Home

✔ 뷰어로 보기

LLM

2026.03.05 16:25

[OpenAI] 엔지니어링 활용: 에이전트 우선 환경에서 Codex를 활용하기

OBG

조회 수 2602 추천 수 0 댓글 0

단축키

Prev이전 문서

Next다음 문서

가 크게 작게 위로 아래로 게시글 수정 내역 댓글로 가기 인쇄

단축키

Prev이전 문서

Next다음 문서

가 크게 작게 위로 아래로 게시글 수정 내역 댓글로 가기 인쇄

https://openai.com/index/harness-engineering/

ChatGPT 요약

1️⃣ 핵심 메시지

이 글의 핵심은 다음입니다.

AI 모델보다 더 중요한 것은 “에이전트를 작동시키는 시스템(harness)”이다.

즉 미래의 개발은

좋은 LLM 모델을 만드는 것보다
AI가 안정적으로 일할 수 있는 실행 환경과 피드백 루프를 만드는 것이 더 중요하다는 주장입니다.

OpenAI는 이를 Harness Engineering이라고 부릅니다.

2️⃣ 실제 실험: “사람이 코드 0줄 작성”

OpenAI 팀은 내부 실험을 했습니다.

조건:

사람이 직접 작성한 코드: 0줄
모든 코드: Codex가 생성
대상:
- 앱 로직
- 테스트
- CI
- 문서
- 운영 코드

결과:

약 100만 줄 코드
5개월
기존 대비 약 10배 빠른 개발 속도

사람의 역할은 다음으로 바뀌었습니다.

Humans steer. Agents execute.
(사람은 방향을 잡고, 에이전트가 실행한다)

3️⃣ 엔지니어 역할 변화

기존 개발자:

코드 작성
→ 테스트
→ 디버깅

Agent-first 개발:

환경 설계
→ 목표 정의
→ 피드백 루프 설계
→ 에이전트 실행

즉 엔지니어는 **코드 작성자가 아니라 “시스템 설계자”**가 됩니다.

4️⃣ Harness Engineering의 핵심 원칙

(1) Repository가 “유일한 진실”

AI는 다음을 읽지 못합니다.

Slack
Google Docs
사람 머릿속

따라서 모든 지식은 repo 안에 있어야 합니다.

(2) 매뉴얼 대신 “지도”

에이전트에게

❌ 1000페이지 문서
✔ 짧은 navigation 문서

예:

AGENTS.md
→ 프로젝트 구조
→ 규칙
→ 문서 링크

Context window가 제한되기 때문입니다.

(3) 구현이 아니라 invariant를 강제

좋은 방식:

데이터 구조 규칙
아키텍처 규칙
테스트 규칙

이런 것은 lint / CI / tests로 강제합니다.

하지만

❌ 함수 구현 방식까지 강제하지 않음

(4) Agent legibility

코드는 사람이 읽기 쉬운 것보다

AI가 이해하기 쉬운 구조가 중요합니다.

예:

명확한 디렉토리 구조
타입 중심 설계
자동 테스트

5️⃣ 개발 프로세스 변화

AI 에이전트 개발에서는 merge philosophy도 달라집니다.

기존:

큰 PR
사람 리뷰

Agent 개발:

작은 PR
빠른 merge
자동 테스트

왜냐하면 에이전트 throughput이 매우 높기 때문입니다.

6️⃣ AI 코드의 특징

OpenAI는 “agent-generated code”를 이렇게 설명합니다.

AI 코드 특징:

완벽하지 않음
반복적으로 수정됨
자동 테스트로 품질 관리

즉 코드 품질은

코드 자체
X

테스트 + feedback loop
O

7️⃣ 가장 중요한 개념: Harness

Harness란:

LLM + tools + rules + feedback loop

즉

Model
+ Tools
+ Repo knowledge
+ CI
+ Tests
+ Execution loop

이 전체가 AI 개발 시스템입니다.

8️⃣ 앞으로의 소프트웨어 엔지니어링

OpenAI의 결론:

앞으로 엔지니어의 핵심 기술은

1️⃣ Prompting
2️⃣ Tooling
3️⃣ Harness design
4️⃣ Feedback loops
5️⃣ Agent safety

즉

“코드를 잘 쓰는 것”보다
“AI가 잘 쓰도록 환경을 만드는 것”이 중요

한 줄 요약

Harness Engineering = AI coding agent가 안정적으로 일하도록 만드는 실행 환경 + 피드백 시스템 설계

Who's OBG

everything is a ralph loop Next everything is a ralph loop 2026.03.05by OBG

0 추천 0 비추천

Facebook Twitter Google Pinterest KakaoStory Band

위로 아래로 게시글 수정 내역 댓글로 가기 인쇄

✔댓글 쓰기

에디터 선택하기

✔ 텍스트 모드 ✔ 에디터 모드

댓글 쓰기

에디터 사용하기 닫기

No Image notice by MoA 2014/11/01 by MoA
in Tool/etc
Views 119206 Replies 2

Programming 게시판 관련
No Image 05Mar
by OBG
2026/03/05 by OBG
in LLM
Views 2602

[OpenAI] 엔지니어링 활용: 에이전트 우선 환경에서 Codex를 활용하기
No Image 05Mar
by OBG
2026/03/05 by OBG
in LLM
Views 2383

everything is a ralph loop
No Image 15Jan
by OBG
2026/01/15 by OBG
in LLM
Views 5321

나노바나나 프로 레시피 북
05Jan
by OBG
2026/01/05 by OBG
in LLM
Views 16579

A Guide to Claude Code 2.0 and getting better at using coding agents
No Image 25Nov
by OBG
2025/11/25 by OBG
in LLM
Views 20156

HunyuanVideo-1.5 영상 생성 모델
No Image 24Nov
by OBG
2025/11/24 by OBG
in LLM
Views 9044

클로드 코드로 프로덕트 팀 바이브코딩 표준화한 방법 (aka 맥도날드 시스템)
No Image 14Nov
by OBG
2025/11/14 by OBG
in LLM
Views 10245

로컬에서 오픈 LLM과 코딩 어시스턴트를 사용하시나요? 환경을 공유해주세요
No Image 29Oct
by OBG
2025/10/29 by OBG
in LLM
Views 9837

Claude Skills는 굉장하다, MCP보다 더 큰 혁신일지도
No Image 15Sep
by OBG
2025/09/15 by OBG
in LLM
Views 10265

macOS에서 로컬 LLM 실험하기
No Image 07Sep
by OBG
2025/09/07 by OBG
in LLM
Views 9998

나노바나나 공식 출시! 구글 제미나이에서 직접 사용하는 방법
No Image 07Sep
by OBG
2025/09/07 by OBG
in LLM
Views 9965

구글 개발자가 말하는 나노바나나의 진짜 실체
No Image 07Sep
by OBG
2025/09/07 by OBG
in LLM
Views 10455

llama.cpp gpt-oss-120b 5090으로 돌려본 후기
No Image 16Aug
by OBG
2025/08/16 by OBG
in LLM
Views 21089

Build a Small Language Model (SLM) From Scratch
No Image 12Aug
by OBG
2025/08/12 by OBG
in LLM
Views 9518

OpenAI의 새로운 오픈소스 모델은 사실상 Phi-5임
No Image 12Aug
by OBG
2025/08/12 by OBG
in LLM
Views 9790

ChatGPT가 7억 명을 서비스할 수 있는데, 나는 왜 GPT-4 하나도 로컬에서 못 돌릴까?
No Image 12Aug
by OBG
2025/08/12 by OBG
in LLM
Views 10454

OpenAI의 gpt‑oss‑120b, gpt‑oss‑20b: 개인 컴퓨터에서 ChatGPT 사용?
No Image 12Aug
by OBG
2025/08/12 by OBG
in LLM
Views 9863

AI가 만든 코드, 결국엔 모두 레거시가 된다?
No Image 10Mar
by OBG
2025/03/10 by OBG
in LLM
Views 11251

알리바바, 딥시크·오픈AI 넘는 추론 모델 출시..."오픈 소스 최강 입증" (QwQ-32B)
No Image 14Jan
by OBG
2025/01/14 by OBG
in LLM
Views 11438

AI-hub 공공데이터를 활용하여 한국어-영어 번역 LLM 만들기
No Image 10Jan
by OBG
2025/01/10 by OBG
in LLM
Views 11747

얼렁뚱땅 LLM을 만들어보자

쓰기

로그인

검색