로그인

검색

OBG
조회 수 23 추천 수 0 댓글 0
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 게시글 수정 내역 댓글로 가기 인쇄
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 게시글 수정 내역 댓글로 가기 인쇄

https://openai.com/index/harness-engineering/

 

ChatGPT 요약

 

1️⃣ 핵심 메시지

이 글의 핵심은 다음입니다.

AI 모델보다 더 중요한 것은 “에이전트를 작동시키는 시스템(harness)”이다.

즉 미래의 개발은

  • 좋은 LLM 모델을 만드는 것보다

  • AI가 안정적으로 일할 수 있는 실행 환경과 피드백 루프를 만드는 것이 더 중요하다는 주장입니다.

OpenAI는 이를 Harness Engineering이라고 부릅니다.


2️⃣ 실제 실험: “사람이 코드 0줄 작성”

OpenAI 팀은 내부 실험을 했습니다.

조건:

  • 사람이 직접 작성한 코드: 0줄

  • 모든 코드: Codex가 생성

  • 대상:

    • 앱 로직

    • 테스트

    • CI

    • 문서

    • 운영 코드

결과:

  • 100만 줄 코드

  • 5개월

  • 기존 대비 약 10배 빠른 개발 속도

사람의 역할은 다음으로 바뀌었습니다.

Humans steer. Agents execute.
(사람은 방향을 잡고, 에이전트가 실행한다)


3️⃣ 엔지니어 역할 변화

기존 개발자:

코드 작성
→ 테스트
→ 디버깅

Agent-first 개발:

환경 설계
→ 목표 정의
→ 피드백 루프 설계
→ 에이전트 실행

즉 엔지니어는 **코드 작성자가 아니라 “시스템 설계자”**가 됩니다.


4️⃣ Harness Engineering의 핵심 원칙

(1) Repository가 “유일한 진실”

AI는 다음을 읽지 못합니다.

  • Slack

  • Google Docs

  • 사람 머릿속

따라서 모든 지식은 repo 안에 있어야 합니다.


(2) 매뉴얼 대신 “지도”

에이전트에게

❌ 1000페이지 문서
✔ 짧은 navigation 문서

예:

AGENTS.md
→ 프로젝트 구조
→ 규칙
→ 문서 링크

Context window가 제한되기 때문입니다.


(3) 구현이 아니라 invariant를 강제

좋은 방식:

데이터 구조 규칙
아키텍처 규칙
테스트 규칙

이런 것은 lint / CI / tests로 강제합니다.

하지만

❌ 함수 구현 방식까지 강제하지 않음


(4) Agent legibility

코드는 사람이 읽기 쉬운 것보다

AI가 이해하기 쉬운 구조가 중요합니다.

예:

  • 명확한 디렉토리 구조

  • 타입 중심 설계

  • 자동 테스트


5️⃣ 개발 프로세스 변화

AI 에이전트 개발에서는 merge philosophy도 달라집니다.

기존:

큰 PR
사람 리뷰

Agent 개발:

작은 PR
빠른 merge
자동 테스트

왜냐하면 에이전트 throughput이 매우 높기 때문입니다.


6️⃣ AI 코드의 특징

OpenAI는 “agent-generated code”를 이렇게 설명합니다.

AI 코드 특징:

  • 완벽하지 않음

  • 반복적으로 수정됨

  • 자동 테스트로 품질 관리

즉 코드 품질은

코드 자체
X

테스트 + feedback loop
O

7️⃣ 가장 중요한 개념: Harness

Harness란:

LLM + tools + rules + feedback loop

Model
+ Tools
+ Repo knowledge
+ CI
+ Tests
+ Execution loop

이 전체가 AI 개발 시스템입니다.


8️⃣ 앞으로의 소프트웨어 엔지니어링

OpenAI의 결론:

앞으로 엔지니어의 핵심 기술은

1️⃣ Prompting
2️⃣ Tooling
3️⃣ Harness design
4️⃣ Feedback loops
5️⃣ Agent safety

“코드를 잘 쓰는 것”보다
“AI가 잘 쓰도록 환경을 만드는 것”이 중요


한 줄 요약

Harness Engineering = AI coding agent가 안정적으로 일하도록 만드는 실행 환경 + 피드백 시스템 설계

?

List of Articles
번호 분류 제목 글쓴이 날짜 조회 수
공지 Tool/etc Programming 게시판 관련 2 MoA 2014.11.01 108017
» LLM [OpenAI] 엔지니어링 활용: 에이전트 우선 환경에서 Codex를 활용하기 new OBG 2026.03.05 23
35 LLM everything is a ralph loop new OBG 2026.03.05 23
34 LLM 나노바나나 프로 레시피 북 OBG 2026.01.15 3896
33 LLM A Guide to Claude Code 2.0 and getting better at using coding agents OBG 2026.01.05 15028
32 LLM HunyuanVideo-1.5 영상 생성 모델 OBG 2025.11.25 18522
31 LLM 클로드 코드로 프로덕트 팀 바이브코딩 표준화한 방법 (aka 맥도날드 시스템) OBG 2025.11.24 7709
30 LLM 로컬에서 오픈 LLM과 코딩 어시스턴트를 사용하시나요? 환경을 공유해주세요 OBG 2025.11.14 8927
29 LLM Claude Skills는 굉장하다, MCP보다 더 큰 혁신일지도 OBG 2025.10.29 8659
28 LLM macOS에서 로컬 LLM 실험하기 OBG 2025.09.15 8891
27 LLM 나노바나나 공식 출시! 구글 제미나이에서 직접 사용하는 방법 OBG 2025.09.07 8848
26 LLM 구글 개발자가 말하는 나노바나나의 진짜 실체 OBG 2025.09.07 8804
25 LLM llama.cpp gpt-oss-120b 5090으로 돌려본 후기 OBG 2025.09.07 9060
24 LLM Build a Small Language Model (SLM) From Scratch OBG 2025.08.16 19528
23 LLM OpenAI의 새로운 오픈소스 모델은 사실상 Phi-5임 OBG 2025.08.12 8490
22 LLM ChatGPT가 7억 명을 서비스할 수 있는데, 나는 왜 GPT-4 하나도 로컬에서 못 돌릴까? OBG 2025.08.12 8722
21 LLM OpenAI의 gpt‑oss‑120b, gpt‑oss‑20b: 개인 컴퓨터에서 ChatGPT 사용? OBG 2025.08.12 8826
20 LLM AI가 만든 코드, 결국엔 모두 레거시가 된다? OBG 2025.08.12 8733
19 LLM 알리바바, 딥시크·오픈AI 넘는 추론 모델 출시..."오픈 소스 최강 입증" (QwQ-32B) OBG 2025.03.10 9922
18 LLM AI-hub 공공데이터를 활용하여 한국어-영어 번역 LLM 만들기 OBG 2025.01.14 10288
17 LLM 얼렁뚱땅 LLM을 만들어보자 OBG 2025.01.10 10307
Board Pagination Prev 1 2 Next
/ 2