로그인

검색

OBG
조회 수 23 추천 수 0 댓글 0
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 게시글 수정 내역 댓글로 가기 인쇄
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 게시글 수정 내역 댓글로 가기 인쇄

https://openai.com/index/harness-engineering/

 

ChatGPT 요약

 

1️⃣ 핵심 메시지

이 글의 핵심은 다음입니다.

AI 모델보다 더 중요한 것은 “에이전트를 작동시키는 시스템(harness)”이다.

즉 미래의 개발은

  • 좋은 LLM 모델을 만드는 것보다

  • AI가 안정적으로 일할 수 있는 실행 환경과 피드백 루프를 만드는 것이 더 중요하다는 주장입니다.

OpenAI는 이를 Harness Engineering이라고 부릅니다.


2️⃣ 실제 실험: “사람이 코드 0줄 작성”

OpenAI 팀은 내부 실험을 했습니다.

조건:

  • 사람이 직접 작성한 코드: 0줄

  • 모든 코드: Codex가 생성

  • 대상:

    • 앱 로직

    • 테스트

    • CI

    • 문서

    • 운영 코드

결과:

  • 100만 줄 코드

  • 5개월

  • 기존 대비 약 10배 빠른 개발 속도

사람의 역할은 다음으로 바뀌었습니다.

Humans steer. Agents execute.
(사람은 방향을 잡고, 에이전트가 실행한다)


3️⃣ 엔지니어 역할 변화

기존 개발자:

코드 작성
→ 테스트
→ 디버깅

Agent-first 개발:

환경 설계
→ 목표 정의
→ 피드백 루프 설계
→ 에이전트 실행

즉 엔지니어는 **코드 작성자가 아니라 “시스템 설계자”**가 됩니다.


4️⃣ Harness Engineering의 핵심 원칙

(1) Repository가 “유일한 진실”

AI는 다음을 읽지 못합니다.

  • Slack

  • Google Docs

  • 사람 머릿속

따라서 모든 지식은 repo 안에 있어야 합니다.


(2) 매뉴얼 대신 “지도”

에이전트에게

❌ 1000페이지 문서
✔ 짧은 navigation 문서

예:

AGENTS.md
→ 프로젝트 구조
→ 규칙
→ 문서 링크

Context window가 제한되기 때문입니다.


(3) 구현이 아니라 invariant를 강제

좋은 방식:

데이터 구조 규칙
아키텍처 규칙
테스트 규칙

이런 것은 lint / CI / tests로 강제합니다.

하지만

❌ 함수 구현 방식까지 강제하지 않음


(4) Agent legibility

코드는 사람이 읽기 쉬운 것보다

AI가 이해하기 쉬운 구조가 중요합니다.

예:

  • 명확한 디렉토리 구조

  • 타입 중심 설계

  • 자동 테스트


5️⃣ 개발 프로세스 변화

AI 에이전트 개발에서는 merge philosophy도 달라집니다.

기존:

큰 PR
사람 리뷰

Agent 개발:

작은 PR
빠른 merge
자동 테스트

왜냐하면 에이전트 throughput이 매우 높기 때문입니다.


6️⃣ AI 코드의 특징

OpenAI는 “agent-generated code”를 이렇게 설명합니다.

AI 코드 특징:

  • 완벽하지 않음

  • 반복적으로 수정됨

  • 자동 테스트로 품질 관리

즉 코드 품질은

코드 자체
X

테스트 + feedback loop
O

7️⃣ 가장 중요한 개념: Harness

Harness란:

LLM + tools + rules + feedback loop

Model
+ Tools
+ Repo knowledge
+ CI
+ Tests
+ Execution loop

이 전체가 AI 개발 시스템입니다.


8️⃣ 앞으로의 소프트웨어 엔지니어링

OpenAI의 결론:

앞으로 엔지니어의 핵심 기술은

1️⃣ Prompting
2️⃣ Tooling
3️⃣ Harness design
4️⃣ Feedback loops
5️⃣ Agent safety

“코드를 잘 쓰는 것”보다
“AI가 잘 쓰도록 환경을 만드는 것”이 중요


한 줄 요약

Harness Engineering = AI coding agent가 안정적으로 일하도록 만드는 실행 환경 + 피드백 시스템 설계

?

  1. Programming 게시판 관련

    Date2014.11.01 CategoryTool/etc ByMoA Views108017
    read more
  2. [OpenAI] 엔지니어링 활용: 에이전트 우선 환경에서 Codex를 활용하기

    Date2026.03.05 CategoryLLM ByOBG Views23
    Read More
  3. everything is a ralph loop

    Date2026.03.05 CategoryLLM ByOBG Views23
    Read More
  4. Claude Code 창시자가 공개한 실전 사용 팁

    Date2026.02.03 CategoryAgent ByOBG Views1854
    Read More
  5. Claude Skills 구축을 위한 완벽 가이드

    Date2026.02.03 CategoryAgent ByOBG Views1809
    Read More
  6. Claude Code - Ollama Integration

    Date2026.01.26 CategoryAgent ByOBG Views6107
    Read More
  7. 앤트로픽 해커톤 우승자의 클로드 코드 구성(configuration) 전체 컬렉션

    Date2026.01.22 CategoryAgent ByOBG Views2766
    Read More
  8. Claude Code 마스터하기 (Github, 책)

    Date2026.01.22 CategoryAgent ByOBG Views6098
    Read More
  9. 나노바나나 프로 레시피 북

    Date2026.01.15 CategoryLLM ByOBG Views3896
    Read More
  10. A Guide to Claude Code 2.0 and getting better at using coding agents

    Date2026.01.05 CategoryLLM ByOBG Views15028
    Read More
  11. Apriori 알고리즘

    Date2025.12.09 CategoryDeeplearning ByOBG Views5949
    Read More
  12. HunyuanVideo-1.5 영상 생성 모델

    Date2025.11.25 CategoryLLM ByOBG Views18522
    Read More
  13. 함수형 프로그래밍을 배워보자!

    Date2025.11.25 CategoryWeb ByOBG Views6123
    Read More
  14. 클로드 코드로 프로덕트 팀 바이브코딩 표준화한 방법 (aka 맥도날드 시스템)

    Date2025.11.24 CategoryLLM ByOBG Views7709
    Read More
  15. LazyGit - 게으른 개발자를 위한 Git UI

    Date2025.11.14 CategoryTool/etc ByOBG Views8615
    Read More
  16. 로컬에서 오픈 LLM과 코딩 어시스턴트를 사용하시나요? 환경을 공유해주세요

    Date2025.11.14 CategoryLLM ByOBG Views8927
    Read More
  17. 오픈 노트북(Open Notebook): Google의 Notebook LM을 대체하는 오픈소스 플랫폼

    Date2025.10.29 CategoryTool/etc ByOBG Views8426
    Read More
  18. Claude Skills는 굉장하다, MCP보다 더 큰 혁신일지도

    Date2025.10.29 CategoryLLM ByOBG Views8659
    Read More
  19. 원격 서버 개발용 편집기로 Helix 에디터를 활용하는 방법

    Date2025.10.29 CategoryTool/etc ByOBG Views8367
    Read More
  20. SQLite Online - 11년간 1인이 개발, 하루 1.1만 명 사용

    Date2025.10.15 CategoryTool/etc ByOBG Views8167
    Read More
  21. macOS에서 로컬 LLM 실험하기

    Date2025.09.15 CategoryLLM ByOBG Views8891
    Read More
Board Pagination Prev 1 2 3 4 5 6 7 8 9 10 ... 17 Next
/ 17