로그인

검색

OBG
조회 수 190 추천 수 0 댓글 0
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 게시글 수정 내역 댓글로 가기 인쇄
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 게시글 수정 내역 댓글로 가기 인쇄

https://openai.com/index/harness-engineering/

 

ChatGPT 요약

 

1️⃣ 핵심 메시지

이 글의 핵심은 다음입니다.

AI 모델보다 더 중요한 것은 “에이전트를 작동시키는 시스템(harness)”이다.

즉 미래의 개발은

  • 좋은 LLM 모델을 만드는 것보다

  • AI가 안정적으로 일할 수 있는 실행 환경과 피드백 루프를 만드는 것이 더 중요하다는 주장입니다.

OpenAI는 이를 Harness Engineering이라고 부릅니다.


2️⃣ 실제 실험: “사람이 코드 0줄 작성”

OpenAI 팀은 내부 실험을 했습니다.

조건:

  • 사람이 직접 작성한 코드: 0줄

  • 모든 코드: Codex가 생성

  • 대상:

    • 앱 로직

    • 테스트

    • CI

    • 문서

    • 운영 코드

결과:

  • 100만 줄 코드

  • 5개월

  • 기존 대비 약 10배 빠른 개발 속도

사람의 역할은 다음으로 바뀌었습니다.

Humans steer. Agents execute.
(사람은 방향을 잡고, 에이전트가 실행한다)


3️⃣ 엔지니어 역할 변화

기존 개발자:

코드 작성
→ 테스트
→ 디버깅

Agent-first 개발:

환경 설계
→ 목표 정의
→ 피드백 루프 설계
→ 에이전트 실행

즉 엔지니어는 **코드 작성자가 아니라 “시스템 설계자”**가 됩니다.


4️⃣ Harness Engineering의 핵심 원칙

(1) Repository가 “유일한 진실”

AI는 다음을 읽지 못합니다.

  • Slack

  • Google Docs

  • 사람 머릿속

따라서 모든 지식은 repo 안에 있어야 합니다.


(2) 매뉴얼 대신 “지도”

에이전트에게

❌ 1000페이지 문서
✔ 짧은 navigation 문서

예:

AGENTS.md
→ 프로젝트 구조
→ 규칙
→ 문서 링크

Context window가 제한되기 때문입니다.


(3) 구현이 아니라 invariant를 강제

좋은 방식:

데이터 구조 규칙
아키텍처 규칙
테스트 규칙

이런 것은 lint / CI / tests로 강제합니다.

하지만

❌ 함수 구현 방식까지 강제하지 않음


(4) Agent legibility

코드는 사람이 읽기 쉬운 것보다

AI가 이해하기 쉬운 구조가 중요합니다.

예:

  • 명확한 디렉토리 구조

  • 타입 중심 설계

  • 자동 테스트


5️⃣ 개발 프로세스 변화

AI 에이전트 개발에서는 merge philosophy도 달라집니다.

기존:

큰 PR
사람 리뷰

Agent 개발:

작은 PR
빠른 merge
자동 테스트

왜냐하면 에이전트 throughput이 매우 높기 때문입니다.


6️⃣ AI 코드의 특징

OpenAI는 “agent-generated code”를 이렇게 설명합니다.

AI 코드 특징:

  • 완벽하지 않음

  • 반복적으로 수정됨

  • 자동 테스트로 품질 관리

즉 코드 품질은

코드 자체
X

테스트 + feedback loop
O

7️⃣ 가장 중요한 개념: Harness

Harness란:

LLM + tools + rules + feedback loop

Model
+ Tools
+ Repo knowledge
+ CI
+ Tests
+ Execution loop

이 전체가 AI 개발 시스템입니다.


8️⃣ 앞으로의 소프트웨어 엔지니어링

OpenAI의 결론:

앞으로 엔지니어의 핵심 기술은

1️⃣ Prompting
2️⃣ Tooling
3️⃣ Harness design
4️⃣ Feedback loops
5️⃣ Agent safety

“코드를 잘 쓰는 것”보다
“AI가 잘 쓰도록 환경을 만드는 것”이 중요


한 줄 요약

Harness Engineering = AI coding agent가 안정적으로 일하도록 만드는 실행 환경 + 피드백 시스템 설계

?

  1. Programming 게시판 관련

  2. [OpenAI] 엔지니어링 활용: 에이전트 우선 환경에서 Codex를 활용하기

  3. everything is a ralph loop

  4. 나노바나나 프로 레시피 북

  5. A Guide to Claude Code 2.0 and getting better at using coding agents

  6. HunyuanVideo-1.5 영상 생성 모델

  7. 클로드 코드로 프로덕트 팀 바이브코딩 표준화한 방법 (aka 맥도날드 시스템)

  8. 로컬에서 오픈 LLM과 코딩 어시스턴트를 사용하시나요? 환경을 공유해주세요

  9. Claude Skills는 굉장하다, MCP보다 더 큰 혁신일지도

  10. macOS에서 로컬 LLM 실험하기

  11. 나노바나나 공식 출시! 구글 제미나이에서 직접 사용하는 방법

  12. 구글 개발자가 말하는 나노바나나의 진짜 실체

  13. llama.cpp gpt-oss-120b 5090으로 돌려본 후기

  14. Build a Small Language Model (SLM) From Scratch

  15. OpenAI의 새로운 오픈소스 모델은 사실상 Phi-5임

  16. ChatGPT가 7억 명을 서비스할 수 있는데, 나는 왜 GPT-4 하나도 로컬에서 못 돌릴까?

  17. OpenAI의 gpt‑oss‑120b, gpt‑oss‑20b: 개인 컴퓨터에서 ChatGPT 사용?

  18. AI가 만든 코드, 결국엔 모두 레거시가 된다?

  19. 알리바바, 딥시크·오픈AI 넘는 추론 모델 출시..."오픈 소스 최강 입증" (QwQ-32B)

  20. AI-hub 공공데이터를 활용하여 한국어-영어 번역 LLM 만들기

  21. 얼렁뚱땅 LLM을 만들어보자

Board Pagination Prev 1 2 Next
/ 2