로그인

검색

OBG
조회 수 23 추천 수 0 댓글 0
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 게시글 수정 내역 댓글로 가기 인쇄
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 게시글 수정 내역 댓글로 가기 인쇄

https://www.seangoedecke.com/gpt-oss-is-phi-5/

https://news.hada.io/topic?id=22414


이 글의 핵심 주장은, 만약 OpenAI가 'gpt-oss'라는 강력한 오픈소스 모델을 출시한다면, 이는 OpenAI가 처음부터 만든 모델이 아니라 마이크로소프트의 차세대 소형 언어 모델(SLM)인 'Phi-5'일 것이라는 예측입니다.

주요 근거는 다음과 같습니다.

  1. 강력한 파트너십과 전략적 이점

    • OpenAI와 Microsoft는 매우 깊은 협력 관계입니다. Microsoft는 OpenAI에 막대한 컴퓨팅 자원(Azure)을 제공하고, OpenAI는 모델 개발 노하우를 공유하며 시너지를 낼 수 있습니다.

    • OpenAI 입장에서 주력 상업 모델인 GPT-4/5를 직접 오픈소스로 공개하는 것은 큰 부담입니다. 하지만 Microsoft의 강력한 소형 모델을 'gpt-oss'로 출시하면, 자신들의 핵심 기술을 보호하면서도 Llama나 Mistral 같은 오픈소스 경쟁에 효과적으로 대응할 수 있습니다.

  2. '소형 언어 모델(SLM)'의 가능성

    • Microsoft의 Phi 시리즈는 이미 작은 크기에도 불구하고 특정 작업에서 매우 뛰어난 성능을 보여주며 '소형 언어 모델(SLM)'의 가능성을 증명했습니다.

    • OpenAI가 이 SLM 기술을 활용해 오픈소스 모델을 출시하는 것은, 밑바닥부터 새로 개발하는 것보다 훨씬 효율적이고 빠른 접근 방식입니다.

  3. 두 회사 모두에게 '윈윈(Win-Win)'

    • OpenAI: 핵심 상업 모델을 지키면서 오픈소스 생태계에 강력한 영향력을 행사할 수 있습니다.

    • Microsoft: 자신들이 개발한 Phi 아키텍처와 연구 성과를 세계에서 가장 유명한 AI 브랜드(OpenAI)를 통해 배포하며 기술 리더십을 더욱 공고히 할 수 있습니다.

결론적으로, 저자는 OpenAI의 오픈소스 모델 출시가 실제로는 Microsoft의 기술력을 바탕으로 한 양사 간의 치밀한 전략적 합작품이 될 것이라고 분석합니다.

?

  1. Programming 게시판 관련

  2. Build a Small Language Model (SLM) From Scratch

  3. OpenAI의 새로운 오픈소스 모델은 사실상 Phi-5임

  4. ChatGPT가 7억 명을 서비스할 수 있는데, 나는 왜 GPT-4 하나도 로컬에서 못 돌릴까?

  5. OpenAI의 gpt‑oss‑120b, gpt‑oss‑20b: 개인 컴퓨터에서 ChatGPT 사용?

  6. AI가 만든 코드, 결국엔 모두 레거시가 된다?

  7. 알리바바, 딥시크·오픈AI 넘는 추론 모델 출시..."오픈 소스 최강 입증" (QwQ-32B)

  8. AI-hub 공공데이터를 활용하여 한국어-영어 번역 LLM 만들기

  9. 얼렁뚱땅 LLM을 만들어보자

  10. Comparing Replit and Cursor for AI-Powered Coding

  11. Anthropic, LLM의 내부를 이해하는데 있어 상당한 진전을 보임

  12. llama3 implemented from scratch

  13. [VESSL AI] 뉴욕주민의 프로젝트플루토 — LLM, LLMOps를 활용한 금융 미디어의 혁신

  14. PEFT: Parameter-Efficient Fine-Tuning of Billion-Scale Models on Low-Resource Hardware

  15. The difference between quantization methods for the same bits

  16. Mixture of Experts - Part 2

  17. ChatGPT의 강력한 경쟁 언어모델 등장!, Mixtral 8x7B

  18. Real-Time Stock News Sentiment Prediction with Python

  19. Getting Started with Sentiment Analysis using Python

  20. How LLMs Work ? Explained in 9 Steps — Transformer Architecture

  21. 만능 프롬프트

Board Pagination Prev 1 2 Next
/ 2