로그인

검색

OBG
조회 수 23 추천 수 0 댓글 0
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 게시글 수정 내역 댓글로 가기 인쇄
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 게시글 수정 내역 댓글로 가기 인쇄

https://www.seangoedecke.com/gpt-oss-is-phi-5/

https://news.hada.io/topic?id=22414


이 글의 핵심 주장은, 만약 OpenAI가 'gpt-oss'라는 강력한 오픈소스 모델을 출시한다면, 이는 OpenAI가 처음부터 만든 모델이 아니라 마이크로소프트의 차세대 소형 언어 모델(SLM)인 'Phi-5'일 것이라는 예측입니다.

주요 근거는 다음과 같습니다.

  1. 강력한 파트너십과 전략적 이점

    • OpenAI와 Microsoft는 매우 깊은 협력 관계입니다. Microsoft는 OpenAI에 막대한 컴퓨팅 자원(Azure)을 제공하고, OpenAI는 모델 개발 노하우를 공유하며 시너지를 낼 수 있습니다.

    • OpenAI 입장에서 주력 상업 모델인 GPT-4/5를 직접 오픈소스로 공개하는 것은 큰 부담입니다. 하지만 Microsoft의 강력한 소형 모델을 'gpt-oss'로 출시하면, 자신들의 핵심 기술을 보호하면서도 Llama나 Mistral 같은 오픈소스 경쟁에 효과적으로 대응할 수 있습니다.

  2. '소형 언어 모델(SLM)'의 가능성

    • Microsoft의 Phi 시리즈는 이미 작은 크기에도 불구하고 특정 작업에서 매우 뛰어난 성능을 보여주며 '소형 언어 모델(SLM)'의 가능성을 증명했습니다.

    • OpenAI가 이 SLM 기술을 활용해 오픈소스 모델을 출시하는 것은, 밑바닥부터 새로 개발하는 것보다 훨씬 효율적이고 빠른 접근 방식입니다.

  3. 두 회사 모두에게 '윈윈(Win-Win)'

    • OpenAI: 핵심 상업 모델을 지키면서 오픈소스 생태계에 강력한 영향력을 행사할 수 있습니다.

    • Microsoft: 자신들이 개발한 Phi 아키텍처와 연구 성과를 세계에서 가장 유명한 AI 브랜드(OpenAI)를 통해 배포하며 기술 리더십을 더욱 공고히 할 수 있습니다.

결론적으로, 저자는 OpenAI의 오픈소스 모델 출시가 실제로는 Microsoft의 기술력을 바탕으로 한 양사 간의 치밀한 전략적 합작품이 될 것이라고 분석합니다.

?

  1. Programming 게시판 관련

    Date2014.11.01 CategoryTool/etc ByMoA Views15605
    read more
  2. Build a Small Language Model (SLM) From Scratch

    Date2025.08.16 CategoryLLM ByOBG Views0
    Read More
  3. OpenAI의 새로운 오픈소스 모델은 사실상 Phi-5임

    Date2025.08.12 CategoryLLM ByOBG Views23
    Read More
  4. ChatGPT가 7억 명을 서비스할 수 있는데, 나는 왜 GPT-4 하나도 로컬에서 못 돌릴까?

    Date2025.08.12 CategoryLLM ByOBG Views31
    Read More
  5. OpenAI의 gpt‑oss‑120b, gpt‑oss‑20b: 개인 컴퓨터에서 ChatGPT 사용?

    Date2025.08.12 CategoryLLM ByOBG Views27
    Read More
  6. AI가 만든 코드, 결국엔 모두 레거시가 된다?

    Date2025.08.12 CategoryLLM ByOBG Views35
    Read More
  7. 알리바바, 딥시크·오픈AI 넘는 추론 모델 출시..."오픈 소스 최강 입증" (QwQ-32B)

    Date2025.03.10 CategoryLLM ByOBG Views1423
    Read More
  8. AI-hub 공공데이터를 활용하여 한국어-영어 번역 LLM 만들기

    Date2025.01.14 CategoryLLM ByOBG Views1624
    Read More
  9. 얼렁뚱땅 LLM을 만들어보자

    Date2025.01.10 CategoryLLM ByOBG Views1710
    Read More
  10. Comparing Replit and Cursor for AI-Powered Coding

    Date2024.09.21 CategoryLLM ByOBG Views2579
    Read More
  11. Anthropic, LLM의 내부를 이해하는데 있어 상당한 진전을 보임

    Date2024.06.03 CategoryLLM ByOBG Views2375
    Read More
  12. llama3 implemented from scratch

    Date2024.05.24 CategoryLLM ByOBG Views1646
    Read More
  13. [VESSL AI] 뉴욕주민의 프로젝트플루토 — LLM, LLMOps를 활용한 금융 미디어의 혁신

    Date2024.04.21 CategoryLLM ByOBG Views2645
    Read More
  14. PEFT: Parameter-Efficient Fine-Tuning of Billion-Scale Models on Low-Resource Hardware

    Date2024.04.15 CategoryLLM ByOBG Views1772
    Read More
  15. The difference between quantization methods for the same bits

    Date2024.04.14 CategoryLLM ByOBG Views2670
    Read More
  16. Mixture of Experts - Part 2

    Date2024.04.14 CategoryLLM ByOBG Views2194
    Read More
  17. ChatGPT의 강력한 경쟁 언어모델 등장!, Mixtral 8x7B

    Date2024.04.14 CategoryLLM ByOBG Views2580
    Read More
  18. Real-Time Stock News Sentiment Prediction with Python

    Date2024.04.11 CategoryLLM ByOBG Views2442
    Read More
  19. Getting Started with Sentiment Analysis using Python

    Date2024.04.11 CategoryLLM ByOBG Views2478
    Read More
  20. How LLMs Work ? Explained in 9 Steps — Transformer Architecture

    Date2024.04.11 CategoryLLM ByOBG Views2522
    Read More
  21. 만능 프롬프트

    Date2024.04.07 CategoryLLM ByOBG Views2621
    Read More
Board Pagination Prev 1 2 Next
/ 2