로그인

검색

OBG
조회 수 4842 추천 수 0 댓글 0
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 게시글 수정 내역 댓글로 가기 인쇄
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 게시글 수정 내역 댓글로 가기 인쇄

https://medium.com/@shravankoninti/build-a-small-language-model-slm-from-scratch-3ddd13fa6470

 

ChatGPT 요약

핵심 요약

1. SLM이란? (Small Language Model)

  • 현재 기준으로 1억 개 미만의 파라미터를 갖는 모델을 **작은 언어 모델(SLM)**로 정의합니다.

  • 과거 GPT‑3 (~175B), GPT‑4(추정치: ~1T)와 비교할 때 매우 작은 크기의 모델입니다.

2. TinyStories 데이터셋

  • TinyStories는 GPT‑3.5 및 GPT‑4가 생성한, 3~4세 어린이가 이해할 수 있는 단어만으로 구성된 짧은 이야기들의 합성 데이터셋입니다. Hugging Face에서 불러올 수 있으며, 약 200만 건의 학습 데이터2만 건의 검증 데이터가 포함되어 있습니다.

3. 전처리: 토크나이제이션 및 입력-출력 구성

  • Tokenization에는 GPT‑2 서브워드 방식을 사용하고, 모든 토큰 ID를 하나의 .bin 파일에 수집해 학습용 대형 토큰 시퀀스를 구성합니다.

4. 모델 설계 및 학습

  • 글에서는 모델 구조나 학습 방법 등 자세한 내용은 제공되지 않았지만, 10~15M 파라미터 수준의 작은 구조로도 일관된 텍스트 생성이 가능할지에 대한 실험이 핵심으로 제시됩니다.

?

List of Articles
번호 분류 제목 글쓴이 날짜 조회 수
공지 Tool/etc Programming 게시판 관련 2 MoA 2014.11.01 45528
31 API/MFC 모달리스 대화상자 Naya 2012.08.02 7116
30 Library Google의 C++ 라이브러리 Naya 2012.08.02 5941
29 Algorithm 큰 수 구하기 알고리즘 Naya 2012.08.02 6380
28 API/MFC Thread Programming Naya 2012.08.02 8926
27 Library Math Library Naya 2012.08.02 7230
26 Library Win32 Socket Class Naya 2012.08.02 6766
25 C/C++ 코드 실행 시간 계산 Naya 2012.08.02 6490
24 API/MFC MFC로 그림 그리기 Naya 2012.08.02 6352
23 Site Start Something! - Windows 8 개발 공식 사이트 Naya 2012.08.02 7939
22 Tool/etc 어셈블리어 컴파일 - 기초 Naya 2012.08.02 6962
21 API/MFC 메트로 스타일 앱개발을 위한 8가지 팁 너울 2012.05.14 7132
20 API/MFC MFC, CHM파일 연동 (context help) 너울 2012.04.16 8675
19 Tool/etc 에디트 플러스, VS 2008 컴파일 환경 설정 너울 2012.04.02 6023
18 Tool/etc 텍스트 에디터 Sublime Text 2 너울 2012.03.30 8074
17 C/C++ printf Type Field Characters 너울 2012.02.23 6856
16 API/MFC MFC 리본 사용하기 (아이콘 제작 포함) 너울 2012.02.09 9880
15 API/MFC MFC Feature Pack: An Introduction 너울 2012.02.08 9163
14 Tool/etc R language 사이트 너울 2012.02.08 8064
13 API/MFC 프로그램 배포용으로 만드는 과정 너울 2012.01.20 7111
12 API/MFC Office 스타일의 리본바 만드는 법 너울 2012.01.12 6554
Board Pagination Prev 1 ... 8 9 10 11 12 13 14 15 16 17 Next
/ 17