Home

✔ 뷰어로 보기

Deeplearning

2022.08.10 18:04

강화학습 학습 관련 정리

OBG

조회 수 10428 추천 수 0 댓글 0

단축키

Prev이전 문서

Next다음 문서

가 크게 작게 위로 아래로 게시글 수정 내역 댓글로 가기 인쇄

단축키

Prev이전 문서

Next다음 문서

가 크게 작게 위로 아래로 게시글 수정 내역 댓글로 가기 인쇄

https://mustlearning.tistory.com/69

기초

1. 리차드 S. 소튼의 [Introduction to Reinforcement Learning] 입문 혹은 David Silver의 강화학습 강의 영상(유튜브)

(Introduction to Reinforcement Learning은 현재 '단단한 강화학습'으로 변역이 되어 출간되었음)

2. 김성훈 교수님의 강화학습 강의 (유튜브)

3. 팡요랩의 강화학습 강의 (유튜브)

강화학습 인 액션 책은 이후 학습 하는 것이 좋을 것

단단한 심층 강화학습 책도 있으니 참고

팡요랩의 PyTorch 이용한 RL 구현 소스

https://www.facebook.com/groups/ReinforcementLearningKR/posts/2193159584256603/

https://github.com/seungeunrho/minimalRL

https://blog.naver.com/PostView.naver?blogId=yo2dh&logNo=222476933570&parentCategoryNo=&categoryNo=15&viewDate=&isShowPopularPosts=true&from=search

시작은 단단한 학습보다 바닥부터 배우는 강화학습으로 하는게 좋을듯

Who's OBG

0 추천 0 비추천

Facebook Twitter Google Pinterest KakaoStory Band

위로 아래로 게시글 수정 내역 댓글로 가기 인쇄

✔댓글 쓰기

에디터 선택하기

✔ 텍스트 모드 ✔ 에디터 모드

댓글 쓰기

에디터 사용하기 닫기

Programming 게시판 관련

Date2014.11.01 CategoryTool/etc ByMoA Views100045

read more
OS 개발에 관한 작은 책

Date2025.03.24 CategoryTool/etc ByOBG Views8808

Read More
알리바바, 딥시크·오픈AI 넘는 추론 모델 출시..."오픈 소스 최강 입증" (QwQ-32B)

Date2025.03.10 CategoryLLM ByOBG Views8883

Read More
2024년 가장 조회수 높은 소프트웨어 엔지니어링 발표들

Date2025.02.18 CategorySite ByOBG Views8302

Read More
존 카맥이 일리야 수츠키버를 4년전에 만났을때, 추천받은 책과 논문 목록

Date2025.02.18 CategoryDeeplearning ByOBG Views8688

Read More
나이 들어가는 프로그래머 - [발표영상] 요약

Date2025.02.14 CategoryTool/etc ByOBG Views9418

Read More
GitHut Copilot - Agent 모드 공개

Date2025.02.14 CategoryTool/etc ByOBG Views20134

Read More
GDB Dashboard

Date2025.01.14 CategoryTool/etc ByOBG Views20302

Read More
AI-hub 공공데이터를 활용하여 한국어-영어 번역 LLM 만들기

Date2025.01.14 CategoryLLM ByOBG Views9305

Read More
OS in 1,000 Lines

Date2025.01.14 CategoryTool/etc ByOBG Views19733

Read More
얼렁뚱땅 LLM을 만들어보자

Date2025.01.10 CategoryLLM ByOBG Views9356

Read More
Comparing Replit and Cursor for AI-Powered Coding

Date2024.09.21 CategoryLLM ByOBG Views19324

Read More
Synology: Top Best Apps For Docker

Date2024.07.01 CategoryTool/etc ByOBG Views19375

Read More
ASCII 3D 렌더러 만들기

Date2024.06.03 CategoryGraphic ByOBG Views8152

Read More
Anthropic, LLM의 내부를 이해하는데 있어 상당한 진전을 보임

Date2024.06.03 CategoryLLM ByOBG Views10263

Read More
llama3 implemented from scratch

Date2024.05.24 CategoryLLM ByOBG Views19376

Read More
HuggingFace 공동창업자가 추천하는 AI 분야 입문 서적

Date2024.05.24 CategoryTool/etc ByOBG Views10687

Read More
[VESSL AI] 뉴욕주민의 프로젝트플루토 — LLM, LLMOps를 활용한 금융 미디어의 혁신

Date2024.04.21 CategoryLLM ByOBG Views11206

Read More
PEFT: Parameter-Efficient Fine-Tuning of Billion-Scale Models on Low-Resource Hardware

Date2024.04.15 CategoryLLM ByOBG Views18794

Read More
The difference between quantization methods for the same bits

Date2024.04.14 CategoryLLM ByOBG Views19164

Read More
Mixture of Experts - Part 2

Date2024.04.14 CategoryLLM ByOBG Views18921

Read More

쓰기

로그인

검색

강화학습 학습 관련 정리

단축키

단축키

Who's OBG

Programming 게시판 관련

OS 개발에 관한 작은 책

알리바바, 딥시크·오픈AI 넘는 추론 모델 출시..."오픈 소스 최강 입증" (QwQ-32B)

2024년 가장 조회수 높은 소프트웨어 엔지니어링 발표들

존 카맥이 일리야 수츠키버를 4년전에 만났을때, 추천받은 책과 논문 목록

나이 들어가는 프로그래머 - [발표영상] 요약

GitHut Copilot - Agent 모드 공개

GDB Dashboard

AI-hub 공공데이터를 활용하여 한국어-영어 번역 LLM 만들기

OS in 1,000 Lines

얼렁뚱땅 LLM을 만들어보자

Comparing Replit and Cursor for AI-Powered Coding

Synology: Top Best Apps For Docker

ASCII 3D 렌더러 만들기

Anthropic, LLM의 내부를 이해하는데 있어 상당한 진전을 보임

llama3 implemented from scratch

HuggingFace 공동창업자가 추천하는 AI 분야 입문 서적

[VESSL AI] 뉴욕주민의 프로젝트플루토 — LLM, LLMOps를 활용한 금융 미디어의 혁신

PEFT: Parameter-Efficient Fine-Tuning of Billion-Scale Models on Low-Resource Hardware

The difference between quantization methods for the same bits

Mixture of Experts - Part 2