로그인

검색

Deeplearning
2022.08.10 18:04

강화학습 학습 관련 정리

OBG
조회 수 5744 추천 수 0 댓글 0
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 게시글 수정 내역 댓글로 가기 인쇄
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 게시글 수정 내역 댓글로 가기 인쇄

https://mustlearning.tistory.com/69

 

기초

1. 리차드 S. 소튼의 [Introduction to Reinforcement Learning] 입문 혹은 David Silver의 강화학습 강의 영상(유튜브) 

(Introduction to Reinforcement Learning은 현재 '단단한 강화학습'으로 변역이 되어 출간되었음)

2. 김성훈 교수님의 강화학습 강의 (유튜브)

3. 팡요랩의 강화학습 강의 (유튜브)

 

강화학습 인 액션 책은 이후 학습 하는 것이 좋을 것

단단한 심층 강화학습 책도 있으니 참고

 

팡요랩의 PyTorch 이용한 RL 구현 소스

https://www.facebook.com/groups/ReinforcementLearningKR/posts/2193159584256603/

https://github.com/seungeunrho/minimalRL

 


https://blog.naver.com/PostView.naver?blogId=yo2dh&logNo=222476933570&parentCategoryNo=&categoryNo=15&viewDate=&isShowPopularPosts=true&from=search

 

시작은 단단한 학습보다 바닥부터 배우는 강화학습으로 하는게 좋을듯

?

  1. Programming 게시판 관련

    Date2014.11.01 CategoryTool/etc ByMoA Views37602
    read more
  2. OS in 1,000 Lines

    Date2025.01.14 CategoryTool/etc ByOBG Views5303
    Read More
  3. 얼렁뚱땅 LLM을 만들어보자

    Date2025.01.10 CategoryLLM ByOBG Views4560
    Read More
  4. Comparing Replit and Cursor for AI-Powered Coding

    Date2024.09.21 CategoryLLM ByOBG Views6524
    Read More
  5. Synology: Top Best Apps For Docker

    Date2024.07.01 CategoryTool/etc ByOBG Views5826
    Read More
  6. ASCII 3D 렌더러 만들기

    Date2024.06.03 CategoryGraphic ByOBG Views4859
    Read More
  7. Anthropic, LLM의 내부를 이해하는데 있어 상당한 진전을 보임

    Date2024.06.03 CategoryLLM ByOBG Views5286
    Read More
  8. llama3 implemented from scratch

    Date2024.05.24 CategoryLLM ByOBG Views5389
    Read More
  9. HuggingFace 공동창업자가 추천하는 AI 분야 입문 서적

    Date2024.05.24 CategoryTool/etc ByOBG Views5636
    Read More
  10. [VESSL AI] 뉴욕주민의 프로젝트플루토 — LLM, LLMOps를 활용한 금융 미디어의 혁신

    Date2024.04.21 CategoryLLM ByOBG Views5820
    Read More
  11. PEFT: Parameter-Efficient Fine-Tuning of Billion-Scale Models on Low-Resource Hardware

    Date2024.04.15 CategoryLLM ByOBG Views5221
    Read More
  12. The difference between quantization methods for the same bits

    Date2024.04.14 CategoryLLM ByOBG Views6460
    Read More
  13. Mixture of Experts - Part 2

    Date2024.04.14 CategoryLLM ByOBG Views5582
    Read More
  14. ChatGPT의 강력한 경쟁 언어모델 등장!, Mixtral 8x7B

    Date2024.04.14 CategoryLLM ByOBG Views5480
    Read More
  15. Real-Time Stock News Sentiment Prediction with Python

    Date2024.04.11 CategoryLLM ByOBG Views6059
    Read More
  16. Getting Started with Sentiment Analysis using Python

    Date2024.04.11 CategoryLLM ByOBG Views5854
    Read More
  17. How LLMs Work ? Explained in 9 Steps — Transformer Architecture

    Date2024.04.11 CategoryLLM ByOBG Views6385
    Read More
  18. 만능 프롬프트

    Date2024.04.07 CategoryLLM ByOBG Views5334
    Read More
  19. A Beginner's Guide to Prompt Engineering with GitHub Copilot

    Date2024.04.04 CategoryLLM ByOBG Views5172
    Read More
  20. [12월 1주] 떠오르는 '미스트랄 7B'...'라마 2' 이어 한국어 모델 세대교체 주도

    Date2024.03.05 CategoryLLM ByOBG Views8731
    Read More
  21. Using Machine Learning to Predict Customers’ Next Purchase Day

    Date2024.02.27 CategoryDeeplearning ByOBG Views8306
    Read More
Board Pagination Prev 1 2 3 4 5 6 7 8 9 10 ... 17 Next
/ 17