로그인

검색

Deeplearning
2022.08.10 18:04

강화학습 학습 관련 정리

OBG
조회 수 3084 추천 수 0 댓글 0
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 게시글 수정 내역 댓글로 가기 인쇄
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 게시글 수정 내역 댓글로 가기 인쇄

https://mustlearning.tistory.com/69

 

기초

1. 리차드 S. 소튼의 [Introduction to Reinforcement Learning] 입문 혹은 David Silver의 강화학습 강의 영상(유튜브) 

(Introduction to Reinforcement Learning은 현재 '단단한 강화학습'으로 변역이 되어 출간되었음)

2. 김성훈 교수님의 강화학습 강의 (유튜브)

3. 팡요랩의 강화학습 강의 (유튜브)

 

강화학습 인 액션 책은 이후 학습 하는 것이 좋을 것

단단한 심층 강화학습 책도 있으니 참고

 

팡요랩의 PyTorch 이용한 RL 구현 소스

https://www.facebook.com/groups/ReinforcementLearningKR/posts/2193159584256603/

https://github.com/seungeunrho/minimalRL

 


https://blog.naver.com/PostView.naver?blogId=yo2dh&logNo=222476933570&parentCategoryNo=&categoryNo=15&viewDate=&isShowPopularPosts=true&from=search

 

시작은 단단한 학습보다 바닥부터 배우는 강화학습으로 하는게 좋을듯

?

  1. Programming 게시판 관련

    Date2014.11.01 CategoryTool/etc ByMoA Views17741
    read more
  2. PEFT: Parameter-Efficient Fine-Tuning of Billion-Scale Models on Low-Resource Hardware

    Date2024.04.15 CategoryLLM ByOBG Views1996
    Read More
  3. The difference between quantization methods for the same bits

    Date2024.04.14 CategoryLLM ByOBG Views2946
    Read More
  4. Mixture of Experts - Part 2

    Date2024.04.14 CategoryLLM ByOBG Views2423
    Read More
  5. ChatGPT의 강력한 경쟁 언어모델 등장!, Mixtral 8x7B

    Date2024.04.14 CategoryLLM ByOBG Views2822
    Read More
  6. Real-Time Stock News Sentiment Prediction with Python

    Date2024.04.11 CategoryLLM ByOBG Views2677
    Read More
  7. Getting Started with Sentiment Analysis using Python

    Date2024.04.11 CategoryLLM ByOBG Views2758
    Read More
  8. How LLMs Work ? Explained in 9 Steps — Transformer Architecture

    Date2024.04.11 CategoryLLM ByOBG Views2767
    Read More
  9. 만능 프롬프트

    Date2024.04.07 CategoryLLM ByOBG Views2905
    Read More
  10. A Beginner's Guide to Prompt Engineering with GitHub Copilot

    Date2024.04.04 CategoryLLM ByOBG Views2301
    Read More
  11. [12월 1주] 떠오르는 '미스트랄 7B'...'라마 2' 이어 한국어 모델 세대교체 주도

    Date2024.03.05 CategoryLLM ByOBG Views2932
    Read More
  12. Using Machine Learning to Predict Customers’ Next Purchase Day

    Date2024.02.27 CategoryDeeplearning ByOBG Views3474
    Read More
  13. 멀티-플레이어 게임 서버와 레이턴시 보상 테크닉

    Date2024.01.16 Category서버 ByOBG Views2370
    Read More
  14. [ifkakao] 추천 시스템: 맥락과 취향 사이 줄타

    Date2024.01.10 CategoryDeeplearning ByOBG Views2670
    Read More
  15. How to stop programmers to copy the code from GitHub when they leave the company?

    Date2024.01.02 CategoryTool/etc ByOBG Views3156
    Read More
  16. 10 Useful/Fun/Weird Github Repos You Have to Play Around With

    Date2023.12.28 CategorySite ByOBG Views3068
    Read More
  17. 모든 개발자를위한 10 가지 특별한 GitHub 리포지토리

    Date2023.12.28 CategorySite ByOBG Views2799
    Read More
  18. 마이크로소프트가 공개한 무료 AI 코스들

    Date2023.11.28 CategoryDeeplearning ByOBG Views2722
    Read More
  19. 내 마음대로 선정한 머신러닝/딥러닝 학습 추천 서적

    Date2023.08.14 CategoryDeeplearning ByOBG Views3455
    Read More
  20. LSTM-AE를 이용한 시퀀스 데이터 이상 탐지

    Date2023.08.14 CategoryDeeplearning ByOBG Views2816
    Read More
  21. Top 3 most used Pytorch Ecosystem Libraries you should Know about

    Date2023.08.02 CategoryDeeplearning ByOBG Views3340
    Read More
Board Pagination Prev 1 2 3 4 5 6 7 8 9 10 ... 17 Next
/ 17