컴퓨터공학 강의 노트

Computer Science Lecture Notes

Chapter 4

강화 학습

Reinforcement Learning

MDP, Q-러닝, 정책 경사

개념 (2)

마르코프 결정 과정골격 정책 경사법골격

법칙 (1)

벨만 방정식골격

연습문제

이 단원의 연습문제를 풀어보세요

컴퓨터공학 강의 노트 | Computer Science Lecture Notes