⚛
컴퓨터공학 강의 노트
Computer Science Lecture Notes
자료구조
알고리즘
운영체제
컴퓨터구조
검색
⌘K
KO
/
EN
홈
/
딥러닝
/
강화 학습
Chapter 4
강화 학습
Reinforcement Learning
MDP, Q-러닝, 정책 경사
개념 (2)
마르코프 결정 과정
골격
정책 경사법
골격
법칙 (1)
벨만 방정식
골격
연습문제
이 단원의 연습문제를 풀어보세요
컴퓨터공학 강의 노트 | Computer Science Lecture Notes