Double DQN 썸네일형 리스트형 Chapter 8. Advanced Value Function Approximation DQN을 기반으로 한 다른 연구들을 알아보자. • 아타리에서의 성공은 심층 신경망을 사용하여 강화학습에서 가치 함수 근사를 수행하는 데 큰 흥미를 불러일으켰습니다. • 즉시 개선된 몇 가지 방법들 (그 외에도 다른 많은 방법들이 있습니다!) • Double DQN (Double Q 학습을 이용한 심층 강화학습, Van Hasselt 등, AAAI 2016) • Prioritized Replay (우선순위 기반 경험 재생, Schaul 등, ICLR 2016) • Dueling DQN (ICML 2016 최우수 논문) (심층 강화학습을 위한 Dueling 네트워크 아키텍처, Wang 등, ICML 2016) DQN을 기반으로 한 연구는 계속해서 진화하고 있으며, 다양한 개선 및 변형이 제안되고 있습니다. .. 더보기 이전 1 다음