'cal q learning' 태그의 글 목록

본문 바로가기

cal q learning

cal q learning https://arxiv.org/abs/2303.05479 Cal-QL: Calibrated Offline RL Pre-Training for Efficient Online Fine-Tuning A compelling use case of offline reinforcement learning (RL) is to obtain a policy initialization from existing datasets followed by fast online fine-tuning with limited interaction. However, existing offline RL methods tend to behave poorly during fine-tu arxiv.org soft actor critic은 자신을.. 더보기

이전 1 다음

티스토리툴바