ISSN 1000-1239 CN 11-1777/TP
基于TD-error自适应校正的深度Q学习主动采样方法
白辰甲,刘鹏,赵巍,唐降龙
Active Sampling for Deep Q-Learning Based on TD-error Adaptive Correction
Bai Chenjia, Liu Peng, Zhao Wei, Tang Xianglong
计算机研究与发展 . 2019, (2): 262 -280 .  DOI: 10.7544/issn1000-1239.2019.20170812