ISSN 1000-1239 CN 11-1777/TP
基于强化学习的伦理智能体训练方法
古天龙, 高慧, 李龙, 包旭光, 李云辉
An Approach for Training Moral Agents via Reinforcement Learning
Gu Tianlong, Gao Hui, Li Long, Bao Xuguang, Li Yunhui
计算机研究与发展 . 2022, (9): 2039 -2050 .  DOI: 10.7544/issn1000-1239.20210474