• 中国精品科技期刊
  • CCF推荐A类中文期刊
  • 计算领域高质量科技期刊T1类
高级检索

机器学习的可解释性

陈珂锐, 孟小峰

陈珂锐, 孟小峰. 机器学习的可解释性[J]. 计算机研究与发展, 2020, 57(9): 1971-1986. DOI: 10.7544/issn1000-1239.2020.20190456
引用本文: 陈珂锐, 孟小峰. 机器学习的可解释性[J]. 计算机研究与发展, 2020, 57(9): 1971-1986. DOI: 10.7544/issn1000-1239.2020.20190456
Chen Kerui, Meng Xiaofeng. Interpretation and Understanding in Machine Learning[J]. Journal of Computer Research and Development, 2020, 57(9): 1971-1986. DOI: 10.7544/issn1000-1239.2020.20190456
Citation: Chen Kerui, Meng Xiaofeng. Interpretation and Understanding in Machine Learning[J]. Journal of Computer Research and Development, 2020, 57(9): 1971-1986. DOI: 10.7544/issn1000-1239.2020.20190456

机器学习的可解释性

基金项目: 国家自然科学基金项目(91646203,61941121,61532010,91846204,61532016,91746115);河南财经政法大学学术创新骨干支持计划项目
详细信息
  • 中图分类号: TP181

Interpretation and Understanding in Machine Learning

Funds: This work was supported by the National Natural Science Foundation of China (91646203, 61941121, 61532010, 91846204, 61532016, 91746115) and the Young Talents Fund of Henan University of Economics and Law.
  • 摘要: 近年来,机器学习发展迅速,尤其是深度学习在图像、声音、自然语言处理等领域取得卓越成效.机器学习算法的表示能力大幅度提高,但是伴随着模型复杂度的增加,机器学习算法的可解释性越差,至今,机器学习的可解释性依旧是个难题.通过算法训练出的模型被看作成黑盒子,严重阻碍了机器学习在某些特定领域的使用,譬如医学、金融等领域.目前针对机器学习的可解释性综述性的工作极少,因此,将现有的可解释方法进行归类描述和分析比较,一方面对可解释性的定义、度量进行阐述,另一方面针对可解释对象的不同,从模型的解释、预测结果的解释和模仿者模型的解释3个方面,总结和分析各种机器学习可解释技术,并讨论了机器学习可解释方法面临的挑战和机遇以及未来的可能发展方向.
    Abstract: In recent years, machine learning has developed rapidly, especially in the deep learning, where remarkable achievements are obtained in image, voice, natural language processing and other fields. The expressive ability of machine learning algorithm has been greatly improved; however, with the increase of model complexity, the interpretability of computer learning algorithm has deteriorated. So far, the interpretability of machine learning remains as a challenge. The trained models via algorithms are regarded as black boxes, which seriously hamper the use of machine learning in certain fields, such as medicine, finance and so on. Presently, only a few works emphasis on the interpretability of machine learning. Therefore, this paper aims to classify, analyze and compare the existing interpretable methods; on the one hand, it expounds the definition and measurement of interpretability, while on the other hand, for the different interpretable objects, it summarizes and analyses various interpretable techniques of machine learning from three aspects: model understanding, prediction result interpretation and mimic model understanding. Moreover, the paper also discusses the challenges and opportunities faced by machine learning interpretable methods and the possible development direction in the future. The proposed interpretation methods should also be useful for putting many research open questions in perspective.
  • 期刊类型引用(47)

    1. 范如国,吴婷. 考虑多重异质性的区域环境合作治理小世界网络演化博弈研究. 管理工程学报. 2025(01): 140-154 . 百度学术
    2. 窦慧,张凌茗,韩峰,申富饶,赵健. 卷积神经网络的可解释性研究综述. 软件学报. 2024(01): 159-184 . 百度学术
    3. 孙书魁,范菁,孙中强,曲金帅,代婷婷. 基于深度学习的图像数据增强研究综述. 计算机科学. 2024(01): 150-167 . 百度学术
    4. 练志润,张家蔚,杨保林. 基于规则生成医案及Transformer算法构建中医方药推荐模型. 中国中医基础医学杂志. 2024(03): 437-442 . 百度学术
    5. 廖才波,杨金鑫,邱志斌,胡雄,曾清霖,黄智勇. 一种基于夏普利值及油中溶解气体分析的可解释变压器故障诊断方法. 电网技术. 2024(04): 1752-1762 . 百度学术
    6. 陈彩华,佘程熙,王庆阳. 可信机器学习综述. 工业工程. 2024(02): 14-26 . 百度学术
    7. 闵继源,鲁统宇,任婷婷,陈汝昊. 基于规则集成的可解释机器学习算法及应用. 计算机科学与探索. 2024(06): 1476-1490 . 百度学术
    8. 王贝伦,张嘉琦,蔡英豪,王兆阳,谈笑,沈典. 面向信息系统推荐与决策的高阶张量分析方法. 计算机研究与发展. 2024(07): 1697-1712 . 本站查看
    9. 申采玉,王帅,周锐盈,汪雨贺,高琴,陈兴智,杨枢. 慢性心力衰竭合并肺部感染患者院内死亡风险预测:基于可解释性机器学习方法. 南方医科大学学报. 2024(06): 1141-1148 . 百度学术
    10. 李志宏,蔡迎彬,王岩,樊华,伊丽米奴尔·阿合买,李紫梅. 基于机器学习算法预测早期结直肠腺癌病人内镜治疗后的癌症特异性生存状态. 护理研究. 2024(14): 2459-2467 . 百度学术
    11. 许志伟,李海龙,李博,李涛,王嘉泰,谢学说,董泽辉. AIGC大模型测评综述:使能技术、安全隐患和应对. 计算机科学与探索. 2024(09): 2293-2325 . 百度学术
    12. 魏光普,于晓燕,高耀辉,马明,马斌,董铁鑫. 省级一流风景园林规划设计虚拟仿真实验课程设计与用后评价研究——以内蒙古科技大学为例. 高教学刊. 2024(27): 25-28 . 百度学术
    13. 王越,李勇,张文静. 面向可解释性的软件缺陷预测主动学习方法. 现代电子技术. 2024(20): 101-108 . 百度学术
    14. 李二超,刘辰淼. Pareto解集旋转的分类多策略预测动态多目标优化. 计算机工程与应用. 2024(22): 87-104 . 百度学术
    15. 龙享福,李少波,张仪宗,杨磊,李传江. 因果学习方法和应用概述. 计算机工程与应用. 2024(24): 1-19 . 百度学术
    16. 赵方煜. 智能要素式审判的运行障碍与优化路径. 武汉交通职业学院学报. 2024(04): 40-46 . 百度学术
    17. 杨朋波,桑基韬,张彪,冯耀功,于剑. 面向图像分类的深度模型可解释性研究综述. 软件学报. 2023(01): 230-254 . 百度学术
    18. 李家宁,熊睿彬,兰艳艳,庞亮,郭嘉丰,程学旗. 因果机器学习的前沿进展综述. 计算机研究与发展. 2023(01): 59-84 . 本站查看
    19. 姚帅君,闫敬来,杜彩凤,杨继红. 基于集成学习构建围绝经期综合征中医智能诊断模型. 中医杂志. 2023(06): 572-580 . 百度学术
    20. 尤振飞,位一鸣,俞兴伟,宣科,邬凌云,王爱玉,张悦. 基于语义分割与证据理论的电杆倾斜检测及风险评估方法. 浙江电力. 2023(04): 79-87 . 百度学术
    21. 赖界亨,卢洵,王克英,邱显欣,潘振宁. 基于广义加性模型的调温负荷测算方法. 广东电力. 2023(06): 40-49 . 百度学术
    22. 刘泽润,刘超. 可持续建成环境研究的机器学习应用进展与展望. 风景园林. 2023(07): 51-59 . 百度学术
    23. 向许,于洪,张晓霞,王国胤. IsomapVSG-LIME:一种新的模型无关解释方法. 智能系统学报. 2023(04): 841-848 . 百度学术
    24. 徐鹤,郑群力,谢作玲,程海涛,李鹏,季一木. 基于知识表示向量的可解释深度学习模型及其疾病预测应用. 数据采集与处理. 2023(04): 777-791 . 百度学术
    25. 龚善要. 人工智能司法应用的实践审思与完善. 国家检察官学院学报. 2023(05): 95-108 . 百度学术
    26. 金东镇,郭城楠,彭芳,赵淑珍,李慧慧,夏喆铮,车明珠,王亚楠,张泽杰,毛广运. 从SHAP到概率——可解释性机器学习在糖尿病视网膜病变靶向脂质组学研究中的应用. 中国卫生统计. 2023(04): 511-515 . 百度学术
    27. 邹琼,张杨,万毅,陈长生. 糖尿病相关预测模型构建的机器学习方法. 中国卫生统计. 2023(04): 631-635+640 . 百度学术
    28. 韩富佳,王晓辉,乔骥,史梦洁,蒲天骄. 基于人工智能技术的新型电力系统负荷预测研究综述. 中国电机工程学报. 2023(22): 8569-8592 . 百度学术
    29. 吕亚兰,徐媛媛,张恒汝. 一种可解释性泛化矩阵分解推荐算法. 南京大学学报(自然科学). 2022(01): 135-142 . 百度学术
    30. 胡安宁. 以文本为基础的社会科学研究:从内容分析到算法模型. 学术论坛. 2022(01): 1-8 . 百度学术
    31. 古天龙,李龙,常亮,罗义琴. 公平机器学习:概念、分析与设计. 计算机学报. 2022(05): 1018-1051 . 百度学术
    32. 罗杨洋,韩锡斌. 混合课程学生成绩预测模型的可解释性探究. 中国远程教育. 2022(06): 46-55 . 百度学术
    33. 符冉迪,司光,金炜. 深度网络与FSVM集成学习的卫星云图云分类. 光学精密工程. 2022(08): 917-927 . 百度学术
    34. 李慧,焦雄. 基于影像组学的乳腺钼靶图像分类模型研究. 太原理工大学学报. 2022(04): 728-735 . 百度学术
    35. 古天龙,郝峰锐,李龙,李晶晶,常亮. 社交网络中负责隐私协商的智能体行为追责. 软件学报. 2022(09): 3453-3469 . 百度学术
    36. 袁高腾,周晓峰,郭宏乐. 基于特征选择算法的ECG信号分类. 山东大学学报(工学版). 2022(04): 38-44 . 百度学术
    37. 姜婷婷,傅诗婷. 人本视角下的数字记忆:“人—记忆—技术”三位一体理论框架构建与启示. 中国图书馆学报. 2022(05): 103-115 . 百度学术
    38. 李凌敏,侯梦然,陈琨,刘军民. 深度学习的可解释性研究综述. 计算机应用. 2022(12): 3639-3650 . 百度学术
    39. 魏佳,蒋理,穆原,徐建. 机器学习在检验医学中的应用进展与挑战. 中华检验医学杂志. 2022(12): 1288-1292 . 百度学术
    40. 辛瑞昊,董哲原,苗冯博,王甜甜,李英瑞,冯欣. 基于机器学习的心脏病预测模型研究. 吉林化工学院学报. 2022(09): 27-32 . 百度学术
    41. 白林亭,海钰琳. 基于梯度分析的卷积神经网络可视化方法. 信息技术与信息化. 2021(04): 61-63 . 百度学术
    42. 陈洞天,单杰,周文丹. 基于Xgboost的心血管疾病预测模型和指标分析研究. 现代医院. 2021(06): 958-961 . 百度学术
    43. 王锦. 基于弹性BP算法的手写数字识别. 新乡学院学报. 2021(06): 24-27 . 百度学术
    44. 戴宏,盛立杰,苗启广. 基于胶囊网络的对抗判别域适应算法. 计算机研究与发展. 2021(09): 1997-2012 . 本站查看
    45. 杜静湄,廖思阳,徐箭. 基于动态迭代排序的电网项目投资决策方法. 武汉大学学报(工学版). 2021(10): 942-951 . 百度学术
    46. 孙建文,周建鹏,刘三女牙,何绯娟,唐云. 基于多层注意力网络的可解释认知追踪方法. 计算机研究与发展. 2021(12): 2630-2644 . 本站查看
    47. 徐良辰,郭崇慧. 智慧医院建设背景下的电子病历分析利用框架. 大数据. 2021(04): 141-156 . 百度学术

    其他类型引用(88)

计量
  • 文章访问数:  3881
  • HTML全文浏览量:  25
  • PDF下载量:  2517
  • 被引次数: 135
出版历程
  • 发布日期:  2020-08-31

目录

    /

    返回文章
    返回