Please wait a minute...
ISSN 1000-1239 CN 11-1777/TP

当期目录

2021年 第58卷 第12期    出版日期:2021-12-01
人工智能
可解释智能学习方法及其应用专题前言
郑庆华
2021, 58(12):  2571-2572.  doi:10.7544/issn1000-1239.2021.qy1201
摘要 ( 405 )   HTML ( 5)   PDF (235KB) ( 383 )  
相关文章 | 计量指标
以深度学习为代表的人工智能取得突破性进展,然而海量的参数与复杂的处理机制, 使得人类很难追溯与理解推理过程,导致这类端到端的黑箱学习方法不可解释,造成“知 其然,不知其所以然” .由此引发人们对算法可信性、公平性产生质疑,甚至造成伦理、法律等问题,影响了黑箱人工智能方法在无人驾驶、精准医疗、智能交通等高风险决策工程中的大规模应用.可解释性问题是打开黑箱人工智能方法、构建新一代人工智能理论的关键问题之一.可解释智能学习方法既要给出结果,同时也能提供计算推理过程所形成的证据链.
基于对比约束的可解释小样本学习
张玲玲, 陈一苇, 吴文俊, 魏笔凡, 罗炫, 常晓军, 刘均
2021, 58(12):  2573-2584.  doi:10.7544/issn1000-1239.2021.20210999
摘要 ( 569 )   HTML ( 7)   PDF (3204KB) ( 496 )  
相关文章 | 计量指标
不同于基于大规模监督的深度学习方法,小样本学习旨在从极少的几个样本中学习这类样本的特性,其更符合人脑的视觉认知机制.近年来,小样本学习受到很多学者关注,他们联合元学习训练模式与度量学习理论,挖掘查询集(无标记样本)和支持集(少量标记样本)在特征空间的语义相似距离,取得不错的小样本分类性能.然而,这些方法的可解释性偏弱,不能为用户提供一种便于直观理解的小样本推理过程.为此,提出一种基于区域注意力机制的小样本分类网络INT-FSL,旨在揭示小样本分类中的2个关键问题:1)图像哪些关键位置的视觉特征在决策中发挥了重要作用;2)这些关键位置的视觉特征能体现哪些类别的特性.除此之外,尝试在每个小样本元任务中设计全局和局部2种对比学习机制,利用数据内部信息来缓解小样本场景中的监督信息匮乏问题.在3个真实图像数据集上进行了详细的实验分析,结果表明:所提方法INT-FSL不仅能有效提升当前小样本学习方法的分类性能,还具备良好的过程可解释性.
面向无人驾驶时空同步约束制导的安全强化学习
王金永, 黄志球, 杨德艳, Xiaowei, Huang, 祝义, 华高洋
2021, 58(12):  2585-2603.  doi:10.7544/issn1000-1239.2021.20211023
摘要 ( 418 )   HTML ( 14)   PDF (3204KB) ( 484 )  
相关文章 | 计量指标
无人驾驶系统综合了软件和硬件复杂的交互过程,在系统设计阶段,形式化方法可以保证系统满足逻辑规约和安全需求;在系统运行阶段,深度强化学习被广泛应用于无人驾驶系统决策中.然而,在面对没有经验的场景和复杂决策任务时,基于黑盒的深度强化学习系统并不能保证系统的安全性和复杂任务奖励函数设置的可解释性.为此提出了一种形式化时空同步约束制导的安全强化学习方法.首先,提出了一种形式化时空同步约束规约语言,接近自然语言的安全需求规约使奖励函数的设置更具有解释性.其次,展示了时空同步自动机和状态-动作空间迁移系统,保证强化学习的状态行为策略更加安全.然后,提出了结合形式化时空约束制导的安全强化学习方法.最后,通过无人驾驶汽车在高速场景变道超车的案例,验证所提方法的有效性.
基于神经符号的动力电池拆解任务与运动规划
任伟, 王志刚, 杨华, 张翌盛, 陈铭
2021, 58(12):  2604-2617.  doi:10.7544/issn1000-1239.2021.20211002
摘要 ( 239 )   HTML ( 2)   PDF (3318KB) ( 173 )  
相关文章 | 计量指标
建立完善的动力电池回收利用体系是我国新能源汽车高质量发展需要突破的瓶颈问题之一,研究和发展智能化、柔性化、精细化的高效拆解技术是其中的重要环节.但由于受非结构化的拆解环境和拆解过程中的不确定性等因素的影响,目前,动力电池拆解还采用人工为主、机器辅助拆解的方式,不仅低效,而且致使工作人员暴露在危险的工作环境中,亟需向自动化、智能化方式转变.研究基于神经符号理论对动态环境中动力电池的拆解任务进行研究,设计并实现了一套任务和运动规划系统.与现有的动力电池拆解系统相比,系统在自主性、可扩展性、可解释性、可学习性4方面具备明显的优势,这4方面的优势相辅相成,可以不断促进系统的完善和提高,为实现动力电池的智能化拆解铺平了道路.基于该系统实现了在复杂多变的拆解工作环境中动力电池连接约束件的智能拆解,验证了系统的可行性.
可解释深度知识追踪模型
刘坤佳, 李欣奕, 唐九阳, 赵翔
2021, 58(12):  2618-2629.  doi:10.7544/issn1000-1239.2021.20211021
摘要 ( 473 )   HTML ( 8)   PDF (2113KB) ( 423 )  
相关文章 | 计量指标
知识追踪任务通过建模用户的习题作答序列跟踪其认知状态,进而预测其下一时刻的答题情况,实现对用户知识掌握程度的智能评估.当前知识追踪方法多针对知识点建模,忽略了习题信息建模与用户个性化表征,并且对于预测结果缺乏可解释性.针对以上问题,提出了一个可解释的深度知识追踪框架.首先引入习题的上下文信息挖掘习题与知识点间的隐含关系,得到更有表征能力的习题与知识点表示,缓解数据稀疏问题.接着建模用户答题序列获得其当前知识状态,并以此学习个性化注意力,进而得到当前习题基于用户知识状态的个性化表示.最后,对于预测结果,依据个性化注意力选择一条推理路径作为其解释.相较于现有方法,所提模型不仅取得了更好的预测结果,还能为预测结果提供推理路径层面的解释,体现了其优越性.
基于多层注意力网络的可解释认知追踪方法
孙建文, 周建鹏, 刘三女牙, 何绯娟, 唐云
2021, 58(12):  2630-2644.  doi:10.7544/issn1000-1239.2021.20210997
摘要 ( 372 )   HTML ( 10)   PDF (1645KB) ( 391 )  
相关文章 | 计量指标
认知追踪是一种数据驱动的学习主体建模技术,旨在根据学生历史答题数据预测其知识掌握状态或未来答题表现.近年来,在深度学习算法的加持下,深度认知追踪成为当前该领域的研究热点.针对深度认知追踪模型普遍存在黑箱属性,决策过程或结果缺乏可解释性,难以提供学习归因分析、错因追溯等高价值教育服务等问题,提出一种基于多层注意力网络的认知追踪模型.通过挖掘题目之间多维度、深层次的语义关联信息,建立一种包含题目元素、语义和记录等3层注意力的网络结构,利用图注意神经网络和自注意力机制等对题目进行嵌入表示、语义融合和记录检索.特别是在损失函数中引入提升模型可解释性的正则化项与权衡因子,实现对模型预测性能与可解释强度的调控.同时,定义了预测结果可解释性度量指标——保真度,实现对认知追踪模型可解释性的量化评估.最后,在6个领域基准数据集上的实验结果表明:该方法有效提升了模型的可解释性.
Dr.Deep:基于医疗特征上下文学习的患者健康状态可解释评估
马连韬, 张超贺, 焦贤锋, 王亚沙, 唐雯, 赵俊峰
2021, 58(12):  2645-2659.  doi:10.7544/issn1000-1239.2021.20211022
摘要 ( 296 )   HTML ( 4)   PDF (3062KB) ( 306 )  
相关文章 | 计量指标
深度学习是当前医疗多变量时序数据分析的主流方法.临床辅助决策关乎病人生命健康,因此深度模型需要抽取患者个性化表示,保证较高的分析、预测准确率;同时还需提供足够的可解释性,即能解释模型给出分析、预测结论的依据.而现有工作暂未能匹配医疗领域多变量时间序列数据的特性来进行个性化表示学习,同时源于深度学习的黑盒性质,现有模型大都可解释性不足,难以满足临床应用的需求.在此背景下,提出了基于医疗特征上下文学习的患者健康状态可解释评估方法Dr.Deep,将各变量的时序特征分别编码,利用多头去协同的自注意力机制,学习不同特征之间关联关系;提出了基于压缩激励机制的特征跳连编码,提升模型对最新病情变化的敏感性并针对不同患者情况分析特征重要性.实验表明:Dr.Deep在重症监护患者脓毒症预测、新冠肺炎重症患者出院时间预测等任务中相比业界方法性能提升,且可以针对不同患者的不同指标自适应学习其重要性作为可解释性的关键因素.同时设计并实现了基于医疗多变量时序数据分析的医生临床辅助系统,该系统建立病人的健康表示学习和预后预测模型并可视化患者病情进展以便医生分析.实验代码已开源于https://github.com/Accountable-Machine-Intelligence/Dr.Deep.所设计的智能医生可视化交互系统已发布于http://47.93.42.104/challenge/100049.
基于互惠性约束的可解释就业推荐方法
朱海萍, 赵成成, 刘启东, 郑庆华, 曾疆维, 田锋, 陈妍
2021, 58(12):  2660-2672.  doi:10.7544/issn1000-1239.2021.20211008
摘要 ( 232 )   HTML ( 4)   PDF (1267KB) ( 218 )  
相关文章 | 计量指标
当前,基于协同过滤和隐因子模型的大学生就业推荐方法,仅考虑学生对就业单位单向偏好易导致“能力失配”,且一个用户一次就业的历史记录极易致负样本不可信,影响推荐性能,同时忽略了对推荐结果的可解释性需求.针对此,依据多任务学习的思路,设计并构建了基于互惠性约束的可解释就业推荐方法.其中,引入注意力机制与模糊门机制,提取并自适应聚合学生与就业单位双向的偏好与需求,缓解“能力失配”问题;提出面向就业意图和就业特征的推荐解释方法,满足可解释性需求;提出基于相似度的随机负采样方法,克服负样本不置信问题.在某高校5届毕业生就业真实数据集上的实验结果表明:相比于多个经典和同时代的推荐方法,所提方法在AUC指标上提升超6%,并且通过消融实验验证了所提方法中各模块的有效性.
基于图匹配网络的可解释知识图谱复杂问答方法
孙亚伟, 程龚, 厉肖, 瞿裕忠
2021, 58(12):  2673-2683.  doi:10.7544/issn1000-1239.2021.20211004
摘要 ( 450 )   HTML ( 4)   PDF (1034KB) ( 438 )  
相关文章 | 计量指标
知识图谱问答是人工智能领域的研究热点之一.在该任务中,自然语言问句结构与知识图谱结构之间的语义匹配是一个具有挑战的研究问题.现有工作主要利用深度学习技术对自然语言问句进行序列化编码,然后与知识图谱子图计算语义匹配,这样做法未充分利用复杂问句的结构信息,方法也缺乏可解释性.针对此问题,提出一种基于图匹配网络的知识图谱复杂问答方法TTQA.首先,通过语法分析方法,构建一个与知识图谱无关的未定查询图.然后,依据未定查询图和给定的知识图谱,构建一个与知识图谱相关的已定查询图,在其中,提出一种图匹配网络GMN,通过结合预训练语言模型和图神经网络技术,再利用注意力机制学习查询结构的上下文表示,从而得到更加丰富的结构匹配表示,用于已定查询图预测.在2个复杂问答数据集LC-QuAD 1.0和ComplexWebQuestions 1.1进行实验,结果表明:TTQA超过了现有方法.同时,通过消融实验验证了GMN的有效性.此外,TTQA生成的未定结构图和已定查询图增强了问答系统可解释性.
系统结构
面向异构多核处理器的FPGA验证
李小波, 唐志敏, 李文
2021, 58(12):  2684-2695.  doi:10.7544/issn1000-1239.2021.20200289
摘要 ( 150 )   HTML ( 2)   PDF (3069KB) ( 112 )  
相关文章 | 计量指标
随着处理器架构的发展,高性能异构多核处理器不断涌现.由于高性能异构多核处理器的设计十分复杂,为了降低设计风险,缩短验证周期,提前进行软件开发,复现硅后问题等,通常需要搭建现场可编程门阵列(field programmable gate array, FPGA)的原型验证平台,并基于FPGA平台开展种类繁多,功能各异的软硬协同验证和调试工作.提出的基于同构FPGA平台对异构多核高性能处理器的FPGA调试、验证方法,有效地利用了异构多核处理器的架构特征,同构FPGA的对称特点,以层次化的方法自顶向下划分FPGA,自底向上构建FPGA平台.结合差速桥、自适应延迟调节、内嵌的虚拟逻辑分析仪(virtual logic analyzer, VLA)等技术可快速完成FPGA平台的点亮(bring-up)和部署.所提出的多核互补,核间替换模拟的调试SHELL等方法可以快速完整地对目标高性能异构多核处理器进行FPGA验证.通过该FPGA原型验证平台,成功地完成了硅前验证,软硬件协同开发和测试,硅后问题复现工作,并为下一代处理器架构设计提供了快速的硬件平台.
神威太湖之光可靠性及可用性设计与分析
高剑刚, 胡晋, 龚道永, 方燕飞, 刘骁, 何王全, 金利峰, 郑方, 李宏亮
2021, 58(12):  2696-2707.  doi:10.7544/issn1000-1239.2021.20200967
摘要 ( 311 )   HTML ( 5)   PDF (2778KB) ( 292 )  
相关文章 | 计量指标
随着系统规模与集成度的快速增加,可靠性与可用性问题成为构建E级计算机系统所面临的重大挑战.针对神威太湖之光超级计算机可靠性与可用性设计与实现开展全面的分析.首先概要描述神威太湖之光超级计算机系统结构.其次,系统提出神威太湖之光超级计算机可靠性增强技术以及故障预测、主动迁移、任务局部降级等主被动容错技术,建立神威太湖之光超级计算机多层次主被动协同的容错系统.再次,根据系统故障统计信息,分析失效分布及主要失效来源,结合指数、对数正态与韦布尔3种典型寿命周期分布,对神威太湖之光系统故障间隔时间分布进行数据拟合分析.最大似然估计与K-S(Kolmogorov Smirnov)检验结果表明,对数正态分布与系统失效经验数据取得了最好的拟合度,建立神威太湖之光系统失效分布模型,并计算得出系统平均无故障时间.通过系统运行统计与实际应用测试,分析了故障预测精确度以及主动迁移、局部降低等容错技术的时间开销与容错效果.最后,在神威太湖之光超级计算机可靠性与可用性分析的基础上,提出E级计算机系统高可靠与高可用技术发展建议.
人工智能
监控视频的异常检测与建模综述
杨帆, 肖斌, 於志文
2021, 58(12):  2708-2723.  doi:10.7544/issn1000-1239.2021.20200638
摘要 ( 748 )   HTML ( 13)   PDF (1129KB) ( 600 )  
相关文章 | 计量指标
随着物联网技术的不断发展,监控设备在交通干道、学校医院、商场超市、小区楼宇等公共区域进行了广泛部署.这些监控设备为人们提供了一种隐性安全保障,也产生了大量的监控视频.基于监控视频的异常检测一直是图像处理、机器视觉、深度学习等相关领域的研究热点.对视频异常进行了直观描述和异常检测概述,对出现的一些综述文章进行了分析,针对其覆盖范围不全和特征表示以及模型没有清晰划分.首先从异常检测特征表示、异常检测建模2方面对传统经典的和新兴的视频异常检测算法进行分类和描述.然后从基于距离、概率、重构3个方面将不同的算法进行比较,分析不同模型的优缺点以及每种模型的特性.并对现存算法的评估标准进行归纳并指出了新的更加准确有效的评估指标.最后,介绍了监控视频异常检测常用的数据集,汇总了不同算法在常用数据集上的检测效果,并对未来的研究在实际应用中面临的一些挑战和研究方向进行了探讨.
基于深度学习的人群计数研究综述
余鹰, 朱慧琳, 钱进, 潘诚, 苗夺谦
2021, 58(12):  2724-2747.  doi:10.7544/issn1000-1239.2021.20200699
摘要 ( 944 )   HTML ( 15)   PDF (7650KB) ( 696 )  
相关文章 | 计量指标
人群计数旨在估计图像或视频中人群的数量、密度或分布,属于目标计数(object counting)领域的研究范畴,广泛应用于人群行为分析、公共安全管理之中,以便及时发现人群拥挤或异常行为,避免事故发生.鉴于人群计数系统强大的实用性,自21世纪以来,研究者对其方法及应用进行了大量广泛的研究.近年来,深度学习技术发展迅猛,很多工作发现深度学习技术可以有效地解决人群计数系统存在的一系列关键问题,例如跨场景计数、透视畸变、尺度变化等.因此,对基于深度学习的人群计数这一研究领域进行回顾、分析和展望.具体地,首先从概念、步骤、方法等维度详细介绍人群计数模型,分析基于传统方法和基于深度学习方法这2类人群计数模型的差异.然后,从计数网络结构、ground-truth生成、损失函数、评价指标这4个方面阐述基于深度学习的人群计数模型的研究现状.最后,比较分析了各种人群计数数据集的特点,并探讨和展望人群计数领域未来可能的研究方向.
3D物体检测的异构方法
吕卓, 姚治成, 贾玉祥, 包云岗
2021, 58(12):  2748-2759.  doi:10.7544/issn1000-1239.2021.20200595
摘要 ( 218 )   HTML ( 3)   PDF (3627KB) ( 233 )  
相关文章 | 计量指标
3D物体检测是计算机视觉的一个重要研究方向,在自动驾驶等领域有着广泛的应用.现有的前沿工作采用端到端的深度学习方法,虽然达到了很好的检测效果但存在着算法复杂度高、计算量大、实时性不够等问题.经过分析发现3D物体检测中的“部分任务”并不适合使用深度学习的方法进行解决,为此提出了一种基于异构方法的3D物体检测方法,该方法在检测过程中同时使用深度学习和传统算法,将检测过程划分为多任务阶段:1)利用深度学习方法从被检测图片中获取被检测物体的mask、物体类别等信息;2)基于mask,利用快速聚类方法从雷达点云空间中筛选出目标物体的表面雷达点;3)利用物体mask、类别、雷达点云等信息计算物体朝向、边框等信息,最终实现3D物体检测.对该方法进行了系统实现,称之为HA3D(a heterogeneous approach for 3D object detection).经实验表明:在针对汽车的3D检测数据集KITTI上,该方法与代表性的基于深度学习的3D物体检测方法相比,在检测精度下降接受范围内(2.0%),速度提升了52.2%,精确率与计算时间的比值提升了49%.从综合表现上来看,方法具有明显的优势.
基于深度学习的人脸属性识别方法综述
赖心瑜, 陈思, 严严, 王大寒, 朱顺痣
2021, 58(12):  2760-2782.  doi:10.7544/issn1000-1239.2021.20200870
摘要 ( 1007 )   HTML ( 15)   PDF (5867KB) ( 701 )  
相关文章 | 计量指标
人脸属性识别是计算机视觉和模式识别领域的热门研究课题之一,对人脸图像的分析和理解具有重要的研究意义,同时在图像检索、人脸识别、微表情识别和推荐系统等诸多领域具有广泛的实际应用价值.随着深度学习的快速发展,目前国内外学者已提出许多基于深度学习的人脸属性识别(deep learning based facial attribute recognition, DFAR)方法.首先,阐述人脸属性识别方法的总体流程.接着,按照不同的模型构建方式,分别对基于部分的与基于整体的DFAR方法进行详细地概述与讨论.具体地,对基于部分的DFAR方法按是否采用规则区域定位进行分类,而对基于整体的DFAR方法则分别从基于单任务学习、基于多任务学习的角度进行区分,并对基于多任务学习的DFAR方法根据是否采用属性分组来进一步细分.然后介绍了常用的人脸属性识别数据集与评价指标,并对比与分析了新近提出的DFAR方法的性能.最后对DFAR方法的未来研究趋势进行展望.
网络技术
基于深度强化学习的自适应虚拟机整合方法
余显, 李振宇, 孙胜, 张广兴, 刁祖龙, 谢高岗
2021, 58(12):  2783-2797.  doi:10.7544/issn1000-1239.2021.20200366
摘要 ( 228 )   HTML ( 6)   PDF (3297KB) ( 200 )  
相关文章 | 计量指标
能耗限制的服务质量优化问题一直以来都是数据中心虚拟机资源管理所面临的巨大挑战之一.尽管现有的工作通过虚拟机整合技术一定程度上降低了能耗和提升了系统服务质量,但这些方法通常难以实现长期最优的管理目标,并且容易受到业务场景变化的影响,面临变更困难以及管理成本高等难题.针对数据中心虚拟机资源管理存在的能耗和服务质量长期最优难保证以及策略调整灵活性差的问题,提出了一种基于深度强化学习的自适应虚拟机整合方法(deep reinforcement learning-based adaptive virtual machine consolidation method, RA-VMC).该方法利用张量化状态表示、确定性动作输出、卷积神经网络和加权奖赏机制构建了从数据中心系统状态到虚拟机迁移策略的端到端决策模型;设计自动化状态生成机制和反向梯度限定机制以改进深度确定性策略梯度算法,加快虚拟机迁移决策模型的收敛速度并且保证近似最优的管理性能.基于真实虚拟机负载数据的仿真实验结果表明:与开源云平台中流行的虚拟机整合方法相比,该方法能够有效地降低能耗和提高系统的服务质量.
一种基于DAG的网络流量调度器
时洋, 文梅, 费佳伟, 张春元
2021, 58(12):  2798-2810.  doi:10.7544/issn1000-1239.2021.20200568
摘要 ( 207 )   HTML ( 10)   PDF (1826KB) ( 220 )  
相关文章 | 计量指标
在如今的数据中心中,各种分布式任务往往会对各种不同的资源进行竞争,特别是网络资源.如果没有有效的网络调度,那么这种竞争就会降低整个数据中心的运行效率.以往的网络资源调度研究由于忽视了任务里计算与网络需求之间的具体关系,对于任务性能的提升十分有限.因此,旨在探索如何通过网络调度来缩短数据中任务的完成时间(job completion time, JCT),从而提升数据中心的整体效率.通过对基于有向无环图(directed acyclic graph, DAG)的分布式任务的深度分析,发现可以在降低它们的网络占用的同时,却不影响它们的JCT.根据这个发现,提出了一个利用计算图来加速任务执行的网络调度器JIT.为了实现JIT,首先将调度问题建模成为一个整数线性规划问题(integer linear programming, ILP),然后证明了这个ILP可以通过一个等价的线性规划模型(linear programming, LP)来快速求解.此外,通过一些合理的简化,将求解时间降低到了1s.与其他调度器的比较实验结果说明了JIT可以取得1.55倍的整体加速效果,从而有效提升数据中心的工作效率.
信息安全
多轮EM结构的量子差分碰撞密钥恢复攻击
张中亚, 吴文玲, 邹剑
2021, 58(12):  2811-2818.  doi:10.7544/issn1000-1239.2021.20200427
摘要 ( 131 )   HTML ( 1)   PDF (547KB) ( 122 )  
相关文章 | 计量指标
量子算法的发展和应用对密码算法的设计和分析产生了深远的影响,其中Grover量子算法和Simon量子算法在密码安全性评估中应用较多,但作为生日碰撞攻击量子化的BHT(Brassard,Hyer,Tapp)量子算法,还没有得到具体应用,研究BHT量子算法对密码算法的分析具有重要意义.通过对多轮EM(Even,Mansour)结构进行分析,研究了经典条件和量子条件下的碰撞搜索算法与差分密钥恢复攻击的结合,对多轮EM结构进行了差分碰撞密钥恢复攻击,并从BHT量子算法的角度进行量子化.结果表明,经典条件下,当差分传递概率2-p≥2-n/2时,r轮EM结构的差分密钥恢复攻击时间复杂度从O(2p+n)降到O(2p+n/2),速度快了2n/2倍.量子条件下,当差分传递概率2-p>2-n/3时,结合BHT量子算法的差分碰撞密钥恢复攻击时间复杂度要优于基于Grover量子算法的差分密钥恢复攻击,显示了BHT量子算法在具体密码分析中的有效性.