ISSN 1000-1239 CN 11-1777/TP

    2021人工智能前沿进展专题

    默认 最新文章 浏览次数
    Please wait a minute...
    选择: 显示/隐藏图片
    1. 人工智能前沿进展专题前言
    陶建华, 朱军, 侯臣平, 张利军
    计算机研究与发展    2021, 58 (8): 1573-1574.   doi: 10.7544/issn1000-1239.2021.qy0801
    摘要1176)   HTML271)    PDF (214KB)(821)   
    人工智能的迅速发展正深刻地改变着人类社会生活,在理论和方法上,人工智能呈现出深度学习、跨界融合、人机协同、群智开放、自主操控等新特征.数据驱动与知识驱动融合、跨媒体协同处理、人机协同增强智能、群体集成智能、自主智能系统等成为人工智能的发展重点,人工智能发展进入新阶段,随着新一代人工智能相关理论建模、技术创新、软硬件升级等整体推进,亟需破解研究中面临的理论、方法、应用等多个层面的挑战性难题.基于上述背景,为了加速我国人工智能领域研究,以及更好地推进人工智能技术的应用落地,《计算机研究与发展》出了本期“新一代人工智能前沿进展”专题.本专题共收录了14篇论文,反映国内同行在新一代人工智能前沿领域的最新研究成果,希望能为从事相关工作的读者提供借鉴和帮助.
    相关文章 | 计量指标
    2. 基于被动-主动的特征演化流学习
    刘艳芳, 李文斌, 高阳
    计算机研究与发展    2021, 58 (8): 1575-1585.   doi: 10.7544/issn1000-1239.2021.20210330
    摘要360)   HTML5)    PDF (855KB)(278)   
    在许多现实应用中,数据以一种特征演化流的形式收集.例如,随着传感器的更换,由旧传感器收集的数据特征会消失,新传感器收集的数据特征会出现.在线被动-主动算法已被证明可以有效地从具有固定特征空间和梯形特征空间的数据集中学习线性分类器.因此,提出了一种基于被动-主动更新策略的特征演化学习算法(passive-aggressive learning with feature evolvable streams, PAFE).该算法通过主动-被动更新策略从当前特征空间和被恢复的已消失特征空间中学习了2个模型.具体来说,在重叠时段,即新旧特征同时存在的时段,该算法用新特征恢复了消失的特征空间,同时用旧特征空间模拟了新特征空间,进而为新特征空间的模型学习提供合理的初始化.基于这2个模型,为提高算法整体性能提出了2个集成算法:组合预测和当前最优预测.在合成数据集和真实数据集上的实验结果验证了该算法的有效性.
    相关文章 | 计量指标
    3. 用于求解旅行商问题的深度智慧型蚁群优化算法
    王原, 陈名, 邢立宁, 吴亚辉, 马武彬, 赵宏
    计算机研究与发展    2021, 58 (8): 1586-1598.   doi: 10.7544/issn1000-1239.2021.20210320
    摘要511)   HTML5)    PDF (3058KB)(465)   
    启发式算法是求解组合优化问题求解的重要手段,其主要特征是能够以可接受的计算代价找到足够好的可行解.然而,设计良好的用于求解组合优化问题的启发式算法需要大量的专业领域知识以及大量的试错工作,且人工设计的启发式算法不能够保证在不同问题集上均具有一致性表现.另一方面,深度学习方法能够通过学习自动设计启发式规则,然而深度学习方法通常缺少在解空间内搜索的能力.为克服以上问题,提出了一种基于蚁群优化和深度强化学习的混合启发式算法框架.在该框架中,蚁群算法能够利用深度强化学习提取的启发式信息,而深度强化学习方法的解空间搜索性能也由于蚁群算法的加入而获得提高.采用经典的TSPLIB中的算例对该算法求解旅行商问题的效能进行了计算验证,结果表明采用深度学习方法能够极大地提升蚁群算法的计算表现,并降低其计算代价.
    相关文章 | 计量指标
    4. 基于张量分解的知识超图链接预测模型
    王培妍, 段磊, 郭正山, 蒋为鹏, 张译丹
    计算机研究与发展    2021, 58 (8): 1599-1611.   doi: 10.7544/issn1000-1239.2021.20210315
    摘要495)   HTML7)    PDF (1928KB)(508)   
    知识超图包含了现实世界中的事实,并给出这些事实的结构化表示.但知识超图无法包括所有事实,所以其是高度不完整的.链接预测方法致力于根据现有实体间链接推理缺失链接,因此广泛应用于知识库补全.目前大多数研究集中于二元关系知识图谱的补全.然而,现实世界中实体间的关系通常是非二元的,即关系中涉及的实体通常多于2个.相较于知识图谱,知识超图能够以一种灵活且自然的方式来表示这些复杂的多元关系.对此,设计一个基于张量分解的知识超图链接预测模型Typer,显式地为不同关系以及不同位置上实体的角色建模,并对关系进行细化分解以提升模型性能.同时,考虑到促进实体与关系间的信息流动有助于学习实体和关系的嵌入表示,提出窗口的概念,以增加实体与关系的交互.此外,证明了Typer模型具有完全表达性,并给出了使模型具有完全表达性的嵌入表示维度边界.在多个公开真实知识超图数据集上进行了详实的实验,实验表明Typer模型能有效解决知识超图链接预测问题,并在所有数据集上取得了较其他方法更好的结果.
    相关文章 | 计量指标
    5. 基于K阶互信息估计的位置感知网络表征学习
    储晓恺, 范鑫鑫, 毕经平
    计算机研究与发展    2021, 58 (8): 1612-1623.   doi: 10.7544/issn1000-1239.2021.20210321
    摘要312)   HTML4)    PDF (2641KB)(199)   
    随着网络结构数据持续、快速的增长,各种复杂网络数据分析与应用层出不穷.近年来,网络表征学习已经成为各类网络分析任务的主流方法.网络表征学习的主要目标是依据节点间连接关系,学习高质量的节点表征向量,从而辅助分析下游任务.然而,现有的表征学习方法未考虑节点在网络中的位置信息.为了解决这一问题,提出了一种位置感知网络表征学习模型PMI,该模型通过最大化每个中心节点与各阶邻居之间的互信息,从而将节点的位置信息学入表征向量中.在表征训练过程中,PMI模型激励每个中心节点记住并识别其每阶的邻居节点,从而间接记录其位置信息.在4个不同领域的真实数据集上进行了多标签分类、网络重构、链接预测等多个代表性网络分析任务实验,实验结果表明提出的PMI模型可以学到高质量的节点表征向量,与现有的表征学习模型相比,PMI模型能够在多个下游任务上有较大幅度提升.此外,还设计邻居对齐任务对PMI模型进行进一步的分析,结果表明PMI模型学到的节点表征能够有效识别不同阶的邻居节点并捕获自身的位置信息,从而为各种下游任务生成合理有效的表征.
    相关文章 | 计量指标
    6. 基于非递减时序随机游走的动态异质网络嵌入
    郭佳雯, 白淇介, 林铸天, 宋春瑶, 袁晓洁
    计算机研究与发展    2021, 58 (8): 1624-1641.   doi: 10.7544/issn1000-1239.2021.20210317
    摘要296)   HTML8)    PDF (1976KB)(350)   
    网络嵌入是将高维网络映射到低维向量空间的一种表示学习方法.目前,人们对动态同质网络嵌入和静态异质信息网络嵌入已经开展了一些研究,但动态异质网络上的嵌入研究仍然较少.如果直接应用静态网络嵌入或动态同质网络嵌入方法来解决动态异质网络嵌入问题,会由于忽略网络的动态或异质特性而导致严重的信息丢失.因此,提出一种基于时间和类别约束随机游走的动态异质网络嵌入方法TNDE.该方法引入类别约束,能够解决动态异质网络中由于异质特性带来的语义信息保留问题.不同于其他动态网络中的时序随机游走,该方法采用非递减的时间约束来增量式地进行随机游走,能够解决网络同时具备动态和异质特性而引入的强语义局部结构上的边时间戳一致的挑战,避免游走时出现时间戳陷入的问题.通过对实时变化的增量游走和嵌入学习,TNDE提供了一种高效的在线表示学习算法.在3个真实数据集上的实验结果表明:该方法在不同特性的网络中具有良好的通用性.与目前最先进方法相比,能够得到下游链路预测和节点分类任务中2.4%~92.7%的准确度提升,显著提高了嵌入质量,并在保证良好嵌入质量的前提下,缩短算法运行时间12.5%~99.91%.
    相关文章 | 计量指标
    7. 基于病毒传播网络的基因序列表示学习
    马扬, 刘泽一, 梁星星, 程光权, 阳方杰, 成清, 刘忠
    计算机研究与发展    2021, 58 (8): 1642-1654.   doi: 10.7544/issn1000-1239.2021.20210287
    摘要313)   HTML4)    PDF (1865KB)(244)   
    基因序列数据中往往存在大量的非编码和缺失序列,现有的基因序列表示大多通过人工方法对高维的基因序列进行特征提取,不仅非常耗时且成功的预测很大程度依赖于生物学知识的正确利用.基于病毒传播网络构建了一种基于图上下文信息的基因序列表示方法,对目标节点病毒序列进行编码后,使用注意力机制对其邻居节点的序列信息进行聚合,从而得到目标节点病毒序列的新的低维表示.进而依据病毒传播网络中相邻节点的基因序列相似性高于不相邻节点的特征,对基因序列表示模型进行优化,训练后得到的新的表示不仅可以有效表达基因序列的特征,同时极大地降低了序列的维度,提高了计算效率.分别在仿真病毒传播网络、新型冠状病毒和艾滋病毒传播网络数据上训练基因序列表示模型,并在相应的网络上进行未采样感染者发现任务.实验结果充分验证了模型的有效性,与其他方法的比较证明了模型的高效性,模型可以有效地在病毒传播网络上发现未采样感染者,这在流行病调查领域也具有一定的实际意义.
    相关文章 | 计量指标
    8. 基于多模态对抗学习的无监督时间序列异常检测
    黄训华, 张凤斌, 樊好义, 席亮
    计算机研究与发展    2021, 58 (8): 1655-1667.   doi: 10.7544/issn1000-1239.2021.20201037
    摘要676)   HTML13)    PDF (2112KB)(580)   
    时间序列异常检测旨在发现对应时序特征中不符合一般规律的特异性模式,是机器学习领域重要的研究方向之一.然而,现有的时序异常检测方法大多为单模态学习,忽略了时序信息在多模态空间上不同特征分布的关联性和互补性,不能充分利用已有信息进行有效地模式挖掘,从而造成检测效果差等问题.为此,提出了一种基于多模态对抗学习的无监督时间序列异常检测模型.首先,将原始时间序列转换至频域空间,构造多模态时间序列表示.其次,提出多模态生成对抗网络模型,针对多模态时间序列,实现正常时序信息关于时域和频域特征分布的无监督联合学习.最后,通过将异常检测问题转化为时间序列在时域和频域空间的重构度量问题,从时域空间和频域空间2个方面度量时间序列的异常值,实现更有效的异常检测.在时间序列数据集合UCR和MIT-BIH中的6个真实数据集的实验结果表明,在异常检测任务上相较于传统单模态异常检测方法,提出方法在AUC和AP这2个性能指标上最高分别提升了12.50%和21.59%,证明了方法的有效性.
    相关文章 | 计量指标
    9. 基于代码属性图和Bi-GRU的软件脆弱性检测方法
    肖添明, 管剑波, 蹇松雷, 任怡, 张建锋, 李宝
    计算机研究与发展    2021, 58 (8): 1668-1685.   doi: 10.7544/issn1000-1239.2021.20210297
    摘要409)   HTML6)    PDF (2352KB)(295)   
    现在软件规模越来越庞大和复杂,脆弱性形式也更趋向多样化,传统的脆弱性检测方法存在人工参与度高、对未知脆弱性检测能力弱的缺点,已无法满足对多样化脆弱性的检测要求.为了提高对未知脆弱性的检测效果,大量机器学习方法被应用到软件脆弱性检测领域.由于现有方法在代码表征过程中存在着较高的语法和语义信息的损失,导致误报率和漏报率较高.针对这一问题,提出了一种基于代码属性图和Bi-GRU的软件脆弱性检测方法.该方法通过从函数的代码属性图中提取出抽象语法树序列、控制流图序列作为函数表征的表征方式,减少代码表征过程中的信息的损失,并通过选取Bi-GRU来构建特征提取模型,提高对脆弱性代码的特征提取能力.实验结果表明,与以抽象语法树为表征方式的方法相比,该方法最大可提高35%的精确率和22%的召回率,可改善面向多个软件源代码混合的真实数据集的脆弱性检测效果,有效降低误报率和漏报率.
    相关文章 | 计量指标
    10. 基于改进RetinaNet的自然环境中蝴蝶种类识别
    谢娟英, 鲁银圆, 孔维轩, 许升全
    计算机研究与发展    2021, 58 (8): 1686-1704.   doi: 10.7544/issn1000-1239.2021.20210283
    摘要411)   HTML7)    PDF (7875KB)(249)   
    蝴蝶是一种对栖息地敏感的昆虫,自然环境中的蝴蝶种类分布反映了区域生态系统平衡和生物多样性.专家鉴别蝴蝶种类耗时耗力,计算机视觉技术为野外环境中蝴蝶种类自动识别提供了可能.针对野外环境下的蝴蝶图像特征,提出2种新的硬注意力机制,DSEA(direct squeeze-and-excitation with global average pooling)和DSEM(direct squeeze-and-excitation with global max pooling),改进经典目标检测算法RetinaNet,并引入可变形卷积增强RetinaNet对蝴蝶形变的建模能力,实现野外环境下蝴蝶种类自动识别.以mAP(mean average precision)目标检测指标评价模型性能,通过实验结果可视化,分析影响模型性能的关键因素.实验结果显示,提出的改进RetinaNet对自然环境下的蝴蝶识别任务具有很不错的效果, 特别是基于DSEM的RetinaNet;分布平衡的训练集可以提升提出模型的泛化性能;样本的结构相异性是影响模型性能的关键因素.
    相关文章 | 计量指标
    11. 基于融合多尺度标记信息的深度交互式图像分割
    丁宗元, 孙权森, 王涛, 王洪元
    计算机研究与发展    2021, 58 (8): 1705-1717.   doi: 10.7544/issn1000-1239.2021.20210195
    摘要449)   HTML7)    PDF (2816KB)(287)   
    现有深度交互式图像分割算法通过对单击点计算距离映射或者高斯映射,然后将其与图像进行拼接作为网络的输入.每个单击点的影响范围是相同的,而每个交互的目的并不相同,早期交互的主要目的为选择,后期则更侧重微调.基于此,提出了融合多尺度标记信息的深度交互图像分割算法.首先,通过设置不同高斯半径,对每个单击点计算2组不同尺度的高斯映射.然后,融合小尺度高斯映射,并移除基础分割网络中的部分下采样模块,使网络提取更丰富的细节特征.同时,为了保持目标分割结果的完整性,提出了非局部特征注意力模块,该模块融合了大尺度高斯映射.最后,根据高斯映射提供的概率信息,提出了概率单击损失,提升目标在单击附近的分割表现.实验结果表明:提出的算法既能保持分割的完整性,又能得到目标细节的分割结果,大大降低了用户的交互负担.
    相关文章 | 计量指标
    12. 基于并行注意力UNet的裂缝检测方法
    刘凡, 王君锋, 陈峙宇, 许峰
    计算机研究与发展    2021, 58 (8): 1718-1726.   doi: 10.7544/issn1000-1239.2021.20210335
    摘要395)   HTML8)    PDF (2284KB)(472)   
    裂缝对公共设施而言存在着安全隐患,因此裂缝检测是公共设施进行维护的重要手段.由于裂缝图像中存在噪声、光线、阴影等因素干扰,神经网络在训练时极易被影响,导致预测结果出现偏差,降低预测效果.为减少这些干扰,设计了一个并行注意力机制,并将其嵌入到UNet网络的解码部分,进而提出了并行注意力UNet(parallel attention based UNet, PA-UNet).该方法分别从通道和空间2个维度加大裂缝特征权重以抑制干扰,然后对这2个维度生成的特征进行融合,以获得更具互补性的裂缝特征.为了验证该方法的有效性,选取了4个数据集进行实验,结果表明该方法较现有的主流方法,裂缝检测效果更加优异.同时,为了验证并行注意力机制的有效性,选取了4种注意力机制与其进行对比实验,结果表明并行注意力机制效果优于其他注意力机制.
    相关文章 | 计量指标
    13. 面向自然语言处理的对抗攻防与鲁棒性分析综述
    郑海斌, 陈晋音, 章燕, 张旭鸿, 葛春鹏, 刘哲, 欧阳亦可, 纪守领
    计算机研究与发展    2021, 58 (8): 1727-1750.   doi: 10.7544/issn1000-1239.2021.20210304
    摘要811)   HTML9)    PDF (1997KB)(881)   
    随着人工智能技术的飞速发展,深度神经网络在计算机视觉、信号分析和自然语言处理等领域中都得到了广泛应用.自然语言处理通过语法分析、语义分析、篇章理解等功能帮助机器处理、理解及运用人类语言.但是,已有研究表明深度神经网络容易受到对抗文本的攻击,通过产生不可察觉的扰动添加到正常文本中,就能使自然语言处理模型预测错误.为了提高模型的鲁棒安全性,近年来也出现了防御相关的研究工作.针对已有的研究,全面地介绍自然语言处理攻防领域的相关工作,具体而言,首先介绍了自然语言处理的主要任务与相关方法;其次,根据攻击和防御机制对自然语言处理的攻击方法和防御方法进行分类介绍;然后,进一步分析自然语言处理模型的可验证鲁棒性和评估基准数据集,并提供自然语言处理应用平台和工具包的详细介绍;最后总结面向自然语言处理的攻防安全领域在未来的研究发展方向.
    相关文章 | 计量指标
    14. 基于孪生BERT网络的科技文献类目映射
    何贤敏, 李茂西, 何彦青
    计算机研究与发展    2021, 58 (8): 1751-1760.   doi: 10.7544/issn1000-1239.2021.20210323
    摘要309)   HTML3)    PDF (1592KB)(277)   
    国际专利分类法(international patent classification, IPC)和中国图书馆分类法(Chinese library classification, CLC)作为重要分类标识,分别在专利信息和期刊文献的组织以及管理中发挥着重要作用.如何准确地建立它们之间的映射关系对实现专利信息、期刊资源交叉浏览和检索有着重要的意义.提出了基于BERT预训练上下文语言模型的孪生网络用于建立IPC类目和CLC类目之间的映射关系,利用孪生网络模型分别抽象这2个分类法类目描述文本,通过平均池化抽象后的向量表示计算得到它们相同维度的句子向量,基于余弦相似度计算句子之间的相似度得分,完成类目映射.在人工标注一定规模的IPC类目和CLC类目之间的映射语料库上进行实验验证,结果表明提出的方法显著优于基于规则的方法和Sia-Multi,Bi-TextCNN,Bi-LSTM等深度神经网络的方法.相关的代码、模型和人工标注语料库已经公开发布.
    相关文章 | 计量指标
    15. 用于金融文本挖掘的多任务学习预训练金融语言模型
    刘壮, 刘畅, Wayne, Lin, 赵军
    计算机研究与发展    2021, 58 (8): 1761-1772.   doi: 10.7544/issn1000-1239.2021.20210298
    摘要493)   HTML6)    PDF (1485KB)(588)   
    近年来,机器学习,尤其是深度神经网络方法促进了金融文本挖掘研究的发展,在金融科技(Fintech)领域起着越来越重要的作用.如何从金融大数据中提取有价值的信息已经成为学术界和工业界一个非常有挑战的研究.由于深度神经网络需要大量标注数据,但是金融领域缺乏训练数据,因此,将深度学习应用于金融大数据挖掘并没有取得很好效果.为了更好地解决该问题,利用自监督学习和多任务学习等深度学习领域最新的思想和技术,提出了基于BERT模型架构的开源金融预训练语言模型F-BERT.F-BERT是一种针对特定领域(金融文本数据)的预训练语言模型,它通过在大型金融语料库上进行无监督训练得到.基于BERT架构,F-BERT可以有效地自动将知识从金融大数据中提取出并记忆在模型中,而无需进行特定于金融任务的模型结构修改,从而可以直接将其应用于下游各种金融领域任务,包括股票涨跌预测、金融情绪分类、金融智能客服等.在金融关系提取、金融情绪分类、金融智能问答任务上的大量实验表明了F-BERT模型的有效性和鲁棒性.同时,F-BERT在这3个有代表性的金融文本挖掘任务上均取得了很高的模型准确率,进一步验证了模型的性能.
    相关文章 | 计量指标