ISSN 1000-1239 CN 11-1777/TP

    2019人工智能前沿进展专题

    默认 最新文章 浏览次数
    Please wait a minute...
    选择: 显示/隐藏图片
    1. 2019人工智能前沿进展专题前言
    封举富,于剑
    计算机研究与发展    2019, 56 (8): 1604-1604.  
    摘要1873)   HTML213)    PDF (146KB)(759)   
           从 AlphaGo 到无人驾驶,从语音识别到人脸识别,人工智能已经成为当代最重要的技术之一,人工智能技术已广泛应用于科学发现、经济建设、社会生活等各个领域.2017年7月20日,国务院印发《新一代人工智能发展规划》,标志着人工智能研发已经提升至国家战略层面.随着大数据、云计算、物联网等信息技术的不断发展,人工智能研究在理论、方法、应用等多个层面均面临新的挑战.
           为及时反映国内同行在人工智能领域的最新研究成果,进一步推动我国人工智能领域的创新发展,《计算机研究与发展》出版“人工智能前沿进展”专题.该专题得到了国内人工智能学界的热情支持,专题总共收到稿件46篇,CCFAI2019会议收稿327篇,经过专家审稿,本专题从中选用文章15篇.这15篇文章反映了国内人工智能的研究现状,为读者提供了国内人工智能研究的最新成果.
           这15篇文章的作者来自于国内不同的人工智能研究机构,研究的着重点也有较大的不同.在机器学习方面,有无监督学习,也有强化学习,特别是在深度学习方面,既有新的理论成果,也有新的算法设计,更有实际应用方面的研究.在人工智能的应用方面,既有自然语言方面的工作,也有图像处理方面的研究,更加可喜的是,还有在程序理解方面的 AI 工作、以及知识图谱与搜索方面的文章.
           众所周知,读书看电视剧,最不喜欢别人剧透.因此,还是请读者自行阅读,这样可能对于作者的成果有更深刻的认知.衷心希望读者在研读专题文章后能够得到新的启发,有新的思想,并有新的文章发表,共同推动国内人工智能理论、技术与应用的进步.


    相关文章 | 计量指标
    2. 基于深度学习的程序理解研究进展
    刘芳,李戈,胡星,金芝
    计算机研究与发展    2019, 56 (8): 1605-1620.   doi: 10.7544/issn1000-1239.2019.20190185
    摘要1343)   HTML33)    PDF (1562KB)(1127)   
    程序理解通过对程序进行分析、抽象、推理从而获取程序中相关信息,在软件开发、维护、迁移等过程中起重要作用,因而得到学术界和工业界的广泛关注.传统程序理解很大程度上依赖开发人员的经验,但随着软件规模及其复杂度不断增大,完全依赖开发人员的先验知识提取程序特征既耗时耗力,又很难充分挖掘出程序中隐含特征.深度学习是一种数据驱动的端到端的方法,它根据已有数据构建深度神经网络对数据中隐含的特征进行挖掘,已经在众多领域中获得成功应用.将深度学习技术运用于程序理解中,根据具体任务以及大量数据自动地学习程序数据中蕴含的特征,可以充分地挖掘出程序中隐含的知识,提高程序理解的效率.对基于深度学习的程序理解研究工作进行综述,首先对程序所包含的性质进行分析,然后介绍主流的程序理解模型,包括基于序列、结构以及执行过程的程序理解模型.随后展示基于深度学习的程序理解在程序分析中的应用,主要针对代码补全、代码注释生成、代码检索等任务.最后,分析并总结程序理解研究所面临的挑战.
    相关文章 | 计量指标
    3. 基于深度神经网络结构的互联网金融市场动态预测
    赵洪科,吴李康,李徵,张兮,刘淇,陈恩红
    计算机研究与发展    2019, 56 (8): 1621-1631.   doi: 10.7544/issn1000-1239.2019.20190330
    摘要805)   HTML25)    PDF (1261KB)(609)   
    近些年,互联网金融市场在国内外迅速发展;同时,针对互联网金融市场的研究也成为了学术界的热点.相比于传统金融市场,互联网金融市场具有更高的流动性和易变性.针对互联网金融市场的动态(日交易量和日交易次数)进行研究,提出了基于深度神经网络结构的融合层次时间序列学习的预测模型.首先,该模型可以实现对多序列(市场宏观动态序列和多种子序列)特征变量输入的处理,并且在时间和序列特征2个维度上利用注意力机制来融合输入变量.其次,模型设计了基于预测序列平稳性约束的优化函数,使得模型具有更好的稳健性.最后,在真实的大规模数据集上进行了大量的实验,结果充分证明了所提出的模型在互联网金融市场动态预测问题上的有效性与稳健性.
    相关文章 | 计量指标
    4. 基于深度卷积生成对抗网络和拓展近邻重排序的行人重识别
    戴臣超,王洪元,倪彤光,陈首兵
    计算机研究与发展    2019, 56 (8): 1632-1641.   doi: 10.7544/issn1000-1239.2019.20190195
    摘要761)   HTML15)    PDF (3089KB)(429)   
    行人重识别任务旨在识别不相交摄像头视图下的相同行人.这项任务极具挑战性,尤其是当数据集中每个行人仅仅有几张图片时.针对行人重识别数据集中行人图片数量不足的问题,提出一个从原始数据集中生成额外训练数据的方法.在这项工作之中存在2个挑战:1)如何从原始数据集之中获取更多的训练数据;2)如何处理这些新生成的训练数据.使用深度卷积生成对抗网络来生成额外的无标签行人图片,并采用标签平滑正则化来处理这些新生成的无标签行人图片.为了进一步提升行人重识别准确度,提出了一种新的无监督重排序框架.此框架既不需要为每组图像对重新计算新的排序列表,也不需要任何人工交互或标签信息.在Market-1501,CUHK03和DukeMTMC-reID数据集上的实验验证了所提方法的有效性.
    相关文章 | 计量指标
    5. 基于混合门单元的非平稳时间序列预测
    刘颉羲,陈松灿
    计算机研究与发展    2019, 56 (8): 1642-1651.   doi: 10.7544/issn1000-1239.2019.20190326
    摘要757)   HTML6)    PDF (2185KB)(509)   
    非平稳多变量时间序列(non-stationary multivariate time series, NSMTS)预测目前仍是一个具有挑战性的任务.基于循环神经网络的深度学习模型,尤其是基于长短期记忆(long short-term memory, LSTM)和门循环单元(gated recurrent unit, GRU)的神经网络已获得了令人印象深刻的预测性能.尽管LSTM结构上较为复杂,却并不总是在性能上占优.最近提出的最小门单元(minimal gated unit, MGU)神经网络具有更简单的结构,并在图像处理和一些序列处理问题中能够提升训练效率.更为关键的是,实验中我们发现该门单元可以高效运用于NSMTS的预测,并达到了与基于LSTM和GRU的神经网络相当的预测性能.然而,基于这3类门单元的神经网络中,没有任何一类总能保证性能上的优势.为此提出了一种线性混合门单元(MIX gated unit, MIXGU),试图利用该单元动态调整GRU和MGU的混合权重,以便在训练期间为网络中的每个MIXGU获得更优的混合结构.实验结果表明,与基于单一门单元的神经网络相比,混合2类门单元的MIXGU神经网络具有更优的预测性能.
    相关文章 | 计量指标
    6. 融合CNN和Bi-LSTM的miRNA-lncRNA互作关系预测模型
    石文浩,孟军,张朋,刘婵娟
    计算机研究与发展    2019, 56 (8): 1652-1660.   doi: 10.7544/issn1000-1239.2019.20190128
    摘要1380)   HTML19)    PDF (2142KB)(565)   
    非编码RNA(ncRNA)在很多动植物生命活动方面起着重要的调节作用,而微小RNA(miRNA)与长非编码RNA(lncRNA)的相互作用更为重要,其互作关系的研究不仅有助于深入分析基因间生物学功能,也可为疾病的诊治和植物的遗传育种方面提供新思路.目前,miRNA-lncRNA互作关系的预测大多使用生物实验和传统机器学习方法.由于生物鉴定代价高耗时长和机器学习涉及过多人工干预且特征提取过程复杂,在此提出一种融合卷积神经网络(convolutional neural network, CNN)和双向长短期记忆网络(bidirectional long short-term memory network, Bi-LSTM)的深度学习模型,兼备两者优势,既考虑序列间信息相关性和结合上下文信息,又能充分提取序列数据的特征.采用交叉检验评估模型性能,在玉米数据集上与传统机器学习方法和单一模型比对,取得较优的分类效果.另外,采用马铃薯和小麦数据集进行模型测试,准确率分别达到95%和93%以上,验证了模型具有良好的泛化能力.
    相关文章 | 计量指标
    7. 一种基于两阶段深度学习的集成推荐模型
    王瑞琴,吴宗大,蒋云良,楼俊钢
    计算机研究与发展    2019, 56 (8): 1661-1669.   doi: 10.7544/issn1000-1239.2019.20190178
    摘要988)   HTML14)    PDF (1082KB)(494)   
    近年来,深度学习技术被广泛应用于推荐系统领域并获得了很大的成功,然而深度学习模型的输入质量对学习结果具有很大影响,稀疏的输入特征向量不仅会增加后续模型训练的难度,而且容易导致学习结果落入局部最优.提出一个基于两阶段深度学习的集成推荐模型:首先,利用具有封闭式参数计算能力的边缘化堆叠去噪自动编码机进行用户和项目高层抽象特征的提取;然后,将得到的用户抽象特征和项目抽象特征进行连接并作为深度神经网络模型的输入向量,通过联合训练的方式进行参数学习和模型优化.此外,为了对低阶特征交互进行建模,推荐模型中还集成了基于原始特征向量的逻辑回归模型.在通用数据集上的大量对比实验研究表明:与当前流行的深度学习推荐方法相比,该方法在推荐精度和召回率方面都有所改善,甚至是在数据稀疏和冷启动的环境下.
    相关文章 | 计量指标
    8. 多示例学习下的深度森林架构
    任婕,侯博建,姜远
    计算机研究与发展    2019, 56 (8): 1670-1676.   doi: 10.7544/issn1000-1239.2019.20190332
    摘要721)   HTML6)    PDF (1048KB)(482)   
    多示例学习已经广泛地应用到各个领域,如图像检索、文本分类、人脸识别等.而近年来深度神经网络也成功地运用到各个任务和问题上,MI-Nets是深度神经网络在多示例学习领域一个成功的应用.虽然MI-Nets很成功,但其主要在图像相关的任务上表现突出,而在非图像任务比如文本分类任务上的性能并不令人满意.而最近2年兴起的深度森林在非图像任务上取得了较好的成绩,并因为其相对于深度神经网络有较少的参数和较稳定的性能而受到青睐.所以用深度森林来提升多示例学习性能具有可行性.但由于深度森林结构的限制,并不能把组成深度森林的每一个森林都直接替换成包级别的森林,需要修改深度森林的结构来达到目的.提出了一种新的深度森林架构MIDF.在该架构下,为了使得中间层的输出分布可以和包中的示例拼接成功,拼接时把包里的每个示例都看作是一个包,从而使得级联结构依然有效.另外,还能自动确认深度森林的层数.实验结果表明:该方法在图像任务上的性能与擅长处理图像任务的MI-Nets相当;而在文本数据上,该方法取得了比MI-Nets和其他基线算法更好的效果.
    相关文章 | 计量指标
    9. 样本加权的多视图聚类算法
    洪敏,贾彩燕,李亚芳,于剑
    计算机研究与发展    2019, 56 (8): 1677-1685.   doi: 10.7544/issn1000-1239.2019.20190150
    摘要1011)   HTML28)    PDF (978KB)(623)   
    大数据时代,人类收集、存储、传输、管理数据的能力日益提高,各行各业已经积累了大量的数据资源,这些数据常呈现出多源性和异构性.如何对这些多源数据进行有效的聚类(也称为多视图聚类)已成为当今机器学习研究关注的焦点之一.现有的多视图聚类算法主要从“全局”角度关注不同视图和特征对簇结构的贡献,没有考虑不同样本间存在的“局部”信息间的差异.因此,提出一种新的多视图样本加权聚类算法(sample-weighted multi-view clustering, SWMVC),该算法对每个样本的不同视图进行加权,采用交替方向乘子法自适应学习样本权值,不仅可以学习不同样本点间不同视图权重的“局部”差异,还可以从学习到的“局部”差异反映出不同视图对簇结构贡献的“全局”差异,具有较好的灵活性.多个数据集上的实验表明:SWMVC方法在异质视图数据上具有较好的聚类效果.
    相关文章 | 计量指标
    10. Heavy-Ball型动量方法的最优个体收敛速率
    程禹嘉,陶蔚,刘宇翔,陶卿
    计算机研究与发展    2019, 56 (8): 1686-1694.   doi: 10.7544/issn1000-1239.2019.20190167
    摘要712)   HTML4)    PDF (2703KB)(315)   
    动量方法作为一种加速技巧被广泛用于提高一阶梯度优化算法的收敛速率.目前,大多数文献所讨论的动量方法仅限于Nesterov提出的加速方法,而对Polyak提出的Heavy-ball型动量方法的研究却较少.特别,在目标函数非光滑的情形下,Nesterov加速方法具有最优的个体收敛性,并在稀疏优化问题的求解中具有很好的效果.但对于Heavy-ball型动量方法,目前仅仅获得了平均输出形式的最优收敛速率,个体收敛是否具有最优性仍然未知.对于非光滑优化问题,通过巧妙地设置步长,证明了Heavy-ball型动量方法具有最优的个体收敛速率,从而说明了Heavy-ball型动量方法可以将投影次梯度方法的个体收敛速率加速至最优.作为应用,考虑了l\-1范数约束的hinge损失函数优化问题.通过与同类的优化算法相比,实验验证了该理论分析的正确性以及所提算法在保持稀疏性方面的良好性能.
    相关文章 | 计量指标
    11. 一种针对异常点的自适应回归特征选择方法
    郭亚庆,王文剑,苏美红
    计算机研究与发展    2019, 56 (8): 1695-1707.   doi: 10.7544/issn1000-1239.2019.20190313
    摘要588)   HTML6)    PDF (1355KB)(409)   
    数据集中含有不相关特征和冗余特征会使学习任务难度提高,特征选择可以有效解决该问题,从而提高学习效率和学习器性能.现有的特征选择方法大多针对分类问题,面向回归问题的较少,特别是当数据集含异常点时,现有方法对异常点敏感.虽然某些方法可以通过给样本损失函数加权来提高其稳健性,但是其权值一般都已预先设定好,且在特征选择和学习器训练过程中固定不变,因此方法的自适应性不强.针对上述问题,提出了一种针对异常点的回归特征选择方法(adaptive weight LASSO, AWLASSO),它首先根据回归系数更新样本误差,并通过自适应正则项将误差大于当前阈值的样本的损失函数赋予较小权重,误差小于阈值的样本的损失函数赋予较大权重,再在更新权重后的加权损失函数下重新估计回归系数,不断迭代上述过程.AWLASSO算法采用阈值来控制样本是否参与回归系数的估计,在阈值作用下,误差较小的样本才可参与估计,所以迭代完成后会获得较优的回归系数估计.另外,AWLASSO算法的阈值不是固定不变的,而是不断增大的(为使初始回归系数估计值较准确,其初始值较小),这样误判为异常点的样本可以重新进入训练集,并保证训练集含有足够的样本.对于误差大于最大阈值的样本点,由于其学习代价较大,算法将其识别为异常点,令其损失函数权重为0,从而有效降低了异常点的影响.在构造数据和标准数据上的实验结果表明:对于含有异常点的数据集,提出的方法比经典方法具有更好的稳健性和稀疏性.
    相关文章 | 计量指标
    12. 基于经验指导的深度确定性多行动者-评论家算法
    陈红名,刘全,闫岩,何斌,姜玉斌,张琳琳
    计算机研究与发展    2019, 56 (8): 1708-1720.   doi: 10.7544/issn1000-1239.2019.20190155
    摘要552)   HTML6)    PDF (4919KB)(386)   
    连续控制问题一直是强化学习研究的一个重要方向.近些年深度学习的发展以及确定性策略梯度(deterministic policy gradients, DPG)算法的提出,为解决连续控制问题提供了很多好的思路.这类方法大多在动作空间中加入外部噪声源进行探索,但是它们在一些连续控制任务中的表现并不是很好.为更好地解决探索问题,提出了一种基于经验指导的深度确定性多行动者-评论家算法(experience-guided deep deterministic actor-critic with multi-actor, EGDDAC-MA),该算法不需要外部探索噪声,而是从自身优秀经验中学习得到一个指导网络,对动作选择和值函数的更新进行指导.此外,为了缓解网络学习的波动性,算法使用多行动者-评论家模型,模型中的多个行动者网络之间互不干扰,各自执行情节的不同阶段.实验表明:相比于DDPG,TRPO和PPO算法,EGDDAC-MA算法在GYM仿真平台中的大多数连续任务中有更好的表现.
    相关文章 | 计量指标
    13. 一种残差置乱上下文信息的场景图生成方法
    林欣,田鑫,季怡,徐云龙,刘纯平
    计算机研究与发展    2019, 56 (8): 1721-1730.   doi: 10.7544/issn1000-1239.2019.20190329
    摘要399)   HTML2)    PDF (4604KB)(262)   
    场景图在视觉理解中有着很重要的作用.现有的场景图生成方法对于主语、宾语以及主宾语间的视觉关系进行研究.但是,人类通过空间关系上下文、语义上下文和目标之间的互动信息来进行关系的理解和推理.为了获得更好的全局上下文表示,同时减少数据集偏差的影响,提出了一个新的场景图生成框架RSSQ(residual shuffle sequence model).该框架由目标解码、残差置乱和位置嵌入3部分构成.残差置乱模块由随机置乱和残差连接的双向LSTM的基本结构叠加而成,利用迭代方式实现随机打乱双向LSTM的隐藏状态以减少数据集偏差影响,利用残差连接提取共享的全局上下文信息.在位置嵌入模块中,通过对目标的相对位置和面积比例的编码则可以增强目标对之间的空间关系.在数据集Visual Genome的3个不同层次子任务的实验中,证明了提出的RSSQ方法因全局上下文改善和空间关系增强,在Recall@50和Recall@100指标评价下,相对于现有方法能生成更好的场景图.
    相关文章 | 计量指标
    14. 基于依存树及距离注意力的句子属性情感分类
    苏锦钿,欧阳志凡,余珊珊
    计算机研究与发展    2019, 56 (8): 1731-1745.   doi: 10.7544/issn1000-1239.2019.20190102
    摘要950)   HTML16)    PDF (1527KB)(452)   
    目前基于注意力机制的句子属性情感分类方法由于忽略句子中属性的上下文信息以及单词与属性间的距离特征,从而导致注意力机制难以学习到合适的注意力权重.针对该问题,提出一种基于依存树及距离注意力的句子属性情感分类模型(dependency tree and distance attention, DTDA).首先根据句子的依存树得到包含属性的依存子树,并利用双向GRU学习句子及属性的上下文特征表示;根据句子中单词和属性在依存树中的最短路径确定相应的语法距离及位置权重,同时结合相对距离构造包含语义信息和距离信息的句子特征表示,并进一步利用注意力机制生成属性相关的句子情感特征表示;最后,将句子的上下文信息与属性相关的情感特征表示合并后并通过softmax进行分类输出.实验结果表明:DTDA在国际语义评测SemEval2014的2个基准数据集Laptop和Restaurant上取得与目前最好方法相当的结果.当使用相关领域训练的词向量时,DTDA在Laptop上的精确率为77.01%,在Restaurant上的准确率为81.68%.
    相关文章 | 计量指标
    15. 实值优化问题的非对称负相关搜索算法
    于润龙,赵洪科,汪中,叶雨扬,张培宁,刘淇,陈恩红
    计算机研究与发展    2019, 56 (8): 1746-1757.   doi: 10.7544/issn1000-1239.2019.20190198
    摘要625)   HTML6)    PDF (4572KB)(250)   
    现实世界中的许多应用与实值优化问题紧密相关.为了求解复杂的实值优化问题,一些研究工作提出不同的元启发式假设并设计相应的搜索策略.在搜索解空间过程中,如何平衡探索解空间新区域(多样化)与实现优质解利用(集约化)之间的关系,是提高元启发式搜索算法性能的关键因素之一.特别地,负相关搜索(negatively correlated search, NCS)通过在搜索进程中引入负相关的搜索趋势,促进了解的多样性,有效改进了并行爬山算法的搜索性能.负相关搜索将每一个搜索进程的搜索行为建模为概率分布,在此基础上,根据搜索进程的搜索范围的相对大小,将搜索行为进一步划分为全局搜索行为和局部搜索行为.然后提出一种新的元启发式搜索算法,即非对称负相关搜索(negatively correlated search with asymmetry, NSA),它假设具有全局搜索行为的搜索进程应尽可能远离具有局部搜索行为的搜索进程.得益于搜索进程之间非对称的负相关的搜索趋势,提出的算法相比负相关搜索拥有更优的搜索效率.实验结果表明:相比成熟的搜索方法,非对称负相关搜索在20个多模态实值优化问题上取得了最佳的整体性能.
    相关文章 | 计量指标
    16. 支持范围查询的低冗余知识图谱管理
    王飞,钱铁云,刘斌,彭智勇
    计算机研究与发展    2019, 56 (8): 1758-1771.   doi: 10.7544/issn1000-1239.2019.20190169
    摘要586)   HTML5)    PDF (1564KB)(518)   
    随着越来越多的数据以知识图谱的形式进行组织和发布,知识图谱的管理引起了大量的关注.现有知识图谱管理方法存在2个明显的缺陷:1)逻辑存储建模产生了大量的数据冗余,无法有效地支持连续属性的范围查询;2)语义存储建模代价昂贵,不能有效地适应查询的动态演化.提出了聚簇对象代理模型(cluster object deputy model, CODM)进行知识和元知识的建模管理.该模型具有2个特点,分别是模式化的逻辑存储建模和轻量级的语义存储建模.CODM设计了基于集合编辑距离的模式聚簇算法将知识图谱转化为模式数据,实现了数据的模式化存储,支持了面向属性数据类型的索引特化.此外,CODM构建类的层次系统建模实体之间的各种语义关联,采用对象指针实现了轻量级的泛化语义关联物化.实验结果证明:CODM不仅能够极大地减少数据冗余和有效地支持范围查询,而且加速了复杂查询的处理效率.
    相关文章 | 计量指标