ISSN 1000-1239 CN 11-1777/TP

    2018优青专题

    默认 最新文章 浏览次数
    Please wait a minute...
    选择: 显示/隐藏图片
    1. 2018优青专题前言
    刘克,刘志勇
    计算机研究与发展    2018, 55 (9): 1827-1828.  
    摘要465)   HTML3)    PDF (436KB)(245)   
    国家自然科学基金委员会自2012年设立优秀青年科学基金(“优青基金”)项目以来,至今已资助6批在基础研究方面崭露头角的青年学者自主选题开展创新研究。为了促进计算机科学技术领域的研究、开发、教育和前沿知识的传播,《计算机研究与发展》自2015年以来刊出了“优青专题”系列,通过集中介绍这些优秀青年学者(及其合作者)的研究成果或学术见解,使读者了解这一层次研究人员的研究状况及相关方向的发展趋势。该系列并未专注于某个特定方向的具体研究细节,而是希望为读者们呈现计算机科学技术研究领域较为宽泛的场景。本期是该系列的第4个专题,共收录12篇文章。
    相关文章 | 计量指标
    2. 基于深度特征的无监督图像检索研究综述
    张皓,吴建鑫
    计算机研究与发展    2018, 55 (9): 1829-1842.   doi: 10.7544/issn1000-1239.2018.20180058
    摘要1949)   HTML22)    PDF (2841KB)(1171)   
    基于内容的图像检索(content-based image retrieval, CBIR)是一项极具挑战的计算机视觉任务.其目标是从数据库图像中找到和查询图像包含相同实例的图像.一个典型的图像检索流程包括2步:设法从图像中提取一个合适的图像的表示向量和对这些表示向量进行最近邻搜索以找到相似的图像.其中,决定图像检索算法性能的关键在于其提取的图像表示的好坏.图像检索中使用的图像表示经历了基于手工特征和基于深度特征两大时期,每个时期又有全局特征和局部特征2个阶段.由于手工特征的表示能力有限,近年来图像检索的研究主要集中在如何利用深度特征.将以提取图像表示的不同思路为线索,回顾无监督图像检索领域的发展历程,介绍该领域的一些代表性算法,并比较这些算法在常用数据集上的性能表现,最后探讨未来的研究方向.
    相关文章 | 计量指标
    3. 面向时序数据异常检测的可视分析综述
    韩东明,郭方舟,潘嘉铖,郑文庭,陈为
    计算机研究与发展    2018, 55 (9): 1843-1852.   doi: 10.7544/issn1000-1239.2018.20180126
    摘要1608)   HTML49)    PDF (2688KB)(826)   
    时序数据中的异常检测指的是在时序上去检测分析数据中异常的特征、趋势或模式.自动化的异常检测方法常会忽略细微的、模糊的、不确定的异常.可视分析通过对数据的可视表达和可视界面,集成用户和数据挖掘的能力.首先总结异常检测的挑战;然后从异常类型(属性、拓扑和混合)和异常检测方法(直接投影法、聚类方法和机器学习方法)2个角度对面向时序数据异常检测的可视分析工作进行分类和总结;最后阐述了未来的研究方向.
    相关文章 | 计量指标
    4. 区块链数据分析:现状、趋势与挑战
    陈伟利,郑子彬
    计算机研究与发展    2018, 55 (9): 1853-1870.   doi: 10.7544/issn1000-1239.2018.20180127
    摘要4883)   HTML124)    PDF (3117KB)(2918)   
    区块链是一项具有颠覆许多传统行业的潜力的新兴技术.自以比特币为代表的区块链1.0诞生以来,区块链技术获得了广泛的关注,积累了大量的用户交易数据.而以以太坊为代表的区块链2.0的诞生,更加丰富了区块链的数据类型.区块链技术的火热,催生了大量基于区块链的技术创新的同时也带来许多新的问题,如用户隐私泄露,非法金融活动等.而区块链数据公开的特性,为研究人员通过分析区块链数据了解和解决相关问题提供了前所未有的机会.因此,总结目前区块链数据存在的研究问题、取得的分析成果、可能的研究趋势以及面临的挑战具有重要意义.为此,全面回顾和总结了当前的区块链数据分析的成果,在介绍区块链技术架构和关键技术的基础上,分析了目前区块链系统中主要的数据类型,总结了目前区块链数据的分析方法,并就实体识别、隐私泄露风险分析、网络画像、网络可视化、市场效应分析、交易模式识别、非法行为检测与分析等7个问题总结了当前区块链数据分析的研究进展.最后针对目前区块链数据分析研究中存在的不足分析和展望了未来的研究方向以及面临的挑战.
    相关文章 | 计量指标
    5. 深度神经网络压缩与加速综述
    纪荣嵘,林绍辉,晁飞,吴永坚,黄飞跃
    计算机研究与发展    2018, 55 (9): 1871-1888.   doi: 10.7544/issn1000-1239.2018.20180129
    摘要2298)   HTML35)    PDF (4080KB)(1516)   
    深度神经网络在人工智能的应用中,包括计算机视觉、语音识别、自然语言处理方面,取得了巨大成功.但这些深度神经网络需要巨大的计算开销和内存存储,阻碍了在资源有限环境下的使用,如移动或嵌入式设备端.为解决此问题,在近年来产生大量关于深度神经网络压缩与加速的研究工作.对现有代表性的深度神经网络压缩与加速方法进行回顾与总结,这些方法包括了参数剪枝、参数共享、低秩分解、紧性滤波设计及知识蒸馏.具体地,将概述一些经典深度神经网络模型,详细描述深度神经网络压缩与加速方法,并强调这些方法的特性及优缺点.此外,总结了深度神经网络压缩与加速的评测方法及广泛使用的数据集,同时讨论分析一些代表性方法的性能表现.最后,根据不同任务的需要,讨论了如何选择不同的压缩与加速方法,并对压缩与加速方法未来发展趋势进行展望.
    相关文章 | 计量指标
    6. 大规模时序图数据的查询处理与挖掘技术综述
    王一舒,袁野,刘萌,王国仁
    计算机研究与发展    2018, 55 (9): 1889-1902.   doi: 10.7544/issn1000-1239.2018.20180132
    摘要1176)   HTML13)    PDF (2466KB)(602)   
    时序图作为一种带有时间维度的图结构,在图数据的查询处理与挖掘工作中扮演着越来越重要的角色.与传统的静态图不同,时序图的结构会随时间序列发生改变,即时序图的边由时间激活.而且由于时序图上每条边都有记录时间的标签,所以时序图包含的信息量相较于静态图也更为庞大,这使得现有的数据查询处理方法不能很好地应用于时序图中.因此如何解决时序图上的数据查询处理与挖掘问题得到研究者们的关注.对现有的时序图上的查询处理与挖掘方法进行了综述,详细介绍了时序图的应用背景和基本定义,梳理了现有的时序图模型,并从图查询处理方法、图挖掘方法和时序图管理系统3个方面对时序图上现有的工作进行了详细的介绍和分析.最后对时序图上可能的研究方向进行了展望,为相关研究提供参考.
    相关文章 | 计量指标
    7. 开放互联网中的学者画像技术综述
    袁莎,唐杰,顾晓韬
    计算机研究与发展    2018, 55 (9): 1903-1919.   doi: 10.7544/issn1000-1239.2018.20180139
    摘要1559)   HTML17)    PDF (3315KB)(863)   
    开放互联网中的学者画像工作是近年来的研究热点问题.学者画像的目标是提取学者各维度的属性信息进行信息挖掘和分析应用.学者画像技术是大型智库实现专家发现、学术影响力评估等功能的关键.在开放互联网中,学者画像面临数据量大、数据噪音和数据冗余等新挑战.这使得传统的用户画像理论、模型和方法无法直接无缝地移植到开放互联网环境下的用户画像系统中.针对这些挑战,对现有学者画像技术进行了总结和分类,为进一步的研究工作提供参考.首先分析了学者画像问题,对学者画像的基础理论——信息抽取方法——进行了总体概述,详细总结了各种可用模型与方法;对实现学者画像的基本任务包括学者信息标注、研究兴趣挖掘和学术影响力预测进行了详细阐述;介绍了学者画像应用实例AMiner系统;对未来重点的研究内容和发展方向进行了探讨和展望.
    相关文章 | 计量指标
    8. 数据中心网络流调度技术前沿进展
    胡智尧,李东升,李紫阳
    计算机研究与发展    2018, 55 (9): 1920-1930.   doi: 10.7544/issn1000-1239.2018.20180156
    摘要1050)   HTML9)    PDF (2375KB)(639)   
    数据中心网络流调度技术对数据中心网络的性能具有重要影响.它是指对数据中心应用产生的网络数据流,通过控制和调度这些网络流在数据中心网络中的传输链路、传输优先级、传输速率等,以优化网络流量的传输(包括减少数据流平均完成时间、降低加权的平均完成时间、降低数据流尾部完成时间、最大化满足有传输时限的数据流、提高网络资源利用率等),最终实现优化用户体验的目的.首先,对数据中心网络流调度问题及其面临的挑战进行简单介绍.流调度的关键挑战在于设计低开销、高效率的调度算法,以及在终端电脑或者网络交换机上实现调度算法.然后,从独立数据流调度方法和网络流组的调度方法进行综述.这2类流调度技术的区别在于应用的环境(如Web搜索和大数据分析)不同.最后,对未来流调度技术的发展方向进行展望,并且提出多个尚未解决、但仍值得研究的问题.
    相关文章 | 计量指标
    9. 有限域上低差分函数研究进展
    屈龙江,陈玺,牛泰霖,李超
    计算机研究与发展    2018, 55 (9): 1931-1945.   doi: 10.7544/issn1000-1239.2018.20180159
    摘要736)   HTML2)    PDF (1305KB)(277)   
    为了抵抗差分密码攻击,密码算法设计希望使用低差分函数.完全非线性函数(perfect nonli-near function, PN函数)、几乎完全非线性函数(almost perfect nonlinear function, APN函数)和4差分置换(differentially 4-uniform permutition)是最重要的几类低差分函数(low differential uniformity function).总结了近年来在PN函数、APN函数和4差分置换等低差分函数研究方面的主要进展.1)回顾了PN函数与半域等数学对象的联系,梳理了PN函数的已有构造以及伪平面函数的构造;2)分析了APN函数的性质与判定,总结了APN函数的已有构造以及它们之间等价性分析方面的结果;3)对于4差分置换,总结了其已有构造及其等价性分析结果;4)介绍了低差分函数在实际密码算法设计中的应用;5)对低差分函数的下一步研究进行了展望.
    相关文章 | 计量指标
    10. 视觉问答技术研究
    俞俊,汪亮,余宙
    计算机研究与发展    2018, 55 (9): 1946-1958.   doi: 10.7544/issn1000-1239.2018.20180168
    摘要1951)   HTML32)    PDF (1926KB)(868)   
    随着深度学习在计算机视觉、自然语言处理领域取得的长足进展,现有方法已经能准确理解视觉对象和自然语言的语义,并在此基础上开展跨媒体数据表达与交互研究.近年来,视觉问答(visual question answering, VQA)是跨媒体表达与交互方向上的研究热点问题.视觉问答旨在让计算机理解图像内容后根据自然语言输入的查询进行自动回答.围绕视觉问答问题,从概念、模型、数据集等方面对近年来的研究进展进行综述,同时探讨现有工作存在的不足;最后从方法论、应用和平台等多方面对视觉问答未来的研究方向进行了展望.
    相关文章 | 计量指标
    11. 一种基于标签传播的两阶段社区发现算法
    郑文萍,车晨浩,钱宇华,王杰
    计算机研究与发展    2018, 55 (9): 1959-1971.   doi: 10.7544/issn1000-1239.2018.20180277
    摘要927)   HTML8)    PDF (4361KB)(533)   
    针对标签传播社区发现算法在节点更新顺序及标签传播过程中存在较大随机性而导致划分结果稳定性差的问题,提出一种基于标签传播的两阶段社区发现算法(a two-stage community detection algorithm based on label propagation, LPA-TS),通过参与系数确定节点更新顺序,并在标签传播过程中依据节点间相似性更新节点标签,得到初始社区划分.将社区看作节点,社区间连边数作为边权重,得到社区关系网络.按照参与系数由低到高的顺序合并社区关系网络中的节点,得到最终社区划分结果.算法LPA-TS减少了传统LPA方法在节点更新和标签传播过程的随机性;在第2阶段,将不符合弱社区定义的初始社区与连边最多的相邻社区合并,再按照社区参与系数由低到高的顺序合并初始社区提升社区发现质量.通过与一些经典算法在8个真实网络及不同参数下LFR benchmark人工网络数据集上的实验比较表明LPA-TS算法表现了良好的稳定性,在NMI、ARI、模块性等方面表现良好.
    相关文章 | 计量指标
    12. 一种基于社交事件关联的故事脉络生成方法
    李莹莹,马帅,蒋浩谊,刘喆,胡春明,李雄
    计算机研究与发展    2018, 55 (9): 1972-1986.   doi: 10.7544/issn1000-1239.2018.20180155
    摘要806)   HTML11)    PDF (4887KB)(332)   
    推特和新浪微博等社交网络已成为报道公共事件的重要平台,它们为监控事件及其演化提供了宝贵的数据.然而,这些数据包含的非正式词语和碎片化文本使得从中提取描述性的信息具有一定的挑战.另外,从快速生成的大量微博监控事件演化也有一定难度.提出在社交网络中监控事件并对具有相同主题的事件演化进行分析.这既可以在粗粒度水平获得事件的概述,又可以在细粒度水平获得事件的详细信息.通过3个连续的组件实现该任务.1)用结构化的方法从微博检测事件;2)基于事件的隐式语义信息对事件聚类并将聚类获得的簇定义为故事;3)用基于图的方法为每个故事生成故事脉络,故事脉络用包含摘要的有向无环图表示故事内事件的演化.用户体验评估实验表明:提出的方法比现有方法具有更高的准确性和可理解性,并能够帮助用户监控事件及其演化.
    相关文章 | 计量指标
    13. 深度学习检索框架的前沿探索
    郭嘉丰,范意兴
    计算机研究与发展    2018, 55 (9): 1987-1999.   doi: 10.7544/issn1000-1239.2018.20180133
    摘要1434)   HTML9)    PDF (3042KB)(800)   
    经过几十年的发展,信息检索技术获得了长足的进步和广泛的应用,但当前主流的搜索引擎系统距离真正智能的信息获取系统仍然有较大差距.智能信息获取系统能够对网络大数据的内容进行获取、阅读和理解,对关键语义信息实现存储和检索,并能够依据用户的信息需求进行推理、决策和信息生成.实现这样的系统,迫切需要在检索架构和检索模型上形成根本性的改变和理论突破.近年来,围绕智能信息获取的需求,利用深度学习检索框架展开了系统性研究,在数据表征、数据索引以及检索算法等方向上形成了一系列原创成果,在探索全新的深度学习检索架构上不断迈进.
    相关文章 | 计量指标