国家自然科学基金委员会自2012年设立优秀青年科学基金(“优青基金”)项目以来,至今已资助6批在基础研究方面崭露头角的青年学者自主选题开展创新研究.为了促进计算机科学技术领域的研究、开发、教育和前沿知识的传播,《计算机研究与发展》自2015年以来刊出了“优青专题”系列,通过集中介绍这些优秀青年学者(及其合作者)的研究成果或学术见解,使读者了解这一层次研究人员的研究状况及相关方向的发展趋势.该系列并未专注于某个特定方向的具体研究细节,而是希望为读者们呈现计算机科学技术研究领域较为宽泛的场景.本期是该系列的第4个专题,共收录12篇文章.

基于内容的图像检索是一项有挑战性的计算机视觉任务,其目标是从数据库图像中找到和查询图像包含相同实例的图像.近年来图像检索的研究主要集中在如何利用深度特征.张皓和吴建鑫的文章“基于深度特征的无监督图像检索研究综述”,以图像表示的不同思路为线索, 介绍了无监督图像检索领域的发展概况及一些代表性算法, 比较了这些算法在常用数据集上的性能表现, 探讨了该领域未来的研究方向.

时序数据中的异常检测指的是在时序上去检测分析数据中异常的特征、趋势或模式.韩东明等人的文章“面向时序数据异常检测的可视分析综述”介绍了异常检测技术中的挑战性问题;从异常类型(属性、拓扑和混合)和异常检测方法(直接投影法、聚类方法和机器学习方法)2个角度,对面向时序数据异常检测的可视分析工作进行了分类和总结,并阐述了未来的研究方向.

区块链是一项对诸多技术和行业具有潜在颠覆性影响的新兴技术,催生了大量技术创新,也带来许多新问题;而区块链数据公开的特性,也为研究人员通过分析区块链数据、了解和解决相关问题提供了机会.陈伟利和郑子彬的文章“区块链数据分析:现状、趋势与挑战”,回顾和总结了当前区块链数据分析的成果.文章在介绍区块链技术架构和关键技术的基础上,分析了目前区块链系统中主要的数据类型,总结了目前区块链数据的分析方法,针对实体识别、隐私泄露风险分析、网络画像、网络可视化、市场效应分析、交易模式识别、非法行为检测与分析7个问题,总结了当前区块链数据分析的研究进展.最后,针对目前区块链研究中存在的不足,分析和展望了未来的研究方向以及面临的挑战.

深度神经网络在多个应用领域取得了成功,但巨大的计算开销和内存存储阻碍了其在资源有限环境(如移动或嵌入式设备端)中的广泛使用.近年关于深度神经网络压缩与加速的研究取得了较大进展,纪荣嵘等人的文章“深度神经网络压缩与加速综述”,回顾与总结了深度神经网络压缩与加速方法并分析了各自的技术特性和优缺点,介绍了深度神经网络压缩与加速的评测方法、数据集并分析了一些代表性方法的性能,探讨了如何选择不同的压缩与加速方法并对其未来的发展趋势进行了展望.

时序图在图数据的查询处理与挖掘工作中扮演着重要角色,如何解决时序图上的数据查询处理与挖掘问题受到广泛关注.王一舒等人的文章“大规模时序图数据的查询处理与挖掘技术综述”,总结了时序图上的查询处理与挖掘方法.文章对时序图的应用背景和基本定义及现有时序图模型进行了介绍,从图查询方法、图挖掘方法和管理系统3个方面对相关研究进行了梳理,同时对时序图今后的研究方向进行了展望.

作为大型智库中实现专家发现、学术影响力评估等功能的关键技术,学者画像技术的目标是提取学者各维度的属性信息进行分析和应用,但目前开放互联网中的学者画像技术面临数据量大、数据噪音和数据冗余等问题.袁莎等人的文章“开放互联网中的学者画像技术综述”,概述了学者画像的基础理论(信息抽取方法)及各种可用模型与方法,对实现学者画像的基本任务包括学者信息抽取、研究兴趣挖掘和学术影响力预测进行了阐述,介绍了AMiner系统这一应用实例,对未来的研究发展方向进行了展望.

数据中心网络流调度技术对数据中心网络的性能具有重要影响.胡智尧等人的文章“数据中心网络流调度技术前沿进展”,对流调度面临的挑战进行了分析,介绍了流调度的算法设计及在终端电脑或者网络交换机上的算法实现,从独立数据流调度方法和网络流组的调度方法2方面进行了文献综述,对未来流调度技术的发展方向进行展望并提出了几个值得研究的问题.

使用低差分函数是抵抗差分密码攻击的重要手段.屈龙江等人的文章“有限域上低差分函数研究进展”,总结了近年来在PN函数、APN函数和4差分置换等低差分函数研究方面的主要进展.文章首先介绍了PN函数及伪平面函数的已有构造,APN函数的性质与判定、已有构造及等价性,4差分置换的已有构造及等价性,然后总结了低差分函数在实际密码算法设计中的应用,最后对低差分函数的下一步研究进行了展望.

作为跨媒体表达与交互方向上的热点研究问题,视觉问答旨在让计算机理解图像内容并根据自然语言输入的查询进行自动回答.俞俊等人的文章“视觉问答技术研究”,围绕视觉问答问题,从概念、模型、数据集等方面对近年来的研究进展进行了综述,探讨了现有工作存在的不足,从方法论、应用和平台等方面对视觉问答研究的未来发展方向进行了展望.

发现复杂网络的社区结构,对于理解其功能和动力学特性具有重要价值.标签传播算法作为发现不重叠社区的经典算法,由于其标签更新与传播过程中存在较大的随机性而稳定性较差.郑文萍等人的文章“一种基于标签传播的两阶段社区发现算法”,提出了一种基于标签传播的两阶段社区发现算法LPA-TS,给出了标签传播过程中的节点选择与更新策略,对社区发现过程的随机性进行合理限制,提高了标签传播社区发现算法的稳定性.

社交网络数据包含的非正式词语和碎片化文本使得从中提取描述性的信息具有较大的挑战性.李莹莹等人的文章“一种基于社交事件关联的故事脉络生成方法”,提出一种在社交网络中监控事件并分析相同主题事件演化的方法.该方法首先用结构化的方法从微博中检测事件,然后基于事件的隐式语义信息将其聚类为故事,最后基于图的方法为每个故事生成故事脉络.该方法既可以在粗粒度水平获得事件的概述信息,又可以在细粒度水平获得事件的详细信息.用户体验评估实验表明,该方法比现有方法具有更高的准确性和可理解性,能够帮助用户监控事件及其演化.

智能信息获取系统对网络大数据进行获取、阅读和理解以及对关键语义信息进行存储和检索,实现对用户信息需求的推理、决策和信息生成等功能.检索架构和模型是提升智能信息获取系统性能的关键.郭嘉丰和范意兴的文章“深度学习检索框架的前沿探索”,对基于深度学习检索框架进行智能信息获取的相关研究进行了总结,介绍了数据表征、数据索引以及检索算法等方向上的技术成果.

这些文章中既有对计算机科学技术领域一些重要研究方向和问题的综述与分析,也有作者们最新研究成果的介绍.希望本专题的出版能为相关领域的读者提供有益的参考与帮助.感谢《计算机研究与发展》编辑部提供了宝贵机会,也感谢审稿专家们和编辑们的大力支持.由于编者水平有限,问题在所难免,请读者不吝赐教.

刘 克(国家自然科学基金委员会信息科学部)

刘志勇(中国科学院计算技术研究所)

2018年8月15日