Please wait a minute...
ISSN 1000-1239 CN 11-1777/TP

当期目录

2017年 第54卷 第6期    出版日期:2017-06-01
综述
优青专题前言
刘克,刘志勇
2017, 54(6):  1131-1132. 
摘要 ( 717 )   HTML ( 2)   PDF (1040KB) ( 661 )  
相关文章 | 计量指标
优秀青年科学基金(“优青基金”)是国家自然科学基金委员会2012年起设立的一类人才项目,主要支持在基础研究方面已取得较好成绩的青年学者自主选择研究方向开展创新研究,至今已经资助了5期。为了集中介绍这些优秀青年学者的研究成果,本刊推出了“优青专题”系列,并已于2015年和2016年出版了两个专辑,本期是该系列的第三个专辑,共13篇文章。与前两次专辑一样,本专辑并不专注于介绍计算机科学技术领域某个特定方向的研究和发展状况,而是为优青基金获得者提供展示他们(及其合作者)研究成果、传播相关知识的综合平台,同时可以使得有关读者通过该专辑了解我国这一层次研究人员的研究状况及相关领域发展的趋势。我们希望本系列专辑的出版能为作者、读者提供一个开放的交流平台,促进计算机科学技术领域的研究、开发、教育和前沿知识的传播。
信息处理
搜索引擎用户满意度评估
刘奕群
2017, 54(6):  1133-1143.  doi:10.7544/issn1000-1239.2017.20160804
摘要 ( 798 )   HTML ( 4)   PDF (5359KB) ( 878 )  
相关文章 | 计量指标
用户满意度评估一直是互联网搜索领域的研究热点,并具有3方面的挑战:1)传统的搜索性能评估方法大多基于对检索结果相关性的标注,但大多数基于相关性标注的评价指标并非针对互联网搜索环境而设计,其结果与搜索用户主观满意度之间的关系缺乏相应研究;2)大多数已有的工作都基于搜索结果同质化的假设,但随着搜索引擎的发展,异质化的搜索结果元素开始频繁地出现在搜索结果列表中;3)已有的关于搜索满意度评估的工作主要基于用户的点击和查询修改行为开展,但实际搜索中会有大量的用户会话中缺失此类信息.总结了近期为解决这些研究问题开展的实验研究工作:1)构建了用户行为实验系统,分析了结果相关性与用户所感知到的结果效用和满意度之间的关系;2)基于仔细设计的异质化搜索结果页面,定量地分析了垂直搜索结果的质量、展现形式、位置等因素对用户满意度的影响;3)受现有的采用鼠标移动信息进行搜索结果相关性预测的工作启发,提出了在搜索结果页面上抽取用户鼠标移动行为模式并进行满意度评估的方法.实验结果表明:在真实搜索环境下,所提出的方法优于现有的模型.
综述
神经机器翻译前沿进展
刘洋
2017, 54(6):  1144-1149.  doi:10.7544/issn1000-1239.2017.20160805
摘要 ( 1497 )   HTML ( 19)   PDF (3970KB) ( 1457 )  
相关文章 | 计量指标
机器翻译研究如何利用计算机实现自然语言之间的自动翻译,是人工智能和自然语言处理领域的重要研究方向之一.近年来,基于深度学习的神经机器翻译方法获得迅速发展,目前已取代传统的统计机器翻译成为学术界和工业界新的主流方法.首先介绍神经机器翻译的基本思想和主要方法,然后对最新的前沿进展进行综述,最后对神经机器翻译的未来发展方向进行展望.
情感分类研究进展
陈龙,管子玉,何金红,彭进业
2017, 54(6):  1150-1170.  doi:10.7544/issn1000-1239.2017.20160807
摘要 ( 1468 )   HTML ( 11)   PDF (9364KB) ( 1421 )  
相关文章 | 计量指标
文本情感分析是多媒体智能理解的重要问题之一.情感分类是情感分析领域的核心问题,旨在解决评论情感极性的自动判断问题.由于互联网评论数据规模与日俱增,传统基于词典的方法和基于机器学习的方法已经不能很好地处理海量评论的情感分类问题.随着近年来深度学习技术的快速发展,其在大规模文本数据的智能理解上表现出了独特的优势,越来越多的研究人员青睐于使用深度学习技术来解决文本分类问题.主要分为2个部分:1)归纳总结传统情感分类技术,包括基于字典的方法、基于机器学习的方法、两者混合方法、基于弱标注信息的方法以及基于深度学习的方法;2)针对前人情感分类方法的不足,详细介绍所提出的面向情感分类问题的弱监督深度学习框架.此外,还介绍了评论主题提取相关的经典工作.最后,总结了情感分类问题的难点和挑战,并对未来的研究工作进行了展望.
人工智能
面向标记分布学习的标记增强
耿新,徐宁,邵瑞枫
2017, 54(6):  1171-1184.  doi:10.7544/issn1000-1239.2017.20170002
摘要 ( 1297 )   HTML ( 7)   PDF (4492KB) ( 972 )  
相关文章 | 计量指标
多标记学习(multi-label learning, MLL)任务处理一个示例对应多个标记的情况,其目标是学习一个从示例到相关标记集合的映射.在MLL中,现有方法一般都是采用均匀标记分布假设,也就是各个相关标记(正标记)对于示例的重要程度都被当作是相等的.然而,对于许多真实世界中的学习问题,不同相关标记的重要程度往往是不同的.为此,标记分布学习将不同标记的重要程度用标记分布来刻画,已经取得很好的效果.但是很多数据中却仅包含简单的逻辑标记而非标记分布.为解决这一问题,可以通过挖掘训练样本中蕴含的标记重要性差异信息,将逻辑标记转化为标记分布,进而通过标记分布学习有效地提升预测精度.上述将原始逻辑标记提升为标记分布的过程,定义为面向标记分布学习的标记增强.首次提出了标记增强这一概念,给出了标记增强的形式化定义,总结了现有的可以用于标记增强的算法,并进行了对比实验.实验结果表明:使用标记增强能够挖掘出数据中隐含的标记重要性差异信息,并有效地提升MLL的效果.
基于概率分布的多峰演化算法
陈伟能,杨强
2017, 54(6):  1185-1197.  doi:10.7544/issn1000-1239.2017.20160891
摘要 ( 951 )   HTML ( 2)   PDF (6078KB) ( 1000 )  
相关文章 | 计量指标
演化算法通过模拟自然界生物迭代演化的智能现象来求解优化问题,因其不依赖于待解问题具体数学模型特性的优势,已成为求解复杂优化问题的重要方法.分布估计算法是一类新兴的演化算法,它通过估计种群中优势个体的分布状况建立概率模型并采样得到子代,具有良好的搜索多样性,且能通用于连续和离散空间的优化问题.为进一步推动基于概率分布思想的演化算法发展,概述了多峰优化演化算法的研究现状,并总结出2个基于概率分布的演化算法框架:面向多解优化的概率分布演化算法框架和基于概率分布的集合型离散演化算法框架.前者针对现有的演化算法在求解多峰多解的优化难题时缺乏足够的搜索多样性的缺点,将广义上基于概率分布的演化策略与小生境技术相结合,突破多解优化的搜索多样性瓶颈;后者围绕粒子群优化等部分演化算法在传统上局限于连续实数向量空间的不足,引入概率分布估计的思想,在离散的集合空间重定义了算法的演化操作,从而提高了算法的可用性.
综述
查询结果可用性研究综述
柳晴,高云君
2017, 54(6):  1198-1212.  doi:10.7544/issn1000-1239.2017.20160806
摘要 ( 770 )   HTML ( 0)   PDF (5085KB) ( 946 )  
相关文章 | 计量指标
数据库可用性研究在数据库领域受到了广泛的关注.其目标在于帮助用户更加高效、方便地使用数据库,从而提高用户对数据库的满意度.主要关注查询结果可用性研究.当前的数据库查询仅仅向用户返回查询结果.如果查询结果不是用户想要的,现有的数据库系统既不能向用户解释为什么会得到这样的结果,也无法给出有效的建议以帮助用户得到满意的查询结果.查询结果可用性研究正是针对当前数据库系统的这一不足而展开.在数据库可用性的视角之上,以查询结果为中心,对当前查询结果可用性工作的最新动态进行了综述.梳理了当前查询结果可用性相关研究中问题的类型及其特点,并从Causality & Responsibility问题、Why-not & Why问题、Why-few & Why-many问题这3个方面对该领域的研究工作现状进行了分类、介绍和总结.最后对该研究领域未来可能的研究方向进行了展望,为相关研究提供参考.
分布式RDF数据管理综述
邹磊,彭鹏
2017, 54(6):  1213-1224.  doi:10.7544/issn1000-1239.2017.20160908
摘要 ( 1095 )   HTML ( 0)   PDF (5363KB) ( 954 )  
相关文章 | 计量指标
资源描述框架(resource description framework, RDF)作为一个展示、共享和连接网络上的数据的模型,已经被广泛地用在各种应用中.同时,SPARQL(simple protocol and RDF query language)作为一种结构化查询语言则被用来支持对RDF数据进行查询检索.随着RDF数据规模的日益增长,在现有RDF数据库上进行SPARQL查询处理已经超出了单机的处理能力.于是,人们需要设计出高性能的分布式RDF数据库以支持对SPARQL查询进行高效的处理.当前,已经有大量的工作来讨论如何搭建分布式RDF数据管理系统.对这些不同的分布式RDF数据管理方法进行综述,将现有的分布式RDF数据管理方法分成3类:基于云计算平台的分布式RDF数据管理方法、基于数据划分的分布式RDF数据管理方法和联邦式系统.基于云计算平台的分布式RDF数据管理方法利用已有云平台进行RDF数据的管理;基于数据划分的分布式RDF数据管理方法首先将RDF数据图划分成若干子图,然后将这些子图分配到不同计算节点上;联邦式系统的特点是数据已经分布在不同节点上,数据管理系统无法控制数据的分布.在每类分布式RDF数据管理方法的介绍中,将深入讨论以帮助读者了解各种方法的特点.
高通量图像视频计算
唐金辉,李泽超,刘少礼,秦磊
2017, 54(6):  1225-1237.  doi:10.7544/issn1000-1239.2017.20170001
摘要 ( 898 )   HTML ( 3)   PDF (3639KB) ( 676 )  
相关文章 | 计量指标
互联网上的图像和视频数据正在飞速地产生和传播.这些数据不仅规模庞大,还具有高并发、高维度、大流量的显著特性,导致了目前对它们的实时分析和处理面临着巨大的挑战.这就需要开展高通量图像视频计算方面的研究,需要结合新型硬件结构,利用其体系结构优势,提出一系列实用的高通量图像视频计算理论与方法,提升数据中心的图像视频数据处理效率.为此,在详细地分析了现有的高通量图像视频计算相关方法与技术的基础上,探讨了现有高通量图像视频计算方法研究的不足;进一步地,分析了高通量图像视频计算的3个未来研究方向:高通量图像视频计算理论、高通量图像视频分析方法及高通量视频编码方法.最后,总结了高通量图像视频计算需要解决的3个关键科学问题.这些问题的解决将为互联网图像视频内容监管、大规模视频监控、图像视频搜索等重要应用提供关键技术支持.
视频拷贝检测方法综述
顾佳伟,赵瑞玮,姜育刚
2017, 54(6):  1238-1250.  doi:10.7544/issn1000-1239.2017.20170003
摘要 ( 1053 )   HTML ( 1)   PDF (5737KB) ( 935 )  
相关文章 | 计量指标
目前网络上存在着大量的拷贝视频,研究人员长期以来致力于视频拷贝检测技术的研究,特别是近年来随着深度学习方法的引入,又涌现出了一些新颖的检测算法.将对现有代表性的视频拷贝检测方法进行回顾与总结,涵盖视频拷贝检测系统的基本框架与各个主要步骤的不同实现方法,包含视频拷贝检测中的特征提取、建立索引、特征匹配与时间对齐等不同模块.总结的关键技术包括了最新的深度学习方法在其中的应用与取得的突破,主要体现在深度卷积神经网络和双胞胎卷积神经网络方法的应用.此外,还将详细介绍目前常用的5个用于视频拷贝检测评测的数据集及通用的评价标准,并讨论分析一些代表性方法的性能表现.最后,对视频拷贝检测技术未来发展趋势进行展望.
人工智能
融合语义知识的深度表达学习及在视觉理解中的应用
张瑞茂,彭杰锋,吴恙,林倞
2017, 54(6):  1251-1266.  doi:10.7544/issn1000-1239.2017.20171064
摘要 ( 1290 )   HTML ( 5)   PDF (12595KB) ( 1265 )  
相关文章 | 计量指标
近几年来,随着深度学习技术的日趋完善,传统的计算机视觉任务得到了前所未有的发展.如何将传统视觉研究中的领域知识融入到深度模型中提升深度模型的视觉表达能力,从而应对更为复杂的视觉任务,成为了学术界广泛关注的问题.鉴于此,以融合了语义知识的深度表达学习为主线展开了一系列研究.取得的主要创新成果包括3个方面:1)研究了将单类型的语义信息(类别相似性)融入到深度特征的学习中,提出了嵌入正则化语义关联的深度Hash学习方法,并将其应用于图像的相似性比对与检索问题中,取得了较大的性能提升;2)研究了将多类型信息(多重上下文信息)融入到深度特征的学习中,提出了基于长短期记忆神经网络的场景上下文学习方法,并将其应用于复杂场景的几何属性分析问题中;3)研究了将视觉数据的结构化语义配置融入到深度表达的学习中,提出了融合语法知识的表达学习方法,并将其应用到复杂场景下的通用内容解析问题中.相关的实验结果表明:该方法能有效地对场景的结构化配置进行预测.
综述
多媒体信息检索中的查询与反馈技术
查正军,郑晓菊
2017, 54(6):  1267-1280.  doi:10.7544/issn1000-1239.2017.20170004
摘要 ( 800 )   HTML ( 1)   PDF (6830KB) ( 765 )  
相关文章 | 计量指标
历经几十年的发展,多媒体检索取得了长足的进步,然而检索性能的提升依然受到“意图鸿沟”与“语义鸿沟”的制约.针对此问题,学术界提出了一系列查询技术帮助用户清楚地表达检索意图以及反馈技术帮助系统准确地理解用户意图与媒体数据,有效提升了检索性能.对多媒体检索中的查询与反馈技术进行了分析与讨论.分析了查询方式的演变与反馈技术的发展,综述了面向PC机、移动智能终端、触屏设备的查询技术,介绍了不同时期的反馈技术,探讨了探索式搜索中的交互问题,最后分析了该领域的未来研究趋势.
动态蛋白质网络的构建、分析及应用研究进展
李敏,孟祥茂
2017, 54(6):  1281-1299.  doi:10.7544/issn1000-1239.2017.20160902
摘要 ( 963 )   HTML ( 1)   PDF (7481KB) ( 764 )  
相关文章 | 计量指标
蛋白质组学的快速发展,特别是高通量技术的发展产生了大量的蛋白质相互作用数据,为人们从更深层次理解蛋白质之间的相互作用及其在复杂疾病的作用机理提供了基础.一个生物体内所有的蛋白质与蛋白质之间的相互作用组成的网络称为蛋白质网络.传统的研究多是基于静态的蛋白质网络模型.然而,由于蛋白质自身表达的动态性及蛋白质间相互作用的动态性,真实的蛋白质网络会随着时间和条件不断变化,与疾病的发生和发展有关的蛋白质功能模块也与这种动态变化密切相关.因此,研究者已经把注意力从关注蛋白质网络的静态属性转移到动态属性上,提出了一系列的动态蛋白质网络的构建方法.在介绍静态蛋白质网络的基础上,分类讨论了动态蛋白质网络的构建方法,将现有的动态蛋白质网络的构建方法归纳为基于蛋白质表达动态性的方法、基于多状态下表达及相关性变化的方法和基于时空动态变化的方法这3类:第1类体现的是蛋白质自身表达随时间演化的动态性,第2类则表现为不同条件下蛋白质之间表达相关性的改变,第3类则体现了蛋白质及蛋白质相互作用在时间和空间上的动态变化.然后,对动态蛋白质网络的蛋白质节点和相关子网络进行了动态分析并详细介绍了动态蛋白质网络在复杂疾病中的一些主流应用,如蛋白质复合物识别、蛋白质功能预测、生物标志物识别、疾病基因预测等.最后,对动态蛋白质网络所面临的挑战与未来的研究方向进行了探讨.
网络技术
基于多核平台的高速网络流量实时捕获方法
令瑞林,李峻峰,李丹
2017, 54(6):  1300-1313.  doi:10.7544/issn1000-1239.2017.20160823
摘要 ( 700 )   HTML ( 3)   PDF (9190KB) ( 890 )  
相关文章 | 计量指标
随着互联网上应用的丰富和网络带宽的增长,带来的安全问题也与日剧增,除了传统的垃圾邮件、病毒传播、DDoS攻击外,还出现了新型的隐蔽性强的攻击方式.网络探针工具是一种部署在局域网出口处的旁路设备,能够收集当前进出网关的全部流量并进行分析,而网络探针工具中最重要的模块就是数据包的捕获.传统的Linux网络协议栈在捕获数据包时有诸多性能瓶颈,无法满足高速网络环境的要求.介绍了基于零拷贝、多核并行化等技术的多种新型的数据包捕获引擎,并基于Intel DPDK平台设计并实现了一个可扩展的数据包捕获系统,它能够利用接收端扩展(receiver-side scaling, RSS)技术实现多核并行化的数据包捕获、模块化的上层处理流程.除此之外,还讨论了更有效、更公平的将数据包分发到不同的接收队列所应使用的Hash函数.经过初步的实验验证,该系统能够实现接近线速的收包并且多个CPU核心间实现负载均衡.
综述
计算机体系结构前言技术(一)专题前言
刘志勇,窦勇,李华伟
2017, 54(6):  1314-1315. 
摘要 ( 1059 )   HTML ( 5)   PDF (961KB) ( 787 )  
相关文章 | 计量指标
随着物联网、大数据应用和智能计算应用的发展,当前计算机的处理、通信和存储能力已经无法匹配海量数据和信息处理复杂性的快速增长,针对应用需求的硬件加速得到蓬勃发展。另一方面,随着器件特征尺寸缩小到其物理极限,电路性能对参数偏差和噪声更加敏感,计算机的能效提升遇到瓶颈,这些问题促进了异构、三维集成、非易失性存储器等新型结构、工艺和器件的大量探索。计算机体系结构技术研究面临许多新的机遇和挑战。面向上述背景,本刊拟开辟“计算机体系结构前沿技术”系列专题,并于今年出版“计算机体系结构前沿技术(一)”专辑。本专辑出版8篇文章,集中讨论面向不同应用背景的智能和近似计算的计算机体系结构技术,以及基于新型工艺和器件的存储器和处理器技术。
系统结构
GPU加速与L-ORB特征提取的全景视频实时拼接
杜承垚,袁景凌,陈旻骋,李涛
2017, 54(6):  1316-1325.  doi:10.7544/issn1000-1239.2017.20170095
摘要 ( 3003 )   HTML ( 9)   PDF (8791KB) ( 1489 )  
相关文章 | 计量指标
全景视频是在同一视点拍摄记录全方位场景的视频.随着虚拟现实(VR)技术和视频直播技术的发展,全景视频的采集设备受到广泛关注.然而制作全景视频要求CPU和GPU都具有很强的处理能力,传统的全景产品往往依赖于庞大的设备和后期处理,导致高功耗、低稳定性、没有实时性且不利于信息安全.为了解决这些问题,首先提出了L-ORB特征点提取算法,该算法优化了分割视频图像的特征检测区域以及简化ORB算法对尺度和旋转不变性的支持;然后利用局部敏感Hash(Multi-Probe LSH)算法对特征点进行匹配,用改进的样本一致性(progressive sample consensus, PROSAC)算法消除误匹配,得到帧图像拼接映射关系,并采用多频带融合算法消除视频间的接缝.此外,使用整合了ARM A57 CPU和Maxwell GPU的Nvidia Jetson TX1异构嵌入式系统,利用其Teraflops的浮点计算能力和内建的视频采集、存储、无线传输模块,实现了多摄像头视频信息的实时全景拼接系统,有效地利用GPU指令的块、线程、流并行策略对图像拼接算法进行加速.实验结果表明,算法在图像拼接的特征提取、特征匹配等各个阶段均有很好的性能提升,其算法速度是传统ORB算法的11倍、传统SIFT算法的639倍;系统较传统的嵌入式系统性能提升了29倍,但其功耗低至10W.
一种基于裸闪存的Key-Value数据库优化方法
秦雄军,张佳程,陆游游,舒继武
2017, 54(6):  1326-1336.  doi:10.7544/issn1000-1239.2017.20170092
摘要 ( 885 )   HTML ( 4)   PDF (5767KB) ( 730 )  
相关文章 | 计量指标
近年来,非关系型的key-value数据库得到越来越广泛的应用.然而,目前主流的key-value数据库或者是基于磁盘设计的,或者是传统的基于文件系统和闪存转换层FTL来构建的,难以发挥闪存存储设备的特性,限制了I/O的并发性能,且垃圾回收过程复杂.设计并实现了一种基于裸闪存的key-value数据管理架构Flashkv,通过用户态下的管理单元进行空间管理和垃圾回收,充分利用了闪存设备内部的并发特性,并简化了垃圾回收过程,去除了传统文件系统和FTL中的冗余功能,缩短了I/O路径.提出了基于闪存特点的I/O调度技术,优化了闪存的读写延迟,提高了吞吐率;提出了用户态缓存管理技术,降低了数据写入量和频繁系统调用所带来的开销.测试结果表明,Flashkv性能是levelDB的1.9~2.2倍,写入量减少60%~65%.
机器学习算法可近似性的量化评估分析
江树浩,鄢贵海,李家军,卢文岩,李晓维
2017, 54(6):  1337-1347.  doi:10.7544/issn1000-1239.2017.20170086
摘要 ( 1139 )   HTML ( 3)   PDF (5472KB) ( 1040 )  
相关文章 | 计量指标
近年来,以神经网络为代表的机器学习算法发展迅速并被广泛应用在图像识别、数据搜索乃至金融趋势分析等领域.而随着问题规模的扩大和数据维度的增长,算法能耗问题日益突出,由于机器学习算法自身拥有的近似特性,近似计算这种牺牲结果的少量精确度降低能耗的技术,被许多研究者用来解决学习算法的能耗问题.我们发现,目前的工作大多专注于利用特定算法的近似特性而忽视了不同算法近似特性的差别对能耗优化带来的影响,而为了分类任务使用近似计算时能够做出能耗最优的选择,了解算法“可近似性”上的差异对近似计算优化能耗至关重要.因此,选取了支持向量机(SVM)、随机森林(RF)和神经网络(NN) 3类常用的监督型机器学习算法,评估了针对不同类型能耗时不同算法的可近似性,并建立了存储污染敏感度、访存污染敏感度和能耗差异度等指标来表征算法可近似性的差距,评估得到的结论将有助于机器学习算法在使用近似计算技术时达到最优化能耗的目的.
深度卷积神经网络的数据表示方法分析与实践
王佩琪,高原,刘振宇,王海霞,汪东升
2017, 54(6):  1348-1356.  doi:10.7544/issn1000-1239.2017.20170098
摘要 ( 996 )   HTML ( 1)   PDF (4457KB) ( 1087 )  
相关文章 | 计量指标
深度卷积神经网络在多个领域展现了不凡的性能,并被广泛应用.随着网络深度的增加和网络结构不断复杂化,计算资源和存储资源的需求也在不断攀升.专用硬件可以很好地解决对计算和存储的双重需求,在低功耗同时满足较高的计算性能,从而应用在一些无法使用通用CPU和GPU的场景中.在专用硬件设计过程中仍存在着很多亟待解决的问题,例如选择何种数据表示方法、如何平衡数据表示精度与硬件实现代价等.为解决上述问题,针对定点数和浮点数建立误差分析模型,从理论角度分析如何选择表示精度及选择结果对网络准确率的影响,并通过实验探究不同数据表示方法对硬件实现代价的影响.通过理论分析和实验验证可知,在一般情况下,满足同等精度要求时浮点表示方法在硬件实现开销上占有一定优势.除此之外,还根据浮点表示特征对神经网络中卷积操作进行了硬件实现,与定点数相比在功耗和面积上分别降低92.9%和77.2%.
采用流水化伪随机编码算法的相变存储器寿命延长方法
高鹏,汪东升,王海霞
2017, 54(6):  1357-1366.  doi:10.7544/issn1000-1239.2017.20170065
摘要 ( 639 )   HTML ( 1)   PDF (8297KB) ( 649 )  
相关文章 | 计量指标
相变存储器(phase change memory, PCM)是一种颇具前景的新型存储器件,具有非易失性、静态功耗低和存储密度高的优点.然而,该类器件的低写入寿命是其在实用化中亟待克服的关键问题之一.一般来说,通过每次写入时仅写入相异位的策略,可以减少产生的平均写入量,从而延长PCM的写入寿命.然而,应用这一差异式的写入策略通常又会以降低读写速度为代价.为此,提出了一种兼具高效和快速特点的写入量减少方法FEBRE(a fast and efficient bit-flipping reduction technique to extend PCM lifetime).该方法在差分写入阶段前,设计并使用了一种快速的一对多映射,将待写入的数据并行映射为多个编码向量,从而增加了从其中找到一个与已有数据最近的向量的可能性.此外,还提出了一种流水化的伪随机编码算法,用以加速一对多映射中的编码过程,从而降低写入开销.实验表明,与目前领先的PRES(pseudo-random encoding scheme)方法相比,FEBRE方法在写入操作中,平均减少了5%以上的写入量,提升了2倍以上的编码速度;在读取操作中,减少了45%以上的解码操作次数.
基于忆阻器的PIM结构实现深度卷积神经网络近似计算
李楚曦,樊晓桠,赵昌和,张盛兵,王党辉,安建峰,张萌
2017, 54(6):  1367-1380.  doi:10.7544/issn1000-1239.2017.20170099
摘要 ( 995 )   HTML ( 5)   PDF (8816KB) ( 916 )  
相关文章 | 计量指标
忆阻器(memristor)能够将存储和计算的特性融合,可用于构建存储计算一体化的PIM(processing-in-memory)结构.但是,由于计算阵列以及结构映射方法的限制,基于忆阻器阵列的深度神经网络计算需要频繁的AD/DA转换以及大量的中间存储,导致了显著的能量和面积开销.提出了一种新型的基于忆阻器的深度卷积神经网络近似计算PIM结构,利用模拟忆阻器大大增加数据密度,并将卷积过程分解到不同形式的忆阻器阵列中分别计算,增加了数据并行性,减少了数据转换次数并消除了中间存储,从而实现了加速和节能.针对该结构中可能存在的精度损失,给出了相应的优化策略.对不同规模和深度的神经网络计算进行仿真实验评估,结果表明,在相同计算精度下,该结构可以最多降低90%以上的能耗,同时计算性能提升约90%.
面向固态硬盘的Spark数据持久化方法设计
陆克中,朱金彬,李正民,隋秀峰
2017, 54(6):  1381-1390.  doi:10.7544/issn1000-1239.2017.20170108
摘要 ( 1136 )   HTML ( 7)   PDF (5951KB) ( 908 )  
相关文章 | 计量指标
基于固态硬盘(solid-state drive, SSD)和硬盘(hard disk drive, HDD)混合存储的数据中心已经成为大数据计算领域的高性能载体,数据中心负载应该可将不同特性的数据按需持久化到SSD或HDD,以提升系统整体性能.Spark是目前产业界广泛使用的高效大数据计算框架,尤其适用于多次迭代计算的应用领域,其原因在于Spark可以将中间数据持久化在内存或硬盘中,且持久化数据到硬盘打破了内存容量不足对数据集规模的限制.然而,当前的Spark实现并未专门提供显式的面向SSD的持久化接口,尽管可根据配置信息将数据按比例分布到不同的存储介质中,但是用户无法根据数据特征按需指定RDD的持久化存储介质,针对性和灵活性不足.这不仅成为进一步提升Spark性能的瓶颈,而且严重影响了混合存储系统性能的发挥.有鉴于此,首次提出面向SSD的数据持久化策略.探索了Spark数据持久化原理,基于混合存储系统优化了Spark的持久化架构,最终通过提供特定的持久化API实现用户可显式、灵活指定RDD的持久化介质.基于SparkBench的实验结果表明,经本方案优化后的Spark与原生版本相比,其性能平均提升14.02%.
三值光学处理器的MSD数据正/负值判断器设计与实现
张宏烈,周健,张素兰,刘艳菊,王先超
2017, 54(6):  1391-1404.  doi:10.7544/issn1000-1239.2017.20170093
摘要 ( 568 )   HTML ( 0)   PDF (7239KB) ( 679 )  
相关文章 | 计量指标
数值正/负或零判断器是计算机比较数据大小的必备器件,随着三值光学处理器中采用三态光信号表示信息的MSD(modified signed-digit)数并行加法器的出现,研究三态光信号所表达数值的正/负或零值判断器成为完善三值光学处理器的重要一环.根据MSD数的特点,通过对三态光信号的变化规律与MSD数据的对应关系的研究,提出了从一组三态光信号来判断其表达的多位MSD数据正/负特性或零值的方法.将这一方法用于2个不定长MSD数据的差运算结果,实现了判别2个MSD数据的大小或相等.依据上述理论,建立了以偏振片、液晶和半反半透镜为主要器件构造的MSD数据判断器结构,加以FPGA作为控制电路,实现了光电混合模式的3位MSD数据判断器.通过实验证明了该判断器的有效性,进而证明了其基本理论的正确性和结构设计的可行性.