ISSN 1000-1239 CN 11-1777/TP

推荐文章

    Please wait a minute...
    选择: 显示/隐藏图片
    1. 基于区块链的数据透明化:问题与挑战
    孟小峰, 刘立新
    计算机研究与发展    2021, 58 (2): 237-252.   doi: 10.7544/issn1000-1239.2021.20200017
    摘要239)      PDF (1812KB)(334)   
    物联网、穿戴设备和移动通信等技术的高速发展促使数据源源不断地产生并汇聚至多方数据收集者,由此带来更严峻的隐私泄露问题, 然而传统的差分隐私、加密和匿名等隐私保护技术还不足以应对.更进一步,数据的自主汇聚导致数据垄断问题,严重影响了大数据价值实现.此外,大数据决策过程中,数据非真实产生、被篡改和质量管理过程中的单点失败等问题导致数据决策不可信.如何使这些问题得到有效治理,使数据被正确和规范地使用是大数据发展面临的主要挑战.首先,提出数据透明化的概念和研究框架,旨在增加大数据价值实现过程的透明性,从而为上述问题提供解决方案.然后,指出数据透明化的实现需求与区块链的特性天然契合,并对目前基于区块链的数据透明化研究现状进行总结.最后,对基于区块链的数据透明化可能面临的挑战进行分析.
    相关文章 | 计量指标
    2. 面向深度学习的公平性研究综述
    陈晋音, 陈奕芃, 陈一鸣, 郑海斌, 纪守领, 时杰, 程瑶
    计算机研究与发展    2021, 58 (2): 264-280.   doi: 10.7544/issn1000-1239.2021.20200758
    摘要175)      PDF (1752KB)(170)   
    深度学习是机器学习研究中的一个重要领域,它具有强大的特征提取能力,且在许多应用中表现出先进的性能,因此在工业界中被广泛应用.然而,由于训练数据标注和模型设计存在偏见,现有的研究表明深度学习在某些应用中可能会强化人类的偏见和歧视,导致决策过程中的不公平现象产生,从而对个人和社会产生潜在的负面影响.为提高深度学习的应用可靠性、推动其在公平领域的发展,针对已有的研究工作,从数据和模型2方面出发,综述了深度学习应用中的偏见来源、针对不同类型偏见的去偏方法、评估去偏效果的公平性评价指标、以及目前主流的去偏平台,最后总结现有公平性研究领域存在的开放问题以及未来的发展趋势.
    相关文章 | 计量指标
    3. 自动文本摘要研究综述
    李金鹏, 张闯, 陈小军, 胡玥, 廖鹏程
    计算机研究与发展    2021, 58 (1): 1-21.   doi: 10.7544/issn1000-1239.2021.20190785
    摘要630)      PDF (1756KB)(784)   
    近年来,互联网技术的蓬勃发展极大地便利了人类的日常生活,不可避免的是互联网中的信息呈井喷式爆发,如何从中快速有效地获取所需信息显得极为重要.自动文本摘要技术的出现可以有效缓解该问题,其作为自然语言处理和人工智能领域的重要研究内容之一,利用计算机自动地从长文本或文本集合中提炼出一段能准确反映源文中心内容的简洁连贯的短文.探讨自动文本摘要任务的内涵,回顾和分析了自动文本摘要技术的发展,针对目前主要的2种摘要产生形式(抽取式和生成式)的具体工作进行了详细介绍,包括特征评分、分类算法、线性规划、次模函数、图排序、序列标注、启发式算法、深度学习等算法.并对自动文本摘要常用的数据集以及评价指标进行了分析,最后对其面临的挑战和未来的研究趋势、应用等进行了预测.
    相关文章 | 计量指标
    4. 深度神经架构搜索综述
    孟子尧, 谷雪, 梁艳春, 许东, 吴春国
    计算机研究与发展    2021, 58 (1): 22-33.   doi: 10.7544/issn1000-1239.2021.20190851
    摘要512)      PDF (1178KB)(645)   
    深度学习在图像、语音、文本等多种模态的数据任务上取得了优异的效果.然而,针对特定任务,人工设计网络需要花费大量的时间,并且需要设计者具有一定水平的专业知识和设计经验.面对如今日趋复杂的网络架构,仅依靠人工进行设计变得越来越复杂.基于此,借助算法自动地对神经网络进行架构的搜索成为了研究热点.神经架构搜索的方法涉及3个方面:搜索空间、搜索策略、性能评估策略.通过搜索策略在搜索空间中选择一个网络架构,借助性能评估策略对该网络架构进行评估,并将结果反馈给搜索策略指导搜索策略选择更好的网络架构,通过不断迭代得到最优的网络架构.为了更好地为读者提供一个快速了解神经网络架构搜索方法的导航地图,从搜索空间、搜索策略和性能评估策略3个方面对现有典型的神经架构搜索方法进行了梳理,总结讨论了近年来常见的架构搜索方法,并分析了各种方法的优势和不足.
    相关文章 | 计量指标
    5. 命名数据网络中的视频传输研究综述
    胡晓艳, 童钟奇, 徐恪, 张国强, 郑少琦, 赵丽侠, 程光, 龚俭
    计算机研究与发展    2021, 58 (1): 116-136.   doi: 10.7544/issn1000-1239.2021.20190697
    摘要118)      PDF (1263KB)(75)   
    互联网目前已经发展为一个由实时视频和视频点播等内容分发服务主导的网络.传统IP网络对于视频分发类任务的支持存在组播的部署复杂且开销大,不能有效利用多路径获取内容、对移动性的支持差和难以同时满足可靠性以及低延时需求等问题.命名数据网络(named data networking, NDN)作为新型的下一代互联网体系结构,支持网络内缓存和多路径传输,而且由消费者驱动的传输模式使其天然地支持消费者端移动性.以上特点使NDN具有高效传输视频内容的潜力.首先介绍了视频传输和NDN的基础背景,然后阐述了一些利用NDN中优势实现视频传输的设计方案.通过对已有方案的总结与比较,最后指出了在NDN中传输视频所面临的挑战.
    相关文章 | 计量指标
    6. 网络功能虚拟化下服务功能链的资源管理研究综述
    祖家琛, 胡谷雨, 严佳洁, 李实吉
    计算机研究与发展    2021, 58 (1): 137-152.   doi: 10.7544/issn1000-1239.2021.20190823
    摘要168)      PDF (2139KB)(219)   
    伴随着云计算,软件定义网络和网络功能虚拟化等网络新技术的出现,未来网络运维向着虚拟化、智能化的方向不断迈进.网络功能虚拟化提供了一种服务节点虚拟化的方法,它采用通用服务器替代传统网络中的专用中间件,可以大大降低网络运营商的建设和运营成本,提升网络管理的灵活性和可扩展性.由于网络端到端服务通常需要不同的服务功能,采用虚拟化技术构建网络服务功能链,进行资源的合理分配和调度成为一个重要的研究课题,引起了学术界和工业界的广泛关注.从网络功能虚拟化的技术背景出发,介绍了网络功能虚拟化下服务功能链资源管理的基础架构、技术基础和应用场景.而后基于服务功能链编排的不同阶段,将现有理论研究划分为4个部分:组链、部署、调度和按需缩放分别展开论述,从问题出发介绍和分析了研究现状.最后,针对现有存在问题,提出了一些拟解决方案,并对未来的研究方向进行了展望.
    相关文章 | 计量指标
    7. 教育大数据中认知跟踪模型研究进展
    胡学钢, 刘菲, 卜晨阳
    计算机研究与发展    2020, 57 (12): 2523-2546.   doi: 10.7544/issn1000-1239.2020.20190767
    摘要692)   HTML6)    PDF (2358KB)(526)   
    教育信息化的不断推进和在线教育的蓬勃发展产生了海量的教育数据,如何挖掘和分析教育大数据成为了教育领域和大数据知识工程领域亟待解决的问题.认知跟踪模型通过获取学生作答习题的得分表现,追踪学生随时间变化的认知状态,从而预测学生在未来时间的作答表现.对教育大数据中认知跟踪模型进行了回顾、分析和展望.首先从模型的原理、步骤和方法等维度详细介绍了认知跟踪模型,包括基于贝叶斯方法和深度学习方法2类认知跟踪模型.同时,从学生作答表现预测、认知状态评估、心理因素分析、习题序列分析和编程练习5个方面阐述认知跟踪模型的应用情景.最后,以经典的贝叶斯认知跟踪模型和深度认知跟踪模型为例分析了2类模型的优缺点,并探讨和展望认知跟踪模型未来可能的研究方向.
    相关文章 | 计量指标
    8. 自动图像标注技术综述
    马艳春, 刘永坚, 解庆, 熊盛武, 唐伶俐
    计算机研究与发展    2020, 57 (11): 2348-2374.   doi: 10.7544/issn1000-1239.2020.20190793
    摘要659)   HTML15)    PDF (1358KB)(492)   
    图像自动标注技术是减少图像数据与内容之间“语义鸿沟”的其中一种最有效途径,对于帮助人类理解图像内容,从海量图像数据中检索感兴趣的信息具有重要现实意义.通过研究近20年公开发表的图像标注文献,总结了图像标注模型的一般性框架;并通过该框架结合各种具体工作,分析出在图像标注研究过程中需要解决的一般性问题;将各种图像标注模型所采用的主要方法归为9种类型,分别为相关模型、隐Markov模型、主题模型、矩阵分解模型、近邻模型、基于支持向量机的模型、图模型、典型相关分析模型以及深度学习模型,并对每种类型的图像标注模型,按照“基本原理介绍—具体模型差异—模型总结”3个层面进行了研究与分析.此外,总结了图像标注模型常用的一些数据集、评测指标,对一些比较著名的标注模型的性能进行了比较,并据此对各种类型的标注模型做了优缺点分析.最后,提出了图像标注领域一些开放式问题和研究方向.
    相关文章 | 计量指标
    9. 几何展开与折叠算法及应用综述
    孙晓鹏, 刘诗涵, 王振燕, 李娇娇
    计算机研究与发展    2020, 57 (11): 2389-2403.   doi: 10.7544/issn1000-1239.2020.20200126
    摘要214)   HTML7)    PDF (1589KB)(219)   
    展开与折叠是计算机图形学中的重要研究问题,已经广泛应用于工业制造、建筑设计、医学治疗和航空航天等方面.通过回顾近年来图形学中展开与折叠方面的主要研究问题,总结整理它们的典型算法.首先介绍展开与折叠的基本概念,并从机器人设计、计算机动画、深度学习和其他4个领域介绍它们的应用情况.之后,按照展开程度分类,从完全展开和近似展开2方面总结展开问题的研究进展和典型算法思想;按照折叠形式不同,将折叠问题分为Origami折叠和Kirigami折叠2类,分别论述其研究进展并总结算法思路.之后,整理展开与折叠的评价指标,总结各类展开与折叠算法的特点,并分析比较它们的优势与不足.最后,总结并提出展开与折叠的4个发展趋势.
    相关文章 | 计量指标
    10. 纠删码存储系统数据更新方法研究综述
    张耀, 储佳佳, 翁楚良
    计算机研究与发展    2020, 57 (11): 2419-2431.   doi: 10.7544/issn1000-1239.2020.20190675
    摘要200)   HTML7)    PDF (1644KB)(130)   
    在分布式存储系统中,节点故障已成为一种常态,为了保证数据的高可用性,系统通常采用数据冗余的方式.目前主要有2种冗余机制:一种是多副本,另一种是纠删码.伴随着数据量的与日俱增,多副本机制带来的效益越来越低,人们逐渐将目光转向存储效率更高的纠删码.但是纠删码本身的复杂规则导致使用纠删码的分布式存储系统的读、写、更新操作的开销相比于多副本较大.所以纠删码通常被用于冷数据或者温数据的存储,热数据这种需要频繁访问更新的场景仍然用多副本机制存储.专注于纠删码存储系统内的数据更新,从硬盘I/O、网络传输、系统优化3方面综述了目前纠删码更新相关的优化工作,对目前具有代表性的编码方案的更新性能做了对比分析,最后展望了未来研究趋势.通过分析发现目前的纠删码更新方案仍然无法获得和多副本相近的更新性能.如何在纠删码更新规则和系统架构角度优化纠删码存储系统,使其能够替换掉热数据场景下的多副本机制,降低热数据存储开销仍是未来值得深入研究的问题.
    相关文章 | 计量指标
    11. 量子计算与量子密码的原理及研究进展综述
    王永利, 徐秋亮
    计算机研究与发展    2020, 57 (10): 2015-2026.   doi: 10.7544/issn1000-1239.2020.20200615
    摘要1286)   HTML23)    PDF (967KB)(1283)   
    量子计算与量子密码是基于量子效应的计算技术和密码技术.1984年Bennett和Brassard提出了第一个量子密钥分发协议,开启了量子密码学的研究,此后相继在量子加密、量子签名等领域进行了大量研究.1994年,Shor利用量子Fourier变换,设计了第一个实用的量子算法,在多项式时间内对大整数进行因子分解.1996年,Grover提出了量子搜索算法,能够对无结构数据进行二次加速.Shor算法和Grover算法的提出不仅体现了量子计算的优越性,还对传统基于数学困难问题的密码学体制造成威胁.经过半个世纪的发展,量子计算与量子密码在理论与实践的研究上都取得了丰硕的成果.从量子力学的数学框架、基本概念和原理、量子计算基本思想、量子密码研究进展及主要思想等方面进行总结梳理.
    相关文章 | 计量指标
    12. 边缘计算隐私保护研究进展
    周俊, 沈华杰, 林中允, 曹珍富, 董晓蕾
    计算机研究与发展    2020, 57 (10): 2027-2051.   doi: 10.7544/issn1000-1239.2020.20200614
    摘要893)   HTML9)    PDF (3203KB)(742)   
    移动通信与大数据理论的广泛应用使得外包系统蓬勃发展,资源受限的本地用户将大批量的数据文件和开销巨大的计算任务外包给云服务器完成.然而,为了解决单一的云服务器容易成为敌手俘获攻击的目标导致单点失败,且在基于多输入输出的多用户、多任务场景中由于远离用户端易造成反馈延迟较大而成为外包系统瓶颈的问题,边缘计算应运而生.在边缘计算中,多个位于云服务器与用户端之间的边缘节点相互合作完成外包存储与外包计算任务,很大程度上解决了外包系统的实时性问题;但同时也带来了巨大的安全与隐私保护挑战.首先给出了边缘计算特有的网络模型与安全模型,并在此基础上从边缘计算的隐私保护数据聚合、隐私保护外包计算和包括隐私保护集合运算、隐私保护机器学习、隐私保护图像处理、隐私保护生物认证、隐私保护的密文搜索等面向应用的安全计算问题3方面出发,基于数据扰动、全同态加密、安全多方计算、全同态数据封装机制和可验证与可审计等密码技术,对边缘计算隐私保护领域的国内外最新研究成果进行了系统的阐述、总结与科学归类.最后,探讨了边缘计算隐私保护当前面临的挑战、未来潜在的研究方向及其解决思路,以期进一步推动边缘计算隐私保护研究的发展与应用.
    相关文章 | 计量指标
    13. 网络安全威胁情报共享与交换研究综述
    林玥, 刘鹏, 王鹤, 王文杰, 张玉清
    计算机研究与发展    2020, 57 (10): 2052-2065.   doi: 10.7544/issn1000-1239.2020.20200616
    摘要633)   HTML14)    PDF (1049KB)(633)   
    网络空间新生威胁正在以其复杂多变的攻击方式危害着个人、组织乃至政府的利益.在传统网络安全防御手段捉肘见襟时,威胁情报共享与交换机制的提出给网络空间安全的防护带来了一丝曙光.网络安全威胁情报是对组织和机构产生潜在危害与直接危害的信息集合,这些信息能帮助组织和机构研判所面临的网络安全威胁,并据此制定决策和进行防御.威胁情报的交换与共享可以使威胁情报价值最大化,降低情报搜集成本和改善信息孤岛问题,进而提高参与共享各方的威胁检测与应急响应能力.首先介绍了网络安全威胁情报的概念和主流的威胁情报共享规范;其次,调研了近10年来国内外有关威胁情报共享与交换的文献,分析和归纳了威胁情报共享与交换的现状与发展趋势,着重从共享模型与机制、交换机制的收益分配以及共享数据的隐私保护3个角度进行了深入分析,指出了3部分存在的问题及相关解决方案,并对各方案的优缺点进行了分析讨论;最后展望了威胁情报共享与交换未来的研究趋势和方向.
    相关文章 | 计量指标
    14. 机器学习的安全问题及隐私保护
    魏立斐, 陈聪聪, 张蕾, 李梦思, 陈玉娇, 王勤
    计算机研究与发展    2020, 57 (10): 2066-2085.   doi: 10.7544/issn1000-1239.2020.20200426
    摘要1381)   HTML23)    PDF (2361KB)(1153)   
    近年来,机器学习迅速地发展,给人们带来便利的同时,也带来极大的安全隐患.机器学习的安全与隐私问题已经成为其发展的绊脚石.机器学习模型的训练和预测均是基于大量的数据,而数据中可能包含敏感或隐私信息,随着数据安全与隐私泄露事件频发、泄露规模连年加剧,如何保证数据的安全与隐私引发科学界和工业界的广泛关注.首先,介绍了机器学习隐私保护中的敌手模型的概念;其次总结机器学习在训练和预测阶段常见的安全及隐私威胁,如训练数据的隐私泄露、投毒攻击、对抗攻击、隐私攻击等.随后介绍了常见的安全防御方法和隐私保护方法,重点介绍了同态加密技术、安全多方计算技术、差分隐私技术等,并比较了典型的方案及3种技术的适用场景.最后,展望机器学习隐私保护的未来发展趋势和研究方向.
    相关文章 | 计量指标
    15. 互联网数据传输协议QUIC研究综述
    李学兵, 陈阳, 周孟莹, 王新
    计算机研究与发展    2020, 57 (9): 1864-1876.   doi: 10.7544/issn1000-1239.2020.20190693
    摘要930)   HTML28)    PDF (929KB)(628)   
    QUIC是由Google提出的用于替代TCP(Transmission Control Protocol)的互联网数据传输协议.它引入了许多新的特性,从而在理论上拥有比TCP更好的性能.例如,它通过多路传输解决了队头阻塞问题,通过0-RTT握手降低了传输层握手延时,以及通过连接迁移更好地对移动性提供支持.但是,现实生活中的网络环境和终端设备是多样性的,并且互联网中存在着各种各样的攻击,所以QUIC在实际网络中的表现可能并不如预期.因此,探究QUIC对现有网络服务的影响是一项很重要的工作.首先介绍了QUIC的发展历史及其主要特性,并以目前使用最为广泛的2个应用场景——网页浏览和视频传输——为例,介绍并总结了国内外对QUIC在不同网络环境下的传输性能的研究分析.随后,从协议设计和系统设计2个方面列举了目前已有的对QUIC的优化工作,并对现有的对QUIC安全性分析的相关工作进行总结,还列举了目前学术界公认的QUIC所存在的安全性问题以及研究者为解决此类问题所作出的努力.最后,对现有研究成果可能的进一步提高之处进行了总结,并对QUIC带来的新的研究课题及其挑战进行了展望.
    相关文章 | 计量指标
    16. 机器学习的可解释性
    陈珂锐, 孟小峰
    计算机研究与发展    2020, 57 (9): 1971-1986.   doi: 10.7544/issn1000-1239.2020.20190456
    摘要1420)   HTML50)    PDF (1315KB)(1324)   
    近年来,机器学习发展迅速,尤其是深度学习在图像、声音、自然语言处理等领域取得卓越成效.机器学习算法的表示能力大幅度提高,但是伴随着模型复杂度的增加,机器学习算法的可解释性越差,至今,机器学习的可解释性依旧是个难题.通过算法训练出的模型被看作成黑盒子,严重阻碍了机器学习在某些特定领域的使用,譬如医学、金融等领域.目前针对机器学习的可解释性综述性的工作极少,因此,将现有的可解释方法进行归类描述和分析比较,一方面对可解释性的定义、度量进行阐述,另一方面针对可解释对象的不同,从模型的解释、预测结果的解释和模仿者模型的解释3个方面,总结和分析各种机器学习可解释技术,并讨论了机器学习可解释方法面临的挑战和机遇以及未来的可能发展方向.
    相关文章 | 计量指标
    17. 实体关系抽取方法研究综述
    李冬梅, 张扬, 李东远, 林丹琼
    计算机研究与发展    2020, 57 (7): 1424-1448.   doi: 10.7544/issn1000-1239.2020.20190358
    摘要1621)   HTML40)    PDF (1404KB)(1243)   
    在自然语言处理领域,信息抽取一直以来受到人们的关注.信息抽取主要包括3项子任务:实体抽取、关系抽取和事件抽取,而关系抽取是信息抽取领域的核心任务和重要环节.实体关系抽取的主要目标是从自然语言文本中识别并判定实体对之间存在的特定关系,这为智能检索、语义分析等提供了基础支持,有助于提高搜索效率,促进知识库的自动构建.综合阐述了实体关系抽取的发展历史,介绍了常用的中文和英文关系抽取工具和评价体系.主要从4个方面展开介绍了实体关系抽取方法,包括:早期的传统关系抽取方法、基于传统机器学习、基于深度学习和基于开放领域的关系抽取方法,总结了在不同历史阶段的主流研究方法以及相应的代表性成果,并对各种实体关系抽取技术进行对比分析.最后,对实体关系抽取的未来重点研究内容和发展趋势进行了总结和展望.
    相关文章 | 计量指标
    18. 一种基于强化学习的混合缓存能耗优化与评价
    范浩, 徐光平, 薛彦兵, 高赞, 张桦
    计算机研究与发展    2020, 57 (6): 1125-1139.   doi: 10.7544/issn1000-1239.2020.20200010
    摘要756)   HTML19)    PDF (3887KB)(502)   
    新兴的非易失存储器STT-RAM具有低泄漏功率、高密度和快速读取速度、高写入能量等特点;而SRAM具有高泄漏功率、低密度、快速读取写入速度、低写入能量等特点.SRAM和STT-RAM相结合组成的混合缓存充分发挥了两者的性能,提供了比SRAM更低的泄漏功率和更高的单元密度,比STT-RAM更高的写入速度和更低的写入能量.混合缓存结构主要是通过把写密集数据放入SRAM中、读密集型数据放入STT-RAM中发挥这2种存储器的性能.因此如何识别并分配读写密集型数据是混合缓存设计的关键挑战.利用缓存访问请求的写入强度和重用信息,提出一种基于强化学习的缓存管理方法,设计缓存分配策略优化能耗.关键思想是使用强化学习对得到的缓存行(cache line)集合的能耗进行学习,得到该集合分配到SRAM或者STT-RAM的权重,将集合中的缓存行分配到权重大的区域.实验评估表明:提出的策略与以前的策略相比,在单核(四核)系统中能耗平均降低了16.9%(9.7%).
    相关文章 | 计量指标
    19. 面向飞腾多核处理器的Winograd快速卷积算法优化
    王庆林, 李东升, 梅松竹, 赖志权, 窦勇
    计算机研究与发展    2020, 57 (6): 1140-1151.   doi: 10.7544/issn1000-1239.2020.20200107
    摘要536)   HTML4)    PDF (2411KB)(334)   
    随着深度学习的快速发展,卷积神经网络已广泛应用于计算机视觉、自然语言处理等人工智能领域中.Winograd快速卷积算法因能有效降低卷积神经网络中卷积操作的计算复杂度而受到广泛关注.随着国防科技大学自主研制的飞腾多核处理器在智能领域的推广应用,对面向飞腾多核处理器的高性能卷积实现提出了强烈需求.针对飞腾多核处理器的体系结构特征与Wingorad快速卷积算法的计算特点,提出了一种高性能并行Winograd快速卷积算法.该算法不依赖通用矩阵乘库函数,由卷积核转换、输入特征图转换、逐元素乘、输出特征图逆变换等4个部分构成,融合设计了4个部分的数据操作,并设计了与之配套的数据布局、多级并行数据转换算法与多级并行矩阵乘算法,实现访存性能以及算法整体性能的提升.在两款飞腾多核处理器上的测试结果显示,与开源库ACL和NNPACK中的Winograd快速卷积实现相比,该算法分别能获得1.05~16.11倍与1.66~16.90倍的性能加速;集成到开源框架Mxnet后,该算法使得VGG16网络的前向计算获得了3.01~6.79倍的性能加速.
    相关文章 | 计量指标
    20. 面向高通量计算机的图算法优化技术
    张承龙, 曹华伟, 王国波, 郝沁汾, 张洋, 叶笑春, 范东睿
    计算机研究与发展    2020, 57 (6): 1152-1163.   doi: 10.7544/issn1000-1239.2020.20200115
    摘要540)   HTML5)    PDF (1876KB)(310)   
    随着互联网技术的蓬勃发展,图数据的规模呈爆炸式增长.如何高效地处理大规模图数据逐渐成为工业界和学术界关注的焦点.宽度优先搜索算法是解决图遍历问题的经典算法,也是Graph500基准的核心测试程序之一.高通量计算机采用ARM架构的众核体系结构,具有高并发、强实时、低功耗等适于大数据计算的特点.在单节点上,BFS算法的优化已取得一系列进展,首先对现有的优化技术进行系统的介绍,并在此基础上提出2种面向高通量计算机的优化手段,通过减少冗余访存和提高缓存局部性,有效提高了算法的访存效率.通过这些优化手段,在高通量计算机上对BFS算法的性能进行了系统的评估.对于顶点规模为230的Kronecker图(顶点数为230,边数为234),优化后的BFS算法在高通量计算机上的平均性能为24.26 GTEPS.与两路x86架构服务器相比,单节点具有1.18倍的性能优势.在性能功耗比方面,高通量计算机的结果为181.04 MTEPS/W.在2019年6月份的Green Graph500面向大数据集的排行榜上取得第2名的成绩.综上,高通量计算机的高并发和低功耗等特点非常适合处理大规模图计算等数据密集型应用.
    相关文章 | 计量指标