ISSN 1000-1239 CN 11-1777/TP

全文下载排行

    一年内发表文章 | 两年内 | 三年内 | 全部 | 最近1个月下载排行 | 最近1年下载排行

    当前位置: 最近1个月下载排行
    Please wait a minute...
    选择: 显示/隐藏图片
    1. 知识图谱构建技术综述
    刘峤,李杨,段宏,刘瑶,秦志光
    计算机研究与发展    2016, 53 (3): 582-600.   doi: 10.7544/issn1000-1239.2016.20148228
    摘要9502)   HTML208)    PDF (2414KB)(15844)   
    谷歌知识图谱技术近年来引起了广泛关注,由于公开披露的技术资料较少,使人一时难以看清该技术的内涵和价值.从知识图谱的定义和技术架构出发,对构建知识图谱涉及的关键技术进行了自底向上的全面解析.1)对知识图谱的定义和内涵进行了说明,并给出了构建知识图谱的技术框架,按照输入的知识素材的抽象程度将其划分为3个层次:信息抽取层、知识融合层和知识加工层;2)分别对每个层次涉及的关键技术的研究现状进行分类说明,逐步揭示知识图谱技术的奥秘,及其与相关学科领域的关系;3)对知识图谱构建技术当前面临的重大挑战和关键问题进行了总结.
    相关文章 | 计量指标
    2. 深度神经架构搜索综述
    孟子尧, 谷雪, 梁艳春, 许东, 吴春国
    计算机研究与发展    2021, 58 (1): 22-33.   doi: 10.7544/issn1000-1239.2021.20190851
    摘要512)      PDF (1178KB)(645)   
    深度学习在图像、语音、文本等多种模态的数据任务上取得了优异的效果.然而,针对特定任务,人工设计网络需要花费大量的时间,并且需要设计者具有一定水平的专业知识和设计经验.面对如今日趋复杂的网络架构,仅依靠人工进行设计变得越来越复杂.基于此,借助算法自动地对神经网络进行架构的搜索成为了研究热点.神经架构搜索的方法涉及3个方面:搜索空间、搜索策略、性能评估策略.通过搜索策略在搜索空间中选择一个网络架构,借助性能评估策略对该网络架构进行评估,并将结果反馈给搜索策略指导搜索策略选择更好的网络架构,通过不断迭代得到最优的网络架构.为了更好地为读者提供一个快速了解神经网络架构搜索方法的导航地图,从搜索空间、搜索策略和性能评估策略3个方面对现有典型的神经架构搜索方法进行了梳理,总结讨论了近年来常见的架构搜索方法,并分析了各种方法的优势和不足.
    相关文章 | 计量指标
    3. 自动文本摘要研究综述
    李金鹏, 张闯, 陈小军, 胡玥, 廖鹏程
    计算机研究与发展    2021, 58 (1): 1-21.   doi: 10.7544/issn1000-1239.2021.20190785
    摘要630)      PDF (1756KB)(784)   
    近年来,互联网技术的蓬勃发展极大地便利了人类的日常生活,不可避免的是互联网中的信息呈井喷式爆发,如何从中快速有效地获取所需信息显得极为重要.自动文本摘要技术的出现可以有效缓解该问题,其作为自然语言处理和人工智能领域的重要研究内容之一,利用计算机自动地从长文本或文本集合中提炼出一段能准确反映源文中心内容的简洁连贯的短文.探讨自动文本摘要任务的内涵,回顾和分析了自动文本摘要技术的发展,针对目前主要的2种摘要产生形式(抽取式和生成式)的具体工作进行了详细介绍,包括特征评分、分类算法、线性规划、次模函数、图排序、序列标注、启发式算法、深度学习等算法.并对自动文本摘要常用的数据集以及评价指标进行了分析,最后对其面临的挑战和未来的研究趋势、应用等进行了预测.
    相关文章 | 计量指标
    4. 基于区块链的数据透明化:问题与挑战
    孟小峰, 刘立新
    计算机研究与发展    2021, 58 (2): 237-252.   doi: 10.7544/issn1000-1239.2021.20200017
    摘要239)      PDF (1812KB)(334)   
    物联网、穿戴设备和移动通信等技术的高速发展促使数据源源不断地产生并汇聚至多方数据收集者,由此带来更严峻的隐私泄露问题, 然而传统的差分隐私、加密和匿名等隐私保护技术还不足以应对.更进一步,数据的自主汇聚导致数据垄断问题,严重影响了大数据价值实现.此外,大数据决策过程中,数据非真实产生、被篡改和质量管理过程中的单点失败等问题导致数据决策不可信.如何使这些问题得到有效治理,使数据被正确和规范地使用是大数据发展面临的主要挑战.首先,提出数据透明化的概念和研究框架,旨在增加大数据价值实现过程的透明性,从而为上述问题提供解决方案.然后,指出数据透明化的实现需求与区块链的特性天然契合,并对目前基于区块链的数据透明化研究现状进行总结.最后,对基于区块链的数据透明化可能面临的挑战进行分析.
    相关文章 | 计量指标
    5. 知识表示学习研究进展
    刘知远,孙茂松,林衍凯,谢若冰
    计算机研究与发展    2016, 53 (2): 247-261.   doi: 10.7544/issn1000-1239.2016.20160020
    摘要9525)   HTML85)    PDF (3333KB)(14289)   
    人们构建的知识库通常被表示为网络形式,节点代表实体,连边代表实体间的关系.在网络表示形式下,人们需要设计专门的图算法存储和利用知识库,存在费时费力的缺点,并受到数据稀疏问题的困扰.最近,以深度学习为代表的表示学习技术受到广泛关注.表示学习旨在将研究对象的语义信息表示为稠密低维实值向量,知识表示学习则面向知识库中的实体和关系进行表示学习.该技术可以在低维空间中高效计算实体和关系的语义联系,有效解决数据稀疏问题,使知识获取、融合和推理的性能得到显著提升.介绍知识表示学习的最新进展,总结该技术面临的主要挑战和可能解决方案,并展望该技术的未来发展方向与前景.
    相关文章 | 计量指标
    被引次数: Baidu(75)
    6. 时间序列异常点及突变点的检测算法
    苏卫星, 朱云龙, 刘 芳, 胡琨元,
    计算机研究与发展   
    摘要3569)   HTML17)    PDF (2315KB)(3402)   
    7. 基于差分量化局部二值模式的人脸反欺诈算法研究
    束鑫, 唐慧, 杨习贝, 宋晓宁, 吴小俊
    计算机研究与发展    2020, 57 (7): 1508-1521.   doi: 10.7544/issn1000-1239.2020.20190319
    摘要221)   HTML1)    PDF (4066KB)(355)   
    随着人脸识别技术已经融入到人们日常生活中,人脸欺诈检测作为人脸识别前的一个关键步骤越来越受到重视.针对打印攻击和视频攻击,提出了一种通过量化局部像素之间的差值来细化传统局部二值模式(local binary pattern, LBP)特征的差分量化局部二值模式(difference quantization local binary pattern, DQ_LBP)算法.DQ_LBP能够在不增加LBP维度的基础上提取像素之间的差值信息,以便更精确地描述图像的局部纹理特征.此外,使用空间金字塔算法统计了不同彩色空间中的DQ_LBP特征并将其融合成统一的特征向量,从而更加充分地描述了人脸的局部彩色纹理信息及其空间结构信息,进一步提高了算法的检测性能.实验结果表明:该算法在CASIA FASD,Replay-Attack,Replay-Mobile三个具有挑战性的人脸反欺诈数据库中都取得了较为优异的结果,而且在实时性设备的应用上具有很大的潜能.
    相关文章 | 计量指标
    8. 大数据管理:概念、技术与挑战
    孟小峰 慈 祥
    计算机研究与发展   
    录用日期: 2020-01-15

    摘要7912)   HTML250)    PDF (3405KB)(266806)   
    9. 基于区块链的网络安全威胁情报共享模型
    黄克振, 连一峰, 冯登国, 张海霞, 刘玉岭, 马向亮
    计算机研究与发展    2020, 57 (4): 836-846.   doi: 10.7544/issn1000-1239.2020.20190404
    摘要1064)   HTML43)    PDF (3685KB)(744)   
    在不断加剧的网络安全攻防对抗过程中,攻防双方存在着天然的不对称性,网络安全威胁情报共享利用是一种有效提高防护方响应能力和效果的手段.然而威胁情报共享利用中的隐私保护需求与构建完整攻击链的需求之间存在矛盾.针对上述矛盾点,提出一种基于区块链的网络安全威胁情报共享模型,利用了区块链技术的账户匿名性和不可篡改性,使用单向加密函数保护情报中的隐私信息,基于加密后的情报构建完整攻击链,借助区块链的回溯能力完成攻击链中攻击源的解密.最后,通过实验验证了该模型的可行性和有效性.
    相关文章 | 计量指标
    10. 一种基于标签传播的两阶段社区发现算法
    郑文萍,车晨浩,钱宇华,王杰
    计算机研究与发展    2018, 55 (9): 1959-1971.   doi: 10.7544/issn1000-1239.2018.20180277
    摘要790)   HTML8)    PDF (4361KB)(493)   
    针对标签传播社区发现算法在节点更新顺序及标签传播过程中存在较大随机性而导致划分结果稳定性差的问题,提出一种基于标签传播的两阶段社区发现算法(a two-stage community detection algorithm based on label propagation, LPA-TS),通过参与系数确定节点更新顺序,并在标签传播过程中依据节点间相似性更新节点标签,得到初始社区划分.将社区看作节点,社区间连边数作为边权重,得到社区关系网络.按照参与系数由低到高的顺序合并社区关系网络中的节点,得到最终社区划分结果.算法LPA-TS减少了传统LPA方法在节点更新和标签传播过程的随机性;在第2阶段,将不符合弱社区定义的初始社区与连边最多的相邻社区合并,再按照社区参与系数由低到高的顺序合并初始社区提升社区发现质量.通过与一些经典算法在8个真实网络及不同参数下LFR benchmark人工网络数据集上的实验比较表明LPA-TS算法表现了良好的稳定性,在NMI、ARI、模块性等方面表现良好.
    相关文章 | 计量指标
    11. 基于语义分割的红外和可见光图像融合
    周华兵, 侯积磊, 吴伟, 张彦铎, 吴云韬, 马佳义
    计算机研究与发展    2021, 58 (2): 436-443.   doi: 10.7544/issn1000-1239.2021.20200244
    摘要67)      PDF (1755KB)(193)   
    红外图像即使在低光照条件下,也能根据热辐射的差异将目标与背景区分开来,而可见光图像具有高空间分辨率的纹理细节,此外,红外和可见光图像都含有相应的语义信息.因此,红外与可见光图像融合,需要既保留红外图像的辐射信息,也保留可见光图像的纹理细节,同时,也要反映出二者的语义信息.而语义分割可以将图像转换为带有语义的掩膜,提取源图像的语义信息.提出了一种基于语义分割的红外和可见光图像融合方法,能够克服现有融合方法不能针对性地提取不同区域特有信息的缺点.使用生成式对抗神经网络,并针对源图像的不同区域设计了2种不同的损失函数,以提高融合图像的质量.首先通过语义分割得到含有红外图像目标区域语义信息的掩模,并利用掩模将红外和可见光图像分割为红外图像目标区域、红外图像背景区域、可见光图像目标区域和可见光图像背景区域;然后对目标区域和背景区域分别采用不同的损失函数得到目标区域和背景区域的融合图像;最后将2幅融合图像结合起来得到最终融合图像.实验表明,融合结果目标区域对比度更高,背景区域纹理细节更丰富,提出的方法取得了较好的融合效果.
    相关文章 | 计量指标
    12. 基于故障检测上下文的等价变异体识别算法
    于畅, 王雅文, 林欢, 宫云战
    计算机研究与发展    2021, 58 (1): 83-97.   doi: 10.7544/issn1000-1239.2021.20190817
    摘要87)      PDF (1595KB)(253)   
    等价变异体识别一直是阻碍变异测试在工业界得以广泛应用的一个关键难题.为此提出了一种基于故障检测上下文的等价变异体识别算法.该算法通过静态分析技术抽取程序中与故障检测条件相关的代码上下文信息,以构造故障检测上下文;接着,故障检测上下文被转换为文档模型,经过一个文档表示学习网络进行编码;最后通过机器学习模型将变异体分类为等价或非等价变异.在包含了22个C程序和118 000个变异体样本的训练集上,该算法取得91%的分类精准度和82%的召回率;同时在跨项目交叉验证中,机器学习模型取得了77%的精准度和78%的召回率.该结果表明基于故障检测上下文的识别技术能够有效地提高等价变异体分类的精准性和泛用性,为提高变异测试技术的有效性提供了技术支持.
    相关文章 | 计量指标
    13. 一种基于区块链的泛用型数据隐私保护的安全多方计算协议
    刘峰, 杨杰, 李志斌, 齐佳音
    计算机研究与发展    2021, 58 (2): 281-290.   doi: 10.7544/issn1000-1239.2021.20200751
    摘要156)      PDF (1496KB)(189)   
    近年来,如何合理有效地在区块链上实现用户隐私数据保护是区块链技术领域的一个关键性问题.针对此问题,设计出一种基于Pedersen承诺与Schnorr协议的安全多方计算协议(protocol of blockchain based on Pedersen commitment linked Schnorr protocol for multi-party computation,BPLSM).通过构筑该协议架构并进行形式化证明演算,表明了该协议能够融入区块链网络、能够在匿名情况下合并不同隐私消息并进行高效签署的特点.此外分析了协议的性质与安全性,证明了在区块链中应用BPLSM协议的泛用型隐私计算方案计算上的低算力开销,并具备良好的信息隐蔽性.最后对协议进行实验仿真,结果表明:在小范围人数固定的多方计算中,BPLSM协议验签的时间成本比当前主流的BLS签名节省约83.5%.
    相关文章 | 计量指标
    14. 机器学习的隐私保护研究综述
    刘俊旭, 孟小峰
    计算机研究与发展    2020, 57 (2): 346-362.   doi: 10.7544/issn1000-1239.2020.20190455
    摘要2413)   HTML99)    PDF (1684KB)(2441)   
    大规模数据收集大幅提升了机器学习算法的性能,实现了经济效益和社会效益的共赢,但也令个人隐私保护面临更大的风险与挑战.机器学习的训练模式主要分为集中学习和联邦学习2类,前者在模型训练前需统一收集各方数据,尽管易于部署,却存在极大数据隐私与安全隐患;后者实现了将各方数据保留在本地的同时进行模型训练,但该方式目前正处于研究的起步阶段,无论在技术还是部署中仍面临诸多问题与挑战.现有的隐私保护技术研究大致分为2条主线,即以同态加密和安全多方计算为代表的加密方法和以差分隐私为代表的扰动方法,二者各有利弊.为综述当前机器学习的隐私问题,并对现有隐私保护研究工作进行梳理和总结,首先分别针对传统机器学习和深度学习2类情况,探讨集中学习下差分隐私保护的算法设计;之后概述联邦学习中存在的隐私问题及保护方法;最后总结目前隐私保护中面临的主要挑战,并着重指出隐私保护与模型可解释性研究、数据透明之间的问题与联系.
    相关文章 | 计量指标
    15. 挖掘专利知识实现关键词自动抽取
    陈忆群,周如旗,朱蔚恒,李梦婷,印鉴
    计算机研究与发展    2016, 53 (8): 1740-1752.   doi: 10.7544/issn1000-1239.2016.20160195
    摘要1354)   HTML5)    PDF (2962KB)(781)   
    关键词是人们快速判断是否要详细阅读文件内容的重要线索,关键词自动抽取在信息检索、自然语言处理等研究领域均有重要应用.设计了一种新的关键词自动抽取方法,使计算机能够像人类专家一样,利用知识库对目标文本进行学习和理解,最终自动抽取出关键词.专利数据因其数据量庞大、内容丰富、表达准确、专业权威而被选中作为知识库来源.详细讨论了专利数据的特性,挖掘不同专利间的知识关联,针对某一知识领域构造背景知识库,在此基础上进行目标文本的关键词自动抽取.与目标文本相关的专利文集中每个专利的专利发明人、权利人、专利引用和分类信息都被用于在不同的专利文档之间发现关联性,利用关联信息扩充背景知识库,获得目标文档在各个相关知识领域的背景知识库.基于背景知识库设计了词知识特征值,以反映词在目标文本背景知识中的重要程度.最后,把关键词抽取问题转化为分类问题,利用支持向量机(support vector machine, SVM)抽取出目标文本的关键词.在专利数据集和开放数据集的实验结果证明明显优于现有算法.
    相关文章 | 计量指标
    被引次数: Baidu(5)
    16. 面向深度学习的公平性研究综述
    陈晋音, 陈奕芃, 陈一鸣, 郑海斌, 纪守领, 时杰, 程瑶
    计算机研究与发展    2021, 58 (2): 264-280.   doi: 10.7544/issn1000-1239.2021.20200758
    摘要175)      PDF (1752KB)(170)   
    深度学习是机器学习研究中的一个重要领域,它具有强大的特征提取能力,且在许多应用中表现出先进的性能,因此在工业界中被广泛应用.然而,由于训练数据标注和模型设计存在偏见,现有的研究表明深度学习在某些应用中可能会强化人类的偏见和歧视,导致决策过程中的不公平现象产生,从而对个人和社会产生潜在的负面影响.为提高深度学习的应用可靠性、推动其在公平领域的发展,针对已有的研究工作,从数据和模型2方面出发,综述了深度学习应用中的偏见来源、针对不同类型偏见的去偏方法、评估去偏效果的公平性评价指标、以及目前主流的去偏平台,最后总结现有公平性研究领域存在的开放问题以及未来的发展趋势.
    相关文章 | 计量指标
    17. 知识图谱研究综述及其在医疗领域的应用
    侯梦薇,卫荣,陆亮,兰欣,蔡宏伟
    计算机研究与发展    2018, 55 (12): 2587-2599.   doi: 10.7544/issn1000-1239.2018.20180623
    摘要3278)   HTML101)    PDF (2825KB)(1880)   
    随着医疗大数据时代的到来,知识互联受到了广泛的关注.如何从海量的数据中提取有用的医学知识,是医疗大数据分析的关键.知识图谱技术提供了一种从海量文本和图像中抽取结构化知识的手段,知识图谱与大数据技术、深度学习技术相结合,正在成为推动人工智能发展的核心驱动力.知识图谱技术在医疗领域拥有广阔的应用前景,该技术在医疗领域的应用研究将会在解决优质医疗资源供给不足和医疗服务需求持续增加的矛盾中产生重要的作用.目前,针对医学知识图谱的研究还处于探索阶段,现有知识图谱技术在医疗领域普遍存在效率低、限制多、拓展性差等问题.首先针对医疗领域大数据专业性强、结构复杂等特点,对医学知识图谱架构和构建技术进行了全面剖析;其次,分别针对医学知识图谱中知识表示、知识抽取、知识融合和知识推理这4个模块的关键技术和研究进展进行综述,并对这些技术进行实验分析与比较.此外,介绍了医学知识图谱在临床决策支持、医疗智能语义检索、医疗问答等医疗服务中的应用现状.最后对当前研究存在的问题与挑战进行了讨论和分析,并对其发展前景进行了展望.
    相关文章 | 计量指标
    18. 分布式深度学习训练网络综述
    朱泓睿, 元国军, 姚成吉, 谭光明, 王展, 户忠哲, 张晓扬, 安学军
    计算机研究与发展    2021, 58 (1): 98-115.   doi: 10.7544/issn1000-1239.2021.20190881
    摘要237)      PDF (3061KB)(260)   
    近年来深度学习在图像、语音、自然语言处理等诸多领域得到广泛应用,但随着人们对深度学习的训练速度和数据处理能力的需求不断提升,传统的基于单机的训练过程愈发难以满足要求,分布式的深度学习训练方法成为持续提升算力的有效途径.其中训练过程中节点间网络的通信性能至关重要,直接影响训练性能.分析了分布式深度学习中的性能瓶颈,在此基础上对目前常用的网络性能优化方案进行综述,详细阐述了目前最新的超大规模分布式训练的体系结构、优化方法、训练环境和最有效的优化方法,最后对分布式训练仍然存在的困难进行了总结,对其未来研究方向进行了展望.
    相关文章 | 计量指标
    19. 边缘计算:现状与展望
    施巍松,张星洲,王一帆,张庆阳
    计算机研究与发展    2019, 56 (1): 69-89.   doi: 10.7544/issn1000-1239.2019.20180760
    摘要4956)   HTML199)    PDF (3670KB)(3240)   
    随着万物互联时代的到来,网络边缘设备产生的数据量快速增加,带来了更高的数据传输带宽需求,同时,新型应用也对数据处理的实时性提出了更高要求,传统云计算模型已经无法有效应对,因此,边缘计算应运而生.边缘计算的基本理念是将计算任务在接近数据源的计算资源上运行,可以有效减小计算系统的延迟,减少数据传输带宽,缓解云计算中心压力,提高可用性,并能够保护数据安全和隐私.得益于这些优势,边缘计算从2014年以来迅速发展.旨在探讨3个问题:边缘计算从哪里来、它的现状如何、它要到哪里去.围绕这3个问题,首先梳理了边缘计算的发展历程,将其归纳为技术储备期、快速增长期和稳健发展期3个阶段,并列举了不同阶段的典型事件.随后,总结了推动边缘计算迅速发展的7项关键技术,并结合已经广泛采用边缘计算的6类典型应用进行了说明.最后,提出了边缘计算在未来发展中需要紧迫解决的6类问题.
    相关文章 | 计量指标
    20. 采用高斯拟合的全局阈值算法阈值优化框架
    陈海鹏,申铉京,龙建武
    计算机研究与发展    2016, 53 (4): 892-903.   doi: 10.7544/issn1000-1239.2016.20140508
    摘要1018)   HTML2)    PDF (5214KB)(797)   
    采用最大类间方差法、最大熵法和最小误差法3种经典全局阈值方法获得的阈值,存在一定偏差.针对该问题,提出了一种采用高斯拟合的全局阈值算法阈值优化框架(TOF).本优化框架先利用全局阈值算法获得初始阈值,将图像粗分为背景和目标2个部分,然后分别计算各部分均值和方差来拟合出2个高斯分布.由于最佳阈值位于2个高斯分布的交点位置,为此本框架采用多次迭代方式来优化阈值,直至最终收敛到最佳阈值.为提高抗噪性能,结合三维直方图重建和降维思想,提出了一种鲁棒的采用高斯拟合的全局阈值算法阈值优化框架(RTOF).实验结果表明,对于以上经典全局算法,采用本优化方法均能收敛到一个最佳阈值,同时本算法还具有鲁棒的抗噪性能和较高的执行效率.
    相关文章 | 计量指标
    被引次数: Baidu(2)