Please wait a minute...
ISSN 1000-1239 CN 11-1777/TP

当期目录

2021年 第58卷 第7期    出版日期:2021-07-01
信息处理
虚假信息检测专题前言
虎嵩林, 赵军, 唐杰, 秦兵, 石川, 颜水成
2021, 58(7):  1351-1352.  doi:10.7544/issn1000-1239.2021.qy0701
摘要 ( 296 )   HTML ( 27)   PDF (221KB) ( 274 )  
相关文章 | 计量指标
虚假信息检测旨在综合应用自然语言处理、社交挖掘、跨模态分析等智能处理手段, 发现并利用信息的内在特征、产生机理与传播规律,为以假新闻为代表的虚假、伪造信息 的识别与干预提供理论和技术支持.《Science》在2018年3月一次刊发了2篇论文,讨论了 假新闻的危害以及对其的科学观察与思考,引发了学术界与产业界对这一科学问题的持 续关注.假新闻、谣言、水军贴等形态的虚假信息在新闻网站、社交媒体、电商应用等平台的 泛滥,可能严重冲击经济、社会和政治秩序,对智能安全检测技术的创新发展提出了迫切 需求.
网络信息生态系统中的虚假信息:检测、缓解与挑战
Amrita, Bhattacharjee, 舒凯, 高旻, 刘欢
2021, 58(7):  1353-1365.  doi:10.7544/issn1000-1239.2021.20200979
摘要 ( 376 )   HTML ( 27)   PDF (836KB) ( 415 )  
相关文章 | 计量指标
随着互联网的迅速发展及网络社会媒体中用户的增加,通过社会媒体发布和传播信息的真实性和质量受到日益广泛的关注.目前大部分公众已习惯从社会媒体平台与互联网获取新闻,甚至是获取受到高度关注的话题(如新冠病毒感染症状)的信息.鉴于网络信息生态系统非常嘈杂,充斥着错误和虚假信息并经常受到恶意媒介的污染,从中识别真实的信息成为一项艰巨任务.对此,研究者们已开始致力于虚假信息检测和减缓虚假信息传播影响方面的工作.讨论了网络信息生态系统中的虚假信息问题,特别是随着新冠病毒大爆发而来的“信息疫情”.随后,简述了虚假信息检测方法,分析了减缓虚假信息影响的方法,并探讨了虚假信息研究中的固有挑战.最后从跨学科角度阐述了检测和减缓虚假信息影响的方法和未来研究展望.
新冠疫情相关社交媒体谣言传播量化分析
陈慧敏, 金思辰, 林微, 朱泽宇, 仝凌波, 刘一芃, 叶奕宁, 姜维翰, 刘知远, 孙茂松, 金兼斌
2021, 58(7):  1366-1384.  doi:10.7544/issn1000-1239.2021.20200818
摘要 ( 531 )   HTML ( 14)   PDF (7063KB) ( 379 )  
相关文章 | 计量指标
新冠肺炎疫情的爆发伴随着大量的谣言在社交媒体平台传播,对网络秩序和社会稳定产生了不良影响.已有的疫情相关社交媒体谣言传播量化分析研究仅对谣言内容等单一传播要素展开分析,而忽略了构成信息传播的其他基础要素,包括传播者、受众以及传播效果等.同时,这些研究的谣言数据与真实的社交媒体谣言数据也存在分布偏差和信息缺失.因此,基于新浪微博平台对新冠疫情相关社交媒体谣言的传播展开更加全面的量化分析.具体而言,首先对谣言传播内容进行分析,包括其主题分析、涉及地区分析、事件倾向性分析以及情感分析;进一步对谣言参与用户进行分析,将参与用户分为3类:造谣者、传谣者和辟谣者,并分别对其基础属性、关注主题、个体情绪以及自网络属性进行探究;最后对谣言引发舆情进行分析,探究其情感的整体分布、与主题、关键词和地区的关系、以及情感的演变规律.该研究首次从信息传播的各个基础要素层面对疫情相关的社交媒体谣言传播展开量化分析,不仅对新冠肺炎疫情相关谣言传播有了更全面深刻的认识,同时对突发公共事件的谣言研究和谣言治理也具有十分重要的价值.
基于主题与情感联合预训练的虚假评论检测方法
张东杰, 黄龙涛, 张荣, 薛晖, 林俊宇, 路瑶
2021, 58(7):  1385-1394.  doi:10.7544/issn1000-1239.2021.20200817
摘要 ( 218 )   HTML ( 9)   PDF (913KB) ( 267 )  
相关文章 | 计量指标
商品评论信息是用户线上决策的重要依据,但在利益的驱使下商家往往会通过雇佣专业的写手撰写大量虚假评论的方式来误导用户,进而达到包装自己或诋毁竞争对手的目的.这种现象会造成不正当的商业竞争和极差的用户体验.针对这一现象,我们通过情感预训练的方法对现有的虚假评论识别模型进行了改进,并提出了一种能够同时整合评论语义和情感信息的联合预训练学习方法.鉴于预训练模型强大的语义表示能力, 在联合学习框架中采用了2种预训练模型编码器分别用于抽取评论的语义和情感上下文特征,并通过联合训练的方法整合2种特征,最后使用Center Loss损失函数对模型进行优化.在多个公开数据集和多个不同任务上进行了验证实验,实验表明提出的联合模型在虚假评论检测与情感极性分析任务上都取得了目前最好的效果且具有更强的泛化能力.
一种基于多关系传播树的谣言检测方法
胡斗, 卫玲蔚, 周薇, 淮晓永, 韩冀中, 虎嵩林
2021, 58(7):  1395-1411.  doi:10.7544/issn1000-1239.2021.20200810
摘要 ( 191 )   HTML ( 5)   PDF (1386KB) ( 235 )  
相关文章 | 计量指标
近年来,社交媒体为人们消费信息提供便利的同时,也逐渐成为谣言产生和传播的温床.为了降低谣言的危害性,谣言检测受到研究学者的广泛关注.近期研究主要基于博文内容和传播结构信息,利用深度学习模型进行谣言检测.但是,这些方法仅考虑传播过程中博文之间的显式交互关系,忽略了对潜在关系的建模,难以捕捉到丰富的传播结构特征.例如,在转发(或评论)的交互形式下,多个转发者(或评论者)之间往往也存在局部的隐式交互.针对该挑战,提出一种基于多关系传播树的谣言检测方法,建模博文之间的多种依赖关系,同时增强重要博文的影响力,以捕获更丰富的信息传播结构特征.具体地,基于文本内容和传播树结构建立异构图,使用多关系图卷积网络建模父子节点之间的层间依赖关系和兄弟节点之间的层内依赖关系,并利用源节点和关键传播节点建模重要博文在信息传播中的潜在影响力,从而学习一个更全面的特征向量表示,用于检测谣言.在3个公开的真实数据集上进行广泛的实验,结果表明该方法具有比其他基线方法更高的谣言检测性能.
融合源信息和门控图神经网络的谣言检测研究
杨延杰, 王莉, 王宇航
2021, 58(7):  1412-1424.  doi:10.7544/issn1000-1239.2021.20200801
摘要 ( 175 )   HTML ( 2)   PDF (2118KB) ( 324 )  
相关文章 | 计量指标
社交媒体在带给人们便利同时,也为谣言的发布和传播提供了平台.目前,大多数的谣言检测方法都是基于文本内容信息,但在社交媒体场景下,文本内容大多是短文本,这类方法往往会因为数据稀疏性的问题导致性能下降.社交网络上的消息传播可建模为图结构,已有研究考虑消息传播结构特点,通过GCN等模型进行谣言检测.GCN依据结构信息聚合邻居来提升节点表示,但有些邻居聚合是无用的,甚至可能带来噪声,使得通过GCN得到的表示并不可靠.此外,这些研究不能有效的突出源帖信息的重要性.针对这些问题提出了一种融合门控的传播图卷积网络模型GUCNH,在GUCNH模型中,首先利用消息转发关系构建信息转发图,通过2个融合门控的图卷积网络模块来聚合邻居节点信息生成节点的表示,融合门控能够对图卷积之前的特征表示和之后的特征表示进行选择与组合,以得到更加可靠的表示.考虑到在转发图中,任意的帖子之间都可能存在相互影响,而不仅仅是基于邻接关系,因此在2个融合门控的图卷积网络模块之间引入多头自注意力模块来建模任意帖子之间的多角度影响.此外,在转发图中,源帖包含的信息往往是最原始、最丰富的,在生成各节点表示之后,选择性的增强了源节点的信息以增强根源信息的影响力.在3个真实数据集上进行的实验表明,提出的模型优于现有的方法.
基于模体度的社交网络虚假信息传播机制研究
徐铭达, 张子柯, 许小可
2021, 58(7):  1425-1435.  doi:10.7544/issn1000-1239.2021.20200806
摘要 ( 197 )   HTML ( 5)   PDF (1876KB) ( 173 )  
相关文章 | 计量指标
社交媒体作为信息传播的载体,既可使人们快捷地分享信息流和获取时事新闻,也可能成为虚假信息泛滥蔓延的重要渠道.现有的虚假信息检测研究多基于对微博内容的机器学习或深度学习的识别模型,忽略了真假信息传播网络的结构差异.基于复杂网络的模体理论,提出了广度模体度与深度模体度的概念来量化传播网络的结构重要指标.研究表明:基于模体度的重要性计算方法是对传统网络结构重要性指标的一种创新与拓展,能够更全面地测度传播网络结构特性.通过构建的二维模体度量化指标,分析和揭示了微博、Twitter网络中虚假信息的结构特性与传播机制:虚假信息在广度传播与深度传播共同作用下扩散,广度模体度主要作用于网络传播规模,而深度模体度影响网络结构的复杂性.基于模体度的网络特征分析,可以应用于社交媒体信息传播的早期从源头上检测虚假信息,为虚假信息检测提供了一种新颖可行的途径.
基于深度学习的图异常检测技术综述
陈波冯, 李靖东, 卢兴见, 沙朝锋, 王晓玲, 张吉
2021, 58(7):  1436-1455.  doi:10.7544/issn1000-1239.2021.20200685
摘要 ( 1259 )   HTML ( 40)   PDF (4432KB) ( 1210 )  
相关文章 | 计量指标
图异常检测旨在大图或海量图数据库中寻找“陌生”或“不寻常”模式,具有广泛的应用场景.深度学习可以从数据中学习隐含的规律,在提取数据中潜在复杂模式方面表现出优越的性能.近年来随着基于深度神经网络的图表示学习取得显著进展,如何利用深度学习方法进行图异常检测引起了学术界和产业界的广泛关注.尽管最近一系列研究从图的角度对异常检测技术进行了调研,但是缺少对深度学习技术下的图异常检测技术的关注.首先给出了静态图和动态图上各类常见的异常定义,然后调研了基于深度神经网络的图表示学习方法,接着从静态图和动态图的角度出发,梳理了基于深度学习的图异常检测的研究现状,并总结了图异常检测的应用场景和相关数据集,最后讨论了图异常检测技术目前面临的挑战和未来的研究方向.
语义增强的多模态虚假新闻检测
亓鹏, 曹娟, 盛强
2021, 58(7):  1456-1465.  doi:10.7544/issn1000-1239.2021.20200804
摘要 ( 279 )   HTML ( 9)   PDF (1839KB) ( 323 )  
相关文章 | 计量指标
近年来社交媒体逐渐成为人们获取新闻信息的主要渠道,但其在给人们带来方便的同时也促进了虚假新闻的传播.在社交媒体的富媒体化趋势下,虚假新闻逐渐由单一的文本形式向多模态形式转变,因此多模态虚假新闻检测正在受到越来越多的关注.现有的多模态虚假新闻检测方法大多依赖于和数据集高度相关的表现层面特征,对新闻的语义层面特征建模不足,难以理解文本和视觉实体的深层语义,在新数据上的泛化能力受限.提出了一种语义增强的多模态虚假新闻检测方法,通过利用预训练语言模型中隐含的事实知识以及显式的视觉实体提取,更好地理解多模态新闻的深层语义.提取不同语义层次的视觉特征,在此基础上采用文本引导的注意力机制建模图文之间的语义交互,从而更好地融合多模态异构特征.在基于微博新闻的真实数据集上的实验结果表明:该方法能够有效提高多模态虚假新闻检测的性能.
基于全局-时频注意力网络的语音伪造检测
王成龙, 易江燕, 陶建华, 马浩鑫, 田正坤, 傅睿博
2021, 58(7):  1466-1475.  doi:10.7544/issn1000-1239.2021.20200799
摘要 ( 159 )   HTML ( 2)   PDF (1140KB) ( 324 )  
相关文章 | 计量指标
语音伪造检测是近年的一个研究热点,受到了广泛关注.目前,卷积神经网及其变种的提出,使其在语音伪造检测任务中取得了不错进展.然而,目前仍存在2方面问题:1)当前工作假设送入卷积神经网络的特征图的每一维对结果的影响是相同的,忽视了每一维上特征图的不同位置强调的信息是不一样的.2)此外,前人工作大多关注特征图的局部信息,没有利用全局视图中特征图之间的关系.为了解决以上挑战,引入全局-时频注意力框架,分别对通道维度和时频维度做了注意力变换.具体而言,引入了2个并行的注意力模块:1)时频注意力模块;2)全局注意力模块.对于时频注意力模块,可以通过使用加权求和在所有时频特征图上聚合特征来进行更新.对于全局注意力模块,借鉴了SE-Net的思想,通过参数为每个特征通道生成权重.通过这种办法,可以得到特征通道上响应的全局分布.在ASVspoof2019 LA公开数据集上进行了一系列实验,结果显示所提的模型取得不错的效果,最佳模型的等错误率达到4.12%,刷新了单个模型的最好成绩.
基于域对抗学习的可泛化虚假人脸检测方法研究
翁泽佳, 陈静静, 姜育刚
2021, 58(7):  1476-1489.  doi:10.7544/issn1000-1239.2021.20200803
摘要 ( 188 )   HTML ( 4)   PDF (2670KB) ( 195 )  
相关文章 | 计量指标
随着生成式对抗网络(generative adversarial networks, GAN)的快速发展,虚假人脸生成技术取得了显著进展.为了降低以假乱真的人脸生成技术给社会带来的危害,虚假人脸鉴别成为一个非常重要的课题,吸引了国内外研究者的广泛关注.然而,目前虚假人脸鉴别的研究工作相对较少,仍然有许多问题需要被解决.其中如何提升鉴别模型的迁移泛化能力是至关重要的问题,也是虚假人脸检测任务能否实际投入使用的关键所在.如何提升虚假人脸鉴别方法的泛化能力,即做到在没有见过的生成方法产生的数据上仍然准确有效非常重要.对此,提出了基于域对抗学习的可泛化虚假人脸检测模型,通过引入领域对抗分支,弱化特征提取器对于特定生成模型非鲁棒性特征的提取,模型能够抽取鲁棒性更强、泛化能力更高的特征,从而在没有见过的生成方法产生的虚假人脸图片上具有更好的鉴别表现.实验结果表明:所提出的方法能够提升鉴别模型的泛化能力,显著提升虚假人脸鉴别模型在未知生成模型产生的虚假图像上的性能.
社交网络信息传播预测与特定信息抑制
曹玖新, 高庆清, 夏蓉清, 刘伟佳, 朱雪林, 刘波
2021, 58(7):  1490-1503.  doi:10.7544/issn1000-1239.2021.20200809
摘要 ( 179 )   HTML ( 8)   PDF (1452KB) ( 278 )  
相关文章 | 计量指标
近年来,随着Twitter、Facebook、新浪微博等社交网站用户数量的激增,信息数量急剧膨胀,隐藏在海量信息中的不实信息的传播带来了不良的影响,如何调控或抑制特定信息的传播是网络信息管理面临的一项技术挑战.为了解决这一问题,首先从真实微博网络出发,基于机器学习方法提出了不依赖于传播模型的独立信息转发预测机制,从而对信息的传播进行预测;其次,基于独立级联模型,综合考虑本文场景的特殊性,提出了异步信息不平等竞争传播模型作为特定信息与免疫信息的竞争传播机制;最后,提出了3个种子节点集合选择算法,通过向选择的种子节点注入免疫信息使得免疫信息在网络中广泛传播从而抑制特定信息的传播.基于真实社交网站数据的实验证明,提出的信息传播预测模型以及种子节点选取算法对特定信息传播的调控和抑制具有良好的效果.
系统结构
基于粗粒度数据流架构的稀疏卷积神经网络加速
吴欣欣, 欧焱, 李文明, 王达, 张浩, 范东睿
2021, 58(7):  1504-1517.  doi:10.7544/issn1000-1239.2021.20200112
摘要 ( 167 )   HTML ( 6)   PDF (3555KB) ( 197 )  
相关文章 | 计量指标
卷积神经网络(convolutional neural network, CNN)在图像处理、语音识别、自然语言处理等领域实现了很好的性能.大规模的神经网络模型通常遭遇计算、存储等资源限制,稀疏神经网络的出现有效地缓解了对计算和存储的需求.尽管现有的领域专用加速器能够有效处理稀疏网络,它们通过算法和结构的紧耦合实现高能效,却丧失了结构的灵活性.粗粒度数据流架构通过灵活的指令调度可以实现不同的神经网络应用.基于该架构,密集卷积规则的计算特性使不同通道共享相同的一套指令执行,然而稀疏网络中存在权值稀疏,使得这些指令中存在0值相关的无效指令,而现有的指令执行方式无法自动跳过它们从而产生无效计算.同时在执行不规则的稀疏网络时,现有的指令映射方法造成了计算阵列的负载不均衡.这些问题阻碍了稀疏网络性能的提升.基于不同通道共享一套指令的前提下,根据稀疏网络的数据和指令特征增加指令控制单元实现权值数据中0值相关指令的检测和跳过,同时使用负载均衡的指令映射算法解决稀疏网络中指令执行不均衡问题.实验表明:与密集网络相比稀疏网络实现了平均1.55倍的性能提升和63.77%的能耗减少.同时比GPU(cuSparse)和Cambricon-X实现的稀疏网络分别快2.39倍(Alexnet)、2.28倍(VGG16)和1.14倍(Alexnet)、1.23倍(VGG16).
闪存固态硬盘系统结构与技术
高聪明, 石亮, 刘凯, 薛春, 舒继武
2021, 58(7):  1518-1532.  doi:10.7544/issn1000-1239.2021.20200690
摘要 ( 200 )   HTML ( 8)   PDF (1926KB) ( 175 )  
相关文章 | 计量指标
闪存固态硬盘凭借其高性能、低功耗、非易失等特点已经被广泛应用于个人电脑、数据中心和云存储服务等.近10年来,随着制程工艺和微电子技术的发展,闪存固态硬盘的特性发生了显著的变化.首先介绍了闪存存储单元的基本结构和存储原理.然后讨论了闪存固态硬盘的多项控制器关键技术,包括缓存设备、地址转换层、垃圾回收、数据分配、磨损均衡以及纠错码等.这些关键技术将支撑闪存固态硬盘的正常运作.此外,探讨了闪存固态硬盘的并行结构,并分析了闪存固态硬盘并行性利用的限制条件以及最新的并行性优化工作.接着,分析了3D闪存固态硬盘的发展和堆叠式结构,并针对3D固态硬盘的性能和寿命优化工作进行了归纳和分析,提出了现有3D固态硬盘性能和寿命优化工作的不足.最后,总结了当前闪存固态硬盘的现状,并提出可能的未来研究方向.
一种面向工业边缘计算应用的缓存替换算法
张雷, 李琳, 陈鸿龙, Daniel, Bovensiepen
2021, 58(7):  1533-1543.  doi:10.7544/issn1000-1239.2021.20200672
摘要 ( 145 )   HTML ( 2)   PDF (3724KB) ( 144 )  
相关文章 | 计量指标
工业应用对数据传输的确定性有严格要求,有必要通过合理的缓存策略保障工业边缘网络的实时服务性能保障.首先面向工业边缘计算应用场景阐述了边缘缓存问题模型.然后分析了工业应用中用户请求的动态性特点,结合工业用户请求的特征属性,给出用户请求内容流行度变化的预测方法.在此基础上提出了基于属性特征流行度预测的缓存替换(combing periodic popularity prediction and size caching strategy, PPPS)算法,根据最近周期窗口内主导属性特征的热度预测值,和尺寸参数一起确定缓存内容价值.实验结果表明:与MPC(most-popular content)、贪婪双尺寸(greedy dual size, GDS)、最近最久未使用(least recently used, LRU)、最近最少访问频次(least frequently used, LFU)、先进先出(first in first out, FIFO)这5种经典算法相比,提出的PPPS算法在缓存命中率和平均延迟2种性能指标下,在不同的用户请求模型、内容大小分布、内容种类参数下均取得最优性能,有效提升了边缘缓存的命中率,提高了缓存利用效率,降低了用户请求内容的延迟.
网络技术
OpenFlow交换机流表溢出缓解技术研究综述
谢升旭, 邢长友, 张国敏, 宋丽华, 胡谷雨
2021, 58(7):  1544-1562.  doi:10.7544/issn1000-1239.2021.20200480
摘要 ( 347 )   HTML ( 13)   PDF (5153KB) ( 255 )  
相关文章 | 计量指标
软件定义网络的转发控制分离、集中控制、开放接口等特性使网络变得灵活可控,其架构得到了充分的发展.由于与各种云化业务的良好结合,软件定义网络(software defined networking, SDN)在近些年来得到了大量的商业部署.在基于OpenFlow的SDN架构中,为了实现流表项的快速查找、掩码匹配等目标,商业部署的硬件交换机大多使用三态内容寻址存储器(ternary content addressable memory, TCAM)来存储控制器下发的流表项.但受限于TCAM的容量和价格,目前商用OpenFlow交换机至多能支持存储数万条流表项,导致其存在因突发流和流表攻击等原因而产生流表溢出问题,严重影响了网络性能.因此,如何建立高效的流表溢出缓解机制引起了研究人员的广泛关注.首先对OpenFlow交换机流表溢出问题产生的原因及其影响进行了分析,在此基础上按照流量突发和攻击行为2种情况归纳对比了流表溢出缓解技术的研究现状,总结分析了现有研究存在的问题与不足,并展望了未来的发展方向和面临的挑战.
基于牵引控制的深度强化学习路由策略生成
孙鹏浩, 兰巨龙, 申涓, 胡宇翔
2021, 58(7):  1563-1572.  doi:10.7544/issn1000-1239.2021.20200018
摘要 ( 120 )   HTML ( 5)   PDF (1687KB) ( 99 )  
相关文章 | 计量指标
当前网络规模的高速增长带来网络流量复杂度的日益提高,增加了对流量特征精确建模的难度.近年来业界提出使用深度强化学习技术实现网络路由的智能化生成,一定程度上克服了人工进行流量分析和建模的缺点.然而,目前提出的解决方案普遍存在可扩展性差等问题.对此,提出了一种基于牵引控制理论的深度强化学习路由策略生成技术Hierar-DRL,通过引入牵引控制理论并结合深度强化学习的自动策略搜索能力,提高了智能路由算法可扩展性.仿真实验结果表明:所提方案相比当前最优方案的端到端时延最多降低了28.5%,证明了所提智能路由方案的有效性.