Please wait a minute...
ISSN 1000-1239 CN 11-1777/TP

当期目录

2020年 第57卷 第11期    出版日期:2020-11-01
信息安全
基于多尺度滤波器的空域图像隐写增强算法
吴俊锜, 翟黎明, 王丽娜, 方灿铭, 吴畑
2020, 57(11):  2251-2259.  doi:10.7544/issn1000-1239.2020.20200441
摘要 ( 367 )   HTML ( 9)   PDF (3678KB) ( 358 )  
相关文章 | 计量指标
隐写是一种利用图像、视频、音频等多媒体载体实现隐蔽传输的技术.如何在尽可能减少对载体影响的情况下嵌入尽可能多的信息一直是隐写算法的研究重点.随着双层校验格码(syndrome tellis codes, STC)的引入,隐写算法的嵌入效率能够达到理论上界.因此,隐写算法的设计重心变为了设计用于衡量图像像素嵌入安全性的失真函数.失真函数是自适应隐写算法的核心.对于空域图像隐写而言,失真函数通常是基于图像的复杂性原则,即载体图像中的纹理区域通常具有较低的失真代价,而平坦区域通常具有更高的失真代价.然而,基于图像内容的多样性,这种准则并不能适用于一幅图像中的所有像素点.提出了一种适用于空域隐写算法的隐写增强算法,通过多尺度滤波器对载体图像进行增强,使得在增强不同尺度的纹理区域的同时减少对图像平坦区域的增强.增强后的失真代价遵循了复杂性原则,并解决了失真代价分配不当的问题.实验结果表明:所提出的算法能够适用于现有的空域隐写算法,并且能够提升它们的抗隐写分析检测能力.
基于边缘计算的进化多目标优化图像隐写算法
丁旭阳, 谢盈, 张小松
2020, 57(11):  2260-2270.  doi:10.7544/issn1000-1239.2020.20200437
摘要 ( 360 )   HTML ( 9)   PDF (6484KB) ( 317 )  
相关文章 | 计量指标
边缘计算解决了终端因计算资源有限而不能运行复杂应用的弊端,在实际应用中可以支持计算资源受限的终端实现基于图像隐写的隐蔽通信.提出了一种适用于边缘计算场景的进化多目标优化图像隐写算法,首先将优化隐写不可察觉性和隐写安全性作为目标函数,给出了图像隐写的形式化定义;其次通过多个定向和非定向的高通滤波器对图像进行预处理,得到叠加的滤波残差作为秘密信息嵌入的候选位置;然后利用遗传算法中的基因操作,在候选位置中逐代寻找适应度高的个体以得到进化多目标优化问题的最优解;最后,在最优解对应的像素位置实现秘密信息的嵌入.通过和现有算法的仿真对比分析结果表明:提出的算法能够很好地保持图像质量,具有较好的抵抗隐写分析的能力.
基于失真-扩展代价的JPEG图像可逆数据隐藏
王洋洋, 和红杰, 陈帆, 张善俊
2020, 57(11):  2271-2282.  doi:10.7544/issn1000-1239.2020.20200434
摘要 ( 213 )   HTML ( 8)   PDF (4687KB) ( 170 )  
相关文章 | 计量指标
兼顾含密JPEG图像的文件增量和视觉失真,提出一种基于失真-扩展代价的JPEG图像可逆数据隐藏算法.采用直方图平移实现秘密数据的可逆嵌入,重点研究如何根据嵌入容量自适应选择嵌入频率和图像块,以最小化含密JPEG图像的视觉失真和文件增量.分析讨论了通过模拟计算数据嵌入不同频率的单位文件增量确定频率嵌入顺序、根据图像块零交流系数个数和平滑度确定图像块嵌入顺序的合理性,数据嵌入时优先选取较小单位文件增量的频率和较平滑图像块;并分别定义单位文件增量、单位失真-增长比作为算法文件扩展、视觉质量与文件扩展关系的定量评价指标.实验结果表明:与现有同类算法相比,所提的算法可更好地兼顾含密JPEG图像文件增量和视觉质量,降低含密JPEG图像文件增量,相同嵌入容量下单位文件增量平均值降低0.15~0.25.
基于端信息跳扩混合的文件隐蔽传输策略
侯博文, 郭宏彬, 石乐义
2020, 57(11):  2283-2293.  doi:10.7544/issn1000-1239.2020.20200420
摘要 ( 157 )   HTML ( 7)   PDF (2333KB) ( 101 )  
相关文章 | 计量指标
端信息跳扩混合技术是一种在端到端的网络数据传输中伪随机改变端信息,并利用端信息扩展序列实现高速同步认证的主动防御技术.将端信息跳扩混合技术引入文件隐蔽传输,研究了端信息跳扩混合网络环境下的文件隐蔽传输策略,提出组播时间校正方案,解决了通信过程中的同步问题;提出基于时间传输和基于传输大小传输的2种适用于端信息跳扩混合网络环境文件传输方案,并在文件传输过程中增加数据迁移技术,实现文件的隐蔽传输和完整性传输;设计实现端信息跳扩混合文件隐蔽传输原型系统并进行了有效性、安全性测试,实验结果表明:该文件隐蔽传输策略能够有效满足文件传输完整性和隐蔽性要求.
基于双向循环神经网络的安卓浏览器指纹识别方法
刘奇旭, 刘心宇, 罗成, 王君楠, 陈浪平, 刘嘉熹
2020, 57(11):  2294-2311.  doi:10.7544/issn1000-1239.2020.20200459
摘要 ( 321 )   HTML ( 17)   PDF (3154KB) ( 292 )  
相关文章 | 计量指标
2010年浏览器指纹的概念被提出用于识别用户身份,目前这项技术已趋于成熟并被广泛应用在一些流行的商业网站进行广告投放.然而传统的指纹技术在追踪用户方面问题颇多,无论系统升级、浏览器更新还是篡改程序伪造导致的指纹特征值改变,都会使浏览器指纹发生变化.在对浏览器指纹属性进行研究的基础上,采集了安卓用户的浏览器指纹,提出了一种用于身份识别的监督学习框架RNNBF.RNNBF的鲁棒性分别体现在数据和模型方面,在数据方面构建基于指纹的数据增强技术生成增强数据集,在模型方面采用注意力机制令模型专注于具有不变性的指纹特征.在模型评估方面,RNNBF模型与单层LSTM模型和随机森林模型分别进行比较,当以F1-Score作为评估标准时,RNNBF模型的识别效果优于后两者,证明了RNNBF模型在动态链接指纹上具有卓越的性能.
工业以太网EtherCAT协议形式化安全评估及改进
冯涛, 王帅帅, 龚翔, 方君丽
2020, 57(11):  2312-2327.  doi:10.7544/issn1000-1239.2020.20200399
摘要 ( 181 )   HTML ( 9)   PDF (7721KB) ( 110 )  
相关文章 | 计量指标
EtherCAT协议由于具有较高的实时性和较强的性能而被广泛应用,但是随着工业以太网协议的快速发展和开放化,使得工业控制系统承受着巨大的网络攻击风险.目前有许多对工业以太网协议安全和改进的研究,但是这些研究缺乏对协议的形式化建模与安全评估,只注重协议本身安全功能的实现,有一定的局限性.为了解决工业以太网受到攻击的现状,将当前应用较多的EtherCAT协议作为研究对象,提出了一种基于有色Petri网理论和Dolev-Yao攻击方法的模型检测方法,对协议进行了安全性评估与改进.首先基于Petri网理论和CPN Tools模型工具对协议的安全机制FSoE进行了一致性验证;然后引入了Dolev-Yao攻击模型对协议的原始模型进行安全性评估,发现协议存在着篡改、重放和欺骗3类中间人攻击漏洞;最后针对协议存在的漏洞提出了一种新方案,对原协议加入了秘钥分发中心和Hash函数,再次利用CPN模型检测工具对新方案进行了安全性验证.通过验证可以发现新方案能够有效防止3类中间人攻击,提高协议的安全性.
MSRD: 多模态网络谣言检测方法
刘金硕, 冯阔, Jeff Z. Pan, 邓娟, 王丽娜
2020, 57(11):  2328-2336.  doi:10.7544/issn1000-1239.2020.20200413
摘要 ( 382 )   HTML ( 22)   PDF (2007KB) ( 436 )  
相关文章 | 计量指标
图像和文本相结合的多模态网络谣言由于更具迷惑性和煽动性,对国家安全和社会稳定的危害性更严重.目前网络谣言检测工作充分考虑了谣言中配文的文本内容而忽略了图像内容以及图像中的内嵌文本内容,因此,提出了一种基于深度神经网络针对图像、图像内嵌文本以及配文文本内容的多模态网络谣言检测方法MSRD.该方法使用VGG-19网络提取图像内容特征,使用DenseNet提取图像内嵌文本内容,使用LSTM网络提取文本内容特征,与图像特征串接后,通过完全连接层获取图像与文本共享表示的均值与方差向量,借助从高斯分布中采样的随机变量以形成重新参数化的多模态特征并作为谣言检测器的输入进行谣言检测.实验表明:该方法在Twitter和微博两大数据集上达到了68.5%和79.4%的准确率.
移动群智感知中融合数据的隐私保护方法
王涛春, 金鑫, 吕成梅, 陈付龙, 赵传信
2020, 57(11):  2337-2347.  doi:10.7544/issn1000-1239.2020.20190579
摘要 ( 307 )   HTML ( 11)   PDF (1515KB) ( 184 )  
相关文章 | 计量指标
随着移动智能设备的普及,群智感知得到广泛应用,也面临严重的隐私泄露问题.现有隐私保护方案一般假设第三方服务平台是可信的,而这种假设对应用场景要求较高.基于此,提出了群智感知中一种新的数据融合隐私保护算法ECPPDA(privacy preservation data aggregation algorithm based on elliptic curve cryptography).服务器将参与者随机划分成g个簇,并形成簇公钥.簇内节点通过簇公钥加密数据并融合得到簇融合结果数据.服务器通过与簇内成员协同合作得到融合结果原文,由于服务器接收到的是融合密文且密文解密需要簇内所有节点共同协作,因此服务器不能得到单个参与者的数据.此外,通过服务器对簇公钥的更新,能够方便参与者动态加入或失效.实验结果显示ECPPDA具有高安全性、低消耗、低通信、高精度的特点.
图形图像
自动图像标注技术综述
马艳春, 刘永坚, 解庆, 熊盛武, 唐伶俐
2020, 57(11):  2348-2374.  doi:10.7544/issn1000-1239.2020.20190793
摘要 ( 858 )   HTML ( 25)   PDF (1358KB) ( 611 )  
相关文章 | 计量指标
图像自动标注技术是减少图像数据与内容之间“语义鸿沟”的其中一种最有效途径,对于帮助人类理解图像内容,从海量图像数据中检索感兴趣的信息具有重要现实意义.通过研究近20年公开发表的图像标注文献,总结了图像标注模型的一般性框架;并通过该框架结合各种具体工作,分析出在图像标注研究过程中需要解决的一般性问题;将各种图像标注模型所采用的主要方法归为9种类型,分别为相关模型、隐Markov模型、主题模型、矩阵分解模型、近邻模型、基于支持向量机的模型、图模型、典型相关分析模型以及深度学习模型,并对每种类型的图像标注模型,按照“基本原理介绍—具体模型差异—模型总结”3个层面进行了研究与分析.此外,总结了图像标注模型常用的一些数据集、评测指标,对一些比较著名的标注模型的性能进行了比较,并据此对各种类型的标注模型做了优缺点分析.最后,提出了图像标注领域一些开放式问题和研究方向.
面向大规模图像检索的深度强相关散列学习方法
贺周雨, 冯旭鹏, 刘利军, 黄青松
2020, 57(11):  2375-2388.  doi:10.7544/issn1000-1239.2020.20190498
摘要 ( 243 )   HTML ( 9)   PDF (4666KB) ( 150 )  
相关文章 | 计量指标
近年来,随着图像数据量的爆炸式增长,散列方法与深度学习相结合的方法在图像检索领域表现出优异的性能.主流的深度监督散列方法大多采用“成对”策略,利用标签信息生成一个相似矩阵约束散列编码.这类方法的计算开销大,不适用于大规模的图像检索.为此,提出了一种一元深度监督散列学习方法——深度强相关散列学习方法,为卷积神经网络添加了一个散列层以得到散列码,通过计算低维散列码之间的汉明距离完成快速图像检索.特别地,为了学习到的散列码更具有区别性,提出了强相关损失函数约束散列码的生成.强相关损失函数通过改变模型对权重矩阵的敏感度调节特征之间的距离,尽可能地增大特征类间距离、缩小类内距离.该方法能够实现快速、准确的大规模图像检索,并且可以广泛地使用在多种卷积神经网络中.在CIFAR-10, NUS-WIDE, SVHN这3个大规模公开数据集中进行了大量实验,结果表明该方法的图像检索性能优于目前主流方法.
几何展开与折叠算法及应用综述
孙晓鹏, 刘诗涵, 王振燕, 李娇娇
2020, 57(11):  2389-2403.  doi:10.7544/issn1000-1239.2020.20200126
摘要 ( 330 )   HTML ( 10)   PDF (1589KB) ( 287 )  
相关文章 | 计量指标
展开与折叠是计算机图形学中的重要研究问题,已经广泛应用于工业制造、建筑设计、医学治疗和航空航天等方面.通过回顾近年来图形学中展开与折叠方面的主要研究问题,总结整理它们的典型算法.首先介绍展开与折叠的基本概念,并从机器人设计、计算机动画、深度学习和其他4个领域介绍它们的应用情况.之后,按照展开程度分类,从完全展开和近似展开2方面总结展开问题的研究进展和典型算法思想;按照折叠形式不同,将折叠问题分为Origami折叠和Kirigami折叠2类,分别论述其研究进展并总结算法思路.之后,整理展开与折叠的评价指标,总结各类展开与折叠算法的特点,并分析比较它们的优势与不足.最后,总结并提出展开与折叠的4个发展趋势.
系统结构
SBS: 基于固态盘内部并行性的R-树高效查询算法
陈玉标, 李建中, 李英姝
2020, 57(11):  2404-2418.  doi:10.7544/issn1000-1239.2020.20190564
摘要 ( 169 )   HTML ( 3)   PDF (1465KB) ( 92 )  
相关文章 | 计量指标
由于闪存固态盘逐渐取代机械硬盘成为主流存储,与此同时,随着闪存固态盘技术的进步,越来越多的存储芯片和硬件资源被植入,使得它拥有丰富的内部并行性,而传统的外存算法和数据结构优化工作往往没有考虑固态盘的内部并行性. 范围查询作为R-树索引的基础操作,它的性能对于地理信息系统非常重要. 但是由于R-树索引父子结点之间加载的依赖问题,使得它很难能够有效地去利用固态盘内部并行性去加速. 因此,为了克服该困难,提出一种基于栈结构的范围查询算法SBS(stack batch search). 它能在有效地利用固态盘内部并行性的同时,最多只需要O(B log N)内存空间. 最后,通过真实数据实验来验证SBS算法的性能. 实验结果表明,SBS在可接受的内存消耗情况下,在2款不同的固态盘上,范围查询的性能加速比可达3.4和4.5.
纠删码存储系统数据更新方法研究综述
张耀, 储佳佳, 翁楚良
2020, 57(11):  2419-2431.  doi:10.7544/issn1000-1239.2020.20190675
摘要 ( 300 )   HTML ( 14)   PDF (1644KB) ( 224 )  
相关文章 | 计量指标
在分布式存储系统中,节点故障已成为一种常态,为了保证数据的高可用性,系统通常采用数据冗余的方式.目前主要有2种冗余机制:一种是多副本,另一种是纠删码.伴随着数据量的与日俱增,多副本机制带来的效益越来越低,人们逐渐将目光转向存储效率更高的纠删码.但是纠删码本身的复杂规则导致使用纠删码的分布式存储系统的读、写、更新操作的开销相比于多副本较大.所以纠删码通常被用于冷数据或者温数据的存储,热数据这种需要频繁访问更新的场景仍然用多副本机制存储.专注于纠删码存储系统内的数据更新,从硬盘I/O、网络传输、系统优化3方面综述了目前纠删码更新相关的优化工作,对目前具有代表性的编码方案的更新性能做了对比分析,最后展望了未来研究趋势.通过分析发现目前的纠删码更新方案仍然无法获得和多副本相近的更新性能.如何在纠删码更新规则和系统架构角度优化纠删码存储系统,使其能够替换掉热数据场景下的多副本机制,降低热数据存储开销仍是未来值得深入研究的问题.
面向键值存储的日志结构合并树优化技术
吴尚宇, 谢婧雯, 王毅
2020, 57(11):  2432-2441.  doi:10.7544/issn1000-1239.2020.20190551
摘要 ( 278 )   HTML ( 5)   PDF (1808KB) ( 223 )  
相关文章 | 计量指标
日志结构合并树(log-structured merge tree, LSM-Tree)是一种针对写优化的数据结构,广泛应用于当代主流键值存储系统之中,用于处理当今世界海量多样化的数据.LSM-Tree通过批量处理的方式将随机写请求转换为顺序写请求,以保持极高的写效率.但LSM-Tree仍存在2个不足:一是数据的流动方向是单向的且固定不变.存储在LSM-Tree底部的数据将被一直保留底部,直到它们成为旧数据被压缩操作删除.访问这些数据将使读放大问题变得更加严重.二是LSM-Tree中的数据分布并未考虑访问频率的影响,这将导致访问延迟不平衡的问题.访问高频的低层数据将产生更高的访问延迟.提出了一种基于访问频率分布的上浮式键值存储结构(floating key-value, FloatKV).FloatKV首先在内存中提出了一种新的数据存储结构(LRU and FIFO, LRFO),其次在外存中设计了一种基于访问频率分布的上浮式键值存储策略.FloatKV记录外存中数据的访问频率,并根据访问频率来调整数据的存储位置,以减少访问延迟.为了验证FloatKV的可行性以及性能,使用标准数据库性能测试工具YSCB(yahoo! cloud serving benchmark)来进行评估,并将FloatKV与当前主流的技术进行比较.实验结果表明,FloatKV能够显著地提高读效率,并有效地减少了读放大问题.
信息处理
基于校园行为信息网络的生活习惯相似学生搜索
王新澳, 段磊, 崔丁山, 卢莉, 顿毅杰, 秦蕊琦
2020, 57(11):  2442-2455.  doi:10.7544/issn1000-1239.2020.20190649
摘要 ( 226 )   HTML ( 5)   PDF (2269KB) ( 172 )  
相关文章 | 计量指标
利用大数据分析、深度学习等新一代信息技术,通过掌握学生的兴趣、爱好、生活习惯等,提高人才培养质量已成为当前重要的科学研究问题.寻找具有相似生活习惯的学生对于心理状况及学业状况预警都有着积极的作用.已有的相似生活习惯学生搜索算法无法解释学生之间相似的原因,并且无法拓展性地融合更多数据源.为此提出了基于校园行为信息网络的生活习惯相似学生搜索算法SCALE(similar campus lifestyle miner).SCALE算法通过带约束的元路径计算相似度.SCALE不仅能保留原始数据中的相似语义,同时可以在此基础上拓展性地融合更多数据源.进一步对算法各部分解耦,为SCALE算法设计了并行化策略以提高执行效率.通过真实校园环境数据集上的实验,验证了SCALE算法的有效性和执行效率.
基于类卷积交互式注意力机制的属性抽取研究
尉桢楷, 程梦, 周夏冰, 李志峰, 邹博伟, 洪宇, 姚建民
2020, 57(11):  2456-2466.  doi:10.7544/issn1000-1239.2020.20190748
摘要 ( 319 )   HTML ( 8)   PDF (2361KB) ( 277 )  
相关文章 | 计量指标
在基于深度学习的属性抽取研究中,注意力机制是常用的模型之一.目前,面向属性抽取的注意力机制存在2个局限性:其一,注意力机制多为自注意力机制,这是一种全局式注意力机制,其将不相关的噪音(距离目标词较远且与之不相关的词)带入注意力向量的计算;其二,目前的注意力机制多为单层注意力机制,注意力一次建模后缺少交互性.针对这2个局限性,提出一种面向属性抽取的类卷积交互式注意力机制.该方法先将目标句输入到双向循环神经网络,借以获得每个词的隐式表达,再经过类卷积交互式注意力机制进行表示学习.类卷积交互式注意力机制分为2层注意力计算:第1层按序(从句首到句末)通过滑动窗口控制每个词的上下文宽度,并计算每个词的注意力分布向量;第2层将第1层的注意力分布向量与所有单词进行交互注意力计算,将得到的注意力向量与第1层的注意力向量拼接,最终输入到条件随机场进行属性标记.在2014—2016语义评估(semantic evaluation, SemEval)官方数据集上验证了模型的有效性.相比于基线模型,在4个数据集上的F1值分别提高了2.21,1.35,2.22,2.21个百分点.
融合常用语的大规模疾病术语图谱构建
张晨童, 张佳影, 张知行, 阮彤, 何萍, 葛小玲
2020, 57(11):  2467-2477.  doi:10.7544/issn1000-1239.2020.20190747
摘要 ( 272 )   HTML ( 5)   PDF (3751KB) ( 206 )  
相关文章 | 计量指标
国家卫计委要求医疗机构使用国际疾病分类(international classification of diseases, ICD)编码,然而由于临床疾病描述存在大量的常用词,导致电子病历中录入的诊断名称与ICD编码直接映射匹配率低.基于区域健康平台上的真实诊断数据,构建了融合常用语的疾病术语图谱.具体来说,在基于疾病构成成分的规则算法基础上,提出了基于数据增强的BERT(bidirectional encoder representation from transformers)上下位关系识别算法,将5万多个诊断常用语和ICD10(international classification of diseases 10th revision,Chinese version)中的疾病进行同义关系和上下位关系识别,进一步融合了ICD11(international classification of diseases 11th revision,Chinese version)的层次结构,此外,还提出了基于疾病-科室关联图谱的任务分配方法以进行人工校验,最终94 478个疾病实体形成了包含1 460条同义关系、46 508条上下位关系的大规模疾病术语图谱.评估实验表明,基于疾病术语图谱,对临床诊断数据的覆盖率比基于ICD10的直接映射编码的覆盖率提升了75.31%,另外,利用疾病术语图谱自动进行编码疾病相比于医生人工编码会缩短约59.75%的编码时间,且正确率达到85%.