Please wait a minute...
ISSN 1000-1239 CN 11-1777/TP

当期目录

2018年 第55卷 第12期    出版日期:2018-12-01
其他应用技术
2018碎片化知识融合与应用专题
郑庆华
2018, 55(12):  2585-2586. 
摘要 ( 576 )   HTML ( 11)   PDF (341KB) ( 358 )  
相关文章 | 计量指标
大数据时代的到来,标志着信息技术已经跨越了数字化与网络化阶段,进入智能化处理阶段。由此引发的一个新的挑战就是知识的碎片化问题,表现为与特定主题相关的知识以文本、图像、视频、音频、图、网页等多模态跨模态的形式分散在多个数据源中,呈现出位置分散、模态多样、结构无序、内容片面、动态依赖的特点,由此造成日趋严重的“学习迷航、认知过载”和“只见树木、不见森林”等问题,成为构建智慧化知识密集型应用的一个瓶颈问题。因此,如何从多源、异质、时变的大数据中分析挖掘碎片化知识并融合成为知识图谱,是提升知识可用性和系统性的基础性关键问题,也是大数据、人工智能、知识自动化等领域面临的共性难题。为此,《计算机研究与发展》推出“碎片化知识融合与应用”专题,介绍在此新领域中的实际案例,交流学术思想和研究成果,促进碎片化知识融合与应用的研究与发展。本期专题得到同行的广泛关注,通过公开征文收到15篇高质量投稿稿件,这些论文围绕不同应用领域阐述了碎片化知识融合与应用的研究成果,展现出大数据挖掘、机器学习、深度学习、知识图谱等方法在破解碎片化知识融合与应用难题方面取得的最新进展和前沿趋势。本专题的审稿严格按照期刊审稿的要求进行,特邀编委先后邀请了二十余位相关领域的专家参与评审,历经初审、复审、终审等阶段,最终遴选出3篇高质量的论文入选本专题。内容涵盖了医疗知识图谱、视觉问答系统等应用,在一定程度上反映了当前国内学者在碎片化知识融合的代表性应用。
综述
知识图谱研究综述及其在医疗领域的应用
侯梦薇,卫荣,陆亮,兰欣,蔡宏伟
2018, 55(12):  2587-2599.  doi:10.7544/issn1000-1239.2018.20180623
摘要 ( 3278 )   HTML ( 101)   PDF (2825KB) ( 1880 )  
相关文章 | 计量指标
随着医疗大数据时代的到来,知识互联受到了广泛的关注.如何从海量的数据中提取有用的医学知识,是医疗大数据分析的关键.知识图谱技术提供了一种从海量文本和图像中抽取结构化知识的手段,知识图谱与大数据技术、深度学习技术相结合,正在成为推动人工智能发展的核心驱动力.知识图谱技术在医疗领域拥有广阔的应用前景,该技术在医疗领域的应用研究将会在解决优质医疗资源供给不足和医疗服务需求持续增加的矛盾中产生重要的作用.目前,针对医学知识图谱的研究还处于探索阶段,现有知识图谱技术在医疗领域普遍存在效率低、限制多、拓展性差等问题.首先针对医疗领域大数据专业性强、结构复杂等特点,对医学知识图谱架构和构建技术进行了全面剖析;其次,分别针对医学知识图谱中知识表示、知识抽取、知识融合和知识推理这4个模块的关键技术和研究进展进行综述,并对这些技术进行实验分析与比较.此外,介绍了医学知识图谱在临床决策支持、医疗智能语义检索、医疗问答等医疗服务中的应用现状.最后对当前研究存在的问题与挑战进行了讨论和分析,并对其发展前景进行了展望.
其他应用技术
基于深度神经网络的图像碎片化信息问答算法
王一蕾,卓一帆,吴英杰,陈铭钦
2018, 55(12):  2600-2610.  doi:10.7544/issn1000-1239.2018.20180606
摘要 ( 1052 )   HTML ( 22)   PDF (3061KB) ( 455 )  
相关文章 | 计量指标
大量结构无序、内容片面的碎片化信息以文本、图像、视频、网页等不同模态的形式,高度分散存储在不同数据源中,现有的研究通过构建视觉问答系统(visual question answering, VQA),实现对多模态碎片化信息的提取、表达和理解.视觉问答任务给定与图像相关的一个问题,推理相应的答案.在视觉问答任务的基本背景下,以设计出完备的图像碎片化信息问答的框架与算法为目标,重点研究包括图像特征提取、问题文本特征提取、多模态特征融合和答案推理的模型与算法.构建深度神经网络模型提取用于表示图像与问题信息的特征,结合注意力机制与变分推断方法关联图像与问题2种模态特征并推理答案.实验结果表明:该模型能够有效提取和理解多模态碎片化信息,并提高视觉问答任务的准确率.
基于群体智慧的簇连接聚类集成算法
张恒山,高宇坤,陈彦萍,王忠民
2018, 55(12):  2611-2619.  doi:10.7544/issn1000-1239.2018.20180575
摘要 ( 718 )   HTML ( 5)   PDF (1962KB) ( 342 )  
相关文章 | 计量指标
利用群体智慧原理,将多个相互独立的聚类算法的结果进行聚合,将显著提高聚类结果的准确性.基于群体智慧的簇连接聚类集成算法,首先使用群体智慧理论的独立性、分散性、多样性原则引导个体聚类结果的生成,然后提出基于连接三元组的聚类集成算法对个体聚类结果进行分组聚合,将分组聚合的结果再次进行聚合得到最终的聚类结果.该算法的优点包括:1)通过簇的分组和权重调整,避免了对基聚类生成的簇进行选择,有利于充分利用已生成簇的信息;2)采用连接三元组算法计算数据之间的相似性,可以充分挖掘数据点之间的关系.对不同数据集的实验研究表明:该算法相对传统的集成聚类算法以及群体智慧与机器学习相结合的集成聚类算法,可以进一步提高集成聚类结果的准确性.
信息安全
基于因果知识网络的攻击场景构建方法
王硕,汤光明,王建华,孙怡峰,寇广
2018, 55(12):  2620-2636.  doi:10.7544/issn1000-1239.2018.20160940
摘要 ( 639 )   HTML ( 1)   PDF (3673KB) ( 280 )  
相关文章 | 计量指标
针对现有因告警缺失及冗余造成的攻击场景构建不准确的问题,提出了基于因果知识网络的攻击场景构建方法.首先依据专家知识定义因果关系,利用真实告警数据挖掘出能够定量刻画因果关系的因果知识,并对其进行显著性检验,以保证因果关系与因果知识的一致性和准确度,进而构成因果知识网络;然后借助因果知识网络,将攻击场景的构建分为初建与重构2步:1)通过告警映射与聚类定性得到初步的攻击场景;2)利用最大后验估计原理对其进行定量推理重构,得到完整的攻击场景.实验结果表明:该方法能利用专家知识和数据挖掘相结合的优势能够提高攻击场景构建的准确度.
面向电子政务网络建设的信任互联管控模型
陈中林,单志广,肖国玉,陈山枝
2018, 55(12):  2637-2650.  doi:10.7544/issn1000-1239.2018.20170773
摘要 ( 386 )   HTML ( 9)   PDF (5936KB) ( 233 )  
相关文章 | 计量指标
电子政务随着国家信息化发展而不断演进,电子政务网络安全成为信息安全的重要研究领域.然而,传统的局域网或互联模式不能适应我国电子政务网络分区分域的管理需求.虽然美国IATF理论在安全架构设计上虽有一定借鉴作用,但不能很好适应于我国电子政务网络特征和安全管理要求.当前,我国电子政务网络呈现出“分层分域的安全防护结构、分级分类的受控访问要求、分级负责的安全管理模式”3个基本特征.通过深入研究分析我国电子政务网络的现状和特征,提出了我国电子政务网络安全的信任互联管控(TIC)模型.分别阐述了电子政务网络安全TIC模型的3种具体设计:对等互联模型、层级互联模型和混合互联模型,并对跨域信任传递、域间安全监管和全程策略管控等关键技术进行了设计.最后,采用层次分析法(analytic hierarchy process, AHP)对TIC模型进行了评估.评估结果表明:在复杂的电子政务网络中,TIC模型可以适合于电子政务网络安全的架构设计,其关键技术能够为建立电子政务网络的安全体系及相关产品研制提供重要的参考借鉴.
簇间非对称群组密钥协商协议
张启坤,甘勇,王锐芳,郑家民,谭毓安
2018, 55(12):  2651-2663.  doi:10.7544/issn1000-1239.2018.20170651
摘要 ( 476 )   HTML ( 1)   PDF (3038KB) ( 242 )  
相关文章 | 计量指标
无线传感器网络中传感器节点资源受限,传感器节点的通信能力及范围限制了其协同操作的规模,该环境下的群组密钥协商往往以簇为单元,群组之间的安全信息交换也限制于簇内通信.针对传感器通信能力及计算能力的限制,提出一种簇间轻量级非对称群组密钥协商协议(inter-cluster lightweight asymmetric group key agreement, CL-AGKG),为簇间传感器节点间建立一条安全高效的群组通信信道.该协议首先建立簇头间的联盟共享密钥,以簇头为桥接节点,实现不同簇的传感器节点具有相同的群组密钥因子信息,进而实现跨簇非对群组密钥协商.全网节点都可以与群组内部节点共享其秘密信息,实现消息发送者不受群组约束的群组安全通信机制.通过非对称计算将更多传感器节点的计算与通信量迁移到能量较大的簇头节点,确保传感器节点的计算及通信开销轻量级性.并实现密钥自证实性,不需要额外的通信轮数,传感器节点可自证实其计算群组密钥的正确性.经分析并证明:该协议在安全及性能方面具有较高的优势.
基于残差共生概率的隐写图像载体安全性评价
王丽娜,王凯歌,徐一波,唐奔宵,谭选择
2018, 55(12):  2664-2673.  doi:10.7544/issn1000-1239.2018.20170757
摘要 ( 333 )   HTML ( 2)   PDF (4187KB) ( 186 )  
相关文章 | 计量指标
隐写是一种利用图像、视频、文本等常见媒体实现隐蔽传输的技术,其反隐写分析的能力是衡量隐写安全性的重要标准.然而,随着双层校验格码(syndrome tellis codes, STC)的出现,隐写安全性的研究出现了滞缓.目前已有的隐写研究大多是失真代价函数的完善和补充.事实上,隐写安全性受到两大因素的显著影响:1)由隐写操作相关的因素、包括嵌入率、嵌入算法等;2)载体自身的掩蔽效果,即载体安全性.从研究载体的安全性角度出发,分析载体图像残差共生概率特征分布与隐写安全性的关系.利用载体聚类中心距离提出一种隐写载体安全性评价方法.实验证明:通过该方法进行载体筛选可有效增强隐写的反检测能力.图像在不同图像库、隐写方法、嵌入率和隐写分析特征的测试中,抗检测能力相比随机选择载体更高,平均检测错误率提高了3.8~11.8个百分点.
一种采用双层校验的RFID离线匿名群证明协议
周志彬,王国军,刘琴,贾维嘉
2018, 55(12):  2674-2684.  doi:10.7544/issn1000-1239.2018.20170787
摘要 ( 353 )   HTML ( 2)   PDF (1992KB) ( 175 )  
相关文章 | 计量指标
随着越来越多的物品被贴上RFID标签,用于证明若干具有一定关系的物品作为一个群组在同一时间、同一地点出现的群证明技术的应用日趋广泛.在RFID群证明技术中,如何在确保标签信息安全与隐私的同时,生成可靠的群证明,并提升协议的执行效率是当前的研究热点.为确保标签信息的安全与隐私,离线群证明协议往往仅由Verifier完成验证,Reader仅负责群证明信息的收集,降低了协议对于非法群证明的响应速度,为提高系统的群证明效率,抵御拒绝服务(deny of proof, DoP)攻击,提出了一种采用双层校验的RFID离线匿名群证明协议AGPDL,使用椭圆曲线加密,通过二次校验的方法,授权Reader在标签匿名的情况下预先进行群证明的有效性验证,然后再由Verifier完成最终的群证明校验,并确认标签身份.通过安全性分析与性能分析可知:AGPDL能够较好地保护标签信息的安全与隐私,抵御冒充攻击与重放攻击,并且防止Reader提交无效群证明带来的系统开销,具有较好的可扩展性.
人工智能
一种基于信任/不信任的信誉攻击防御策略及稳定性分析
马海燕,梁永全,纪淑娟,李达
2018, 55(12):  2685-2702.  doi:10.7544/issn1000-1239.2018.20170587
摘要 ( 475 )   HTML ( 0)   PDF (3085KB) ( 276 )  
相关文章 | 计量指标
虽然各电子商务企业采用多种信誉评价机制解决消费者对卖方或平台的信任问题,但是信誉评价系统仍然频繁地遭受各种攻击.这些攻击致使卖方的信誉排名和推荐排名被操控,大量诚实消费者被误导而购买了质量较差的商品.有研究者提出综合考虑消费者之间的信任和不信任信息可以使消费者更好地抵御信誉攻击.然而,现有工作存在“信任或不信任信息融合不足”以及“使用一组顾问评价所有卖方”等局限性,因此导致卖方信誉评价的针对性和准确性较差.提出了一种新的防御策略——T&D,它综合考虑了消费者的可信和不可信2个方面.此外,该策略为消费者设置了白名单(存储若干个最信任的评价者)和黑名单(存储若干个最不信任的评价者).利用黑名单净化白名单,诚实消费者可以找到更可信的评价者并依据这些评价者的评分和诚实消费者自身的经历准确评估每个卖方的信誉值.模拟实验结果显示:该策略在评估准确性和稳定性方面明显优于现有防御策略.
基于拓扑稀疏编码预训练CNN的视频语义分析
程晓阳,詹永照,毛启容,詹智财
2018, 55(12):  2703-2714.  doi:10.7544/issn1000-1239.2018.20170579
摘要 ( 364 )   HTML ( 2)   PDF (4450KB) ( 244 )  
相关文章 | 计量指标
视频特征的深度学习已成为视频对象检测、动作识别、视频事件检测等视频语义分析方面的研究热点.视频图像的拓扑信息对描述图像内容的关联关系有着重要的作用,同时综合视频序列特性考虑以有标签的视频进行优化学习,将有利于提高视频特征表达的可鉴别性.基于上述考虑,提出一种基于拓扑稀疏编码预训练CNN的视频特征学习方法并用于视频语义分析,该方法将视频特征学习分为2个阶段:半监督视频图像特征学习和有监督的视频序列特征的优化学习.1)在半监督视频图像特征学习中,构建了一个新的拓扑稀疏编码器用之于预训练各层神经网络参数,使视频图像的特征表达能反映图像的拓扑信息,并在图像特征学习的全连接层以有标签的视频概念类别进行逻辑回归微调网络参数.2)在有监督的视频序列特征的优化学习中,构建了视频特征学习的全连接层,综合有标签的视频序列关键帧特征,建立逻辑回归约束,微调网络参数,以实现类别更具可鉴别的视频特征的优化.在典型的视频数据集上进行了相关方法的视频语义概念检测实验,实验结果表明:所提出的方法对视频特征的表达更具可鉴别性,能有效提高视频语义概念检测率.
面向异构语义映射的D3L转换算法及其性质研究
赵晓非,史忠植,冯志勇
2018, 55(12):  2715-2724.  doi:10.7544/issn1000-1239.2018.20170766
摘要 ( 297 )   HTML ( 0)   PDF (1587KB) ( 201 )  
相关文章 | 计量指标
桥规则为分布式动态描述逻辑(distributed dynamic description logics, D3L)提供了描述语义映射和知识传播的重要机制.现有的研究仅针对包含原子元素的同构桥规则.将研究扩展到了被包含端存在复合元素的异构桥规则的D3L推理问题.定义了分布式知识库的正则性.通过对桥规则进行形式变换并针对不同情形转换为已有的语言机制,提出了将动态描述逻辑DSROIQ作为局部本体语言的D3L知识库转换为单一DSROIQ知识库的算法,接着研究了该转换的性质,证明了该算法可以在多项式时间内终止、算法的目标知识库与原始知识库在可满足性上是等价的,进而证明了在上述桥规则存在的情况下正则D3L知识库的集中式推理具有与单一DSROIQ知识库推理相同的最坏时间复杂度.该算法使得D3L推理可以获得与现有的分布式推理方法相同的最坏时间复杂度并且解决了后者难以处理异构复合桥规则的问题.
一种线性的在线AUC优化方法
朱真峰,翟艳祥,叶阳东
2018, 55(12):  2725-2733.  doi:10.7544/issn1000-1239.2018.20170357
摘要 ( 900 )   HTML ( 1)   PDF (1375KB) ( 290 )  
相关文章 | 计量指标
AUC(area under the ROC curve)优化问题的损失函数由来自不同类别的样本对构成,这使得依赖于损失函数之和的目标函数与训练样本数二次相关,不能直接使用传统在线学习方法求解.当前的在线AUC优化算法聚焦于在求解过程中避免直接计算所有的损失函数,以减小问题的规模,实现在线AUC优化.针对以上问题提出了一种AUC优化的新目标函数,该目标函数仅与训练样本数线性相关;理论分析表明:最小化该目标函数等价于最小化由L2正则化项和最小二乘损失函数组成的AUC优化的目标函数.基于新的目标函数,提出了在线AUC优化的线性方法(linear online AUC maximization, LOAM);根据不同的分类器更新策略,给出2种算法LOAM\-{ILSC}和LOAM\-{Ada}.实验表明:与原有方法相比,LOAM\-{ILSC}算法获得了更优的AUC性能,而对于实时或高维学习任务,LOAM\-{Ada}算法更加高效.
一种基于STR算法的新表压缩方法
董爱迪,李占山,于海鸿
2018, 55(12):  2734-2740.  doi:10.7544/issn1000-1239.2018.20170529
摘要 ( 465 )   HTML ( 1)   PDF (1317KB) ( 180 )  
相关文章 | 计量指标
约束传播是约束编程的关键方法,近些年来,一些约束传播算法中频繁用到简单表缩减(simple tabular reduction, STR)算法来降低约束表的空间消耗,同时提高广义弧相容(generalised arc consistent, GAC)算法的运行速度.短支持方法是在约束传播算法中使用最广泛的一种表压缩方式,但当约束表压缩率较低时,短支持方法提高运行速度效果不明显.因此提出一种压缩约束表的新算法STRO(simple tabular reduction optimization),结合短支持压缩和位操作,在提高STR算法的运行速度的同时压缩表空间效果更好.实验结果表明:在约束表的平均大小不是特别小的情况下,STRO与ShortSTR2,STR2算法相比,速度更快、效率更高;与STRbit算法相比,在时间上可以替代STRbit算法,但STRO算法的表压缩率更大、更加节省空间.
图形图像
基于多图像先验知识的噪声水平评估算法
徐少平,曾小霞,唐祎玲,江顺亮
2018, 55(12):  2741-2752.  doi:10.7544/issn1000-1239.2018.20170336
摘要 ( 489 )   HTML ( 2)   PDF (2409KB) ( 206 )  
相关文章 | 计量指标
为解决基于单图像噪声水平评估算法抗干扰能力低和执行效率不高的问题,提出一种基于多图像先验知识的噪声水平评估算法.首先,在具有广泛代表性且未受噪声干扰图像集合上添加已知噪声水平的高斯噪声构建失真样本图像集合,并提取每幅样本图像中的若干统计特征值构成描述他们噪声水平值高低的噪声水平感知特征矢量.然后,利用样本图像上所提取的特征矢量及对其所施加的噪声水平值构成样本库.在评估时,先提取待评价噪声图像的特征矢量并在样本库中检索出与之类似的若干特征矢量及它们所对应的噪声水平值, 之后基于这些样本信息以加权均值法估算待评价图像的噪声水平值.实验数据表明:较现有的噪声水平评估算法,新算法不仅在高、中、低噪声水平下都具有稳定的预测准确度,而且评估速度快.尤其是对于高斯噪声中伴有脉冲或者泊松噪声情况,具有较好的抗干扰能力.
基于多分辨率和自适应分数阶的Active Demons算法
张桂梅,郭黎娟,熊邦书,储珺
2018, 55(12):  2753-2763.  doi:10.7544/issn1000-1239.2018.20170523
摘要 ( 358 )   HTML ( 1)   PDF (3496KB) ( 199 )  
相关文章 | 计量指标
分数阶Active Demons(fractional active demons, FAD)算法是图像非刚性配准的有效方法,并且能解决灰度均匀和弱纹理图像配准精度低,优化易陷入局部极小而导致的配准速度缓慢问题,但是该算法中分数阶最佳阶次的寻找需要通过多次实验人工选取,缺乏阶次自适应性.针对该问题,提出了基于多分辨率和自适应分数阶的Active Demons算法,该算法首先根据图像梯度模值和信息熵,构建了自适应分数阶阶次的数学模型,基于该模型自动计算出分数阶的最佳阶次和微分动态模板;然后将多分辨率策略加入到自适应分数阶Active Demons算法中,进一步提高了图像配准效率.理论分析和实验结果均表明:提出的算法可用于灰度均匀、弱边缘和弱纹理图像的配准,能根据图像的局部特征自适应计算最佳分数阶阶次,并避免了算法陷入局部最优,从而提高了图像配准的精度和效率.
一种视觉信息融合数据手套设计研究
王赋攀,吴亚东,杨文超,杨帆,侯佳鑫,廖竞
2018, 55(12):  2764-2774.  doi:10.7544/issn1000-1239.2018.20170891
摘要 ( 317 )   HTML ( 3)   PDF (3836KB) ( 188 )  
相关文章 | 计量指标
基于数据手套的手势交互是人机交互技术的重要实现方式,手势识别和空间定位效率对虚拟交互任务中的沉浸感和体验感有重要影响.目前主要的数据手套产品的复杂结构导致相应建模及手势识别算法设计复杂度高,难以兼顾成本和效率.面向应用需求,完成了一种融合视觉信息的数据手套应用系统方案设计.首先,在手势识别上,通过将3指弯曲度数据和视觉采集模型相结合的方法,有效简化了手势的建模和匹配过程,实现对特定手势的快速识别.其次,在空间位置定位上,提出了一种高效的基于特征校验的霍夫变换算法:通过摄像头捕获发光球的圆形轮廓以计算其三维空间位置;使用基于直径方程的改进型霍夫梯度算法降低圆形检测识别复杂度;对于连续帧图像,采用了基于可信度的特征校验法则进行快速处理,进一步提高算法整体效率.最后,该方案在沉浸式中学虚拟实验系统中应用,系统运行稳定,具有良好的交互体验.
基于全卷积网络的中小目标检索方法(201909撤稿)
彭天强, 孙晓峰, 栗芳
2018, 55(12):  2775-2784.  doi:10.7544/issn1000-1239.2018.20170581
摘要 ( 486 )   HTML ( 15)  
相关文章 | 计量指标
基于预训练卷积神经网络(convolutional neural networks, CNNs)的图像表示已成为图像检索任务中一种新的方法,但是这种图像表示方法均是对图像的整体特征表示,无法适用于目标仅占被检索图像的部分区域的检索.为了解决该问题,提出一种基于全卷积网络的中小目标检索方法,该方法将预训练全卷积网络应用于目标较小、仅占被检索图像部分区域的检索.1)利用全卷积网络对输入图像大小不受限制的优势,给定被检索图像,经过全卷积网络得到该图像的特征矩阵表示;2)给定查询目标图像,利用全卷积神经网络,得到目标图像的特征表示;3)将目标特征,与被检索图像的特征矩阵的每一个特征进行相似性比对,得到相似值和匹配最优位置.进一步引入多尺度、多比例变换以适用不同大小的实例目标.在标准数据集Oxford5K上的实验表明:该算法的检索性能优于现有算法.另外,在搜集的Logo数据集,该算法得到了不错的检索效果,进一步验证了算法的普适性和有效性.
一种结合时空上下文的在线卷积网络跟踪算法
柳培忠,汪鸿翔,骆炎民,杜永兆
2018, 55(12):  2785-2793.  doi:10.7544/issn1000-1239.2018.20170327
摘要 ( 481 )   HTML ( 3)   PDF (4039KB) ( 260 )  
相关文章 | 计量指标
基于卷积神经网络提取抽象特征缺乏时空信息的问题,结合时空上下文模型作为卷积神经网络的各阶滤波器,提出一种在线卷积神经网络的视觉跟踪算法.首先对初始目标进行归一化处理并提取目标置信图,跟踪过程中结合时空信息更新得到时空上下文模型,第1层使用更新后的模型对输入进行卷积,并对卷积结果进行滑动窗口取片,第2层再使用时空模型分别对取片结果进行卷积,提取目标简单抽象特征,然后叠加简单层的卷积结果得到目标的深层次表达,最后结合粒子滤波跟踪框架实现目标跟踪.实验表明:结合时空上下文模型的在线卷积网络结构提取的深度抽象特征,保留相关时空信息,提高复杂背景下的跟踪效率.
软件技术
基于联合树的隐私高维数据发布方法
张啸剑,陈莉,金凯忠,孟小峰
2018, 55(12):  2794-2809.  doi:10.7544/issn1000-1239.2018.20170756
摘要 ( 454 )   HTML ( 3)   PDF (8175KB) ( 231 )  
相关文章 | 计量指标
基于差分隐私的数据发布已得到研究者的广泛关注.然而,现有的发布方法却不能有效地处理高维数据,其原因在于维度灾难和值域多样会引入极大的噪音值,进而使得发布结果的可用性比较低.基于此,提出一种基于联合树的隐私高维数据发布方法PrivHD(differentially private high dimensional data release),该方法通过指数机制构造Markov网,引入满足差分隐私的高通滤波技术缩减指数机制搜索空间.结合充分三角化操作和顶点消除操作对Markov网分割来获得完全团图,采用最大生成树方法生成满足差分隐私的联合树.利用联合树中各个团后置处理之后的联合分布表合成最终的高维数据.基于真实的高维数据集比较PrivHD算法与PrivBayes(private Bayesian network),JTree(junction tree)算法的精度,实验结果表明:PrivHD算法的k-way查询和SVM(support vector machine)分类精度优于同类算法.