Please wait a minute...
ISSN 1000-1239 CN 11-1777/TP

当期目录

2016年 第53卷 第5期    出版日期:2016-05-01
信息处理
在线社会网络无偏采样技术
王栋,李振宇,谢高岗
2016, 53(5):  949-967.  doi:10.7544/issn1000-1239.2016.20148387
摘要 ( 959 )   HTML ( 1)   PDF (3900KB) ( 781 )  
相关文章 | 计量指标
作为当前流行的内容共享和信息传播的平台,在线社会网络(online social network, OSN)(例如Facebook和Twitter)已经吸引了各个领域研究人员的关注.然而,研究者通常很难获取完整的在线社会网络数据集,取而代之的是通过一个具有代表性样本集来估计完整网络的特性.因此,怎样获得无偏样本集或对网络特性进行无偏估算成为了OSN研究的关键前提.对在线社会网络的无偏采样技术研究现状进行了综述分析.首先在理论上给出了大规模网络无偏采样的充分必要条件,接着从采样原理、采样偏见性和采样效率3方面对目前常用的采样技术进行了对比分析,最后讨论了在线社会网络采样技术的发展趋势.该工作为在线社会网络采样技术的使用及其研究提供了重要的参考价值.
信息安全
移动目标防御技术研究进展
蔡桂林,王宝生,王天佐,罗跃斌,王小峰,崔新武
2016, 53(5):  968-987.  doi:10.7544/issn1000-1239.2016.20150225
摘要 ( 2025 )   HTML ( 18)   PDF (2429KB) ( 1812 )  
相关文章 | 计量指标
易攻难守是当前网络安全面临的核心问题之一.移动目标防御为解决这一问题提供了一种全新思路,其核心思想是通过内部可管理的方式对被保护目标的攻击面实施持续性的动态变换以迷惑攻击者,从而增加攻击者实施成功攻击的代价和复杂度,降低其攻击成功的概率,提高系统弹性和安全性.首先对移动目标防御的基本概念加以介绍,并依据研究内容的不同对已有的研究成果进行分类;然后对每类成果加以描述、分析和总结;最后对当前研究现状进行总结,并对未来研究方向进行了展望.
IP时间隐通道的信息隐藏算法及其性能分析
王昌达,黄磊,刘志锋
2016, 53(5):  988-999.  doi:10.7544/issn1000-1239.2016.20150063
摘要 ( 863 )   HTML ( 1)   PDF (2438KB) ( 701 )  
相关文章 | 计量指标
隐通道(亦称隐蔽信道)是高等级可信系统评估的重要指标,而以时间作为信息传输载体的工作方式决定了IP时间隐通道在包交换网络中几乎不能被根除.目前,利用IP时间隐通道在网络中实施信息的隐蔽传输没有统一的数学模型,对其研究主要还是依靠实验方式.首先根据时间的物理定义,将IP时间隐通道按工作方式的差异分成不同类别;然后以随机过程为工具,建立了基于定长时隙与包间延迟2种IP时间隐通道的信息隐藏算法模型;最后在此基础上,推导出了其带宽和误码率与相关网络环境参数的函数关系,并对可获取的有效隐蔽通信带宽与网络噪声的影响进行了一般性的讨论.实验结果印证了提出的数学模型及其理论分析结果的正确性,由此IP时间隐通道的研究可以从主要依靠实验转化为形式化分析与实验验证相结合.
基于RBAC模型的权限高效管理方法
罗钧,赵传智,汪飞
2016, 53(5):  1000-1008.  doi:10.7544/issn1000-1239.2016.20148288
摘要 ( 924 )   HTML ( 2)   PDF (1620KB) ( 654 )  
相关文章 | 计量指标
针对现有基于角色的访问控制模型(role-based access control,RBAC)服务请求中缺乏关键权限管理办法及其算法的指数级复杂度,设计了一种高效的管理方法.该方法是在简化的系统模型(simplify system model, SSM)上通过建立基于权限的访问控制列表(privilege-based access control list, PBACL)来管理关键权限;通过自定义的角色关系结构体将系统角色横向和纵向划分.该方法针对不同的外部服务请求,通过自定义的角色加法(role plus, RP)可以简单快速地查找出最佳角色集,其复杂度仅为多项式级;能够解决关键权限被赋予多个用户从而导致的安全冲突问题;支持系统模型在“不稳定型”系统中的快速重构.该方法同样适用于多域环境下的访问控制,能够有效地避免多域环境下关键权限多分配的问题,能够快速检测出由于域间映射带来安全冲突问题例如:循环继承冲突和角色互斥约束冲突等.
基于粗糙集的漏洞属性约简及严重性评估
付志耀,高岭,孙骞,李洋,高妮
2016, 53(5):  1009-1017.  doi:10.7544/issn1000-1239.2016.20150065
摘要 ( 799 )   HTML ( 1)   PDF (1171KB) ( 705 )  
相关文章 | 计量指标
计算机漏洞是危害网络安全的重大隐患,可以利用系统配置不当、系统设计缺陷或是软件的bug等对系统攻击.由于产生漏洞有多种因素,使得与漏洞相关的属性有很多,难以客观筛选强关联属性.而且在不依赖专家经验或是先验知识的基础上,确定属性权重的客观标准也是一个困难的问题.提出一种新的漏洞评估方法RAR,首先采用粗糙集理论中改进的可辨识矩阵算法,得到约简的漏洞强关联属性集;进而利用属性综合评价系统理论评估漏洞的严重性;最终获得二元组表示漏洞的定性评估值和定量评估值.实验结果体现该方法避免了主观选择漏洞强关联属性集和依赖专家先验知识,在漏洞属性约简和属性权重的计算上获得了满意的效果,对漏洞的定性分析和定量分析是准确有效的.
人工智能
一种基于信息熵的混合数据属性加权聚类算法
赵兴旺,梁吉业
2016, 53(5):  1018-1028.  doi:10.7544/issn1000-1239.2016.20150131
摘要 ( 1122 )   HTML ( 0)   PDF (1068KB) ( 964 )  
相关文章 | 计量指标
同时兼具数值型和分类型属性的混合数据在实际应用中普通存在,混合数据的聚类分析越来越受到广泛的关注.为解决高维混合数据聚类中属性加权问题,提出了一种基于信息熵的混合数据属性加权聚类算法,以提升模式发现的效果.工作主要包括:首先为了更加准确客观地度量对象与类之间的差异性,设计了针对混合数据的扩展欧氏距离;然后,在信息熵框架下利用类内信息熵和类间信息熵给出了聚类结果中类内抱团性及一个类与其余类分离度的统一度量机制,并基于此给出了一种属性重要性度量方法,进而设计了一种基于信息熵的属性加权混合数据聚类算法.在10个UCI数据集上的实验结果表明,提出的算法在4种聚类评价指标下优于传统的属性未加权聚类算法和已有的属性加权聚类算法,并通过统计显著性检验表明本文提出算法的聚类结果与已有算法聚类结果具有显著差异性.
基于概率和代表点的数据流动态聚类算法
毕安琪,董爱美,王士同
2016, 53(5):  1029-1042.  doi:10.7544/issn1000-1239.2016.20148428
摘要 ( 906 )   HTML ( 0)   PDF (5463KB) ( 630 )  
相关文章 | 计量指标
为了解决数据流动态聚类问题,提出了一种概率化的基于代表点聚类算法.首先,基于概率框架给出了AP(affinity propagation)聚类算法和EEM(enhanced α-expansion move)聚类算法的联合目标函数,提出了概率化的基于代表点聚类算法;其次,根据样本与其代表点之间的概率,提出了基于概率的漂移动态α-expansion数据流聚类算法.该算法使得新数据的代表点尽可能贴近原始数据的代表点,从而提高聚类性能;另一方面,考虑到原始数据与新数据的相似性,该算法能够处理2种漂移过程中的动态聚类问题:1)新数据与原始数据分享部分数据,其余数据与原始数据相似;2)没有相同的数据,新数据与原始数据有相似关系.在人工合成数据集D31,Birch3以及真实数据集Forest Covertpye,KDD CUP99的实验结果均显示出了所提之算法能够处理数据流聚类问题,并保证聚类性能稳定.
基于词典优化与空间一致性度量的目标检索
赵永威,周苑,李弼程
2016, 53(5):  1043-1052.  doi:10.7544/issn1000-1239.2016.20150070
摘要 ( 768 )   HTML ( 0)   PDF (4037KB) ( 506 )  
相关文章 | 计量指标
基于视觉词典模型(bag of visual words model, BoVWM)的目标检索存在时间效率低、词典区分性不强的问题,以及由于空间信息的缺失及量化误差等导致的视觉语义分辨力不强的问题.针对这些问题,提出了基于词典优化与空间一致性度量的目标检索方法.首先,该方法引入E\+2LSH(exact Euclidean locality sensitive hashing)过滤图像中的噪声和相似关键点,提高词典生成效率和质量;然后,引入卡方模型(chi-square model, CSM)移除词典中的视觉停用词增强视觉词典的区分性;最后,采用空间一致性度量准则进行目标检索并对初始结果进行K-近邻(K-nearest neighbors, K-NN)重排序.实验结果表明:新方法在一定程度上改善了视觉词典的质量,增强了视觉语义分辨能力,进而有效地提高目标检索性能.
一种基于最大值损失函数的快速偏标记学习算法
周瑜,贺建军,顾宏,张俊星
2016, 53(5):  1053-1062.  doi:10.7544/issn1000-1239.2016.20150267
摘要 ( 953 )   HTML ( 0)   PDF (1800KB) ( 522 )  
相关文章 | 计量指标
在弱监督信息条件下进行学习已成为大数据时代机器学习领域的研究热点,偏标记学习是最近提出的一种重要的弱监督学习框架,主要解决在只知道训练样本的真实标记属于某个候选标记集合的情况下如何进行学习的问题,在很多领域都具有广泛应用.最大值损失函数可以很好地描述偏标记学习中的样本与候选标记间的关系,但是由于建立的模型通常是一个难以求解的非光滑函数,目前还没有建立基于该损失函数的偏标记学习算法.此外,已有的偏标记学习算法都只能处理样本规模比较小的问题,还没看到面向大数据的算法.针对以上2个问题,先利用凝聚函数逼近最大值损失函数中的max(·)将模型的目标函数转换为一个光滑的凹函数,然后利用随机拟牛顿法对其进行求解,最终实现了一种基于最大值损失函数的快速偏标记学习算法.仿真实验结果表明,此算法不仅要比基于均值损失函数的传统算法取得更好的分类精度,运行速度上也远远快于这些算法,处理样本规模达到百万级的问题只需要几分钟.
一种大规模分类数据聚类算法及其并行实现
丁祥武,郭涛,王梅,金冉
2016, 53(5):  1063-1071.  doi:10.7544/issn1000-1239.2016.20148422
摘要 ( 1171 )   HTML ( 1)   PDF (2123KB) ( 774 )  
相关文章 | 计量指标
CLOPE算法在大规模、稀疏、高维的分类数据集的聚类上取得了很好的聚类效果.然而该算法受输入数据的顺序影响,难以获得稳定且全局最优的聚类结果.因此提出一种基于等分划分再排列思想的p-CLOPE算法对这一缺陷进行改进.在p-CLOPE算法的每一轮迭代过程中,对输入数据集等分为p部分再排列生成不同顺序的p!份数据集,对这些数据集分别聚类并选取最优的聚类结果作为下一轮迭代的输入.为了降低上述过程的时间复杂度,提出了一种中间结果复用策略,较大程度地提高了聚类速度.最后,在Hadoop平台上实现了一个包含p-CLOPE相关算法的开源聚类工具.实验表明:p-CLOPE算法比CLOPE算法取得了更优的聚类结果.对蘑菇数据集,当CLOPE算法取得最优聚类结果时,p-CLOPE比CLOPE取得了高35.7%的收益值;在处理大量数据时,并行p-CLOPE比串行p-CLOPE极大地缩短了聚类时间,并在计算资源充足时,取得了接近p!倍的加速比.
软件技术
基于分支相关性分析的不可达路径检测方法
姜淑娟,韩寒,史娇娇,张艳梅,鞠小林,钱俊彦
2016, 53(5):  1072-1085.  doi:10.7544/issn1000-1239.2016.20148031
摘要 ( 846 )   HTML ( 1)   PDF (2855KB) ( 565 )  
相关文章 | 计量指标
软件测试中,不可达路径的存在会导致测试资源浪费,有效地检测程序中的不可达路径有助于节约测试资源、提高测试效率.分支相关性的存在是不可达路径产生的主要起因.因此,确定分支的相关性在不可达路径的检测中占据十分重要的地位.提出了一种利用关联分析和数据流分析确定分支相关性的方法,进而实现不可达路径的自动检测.首先,结合静态分析和动态分析,构建反映程序中各分支判断语句静态依赖关系和动态执行信息的数据集;然后,利用关联分析和数据流分析技术确定分支的相关性;最后,根据分支相关性信息检测不可达路径.基于一组基准程序和开源程序,开展不可达路径检测实验.实验结果表明,该方法能够准确地检测出程序中的不可达路径,可以有效地提高软件测试的效率.
基于求解开销预测的符号执行搜索策略研究
刘经德,陈振邦,王戟
2016, 53(5):  1086-1094.  doi:10.7544/issn1000-1239.2016.20148330
摘要 ( 914 )   HTML ( 1)   PDF (1658KB) ( 547 )  
相关文章 | 计量指标
符号执行中约束求解所占的时间比例非常高.同时,不同复杂度约束的求解时间开销差距悬殊,这一现象在对包含复杂数值计算的程序进行符号执行时尤为明显.在指定时间内求解更多约束有利于覆盖更多语句和探索更多路径.为此,提出了基于求解开销预测的符号执行搜索策略.基于实验总结出了度量约束复杂度的经验公式,并结合约束的历史求解开销来预测当前的求解开销,从而在符号执行过程中优先探索求解开销较小的路径.在KLEE中实现了上述搜索策略,并对GNU科学计算库(GSL)中的12个模块进行了实验.实验结果表明,相比现有搜索策略,提出的搜索策略在保证语句覆盖率的同时,可以探索更多的路径(平均24.34%提高);而且,在相同时间内,可以查找出更多的软件缺陷,同时查找出相同缺陷的时间开销平均降低了44.43%.
元数据存储库系统中违背良格式约束潜在操作的推理
赵晓非,高阳,史颖欢,史忠植
2016, 53(5):  1095-1105.  doi:10.7544/issn1000-1239.2016.20148461
摘要 ( 718 )   HTML ( 0)   PDF (2526KB) ( 409 )  
相关文章 | 计量指标
存储库系统的元数据组织方式呈现出分层、多级并且动态变化的复杂结构;存储库系统标准对确保良格式约束规定得并不充分,上述2个原因使得确保基于元对象设施(meta object facility, MOF)建立的元数据存储库系统的状态不违背良格式约束成为一个令人棘手的问题.提出了一种能够自动推断可能违背良格式约束的潜在操作的方法.首先定义了一组比MOF的构造活动更精确和灵活的MOF内部活动并建立了二者之间的对应关系;接着研究了如何推断可能违背约束条件的内部活动;最后通过比对与这些内部活动相对应的构造活动是否在操作规范中出现,研究了如何推断违背约束条件的潜在操作,该方法可以用于约束检测领域.由于可以剔除许多无关的检测,该方法可以有效地提高良格式约束检测的效率.此外该方法对约束设计领域也有一定的参考价值.
差分隐私下一种精确直方图发布方法
张啸剑,邵超,孟小峰
2016, 53(5):  1106-1117.  doi:10.7544/issn1000-1239.2016.20150304
摘要 ( 1153 )   HTML ( 4)   PDF (3344KB) ( 952 )  
相关文章 | 计量指标
基于分组的差分隐私直方图发布得到了研究者的广泛关注,组均值造成的近似误差与噪音造成的拉普拉斯误差之间的均衡直接制约着直方图发布精度.针对现有基于分组的直方图发布方法难以有效兼顾近似误差与拉普拉斯误差的不足,提出了一种满足差分隐私的精确直方图发布方法DiffHR(differentially private histogram release);通过分析直方图桶计数序列的排序有助于提升发布精度,利用Markov链蒙特卡洛(Markov chain Monte Carlo, MCMC)方法中的Metropolis-Hastings技术与指数机制,提出了一种有效排序方法,通过不断置换2个随机选取的桶以逐渐逼近正确排序;基于抽样排序后的直方图,提出了一种基于懒散分组下界的自适应贪心聚类方法,该方法的时间复杂度为O(n),并且可有效均衡近似误差与拉普拉斯误差.DiffHR,GS,AHP方法在真实数据上的实验结果表明,其发布精度上优于同类算法.
图形图像
矩形域上的参数曲面自由变形算法
张莉,葛先玉,檀结庆
2016, 53(5):  1118-1127.  doi:10.7544/issn1000-1239.2016.20148312
摘要 ( 912 )   HTML ( 3)   PDF (3736KB) ( 600 )  
相关文章 | 计量指标
针对参数曲面的自由变形,构造了矩形域上一类带平台的、分片多项式形式的伸缩函数.新的伸缩函数具备了对称性、单点峰值性、线性峰值性和区域峰值性等良好的性质;且具备了简单的多项式形式,易于构造和操控;由此构造的伸缩因子中的各个参数具备明显的几何意义,特别适用于交互设计.将基于伸缩因子构造的变形矩阵作用于待变形的曲面,可以获得诸如凹凸、剪切、伸缩和改变变形中心等各类变形效果,借助于叠加变形可进一步实现丰富多样的复杂变形效果.该文付出了大量的数值实例,展示了各类变形效果以及伸缩函数中各个不同参数对形状的调控.
基于抗噪声局部二值模式的纹理图像分类
冀中,聂林红
2016, 53(5):  1128-1135.  doi:10.7544/issn1000-1239.2016.20148320
摘要 ( 914 )   HTML ( 5)   PDF (1543KB) ( 767 )  
相关文章 | 计量指标
局部二值模式(local binary pattern, LBP)特征是一种简单有效的纹理特征描述符,但是它的抗噪声能力较差.针对这一问题,提出一种对噪声较为鲁棒的纹理特征表示方法——抗噪声的完整增强局部二值模式(noise-tolerant complete enhanced LBP, CELBP\+{NT}).该特征基于局部二值模式特征,对光照、旋转和噪声均具有较好的鲁棒性.其提取过程如下:1)根据LBP中各模式的结构和出现频率对特征中的模式重新分类,提出增强局部二值模式(enhanced LBP, ELBP)特征;2)添加差值的模值信息与中心像素信息,并根据图像尺寸自适应地调整其中的阈值,提出完整增强局部二值模式(complete ELBP, CELBP)特征;3)进一步将该特征进行多尺度下的表示,从而最终提出具有抗噪声能力的纹理特征——CELBP\+{NT}.通过在常用的纹理数据库上添加不同强度和不同类型噪声的情况进行实验,结果表明:CELBP\+{NT}不仅能够显著提升无噪声纹理图像的分类性能,而且对含有噪声的纹理图像分类也有显著的性能提高.
系统结构
集成众核上快速独立成分分析降维并行算法
方民权,张卫民,周海芳
2016, 53(5):  1136-1146.  doi:10.7544/issn1000-1239.2016.20148080
摘要 ( 802 )   HTML ( 2)   PDF (3270KB) ( 433 )  
相关文章 | 计量指标
高光谱遥感影像快速独立成分分析(fast independent component analysis, FastICA)降维过程包含大规模矩阵计算及大量迭代计算.通过热点分析,面向集成众核(many integrated core, MIC)架构设计了协方差矩阵计算、白化处理和ICA迭代等热点并行方案,提出和实现一种M-FastICA并行降维算法,并构建算法性能模型;基于集成众核研究并行程序优化策略,针对各热点并行方案提出一系列优化策略,特别是创新性地提出一种下三角阵负载均衡方法,并量化测试其优化效果.实验结果显示M-FastICA算法最高可加速42倍,比24核CPU多线程并行快2.2倍;探讨了波段数与并行程序性能的关系;实验数据验证了算法性能模型的准确性.
一种求解地震波方程的高效并行谱元格式
林灯,崔涛,冷伟,张林波
2016, 53(5):  1147-1155.  doi:10.7544/issn1000-1239.2016.20148440
摘要 ( 857 )   HTML ( 0)   PDF (2015KB) ( 719 )  
相关文章 | 计量指标
地震波数值模拟在地震学和地震勘探中扮演着非常重要角色.在已有工作的基础上,提出1种高效并行的地震波PML方程谱元格式.PML被引入地震波方程以吸收外向波进而模拟无界区域.进一步,为了适应复杂地形同时允许时间显式推进,谱元方法被用来离散地震波PML方程.由此得到地震波PML方程谱元格式.在此基础上,阐述了单元刚度矩阵分解性质,并说明了利用单元刚度矩阵分解可以大幅减少刚度矩阵存储量同时显著加速刚度矩阵与向量乘积,进而显著减少格式的计算量和存储量.此外,算法复杂性分析表明格式无论在计算量上还是在存储量上都优于几种已知的1阶地震波PML方程谱元格式.结合并行技术,给出了高效并行的地震波PML方程谱元格式.数值实验验证了格式的正确性、良好的强弱并行可扩展性以及对复杂地形的适应性.
基于MRT-LBM方法的大规模可扩展并行计算研究
刘智翔,方勇,宋安平,徐磊,王晓伟,周丽萍,张武
2016, 53(5):  1156-1165.  doi:10.7544/issn1000-1239.2016.20148441
摘要 ( 1213 )   HTML ( 4)   PDF (3317KB) ( 526 )  
相关文章 | 计量指标
在大规模三维复杂流动的数值模拟中,针对具有良好数值稳定性的多弛豫时间模型格子Boltzmann方法(MRT-LBM),并结合大涡模拟湍流模型和曲面边界插值格式,分析了在D3Q19离散速度模型下的网格生成、流场信息初始化和迭代计算3部分的可并行性.采用MPI编程模型,从分布式集群的特点和计算量负载均衡的角度出发,分别提出了适合于大规模分布式集群的网格生成、流场信息初始化和迭代计算的并行算法.该并行算法也能有效适用于D3Q15和D3Q27离散速度模型.通过在国产神威蓝光超级计算机上的测试,分别针对求解问题总体计算规模固定和保持每个计算核中计算量一致的2种情况的并行性能分析,验证了该并行算法在十万计算核的量级下仍具有良好的加速比和可扩展性.
氧碘化学激光器数值模拟中的多块并行通信算法
郭红,李艳,安恒斌
2016, 53(5):  1166-1172.  doi:10.7544/issn1000-1239.2016.20148444
摘要 ( 576 )   HTML ( 0)   PDF (1396KB) ( 420 )  
相关文章 | 计量指标
为实现氧碘化学激光器大规模数值模拟,基于JASMIN(J parallel adaptive structured mesh applications infrastructure)框架设计实现了氧碘化学激光器数值模拟的多块并行通信算法.该算法针对模拟中构造多块结构网格间通信关系困难、氧碘化学激光器数值模拟填充物理边界复杂以及网格块内块间通信调度策略不统一等通信问题,实现了块间关系自动识别算法用以自动识别多块结构网格间通信关系,构造了特殊物理边界数据结构帮助实现物理边界的填充,并采用了统一的通信调度策略以降低通信时间.数值结果表明:该算法解决了氧碘化学激光器大规模数值模拟中的通信问题,并很好地模拟了氧碘化学激光器装置,使用简单,可以扩展到上千个处理器核.