Please wait a minute...
ISSN 1000-1239 CN 11-1777/TP

当期目录

2010年 第47卷 第10期    出版日期:2010-10-15
论文
域间授权互操作研究综述
王雅哲 冯登国
2010, 47(10):  1673-1689. 
摘要 ( 428 )   HTML ( 0)   PDF (4071KB) ( 539 )  
相关文章 | 计量指标
分布式系统安全是多域协作场景下的重要研究领域,近年来得到大力发展.在大多数实际的多域协作过程中,无论开发者还是管理者都不想完全摈弃已有的权限管理和访问控制体系,希望在授权开放性和系统改造代价间保持平衡和兼顾.域间授权互操作正是在这一背景下逐渐成为该领域具有代表性的研究方法.着力对域间互操作理论和技术的整体进展与演化进行细致梳理与剖析,从多维视角下对其进行归类比较,例如:根据域间协作架构划分,可分为松耦合协作模式和联邦式协作模式;根据安全检测实施方式划分,可分为基于协调中心的检测模式和无协调中心模式;根据互操作建模方式划分,主要包括基于管理行为的预前建立模式和基于请求驱动的实时建立模式;根据建立互操作采用的辅助技术划分,主要涉及基于信任、基于风险和基于语义等;根据策略整合所处的层面划分,可分为面向授权管理的策略集成和面向资源聚合的策略集成.针对若干典型方案,阐述其基本原理、适用场景,对技术特点和局限性给出较为深入的对比分析,在大量现有研究工作的基础上综述授权互操作发展的基本特点,归结展望了今后可能的研究趋势.
发布/订购系统中基于重复属性判定的事件匹配算法研究
刘国 周忠 吴威
2010, 47(10):  1690-1699. 
摘要 ( 389 )   HTML ( 2)   PDF (999KB) ( 454 )  
相关文章 | 计量指标
在基于Map的发布/订购系统中,典型的事件匹配算法大都针对用户发布的每个事件寻找相匹配的订购,由于同一属性在不同事件中重复出现是一种普遍现象,当用户发布的事件数量较大时,相同的属性会与订购中的约束条件重复匹配,事件匹配存在着冗余.针对这种重复匹配问题,提出一种基于重复属性判定的事件匹配算法,该算法通过判定属性的重复关系,合并事件集合去除重复属性,并将订购集合组织为约束的多级索引结构以减少不必要的匹配,从而提高算法的匹配效率和可维护性.实验表明,当事件数量和订购数量较大时,该算法与同类算法相比具有更高的匹配效率.
PCRTT离线码率平滑的自适应分段方法
王子磊 许书彬 奚宏生
2010, 47(10):  1700-1708. 
摘要 ( 470 )   HTML ( 2)   PDF (2256KB) ( 349 )  
相关文章 | 计量指标
码率平滑通过降低发送码流的突发性成为提高网络带宽利用率的一种有效手段.为提高平滑性能和降低资源需求,利用原始码流在平均码率线上的波动形式,提出了一种对视频数据进行自适应分段的码率平滑算法t-PCRTT.该算法在相同分段数下能够有效降低客户端缓冲区需求,分析函数上的平滑结果显示它的缓冲区需求不足PCRTT算法的50%.在采用MPEG4和H.264两类编码影片的性能评估实验中,t-PCRTT的最小缓冲区需求明显降低,在不同缓冲区下的码率变化次数接近于最优值,能够更好地支持VCR-Window模式下的VCR操作.
一种基于支撑向量回归与博弈论的移动位置跟踪算法
曾凡仔 梁振华 李仁发
2010, 47(10):  1709-1713. 
摘要 ( 417 )   HTML ( 1)   PDF (1013KB) ( 442 )  
相关文章 | 计量指标
非视距传输造成测距严重有偏,从而使得位置估计误差显著增加.将定位问题嵌入到机器学习框架,并通过引入博弈理论对位置估计进行平滑来实现移动位置跟踪.由于将观测作为射频特征,而不是实际距离的度量,因此能够大大减轻非视距传输对位置估计性能的影响,同时在平滑过程中,将噪声建模为估计子的对手,通过微分博弈理论来实现平滑,并与卡尔曼滤波平滑进行了比较.仿真实验表明,方法具有更好的位置估计性能,特别是在非视距环境下其效果更为明显.
基于攻防随机博弈模型的防御策略选取研究
姜伟, 方滨兴, 田志宏, 张宏莉,
2010, 47(10):  1714-1723. 
摘要 ( 615 )   HTML ( 2)   PDF (1501KB) ( 897 )  
相关文章 | 计量指标
由于网络安全攻防双方的目标对立性和策略依存性,使得最优防御策略选取问题十分复杂.形式化定义了网络安全防御策略选取问题.提出了一种刻画网络安全攻防矛盾,解决防御策略选取问题的攻防随机博弈模型.该模型是矩阵型攻防博弈模型和Markov决策过程的扩展,是多人、多状态的动态攻防推演模型.将攻击者在网络实体上的特权状态作为攻防随机博弈模型的元素,建模网络攻防状态的动态变化,并预测攻击行为和决策最优防御策略.给出了基于上述模型的防御策略选取算法.用一个网络实例分析了该模型和算法在攻击策略预测和防御策略决策方面的有效性.
入侵进程的层次化在线风险评估
穆成坡, 黄厚宽, 田盛丰,
2010, 47(10):  1724-1732. 
摘要 ( 453 )   HTML ( 0)   PDF (2702KB) ( 373 )  
相关文章 | 计量指标
提出了从服务、主机和网络自下到上的层次化在线风险评估模型,实时地评估一个正在发生的入侵进程在这3个层面所产生的风险情况.在服务层面,使用了证据理论来融合报警线程中多个能够反映风险变化情况的变量来计算风险指数,通过风险指数反映入侵风险的客观情况,同时结合主观安全意识所反映出的目标风险分布,综合评估目标的风险状态.在主机层面提出了基于木桶原理的风险评估方法,在网络层面提出了安全依赖网络概念,利用了改进的风险传播算法,完成了网络层面的风险评估.提出的评估算法将报警验证、聚合与关联,以及报警置信度学习这些报警处理过程同风险评估紧密结合起来,很好地处理了风险评估中主观性、模糊性和不确定性等问题.实验表明对各种入侵进程进行的层次化在线风险评估结果与攻击实际特点相符合,为响应决策提供了有利的支持.
权吸引子传播算法及其在文本聚类中的应用
管仁初, 裴志利, 时小虎, 杨晨, 梁艳春,
2010, 47(10):  1733-1740. 
摘要 ( 672 )   HTML ( 2)   PDF (1170KB) ( 915 )  
相关文章 | 计量指标
吸引子传播算法(affinity propagation, AP)是一种新的高效聚类算法.由于AP算法简单易用,它已被广泛应用到数据挖掘的各个领域.在AP算法中,相似性度量具有重要作用.另一方面,传统的文本挖掘常采用向量空间模型和满足欧氏空间的相似性度量.这种方法的优点是简单且易于实现,但随着数据规模的膨胀,向量空间将变得高维稀疏并将导致计算复杂度快速增长.为解决此问题,给出了相似特征集、排斥特征集和仲裁特征集的概念,在这些概念的基础上提出了一种能够包含文本结构信息的非欧空间相似性度量方法.并提出了一种新的聚类算法,称之为权吸引子传播算法(weight affinity propagation, WAP).为检验提出算法的聚类效果,选用标准数据集Reuters-21578进行了验证.实验结果表明WAP明显优于k-means聚类算法、具备非线性特征的SOFM聚类算法和采用经典相似性度量的吸引子传播算法等3种经典聚类算法.
基于元性质的数量型属性值自动提取系统的实现
卢汉, 曹存根, 王 石,
2010, 47(10):  1741-1748. 
摘要 ( 381 )   HTML ( 0)   PDF (1191KB) ( 674 )  
相关文章 | 计量指标
实体属性值抽取是信息抽取的重要组成部分.针对数量型属性类型多样以及取值易变的问题,设计实现了一种基于元性质的数量型属性值自动抽取系统.对系统的结构、功能框架以及相关核心技术,包括提取文本的选择、候选值的提取及评估、结果的自动验证等进行了详细讨论.通过对百度百科的五大类9个子类实体数量型属性值的抽取,平均准确率和召回率分别达到71%和89%,高于基于简单搜索的方法和传统的基于词汇-句模的方法.该方法适用于开放领域的数量型属性值获取,易于获取单值属性的精确取值.
基于新的距离度量的K-Modes聚类算法
梁吉业, 白 亮, 曹付元,
2010, 47(10):  1749-1755. 
摘要 ( 932 )   HTML ( 2)   PDF (678KB) ( 557 )  
相关文章 | 计量指标
传统的K-Modes聚类算法采用简单的0-1匹配差异方法来计算同一分类属性下两个属性值之间的距离, 没有充分考虑其相似性. 对此, 基于粗糙集理论, 提出了一种新的距离度量. 该距离度量在度量同一分类属性下两个属性值之间的差异时, 克服了简单0-1匹配差异法的不足, 既考虑了它们本身的异同, 又考虑了其他相关分类属性对它们的区分性. 并将提出的距离度量应用于传统K-Modes聚类算法中. 通过与基于其他距离度量的K-Modes聚类算法进行实验比较, 结果表明新的距离度量是更加有效的.
一种约简动作变元的命题规划编码方式
吕帅 刘磊 江鸿 史晶晶
2010, 47(10):  1756-1763. 
摘要 ( 336 )   HTML ( 0)   PDF (949KB) ( 427 )  
相关文章 | 计量指标
基于动作的编码方式是2006年国际规划竞赛中著名的最优规划系统SATPLAN2006采用的一种基于约简状态变元的命题规划编码方式.依据基于动作的编码方式,提出一种基于约简动作变元的自动命题规划编码方式:基于命题的编码方式.首先分析构造新编码方式的理论依据,提出基于命题的编码方式的编码组成,证明其有效性,并描述某些公理的具体实现细节,最后分析其与已有几种编码方式的不同之处.在SATPLAN2006中实现了基于命题的编码方式,利用国际规划竞赛选用的标准测试问题予以测试,并分析其与基于动作的编码方式等两种极端编码方式的求解特性.实验结果表明:对于顺序规划问题域,基于命题的编码方式更有效,而对于并发规划问题域,基于动作的编码方式更有效.
基于自适应多阶Markov模型的位置预测
吕明琪, 陈岭, 陈根才,
2010, 47(10):  1764-1770. 
摘要 ( 601 )   HTML ( 0)   PDF (1357KB) ( 611 )  
相关文章 | 计量指标
准确预测用户的地理位置可以有效地改善基于位置服务的质量.针对标准Markov模型预测能力不足,以及多阶Markov模型阶数难以确定的问题,提出了一种基于自适应多阶Markov模型的位置预测方法.该方法采用一种基于规则图形的方式对原始位置信息进行抽象化处理,并使用一种基于训练数据的启发式方式自动确定用于预测的模型阶数.最后,基于真实的位置数据,对自适应多阶Markov模型的预测性能进行了评测.结果表明自适应多阶Markov模型的预测精度和预测长度始终高于多阶Markov模型,平均预测精度提高将近20%,平均预测长度提高将近10个单位区域,且不易受训练数据质量影响.
综述
GDG:一种基于逆支配点集的top-k高效查询索引方法
甘亮1 金鑫2 贾焰1 李爱平1 盘仰柯3
2010, 47(10):  1771-1784. 
摘要 ( 486 )   HTML ( 3)   PDF (2614KB) ( 377 )  
相关文章 | 计量指标


考虑偏好top-k计算问题,提出一种整合网格索引和DG索引的Gridded Dominant Graph(GDG)混合索引结构.首先,提出基于数据点逆支配点集性质的剪枝自由点方法,该方法大大减少了构建索引中的数据点及查询时可能访问的数据点.通过网格索引高效地计算逆支配点集,并得出网格中“k-最大运算区域”和“k-最大查找区域”,分别在建立索引和top-k查询阶段近似地剪枝自由点.然后,分析了查询索引阶段层次式索引(如dominant graph(DG))在同一层次中无序访问数据点的不足,通过增加网格索引而使访问有序.计算网格概要信息并将网格单元按函数分值排序,使层次内数据点依据网格单元顺序而访问有序.由于附加的网格索引增加计算和存储开销较少,同时性能有较大提升,所以GDG适用性强.理论分析和实验结果均验证了上述方法的有效性.
论文
一种优化多重过滤的序列查询算法
戴东波 汤春蕾 邱伯仁 熊赟 朱扬勇
2010, 47(10):  1785-1796. 
摘要 ( 489 )   HTML ( 2)   PDF (1268KB) ( 383 )  
相关文章 | 计量指标
序列数据一类重要的数据类型,在文本、Web访问日志文件、生物数据库等应用中普遍存在,对其进行相似性查询是一种获取有用信息的重要手段.在大型序列数据库中进行高效相似性查询的关键因素之一就是查询算法的过滤能力,即设计能快速过滤与查询序列不相关序列集的过滤器十分重要.提出了结合序列距离的度量性质和序列自身特征的多重过滤算法SSQ_MF,SSQ_MF使用了长度过滤器、前缀过滤器和基于参考集的过滤器,使得算法过滤能力较基于单一过滤器算法进一步增强.此外,设计了有关数据结构对查询数据库的一些统计信息进行了预计算和保存,有效估计了各过滤器的过滤集大小,并构建了一个由过滤集大小确定的最优过滤顺序模型,使得算法的过滤代价最低.实验结果表明,算法SSQ_MF的查询性能优于单一过滤器算法和随机过滤顺序的多过滤器算法.
数据库事务恢复日志和入侵响应模型研究
陈驰 冯登国 徐震
2010, 47(10):  1797-1804. 
摘要 ( 372 )   HTML ( 0)   PDF (1047KB) ( 437 )  
相关文章 | 计量指标
数据库日志记录数据元素的变迁历史,是维护数据库系统正确性和一致性的重要依据.现有的日志模式无法体现事务间依赖关系,系统在遭到恶意攻击时只得让所有数据元素恢复到出错点的状态,容忍入侵的能力差.提出一种新型的事务恢复日志模型,采用抽象状态机描述了日志生成规则和入侵响应模型,对事务之间的依赖关系进行了形式化的定义,并对入侵响应模型的完整性和正确性进行了分析.配置事务恢复日志和入侵响应机制的数据库系统在遭受攻击时,可以仅恢复受恶意事务影响的后继而无需回滚所有事务,从而提高了数据库系统的生存性.
LHFR:面向长事务的层次式失效恢复算法
任怡 管剑波 敖琦 戴华东 吴庆波
2010, 47(10):  1805-1811. 
摘要 ( 539 )   HTML ( 0)   PDF (831KB) ( 518 )  
相关文章 | 计量指标
针对长事务失效恢复效率问题,提出了长事务的层次式模型LHM,给出分支和循环的有效处理方法.基于该模型提出了面向长事务的层次失效恢复算法LHFR.在保证长事务语义原子性和持久性前提下,该算法通过将失效控制在最低层次的子事务内进行补偿,能将失效范围限制在长事务实例的局部范围内,从而限制失效后回滚子事务的数量,减少不必要的时间损失,提高失效恢复的效率.通过模拟长事务执行与失效恢复过程,验证了LHFR算法的高效性,实验表明该算法可以缩短失效恢复所需时间并减少因无法补偿而需要人工干预的概率.
基于整体DCT系数顺序测度的鲁棒图像拷贝检测算法
凌贺飞 许治华 邹复好 卢正鼎 李 平
2010, 47(10):  1812-1822. 
摘要 ( 485 )   HTML ( 0)   PDF (2560KB) ( 483 )  
相关文章 | 计量指标
能有效检测经过信号处理和几何攻击之后的版权图像是当今拷贝检测研究的热点和难点之一.现有基于图像分块的拷贝检测算法在图像经过旋转和缩放变换后分块内容变换较大,检测效果较差.针对上述问题,提出一种基于整体DCT系数顺序测度的鲁棒图像拷贝检测方法,选取彩色图像YCbCr颜色空间Y平面整体DCT变换后的中低频系数,计算其顺序测度作为图像特征矢量.由于整体DCT中低频系数随着图像缩放有规律的变化,引入顺序测度提取中低频系数的序列作为图像特征,因而对缩放失真具有较好的抵抗力,同时能很好地抵抗信号处理攻击;提出旋转补偿策略,使本算法能抵抗30°以内的旋转变换攻击.实验结果证明在抗拉伸和旋转攻击方面,给出的算法相对于已有算法具有较高的查全率和查准率.
利用情感激励提取足球视频精彩镜头
于俊清, 何欢欢, 何云峰,
2010, 47(10):  1823-1831. 
摘要 ( 558 )   HTML ( 0)   PDF (2579KB) ( 421 )  
相关文章 | 计量指标
足球视频精彩镜头的提取是足球视频检索和摘要生成的关键技术,有着很高的学术研究价值和广泛的应用前景.在系统分析现有足球视频精彩镜头提取方法的基础上,从观众情绪波动的视角出发,以Hanjalic情感曲线的理论思想为基础,设计了一个基于情感激励模型提取足球视频精彩镜头的系统.针对足球视频构建了一种新的特征——镜头激烈度,用此特征取代运动强度特征建立情感激励模型,从而改进了Hanjalic情绪激励曲线的生成方法,提高了系统的查全率、准确率和计算性能.结合足球领域知识,实现了更准确的精彩镜头定位方法,可以根据用户的实际观看时间自动筛选精彩镜头.实验结果验证了算法具有很好的检测效果.
对象存储设备端数据管理策略研究
刘景宁 谢黎明 冯丹 吕满
2010, 47(10):  1832-1839. 
摘要 ( 349 )   HTML ( 0)   PDF (2037KB) ( 432 )  
相关文章 | 计量指标
在对象存储系统中,数据由智能化的对象存储设备管理.当前,对象存储设备端主要提供对象接口,传统的设计主要由通用文件I/O来封装.但是,通用文件系统在管理平坦命名空间时,尤其在长期使用后性能退化严重.因此,提出基于扩展Hash的对象文件系统XOBFS(extensible hashing object-based storage file system),将磁盘空间划分成多个区域单元,区域中定长块分配策略与位图管理空闲块方式结合;对象属性用扩展Hash管理,在Hash桶中采用相同对象属性相邻存放策略.XOBFS应用在对象存储设备端,具有元数据规模小、长期使用性能不退化、对属性进行有效管理等特点.测试结果表明,基于大对象的XOBFS的吞吐率优于传统文件系统.
JUTA: 一个Java自动化单元测试工具
严俊, 郭涛, 阮辉, 玄跻峰,
2010, 47(10):  1840-1848. 
摘要 ( 1124 )   HTML ( 2)   PDF (1102KB) ( 747 )  
相关文章 | 计量指标
描述了一个Java自动化的单元测试工具JUTA.JUTA首先调用工具Soot解析单个Java方法的源码,并将源码解析成一个控制流图.在此基础上,采用符号执行的方法分析控制流图上的路径.工具能够自动地产生满足覆盖率标准的程序的测试用例.这种方法产生的所有测试用例都是可执行的,并且一般来说具有较小的测试用例数.如果用户能够合理地给出描述程序错误的断言,框架JUTA能够自动地检查源码中部分特定类型的错误.实验结果表明工具对Java单元代码的动态测试和静态测试均能在可接受的时间内给出有效的结果.
基于模糊C均值聚类的环境感知推荐算法
张付志 常俊风 周全强
2010, 47(10):  2185-2194. 
摘要 ( 461 )   HTML ( 1)   PDF (2025KB) ( 491 )  
相关文章 | 计量指标
针对现有环境感知推荐算法存在的不足,提出一种基于模糊C均值聚类的环境感知推荐算法.首先采用模糊C均值聚类算法对历史环境信息进行聚类,产生聚类及隶属矩阵;然后匹配活动用户环境信息与历史环境信息聚类,采用聚类隶属度作为映射系数将符合条件的非隶属数据映射为隶属数据,最终选择与活动环境匹配的隶属用户评分数据为用户产生推荐.同现有算法相比,该算法不仅解决了因用户环境改变不能准确推荐项目的问题,而且通过采用模糊聚类算法克服了传统硬聚类问题,并且借助于隶属映射函数解决了聚类产生的数据稀疏性问题.在MovieLens数据集上比较了新算法和其他算法的性能,验证了所提算法的有效性.