Please wait a minute...
ISSN 1000-1239 CN 11-1777/TP

当期目录

2012年 第49卷 第11期    出版日期:2012-11-15
论文
一种新型多标记懒惰学习算法
张敏灵
2012, 49(11):  2271-2282. 
摘要 ( 1146 )   HTML ( 1)   PDF (1410KB) ( 746 )  
相关文章 | 计量指标
在多标记学习框架下,每个样本由单个实例进行表示并同时对应于多个概念标记.已有的多标记懒惰学习算法并未充分考察样本多个标记之间的相关性,因此其泛化性能将会受到一定程度的不利影响.针对上述问题,提出一种新型多标记懒惰学习算法IMLLA.该算法首先找出测试样本在训练集中与各个概念类对应的近邻样本,然后基于近邻样本的多标记信息构造一个标记计数向量,并提交给已训练的线性分类器进行预测.由于IMLLA在对每个概念类进行预测时利用了蕴含于其他概念类中的信息,因而充分考察了样本多个标记之间的相关性.在人工数据集以及真实世界数据集上的实验表明,IMLLA算法的性能显著优于常用的多标记学习算法.
一种基于约束的中垂面相似度准则
高 山 祖 辰 张道强
2012, 49(11):  2283-2288. 
摘要 ( 565 )   HTML ( 0)   PDF (1330KB) ( 441 )  
相关文章 | 计量指标
在数据挖掘和机器学习的基于距离的各种技术中,例如基于距离的聚类和基于距离的分类,如何度量数据间的相似性已经成为一项基础任务.对于某一具体问题,采用合适的相似性度量,会使问题得到更有效的解决.越来越多的研究表明,通过对成对约束(正约束和负约束)的充分利用,从而得到与问题相匹配的相似性度量,能够大幅度地提升算法性能.目前基于约束的相似性度量研究主要是基于约束的距离度量学习,通过对约束信息的利用,学习一个距离度量矩阵,然后再进行分类或者聚类.通过对成对约束尤其是负约束的挖掘,提出一种基于成对约束的相似性度量准则,然后将此准则应用于聚类和分类任务中,分别提出聚类和分类算法,最后在大量标准数据集上将这些算法的性能与目前流行的算法进行实验比较,并据此得出了一些经验性的启示.
一种基于标记传播的大规模图像分类方法
佘俏俏 俞 扬 姜 远 周志华
2012, 49(11):  2289-2295. 
摘要 ( 817 )   HTML ( 2)   PDF (1890KB) ( 617 )  
相关文章 | 计量指标
在基于内容的图像检索中,图像标记具有十分重要的作用. 由于为图像加标注代价昂贵,研究者通过利用大量的未标记数据来提高分类性能,标记传播是其中的一类有效方法. 随着数据采集、存储技术的发展,数字图像的积累越来越容易,但现有的标记传播方法难以处理真实世界中的大规模数据. 因此,针对大规模图像标记,融合标记传播和随机森林技术,提出一种新方法RFLP. 它使用随机决策树进行样本压缩,使得传统的标记传播方法能够在压缩过的示例上高效执行,以利用未标记数据提高分类性能,然后利用随机森林将标记传播的结果推广到所有未标记示例上. 实验结果表明,新方法RFLP的可扩展性明显优于传统标记传播方法,且其分类性能良好.
LDA-CRF:一种基于概率图模型的目标检测方法
郭乔进 李 宁 杨育彬 武港山
2012, 49(11):  2296-2304. 
摘要 ( 1055 )   HTML ( 1)   PDF (2102KB) ( 704 )  
相关文章 | 计量指标
目标检测和识别是计算机视觉和机器学习的研究热点.近年来,主题模型(如LDA等)在无监督的图像识别和定位等应用中获得了巨大的成功.然而,LDA忽略了图像区域之间的空间关系,并且不能处理连续值的视觉特征或特征向量.而条件随机场(CRF)能够利用图像区域之间的局部相关性来提高分类准确性.基于LDA和CRF提出了一种LDA-CRF模型.通过利用LDA生成的主题信息来辅助CRF的分类,同时结合图像区域之间结构化的类别信息来改进LDA的主题生成机制.实验结果表明,LDA-CRF模型的检测效果要优于CRF.
基于样例选取的属性约简算法
王熙照 王婷婷 翟俊海
2012, 49(11):  2305-2310. 
摘要 ( 622 )   HTML ( 1)   PDF (664KB) ( 579 )  
相关文章 | 计量指标
计算属性约简是粗糙集框架下归纳学习的关键部分.基于差别矩阵的属性约简算法是常用的属性约简算法之一.给定一个信息系统,利用该算法可以求出信息系统的所有属性约简.但是该算法需要的存储空间大,执行时间长,特别是对于大型数据库,差别矩阵的存储成为其应用的瓶颈.针对这一问题,提出了一种基于样例选取的属性约简算法,算法分为3步:首先从样例集中挑选出重要的样例;然后用选出的样例构造差别矩阵;最后计算信息系统的所有约简.实验结果显示,当处理大型数据库时,新算法能有效地减少存储空间和执行时间.
一种新的基于嵌入集的图分类方法
王桂娟, 印 鉴, 詹卫许,
2012, 49(11):  2311-2319. 
摘要 ( 563 )   HTML ( 0)   PDF (1555KB) ( 454 )  
相关文章 | 计量指标
随着图数据收集技术在许多科学领域的发展,对图数据分类已成为机器学习和数据挖掘领域的重要课题.目前已经提出许多图分类方法.其中,一些图分类方法采用3步来构筑分类模型;一些图分类方法采用2步来构筑分类模型.这些方法在挖掘频繁子图或特征子图时,只考虑到子图的结构信息,而没有考虑到子图的嵌入信息.为此,在L-CCAM子图编码的基础上,提出了一种基于嵌入集的图分类方法.该方法采用基于类别信息的特征子图选择策略,不但考虑了子图的结构信息,而且在频繁子图挖掘过程中充分利用嵌入信息——嵌入集,通过一步即直接选择特征子图以及生成分类规则.实验结果表明:在对化合物数据分类时,在分类精度上该方法优于采用3步的图分类方法;在运行效率上该方法优于采用2步和3步的图数据分类方法.
基于粒度层次映射转换的时态粒点差运算方法
左亚尧, 汤 庸, 舒忠梅,
2012, 49(11):  2320-2327. 
摘要 ( 438 )   HTML ( 0)   PDF (1010KB) ( 571 )  
相关文章 | 计量指标
计算两个时态粒点在任意时态粒度下的差值是时态断言的基础,提出基于时态粒度的层次映射转换方法,将时态粒点映射为各时态粒度下的可列集,差运算可转换为不同粒度映射下的自然数差运算.并论证了时态论域T与自然数集N间的对等关系以及映射的连续性,证明了方法的正确性.克服了弹性时态粒度的影响,适应任何基于非规则时态粒度集或者自定义时态粒度集上的时态粒点差运算.
半配对半监督场景下的低分辨率人脸识别
周旭东, 陈晓红, 陈松灿,
2012, 49(11):  2328-2333. 
摘要 ( 676 )   HTML ( 0)   PDF (950KB) ( 568 )  
相关文章 | 计量指标
实际环境(如监控)中常遇到大量低分辨率人脸图像需要识别.对低分辨率人脸的识别相对高分辨率更难,因其含有相对有限的判别信息.为此,通过在人脸识别(系统)构建阶段引入与低分辨率人脸相配对的高分辨率人脸,以提高识别性能成为最近研究的焦点之一.但这些研究仍存在以下不足:1)均要求高、低分辨率人脸样本间的全配对;2)识别系统构建时未利用给出的类信息,导致系统性能受限.事实上常常面对的应用场景是仅能获取部分配对和部分标号的高、低分辨率人脸样本集, 即所谓的半配对半监督场景,对此提出一种用于低分辨率人脸识别的半配对半监督算法,以弥补现有相关研究的不足.在Yale和AR人脸数据集上的实验结果验证了该算法的有效性.
一种基于Petri网的RFID事件检测的形式化方法
孙基男, 黄 雨, 黄舒志, 张世琨, 袁崇义,
2012, 49(11):  2334-2343. 
摘要 ( 729 )   HTML ( 0)   PDF (2204KB) ( 479 )  
相关文章 | 计量指标
无线射频识别(RFID)采用唯一的电子标签识别物理对象,可高速收集大量目标数据.为向各类应用提供语义信息,RFID系统需从收集的数据中检测用户自定义的复合事件.通过提出一种基于Petri网的RFID事件检测方法,引入形式化的ED-net模型描述复合事件语义,并以此为基础实现一种事件检测方法.ED-net模型是对传统Petri网的一种扩展,提供了描述用户自定义类型、函数及表达式的能力,可精确描述RFID复合事件的属性及时域、非时域、参数化等约束条件.通过对RFID事件形式化描述,各种RFID事件可以统一在ED-net模型,并可自动化进行检测处理,避免了不同复合事件间公共子事件重复检测的问题.最后,经过实验测试和分析,验证了该形式化方法的有效性及其优势.
Tag-TextRank:一种基于Tag的网页关键词抽取方法
李 鹏 王 斌 石志伟 崔雅超 李恒训
2012, 49(11):  2344-2351. 
摘要 ( 1255 )   HTML ( 3)   PDF (1360KB) ( 783 )  
相关文章 | 计量指标
关键词抽取是从文本中抽取代表性关键词的过程,在文本处理领域中具有重要的应用价值.利用一种近年来受到广泛关注的新的信息源——社会化标签(tag)——来提高网页关键词抽取的质量.通过对Tag数据进行统计分析,发现用户往往对多个在话题上相关的网页使用同样的标签词,一个特定的文档可以通过其标注信息找到相关文档.在此基础上,提出了利用Tag进行关键词抽取的框架,并给出了一种具体的实现方法Tag-TextRank.该方法在TextRank基础上,通过目标文档中的每个Tag引入相关文档来估计词项图的边权重并计算得到词项的重要度,最后将不同Tag下的词项权重计算结果进行融合.在公开语料上的实验表明,Tag-TextRank在各项评价指标上均优于经典的关键词抽取方法TextRank,并具有很好的推广性.
一种结合文本和链接分析的局部Web社区识别技术
张宪超 徐 雯 高 亮 梁文新
2012, 49(11):  2352-2358. 
摘要 ( 445 )   HTML ( 0)   PDF (1214KB) ( 502 )  
相关文章 | 计量指标
当前Web社区识别算法大都基于纯链接分析,忽略了Web的文本属性.针对Flake等人提出的基于最大流算法的社区识别框架的不足(如赋予网页之间的链接不公平的权重、排序策略单一等),提出了一种结合网页内容分析与链接分析的改进算法.首先,提出一种新的基于文本相似度的边容量分配方法.基于网页间内容越相似彼此传递的权威度越大的特点,将网页的内容相似度用于Web图的边容量设置上,具体策略为Max-flow+TF-IDF边容量设置和Max-flow+TF-IDF+Seeds边容量设置.其次,提出的社区结点的排序策略充分考虑了结点和社区主题的相似度,以此来增强结点区分度.理论分析和实验证明了该算法具有提高社区发现的精度和大小、计算出的排序分值更为客观合理等优点.
基于动态主题建模的Web论坛文档摘要
任昭春 马 军 陈竹敏
2012, 49(11):  2359-2367. 
摘要 ( 623 )   HTML ( 0)   PDF (1891KB) ( 781 )  
相关文章 | 计量指标
针对论坛文档由于自身特点缺乏有效的文档摘要方法的现状,提出一种基于LDA主题模型的论坛文档摘要方法.在主题建模中考虑了Web论坛文档中帖子和帖子之间的回复关系,并把主题的分布变为随文档变化而变化的一个动态过程,来解决主题的依赖和偏移问题.在使用Gibbs EM 采样算法来确定动态主题模型的参数后,通过计算句子中主题权重之和来确定各个主题的重要程度;最后根据动态主题模型中主题的概率分布计算各句子的权重并得到文档的摘要.实验结果表明,新方法在各个ROUGE评测标准上均优于其他各种对比的摘要方法.
低频查询的用户行为分析和类别研究
姚 婷 张 敏 刘奕群 马少平 茹立云
2012, 49(11):  2368-2375. 
摘要 ( 648 )   HTML ( 0)   PDF (1643KB) ( 563 )  
相关文章 | 计量指标
低频查询是用户提交查询频次非常低的查询.它们占了搜索引擎独立查询的很大比例且对用户体验影响巨大,但由于数据稀疏性,现有的搜索引擎用户行为分析及相关研究中对低频查询涉及很少.结合前人的相关工作,使用商业搜索引擎的大规模用户日志,在会话级别上进行低频查询的用户行为分析以及类别研究.基于目标查询行为、后续相关查询行为、整体会话行为3个方面的12个特征进行了低频查询的用户行为特征分析,首次提出了低频查询类别分析框架,并进一步使用改进的AdaBoost算法对低频查询会话进行分类.实验对2 000个随机的低频查询会话样例进行分类,AUC值达到了83%以上.低频查询的用户行为分析和类别研究,将为搜索引擎用户行为分析等网络检索研究提供重要基础.
基于情感关键句抽取的情感分类研究
林 政, 谭松波, 程学旗,
2012, 49(11):  2376-2382. 
摘要 ( 580 )   HTML ( 4)   PDF (886KB) ( 576 )  
相关文章 | 计量指标
情感分析需要解决的一个重要问题是判断一篇文档的极性是正面的还是负面的.情感分类的正确率很难达到普通文本分类的水平,因为情感分类更难更复杂.在判断文档的情感极性时,不同的句子具有不同的情感贡献度,所以,对整篇文档的关键句和细节句进行区分将有助于提高情感分类的性能.关键句通常简短且具有判别性,而细节描述句通常复杂多样且容易引入歧义.在关键句抽取算法中,考虑3类属性:情感属性、位置属性和关键词属性.为了更好地利用关键句和细节句之间的差异性和互补性,将抽取的关键句分别用于有监督的和半监督的情感分类.在有监督情感分类中,采用的是分类器融合的方法;在半监督情感分类中,采用的是Co-training算法.在8个领域上进行实验,结果表明所提方法性能明显优于Baseline,从而证明情感关键句抽取算法是有效的.
基于本体的Deep Web查询接口集成
王 英, 左祥麟, 左万利, 王 鑫,
2012, 49(11):  2383-2394. 
摘要 ( 577 )   HTML ( 3)   PDF (2612KB) ( 537 )  
相关文章 | 计量指标
Deep Web中的海量信息只能通过查询接口访问获得,为了能够同时访问同一领域多个Web数据库,需要对多个Web数据库的查询接口进行集成.因此,引入本体技术,提出基于本体的Deep Web查询接口集成方法.Deep Web查询接口集成主要完成两个方面的工作:模式匹配与模式融合.模式匹配采用本体的“Bridge(桥接)”效应建立不同接口模式间的属性映射关系,以准确发现不同接口属性间的语义关联.模式融合根据模式匹配的结果,合并Deep Web数据库查询接口集合中表示同一语义的属性,并尽可能地保持该领域查询接口的结构特征和属性顺序,以获得集成查询接口.通过实验分析,基于本体的Deep Web查询接口集成方法不仅简化了模式匹配的复杂过程,而且很大程度上提高了模式集成的精度.因此,基于本体的Deep Web查询接口集成方法是高效可行的.
基于依存句法的博文情感倾向分析研究
冯 时, 付永陈, 阳 锋, 王大玲, 张一飞,
2012, 49(11):  2395-2406. 
摘要 ( 743 )   HTML ( 3)   PDF (2504KB) ( 696 )  
相关文章 | 计量指标
博客作为一种用户发表其观点和看法的载体已成为Web上一个重要的情感抒发与交流平台,博文搜索为这种交流提供了方便快捷的途径.很多时候,用户进行博文搜索时更关注作者对事件所持的观点或情感,但目前的博文搜索返回结果大多基于主题而非情感倾向.基于此提出一种基于句法依存分析技术的算法SOAD(sentiment orientation analysis based on syntactic dependency)对博文搜索结果进行情感倾向性分析.基于SOAD算法,构建了一个中文博文搜索原型系统,对博文搜索结果进行再处理.实验证明,一方面,SOAD算法在分析博文情感上具有更大的优势;另一方面,建立的原型系统实现了依据情感倾向返回搜索结果的目标.
面向排序的基于查询需求的查询聚类模型
花贵春 张 敏 刘奕群 马少平 茹立云
2012, 49(11):  2407-2413. 
摘要 ( 411 )   HTML ( 0)   PDF (1431KB) ( 465 )  
相关文章 | 计量指标
排序是信息检索中的一个重要的环节,当今已经提出百余种用于构建排序函数的特征,如何利用这些特征构建更有效的排序函数成为当今的一个热点问题,因此排序学习(learning to rank)作为信息检索与机器学习的交叉学科,越来越受到人们的重视.根据不同的原则,查询可以分为不同的类别.不同类别的查询,排序特征的重要性不同,在排序函数的构建过程中的权重也会不同.为所有的查询都采用统一的排序函数是不合理的.针对这一问题,首先对利用关键词匹配原则得到的查询特征进行分析,选择出适当的查询特征集合构建查询特征向量,然后基于查询特征向量之间的距离对查询进行聚类,并为每个聚类类别学习得到排序函数,最后为一个新来的查询选择最适合的排序函数对文档进行排序.实验结果显示,在经过查询特征选择的查询聚类基础上得到的排序函数,和在所有的查询类别上得到的排序函数,两者的性能具有可比性,甚至前者优于后者.
防御代码注入式攻击的字面值污染方法
王 溢, 李舟军, 郭 涛,
2012, 49(11):  2414-2423. 
摘要 ( 550 )   HTML ( 2)   PDF (1996KB) ( 466 )  
相关文章 | 计量指标
当前几乎所有的Web应用程序都面临着诸如跨站脚本(XSS)和SQL注入等代码注入式攻击的威胁,这种威胁源自于程序对用户输入缺乏验证和过滤,导致恶意输入可作为数据库查询或页面中的脚本而执行,从而破坏网站的数据完整性,泄露用户隐私.为了增强应用程序对此类攻击的抵抗性,提出一种针对Web程序的字面值污染方法,该方法能够对代码注入式攻击给予高效的防御且十分易于部署.此方案通过强化服务器端脚本配合可自定义的安全过滤策略,达到对此类攻击的完全免疫.尽管需要对Web应用程序进行插桩等修改,但该过程是完全自动化和正确的,在处理大规模的程序时具有很强的实用价值.通过实现该技术的原型系统PHPHard对若干PHP应用程序的初步实验,可以发现该方法能够移除恶意脚本,成功阻止跨站脚本的攻击.与传统方法相比,它在精确度和有效性上具有优势,且仅引入了很小的开销.
改进型极低限要求互有认证协议研究
张学军, 蔡文琦, 孙知信, 王锁萍,
2012, 49(11):  2424-2431. 
摘要 ( 437 )   HTML ( 0)   PDF (1294KB) ( 439 )  
相关文章 | 计量指标
在极低限要求相互认证协议(M2AP)的基础上,通过对传输的信息进行一定的保护,提出了一种改进型极低限要求相互认证协议(IM2AP).该协议通过标签和阅读器之间共享的假名和密钥实现互有认证,认证通过之后再进行隐私信息的传输.为了确保标签和阅读器的互有认证过程不被攻击者恶意干扰,标签利用密钥的汉明权重产生了一个可以和阅读器共享的随机数,并根据这个随机数对传输的信息进行一次循环移位,使得攻击者无法对某一特定位进行篡改,从而有效地避免了去同步攻击和整体揭露攻击.通过安全分析和性能分析,表明该协议能够在轻量型安全认证协议安全性普遍较弱的情况下,用有限的成本增加来大幅提高系统的安全性和可靠性,具有较高的实用价值.
基于赌轮选择遗传算法的数据隐藏发布方法
胡新平 贺玉芝 倪巍伟 张 勇
2012, 49(11):  2432-2439. 
摘要 ( 723 )   HTML ( 0)   PDF (2099KB) ( 364 )  
相关文章 | 计量指标
面向聚类挖掘的隐私保护微数据发布是数据挖掘研究的新兴热点之一,其目标是通过对微数据数值的修改实现对微数据隐私的保护,同时保证隐藏后数据具有与原数据集相同(或相似)的聚类效果.从保持数据邻域关系稳定的角度,提出一种基于赌轮遗传的干扰方法RWSGA,采用在数据点的k邻域内运用赌轮算子随机选择2个数据点进行交叉或变异的思想实现数据隐藏.进一步,提出从高密度点区域筛选k邻域中心以改进变异操作选择域的优化策略,解决变异操作可能导致数据扰动幅度过大的问题.理论分析和实验结果表明,该方法能较好地对原始数据进行扰动修改以保护数据隐私不泄露,同时保证发布前后的数据聚类结果差异较小.
一种用于类C语言环境的安全的类型化内存模型
何炎祥, 吴 伟, 陈 勇, 李清安, 刘健博,
2012, 49(11):  2440-2449. 
摘要 ( 453 )   HTML ( 2)   PDF (1180KB) ( 522 )  
相关文章 | 计量指标
使用形式化方法对程序进行验证是保证软件可信的重要手段.对于像C语言这样的较低级的命令式语言可以直接对内存进行操作,对其操作语义或公理语义的形式化需要基于合适的内存模型.传统的字节内存模型可以很好地描述各种内存操作,但是无法保证安全性,同时使程序验证变得异常复杂.面向对象语言的内存模型则具有较高的抽象性,便于程序验证,但不适合描述低级的内存操作.结合字节内存模型和面向对象语言内存模型,提出一种安全的类型化的内存模型,既可用于对语义的形式化,也可用于基于霍尔逻辑的程序验证.此内存模型既允许指针算术、结构赋值、类型转换等内存操作,同时也可以有效减少因指针别名给程序验证带来的复杂度.基于Coq辅助定理证明工具,对内存模型进行了形式化实现和验证.
基于广义随机Petri网的Web服务交互行为-环境模型
朱 俊, 郭长国, 吴泉源,
2012, 49(11):  2450-2463. 
摘要 ( 600 )   HTML ( 0)   PDF (4145KB) ( 391 )  
相关文章 | 计量指标
在因特网环境下,个体Web服务的可靠性和性能表现都与访问者的地域位置有关,其本质是服务交互行为受到了不可预知的网络环境的影响.而通过协调多个伙伴服务之间的交互操作而实现的服务组合更加容易受到网络环境因素的影响.在这种情况下,服务组合建模只考虑组合本身,而不考虑网络环境的影响,将会对模型的评估造成较大的偏差.于是,为了能够真实地评估服务交互行为与网络环境之间的关系,提出了一种基于广义随机Petri网的Web服务“交互行为-环境”模型.该模型不仅引入了伙伴服务的可靠性和性能方面的因素,而且充分考虑真实的网络环境因素.该模型能够对被建模系统进行定性和定量分析,从而指导服务组合方案的优化,评估网络环境对交互行为的影响.最后,进行了案例研究,并深入评估了该实例的可靠性、性能以及交互行为方面的属性.
基于失败恢复策略的Web组合事务QoS估算
梅晓勇, 李师贤, 黄昌勤, 郑小林,
2012, 49(11):  2464-2480. 
摘要 ( 630 )   HTML ( 1)   PDF (5112KB) ( 436 )  
相关文章 | 计量指标
由于组合应用需求超越了传统事务,为了保证组合服务事务的性质,不可避免地需要合适的失败恢复机制,以提供持续的和可靠的执行语义.提出一种组合事务恢复模型,采用向前、向后和替代恢复的综合事务恢复策略实现失败恢复的动态编程,将失败恢复策略从业务流中分离出来建模.与高级事务聚合模式相对应,任务执行失败将影响组合事务流程的执行进展.然而,现有的QoS性能估算方法并没有考虑失败恢复产生的影响,因此,不能直接用于组合事务的QoS估算.根据事务正确和出错情形,提出了一个基于组合事务的QoS评价和估算模型.实验证明,该模型能有效地估算和分析组合事务性能,对于减少事务失败率和消除不利因素影响有较好的效果.
PMTree:一种高效的事件流模式匹配方法
程苏珺 王永剑 孟 由 程振东 栾钟治 钱德沛
2012, 49(11):  2481-2493. 
摘要 ( 907 )   HTML ( 4)   PDF (3432KB) ( 507 )  
相关文章 | 计量指标
复杂事件处理技术从多个持续事件流中分析并提取满足特定模式的事件序列.高吞吐率场景下,如何快速准确地识别事件序列是复杂事件处理技术中一个非常重要的问题.现在事件流的模式匹配方法——NFA、Petri网、有向图等——存在语义描述能力不足、部分算子实现代价高等缺陷.针对这一现状,设计并实现了一种基于树的模式匹配方法——PMTree.PMTree定义了事件模型及相应事件算子,将事件序列映射为树节点,同时将时间窗口约束及谓词约束等放置在相应节点,这些树节点连接成一棵PMTree来支持实时的事件筛选与过滤.进一步研究了PMTree构建过程中的优化策略,并提出了开销模型以及优化构建算法,以尽可能减少模式匹配开销.实验结果表明,相同测试条件下基于PMTree实现的复杂事件处理引擎Cesar吞吐率是基于NFA实现的开源引擎Esper的3~6倍,并且在不同事件量或事件序列复杂度下性能表现稳定.
无线传感网络节点定位中的导标动态移动策略
刘克中, 陈巍博, 占 真, 张金奋, 付 琴,
2012, 49(11):  2494-2500. 
摘要 ( 592 )   HTML ( 0)   PDF (2269KB) ( 384 )  
相关文章 | 计量指标
在基于移动导标的无线传感器网络节点定位中,导标的移动路径将直接影响到节点定位的效率和精度.考虑到无线传感器网络节点通信能力和计算能力有限性,着重研究一种基于网络局部拓扑信息的导标移动虚拟力修正模型.模型中,导标对邻居节点进行筛选,并进一步收集有效节点与导标的距离、有效节点拥有邻居节点数目等参数,在此基础上建立移动导标虚拟引力模型,该模型能使导标的移动具有较强的自适应性.更进一步,针对节点虚拟引力基本模型存在的导标无引力情况和冗余遍历情况,通过加入接近因子及已定位区域边界曲线拟合的方法,对基本模型进行修正.仿真实验表明,提出的路径规划算法与典型的传统路径算法相比较,导标遍历网络的路径长度缩短了20%~30%,较大程度节约了定位过程中导标节点遍历网络所需的能量开销.