Please wait a minute...
ISSN 1000-1239 CN 11-1777/TP

当期目录

2005年 第42卷 第3期    出版日期:2005-03-15
论文
存储与计算的分离
马一力 傅湘林 韩晓明 许 鲁
2005, 42(3):  . 
摘要 ( 1413 )   PDF (552KB) ( 1861 )  
相关文章 | 计量指标
当前计算应用的发展对传统计算机体系结构提出了挑战.由计算资源和存储资源固定连接形成的系统已经不能适应动态计算的需求.从应用出发,提出计算资源和存储资源物理分离和逻辑分离的概念,并以此为基础,构造三维可重构计算环境可以解决这些问题.在这种环境中,用户程序、计算资源和存储资源可以根据应用的需求动态组合.由于摆脱了资源的地理位置和操作环境等方面的限制,计算过程将呈现出数据驱动的特点,从而实现按需计算,使计算系统可以在更大范围内为用户提供服务.
基于最大判别熵的有监督独立分量分析方法
黄雅平 罗四维 齐英剑
2005, 42(3):  . 
摘要 ( 395 )   PDF (341KB) ( 439 )  
相关文章 | 计量指标
独立分量分析(independent component analysis,ICA)是目前非常活跃的一个研究领域,在盲源分离、信号处理等方面有着广泛的应用.特别是在特征提取方面,由于其处理非高斯分布的数据的能力,引起了广泛关注,取得了很好的效果.但是传统的独立分量分析方法的思想都是通过定义一个衡量分量独立性的目标函数来求解问题,在应用到特征提取方面时,没有考虑到提取的独立分量对于识别和分类问题的重要性.为了克服传统ICA算法的不足,从信息论角度出发,选择判别熵作为衡量类别之间差异的度量,提出了基于最大判别熵的有监督独立分量分析方法(SICA-MJE),并在人脸识别和虹膜识别应用中进行了验证,取得了很好的实验结果.
一种基于核的快速非线性鉴别分析方法
徐 勇 杨静宇 金 忠 娄 震
2005, 42(3):  . 
摘要 ( 392 )   PDF (424KB) ( 404 )  
相关文章 | 计量指标
基于“核技巧”提出的新的非线性鉴别分析方法在最小二乘意义上与基于核的Fisher鉴别分析方法等效,相应鉴别方向通过一个线性方程组得出,计算代价较小,相应分类实现极其简便.该方法的最大优点是,对训练数据进行筛选,可使构造鉴别矢量的“显著”训练模式数大大低于总训练模式数,从而使得测试集的分类非常高效;同时,设计出专门的优化算法以加速“显著”训练模式的选取.实验表明,这种非线性方法不仅具有明显的效率上的优势,且具有不低于基于核的Fisher鉴别分析方法的性能.
一种主动学习神经网络集成方法
王正群, 陈世福, 陈兆乾,
2005, 42(3):  . 
摘要 ( 594 )   PDF (365KB) ( 1163 )  
相关文章 | 计量指标
分析了神经网络集成泛化误差、个体神经网络泛化误差、个体神经网络差异度之间的关系,提出了一种个体神经网络主动学习方法.个体神经网络同时交互训练,既满足了个体神经网络的精度要求,又满足了个体神经网络的差异性要求.另外,给出了一种个体神经网络选择性集成方法,对个体神经网络加入偏置量,增加了个体神经网络的可选数量,降低了神经网络集成的泛化误差.理论分析和实验结果表明,使用这种个体神经网络训练方法、个体神经网络选择性集成方法能够构建有效的神经网络集成系统.
一种高效的用于文本聚类的无监督特征选择算法
刘 涛, 吴功宜, 陈 正,
2005, 42(3):  . 
摘要 ( 771 )   PDF (345KB) ( 1224 )  
相关文章 | 计量指标
特征选择虽然非常成功地应用于文本分类,但却很少用于文本聚类,这是因为那些高效的特征选择方法通常都是有监督的特征选择算法,它们因为需要类信息而无法直接应用于文本聚类.为了能将这些方法应用到文本聚类上,提出了一种新的无监督特征选择算法:基于K-Means的特征选择算法(KFS).这个算法通过在不同K-Means聚类结果上使用有监督特征选择的方法,成功地选择出了最为重要的一小部分特征,使文本聚类的性能提高了近15%.
支持有向有环图的微调度方法
文严治 连瑞琦 吴承勇 冯晓兵 张兆庆
2005, 42(3):  . 
摘要 ( 250 )   PDF (404KB) ( 492 )  
相关文章 | 计量指标
指令调度是编译器中的重要优化阶段.如何充分利用处理器结构相关的资源,发掘程序并行性,以提高编译优化性能和增强代码可适应性,一直是指令调度的研究难点之一.目前微调度已经取得了一定的效果,但对软件流水产生的有向有环图则未能提供支持.在ORC中提出并实现了一种基于IA-64体系结构的支持有向有环图的微调度方法,有效地减少了程序执行周期和流水线停顿,取得了较为满意的编译优化性能.
存储模型仿真器的设计与实现
吴俊敏 杨 超 陈国良 张淼辉 门 珂
2005, 42(3):  . 
摘要 ( 397 )   PDF (528KB) ( 495 )  
相关文章 | 计量指标
存储一致性问题和高速缓存一致性问题是共享存储并行计算机中两个最关键的问题,通过仿真器对它们进行了量化研究,设计并实现了一个存储模型仿真器MMS.基于MMS仿真了不同并行机结构模型下多种存储一致性模型的行为;针对不同类型的计算问题比较了不同的存储一致性模型,并对实验结果进行了分析;实现了几个不同的高速缓存一致性协议,并比较了它们的性能.
整数乘法电路的形式化验证方法研究
王海霞 韩承德
2005, 42(3):  . 
摘要 ( 303 )   PDF (402KB) ( 485 )  
相关文章 | 计量指标
采用基于决策图的模型检验方法对整数乘法器验证时会出现内存爆炸,解决该问题的一种有效途径是采用反向替换方法.函数替换算法是反向替换方法的核心算法,如果保证被替换变量位于被替换函数的决策图顶层,替换算法可以简化.通过设置变量序和限定变量替换顺序,提出了一种保证被替换变量始终位于被替换函数决策图的顶层的反向替换方法,可极大降低整数乘法器验证的运行时间和内存使用量.实验结果表明,采用改进的反向替换方法,在1GB内存下,可将Add-Step乘法器的验证规模从84×84位提高到256×256位,将Diagonal乘法器的验证规模从84×84位提高到206×206位.
基于精细可扩展编码的多视角视频编码研究
黄 晁, 李锦涛,
2005, 42(3):  . 
摘要 ( 329 )   PDF (341KB) ( 382 )  
相关文章 | 计量指标
多视角视频几倍于目前普通视频的数据量,如果不采用有效的压缩编码技术,其有效的传输和存储将是不可能的,也成为制约多视角视频广泛应用的瓶颈.因此,进行高性能多视角视频编码技术的研究是十分必要的.尤其是随着网络的发展,能提供交互的多视角视频技术越来越受到关注.如何有效地通过网络传输多视角视频信号的问题显得更加重要.针对这一问题,采用精细可扩展编码(FGS)的思想设计了多视角视频编码器.实验表明,方案在保证了高编码效率的同时能较好地解决多视角视频的网络传输问题.
基于SGNN的图像融合
鲍复民, 李爱国, 覃 征,
2005, 42(3):  . 
摘要 ( 407 )   PDF (453KB) ( 420 )  
相关文章 | 计量指标
近年来,将神经网络用于图像融合处理取得了一些成果,但已有的方法存在着计算量大、需要用户设置网络结构和较多参数等缺点.自生成神经网络(SGNN)是一类自组织神经网络,它不需要用户指定网络结构和学习参数,而且不需要迭代学习,是一类特点突出的神经网络.提出一种基于SGNN进行图像融合的新方法,分3步:①对图像进行预处理,使用小波方法滤除图像的噪声;②用SGNN对图像像素进行聚类,将像素按灰度值聚为某几类;③对经过第2步处理的像素进行融合,用灰度值对像素进行模糊分类之后再用加权平均法精确化,最终得到融合图像.该方法易于使用、计算速度快.实验表明该方法融合结果的均方误差比拉普拉斯金字塔算法和小波变换方法降低约30%~60%.
应用PSO的快速纹理合成算法
张 岩 李文辉 孟 宇 庞云阶
2005, 42(3):  . 
摘要 ( 325 )   PDF (725KB) ( 417 )  
相关文章 | 计量指标
应用PSO的快速纹理合成算法是一种高效的纹理合成算法,应用粒子群优化(PSO)算法对基于块采样的纹理合成算法的搜索匹配过程进行了改进,改变了原算法的全遍历搜索过程,在不影响合成质量的前提下加快了合成速度.本算法对于按序和随机的各种应用都能在一台中等的PC机上几秒内合成高质量的纹理.并对算法执行中的粒子数、迭代次数对合成速度和合成效果的影响进行了详细的分析.
基于序列图像的实时人流检测与识别算法研究
高成英, 刘 宁, 罗笑南,
2005, 42(3):  . 
摘要 ( 447 )   PDF (549KB) ( 1008 )  
相关文章 | 计量指标
针对可见光下人流检测、识别算法中存在的运动目标分割准确率低、识别效果差等问题,提出一种新的跟踪与识别方法.首先利用序列图像中运动目标时空一致性,将帧间二阶差分(SODP)与边缘检测相结合进行运动目标分割;再根据行人运动模型和运动目标局部性特征,通过粗采样方法快速提取跟踪特征向量;利用运动目标轮廓投影比、形状因子等特征分量,并构造基于人工神经网络的运动目标分类器进行识别.通过对大型商场进行的实际测试表明:该方法在运行效率、识别准确率方面均取得满意结果.同时,算法对于光线、阴影和人流变化等外界因素的影响,具有较强适应性.
一个多时间粒度下时态函数依赖的有限属性闭包算法
姚春龙, 郝忠孝,
2005, 42(3):  . 
摘要 ( 299 )   PDF (400KB) ( 459 )  
相关文章 | 计量指标
为了有效地进行时态数据库设计,支持多时间粒度的时态函数依赖(TFDs)被用于时态模式的规范化.时态模式规范化所要解决的一个关键问题是求解时态函数依赖的有限属性闭包问题.由于多时间粒度的使用,使得有限属性闭包问题变得非常复杂.实际上,TFDs与传统的函数依赖(FDs)之间存在着密切的联系.通过分析这些联系和封闭时态类型集的特性,利用传统FDs的相关算法提出一个有效的求解有限属性闭包的算法.通过分析和与相关算法的实验比较,该算法更加有效.
一种不完全维组合格及其增量构造算法
高宏彬 林友芳 黄厚宽
2005, 42(3):  . 
摘要 ( 295 )   PDF (393KB) ( 468 )  
相关文章 | 计量指标
数据仓库多维模型中的维结构具有层次性的特点,并且动态决策分析也有在维的不同层次间切换的需求,因此维在逻辑上一般采用层次结构来组织.传统的代数格模型只支持单维单关键字,维组合格模型则对代数格模型进行了扩展,能够支持单维复合关键字.进一步改进了维组合格模型,引入了不完全维组合格的概念,以实现在多维数据立方体的维模型建模阶段对立方体视图空间的约简.给出了维组合格上的基本操作,并应用这些基本操作实现了一种由维格增量构造不完全维组合格的算法.
一种挖掘最大频繁项集的深度优先算法
颜跃进 李舟军 陈火旺
2005, 42(3):  . 
摘要 ( 439 )   PDF (359KB) ( 568 )  
相关文章 | 计量指标
最大频繁项集挖掘是许多数据挖掘应用中的重要问题.提出一种新的深度优先搜索最大频繁项集的算法.该算法采用位图数据格式,结合了流行的各种有效剪枝技术,并使用局部最大频繁项集来进行高效的超集存在判断,明显地加速了最大频繁项集的生成,从而降低了CPU时间.
基于本体的XML数据集成的查询处理
陶 春 张 亮 施伯乐
2005, 42(3):  . 
摘要 ( 486 )   PDF (541KB) ( 385 )  
相关文章 | 计量指标
数据集成在很长一段时间一直为人们所关注.随着XML逐渐成为Web上发布和交换数据的标准,研究人员提出了基于本体的XML数据的语义集成方案.此文对于这样的方案进行了形式化,提出的算法NaiveMaxQEP解决了最大查询计划的生成问题;并基于非完整性角色个数有限的假设,对于查询执行计划生成算法进行了优化,提出了OptMaxQEP算法;为支持高效的分布式资源整合,文章还给出了网络代价优化算法NetOptQEP,基于网络代价对输出的执行计划进行了优化.
一种基于结构化语料库的概念语义网络自动生成算法
郑庆华 王朝静 孙 霞
2005, 42(3):  . 
摘要 ( 260 )   PDF (395KB) ( 521 )  
相关文章 | 计量指标
概念语义网络是为了解决信息检索中的词汇不匹配的问题而提出的,是提高检索效果的基本途径之一.以面向自然语言的网络答疑为应用背景,提出了一种基于半结构化语料库的概念语义网络自动生成算法.通过分析语料的组成特点,对不同的概念关系类型,采取不同的模板进行文档抽取,并设定不同的窗口单元计算概念间的相关度;然后经过阈值筛选和角色转换,获得各种类型的概念关系,在此基础上进行语义网络的优化调整.实验结果表明,本算法获得的概念语义网络可以有效地提高问题检索的效果.
使用遗传算法的信息检索动态参数学习方法
张 敏 林 川 马少平
2005, 42(3):  . 
摘要 ( 276 )   PDF (434KB) ( 480 )  
相关文章 | 计量指标
信息检索系统中的参数设定在很大程度上决定着系统的检索性能.参数的数据相关性和敏感性使得经验值往往不可靠.另一方面,由于在检索过程中缺乏当前查询的相关文档信息,因而不可能进行有指导的参数学习.因此,自动无指导的参数学习方法是极为必要和重要的.首先考察传统上根据经验值设定固定的系统参数的效果,结果表明其泛化能力差,效果不稳定且不可靠.其次,提出一种使用遗传算法进行动态参数学习的方法.在TREC11,TREC10和TREC9三组大规模Web标准测试数据集上进行了实验,数据集规模均超过10GB. 实验结果表明,经过动态参数学习,系统性能总是能够接近甚至达到可能实现的最优性能.
基于主动测试的HTTP业务性能分析
范 超, 谢高岗, 张大方, 李忠诚,
2005, 42(3):  . 
摘要 ( 411 )   PDF (471KB) ( 344 )  
相关文章 | 计量指标
Web业务在当前Internet流量中占有重要地位,而网络路径对HTTP业务性能的影响直接决定了用户可察觉的Web服务器访问的响应时间和页面下载速率的差异.通过主动业务仿真方法,测量端到端路径HTTP业务的性能表现,分析了业务响应时间的构成与分布特征,发现对同一页面在不同时间访问的下载速率表现出高可变性,证明常用的基于均值-标准差的性能故障检测判别方法并不完全适用于该类性能参数,提出了基于盒式图的端到端路径HTTP业务性能故障检测算法.
认证可信度理论研究
汪伦伟 廖湘科 王怀民
2005, 42(3):  . 
摘要 ( 308 )   PDF (297KB) ( 343 )  
相关文章 | 计量指标
认证是操作系统安全的基础之一,没有经过用户认证,系统安全的3个基本特性:秘密性、完整性和可用性将会严重地受到破坏.但是由于当前系统在用户认证过程中存在一些不确定性因素,如认证机制的不确定性、认证规则的不确定性和认证结论的不确定性,借鉴专家系统中不确定性推理的思想,提出认证可信度的思想,并给出了认证可信度因子模型.该模型对认证过程存在的不确定性因素给出了度量,针对需要多种认证机制的重要、特殊系统给出了认证可信度因子在多认证机制之间的传播公式,并进行了证明.通过在认证过程中引入认证可信度,可以很好地描述认证过程中的不确定性因素,并且可以更好地增强系统在多种认证机制情况下的安全性.
有不同中断时间代价的一致并行抢先调度问题
周华奇 鲁鸣鸣 朱 洪
2005, 42(3):  . 
摘要 ( 349 )   PDF (375KB) ( 357 )  
相关文章 | 计量指标
提出了具有不同中断时间代价的抢先调度问题(P|ptmn(δ\-i)|C\-{max}).该问题在工程任务分配、分布式计算和网络通信等实际问题中有着广泛的应用背景.首先证明了这个问题是一个NP难优化问题.并给出了一个时间复杂度为O(nlogn)的近似算法,其近似度为5/3. 算法的特点是结合中断时间δ\-i来应用LPT思想,而不只是把它应用到任务i的执行时间p\-i上,从而避免了LPT算法在最坏情形下的近似度差的问题.在算法的关键部分,运用了均分的技巧来提高任务执行的并行性,进一步提高了近似度.
嵌入式系统软硬件协同验证中软件验证方法
王世好, 王歆民, 刘明业,
2005, 42(3):  . 
摘要 ( 341 )   PDF (314KB) ( 472 )  
相关文章 | 计量指标
随着集成电路及计算机技术的发展,嵌入式系统设计变得越来越复杂.复杂的嵌入式系统设计,通常采用验证的手段检验系统设计的正确性,硬件验证通常是在硬件设计描述的基础上建立用于模拟硬件功能的硬件模拟器;软件验证常用的方法是建立处理器功能模型(指令集模拟器ISS),逐条解释嵌入式软件在目标机器上的执行过程,产生模拟输出,驱动外围电路(即硬件设计).指令集模拟器从底层时序关系模拟嵌入式软件在目标CPU上运行过程.对于复杂嵌入式系统设计,ISS模拟速度通常成为协同模拟瓶颈.基于RTOS的嵌入式软件快速验证方法可以有效地提高软件模拟速度,扩展RTOS功能,适应协同模拟需要,建立硬件模拟驱动,实现软件和硬件模拟器通信连接和协同模拟同步控制.基于RTOS的嵌入式软件验证方法以编译代码模型为基础,从系统行为级验证嵌入式软件功能,验证速度快.在实际应用中,该方法和ISS验证相结合,能够实现更有效、更快速的嵌入式系统协同验证.最后以几个典型硬件设计为基础,编写相应的控制软件,进行软硬件协同验证实验,实验结果数据说明该验证方法实用、有效、快速.
Web社区发现技术综述
杨 楠 弓丹志 李 忺 孟小峰
2005, 42(3):  1. 
摘要 ( 472 )   PDF (425KB) ( 1472 )  
相关文章 | 计量指标
Web是一个复杂超文本所组成的巨大的信息源,而且以很快的速度在不断的扩大.针对这样一个不断变化的信息源,如何利用和发现Web中的有用信息变得具有挑战性. Web在发展过程中存在着大量的社区,这些社区是Web组织中非常重要的信息.通过对社区信息的认识可以帮助我们总览Web的全貌.而将Web按照社区来组织有许多优点.社区可以引导用户找到感兴趣的信息;社区可以帮助Internet/Intranet服务提供者有效地组织门户;社区可以帮助制造商准确地找到消费者.社区还代表了Web的社会活动,因为Web就是一个社会性的网络.目前,许多社区的发现和维护是依靠人工来完成的,维护成本较高,修改也困难;此外,还存在着许多不为人知或者称为潜在的社区,而这些社区是无法通过人工来发现的.因此,许多研究都在致力于社区的自动或半自动发现技术.社区的发现主要采用基于Web图形的链接分析技术.在方法上大致上分为两类,一类是面向某个主题的社区发现,而另一个是无主题的社区发现技术.对于社区的发现技术做了较为全面的分析,并且总结了社区发现技术中依然存在的、挑战性的问题和未来的研究趋势.