Please wait a minute...
ISSN 1000-1239 CN 11-1777/TP

当期目录

2006年 第43卷 第6期    出版日期:2006-06-15
论文
龙芯2号处理器设计和性能分析
胡伟武 张福新 李祖松
2006, 43(6):  959-966. 
摘要 ( 414 )   HTML ( 1)   PDF (484KB) ( 532 )  
相关文章 | 计量指标
介绍龙芯2号处理器设计及其性能测试结果.龙芯2号采用四发射超标量超流水结构,片内一级指令和数据高速缓存各64KB,片外二级高速缓存最多可达8MB.为了充分发挥流水线的效率,龙芯2号实现了先进的转移猜测、寄存器重命名、动态调度等乱序执行技术以及非阻塞的Cache访问和load Speculation等动态存储访问机制.龙芯2号处理器采用0.18μm的CMOS工艺实现,在正常电压下的最高工作频率为500MHz,500MHz时的实测功耗为3~5W. 龙芯2号单精度峰值浮点运算速度为20亿次/秒,双精度浮点运算速度为10亿次/秒,SPEC CPU2000的实测性能是龙芯1号的8~10倍,综合性能已经达到Pentium Ⅲ的水平.目前芯片样机能流畅运行完整的64位中文Linux操作系统,全功能的Mozilla浏览器、多媒体播放器和OpenOffice办公套件,可以满足绝大多数桌面应用的要求.
龙芯2号处理器功能部件设计
张 戈 齐子初 胡伟武
2006, 43(6):  967-973. 
摘要 ( 490 )   HTML ( 0)   PDF (377KB) ( 661 )  
相关文章 | 计量指标
功能部件是处理器中进行指令运算的核心单元,它的算法及其实现直接影响到处理器的总体性能.介绍了龙芯2号处理器的功能部件,探讨了从算法到物理设计等不同层次的功能部件设计方法.龙芯2号功能部件分为两个定点ALU和两个浮点ALU实现,除实现完整的MIPS定、浮点指令集外,还实现了龙芯2号类MMX自定义多媒体指令集以及定点操作在浮点部件(FPU)中的数据通路复用.龙芯2号浮点部件遵照IEEE754和MIPS相关标准,浮点加法4拍完成,浮点乘法5拍完成,浮点除法4~17拍完成.物理设计支持0.18μm工艺下主频500MHz的标准单元实现,浮点单精度峰值性能达到2GFLOPS,双精度峰值性能达到1GFLOPS.
龙芯2号微处理器的功能验证
张 珩, 沈海华,
2006, 43(6):  974-979. 
摘要 ( 438 )   HTML ( 2)   PDF (311KB) ( 592 )  
相关文章 | 计量指标
开发龙芯2号这样的高性能通用处理器是一项极其复杂的艰巨任务.龙芯2号处理器的设计规模和复杂度比龙芯1号增加了许多倍,如何保证设计的正确性是一个重大挑战.简单的系统级测试已经不能满足设计的需要,这就要求采用多种有效的、先进的验证方法和工具帮助设计者尽可能早的发现和改正设计错误.主要介绍了在龙芯2号处理器的设计开发过程中采用的功能验证流程和主要验证方法.模拟仿真是主要的验证手段,新的形式化验证方法也应用到了验证流程当中.
龙芯2号处理器系统优化关键技术
伍 鸣 张福新 林 伟 许先超 袁 楠 王 剑
2006, 43(6):  980-986. 
摘要 ( 449 )   HTML ( 2)   PDF (442KB) ( 507 )  
相关文章 | 计量指标
系统软件作为处理器和应用程序之间的接口,对于充分利用处理器的特性来维护处理器与应用程序的稳定性和提高应用程序的性能起着极其重要的作用.描述了在Linux内核中解决龙芯2号处理器的Cache别名问题的方法以及通过增加页的大小、软TLB和FAST_TLB_REFILL的方法减小TLB失效的性能损失,还有Uncache Accelerate对媒体播放软件的加速.实验结果表明,在系统软件中增加这些方法的支持,对系统的稳定性和性能都有较大的好处.
高性能通用微处理器体系结构关键技术研究
张民选 王永文 邢座程 邓让钰 蒋 江 张承义
2006, 43(6):  987-992. 
摘要 ( 497 )   HTML ( 4)   PDF (318KB) ( 746 )  
相关文章 | 计量指标
X处理器是我国自主设计的基于EPIC思想的高性能通用微处理器.介绍了8级流水线和OLSM执行模型,以很少的硬件代价克服了基本EPIC模型的局限性.设计了一种多分支预测结构,支持多条分支指令的并行执行,并通过判定执行减少分支指令的数目;设计了两级cache存储器,提出DTD低功耗设计方法,并通过前瞻执行隐藏访存的延迟.最后,展望了高性能通用微处理器的发展趋势.
“银河飞腾”高性能数字信号处理器研究进展
陈书明 李振涛 万江华 胡定磊 郭 阳 汪 东 扈 啸 孙书为
2006, 43(6):  993-1000. 
摘要 ( 657 )   HTML ( 0)   PDF (455KB) ( 680 )  
相关文章 | 计量指标
YHFT-DSP/700是2004年研制成功的“银河飞腾”系列超长指令字结构高性能浮点DSP,其主频达238MHz,峰值性能为每秒14亿次浮点运算和19亿条指令.介绍了YHFT-DSP/700的体系结构、设计方法和编译器等关键技术;介绍了同时多线程YHFT-DSP/SMT的体系结构,它可以将DSP的性能提高40%;分析了国际主流高性能DSP的体系结构和发展趋势.
基于组合解压缩电路的多扫描链测试方法
董 婕, 胡 瑜, 韩银和, 李晓维,
2006, 43(6):  1001-1007. 
摘要 ( 368 )   HTML ( 1)   PDF (375KB) ( 666 )  
相关文章 | 计量指标
提出一种采用组合电路实现解压缩电路的压缩方法,只需少量的输入管脚,可以驱动大量的内部扫描链.该方法利用确定性测试向量中存在的大量的不确定位(X位),采用对测试向量进行切片划分和兼容赋值的思想,通过分析扫描切片之间的兼容关系来寻找所需的外部扫描输入管脚的最小个数.实验结果表明,它能有效地降低测试数据量.此外,通过应用所提出的解压缩电路,扫描链的条数不再受到自动测试仪的限制,因此能充分发挥多扫描链设计降低测试应用时间的优点.
P2P网络环境下的一种高效搜索算法:Multilayer Light-Gossip
李仁发, 乐光学, 周祖德,
2006, 43(6):  1008-1018. 
摘要 ( 463 )   HTML ( 1)   PDF (684KB) ( 421 )  
相关文章 | 计量指标
由于现有非结构化P2P网络路由协议均在应用层实现,缺乏缓存机制和对Internet底层通信子网路由资源的利用,存在可扩展性差和效率不高的问题.在基于层域结构的RLP2P网络环境下,将路由空间分为域间和域内两层,结合泛洪和生成树搜索方式的优点,提出并实现了一种Multilayer Light-Gossip分级搜索算法和域间基于正六边形的蜂窝路由探测策略,把网络中的搜索消息分为域间和域内扩散两类分级扩散,以一定的消息冗余保持网络的稳健性和搜索的有效性,使定位某种服务的工作量和查询范围从网络中的所有结点数降到域内的节点数.运用预测评估方法对级间路由消息进行预分组,使消息能够自适应地沿着一条在时间度量上距离尽量短的路径前进.实验结果表明,Multilayer Light-Gossip算法大幅提高搜索效率和减少冗余消息,在广域环境下具有良好的搜索性能和扩展性.
ELIQoS:一种高效节能、与位置无关的传感器网络服务质量协议
毛莺池, 龚海刚, 刘 明, 陈道蓄, 谢 立,
2006, 43(6):  1019-1026. 
摘要 ( 410 )   HTML ( 2)   PDF (480KB) ( 468 )  
相关文章 | 计量指标
如何保证在覆盖足够的监测区域的同时延长网络的寿命是无线传感器网络所面临的最重要问题之一,广泛采用的策略是选出工作节点以满足应用期望的服务质量(即覆盖率),同时关闭其他冗余节点.分析了随机部署网络在已知监测区域大小和节点感知范围情况下,无需节点位置信息,应用期望的服务质量与所需的工作节点数量之间的数学关系.在此基础上提出了一种高效节能、与位置无关的传感器网络服务质量协议(ELIQoS),协议根据节点能量大小,选取最少的工作节点满足应用期望的服务质量.实验结果表明,ELIQoS协议不仅可以有效地提供满足应用期望的服务质量,而且可以减少能量消耗,实现能耗负载均衡.
加权Internet访问直径短期及长期预测行为分析
赵 海 徐 野 苏威积 张文波 张 昕
2006, 43(6):  1027-1035. 
摘要 ( 371 )   HTML ( 0)   PDF (584KB) ( 372 )  
相关文章 | 计量指标
Internet物理特征量短期及长期预测是一个重要课题,为此,首先定义了加权Internet网络,然后形式化定义表征加权Internet的物理参量——加权Internet访问直径,接下来根据海量数据变化特点,提出了基于Logistic模型的、以正余弦函数模拟振荡变化的数学模型,使用浮点型遗传算法分别进行拟合实验,并通过实验结果对上述模型进行了评价和选优.由于加权访问直径演化极为复杂,传统的一维数学模型在长期预测中已不适用.因此,在长期预测方面,首先计算得到加权Internet访问直径的关联维数,证实其演化过程为混沌现象,存在奇异吸引子.最后根据关联维数及奇异吸引子相近空间混沌轨道运动特性,提出了基于四维微分方程组的加权访问直径长期预测的形式模型.
缓冲交叉开关交换结构多播调度算法研究
孙书韬, 贺思敏, 郑燕峰, 高 文,
2006, 43(6):  1036-1043. 
摘要 ( 491 )   HTML ( 1)   PDF (489KB) ( 402 )  
相关文章 | 计量指标
高性能核心交换设备多播调度受到越来越多的关注.交叉开关结构下的多播调度方案或者性能较差,或者过于复杂,难于应用在高速交换场合.为此,提出一种面向多播的多输入队列缓冲交叉开关体系结构.将多播调度分解为信元分派、输入调度、输出调度3个可分布式并行执行的子问题,并设计了相应的调度算法,降低了算法复杂性.实验结果表明,交叉点缓冲区容量与输入队列数量对多播性能都具有很大的影响.在突发流量到达下,与单多播输入队列的体系结构相比,无论是采用O(1)复杂度的HA-RR-RR还是复杂度更高的调度算法,均能显著提高系统吞吐性能.
改进的PageRank在Web信息搜集中的应用
秦 拯, 张 玲, 李 娜,
2006, 43(6):  1044-1049. 
摘要 ( 375 )   HTML ( 1)   PDF (366KB) ( 537 )  
相关文章 | 计量指标
PageRank是一种用于网页排序的算法,它利用网页间的相互引用关系评价网页的重要性.但由于它对每条出链赋予相同的权值,忽略了网页与主题的相关性,容易造成主题漂移现象.在分析了几种PageRank算法基础上,提出了一种新的基于主题分块的PageRank算法.该算法按照网页结构对网页进行分块,依照各块与主题的相关性大小对块中的链接传递不同的PageRank值,并能根据已访问的链接对块进行相关性反馈.实验表明,所提出的算法能较好地改进搜索结果的精确度.
基于属性的扩展委托模型
叶春晓, 吴中福, 符云清, 钟 将, 冯 永,
2006, 43(6):  1050-1057. 
摘要 ( 359 )   HTML ( 1)   PDF (469KB) ( 389 )  
相关文章 | 计量指标
为提高委托过程的安全性,对现有委托模型进行了扩展,提出了一个更加安全的基于属性的扩展委托模型(ABDM\-A). ABDM\-A中的委托约束不但包括委托先决条件(CR),还包含委托属性表达式(DAE).受托者必须同时满足委托先决条件和委托属性表达式才能被委托权限或角色.为保证委托过程的灵活性,ABDM\-A将委托属性表达式进一步分为永久和临时委托属性表达式,使得委托者可临时而不是永久地将某些高级权限委托给不具备资格的用户. ABDM\-A提高了委托过程的安全性,减轻了委托者和系统管理员的负担.
基于污染数据分析实现LSB秘密消息的检测
刘文芬 管 伟 曹 佳 张卫明
2006, 43(6):  1058-1064. 
摘要 ( 432 )   HTML ( 2)   PDF (410KB) ( 370 )  
相关文章 | 计量指标
信息隐藏技术已经成为网络信息安全的一个重要研究方向,如何有效地监控和检测网络中传递的秘密消息对于保障国家安全具有重要的现实意义.针对互联网上大量的隐写软件利用彩色及灰度图像的最低有效比特位(LSB)隐藏秘密消息,基于污染数据分析,提出了一种新的隐写分析方法,并给出了此算法的数学模型.该方法不仅可以快速有效地检测出图像中秘密消息的存在性,同时还可以精确地估计出连续及随机间隔嵌入算法下所嵌入秘密消息的长度.
多域间动态角色转换的职责分离
廖俊国, 洪 帆, 朱 贤, 肖海军,
2006, 43(6):  1065-1070. 
摘要 ( 467 )   HTML ( 0)   PDF (389KB) ( 489 )  
相关文章 | 计量指标
两个或多个管理域间的安全互操作是一个重要的研究课题. Kapadia等人提出的IRBAC 2000模型通过动态角色转换灵活地实现了域间安全互操作.在IRBAC 2000模型中每个管理域均采用RBAC模型,职责分离是RBAC模型支持的最基本的3个安全原则之一,并可用一组静态互斥角色约束来表示.而IRBAC 2000模型没有考虑职责分离.因此,对动态角色转换违背静态互斥角色约束的各种情形进行了详细分析,并抽象出各种情形的本质特征;对动态角色转换是否会违背静态互斥角色约束提供了一种判定方法并给出了相应的算法;提出了使用先决条件来加强IRBAC 2000模型安全性的保护机制.
正形置换的枚举与计数
任金萍 吕述望
2006, 43(6):  1071-1075. 
摘要 ( 370 )   HTML ( 1)   PDF (260KB) ( 479 )  
相关文章 | 计量指标
正形置换在密码算法的设计中占有很重要的地位.研究正形置换的特性、枚举、计数对于密码设计和密码分析均具有重要的意义.正形置换的理论研究已成为国内外密码学编码理论的热点问题.对正形置换的计数和枚举问题进行讨论,利用和阵给出了正形置换的一个枚举方法,利用该方法可以列出所有的n阶正形置换.国内外相关文献中还未见到正形置换的枚举方法.由该枚举法得出了n阶正形置换个数N\-n的上界和下界,这个结果比迄今为止给出的结果都要好,是目前给出的最优上下界.
高速、可配置RSA密码协处理器的VLSI设计
范益波 曾晓洋 于 宇
2006, 43(6):  1076-1082. 
摘要 ( 687 )   HTML ( 0)   PDF (479KB) ( 441 )  
相关文章 | 计量指标
通过算法级分析和对比RSA原始算法以及改进型模幂模乘算法,提出了一种双重流水线结构的RSA密码协处理器体系结构,该结构具备高速、可配置性能.基于该体系结构,可以根据不同的用户需求,方便地设计出支持各种速度和密钥长度的RSA密码处理器.该体系结构尤其适用于设计高速、高位宽RSA密码芯片;同时其可配置性能也可以满足低速、高位数、高安全性RSA系统的市场需求.另外,基于该体系结构设计的RSA加密IP,非常适合SoC的芯片设计.最后,基于该体系结构设计了一款高速1024b RSA密码加密芯片,采用0.18μm标准单元库设计,实现结果显示,芯片在150MHz时钟频率下能完成每秒5000次1024b RSA加密运算,是国内同类产品中速度最快的.
一种不影响任务集合可调度性的优先级映射算法
王保进, 李明树,
2006, 43(6):  1083-1089. 
摘要 ( 411 )   HTML ( 0)   PDF (391KB) ( 401 )  
相关文章 | 计量指标
采用静态优先级调度的实时系统中,当任务个数多于优先级个数时,只能给多个任务分配相同的优先级.现有分配算法增大了高优先级任务的最坏情况响应时间,可能造成任务集合不可调度.利用抢占阈值的调度算法,能在提高任务集合可调度性的同时,使用较少的线程.但所用优先级个数没有减少.提出了一种优先级映射算法——阈值段间映射法(threshold segment mapping, TSM),以及与之配合的事件驱动线程框架.证明了TSM是严格排序的.仿真结果表明,在保证任务集合可调度的前提下,TSM使用了比现有映射算法更少的优先级.
低能耗软件设计中的性能无损电压调度技术研究
雷 霆 李 曦 周学海
2006, 43(6):  1090-1096. 
摘要 ( 295 )   HTML ( 3)   PDF (391KB) ( 352 )  
相关文章 | 计量指标
合理地运用动态电压调整技术可以有效降低软件运行所需的能耗.从归纳分析电压调整特征入手,针对程序执行中存在电压调整特征差异的情况,提出了性能无损的低能耗电压调度问题.把该问题形式化为一个混合整数规划模型(MILP),提出了基于剖析结果的PGS算法和基于分析结果的ADS算法.实例分析表明所提出的方法能够有效实现性能无损的低能耗软件设计,模拟实验表明启发式算法可实现较好的近似解.
增量ETL过程自动化产生方法的研究
张旭峰 孙未未 汪 卫 冯雅慧 施伯乐
2006, 43(6):  1097-1103. 
摘要 ( 589 )   HTML ( 1)   PDF (382KB) ( 482 )  
相关文章 | 计量指标
ETL过程用于将数据从数据源装载到数据仓库中,它可以被划分为两种类型:全量ETL过程和增量ETL过程.全量ETL过程只能处理全量数据,但易于设计.而增量ETL过程设计起来比较复杂,但适用于处理增量数据.主要对增量ETL过程的自动化产生方法进行了研究,根据已有的全量ETL过程,可以自动产生增量ETL过程,从而降低设计增量ETL过程的代价.利用已有的物化视图增量维护的方法,给出了根据全量ETL过程自动产生增量ETL过程的方法.但是已有的研究集中在包含选择、投影、联接和聚合运算情况下物化视图的增量维护,未见对包括差运算情况下的讨论.作为研究工作的基础,还详细讨论了包含差运算情况下物化视图的增量维护问题.
多Agent系统中双边多指标自动协商的ACEA算法
高 坚 张 伟
2006, 43(6):  1104-1108. 
摘要 ( 432 )   HTML ( 0)   PDF (281KB) ( 445 )  
相关文章 | 计量指标
自动协商是多Agent系统中的一个中心议题,它是在Agent间建立一种合作合约,多数情况下这种合约包含多个协商指标,而多指标的协商比单一指标的协商要复杂得多.因此,如何快速、高效地进行Agent间的多指标自动协商是多Agent系统中必须解决的一个问题.给出了一个Agent间多指标协商的模型(MN),并在此基础上提出了双边—多指标协商的一种加速混沌进化算法(ACEA). ACEA算法首先将混沌机制引入进化计算,然后采用压缩技术对算法进行加速,这样既克服了进化计算过早收敛到局部Nash平衡点的缺点,又解决了多指标协商繁杂的计算和引入混沌后带来的收敛速度慢的问题.理论分析和仿真实验表明,ACEA算法以概率1收敛到全局最优解.
面向认知协作的知识流分析与研究
窦万春 刘茜萍 蔡士杰
2006, 43(6):  1109-1114. 
摘要 ( 371 )   HTML ( 1)   PDF (303KB) ( 560 )  
相关文章 | 计量指标
为了有效地对认知科学中基于群学习方式的认知协作进行研究,首先探讨了基于本体描述的认知基础环境,对知识驱动的认知环境所涉及的一些基本概念进行了定义.进而,基于本体论思想,对支持认知协作的知识应用集成环境进行了探讨.在此基础上,对知识流关系进行了形式化定义,并利用Markov决策过程理论分析研究了知识应用集成环境下协同认知的过程逻辑.最后,对全文进行了总结并提出了进一步的研究方向.
基于动态分界点计算的并行几何校正算法
欧新良, 陈松乔, 常志明,
2006, 43(6):  1115-1121. 
摘要 ( 426 )   HTML ( 0)   PDF (518KB) ( 414 )  
相关文章 | 计量指标
近年来,遥感图像几何校正的并行处理成为重点研究的对象.但现有的并行算法尚存在一些问题,这些算法不具备负载平衡能力或者全局计算量大,而且局部操作非常耗时.针对以上不足提出了一种基于动态分界点计算的并行几何校正算法PIWA-DDC. 通过LogP模型,推导出PIWA-DDC算法具有良好的可扩展性.通过在MPP上的测试数据,验证了该算法具有良好的负载平衡能力和高效处理几何畸变的能力.
现代汉语通用分词系统中歧义切分的实用技术
罗智勇, 宋 柔,
2006, 43(6):  1122-1128. 
摘要 ( 459 )   HTML ( 2)   PDF (379KB) ( 615 )  
相关文章 | 计量指标
歧义切分技术是中文自动分词系统的关键技术之一.特别是在现代汉语通用分词系统(GPWS)中,允许用户动态创建词库、允许多个用户词库同时参与切分,这给歧义切分技术提出了更高的实用性要求.从大规模的真实语料库中,考察了歧义(特别是交集型歧义)的分布情况和特征;提出了一种改进的正向最大匹配歧义字段发现算法;并根据GPWS的需求,提出了一种“规则+例外”的实用消歧策略.对1亿字《人民日报》语料(约234MB)中的交集型歧义字段进行了穷尽式的抽取,并随机的对上述策略进行了开放性测试,正确率达99%.
多文档文摘中句子优化选择方法研究
秦 兵 刘 挺 陈尚林 李 生
2006, 43(6):  1129-1134. 
摘要 ( 321 )   HTML ( 4)   PDF (340KB) ( 591 )  
相关文章 | 计量指标
在多文档文摘子主题划分的基础上,提出了一种在子主题之间对文摘句优化选择的方法.首先在句子相似度计算的基础上,形成多文档集合的子主题,通过对各子主题打分,确定子主题的抽取顺序.以文摘中有效词的覆盖率作为优化指标,在各个子主题中选择文摘句.从减少子主题之间及子主题内部的信息的冗余性两个角度选择文摘句,使文摘的信息覆盖率得到很大提高.实验表明,生成的文摘是令人满意的.