Please wait a minute...
ISSN 1000-1239 CN 11-1777/TP

当期目录

2014年 第51卷 第9期    出版日期:2014-09-01
人工智能
基于卷积神经网络的正则化方法
吕国豪,罗四维, 黄雅平, 蒋欣兰
2014, 51(9):  1891-1900.  doi:10.7544/issn1000-1239.2014.20140266
摘要 ( 2831 )   HTML ( 6)   PDF (3024KB) ( 2392 )  
相关文章 | 计量指标
正则化方法是逆问题求解中经常使用的方法.准确的正则化模型在逆问题求解中具有重要作用.对于不同类型的图像和图像的不同区域,正则化方法的能量约束形式应当不同,但传统的L1,L2正则化方法均基于单一先验假设,对所有图像使用同一能量约束形式.针对传统正则化模型中单一先验假设的缺陷,提出了基于卷积神经网络的正则化方法,并将其应用于图像复原问题.该方法的创新之处在于将图像复原看作一个分类问题,利用卷积神经网络对图像子块的特征进行提取和分类,然后针对不同特征区域采用不同的先验形式进行正则化约束,使正则化方法不再局限于单一的先验假设.实验表明基于卷积神经网络的正则化方法的图像复原结果优于传统的单一先验假设模型.
一种具有O(1/T)收敛速率的稀疏随机算法
姜纪远,夏良,章显,陶卿
2014, 51(9):  1901-1910.  doi:10.7544/issn1000-1239.2014.20140161
摘要 ( 1156 )   HTML ( 1)   PDF (2898KB) ( 784 )  
相关文章 | 计量指标
随机梯度下降(stochastic gradient descent, SGD)是一种求解大规模优化问题的简单高效方法,近期的研究表明,在求解强凸优化问题时其收敛速率可通过α-suffix平均技巧得到有效的提升.但SGD属于黑箱方法,难以得到正则化优化问题所期望的实际结构效果.另一方面,COMID(composite objective mirror descent)是一种能保证L1正则化结构的稀疏随机算法,但对于强凸优化问题其收敛速率仅为O(logT/T).主要考虑“L1+Hinge”优化问题,首先引入L2强凸项将其转化为强凸优化问题,进而将COMID算法和α-suffix平均技巧结合得到L1MD-α算法.证明了L1MD-α具有O(1/T)的收敛速率,并且获得了比COMID更好的稀疏性.大规模数据库上的实验验证了理论分析的正确性和所提算法的有效性.
基于DBN模型的遥感图像分类
吕启, 窦勇,牛新, 徐佳庆, 夏飞
2014, 51(9):  1911-1918.  doi:10.7544/issn1000-1239.2014.20140199
摘要 ( 2224 )   HTML ( 6)   PDF (3333KB) ( 1930 )  
相关文章 | 计量指标
遥感图像分类是地理信息系统(geographic information system, GIS)的关键技术,对城市规划与管理起到十分重要的作用.近年来,深度学习成为机器学习领域的一个新兴研究方向.深度学习采用模拟人脑多层结构的方式,对数据从低层到高层渐进地进行特征提取,从而发掘数据在时间与空间上的规律,进而提高分类的准确性.深度信念网络(deep belief network, DBN)是一种得到广泛研究与应用的深度学习模型,它结合了无监督学习和有监督学习的优点,对高维数据具有较好的分类能力.提出一种基于DBN模型的遥感图像分类方法,并利用RADARSAT-2卫星6d的极化合成孔径雷达(synthetic aperture radar, SAR)图像进行了验证.实验表明,与支持向量机(SVM)及传统的神经网络(NN)方法相比,基于DBN模型的方法可以取得更好的分类效果.
融合显著信息的层次特征学习图像分类
祝军,赵杰煜,董振宇
2014, 51(9):  1919-1928.  doi:10.7544/issn1000-1239.2014.20140138
摘要 ( 1089 )   HTML ( 2)   PDF (3754KB) ( 1040 )  
相关文章 | 计量指标
高效的图像特征表示是计算机视觉的基础.基于图像的视觉显著性机制及深度学习模型的思想,提出一种融合图像显著性的层次稀疏特征表示用于图像分类.这种层次特征学习每一层都由3个部分组成:稀疏编码、显著性最大值汇聚(saliency max pooling)和对比度归一化.通过在图像层次稀疏表示中引入图像显著信息,加强了图像特征的语义信息,得到图像显著特征表示.相比于手工指定特征,该模型采用无监督数据驱动的方式直接从图像中学习到有效的图像特征描述.最后采用支持向量机(support vector machine, SVM)分类器进行监督学习,实现对图像进行分类.在2个常用的标准图像数据集(Caltech 101和Caltech 256)上进行的实验结果表明,结合图像显著性信息的层次特征表示,相比于基于局部特征的单层稀疏表示在分类性能上有了显著提升.
缺陷检测的稀疏表示模型及应用
李清勇,梁正平,黄雅平,史忠植
2014, 51(9):  1929-1935.  doi:10.7544/issn1000-1239.2014.20140153
摘要 ( 798 )   HTML ( 0)   PDF (1471KB) ( 894 )  
相关文章 | 计量指标
基于缺陷检测应用中图像的稀疏特性,提出了缺陷图像的稀疏表示模型以及基于稀疏性的缺陷分解算法.在该模型中,缺陷图像表示为图像背景、缺陷目标和噪声3种成分的叠加,并且图像背景和缺陷目标可以分别由对应的冗余字典稀疏表示;然后借鉴盲源分离原理和块协调松弛方法,实现缺陷目标成分的有效分解;最后,在钢轨表面擦伤检测应用中验证了该算法的性能.
基于RNN-RBM语言模型的语音识别研究
黎亚雄,张坚强,潘登,胡惮
2014, 51(9):  1936-1944.  doi:10.7544/issn1000-1239.2014.20140211
摘要 ( 2201 )   HTML ( 9)   PDF (1524KB) ( 1227 )  
相关文章 | 计量指标
近年来深度学习兴起,其在语言模型领域有着不错的成效,如受限玻尔兹曼机(restricted Boltz-mann machine, RBM)语言模型等.不同于N-gram语言模型,这些根植于神经网络的语言模型可以将词序列映射到连续空间来评估下一词出现的概率,以解决数据稀疏的问题.此外,也有学者使用递归神经网络来建构语言模型,期望由递归的方式充分利用所有上文信息来预测下一词,进而有效处理长距离语言约束.根据递归受限玻尔兹曼机神经网络(recurrent neural network-restricted Boltzmann machine, RNN-RBM)的基础来捕捉长距离信息;另外,也探讨了根据语言中语句的特性来动态地调整语言模型.实验结果显示,使用RNN-RBM语言模型对于大词汇连续语音识别的效能有相当程度的提升.
基于深度学习的作曲家分类问题
胡振, 傅昆, 张长水
2014, 51(9):  1945-1954.  doi:10.7544/issn1000-1239.2014.20140189
摘要 ( 1436 )   HTML ( 2)   PDF (2371KB) ( 1897 )  
相关文章 | 计量指标
在音乐信息检索领域,作曲家分类是一个十分重要的问题,这一问题的目标是通过音频数据来识别相应的作曲家信息.传统的分类算法都是通过提取复杂的特征来进行分类的,而深层神经网络在特征学习上具有比较强的能力,因此提出用深层神经网络来解决这一问题.为了结合不同深层神经网络模型的优点,设计了一种混合模型,该模型基于深度置信网络(deep belief network, DBN)和级联去噪自编码器(stacked denoising autoencoder, SDA),可以较好地解决作曲家分类问题.实验表明,该模型取得了76.26%的正确率,这一结果比单纯用某一种模型搭建的深层神经网络以及支持向量机要好.和图像数据类似,人脑在提取音乐特征也是分层的,每一层对信号的处理不一样,因此混合模型在解决作曲家分类问题上具有一定的优势.
系统结构
提升稀疏目录缓存一致性系统性能的方法
张轮凯,宋风龙,王达,范东睿,孙凝晖
2014, 51(9):  1955-1970.  doi:10.7544/issn1000-1239.2014.20131173
摘要 ( 687 )   HTML ( 3)   PDF (5576KB) ( 661 )  
相关文章 | 计量指标
稀疏目录技术在缓存一致性非一致存储访问(cache coherent non-uniform memory access, ccNUMA)系统中有广泛应用.但是,稀疏目录技术的一个主要缺陷在于目录项替换在目录热点存在的情况下会严重降低系统的性能.针对此问题,研究如何提升稀疏目录性能.首先,从定性和定量的角度对主流的稀疏目录替换算法进行了分析,并且发现最为原始的最久未使用(least-recent-used, LRU)算法的性能实际上要优于一些近期提出的目录替换算法,如最少共享者(least-sharer-count, LSC)算法.其次,将victim cache的思想应用到稀疏目录上,提出了victim目录(victim directory),该技术在主稀疏目录模块上加入了一个小的全相联二级目录存储.最后,提出了选择性victim目录(selective victim directory)技术,使得victim目录选择性地仅存储有用的目录项,从而进一步减少了目录替换的数量.选择性victim目录通过向所有节点的cache发出探查消息(probe messages),从而选择性地存储较为有用的目录项.实验证明,选择性victim目录取得了比简单victim目录更好的性能;而且在仅增加了1KB左右的硬件开销的代价下,选择性victim目录节省了35.7%的程序运行时间.
一种面向通信特征的3D NoC体系结构设计
王谛,赵天磊,唐遇星,窦强
2014, 51(9):  1971-1979.  doi:10.7544/issn1000-1239.2014.20130131
摘要 ( 784 )   HTML ( 2)   PDF (3195KB) ( 554 )  
相关文章 | 计量指标
三维集成电路(three dimensional integrated circuit, 3D IC)和片上网络(network on chip, NoC)是集成电路设计发展的两个趋势.将两者结合的三维片上网络(three dimensional networks on chip, 3D NoC)是当前研究的热点之一.针对现有3D NoC的研究没有充分关注硅片内与硅片间的异构通信特征.提出了面向通信特征的硅片间单跳步(single hop inter dies, SHID)体系结构,该结构采用异构拓扑结构和硅片间扩展路由器(express inter dies router, EIDR).通过实验数据的分析表明,与3D-Mesh和NoC-Bus这两种已有的3D NoC结构相比,SHID结构有以下特点:1)延迟较低,4层堆叠时比3D-Mesh低15.1%,比NoC-Bus低11.5%;2)功耗与NoC-Bus相当,比3D-Mesh低10%左右;3)吞吐率随堆叠层数增加下降缓慢,16层堆叠时吞吐率比3D-Mesh高66.98%,比NoC-Bus高314.49%.SHID体系结构同时具备性能和可扩展性的优势,是未来3D NoC体系结构良好设计选择.
基于定制协处理器的基因重测序加速技术研究
汤文,张春明,谭光明,张佩珩,孙凝晖
2014, 51(9):  1980-1992.  doi:10.7544/issn1000-1239.2014.20130987
摘要 ( 666 )   HTML ( 2)   PDF (3879KB) ( 519 )  
相关文章 | 计量指标
自2008年1月高通量测序技术应用以来,测序的通量和成本都在不断下降.然而基因数据的爆发式增长速度已经超过了摩尔定律,对海量数据的计算处理能力成为制约基因测序应用推广的瓶颈.以基于Hash索引的重测序算法为目标,对计算和访存行为进行分析,从而提出了一个现场可编程门阵列(field programmable gate array, FPGA)作为协处理器的架构,并在Convey公司的HC-1ex平台上进行了设计与实现.其基本处理单元内部采用全流水的设计及FIFO隔离计算模块和访存模块,可以完整执行重测序算法的核心流程.通过将基本处理单元和访存端口的一对一绑定,在4块Xilinx Virtex-6 LX760上实现了64路并行处理流程,总平均读内存带宽可达22.59GBps.与8核Intel Xeon处理器相比,可以提升28.5倍的性能.
基于虚通道故障粒度划分的3D NoC容错路由器设计
欧阳一鸣,张一栋,梁华国,黄正峰,常郝
2014, 51(9):  1993-2002.  doi:10.7544/issn1000-1239.2014.20131161
摘要 ( 703 )   HTML ( 0)   PDF (3440KB) ( 573 )  
相关文章 | 计量指标
深亚微米工艺下,路由器受制于制造缺陷及运行时的脆弱性,易发生虚通道(virtual channel, VC)永久性故障,从而引起通信故障,影响系统功能和性能.为了能够有效地容忍虚通道故障、保证系统性能及充分利用可用资源,将虚通道故障类型细分为粗粒度故障和细粒度故障,提出SVS(single VC sharing)路由器架构,通过将路由器端口两两分组,组内端口间实现单虚通道共享.当发生虚通道粗粒度故障时,使用组内相邻端口共享虚通道容错.当发生细粒度故障时,根据Slot State Table信息配置虚通道读/写指针的值,从而跳过故障Buffer槽实现容错.在无粗粒度故障情况下,共享虚通道还可用于负载平衡及容忍路由计算模块故障.实验结果表明:较其他已有的虚通道路由器,SVS路由器在3种不同的故障情况下均较大地降低了延时,提高了吞吐量.这表明SVS路由器可有效提高系统可靠性,保证了系统性能,充分利用了可用资源.
BTB索引散列算法的研究与设计
王国澎,胡向东,尹飞,朱英
2014, 51(9):  2003-2011.  doi:10.7544/issn1000-1239.2014.20130132
摘要 ( 854 )   HTML ( 0)   PDF (2569KB) ( 685 )  
相关文章 | 计量指标
分支误预测是影响高性能处理器性能进一步提升的一个主要因素.现代处理器采用分支目标缓存(branch target buffer, BTB)预测分支指令的目标地址,BTB的预测精度受限于其命中率.由于程序中分支指令的分布并不均匀,传统的BTB索引方式无法充分利用BTB资源,从而造成不必要的冲突缺失,影响分支目标地址的预测精度,采用散列索引方式优化访问映射关系是有效解决方法之一.当前大量文献研究了cache的访问方式,但对BTB的散列索引算法的专门探讨则显不足.为了消除分支指令的分布空洞,离散分支指令和BTB条目的固有映射关系,设计了用于BTB索引的XOR散列算法和优化的bit-select索引算法,使用概率方法对BTB单组最大映射数期望的上界作了估计,并对这两种散列索引算法的效果进行了模拟评估.实验结果表明,散列映射方式能够较好地避免BTB冲突缺失造成的预测失败,XOR散列算法的离散效果更好.
基于连续缓存和二级缓存的DFTL改进算法
姚英彪,沈佐兵
2014, 51(9):  2012-2021.  doi:10.7544/issn1000-1239.2014.20130660
摘要 ( 1246 )   HTML ( 2)   PDF (3088KB) ( 1484 )  
相关文章 | 计量指标
DFTL(demand-based FTL)是一种根据负载访问特点动态加载映射项到缓存中的知名FTL(flash translation layer)算法,但是它没有考虑到请求的空间局部性,而且缓存中的一个映射项剔除就可能会导致翻译页的更新,缓存中映射项的频繁剔除又会导致额外的擦除操作.在DFTL的基础上,提出了SDFTL(sequential/second cache DFTL)算法.SDFTL新设置连续缓存和二级缓存,连续缓存通过预取映射信息,利用请求的空间局部性,提高了FTL对连续负载的处理性能;二级缓存通过暂存从一级缓存中剔除的、发生更新的映射项,并采取批量更新策略回写到闪存,减少了闪存的翻译页写回次数和擦除次数.利用实际负载做的实验结果显示,SDFTL相比DFTL缓存命中率平均提高41.57%,擦除次数平均减少23.08%,响应时间平均减少17.74%.
一种将测试集嵌入到Test-per-Clock位流中的方法
刘铁桥,邝继顺,蔡烁,尤志强
2014, 51(9):  2022-2029.  doi:10.7544/issn1000-1239.2014.20130179
摘要 ( 502 )   HTML ( 0)   PDF (1709KB) ( 534 )  
相关文章 | 计量指标
集成电路测试方案的关键在于测试向量产生器的设计.传统的测试方法在测试向量生成、测试应用的过程中,没有充分利用测试数据位流来构建测试向量,从而造成了测试时间和存储开销的增加.为了减少测试成本,提出了一种基于test-per-clock模式的内建自测试方法.通过对线性移位测试结构的分析,提出了一种递进式的反复测试生成方法:顺序求解输入位流,逆向精简,多次求解以获得更优值,最终将测试集以较小的代价嵌入到test-per-clock位流中.在测试应用时,只需存储求解后的最小输入流,通过控制线性移位的首位从而生成所需的测试集.实验结果表明,在达到故障覆盖率要求的前提下,能显著地减少测试应用时间和存储面积开销.
软件技术
一种基于RGPS着色的C-net模型及其应用
黄贻望,何克清,冯在文,黄颖,谢芳
2014, 51(9):  2030-2045.  doi:10.7544/issn1000-1239.2014.20130595
摘要 ( 676 )   HTML ( 0)   PDF (5990KB) ( 591 )  
相关文章 | 计量指标
可配置业务流程模型描述面向领域的相似流程模型家簇,这种模型能够通过配置操作获取满足特定用户需求的个性化流程模型.提出一个在角色和目标约束下以流程为中心的可配置业务流程模型,首先对因果网模型(C-net)进行扩展,将该模型中的活动元素增加角色和目标两个约束关系,从而利用RGPS需求元模型框架中对角色(R)、目标(G)、流程(P)、服务(S)之间的约束规则和关联关系去约束业务流程活动之间的执行序列,使得模型有效反映了业务流程活动中的实际行为;然后将活动的输入绑定和输出绑定端口设置配置操作标记,通过对端口配置标记的操作形成个性化流程;最后,给出了模型的形式化定义并分析模型在业务流程配置中的应用,使得能够指导业务流程的配置等管理操作.
自稳定的分布式事务内存模型及算法
林菲,孙勇,丁宏, 任一支
2014, 51(9):  2046-2057.  doi:10.7544/issn1000-1239.2014.20130058
摘要 ( 816 )   HTML ( 0)   PDF (2238KB) ( 530 )  
相关文章 | 计量指标
针对具有瞬时故障的分布式系统,综合考虑系统鲁棒性和可扩展性,提出了一种自稳定的分布式事务内存模型(self-stabilizing distributed transactional memory, SSDTM).首先,利用分层技术和抵押组合理论建立模型框架,并对生成树算法进行了自稳定改进,以克服现有算法只能适应稳定环境的缺点;其次,将数据流技术与自稳定相结合,设计了数据对象操作方法,提高了系统的数据访问局部性;然后,在给出事务服务模型的基础上,提出了基于改进逻辑时钟的SSDTM并发控制算法;最后,结合理论推导,使用4个典型测试用例在SimJava环境下对SSDTM进行了多角度、大规模的分析和性能测试.结果表明,所提算法具有较强的参数鲁棒性和适用性,与其他模型相比,SSDTM具有更高的吞吐量和容错性.
一种可伸缩的多租户数据自适应存储方法
谷连超,崔立真
2014, 51(9):  2058-2069.  doi:10.7544/issn1000-1239.2014.20131339
摘要 ( 768 )   HTML ( 2)   PDF (3485KB) ( 632 )  
相关文章 | 计量指标
多租户是云应用的主要特征,在共享数据存储模式下,如何根据不同租户对数据请求的性能需求,实现多节点的数据动态伸缩存储是云数据管理的关键.提出一种可伸缩的多租户数据自适应存储方法,主要包括一个分段多维性能边界模型,用于判定数据节点能否满足不同租户的性能需求;一个基于贪婪的数据存储布局调整策略生成算法,制定对过载节点数据的移动和对未过载节点数据合并的策略.通过实验系统分析,该方法能够准确预测和判断系统是否过载,通过控制较少的数据移动,减少对系统性能的影响,使得云中共享数据节点能够满足不同租户的性能需求.
图形图像
频域二元纯相位编码压缩成像
张成,张芬,沈川,章权兵,韦穗,王岳
2014, 51(9):  2070-2080.  doi:10.7544/issn1000-1239.2014.20130304
摘要 ( 542 )   HTML ( 0)   PDF (3494KB) ( 512 )  
相关文章 | 计量指标
基金项目:NSFC-广东联合基金项目(U1201255);国家自然科学基金项目(61201396,61201227,61301296,61377006);高等学校博士学科点专项科研基金项目(20113401130001);安徽省自然科学基金项目(1208085QF114);安徽大学博士科研启动经费项目(33190218);安徽大学青年基金项目(KJQN1120)
结合颜色和梯度信息的稀疏图像修复算法
李志丹,和红杰,尹忠科,陈帆
2014, 51(9):  2081-2093.  doi:10.7544/issn1000-1239.2014.20130071
摘要 ( 709 )   HTML ( 1)   PDF (6623KB) ( 565 )  
相关文章 | 计量指标
现有基于稀疏性的图像修复算法仅利用颜色信息衡量样本块的相似度,易降低修复区域内结构部分的连通性及与邻域信息的连续一致性,同时在全局范围内搜索匹配块也增加了算法的运行时间.为解决上述问题,利用颜色与梯度模值信息度量样本块之间的距离,构造新的相似度以确定块结构稀疏度函数,利用块结构稀疏度确定填充顺序,同时构造新的匹配准则函数寻找匹配块;并利用块结构稀疏度值能够较好地反映样本块所处区域特征的特性,根据块结构稀疏度值自适应确定局部搜索区域大小.并通过实验验证在不同图像中颜色信息与梯度信息所占比例不同.实验结果表明,该算法较对比算法能够更好地保持结构部分的连贯性及与邻域信息的连续一致性,在峰值信噪比上至少提高1dB,并且算法速度提高4~11倍.
基于双粒子群协同优化的ECT图像重建算法
赵玉磊,郭宝龙,吴宪祥,王湃
2014, 51(9):  2094-2100.  doi:10.7544/issn1000-1239.2014.20131006
摘要 ( 753 )   HTML ( 0)   PDF (1589KB) ( 631 )  
相关文章 | 计量指标
由于电容层析成像(electrical capacitance tomography, ECT)系统中电容传感器的敏感场是“软场”,然而传统的图像重建算法是在忽略“软场”效应的条件下构建的,因此在提高成像精度上存在瓶颈.针对该问题,在分析敏感场分布,并讨论“软场”效应及其对图像重建产生的影响的基础上,提出一种基于双粒子群协同优化的图像重建算法.该算法通过引入用于构造粒子群优化适应度函数的先验条件,消除了因忽略“软场”效应而产生的影响,并通过最小二乘支持向量机得到不同流型下的先验条件.同时,该算法通过借鉴Lotka-Volerrra双群协同竞争模型,提出一种双群协同竞争方案,通过群内与群间的学习竞争提高粒子多样性,从而提高粒子群的全局收敛能力和收敛速度.实验结果表明,该算法不仅成像精度高、易收敛,而且具有抵抗测量信号中噪声干扰的特点.
压缩感知中迂回式匹配追踪算法
裴廷睿,杨术,李哲涛,谢井雄
2014, 51(9):  2101-2107.  doi:10.7544/issn1000-1239.2014.20131148
摘要 ( 1212 )   HTML ( 2)   PDF (1492KB) ( 3273 )  
相关文章 | 计量指标
迂回式匹配追踪(detouring matching pursuit, DMP)是一种计算复杂度低、准确率高、对传感矩阵列相关性要求低的贪婪重构稀疏信号算法.DMP中子内积逆和系数矩阵递增递减核心式被提出并证明,DMP利用子内积逆和系数矩阵减少残差误差变化量的计算量,达到降低计算复杂度的目的.另外,DMP采用先逐个最优缩减、后逐个最优扩增假定支撑集元素的方法提高重构准确率和扩大重构稀疏信号的稀疏度范围.DMP算法复杂度分析表明,DMP算法中获取、缩减和扩增假定支撑集的复杂度分别为O(K2N),O(b(K-b)N)和O(b(K-b)N).加权间接重构0-1稀疏信号实验结果表明,对于稀疏度为M/2的0-1稀疏信号,DMP、逐步贪婪追踪(greedy pursuit algorithm, GPA)、子空间追踪(subspace pursuit, SP)、压缩采样追踪(compressive sampling matching pursuit, CoSaMP)、正交匹配追踪(orthogonal matching pursuit, OMP)的重构准确率分别为99%,65%,0%,0%和13%.非零值服从正态分布的稀疏信号实验结果也表明DMP的重构准确率优势显著.
人工智能
大数据环境下用于实体解析的两层相关性聚类方法
王宁, 李杰
2014, 51(9):  2108-2116.  doi:10.7544/issn1000-1239.2014.20131345
摘要 ( 863 )   HTML ( 1)   PDF (1943KB) ( 794 )  
相关文章 | 计量指标
数据量大、数据更新速度快、数据源多样和数据存在噪声是大数据的四大特点,这为数据集成提出了新的挑战.实体解析是数据集成的一个重要步骤,在大数据环境下,传统的实体解析算法在效率、质量,特别是抗噪声能力方面的表现并不理想.为了解决大数据环境中因为数据噪声所导致的解析结果冲突,将公共邻居引入相关性聚类问题.上层预分块算法基于邻居关系设计,因而能够快速有效地完成初步分块;核概念的引入更精确地定义了节点与类之间的关联程度,以便下层调整算法准确地判断节点的归属,进而提高相关性聚类的准确度.两层算法采用较为粗糙的相似度距离函数,使得算法不仅简单而且高效.同时,由于引入邻居关系,算法的抗噪声能力明显提高.大量实验表明,两层相关性聚类算法无论在解析质量、抗噪声能力还是在扩展性方面均优于传统算法.
熵指数约束的模糊聚类新算法
黄成泉,王士同, 蒋亦樟
2014, 51(9):  2117-2129.  doi:10.7544/issn1000-1239.2014.20130305
摘要 ( 715 )   HTML ( 0)   PDF (3819KB) ( 568 )  
相关文章 | 计量指标
针对基于模糊C均值聚类(fuzzy C-means, FCM)算法框架的竞争聚集聚类(competitive agglomeration, CA)算法中模糊指数m被限定为2的问题,提出了一种更为普适的模糊聚类新算法.该算法首先在FCM算法框架的基础上引入熵指数约束条件,构造了基于熵指数约束的模糊C均值聚类(entropy index constraint FCM, EIC-FCM)算法,成功地将模糊指数m>1的约束条件转换为熵指数0
两类模糊有限状态机积的交换性
谢正卫, 翟莹, 黄飞丹, 易忠, 邓培民
2014, 51(9):  2130-2136.  doi:10.7544/issn1000-1239.2014.20121184
摘要 ( 666 )   HTML ( 1)   PDF (715KB) ( 597 )  
相关文章 | 计量指标
利用代数工具矩阵、半群等对两类模糊有限状态机的交换性作了进一步的研究.首先给出了模糊有限状态机是可交换的几个等价刻画,即模糊有限状态机交换与其状态转移矩阵关于模糊矩阵乘法交换等价,与其输入集上字符串关于同余关系构成的乘法半群交换等价,并讨论了模糊有限状态机的直积、级联积、圈积以及和的交换性.其次提出了Mealy-型模糊有限状态机是可交换的概念,同时在新的概念下详细地研究了Mealy-型模糊有限状态机的直积、级联积、圈积以及和、商的交换性.得到了两个(Mealy-型)模糊有限状态机的完全直积、和交换的充要条件;得到两个(Mealy-型)模糊有限状态机的圈积、级联积交换的一个充分条件;证明了商Mealy-型模糊有限状态机保持原Mealy-型模糊有限状态机的交换性.最后给出判别模糊有限状态机交换性的算法.