Please wait a minute...
ISSN 1000-1239 CN 11-1777/TP

当期目录

2018年 第55卷 第5期    出版日期:2018-05-01
人工智能
基于特征变权的动态模糊特征选择算法
王玲,孟建瑶
2018, 55(5):  893-907.  doi:10.7544/issn1000-1239.2018.20170503
摘要 ( 959 )   HTML ( 6)   PDF (3893KB) ( 670 )  
相关文章 | 计量指标
针对大多数动态特征选择算法不能实时地根据特征重要性的变化动态优化模糊特征的问题,提出了基于特征变权的动态模糊特征选择算法.该算法利用滑动窗口分割模糊化后的数据,在第1个窗口中进行离线模糊特征选择,根据输入模糊特征与输出特征的互信息量,计算各个模糊输入特征的权重,获取候选模糊特征子集,并采取后向特征选择的方式和模糊特征筛选指标得到优化模糊特征子集;在随后的窗口中进行在线模糊特征选择,结合当前窗口的候选模糊特征子集和已有模糊特征选择结果,计算模糊输入特征的重要度,获得当前窗口中的优化模糊特征子集.通过计算窗口之间模糊特征权重的变化,发现输入模糊特征的演化关系.不同数据集的仿真结果表明,所提出算法在自适应性和预测准确性方面均有显著提高.
基于网格热度值的船舶规律路径提取算法
李建江,陈玮,李明,张凯,刘雅俊
2018, 55(5):  908-919.  doi:10.7544/issn1000-1239.2018.20170226
摘要 ( 814 )   HTML ( 2)   PDF (3427KB) ( 523 )  
相关文章 | 计量指标
随着无线传感器、卫星、GPS(global positioning system)等移动目标定位技术的发展,产生的移动数据(诸如人类足迹、车辆行驶轨迹和船舶轨迹等)的规模越来越大.而移动目标检测设备只会存储一系列离散点的信息,所以基于离散点来追踪和恢复其完整的轨迹是更加全面掌握移动目标运动规律的必要前提.数据挖掘方法能从移动目标的历史位置信息中挖掘出“规律”路径,其中基于网格的聚类分析方法不仅能有效表达这些轨迹点,还能分析出这些轨迹点之间的关系,是提取规律路径的有效方法.为此,提出了基于网格“热度值”的距离和密度相结合的热度因子相似性度量方法,进而给出了移动目标规律路径提取算法.最后,使用船舶自动识别系统(automatic identification system, AIS)生成的船舶实际动态数据进行测试,来验证该算法的精度和性能.算法分析和实验结果表明:基于网格热度值的规律路径提取算法能有效地发现不同形状的轨迹序列.
基于主题序列模式的旅游产品推荐引擎
朱桂祥,曹杰
2018, 55(5):  920-932.  doi:10.7544/issn1000-1239.2018.20160926
摘要 ( 924 )   HTML ( 4)   PDF (4422KB) ( 601 )  
相关文章 | 计量指标
旅游产品推荐是当前推荐系统研究领域中的新兴议题之一.由于旅游产品描述信息维度多样复杂、“用户-产品”关联矩阵极为稀疏且冷启动问题突出,已经在电子商务领域获得成功的协同过滤推荐往往难以直接被应用于旅游产品推荐.提出基于主题序列模式的旅游产品推荐引擎SECT,试图通过在线旅游网站点击日志的挖掘产生推荐.首先,从页面语义描述文本中挖掘主题,以在泛化层面捕捉用户行为模式;其次,从页面访问时间序列数据中挖掘频繁序列模式及其候选产品集,形成序列模式库;最后,提出Markov n-gram模型,完成用户实时点击流与模式库匹配计算.为了提升在线匹配计算的效率,设计一种新的多叉树数据结构PSC-tree用于存储历史模式库,并与在线计算模块无缝衔接.在真实旅游数据集上的实验结果表明:该推荐引擎比传统推荐算法具有更优越的性能,而且能有效提升冷启动用户的推荐率和准确率.此外,针对长尾物品的推荐,SECT也优于基准算法.
基于双向分层语义模型的多源新闻评论情绪预测
张莹,王超,郭文雅,袁晓洁
2018, 55(5):  933-944.  doi:10.7544/issn1000-1239.2018.20160947
摘要 ( 619 )   HTML ( 1)   PDF (2493KB) ( 476 )  
相关文章 | 计量指标
随着在线新闻服务的迅猛发展,用户在阅读新闻后可以非常方便地表达自己的主观情绪,有效分析和预测用户的情绪有助于新闻服务提供商为新闻用户提供更好的服务.情绪标注研究已经取得了很多优秀的成果,但仍然存在着一些问题:1)传统的方法将整个文档看作单词流或词袋,不能对句子间的逻辑关系进行建模,在文档中的句子间包含逻辑关系时,这些方法无法适当地表达文档的语义;2)这些方法只用了文档本身的语义,忽略了与该文档相关的其他信息源中信息,而这些信息源对该文档的语义表达也有一定的影响.为了解决这些问题,提出了一种基于多信息源的在线新闻评论双向分层语义表示模型,称为双向分层语义神经网络(bi-directional hierarchical semantic neural network, Bi-HSNN),该模型既捕获句子中词语所表达的情感,又自底向上地学习文档中句子间的逻辑关系,并利用评论、新闻和用户投票等多种信息源对在线新闻评论的情绪进行标注.在真实数据集上的一系列实验,验证了该模型的有效性.
基于多通道卷积神经网络的中文微博情感分析
陈珂,梁斌,柯文德,许波,曾国超
2018, 55(5):  945-957.  doi:10.7544/issn1000-1239.2018.20170049
摘要 ( 1408 )   HTML ( 24)   PDF (2794KB) ( 1091 )  
相关文章 | 计量指标
近年来,深度学习在情感分析任务中的应用得到了越来越多的关注.针对以文本词向量作为输入的卷积神经网络无法充分利用情感分析任务中特有的情感特征信息,以及难以有效表示每个词语在句子中的重要程度等问题,提出一种基于多通道卷积神经网络(multi-channels convolutional neural networks, MCCNN)的中文微博情感分析模型.该模型针对情感分析任务中特有的情感信息来构建文本输入矩阵,使模型在训练过程中有效获取输入句子的情感特征信息.同时,该模型通过将不同特征信息结合形成不同的网络输入通道,使网络模型在训练过程中从多方面的特征表示来学习输入句子的情感信息,有效表示出每个词语在句子中的重要程度,获取更多的隐藏信息.最后在COAE2014数据集和微博语料数据上进行实验,取得了比普通卷积神经网络、结合情感信息的卷积神经网络和传统分类器更好的性能.
基于粗糙集知识发现的开放领域中文问答检索
韩朝,苗夺谦,任福继,张红云
2018, 55(5):  958-967.  doi:10.7544/issn1000-1239.2018.20170232
摘要 ( 794 )   HTML ( 4)   PDF (1830KB) ( 474 )  
相关文章 | 计量指标
基于信息检索的开放领域问答系统,其主要原理是先使用语义分析工具和知识库获得确定性的语义和知识等信息,然后再进行问答句匹配度计算.但在实际的中文问答系统应用中,由于中文语言表达的不确定性和中文知识表达的不确定性大量存在,现有的匹配度计算方法不适合大量不确定性存在的应用场景.针对这一问题,提出了一种基于粗糙集知识发现的中文问答检索方法,利用粗糙集的属性约简方法和上近似概念从已标注的问答语料库中发现并表示知识,再结合传统的句子相似度方法对问句和候选句进行匹配度计算.实验结果表明:相对传统的问答检索方法,该方法在MAP和MRR两个评测指标上均有提升.
一种基于社区专家信息的协同过滤推荐算法
张凯涵,梁吉业,赵兴旺,王智强
2018, 55(5):  968-976.  doi:10.7544/issn1000-1239.2018.20170253
摘要 ( 997 )   HTML ( 8)   PDF (1530KB) ( 525 )  
相关文章 | 计量指标
协同过滤推荐算法由于不受特定领域知识限制、简单易实现等优点,得到了广泛的应用.但是,在实际应用中,该类算法往往面临着数据稀疏性、可扩展性、冷启动等问题.为了解决其中的用户冷启动问题,将用户社交信息和评分信息进行融合,提出了一种基于社区专家信息的协同过滤推荐算法.首先,依据用户的社交关系将用户划分为不同的社区;其次,根据一定的准则确定各个社区的专家,并利用社交信息和评分信息对专家评分进行填充进而缓解稀疏性;最后,对冷启动用户根据其所属社区的专家信息进行预测评分.在数据集FilmTrust和Epinions上与已有协同过滤推荐算法进行了比较分析.实验结果表明,提出的算法可以有效缓解协同过滤推荐算法中的用户冷启动问题,并在平均绝对误差和均方根误差2个评价指标上优于已有算法.
基于基准相似空间分布优化的偏好预测方法
高岭,高全力,王海,王伟,杨康
2018, 55(5):  977-985.  doi:10.7544/issn1000-1239.2018.20160924
摘要 ( 592 )   HTML ( 1)   PDF (2635KB) ( 356 )  
相关文章 | 计量指标
针对现有推荐系统所采用的行为相似度度量方法,受数据稀疏性的影响难以获取到用户真正的偏好最近邻,影响了推荐准确度的问题,提出了一种结合基准相似空间分布优化的用户偏好获取方法.首先通过余弦相似度、修正的余弦相似性、皮尔森相关系数等偏好行为相似程度度量方法,获取用户与用户间原始的偏好行为近似程度,根据近似程度的分布特征首先获取偏好中心点,并根据偏好行为近似程度距偏好中心点的行为距离获取平均相似幅度,进而生成基准相似空间,通过建立基于平均近邻与异常评分交互影响的修正模型,优化基准相似空间,并据此为用户生成推荐列表.在大规模真实数据集上的实验结果表明:所提出方法与现有方法WSCF与OTCF相比,平均绝对误差分别降低了12.8%与9.7%,覆盖率分别提升了5.79%与3.83%,多样性与WSCF基本一致,相比OTCF增加了近4.3%,即是所提出方法提升了推荐精度与推荐质量.
结合近邻传播聚类的选择性集成分类方法
孟军,张晶,姜丁菱,何馨宇,李丽双
2018, 55(5):  986-993.  doi:10.7544/issn1000-1239.2018.20170077
摘要 ( 648 )   HTML ( 1)   PDF (1253KB) ( 426 )  
相关文章 | 计量指标
从海量的基因微阵列数据中提取出有价值的信息是生物信息学的研究热点.基因微阵列数据具有高维度、小样本和高冗余的特性.因此,提出一种基于相交邻域粗糙集的基因选择方法,挑选出关键基因用于对微阵列数据进行分类.首先利用pathway知识进行基因初步选择,每个pathway单元对应一个基因子集,然后采用基于粗糙集的属性约简方法筛选出无冗余的关键基因.由于pathway知识单元的数量较多,对应生成大量的基分类器,为了进一步提高基分类器之间的差异性和集成的效率,对基分类器进行选择是十分必要的.近邻传播聚类不需要提前设定聚簇数量和起始点并且可以更快速、精确地进行聚类.因此,使用近邻传播聚类方法对基分类器进行分组,产生差异性较大的聚簇,再从每个簇中选择一个分类器构建集成分类器.在拟南芥的生物和非生物胁迫响应相关的微阵列数据集上的实验结果表明:在准确率方面,提出的方法与现有的集成方法相比最多可以提高12%.
信息安全
指定验证者与可撤销重加密的可搜索加密方案
徐潜,谭成翔,樊志杰,冯俊,朱文烨,校娅
2018, 55(5):  994-1013.  doi:10.7544/issn1000-1239.2018.20161051
摘要 ( 796 )   HTML ( 4)   PDF (3264KB) ( 494 )  
相关文章 | 计量指标
隐藏向量加密(hidden vector encryption, HVE)作为一种谓词加密策略,不仅可以对解密密钥进行细粒度的控制,同时也支持对关键词的合取和子集等范围搜索,因此可以被应用在诸如电子健康记录等系统中,以保护用户敏感数据并提供密文检索功能.然而,目前已有的隐藏向量加密策略均未考虑离线关键词测试攻击和可撤销的代理访问控制.针对这一问题,提出了一种支持指定验证者和基于时间的可撤销代理重加密的高效的隐藏向量加密方案.代理人可以在数据拥有者指定的时间区间内访问密文数据,而当超过预定的时间后,代理权限将被自动撤销.由于只有指定的验证者可以执行验证操作,使得方案可以有效地抵御离线关键词测试攻击.提出的可搜索加密方案不仅在标准模型下面对选择关键词、选择时间攻击是可证明安全的,同时,搜索令牌的尺寸、重加密算法的时间复杂度以及验证操作的双线性对运算次数均限定在O(1)常数界限内.因此,方案具有较好的安全性和实用效率.
软件技术
面向环境与需求不确定性的系统自适应决策
杨卓群,金芝
2018, 55(5):  1014-1033.  doi:10.7544/issn1000-1239.2018.20161039
摘要 ( 810 )   HTML ( 2)   PDF (9408KB) ( 344 )  
相关文章 | 计量指标
软件系统在运行时会与其他软硬件系统、设备和用户发生密切交互.软件运行环境呈现出不稳定的特点,同时软件需求也可能会发生变化.由于难以准确预测和描述软件运行时的环境及需求,两者的变化具有不确定性.为提供持续服务,软件需要通过自适应能力,根据环境和自身的变化来调节其行为.不确定性给软件的自适应过程带来很大挑战.现有相关工作主要关注环境变化给需求带来的影响,以及环境变化时如何调节软件行为来满足固定的需求.这些方法难以处理需求不确定时自适应过程中的变化性和复杂性.针对该问题,提出一种基于模糊控制的自适应决策方法,以应对运行时环境与需求的不确定性.首先通过模糊逻辑建模与规约环境和软件中的变化要素,并构建要素间的推理规则;其次基于前馈-反馈控制结构和模糊控制器设计自适应机制;最后通过模糊推理和遗传算法实现决策求解.不同环境和约束下的自适应结果表明:软件能够通过自适应机制和算法求得优化决策.为验证方法的可行性和有效性,通过一个移动端比特币采矿机案例进行了评估.
一种支持数据去冗和扩容的多媒体文件云存储系统实现
汪帅,吕江花,汪溁鹤,吴继芳,马世龙
2018, 55(5):  1034-1048.  doi:10.7544/issn1000-1239.2018.20160853
摘要 ( 613 )   HTML ( 4)   PDF (4095KB) ( 323 )  
相关文章 | 计量指标
随着互联网的发展,存储多媒体文件的场景日益增多,云存储系统成为了业界焦点,很多云存储系统为应用程序提供数据存储、查询和计算服务.许多应用程序拥有大量重复的体积较小的多媒体文件,传统的分布式文件系统已不能满足多媒体文件对存储性能的需求,它们通常会把多媒体文件分块存储在不同的存储服务器上,每次获取文件内容都需要从多个块结点把数据获取到,然后重构文件内容给应用程序,导致访问这类体积较小的多媒体文件会消耗更多的资源.为了解决数据冗余度高的应用程序在低存储成本条件下对多媒体文件进行分布式存储的问题,同时为了提高这类应用程序的运行效率,首先提出一种分布式存储目录建模方案,可以用来描述数据中心的存储目录逻辑结构;然后实现了一个多媒体文件云存储系统MFCSS,支持数据去冗和存储目录逻辑扩容.分析和实验结果表明:MFCSS系统在保存数据冗余度较高的多媒体文件时具有良好的性能,可以有效提高磁盘的存储效率,同时具备良好的扩展性,可以简化应用程序管理分布式存储环境中多媒体文件的过程.
基于混合编码的FPGA系统配置文件压缩算法
伍卫国,王超辉,王今雨,聂世强,胡壮
2018, 55(5):  1049-1064.  doi:10.7544/issn1000-1239.2018.20170015
摘要 ( 647 )   HTML ( 4)   PDF (4640KB) ( 439 )  
相关文章 | 计量指标
随着集成电路制作工艺的提升,FPGA可重构资源数量不断增加,导致配置文件体量过大从而引起配置过程耗时较长.针对这个问题,提出了一种基于混合编码的配置文件压缩算法MH-RLE.该算法根据二进制配置文件中“0”和“1”的分布特点,首先,采用RLE定长压缩方法对其进行压缩;然后,采用Huffman编码解决RLE定长压缩计数位“空零”问题;最后,使用提出的掩码方式进行二次压缩以进一步提升压缩率.实验结果表明:MH-RLE的平均压缩率为49.82%,相较于其他6种压缩算法其压缩率均有不同程度的提升,最多可提升12.4%.
基于缓存映射项重用距离的闪存地址映射方法
周权彪,张兴军,梁宁静,霍文洁,董小社
2018, 55(5):  1065-1077.  doi:10.7544/issn1000-1239.2018.20170254
摘要 ( 808 )   HTML ( 0)   PDF (2893KB) ( 323 )  
相关文章 | 计量指标
经典的闪存转换层(flash translation layer, FTL)地址映射方法DFTL(demand-based FTL)将全局映射信息放在闪存中,仅缓存最近最常使用的映射信息,解决了页级映射策略中映射信息较大和缓存容量有限的矛盾.但是,DFTL没有充分利用负载的空间局部性特点提高缓存命中率;在缓存失效时频繁的脏映射项换出也会导致大量的映射页写操作;此外,它未能优化垃圾回收过程中有效页迁移导致的写放大问题.针对上述不足,提出一种基于缓存映射项重用距离的地址映射方法IRR-FTL(inter-reference recency-based FTL),通过设置映射页缓存槽,充分挖掘负载空间局部性;基于缓存映射项重用距离实现负载自适应的写缓存映射表冷热分区,并分别采取不同的管理策略,减少映射页写操作;此外,实现基于重用距离的冷热数据分离存储,提高垃圾回收效率.通过采用多种负载对该方法进行验证实验,实验结果表明IRR-FTL相比DFTL缓存命中率提高29.1%,平均响应时间降低了27.3%,擦除次数降低了10.7%.
图形图像
基于图和稀疏主成分分析的多目标显著性检测
梁大川,李静,刘赛,李东民
2018, 55(5):  1078-1089.  doi:10.7544/issn1000-1239.2018.20160681
摘要 ( 755 )   HTML ( 5)   PDF (5241KB) ( 512 )  
相关文章 | 计量指标
针对具有多个显著目标且背景较为复杂的图像,提出了一种基于全连接图和稀疏主成分分析(sparse principal component analysis, sPCA)的显著性检测方法.首先,在不同的尺度空间上利用目标先验知识快速获取包含预选显著目标的空间位置信息,同时,在超像素分割的基础上构造全连接图,并计算超像素级的显著图.然后,利用目标先验知识提取并优化超像素显著图的显著性区域,采用稀疏主成分分析提取优化后的显著性像素点的主要特征,获取相应尺度的显著图.最后,将多个尺度下的显著图进行融合得到最终的显著图.该方法充分利用了超像素与像素显著性计算的优势,在提高检测速度的同时获得更高的检测精度.在公开的多目标数据集SED2和HKU_IS上进行实验验证,结果表明:该方法能够有效检测出复杂背景下的多个显著目标.
基于近似l\-0范数的稀疏信号重构
聂栋栋,弓耀玲
2018, 55(5):  1090-1096.  doi:10.7544/issn1000-1239.2018.20160829
摘要 ( 601 )   HTML ( 5)   PDF (1752KB) ( 399 )  
相关文章 | 计量指标
信号重构算法是压缩感知的关键.基于近似l\-0范数的信号重构选取一个连续函数近似估计l\-0范数,从而将l\-0范数最小化问题转化为平滑函数的优化问题.该算法的关键在于选择合适的平滑函数和优化算法.为了提高压缩感知中稀疏信号恢复的精度,在之前工作的基础上,提出用一个简单的分式函数的和来近似估计l\-0范数.然后通过牛顿迭代算法求解该函数的无约束优化问题的稀疏解,整合了似零范数算法快速收敛和牛顿迭代法精度高的优点.这样就可以在较少的时间内平滑且有效地近似l\-0范数的最小化问题.仿真实验测试了所提算法在不同的压缩比、稀疏度及噪声水平情况下的性能,并与现有的同类算法进行了比较.结果表明:所提算法比现有的同类算法性能更好,重建信号的精度有了较大的提升,这有效地提高了在同等条件下压缩感知信号的恢复质量.
系统结构
基于忆阻器交叉阵列的卷积神经网络电路设计
胡飞,尤志强,刘鹏,邝继顺
2018, 55(5):  1097-1107.  doi:10.7544/issn1000-1239.2018.20170107
摘要 ( 1211 )   HTML ( 5)   PDF (3608KB) ( 633 )  
相关文章 | 计量指标
由于在神经形态计算方面具有优良的性能,忆阻器交叉阵列引起了研究者的广泛关注.利用忆阻器与传统器件提出了1个改进的忆阻器交叉阵列电路,可以准确地存储权重与偏置,结合相应的编码方案后可以运算点积操作,并将其用于卷积神经网络中的卷积核、池化与分类器部分.利用改进的忆阻器交叉阵列和基于卷积神经网络本身拥有的高容错性,还设计了1个忆阻卷积神经网络结构,可以完成1个基本卷积神经网络算法.在卷积操作后直接存储模拟形式的计算结果,使得卷积操作与池化操作之间避免了1次模数-数模转换过程.实验结果表明:设计的面积为0.852 5cm\+2芯片上的运算性能是1台计算机速度的1 770倍,在面积基本相当的前提下,性能比前人设计的电路提高了7.7倍.设计存在可以接受的微小识别误差开销,与软件运行结果相比,此电路在每个忆阻器存储6b或8b信息的情况下平均识别误差分别只增加了0.039%与0.012%.
BTI作用下三因素对集成电路软差错率的影响
王真,江建慧,陈乃金,卢光明,张颖
2018, 55(5):  1108-1116.  doi:10.7544/issn1000-1239.2018.20170094
摘要 ( 677 )   HTML ( 0)   PDF (2025KB) ( 368 )  
相关文章 | 计量指标
在纳米工艺下,老化效应与软差错共同引发的集成电路可靠性问题至关重要,目前,考虑多个因素分析老化效应对软差错率影响的工作相对较少.作为一种典型的老化效应,偏置温度不稳定性(bias temperature instability, BTI)效应包括发生在PMOS中的负偏置温度不稳定性(negative bias temperature instability, NBTI)和发生在NMOS中的正偏置温度不稳定性(positive bias temperature instability, PBTI),现有工作多聚焦在单个因素在NBTI下的影响.在BTI作用下门延迟对软差错率(soft error rate, SER)的影响研究工作的基础上,进一步研究了单粒子瞬态(single event transient, SET)故障脉冲宽度和关键电荷对SER的影响.首先通过考虑PBTI,完善了在BTI作用下基于32nm工艺SET脉宽的变化模型;然后分别研究了如何在SER的计算中考虑SET脉宽和关键电荷的影响,提出了SET脉宽变化可以反映在模拟注入电荷量的变化上的结论.通过HSPICE仿真验证和C++实验表明:3个因素中延迟和SET脉宽对SER影响较小,受BTI应力影响SER将增大,应力作用初期影响最为明显,之后影响将变缓.