Please wait a minute...
ISSN 1000-1239 CN 11-1777/TP

当期目录

2016年 第53卷 第4期    出版日期:2016-04-01
网络技术
面向“互联网+”的未来网络理论、体系结构与应用专题前言
王兴伟,王丹,崔勇
2016, 53(4):  727-728. 
摘要 ( 955 )   HTML ( 2)   PDF (491KB) ( 838 )  
相关文章 | 计量指标
“互联网+”用互联互通的办法提高经济社会运行效率,以互联网为纽带,以网络思维为基础,结合生产、生活等经济社会运行的各个方面,革新传统行业,推动新兴行业。在此背景下,不但需要开发新的“互联网+”应用,而且需要研究新的互联网理论和技术。所谓“互联网+”,简单的说,就是促进互联网与各行各业的融合与发展,把互联网的创新成果与经济社会各领域深度融合,推动技术进步、效率提升和组织变革,提升实体经济创新力和生产力,形成更广泛的以互联网为基础设施和创新要素的经济社会发展新形态。作为“互联网+”的创新基点,网络技术呈现出不同以往的特征,例如,网络信息海量化,云计算常态化,互联网演进持续化,互联网移动化,等等。如何顺应“互联网+”发展趋势,充分发挥中国互联网的规模优势和应用优势,推动互联网由消费领域向生产领域拓展,加速提升产业发展水平,增强各行业创新能力,构筑经济社会发展新优势和新动能成为“互联网+”发展的挑战。面对前所未有的机遇和挑战,亟需加强对互联网研究的交流,集思广益,推动我国“互联网+”的持续快速稳定发展。借此契机,《计算机研究与发展》适时提出并组织了“互联网+的未来网络理论、体系结构与应用”专刊,从多个方向研究和阐述了“互联网+”领域的成果,向读者展示了近期的热点研究成果和发展动态。征文一经刊登,就引起了众多研究者的极大兴趣,得到大家广泛支持。通过专题公开征文以及约稿征得近百篇高质量的投稿。经过相关领域的专家的评审,历经初审、复审和专家会议终审等阶段,最终从中遴选出12篇论文入选本专题。这些征稿涵盖了大数据、云计算、下一代互联网和移动互联网等研究内容,一定程度上体现出国内研究单位近期在网络领域的主流研究方向和最新研究成果。
面向“互联网+”的网络技术发展现状与未来趋势
王兴伟,李婕,谭振华,马连博,李福亮,黄敏
2016, 53(4):  729-741.  doi:10.7544/issn1000-1239.2016.20151146
摘要 ( 2816 )   HTML ( 14)   PDF (3264KB) ( 3098 )  
相关文章 | 计量指标
“互联网+”是对互联网的升华和发展,旨在促进互联网与经济社会的深度融合,推动经济社会的创新发展.在“互联网+”环境下,互联网不再仅仅发挥信息基础设施的作用,更为重要的是互联网将成为改进经济社会实体管理、生产和经营方式的创新要素.以此为背景,分析了“互联网+”的由来与内涵,描述了推动“互联网+”的国家行动;从方便海量信息互联与访问、改善网络管理与网络性能、支持便捷访问与交互、适应“两化”(工业化与信息化)融合、面向生产等角度,阐述了适合“互联网+”发展需要的网络范型;讨论了面向“互联网+”环境,网络在规模、异构、性能、安全、应用等方面需要应对的新的挑战.最后,给出结论.
基于流行度预测的互联网+电视节目缓存调度算法
朱琛刚,程光,胡一非,王玉祥
2016, 53(4):  742-751.  doi:10.7544/issn1000-1239.2016.20151143
摘要 ( 885 )   HTML ( 0)   PDF (4209KB) ( 925 )  
相关文章 | 计量指标
针对互联网+电视平台为提高热点节目命中率而过渡消耗存储空间的问题,提出一种基于流行度预测的节目缓存调度算法PPRA(popularity prediction replication algorithm).首先,在对实际测量数据进行统计与分析的基础上,使用随机森林(random forests, RF)算法构建节目流行度预测模型.同时,针对所选特征存在的“维数灾难”问题,利用主成分分析法(principal component analysis, PCA)实施特征降维处理,以实现视频流行度预测值的快速计算.然后基于节目流行度预测数据调度缓存中的节目.最后以某广电运营商130万用户120 d的收视数据为例,对PPRA算法进行实验.实验结果表明,在保证一定缓存命中率前提下,与LRU,LFU算法相比,PPRA算法仅需30%的存储空间,可有效降低互联网+电视平台的建设成本.
一种融合情景和评论信息的位置社交网络兴趣点推荐模型
高榕,李晶,杜博,余永红,宋成芳,丁永刚
2016, 53(4):  752-763.  doi:10.7544/issn1000-1239.2016.20151005
摘要 ( 1123 )   HTML ( 0)   PDF (3797KB) ( 996 )  
相关文章 | 计量指标
随着位置社交网络(location-based social network, LBSN)的快速增长,兴趣点(point-of-interest, POI)推荐已经成为一种帮助人们发现有趣位置的重要方式.现有的研究工作主要是利用用户签到的历史数据及其情景信息(如地理信息、社交关系)来提高推荐质量,而忽视了利用兴趣点相关的评论信息.但是,现实中用户在LBSN中只对少数兴趣点进行签到,使得用户签到历史数据及其情景信息极其稀疏,这对兴趣点推荐来说是一个巨大的挑战.为此,提出了一种新的兴趣点推荐模型,称为GeoSoRev模型.该模型在已有的基于矩阵分解的经典推荐模型的基础上,融合关于兴趣点的评论信息、用户社交关联和地理信息这3个因素进行兴趣点推荐.基于2个来自Foursquare的真实数据集的实验结果表明,与其他主流的兴趣点推荐模型相比,GeoSoRev模型在准确率和召回率等多项评价指标上都取得了显著的提高.
基于交互意见和地位理论的符号网络链接预测模型
王鑫,王英,左万利
2016, 53(4):  764-775.  doi:10.7544/issn1000-1239.2016.20151079
摘要 ( 653 )   HTML ( 0)   PDF (2491KB) ( 587 )  
相关文章 | 计量指标
随着社会网络的普遍和流行,社会网络为符号网络(signed network)的深入研究提出了更多的全新问题,其中链接预测是符号网络研究的核心问题之一.交互意见和地位理论能够较好地解释符号网络中链接关系的构建和链接的符号属性,二者作为链接构建的诱因为提高链接预测的质量提供了理论基础.因此,通过研究交互意见和地位理论与链接关系的强相关性,构建符号网络链接预测模型.首先,利用交互意见增强待分解矩阵的可靠度,弥补由地位理论的对称性所带来的局限性;然后,在稀疏学习矩阵分解模型基础上,将交互意见建模为增强可靠度因子,同时将地位理论建模为稀疏学习模型的正则化项;最后,构建基于交互意见和地位理论的符号网络链接预测模型MF-SI.实验结果表明相比于其他基本方法,MF-SI模型获得了较好的预测质量,说明集成交互意见和地位理论能够较好地实现符号网络链接预测问题.
基于项目合作的社会关系网络构建
何贤芒,陈银冬,李东,郝艳妮
2016, 53(4):  776-784.  doi:10.7544/issn1000-1239.2016.20151172
摘要 ( 640 )   HTML ( 2)   PDF (1110KB) ( 605 )  
相关文章 | 计量指标
目前,基于论文合作关系的科学研究人员社会关系网络得到了极大的关注,但是存在实体识别不准确、数据更新不及时等数据质量问题.有鉴于此,提出利用历年项目申请书的合作关系,同时将实体识别问题归结为一个聚类问题,证明该问题的计算复杂度,然后提出了算法来解决该问题,最后在真实数据上验证算法的效率.
软件定义数据中心内一种基于拓扑感知的VDC映射算法
文学敏,韩言妮,于冰,孙建朋,徐震
2016, 53(4):  785-797.  doi:10.7544/issn1000-1239.2016.20151134
摘要 ( 885 )   HTML ( 2)   PDF (4964KB) ( 514 )  
相关文章 | 计量指标
在云计算中,服务提供商(service provider, SP)可以向基础设施提供商(infrastructure provider, InP)按需租赁资源并部署服务.SP只需专注于自己的服务即可,无需考虑设备成本与维护代价.然而传统InP仅以虚拟机的方式提供资源,并不保证网络性能与带宽隔离.随着网络虚拟化技术的发展,尤其是软件定义网络(software defined networking, SDN)概念的提出,一些研究人员建议InP以虚拟数据中心(virtual data center, VDC)的方式为SP提供资源,以解决传统数据中心的上述问题.尽管以VDC的方式分配资源具有诸多的优势,也带来了一项新的挑战,如何满足SP的多样化需求,以最小的代价、最大的收益为VDC分配资源,这是一个NP-hard问题.为解决VDC映射问题,提出了一种基于拓扑势和模块度的启发式映射算法,折衷租户的可靠性需求与映射代价,并提高InP收益.最后,基于收益代价比门限经验值,提出一种动态监控策略,选择高收益代价比的VDC请求,进一步最大化InP的利润.大量的仿真实验证明该算法可以以最小的代价接受更多的请求,同时提高InP收益.
软件技术
基于代价估计的Hive多维索引分割策略选择算法
刘越,李锦涛,虎嵩林
2016, 53(4):  798-810.  doi:10.7544/issn1000-1239.2016.20151163
摘要 ( 854 )   HTML ( 4)   PDF (3814KB) ( 447 )  
相关文章 | 计量指标
在能源互联网、智慧城市等新兴领域,智能终端采集的庞大数据往往需要多维分析,传统企业寻求借助互联网技术(如Hadoop和Hive)应对大数据问题.但是Hive当前的多维索引能力较弱,无法满足传统企业的需求.针对这一问题,提出了一种基于分布式网格文件的多维索引技术——DGFIndex,来提升Hive的多维查询处理能力.但是在创建DGFIndex时,需要用户指定各个索引维度的分割粒度,而分割粒度的大小与查询性能息息相关.在用户对数据与查询特征不熟悉时,很难选择较优的分割策略.为了解决这一问题,通过建立新的MapReduce代价模型,并使用两阶段模拟退火算法为DGFIndex搜索较优的分割策略,从而提升查询性能,减少查询集合的总耗时.实验结果表明:DGFIndex可以提升Hive多维查询性能50%~114%,对于固定的查询集合,与人工选定分割策略比较,基于代价估计的分割策略选择算法可以为DGFIndex快速选定较优的分割策略,并可以使整个查询集合的处理时间比人工方法最多减少30%.
网络技术
基于移动云服务的车联网数据上传策略
刘冰艺,吴黎兵,贾东耀,聂雷,叶璐瑶,汪建平
2016, 53(4):  811-823.  doi:10.7544/issn1000-1239.2016.20151150
摘要 ( 1086 )   HTML ( 0)   PDF (3894KB) ( 896 )  
相关文章 | 计量指标
传统的基于专用短程通信(dedicated short range communication, DSRC)的车载网络(vehicular ad hoc network, VANET)通信架构难以满足车联网数据传输的服务质量(quality of service, QoS)需求,通过移动网关将数据上传至服务器,由服务器决策传输给目标车辆,可以扩大数据广播域,极大减少数据远程传输时延.结合移动云服务的思想,提出了一种新的车联网架构和数据传输方法.首先给出了网关服务者(gateway server, GWS)向云端注册服务信息的具体流程;其次提出了一种云端服务网关选取方法,该方法结合云端的历史数据和实时数据,动态决定参与服务的网关服务者及其服务范围,网关消费者(gateway consumer, GWC)在获取服务广播消息后,综合考虑通信负载、链路稳定度、信道质量等性能参数来选出最优的网关服务者,并将数据传输给网关服务者,再由其上传到云端;最后在OMNeT++实验环境下,针对不同的交通场景,对该方法传输性能进行了评估.结果表明该方法获得较低传输延迟的同时,能够保证较高的传输成功率,理论分析也证明了该方法的有效性.
互联网(IPv4/IPv6)宏观拓扑结构生命特征
刘晓,赵海,李少锋,王进法,李鹤群
2016, 53(4):  824-833.  doi:10.7544/issn1000-1239.2016.20151106
摘要 ( 576 )   HTML ( 0)   PDF (3040KB) ( 469 )  
相关文章 | 计量指标
从生物进化的角度看待互联网演化,可以操控并引导网络演化方向,预测未来互联网结构与功能的发展趋势.择取CAIDA互联网全球研究机构2010—2014年互联网IPv4及IPv6全网探测数据.将Eigen对“生命特征”的定义与互联网宏观拓扑特征量的定义融合:以标准网络结构熵表征网络代谢行为;以1-25核网络度分布频度变化描述网络自复制特性;从网络平均聚集系数及网络平均路径长度的演化情况观测互联网自复制过程中出现的误差.对比分析互联网3种生命特征,发现IPv4与IPv6互联网均具有生命特征,且IPv6的生命特征较IPv4更明显,网络拓扑更具生命力.从互联网宏观拓扑中提取生命特征,是将生物学思想成功引入互联网领域的标志,这不仅对未来互联网研究提供更丰富的研究方法和更大的研究空间,更为有效地实现网络功能、预测并指导互联网发展提供理论支持.
IPv6物联网层次转发体系中的地址压缩
肖融,孙波,陈文龙,肖永康,魏云刚
2016, 53(4):  834-844.  doi:10.7544/issn1000-1239.2016.20151165
摘要 ( 702 )   HTML ( 2)   PDF (3089KB) ( 612 )  
相关文章 | 计量指标
作为“互联网+”计划的重要组成部分,物联网广泛应用于人类社会的各个方面.IPv6节点标识是物联网大规模部署的基础.然而,128b的IPv6地址却给资源受限的物联网增加了存储、带宽等代价.面向物联网层次转发体系,设计了IACH地址压缩机制,包括:去除尾部无效寻径信息、地址剥离、地址扩展等.接着,提出了地址映射机制,将外部无规律的IPv6地址映射成物联子网虚拟地址,使其可应用上述IACH机制进行压缩.该机制与现有6LoWPAN兼容.实验及性能分析表明:IACH可大幅提升物联网报文传输的有效负载比例.对于相同长度的IP上层负载,IACH转发时延略低于标准6LoWPAN.
一种面向域间路由系统的信任模型
夏怒,李伟,陆悠,蒋健,单冯,罗军舟
2016, 53(4):  845-860.  doi:10.7544/issn1000-1239.2016.20151121
摘要 ( 597 )   HTML ( 0)   PDF (6837KB) ( 433 )  
相关文章 | 计量指标
在域间路由系统中,边界网关协议(border gateway protocol, BGP)的运行基于对自治域路由通告行为的可信假设,给了虚假路由信息发布者可乘之机,导致影响Internet稳定运行的安全事件时有发生,然而现有研究工作并不能有效抑制虚假路由信息的产生和传播,因此提出一种面向域间路由系统的信任模型,以实现对自治域路由通告行为准确的可信评估.在该模型中,在每个评估周期,评估自治域对其邻居自治域的历史路由通告行为进行直接评估,同时收集被评估自治域的其他邻居自治域对其的直接评估,最后综合多方来源的直接评估结果计算被评估自治域的信任度.采用路由通告行为预测方法,以使直接评估结果可准确反映被评估自治域的未来路由通告行为,此外,为使评估自治域可获得充分的信任信息以保障信任度评估结果的准确性,采用信任推荐激励机制促进自治域积极参与信任推荐,自治域间相互根据对方的历史信任推荐积极性计算信任推荐概率,并基于该概率进行信任推荐.实验结果表明:相比于其他信任模型,在不同的评估环境中,信任模型的信任评估结果可更为准确地反映被评估自治域未来发布真实路由通告的可能性.
互联网流量补贴模型研究与实例分析
苏辉,徐恪,沈蒙,王勇,钟宜峰,李彤
2016, 53(4):  861-872.  doi:10.7544/issn1000-1239.2016.20151037
摘要 ( 829 )   HTML ( 2)   PDF (3158KB) ( 449 )  
相关文章 | 计量指标
随着移动互联网的不断发展,许多网络用户都使用智能手机或是平板电脑取代了传统的台式机作为首选的上网设备.相应地,用户对移动流量的需求增长也非常迅速.然而,由于高昂的访问成本,人们还是难以完全享受移动互联网带来的便利,已经在一定程度上阻碍了移动互联网的发展.从全局角度看,如何为互联网参与者们设计优化的流量分配方案已经成为一个关键问题.针对此问题,提出了一个新的基于互联网内容提供商与运营商合作的流量补贴模型DA(data allowance),共同为用户提供补贴.通过对该模型的经济学分析,得到以下结论:1)该模式能够在内容商、运营商、用户之间形成更具弹性的关系,能有效延长用户的活跃在线时间;2)提出的内容商补贴策略能够实现用户与内容商的双赢结果;3)流量补贴策略不是可以任意实施的,它有约束条件限制以保证补贴的有效性,能够对互联网内容商和运营商制定补贴策略提供有益参考.
图形图像
多层次细粒度并行HEVC帧内模式选择算法
张峻,代锋,马宜科,张勇东
2016, 53(4):  873-883.  doi:10.7544/issn1000-1239.2016.20148455
摘要 ( 726 )   HTML ( 0)   PDF (2726KB) ( 441 )  
相关文章 | 计量指标
在众核平台上并行加速是解决高效视频编码(high efficiency video coding, HEVC)标准编码复杂度高的有效方法.传统的粗粒度并行方案如Tiles和WPP未能在并行度和编码质量之间取得较好的平衡,对编码质量影响较大或者并行度不高.充分挖掘HEVC帧内模式选择中的并行性,提出了一种在CTU内使用的多层次细粒度的帧内模式选择算法.具体说来,对帧内模式选择过程进行了子任务划分,分析并消除了相邻编码块之间多种阻碍并行计算的数据依赖关系,包括帧内预测参考像素依赖、预测模式依赖和熵编码依赖等,实现了同一个CTU内所有层次的细粒度编码块的代价计算和模式选择并行进行.将算法在Tile-Gx36平台上实现,实验结果表明此并行算法与HEVC参考代码HM相比能获得18倍的整体编码加速比而且编码质量损失较小(码率上升3%).
基于低秩矩阵和字典学习的图像超分辨率重建
杨帅锋,赵瑞珍
2016, 53(4):  884-891.  doi:10.7544/issn1000-1239.2016.20140726
摘要 ( 1010 )   HTML ( 1)   PDF (2257KB) ( 735 )  
相关文章 | 计量指标
基于稀疏表示和字典学习的超分辨率重建算法没有对图像进行分解,直接将整幅图像的信息都进行了学习重建.由低秩矩阵理论知,可将图像分解成低秩部分和稀疏部分.根据图像各部分信息的特征分别用不同的方法进行超分辨率重建,将能更加有效地利用图像的特征.据此提出了一种基于低秩矩阵和字典学习的超分辨率重建方法.该方法首先通过对图像进行低秩分解得到图像的低秩部分和稀疏部分,图像的低秩部分保留了图像的大部分信息.算法只对图像的低秩部分通过字典学习的方法进行超分辨率重建,图像的稀疏部分则不参与学习重建,而是采用双三线性插值的方法进行重建.实验分析表明,图像的重建质量有所提升,同时减少了一定的重建时间,提升了算法的运行速度.与现有算法比较,在视觉效果、峰值信噪比、算法运行速度等方面均获得了更好的结果.
采用高斯拟合的全局阈值算法阈值优化框架
陈海鹏,申铉京,龙建武
2016, 53(4):  892-903.  doi:10.7544/issn1000-1239.2016.20140508
摘要 ( 1018 )   HTML ( 2)   PDF (5214KB) ( 797 )  
相关文章 | 计量指标
采用最大类间方差法、最大熵法和最小误差法3种经典全局阈值方法获得的阈值,存在一定偏差.针对该问题,提出了一种采用高斯拟合的全局阈值算法阈值优化框架(TOF).本优化框架先利用全局阈值算法获得初始阈值,将图像粗分为背景和目标2个部分,然后分别计算各部分均值和方差来拟合出2个高斯分布.由于最佳阈值位于2个高斯分布的交点位置,为此本框架采用多次迭代方式来优化阈值,直至最终收敛到最佳阈值.为提高抗噪性能,结合三维直方图重建和降维思想,提出了一种鲁棒的采用高斯拟合的全局阈值算法阈值优化框架(RTOF).实验结果表明,对于以上经典全局算法,采用本优化方法均能收敛到一个最佳阈值,同时本算法还具有鲁棒的抗噪性能和较高的执行效率.
系统结构
一种面向云存储的动态授权访问控制机制
王晶,黄传河,王金海
2016, 53(4):  904-920.  doi:10.7544/issn1000-1239.2016.20150158
摘要 ( 926 )   HTML ( 0)   PDF (4985KB) ( 600 )  
相关文章 | 计量指标
云存储是一种新型的数据存储体系结构,云存储中数据的安全性、易管理性等也面临着新的挑战.首先,云存储系统需要为用户提供安全可靠的数据访问服务,并确保云端数据的安全性.为此,研究者们针对云存储中数据结构复杂、数据存储量大等特点提出了属性加密(attribute-based encryption, ABE)方案,为云储存系统提供细粒度的密文访问控制机制.在该机制中,数据所有者使用访问策略表示数据的访问权限并对数据进行加密.但数据的访问权限常会因各种原因发生改变,从而导致云中存储密文的频繁更新,进而影响数据的易管理性.为避免访问权限管理造成大量的计算和通信开销,提出了一种高效、安全、易管理的云存储体系结构:利用ABE加密机制实现对密文的访问控制,通过高效的动态授权方法实现访问权限的管理,并提出了不同形式的访问策略之间的转换方法,使得动态授权方法更为通用,不依赖于特定的访问策略形式;针对授权执行者的不同,制定了更新授权、代理授权和临时授权3种动态授权形式,使得动态授权更为灵活、快捷;特别地,在该动态授权方法中,授权执行者根据访问策略的更改计算出最小增量集合,并根据该增量集合更新密文以降低密文更新代价.理论分析和实验结果表明,该动态授权方法能减小资源的耗费、优化系统执行效率、提高访问控制机制灵活性.
二次改进遗传算法与3D NoC低功耗映射
张大坤,宋国治,林华洲,任淑霞
2016, 53(4):  921-931.  doi:10.7544/issn1000-1239.2016.20150682
摘要 ( 754 )   HTML ( 0)   PDF (2874KB) ( 395 )  
相关文章 | 计量指标
随着集成电路技术的迅速发展,芯片的集成度不断提高,片上众多处理单元间的高效互连成为关键问题,因而相继出现了片上系统(system-on-chip, SoC)和二维片上网络(two-dimensional network-on-chip, 2D NoC).当二维片上网络在多方面达到瓶颈时,三维片上网络(three-dimensional network-on-chip, 3D NoC)应运而生.三维片上网络已引起学术界和产业界的高度重视,三维片上网络低功耗映射是其中的1个关键问题.之前的研究曾提出过一种基于改进遗传算法的3D NoC低功耗映射算法,并收到了良好的仿真效果.但当问题规模变大时,计算量随之增大、运行效率明显降低.针对这一问题,对3D NoC中面向功耗优化的二次改进遗传算法任务映射机制进行研究,提出了一种新的3D NoC低功耗映射算法,并对该映射算法进行了仿真实验.实验结果表明,在种群规模较大的条件下,该算法不仅能够继续降低功耗,而且能够大幅度地减少映射算法的运行时间.
信息处理
基于移动网络流量日志的城市时空行为分析
强思维,陈夏明,姜开达,金耀辉
2016, 53(4):  932-940.  doi:10.7544/issn1000-1239.2016.20148278
摘要 ( 1000 )   HTML ( 1)   PDF (4067KB) ( 652 )  
相关文章 | 计量指标
城市的空间组织和居民行为研究是城市地理学研究的重点,随着信息技术的快速发展,居民的时空行为对城市空间的组织和结构的影响呈现出日益增加的趋势,因此,对城市空间以及居民时空行为的深入分析具有很高的研究价值.通过采集杭州市区移动3G网络流量日志,首先采用空间点模式的分析方法研究了城市居民的聚集模式,并研究了居民移动的距离、方向等方面的特征;之后采用网格的方法对城市空间进行分块,并以区块为主体研究了热点区块出现的时空点、区块人流的更迭速率、工作日人流的潮汐效应;提出了区块差异指数的概念,并利用其对区块进行聚类,分析了区块间的相关性和区块间距离之间的关系.由于所研究的数据来源于移动3G网络流量日志,因此具有覆盖面广、数据量大等特点,非常适合从大时空尺度层面研究居民和城市空间活动.
结合全局特征的命名实体属性值抽取
刘倩,伍大勇,刘悦,程学旗,庞琳
2016, 53(4):  941-948.  doi:10.7544/issn1000-1239.2016.20140806
摘要 ( 1050 )   HTML ( 2)   PDF (1335KB) ( 763 )  
相关文章 | 计量指标
关注非结构化文本中命名实体属性值的抽取问题.当前主流有监督属性值抽取方法仅使用局部特征,抽取效果有限,开展了利用文本全局特征改善属性值抽取的研究.通过适用于中文属性值抽取的全局特征,用局部特征以外的有价值信息提高抽取效果.据此,提出结合全局特征的感知机学习算法,该算法能够方便地融合文本全局特征,并将全局特征和局部特征统一结合到模型学习过程中,使模型具有更好的特征表示能力.实验结果表明,所提出方法的整体抽取效果高于仅使用局部特征的CRF模型和平均感知机模型.该方法适用于开放领域的属性值获取,具有较好的泛化能力.