计算机研究与发展 ›› 2016, Vol. 53 ›› Issue (8): 1696-1708.doi: 10.7544/issn1000-1239.2016.20160192
所属专题: 2016数据挖掘前沿技术专题
刘峤,钟云,刘瑶,吴祖峰,秦志光
Liu Qiao, Zhong Yun, Liu Yao, Wu Zufeng,Qin Zhiguang
摘要: 实体链接任务的目标是将从文本中抽取得到的实体指称项正确地链接到知识库中的对应实体对象上.当前主流的实体链接算法大致可分为2类:基于上下文相似度的实体链接算法和基于图的集成实体链接算法.这2类算法各自存在一些优点和不足.前者有利于从上下文语义的角度对实体进行区分,但难以充分利用知识库中已有的知识体系辅助决策;后者能够更好地利用知识库中实体间的语义关联关系,但在上下文信息不充分的情况下,较难区分概念相近的实体.提出一种基于语义一致性的集成实体链接算法,该算法能够更好地利用知识库中实体间的结构化语义关系,帮助提高算法对概念相似实体的区分度,实验结果表明:该算法能够有效提高实体链接结果的准确率和召回率,性能显著优于当前的主流算法,在对长、短文本的实体链接任务中性能表现稳定,具有良好的适应性和可推广性.
中图分类号: