计算机研究与发展 ›› 2019, Vol. 56 ›› Issue (12): 2536-2548.doi: 10.7544/issn1000-1239.2019.20190640
所属专题: 2019大数据知识工程及应用专题
黄培馨1,赵翔1,2,方阳1,朱慧明1,3,肖卫东1,2
Huang Peixin1, Zhao Xiang1,2, Fang Yang1, Zhu Huiming1,3, Xiao Weidong1,2
摘要: 知识图谱作为一种有效表示现实世界的系统受到学术界和工业界广泛关注,并由于其精准表示知识的能力被广泛应用于信息服务、智慧搜索、自动问答等上层应用.知识图谱的核心为三元组形式的实体和关系.现有知识图谱远不足以描述现实世界,因此,如何通过实体关系抽取方法来补全或者构建新的知识图谱显得至关重要.传统流水线式的实体关系抽取方法会导致误差传递,而已有的联合抽取没有充分考虑命名实体识别与关系抽取之间的联系,从而降低抽取效果.针对上述问题,对知识三元组抽取方法进行了深入研究,提出了一种融合对抗训练的端到端知识三元组联合抽取方法.首先,采用了一种实体关系联合标注策略,通过端到端的神经网络抽取文本语义特征,并对文本进行自动标注;其次,模型在神经网络中加入自注意力机制增强对文本信息的编码能力,并通过引入带偏置项的目标函数提高对相关联实体的辨识能力;最后,模型融合了对抗训练以提高鲁棒性,改进抽取效果.在实验部分,采用4种分析方法和3种评价指标对模型性能进行评价分析,实验结果证明了模型在知识抽取上的性能明显优于现有方法.
中图分类号: