• 中国精品科技期刊
  • CCF推荐A类中文期刊
  • 计算领域高质量科技期刊T1类
高级检索

基于重排序的迭代式实体对齐

曾维新, 赵翔, 唐九阳, 谭真, 王炜

曾维新, 赵翔, 唐九阳, 谭真, 王炜. 基于重排序的迭代式实体对齐[J]. 计算机研究与发展, 2020, 57(7): 1460-1471. DOI: 10.7544/issn1000-1239.2020.20190643
引用本文: 曾维新, 赵翔, 唐九阳, 谭真, 王炜. 基于重排序的迭代式实体对齐[J]. 计算机研究与发展, 2020, 57(7): 1460-1471. DOI: 10.7544/issn1000-1239.2020.20190643
Zeng Weixin, Zhao Xiang, Tang Jiuyang, Tan Zhen, Wang Wei. Iterative Entity Alignment via Re-Ranking[J]. Journal of Computer Research and Development, 2020, 57(7): 1460-1471. DOI: 10.7544/issn1000-1239.2020.20190643
Citation: Zeng Weixin, Zhao Xiang, Tang Jiuyang, Tan Zhen, Wang Wei. Iterative Entity Alignment via Re-Ranking[J]. Journal of Computer Research and Development, 2020, 57(7): 1460-1471. DOI: 10.7544/issn1000-1239.2020.20190643
曾维新, 赵翔, 唐九阳, 谭真, 王炜. 基于重排序的迭代式实体对齐[J]. 计算机研究与发展, 2020, 57(7): 1460-1471. CSTR: 32373.14.issn1000-1239.2020.20190643
引用本文: 曾维新, 赵翔, 唐九阳, 谭真, 王炜. 基于重排序的迭代式实体对齐[J]. 计算机研究与发展, 2020, 57(7): 1460-1471. CSTR: 32373.14.issn1000-1239.2020.20190643
Zeng Weixin, Zhao Xiang, Tang Jiuyang, Tan Zhen, Wang Wei. Iterative Entity Alignment via Re-Ranking[J]. Journal of Computer Research and Development, 2020, 57(7): 1460-1471. CSTR: 32373.14.issn1000-1239.2020.20190643
Citation: Zeng Weixin, Zhao Xiang, Tang Jiuyang, Tan Zhen, Wang Wei. Iterative Entity Alignment via Re-Ranking[J]. Journal of Computer Research and Development, 2020, 57(7): 1460-1471. CSTR: 32373.14.issn1000-1239.2020.20190643

基于重排序的迭代式实体对齐

基金项目: 国家自然科学基金项目(61872446,61902417,71690233,71971212);湖南省自然科学基金项目(2019JJ20024);湖南省研究生科研创新项目(CX20190033)
详细信息
  • 中图分类号: TP391

Iterative Entity Alignment via Re-Ranking

Funds: This work was supported by the National Natural Science Foundation of China (61872446, 61902417, 71690233, 71971212), the Natural Science Foundation of Hunan Province of China (2019JJ20024), and the Postgraduate Scientific Research Innovation Project of Hunan Province (CX20190033).
  • 摘要: 现有的知识图谱无法避免地存在不完整这一问题.缓解此问题的可行方法是引入外部知识图谱中的知识.在此过程中,实体对齐是最关键的步骤.当前最先进的实体对齐解决方案主要依靠知识图谱的结构信息来判断实体的等价性,但在真实世界知识图谱上,大部分实体只具有较低的节点度数以及微少的结构信息.此外,标注数据的缺乏也大大限制了实体对齐模型的效果.为解决上述问题,提出将不受节点度数影响的实体名信息与结构信息相结合,从更全面的角度实现实体对齐.在此基本框架上,利用基于课程学习的迭代训练方法从易至难地选择高置信度结果加入到训练数据中,扩增标注数据的规模.最后使用词移距离模型进一步改进实体名信息的利用方式,并对前序对齐结果重排序,提升实体对齐准确率.在跨语言以及单语言实体对齐任务上的实验结果表明,提出的实体对齐方法性能远好于当前最好的方法.
    Abstract: Existing knowledge graphs (KGs) inevitably suffer from the problem of incompleteness. One feasible approach to tackle this issue is by introducing knowledge from other KGs. During the process of knowledge integration, entity alignment (EA), which aims to find equivalent entities in different KGs, is the most crucial step, as entities are the pivots that connect heterogeneous KGs. State-of-the-art EA solutions mainly rely on KG structure information for judging the equivalence of entities, whereas most entities in real-life KGs are in low degrees and contain limited structural information. Additionally, the lack of supervision signals also constrains the effectiveness of EA models. In order to tackle aforementioned issues, we propose to combine entity name information, which is not affected by entity degree, with structural information, to convey more comprehensive signals for aligning entities. Upon this basic EA framework, we further devise a curriculum learning based iterative training strategy to increase the scale of labelled data with confident EA pairs selected from the results of each round. Moreover, we exploit word mover’s distance model to optimize the utilization of entity name information and re-rank alignment results, which in turn boosts the accuracy of EA. We evaluate our proposal on both cross-lingual and mono-lingual EA tasks against strong existing methods, and the experimental results reveal that our solution outperforms the state-of-the-arts by a large margin.
  • 期刊类型引用(17)

    1. 袁子淇,孙庆赟,周号益,朱祖坤,李建欣. MNDetector:基于多层网络的异常访问检测方法. 计算机研究与发展. 2025(03): 765-778 . 本站查看
    2. 陈佳乐,陈旭,景永俊,王叔洋. 图神经网络在异常检测中的应用综述. 计算机工程与应用. 2024(13): 51-65 . 百度学术
    3. 林馥,李明康,罗学雄,张书豪,张越,王梓桐. 基于异常感知的变分图自编码器的图级异常检测算法. 计算机研究与发展. 2024(08): 1968-1981 . 本站查看
    4. 孔翎超,刘国柱. 离群点检测算法综述. 计算机科学. 2024(08): 20-33 . 百度学术
    5. 王泽鹏 ,马超 ,张壮壮 ,吴黎兵 ,石小川 . 动态决策驱动的工控网络数据要素威胁检测方法. 计算机研究与发展. 2024(10): 2404-2416 . 本站查看
    6. 叶苗,程锦,黄源,蒋秋香,王勇. 面向WSN异常节点检测的融合重构机制与对比学习方法. 通信学报. 2024(09): 153-169 . 百度学术
    7. 王芳. 基于深度学习的网络传输数据异常识别方法. 现代电子技术. 2023(06): 62-66 . 百度学术
    8. 江铃燚,郑艺峰,陈澈,李国和,张文杰. 有监督深度学习的优化方法研究综述. 中国图象图形学报. 2023(04): 963-983 . 百度学术
    9. 富坤,刘赢华,郝玉涵,孙明磊. 基于图模块度聚类的异常检测算法. 计算机应用研究. 2023(06): 1721-1727 . 百度学术
    10. 曹成顺. 基于深度神经网络的输电线路异常自动辨识方法. 信息与电脑(理论版). 2023(15): 165-167 . 百度学术
    11. 冯健,赵宇鹏,刘天. 融合双重自监督信号的图异常检测. 科学技术与工程. 2023(35): 15142-15147 . 百度学术
    12. 王炳泉. 基于SVM的网络流量异常检测算法. 信息与电脑(理论版). 2023(22): 245-247 . 百度学术
    13. 唐立,郝鹏,任沛阁,张祖耀,何翔,张学军. 基于改进孤立森林算法的无人机异常行为检测. 航空学报. 2022(08): 584-593 . 百度学术
    14. 陈益芳,宣羿,樊立波,孙智卿,屠永伟,张亦涵,蔡乾晨. 基于机器学习的电网威胁检测算法模型和大数据平台设计. 电力大数据. 2022(04): 34-41 . 百度学术
    15. 刘华玲,刘雅欣,许珺怡,陈尚辉,乔梁. 图异常检测在金融反欺诈中的应用研究进展. 计算机工程与应用. 2022(22): 41-53 . 百度学术
    16. 李净. 国际视野下治理虚假新闻的技术手段及相关模型. 中国传媒科技. 2021(08): 17-21 . 百度学术
    17. 雷瑜,郑丹,曾繁如,樊志伟,宁黎,邓立. 四川耕地“非粮化”监测中的智能监测方法. 资源与人居环境. 2021(12): 47-51 . 百度学术

    其他类型引用(34)

计量
  • 文章访问数:  1135
  • HTML全文浏览量:  3
  • PDF下载量:  367
  • 被引次数: 51
出版历程
  • 发布日期:  2020-06-30

目录

    /

    返回文章
    返回