• 中国精品科技期刊
  • CCF推荐A类中文期刊
  • 计算领域高质量科技期刊T1类
高级检索

一种改进的基于翻译的知识图谱表示方法

方阳, 赵翔, 谭真, 杨世宇, 肖卫东

方阳, 赵翔, 谭真, 杨世宇, 肖卫东. 一种改进的基于翻译的知识图谱表示方法[J]. 计算机研究与发展, 2018, 55(1): 139-150. DOI: 10.7544/issn1000-1239.2018.20160723
引用本文: 方阳, 赵翔, 谭真, 杨世宇, 肖卫东. 一种改进的基于翻译的知识图谱表示方法[J]. 计算机研究与发展, 2018, 55(1): 139-150. DOI: 10.7544/issn1000-1239.2018.20160723
Fang Yang, Zhao Xiang, Tan Zhen, Yang Shiyu, Xiao Weidong. A Revised Translation-Based Method for Knowledge Graph Representation[J]. Journal of Computer Research and Development, 2018, 55(1): 139-150. DOI: 10.7544/issn1000-1239.2018.20160723
Citation: Fang Yang, Zhao Xiang, Tan Zhen, Yang Shiyu, Xiao Weidong. A Revised Translation-Based Method for Knowledge Graph Representation[J]. Journal of Computer Research and Development, 2018, 55(1): 139-150. DOI: 10.7544/issn1000-1239.2018.20160723

一种改进的基于翻译的知识图谱表示方法

基金项目: 国家自然科学基金项目(61402494,61402498,71690233);湖南省自然科学基金项目(2015JJ4009)
详细信息
  • 中图分类号: TP391

A Revised Translation-Based Method for Knowledge Graph Representation

  • 摘要: 知识图谱在人工智能上有很大的研究价值,并被广泛应用于语义搜索和自动问答等领域.知识图谱表示将包含了实体和关系的大规模知识图谱映射到一个连续的向量空间.为此,有一系列知识表示模型提出,其中基于翻译模型的经典方法TransE不仅模型复杂度低、计算效率高,而且同样具有良好的知识表达能力.但是,TransE亦存在2个缺陷:1)它使用了不够灵活的欧氏距离作为度量,对每一个特征维同等对待,模型的准确性可能受到无关维度的干扰;2)它在处理自反、一对多、多对一和多对多等复杂关系时存在局限性.目前,还没有一种方法能同时解决上述2个缺陷,因此提出一种改进的基于翻译的知识图谱表示方法TransAH.对于第1个缺陷,TransAH采用了一种自适应的度量方法,加入了对角权重矩阵将得分函数中的度量由欧氏距离转换为加权欧氏距离,并实现了为每一个特征维区别地赋予权重.针对第2个缺陷,受TransH方法的启发,TransAH引入面向特定关系的超平面模型,将头实体和尾实体映射至给定关系的超平面加以区分.最后,在公开真实的知识图谱数据集上分析和验证了所提方法的有效性.利用链路预测和三元组分类这2项任务开展了全面横向评测实验,相较于现有的模型和方法,TransAH在各项指标上均取得了很大的进步,体现了其优越性.
    Abstract: Knowledge graph is of great research value to artificial intelligence, which has been extensively applied in the fields of semantic search and question answering, etc. Knowledge graph representation transforms a large-scale knowledge graph comprising entities and relations into a continuous vector space. To this end, there have been a number of models and methods proposed for knowledge embedding. Among them, TransE is a classic translation-based method that is of low model complexity, high computational efficiency, as well as good capability of expressing knowledge. However, TransE still has two flaws: one is that it utilizes inflexible Euclidean distance as metric, and treats each feature dimension identically, hence, the model accuracy may be interfered by irrelevant dimensions; the other is that it has limitations in dealing with complex relations including reflexive, one-to-many, many-to-one and many-to-many relations. Currently, there has not been a single method that resolves the flaws simultaneously, and thus, we propose a revised translation-based method for knowledge graph representation, namely, TransAH. For the first flaw, TransAH adopts an adaptive metric, replacing Euclidean distance with weighted Euclidean distance by adding a diagonal weight matrix, which assigns different weights to every feature dimension. As to the second, inspired by TransH, it introduces the relation-oriented hyperspace model, projecting head and tail entities to hyperspace of a given relation for distinction. At last, empirical studies on public real knowledge graph datasets analyze and verify the effectiveness of the proposed method. Comprehensive comparative experiments using two tasks-link prediction and triplet classification show that, in contrast to the existing models and methods, TransAH achieves remarkable improvement in various aspects and demonstrates its superiority.
  • 期刊类型引用(50)

    1. 田鹏,朱瑞,张健,王坤,张俊三. 一种基于知识图谱共享信息的推荐模型. 计算机应用与软件. 2024(03): 233-239 . 百度学术
    2. 崔员宁,孙泽群,胡伟. 基于规则提示的知识图谱通用推理预训练模型. 计算机研究与发展. 2024(08): 2030-2044 . 本站查看
    3. 林霞,王聪,李敏,李俊华. 基于柯西-施瓦茨不等式的知识图谱稠密表示方法. 小型微型计算机系统. 2023(02): 300-306 . 百度学术
    4. 李志飞,赵月,张龑. 基于表示学习的知识图谱推理研究综述. 计算机科学. 2023(03): 94-113 . 百度学术
    5. 薛瑾,王晓峰. 信息需求视角下的自驾旅游本体构建——以陕西黄河旅游带为例. 西北大学学报(自然科学版). 2023(02): 195-208 . 百度学术
    6. 周新,郭敬楠,宁博,李冠宇. IntSE:特征增强的知识图谱补全方法. 小型微型计算机系统. 2023(09): 1961-1965 . 百度学术
    7. 韩忠明,熊峙冰,陈福宇,杨伟杰,张珣. 面向大规模网络安全知识图谱的快速表示学习模型. 科技导报. 2023(13): 23-31 . 百度学术
    8. 孙泽群,崔员宁,胡伟. 基于链接实体回放的多源知识图谱终身表示学习. 软件学报. 2023(10): 4501-4517 . 百度学术
    9. 石津妮,安敬民,李冠宇. 基于路径与层次注意力的关系预测方法. 计算机工程与设计. 2023(11): 3433-3439 . 百度学术
    10. 王永康,艾山·吾买尔,顾亚东,何江涛. TransREF:一种改进的基于邻域信息的知识表示模型. 电子测量技术. 2023(21): 7-15 . 百度学术
    11. 周贞云,邱均平. 中图分类号的学科应用及其可视化——以我国知识图谱研究为例. 现代情报. 2022(05): 3-12+68 . 百度学术
    12. 李天宇,周子力,赵晓函,陈丹华,王凯莉. TransP:一种基于WordNet中PartOf关系的知识图谱嵌入方法. 计算机应用与软件. 2022(05): 241-246+266 . 百度学术
    13. 周乐,代婷婷,李淳,谢军,楚博策,李峰,张君毅,刘峤. 基于节点-属性二部图的网络表示学习模型. 计算机应用. 2022(08): 2311-2318 . 百度学术
    14. 王瑞,李智杰,李昌华,张颉. 面向链接预测的知识图谱嵌入研究综述. 计算机测量与控制. 2022(09): 8-16 . 百度学术
    15. 张博文,张敏杰,侯田钰,高飞,杨宁,丁辉. 变压器故障知识图谱构建关键技术研究及应用. 电力信息与通信技术. 2022(10): 44-53 . 百度学术
    16. 范琪,章健军,王庚平,任伟. 基于知识图谱的变电站智能故障诊断研究. 电子技术与软件工程. 2022(20): 109-112 . 百度学术
    17. 陈文杰. 一种融合主题特征的自适应知识表示方法. 计算机工程. 2021(01): 87-93+100 . 百度学术
    18. 翟社平,王书桓,尚定蓉,董苏苏. 一种融入实体描述的自适应知识表示模型. 中文信息学报. 2021(01): 43-53 . 百度学术
    19. 王卫红,冯倩,吕红燕,曹玉辉. 融合知识图谱表示学习的栈式自编码器推荐算法. 计算机应用与软件. 2021(02): 264-269 . 百度学术
    20. 张正航,钱育蓉,行艳妮,赵鑫. 基于TransE的表示学习方法研究综述. 计算机应用研究. 2021(03): 656-663 . 百度学术
    21. 何春燕. 不同语义认知视角下交互式智能翻译方法研究. 宿州学院学报. 2021(01): 52-56+76 . 百度学术
    22. 金婧,万怀宇,林友芳. 融合实体类别信息的知识图谱表示学习. 计算机工程. 2021(04): 77-83 . 百度学术
    23. 袁华兵,刘敏,杨延庆. 知识图谱中基于多关系路径的链路预测方法. 电子测量技术. 2021(05): 135-138 . 百度学术
    24. 孟小艳,蒋同海,周喜,韩云飞,马博. 一种改进的自适应知识图谱嵌入式表示方法. 计算机应用研究. 2021(01): 39-43 . 百度学术
    25. 周泽华,陈恒,李冠宇. 基于图上下文的知识表示学习. 计算机应用与软件. 2021(06): 120-125 . 百度学术
    26. 王宁,刘玮,兰剑. 基于法院判决文书的法律知识图谱构建和补全. 郑州大学学报(理学版). 2021(03): 23-29 . 百度学术
    27. 田玲,张谨川,张晋豪,周望涛,周雪. 知识图谱综述——表示、构建、推理与知识超图理论. 计算机应用. 2021(08): 2161-2186 . 百度学术
    28. 杜亚茹,黄媛,高欣娜,武猛,李海杰,杨英茹. 一种面向蔬菜中文知识图谱表示学习的改进方法. 中国农机化学报. 2021(09): 136-142 . 百度学术
    29. 刘昕,白婷婷,张淯舒,钱茛南,何旭莉,席永轲. 基于EA-LDA算法的领域知识图谱潜在关系扩展. 计算机工程. 2021(10): 89-96+102 . 百度学术
    30. 赵晓函,周子力,李天宇,陈丹华,王凯莉. 一种基于IC参数的知识图谱嵌入方法. 中文信息学报. 2021(10): 48-55 . 百度学术
    31. 黄治纲,谢新强,邢铁军,葛东,蔡晨秋,窦丽莉,王天翊. 基于司法案例知识图谱的类案推荐. 南京大学学报(自然科学). 2021(06): 1053-1063 . 百度学术
    32. 郑志蕴,吴建萍,李钝,刘允,米高扬. 一种基于短文本相似度计算的知识子图融合方法. 小型微型计算机系统. 2020(01): 6-11 . 百度学术
    33. 陈嘉颖,于炯,杨兴耀. 一种融合语义分析特征提取的推荐算法. 计算机研究与发展. 2020(03): 562-575 . 本站查看
    34. 张正航. 基于翻译模型的知识表示发展综述. 南方农机. 2020(07): 245 . 百度学术
    35. 陈文杰,文奕,张鑫,杨宁,赵爽. 一种改进的基于TransE知识图谱表示方法. 计算机工程. 2020(05): 63-69+77 . 百度学术
    36. 张阳,王贻欣,张杨,陈强,蔡钺. 一种大数据智能化语义分析系统. 电子技术与软件工程. 2020(06): 168-169 . 百度学术
    37. 崔员宁,李静,沈力,申扬,乔林,薄珏. Duration-HyTE:基于持续时间建模的时间感知知识表示学习方法. 计算机研究与发展. 2020(06): 1239-1251 . 本站查看
    38. 岳昆,阚伊戎,王钰杰,钱文华. 面向电子商务应用的知识图谱关联查询处理. 计算机集成制造系统. 2020(05): 1326-1335 . 百度学术
    39. 詹威威,程序,蔡惠民,刘汪洋,王彬,余正涛. 基于综合影响力模型的改进EvolveKG方法及应用研究. 计算机应用研究. 2020(S1): 159-162 . 百度学术
    40. 姚兰. 基于改进短语翻译模型的计算机智能化校对系统研究. 电子设计工程. 2020(18): 52-55+59 . 百度学术
    41. 龙波. 相关序列小目标图像背景杂波度量方法仿真. 计算机仿真. 2020(09): 377-381 . 百度学术
    42. 陈文杰. 基于翻译模型的科研合作预测研究. 数据分析与知识发现. 2020(10): 28-36 . 百度学术
    43. 姚思雨,赵天哲,王瑞杰,刘均. 规则引导的知识图谱联合嵌入方法. 计算机研究与发展. 2020(12): 2514-2522 . 本站查看
    44. 孙郑煜,鄂海红,宋美娜,王宁. 基于大数据技术的医学知识图谱构建方法. 软件. 2020(01): 13-17 . 百度学术
    45. 张嫚嫚,张武,金秀,朱诚,宋一帆,洪汛,李孟杰. 农作物病虫害专家系统中的知识表示方法. 江汉大学学报(自然科学版). 2019(04): 378-384 . 百度学术
    46. 朱艳丽,杨小平,王良,张志宇. TransRD:一种不对等特征的知识图谱嵌入表示模型. 中文信息学报. 2019(11): 73-82 . 百度学术
    47. 安莹,王志娜,陈先来,刘莉,李忠民,罗熹. 带权疾病网络上的潜在共病关系预测. 湖南大学学报(自然科学版). 2019(12): 33-40 . 百度学术
    48. 李莎,齐灿. 基于双语E-Chunk的机器辅助翻译模型仿真. 计算机仿真. 2019(12): 345-348+352 . 百度学术
    49. 王子悦,陈华辉. 知识表示学习综述. 无线通信技术. 2019(04): 55-60 . 百度学术
    50. 侯梦薇,卫荣,陆亮,兰欣,蔡宏伟. 知识图谱研究综述及其在医疗领域的应用. 计算机研究与发展. 2018(12): 2587-2599 . 本站查看

    其他类型引用(40)

计量
  • 文章访问数:  2397
  • HTML全文浏览量:  2
  • PDF下载量:  1375
  • 被引次数: 90
出版历程
  • 发布日期:  2017-12-31

目录

    /

    返回文章
    返回