ISSN 1000-1239 CN 11-1777/TP

    2019大数据知识工程及应用专题

    默认 最新文章 浏览次数
    Please wait a minute...
    选择: 显示/隐藏图片
    1. 基于跨域对抗学习的零样本分类
    刘欢, 郑庆华, 罗敏楠, 赵洪科, 肖阳, 吕彦章
    计算机研究与发展    2019, 56 (12): 2521-2535.   doi: 10.7544/issn1000-1239.2019.20190614
    摘要715)   HTML29)    PDF (4855KB)(489)   
    零样本学习旨在识别具有少量、甚至没有训练样本的未见类,这些类与可见类遵循不同的数据分布.最近,随着深度神经网络在跨模态生成方面的成功,使用合成的样本对未见数据进行分类取得了巨大突破.现有方法通过共享生成器和解码器,联合传统生成对抗网络和变分自编码器来实现样本的合成.然而,由于这2种生成网络产生的数据分布不同,联合模型合成的数据遵循复杂的多域分布.针对这个问题,提出跨域对抗生成网络(CrossD-AGN),将传统生成对抗网络和变分自编码器有机结合起来,基于类级语义信息为未见类合成样本,从而实现零样本分类.提出跨域对抗学习机制,引入2个对称的跨域判别器,通过判断合成样本属于生成器域分布还是解码器域分布,促使联合模型中的生成器/解码器不断优化,提高样本合成能力.在多个真实数据集上进行了广泛的实验,结果表明了所提出方法在零样本学习上的有效性和优越性.
    相关文章 | 计量指标
    2. 融合对抗训练的端到端知识三元组联合抽取
    黄培馨, 赵翔, 方阳, 朱慧明, 肖卫东
    计算机研究与发展    2019, 56 (12): 2536-2548.   doi: 10.7544/issn1000-1239.2019.20190640
    摘要778)   HTML21)    PDF (1562KB)(447)   
    知识图谱作为一种有效表示现实世界的系统受到学术界和工业界广泛关注,并由于其精准表示知识的能力被广泛应用于信息服务、智慧搜索、自动问答等上层应用.知识图谱的核心为三元组形式的实体和关系.现有知识图谱远不足以描述现实世界,因此,如何通过实体关系抽取方法来补全或者构建新的知识图谱显得至关重要.传统流水线式的实体关系抽取方法会导致误差传递,而已有的联合抽取没有充分考虑命名实体识别与关系抽取之间的联系,从而降低抽取效果.针对上述问题,对知识三元组抽取方法进行了深入研究,提出了一种融合对抗训练的端到端知识三元组联合抽取方法.首先,采用了一种实体关系联合标注策略,通过端到端的神经网络抽取文本语义特征,并对文本进行自动标注;其次,模型在神经网络中加入自注意力机制增强对文本信息的编码能力,并通过引入带偏置项的目标函数提高对相关联实体的辨识能力;最后,模型融合了对抗训练以提高鲁棒性,改进抽取效果.在实验部分,采用4种分析方法和3种评价指标对模型性能进行评价分析,实验结果证明了模型在知识抽取上的性能明显优于现有方法.
    相关文章 | 计量指标
    3. 基于相邻和语义亲和力的开放知识图谱表示学习
    杜治娟, 杜治蓉, 王璐
    计算机研究与发展    2019, 56 (12): 2549-2561.   doi: 10.7544/issn1000-1239.2019.20190648
    摘要636)   HTML16)    PDF (3786KB)(518)   
    知识图谱(knowledge graph, KG)打破了不同场景下的数据隔离,为实际应用提供基础支持.表示学习将KG转换到低维向量空间来为KG应用提供便利.然而,KG的表示学习目前存在2个问题:1)假设KG满足闭合世界假设,要求所有实体在训练中可见.实际上,大多数KG都在快速增长,例如DBPedia平均每天产生200个新实体.2)采用矩阵映射、卷积等复杂的语义交互方式提高模型的准确性,这样做也限制了模型的可扩展性.为此,针对允许新实体存在的开放KG,提出一种表示学习方法TransNS.它选取相关的邻居作为实体的属性来推断新实体,并在学习阶段利用实体之间的语义亲和力选择负例三元组来增强语义交互能力.5个传统数据集和8个新数据集对比了TransNS与最经典的表示学习方法,结果表明:TransNS在开放KG上表现良好,甚至在基准闭合KG上优于现有模型.
    相关文章 | 计量指标