计算机研究与发展 ›› 2020, Vol. 57 ›› Issue (7): 1481-1489.doi: 10.7544/issn1000-1239.2020.20190522
胡超文,邬昌兴,杨亚连
Hu Chaowen, Wu Changxing, Yang Yalian
摘要: 文本蕴含识别旨在自动判断给定的前提和假设(通常为2个句子)之间是否存在蕴含关系,是自然语言处理领域一项基础但富有挑战的任务.当前,主流的基于深度学习的模型通常分别建模前提和假设的语义表示,而没有把它们看作一个整体;另外,在捕获它们之间的语义关系时,大都没有同时利用句子级别的全局信息和短语级别的局部信息.最近提出的S-LSTM能够同时学习句子和短语的语义表示,在文本分类等任务上取得了较好的效果.基于上述情况,提出了一种基于扩展的S-LSTM的文本蕴含识别模型.一方面,把前提和假设看作一个整体,扩展S-LSTM以同时学习它们的语义表示;另一方面,在建模语义关系时,既利用句子级别的信息又利用短语级别的信息,以此获得更好的语义表示.在英文SNLI数据集和中文CNLI数据集上的实验结果表明:提出的模型取得了比基准模型更好的识别性能.
中图分类号: