计算机研究与发展 ›› 2018, Vol. 55 ›› Issue (1): 179-187.doi: 10.7544/issn1000-1239.2018.20160784
高云龙1,2,左万利1,2,王英1,2,王鑫2,3
Gao Yunlong1,2, Zuo Wanli1,2, Wang Ying1,2, Wang Xin2,3
摘要: 句子分类模型的建立对于自然语言理解的研究有着十分重要的意义.基于卷积神经网络(convolutional neural networks, CNN)提取数据特征的特点,提出基于稀疏自学习卷积神经网络(sparse and self-taught CNN, SCNN)的句子分类模型.首先,在卷积层排除人为约定的特征map输入,自学习前一层输入的特征矩阵的有效组合,动态捕获句子范围内各个特征的有效关联;然后,在训练过程中利用L1范数增加稀疏性约束,降低模型复杂度;最后,在采样层利用K-Max Pooling选择句子中最大特征的序列,并保留特征之间的相对次序.SCNN可以处理变长的句子输入,模型的建立不依赖于句法、分析树等语言学特征,从而适用于任何一种语言.通过对语料库进行句子分类实验,验证了所提出模型有较好的分类效果.
中图分类号: