计算机研究与发展 ›› 2021, Vol. 58 ›› Issue (8): 1751-1760.doi: 10.7544/issn1000-1239.2021.20210323
所属专题: 2021人工智能前沿进展专题
何贤敏1,李茂西1,何彦青2
出版日期:
2021-08-01
基金资助:
He Xianmin1, Li Maoxi1, He Yanqing2
Online:
2021-08-01
Supported by:
摘要: 国际专利分类法(international patent classification, IPC)和中国图书馆分类法(Chinese library classification, CLC)作为重要分类标识,分别在专利信息和期刊文献的组织以及管理中发挥着重要作用.如何准确地建立它们之间的映射关系对实现专利信息、期刊资源交叉浏览和检索有着重要的意义.提出了基于BERT预训练上下文语言模型的孪生网络用于建立IPC类目和CLC类目之间的映射关系,利用孪生网络模型分别抽象这2个分类法类目描述文本,通过平均池化抽象后的向量表示计算得到它们相同维度的句子向量,基于余弦相似度计算句子之间的相似度得分,完成类目映射.在人工标注一定规模的IPC类目和CLC类目之间的映射语料库上进行实验验证,结果表明提出的方法显著优于基于规则的方法和Sia-Multi,Bi-TextCNN,Bi-LSTM等深度神经网络的方法.相关的代码、模型和人工标注语料库已经公开发布.
中图分类号:
何贤敏, 李茂西, 何彦青. 基于孪生BERT网络的科技文献类目映射[J]. 计算机研究与发展, 2021, 58(8): 1751-1760.
He Xianmin, Li Maoxi, He Yanqing. Siamese BERT-Networks Based Classification Mapping of Scientific and Technological Literature[J]. Journal of Computer Research and Development, 2021, 58(8): 1751-1760.
[1] | 韩牟, 杨晨, 华蕾, 刘帅, 马世典. 面向移动边缘计算车联网中车辆假名管理方案[J]. 计算机研究与发展, 2022, 59(4): 781-795. |
[2] | 张力, 张书奎, 刘海, 张洋, 陶冶, 龙浩, 于淳清, 祝启鼎. 基于用户关注度以及时间监督的任务分发[J]. 计算机研究与发展, 2022, 59(4): 813-825. |
[3] | 周钧锴, 王念, 崔莉. EasiLTOM:一种基于局部动态阈值的信号活动区间识别方法[J]. 计算机研究与发展, 2022, 59(4): 826-833. |
[4] | 侯鑫, 曲国远, 魏大洲, 张佳程. 基于迭代稀疏训练的轻量化无人机目标检测算法[J]. 计算机研究与发展, 2022, 59(4): 882-893. |
[5] | 杜国王, 周丽华, 王丽珍, 杜经纬. 基于两级权重的多视角聚类[J]. 计算机研究与发展, 2022, 59(4): 907-921. |
[6] | 张强, 杨吉斌, 张雄伟, 曹铁勇, 郑昌艳. CS-Softmax:一种基于余弦相似性的Softmax损失函数[J]. 计算机研究与发展, 2022, 59(4): 936-949. |
[7] | 丁文隆, 汪承宁, 童薇. 基于自选尾数压缩的高能效浮点忆阻存内处理系统[J]. 计算机研究与发展, 2022, 59(3): 533-552. |
[8] | 蔡长兴, 杜亚娟, 周泰宇. 耐久性感知的持久性内存异地更新[J]. 计算机研究与发展, 2022, 59(3): 553-567. |
[9] | 孙辉, 娄本冬, 黄建忠, 赵雨虹, 符松. 近数据计算下键值存储中Compaction并行优化方法[J]. 计算机研究与发展, 2022, 59(3): 597-616. |
[10] | 蔡桓, 陆克中, 伍启荣, 吴定明. 面向概念漂移数据流的自适应分类算法[J]. 计算机研究与发展, 2022, 59(3): 633-646. |
[11] | 蔡德润, 李红燕. 基于度量学习的无监督域适应方法及其在死亡风险预测上的应用[J]. 计算机研究与发展, 2022, 59(3): 674-682. |
[12] | 孔乐毅, 张金艺, 楼亮亮. 有限样本条件下欠规范手语识别容错特征扩充[J]. 计算机研究与发展, 2022, 59(3): 683-693. |
[13] | 柳欣, 王锐, 钟必能, 王楠楠. 结合双流网络和双向五元组损失的跨人脸-语音匹配[J]. 计算机研究与发展, 2022, 59(3): 694-705. |
[14] | 宋轩, 高云君, 李勇, 关庆锋, 孟小峰. 空间数据智能:概念、技术与挑战[J]. 计算机研究与发展, 2022, 59(2): 255-263. |
[15] | 倪庆剑, 彭文强, 张志政, 翟玉庆. 基于信息增强传输的时空图神经网络交通流预测[J]. 计算机研究与发展, 2022, 59(2): 282-293. |
阅读次数 | ||||||
全文 |
|
|||||
摘要 |
|
|||||