• 中国精品科技期刊
  • CCF推荐A类中文期刊
  • 计算领域高质量科技期刊T1类
高级检索

自动文本摘要研究综述

李金鹏, 张闯, 陈小军, 胡玥, 廖鹏程

李金鹏, 张闯, 陈小军, 胡玥, 廖鹏程. 自动文本摘要研究综述[J]. 计算机研究与发展, 2021, 58(1): 1-21. DOI: 10.7544/issn1000-1239.2021.20190785
引用本文: 李金鹏, 张闯, 陈小军, 胡玥, 廖鹏程. 自动文本摘要研究综述[J]. 计算机研究与发展, 2021, 58(1): 1-21. DOI: 10.7544/issn1000-1239.2021.20190785
Li Jinpeng, Zhang Chuang, Chen Xiaojun, Hu Yue, Liao Pengcheng. Survey on Automatic Text Summarization[J]. Journal of Computer Research and Development, 2021, 58(1): 1-21. DOI: 10.7544/issn1000-1239.2021.20190785
Citation: Li Jinpeng, Zhang Chuang, Chen Xiaojun, Hu Yue, Liao Pengcheng. Survey on Automatic Text Summarization[J]. Journal of Computer Research and Development, 2021, 58(1): 1-21. DOI: 10.7544/issn1000-1239.2021.20190785
李金鹏, 张闯, 陈小军, 胡玥, 廖鹏程. 自动文本摘要研究综述[J]. 计算机研究与发展, 2021, 58(1): 1-21. CSTR: 32373.14.issn1000-1239.2021.20190785
引用本文: 李金鹏, 张闯, 陈小军, 胡玥, 廖鹏程. 自动文本摘要研究综述[J]. 计算机研究与发展, 2021, 58(1): 1-21. CSTR: 32373.14.issn1000-1239.2021.20190785
Li Jinpeng, Zhang Chuang, Chen Xiaojun, Hu Yue, Liao Pengcheng. Survey on Automatic Text Summarization[J]. Journal of Computer Research and Development, 2021, 58(1): 1-21. CSTR: 32373.14.issn1000-1239.2021.20190785
Citation: Li Jinpeng, Zhang Chuang, Chen Xiaojun, Hu Yue, Liao Pengcheng. Survey on Automatic Text Summarization[J]. Journal of Computer Research and Development, 2021, 58(1): 1-21. CSTR: 32373.14.issn1000-1239.2021.20190785

自动文本摘要研究综述

基金项目: 国家自然科学基金项目(61602474)
详细信息
  • 中图分类号: TP391

Survey on Automatic Text Summarization

Funds: This work was supported by the National Natural Science Foundation of China (61602474).
  • 摘要: 近年来,互联网技术的蓬勃发展极大地便利了人类的日常生活,不可避免的是互联网中的信息呈井喷式爆发,如何从中快速有效地获取所需信息显得极为重要.自动文本摘要技术的出现可以有效缓解该问题,其作为自然语言处理和人工智能领域的重要研究内容之一,利用计算机自动地从长文本或文本集合中提炼出一段能准确反映源文中心内容的简洁连贯的短文.探讨自动文本摘要任务的内涵,回顾和分析了自动文本摘要技术的发展,针对目前主要的2种摘要产生形式(抽取式和生成式)的具体工作进行了详细介绍,包括特征评分、分类算法、线性规划、次模函数、图排序、序列标注、启发式算法、深度学习等算法.并对自动文本摘要常用的数据集以及评价指标进行了分析,最后对其面临的挑战和未来的研究趋势、应用等进行了预测.
    Abstract: In recent years, the rapid development of Internet technology has greatly facilitated the daily life of human, and it is inevitable that massive information erupts in a blowout. How to quickly and effectively obtain the required information on the Internet is an urgent problem. The automatic text summarization technology can effectively alleviate this problem. As one of the most important fields in natural language processing and artificial intelligence, it can automatically produce a concise and coherent summary from a long text or text set through computer, in which the summary should accurately reflect the central themes of source text. In this paper, we expound the connotation of automatic summarization, review the development of automatic text summarization technique and introduce two main techniques in detail: extractive and abstractive summarization, including feature scoring, classification method, linear programming, submodular function, graph ranking, sequence labeling, heuristic algorithm, deep learning, etc. We also analyze the datasets and evaluation metrics that are commonly used in automatic summarization. Finally, the challenges ahead and the future trends of research and application have been predicted.
  • 期刊类型引用(13)

    1. 程巍,王红英,娄岩. 基于“5G云+VR”的心脏解剖虚拟仿真教学系统的构建与应用. 中国医学教育技术. 2025(02): 223-228 . 百度学术
    2. 费星瑞,谢逸. 基于HMM-NN的用户点击流识别. 计算机科学. 2022(07): 340-349 . 百度学术
    3. 王同贺,华昊辰,曹军威. 共识边缘计算及其在能源互联网中的应用. 电力建设. 2021(02): 116-125 . 百度学术
    4. 柴艳娜. 内核网络堆栈的Go语言实现与分析. 电子设计工程. 2021(13): 34-37+42 . 百度学术
    5. 樊琦,李卓,陈昕. 基于边缘计算的分支神经网络模型推断延迟优化. 计算机应用. 2020(02): 342-346 . 百度学术
    6. 向安玲,杨钰雯. 边缘计算在传媒领域的应用. 中国传媒科技. 2020(03): 113-116 . 百度学术
    7. 常国锋. 基于信任域的环形网络介质访问时延控制仿真. 计算机仿真. 2020(03): 349-353 . 百度学术
    8. 董召杰,林志达. 基于边缘计算的机巡图像缺陷识别算法研究. 自动化与仪器仪表. 2020(07): 77-80 . 百度学术
    9. 张翠芳,姬楠楠. 基于模糊矩阵的多线程网络通信延迟检测技术研究. 科学技术与工程. 2020(27): 11198-11203 . 百度学术
    10. 华昊辰,李宇童,王同贺,秦兆铭,曹军威. 一种基于混合随机H_2/H_∞方法的能源互联网边缘计算系统控制策略. 中国电机工程学报. 2020(21): 6875-6885 . 百度学术
    11. 闫朝峰,刘清莉. 王者荣耀业务网络感知保障浅析. 通讯世界. 2019(09): 81-82 . 百度学术
    12. 肖文华,刘必欣,刘巍,程钢,王跃华. 面向恶劣环境的边缘计算综述. 指挥与控制学报. 2019(03): 181-190 . 百度学术
    13. 丁祥海,王志会. 边缘计算在计算机科学方向的进展研究. 信息与管理研究. 2019(06): 73-83 . 百度学术

    其他类型引用(6)

计量
  • 文章访问数: 
  • HTML全文浏览量:  0
  • PDF下载量: 
  • 被引次数: 19
出版历程
  • 发布日期:  2020-12-31

目录

    /

    返回文章
    返回