• 中国精品科技期刊
  • CCF推荐A类中文期刊
  • 计算领域高质量科技期刊T1类
高级检索

基于深度学习的数据库自然语言接口综述

潘璇, 徐思涵, 蔡祥睿, 温延龙, 袁晓洁

潘璇, 徐思涵, 蔡祥睿, 温延龙, 袁晓洁. 基于深度学习的数据库自然语言接口综述[J]. 计算机研究与发展, 2021, 58(9): 1925-1950. DOI: 10.7544/issn1000-1239.2021.20200209
引用本文: 潘璇, 徐思涵, 蔡祥睿, 温延龙, 袁晓洁. 基于深度学习的数据库自然语言接口综述[J]. 计算机研究与发展, 2021, 58(9): 1925-1950. DOI: 10.7544/issn1000-1239.2021.20200209
Pan Xuan, Xu Sihan, Cai Xiangrui, Wen Yanlong, Yuan Xiaojie. Survey on Deep Learning Based Natural Language Interface to Database[J]. Journal of Computer Research and Development, 2021, 58(9): 1925-1950. DOI: 10.7544/issn1000-1239.2021.20200209
Citation: Pan Xuan, Xu Sihan, Cai Xiangrui, Wen Yanlong, Yuan Xiaojie. Survey on Deep Learning Based Natural Language Interface to Database[J]. Journal of Computer Research and Development, 2021, 58(9): 1925-1950. DOI: 10.7544/issn1000-1239.2021.20200209

基于深度学习的数据库自然语言接口综述

基金项目: 国家自然科学基金重点项目(U1936206);国家自然科学基金项目(U1836109,U1903128);国家自然科学基金面上项目(61772289,62077031);国家自然科学基金青年科学基金项目(62002178);天津市自然科学基金项目(20JCQNJC01730)
详细信息
  • 中图分类号: TP391

Survey on Deep Learning Based Natural Language Interface to Database

Funds: This work was supported by the Key Program of the National Natural Science Foundation of China (U1936206), the National Natural Science Foundation of China (U1836109, U1903128), the General Program of the National Natural Science Foundation of China (61772289, 62077031), the National Natural Science Foundation of China for Young Scientists (62002178), and the Natural Science Foundation of Tianjin (20JCQNJC01730).
  • 摘要: 数据库自然语言接口(natural language interface to database, NLIDB)能够凭借自然语言描述实现数据库查询操作,是促进用户无障碍地与数据库交互的重要工具.因为NLIDB具有较高的应用价值,近年来一直受到学术与商业领域的关注.目前成熟的NLIDB系统大部分基于经典自然语言处理方法,即通过指定的规则实现自然语言查询到结构化查询的转化.但是基于规则的方法仍然存在拓展性不强的缺陷.深度学习方法具有分布式表示和深层次抽象表示等优势,能深入挖掘自然语言中潜在的语义特征.因此近年来在NLIDB中,引入深度学习技术成为了热门的研究方向.针对基于深度学习的NLIDB研究进展进行总结:首先以解码方法为依据,将现有成果归纳为4种类型分别进行分析;然后汇总了7种模型中常用的辅助方法;最后根据目前尚待解决的问题,提出未来仍需关注的研究方向.
    Abstract: NLIDB (natural language interface to database) provides a new form to access databases with barrier-free text query, which reduces the burdens for users to learn the SQL (structured query language). Because of its great application value, NLIDB has attracted much attention in the field of scientific research and commercial in recent years. Most of the current mature NLIDB systems are based on classical natural language processing technologies, which depend on rule-based approaches to realize the transformation from natural language questions to SQL. But these approaches have poor ability to generalize. Deep learning models have advantages on distributed and high-level representation learning, which are competent for semantic feature mining in natural language. Therefore, the application of deep learning technology in NLIDB has gradually become a hot research topic nowadays. This paper provides a systematic review of the NLIDB researches based on deep learning in recent years. The main contributions are as follows: firstly, according to the decoding method, we sort out existing deep learning-based NLIDB models into 4 categories, and state the advantage and the weakness respectively; secondly, we summarize 7 common assist techniques in the implementations of the NLIDB models; thirdly, we propose the problems remaining to be solved and put forward the relevant directions for future researches.
  • 期刊类型引用(13)

    1. 周康,阳爱民,周栋,林楠铠. 基于稀疏连接和多通道LSTM的NL2SQL研究. 信息技术. 2024(08): 169-173+180 . 百度学术
    2. 富庭轩,陈启明,杨怀宇. 一种新型的数据库自然语言查询实现方案. 现代信息科技. 2024(15): 51-54+59 . 百度学术
    3. 李伟强,王震,张正毅. AIGC时代下物流客服产业优化与探索. 中国新技术新产品. 2024(18): 133-136 . 百度学术
    4. 何佳壕,刘喜平,舒晴,万常选,刘德喜,廖国琼. 带复杂计算的金融领域自然语言查询的SQL生成. 浙江大学学报(工学版). 2023(02): 277-286 . 百度学术
    5. 赵志超,游进国,何培蕾,李晓武. 数据库中文查询对偶学习式生成SQL语句研究. 中文信息学报. 2023(03): 164-172 . 百度学术
    6. 王燕凤. 数据库查询系统中自然语言理解技术应用. 科技创新与应用. 2023(18): 23-26 . 百度学术
    7. 殷来祥,李志强,付琼莹. 基于NL2SQL的兵棋数据智能统计分析方法研究. 系统仿真学报. 2023(09): 2000-2010 . 百度学术
    8. 梁清源,朱琪豪,孙泽宇,张路,张文杰,熊英飞,梁广泰,郁莲. 基于深度学习的SQL生成研究综述. 中国科学:信息科学. 2022(08): 1363-1392 . 百度学术
    9. 熊军,张冲,王代印,宋连双,陈峰. 三区三线管控下GIS划定永久基本农田研究. 城市建筑. 2022(22): 41-45 . 百度学术
    10. 冯丽露,康耀龙,高晓晶,王涛. 基于SSM框架的数据结构在线评测系统设计与实现. 中国信息技术教育. 2021(13): 86-89 . 百度学术
    11. 何文红. 基于深度学习背景下的高中数学教学研究. 高考. 2021(22): 51-52 . 百度学术
    12. 千月欣,王永忠,李佳骏,徐天羿. 基于深度学习的机场能见度预测研究. 云南民族大学学报(自然科学版). 2021(06): 615-620 . 百度学术
    13. 王胜杰,李焕云. 基于灰色GM模型的数据压缩处理方法. 电脑知识与技术. 2021(36): 151-152+159 . 百度学术

    其他类型引用(10)

计量
  • 文章访问数:  1091
  • HTML全文浏览量:  12
  • PDF下载量:  504
  • 被引次数: 23
出版历程
  • 发布日期:  2021-08-31

目录

    /

    返回文章
    返回