Exploration on Neural Information Retrieval Framework
-
摘要: 经过几十年的发展,信息检索技术获得了长足的进步和广泛的应用,但当前主流的搜索引擎系统距离真正智能的信息获取系统仍然有较大差距.智能信息获取系统能够对网络大数据的内容进行获取、阅读和理解,对关键语义信息实现存储和检索,并能够依据用户的信息需求进行推理、决策和信息生成.实现这样的系统,迫切需要在检索架构和检索模型上形成根本性的改变和理论突破.近年来,围绕智能信息获取的需求,利用深度学习检索框架展开了系统性研究,在数据表征、数据索引以及检索算法等方向上形成了一系列原创成果,在探索全新的深度学习检索架构上不断迈进.Abstract: After decades of research, information retrieval technology has been significantly advanced and widely applied in our daily life. However, there is still a huge gap between modern search engines and true intelligent information accessing systems. In our opinion, an intelligent information accessing system should be able to crawl, read and understand the content of the big Web data, index and search the key semantic information, and reason, decide and generate the right results based on users’ information need. To develop such kind of systems, we need theoretical breakthrough on the search architecture and models. In recent years, to address the intelligent information accessing problem, we have conducted systematical research on neural information retrieval framework. We have achieved a few of original contributions on text representation, data indexing and relevance matching. However, there is still a long way in this direction and we will continue our exploration on neural information retrieval in the future.
-
Keywords:
- information retrieval /
- deep learning /
- data representation /
- relevance matching /
- data indexing
-
-
期刊类型引用(13)
1. 周康,阳爱民,周栋,林楠铠. 基于稀疏连接和多通道LSTM的NL2SQL研究. 信息技术. 2024(08): 169-173+180 . 百度学术
2. 富庭轩,陈启明,杨怀宇. 一种新型的数据库自然语言查询实现方案. 现代信息科技. 2024(15): 51-54+59 . 百度学术
3. 李伟强,王震,张正毅. AIGC时代下物流客服产业优化与探索. 中国新技术新产品. 2024(18): 133-136 . 百度学术
4. 何佳壕,刘喜平,舒晴,万常选,刘德喜,廖国琼. 带复杂计算的金融领域自然语言查询的SQL生成. 浙江大学学报(工学版). 2023(02): 277-286 . 百度学术
5. 赵志超,游进国,何培蕾,李晓武. 数据库中文查询对偶学习式生成SQL语句研究. 中文信息学报. 2023(03): 164-172 . 百度学术
6. 王燕凤. 数据库查询系统中自然语言理解技术应用. 科技创新与应用. 2023(18): 23-26 . 百度学术
7. 殷来祥,李志强,付琼莹. 基于NL2SQL的兵棋数据智能统计分析方法研究. 系统仿真学报. 2023(09): 2000-2010 . 百度学术
8. 梁清源,朱琪豪,孙泽宇,张路,张文杰,熊英飞,梁广泰,郁莲. 基于深度学习的SQL生成研究综述. 中国科学:信息科学. 2022(08): 1363-1392 . 百度学术
9. 熊军,张冲,王代印,宋连双,陈峰. 三区三线管控下GIS划定永久基本农田研究. 城市建筑. 2022(22): 41-45 . 百度学术
10. 冯丽露,康耀龙,高晓晶,王涛. 基于SSM框架的数据结构在线评测系统设计与实现. 中国信息技术教育. 2021(13): 86-89 . 百度学术
11. 何文红. 基于深度学习背景下的高中数学教学研究. 高考. 2021(22): 51-52 . 百度学术
12. 千月欣,王永忠,李佳骏,徐天羿. 基于深度学习的机场能见度预测研究. 云南民族大学学报(自然科学版). 2021(06): 615-620 . 百度学术
13. 王胜杰,李焕云. 基于灰色GM模型的数据压缩处理方法. 电脑知识与技术. 2021(36): 151-152+159 . 百度学术
其他类型引用(10)
计量
- 文章访问数: 2055
- HTML全文浏览量: 5
- PDF下载量: 976
- 被引次数: 23