• 中国精品科技期刊
  • CCF推荐A类中文期刊
  • 计算领域高质量科技期刊T1类
高级检索

开放互联网中的学者画像技术综述

袁莎, 唐杰, 顾晓韬

袁莎, 唐杰, 顾晓韬. 开放互联网中的学者画像技术综述[J]. 计算机研究与发展, 2018, 55(9): 1903-1919. DOI: 10.7544/issn1000-1239.2018.20180139
引用本文: 袁莎, 唐杰, 顾晓韬. 开放互联网中的学者画像技术综述[J]. 计算机研究与发展, 2018, 55(9): 1903-1919. DOI: 10.7544/issn1000-1239.2018.20180139
Yuan Sha, Tang Jie, Gu Xiaotao. A Survey on Scholar Profiling Techniques in the Open Internet[J]. Journal of Computer Research and Development, 2018, 55(9): 1903-1919. DOI: 10.7544/issn1000-1239.2018.20180139
Citation: Yuan Sha, Tang Jie, Gu Xiaotao. A Survey on Scholar Profiling Techniques in the Open Internet[J]. Journal of Computer Research and Development, 2018, 55(9): 1903-1919. DOI: 10.7544/issn1000-1239.2018.20180139
袁莎, 唐杰, 顾晓韬. 开放互联网中的学者画像技术综述[J]. 计算机研究与发展, 2018, 55(9): 1903-1919. CSTR: 32373.14.issn1000-1239.2018.20180139
引用本文: 袁莎, 唐杰, 顾晓韬. 开放互联网中的学者画像技术综述[J]. 计算机研究与发展, 2018, 55(9): 1903-1919. CSTR: 32373.14.issn1000-1239.2018.20180139
Yuan Sha, Tang Jie, Gu Xiaotao. A Survey on Scholar Profiling Techniques in the Open Internet[J]. Journal of Computer Research and Development, 2018, 55(9): 1903-1919. CSTR: 32373.14.issn1000-1239.2018.20180139
Citation: Yuan Sha, Tang Jie, Gu Xiaotao. A Survey on Scholar Profiling Techniques in the Open Internet[J]. Journal of Computer Research and Development, 2018, 55(9): 1903-1919. CSTR: 32373.14.issn1000-1239.2018.20180139

开放互联网中的学者画像技术综述

基金项目: 国家自然科学基金优秀青年科学基金项目(61222212);国家自然科学基金项目(61806111);国家“八六三”高技术研究发展计划基金项目(2015AA124102) This work was supported by the National Natural Science Foundation of China for Excellent Young Scientists (61222212), the National Natural Science Foundation of China (61806111), and the National High Technology Research and Development Program of China (863 Program) (2015AA124102).
详细信息
  • 中图分类号: TP182

A Survey on Scholar Profiling Techniques in the Open Internet

  • 摘要: 开放互联网中的学者画像工作是近年来的研究热点问题.学者画像的目标是提取学者各维度的属性信息进行信息挖掘和分析应用.学者画像技术是大型智库实现专家发现、学术影响力评估等功能的关键.在开放互联网中,学者画像面临数据量大、数据噪音和数据冗余等新挑战.这使得传统的用户画像理论、模型和方法无法直接无缝地移植到开放互联网环境下的用户画像系统中.针对这些挑战,对现有学者画像技术进行了总结和分类,为进一步的研究工作提供参考.首先分析了学者画像问题,对学者画像的基础理论——信息抽取方法——进行了总体概述,详细总结了各种可用模型与方法;对实现学者画像的基本任务包括学者信息标注、研究兴趣挖掘和学术影响力预测进行了详细阐述;介绍了学者画像应用实例AMiner系统;对未来重点的研究内容和发展方向进行了探讨和展望.
    Abstract: Scholar profiling from the open Internet has become a hot research topic in recent years. Its goal is to extract the attribute information of a scholar. Scholar profiling is a fundamental issue in large-scale expert databases for finding experts, evaluating academic influence, and so on. In the open Internet, scholar profiling faces new challenges, such as large amount of data, data noise and data redundancy. The traditional user profiling methods and algorithms cannot be directly used in the user profiling system in the open Internet environment. In this paper, the existing technologies are summarized and classified to provide reference for further research. Firstly, we analyze the problem of scholar profiling, and give a general overview of the information extraction method, which is the basic theory of user profiling. Then, the three basic tasks of scholar profiling including scholar information annotation, research interest mining and academic impact prediction are introduced in detail. What’s more, the successful application system of scholar profiling called AMiner is introduced. Finally, open research issues are discussed and possible future research directions are prospected.
  • 期刊类型引用(14)

    1. 孙林,马天娇. 基于中心偏移的Fisher score与直觉邻域模糊熵的多标记特征选择. 计算机科学. 2024(07): 96-107 . 百度学术
    2. 袁钟 ,陈红梅 ,王志红 ,李天瑞 . 利用混杂核模糊补互信息选择特征. 计算机研究与发展. 2023(05): 1111-1120 . 本站查看
    3. 杨璇,马建敏,赵曼君. 基于邻域互信息的高维时序数据特征选择. 计算机工程. 2023(07): 135-142+149 . 百度学术
    4. 马明艳,陈伟,吴礼发. 基于CNN_BiLSTM网络的入侵检测方法. 计算机工程与应用. 2022(10): 116-124 . 百度学术
    5. 孙林,梁娜,徐久成. 基于自适应邻域互信息与谱聚类的特征选择. 山东大学学报(理学版). 2022(12): 13-24 . 百度学术
    6. 刘文,米据生,孙妍. 一种新的犹豫模糊粗糙近似算子的公理刻画. 计算机研究与发展. 2021(09): 2062-2070 . 本站查看
    7. 王翔,谢胜军. 加权社会网络低维冗余数据快速挖掘算法仿真. 计算机仿真. 2021(08): 372-375+477 . 百度学术
    8. 张敏,彭红伟,颜晓玲. 基于神经网络的模糊决策树改进算法. 计算机工程与应用. 2021(21): 174-179 . 百度学术
    9. 张仕斌,黄曦,昌燕,闫丽丽,程稳. 大数据环境下量子机器学习的研究进展及发展趋势. 电子科技大学学报. 2021(06): 802-819 . 百度学术
    10. 姚晟,陈菊,吴照玉. 一种基于邻域容差信息熵的组合度量方法. 小型微型计算机系统. 2020(01): 46-50 . 百度学术
    11. 徐道磊,陈培林,唐轶轩,吴尚,路宇,卞显福. 一种新的决策粗糙集最小化决策代价属性约简算法. 微电子学与计算机. 2020(08): 55-60+65 . 百度学术
    12. 姚晟,吴照玉,陈菊,王维. 基于决策理论粗糙集的一种新属性约简方法. 微电子学与计算机. 2019(05): 76-81 . 百度学术
    13. 段海玲,王光琼. 一种高效的复杂信息系统增量式属性约简. 华南理工大学学报(自然科学版). 2019(06): 18-30 . 百度学术
    14. 龚芝,陈志伟,马凌. 不完备信息系统中一种新的不确定性度量方法. 测控技术. 2018(11): 116-119+124 . 百度学术

    其他类型引用(7)

计量
  • 文章访问数:  2400
  • HTML全文浏览量:  10
  • PDF下载量:  1102
  • 被引次数: 21
出版历程
  • 发布日期:  2018-08-31

目录

    /

    返回文章
    返回