• 中国精品科技期刊
  • CCF推荐A类中文期刊
  • 计算领域高质量科技期刊T1类
高级检索

一种基于集成学习的科研合作者潜力预测分类方法

艾科, 马国帅, 杨凯凯, 钱宇华

艾科, 马国帅, 杨凯凯, 钱宇华. 一种基于集成学习的科研合作者潜力预测分类方法[J]. 计算机研究与发展, 2019, 56(7): 1383-1395. DOI: 10.7544/issn1000-1239.2019.20180641
引用本文: 艾科, 马国帅, 杨凯凯, 钱宇华. 一种基于集成学习的科研合作者潜力预测分类方法[J]. 计算机研究与发展, 2019, 56(7): 1383-1395. DOI: 10.7544/issn1000-1239.2019.20180641
Ai Ke, Ma Guoshuai, Yang Kaikai, Qian Yuhua. A Classification Method of Scientific Collaborator Potential Prediction Based on Ensemble Learning[J]. Journal of Computer Research and Development, 2019, 56(7): 1383-1395. DOI: 10.7544/issn1000-1239.2019.20180641
Citation: Ai Ke, Ma Guoshuai, Yang Kaikai, Qian Yuhua. A Classification Method of Scientific Collaborator Potential Prediction Based on Ensemble Learning[J]. Journal of Computer Research and Development, 2019, 56(7): 1383-1395. DOI: 10.7544/issn1000-1239.2019.20180641

一种基于集成学习的科研合作者潜力预测分类方法

基金项目: 国家自然科学基金项目(61672332,61432011,U1435212);山西省海外归国人员研究项目(2017023)
详细信息
  • 中图分类号: TP18; TP391

A Classification Method of Scientific Collaborator Potential Prediction Based on Ensemble Learning

  • 摘要: 科研合作是学术成果非常重要的实现形式,很多高水平的研究成果通过合作实现.研究合作潜力可以为学者选择合作者提供指导,最大化科研效率.然而当前大数据爆发阻碍了合作者的有效选择.为了解决这个问题,基于学者-文章大数据,经过特征分析和优化,综合考虑学者的文章、机构、研究兴趣等个人属性和相关属性,分别从文章标题、文章等级、文章数量、时间及署名序多维度构造样本特征,以文章所发表的期刊会议等级作为合作者序列对的样本标签,表示当前合作者的潜力高低,利用集成方法的强学习特性,提出了基于集成学习分类方法的科研合作者潜力预测模型.分析并构造对应于科研合作者潜力预测问题的特征集后,采用分类方法解决这一问题.实验中准确率、召回率、F1分数都远高于传统机器学习方法,并能以较少的样本和时间收敛于较高值(80%以上),说明了模型的优越性.
    Abstract: Scientific cooperation is a very important form of academic achievement. Many high-level researches are achieved through cooperation. Researching the collaboration potential can provide guidance for scholars to choose collaborators and maximize the efficiency of scientific research. However, the current outbursts of big data have hindered the effective choice of collaborators. In order to solve the problem, based on scholar-paper big data, after features analysis and optimization and comprehensively considering individual attributes and related attributes of scholars' papers, institutions, research interests, etc., sample features from various dimensions such as paper title, paper rank, paper number, time and coauthor order are constructed. Taking journal or conference level of papers as the sample tags of collaborators sequence pairs, which indicates the potential of current cooperators and make use of the strong learning characteristics of the ensemble methods, a scientific collaborator potential prediction model based on ensemble learning classification method is proposed. After analyzing and constructing the feature set that corresponds to the problem of scientific collaborator potential prediction, classification method is adopted to solve the problem. In experiments, the accuracy, recall rate, and F1 score are much higher than those of traditional machine learning methods and can converge to high values (above 80%) with few samples and little time, indicating the superiority of the proposed model.
  • 期刊类型引用(10)

    1. 马国帅,钱宇华,张亚宇,李俊霞,刘郭庆. 动态异构信息融合的科研合作潜力预测. 计算机应用. 2023(09): 2775-2783 . 百度学术
    2. 胡泽文,崔静静,任萍. 国内科研合作研究进展综述. 现代情报. 2022(06): 148-159 . 百度学术
    3. 高虹雷,门昌骞,王文剑. 一种特征值区间划分的模型决策树加速算法. 小型微型计算机系统. 2021(06): 1136-1143 . 百度学术
    4. 刘国仕. 基于高校资源配置效率的大学生创新创业潜力测评系统设计. 现代电子技术. 2021(24): 83-86 . 百度学术
    5. 魏国辉,张丰聪,付先军,王振国. 中药成分相似性量化建模及寒热药性预测分析. 数据分析与知识发现. 2020(05): 75-83 . 百度学术
    6. 张佳欢,李磊军,李美争,米据生,解滨. 基于聚类的多标记选择性集成. 南京航空航天大学学报. 2020(05): 768-776 . 百度学术
    7. 张喆,汤永利. 基于集成学习的全云化健康大数据整合系统设计. 现代电子技术. 2020(22): 173-176+180 . 百度学术
    8. 陈文杰. 基于翻译模型的科研合作预测研究. 数据分析与知识发现. 2020(10): 28-36 . 百度学术
    9. 舒坚,高素,陈宇斌. 基于自适应广义回归神经网络的链路质量评估. 计算机研究与发展. 2020(12): 2662-2672 . 本站查看
    10. 刘鹏程,孙林夫,张常有. 融合组合赋权与嵌套集成分类器的服务商评价. 计算机集成制造系统. 2020(12): 3408-3426 . 百度学术

    其他类型引用(11)

计量
  • 文章访问数:  1073
  • HTML全文浏览量:  0
  • PDF下载量:  419
  • 被引次数: 21
出版历程
  • 发布日期:  2019-06-30

目录

    /

    返回文章
    返回