• 中国精品科技期刊
  • CCF推荐A类中文期刊
  • 计算领域高质量科技期刊T1类
高级检索

一种面向多源异构数据的协同过滤推荐算法

吴宾, 娄铮铮, 叶阳东

吴宾, 娄铮铮, 叶阳东. 一种面向多源异构数据的协同过滤推荐算法[J]. 计算机研究与发展, 2019, 56(5): 1034-1047. DOI: 10.7544/issn1000-1239.2019.20180461
引用本文: 吴宾, 娄铮铮, 叶阳东. 一种面向多源异构数据的协同过滤推荐算法[J]. 计算机研究与发展, 2019, 56(5): 1034-1047. DOI: 10.7544/issn1000-1239.2019.20180461
Wu Bin, Lou Zhengzheng, Ye Yangdong. A Collaborative Filtering Recommendation Algorithm for Multi-Source Heterogeneous Data[J]. Journal of Computer Research and Development, 2019, 56(5): 1034-1047. DOI: 10.7544/issn1000-1239.2019.20180461
Citation: Wu Bin, Lou Zhengzheng, Ye Yangdong. A Collaborative Filtering Recommendation Algorithm for Multi-Source Heterogeneous Data[J]. Journal of Computer Research and Development, 2019, 56(5): 1034-1047. DOI: 10.7544/issn1000-1239.2019.20180461
吴宾, 娄铮铮, 叶阳东. 一种面向多源异构数据的协同过滤推荐算法[J]. 计算机研究与发展, 2019, 56(5): 1034-1047. CSTR: 32373.14.issn1000-1239.2019.20180461
引用本文: 吴宾, 娄铮铮, 叶阳东. 一种面向多源异构数据的协同过滤推荐算法[J]. 计算机研究与发展, 2019, 56(5): 1034-1047. CSTR: 32373.14.issn1000-1239.2019.20180461
Wu Bin, Lou Zhengzheng, Ye Yangdong. A Collaborative Filtering Recommendation Algorithm for Multi-Source Heterogeneous Data[J]. Journal of Computer Research and Development, 2019, 56(5): 1034-1047. CSTR: 32373.14.issn1000-1239.2019.20180461
Citation: Wu Bin, Lou Zhengzheng, Ye Yangdong. A Collaborative Filtering Recommendation Algorithm for Multi-Source Heterogeneous Data[J]. Journal of Computer Research and Development, 2019, 56(5): 1034-1047. CSTR: 32373.14.issn1000-1239.2019.20180461

一种面向多源异构数据的协同过滤推荐算法

基金项目: 国家重点研发计划项目(2018YFB1201403);国家自然科学基金项目(61772475,61502434)
详细信息
  • 中图分类号: TP181

A Collaborative Filtering Recommendation Algorithm for Multi-Source Heterogeneous Data

  • 摘要: 随着电子商务网站的快速发展,数据特征和现实需求均发生了较大变化.以大规模、多源性、异构性为主要特征的数据发挥着更加重要的作用.然而,电子商务系统中数据所具有的特性使得大多数协同过滤方法较难直接用于物品推荐.如何整合多源异构数据来实现数据的价值最大化是当前推荐系统亟待解决的问题.针对这一问题,首先分析了多源异构数据中各类数据的特点,并根据各自特点为其设计了不同的建模方式.其次,提出一种新颖的推荐模型用于评分预测任务,它通过融合多关系数据和视觉信息来缓解数据稀疏问题.最后,设计了一种高效的算法MSRA(multi-source heterogeneous information based recommendation algorithm)用于求解所提模型的参数.在多个亚马逊数据集上的实验结果表明:1)面向多源异构数据的推荐算法其性能明显优于当前主流协同过滤算法; 2)该算法不仅可以有效缓解物品的冷启动问题,而且能够更好地预测不同类型物品的实际评分.
    Abstract: With the rapid development of electronic e-commerce sites, data characteristics and realistic demands have changed. The data, which has main characteristics of large-scale, multi-source and heterogeneous, is playing an important role. However, these unique characteristics of electronic e-commerce systems make most of existing collaborative filtering methods difficult to be adapted for product recommendation. The immediate problem to be solved is how to integrate multi-source heterogeneous data to achieve the maximum value of big data. In this paper, we first analyze the characteristics of various data among different information sources, and design different modeling solutions. Then, we propose a novel recommendation model for the task of rating prediction, which makes it possible to mitigate the sparsity problem via seamlessly integrating multi-relational data and visual contents. Finally, we devise a computationally efficient learning algorithm named MSRA (multi-source heterogeneous information based recommendation algorithm), to optimize the proposed model. To verify the effectiveness of our proposed model, we conduct extensive experiments on a wide spectrum of large-scale Amazon datasets. Experimental results demonstrate that 1)the designed algorithm consistently and significantly outperforms several state-of-the-art collaborative filtering algorithms, and 2)our algorithm is capable of alleviating the item cold-start problem and helping obtain more accurate results of various items.
  • 期刊类型引用(42)

    1. 暴琳,朱志宇,孙晓燕,徐标. 面向多源异构数据的个性化搜索和推荐算法综述. 控制理论与应用. 2024(02): 189-209 . 百度学术
    2. 刘思佳,黄海. 基于人工智能的多样性通用数据周期推荐算法. 系统科学学报. 2023(01): 61-65 . 百度学术
    3. 曹泽麟,徐君,董振华,文继荣. 基于多任务学习的位置倾向性得分预测算法. 计算机研究与发展. 2023(01): 85-94 . 本站查看
    4. 孙继洋. 浅析多源异构数据治理技术在跨境电力运营监管过程中的应用与实践. 科技与创新. 2023(04): 176-178+181 . 百度学术
    5. 王磊. 基于多源异构数据的体能训练效度评估方法. 信息技术. 2023(02): 191-196 . 百度学术
    6. 钱忠胜,赵畅,俞情媛,李端明. 结合注意力CNN与GNN的信息融合推荐方法. 软件学报. 2023(05): 2317-2336 . 百度学术
    7. 张作玲. 基于税收数据的协同过滤推荐算法设计与实现. 长沙民政职业技术学院学报. 2023(01): 117-124 . 百度学术
    8. 潘燕. 改进多维关联规则算法在多源异构数据挖掘中的应用. 内蒙古民族大学学报(自然科学版). 2023(03): 214-219 . 百度学术
    9. 李火苗. 面向移动终端的图书馆书籍智能推荐系统. 自动化技术与应用. 2023(06): 77-81 . 百度学术
    10. 张程东,王绍卿,刘玉芳,郑顺,孙福振. 采用新型元路径的异构图表示学习方法. 计算机科学与探索. 2023(07): 1680-1689 . 百度学术
    11. 黄巧文,周宽久,费铮,崔云鹏. 基于模糊聚类的多视图协同过滤推荐算法. 计算机技术与发展. 2023(08): 14-22 . 百度学术
    12. 侯浩天. 基于数据挖掘的大数据信息推荐算法研究. 信息与电脑(理论版). 2023(16): 76-78 . 百度学术
    13. 张富国,刘云鹤,李辉,毛明松,陈鸿宇. 一种基于准则级特征交叉融合的推荐算法. 小型微型计算机系统. 2023(12): 2700-2706 . 百度学术
    14. 李卓敏,卢敏,马圣雨,宋逸杰. 基于动态时间权重的混合协同过滤推荐算法. 软件导刊. 2023(12): 99-104 . 百度学术
    15. 陈改霞,叶萧然. 基于模糊关联空间的激光雷达三维扫描数据过滤研究. 现代雷达. 2023(12): 102-108 . 百度学术
    16. 李嘉雯,周捷,吴瑕玉. 我国个性化推荐算法现状可视化分析——对服装领域发展趋势的思考. 国际纺织导报. 2023(06): 42-46 . 百度学术
    17. 肖宏宇,曾文驱,王淑营. 基于模型特征匹配的BIM模型混合推荐算法. 计算机与现代化. 2022(01): 28-32 . 百度学术
    18. 朱木清,文谧. 基于数据挖掘的高维数据协同过滤推荐算法. 自动化与仪器仪表. 2022(01): 91-94+99 . 百度学术
    19. 李孟浩,赵学健,余云峰,宋学永,孙知信. 推荐算法研究进展. 小型微型计算机系统. 2022(03): 544-554 . 百度学术
    20. 毛俊华. 基于模糊聚类的智慧医院多源异构数据整合系统. 电子设计工程. 2022(07): 120-124 . 百度学术
    21. 吴福生,刘金会,倪明涛,李延斌. 多源数据关联访问控制模型下的隐私泄露定量分析. 现代电子技术. 2022(11): 57-61 . 百度学术
    22. 张艳,张柯,郭靖. 矿区岩土施工安全监测系统设计及应用. 能源与环保. 2022(07): 36-42 . 百度学术
    23. 阮大治,徐东,黄海艇. 电子信息系统中多维度数据协同过滤方法. 电子设计工程. 2022(15): 113-117 . 百度学术
    24. 尹天贺,牛存良,张养硕. 一种融合项目信息与信任机制的协同过滤算法. 河北工业大学学报. 2022(04): 39-45 . 百度学术
    25. 杨俊,肖楠,刘典勇. 基于MES的多源异构信息集成与共享系统. 电子设计工程. 2022(18): 77-81 . 百度学术
    26. 潘建宏,王磊,樊家树,张俊茹,董爱迪. 一种基于知识图谱技术的多源异构数据融合、共享方法. 电子设计工程. 2022(23): 185-188+193 . 百度学术
    27. 王卫红,冯倩,吕红燕,曹玉辉. 融合知识图谱表示学习的栈式自编码器推荐算法. 计算机应用与软件. 2021(02): 264-269 . 百度学术
    28. 何玉林,金一,戴德鑫,黄柏皓,黄家杰. 混合属性数据集分布一致性度量的新方法. 深圳大学学报(理工版). 2021(02): 170-179 . 百度学术
    29. 陈丛,周力臻. 基于Python爬虫技术的虚假数据溯源与过滤. 计算机仿真. 2021(03): 346-350 . 百度学术
    30. 罗莉霞,蒋盛益. 基于MapReduce的相似矩阵并行构造. 计算机工程与设计. 2021(05): 1368-1375 . 百度学术
    31. 秦冲,赵铁柱,柳毅. 个性化推荐算法的研究及发展综述. 东莞理工学院学报. 2021(03): 51-60 . 百度学术
    32. 张志强,邹文杰,陈豪贤. 家电服务全生命周期多源异构大数据集成技术研究. 电子技术与软件工程. 2021(16): 186-188 . 百度学术
    33. 高子建,张晗睿,窦万春,徐江民,孟顺梅. 基于谱聚类和隐语义模型的智能协同推荐方法. 计算机集成制造系统. 2021(09): 2517-2524 . 百度学术
    34. 张杰,张月琴,张泽华,刘志鑫,雷祥. 异质信息融合网络嵌入的注意力偏好推荐方法. 计算机工程与应用. 2021(21): 123-131 . 百度学术
    35. 朱海萍 ,赵成成 ,刘启东 ,郑庆华 ,曾疆维 ,田锋 ,陈妍 . 基于互惠性约束的可解释就业推荐方法. 计算机研究与发展. 2021(12): 2660-2672 . 本站查看
    36. 刘波. 基于多源数据集成的地理信息系统数据高效整合研究. 经纬天地. 2021(05): 93-96 . 百度学术
    37. 艾宪仓,岳铁军. 基于深度学习的小目标检测区域数据推荐算法. 信息技术. 2020(05): 54-57+63 . 百度学术
    38. 彭虎,杨迎方,邓长寿. 基于传播和时间权重的协同过滤新书推荐算法. 九江学院学报(自然科学版). 2020(01): 64-69 . 百度学术
    39. 张瑞典,钱晓东. 用余弦相似度修正评分的协同过滤推荐算法. 计算机工程与科学. 2020(06): 1096-1105 . 百度学术
    40. 刘海鸥,黄文娜,张源强,苏妍嫄. 移动社交网络情境化推荐关键问题研究综述. 小型微型计算机系统. 2020(09): 1812-1819 . 百度学术
    41. 刘航,崔涛. 基于加权决策的无人飞行器多源数据融合算法. 计算机仿真. 2020(10): 44-47+63 . 百度学术
    42. 农艺,唐忠. 综合用户属性和相似度的协同过滤推荐算法. 微型电脑应用. 2019(11): 27-29 . 百度学术

    其他类型引用(24)

计量
  • 文章访问数:  1693
  • HTML全文浏览量:  8
  • PDF下载量:  1010
  • 被引次数: 66
出版历程
  • 发布日期:  2019-04-30

目录

    /

    返回文章
    返回