NT-EP: A Non-Topology Method for Predicting the Scope of Social Message Propogation
-
摘要: 准确预测社交网络中消息的传播范围是舆情分析的重要内容,该问题受到了数据挖掘领域的广泛关注.目前的大部分研究主要利用社交网络拓扑结构和用户的动作日志来预测社交消息的传播范围.在实际应用中用户的动作日志中通常容易获得,但是社交网络的拓扑结构(例如用户之间的朋友关系)并不容易获得,因此无拓扑结构的社交消息预测具有更广泛的应用前景.提出了一种新的社交消息传播范围预测方法NT-EP,该方法由4部分构成:1)利用消息传播随时间衰减的特性为消息构造加权传播图,使用随机游走策略获取多条传播路径;2)把目标消息的传播路径输入到Bi-GRU(bidirectional gated recurrent unite),结合注意力机制计算出目标消息的传播特征向量;3)使用梯度下降方法计算出其他消息的影响向量;4)将目标消息的传播特征向量和其他消息的影响向量结合在一起,预测目标消息的传播范围.在Sina微博和Flixster数据集上的实验结果表明:NT-EP方法在均方误差(mean squared error, MSE),F1-score等多个指标上都优于现有的社交消息预测方法.Abstract: Predicting the scope of a message accurately in social networks is an important part of public opinion analysis, which has received extensive attention in the field of data mining. Most of the current research mainly uses social network topology and user action logs to predict the spread of social messages. It is usually easy to obtain action log about users in real applications, but the topology of the social network (for example, the friend relationship between users) is not easy to obtain. Therefore, non-topology social message prediction has good prospects for broader applications. In this paper, we propose a new method called NT-EP for predicting the propagation scope of social messages. NT-EP consists of four parts: 1)We construct a weighted propagation graph for each message based on the characteristics of message propagation decay over time, and then use a random walk strategy to obtain multiple propagation paths on the propagation graph; 2)We put multiple propagation paths of the target message into Bi-GRU, and combine the attention mechanism to obtain the propagation feature representation for the target message; 3)We use the gradient descent method to calculate the influence representation about other messages; 4)Combining the propagation feature representation for the target message with the influence representation about other events, we predict the propagation scope of the target message. The experimental results on Sina microblog and Flixster dataset show that our method is superior to existing social event prediction methods in terms of many indicators such as MSE and F1-score.
-
Keywords:
- social network /
- scope of propagation /
- topology structure /
- random walk /
- gradient descent
-
-
期刊类型引用(14)
1. 孙林,马天娇. 基于中心偏移的Fisher score与直觉邻域模糊熵的多标记特征选择. 计算机科学. 2024(07): 96-107 . 百度学术
2. 袁钟 ,陈红梅 ,王志红 ,李天瑞 . 利用混杂核模糊补互信息选择特征. 计算机研究与发展. 2023(05): 1111-1120 . 本站查看
3. 杨璇,马建敏,赵曼君. 基于邻域互信息的高维时序数据特征选择. 计算机工程. 2023(07): 135-142+149 . 百度学术
4. 马明艳,陈伟,吴礼发. 基于CNN_BiLSTM网络的入侵检测方法. 计算机工程与应用. 2022(10): 116-124 . 百度学术
5. 孙林,梁娜,徐久成. 基于自适应邻域互信息与谱聚类的特征选择. 山东大学学报(理学版). 2022(12): 13-24 . 百度学术
6. 刘文,米据生,孙妍. 一种新的犹豫模糊粗糙近似算子的公理刻画. 计算机研究与发展. 2021(09): 2062-2070 . 本站查看
7. 王翔,谢胜军. 加权社会网络低维冗余数据快速挖掘算法仿真. 计算机仿真. 2021(08): 372-375+477 . 百度学术
8. 张敏,彭红伟,颜晓玲. 基于神经网络的模糊决策树改进算法. 计算机工程与应用. 2021(21): 174-179 . 百度学术
9. 张仕斌,黄曦,昌燕,闫丽丽,程稳. 大数据环境下量子机器学习的研究进展及发展趋势. 电子科技大学学报. 2021(06): 802-819 . 百度学术
10. 姚晟,陈菊,吴照玉. 一种基于邻域容差信息熵的组合度量方法. 小型微型计算机系统. 2020(01): 46-50 . 百度学术
11. 徐道磊,陈培林,唐轶轩,吴尚,路宇,卞显福. 一种新的决策粗糙集最小化决策代价属性约简算法. 微电子学与计算机. 2020(08): 55-60+65 . 百度学术
12. 姚晟,吴照玉,陈菊,王维. 基于决策理论粗糙集的一种新属性约简方法. 微电子学与计算机. 2019(05): 76-81 . 百度学术
13. 段海玲,王光琼. 一种高效的复杂信息系统增量式属性约简. 华南理工大学学报(自然科学版). 2019(06): 18-30 . 百度学术
14. 龚芝,陈志伟,马凌. 不完备信息系统中一种新的不确定性度量方法. 测控技术. 2018(11): 116-119+124 . 百度学术
其他类型引用(7)
计量
- 文章访问数: 883
- HTML全文浏览量: 2
- PDF下载量: 283
- 被引次数: 21