Learning to Rank for Evolution Trend Evaluation of Online Public Opinion Events
-
摘要: 社交网络中的舆情事件关乎社会的和谐与稳定,分析事件的演化趋势并进行管控能够有效降低恶性舆情事件的影响.但是,高效的舆情管控却面临标注数据少、管控资源有限的难题,采用人机混合增强技术,充分利用少量标注样本中的专家知识,是建立舆情演化态势评估模型的可行思路之一.据此,提出一种基于排序学习的舆情事件演化趋势重要性评估算法,在模型训练过程中,充分利用标注数据中的专家知识以及有标签数据和无标签数据的关联关系,筛选重要舆情事件进行管控,提升管控资源利用效能.首先,结合舆情管控经验和需求,从“人”“事”“势”等三要素出发,构建易获取、可量化、有含义的舆情事件演化态势评估指标体系;其次,基于图卷积神经网络构建舆情演化趋势评估模型,利用局部敏感Hash算法挖掘数据的空间结构信息,并利用图卷积求取数据及其邻域的混合特征;最后,针对有标签数据和无标签数据设计相应的损失函数,实现标注数据中专家知识和无标注数据中空间结构信息的综合利用.在公开数据集MQ2007-semi和MQ2008-semi上验证了算法的有效性,在自主构建的舆情数据集上验证了算法的实用性和泛化性.实验结果表明,所提算法可以根据少量的专家知识或标注数据,实现网络舆情事件演化态势的评估,为资源有限条件下的舆情事件管控提供决策支撑.Abstract: Public opinion events in social networks have a bearing on social harmony and stability. Analyzing the evolution trend of events so as to manage and control them is able to reduce the impact of malignant online public opinion. However, the lack of labelled data and the limited relevant resources makes the effective management of online public opinion challenging and complicated. To solve those difficulties, we propose a learning-to-rank algorithm for the events evolution trend evaluation, which makes full use of the expert knowledge in the labelled data and the correlation between labelled and unlabelled data to select important public opinion for management, in turn, improves the management efficiency. Firstly, based on the experiences and demands of public opinion management, we design a measurable, accessible and meaningful hierarchical index system, which is derived from the three most important factors of events, for evolution trend evaluation. Secondly, we build an evaluation model for evolution trend evaluation based on the graph convolutional network. Specifically, our model uses the local sensitive Hash algorithm to mine the structural information from the data node’s neighborhood and generates the mixed feature of the data node and its neighbor. Finally, we design different loss functions for the labelled and unlabelled data respectively, in order to realize the comprehensive utilization of the expert knowledge in the labelled data and the spatial structure information in the unlabelled data. We verify the efficiency of the proposed model on public datasets MQ 2007-semi and MQ 2008-semi. We also build a real-world public opinion event dataset to verify the practicability and generalization of the proposed algorithm. The experimental results show that the proposed model can evaluate the public opinion event evolution trend with limited expert knowledge, and provide decision support for public opinion event management with limited resources.
-
-
期刊类型引用(20)
1. 韩溥. 一种安全可靠的虚拟化智能弹性架构IRF教育网络设计. 网络安全技术与应用. 2025(03): 15-18 . 百度学术
2. 蒋燕,周彬彬,姚文才,王有香,陈凯,马玮骏,李胜,殷峻暹. 接收方发起的电站数据上报控制方法研究. 中国农村水利水电. 2024(03): 238-243+249 . 百度学术
3. 梅道光,王丽. 数据中心综合监控系统延迟问题分析及应对策略研究. 信息技术与信息化. 2024(04): 71-76 . 百度学术
4. 李仁刚,王彦伟,郝锐,肖麟阁,杨乐,杨广文,阚宏伟. Direct xPU:一种新型节点间通信优化的分布式异构计算架构. 计算机研究与发展. 2024(06): 1388-1400 . 本站查看
5. 蒋万春,李昊阳,陈晗瑜,王洁,王建新,阮昌. 网络拥塞控制方法综述. 软件学报. 2024(08): 3952-3979 . 百度学术
6. 农佳明,陈孟臻. 基于流量延时调度的无线传感网数据传输拥塞控制方法. 传感技术学报. 2024(08): 1441-1447 . 百度学术
7. 关世杰,王国靖. 基于状态确认的卫星链路拥塞控制算法研究. 沈阳理工大学学报. 2023(04): 15-18+25 . 百度学术
8. 高凯辉,李丹. 数据中心网络性能保障研究综述. 电信科学. 2023(06): 1-21 . 百度学术
9. 胡晋彬,罗望卿,王进. 基于NS-3的计算机网络传输实验教学方案设计. 软件导刊. 2023(06): 187-190 . 百度学术
10. 张磊,袁鉴辞,李静. 基于物联网技术的医学装备质控管理平台设计. 电子设计工程. 2023(17): 164-168 . 百度学术
11. 胡晋彬,黄家玮,王建新,王进. 基于直接拥塞通告的数据中心无损网络传输控制机制. 电子学报. 2023(09): 2355-2365 . 百度学术
12. 李佳琦,周书杰,曹成茂. 面粉存储智能仓库控制系统设计与试验. 中国农机装备. 2023(09): 29-35 . 百度学术
13. 马力文,周颖. 改善STARTUP阶段空窗现象的BBR单边适应算法. 计算机科学. 2022(02): 321-328 . 百度学术
14. 孙华宝. 基于SDN的云计算网络模型设计. 信息与电脑(理论版). 2022(07): 50-52 . 百度学术
15. 涂聪,陈庆奎. 面向AI数据流处理的边缘GPU集群通信系统. 小型微型计算机系统. 2022(06): 1147-1153 . 百度学术
16. 包红林,李敏,邵志东,张代兰. 面向大规模地震数据并行处理高速可扩展通信技术应用研究. 石油物探. 2022(05): 793-800 . 百度学术
17. 黄端琼. 福建省海洋与渔业大数据中心建设初探. 海洋信息技术与应用. 2022(04): 32-37 . 百度学术
18. 林霄,姬硕,岳胜男,孙卫强,胡卫生. 面向跨数据中心网络的节点约束存储转发调度方法. 计算机研究与发展. 2021(02): 319-337 . 本站查看
19. 张媛媛,姚晋. 一种高可靠网络的设计与实现. 数字通信世界. 2021(04): 15-18 . 百度学术
20. 管春泓. 云计算背景下数据中心网络架构设计研究. 信息系统工程. 2021(12): 97-100 . 百度学术
其他类型引用(31)
计量
- 文章访问数: 897
- HTML全文浏览量: 4
- PDF下载量: 518
- 被引次数: 51