An Approach for Storytelling by Correlating Events from Social Networks
-
摘要: 推特和新浪微博等社交网络已成为报道公共事件的重要平台,它们为监控事件及其演化提供了宝贵的数据.然而,这些数据包含的非正式词语和碎片化文本使得从中提取描述性的信息具有一定的挑战.另外,从快速生成的大量微博监控事件演化也有一定难度.提出在社交网络中监控事件并对具有相同主题的事件演化进行分析.这既可以在粗粒度水平获得事件的概述,又可以在细粒度水平获得事件的详细信息.通过3个连续的组件实现该任务.1)用结构化的方法从微博检测事件;2)基于事件的隐式语义信息对事件聚类并将聚类获得的簇定义为故事;3)用基于图的方法为每个故事生成故事脉络,故事脉络用包含摘要的有向无环图表示故事内事件的演化.用户体验评估实验表明:提出的方法比现有方法具有更高的准确性和可理解性,并能够帮助用户监控事件及其演化.Abstract: Social networks, such as Twitter and Sina weibo, have become popular platforms to report the public event. They provide valuable data for us to monitor events and their evolution. However, informal words and fragmented texts make it challenging to extract descriptive information. Monitoring the event progression from fast accumulation of microblogs is also difficult. To this end, we monitor the event progression with a common topic from the social network. This can help us to gain an overview and a detailed documentation of the events. In this paper, we use three consecutive components to meet this end. First, we use a structure based approach to detect events from the microblog dataset. Second, we cluster the events by their topics based on their latent semantic information, and define each cluster as a story. Third, we use a graph based approach to generate a storyline for each story. The storyline is denoted by a directed acyclic graph (DAG) with a summary to express the progression of events in the story. The user experience evaluation indicates that this method can help us to monitor events and their progression by achieving improved accuracy and comprehension compared with the state of art methods.
-
Keywords:
- social network /
- event progression /
- storyline /
- cluster /
- topic model
-
-
期刊类型引用(13)
1. 孟令伍,贺成龙,顾学海,丁灿. 基于BERTopic模型的网络舆情事件热门话题追踪. 网络安全技术与应用. 2025(02): 29-36 . 百度学术
2. 杨京虎,段亮,岳昆,李忠斌. 基于子事件的对话长文本情感分析. 南京大学学报(自然科学). 2023(03): 483-493 . 百度学术
3. 刘东,林川,任丽娜,黄瑞章. 面向热点新闻事件的层次化故事脉络生成方法. 计算机应用. 2023(08): 2376-2381 . 百度学术
4. 翟利志,李睿祥,杨佳贝,饶元,张岐坦,周云. 基于复合语义特征的事件图谱构建技术研究进展. 计算机科学. 2023(09): 242-259 . 百度学术
5. 马子娟,岳昆,段亮,赵天资. 基于在线Biterm主题模型的舆情新闻事件跟踪. 计算机工程与应用. 2022(22): 132-141 . 百度学术
6. 樊笑冰,饶元,王硕,李睿祥,刘旭辉. 基于命名实体敏感的分层新闻故事线生成方法. 中文信息学报. 2021(01): 113-124 . 百度学术
7. 赵天资,段亮,岳昆,乔少杰,马子娟. 基于Biterm主题模型的新闻线索生成方法. 数据分析与知识发现. 2021(02): 1-13 . 百度学术
8. 王崇伟,赵旭剑. 面向新浪微博的故事脉络生成系统. 西南科技大学学报. 2021(03): 60-65 . 百度学术
9. 赵旭剑,王崇伟. 基于图卷积网络的微博新闻故事线抽取方法. 计算机应用. 2021(11): 3139-3144 . 百度学术
10. 赵旭剑,王崇伟,金培权,张晖,杨春明,李波. 面向Web的故事脉络挖掘研究综述. 中文信息学报. 2021(11): 13-33 . 百度学术
11. 陈黎明,黄瑞章,秦永彬,陈艳平. 面向新闻事件的故事树构建方法. 计算机工程与设计. 2020(07): 1910-1919 . 百度学术
12. 蒋伟进,王扬,刘晓亮,吕斯健. 基于词相关性特征的多归属谱聚类突发事件检测. 通信学报. 2020(12): 193-204 . 百度学术
13. 张晨昕,饶元,樊笑冰,王硕. 基于社交媒体的事件脉络挖掘研究进展. 中文信息学报. 2019(11): 15-30 . 百度学术
其他类型引用(15)
计量
- 文章访问数: 1395
- HTML全文浏览量: 3
- PDF下载量: 457
- 被引次数: 28