计算机研究与发展 ›› 2018, Vol. 55 ›› Issue (9): 1972-1986.doi: 10.7544/issn1000-1239.2018.20180155
所属专题: 2018优青专题
李莹莹1,2,马帅1,2,蒋浩谊1,2,刘喆2,胡春明1,2,李雄3
Li Yingying1,2, Ma Shuai1,2, Jiang Haoyi1,2, Liu Zhe2, Hu Chunming1,2, Li Xiong3
摘要: 推特和新浪微博等社交网络已成为报道公共事件的重要平台,它们为监控事件及其演化提供了宝贵的数据.然而,这些数据包含的非正式词语和碎片化文本使得从中提取描述性的信息具有一定的挑战.另外,从快速生成的大量微博监控事件演化也有一定难度.提出在社交网络中监控事件并对具有相同主题的事件演化进行分析.这既可以在粗粒度水平获得事件的概述,又可以在细粒度水平获得事件的详细信息.通过3个连续的组件实现该任务.1)用结构化的方法从微博检测事件;2)基于事件的隐式语义信息对事件聚类并将聚类获得的簇定义为故事;3)用基于图的方法为每个故事生成故事脉络,故事脉络用包含摘要的有向无环图表示故事内事件的演化.用户体验评估实验表明:提出的方法比现有方法具有更高的准确性和可理解性,并能够帮助用户监控事件及其演化.
中图分类号: