• 中国精品科技期刊
  • CCF推荐A类中文期刊
  • 计算领域高质量科技期刊T1类
高级检索

基于动量模型的微博突发话题检测方法

贺敏, 杜攀, 张瑾, 刘悦, 程学旗

贺敏, 杜攀, 张瑾, 刘悦, 程学旗. 基于动量模型的微博突发话题检测方法[J]. 计算机研究与发展, 2015, 52(5): 1022-1028. DOI: 10.7544/issn1000-1239.2015.20131549
引用本文: 贺敏, 杜攀, 张瑾, 刘悦, 程学旗. 基于动量模型的微博突发话题检测方法[J]. 计算机研究与发展, 2015, 52(5): 1022-1028. DOI: 10.7544/issn1000-1239.2015.20131549
He Min, Du Pan, Zhang Jin, Liu Yue, Cheng Xueqi. Microblog Bursty Topic Detection Method Based on Momentum Model[J]. Journal of Computer Research and Development, 2015, 52(5): 1022-1028. DOI: 10.7544/issn1000-1239.2015.20131549
Citation: He Min, Du Pan, Zhang Jin, Liu Yue, Cheng Xueqi. Microblog Bursty Topic Detection Method Based on Momentum Model[J]. Journal of Computer Research and Development, 2015, 52(5): 1022-1028. DOI: 10.7544/issn1000-1239.2015.20131549
贺敏, 杜攀, 张瑾, 刘悦, 程学旗. 基于动量模型的微博突发话题检测方法[J]. 计算机研究与发展, 2015, 52(5): 1022-1028. CSTR: 32373.14.issn1000-1239.2015.20131549
引用本文: 贺敏, 杜攀, 张瑾, 刘悦, 程学旗. 基于动量模型的微博突发话题检测方法[J]. 计算机研究与发展, 2015, 52(5): 1022-1028. CSTR: 32373.14.issn1000-1239.2015.20131549
He Min, Du Pan, Zhang Jin, Liu Yue, Cheng Xueqi. Microblog Bursty Topic Detection Method Based on Momentum Model[J]. Journal of Computer Research and Development, 2015, 52(5): 1022-1028. CSTR: 32373.14.issn1000-1239.2015.20131549
Citation: He Min, Du Pan, Zhang Jin, Liu Yue, Cheng Xueqi. Microblog Bursty Topic Detection Method Based on Momentum Model[J]. Journal of Computer Research and Development, 2015, 52(5): 1022-1028. CSTR: 32373.14.issn1000-1239.2015.20131549

基于动量模型的微博突发话题检测方法

基金项目: 国家“八六三”高技术研究发展计划基金项目(SS2014AA012303);国家自然科学基金项目(61303156)
详细信息
  • 中图分类号: TP391

Microblog Bursty Topic Detection Method Based on Momentum Model

  • 摘要: 针对微博特征空间动态变化、信息噪音大的特点,提出一种基于有意义串动量模型的微博突发话题检测方法.提取时间窗口内微博信息流的有意义串,作为微博信息的动态特征,根据动力学原理对特征进行动量建模,结合特征能量大小、变化趋势以及二阶变化率检测突发特性有意义串,即突发特征,合并突发特征形成突发话题.微博数据实验表明,该方法适用于在线微博突发话题检测,在准确率和召回率上都有明显提升.
    Abstract: Microblogs reflect the general public's real-time reaction to major events. Finding bursty topics from microblogs is an important task to understand the current events which attract a large number of Internet users. However, the existing methods suitable for news articles aren't adopted directly for microblogs, because microblogs have unique characteristics compared with formal texts, including diversity, dynamic and noise. In this paper, a new detection method for microblog bursty topic is proposed based on momentum model. The meaningful strings are extracted from micorblog posts in the special time window as the microblog dynamic features. The dynamic characteristics of these features are modeled by the principle of momentum. The velocity, accelerated velocity and momentum of the features are defined by the dynamic frequencies at different dimensions. The bursty features are detected with the combination of momentum, variation trend and second order change rate. By merging the detected bursty features with mutual information, the bursty topics are obtained. The experiments are conducted on a real Sina microblog data set containing around 526 thousand posts of 1000 users, and results show that the proposed method improves the precision and recall remarkably compared with the conventional methods. The proposed method could be well applied in online bursty topic detection for microblog information.
  • 期刊类型引用(25)

    1. 吴仁彪,张振驰,贾云飞,乔晗. 云平台下基于截止时间的自适应调度策略. 计算机应用. 2023(01): 176-184 . 百度学术
    2. 邹文仲,邓力源,张高峰,王凌梓,章金峰. 基于调度云平台通用分布式架构实践. 南方电网技术. 2023(09): 20-28 . 百度学术
    3. 许源佳,吴恒,杨晨,吴悦文,张文博,王焘. 面向状态可变数据流的集群调度综述. 计算机学报. 2022(05): 973-992 . 百度学术
    4. 陈旭辉,刘洋,张鸿,高鹏,许竹霞. Linux大规模集群应用管理模型的研究及实现. 电子设计工程. 2022(10): 17-21+26 . 百度学术
    5. 谢志强,周伟,杨静. 考虑层级调度次序的资源协同综合调度算法. 计算机集成制造系统. 2022(11): 3391-3402 . 百度学术
    6. 刘刚. 城市智慧社区安防管理系统研究. 哈尔滨职业技术学院学报. 2022(06): 120-122 . 百度学术
    7. 毛安琪,汤小春,丁朝,李战怀. 集中式集群资源调度框架的可扩展性优化. 计算机研究与发展. 2021(03): 497-512 . 本站查看
    8. 陈吉宁. 基于动态增容的政务大数据资源调度优化系统设计. 自动化技术与应用. 2021(04): 58-61+72 . 百度学术
    9. 赵杉. 云平台安全监控大数据集群调度容错控制仿真. 计算机仿真. 2021(07): 486-490 . 百度学术
    10. 赵全,汤小春,朱紫钰,毛安琪,李战怀. 大规模短时间任务的低延迟集群调度框架. 计算机应用. 2021(08): 2396-2405 . 百度学术
    11. 鲁小艳. 基于集群计算的高校艺术专业理论教学与实践模式. 科技风. 2021(33): 129-132 . 百度学术
    12. 王晓霞,孙德才. 大数据处理中MapReduce框架的Q-sample算法设计. 现代计算机. 2021(36): 44-48 . 百度学术
    13. 崔校郡. 新时期大数据分析与应用关键技术研究. 信息技术与信息化. 2020(01): 204-206 . 百度学术
    14. 顾东虎. Hadoop云平台下基于P-WAP的大数据聚类挖掘算法. 长春师范大学学报. 2020(10): 29-35 . 百度学术
    15. 姜一,刘菁,姚嵘. 基于智能感知的电力多元数据集群热点处理研究. 电子设计工程. 2020(21): 20-23+28 . 百度学术
    16. 罗兰溪,柯行思,宋凯. 基于云平台的电力大数据变化趋势预测. 信息技术. 2020(11): 60-65 . 百度学术
    17. 孙卫红,吕文新. 区域集群下板材订单配置模型及算法研究. 运筹与管理. 2020(12): 38-42+50 . 百度学术
    18. 庞慧,刘丽娟,周丽莉. 有效网络大数据流多任务传输调度方法. 计算机仿真. 2020(12): 391-395 . 百度学术
    19. 朱晔,姜志博,田浩,陶汉涛,吴大伟,张磊,何君. 电网雷电大数据采集系统研发. 高压电器. 2019(04): 160-168 . 百度学术
    20. 刘甜. 大数据时代下计算机软件技术的应用探索. 计算机产品与流通. 2019(06): 20 . 百度学术
    21. 邵必林,王莎莎. 基于负载预测的HDFS动态负载均衡改进算法. 探测与控制学报. 2019(02): 75-80 . 百度学术
    22. 李维虎,张顶山,崔慧明,周龙,朱志挺,谢挺. 数据中心网络coflow调度机制结构构建及仿真. 电子测量技术. 2019(10): 78-81 . 百度学术
    23. 黄高攀,何金陵,庄岭,张利. 面向应用检测任务的负载均衡算法研究. 计算技术与自动化. 2019(01): 71-76 . 百度学术
    24. 郜广兰,徐晶晶,任刚,朱命冬,张超. 面向高校科研人员的高性能集群计算科研平台建设研究. 河南机电高等专科学校学报. 2019(03): 4-7 . 百度学术
    25. 陈湉,林勇. 大数据分析背景下地震后紧急物流资源调度模型设计. 地震工程学报. 2018(06): 1343-1349 . 百度学术

    其他类型引用(14)

计量
  • 文章访问数:  1229
  • HTML全文浏览量:  2
  • PDF下载量:  1050
  • 被引次数: 39
出版历程
  • 发布日期:  2015-04-30

目录

    /

    返回文章
    返回