CN106600069B - 基于微博主题标签进行微博转发预测的方法和系统 - Google Patents

基于微博主题标签进行微博转发预测的方法和系统 Download PDF

Info

Publication number
CN106600069B
CN106600069B CN201611183020.2A CN201611183020A CN106600069B CN 106600069 B CN106600069 B CN 106600069B CN 201611183020 A CN201611183020 A CN 201611183020A CN 106600069 B CN106600069 B CN 106600069B
Authority
CN
China
Prior art keywords
microblog
prediction
user
node
nodes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201611183020.2A
Other languages
English (en)
Other versions
CN106600069A (zh
Inventor
陈雁
郭培伦
朱鹏军
李平
胡栋
陈凯琪
刘婷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan Shuzhi Huitong Data Co ltd
Southwest Petroleum University
Original Assignee
Sichuan Shuzhi Huitong Data Co ltd
Southwest Petroleum University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan Shuzhi Huitong Data Co ltd, Southwest Petroleum University filed Critical Sichuan Shuzhi Huitong Data Co ltd
Priority to CN201611183020.2A priority Critical patent/CN106600069B/zh
Publication of CN106600069A publication Critical patent/CN106600069A/zh
Application granted granted Critical
Publication of CN106600069B publication Critical patent/CN106600069B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Theoretical Computer Science (AREA)
  • Tourism & Hospitality (AREA)
  • General Physics & Mathematics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Development Economics (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于微博主题标签进行微博转发预测的方法和系统,其方法包括:获取并存储预设时间窗内各微博的微博内容及微博转发关系;根据微博内容对所述时间窗内的微博进行主题分类;对每个微博主题建立微博转发关系网络;计算每个微博主题的微博转发关系网络中各节点的权重;根据各微博转发关系网络中各节点的权重进行微博转发预测。本发明通过对现有微博按照主题进行分类,然后针对每一类主题的微博建立一个微博转发关系网络,然后根据各微博转发关系网络实现微博转发的预测。

Description

基于微博主题标签进行微博转发预测的方法和系统
技术领域
本发明涉及信息传播技术领域,特别是涉及一种基于微博主题标签进行微博转发预测的方法和系统。
背景技术
微博(Weibo),即微型博客(MicroBlog)的简称,也即是博客的一种,是一种通过关注机制分享简短实时信息的广播式的社交网络平台。
微博是一个基于用户关系信息分享、传播以及获取的平台。用户可以通过WEB、WAP等各种客户端组建个人社区,以140字(包括标点符号)的文字更新信息,并实现即时分享。微博的关注机制分为可单向、可双向两种。
微博作为一种分享和交流平台,其更注重时效性和随意性。微博客更能表达出每时每刻的思想和最新动态,而博客则更偏重于梳理自己在一段时间内的所见、所闻、所感。因微博而诞生出微小说这种小说体裁。
中国互联网络信息中心(CNNIC)于2011年7月19日发布《第28次中国互联网络发展状况统计报告》,报告显示,2011年上半年,中国微博用户从6331万增至1.95亿,增长约2倍。微博在网民中的普及率从13.8%增至40.2%。从2010年底至今,手机微博在网民中的使用率比例从15.5%上升到34%。
截至2014 年6 月底,我国微博用户规模为2.75 亿,用户之间结成复杂的关注关系,每天发送微博近1 亿条,信息沿着用户间的关注关系进行传播,形成传播扩散网络。微博转发是消息在微博网络中得到持续传播的重要方式,微博转发预测能够有效估计消息是否能获得转发及其转发规模,及早发现可能引发大规模爆发的微博,对微博突发性检测和微博影响力评估具有重要意义。
发明内容
本发明的目的在于克服现有技术的不足,提供一种基于微博主题标签进行微博转发预测的方法,根据微博的主题系进行微博转发的预测。
本发明的目的是通过以下技术方案来实现的:基于微博主题标签进行微博转发预测的方法,包括:
获取并存储预设时间窗内各微博的微博内容及微博转发关系;
根据微博内容对所述时间窗内的微博进行主题分类;
对每个微博主题建立微博转发关系网络;
计算每个微博主题的微博转发关系网络中各节点的权重;
根据各微博转发关系网络中各节点的权重进行微博转发预测。
根据微博内容对所述时间窗内的微博进行主题分类的方法,包括:
利用预设的主题模型对所述时间窗内的微博进行主题分类;
存储各微博主题中各微博的转发关系。
对每个微博主题建立微博转发关系网络的方法,包括:
根据各微博主题中各微博的转发关系,建立有向图网络:将各微博用户作为有向图网络中的节点,若第一微博用户关注了第二微博用户,则构建一条从第二微博用户至第一微博用户的有向边。
计算每个微博主题的微博转发关系网络中各节点的权重的方法,包括:
统计所述微博用户关系网络中的节点数N,为所述微博用户关系网络中的节点设置权重1/N;
更新所述节点的权重,直到各节点的权重的变化率小于第一阈值。
更新所述节点的权重的方法,包括:对于任意微博用户对应的节点,将该节点的权重平均分配给关注该微博用户的微博用户对应的节点。
根据各微博转发关系网络中各节点的权重进行微博转发预测的方法,包括:
定义一微博用户关注另一微博用户,则该微博用户为另一微博用户的一度粉丝;
获取发出待测微博的微博用户的一度粉丝对应的节点的权重;
判断所述一度粉丝对应节点中是否存在权重值超过第二阈值的节点:若是,则将权重值超过第二阈值的节点作为预测节点,然后进行下一阶段预测;若否,则选择权重值最大的设定数量的节点作为预测节点,然后进行下一阶段预测;
下一阶段预测:判断预测节点的一度粉丝对应节点中是否存在权重值大于第二阈值的节点,若是则将权重值大于第二阈值的节点作为预测节点,重复下一阶段预测;判断预测节点的一度粉丝数量是否大于第三阈值,若是,则选择权重值最大的设定数量的节点作为预测节点,重复下一阶段预测。
基于微博主题标签进行微博转发预测的系统,包括:
数据采集模块,获取并存储预设时间窗内各微博的微博内容及微博转发关系;
分析模块,根据微博内容对所述时间窗内的微博进行主题分类;对每个微博主题建立微博转发关系网络;计算每个微博主题的微博转发关系网络中各节点的权重;
预测模块,根据各微博转发关系网络中各节点的权重进行微博转发预测。
所述基于微博主题标签进行微博转发预测的系统还包括:
用户前端模块,为用户提供界面使其录入发布待测微博的微博用户的信息;
用户后端模块,存储预测结果,并将预测结果发送给预设网站进行调用。
计算每个微博主题的微博转发关系网络中各节点的权重的方法,包括:
统计所述微博用户关系网络中的节点数N,为所述微博用户关系网络中的节点设置权重1/N;
更新所述节点的权重,直到各节点的权重的变化率小于第一阈值;更新所述节点的权重的方法包括:对于任意微博用户对应的节点,将该节点的权重平均分配给关注该微博用户的微博用户对应的节点。
根据各微博转发关系网络中各节点的权重进行微博转发预测的方法,包括:
定义一微博用户关注另一微博用户,则该微博用户为另一微博用户的一度粉丝;
获取发出待测微博的微博用户的一度粉丝对应的节点的权重;
判断所述一度粉丝对应节点中是否存在权重值超过第二阈值的节点:若是,则将权重值超过第二阈值的节点作为预测节点,然后进行下一阶段预测;若否,则选择权重值最大的设定数量的节点作为预测节点,然后进行下一阶段预测;
下一阶段预测:判断预测节点的一度粉丝对应节点中是否存在权重值大于第二阈值的节点,若是则将权重值大于第二阈值的节点作为预测节点,重复下一阶段预测;判断预测节点的一度粉丝数量是否大于第三阈值,若是,则选择权重值最大的设定数量的节点作为预测节点,重复下一阶段预测。
本发明的有益效果是:本发明通过对现有微博按照主题进行分类,然后针对每一类主题的微博建立一个微博转发关系网络,然后根据各微博转发关系网络实现微博转发的预测。
附图说明
图1为本发明中基于微博主题标签进行微博转发预测的方法的一个实施例的流程图;
图2为本发明中基于微博主题标签进行微博转发预测的系统的一个实施例的框图。
具体实施方式
下面结合附图进一步详细描述本发明的技术方案,但本发明的保护范围不局限于以下所述。
如图1所示,基于微博主题标签进行微博转发预测的方法,包括:
步骤一、获取并存储预设时间窗内各微博的微博内容及微博转发关系。
步骤二、根据微博内容对所述时间窗内的微博进行主题分类。
根据微博内容对所述时间窗内的微博进行主题分类的方法,包括:
利用预设的主题模型对所述时间窗内的微博进行主题分类;
存储各微博主题中各微博的转发关系。
步骤三、对每个微博主题建立微博转发关系网络。
对每个微博主题建立微博转发关系网络的方法,包括:
根据各微博主题中各微博的转发关系,建立有向图网络:将各微博用户作为有向图网络中的节点,若第一微博用户关注了第二微博用户,则构建一条从第二微博用户至第一微博用户的有向边;若第一微博用户同时关注了第二微博用户和第三微博用户,则构建一条从第二微博用户至第一微博用户的有向边、以及一条从第三微博用户至第一微博用户的有向边。
步骤四、采用局部随机游走计算每个微博主题的微博转发关系网络中各节点的权重。
计算每个微博主题的微博转发关系网络中各节点的权重的方法,包括:
统计所述微博用户关系网络中的节点数N,为所述微博用户关系网络中的节点设置权重1/N;
更新所述节点的权重,直到各节点的权重的变化率小于第一阈值。
更新所述节点的权重的方法,包括:对于任意微博用户对应的节点,将该节点的权重平均分配给关注该微博用户的微博用户对应的节点。
步骤五、根据各微博转发关系网络中各节点的权重进行微博转发预测。
根据各微博转发关系网络中各节点的权重进行微博转发预测的方法,包括:
定义一微博用户关注另一微博用户,则该微博用户为另一微博用户的一度粉丝;
获取发出待测微博的微博用户的一度粉丝对应的节点的权重;
判断所述一度粉丝对应节点中是否存在权重值超过第二阈值的节点:若是,则将权重值超过第二阈值的节点作为预测节点,然后进行下一阶段预测;若否,则选择权重值最大的设定数量的节点作为预测节点,然后进行下一阶段预测;
下一阶段预测:判断预测节点的一度粉丝对应节点中是否存在权重值大于第二阈值的节点,若是则将权重值大于第二阈值的节点作为预测节点,重复下一阶段预测;判断预测节点的一度粉丝数量是否大于第三阈值,若是,则选择权重值最大的设定数量的节点作为预测节点,重复下一阶段预测。
如图2所示,基于微博主题标签进行微博转发预测的系统,包括数据采集模块、分析模块和预测模块。
所述数据采集模块,获取并存储预设时间窗内各微博的微博内容及微博转发关系。
所述分析模块,根据微博内容对所述时间窗内的微博进行主题分类;对每个微博主题建立微博转发关系网络;计算每个微博主题的微博转发关系网络中各节点的权重。
根据微博内容对所述时间窗内的微博进行主题分类的方法,包括:利用预设的主题模型对所述时间窗内的微博进行主题分类;存储各微博主题中各微博的转发关系。
对每个微博主题建立微博转发关系网络的方法,包括:
根据各微博主题中各微博的转发关系,建立有向图网络:将各微博用户作为有向图网络中的节点,若第一微博用户关注了第二微博用户,则构建一条从第二微博用户至第一微博用户的有向边;若第一微博用户同时关注了第二微博用户和第三微博用户,则构建一条从第二微博用户至第一微博用户的有向边、以及一条从第三微博用户至第一微博用户的有向边。
计算每个微博主题的微博转发关系网络中各节点的权重的方法,包括:统计所述微博用户关系网络中的节点数N,为所述微博用户关系网络中的节点设置权重1/N;更新所述节点的权重,直到各节点的权重的变化率小于第一阈值;更新所述节点的权重的方法包括:对于任意微博用户对应的节点,将该节点的权重平均分配给关注该微博用户的微博用户对应的节点。
所述预测模块,根据各微博转发关系网络中各节点的权重进行微博转发预测。
根据各微博转发关系网络中各节点的权重进行微博转发预测的方法,包括:
定义一微博用户关注另一微博用户,则该微博用户为另一微博用户的一度粉丝;
获取发出待测微博的微博用户的一度粉丝对应的节点的权重;
判断所述一度粉丝对应节点中是否存在权重值超过第二阈值的节点:若是,则将权重值超过第二阈值的节点作为预测节点,然后进行下一阶段预测;若否,则选择权重值最大的设定数量的节点作为预测节点,然后进行下一阶段预测;
下一阶段预测:判断预测节点的一度粉丝对应节点中是否存在权重值大于第二阈值的节点,若是则将权重值大于第二阈值的节点作为预测节点,重复下一阶段预测;判断预测节点的一度粉丝数量是否大于第三阈值,若是,则选择权重值最大的设定数量的节点作为预测节点,重复下一阶段预测。
所述基于微博主题标签进行微博转发预测的系统还包括:
用户前端模块,为用户提供界面使其录入发布待测微博的微博用户的信息;
用户后端模块,存储预测结果,并将预测结果发送给预设网站进行调用。
以上所述仅是本发明的优选实施方式,应当理解本发明并非局限于本文所披露的形式,不应看作是对其他实施例的排除,而可用于各种其他组合、修改和环境,并能够在本文所述构想范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本发明的精神和范围,则都应在本发明所附权利要求的保护范围内。

Claims (5)

1.基于微博主题标签进行微博转发预测的方法,其特征在于,包括:
获取并存储预设时间窗内各微博的微博内容及微博转发关系;
根据微博内容对所述时间窗内的微博进行主题分类;
对每个微博主题建立微博转发关系网络;
计算每个微博主题的微博转发关系网络中各节点的权重;
计算每个微博主题的微博转发关系网络中各节点的权重的方法,包括:
统计所述微博转发 关系网络中的节点数N,为所述微博转发 关系网络中的节点设置权重1/N;
更新所述节点的权重,直到各节点的权重的变化率小于第一阈值;
更新所述节点的权重的方法,包括:对于任意微博用户对应的节点,将该节点的权重平均分配给关注该微博用户的微博用户对应的节点;
根据各微博转发关系网络中各节点的权重进行微博转发预测包括:
定义一微博用户关注另一微博用户,则该微博用户为另一微博用户的一度粉丝;
获取发出待测微博的微博用户的一度粉丝对应的节点的权重;
判断所述一度粉丝对应节点中是否存在权重值超过第二阈值的节点:若是,则将权重值超过第二阈值的节点作为预测节点,然后进行下一阶段预测;若否,则选择权重值最大的设定数量的节点作为预测节点,然后进行下一阶段预测;
下一阶段预测:判断预测节点的一度粉丝对应节点中是否存在权重值大于第二阈值的节点,若是则将权重值大于第二阈值的节点作为预测节点,重复下一阶段预测;判断预测节点的一度粉丝数量是否大于第三阈值,若是,则选择权重值最大的设定数量的节点作为预测节点,重复下一阶段预测。
2.根据权利要求1所述的基于微博主题标签进行微博转发预测的方法,其特征在于,根据微博内容对所述时间窗内的微博进行主题分类的方法,包括:
利用预设的主题模型对所述时间窗内的微博进行主题分类;
存储各微博主题中各微博的转发关系。
3.根据权利要求1所述的基于微博主题标签进行微博转发预测的方法,其特征在于,对每个微博主题建立微博转发关系网络的方法,包括:
根据各微博主题中各微博的转发关系,建立有向图网络:将各微博用户作为有向图网络中的节点,若第一微博用户关注了第二微博用户,则构建一条从第二微博用户至第一微博用户的有向边。
4.根据权利要求1所述的基于微博主题标签进行微博转发预测的方法所运行的基于微博主题标签进行微博转发预测的系统,其特征在于,包括:
数据采集模块,获取并存储预设时间窗内各微博的微博内容及微博转发关系;
分析模块,根据微博内容对所述时间窗内的微博进行主题分类;对每个微博主题建立微博转发关系网络;计算每个微博主题的微博转发关系网络中各节点的权重;
预测模块,根据各微博转发关系网络中各节点的权重进行微博转发预测。
5.根据权利要求4所述的基于微博主题标签进行微博转发预测的系统,其特征在于,所述基于微博主题标签进行微博转发预测的系统还包括:
用户前端模块,为用户提供界面使其录入发布待测微博的微博用户的信息;
用户后端模块,存储预测结果,并将预测结果发送给预设网站进行调用。
CN201611183020.2A 2016-12-20 2016-12-20 基于微博主题标签进行微博转发预测的方法和系统 Expired - Fee Related CN106600069B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611183020.2A CN106600069B (zh) 2016-12-20 2016-12-20 基于微博主题标签进行微博转发预测的方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611183020.2A CN106600069B (zh) 2016-12-20 2016-12-20 基于微博主题标签进行微博转发预测的方法和系统

Publications (2)

Publication Number Publication Date
CN106600069A CN106600069A (zh) 2017-04-26
CN106600069B true CN106600069B (zh) 2020-08-18

Family

ID=58600193

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611183020.2A Expired - Fee Related CN106600069B (zh) 2016-12-20 2016-12-20 基于微博主题标签进行微博转发预测的方法和系统

Country Status (1)

Country Link
CN (1) CN106600069B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102662956A (zh) * 2012-03-05 2012-09-12 西北工业大学 一种基于用户话题链接行为的社交网络意见领袖识别方法
CN103412872A (zh) * 2013-07-08 2013-11-27 西安交通大学 一种基于有限节点驱动的微博社会网络信息推荐方法
CN104933622A (zh) * 2015-03-12 2015-09-23 中国科学院计算技术研究所 一种基于用户和微博主题的微博流行度预测方法及系统
CN105260474A (zh) * 2015-10-29 2016-01-20 俞定国 一种基于信息交互网络的微博用户影响力计算方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090124241A1 (en) * 2007-11-14 2009-05-14 Qualcomm Incorporated Method and system for user profile match indication in a mobile environment
US9489638B2 (en) * 2013-08-02 2016-11-08 Telefonaktiebolaget Lm Ericsson (Publ) Method and apparatus for propagating user preference information in a communications network

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102662956A (zh) * 2012-03-05 2012-09-12 西北工业大学 一种基于用户话题链接行为的社交网络意见领袖识别方法
CN103412872A (zh) * 2013-07-08 2013-11-27 西安交通大学 一种基于有限节点驱动的微博社会网络信息推荐方法
CN104933622A (zh) * 2015-03-12 2015-09-23 中国科学院计算技术研究所 一种基于用户和微博主题的微博流行度预测方法及系统
CN105260474A (zh) * 2015-10-29 2016-01-20 俞定国 一种基于信息交互网络的微博用户影响力计算方法

Also Published As

Publication number Publication date
CN106600069A (zh) 2017-04-26

Similar Documents

Publication Publication Date Title
Zhang et al. Dynamics of information diffusion and its applications on complex networks
Yan et al. Social network based microblog user behavior analysis
US10412185B2 (en) Event information system classifying messages using machine learning classification model and pushing selected messages to user
Lu et al. Predicting the content dissemination trends by repost behavior modeling in mobile social networks
US20100145900A1 (en) Spam filtering based on statistics and token frequency modeling
US9519682B1 (en) User trustworthiness
US20160359790A1 (en) System and method for determining and delivering breaking news utilizing social media
US20090144377A1 (en) Social news forwarding to generate interest clusters
US20140095611A1 (en) Personalization through dynamic social channels
Chen et al. TruSMS: A trustworthy SMS spam control system based on trust management
US20130123020A1 (en) Dynamic playbook: experimentation platform for social networks
Kandhway et al. Campaigning in heterogeneous social networks: Optimal control of SI information epidemics
US9146943B1 (en) Determining user content classifications within an online community
Jahanbakhsh et al. Social-greedy: a socially-based greedy routing algorithm for delay tolerant networks
KR20160086961A (ko) 사용자의 통신 가용성 표시
Li et al. Modeling and performance analysis of information diffusion under information overload in Facebook‐like social networks
CN103838814A (zh) 一种动态展示人脉图谱关系的方法
Yan et al. Empirical analysis on the human dynamics of blogging behavior on GitHub
US20150052203A1 (en) System and method for mailing list identification and representation
Zhu et al. Information dissemination model for social media with constant updates
CN103425703A (zh) 一种网络信息的处理方法和装置
JP2013003763A (ja) 情報推薦装置、情報推薦方法及び情報推薦プログラム
Zheng et al. Factors influencing message dissemination through social media
Yu et al. Positive and unlabeled learning for user behavior analysis based on mobile internet traffic data
CN106603387B (zh) 基于微博转发关系进行微博转发路径预测的方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20200818

Termination date: 20211220

CF01 Termination of patent right due to non-payment of annual fee