CN108564191A - 一种基于混沌理论的热点话题流行度预测系统及方法 - Google Patents
一种基于混沌理论的热点话题流行度预测系统及方法 Download PDFInfo
- Publication number
- CN108564191A CN108564191A CN201711380305.XA CN201711380305A CN108564191A CN 108564191 A CN108564191 A CN 108564191A CN 201711380305 A CN201711380305 A CN 201711380305A CN 108564191 A CN108564191 A CN 108564191A
- Authority
- CN
- China
- Prior art keywords
- popularity
- topic
- user
- parameter
- phase space
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 18
- 230000007246 mechanism Effects 0.000 claims abstract description 43
- 230000004927 fusion Effects 0.000 claims abstract description 29
- 238000000513 principal component analysis Methods 0.000 claims abstract description 6
- 230000000739 chaotic effect Effects 0.000 claims description 14
- 238000000605 extraction Methods 0.000 claims description 7
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 claims description 3
- 230000008859 change Effects 0.000 claims description 3
- 238000012552 review Methods 0.000 claims description 3
- 241000208340 Araliaceae Species 0.000 claims 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 claims 1
- 235000003140 Panax quinquefolius Nutrition 0.000 claims 1
- 235000008434 ginseng Nutrition 0.000 claims 1
- 238000007499 fusion processing Methods 0.000 abstract 1
- 230000000694 effects Effects 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 230000000644 propagated effect Effects 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 3
- 238000011161 development Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 210000003813 thumb Anatomy 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000013065 commercial product Substances 0.000 description 1
- 230000006854 communication Effects 0.000 description 1
- 238000013481 data capture Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 239000004744 fabric Substances 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000012887 quadratic function Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Development Economics (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明请求保护一种基于混沌理论的流行度预测模型。它的具体步骤如下:获取数据、定义流行度、混沌理论模型、预测模型四个部分。首先,通过网络爬虫抓取Web中的内容获取社交网络用户数据。然后,分析影响流行度的驱动机制,利用主成分分析,量化基于多种机制影响的话题流行度。其次,利用上一步定义的流行度时间序列分别从单参数和多参数入手,基于混沌理论进行流行度时间序列的相空间重构,同时,在多参数相空间融合过程中,利用贝叶斯估计理论将多个参数在同一高维空间中进行相点的最优融合,得到新的多参数重构相空间。最后,考虑到RBF具有很强的逼近非线性函数的能力,利用RBF对重构的混沌时间序列进行流行度预测。
Description
技术领域
本发明属于社交网络热点话题分析领域,主要涉及用户行为分析,构建一种基于混沌时间序列的热点话题流行度预测模型。
背景技术
随着Web2.0的兴起以及技术的发展与进步,在线社交网已经成为人们获取信息、交流信息的重要平台,对人们的工作生活产生了巨大的影响。其中,微博是当今最为流行的在线社交网之一,它是一种互动及传播性及快的平台,正是因为这,使得用户生成的内容成为受到关注的热门内容,拥有较高的流行度。对于话题的流行度的预测与分析具有非常重要的研究和应用价值。在安全领域,感知话题流行度的趋势、预测话题流行度的值,能够及时掌控舆情的发展趋势,从而有效的掌控社会态势并有利的支持安全预警和辅助决策;在商业领域,准确估计热点话题的流行度可以及时了解用户的需求和喜好,帮助商家更合理的进行商品推荐和广告投放。因此如何准确地估计出给定热点话题在未来某个时间点的流行度的值,成为社交网络领域的主要研究内容。
目前,关于流行度的研究主要集中于在线视频、微博、话题标签等。多数研究工作中,研究者通常将流行度定义量化为某种数量,如视频的观看数、微博的点赞数、话题标签的出现次数等。关于流行度的预测方法,主要有3类:基于早期流行度、基于影响因素、基于级联传播。基于早期流行度的预测方法认为早期流行度和一段时间后的流行度之间存在很强的线性关系,因此早期流行度可以作为预测因子预测未来时刻的流行度,SH模型是流行度演化态势预测的经典模型,后来SH模型的基础上扩展和延伸,如:多元线性回归模型和生成式模型等。基于影响因素的方法,考虑影响流行度的多种因素,利用分类学习、随机过程等对流行度进行预测。例如:He等人考虑影响流行度的时序因素和社交影响力,提出一个正则排序算法,用来预测网络信息未来流行度。基于级联传播的流行度预测方法,此方法是一种信息传播过程,考虑到好友间的网络拓扑结构,如:Kupavskii研究了Twitter中retweet的级联,利用传染病模型对retweet级联的增长过程进行建模。
在热点话题信息传播中,流行度的态势变化受多种因素交互影响,简单的用数量来定义流行度不能全面细致的反应流行度的态势变化,同时传统的时间序列流行度采用SH模型和多元回归等线性模型对未来时刻的流行度预测,忽略了流行度态势变化的非线性特点,且由于精确预测的数值是一个非常困难的问题,一些流行度预测仅仅停留在流行度范围、周期和速度预测领域。本发明把混沌理论应用到流行度的预测当中,传统的混沌预测时从宏观角度出发,把百度指数、谷歌指数当作流行度,本方法则从具体话题入手,把混沌理论应用于微观、细粒度的热点话题流行度预测中,同时,针对单参数预测难以反映流行度态势变化的情况,利用贝叶斯估计理论进行多参数的最优融合,弥补了单参数预测不足,达到更好的预测效果。
发明内容
本发明针对现有技术中,流行度定义、交互机制影响下时间序列表现出非线性特征、流行度数值预测困难等问题,提出一种基于混沌理论的热点话题流行度预测系统及方法。该方法从微观、细粒度的层面,发现热点话题流行度的传播趋势具有混沌特性。
本发明的技术方案如下:
一种基于混沌理论的热点话题流行度预测系统,包括数据源获取模块,用于获取社交网络用户数据,抓取热点话题的传播信息,包括用户个人信息和用户话题用信息,其中,用户话题信息是指用户参与该话题转发、评论或者点赞的时间以及转发或者评论该话题的内容,用户个人信息包括参与该话题用户的粉丝数,关注数以及其历史行为信息,其还包括:流行度定义模块、融合模块及流行度预测模块;其中流行度定义模块是根据数据源模块抓取的数据,即用户的话题信息和历史行为信息,获得的影响流行度的因素,进而提取影响流行度变化趋势的行为驱动机制和属性驱动机制,利用主成分分析,确定影响流行度的主要驱动机制,定义基于多种驱动机制影响的流行度,进而获得单参数和多参数流行度时间序列;
融合模块,用于对流行度定义模块获得的单参数和多参数时间序列利用小数据量法求最大Lyapunov指数,从而证明热点话题的流行度变化趋势具有混沌特性,单参数相空间重构时,只需求得嵌入维数和延迟时间,按照相空间重构定理重构相空间,但对多参数相空间重构时,结合贝叶斯估计理论对多变量相空间在同一高维相空间进行相点的最优融合,得到对应的融合后新的相空间;
流行度预测模块,用于对融合模块得到的单参数和多参数融合相空间,利用径向基神将网络RBF对其重构的相空间进行流行度的预测。
进一步的,所述流行度定义模块提取流行度的行为驱动机制和属性驱动机制,包括以下内容:
行为驱动机制:
(1)参与该话题用户在特定时刻的评论数:countnum(ti)
(2)参与该话题用户在特定时刻的转发数:retweetnum(ti)
属性驱动机制:
(1)参与该话题用户在特定时刻关注度:attentionvalue(ti)
(2)参与该话题用户在特定时刻的影响力:influence(ti)。
进一步的,所述行为驱动机制,获取的转发和评论数影响的流行度的时间序列的获得包括:从话题开始到话题结束,每隔10分钟作为一个时间序列的采样点,用户在每个时刻受转发数影响的流行度定义为该时刻用户转发数相对上一时刻转发数增加的数目;用户在每个时刻受评论数影响的流行度定义为该时刻用户评论数相对上一时刻评论数增加的数目;
属性驱动机制:参与用户关注度影响的时间序列的获得:A(ui)是用户的关
注度,其中Num[fans(ui)]、Num[fllower(ui)]分别代表用户ui的粉丝数和关注数,
则把用户关注度定义为:
则用户在每时刻受用户关注度影响的流行度时间序列定义为在该时刻前一个小时内参与本话题的所有用户的关注度之和;
参与用户影响力影响的时间序列的获得:I(ui)是参与用户的影响力,其中分别为用户ui在所研究话题开始前一个月每条微博的平均阅读数、平均评论数、平均转发数,把用户影响力定义为:
则用户在每时刻受用户影响力影响的流行度时间序列定义为在该时刻前一个小时内参与本话题的所有用户的影响力之和。
进一步的,所述融合模块具体具体包括:
S31:单参数的相空间重构理论;
S32:多参数的相空间重构理论;
其中在单参数和多参数进行相空间重构时分别采用C-C算法和Cao算法求延迟时间和嵌入维数,且利用贝叶斯估计理论进行多参数相空间融合时,选取最大嵌入维数m和最小延迟时间τ作为新的相空间重构参数。
进一步的,所述流行度预测模块把得到的单参数和多参数相空间分别结合RBF进行流行度预测,其中输入是相空间的每个相点,输出是下一时刻流行度的值,φi是径向基函数,表示为:
其中ck为每个径向基函数的中心,σ为基宽向量。Yk表示预测模型的输入数据,在本发明代表重构后的每一个相点。
一种基于所述系统的基于混沌理论的热点话题流行度预测方法,包括以下步骤:
S1:获取数据源;从现有的社交平台的API获取,或者通过网络爬虫抓取web中的内容获取社交网络用户数据;
S2:定义流行度,获得单变量和多变量流行度态势变化的时间序列;提取影响流行度变化趋势的行为驱动机制和属性驱动机制,利用主成分分析,确定影响流行度的主要驱动机制,定义基于多种驱动机制影响的流行度,获得单参数和多参数流行度时间序列;
S3:证明热点话题流行度传播趋势具有混沌特性,进而对获得的单参数和多参数时间序列进行相空间重构;对S2获得的单变量和多变量时间序列利用小数据量法求最大Lyapunov指数;单变量相空间重构时,求得嵌入维数和延迟时间,按照相空间重构定理重构相空间即可,但对多变量相空间重构时,需要结合贝叶斯估计理论对多变量相空间在同一高维相空间进行相点的最优融合,得到对应的融合后新的相空间。
S4:对S3得到的单参数和多参数融合相空间,利用RBF对其重构的相空间进行流行度的预测。
本发明的优点及有益效果如下:
本发明首先,考虑到流行度的态势变化受多种驱动机制交互影响,利用主成分分析,确定影响流行度的主要成分,从而定义多种因素影响的流行度,更加全面细致的反映了流行度的态势变化。其次,本发明从具体话题入手,在微观细粒度层面发现信息传播趋势具有混沌特性,把混沌预测理论应用于流行度的预测。然后,考虑到单参数不足以反映流行度传播趋势变化情况,结合贝叶斯估计理论进行多参数的流行度影响驱动因素的最优融合,从而包含更全面的系统信息,反映更完整的系统特征,从而提高预测效果。最后,考虑到RBF具有高效的逼近高度复杂非线性系统的能力且收敛速度快、不易陷入局部最小值的优点,用RBF对重构后的相空间进行未来时刻流行度的预测,从而有效的提高预测能力。
附图说明
图1是本发明总体流程图;
图2是本发明的流行度定义模型图;
图3是本发明单参数混沌相空间重构图;
图4是本发明多参数混沌相空间重构图;
图5是本发明的预测模型图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、详细地描述。所描述的实施例仅仅是本发明的一部分实施例。
本发明解决上述技术问题的技术方案是:
如图1所示为本发明关于热点话题预测系统具体实施的流程示意图。本发明的具体步骤包括以下几个步骤:
S1:获取数据源。从现有的社交平台的API获取,或者通过网络爬虫抓取web中的内容获取社交网络用户数据。
S2:定义流行度,获得单变量和多变量流行度态势变化的时间序列。提取影响流行度变化趋势的行为驱动机制和属性驱动机制,利用主成分分析,确定影响流行度的主要驱动机制,定义基于多种驱动机制影响的流行度,进而获得单参数和多参数流行度时间序列。
S3:证明热点话题流行度传播趋势具有混沌特性,进而对获得的单参数和多参数时间序列进行相空间重构。对第二步获得的单变量和多变量时间序列利用小数据量法求最大Lyapunov指数,从而证明热点话题的流行度变化趋势具有混沌特性。单变量相空间重构时,只需求得嵌入维数和延迟时间,按照相空间重构定理重构相空间即可,但对多变量相空间重构时,需要结合贝叶斯估计理论对多变量相空间在同一高维相空间进行相点的最优融合,得到对应的融合后新的相空间。
S4:对S3得到的单参数和多参数融合相空间,利用RBF对其重构的相空间进行流行度的预测。
对于S1获取数据源,通过腾讯微博抓取热点话题的传播信息,其中包括用户个人信息和用户话题用信息。其中,用户话题信息是指用户参与该话题转发、评论或者点赞的时间以及转发或者评论该话题的内容,用户个人信息包括参与该话题用户的粉丝数,关注数以及其历史行为等信息。
对于S2的实施,其流程图如图2所示,主要包括以下几个步骤:
S21:提取影响流行度的驱动机制,获得各种驱动机制影响下的多参数的时间序列。从行为驱动机制和属性驱动机制两个方面提取影响流行度的影响因素,其中行为驱动机制是指参与话题用户的转发数和评论数,属性驱动机制是指参与话题用户的影响力和关注度。以下是各种驱动机制下各个时间序列获取的具体方法:
转发和评论数影响的流行度的时间序列的获得:从话题开始到话题结束,每隔10分钟作为一个时间序列的采样点,用户在每个时刻受转发数影响的流行度定义为该时刻用户转发数相对上一时刻转发数增加的数目。同理,用户在每个时刻受评论数影响的流行度定义为该时刻用户评论数相对上一时刻评论数增加的数目。
参与用户关注度影响的时间序列的获得:A(ui)是用户的关注度,其中Num[fans(ui)]、Num[fllower(ui)]分别代表用户ui的粉丝数和关注数。则把用户关注度定义为:
则用户在每时刻受用户关注度影响的流行度时间序列定义为在该时刻前一个小时内参与本话题的所有用户的关注度之和。
参与用户影响力影响的时间序列的获得:I(ui)是参与用户的影响力,其中分别为用户ui在所研究话题开始前一个月每条微博的平均阅读数、平均评论数、平均转发数。则把用户影响力定义为:
则用户在每时刻受用户影响力影响的流行度时间序列定义为在该时刻前一个小时内参与本话题的所有用户的影响力之和。
S22:对S21得到的多个影响流行度的时间序列,进行主成分分析,确定影响流行度的主要成分,从而定义出多种机制交互影响的流行度表达式。
对于S3的实施包括单参数的相空间重构和多参数的相空间重构,其具体步骤包括以下几个步骤:
S31:单参数的相空间重构理论,其具体实施流程图如图3,具体步骤如下:
S311:单参数流行度数据预处理。对步骤S2得到的单变量流行度时间序列记为{ai}(i=1,2,...,N),进行归一化处理,公式为:
S312:证明具有混沌特性。对S311预处理的数据利用小数据量法求最大Lyapunov指数判断话题有没有混沌特性,其中用C-C算法求延时时间,Cao求嵌入维数。
S313:利用步骤S312求得的嵌入维数和延迟时间,对单参数流行度进行相空间重构,重构后的相空间为:
S32:多参数的相空间重构理论,其具体实施流程图如图4,具体步骤如下:
S321:多参数流行度的时间序列的数据预处理。对步骤S2得到的多参数时间序列{wij}(i=1,2,...,M;j=1,2,...N)(其中M代表多参数的个数,N代表时间序列的长度)按照S311的方法分别进行归一化处理,得到新的归一化时间序列:{xij}(i=1,2,...,M;j=1,2,...N)。
S322:多参数相空间重构。用C-C和Cao算法分别求得各个参数的延迟时间和嵌入维数,取其中最小延迟时间m和最大嵌入维数τ,把多参数时间序列嵌入到同一高维空间,从而得到M个参数重构空间,其中第i个参数的重构空间表示为:
S323:贝叶斯估计理论进行相点的最优融合。步骤S322得到的多维相空间中,需要融合的相点集合为:Dk=[x1,x2,...,xM],其中
xi=(xi,k,xi,k+τ,...,xi,k+(m-1)τ)(i=1,2,...,M) 式(6)
其中xi表示任意M个相空间点。设zk表示融合后的相点,则有贝叶斯估计理论有:
假设参数zk服从的正态分布,且Dk服从分布,另则
其中,其指数部分是关于zk的二次函数,所以p(zk/x1,x2,...,xM)仍然服从正态分布N(z,σ2),即
根据式(8)和式(9)可得:
则最优融合相点zk的贝叶斯估计值可表示为:
则得到的新的相空间点则得到的新的m维相空间表示为:
Z=[Z1,Z2,...,ZM]T 式(12)
式中,Zi=[zi,zi+τ,...,zi+(m-1)τ](i=1,2,...,N-(m-1)τ)。其中Zi为融合后新的相点,i为时间序列中任意点的坐标。
S324:与S312证明单参数流行度具有混沌特性的方法一样,对上述得到的新的融合后的数据进行处理,证明数据具有混沌特性,从而得到了新的重构后的相空间。
对于S4的实施,把步骤S3得到的单参数和多参数相空间分别结合RBF进行流行度预测,其预测模型图如图5所示,其中输入是相空间的每个相点,输出是下一时刻流行度的值,φi是径向基函数,可表示为:
其中ck为每个径向基函数的中心,σ为基宽向量。
该模型一种流行度预测模型,一方面能够很好的预测未来时刻流行度的值,另一方面能够反映流行度态势变化趋势。本发明利用社交网络中热点话题的互动数据,分析影响流行度的多种驱动机制分析影响流行度的主要成分,定义流行度,进而把RBF和混沌理论相结合应用于流行度的预测。
以上这些实施例应理解为仅用于说明本发明而不用于限制本发明的保护范围。在阅读了本发明的记载的内容之后,技术人员可以对本发明作各种改动或修改,这些等效变化和修饰同样落入本发明权利要求所限定的范围。
Claims (6)
1.一种基于混沌理论的热点话题流行度预测系统,包括数据源获取模块,用于获取社交网络用户数据,抓取热点话题的传播信息,包括用户个人信息和用户话题用信息,其中,用户话题信息是指用户参与该话题转发、评论的时间以及转发或者评论该话题的内容,用户个人信息包括参与该话题用户的粉丝数,关注数以及其历史行为信息,其特征在于,还包括:流行度定义模块、融合模块及流行度预测模块;其中流行度定义模块是根据数据源模块抓取的数据,即用户的话题信息和历史行为信息,获得的影响流行度的因素,即和数据源模块的关系进而提取影响流行度变化趋势的行为驱动机制和属性驱动机制,利用主成分分析,确定影响流行度的主要驱动机制,定义基于多种驱动机制影响的流行度,进而获得单参数和多参数流行度时间序列;
融合模块,用于对流行度定义模块获得的单参数和多参数时间序列利用小数据量法求最大Lyapunov指数,从而证明热点话题的流行度变化趋势具有混沌特性,单参数相空间重构时,只需求得嵌入维数和延迟时间,按照相空间重构定理重构相空间,但对多参数相空间重构时,结合贝叶斯估计理论对多变量相空间在同一高维相空间进行相点的最优融合,得到对应的融合后新的相空间;
流行度预测模块,用于对融合模块得到的单参数和多参数融合相空间,利用径向基神将网络RBF对其重构的相空间进行流行度的预测。
2.根据权利要求1所述的一种基于混沌理论的热点话题流行度预测系统,其特征在于,所述流行度定义模块提取流行度的行为驱动机制和属性驱动机制,包括以下内容:
行为驱动机制:
(1)参与该话题用户在特定时刻的评论数:countnum(ti)
(2)参与该话题用户在特定时刻的转发数:retweetnum(ti)
属性驱动机制:
(1)参与该话题用户在特定时刻关注度:attentionvalue(ti)
(2)参与该话题用户在特定时刻的影响力:influence(ti)。
3.根据权利要求2所述的一种基于混沌理论的热点话题流行度预测系统,其特征在于,所述行为驱动机制,获取的转发和评论数影响的流行度的时间序列的获得包括:从话题开始到话题结束,每隔10分钟作为一个时间序列的采样点,用户在每个时刻受转发数影响的流行度定义为该时刻用户转发数相对上一时刻转发数增加的数目;用户在每个时刻受评论数影响的流行度定义为该时刻用户评论数相对上一时刻评论数增加的数目;
属性驱动机制:参与用户关注度影响的时间序列的获得:A(ui)是用户的关注度,其中Num[fans(ui)]、Num[fllower(ui)]分别代表用户ui的粉丝数和关注数,则把用户关注度定义为:
则用户在每时刻受用户关注度影响的流行度时间序列定义为在该时刻前一个小时内参与本话题的所有用户的关注度之和;
参与用户影响力影响的时间序列的获得:I(ui)是参与用户的影响力,其中分别为用户ui在所研究话题开始前一个月每条微博的平均阅读数、平均评论数、平均转发数,把用户影响力定义为:
则用户在每时刻受用户影响力影响的流行度时间序列定义为在该时刻前一个小时内参与本话题的所有用户的影响力之和。
4.根据权利要求1-3之一所述的基于混沌理论的热点话题流行度预测系统,其特征在于,所述融合模块具体具体包括:
S31:单参数的相空间重构理论;
S32:多参数的相空间重构理论;
其中在单参数和多参数进行相空间重构时分别采用C-C算法和Cao算法求延迟时间和嵌入维数,且利用贝叶斯估计理论进行多参数相空间融合时,选取最大嵌入维数m和最小延迟时间τ作为新的相空间重构参数。
5.根据权利要求4所述的基于混沌理论的热点话题流行度预测系统,其特征在于,所述流行度预测模块把得到的单参数和多参数相空间分别结合RBF进行流行度预测,其中输入是相空间的每个相点,输出是下一时刻流行度的值,φi是径向基函数,表示为:
其中ck为每个径向基函数的中心,σ为基宽向量。Yk表示预测模型的输入数据,代表重构后的每一个相点。
6.一种基于权利要求1所述系统的基于混沌理论的热点话题流行度预测方法,其特征在于,包括以下步骤:
S1:获取数据源;从现有的社交平台的API获取,或者通过网络爬虫抓取web中的内容获取社交网络用户数据;
S2:定义流行度,获得单变量和多变量流行度态势变化的时间序列;提取影响流行度变化趋势的行为驱动机制和属性驱动机制,利用主成分分析,确定影响流行度的主要驱动机制,定义基于多种驱动机制影响的流行度,获得单参数和多参数流行度时间序列;
S3:证明热点话题流行度传播趋势具有混沌特性,进而对获得的单参数和多参数时间序列进行相空间重构;对S2获得的单变量和多变量时间序列利用小数据量法求最大Lyapunov指数;单变量相空间重构时,求得嵌入维数和延迟时间,按照相空间重构定理重构相空间即可,但对多变量相空间重构时,需要结合贝叶斯估计理论对多变量相空间在同一高维相空间进行相点的最优融合,得到对应的融合后新的相空间。
S4:对S3得到的单参数和多参数融合相空间,利用RBF对其重构的相空间进行流行度的预测。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711380305.XA CN108564191A (zh) | 2017-12-20 | 2017-12-20 | 一种基于混沌理论的热点话题流行度预测系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711380305.XA CN108564191A (zh) | 2017-12-20 | 2017-12-20 | 一种基于混沌理论的热点话题流行度预测系统及方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108564191A true CN108564191A (zh) | 2018-09-21 |
Family
ID=63530258
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711380305.XA Pending CN108564191A (zh) | 2017-12-20 | 2017-12-20 | 一种基于混沌理论的热点话题流行度预测系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108564191A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110825948A (zh) * | 2019-11-05 | 2020-02-21 | 重庆邮电大学 | 基于促谣-辟谣消息和表示学习的谣言传播控制方法 |
CN114818914A (zh) * | 2022-04-24 | 2022-07-29 | 重庆大学 | 基于相空间和光流图像的多变量时间序列的分类方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104978857A (zh) * | 2015-05-26 | 2015-10-14 | 重庆邮电大学 | 一种基于混沌理论的交通状态预测方法及其装置 |
JP2015210557A (ja) * | 2014-04-24 | 2015-11-24 | 株式会社明電舎 | 予測装置及び予測方法 |
CN106651030A (zh) * | 2016-12-21 | 2017-05-10 | 重庆邮电大学 | 一种改进的rbf神经网络热点话题用户参与行为预测方法 |
CN107292390A (zh) * | 2017-05-24 | 2017-10-24 | 重庆邮电大学 | 一种基于混沌理论的信息传播模型及其传播方法 |
-
2017
- 2017-12-20 CN CN201711380305.XA patent/CN108564191A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015210557A (ja) * | 2014-04-24 | 2015-11-24 | 株式会社明電舎 | 予測装置及び予測方法 |
CN104978857A (zh) * | 2015-05-26 | 2015-10-14 | 重庆邮电大学 | 一种基于混沌理论的交通状态预测方法及其装置 |
CN106651030A (zh) * | 2016-12-21 | 2017-05-10 | 重庆邮电大学 | 一种改进的rbf神经网络热点话题用户参与行为预测方法 |
CN107292390A (zh) * | 2017-05-24 | 2017-10-24 | 重庆邮电大学 | 一种基于混沌理论的信息传播模型及其传播方法 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110825948A (zh) * | 2019-11-05 | 2020-02-21 | 重庆邮电大学 | 基于促谣-辟谣消息和表示学习的谣言传播控制方法 |
CN110825948B (zh) * | 2019-11-05 | 2022-10-18 | 重庆邮电大学 | 基于促谣-辟谣消息和表示学习的谣言传播控制方法 |
CN114818914A (zh) * | 2022-04-24 | 2022-07-29 | 重庆大学 | 基于相空间和光流图像的多变量时间序列的分类方法 |
CN114818914B (zh) * | 2022-04-24 | 2024-05-24 | 重庆大学 | 基于相空间和光流图像的多变量时间序列的分类方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Bliss et al. | An evolutionary algorithm approach to link prediction in dynamic social networks | |
Tan et al. | A coevolutionary algorithm for rules discovery in data mining | |
TW201717071A (zh) | 推薦方法及裝置 | |
CN106651030A (zh) | 一种改进的rbf神经网络热点话题用户参与行为预测方法 | |
Turabieh et al. | Dynamic adaptive network-based fuzzy inference system (D-ANFIS) for the imputation of missing data for Internet of medical Things applications | |
Jiahao et al. | Knowledge-based learning of nonlinear dynamics and chaos | |
Repta et al. | Towards the development of semantically enabled flexible process monitoring systems | |
Du et al. | Disentangled spatiotemporal graph generative models | |
Cybenko | Parallel computing for machine learning in social network analysis | |
Luo et al. | Empirical analysis and modelling social network user interaction behavior and time characteristics based on selection preference | |
Ji et al. | Multi-range gated graph neural network for telecommunication fraud detection | |
CN108564191A (zh) | 一种基于混沌理论的热点话题流行度预测系统及方法 | |
Hussain et al. | Federated learning: A survey of a new approach to machine learning | |
Elghomary et al. | Dynamic peer recommendation system based on trust model for sustainable social tutoring in MOOCs | |
Ling et al. | Nestpp: Modeling thread dynamics in online discussion forums | |
Ali et al. | NEDRL-CIM: Network embedding meets deep reinforcement learning to tackle competitive influence maximization on evolving social networks | |
An et al. | Information propagation with individual attention-decay effect on activity-driven networks | |
Xu et al. | Reverse-graph enhanced graph neural networks for session-based recommendation | |
CN114842247B (zh) | 基于特征累加的图卷积网络半监督节点分类方法 | |
Rojas et al. | Advances in computational intelligence | |
Tadić et al. | Can human-like bots control collective mood: agent-based simulations of online chats | |
Yan et al. | Tackling the achilles heel of social networks: Influence propagation based language model smoothing | |
Singh et al. | A neural architecture search for automated multimodal learning | |
Zhu et al. | Maximizing Influence in Temporal Social Networks: A Node Feature-Aware Voting Algorithm. | |
Liu et al. | Variational Collective Graph AutoEncoder for Multi-behavior Recommendation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180921 |