CN111401648A - 一种互联网热点互相影响情况下的事件预测方法 - Google Patents
一种互联网热点互相影响情况下的事件预测方法 Download PDFInfo
- Publication number
- CN111401648A CN111401648A CN202010206364.0A CN202010206364A CN111401648A CN 111401648 A CN111401648 A CN 111401648A CN 202010206364 A CN202010206364 A CN 202010206364A CN 111401648 A CN111401648 A CN 111401648A
- Authority
- CN
- China
- Prior art keywords
- event
- attention
- time
- events
- network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/90335—Query processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/9038—Presentation of query results
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Human Resources & Organizations (AREA)
- Game Theory and Decision Science (AREA)
- Development Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本发明属于预测方法,具体涉及一种互联网热点互相影响情况下的事件预测方法。它包括下述步骤:步骤1:计算单个事件实时关注度;步骤2:计算事件互相影响度,并计算考虑了互相影响情况下的实时关注度;步骤3:根据事件关注度计算每个事件的概率;步骤4:通过最近的几个时间周期计算短期关注度趋势;步骤5:预测;步骤6:排序,对步骤5得到的概率排序,排序结果就是事件热点的排序情况。本发明的显著效果是:本申请充分考虑了不同事件之间的影响程度,因此预测准确率更高。
Description
技术领域
本发明属于预测方法,具体涉及一种互联网热点互相影响情况下的事件预测方法。
背景技术
网络信息的管控是互联网信息安全的重要组成部分。良好的网络信息管控可以减少负面信息言论,突出正能量。网络信息的特点之一是热点产生毫无规律,突发性强,有些信息持续性强,有些信息很快销声匿迹。如果能对网络热点信息进行预测,那么就能够提前预知未来热点信息走向,从而提前进行人工干预。
现有的预测方法一般都采用人工申请网络、贝叶斯算法等方式进行预测。这些预测方法或者计算量特别巨大,或者需要足够多的训练样本,往往经济开销或时间开销无法满足要求。
另外,网络热点往往不是孤立出现,一个事件的出现,与之有关联的类似事件、对立事件、谐音事件、同名人事件等都会多多少少收到影响,而这种影响,在现有技术的预测方法中并没有体现。
因此需要一种经济、高效、考虑事件之间关联性的预测方法。
发明内容
本发明针对现有技术缺陷,提供一种互联网热点互相影响情况下的事件预测方法。
本发明是这样实现的:一种互联网热点互相影响情况下的事件预测方法,包括下述步骤:
步骤1:计算单个事件实时关注度
通过计算得到单个事件的实时关注度;
步骤2:计算事件互相影响度
计算事件互相影响度,并计算考虑了互相影响情况下的实时关注度;
步骤3:所有事件关注度
根据事件关注度计算每个事件的概率;
步骤4:计算短期关注度趋势
通过最近的几个时间周期计算短期关注度趋势;
步骤5:预测
步骤6:排序
对步骤5得到的概率排序,排序结果就是事件热点的排序情况。
如上所述一种互联网热点互相影响情况下的事件预测方法,其中,所述的步骤1包括下述内容
用下述公式计算某事件a的网络实时关注度k′a
其中k′ai是单个网络节点i的关注度,n为整个网络中关注事件a的所有网络节点,
k′ai用下述公式计算
其中,kat为该网络节点在t时刻受关注的程度,具体数值从外部输入;
所述的t0为事件a在网络上第一次出现的时刻;
所述的t为当前时刻;
当t=t0时,为事件a第一次在网络上出现的时刻,此时该事件为孤立时间,因此不作计算。
如上所述一种互联网热点互相影响情况下的事件预测方法,其中,所述的步骤2包括下述内容
步骤2.1:事件分解
将所有事件按照关联表的要素进行分解,形成矩阵A
其中矩阵A的元素auv表示第u个事件的第v维度元素分解,
步骤2.2:查询关联度
对矩阵A中的每列元素,在关联表中查询同列元素中任意两个元素的关联度和查询次数,用bijz表示第i个事件和第j个事件在第z个维度的关联度,其中1≤z≤v,i≠j,i≤m,j≤m,m为网络中关注事件的总数量,
当关联表中有第i个事件和第j个事件在第z个维度的关联度时,bijz的值为关联表中的对应值,如果关联表中没有第i个事件和第j个事件在第z个维度的关联度时,bijz的值为0,
对上述数据梳理,可以得到,对于任意一个事件i可以得到矩阵B和矩阵C
以及
矩阵B表示网络中其他事件对该节点影响的情况,矩阵B中的每个元素表示第j个事件第v个维度对该节点的影响,
矩阵C为矩阵B的查询次数的汇总,即矩阵C中的每个元素是矩阵B中对应元素的查询次数,
步骤2.3:计算网络实时关注度
用下述公式计算考虑了事件相互影响的网络实时关注度ka
如上所述一种互联网热点互相影响情况下的事件预测方法,其中,所述的步骤3包括下述内容
假设有m个事件需要预测,那么计算m个事件的概率关系
其中计算得到的pj是第j个事件的概率;
式中的kj是步骤1中计算得到的单个事件的实时关注度,在步骤1中针对事件a因此得到的实时关注度为ka,当针对的是某具体事件j的时候,得到的就是实时关注度kj。
如上所述一种互联网热点互相影响情况下的事件预测方法,其中,所述的步骤4包括下述内容
对某个固定节点i,当其关注了某事件a时,可以输入kz1、kz2、kz3…kzg,该g个数值是步骤1中t时刻之前固定时间差的该节点对于事件a的关注度,并且
t-zg=zg-z(g-1)=…=z3-z2=z2-z1=Q
其中Q是时间差,由外部输入,g是向前延伸数据个数,由外部输入,
用下述公式计算短期关注度趋势Si,具体步骤如下
以时间为x坐标,以kzg为纵坐标,进行二次曲线拟合,对系数求导得到短期关注度趋势Si,
那么对事件a,则通过下式计算单独事件总短期关注趋势Sa
其中,n为网络中所有节点数。
如上所述一种互联网热点互相影响情况下的事件预测方法,其中,所述的步骤5包括下述内容
用下述公式预测第j个事件下一时刻的概率pj+1
其中pj是前面计算的第j个事件的概率;
所述的Sj是前面中计算的第j个事件的短期关注趋势。
本发明的显著效果是:(1)本申请只针对网络事件进行计算,不需要提前进行样本训练,计算复杂度较低,因此经济性和实效性都较好的满足了现实需求。(2)本申请充分考虑了时间对事件的影响度,也充分考虑了过去事件发展趋势对未来的影响度,所做的预测较为准确。(3)本申请充分考虑了不同事件之间的影响程度,因此预测准确率更高。
具体实施方式
本申请的方案需要提前建立一个关联表,在该表中包含以下内容:(1)构成事件的要素,例如人物、事件内容、地点等内容;(2)不同信息之间的关联度,例如现实生活中人物甲和人物乙是朋友,那么表中给出人物甲和人物乙的关联度,通过查表可以直接读取该关联度;(3)信息被成功查询到的次数自动累加,例如人物甲和人物乙的信息关联度,假设有外部请求进行查询,查询的内容是人物甲和人物乙的信息关联度,那么该信息的查询次数自动累加1。(4)若查询没有需要的关联度,那么返回数值0。
所述的关联表中的不同信息之间的关联度由人为确定,由于现实世界的各种关系是在不断变化的,因此每过一段时间,该关联表就需要更新。关联表中的事件构成要素可以根据需要进行调整,例如可以增加谐音、关键词、天气等任意需要的维度。
对于本领域技术人员来说,利用现有技术制作满足上述要求的关联表是很容易做到的。
一种互联网热点互相影响情况下的事件预测方法,包括下述步骤:
步骤1:计算单个事件实时关注度
用下述公式计算某事件a的网络实时关注度k′a
其中k′ai是单个网络节点i的关注度,n为整个网络中关注事件a的所有网络节点。
k′ai用下述公式计算
其中,kat为该网络节点在t时刻受关注的程度,具体数值从外部输入;
所述的t0为事件a在网络上第一次出现的时刻;
所述的t为当前时刻;
当t=t0时,为事件a第一次在网络上出现的时刻,此时该事件为孤立时间,因此不作计算。
步骤2:计算事件互相影响度
步骤2.1:事件分解
将所有事件按照关联表的要素进行分解,形成矩阵A
其中矩阵A的元素auv表示第u个事件的第v维度元素分解。
例如网络中只有4个事件,关联表中的要素只有3个,那么矩阵A就是4×3矩阵。
步骤2.2:查询关联度
对矩阵A中的每列元素,在关联表中查询同列元素中任意两个元素的关联度和查询次数,用bijz表示第i个事件和第j个事件在第z个维度的关联度,其中1≤z≤v,i≠j,i≤m,j≤m,m为网络中关注事件的总数量。
当关联表中有第i个事件和第j个事件在第z个维度的关联度时,bijz的值为关联表中的对应值,如果关联表中没有第i个事件和第j个事件在第z个维度的关联度时,bijz的值为0。
对上述数据梳理,可以得到,对于任意一个事件i可以得到矩阵B和矩阵C
以及
矩阵B表示网络中其他事件对该节点影响的情况,矩阵B中的每个元素表示第j个事件第v个维度对该节点的影响,
矩阵C为矩阵B的查询次数的汇总,即矩阵C中的每个元素是矩阵B中对应元素的查询次数,例如矩阵C中的元素cij是矩阵B中对应元素bij的查询次数,cij的具体数值直接从关联表中读取,如果关联表中没有相应值,cij的数值取0。
步骤2.3:计算网络实时关注度
用下述公式计算考虑了事件相互影响的网络实时关注度ka
步骤3:所有事件关注度
假设有m个事件需要预测,那么计算m个事件的概率关系
其中计算得到的pj是第j个事件的概率;
式中的kj是步骤1中计算得到的单个事件的实时关注度,在步骤1中针对事件a因此得到的实时关注度为ka,当针对的是某具体事件j的时候,得到的就是实时关注度kj。
步骤4:计算短期关注度趋势
对某个固定节点i,当其关注了某事件a时,可以输入kz1、kz2、kz3…kzg,该g个数值是步骤1中t时刻之前固定时间差的该节点对于事件a的关注度,并且
t-zg=zg-z(g-1)=…=z3-z2=z2-z1=Q
其中Q是时间差,由外部输入,g是向前延伸数据个数,由外部输入,Q可以是一分钟,一小时,一天,一周或其他时间长度,但是该Q值应保证在时间上最小的关注度kz1有意义。例如,某明星新新电影宣传,当事件第一次在网上出现第3天时,此时g取3,那么Q最大只能取为1天,使得Z1为第一次在网络上出现的那天的值。假设该事件在网上已经出现4天,g取3,Q取1天,那么kz1为第一天的关注度、kz2为第二天的关注度、kz3为第三天的关注度,kat为当前时刻t的关注度。类似的也可以将Q取为1小时,那么kz1为t时刻前3小时的关注度、kz2为t时刻前2小时的关注度、kz3为t时刻前1小时的关注度
用下述公式计算短期关注度趋势Si,具体步骤如下
以时间为x坐标,以kzg为纵坐标,进行二次曲线拟合,对系数求导得到短期关注度趋势Si。
那么对事件a,则通过下式计算单独事件总短期关注趋势Sa
其中,n为网络中所有节点数
步骤5:预测
用下述公式预测第j个事件下一时刻的概率pj+1
其中pj是步骤3计算的第j个事件的概率;
所述的Sj是步骤4中计算的第j个事件的短期关注趋势;
步骤6:排序
对步骤4得到的概率pj+1排序,排序结果就是事件热点的排序情况。
Claims (6)
1.一种互联网热点互相影响情况下的事件预测方法,其特征在于,包括下述步骤:
步骤1:计算单个事件实时关注度
通过计算得到单个事件的实时关注度;
步骤2:计算事件互相影响度
计算事件互相影响度,并计算考虑了互相影响情况下的实时关注度;
步骤3:所有事件关注度
根据事件关注度计算每个事件的概率;
步骤4:计算短期关注度趋势
通过最近的几个时间周期计算短期关注度趋势;
步骤5:预测
步骤6:排序
对步骤5得到的概率排序,排序结果就是事件热点的排序情况。
3.如权利要求2所述一种互联网热点互相影响情况下的事件预测方法,其特征在于:所述的步骤2包括下述内容
步骤2.1:事件分解
将所有事件按照关联表的要素进行分解,形成矩阵A
其中矩阵A的元素auv表示第u个事件的第v维度元素分解,
步骤2.2:查询关联度
对矩阵A中的每列元素,在关联表中查询同列元素中任意两个元素的关联度和查询次数,用bijz表示第i个事件和第j个事件在第z个维度的关联度,其中1≤z≤v,i≠j,i≤m,j≤m,m为网络中关注事件的总数量,
当关联表中有第i个事件和第j个事件在第z个维度的关联度时,bijz的值为关联表中的对应值,如果关联表中没有第i个事件和第j个事件在第z个维度的关联度时,bijz的值为0,
对上述数据梳理,可以得到,对于任意一个事件i可以得到矩阵B和矩阵C
以及
矩阵B表示网络中其他事件对该节点影响的情况,矩阵B中的每个元素表示第j个事件第v个维度对该节点的影响,
矩阵C为矩阵B的查询次数的汇总,即矩阵C中的每个元素是矩阵B中对应元素的查询次数,
步骤2.3:计算网络实时关注度
用下述公式计算考虑了事件相互影响的网络实时关注度ka
5.如权利要求4所述一种互联网热点互相影响情况下的事件预测方法,其特征在于:所述的步骤4包括下述内容
对某个固定节点i,当其关注了某事件a时,可以输入kz1、kz2、kz3…kzg,该g个数值是步骤1中t时刻之前固定时间差的该节点对于事件a的关注度,并且
t-zg=zg-z(g-1)=…=z3-z2=z2-z1=Q
其中Q是时间差,由外部输入,g是向前延伸数据个数,由外部输入,
用下述公式计算短期关注度趋势Si,具体步骤如下
以时间为x坐标,以kzg为纵坐标,进行二次曲线拟合,对系数求导得到短期关注度趋势Si,
那么对事件a,则通过下式计算单独事件总短期关注趋势Sa
其中,n为网络中所有节点数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010206364.0A CN111401648B (zh) | 2020-03-20 | 2020-03-20 | 一种互联网热点互相影响情况下的事件预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010206364.0A CN111401648B (zh) | 2020-03-20 | 2020-03-20 | 一种互联网热点互相影响情况下的事件预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111401648A true CN111401648A (zh) | 2020-07-10 |
CN111401648B CN111401648B (zh) | 2021-01-19 |
Family
ID=71429125
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010206364.0A Expired - Fee Related CN111401648B (zh) | 2020-03-20 | 2020-03-20 | 一种互联网热点互相影响情况下的事件预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111401648B (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104281607A (zh) * | 2013-07-08 | 2015-01-14 | 上海锐英软件技术有限公司 | 微博热点话题分析方法 |
CN104299070A (zh) * | 2014-09-12 | 2015-01-21 | 大连理工大学 | 电网运行趋势实时安全评估方法 |
CN104408108A (zh) * | 2014-11-18 | 2015-03-11 | 重庆邮电大学 | 基于灰色系统理论的热点话题群体影响力分析系统及方法 |
CN105761152A (zh) * | 2016-02-07 | 2016-07-13 | 重庆邮电大学 | 社交网络中一种基于三元组的参与话题预测方法 |
CN106156257A (zh) * | 2015-04-28 | 2016-11-23 | 北大方正集团有限公司 | 一种微博舆情事件的态势预测方法 |
CN106557552A (zh) * | 2016-10-27 | 2017-04-05 | 国家计算机网络与信息安全管理中心 | 一种网络话题热度预测方法 |
CN107944610A (zh) * | 2017-11-17 | 2018-04-20 | 平安科技(深圳)有限公司 | 预测事件流行度方法、服务器及计算机可读存储介质 |
CN109086341A (zh) * | 2018-07-10 | 2018-12-25 | 南京邮电大学 | 应用群体智能的热点事件热度度量方法 |
CN109299808A (zh) * | 2018-06-04 | 2019-02-01 | 西安电子科技大学 | 基于群体劝说力建模的网民观点演化趋势预测方法 |
-
2020
- 2020-03-20 CN CN202010206364.0A patent/CN111401648B/zh not_active Expired - Fee Related
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104281607A (zh) * | 2013-07-08 | 2015-01-14 | 上海锐英软件技术有限公司 | 微博热点话题分析方法 |
CN104299070A (zh) * | 2014-09-12 | 2015-01-21 | 大连理工大学 | 电网运行趋势实时安全评估方法 |
CN104408108A (zh) * | 2014-11-18 | 2015-03-11 | 重庆邮电大学 | 基于灰色系统理论的热点话题群体影响力分析系统及方法 |
CN106156257A (zh) * | 2015-04-28 | 2016-11-23 | 北大方正集团有限公司 | 一种微博舆情事件的态势预测方法 |
CN105761152A (zh) * | 2016-02-07 | 2016-07-13 | 重庆邮电大学 | 社交网络中一种基于三元组的参与话题预测方法 |
CN106557552A (zh) * | 2016-10-27 | 2017-04-05 | 国家计算机网络与信息安全管理中心 | 一种网络话题热度预测方法 |
CN107944610A (zh) * | 2017-11-17 | 2018-04-20 | 平安科技(深圳)有限公司 | 预测事件流行度方法、服务器及计算机可读存储介质 |
CN109299808A (zh) * | 2018-06-04 | 2019-02-01 | 西安电子科技大学 | 基于群体劝说力建模的网民观点演化趋势预测方法 |
CN109086341A (zh) * | 2018-07-10 | 2018-12-25 | 南京邮电大学 | 应用群体智能的热点事件热度度量方法 |
Non-Patent Citations (2)
Title |
---|
YIK-WAI NG: "TrendFocus: Visualization of trends in financial news with indicator sets", 《IEEE XPLORE》 * |
苏晨吉: ""大规模网络事件热度预测系统的设计与实现"", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Also Published As
Publication number | Publication date |
---|---|
CN111401648B (zh) | 2021-01-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110462604A (zh) | 基于设备使用关联互联网设备的数据处理系统和方法 | |
CN107644089A (zh) | 一种基于网络媒体的热门事件提取方法 | |
CN112434169A (zh) | 一种知识图谱的构建方法及其系统和计算机设备 | |
CN111506723A (zh) | 问答响应方法、装置、设备及存储介质 | |
WO2010037314A1 (zh) | 一种搜索的方法、系统和装置 | |
CN113672599A (zh) | 通过创建领域知识图谱实现政务信息化项目建设管理的可视化辅助决策方法 | |
CN112149976A (zh) | 一种基于人工智能的电网精准投资项目决策方法 | |
CN111401648B (zh) | 一种互联网热点互相影响情况下的事件预测方法 | |
CN109886449A (zh) | 一种基于用户用电行为的地区电网负荷预测方法 | |
CN110019763B (zh) | 文本过滤方法、系统、设备及计算机可读存储介质 | |
CN113807827A (zh) | 一种基于大数据的人力资源匹配算法 | |
Karozis et al. | A deep learning approach for spatial error correction of numerical seasonal weather prediction simulation data | |
CN112488063A (zh) | 一种基于多阶段聚合Transformer模型的视频语句定位方法 | |
CN117081941A (zh) | 基于注意力机制的流量预测方法及其装置、电子设备 | |
CN107016135A (zh) | 一种面向非确定、不保真、超复杂资源环境的正反双向动态平衡搜索策略 | |
CN113065780B (zh) | 任务分配方法、装置、存储介质和计算机设备 | |
US20240005170A1 (en) | Recommendation method, apparatus, electronic device, and storage medium | |
CN112258009B (zh) | 一种智慧政务请求处理方法 | |
CN111416741B (zh) | 一种基于互联网技术的事件热点预测方法 | |
Riyana | Achieving Anatomization Constraints in Dynamic Datasets | |
Monti et al. | Learning Bayesian belief networks with neural network estimators | |
Zhang et al. | Daily tourism forecasting through a novel method based on principal component analysis, grey wolf optimizer, and extreme learning machine | |
CN113569139A (zh) | 一种个性化会话推荐方法和系统 | |
CN112016004A (zh) | 一种基于多粒度信息融合的职务犯罪筛查系统及方法 | |
CN111768031A (zh) | 一种基于arma算法预测人群聚集趋势的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20210119 |