CN107944610B - 预测事件流行度方法、服务器及计算机可读存储介质 - Google Patents

预测事件流行度方法、服务器及计算机可读存储介质 Download PDF

Info

Publication number
CN107944610B
CN107944610B CN201711141758.7A CN201711141758A CN107944610B CN 107944610 B CN107944610 B CN 107944610B CN 201711141758 A CN201711141758 A CN 201711141758A CN 107944610 B CN107944610 B CN 107944610B
Authority
CN
China
Prior art keywords
event
node
sequence
vector
cycle
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711141758.7A
Other languages
English (en)
Other versions
CN107944610A (zh
Inventor
王健宗
吴天博
黄章成
肖京
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN201711141758.7A priority Critical patent/CN107944610B/zh
Priority to PCT/CN2018/076135 priority patent/WO2019095570A1/zh
Publication of CN107944610A publication Critical patent/CN107944610A/zh
Application granted granted Critical
Publication of CN107944610B publication Critical patent/CN107944610B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • General Physics & Mathematics (AREA)
  • Marketing (AREA)
  • Tourism & Hospitality (AREA)
  • General Health & Medical Sciences (AREA)
  • General Business, Economics & Management (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Biomedical Technology (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Primary Health Care (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种预测事件流行度的方法,该方法包括:将社交网站的用户关系结构抽象成节点图;获取所述社交网站某个时刻事件,并在所述节点图上对所述事件可能传播的序列进行采样;建立基于门控循环单元的双循环神经网络模型;将所述采样的序列输入至所述基于门控循环单元的双循环神经网络模型;通过所述基于门控循环单元的双循环神经网络模型输出预测得到所述事件的影响度。本发明还提供一种服务器及计算机可读存储介质。本发明提供的预测事件流行度方法、服务器及计算机可读存储介质能够预测事件未来的流行度,为决策者提供科学的信息支持。

Description

预测事件流行度方法、服务器及计算机可读存储介质
技术领域
本发明涉及互联网技术领域,尤其涉及一种预测事件流行度方法、服务器及计算机可读存储介质。
背景技术
随着互联网以及移动终端的快速发展,社交媒体已经逐渐成为人们生活中不可缺少的一部分,也成为了这个时代信息传播的主要渠道。同时,社交媒体也是舆情传播的重要途径。在一个事件的早期发展阶段,预测这个事件将来的流行度,具有重大的意义。针对复杂网络的结构和信息扩散的模式,提出端到端的社交媒体事件热度预测方法,该方法通过对信息传播模式的学习,从而预测事件未来的流行度,为决策者提供科学的信息支持。
发明内容
有鉴于此,本发明提出一种预测事件流行度方法、服务器及计算机可读存储介质,以解决如何的问题。
首先,为实现上述目的,本发明提出一种预测事件流行度方法,该方法包括步骤:
将社交网站的用户关系结构抽象成节点图;
获取所述社交网站某个时刻事件,并在所述节点图上对所述事件可能传播的序列进行采样;
建立基于门控循环单元的双循环神经网络模型;
将所述采样的序列输入至所述基于门控循环单元的双循环神经网络模型;
通过所述基于门控循环单元的双循环神经网络模型输出预测得到所述事件的影响度。
可选地,所述将所述采样的序列输入至所述基于门控循环单元的双循环神经网络模型的步骤,具体包括如下步骤:
将所述节点图的每个节点映射成向量;
将每个节点传播的关于所述事件的文本内容映射成向量;
将所述每个节点映射成的向量以及所述每个节点传播的文本内容映射成的向量连接成序列向量作为双向循环神经网络模型的输入。
可选地,所述通过所述基于门控循环单元的双循环神经网络模型输出预测得到所述事件的影响度的步骤,具体包括:
使用注意力(attention)机制将图的序列向量转化成向量图的表示;
使用全连接层输出最终预测结果。
可选地,在所述节点图上对所述事件可能传播的序列进行采样的步骤,具体包括如下步骤:
采用随机游走对所述事件可能传播的序列进行采样;
计算在随机游走中正在访问的节点转移到邻居节点的概率;
根据马尔科夫性质及所述概率,采样出不同的节点转移序列。
可选地,所述方法还包括:
设定一预设时间;
当到达所述预设时间时,输出关于所述事件的热度预测结果;
设定一预设人数值;
当所述事件的影响人数达到所述预设人数时,输出关于所述事件的热度预测结果。
此外,为实现上述目的,本发明还提供一种服务器,包括存储器、处理器,所述存储器上存储有可在所述处理器上运行的预测事件流行度系统,所述预测事件流行度系统被所述处理器执行时实现如下步骤:
将社交网站的用户关系结构抽象成节点图;
获取所述社交网站某个时刻事件,并在所述节点图上对所述事件可能传播的序列进行采样;
建立基于门控循环单元的双循环神经网络模型;
将所述采样的序列输入至所述基于门控循环单元的双循环神经网络模型;
通过所述基于门控循环单元的双循环神经网络模型输出预测得到所述事件的影响度。
可选地,所述将所述采样的序列输入至所述基于门控循环单元的双循环神经网络模型的步骤,具体包括如下步骤:
将所述节点图的每个节点映射成向量;
将每个节点传播的关于所述事件的文本内容映射成向量;
将所述每个节点映射成的向量以及所述每个节点传播的文本内容映射成的向量连接成序列向量作为双向循环神经网络模型的输入。
可选地,在所述节点图上对所述事件可能传播的序列进行采样的步骤,具体包括如下步骤:
采用随机游走对所述事件可能传播的序列进行采样;
计算在随机游走中正在访问的节点转移到邻居节点的概率;
根据马尔科夫性质及所述概率,采样出不同的节点转移序列;
所述通过所述基于门控循环单元的双循环神经网络模型输出预测得到所述事件的影响度的步骤,具体包括:
使用注意力(attention)机制将图的序列向量转化成向量图的表示;
使用全连接层输出最终预测结果。
可选地,所述方法还包括如下步骤:
设定一预设时间;
当到达所述预设时间时,输出关于所述事件的热度预测结果。
设定一预设人数值;
当所述事件的影响人数达到所述预设人数时,输出关于所述事件的热度预测结果。
进一步地,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质存储有预测事件流行度系统,所述预测事件流行度系统可被至少一个处理器执行,以使所述至少一个处理器执行如上述的预测事件流行度方法的步骤。
相较于现有技术,本发明所提出的预测事件流行度方法、服务器及计算机可读存储介质,首先,将社交网站的用户关系结构抽象成节点图;接着,获取所述社交网站某个时刻事件,并在所述节点图上对所述事件可能传播的序列进行采样;进一步地,建立基于门控循环单元的双循环神经网络模型;最后,将所述采样的序列输入至所述基于门控循环单元的双循环神经网络模型,通过所述基于门控循环单元的双循环神经网络模型输出预测得到所述事件的影响度,从而预测事件未来的流行度,为决策者提供科学的信息支持。
附图说明
图1是本发明服务器一可选的硬件架构的示意图;
图2是本发明预测事件流行度系统第一实施例的程序模块示意图;
图3是本发明预测事件流行度系统的节点示意图;
图4是本发明预测事件流行度系统的模型示意图;
图5是本发明预测事件流行度系统第二实施例的程序模块示意图;
图6是本发明预测事件流行度系统第三实施例的程序模块示意图;
图7是本发明预测事件流行度方法第一实施例的流程示意图;
图8是本发明预测事件流行度方法第二实施例的流程示意图;
图9是本发明预测事件流行度方法第三实施例的流程示意图。
附图标记:
服务器 2
存储器 11
处理器 12
网络接口 13
预测事件流行度系统 200
抽象模块 201
采样模块 202
构建模块 203
输入模块 204
预测模块 205
映射模块 206
设定模块 207
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,在本发明中涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。
参阅图1所示,是本发明服务器2一可选的硬件架构的示意图。
本实施例中,所述服务器2可包括,但不仅限于,可通过系统总线相互通信连接存储器11、处理器12、网络接口13。需要指出的是,图1仅示出了具有组件11-13的服务器2,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。
其中,所述服务器2可以是机架式服务器、刀片式服务器、塔式服务器或机柜式服务器等计算设备,该服务器2可以是独立的服务器,也可以是多个服务器所组成的服务器集群。
所述存储器11至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,所述存储器11可以是所述服务器2的内部存储单元,例如该服务器2的硬盘或内存。在另一些实施例中,所述存储器11也可以是所述服务器2的外部存储设备,例如该服务器2上配备的插接式硬盘,智能存储卡(SmartMedia Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。当然,所述存储器11还可以既包括所述服务器2的内部存储单元也包括其外部存储设备。本实施例中,所述存储器11通常用于存储安装于所述服务器2的操作系统和各类应用软件,例如预测事件流行度系统200的程序代码等。此外所述存储器11还可以用于暂时地存储已经输出或者将要输出的各类数据。
所述处理器12在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器12通常用于控制所述服务器2的总体操作。本实施例中,所述处理器12用于运行所述存储器11中存储的程序代码或者处理数据,例如运行所述的预测事件流行度系统200等。
所述网络接口13可包括无线网络接口或有线网络接口,该网络接口13通常用于在所述服务器2与其他电子设备之间建立通信连接。
至此,己经详细介绍了本发明相关设备的硬件结构和功能。下面,将基于上述介绍提出本发明的各个实施例。
首先,本发明提出一种预测事件流行度系统200。
参阅图2所示,是本发明预测事件流行度系统200第一实施例的程序模块图。
本实施例中,所述预测事件流行度系统200包括一系列的存储于存储器11上的计算机程序指令,当该计算机程序指令被处理器12执行时,可以实现本发明各实施例的预测事件流行度操作。在一些实施例中,基于该计算机程序指令各部分所实现的特定的操作,预测事件流行度系统200可以被划分为一个或多个模块。例如,在图2中,所述预测事件流行度系统200可以被分割成抽象模块201、采样模块202、构建模块203、输入模块204及预测模块205。其中:
所述抽象模块201,用于将社交网站的用户关系结构抽象成节点图;
具体地,所述服务器2通过所述抽象模块201将社交网络结构,例如微博,的用户关系结构抽象为节点图G=(V,E),图的节点V代表用户,边E代表用户之间的联系。
请一并参阅附图3,附图3是本发明预测事件流行度系统200第一实施例的节点示意图。如图3所示,ABCDEF分别表示不同的用户,箭头用户之间的关系,比如,A关注B和D,B关注E和C,C关注D和F,D关注F,如此,将不同用户之间的关系清楚的罗列。
所述采样模块202,用于获取某个时刻的事件,在所述节点图上对所述时间可能传播的序列进行采样。
在本实施例中,采用随机游走对事件可能传播的序列进行采样。在随机游走的过程中,正在访问的节点为v,接下来转移到v的邻居节点N(v)的概率为:
Figure BDA0001471524560000081
其中,α为平滑因子,sc为评价函数,可定义为u的出度或者边uv的权重。
根据马尔科夫性质,使用以上概率,可以采样出不同的节点转移序列。采样在序列长度到达预设值T时终止。
参照图3所示从箭头的开始到箭头的截止为一个序列例如
Figure BDA0001471524560000082
为一个序列。
所述构建模块203,用于建立基于门控循环单元的双循环神经网络模型。
所述输入模块204,用于将所述采样的序列输入至所述基于门控循环单元的双循环神经网络模型。
具体地,所述输入模块204根据所述采样模块202采样到的序列,作为基于门控循环单元的双循环神经网络模型的输入。若所述采样模块204从节点图采样到K个序列,每个序列的长度为T,其中T为变量,即每个序列的长度可能不一样,则所述输入模块204将K个长度为T的序列作为基于门控循环单元的双循环神经网络模型的输入。
所述预测模块205,用于通过所述基于门控循环单元的双循环神经网络模型根据所述输入序列,输出预测结果。
在本实施方式中,所述预测结果为序列向量。所述预测模块204将所述采样的序列输入至所述基于门控循环单元的双循环神经网络模型,并设定预测目标或预测条件,如当需要预测任意时刻,如时刻t0的事件影响到人数,即预测时刻t1的事件影响到的节点集合Vt1。当需要预测事件最终的影响到的人数,即要预测的目标是在事件开始蔓延的时间t0后的时间t内,事件所影响到的节点集合Vt。其中,时间t表示事件不再有变化(事件传播波动小于一预设值即可认为事件不再有变化)的时间段。
具体地,所述服务器2还将所述基于门控循环单元的双循环神经网络模型的输出转换成转化成向量图的表示,所述向量图可以用以下向量表示:
Figure BDA0001471524560000091
其中,gc是被事件影响的子图,k为序列序号,i为节点序号,B为mini-batch的分块数,
Figure BDA0001471524560000092
是序列的编码,ac和λi可以在深度学习的过程中学习得到。最后使用全连接层输出最终预测结果。其中,使用全连接层输出的最终预测结果表示为:
f(gc)=MLP(h(gc))
其中,MLP代表多层感知机(Multilayer Perceptron),是一种前向结构的人工神经网络,映射一组输入向量到一组输出向量。MLP可以被看作是一个有向图,由多个的节点层所组成,每一层都全连接到下一层。除了输入节点,每个节点都是一个带有非线性激活函数的神经元(或称处理单元)。
请一并参阅附图4,附图,4为本发明预测事件流行度系统200的模型示意图。如图4所示,首先将社交网络结构抽象成节点图;进而采样出不同的节点转移序列,如图为K个长度为T的序列;接着将序列转换成向量作为已经建立好的基于门控循环单元的双循环神经网络模型的输入;进一步地,将所述基于门控循环单元的双循环神经网络模型输出的序列向量转换成图;然后,通过使用注意力(attention)机制将图的序列向量转化成向量图;最后通过全连接层输出最终预测结果。
通过上述程序模块201-205,本发明所提出的预测事件流行度系统200,首先,将社交网站的用户关系结构抽象成节点图;接着,获取所述社交网站某个时刻事件,并在所述节点图上对所述事件可能传播的序列进行采样;进一步地,建立基于门控循环单元的双循环神经网络模型;最后,将所述采样的序列输入至所述基于门控循环单元的双循环神经网络模型,通过所述基于门控循环单元的双循环神经网络模型输出预测得到所述事件的影响度,从而预测事件未来的流行度,为决策者提供科学的信息支持。
参阅图5所示,是本发明预测事件流行度系统200第二实施例的程序模块图。本实施例中,所述的预测事件流行度系统200除了包括第一实施例中的所述的抽象模块201、采样模块202、构建模块203、输入模块204及预测模块204之外,还包括映射模块206。
所述映射模块206,用于将所述节点图的每个节点映射成向量。
具体地,所述服务器2通过所述映射模块205将所述序列的每个节点映射成向量。假设所述采样模块202采样了K个长度为T的序列,则所述映射模块205将所述K个长度为T的序列中的每个节点映射成向量。在本实施例中,所述映射模块205使用Node2Vec将所述序列的每个节点映射成向量。
所述映射模块206,还用于将每个节点传播的关于所述事件的文本内容映射成向量。
具体地,在本实施例中,所述映射模块206使用使用Word2Vec将所述每个节点传播的文本内容映射成向量。
所述输入模块204,还用于将所述每个节点映射成的向量以及所述每个节点传播的文本内容映射成的向量连接成序列向量作为双向循环神经网络模型的输入。
具体地,所述每个节点映射成的向量以及所述每个节点传播的文本内容映射成的向量连接成序列向量,如此,节点与节点传播的文本内容相互关联映射,使得对于事件流行度的预测跟准确。
通过上述程序模块206,本发明所提出的预测事件流行度系统200,还能够将所述节点图的每个节点映射成向量,并将将每个节点传播的关于所述事件的文本内容映射成向量,然后将所述每个节点映射成的向量以及所述每个节点传播的文本内容映射成的向量连接成序列向量作为双向循环神经网络模型的输入,实现将节点与事件的文本内容相关联后作为双向循环神经网络模型的输入,使得预测更准确。
参阅图6所示,是本发明预测事件流行度系统200第三实施例的程序模块图。本实施例中,所述的预测事件流行度系统200在第二实施例的基础上,还包括设定模块207。
所述设定模块207,用于设定一预设时间。
所述预测模块205,还用于当到达所述预设时间时,输出关于所述事件的热度预测结果。
具体地,所述服务器2可以通过设定模块207设定一预设时间,以实现预测当事件发生后,在一定时间内,该事件的流行度(影响度)。如所述设定模块207设定一时间区间t0-t,t0表示事件发生的时间,t表示设定的时间区间的截止时间。当到达时间t后,输出最终预测结果,实现预测经过任意时间t的事件影响人数。
所述设定模块207,还用于设定一预设人数值。
所述预测模块205,还用于当所述事件的影响人数达到所述预设人数时,输出关于所述事件的热度预测结果。
具体地,所述服务器2还可以通过所述设定模块207设定一预设人数值,以实现预测当事件发生后,在多长时间内,该受到事件的影响人数或是关注该事件的人数达到预设人数值。当收到影响的人数达到预设人数值之后,输出最终预测结果,实现了预测达到任意人数值,需要经过多长时间。
通过上述程序模块206,本发明所提出的预测事件流行度系统200,还能够设定一预设时间,并在到达所述预设时间时,输出关于所述事件的热度预测结果;同时还可设定一预设人数值,当所述事件的影响人数达到所述预设人数时,输出关于所述事件的热度预测结果,实现多方面预测事件流行度。
此外,本发明还提出一种预测事件流行度方法。
参阅图7所示,是本发明预测事件流行度方法第一实施例的流程示意图。在本实施例中,根据不同的需求,图7所示的流程图中的步骤的执行顺序可以改变,某些步骤可以省略。
步骤S301,将社交网站的用户关系结构抽象成节点图;
具体地,所述服务器2将社交网络结构,例如微博,的用户关系结构抽象为节点图G=(V,E),图的节点V代表用户,边E代表用户之间的联系。
请一并参阅附图3,附图3是本发明预测事件流行度系统200第一实施例的节点示意图。如图3所示,ABCDEF分别表示不同的用户,箭头用户之间的关系,比如,A关注B和D,B关注E和C,C关注D和F,D关注F,如此,将不同用户之间的关系清楚的罗列。
步骤S302,获取某个时刻的事件,在所述节点图上对所述时间可能传播的序列进行采样。
在本实施例中,采用随机游走对事件可能传播的序列进行采样。在随机游走的过程中,正在访问的节点为v,接下来转移到v的邻居节点N(v)的概率为:
Figure BDA0001471524560000121
其中,α为平滑因子,sc为评价函数,可定义为u的出度或者边uv的权重。
根据马尔科夫性质,使用以上概率,可以采样出不同的节点转移序列。采样在序列长度到达预设值T时终止。
参照图3所示,从箭头的开始到箭头的截止为一个序列,例如,
Figure BDA0001471524560000131
为一个序列。
步骤S303,建立基于门控循环单元的双循环神经网络模型;
步骤S504,将所述采样的序列输入至所述基于门控循环单元的双循环神经网络模型。
具体地,所述服务器2将采样到的序列,作为基于门控循环单元的双循环神经网络模型的输入。若所述服务器2从节点图采样到K个序列,每个序列的长度为T,其中T为变量,即每个序列的长度可能不一样,则所述服务器2将K个长度为T的序列作为基于门控循环单元的双循环神经网络模型的输入。
步骤S305,通过所述基于门控循环单元的双循环神经网络模型根据所述输入序列,输出预测结果。
在本实施方式中,所述预测结果为序列向量。所述服务器2将所述采样的序列输入至所述基于门控循环单元的双循环神经网络模型,并设定预测目标或预测条件,如当需要预测任意时刻,如时刻t0的事件影响到人数,即预测时刻t1的事件影响到的节点集合Vt1。当需要预测事件最终的影响到的人数,即要预测的目标是在事件开始蔓延的时间t0后的时间t内,事件所影响到的节点集合Vt。其中,时间t表示事件不再有变化(事件传播波动小于一预设值即可认为事件不再有变化)的时间段。
具体地,所述服务器2还将所述基于门控循环单元的双循环神经网络模型的输出转换成转化成向量图的表示,所述向量图可以用以下向量表示:
Figure BDA0001471524560000132
其中,gc是被事件影响的子图,k为序列序号,i为节点序号,B为mini-batch的分块数,
Figure BDA0001471524560000133
是序列的编码,ac和λi可以在深度学习的过程中学习得到。最后使用全连接层输出最终预测结果。其中,使用全连接层输出的最终预测结果表示为:
f(gc)=MLP(h(gc))
其中,MLP代表多层感知机(Multilayer Perceptron),是一种前向结构的人工神经网络,映射一组输入向量到一组输出向量。MLP可以被看作是一个有向图,由多个的节点层所组成,每一层都全连接到下一层。除了输入节点,每个节点都是一个带有非线性激活函数的神经元(或称处理单元)。
请一并参阅附图4,附图,4为本发明预测事件流行度系统200的模型示意图。如图4所示,首先将社交网络结构抽象成节点图;进而采样出不同的节点转移序列,如图为K个长度为T的序列;接着将序列转换成向量作为已经建立好的基于门控循环单元的双循环神经网络模型的输入;进一步地,将所述基于门控循环单元的双循环神经网络模型输出的序列向量转换成图;然后,通过使用注意力(attention)机制将图的序列向量转化成向量图;最后通过全连接层输出最终预测结果。
通过上述步骤S301-S305,本发明所提出的预测事件流行度方法,首先,将社交网站的用户关系结构抽象成节点图;接着,获取所述社交网站某个时刻事件,并在所述节点图上对所述事件可能传播的序列进行采样;进一步地,建立基于门控循环单元的双循环神经网络模型;最后,将所述采样的序列输入至所述基于门控循环单元的双循环神经网络模型,通过所述基于门控循环单元的双循环神经网络模型输出预测得到所述事件的影响度,从而预测事件未来的流行度,为决策者提供科学的信息支持。
如图8所示,是本发明预测事件流行度方法的第二实施例的流程示意图。本实施例中,第一实施例中的,所述将所述采样的序列输入至所述基于门控循环单元的双循环神经网络模型的步骤,具体包括如下步骤:
步骤S401,将所述节点图的每个节点映射成向量。
具体地,所述服务器2将所述序列的每个节点映射成向量。假设采样了K个长度为T的序列,则所述服务器2将所述K个长度为T的序列中的每个节点映射成向量。在本实施例中,所述服务器2使用Node2Vec将所述序列的每个节点映射成向量。
步骤S402,将每个节点传播的关于所述事件的文本内容映射成向量。
具体地,在本实施例中,所述服务器2使用使用Word2Vec将所述每个节点传播的文本内容映射成向量。
步骤S403,将所述每个节点映射成的向量以及所述每个节点传播的文本内容映射成的向量连接成序列向量作为双向循环神经网络模型的输入。
具体地,所述每个节点映射成的向量以及所述每个节点传播的文本内容映射成的向量连接成序列向量,如此,节点与节点传播的文本内容相互关联映射,使得对于事件流行度的预测跟准确。
通过上述步骤S401-S403,本发明所提出的预测事件流行度方法,还能够将所述节点图的每个节点映射成向量,并将将每个节点传播的关于所述事件的文本内容映射成向量,然后将所述每个节点映射成的向量以及所述每个节点传播的文本内容映射成的向量连接成序列向量作为双向循环神经网络模型的输入,实现将节点与事件的文本内容相关联后作为双向循环神经网络模型的输入,使得预测更准确。
如图9所示,是本发明预测事件流行度方法的第三实施例的流程示意图。本实施例中,本发明预测事件流行度方法还包括如下步骤:
步骤S501,设定一预设时间。
步骤S502,当到达所述预设时间时,输出关于所述事件的热度预测结果。
具体地,所述服务器2可以设定一预设时间,以实现预测当事件发生后,在一定时间内,该事件的流行度(影响度)。如所述设定模块207设定一时间区间t0-t,t0表示事件发生的时间,t表示设定的时间区间的截止时间。当到达时间t后,输出最终预测结果,实现预测经过任意时间t的事件影响人数。
步骤S503,设定一预设人数值。
步骤S504,当所述事件的影响人数达到所述预设人数时,输出关于所述事件的热度预测结果。
具体地,所述服务器2还可以设定一预设人数值,以实现预测当事件发生后,在多长时间内,该受到事件的影响人数或是关注该事件的人数达到预设人数值。当收到影响的人数达到预设人数值之后,输出最终预测结果,实现了预测达到任意人数值,需要经过多长时间。
通过上述步骤S501-S504,本发明所提出的预测事件流行度方法,还能够设定一预设时间,并在到达所述预设时间时,输出关于所述事件的热度预测结果;同时还可设定一预设人数值,当所述事件的影响人数达到所述预设人数时,输出关于所述事件的热度预测结果,实现多方面预测事件流行度。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (8)

1.一种预测事件流行度方法,应用于服务器,其特征在于,所述方法包括步骤:
将社交网站的用户关系结构抽象成节点图;
获取所述社交网站某个时刻事件,并在所述节点图上对所述事件可能传播的序列进行采样;
建立基于门控循环单元的双循环神经网络模型;
将所述采样的序列输入至所述基于门控循环单元的双循环神经网络模型;
将所述基于门控循环单元的双循环神经网络模型的输出转换成向量图,使用全连接层输出预测结果得到所述事件的影响度,所述向量图用以下向量表示:
Figure FDA0003648691990000011
其中,gc是被事件影响的子图,k为序列序号,i为节点序号,B为mini-batch的分块数,
Figure FDA0003648691990000012
是序列的编码,ac和λi是在深度学习的过程中学习得到的;
设定一预设时间;
当到达所述预设时间时,输出关于所述事件的热度预测结果,表征经过任意时间的事件影响人数;
设定一预设人数值;
当所述事件的影响人数达到所述预设人数时,输出关于所述事件的热度预测结果,表征达到任意人数值,需要经过多长时间。
2.如权利要求1所述的预测事件流行度方法,其特征在于,所述将所述采样的序列输入至所述基于门控循环单元的双循环神经网络模型的步骤,具体包括如下步骤:
将所述节点图的每个节点映射成向量;
将每个节点传播的关于所述事件的文本内容映射成向量;
将所述每个节点映射成的向量以及所述每个节点传播的文本内容映射成的向量连接成序列向量作为双向循环神经网络模型的输入。
3.如权利要求2所述的预测事件流行度方法,其特征在于,所述通过所述基于门控循环单元的双循环神经网络模型输出预测得到所述事件的影响度的步骤,具体包括:
使用注意力(attention)机制将图的序列向量转化成向量图的表示;
使用全连接层输出最终预测结果。
4.如权利要求1所述的预测事件流行度方法,其特征在于,在所述节点图上对所述事件可能传播的序列进行采样的步骤,具体包括如下步骤:
采用随机游走对所述事件可能传播的序列进行采样;
计算在随机游走中正在访问的节点转移到邻居节点的概率;
根据马尔科夫性质及所述概率,采样出不同的节点转移序列。
5.一种服务器,其特征在于,所述服务器包括存储器、处理器,所述存储器上存储有可在所述处理器上运行的预测事件流行度系统,所述预测事件流行度系统被所述处理器执行时实现如下步骤:
将社交网站的用户关系结构抽象成节点图;
获取所述社交网站某个时刻事件,并在所述节点图上对所述事件可能传播的序列进行采样;
建立基于门控循环单元的双循环神经网络模型;
将所述采样的序列输入至所述基于门控循环单元的双循环神经网络模型;
将所述基于门控循环单元的双循环神经网络模型的输出转换成向量图,使用全连接层输出预测结果得到所述事件的影响度,所述向量图用以下向量表示:
Figure FDA0003648691990000031
其中,gc是被事件影响的子图,k为序列序号,i为节点序号,B为mini-batch的分块数,
Figure FDA0003648691990000032
是序列的编码,ac和λi是在深度学习的过程中学习得到的;
设定一预设时间;
当到达所述预设时间时,输出关于所述事件的热度预测结果,表征经过任意时间的事件影响人数;
设定一预设人数值;
当所述事件的影响人数达到所述预设人数时,输出关于所述事件的热度预测结果,表征达到任意人数值,需要经过多长时间。
6.如权利要求5所述的服务器,其特征在于,将所述采样的序列输入至所述基于门控循环单元的双循环神经网络模型的步骤,具体包括如下步骤:
将所述节点图的每个节点映射成向量;
将每个节点传播的关于所述事件的文本内容映射成向量;
将所述每个节点映射成的向量以及所述每个节点传播的文本内容映射成的向量连接成序列向量作为双向循环神经网络模型的输入。
7.如权利要求6所述的服务器,其特征在于,在所述节点图上对所述事件可能传播的序列进行采样的步骤,具体包括如下步骤:
采用随机游走对所述事件可能传播的序列进行采样;
计算在随机游走中正在访问的节点转移到邻居节点的概率;
根据马尔科夫性质及所述概率,采样出不同的节点转移序列;
所述通过所述基于门控循环单元的双循环神经网络模型输出预测得到所述事件的影响度的步骤,具体包括:
使用注意力(attention)机制将图的序列向量转化成向量图的表示;
使用全连接层输出最终预测结果。
8.一种计算机可读存储介质,所述计算机可读存储介质存储有预测事件流行度系统,所述预测事件流行度系统可被至少一个处理器执行,以使所述至少一个处理器执行如权利要求1-4中任一项所述的预测事件流行度方法的步骤。
CN201711141758.7A 2017-11-17 2017-11-17 预测事件流行度方法、服务器及计算机可读存储介质 Active CN107944610B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201711141758.7A CN107944610B (zh) 2017-11-17 2017-11-17 预测事件流行度方法、服务器及计算机可读存储介质
PCT/CN2018/076135 WO2019095570A1 (zh) 2017-11-17 2018-02-10 预测事件流行度方法、服务器及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711141758.7A CN107944610B (zh) 2017-11-17 2017-11-17 预测事件流行度方法、服务器及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN107944610A CN107944610A (zh) 2018-04-20
CN107944610B true CN107944610B (zh) 2022-08-02

Family

ID=61931584

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711141758.7A Active CN107944610B (zh) 2017-11-17 2017-11-17 预测事件流行度方法、服务器及计算机可读存储介质

Country Status (2)

Country Link
CN (1) CN107944610B (zh)
WO (1) WO2019095570A1 (zh)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108900446B (zh) * 2018-05-28 2021-03-30 南京信息工程大学 基于门控循环单元神经网络的坐标变换常模盲均衡方法
CN108923983B (zh) * 2018-07-13 2021-01-12 南昌航空大学 机会网络链路的预测方法、装置及可读存储介质
CN110032682B (zh) * 2019-04-17 2023-08-11 腾讯科技(上海)有限公司 一种信息推荐列表生成方法、装置及设备
CN111401648B (zh) * 2020-03-20 2021-01-19 李惠芳 一种互联网热点互相影响情况下的事件预测方法
CN112150207A (zh) * 2020-09-30 2020-12-29 武汉大学 基于时空上下文注意力网络的网约车订单需求预测方法
CN112396091B (zh) * 2020-10-23 2024-02-09 西安电子科技大学 社交媒体图像流行度预测方法、系统、存储介质及应用
CN112580879B (zh) * 2020-12-23 2023-10-10 河南广播电视台 一种基于图神经网络的信息流行度预测方法
CN112580878B (zh) * 2020-12-23 2023-10-10 河南广播电视台 一种基于图神经网络的信息流行度预测方法
CN113076335B (zh) * 2021-04-02 2024-05-24 西安交通大学 一种网络模因检测方法、系统、设备及存储介质
CN113205426A (zh) * 2021-05-27 2021-08-03 中库(北京)数据系统有限公司 一种预测社交媒体内容的热度等级的方法和装置
CN113283589B (zh) * 2021-06-07 2022-07-19 支付宝(杭州)信息技术有限公司 事件预测系统的更新方法及装置
CN113505924B (zh) * 2021-07-09 2023-08-01 福州大学 一种基于级联时空特征的信息传播预测方法及系统
CN115660147A (zh) * 2022-09-26 2023-01-31 哈尔滨工业大学 一种基于传播路径间与传播路径内影响力建模的信息传播预测方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106339463A (zh) * 2016-08-26 2017-01-18 中国传媒大学 基于Logistic模型的网络舆情预警系统及其预警方法
CN106599273A (zh) * 2016-12-23 2017-04-26 贾志娟 一种基于社交网络分析的微博诈骗团体挖掘方法
CN106681989A (zh) * 2015-11-09 2017-05-17 郑州大学 一种预测微博转发概率的方法
CN107145977A (zh) * 2017-04-28 2017-09-08 电子科技大学 一种对在线社交网络用户进行结构化属性推断的方法

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9652525B2 (en) * 2012-10-02 2017-05-16 Banjo, Inc. Dynamic event detection system and method
CN103617279A (zh) * 2013-12-09 2014-03-05 南京邮电大学 基于Pagerank方法的微博信息传播影响力评估模型的实现方法
US9397904B2 (en) * 2013-12-30 2016-07-19 International Business Machines Corporation System for identifying, monitoring and ranking incidents from social media
US20150271557A1 (en) * 2014-03-24 2015-09-24 Joseph Akwo Tabe Multimedia television system for interactive social media and social network
CN104182457B (zh) * 2014-07-14 2017-08-01 上海交通大学 在社交网络中基于泊松过程模型的事件流行度预测方法
US9817893B2 (en) * 2015-02-18 2017-11-14 Adobe Systems Incorporated Tracking changes in user-generated textual content on social media computing platforms
CN105975504A (zh) * 2016-04-28 2016-09-28 中国科学院计算技术研究所 一种基于循环神经网络的社交网络消息爆发检测方法及系统
CN105913159A (zh) * 2016-04-29 2016-08-31 北京邮电大学 基于社交网络事件的用户影响力预测方法
CN106651030B (zh) * 2016-12-21 2020-08-04 重庆邮电大学 一种改进的rbf神经网络热点话题用户参与行为预测方法
CN106897388A (zh) * 2017-01-24 2017-06-27 北京航空航天大学 预测微博事件热度的方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106681989A (zh) * 2015-11-09 2017-05-17 郑州大学 一种预测微博转发概率的方法
CN106339463A (zh) * 2016-08-26 2017-01-18 中国传媒大学 基于Logistic模型的网络舆情预警系统及其预警方法
CN106599273A (zh) * 2016-12-23 2017-04-26 贾志娟 一种基于社交网络分析的微博诈骗团体挖掘方法
CN107145977A (zh) * 2017-04-28 2017-09-08 电子科技大学 一种对在线社交网络用户进行结构化属性推断的方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
信息过滤技术在网站信息监管中的应用与研究;宁墨;《中国优秀博硕士学位论文全文数据库(硕士)信息科技辑》;20160615(第6期);全文 *
基于微博数据的电影票房预测研究;王伟;《中国优秀博硕士学位论文全文数据库(硕士)信息科技辑》;20160615(第6期);全文 *

Also Published As

Publication number Publication date
CN107944610A (zh) 2018-04-20
WO2019095570A1 (zh) 2019-05-23

Similar Documents

Publication Publication Date Title
CN107944610B (zh) 预测事件流行度方法、服务器及计算机可读存储介质
WO2019114344A1 (zh) 一种基于图结构模型的异常账号防控方法、装置以及设备
WO2020224106A1 (zh) 基于神经网络的文本分类方法、系统及计算机设备
US8069167B2 (en) Calculating web page importance
CN112488183B (zh) 一种模型优化方法、装置、计算机设备及存储介质
CN111831675A (zh) 一种仓储模型训练方法、装置、计算机设备及存储介质
CN114330699A (zh) 神经网络结构搜索方法及装置
CN112256886B (zh) 图谱中的概率计算方法、装置、计算机设备及存储介质
CN113643532B (zh) 一种区域交通的预测方法以及设备
CN116684330A (zh) 基于人工智能的流量预测方法、装置、设备及存储介质
CN115905687A (zh) 基于元学习图神经网络面向冷启动的推荐系统及方法
CN113988225B (zh) 建立表征提取模型、表征提取、类型识别的方法和装置
CN113886721B (zh) 个性化兴趣点推荐方法、装置、计算机设备及存储介质
CN114971078A (zh) 基于约束性多目标粒子群优化的路径规划方法及相关设备
CN115700548A (zh) 用户行为预测的方法、设备和计算机程序产品
CN117034031A (zh) 基于沟通场景的语句生成方法及装置
CN111144473A (zh) 训练集构建方法、装置、电子设备及计算机可读存储介质
CN113610228B (zh) 神经网络模型的构建方法及装置
CN115099875A (zh) 基于决策树模型的数据分类方法及相关设备
CN111582456B (zh) 用于生成网络模型信息的方法、装置、设备和介质
CN117010480A (zh) 模型训练方法、装置、设备、存储介质及程序产品
CN111667028B (zh) 一种可靠负样本确定方法和相关装置
CN110400409B (zh) 基于bls签名算法的门限投票方法、系统及相关设备
CN112764923A (zh) 计算资源分配方法、装置、计算机设备及存储介质
CN112418441A (zh) 基于迁移学习的数据处理方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant