CN105975504A - 一种基于循环神经网络的社交网络消息爆发检测方法及系统 - Google Patents
一种基于循环神经网络的社交网络消息爆发检测方法及系统 Download PDFInfo
- Publication number
- CN105975504A CN105975504A CN201610273082.6A CN201610273082A CN105975504A CN 105975504 A CN105975504 A CN 105975504A CN 201610273082 A CN201610273082 A CN 201610273082A CN 105975504 A CN105975504 A CN 105975504A
- Authority
- CN
- China
- Prior art keywords
- message
- history
- neural network
- recurrent neural
- recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 43
- 230000000306 recurrent effect Effects 0.000 title claims abstract description 37
- 238000001514 detection method Methods 0.000 title claims abstract description 23
- 238000012549 training Methods 0.000 claims abstract description 16
- 238000000605 extraction Methods 0.000 claims description 6
- 238000001914 filtration Methods 0.000 claims description 5
- 238000000034 method Methods 0.000 abstract description 25
- 230000014509 gene expression Effects 0.000 abstract 2
- 238000007781 pre-processing Methods 0.000 abstract 1
- 238000011176 pooling Methods 0.000 description 14
- 239000013598 vector Substances 0.000 description 12
- 230000008569 process Effects 0.000 description 11
- 230000006870 function Effects 0.000 description 6
- 230000000694 effects Effects 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 230000007935 neutral effect Effects 0.000 description 4
- 230000004913 activation Effects 0.000 description 3
- 238000006116 polymerization reaction Methods 0.000 description 3
- 230000003134 recirculating effect Effects 0.000 description 3
- 241000208340 Araliaceae Species 0.000 description 2
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 2
- 235000003140 Panax quinquefolius Nutrition 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 2
- 230000032683 aging Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 235000008434 ginseng Nutrition 0.000 description 2
- 230000001537 neural effect Effects 0.000 description 2
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000002547 anomalous effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000009792 diffusion process Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000005180 public health Effects 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Databases & Information Systems (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Business, Economics & Management (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提出一种基于循环神经网络(Recurrent Neural Network,RNN)的社交网络消息爆发检测方法及系统,涉及在线社交网络中内容的流行度预测技术领域,该方法包括获取社交网络中用户发布与转发的历史消息,对所述历史消息进行预处理,获取历史转发时间序列;对所述历史消息与所述历史转发时间序列进行循环神经网络训练,并生成预测模型;实时采集用户发布与转发的消息,根据所述消息,生成转发时间序列,将所述转发时间序列输入到所述预测模型,生成特征表达,将所述特征表达输入到全连接神经网络进行分类,结果以softmax方式输出,以完成社交网络消息爆发检测。
Description
技术领域
本发明涉及在线社交网络中内容的流行度预测技术领域,特别涉及一种基于循环神经网络的社交网络消息爆发检测方法及系统。
背景技术
以微博为代表的在线社交媒体,每天会产生数以亿计的消息和内容,社交网络中用户高度互联的结构和用户的从众效应使得消息的扩散变得十分的便捷和高效,极大地便利了人们获取信息的方式,加强了人与人之间的联系,然而,网络中的信息良莠不齐,只有极少部分的消息最终会流行和爆发,引起公众广泛地关注并伴随着巨大的社会舆论和影响,在消息或内容爆发的早期进行有效识别,对于公司来讲,是在线信誉监控(Online Reputation Monitoring)的重要手段,如果是负面的消息,则应该及时采取相应的措施,降低公司信誉损失,正面的消息则可借机营销,提升公司业绩;对于政府部门来讲,尽早地发现关于自然灾害事件、公共卫生疾病、反动谣言等消息,就能及时采取对应的措施,提前进行相应的决策和部署。
目前,预测消息的爆发和流行主要可以分为基于内容特征的分析方法和基于自激励点过程的方法,基于内容特征的方法通过捕捉消息相关的内容特征随时间的异常变化,来发现突发的话题,这种方法需要消息的传播积累到一定程度,达到了显著的水平,客观上造成了爆发消息被检出的时间已经接近或滞后于消息爆发实际发生的时间,时效性不高;基于自激励点过程的方法,以消息个体为对象,将其转发时间序列建模成自激励的点过程,旨在刻画消息传播中的“富者愈富”、“时间衰减”等序列特征,与基于内容特征的方法相比,该方法时效性高,但是,基于自激励点过程的方法,仍存在以下缺点:第一,其特征是人为定义的,对数据的依赖很强,如对于“富者愈富”现象的建模,有的采用线性函数,有的采用非线性函数,对于“时间衰减”效应,有的采用log-normal分布,有的采用power law分布;第二,该模型在预测的时候只利用了待预测消息的观测序列,没有用到其它消息的历史传播信息,导致预测的准确性不高。综上,目前还缺乏一种预测及时,人为干预少且预测效果好的方法。
发明专利“一种微博突发事件检测方法”,包括步骤:降维处理:基于LSH算法对微博数据流中的词汇进行映射处理;创建B-Sketch模型:创建微博数据流中的B-Sketch数据;推测突发事件:根据B-Sketch数据计算微博数据流中的事件加速率a和事件中词的分布向量p,根据事件加速率a判断事件是否为突发事件。由于通过LSH算法将所有词汇映射到低维空间,降低了计算的复杂度,并基于B-Sketch模型推测隐含的突发事件,使得能够快速有效的实时处理微博数据流,及早地检测出突发事件。该发明专利通过跟踪微博中词特征随时间的动态变化趋势发现突发事件,而本发明利用的是信息传播的转发时间序列,利用循环神经网络来进行序列特征的识别和分类,与上述发明专利有本质区别。
发明内容
针对现有技术的不足,本发明提出一种基于循环神经网络的社交网络消息爆发检测方法及系统,循环神经网络包含LSTM(Long Short-Term Memory)、GRU(Gated Recurrent Unit)等类型的网络。
本发明提出一种基于循环神经网络的社交网络消息爆发检测方法,包括:
步骤1,获取社交网络中用户发布与转发的历史消息,对所述历史消息进行预处理,获取历史转发时间序列特征;
步骤2,将所述历史消息与所述历史转发时间序列特征输入循环神经网络训练,并生成预测模型;
步骤3,实时采集用户发布与转发的消息,根据所述消息,生成转发时间序列特征,将所述转发时间序列特征输入到所述预测模型,生成特征表达,将所述特征表达输入到全连接神经网络进行分类,结果以softmax方式输出,以完成社交网络消息爆发检测。
所述步骤1中通过所述历史消息中的转发标识构建所述消息的所述历史转发时间序列特征,然后基于循环神经网络进行消息转发序列特征的抽取。
通过“//@用户名”标识或“RT@用户名”标识获取所述历史转发时间序列特征。
根据社交网络中API从社交网络中获取所述历史消息或所述消息。
所述步骤1中预处理包括对所述历史消息进行垃圾过滤,保留存在内容、存在用户转发的历史消息。
本发明还提出一种基于循环神经网络的社交网络消息爆发检测系统,包括:
获取历史转发时间序列模块,用于获取社交网络中用户发布与转发的历史消息,对所述历史消息进行预处理,获取历史转发时间序列特征;
生成预测模型模块,用于将所述历史消息与所述历史转发时间序列特征输入循环神经网络训练,并生成预测模型;
网络消息爆发检测模块,用于实时采集用户发布与转发的消息,根据所述消息,生成转发时间序列特征,将所述转发时间序列特征输入到所述预测模型,生成特征表达,将所述特征表达输入到全连接神经网络进行分类,结果以softmax方式输出,以完成社交网络消息爆发检测。
所述获取历史转发时间序列模块中通过所述历史消息中的转发标识构建所述消息的所述历史转发时间序列特征,然后基于循环神经网络进行消息转发序列特征的抽取。
通过“//@用户名”标识或“RT@用户名”标识获取所述历史转发时间序列特征。
根据社交网络中API从社交网络中获取所述历史消息或所述消息。
所述获取历史转发时间序列模块中预处理包括对所述历史消息进行垃圾过滤,保留存在内容、存在用户转发的历史消息。
由以上方案可知,本发明的优点在于:
本发明具有以下优势:(1)避免了人为定义特征的随意性和人工抽取特征的烦琐过程,是一种完全数据驱动的措施;(2)打破了特征之间的独立性假设,自动学习消息内容转发过程中的长时间序列特征,具有更强的表达能力。
附图说明
图1为整个系统的流程示意图;
图2为神经网络架构图;
图3为LSTM单元图;
图4为三种类型的pooling操作;
图5为消息的转发时间序列图。
具体实施方式
针对现有技术不足,本文提出了一种基于循环神经网络的社交网络消息爆发检测方法及系统,该方法利用循环神经网络擅长处理和预测时间序列中间隔和延迟非常长的重要特征的特点,以单个消息的初始转发时间序列作为输入,建模消息转发过程中的长时间依赖关系,自动学习如“富者愈富”、“时间衰减”等消息的转发序列特征。
具体的,本发明方法包括以下步骤,如图1所示:
步骤1:社交网络数据采集。根据社交网络的特点采集相应的内容和时间信息,对于微博和Twitter来讲,指的是用户发布和转发的历史消息以及相应的时刻;
步骤2:数据预处理。对数据进行垃圾过滤,近似重复消息的归集,利用消息中的转发标识构建消息的历史转发时间序列。对数据进行垃圾过滤,去除没有内容、没有转发数的微博,利用Simhash等方法,对微博消息中近似重复的消息进行归集,对每一条消息,利用消息中的转发标识构建消息的转发时间序列,对每条消息的爆发和非爆发属性,按照任务的需求进行标注,如在一周之内转发次数超过1000的为爆发消息,否则为非爆发消息。
步骤3:循环神经网络训练。将预处理得到的样本分为训练集、验证集和测试集。设共有n条消息(p1,p2,…,pn),y=(y1,y2,…,yn)表示消息真实的类别,表示预测的消息类别,是循环网络需要学习的预测函数,优化的目标是最小化交叉熵函数L(θ),如式(1)所示:
其中θ为需要优化的参数,表示循环神经网络上边的权重等,Xj为函数的输入,代表第j条消息的转发时间序列,神经网络训练的目标是找到一组参数θ的取值,使得L(θ)在训练集合上最小。
神经网络的结构如图2所示,网络的参数为U,Wr,Wo,v,其中xt表示循环网络在步骤t时的输入,其值是消息第t次转发的时刻,接着,xt的值被映射成一个长度固定的向量vt,注意,每个相同的xt值对应相同的vt,然后vt输入到循环网络的隐藏层进行计算,每个时间步骤t的隐层输出为st,在计算完所有的隐层输出之后,对s0,s1,...,st做聚合操作(pooling)得到向量P,如图4所示,pooling分为3种,平均聚合(average pooling),最大聚合(maxpooling)和最后聚合(last pooling),average pooling操作对所有输入向量的每一维取平均值,max pooling操作对所有输入向量的每一维取最大值,lastpooling操作对所有输入向量取最后一个时间步骤的向量,在完成pooling操作后,利用全连接的网络进行分类,为了描述的方便,预先定义一些符号,对于网络中的每一个节点j,<i,j>表示从节点i指向j的有向边,wij为边<i,j>的权重,bi表示节点i的输出,aj表示节点j所有输入值的加权和,σ为sigmoid激活函数,U为输入向量到RNN隐层的参数矩阵,Wr为RNN隐层之间的参数矩阵,Wo表示输出层的参数矩阵。其训练分为前向计算和后向传播两个过程:
1、前向计算过程如下:
vt=indexing(xt) (2)
st=σ(Uvt+Wrst-1) (3)
P=pooling(s0,s1,…,st) (4)
其中indexing为索引操作,pooling为聚合操作,对于全连接网络中的某个节点j,设其输入为式(5)所示:
其中pi为连接节点j的输入节点的输出值,K为连接节点j的输入节点数,bj为节点j的输出,为式(6)所示:
bj=σ(aj) (6)
由于爆发检测是二分类问题,所以神经网络最外层的节点个数为1,设为节点o,对于最外层的节点,其输入为ao,输出为消息爆发的概率则:
2、训练过程如下:
对于某个训练样本,其损失函数为式(10):
其中,表示对函数的某个变量求偏导数,如表示对函数中的变量求偏导数,根据链式法则:
对于网络中的任一节点j,定义:
对于隐藏层Hj的节点j,设其连接的Hj+1层节点个数为K,则:
对于倒数第一层之前的隐藏层节点,可以通过式(15)递归的计算:
所以,对于全连接网络的权重Wo的偏导,其计算式子为:
其中表示权重矩阵Wo中的一个元素,下同。设pooling的方式采用average pooling的方式,则:
其中,st,i表示RNN网络在时间步骤t时刻输出的向量的第i维,RNN的训练采用BPTT的方式,定义:
其参数Wr,U,V的偏导计算公式为:
循环神经网络训练采用标准的BPTT(Back Propagation Through Time)后向传播算法。
以LSTM型RNN网络为例,LSTM神经网络就是在图2的基础上,将循环网络隐藏层的单元替换成图3所示的LSTM单元,具体的训练方式没有本质的区别,LSTM单元由3个控制门(gate)和一个内部存储单元(cell)组成,gate是一种让信息选择性通过的机制,全0表示不让任何信息通过,全1表示让所有信息通过,cell则起到了保持和传递信息的作用。三个控制门依次是输入门(input gate,it),遗忘门(forget gate,ft)和输出门(output gate,ot),g,h为tanh(·)激活函数,σ为sigmoid(·)激活函数,xt,ct和st分别是LSTM单元步骤t时的输入向量,内部状态向量和输出向量,zt就是标准RNN的输出。
步骤4:实时数据采集。直接利用社交网络中提供的API从社交网络中实时抓取用户发布或转发的消息。
步骤5:消息转发时间序列生成。对于某条转发的消息,根据其中的转发标志、时间信息,构建消息的转发时间序列。如微博中利用“//@用户名”标识,Twitter中利用“RT@用户名”标识等抽取出消息的转发时间序列。如图5所示,展示了抽取的某条消息的转发时间序列。
步骤6:转发序列的特征表达学习。利用步骤3中训练生成的LSTM神经网络作为预测模型,步骤5中生成的消息转发时间序列作为输入,按照式(2)(3)(4)生成消息转发序列的特征表达P。
步骤7:消息爆发预测。利用步骤6得到的消息转发序列的特征表达P,输入全连接神经网络进行分类,结果以softmax方式输出,按照式(5)的计算结果预测消息未来是否爆发。
本发明还提出一种基于循环神经网络的社交网络消息爆发检测系统,包括:
获取历史转发时间序列模块,用于获取社交网络中用户发布与转发的历史消息,对所述历史消息进行预处理,获取历史转发时间序列特征;
生成预测模型模块,用于将所述历史消息与所述历史转发时间序列特征输入循环神经网络训练,并生成预测模型;
网络消息爆发检测模块,用于实时采集用户发布与转发的消息,根据所述消息,生成转发时间序列特征,将所述转发时间序列特征输入到所述预测模型,生成特征表达,将所述特征表达输入到全连接神经网络进行分类,结果以softmax方式输出,其中softmax输出是将一组数转换为总和为1,值在0到1之间的一种输出方式,具体来说,设z是K维的向量,则其softmax输出为式(22):
其中,e为自然常数,σ(z)j为softmax第j维的输出,则取σ(z)j最大的值作为待预测消息的最终类别。作为消息爆发预测任务,K的取值为2。
所述获取历史转发时间序列模块中通过所述历史消息中的转发标识构建所述消息的所述历史转发时间序列特征,然后基于循环神经网络进行消息转发序列特征的抽取。
通过“//@用户名”标识或“RT@用户名”标识获取所述历史转发时间序列特征。
根据社交网络中API从社交网络中获取所述历史消息或所述消息。
所述获取历史转发时间序列模块中预处理包括对所述历史消息进行垃圾过滤,保留存在内容、存在用户转发的历史消息。
Claims (10)
1.一种基于循环神经网络的社交网络消息爆发检测方法,其特征在于,包括:
步骤1,获取社交网络中用户发布与转发的历史消息,对所述历史消息进行预处理,获取历史转发时间序列特征;
步骤2,将所述历史消息与所述历史转发时间序列特征输入循环神经网络训练,并生成预测模型;
步骤3,实时采集用户发布与转发的消息,根据所述消息,生成转发时间序列特征,将所述转发时间序列特征输入到所述预测模型,生成特征表达,将所述特征表达输入到全连接神经网络进行分类,结果以softmax方式输出,以完成社交网络消息爆发检测。
2.如权利要求1所述的基于循环神经网络的社交网络消息爆发检测方法,其特征在于,所述步骤1中通过所述历史消息中的转发标识构建所述消息的所述历史转发时间序列特征,然后基于循环神经网络进行消息转发序列特征的抽取。
3.如权利要求1所述的基于循环神经网络的社交网络消息爆发检测方法,其特征在于,通过“//@用户名”标识或“RT@用户名”标识获取所述历史转发时间序列特征。
4.如权利要求1所述的基于循环神经网络的社交网络消息爆发检测方法,其特征在于,根据社交网络中API从社交网络中获取所述历史消息或所述消息。
5.如权利要求1所述的基于循环神经网络的社交网络消息爆发检测方法,其特征在于,所述步骤1中预处理包括对所述历史消息进行垃圾过滤,保留存在内容、存在用户转发的历史消息。
6.一种基于循环神经网络的社交网络消息爆发检测系统,其特征在于,包括:
获取历史转发时间序列模块,用于获取社交网络中用户发布与转发的历史消息,对所述历史消息进行预处理,获取历史转发时间序列特征;
生成预测模型模块,用于将所述历史消息与所述历史转发时间序列特征输入循环神经网络训练,并生成预测模型;
网络消息爆发检测模块,用于实时采集用户发布与转发的消息,根据所述消息,生成转发时间序列特征,将所述转发时间序列特征输入到所述预测模型,生成特征表达,将所述特征表达输入到全连接神经网络进行分类,结果以softmax方式输出,以完成社交网络消息爆发检测。
7.如权利要求6所述的基于循环神经网络的社交网络消息爆发检测系统,其特征在于,所述获取历史转发时间序列模块中通过所述历史消息中的转发标识构建所述消息的所述历史转发时间序列特征,然后基于循环神经网络进行消息转发序列特征的抽取。
8.如权利要求6所述的基于循环神经网络的社交网络消息爆发检测系统,其特征在于,通过“//@用户名”标识或“RT@用户名”标识获取所述历史转发时间序列特征。
9.如权利要求6所述的基于循环神经网络的社交网络消息爆发检测系统,其特征在于,根据社交网络中API从社交网络中获取所述历史消息或所述消息。
10.如权利要求6所述的基于循环神经网络的社交网络消息爆发检测方法,其特征在于,所述获取历史转发时间序列模块中预处理包括对所述历史消息进行垃圾过滤,保留存在内容、存在用户转发的历史消息。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610273082.6A CN105975504A (zh) | 2016-04-28 | 2016-04-28 | 一种基于循环神经网络的社交网络消息爆发检测方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610273082.6A CN105975504A (zh) | 2016-04-28 | 2016-04-28 | 一种基于循环神经网络的社交网络消息爆发检测方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN105975504A true CN105975504A (zh) | 2016-09-28 |
Family
ID=56993634
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610273082.6A Pending CN105975504A (zh) | 2016-04-28 | 2016-04-28 | 一种基于循环神经网络的社交网络消息爆发检测方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105975504A (zh) |
Cited By (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106411597A (zh) * | 2016-10-14 | 2017-02-15 | 广东工业大学 | 一种网络流量异常检测方法及系统 |
CN106603293A (zh) * | 2016-12-20 | 2017-04-26 | 南京邮电大学 | 虚拟网络环境下一种基于深度学习的网络故障诊断方法 |
CN106651007A (zh) * | 2016-11-24 | 2017-05-10 | 北京理工大学 | 基于gru的光伏电站辐照度中长期预测的方法及装置 |
CN106682217A (zh) * | 2016-12-31 | 2017-05-17 | 成都数联铭品科技有限公司 | 一种基于自动信息筛选学习的企业二级行业分类方法 |
CN106779467A (zh) * | 2016-12-31 | 2017-05-31 | 成都数联铭品科技有限公司 | 基于自动信息筛选的企业行业分类系统 |
CN107544904A (zh) * | 2017-08-21 | 2018-01-05 | 哈尔滨工程大学 | 一种基于深度cg‑lstm神经网络的软件可靠性预测模型 |
CN107563122A (zh) * | 2017-09-20 | 2018-01-09 | 长沙学院 | 基于交织时间序列局部连接循环神经网络的犯罪预测方法 |
CN107872772A (zh) * | 2017-12-19 | 2018-04-03 | 北京奇虎科技有限公司 | 诈骗短信的检测方法及装置 |
CN107944610A (zh) * | 2017-11-17 | 2018-04-20 | 平安科技(深圳)有限公司 | 预测事件流行度方法、服务器及计算机可读存储介质 |
CN108563686A (zh) * | 2018-03-14 | 2018-09-21 | 中国科学院自动化研究所 | 基于混合神经网络的社交网络谣言识别方法及系统 |
CN108668265A (zh) * | 2017-12-29 | 2018-10-16 | 西安电子科技大学 | 基于循环神经网络预测移动用户间相遇概率的方法 |
CN108876058A (zh) * | 2018-07-27 | 2018-11-23 | 南京航空航天大学 | 一种基于微博的新闻事件影响力预测方法 |
CN108876044A (zh) * | 2018-06-25 | 2018-11-23 | 中国人民大学 | 一种基于知识增强神经网络的线上内容流行度预测方法 |
CN109685153A (zh) * | 2018-12-29 | 2019-04-26 | 武汉大学 | 一种基于特征聚合的社交网络谣言鉴别方法 |
CN109714322A (zh) * | 2018-12-14 | 2019-05-03 | 中国科学院声学研究所 | 一种检测网络异常流量的方法及其系统 |
CN109738939A (zh) * | 2019-03-21 | 2019-05-10 | 蔡寅 | 一种地震前兆数据异常检测方法 |
CN109756632A (zh) * | 2018-12-19 | 2019-05-14 | 国家计算机网络与信息安全管理中心 | 一种基于多维时间序列的诈骗电话分析方法 |
CN110135566A (zh) * | 2019-05-21 | 2019-08-16 | 四川长虹电器股份有限公司 | 基于lstm二分类神经网络模型的注册用户名检测方法 |
CN110166415A (zh) * | 2018-03-22 | 2019-08-23 | 西安电子科技大学 | 基于匿名网络和机器学习的信誉数据处理方法 |
CN110275953A (zh) * | 2019-06-21 | 2019-09-24 | 四川大学 | 人格分类方法及装置 |
CN110336700A (zh) * | 2019-07-10 | 2019-10-15 | 重庆大学 | 一种基于时间及用户的转发序列的微博流行度预测模型 |
CN110362612A (zh) * | 2019-07-19 | 2019-10-22 | 中国工商银行股份有限公司 | 由电子设备执行的异常数据检测方法、装置和电子设备 |
US20200034707A1 (en) * | 2018-07-27 | 2020-01-30 | drchrono inc. | Neural Network Encoders and Decoders for Physician Practice Optimization |
CN111079084A (zh) * | 2019-12-04 | 2020-04-28 | 清华大学 | 一种基于长短时记忆网络的信息转发概率预测方法及系统 |
CN111431742A (zh) * | 2018-05-31 | 2020-07-17 | 腾讯科技(深圳)有限公司 | 网络信息检测方法、装置、存储介质和计算机设备 |
CN113190733A (zh) * | 2021-04-27 | 2021-07-30 | 中国科学院计算技术研究所 | 基于多平台的网络事件流行度预测方法与系统 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102647292A (zh) * | 2012-03-20 | 2012-08-22 | 北京大学 | 一种基于半监督神经网络模型的入侵检测方法 |
-
2016
- 2016-04-28 CN CN201610273082.6A patent/CN105975504A/zh active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102647292A (zh) * | 2012-03-20 | 2012-08-22 | 北京大学 | 一种基于半监督神经网络模型的入侵检测方法 |
Non-Patent Citations (2)
Title |
---|
刘龙飞等: "基于卷积神经网络的微博情感倾向性分析", 《中文信息学报》 * |
贺敏等: "基于时间序列分析的微博突发话题检测方法", 《通信学报》 * |
Cited By (38)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106411597A (zh) * | 2016-10-14 | 2017-02-15 | 广东工业大学 | 一种网络流量异常检测方法及系统 |
CN106651007A (zh) * | 2016-11-24 | 2017-05-10 | 北京理工大学 | 基于gru的光伏电站辐照度中长期预测的方法及装置 |
CN106603293A (zh) * | 2016-12-20 | 2017-04-26 | 南京邮电大学 | 虚拟网络环境下一种基于深度学习的网络故障诊断方法 |
CN106682217A (zh) * | 2016-12-31 | 2017-05-17 | 成都数联铭品科技有限公司 | 一种基于自动信息筛选学习的企业二级行业分类方法 |
CN106779467A (zh) * | 2016-12-31 | 2017-05-31 | 成都数联铭品科技有限公司 | 基于自动信息筛选的企业行业分类系统 |
CN107544904A (zh) * | 2017-08-21 | 2018-01-05 | 哈尔滨工程大学 | 一种基于深度cg‑lstm神经网络的软件可靠性预测模型 |
CN107544904B (zh) * | 2017-08-21 | 2020-11-03 | 哈尔滨工程大学 | 一种基于深度cg-lstm神经网络的软件可靠性预测方法 |
CN107563122A (zh) * | 2017-09-20 | 2018-01-09 | 长沙学院 | 基于交织时间序列局部连接循环神经网络的犯罪预测方法 |
CN107563122B (zh) * | 2017-09-20 | 2020-05-19 | 长沙学院 | 基于交织时间序列局部连接循环神经网络的犯罪预测方法 |
CN107944610A (zh) * | 2017-11-17 | 2018-04-20 | 平安科技(深圳)有限公司 | 预测事件流行度方法、服务器及计算机可读存储介质 |
WO2019095570A1 (zh) * | 2017-11-17 | 2019-05-23 | 平安科技(深圳)有限公司 | 预测事件流行度方法、服务器及计算机可读存储介质 |
CN107872772A (zh) * | 2017-12-19 | 2018-04-03 | 北京奇虎科技有限公司 | 诈骗短信的检测方法及装置 |
CN107872772B (zh) * | 2017-12-19 | 2021-02-26 | 北京奇虎科技有限公司 | 诈骗短信的检测方法及装置 |
CN108668265A (zh) * | 2017-12-29 | 2018-10-16 | 西安电子科技大学 | 基于循环神经网络预测移动用户间相遇概率的方法 |
CN108563686A (zh) * | 2018-03-14 | 2018-09-21 | 中国科学院自动化研究所 | 基于混合神经网络的社交网络谣言识别方法及系统 |
CN108563686B (zh) * | 2018-03-14 | 2021-07-30 | 中国科学院自动化研究所 | 基于混合神经网络的社交网络谣言识别方法及系统 |
CN110166415A (zh) * | 2018-03-22 | 2019-08-23 | 西安电子科技大学 | 基于匿名网络和机器学习的信誉数据处理方法 |
CN111431742A (zh) * | 2018-05-31 | 2020-07-17 | 腾讯科技(深圳)有限公司 | 网络信息检测方法、装置、存储介质和计算机设备 |
CN111431742B (zh) * | 2018-05-31 | 2021-09-24 | 腾讯科技(深圳)有限公司 | 网络信息检测方法、装置、存储介质和计算机设备 |
CN108876044B (zh) * | 2018-06-25 | 2021-02-26 | 中国人民大学 | 一种基于知识增强神经网络的线上内容流行度预测方法 |
CN108876044A (zh) * | 2018-06-25 | 2018-11-23 | 中国人民大学 | 一种基于知识增强神经网络的线上内容流行度预测方法 |
CN108876058B (zh) * | 2018-07-27 | 2021-07-27 | 南京航空航天大学 | 一种基于微博的新闻事件影响力预测方法 |
US20200034707A1 (en) * | 2018-07-27 | 2020-01-30 | drchrono inc. | Neural Network Encoders and Decoders for Physician Practice Optimization |
CN108876058A (zh) * | 2018-07-27 | 2018-11-23 | 南京航空航天大学 | 一种基于微博的新闻事件影响力预测方法 |
CN109714322A (zh) * | 2018-12-14 | 2019-05-03 | 中国科学院声学研究所 | 一种检测网络异常流量的方法及其系统 |
CN109756632A (zh) * | 2018-12-19 | 2019-05-14 | 国家计算机网络与信息安全管理中心 | 一种基于多维时间序列的诈骗电话分析方法 |
CN109685153A (zh) * | 2018-12-29 | 2019-04-26 | 武汉大学 | 一种基于特征聚合的社交网络谣言鉴别方法 |
CN109685153B (zh) * | 2018-12-29 | 2022-07-05 | 武汉大学 | 一种基于特征聚合的社交网络谣言鉴别方法 |
CN109738939A (zh) * | 2019-03-21 | 2019-05-10 | 蔡寅 | 一种地震前兆数据异常检测方法 |
CN110135566A (zh) * | 2019-05-21 | 2019-08-16 | 四川长虹电器股份有限公司 | 基于lstm二分类神经网络模型的注册用户名检测方法 |
CN110275953A (zh) * | 2019-06-21 | 2019-09-24 | 四川大学 | 人格分类方法及装置 |
CN110336700A (zh) * | 2019-07-10 | 2019-10-15 | 重庆大学 | 一种基于时间及用户的转发序列的微博流行度预测模型 |
CN110336700B (zh) * | 2019-07-10 | 2021-09-14 | 重庆大学 | 一种基于时间及用户的转发序列的微博流行度预测方法 |
CN110362612A (zh) * | 2019-07-19 | 2019-10-22 | 中国工商银行股份有限公司 | 由电子设备执行的异常数据检测方法、装置和电子设备 |
CN111079084A (zh) * | 2019-12-04 | 2020-04-28 | 清华大学 | 一种基于长短时记忆网络的信息转发概率预测方法及系统 |
CN111079084B (zh) * | 2019-12-04 | 2021-09-10 | 清华大学 | 一种基于长短时记忆网络的信息转发概率预测方法及系统 |
CN113190733A (zh) * | 2021-04-27 | 2021-07-30 | 中国科学院计算技术研究所 | 基于多平台的网络事件流行度预测方法与系统 |
CN113190733B (zh) * | 2021-04-27 | 2023-09-12 | 中国科学院计算技术研究所 | 基于多平台的网络事件流行度预测方法与系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105975504A (zh) | 一种基于循环神经网络的社交网络消息爆发检测方法及系统 | |
CN102591854B (zh) | 针对文本特征的广告过滤系统及其过滤方法 | |
CN109523021B (zh) | 一种基于长短时记忆网络的动态网络结构预测方法 | |
CN112199608B (zh) | 基于网络信息传播图建模的社交媒体谣言检测方法 | |
CN107562784A (zh) | 基于ResLCNN模型的短文本分类方法 | |
CN107870957A (zh) | 一种基于信息增益和bp神经网络的热门微博预测方法 | |
WO2020108430A1 (zh) | 一种微博情感分析方法及系统 | |
CN108062561A (zh) | 一种基于长短时记忆网络模型的短时数据流预测方法 | |
CN112087442B (zh) | 基于注意力机制的时序相关网络入侵检测方法 | |
CN106628097A (zh) | 一种基于改进径向基神经网络的船舶设备故障诊断方法 | |
CN109685153A (zh) | 一种基于特征聚合的社交网络谣言鉴别方法 | |
CN111753207B (zh) | 一种基于评论的神经图协同过滤方法 | |
CN106682089A (zh) | 一种基于RNNs的短信自动安全审核的方法 | |
CN112329444B (zh) | 融合文本和传播结构的早期谣言检测方法 | |
CN113343126B (zh) | 基于事件与传播结构的谣言检测方法 | |
CN106339718A (zh) | 一种基于神经网络的分类方法及装置 | |
CN111428151B (zh) | 一种基于网络增速的虚假消息识别方法及其装置 | |
CN109783629A (zh) | 一种融合全局事件关系信息的微博客事件谣言检测方法 | |
CN113032917A (zh) | 一种基于生成对抗及卷积循环神经网络的机电轴承故障检测方法及应用系统 | |
CN115017887A (zh) | 基于图卷积的中文谣言检测方法 | |
CN107832729A (zh) | 一种轴承锈蚀智能诊断方法 | |
CN104518930A (zh) | 一种面向微博的异常用户和消息同时检测方法 | |
CN112395511A (zh) | 一种基于移动应用内消息传播路径的谣言检测与存证系统 | |
CN112765313A (zh) | 一种基于原文和评论信息分析算法的虚假信息检测方法 | |
CN104346336A (zh) | 一种基于机器文本对骂的情感发泄方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20160928 |
|
WD01 | Invention patent application deemed withdrawn after publication |