CN107870957A - 一种基于信息增益和bp神经网络的热门微博预测方法 - Google Patents

一种基于信息增益和bp神经网络的热门微博预测方法 Download PDF

Info

Publication number
CN107870957A
CN107870957A CN201610880756.9A CN201610880756A CN107870957A CN 107870957 A CN107870957 A CN 107870957A CN 201610880756 A CN201610880756 A CN 201610880756A CN 107870957 A CN107870957 A CN 107870957A
Authority
CN
China
Prior art keywords
microblogging
feature
popular
temperature
neural network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610880756.9A
Other languages
English (en)
Inventor
郑志蕴
江国林
张行进
王振飞
李钝
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhengzhou University
Original Assignee
Zhengzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou University filed Critical Zhengzhou University
Priority to CN201610880756.9A priority Critical patent/CN107870957A/zh
Publication of CN107870957A publication Critical patent/CN107870957A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3346Query execution using probabilistic model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/374Thesaurus
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及社交网络与舆情分析领域,公开了一种基于信息增益与BP神经网络的热门微博预测方法。该方法针对大规模的微博数据进行挖掘,首先,对微博的原始特征进行分析和处理,从中提取关键特征。其次,利用信息增益算法,由微博的传播特征推导出微博的热度计算公式。再次,建立BP神经网络模型,根据微博的内容和博主特征,预测微博的传播特征,并由此计算微博的热度。最后,在实际微博网络中进行实证统计实验,以此确定模型的重要参数,并根据微博热度预测该微博能否成为热门微博。通过该方法可以对刚发布的微博热度进行及时预测,在微博营销、危机公关、舆情引导、舆情监测等领域都能得到广泛应用。

Description

一种基于信息增益和BP神经网络的热门微博预测方法
技术领域
本发明涉及社交网络与舆情分析领域,具体地说,涉及一种基于信息增益与BP神经网络的热门微博预测方法。
背景技术
随着Web2.0的迅速发展,微博已经成为现代社会最重要的新媒体平台之一。据中国互联网络信息中心CNNIC发布的第37次《中国互联网络发展状况统计报告》显示,截至2015年12月底,我国微博用户规模达到2.31亿,网民使用率为33.5%。庞大的用户群、短小精悍的内容和丰富多样的表现形式使得微博具有强大的传播性与互动性。微博已经成为了信息发布的重要渠道、网络营销的重要手段和网络舆情的重要载体,对国家安全和社会发展都产生了深远的影响。相比普通微博,热门微博能够得到更大量的传播和更广泛的关注,因此分析热门微博的影响因素并对热门微博进行预测研究,对于企业的产品推广和营销、政府的舆情监控和引导,都具有重要的意义。
发明内容
本发明目的在于设计了一种基于信息增益与BP神经网络的热门微博预测方法,对微博的内容特征、博主特征、传播特征进行分析,并从中提取关键特征,将信息增益算法和BP神经网络模型相结合,利用微博的内容和博主特征来预测该微博能否成为热门微博。通过该 方法可以对刚发布的微博热度进行及时预测,为微博营销和舆情引导提供支撑信息。
本发明采用的技术方案如下:
本发明提供一种基于信息增益与BP神经网络的热门微博预测方法,包括以下步骤:
1、特征分析:将微博分为内容特征、博主特征和传播特征三大特征,并根据微博的传播规律,分析得到微博的内容和博主特征决定其传播特征,微博的传播特征决定微博的热度。
2、传播特征提取:选取转发数、点赞数、评论数、平均转发数、平均点赞数、平均评论数作为研究对象,分别做出热门微博与非热门微博的上述特征的累积分布函数曲线对比,提取微博传播的关键特征,对微博的热度进行度量。
3、内容特征提取:(1)对微博文本进行处理,对微博文本进行分词、去停用词,从中挖掘关键词并统计相应词频;(2)忽略内嵌外部链接(URL),在实际微博应用中,网页链接很少,而且由于跳转的等待时间较长,安全性不能保证,大多数人不愿意打开,忽略后能够尽可能的消除网页交互的噪声数据。(3)综合考虑微博文本中的图片、视频、长微博、表情、话题(“#主题名#”)等用户自定义标签,将微博文本指标化。
4、博主特征提取:从博主的长期和近期影响力两方面出发,选取博主的粉丝数、最近微博被转发数、被点赞数、被评论数等特征,同时为了消除指标之间的量纲影响,需要进行归一化 处理,以解决特征指标之间的可比性。
5、利用信息增益算法,推导微博的热度计算公式:信息增益算法是一种基于信息熵的评估方法,可以衡量一个特征区分数据样本的能力。设U是具有t个特征t1,t2,…,tt的数据集,划分为m个不同类别C1,C2,…,Cm,对某个特征ti的可能取值为x1,x2,…,xn,则该特征的信息增益计算公式如下:
根据各特征的信息增益,可以计算该特征对于类别划分的贡献和权值。某特征ti的权值wi的计算公式如下:
其中Gmean为所有特征的平均增益值。
在微博的传播特征中,不同特征对于微博热度的区分度不同,因此对于微博热度的权重也不同。本发明采用信息增益算法定量计算各传播特征对于微博热度的权值,进而推导微博的热度计算公式。
6、建立BP神经网络模型推算微博热度:微博的传播特征是在传播过程中逐渐产生,微博的内容和博主特征决定其传播特征,因此采用微博的内容和博主特征对微博的传播特征进行预测。应用1986年由Rumelhart和McCelland为首的科学家小组提出的BP神经网络模型,利用BP神经网络非线性映射能力和自学习自适应的特点,对微博热度进行预测。
7、在实际微博网络中进行实证统计实验,以此确定模型的重 要参数,并根据微博热度预测该微博能否成为热门微博。
有益效果:
1、对微博特征进行分类,并根据微博的传播规律,充分发掘微博特征之间的关系。
2、在特征提取阶段,提前对数据预处理,充分考虑了微博文本的特点,对文本进行分词统计词频,综合考虑微博文本中的图片、视频、长微博、表情、话题(“#主题名#”)等用户自定义标签,将微博文本指标化。同时忽略内嵌外部链接,对无用的噪声数据进行了过滤,更好地评估微博的内容特征对微博传播的影响。
3、在信息增益中,重要性的衡量标准就是看特征能够为分类系统带来多少信息,带来的信息越多,该特征越重要。利用信息增益算法,可以通过对实际数据的统计定量计算各传播特征对于微博热度的权值,由此推导出的热度计算公式也更加准确。
4、BP神经网络模型经过几十年的发展,已经十分成熟,在各个领域都有广泛的应用。考虑到微博内容和博主特征的复杂性和相关性,以及它们对于微博传播影响的非线性和不确定性,BP神经网络模型具有非线性映射能力和自学习自适应的特点,完全满足需求。
附图说明
图1是本发明实施例提供的基于信息增益与BP神经网络的热门微博预测模型示意图。
图2是本发明实施例提供的BP神经网络模型示意图。
图3是本发明实施例提供的平均转发数的CDF(累积分布函数)曲线图。
图4是本发明实施例提供的平均评论数的CDF(累积分布函数)曲线图。
图5是本发明实施例提供的平均点赞数的CDF(累积分布函数)曲线图。
图6是本发明实施例提供的微博的各传播特征对于微博热度的信息增益和权值图。
图7是本发明实施例提供的Ir=0.001时BP神经网络模型训练误差曲线图。
图8是本发明实施例提供的Ir=0.01时BP神经网络模型训练误差曲线图。
图9是本发明实施例提供的Ir=0.1时BP神经网络模型训练误差曲线图。
图10是本发明实施例提供的Ir=0.15时BP神经网络模型训练误差曲线图。
具体实施方式
以下结合附图与具体实施方式对本发明作进一步的详细描述。
如图1所示,本发明实施例的基于信息增益与BP神经网络的热门微博预测方法包括以下步骤:
1)数据采集:采用网络爬虫作为实验工具,从新浪微博采集得 到实验数据集。为保证数据的时效性,本文以2016年4月7日16点25分时新浪热门微博榜页面为初始采集网页,随机抓取8572条新浪微博。由于新浪访客系统(Sina Visitor System)和新浪反爬虫策略对于用户微博数据的保护,部分采集得到的样本数据不完整,经过筛选后,共得到有效样本6300条,忽略样本2272条。
2)数据预处理:
(1)对微博文本进行处理,对微博文本进行分词、去停用词,从中挖掘关键词并统计相应词频;
(2)忽略内嵌外部链接(URL),在实际微博应用中,网页链接很少,而且由于跳转的等待时间较长,安全性不能保证,大多数人不愿意打开,忽略后能够尽可能的消除网页交互的噪声数据;
(3)综合考虑微博文本中的图片、视频、长微博、表情、话题(“#主题名#”)等用户自定义标签,将微博文本指标化;
(4)归一化处理,为了消除指标之间的量纲影响,需要进行归一化处理,将它们转化为(0,1)上的无量纲化指标值,以解决特征指标之间的可比性。
3)统计数据,利用信息增益算法,推导微博热度计算公式:将微博数据集U分为热门微博C1和非热门微博C2两种类别,并选取平均转发数、平均评论数、平均点赞数等3个特征,分别为t1、t2、t3。设微博ui的热度为h(ui),平均转发数为r(ui),平均评论数为c(ui),平均点赞数为p(ui)。对于t1、t2、t3来说,每一特征的可能取值过多,因此需要对每条微博ui的r(ui)、c(ui)、p(ui)进行离散化。基于图3~图5微博传播特征的累积分布曲线,定义t1(ui)、t2(ui)、t3(ui)具体取值的依据如下:
统计得到t1、t2、t3的取值概率p(ti=xk),微博的分类取值概率p(cj)以及t1、t2、t3在不同取值时归属各类别的条件概率p(cj|ti=xk)。通过对6300条实际微博数据统计,定量计算t1、t2、t3对于微博热度的权值w1、w2、w3,如图6所示。
最终得到微博的热度计算公式如下:
h(ui)=w1×r(ui)+w2×c(ui)+w3×p(ui) (3)
4)建立基于BP神经网络的热门微博预测模型:BP神经网络模型拓扑结构包括输入层(input layer)、隐层(hidden layer)和输出层(output layer)。本发明采用典型的三层BP网络结构,输入和输出节点数分别是7和3,隐层的节点数由经验公式(4)所确定。
其中S为隐层节点数,m为输入节点数,n为输出节点数。
将微博内容和博主的关键特征的七个指标(综合词频、是否含有图片或视频或长微博、是否含有表情、粉丝数、最近微 博被转发数、被点赞数、被评论数)作为输入,微博传播的三个特征(平均转发数、平均评论数、平均点赞数)作为输出,建立基于BP神经网络的热门微博预测模型,如图1所示。
5)实验确定模型的重要参数,预测热门微博:在BP神经网络模型中,学习速率Ir是一个重要的参数。BP神经网络基于误差-修正进行学习,修正量的大小受学习速率的控制,因此学习速率的大小对收敛速度和训练结果影响很大,一般设定在0.01~0.1之间。本文分别设定Ir为0.001、0.01、0.1、0.15进行实验,误差曲线如图7~图10所示。在误差曲线图中,横坐标表示训练步数,纵坐标表示均方误差。从图7~图10可以看出,当Ir为0.001时,训练未能在最大步数内达到收敛。当Ir为0.01、0.1时,均能收敛。随着Ir的进一步增大,当Ir为0.15时,出现振荡,当Ir>0.15时,误差曲线发散消失,训练失败。从训练误差来说,在训练达到收敛的情况下,误差有所不同,但差别不明显。从收敛速度来看,随着Ir越来越大,收敛步数越来越小,收敛速度越来越快。在实际运行中,当Ir为0.1时,花费时间不到50秒,而当Ir为0.01时,用时近3分钟。从收敛速度和训练误差两方面考虑,Ir设定为0.1。
在参数设定完成后,对模型进行训练学习,BP神经网络是误差反传误差反向传播算法的学习过程,由信息的正向传播和误差的反向传播两个过程组成。输入层各神经元负责接收来自外界的输入信息,并传递给中间层各神经元;中间层 是内部信息处理层,负责信息变换,根据信息变化能力的需求,中间层可以设计为单隐层或者多隐层结构;最后一个隐层传递到输出层各神经元的信息,经进一步处理后,完成一次学习的正向传播处理过程,由输出层向外界输出信息处理结果。当实际输出与期望输出不符时,进入误差的反向传播阶段。误差通过输出层,按误差梯度下降的方式修正各层权值,向隐层、输入层逐层反传。周而复始的信息正向传播和误差反向传播过程,是各层权值不断调整的过程,也是神经网络学习训练的过程,此过程一直进行到网络输出的误差减少到可以接受的程度,或者预先设定的学习次数为止。
在模型训练完成后,初始化微博热度,并根据实际需要合理设定微博热度阈值,对热门微博进行预测。

Claims (6)

1.一种基于信息增益与BP神经网络的热门微博预测方法,其特征在于,分为如下步骤:
1.1 特征分析与提取:
1)特征分析:将微博分为内容特征、博主特征和传播特征三大特征,并根据微博的传播规律,分析得到微博的内容和博主特征决定其传播特征,微博的传播特征决定微博的热度。
2)数据预处理:筛选有效数据,去除不完整或重复数据;微博内容处理,对微博文本进行分词、去停用词、统计词频、记录是否含有表情、图片、视频、长微博等。
3)特征提取:微博的原始特征繁杂,通过对热门微博与非热门微博的各种特征的累积分布函数曲线对比,提取出微博的关键特征。
1.2 利用信息增益算法,推导出微博的热度计算公式:在微博的传播特征中,不同特征对于微博热度的区分度不同,因此对于微博热度的权重也不同。利用信息增益算法对6300条实际微博数据统计,定量计算各传播特征对于微博热度的权值,
得到微博的热度计算公式。
1.3 建立BP神经网络模型推算微博热度:根据微博的三大特征之间的关系,建立一个基于BP神经网络的预测模型,将微博的内容特征和博主特征作为输入,预测微博的传播特征,进而计算微博的热度。
1.4 在实际微博网络中进行实证统计实验,以此确定模型的重要参数,并根据微博热度预测该微博能否成为热门微博。
2.根据权利要求1所述的一种基于信息增益与BP神经网络的热门微博预测方法,其特征在于1.1中所述的将微博分为内容特征、博主特征和传播特征三大特征;即内容特征包括文字、图片、视频、长微博、表情、网页链接、话题标签等;博主特征包括粉丝数、关注数、发文数、转发数、评论数、被转发数、被评论数、被点赞数等;传播特征包括转发数、点赞数、评论数、平均转发数、平均评论数、平均点赞数等。
3.根据权利要求1所述的一种基于信息增益与BP神经网络的热门微博预测方法,其特征在于1.1中所述的根据微博的传播规律,分析得到微博的内容和博主特征决定其传播特征,微博的传播特征决定微博的热度;即内容和博主特征是一条微博发布时的本质特征,而传播特征是微博在传播过程中逐渐产生的表现特征,是内容和博主特征的反映,因此微博的内容和博主特征决定其传播特征。为保障用户的阅读效率和阅读质量,同时达到激励内容作者创作和推广的目的,新浪以热度为标准对微博进行排序,推出热门微博榜,其中热度数值是由该微博的转发数、点赞数和微博发布时间等各因素得到。以是否上榜为依据,微博可分为热门微博和非热门微博两类。显然,微博的传播特征是区分热门微博与非热门微博的关键,决定微博的热度。
4.根据权利要求1所述的一种基于信息增益与BP神经网络的热门微博预测方法,其特征在于1.1中所述的微博的内容和博主特征决定其传播特征,微博的传播特征决定微博的热度;即内容和博主特征是一条微博发布时的本质特征,而传播特征是微博在传播过程中逐渐产生的表现特征,是内容和博主特征的反映,微博的内容和博主特征决定其传播特征。为保障用户的阅读效率和阅读质量,同时达到激励内容作者创作和推广的目的,新浪以热度为标准对微博进行排序,推出热门微博榜,其中热度数值是由该微博的转发数、点赞数和微博发布时间等各因素得到。以是否上榜为依据,微博可分为热门微博和非热门微博两类。显然,微博的传播特征是区分热门微博与非热门微博的关键,决定微博的热度。
5.根据权利要求1所述的一种基于信息增益与BP神经网络的热门微博预测方法,其特征在于1.2中所述的利用信息增益算法,推导出微博的热度计算公式;即选取平均转发数、平均评论数、平均点赞数作为微博传播的关键特征,利用信息增益算法,得到微博的热度计算公式。设U是具有t个特征t1,t2,…,tt的数据集,划分为m个不同类别C1,C2,…,Cm,对某个特征ti的可能取值为x1,x2,…,xn,则该特征的信息增益计算公式如下:
根据各特征的信息增益,可以计算该特征对于类别划分的贡献和权值。某特征ti的权值wi的计算公式如下:
其中Gmean为所有特征的平均增益值。
微博数据集U分为热门微博C1和非热门微博C2两种类别,并选取平均转发数、平均评论数、平均点赞数等3个特征,分别为t1、t2、t3。设微博ui的热度为h(ui),平均转发数为r(ui),平均评论数为c(ui),平均点赞数为p(ui)。统计得到t1、t2、t3的取值概率p(ti=xk),微博的分类取值概率p(cj)以及t1、t2、t3在不同取值时归属各类别的条件概率p(cj|ti=xk)。通过对6300条实际微博数据统计,定量计算t1、t2、t3对于微博热度的权值w1、w2、w3。最终得到微博的热度计算公式如下:
h(u1)=w1×r(u1)+w2×c(u1)+w3×p(u1) (3) 。
6.根据权利要求1所述的一种基于信息增益与BP神经网络的热门微博预测方法,其特征在于1.3中所述的建立一个基于BP神经网络的预测模型;微博的传播特征是在传播过程中逐渐产生,微博的内容和博主特征决定其传播特征,因此采用微博的内容和博主特征对微博的传播特征进行预测。考虑到微博内容和博主特征的复杂性和相关性,以及它们对于微博传播影响的非线性和不确定性,应用1986年由Rumelhart和McCelland为首的科学家小组提出的BP神经网络模型,利用BP神经网络非线性映射能力和自学习自适应的特点,对微博热度进行预测。BP神经网络是一种按误差逆传播算法训练的多层前馈网络,能学习和存贮大量的输入-输出模式映射关系,而无需事前揭示描述这种映射关系的数学方程。它的学习规则是使用最速下降法,通过反向传播来不断调整网络的权值和阈值,使网络的误差平方和最小。采用典型的三层BP网络结构,隐层的节点数由以下经验公式(4)所确定:
其中S为隐层节点数,m为输入节点数,n为输出节点数。
在确定输入节点数、输出节点数和隐层节点数后,基于BP神经网络的热门微博预测模型建立完成。
CN201610880756.9A 2016-09-28 2016-09-28 一种基于信息增益和bp神经网络的热门微博预测方法 Pending CN107870957A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610880756.9A CN107870957A (zh) 2016-09-28 2016-09-28 一种基于信息增益和bp神经网络的热门微博预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610880756.9A CN107870957A (zh) 2016-09-28 2016-09-28 一种基于信息增益和bp神经网络的热门微博预测方法

Publications (1)

Publication Number Publication Date
CN107870957A true CN107870957A (zh) 2018-04-03

Family

ID=61761182

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610880756.9A Pending CN107870957A (zh) 2016-09-28 2016-09-28 一种基于信息增益和bp神经网络的热门微博预测方法

Country Status (1)

Country Link
CN (1) CN107870957A (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109508416A (zh) * 2018-11-09 2019-03-22 四川大学 基于评论数量的微博舆情事件热度与发展趋势预测方法
CN109670032A (zh) * 2019-01-09 2019-04-23 合肥工业大学 一种基于神经网络的微博正向影响力排行方法
CN110069690A (zh) * 2019-04-24 2019-07-30 成都市映潮科技股份有限公司 一种主题网络爬虫方法、装置及介质
CN110166275A (zh) * 2018-05-22 2019-08-23 腾讯科技(深圳)有限公司 信息处理方法、装置及存储介质
WO2020007266A1 (zh) * 2018-07-04 2020-01-09 奇酷互联网络科技(深圳)有限公司 动态分享消息的管理方法、管理设备、存储介质及终端
CN110688477A (zh) * 2019-10-10 2020-01-14 华夏幸福产业投资有限公司 一种技术热点领域的预测方法、装置、设备及存储介质
CN110705276A (zh) * 2019-09-26 2020-01-17 中电万维信息技术有限责任公司 基于神经网络监控网络舆情的方法、装置及存储介质
CN111026958A (zh) * 2019-11-29 2020-04-17 微梦创科网络科技(中国)有限公司 一种热门微博排序方法及装置
CN111552882A (zh) * 2020-05-09 2020-08-18 重庆邮电大学 一种新闻影响力计算方法、装置、计算机设备及存储介质
CN112417097A (zh) * 2020-11-19 2021-02-26 中国电子科技集团公司电子科学研究院 一种用于舆情解析的多模态数据特征提取与关联方法
CN114187126A (zh) * 2021-11-08 2022-03-15 杭州萝卜智能技术有限公司 一种基于数据分析的网络舆情管控系统
CN114970955A (zh) * 2022-04-15 2022-08-30 黑龙江省网络空间研究中心 基于多模态预训练模型的短视频热度预测方法及装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103092921A (zh) * 2012-12-26 2013-05-08 中国科学院深圳先进技术研究院 一种面向微博热门话题社区的动态预测方法及系统
CN104123377A (zh) * 2014-07-30 2014-10-29 福州大学 一种微博话题热度预测系统及方法
CN104484343A (zh) * 2014-11-26 2015-04-01 无锡清华信息科学与技术国家实验室物联网技术中心 一种对微博进行主题发现与追踪的方法
CN104915397A (zh) * 2015-05-28 2015-09-16 国家计算机网络与信息安全管理中心 一种微博传播趋势预测方法及装置
CN105224608A (zh) * 2015-09-06 2016-01-06 华南理工大学 基于微博数据分析的热点新闻预测方法及系统
CN105809554A (zh) * 2016-02-07 2016-07-27 重庆邮电大学 一种社交网络中用户参与热点话题的预测方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103092921A (zh) * 2012-12-26 2013-05-08 中国科学院深圳先进技术研究院 一种面向微博热门话题社区的动态预测方法及系统
CN104123377A (zh) * 2014-07-30 2014-10-29 福州大学 一种微博话题热度预测系统及方法
CN104484343A (zh) * 2014-11-26 2015-04-01 无锡清华信息科学与技术国家实验室物联网技术中心 一种对微博进行主题发现与追踪的方法
CN104915397A (zh) * 2015-05-28 2015-09-16 国家计算机网络与信息安全管理中心 一种微博传播趋势预测方法及装置
CN105224608A (zh) * 2015-09-06 2016-01-06 华南理工大学 基于微博数据分析的热点新闻预测方法及系统
CN105809554A (zh) * 2016-02-07 2016-07-27 重庆邮电大学 一种社交网络中用户参与热点话题的预测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
王振飞等: "基于逻辑回归模型的微博转发预测", 《小型微型计算机系统》 *

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110166275A (zh) * 2018-05-22 2019-08-23 腾讯科技(深圳)有限公司 信息处理方法、装置及存储介质
CN110166275B (zh) * 2018-05-22 2021-06-11 腾讯科技(深圳)有限公司 信息处理方法、装置及存储介质
WO2020007266A1 (zh) * 2018-07-04 2020-01-09 奇酷互联网络科技(深圳)有限公司 动态分享消息的管理方法、管理设备、存储介质及终端
CN109508416B (zh) * 2018-11-09 2021-11-23 四川大学 基于评论数量的微博舆情事件热度与发展趋势预测方法
CN109508416A (zh) * 2018-11-09 2019-03-22 四川大学 基于评论数量的微博舆情事件热度与发展趋势预测方法
CN109670032A (zh) * 2019-01-09 2019-04-23 合肥工业大学 一种基于神经网络的微博正向影响力排行方法
CN110069690A (zh) * 2019-04-24 2019-07-30 成都市映潮科技股份有限公司 一种主题网络爬虫方法、装置及介质
CN110705276A (zh) * 2019-09-26 2020-01-17 中电万维信息技术有限责任公司 基于神经网络监控网络舆情的方法、装置及存储介质
CN110688477A (zh) * 2019-10-10 2020-01-14 华夏幸福产业投资有限公司 一种技术热点领域的预测方法、装置、设备及存储介质
CN110688477B (zh) * 2019-10-10 2022-11-15 华夏幸福产业投资有限公司 一种技术热点领域的预测方法、装置、设备及存储介质
CN111026958A (zh) * 2019-11-29 2020-04-17 微梦创科网络科技(中国)有限公司 一种热门微博排序方法及装置
CN111552882A (zh) * 2020-05-09 2020-08-18 重庆邮电大学 一种新闻影响力计算方法、装置、计算机设备及存储介质
CN111552882B (zh) * 2020-05-09 2022-07-01 重庆邮电大学 一种新闻影响力计算方法、装置、计算机设备及存储介质
CN112417097A (zh) * 2020-11-19 2021-02-26 中国电子科技集团公司电子科学研究院 一种用于舆情解析的多模态数据特征提取与关联方法
CN114187126A (zh) * 2021-11-08 2022-03-15 杭州萝卜智能技术有限公司 一种基于数据分析的网络舆情管控系统
CN114187126B (zh) * 2021-11-08 2022-08-19 杭州萝卜智能技术有限公司 一种基于数据分析的网络舆情管控系统
CN114970955A (zh) * 2022-04-15 2022-08-30 黑龙江省网络空间研究中心 基于多模态预训练模型的短视频热度预测方法及装置
CN114970955B (zh) * 2022-04-15 2023-12-15 黑龙江省网络空间研究中心 基于多模态预训练模型的短视频热度预测方法及装置

Similar Documents

Publication Publication Date Title
CN107870957A (zh) 一种基于信息增益和bp神经网络的热门微博预测方法
Wei et al. Twitter bot detection using bidirectional long short-term memory neural networks and word embeddings
Cai et al. Behavior enhanced deep bot detection in social media
CN104216954B (zh) 突发事件话题状态的预测装置及预测方法
CN112199608B (zh) 基于网络信息传播图建模的社交媒体谣言检测方法
Boukabous et al. Crime prediction using a hybrid sentiment analysis approach based on the bidirectional encoder representations from transformers
CN102394798B (zh) 一种基于多元特征的微博信息传播行为预测方法及系统
Li et al. A rumor events detection method based on deep bidirectional GRU neural network
CN107092596A (zh) 基于attention CNNs和CCR的文本情感分析方法
CN111966786B (zh) 一种微博谣言检测方法
CN106294590A (zh) 一种基于半监督学习的社交网络垃圾用户过滤方法
CN104182457A (zh) 在社交网络中基于泊松过程模型的事件流行度预测方法
CN110134788B (zh) 一种基于文本挖掘的微博发布优化方法及系统
CN116776889A (zh) 一种基于图卷积网络和外部知识嵌入的粤语谣言检测方法
CN114218457A (zh) 一种基于转发社交媒体用户表征的假新闻检测方法
Cheng et al. ISC: An iterative social based classifier for adult account detection on twitter
Kate et al. Monitoring food safety violation reports from internet forums
İş et al. A Profile Analysis of User Interaction in Social Media Using Deep Learning.
Sadreddin et al. Chunk-based incremental feature learning for credit-card fraud data stream
Reddy et al. Convolutional neural networks-bidirectional long short term memory based fake review classification
CN115495671A (zh) 一种基于图结构迁移的跨领域谣言传播控制方法
Tan et al. Detection of malicious web requests using neural networks with multi granularity features
Dong et al. Rumor Detection with Adversarial Training and Supervised Contrastive Learning
Jinghua et al. Information diffusion prediction based on cascade sequences and social topology
Ströde et al. Information extraction to improve link prediction in scientific social networks

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20180403