CN110688484A - 一种基于不平衡贝叶斯分类的微博敏感事件言论检测方法 - Google Patents

一种基于不平衡贝叶斯分类的微博敏感事件言论检测方法 Download PDF

Info

Publication number
CN110688484A
CN110688484A CN201910905103.5A CN201910905103A CN110688484A CN 110688484 A CN110688484 A CN 110688484A CN 201910905103 A CN201910905103 A CN 201910905103A CN 110688484 A CN110688484 A CN 110688484A
Authority
CN
China
Prior art keywords
parameter
omega
classification model
classification
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910905103.5A
Other languages
English (en)
Other versions
CN110688484B (zh
Inventor
韩忠明
刘聃
段大高
杨伟杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Technology and Business University
Original Assignee
Beijing Technology and Business University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Technology and Business University filed Critical Beijing Technology and Business University
Priority to CN201910905103.5A priority Critical patent/CN110688484B/zh
Publication of CN110688484A publication Critical patent/CN110688484A/zh
Application granted granted Critical
Publication of CN110688484B publication Critical patent/CN110688484B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • G06F18/24155Bayesian classification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Probability & Statistics with Applications (AREA)
  • Databases & Information Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开一种基于不平衡贝叶斯分类的微博敏感事件言论检测方法,包括:S1、选取需要检测的微博言论数据集,通过文本特征处理构建不平衡数据集,构建分类模型;指定分类模型在参数ω上的先验分布,对参数ω随机初始化,得到初始参数向量ω0;S2、计算参数为ω0的分类模型对各类别子数据集的间隔似然值;S3、计算分类模型在参数ω0上的后验概率;S4、采样新参数点;S5、记录采样到的参数序列;S6、分类模型计算待测言论特征属于各类别的概率分布向量p,预测待测言论特征的类别为p中概率最高的类别;本发明不需大量数据支撑训练过程,克服了异常类样本过拟合的问题,从而有效提高了异常类言论数量过少时数据集的分类精度。

Description

一种基于不平衡贝叶斯分类的微博敏感事件言论检测方法
技术领域
本发明涉及数据挖掘技术领域,特别是涉及一种基于不平衡贝叶斯分类的微博敏感事件言论检测方法。
背景技术
在互联网快速发展的时代,越来越多的人使用互联网进行交流,但是互联网自身的匿名性会使人在网上发出不负责任的言论,包括对敏感事件进行不负责任的评价,例如涉黄涉恐言论、谣言、辱华言论等。在微博等社交平台中,人工筛查微博言论不再可行,需要通过深度学习等方法对这些言论进行识别检测。但是在敏感事件言论检测这个任务中,多数人发的微博并不涉及敏感事件,仅有很少一部分人的言论涉及敏感事件,造成数据集中正常类和异常类的微博样本数量差异很大,这种数据集称为不平衡数据集。传统分类算法假定数据集具有平衡的类分布或各类别具有相等的错误分类代价,因此,当处理微博敏感事件言论检测任务时,传统分类算法不能正确表示数据的分布特征,使模型的分类结果倾向于正常类而忽略异常类。
现有可用于微博敏感事件言论检测的不平衡分类方法通常基于函数逼近方法,大致分为重采样和改进损失函数。重采样通过减少正常类样本或增加异常类样本等手段构造具有平衡类分布的训练数据集,而改进损失函数对不同的类别设置不同的错误分类代价使模型可以在不平衡数据集上训练。函数逼近方法要求训练数据集能够反映真实的数据分布,但是在微博敏感事件言论检测中,涉及敏感事件的言论较少,数据集存在异常样本过少的问题,导致异常类样本由于数量不足而无法良好刻画真实的数据分布,使模型对异常类样本存在过拟合的现象。
发明内容
本发明的目的是提供一种基于不平衡贝叶斯分类的微博敏感事件言论检测方法,以解决上述现有技术存在的问题,提高异常类样本量过少时数据集分类的准确度。
为实现上述目的,本发明提供了如下方案:本发明提供一种基于不平衡贝叶斯分类的微博敏感事件言论检测方法方法,包括如下步骤:
S1、选取需要检测的微博言论数据集,通过文本特征处理构建不平衡数据集(X,Y),其中X为言论特征向量的集合,Y为数据的类别标签构成的集合,提取数据集(X,Y)的数据维度和类别数量,构建分类模型F;指定分类模型F在参数ω上的先验分布P(ω),使用P(ω)对参数ω进行随机初始化,得到初始参数向量ω0
S2、计算参数为ω0的分类模型F对数据集(X,Y)中类别为c的子数据集(Xc,Yc)的间隔似然值;
S3、计算分类模型F在数据集(X,Y)上的类间隔似然值,并根据分类模型F在数据集(X,Y)上的类间隔似然值,计算分类模型F在参数ω0上的后验概率;
S4、从当前时刻的参数点ωt开始,在参数空间R|ω|中以步长a随机移动到新的参数点ω′,计算参数点ω′的后验概率值P(ω′|X,Y);若P(ω′|X,Y)>P(ωt|X,Y),则接受参数点的转移,且ωt+1=ω′;若P(ω′|X,Y)≤P(ωt|X,Y),则从0~1均匀分布U(0,1)中随机采样一个实数γ并设定参数点的转移接受概率α,若α>γ则接受参数点的转移,ωt+1=ω′,否则拒绝参数点的转移,且ωt+1=ωt
S5、重复步骤S4,直至时刻t=T+T′,其中T表示收敛时刻数,T′表示采样时刻数,并记录采样到的参数序列为Ω={ωT+1T+2,…,ωT+T′};
S6、分类模型F使用参数序列Ω中的所有参数计算待测言论特征x属于各类别的概率分布向量p,预测待测言论特征x的类别为概率分布向量p中概率最高的类别,实现对微博敏感事件言论的检测。
优选的,步骤S1中的分类模型F是一种基于函数逼近的分类模型,并使用标准正态分布作为分类模型F的参数ω的先验分布P(ω)。
优选的,步骤S1中的分类模型F为单层全连接神经网络分类模型,并使用Softmax函数作为单层全连接神经网络分类模型的激活函数。
优选的,步骤S2中,参数为ω0的分类模型F对子数据集(Xc,Yc)的间隔似然值的计算方法如公式1和公式2所示:
Figure BDA0002213045190000031
Figure BDA0002213045190000032
其中,M(yi|xi0)表示分类模型F对数据(xi,yi)的间隔值,(xi,yi)表示数据集(Xc,Yc)上的一条数据,F(yi|xi0)表示模型参数为ω0时,分类模型F计算输入数据xi的类别为yi的概率;F(c|xi0)表示模型参数为ω0时,分类模型F计算输入数据xi的类别为c的概率;M(Yc|Xc0)表示模型参数为ω0时,分类模型F在c类上的间隔似然值;C表示数据集(X,Y)中所有类别构成的集合。
优选的,步骤3中,分类模型F在数据集(X,Y)上的类间隔似然值的计算方法如公式3所示,分类模型F在参数ω0上的后验概率的计算方法如公式4所示:
Figure BDA0002213045190000041
Figure BDA0002213045190000042
其中,
Figure BDA0002213045190000043
表示模型参数为ω0时,模型F在数据集(X,Y)上的类间隔似然值,P(ω0|X,Y)表示参数ω0在数据集(X,Y)上的后验概率,P(ω0)表示参数ω0的先验概率。
优选的,步骤4中设定参数点的转移接受概率α为0.6。
优选的,步骤6中,待测样本x属于各类别的概率分布向量p的计算方法如公式5所示:
Figure BDA0002213045190000044
其中,F(x|ωT+i)表示模型参数为ωT+i的模型F根据待测样本x计算得到的概率向量。
本发明公开了以下技术效果:针对微博敏感事件言论检测任务中存在异常类样本过少的问题,本发明提出了基于不平衡贝叶斯分类的微博敏感事件言论检测方法,基于贝叶斯学习的假设,微博敏感事件发生的概率是对事件发生的信念度,而不是事件发生次数的均值,由于微博敏感事件较少,从大量非敏感内容中分类处敏感内容是一个不平衡分类问题,本发明构建了新的损失函数,对不同的类别设置不同的错误分类代价,然后采用贝叶斯学习在微博敏感事件的不平衡样本集上训练,这样有效避免了统计模型中需要大量数据满足中心极限定理的收敛条件,同时,本发明使用概率模型的推理方法,改善了现有微博敏感事件言论检测方法对异常类样本过拟合的问题,能够在异常类样本过少的数据集上达到良好的学习效果,从而在敏感事件言论检测任务中,学习到一个对正常类和异常类言论均达到高分类精度的模型,有效提高了微博敏感事件言论检测精度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明基于不平衡贝叶斯分类的微博敏感事件言论检测方法流程图;
图2为本发明分类模型F结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
参照图1-2所示,本实施例提供一种基于不平衡贝叶斯分类的微博敏感事件言论检测方法,包括如下步骤:
S1、获取一组微博言论数据,对微博言论进行文本特征处理得到高维的言论特征,为简化、方便描述,本实施例采用降维方法将特征维度降至二维。构造言论特征和标签的构成的数据集(X,Y),其中X为言论特征向量的集合,Y为数据的类别标签构成的集合,如表1所示,X特征维度为2,正常类和异常类分别用标签“0”、“1”标记,构建分类模型F;本实施例构造单层全连接神经网络作为分类模型F,使用Softmax函数作为激活函数,使用标准正态分布作为分类模型F的参数ω的先验分布P(ω),使用P(ω)对参数ω进行随机初始化,从标准正态分布中进行多次采样,得到初始参数向量ω0
Figure BDA0002213045190000061
表1
Figure BDA0002213045190000071
S2、在参数为ω0时,计算分类模型F对数据集(X,Y)中类别为c的子数据集(Xc,Yc)的间隔似然值,如公式1和公式2所示,计算结果如表2所示:
Figure BDA0002213045190000072
Figure BDA0002213045190000073
其中,M(yi|xi0)表示分类模型F对数据(xi,yi)的间隔值,(xi,yi)表示数据集(Xc,Yc)上的一条数据,F(yi|xi0)表示模型参数为ω0时,分类模型F计算输入数据xi的类别为yi的概率;F(c|xi0)表示模型参数为ω0时,分类模型F计算输入数据xi的类别为c的概率;M(Yc|Xc0)表示模型参数为ω0时,分类模型F在c类上的间隔似然值;C表示数据集(X,Y)中所有类别构成的集合。
表2
编号 F(0|x,ω<sup>0</sup>) F(1|x,ω<sup>0</sup>) M(y|x,ω<sup>0</sup>)
(x<sub>1</sub>,y<sub>1</sub>) 0.806 0.194 0.648
(x<sub>2</sub>,y<sub>2</sub>) 0.790 0.210 0.641
(x<sub>3</sub>,y<sub>3</sub>) 0.791 0.209 0.642
(x<sub>4</sub>,y<sub>4</sub>) 0.766 0.234 0.630
(x<sub>5</sub>,y<sub>5</sub>) 0.538 0.462 0.481
(x<sub>6</sub>,y<sub>6</sub>) 0.559 0.441 0.470
S3、使用类间隔似然函数计算分类模型F在数据集(X,Y)上的类间隔似然值,如公式3所示,并根据分类模型F在数据集(X,Y)上的类间隔似然值,计算分类模型F在参数ω0上的后验概率,如公式4所示;
Figure BDA0002213045190000081
Figure BDA0002213045190000082
其中,表示模型参数为ω0时,模型F在数据集(X,Y)上的类间隔似然值,P(ω0|X,Y)表示参数ω0在数据集(X,Y)上的后验概率,P(ω0)表示参数ω0的先验概率;
经计算,参数ω0的先验概率值为:P(ω0)=1.74×10-4,参数ω0的后验概率值为:P(ω0|X,Y)=5.34×10-5
S4、从当前时刻的参数点ωt开始,在参数空间R|ω|中以步长a随机移动到新的参数点ω′,本实施例中设定步长a为0.1,通过公式1-4计算参数点ω′的后验概率值P(ω′|X,Y);若P(ω′|X,Y)>P(ωt|X,Y),则接受参数点的转移,且ωt+1=ω′;若P(ω′|X,Y)≤P(ωt|X,Y),则从0~1均匀分布U(0,1)中随机采样一个实数γ,若转移接受概率α>γ则接受参数点的转移,ωt+1=ω′,否则拒绝参数点的转移,且ωt+1=ωt;本实施例设定参数点的转移接受概率α为0.6,通过计算,
Figure BDA0002213045190000084
“0”类的间隔似然值为:M(Y0|X0,ω′)=0.1761,
“1”类的间隔似然值为:M(Y1|X1,ω′)=0.2215,
参数ω′的先验概率值为:P(ω′)=1.85×10-4
参数ω′的后验概率为值:P(ω′|X,Y)=5.63×10-4
参数ω′的后验概率值大于ω0,接受转移,ω1=ω′。
S5、重复步骤S4,直至时刻t=T+T′,其中T表示收敛时刻数,T′表示采样时刻数,并记录采样到的参数序列为Ω={ωT+1T+2,…,ωT+T′};本实施例设定收敛时刻数T和采样时刻数T均为2,即迭代重复步骤S4至参数随机移动4次;第二次迭代结果如下:
模拟参数随机移动至ω′,计算ω′对应的后验概率值,模拟及计算结果如下:
“0”类的间隔似然值为:M(Y0|X0,ω′)=0.1769,
“1”类的间隔似然值为:M(Y1|X1,ω′)=0.2219,
参数ω′的先验概率值为:P(ω′)=2.20×10-4
参数ω′的后验概率值为:P(ω′|X,Y)=6.15×10-4
参数ω′的后验概率值小于ω0,随机采样γ为0.81,α<γ,拒绝转移,ω2=ω1;第三、四次参数采样结果如下:
Figure BDA0002213045190000092
采样迭代期为第三次和第四次迭代,记录ω3和ω4的参数值作为模型参数序列Ω。
S6、分类模型F使用参数序列Ω中的所有参数计算待测言论特征x属于各类别的概率分布向量p,如公式5所示,预测待测言论特征x的类别为概率分布向量p中概率最高的类别,实现对微博敏感事件言论的检测,如公式6所示:
Figure BDA0002213045190000093
c=argmax(p) 6其中,F(x|ωT+i)表示模型参数为ωT+i的模型F根据待测样本x计算得到的概率向量;
本实施例以表1中的x1作为待测样本,使用参数为ω3和ω4的分类模型F得到的概率向量分别为:
F(x|ω3)=[0.666 0.334],F(x|ω4)=[0.647 0.353],
根据公式5:
Figure BDA0002213045190000101
根据公式6,c=argmax(p)=“0”,即待测样本x1的分类结果为“0”类。
可见,本发明能够在敏感事件言论检测任务中,学习到一个对正常类和异常类言论均达到高分类精度的模型,有效提高了微博敏感事件言论检测精度。同时,本发明中的不平衡贝叶斯分类方法能够推广应用于异常检测、文本分析、医疗诊断、入侵识别等多个技术领域,用于不平衡样本分类识别,有效提高了机器学习的易用性。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。
在发明的描述中,需要理解的是,术语“纵向”、“横向”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
以上所述的实施例仅是对本发明的优选方式进行描述,并非对本发明的范围进行限定,在不脱离本发明设计精神的前提下,本领域普通技术人员对本发明的技术方案做出的各种变形和改进,均应落入本发明权利要求书确定的保护范围内。

Claims (7)

1.一种基于不平衡贝叶斯分类的微博敏感事件言论检测方法,其特征在于:包括如下步骤:
S1、选取需要检测的微博言论数据集,通过文本特征处理构建不平衡数据集(X,Y),其中X为言论特征向量的集合,Y为数据的类别标签构成的集合,提取数据集(X,Y)的数据维度和类别数量,构建分类模型F;指定分类模型F在参数ω上的先验分布P(ω),使用P(ω)对参数ω进行随机初始化,得到初始参数向量ω0
S2、计算参数为ω0的分类模型F对数据集(X,Y)中类别为c的子数据集(Xc,Yc)的间隔似然值;
S3、计算分类模型F在数据集(X,Y)上的类间隔似然值,并根据分类模型F在数据集(X,Y)上的类间隔似然值,计算分类模型F在参数ω0上的后验概率;
S4、从当前时刻的参数点ωt开始,在参数空间R|ω|中以步长a随机移动到新的参数点ω′,计算参数点ω′的后验概率值P(ω′|X,Y);若P(ω′|X,Y)>P(ωt|X,Y),则接受参数点的转移,且ωt+1=ω′;若P(ω′|X,Y)≤P(ωt|X,Y),则从0~1均匀分布U(0,1)中随机采样一个实数γ并设定参数点的转移接受概率α,若α>γ则接受参数点的转移,ωt+1=ω′,否则拒绝参数点的转移,且ωt+1=ωt
S5、重复步骤S4,直至时刻t=T+T′,其中T表示收敛时刻数,T′表示采样时刻数,并记录采样到的参数序列为Ω={ωT+1T+2,…,ωT+T′};
S6、分类模型F使用参数序列Ω中的所有参数计算待测言论特征x属于各类别的概率分布向量p,预测待测言论特征x的类别为概率分布向量p中概率最高的类别,实现对微博敏感事件言论的检测。
2.根据权利要求1所述的基于不平衡贝叶斯分类的微博敏感事件言论检测方法,其特征在于:步骤S1中的分类模型F是一种基于函数逼近的分类模型,并使用标准正态分布作为分类模型F的参数ω的先验分布P(ω)。
3.根据权利要求2所述的基于不平衡贝叶斯分类的微博敏感事件言论检测方法,其特征在于:步骤S1中的分类模型F为单层全连接神经网络分类模型,并使用Softmax函数作为单层全连接神经网络分类模型的激活函数。
4.根据权利要求1所述的基于不平衡贝叶斯分类的微博敏感事件言论检测方法,其特征在于:步骤S2中,参数为ω0的分类模型F对子数据集(Xc,Yc)的间隔似然值的计算方法如公式1和公式2所示:
Figure FDA0002213045180000021
其中,M(yi|xi0)表示分类模型F对数据(xi,yi)的间隔值,(xi,yi)表示数据集(Xc,Yc)上的一条数据,F(yi|xi0)表示模型参数为ω0时,分类模型F计算输入数据xi的类别为yi的概率;F(c|xi0)表示模型参数为ω0时,分类模型F计算输入数据xi的类别为c的概率;M(Yc|Xc0)表示模型参数为ω0时,分类模型F在c类上的间隔似然值;C表示数据集(X,Y)中所有类别构成的集合。
5.根据权利要求1所述的基于不平衡贝叶斯分类的微博敏感事件言论检测方法,其特征在于:步骤3中,分类模型F在数据集(X,Y)上的类间隔似然值的计算方法如公式3所示,分类模型F在参数ω0上的后验概率的计算方法如公式4所示:
Figure FDA0002213045180000031
Figure FDA0002213045180000032
其中,
Figure FDA0002213045180000033
表示模型参数为ω0时,模型F在数据集(X,Y)上的类间隔似然值,P(ω0|X,Y)表示参数ω0在数据集(X,Y)上的后验概率,P(ω0)表示参数ω0的先验概率。
6.根据权利要求1所述的基于不平衡贝叶斯分类的微博敏感事件言论检测方法,其特征在于:步骤4中设定参数点的转移接受概率α为0.6。
7.根据权利要求1所述的基于不平衡贝叶斯分类的微博敏感事件言论检测方法,其特征在于:步骤6中,待测样本x属于各类别的概率分布向量p的计算方法如公式5所示:
Figure FDA0002213045180000034
其中,F(x|ωT+i)表示模型参数为ωT+i的模型F根据待测样本x计算得到的概率向量。
CN201910905103.5A 2019-09-24 2019-09-24 一种基于不平衡贝叶斯分类的微博敏感事件言论检测方法 Expired - Fee Related CN110688484B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910905103.5A CN110688484B (zh) 2019-09-24 2019-09-24 一种基于不平衡贝叶斯分类的微博敏感事件言论检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910905103.5A CN110688484B (zh) 2019-09-24 2019-09-24 一种基于不平衡贝叶斯分类的微博敏感事件言论检测方法

Publications (2)

Publication Number Publication Date
CN110688484A true CN110688484A (zh) 2020-01-14
CN110688484B CN110688484B (zh) 2021-12-31

Family

ID=69110279

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910905103.5A Expired - Fee Related CN110688484B (zh) 2019-09-24 2019-09-24 一种基于不平衡贝叶斯分类的微博敏感事件言论检测方法

Country Status (1)

Country Link
CN (1) CN110688484B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112231562A (zh) * 2020-10-15 2021-01-15 北京工商大学 一种网络谣言识别方法及系统
CN113626685A (zh) * 2021-07-08 2021-11-09 中国科学院信息工程研究所 一种面向传播不确定性的谣言检测方法及装置
CN114429403A (zh) * 2020-10-14 2022-05-03 国际商业机器公司 在误报内容减轻方面在社交网络和付费策展内容制作者之间调解

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005202932A (ja) * 2003-11-19 2005-07-28 Mitsubishi Electric Research Laboratories Inc データを複数のクラスに分類する方法
CN101996241A (zh) * 2010-10-22 2011-03-30 东南大学 一种基于贝叶斯算法的内容过滤方法
CN104077412A (zh) * 2014-07-14 2014-10-01 福州大学 一种基于多Markov链的微博用户兴趣预测方法
CN106202211A (zh) * 2016-06-27 2016-12-07 四川大学 一种基于微博类型的集成微博谣言识别方法
CN108009249A (zh) * 2017-12-01 2018-05-08 北京中视广信科技有限公司 针对不平衡数据的融合用户行为规则的垃圾评论过滤方法
CN108804651A (zh) * 2018-06-07 2018-11-13 南京邮电大学 一种基于强化贝叶斯分类的社交行为检测方法
CN109446393A (zh) * 2018-09-12 2019-03-08 北京邮电大学 一种网络社区话题分类方法及装置
CN109951327A (zh) * 2019-03-05 2019-06-28 南京信息职业技术学院 一种基于贝叶斯混合模型的网络故障数据合成方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005202932A (ja) * 2003-11-19 2005-07-28 Mitsubishi Electric Research Laboratories Inc データを複数のクラスに分類する方法
CN101996241A (zh) * 2010-10-22 2011-03-30 东南大学 一种基于贝叶斯算法的内容过滤方法
CN104077412A (zh) * 2014-07-14 2014-10-01 福州大学 一种基于多Markov链的微博用户兴趣预测方法
CN106202211A (zh) * 2016-06-27 2016-12-07 四川大学 一种基于微博类型的集成微博谣言识别方法
CN108009249A (zh) * 2017-12-01 2018-05-08 北京中视广信科技有限公司 针对不平衡数据的融合用户行为规则的垃圾评论过滤方法
CN108804651A (zh) * 2018-06-07 2018-11-13 南京邮电大学 一种基于强化贝叶斯分类的社交行为检测方法
CN109446393A (zh) * 2018-09-12 2019-03-08 北京邮电大学 一种网络社区话题分类方法及装置
CN109951327A (zh) * 2019-03-05 2019-06-28 南京信息职业技术学院 一种基于贝叶斯混合模型的网络故障数据合成方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114429403A (zh) * 2020-10-14 2022-05-03 国际商业机器公司 在误报内容减轻方面在社交网络和付费策展内容制作者之间调解
CN112231562A (zh) * 2020-10-15 2021-01-15 北京工商大学 一种网络谣言识别方法及系统
CN112231562B (zh) * 2020-10-15 2023-07-14 北京工商大学 一种网络谣言识别方法及系统
CN113626685A (zh) * 2021-07-08 2021-11-09 中国科学院信息工程研究所 一种面向传播不确定性的谣言检测方法及装置
CN113626685B (zh) * 2021-07-08 2024-05-03 中国科学院信息工程研究所 一种面向传播不确定性的谣言检测方法及装置

Also Published As

Publication number Publication date
CN110688484B (zh) 2021-12-31

Similar Documents

Publication Publication Date Title
CN109934293B (zh) 图像识别方法、装置、介质及混淆感知卷积神经网络
US11816183B2 (en) Methods and systems for mining minority-class data samples for training a neural network
CN110688484B (zh) 一种基于不平衡贝叶斯分类的微博敏感事件言论检测方法
CN106897404B (zh) 一种基于多gru层神经网络的推荐方法与系统
CN110738242B (zh) 一种深度神经网络的贝叶斯结构学习方法及装置
CN112231562A (zh) 一种网络谣言识别方法及系统
CN109800884B (zh) 模型参数的处理方法、装置、设备和计算机存储介质
CN112465043B (zh) 模型训练方法、装置和设备
CN106650314A (zh) 预测氨基酸突变的方法及系统
CN113379071B (zh) 一种基于联邦学习的噪声标签修正方法
CN111428151B (zh) 一种基于网络增速的虚假消息识别方法及其装置
CN113283524A (zh) 一种基于对抗攻击的深度神经网络近似模型分析方法
CN114036308A (zh) 基于图注意力神经网络的知识图谱表示方法
JP6962123B2 (ja) ラベル推定装置及びラベル推定プログラム
CN109783805A (zh) 一种网络社区用户识别方法及装置
CN113762716A (zh) 基于深度学习和注意力的台区运行状态评估方法及系统
CN114154557A (zh) 癌症组织分类方法、装置、电子设备及存储介质
CN108491719A (zh) 一种改进朴素贝叶斯算法的安卓恶意程序检测方法
Alasalmi et al. Classification uncertainty of multiple imputed data
CN110459266B (zh) Snp致病因素与疾病关联关系模型建立方法
CN114972963A (zh) 基于关系独立和特征适应器的关系增量场景图生成方法
CN111078820B (zh) 基于权重符号社交网络嵌入的边权预测方法
CN114048796A (zh) 一种改进型硬盘故障预测方法及装置
CN113157993A (zh) 一种基于时序图极化分析的网络水军行为预警模型
CN110309285B (zh) 自动问答方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20211231