CN108596276A - 基于特征加权的朴素贝叶斯微博用户分类方法 - Google Patents
基于特征加权的朴素贝叶斯微博用户分类方法 Download PDFInfo
- Publication number
- CN108596276A CN108596276A CN201810443273.1A CN201810443273A CN108596276A CN 108596276 A CN108596276 A CN 108596276A CN 201810443273 A CN201810443273 A CN 201810443273A CN 108596276 A CN108596276 A CN 108596276A
- Authority
- CN
- China
- Prior art keywords
- feature
- microblog users
- information
- probability
- users
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
- G06F18/24155—Bayesian classification
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Probability & Statistics with Applications (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明请求保护一种基于特征加权的朴素贝叶斯微博用户分类方法。本发明目的是区分正常微博用户和恶意微博用户。本发明首先将经过离散化处理的微博用户数据分为训练数据集和测试数据集;然后对训练数据集进行计算得到各个特征的先验概率、条件概率和信息增益,再根据信息增益排名建立目标优化矩阵,确定各个特征的权值;最后对测试数据进行计算后验概率,最大的后验概率所对应的类别即是分类结果。本发明弱化了朴素贝叶斯分类方法的特征之间相互独立且同等重要的假设,通过计算信息增益,确定各特征对分类结果的重要程度,建立目标优化矩阵,确定各个特征的权值,以此提高了微博用户分类的准确性。
Description
技术领域
本发明属于计算机领域,尤其涉及一种基于特征加权的朴素贝叶斯微博用 户分类方法。
背景技术
近几年,随着互联网的快速发展,各种社交平台也跟着迅速崛起。微博作 为一种新兴的信息传播平台,具有传播速度快,覆盖面积广的特点。微博成为 人们关注时政,获取新闻,发表评论的重要途径。但是在微博带给我们便利的 同时,微博平台上也充满着各种各样的恶意信息,如钓鱼链接、垃圾广告信息 等。这些恶意信息的产生来源就是微博上的一些恶意用户。为了避免正常用户 上当受骗,如何识别微博恶意用户的研究就很有意义。
朴素贝叶斯分类算法,具有简单,分类速度快的特点。但是朴素贝叶斯假 设各个特征相互独立且同等重要。但是往往现实中特征对分类结果具有不同的 重要性。微博上的恶意用户会有抱团现象,或者就是一个人用机器控制多个账 号。这些恶意用户的微博特征信息和正常用户的微博特征信息有区别,这也是 区分正常用户和恶意用户的关键。经过收集信息发现,正常用户和恶意用户在 某些特征方面有很大的差异,但在一些特征方面,差异不明显。如何改进传统 朴素贝叶斯方法对微博用户分类成为迫切需要解决的问题。
发明内容
本发明旨在解决以上现有技术的问题。提出了一种快速有效的对微博用户进 行分类,有效提高微博用户分类的准确率的基于特征加权的朴素贝叶斯微博用 户分类方法。本发明的技术方案如下:
一种基于特征加权的朴素贝叶斯微博用户分类方法,其包括以下步骤:
步骤1:获取微博用户信息,组建数据列表;
步骤2:对步骤1中得到的微博用户信息数据进行离散化处理,得到数据集;
步骤3:将数据集分为训练数据集和测试数据集;
步骤4:对于训练数据集,计算微博用户所属类别的先验概率,以及各个特 征的条件概率和信息增益;
步骤5:采用改进朴素贝叶斯分类算法,改进点主要在于,通过计算各个特 征的信息增益,获知各个特征对于分类结果的重要性,构建目标优化矩阵,根 据各个特征信息的增益排名,确定每个特征的权值;
步骤6:计算测试数据的后验概率,并将最大后验概率对应的类作为分类结 果。
进一步的,所述步骤1:获取微博用户信息,组建数据列表,具体包括:
步骤1.1:关注目标用户包括正常用户和恶意用户的微博;
步骤1.2:记录这些目标用户的基本特征信息,包括:粉丝数,关注数,微 博数,微博年龄,认证情况,阳光信用等级,用一个特征向量表示一个用户, 构建数据集。
进一步的,所述步骤2对数据集采用固定步长分组法进行离散化处理,所 述分组法的步骤包括:将每个特征的取值范围分为三个小段,每个小段分别用 0,1,2表示。如对于微博注册日期这一特征,2009年至2011年期间注册的用0 表示,2012至2014年期间注册的用1表示,2015年-2017年期间注册的用2表 示。
进一步的,所述步骤3将数据集分为训练数据集和测试数据集,具体包括: 将数据集随机打乱,分成十份,选取其中九份作为训练数据集,剩下一份作为 测试数据集。
进一步的,所述步骤4对于训练数据集,计算微博用户所属类别的先验概 率,以及各个特征的条件概率和信息增益;包括:
分别计算正常用户和恶意用户两种类别的先验概率P(Y1)和P(Y2),计算公 式如下:
其中Y1代表正常用户,Y2代表恶意用户,N代表整个训练数据集样本的数量, NY1代表训练数据集中正常用户样本的数量,代表训练数据集中恶意用户样本的 数量;
步骤4.2:分别计算对于两种不同类别的各个特征的条件概率P(X(i)|Y1)和 P(X(i)|Y2),其中X(i)表示特征向量X中的第i个特征;
步骤4.3:分别计算各个特征的信息增益;
信息增益表示得知特征X的信息而使得类Y的信息的不确定性减少的程度, 特征A对训练数据集D的信息增益g(D,A),定义为集合D的经验熵H(D)与特征 A在给定条件D的经验条件熵H(D|A)之差,即
g(D,A)=H(D)-H(D|A)
信息增益反映出了特征对分类结果的重要性程度。
进一步的,所述步骤5的目标优化矩阵构建的过程如下:
首先,将特征向量包含的特征依次填入矩阵表的第一行和第一列;
其次,从纵轴的特征1开始,与横轴的特征2,特征3,一直到特征n逐一 进行比较,根据计算出的各个特征的信息增益,若特征1比特征2的信息增益 大,则在特征1和特征2相交的表格内填1,反之填0,其他特征之间比较也是 按照此规则;
最后,统计每行之和作为最后矩阵一列,得到目标优化矩阵。
进一步的,所述各个特征权值获取方式如下:
利用合计项计算权重,可能出现某项特征的合计为0,但实际上该特征对于 分类结果还是具有一定的重要性。所以权值计算公式如下:
某特征权值=1+(某特征的合计得分/所有特征的合计得分之和)。
进一步的,所述步骤6计算测试数据的后验概率,并将最大后验概率对应 的类作为分类结果,具体包括:
根据步骤4计算的到的类的先验概率,各个特征的条件概率和步骤5计算 得到的各个特征的权值,计算测试数据的后验概率,公式如下:
其中j={1,2},q代表特征x(i)的权值,将最大的后验概率对应的类作为测试 数据的分类结果。
本发明的优点及有益效果如下:
本发明基于特征加权的朴素贝叶斯微博用户分类方法。通过计算各个特征 的信息增益,获知各个特征对于分类结果的重要性,构建目标优化矩阵,确定 每个特征的权值。通过本方法能够快速有效的对微博用户进行分类,有效提高 微博用户分类的准确率。
附图说明
图1是本发明提供优选实施例微博用户分类方法的流程图;
图2为目标优化矩阵图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、 详细地描述。所描述的实施例仅仅是本发明的一部分实施例。
本发明解决上述技术问题的技术方案是:
参见图1,一种基于基于特征加权的朴素贝叶斯微博用户分类方法,包括如 下步骤:
步骤1:获取微博用户信息,组建数据列表;
步骤1.1:关注目标用户包括正常用户和恶意用户的微博;
步骤1.2:记录这些目标用户的基本特征信息,包括:粉丝数,关注数,微 博数,微博年龄,认证情况,阳光信用等级,用一个特征向量表示一个用户, 构建数据集;
步骤2:对步骤1得到的数据集采用固定步长分组法进行离散化处理;
步骤3:将数据集分为训练数据集和测试数据集。将数据集随机打乱,分成 十份,选取其中九份作为训练数据集,剩下一份作为测试数据集;
步骤4:对于训练数据集,计算类的先验概率,各个特征的条件概率和信息 增益;
步骤4.1:分别计算正常用户和恶意用户两种类别的先验概率P(Y1)和P(Y2), 计算公式如下:
其中Y1代表正常用户,Y2代表恶意用户,N代表整个训练数据集样本的数量, NY1代表训练数据集中正常用户样本的数量,代表训练数据集中恶意用户样本的 数量。
步骤4.2:分别计算对于两种不同类别的各个特征的条件概率P(X(i)|Y1)和 P(X(i)|Y2),其中X(i)表示特征向量X中的第i个特征;
步骤4.3:分别计算各个特征的信息增益;
在信息论与概率统计中,熵是表示随机变量不确定性的度量。信息增益表 示得知特征X的信息而使得类Y的信息的不确定性减少的程度。特征A对训练 数据集D的信息增益g(D,A),定义为集合D的经验熵H(D)与特征A在给定条件 D的经验条件熵H(D|A)之差,即
g(D,A)=H(D)-H(D|A)
信息增益反映出了特征对分类结果的重要性程度。
步骤5:建立目标优化矩阵,根据各个特征信息增益排名,计算出各个特征 的权值;
步骤5.1:根据特征,构建目标优化矩阵;
步骤5.2:根据目标优化矩阵计算出各个特征的权值;
目标优化矩阵构建的过程如下:
首先,将特征向量包含的特征依次填入矩阵表的第一行和第一列。
其次,从纵轴的特征1开始,与横轴的特征2,特征3,一直到特征n逐一 进行比较。根据步骤4计算出的各个特征的信息增益,若特征1比特征2的信 息增益大,则在特征1和特征2相交的表格内填1,反之填0。其他特征之间比 较也是按照此规则。
最后,统计每行之和作为最后矩阵一列,得到目标优化矩阵。
各个特征权值获取方式如下:
利用附图2中的合计项计算权重,可能出现某项特征的合计为0,但实际上 该特征对于分类结果还是具有一定的重要性。所以权值计算公式如下:
某特征权值=1+(某特征的合计得分/所有特征的合计得分之和)
步骤6:根据步骤4计算的到的类的先验概率,各个特征的条件概率和步骤 5计算得到的各个特征的权值,计算测试数据的后验概率,公式如下:
其中j={1,2},q代表特征x(i)的权值。
将最大的后验概率对应的类作为测试数据的分类结果,如图分类结束。
以上这些实施例应理解为仅用于说明本发明而不用于限制本发明的保护范围。在阅读了本发明的记载的内容之后,技术人员可以对本发明作各种改动或修改, 这些等效变化和修饰同样落入本发明权利要求所限定的范围。
Claims (8)
1.一种基于特征加权的朴素贝叶斯微博用户分类方法,其特征在于,包括以下步骤:
步骤1:获取微博用户信息,组建数据列表;
步骤2:对步骤1中得到的微博用户信息数据进行离散化处理,得到数据集;
步骤3:将数据集分为训练数据集和测试数据集;
步骤4:对于训练数据集,计算微博用户所属类别的先验概率,以及各个特征的条件概率和信息增益;
步骤5:采用改进朴素贝叶斯分类算法,改进点主要在于,通过计算各个特征的信息增益,获知各个特征对于分类结果的重要性,构建目标优化矩阵,根据各个特征信息的增益排名,确定每个特征的权值;
步骤6:计算测试数据的后验概率,并将最大后验概率对应的类作为分类结果。
2.根据权利要求1所述的基于特征加权的朴素贝叶斯微博用户分类方法,其特征在于,所述步骤1:获取微博用户信息,组建数据列表,具体包括:
步骤1.1:关注目标用户包括正常用户和恶意用户的微博;
步骤1.2:记录这些目标用户的基本特征信息,包括:粉丝数,关注数,微博数,微博年龄,认证情况,阳光信用等级,用一个特征向量表示一个用户,构建数据集。
3.根据权利要求1或2所述的基于特征加权的朴素贝叶斯微博用户分类方法,其特征在于,所述步骤2对数据集采用分组法进行离散化处理,所述分组法的步骤包括:将每个特征的取值范围分为三个小段,每个小段分别用0,1,2表示。
4.根据权利要求1或2所述的基于特征加权的朴素贝叶斯微博用户分类方法,其特征在于,所述步骤3将数据集分为训练数据集和测试数据集,具体包括:将数据集随机打乱,分成十份,选取其中九份作为训练数据集,剩下一份作为测试数据集。
5.根据权利要求4所述的基于特征加权的朴素贝叶斯微博用户分类方法,其特征在于,所述步骤4对于训练数据集,计算微博用户所属类别的先验概率,以及各个特征的条件概率和信息增益;包括:
分别计算正常用户和恶意用户两种类别的先验概率P(Y1)和P(Y2),计算公式如下:
其中Y1代表正常用户,Y2代表恶意用户,N代表整个训练数据集样本的数量,NY1代表训练数据集中正常用户样本的数量,代表训练数据集中恶意用户样本的数量;
步骤4.2:分别计算对于两种不同类别的各个特征的条件概率P(X(i)|Y1)和P(X(i)|Y2),其中X(i)表示特征向量X中的第i个特征;
步骤4.3:分别计算各个特征的信息增益;
信息增益表示得知特征X的信息而使得类Y的信息的不确定性减少的程度,特征A对训练数据集D的信息增益g(D,A),定义为集合D的经验熵H(D)与特征A在给定条件D的经验条件熵H(D|A)之差,即
g(D,A)=H(D)-H(D|A)
信息增益反映出了特征对分类结果的重要性程度。
6.根据权利要求5所述的基于特征加权的朴素贝叶斯微博用户分类方法,其特征在于,所述步骤5的目标优化矩阵构建的过程如下:
首先,将特征向量包含的特征依次填入矩阵表的第一行和第一列;
其次,从纵轴的特征1开始,与横轴的特征2,特征3,一直到特征n逐一进行比较,根据计算出的各个特征的信息增益,若特征1比特征2的信息增益大,则在特征1和特征2相交的表格内填1,反之填0,其他特征之间比较也是按照此规则;
最后,统计每行之和作为最后矩阵一列,得到目标优化矩阵。
7.根据权利要求6所述的基于特征加权的朴素贝叶斯微博用户分类方法,其特征在于,所述各个特征权值获取方式如下:
利用合计项计算权重,可能出现某项特征的合计为0,但实际上该特征对于分类结果还是具有一定的重要性。所以权值计算公式如下:
某特征权值=1+(某特征的合计得分/所有特征的合计得分之和)。
8.根据权利要求6所述的基于特征加权的朴素贝叶斯微博用户分类方法,其特征在于,所述步骤6计算测试数据的后验概率,并将最大后验概率对应的类作为分类结果,具体包括:
根据步骤4计算的到的类的先验概率,各个特征的条件概率和步骤5计算得到的各个特征的权值,计算测试数据的后验概率,公式如下:
其中j={1,2},q代表特征x(i)的权值,将最大的后验概率对应的类作为测试数据的分类结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810443273.1A CN108596276A (zh) | 2018-05-10 | 2018-05-10 | 基于特征加权的朴素贝叶斯微博用户分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810443273.1A CN108596276A (zh) | 2018-05-10 | 2018-05-10 | 基于特征加权的朴素贝叶斯微博用户分类方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108596276A true CN108596276A (zh) | 2018-09-28 |
Family
ID=63636960
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810443273.1A Pending CN108596276A (zh) | 2018-05-10 | 2018-05-10 | 基于特征加权的朴素贝叶斯微博用户分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108596276A (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109583203A (zh) * | 2018-10-31 | 2019-04-05 | 武汉华中时讯科技有限责任公司 | 一种恶意用户检测方法、装置及系统 |
CN110072186A (zh) * | 2019-04-15 | 2019-07-30 | 哈尔滨工程大学 | 基于属性独立的加权朴素贝叶斯室内定位方法 |
CN110543904A (zh) * | 2019-08-26 | 2019-12-06 | 河北航天信息技术有限公司 | 一种基于贝叶斯的企业风险分类模型构建方法 |
CN111797942A (zh) * | 2020-07-23 | 2020-10-20 | 深圳壹账通智能科技有限公司 | 用户信息的分类方法及装置、计算机设备、存储介质 |
CN113742543A (zh) * | 2021-09-22 | 2021-12-03 | 中国银行股份有限公司 | 一种数据筛选方法、装置、电子设备及存储介质 |
CN114925759A (zh) * | 2022-05-12 | 2022-08-19 | 东北大学 | 一种以太坊钓鱼行为账户的特征分析方法 |
CN114925759B (zh) * | 2022-05-12 | 2024-07-12 | 东北大学 | 一种区块链钓鱼行为账户的特征分析方法 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102402566A (zh) * | 2011-08-09 | 2012-04-04 | 江苏欣网视讯科技有限公司 | 基于中文网页自动分类技术的Web用户行为分析方法 |
CN104751171A (zh) * | 2015-03-09 | 2015-07-01 | 中南大学 | 基于特征加权的朴素贝叶斯扫描证书图像分类方法 |
CN104778240A (zh) * | 2015-04-08 | 2015-07-15 | 重庆理工大学 | 基于多特征融合的微博文本数据分类方法 |
WO2016088942A1 (ko) * | 2014-12-01 | 2016-06-09 | 서울대학교산학협력단 | 쌍별 비교 데이터를 이용한 다중랭킹 추정 방법 및 장치 |
CN105930906A (zh) * | 2016-04-15 | 2016-09-07 | 上海大学 | 一种基于特征加权和改进贝叶斯算法的摔倒检测方法 |
CN105962931A (zh) * | 2015-03-13 | 2016-09-28 | 胡渐佳 | 学习场景分段记录方法和记录装置 |
CN106294590A (zh) * | 2016-07-29 | 2017-01-04 | 重庆邮电大学 | 一种基于半监督学习的社交网络垃圾用户过滤方法 |
CN106960390A (zh) * | 2017-01-03 | 2017-07-18 | 上海大学 | 基于节点聚合度的重叠社区划分方法 |
-
2018
- 2018-05-10 CN CN201810443273.1A patent/CN108596276A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102402566A (zh) * | 2011-08-09 | 2012-04-04 | 江苏欣网视讯科技有限公司 | 基于中文网页自动分类技术的Web用户行为分析方法 |
WO2016088942A1 (ko) * | 2014-12-01 | 2016-06-09 | 서울대학교산학협력단 | 쌍별 비교 데이터를 이용한 다중랭킹 추정 방법 및 장치 |
CN104751171A (zh) * | 2015-03-09 | 2015-07-01 | 中南大学 | 基于特征加权的朴素贝叶斯扫描证书图像分类方法 |
CN105962931A (zh) * | 2015-03-13 | 2016-09-28 | 胡渐佳 | 学习场景分段记录方法和记录装置 |
CN104778240A (zh) * | 2015-04-08 | 2015-07-15 | 重庆理工大学 | 基于多特征融合的微博文本数据分类方法 |
CN105930906A (zh) * | 2016-04-15 | 2016-09-07 | 上海大学 | 一种基于特征加权和改进贝叶斯算法的摔倒检测方法 |
CN106294590A (zh) * | 2016-07-29 | 2017-01-04 | 重庆邮电大学 | 一种基于半监督学习的社交网络垃圾用户过滤方法 |
CN106960390A (zh) * | 2017-01-03 | 2017-07-18 | 上海大学 | 基于节点聚合度的重叠社区划分方法 |
Non-Patent Citations (4)
Title |
---|
YUN LIU 等: "Research on micro-blog character analysis based on Naive Bayes", 《PROCEEDINGS OF SPIE》 * |
刘磊 等: "基于特征加权朴素贝叶斯分类算法的网络用户识别", 《计算机应用》 * |
宋健: "城市信息化风险管理研究", 《中国博士学位论文全文数据库 经济与管理科学辑》 * |
居友道: "基于改进朴素贝叶斯算法的Android恶意软件检测", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109583203A (zh) * | 2018-10-31 | 2019-04-05 | 武汉华中时讯科技有限责任公司 | 一种恶意用户检测方法、装置及系统 |
CN109583203B (zh) * | 2018-10-31 | 2020-10-16 | 武汉华中时讯科技有限责任公司 | 一种恶意用户检测方法、装置及系统 |
CN110072186A (zh) * | 2019-04-15 | 2019-07-30 | 哈尔滨工程大学 | 基于属性独立的加权朴素贝叶斯室内定位方法 |
CN110543904A (zh) * | 2019-08-26 | 2019-12-06 | 河北航天信息技术有限公司 | 一种基于贝叶斯的企业风险分类模型构建方法 |
CN111797942A (zh) * | 2020-07-23 | 2020-10-20 | 深圳壹账通智能科技有限公司 | 用户信息的分类方法及装置、计算机设备、存储介质 |
CN113742543A (zh) * | 2021-09-22 | 2021-12-03 | 中国银行股份有限公司 | 一种数据筛选方法、装置、电子设备及存储介质 |
CN113742543B (zh) * | 2021-09-22 | 2024-02-23 | 中国银行股份有限公司 | 一种数据筛选方法、装置、电子设备及存储介质 |
CN114925759A (zh) * | 2022-05-12 | 2022-08-19 | 东北大学 | 一种以太坊钓鱼行为账户的特征分析方法 |
CN114925759B (zh) * | 2022-05-12 | 2024-07-12 | 东北大学 | 一种区块链钓鱼行为账户的特征分析方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11659050B2 (en) | Discovering signature of electronic social networks | |
CN108596276A (zh) | 基于特征加权的朴素贝叶斯微博用户分类方法 | |
WO2022141861A1 (zh) | 情感分类方法、装置、电子设备及存储介质 | |
EP2866421B1 (en) | Method and apparatus for identifying a same user in multiple social networks | |
US8990208B2 (en) | Information management and networking | |
US20150161529A1 (en) | Identifying Related Events for Event Ticket Network Systems | |
CN106817251B (zh) | 一种基于节点相似度的链路预测方法及装置 | |
CN108182634A (zh) | 一种借贷预测模型的训练方法、借贷预测方法和装置 | |
CN106940732A (zh) | 一种面向微博的疑似水军发现方法 | |
CN108717459B (zh) | 一种面向用户评论信息的移动应用缺陷定位方法 | |
Ahmed et al. | Discovering diverse, high quality design ideas from a large corpus | |
CN109902823B (zh) | 一种基于生成对抗网络的模型训练方法及设备 | |
CN113569129A (zh) | 点击率预测模型处理方法、内容推荐方法、装置及设备 | |
CN106681989A (zh) | 一种预测微博转发概率的方法 | |
CN110825868A (zh) | 一种基于话题热度的文本推送方法、终端设备及存储介质 | |
Liang et al. | MOPSO-based CNN for keyword selection on google ads | |
CN115392237A (zh) | 情感分析模型训练方法、装置、设备及存储介质 | |
Li et al. | A credit risk model with small sample data based on G-XGBoost | |
Wei et al. | Using network flows to identify users sharing extremist content on social media | |
CN107239562A (zh) | 基于概率特征关联的舆情分析方法 | |
CN114510645B (zh) | 一种基于提取有效多目标群组来解决长尾推荐问题的方法 | |
Mahalakshmi et al. | Twitter sentiment analysis using conditional generative adversarial network | |
CN112434126B (zh) | 一种信息处理方法、装置、设备和存储介质 | |
US11463461B2 (en) | Unequal probability sampling based on a likelihood model score to evaluate prevalence of inappropriate entities | |
Wang et al. | [Retracted] Prediction of Sports Performance and Analysis of Influencing Factors Based on Machine Learning and Big Data Statistics |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180928 |