CN104933191A - 一种基于贝叶斯算法的垃圾评论识别方法、系统及终端 - Google Patents
一种基于贝叶斯算法的垃圾评论识别方法、系统及终端 Download PDFInfo
- Publication number
- CN104933191A CN104933191A CN201510402429.8A CN201510402429A CN104933191A CN 104933191 A CN104933191 A CN 104933191A CN 201510402429 A CN201510402429 A CN 201510402429A CN 104933191 A CN104933191 A CN 104933191A
- Authority
- CN
- China
- Prior art keywords
- comment
- spam
- content
- bayesian algorithm
- new
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
Abstract
本发明公开了一种基于贝叶斯算法的垃圾评论识别方法、系统及终端,步骤如下:将一定数量且确定为正常评论的内容输入到贝叶斯算法的训练集中进行训练,以新评论的内容为关键词,在原有评论库中通过搜索引擎进行搜索;再者检测原有评论库中的评论与新评论的相似度以及数量,根据相似度即数量确定新评论是否为嫌疑垃圾评论;将被判定为嫌疑垃圾评论的新评论的内容输入到贝叶斯算法中进行判定,确定是否为正常评论。本发明结合搜索引擎和贝叶斯算法,能够在没有之前的垃圾评论内容做参照的情况下,在大量的评论中,智能的将垃圾评论挖掘识别出来。避免了纯贝叶斯算法需要依赖于以前的垃圾评论内容,不能智能识别出新的变种的垃圾评论内容的现象。
Description
技术领域
本发明涉及网络安全技术,特别涉及一种基于贝叶斯算法的垃圾评论识别方法、系统及终端。
背景技术
近年来,随着因特网的快速发展,人们发表观点以及相互交流的方式也发生了改变,网络已经成为人们获取知识、交流沟通、发布信息的主要工具,对于当今视频网站、博客、微博、电子商务等互动式平台的发展,评论中信息的挖掘越来越受到关注,人们在观看视频,阅读博客、微博或者在电子商务平台上购买商品后,通常会做出相应的评论,表达自己的观点,例如视频的评论可以反映观看者对于视频的观看后的感觉,博文或者微博评论可以反映阅读者对博文的观点以及对发布者的情感表达,商品评论可以分析出购买者对商品的满意度,供后来者参考。
但是针对相关互动式平台,特别是较为出名的网站或者人气较高的发布者发布的信息,有些用户为谋取私利或者破坏社会稳定,经常发布一些垃圾评论,例如,无关的广告评论、推销评论、含有政治、暴力、色情等评论内容。传统的垃圾评论识别方法主要是通过各种用户特征如关键词来搜索评论本身所携带的内容以检测垃圾评论,在识别后进行事先屏蔽或者事后删除。但是在网站中垃圾评论和正常评论在形式上有时并无区别,而且垃圾评论者可以通过将关键词替换为谐音字词来刻意规避该关键词搜索,很容易被恶意评论这绕过。现有的各种网络系统中,一般是根据贝叶斯算法判别评论内容是否为垃圾评论,贝叶斯算法是统计学的一种分类方法,它是一类利用概率统计知识进行分类的算法,通过这种算法对评论内容进行判别时,可以将恶意评论者想得到的关键词替换内容也作为训练样本输入到贝叶斯算法的训练集,恶意评论者很难通过关键词的替换来绕过识别,具有判别精度更高的优点。但是贝叶斯算法需要根据已有的垃圾评论内容做基础,从而判断新的评论内容是否正常,那就会面临一个问题,如果恶意评论者发的是一条和已有的垃圾内容差别很大的内容,则贝叶斯算法将无法直接识别出来。
发明内容
本发明的目的在于克服现有技术的缺点与不足,提供一种基于贝叶斯算法的垃圾评论识别方法,该识别方法结合搜索引擎和贝叶斯算法,能够在没有之前的垃圾评论内容做参照的情况下,在大量的评论中,智能的将垃圾评论挖掘识别出来。
本发明的第二目的在于,提供一种用于实现上述方法的基于贝叶斯算法的垃圾评论识别系统。
本发明的第三目的在于,提供一种终端。
本发明的第一目的通过下述技术方案实现:一种基于贝叶斯算法的垃圾评论识别方法,步骤如下:
选择一定数量并且确定为正常评论的内容加入到贝叶斯算法的训练集中进行训练;以新评论的内容作为关键词,通过搜索引擎在原有评论库中进行搜索;
检测在原有评论库中搜索到的评论与新评论的相似度以及数量,当在原有评论库中搜索到和新评论内容的相似度达到预设的第一阈值且数量达到预设的第二阈值的评论时,则将该新评论以及与该新评论相似度达到预设的第一阈值的评论判定为嫌疑垃圾评论;
将被判定为嫌疑垃圾评论的新评论的内容输入到贝叶斯算法中进行判定,若判定结果为该新评论为正常评论的概率达到预设的第三阈值时,则将该新评论判定为正常评论,否则判定为垃圾评论。
优选的,所述选取输入到贝叶斯算法的训练集中进行训练的正常评论的数量为10万条以上。
优选的,原有评论库中的评论与新评论的相似度指的是:新评论和原有评论库中的评论的内容中相同文字的数量与新评论内容中文字总量之间的比值。
优选的,所述预设的第一阈值为80%。
优选的,所述预设的第二阈值200条。
优选的,所述预设的第三阈值为80%。
优选的,还包括以下步骤:当新评论被判定为垃圾评论时,拦截该新评论的内容。
本发明的第二目的通过下述技术方案实现:一种基于贝叶斯算法的垃圾评论识别系统,包括
获取模块,用于获取一定数量并且确定为正常评论的内容,然后输入到贝叶斯算法的训练集中进行训练;
原有评论库,用于存放所有的评论内容的数据库,为原有的数据库;
搜索引擎模块,用于以新评论的内容作为关键词,在原有评论库进行搜索;
相似度检测模块,用于检测搜索引擎模块搜索到原有评论库中的评论和新评论之间的相似度;
数量检测模块,用于检测原有评论库中与新评论内容的相似度达到预设的第一阈值的评论的数量;
嫌疑垃圾评论判定模块,用于在原有评论库中搜索到和新评论的内容的相似度达到预设的第一阈值且数量达到预设的第二阈值的评论时,将新评论以及与该新评论相似度达到预设的第一阈值的评论判定为嫌疑垃圾评论;
以及垃圾评论判定模块,用于将被判定为嫌疑垃圾评论的新评论的内容输入到贝叶斯算法中进行判定,若判定结果为该新评论为正常评论的概率达到预设的第三阈值时,则将该新评论判定为正常评论,否则判定为垃圾评论。
优选的,还包括拦截模块,用于在所述垃圾评论判定模块判定新评论为垃圾评论时,拦截该新评论的内容。
本发明的第三目的通过下述技术方案实现:一种终端,包括上述所述的基于贝叶斯算法的垃圾评论识别系统。
本发明相对于现有技术具有如下的优点及效果:
本发明首先选择一定数量并且确定为正常评论的内容加入到贝叶斯算法的训练集中进行训练;以新评论的内容作为关键词,通过搜索引擎在原有评论库中进行搜索;检测原有评论库中的评论与新评论的相似度以及数量,当在原有评论库中搜索到和新评论内容的相似度达到预设的第一阈值且数量达到预设的第二阈值的评论时,则将该新评论以及与该新评论相似度达到预设的第一阈值的评论判定为嫌疑垃圾评论;将被判定为嫌疑垃圾评论的新评论的内容输入到贝叶斯算法中进行判定,若判定结果为该新评论为正常评论的概率达到预设的第三阈值时,则将该新评论判定为正常评论,否则判定为垃圾评论。本发明首先通过搜索引擎搜索原有评论库,根据相似度判断新评论是否为嫌疑垃圾评论,针对嫌疑垃圾评论再进一步通过贝叶斯算法进行判断,最终确定新评论是否为垃圾评论。本发明结合搜索引擎和贝叶斯算法,并且建立正常评论的训练集,因此能够在没有之前的垃圾评论内容做参照的情况下,在大量的评论中,智能的将垃圾评论挖掘识别出来。避免了纯贝叶斯算法需要依赖于以前的垃圾评论内容,不能智能识别出新的变种垃圾评论内容的现象。能够有效识别出垃圾评论,降低各种垃圾广告对用户的干扰,提升用户体验。
附图说明
图1是本发明实施例1方法的流程图。
图2是本发明实施例2系统的组成框图。
具体实施方式
下面结合实施例及附图对本发明作进一步详细的描述,但本发明的实施方式不限于此。
实施例1
如图1所示,本实施例公开了一种基于贝叶斯算法的垃圾评论识别方法,步骤如下:
选择一定数量并且确定为正常评论的内容加入到贝叶斯算法的训练集中进行训练;本步骤中选取输入到贝叶斯算法训练集中进行训练的正常评论的数量为10万条以上,一般是10至50万条。
以新评论的内容作为关键词,通过搜索引擎在原有评论库中进行搜索;
检测在原有评论库中搜索到的评论与新评论的相似度以及数量,当在原有评论库中搜索到和新评论的内容的相似度达到预设的第一阈值且数量达到预设的第二阈值的评论时,则将该新评论和与该新评论相似度达到预设的第一阈值的评论判定为嫌疑垃圾评论,否则将新评论判定为正常评论;其中本实施例中预设的第一阈值为80%,预设的第二阈值为200条。
将被判定为嫌疑垃圾评论的新评论的内容输入到贝叶斯算法中进行判定,若判定结果为该新评论为正常评论的概率达到预设的第三阈值时,则将该新评论判定为正常评论,否则判定为垃圾评论。在本实施例中预设的第三阈值为80%。
当新评论被判定为垃圾评论时,拦截该新评论的内容。
本实施例上述步骤中,原有评论库中的评论与新评论的相似度指的是:新评论和原有评论库中的评论内容中相同文字的数量与新评论内容中文字总量之间的比值。例如新评论的内容有10个字,如果原有评论库里至少有200条评论的内容有至少8个字与这条新评论重合,那么我们认为原有评论库中这200条评论和这条新评论都是有嫌疑的。这样做的理由是,垃圾评论一般都会批量的发,所以如果发现系统中涌进来大量类似的评论,那很可能是垃圾评论。
本实施例上述识别方法首先通过搜索引擎搜索原有评论库,根据相似度判断新评论是否为嫌疑垃圾评论,针对嫌疑垃圾评论再进一步通过贝叶斯算法进行判断,最终确定新评论是否为垃圾评论。本实施例上述识别方法结合搜索引擎和贝叶斯算法,能够在没有之前的垃圾评论内容做参照的情况下,在大量的评论中,智能的将垃圾评论挖掘识别出来。避免了纯贝叶斯算法需要依赖于以前的垃圾评论内容,不能智能识别出新的变种的垃圾评论内容的现象。能够有效识别出垃圾评论,降低各种垃圾广告对用户的干扰,提升用户体验。
实施例2
如图2所示,本实施例还公开了一种用于实现上述识别方法的基于贝叶斯算法的垃圾评论识别系统,其包括
获取模块,用于获取一定数量并且确定为正常评论的内容,然后输入到贝叶斯算法的训练集中进行训练;
原有评论库,用于所有评论内容的数据库,是系统原有的数据库;
搜索引擎模块,用于以新评论的内容作为关键词,在原有评论库中搜索评论的内容;
相似度检测模块,用于检测搜索引擎模块搜索到原有评论库中的评论和新评论之间的相似度;
数量检测模块,用于检测原有评论库中与新评论内容的相似度达到预设的第一阈值的评论的数量;
嫌疑垃圾评论判定模块,用于在原有评论库中搜索到和新评论的内容的相似度达到预设的第一阈值且数量达到预设的第二阈值的评论时,将新评论和与该新评论相似度达到预设的第一阈值的评论判定为嫌疑垃圾评论;本实施例中预设的第一阈值为80%,预设的第二阈值为200条。
垃圾评论判定模块,用于将被判定为嫌疑垃圾评论的新评论的内容输入到贝叶斯算法中进行判定,若判定结果为该新评论为正常评论的概率达到预设的第三阈值时,则将该新评论判定为正常评论,否则判定为垃圾评论。在本实施例中预设的第三阈值为80%。
拦截模块,用于在垃圾评论判定模块判定新评论为垃圾评论时,拦截该新评论的内容。以阻值垃圾评论的发布。
实施例3
本实施例还公开了一种包括上述基于贝叶斯算法的垃圾评论识别系统的终端。该终端可以为手机、平板电脑和计算机。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。
Claims (10)
1.一种基于贝叶斯算法的垃圾评论识别方法,其特征在于,步骤如下:
选择一定数量并且确定为正常评论的内容加入到贝叶斯算法的训练集中进行训练;
以新评论的内容作为关键词,通过搜索引擎在原有评论库中进行搜索;
检测在原有评论库中搜索到的评论与新评论的相似度以及数量,当在原有评论库中搜索到和新评论内容的相似度达到预设的第一阈值且数量达到预设的第二阈值的评论时,则将该新评论以及与该新评论相似度达到预设的第一阈值的评论判定为嫌疑垃圾评论;
将被判定为嫌疑垃圾评论的新评论的内容输入到贝叶斯算法中进行判定,若判定结果为该新评论为正常评论的概率达到预设的第三阈值时,则将该新评论判定为正常评论,否则判定为垃圾评论。
2.根据权利要求1所述的基于贝叶斯算法的垃圾评论识别方法,其特征在于,所述选取输入到贝叶斯算法的训练集中进行训练的正常评论的数量为10万条以上。
3.根据权利要求1所述的基于贝叶斯算法的垃圾评论识别方法,其特征在于,原有评论库中的评论与新评论的相似度指的是:新评论和原有评论库中的评论的内容中相同文字的数量与新评论内容中文字总量之间的比值。
4.根据权利要求1所述的基于贝叶斯算法的垃圾评论识别方法,其特征在于,所述预设的第一阈值为80%。
5.根据权利要求1所述的基于贝叶斯算法的垃圾评论识别方法,其特征在于,所述预设的第二阈值200条。
6.根据权利要求1所述的基于贝叶斯算法的垃圾评论识别方法,其特征在于,所述预设的第三阈值为80%。
7.根据权利要求1所述的基于贝叶斯算法的垃圾评论识别方法,其特征在于,还包括以下步骤:当新评论被判定为垃圾评论时,拦截该新评论的内容。
8.一种基于贝叶斯算法的垃圾评论识别系统,其特征在于,包括
获取模块,用于获取一定数量并且确定为正常评论的内容,然后输入到贝叶斯算法的训练集中进行训练;
原有评论库,用于存放所有的评论内容的数据库,为原有的数据库;
搜索引擎模块,用于以新评论的内容作为关键词,在原有评论库进行搜索;
相似度检测模块,用于检测搜索引擎模块搜索到原有评论库中的评论和新评论之间的相似度;
数量检测模块,用于检测原有评论库中与新评论内容的相似度达到预设的第一阈值的评论的数量;
嫌疑垃圾评论判定模块,用于在原有评论库中搜索到和新评论的内容的相似度达到预设的第一阈值且数量达到预设的第二阈值的评论时,将新评论以及与该新评论相似度达到预设的第一阈值的评论判定为嫌疑垃圾评论;
以及垃圾评论判定模块,用于将被判定为嫌疑垃圾评论的新评论的内容输入到贝叶斯算法中进行判定,若判定结果为该新评论为正常评论的概率达到预设的第三阈值时,则将该新评论判定为正常评论,否则判定为垃圾评论。
9.根据权利要求7所述的基于贝叶斯算法的垃圾评论识别系统,其特征在于,还包括拦截模块,用于在所述垃圾评论判定模块判定新评论为垃圾评论时,拦截该新评论的内容。
10.一种终端,其特征在于,包括权利要求8或9所述的基于贝叶斯算法的垃圾评论识别系统。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510402429.8A CN104933191A (zh) | 2015-07-09 | 2015-07-09 | 一种基于贝叶斯算法的垃圾评论识别方法、系统及终端 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510402429.8A CN104933191A (zh) | 2015-07-09 | 2015-07-09 | 一种基于贝叶斯算法的垃圾评论识别方法、系统及终端 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN104933191A true CN104933191A (zh) | 2015-09-23 |
Family
ID=54120358
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510402429.8A Pending CN104933191A (zh) | 2015-07-09 | 2015-07-09 | 一种基于贝叶斯算法的垃圾评论识别方法、系统及终端 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104933191A (zh) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106708966A (zh) * | 2016-11-29 | 2017-05-24 | 中国计量大学 | 基于相似度计算的垃圾评论检测方法 |
CN106777341A (zh) * | 2017-01-13 | 2017-05-31 | 广东欧珀移动通信有限公司 | 信息处理方法、装置及计算机设备 |
CN106844349A (zh) * | 2017-02-14 | 2017-06-13 | 广西师范大学 | 基于协同训练的垃圾评论识别方法 |
CN106960012A (zh) * | 2017-03-01 | 2017-07-18 | 云南大学 | 一种跨领域垃圾评价识别的方法 |
CN107229608A (zh) * | 2016-03-23 | 2017-10-03 | 阿里巴巴集团控股有限公司 | 垃圾评论识别方法和装置 |
CN107239512A (zh) * | 2017-05-18 | 2017-10-10 | 华中科技大学 | 一种结合评论关系网络图的微博垃圾评论识别方法 |
CN109344388A (zh) * | 2018-08-02 | 2019-02-15 | 中央电视台 | 一种垃圾评论识别方法、装置及计算机可读存储介质 |
CN109902179A (zh) * | 2019-03-04 | 2019-06-18 | 上海宝尊电子商务有限公司 | 基于自然语言处理的筛选电商垃圾评论的方法 |
CN110175851A (zh) * | 2019-02-28 | 2019-08-27 | 腾讯科技(深圳)有限公司 | 一种作弊行为检测方法及装置 |
CN111242647A (zh) * | 2020-01-20 | 2020-06-05 | 南京财经大学 | 一种基于电商评论识别恶意用户的方法 |
CN113127640A (zh) * | 2021-03-12 | 2021-07-16 | 嘉兴职业技术学院 | 一种基于自然语言处理的恶意垃圾评论攻击识别方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101159704A (zh) * | 2007-10-23 | 2008-04-09 | 浙江大学 | 基于微内容相似度的反垃圾方法 |
WO2010117581A1 (en) * | 2009-04-08 | 2010-10-14 | Google Inc. | Similarity-based feature set supplementation for classification |
CN103198161A (zh) * | 2013-04-28 | 2013-07-10 | 中国科学院计算技术研究所 | 微博水军识别方法与设备 |
CN103226576A (zh) * | 2013-04-01 | 2013-07-31 | 杭州电子科技大学 | 基于语义相似度的垃圾评论过滤方法 |
CN103634473A (zh) * | 2013-12-05 | 2014-03-12 | 南京理工大学连云港研究院 | 基于朴素贝叶斯分类的手机垃圾短信过滤方法与系统 |
-
2015
- 2015-07-09 CN CN201510402429.8A patent/CN104933191A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101159704A (zh) * | 2007-10-23 | 2008-04-09 | 浙江大学 | 基于微内容相似度的反垃圾方法 |
WO2010117581A1 (en) * | 2009-04-08 | 2010-10-14 | Google Inc. | Similarity-based feature set supplementation for classification |
CN103226576A (zh) * | 2013-04-01 | 2013-07-31 | 杭州电子科技大学 | 基于语义相似度的垃圾评论过滤方法 |
CN103198161A (zh) * | 2013-04-28 | 2013-07-10 | 中国科学院计算技术研究所 | 微博水军识别方法与设备 |
CN103634473A (zh) * | 2013-12-05 | 2014-03-12 | 南京理工大学连云港研究院 | 基于朴素贝叶斯分类的手机垃圾短信过滤方法与系统 |
Non-Patent Citations (1)
Title |
---|
刘星: "基于融合分类器的垃圾评论识别方法研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107229608A (zh) * | 2016-03-23 | 2017-10-03 | 阿里巴巴集团控股有限公司 | 垃圾评论识别方法和装置 |
CN106708966B (zh) * | 2016-11-29 | 2023-04-25 | 中国计量大学 | 基于相似度计算的垃圾评论检测方法 |
CN106708966A (zh) * | 2016-11-29 | 2017-05-24 | 中国计量大学 | 基于相似度计算的垃圾评论检测方法 |
CN106777341A (zh) * | 2017-01-13 | 2017-05-31 | 广东欧珀移动通信有限公司 | 信息处理方法、装置及计算机设备 |
CN106844349A (zh) * | 2017-02-14 | 2017-06-13 | 广西师范大学 | 基于协同训练的垃圾评论识别方法 |
CN106844349B (zh) * | 2017-02-14 | 2019-10-18 | 广西师范大学 | 基于协同训练的垃圾评论识别方法 |
CN106960012A (zh) * | 2017-03-01 | 2017-07-18 | 云南大学 | 一种跨领域垃圾评价识别的方法 |
CN107239512A (zh) * | 2017-05-18 | 2017-10-10 | 华中科技大学 | 一种结合评论关系网络图的微博垃圾评论识别方法 |
CN109344388A (zh) * | 2018-08-02 | 2019-02-15 | 中央电视台 | 一种垃圾评论识别方法、装置及计算机可读存储介质 |
CN109344388B (zh) * | 2018-08-02 | 2023-06-09 | 中央电视台 | 一种垃圾评论识别方法、装置及计算机可读存储介质 |
CN110175851A (zh) * | 2019-02-28 | 2019-08-27 | 腾讯科技(深圳)有限公司 | 一种作弊行为检测方法及装置 |
CN110175851B (zh) * | 2019-02-28 | 2023-09-12 | 腾讯科技(深圳)有限公司 | 一种作弊行为检测方法及装置 |
CN109902179A (zh) * | 2019-03-04 | 2019-06-18 | 上海宝尊电子商务有限公司 | 基于自然语言处理的筛选电商垃圾评论的方法 |
CN111242647B (zh) * | 2020-01-20 | 2021-04-13 | 南京财经大学 | 一种基于电商评论识别恶意用户的方法 |
CN111242647A (zh) * | 2020-01-20 | 2020-06-05 | 南京财经大学 | 一种基于电商评论识别恶意用户的方法 |
CN113127640A (zh) * | 2021-03-12 | 2021-07-16 | 嘉兴职业技术学院 | 一种基于自然语言处理的恶意垃圾评论攻击识别方法 |
CN113127640B (zh) * | 2021-03-12 | 2022-11-29 | 嘉兴职业技术学院 | 一种基于自然语言处理的恶意垃圾评论攻击识别方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104933191A (zh) | 一种基于贝叶斯算法的垃圾评论识别方法、系统及终端 | |
US20240098157A1 (en) | System and method for automatic storyline construction based on determined breaking news | |
US11797620B2 (en) | Expert detection in social networks | |
US11153253B2 (en) | System and method for determining and delivering breaking news utilizing social media | |
Zhang et al. | A domain-feature enhanced classification model for the detection of Chinese phishing e-Business websites | |
CN104298719B (zh) | 基于社交行为进行用户的类别划分、广告投放方法和系统 | |
Ratkiewicz et al. | Detecting and tracking political abuse in social media | |
US9292877B2 (en) | Methods and systems for generating concept-based hash tags | |
US20160359791A1 (en) | Computerized notification system and method for delivering breaking news content | |
CN106250513A (zh) | 一种基于事件建模的事件个性化分类方法及系统 | |
CN104573016A (zh) | 一种基于行业的垂直舆情分析系统及方法 | |
CN103544188A (zh) | 移动互联网内容的用户偏好推送方法与装置 | |
CN105989077B (zh) | 一种基于推荐的兴趣社区用户引导方法 | |
CN106570020A (zh) | 用于提供推荐信息的方法和装置 | |
CN107679069A (zh) | 基于新闻数据及相关评论信息的一种特定群体发现方法 | |
Zhou et al. | An intelligent video tag recommendation method for improving video popularity in mobile computing environment | |
CN109101505A (zh) | 一种推荐方法、推荐装置和用于推荐的装置 | |
CN103955480A (zh) | 一种用于确定用户所对应的目标对象信息的方法与设备 | |
CN106383862A (zh) | 一种违规短信检测方法及系统 | |
CN103412880A (zh) | 一种用于确定多媒体资源间隐式关联信息的方法与设备 | |
Raja et al. | Fake news detection on social networks using Machine learning techniques | |
Bhatia et al. | Debunking online reputation rumours using hybrid of lexicon-based and machine learning techniques | |
CN114915468A (zh) | 基于知识图谱的网络犯罪智能分析检测方法 | |
CN105808602B (zh) | 一种垃圾信息的检测方法及装置 | |
CN103389981A (zh) | 网络标签自动识别方法及其系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Address after: 523860 No. 18, Wu Sha Beach Road, Changan Town, Dongguan, Guangdong Applicant after: OPPO Guangdong Mobile Communications Co., Ltd. Address before: 523860 No. 18, Wu Sha Beach Road, Changan Town, Dongguan, Guangdong Applicant before: Guangdong OPPO Mobile Communications Co., Ltd. |
|
CB02 | Change of applicant information | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20150923 |
|
RJ01 | Rejection of invention patent application after publication |