CN110457630B - 一种开源社区异常点赞用户的识别方法及系统 - Google Patents
一种开源社区异常点赞用户的识别方法及系统 Download PDFInfo
- Publication number
- CN110457630B CN110457630B CN201910694279.0A CN201910694279A CN110457630B CN 110457630 B CN110457630 B CN 110457630B CN 201910694279 A CN201910694279 A CN 201910694279A CN 110457630 B CN110457630 B CN 110457630B
- Authority
- CN
- China
- Prior art keywords
- user
- praise
- item
- decision tree
- attribute data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000002159 abnormal effect Effects 0.000 title claims abstract description 45
- 238000000034 method Methods 0.000 title claims abstract description 34
- 238000003066 decision tree Methods 0.000 claims abstract description 54
- 238000013145 classification model Methods 0.000 claims abstract description 37
- 238000012549 training Methods 0.000 claims abstract description 18
- 239000013598 vector Substances 0.000 claims description 15
- 230000002349 favourable effect Effects 0.000 claims description 10
- 230000000694 effects Effects 0.000 claims description 9
- 238000012163 sequencing technique Methods 0.000 claims description 3
- 230000002547 anomalous effect Effects 0.000 claims 4
- 230000008901 benefit Effects 0.000 description 4
- 238000011161 development Methods 0.000 description 4
- 230000008520 organization Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 2
- 238000005065 mining Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000001680 brushing effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/958—Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/50—Network services
- H04L67/535—Tracking the activity of the user
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Databases & Information Systems (AREA)
- Marketing (AREA)
- Artificial Intelligence (AREA)
- Tourism & Hospitality (AREA)
- Primary Health Care (AREA)
- General Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- General Health & Medical Sciences (AREA)
- Economics (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Strategic Management (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Computer Hardware Design (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种开源社区异常点赞用户的识别方法及系统,属于异常用户识别技术领域,解决了现有技术中对开源社区异常点赞用户识别率低的问题。该方法包括以下步骤:获取样本用户数据;根据样本用户数据构建决策树,训练得到决策树分类模型;利用决策树分类模型对待识别用户进行分类,确定用户类别;用户类别包括正常点赞用户和异常点赞用户。本发明根据用户属性和用户点赞项目属性,能够更精确的识别出异常点赞用户,以净化开源社区环境。
Description
技术领域
本发明涉及异常用户识别技术领域,尤其涉及一种开源社区异常点赞用户的识别方法及系统。
背景技术
随着计算机行业的不断发展,开源社区逐渐成为开发者进行学习的重要场所。全球最知名的开源软件平台Github,受到大家的瞩目。目前,Github已经有超过两千八百万的注册用户和七千九百万的代码库,已经成为了世界上最大的代码存放网站和最火的开源社区。用户通过增加点赞数的方法评价一个项目。因此项目的点赞数成为了社区内用户对未接触项目的直观评价方法。目前,出现了点赞数异常增加的现象,项目持有人通过购买的方法增加项目的点赞数。着对于经常使用Github近期点赞数增加较多的项目榜单的用户来说,刷赞行为会对优质项目的挖掘造成阻碍。最终导致网站公信力下降,增加寻找高质量项目和优秀用户的成本,损害全体用户的利益。因此要筛选出这些异常的点赞用户,帮助社区净化点赞数反映项目质量的这一评价环境。
目前挖掘异常用户的方法多基于社交平台,一是通过选择账户注册的相关动作信息进行区分,包括关注的用户特征、账户注册时间、注册名称、注册所用的联系方式、注册的个人简介和兴趣选择等。二是通过选择账户发布消息的相关特征,包括用户在账户创建时间、账户在线时间、消息发布频率、消息回复频率和消息的长短等特征。某些专职于散布舆情或是发布广告的异常账户,比较容易在这类特征的算法下被筛选出来。三是通过选择用户之间的关联关系特征构建分类器,但是缺乏对开源社区的相关研究。
现有技术存在以下缺点:
一是现有技术中选取的用于判别点赞用户正常与否的相关信息数据较少,且关联性较低,导致对异常点赞用户识别率低。
二是选择用户之间的关联关系特征构建分类器,缺乏对开源社区的相关研究,无法更精确地识别异常点赞用户。
发明内容
鉴于上述的分析,本发明旨在提供一种开源社区异常点赞用户的识别方法及系统,用以解决现有识别异常用户方法对异常用户识别率低的问题。
一方面,本发明提供了一种开源社区异常点赞用户的识别方法,该方法包括以下步骤:获取样本用户数据;样本用户数据包括用户属性数据和点赞项目属性数据;根据样本用户数据构建决策树,训练得到决策树分类模型;利用决策树分类模型对待识别用户进行分类,确定用户类别;用户类别包括正常点赞用户和异常点赞用户。
进一步的,用户属性数据包括:用户类型、是否有公司、是否有博客、是否有地址、是否有邮箱、是否有个人简介、项目数量、公共代码段数量、粉丝数量、关注数量、非fork项目数量、获得点赞总数、点赞活动间隔和用户贡献数。
进一步的,点赞项目属性数据包括:点赞项目创建时间和点赞项目提交次数。
进一步的,点赞项目属性数据还包括:点赞总数、项目直接分支数、项目总分支数、订阅数、项目大小、最近更新时间、项目是否来自拷贝、项目是否有维基、项目是否有网页、项目描述长度、提交次数、贡献者人数、标签数量、发布数量、问题数量和拉取请求数量。
进一步的,通过下述流程确定所述决策树分类模型:
将样本用户数据中的用户属性数据、点赞项目属性数据和用户类别数值化;
将每一个用户数值化后的用户属性数据、点赞项目属性数据和用户类别作为特征向量里的元素,生成一个特征向量;
将特征向量导入决策树算法模型,训练得到决策树分类模型。
进一步的,通过下述方法训练得到决策树分类模型:
计算用户属性和点赞项目属性中每个属性的信息增益,并按信息增益大小进行降序排序,确定所有属性顺序;
选择信息增益最大的属性作为决策树的根节点,再按照所述顺序依次确定决策树子节点对应的属性;
直到所有决策树子节点下对应的用户类别一致,训练得到决策树分类模型。
进一步的,对待识别用户进行分类,通过将待识别用户的用户属性数据和点赞项目属性数据数值化,生成特征向量,导入所述决策树分类模型,确定用户类别。
根据上述技术方案,本发明的有益效果如下:
1、基于开源社区获取的用于判别点赞用户正常与否的相关信息数据较全面,包括用户属性数据和点赞项目属性数据,且关联性较高,根据上述相关信息数据构建的决策树分类模型,可以提高对异常点赞用户的识别率以及识别精度;
2、正常点赞用户和异常点赞用户的点赞项目创建时间属性和点赞项目提交次数属性差异很大,在识别点赞用户正常与否时,通过待识别用户的此两项属性数据也可快速确定点赞用户类别。
另一方面,本发明提供了一种开源社区异常点赞用户的识别系统,该系统包括:
样本用户数据获取模块,用于获取样本用户数据;所述样本用户数据包括用户属性数据和点赞项目属性数据;
决策树分类模型获得模块,用于根据所述获取的样本用户数据训练得到决策树分类模型;
待识别用户分类模块,用于根据所述决策树分类模型对待识别用户分类,确定用户类别;所述用户类别包括正常点赞用户和异常点赞用户。
进一步的,点赞项目属性数据包括:点赞项目创建时间和点赞项目提交次数。
进一步的,点赞项目属性数据还包括:点赞总数、项目直接分支数、项目总分支数、订阅数、项目大小、最近更新时间、项目是否来自拷贝、项目是否有维基、项目是否有网页、项目描述长度、提交次数、贡献者人数、标签数量、发布数量、问题数量和拉取请求数量。
由于本发明中的开源社区异常点赞用户的识别系统与上述开源社区异常点赞用户的识别方法原理相同,所以该系统也具有与上述识别方法相应的技术效果。
本发明的其他特征和优点将在随后的说明书中阐述,并且,部分优点可从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过说明书以及附图中所特别指出的内容中来实现和获得。
附图说明
附图仅用于示出具体实施例的目的,而并不认为是对本发明的限制,在整个附图中,相同的参考符号表示相同的部件。
图1为识别正常和异常点赞用户的方法示意图。
具体实施方式
下面结合附图来具体描述本发明的优选实施例,其中,附图构成本申请一部分,并与本发明的实施例一起用于阐释本发明的原理,并非用于限定本发明的范围。
方法实施例
本发明的一个具体实施例,公开了一种开源社区异常点赞用户的识别方法,如图1所示,该方法包括以下步骤:获取样本用户数据;样本用户数据包括用户属性数据和点赞项目属性数据;根据样本用户数据构建决策树,训练得到决策树分类模型;利用决策树分类模型对待识别用户进行分类,确定用户类别;用户类别包括正常点赞用户和异常点赞用户。
其中,获取的样本用户数据越多,训练得到的决策树分类模型对待识别用户识别的准确率越高,本发明中获取了360组样本用户数据,所训练得到的决策树分类模型对待识别用户识别的准确率达到99%以上。
具体的,用户属性数据包括:用户类型、是否有公司、是否有博客、是否有地址、是否有邮箱、是否有个人简介、项目数量、公共代码段数量、粉丝数量、关注数量、非fork项目数量、获得点赞总数、点赞活动间隔和用户贡献数;
正常点赞用户和异常点赞用户在上述用户属性上都有明显差异。其中,用户类型包括个人和组织两种类型,异常点赞用户是个人类型,组织类型的不进行点赞活动;是否有公司、是否有博客、是否有地址、是否有邮箱、是否有个人简介,属于用户个人信息,异常点赞用户的个人信息不够详细,而正常点赞用户的个人信息相对全面;
项目数量包括fork项目数量和非fork项目数量,fork项目数量指的是用户拷贝的其他用户的项目的数量,非fork项目数量是用户自己创建的项目数量,公共代码段数量是一种代码管理方法,用户保存一段公共代码,公共代码段数量就加一,相比与正常点赞用户,异常点赞用户主要工作是点赞,不是开发,所以项目数量和非fork的项目数量会偏少,公共代码段数量也会偏少;且由于异常点赞用户开发活动少、项目数量少,所以异常点赞用户获得的总赞数也少,用户贡献度也偏低;
对于粉丝数量、关注数量、点赞活动间隔(秒),相比于正常点赞用户,异常点赞用户主要工作不是开发和学习,与其他的用户互动不会太多,所以关注数量往往不多;由于用户贡献度低,粉丝数量也会偏少;由于异常用户的工作是点赞,且工作需求大,所以异常用户点赞间隔比较规律,且间隔时间较短,而正常点赞用户点赞间隔没有规律。
优选的,点赞项目属性数据包括:点赞项目创建时间和点赞项目提交次数;正常点赞用户点赞的项目创建时间远早于异常点赞用户点赞的项目,且点赞项目提交次数也远多于异常点赞用户点赞的项目提交次数。正常点赞用户和异常点赞用户的点赞项目创建时间和点赞项目提交次数两项属性差异很大,基于此两种点赞属性数据进行模型构建,并分类,能够极大提高训练及分类的效率,且由于该两种数据极大的代表了正常与异常点赞用户的特性,因此在提高效率的同时,分类准确度也能满足要求。
具体的,点赞项目属性数据还包括:点赞总数、项目直接分支数、项目总分支数、订阅数、项目大小、最近更新时间、项目是否来自拷贝、项目是否有维基、项目是否有网页、项目描述长度、提交次数、贡献者人数、标签数量、发布数量、问题数量和拉取请求数量;
其中,对于点赞总数、项目直接分支数、项目总分支数和订阅数,异常点赞用户和正常带你咱用户在这些点赞项目属性上有所差异。由于异常用户点赞的目的是为了刷赞,所以其点赞的项目质量相对较低,因而点赞项目获得的点赞总数较少、项目直接分支数、项目总分支数和订阅数也都相对较少,所以相对于正常点赞用户点赞的高质量项目,异常点赞用户点赞的项目上述四个属性数据都是偏低的;
对于项目创建时间(天)和最近更新时间(天):异常点赞用户点赞的项目往往是新建的,距今时间较短。
对于是否来自拷贝、项目大小、是否有维基、是否有网页、项目描述长度,这些属性都与项目质量相关,异常点赞用户点赞的项目质量相对较低,所以这些属性会与正常点赞用户所点赞的项目存在差异。
对于提交次数、贡献者人数、标签数量、发布数量、问题数量、拉取请求数量,正常点赞用户点赞的项目质量相对较高,而高质量的项目往往参与人数多,经历的更新和变化也较多,所以上述属性的数据相对较高,而异常点赞用户点赞的项目存在时间短,质量低,因此上述属性数据也会偏低。
在具体实施过程中,通过下述流程确定所述决策树分类模型:
将样本用户数据中的用户属性数据、点赞项目属性数据和用户类别数值化;
对于用户属性数据的数值化处理,对于用户类型,组织为1,个人为0;其他的个人信息,有为1,无为0;对于项目数量、公共代码段数量、粉丝数量、关注数量、非fork项目数量、获得总赞数、点赞活动间隔(秒)、用户贡献数这些属性的数据都是具体的数值,可以直接获取,不需进一步处理;
对于点赞项目属性的数值化处理,每一个用户都点赞了若干个项目,因此项目是否来自拷贝、是否有维基、是否有网页三个属性采用百分比,取大于50%对应的结果,若是则取值为1,若不是则取值为0;对于其它的点赞项目属性,直接获取数据后,再取用中位数;
对于用户类别,正常点赞用户取值为1,异常点赞用户取值为0。
将每一个用户数值化后的用户属性数据、点赞项目属性数据和用户类别作为特征向量里的元素,生成一个特征向量;
将特征向量导入决策树算法模型,训练得到决策树分类模型。
具体的,通过下述方法训练得到决策树分类模型:
计算用户属性和点赞项目属性中每个属性的信息增益,并按信息增益大小进行降序排序,确定所有属性顺序;
选择信息增益最大的属性作为决策树的根节点,再按照所述顺序依次确定决策树子节点对应的属性;
直到所有决策树子节点下对应的用户类别一致,训练得到决策树分类模型。优选的,决策树算法模型选用ID3方法。
利用训练得到的决策树分类模型,对待识别用户进行分类,通过将待识别用户的用户属性数据和点赞项目属性数据数值化,生成特征向量,导入所述决策树分类模型,确定用户类别。
本发明实施例中的开源社区异常点赞用户的识别方法,一方面,基于开源社区获取的用于判别点赞用户正常与否的相关信息数据较全面,包括用户属性数据和点赞项目属性数据,且关联性较高,根据上述相关信息数据构建的决策树分类模型,可以提高对异常点赞用户的识别率以及识别精度;另一方面,正常点赞用户和异常点赞用户的点赞项目创建时间属性和点赞项目提交次数属性差异很大,在识别点赞用户正常与否时,通过待识别用户的此两项属性数据也可快速确定点赞用户类别。
系统实施例
本发明的一个具体实施例,公开了一种开源社区异常点赞用户的识别系统,该系统包括:
样本用户数据获取模块,用于获取样本用户数据;所述样本用户数据包括用户属性数据和点赞项目属性数据;
决策树分类模型获得模块,用于根据所述获取的样本用户数据训练得到决策树分类模型;
待识别用户分类模块,用于根据所述决策树分类模型对待识别用户分类,确定用户类别;所述用户类别包括正常点赞用户和异常点赞用户。
优选的,点赞项目属性数据包括:点赞项目创建时间和点赞项目提交次数。
具体的,点赞项目属性数据还包括:点赞总数、项目直接分支数、项目总分支数、订阅数、项目大小、最近更新时间、项目是否来自拷贝、项目是否有维基、项目是否有网页、项目描述长度、提交次数、贡献者人数、标签数量、发布数量、问题数量和拉取请求数量。
本发明实施例中的开源社区异常点赞用户的识别系统,一方面,基于开源社区获取的用于判别点赞用户正常与否的相关信息数据较全面,包括用户属性数据和点赞项目属性数据,且关联性较高,根据上述相关信息数据构建的决策树分类模型,可以提高对异常点赞用户的识别率以及识别精度;另一方面,正常点赞用户和异常点赞用户的点赞项目创建时间属性和点赞项目提交次数属性差异很大,在识别点赞用户正常与否时,通过待识别用户的此两项属性数据也可快速确定点赞用户类别。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。
Claims (10)
1.一种开源社区异常点赞用户的识别方法,其特征在于,包括以下步骤:
获取样本用户数据;所述样本用户数据包括用户属性数据和点赞项目属性数据;所述用户属性数据包括用户类型、公共代码段数量和点赞活动间隔;所述点赞项目属性数据包括项目直接分支数、项目总分支数和拉取请求数量;
根据所述样本用户数据构建决策树,训练得到决策树分类模型;
利用所述决策树分类模型对待识别用户进行分类,确定用户类别;所述用户类别包括正常点赞用户和异常点赞用户。
2.根据权利要求1所述的一种开源社区异常点赞用户的识别方法,其特征在于,所述用户属性数据还包括:用户类型、是否有公司、是否有博客、是否有地址、是否有邮箱、是否有个人简介、项目数量、粉丝数量、关注数量、非fork项目数量、获得点赞总数和用户贡献数。
3.根据权利要求2所述的一种开源社区异常点赞用户的识别方法,其特征在于,所述点赞项目属性数据还包括:点赞项目创建时间和点赞项目提交次数。
4.根据权利要求3所述的一种开源社区异常点赞用户的识别方法,其特征在于,所述点赞项目属性数据还包括:点赞总数、订阅数、项目大小、最近更新时间、项目是否来自拷贝、项目是否有维基、项目是否有网页、项目描述长度、提交次数、贡献者人数、标签数量、发布数量、问题数量。
5.根据权利要求4所述的一种开源社区异常点赞用户的识别方法,其特征在于,通过下述流程确定所述决策树分类模型:
将所述样本用户数据中的用户属性数据、点赞项目属性数据和用户类别数值化;
将每一个用户数值化后的用户属性数据、点赞项目属性数据和用户类别作为特征向量里的元素,生成一个特征向量;
将所述特征向量导入决策树算法模型,训练得到决策树分类模型。
6.根据权利要求5所述的一种开源社区异常点赞用户的识别方法,其特征在于,通过下述方法训练得到决策树分类模型:
计算用户属性和点赞项目属性中每个属性的信息增益,并按信息增益大小进行降序排序,确定所有属性顺序;
选择信息增益最大的属性作为决策树的根节点,再按照所述顺序依次确定决策树子节点对应的属性;
直到所有决策树子节点下对应的用户类别一致,训练得到决策树分类模型。
7.根据权利要求6所述的一种开源社区异常点赞用户的识别方法,其特征在于,所述对待识别用户进行分类,通过将待识别用户的用户属性数据和点赞项目属性数据数值化,生成特征向量,导入所述决策树分类模型,确定用户类别。
8.一种开源社区异常点赞用户的识别系统,其特征在于,包括:
样本用户数据获取模块,用于获取样本用户数据;所述样本用户数据包括用户属性数据和点赞项目属性数据;所述用户属性数据包括用户类型、公共代码段数量和点赞活动间隔;所述点赞项目属性数据包括项目直接分支数、项目总分支数和拉取请求数量;
决策树分类模型获得模块,用于根据所述获取的样本用户数据训练得到决策树分类模型;
待识别用户分类模块,用于根据所述决策树分类模型对待识别用户分类,确定用户类别;所述用户类别包括正常点赞用户和异常点赞用户。
9.根据权利要求8所述的一种开源社区异常点赞用户的识别系统,其特征在于,所述点赞项目属性数据包括:点赞项目创建时间和点赞项目提交次数。
10.根据权利要求9所述的一种开源社区异常点赞用户的识别系统,其特征在于,所述点赞项目属性数据还包括:点赞总数、订阅数、项目大小、最近更新时间、项目是否来自拷贝、项目是否有维基、项目是否有网页、项目描述长度、提交次数、贡献者人数、标签数量、发布数量、问题数量。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910694279.0A CN110457630B (zh) | 2019-07-30 | 2019-07-30 | 一种开源社区异常点赞用户的识别方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910694279.0A CN110457630B (zh) | 2019-07-30 | 2019-07-30 | 一种开源社区异常点赞用户的识别方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110457630A CN110457630A (zh) | 2019-11-15 |
CN110457630B true CN110457630B (zh) | 2022-03-29 |
Family
ID=68483984
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910694279.0A Active CN110457630B (zh) | 2019-07-30 | 2019-07-30 | 一种开源社区异常点赞用户的识别方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110457630B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111310863B (zh) * | 2020-03-27 | 2023-09-08 | 北京奇艺世纪科技有限公司 | 一种用户检测方法、装置及电子设备 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1723636A1 (de) * | 2004-03-12 | 2006-11-22 | Siemens Aktiengesellschaft | Benutzer- und vokabularadaptive bestimmung von konfidenz- und rückweisungsschwellen |
CN103795592A (zh) * | 2014-01-21 | 2014-05-14 | 中国科学院信息工程研究所 | 网络水军的检测方法及装置 |
CN104573017A (zh) * | 2015-01-09 | 2015-04-29 | 北京网智天元科技股份有限公司 | 识别网络水军团体的方法及系统 |
CN105915555A (zh) * | 2016-06-29 | 2016-08-31 | 北京奇虎科技有限公司 | 网络异常行为的检测方法及系统 |
CN107895010A (zh) * | 2017-11-13 | 2018-04-10 | 华东师范大学 | 一种基于网络点赞检测网络水军的方法 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0680330A4 (en) * | 1993-01-22 | 1998-07-29 | Ludwig Inst Cancer Res | METHOD OF IDENTIFYING AND TREATING SUBJECTS CARRIING CANCER CELLS THAT EXPRESS HLA-C / MAGE-1 CLONE 10. |
JP4762107B2 (ja) * | 2006-10-19 | 2011-08-31 | 富士通株式会社 | 異常onu特定装置、異常onu特定プログラムおよび異常onu特定方法 |
CN100543701C (zh) * | 2007-12-25 | 2009-09-23 | 中兴通讯股份有限公司 | 一种实现嵌入式软件异常测试的方法及系统 |
CN106682114B (zh) * | 2016-12-07 | 2020-10-27 | 广东工业大学 | 一种融合用户信任关系和评论信息的个性化推荐方法 |
CN108304535B (zh) * | 2018-01-30 | 2021-07-30 | 深圳市富途网络科技有限公司 | 一种社区内容智能排序估算方法 |
CN109286659A (zh) * | 2018-08-18 | 2019-01-29 | 何世容 | 一种游戏程序推送方法、装置、终端及计算机存储介质 |
-
2019
- 2019-07-30 CN CN201910694279.0A patent/CN110457630B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1723636A1 (de) * | 2004-03-12 | 2006-11-22 | Siemens Aktiengesellschaft | Benutzer- und vokabularadaptive bestimmung von konfidenz- und rückweisungsschwellen |
CN103795592A (zh) * | 2014-01-21 | 2014-05-14 | 中国科学院信息工程研究所 | 网络水军的检测方法及装置 |
CN104573017A (zh) * | 2015-01-09 | 2015-04-29 | 北京网智天元科技股份有限公司 | 识别网络水军团体的方法及系统 |
CN105915555A (zh) * | 2016-06-29 | 2016-08-31 | 北京奇虎科技有限公司 | 网络异常行为的检测方法及系统 |
CN107895010A (zh) * | 2017-11-13 | 2018-04-10 | 华东师范大学 | 一种基于网络点赞检测网络水军的方法 |
Non-Patent Citations (1)
Title |
---|
基于用户行为的网络论坛水军检测研究与实现;吕晨;《中国优秀硕士学位论文全文数据库 信息科技辑》;20170715;正文第3-5章 * |
Also Published As
Publication number | Publication date |
---|---|
CN110457630A (zh) | 2019-11-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Morstatter et al. | A new approach to bot detection: striking the balance between precision and recall | |
CN110163647B (zh) | 一种数据处理方法及装置 | |
TWI665607B (zh) | Information push method and device | |
CN102483745B (zh) | 共同选择图像分类 | |
Tavares et al. | Scaling-laws of human broadcast communication enable distinction between human, corporate and robot twitter users | |
Gómez et al. | A likelihood-based framework for the analysis of discussion threads | |
CN104965890A (zh) | 广告推荐的方法和装置 | |
CN107835113A (zh) | 一种基于网络映射的社交网络中异常用户检测方法 | |
US20110179116A1 (en) | System and method for providing personality-based content and advertisements | |
Schnebly et al. | Random forest twitter bot classifier | |
CN110059177B (zh) | 一种基于用户画像的活动推荐方法及装置 | |
Bottero | Who do you think they were? How family historians make sense of social position and inequality in the past | |
CN108241867B (zh) | 一种分类方法及装置 | |
US20140147048A1 (en) | Document quality measurement | |
CN114077705A (zh) | 一种对社交平台上的媒体账号进行画像的方法和系统 | |
Wainer et al. | How productivity and impact differ across computer science subareas | |
CN110457630B (zh) | 一种开源社区异常点赞用户的识别方法及系统 | |
CN112231605A (zh) | 信息展示的方法和装置 | |
CN109254993B (zh) | 一种基于文本的性格数据分析方法及系统 | |
CN115829657A (zh) | 一种应用于数据统计的数据采集方法、装置及存储介质 | |
CN113486649B (zh) | 文本评论的生成方法以及电子设备 | |
CN114003803A (zh) | 一种社交平台上特定地域的媒体账号发现方法及系统 | |
JP5841108B2 (ja) | 情報処理装置、記事情報生成方法およびプログラム | |
Mannan et al. | An Empirical Study on Theories of Sentiment Analysis in Relation to Fake News Detection | |
CN108763400B (zh) | 基于对象行为和主题偏好的对象划分方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |