WO2020257988A1 - 刷量用户识别方法及相关产品 - Google Patents
刷量用户识别方法及相关产品 Download PDFInfo
- Publication number
- WO2020257988A1 WO2020257988A1 PCT/CN2019/092589 CN2019092589W WO2020257988A1 WO 2020257988 A1 WO2020257988 A1 WO 2020257988A1 CN 2019092589 W CN2019092589 W CN 2019092589W WO 2020257988 A1 WO2020257988 A1 WO 2020257988A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- feature
- target
- reference objects
- user
- brush
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/50—Monitoring users, programs or devices to maintain the integrity of platforms, e.g. of processors, firmware or operating systems
- G06F21/55—Detecting local intrusion or implementing counter-measures
- G06F21/56—Computer malware detection or handling, e.g. anti-virus arrangements
Abstract
本申请实施例公开了一种刷量用户识别方法及相关产品,该方法包括:通过获取多个参考对象中每一参考对象的特征样本集,得到多个特征样本集,根据预设算法对多个特征样本集进行运算,得到目标刷量识别模型,对目标对象进行特征提取,得到目标特征集,将目标特征集输入到目标刷量识别模型进行运算,得到目标对象是否为刷量用户的识别结果,如此,可基于多个参考对象的特征样本集训练目标刷量识别模型,然后根据目标刷量识别模型识别目标对象是否属于刷量用户,从而,可更加准确地识别刷量用户。
Description
本申请涉及电子技术领域,具体涉及一种刷量用户识别方法及相关产品。
随着电子设备(如:手机、平板电脑等)的大量普及应用,电子设备能够支持的应用越来越多,功能越来越强大,电子设备向着多样化、个性化的方向发展,成为用户生活中不可缺少的电子用品。例如,电子设备中会安装很多不同的应用,通过不同功能的应用实现不同的使用体验,一般来说,用户在安装应用时,会优先选择应用商店中排名靠前或者下载量较高的应用。
目前,很多应用存在为了提高排名和点击量,会虚构很多不存在的用户进行刷量,刷量用户的存在会破坏网络服务平台的公平性,因此,需要对刷量用户进行识别,从而保证排名和点击量统计的准确性和公平性。
发明内容
本申请实施例提供了一种刷量用户识别方法及相关产品,能够更加准确地对刷量用户进行识别。
第一方面,本申请实施例提供一种刷量用户识别方法,所述方法包括:
获取多个参考对象中每一参考对象的特征样本集,得到多个特征样本集;
根据预设算法对所述多个特征样本集进行运算,得到目标刷量识别模型;
对目标对象进行特征提取,得到目标特征集;
将所述目标特征集输入到所述目标刷量识别模型进行运算,得到所述目标对象是否为刷量用户的识别结果。
第二方面,本申请实施例提供了一种刷量用户识别装置,所述刷量用户识别装置包括:
获取单元,用于获取多个参考对象中每一参考对象的特征样本集,得到多个特征样本集;
运算单元,用于根据预设算法对所述多个特征样本集进行运算,得到目标刷量识别模型;
提取单元,用于对目标对象进行特征提取,得到目标特征集;
所述运算单元,还用于将所述目标特征集输入到所述目标刷量识别模型进行运算,得到所述目标对象是否为刷量用户的识别结果。
第三方面,本申请实施例提供一种电子设备,包括处理器、存储器、通信接口,以及一个或多个程序,其中,上述一个或多个程序被存储在上述存储器中,并且被配置由上述 处理器执行,上述程序包括用于执行本申请实施例第一方面中的步骤的指令。
第四方面,本申请实施例提供了一种计算机可读存储介质,其中,上述计算机可读存储介质存储用于电子数据交换的计算机程序,其中,上述计算机程序使得计算机执行如本申请实施例第一方面中所描述的部分或全部步骤。
第五方面,本申请实施例提供了一种计算机程序产品,其中,上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,上述计算机程序可操作来使计算机执行如本申请实施例第一方面中所描述的部分或全部步骤。该计算机程序产品可以为一个软件安装包。
下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1A是本申请实施例提供的一种电子设备的结构示意图;
图1B是本申请实施例提供的一种刷量用户识别方法的流程示意图;
图2是本申请实施例公开的另一种刷量用户识别方法的流程示意图;
图3是本申请实施例公开的另一种刷量用户识别方法的流程示意图;
图4是本申请实施例公开的另一种电子设备的结构示意图;
图5是本申请实施例公开的一种刷量用户识别装置的结构示意图。
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
本申请实施例所涉及到的电子设备可以包括各种具有无线通信功能的手持设备、车载设备、可穿戴设备、计算设备或连接到无线调制解调器的其他处理设备,以及各种形式的 用户设备(user equipment,UE),移动台(mobile station,MS),终端设备(terminal device),服务器等等。为方便描述,上面提到的设备统称为电子设备。下面对本申请实施例进行详细介绍。
请参阅图1A,图1A是本申请实施例公开的一种电子设备的结构示意图,电子设备100可以包括控制电路,该控制电路可以包括存储和处理电路110。该存储和处理电路110可以存储器,例如硬盘驱动存储器,非易失性存储器(例如闪存或用于形成固态驱动器的其它电子可编程只读存储器等),易失性存储器(例如静态或动态随机存取存储器等)等,本申请实施例不作限制。存储和处理电路110中的处理电路可以用于控制电子设备100的运转。该处理电路可以基于一个或多个微处理器,微控制器,数字主从耳机切换控制器,基带处理器,功率管理单元,音频编解码器芯片,专用集成电路,显示驱动器集成电路等来实现。
存储和处理电路110可用于运行电子设备100中的软件,例如互联网浏览应用程序,互联网协议语音(voice over internet protocol,VOIP)电话呼叫应用程序,电子邮件应用程序,媒体播放应用程序,操作系统功能等。这些软件可以用于执行一些控制操作,例如,基于照相机的图像采集,基于环境光传感器的环境光测量,基于接近传感器的接近传感器测量,基于诸如发光二极管的状态指示灯等状态指示器实现的信息显示功能,基于触摸传感器的触摸事件检测,与在多个(例如分层的)显示器上显示信息相关联的功能,与执行无线通信功能相关联的操作,与收集和产生音频信号相关联的操作,与收集和处理按钮按压事件数据相关联的控制操作,以及电子设备100中其它功能等,本申请实施例不作限制。
电子设备100还可以包括输入-输出电路150。输入-输出电路150可用于使电子设备100实现数据的输入和输出,即允许电子设备100从外部设备接收数据和也允许电子设备100将数据从电子设备100输出至外部设备。输入-输出电路150可以进一步包括传感器170。传感器170可以包括环境光传感器,基于光和电容的接近传感器,触摸传感器(例如,基于光触摸传感器和/或电容式触摸传感器,其中,触摸传感器可以是触控显示屏的一部分,也可以作为一个触摸传感器结构独立使用),加速度传感器,重力传感器,和其它传感器等。
输入-输出电路150还可以包括一个或多个显示器,例如显示器130。显示器130可以包括液晶显示器,有机发光二极管显示器,电子墨水显示器,等离子显示器,使用其它显示技术的显示器中一种或者几种的组合。显示器130可以包括触摸传感器阵列(即,显示器130可以是触控显示屏)。触摸传感器可以是由透明的触摸传感器电极(例如氧化铟锡(ITO)电极)阵列形成的电容式触摸传感器,或者可以是使用其它触摸技术形成的触摸传感器,例如音波触控,压敏触摸,电阻触摸,光学触摸等,本申请实施例不作限制。
音频组件140可以用于为电子设备100提供音频输入和输出功能。电子设备100中的音频组件140可以包括扬声器,麦克风,蜂鸣器,音调发生器以及其它用于产生和检测声音的组件。
通信电路120可以用于为电子设备100提供与外部设备通信的能力。通信电路120可以包括模拟和数字输入-输出接口电路,和基于射频信号和/或光信号的无线通信电路。通信电路120中的无线通信电路可以包括射频收发器电路、功率放大器电路、低噪声放大器、开关、滤波器和天线。举例来说,通信电路120中的无线通信电路可以包括用于通过发射和接收近场耦合电磁信号来支持近场通信(near field communication,NFC)的电路。例如, 通信电路120可以包括近场通信天线和近场通信收发器。通信电路120还可以包括蜂窝电话收发器和天线,无线局域网收发器电路和天线等。
电子设备100还可以进一步包括电池,电力管理电路和其它输入-输出单元160。输入-输出单元160可以包括按钮,操纵杆,点击轮,滚动轮,触摸板,小键盘,键盘,照相机,发光二极管和其它状态指示器等。
用户可以通过输入-输出电路150输入命令来控制电子设备100的操作,并且可以使用输入-输出电路150的输出数据以实现接收来自电子设备100的状态信息和其它输出。
请参阅图1B,图1B是本申请实施例提供的一种刷量用户识别方法的流程示意图,本实施例中所描述的刷量用户识别方法,该刷量用户识别方法包括:
101、获取多个参考对象中每一参考对象的特征样本集,得到多个特征样本集。
其中,多个参考对象是指在预设时间段内出现的用户或者用户账号。预设时间段例如可以是最近一个月,或者最近3个月等等,此处不做限制。
本申请实施例中,可获取多个参考对象中每一参考对象使用电子设备的使用数据,得到多个使用数据,然后,针对每一参考对象的使用数据进行特征提取,得到每一参考对象对应的特征样本集,从而,可得到多个参考对象对应的多个特征样本集。其中,每一特征样本集中包含多个维度的多个特征样本。
其中,参考对象使用电子设备的使用数据可包括以下至少一种:参考对象使用电子设备中所有应用的时间分布,参考对象使用特定应用的应用数据,应用数据可包括以下至少一种内容:使用特定应用的频次、每次使用特定应用的时长、每次使用特定应用的时间段、每次使用特定应用的地理位置、每次使用特定应用的IP地址等,电子设备中的特定操作行为,其中,特定操作行为可包括以下至少一种:通话操作行为,例如有来电记录,短信接收行为、邮件接收行为、闹钟提醒行为等等。
其中,特定应用是指,在预设时间段内用户使用该应用的使用频次超过预设频次的应用,特定应用可以是电子设备安装的应用,特定应用可包括以下任意一种:浏览器应用、支付应用、聊天应用、邮件应用、乘车应用、导航应用、阅读应用、视频播放应用、音乐播放应用、学习应用,例如英语学习应用,专业考试学习应用、购物应用、健身应用、快递应用、工作应用等等,在此不做限定。
102、根据预设算法对所述多个特征样本集进行运算,得到目标刷量识别模型。
其中,预设算法可包括以下至少一种:预设分类规则、预设的监督算法、以及预设的非监督分类算法,预设分类规则可包括:预设的位置规则、预设的应用使用规则等,例如,一个账号在多个电子设备上进行登录,一个电子设备有多个账号进行登录,可确定存在刷量用户,又例如,一个位置聚集多个设备,一个位置可以是同一IP位置,或者,同一地理位置。又例如,当多个参考对象的操作行为具有一致性,有很多机械操作的行为或者序列操作的行为,可利用应用使用的时间序列的相似性判断,也确定多个刷量用户是否属于样本刷量群体。预设的监督算法可包括以下至少一种:邻近(k-Nearest Neighbor,KNN)算法、逻辑回归(Logistic Regression,LR)算法、支持向量机(support vector machine,SVM)算法、极端梯度提升(eXtreme Gradient Boosting,XGboost)算法或者随机森林算法。预设的非监督分类算法可包括以下至少一种:均值(k-means clustering,Kmeans)算法、基于 密度的聚类算法(Density-Based Spatial Clustering of Applications with Noise,DBscan)、隔离森林算法Isolation Forest。
本申请实施例中,可融合上述多种预设算法,具体地,可根据预设算法对多个特征样本集中每一特征样本集进行运算,确定每一特征样本集对应的参考对象是否属于刷量用户,从而可以将多个参考对象划分为多个正样本和多个负样本,然后根据多个正样本和多个负样本进行训练学习,得到目标刷量识别模型。
可选地,上述步骤102中,根据预设算法对所述多个特征样本集进行运算,得到目标刷量识别模型,可包括以下步骤:
21、根据预设的分类规则和所述多个特征样本集将所述多个参考对象划分为多个第一参考对象和多个第二参考对象,其中,所述第一参考对象为确定属于刷量用户的参考对象,所述第二参考对象为未确定属于刷量用户的参考对象;
22、根据预设的分类监督算法和所述多个第二参考对象对应的多个特征样本集确定所述多个第二参考对象中确定为刷量用户的多个第三参考对象;
23、将所述多个第一参考对象和所述多个第三参考对象对应的多个特征样本集作为正样本,将所述多个第二参考对象中除了所述多个第三参考对象以外的其他第二参考对象作为负样本,进行学习,得到所述目标刷量识别模型。
本申请实施例中,可根据预设的分类规则,确定多个参考对象中哪些属于刷量用户,例如,针对任一参考对象,根据参考对象使用电子设备中的所有应用的时间分布,可确定参考对象使用频次超过预设频次的特定应用,以及使用次数较少的非特定应用,若参考对象使用某一非特定应用的时长突然增加,可判断存在异常,进而可确定参考对象属于刷量用户。通过预设规则,可以确定多个参考对象中确定属于刷量用户的多个第一参考对象,以及为未确定属于刷量用户的多个第二参考对象。
其中,通过预设规则难以将所有参考对象中的刷量用户进行识别,多个第二参考对象中,可能存在预设规则未能识别的刷量用户。因此,可通过预设的监督算法进一步确定多个第二参考对象中属于刷量用户的多个第三参考对象。
可选地,上述步骤21中,所述多个特征样本集中每一特征样本集包含多个维度的多个特征样本,所述分类规则包括所述多个维度对应的多个特征规则;所述根据预设的分类规则和所述多个特征样本集将所述多个参考对象划分为多个第一参考对象和多个第二参考对象,可包括以下步骤:
A1、根据预设的优先级顺序确定所述多个特征样本集中每一特征样本集包含的优先级最高的特征样本对应的特征规则,得到多个特征规则,所述优先级顺序为预设的所述多个维度的多个特征样本的优先级顺序,所述多个特征规则与所述多个特征样本集一一对应;
A2、根据所述多个特征规则中每一特征规则确定对应特征样本集所属的参考对象是否属于刷量用户,得到所述多个参考对象中属于刷量用户的多个第一参考对象和不属于刷量用户的多个第二参考对象。
本申请实施例中,可预先针对多个维度的多个特征样本设定对应的特征规则,得到多个特征规则,每一维度对应一个特征规则,并预先设定多个维度的多个特征样本的优先级顺序。从而,可根据预设的优先级顺序确定所述多个特征样本集中每一特征样本集包含的 优先级最高的特征样本对应的特征规则,得到多个特征规则,然后,根据多个特征规则中每一特征规则确定对应特征样本集所属的参考对象是否属于刷量用户,得到多个参考对象中属于刷量用户的多个第一参考对象和不属于刷量用户的多个第二参考对象。
可选地,上述步骤21中,所述分类规则包括地理位置规则或者应用使用规则;所述根据预设的分类规则和所述多个特征样本集将所述多个参考对象划分为多个第一参考对象和多个第二参考对象,可包括以下步骤:
A3、根据所述地理位置规则和所述多个特征样本集中每一特征样本集包含的位置特征样本确定对应特征样本集所属的参考对象是否属于刷量用户,得到所述多个参考对象中属于刷量用户的多个第一参考对象和不属于刷量用户的多个第二参考对象。
或者,
A4、根据所述应用使用规则和所述多个特征样本集中每一特征样本集内的应用使用特征样本确定对应特征样本集所属的参考对象是否属于刷量用户,得到所述多个参考对象中属于刷量用户的多个第一参考对象和不属于刷量用户的多个第二参考对象。
其中,可预先针对特征样本集中的某些特征样本设定特征规则,具体地,可针对地理位置特征设定地理位置规则,若任意参考对象对应的特征样本集中包含地理位置特征,则可以根据地理位置规则和地理位置特征确定该参考对象是否属于刷量用户。
可选地,还可针对应用使用特征设定应用使用规则,从而可以根据应用使用特征设定应用使用规则,若任意参考对象对应的特征样本集中包含应用使用特征,则可以根据应用使用规则和应用使用特征确定该参考对象是否属于刷量用户。
从而,可根据上述特征规则确定多个参考对象中属于刷量用户的多个第一参考对象,以及,未确定属于刷量用户的多个第二参考对象。
可选地,上述步骤102中,根据预设算法对所述多个特征样本集进行运算,得到目标刷量识别模型,可包括以下步骤:
24、根据预设的非监督分类算法和所述多个特征样本集对所述多个参考对象进行聚类,得到多个样本刷量群体,每一所述样本刷量群体包括同一聚类的多个参考对象;
25、将所述多个样本刷量群体中每一样本刷量群体的多个参考对象的多个特征样本集进行训练学习,得到所述目标刷量识别模型。
其中,可通过预设的非监督分类算法对多个特征样本集进行聚类,具体地,可将具有类似特征样本的特征样本集进行聚类,然后,将属于同一类的多个特征样本集对应的多个参考对象归属于一个样本刷量群体,从而,得到多个样本刷量群体。进一步地,将所述多个样本刷量群体中每一样本刷量群体的多个参考对象的多个特征样本集进行训练学习,得到目标刷量识别模型,其中每一样本刷量群体对应一个群体特征集,群体特征集中包含该样本刷量群体相同的多个特征。
103、对目标对象进行特征提取,得到目标特征集。
本申请实施例中,目标对象是指新出现的一个用户或者一个新出现的用户账号。当发现新出现的目标对象,可获取目标对象使用电子设备的目标使用数据,然后对该目标使用数据进行特征提取,得到目标特征集。
104、将所述目标特征集输入到所述目标刷量识别模型进行运算,得到所述目标对象是 否为刷量用户的识别结果。
其中,将目标特征集输入到目标刷量识别模型进行运算,可得到目标对象是否属于刷量用户的识别结果,此外,还可确定目标对象属于单刷量用户还是某一样本刷量群体中的群体刷量用户。单刷量用户,是指目标对象进行刷量的行为属于个人行为;群体刷量用户是指,目标对象的刷量行为属于群体刷量行为。
可选地,上述步骤104中,将所述目标特征集输入到所述目标刷量识别模型进行运算,得到所述目标对象是否为刷量用户的识别结果,可包括以下步骤:
41、将所述目标对象的目标特征集输入所述目标刷量识别模型中,得到所述目标对象属于刷量用户的概率值;
42、若所述概率值超过预设概率值,确定所述目标对象为刷量用户。
其中,为了确定目标对象是否属于单刷量用户,可将目标特征集输入目标刷量识别模型中,根据目标刷量识别模型确定目标对象属于刷量用户的概率值,若概率值超过预设概率值,确定目标对象为刷量用户,若概率值不超过预设概率值,则得到目标对象不属于刷量用户的识别结果。
可选地,还可根据所述分类规则或者所述分类监督算法确定所述目标对象是否为刷量用户,具体地,可先通过预设的分类规则确定目标对象是否属于刷量用户,若未确定目标对象属于刷量用户,可进一步通过分类监督算法确定目标对象是否属于刷量用户。
可选地,上述步骤104中,将所述目标特征集输入到所述目标刷量识别模型进行运算,得到所述目标对象是否为刷量用户的识别结果,可包括以下步骤:
43、将所述目标特征集输入所述目标刷量识别模型中,得到所述目标对象与所述目标刷量识别模型中多个样本刷量群体之间的多个关联度,所述多个关联度与所述多个样本刷量群体一一对应;
44、若所述多个关联度中的最大关联度超过预设关联度,确定所述目标对象属于所述最大关联度对应的目标样本刷量群体中的刷量用户。
其中,为了确定目标对象是否属于群体刷量用户,可先将目标特征集输入目标刷量识别模型中,得到目标对象与所述目标刷量识别模型中多个样本刷量群体之间的多个关联度,具体地,可根据目标特征集和目标刷量识别模型中多个样本刷量群体中每一样本刷量群体对应的群体特征集确定目标对象与所述每一样本刷量群体之间的关联度,得到多个关联度。然后确定多个关联度中的最大关联度,若该最大关联度超过预设关联度,可确定目标对象属于最大关联度对应的目标样本刷量群体中的刷量用户。
可选地,上述步骤43中,所述将所述目标特征集输入所述目标刷量识别模型中,得到所述目标对象与所述目标刷量识别模型中多个样本刷量群体之间的多个关联度,可包括以下步骤:
B1、确定所述目标特征集分别与所述目标刷量识别模型中多个样本刷量群体中每一样本刷量群体对应的群体特征集包含的相似特征对的相似特征对数量,得到多个相似特征对数量;
B2、根据预设的相似特征对数量与关联度之间的对应关系确定所述多个相似特征对数量中每一相似特征对数量对应的关联度,得到多个关联度。
其中,可确定目标特征集与多个样本刷量群体中每一样本刷量群体对应的群体特征集包含的相似特征对的相似特征对数量,其中,相似特征对可包括相同特征。例如,目标特征集与第一样本刷量群体对应的第一群体特征集包含5个相似特征对,则目标特征集与第一样本刷量群体对应的相似特征对数量为5。从而,可确定目标特征集与多个样本刷量群体之间对应的多个相似特征对数量,多个样本刷量群体与多个相似特征对数量一一对应。
本申请实施例中,还可预先设定相似特征对数量与关联度之间的对应关系,从而,可根据该对应关系确定多个相似特征对数量中每一相似特征对数量对应的关联度,得到多个关联度。
可选地,上述步骤B1中,确定所述目标特征集分别与所述目标刷量识别模型中多个样本刷量群体中每一样本刷量群体对应的群体特征集包含的相似特征对的相似特征对数量,得到多个相似特征对数量,可包括以下步骤:
B11、将所述目标特征集中的多个目标特征分别与所述目标刷量识别模型中多个样本刷量群体中每一样本刷量群体对应的群体特征集中的多个群体特征进行匹配,得到多个匹配值;
B12、将所述多个匹配值中超过预设匹配值的目标匹配值对应的目标特征和群体特征确定为相似特征对,并统计所述目标特征集分别与所述目标刷量识别模型中多个样本刷量群体中每一样本刷量群体对应的群体特征集包含的相似特征对的相似特征对数量,得到多个相似特征对数量。
其中,可将目标特征集中的多个目标特征与多个样本刷量群体中每一样本刷量群体对应的群体特征集中的多个群体特征进行匹配,得到多个匹配值,具体地,针对目标特征集中的多个目标特征中的任一目标特征,可将该目标特征分别与多个样本刷量群体中每一样本刷量群体对应的群体特征集中的多个群体特征进行匹配,每一被匹配的目标特征和群体特征对应一个匹配值,从而,可得到多个匹配值。然后,确定匹配值超过预设匹配值的目标特征和群体特征为相似特征对,从而,可以确定目标特征集与多个样本刷量群体中每一样本刷量群体对应的群体特征集包含的相似特征对的相似特征对数量,进而,可统计目标特征集分别与目标刷量识别模型中多个样本刷量群体中每一样本刷量群体对应的群体特征集包含的相似特征对的相似特征对数量,得到多个相似特征对数量。
可以看出,本申请实施例中所描述的刷量用户识别方法,通过获取多个参考对象中每一参考对象的特征样本集,得到多个特征样本集,根据预设算法对多个特征样本集进行运算,得到目标刷量识别模型,对目标对象进行特征提取,得到目标特征集,将目标特征集输入到目标刷量识别模型进行运算,得到目标对象是否为刷量用户的识别结果,如此,可基于多个参考对象的特征样本集训练目标刷量识别模型,然后根据目标刷量识别模型识别目标对象是否属于刷量用户,从而,可更加准确地识别刷量用户。
与上述一致地,请参阅图2,图2是本申请实施例提供的另一种刷量用户识别方法的流程示意图,本实施例中所描述的刷量用户识别方法,应用于电子设备,该方法可包括以下步骤:
201、获取多个参考对象中每一参考对象的特征样本集,得到多个特征样本集。
202、根据预设的分类规则和所述多个特征样本集将所述多个参考对象划分为多个第一参考对象和多个第二参考对象,其中,所述第一参考对象为确定属于刷量用户的参考对象,所述第二参考对象为未确定属于刷量用户的参考对象。
203、根据预设的分类监督算法和所述多个第二参考对象对应的多个特征样本集确定所述多个第二参考对象中确定为刷量用户的多个第三参考对象。
204、将所述多个第一参考对象和所述多个第三参考对象对应的多个特征样本集作为正样本,将所述多个第二参考对象中除了所述多个第三参考对象以外的其他第二参考对象作为负样本,进行学习,得到所述目标刷量识别模型。
205、对目标对象进行特征提取,得到目标特征集。
206、将所述目标对象的目标特征集输入所述目标刷量识别模型中,得到所述目标对象属于刷量用户的概率值。
207、若所述概率值超过预设概率值,确定所述目标对象为刷量用户。
其中,上述步骤201-206的具体实现过程可参照图1B所示的方法中相应的描述,在此不再赘述。
可以看出,本申请实施例中所描述的刷量用户识别方法,通过获取多个参考对象中每一参考对象的特征样本集,得到多个特征样本集,根据预设的分类规则和多个特征样本集将多个参考对象划分为多个第一参考对象和多个第二参考对象,根据预设的分类监督算法和所述多个第二参考对象对应的多个特征样本集确定多个第二参考对象中确定为刷量用户的多个第三参考对象,将多个第一参考对象和所述多个第三参考对象对应的多个特征样本集作为正样本,将多个第二参考对象中除了所述多个第三参考对象以外的其他第二参考对象作为负样本,进行学习,得到所述目标刷量识别模型,对目标对象进行特征提取,得到目标特征集,将目标对象的目标特征集输入目标刷量识别模型中,得到目标对象属于刷量用户的概率值,若概率值超过预设概率值,确定目标对象为刷量用户,如此,可基于多个参考对象的特征样本集训练目标刷量识别模型,然后根据目标刷量识别模型识别目标对象是否属于刷量用户,从而,可更加准确地识别刷量用户。
与上述一致地,请参阅图3,为本申请实施例提供的另一种刷量用户识别方法的实施例流程示意图,本实施例中所描述的刷量用户识别方法,本方法可包括以下步骤:
301、获取多个参考对象中每一参考对象的特征样本集,得到多个特征样本集。
302、根据预设的非监督分类算法和所述多个特征样本集对所述多个参考对象进行聚类,得到多个样本刷量群体,每一所述样本刷量群体包括同一聚类的多个参考对象。
303、将所述多个样本刷量群体中每一样本刷量群体的多个参考对象的多个特征样本集进行训练学习,得到所述目标刷量识别模型。
304、对目标对象进行特征提取,得到目标特征集。
305、将所述目标特征集输入所述目标刷量识别模型中,得到所述目标对象与所述目标刷量识别模型中多个样本刷量群体之间的多个关联度,所述多个关联度与所述多个样本刷量群体一一对应。
306、若所述多个关联度中的最大关联度超过预设关联度,确定所述目标对象属于所述 最大关联度对应的目标样本刷量群体中的刷量用户。
其中,上述步骤301-306的具体实现过程可参照图1B所示的方法中相应的描述,在此不再赘述。
本申请实施例中所描述的刷量用户识别方法,通过获取多个参考对象中每一参考对象的特征样本集,得到多个特征样本集,根据预设的非监督分类算法和多个特征样本集对多个参考对象进行聚类,得到多个样本刷量群体;将多个样本刷量群体中每一样本刷量群体的多个参考对象的多个特征样本集进行训练学习,得到所述目标刷量识别模型,对目标对象进行特征提取,得到目标特征集,将目标特征集输入所述目标刷量识别模型中,得到所标对象与目标刷量识别模型中多个样本刷量群体之间的多个关联度,若多个关联度中的最大关联度超过预设关联度,确定目标对象属于最大关联度对应的目标样本刷量群体中的刷量用户,如此,可基于多个参考对象的特征样本集训练目标刷量识别模型,然后根据目标刷量识别模型识别目标对象是否属于刷量用户,从而,可更加准确地识别刷量用户。
与上述一致地,请参阅图4,图4是本申请实施例提供的一种电子设备400,包括:处理器410、存储器420、通信接口430以及一个或多个程序421,所述一个或多个程序421被存储在所述存储器420中,并且被配置成由所述处理器410执行,所述程序包括用于执行以下步骤的指令:
获取多个参考对象中每一参考对象的特征样本集,得到多个特征样本集;
根据预设算法对所述多个特征样本集进行运算,得到目标刷量识别模型;
对目标对象进行特征提取,得到目标特征集;
将所述目标特征集输入到所述目标刷量识别模型进行运算,得到所述目标对象是否为刷量用户的识别结果。
在一个可能的示例中,在所述根据预设算法对所述多个特征样本集进行运算,得到目标刷量识别模型方面,所述程序421包括用于执行以下步骤的指令:
根据预设的分类规则和所述多个特征样本集将所述多个参考对象划分为多个第一参考对象和多个第二参考对象,其中,所述第一参考对象为确定属于刷量用户的参考对象,所述第二参考对象为未确定属于刷量用户的参考对象;
根据预设的分类监督算法和所述多个第二参考对象对应的多个特征样本集确定所述多个第二参考对象中确定为刷量用户的多个第三参考对象;
将所述多个第一参考对象和所述多个第三参考对象对应的多个特征样本集作为正样本,将所述多个第二参考对象中除了所述多个第三参考对象以外的其他第二参考对象作为负样本,进行学习,得到所述目标刷量识别模型。
在一个可能的示例中,所述多个特征样本集中每一特征样本集包含多个维度的多个特征样本,在所述分类规则包括所述多个维度对应的多个特征规则;所述根据预设的分类规则和所述多个特征样本集将所述多个参考对象划分为多个第一参考对象和多个第二参考对象方面,所述程序421包括用于执行以下步骤的指令:
根据预设的优先级顺序确定所述多个特征样本集中每一特征样本集包含的优先级最高的特征样本对应的特征规则,得到多个特征规则,所述优先级顺序为预设的所述多个维度 的多个特征样本的优先级顺序,所述多个特征规则与所述多个特征样本集一一对应;
根据所述多个特征规则中每一特征规则确定对应特征样本集所属的参考对象是否属于刷量用户,得到所述多个参考对象中属于刷量用户的多个第一参考对象和不属于刷量用户的多个第二参考对象。
在一个可能的示例中,所述分类规则包括地理位置规则或者应用使用规则,在根据预设的分类规则和所述多个特征样本集将所述多个参考对象划分为多个第一参考对象和多个第二参考对象方面,所述程序421包括用于执行以下步骤的指令:
根据所述地理位置规则和所述多个特征样本集中每一特征样本集包含的位置特征样本确定对应特征样本集所属的参考对象是否属于刷量用户,得到所述多个参考对象中属于刷量用户的多个第一参考对象和不属于刷量用户的多个第二参考对象。
或者,
根据所述应用使用规则和所述多个特征样本集中每一特征样本集内的应用使用特征样本确定对应特征样本集所属的参考对象是否属于刷量用户,得到所述多个参考对象中属于刷量用户的多个第一参考对象和不属于刷量用户的多个第二参考对象。
在一个可能的示例中,在所述将所述目标特征集输入到所述目标刷量识别模型进行运算,得到所述目标对象是否为刷量用户的识别结果方面,所述程序421包括用于执行以下步骤的指令:
将所述目标对象的目标特征集输入所述目标刷量识别模型中,得到所述目标对象属于刷量用户的概率值;
若所述概率值超过预设概率值,确定所述目标对象为刷量用户。
在一个可能的示例中,在所述根据预设算法对所述多个特征样本集进行运算,得到目标刷量识别模型方面,所述程序421包括用于执行以下步骤的指令:
根据预设的非监督分类算法和所述多个特征样本集对所述多个参考对象进行聚类,得到多个样本刷量群体,每一所述样本刷量群体包括同一聚类的多个参考对象;
将所述多个样本刷量群体中每一样本刷量群体的多个参考对象的多个特征样本集进行训练学习,得到所述目标刷量识别模型。
在一个可能的示例中,在所述将所述目标特征集输入到所述目标刷量识别模型进行运算,得到所述目标对象是否为刷量用户的识别结果方面,所述程序421包括用于执行以下步骤的指令:
将所述目标特征集输入所述目标刷量识别模型中,得到所述目标对象与所述目标刷量识别模型中多个样本刷量群体之间的多个关联度,所述多个关联度与所述多个样本刷量群体一一对应;
若所述多个关联度中的最大关联度超过预设关联度,确定所述目标对象属于所述最大关联度对应的目标样本刷量群体中的刷量用户。
在一个可能的示例中,在所述将所述目标特征集输入所述目标刷量识别模型中,得到所述目标对象与所述目标刷量识别模型中多个样本刷量群体之间的多个关联度方面,所述程序421包括用于执行以下步骤的指令:
确定所述目标特征集分别与所述目标刷量识别模型中多个样本刷量群体中每一样本刷 量群体对应的群体特征集包含的相似特征对的相似特征对数量,得到多个相似特征对数量;
根据预设的相似特征对数量与关联度之间的对应关系确定所述多个相似特征对数量中每一相似特征对数量对应的关联度,得到多个关联度。
在一个可能的示例中,在所述确定所述目标特征集分别与所述目标刷量识别模型中多个样本刷量群体中每一样本刷量群体对应的群体特征集包含的相似特征对的相似特征对数量,得到多个相似特征对数量方面,所述程序421还包括用于执行以下步骤的指令:
将所述目标特征集中的多个目标特征分别与所述目标刷量识别模型中多个样本刷量群体中每一样本刷量群体对应的群体特征集中的多个群体特征进行匹配,得到多个匹配值;
将所述多个匹配值中超过预设匹配值的目标匹配值对应的目标特征和群体特征确定为相似特征对,并统计所述目标特征集分别与所述目标刷量识别模型中多个样本刷量群体中每一样本刷量群体对应的群体特征集包含的相似特征对的相似特征对数量,得到多个相似特征对数量。
请参阅图5,图5是本实施例提供的一种刷量用户识别装置的结构示意图。该刷量用户识别装置应用于如图1A所示的电子设备,所述刷量用户识别装置包括获取单元501、运算单元502和提取单元503,其中,
所述获取单元501,用于获取多个参考对象中每一参考对象的特征样本集,得到多个特征样本集;
所述运算单元502,用于根据预设算法对所述多个特征样本集进行运算,得到目标刷量识别模型;
所述提取单元503,用于对目标对象进行特征提取,得到目标特征集;
所述运算单元502,还用于将所述目标特征集输入到所述目标刷量识别模型进行运算,得到所述目标对象是否为刷量用户的识别结果。
可选地,在所根据预设算法对所述多个特征样本集进行运算,得到目标刷量识别模型方面,所述运算单元具体用于:
根据预设的分类规则和所述多个特征样本集将所述多个参考对象划分为多个第一参考对象和多个第二参考对象,其中,所述第一参考对象为确定属于刷量用户的参考对象,所述第二参考对象为未确定属于刷量用户的参考对象;
根据预设的分类监督算法和所述多个第二参考对象对应的多个特征样本集确定所述多个第二参考对象中确定为刷量用户的多个第三参考对象;
将所述多个第一参考对象和所述多个第三参考对象对应的多个特征样本集作为正样本,将所述多个第二参考对象中除了所述多个第三参考对象以外的其他第二参考对象作为负样本,进行学习,得到所述目标刷量识别模型。
可选地,所述多个特征样本集中每一特征样本集包含多个维度的多个特征样本,所述分类规则包括所述多个维度对应的多个特征规则;在所述根据预设的分类规则和所述多个特征样本集将所述多个参考对象划分为多个第一参考对象和多个第二参考对象方面,所述运算单元具体用于:
根据预设的优先级顺序确定所述多个特征样本集中每一特征样本集包含的优先级最高 的特征样本对应的特征规则,得到多个特征规则,所述优先级顺序为预设的所述多个维度的多个特征样本的优先级顺序,所述多个特征规则与所述多个特征样本集一一对应;
根据所述多个特征规则中每一特征规则确定对应特征样本集所属的参考对象是否属于刷量用户,得到所述多个参考对象中属于刷量用户的多个第一参考对象和不属于刷量用户的多个第二参考对象。
可选地,所述分类规则包括地理位置规则或者应用使用规则,在根据预设的分类规则和所述多个特征样本集将所述多个参考对象划分为多个第一参考对象和多个第二参考对象方面,所述运算单元具体用于:
根据所述地理位置规则和所述多个特征样本集中每一特征样本集包含的位置特征样本确定对应特征样本集所属的参考对象是否属于刷量用户,得到所述多个参考对象中属于刷量用户的多个第一参考对象和不属于刷量用户的多个第二参考对象。
或者,
根据所述应用使用规则和所述多个特征样本集中每一特征样本集内的应用使用特征样本确定对应特征样本集所属的参考对象是否属于刷量用户,得到所述多个参考对象中属于刷量用户的多个第一参考对象和不属于刷量用户的多个第二参考对象。
可选地,在所述将所述目标特征集输入到所述目标刷量识别模型进行运算,得到所述目标对象是否为刷量用户的识别结果方面,所述运算单元502具体用于:
将所述目标对象的目标特征集输入所述目标刷量识别模型中,得到所述目标对象属于刷量用户的概率值;
若所述概率值超过预设概率值,确定所述目标对象为刷量用户。
可选地,在根据预设算法对所述多个特征样本集进行运算,得到目标刷量识别模型方面,所述运算单元502具体用于:
根据预设的非监督分类算法和所述多个特征样本集对所述多个参考对象进行聚类,得到多个样本刷量群体,每一所述样本刷量群体包括同一聚类的多个参考对象;
将所述多个样本刷量群体中每一样本刷量群体的多个参考对象的多个特征样本集进行训练学习,得到所述目标刷量识别模型。
可选地,在所述将所述目标特征集输入到所述目标刷量识别模型进行运算,得到所述目标对象是否为刷量用户的识别结果方面,所述运算单元502具体用于:
将所述目标特征集输入所述目标刷量识别模型中,得到所述目标对象与所述目标刷量识别模型中多个样本刷量群体之间的多个关联度,所述多个关联度与所述多个样本刷量群体一一对应;
若所述多个关联度中的最大关联度超过预设关联度,确定所述目标对象属于所述最大关联度对应的目标样本刷量群体中的刷量用户。
可选地,在所述将所述目标特征集输入所述目标刷量识别模型中,得到所述目标对象与所述目标刷量识别模型中多个样本刷量群体之间的多个关联度方面,所述运算单元具体用于:
确定所述目标特征集分别与所述目标刷量识别模型中多个样本刷量群体中每一样本刷量群体对应的群体特征集包含的相似特征对的相似特征对数量,得到多个相似特征对数量;
根据预设的相似特征对数量与关联度之间的对应关系确定所述多个相似特征对数量中每一相似特征对数量对应的关联度,得到多个关联度。
可选地,在所述确定所述目标特征集分别与所述目标刷量识别模型中多个样本刷量群体中每一样本刷量群体对应的群体特征集包含的相似特征对的相似特征对数量,得到多个相似特征对数量方面,所述运算单元502具体用于:
将所述目标特征集中的多个目标特征分别与所述目标刷量识别模型中多个样本刷量群体中每一样本刷量群体对应的群体特征集中的多个群体特征进行匹配,得到多个匹配值;
将所述多个匹配值中超过预设匹配值的目标匹配值对应的目标特征和群体特征确定为相似特征对,并统计所述目标特征集分别与所述目标刷量识别模型中多个样本刷量群体中每一样本刷量群体对应的群体特征集包含的相似特征对的相似特征对数量,得到多个相似特征对数量。
可以看出,本申请实施例中所描述的刷量用户识别装置,通过获取多个参考对象中每一参考对象的特征样本集,得到多个特征样本集,根据预设算法对多个特征样本集进行运算,得到目标刷量识别模型,对目标对象进行特征提取,得到目标特征集,将目标特征集输入到目标刷量识别模型进行运算,得到目标对象是否为刷量用户的识别结果,如此,可基于多个参考对象的特征样本集训练目标刷量识别模型,然后根据目标刷量识别模型识别目标对象是否属于刷量用户,从而,可更加准确地识别刷量用户。
可以理解的是,本实施例的刷量用户识别装置的各程序模块的功能可根据上述方法实施例中的方法具体实现,其具体实现过程可以参照上述方法实施例的相关描述,此处不再赘述。
本申请实施例还提供一种计算机存储介质,其中,该计算机存储介质存储用于电子数据交换的计算机程序,该计算机程序使得计算机执行如上述方法实施例中记载的任何一种刷量用户识别方法的部分或全部步骤。
本申请实施例还提供一种计算机程序产品,所述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,所述计算机程序可操作来使计算机执行如上述方法实施例中记载的任何一种刷量用户识别方法的部分或全部步骤。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接, 可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件程序模块的形式实现。
所述集成的单元如果以软件程序模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储器中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储器包括:U盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储器中,存储器可以包括:闪存盘、ROM、RAM、磁盘或光盘等。
以上对本申请实施例进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
Claims (20)
- 一种刷量用户识别方法,其特征在于,所述方法包括:获取多个参考对象中每一参考对象的特征样本集,得到多个特征样本集;根据预设算法对所述多个特征样本集进行运算,得到目标刷量识别模型;对目标对象进行特征提取,得到目标特征集;将所述目标特征集输入到所述目标刷量识别模型进行运算,得到所述目标对象是否为刷量用户的识别结果。
- 根据权利要求1所述的方法,其特征在于,所述根据预设算法对所述多个特征样本集进行运算,得到目标刷量识别模型,包括:根据预设的分类规则和所述多个特征样本集将所述多个参考对象划分为多个第一参考对象和多个第二参考对象,其中,所述第一参考对象为确定属于刷量用户的参考对象,所述第二参考对象为未确定属于刷量用户的参考对象;根据预设的分类监督算法和所述多个第二参考对象对应的多个特征样本集确定所述多个第二参考对象中确定为刷量用户的多个第三参考对象;将所述多个第一参考对象和所述多个第三参考对象对应的多个特征样本集作为正样本,将所述多个第二参考对象中除了所述多个第三参考对象以外的其他第二参考对象作为负样本,进行学习,得到所述目标刷量识别模型。
- 根据权利要求2所述的方法,其特征在于,所述多个特征样本集中每一特征样本集包含多个维度的多个特征样本,所述分类规则包括所述多个维度对应的多个特征规则;所述根据预设的分类规则和所述多个特征样本集将所述多个参考对象划分为多个第一参考对象和多个第二参考对象,包括:根据预设的优先级顺序确定所述多个特征样本集中每一特征样本集包含的优先级最高的特征样本对应的特征规则,得到多个特征规则,所述优先级顺序为预设的所述多个维度的多个特征样本的优先级顺序,所述多个特征规则与所述多个特征样本集一一对应;根据所述多个特征规则中每一特征规则确定对应特征样本集所属的参考对象是否属于刷量用户,得到所述多个参考对象中属于刷量用户的多个第一参考对象和不属于刷量用户的多个第二参考对象。
- 根据权利要求2所述的方法,其特征在于,所述分类规则包括地理位置规则或者应用使用规则,根据预设的分类规则和所述多个特征样本集将所述多个参考对象划分为多个第一参考对象和多个第二参考对象,包括:根据所述地理位置规则和所述多个特征样本集中每一特征样本集包含的位置特征样本确定对应特征样本集所属的参考对象是否属于刷量用户,得到所述多个参考对象中属于刷量用户的多个第一参考对象和不属于刷量用户的多个第二参考对象;或者,根据所述应用使用规则和所述多个特征样本集中每一特征样本集内的应用使用特征样本确定对应特征样本集所属的参考对象是否属于刷量用户,得到所述多个参考对象中属于刷量用户的多个第一参考对象和不属于刷量用户的多个第二参考对象。
- 根据权利要求2-4任一项所述的方法,其特征在于,所述将所述目标特征集输入到所述目标刷量识别模型进行运算,得到所述目标对象是否为刷量用户的识别结果,包括:将所述目标对象的目标特征集输入所述目标刷量识别模型中,得到所述目标对象属于刷量用户的概率值;若所述概率值超过预设概率值,确定所述目标对象为刷量用户。
- 根据权利要求1所述的方法,其特征在于,所述根据预设算法对所述多个特征样本集进行运算,得到目标刷量识别模型,包括:根据预设的非监督分类算法和所述多个特征样本集对所述多个参考对象进行聚类,得到多个样本刷量群体,每一所述样本刷量群体包括同一类的参考对象;将所述多个样本刷量群体中每一样本刷量群体的多个参考对象的多个特征样本集进行训练学习,得到所述目标刷量识别模型。
- 根据权利要求6所述的方法,其特征在于,所述将所述目标特征集输入到所述目标刷量识别模型进行运算,得到所述目标对象是否为刷量用户的识别结果,包括:将所述目标特征集输入所述目标刷量识别模型中,得到所述目标对象与所述目标刷量识别模型中多个样本刷量群体之间的多个关联度,所述多个关联度与所述多个样本刷量群体一一对应;若所述多个关联度中的最大关联度超过预设关联度,确定所述目标对象属于所述最大关联度对应的目标样本刷量群体中的刷量用户。
- 根据权利要求7所述的方法,其特征在于,所述将所述目标特征集输入所述目标刷量识别模型中,得到所述目标对象与所述目标刷量识别模型中多个样本刷量群体之间的多个关联度,包括:确定所述目标特征集分别与所述目标刷量识别模型中多个样本刷量群体中每一样本刷量群体对应的群体特征集包含的相似特征对的相似特征对数量,得到多个相似特征对数量;根据预设的相似特征对数量与关联度之间的对应关系确定所述多个相似特征对数量中每一相似特征对数量对应的关联度,得到多个关联度。
- 根据权利要求8所述的方法,其特征在于,所述确定所述目标特征集分别与所述目标刷量识别模型中多个样本刷量群体中每一样本刷量群体对应的群体特征集包含的相似特征对的相似特征对数量,得到多个相似特征对数量,包括:将所述目标特征集中的多个目标特征分别与所述目标刷量识别模型中多个样本刷量群体中每一样本刷量群体对应的群体特征集中的多个群体特征进行匹配,得到多个匹配值;将所述多个匹配值中超过预设匹配值的目标匹配值对应的目标特征和群体特征确定为相似特征对,并统计所述目标特征集分别与所述目标刷量识别模型中多个样本刷量群体中每一样本刷量群体对应的群体特征集包含的相似特征对的相似特征对数量,得到多个相似特征对数量。
- 一种刷量用户识别装置,其特征在于,所述刷量用户识别装置包括:获取单元,用于获取多个参考对象中每一参考对象的特征样本集,得到多个特征样本集;运算单元,用于根据预设算法对所述多个特征样本集进行运算,得到目标刷量识别模型;提取单元,用于对目标对象进行特征提取,得到目标特征集;所述运算单元,还用于将所述目标特征集输入到所述目标刷量识别模型进行运算,得到所述目标对象是否为刷量用户的识别结果。
- 根据权利要求10所述的装置,其特征在于,在所根据预设算法对所述多个特征样本集进行运算,得到目标刷量识别模型方面,所述运算单元具体用于:根据预设的分类规则和所述多个特征样本集将所述多个参考对象划分为多个第一参考对象和多个第二参考对象,其中,所述第一参考对象为确定属于刷量用户的参考对象,所述第二参考对象为未确定属于刷量用户的参考对象;根据预设的分类监督算法和所述多个第二参考对象对应的多个特征样本集确定所述多个第二参考对象中确定为刷量用户的多个第三参考对象;将所述多个第一参考对象和所述多个第三参考对象对应的多个特征样本集作为正样本,将所述多个第二参考对象中除了所述多个第三参考对象以外的其他第二参考对象作为负样本,进行学习,得到所述目标刷量识别模型。
- 根据权利要求11所述的装置,其特征在于,所述多个特征样本集中每一特征样本集包含多个维度的多个特征样本,所述分类规则包括所述多个维度对应的多个特征规则;在所述根据预设的分类规则和所述多个特征样本集将所述多个参考对象划分为多个第一参考对象和多个第二参考对象方面,所述运算单元具体用于:根据预设的优先级顺序确定所述多个特征样本集中每一特征样本集包含的优先级最高的特征样本对应的特征规则,得到多个特征规则,所述优先级顺序为预设的所述多个维度的多个特征样本的优先级顺序,所述多个特征规则与所述多个特征样本集一一对应;根据所述多个特征规则中每一特征规则确定对应特征样本集所属的参考对象是否属于刷量用户,得到所述多个参考对象中属于刷量用户的多个第一参考对象和不属于刷量用户的多个第二参考对象。
- 根据权利要求11所述的装置,其特征在于,所述分类规则包括地理位置规则或者应用使用规则,在根据预设的分类规则和所述多个特征样本集将所述多个参考对象划分为 多个第一参考对象和多个第二参考对象方面,所述运算单元具体用于:根据所述地理位置规则和所述多个特征样本集中每一特征样本集包含的位置特征样本确定对应特征样本集所属的参考对象是否属于刷量用户,得到所述多个参考对象中属于刷量用户的多个第一参考对象和不属于刷量用户的多个第二参考对象;或者,根据所述应用使用规则和所述多个特征样本集中每一特征样本集内的应用使用特征样本确定对应特征样本集所属的参考对象是否属于刷量用户,得到所述多个参考对象中属于刷量用户的多个第一参考对象和不属于刷量用户的多个第二参考对象。
- 根据权利要求11-13任一项所述的装置,其特征在于,在所述将所述目标特征集输入到所述目标刷量识别模型进行运算,得到所述目标对象是否为刷量用户的识别结果方面,所述运算单元具体用于:将所述目标对象的目标特征集输入所述目标刷量识别模型中,得到所述目标对象属于刷量用户的概率值;若所述概率值超过预设概率值,确定所述目标对象为刷量用户。
- 根据权利要求10所述的装置,其特征在于,在根据预设算法对所述多个特征样本集进行运算,得到目标刷量识别模型方面,所述运算单元具体用于:根据预设的非监督分类算法和所述多个特征样本集对所述多个参考对象进行聚类,得到多个样本刷量群体,每一所述样本刷量群体包括同一聚类的多个参考对象;将所述多个样本刷量群体中每一样本刷量群体的多个参考对象的多个特征样本集进行训练学习,得到所述目标刷量识别模型。
- 根据权利要求15所述的装置,其特征在于,在所述将所述目标特征集输入到所述目标刷量识别模型进行运算,得到所述目标对象是否为刷量用户的识别结果方面,所述运算单元具体用于:将所述目标特征集输入所述目标刷量识别模型中,得到所述目标对象与所述目标刷量识别模型中多个样本刷量群体之间的多个关联度,所述多个关联度与所述多个样本刷量群体一一对应;若所述多个关联度中的最大关联度超过预设关联度,确定所述目标对象属于所述最大关联度对应的目标样本刷量群体中的刷量用户。
- 根据权利要求16所述的装置,其特征在于,在所述将所述目标特征集输入所述目标刷量识别模型中,得到所述目标对象与所述目标刷量识别模型中多个样本刷量群体之间的多个关联度方面,所述运算单元具体用于:确定所述目标特征集分别与所述目标刷量识别模型中多个样本刷量群体中每一样本刷量群体对应的群体特征集包含的相似特征对的相似特征对数量,得到多个相似特征对数量;根据预设的相似特征对数量与关联度之间的对应关系确定所述多个相似特征对数量中 每一相似特征对数量对应的关联度,得到多个关联度。
- 一种电子设备,其特征在于,包括处理器、存储器、通信接口,以及一个或多个程序,所述一个或多个程序被存储在所述存储器中,并且被配置由所述处理器执行,所述程序包括用于执行如权利要求1-9任一项所述的方法中的步骤的指令。
- 一种计算机可读存储介质,其特征在于,存储用于电子数据交换的计算机程序,其中,所述计算机程序使得计算机执行如权利要求1-9任一项所述的方法。
- 一种计算机程序产品,其特征在于,所述计算机程序产品包括存储了计算机程序的计算机可读存储介质,所述计算机程序使得计算机执行如权利要求1-9任一项所述的方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201980091215.XA CN113396414A (zh) | 2019-06-24 | 2019-06-24 | 刷量用户识别方法及相关产品 |
PCT/CN2019/092589 WO2020257988A1 (zh) | 2019-06-24 | 2019-06-24 | 刷量用户识别方法及相关产品 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/CN2019/092589 WO2020257988A1 (zh) | 2019-06-24 | 2019-06-24 | 刷量用户识别方法及相关产品 |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2020257988A1 true WO2020257988A1 (zh) | 2020-12-30 |
Family
ID=74061123
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/CN2019/092589 WO2020257988A1 (zh) | 2019-06-24 | 2019-06-24 | 刷量用户识别方法及相关产品 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN113396414A (zh) |
WO (1) | WO2020257988A1 (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112818868A (zh) * | 2021-02-03 | 2021-05-18 | 招联消费金融有限公司 | 基于行为序列特征数据的违规用户识别方法和装置 |
CN112995689A (zh) * | 2021-02-24 | 2021-06-18 | 上海哔哩哔哩科技有限公司 | 确定直播间刷量的方法及装置 |
CN113129054A (zh) * | 2021-03-30 | 2021-07-16 | 广州博冠信息科技有限公司 | 用户识别方法和装置 |
CN114024737A (zh) * | 2021-11-02 | 2022-02-08 | 上海哔哩哔哩科技有限公司 | 确定直播间刷量的方法及装置 |
CN114650239A (zh) * | 2022-03-23 | 2022-06-21 | 腾讯音乐娱乐科技(深圳)有限公司 | 一种数据的刷量识别方法、存储介质和电子设备 |
WO2022193835A1 (zh) * | 2021-03-15 | 2022-09-22 | 上海哔哩哔哩科技有限公司 | 数据处理方法、直播方法、鉴权服务器及直播数据服务器 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090003703A1 (en) * | 2007-06-26 | 2009-01-01 | Microsoft Corporation | Unifield digital ink recognition |
CN104123500A (zh) * | 2014-07-22 | 2014-10-29 | 卢永强 | 一种基于深度学习的Android平台恶意应用检测方法及装置 |
CN104966161A (zh) * | 2015-06-16 | 2015-10-07 | 北京四方继保自动化股份有限公司 | 一种基于高斯混合模型的电能质量录波数据计算分析方法 |
CN106446754A (zh) * | 2015-08-11 | 2017-02-22 | 阿里巴巴集团控股有限公司 | 图像识别方法、度量学习方法、图像来源识别方法及装置 |
CN109213840A (zh) * | 2018-09-12 | 2019-01-15 | 北京英视睿达科技有限公司 | 基于多维特征深度学习的热点网格识别方法 |
-
2019
- 2019-06-24 WO PCT/CN2019/092589 patent/WO2020257988A1/zh active Application Filing
- 2019-06-24 CN CN201980091215.XA patent/CN113396414A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090003703A1 (en) * | 2007-06-26 | 2009-01-01 | Microsoft Corporation | Unifield digital ink recognition |
CN104123500A (zh) * | 2014-07-22 | 2014-10-29 | 卢永强 | 一种基于深度学习的Android平台恶意应用检测方法及装置 |
CN104966161A (zh) * | 2015-06-16 | 2015-10-07 | 北京四方继保自动化股份有限公司 | 一种基于高斯混合模型的电能质量录波数据计算分析方法 |
CN106446754A (zh) * | 2015-08-11 | 2017-02-22 | 阿里巴巴集团控股有限公司 | 图像识别方法、度量学习方法、图像来源识别方法及装置 |
CN109213840A (zh) * | 2018-09-12 | 2019-01-15 | 北京英视睿达科技有限公司 | 基于多维特征深度学习的热点网格识别方法 |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112818868A (zh) * | 2021-02-03 | 2021-05-18 | 招联消费金融有限公司 | 基于行为序列特征数据的违规用户识别方法和装置 |
CN112995689A (zh) * | 2021-02-24 | 2021-06-18 | 上海哔哩哔哩科技有限公司 | 确定直播间刷量的方法及装置 |
CN112995689B (zh) * | 2021-02-24 | 2023-01-03 | 上海哔哩哔哩科技有限公司 | 确定直播间刷量的方法及装置 |
WO2022193835A1 (zh) * | 2021-03-15 | 2022-09-22 | 上海哔哩哔哩科技有限公司 | 数据处理方法、直播方法、鉴权服务器及直播数据服务器 |
CN113129054A (zh) * | 2021-03-30 | 2021-07-16 | 广州博冠信息科技有限公司 | 用户识别方法和装置 |
CN114024737A (zh) * | 2021-11-02 | 2022-02-08 | 上海哔哩哔哩科技有限公司 | 确定直播间刷量的方法及装置 |
CN114024737B (zh) * | 2021-11-02 | 2023-10-17 | 上海哔哩哔哩科技有限公司 | 确定直播间刷量的方法、装置及计算机可读存储介质 |
CN114650239A (zh) * | 2022-03-23 | 2022-06-21 | 腾讯音乐娱乐科技(深圳)有限公司 | 一种数据的刷量识别方法、存储介质和电子设备 |
CN114650239B (zh) * | 2022-03-23 | 2024-02-23 | 腾讯音乐娱乐科技(深圳)有限公司 | 一种数据的刷量识别方法、存储介质和电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN113396414A (zh) | 2021-09-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2020257988A1 (zh) | 刷量用户识别方法及相关产品 | |
WO2021003673A1 (zh) | 内容推送方法及相关产品 | |
CN105447036B (zh) | 一种基于观点挖掘的社交媒体信息可信度评估方法及装置 | |
CN108153463B (zh) | 应用界面显示控制方法、装置及存储介质和移动终端 | |
CN107947951A (zh) | 用户群组推荐方法、装置及存储介质和服务器 | |
CN107608532A (zh) | 一种联想输入方法、装置及电子设备 | |
WO2021120875A1 (zh) | 搜索方法、装置、终端设备及存储介质 | |
WO2020257990A1 (zh) | 设备推荐方法及相关产品 | |
CN113940033B (zh) | 用户识别方法及相关产品 | |
CN112329926A (zh) | 智能机器人的质量改善方法及系统 | |
CN105955507B (zh) | 一种软键盘的显示方法以及终端 | |
CN113396433B (zh) | 用户画像构建方法及相关产品 | |
WO2020133435A1 (zh) | 信息提示方法及相关产品 | |
CN106294087B (zh) | 一种对业务执行操作的操作频率的统计方法及装置 | |
CN107256334A (zh) | 食谱搭配方法及相关产品 | |
CN107317917B (zh) | 应用控制方法及相关产品 | |
CN116307394A (zh) | 产品用户体验评分方法、装置、介质及设备 | |
WO2019041285A1 (zh) | 联想词推荐方法、移动终端以及计算机可读存储介质 | |
CN110298277A (zh) | 指纹识别方法及相关产品 | |
CN109144721A (zh) | 资源排序方法、资源显示方法、相关装置及存储介质 | |
CN112329462B (zh) | 一种数据排序方法、装置、电子设备及存储介质 | |
WO2020252742A1 (zh) | 资源推送方法及相关产品 | |
CN105898053A (zh) | 一种通信记录处理设备、方法以及移动终端 | |
CN107846493B (zh) | 通话联系人控制方法、装置及存储介质和移动终端 | |
WO2020147007A1 (zh) | 信息推送方法及相关产品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 19934676 Country of ref document: EP Kind code of ref document: A1 |
|
NENP | Non-entry into the national phase |
Ref country code: DE |
|
32PN | Ep: public notification in the ep bulletin as address of the adressee cannot be established |
Free format text: NOTING OF LOSS OF RIGHTS PURSUANT TO RULE 112(1) EPC (EPO FORM 1205N DATED 15/02/2022) |
|
122 | Ep: pct application non-entry in european phase |
Ref document number: 19934676 Country of ref document: EP Kind code of ref document: A1 |