CN113412607B - 内容推送方法、装置、移动终端及存储介质 - Google Patents
内容推送方法、装置、移动终端及存储介质 Download PDFInfo
- Publication number
- CN113412607B CN113412607B CN201980091547.8A CN201980091547A CN113412607B CN 113412607 B CN113412607 B CN 113412607B CN 201980091547 A CN201980091547 A CN 201980091547A CN 113412607 B CN113412607 B CN 113412607B
- Authority
- CN
- China
- Prior art keywords
- natural person
- user
- target
- ids
- target natural
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L9/00—Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
- H04L9/40—Network security protocols
Landscapes
- Engineering & Computer Science (AREA)
- Computer Security & Cryptography (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Transfer Between Computers (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
一种内容推送方法,包括:抓取M个用户标识ID,确定与所述M个用户ID对应的N个自然人ID;检测目标自然人ID是否为异常自然人ID,所述目标自然人ID为所述N个自然人ID中的任意一个;若是,拒绝向所述目标自然人ID进行内容推送。该方法可以提高内容推送的准确性。
Description
技术领域
本申请涉及通信技术领域,具体涉及一种内容推送方法、装置、移动终端及存储介质。
背景技术
目前,服务端(比如,服务器)向用户端(比如,应用程序客户端)进行内容推送时,一般根据登录用户端的用户标识(Identity,ID)的兴趣、爱好等用户画像进行内容推送。然而,一旦用户ID的用户画像判断有误,则服务端向客户端会推送错误的内容。
发明内容
本申请实施例提供了一种内容推送方法、装置、移动终端及存储介质,可以提高内容推送的准确性。
第一方面,本申请实施例提供一种内容推送方法,包括:
抓取M个用户标识ID,确定与所述M个用户ID对应的N个自然人ID,M、N均为正整数,N小于或等于M;
检测目标自然人ID是否为异常自然人ID,所述目标自然人ID为所述N个自然人ID中的任意一个;
若是,拒绝向所述目标自然人ID进行内容推送。
第二方面,本申请实施例提供了一种内容推送装置,所述内容推送装置包括抓取单元、确定单元、检测单元和处理单元,其中:
所述抓取单元,用于抓取M个用户标识ID;
所述确定单元,用于确定与所述M个用户ID对应的N个自然人ID,M、N均为正整数,N小于或等于M;
所述检测单元,用于检测目标自然人ID是否为异常自然人ID,所述目标自然人ID为所述N个自然人ID中的任意一个;
所述处理单元,用于在所述检测单元检测出所述目标自然人ID为异常自然人ID的情况下,拒绝向所述目标自然人ID进行内容推送。
第三方面,本申请实施例提供一种移动终端,包括处理器、存储器,所述存储器用于存储一个或多个程序,所述一个或多个程序被配置成由所述处理器执行,上述程序包括用于执行本申请实施例第一方面中的步骤的指令。
第四方面,本申请实施例提供了一种计算机可读存储介质,其中,上述计算机可读存储介质存储用于电子数据交换的计算机程序,其中,上述计算机程序使得计算机执行如本申请实施例第一方面中所描述的部分或全部步骤。
第五方面,本申请实施例提供了一种计算机程序产品,其中,上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,上述计算机程序可操作来使计算机执行如本申请实施例第一方面中所描述的部分或全部步骤。该计算机程序产品可以为一个软件安装包。
可以看出,本申请实施例中所描述的内容推送方法,具体包括如下步骤:抓取M个用户标识ID,确定与M个用户ID对应的N个自然人ID,其中,M、N均为正整数,N小于或等于M;检测目标自然人ID是否为异常自然人ID,目标自然人ID为N个自然人ID中的任意一个;若是,拒绝向目标自然人ID进行内容推送。实施本申请实施例,首先将M个用户ID转换为N个自然人ID,减小推送的ID的数量,然后识别自然人ID中的异常自然人ID,不向异常自然人ID进行内容推送,进一步缩小推送的自然人ID的数量,可以避免向异常自然人ID进行内容推送,提高内容推送的准确性,由于符合推送条件的自然人ID的数量要小于M个用户标识ID,可以降低服务端内容推送的压力,从而提高内容推送的速度。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例公开的一种内容推送方法的流程示意图;
图2是本申请实施例公开的一种判断自然人ID是否为代用ID的示意图;
图3是本申请实施例公开的另一种内容推送方法的流程示意图;
图4是本申请实施例公开的一种内容推送装置的结构示意图;
图5是本申请实施例公开的一种移动终端的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本发明的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
本申请实施例所涉及到的移动终端可以包括各种具有无线通信功能的手持设备、车载设备、可穿戴设备、计算设备或连接到无线调制解调器的其他处理设备,以及各种形式的用户设备(User Equipment,UE),移动台(Mobile Station,MS),终端设备(terminaldevice)等等。为方便描述,上面提到的设备统称为移动终端。
下面对本申请实施例进行详细介绍。
请参阅图1,图1是本申请实施例公开的一种内容推送方法的流程示意图,如图1所示,该内容推送方法包括如下步骤。
101,服务端抓取M个用户标识ID,确定与M个用户ID对应的N个自然人ID,M、N均为正整数,N小于或等于M。
本申请实施例中,服务端是为客户端服务的,服务的内容诸如向客户端提供资源,保存客户端数据等。服务端是一种有针对性的服务程序,运行服务端的设备可以称为服务器。服务端可以同时与多个客户端建立连接,可以同时为多个客户端提供服务。本申请实施例中服务端为客户端提供的服务主要包括内容推送服务。内容推送服务可以包括:浏览器内容推送服务、应用程序下载推送服务、游戏内容推送服务等。服务端可以包括应用程序服务端、浏览器服务端、游戏服务端等。
服务端可以从数据库中抓取M个用户标识(identity,ID),可以向这M个用户ID所登录的客户端推送特定的内容。用户ID可以包括如下任意一种或多种类型:单点登录标识(single sign on identity,SSOID)、OpenID、集成电路卡识别码(Integrate circuitcard identity,ICCID)、国际移动设备识别码(International Mobile EquipmentIdentity,IMEI)、电话号码(telephone,TEL)等。SSO是在多个应用系统中,用户只需登录一次就可以访问所有相互信任的应用系统。
服务端可以从数据库中随机抓取M个用户ID,后续可以向这M个用户ID中对应的N个自然人ID中的正常自然人ID进行不同的内容推送。服务端也可以从数据库中抓取具有相同特征的M个用户ID,后续可以向这M个用户ID中对应的N个自然人ID中的正常自然人ID进行相同的内容推送。
服务端确定与M个用户ID对应的N个自然人ID,具体可以为:服务端根据已经生成的用户ID与自然人ID的对应关系确定与M个用户ID对应的N个自然人ID。
第一种情况:若M个用户ID均在上述已经生成的用户ID与自然人ID的对应关系中,则直接按照上述方法确定与M个用户ID对应的N个自然人ID。
第二中情况:若M个用户ID都不在上述已经生成的用户ID与自然人ID的对应关系中,则服务端可以获取上述已经生成的用户ID与自然人ID的对应关系中的所有自然人ID,根据M个用户ID的用户行为数据分析该M个用户ID与上述所有自然人ID中每个自然人ID的相似度,如果第一用户ID(第一用户ID为上述M个用户ID中的任一个)与上述所有自然人ID中相似度最高的自然人ID的相似度大于预设相似度阈值,则将第一用户ID与上述所有自然人ID中相似度最高的自然人ID建立对应关系,如果第一用户ID与上述所有自然人ID中相似度最高的自然人ID的相似度大于预设相似度阈值,则将第一用户ID的用户行为数据与数据库中的其他用户ID的用户行为数据进行匹配,若第一用户ID的用户行为数据与上述数据库中的其他用户ID中相似度最高的用户ID的相似度大于预设相似度阈值,则将第一用户ID与上述数据库中的其他用户ID中相似度最高的用户ID建立对应关系,形成新的自然人ID,该新的自然人ID对应该第一用户ID和上述数据库中的其他用户ID中相似度最高的用户ID。
第三中情况:若M个用户ID有部分在上述已经生成的用户ID与自然人ID的对应关系中,有另外一部分不在上述已经生成的用户ID与自然人ID的对应关系中,则在上述已经生成的用户ID与自然人ID的对应关系中的用户ID直接按照对应关系确定对应的自然人ID,不在上述已经生成的用户ID与自然人ID的对应关系中的用户ID按照上述第二种情况的方法确定与之对应的自然人ID。
其中,本申请实施例中的自然人ID会对应一个自然人。这个自然人可能会对应至少一个移动终端(比如,手机)、至少一个电话号码、至少一个应用程序账号、至少一个OpenID、一个SSOID、至少一个ICCID、至少一个IMEI。比如说,一个自然人有用一部手机、一个电话号码、5个应用程序账号,则将手机的IMEI、电话号码、5个应用程序账号打上一个自然人ID的标签。这5个应用程序账号对应的用户行为数据都属于这个自然人ID的用户行为数据。这样,一个真实的自然人,可以有很多个用户ID(比如,一个手机的IMEI、一个电话号码、5个应用程序账号),但是却只对应一个唯一的自然人ID。
102,服务端检测目标自然人ID是否为异常自然人ID,目标自然人ID为上述N个自然人ID中的任意一个。若是,则执行步骤103,若否,则执行步骤104。
本申请实施例中,异常自然人ID包括:该异常自然人ID对应的所有用户ID长时间处于离线状态、该异常自然人ID对应的所有用户ID中存在登录异常的用户ID(比如,某个应用程序账号被盗号后向联系人列表中的好友发送大量的垃圾消息)、该异常自然人ID对应的所有用户ID中存在刷量行为的用户ID(比如,该用户ID频繁的下载和卸载应用程序,该用户ID大量的充值账号等)、该异常自然人ID对应的所有用户ID中存在代用行为的用户ID(比如,该用户ID的用户行为习惯与之前的用户行为习惯差别很大)。
如果服务端检测到目标自然人ID为异常自然人ID,则不会向该目标自然人ID进行内容推送,减少不必要的内容推送,降低服务端内容推送的压力,从而提高内容推送的速度。
如果服务端检测到目标自然人ID不是异常自然人ID,则向该目标自然人ID进行内容推送。具体的,服务端可以向该目标自然人ID对应的多个用户ID中的任意一个进行内容推送。举例来说,如果该目标自然人ID对应5个不同的应用程序账号(比如,A浏览器应用程序账号、B浏览器应用程序账号、C浏览器应用程序账号、D浏览器应用程序账号、E浏览器应用程序账号),如果有突发性新闻,则服务端只需向这5个不同的应用程序账号中的其中一个发送推送该突发性新闻消息即可,因而无需向另外4个应用程序账号发送相同的推送消息,可以提高消息推送的效率,避免消息重复推送。
其中,服务端推送的内容可以是通知类消息(比如,新闻类消息)、营销类消息(比如,商品促销信息)等。
可选的,步骤102中,服务端检测目标自然人ID是否为异常自然人ID,包括:
(11)服务端获取目标自然人ID的用户行为数据,基于目标自然人ID的用户行为数据分析目标自然人ID是否为刷量ID;
(12)若目标自然人ID为刷量ID,服务端确定目标自然人ID为异常自然人ID;
(13)若目标自然人ID不是刷量ID,服务端采用机器学习算法检测目标自然人ID是否为代用ID;
(14)若目标自然人ID为代用ID,服务端确定目标自然人ID为异常自然人ID。
本申请实施例中,服务端首先分析目标自然人ID是否为刷量ID,若是刷量ID,则认为该目标自然人ID为异常自然人ID,若不是刷量ID,则进一步检测该目标自然人ID是否为代用ID,若是代用ID,则认为该目标自然人ID为异常自然人ID,若不是代用ID,则认为该目标自然人ID为正常自然人ID,是属于符合内容推送条件的自然人ID。
其中,刷量用户的最核心的诉求是获取更多的关注,从而带来更大的流量,吸引更多用户。通过观察大盘用户的用户行为数据发现刷量用户几个比较明显的特征:对于软件商店来说,刷量用户更多是刷下载,对游戏来说刷充值,想让平台给其更好的展示位置,这种用户跟正常用户相比是比较容易识别出来的,观察大盘用户的行为分布情况,就能制定相应的规则条件,初步剔除非常明显的刷量用户。
刷量ID具有一定的行为特征:比如,对于刷APP排行榜的刷量ID而言,每天安装的APP的次数100+次、每天卸载的APP的次数100+次、该刷量ID一直定位在同一个地方、该刷量ID购买一月的VIP,仅活跃了一周甚至一两天、该刷量ID的付费额度3000+,等等。
相较于刷量ID,代用ID则难以识别,本申请实施例采用机器学习算法检测目标自然人ID是否为代用ID。具体的,本申请实施例可以根据用户位置特征,出行偏好,APP使用习惯和兴趣,设备使用特征,以及设备自身对应的唯一标识,利用机器学习中随机森林,决策树,xgboost,局部敏感哈希(Locality-Sensitive Hashing,LSH),图数据库方法将各个信息孤岛连接起来,从而丰富一个用户使用设备的正常生命周期。举例来说,请参阅图2,图2是本申请实施例公开的一种判断自然人ID是否为代用ID的示意图。如图2所示,服务端预先获取用户通过多个应用ID登录的多个应用数据,根据该多个应用数据确定多组特征,对该多组特征进行训练,得到一个机器学习模型,在用户每次登录后,采集当前的一些数据,并进行特征提取,得到特征,将特征输入到机器学习模型,得到账号的代用权重值,从而更好判断这个账号是否是有代用行为。
可选的,上述用户行为数据包括应用程序安装数据、应用程序卸载数据以及付费额度,上述步骤(11)中,服务端基于目标自然人ID的用户行为数据分析目标自然人ID是否为刷量ID,具体为:
(111)服务端检测目标自然人ID的应用程序安装数据中是否存在单日安装总量大于预设安装数量上限阈值的数据;检测目标自然人ID的应用程序卸载数据中是否存在单日卸载总量大于预设卸载数量上限阈值的数据;检测目标自然人ID的付费额度是否超过预设额度阈值;
(112)若目标自然人ID的应用程序安装数据中存在单日安装总量大于预设安装数量上限阈值的数据,并且目标自然人ID的应用程序卸载数据中存在单日卸载总量大于预设卸载数量上限阈值的数据,并且目标自然人ID的付费额度超过预设额度阈值,服务端确定目标自然人ID为刷量ID。
本申请实施例中,目标自然人ID的用户行为数据可以包括该目标自然人ID对应的多个用户ID的用户行为数据。比如,该目标自然人ID对应的5个应用程序账号,则该目标自然人ID的用户行为数据包括5个应用程序账号的用户行为数据。只要这5个应用程序账号的其中任意一个的用户行为数据异常,则认为该目标自然人ID为异常自然人ID。用户行为数据可以包括:应用程序安装数据、应用程序卸载数据、付费额度、应用程序活跃数据、定位数据等。
可选的,若目标自然人ID的应用程序安装数据中存在单日安装总量大于预设安装数量上限阈值的数据,并且目标自然人ID的定位数据在预设时长内没有发生变化,则服务端确定目标自然人ID为刷量ID;
若目标自然人ID的应用程序卸载数据中存在单日卸载总量大于预设卸载数量上限阈值的数据,并且目标自然人ID的定位数据在预设时长内没有发生变化,则服务端确定目标自然人ID为刷量ID;
若目标自然人ID的付费额度超过预设额度阈值,并且目标自然人ID的定位数据在预设时长内没有发生变化,则服务端确定目标自然人ID为刷量ID。
本申请实施例提供一种确定目标自然人ID是否为刷量ID的方法,可以快速识别目标自然人ID是否为刷量ID,避免后续向刷量ID进行内容推送,降低服务端内容推送的压力。
可选的,上述(13)中,服务端采用机器学习算法检测目标自然人ID是否为代用ID,具体为:
(131)服务端确定目标自然人ID对应的至少一个用户ID;
(132)在目标自然人ID对应的第一用户ID登录目标设备后,服务端获取目标设备的位置特征、第一用户ID的出行偏好特征、第一用户ID的应用程序使用习惯特征、第一用户ID的兴趣特征、目标设备的设备使用特征以及目标设备标识;第一用户ID为至少一个用户ID中的任意一个;
(133)服务端将目标设备的位置特征、第一用户ID的出行偏好特征、第一用户ID的应用程序使用习惯特征、第一用户ID的兴趣特征、目标设备的设备使用特征以及目标设备标识输入训练好的机器学习模型,得到第一用户ID的代用权重值;
(134)若第一用户ID的代用权重值大于预设权重阈值,服务端确定目标自然人ID为代用ID。
本申请实施例中,目标设备的位置特征可以从目标设备周期性上报的GPS位置信息中提取。出行偏好特征可以从第一用户ID上报的行程单、GPS位置信息中提取。第一用户ID的应用程序使用习惯特征可以从第一用户ID上报的应用程序开启时间点、应用程序关闭时间点、应用程序的亮度、应用程序的音量、应用程序功能使用情况、应用程序持续运行时长、应用程序累计运行时长中提取。第一用户ID的兴趣特征可以从第一用户ID上报的网页浏览记录、收藏记录、搜索记录从提取。目标设备的设备使用特征可以从目标设备的使用习惯(比如,目标设备的开机时间、关机时间、目标设备的背光亮度、目标设备的音量、目标设备的握持姿势等)中提取。
其中,训练好的机器学习模型可以根据该目标自然人ID对应的至少一个用户ID的历史用户行为数据进行训练得到。
本申请实施例中,训练好的机器学习模型是基于该目标自然人ID对应的所有用户ID的历史用户行为数据进行训练得到,该训练好的机器学习模型可以较好的反映一个用户使用设备的习惯,后续当该自然人ID对应的用户ID登录后,可以将该自然人ID对应的该用户ID的用户行为数据输入该训练好的机器学习模型,得到代用权重值。一般而言,代用权重值越高,则表明该用户ID被代用的可能性越高。预设权重阈值可以预先进行设定,用于对用户ID的代用行为进行判断。如图2所示,自然人ID对应三个用户ID(openid1、openid2、openid3),APP规则包括应用程序使用习惯特征,地理位置规则包括目标设备的位置特征,账号体系规则包括出行偏好特征、兴趣特征。可以设置预设权重阈值为0.5,则对于openid1而言,则认定为代用ID,对于openid2和openid3而言,则认定为自用ID。由于该自然人ID对应的三个用户ID有一个用户ID为代用ID,则可以判定该自然人ID为异常自然人ID。
可选的,在执行步骤(131)之前,还可以执行如下步骤:
服务端预先获取至少一个用户ID上报的多个应用数据,根据多个应用数据确定多组特征,对多组特征进行训练,得到训练好的机器学习模型。
本申请实施例中,训练好的机器学习模型是服务端根据预先获取的该目标自然人ID对应的至少一个用户ID上报的多个应用数据中提取的多组特征(APP特征、位置特征、目标设备使用特征)进行训练得到的,该训练好的机器学习模型的是针对该目标自然人ID的用户习惯确定的,可以准确的非该目标自然人的其他自然人的使用进行甄别,准确的识别出用户ID是否出现代用情况。
103,服务端拒绝向目标自然人ID进行内容推送。
104,服务端向目标自然人ID进行内容推送。
本申请实施例中,首先将M个用户ID转换为N个自然人ID,减小推送的ID的数量,然后识别自然人ID中的异常自然人ID,不向异常自然人ID进行内容推送,进一步缩小推送的自然人ID的数量,可以避免向异常自然人ID进行内容推送,提高内容推送的准确性,由于符合推送条件的自然人ID的数量要小于M个用户标识ID,可以降低服务端内容推送的压力,从而提高内容推送的速度。
本申请实施例,可以识别正常自然人ID和异常自然人ID(虚假用户、干扰用户),及时剔除异常自然人ID,减少不必要的经济和分析损失;对正常自然人ID进行内容推送,从而提高推送的准确性,减少资源浪费,并且能实现精准运营。
请参阅图3,图3是本申请实施例公开的另一种内容推送方法的流程示意图。图3是在图1的基础上进一步优化得到的,如图3所示,该内容推送方法包括如下步骤。
301,服务端获取多个客户端上报的多个用户ID的行为数据,使用图存储计算引擎计算所述多个用户ID的行为数据之间的相似度。
302,服务端基于所述多个用户ID的行为数据之间的相似度构建用户ID之间的关系对。
303,服务端根据所述用户ID之间的关系对构建用户ID与自然人ID的对应关系。
本申请实施例中,图存储计算引擎,也可以称为图计算引擎,图存储计算引擎采用网页排名(PageRank)算法、最短路径算法、交替最小二乘(Alternating Least Squares,ALS)算法计算所述多个用户ID的行为数据之间的相似度。将相似度大于预设相似度阈值的用户ID建立关系对。比如,SSOID1<->IMEI2,OPENID1<->ICCID3,SSOID2<->TEL2,IMEI2<->TEL3,IMEI2<->ICCID1,SSOID2<->OPENID1,IMEI1<->SSOID2。则SSOID1、IMEI2、TEL3、ICCID1对应一个自然人ID(比如,自然人ID1),OPENID1、ICCID3、SSOID2、TEL2、IMEI1对应另一个自然人ID(比如,自然人ID2)。具体可以参见表1。
表1
用户ID | 自然人ID |
SSOID1、IMEI2、TEL3、ICCID1 | 自然人ID1 |
OPENID1、ICCID3、SSOID2、TEL2、IMEI1 | 自然人ID2 |
表1是本申请实施例公开的一种用户ID与自然人ID的对应关系表。如表1所示,自然人ID1与SSOID1、IMEI2、TEL3、ICCID1的对应、自然人ID2与OPENID1、ICCID3、SSOID2、TEL2、IMEI1的对应。
304,服务端抓取M个用户标识ID,服务端获取用户ID与自然人ID的对应关系。
305,服务端根据该用户ID与自然人ID的对应关系确定与M个用户ID对应的N个自然人ID。
本申请实施中,用户ID与自然人ID的对应关系可以预先获取。可以在步骤301至步骤303中确定用户ID与自然人ID的对应关系。步骤304在步骤301至步骤303之后执行,用户ID与自然人ID的对应关系无需实时生成,可以快速确定M个用户ID对应的N个自然人ID。
306,服务端检测目标自然人ID是否为异常自然人ID,目标自然人ID为上述N个自然人ID中的任意一个。若是,则执行步骤307,若否,则执行步骤308。
307,服务端拒绝向目标自然人ID进行内容推送。
308,服务端向目标自然人ID进行内容推送。
本申请实施例中的步骤306至步骤308的具体实施可以参见图1所示的步骤102至步骤104的描述,此处不再赘述。
本申请实施例中,首先根据用户ID与自然人ID的对应关系将M个用户ID转换为N个自然人ID,减小推送的ID的数量,然后识别自然人ID中的异常自然人ID,不向异常自然人ID进行内容推送,进一步缩小推送的自然人ID的数量,可以避免向异常自然人ID进行内容推送,提高内容推送的准确性,由于符合推送条件的自然人ID的数量要小于M个用户标识ID,可以降低服务端内容推送的压力,从而提高内容推送的速度。
上述主要从方法侧执行过程的角度对本申请实施例的方案进行了介绍。可以理解的是,移动终端为了实现上述功能,其包含了执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,本发明能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
本申请实施例可以根据上述方法示例对移动终端进行功能单元的划分,例如,可以对应各个功能划分各个功能单元,也可以将两个或两个以上的功能集成在一个处理单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。需要说明的是,本申请实施例中对单元的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
请参阅图4,图4是本申请实施例公开的一种内容推送装置的结构示意图。如图4所示,该内容推送装置400包括抓取单元401、确定单元402、检测单元403和处理单元404,其中:
所述抓取单元401,用于抓取M个用户标识ID;
所述确定单元402,用于确定与所述M个用户ID对应的N个自然人ID,M、N均为正整数,N小于或等于M;
所述检测单元403,用于检测目标自然人ID是否为异常自然人ID,所述目标自然人ID为所述N个自然人ID中的任意一个;
所述处理单元404,用于在所述检测单元403检测出所述目标自然人ID为异常自然人ID的情况下,拒绝向所述目标自然人ID进行内容推送。
可选的,所述处理单元404,还用于在所述检测单元403检测出所述目标自然人ID不是异常自然人ID的情况下,向所述目标自然人ID进行内容推送。
可选的,所述检测单元403检测目标自然人ID是否为异常自然人ID,具体为:获取所述目标自然人ID的用户行为数据,基于所述目标自然人ID的用户行为数据分析所述目标自然人ID是否为刷量ID;若所述目标自然人ID为刷量ID,则确定所述目标自然人ID为异常自然人ID;若所述目标自然人ID不是刷量ID,采用机器学习算法检测所述目标自然人ID是否为代用ID;若所述目标自然人ID为代用ID,则确定所述目标自然人ID为异常自然人ID。
可选的,所述用户行为数据包括应用程序安装数据、应用程序卸载数据以及付费额度,所述检测单元403基于所述目标自然人ID的用户行为数据分析所述目标自然人ID是否为刷量ID,具体为:检测所述目标自然人ID的应用程序安装数据中是否存在单日安装总量大于预设安装数量上限阈值的数据;检测所述目标自然人ID的应用程序卸载数据中是否存在单日卸载总量大于预设卸载数量上限阈值的数据;检测所述目标自然人ID的付费额度是否超过预设额度阈值;若所述目标自然人ID的应用程序安装数据中存在单日安装总量大于所述预设安装数量上限阈值的数据,并且所述目标自然人ID的应用程序卸载数据中存在单日卸载总量大于所述预设卸载数量上限阈值的数据,并且所述目标自然人ID的付费额度超过所述预设额度阈值,则确定目标自然人ID为刷量ID。
可选的,所述检测单元403采用机器学习算法检测所述目标自然人ID是否为代用ID,具体为:确定所述目标自然人ID对应的至少一个用户ID;在所述目标自然人ID对应的第一用户ID登录目标设备后,获取所述目标设备的位置特征、所述第一用户ID的出行偏好特征、所述第一用户ID的应用程序使用习惯特征、所述第一用户ID的兴趣特征、所述目标设备的设备使用特征以及目标设备标识;所述第一用户ID为所述至少一个用户ID中的任意一个;将所述目标设备的位置特征、所述第一用户ID的出行偏好特征、所述第一用户ID的应用程序使用习惯特征、所述第一用户ID的兴趣特征、所述目标设备的设备使用特征以及目标设备标识输入训练好的机器学习模型,得到所述第一用户ID的代用权重值;若所述第一用户ID的代用权重值大于预设权重阈值,则确定所述目标自然人ID为代用ID。
可选的,所述检测单元403确定所述目标自然人ID对应的至少一个用户ID之前,还用于预先获取所述至少一个用户ID上报的多个应用数据,根据所述多个应用数据确定多组特征,对所述多组特征进行训练,得到训练好的机器学习模型。
可选的,所述确定单元402确定与所述M个用户ID对应的N个自然人ID,具体为:获取用户ID与自然人ID的对应关系;根据所述用户ID与自然人ID的对应关系确定与所述M个用户ID对应的N个自然人ID。
可选的,所述确定单元402获取用户ID与自然人ID的对应关系之前,还用于获取多个客户端上报的多个用户ID的行为数据,使用图存储计算引擎计算所述多个用户ID的行为数据之间的相似度;基于所述多个用户ID的行为数据之间的相似度构建用户ID之间的关系对;根据所述用户ID之间的关系对构建用户ID与自然人ID的对应关系。
实施图4所示的内容推送装置,首先将M个用户ID转换为N个自然人ID,减小推送的ID的数量,然后识别自然人ID中的异常自然人ID,不向异常自然人ID进行内容推送,进一步缩小推送的自然人ID的数量,可以避免向异常自然人ID进行内容推送,提高内容推送的准确性,由于符合推送条件的自然人ID的数量要小于M个用户标识ID,可以降低服务端内容推送的压力,从而提高内容推送的速度。
请参阅图5,图5是本申请实施例公开的一种移动终端的结构示意图。如图5所示,该移动终端500包括处理器501和存储器502,其中,移动终端500还可以包括总线503,处理器501和存储器502可以通过总线503相互连接,总线503可以是外设部件互连标准(Peripheral Component Interconnect,简称PCI)总线或扩展工业标准结构(ExtendedIndustry Standard Architecture,简称EISA)总线等。总线503可以分为地址总线、数据总线、控制总线等。为便于表示,图5中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。其中,移动终端500还可以包括输入输出设备504,输入输出设备504可以包括显示屏,例如液晶显示屏。存储器502用于存储包含指令的一个或多个程序;处理器501用于调用存储在存储器502中的指令执行上述图1至图3中的部分或全部方法步骤。
实施图5所示的移动终端,首先将M个用户ID转换为N个自然人ID,减小推送的ID的数量,然后识别自然人ID中的异常自然人ID,不向异常自然人ID进行内容推送,进一步缩小推送的自然人ID的数量,可以避免向异常自然人ID进行内容推送,提高内容推送的准确性,由于符合推送条件的自然人ID的数量要小于M个用户标识ID,可以降低服务端内容推送的压力,从而提高内容推送的速度。
本申请实施例还提供一种计算机存储介质,其中,该计算机存储介质存储用于电子数据交换的计算机程序,该计算机程序使得计算机执行如上述方法实施例中记载的任何一种内容推送方法的部分或全部步骤。
本申请实施例还提供一种计算机程序产品,该计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,该计算机程序可操作来使计算机执行如上述方法实施例中记载的任何一种内容推送方法的部分或全部步骤。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储器中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储器包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储器中,存储器可以包括:闪存盘、只读存储器(英文:Read-Only Memory,简称:ROM)、随机存取器(英文:Random Access Memory,简称:RAM)、磁盘或光盘等。
以上对本申请实施例进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (9)
1.一种内容推送方法,其特征在于,包括:
抓取M个用户ID,确定与所述M个用户ID对应的N个自然人ID,M、N均为正整数,N小于或等于M;
检测目标自然人ID是否为异常自然人ID,所述目标自然人ID为所述N个自然人ID中的任意一个;
若是,拒绝向所述目标自然人ID进行内容推送;
若否,向所述目标自然人ID进行内容推送;
所述检测目标自然人ID是否为异常自然人ID,包括:
获取所述目标自然人ID的用户行为数据,基于所述目标自然人ID的用户行为数据分析所述目标自然人ID是否为刷量ID;
若所述目标自然人ID为刷量ID,则确定所述目标自然人ID为异常自然人ID;
若所述目标自然人ID不是刷量ID,采用机器学习算法检测所述目标自然人ID是否为代用ID;
若所述目标自然人ID为代用ID,则确定所述目标自然人ID为异常自然人ID。
2.根据权利要求1所述的方法,其特征在于,所述用户行为数据包括应用程序安装数据、应用程序卸载数据以及付费额度,所述基于所述目标自然人ID的用户行为数据分析所述目标自然人ID是否为刷量ID,包括:
检测所述目标自然人ID的应用程序安装数据中是否存在单日安装总量大于预设安装数量上限阈值的数据;检测所述目标自然人ID的应用程序卸载数据中是否存在单日卸载总量大于预设卸载数量上限阈值的数据;检测所述目标自然人ID的付费额度是否超过预设额度阈值;
若所述目标自然人ID的应用程序安装数据中存在单日安装总量大于所述预设安装数量上限阈值的数据,并且所述目标自然人ID的应用程序卸载数据中存在单日卸载总量大于所述预设卸载数量上限阈值的数据,并且所述目标自然人ID的付费额度超过所述预设额度阈值,则确定目标自然人ID为刷量ID。
3.根据权利要求1所述的方法,其特征在于,所述采用机器学习算法检测所述目标自然人ID是否为代用ID,包括:
确定所述目标自然人ID对应的至少一个用户ID;
在所述目标自然人ID对应的第一用户ID登录目标设备后,获取所述目标设备的位置特征、所述第一用户ID的出行偏好特征、所述第一用户ID的应用程序使用习惯特征、所述第一用户ID的兴趣特征、所述目标设备的设备使用特征以及目标设备标识;所述第一用户ID为所述至少一个用户ID中的任意一个;
将所述目标设备的位置特征、所述第一用户ID的出行偏好特征、所述第一用户ID的应用程序使用习惯特征、所述第一用户ID的兴趣特征、所述目标设备的设备使用特征以及目标设备标识输入训练好的机器学习模型,得到所述第一用户ID的代用权重值;
若所述第一用户ID的代用权重值大于预设权重阈值,则确定所述目标自然人ID为代用ID。
4.根据权利要求3所述的方法,其特征在于,所述确定所述目标自然人ID对应的至少一个用户ID之前,所述方法还包括:
预先获取所述至少一个用户ID上报的多个应用数据,根据所述多个应用数据确定多组特征,对所述多组特征进行训练,得到训练好的机器学习模型。
5.根据权利要求1~4任一项所述的方法,其特征在于,所述确定与所述M个用户ID对应的N个自然人ID,包括:
获取用户ID与自然人ID的对应关系;
根据所述用户ID与自然人ID的对应关系确定与所述M个用户ID对应的N个自然人ID。
6.根据权利要求5所述的方法,其特征在于,所述获取用户ID与自然人ID的对应关系之前,所述方法还包括:
获取多个客户端上报的多个用户ID的行为数据,使用图存储计算引擎计算所述多个用户ID的行为数据之间的相似度;
基于所述多个用户ID的行为数据之间的相似度构建用户ID之间的关系对;
根据所述用户ID之间的关系对构建用户ID与自然人ID的对应关系。
7.一种内容推送装置,其特征在于,所述内容推送装置包括抓取单元、确定单元、检测单元和处理单元,其中:
所述抓取单元,用于抓取M个用户ID;
所述确定单元,用于确定与所述M个用户ID对应的N个自然人ID,M、N均为正整数,N小于或等于M;
所述检测单元,用于检测目标自然人ID是否为异常自然人ID,所述目标自然人ID为所述N个自然人ID中的任意一个;
所述处理单元,用于在所述检测单元检测出所述目标自然人ID为异常自然人ID的情况下,拒绝向所述目标自然人ID进行内容推送;
所述处理单元,还用于在所述检测单元检测出所述目标自然人ID不是异常自然人ID的情况下,向所述目标自然人ID进行内容推送;
所述检测单元检测目标自然人ID是否为异常自然人ID,具体为:获取所述目标自然人ID的用户行为数据,基于所述目标自然人ID的用户行为数据分析所述目标自然人ID是否为刷量ID;若所述目标自然人ID为刷量ID,则确定所述目标自然人ID为异常自然人ID;若所述目标自然人ID不是刷量ID,采用机器学习算法检测所述目标自然人ID是否为代用ID;若所述目标自然人ID为代用ID,则确定所述目标自然人ID为异常自然人ID。
8.一种移动终端,其特征在于,包括处理器以及存储器,所述存储器用于存储一个或多个程序,所述一个或多个程序被配置成由所述处理器执行,所述程序包括用于执行如权利要求1~6任一项所述的方法。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质用于存储电子数据交换的计算机程序,其中,所述计算机程序使得计算机执行如权利要求1~6任一项所述的方法。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/CN2019/093110 WO2020258102A1 (zh) | 2019-06-26 | 2019-06-26 | 内容推送方法、装置、移动终端及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113412607A CN113412607A (zh) | 2021-09-17 |
CN113412607B true CN113412607B (zh) | 2022-09-09 |
Family
ID=74059881
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201980091547.8A Active CN113412607B (zh) | 2019-06-26 | 2019-06-26 | 内容推送方法、装置、移动终端及存储介质 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN113412607B (zh) |
WO (1) | WO2020258102A1 (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112650746A (zh) * | 2021-01-12 | 2021-04-13 | 浪潮云信息技术股份公司 | 一种应用于政务办理系统自动捕获交换业务数据的方法 |
CN113435505A (zh) * | 2021-06-28 | 2021-09-24 | 中电积至(海南)信息技术有限公司 | 一种安全用户画像的构建方法与装置 |
CN114860557B (zh) * | 2022-04-08 | 2023-05-26 | 广东联想懂的通信有限公司 | 用户行为信息生成方法、装置、设备及可读存储介质 |
CN115914153A (zh) * | 2022-11-15 | 2023-04-04 | 浪潮云信息技术股份公司 | 一种基于微信公众号与im即时通讯结合的方法及系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105095891A (zh) * | 2014-05-05 | 2015-11-25 | 深圳市贝尔信智能系统有限公司 | 一种人脸捕捉的方法,装置及系统 |
CN108898042A (zh) * | 2017-12-27 | 2018-11-27 | 浩云科技股份有限公司 | 一种应用于atm机舱内用户异常行为的检测方法 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104639550A (zh) * | 2015-02-12 | 2015-05-20 | 北京嘀嘀无限科技发展有限公司 | 用户识别方法和设备 |
CN106572048A (zh) * | 2015-10-09 | 2017-04-19 | 腾讯科技(深圳)有限公司 | 一种社交网络中用户信息的识别方法和系统 |
CN105550348A (zh) * | 2015-12-25 | 2016-05-04 | 时趣互动(北京)科技有限公司 | 基于用户在线行为数据的作弊用户判定方法及装置 |
DE102017220545A1 (de) * | 2017-11-17 | 2019-05-23 | Bundesdruckerei Gmbh | Verhaltensbasierte Authentifizierung mit Rückfallposition |
CN108416015A (zh) * | 2018-03-05 | 2018-08-17 | 重庆电子工程职业学院 | 一种信息安全推送方法 |
CN108985954B (zh) * | 2018-07-02 | 2022-06-21 | 武汉斗鱼网络科技有限公司 | 一种建立各标识的关联关系的方法以及相关设备 |
CN109241343B (zh) * | 2018-07-27 | 2022-07-22 | 北京奇艺世纪科技有限公司 | 一种刷量用户识别系统、方法及装置 |
-
2019
- 2019-06-26 CN CN201980091547.8A patent/CN113412607B/zh active Active
- 2019-06-26 WO PCT/CN2019/093110 patent/WO2020258102A1/zh active Application Filing
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105095891A (zh) * | 2014-05-05 | 2015-11-25 | 深圳市贝尔信智能系统有限公司 | 一种人脸捕捉的方法,装置及系统 |
CN108898042A (zh) * | 2017-12-27 | 2018-11-27 | 浩云科技股份有限公司 | 一种应用于atm机舱内用户异常行为的检测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN113412607A (zh) | 2021-09-17 |
WO2020258102A1 (zh) | 2020-12-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113412607B (zh) | 内容推送方法、装置、移动终端及存储介质 | |
CN110198310B (zh) | 一种网络行为反作弊方法、装置及存储介质 | |
CN104468249B (zh) | 一种账号异常的检测方法及装置 | |
CN106934627B (zh) | 一种电商行业作弊行为的检测方法及装置 | |
JP5551704B2 (ja) | オンライン・マーケティング効率の評価 | |
CN110337059B (zh) | 一种用户家庭关系的分析算法、服务器及网络系统 | |
CN112311612B (zh) | 一种信息构建方法、装置及存储介质 | |
CN110401779A (zh) | 一种识别电话号码的方法、装置和计算机可读存储介质 | |
CN104579912B (zh) | 数据推送的方法及装置 | |
CN102801817B (zh) | 基于用户上下文的推送方法及装置 | |
CN110609937A (zh) | 一种爬虫识别方法及装置 | |
CN107515915A (zh) | 基于用户行为数据的用户标识关联方法 | |
CN102880501A (zh) | 应用推荐的实现方法、装置和系统 | |
CN103176982A (zh) | 一种电子图书推荐的方法及系统 | |
CN113412608B (zh) | 内容推送方法、装置、服务端及存储介质 | |
CN108833453A (zh) | 一种确定应用账号的方法及设备 | |
CN113505272B (zh) | 基于行为习惯的控制方法和装置、电子设备和存储介质 | |
CN113572752A (zh) | 异常流量的检测方法和装置、电子设备、存储介质 | |
CN111723083B (zh) | 用户身份识别方法、装置、电子设备及存储介质 | |
CN109495378A (zh) | 检测异常帐号的方法、装置、服务器及存储介质 | |
CN106910135A (zh) | 用户推荐方法及装置 | |
CN111782735A (zh) | 羊毛党流量识别方法及装置 | |
CN112347457A (zh) | 异常账户检测方法、装置、计算机设备和存储介质 | |
CN111368858B (zh) | 用户满意度评估方法及装置 | |
CN109429296B (zh) | 用于终端与上网信息关联的方法、装置及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |