CN111522724B - 异常账号的确定方法、装置、服务器及存储介质 - Google Patents
异常账号的确定方法、装置、服务器及存储介质 Download PDFInfo
- Publication number
- CN111522724B CN111522724B CN202010328517.9A CN202010328517A CN111522724B CN 111522724 B CN111522724 B CN 111522724B CN 202010328517 A CN202010328517 A CN 202010328517A CN 111522724 B CN111522724 B CN 111522724B
- Authority
- CN
- China
- Prior art keywords
- target
- score
- account
- different
- prediction model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000002159 abnormal effect Effects 0.000 title claims abstract description 164
- 238000000034 method Methods 0.000 title claims abstract description 80
- 238000003860 storage Methods 0.000 title claims abstract description 30
- 230000006399 behavior Effects 0.000 claims abstract description 107
- 238000010276 construction Methods 0.000 claims abstract description 82
- 238000012549 training Methods 0.000 claims description 35
- 238000012795 verification Methods 0.000 claims description 34
- 238000004422 calculation algorithm Methods 0.000 claims description 9
- 238000004590 computer program Methods 0.000 claims description 8
- 230000004044 response Effects 0.000 claims description 5
- 230000002776 aggregation Effects 0.000 claims description 2
- 238000004220 aggregation Methods 0.000 claims description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 14
- 238000012545 processing Methods 0.000 description 12
- 238000003973 irrigation Methods 0.000 description 11
- 230000002262 irrigation Effects 0.000 description 11
- 238000010586 diagram Methods 0.000 description 10
- 230000008569 process Effects 0.000 description 9
- 230000002547 anomalous effect Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000005192 partition Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000007621 cluster analysis Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/34—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
- G06F11/3438—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment monitoring of user actions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/018—Certifying business or products
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Strategic Management (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Development Economics (AREA)
- General Business, Economics & Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Economics (AREA)
- Marketing (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Quality & Reliability (AREA)
- Computer Hardware Design (AREA)
- Game Theory and Decision Science (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Primary Health Care (AREA)
- Tourism & Hospitality (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请公开了一种异常账号的确定方法、装置、服务器及存储介质,属于互联网技术领域,该方法包括:获取目标用户账号对应的目标历史行为,目标历史行为指目标用户账号在应用平台上的历史行为;根据目标历史行为构建目标用户账号对应的目标用户画像,目标用户画像基于不同画像构建维度和不同业务场景构建得到,其中,业务场景中包含各自对应的画像构建维度;根据目标用户画像确定目标用户账号对应的目标评分,目标评分用于表征目标用户账号属于异常账号的概率;根据目标评分确定异常账号。可以提高确定用户账号是否为异常账号的准确率,从而降低异常账号的误判率,避免对正常用户账号的干扰。
Description
技术领域
本申请实施例涉及互联网技术领域,特别涉及一种异常账号的确定方法、装置、服务器及存储介质。
背景技术
在音乐平台中,经常会出现一些异常账号,比如,某些用户账号并非对应真人操作,而是机器操作或其他非人力操作,会出现虚假点赞或虚假评论,从而展现给音乐平台其他用户一些虚假信息。
相关技术中,一般基于用户账号在音乐平台中的某种操作或行为信息,来确定该用户账号是否属于异常账号,比如,用户账号对应的点赞操作,而采用单一操作来判断用户账号是否属于异常账号,漏报率或误判率较高。
发明内容
本申请实施例提供了一种异常账号的确定方法、装置、服务器及存储介质。
所述技术方案如下:
一方面,本申请实施例提供一种异常账号的确定方法,所述方法包括:
获取目标用户账号对应的目标历史行为,所述目标历史行为所述目标用户账号在应用平台上的历史行为;
根据所述目标历史行为构建所述目标用户账号对应的目标用户画像,所述目标用户画像基于不同画像构建维度和不同业务场景构建得到,其中,所述业务场景中包含各自对应的画像构建维度;
根据所述目标用户画像确定所述目标用户账号对应的目标评分,所述目标评分用于表征所述目标用户账号属于异常账号的概率;
根据所述目标评分确定所述异常账号。
另一方面,本申请实施例提供一种异常账号的确定装置,所述装置包括:
获取模块,用于获取目标用户账号对应的目标历史行为,所述目标历史行为所述目标用户账号在应用平台上的历史行为;
构建模块,用于根据所述目标历史行为构建所述目标用户账号对应的目标用户画像,所述目标用户画像基于不同画像构建维度和不同业务场景构建得到,其中,所述业务场景中包含各自对应的画像构建维度;
第一确定模块,用于根据所述目标用户画像确定所述目标用户账号对应的目标评分,所述目标评分用于表征所述目标用户账号属于异常账号的概率;
第二确定模块,用于根据所述目标评分确定所述异常账号。
再一方面,本申请实施例提供一种服务器,所述终端包括处理器和存储器,所述存储器中存储有计算机程序,所述计算机程序由所述处理器加载并执行以实现上述异常账号的确定方法。
又一方面,本申请实施例提供一种非临时性计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述异常账号的确定方法。
本申请实施例提供的技术方案可以带来如下有益效果:
通过获取目标用户账号在音乐平台上的目标历史行为,并根据该目标历史行为在不同画像构建维度和不同业务场景下构建目标用户画像(业务场景中包含各自对应的画像构建维度),以便根据该目标用户画像确定出目标用户账号对应的目标评分(即目标用户账号属于异常账号的概率),从而根据目标评分确定出异常账号。本申请实施例可以在多维度多业务场景下构建目标用户画像,使得根据目标用户画像确定出的目标评分更准确,可以提高确定目标用户账号是否为异常账号的准确率,从而降低了异常账号的误判率,避免对正常用户账号的干扰。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了本申请一个示例性实施例示出的计算机系统的结构示意图;
图2示出了本申请一个示例性实施例示出的异常账号的确定方法的流程图;
图3示出了本申请另一个示例性实施例提供的异常账号的确定方法的流程图;
图4示出了本申请另一个示例性实施例提供的异常账号的确定方法的流程图;
图5示出了本申请一个示例性实施例示出的评分预测模型的训练过程的流程图;
图6示出了本申请一个示例性实施例示出的评分预测模型的训练过程的示意图;
图7示出了本申请另一个示例性实施例示出的异常账号的确定方法的流程图;
图8示出了本申请另一个示例性实施例示出的异常账号的确定方法的流程图;
图9示出了本申请一个示例性实施例示出的异常账号的确定方法的示意图;
图10示出了本申请一个示例性实施例提供的异常账号的确定装置的结构框图;
图11示出了本申请一个实施例提供的服务器的结构框图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
请参考图1,其示出了本申请一个示例性实施例示出的计算机系统的结构示意图,该计算机系统包括终端101和服务器102。
终端101是安装有应用程序的设备。其可以是智能手机、平板电脑、个人计算机(Personal Computer,PC)、或其他电子设备。本申请实施例中,应用程序可以为音乐类应用、社交类应用、直播类应用等;以音乐类应用为例,本申请实施例中,终端101可以收集用户在同一音乐类应用程序中的历史行为信息,比如,用户基础信息(登录信息)、用户听歌记录、下载记录、评论记录、点赞记录、访客记录等,并发送给服务器102。
终端101和服务器102通过有线或无线网络相连。
服务器102是终端101中安装的应用程序对应的后台服务器。其可以是一台服务器,若干台服务器构成的服务器集群或云服务器。本申请实施例中,服务器102可以接收终端发送的用户账号对应的历史行为信息,并与用户账号关联存储在对应数据库中;可选的,服务器102可以根据该历史行为构建出该用户账号对应的用户画像,并根据该用户画像确定出该用户账号是否为异常账号;可选的,服务器102中还预先设置有多种警告策略,用于在确定出用户账号为异常账号时,向终端推送对应的警告策略,由终端执行该警告策略。
需要说明的是,服务器102可以和大量终端进行数据(历史行为信息和警告策略)交互,即可以接收大量终端上报的历史行为信息,并对大量历史行为信息进行分析,向各个终端推送其对应的警告策略。
请参考图2,其示出了本申请一个示例性实施例示出的异常账号的确定方法的流程图,本申请实施例以该方法应用于上述图1所示的服务器为例进行说明,该方法包括:
步骤201,获取目标用户账号对应的目标历史行为,目标历史行为指目标用户账号在应用平台上的历史行为。
其中,应用平台的类型可以包括但不限于音乐平台、社交平台、直播平台,本申请实施例对此不构成限定,为了便于说明,下文实施例中均以音乐平台为例进行说明。
示意性的,若应用平台为音乐平台,音乐平台指用于进行音视频的传播、播放、下载、评论、权限获取以及推荐的平台,比如,用户可以在音乐平台上向其他用户推荐新歌、或对其他用户发表的新歌进行评论、或对其他用户的评论进行点赞、或访问其他用户的主页等。
在一种可能的实施方式中,服务器可以获取目标用户账号在音乐平台上的目标历史行为等信息,其中,目标历史行为信息可以包括三大类:用户信息流水、音乐平台流水、社交流水,用户信息流水指用户的基础信息,比如,目标用户在音乐平台中的账号信息、登录信息、个人标签等信息;音乐平台流水指音乐平台特有的用户行为信息,比如,用户账号的听歌记录、下载歌曲的记录、购买歌曲的记录等,社交流水指用户账号对应的评论记录、点赞记录、访客记录、关注记录等。
可选的,终端中的音乐类应用程序在运行过程中,可以实时采集目标用户账号对应的目标历史行为信息,并将该目标历史行为信息存储在特定的存储分区中,以便后续将目标用户账号在音乐平台上的目标历史行为信息发送给服务器,相应的,服务器接收到对应的目标历史行为信息,可以将其与对应的目标用户账号关联存储。
可选的,终端中可以设置有加密存储分区,用来存储采集到的目标历史行为信息,避免该目标历史行为信息被非系统应用访问,可以提高目标历史行为信息的安全性。
可选的,终端可以定期向服务器发送采集到的目标历史行为信息,比如,每隔5天;或当终端检测到采集的目标历史行为信息的数据量达到数据量阈值时,向服务器发送采集到的目标历史行为,比如,数据量阈值可以为500MB。
可选的,服务器可以将接收到的目标历史行为和目标用户账号关联存储在分布式数据处理(HadoopA)集群(框架)中,以便服务器后续对该目标历史行为信息进行提取分析。
步骤202,根据目标历史行为构建目标用户账号对应的目标用户画像,目标用户画像基于不同画像构建维度和不同业务场景构建得到。
其中,目标用户画像用于表征目标用户账号在不同画像构建维度和不同业务场景下的历史行为特征。
在一种可能的实施方式中,服务器中预先存储有目标用户画像的画像构建标准,即目标用户画像对应的不同画像构建维度和不同业务场景,比如,不同画像构建维度可以包括:频次维度、推新歌维度、灌水维度等,不同业务场景可以包括:评论场景、点赞场景、访客场景、关注场景等,本实施例对用户画像构建标准不构成限定。
其中,各个业务场景中包含各自对应的画像构建维度。比如,在评论场景中,可以包含有评论频次维度、评论推新歌维度、评论灌水维度等,评论频次即目标用户账号在预定期间内的评论次数,评论推新歌维度即目标用户账号的评论内容中涉及到推荐歌曲的次数,评论灌水维度即目标用户账号的评论内容是无关紧要或带诱导性质的评论的次数。
在一种可能的实施方式中,当服务器获取到目标用户账号对应的目标历史行为之后,可以根据预先设置的用户画像构建标准(即画像构建维度和业务场景)构建目标用户画像。比如,服务器通过分析用户历史行为中包含的与评论相关的历史行为(或评论内容),分析得到目标用户账号对应的评论频次、评论推新歌次数、评论灌水次数等,构建出目标用户账号在评论场景下的目标用户画像,同理,服务器通过分析目标历史行为中包含的点赞场景下或访客场景下的相关目标历史行为,可以得到点赞场景或访客场景对应的目标用户画像,综合不同业务场景下的目标用户画像,即构建出目标用户账号对应的目标用户画像。
示意性的,根据用户历史行为构建出的目标用户画像可以为:目标用户账号对应的评论次数为1000次,评论推新歌的次数为800次,评论灌水的次数为900次等;目标用户账号对应的点赞次数为10000次,点赞用于推新歌的评论的次数为9000次,点赞灌水的次数为9500次。
可选的,可以每隔预设时间段构建一次目标用户画像,比如,每隔7天构建一次目标用户账号对应的目标用户画像。
可选的,服务器中设置有列式数据库管理系统(Clickhouse),用于对目标历史行为进行分析和特征提取,即构建目标用户账号对应的目标用户画像。
步骤203,根据目标用户画像确定目标用户账号对应的目标评分,目标评分用于表征目标用户账号属于异常账号的概率。
在一种可能的实施方式中,服务器中预先设置有异常账号的对应规则,或预先训练有对应的评分预测模型,可以根据目标用户画像确定出目标用户账号对应的目标评分,以便根据该目标评分判断该目标用户账号是否为异常账号。
步骤204,根据目标评分确定异常账号。
在一种可能的实施方式中,当服务器确定出目标用户账号对应的目标评分之后,可以根据目标评分来确定目标用户账号是否属于异常账号,其中,目标评分越高,目标用户账号属于异常账号的可能性越大。
综上所述,本申请实施例提供的技术方案中,通过获取目标用户账号在音乐平台上的目标历史行为,并根据该目标历史行为在不同画像构建维度和不同业务场景下构建目标用户画像(业务场景中包含各自对应的画像构建维度),以便根据该目标用户画像确定出目标用户账号对应的目标评分(即目标用户账号属于异常账号的概率)。由于该目标用户画像可以表征目标用户账号在不同画像构建维度和不同业务场景下的历史行为特征,可以实现多维度多业务场景对目标用户账号对应的历史行为特征进行提取和分析,从而使得确定出的目标评分更符合用户的历史行为特征,可以提高确定目标用户账号是否为异常账号的准确率,从而降低了异常账号的误判率,避免对正常用户账号的干扰。
在一种可能的实施方式中,可以通过机器学习的方式分析目标用户账号对应的历史行为特征,比如,开发人员通过预先训练有评分预测模型,并设置在服务器中,以便该评分预测模型根据目标用户账号对应的目标用户画像,分析得到该目标用户账号属于异常账号的概率。
请参考图3,其示出了本申请另一个示例性实施例提供的异常账号的确定方法的流程图。本申请实施例以该方法应用于上述图1所示的服务器为例进行说明,该方法包括:
步骤301,获取目标用户账号对应的目标历史行为,目标历史行为指目标用户账号在应用平台上的历史行为。
步骤302,根据目标历史行为构建目标用户账号对应的目标用户画像,目标用户画像基于不同画像构建维度和不同业务场景构建得到。
步骤301和步骤302的实施方式可以参考步骤201和步骤202,本实施例在此不做赘述。
步骤303,将目标用户画像输入评分预测模型,得到第一目标评分,评分预测模型基于不同业务场景和不同画像构建维度训练得到。
其中,服务器中预先设置有评分预测模型,该评分预测模型可以基于用户画像,分析得到用户账号属于异常账号的概率,由于目标用户画像是基于不同业务场景和不同画像构建维度对目标历史行为分析得到的,因此,评分预测模型也应基于不同业务场景和不同画像构建维度训练得到,用于综合分析目标用户账号在不同业务场景和不同画像构建维度下属于异常账号的概率。
在一种可能的实施方式中,服务器构建出目标历史行为对应的目标用户画像之后,即将该目标用户画像输入评分预测模型中,可以得到评分预测模型输出的第一目标评分,该第一目标评分即表征目标用户账号在不同画像构建维度和不同业务场景下属于异常账号的综合概率。
其中,评分预测模型的训练过程可以参考下文实施例,本实施例在此不做赘述。
在一种可能的实施方式中,目标用户画像包含有不同画像构建维度和不同业务场景,因此,在训练评分预测模型时,也需要针对不同业务场景和不同画像构建维度,训练对应的评分预测模型,即评分预测模型包括不同画像构建维度对应的维度评分预测模型、不同业务场景对应的场景评分预测模型和整体评分预测模型,其中,整体评分预测模型用于整合不同维度和不同业务场景下对应的多个评分。
示意性的,在图3的基础上,如图4所示,步骤303可以包括步骤303A、步骤303B和步骤303C。
步骤303A,将不同业务场景中同一画像构建维度的用户数据输入维度评分预测模型,得到维度评分,维度评分用于表征目标用户账号在不同画像构建维度下属于异常账号的概率。
其中,不同画像构建维度对应不同维度评分预测模型。比如,若画像构建维度包括频次维度、推新歌维度、灌水维度,则对应的维度评分预测模型包括:频次评分预测模型、推新歌评分预测模型以及灌水评分预测模型等。
在一种可能的实施方式中,服务器将不同业务场景中同一画像构建维度对应的用户数据输入维度评分预测模型,即可以得到维度评分预测模型输出的维度评分,该维度评分用于表征目标用户账号在不同画像构建维度下属于异常账号的概率。
示意性的,以目标用户画像对应的不同业务场景为评论场景、点赞场景、访客场景,画像构建维度为频次维度为例,则服务器将评论场景下的评论频次数据、点赞场景下的点赞频次数据、访客场景下的访问频次数据输入频次评分预测模型,即可以得到频次评分预测模型输出的频次评分,该频次评分即表征目标用户账号在频次维度下属于异常账号的概率,同理,可以分别得到推新歌评分预测模型输出的推新歌评分,以及灌水评分预测模型输出的灌水评分。
可选的,由于不同业务的关注对象不同,比如,评论业务下可能更关注评论频次,因此,实际应用中,针对不同的业务,可以动态调整用户数据的权重,即若评分预测模型应用在评论业务中,则针对频次评分预测模型,评论频次对应的用户数据权重较高。
步骤303B,将业务场景中各个画像构建维度对应的用户数据输入场景评分预测模型,得到场景评分,场景评分用于表征目标用户账号在不同业务场景下属于异常账号的概率。
其中,不同业务场景对应不同场景评分预测模型。比如,目标用户画像对应的业务场景包括:评论场景、点赞场景、访客场景,则对应的场景评分预测模型包括:评论评分预测模型、点赞评分预测模型和访客评分预测模型。
在一种可能的实施方式中,服务器将业务场景中各个画像构建维度对应的用户数据输入场景评分预测模型中,即可以得到场景评分预测模型输出的场景评分,该场景评分用于表征目标用户账号在不同业务场景中属于异常账号的概率。
示意性的,以业务场景为评论场景,评论场景中包含的画像构建维度为频次维度、推新歌维度、灌水维度为例,服务器将评论场景下的评论维度对应的用户数据(评论频次)、推新歌维度对应的用户数据(推新歌频次)、灌水维度对应的用户数据(评论灌水次数)等输入评论评分预测模型,可以得到评论评分预测模型输出的评论评分,同理,可以得到点赞评分预测模型输出的点赞评分,以及访客评分预测模型输出的访客评分。
可选的,业务场景中的不同画像构建维度对应的用户数据的权重相同。
步骤303C,将维度评分和场景评分输入整体评分预测模型,得到第一目标评分。
其中,整体评分预测模型用于整合各个维度评分和各个场景评分,以便综合分析用户账号在不同画像构建维度和不同业务场景下的历史行为特征,得到表征用户账号是否属于异常账号的综合评分(即第一目标评分)。
在一种可能的实施方式中,服务器将得到的各个维度评分和各个场景评分,比如,频次评分、推新歌评分、灌水评分、评论评分、点赞评分、访客评分输入整体评分预测模型中,即可以得到整体评分预测模型输出的第一目标评分。
可选的,由于不同业务关注的评分对象不同,比如,评论业务可能更关注评论评分和灌水评分,则相应的评论评分和灌水评分对应的权重就比较高,即各个评分对应的权重可能存在差异。
可选的,各个评分对应的权重可以由开发人员或业务人员进行动态调整。
步骤304,根据第一目标评分确定目标评分。
在一种可能的实施方式中,当服务器将构建的目标用户画像输入对应的评分预测模型后,即可以得到目标用户账号对应的第一目标评分,对于成熟业务,由于评分预测模型是根据大量准确的样本历史行为训练得到,该评分预测模型模型的预测准确率较高,因此,可以直接将该第一目标评分确定为目标评分,用于表征目标用户账号属于异常账号的概率。
步骤305,根据目标评分确定异常账号。
本步骤的实施方式可以参考步骤104,本实施例在此不做赘述。
本实施例中,服务器中通过预设评分预测模型,并将构建出的目标用户画像输入该评分预测模型中,可以得到评分预测模型输出的第一目标评分,并根据该第一目标评分来确定用户账号属于异常账号的概率,通过应用机器学习的方式分析用户画像,可以提高确定异常账号的概率。
在一种可能的实施方式中,对于成熟业务,开发人员可以预先根据确定的异常账号和正常账号分别对应的历史行为信息,来训练上述评分预测模型。
请参考图5,其示出了本申请一个示例性实施例示出的评分预测模型的训练过程的流程图,该方法包括:
步骤501,获取样本用户账号对应的样本历史行为,样本历史行为指样本用户账号在应用平台上的历史行为。
其中,样本用户账号可以包括异常账号、疑似异常账号、正常账号等,本实施例对样本用户账号的类别不构成限定。
在一种可能的实施方式中,服务器可以收集历史作弊用户账号(异常账号)对应的历史行为、历史正常账号对应的历史行为、和历史疑似作弊账号(疑似异常账号)对应的历史行为作为样本集,来训练评分预测模型,并人工标注各类用户账号的类型,比如,异常账号对应1,正常账号对应0。
可选的,由于样本数量越多,评分预测模型对应的预测准确率就越高,当确定的异常账号数量较少时,可以通过无监督(Unsupervised Cluster)和半监督(Semi-SupervisedLearning)大数据算法挖掘和发现与异常账号相似的疑似异常账号。
示意性的,服务器通过为确定的异常账号构建用户画像,与若干用户画像进行聚类分析,确定出与异常账号对应的用户画像类似的其他用户画像,并将该用户画像对应的用户账号确定为疑似异常账号。
步骤502,根据样本历史行为构建样本用户画像,样本用户画像基于不同画像构建维度和不同业务场景构建得到。
其中,样本用户画像用于表征样本用户账号在不同画像构建维度和不同业务场景下的历史行为特征。
在一种可能的实施方式中,服务器基于不同画像构建维度和不同业务场景,构建样本用户账号对应的样本用户画像,即对获取到样本历史行为进行分析和特征提取。
其中,样本用户画像对应的不同画像构建维度和不同业务场景可以参考上文实施例,本实施例在此不做赘述。
步骤503,根据样本用户账号对应的样本用户画像,通过提升(boosting)方法训练维度评分预测模型,得到维度评分预测模型输出的样本维度评分,样本维度评分用于表征样本用户账号在不同画像构建维度下属于异常账号的概率。
由于不同业务的关注对象不同,比如,评论业务下,可能更关注评论频次,相应的,在模型训练过程中,应该更关注评论频次这个维度,因此,针对维度评分预测模型,由于涉及到不同的业务场景,因此,在训练维度评分预测模型的过程中,采用可以动态调整权重的boosting方法来进行训练,其中,同一画像构建维度在不同业务场景中对应有不同权重。
在一种可能的实施方式中,服务器将样本用户画像输入维度评分预测模型,得到维度评分预测模型输出的样本维度评分,以样本用户画像对应的画像构建维度为频次维度、推新歌维度、灌水维度为例,样本维度评分对应有样本频次评分、样本推新歌评分以及样本灌水评分。
步骤504,根据样本用户画像,通过自助聚合(bagging)方法训练场景评分预测模型,得到场景评分预测模型输出的样本场景评分,样本场景评分用于表征样本用户账号在不同业务场景下属于异常账号的概率。
由于同一业务场景下对不同维度的关注度相同,因此,不涉及各维度权重的动态调整,因此,采用bagging方法来训练场景评分预测模型,其中,同一业务场景中的不同画像构建维度对应有相同权重。
在一种可能的实施方式中,服务器将样本用户画像输入场景评分预测模型中,得到场景评分预测模型输出的样本场景评分,以样本用户画像包含评论场景、点赞场景、访客场景为例,样本场景评分包括样本评论评分、样本点赞评分和样本访客评分。
步骤505,根据样本业务评分和样本场景评分,通过bagging方法训练整体评分预测模型,得到整体评分预测模型输出的样本评分,样本评分用于表征样本用户账号属于异常账号的概率。
由于bagging方法的核心在于投票,可以基于不同场景的需要人为设置投票规则,因此,为了提高评分预测模型的训练速率,以及方便后续业务的增加和减少,采用bagging方法来训练整体评分预测模型,用于整合各个场景评分和各个维度评分。
在一种可能的实施方式中,将各个样本维度评分和各个样本场景评分输入整体评分预测模型中,得到整体评分预测模型输出的样本评分,其中,样本业务评分和样本场景评分可以分别设置有不同权重。
可选的,将得到的样本评分表征的账号性质与人工标注的样本用户的账号性质进行损失计算,并利用反向传播算法,更新整体评分预测模型、维度评分预测模型以及场景评分预测模型中的参数。
示意性的,如图6所示,其示出了本申请一个示例性实施例示出的评分预测模型的训练过程的示意图。
在601中进行目标定义,即人工标注样本用户账号的性质,即样本用户账号为异常账号、正常账号或疑似异常账号,并通过半监督算法和无监督算法挖掘与异常账号相似的疑似异常账号,构成训练样本集。
在602中对样本用户账号对应的样本历史行为进行特征提取,即构建样本用户账号对应的样本用户画像,其中,样本历史行为信息可以包括:用户基础信息、注册信息、登录信息、社交信息、音乐互动信息、场景信息等。
在603中进行评分预测模型的训练,该评分预测模型采用矩阵式算法框架,可以分片计算出样本用户在不同社交业务的规律,即在不同画像构建维度和不同业务场景下进行评分预测模型的训练,其中,维度评分预测模型采用boosting方法进行训练,场景评分预测模型采用bagging方法进行训练;最后将得到的各个场景评分(评论评分、点赞评分、访客评分)和各个维度评分(频次评分、推新歌评分、灌水评分)输入整体评分预测模型中,并通过bagging方法训练得到样本用户账号对应的样本评分。
本实施例中,通过在不同画像构建维度和不同业务场景下训练评分预测模型,得到维度评分预测模型、场景评分预测模型和整体评分预测模型;并针对不同评分预测模型采用不同的训练方式,考虑训练效率的同时兼顾到不同业务场景下的需求。
由于评分预测模型需要预先根据确定的异常账号进行训练,而对于新的业务场景,可能无法准确确定出异常账号,此时,还需要引入人工设置的异常账号规则,与评分预测模型一起对目标用户画像进行分析,来综合判定用户账号属于异常账号的可能性。
在图3的基础上,请参考图7,其示出了本申请另一个示例性实施例示出的异常账号的确定方法的流程图,本申请实施例以该方法应用于上述图1所示的服务器为例进行说明,该方法包括:
步骤701,获取目标用户账号对应的目标历史行为,目标历史行为指目标用户账号在应用平台上的历史行为。
步骤702,根据目标历史行为构建目标用户账号对应的目标用户画像,目标用户画像基于不同画像构建维度和不同业务场景构建得到。
步骤703,将目标用户画像输入评分预测模型,得到第一目标评分,评分预测模型基于不同业务场景和不同画像构建维度训练得到。
步骤701至步骤703的实施方式可以参考步骤301至步骤303,本实施例在此不做赘述。
步骤704,根据目标用户画像和预设异常账号规则,确定目标用户账号对应的第二目标评分。
其中,预设异常账号规则由开发人员根据业务需求设置得到,比如,针对点赞场景,设置的异常账号规则可以为:1min点赞次数超过500次,即为异常账号,本实施例对此不构成限定。
在一种可能的实施方式中,服务器构建出目标用户画像之后,即将该目标用户画像与预设异常账号规则进行对比,来确定目标用户账号对应的第二目标评分,比如,若目标用户画像指示目标用户账号1min点赞次数为1000次,大于500次,则表示该目标用户账号为异常账号,对应的第二目标评分可以为1,相应的,若目标用户画像指示目标用户账号1min点赞次数为30次,远小于500次,则表示该目标用户账号为正常账号,对应的第二目标评分可以为0。
步骤705,根据第一目标评分和第二目标评分,确定目标评分。
步骤706,根据目标评分确定异常账号。
本步骤的实施方式可以参考步骤104,本实施例在此不做赘述。
由于第一目标评分和第二目标评分的确定方式存在差异,而在不同的应用场景下,对两个目标评分的关注度不同,即第一目标评分和第二目标评分对应不同权重。比如,对于新业务,由于预先确定的异常账号较少,则对应的评分预测模型的准确率较低,此时,确定目标评分时应该适当增大第二目标评分的权重,即更注重预设异常账号规则得到的评分;若对于成熟业务,由于已知异常账号较多,相应的评分预测模型的预测结果更准确,此时,确定目标评分时应该适当增加第一目标评分的权重,即更注重评分预测模型得到的评分。
可选的,由于第一目标评分需要输入用户画像来进行确定,而用户画像的数据量也会影响评分预测模型的预测准确性,因此,在一种可能的实施方式中,可以通过目标用户画像的数据量的多少,来确定第一目标评分和第二目标评分的权重,比如,若目标用户画像对应的用户数据量较多时,第一目标评分对应的权重较高,若目标用户画像对应的用户数据量较少时,第二目标评分对应的权重较高。
在一种可能的实施方式中,根据第一目标评分和第二目标评分以及各个目标评分对应的权重,得到表征目标用户账号是否属于异常账号的目标评分。
本实施例中,通过将目标用户画像输入评分预测模型,得到目标用户账号对应的第一目标评分,并将目标用户画像和预设异常规则进行对比,得到目标用户账号对应的第二目标评分,并综合经验规则(预设异常账号规则)与评分预测模型两种预测方式,得到该目标用户账号对应的目标评分,由于在得到目标评分时,可以动态调整第一目标评分和第二目标评分分别对应的权重,以便在新业务时,更关注经验规则对应的第二目标评分,在业务成熟阶段更关注评分预测模型得到的第一目标评分,从而提高确定异常账号的准确性。
在一种可能的应用场景下,当服务器确定出某些用户账号属于异常账号,为了避免异常账号对音乐平台各个业务的影响,比如,某歌手通过请水军的方式宣传新歌,对新歌排行榜公平性的影响,因此,开发人员预先针对异常账号设置有对应的警告策略,通过执行该警告策略,达到对异常账号的警告目的。
在图2的基础上,请参考图8,其示出了本申请另一个示例性实施例示出的异常账号的确定方法的流程图,该方法包括:
步骤801,获取目标用户账号对应的目标历史行为,目标历史行为指目标用户账号在应用平台上的历史行为。
步骤802,根据目标历史行为构建目标用户账号对应的目标用户画像,目标用户画像基于不同画像构建维度和不同业务场景构建得到。
步骤803,根据目标用户画像确定目标用户账号对应的目标评分,目标评分用于表征目标用户账号属于异常账号的概率。
步骤801至步骤803的实施方式可以参考上文实施例,本实施例在此不做赘述。
步骤804,响应于目标评分高于评分阈值,将目标用户账号确定为异常账号。
其中,评分阈值为划分正常账号和异常账号的标准,其可以由开发人员预先设置,或由业务人员根据不同业务场景需求进行设置,比如,评分阈值为0.4。
在一种可能的实施方式中,服务器将得到的目标评分与评分阈值进行比较,若目标评分高于评分阈值,比如,目标评分为0.6,高于评分阈值0.4,则表示目标用户账号为异常账号。
可选的,若目标评分低于评分阈值,比如,目标评分为0.2,低于评分阈值0.4,则表示目标用户账号为正常账号。
步骤805,根据目标评分所属的目标评分范围,确定异常账号对应的目标警告策略,其中,不同警告策略对应不同评分范围。
在一种可能的实施方式中,当服务器确定出目标用户账号对应的目标评分之后,首先与评分阈值进行比较,若目标评分大于评分阈值,则表示该目标用户账号可能为异常账号,若目标评分小于评分阈值则表示该目标用户账号为正常账号,示意性的,若目标评分为0.6,大于评分阈值0.4,则表示目标用户账号可能为异常账号,需要针对该目标用户账号采取警告策略。
为了降低对异常账号的误判率,且减少对正常账号对应的用户的干扰,在一种可能的实施方式中,采用分级模式设置警告策略,其中,不同警告策略对应的严重性不同,且不同警告策略对应的评分范围不同,即随着目标评分越高,对应的警告策略越严格。
在一种可能的实施方式中,当服务器确定出目标评分高于评分阈值之后,即确定出该目标用户账号为疑似异常账号,即根据该目标评分和不同警告策略对应的评分范围,来确定目标用户账号对应的目标警告策略。
步骤806,响应于异常账号在应用平台上执行预定操作时,执行目标警告策略。
其中,预定操作可以包括:点赞操作、评论操作、访客操作、关注操作等,本实施例对此不构成限定。
在一种可能的实施方式中,服务器将异常账号对应的警告策略发送至终端,当异常账号在应用平台中进行预定操作时,执行该目标警告策略,用于警告异常账号存在社交作弊的可能性。
示意性的,警告策略可以包括:滑块验证、图文验证、账号绑定验证、真人验证、禁止预定操作、封禁异常账号等六种,则执行目标警告策略可以包括以下步骤:
一、若目标警告策略为第一警告策略,执行滑块验证,第一警告策略对应第一评分范围。
其中,滑块验证即需要异常账号拖动滑块至目标位置,滑块验证策略对应的第一目标评分范围可以为0.4-0.5。
在一种可能的实施方式中,当服务器确定出目标评分属于滑块验证策略对应的评分范围时,比如,目标评分为0.42,属于第一评分范围,则执行滑块验证策略。
二、若目标警告策略为第二警告策略,执行图文验证,第二警告策略对应第二评分范围。
其中,图文验证即需要目标用户输入特定文字或按顺序点击特定图片,图文验证策略对应的第二目标评分范围可以为0.5-0.6。
在一种可能的实施方式中,当服务器确定出目标评分属于图文验证策略对应的评分范围时,比如,目标评分为0.55,属于第二评分范围,则执行图文验证策略。
三、若目标警告策略为第三警告策略,执行账号绑定验证,第三警告策略对应第三评分范围。
其中,账号绑定验证即将异常账号绑定手机号、银行卡或身份证等操作,账号绑定验证对应的第三目标评分范围可以为0.6-0.7。
在一种可能的实施方式中,当服务器确定出目标评分属于账号绑定验证策略对应的评分范围时,比如,目标评分为0.68,属于第三评分范围,则执行账号绑定验证策略。
四、若目标警告策略为第四警告策略,执行真人验证,第四警告策略对应第四评分范围。
其中,真人验证即需要目标用户进行人脸识别操作,真人验证对应的第四目标评分范围可以为0.7-0.8。
在一种可能的实施方式中,当服务器确定出目标评分属于真人验证策略对应的评分范围时,比如,目标评分为0.75,属于第四评分范围,则执行真人验证策略。
五、若目标警告策略为第五警告策略,禁止预定操作,第五警告策略对应第五评分范围。
其中,禁止预定操作即禁止异常账号在应用平台上执行评论操作、或点赞操作、或访客操作、或关注操作等,禁止预定操作对应的第五目标评分范围可以为0.8-0.9。
在一种可能的实施方式中,当服务器确定出目标评分属于禁止预定操作策略对应的评分范围时,比如,目标评分为0.87,属于第五评分范围,则执行禁止预定操作策略。
六、若目标警告策略为第六警告策略,封禁异常账号,第六警告策略对应第六评分范围。
其中,封禁异常账号即禁止异常账号登录该应用平台,封禁异常账号对应的第六目标评分范围可以为0.9-1.0。
在一种可能的实施方式中,当服务器确定出目标评分属于封禁异常账号策略对应的评分范围时,比如,目标评分为0.97,属于第六评分范围,则执行封禁目标用户账号策略。
其中,各个警告策略对应的评分范围之间不存在交集,且第n评分范围的评分上限小于第n+1评分范围的评分上限,n为大于1且小于6的整数,比如,第一警告策略(滑块验证策略)对应的评分上限(0.5)小于第二警告策略(图文验证策略)对应的评分上限(0.6)。
可选的,为了降低对异常账号的漏报率,则只需要适当扩大疑似作弊用户的召回率,即降低评分阈值,比如,原评分阈值为0.4,则调整之后的评分阈值为0.3,即对目标评分大于0.3的目标用户账号采用警告策略,可以有效降低异常账号的漏报率。
本实施例中,通过预先设置分级策略,即根据不同的评分范围设置不同的警告策略,当目标评分较低时,采用警告度较低的警告策略,可以避免对正常用户的干扰,同时达到对疑似作弊用户的警告,当目标评分较高时,采用更严格的警告策略,从而减少应用平台中的异常账号。
请参考图9,其示出了本申请一个示例性实施例示出的异常账号的确定方法的示意图,该方法包括:
服务器获取目标用户账号在音乐平台上的日志流水,包括:用户流水、音乐平台流水和社交流水等,即获取目标用户账号在音乐平台上的目标历史行为,并将该目标历史行为(即日志流水)存储在Hadoop集群901中;在Clickhouse集群902中对日志流水进行加工和提取,即通过分析目标历史行为构建出目标用户账号对应的目标用户画像;再将目标用户画像输入评分预测模型904中,得到评分预测模型904输出的第一目标评分,以及将目标用户画像和预设异常账号规则903进行对比,得到目标用户账号对应的第二目标评分,并整合第一目标评分和第二目标评分,得到表征目标用户账号是否属于异常账号的目标评分905;之后将目标评分905输入规则引擎906中,通过不同警告策略对应的评分范围和目标评分905,确定出目标账号是否属于异常账号,以及若目标用户账号属于异常账号,对应的目标警告策略;确定出目标警告策略之后,当目标用户账号在音乐平台上执行预定操作时,执行该目标警告策略。
下述为本申请装置实施例,可以用于执行本申请方法实施例。对于本申请装置实施例中未披露的细节,请参照本申请方法实施例。
请参考图10,其示出了本申请一个示例性实施例提供的异常账号的确定装置的结构框图。该装置具有实现上述方法示例的功能,所述功能可以由硬件实现,也可以由硬件执行相应的软件实现。该装置可以是上文介绍的服务器,也可以设置在服务器中。如图10所示,该装置1000可以包括:获取模块1001、构建模块1002、第一确定模块1003和第二确定模块1004。
获取模块1001,用于获取目标用户账号对应的目标历史行为,所述目标历史行为指所述目标用户账号在应用平台上的历史行为;
构建模块1002,用于根据所述目标历史行为构建所述目标用户账号对应的目标用户画像,所述目标用户画像基于不同画像构建维度和不同业务场景构建得到,其中,所述业务场景中包含各自对应的画像构建维度;
第一确定模块1003,用于根据所述目标用户画像确定所述目标用户账号对应的目标评分,所述目标评分用于表征所述目标用户账号属于异常账号的概率;
第二确定模块1004,用于根据所述目标评分确定所述异常账号。
可选的,所述第一确定模块1003,包括:
处理单元,用于将所述目标用户画像输入评分预测模型,得到第一目标评分,所述评分预测模型用于基于不同业务场景和不同画像构建维度训练得到;
第一确定单元,用于根据所述第一目标评分确定所述目标评分。
可选的,所述评分预测模型包括所述不同画像构建维度对应的维度评分预测模型、所述不同业务场景对应的场景评分预测模型和整体评分预测模型;
可选的,所述处理单元,还用于:
将不同业务场景中同一画像构建维度的用户数据输入所述维度评分预测模型,得到维度评分,所述维度评分用于表征所述目标用户账号在所述不同画像构建维度下属于所述异常账号的概率,且不同画像构建维度对应不同维度评分预测模型;
将所述业务场景中各个画像构建维度对应的用户数据输入所述场景评分预测模型,得到场景评分,所述场景评分用于表征所述目标用户账号在所述不同业务场景下属于所述异常账号的概率,且不同业务场景对应不同场景评分预测模型;
将所述维度评分和所述场景评分输入所述整体评分预测模型,得到所述第一目标评分。
可选的,所述装置还包括:
第一训练模块,用于根据样本用户账号对应的样本用户画像,通过boosting方法训练所述维度评分预测模型,得到所述维度评分预测模型输出的样本维度评分,其中,同一画像构建维度在所述不同业务场景中对应有不同权重,所述样本维度评分用于表征所述样本用户账号在所述不同画像构建维度下属于所述异常账号的概率;
第二训练模块,用于根据所述样本用户画像,通过bagging方法训练所述场景评分预测模型,得到所述场景评分预测模型输出的样本场景评分,其中,同一业务场景中的所述不同画像构建维度对应有相同权重,所述样本场景评分用于表征所述样本用户账号在所述不同业务场景下属于所述异常账号的概率;
第三训练模块,用于根据所述样本业务评分和所述样本场景评分,通过所述bagging方法训练所述整体评分预测模型,得到所述整体评分预测模型输出的样本评分,其中,所述样本业务评分和所述样本场景评分分别对应有不同权重,所述样本评分用于表征所述样本用户账号属于所述异常账号的概率。
可选的,所述装置还包括:
第三确定模块,用于根据所述目标用户画像和预设异常账号规则,确定所述目标用户账号对应的第二目标评分;
所述第一确定单元,还用于:
根据所述第一目标评分和所述第二目标评分,确定所述目标评分,其中,所述第一目标评分和所述第二目标评分对应不同权重。
可选的,所述第二确定模块1004,包括:
第二确定单元,用于响应于所述目标评分高于评分阈值,将所述目标用户账号确定为所述异常账号。
可选的,所述装置还包括:
第四确定模块,用于根据所述目标评分所属的目标评分范围,确定所述异常账号对应的目标警告策略,其中,不同警告策略对应不同评分范围;
执行模块,用于响应于所述异常账号在应用平台上执行预定操作时,执行所述目标警告策略。
可选的,所述执行模块,还包括:
第一执行单元,用于若所述目标警告策略为第一警告策略,执行滑块验证,所述第一警告策略对应第一评分范围;
第二执行单元,用于若所述目标警告策略为第二警告策略,执行图文验证,所述第二警告策略对应第二评分范围;
第三执行单元,用于若所述目标警告策略为第三警告策略,执行账号绑定验证,所述第三警告策略对应第三评分范围;
第四执行单元,用于若所述目标警告策略为第四警告策略,执行真人验证,所述第四警告策略对应第四评分范围;
第五执行单元,用于若所述目标警告策略为第五警告策略,禁止所述预定操作,所述第五警告策略对应第五评分范围;
第六执行单元,用于若所述目标警告策略为第六警告策略,封禁所述异常账号,所述第六警告策略对应第六评分范围;
其中,各个评分范围之间不存在交集,且所述第n评分范围的评分上限小于所述第n+1评分范围的评分上限,n为大于1且小于6的整数。
综上所述,本申请实施例提供的技术方案中,通过获取目标用户账号在音乐平台上的目标历史行为,并根据该目标历史行为在不同画像构建维度和不同业务场景下构建目标用户画像(业务场景中包含各自对应的画像构建维度),以便根据该目标用户画像确定出目标用户账号对应的目标评分(即目标用户账号属于异常账号的概率)。由于该目标用户画像可以表征目标用户账号在不同画像构建维度和不同业务场景下的历史行为特征,可以实现多维度多业务场景对目标用户账号对应的历史行为特征进行提取和分析,从而使得确定出的目标评分更符合用户的历史行为特征,可以提高确定目标用户账号是否为异常账号的准确率,从而降低了异常账号的误判率,避免对正常用户账号的干扰。
需要说明的是:上述实施例提供的装置在实现其功能时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的装置与方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
请参考图11,其示出了本申请一个实施例提供的服务器的结构框图。该服务器可用于实施上述实施例中提供的异常账号的确定方法。具体来讲:
所述服务器1100包括中央处理单元(Central Processing Unit,CPU)1101、包括随机存取存储器(Random Access Memory,RAM)1102和只读存储器(Read-Only Memory,ROM)1103的系统存储器1104,以及连接系统存储器1104和中央处理单元1101的系统总线1105。所述服务器1100还包括帮助服务器内的各个器件之间传输信息的基本输入/输出系统(Input/Output系统,I/O系统)1106,和用于存储操作系统1113、应用程序1114和其他程序模块1115的大容量存储设备1107。
所述基本输入/输出系统1106包括有用于显示信息的显示器1108和用于用户输入信息的诸如鼠标、键盘之类的输入设备1109。其中所述显示器1108和输入设备1109都通过连接到系统总线1105的输入输出控制器1110连接到中央处理单元1101。所述基本输入/输出系统1106还可以包括输入输出控制器1110以用于接收和处理来自键盘、鼠标、或电子触控笔等多个其他设备的输入。类似地,输入输出控制器1110还提供输出到显示屏、打印机或其他类型的输出设备。
所述大容量存储设备1107通过连接到系统总线1105的大容量存储控制器(未示出)连接到中央处理单元1101。所述大容量存储设备1107及其相关联的计算机可读存储介质为服务器1100提供非易失性存储。也就是说,所述大容量存储设备1107可以包括诸如硬盘或者只读光盘(Compact Disc Read-Only Memory,CD-ROM)驱动器之类的计算机可读存储介质(未示出)。
不失一般性,所述计算机可读存储介质可以包括计算机存储介质和通信介质。计算机存储介质包括以用于存储诸如计算机可读存储指令、数据结构、程序模块或其他数据等信息的任何方法或技术实现的易失性和非易失性、可移动和不可移动介质。计算机存储介质包括RAM、ROM、可擦除可编程只读寄存器(Erasable Programmable Read OnlyMemory,EPROM)、电子抹除式可复写只读存储器(Electrically-Erasable ProgrammableRead-Only Memory,EEPROM)、闪存或其他固态存储其技术,CD-ROM、数字多功能光盘(Digital Versatile Disc,DVD)或其他光学存储、磁带盒、磁带、磁盘存储或其他磁性存储设备。当然,本领域技术人员可知所述计算机存储介质不局限于上述几种。上述的系统存储器1104和大容量存储设备1107可以统称为存储器。
存储器存储有一个或多个程序,一个或多个程序被配置成由一个或多个中央处理单元1101执行,一个或多个程序包含用于实现上述方法实施例的指令,中央处理单元1101执行该一个或多个程序实现上述各个方法实施例提供的方法。
根据本申请的各种实施例,所述服务器1100还可以通过诸如因特网等网络连接到网络上的远程服务器运行。也即服务器1100可以通过连接在所述系统总线1105上的网络接口单元1111连接到网络1112,或者说,也可以使用网络接口单元1111来连接到其他类型的网络或远程服务器系统(未示出)。
所述存储器还包括一个或者一个以上的程序,所述一个或者一个以上程序存储于存储器中,所述一个或者一个以上程序包含用于进行本申请实施例提供的方法中由服务器所执行的步骤。
在示例性实施例中,还提供了一种非临时性计算机可读存储介质,所述存储介质中存储有计算机程序,所述计算机程序在被处理器执行时以实现上述异常账号的确定方法。
在示例性实施例中,还提供了一种计算机程序产品,当该计算机程序产品被处理器执行时,其用于实现上述异常账号的确定方法。
应当理解的是,在本文中提及的“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。另外,本文中描述的步骤编号,仅示例性示出了步骤间的一种可能的执行先后顺序,在一些其它实施例中,上述步骤也可以不按照编号顺序来执行,如两个不同编号的步骤同时执行,或者两个不同编号的步骤按照与图示相反的顺序执行,本申请实施例对此不作限定。
以上所述仅为本申请的可选实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (9)
1.一种异常账号的确定方法,其特征在于,所述方法包括:
获取目标用户账号对应的目标历史行为,所述目标历史行为指所述目标用户账号在应用平台上的历史行为;
根据所述目标历史行为构建所述目标用户账号对应的目标用户画像,所述目标用户画像基于不同画像构建维度和不同业务场景构建得到,其中,所述业务场景中包含各自对应的画像构建维度;
将所述目标用户画像输入评分预测模型,得到第一目标评分,所述评分预测模型基于不同业务场景和不同画像构建维度训练得到,所述评分预测模型包括所述不同画像构建维度对应的维度评分预测模型;
根据所述第一目标评分确定目标评分,所述目标评分用于表征所述目标用户账号属于异常账号的概率;
根据所述目标评分确定所述异常账号;
所述获取目标用户账号对应的目标历史行为之前,所述方法还包括:
根据样本用户账号对应的样本用户画像,通过提升boosting算法训练所述维度评分预测模型,得到所述维度评分预测模型输出的样本维度评分,其中,同一画像构建维度在所述不同业务场景中对应有不同权重,所述样本维度评分用于表征所述样本用户账号在所述不同画像构建维度下属于所述异常账号的概率。
2.根据权利要求1所述的方法,其特征在于,所述评分预测模型还包括所述不同画像构建维度对应的所述不同业务场景对应的场景评分预测模型和整体评分预测模型;所述将所述目标用户画像输入评分预测模型,得到第一目标评分,包括:
将不同业务场景中同一画像构建维度的用户数据输入所述维度评分预测模型,得到维度评分,所述维度评分用于表征所述目标用户账号在所述不同画像构建维度下属于所述异常账号的概率,且不同画像构建维度对应不同维度评分预测模型;
将所述业务场景中各个画像构建维度对应的用户数据输入所述场景评分预测模型,得到场景评分,所述场景评分用于表征所述目标用户账号在所述不同业务场景下属于所述异常账号的概率,且不同业务场景对应不同场景评分预测模型;
将所述维度评分和所述场景评分输入所述整体评分预测模型,得到所述第一目标评分。
3.根据权利要求2所述的方法,其特征在于,所述获取目标用户账号对应的目标历史行为之前,所述方法还包括:
根据所述样本用户画像,通过自助聚合bagging算法训练所述场景评分预测模型,得到所述场景评分预测模型输出的样本场景评分,其中,同一业务场景中的所述不同画像构建维度对应有相同权重,所述样本场景评分用于表征所述样本用户账号在所述不同业务场景下属于所述异常账号的概率;
根据样本业务评分和所述样本场景评分,通过所述bagging算法训练所述整体评分预测模型,得到所述整体评分预测模型输出的样本评分,其中,所述样本业务评分和所述样本场景评分分别对应有不同权重,所述样本评分用于表征所述样本用户账号属于所述异常账号的概率。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
根据所述目标用户画像和预设异常账号规则,确定所述目标用户账号对应的第二目标评分;
所述根据所述第一目标评分确定所述目标评分,包括:
根据所述第一目标评分和所述第二目标评分,确定所述目标评分,其中,所述第一目标评分和所述第二目标评分对应不同权重。
5.根据权利要求1至3任一所述的方法,其特征在于,所述根据所述目标评分确定所述异常账号,包括:
响应于所述目标评分高于评分阈值,将所述目标用户账号确定为所述异常账号;
所述根据所述目标评分确定所述异常账号之后,所述方法还包括:
根据所述目标评分所属的目标评分范围,确定所述异常账号对应的目标警告策略,其中,不同警告策略对应不同评分范围;
响应于所述异常账号在应用平台上执行预定操作时,执行所述目标警告策略。
6.根据权利要求5所述的方法,其特征在于,所述执行所述目标警告策略,包括:
若所述目标警告策略为第一警告策略,执行滑块验证,所述第一警告策略对应第一评分范围;
若所述目标警告策略为第二警告策略,执行图文验证,所述第二警告策略对应第二评分范围;
若所述目标警告策略为第三警告策略,执行账号绑定验证,所述第三警告策略对应第三评分范围;
若所述目标警告策略为第四警告策略,执行真人验证,所述第四警告策略对应第四评分范围;
若所述目标警告策略为第五警告策略,禁止所述预定操作,所述第五警告策略对应第五评分范围;
若所述目标警告策略为第六警告策略,封禁所述异常账号,所述第六警告策略对应第六评分范围;
其中,各个评分范围之间不存在交集,且所述第n评分范围的评分上限小于所述第n+1评分范围的评分上限,n为大于1且小于6的整数。
7.一种异常账号的确定装置,其特征在于,所述装置包括:
获取模块,用于获取目标用户账号对应的目标历史行为,所述目标历史行为所述目标用户账号在应用平台上的历史行为;
构建模块,用于根据所述目标历史行为构建所述目标用户账号对应的目标用户画像,所述目标用户画像基于不同画像构建维度和不同业务场景构建得到,其中,所述业务场景中包含各自对应的画像构建维度;
第一确定模块,用于将所述目标用户画像输入评分预测模型,得到第一目标评分,所述评分预测模型基于不同业务场景和不同画像构建维度训练得到,所述评分预测模型包括所述不同画像构建维度对应的维度评分预测模型;根据所述第一目标评分确定目标评分,所述目标评分用于表征所述目标用户账号属于异常账号的概率;
第二确定模块,用于根据所述目标评分确定所述异常账号;
第一训练模块,用于根据样本用户账号对应的样本用户画像,通过提升boosting算法训练所述维度评分预测模型,得到所述维度评分预测模型输出的样本维度评分,其中,同一画像构建维度在所述不同业务场景中对应有不同权重,所述样本维度评分用于表征所述样本用户账号在所述不同画像构建维度下属于所述异常账号的概率。
8.一种服务器,其特征在于,所述服务器包括处理器和存储器,所述存储器中存储有计算机程序,所述计算机程序由所述处理器加载并执行以实现如权利要求1至6任一项所述的异常账号的确定方法。
9.一种非临时性计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述的异常账号的确定方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010328517.9A CN111522724B (zh) | 2020-04-23 | 2020-04-23 | 异常账号的确定方法、装置、服务器及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010328517.9A CN111522724B (zh) | 2020-04-23 | 2020-04-23 | 异常账号的确定方法、装置、服务器及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111522724A CN111522724A (zh) | 2020-08-11 |
CN111522724B true CN111522724B (zh) | 2023-08-25 |
Family
ID=71904544
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010328517.9A Active CN111522724B (zh) | 2020-04-23 | 2020-04-23 | 异常账号的确定方法、装置、服务器及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111522724B (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115545271A (zh) * | 2020-08-12 | 2022-12-30 | 支付宝(杭州)信息技术有限公司 | 一种用户身份状态预测方法、装置及设备 |
CN114124873B (zh) * | 2020-08-26 | 2023-07-18 | 腾讯科技(深圳)有限公司 | 账号异常处理方法、装置、计算机设备和存储介质 |
CN113222736A (zh) * | 2021-05-24 | 2021-08-06 | 北京城市网邻信息技术有限公司 | 一种异常用户的检测方法、装置、电子设备及存储介质 |
CN114629693B (zh) * | 2022-02-28 | 2023-10-31 | 天翼安全科技有限公司 | 一种可疑宽带账号的识别方法及装置 |
CN114757729A (zh) * | 2022-03-03 | 2022-07-15 | 未鲲(上海)科技服务有限公司 | 交易请求的处理方法、装置、终端设备和存储介质 |
CN118154207B (zh) * | 2024-05-13 | 2024-07-26 | 鲁担(山东)数据科技有限公司 | 一种基于人工智能算法的反欺诈系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109978549A (zh) * | 2019-02-19 | 2019-07-05 | 北京三快在线科技有限公司 | 识别二次放号的方法和装置、存储介质 |
EP3528219A1 (en) * | 2018-02-14 | 2019-08-21 | Arb Labs Inc. | Systems, methods and devices for monitoring betting activities |
CN110598157A (zh) * | 2019-09-20 | 2019-12-20 | 北京字节跳动网络技术有限公司 | 目标信息识别方法、装置、设备及存储介质 |
CN110633423A (zh) * | 2019-09-20 | 2019-12-31 | 北京字节跳动网络技术有限公司 | 目标账号识别方法、装置、设备及存储介质 |
-
2020
- 2020-04-23 CN CN202010328517.9A patent/CN111522724B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3528219A1 (en) * | 2018-02-14 | 2019-08-21 | Arb Labs Inc. | Systems, methods and devices for monitoring betting activities |
CN109978549A (zh) * | 2019-02-19 | 2019-07-05 | 北京三快在线科技有限公司 | 识别二次放号的方法和装置、存储介质 |
CN110598157A (zh) * | 2019-09-20 | 2019-12-20 | 北京字节跳动网络技术有限公司 | 目标信息识别方法、装置、设备及存储介质 |
CN110633423A (zh) * | 2019-09-20 | 2019-12-31 | 北京字节跳动网络技术有限公司 | 目标账号识别方法、装置、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN111522724A (zh) | 2020-08-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111522724B (zh) | 异常账号的确定方法、装置、服务器及存储介质 | |
CN110598016B (zh) | 一种多媒体信息推荐的方法、装置、设备和介质 | |
CN109241425B (zh) | 一种资源推荐方法、装置、设备及存储介质 | |
CN110442712B (zh) | 风险的确定方法、装置、服务器和文本审理系统 | |
CN106850346B (zh) | 用于监控节点变化及辅助识别黑名单的方法、装置及电子设备 | |
CN107807941B (zh) | 信息处理方法和装置 | |
CN111311136A (zh) | 风控决策方法、计算机设备及存储介质 | |
CN113383362B (zh) | 用户识别方法及相关产品 | |
CN104836781A (zh) | 区分访问用户身份的方法及装置 | |
CN110413867B (zh) | 用于内容推荐的方法及系统 | |
CN110727868A (zh) | 对象推荐方法、装置和计算机可读存储介质 | |
CN106339507A (zh) | 流媒体消息推送方法和装置 | |
WO2019061664A1 (zh) | 电子装置、基于用户上网数据的产品推荐方法及存储介质 | |
CN113422988B (zh) | 直播封面生成方法、装置、电子设备及存储介质 | |
CN110362751B (zh) | 业务推荐方法、装置、计算机设备和存储介质 | |
WO2019074446A1 (en) | LOAN REQUEST PROCESSING SYSTEM AND METHOD | |
US11475019B2 (en) | Contact graph scoring system | |
CN112202849A (zh) | 内容分发方法、装置、电子设备和计算机可读存储介质 | |
TW202111592A (zh) | 學習模型應用系統、學習模型應用方法及程式產品 | |
CN111784360B (zh) | 一种基于网络链接回溯的反欺诈预测方法及系统 | |
CN114491093B (zh) | 多媒体资源推荐、对象表征网络的生成方法及装置 | |
CN114697127B (zh) | 一种基于云计算的业务会话风险处理方法及服务器 | |
CN112804566A (zh) | 节目推荐方法、设备及计算机可读存储介质 | |
CN116318974A (zh) | 站点风险识别方法、装置、计算机可读介质及电子设备 | |
US10482105B1 (en) | External verification of content popularity |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |