CN109561069A - 一种识别模型的生成方法及装置、一种识别方法及装置 - Google Patents

一种识别模型的生成方法及装置、一种识别方法及装置 Download PDF

Info

Publication number
CN109561069A
CN109561069A CN201811248270.9A CN201811248270A CN109561069A CN 109561069 A CN109561069 A CN 109561069A CN 201811248270 A CN201811248270 A CN 201811248270A CN 109561069 A CN109561069 A CN 109561069A
Authority
CN
China
Prior art keywords
user
business
supervised
sample
users
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811248270.9A
Other languages
English (en)
Inventor
毛雪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Advanced New Technologies Co Ltd
Advantageous New Technologies Co Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201811248270.9A priority Critical patent/CN109561069A/zh
Publication of CN109561069A publication Critical patent/CN109561069A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/08Network architectures or network communication protocols for network security for authentication of entities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/30Network architectures or network communication protocols for network security for supporting lawful interception, monitoring or retaining of communications or communication related information
    • H04L63/302Network architectures or network communication protocols for network security for supporting lawful interception, monitoring or retaining of communications or communication related information gathering intelligence information for situation awareness or reconnaissance

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Computer Security & Cryptography (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Evolutionary Computation (AREA)
  • Technology Law (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请提供一种识别模型的生成方法及装置、一种识别方法及装置,所述方法包括:获取待识别用户信息;根据所述待识别用户信息提取待识别用户的被监督业务的业务行为的特征变量及变量值;由计算机系统通过将识别模型应用于所述提取待识别用户的特征变量及变量值来识别所述待识别用户是否为被控用户。

Description

一种识别模型的生成方法及装置、一种识别方法及装置
技术领域
本申请涉及信息数据分类识别处理技术领域,特别涉及一种识别模型的生成方法及装置、一种识别方法及装置、一种计算设备及存储介质。
背景技术
当今,在许多互联网的场景下,商家会通过抢红包的方式吸引消费者。在在抢红包业务中,出现有黑产获取商家(或用户)公开在自媒体平台上的口令后,通过真机群控进行批量秒领。真机群控通过系统自动化控制集成技术,把多个手机操作界面直接映射到电脑显示器,实现由一台电脑来控制几十台甚至上百台手机的效果,同时群控系统对中控电脑上每个手机的操作界面进行编号,对应相同编号的手机,从而实现一对一的手机操作控制。很显然,真机群控的出现对真正用户是不利和商家均是不利的,需要对其进行规避。
发明内容
有鉴于此,本说明书实施例提供了一种识别模型的生成方法及装置、一种识别方法及装置、一种计算设备及存储介质,以解决现有技术中存在的技术缺陷。
第一方面,本说明书一实施例公开了一种识别模型的生成方法,包括:
获取样本用户信息以及每个所述样本用户对应的白标签或黑标签;
根据所述样本用户信息对每个样本用户的被监督业务的业务行为进行分析,并提取每个样本用户的被监督业务的业务行为的特征变量及变量值;
由计算机系统生成识别模型,所述识别模型使得每个样本用户的被监督业务的业务行为的特征变量及变量值与样本用户的所述白标签或所述黑标签相关联,其中,所述白标签对应于样本用户为非被控用户,所述黑标签对应于样本用户为被控用户。
第二方面,本说明书一实施例公开了一种识别方法,包括:
获取待识别用户信息;
根据所述待识别用户信息提取待识别用户的被监督业务的业务行为的特征变量及变量值;
由计算机系统通过将识别模型应用于所述提取待识别用户的特征变量及变量值来识别所述待识别用户是否为被控用户。
第三方面,本说明书一实施例公开了一种识别模型的生成装置,包括:
第一获取模块,被配置为获取样本用户信息以及每个所述样本用户对应的白标签或黑标签;
第一提取模块,被配置为根据所述样本用户信息对每个样本用户的被监督业务的业务行为进行分析,并提取每个样本用户的被监督业务的业务行为的特征变量及变量值;
训练模块,被配置为由计算机系统生成识别模型,所述识别模型使得每个用户的被监督业务的业务行为的特征变量及变量值与样本用户的所述白标签或所述黑标签相关联,其中,所述白标签对应于样本用户为非被控用户,所述黑标签对应于样本用户为被控用户。
第四方面,本说明书一实施例公开了一种识别装置,包括:
第二获取模块,被配置为获取待识别用户信息;
第三提取模块,被配置为根据所述待识别用户信息提取待识别用户的被监督业务的业务行为的特征变量及变量值;
识别模块,被配置为将识别模型应用于所述提取待识别用户的特征变量及变量值来识别所述待识别用户是否为被控用户。
第五方面,本说明书一实施例公开了一种计算设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机指令,所述处理器执行所述指令时实现该指令被处理器执行时实现如上所述识别模型的生成方法或者识别方法的步骤。
第六方面,本说明书一实施例公开了一种计算机可读存储介质,其存储有计算机指令,该指令被处理器执行时实现如上所述识别模型的生成方法或者识别方法的步骤。
本申请提供一种识别模型的生成方法及装置、一种识别方法及装置,所述方法包括:获取待识别用户信息;根据所述待识别用户信息提取待识别用户的被监督业务的业务行为的特征变量及变量值;将识别模型应用于所述提取待识别用户的特征变量及变量值来识别所述待识别用户是否为被控用户;使得被控用户识别准确性高并且识别速度快。
附图说明
图1是说明书一个或多个实施例提供的一种识别方法的流程图;
图2是说明书一个或多个实施例提供的一种识别模型的生成方法的流程图;
图3是说明书一个或多个实施例提供的一种识别方法的流程图;
图4是说明书一个或多个实施例提供的一种识别方法的流程图;
图5是说明书一个或多个实施例提供的一种识别模型的生成装置的结构示意图;
图6是说明书一个或多个实施例提供的一种识别装置的结构示意图;
图7是说明书一个或多个实施例提供的一种计算设备的结构框图。
具体实施方式
在下面的描述中阐述了很多具体细节以便于充分理解本申请。但是本申请能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本申请内涵的情况下做类似推广,因此本申请不受下面公开的具体实施的限制。
在本说明书一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书一个或多个实施例。在本说明书一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本说明书一个或多个实施例中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本说明书一个或多个实施例中可能采用术语第一、第二等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本说明书一个或多个实施例范围的情况下,第一也可以被称为第二,类似地,第二也可以被称为第一。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
首先对本说明书一个或多个实施例中使用到的技术术语进行解释。
群控:分为线控及云控。可以用一台电脑控制上百部手机,实现手机群控。使用一台电脑控制百部手机,同时操作微信达到电脑群控手机的效果,极大程度上节省人工成本,提高办公和微信营销效率。本说明书一个或多个实施例中,真机群控主要应用在支付宝口令红包业务中,黑产获取商家或用户公开在自媒体平台上的口令后,通过真机群控进行批量秒领。
白帽子:白帽子描述的是正面的黑客。他可以识别计算机系统或网络系统中的安全漏洞,但并不会恶意去利用,而是公布其漏洞。这样系统可以在被其他人(例如黑帽子)利用之前修补漏洞。
参见图1,本说明书一个或多个实施例提供了一种识别方法,包括步骤102至步骤106。
步骤102:获取待识别用户信息。
本说明书一个或多个实施例中,所述待识别用户信息包括但不限于用户名称、注册用户时间、关联银行号码、注册身份证号码等。
步骤104:根据所述待识别用户信息提取待识别用户的被监督业务的业务行为的特征变量及变量值。
本说明书一个或多个实施例中,所述被监督业务的业务行为的特征变量包括环境数据变量和历史数据变量,
其中,所述环境数据变量包括所述待识别用户使用设备的IP地址、MAC地址和/或IMEI地址,
所述历史数据变量包括待识别用户在所述被监督业务下的尝试次数、成功次数、失败次数、所述待识别用户在完成所述被监督业务操作的时间、被监督业务的结束时间和/或所述待识别用户重复执行所述被监督业务的次数。
本说明书一个或多个实施例中,根据所述待识别用户信息提取待识别用户的被监督业务的业务行为的特征变量及变量值可以包括在一个用户、身份、设备、环境下的一定段时间内的业务成功次数、尝试业务次数、业务失败的比率、业务操作均在预设时间内的次数以及同设备同身份同一业务操作的次数,然后根据所述特征变量确定变量值。
本说明书一个或多个实施例中,以支付宝红包领取业务为例,对获取待识别用户信息以及根据所述待识别用户信息提取待识别用户的被监督业务的业务行为的特征变量及变量值进行详细说明。
在支付宝口令红包领取业务中,当用户a获得一个红包口令后,用户a登录支付宝客户端,打开口令输入界面,并在输入界面的输入框中输入红包口令,并点击发送;当服务器收到支付宝客户端发来的点击指令,即读取该用户a的用户信息,所述用户信息可以包括用户a的名称、支付宝所在的设备名称、注册用户时间、关联银行号码以及注册身份证号码等。
然后根据所述用户信息,检索与该用户有相同的银行号码、注册身份证号码或者具有相同设备名称之一的用户,并认定这些用户为具有同一用户、身份、设备、环境的用户,所述特征变量则为这些用户抢红包的相关数据包括:抢红包成功次数、尝试领取红包次数、被策略拦截的比率、领取疑似被秒领的红包数量、领取红包时间都在最后几秒的次数以及同设备同身份领取出现在同一个红包的次数,并根据所述特征变量得到特征值,例如尝试次数为10次、成功次数20次以及失败次数为5次等。
步骤106:由计算机系统通过将识别模型应用于所述提取待识别用户的特征变量及变量值来识别所述待识别用户是否为被控用户。
本说明书一个或多个实施例中,若所述待识别用户为历史用户;
则由计算机系统通过将识别模型应用于所述提取的特征变量及变量值来识别所述待识别用户是否为被控用户之后,还可以包括:
将被控用户加入稽核名单中。
本说明书一个或多个实施例中,首先获取待识别用户信息,然后根据所述待识别用户信息提取待识别用户的被监督业务的业务行为的特征变量及变量值,最后由计算机系统通过将识别模型应用于所述提取待识别用户的特征变量及变量值来识别所述待识别用户是否为被控用户,采用该识别模型对被控用户进行识别的方法,使得被控用户识别准确性高并且识别速度快。
本说明书一个或多个实施例中,所述识别方法中使用的所述识别模型通过以下步骤生成,包括步骤202至步骤206。
步骤202:获取样本用户信息以及每个所述样本用户对应的白标签或黑标签。
步骤204:根据所述样本用户信息对每个样本用户的被监督业务的业务行为进行分析,并提取每个样本用户的被监督业务的业务行为的特征变量及变量值。
本说明书一个或多个实施例中,所述被监督业务的业务行为的特征变量包括环境数据变量和历史数据变量,
其中,所述环境数据变量包括所述样本用户使用设备的IP地址、MAC地址和/或IMEI地址,
所述历史数据变量包括所述样本用户在所述被监督业务下的尝试次数、成功次数、失败次数、所述样本用户在完成所述被监督业务操作的时间、被监督业务的结束时间和/或所述样本用户重复执行所述被监督业务的次数。
本说明书一个或多个实施例中,提取每个样本用户的被监督业务的业务行为的特征变量及变量值之前,还包括:
根据所述被监督业务确定待提取的每个样本用户的业务行为的特征变量。
其中,根据所述被监督业务确定待提取的每个样本用户的业务行为的特征变量包括根据所述被监督业务的业务行为的特征变量在所述被监督业务中的重要程度确定待提取的每个样本用户的业务行为的特征变量。
步骤206:由计算机系统生成识别模型,所述识别模型使得每个样本用户的被监督业务的业务行为的特征变量及变量值与样本用户的所述白标签或所述黑标签相关联,其中,所述白标签对应于样本用户为非被控用户,所述黑标签对应于样本用户为被控用户。
本说明书一个或多个实施例中,所述识别模型包括逻辑回归、随机森林或者支持向量机。
实际应用中,所述识别模型可以应用在抢红包业务真机群控用户的识别中,所述输入参数可以包括历史上已存在的正常用户以及由白帽子提供的具有真机群控特征的异常用户,并且每个用户均对应一个标签,例如黑标签0或白标签1,其中,所述白标签对应于用户为非被控用户,所述黑标签对应于用户为被控用户,然后将每个用户对应的特征变量提取出来,并对用户的每个特征变量按照风险大小赋值,比如风险从大到小依次为9-0,这些数值即为所述输入参数。
所述输出参数包括提取出的所有用户的业务特征与标签关联度,输出的值越大,表示所述用户为白标签或黑标签的相关度越大。
本说明书一个或多个实施例中,所述识别模型可以还原用户业务行为特征,针对每一个异常用户,均可以获取异常用户异常操作返回时的全部信息,包括个体特征和群居特征进行训练,并给出分类标签,其中,所述个体特征和群居特征可以较为准确的刻画风险行为,不需要人工干预阈值选择,使得训练好的所述识别模型可以根据输入的特征变量更加准确的识别出异常用户即被控用户,保障业务的安全性。
参见图3,本说明书一个或多个实施例提供了一种识别方法,包括步骤302至步骤316。
步骤302:获取待识别用户信息。
步骤304:根据所述待识别用户信息提取待识别用户的被监督业务的业务行为的特征变量及变量值。
步骤306:所述待识别用户为当前用户,将所述当前用户与预先统计的稽核名单比较。
步骤308:由计算机系统通过将识别模型应用于所述提取待识别用户的特征变量及变量值来识别所述待识别用户是否为被控用户。
步骤310:若所述当前用户在所述稽核名单中,所述当前用户对所述被监督业务的尝试次数减少并且由计算机系统通过将识别模型应用于所述提取的特征变量及变量值来识别所述当前用户不是被控用户,允许所述当前用户执行所述被监督业务。
步骤312:若所述当前用户在所述稽核名单中,所述当前用户对所述被监督业务的尝试次数增加并且由计算机系统通过将识别模型应用于所述提取的特征变量及变量值来识别所述当前用户是被控用户,不允许所述当前用户执行所述被监督业务。
步骤314:若所述当前用户不在所述稽核名单中,并且由计算机系统通过将识别模型应用于所述提取的特征变量及变量值来识别所述当前用户不是被控用户,允许所述当前用户执行所述被监督业务。
步骤316:若所述当前用户不在所述稽核名单中,并且由计算机系统通过将识别模型应用于所述提取的特征变量及变量值来识别所述当前用户是被控用户,不允许所述当前用户执行所述被监督业务。
实际应用中,所述步骤310至步骤316根据实际需求被选择执行。
参见图4,以支付宝口令红包领取业务为例对将所述当前用户与预先统计的稽核名单比较的情况进行详细说明,包括步骤402至步骤422。
步骤402:获取当前口令红包领取用户。
步骤404:若所述当前口令红包领取用户在预先统计的策略稽核名单中,执行步骤406或步骤410。
步骤406:所述当前口令红包领取用户对所述红包领取业务的尝试次数减少并且由计算机系统通过将识别模型应用于所述提取的特征变量及变量值来识别所述当前口令红包领取用户的操作无真机群控特点,不是被控用户,则执行步骤408。
步骤408:将所述当前口令红包领取用户从策略稽核名单中释放,允许所述当前口令红包领取用户领取红包。
步骤410:所述当前口令红包领取用户对所述红包领取业务的尝试次数增加并且由计算机系统通过将识别模型应用于所述提取的特征变量及变量值来识别所述当前口令红包领取用户的操作有真机群控特点,是被控用户,则执行步骤412。
步骤412:不允许所述当前口令红包领取用户领取红包,并将所述当前口令红包领取用户作为黑样本使用在对所述识别模型的训练中。
步骤414:若所述当前口令红包领取用户不在预先统计的策略稽核名单中,执行步骤416或步骤420。
步骤416:由计算机系统通过将识别模型应用于所述提取的特征变量及变量值来识别所述当前口令红包领取用户的操作无真机群控特点,不是被控用户,执行步骤418。
步骤418:允许所述当前口令红包领取用户领取红包。
步骤420:由计算机系统通过将识别模型应用于所述提取的特征变量及变量值来识别所述当前口令红包领取用户的操作有真机群控特点,是被控用户,执行步骤422。
步骤422:将所述当前口令红包领取用户加入所述策略稽核名单中,并且不允许所述当前口令红包领取用户领取红包。
本说明书一个或多个实施例中,将所述识别方法应用于领取红包业务中,首先可以基于白帽子提供的真机群控领取红包的账户进行分析,将分析结果作为识别模型训练的标签,然后根据分析结果挖掘真机群控领取红包的特征变量以及变量值,然后使用监督机器学习模型即预先生成的识别模型对批量领取用户做判别分析,可以准确识别出批量操作领取红包的异常用户,并且采用识别模型对批量领取用户做判别分析的方式可以减少开发成本,缩短开发周期,极大的提高了工作效率。
将所述识别方法以及所述识别方法中的识别模型应用在支付宝口令红包领取中,首先由白帽子提供具有批量操作领取红包特征的用户以及正常操作的用户进行分析,获取这些用户信息以及每个用户对应的白标签或黑标签,白标签对应于正常操作用户,黑标签对应于被控用户。
然后根据所述支付宝口令红包领取的领取红包行为的特征变量在所述支付宝口令红包领取业务中的重要程度确定待提取的每个用户的领取红包行为的特征变量以及特征值。
最后采用上述用户信息、每个用户对应的黑标签或者白标签、每个用户的领取红包行为的特征变量以及特征值对由计算机系统生成的识别模型进行训练,该识别模型具有监督学习的能力,通过训练,所述识别模型使得每个用户的支付宝红包领取的领取红包行为的特征变量及变量值与用户的所述白标签或所述黑标签相关联,实现对支付宝口令领取红包业务实时监控用户的红包领取操作,然后根据对应标签判断用户是否为批量操作用户等风险识别。
在具体的支付宝口令红包领取识别用户领取红包行为的处理过程中,可以将训练好的识别模型部署到支付宝应用程序中,每当用户进行一系列的领取红包操作时,可以将用户在该时间内的一系列领取红包操作行为数据转化成识别模型的输入数据,识别模型会输出该一系列的领取红包操作行为的行为类别,例如正常领取红包操作或批量领取红包操作等,进一步建立稽核名单,并结合识别模型的识别结果,用量化方式拦截批量操作用户,同时不打扰正常用户操作,进而可以在出现风险操作时更加精准、及时的采取相应措施,保障红包领取业务的正常稳定开展。
参见图5,本说明书一个或多个实施例提供了一种识别模型的生成装置,包括:
第一获取模块502,被配置为获取样本用户信息以及每个所述样本用户对应的白标签或黑标签;
第一提取模块504,被配置为根据所述样本用户信息对每个样本用户的被监督业务的业务行为进行分析,并提取每个样本用户的被监督业务的业务行为的特征变量及变量值;
训练模块506,被配置为由计算机系统生成识别模型,所述识别模型使得每个样本用户的被监督业务的业务行为的特征变量及变量值与样本用户的所述白标签或所述黑标签相关联,其中,所述白标签对应于样本用户为非被控用户,所述黑标签对应于样本用户为被控用户。
可选地,所述被监督业务的业务行为的特征变量包括环境数据变量和历史数据变量,
其中,所述环境数据变量包括所述样本用户使用设备的IP地址、MAC地址和/或IMEI地址,
所述历史数据变量包括所述样本用户在所述被监督业务下的尝试次数、成功次数、失败次数、所述样本用户在完成所述被监督业务操作的时间、被监督业务的结束时间和/或所述样本用户重复执行所述被监督业务的次数。
可选地,所述装置还包括:
第二提取模块,被配置为根据所述被监督业务确定待提取的每个样本用户的业务行为的特征变量。
可选地,所述第二提取模块还被配置为根据所述被监督业务的业务行为的特征变量在所述被监督业务中的重要程度确定待提取的每个样本用户的业务行为的特征变量。
可选地,所述识别模型包括逻辑回归、随机森林或者支持向量机。
本说明书一个或多个实施例中,所述识别模型可以还原用户业务行为特征,针对每一个异常用户,均可以获取异常用户异常操作返回时的全部信息,包括个体特征和群居特征进行训练,并给出分类标签,其中,所述个体特征和群居特征可以较为准确的刻画风险行为,不需要人工干预阈值选择,使得训练好的所述识别模型可以根据输入的特征变量更加准确的识别出异常用户即被控用户,保障业务的安全性。
参见图6,本说明书一个或多个实施例提供了一种识别装置,包括:
第二获取模块602,被配置为获取待识别用户信息;
第三提取模块604,被配置为根据所述待识别用户信息提取待识别用户的被监督业务的业务行为的特征变量及变量值;
识别模块606,被配置为将识别模型应用于所述提取待识别用户的特征变量及变量值来识别所述待识别用户是否为被控用户。
可选地,所述被监督业务的业务行为的特征变量包括环境数据变量和历史数据变量,
其中,所述环境数据变量包括所述待识别用户使用设备的IP地址、MAC地址和/或IMEI地址,
所述历史数据变量包括待识别用户在所述被监督业务下的尝试次数、成功次数、失败次数、所述待识别用户在完成所述被监督业务操作的时间、被监督业务的结束时间和/或所述待识别用户重复执行所述被监督业务的次数。
可选地,所述待识别用户为历史用户;
所述装置还包括:
添加模块,被配置为将被控用户加入稽核名单中。
可选地,所述待识别用户为当前用户;所述装置还包括:
第一比较模块,被配置为将所述当前用户与预先统计的稽核名单比较;
若所述当前用户在所述稽核名单中,所述当前用户对所述被监督业务的尝试次数减少并且将识别模型应用于所述提取的特征变量及变量值来识别所述当前用户不是被控用户之后,所述装置还包括:
第一执行模块,被配置为允许所述当前用户执行所述被监督业务;或者
若所述当前用户在所述稽核名单中,所述当前用户对所述被监督业务的尝试次数增加并且将识别模型应用于所述提取的特征变量及变量值来识别所述当前用户是被控用户之后,所述装置还包括:
第二执行模块,被配置为不允许所述当前用户执行所述被监督业务。
可选地,所述待识别用户为当前用户;所述装置还包括:
第二比较模块,将所述当前用户与预先统计的稽核名单比较;
若所述当前用户不在所述稽核名单中,并且将识别模型应用于所述提取的特征变量及变量值来识别所述当前用户不是被控用户之后,所述装置还包括:
第三执行模块,被配置为允许所述当前用户执行所述被监督业务;或者
若所述当前用户不在所述稽核名单中,并且将识别模型应用于所述提取的特征变量及变量值来识别所述当前用户是被控用户之后,所述装置还包括:
第四执行模块,被配置为不允许所述当前用户执行所述被监督业务。
本说明书一个或多个实施例中,所述识别装置首先获取待识别用户信息,然后根据所述待识别用户信息提取待识别用户的被监督业务的业务行为的特征变量及变量值,最后将识别模型应用于所述提取待识别用户的特征变量及变量值来识别所述待识别用户是否为被控用户,采用该识别模型对被控用户进行识别的方法,使得被控用户识别准确性高并且识别速度快。
图7是示出了根据本说明书一实施例的计算设备700的结构框图。该计算设备700的部件包括但不限于存储器710和处理器720。处理器720与存储器710通过总线730相连接,数据库750用于保存数据。
计算设备700还包括接入设备740,接入设备740使得计算设备700能够经由一个或多个网络760通信。这些网络的示例包括公用交换电话网(PSTN)、局域网(LAN)、广域网(WAN)、个域网(PAN)或诸如因特网的通信网络的组合。接入设备740可以包括有线或无线的任何类型的网络接口(例如,网络接口卡(NIC))中的一个或多个,诸如IEEE702.11无线局域网(WLAN)无线接口、全球微波互联接入(Wi-MAX)接口、以太网接口、通用串行总线(USB)接口、蜂窝网络接口、蓝牙接口、近场通信(NFC)接口,等等。
在本说明书的一个实施例中,计算设备700的上述以及图7中未示出的其他部件也可以彼此相连接,例如通过总线。应当理解,图7所示的计算设备结构框图仅仅是出于示例的目的,而不是对本说明书范围的限制。本领域技术人员可以根据需要,增添或替换其他部件。
计算设备700可以是任何类型的静止或移动计算设备,包括移动计算机或移动计算设备(例如,平板计算机、个人数字助理、膝上型计算机、笔记本计算机、上网本等)、移动电话(例如,智能手机)、可佩戴的计算设备(例如,智能手表、智能眼镜等)或其他类型的移动设备,或者诸如台式计算机或PC的静止计算设备。计算设备700还可以是移动式或静止式的服务器。
本说明书一实施例还提供一种计算机可读存储介质,其存储有计算机指令,该指令被处理器执行时实现如前所述识别模型的生成方法或者识别方法的步骤。
上述为本实施例的一种计算机可读存储介质的示意性方案。需要说明的是,该存储介质的技术方案与上述的所述识别模型的生成方法或者识别方法的技术方案属于同一构思,存储介质的技术方案未详细描述的细节内容,均可以参见上述所述识别模型的生成方法或者识别方法的技术方案的描述。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
本说明书实施例中所述支付涉及的技术载体,例如可以包括近场通信(NearField Communication,NFC)、WIFI、3G/4G/5G、POS机刷卡技术、二维码扫码技术、条形码扫码技术、蓝牙、红外、短消息(Short Message Service,SMS)、多媒体消息(MultimediaMessage Service,MMS)等。
所述计算机指令包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
需要说明的是,对于前述的各方法实施例,为了简便描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其它顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定都是本申请所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其它实施例的相关描述。
以上公开的本申请优选实施例只是用于帮助阐述本申请。可选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本说明书的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本申请的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本申请。本申请仅受权利要求书及其全部范围和等效物的限制。

Claims (22)

1.一种识别模型的生成方法,其特征在于,包括:
获取样本用户信息以及每个所述样本用户对应的白标签或黑标签;
根据所述样本用户信息对每个样本用户的被监督业务的业务行为进行分析,并提取每个样本用户的被监督业务的业务行为的特征变量及变量值;
由计算机系统生成识别模型,所述识别模型使得每个样本用户的被监督业务的业务行为的特征变量及变量值与样本用户的所述白标签或所述黑标签相关联,其中,所述白标签对应于样本用户为非被控用户,所述黑标签对应于样本用户为被控用户。
2.根据权利要求1所述的方法,其特征在于,所述被监督业务的业务行为的特征变量包括环境数据变量和历史数据变量,
其中,所述环境数据变量包括所述样本用户使用设备的IP地址、MAC地址和/或IMEI地址,
所述历史数据变量包括所述样本用户在所述被监督业务下的尝试次数、成功次数、失败次数、所述样本用户在完成所述被监督业务操作的时间、被监督业务的结束时间和/或所述样本用户重复执行所述被监督业务的次数。
3.根据权利要求1所述的方法,其特征在于,提取每个样本用户的被监督业务的业务行为的特征变量及变量值之前,还包括:
根据所述被监督业务确定待提取的每个样本用户的业务行为的特征变量。
4.根据权利要求3所述的方法,其特征在于,根据所述被监督业务确定待提取的每个样本用户的业务行为的特征变量包括:
根据所述被监督业务的业务行为的特征变量在所述被监督业务中的重要程度确定待提取的每个样本用户的业务行为的特征变量。
5.根据权利要求1所述的方法,其特征在于,所述识别模型包括逻辑回归、随机森林或者支持向量机。
6.一种识别方法,其特征在于,包括:
获取待识别用户信息;
根据所述待识别用户信息提取待识别用户的被监督业务的业务行为的特征变量及变量值;
由计算机系统通过将识别模型应用于所述提取待识别用户的特征变量及变量值来识别所述待识别用户是否为被控用户。
7.根据权利要求6所述的方法,其特征在于,所述被监督业务的业务行为的特征变量包括环境数据变量和历史数据变量,
其中,所述环境数据变量包括所述待识别用户使用设备的IP地址、MAC地址和/或IMEI地址,
所述历史数据变量包括待识别用户在所述被监督业务下的尝试次数、成功次数、失败次数、所述待识别用户在完成所述被监督业务操作的时间、被监督业务的结束时间和/或所述待识别用户重复执行所述被监督业务的次数。
8.根据权利要求6所述的方法,其特征在于,所述待识别用户为历史用户;
由计算机系统通过将识别模型应用于所述提取的特征变量及变量值来识别所述待识别用户是否为被控用户之后,还包括:
将被控用户加入稽核名单中。
9.根据权利要求6所述的方法,其特征在于,所述待识别用户为当前用户;
由计算机系统通过将识别模型应用于所述提取的特征变量及变量值来识别所述待识别用户是否为被控用户之前还包括:
将所述当前用户与预先统计的稽核名单比较;
若所述当前用户在所述稽核名单中,所述当前用户对所述被监督业务的尝试次数减少并且由计算机系统通过将识别模型应用于所述提取的特征变量及变量值来识别所述当前用户不是被控用户之后,还包括:
允许所述当前用户执行所述被监督业务;或者
若所述当前用户用户在所述稽核名单中,所述当前用户对所述被监督业务的尝试次数增加并且由计算机系统通过将识别模型应用于所述提取的特征变量及变量值来识别所述当前用户是被控用户之后,还包括:
不允许所述当前用户执行所述被监督业务。
10.根据权利要求6所述的方法,其特征在于,所述待识别用户为当前用户;
由计算机系统通过将识别模型应用于所述提取的特征变量及变量值来识别所述待识别用户是否为被控用户之前还包括:
将所述当前用户与预先统计的稽核名单比较;
若所述当前用户不在所述稽核名单中,并且由计算机系统通过将识别模型应用于所述提取的特征变量及变量值来识别所述当前用户不是被控用户之后,还包括:
允许所述当前用户执行所述被监督业务;或者
若所述当前用户不在所述稽核名单中,并且由计算机系统通过将识别模型应用于所述提取的特征变量及变量值来识别所述当前用户是被控用户之后,还包括:
不允许所述当前用户执行所述被监督业务。
11.一种识别模型的生成装置,其特征在于,包括:
第一获取模块,被配置为获取样本用户信息以及每个所述样本用户对应的白标签或黑标签;
第一提取模块,被配置为根据所述样本用户信息对每个样本用户的被监督业务的业务行为进行分析,并提取每个样本用户的被监督业务的业务行为的特征变量及变量值;
训练模块,被配置为由计算机系统生成识别模型,所述识别模型使得每个样本用户的被监督业务的业务行为的特征变量及变量值与样本用户的所述白标签或所述黑标签相关联,其中,所述白标签对应于样本用户为非被控样本用户,所述黑标签对应于样本用户为被控样本用户。
12.根据权利要求11所述的装置,其特征在于,所述被监督业务的业务行为的特征变量包括环境数据变量和历史数据变量,
其中,所述环境数据变量包括所述样本用户使用设备的IP地址、MAC地址和/或IMEI地址,
所述历史数据变量包括所述样本用户在所述被监督业务下的尝试次数、成功次数、失败次数、所述样本用户在完成所述被监督业务操作的时间、被监督业务的结束时间和/或所述样本用户重复执行所述被监督业务的次数。
13.根据权利要求11所述的装置,其特征在于,还包括:
第二提取模块,被配置为根据所述被监督业务确定待提取的每个样本用户的业务行为的特征变量。
14.根据权利要求13所述的装置,其特征在于,所述第二提取模块还被配置为根据所述被监督业务的业务行为的特征变量在所述被监督业务中的重要程度确定待提取的每个样本用户的业务行为的特征变量。
15.根据权利要求11所述的装置,其特征在于,所述识别模型包括逻辑回归、随机森林或者支持向量机。
16.一种识别装置,其特征在于,包括:
第二获取模块,被配置为获取待识别用户信息;
第三提取模块,被配置为根据所述待识别用户信息提取待识别用户的被监督业务的业务行为的特征变量及变量值;
识别模块,被配置为将识别模型应用于所述提取待识别用户的特征变量及变量值来识别所述待识别用户是否为被控用户。
17.根据权利要求16所述的装置,其特征在于,所述被监督业务的业务行为的特征变量包括环境数据变量和历史数据变量,
其中,所述环境数据变量包括所述待识别用户使用设备的IP地址、MAC地址和/或IMEI地址,
所述历史数据变量包括待识别用户在所述被监督业务下的尝试次数、成功次数、失败次数、所述待识别用户在完成所述被监督业务操作的时间、被监督业务的结束时间和/或所述待识别用户重复执行所述被监督业务的次数。
18.根据权利要求16所述的装置,其特征在于,所述待识别用户为历史用户;
所述装置还包括:
添加模块,被配置为将被控用户加入稽核名单中。
19.根据权利要求16所述的装置,其特征在于,所述待识别用户为当前用户;所述装置还包括:
第一比较模块,被配置为将所述当前用户与预先统计的稽核名单比较;
若所述当前用户在所述稽核名单中,所述当前用户对所述被监督业务的尝试次数减少并且将识别模型应用于所述提取的特征变量及变量值来识别所述当前用户不是被控用户之后,所述装置还包括:
第一执行模块,被配置为允许所述当前用户执行所述被监督业务;或者
若所述当前用户在所述稽核名单中,所述当前用户对所述被监督业务的尝试次数增加并且将识别模型应用于所述提取的特征变量及变量值来识别所述当前用户是被控用户之后,所述装置还包括:
第二执行模块,被配置为不允许所述当前用户执行所述被监督业务。
20.根据权利要求16所述的装置,其特征在于,所述待识别用户为当前用户;所述装置还包括:
第二比较模块,将所述当前用户与预先统计的稽核名单比较;
若所述当前用户不在所述稽核名单中,并且将识别模型应用于所述提取的特征变量及变量值来识别所述当前用户不是被控用户之后,所述装置还包括:
第三执行模块,被配置为允许所述当前用户执行所述被监督业务;或者
若所述当前用户不在所述稽核名单中,并且将识别模型应用于所述提取的特征变量及变量值来识别所述当前用户是被控用户之后,所述装置还包括:
第四执行模块,被配置为不允许所述当前用户执行所述被监督业务。
21.一种计算设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机指令,其特征在于,所述处理器执行所述指令时实现权利要求1-5或6-10任意一项所述方法的步骤。
22.一种计算机可读存储介质,其存储有计算机指令,其特征在于,该指令被处理器执行时实现权利要求1-5或6-10任意一项所述方法的步骤。
CN201811248270.9A 2018-10-25 2018-10-25 一种识别模型的生成方法及装置、一种识别方法及装置 Pending CN109561069A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811248270.9A CN109561069A (zh) 2018-10-25 2018-10-25 一种识别模型的生成方法及装置、一种识别方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811248270.9A CN109561069A (zh) 2018-10-25 2018-10-25 一种识别模型的生成方法及装置、一种识别方法及装置

Publications (1)

Publication Number Publication Date
CN109561069A true CN109561069A (zh) 2019-04-02

Family

ID=65865248

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811248270.9A Pending CN109561069A (zh) 2018-10-25 2018-10-25 一种识别模型的生成方法及装置、一种识别方法及装置

Country Status (1)

Country Link
CN (1) CN109561069A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110311902A (zh) * 2019-06-21 2019-10-08 北京奇艺世纪科技有限公司 一种异常行为的识别方法、装置及电子设备
CN110597984A (zh) * 2019-08-12 2019-12-20 大箴(杭州)科技有限公司 异常行为用户信息的确定方法及装置、存储介质、终端
CN111641608A (zh) * 2020-05-18 2020-09-08 咪咕动漫有限公司 异常用户识别方法、装置、电子设备及存储介质
CN112260882A (zh) * 2019-07-02 2021-01-22 北京融核科技有限公司 一种可快速部署的移动应用和网络服务集成测试装置及其方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106777024A (zh) * 2016-12-08 2017-05-31 北京小米移动软件有限公司 识别恶意用户的方法及装置
CN107274212A (zh) * 2017-05-26 2017-10-20 北京小度信息科技有限公司 作弊识别方法及装置
US10009358B1 (en) * 2014-02-11 2018-06-26 DataVisor Inc. Graph based framework for detecting malicious or compromised accounts
CN108229130A (zh) * 2018-01-30 2018-06-29 中国银联股份有限公司 一种验证方法及装置
CN108470253A (zh) * 2018-04-02 2018-08-31 腾讯科技(深圳)有限公司 一种用户识别方法、装置及存储设备

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10009358B1 (en) * 2014-02-11 2018-06-26 DataVisor Inc. Graph based framework for detecting malicious or compromised accounts
CN106777024A (zh) * 2016-12-08 2017-05-31 北京小米移动软件有限公司 识别恶意用户的方法及装置
CN107274212A (zh) * 2017-05-26 2017-10-20 北京小度信息科技有限公司 作弊识别方法及装置
CN108229130A (zh) * 2018-01-30 2018-06-29 中国银联股份有限公司 一种验证方法及装置
CN108470253A (zh) * 2018-04-02 2018-08-31 腾讯科技(深圳)有限公司 一种用户识别方法、装置及存储设备

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110311902A (zh) * 2019-06-21 2019-10-08 北京奇艺世纪科技有限公司 一种异常行为的识别方法、装置及电子设备
CN110311902B (zh) * 2019-06-21 2022-04-22 北京奇艺世纪科技有限公司 一种异常行为的识别方法、装置及电子设备
CN112260882A (zh) * 2019-07-02 2021-01-22 北京融核科技有限公司 一种可快速部署的移动应用和网络服务集成测试装置及其方法
CN112260882B (zh) * 2019-07-02 2022-06-24 北京融核科技有限公司 一种可快速部署的移动应用和网络服务集成测试装置及其方法
CN110597984A (zh) * 2019-08-12 2019-12-20 大箴(杭州)科技有限公司 异常行为用户信息的确定方法及装置、存储介质、终端
CN111641608A (zh) * 2020-05-18 2020-09-08 咪咕动漫有限公司 异常用户识别方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN109561069A (zh) 一种识别模型的生成方法及装置、一种识别方法及装置
CN109241711A (zh) 基于预测模型的用户行为识别方法及装置
CN106992994A (zh) 一种云服务的自动化监控方法和系统
CN105306495B (zh) 用户识别方法和装置
CN109194689B (zh) 异常行为识别方法、装置、服务器及存储介质
CN110442712A (zh) 风险的确定方法、装置、服务器和文本审理系统
CN106777971A (zh) 一种智能导诊方法及其装置
CN108229485A (zh) 用于测试用户界面的方法和装置
CN111950622B (zh) 基于人工智能的行为预测方法、装置、终端及存储介质
CN107256428A (zh) 数据处理方法、数据处理装置、存储设备及网络设备
CN110489578A (zh) 图片处理方法、装置及计算机设备
CN111970400B (zh) 骚扰电话识别方法及装置
CN109886554A (zh) 违规行为判别方法、装置、计算机设备和存储介质
CN110706300A (zh) 虚拟形象生成方法及装置
CN112016855B (zh) 基于关系网匹配的用户行业识别方法、装置和电子设备
CN111309887A (zh) 一种训练文本关键内容提取模型的方法和系统
CN111768040A (zh) 模型解释方法、装置、设备及可读存储介质
CN109544150A (zh) 一种分类模型生成方法及装置、计算设备及存储介质
CN111241502B (zh) 跨设备的用户识别方法及装置、电子设备、存储介质
CN109189902A (zh) 自动应答咨询的方法及装置
CN109903122A (zh) 房产交易信息处理方法、装置、设备及存储介质
CN109391620A (zh) 异常行为判定模型的建立方法、系统、服务器及存储介质
CN109597894A (zh) 一种关联模型生成方法及装置、一种数据关联方法及装置
CN108241867A (zh) 一种分类方法及装置
CN117196630A (zh) 交易风险预测方法、装置、终端设备以及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20200923

Address after: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Applicant after: Innovative advanced technology Co.,Ltd.

Address before: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Applicant before: Advanced innovation technology Co.,Ltd.

Effective date of registration: 20200923

Address after: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Applicant after: Advanced innovation technology Co.,Ltd.

Address before: A four-storey 847 mailbox in Grand Cayman Capital Building, British Cayman Islands

Applicant before: Alibaba Group Holding Ltd.

TA01 Transfer of patent application right
RJ01 Rejection of invention patent application after publication

Application publication date: 20190402

RJ01 Rejection of invention patent application after publication