CN117252429A - 风险用户的识别方法、装置、存储介质及电子设备 - Google Patents
风险用户的识别方法、装置、存储介质及电子设备 Download PDFInfo
- Publication number
- CN117252429A CN117252429A CN202311415566.6A CN202311415566A CN117252429A CN 117252429 A CN117252429 A CN 117252429A CN 202311415566 A CN202311415566 A CN 202311415566A CN 117252429 A CN117252429 A CN 117252429A
- Authority
- CN
- China
- Prior art keywords
- user
- data
- data set
- identified
- operator
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 59
- 230000003993 interaction Effects 0.000 claims abstract description 84
- 238000012545 processing Methods 0.000 claims abstract description 47
- 230000015654 memory Effects 0.000 claims abstract description 44
- 239000013598 vector Substances 0.000 claims abstract description 43
- 238000004891 communication Methods 0.000 claims description 15
- 238000012549 training Methods 0.000 claims description 11
- 238000000605 extraction Methods 0.000 claims description 10
- 238000007781 pre-processing Methods 0.000 claims description 9
- 230000006870 function Effects 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 6
- 238000004140 cleaning Methods 0.000 claims description 5
- 230000006399 behavior Effects 0.000 description 14
- 230000008569 process Effects 0.000 description 13
- 230000002354 daily effect Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 7
- 230000002159 abnormal effect Effects 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000007787 long-term memory Effects 0.000 description 2
- 238000005065 mining Methods 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 230000006403 short-term memory Effects 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 230000004308 accommodation Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000013475 authorization Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000012407 engineering method Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002688 persistence Effects 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000012954 risk control Methods 0.000 description 1
- 230000011273 social behavior Effects 0.000 description 1
- 230000003997 social interaction Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
- G06N3/0442—Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Human Resources & Organizations (AREA)
- General Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Economics (AREA)
- Marketing (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Development Economics (AREA)
- General Business, Economics & Management (AREA)
- Evolutionary Biology (AREA)
- Entrepreneurship & Innovation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Educational Administration (AREA)
- Biomedical Technology (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Technology Law (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Tourism & Hospitality (AREA)
- Health & Medical Sciences (AREA)
- Game Theory and Decision Science (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本发明公开了一种风险用户的识别方法、装置、存储介质及电子设备。该方法包括:获取待识别用户在目标时间范围内的数据集合,其中,数据集合包括运营商数据、金融交易数据、待识别用户在社交平台上的用户数据以及待识别用户在风险网站上的交互数据,运营商数据为时序数据;通过长短时记忆网络模型对运营商数据进行特征提取处理,得到特征向量;通过目标识别模型对特征向量、金融交易数据、用户数据以及交互数据进行处理,得到待识别用户的识别结果,其中,识别结果用于确定待识别用户是否为风险用户。本发明解决了相关技术中依据单一数据源识别风险用户,从而存在识别准确性低的技术问题。
Description
技术领域
本发明涉及大数据应用领域,具体而言,涉及一种风险用户的识别方法、装置、存储介质及电子设备。
背景技术
随着互联网的发展和普及,金融科技提供了便捷、高效和低成本的金融服务,为人们的出行、购物和工作带来了极大便利,然而,与之相关的金融违规活动在近年来也随之呈指数级上升,给个人或者金融机构带来了巨大的财产损失。
针对当前的金融违规活动,基于机器学习的反违规技术得到了广泛应用,但目前,这种方式一方面由于单一数据源的限制而无法对越来越复杂的违规手段或者违规链路进行全面识别,另一方面采用较为简单的特征工程方法,仅将数据源下的不同特征拼接在一起进行建模以用于识别违规技术,由此存在识别准确性低的问题。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种风险用户的识别方法、装置、存储介质及电子设备,以至少解决相关技术中依据单一数据源识别风险用户,从而存在识别准确性低的技术问题。
根据本发明实施例的一个方面,提供了一种风险用户的识别方法,包括:获取待识别用户在目标时间范围内的数据集合,其中,数据集合包括运营商数据、金融交易数据、待识别用户在社交平台上的用户数据以及待识别用户在风险网站上的交互数据,运营商数据为时序数据;通过长短时记忆网络模型对运营商数据进行特征提取处理,得到特征向量;通过目标识别模型对特征向量、金融交易数据、用户数据以及交互数据进行处理,得到待识别用户的识别结果,其中,识别结果用于确定待识别用户是否为风险用户。
进一步地,风险用户的识别方法还包括:依据由多个待识别用户的手机号组成的手机号集合,从运营商平台中获取多个待识别用户在目标时间范围内的运营商数据集合;依据手机号集合,从金融机构中获取多个待识别用户在目标时间范围内的金融交易数据集合;依据手机号集合,从社交平台中获取多个待识别用户在目标时间范围内的用户数据集合;从使用手机号集合中的手机号的终端中获取多个待识别用户在目标时间范围内在风险网站上的交互数据集合;依据运营商数据集合、金融交易数据集合、用户数据集合以及交互数据集合确定每个待识别用户的数据集合。
进一步地,风险用户的识别方法还包括:依据手机号集合中的手机号序列,对运营商数据集合、金融交易数据集合、用户数据集合以及交互数据集合中的数据进行重新排序,得到排序后的运营商数据集合、排序后的金融交易数据集合、排序后的用户数据集合以及排序后的交互数据集合;对于每个待识别用户,依据待识别用户的手机号在手机号集合中的序位,从排序后的运营商数据集合、排序后的金融交易数据集合、排序后的用户数据集合以及排序后的交互数据集合中确定待识别用户的数据集合。
进一步地,风险用户的识别方法还包括:在依据运营商数据集合、金融交易数据集合、用户数据集合以及交互数据集合确定每个待识别用户的数据集合之前,对运营商数据集合、金融交易数据集合、用户数据集合以及交互数据集合中的数据进行数据预处理,其中,数据预处理包括以下至少之一:数据清洗、归一化。
进一步地,风险用户的识别方法还包括:对特征向量、金融交易数据、用户数据以及交互数据进行数据拼接,得到目标数据;将目标数据输入至目标识别模型,得到识别结果。
进一步地,风险用户的识别方法还包括:在得到待识别用户的识别结果之后,依据识别结果判断待识别用户是否为风险用户;若待识别用户为风险用户,则对待识别用户所持有的手机号的通讯权限进行调整,或者,禁止待识别用户办理目标业务。
进一步地,风险用户的识别方法还包括:获取训练样本集,其中,训练样本集包括多个样本用户的样本数据集合以及每个样本用户的真实用户类别,真实用户类别表征样本用户是否为风险用户;通过初始长短时记忆网络模型对样本数据集合中的样本运营商数据进行处理,得到样本特征向量;通过初始识别模型对样本特征向量、样本数据集合中的样本金融交易数据、样本用户数据以及样本交互数据进行处理,得到初始识别结果;依据预设的损失函数、初始识别结果以及真实用户类别计算损失值,并在损失值大于预设数值的情况下,更新初始长短时记忆网络模型的参数以及初始识别模型的参数,直至损失值小于或等于预设数值,得到长短时记忆网络模型和目标识别模型。
根据本发明实施例的另一方面,还提供了一种风险用户的识别装置,包括:第一获取模块,用于获取待识别用户在目标时间范围内的数据集合,其中,数据集合包括运营商数据、金融交易数据、待识别用户在社交平台上的用户数据以及待识别用户在风险网站上的交互数据,运营商数据为时序数据;特征提取模块,用于通过长短时记忆网络模型对运营商数据进行特征提取处理,得到特征向量;第一处理模块,用于通过目标识别模型对特征向量、金融交易数据、用户数据以及交互数据进行处理,得到待识别用户的识别结果,其中,识别结果用于确定待识别用户是否为风险用户。
根据本发明实施例的另一方面,还提供了一种计算机可读存储介质,计算机可读存储介质中存储有计算机程序,其中,计算机程序被设置为运行时执行上述的风险用户的识别方法。
根据本发明实施例的另一方面,还提供了一种电子设备,电子设备包括一个或多个处理器;存储器,用于存储一个或多个程序,当一个或多个程序被一个或多个处理器执行时,使得一个或多个处理器实现用于运行程序,其中,程序被设置为运行时执行上述的风险用户的识别方法。
在本发明实施例中,采用依据多个数据源识别用户是否为风险用户的方式,通过获取待识别用户在目标时间范围内的数据集合,然后通过长短时记忆网络模型对运营商数据进行特征提取处理,得到特征向量,从而通过目标识别模型对特征向量、金融交易数据、用户数据以及交互数据进行处理,得到待识别用户的识别结果。其中,数据集合包括运营商数据、金融交易数据、待识别用户在社交平台上的用户数据以及待识别用户在风险网站上的交互数据,运营商数据为时序数据,识别结果用于确定待识别用户是否为风险用户。
在上述过程中,通过获取待识别用户在目标时间范围内的数据集合,实现了对待识别用户在不同领域所相关的数据的获取,进一步地,通过利用目标识别模型对待识别用户来自不同领域的数据进行处理,可以有效挖掘各领域数据源之间的相互关系,从而实现了从多个维度分析待识别用户的行为特征,进而可以提高对待识别用户是否为风险用户的识别准确度。此外,通过长短时记忆网络模型对待识别用户的运营商数据进行处理,实现了对待识别用户在通信维度的时序行为数据的深度挖掘,从而可以更进一步地提高识别准确度。
由此可见,本申请所提供的方案达到了依据多个数据源识别用户是否为风险用户的目的,从而实现了提高识别准确度的技术效果,进而解决了相关技术中依据单一数据源识别风险用户,从而存在识别准确性低的技术问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的一种可选的风险用户的识别方法的流程图一;
图2是根据本发明实施例的一种可选的长短时记忆网络模型和目标识别模型的工作示意图;
图3是根据本发明实施例的一种可选的风险用户的识别方法的流程图二;
图4是根据本发明实施例的一种可选的风险用户的识别装置的示意图;
图5是根据本发明实施例的一种可选的电子设备的示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,并且相关数据的收集、使用和处理需要遵守相关地区的相关法律法规和标准,并提供有相应的操作入口,供用户选择授权或者拒绝。
实施例1
根据本发明实施例,提供了一种风险用户的识别方法的实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图1是根据本发明实施例的一种可选的风险用户的识别方法的流程图一,如图1所示,该方法包括如下步骤:
步骤S101,获取待识别用户在目标时间范围内的数据集合,其中,数据集合包括运营商数据、金融交易数据、待识别用户在社交平台上的用户数据以及待识别用户在风险网站上的交互数据,运营商数据为时序数据。
可选的,可以将电子设备、应用系统、服务器等装置作为本申请的执行主体,在本实施例中,将目标识别系统作为执行主体以获取前述的数据集合。其中,目标识别系统可以应用于目标机构中,目标机构可以是运营商机构、金融机构或其它机构,在本实施例中,以目标机构为运营商机构为例进行说明。
在一种可选的应用场景下,风险用户可能对他人的社交平台账号、金融卡进行违规使用,例如,将他人注册的社交平台账号、金融卡所绑定的手机号修改为风险用户的手机号,并利用他人注册的社交平台账号、金融卡进行违规行为。因此,在本实施例中,可以依据待识别用户的手机号从各个渠道中获取的该手机号匹配的数据,并将该手机号匹配到的数据确定为待识别用户所对应的数据,由此实现对待识别用户在目标时间范围内的数据集合的获取,并依据该数据集合确定待识别用户是否为风险用户。其中,风险用户可以是指具有交易风险的用户,目标时间范围可以是时间终止点为目标时间点的时间范围,目标时间点可以是当前时间点,也可以是当前时间点之前的时间点,例如,目标时间范围为“最近30天内”。
上述的运营商数据包括用于表征待识别用户的手机号相关的通信信息的数据,例如,通信信息可以是该手机号对应的用户基础信息、通话记录、短信记录、位置信息、流量信息和DPI(Deep packet inspection,深度数据包检测)信息等。这些数据可以有效表征该手机号的通信行为模式,如通话时间、通话频率和通话时间段等特征,从而可以用于识别是否存在异常通信行为。其中,用户基础信息可以包括年龄,性别,入网时长等,通话记录可以包括手机号每日通话数据相关的特征,如每日拨打电话次数、接听电话次数、拨打不同号码次数、30秒内通话时长次数、拨打或接听异省号码次数、拨打或接听银行号码次数等,短信记录可以包括手机号每日短信数据相关的特征,如每日发送短信次数、接收短信次数、发送金融机构类短信次数、接收金融机构类短信次数等,流量记录可以包括手机号每日流量数据相关的特征,如每日流量使用量,位置信息可以包括手机号每日位置信息相比前一日是否发生变化的特征,DPI信息可以包括手机号每日访问APP的解析数据特征,如访问支付类APP次数、访问金融贷款类APP次数、访问金融理财类APP次数、访问旅游住宿类APP次数、访问新闻咨询类APP次数、访问社交类APP次数、访问出行导航类APP次数等。
上述的金融交易数据可以包括用于表征待识别用户的手机号绑定的金融卡的交易次数、成功交易次数、失败交易次数、不同交易对象数量等信息的数据。这些数据可以有效表征该手机号的金融交易行为模式,如资金流动情况、消费行为模式、收入支出情况等,从而可以用于识别是否存在异常金融交易行为。
用户数据可以包括用于表征待识别用户的手机号绑定的社交平台账号的好友数量、关注数量、被关注数量、活跃程度、互动程度、用户资料认证完整程度、用户资料认证真实程度等信息的数据。这些数据可以有效表征该手机号的社交互动模式,从而可以用于识别是否存在异常社交行为。
交互数据可以包括用于表征用户浏览风险网站的次数、注册风险网站的数量等信息的数据,风险网站的网站信息可以是预设在目标识别系统内的,风险网站可以是指具有交易风险的网站,这些数据可以有效表征该手机号的网络行为模式,从而可以用于识别是否存在异常网络行为。
步骤S102,通过长短时记忆网络模型对运营商数据进行特征提取处理,得到特征向量。
可选的,目标识别系统可以将运营商数据输入至长短时记忆网络(Long Short-Term Memory,LSTM)模型,从而利用LSTM模型对待识别用户的运营商数据中的时序行为特征进行深度挖掘,得到识别结果。其中,在本实施例中,长短时记忆网络模型可以包含输入层、隐藏层和输出层,图2是根据本发明实施例的一种可选的长短时记忆网络模型和目标识别模型的工作示意图,如图2所示,长短时记忆网络模型的输入层维度大小为运营商数据的特征维度Ncom,输出层维度大小为对待识别用户的时序行为进行深度挖掘到的特征维度大小Ncom_out,也即特征向量的维度大小为Ncom_out。
步骤S103,通过目标识别模型对特征向量、金融交易数据、用户数据以及交互数据进行处理,得到待识别用户的识别结果,其中,识别结果用于确定待识别用户是否为风险用户。
可选的,在得到特征向量之后,如图2所示,目标识别模型可以对上述的特征向量、金融交易数据、用户数据以及交互数据进行数据处理,并将数据处理后得到的数据输入至目标识别模型中,从而由目标识别模型输出识别结果。其中,前述的数据处理可以是指数据拼接,也可以是其它数据处理方法,上述的目标识别模型可以是全连接神经网络(Multi-Layer Perception,MLP)模型。
例如,如图2所示,目标识别系统可以对特征向量、金融交易数据、用户数据以及交互数据进行数据拼接,得到输入数据,输入数据的维度大小为Ncom_out+Nother,其中,Nother是指金融交易数据、用户数据以及交互数据的维度大小之和。进一步地,将前述的输入数据输入至目标识别模型之后,可以得到维度大小为1的识别结果,该识别结果可以用于表示待识别用户为风险用户的概率。
基于上述步骤S101至步骤S103所限定的方案,可以获知,在本发明实施例中,采用依据多个数据源识别用户是否为风险用户的方式,通过获取待识别用户在目标时间范围内的数据集合,然后通过长短时记忆网络模型对运营商数据进行特征提取处理,得到特征向量,从而通过目标识别模型对特征向量、金融交易数据、用户数据以及交互数据进行处理,得到待识别用户的识别结果。其中,数据集合包括运营商数据、金融交易数据、待识别用户在社交平台上的用户数据以及待识别用户在风险网站上的交互数据,运营商数据为时序数据,识别结果用于确定待识别用户是否为风险用户。
容易注意到的是,在上述过程中,通过获取待识别用户在目标时间范围内的数据集合,实现了对待识别用户在不同领域所相关的数据的获取,进一步地,通过利用目标识别模型对待识别用户来自不同领域的数据进行处理,可以有效挖掘各领域数据源之间的相互关系,从而实现了从多个维度分析待识别用户的行为特征,进而可以提高对待识别用户是否为风险用户的识别准确度。此外,通过长短时记忆网络模型对待识别用户的运营商数据进行处理,实现了对待识别用户在通信维度的时序行为数据的深度挖掘,从而可以更进一步地提高识别准确度。
由此可见,本申请所提供的方案达到了依据多个数据源识别用户是否为风险用户的目的,从而实现了提高识别准确度的技术效果,进而解决了相关技术中依据单一数据源识别风险用户,从而存在识别准确性低的技术问题。
在一种可选的实施例中,在待识别用户为多个的情况下,目标识别系统可以通过以下方式获取每个待识别用户的数据集合:依据由多个待识别用户的手机号组成的手机号集合,从运营商平台中获取多个待识别用户在目标时间范围内的运营商数据集合;依据手机号集合,从金融机构中获取多个待识别用户在目标时间范围内的金融交易数据集合;依据手机号集合,从社交平台中获取多个待识别用户在目标时间范围内的用户数据集合;从使用手机号集合中的手机号的终端中获取多个待识别用户在目标时间范围内在风险网站上的交互数据集合;依据运营商数据集合、金融交易数据集合、用户数据集合以及交互数据集合确定每个待识别用户的数据集合。
其中,由于不同领域的数据源往往存在于不同平台或设备中,因此,在本实施例中,目标识别系统可以与存储有各个数据的平台或设备建立通信连接,以便实现对数据的有效获取,例如,通过不同的API接口获取待识别用户在不同领域的数据。可选的,在本实施例中,上述的运营商平台即为前述的运营商机构中的平台。
可选的,在本实施例中,手机号集合中的手机号可以为加密手机号,以便提升数据传输的安全性,其中加密手机号的加密方法包括但不限于MD5加密、SHA256加密等加密方法。具体地,由于在本实施例中目标识别系统应用于运营商机构中,因此,目标识别系统可以直接从运营商平台中获取数据,并通过不同的API接口分别向金融机构、社交平台发送数据获取请求,从而得到上述的运营商数据集合、金融交易数据集合、用户数据集合以及交互数据集合。其中,数据获取请求中至少包括手机号集合以及目标时间范围。可选的,目标识别系统可以向使用手机号集合中的手机号的终端发送数据获取请求,以获取该终端预先收集的待识别用户在风险网站上的交互数据。其中,目标识别系统可以预先在前述的终端中安装安全管理软件或其它可执行文件,以通过安全管理软件或其它可执行文件预先收集前述的交互数据。
可选的,在获取到运营商数据集合、金融交易数据集合、用户数据集合以及交互数据集合之后,目标识别系统可以依据前述的多个集合确定每个待识别用户的数据集合。其中,运营商数据集合、金融交易数据集合、用户数据集合以及交互数据集合中分别包含有所有待识别用户对应的运营商数据、金融交易数据、用户数据以及交互数据。
需要说明的是,通过在待识别用户为多个的情况下,依据手机号从各个渠道获取待识别用户的数据,可以实现对待识别用户在不同领域下的相关数据的有效获取,从而可以提高数据集合内数据的准确性。
在一种可选的实施例中,在依据运营商数据集合、金融交易数据集合、用户数据集合以及交互数据集合确定每个待识别用户的数据集合的过程中,目标识别系统可以依据手机号集合中的手机号序列,对运营商数据集合、金融交易数据集合、用户数据集合以及交互数据集合中的数据进行重新排序,得到排序后的运营商数据集合、排序后的金融交易数据集合、排序后的用户数据集合以及排序后的交互数据集合,从而对于每个待识别用户,依据待识别用户的手机号在手机号集合中的序位,从排序后的运营商数据集合、排序后的金融交易数据集合、排序后的用户数据集合以及排序后的交互数据集合中确定待识别用户的数据集合。
可选的,由于所需要获取的运营商数据、金融交易数据、用户数据以及交互数据来源于不同渠道,因此,在获取多个待识别用户的这些数据时,所得到的运营商数据集合、金融交易数据集合、用户数据集合以及交互数据集合中的数据可能是乱序的,例如,在运营商数据集合中,所有待识别用户的数据按照待识别用户的手机号注册地区排序,在用户数据集合中,所有待识别用户的数据按照待识别用户匹配的账号的注册时间排序。
因此,在本实施例中,在运营商数据集合、金融交易数据集合、用户数据集合以及交互数据集合之后,需要按照统一的排序方式对运营商数据集合、金融交易数据集合、用户数据集合以及交互数据集合内的数据排序。具体地,目标识别系统可以按照手机号集合中手机号的排序对上述数据集合内的数据进行重新排序,从而得到排序后的运营商数据集合、排序后的金融交易数据集合、排序后的用户数据集合以及排序后的交互数据集合。
进一步地,对于每个待识别用户,目标识别系统可以先确定待识别用户的手机号在手机号集合中的序位,然后从排序后的运营商数据集合、排序后的金融交易数据集合、排序后的用户数据集合以及排序后的交互数据集合中分别提取出处于相同序位的数据,从而可以由提取出的数据组成待识别用户的数据集合。
其中,由于运营商数据为时序数据,例如,运营商数据内记录了各个手机号在最近30天内每天与运营商相关的行为数据。因此,对于运营商数据集合,目标识别系统可以先判断运营商数据内的数据是否按照时间顺序排序,从而在运营商数据内的数据未按照时间顺序排序的情况下,依照运营商数据内的时间信息先对运营商数据内的数据进行重新排序,例如,使得数据按照第一天至第三十天的顺序排列。之后,依据手机号集合中的手机号序列,对运营商数据集合进行二次排序。
需要说明的是,通过依据手机号集合中的手机号序列,对运营商数据集合、金融交易数据集合、用户数据集合以及交互数据集合中的数据进行排序,使得排序后的各个集合中处于同一序位的数据属于同一个待识别用户,从而可以对各个待识别用户的数据集合快速且有效的确定。
在一种可选的实施例中,在依据运营商数据集合、金融交易数据集合、用户数据集合以及交互数据集合确定每个待识别用户的数据集合之前,目标识别系统可以对运营商数据集合、金融交易数据集合、用户数据集合以及交互数据集合中的数据进行数据预处理,其中,数据预处理包括以下至少之一:数据清洗、归一化。
可选的,数据清洗包括但不限于对数据中的缺失值、异常值进行处理。其中,在对缺失值进行处理的过程中,可以采用平均值、中位数或众数进行填充,且对于不同类型的数据可以选用不同的填充方法,例如,对于年龄这一连续型数据可选用平均值或中位数进行填充,性别则可采用众数进行填充。在对异常值进行处理的过程中,可以基于预设的业务规则和统计分析方法进行判断和处理。
可选的,目标识别系统可以采用公式(1)对运营商数据集合、金融交易数据集合、用户数据集合以及交互数据集合这各个集合中的数据进行归一化处理:
其中,X为某一数据,min(X)表示集合中该类数据的最小值,max(X)表示集合中该类数据的最大值,Xnorm为归一化后的数据。
需要说明的是,通过对前述各个集合中的数据进行预处理,便于提高长短时记忆网络模型以及目标识别模型的处理效率。
在一种可选的实施例中,在通过目标识别模型对特征向量、金融交易数据、用户数据以及交互数据进行处理,得到待识别用户的识别结果的过程中,目标识别系统可以对特征向量、金融交易数据、用户数据以及交互数据进行数据拼接,得到目标数据,从而将目标数据输入至目标识别模型,得到识别结果。
可选的,目标识别系统可以依据预设的拼接函数对特征向量、金融交易数据、用户数据以及交互数据进行数据拼接,得到目标数据。其中,对于每个待识别用户,若特征向量的维度大小为Ncom_out,金融交易数据、用户数据以及交互数据的维度大小之和为Nother,则目标数据的维度大小为Ncom_out+Nother。
需要说明的是,通过先对数据和特征向量进行拼接,再将得到的目标数据输入至目标识别模型,使得目标识别模型可以有效获取到待识别对象在各个领域的行为特征。
在一种可选的实施例中,在得到待识别用户的识别结果之后,目标识别系统可以依据识别结果判断待识别用户是否为风险用户,若待识别用户为风险用户,则对待识别用户所持有的手机号的通讯权限进行调整,或者,禁止待识别用户办理目标业务。
可选的,在识别结果用于表示待识别用户为风险用户的概率的情况下,若识别结果中的概率值大于等于50%,则可以确定待识别用户为风险用户,反之,确定待识别用户不是风险用户。
进一步地,在本实施中,待识别用户所持有的手机号可以是前述的运营商机构开通的,因此,在确定待识别用户为风险用户的情况下,目标识别系统可以对待识别用户所持有的手机号的通讯权限进行调整,例如,将通讯权限调整为禁止该手机号一天中所拨出的电话大于5个。可选的,目标识别系统也可以禁止待识别用户办理目标业务,其中,目标业务可以是运营商业务,例如,目标业务为办理电话卡等。
需要说明的是,通过上述过程,实现了对风险用户有效的风险控制,从而便于提高其它用户的通讯安全性以及交易安全性。
在一种可选的实施例中,目标识别系统可以通过以下方式生成长短时记忆网络模型和目标识别模型:获取训练样本集,其中,训练样本集包括多个样本用户的样本数据集合以及每个样本用户的真实用户类别,真实用户类别表征样本用户是否为风险用户;通过初始长短时记忆网络模型对样本数据集合中的样本运营商数据进行处理,得到样本特征向量;通过初始识别模型对样本特征向量、样本数据集合中的样本金融交易数据、样本用户数据以及样本交互数据进行处理,得到初始识别结果;依据预设的损失函数、初始识别结果以及真实用户类别计算损失值,并在损失值大于预设数值的情况下,更新初始长短时记忆网络模型的参数以及初始识别模型的参数,直至损失值小于或等于预设数值,得到长短时记忆网络模型和目标识别模型。
可选的,训练样本集包括多个样本用户在样本时间范围内的样本数据集合以及每个样本用户的真实用户类别,前述的样本数据集合包括样本运营商数据、样本金融交易数据、样本用户在社交平台上的样本用户数据以及样本用户在风险网站上的样本交互数据。
其中,上述的损失函数可以是如公式(2)所示的交叉熵损失函数:
L=-y*log(p)-(1-y)*log(1-p) (2)
其中,L表示损失值,log为自然对数,y表示真实用户类别,p表示初始识别结果。
进一步地,若损失值大于预设数值,则目标识别系统可以初始长短时记忆网络模型的参数以及初始识别模型的参数,然后通过更新后的初始长短时记忆网络模型以及更新后的初始识别模型对训练样本集进行处理,得到新的初始识别结果。之后,目标识别系统可以依据新的初始识别结果计算新的损失值,并在新的损失值大于预设数值的情况下,继续按照上述过程迭代,直至损失值小于或等于预设数值,将得到的最新的初始长短时记忆网络模型确定为长短时记忆网络模型,将得到的最新的初始识别模型确定为目标识别模型。
需要说明的是,通过上述过程,实现了对长短时记忆网络模型和目标识别模型的有效训练,从而可以有效提高模型的准确性和鲁棒性。
可选的,图3是根据本发明实施例的一种可选的风险用户的识别方法的流程图二,如图3所示,以目标识别系统应用于运营商机构中为例,对风险用户的识别方法的一种应用过程进行说明。如图3所示,在待识别用户为多个时,目标识别系统从运营商平台中对多个待识别用户的基础信息、通话记录、短信记录、流量等信息进行提取,从而得到运营商数据集合。此外,目标识别系统还通过不同的API接口分别获取得到金融交易数据集合、用户数据集合以及交互数据集合。
进一步地,如图3所示,目标识别系统对运营商数据集合中的数据进行数据清洗和数据归一化,然后依据手机号集合中的手机号序列和时间信息对处理后的运营商数据集合中的数据进行重新排序。目标识别系统还对金融交易数据集合、用户数据集合以及交互数据集合中的数据进行数据清洗和归一化,并依据手机号集合中的手机号序列对处理后的金融交易数据集合、处理后的用户数据集合以及处理后的交互数据集合中的数据进行重新排序。
更进一步地,如图3所示,目标识别系统可以将排序后的运营商数据集合输入至长短时记忆网络模型,通过长短时记忆网络模型对待识别用户的时序行为特征进行深度挖掘,得到每个待识别用户的特征向量。进一步地,目标识别系统将各个待识别用户的特征向量与该待识别用户的金融交易数据、用户数据以及交互数据进行拼接,得到各个待识别用户对应的目标数据,然后将所有待识别用户对应的目标数据输入至目标识别模型,通过目标识别系统对待识别用户在多个领域的行为特征进行分析,从而得到识别结果。
可选的,对长短时记忆网络模型和目标识别模型的工作过程进行更具体地说明。其中,在本实施例中,长短时记忆网络模型的参数配置可以如表1所示:
表1
参数名 | 取值 |
输入维度(input_size) | 300 |
隐藏层维度(hidden_size) | 10 |
隐藏层数目(num_layers) | 3 |
批次大小(batch_size) | 128 |
学习率(learning_rate) | 0.001 |
随机梯度下降算法 | Adam |
例如,假设一个待识别用户的运营商数据中包括300个类型的数据,则运营商数据的维度大小即为300,其中,前述的300个类型可以包含性别、年龄、流量使用量、短信发送次数等。那么,长短时记忆网络模型的输入维度即为300。进一步地,如表1所示,长短时记忆网络模型的隐藏层维度为10,具有3个隐藏层,若每次输入到长短时记忆网络模型的批次数据大小为128,时间步数为30,则每次输入到长短时记忆网络模型的数据大小为(128,30,300),该输入数据经过3个隐藏层后处理后得到的特征向量的数据大小为(128,10),即一个识别用户对应的特征向量的维度大小为10。进一步地,若每个待识别用户的金融交易数据、用户数据以及交互数据的维度大小之和为20,也即Nother=20,那么每个批次的除运营商数据以外的数据大小为(128,20),每个批次的目标数据的数据大小为(128,30)。
更进一步地,目标识别系统可以将一批次的目标数据输入到目标识别模型中进行处理,以得到这一批次对应的识别结果。其中,目标识别模型可以包括两个隐藏层,维度分别为20和10。
由此可见,本申请所提供的方案达到了依据多个数据源识别用户是否为风险用户的目的,从而实现了提高识别准确度的技术效果,进而解决了相关技术中依据单一数据源识别风险用户,从而存在识别准确性低的技术问题。
实施例2
根据本发明实施例,提供了一种风险用户的识别装置的实施例,其中,图4是根据本发明实施例的一种可选的风险用户的识别装置的示意图,如图4所示,该装置包括:
第一获取模块401,用于获取待识别用户在目标时间范围内的数据集合,其中,数据集合包括运营商数据、金融交易数据、待识别用户在社交平台上的用户数据以及待识别用户在风险网站上的交互数据,运营商数据为时序数据;
特征提取模块402,用于通过长短时记忆网络模型对运营商数据进行特征提取处理,得到特征向量;
第一处理模块403,用于通过目标识别模型对特征向量、金融交易数据、用户数据以及交互数据进行处理,得到待识别用户的识别结果,其中,识别结果用于确定待识别用户是否为风险用户。
需要说明的是,上述第一获取模块401、特征提取模块402以及第一处理模块403对应于上述实施例中的步骤S101至步骤S103,三个模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例1所公开的内容。
可选的,风险用户的识别装置还包括:第二获取模块,用于依据由多个待识别用户的手机号组成的手机号集合,从运营商平台中获取多个待识别用户在目标时间范围内的运营商数据集合;第三获取模块,用于依据手机号集合,从金融机构中获取多个待识别用户在目标时间范围内的金融交易数据集合;第四获取模块,用于依据手机号集合,从社交平台中获取多个待识别用户在目标时间范围内的用户数据集合;第五获取模块,用于从使用手机号集合中的手机号的终端中获取多个待识别用户在目标时间范围内在风险网站上的交互数据集合;确定模块,用于依据运营商数据集合、金融交易数据集合、用户数据集合以及交互数据集合确定每个待识别用户的数据集合。
可选的,确定模块还包括:排序模块,用于依据手机号集合中的手机号序列,对运营商数据集合、金融交易数据集合、用户数据集合以及交互数据集合中的数据进行重新排序,得到排序后的运营商数据集合、排序后的金融交易数据集合、排序后的用户数据集合以及排序后的交互数据集合;确定子模块,用于对于每个待识别用户,依据待识别用户的手机号在手机号集合中的序位,从排序后的运营商数据集合、排序后的金融交易数据集合、排序后的用户数据集合以及排序后的交互数据集合中确定待识别用户的数据集合。
可选的,风险用户的识别装置还包括:第二处理模块,用于对运营商数据集合、金融交易数据集合、用户数据集合以及交互数据集合中的数据进行数据预处理,其中,数据预处理包括以下至少之一:数据清洗、归一化。
可选的,第一处理模块403还包括:拼接子模块,用于对特征向量、金融交易数据、用户数据以及交互数据进行数据拼接,得到目标数据;处理子模块,用于将目标数据输入至目标识别模型,得到识别结果。
可选的,风险用户的识别装置还包括:判断模块,用于依据识别结果判断待识别用户是否为风险用户;第三处理模块,用于若待识别用户为风险用户,则对待识别用户所持有的手机号的通讯权限进行调整,或者,禁止待识别用户办理目标业务。
可选的,风险用户的识别装置还包括:第六获取模块,用于获取训练样本集,其中,训练样本集包括多个样本用户的样本数据集合以及每个样本用户的真实用户类别,真实用户类别表征样本用户是否为风险用户;第四处理模块,用于通过初始长短时记忆网络模型对样本数据集合中的样本运营商数据进行处理,得到样本特征向量;第五处理模块,用于通过初始识别模型对样本特征向量、样本数据集合中的样本金融交易数据、样本用户数据以及样本交互数据进行处理,得到初始识别结果;第六处理模块,用于依据预设的损失函数、初始识别结果以及真实用户类别计算损失值,并在损失值大于预设数值的情况下,更新初始长短时记忆网络模型的参数以及初始识别模型的参数,直至损失值小于或等于预设数值,得到长短时记忆网络模型和目标识别模型。
实施例3
根据本发明实施例的另一方面,还提供了计算机可读存储介质,计算机可读存储介质中存储有计算机程序,其中,计算机程序被设置为运行时执行上述的风险用户的识别方法。
实施例4
根据本发明实施例的另一方面,还提供了一种电子设备,其中,图5是根据本发明实施例的一种可选的电子设备的示意图,如图5所示,电子设备包括一个或多个处理器;存储器,用于存储一个或多个程序,当一个或多个程序被一个或多个处理器执行时,使得一个或多个处理器实现用于运行程序,其中,程序被设置为运行时执行上述的风险用户的识别方法。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (10)
1.一种风险用户的识别方法,其特征在于,包括:
获取待识别用户在目标时间范围内的数据集合,其中,所述数据集合包括运营商数据、金融交易数据、所述待识别用户在社交平台上的用户数据以及所述待识别用户在风险网站上的交互数据,所述运营商数据为时序数据;
通过长短时记忆网络模型对所述运营商数据进行特征提取处理,得到特征向量;
通过目标识别模型对所述特征向量、所述金融交易数据、所述用户数据以及所述交互数据进行处理,得到所述待识别用户的识别结果,其中,所述识别结果用于确定所述待识别用户是否为风险用户。
2.根据权利要求1所述的方法,其特征在于,在所述待识别用户为多个的情况下,通过以下方式获取每个待识别用户的数据集合:
依据由多个待识别用户的手机号组成的手机号集合,从运营商平台中获取所述多个待识别用户在所述目标时间范围内的运营商数据集合;
依据所述手机号集合,从金融机构中获取所述多个待识别用户在所述目标时间范围内的金融交易数据集合;
依据所述手机号集合,从所述社交平台中获取所述多个待识别用户在所述目标时间范围内的用户数据集合;
从使用所述手机号集合中的手机号的终端中获取所述多个待识别用户在所述目标时间范围内在所述风险网站上的交互数据集合;
依据所述运营商数据集合、所述金融交易数据集合、所述用户数据集合以及所述交互数据集合确定所述每个待识别用户的数据集合。
3.根据权利要求2所述的方法,其特征在于,依据所述运营商数据集合、所述金融交易数据集合、所述用户数据集合以及所述交互数据集合确定所述每个待识别用户的数据集合,包括:
依据所述手机号集合中的手机号序列,对所述运营商数据集合、所述金融交易数据集合、所述用户数据集合以及所述交互数据集合中的数据进行重新排序,得到排序后的运营商数据集合、排序后的金融交易数据集合、排序后的用户数据集合以及排序后的交互数据集合;
对于每个待识别用户,依据所述待识别用户的手机号在所述手机号集合中的序位,从所述排序后的运营商数据集合、所述排序后的金融交易数据集合、所述排序后的用户数据集合以及所述排序后的交互数据集合中确定所述待识别用户的数据集合。
4.根据权利要求2所述的方法,其特征在于,在依据所述运营商数据集合、所述金融交易数据集合、所述用户数据集合以及所述交互数据集合确定所述每个待识别用户的数据集合之前,所述方法还包括:
对所述运营商数据集合、所述金融交易数据集合、所述用户数据集合以及所述交互数据集合中的数据进行数据预处理,其中,所述数据预处理包括以下至少之一:数据清洗、归一化。
5.根据权利要求1所述的方法,其特征在于,通过目标识别模型对所述特征向量、所述金融交易数据、所述用户数据以及所述交互数据进行处理,得到所述待识别用户的识别结果,包括:
对所述特征向量、所述金融交易数据、所述用户数据以及所述交互数据进行数据拼接,得到目标数据;
将所述目标数据输入至所述目标识别模型,得到所述识别结果。
6.根据权利要求1所述的方法,其特征在于,在得到所述待识别用户的识别结果之后,所述方法还包括:
依据所述识别结果判断所述待识别用户是否为风险用户;
若所述待识别用户为所述风险用户,则对所述待识别用户所持有的手机号的通讯权限进行调整,或者,禁止所述待识别用户办理目标业务。
7.根据权利要求1所述的方法,其特征在于,所述长短时记忆网络模型和所述目标识别模型通过以下方式生成:
获取训练样本集,其中,所述训练样本集包括多个样本用户的样本数据集合以及每个样本用户的真实用户类别,所述真实用户类别表征所述样本用户是否为风险用户;
通过初始长短时记忆网络模型对所述样本数据集合中的样本运营商数据进行处理,得到样本特征向量;
通过初始识别模型对所述样本特征向量、所述样本数据集合中的样本金融交易数据、样本用户数据以及样本交互数据进行处理,得到初始识别结果;
依据预设的损失函数、所述初始识别结果以及所述真实用户类别计算损失值,并在所述损失值大于预设数值的情况下,更新所述初始长短时记忆网络模型的参数以及所述初始识别模型的参数,直至所述损失值小于或等于所述预设数值,得到所述长短时记忆网络模型和所述目标识别模型。
8.一种风险用户的识别装置,其特征在于,包括:
第一获取模块,用于获取待识别用户在目标时间范围内的数据集合,其中,所述数据集合包括运营商数据、金融交易数据、所述待识别用户在社交平台上的用户数据以及所述待识别用户在风险网站上的交互数据,所述运营商数据为时序数据;
特征提取模块,用于通过长短时记忆网络模型对所述运营商数据进行特征提取处理,得到特征向量;
第一处理模块,用于通过目标识别模型对所述特征向量、所述金融交易数据、所述用户数据以及所述交互数据进行处理,得到所述待识别用户的识别结果,其中,所述识别结果用于确定所述待识别用户是否为风险用户。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行所述权利要求1至7任一项中所述的风险用户的识别方法。
10.一种电子设备,其特征在于,所述电子设备包括一个或多个处理器;存储器,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现用于运行程序,其中,所述程序被设置为运行时执行所述权利要求1至7任一项中所述的风险用户的识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311415566.6A CN117252429A (zh) | 2023-10-27 | 2023-10-27 | 风险用户的识别方法、装置、存储介质及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311415566.6A CN117252429A (zh) | 2023-10-27 | 2023-10-27 | 风险用户的识别方法、装置、存储介质及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117252429A true CN117252429A (zh) | 2023-12-19 |
Family
ID=89133248
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311415566.6A Pending CN117252429A (zh) | 2023-10-27 | 2023-10-27 | 风险用户的识别方法、装置、存储介质及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117252429A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117709906A (zh) * | 2024-02-04 | 2024-03-15 | 杭银消费金融股份有限公司 | 一种外部数据源查询决策方法与装置 |
-
2023
- 2023-10-27 CN CN202311415566.6A patent/CN117252429A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117709906A (zh) * | 2024-02-04 | 2024-03-15 | 杭银消费金融股份有限公司 | 一种外部数据源查询决策方法与装置 |
CN117709906B (zh) * | 2024-02-04 | 2024-05-14 | 杭银消费金融股份有限公司 | 一种外部数据源查询决策方法与装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110517097B (zh) | 识别异常用户的方法、装置、设备及存储介质 | |
CN112036890B (zh) | 客户身份认证方法及装置 | |
WO2017186090A1 (zh) | 通信号码处理方法及装置 | |
CN110209841A (zh) | 一种基于诈骗案件案情的诈骗分析方法及装置 | |
CN117252429A (zh) | 风险用户的识别方法、装置、存储介质及电子设备 | |
EP4150510A1 (en) | System, method and computer program product for mitigating customer onboarding risk | |
CN111091408A (zh) | 用户识别模型创建方法、装置与识别方法、装置 | |
CN111105064B (zh) | 确定欺诈事件的嫌疑信息的方法及装置 | |
CN110992155A (zh) | 竞标入围处理方法及相关产品 | |
CN107172622A (zh) | 伪基站短信的识别和分析方法、装置及系统 | |
CN108777749B (zh) | 一种诈骗电话识别方法及装置 | |
CN106572053A (zh) | 用于社交通信应用的安全监控的方法和设备 | |
CN109711984B (zh) | 一种基于催收的贷前风险监控方法及装置 | |
CN117097571A (zh) | 一种网络传输敏感数据的检测方法、系统、装置及介质 | |
CN115983907A (zh) | 一种数据推荐方法、装置、电子设备及计算机可读介质 | |
CN115170130A (zh) | 一种基于比特币交易分析的Tor非法用户去匿名化方法 | |
US10546300B2 (en) | Method for activating a new service or account | |
CN105472162B (zh) | 一种信息处理方法及电子设备 | |
CN110956445B (zh) | 用于生成风险文件的方法和装置 | |
CN114363465A (zh) | 信息处理方法、装置、设备及存储介质 | |
CN110808978B (zh) | 实名认证方法以及装置 | |
CN105871937A (zh) | 数据处理的方法、装置及系统 | |
CN112132693A (zh) | 交易验证方法、装置、计算机设备与计算机可读存储介质 | |
CN111447082B (zh) | 关联账号的确定方法、装置和关联数据对象的确定方法 | |
CN115460059B (zh) | 风险预警方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |