CN111985703A - 一种用户身份状态预测方法、装置及设备 - Google Patents
一种用户身份状态预测方法、装置及设备 Download PDFInfo
- Publication number
- CN111985703A CN111985703A CN202010806611.0A CN202010806611A CN111985703A CN 111985703 A CN111985703 A CN 111985703A CN 202010806611 A CN202010806611 A CN 202010806611A CN 111985703 A CN111985703 A CN 111985703A
- Authority
- CN
- China
- Prior art keywords
- user
- identified
- identity state
- information
- account
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 127
- 230000002159 abnormal effect Effects 0.000 claims abstract description 51
- 238000012549 training Methods 0.000 claims abstract description 29
- 238000012795 verification Methods 0.000 claims description 80
- 230000008569 process Effects 0.000 claims description 47
- 230000006399 behavior Effects 0.000 claims description 43
- 238000000605 extraction Methods 0.000 claims description 8
- 230000036541 health Effects 0.000 claims description 7
- 230000000977 initiatory effect Effects 0.000 claims description 7
- 238000007405 data analysis Methods 0.000 claims description 3
- 230000011273 social behavior Effects 0.000 claims description 3
- 239000000126 substance Substances 0.000 claims description 3
- 230000007246 mechanism Effects 0.000 claims description 2
- 239000003795 chemical substances by application Substances 0.000 description 32
- 238000010586 diagram Methods 0.000 description 14
- 239000013598 vector Substances 0.000 description 13
- 230000006870 function Effects 0.000 description 10
- 238000004590 computer program Methods 0.000 description 9
- 230000006872 improvement Effects 0.000 description 9
- 238000012545 processing Methods 0.000 description 8
- 230000008859 change Effects 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 6
- 230000005856 abnormality Effects 0.000 description 4
- 230000009471 action Effects 0.000 description 4
- 206010063385 Intellectualisation Diseases 0.000 description 3
- 230000018109 developmental process Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000002265 prevention Effects 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000013524 data verification Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 201000010099 disease Diseases 0.000 description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 238000012552 review Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 238000001276 Kolmogorov–Smirnov test Methods 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000002354 daily effect Effects 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 230000008014 freezing Effects 0.000 description 1
- 238000007710 freezing Methods 0.000 description 1
- 230000035784 germination Effects 0.000 description 1
- 230000002650 habitual effect Effects 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 238000012946 outsourcing Methods 0.000 description 1
- 229920001296 polysiloxane Polymers 0.000 description 1
- 238000012913 prioritisation Methods 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000003997 social interaction Effects 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
- G06Q10/103—Workflow collaboration or project management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/18—Legal services
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Tourism & Hospitality (AREA)
- Entrepreneurship & Innovation (AREA)
- Theoretical Computer Science (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Technology Law (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Development Economics (AREA)
- Game Theory and Decision Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本说明书实施例公开了一种用户身份状态预测方法、装置及设备。方法包括:获取待识别用户的用户数据;对所述用户数据进行解析,确定所述待识别用户在多个预设维度上对应的第一特征信息;将所述第一特征信息输入采用多个预设维度的数据训练得到的身份状态预测模型中,输出待识别用户身份状态的预测分数,从而得到待识别用户的身份状态异常的概率。
Description
技术领域
本申请涉及计算机技术领域,尤其涉及一种用户身份状态预测方法、装置及设备。
背景技术
KYC:是Know Your Customer的简称,当前行业相关法律规定要求自然人、法人和其他组织,要对自己的客户作出全面的了解,也就是了解客户原则。主要目标是通过对客户身份的核实和商业行为的了解,有效地发现和报告可疑行为,从而合理而有效地从客户日常的、习惯性的行为中发现不正常的、或许是可疑的行为。
随着互联网的发展,实际应用过程中,可以根据用户多业务场景所留下的信息,通过大数据能力,给用户进行多种画像侧写,沉淀的标签信息可用于多种业务场景,例如:圈人营销,个性化服务定制,数字金融服务升级等等。通过用户身份的核实,从而提供合适的服务。
因此,亟需提出一种用户身份状态预测方案。
发明内容
本说明书实施例提供一种用户身份状态预测方法、装置及设备,以解决现有技术中无法准确预测用户身份状态的问题。
为解决上述技术问题,本说明书实施例是这样实现的:
本说明书实施例提供的一种用户身份状态预测方法,包括:
获取待识别用户的用户数据;所述用户数据包括所述待识别用户的基本属性数据以及操作行为数据;
对所述用户数据进行解析,确定所述待识别用户在多个预设维度上对应的第一特征信息;
将所述第一特征信息输入训练完成的身份状态预测模型中,输出所述待识别用户的身份状态的预测分数;所述身份状态预测模型是采用多个预设维度的数据训练得到的;所述预测分数用于表示所述待识别用户的身份状态异常的概率。
本说明书实施例提供的一种用户身份状态预测装置,包括:
数据获取模块,用于获取待识别用户的用户数据;所述用户数据包括所述待识别用户的基本属性数据以及操作行为数据;
数据解析模块,用于对所述用户数据进行解析,确定所述待识别用户在多个预设维度上对应的第一特征信息;
身份状态预测模块,用于将所述第一特征信息输入训练完成的身份状态预测模型中,输出所述待识别用户的身份状态的预测分数;所述身份状态预测模型是采用多个预设维度的数据训练得到的;所述预测分数用于表示所述待识别用户的身份状态异常的概率。
本说明书实施例提供的一种用户身份状态预测设备,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:
获取待识别用户的用户数据;所述用户数据包括所述待识别用户的基本属性数据以及操作行为数据;
对所述用户数据进行解析,确定所述待识别用户在多个预设维度上对应的第一特征信息;
将所述第一特征信息输入训练完成的身份状态预测模型中,输出所述待识别用户的身份状态的预测分数;所述身份状态预测模型是采用多个预设维度的数据训练得到的;所述预测分数用于表示所述待识别用户的身份状态异常的概率。
本说明书实施例提供的一种计算机可读介质,其上存储有计算机可读指令,所述计算机可读指令可被处理器执行以实现一种用户身份状态预测方法。
本说明书一个实施例实现了能够达到以下有益效果:通过获取待识别用户的用户数据;对所述用户数据进行解析,确定所述待识别用户在多个预设维度上对应的第一特征信息;将所述第一特征信息输入采用多个预设维度的数据训练得到的身份状态预测模型中,输出待识别用户身份状态的预测分数,从而得到待识别用户的身份状态异常的概率。通过上述方法,能够解决现有技术中完全依赖人工审核用户身份状态造成的压力与风险的问题,实现流程自动化,智能化;通过多维度特征向量,提前预测用户身份状态变化,能够更好地实现风险防控。
附图说明
为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本说明书实施例提供的一种用户身份状态预测方法的整体结构示意图;
图2是本说明书实施例提供的一种用户身份状态预测方法的流程示意图;
图3是本说明书实施例提供的一种用户身份状态异常确定方法的流程示意图;
图4是本说明书实施例提供的一种用户身份状态预测装置示意图;
图5是本说明书实施例提供的一种用户身份状态预测设备示意图。
具体实施方式
为使本说明书一个或多个实施例的目的、技术方案和优点更加清楚,下面将结合本说明书具体实施例及相应的附图对本说明书一个或多个实施例的技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本说明书的一部分实施例,而不是全部的实施例。基于本说明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本说明书一个或多个实施例保护的范围。
实际应用过程中,可以根据用户多业务场景所留下的信息,通过大数据能力,给用户进行多种画像侧写,沉淀的标签信息可用于多种业务场景,例如:圈人营销,个性化服务定制,数字金融服务升级等等。通过用户身份的核实,从而提供合适的服务。当前体系内的用户画像预测方法多仅关注用户生命周期前半段(萌芽期,成长期),当用户进入生命周期后半段时(衰退期),就会难以识别用户生活中的变化,从而不能提供合适的服务。一个典型的应用场景是,每年信贷类产品因无法及时感知用户身份状态发生的重大变化(比如:身故),导致每年都会产生重大用户逾期催收失败的坏账风险,或者身故用户账号被他人窃取使用,进行数字金融服务,导致资金损失重大。
现有技术中,为了获知用户的身份状态,主要依赖相关代理人或联系人主动上传账号所有者死亡证明;或者通过权威机构接口调取用户身份信息,查询用户身份状态信息。但是,交易应用平台中存在上万甚至上亿的用户,应用平台不可能每天都从权威机构接口调取应用平台上全量用户的身份信息,且查询有一定成本;代理人也可能只有当交易应用平台主动与其联系时,才会联系平台客服人员进行资料上传。因此,对用户的身份状态的确定造成很大的阻力。
同时,当前用户的身故流程都属于事后,通过人工审核进行,并没有体系化的框架流程。真实用户没有自助化的服务流程,体感极差,往往容易遇到很大的阻碍。
为了解决现有技术中的缺陷,以下结合附图,详细说明本说明书各实施例提供的技术方案。
图1是本说明书实施例提供的一种用户身份状态预测方法的整体结构示意图。如图1所示,包括数据获取模块102、身份状态预测模块104、设定规则预测模块106、权威机构校验模块108、生物核身校验模块110、证明信息审核模块112以及账号处理模块114。其中,数据获取模块102获取到用户数据之后,基于多个预设维度对用户数据进行分析,得到特征向量,采用特征向量进行模型训练,得到身份状态预测模型。身份状态预测模块104采用身份状态预测模型对全量用户的身份状态进行预测,得到预测分数,对于高分用户,再采用设定规则预测模块106、权威机构校验模块108、生物核身校验模块110、证明信息审核模块112确定高分用户的身份状态是否异常(即是否身故),如果用户已身故,采用账号处理模块114对身故用户的账号进行相应处理。
接下来,将针对说明书实施例提供的一种实体名称匹配方法结合附图进行具体说明:
图2是本说明书实施例提供的一种用户身份状态预测方法的流程示意图。从程序角度而言,流程的执行主体可以为搭载于应用服务器的程序或应用客户端。该实施例中的执行主体可以是某一应用平台的服务器。
如图2所示,该流程可以包括以下步骤:
步骤202:获取待识别用户的用户数据;所述用户数据包括所述待识别用户的基本属性数据以及操作行为数据。
需要说明的是,这里的待识别用户可以指的是对应的应用平台中的任意用户。例如:某支付交易平台上的用户。用户数据可以包括用户的基本属性数据以及操作行为数据。这里的基本属性数据可以是静态数据。
其中,待识别用户的基本属性数据可以包括待识别用户的人口属性数据、社会属性数据、账号属性数据以及商业属性数据中的一种或多种。其中,人口属性数据可以包括:待识别用户的年龄、性别、民族、社会面貌等数据。社会属性数据可以包括:待识别用户的工作单位、工作地址、职位等数据。账号属性数据可以包括:待识别用户在该应用平台中的账号注册、账号认证、账号登录设备等数据。商业属性数据可以包括:待识别用户的资产数据、理财数据、投资数据等。
操作行为数据可以包括待识别用户的访问行为数据、社交行为数据、账号通讯录数据、风险标签数据以及交易行为数据中的至少一种。其中,待识别用户访问产生的数据都可以作为访问行为数据,例如:待识别用户修改昵称的行为、活跃场景的行为、校验行为、修改密码、换绑、删除记录等行为都可以是访问行为。社交行为数据可以包括待识别用户的聊天行为数据、加群行为数据等。账号通讯录数据可以包括本人存储姓名、通讯录好友中为应用平台注册用户的账号数,上传手机通讯录等数据。交易行为数据可以包括交易金额、交易次数、交易场景、代付、领取红包、亲密付等数据。用户风险标签可以包括:是否出现信贷逾期、是否支付代扣失败、是否信用卡还款失败等标签。
步骤204:对所述用户数据进行解析,确定所述待识别用户在多个预设维度上对应的第一特征信息。
在实际应用中,获取到的每个用户的用户数据是关于用户在相应的应用平台上的全部数据。在分析时,需要按照数据的类型对用户行为进行分析,因此,所述对所述用户数据进行解析,具体可以包括:
对所述用户数据按照预设维度进行分类;
或者,对所述用户数据按照数据类型进行分类。
需要说明的是,预设维度至少可以包括:身份基础信息维度、冲突行为维度、设备维度、社交维度、健康维度、交易维度以及操作行为维度。这些维度都可以是高显著性维度,采用这些维度对用户身份行为进行刻画。每一个维度都可以对应一个特征向量,本方案中采用高显著性的多维度特征向量对用户身份进行刻画。
其中,身份基础信息可以表示待识别用户的身份基础属性信息,例如:年龄、性别、账号ID、注册时间、关联账号数、绑定手机号等。
冲突行为可以表示与历史操作习惯相悖的行为。
设备可以是待识别用户的账号登录过的设备。
社交可以包括聊天、添加好友、加群、发布动态等。
健康可以包括待识别用户购买的保险、上报的健康参数等。
交易可以包括待识别用户通过该交易应用平台完成的所有交易。
操作行为可以包括待识别用户在该交易应用平台中进行的所有操作(例如:访问操作、修改信息的操作、转发操作等)。
步骤206:将所述第一特征信息输入训练完成的身份状态预测模型中,输出所述待识别用户的身份状态的预测分数;所述身份状态预测模型是采用多个预设维度的数据训练得到的;所述预测分数用于表示所述待识别用户身份状态异常的概率。
身份状态异常可以指的是身故状态。身故可以包括意外身故和自然身故。意外身故一般指不是故意行为造成的,事先不能预见,客观上不能采取措施避免;自然身故一般是指符合生命和疾病自然发展规律,没有暴力干预而发生的死亡。
因此,在获取数据时,应用平台也可以获取用户的年龄数据,根据自然年龄预测用户身故的概率。
身份状态模型可以是一个二分类模型,可以包括逻辑回归模型、支持向量机(SVM)、决策树、随机森林等等。在实际应用中,训练身份状态模型的真实样本可以由应用平台的业务方进行回传。具体地,业务方回传的真实样本中,可以包括待识别用户的用户家属主动提供权威机构出具的死亡证明,或保险公司提供的保险赔付的身故名单等,作为黑样本。白样本(即普通正常用户)可以随机抽取。身份状态模型在训练时,也是采用多个预设维度的特征向量进行训练得到的。
预测分数可以表示待识别用户的身份状态异常的概率。预测分数可以是一个百分比,也可以是一个具体的分数值,例如:预测分数为90分,可以表示待识别用户的身份状态异常的概率为90%。
在具体训练模型时,可以采用以下方式进行训练:
所述将所述第一特征信息输入训练完成的身份状态预测模型中,输出所述待识别用户的身份状态的预测分数之前,还可以包括:
获取已知身份状态的用户的样本数据;
将所述样本数据按照所述多个预设维度进行特征提取,得到第二特征信息;
采用所述第二特征信息对初始身份状态预设模型进行训练,得到所述初始身份状态身份模型对所述样本数据的预测结果;所述预测结果为所述样本数据中各个用户的身份状态预测概率;
根据所述预测结果与已知身份状态之间的差异调整所述初始身份状态预设模型对应的参数,直至所述差异满足预设条件为止,得到训练完成的身份状态预测模型。
另外,除了上述方法步骤,还可以将样本数据分为三组,每一组分别训练一个模型,待训练完成后,将其他组的数据作为测试数据,测试训练完成的模型对其他组的数据的预测结果是否稳定。即采用分组训练的方式对模型进行训练,以提高模型训练的稳定性。
可选的,所述得到训练完成的身份状态预测模型之后,还可以包括:
采用模型评估指标(area under the curve,简称AUC)对训练完成的身份状态模型进行性能评价;
或者,采用KS校验(Kolmogorov-Smirnov test)来预测训练完成的身份状态模型的准确率。
当然,在实际操作时,在评价训练完成的身份状态预测模型时,可以检验该模型的准确率、覆盖率等。
其中,AUC的全称是Area Under Curve,即ROC曲线和x轴(FPR轴)之间的面积。AUC考虑的是模型预测的排序质量,反映了模型把正例排在反例前面的比例(如果AUC=1,说明模型100%将所有正例排在反例前面)。
需要说明的是,上述实施例中的方法步骤是对任意一个用户的身份状态进行预测的方法。在实际应用中,本方案的方法步骤可以同时对某一应用平台上的全量用户进行预测。即可以采用训练完成的身份状态预测模型对应用平台上的全量用户进行预测打分。
图2中的方法,通过获取待识别用户的用户数据;对所述用户数据进行解析,确定所述待识别用户在多个预设维度上对应的第一特征信息;将所述第一特征信息输入采用多个预设维度的数据训练得到的身份状态预测模型中,输出待识别用户身份状态的预测分数,从而得到待识别用户的身份状态异常的概率。通过上述方法,能够解决现有技术中完全依赖人工审核用户身份状态造成的压力与风险的问题,实现流程自动化,智能化;通过多维度特征向量,提前预测用户身份状态变化,能够更好地实现风险防控。
基于图2的方法,本说明书实施例还提供了该方法的一些具体实施方案,下面进行说明。
本方案中,采用训练得到的身份状态模型能够预测得到待识别用户的身份状态异常的概率,这个概率值可以作为后续确定待识别用户的身份状态的参考依据。具体可以对概率值大于预设阈值的用户进行后续的身份核验,具体地,可以采用以下步骤实现:
可选的,所述将所述第一特征信息输入训练完成的身份状态预测模型中,输出所述待识别用户的身份状态的预测分数之后,还可以包括:
判断所述预测分数是否大于预设阈值,得到判断结果;
当所述判断结果表示所述预测分数大于预设阈值时,采用所述待识别用户的身份状态证明信息继续对所述待识别用户的身份状态是否异常进行核验。
需要说明的是,在本方案中,采用身份状态预测模型可以对应用平台上的全量用户进行身份状态的预测,得到预测结果之后,预测分数大于预设阈值的用户可以表示身份状态异常的概率较大的用户,这里的身份状态异常可以表示身故。对于身份状态异常的用户可以进一步确定这些用户的身份状态。
通过上述方法,通过采用身份状态模型对应用平台上的全量用户的身份状态进行打分,将高分的用户筛选出来,再进行后续的各种方式的核验。能够提高用户身份状态核验的效率以及准确率。
可选的,所述采用所述待识别用户的身份状态证明信息继续对所述待识别用户的身份状态是否异常进行核验,具体可以包括:
获取所述待识别用户的身份状态证明信息;
根据所述身份状态证明信息对所述待识别用户的身份状态是否异常进行核验。
需要说明的是,身份状态证明信息可以证明用户的身份状态,例如:可以是权威机构提供的用户的身份状态证明信息,例如:死亡证明。身份状态证明信息还可以是由用户的代理人上传的身份证明,比如:死亡证明。
上述步骤中,身份状态异常可以是身故状态。例如:如果获取到的待识别用户的身份状态证明信息为死亡证明,可以确定待识别用户已身故。
可选的,所述获取所述待识别用户的身份状态证明信息,具体可以包括:
获取权威机构提供的所述待识别用户的身份状态证明信息;
和/或,获取所述待识别用户的代理人上传的身份状态证明信息。
需要说明的是,上述步骤中的权威机构可以是专门负责人口管理的机构。也可以是能够掌握人员身份状态信息的企业,比如:保险公司。
其中,所述获取所述待识别用户的代理人上传的身份状态证明信息之前,还可以包括:
获取所述待识别用户的用户关系网络;所述用户关系网络可以是应用平台根据所述待识别用户的历史操作行为以及通讯录信息建立的;
根据所述用户关系网络确定所述待识别用户的代理人;
向所述代理人的终端发送第一提示信息,所述第一提示信息用于提示所述代理人上传所述待识别用户的身份状态证明信息。
上述步骤中的代理人可以是待识别用户的家人、亲戚或亲密的朋友等。
所述获取所述待识别用户的代理人上传的身份状态证明信息之前,还可以包括:
获取应用平台体系内的关系数据,
根据所述关系数据,确定潜在代理人;
端内通过消息提醒服务,联系所述潜在代理人上传凭证信息。
所述关系数据可以包括保险订单、出行订单、酒店订单等数据,此时的潜在代理人可以是保险公司、酒店或交通部门。凭证信息可以是待识别用户的保险信息、出行信息、酒店订单信息等。
另外,确定代理人时,还可以通过相关机构的户籍相关数据获取代理人信息。
通过上述方法,可以更加全面地获取用户在其他场景中所产生的数据,能更好地支持应用平台对待识别用户的身份状态是否异常进行核验。
在实际应用中,为了骗保或者谋取其他利益,可能会存在虚假上报死亡证明的情况,此时,保险公司的身份状态证明信息也可能存在错误。而专门负责管理人口的机构,往往需要死者的亲属主动申报死亡或者对于失踪人口来说,需要满足一定期限,才能宣告死亡,此时,该机构中的用户身份状态信息存在更新延迟的情况,因此,权威机构提供的用户身份状态证明信息也可能不是最新的信息或错误的信息,基于此,在获取权威机构提供的身份证明信息之后,还可以采用用户生物核身校验,为权威机构的数据核验进行风险兜底,具体可以采用以下步骤实现:
可选的,所述采用所述待识别用户的身份状态证明信息继续对所述待识别用户的身份状态是否异常进行核验,具体可以包括:
获取权威机构提供的所述待识别用户的身份状态证明信息;
当所述权威机构提供的身份状态证明信息表示所述待识别用户已身故,发起生物核身校验;所述生物核身校验过程中用于比对的标准信息为预先存储的所述待识别用户的生物信息;
获取生物核身校验结果;当所述生物核身校验结果表示校验通过时,确定所述待识别用户的身份状态正常;
当所述生物核身校验结果表示无人进行生物核身校验时,确定所述待识别用户的身份状态异常,所述身份状态异常用于表示所述待识别用户已身故。
在获取权威机构提供的身份状态证明信息之后,假设根据该身份状态证明信息可以证明待识别用户已身故,此时,还不能确定待识别用户的身份状态异常,为了进一步确定待识别用户的身份状态,应用平台可以发起生物核身校验。需要说明的是,生物核身校验可以表示对用户的生物信息进行核验,用户的生物信息可以包括面部信息、指纹信息、掌纹信息、虹膜信息等。
其中,发起生物核身校验,具体可以包括:
向所述待识别用户账号登录的终端发送第二提示信息;所述第二提示信息用于提示所述当前使用所述待识别用户账号的用户进行生物核身校验。
所述发起生物核身校验之后,还包括:
获取所述待识别用户账号登录的终端返回的用户的生物信息;
将所述生物信息与预先存储的所述待识别用户的生物信息进行比对;
当所述生物信息与预先存储的所述待识别用户的生物信息一致时,确定进行生物核身校验的用户为待识别用户,校验通过;
当所述生物信息与预先存储的所述待识别用户的生物信息不一致时,确定进行生物核身校验的用户不是待识别用户,校验不通过。
需要说明的是,当校验通过时,可以证明所述待识别用户还具备进行生物核身校验的能力,其身份状态正常。
另外,在实际实现过程中,虽然应用平台发起了生物核身校验,但是,如果用户已身故,则应用平台获取不到待识别用户的生物信息。此时,可以设定生物核身校验时间,比如:设置时间为7天,当所述生物核身校验结果表示无人进行生物核身校验时,确定所述待识别用户的身份状态异常,可以判定当前账号原本所有者已无能力进行生物核身校验,确定待识别用户的身份状态异常,即所述待识别用户已身故。
在实际应用中,可能存在待识别用户已身故,其家人通过密码登录待识别用户的账号的情况,此时,进行生物核身校验时,会识别出当前使用账号的用户并非是待识别用户,此时,可以要求使用该账号的用户上传待识别用户的身份证明信息,以确定不存在盗号的情况,具体,可以采用以下步骤:
可选的,所述获取生物核身校验结果之后,还可以包括:
当所述生物核身校验结果表示当前操作所述待识别用户账号的用户不是所述待识别用户,向所述待识别用户账号登录的终端发送提示信息;所述提示信息用于提示存在非本人进行生物核身校验时,要求当前操作所述待识别用户账号的用户上传所述待识别用户的身份状态证明信息。
所述向所述待识别用户账号登录的终端发送提示信息之后,还可以包括:
获取所述待识别用户账号登录的终端返回的信息,所述信息可以包括待识别用户身份状态证明信息;
根据终端返回的信息对所述待识别用户账号是否存在使用异常进行判断。
当然,如果用户上传的不是待识别用户的身份状态信息,终端返回的信息也可以是其他信息。在实际应用场景中,用户还可能不上传信息,此时,终端返回的信息可以是“无响应、未接收到上传信息”等反馈信息。
可选的,所述向所述待识别用户账号登录的终端发送提示信息之后,还可以包括:
若所述当前操作所述待识别用户账号的用户在设定时间内未上传所述待识别用户的身份状态证明信息,则表示所述待识别用户的账号存在使用异常。
上述步骤中,账号存在使用异常可以表示:发生盗号或存在非正常使用账号的风险。因此,如果在设定时间内无上传凭证或上传凭证无效时,可以将所述待识别用户的账号对应的业务锁定,以防止他人非法使用账号进行其他业务。
可选的,所述向所述待识别用户账号登录的终端发送提示信息之后,还可以包括:
若所述当前操作所述待识别用户账号的用户在设定时间内上传了所述待识别用户的身份状态证明信息,且所述身份状态证明信息表示所述待识别用户已身故,则按照继承流程,完成对所述待识别用户的账号继承。
如果当前操作待识别用户账号的用户在设定时间内能够上传待识别用户的身故证明信息,可以确定该用户为待识别用户的代理人,此时,可以提示该代理人完成账号的继承。代理人可通过在端内发起正式的自助继承流程,完成对当前账号的继承。当然,代理人也可以选择放弃继承,交由应用平台全权处理。
可选的,所述按照继承流程,完成对所述待识别用户的账号继承,具体可以包括:
接收所述用户发起的账号继承请求;
获取所述用户上传的用户身份证明信息;
根据所述用户的身份证明信息以及已有的所述待识别用户的身份证明信息,确定所述用户与所述待识别用户之间的关联关系;
判断所述关联关系是否满足继承条件;
当所述关联关系满足继承条件时,录入所述用户的生物信息;
所述用户的生物信息录入完成后,将所述账号的认证信息变更为所述用户的相关信息,完成账号继承。
上述步骤中,继承条件可以根据实际应用场景进行设定。例如:继承条件可以包括:关联关系为亲属关系。即并不是所有代理人都能对待识别用户的账号进行继承,例如:保险公司可能不适合继承待识别用户的账号。
如果代理人满足继承条件,代理人可以按照提示,完成信息录入,从而将该账号的使用权进行变更。
另外,作为扩展,在实际应用中,完成账号继承的情况下,如果该账号在待识别用户使用的过程中,发生了借贷的相关事宜,当完成继承之后,继承账号的用户不需要承担待识别用户的债务,即债务不随账号一起继承。
可选的,所述判断所述关联关系是否满足继承条件之后,还可以包括:
当所述关联关系不满足继承条件时,终止所述继承流程。
可选的,所述在所述继承流程终止后,还可以包括:
将所述待识别用户的身份状态信息在应用平台进行全域广播;
和/或,停止向所述待识别用户的账号提供数字金融服务。
可选的,所述在所述继承流程终止后,还可以包括:
将所述待识别用户的账号进行注销。
上述步骤中,如果确定待识别用户已身故,且无法完成账号继承,此时,应用平台可以对用户身份状态在应用平台中进行全域广播,通知各业务方及时停止对该待识别用户的业务服务。
同时如有相关的逾期风险,提早按照合约内容进行赔付申请流程。
账号注销:可以由应用平台后端进行账号的注销操作,也可以提醒代理人,由代理人在设定时间内(比如:30天内)完成自助销户。
数字金融服务可以指通过互联网及信息技术手段与传统金融服务业态相结合的新一代金融服务。其中,数字金融可以包括互联网支付、移动支付、网上银行、金融服务外包及网上贷款、网上保险、网上基金等金融服务。
通过上述方法,能最大程度上提前识别用户身份状态的重大变化,无需等待业务发生重大实际资损,再进行事后核实,相关数字金融服务能提前进行用户运营,避免产生重大业务资损。
可选的,所述将所述样本数据按照所述多个预设维度进行特征提取,得到第二特征信息,具体可以包括:
确定多个预设维度的优先级;
根据所述优先级确定每个预设维度的特征向量对应的权重值;
根据所述权重值对每个预设维度对应的特征向量进行权重赋值,得到第二特征向量。
在具体实现过程中,维度可以具有优先级,可以通过计算每个维度的变量的显著性,从而判断每一个维度的变量对结果的影响有多重要,根据显著性不同,可以进行权重的调整。例如:优先级排序可以是:冲突行为维度>设备维度>操作维度>交易维度>社交维度>身份基础信息维度>健康维度。
更为具体地,在一具体的应用场景中,例如,以某交易平台中的用户为例,该交易平台在进行用户的身份状态模型的设计时,可以基于多个维度的变量来实现的,其中,多个维度可以包括:通讯录相关变量、用户风险标签、交易操作、可信操作、操作行为、设备标签、账户基础属性、健康维度指标、冲突行为、身份关联信息等维度。
其中,通讯录相关变量可以包括:用户手机号被存储次数、本人存储姓名是否发生变化、设定时间内的社交次数环比、通讯录好友中为该交易平台认证的账户数以及设定时间内上传的通讯录次数等。其中,环比指的是本期统计数据与上期比较,例如2014年7月份与2014年6月份相比较,叫环比。
用户风险标签可以是交易应用平台对用户的历史行为进行分析后,打上的标签。用户风险标签可以包括:是否出现信贷逾期、是否支付代扣失败、是否信用卡还款失败等标签。
交易操作可以包括:用户设定时间内被代付的次数、用户设定时间内领取红包的次数、用户设定时间内领取红包的金额、用户设定时间内的交易记录等。
可信操作可以包括:同证件下与认证账户的转账记录、同证件下与认证账户的亲密付记录以及同证件下认证账户代付金额等。例如:同一身份证注册有多个账号,可以是同一用户的主账号和一些小号,主账号可以给自己的小号转账。
操作行为可以包括:用户的密码校验异步事件次数、修改密码、换绑、删除记录、解除处罚的次数、设定时间内的活跃天数、社交次数、加群次数、修改昵称或头像次数、扫码次数等。
设备标签可以包括:设备是否存在、设备是否刷机、设备定位服务是否开启、设备信息是否存在等。在一些应用中,如果发生设备丢失的情况,其他用户无法正常使用支付宝中的一些功能,比如:没有密码,核验人脸指纹通过不了,这时,可能会送店维修,刷机、破解密码等。如果发现有这些行为,存在账号使用异常的风险很大。
账户基础属性可以包括:用户登录采用的登录账是否是邮箱、年龄、性别、账号ID、注册时间、关联账号数、绑定手机号等。
健康维度指标可以包括:用户是否使用疾病互助共济服务以及使用天数、是否购买保险等。
冲突行为可以包括:设定时间内用户登录次数环比以及设定时间内用户交易次数环比等。
身份关联信息可以包括:用户手机号关联的账户数、用户设备关联的账户数、证件号认证次数、用户账号使用设备个数、绑定手机号认证次数以及设备认证次数等。
获取了用户数据,并对用户数据进行多维度特征向量提取之后,可以训练得到身份状态预测模型。基于该身份状态预测模型,对于待识别用户的身份状态进行确定的流程可以结合图3进行说明:
图3是本说明书实施例提供的一种用户身份状态异常确定方法的流程示意图。
如图3所示,以交易应用平台为执行主体。确定用户身份状态是否异常的方法可以包括以下步骤:
步骤302:采用训练完成的身份状态预测模型对交易应用平台上的全量用户进行身份状态预测,得到预测分数。
步骤304:对于任意一个待识别用户,如果预测分数小于预设阈值,流程终止,确定所述待识别用户的身份状态正常。
步骤306:预测分数大于预设阈值,采用预设规则对待识别用户进行规则校验。其中,所述规则可以包括年龄是否达到自然死亡年龄段、是否有重大疾病等。
步骤308:预设规则校验未通过,则流程终止,确定所述待识别用户的身份状态正常。
步骤310:预设规则校验通过,采用权威机构提供的数据进行核验。
步骤312:采用权威机构提供的数据进行核验不通过,则流程终止,确定所述待识别用户的身份状态正常。
步骤314:采用权威机构提供的数据进行核验通过,则进行本人生物核身校验。
步骤316:生物核身校验通过,确定是本人,则流程终止,确定所述待识别用户的身份状态正常。
步骤318:设定时间内无人进行生物核身校验,确定所述待识别用户身故。
步骤320:生物核身校验未通过,有其他用户进行生物核身校验,要求该其他用户在设定时间内上传死亡证明。
步骤322:设定时间内未上传,直接冻结待识别用户的账号或锁定该账号对应的全部业务。
步骤324:设定时间内上传了待识别用户的死亡证明,证明该其他用户为代理人,要求该代理人进行继承流程。
步骤326:代理人开启继承流程,满足继承条件,账号信息绑定变更、完成继承流程。
步骤328:代理人开启继承流程,不满足继承条件,停止继承流程。
步骤330:代理人在设定时间内未开启继承流程,全域广播通知、数字金融服务关闭、自助销户或平台销户,身故流程结束,待识别用户的账号完成妥善处理。
通过上述实施例中的方法,本方案可以实现以下技术效果:
1)通过身份状态预测模型、业务规则校验,权威机构数据核验,生物核身校验,凭证自助校验,能够实现最大程度上尽早确定用户身份状态是否异常,无需等待业务发生重大实际资损,再进行事后联系。
2)解决了完全依赖人工审核全流程的压力与风险,通过风险方案结合,实现流程自动化,智能化。
3)通过多维度特征向量训练得到的身份状态预测模型提前预测全量用户的身份状态,为后续确定用户的身份状态异常提供了基础,能够提高对用户身份状态预测的准确率,能更好地实现风险防控。
4)基于多维度的用户特征向量补全用户生命周期全画像。
5)不仅能最大程度上提前识别用户身份状态重大变化,还能对数字金融服务提前进行用户运营,避免重大业务资损。
基于同样的思路,本说明书实施例还提供了上述方法对应的装置。图4是本说明书实施例提供的一种用户身份状态预测装置示意图。如图4所示,该装置40可以包括:
数据获取模块402,用于获取待识别用户的用户数据;所述用户数据包括所述待识别用户的基本属性数据以及操作行为数据;
数据解析模块404,用于对所述用户数据进行解析,确定所述待识别用户在多个预设维度上对应的第一特征信息;
身份状态预测模块406,用于将所述第一特征信息输入训练完成的身份状态预测模型中,输出所述待识别用户的身份状态的预测分数;所述身份状态预测模型是采用多个预设维度的数据训练得到的;所述预测分数用于表示所述待识别用户的身份状态异常的概率。
基于图4的装置,本说明书实施例还提供了该方法的一些具体实施方案,下面进行说明。
可选的,所述装置40,还可以包括:
判断模块,用于判断所述预测分数是否大于预设阈值,得到判断结果;
核验模块,用于当所述判断结果表示所述预测分数大于预设阈值时,采用所述待识别用户的身份状态证明信息继续对所述待识别用户的身份状态是否异常进行核验。
可选的,所述核验模块,具体可以包括:
身份状态证明信息获取单元,用于获取所述待识别用户的身份状态证明信息;
核验单元,用于根据所述身份状态证明信息对所述待识别用户的身份状态是否异常进行核验。
可选的,所述身份状态证明信息获取单元,具体可以包括:
身份状态证明信息获取子单元,用于获取权威机构提供的所述待识别用户的身份状态证明信息;
和/或,获取所述待识别用户的代理人上传的身份状态证明信息。
可选的,所述核验模块,具体可以包括:
身份状态证明信息获取单元,用于获取权威机构提供的所述待识别用户的身份状态证明信息;
生物核身校验单元,用于当所述权威机构提供的身份状态证明信息表示所述待识别用户已身故,发起生物核身校验;所述生物核身校验过程中用于比对的标准信息为预先存储的所述待识别用户的生物信息;
身份状态正常确定单元,用于获取生物核身校验结果;当所述生物核身校验结果表示校验通过时,确定所述待识别用户的身份状态正常;
身份状态异常确定单元,用于当所述生物核身校验结果表示无人进行生物核身校验时,确定所述待识别用户的身份状态异常,所述身份状态异常用于表示所述待识别用户已身故。
可选的,所述装置40,还可以包括:
提示信息发送模块,用于当所述生物核身校验结果表示当前操作所述待识别用户账号的用户不是所述待识别用户,向所述待识别用户账号登录的终端发送提示信息;所述提示信息用于提示当前操作所述待识别用户账号的用户上传所述待识别用户的身份状态证明信息。
可选的,所述装置40,还可以包括:
账号使用异常确定模块,用于若所述当前操作所述待识别用户账号的用户在设定时间内未上传所述待识别用户的身份状态证明信息,则表示所述待识别用户的账号存在使用异常。
可选的,所述装置40,还可以包括:
账号继承模块,用于若所述当前操作所述待识别用户账号的用户在设定时间内上传了所述待识别用户的身份状态证明信息,且所述身份状态证明信息表示所述待识别用户已身故,则按照继承流程,完成对所述待识别用户的账号继承。
可选的,所述账号继承模块,具体可以用于:
接收所述用户发起的账号继承请求;
获取所述用户上传的用户身份证明信息;
根据所述用户的身份证明信息以及已有的所述待识别用户的身份证明信息,确定所述用户与所述待识别用户之间的关联关系;
判断所述关联关系是否满足继承条件;
当所述关联关系满足继承条件时,录入所述用户的生物信息;
所述用户的生物信息录入完成后,将所述账号的认证信息变更为所述用户的相关信息,完成账号继承。
可选的,所述装置40,还可以包括:
样本数据获取模块,用于获取已知身份状态的用户的样本数据;
特征提取模块,用于将所述样本数据按照所述多个预设维度进行特征提取,得到第二特征信息;
模型训练模块,用于采用所述第二特征信息对初始身份状态预设模型进行训练,得到所述初始身份状态身份模型对所述样本数据的预测结果;所述预测结果为所述样本数据中各个用户的身份状态预测概率;
参数调整模块,用于根据所述预测结果与已知身份状态之间的差异调整所述初始身份状态预设模型对应的参数,直至所述差异满足预设条件为止,得到训练完成的身份状态预测模型。
可选的,当所述待识别用户的账号存在使用异常时,将所述待识别用户的账号对应的业务锁定。
可选的,所述装置40,还可以包括:
继承流程终止模块,用于当所述关联关系不满足继承条件时,终止所述继承流程。
可选的,所述装置40,还可以用于:
将所述待识别用户的身份状态信息在应用平台进行全域广播;
和/或,停止向所述待识别用户的账号提供数字金融服务。
可选的,所述装置40,还可以包括:
账号注销模块,用于将所述待识别用户的账号进行注销。
基于同样的思路,本说明书实施例还提供了上述方法对应的设备。
图5是本说明书实施例提供的一种用户身份状态预测示意图。如图5所示,设备500可以包括:
至少一个处理器510;以及,
与所述至少一个处理器通信连接的存储器530;其中,
所述存储器530存储有可被所述至少一个处理器510执行的指令520,所述指令被所述至少一个处理器510执行,以使所述至少一个处理器510能够:
获取待识别用户的用户数据;所述用户数据包括所述待识别用户的基本属性数据以及操作行为数据;
对所述用户数据进行解析,确定所述待识别用户在多个预设维度上对应的第一特征信息;
将所述第一特征信息输入训练完成的身份状态预测模型中,输出所述待识别用户的身份状态的预测分数;所述身份状态预测模型是采用多个预设维度的数据训练得到的;所述预测分数用于表示所述待识别用户的身份状态异常的概率。
基于同样的思路,本说明书实施例还提供了上述方法对应的计算机可读介质。计算机可读介质上存储有计算机可读指令,所述计算机可读指令可被处理器执行以实现以下方法:
获取待识别用户的用户数据;所述用户数据包括所述待识别用户的基本属性数据以及操作行为数据;
对所述用户数据进行解析,确定所述待识别用户在多个预设维度上对应的第一特征信息;
将所述第一特征信息输入训练完成的身份状态预测模型中,输出所述待识别用户的身份状态的预测分数;所述身份状态预测模型是采用多个预设维度的数据训练得到的;所述预测分数用于表示所述待识别用户的身份状态异常的概率。
在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray,FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字符系统“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(Hardware Description Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等,目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字符助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字符多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带式磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。
Claims (28)
1.一种用户身份状态预测方法,包括:
获取待识别用户的用户数据;所述用户数据包括所述待识别用户的基本属性数据以及操作行为数据;
对所述用户数据进行解析,确定所述待识别用户在多个预设维度上对应的第一特征信息;
将所述第一特征信息输入训练完成的身份状态预测模型中,输出所述待识别用户的身份状态的预测分数;所述身份状态预测模型是采用多个预设维度的数据训练得到的;所述预测分数用于表示所述待识别用户的身份状态异常的概率。
2.根据权利要求1所述的方法,所述将所述第一特征信息输入训练完成的身份状态预测模型中,输出所述待识别用户的身份状态的预测分数之后,还包括:
判断所述预测分数是否大于预设阈值,得到判断结果;
当所述判断结果表示所述预测分数大于预设阈值时,采用所述待识别用户的身份状态证明信息继续对所述待识别用户的身份状态是否异常进行核验。
3.根据权利要求2所述的方法,所述采用所述待识别用户的身份状态证明信息继续对所述待识别用户的身份状态是否异常进行核验,具体包括:
获取所述待识别用户的身份状态证明信息;
根据所述身份状态证明信息对所述待识别用户的身份状态是否异常进行核验。
4.根据权利要求3所述的方法,所述获取所述待识别用户的身份状态证明信息,具体包括:
获取权威机构提供的所述待识别用户的身份状态证明信息;
和/或,获取所述待识别用户的代理人上传的身份状态证明信息。
5.根据权利要求2所述的方法,所述采用所述待识别用户的身份状态证明信息继续对所述待识别用户的身份状态是否异常进行核验,具体包括:
获取权威机构提供的所述待识别用户的身份状态证明信息;
当所述权威机构提供的身份状态证明信息表示所述待识别用户已身故,发起生物核身校验;所述生物核身校验过程中用于比对的标准信息为预先存储的所述待识别用户的生物信息;
获取生物核身校验结果;当所述生物核身校验结果表示校验通过时,确定所述待识别用户的身份状态正常;
当所述生物核身校验结果表示无人进行生物核身校验时,确定所述待识别用户的身份状态异常,所述身份状态异常用于表示所述待识别用户已身故。
6.根据权利要求5所述的方法,所述获取生物核身校验结果之后,还包括:
当所述生物核身校验结果表示当前操作所述待识别用户账号的用户不是所述待识别用户,向所述待识别用户账号登录的终端发送提示信息;所述提示信息用于提示当前操作所述待识别用户账号的用户上传所述待识别用户的身份状态证明信息。
7.根据权利要求6所述的方法,所述向所述待识别用户账号登录的终端发送提示信息之后,还包括:
若所述当前操作所述待识别用户账号的用户在设定时间内未上传所述待识别用户的身份状态证明信息,则表示所述待识别用户的账号存在使用异常。
8.根据权利要求6所述的方法,所述向所述待识别用户账号登录的终端发送提示信息之后,还包括:
若所述当前操作所述待识别用户账号的用户在设定时间内上传了所述待识别用户的身份状态证明信息,且所述身份状态证明信息表示所述待识别用户已身故,则按照继承流程,完成对所述待识别用户的账号继承。
9.根据权利要求8所述的方法,所述按照继承流程,完成对所述待识别用户的账号继承,具体包括:
接收所述用户发起的账号继承请求;
获取所述用户上传的用户身份证明信息;
根据所述用户的身份证明信息以及已有的所述待识别用户的身份证明信息,确定所述用户与所述待识别用户之间的关联关系;
判断所述关联关系是否满足继承条件;
当所述关联关系满足继承条件时,录入所述用户的生物信息;
所述用户的生物信息录入完成后,将所述账号的认证信息变更为所述用户的相关信息,完成账号继承。
10.根据权利要求7所述的方法,当所述待识别用户的账号存在使用异常时,将所述待识别用户的账号对应的业务锁定。
11.根据权利要求9所述的方法,所述判断所述关联关系是否满足继承条件之后,还包括:
当所述关联关系不满足继承条件时,终止所述继承流程。
12.根据权利要求11所述的方法,所述在所述继承流程终止后,还包括:
将所述待识别用户的身份状态信息在应用平台进行全域广播;
和/或,停止向所述待识别用户的账号提供数字金融服务。
13.根据权利要求11所述的方法,所述在所述继承流程终止后,还包括:
将所述待识别用户的账号进行注销。
14.根据权利要求1所述的方法,所述将所述第一特征信息输入训练完成的身份状态预测模型中,输出所述待识别用户的身份状态的预测分数之前,还包括:
获取已知身份状态的用户的样本数据;
将所述样本数据按照所述多个预设维度进行特征提取,得到第二特征信息;
采用所述第二特征信息对初始身份状态预设模型进行训练,得到所述初始身份状态身份模型对所述样本数据的预测结果;所述预测结果为所述样本数据中各个用户的身份状态预测概率;
根据所述预测结果与已知身份状态之间的差异调整所述初始身份状态预设模型对应的参数,直至所述差异满足预设条件为止,得到训练完成的身份状态预测模型。
15.根据权利要求1所述的方法,所述待识别用户的基本属性数据包括所述待识别用户的人口属性数据、社会属性数据、账号属性数据以及商业属性数据中的一种或多种;
所述操作行为数据包括所述待识别用户的访问行为数据、社交行为数据、账号通讯录数据、风险标签数据以及交易行为数据中的至少一种。
16.根据权利要求1所述的方法,所述预设维度至少包括:身份基础信息维度、冲突行为维度、设备维度、社交维度、健康维度、交易维度以及操作行为维度。
17.一种用户身份状态预测装置,包括:
数据获取模块,用于获取待识别用户的用户数据;所述用户数据包括所述待识别用户的基本属性数据以及操作行为数据;
数据解析模块,用于对所述用户数据进行解析,确定所述待识别用户在多个预设维度上对应的第一特征信息;
身份状态预测模块,用于将所述第一特征信息输入训练完成的身份状态预测模型中,输出所述待识别用户的身份状态的预测分数;所述身份状态预测模型是采用多个预设维度的数据训练得到的;所述预测分数用于表示所述待识别用户的身份状态异常的概率。
18.根据权利要求17所述的装置,所述装置,还包括:
判断模块,用于判断所述预测分数是否大于预设阈值,得到判断结果;
核验模块,用于当所述判断结果表示所述预测分数大于预设阈值时,采用所述待识别用户的身份状态证明信息继续对所述待识别用户的身份状态是否异常进行核验。
19.根据权利要求18所述的装置,所述核验模块,具体包括:
身份状态证明信息获取单元,用于获取所述待识别用户的身份状态证明信息;
核验单元,用于根据所述身份状态证明信息对所述待识别用户的身份状态是否异常进行核验。
20.根据权利要求19所述的装置,所述身份状态证明信息获取单元,具体包括:
身份状态证明信息获取子单元,用于获取权威机构提供的所述待识别用户的身份状态证明信息;
和/或,获取所述待识别用户的代理人上传的身份状态证明信息。
21.根据权利要求18所述的装置,所述核验模块,具体包括:
身份状态证明信息获取单元,用于获取权威机构提供的所述待识别用户的身份状态证明信息;
生物核身校验单元,用于当所述权威机构提供的身份状态证明信息表示所述待识别用户已身故,发起生物核身校验;所述生物核身校验过程中用于比对的标准信息为预先存储的所述待识别用户的生物信息;
身份状态正常确定单元,用于获取生物核身校验结果;当所述生物核身校验结果表示校验通过时,确定所述待识别用户的身份状态正常;
身份状态异常确定单元,用于当所述生物核身校验结果表示无人进行生物核身校验时,确定所述待识别用户的身份状态异常,所述身份状态异常用于表示所述待识别用户已身故。
22.根据权利要求21所述的装置,所述装置,还包括:
提示信息发送模块,用于当所述生物核身校验结果表示当前操作所述待识别用户账号的用户不是所述待识别用户,向所述待识别用户账号登录的终端发送提示信息;所述提示信息用于提示当前操作所述待识别用户账号的用户上传所述待识别用户的身份状态证明信息。
23.根据权利要求22所述的装置,所述装置,还包括:
账号使用异常确定模块,用于若所述当前操作所述待识别用户账号的用户在设定时间内未上传所述待识别用户的身份状态证明信息,则表示所述待识别用户的账号存在使用异常。
24.根据权利要求22所述的装置,所述装置,还包括:
账号继承模块,用于若所述当前操作所述待识别用户账号的用户在设定时间内上传了所述待识别用户的身份状态证明信息,且所述身份状态证明信息表示所述待识别用户已身故,则按照继承流程,完成对所述待识别用户的账号继承。
25.根据权利要求24所述的装置,所述账号继承模块,具体用于:
接收所述用户发起的账号继承请求;
获取所述用户上传的用户身份证明信息;
根据所述用户的身份证明信息以及已有的所述待识别用户的身份证明信息,确定所述用户与所述待识别用户之间的关联关系;
判断所述关联关系是否满足继承条件;
当所述关联关系满足继承条件时,录入所述用户的生物信息;
所述用户的生物信息录入完成后,将所述账号的认证信息变更为所述用户的相关信息,完成账号继承。
26.根据权利要求17所述的装置,所述装置,还包括:
样本数据获取模块,用于获取已知身份状态的用户的样本数据;
特征提取模块,用于将所述样本数据按照所述多个预设维度进行特征提取,得到第二特征信息;
模型训练模块,用于采用所述第二特征信息对初始身份状态预设模型进行训练,得到所述初始身份状态身份模型对所述样本数据的预测结果;所述预测结果为所述样本数据中各个用户的身份状态预测概率;
参数调整模块,用于根据所述预测结果与已知身份状态之间的差异调整所述初始身份状态预设模型对应的参数,直至所述差异满足预设条件为止,得到训练完成的身份状态预测模型。
27.一种用户身份状态预测设备,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:
获取待识别用户的用户数据;所述用户数据包括所述待识别用户的基本属性数据以及操作行为数据;
对所述用户数据进行解析,确定所述待识别用户在多个预设维度上对应的第一特征信息;
将所述第一特征信息输入训练完成的身份状态预测模型中,输出所述待识别用户的身份状态的预测分数;所述身份状态预测模型是采用多个预设维度的数据训练得到的;所述预测分数用于表示所述待识别用户的身份状态异常的概率。
28.一种计算机可读介质,其上存储有计算机可读指令,所述计算机可读指令可被处理器执行以实现权利要求1至16中任一项所述的用户身份状态预测方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210993200.6A CN115545271A (zh) | 2020-08-12 | 2020-08-12 | 一种用户身份状态预测方法、装置及设备 |
CN202010806611.0A CN111985703B (zh) | 2020-08-12 | 2020-08-12 | 一种用户身份状态预测方法、装置及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010806611.0A CN111985703B (zh) | 2020-08-12 | 2020-08-12 | 一种用户身份状态预测方法、装置及设备 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210993200.6A Division CN115545271A (zh) | 2020-08-12 | 2020-08-12 | 一种用户身份状态预测方法、装置及设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111985703A true CN111985703A (zh) | 2020-11-24 |
CN111985703B CN111985703B (zh) | 2022-07-29 |
Family
ID=73435292
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210993200.6A Pending CN115545271A (zh) | 2020-08-12 | 2020-08-12 | 一种用户身份状态预测方法、装置及设备 |
CN202010806611.0A Active CN111985703B (zh) | 2020-08-12 | 2020-08-12 | 一种用户身份状态预测方法、装置及设备 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210993200.6A Pending CN115545271A (zh) | 2020-08-12 | 2020-08-12 | 一种用户身份状态预测方法、装置及设备 |
Country Status (1)
Country | Link |
---|---|
CN (2) | CN115545271A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112737848A (zh) * | 2020-12-29 | 2021-04-30 | 青岛海尔科技有限公司 | 对象类型的确定方法、装置、存储介质及电子装置 |
CN112767178A (zh) * | 2020-12-31 | 2021-05-07 | 平安养老保险股份有限公司 | 生存状态监测方法、装置、计算机设备及存储介质 |
CN113221832A (zh) * | 2021-05-31 | 2021-08-06 | 常州纺织服装职业技术学院 | 基于三维人体数据的人体识别方法和系统 |
CN113569949A (zh) * | 2021-07-28 | 2021-10-29 | 广州博冠信息科技有限公司 | 异常用户识别方法及装置、电子设备和存储介质 |
CN114154058A (zh) * | 2021-11-02 | 2022-03-08 | 支付宝(杭州)信息技术有限公司 | 一种账号操作者身份的预测方法及装置 |
CN115374190A (zh) * | 2022-10-25 | 2022-11-22 | 支付宝(杭州)信息技术有限公司 | 一种类案检索的方法、装置、存储介质及电子设备 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107403385A (zh) * | 2016-05-18 | 2017-11-28 | 平安科技(深圳)有限公司 | 投保信息审核方法和装置 |
CN108898418A (zh) * | 2018-05-31 | 2018-11-27 | 康键信息技术(深圳)有限公司 | 用户账号检测方法、装置、计算机设备和存储介质 |
CN109522304A (zh) * | 2018-11-23 | 2019-03-26 | 中国联合网络通信集团有限公司 | 异常对象识别方法及装置、存储介质 |
CN110348471A (zh) * | 2019-05-23 | 2019-10-18 | 平安科技(深圳)有限公司 | 异常对象识别方法、装置、介质及电子设备 |
CN110399925A (zh) * | 2019-07-26 | 2019-11-01 | 腾讯科技(武汉)有限公司 | 账号的风险识别方法、装置及存储介质 |
CN111107057A (zh) * | 2019-11-28 | 2020-05-05 | 泰康保险集团股份有限公司 | 异常用户账号检测方法、装置、设备及存储介质 |
CN111522724A (zh) * | 2020-04-23 | 2020-08-11 | 广州酷狗计算机科技有限公司 | 异常账号的确定方法、装置、服务器及存储介质 |
-
2020
- 2020-08-12 CN CN202210993200.6A patent/CN115545271A/zh active Pending
- 2020-08-12 CN CN202010806611.0A patent/CN111985703B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107403385A (zh) * | 2016-05-18 | 2017-11-28 | 平安科技(深圳)有限公司 | 投保信息审核方法和装置 |
CN108898418A (zh) * | 2018-05-31 | 2018-11-27 | 康键信息技术(深圳)有限公司 | 用户账号检测方法、装置、计算机设备和存储介质 |
CN109522304A (zh) * | 2018-11-23 | 2019-03-26 | 中国联合网络通信集团有限公司 | 异常对象识别方法及装置、存储介质 |
CN110348471A (zh) * | 2019-05-23 | 2019-10-18 | 平安科技(深圳)有限公司 | 异常对象识别方法、装置、介质及电子设备 |
CN110399925A (zh) * | 2019-07-26 | 2019-11-01 | 腾讯科技(武汉)有限公司 | 账号的风险识别方法、装置及存储介质 |
CN111107057A (zh) * | 2019-11-28 | 2020-05-05 | 泰康保险集团股份有限公司 | 异常用户账号检测方法、装置、设备及存储介质 |
CN111522724A (zh) * | 2020-04-23 | 2020-08-11 | 广州酷狗计算机科技有限公司 | 异常账号的确定方法、装置、服务器及存储介质 |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112737848A (zh) * | 2020-12-29 | 2021-04-30 | 青岛海尔科技有限公司 | 对象类型的确定方法、装置、存储介质及电子装置 |
CN112767178A (zh) * | 2020-12-31 | 2021-05-07 | 平安养老保险股份有限公司 | 生存状态监测方法、装置、计算机设备及存储介质 |
CN113221832A (zh) * | 2021-05-31 | 2021-08-06 | 常州纺织服装职业技术学院 | 基于三维人体数据的人体识别方法和系统 |
CN113221832B (zh) * | 2021-05-31 | 2023-07-11 | 常州纺织服装职业技术学院 | 基于三维人体数据的人体识别方法和系统 |
CN113569949A (zh) * | 2021-07-28 | 2021-10-29 | 广州博冠信息科技有限公司 | 异常用户识别方法及装置、电子设备和存储介质 |
CN114154058A (zh) * | 2021-11-02 | 2022-03-08 | 支付宝(杭州)信息技术有限公司 | 一种账号操作者身份的预测方法及装置 |
CN115374190A (zh) * | 2022-10-25 | 2022-11-22 | 支付宝(杭州)信息技术有限公司 | 一种类案检索的方法、装置、存储介质及电子设备 |
CN115374190B (zh) * | 2022-10-25 | 2023-03-24 | 支付宝(杭州)信息技术有限公司 | 一种类案检索的方法、装置、存储介质及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN115545271A (zh) | 2022-12-30 |
CN111985703B (zh) | 2022-07-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111985703B (zh) | 一种用户身份状态预测方法、装置及设备 | |
US11256777B2 (en) | Data processing user interface monitoring systems and related methods | |
US11416636B2 (en) | Data processing consent management systems and related methods | |
US11868507B2 (en) | Data processing systems for cookie compliance testing with website scanning and related methods | |
US20220360590A1 (en) | Consent conversion optimization systems and related methods | |
US10762236B2 (en) | Data processing user interface monitoring systems and related methods | |
US10706176B2 (en) | Data-processing consent refresh, re-prompt, and recapture systems and related methods | |
US10726158B2 (en) | Consent receipt management and automated process blocking systems and related methods | |
US11354434B2 (en) | Data processing systems for verification of consent and notice processing and related methods | |
US11461500B2 (en) | Data processing systems for cookie compliance testing with website scanning and related methods | |
US11550886B2 (en) | Disambiguation and authentication of device users | |
US11222142B2 (en) | Data processing systems for validating authorization for personal data collection, storage, and processing | |
US11520928B2 (en) | Data processing systems for generating personal data receipts and related methods | |
US11062294B2 (en) | Cognitive blockchain for customized interchange determination | |
US9824199B2 (en) | Multi-factor profile and security fingerprint analysis | |
US11636171B2 (en) | Data processing user interface monitoring systems and related methods | |
US11960564B2 (en) | Data processing systems and methods for automatically blocking the use of tracking tools | |
WO2019074446A1 (en) | LOAN REQUEST PROCESSING SYSTEM AND METHOD | |
US20230195829A1 (en) | Data processing consent capture systems and related methods | |
CN104704521B (zh) | 多因素简档和安全指纹分析 | |
US11675929B2 (en) | Data processing consent sharing systems and related methods | |
US11538116B2 (en) | Life event bank ledger | |
US20210149982A1 (en) | Data processing systems and methods for dynamically determining data processing consent configurations |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |