CN109377347A - 基于特征选择的网络信用预警方法、系统及电子设备 - Google Patents
基于特征选择的网络信用预警方法、系统及电子设备 Download PDFInfo
- Publication number
- CN109377347A CN109377347A CN201811130756.2A CN201811130756A CN109377347A CN 109377347 A CN109377347 A CN 109377347A CN 201811130756 A CN201811130756 A CN 201811130756A CN 109377347 A CN109377347 A CN 109377347A
- Authority
- CN
- China
- Prior art keywords
- user
- data
- positive
- network credit
- registration information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 28
- 230000006399 behavior Effects 0.000 claims abstract description 33
- 230000003993 interaction Effects 0.000 claims abstract description 30
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 19
- 238000002955 isolation Methods 0.000 claims abstract description 18
- 238000009826 distribution Methods 0.000 claims description 15
- 230000015654 memory Effects 0.000 claims description 15
- 239000011159 matrix material Substances 0.000 claims description 8
- 230000007704 transition Effects 0.000 claims description 7
- 230000001815 facial effect Effects 0.000 claims description 5
- 238000000605 extraction Methods 0.000 claims description 3
- 238000007670 refining Methods 0.000 claims description 2
- 238000012549 training Methods 0.000 abstract description 2
- 230000004069 differentiation Effects 0.000 abstract 2
- 238000011835 investigation Methods 0.000 description 8
- 238000001514 detection method Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000002159 abnormal effect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000005192 partition Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 235000017166 Bambusa arundinacea Nutrition 0.000 description 1
- 235000017491 Bambusa tulda Nutrition 0.000 description 1
- 241001330002 Bambuseae Species 0.000 description 1
- 235000015334 Phyllostachys viridis Nutrition 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000002547 anomalous effect Effects 0.000 description 1
- 239000011425 bamboo Substances 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 230000008713 feedback mechanism Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/03—Credit; Loans; Processing thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- General Health & Medical Sciences (AREA)
- Economics (AREA)
- General Business, Economics & Management (AREA)
- Technology Law (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- Development Economics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本发明涉及一种基于特征选择的网络信用预警方法、系统以及电子设备,所述方法包括:获取用户基本注册信息;根据预置的埋点策略获取应用交互数据,根据所述应用交互数据生成埋点数据;获取人脸特征;根据上述注册信息、埋点数据和人脸特征,通过Wasserstein距离进行特征重要性选择;根据选择的重要特征通过Isolation forest算法区分数据中的正负样本;根据区分的正负样本进行网络信用预警。本发明不依赖于第三方征信数据,完全基于用户操作行为和人脸特征,并采用Wasserstein距离进行特征选择,从而使非监督学习也能够充分的利用特征重要性进行模型训练从而提升预测准确性。
Description
技术领域
本发明属于计算机软件技术领域,具体涉及一种基于特征选择的网络信用预警方法、系统以及电子设备。
背景技术
2015年底,随着国务院印发《推进普惠金融发展规划(2016—2020年)》,大大小小的有关普惠金融的公司、业务(现金贷,分期付款等)如雨后春笋在全国各地铺面开来。然而普惠金融往往都高度依赖于个人征信和信贷风控,可以说,征信和风控是普惠金融的核心。这是因为,普惠金融面向有金融服务需求的社会各阶层和群体提供适当、有效的金融服务。小微企业、农民、城镇低收入人群、贫困人群和残疾人、老年人等特殊群体是当前我国普惠金融重点服务对象。特殊群体在金融风险中类属于高风险客群,一旦出现风控漏洞,小则影响企业收益,大则波及经济、社会和科技的各个层面。因此,针对普惠金融业务有效的征信和风控系统对深圳市的经济、社会和科技发展都具有重要的意义。
其中,普惠金融现金贷业务更是一种突破传统信用卡服务的新型借贷类型,用户通过智能手机APP注册就可以在极短时间内(为了提高用户体验抢占市场,一些APP甚至发起了极速放款的诱饵,符合要求的用户放款时间通常小于5分钟)申请相应额度的贷款,因此,现金贷业务的风控体系建设尤为重要,而现金贷风控体系的核心是诈骗识别算法。具体来说,现金贷诈骗识别可以依据业务时间节点分为两部分:贷前诈骗识别和贷中诈骗识别。
由于已经具备较为丰富的用户行为和标签储备,因此贷中诈骗识别一般采用有监督的方式进行建模,其正样本的准确率和召回率都会有很高的水准。然而,贷中诈骗识别能够挽回的仅仅是欺诈用户后续诈骗行为带来的经济损失,已经造成的损失将无法弥补。另一方面,贷前诈骗识别会将非黑名单用户(注:黑名单用户会直接被拒绝申请)行为在申请贷款前进行过滤识别,将高风险用户直接拒绝申请,从而避免任意形式的经济损失。然而,贷前诈骗识别由于没有可用标签,一般只能基于非监督模型进行建模分析。非监督模式的贷前诈骗识别面临了很多亟待解决的实际问题,总结起来包含以下两个方面:
贷前冷启动
贷前冷启动指的是新用户注册,各个方面(行为、时间、空间、设备信息等)数据匮乏,很难由传统的行为统计方式描绘出用户风险画像。
非监督模式特征选择
由于贷前冷启动问题,导致用户行为特征不均匀分布。如果直接将稀疏特征矩阵进行模型训练,将造成模型偏差(欠拟合)。
对于上述提及到的困难,目前大多数的解决方案是大量的引入第三方征信数据,将贷前征信和贷前反欺诈有机的结合。尽管引入第三方征信数据能在一定程度上够缓解上述问题带来的负面影响,但第三方征信数据的持续引入必将给企业带来更大的经济成本,同时,由于第三方征信的不确定性,完全依赖第三方征信会对模型鲁棒性带来新的负面影响。
发明内容
针对以上问题,本发明旨在提供一种不依赖于第三方征信数据,而是利用用户APP操作数据和人脸数据进行特征刻画,并通过Wasserstein距离进行特征选择来提升模型的准确性和鲁棒性的网络信用预警方法、系统以及电子设备。
为解决上述技术问题,本发明采用的一个技术方案是:提供一种基于特征选择的网络信用预警方法,包括如下步骤:
S1、获取用户基本注册信息;
S2、根据预置的埋点策略获取应用交互数据,根据所述应用交互数据生成埋点数据;
S3、获取人脸特征;
S4、根据上述注册信息、埋点数据和人脸特征,通过Wasserstein距离进行特征重要性选择;所述Wasserstein距离根据历史正样本来初始化特定特征正样本的概率分布,从而确定正负样本在特定特征上的差异,并根据特定特征上的差异完成特征重要性选择;
S5、根据选择的重要特征通过Isolation forest算法区分数据中的正负样本;
S6、根据区分的正负样本进行网络信用预警。
进一步的,所述用户基本注册信息至少包括用户名称、性别、出生年月、身份证号码和电话号码。
更进一步的,所述埋点数据至少包括复制、粘贴、删除、输入框聚焦时间。
作为一种改进,步骤S3中所述人脸特征为根据用户注册时的摄像头实时采集的用户正面或侧面照片,并基于Dlib框架衍生的人脸特征。
作为更进一步的改进,所述人脸特征用以深度刻画用户在使用时的心理状态,从人类心理学的角度细化用户信用风险。
具体的,所述步骤S2包括:获取应用交互数据并判断是否符合操作行为习惯马尔科夫链,所述操作行为习惯马尔科夫链指单个用户对于整体用户行为转移矩阵的概率差异。
一种基于特征选择的网络信用预警系统,包括:
客户端,所述客户端用以采集相关数据,包括用户信息采集单元,埋点数据采集单元和人脸特征提取单元;
所述用户信息采集单元用以获取用户基本注册信息;
所述埋点数据采集单元用以根据预置的埋点策略获取应用交互数据,根据所述应用交互数据生成埋点数据;
人脸特征提取单元用以获取人脸特征;
网络服务器,所述网络服务器用以根据采集的相关数据进行网络信用预警,包括Wasserstein距离单元和Isolation forest算法单元;
所述Wasserstein距离单元根据上述注册信息、埋点数据和人脸特征,通过Wasserstein距离进行特征重要性选择;所述Wasserstein距离根据历史正样本来初始化特定特征正样本的概率分布,从而确定正负样本在特定特征上的差异,并根据特定特征上的差异完成特征重要性选择;
所述Isolation forest算法单元根据选择的重要特征通过Isolation forest算法区分数据中的正负样本,并根据区分的正负样本进行网络信用预警。
进一步的,所述用户基本注册信息至少包括用户名称、性别、出生年月、身份证号码和电话号码。
进一步的,所述埋点数据至少包括复制、粘贴、删除、输入框聚焦时间。
一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述权利要求1至7任一项所述的基于特征选择的网络信用预警方法的以下操作:
S1、获取用户基本注册信息;
S2、根据预置的埋点策略获取应用交互数据,根据所述应用交互数据生成埋点数据;
S3、获取人脸特征;
S4、根据上述注册信息、埋点数据和人脸特征,通过Wasserstein距离进行特征重要性选择;
S5、根据选择的重要特征通过Isolation forest算法区分数据中的正负样本;
S6、根据区分的正负样本进行网络信用预警。
本发明一种基于特征选择的网络信用预警方法、系统以及电子设备,该系统不依赖于第三方征信数据,完全基于用户贷前APP操作行为和人脸特征,并采用Wasserstein距离进行特征选择,从而使非监督学习也能够充分的利用特征重要性进行模型训练从而提升预测准确性。
附图说明
图1是本发明一种基于特征选择的网络信用预警方法逻辑示意图;
图2是本发明一种基于特征选择的网络信用预警系统逻辑示意框图;
图3是本发明一种基于特征选择的网络信用预警系统以及电子设备逻辑示意图。
具体实施方式
以下结合图1-3具体说明本发明提供的一种基于特征选择的网络信用预警方法、系统以及电子设备。本发明一种基于特征选择的网络信用预警方法、系统是基于在互联网金融现金贷贷前诈骗识别业务应用上进行开发的。
如图1所示,一种基于特征选择的网络信用预警方法,包括如下步骤:
S1、获取用户基本注册信息;所述注册信息至少包括用户名称、性别、出生年月、身份证号码和电话号码等。
S2、根据预置的埋点策略获取应用交互数据,根据所述应用交互数据生成埋点数据;基于原始APP埋点数据(至少包括复制、粘贴、删除、输入框聚焦时间等)衍生用户APP操作行为特征,如操作行为习惯马尔科夫链等。
获取应用交互数据并判断是否符合操作行为习惯马尔科夫链,所述操作行为习惯马尔科夫链指单个用户对于整体用户行为转移矩阵的概率差异。
S3、获取人脸特征;所述人脸特征为根据用户注册时的摄像头实时采集的用户正面或侧面照片,并基于Dlib框架衍生的维人脸特征。所述人脸特征用以深度刻画用户在使用时的心理状态,从人类心理学的角度细化用户信用风险。
所述步骤1至步骤3为贷前特征构造,贷前特征包含了时间、空间、时空分布、二级关联、行为习惯以及人脸特征等相关信息。其中用户行为习惯,特别的,基于马尔科夫链的用户操作行为概率,极大的丰富了用户贷前风险画像。具体的,以基于所有用户的操作行为概率转移矩阵为初始条件,当冷启动用户有新的操作行为时,基于概率转移矩阵得出该操作行为相对于大部分用户的概率,从而反映该操作的异常状态。另外,为了尽量丰富贷前冷启动用户的特征,本发明引入人脸特征用以深度刻画用户在申请贷款前的心理状态,从而从人类心理学的角度细化用户欺诈风险。具体的,使用openCV抽取用户的人脸数据,应用Dlib开源工具包将用户人脸数据衍生出128人脸特征向量,
S4、根据上述注册信息、埋点数据和人脸特征,通过Wasserstein距离进行特征重要性选择;所述Wasserstein距离根据历史正样本来初始化特定特征正样本的概率分布,从而确定正负样本在特定特征上的差异,并根据特定特征上的差异完成特征重要性选择。
对于贷前反欺诈模型,由于不存在相应的监督机制,因此无法采用基于反馈机制的特征选择方式。在本课题中,基于KL散度(相对熵)和Wasserstein距离(Earth-MoverDistance–EMD)的特征选择算法被应用。KL散度是两个概率分布P(该特征在正样本上的分布)和Q(该特征在负样本上的分布)差别的非对称性的度量。或者说,KL散度是用来度量使用基于Q的编码来编码来自P的样本平均所需的额外的位元数。KL散度是非对称的,Wasserstein距离却是对称的。EMD是一种在D区域两个概率分布距离的度量,如果两个分布被看作在D区域上两种不同方式堆积一定数量的山堆,那么EMD就是把一堆变成另一堆所需要移动单位小块最小的距离之和。
S5、根据选择的重要特征通过Isolation forest算法区分数据中的正负样本;Isolation(孤立)指的是将每一个样本都和其他样本分开,如果是异常样本,则由于在大部分特征上少儿不同的特性,更容易被孤立。Isolation forest(孤立森林)和著名的有监督学习算法Random forest(随机森林)类似,但每次选择划分属性和划分点(值)时都是随机的,而不是根据信息增益或者基尼指数来选择。在建树过程中,如果一些样本很快就到达了叶子节点(即叶子到根的距离很短),那么就被认为很有可能是异常点。因为那些路径比较短的样本,都是因为距离主要的样本点分布中心比较远的。也就是说,可以通过计算样本在所有树中的平均路径长度来寻找异常点。
S6、根据区分的正负样本进行网络信用预警。
如图2-3所示,一种基于特征选择的网络信用预警系统,包括:
客户端,所述客户端用以采集相关数据,包括用户信息采集单元,埋点数据采集单元和人脸特征提取单元;
所述用户信息采集单元用以获取用户基本注册信息;所述注册信息至少包括用户名称、性别、出生年月、身份证号码和电话号码等。
所述埋点数据采集单元用以根据预置的埋点策略获取应用交互数据,根据所述应用交互数据生成埋点数据;基于原始APP埋点数据(至少包括复制、粘贴、删除、输入框聚焦时间等)衍生用户APP操作行为特征,如操作行为习惯马尔科夫链等。
获取应用交互数据并判断是否符合操作行为习惯马尔科夫链,所述操作行为习惯马尔科夫链指单个用户对于整体用户行为转移矩阵的概率差异。
人脸特征提取单元用以获取人脸特征;所述人脸特征为根据用户注册时的摄像头实时采集的用户正面或侧面照片,并基于Dlib框架衍生的128维人脸特征。所述人脸特征用以深度刻画用户在使用时的心理状态,从人类心理学的角度细化用户信用风险。
网络服务器,所述网络服务器用以根据采集的相关数据进行进行网络信用预警,包括Wasserstein距离单元和Isolation forest算法单元;
所述Wasserstein距离单元根据上述注册信息、埋点数据和人脸特征,通过Wasserstein距离进行特征重要性选择;所述Wasserstein距离根据历史正样本来初始化特定特征正样本的概率分布,从而确定正负样本在特定特征上的差异,并根据特定特征上的差异完成特征重要性选择。
所述Isolation forest算法单元根据选择的重要特征通过Isolation forest算法区分数据中的正负样本,并根据区分的正负样本进行网络信用预警。
本申请实施例提供的基于特征选择的网络信用预警的电子设备,该设备包括一个或多个处理器以及存储器。以一个处理器为例,该设备还可以包括:输入系统和输出系统。处理器、存储器、输入系统和输出系统可以通过总线或者其他方式连接。
存储器作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序、非暂态计算机可执行程序以及模块。处理器通过运行存储在存储器中的非暂态软件程序、指令以及模块,从而执行电子设备的各种功能应用以及数据处理,即实现上述方法实施例的处理方法。
存储器可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施例中,存储器可选包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至处理系统。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入系统可接收输入的数字或字符信息,以及产生信号输入。输出系统可包括显示屏等显示设备。
所述一个或者多个模块存储在所述存储器中,当被所述一个或者多个处理器执行时,执行上述任一方法实施例的以下操作:
S1、获取用户基本注册信息;所述注册信息至少包括用户名称、性别、出生年月、身份证号码和电话号码等。
S2、根据预置的埋点策略获取应用交互数据,根据所述应用交互数据生成埋点数据;基于原始APP埋点数据(至少包括复制、粘贴、删除、输入框聚焦时间等)衍生用户APP操作行为特征,如操作行为习惯马尔科夫链等。
获取应用交互数据并判断是否符合操作行为习惯马尔科夫链,所述操作行为习惯马尔科夫链指单个用户对于整体用户行为转移矩阵的概率差异。
S3、获取人脸特征;所述人脸特征为根据用户注册时的摄像头实时采集的用户正面或侧面照片,并基于Dlib框架衍生的维人脸特征。所述人脸特征用以深度刻画用户在使用时的心理状态,从人类心理学的角度细化用户信用风险。
S4、根据上述注册信息、埋点数据和人脸特征,通过Wasserstein距离进行特征重要性选择;所述Wasserstein距离根据历史正样本来初始化特定特征正样本的概率分布,从而确定正负样本在特定特征上的差异,并根据特定特征上的差异完成特征重要性选择。
S5、根据选择的重要特征通过Isolation forest算法区分数据中的正负样本。
S6、根据区分的正负样本进行网络信用预警。
上述产品可执行本申请实施例所提供的方法,具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本申请实施例提供的方法。
本发明一种基于特征选择的网络信用预警方法、系统以及电子设备,该系统不依赖于第三方征信数据,完全基于用户贷前APP操作行为和人脸特征,并采用Wasserstein距离进行特征选择,从而使非监督学习也能够充分的利用特征重要性进行模型训练从而提升预测准确性。相比于现有最好的技术来说,本系统无论是从应用效率,还是应用准确率都有明显的优势。
本发明除了应用在互联网金融现金贷贷前诈骗识别业务之外,其发明的核心思想还有更广阔的工程和科学应用。具体的,本发明可以应用到任何存在冷启动、特征不确定性问题的非监督异常检测场景,如医疗疑难杂症检测、计算机网络入侵检测等。
以上所述仅为本发明的实施方式,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种基于特征选择的网络信用预警方法,其特征在于,包括如下步骤:
S1、获取用户基本注册信息;
S2、根据预置的埋点策略获取应用交互数据,根据所述应用交互数据生成埋点数据;
S3、获取人脸特征;
S4、根据上述注册信息、埋点数据和人脸特征,通过Wasserstein距离进行特征重要性选择;所述Wasserstein距离根据历史正样本来初始化特定特征正样本的概率分布,以确定正负样本在特定特征上的差异,并根据特定特征上的差异完成特征重要性选择;
S5、根据选择的重要特征通过Isolation forest算法区分数据中的正负样本;
S6、根据区分的正负样本进行网络信用预警。
2.如权利要求1所述的基于特征选择的网络信用预警方法,其特征在于,所述用户基本注册信息至少包括用户名称、性别、出生年月、身份证号码和电话号码。
3.如权利要求1所述的基于特征选择的网络信用预警方法,其特征在于,所述埋点数据至少包括复制、粘贴、删除、输入框聚焦时间。
4.如权利要求1所述的基于特征选择的网络信用预警方法,其特征在于,步骤S3中所述人脸特征为根据用户注册时的摄像头实时采集的用户正面或侧面照片,并基于Dlib框架衍生的人脸特征。
5.如权利要求4所述的基于特征选择的网络信用预警方法,其特征在于,所述人脸特征用以深度刻画用户在使用时的心理状态,从人类心理学的角度细化用户信用风险。
6.如权利要求1所述的基于特征选择的网络信用预警方法,其特征在于,所述步骤S2包括:获取应用交互数据并判断是否符合操作行为习惯马尔科夫链,所述操作行为习惯马尔科夫链指单个用户对于整体用户行为转移矩阵的概率差异。
7.一种基于特征选择的网络信用预警系统,其特征在于,包括:
客户端,所述客户端用以采集相关数据,包括用户信息采集单元,埋点数据采集单元和人脸特征提取单元;
所述用户信息采集单元用以获取用户基本注册信息;
所述埋点数据采集单元用以根据预置的埋点策略获取应用交互数据,根据所述应用交互数据生成埋点数据;
人脸特征提取单元用以获取人脸特征;
网络服务器,所述网络服务器用以根据采集的相关数据进行网络信用预警,包括Wasserstein距离单元和Isolation forest算法单元;
所述Wasserstein距离单元根据上述注册信息、埋点数据和人脸特征,通过Wasserstein距离进行特征重要性选择;所述Wasserstein距离根据历史正样本来初始化特定特征正样本的概率分布,以确定正负样本在特定特征上的差异,并根据特定特征上的差异完成特征重要性选择;
所述Isolation forest算法单元根据选择的重要特征通过Isolation forest算法区分数据中的正负样本,并根据区分的正负样本进行网络信用预警。
8.如权利要求7所述的基于特征选择的网络信用预警系统,其特征在于,所述用户基本注册信息至少包括用户名称、性别、出生年月、身份证号码和电话号码。
9.如权利要求7所述的基于特征选择的网络信用预警系统,其特征在于,所述埋点数据至少包括复制、粘贴、删除、输入框聚焦时间。
10.一种电子设备,其特征在于,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述权利要求1至6任一项所述的基于特征选择的网络信用预警方法的以下操作:
S1、获取用户基本注册信息;
S2、根据预置的埋点策略获取应用交互数据,根据所述应用交互数据生成埋点数据;
S3、获取人脸特征;
S4、根据上述注册信息、埋点数据和人脸特征,通过Wasserstein距离进行特征重要性选择;所述Wasserstein距离根据历史正样本来初始化特定特征正样本的概率分布,从而确定正负样本在特定特征上的差异,并根据特定特征上的差异完成特征重要性选择;
S5、根据选择的重要特征通过Isolation forest算法区分数据中的正负样本;
S6、根据区分的正负样本进行网络信用预警。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811130756.2A CN109377347B (zh) | 2018-09-27 | 2018-09-27 | 基于特征选择的网络信用预警方法、系统及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811130756.2A CN109377347B (zh) | 2018-09-27 | 2018-09-27 | 基于特征选择的网络信用预警方法、系统及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109377347A true CN109377347A (zh) | 2019-02-22 |
CN109377347B CN109377347B (zh) | 2020-07-24 |
Family
ID=65402572
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811130756.2A Active CN109377347B (zh) | 2018-09-27 | 2018-09-27 | 基于特征选择的网络信用预警方法、系统及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109377347B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110399818A (zh) * | 2019-07-15 | 2019-11-01 | 联动优势科技有限公司 | 一种风险预测的方法和设备 |
CN110457590A (zh) * | 2019-06-25 | 2019-11-15 | 华院数据技术(上海)有限公司 | 基于小数据输入的智能用户画像方法 |
CN113610535A (zh) * | 2021-07-29 | 2021-11-05 | 浙江惠瀜网络科技有限公司 | 适用于消费分期业务过程的风险监控方法及装置 |
CN113822679A (zh) * | 2021-11-24 | 2021-12-21 | 四川新网银行股份有限公司 | 一种自动决策的智能反欺诈贷中管理系统及方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130191287A1 (en) * | 2010-10-01 | 2013-07-25 | Vtm, Llc | Videoconference access facility |
CN107392755A (zh) * | 2017-07-07 | 2017-11-24 | 南京甄视智能科技有限公司 | 贷款风险融合评估方法与系统 |
CN107403370A (zh) * | 2016-08-31 | 2017-11-28 | 彭梅 | 金融借贷风险控制系统以及运行方法 |
CN107464115A (zh) * | 2017-07-20 | 2017-12-12 | 北京小米移动软件有限公司 | 个人特征信息验证方法及装置 |
CN108038965A (zh) * | 2017-11-24 | 2018-05-15 | 江西智梦圆电子商务有限公司 | 一种基于人脸和掌静脉识别的无人智能售货方法 |
CN108399509A (zh) * | 2018-04-12 | 2018-08-14 | 阿里巴巴集团控股有限公司 | 确定业务请求事件的风险概率的方法及装置 |
-
2018
- 2018-09-27 CN CN201811130756.2A patent/CN109377347B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130191287A1 (en) * | 2010-10-01 | 2013-07-25 | Vtm, Llc | Videoconference access facility |
CN107403370A (zh) * | 2016-08-31 | 2017-11-28 | 彭梅 | 金融借贷风险控制系统以及运行方法 |
CN107392755A (zh) * | 2017-07-07 | 2017-11-24 | 南京甄视智能科技有限公司 | 贷款风险融合评估方法与系统 |
CN107464115A (zh) * | 2017-07-20 | 2017-12-12 | 北京小米移动软件有限公司 | 个人特征信息验证方法及装置 |
CN108038965A (zh) * | 2017-11-24 | 2018-05-15 | 江西智梦圆电子商务有限公司 | 一种基于人脸和掌静脉识别的无人智能售货方法 |
CN108399509A (zh) * | 2018-04-12 | 2018-08-14 | 阿里巴巴集团控股有限公司 | 确定业务请求事件的风险概率的方法及装置 |
Non-Patent Citations (1)
Title |
---|
罗方科 等: ""基于Logistic回归模型的个人小额贷款信用风险评估及应用"", 《财经理论与实践》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110457590A (zh) * | 2019-06-25 | 2019-11-15 | 华院数据技术(上海)有限公司 | 基于小数据输入的智能用户画像方法 |
CN110399818A (zh) * | 2019-07-15 | 2019-11-01 | 联动优势科技有限公司 | 一种风险预测的方法和设备 |
CN113610535A (zh) * | 2021-07-29 | 2021-11-05 | 浙江惠瀜网络科技有限公司 | 适用于消费分期业务过程的风险监控方法及装置 |
CN113822679A (zh) * | 2021-11-24 | 2021-12-21 | 四川新网银行股份有限公司 | 一种自动决策的智能反欺诈贷中管理系统及方法 |
Also Published As
Publication number | Publication date |
---|---|
CN109377347B (zh) | 2020-07-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111369342B (zh) | 基于机器学习的贷款审批方法、装置、设备和存储介质 | |
CN109377347B (zh) | 基于特征选择的网络信用预警方法、系统及电子设备 | |
CN108876133B (zh) | 基于业务信息的风险评估处理方法、装置、服务器和介质 | |
CN111681091B (zh) | 基于时间域信息的金融风险预测方法、装置及存储介质 | |
WO2020037942A1 (zh) | 风险预测处理方法、装置、计算机设备和介质 | |
US20180253657A1 (en) | Real-time credit risk management system | |
CN108876600A (zh) | 预警信息推送方法、装置、计算机设备和介质 | |
CN109816200B (zh) | 任务推送方法、装置、计算机设备和存储介质 | |
CN113011895B (zh) | 关联账户样本筛选方法、装置和设备及计算机存储介质 | |
CN113011646B (zh) | 一种数据处理方法、设备以及可读存储介质 | |
CN111951050B (zh) | 理财产品推荐方法及装置 | |
CN109344998A (zh) | 一种基于医疗美容场景的客户违约概率预测方法 | |
CN113538070B (zh) | 用户生命价值周期检测方法、装置和计算机设备 | |
Shao et al. | How does facial recognition as an urban safety technology affect firm performance? The moderating role of the home country’s government subsidies | |
CN110135943A (zh) | 产品推荐方法、装置、计算机设备和存储介质 | |
CN111061948A (zh) | 一种用户标签推荐方法、装置、计算机设备及存储介质 | |
CN110675252A (zh) | 风险评估方法、装置、电子设备及存储介质 | |
CN113887214B (zh) | 基于人工智能的意愿推测方法、及其相关设备 | |
CN111583024A (zh) | 信用评估方法、装置、存储介质及服务器 | |
WO2024104068A9 (zh) | 视频检测方法、装置、设备、存储介质及产品 | |
CN112070744B (zh) | 一种人脸识别的方法、系统、设备及可读存储介质 | |
CN117095460A (zh) | 基于长短时关系预测编码的自监督群体行为识别方法及其识别系统 | |
CN115293783A (zh) | 风险用户识别方法、装置、计算机设备和存储介质 | |
CN113706258B (zh) | 基于组合模型的产品推荐方法、装置、设备及存储介质 | |
CN112347102B (zh) | 多表拼接方法和多表拼接装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |