CN109472626A - 一种面向手机租赁业务的智能金融风险控制方法及系统 - Google Patents
一种面向手机租赁业务的智能金融风险控制方法及系统 Download PDFInfo
- Publication number
- CN109472626A CN109472626A CN201811416102.6A CN201811416102A CN109472626A CN 109472626 A CN109472626 A CN 109472626A CN 201811416102 A CN201811416102 A CN 201811416102A CN 109472626 A CN109472626 A CN 109472626A
- Authority
- CN
- China
- Prior art keywords
- feature
- order
- isomery
- data
- application
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/018—Certifying business or products
- G06Q30/0185—Product, service or business identity fraud
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0645—Rental transactions; Leasing transactions
Landscapes
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Marketing (AREA)
- Economics (AREA)
- Development Economics (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及金融风险控制领域,尤其涉及一种面向手机租赁业务的智能金融风险控制方法及系统,该方法包括:对新订单和历史订单的数据进行数据清洗和特征工程,得到各个订单的基本特征和图模型构建数据;采用历史订单的图模型构建数据构建异构图,抽取图特征;从异构图获得同构图,获取图嵌入特征;将历史订单的基本特征、图特征和图嵌入特征输入到深度因子分解机模型进行训练;将新订单的图模型构建数据放入异构图中并抽取新订单的图特征和图嵌入特征;将新订单三种特征输入到深度因子分解机模型进行检测,若输出标签为欺诈,则发出警报。该方法利用人工智能算法实现了欺诈申请订单的检测,有利于企业减少由于欺诈带来的资金损失。
Description
技术领域
本发明涉及金融风险控制领域,尤其涉及一种面向手机租赁业务的智能金融风险控制方法及系统。
背景技术
近年来,中国的在线借贷行业快速增长,据统计,2017年约有2000家网上贷款公司在10个月内完成了超过2000亿元的人民币交易。一方面,巨额贷款有助于为消费市场提供金融服务;而另一方面,由于这种金融服务是针对传统信贷服务未包含的没有担保和抵押的人,很容易受到欺诈者的攻击,如果没有适当风险控制流程,贷款公司将承受的相关损失可能相当大。
在许多线下金融机构,如银行中,仍然以诸如FICO开发的基于逻辑回归的记分卡等传统模型作为其核心风险控制策略。
但是对于线上金融机构,对于信息的来源、收集、真假判断等各方面都存在很大困难,并不能单纯根据已经很成熟的记分卡模型作为其风控手段,需要利用有限的信息得到最佳的风险控制效果。也就是说传统解决方案在结构信用数据不足的在线贷款业务中有着显而易见的缺点。
目前,很多在线借贷平台都是遵循先人审核再进行机器审核的流程,先人为根据经验判断,再用机器根据规则判断。
以杭州某公司的手机租赁业务为例,其采用先人审后机审的方式,依靠诸如“芝麻逾期记录是否结清、紧急联系人是否虚假、身份证是否虚假”等纯规则进行审核。但是事实证明这种方法仍会给公司造成极大损失,根据2017年-2018年的订单数据分析来看,此方法仍然存在约10%的欺诈申请订单,这是因为利用规则审核,存在规则数有限且不能根据用户的个体行为以及用户间个体行为的关系进行综合评估的弊端。
因此,急需一种面向手机租赁业务的智能金融风险控制解决方案,来实现欺诈申请订单的检测,有利于企业减少由于欺诈带来的资金损失。
发明内容
本发明首先提供一种面向手机租赁业务的智能金融风险控制方法,利用人工智能算法,实现了欺诈申请订单的检测,有利于企业减少由于欺诈带来的资金损失。
具体技术方案如下:
一种面向手机租赁业务的智能金融风险控制方法,包括以下步骤:
(1)对已知标签的历史订单的数据进行数据清洗和特征工程,得到各个历史订单的基本特征和图模型构建数据;
(2)采用历史订单的图模型构建数据构建异构图,并抽取各个历史订单的图特征;从所述异构图获得同构图,并采用深度游走获得各个历史订单的图嵌入特征;
(3)以已知标签的历史订单集合作为训练集,将各个历史订单的基本特征、图特征和图嵌入特征输入到深度因子分解机模型进行训练,直至深度因子分解机模型收敛后结束训练;
(4)对新订单的数据进行数据清洗和特征工程,得到该新订单的基本特征和图模型构建数据;
(5)将所述新订单的图模型构建数据放入所述异构图中,并抽取所述新订单的图特征;从异构图获得同构图,并采用深度游走获得所述新订单的图嵌入特征;
(6)将所述新订单的基本特征、图特征和图嵌入特征输入到训练好的深度因子分解机模型进行检测,若输出标签为欺诈,则发出警报。
本发明的智能金融风险控制方法使用丰富的历史订单(用户行为)数据对新订单建立关系网络,并根据异构图特征和同构稀疏的第三方征信数据、新订单的基本信息数据以及用户行为间的交互信息数据等三方面数据进行建模,从而有效检测用户欺诈行为。
新订单和已知标签的历史订单的数据来自用户基本信息表、用户行为信息记录,订单对应信息、订单对应账期信息、用户积分信息以及第三方征信数据等6类不同的数据源。
对数据进行数据清洗可以去除新订单和历史订单的数据中的冗余信息和空值率过高的信息;对数据进行特征工程生成衍生的特征字段。
通过数据清洗和特征工程可以获得新订单和历史订单的基本特征和图模型构建数据。所述基本特征为用户性别、职业、年龄和芝麻信用分中的至少一项;所述图模型构建数据为订单号、收获地址GPS、以100米为单位的GPS地址(GPS_100)GPS_100米、以1000米为单位的GPS地址(GPS_1000)和下单设备ID中的至少一项。
步骤(2)中,所述异构图的构建方法包括:
(2-a)对历史订单的各个属性进行同质性检测,判断其能否构建异构图;
(2-b)通过同质性检测后,采用各个历史订单之间的关系构建异构图。
所述的异构图中具有两种不同类型的结点,即申请结点(即某一个订单)和信息结点(与订单关联的用户信息),申请结点的一阶邻居是信息结点,二阶的邻居是其他的申请结点。一个申请结点包含某订单的申请信息,比如租机的款式、首次支付的租金、租期时间、租机折扣等信息。一个信息结点可能包含的属性各不相同,一个信息结点可以是用户ID、用户手机号、下单时的IP地址、GPS信号中的任意属性。
步骤(2)中,采用局部和全局的统计特征对异构图中申请结点进行图特征抽取,获得历史订单的图特征。
所述的图特征包括和度有关的特征(属于局部特征)、四边形特征(属于局部特征)和欺诈分(属于全局特征)。
所述和度有关的特征包括与一申请结点一阶相邻的信息结点数、二阶相邻的其他申请结点数和二阶相邻的欺诈申请结点数等。
所述的四边形特征是指与该申请阶段至少通过两个信息结点相连的申请结点的个数。在异构图中,一个四边形一定是由两个申请结点和两个信息结点组成。对于每一个申请结点,四边形个数刻画了和当前申请结点至少通过两个信息结点相连的申请结点的个数。且在此处定义的四边形是广义的,即若当前申请结点与另一个申请结点有2个以上的信息结点相连,仍然认为是同一个四边形。
所述的欺诈分是通过Page Rank算法或Personalized Page Rank算法进行计算。在计算欺诈分时需要做一个前提假设:由于非欺诈申请中存在表现好的申请订单,假设非欺诈结点和信息结点无欺诈的传播性,单单对历史已有的欺诈申请结点进行欺诈染色,并全局地计算各申请结点的欺诈分。
步骤(2)中,从所述异构图获得申请订单和历史订单的同构图的方法为:在所述异构图中,将具有相同信息结点的申请结点进行连接,并删除申请结点和信息结点的边,获得同构图。
例如申请A和申请B使用同一个手机号进行下单,则说明这两个申请节点之间存在关系。在连接相同信息结点的两个申请结点之间增加一条边,同时删去所有申请结点和信息结点之间的边和信息结点,这样异构图就折叠成了同构图。异构图中申请结点之间的间接关系转换成了同构图中申请结点之间的直接关系。
步骤(3)中,所述深度因子分解机模型包括特征输入层、嵌入层、因子分解机、深度神经网络以及输出层;
所述嵌入层将输入层输入的原始特征(高维稀疏特征)变为低维密集特征;
所述因子分解机显式地进行低维密集特征间的两两交互,从而学习低阶交互特征,并将原始特征与低阶交互特征合并;
深度神经网络隐式地学习低维密集特征得到高阶交互特征;
将因子分解机的输出和深度神经网络的输出合并输出到输出层。
基于相同的发明构思,本发明还提供了一种面向手机租赁业务的智能金融风险控制系统,包括:
数据处理模块,对申请订单的数据进行数据清洗和特征工程,得到申请订单的基本特征和图模型构建数据;所述的申请订单包括未知标签的新订单和已知标签的历史订单;
订单识别模块,采用历史订单的图模型构建数据构建异构图,将新订单的图模型构建数据放入所述异构图中,并抽取所述新订单的图特征;从所述异构图获得同构图,并采用深度游走获得所述新订单的图嵌入特征;
欺诈预警模块,存储有训练好的深度因子分解机模型,将所述新订单的基本特征、图特征和图嵌入特征输入到训练好的深度因子分解机模型进行检测,若输出标签为欺诈,则发出警报。
优选的,所述的订单识别模块中包含:
异构图构建单元,对历史订单的各个属性进行同质性检测,判断其能否构建异构图;通过同质性检测后,利用各个历史订单之间的关系构建异构图;
图特征抽取单元,将新订单的图模型构建数据放入所述异构图中,采用局部和全局的统计特征抽取新订单的图特征;
同构图构建单元,将新订单的图模型构建数据放入所述异构图中后,将具有相同信息结点的申请结点进行连接,并删除申请结点和信息结点的边,获得同构图;
图嵌入特征获取单元,采用深度游走算法从同构图中获得新订单的图嵌入特征。
与现有技术相比,本发明的有益效果为:
本发明利用人工智能技术,结合在线获取的体量庞大的用户行为数据,根据用户申请、用户申请间关系、申请信息等用户行为数据构建图模型,并采用深度游走、深度因子分解机等模型对多种数据进行建模,可以有效检测申请订单中是否存在欺诈风险。
附图说明
图1为本发明实施例的智能金融风险控制系统的架构示意图;
图2为本发明实施例的智能金融风险控制系统的工作流程示意图;
图3为订单识别模块的工作流程示意图;
图4为深度因子分解机模型的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步详细描述,需要指出的是,以下所述实施例旨在便于对本发明的理解,而对其不起任何限定作用。
如图1所示,本发明实施例的智能金融风险控制系统包括数据处理模块、订单识别模块和欺诈预警模块,其工作流程如图2所示,具体如下:在获得数据后,进行数据清理和特征工程等预处理操作,得到基本特征以及用于图建模的数据;然后利用图建模数据构建异构图,并进行统计图特征抽取;再利用异构图折叠成为同构图,并通过深度游走得到图嵌入特征;利用深度因子分解机对上述得到的基本特征、统计图特征和图嵌入特征组合成的数据进行建模,从而检测欺诈的存在。该过程由数据处理模块、订单识别模块和欺诈预警模块分步实现。
(1)将杭州某公司的租机平台2017年-2018年的103869单历史订单数据进行分层采样,作为原始数据,其中欺诈申请的比例是10.9%。每单订单数据包括来自用户基本信息表、用户行为信息记录、订单对应信息、订单对应账期信息、用户积分信息以及第三方征信数据等6类不同数据源。取原始数据的80%作为测试集,20%作为训练集。
首先对原始数据进行数据清洗和特征工程等预处理操作,该过程由数据处理模块完成,过程如下:
(1-1)对原始进行数据清洗,去除冗余信息和空值率过高的信息;
(1-2)对清洗后的原始数据进行特征工程生成衍生的特征字段。
例如基本申请信息中可以用下单时间和账号注册时间的计算差值得到下单注册时间差;行为信息中通过工作地址字段得到公司的固定电话;通过详细收货地址得到收货的GPS地址,以及对GPS地址进行小数点的删减分别得到以100米为单位的GPS地址、1000米为单位的GPS地址,从而为后续申请的社交网络关系建模提供基础。
经数据清洗和特征工程处理后得到两种数据:
(1-2a)基本特征,包括用户性别、职业、年龄、芝麻信用分等。
(1-2b)图模型构建所需数据,包括申请订单号、GPS、100米为单位的GPS地址(GPS_100)、以1000米为单位的GPS地址(GPS_1000)、设备ID等。
(2)利用得到的图模型构建所需数据先构建订单的异构图,并根据异构图折叠得到同构图,然后抽取异构图特征以及同构图结点的图嵌入特征;最后利用深度因子分解机对上述获得的基本特征、异构图特征和图嵌入特征进行建模。该过程由订单识别模块完成,如图3所示,该过程如下:
(2-1)构建异构图,其输入是步骤(1)中得到的图模型构建所需数据,异构图构建方法包括:
(2-1a)图模型构建所需数据可分为两种不同类型,分别是申请结点和信息结点。一个申请结点包含某次租机的申请信息,比如租机的款式、首次支付的租金、租期时间、租机折扣等信息。每一个信息结点可能包含的属性各不相同,一个信息结点可以是用户ID、用户手机号、下单时的IP地址、GPS信号中的任意属性。
对订单的申请结点进行同质性检测。
网络的同质性(homophilic)的定义是具有相同标签的结点在更大程度上会连接在一起,则认为此网络具有同质性。在可以构成边的所有关系(Relation)中,并不是所有的关系构成的图都具有同质性,所以要先对其进行同质性检测,使用交叉边数(Cross Edge)作为衡量某一关系构成的图的同质性标准。交叉边(Cross Edge)是两个不同类别的申请结点(一个欺诈结点、一个非欺诈结点)之间存在的边。当交叉边越少,可以认为所构成的网络越同质。在本发明中,我们使用共计103869单的历史申请订单的记录,其中欺诈申请的比例是10.9%,即期望的交叉边比例是0.218,挑选出交叉边比小于0.218的关系作为通过同质性检测的关系,参见表1。
表1不同的建图属性的同质性检测
关系 | 边数 | 交叉边数 | 交叉边比例 |
用户ID | 25135 | 0 | 0 |
订单IP | 9753 | 579 | 0.059 |
GPS | 18358 | 393 | 0.021 |
GPS_100 | 89046 | 3634 | 0.041 |
GPS_1000 | 377510 | 21272 | 0.056 |
工作单位 | 17594 | 860 | 0.049 |
订单MAC | 76402 | 6024 | 0.079 |
订单设备ID | 1155 | 10 | 0.009 |
紧急联系电话 | 2008 | 9 | 0.004 |
(2-1b)使用经过同质性检测后的关系进行异构图的构建。
在异构图中,具有两种不同类型的结点类型,分别是申请结点和信息结点。一个申请结点包含某次租机的申请信息,比如租机的款式、首次支付的租金、租期时间、租机折扣等信息。每一个信息结点可能包含的属性各不相同,一个信息结点可以是用户ID、用户手机号、下单时的IP地址、GPS信号中的任意属性。
将申请结点和信息结点连接起来的边代表不同的关系。
在异构图中,不同种结点直接连接,同种结点间接连接。
(2-2)异构图特征抽取。
在异构图构建完毕之后,使用局部和全局的统计特征对异构图的申请结点进行图特征抽取,获得异构图特征。
有两个局部特征和一个全局特征,包括:
(2-2a)和度有关的特征,属于局部特征。在异构图中,申请结点的一阶邻居是信息结点,二阶的邻居是其他的申请结点。和度有关的特征包括一阶相邻的信息结点数,二阶相邻的其他申请结点数,二阶相邻的欺诈申请结点数等;
(2-2b)四边形特征,属于局部特征。在异构图中,一个四边形一定是由两个申请结点和两个信息结点组成。对于每一个申请结点,四边形个数刻画了和当前申请结点至少通过两个信息结点相连的另一个申请结点。且在此处定义的四边形是广义的,即若当前申请结点与另一个申请结点有2个以上的信息结点相连,仍然认为是同一个四边形;
(2-2c)欺诈分,属于全局特征。通过Google提出的Page Rank算法,并结合Van提出的在公司-资源的异构图中进行Personalized Page Rank算法的思想计算欺诈分。
这里需要做一个假设,由于非欺诈申请中存在表现好的申请订单,假设非欺诈结点和信息结点无欺诈的传播性,单单对历史已有的欺诈申请结点进行欺诈染色,并全局地计算各申请结点的欺诈分。
(2-3)异构图折叠得到同构图,也就是将具有相同信息结点的申请结点进行连接,并删除申请结点和信息结点的边。
根据步骤(2-1)得到的异构图,折叠之后得到同构图,若两个申请节点连接同一个信息节点,例如申请A和申请B使用同一个手机号进行下单,则说明这两个申请节点之间存在关系。在连接相同信息结点的两个申请结点之间增加一条边,同时删去所有申请结点和信息结点之间的边和信息结点,这样异构图就折叠成了同构图。异构图中申请结点之间的间接关系转换成了同构图中申请结点之间的直接关系。
(2-4)在同构图中利用深度游走模型用向量的形式表示申请结点序列,得到申请结点图嵌入特征。深度游走是一种网络表征学习算法,通过学习网络的结构特征来得到网络中结点的向量表示。由于深度游走学习到的结点向量可以反映网络中结点之间的潜在关系,因此在同构图中使用此算法抽取申请结点嵌入特征。
由于网络中结点的度和自然语言中单词的出现频率均遵循幂律分布,因此深度游走将网络中的结点视为语言模型中的单词,并通过随机游走得到一系列的结点序列来模拟语言中的句子,然后借助语言模型skipgram来学习结点的向量表示。
(2-5)综合(1-1)获得的基本特征、(2-2)获得的异构图特征以及(2-4)获得的图嵌入特征等三类样本数据,利用深度因子分解机进行建模。因为所用数据存在很大的稀疏性,故本发明选用深度因子分解机模型,以在一定程度上缓解训练数据稀疏的问题。
所采用的深度因子分解机模型的结构如图4所示,其分为因子分解机和深度神经网络两部分。首先是两部分的共享单元,使用嵌入层将输入的高维稀疏特征(原始特征)变为低维密集特征,使用因子分解机显式地进行密集特征间的两两交互,从而学习低阶交互特征,并将原始特征与低阶交互特征合并;深度神经网络部分隐式地学习到高阶特征交互;将因子分解机和深度神经网络两部分的输出合并作为最后输出层。
将训练样本的基本特征、异构图特征作为深输入层的直接输入,将训练样本的图嵌入特征作为神经网络部分的直接输入,直至深度因子分解机收敛即可。并将测试集作同样的处理对训练好的深度因子分解机模型进行测试。
(3)采用训练好的深度因子分解机模型检测申请订单是否存在欺诈性,若深度因子分解机模型检测到申请订单存在欺诈性,便发出警报,提示该申请订单存在的危险。该过程由欺诈预警模块完成,具体包括:
(3-1)通过数据清洗和特征工程,提取申请订单的基本特征和图模型构建数据;
(3-2)将申请订单的图模型构建数据放入原始数据的异构图中,并从中抽取该申请订单的图特征(包括该申请订单和度有关的特征、四边形特征、欺诈分);
(3-3)将申请订单的图模型构建数据放入异构图中后,折叠获得同构图,从同构图中获取该申请订单的图嵌入特征;
(3-4)将该申请订单的基本特征、图特征和图嵌入特征输入到训练好的深度因子分解机模型中进行检测,若输出标签为欺诈,则发出警报。
以上所述的实施例对本发明的技术方案和有益效果进行了详细说明,应理解的是以上所述仅为本发明的具体实施例,并不用于限制本发明,凡在本发明的原则范围内所做的任何修改、补充和等同替换等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种面向手机租赁业务的智能金融风险控制方法,其特征在于,包括以下步骤:
(1)对已知标签的历史订单的数据进行数据清洗和特征工程,得到各个历史订单的基本特征和图模型构建数据;
(2)采用历史订单的图模型构建数据构建异构图,并抽取各个历史订单的图特征;从所述异构图获得同构图,并采用深度游走获得各个历史订单的图嵌入特征;
(3)以已知标签的历史订单集合作为训练集,将各个历史订单的基本特征、图特征和图嵌入特征输入到深度因子分解机模型进行训练,直至深度因子分解机模型收敛后结束训练;
(4)对新订单的数据进行数据清洗和特征工程,得到该新订单的基本特征和图模型构建数据;
(5)将所述新订单的图模型构建数据放入所述异构图中,并抽取所述新订单的图特征;从异构图获得同构图,并采用深度游走获得所述新订单的图嵌入特征;
(6)将所述新订单的基本特征、图特征和图嵌入特征输入到训练好的深度因子分解机模型进行检测,若输出标签为欺诈,则发出警报。
2.根据权利要求1所述的面向手机租赁业务的智能金融风险控制方法,其特征在于,所述新订单的和历史订单的数据来自用户基本信息、用户行为信息记录,订单对应信息、订单对应账期信息、用户积分信息以及第三方征信数据6类不同的数据源。
3.根据权利要求1所述的面向手机租赁业务的智能金融风险控制方法,其特征在于,步骤(2)中,所述异构图的构建方法包括:
(2-a)对历史订单的各个属性进行同质性检测,判断其能否构建异构图;
(2-b)通过同质性检测后,采用各个历史订单之间的关系构建异构图。
4.根据权利要求1或3所述的面向手机租赁业务的智能金融风险控制方法,其特征在于,步骤(2)中,采用局部和全局的统计特征对异构图中申请结点进行图特征抽取,获得历史订单的图特征。
5.根据权利要求4所述的面向手机租赁业务的智能金融风险控制方法,其特征在于,所述的图特征包括和度有关的特征、四边形特征和欺诈分。
6.根据权利要求5所述的面向手机租赁业务的智能金融风险控制方法,其特征在于,所述和度有关的特征包括与一申请结点一阶相邻的信息结点数、二阶相邻的其他申请结点数和二阶相邻的欺诈申请结点数;所述四边形特征是指与一申请结点至少通过两个信息结点相连的申请结点数;所述欺诈分通过Page Rank算法或Personalized Page Rank算法进行计算。
7.根据权利要求1或3所述的面向手机租赁业务的智能金融风险控制方法,其特征在于,步骤(2)中,从所述异构图获得同构图的方法为:在所述异构图中,将具有相同信息结点的申请结点进行连接,并删除申请结点和信息结点的边,获得同构图。
8.根据权利要求1所述的面向手机租赁业务的智能金融风险控制方法,其特征在于,步骤(3)中,所述深度因子分解机模型包括特征输入层、嵌入层、因子分解机、深度神经网络以及输出层;
所述嵌入层将输入层输入的原始特征变为低维密集特征;
所述因子分解机显式地进行低维密集特征间的两两交互,从而学习低阶交互特征,并将原始特征与低阶交互特征合并;
深度神经网络隐式地学习低维密集特征得到高阶交互特征;
将因子分解机的输出和深度神经网络的输出合并输出到输出层。
9.一种面向手机租赁业务的智能金融风险控制系统,其特征在于,包括:
数据处理模块,对申请订单的数据进行数据清洗和特征工程,得到申请订单的基本特征和图模型构建数据;所述的申请订单包括未知标签的新订单和已知标签的历史订单;
订单识别模块,采用历史订单的图模型构建数据构建异构图,将新订单的图模型构建数据放入所述异构图中,并抽取所述新订单的图特征;从所述异构图获得同构图,并采用深度游走获得所述新订单的图嵌入特征;
欺诈预警模块,存储有训练好的深度因子分解机模型,将所述新订单的基本特征、图特征和图嵌入特征输入到训练好的深度因子分解机模型进行检测,若输出标签为欺诈,则发出警报。
10.根据权利要求9所述的面向手机租赁业务的智能金融风险控制系统,其特征在于,所述的订单识别模块中包含:
异构图构建单元,对历史订单的各个属性进行同质性检测,判断其能否构建异构图;通过同质性检测后,利用各个历史订单之间的关系构建异构图;
图特征抽取单元,将新订单的图模型构建数据放入所述异构图中,采用局部和全局的统计特征抽取新订单的图特征;
同构图构建单元,将新订单的图模型构建数据放入所述异构图中后,将具有相同信息结点的申请结点进行连接,并删除申请结点和信息结点的边,获得同构图;
图嵌入特征获取单元,采用深度游走算法从同构图中获得新订单的图嵌入特征。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811416102.6A CN109472626B (zh) | 2018-11-26 | 2018-11-26 | 一种面向手机租赁业务的智能金融风险控制方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811416102.6A CN109472626B (zh) | 2018-11-26 | 2018-11-26 | 一种面向手机租赁业务的智能金融风险控制方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109472626A true CN109472626A (zh) | 2019-03-15 |
CN109472626B CN109472626B (zh) | 2020-08-18 |
Family
ID=65673376
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811416102.6A Active CN109472626B (zh) | 2018-11-26 | 2018-11-26 | 一种面向手机租赁业务的智能金融风险控制方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109472626B (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110189167A (zh) * | 2019-05-20 | 2019-08-30 | 华南理工大学 | 一种基于异构图嵌入的移动广告欺诈检测方法 |
CN110209825A (zh) * | 2019-06-17 | 2019-09-06 | 大连海事大学 | 一种基于宽度学习系统的快速网络表征学习算法 |
CN111325258A (zh) * | 2020-02-14 | 2020-06-23 | 腾讯科技(深圳)有限公司 | 特征信息获取方法、装置、设备及存储介质 |
CN111368147A (zh) * | 2020-02-25 | 2020-07-03 | 支付宝(杭州)信息技术有限公司 | 图特征处理的方法及装置 |
CN111861178A (zh) * | 2020-07-13 | 2020-10-30 | 北京嘀嘀无限科技发展有限公司 | 服务匹配模型的训练方法、服务匹配方法、设备及介质 |
CN112529621A (zh) * | 2020-12-10 | 2021-03-19 | 中山大学 | 一种基于异构图嵌入技术的广告受众基础属性预估方法 |
CN111861178B (zh) * | 2020-07-13 | 2024-06-07 | 北京嘀嘀无限科技发展有限公司 | 服务匹配模型的训练方法、服务匹配方法、设备及介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020147677A1 (en) * | 2001-03-26 | 2002-10-10 | Shaun Brady | Method and system for property rental tenant approval, line of credit based rental payment, and deposit and rental payment insurance |
US20090327132A1 (en) * | 2008-06-27 | 2009-12-31 | Vesselin Diev | Incremental factorization-based smoothing of sparse multi-dimensional risk tables |
CN102567788A (zh) * | 2010-12-28 | 2012-07-11 | 中国移动通信集团重庆有限公司 | 一种通信业务欺诈行为的实时识别系统和方法 |
CN103279868A (zh) * | 2013-05-22 | 2013-09-04 | 兰亭集势有限公司 | 一种自动识别欺诈订单的方法和装置 |
WO2016115525A1 (en) * | 2015-01-15 | 2016-07-21 | Bigrentz Inc. | Enterprise resource management |
CN106056442A (zh) * | 2016-08-22 | 2016-10-26 | 优品汽车服务(上海)有限公司 | 汽车库存融资风险控制管理系统及方法 |
CN108475393A (zh) * | 2016-01-27 | 2018-08-31 | 华为技术有限公司 | 通过合成特征和梯度提升决策树进行预测的系统和方法 |
-
2018
- 2018-11-26 CN CN201811416102.6A patent/CN109472626B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020147677A1 (en) * | 2001-03-26 | 2002-10-10 | Shaun Brady | Method and system for property rental tenant approval, line of credit based rental payment, and deposit and rental payment insurance |
US20090327132A1 (en) * | 2008-06-27 | 2009-12-31 | Vesselin Diev | Incremental factorization-based smoothing of sparse multi-dimensional risk tables |
CN102567788A (zh) * | 2010-12-28 | 2012-07-11 | 中国移动通信集团重庆有限公司 | 一种通信业务欺诈行为的实时识别系统和方法 |
CN103279868A (zh) * | 2013-05-22 | 2013-09-04 | 兰亭集势有限公司 | 一种自动识别欺诈订单的方法和装置 |
WO2016115525A1 (en) * | 2015-01-15 | 2016-07-21 | Bigrentz Inc. | Enterprise resource management |
CN108475393A (zh) * | 2016-01-27 | 2018-08-31 | 华为技术有限公司 | 通过合成特征和梯度提升决策树进行预测的系统和方法 |
CN106056442A (zh) * | 2016-08-22 | 2016-10-26 | 优品汽车服务(上海)有限公司 | 汽车库存融资风险控制管理系统及方法 |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110189167A (zh) * | 2019-05-20 | 2019-08-30 | 华南理工大学 | 一种基于异构图嵌入的移动广告欺诈检测方法 |
CN110209825A (zh) * | 2019-06-17 | 2019-09-06 | 大连海事大学 | 一种基于宽度学习系统的快速网络表征学习算法 |
CN111325258A (zh) * | 2020-02-14 | 2020-06-23 | 腾讯科技(深圳)有限公司 | 特征信息获取方法、装置、设备及存储介质 |
CN111325258B (zh) * | 2020-02-14 | 2023-10-24 | 腾讯科技(深圳)有限公司 | 特征信息获取方法、装置、设备及存储介质 |
CN111368147A (zh) * | 2020-02-25 | 2020-07-03 | 支付宝(杭州)信息技术有限公司 | 图特征处理的方法及装置 |
CN111368147B (zh) * | 2020-02-25 | 2021-07-06 | 支付宝(杭州)信息技术有限公司 | 图特征处理的方法及装置 |
CN111861178A (zh) * | 2020-07-13 | 2020-10-30 | 北京嘀嘀无限科技发展有限公司 | 服务匹配模型的训练方法、服务匹配方法、设备及介质 |
CN111861178B (zh) * | 2020-07-13 | 2024-06-07 | 北京嘀嘀无限科技发展有限公司 | 服务匹配模型的训练方法、服务匹配方法、设备及介质 |
CN112529621A (zh) * | 2020-12-10 | 2021-03-19 | 中山大学 | 一种基于异构图嵌入技术的广告受众基础属性预估方法 |
Also Published As
Publication number | Publication date |
---|---|
CN109472626B (zh) | 2020-08-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109472626A (zh) | 一种面向手机租赁业务的智能金融风险控制方法及系统 | |
CN109636061A (zh) | 医保欺诈预测网络的训练方法、装置、设备及存储介质 | |
CN103646110B (zh) | 自然人基本身份信息匹配方法 | |
CN109300029A (zh) | 借贷欺诈检测模型训练方法、借贷欺诈检测方法及装置 | |
TW201944305A (zh) | 確定業務請求事件的風險機率的方法及裝置 | |
CN109299258A (zh) | 一种舆情事件检测方法、装置及设备 | |
CN109002492B (zh) | 一种基于LightGBM的绩点预测方法 | |
CN109739995B (zh) | 一种信息处理方法及装置 | |
Iban | An explainable model for the mass appraisal of residences: The application of tree-based Machine Learning algorithms and interpretation of value determinants | |
CN110490685A (zh) | 一种基于大数据分析的产品推荐方法 | |
CN108345587A (zh) | 一种评论的真实性检测方法与系统 | |
CN106529110A (zh) | 一种用户数据分类的方法和设备 | |
CN108182260A (zh) | 一种基于语义选择的多变量时间序列分类方法 | |
CN110110754A (zh) | 基于代价局部泛化误差的不平衡问题的分类方法 | |
CN107633293A (zh) | 一种领域自适应方法及装置 | |
CN110321436A (zh) | 一种基于社交注意力机制表示学习的冷启动欺诈评论检测方法 | |
CN109635260A (zh) | 用于生成文章模板的方法、装置、设备和存储介质 | |
CN115909443A (zh) | 基于多头注意力机制的表情识别模型及其训练方法 | |
CN106875595A (zh) | 一种pos终端使用地点的确定方法及装置 | |
CN117291184B (zh) | 大语言模型的评估方法及装置、存储介质、计算机设备 | |
CN106980639A (zh) | 短文本数据聚合系统及方法 | |
CN112529415A (zh) | 基于组合多感受野图神经网络的物品评分方法 | |
CN110619564B (zh) | 一种反欺诈特征生成方法和装置 | |
Yudantara et al. | Determinants of Implementation SIAPIK for Small Medium Enterprise | |
Hooghe et al. | Technical report for the social cohesion survey Flanders 2009 (SCIF 2009) |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |