CN111652713A - 权益风控建模方法和装置 - Google Patents
权益风控建模方法和装置 Download PDFInfo
- Publication number
- CN111652713A CN111652713A CN202010618802.4A CN202010618802A CN111652713A CN 111652713 A CN111652713 A CN 111652713A CN 202010618802 A CN202010618802 A CN 202010618802A CN 111652713 A CN111652713 A CN 111652713A
- Authority
- CN
- China
- Prior art keywords
- data
- wind control
- feature vector
- classification model
- determining
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 59
- 239000013598 vector Substances 0.000 claims abstract description 159
- 238000013145 classification model Methods 0.000 claims abstract description 60
- 238000012549 training Methods 0.000 claims abstract description 50
- 238000011156 evaluation Methods 0.000 claims abstract description 36
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 29
- 238000012545 processing Methods 0.000 claims abstract description 17
- 230000008569 process Effects 0.000 claims abstract description 14
- 238000012706 support-vector machine Methods 0.000 claims description 65
- 230000006399 behavior Effects 0.000 claims description 17
- 238000004590 computer program Methods 0.000 claims description 16
- 210000002268 wool Anatomy 0.000 claims description 13
- 230000000694 effects Effects 0.000 claims description 9
- 238000003860 storage Methods 0.000 claims description 8
- 238000004140 cleaning Methods 0.000 claims description 6
- 238000006243 chemical reaction Methods 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 16
- 230000006870 function Effects 0.000 description 10
- 238000004364 calculation method Methods 0.000 description 6
- 238000005457 optimization Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000012937 correction Methods 0.000 description 3
- 230000007774 longterm Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000009795 derivation Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 238000003306 harvesting Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 238000012502 risk assessment Methods 0.000 description 1
- 101150049349 setA gene Proteins 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/03—Credit; Loans; Processing thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Economics (AREA)
- General Business, Economics & Management (AREA)
- Technology Law (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- Development Economics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供了一种权益风控建模方法和装置,该方法包括:获取历史数据信息和特征向量数据;所述特征向量数据随时间进行更新;对历史数据信息进行处理,确定特征向量;利用线性SVM算法对特征向量训练,确定SVM分类模型和支持向量集;利用SVM分类模型评估特征向量数据,确定风控评估准确率;在风控评估准确率低于设定阈值时,根据设定时间间隔对特征向量数据加权,将加权后的特征向量数据和支持向量集作为训练样本,输入到SVM分类模型进行迭代训练,直至风控评估准确率达到设定阈值时停止迭代,确定权益风控模型。在迭代更新的过程中根据设定时间间隔对特征向量数据加权,实现对SVM分类模型更新校正,有效提高权益风控模型的准确率。
Description
技术领域
本发明涉及数据建模技术领域,尤其涉及一种权益风控建模方法和装置。
背景技术
本部分旨在为权利要求书中陈述的本发明的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
随着金融行业的发展,客户权益(如优惠券、兑换券等)在银行企业获客和增加客户粘性等方面具有重要意义。然而,银行企业在开展此类营销活动的同时,也必须对活动的风险进行防范,避免活动的利益被大量的“羊毛党”获取,而失去营销活动原本的意义。
对于这类风险的智能防范,现有的方案是利用收集的海量样本数据,利用传统模式识别方法训练模型,并利用模型识别每次营销活动中薅羊毛的风险。具体而言,会利用历史数据来做训练样本,把已知薅羊毛的特征数据和已知正常行为的特征数据标记为两类标签,然后把这些特征数据及对应的标签作为样本输入,通过贝叶斯、逻辑回归等模式识别算法训练出风控模型,并根据模型对用户请求的特征数据进行识别,以此作为识别薅羊毛行为的风险评估辅助手段。
然而,如今羊毛党的手段五花八门、层出不穷,如不断的变化网络IP、收获地址等,过去营销活动积累的数据价值性越来越小,影响模型的准确度。如果单纯的利用新样本加入到训练样本中训练模型,则凸显不出新样本数据更高的价值性,过多的样本数据也会让算法计算的复杂度更高。
因此,如何提供一种新的方案,其能够解决上述技术问题是本领域亟待解决的技术难题。
发明内容
本发明实施例提供一种权益风控建模方法,提高了权益风控模型的准确率,该方法包括:
获取历史数据信息和特征向量数据;所述特征向量数据随时间进行更新;
对历史数据信息进行处理,确定特征向量;
利用线性SVM算法对特征向量训练,确定SVM分类模型和支持向量集;
利用SVM分类模型评估特征向量数据,确定风控评估准确率;
在风控评估准确率低于设定阈值时,根据设定时间间隔对特征向量数据加权,将加权后的特征向量数据和支持向量集作为训练样本,输入到SVM分类模型进行迭代训练,直至风控评估准确率达到设定阈值时停止迭代,确定权益风控模型。
本发明实施例还提供一种权益风控建模装置,包括:
数据获取模块,用于获取历史数据信息和特征向量数据;所述特征向量数据随时间进行更新;
特征向量确定模块,用于对历史数据信息进行处理,确定特征向量;
SVM分类模型和支持向量集确定模块,用于利用线性SVM算法对特征向量训练,确定SVM分类模型和支持向量集;
风控评估准确率确定模块,用于利用SVM分类模型评估特征向量数据,确定风控评估准确率;
权益风控模型确定模块,用于在风控评估准确率低于设定阈值时,根据设定时间间隔对特征向量数据加权,将加权后的特征向量数据和支持向量集作为训练样本,输入到SVM分类模型进行迭代训练,直至风控评估准确率达到设定阈值时停止迭代,确定权益风控模型。
本发明实施例还提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述权益风控建模方法。
本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有执行实现上述权益风控建模方法的计算机程序。
本发明实施例提供的一种权益风控建模方法和装置,首先获取历史数据信息和特征向量数据,其中,特征向量数据是随着时间持续更新的;然后对历史数据信息进行处理,确定特征向量;接着利用线性SVM算法对特征向量训练,确定SVM分类模型和支持向量集,下一步利用SVM分类模型评估特征向量数据,确定风控评估准确率;最后在风控评估准确率低于设定阈值时,根据设定时间间隔对特征向量数据加权,将加权后的特征向量数据和支持向量集作为训练样本,输入到SVM分类模型进行迭代训练,直至风控评估准确率达到设定阈值时停止迭代,确定权益风控模型。本发明实施例使用历史数据信息建立SVM分类模型,同时考虑到随时间不断更新的特征向量数据对SVM分类模型的价值度,在迭代更新的过程中根据设定时间间隔对特征向量数据加权,实现对SVM分类模型的更新校正,实现对风控模型的不断优化,可以有效提高权益风控模型的准确率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1为本发明实施例一种权益风控建模方法示意图。
图2为本发明实施例一种权益风控建模方法流程图。
图3为本发明实施例一种权益风控建模方法的线性SVM算法分类决策函数示意图。
图4为运行本发明实施的一种权益风控建模方法的计算机装置示意图。
图5为本发明实施例一种权益风控建模装置示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚明白,下面结合附图对本发明实施例做进一步详细说明。在此,本发明的示意性实施例及其说明用于解释本发明,但并不作为对本发明的限定。
在本发明实施例中,涉及的专业名词解释如下:
标签:根据一次用户请求所对应的特征数据(如ip地址、手机号等)进行分类识别后对应的标签。将被识别为薅羊毛行为的特征数据标记为正标签(+1);相反,被识别为正常行为的特征数据标记为负标签(-1)。
支持向量机(Support Vector Machine,SVM):是建立在风险最小及统计学理论的VC维理论基础上的,利用有限的样本数据在模型复杂性(对所有参与训练样本数据的学习精度)及学习能力(即准确识别出样本数据的能力)之间的一个最佳折中,已得到最大的推广能力;
支持向量(Support Vector,SV):能够正确分类训练集的特征向量。
图1为本发明实施例一种权益风控建模方法示意图,如图1所示,本发明实施例提供一种权益风控建模方法,提高了权益风控模型的准确率,该方法包括:
步骤101:获取历史数据信息和特征向量数据;所述特征向量数据随时间进行更新;
步骤102:对历史数据信息进行处理,确定特征向量;
步骤103:利用线性SVM算法对特征向量训练,确定SVM分类模型和支持向量集;
步骤104:利用SVM分类模型评估特征向量数据,确定风控评估准确率;
步骤105:在风控评估准确率低于设定阈值时,根据设定时间间隔对特征向量数据加权,将加权后的特征向量数据和支持向量集作为训练样本,输入到SVM分类模型进行迭代训练,直至风控评估准确率达到设定阈值时停止迭代,确定权益风控模型。
本发明实施例提供的一种权益风控建模方法,首先获取历史数据信息和特征向量数据,其中,特征向量数据是随着时间持续更新的;然后对历史数据信息进行处理,确定特征向量;接着利用线性SVM算法对特征向量训练,确定SVM分类模型和支持向量集,下一步利用SVM分类模型评估特征向量数据,确定风控评估准确率;最后在风控评估准确率低于设定阈值时,根据设定时间间隔对特征向量数据加权,将加权后的特征向量数据和支持向量集作为训练样本,输入到SVM分类模型进行迭代训练,直至风控评估准确率达到设定阈值时停止迭代,确定权益风控模型。本发明实施例使用历史数据信息建立SVM分类模型,同时考虑到随时间不断更新的特征向量数据对SVM分类模型的价值度,在迭代更新的过程中根据设定时间间隔对特征向量数据加权,实现对SVM分类模型的更新校正,实现对风控模型的不断优化,可以有效提高权益风控模型的准确率。
本发明实施例的一种权益风控建模方法,实施例中可以包括:
获取历史数据信息和特征向量数据;所述特征向量数据随时间进行更新;对历史数据信息进行处理,确定特征向量;利用线性SVM算法对特征向量训练,确定SVM分类模型和支持向量集;利用SVM分类模型评估特征向量数据,确定风控评估准确率;在风控评估准确率低于设定阈值时,根据设定时间间隔对特征向量数据加权,将加权后的特征向量数据和支持向量集作为训练样本,输入到SVM分类模型进行迭代训练,直至风控评估准确率达到设定阈值时停止迭代,确定权益风控模型。
具体实施本发明实施例提供的一种权益风控建模方法时,一个实施例中,获取历史数据信息,包括:从数据库中获取历史权益活动过程中产生的历史数据信息;其中,所述历史数据信息包括:已识别的薅羊毛行为数据和已识别的正常获取权益行为数据。
实施例中,针对手机银行推出的营销活动,采集多个系统(平台)在营销活动过程中产生的数据信息(客户信息、登录信息、订单信息、交易信息、产品信息),其中包括薅羊毛样本数据及正常样本数据。把已知薅羊毛的特征数据和已知正常行为的特征数据标记为两类标签,例如薅羊毛的行为数据标记为正标签(+1),相反正常行为数据标记为负标签(-1)。
具体实施本发明实施例提供的一种权益风控建模方法时,一个实施例中,对历史数据信息进行处理,确定特征向量,包括:
对历史数据信息进行数据清洗转换加载,抽取出多维数据;
对多维数据中的每一维数据转化为均值为0、方差为1的值,确定特征向量。
实施例中,对历史数据信息进行数据清洗转换加载,抽取出多维数据;所述多维数据包括:设备IP、交易频率、交易时间、同一IP账户数、身份证、姓名等多维数据;对每一维数据转化为均值为0,方差为1的值,得到特征向量。
具体实施本发明实施例提供的一种权益风控建模方法时,一个实施例中,利用线性SVM算法对特征向量训练,确定SVM分类模型和支持向量集,包括:
利用线性SVM算法对特征向量进行划分,确定超平面;所述超平面为特征向量中所有数据到超平面的距离最大的平面;
实施例中,利用线性SVM算法,找到空间中一个能够将所有样本数据划分的超平面,使得所有数据到这个超平面距离最大,对提取到特征向量进行训练,得到支持向量集,并找到一个最优的决策边界,即SVM分类模型。
利用超平面对特征向量进行训练,获得SVM分类模型和支持向量集。
具体实施本发明实施例提供的一种权益风控建模方法时,一个实施例中,所述支持向量机在每次迭代更新时,剔除不影响SVM分类模型的样本数据。
支持向量机算法其主要思想是通过找到空间中一个能够将所有样本数据划分的超平面,使得所有数据到这个超平面距离最大。该问题是为了解决凸二次规划问题,如下:
0≤αi≤C i=1,…,l
其中,如图3本发明实施例一种权益风控建模方法的线性SVM算法分类决策函数示意图所示,在线性情况时的分类决策函数为:
0≤αi≤C i=1,…,l
通过上述推导,可以得出非线性情况分类决策函数为:
一般情况下,支持向量集只占所有样本的小部分,但是包含了所有样本数据的分类信息。利用这一点,在每次更新模型的时候,可剔除不影响模型的样本数据,即非支持向量集。如图3所示,在虚线w·x+b=1上的灰色圆点和在虚线w·x+b=-1上的灰色圆圈为支持向量集,其他剩余的黑色圆点和黑色圆圈为非支持向量集。因此,每次训练模型的训练样本减少,算法计算的复杂度降低。另一方面,根据实际的应用场景,可知越新的样本数据,具有较高的研究价值,对样本数据进行有效的加权重,在一定程度上提高模型的准确率和闭合速度。
前述提到的分类决策函数的表达式为举例说明,本领域技术人员可以理解,在实施时还可以根据需要对上述公式进行一定形式的变形和添加其它的参数或数据,或者提供其它的具体公式,这些变化例均应落入本发明的保护范围。
图2为本发明实施例一种权益风控建模方法流程图,如图2所示,本发明实施例还提供一种应用一种权益风控建模方法的实例,具体包括:
步骤1、令t=0,采集多个系统(平台)中的历史数据信息(客户信息、登录信息、订单信息、交易信息、产品信息),其中包括有已识别为薅羊毛行为的数据(正标签),及正常行为产生的数据(负标签);
步骤2、对步骤1中的数据进行数据清洗转换加载,抽取出设备IP、交易频率、交易时间、同一IP账户数、身份证、姓名等多维数据,且对每一维数据转化为均值为0,方差为1的值,得到特征向量A^t;
步骤4、根据步骤3的风控模型评估在线客户请求的特征向量数据Bt,如果评估出的准确率达到预设阈值,则停止更新模型,得到风控模型Tt,否则转步骤5;
上述本发明实施例一种权益风控建模方法,在迭代更新过程中,为了适应业务场景,通过特征数据加权的手段,来赋予样本数据不同的研究价值;在迭代更新过程中,为了解决训练样本越来越多影响算法计算的复杂度,通过剔除不影响模型分类的样本数据的手段,来降低算法计算的复杂度。本发明提出的一种基于增量支持向量机的银行客户权益风控建模的方法,在一定程度上解决了上述问题,根据时间间隔,对每个样本数据特别处理,数据越新权值越大,越能影响分类模型,并剔除部分数据,只取占所有样本数据部分的支持向量集,不断去迭代优化模型,从而,在一定的训练效率下,保证模型长期适用性。
图4为运行本发明实施的一种权益风控建模方法的计算机装置示意图。如图4所示,本发明实施例还提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述权益风控建模方法。
本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有执行实现上述权益风控建模方法的计算机程序。
本发明实施例中还提供了一种权益风控建模装置,如下面的实施例所述。由于该装置解决问题的原理与一种权益风控建模方法相似,因此该装置的实施可以参见一种权益风控建模方法的实施,重复之处不再赘述。
图5为本发明实施例一种权益风控建模装置示意图。如图5所示,本发明实施例还提供一种权益风控建模装置,可以包括:
数据获取模块501,用于获取历史数据信息和特征向量数据;所述特征向量数据随时间进行更新;
特征向量确定模块502,用于对历史数据信息进行处理,确定特征向量;
SVM分类模型和支持向量集确定模块503,用于利用线性SVM算法对特征向量训练,确定SVM分类模型和支持向量集;
风控评估准确率确定模块504,用于利用SVM分类模型评估特征向量数据,确定风控评估准确率;
权益风控模型确定模块505,用于在风控评估准确率低于设定阈值时,根据设定时间间隔对特征向量数据加权,将加权后的特征向量数据和支持向量集作为训练样本,输入到SVM分类模型进行迭代训练,直至风控评估准确率达到设定阈值时停止迭代,确定权益风控模型。
具体实施本发明实施例提供的一种权益风控建模装置时,一个实施例中,数据获取模块,具体用于:从数据库中获取历史权益活动过程中产生的历史数据信息;其中,所述历史数据信息包括:已识别的薅羊毛行为数据和已识别的正常获取权益行为数据。
具体实施本发明实施例提供的一种权益风控建模装置时,一个实施例中,特征向量确定模块,具体用于:
对历史数据信息进行数据清洗转换加载,抽取出多维数据;
对多维数据中的每一维数据转化为均值为0、方差为1的值,确定特征向量。
具体实施本发明实施例提供的一种权益风控建模装置时,一个实施例中,SVM分类模型和支持向量集确定模块,具体用于:
利用线性SVM算法对特征向量进行划分,确定超平面;所述超平面为特征向量中所有数据到超平面的距离最大的平面;
利用超平面对特征向量进行训练,获得SVM分类模型和支持向量集。
具体实施本发明实施例提供的一种权益风控建模装置时,一个实施例中,所述支持向量机在每次迭代更新时,剔除不影响SVM分类模型的样本数据。
综上,本发明实施例提供的一种权益风控建模方法和装置,首先获取历史数据信息和特征向量数据,其中,特征向量数据是随着时间持续更新的;然后对历史数据信息进行处理,确定特征向量;接着利用线性SVM算法对特征向量训练,确定SVM分类模型和支持向量集,下一步利用SVM分类模型评估特征向量数据,确定风控评估准确率;最后在风控评估准确率低于设定阈值时,根据设定时间间隔对特征向量数据加权,将加权后的特征向量数据和支持向量集作为训练样本,输入到SVM分类模型进行迭代训练,直至风控评估准确率达到设定阈值时停止迭代,确定权益风控模型。本发明实施例使用历史数据信息建立SVM分类模型,同时考虑到随时间不断更新的特征向量数据对SVM分类模型的价值度,在迭代更新的过程中根据设定时间间隔对特征向量数据加权,实现对SVM分类模型的更新校正,实现对风控模型的不断优化,可以有效提高权益风控模型的准确率。在迭代更新过程中,为了解决训练样本越来越多影响算法计算的复杂度,通过剔除不影响模型分类的样本数据的手段,只取占所有样本数据部分的支持向量集,来降低算法计算的复杂度,从而,在一定的训练效率下,保证模型长期适用性。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (12)
1.一种权益风控建模方法,其特征在于,包括:
获取历史数据信息和特征向量数据;所述特征向量数据随时间进行更新;
对历史数据信息进行处理,确定特征向量;
利用线性SVM算法对特征向量训练,确定SVM分类模型和支持向量集;
利用SVM分类模型评估特征向量数据,确定风控评估准确率;
在风控评估准确率低于设定阈值时,根据设定时间间隔对特征向量数据加权,将加权后的特征向量数据和支持向量集作为训练样本,输入到SVM分类模型进行迭代训练,直至风控评估准确率达到设定阈值时停止迭代,确定权益风控模型。
2.如权利要求1所述的方法,其特征在于,获取历史数据信息,包括:从数据库中获取历史权益活动过程中产生的历史数据信息;其中,所述历史数据信息包括:已识别的薅羊毛行为数据和已识别的正常获取权益行为数据。
3.如权利要求1所述的方法,其特征在于,对历史数据信息进行处理,确定特征向量,包括:
对历史数据信息进行数据清洗转换加载,抽取出多维数据;
对多维数据中的每一维数据转化为均值为0、方差为1的值,确定特征向量。
4.如权利要求1所述的方法,其特征在于,利用线性SVM算法对特征向量训练,确定SVM分类模型和支持向量集,包括:
利用线性SVM算法对特征向量进行划分,确定超平面;所述超平面为特征向量中所有数据到超平面的距离最大的平面;
利用超平面对特征向量进行训练,获得SVM分类模型和支持向量集。
5.如权利要求4所述的方法,其特征在于,所述支持向量机在每次迭代更新时,剔除不影响SVM分类模型的样本数据。
6.一种权益风控建模装置,其特征在于,包括:
数据获取模块,用于获取历史数据信息和特征向量数据;所述特征向量数据随时间进行更新;
特征向量确定模块,用于对历史数据信息进行处理,确定特征向量;
SVM分类模型和支持向量集确定模块,用于利用线性SVM算法对特征向量训练,确定SVM分类模型和支持向量集;
风控评估准确率确定模块,用于利用SVM分类模型评估特征向量数据,确定风控评估准确率;
权益风控模型确定模块,用于在风控评估准确率低于设定阈值时,根据设定时间间隔对特征向量数据加权,将加权后的特征向量数据和支持向量集作为训练样本,输入到SVM分类模型进行迭代训练,直至风控评估准确率达到设定阈值时停止迭代,确定权益风控模型。
7.如权利要求6所述的装置,其特征在于,数据获取模块,具体用于:从数据库中获取历史权益活动过程中产生的历史数据信息;其中,所述历史数据信息包括:已识别的薅羊毛行为数据和已识别的正常获取权益行为数据。
8.如权利要求6所述的装置,其特征在于,特征向量确定模块,具体用于:
对历史数据信息进行数据清洗转换加载,抽取出多维数据;
对多维数据中的每一维数据转化为均值为0、方差为1的值,确定特征向量。
9.如权利要求6所述的装置,其特征在于,SVM分类模型和支持向量集确定模块,具体用于:
利用线性SVM算法对特征向量进行划分,确定超平面;所述超平面为特征向量中所有数据到超平面的距离最大的平面;
利用超平面对特征向量进行训练,获得SVM分类模型和支持向量集。
10.如权利要求9所述的装置,其特征在于,所述支持向量机在每次迭代更新时,剔除不影响SVM分类模型的样本数据。
11.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现权利要求1至5任一项所述权益风控建模方法。
12.一种计算机可读存储介质,所述计算机可读存储介质存储有执行实现权利要求1至5任一项所述权益风控建模方法的计算机程序。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010618802.4A CN111652713B (zh) | 2020-07-01 | 2020-07-01 | 权益风控建模方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010618802.4A CN111652713B (zh) | 2020-07-01 | 2020-07-01 | 权益风控建模方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111652713A true CN111652713A (zh) | 2020-09-11 |
CN111652713B CN111652713B (zh) | 2024-02-27 |
Family
ID=72345242
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010618802.4A Active CN111652713B (zh) | 2020-07-01 | 2020-07-01 | 权益风控建模方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111652713B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112686702A (zh) * | 2020-12-31 | 2021-04-20 | 平安消费金融有限公司 | 羊毛党识别方法、装置、计算机设备及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106779755A (zh) * | 2016-12-31 | 2017-05-31 | 湖南文沥征信数据服务有限公司 | 一种网络电商借贷风险评估方法及模型 |
WO2019080407A1 (zh) * | 2017-10-25 | 2019-05-02 | 深圳壹账通智能科技有限公司 | 信贷评估方法、装置、设备及计算机可读存储介质 |
CN109766912A (zh) * | 2018-12-07 | 2019-05-17 | 国电南瑞科技股份有限公司 | 一种基于卡尔曼滤波与支持向量机的输电线路覆冰评估方法和系统 |
CN110147823A (zh) * | 2019-04-16 | 2019-08-20 | 阿里巴巴集团控股有限公司 | 一种风控模型训练方法、装置及设备 |
WO2019232862A1 (zh) * | 2018-06-06 | 2019-12-12 | 平安科技(深圳)有限公司 | 嘴巴模型训练方法、嘴巴识别方法、装置、设备及介质 |
-
2020
- 2020-07-01 CN CN202010618802.4A patent/CN111652713B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106779755A (zh) * | 2016-12-31 | 2017-05-31 | 湖南文沥征信数据服务有限公司 | 一种网络电商借贷风险评估方法及模型 |
WO2019080407A1 (zh) * | 2017-10-25 | 2019-05-02 | 深圳壹账通智能科技有限公司 | 信贷评估方法、装置、设备及计算机可读存储介质 |
WO2019232862A1 (zh) * | 2018-06-06 | 2019-12-12 | 平安科技(深圳)有限公司 | 嘴巴模型训练方法、嘴巴识别方法、装置、设备及介质 |
CN109766912A (zh) * | 2018-12-07 | 2019-05-17 | 国电南瑞科技股份有限公司 | 一种基于卡尔曼滤波与支持向量机的输电线路覆冰评估方法和系统 |
CN110147823A (zh) * | 2019-04-16 | 2019-08-20 | 阿里巴巴集团控股有限公司 | 一种风控模型训练方法、装置及设备 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112686702A (zh) * | 2020-12-31 | 2021-04-20 | 平安消费金融有限公司 | 羊毛党识别方法、装置、计算机设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN111652713B (zh) | 2024-02-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108537168B (zh) | 基于迁移学习技术的面部表情识别方法 | |
CN110111113B (zh) | 一种异常交易节点的检测方法及装置 | |
JP6897749B2 (ja) | 学習方法、学習システム、および学習プログラム | |
CN114612743A (zh) | 深度学习模型的训练方法、目标对象识别方法和装置 | |
CN112883990A (zh) | 数据分类方法及装置、计算机存储介质、电子设备 | |
CN113240506A (zh) | 一种基于无监督领域自适应的金融风控冷启动建模方法 | |
CN113919497A (zh) | 针对连续学习能力系统的基于特征操纵的攻击和防御方法 | |
Wang et al. | Towards calibrated hyper-sphere representation via distribution overlap coefficient for long-tailed learning | |
Tan et al. | Data pruning via moving-one-sample-out | |
CN115063664A (zh) | 用于工业视觉检测的模型学习方法、训练方法及系统 | |
CN112950347B (zh) | 资源数据处理的优化方法及装置、存储介质、终端 | |
CN111652713A (zh) | 权益风控建模方法和装置 | |
CN114255381A (zh) | 图像识别模型的训练方法、图像识别方法、装置及介质 | |
CN117671704A (zh) | 一种手写体数字识别方法、装置及计算机存储介质 | |
CN113298264A (zh) | 基于浅层自学习算法拒绝推断的设备认证方法及系统、电子设备 | |
Zhang et al. | A Face Detection Method Based on Image Processing and Improved Adaptive Boosting Algorithm. | |
CN116342906A (zh) | 一种跨域小样本图像识别方法及系统 | |
KR102244705B1 (ko) | 학습데이터 생성을 위한 크라우드소싱 기반 유사 프로젝트의 작업 단가 역전 조정을 통한 작업자 유입 조절 방법 | |
CN110688880A (zh) | 一种基于精简ResNet残差网络的车牌识别方法 | |
CN112200488A (zh) | 针对业务对象的风险识别模型训练方法及装置 | |
CN112396507A (zh) | 基于阴影划分的集成svm个人信用评估方法 | |
Mullen et al. | Artificial ants to extract leaf outlines and primary venation patterns | |
Nitta et al. | Detecting Data Drift with KS Test Using Attention Map | |
CN115936832A (zh) | 信用风险评估方法及装置 | |
Hu et al. | An Improved Online Multiclass Classification Algorithm Based on Confidence-Weighted |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |