CN112163642A - 一种风控规则获取方法、装置、介质及设备 - Google Patents

一种风控规则获取方法、装置、介质及设备 Download PDF

Info

Publication number
CN112163642A
CN112163642A CN202011193975.2A CN202011193975A CN112163642A CN 112163642 A CN112163642 A CN 112163642A CN 202011193975 A CN202011193975 A CN 202011193975A CN 112163642 A CN112163642 A CN 112163642A
Authority
CN
China
Prior art keywords
sample set
wind control
decision tree
control rule
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011193975.2A
Other languages
English (en)
Inventor
姚尧
俞晓臣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Yuncong Technology Co ltd
Original Assignee
Beijing Yuncong Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Yuncong Technology Co ltd filed Critical Beijing Yuncong Technology Co ltd
Priority to CN202011193975.2A priority Critical patent/CN112163642A/zh
Publication of CN112163642A publication Critical patent/CN112163642A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Business, Economics & Management (AREA)
  • Software Systems (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Development Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • General Business, Economics & Management (AREA)
  • Medical Informatics (AREA)
  • Economics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种风控规则获取方法,包括:根据业务对象的业务类型确定与业务类型相对应的原始属性数据的数据特征;基于所述数据特征与所述业务类型所关联的业务衡量指标值之间的相关度,对所述数据特征进行排序,获取排序后的样本集;基于所述样本集,生成决策树;确定决策树从根节点到每一个叶子节点的所有路径,每条路径作为一个风控规则。本发明基于回归决策树进行规则的自动挖掘,根据数据自身的特点寻找最优的分割点,进行多轮的递归,从而达到更好的效果。

Description

一种风控规则获取方法、装置、介质及设备
技术领域
本发明涉及金融领域,具体涉及一种风控规则获取方法、装置、介质及设备。
背景技术
在金融风控领域,决策一般分为两部分,一部分决策是由法律法规、个人经验设定的硬规则,不符合规则的用户予以拒绝;另一部分决策是根据机器学习模型给出的最终结果。然而在规则的制定上,很多时候会比较主观,带有一些个人的倾向,无法最大化发挥和挖掘历史数据自身的特点,也会对一些用户造成误判,不够灵活。
发明内容
鉴于以上所述现有技术的缺点,本发明的目的在于提供一种风控规则获取方法、装置、机器可读介质及设备,用于解决现有技术存在的问题。
为实现上述目的及其他相关目的,本发明提供一种风控规则获取方法,包括:
根据业务对象的业务类型确定与业务类型相对应的原始属性数据的数据特征;
基于所述数据特征与所述业务类型所关联的业务衡量指标值之间的相关度,对所述数据特征进行排序,获取排序后的样本集;
基于所述样本集,生成决策树;
确定决策树从根节点到每一个叶子节点的所有路径,每条路径作为一个风控规则。
可选地,所述业务类型包括以下至少之一:贷款业务、信用卡办理业务;所述业务衡量指标包括以下至少之一:是否具备还款能力、是否会逾期。
可选地,所述基于所述样本集,生成决策树,包括:
将所述样本集中的第一个数据特征确定为目标分裂特征,并对所述目标分裂特征执行分裂操作;
从所述样本集中删除所述目标分裂特征,得到新的样本集;
重复下述步骤,直至满足停止条件,以得到决策树;
将所述新的样本集中的第一个数据特征确定为目标分裂特征,并对所述目标分裂特征执行分裂操作;
从所述样本集中删除所述目标分裂特征,得到新的样本集。
可选地,还包括从多个风控规则中选择一个风控规则作为目标风控规则,选择目标风控规则的方法包括:
对每条路径上所有节点表示的业务衡量指标值进行求和,得到总的业务衡量指标值;
将最大的总的业务衡量指标值对应的路径作为目标风控规则。
可选地,根据所述业务类型,确定所述决策树的最大深度限制。
可选地,所述决策树模型包括回归决策树模型、分类决策树模型或多叉树模型。
可选地,还包括对所述原始属性数据进行预处理,包括:
对所述原始属性数据进行清洗;
对清洗后的原始属性数据进行缺失值填充。
为实现上述目的及其他相关目的,本发明提供一种风控规则获取装置,包括:
数据获取模块,用于根据业务对象的业务类型确定与业务类型相对应的原始属性数据的数据特征;
样本集构建模块,基于所述数据特征与所述业务类型所关联的业务衡量指标值之间的相关度,对所述数据特征进行排序,获取排序后的样本集;
决策树生成模块,用于基于所述样本集,生成决策树;
风控规则生成模块,用于确定决策树从根节点到每一个叶子节点的所有路径;其中,每条路径作为一个风控规则。
可选地,所述业务类型包括以下至少之一:贷款业务、信用卡办理业务;所述业务衡量指标包括以下至少之一:是否具备还款能力、是否会逾期。
可选地,所述决策树生成模块包括:
目标分裂特征确定模块,用于将所述样本集中的第一个数据特征确定为目标分裂特征,并对所述目标分裂特征执行分裂操作;
特征删除模块,用于从所述样本集中删除所述目标分裂特征,得到新的样本集;
决策决构建模块,用于重复下述步骤,直至满足停止条件,以得到决策树;
将所述新的样本集中的第一个数据特征确定为目标分裂特征,并对所述目标分裂特征执行分裂操作;
从所述样本集中删除所述目标分裂特征,得到新的样本集。
可选地,还包括目标风控规则选择模块,用于从多个风控规则中选择一个风控规则作为目标风控规则;所述风控规则选择模块对每条路径上所有节点表示的业务衡量指标值进行求和,得到总的业务衡量指标值;并将最大的总的业务衡量指标值对应的路径作为目标风控规则。
可选地,根据所述业务类型,确定所述决策树的最大深度限制。
可选地,所述决策树模型包括回归决策树模型、分类决策树模型或多叉树模型。
为实现上述目的及其他相关目的,本发明还提供一种设备,包括:
一个或多个处理器;和
其上存储有指令的一个或多个机器可读介质,当所述一个或多个处理器执行时,使得所述设备执行前述的一个或多个所述的方法。
为实现上述目的及其他相关目的,本发明还提供一个或多个机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得设备执行前述的一个或多个所述的方法。
如上所述,本发明提供的一种风控规则获取方法、装置、机器可读介质及设备、装置、介质及设备,具有以下有益效果:
本发明的一种风控规则获取方法,包括:根据业务对象的业务类型确定与业务类型相对应的原始属性数据的数据特征;基于所述数据特征与所述业务类型所关联的业务衡量指标值之间的相关度,对所述数据特征进行排序,获取排序后的样本集;基于所述样本集,生成决策树;确定决策树从根节点到每一个叶子节点的所有路径,每条路径作为一个风控规则。本发明基于回归决策树进行规则的自动挖掘,根据数据自身的特点寻找最优的分割点,进行多轮的递归,从而达到更好的效果。
附图说明
图1为本发明一实施例一种风控规则获取方法的流程图;
图2为本发明一实施例生成决策树的方法的流程图;
图3为本发明一实施例选择目标风控规则的方法流程图;
图4为本发明一实施例一棵决策树的结构示意图;
图5为本发明一实施例一种风控规则获取装置的结构示意图;
图6为本发明一实施例中终端设备的硬件结构示意图;
图7为本发明一实施例中终端设备的硬件结构示意图。
具体实施方式
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
需要说明的是,以下实施例中所提供的图示仅以示意方式说明本发明的基本构想,遂图式中仅显示与本发明中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。
如图1所示,一种风控规则获取方法,包括:
S11根据业务对象的业务类型确定与业务类型相对应的原始属性数据的数据特征;
S12基于所述数据特征与所述业务类型所关联的业务衡量指标值之间的相关度,对所述数据特征进行排序,获取排序后的样本集;
S13基于所述样本集,生成决策树;
S14确定决策树从根节点到每一个叶子节点的所有路径,每条路径作为一个风控规则。
本发明基于回归决策树进行规则的自动挖掘,根据数据自身的特点寻找最优的分割点,进行多轮的递归,从而达到更好的效果。在大部分数据上,可以较好的挖掘出一条高质量的路径作为风控规则,从而提高风控算法的处理效率,而且具有较强的可解释性。
在步骤S11中,所述原始属性数据的数据特征可以包括但不限于:业务对象的姓名、年龄、所在地区、职业、收入、文化程度、资产情况。
在步骤S12中,其中的业务衡量指标值是指对一个业务对象的判断。例如,所述业务类型包括贷款业务、信用卡办理业务;所述业务衡量指标包括是否具备还款能力、是否会逾期。以贷款业务为例,业务对象的业务类型是贷款,那么所述业务类型所关联的业务衡量指标值可以是是否具备还款能力。假如,业务对象的原始属性的数据特征为业务对象的姓名、年龄、所在地区、职业、收入、文化程度、资产情况。原始属性数据的数据特征与业务类型所关联的业务衡量指标值之间的相关度,相关度越大,则认为业务对象向业务衡量指标值所表达的意思越靠近。例如,“收入”这一数据特征与“是否具备还款能力”这一业务衡量指标值的相关度大于“所在地区”与“是否具备还款能力”这一业务衡量指标值的相关度;而“所在地区”与“是否具备还款能力”这一业务衡量指标值的相关度大于“性别”与“是否具备还款能力”这一业务衡量指标值的相关度;因此,根据相关度对所述数据特征进行排序(一般来说,采用从大到小的顺序排列),获取排序后的样本集。
在构建好样本集后,就可以基于所述样本集生成决策树。决策树的生成一般是从根节点开始,选择对应特征,然后选择节点对应特征的分割点,再根据分割点分裂节点。
对于离散型特征,例如,“性别”是一个离散型的特征,其有两个取值—“男、女”,那么根节点就分裂成两个子节点。对于连续型特征,则需要根据取值的分割点,来分裂子节点,例如“年龄”这一特征,可以选择25,35或45作为分割点。总而言之,决策树通过选择特征和对应分割点生成多个子节点,当某一个节点中的取值只属于某类别(或方差较小)时,那么就不再进一步分裂子节点。
在一实施例中,如图2所示,所述基于所述样本集,生成决策树,包括:
S21将所述样本集中的第一个数据特征确定为目标分裂特征,并对所述目标分裂特征执行分裂操作;
S22从所述样本集中删除所述目标分裂特征,得到新的样本集;
S23将所述新的样本集中的第一个数据特征确定为目标分裂特征,并对所述目标分裂特征执行分裂操作;
S24从所述样本集中删除所述目标分裂特征,得到新的样本集;
S25重复步骤S23、S24,直至满足停止条件,以得到决策树。
其中,所述停止条件为样本集为空,或特征的分裂次数达到设定次数。
具体地,生成决策树的方法包括:
计算样本集中各数据特征与业务衡量指标值之间的相关度,将各数据特征与业务衡量指标值之间的相关度从大到小的顺序,依次构建决策树,即,与业务衡量指标值之间的相关度越大的数据特征,其在最终生成的决策树中越邻近根节点,其中,与业务衡量指标值之间的相关度最大的数据特征为决策树的根节点。
更加具体地,生成决策树的方法包括:
确定出样本集中各数据特征与业务衡量指标值之间的关联度后,可以将该样本集中的各原始特征按照其与业务衡量指标值之间的相关度从大到小的顺序进行排序,得到排序后的样本集。这样,可以首先将该排序后的样本集中的第一个数据特征确定为目标分裂特征,并对该目标分裂特征执行分裂操作,即,将该目标分裂特征作为决策树的根节点,并对该根节点执行分裂操作,然后,从上述排序后的样本集中删除上述第一个数据特征,得到新的样本集;当该新的样本集非空时,可以将该新的样本集中的第一个数据特征确定为目标分裂特征,并对其执行分裂操作,即,将该新的目标分裂特征作为决策树第1层的分支节点,并对其执行分裂操作,然后,从上述新的样本集中删除第一个数据特征,得到新的样本集;当该新的样本集非空时,可以将该新的样本集中的第一个数据特征确定为目标分裂特征,并对其执行分裂操作,即,将该目标分裂特征作为决策树第2层的分支节点,并对其执行分裂操作,然后,从上述新的样本集中删除第一个数据特征;如此循环,直到上述样本集为空时,结束,即得到最终的决策树。
例如,构建一棵用于预测贷款用户是否具备还款能力的决策树,即业务衡量指标值为是否具备还款能力,其中,贷款用户具备三个特征:是否结婚(特征X1)、月收入是否大于4000元(特征X2)、是否拥有房产(特征X3),即样本集为(X1,X2,X3),将该样本集(X1,X2,X3)中的各特征按照其与业务衡量指标值之间的相关度从大到小的顺序进行排序后得到的样本集为(X3,X1,X2}。在构建决策树时,可以先将样本集(X3,X1,X2)中的特征X3作为根节点,并对其执行分裂操作,然后从样本集(X3,X1,X2)删除特征X3,此时,新的样本集为(X1,X2);由于当前的样本集(X1,X2)非空,可以将其中的特征X1作为决策树的第1层分枝节点,并对其执行分裂操作,然后从样本集(X1,X2)删除特征X1,此时,样本集为(X2);由于当前的样本集(X2)非空,可以将其中的特征X2作为决策树的第2层分节点,,并对其执行分裂操作,然后从样本集(X2)删除特征X2,此时,样本集为0,结束。
在生成决策树的过程中,决策树中每一条路径都可被作为风控规则,而在具体执行相应业务的时候,需要选择一个风控规则作为目标风控规则,如图3所示,选择目标风控规则的方法包括:
S31对每条路径上所有节点表示的业务衡量指标值进行求和,得到总的业务衡量指标值;
S32将最大的总的业务衡量指标值对应的路径作为目标风控规则。
采用如图4所示的决策树获得了4条路径,那么将4条路径中每个节点表示的业务衡量指标值相加,得到4个总的业务衡量指标值,比较4个总的业务衡量指标值的大小,将最大的总的业务衡量指标值所对应的路径作为目标风控规则。
在一实施例中,不同类型的业务可能需要不同的业务解释需求,因此,针对不同的业务类型,决策树模型需具有不同的最大深度限制。
在一实施例中,所述决策树包括回归决策树、分类决策树或多叉树。
在一实施例中,还包括对所述原始属性数据进行预处理,包括:
对所述原始属性数据进行清洗;
对清洗后的原始属性数据进行缺失值填充。
由于业务数据中经常出现缺失的情况,进行缺失值填充可以将便于建模的数据填充到数据缺失的区域,以堤高建模的质量。对缺失数据进行处理具体可以是将空值或者一个指定的值替换为前值、后值、最大值、最小值、均值或者一个自定义的值,将字符型的空值或空字符串替换为前值、后值、一个自定义的值;也可以采用RandomForest算法对缺失值进行填充。
本发明可以较好的挖掘出一条高质量的路径作为风控规则,从而提高风控算法的处理效率,而且具有较强的可解释性。
如图5所示,一种风控规则获取装置,包括:
数据获取模块51,用于根据业务对象的业务类型确定与业务类型相对应的原始属性数据的数据特征;
样本集构建模块52,基于所述数据特征与所述业务类型所关联的业务衡量指标值之间的相关度,对所述数据特征进行排序,获取排序后的样本集;
决策树生成模块53,用于基于所述样本集,生成决策树;
风控规则生成模块54,用于确定决策树从根节点到每一个叶子节点的所有路径;其中,每条路径作为一个风控规则。
在一实施例中,所述业务类型包括以下至少之一:贷款业务、信用卡办理业务;所述业务衡量指标包括以下至少之一:是否具备还款能力、是否会逾期。
在一实施例中,所述决策树生成模块包括:
目标分裂特征确定模块,用于将所述样本集中的第一个数据特征确定为目标分裂特征,并对所述目标分裂特征执行分裂操作;
特征删除模块,用于从所述样本集中删除所述目标分裂特征,得到新的样本集;
决策决构建模块,用于重复下述步骤,直至满足停止条件,以得到决策树;
将所述新的样本集中的第一个数据特征确定为目标分裂特征,并对所述目标分裂特征执行分裂操作;
从所述样本集中删除所述目标分裂特征,得到新的样本集。
在一实施例中,还包括目标风控规则选择模块,用于从多个风控规则中选择一个风控规则作为目标风控规则;所述风控规则选择模块对每条路径上所有节点表示的业务衡量指标值进行求和,得到总的业务衡量指标值;并将最大的总的业务衡量指标值对应的路径作为目标风控规则。
在一实施例中,根据所述业务类型,确定所述决策树的最大深度限制。
在一实施例中,所述决策树模型包括回归决策树模型、分类决策树模型或多叉树模型。
在本实施例中,该装置实施例与前述的方法实施例相对应,具体功能和技术效果参照上述实施例即可,此处不再赘述。
本申请实施例还提供了一种设备,该设备可以包括:一个或多个处理器;和其上存储有指令的一个或多个机器可读介质,当由所述一个或多个处理器执行时,使得所述设备执行图1所述的方法。在实际应用中,该设备可以作为终端设备,也可以作为服务器,终端设备的例子可以包括:智能手机、平板电脑、电子书阅读器、MP3(动态影像专家压缩标准语音层面3,Moving Picture Experts GroupAudio Layer III)播放器、MP4(动态影像专家压缩标准语音层面4,Moving Picture Experts Group Audio Layer IV)播放器、膝上型便携计算机、车载电脑、台式计算机、机顶盒、智能电视机、可穿戴设备等等,本申请实施例对于具体的设备不加以限制。
本申请实施例还提供了一种非易失性可读存储介质,该存储介质中存储有一个或多个模块(programs),该一个或多个模块被应用在设备时,可以使得该设备执行本申请实施例的图1中方法所包含步骤的指令(instructions)。
图6为本申请一实施例提供的终端设备的硬件结构示意图。如图所示,该终端设备可以包括:输入设备1100、第一处理器1101、输出设备1102、第一存储器1103和至少一个通信总线1104。通信总线1104用于实现元件之间的通信连接。第一存储器1103可能包含高速RAM存储器,也可能还包括非易失性存储NVM,例如至少一个磁盘存储器,第一存储器1103中可以存储各种程序,用于完成各种处理功能以及实现本实施例的方法步骤。
可选的,上述第一处理器1101例如可以为中央处理器(Central ProcessingUnit,简称CPU)、应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,该第一处理器1101通过有线或无线连接耦合到上述输入设备1100和输出设备1102。
可选的,上述输入设备1100可以包括多种输入设备,例如可以包括面向用户的用户接口、面向设备的设备接口、软件的可编程接口、摄像头、传感器中至少一种。可选的,该面向设备的设备接口可以是用于设备与设备之间进行数据传输的有线接口、还可以是用于设备与设备之间进行数据传输的硬件插入接口(例如USB接口、串口等);可选的,该面向用户的用户接口例如可以是面向用户的控制按键、用于接收语音输入的语音输入设备以及用户接收用户触摸输入的触摸感知设备(例如具有触摸感应功能的触摸屏、触控板等);可选的,上述软件的可编程接口例如可以是供用户编辑或者修改程序的入口,例如芯片的输入引脚接口或者输入接口等;输出设备1102可以包括显示器、音响等输出设备。
在本实施例中,该终端设备的处理器包括用于执行各设备中各模块的功能,具体功能和技术效果参照上述实施例即可,此处不再赘述。
图7为本申请的一个实施例提供的终端设备的硬件结构示意图。图7是对图6在实现过程中的一个具体的实施例。如图所示,本实施例的终端设备可以包括第二处理器1201以及第二存储器1202。
第二处理器1201执行第二存储器1202所存放的计算机程序代码,实现上述实施例中图1所述方法。
第二存储器1202被配置为存储各种类型的数据以支持在终端设备的操作。这些数据的示例包括用于在终端设备上操作的任何应用程序或方法的指令,例如消息,图片,视频等。第二存储器1202可能包含随机存取存储器(random access memory,简称RAM),也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
可选地,第二处理器1201设置在处理组件1200中。该终端设备还可以包括:通信组件1203,电源组件1204,多媒体组件1205,语音组件1206,输入/输出接口1207和/或传感器组件1208。终端设备具体所包含的组件等依据实际需求设定,本实施例对此不作限定。
处理组件1200通常控制终端设备的整体操作。处理组件1200可以包括一个或多个第二处理器1201来执行指令,以完成上述数据处理方法中的全部或部分步骤。此外,处理组件1200可以包括一个或多个模块,便于处理组件1200和其他组件之间的交互。例如,处理组件1200可以包括多媒体模块,以方便多媒体组件1205和处理组件1200之间的交互。
电源组件1204为终端设备的各种组件提供电力。电源组件1204可以包括电源管理系统,一个或多个电源,及其他与为终端设备生成、管理和分配电力相关联的组件。
多媒体组件1205包括在终端设备和用户之间的提供一个输出接口的显示屏。在一些实施例中,显示屏可以包括液晶显示器(LCD)和触摸面板(TP)。如果显示屏包括触摸面板,显示屏可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。
语音组件1206被配置为输出和/或输入语音信号。例如,语音组件1206包括一个麦克风(MIC),当终端设备处于操作模式,如语音识别模式时,麦克风被配置为接收外部语音信号。所接收的语音信号可以被进一步存储在第二存储器1202或经由通信组件1203发送。在一些实施例中,语音组件1206还包括一个扬声器,用于输出语音信号。
输入/输出接口1207为处理组件1200和外围接口模块之间提供接口,上述外围接口模块可以是点击轮,按钮等。这些按钮可包括但不限于:音量按钮、启动按钮和锁定按钮。
传感器组件1208包括一个或多个传感器,用于为终端设备提供各个方面的状态评估。例如,传感器组件1208可以检测到终端设备的打开/关闭状态,组件的相对定位,用户与终端设备接触的存在或不存在。传感器组件1208可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在,包括检测用户与终端设备间的距离。在一些实施例中,该传感器组件1208还可以包括摄像头等。
通信组件1203被配置为便于终端设备和其他设备之间有线或无线方式的通信。终端设备可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个实施例中,该终端设备中可以包括SIM卡插槽,该SIM卡插槽用于插入SIM卡,使得终端设备可以登录GPRS网络,通过互联网与服务器建立通信。
由上可知,在图7实施例中所涉及的通信组件1203、语音组件1206以及输入/输出接口1207、传感器组件1208均可以作为图6实施例中的输入设备的实现方式。
上述实施例仅例示性说明本发明的原理及其功效,而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下,对上述实施例进行修饰或改变。因此,举凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本发明的权利要求所涵盖。

Claims (15)

1.一种风控规则获取方法,其特征在于,包括:
根据业务对象的业务类型确定与业务类型相对应的原始属性数据的数据特征;
基于所述数据特征与所述业务类型所关联的业务衡量指标值之间的相关度,对所述数据特征进行排序,获取排序后的样本集;
基于所述样本集,生成决策树;
确定决策树从根节点到每一个叶子节点的所有路径,每条路径作为一个风控规则。
2.根据权利要求1所述的风控规则获取方法,其特征在于,所述业务类型包括以下至少之一:贷款业务、信用卡办理业务;所述业务衡量指标包括以下至少之一:是否具备还款能力、是否会逾期。
3.根据权利要求1所述的风控规则获取方法,其特征在于,所述基于所述样本集,生成决策树,包括:
将所述样本集中的第一个数据特征确定为目标分裂特征,并对所述目标分裂特征执行分裂操作;
从所述样本集中删除所述目标分裂特征,得到新的样本集;
重复下述步骤,直至满足停止条件,以得到决策树;
将所述新的样本集中的第一个数据特征确定为目标分裂特征,并对所述目标分裂特征执行分裂操作;
从所述样本集中删除所述目标分裂特征,得到新的样本集。
4.根据权利要求1所述的风控规则获取方法,其特征在于,还包括从多个风控规则中选择一个风控规则作为目标风控规则,选择目标风控规则的方法包括:
对每条路径上所有节点表示的业务衡量指标值进行求和,得到总的业务衡量指标值;
将最大的总的业务衡量指标值对应的路径作为目标风控规则。
5.根据权利要求1所述的风控规则获取方法,其特征在于,根据所述业务类型,确定所述决策树的最大深度限制。
6.根据权利要求1所述的风控规则获取方法,其特征在于,所述决策树模型包括回归决策树模型、分类决策树模型或多叉树模型。
7.根据权利要求1所述的风控规则获取方法,其特征在于,还包括对所述原始属性数据进行预处理,包括:
对所述原始属性数据进行清洗;
对清洗后的原始属性数据进行缺失值填充。
8.一种风控规则获取装置,其特征在于,包括:
数据获取模块,用于根据业务对象的业务类型确定与业务类型相对应的原始属性数据的数据特征;
样本集构建模块,基于所述数据特征与所述业务类型所关联的业务衡量指标值之间的相关度,对所述数据特征进行排序,获取排序后的样本集;
决策树生成模块,用于基于所述样本集,生成决策树;
风控规则生成模块,用于确定决策树从根节点到每一个叶子节点的所有路径;其中,每条路径作为一个风控规则。
9.根据权利要求8所述的风控规则获取装置,其特征在于,所述业务类型包括以下至少之一:贷款业务、信用卡办理业务;所述业务衡量指标包括以下至少之一:是否具备还款能力、是否会逾期。
10.根据权利要求8所述的风控规则获取装置,其特征在于,所述决策树生成模块包括:
目标分裂特征确定模块,用于将所述样本集中的第一个数据特征确定为目标分裂特征,并对所述目标分裂特征执行分裂操作;
特征删除模块,用于从所述样本集中删除所述目标分裂特征,得到新的样本集;
决策决构建模块,用于重复下述步骤,直至满足停止条件,以得到决策树;
将所述新的样本集中的第一个数据特征确定为目标分裂特征,并对所述目标分裂特征执行分裂操作;
从所述样本集中删除所述目标分裂特征,得到新的样本集。
11.根据权利要求8所述的风控规则获取装置,其特征在于,还包括目标风控规则选择模块,用于从多个风控规则中选择一个风控规则作为目标风控规则;所述风控规则选择模块对每条路径上所有节点表示的业务衡量指标值进行求和,得到总的业务衡量指标值;并将最大的总的业务衡量指标值对应的路径作为目标风控规则。
12.根据权利要求8所述的风控规则获取装置,其特征在于,根据所述业务类型,确定所述决策树的最大深度限制。
13.根据权利要求8所述的风控规则获取装置,其特征在于,所述决策树模型包括回归决策树模型、分类决策树模型或多叉树模型。
14.一种设备,其特征在于,包括:
一个或多个处理器;和
其上存储有指令的一个或多个机器可读介质,当所述一个或多个处理器执行时,使得所述设备执行如权利要求1-7中一个或多个所述的方法。
15.一个或多个机器可读介质,其特征在于,其上存储有指令,当由一个或多个处理器执行时,使得设备执行如权利要求1-7中一个或多个所述的方法。
CN202011193975.2A 2020-10-30 2020-10-30 一种风控规则获取方法、装置、介质及设备 Pending CN112163642A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011193975.2A CN112163642A (zh) 2020-10-30 2020-10-30 一种风控规则获取方法、装置、介质及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011193975.2A CN112163642A (zh) 2020-10-30 2020-10-30 一种风控规则获取方法、装置、介质及设备

Publications (1)

Publication Number Publication Date
CN112163642A true CN112163642A (zh) 2021-01-01

Family

ID=73866296

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011193975.2A Pending CN112163642A (zh) 2020-10-30 2020-10-30 一种风控规则获取方法、装置、介质及设备

Country Status (1)

Country Link
CN (1) CN112163642A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112966756A (zh) * 2021-03-10 2021-06-15 北京云从科技有限公司 一种可视化的准入规则的生成方法、装置、机器可读介质及设备
CN113240259A (zh) * 2021-04-30 2021-08-10 顶象科技有限公司 规则策略组的生成方法、系统及电子设备
CN113256402A (zh) * 2021-06-03 2021-08-13 上海冰鉴信息科技有限公司 风险控制规则确定方法、装置和电子设备
CN113487225A (zh) * 2021-07-23 2021-10-08 北京云从科技有限公司 一种风险控制方法、系统、设备及介质
CN114140259A (zh) * 2021-11-29 2022-03-04 中国平安财产保险股份有限公司 基于人工智能的核保风控方法、装置、设备及存储介质
CN114513460A (zh) * 2022-01-28 2022-05-17 新华三技术有限公司 决策树的生成方法及装置
CN116011883A (zh) * 2023-01-31 2023-04-25 厦门国际银行股份有限公司 一种金融风控决策规则的调优方法、系统及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107545360A (zh) * 2017-07-28 2018-01-05 浙江邦盛科技有限公司 一种基于决策树的风控智能规则导出方法及系统
CN109657840A (zh) * 2018-11-22 2019-04-19 东软集团股份有限公司 决策树生成方法、装置、计算机可读存储介质及电子设备

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107545360A (zh) * 2017-07-28 2018-01-05 浙江邦盛科技有限公司 一种基于决策树的风控智能规则导出方法及系统
CN109657840A (zh) * 2018-11-22 2019-04-19 东软集团股份有限公司 决策树生成方法、装置、计算机可读存储介质及电子设备

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112966756A (zh) * 2021-03-10 2021-06-15 北京云从科技有限公司 一种可视化的准入规则的生成方法、装置、机器可读介质及设备
CN113240259A (zh) * 2021-04-30 2021-08-10 顶象科技有限公司 规则策略组的生成方法、系统及电子设备
CN113240259B (zh) * 2021-04-30 2023-05-23 杭州顶象科技有限公司 规则策略组的生成方法、系统及电子设备
CN113256402A (zh) * 2021-06-03 2021-08-13 上海冰鉴信息科技有限公司 风险控制规则确定方法、装置和电子设备
CN113487225A (zh) * 2021-07-23 2021-10-08 北京云从科技有限公司 一种风险控制方法、系统、设备及介质
CN113487225B (zh) * 2021-07-23 2024-05-24 北京云从科技有限公司 一种风险控制方法、系统、设备及介质
CN114140259A (zh) * 2021-11-29 2022-03-04 中国平安财产保险股份有限公司 基于人工智能的核保风控方法、装置、设备及存储介质
CN114513460A (zh) * 2022-01-28 2022-05-17 新华三技术有限公司 决策树的生成方法及装置
CN114513460B (zh) * 2022-01-28 2023-09-15 新华三技术有限公司 决策树的生成方法及装置
CN116011883A (zh) * 2023-01-31 2023-04-25 厦门国际银行股份有限公司 一种金融风控决策规则的调优方法、系统及存储介质
CN116011883B (zh) * 2023-01-31 2023-11-07 厦门国际银行股份有限公司 一种金融风控决策规则的调优方法、系统及存储介质

Similar Documents

Publication Publication Date Title
CN112163642A (zh) 一种风控规则获取方法、装置、介质及设备
US10554679B2 (en) Abusive traffic detection
JP2017515184A (ja) 一時的な取引制限の決定
CN104156390A (zh) 一种评论推荐方法和系统
CN112949172A (zh) 一种数据处理方法、装置、机器可读介质及设备
CN110457577A (zh) 数据处理方法、装置、设备和计算机存储介质
EP4120167A1 (en) Abnormal behavior detection method and apparatus, and electronic device and computer-readable storage medium
CN111563810A (zh) 信贷风控模型生成方法、信用评估方法、系统、机器可读介质及设备
CN113538154B (zh) 风险对象的识别方法、装置、存储介质和电子设备
CN111353103B (zh) 用于确定用户社群信息的方法和装置
CN108197203A (zh) 一种门脸头图挑选方法、装置、服务器和存储介质
CN116541610A (zh) 一种推荐模型的训练方法及装置
CN114219664B (zh) 产品推荐方法、装置、计算机设备及存储介质
CN112966756A (zh) 一种可视化的准入规则的生成方法、装置、机器可读介质及设备
CN114239683A (zh) 一种面向电力系统的数据融合处理方法、系统及设备
CN112182520A (zh) 非法账号的识别方法、装置、可读介质及电子设备
CN113010493A (zh) 一种数据质量在线分析方法、装置、机器可读介质及设备
CN112308702A (zh) 一种信贷风险评估方法、装置、介质及设备
CN111275683A (zh) 图像质量评分处理方法、系统、设备及介质
CN116186541A (zh) 一种推荐模型的训练方法及装置
CN111813988B (zh) 用于图像特征库的hnsw节点删除方法、系统、设备和介质
CN107562758B (zh) 一种推送信息的方法、装置及电子设备
CN111428767B (zh) 数据处理方法及装置、处理器、电子设备及存储介质
CN111915422A (zh) 一种风控模型调度方法、装置、机器可读介质及设备
CN113222632A (zh) 对象挖掘的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20210101