CN110309205A - 一种信用决策数据优化提取系统及方法 - Google Patents

一种信用决策数据优化提取系统及方法 Download PDF

Info

Publication number
CN110309205A
CN110309205A CN201910618271.6A CN201910618271A CN110309205A CN 110309205 A CN110309205 A CN 110309205A CN 201910618271 A CN201910618271 A CN 201910618271A CN 110309205 A CN110309205 A CN 110309205A
Authority
CN
China
Prior art keywords
decision
data
credit
data collection
rule
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910618271.6A
Other languages
English (en)
Other versions
CN110309205B (zh
Inventor
黄妍昕
罗皓
王静
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Honest Mdt Infotech Ltd
Original Assignee
Shanghai Honest Mdt Infotech Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Honest Mdt Infotech Ltd filed Critical Shanghai Honest Mdt Infotech Ltd
Priority to CN201910618271.6A priority Critical patent/CN110309205B/zh
Publication of CN110309205A publication Critical patent/CN110309205A/zh
Application granted granted Critical
Publication of CN110309205B publication Critical patent/CN110309205B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2462Approximate or statistical queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0637Strategic management or analysis, e.g. setting a goal or target of an organisation; Planning actions based on goals; Analysis or evaluation of effectiveness of goals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Development Economics (AREA)
  • Marketing (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Databases & Information Systems (AREA)
  • General Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • Game Theory and Decision Science (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Operations Research (AREA)
  • Probability & Statistics with Applications (AREA)
  • Tourism & Hospitality (AREA)
  • Educational Administration (AREA)
  • Technology Law (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本申请公开了一种信用决策数据优化提取系统及方法,系统包括:用户管理模块,用于对决策优化用户接入的相应决策账号信息进行决策优化管理,将对应的决策优化用户数据进行收集;决策数据总览模块,用于查看决策优化用户数据并将其转化形成第一决策数据集、第二决策数据集的相关信息数据;决策日志获取模块,用于将收集的第一、第二决策数据集的决策数据抽取日志信息并查看其运行情况,并通过筛选对日志信息进行降噪处理;决策数据优化模块,用于通过决策数据编辑功能,允许决策优化用户创建或编辑第一、第二决策数据集,并且对编辑完成的第一、第二决策数据集的有效程度进行优化。本申请能够对信用决策数据进行优化,提高信用决策数据的准确性。

Description

一种信用决策数据优化提取系统及方法
技术领域
本申请涉及计算机技术领域,特别涉及一种信用决策数据优化提取系统及方法。
背景技术
伴随着互联网金融大潮,各类业务爆发式增长,面对个人信用体系不完善、恶意骗贷、坏账和逾期、债务收回成本较高等诸多挑战,信用决策始终是业务的重中之重。然而信用决策系统搭建成本高、信用决策专业人才严重紧缺、人工审核效率低下、流程繁琐,信用决策规则组件不能自由组合配置等诸多难题,如何实现智能高效的审批成为了越来越多的信用决策人关心的问题。
随着行业环境不断变化,特别是欺诈团伙逐渐呈现集团化、规模化、专业化等特点,需要信用决策体系不断迭代,这要求引擎设计上提高操作灵活性,增强其对业务复杂度的适应能力。
因此,信用决策应把握规则的有效性,需要快速迭代,因为用户时刻在发生变化,之前定的规则是否有效需要经常去关注、测试和修改。
传统的信用决策决策是写在代码里的,由于信用决策规则需要不断迭代和优化,在进行信用决策规则的迭代和优化时,往往是信用决策人员首先编写规则,然后由IT人员在后台针对信用决策人员编写的规则进行代码的迭代和验证,这种通过IT人员将规则开发进系统的方式需要连接大量内部数据,数据集成复杂,使得IT人员不堪重负,耗时耗力,且迭代周期长,系统灵活性和适应性差。
发明内容
有鉴于此,本申请的目的在于提供一种信用决策数据优化提取系统及方法,该系统能够对信用决策数据进行优化,提高信用决策数据的准确性。所有的决策数据集的设计全部可以通过鼠标点击实现复杂的业务规则定义,没有任何编程经验的业务人员也可以轻松上手完成复杂业务规则的定义,策略调整之后实时生效,无需重新编译和上线。
为了实现本申请的上述目的,根据本申请的一个方面,本申请提供了一种信用决策数据优化提取系统,该系统包括:
用户管理模块,用于对决策优化用户接入的相应决策账号信息进行决策优化管理,将对应的决策优化用户数据进行收集;
决策数据总览模块,用于查看决策优化用户数据并将其转化形成第一决策数据集、第二决策数据集的相关信息数据;
决策日志获取模块,用于将收集的第一、第二决策数据集的决策数据抽取日志信息,查看第一、第二决策数据集的日志信息运行情况,并通过筛选对日志信息进行降噪处理;
决策数据优化模块,用于通过决策数据编辑功能,允许决策优化用户创建或编辑第一、第二决策数据集,并且对编辑完成的第一、第二决策数据集的有效程度进行优化。
优选地,所述决策数据总览模块包括:
数据预处理单元:用于将调用的决策优化用户数据获取的原始数据在经过第三方的数据接口数据的补充,以及特征提取脚本的计算与格式化规整以后,转换成特征变量列表数据,形成第一决策数据集;
数据集生成单元:用于根据第一决策数据集的变量列表建立第二决策数据集;
数据集测试单元:用于将决策优化用户数据获取的原始数据形成第一决策数据集和第二决策数据集进行测试,并将测试得到输出数据返还至数据预处理单元,其中,所述第二决策数据集用于将多个决策规则数据集按照预设的顺序进行排列。
优选地,所述数据预处理单元包括:
原始数据获取子单元:用于获取调用方的传入的原始数据;
外部数据调用子单元:用于从原始数据中选择决策数据参数,调用第三方的数据接口,以补充申请方的更多维度信息;
脚本编写子单元:用于编写决策优化用户数据特征提取脚本,所述特征提取脚本用于将调用方传入的原始数据和第三方接口获取的附加数据统一格式化为一组特征值。
优选地,所述第二决策数据集包括:
条件决策规则数据集和分数决策规则数据集,其中,
所述条件决策规则数据集包括串行规则集和并行规则集,对于串行规则集设置决定调用顺序的优先级,根据优先级进行判断,若命中在先的拒绝规则后直接执行拒绝决策,在后的规则不再判断,即靠后的串行规则不再判断;对于并行规则集跑完所有的规则后,有一条命中则拒绝,最终得出拒绝的结果可以是命中多条规则;
所述分数决策规则数据集包括使用二维表形式展示目标对象的各个属性,针对不同属性设置不同区段的条件,每个条件对应不同的分值,以实现对目标对象的评分计算。
优选地,所述数据集测试单元返还给数据预处理单元的输出数据的形式包括:若第二决策数据集中的决策规则数据集为条件决策规则数据集,则返回是否拒绝;若第二决策数据集中的决策规则数据集为分数决策规则数据集,则返回信用分。
优选地,所述数据集测试单元返还给数据预处理单元的输出数据还包括命中的决策规则数据集的具体信息。
优选地,用户管理模块具体用于查询、新建和删除决策优化用户接入的相应的决策账号信息,并收集对应的决策优化用户数据,其中,所述决策账号信息包括用户名称、手机号和账号创建日期。
优选地,所述第一、第二决策数据集的日志信息运行情况包括第一、第二决策数据集的决策数据所对应的决策优化用户账号名称、第一、第二决策数据集编码、第一、第二决策数据集调用时间、第一、第二决策数据集是否成功调用、调用第一、第二决策数据集的业务号以及调用第一、第二决策数据集的耗时。
为了实现本申请的上述目的,根据本申请的一个方面,本申请提供了一种信用决策数据优化提取方法,该方法基于上述信用决策数据优化提取系统实现,该方法包括:
获取业务部门整理的信用决策需求;
基于所述信用决策需求通过所述信用决策数据优化提取系统编辑决策规则;
在所述信用决策数据优化提取系统上对所述决策规则的有效程度进行测试;
在所述决策规则的有效程度合格后,存储所述决策规则;
获取预贷款用户信息,基于所述决策规则通过所述信用决策数据优化提取系统对预贷款用户信息进行判断得到判断结果,其中,所述判断结果用于表征是否为所述预贷款用户提供信用贷款。
优选地,所述基于所述信用决策需求通过所述信用决策数据优化提取系统编辑决策规则包括:
根据信用决策需求确认整套策略,并列出整套策略落地所需要的原始入参变量以及最终输出变量;
将原始入参变量和输出变量配入决策流管理模块,并建立与外部变量的一一对应关系;
在决策流管理模块内部将配入的原始入参变量处理成策略可用的字段;
使用决策流管理模块内部组件,完成入参到出参的转换;
将各个组件按照整套策略流程的先后顺序串起来形成决策规则。
由以上方案可知,本申请提供的一种信用决策数据优化提取系统,该系统包括用户管理模块,用于对决策优化用户接入的相应决策账号信息进行决策优化管理,将对应的决策优化用户数据进行收集;决策数据总览模块,用于查看决策优化用户数据并将其转化形成第一决策数据集、第二决策数据集的相关信息数据;决策日志获取模块,用于将收集的第一、第二决策数据集的决策数据抽取日志信息,查看第一、第二决策数据集的日志信息运行情况,并通过筛选对日志信息进行降噪处理;决策数据优化模块,用于通过决策数据编辑功能,允许决策优化用户创建或编辑第一、第二决策数据集,并且对编辑完成的第一、第二决策数据集的有效程度进行优化。相对于现有技术在进行信用决策规则的迭代和优化时,往往是信用决策人员首先编写规则,然后由IT人员在后台针对信用决策人员编写的规则进行代码的迭代和验证,本申请能够以可视化方式编写业务策略,使非技术业务用户直接参与策略运营,能够对信用决策数据进行优化,提高信用决策数据的准确性。所有的信用决策数据集的设计全部可以通过鼠标点击实现复杂的业务规则定义,没有任何编程经验的业务人员也可以轻松上手完成复杂业务规则的定义,策略调整之后实时生效,无需重新编译和上线。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请提供的一种优选实施方式中信用决策数据优化提取系统的结构示意图;
图2为本申请提供的一种优选实施方式中信用决策数据优化提取方法的实现流程图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
如图1所示,为本申请公开的一种信用决策数据优化提取系统的一种优选实施方式的结构示意图,该系统包括:
用户管理模块101,用于对决策优化用户接入的相应决策账号信息进行决策优化管理,将对应的决策优化用户数据进行收集;
决策数据总览模块102,用于查看决策优化用户数据并将其转化形成第一决策数据集、第二决策数据集的相关信息数据;
决策日志获取模块103,用于将收集的第一、第二决策数据集的决策数据抽取日志信息,查看第一、第二决策数据集的日志信息运行情况,并通过筛选对日志信息进行降噪处理;
决策数据优化模块104,用于通过决策数据编辑功能,允许决策优化用户创建或编辑第一、第二决策数据集,并且对编辑完成的第一、第二决策数据集的有效程度进行优化。
在本实施方式中,决策数据总览模块102包括:
数据预处理单元1021:用于将调用的决策优化用户数据获取的原始数据在经过第三方的数据接口数据的补充,以及特征提取脚本的计算与格式化规整以后,转换成特征变量列表数据,形成第一决策数据集;
数据集生成单元1022:用于根据第一决策数据集的变量列表建立第二决策数据集;
数据集测试单元1023:用于将决策优化用户数据获取的原始数据形成第一决策数据集和第二决策数据集进行测试,并将测试得到输出数据返还至数据预处理单元,其中,第二决策数据集用于将多个决策规则数据集按照预设的顺序进行排列。
在本实施方式中,数据预处理单元1021包括:
原始数据获取子单元10211:用于获取调用方的传入的原始数据;
外部数据调用子单元10212:用于从原始数据中选择决策数据参数,调用第三方的数据接口,以补充申请方的更多维度信息;
脚本编写子单元10213:用于编写决策优化用户数据特征提取脚本,特征提取脚本用于将调用方传入的原始数据和第三方接口获取的附加数据统一格式化为一组特征值。
在本实施方式中,第二决策数据集包括:
条件决策规则数据集和分数决策规则数据集,其中,
条件决策规则数据集包括串行规则集和并行规则集,对于串行规则集设置决定调用顺序的优先级,根据优先级进行判断,若命中在先的拒绝规则后直接执行拒绝决策,在后的规则不再判断,即靠后的串行规则不再判断,举例说明,对于串行规则集要判断先后顺序,比如数据先进行规则A的判断再进行规则B的判断,如果命中拒绝规则A后直接执行拒绝决策,规则B不再判断,即靠后的串行规则不再判断;;对于并行规则集跑完所有的规则后,有一条命中则拒绝,最终得出拒绝的结果可以是命中多条规则;
分数决策规则数据集包括使用二维表形式展示目标对象的各个属性,针对不同属性设置不同区段的条件,每个条件对应不同的分值,以实现对目标对象的评分计算。
在本实施方式中,数据集测试单元1023返还给数据预处理单元1021的输出数据的形式包括:若第二决策数据集中的决策规则数据集为条件决策规则数据集,则返回是否拒绝;若第二决策数据集中的决策规则数据集为分数决策规则数据集,则返回信用分。
在本实施方式中,数据集测试单元1023返还给数据预处理单元1021的输出数据还包括命中的决策规则数据集的具体信息。
在本实施方式中,用户管理模块101具体用于查询、新建和删除决策优化用户接入的相应的决策账号信息,并收集对应的决策优化用户数据,其中,决策账号信息包括用户名称、手机号和账号创建日期。
在本实施方式中,第一、第二决策数据集的日志信息运行情况包括第一、第二决策数据集的决策数据所对应的决策优化用户账号名称、第一、第二决策数据集编码、第一、第二决策数据集调用时间、第一、第二决策数据集是否成功调用、调用第一、第二决策数据集的业务号以及调用第一、第二决策数据集的耗时。
具体地,在本实施方式中,第一决策数据集为决策流,第二决策数据集为决策规则,决策数据优化模块104是一堆信用决策数据优化提取规则的集合,通过不同的分支、层层规则的递进关系进行运算,根据优先级对数据进行判断。
例如,无成本或低成本的规则优先于高成本的规则运行。
举例说明:借款用户的身份特定不符合信用决策要求的,诸如低于18岁的用户数据,则可优先运行。而一些通过对接外部三方征信的信用决策规则,需支出相关查询费用的,则靠后运行。此外,在外部三方征信的规则中,命中式收费的信用决策规则(如黑名单与反欺诈)又可以优先于每次查询式收费的信用决策规则(如征信报告)运行。
具体地,在本实施方式中,信用决策决策的核心思路是基于大量真实的样本数据,而对数据的提炼与作用过程,将使用到“参数”的定义。“参数”决定了区间和上下限范围,一条信用决策规则通常作用于某一数据类型,依据此数值是否满足“参数”的定义范围,得出是否可通过信用决策的结论。
具体地,本系统对于非刚需与必要的信用决策规则,能够“开关化”。
举例说明:第二决策数据集中的信用决策规则数据集做成“开关”。如校验用户的芝麻信用分是否高于500分,则可做成“开关”。待该规则上线后,可通过分析此项规则的触发率得出是否合理的判断。因为芝麻信用分是否可作为决策依据将主要取决于业务方向与用户群体,因为理论上芝麻信用分的高低主要与用户在芝麻信用体系内的数据绑定维度的多与少相关,并不一定绝对反映用户的信用程度。
具体地,本系统的信用决策规则上的“参数”可调整与灵活配置。
举例说明:该信用决策体系中会加入年龄的限制,诸如用户年龄需满18岁。其中的“18岁”便是所定义的参数,此处最好可调整与配置。因为考虑到经济能力和还款能力,参数可调整到23岁以上。
由以上方案可知,本申请提供的一种信用决策数据优化提取系统,该系统包括用户管理模块101,用于对决策优化用户接入的相应决策账号信息进行决策优化管理,将对应的决策优化用户数据进行收集;决策数据总览模块102,用于查看决策优化用户数据并将其转化形成第一决策数据集、第二决策数据集的相关信息数据;决策日志获取模块103,用于将收集的第一、第二决策数据集的决策数据抽取日志信息,查看第一、第二决策数据集的日志信息运行情况,并通过筛选对日志信息进行降噪处理;决策数据优化模块104,用于通过决策数据编辑功能,允许决策优化用户创建或编辑第一、第二决策数据集,并且对编辑完成的第一、第二决策数据集的有效程度进行优化。相对于现有技术在进行信用决策规则的迭代和优化时,往往是信用决策人员首先编写规则,然后由IT人员在后台针对信用决策人员编写的规则进行代码的迭代和验证,本申请能够以可视化方式编写业务策略,使非技术业务用户直接参与策略运营,能够对信用决策数据进行优化,提高信用决策数据的准确性。所有的信用决策数据集的设计全部可以通过鼠标点击实现复杂的业务规则定义,没有任何编程经验的业务人员也可以轻松上手完成复杂业务规则的定义,策略调整之后实时生效,无需重新编译和上线,大幅度降低业务人员与技术人员的沟通成本,花很少的时间处理数据,加速业务拓展,另外,本系统提供两种决策方式,一种是直接给出是否予以通过的结果,一种是给出信用分,由调用方决定是否通过。
本申请提供了一种信用决策数据优化提取方法,该方法基于上述信用决策数据优化提取系统实现,如图2所示,该方法包括:
S201,获取业务部门整理的信用决策需求;
在进行信用决策数据优化提取时,首先需要获取到业务部门整理的最新信用决策需求信息,以便于根据需求对信用决策数据优化提取系统中的第一、第二决策数据集进行更新,从而保证后续的决策结果的准确性。
S202,基于信用决策需求通过信用决策数据优化提取系统编辑第一、第二决策数据集;
获取到信用决策需求后,信用决策业务人员根据信用决策需求的相关内容在信用决策数据优化提取系统中通过界面方式创建或编辑与信用决策需求想匹配的第一、第二决策数据集。
S203,在信用决策数据优化提取系统上对第一、第二决策数据集的有效程度进行测试;
根据信用决策需求编辑好新的第一、第二决策数据集后,需要在在信用决策数据优化提取系统对决策规则进行测试,查看其是否能够按照既定设计策略运行。
S204,在第一、第二决策数据集的有效程度合格后,存储第一、第二决策数据集;
通过对新编辑的第一、第二决策数据集进行测试后,若其能够按照既定设计策略运行,则说明该第一、第二决策数据集的有效程度合格,此时则存储该第一、第二决策数据集,以便通过该第一、第二决策数据集进行后续的用户信息验证和判断。
S205,获取预贷款用户信息,基于第一、第二决策数据集通过信用决策数据优化提取系统对预贷款用户信息进行判断得到判断结果,其中,判断结果用于表征是否为预贷款用户提供信用贷款。
按照风控需求进行创建的第一、第二决策数据集测试成功并存储后,就可以通过该第一、第二决策数据集进行贷款用户信息的判断。此时,首先需要获取到需要贷款用户的基本信息,如年龄、征信信息等,然后将该基本信息作为输入数据输入到信用决策数据优化提取系统中,利用该系统中相应的第一、第二决策数据集对需要贷款用户的相关信息进行验证,并判断是否可以为该用户提供信用贷款。
在本发明的一种优选实施方式中,步骤S202包括:
根据信用决策需求确认整套策略,并列出整套策略落地所需要的原始入参变量以及最终输出变量;
将原始入参变量和输出变量配入决策数据优化模块,并建立与外部变量的一一对应关系;
在决策数据优化模块内部将配入的原始入参变量处理成策略可用的字段;
使用决策数据优化模块内部组件,完成入参到出参的转换;
将各个组件按照整套策略流程的先后顺序串起来形成决策规则数据集。
由以上方案可知,本申请提供的一种信用决策数据优化提取方法,首先获取业务部门整理的信用决策需求;然后基于所述信用决策需求通过所述信用决策数据优化提取系统编辑第一、第二决策数据集;接着在所述信用决策数据优化提取系统上对所述第一、第二决策数据集的有效程度进行测试;进而在所述第一、第二决策数据集的有效程度合格后,存储所述第一、第二决策数据集;最后获取预贷款用户信息,基于所述第一、第二决策数据集通过所述信用决策数据优化提取系统对预贷款用户信息进行判断得到判断结果,其中,所述判断结果用于表征是否为所述预贷款用户提供信用贷款。相对于现有技术在进行信用决策规则的迭代和优化时,往往是信用决策人员首先编写规则,然后由IT人员在后台针对信用决策人员编写的规则进行代码的迭代和验证,本申请能够以可视化方式编写业务策略,使非技术业务用户直接参与策略运营,能够对信用决策数据进行优化,提高信用决策数据的准确性。所有的信用决策数据集的设计全部可以通过鼠标点击实现复杂的业务规则定义,没有任何编程经验的业务人员也可以轻松上手完成复杂业务规则的定义,策略调整之后实时生效,无需重新编译和上线,大幅度降低业务人员与技术人员的沟通成本,花很少的时间处理数据,加速业务拓展,另外,本系统提供两种决策方式,一种是直接给出是否予以通过的结果,一种是给出信用分,由调用方决定是否通过。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上对本发明所提供的一种用户扩展方法、装置及系统进行了详细介绍,对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种信用决策数据优化提取系统,其特征在于,包括:
用户管理模块,用于对决策优化用户接入的相应决策账号信息进行决策优化管理,将对应的决策优化用户数据进行收集;
决策数据总览模块,用于查看决策优化用户数据并将其转化形成第一决策数据集、第二决策数据集的相关信息数据;
决策日志获取模块,用于将收集的第一、第二决策数据集的决策数据抽取日志信息,查看第一、第二决策数据集的日志信息运行情况,并通过筛选对日志信息进行降噪处理;
决策数据优化模块,用于通过决策数据编辑功能,允许决策优化用户创建或编辑第一、第二决策数据集,并且对编辑完成的第一、第二决策数据集的有效程度进行优化。
2.根据权利要求1所述的信用决策数据优化提取系统,其特征在于,所述决策数据总览模块包括:
数据预处理单元:用于将调用的决策优化用户数据获取的原始数据在经过第三方的数据接口数据的补充,以及特征提取脚本的计算与格式化规整以后,转换成特征变量列表数据,形成第一决策数据集;
数据集生成单元:用于根据第一决策数据集的变量列表建立第二决策数据集;
数据集测试单元:用于将决策优化用户数据获取的原始数据形成第一决策数据集和第二决策数据集进行测试,并将测试得到输出数据返还至数据预处理单元,其中,所述第二决策数据集用于将多个决策规则数据集按照预设的顺序进行排列。
3.根据权利要求2所述的信用决策数据优化提取系统,其特征在于,所述数据预处理单元包括:
原始数据获取子单元:用于获取调用方的传入的原始数据;
外部数据调用子单元:用于从原始数据中选择决策数据参数,调用第三方的数据接口,以补充申请方的更多维度信息;
脚本编写子单元:用于编写决策优化用户数据特征提取脚本,所述特征提取脚本用于将调用方传入的原始数据和第三方接口获取的附加数据统一格式化为一组特征值。
4.根据权利要求3所述的信用决策数据优化提取系统,其特征在于,所述第二决策数据集包括:
条件决策规则数据集和分数决策规则数据集,其中,
所述条件决策规则数据集包括串行规则集和并行规则集,对于串行规则集设置决定调用顺序的优先级,根据优先级进行判断,若命中在先的拒绝规则后直接执行拒绝决策,在后的规则不再判断,即靠后的串行规则不再判断;对于并行规则集跑完所有的规则后,有一条命中则拒绝,最终得出拒绝的结果可以是命中多条规则;
所述分数决策规则数据集包括使用二维表形式展示目标对象的各个属性,针对不同属性设置不同区段的条件,每个条件对应不同的分值,以实现对目标对象的评分计算。
5.根据权利要求4所述的信用决策数据优化提取系统,其特征在于,所述数据集测试单元返还给数据预处理单元的输出数据的形式包括:若第二决策数据集中的决策规则数据集为条件决策规则数据集,则返回是否拒绝;若第二决策数据集中的决策规则数据集为分数决策规则数据集,则返回信用分。
6.根据权利要求5所述的信用决策数据优化提取系统,其特征在于,所述数据集测试单元返还给数据预处理单元的输出数据还包括命中的决策规则数据集的具体信息。
7.根据权利要求1-6任意一项所述的信用决策数据优化提取系统,其特征在于,用户管理模块具体用于查询、新建和删除决策优化用户接入的相应的决策账号信息,并收集对应的决策优化用户数据,其中,所述决策账号信息包括用户名称、手机号和账号创建日期。
8.根据权利要求1-6任意一项所述的信用决策数据优化提取系统,其特征在于,所述第一、第二决策数据集的日志信息运行情况包括第一、第二决策数据集的决策数据所对应的决策优化用户账号名称、第一、第二决策数据集编码、第一、第二决策数据集调用时间、第一、第二决策数据集是否成功调用、调用第一、第二决策数据集的业务号以及调用第一、第二决策数据集的耗时。
9.一种信用决策数据优化提取系统的方法,其特征在于,包括:
获取业务部门整理的信用决策需求;
基于所述信用决策需求通过所述信用决策数据优化提取系统编辑第一、第二决策数据集;
在所述信用决策数据优化提取系统上对所述第一、第二决策数据集的有效程度进行测试;
在所述第一、第二决策数据集的有效程度合格后,存储所述第一、第二决策数据集;
获取预贷款用户信息,基于所述第一、第二决策数据集通过所述信用决策数据优化提取系统对预贷款用户信息进行判断得到判断结果,其中,所述判断结果用于表征是否为所述预贷款用户提供信用贷款。
10.根据权利要求9所述信用决策数据优化提取方法,其特征在于,所述基于所述信用决策需求通过所述信用决策数据优化提取系统编辑第一、第二决策数据集包括:
根据信用决策需求确认整套策略,并列出整套策略落地所需要的原始入参变量以及最终输出变量;
将原始入参变量和输出变量配入决策数据优化模块,并建立与外部变量的一一对应关系;
在决策数据优化模块内部将配入的原始入参变量处理成策略可用的字段;
使用决策数据优化模块内部组件,完成入参到出参的转换;
将各个组件按照整套策略流程的先后顺序串起来形成决策规则数据集。
CN201910618271.6A 2019-07-10 2019-07-10 一种信用决策数据优化提取系统及方法 Active CN110309205B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910618271.6A CN110309205B (zh) 2019-07-10 2019-07-10 一种信用决策数据优化提取系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910618271.6A CN110309205B (zh) 2019-07-10 2019-07-10 一种信用决策数据优化提取系统及方法

Publications (2)

Publication Number Publication Date
CN110309205A true CN110309205A (zh) 2019-10-08
CN110309205B CN110309205B (zh) 2021-12-07

Family

ID=68079993

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910618271.6A Active CN110309205B (zh) 2019-07-10 2019-07-10 一种信用决策数据优化提取系统及方法

Country Status (1)

Country Link
CN (1) CN110309205B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112215454A (zh) * 2020-08-24 2021-01-12 广东电网有限责任公司广州供电局 一种用于电网企业管理的智能决策系统
WO2022134466A1 (zh) * 2020-12-23 2022-06-30 平安科技(深圳)有限公司 数据处理方法及相关设备

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1317726A1 (en) * 2000-09-07 2003-06-11 Petrovantage, Inc. Computer method and apparatus for petroleum trading and logistics
CN104317800A (zh) * 2014-09-19 2015-01-28 山东大学 一种海量智能用电数据混合存储系统及方法
CN105550378A (zh) * 2016-02-04 2016-05-04 贵州电网有限责任公司信息中心 一种复杂网络体系下异构安全日志信息的提取与分析方法
CN106254543A (zh) * 2016-09-27 2016-12-21 盐城工学院 基于云计算架构的分布式互联网金融网贷方法和系统
CN106454900A (zh) * 2016-11-01 2017-02-22 合肥工业大学 基于智能终端的移动通信网络用户感知分析优化系统
CN106570174A (zh) * 2016-11-10 2017-04-19 中广热点云科技有限公司 运行于cmmb超级热点业务平台的大数据分析方法及系统
CN106777024A (zh) * 2016-12-08 2017-05-31 北京小米移动软件有限公司 识别恶意用户的方法及装置
US10120092B2 (en) * 2016-08-22 2018-11-06 Chevron U.S.A. Inc. System and method for analysis of depositional settings of subsurface reservoirs
CN109144374A (zh) * 2018-09-27 2019-01-04 范若愚 基于可视化规则引擎的业务处理方法、系统及相关设备
CN109474338A (zh) * 2019-01-22 2019-03-15 重庆邮电大学 一种室内VLC-WiFi混合通信系统接入选择方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1317726A1 (en) * 2000-09-07 2003-06-11 Petrovantage, Inc. Computer method and apparatus for petroleum trading and logistics
CN104317800A (zh) * 2014-09-19 2015-01-28 山东大学 一种海量智能用电数据混合存储系统及方法
CN105550378A (zh) * 2016-02-04 2016-05-04 贵州电网有限责任公司信息中心 一种复杂网络体系下异构安全日志信息的提取与分析方法
US10120092B2 (en) * 2016-08-22 2018-11-06 Chevron U.S.A. Inc. System and method for analysis of depositional settings of subsurface reservoirs
CN106254543A (zh) * 2016-09-27 2016-12-21 盐城工学院 基于云计算架构的分布式互联网金融网贷方法和系统
CN106454900A (zh) * 2016-11-01 2017-02-22 合肥工业大学 基于智能终端的移动通信网络用户感知分析优化系统
CN106570174A (zh) * 2016-11-10 2017-04-19 中广热点云科技有限公司 运行于cmmb超级热点业务平台的大数据分析方法及系统
CN106777024A (zh) * 2016-12-08 2017-05-31 北京小米移动软件有限公司 识别恶意用户的方法及装置
CN109144374A (zh) * 2018-09-27 2019-01-04 范若愚 基于可视化规则引擎的业务处理方法、系统及相关设备
CN109474338A (zh) * 2019-01-22 2019-03-15 重庆邮电大学 一种室内VLC-WiFi混合通信系统接入选择方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
刘健: "基于"人本服务"的决策问题算法与模型研究", 《中国博士学位论文全文数据库 经济与管理科学辑》 *
廖明 等: "基于大数据融合算法的DNS日志分析系统", 《电信科学》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112215454A (zh) * 2020-08-24 2021-01-12 广东电网有限责任公司广州供电局 一种用于电网企业管理的智能决策系统
WO2022134466A1 (zh) * 2020-12-23 2022-06-30 平安科技(深圳)有限公司 数据处理方法及相关设备

Also Published As

Publication number Publication date
CN110309205B (zh) 2021-12-07

Similar Documents

Publication Publication Date Title
CN107025509B (zh) 基于业务模型的决策系统和方法
CN110414716B (zh) 一种基于LightGBM的企业失信概率预测方法及系统
CN102591854B (zh) 针对文本特征的广告过滤系统及其过滤方法
CN106022708A (zh) 一种预测员工离职的方法
CN109033497B (zh) 一种面向高并发的多阶段数据挖掘算法智能选择方法
CN105931116A (zh) 基于深度学习机制的自动化信用评分系统及方法
CN109583796A (zh) 一种用于物流园区运营分析的数据挖掘系统及方法
CN110349000A (zh) 基于用户分群的提额策略确定方法、装置和电子设备
CN108446885A (zh) 一种评审意见自动归集方法
CN109670167A (zh) 一种基于Word2Vec的电力客服工单情感量化分析方法
CN109635007A (zh) 一种行为评估方法、装置及相关设备
CN110070452A (zh) 模型训练方法、装置、计算设备及计算机可读存储介质
CN104331502A (zh) 针对快递员周边人群营销中快递员数据的识别方法
CN109558484A (zh) 基于相似度词序矩阵的电力客服工单情感量化分析方法
CN110415103A (zh) 基于变量影响度指标进行用户分群提额的方法、装置和电子设备
CN108694462A (zh) 专利价值度评价方法和计算机可读存储介质
CN110309205A (zh) 一种信用决策数据优化提取系统及方法
CN111199469A (zh) 用户还款模型生成方法、装置及电子设备
CN109064126B (zh) 基于质量驱动的水电工程计量信息管理方法
CN106529983A (zh) 一种微博意见领袖定向广告投放系统
CN108960884A (zh) 信息处理方法、模型构建方法及装置、介质和计算设备
CN110310012A (zh) 数据分析方法、装置、设备及计算机可读存储介质
CN107798137B (zh) 一种基于可加模型的多源异构数据融合架构系统
CN108765127A (zh) 一种基于蒙特卡罗搜索的信用评分卡特征选择方法
CN110610415B (zh) 一种模型更新的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant