CN114969651B - 基于大数据ai技术的智能风控体系构建方法及装置 - Google Patents

基于大数据ai技术的智能风控体系构建方法及装置 Download PDF

Info

Publication number
CN114969651B
CN114969651B CN202210895969.4A CN202210895969A CN114969651B CN 114969651 B CN114969651 B CN 114969651B CN 202210895969 A CN202210895969 A CN 202210895969A CN 114969651 B CN114969651 B CN 114969651B
Authority
CN
China
Prior art keywords
enterprise
matrix
data
type
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210895969.4A
Other languages
English (en)
Other versions
CN114969651A (zh
Inventor
李欣
符金华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Lechaoren Technology Co ltd
Original Assignee
Chengdu Lechaoren Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Lechaoren Technology Co ltd filed Critical Chengdu Lechaoren Technology Co ltd
Priority to CN202210895969.4A priority Critical patent/CN114969651B/zh
Publication of CN114969651A publication Critical patent/CN114969651A/zh
Application granted granted Critical
Publication of CN114969651B publication Critical patent/CN114969651B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • Economics (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Databases & Information Systems (AREA)
  • Algebra (AREA)
  • Strategic Management (AREA)
  • Operations Research (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Development Economics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Quality & Reliability (AREA)
  • Marketing (AREA)
  • Educational Administration (AREA)
  • General Business, Economics & Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Computing Systems (AREA)
  • Complex Calculations (AREA)

Abstract

本发明涉及大数据处理技术领域,揭露了一种基于大数据AI技术的智能风控体系构建方法及装置,包括:对企业数据执行维度整理,得到企业矩阵,按照数据类型为字符型或数值型,将所述企业矩阵拆分为企业字符矩阵及企业数值矩阵,计算所述企业数值矩阵内每种数据类型对应的具体数据值的先验分布值,构建每种数据类型下先验分布值的概率分布函数,求解所述概率分布函数得到每种数据类型所对应的异常概率值,计算所述企业字符矩阵的隶属度矩阵,其中所述隶属度矩阵由根据所述企业字符矩阵构建的隶属度函数计算所得,可视化每个所述异常概率值及所述隶属度矩阵得到企业的经营管理可视化图。本发明可解决目前风控体系运行卡顿甚至中断退出的问题。

Description

基于大数据AI技术的智能风控体系构建方法及装置
技术领域
本发明涉及大数据处理技术领域,尤其涉及一种基于大数据AI技术的智能风控体系构建方法及装置。
背景技术
伴随大数据及人工智能技术的快速发展,目前企业的风险控制已经变得更加难以评估,因此为了适应科技发展,已衍生出大量的风险控制体系。
目前多数风险控制体系均较为臃肿,包括规则管理、企业决策流分析、企业管理评分卡、数据指标管理、日志管理等,虽然功能齐全,但这类风险控制体系由于集成了太多功能,导致运行时系统卡顿甚至出现中断退出的现象。
发明内容
本发明提供一种基于大数据AI技术的智能风控体系构建方法、装置及计算机可读存储介质,其主要目的在于解决目前风控体系过于臃肿导致运行卡顿甚至中断退出的问题。
为实现上述目的,本发明提供的一种基于大数据AI技术的智能风控体系构建方法,包括:
接收企业所提供的企业数据,对所述企业数据执行维度整理,得到企业矩阵,其中所述企业矩阵包括两个维度,第一维度为数据类型,其中数据类型包括企业所服务客户的客户类型、企业征信类型、企业财务类型、企业人力资源类型,第二个维度为数据类型对应的具体数据值;
按照数据类型为字符型或数值型,将所述企业矩阵拆分为企业字符矩阵及企业数值矩阵;
计算所述企业数值矩阵内每种数据类型对应的具体数据值的先验分布值;
构建每种数据类型下先验分布值的概率分布函数,求解所述概率分布函数得到每种数据类型所对应的异常概率值;
计算所述企业字符矩阵的隶属度矩阵,其中所述隶属度矩阵由根据所述企业字符矩阵构建的隶属度函数计算所得;
根据时间的变化规律,可视化每个所述异常概率值及所述隶属度矩阵,得到企业的经营管理可视化图。
可选地,所述对所述企业数据执行维度整理,得到企业矩阵,包括:
按照所述企业数据的数据类型,对所述企业数据执行维度划分,得到包括不同类型的单维矩阵,所述单维矩阵如下:
Figure 472759DEST_PATH_IMAGE001
其中,所述a1为客户类型对应的单维向量,a2为企业征信类型对应的单维向量,am为企业数据所包括的第m种企业数据类型对应的单维向量;
将每种类型所对应的类型数据依次填充至对应的单维向量中,得到所述企业矩阵,所述企业矩阵如下:
Figure 783655DEST_PATH_IMAGE002
其中,xmn表示企业内第m种数据类型下第n个数据的具体数据值,X为所述企业矩阵。
可选地,所述按照数据类型为字符型或数值型,将所述企业矩阵拆分为企业字符矩阵及企业数值矩阵,包括:
Figure 178864DEST_PATH_IMAGE003
其中,X1为所述企业数值矩阵,
Figure 554088DEST_PATH_IMAGE004
表示企业数值矩阵内第t个数据类型对应的单维向量,X2为所述企业字符矩阵,
Figure 907709DEST_PATH_IMAGE005
表示企业数值矩阵内第s个数据类型对应的单维向量,且t+s=m。
可选地,所述计算所述企业数值矩阵内每种数据类型对应的具体数据值的先验分布值,包括:
获取每种数据类型对应的所有的具体数据值,得到具体数据集集合;
求解所述具体数据集集合的方差及平均值;
根据所述方差及平均值构建正态概率分布函数;
求解所述正态概率分布函数得到所述先验分布值。
可选地,所述求解所述正态概率分布函数得到所述先验分布值,包括:
Figure 174742DEST_PATH_IMAGE006
其中,
Figure 576905DEST_PATH_IMAGE007
表示企业数值矩阵内第i种数据类型下第j个数据的具体数据值所对应的先验分布值,μi,j表示企业数值矩阵内第i种数据类型下第j个数据的具体数据值的平均值,
Figure 245784DEST_PATH_IMAGE008
表示企业数值矩阵内第
Figure 504727DEST_PATH_IMAGE010
种数据类型下第j个数据的具体数据值的方差,
Figure 586952DEST_PATH_IMAGE011
为企业数值矩阵内第i种数据类型所对应的超参数,b为调节因子,由用户确定,
Figure 323964DEST_PATH_IMAGE012
表示
Figure 112928DEST_PATH_IMAGE013
Figure 746035DEST_PATH_IMAGE014
需满足卡方分布。
可选地,所述构建每种数据类型下先验分布值的概率分布函数,包括:
采用如下方式构建得到所述概率分布函数:
Figure 722081DEST_PATH_IMAGE015
其中,Ck表示企业数值矩阵内第i种数据类型下第j个数据的具体数据值所对应的风险级别,k为风险级别个数,
Figure 528363DEST_PATH_IMAGE016
表示
Figure 171834DEST_PATH_IMAGE017
为条件概率下为风险级别Ck的风险概率,p(Ck)表示风险级别Ck在企业数值矩阵为参照样本下所发生的概率,
Figure 834897DEST_PATH_IMAGE018
表示第i种数据类型下第j个数据的先验分布值的在所述企业数值矩阵内的发生概率。
可选地,所述计算所述企业字符矩阵的隶属度矩阵,包括:
获取三角模糊数[a,b,c],其中,a≤b≤c;
构建基于所述三角模糊数[a,b,c]的隶属度函数:
Figure 563818DEST_PATH_IMAGE019
其中,u(x)表示企业管理者认为企业字符矩阵属于三角模糊数[a,b,c]的程度,简称隶属度,v(x)表示企业管理者认为企业字符矩阵不属于三角模糊数[a,b,c]的程度,简称非隶属度,x为所述企业字符矩阵内每种数据类型下的字符所对应的十进制数。
为了解决上述问题,本发明还提供一种基于大数据AI技术的智能风控体系构建装置,所述装置包括:
企业矩阵构建模块,用于接收企业所提供的企业数据,对所述企业数据执行维度整理,得到企业矩阵,其中所述企业矩阵包括两个维度,第一维度为数据类型,其中数据类型包括企业所服务客户的客户类型、企业征信类型、企业财务类型、企业人力资源类型,第二个维度为数据类型对应的具体数据值;
矩阵拆分模块,用于按照数据类型为字符型或数值型,将所述企业矩阵拆分为企业字符矩阵及企业数值矩阵;
异常概率值求解模块,用于计算所述企业数值矩阵内每种数据类型对应的具体数据值的先验分布值,构建每种数据类型下先验分布值的概率分布函数,求解所述概率分布函数得到每种数据类型所对应的异常概率值;
隶属度矩阵求解模块,用于计算所述企业字符矩阵的隶属度矩阵,其中所述隶属度矩阵由根据所述企业字符矩阵构建的隶属度函数计算所得;
可视化模块,用于根据时间的变化规律,可视化每个所述异常概率值及所述隶属度矩阵,得到企业的经营管理可视化图。
为了解决上述问题,本发明还提供一种电子设备,所述电子设备包括:
存储器,存储至少一个指令;及
处理器,执行所述存储器中存储的指令以实现上述所述的基于大数据AI技术的智能风控体系构建方法。
为了解决上述问题,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一个指令,所述至少一个指令被电子设备中的处理器执行以实现上述所述的基于大数据AI技术的智能风控体系构建方法。
为解决背景技术所述问题。本发明实施例接收企业所提供的企业数据,对所述企业数据执行维度整理,得到企业矩阵,其中所述企业矩阵包括两个维度,第一维度为数据类型,其中数据类型包括企业所服务客户的客户类型、企业征信类型、企业财务类型、企业人力资源类型,第二个维度为数据类型对应的具体数据值,为了轻量化目前风控体系,本发明实施例去繁就简,先按照数据类型为字符型或数值型,将所述企业矩阵拆分为企业字符矩阵及企业数值矩阵,其中计算所述企业数值矩阵内每种数据类型对应的具体数据值的先验分布值,构建每种数据类型下先验分布值的概率分布函数,求解所述概率分布函数得到每种数据类型所对应的异常概率值,可见异常概率值的计算仅通过概率函数计算即可,并没有使用复杂繁琐的深度学习模型,可缓解由于集成过多深度学习模型而导致的臃肿卡顿现象,此外,本发明实施例中,进一步利用字符串型的企业数据计算得到隶属度矩阵,隶属度是对多种因素影响的事物做出全面评价的一种十分有效的多因素决策方法,因此可有效替代企业管理评分卡、数据指标管理、日志管理等模块,进一步轻量化风控体系。因此本发明提出的基于大数据AI技术的智能风控体系构建方法、装置、电子设备及计算机可读存储介质,可以解决目前风控体系过于臃肿导致运行卡顿甚至中断退出的问题。
附图说明
图1为本发明一实施例提供的基于大数据AI技术的智能风控体系构建方法的流程示意图;
图2为本发明一实施例提供的基于大数据AI技术的智能风控体系构建装置的功能模块图;
图3为本发明一实施例提供的实现所述基于大数据AI技术的智能风控体系构建方法的电子设备的结构示意图。
图中:1-电子设备;10-处理器;11-存储器;13-通信接口;100-基于大数据AI技术的智能风控体系构建装置;101-企业矩阵构建模块;102-矩阵拆分模块;103-异常概率值求解模块;104-隶属度矩阵求解模块;105-可视化模块。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本申请实施例提供一种基于大数据AI技术的智能风控体系构建方法。所述基于大数据AI技术的智能风控体系构建方法的执行主体包括但不限于服务端、终端等能够被配置为执行本申请实施例提供的该方法的电子设备中的至少一种。换言之,所述基于大数据AI技术的智能风控体系构建方法可以由安装在终端设备或服务端设备的软件或硬件来执行,所述软件可以是区块链平台。所述服务端包括但不限于:单台服务器、服务器集群、云端服务器或云端服务器集群等。
参照图1所示,为本发明一实施例提供的基于大数据AI技术的智能风控体系构建方法的流程示意图。在本实施例中,所述基于大数据AI技术的智能风控体系构建方法包括:
S1、接收企业所提供的企业数据,对所述企业数据执行维度整理,得到企业矩阵,其中所述企业矩阵包括两个维度,第一维度为数据类型,其中数据类型包括企业所服务客户的客户类型、企业征信类型、企业财务类型、企业人力资源类型,第二个维度为数据类型对应的具体数据值;
本发明实施例中,所述企业数据可根据不同企业的企业类型适应性改变,如企业A为线上文具买卖平台,则客户数据包括客户注册名、注册密码、联系方式、联系地址、联系人信息等,此外还包括客户的经验类数据,包括企业征信数据、企业财务数据、企业人力资源数据等。
因此为方便对企业数据的计算及分析,需将企业数据转为矩阵数据,详细地,所述对所述企业数据执行维度整理,得到企业矩阵,包括:
按照所述企业数据的数据类型,对所述企业数据执行维度划分,得到包括不同类型的单维矩阵,所述单维矩阵如下:
Figure 908212DEST_PATH_IMAGE020
其中,所述a1为客户类型对应的单维向量,a2为企业征信类型对应的单维向量,am为企业数据所包括的第m种企业数据类型对应的单维向量;其他企业数据类型可以为企业财务类型、企业人力资源类型。需强调的是,不同企业的m值有可能不同,需要根据不同企业的经营范围、企业规模、企业所收集到的数据等情况具体确定。
将每种类型所对应的类型数据依次填充至对应的单维向量中,得到所述企业矩阵,所述企业矩阵如下:
Figure 609452DEST_PATH_IMAGE021
其中,xmn表示企业内第m种数据类型下第n个数据的具体数据值。示例性的,线上文具买卖平台企业A包括客户类型a1,其中a1包括客户注册名、注册密码、联系方式、联系地址、联系人信息,因此x11表示客户类型为客户注册名的具体名称,可能为“小张”、“小李”等。
S2、按照数据类型为字符型或数值型,将所述企业矩阵拆分为企业字符矩阵及企业数值矩阵;
可理解的是,在上述企业矩阵中所包括的数据类型有字符型或数值型,如x11表示客户注册名的具体名称,可能包括“小张”、“小李”等即为明显的字符型;x31可能表示企业财务类型为当天营业额的具体数值,可能为35万、50万等,明显为数值型。
本发明实施例中,为了更好的分析企业数据所生成的企业矩阵,先按照数据类型为字符型或数值型,分为企业字符矩阵及企业数值矩阵,即:
Figure 115519DEST_PATH_IMAGE022
其中,X1为所述企业数值矩阵,
Figure 597316DEST_PATH_IMAGE023
表示企业数值矩阵内第t个数据类型对应的单维向量,X2为所述企业字符矩阵,
Figure 479822DEST_PATH_IMAGE024
表示企业数值矩阵内第s个数据类型对应的单维向量,且t+s=m。
S3、计算所述企业数值矩阵内每种数据类型对应的具体数据值的先验分布值;
详细地,所述计算每种数据类型对应的具体数据值的先验分布值,包括:
获取每种数据类型对应的所有的具体数据值,得到具体数据集集合;
求解所述具体数据集集合的方差及平均值;
根据所述方差及平均值构建正态概率分布函数;
求解所述正态概率分布函数得到所述先验分布值。
示例性的,如x31表示企业财务类型为当天营业额的具体数值,可能为35万、50万等,假设以一年为周期则共有365组x31,即365组x31表示为具体数据集集合,此外,进一步求解365组x31的方差及平均差从而可构建出正态概率分布函数。
详细地,所述求解所述正态概率分布函数得到所述先验分布值,包括:
Figure 160202DEST_PATH_IMAGE006
其中,
Figure 368329DEST_PATH_IMAGE025
表示企业数值矩阵内第i种数据类型下第j个数据的具体数据值所对应的先验分布值,μi,j表示企业数值矩阵内第i种数据类型下第j个数据的具体数据值的平均值,
Figure 806264DEST_PATH_IMAGE026
表示企业数值矩阵内第
Figure 430143DEST_PATH_IMAGE010
种数据类型下第j个数据的具体数据值的方差,
Figure 902713DEST_PATH_IMAGE027
为企业数值矩阵内第i种数据类型所对应的超参数,b为调节因子,由用户确定,
Figure 16162DEST_PATH_IMAGE028
表示
Figure 941393DEST_PATH_IMAGE029
Figure 995062DEST_PATH_IMAGE030
需满足卡方分布。
S4、构建每种数据类型下先验分布值的概率分布函数,求解所述概率分布函数得到每种数据类型所对应的异常概率值;
详细地,所述构建每种数据类型下先验分布值的概率分布函数,包括:
采用如下方式构建得到所述概率分布函数:
Figure 587717DEST_PATH_IMAGE015
其中,Ck表示企业数值矩阵内第i种数据类型下第j个数据的具体数据值所对应的风险级别,k为风险级别个数,
Figure 872068DEST_PATH_IMAGE031
表示
Figure 487857DEST_PATH_IMAGE032
为条件概率下为风险级别Ck的风险概率,p(Ck)表示风险级别Ck在企业数值矩阵为参照样本下所发生的概率,
Figure 250277DEST_PATH_IMAGE033
表示第i种数据类型下第j个数据的先验分布值的在所述企业数值矩阵内的发生概率。
详细地,所述求解所述概率分布函数得到每种数据类型所对应的异常概率值,包括:
接收用户输入的风险级别阈值;
利用所述概率分布函数,计算大于或等于所述风险级别阈值的风险概率值;
示例性的,如k=5表示共有5个风险级别,其中C1的风险级别最小,C5的风险级别最大,如用户确认的风险级别阈值为5,则表示需要求解
Figure 697439DEST_PATH_IMAGE034
的风险概率,若求解的风险概率为0.65。
S5、计算所述企业字符矩阵的隶属度矩阵,其中所述隶属度矩阵由根据所述企业字符矩阵构建的隶属度函数计算所得;
详细地,所述计算所述企业字符矩阵的隶属度矩阵,包括:
获取三角模糊数[a,b,c],其中,a≤b≤c;
构建基于所述三角模糊数[a,b,c]的隶属度函数:
Figure 152691DEST_PATH_IMAGE019
其中,u(x)表示企业管理者认为企业字符矩阵属于三角模糊数[a,b,c]的程度,简称隶属度,v(x)表示企业管理者认为企业字符矩阵不属于三角模糊数[a,b,c]的程度,简称非隶属度,x为所述企业字符矩阵内每种数据类型下的字符所对应的十进制数。
根据所述隶属度函数依次计算每种数据类型下字符所对应的隶属度及非隶属度,用隶属度及非隶属度代替所对应的字符,得到所述隶属度矩阵。
示例性的,
Figure 380410DEST_PATH_IMAGE035
表示客户注册名的具体名称为“小张”的字符,通过隶属度函数的计算得到
Figure 212100DEST_PATH_IMAGE036
的隶属度及非隶属度为0.3及0.12,则将0.3、0.12替代“小张”,依次操作所述企业字符矩阵内每个字符,得到所述隶属度矩阵。
需解释的是,隶属度及非隶属度属于模糊评价函数里的概念:模糊综合评价是对受多种因素影响的事物做出全面评价的一种十分有效的多因素决策方法,其特点是评价结果不是绝对地肯定或否定,而是以一个模糊集合来表示,可理解的是,如客户类型及企业人力资源类型等字符型类难以计算其风险,但可通过隶属度及非隶属度模糊的评价其风险级别,以提供参考价值。
S6、根据时间的变化规律,可视化每个所述异常概率值及所述隶属度矩阵,得到企业的经营管理可视化图。
可理解的是,每个异常概率值及隶属度矩阵均对应生成时间,以时间为横轴,异常概率值为纵轴可生成时间-异常概率值的波动图将隶属度矩阵按照热图的构建原理,可生成包括时间的每个隶属度矩阵对应的热图供企业管理人员直观了解。
为解决背景技术所述问题。本发明实施例接收企业所提供的企业数据,对所述企业数据执行维度整理,得到企业矩阵,其中所述企业矩阵包括两个维度,第一维度为数据类型,其中数据类型包括企业所服务客户的客户类型、企业征信类型、企业财务类型、企业人力资源类型,第二个维度为数据类型对应的具体数据值,为了轻量化目前风控体系,本发明实施例去繁就简,先按照数据类型为字符型或数值型,将所述企业矩阵拆分为企业字符矩阵及企业数值矩阵,其中计算所述企业数值矩阵内每种数据类型对应的具体数据值的先验分布值,构建每种数据类型下先验分布值的概率分布函数,求解所述概率分布函数得到每种数据类型所对应的异常概率值,可见异常概率值的计算仅通过概率函数计算即可,并没有使用复杂繁琐的深度学习模型,可缓解由于集成过多深度学习模型而导致的臃肿卡顿现象,此外,本发明实施例中,进一步利用字符串型的企业数据计算得到隶属度矩阵,隶属度是对多种因素影响的事物做出全面评价的一种十分有效的多因素决策方法,因此可有效替代企业管理评分卡、数据指标管理、日志管理等模块,进一步轻量化风控体系。因此本发明提出的基于大数据AI技术的智能风控体系构建方法、装置、电子设备及计算机可读存储介质,可以解决目前风控体系过于臃肿导致运行卡顿甚至中断退出的问题。
如图2所示,是本发明一实施例提供的基于大数据AI技术的智能风控体系构建装置的功能模块图。
本发明所述基于大数据AI技术的智能风控体系构建装置100可以安装于电子设备中。根据实现的功能,所述基于大数据AI技术的智能风控体系构建装置100可以包括企业矩阵构建模块101、矩阵拆分模块102、异常概率值求解模块103、隶属度矩阵求解模块104及可视化模块105。本发明所述模块也可以称之为单元,是指一种能够被电子设备处理器所执行,并且能够完成固定功能的一系列计算机程序段,其存储在电子设备的存储器中。
所述企业矩阵构建模块101,用于接收企业所提供的企业数据,对所述企业数据执行维度整理,得到企业矩阵,其中所述企业矩阵包括两个维度,第一维度为数据类型,其中数据类型包括企业所服务客户的客户类型、企业征信类型、企业财务类型、企业人力资源类型,第二个维度为数据类型对应的具体数据值;
所述矩阵拆分模块102,用于按照数据类型为字符型或数值型,将所述企业矩阵拆分为企业字符矩阵及企业数值矩阵;
所述异常概率值求解模块103,用于计算所述企业数值矩阵内每种数据类型对应的具体数据值的先验分布值,构建每种数据类型下先验分布值的概率分布函数,求解所述概率分布函数得到每种数据类型所对应的异常概率值;
所述隶属度矩阵求解模块104,用于计算所述企业字符矩阵的隶属度矩阵,其中所述隶属度矩阵由根据所述企业字符矩阵构建的隶属度函数计算所得;
所述可视化模块105,用于根据时间的变化规律,可视化每个所述异常概率值及所述隶属度矩阵,得到企业的经营管理可视化图。
详细地,本发明实施例中所述基于大数据AI技术的智能风控体系构建装置100中的所述各模块的使用具体实施方式:
企业矩阵构建模块101、接收企业所提供的企业数据,对所述企业数据执行维度整理,得到企业矩阵,其中所述企业矩阵包括两个维度,第一维度为数据类型,其中数据类型包括企业所服务客户的客户类型、企业征信类型、企业财务类型、企业人力资源类型,第二个维度为数据类型对应的具体数据值。
本发明实施例中,所述企业数据可根据不同企业的企业类型适应性改变,如企业A为线上文具买卖平台,则客户数据包括客户注册名、注册密码、联系方式、联系地址、联系人信息等,此外还包括客户的经验类数据,包括企业征信数据、企业财务数据、企业人力资源数据等。
因此为方便对企业数据的计算及分析,需将企业数据转为矩阵数据,详细地,所述对所述企业数据执行维度整理,得到企业矩阵,包括:
按照所述企业数据的数据类型,对所述企业数据执行维度划分,得到包括不同类型的单维矩阵,所述单维矩阵如下:
Figure 248189DEST_PATH_IMAGE020
其中,所述a1为客户类型对应的单维向量,a2为企业征信类型对应的单维向量,am为企业数据所包括的其他企业数据类型对应的单维向量;其他企业数据类型可以为企业财务类型、企业人力资源类型。需强调的是,不同企业的m值有可能不同,需要根据不同企业的经营范围、企业规模、企业所收集到的数据等情况具体确定。
将每种类型所对应的类型数据依次填充至对应的单维向量中,得到所述企业矩阵,所述企业矩阵如下:
Figure 77604DEST_PATH_IMAGE021
其中,xmn表示企业内第m种数据类型下第n个数据的具体数据值。示例性的,线上文具买卖平台企业A包括客户类型a1,其中a1包括客户注册名、注册密码、联系方式、联系地址、联系人信息,因此x11表示客户类型为客户注册名的具体名称,可能为“小张”、“小李”等。
矩阵拆分模块102、按照数据类型为字符型或数值型,将所述企业矩阵拆分为企业字符矩阵及企业数值矩阵。
可理解的是,在上述企业矩阵中所包括的数据类型有字符型或数值型,如x11表示客户注册名的具体名称,可能包括“小张”、“小李”等即为明显的字符型;x31可能表示企业财务类型为当天营业额的具体数值,可能为35万、50万等,明显为数值型。
本发明实施例中,为了更好的分析企业数据所生成的企业矩阵,先按照数据类型为字符型或数值型,分为企业字符矩阵及企业数值矩阵,即:
Figure 464723DEST_PATH_IMAGE022
其中,X1为所述企业数值矩阵,
Figure 834525DEST_PATH_IMAGE037
表示企业数值矩阵内第t个数据类型对应的单维向量,X2为所述企业字符矩阵,
Figure 318596DEST_PATH_IMAGE038
表示企业数值矩阵内第s个数据类型对应的单维向量,且t+s=m。
异常概率值求解模块103、计算所述企业数值矩阵内每种数据类型对应的具体数据值的先验分布值,构建每种数据类型下先验分布值的概率分布函数,求解所述概率分布函数得到每种数据类型所对应的异常概率值。
详细地,所述计算每种数据类型对应的具体数据值的先验分布值,包括:
获取每种数据类型对应的所有的具体数据值,得到具体数据集集合;
求解所述具体数据集集合的方差及平均值;
根据所述方差及平均值构建正态概率分布函数;
求解所述正态概率分布函数得到所述先验分布值。
示例性的,如x31表示企业财务类型为当天营业额的具体数值,可能为35万、50万等,假设以一年为周期则共有365组x31,即365组x31表示为具体数据集集合,此外,进一步求解365组x31的方差及平均差从而可构建出正态概率分布函数。
详细地,所述求解所述正态概率分布函数得到所述先验分布值,包括:
Figure 115651DEST_PATH_IMAGE006
其中,
Figure 990066DEST_PATH_IMAGE039
表示企业数值矩阵内第i种数据类型下第j个数据的具体数据值所对应的先验分布值,μi,j表示企业数值矩阵内第i种数据类型下第j个数据的具体数据值的平均值,
Figure 163558DEST_PATH_IMAGE040
表示企业数值矩阵内第
Figure 377502DEST_PATH_IMAGE010
种数据类型下第j个数据的具体数据值的方差,
Figure 345458DEST_PATH_IMAGE041
为企业数值矩阵内第i种数据类型所对应的超参数,b为调节因子,由用户确定,
Figure 707169DEST_PATH_IMAGE042
表示
Figure 481090DEST_PATH_IMAGE043
Figure 611857DEST_PATH_IMAGE014
需满足卡方分布。
详细地,所述构建每种数据类型下先验分布值的概率分布函数,包括:
采用如下方式构建得到所述概率分布函数:
Figure 16293DEST_PATH_IMAGE015
其中,Ck表示企业数值矩阵内第i种数据类型下第j个数据的具体数据值所对应的风险级别,k为风险级别个数,
Figure 599721DEST_PATH_IMAGE044
表示
Figure 52700DEST_PATH_IMAGE045
为条件概率下为风险级别Ck的风险概率,p(Ck)表示风险级别Ck在企业数值矩阵为参照样本下所发生的概率,
Figure 303552DEST_PATH_IMAGE046
表示第i种数据类型下第j个数据的先验分布值的在所述企业数值矩阵内的发生概率。
详细地,所述求解所述概率分布函数得到每种数据类型所对应的异常概率值,包括:
接收用户输入的风险级别阈值;
利用所述概率分布函数,计算大于或等于所述风险级别阈值的风险概率值;
示例性的,如k=5表示共有5个风险级别,其中C1的风险级别最小,C5的风险级别最大,如用户确认的风险级别阈值为5,则表示需要求解
Figure 613311DEST_PATH_IMAGE047
的风险概率,若求解的风险概率为0.65。
隶属度矩阵求解模块104、计算所述企业字符矩阵的隶属度矩阵,其中所述隶属度矩阵由根据所述企业字符矩阵构建的隶属度函数计算所得。
详细地,所述计算所述企业字符矩阵的隶属度矩阵,包括:
获取三角模糊数[a,b,c],其中,a≤b≤c;
构建基于所述三角模糊数[a,b,c]的隶属度函数:
Figure 522185DEST_PATH_IMAGE019
其中,u(x)表示企业管理者认为企业字符矩阵属于三角模糊数[a,b,c]的程度,简称隶属度,v(x)表示企业管理者认为企业字符矩阵不属于三角模糊数[a,b,c]的程度,简称非隶属度,x为所述企业字符矩阵内每种数据类型下的字符所对应的十进制数。
根据所述隶属度函数依次计算每种数据类型下字符所对应的隶属度及非隶属度,用隶属度及非隶属度代替所对应的字符,得到所述隶属度矩阵。
示例性的,
Figure 575592DEST_PATH_IMAGE048
表示客户注册名的具体名称为“小张”的字符,通过隶属度函数的计算得到
Figure 680951DEST_PATH_IMAGE049
的隶属度及非隶属度为0.3及0.12,则将0.3、0.12替代“小张”,依次操作所述企业字符矩阵内每个字符,得到所述隶属度矩阵。
需解释的是,隶属度及非隶属度属于模糊评价函数里的概念:模糊综合评价是对受多种因素影响的事物做出全面评价的一种十分有效的多因素决策方法,其特点是评价结果不是绝对地肯定或否定,而是以一个模糊集合来表示,可理解的是,如客户类型及企业人力资源类型等字符型类难以计算其风险,但可通过隶属度及非隶属度模糊的评价其风险级别,以提供参考价值。
可视化模块105、根据时间的变化规律,可视化每个所述异常概率值及所述隶属度矩阵,得到企业的经营管理可视化图。
可理解的是,每个异常概率值及隶属度矩阵均对应生成时间,以时间为横轴,异常概率值为纵轴可生成时间-异常概率值的波动图将隶属度矩阵按照热图的构建原理,可生成包括时间的每个隶属度矩阵对应的热图供企业管理人员直观了解。
为解决背景技术所述问题。本发明实施例接收企业所提供的企业数据,对所述企业数据执行维度整理,得到企业矩阵,其中所述企业矩阵包括两个维度,第一维度为数据类型,其中数据类型包括企业所服务客户的客户类型、企业征信类型、企业财务类型、企业人力资源类型,第二个维度为数据类型对应的具体数据值,为了轻量化目前风控体系,本发明实施例去繁就简,先按照数据类型为字符型或数值型,将所述企业矩阵拆分为企业字符矩阵及企业数值矩阵,其中计算所述企业数值矩阵内每种数据类型对应的具体数据值的先验分布值,构建每种数据类型下先验分布值的概率分布函数,求解所述概率分布函数得到每种数据类型所对应的异常概率值,可见异常概率值的计算仅通过概率函数计算即可,并没有使用复杂繁琐的深度学习模型,可缓解由于集成过多深度学习模型而导致的臃肿卡顿现象,此外,本发明实施例中,进一步利用字符串型的企业数据计算得到隶属度矩阵,隶属度是对多种因素影响的事物做出全面评价的一种十分有效的多因素决策方法,因此可有效替代企业管理评分卡、数据指标管理、日志管理等模块,进一步轻量化风控体系。因此本发明提出的基于大数据AI技术的智能风控体系构建方法、装置、电子设备及计算机可读存储介质,可以解决目前风控体系过于臃肿导致运行卡顿甚至中断退出的问题。
如图3所示,是本发明一实施例提供的实现基于大数据AI技术的智能风控体系构建方法的电子设备的结构示意图。
所述电子设备1可以包括处理器10、存储器11和总线,还可以包括存储在所述存储器11中并可在所述处理器10上运行的计算机程序,如基于大数据AI技术的智能风控体系构建方法程序。
其中,所述存储器11至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、移动硬盘、多媒体卡、卡型存储器(例如:SD或DX存储器等)、磁性存储器、磁盘、光盘等。所述存储器11在一些实施例中可以是电子设备1的内部存储单元,例如该电子设备1的移动硬盘。所述存储器11在另一些实施例中也可以是电子设备1的外部存储设备,例如电子设备1上配备的插接式移动硬盘、智能存储卡(Smart Media Card, SMC)、安全数字(SecureDigital, SD)卡、闪存卡(Flash Card)等。进一步地,所述存储器11还可以既包括电子设备1的内部存储单元也包括外部存储设备。所述存储器11不仅可以用于存储安装于电子设备1的应用软件及各类数据,例如基于大数据AI技术的智能风控体系构建方法程序的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。
所述处理器10在一些实施例中可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路所组成,包括一个或者多个中央处理器(Central Processing unit,CPU)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。所述处理器10是所述电子设备的控制核心(Control Unit),利用各种接口和线路连接整个电子设备的各个部件,通过运行或执行存储在所述存储器11内的程序或者模块(例如基于大数据AI技术的智能风控体系构建方法程序等),以及调用存储在所述存储器11内的数据,以执行电子设备1的各种功能和处理数据。
所述总线可以是外设部件互连标准(peripheral component interconnect,简称PCI)总线或扩展工业标准结构(extended industry standard architecture,简称EISA)总线等。该总线可以分为地址总线、数据总线、控制总线等。所述总线被设置为实现所述存储器11以及至少一个处理器10等之间的连接通信。
图3仅示出了具有部件的电子设备,本领域技术人员可以理解的是,图3示出的结构并不构成对所述电子设备1的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
例如,尽管未示出,所述电子设备1还可以包括给各个部件供电的电源(比如电池),优选地,电源可以通过电源管理装置与所述至少一个处理器10逻辑相连,从而通过电源管理装置实现充电管理、放电管理、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述电子设备1还可以包括多种传感器、蓝牙模块、Wi-Fi模块等,在此不再赘述。
进一步地,所述电子设备1还可以包括网络接口,可选地,所述网络接口可以包括有线接口和/或无线接口(如WI-FI接口、蓝牙接口等),通常用于在该电子设备1与其他电子设备之间建立通信连接。
可选地,该电子设备1还可以包括用户接口,用户接口可以是显示器(Display)、输入单元(比如键盘(Keyboard)),可选地,用户接口还可以是标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在电子设备1中处理的信息以及用于显示可视化的用户界面。
应该了解,所述实施例仅为说明之用,在专利申请范围上并不受此结构的限制。
所述电子设备1中的所述存储器11存储的基于大数据AI技术的智能风控体系构建方法程序是多个指令的组合,在所述处理器10中运行时,可以实现:
接收企业所提供的企业数据,对所述企业数据执行维度整理,得到企业矩阵,其中所述企业矩阵包括两个维度,第一维度为数据类型,其中数据类型包括企业所服务客户的客户类型、企业征信类型、企业财务类型、企业人力资源类型,第二个维度为数据类型对应的具体数据值;
按照数据类型为字符型或数值型,将所述企业矩阵拆分为企业字符矩阵及企业数值矩阵;
计算所述企业数值矩阵内每种数据类型对应的具体数据值的先验分布值;
构建每种数据类型下先验分布值的概率分布函数,求解所述概率分布函数得到每种数据类型所对应的异常概率值;
计算所述企业字符矩阵的隶属度矩阵,其中所述隶属度矩阵由根据所述企业字符矩阵构建的隶属度函数计算所得;
根据时间的变化规律,可视化每个所述异常概率值及所述隶属度矩阵,得到企业的经营管理可视化图。
具体地,所述处理器10对上述指令的具体实现方法可参考图1至图3对应实施例中相关步骤的描述,在此不赘述。
进一步地,所述电子设备1集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。所述计算机可读存储介质可以是易失性的,也可以是非易失性的。例如,所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)。
本发明还提供一种计算机可读存储介质,所述可读存储介质存储有计算机程序,所述计算机程序在被电子设备的处理器所执行时,可以实现:
接收企业所提供的企业数据,对所述企业数据执行维度整理,得到企业矩阵,其中所述企业矩阵包括两个维度,第一维度为数据类型,其中数据类型包括企业所服务客户的客户类型、企业征信类型、企业财务类型、企业人力资源类型,第二个维度为数据类型对应的具体数据值;
按照数据类型为字符型或数值型,将所述企业矩阵拆分为企业字符矩阵及企业数值矩阵;
计算所述企业数值矩阵内每种数据类型对应的具体数据值的先验分布值;
构建每种数据类型下先验分布值的概率分布函数,求解所述概率分布函数得到每种数据类型所对应的异常概率值;
计算所述企业字符矩阵的隶属度矩阵,其中所述隶属度矩阵由根据所述企业字符矩阵构建的隶属度函数计算所得;
根据时间的变化规律,可视化每个所述异常概率值及所述隶属度矩阵,得到企业的经营管理可视化图。
在本发明所提供的几个实施例中,应该理解到,所揭露的设备,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。
因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附关联图标记视为限制所涉及的权利要求。
本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第二等词语用来表示名称,而并不表示任何特定的顺序。
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。

Claims (6)

1.一种基于大数据AI技术的智能风控体系构建方法,其特征在于,所述方法包括:
接收企业所提供的企业数据,对所述企业数据执行维度整理,得到企业矩阵,其中所述企业矩阵包括两个维度,第一维度为数据类型,其中数据类型包括企业所服务客户的客户类型、企业征信类型、企业财务类型、企业人力资源类型,第二个维度为数据类型对应的具体数据值;
按照数据类型为字符型或数值型,将所述企业矩阵拆分为企业字符矩阵及企业数值矩阵;
计算所述企业数值矩阵内每种数据类型对应的具体数据值的先验分布值;
构建每种数据类型下先验分布值的概率分布函数,求解所述概率分布函数得到每种数据类型所对应的异常概率值;
计算所述企业字符矩阵的隶属度矩阵,其中所述隶属度矩阵由根据所述企业字符矩阵构建的隶属度函数计算所得;
根据时间的变化规律,可视化每个所述异常概率值及所述隶属度矩阵,得到企业的经营管理可视化图;
所述计算所述企业数值矩阵内每种数据类型对应的具体数据值的先验分布值,包括:
获取每种数据类型对应的所有的具体数据值,得到具体数据集集合;
求解所述具体数据集集合的方差及平均值;
根据所述方差及平均值构建正态概率分布函数;
求解所述正态概率分布函数得到所述先验分布值;
所述求解所述正态概率分布函数得到所述先验分布值,包括:
Figure 818084DEST_PATH_IMAGE001
其中,
Figure 743315DEST_PATH_IMAGE002
表示企业数值矩阵内第i种数据类型下第j个数据的具体数据值所对应的先验分布值,μi,j表示企业数值矩阵内第i种数据类型下第j个数据的具体数据值的平均值,
Figure 905306DEST_PATH_IMAGE003
表示企业数值矩阵内第i种数据类型下第j个数据的具体数据值的方差,
Figure 966803DEST_PATH_IMAGE004
为企业数值矩阵内第i种数据类型所对应的超参数,b为调节因子,由用户确定,
Figure 251154DEST_PATH_IMAGE005
表示
Figure 601363DEST_PATH_IMAGE006
Figure 629362DEST_PATH_IMAGE007
需满足卡方分布;
所述构建每种数据类型下先验分布值的概率分布函数,包括:
采用如下方式构建得到所述概率分布函数:
Figure 810945DEST_PATH_IMAGE008
其中,Ck表示企业数值矩阵内第i种数据类型下第j个数据的具体数据值所对应的风险级别,k为风险级别个数,
Figure 938301DEST_PATH_IMAGE009
表示
Figure 838124DEST_PATH_IMAGE010
为条件概率下为风险级别Ck的风险概率,p(Ck)表示风险级别Ck在企业数值矩阵为参照样本下所发生的概率,
Figure 404234DEST_PATH_IMAGE011
表示第i种数据类型下第j个数据的先验分布值的在所述企业数值矩阵内的发生概率;
所述求解所述概率分布函数得到每种数据类型所对应的异常概率值,包括:
接收用户输入的风险级别阈值;
利用所述概率分布函数,计算大于或等于所述风险级别阈值的风险概率值;
所述计算所述企业字符矩阵的隶属度矩阵,包括:
获取三角模糊数[a,b,c],其中,a≤b≤c;
构建基于所述三角模糊数[a,b,c]的隶属度函数:
Figure 640656DEST_PATH_IMAGE012
其中,u(x)表示企业管理者认为企业字符矩阵属于三角模糊数[a,b,c]的程度,简称隶属度,v(x)表示企业管理者认为企业字符矩阵不属于三角模糊数[a,b,c]的程度,简称非隶属度,x为所述企业字符矩阵内每种数据类型下的字符所对应的十进制数;
根据所述隶属度函数依次计算每种数据类型下字符所对应的隶属度及非隶属度,用隶属度及非隶属度代替所对应的字符,得到所述隶属度矩阵。
2.如权利要求1所述的基于大数据AI技术的智能风控体系构建方法,其特征在于,所述对所述企业数据执行维度整理,得到企业矩阵,包括:
按照所述企业数据的数据类型,对所述企业数据执行维度划分,得到包括不同类型的单维矩阵,所述单维矩阵如下:
Figure 1230DEST_PATH_IMAGE013
其中,所述a1为客户类型对应的单维向量,a2为企业征信类型对应的单维向量,am为企业数据所包括的第m种企业数据类型对应的单维向量;
将每种类型所对应的类型数据依次填充至对应的单维向量中,得到所述企业矩阵,所述企业矩阵如下:
Figure 388349DEST_PATH_IMAGE014
其中,xmn表示企业内第m种数据类型下第n个数据的具体数据值,X为所述企业矩阵。
3.如权利要求2所述的基于大数据AI技术的智能风控体系构建方法,其特征在于,所述按照数据类型为字符型或数值型,将所述企业矩阵拆分为企业字符矩阵及企业数值矩阵,包括:
Figure 695834DEST_PATH_IMAGE015
其中,X1为所述企业数值矩阵,
Figure 586430DEST_PATH_IMAGE016
表示企业数值矩阵内第t个数据类型对应的单维向量,X2为所述企业字符矩阵,
Figure 383484DEST_PATH_IMAGE017
表示企业数值矩阵内第s个数据类型对应的单维向量,且t+s=m。
4.一种基于大数据AI技术的智能风控体系构建装置,其特征在于,所述装置包括:
企业矩阵构建模块,用于接收企业所提供的企业数据,对所述企业数据执行维度整理,得到企业矩阵,其中所述企业矩阵包括两个维度,第一维度为数据类型,其中数据类型包括企业所服务客户的客户类型、企业征信类型、企业财务类型、企业人力资源类型,第二个维度为数据类型对应的具体数据值;
矩阵拆分模块,用于按照数据类型为字符型或数值型,将所述企业矩阵拆分为企业字符矩阵及企业数值矩阵;
异常概率值求解模块,用于计算所述企业数值矩阵内每种数据类型对应的具体数据值的先验分布值,构建每种数据类型下先验分布值的概率分布函数,求解所述概率分布函数得到每种数据类型所对应的异常概率值;
隶属度矩阵求解模块,用于计算所述企业字符矩阵的隶属度矩阵,其中所述隶属度矩阵由根据所述企业字符矩阵构建的隶属度函数计算所得;
可视化模块,用于根据时间的变化规律,可视化每个所述异常概率值及所述隶属度矩阵,得到企业的经营管理可视化图;
所述计算所述企业数值矩阵内每种数据类型对应的具体数据值的先验分布值,包括:
获取每种数据类型对应的所有的具体数据值,得到具体数据集集合;
求解所述具体数据集集合的方差及平均值;
根据所述方差及平均值构建正态概率分布函数;
求解所述正态概率分布函数得到所述先验分布值;
所述求解所述正态概率分布函数得到所述先验分布值,包括:
Figure 930003DEST_PATH_IMAGE001
其中,
Figure 978862DEST_PATH_IMAGE002
表示企业数值矩阵内第i种数据类型下第j个数据的具体数据值所对应的先验分布值,μi,j表示企业数值矩阵内第i种数据类型下第j个数据的具体数据值的平均值,
Figure 927226DEST_PATH_IMAGE003
表示企业数值矩阵内第i种数据类型下第j个数据的具体数据值的方差,
Figure 770548DEST_PATH_IMAGE004
为企业数值矩阵内第i种数据类型所对应的超参数,b为调节因子,由用户确定,
Figure 866680DEST_PATH_IMAGE005
表示
Figure 578285DEST_PATH_IMAGE006
Figure 395804DEST_PATH_IMAGE007
需满足卡方分布;
所述构建每种数据类型下先验分布值的概率分布函数,包括:
采用如下方式构建得到所述概率分布函数:
Figure 534661DEST_PATH_IMAGE008
其中,Ck表示企业数值矩阵内第i种数据类型下第j个数据的具体数据值所对应的风险级别,k为风险级别个数,
Figure 118089DEST_PATH_IMAGE009
表示
Figure 305488DEST_PATH_IMAGE010
为条件概率下为风险级别Ck的风险概率,p(Ck)表示风险级别Ck在企业数值矩阵为参照样本下所发生的概率,
Figure 290762DEST_PATH_IMAGE011
表示第i种数据类型下第j个数据的先验分布值的在所述企业数值矩阵内的发生概率;
所述求解所述概率分布函数得到每种数据类型所对应的异常概率值,包括:
接收用户输入的风险级别阈值;
利用所述概率分布函数,计算大于或等于所述风险级别阈值的风险概率值;
所述计算所述企业字符矩阵的隶属度矩阵,包括:
获取三角模糊数[a,b,c],其中,a≤b≤c;
构建基于所述三角模糊数[a,b,c]的隶属度函数:
Figure 600520DEST_PATH_IMAGE012
其中,u(x)表示企业管理者认为企业字符矩阵属于三角模糊数[a,b,c]的程度,简称隶属度,v(x)表示企业管理者认为企业字符矩阵不属于三角模糊数[a,b,c]的程度,简称非隶属度,x为所述企业字符矩阵内每种数据类型下的字符所对应的十进制数;
根据所述隶属度函数依次计算每种数据类型下字符所对应的隶属度及非隶属度,用隶属度及非隶属度代替所对应的字符,得到所述隶属度矩阵。
5.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1至3中任意一项所述的基于大数据AI技术的智能风控体系构建方法。
6.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至3中任意一项所述的基于大数据AI技术的智能风控体系构建方法。
CN202210895969.4A 2022-07-28 2022-07-28 基于大数据ai技术的智能风控体系构建方法及装置 Active CN114969651B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210895969.4A CN114969651B (zh) 2022-07-28 2022-07-28 基于大数据ai技术的智能风控体系构建方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210895969.4A CN114969651B (zh) 2022-07-28 2022-07-28 基于大数据ai技术的智能风控体系构建方法及装置

Publications (2)

Publication Number Publication Date
CN114969651A CN114969651A (zh) 2022-08-30
CN114969651B true CN114969651B (zh) 2022-10-25

Family

ID=82969503

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210895969.4A Active CN114969651B (zh) 2022-07-28 2022-07-28 基于大数据ai技术的智能风控体系构建方法及装置

Country Status (1)

Country Link
CN (1) CN114969651B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015053423A1 (ko) * 2013-10-11 2015-04-16 (주)나노포인트 운전 습관 분석 진단 시스템 및 방법
CN110490433A (zh) * 2019-07-30 2019-11-22 同济大学 一种列控系统风险评估方法
CN113421155A (zh) * 2021-06-11 2021-09-21 苏州天保供应链信息技术服务有限公司 钢贸企业画像多维度模型构建方法、风控管理方法及装置
CN113674081A (zh) * 2021-07-30 2021-11-19 浙江创邻科技有限公司 一种基于图数据库的中小企业风控管理系统及方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11321634B2 (en) * 2019-05-21 2022-05-03 International Business Machines Corporation Minimizing risk using machine learning techniques
CN111694844B (zh) * 2020-05-28 2024-05-07 平安科技(深圳)有限公司 基于配置算法的企业运行数据分析方法、装置及电子设备
CN112396320A (zh) * 2020-11-18 2021-02-23 西南石油大学 一种基于ism与模糊贝叶斯网络的隧道坍塌风险评估方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015053423A1 (ko) * 2013-10-11 2015-04-16 (주)나노포인트 운전 습관 분석 진단 시스템 및 방법
CN110490433A (zh) * 2019-07-30 2019-11-22 同济大学 一种列控系统风险评估方法
CN113421155A (zh) * 2021-06-11 2021-09-21 苏州天保供应链信息技术服务有限公司 钢贸企业画像多维度模型构建方法、风控管理方法及装置
CN113674081A (zh) * 2021-07-30 2021-11-19 浙江创邻科技有限公司 一种基于图数据库的中小企业风控管理系统及方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于贝叶斯网络的化工企业人员应急疏散研究;朱敬聪 等;《安全与环境学报》;20210425;第21卷(第2期);739-745 *

Also Published As

Publication number Publication date
CN114969651A (zh) 2022-08-30

Similar Documents

Publication Publication Date Title
CN113592019B (zh) 基于多模型融合的故障检测方法、装置、设备及介质
CN111694844B (zh) 基于配置算法的企业运行数据分析方法、装置及电子设备
CN113626606B (zh) 信息分类方法、装置、电子设备及可读存储介质
CN113688923A (zh) 订单异常智能检测方法、装置、电子设备及存储介质
CN114491047A (zh) 多标签文本分类方法、装置、电子设备及存储介质
CN111950625A (zh) 基于人工智能的风险识别方法、装置、计算机设备及介质
CN114881616A (zh) 业务流程执行方法、装置、电子设备及存储介质
CN113868529A (zh) 知识推荐方法、装置、电子设备及可读存储介质
CN113919738A (zh) 业务办理窗口分配方法、装置、电子设备及可读存储介质
CN113627160B (zh) 文本纠错方法、装置、电子设备及存储介质
CN113658002B (zh) 基于决策树的交易结果生成方法、装置、电子设备及介质
CN113837631A (zh) 员工评价方法、装置、电子设备及可读存储介质
CN117193975A (zh) 任务调度方法、装置、设备及存储介质
CN114969651B (zh) 基于大数据ai技术的智能风控体系构建方法及装置
CN113435746B (zh) 用户工作量的评分方法、装置、电子设备及存储介质
CN113657546B (zh) 信息分类方法、装置、电子设备及可读存储介质
CN113657499B (zh) 基于特征选择的权益分配方法、装置、电子设备及介质
CN115471215A (zh) 一种业务流程处理方法及装置
CN112560721B (zh) 无感知模型切换方法、装置、电子设备及存储介质
CN114662095A (zh) 基于操作数据的安全监测方法、装置、设备及存储介质
CN113486646A (zh) 产品报告发布方法、装置、电子设备及可读存储介质
CN114742423B (zh) 一种随机分组方法、装置、设备及介质
CN113360945B (zh) 基于差分隐私的噪声添加方法、装置、设备及介质
CN113723611B (zh) 基于因果推断的业务因子生成方法、装置、设备及介质
CN117829839A (zh) 可疑交易账户识别方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant