CN117709710A - 风险识别方法、装置、设备及存储介质 - Google Patents
风险识别方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN117709710A CN117709710A CN202311631385.7A CN202311631385A CN117709710A CN 117709710 A CN117709710 A CN 117709710A CN 202311631385 A CN202311631385 A CN 202311631385A CN 117709710 A CN117709710 A CN 117709710A
- Authority
- CN
- China
- Prior art keywords
- risk identification
- initial
- risk
- training data
- data set
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 38
- 238000012549 training Methods 0.000 claims abstract description 99
- 238000012216 screening Methods 0.000 claims abstract description 16
- 238000012545 processing Methods 0.000 claims description 20
- 238000010606 normalization Methods 0.000 claims description 11
- 238000005457 optimization Methods 0.000 claims description 7
- 238000003062 neural network model Methods 0.000 claims description 3
- 238000004590 computer program Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000802 evaporation-induced self-assembly Methods 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000002945 steepest descent method Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Economics (AREA)
- Software Systems (AREA)
- Development Economics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Educational Administration (AREA)
- Life Sciences & Earth Sciences (AREA)
- Game Theory and Decision Science (AREA)
- Health & Medical Sciences (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请提供一种风险识别方法、装置、设备及存储介质,涉及计算机技术领域。其中,该方法包括:从多个目标实体的多维度历史信息中获取预设维度的初始训练数据集,并利用所述初始训练数据集训练预先搭建的风险识别模型,得到初始的风险识别模型;利用所述初始的风险识别模型确定所述预设维度中不同维度对应的历史信息对风险识别的贡献度,并根据所述贡献度从所述预设维度中筛选出目标维度;从所述多维度历史信息中获取所述目标维度的目标训练数据集,并利用所述目标训练数据集对所述初始的风险识别模型进行优化。本申请可以提高实体风险识别的准确性。
Description
技术领域
本申请涉及计算机技术领域,尤其涉及一种风险识别方法、装置、设备及存储介质。
背景技术
中小企业作为国民经济的重要组成部分,对经济发展具有重要意义。由于中小企业信息建立不完善、各企业信息独立存在,数据结构差异大,在做商业决策时不能快速识别出潜在的风险企业。
目前对中小企业的信用风险识别,一是基于风险企业已经发生过的存在法律纠纷的事件或者严重行政处罚事件,二是基于目标企业的经营、财务、市场等指标来预测的,但识别的准确性都无法满足当前的需求。
发明内容
本申请提供一种风险识别方法、装置、设备及存储介质,用以解决现有技术中对企业风险识别准确性低的问题。
第一方面,本申请提供一种风险识别方法,包括:
从多个目标实体的多维度历史信息中获取预设维度的初始训练数据集,并利用所述初始训练数据集训练预先搭建的风险识别模型,得到初始的风险识别模型;
利用所述初始的风险识别模型确定所述预设维度中不同维度对应的历史信息对风险识别的贡献度,并根据所述贡献度从所述预设维度中筛选出目标维度;
从所述多维度历史信息中获取所述目标维度的目标训练数据集,并利用所述目标训练数据集对所述初始的风险识别模型进行优化,得到优化的风险识别模型;
利用所述优化的风险识别模型对任意实体进行风险识别。
第二方面,本申请提供一种风险识别装置,包括:
初始训练模块,用于从多个目标实体的多维度历史信息中获取预设维度的初始训练数据集,并利用所述初始训练数据集训练预先搭建的风险识别模型,得到初始的风险识别模型;
贡献度确定模块,用于利用所述初始的风险识别模型确定所述预设维度中不同维度对应的历史信息对风险识别的贡献度,并根据所述贡献度从所述预设维度中筛选出目标维度;
模型优化模块,用于从所述多维度历史信息中获取所述目标维度的目标训练数据集,并利用所述目标训练数据集对所述初始的风险识别模型进行优化,得到优化的风险识别模型;
风险识别模块,用于利用所述优化的风险识别模型对任意实体进行风险识别。
第三方面,本申请实施例还提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如本申请实施例中任一所述的风险识别方法。
第四方面,本申请实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本申请实施例中任一所述的风险识别方法。
本申请提供的风险识别方法、装置、设备及存储介质,先从多个目标实体的多维度历史信息中获取预设维度的初始训练数据集,并训练风险识别模型得到初始的风险识别模型,然后利用初始的风险识别模型确定预设维度中不同维度对应的历史信息对风险识别的贡献度,并根据贡献度从预设维度中筛选出目标维度,接着,从多维度历史信息中获取目标维度的目标训练数据集,并对初始的风险识别模型进行优化,得到优化的风险识别模型,最后利用优化的风险识别模型对任意实体进行风险识别。由此,结合与实体相关联的多维度历史数据来训练模型,并且在得到初始模型之后,依据不同维度的数据对实体风险识别的贡献度,选择目标维度的数据再次对模型进行训练和优化,从而提高模型的训练效果,进而提高模型对实体风险识别的准确性。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
图1为本申请实施例提供的风险识别方法的流程图;
图2为本申请实施例提供的风险识别方法中筛选目标维度过程的流程图;
图3为本申请实施例提供的风险识别方法的流程图;
图4为本申请实施例提供的风险识别装置的结构示意图;
图5为本申请实施例提供的电子设备的结构示意图。
通过上述附图,已示出本申请明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本申请构思的范围,而是通过参考特定实施例为本领域技术人员说明本申请的概念。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本申请,而非对本申请的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本申请相关的部分而非全部结构。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本申请的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。本申请技术方案中对数据的获取、存储、使用、处理等均符合国家法律法规的相关规定。
图1为本申请实施例提供的风险识别方法的流程图。本实施例可适用于利用经训练和优化的风险识别模型识别企业风险的情况,该方法可以由风险识别装置来执行,该装置可以采用软件和/或硬件的方式实现,优选是配置于电子设备中,例如计算机设备或服务器等。如图1所示,该方法具体包括:
S101、从多个目标实体的多维度历史信息中获取预设维度的初始训练数据集,并利用初始训练数据集训练预先搭建的风险识别模型,得到初始的风险识别模型。
其中,目标实体可以是指企业实体。所述多维度历史信息至少包括目标实体的属性信息、交易类信息和风险要素信息,其中,交易类信息表示目标实体和与之存在关联的其他实体之间存在的交易类信息。例如,企业实体的属性信息可以包括企业法人、股东、企业规模和财务信息等;交易类信息可以包括在金融机构产生的供应链的上下游资金往来信息、物流信息、贸易背景信息(例如订单信息,电子票据信息,应收账款信息等)和信贷信息等;风险要素信息可以包括信贷违规行为、与其他企业间的资金、合同或其他借贷纠纷、征信系统,黑名单和不良贷款率等。本申请实施例中不仅将企业自身的信息作为训练数据,还将该企业与其他企业之间的关联信息也作为训练数据对风险识别模型进行训练,使得风险识别模型可以从多维度提取企业的特征进行识别,继而提高模型训练的效果。
与目标实体有关的历史信息维度众多,为了提高模型训练的效率,可以从中选择预设维度的初始训练数据集来训练风险识别模型。其中,预设维度可以根据需要进行配置,例如,分别从属性信息、交易类信息和风险要素信息中选取多个维度作为预设维度。
在一种实施方式中,风险识别模型可以为BP神经网络模型。BP的思想是利用输出后的误差来估计输出层前一层的误差,再用这层误差来估计更前一层的误差,如此获取所有各层误差估计。根据这个误差来调整各层的连接权值,再用调整后的连接权值重新计算输出误差,直到输出的误差达到符合的要求或者迭代次数溢出设定值。其核心是使用最速下降法,通过反向传播不断调整网络的取值和阈值,最后使全局误差系数最小,其网络结构通常包括输入层、隐藏层和输出层。
此外,在另一种实施方式中,利用初始训练数据集训练预先搭建的风险识别模型,得到初始的风险识别模型,可以包括:
对初始训练数据集中每个维度对应的历史信息进行归一化处理;
利用归一化处理后的初始训练数据集训练预先搭建的风险识别模型,得到初始的风险识别模型。
具体的,归一化处理的目的在于对不同维度的历史信息进行量化,并且使各类数据的有效取值范围在0到1之间,以便于模型从中提取特征。例如,对于金额这类大数值x,可以通过如下映射关系进行转化:y=f(x),其中,y的取值为[0,1];对于非数值类的企业数据,可以结合专家意见通过定义数据的方式转化为数值类型,即权重的分配,例如,若企业规模为大型企业,那么其企业规模维度的数据可以归一化为0.8,中型企业则归一化为0.5,小微企业归一化为0.3。
S102、利用初始的风险识别模型确定预设维度中不同维度对应的历史信息对风险识别的贡献度,并根据贡献度从预设维度中筛选出目标维度。
S103、从多维度历史信息中获取目标维度的目标训练数据集,并利用目标训练数据集对初始的风险识别模型进行优化,得到优化的风险识别模型。
S104、利用优化的风险识别模型对任意实体进行风险识别。
企业不同维度的数据对识别企业风险的贡献度是不一样的,本申请实施例中按照贡献度从高到低的顺序,从预设维度中筛选出设定数量的目标维度,然后从多维度历史信息中获取目标维度的目标训练数据集,并利用目标训练数据集对初始的风险识别模型进行优化,得到优化的风险识别模型。其中,优化的过程可以是利用目标训练数据集再次对初始的风险识别模型进行训练,以优化模型的网络参数。这样,优化后的风险识别模型对任意实体进行风险识别时其准确性能够进一步得到提高。
其中,贡献度是利用初始的风险识别模型来确定,由于初始的风险识别模型已经具备对企业风险进行预测的能力,将不同维度的历史信息数据输入初始的风险识别模型,然后比较模型的输出与该数据的标注预期值,若输出接近或等于预期,则表示该维度的历史信息对风险预测的贡献度相对较大,根据输出与预期的比较结果,就可以对不同维度的历史信息进行排序,得到其贡献度从大到小的顺序,即可从预设维度中筛选出排序在前的设定数量的目标维度。需要说明的是,本申请实施例对目标维度的数量不做任何限定,可以根据实际需要进行配置。
将任意实体对应的目标维度的数据输入经优化得到的风险识别模型,利用模型根据其目标维度的数据就可以预测该实体的风险值。实施时,可以根据不同的风险值区间划分不同的风险等级以及时进行预警。例如可划分为恶劣警告、严重警告、中度警告、轻微警告和无风险警告五类。假如风险值落入恶劣警告所对应的区间,那么则表示该实体风险较大,属于恶劣警告的风险等级。
本申请实施例的技术方案,先从多个目标实体的多维度历史信息中获取预设维度的初始训练数据集,并训练风险识别模型得到初始的风险识别模型,然后利用初始的风险识别模型确定预设维度中不同维度对应的历史信息对风险识别的贡献度,并根据贡献度从预设维度中筛选出目标维度,接着,从多维度历史信息中获取目标维度的目标训练数据集,并对初始的风险识别模型进行优化,得到优化的风险识别模型,最后利用优化的风险识别模型对任意实体进行风险识别。由此,结合与实体相关联的多维度历史数据来训练模型,并且在得到初始模型之后,依据不同维度的数据对实体风险识别的贡献度,选择目标维度的数据再次对模型进行训练和优化,从而提高模型的训练效果,进而提高模型对实体风险识别的准确性。
图2为本申请实施例提供的风险识别方法中筛选目标维度过程的流程图。如图2所示,筛选目标维度的过程包括如下步骤:
S201、从预设维度中获取多个不同的候选维度组合。
例如,若预设维度有N个,那么可以从中获取多个不同的J个维度作为候选维度组合,每个候选维度组合中都具有J个维度,N和J均为自然数,且N大于J。
S202、从多维度历史信息中获取每个候选维度组合对应的中间训练数据集及其对应的风险预期值。
其中,风险预期值是预先根据不同的中间训练数据标注的与之对应的风险值的预期值。
S203、将中间训练数据集输入初始的风险识别模型,利用初始的风险识别模型输出中间训练数据集对应的风险识别结果。
S204、比较每个中间训练数据集对应的风险识别结果与风险预期值,根据比较结果确定每个候选维度组合的贡献度。
S205、按照每个候选维度组合的贡献度的大小顺序,从预设维度中筛选出目标维度。
其中,根据比较结果,风险识别结果与风险预期值越接近,那么该风险识别结果所对应的中间训练数据集的候选维度组合的贡献度则越大。将贡献度最高的候选维度组合作为目标维度用于风险识别模型的优化。
本申请实施例的技术方案,在初始训练后,利用得到的初始风险识别模型对不同维度组合的数据对风险识别的贡献度进行识别,因此,可以将贡献度最高的目标维度的数据作为训练数据再次通过训练对模型进行优化,也即,从多个维度的数据中选取对模型预测企业风险最有价值和贡献的目标维度来优化模型,不仅可以提高模型优化的效率,还可以提高优化后模型预测的准确度。
图3为本申请实施例提供的风险识别方法的流程图。如图3所示,历史数据包括企业的静态类信息和业务类信息,其中业务类信息可以包括交易类信息和风险要素信息。然后,先对这些历史数据进行归一化处理,在利用BP神经网络构建出风险识别模型,利用这些历史数据对模型进行训练和优化,优化后得到的模型就可以对企业异常风险进行识别,即可以依据小微企业之间的、小微企业与核心企业之间供应链上的关系来识别企业供应链中的风险企业,进一步还可以根据识别出的风险值来对企业风险进行预警。因此,本申请实施例的技术方案,一方面,为提高风险企业识别的准确性,将神经网络算法应用于企业的风险识别中,通过学习大量的输入-输出模式映射关系,为企业在做商业决策时提供了更全面的考量因素;另一方面,本申请可以随着时间推移,可以采用新的企业数据和提取更多的用于识别风险企业的有效特征进行模型训练,产生符合当前宏观经济的模型,从而提高新的经济形势下的风险企业识别概率;再一方面,用于训练模型的数据真实可靠,且随着数据积累,能发现更多有利于识别企业风险的关键特征。
图4为本申请实施例提供的风险识别装置的结构示意图。如图4所示,该风险识别装置40,包括:
初始训练模块410,用于从多个目标实体的多维度历史信息中获取预设维度的初始训练数据集,并利用所述初始训练数据集训练预先搭建的风险识别模型,得到初始的风险识别模型;
贡献度确定模块420,用于利用所述初始的风险识别模型确定所述预设维度中不同维度对应的历史信息对风险识别的贡献度,并根据所述贡献度从所述预设维度中筛选出目标维度;
模型优化模块430,用于从所述多维度历史信息中获取所述目标维度的目标训练数据集,并利用所述目标训练数据集对所述初始的风险识别模型进行优化,得到优化的风险识别模型;
风险识别模块440,用于利用所述优化的风险识别模型对任意实体进行风险识别。
在一些实施例中,所述多维度历史信息至少包括所述目标实体的属性信息、交易类信息和风险要素信息,其中,所述交易类信息表示所述目标实体和与之存在关联的其他实体之间存在的交易类信息。
在一些实施例中,所述风险识别模型为BP神经网络模型。
在一些实施例中,所述初始训练模块410包括:
归一化处理单元,用于对所述初始训练数据集中每个维度对应的历史信息进行归一化处理;
初始训练单元,用于利用归一化处理后的初始训练数据集训练预先搭建的风险识别模型,得到初始的风险识别模型。
在一些实施例中,所述贡献度确定模块420包括:
候选维度组合获取单元,用于从所述预设维度中获取多个不同的候选维度组合;
中间训练数据集获取单元,用于从所述多维度历史信息中获取每个候选维度组合对应的中间训练数据集及其对应的风险预期值;
风险识别结果获取单元,用于将所述中间训练数据集输入所述初始的风险识别模型,利用所述初始的风险识别模型输出所述中间训练数据集对应的风险识别结果;
贡献度确定单元,用于比较每个中间训练数据集对应的风险识别结果与风险预期值,根据比较结果确定所述每个候选维度组合的贡献度;
目标维度筛选单元,用于按照所述每个候选维度组合的贡献度的大小顺序,从所述预设维度中筛选出目标维度。
本申请实施例提供的风险识别装置,可用于执行上述实施例中风险识别方法的技术方案,其实现原理和技术效果类似,在此不再赘述。
需要说明的是,应理解以上装置的各个模块的划分仅仅是一种逻辑功能的划分,实际实现时可以全部或部分集成到一个物理实体上,也可以物理上分开。且这些模块可以全部以软件通过处理元件调用的形式实现;也可以全部以硬件的形式实现;还可以部分模块通过处理元件调用软件的形式实现,部分模块通过硬件的形式实现。例如,贡献度确定模块420可以为单独设立的处理元件,也可以集成在上述装置的某一个芯片中实现,此外,也可以以程序代码的形式存储于上述装置的存储器中,由上述装置的某一个处理元件调用并执行以上贡献度确定模块420的功能。其它模块的实现与之类似。此外这些模块全部或部分可以集成在一起,也可以独立实现。这里的处理元件可以是一种集成电路,具有信号的处理能力。在实现过程中,上述方法的各步骤或以上各个模块可以通过处理器元件中的硬件的集成逻辑电路或者软件形式的指令完成。
本申请的技术方案中,所涉及的用户个人信息的收集、存储、使用、加工、传输、提供和公开等处理,均符合相关法律法规的规定,且不违背公序良俗。
图5为本申请实施例提供的电子设备的结构示意图。如图5所示,该电子设备可以包括:收发器121、处理器122、存储器123。
处理器122执行存储器存储的计算机执行指令,使得处理器122执行上述实施例中的方案。处理器122可以是通用处理器,包括中央处理器CPU、网络处理器(networkprocessor,NP)等;还可以是数字信号处理器DSP、专用集成电路ASIC、现场可编程门阵列FPGA或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
存储器123通过系统总线与处理器122连接并完成相互间的通信,存储器123用于存储计算机程序指令。
收发器121可以用于获取待运行任务和待运行任务的配置信息。
系统总线可以是外设部件互连标准(peripheral component interconnect,PCI)总线或扩展工业标准结构(extended industry standard architecture,EISA)总线等。系统总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。收发器用于实现数据库访问装置与其他计算机(例如客户端、读写库和只读库)之间的通信。存储器可能包含随机存取存储器(randomaccess memory,RAM),也可能还包括非易失性存储器(non-volatile memory)。
本申请实施例提供的电子设备,可以是上述实施例的终端设备。
本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质中存储有计算机指令,当该计算机指令在计算机上运行时,使得计算机执行上述实施例风险识别方法的技术方案。
本申请实施例还提供一种计算机程序产品,该计算机程序产品包括计算机程序,其存储在计算机可读存储介质中,至少一个处理器可以从计算机可读存储介质读取计算机程序,至少一个处理器执行计算机程序时可实现上述实施例中风险识别方法的技术方案。
计算机程序产品在实现的过程中,可以以一种或多种程序设计语言或其组合来编写用于执行本申请操作的计算机程序代码,程序设计语言包括面向对象的程序设计语言,诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
注意,上述仅为本申请的较佳实施例及所运用技术原理。本领域技术人员会理解,本申请不限于这里的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本申请的保护范围。因此,虽然通过以上实施例对本申请进行了较为详细的说明,但是本申请不仅仅限于以上实施例,在不脱离本申请构思的情况下,还可以包括更多其他等效实施例,而本申请的范围由所附的权利要求范围决定。
Claims (10)
1.一种风险识别方法,其特征在于,包括:
从多个目标实体的多维度历史信息中获取预设维度的初始训练数据集,并利用所述初始训练数据集训练预先搭建的风险识别模型,得到初始的风险识别模型;
利用所述初始的风险识别模型确定所述预设维度中不同维度对应的历史信息对风险识别的贡献度,并根据所述贡献度从所述预设维度中筛选出目标维度;
从所述多维度历史信息中获取所述目标维度的目标训练数据集,并利用所述目标训练数据集对所述初始的风险识别模型进行优化,得到优化的风险识别模型;
利用所述优化的风险识别模型对任意实体进行风险识别。
2.根据权利要求1所述的方法,其特征在于,所述多维度历史信息至少包括所述目标实体的属性信息、交易类信息和风险要素信息,其中,所述交易类信息表示所述目标实体和与之存在关联的其他实体之间存在的交易类信息。
3.根据权利要求1所述的方法,其特征在于,所述风险识别模型为BP神经网络模型。
4.根据权利要求1所述的方法,其特征在于,所述利用所述初始训练数据集训练预先搭建的风险识别模型,得到初始的风险识别模型,包括:
对所述初始训练数据集中每个维度对应的历史信息进行归一化处理;
利用归一化处理后的初始训练数据集训练预先搭建的风险识别模型,得到初始的风险识别模型。
5.根据权利要求1所述的方法,其特征在于,所述利用所述初始的风险识别模型确定所述预设维度中不同维度对应的历史信息对风险识别的贡献度,并根据所述贡献度从所述预设维度中筛选出目标维度,包括:
从所述预设维度中获取多个不同的候选维度组合;
从所述多维度历史信息中获取每个候选维度组合对应的中间训练数据集及其对应的风险预期值;
将所述中间训练数据集输入所述初始的风险识别模型,利用所述初始的风险识别模型输出所述中间训练数据集对应的风险识别结果;
比较每个中间训练数据集对应的风险识别结果与风险预期值,根据比较结果确定所述每个候选维度组合的贡献度;
按照所述每个候选维度组合的贡献度的大小顺序,从所述预设维度中筛选出目标维度。
6.一种风险识别装置,其特征在于,包括:
初始训练模块,用于从多个目标实体的多维度历史信息中获取预设维度的初始训练数据集,并利用所述初始训练数据集训练预先搭建的风险识别模型,得到初始的风险识别模型;
贡献度确定模块,用于利用所述初始的风险识别模型确定所述预设维度中不同维度对应的历史信息对风险识别的贡献度,并根据所述贡献度从所述预设维度中筛选出目标维度;
模型优化模块,用于从所述多维度历史信息中获取所述目标维度的目标训练数据集,并利用所述目标训练数据集对所述初始的风险识别模型进行优化,得到优化的风险识别模型;
风险识别模块,用于利用所述优化的风险识别模型对任意实体进行风险识别。
7.根据权利要求6所述的装置,其特征在于,所述初始训练模块包括:
归一化处理单元,用于对所述初始训练数据集中每个维度对应的历史信息进行归一化处理;
初始训练单元,用于利用归一化处理后的初始训练数据集训练预先搭建的风险识别模型,得到初始的风险识别模型。
8.根据权利要求6所述的装置,其特征在于,所述贡献度确定模块包括:
候选维度组合获取单元,用于从所述预设维度中获取多个不同的候选维度组合;
中间训练数据集获取单元,用于从所述多维度历史信息中获取每个候选维度组合对应的中间训练数据集及其对应的风险预期值;
风险识别结果获取单元,用于将所述中间训练数据集输入所述初始的风险识别模型,利用所述初始的风险识别模型输出所述中间训练数据集对应的风险识别结果;
贡献度确定单元,用于比较每个中间训练数据集对应的风险识别结果与风险预期值,根据比较结果确定所述每个候选维度组合的贡献度;
目标维度筛选单元,用于按照所述每个候选维度组合的贡献度的大小顺序,从所述预设维度中筛选出目标维度。
9.一种电子设备,其特征在于,包括:处理器,以及与所述处理器通信连接的存储器;
所述存储器存储计算机执行指令;
所述处理器执行所述存储器存储的计算机执行指令,以实现如权利要求1-5中任一项所述的风险识别方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如权利要求1-5中任一项所述的风险识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311631385.7A CN117709710A (zh) | 2023-11-30 | 2023-11-30 | 风险识别方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311631385.7A CN117709710A (zh) | 2023-11-30 | 2023-11-30 | 风险识别方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117709710A true CN117709710A (zh) | 2024-03-15 |
Family
ID=90143412
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311631385.7A Pending CN117709710A (zh) | 2023-11-30 | 2023-11-30 | 风险识别方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117709710A (zh) |
-
2023
- 2023-11-30 CN CN202311631385.7A patent/CN117709710A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Ashofteh et al. | A conservative approach for online credit scoring | |
US20220343433A1 (en) | System and method that rank businesses in environmental, social and governance (esg) | |
US11037236B1 (en) | Algorithm and models for creditworthiness based on user entered data within financial management application | |
CN103154991A (zh) | 信用风险采集 | |
US8984022B1 (en) | Automating growth and evaluation of segmentation trees | |
CN110955866A (zh) | 跨境交易风险评估装置、方法及可读存储介质 | |
US11055772B1 (en) | Instant lending decisions | |
US20080255900A1 (en) | Process for identifying potential customers for business outsourcing | |
CN111241161A (zh) | 发票信息挖掘方法、装置、计算机设备及存储介质 | |
WO2021257610A1 (en) | Time series forecasting and visualization methods and systems | |
CN115545886A (zh) | 逾期风险识别方法、装置、设备及存储介质 | |
CN114118816B (zh) | 一种风险评估方法、装置、设备及计算机存储介质 | |
CN117934154A (zh) | 交易风险预测方法、模型训练方法、装置、设备、介质和程序产品 | |
US20210049687A1 (en) | Systems and methods of generating resource allocation insights based on datasets | |
CN110544165B (zh) | 一种信用风险评分卡创建方法、装置及电子设备 | |
CN116739750A (zh) | 贷户违约预测方法、装置、设备和介质 | |
CN112200340A (zh) | 预测逃废债区块链系统 | |
US10235719B2 (en) | Centralized GAAP approach for multidimensional accounting to reduce data volume and data reconciliation processing costs | |
CN117709710A (zh) | 风险识别方法、装置、设备及存储介质 | |
CN110060146B (zh) | 一种数据转移方法及相关设备 | |
US11972338B2 (en) | Automated systems for machine learning model development, analysis, and refinement | |
US20240013188A1 (en) | Computer-implemented systems and methods for payment routing | |
US20240013215A1 (en) | Computer-implemented systems and methods for payment routing | |
US20240013293A1 (en) | Computer-implemented systems and methods for payment routing | |
US20240013189A1 (en) | Computer-implemented systems and methods for payment routing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |