CN112348220A - 一种基于企业行为模式的信用风险评估预测方法及系统 - Google Patents

一种基于企业行为模式的信用风险评估预测方法及系统 Download PDF

Info

Publication number
CN112348220A
CN112348220A CN201910735301.1A CN201910735301A CN112348220A CN 112348220 A CN112348220 A CN 112348220A CN 201910735301 A CN201910735301 A CN 201910735301A CN 112348220 A CN112348220 A CN 112348220A
Authority
CN
China
Prior art keywords
enterprise
data
foreign trade
credit risk
behavior
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910735301.1A
Other languages
English (en)
Inventor
刘键伟
刘彦龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Mars Data Technology Co ltd
Original Assignee
Shanghai Mars Data Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Mars Data Technology Co ltd filed Critical Shanghai Mars Data Technology Co ltd
Priority to CN201910735301.1A priority Critical patent/CN112348220A/zh
Publication of CN112348220A publication Critical patent/CN112348220A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Physics & Mathematics (AREA)
  • Economics (AREA)
  • Theoretical Computer Science (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Data Mining & Analysis (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Tourism & Hospitality (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Technology Law (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Educational Administration (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本发明公开了一种基于企业行为模式的信用风险评估预测方法及系统。所述基于企业行为模式的信用风险评估预测方法,包括数据准备、对外贸企业原始数据进行转换、对外贸企业商业数据进行模型参数的空间变换、采用广义聚类算法在多维特征空间上进行聚类、对数百组行为特征坏样本监督学习、计算每家外贸企业的信用风险分数。本发明在数据处理方式上选用了多维特征空间映射的方法;通过广义聚类算法实现了多维特征空间自动计算最优刻画外贸企业商业行为的种类,实现对外贸企业信用风险的精准预测,为金融机构提供信贷决策依据,用于外贸企业信用价值管理、金融机构对外贸企业的风险管理、金融机构的金融风控。

Description

一种基于企业行为模式的信用风险评估预测方法及系统
技术领域
本发明涉及企业风险评估技术领域,具体涉及基于企业行为模式的信用风险评估预测方法及系统。
背景技术
目前金融机构对企业风险评估普遍采用指标体系打分法。其理论依据是:业绩比较差、财务状况糟糕的企业所呈现出来的比率和财务趋势不同于那些业绩好、财务状况良好的企业,金融机构可以据此对借款企业进行识别。金融机构按照各自内部的评级体系只对与其有业务往来的企业进行信用风险评级。在对中小企业进行信用风险分析时,考虑信用风险评估成本,大多没有对各种规模的企业进行细分,而是笼统地使用大中型企业的评定标准。仅仅依靠财务数据评估中小型企业的信用风险具有非常大的局限性。评定标准的模型参数往往是企业的财务数据,而这些财务指标数据对于某些中小企业来说,为了获得金融服务支持,往往会进行虚假填报,数据的真实性有待考证。而且,这些数据常常是年度的静态数据,评定结果不会动态更新。评定的结果常常出现滞后性和不准性。正因为现有评估信用风险的方法存在以上弊端,一种适用于外贸企业的科学的信用评估方法亟待研究。
发明内容
本发明是为了克服现有企业信用评估方法的不足,提供基于企业行为模式的信用风险评估预测方法及系统。
术语
广义聚类算法(EM),EM算法是通过两个步骤迭代完成的。1)期望计算:迭代估计每个观测值属于每个类的概率;2)最大化:利用上一步求得的最大似然值来计算参数的值,对每类参数进行估计。找到的参数估计值被用于下一个 E步计算中,这个过程不断交替进行。
聚类算法包括划分法、密度算法、图形聚类、模型聚类等。但本发明使用的广义聚类算法区别于传统通过固有的变量计算或模型来进行聚类。而是通过模式探索进行聚类的方法。适合企业行为模式的探索研究。
每组坏样本率,坏样本率=坏样本数/每组总样本数,坏样本提取于金融机构对企业金融服务的违约记录及公共部门所披露失信企业公开名录。
公式Score=1000-500*LOG(2^(8*P),2),P代表坏样本率,^:指数符号,log: 对数符号。
本发明的主要目的之一是提供一种基于企业行为模式的信用风险评估预测方法,包括以下步骤:
S1:数据准备,采集外贸企业原始商业数据;
S2:对外贸企业原始数据进行转换,聚合多个企业维度的特征变量;
S3:对外贸企业商业数据进行模型参数的空间变换,将外贸企业行为特征映射到多维空间向量上;
S4:采用广义聚类算法在多维特征空间上进行聚类,生成外贸企业行为特征库;
S5:对数百组行为特征坏样本监督学习,不同企业特征的行为模式都有坏样本分布规律,保存每组的坏样本率;
S6:计算每家外贸企业的信用风险分数。
在另一优选例中,还包括对S1采集的数据进行完整性及连续性的验证。
优选地,S1采集的原始商业数据包括财务数据、ERP数据、HR数据、贸易企业商业行为数据、静态工商数据及履约行为数据。
优选地,S1采集的原始商业数据包括、员工人数、往来单位、企业所处行业、所处区域、注册资本、经营年限、企业性质、企业股东信息、外贸的伙伴、贸易规模、贸易品类、贸易用途、贸易频率、贸易对象(国家)、贸易波动。
优选地,S1要求采集的企业商业数据不少于1年。
优选地,S4中广义聚类算法是基于行为模式的算法,其特点是发现的行为模式特征符合正态分布。
优选地,在S6步骤中,通过公式Score=1000-500*LOG(2^(8*P),2),计算每家外贸企业的信用风险,P为每组坏样本率。
优选地,在引入的多维商业数据变量中,由于不同变量的量级差距较大,为了保证模型对变量的统一敏感度。对所有变量进行100-1000区间值的转换。使用公式:(value-min(变量))/(max(变量)-min(变量))*(1000-100)+100
其中min:最小值max:最大值。
优选地,在S6步骤中,每家外贸企业的信用风险分数范围为500-1000。
优选地,在S6步骤中,每家外贸企业的信用风险分数范围为573-798。
优选地,所有行为模式的信用风险分数在500-1000之间,分值越大代表信用风险越低,反之分值小代表信用风险越高。
优选地,所有行为模式的信用风险分数在575-797之间,分值越大代表信用风险越低,反之分值小代表信用风险越高。
优选地,对于不能提供连续商业数据的企业,通过距离临近算法将企业归并到最符合的行为特征的组别,找到信用风险分数。
优选地,采用距离临近算法,选取的临近样本数20。
在另一优选例中,通过对外贸企业行为特征分析,发现数百种外贸企业行为模式,包括稳定多样加工技术依赖型、进口高端技术潜力生态型、单一生产依赖激进型、小型出口制造贸易波动型、大型生产制造贸易稳定型、小型贸易伙伴及贸易品类单一型。
优选地,提炼的企业行为模式方法是依据企业的外贸特征:如外贸的伙伴、贸易规模、贸易品类、贸易用途等。
在另一优选例中,所有的信用风险分数根据外贸企业最新的企业商业数据进行更新,反映的是企业的运营、管理的状态。
优选地,通过时间序列分析信用分数可以为企业未来风险进行预测演算。
本发明的另一个主要目的是提供一种基于企业行为模式的信用风险评估系统,包括数据采集模块,数据空间转换模块,数据聚类分析模块,数据训练模块,数据计算模块。数据采集模块,用于采集外贸企业原始商业数据;数据空间转换模块与数据采集模块相连,用于对外贸企业原始数据进行转换,聚合多个企业维度的特征变量;用于对外贸企业商业数据进行模型参数的空间变换,将外贸企业行为特征映射到多维空间向量上;数据聚类分析模块与数据空间转换模块相连,采用广义聚类算法在多维特征空间上进行聚类,生成外贸企业行为特征库;数据训练模块与数据聚类分析模块相连,用于对数百组行为特征坏样本监督学习,不同企业特征的行为模式都有坏样本分布规律,保存每组的坏样本率;数据计算模块与数据训练模块相连,用于计算每家外贸企业的信用风险分数。
在另一优选例中,数据采集模块,还用于对采集的数据进行完整性及连续性的验证。
优选地,数据采集模块采集的原始商业数据包括财务数据、ERP数据、HR 数据、贸易企业商业行为数据、静态工商数据及履约行为数据。
优选地,数据采集模块采集的原始商业数据包括往来单位、企业所处行业、所处区域、注册资本、经营年限、企业性质、企业股东信息、外贸的伙伴、贸易规模、贸易品类、贸易用途、贸易频率、贸易对象(国家)、贸易波动。
优选地,数据采集模块要求采集的企业商业数据不少于1年。
优选地,数据聚类分析模块中广义聚类算法是基于行为模式的算法,其特点是发现的行为模式特征符合正态分布。
优选地,在数据计算模块中,通过公式Score=1000-500*LOG(2^(8*P),2),计算每家外贸企业的信用风险,P为每组坏样本率。
在引入的多维商业数据变量中,由于不同变量的量级差距较大,为了保证模型对变量的统一敏感度。对所有变量进行100-1000区间值的转换。使用公式: (value-min(变量))/(max(变量)-min(变量))*(1000-100)+100
其中min:最小值max:最大值。
优选地,在数据计算模块中,每家外贸企业的信用风险分数范围为 500-1000。
优选地,在数据计算模块中,每家外贸企业的信用风险分数范围为573-798。优选地,所有行为模式的信用风险分数在500-1000之间,分值越大代表信用风险越低,反之分值小代表信用风险越高。
优选地,所有行为模式的信用风险分数在575-797之间,分值越大代表信用风险越低,反之分值小代表信用风险越高。
优选地,对于不能提供连续商业数据的企业,通过距离临近算法将企业归并到最符合的行为特征的组别,找到信用风险分数。
优选地,采用距离临近算法,选取的临近样本数20。
在另一优选例中,通过对外贸企业行为特征分析,发现数百种外贸企业行为模式,包括稳定多样加工技术依赖型、进口高端技术潜力生态型、单一生产依赖激进型、小型出口制造贸易波动型、大型生产制造贸易稳定型、小型贸易伙伴及贸易品类单一型。
优选地,提炼的企业行为模式方法是依据企业的外贸特征:如外贸的伙伴、贸易规模、贸易品类、贸易用途等。
在另一优选例中,所有的信用风险分数根据外贸企业最新的企业商业数据进行更新,反映的是企业的运营、管理的状态。
优选地,通过时间序列分析信用分数可以为企业未来风险进行预测演算。
本发明的另一个主要目的是提供基于企业行为模式的信用风险评估系统的应用,具体用于外贸企业信用价值管理、金融机构对外贸企业的风险管理、金融机构的金融风控。
优选地,基于企业行为模式的信用风险评估系统用于外贸企业信用价值管理,每家外贸企业的信用风险分数范围为500-1000。
优选地,基于企业行为模式的信用风险评估系统用于金融机构对外贸企业的风险管理,每家外贸企业的信用风险分数范围为500-1000。
优选地,基于企业行为模式的信用风险评估系统用于金融机构的金融风控,每家外贸企业的信用风险分数范围为500-1000。
与现有技术相比,本发明的有益效果是:
1.突破了财务数据造假带来的评估局限性;
2.每一步设计都选用了科学的算法进行演算;
3.在数据处理方式上选用了多维特征空间映射的方法;
4.通过广义聚类算法实现了多维特征空间自动计算最优刻画外贸企业商业行为的种类;通过基尼系数的显著性及误差影响分析证明当前坏样本分组的有效性。
5.通过自有相似特征挖掘的方法为缺失数据的企业匹配最相似的行为特征。
6.定义每一类企业行为特征的信用风险分数,信用风险分数随企业商业数据的更新而动态变化。
取得的积极效果:
1.发掘企业行为模式:该模型凸显企业行为的差异化,不同的企业行为特征所表现出的信用风险也存在着差异。累计定义数百种外贸企业行为模式。
2.信用信息不全的中小企业也能被评估风险。
3.为中国所有外贸企业建立信用风险指数,该指数能直观反映企业金融信贷风险,经过实证研究预测准确率较高。
附图说明:
图1为本发明的外贸企业的行为模式风险评估模型方法整体流程图。
图2为外贸企业信用风险整体分布图。
图3为外贸企业信用价值维度对比图。
具体实施方式
下面将对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明意在提供一种用于评估外贸企业信用风险的量化模型,通过挖掘外贸企业行为模式特征,建立行为模式与信用风险、信用价值之间的联系。实现对外贸企业信用风险的精准预测,为金融机构提供信贷决策依据,致力于国际数字贸易信用体系的建立。
实施例1
外贸企业的行为模式风险评估预测模型包括以下步骤:
S1:采集外贸企业原始商业数据;
S2:对外贸企业原始商业数据进行完整性及连续性的验证,要求采集的企业商业数据不少于1年;
S3:对外贸企业原始数据进行转换,聚合多个企业维度的特征变量;
S4:对外贸企业商业数据进行模型参数的空间变换,将外贸企业行为特征映射到多维空间向量上;
S5:通过广义聚类算法(EM)在多维特征空间上进行聚类,生成数百组有差异特征的群体组别;
S6:通过对数百组行为特征坏样本的监督学习,发现不同企业特征的行为模式都有其稳定的坏样本分布规律;
S7:通过公式Score=1000-500*LOG(2^(8*P),2)(P为每组坏样本率)计算每家外贸企业的信用风险。分数范围在500-1000区间。
S7也可以采用线性公司,比如在引入的多维商业数据变量中,由于不同变量的量级差距较大,为了保证模型对变量的统一敏感度。对所有变量进行 100-1000区间值的转换。使用公式:(value-min(变量))/(max(变量)-min(变量))*(1000-100)+100,其中min:最小值max:最大值。
S8:对于不能提供连续(多年)商业数据的企业,通过距离临近算法将该家企业归并到最符合其行为特征的组别。同样可以较准确地找到其信用风险分。
在S1数据采集步骤中,尽可能采集企业最小粒度的商业数据。通过大数据征信验证数据的准确性。所采集的数据是外贸企业的商业行为数据,数据本身具有真实性和可靠性。S3原始数据变换过程中,根据企业的基础商业数据衍射计算多个企业的特征变量,如:企业贸易的稳定性、交易频次的波动程度等。 S5广义聚类算法是基于行为模式发现的算法,其特点是发现的行为模式特征符合正态分布。S8临近算法选取的临近样本数为K=20,当K取该值时效果最好。
在S4对外贸企业商业数据进行模型参数的空间变换,将外贸企业行为特征映射到多维空间向量上.把所有的变量转换为统一的量级后,对变量进行1-12 的离散变化。1-12及代表了变量转换后值的由低到高。多个变量及变量的值形成了多维向量空间矩阵。后续的模型是基于多维空间矩阵进行算法的迭代计算,以此发现企业所表现出的不同的行为模式。
通过对外贸企业行为特征分析,发现数百种外贸企业行为模式。如:稳定多样加工技术依赖型;进口高端技术潜力生态型;单一生产依赖激进型、小型出口制造贸易波动型、大型生产制造贸易稳定型、小型贸易伙伴及贸易品类单一型等。提炼的行为模式方法是依据企业的外贸特征:如外贸的伙伴、贸易规模、贸易品类、贸易用途等。
所有行为模式的信用风险分数在500-1000之间,分值越大代表信用风险越低,反之分值小代表信用风险越高。
在另一较佳实施例中,所有行为模式的信用风险分数在575-797之间,分值越大代表信用风险越低,反之分值小代表信用风险越高。
所有的信用风险分数根据外贸企业最新的企业商业数据进行更新,反映的是企业的运营、管理的状态。通过时间序列分析信用分可以为企业未来风险进行预测演算。如:风险系数不断下降,预示企业的运营、管理发生了危机。
实施例2
为更清楚地描述本发明的目的、技术方案和优点,下面将结合附图1对本发明的各实施方式进行详细的阐述。
本发明的外贸企业的行为模式风险评估模型特别适合于外贸企业的风险评估,引入的数据为外贸企业的商业数据,数据真实可靠,解决了现有模型中数据非动态、非真实等问题。相比于以往的风控模型,创新地提出了企业行为模式的概念,并通过挖掘企业行为特征与企业信用风险潜在的联系,定义企业的信用价值。
目前市场上基于企业的数据范围较广,但这些数据与信用风险没有强关联性。而本发明的步骤S1中要求采集的数据为企业的商业行为数据,这类数据与企业的信用风险有较强的关联,也是企业信用风险高低的具体表现。在数据采集方面,在企业授信前提下数据上传到私有的大数据平台,数据操作合法合规,安全可靠。
对于数据的验证,区别于传统的数据挖掘对数据检验的方法,本发明是基于企业商业数据,通过技术手段和企业征信验证数据的真实性及连续型即可,无需对数据的空值、异常等做大量的检查。
在步骤S3中,前期导入的是外贸企业基础商业数据,这些数据直观上看没有明显的商业意义。通过数据挖掘聚合尽可能多的数据字段属性,聚合后的字段能反映企业的行为特征。在这里不限变量的个数,从业务模式角度构建潜在的行为特征。要求变量能直观反映企业贸易行为特征。
在行为特征聚类S5中,本发明提出的是基于行为模式发现的算法,其特点是发现的行为模式特征符合正态分布。区别于传统的聚类方法,聚类的效果侧重的是特征差异,并非高低大小上的区分。
对于坏样本的监督学习,通过使用零假设检验计算GINI系数来验证模型的可适用性。即使小样本的无监督学习,结果也具有代表意义。
在S7步骤中,通过公式Score=1000-500*LOG(2^(8*P),2)(P为每组坏样本率)计算每家外贸企业的信用风险。分数范围在500-1000区间。其中700分以下为高风险,700-900为中信用风险,900分以上为低风险。最终信用风险评分的整体分布情况如图2所示。
在另一方案中,在S7步骤中,通过公式Score=1000-500*LOG(2^(8*P),2)(P 为每组坏样本率)计算每家外贸企业的信用风险。分数范围在573-798区间。其中700分以下为高风险,700-780为中信用风险,780分以上为低风险。
实施例3
一种基于企业行为模式的信用风险评估系统,包括数据采集模块,数据转换模块,数据空间转换模块,数据聚类分析模块,数据训练模块,数据计算模块。
数据采集模块,用于采集外贸企业原始商业数据;数据转换模块与数据采集模块相连,用于对外贸企业原始数据进行转换,聚合多个企业维度的特征变量;数据空间转换模块与数据转换模块相连,用于对外贸企业商业数据进行模型参数的空间变换,将外贸企业行为特征映射到多维空间向量上;数据聚类分析模块与数据空间转换模块相连,采用广义聚类算法在多维特征空间上进行聚类,生成外贸企业行为特征库;数据训练模块与数据聚类分析模块相连,用于对数百组行为特征坏样本监督学习,不同企业特征的行为模式都有坏样本分布规律,保存每组的坏样本率;数据计算模块与数据训练模块相连,用于计算每家外贸企业的信用风险分数。
数据采集模块,还用于对采集的数据进行完整性及连续性的验证。
数据采集模块采集的原始商业数据包括财务数据、ERP数据、HR数据、贸易企业商业行为数据、静态工商数据及履约行为数据。数据采集模块采集的原始商业数据包括往来单位、企业所处行业、所处区域、注册资本、经营年限、企业性质、企业股东信息、外贸的伙伴、贸易规模、贸易品类、贸易用途、贸易频率、贸易对象(国家)、贸易波动。数据采集模块要求采集的企业商业数据不少于1年。
数据聚类分析模块中广义聚类算法是基于行为模式的算法,其特点是发现的行为模式特征符合正态分布。
在数据计算模块中,通过公式Score=1000-500*LOG(2^(8*P),2),计算每家外贸企业的信用风险,P为每组坏样本率。
或者采用线性公式,比如在引入的多维商业数据变量中,由于不同变量的量级差距较大,为了保证模型对变量的统一敏感度。对所有变量进行100-1000 区间值的转换。使用公式:(value-min(变量))/(max(变量)-min(变量))*(1000-100)+100,其中min:最小值max:最大值。
在数据计算模块中,每家外贸企业的信用风险分数范围为500-1000。
在另一方案中,在数据计算模块中,每家外贸企业的信用风险分数范围为 573-798。
所有行为模式的信用风险分数在500-1000之间,分值越大代表信用风险越低,反之分值小代表信用风险越高。在另一方案中,所有行为模式的信用风险分数在575-797之间,分值越大代表信用风险越低,反之分值小代表信用风险越高。
对于不能提供连续商业数据的企业,通过距离临近算法将企业归并到最符合的行为特征的组别,找到信用风险分数。采用距离临近算法,发现的行为模式特征符合正态分布。选取的临近样本数为K=20,当K取该值时效果最好。
通过对外贸企业行为特征分析,发现数百种外贸企业行为模式,包括稳定多样加工技术依赖型、进口高端技术潜力生态型、单一生产依赖激进型、小型出口制造贸易波动型、大型生产制造贸易稳定型、小型贸易伙伴及贸易品类单一型。提炼的企业行为模式方法是依据企业的外贸特征:如外贸的伙伴、贸易规模、贸易品类、贸易用途等。
所有的信用风险分数根据外贸企业最新的企业商业数据进行更新,反映的是企业的运营、管理的状态。通过时间序列分析信用分数可以为企业未来风险进行预测演算。
实施例4
关于外贸企业的行为模式风险评估模型使用场景为:
1.外贸企业信用价值管理
1)外贸企业按照规定的数据字段格式按时提交企业商业数据;
2)行为模式风险评估模型根据数据建模后输出该企业的信用风险分数及企业贸易行为模式;
3)外贸企业获取其信用风险分数及贸易行为模式;
4)外贸企业对自身经营、管理做出调整。
基于企业行为模式的信用风险评估系统用于外贸企业信用价值管理,每家外贸企业的信用风险分数范围为500-1000。
通过将该企业贸易行为所处信用风险位置进行对比分析,让企业更加了解自身的贸易状况。如图3所示,企业商业数据来源于贸易伙伴、贸易规模、贸易品类、贸易用途、贸易稳定性、贸易波动性,通过行为模式风险评估模型根据建模后输出该企业的信用风险分数为981分,属于低信用风险。其企业行为标签是:大型生产制造贸易稳定型企业。
企业可以直观地在一些贸易指标上发现自身的不足,在后续的贸易经营中重点改善从而提高自身在贸易行业的竞争力。
2.金融机构对外贸企业的风险管理
1)金融机构合作企业的信用风险分数及贸易行为模式;
2)金融机构根据信用风险分数决定是否把该企业定为合作对象;
3)金融机构根据信用风险分数为外贸企业做出差异化的金融服务产品;
4)金融机构根据信用风险分数对外贸企业提出预警。
5)金融机构根据信用风险分数对外贸企业决定是否调整金融服务产品策略。
金融机构根据信用风险分数对外贸企业决定是否纳入再合作的对象。
基于企业行为模式的信用风险评估系统用于金融机构对外贸企业的风险管理,每家外贸企业的信用风险分数范围为500-1000。
3.各金融机构金融风控
由于信用风险分数根据企业商业数据动态更新,在借贷的关键三个阶段都需要通过信用风险分数进行数据决策。
贷前:贷前审核阶段,对于分数较差的企业如:高贸易行为、高基本面风险,出于公司利润角度考量,即使利率较高也选择不放贷。该类企业在贸易交易中已经处于衰退阶段或企业存在较大的不确定性。
贷中:贷中监测企业信用风险的变化情况,信用风险位置稳定或降低表明该企业贸易良好,信用风险可控。如果信用风险随着时间的变化逐渐增加,可以通过其它渠道进一步了解该企业的经营状况。如果只是暂时性的,后续仍可以考虑继续合作。但如果企业面临倒闭等风险,需要提前介入以减少公司的经济损失。
贷后:根据还贷的准时率等,在企业信用风险不加剧的情况下,后续可以考虑继续合作,如增加贷款额度,提升贷款周期等。
基于企业行为模式的信用风险评估系统用于金融机构的金融风控,每家外贸企业的信用风险分数范围为500-1000。
以上显示和描述了本发明的基本原理、主要特征和优良特点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

Claims (10)

1.一种基于企业行为模式的信用风险评估预测方法,其特征在于,包括以下步骤:
S1:数据准备,采集外贸企业原始商业数据;
S2:对外贸企业原始数据进行转换,聚合多个企业维度的特征变量;
S3:对外贸企业商业数据进行模型参数的空间变换,将外贸企业行为特征映射到多维空间向量上;
S4:采用广义聚类算法在多维特征空间上进行聚类,生成外贸企业行为特征库;
S5:对行为特征库进行坏样本监督学习,保存每组的坏样本率;
S6:计算每家外贸企业的信用风险分数。
2.根据权利要求1所述的基于企业行为模式的信用风险评估预测方法,其特征在于,还包括对S1采集的数据进行完整性及连续性的验证。
3.根据权利要求1所述的基于企业行为模式的信用风险评估预测方法,其特征在于,在S6步骤中,通过公式Score=1000-500*LOG(2^(8*P),2),计算每家外贸企业的信用风险,P为每组坏样本率。
4.根据权利要求1所述的基于企业行为模式的信用风险评估预测方法,其特征在于,在S6步骤中,每家外贸企业的信用风险分数范围为500-1000。
5.根据权利要求1所述的基于企业行为模式的信用风险评估预测方法,其特征在于,对于不能提供连续商业数据的企业,通过距离临近算法将企业归并到最符合的行为特征的组别,找到信用风险分数。
6.根据权利要求5所述的基于企业行为模式的信用风险评估预测方法,其特征在于,采用距离临近算法,选取的临近样本数20。
7.一种基于企业行为模式的信用风险评估系统,其特征在于,包括数据采集模块,数据空间转换模块,数据聚类分析模块,数据训练模块,数据计算模块;
数据采集模块,用于采集外贸企业原始商业数据;
数据空间转换模块与数据采集模块相连,用于对外贸企业原始数据进行转换,聚合多个企业维度的特征变量;并对外贸企业商业数据进行模型参数的空间变换,将外贸企业行为特征映射到多维空间向量上;
数据聚类分析模块与数据空间转换模块相连,采用广义聚类算法在多维特征空间上进行聚类,生成外贸企业行为特征库;
数据训练模块与数据聚类分析模块相连,用于对行为特征坏样本监督学习,保存每组的坏样本率;
数据计算模块与数据训练模块相连,用于计算每家外贸企业的信用风险分数。
8.根据权利要求7所述的基于企业行为模式的信用风险评估系统,其特征在于,数据采集模块,还用于对采集的数据进行完整性及连续性的验证。
9.根据权利要求7所述的基于企业行为模式的信用风险评估系统,其特征在于,每家外贸企业的信用风险分数为500-1000。
10.权利要求7所述的基于企业行为模式的信用风险评估系统的应用,其特征在于,用于外贸企业信用价值管理、金融机构对外贸企业的风险管理、金融机构的金融风控。
CN201910735301.1A 2019-08-09 2019-08-09 一种基于企业行为模式的信用风险评估预测方法及系统 Pending CN112348220A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910735301.1A CN112348220A (zh) 2019-08-09 2019-08-09 一种基于企业行为模式的信用风险评估预测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910735301.1A CN112348220A (zh) 2019-08-09 2019-08-09 一种基于企业行为模式的信用风险评估预测方法及系统

Publications (1)

Publication Number Publication Date
CN112348220A true CN112348220A (zh) 2021-02-09

Family

ID=74366994

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910735301.1A Pending CN112348220A (zh) 2019-08-09 2019-08-09 一种基于企业行为模式的信用风险评估预测方法及系统

Country Status (1)

Country Link
CN (1) CN112348220A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113781207A (zh) * 2021-09-15 2021-12-10 杭银消费金融股份有限公司 基于实验设计的风控管理策略确定方法及系统
CN114021898A (zh) * 2021-10-13 2022-02-08 成都寻道数财科技有限公司 识别校外合作企业风险等级的系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130132269A1 (en) * 2010-08-06 2013-05-23 The Dun And Bradstreet Corporation Method and system for quantifying and rating default risk of business enterprises
CN107993143A (zh) * 2017-11-23 2018-05-04 深圳大管加软件与技术服务有限公司 一种信贷风险评估方法及系统
CN109934431A (zh) * 2017-12-15 2019-06-25 上海特易信息科技有限公司 一种信用评估方法及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130132269A1 (en) * 2010-08-06 2013-05-23 The Dun And Bradstreet Corporation Method and system for quantifying and rating default risk of business enterprises
CN107993143A (zh) * 2017-11-23 2018-05-04 深圳大管加软件与技术服务有限公司 一种信贷风险评估方法及系统
CN109934431A (zh) * 2017-12-15 2019-06-25 上海特易信息科技有限公司 一种信用评估方法及系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113781207A (zh) * 2021-09-15 2021-12-10 杭银消费金融股份有限公司 基于实验设计的风控管理策略确定方法及系统
CN114021898A (zh) * 2021-10-13 2022-02-08 成都寻道数财科技有限公司 识别校外合作企业风险等级的系统

Similar Documents

Publication Publication Date Title
Du et al. CUS-heterogeneous ensemble-based financial distress prediction for imbalanced dataset with ensemble feature selection
CN110263866A (zh) 一种基于深度学习的电力用户负荷区间预测方法
WO2007106786A2 (en) Methods and systems for multi-credit reporting agency data modeling
AU2019100968A4 (en) A Credit Reporting Evaluation System Based on Mixed Machine Learning
CN112053233B (zh) 基于gra的动态中小企业信用评分方法及系统
CN116523262B (zh) 基于大数据的生产计划智能规划方法、系统和介质
CN104321794A (zh) 一种使用多维评级来确定一实体的未来商业可行性的系统和方法
Zou et al. Business failure prediction based on a cost-sensitive extreme gradient boosting machine
CN112348220A (zh) 一种基于企业行为模式的信用风险评估预测方法及系统
Jandaghi et al. Identification of the most critical factors in bankruptcy prediction and credit classification of companies
CN113835947B (zh) 一种基于异常识别结果确定异常原因的方法和系统
Ahmed et al. Enhancing stock portfolios for enterprise management and investment in energy industry
CN116776209A (zh) 一种关口计量装置运行状态辨识方法、系统、设备及介质
Zang Construction of Mobile Internet Financial Risk Cautioning Framework Based on BP Neural Network
Terzi et al. Comparison of financial distress prediction models: Evidence from turkey
Kumar et al. A deep clustering framework for load pattern segmentation
Li Stock Price Prediction based on Multiple Regression Models
Ramos et al. Data Mining Techniques Applied to Power Systems
Touvras An Analytics Process for Forecasting Expected Credit Losses for the Lifetime of Loans: auto loan portfolios
Li Study on Early Warning on the Financial Risk of Project Venture Capital through a Neural Network Model
Kushwaha et al. Prospective Stock Analysis Model to improve the investment chances using Machine Learning
Lv et al. A k-means++-improved radial basis function neural network model for corporate financial crisis early warning: an empirical model validation for Chinese listed companies
Gao A Methodological Study on Selection of Comparable Companies for Mergers and Acquisitions of Listed Companies Based on KNN Algorithm
Rautio Comparative Analysis of Clustering Techniques for Stock Selection in Finnish Stock Markets Using Common Financial Metrics
Ma Research on enterprise comprehensive financial analysis based on clustering algorithm

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination