CN110246024A

CN110246024A - 违约指数评估方法

Info

Publication number: CN110246024A
Application number: CN201811253259.1A
Authority: CN
Inventors: 金端峰; 苏玥; 顾津
Original assignee: Love Letter And Letter Co Ltd
Current assignee: Love Letter And Letter Co Ltd
Priority date: 2018-10-25
Filing date: 2018-10-25
Publication date: 2019-09-17

Abstract

本发明实施例提供一种违约指数评估方法，属于企业信用评估和预测技术领域。评估方法包括：根据与样本企业关联的样本关联企业的历史涉税数据以及设定的模型建立规则，建立用于对目标企业进行评估的违约指数评估模型；获取所述目标企业在设定统计周期的涉税数据；根据所述目标企业在设定统计周期的涉税数据和所述违约指数评估模型，计算所述目标企业的违约指数。由此，一方面，使用涉税数据可以避免因为财务数据统计不准确而产生的误差，所以得到的评估结果更准确、更全面；另一方面，从关联企业角度，如供应链角度，对企业信用做出评估，可以反应企业在市场结构中的信用情况，从而增加评估结果的可信度。

Description

违约指数评估方法

技术领域

本发明实施例涉及企业信用评估和预测技术领域，尤其涉及一种违约指数评估方法。

背景技术

随着我国社会信用体系的建立和完善以及与金融体系的不断融合，企业信用尤其是企业信贷信用的评估和预测成为了金融体系、信用体系以及企业大数据的交织点和基础。

目前，国内的银行金融机构等对企业信贷信用评估和预测方法中，主要评估依据为财务数据和企业财产。但是，财务数据和企业资产数据存在统计不准确，不能准确反映企业经营状态、市场情况、供应链状态以及交易对手等信息；并且，财务数据存在可追溯性差、追溯成本高、完整性低、可信性低等问题。

在实现本发明过程中，发明人发现现有技术中至少存在如下问题：现有企业信贷信用评估和预测方法所得的结果可信度低。

发明内容

有鉴于此，本发明实施例所解决的技术问题之一在于提供一种违约指数评估方法，用以克服现有技术中，评估和预测方法所得的结果准确性差的缺陷，达到提高评估和预测准确性的效果。

本发明实施例提供一种违约指数评估方法，包括：根据与样本企业关联的样本关联企业的历史涉税数据以及设定的模型建立规则，建立用于对目标企业进行评估的违约指数评估模型；获取目标企业在设定统计周期的涉税数据；根据目标企业在设定统计周期的涉税数据和违约指数评估模型，计算目标企业的违约指数。

可选地，在本发明一具体实施例中，在根据与样本企业关联的样本关联企业的历史涉税数据以及设定的模型建立规则，建立用于对目标企业进行评估的违约指数评估模型之前，方法还包括：获取与样本企业关联的样本关联企业的历史涉税数据，其中，样本关联企业包括与样本企业在供应链上相关联的一个或多个企业。

可选地，在本发明一具体实施例中，获取与样本企业关联的样本关联企业的历史涉税数据包括：选取存在历史违约情况的企业作为样本企业，获取样本关联企业的在样本企业违约时点开始向前回溯至少12个月度的历史涉税数据。

可选地，在本发明一具体实施例中，历史涉税数据包括每个样本关联企业的发票总额、发票总张数中的至少一种。

可选地，在本发明一具体实施例中，根据与样本企业关联的样本关联企业的历史涉税数据以及设定的模型建立规则，建立用于对目标企业进行评估的违约指数评估模型，包括：根据与样本企业关联的样本关联企业的历史涉税数据以及逻辑回归模型建立规则，建立用于对目标企业进行评估的违约指数评估模型。

可选地，在本发明一具体实施例中，根据与样本企业关联的样本关联企业的历史涉税数据以及逻辑回归模型建立规则，建立用于对目标企业进行评估的违约指数评估模型，包括：

对样本关联企业的历史涉税数据进行数据预处理，获得一组或多组样本数据，其中，样本数据中包括样本关联企业与样本企业相关的税务数据、以及样本企业对样本关联企业发生的违约情况；

建立逻辑回归基础函数，其数学形式是：其中，χ表示税务数据，h_θ(χ)表示违约情况，θ表示χ的系数；

通过所述一组或多组样本数据训练所述逻辑回归基础函数，并根据最大近似然函数的方法获得最优的系数θ；

根据所述最优的系数θ，确定逻辑回归计算模型；

根据逻辑回归计算模型、分值转化方法和加权计算公式，确定违约指数计算模型。

可选地，在本发明一具体实施例中，获取目标企业在设定统计周期的涉税数据包括：获取关联企业的在观测时点开始向前回溯至少12个月度与目标企业相关的涉税数据，其中，关联企业包括：与目标企业在供应链上相关联的一个或多个企业。

可选地，在本发明一具体实施例中，根据目标企业在设定统计周期的涉税数据和违约指数评估模型，计算目标企业的违约指数，包括：根据与目标企业相关的单一关联企业的涉税数据和违约指数评估模型，获得目标企业对应单一相关企业的单一违约指数；根据所有单一违约指数和单一相关企业的发票总额和全部相关企业的发票总额，获得目标企业的总体违约指数。

可选地，在本发明一具体实施例中，所述评估方法还包括：对违约指数评估模型进行至少一种模型区分度检验，根据检验结果对违约指数评估模型进行参数调优。

可选地，在本发明一具体实施例中，根据与样本企业关联的样本关联企业的历史涉税数据以及设定的模型建立规则，建立用于对目标企业进行评估的违约指数评估模型，还包括：根据与样本企业关联的样本关联企业的历史涉税数据以及设定的模型建立规则，建立用于对目标企业进行预测的违约指数预测模型。

可选地，在本发明一具体实施例中，根据目标企业在设定统计周期的涉税数据和违约指数评估模型，计算目标企业的违约指数，还包括：根据目标企业在设定统计周期的涉税数据和违约指数预测模型，预测目标企业的一个或多个未来时间点的违约指数。

可选地，在本发明一具体实施例中，所述评估方法还包括：对违约指数预测模型进行至少一种跨时间点模型区分度检验，根据检验结果对违约指数预测模型进行参数调优。

由以上技术方案可见，本发明实施例的违约指数评估方法包括：根据与样本企业关联的样本关联企业的历史涉税数据以及设定的模型建立规则，建立用于对目标企业进行评估的违约指数评估模型；获取所述目标企业在设定统计周期的涉税数据；根据所述目标企业在设定统计周期的涉税数据和所述违约指数评估模型，计算所述目标企业的违约指数。由此，一方面，使用涉税数据可以避免因为财务数据统计不准确而产生的误差，所以得到的评估结果更准确、更全面；另一方面，从关联企业角度，如供应链角度，对企业信用做出评估，可以反应企业在市场结构中的信用情况，从而增加评估结果的可信度。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明实施例中记载的一些实施例，对于本领域普通技术人员来讲，还可以根据这些附图获得其他的附图。

图1为根据本申请实施例一的一种评估方法的步骤流程图；

图2为根据本申请实施例二的一种评估方法的步骤流程图；

图3为根据本申请实施例三的一种评估装置的示意图；

图4为根据本申请实施例四的一种评估装置的示意图；

图5为根据本申请实施例二中区分度检验的一种ROC曲线图；

图6为根据本申请实施例二中区分度检验的一种KS检验曲线图；

图7为根据本申请实施例二中区分度检验的一种好坏样本违约指数分布曲线图。

具体实施方式

为了使本领域的人员更好地理解本发明实施例中的技术方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅是本发明实施例一部分实施例，而不是全部的实施例。基于本发明实施例中的实施例，本领域普通技术人员所获得的所有其他实施例，都应当属于本发明实施例保护的范围。

下面结合本发明实施例附图进一步说明本发明实施例具体实现。

实施例一

图1为根据本申请实施例一的一种评估方法的步骤流程图，如图1所示。

本实施例的违约指数评估方法包括以下步骤：

步骤S101、根据与样本企业关联的样本关联企业的历史涉税数据以及设定的模型建立规则，建立用于对目标企业进行评估的违约指数评估模型。

本实施例中，样本企业包括存在历史违约情况的企业，例如，一个企业与其他企业或单位发生过违约纠纷，则该企业可以作为样本企业。样本关联企业包括与样本企业相关联的一个或多个企业。例如，在供应市场中，样本关联企业可以是样本企业的下游企业等。历史涉税数据包括样本企业与所有样本关联企业交易产生的税务数据；其中，可以设定涉税数据具体的时间段，如，在样本企业发生违约的时间点向前回溯若干月度。

进一步地，设定的模型建立规则包括二分法模型的建立规则，如逻辑回归模型、决策树等。违约指数评估模型用于计算目标企业的违约指数。本实施例中，历史涉税数据可以准确反映样本企业在发生违约前的企业状态，通过使用历史涉税数据建立违约指数评估模型，提高了违约指数评估模型的可信度。

步骤S102、获取目标企业在设定统计周期的涉税数据。

本实施例中，目标企业包括，大型企业、中型企业、小型企业等。设定统计周期可以根据实际情况进行设置，例如，选取在观测时间点前若干月度至观测时间点作为观测周期。涉税数据包括，由关联企业与目标企业交易产生的涉税数据；其中，关联企业包括与目标企业在供应链上相关联的一个或多个企业。

本实施例中，本领域技术人员可以通过任意合适的方式获取目标企业在统计周期的涉税数据，例如，通过第三方税务数据收集前端获取、手动收集、通过查询关联企业获取等等。由此，可以实现方便快捷的获取涉税数据。

步骤S103、根据目标企业在设定统计周期的涉税数据和违约指数评估模型，计算目标企业的违约指数。

本实施例中，目标企业的违约指数可以表示目标企业在当前时间的违约风险，目标企业违约指数越高，表明该企业违约风险越低。其中，违约指数的分值范围可以根据具体分辨需求进行人工设置，如，设置违约指数范围为0-1000。

通过本实施例，根据所述目标企业在设定统计周期的涉税数据和所述违约指数评估模型，计算所述目标企业的违约指数。由此，一方面，使用涉税数据可以避免因为财务数据统计不准确而产生的误差，所以得到的评估结果更准确、更全面；另一方面，从关联企业角度，如供应链角度，对企业做出评估，可以反应企业在市场结构中的信用情况，增加评估结果的可信度。

实施例二

图2为根据本申请实施例二的一种评估方法的步骤流程图，如图2所示。

本实施例的违约指数评估方法包括以下步骤：

步骤S201、获取样本企业违约数据。

本实施例中，样本企业可以是存在历史违约情况的企业；其中，样本企业的违约情况，如，1、样本企业与银行的交易中存在逾期或不良客户记录；2、与其他企业或单位存有司法借贷纠纷。样本企业的违约数据包括一一对应的违约时间、违约对象等。此外，获取样本企业违约数据的方式包括：通过银行提供的数据获取、在司法查询平台查询等。

本实施例，通过使用存在违约情况的企业作为样本企业，可以使评估方法对存在类似与样本企业的企业更敏感，从而能够更容易发现企业的违约风险，从而提高了评估方法的可信度。

步骤S202、获取样本关联企业的税务数据。

本实施例中，样本关联企业包括与样本企业相关联的一个或多个企业。如，当两个或两个以上企业存在交易，就可以认为所述企业相关联。样本关联企业的税务数据能够更准确的反应样本企业的具体情况，例如，供应链中样本关联企业得税务数据，能够准确反映样本企业在供应链中的参与交易的企业组成、交易时间、交易金额等；进一步地，可以分析得到样本企业的交易结构等信息，提高了评估方法的可信度。

进一步地，获取样本关联企业的在样本企业违约时点开始向前回溯至少12个月度的历史涉税数据。其中，历史涉税数据包括每个样本关联企业的发票数据，具体地，发票数据包括专票数据和普票数据。其中发票数据包括票头、字轨号码、联次及用途、客户名称、开票日期、银行开户帐号、开票单位及责任人的至少一种。本实施例中，由于相比于财务数据，税务数据的完整性和准确性高，所以有效提高了评估方法的可信度。

步骤S203、对税务数据进行初步数据处理。

本实施例，根据数据处理方法对获取的税务数据进行数据处理。其中，变量名称和变量定义如表1所示：

表1

本实施例中，初步数据处理如下所述：

对样本关联企业汇总的发票总额取自然对数，得到样本关联企业销项金额转化值ln_s_t_amount_gf。

对样本关联企业汇总发票总数目取自然对数，得到样本关联企业销项发票数量转化值ln_s_fpsl_gf。

HHI(Herfindahl-Hirschman Index，赫芬达尔—赫希曼指数)是一种测量产业集中度的综合指数，表示市场中企业规模的离散度，HHI值越大，表示市场集中程度越高垄断程度越高；N为样本关联企业的企业总数，如果企业总数少于50家，N等于企业总数，如果企业总数不少于50家，则N等于50；X_i为第i个企业的规模，其中i不大于N；X为市场所有企业的总规模；hhi_xf为HHI取百分数的分子。

num4_amount_ration_je表示在统计周期内交易金额排名前4的样本关联企业的交易总金额与所有企业的交易总金额的比值。

zp_ratio为样本企业所开专票数量占其全部开票数量的比值。

步骤S204、建立违约指数评估模型，包括：

根据初步数据处理得到的数据和样本企业的违约数据，获得一组或多组样本数据。

本实施例中，所述样本数据中包括所述样本关联企业与所述样本企业相关的税务数据以及所述样本企业对所述样本关联企业发生的违约情况。其中，税务数据包括发票总金额、发票总数量的至少一种；违约情况包括：发生违约、没有违约；其可以用相应符号代替，如，使用“1”代表样本企业对样本关联企业发生违约，“0”代表样本企业对样本关联企业没有违约。并且，每一组样本数据的税务数据与违约情况一一对应。样本企业对样本关联企业的违约情况，可以从步骤201中的样本企业的违约情况和违约时间确定；进一步地，一旦样本企业发生违约，即视为样本企业对所有样本关联企业发生违约。

建立逻辑回归基础函数，其数学形式是：

其中，h_θ(χ)表示违约情况，χ表示税务数据，θ表示χ的系数。其中，税务数据包括：样本关联企业销项金额转化值，样本关联企业销项发票数量转化值等。

本实施例中，由于使用了逻辑回归函数，h_θ(χ)的取值范围在[0,1]之间，进一步地，可以对h_θ(χ)的阈值进行设置，如，设置阈值a属于(0,1)，当h_θ(χ)大于a时，取h_θ(χ)等于1，当h_θ(χ)小于a时，取h_θ(χ)等于0。

通过所述一组或多组样本数据训练所述逻辑回归基础函数，并根据最大近似然函数的方法获得最优的系数θ。

本实施例中，将所述一组或多组样本数据带入逻辑回归基础函数中，获得关于系数θ的方程，应用最大近似然函数的方法求解方程获得最优的系数θ。本领域技术人员可以采用任意适当的方法获得最优的系数θ，本申请对此不作限定。

根据所述最优的系数θ，确定逻辑回归计算模型。其中，将最优系数θ带入逻辑回归基础函数得到逻辑回归模型。

根据逻辑回归计算模型、分值转化方法和加权计算公式，确定违约指数计算模型；其中，所述步骤包括：

根据逻辑回归计算模型、分值转化方法，获得单一违约指数评估模型。

本实施例中，分值转化方法的评分计算公式如下：

wy_score_gf_i＝A-Blog(adds)

其中，adds为计算过程中的一种中间值；χ表示税务数据，θ表示χ的系数；wy_score_gf_i是目标企业对应的单一样本相关企业的违约指数，A是补偿系数，B是刻度系数。其中，税务数据包括：样本关联企业销项金额转化值，样本关联企业销项发票数量转化值等。

本实施例中，根据在某个特定比率设定的预期分支和指定比率的分数，通过计算即可得补偿系数A和刻度系数B的具体数值，确定单一违约指数评估模型。

根据单一违约指数评估模型和加权计算公式确定违约指数评估模型。

其中加权计算公式的数学形式为：

其中，wy_score_xf包括样本企业总体违约指数；avg_amt_gf_i包括样本企业对应的单一样本相关企业的税务数据金额；avg_amt_gf_{total_xf}包括样本企业对应的所有样本相关企业的税务数据总金额；wy_score_gf_i包括样本企业对应的单一样本相关企业的违约指数。

步骤S205、获取目标企业在设定统计周期的涉税数据。

本实施例中，涉税数据属于关联企业，其包括与目标企业相关的涉税数据。所述关联企业包括：与所述目标企业在供应链上相关联的一个或多个企业。其中，设定周期可以是在观测时点开始向前回溯至少12个月度。进一步地，涉税数据的获取方式包括：通过第三方税务数据收集前端获取、手动收集获取、通过查询关联企业信息获取等等。

步骤S206、根据所述目标企业在设定统计周期的涉税数据和违约指数评估模型，计算所述目标企业的违约指数。

本实施例中，计算过程包括：根据与目标企业相关的单一关联企业的涉税数据和所述违约指数评估模型，获得所述目标企业对应单一相关企业的单一违约指数。根据所有所述单一违约指数和所述单一相关企业的发票总额和全部相关企业的发票总额和总体违约指数计算公式，获得所述目标企业的总体违约指数。

通过上述过程，即可实现对目标企业进行违约指数评估。但为了实现对目标企业违约指数的预测功能，进一步地，还可以执行以下可选步骤S207-S208。

步骤S207、根据与样本企业关联的样本关联企业的历史涉税数据以及设定的模型建立规则，建立用于对目标企业进行预测的违约指数预测模型。

本实施例中，历史涉税数据的选取起点包括在样本企业发生违约的时间点向前回溯若干月度，历史涉税数据的选取终点包括在样本企业发生违约的时间点向前回溯设定月度，其中，设定月度为需要预测的时间段。需要说明的是，历史涉税数据的选取起点要早于选取终点。其中，违约指数预测模型的建立与违约指数评估模型的建立过程相似，详细过程可参考本实施例步骤S201-206。

步骤S208、根据所述目标企业在设定统计周期的涉税数据和所述违约指数预测模型，预测所述目标企业的一个或多个未来时间点的违约指数。

本实施例中，预测所述目标企业的一个或多个未来时间点的违约指数的方法与上述评估目标企业的违约指数的方法相似，详细原理可参考本实施例步骤S206。

通过上述过程，即可实现对目标企业进行违约指数评估。但为了获得更准确的评估结果，进一步地，对违约指数评估模型进行区分度检验，并根据检验结果对违约指数评估模型进行调优。

模型对好坏客户的区分能力，决定了模型的精度，因此在获得违约指数评估模型之后对模型进行至少一种模型区分度检验，根据检验结果对所述违约指数评估模型进行调优。

对违约指数评估模型进行区分度检验包括以下操作：

获取验证企业的历史税务数据。其中，验证企业的历史税务数据包括，验证企业的违约情况和与验证企业相关联企业的税务数据，其中，违约情况和税务数据一一对应。验证企业相关联企业的税务数据的获取方式可以是上述步骤中的税务数据获取方式。

根据验证企业的历史税务数据和违约指数评估模型，获得验证企业的违约指数。其中，将验证企业的历史税务数据输入违约指数评估模型，违约指数评估模型根据所述历史税务数据，计算该企业的总体违约指数。

根据所述总体违约指数判断验证企业违约情况。

根据实际违约情况和判断违约情况进行区分度检验。本实施例中，制作表2以方便对区分度检验进行说明；但本领域技术人员可根据实际情况进行任意的区分度检验。

表2

根据表2的数据对违约指数评估模型进行至少一种模型区分度检验：

1、根据表2数据进行ROC曲线检验。

ROC(Receiver Operating Characteristic Curve，接受者操作特征曲线)及AR(Accurate Ratio，比例系数)系数主要用来检验模型对目标企业的违约状况的正确分辨能力。

例如，根据一个验证企业的违约指数对该验证企业的违约状态进行判断，并生成判断结果，然后比较该判断结果与企业的实际违约状态是否符合；具体情况如表3：

表3

	实际违约	实际不违约
			判断违约	A	B
判断不违约	C	D

如图5为根据本申请实施例二中区分度检验的一种ROC曲线图和表3所示，ROC曲线的纵坐标灵敏度可以是A/(A+C)，即在验证企业发生违约的情况下，根据违约指数判断其发生违约的概率。ROC曲线的横坐标特异度可以是B/(B+D)，即在验证企业不违约的情况下，根据违约指数判断其发生违约的概率。

ROC曲线下方所占的面积与总面积的比值描述了，在所有对验证企业的判断中，判断正确的情况所占的比例。违约指数评估模型对验证企业违约情况的预测能力越强，ROC曲线越往左上角靠近。AR系数表示ROC曲线下方的面积，AR系数的数值值一般在0.5-1.0之间；AR系数的数值越大表示违约指数评估模型判断准确性越高，违约指数评估模型的风险区分能力越强。

2、根据表2数据进行KS检验。

KS(Kolmogorov-Smirnov，柯尔莫哥洛夫-斯米诺夫检验)检验主要是验证模型对验证企业是否违约的区分能力，通常是在违约指数评估模型预测全体验证企业的违约指数后，将全体验证企业按违约与非违约分为两部分，然后用KS统计量来检验这两组样本违约指数的分布是否有显著差异。

图6为根据本申请实施例二中区分度检验的一种KS检验曲线图，纵坐标为违约指数。KS值为两条曲线差值绝对值的最大值。例如，图6中，横坐标表示违约指数阈值区间，纵坐标表示在该违约指数阈值区间中验证企业数量与全部该种类验证企业的比值；其中，曲线0表示“好”的验证企业，曲线1表示“坏”的验证企业，则KS值表示曲线0与曲线1之间的最大差值的绝对值。KS值表示了模型将“好”和“坏”验证企业区分开来的能力；KS值越大，违约指数评估模型的预测准确性越好。

3、根据表2数据进行好坏样本违约指数分布检验。

根据表2数据进行好坏样本违约指数分布检验。图7为根据本申请实施例二中区分度检验的一种好坏样本违约指数分布曲线图，其横坐标表示违约指数阈值区间；纵坐标为在违约指数阈值区间的验证企业数量在总验证企业数量的比值，该值越大表示该阈值区间中含有的企业数量越多。未违约曲线表示为未违约验证企业数量与总验证企业数量的比值及其变化趋势，违约曲线表示违约验证企业与总验证企业数量的比值及其变化趋势。其中违约曲线使用右侧副纵坐标轴，未违约曲线使用左侧纵坐标轴。

从两组曲线趋势可以看出，从阈值低分组到高分组，违约的验证企业在总体验证企业中占比逐渐下降，即违约指数分值越大，企业违约的可能性越小。进一步地，在违约验证企业曲线与未违约验证样本曲线相比较，违约验证企业在相对应占比下的违约指数小于未违约验证样本在相对应占比下的违约指数，表明违约样本违约指数分值集中在低分段，说明违约指数评估模型对验证企业的评分比较准确。

本实施例中，若根据模型区分度检验得到的结果表示评分准确，则表示该违约指数评估模型可信度高，可以在实际应用中使用。若根据模型区分度检验得到的结果表示评分不够准确，进一步地根据检测结果对违约指数评估模型的参数进行调优。例如，对违约指数评估模型的参数进行参数调优；或对异常自变量进行处理，如，将无法计算的自变量进行赋值处理；或对违约样本的选择性偏差进行修正处理，如，目标企业月度票平均开票额度大于70000元时，模型计算结果可能会产生随机偏差，所以对此类个体进行标示，并对其进行个案分析处理。

此外，对违约指数预测模型进行至少一种跨时间点模型区分度检验，根据检验结果对所述违约指数预测模型进行调优。其中，具体方法与上述对违约指数评估模型区分度检验方法和调优方法相似。

通过本实施例，根据目标企业在设定统计周期的涉税数据和违约指数评估模型，计算目标企业的违约指数；可实现对目标企业违约指数的自动化计算。其中，本实施例获取的原始数据为税务数据，与财务数据相比，税务数据的完整性和准确性更高；进一步地，从供应链角度进行企业的违约指数评估，可以反应反映目标企业的经营状态、市场情况、供应链状态，增加违约指数评估的可信度。实现了以税务数据为依据，从供应链角度评估企业的违约指数。从而有效提高了评估方法的可信度。

实施例三

图3为根据本申请实施例三的一种评估装置的示意图，如图3所示。

本申请实施例的评估装置包括：

税务数据获取模块，可以用于获取与样本企业关联的样本关联企业的历史涉税数据；可以用于获取目标企业在设定统计周期的涉税数据。

模型建立模块，用于根据获取与样本企业关联的样本关联企业的历史涉税数据，建立违约指数评估模型。

违约指数计算模块，用于根据违约指数评估模型和目标企业在设定统计周期的涉税数据，计算违约指数。

实施例四

图4为根据本申请实施例四的一种评估装置的示意图，如图4所示。

本申请实施例的评估装置包括：

模型建立模块，用于根据获取与样本企业关联的样本关联企业的历史涉税数据，建立逻辑回归模型；进一步用于根据逻辑回归模型，获得违约指数评估模型。

违约指数计算模块，用于根据违约指数评估模型和目标企业在设定统计周期的涉税数据，计算目标企业的违约指数；用于根据违约指数评估模型和目标企业在设定统计周期的涉税数据，计算目标企业的未来一个或多个时间点的违约指数。

违约指数计算模块包括：

单一违约指数计算单元，用于根据违约指数评估模型和目标企业在设定统计周期的涉税数据，计算目标企业的单一违约指数。

总体违约指数计算单元，用于根据违约指数评估模型，及所有单一违约指数和所有单一相关企业的发票总额和全部相关企业的发票总额，计算目标企业的总体违约指数。

区分度检验模块，用于对违约指数评估模型进行至少一种模型区分度检验，根据检验结果对所述违约指数评估模型进行调优。

当然，实施本发明实施例的任一技术方案必不一定需要同时达到以上的所有优点。

本领域的技术人员应明白，本发明实施例的实施例可提供为方法、装置(设备)、或计算机程序产品。因此，本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明实施例是参照根据本发明实施例的方法、装置(设备)和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本发明实施例的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例作出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。显然，本领域的技术人员可以对本发明实施例进行各种改动和变型而不脱离本发明实施例的精神和范围。这样，倘若本发明实施例的这些修改和变型属于本发明实施例权利要求及其等同技术的范围之内，则本发明实施例也意图包含这些改动和变型在内。

Claims

1.一种违约指数评估方法，其特征在于，包括：

根据与样本企业关联的样本关联企业的历史涉税数据以及设定的模型建立规则，建立用于对目标企业进行评估的违约指数评估模型；

获取所述目标企业在设定统计周期的涉税数据；

根据所述目标企业在设定统计周期的涉税数据和所述违约指数评估模型，计算所述目标企业的违约指数。

2.根据权利要求1所述评估方法，其特征在于，在所述根据与样本企业关联的样本关联企业的历史涉税数据以及设定的模型建立规则，建立用于对目标企业进行评估的违约指数评估模型之前，所述方法还包括：

获取与样本企业关联的样本关联企业的历史涉税数据，其中，所述样本关联企业包括与所述样本企业在供应链上相关联的一个或多个企业。

3.根据权利要求2所述评估方法，其特征在于，所述获取与样本企业关联的样本关联企业的历史涉税数据包括：

选取存在历史违约情况的企业作为样本企业，获取所述样本关联企业的在样本企业违约时点开始向前回溯至少12个月度的历史涉税数据。

4.根据权利要求1-3任一项所述评估方法，其特征在于，所述历史涉税数据包括每个样本关联企业的发票总额、发票总张数中的至少一种。

5.根据权利要求1所述评估方法，其特征在于，

根据与样本企业关联的样本关联企业的历史涉税数据以及设定的模型建立规则，建立用于对目标企业进行评估的违约指数评估模型，包括：

根据与样本企业关联的样本关联企业的历史涉税数据以及逻辑回归模型建立规则，建立用于对目标企业进行评估的违约指数评估模型。

6.根据权利要求5所述评估方法，其特征在于，所述根据与样本企业关联的样本关联企业的历史涉税数据以及逻辑回归模型建立规则，建立用于对目标企业进行评估的违约指数评估模型，包括：

对所述样本关联企业的历史涉税数据进行数据预处理，获得一组或多组样本数据，其中，所述样本数据中包括所述样本关联企业与所述样本企业相关的税务数据、以及所述样本企业对所述样本关联企业发生的违约情况；

根据所述最优的系数θ，确定逻辑回归计算模型；

7.根据权利要求1所述评估方法，其特征在于，所述获取目标企业在设定统计周期的涉税数据包括：

获取关联企业的在观测时点开始向前回溯至少12个月度与目标企业相关的涉税数据，其中，所述关联企业包括：与所述目标企业在供应链上相关联的一个或多个企业。

8.根据权利要求1所述评估方法，其特征在于，根据所述目标企业在设定统计周期的涉税数据和违约指数评估模型，计算所述目标企业的违约指数，包括：

根据与目标企业相关的单一关联企业的涉税数据和所述违约指数评估模型，获得所述目标企业对应单一相关企业的单一违约指数；

根据所有所述单一违约指数和所述单一相关企业的发票总额和全部相关企业的发票总额，获得所述目标企业的总体违约指数。

9.根据权利要求1-3、5-8任一项所述评估方法，其特征在于，还包括：对违约指数评估模型进行至少一种模型区分度检验，根据检验结果对所述违约指数评估模型进行参数调优。

10.根据权利要求1所述评估方法，其特征在于，根据与样本企业关联的样本关联企业的历史涉税数据以及设定的模型建立规则，建立用于对目标企业进行评估的违约指数评估模型，还包括：

根据与样本企业关联的样本关联企业的历史涉税数据以及设定的模型建立规则，建立用于对目标企业进行预测的违约指数预测模型。

11.根据权利要求10所述评估方法，其特征在于，根据所述目标企业在设定统计周期的涉税数据和违约指数评估模型，计算所述目标企业的违约指数，还包括：

根据所述目标企业在设定统计周期的涉税数据和所述违约指数预测模型，预测所述目标企业的一个或多个未来时间点的违约指数。

12.根据权利要求10或11所述评估方法，其特征在于，还包括：对违约指数预测模型进行至少一种跨时间点模型区分度检验，根据检验结果对所述违约指数预测模型进行参数调优。