CN112308295A - 违约概率预测方法及装置 - Google Patents

违约概率预测方法及装置 Download PDF

Info

Publication number
CN112308295A
CN112308295A CN202011080657.5A CN202011080657A CN112308295A CN 112308295 A CN112308295 A CN 112308295A CN 202011080657 A CN202011080657 A CN 202011080657A CN 112308295 A CN112308295 A CN 112308295A
Authority
CN
China
Prior art keywords
probability prediction
default
predicted
time period
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011080657.5A
Other languages
English (en)
Other versions
CN112308295B (zh
Inventor
贺欧文
卜志成
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seashell Housing Beijing Technology Co Ltd
Original Assignee
Beijing Shell Time Network Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Shell Time Network Technology Co ltd filed Critical Beijing Shell Time Network Technology Co ltd
Priority to CN202011080657.5A priority Critical patent/CN112308295B/zh
Publication of CN112308295A publication Critical patent/CN112308295A/zh
Application granted granted Critical
Publication of CN112308295B publication Critical patent/CN112308295B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Data Mining & Analysis (AREA)
  • Operations Research (AREA)
  • Mathematical Optimization (AREA)
  • Tourism & Hospitality (AREA)
  • Mathematical Physics (AREA)
  • General Business, Economics & Management (AREA)
  • Quality & Reliability (AREA)
  • Development Economics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Game Theory and Decision Science (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • Marketing (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Algebra (AREA)
  • Educational Administration (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明实施例提供一种违约概率预测方法及装置,其中,该方法包括:根据待预测目标在预设的时间段内的基础数据,获取基础数据在时间段内各特征时间的变化率,作为待预测目标的概率预测特征;将待预测目标的概率预测特征输入违约概率预测模型,输出待预测目标的违约概率预测结果;其中,违约概率预测模型,是以概率预测特征样本数据为样本,以所述概率预测特征样本数据对应的未违约或违约数据为样本标签进行训练后获得的。本发明实施例提供的违约概率预测方法及装置,通过获取待预测目标的基础数据在时间段内各特征时间的变化率,作为待预测目标的概率预测特征,根据概率预测特征获取违约概率预测结果,能获得更准确的违约概率预测结果。

Description

违约概率预测方法及装置
技术领域
本发明涉及计算机技术领域,尤其涉及一种违约概率预测方法及装置。
背景技术
在对企业或个人进行违约概率预测时,通常是基于提取出的静态特征进行建模,利用建立的模型进行违约概率预测。
静态特征,通常为某一数据本身,例如人员或资金数量等。静态特征,难以反映企业或个人的瞬时动态违约可能性,不具备瞬时动态违约可能性的刻画能力。对于企业或个人而言,不同的时间点的静态特征相同,但是否违约的结果可能完全不同。因此,现有违约概率预测方法存在预测准确率较低的不足。
发明内容
本发明实施例提供一种违约概率预测方法及装置,用以解决现有技术中准确率较低的缺陷,实现更准确的违约概率预测。
本发明实施例提供一种违约概率预测方法,包括:
根据待预测目标在预设的时间段内的基础数据,获取所述基础数据在所述时间段内各特征时间的变化率,作为所述待预测目标的概率预测特征;
将所述待预测目标的概率预测特征输入违约概率预测模型,输出所述待预测目标的违约概率预测结果;
其中,所述违约概率预测模型,是以概率预测特征样本数据为样本,以所述概率预测特征样本数据对应的未违约或违约数据为样本标签进行训练后获得的。
根据本发明一个实施例的违约概率预测方法,所述根据待预测目标在预设的时间段内的基础数据,获取所述基础数据在所述时间段内各特征时间的变化率的具体步骤包括:
根据所述待预测目标所述时间段内的基础数据和预设的时间窗口,获取所述时间段的各子时间段对应的基础数据的滑动平均值,获得滑动平均值曲线;
获取每一所述特征时间对应的所述滑动平均值曲线的导数,作为所述基础数据在所述特征时间的变化率;
其中,所述时间窗口,为时长等于所述子时间段的时长的大于1的整数倍的时间段。
根据本发明一个实施例的违约概率预测方法,所述特征时间为所述时间段的若干个子时间段;
相应地,所述根据待预测目标在预设的时间段内的基础数据,获取所述基础数据在所述时间段内各特征时间的变化率的具体步骤包括:
根据所述待预测目标所述时间段内的基础数据,获取所述若干个子时间段中的每个子时间段的基础数据的同比变化率和/或环比变化率。
根据本发明一个实施例的违约概率预测方法,所述基础数据包括人员数据和/或经营数据。
根据本发明一个实施例的违约概率预测方法,所述人员数据包括员工数量和/或离职员工数量。
根据本发明一个实施例的违约概率预测方法,所述经营数据包括订单数量、订单成交量和订单成交率中的至少一种。
根据本发明一个实施例的违约概率预测方法,所述违约概率预测模型,为多元线性回归模型或神经网络模型。
本发明实施例还提供一种违约概率预测装置,包括:
特征提取模块,用于根据待预测目标在预设的时间段内的基础数据,获取所述基础数据在所述时间段内各特征时间的变化率,作为所述待预测目标的概率预测特征;
概率预测模块,用于将所述待预测目标的概率预测特征输入违约概率预测模型,输出所述待预测目标的违约概率预测结果;
其中,所述违约概率预测模型,是以概率预测特征样本数据为样本,以所述概率预测特征样本数据对应的未违约或违约数据为样本标签进行训练后获得的。
本发明实施例还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述违约概率预测方法的步骤。
本发明实施例还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述违约概率预测方法的步骤。
本发明实施例提供的违约概率预测方法及装置,通过获取待预测目标的基础数据在时间段内各特征时间的变化率,作为待预测目标的概率预测特征,根据待预测目标的概率预测特征,获取待预测目标的违约概率预测结果,采用动态的变化率作为概率预测特征,能最大限度地捕捉瞬时动态违约可能性,能对瞬时动态违约可能性进行灵敏响应,能获得更准确的违约概率预测结果,更能够反映违约可能性的变化趋势,对短期违约可能性的预警作用更加灵敏,能够有效增强违约概率预测。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种违约概率预测方法的流程示意图;
图2是本发明实施例提供的一种违约概率预测装置的结构示意图;
图3是本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为了克服现有技术的上述问题,本发明实施例提供一种违约概率预测方法及装置,其发明构思是,选用反映数据变化的动态特征,进行违约概率预测,以获得更准确的违约概率预测结果。
图1是本发明实施例提供的一种违约概率预测方法的流程示意图。下面结合图1描述本发明实施例的违约概率预测方法。如图1所示,该方法包括:步骤S101、根据待预测目标在预设的时间段内的基础数据,获取基础数据在时间段内各特征时间的变化率,作为待预测目标的概率预测特征。
具体地,基础数据,指与待预测目标的风险状况存在一定相关性的人员、资金、交易和知识产权等方面的数据。
待预测目标,可以为企业或个人等实体。
基础数据,可以包括一项或多项。
预设的时间段,可以为进行违约概率预测的时刻之前的某个时间至进行违约概率预测的时刻之间的时间段。
该时间段的时长,可以预先设定。例如,该时间段的时长为三年、一年或6个月等。对于该时间段的时长的具体取值,本发明实施例不作限定。
本发明实施例中,并不直接将基础数据作为概率预测特征,而是对基础数据进行处理,根据预先选取的该时间段中的特征时间,获取基础数据在时间段内各特征时间的变化率。
特征时间,为在该时间段内针对某一项基础数据选取的若干个时间点或子时间段。
若干个,指一个或多个。
通过选取合适的特征时间,可以使得基础数据在特征时间的变化率与违约概率存在更高的相关性。
例如,对于员工数量这一基础数据,可以选择新年前后、企业年终奖发放前后和应届生毕业时点等中的至少一个作为特征时间,还可以选择有新发布政策或其他外部因素影响的时间点等作为特征时间;对于定案成交量这一基础数据,可以选择节假日、企业推出新产品的时间点和行业规律(周期性)关键时间点等中的至少一个作为特征时间。
根据待预测目标在预设的时间段内的基础数据,可以通过计算等方法,获取基础数据在时间段内每一特征时间的变化率。
可以理解的是,基础数据在特征时间的变化率,反映的不是基础数据的绝对数量,而是基础数据的变化情况,因而是动态的特征,可以捕捉瞬时动态违约可能性,可以作为待预测目标的概率预测特征,用于预测待预测目标的违约概率。
步骤S102、将待预测目标的概率预测特征输入违约概率预测模型,输出待预测目标的违约概率预测结果。
其中,违约概率预测模型,是以概率预测特征样本数据为样本,以概率预测特征样本数据对应的未违约或违约数据为样本标签进行训练后获得的。
具体地,获得待预测目标的概率预测特征之后,将待预测目标的概率预测特征输入训练好的违约概率预测模型,获取待预测目标的违约概率预测结果。
需要说明的是,违约概率预测模型,可以是基于任一种机器学习算法构建的模型。
在步骤S102之前,可以将概率预测特征样本数据作为样本,将概率预测特征样本数据对应的未违约或违约数据作为样本标签,对违约概率预测模型进行训练,获得训练好的违约概率预测模型。
训练好的违约概率预测模型,可以用于对待预测目标的违约概率进行预测。
可以对样本企业在历史时间段内的基础数据进行特征提取,获取样本企业的基础数据在历史时间段内各特征时间的变化率,作为概率预测特征样本数据。
预测特征样本数据对应的未违约或违约数据,指该历史时间段结束后,该样本企业是否违约。如果违约,则为违约数据,该违约数据可以用1表示;如果未违约,则为未违约数据,该未违约数据可以用0表示。
本发明实施例通过获取待预测目标的基础数据在时间段内各特征时间的变化率,作为待预测目标的概率预测特征,根据待预测目标的概率预测特征,获取待预测目标的违约概率预测结果,采用动态的变化率作为概率预测特征,能最大限度地捕捉瞬时动态违约可能性,能对瞬时动态违约可能性进行灵敏响应,能获得更准确的违约概率预测结果,更能够反映违约可能性的变化趋势,对短期违约可能性的预警作用更加灵敏,能够有效增强违约概率预测。
基于上述各实施例的内容,根据待预测目标在预设的时间段内的基础数据,获取基础数据在时间段内各特征时间的变化率的具体步骤包括:根据待预测目标在时间段内的基础数据和预设的时间窗口,获取时间段的各子时间段对应的基础数据的滑动平均值,获得滑动平均值曲线。
其中,时间窗口,为时长等于子时间段的时长的整数倍的时间段。
具体地,为了兼顾变化率的可比性和灵敏度,可以采用滑动时间窗口结合导数的方式,获取基础数据在特征时间的变化率。
可以理解的是,可以将该时间段划分为时间上不存在交叉的多个等时长的子时间段。
例如,时间段的时长为1年时,可以将该时间段按月划分为12个月,每个月均为一个子时间段。
预设的时间窗口是一个时间段。预设的时间窗口的时长,可以为子时间段的时长的大于1的整数倍。
例如,时间段的时长为1年,子时间段的时长为1个月或1周时,可以采用时长为1个季度的时间窗口。
滑动平均法(moving average)又称移动平均法,是在简单平均数法基础上,通过顺序逐期增减新旧数据求算移动平均值,借以消除偶然变动因素,找出事物发展趋势,并据此进行预测的方法。
对于任一子时间段,获取该子时间段对应的基础数据的滑动平均值的具体步骤包括:
根据预设的时间窗口,获取该时间窗口覆盖的多个子时间段;上述多个子时间段,以该任一子时间段为最后一个子时间段;
获取上述多个子时间段的基础数据的加权平均值,作为该任一子时间段对应的滑动平均值。
获取该时间段内各子时间段对应的基础数据的滑动平均值之后,可以获得滑动平均值曲线。
在二维平面坐标系中,该滑动平均值曲线上任一点的横坐标为时间,纵坐标为基础数据的滑动平均值。
获取每一特征时间对应的滑动平均值曲线的导数,作为基础数据在特征时间的变化率。
需要说明的是,本发明实施例中,特征时间,为在该时间段内针对某一项基础数据选取的时间点。
具体地,获得滑动平均值曲线之后,对于每一特征时间,获取该特征时间处滑动平均值曲线的导数,作为该特征时间对应的滑动平均值曲线的导数,并作为基础数据在该特征时间的变化率。
基础数据的同比变化率的可比性较高、灵敏度较低,而环比变化率的可比性较低、灵敏度较高,而通过滑动时间窗口结合导数的方式,则可以兼顾可比性和灵敏度,同时具有较高的可比性和较高的灵敏度。
本发明实施例根据预设的时间窗口,获取基础数据的滑动平均值形成的滑动平均值曲线,将滑动平均值曲线在滑动平均值曲线的导数,作为基础数据在特征时间的变化率,能兼顾动态特征的可比性和灵敏度,能有效地消除基础数据的随机波动,从而能基于动态的概率预测特征,获得更准确的违约概率预测结果。
基于上述各实施例的内容,特征时间为时间段的若干个子时间段。
具体地,可以选择时间段包括的部分或全部子时间段,作为特征时间。
相应地,根据待预测目标预设的时间段内的基础数据,获取基础数据在时间段内各特征时间的变化率的具体步骤包括:根据待预测目标时间段内的基础数据,获取若干个子时间段中的每个子时间段的基础数据的同比变化率和/或环比变化率。
具体地,变化率,可以是同比变化率和/或环比变化率。
同比变化率,指该子时间段的基础数据,相比上一年度同期的基础数据的变化率。
环比变化率,指该子时间段的基础数据,相比该子时间段的上一子时间段的基础数据的变化率。
由于基础数据,可以包括一项或多项,因此,根据每一项基础数据的特点,可以获取该项基础数据的同比变化率或环比变化率,作为变化率。
对于选择同比变化率作为变化率的某项基础数据,对于被选择为特征时间的子时间段,可以获取该子时间段该项基础数据的同比变化率,作为该项基础数据在该特征时间的变化率。
对于选择环比变化率作为变化率的某项基础数据,对于被选择为特征时间的子时间段,可以获取该子时间段该项基础数据的环比变化率,作为该项基础数据在该特征时间的变化率。
本发明实施例通过获取作为特征时间的若干个子时间段的基础数据的同比变化率,作为基础数据在各特征时间的变化率,能提高数据的可比性,通过获取作为特征时间的若干个子时间段的基础数据的环比变化率,作为基础数据在各特征时间的变化率,能提高数据的灵敏性,从而能基于动态的概率预测特征,获得更准确的违约概率预测结果。
基于上述各实施例的内容,基础数据包括人员数据和/或经营数据。
具体地,待预测目标为企业时,基础数据包括人员数据和/或经营数据。
人员数据,指与待预测目标的员工有关的数据。
经营数据,指与待预测目标的业务经营有关的数据。
人员数据的变化情况,可以反映企业的违约可能性。例如,一般情况下,员工数量在短期内大量减少,表示企业的违约可能性较高;员工数量长期保持稳定,表示企业的违约可能性较低。
经营数据的变化情况,也可以反映企业的违约可能性。例如,企业的业绩同比保持上升,表示企业的违约可能性较低;而企业的业绩同比持续下降,表示企业的违约可能性较高。
本发明实施例通过选择人员数据和/或经营数据作为基础数据,从而能通过基础数据的变化率作为动态的概率预测特征,能捕捉企业的瞬时动态违约可能性,能对企业的瞬时动态违约可能性进行灵敏响应,能获得更准确的瞬时违约概率预测结果。
基于上述各实施例的内容,人员数据包括员工数量和/或离职员工数量。
具体地,人员数据,可以包括员工数量、离职员工数量、各类型员工的数量和各类型员工的中离职数量中的至少一种。
员工数量,指现有员工的数量。
员工的类型,可以是根据年龄、性别、学历、从业年限和入职年限等标准中的至少一种确定的类型。
本发明实施例通过选择人员数据作为基础数据,从而能通过基础数据的变化率作为动态的概率预测特征,能捕捉企业的瞬时动态违约可能性,能对企业的瞬时动态违约可能性进行灵敏响应,能获得更准确的瞬时违约概率预测结果。
基于上述各实施例的内容,经营数据包括订单数量、订单成交量和订单成交率中的至少一种。
具体地,订单数量,指订单的总数。
订单成交量,指成交的订单金额的总和。
订单成交率,指发出的订单中,成功进行交易的比例。
本发明实施例通过选择经营数据作为基础数据,从而能通过基础数据的变化率作为动态的概率预测特征,能捕捉企业的瞬时动态违约可能性,能对企业的瞬时动态违约可能性进行灵敏响应,能获得更准确的瞬时违约概率预测结果。
基于上述各实施例的内容,违约概率预测模型,为多元线性回归模型或神经网络模型。
具体地,在回归分析中,因变量的变化往往受几个重要因素的影响,此时就需要用两个或两个以上的影响因素作为自变量来解释因变量的变化,这就是多元回归亦称多重回归。当多个自变量与因变量之间是线性关系时,所进行的回归分析就是多元线性回归。
神经网络模型可以用于解决非线性回归和分类问题,它可以利用训练数据学习出一个非线性方程来进行预测。相比多元线性回归模型,神经网络模型可以捕捉更复杂的关系。
本发明实施例通过将动态的变化率作为概率预测特征,输入多元线性回归模型或神经网络模型,获取待预测目标的违约概率预测结果,能获得更准确的瞬时违约概率预测结果。
下面对本发明实施例提供的违约概率预测装置进行描述,下文描述的违约概率预测装置与上文描述的违约概率预测方法可相互对应参照。
图2为根据本发明实施例提供的违约概率预测装置的结构示意图。基于上述各实施例的内容,如图2所示,该装置包括特征提取模块201和违约概率预测模块202,其中:
特征提取模块201,用于根据待预测目标在预设的时间段内的基础数据,获取基础数据在时间段内各特征时间的变化率,作为待预测目标的概率预测特征;
概率预测模块202,用于将待预测目标的概率预测特征输入违约概率预测模型,输出待预测目标的违约概率预测结果;
其中,违约概率预测模型,是以概率预测特征样本数据为样本,以概率预测特征样本数据对应的未违约或违约数据为样本标签进行训练后获得的。
具体地,特征提取模块201与概率预测模块202电连接。
特征提取模块201根据待预测目标预设的时间段内的基础数据,可以通过计算等方法,获取基础数据在时间段内每一特征时间的变化率。
概率预测模块202将待预测目标的概率预测特征输入训练好的违约概率预测模型,获取待预测目标的违约概率预测结果。
本发明实施例提供的违约概率预测装置,用于执行本发明上述各实施例提供的违约概率预测方法,该违约概率预测装置包括的各模块实现相应功能的具体方法和流程详见上述违约概率预测方法的实施例,此处不再赘述。
该违约概率预测装置用于前述各实施例的违约概率预测方法。因此,在前述各实施例中的违约概率预测方法中的描述和定义,可以用于本发明实施例中各执行模块的理解。
本发明实施例通过获取待预测目标的基础数据在时间段内各特征时间的变化率,作为待预测目标的概率预测特征,根据待预测目标的概率预测特征,获取待预测目标的违约概率预测结果,采用动态的变化率作为概率预测特征,能最大限度地捕捉瞬时动态违约可能性,能对瞬时动态违约可能性进行灵敏响应,能获得更准确的违约概率预测结果,更能够反映违约可能性的变化趋势,对短期违约可能性的预警作用更加灵敏,能够有效增强违约概率预测。
图3示例了一种电子设备的实体结构示意图,如图3所示,该电子设备可以包括:处理器(processor)301、存储器(memory)302和总线303;其中,处理器301和存储器302通过总线303完成相互间的通信;处理器301用于调用存储在存储器302中并可在处理器301上运行的计算机程序指令,以执行上述各方法实施例提供的违约概率预测方法,该方法包括:根据待预测目标在预设的时间段内的基础数据,获取基础数据在时间段内各特征时间的变化率,作为待预测目标的概率预测特征;将待预测目标的概率预测特征输入违约概率预测模型,输出待预测目标的违约概率预测结果;其中,违约概率预测模型,是以概率预测特征样本数据为样本,以概率预测特征样本数据对应的未违约或违约数据为样本标签进行训练后获得的。
此外,上述的存储器302中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,RandomAccessMemory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明实施例还提供一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法实施例所提供的违约概率预测方法,该方法包括:根据待预测目标在预设的时间段内的基础数据,获取基础数据在时间段内各特征时间的变化率,作为待预测目标的概率预测特征;将待预测目标的概率预测特征输入违约概率预测模型,输出待预测目标的违约概率预测结果;其中,违约概率预测模型,是以概率预测特征样本数据为样本,以概率预测特征样本数据对应的未违约或违约数据为样本标签进行训练后获得的。
又一方面,本发明实施例还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各实施例提供的违约概率预测方法,该方法包括:根据待预测目标在预设的时间段内的基础数据,获取基础数据在时间段内各特征时间的变化率,作为待预测目标的概率预测特征;将待预测目标的概率预测特征输入违约概率预测模型,输出待预测目标的违约概率预测结果;其中,违约概率预测模型,是以概率预测特征样本数据为样本,以概率预测特征样本数据对应的未违约或违约数据为样本标签进行训练后获得的。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种违约概率预测方法,其特征在于,包括:
根据待预测目标在预设的时间段内的基础数据,获取所述基础数据在所述时间段内各特征时间的变化率,作为所述待预测目标的概率预测特征;
将所述待预测目标的概率预测特征输入违约概率预测模型,输出所述待预测目标的违约概率预测结果;
其中,所述违约概率预测模型,是以概率预测特征样本数据为样本,以所述概率预测特征样本数据对应的未违约或违约数据为样本标签进行训练后获得的。
2.根据权利要求1所述的违约概率预测方法,其特征在于,所述根据待预测目标在预设的时间段内的基础数据,获取所述基础数据在所述时间段内各特征时间的变化率的具体步骤包括:
根据所述待预测目标在所述时间段内的基础数据和预设的时间窗口,获取所述时间段的各子时间段对应的基础数据的滑动平均值,获得滑动平均值曲线;
获取每一所述特征时间对应的所述滑动平均值曲线的导数,作为所述基础数据在所述特征时间的变化率;
其中,所述时间窗口,为时长等于所述子时间段的时长的大于1的整数倍的时间段。
3.根据权利要求1所述的违约概率预测方法,其特征在于,所述特征时间为所述时间段的若干个子时间段;
相应地,所述根据待预测目标在预设的时间段内的基础数据,获取所述基础数据在所述时间段内各特征时间的变化率的具体步骤包括:
根据所述待预测目标所述时间段内的基础数据,获取所述若干个子时间段中的每个子时间段的基础数据的同比变化率和/或环比变化率。
4.根据权利要求1所述的违约概率预测方法,其特征在于,所述基础数据包括人员数据和/或经营数据。
5.根据权利要求4所述的违约概率预测方法,其特征在于,所述人员数据包括员工数量和/或离职员工数量。
6.根据权利要求4所述的违约概率预测方法,其特征在于,所述经营数据包括订单数量、订单成交量和订单成交率中的至少一种。
7.根据权利要求1至6任一所述的违约概率预测方法,其特征在于,所述违约概率预测模型,为多元线性回归模型或神经网络模型。
8.一种违约概率预测装置,其特征在于,包括:
特征提取模块,用于根据待预测目标在预设的时间段内的基础数据,获取所述基础数据在所述时间段内各特征时间的变化率,作为所述待预测目标的概率预测特征;
概率预测模块,用于将所述待预测目标的概率预测特征输入违约概率预测模型,输出所述待预测目标的违约概率预测结果;
其中,所述违约概率预测模型,是以概率预测特征样本数据为样本,以所述概率预测特征样本数据对应的未违约或违约数据为样本标签进行训练后获得的。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7任一项所述的违约概率预测方法的步骤。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1至7任一项所述的违约概率预测方法的步骤。
CN202011080657.5A 2020-10-10 2020-10-10 违约概率预测方法及装置 Active CN112308295B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011080657.5A CN112308295B (zh) 2020-10-10 2020-10-10 违约概率预测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011080657.5A CN112308295B (zh) 2020-10-10 2020-10-10 违约概率预测方法及装置

Publications (2)

Publication Number Publication Date
CN112308295A true CN112308295A (zh) 2021-02-02
CN112308295B CN112308295B (zh) 2024-06-21

Family

ID=74488323

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011080657.5A Active CN112308295B (zh) 2020-10-10 2020-10-10 违约概率预测方法及装置

Country Status (1)

Country Link
CN (1) CN112308295B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106529729A (zh) * 2016-11-18 2017-03-22 同济大学 基于BP_Adaboost模型的信用卡用户违约的预测方法及系统
CN107527288A (zh) * 2017-06-16 2017-12-29 兴业数字金融服务(上海)股份有限公司 一种债券存续期风险预警系统
CN108256691A (zh) * 2018-02-08 2018-07-06 成都智宝大数据科技有限公司 还款概率预测模型构建方法及装置
CN110246024A (zh) * 2018-10-25 2019-09-17 爱信诺征信有限公司 违约指数评估方法
CN110458324A (zh) * 2019-07-04 2019-11-15 重庆金融资产交易所有限责任公司 风险概率的计算方法、装置和计算机设备

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106529729A (zh) * 2016-11-18 2017-03-22 同济大学 基于BP_Adaboost模型的信用卡用户违约的预测方法及系统
CN107527288A (zh) * 2017-06-16 2017-12-29 兴业数字金融服务(上海)股份有限公司 一种债券存续期风险预警系统
CN108256691A (zh) * 2018-02-08 2018-07-06 成都智宝大数据科技有限公司 还款概率预测模型构建方法及装置
CN110246024A (zh) * 2018-10-25 2019-09-17 爱信诺征信有限公司 违约指数评估方法
CN110458324A (zh) * 2019-07-04 2019-11-15 重庆金融资产交易所有限责任公司 风险概率的计算方法、装置和计算机设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
兰云鹏等: "Logistic回归分析在违约概率预测中的应用", 《哈尔滨师范大学自然科学学报》, vol. 35, no. 02, 15 April 2019 (2019-04-15) *

Also Published As

Publication number Publication date
CN112308295B (zh) 2024-06-21

Similar Documents

Publication Publication Date Title
Haslbeck et al. A tutorial on estimating time-varying vector autoregressive models
Ardia et al. Generalized autoregressive score models in R: The GAS package
Fulop et al. Efficient learning via simulation: A marginalized resample-move approach
Bardwell et al. Most recent changepoint detection in panel data
US20210303970A1 (en) Processing data using multiple neural networks
US11062240B2 (en) Determining optimal workforce types to fulfill occupational roles in an organization based on occupational attributes
CN111401777A (zh) 企业风险的评估方法、装置、终端设备及存储介质
US20200234218A1 (en) Systems and methods for entity performance and risk scoring
US20110153536A1 (en) Computer-Implemented Systems And Methods For Dynamic Model Switching Simulation Of Risk Factors
WO2020258994A1 (zh) 一种节点数据预测方法及装置
US20150081398A1 (en) Determining a performance target setting
US11763049B1 (en) Systems and methods for time series simulation
US20230359941A1 (en) System and method for efficient transformation prediction in a data analytics prediction model pipeline
Pasricha et al. Markov regenerative credit rating model
Hautsch et al. Multivariate dynamic intensity peaks‐over‐threshold models
CN112308293B (zh) 违约概率预测方法及装置
Soujanya et al. Evaluating future stock value asset using machine learning
US20240037370A1 (en) Automated data forecasting using machine learning
US20220067460A1 (en) Variance Characterization Based on Feature Contribution
CN113553234A (zh) 数据异常检测方法
US20240020436A1 (en) Automated data quality monitoring and data governance using statistical models
CN112308295A (zh) 违约概率预测方法及装置
CN115858291A (zh) 一种系统指标的检测方法、装置、电子设备及其存储介质
TW201506827A (zh) 用以從經整理及分析之一段時間內資料信號導出實質變化屬性以預測傳統預測因子之未來變化的系統及方法
CN113129127A (zh) 预警方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20240826

Address after: Room 102, 1st Floor, Building 1, No. 2 Chuangye Road, Haidian District, Beijing, 100080

Patentee after: Seashell Housing (Beijing) Technology Co.,Ltd.

Country or region after: China

Address before: Room 106-802, building 2, yard 8, Xingsheng South Road, Miyun District, Beijing

Patentee before: Beijing Shell Time Network Technology Co.,Ltd.

Country or region before: China