CN118037468A - 回收风险预测模型训练以及票据回收风险评估方法、装置 - Google Patents
回收风险预测模型训练以及票据回收风险评估方法、装置 Download PDFInfo
- Publication number
- CN118037468A CN118037468A CN202410183410.8A CN202410183410A CN118037468A CN 118037468 A CN118037468 A CN 118037468A CN 202410183410 A CN202410183410 A CN 202410183410A CN 118037468 A CN118037468 A CN 118037468A
- Authority
- CN
- China
- Prior art keywords
- risk
- bill
- sample data
- recovery
- prediction model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000011084 recovery Methods 0.000 title claims abstract description 258
- 238000013058 risk prediction model Methods 0.000 title claims abstract description 207
- 238000012549 training Methods 0.000 title claims abstract description 102
- 238000000034 method Methods 0.000 title claims abstract description 87
- 238000012502 risk assessment Methods 0.000 title claims abstract description 45
- 238000004064 recycling Methods 0.000 claims abstract description 105
- 238000003860 storage Methods 0.000 claims description 13
- 238000004590 computer program Methods 0.000 claims description 10
- 238000002360 preparation method Methods 0.000 claims description 4
- 230000006870 function Effects 0.000 description 30
- 238000004891 communication Methods 0.000 description 19
- 238000012545 processing Methods 0.000 description 18
- 238000007726 management method Methods 0.000 description 16
- 238000010586 diagram Methods 0.000 description 14
- 230000008569 process Effects 0.000 description 12
- 238000003062 neural network model Methods 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 6
- 238000009826 distribution Methods 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 238000009877 rendering Methods 0.000 description 2
- 239000002689 soil Substances 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000013475 authorization Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 230000009469 supplementation Effects 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02W—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO WASTEWATER TREATMENT OR WASTE MANAGEMENT
- Y02W90/00—Enabling technologies or technologies with a potential or indirect contribution to greenhouse gas [GHG] emissions mitigation
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本说明书实施例公开了一种回收风险预测模型训练以及票据回收风险评估方法、装置。获取样本数据,样本数据的标准类别标签用于描述样本数据不存在逾期风险的概率以及样本数据存在逾期风险的概率;将样本数据输入回收风险预测模型,得到样本数据对应的预测类别标签;根据标准类别标签以及预测类别标签训练回收风险预测模型。由于样本数据中包含了不明确是否存在逾期风险的样本数据,那么使用这样的样本数据来训练回收风险预测模型,就可以使得回收风险预测模型学习到不明确标签的数据的特征,扩大样本数据的可用范围,增强模型对各类型数据的风险预测性能。
Description
技术领域
本说明书实施例涉及计算机技术领域,尤其涉及一种回收风险预测模型训练以及票据回收风险评估方法、装置。
背景技术
随着企业的不断发展,企业的经营项目变得纷繁多样,与之相应的供应商也越来越多。企业采购产品或服务时,常见的交易模式有先款后票和先票后款等模式。在先款后票模式下,企业先向供应商付款,供应商在收款后开具相应发票给企业,企业则需要对供应商开具的发票进行回收,来完成后续的税务操作。票据回收的及时性影响了企业的税务处理效率,因此需要一种票据回收风险评估方法,对票据的回收风险进行量化,以使得企业能够高效管理票据流程。
发明内容
本说明书实施例提供一种回收风险预测模型训练以及票据回收风险评估方法、装置,可以解决相关技术中票据回收期限难以管理、逾期风险无法预测的技术问题。
第一方面,本说明书实施例提供一种回收风险预测模型训练方法,该方法包括:
获取样本数据,所述样本数据的标准类别标签用于描述所述样本数据不存在逾期风险的概率以及所述样本数据存在逾期风险的概率;
将所述样本数据输入回收风险预测模型,得到所述样本数据对应的预测类别标签;
根据所述标准类别标签以及所述预测类别标签训练所述回收风险预测模型,直至所述回收风险预测模型收敛。
第二方面,本说明书实施例提供一种票据回收风险评估方法,该方法包括:
获取至少一个待回票账单,所述待回票账单为需要回收预设类型票据的账单;
将各待回票账单输入回收风险预测模型,确定所述回收风险预测模型对各待回票账单输出的回收风险概率;
根据各待回票账单对应的回收风险概率确定各待回票账单对应的风险评估结果;
其中,所述回收风险预测模型为上述任一实施例所述中的回收风险预测模型训练方法训练得到的回收风险预测模型。
第三方面,本说明书实施例提供一种回收风险预测模型训练装置,该装置包括:
数据准备模块,用于获取样本数据,所述样本数据的标准类别标签用于描述所述样本数据不存在逾期风险的概率以及所述样本数据存在逾期风险的概率;
预测输出模块,用于将所述样本数据输入回收风险预测模型,得到所述样本数据对应的预测类别标签;
模型训练模块,用于根据所述标准类别标签以及所述预测类别标签训练所述回收风险预测模型,直至所述回收风险预测模型收敛。
第四方面,本说明书实施例提供一种票据回收风险评估装置,该装置包括:
账单获取模块,用于获取至少一个待回票账单,所述待回票账单为需要回收预设类型票据的账单;
风险预测模块,用于将各待回票账单输入回收风险预测模型,确定所述回收风险预测模型对各待回票账单输出的回收风险概率;
风险评估模块,用于根据各待回票账单对应的回收风险概率确定各待回票账单对应的风险评估结果;
其中,所述回收风险预测模型为上述任一实施例中所述的回收风险预测模型训练方法训练得到的回收风险预测模型。
第五方面,本说明书实施例提供一种包含指令的计算机程序产品,当所述计算机程序产品在计算机或处理器上运行时,使得所述计算机或所述处理器执行上述的方法的步骤。
第六方面,本说明书实施例提供一种计算机存储介质,所述计算机存储介质存储有多条指令,所述指令适于由处理器加载并执行上述的方法的步骤。
第七方面,本说明书实施例提供一种终端,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述计算机程序适于由处理器加载并执行上述的方法的步骤。
本说明书一些实施例提供的技术方案带来的有益效果至少包括:
本说明书实施例提供一种回收风险预测模型训练,获取样本数据,样本数据的标准类别标签用于描述样本数据不存在逾期风险的概率以及样本数据存在逾期风险的概率;将样本数据输入回收风险预测模型,得到样本数据对应的预测类别标签;根据标准类别标签以及预测类别标签训练回收风险预测模型,直至回收风险预测模型收敛。由于样本数据的标准类别标签描述了样本数据不存在逾期风险的概率,以及样本数据存在逾期风险的概率,就说明样本数据中包含了不明确是否存在逾期风险的样本数据,那么使用这样的样本数据来训练回收风险预测模型,就可以使得回收风险预测模型学习到不明确标签的数据的特征,扩大样本数据的可用范围,增强模型对各类型数据的风险预测性能,最终提高模型在实际场景中的风险预测准确度,有效提升了票据回收的工作效率。
附图说明
为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本说明书实施例提供的一种票据回收风险评估方法的示例性系统架构图;
图2为本说明书实施例提供的一种回收风险预测模型训练方法的流程示意图;
图3为本说明书另一实施例提供的一种回收风险预测模型训练方法的流程示意图;
图4为本说明书实施例提供的一种回收风险预测模型的架构示意图;
图5为本说明书实施例提供的一种票据回收风险评估方法的流程示意图;
图6为本说明书实施例提供的一种票据回收风险预测系统的架构示意图;
图7为本说明书另一实施例提供的一种票据回收风险评估方法的流程示意图;
图8为本说明书实施例提供的一种票据回收风险评估方法的交互流程图;
图9为本说明书实施例提供的一种回收风险预测模型训练装置的结构框图;
图10为本说明书实施例提供的一种票据回收风险评估装置的结构框图;
图11为本说明书实施例提供的一种终端的结构示意图;
图12为本说明书另一实施例提供的一种终端的结构示意图。
具体实施方式
为使得本说明书实施例的特征和优点能够更加的明显和易懂,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而非全部实施例。基于本说明书中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本说明书实施例保护的范围。
下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本说明书实施例相一致的所有实施方式。相反,它们仅是如所附权利要求书中所详述的、本说明书实施例的一些方面相一致的装置和方法的例子。
随着企业的不断发展,企业的经营项目变得纷繁多样,与之相应的供应商也越来越多。企业采购产品或服务时,常见的交易模式有先款后票和先票后款等模式。在先款后票模式下,企业先向供应商付款,供应商在收款后开具相应发票给企业,企业则需要对供应商开具的发票进行回收,来完成后续的税务操作,票据回收操作能保证企业的经营合规性并减少企业税务成本。
通常在先款后票模式下,既有通过合同约定最晚开票期限的交易方式,也有不约定最晚开票期限的交易方式,这使得票据回收往往依赖于财务人员的经验来进行流程管理,在仅依赖于企业财务人员人工经验管理进项票回收的情形下,财务人员需要对纷繁多样的供应商进行回票管理,不同的供应商回票周期有长有短,难以使用统一的标准衡量回票周期。在这种情况下,财务人员只能根据人工经验来判断在有合同约定的情形下,对不同的供应商应当在合同约定的最晚开票日期前多久进行开票催办和跟进;以及在无合同约定的情形下,对不同的供应商应当在什么时间进行开票催办和跟进。这样的票据回收流程不仅提高了票据管理的人工成本,也容易导致企业在使用票据办理税务工作的时间延迟,不利于企业的资金成本管理。
票据回收的及时性影响了企业的税务处理效率,因此需要一种票据回收风险评估方法,对票据的回收风险进行量化,以使得企业能够高效管理票据流程。
因此本说明书实施例提供一种回收风险预测模型训练方法,以解决上述票据回收期限难以管理、逾期风险无法预测的技术问题。
请参阅图1,图1为本说明书实施例提供的一种票据回收风险评估方法的示例性系统架构图。
如图1所示,系统架构可以包括终端101、网络102和服务器103。网络102用于在终端101和服务器103之间提供通信链路的介质。网络102可以包括各种类型的有线通信链路或无线通信链路,例如:有线通信链路包括光纤、双绞线或同轴电缆的,无线通信链路包括蓝牙通信链路、无线保真(Wireless-Fidelity,Wi-Fi)通信链路或微波通信链路等。
终端101可以通过网络102与服务器103交互,以接收来自服务器103的消息或向服务器103发送消息,或者终端101可以通过网络102与服务器103交互,进而接收其他用户向服务器103发送的消息或者数据。终端101可以是硬件,也可以是软件。当终端101为硬件时,可以是各种电子设备,包括但不限于智能手表、智能手机、平板电脑、膝上型便携式计算机和台式计算机等。当终端101为软件时,可以是安装在上述所列举的电子设备中,其可以实现呈多个软件或软件模块(例如:用来提供分布式服务),也可以实现成单个软件或软件模块,在此不作具体限定。
在本说明书实施例中,终端101获取样本数据,样本数据的标准类别标签用于描述样本数据不存在逾期风险的概率以及样本数据存在逾期风险的概率;进一步地,终端101将样本数据输入回收风险预测模型,得到样本数据对应的预测类别标签;基于此,终端101根据标准类别标签以及预测类别标签训练回收风险预测模型,直至回收风险预测模型收敛。
服务器103可以是提供各种服务的业务服务器。需要说明的是,服务器103可以是硬件,也可以是软件。当服务器103为硬件时,可以实现成多个服务器组成的分布式服务器集群,也可以实现成单个服务器。当服务器103为软件时,可以实现成多个软件或软件模块(例如用来提供分布式服务),也可以实现成单个软件或软件模块,在此不做具体限定。
或者,该系统架构还可以不包括服务器103,换言之,服务器103可以为本说明书实施例中可选的设备,即本说明书实施例提供的方法可以应用于仅包括终端101的系统结构中,本说明书实施例对此不做限定。
应理解,图1中的终端、网络以及服务器的数目仅是示意性的,根据实现需要,可以是任意数量的终端、网络以及服务器。
请参阅图2,图2为本说明书实施例提供的一种回收风险预测模型训练方法的流程示意图。本说明书实施例的执行主体可以是执行回收风险预测模型训练的终端,也可以是执行回收风险预测模型训练方法的终端中的处理器,还可以是执行回收风险预测模型训练方法的终端中的回收风险预测模型训练服务。为方便描述,下面以执行主体是终端中的处理器为例,介绍回收风险预测模型训练方法的具体执行过程。
如图2所示,回收风险预测模型训练方法至少可以包括:
S202、获取样本数据,样本数据的标准类别标签用于描述样本数据不存在逾期风险的概率以及样本数据存在逾期风险的概率。
可选地,在处理各种交易时,各类票据的回收期限没有固定周期和规律,而票据回收一旦逾期就可能会影响企业的税务计划,影响企业内部的资金成本,这就导致票据回收非常依赖于财务人员的人工经验,需要财务人员依据自己的经验来对各项待回收票据进行催收和管理。具体的,财务人员在管理票据回收案件时,需要对票据的回收逾期风险进行分析判断,也就是需要判断各项待回收票据是否存在逾期风险,以及存在逾期风险的程度,然后具有不同程度逾期风险的待回收票据可能具有不同的催收优先级或者催收策略,根据这些催收策略来实现在非逾期的期限内对票据进行回收。然而人工经验的学习成本高、学习周期长,财务人员可能需要经过长时间、多方面的学习才能够积攒一定的票据回收经验,并且人工经验在分析票据逾期风险时的准确度也是有限的,导致票据回收的效率低,成本高,不适用于大体量待回收票据的统一处理。
可选地,待回收票据的各项特征能够用于分析该票据是否存在逾期风险,例如根据票据的供应商特征信息可以确定该票据是否具有最晚回收期限以及最晚回收期限是多久,还可以确定该供应商的平均回票周期、逾期次数、平均逾期时间等,那么使用神经网络模型来对样本票据数据的特征进行学习,神经网络模型就能总结出各种票据特征对票据逾期风险的影响,从而具有根据待回收票据的特征来预测出该待回收票据的逾期风险的性能。
可选地,使用神经网络模型来预测待回收票据的逾期风险之前,需要先基于样本数据对神经网络模型进行训练,那么首先需要得到能够用于训练的样本数据。在一种可行的实施方式中,真实环境中的历史数据比计算机生成的虚构数据更具有代表性,那么样本数据可以通过对历史真实数据进行处理得到。
可选地,准备样本数据时,对样本数据添加的标注方式会直接影响神经网络模型对样本数据的学习和预测方向。目前在训练神经网络模型时,有基于账龄分析方法的票据回收风险预估方式,该方法通过账龄分析对各供应商不同欠票单据的风险等级进行打标,然后通过样本数据的标签分析不同供应商的欠票趋势及稳定周期,得到供应商的正常回票周期,从而根据正常回票周期划分欠票账单的风险等级。然而该方法也存在明显的缺点:第一,基于账龄分析的方法需要人工选择作为特征的账龄,并建立相应的预测模型,这同样需要大量专业知识和人工经验,且可能存在主观性和偏差;第二,基于账龄分析方法的预测模型通常是基于线性回归或简单的统计方法,无法准确捕捉数据中的复杂非线性关系;第三,基于账龄分析方法的预测模型对数据量和数据质量要求较高,在数据量不足或者存在噪声和缺失值时,可能导致预测结果不准确或不可靠。
进一步地,为了让模型更准确的学习数据特征与回收风险之间的关联性,对样本数据进行标注时,可以直接根据各样本数据对应的真实回收风险来进行打标,也即对于回收时已经超期的样本数据,其标签标注为“存在逾期风险”,而对于回收时还未超期的样本数据,其标签标注为“不存在逾期风险”,这样神经网络模型能更直观的学习样本数据本身的数据特征与逾期风险之间的关系,而不受到基于人工经验而规定的打标规则的限制。
更进一步地,在使用实际场景下的历史票据数据来构建样本数据时,不一定所有历史票据数据都具有明确的分类,例如在存在约定回收期限的情形下,根据历史票据的真实回收时间是否超过约定回收期限,可以确定该历史票据的标签属于“存在逾期风险”或者“不存在逾期风险”;或是在不存在约定回收期限的情形下,无法回收的历史票据的标签可以明确为“存在逾期风险”,那么这些情况下可以直接通过账单流逝的时间来判断其票据回收的逾期风险。但实际上,部分提供票据的供应商有其自己的回票周期,这些供应商按照其内部的回票周期进行自己的回票管理,这个回票周期既不是与我方约定好的回收期限,也不是随机的,当这类供应商的票据已经超过其内部的回票周期时,即使还没有超过约定的回收期限,其发票回收也容易逾期,因此,容易理解到,待回收票据的回收风险并不仅由约定回收期限、实际回收期限来决定,而是与其供应商信息、票据本身信息等多项特征共同影响的。
可选地,对于不能明确为“存在逾期风险”或者“不存在逾期风险”,而是既有可能“存在逾期风险”也有可能“不存在逾期风险”的样本数据,由于这类样本数据不能具有明确的类别标签,因此使用这种样本数据来进行模型训练时,即为弱监督学习,此时可以采用偏标签学习(Partial Label Learning)的方式来实现模型训练,偏标签学习能够适用于具有标签不确定性的现实世界数据标注场景。
在本说明书实施例中,使用偏标签学习的模型训练方法来训练回收风险预测模型时,样本数据包括黑样本、白样本以及灰样本,其中黑样本为存在逾期风险的样本,白样本为不存在逾期风险的样本,而灰样本则为既可能存在逾期风险也可能不存在逾期风险的不确定性样本。那么为了对灰样本进行打标,样本数据的标准类别标签就不能只是“存在逾期风险”或者“不存在逾期风险”这两类,而是需要能描述样本数据不存在逾期风险的概率以及样本数据存在逾期风险的概率,这样才能对灰样本进行打标,然后将样本数据用于训练回收风险预测模型时,帮助回收风险预测模型挖掘账单票据回收的预估风险。
可选地,在模型的具体训练过程中,为了便于模型的学习,黑样本作为存在逾期风险的样本,那么可以将黑样本的标签标注为(0,1),标签含义为该样本为白样本的概率为0,为黑样本的概率为1,那么简化标签可以直接确定黑样本的标签为1;同样的,白样本作为不存在逾期风险的样本,可以确定白样本的标签为0;灰样本则使用代理标签,代理标签就描述了灰样本为白样本的概率和灰样本为白样本的概率,例如,若灰样本的标签为(0.2,0.8),其中0.2就代表灰样本为白样本的概率,0.8就代表灰样本为黑样本的概率。
S204、将样本数据输入回收风险预测模型,得到样本数据对应的预测类别标签。
可选地,在准备好样本数据之后,使用样本数据训练回收风险预测模型,将样本数据输入回收风险预测模型,回收风险预测模型会对样本数据进行类别预测,回收风险预测模型会在内部判断各样本数据存在逾期风险的可能性和不存在逾期风险的可能性,然后输出样本数据对应的预测类别标签。
S206、根据标准类别标签以及预测类别标签训练回收风险预测模型,直至回收风险预测模型收敛。
可选地,根据样本数据的标准类别标签以及预测类别标签可以训练回收风险预测模型,直至回收风险预测模型收敛,收敛后的回收风险预测模型可以用于实际场景中对待回收票据进行回收逾期风险的预测。收敛后的回收风险预测模型由于在训练过程中使用了灰样本,样本数据的类别标签描述了样本分别属于两个分类的概率,有利于模型学习到类别不明确的数据的特征,当模型用于在实际场景下预测票据回收风险时,可以有效提升回收风险的预测准确性,降低票据回收的人力物力成本,提高票据回收的效率。
具体地,训练神经网络模型时,通常会根据训练需求构建损失函数,损失函数可以评价网络模型输出的预测值和真实值不一样的程度,基于损失函数可以指导网络模型的优化方向,以使得网络模型的输出与标准值靠近,直至达到预设拟合效果。在本说明书实施例中,样本数据的标准类别标签代表了样本数据的真实情况,样本数据的预测类别标签代表了模型对其的预测结果,那么在构建损失函数时,可以使用损失函数计算标准类别标签与预测类别标签之间的差别程度作为损失值,也即根据标准类别标签以及预测类别标签计算回收风险预测模型的损失值,该损失值即为回收风险预测模型的当前预测性能与预期预测性能之间的差距,那么基于损失值训练回收风险预测模型,能够使得回收风险预测模型逐渐学习真实场景下数据与结果之间的关联性,逐渐向预期拟合效果收敛。
在本说明书实施例中,提供一种回收风险预测模型训练方法,获取样本数据,样本数据的标准类别标签用于描述样本数据不存在逾期风险的概率以及样本数据存在逾期风险的概率;将样本数据输入回收风险预测模型,得到样本数据对应的预测类别标签;根据标准类别标签以及预测类别标签训练回收风险预测模型,直至回收风险预测模型收敛。由于样本数据的标准类别标签描述了样本数据不存在逾期风险的概率,以及样本数据存在逾期风险的概率,就说明样本数据中包含了不明确是否存在逾期风险的样本数据,那么使用这样的样本数据来训练回收风险预测模型,就可以使得回收风险预测模型学习到不明确标签的数据的特征,扩大样本数据的可用范围,增强模型对各类型数据的风险预测性能,最终提高模型在实际场景中的风险预测准确度,有效提升了票据回收的工作效率。
请参阅图3,图3为本说明书另一实施例提供的一种回收风险预测模型训练方法的流程示意图。
如图3所示,回收风险预测模型训练方法至少可以包括:
S302、获取样本数据,样本数据的标准类别标签用于描述样本数据不存在逾期风险的概率以及样本数据存在逾期风险的概率。
关于步骤S302,请参阅步骤S202中的详细记载,此处不再赘述。
S304、当回收风险预测模型中包括偏标签学习分支模型时,将样本数据输入偏标签学习分支模型中,得到样本数据对应的第一预测类别标签,第一预测类别标签用于描述样本数据不存在逾期风险的概率以及样本数据存在逾期风险的概率。
可选地,在回收风险预测模型中,若包括专门用于进行偏标签学习的分支模型,那么进行偏标签学习训练时,应该将样本数据输入偏标签学习分支模型中,以使得该分支模型专用于对包括黑样本、白样本、灰样本的样本数据进行偏标签学习,在得到样本数据对应的第一预测类别标签,在偏标签学习中,输出的第一预测类别标签,描述了样本数据不存在逾期风险的概率以及样本数据存在逾期风险的概率,例如对样本数据a输出的第一预测类别标签为(0.12,0.88)就说明模型预测出样本数据a为白样本的概率为0.12,以及样本数据a为黑样本的概率为0.88。
请参阅图4,图4为本说明书实施例提供的一种回收风险预测模型的架构示意图。如图4所示,首先需要对样本数据进行预处理,筛选出其中的重要信息作为输入回收风险预测模型的重要特征,例如可以包括购买的商品或服务信息、付款的具体时间、付款的金额大小、以及能唯一确定的供应商名称等等信息。由于此时输入的特征信息较为粗糙,不能直接被深度神经网络模型学习,需要经过一些嵌入层(Embedding层)的处理和分析,这里回收风险预测模型使用第一全连接层(也即FC层)处理特征信息,对特征信息进行编码,然后使用归一化层(也即BN层)对编码后的特征信息进行归一化,让特征分布接近于多维标准高斯分布,最后再接一个第二全连接层作为最终分类器的输出。
请继续参阅图4,由于偏标签学习是在回收风险预测模型中的偏标签学习分支模型中进行的,那么最后的第二全连接层是在偏标签学习分支模型中的,从第二全连接层输出的信息直接进入偏标签学习分支模型的分类器中,考虑到分类器需要解决多分类问题,因此基于SoftMax函数来构建分类器,具体来说,对于每一个输入样本,经过神经网络计算后,会得到一个输出向量,这个输出向量的每一个元素代表该样本属于某一个类别的可能性。Softmax函数会将这个输出向量中的每一个元素进行归一化处理,转换成概率值,使得这个概率值满足总和为1的条件。在本说明书实施例中,基于SoftMax函数的分类器就可以以使得偏标签学习分支模型能输出样本数据分别在“存在逾期风险”和“不存在逾期风险”这两种类型上的概率。
具体地,样本数据进行预处理时可以使用数据清洗、异常值剔除、缺失值通过插值补充、数据平滑、数据标准化等预处理操作,本说明书实施例对数据预处理方法不作具体限定。
S306、当回收风险预测模型中包括子任务学习分支模型时,确定样本数据对应的仅包含灰样本的灰样本数据,将灰样本数据输入子任务学习分支模型中,得到灰样本数据对应的第二预测类别标签,第二预测类别标签用于描述灰样本数据存在逾期风险的概率。
可选地,在模型不断的训练中,灰样本的标准类别标签会根据模型每次预测出的第一预测类别标签进行更新,然后以更新的标准类别标签进行下一轮的模型训练。而在实际情形中,由于真实场景下票据回收逾期的占比相对较小,也即从实际场景中获取的样本数据中,白样本的数量远远多于黑样本的数量,模型接收到的白样本特征信息就比黑样本特种信息多得多,那么模型训练初期输出的预测倾向会更偏向于白样本,这就导致对灰样本会更倾向于认为灰样本为白样本,那么灰样本进行标签更新时也会向白样本偏移,但灰样本的真实标签往往更倾向于黑样本,此时灰样本的预测方向就与其真实的先验分布相悖。
可选地,为了缓解标签噪声和不同类型样本之间分布不均衡的问题,可以对回收风险预测模型设置除了偏标签学习任务之外的子任务,该子任务专门用于训练模型对灰样本为黑样本的概率进行预测,加强回收风险预测模型对灰样本与黑样本之间关联性的学习,回收风险预测模型同时进行偏标签学习和灰样本预测,实现多任务学习。
可选地,请继续参阅图4,对于子任务,回收风险预测模型中需要包括除偏标签学习分支模型之外的子任务学习分支模型,并且由于子任务预测灰样本为黑样本的概率,那么只需要确定样本数据对应的仅包含灰样本的灰样本数据,输入子任务学习分支模型,在样本数据的特征信息进行全连接和归一化处理后,最后再接一个子任务学习分支模型中的第三全连接层作为最终分类器的输出,输入第三全连接层的是灰样本数据的特征信息,从第三全连接层输出的信息直接进入子任务学习分支模型的分类器中,该分类器也可以基于SoftMax函数来构建,便于后续损失函数的计算。
可选地,子任务学习分支模型会对灰样本数据为黑样本数据的概率进行预测,得到灰样本数据对应的第二预测类别标签,第二预测类别标签就描述了灰样本数据存在逾期风险的概率,也即灰样本为黑样本的概率。
S308、根据标准类别标签、第一预测类别标签以及第二预测类别标签训练回收风险预测模型。
可选地,在计算损失函数时,由于回收风险预测模型中多任务的各个分支任务有不同的预测目标,那么各分支任务的分支模型都应该各自计算损失,然后再同一结合起来对回收风险预测模型进行参数调整,也即根据标准类别标签、第一预测类别标签计算偏标签学习分支模型的损失,以及根据标准类别标签、第二预测类别标签计算子任务学习分支模型的损失,然后结合两个损失值来训练回收风险预测模型。
可选地,偏标签学习分支模型的损失函数如下所示:
其中,g(x)为模型输出的第一预测类别标签,为交叉墒损失函数(Cross EntropyLoss),该损失函数使用随着模型预测结果而动态更新的标准类别标签wz来计算,也即灰样本使用其标准类别标签wz进行监督,并且会在每次训练的batch迭代后进行更新。灰样本的标准类别标签的更新方式为:
其中,gz(x;θ(t))是模型在第t次迭代时对样本数据x判为第z类别的分数,y是样本数据x的偏标签集合,表示样本数据x可能归属的类别,该场景下,灰样本可能归属黑或白两种类别。为了能够在训练期间快速排除非部分标签,同时也减少部分标签对模型训练的影响,增加了杠杠参数β,用于区分部分标签和非部分标签。
进一步地,子任务学习分支模型的损失函数如下所示:
其中,为交叉墒损失函数(Cross Entropy Loss),λ为该任务分支损失函数权重,为避免过于影响偏标签学习分支的主任务训练,一般取较小值,例如可以取值为0.01,以减少子任务对主任务的影响。
在本说明书实施例中,提供一种回收风险预测模型训练方法,通过偏标签学习分支模型来进行偏标签学习,预测样本数据分别在“存在逾期风险”和“不存在逾期风险”这两种类型上的概率;通过子任务学习分支模型来预测灰样本数据分别在“存在逾期风险”这一类型上的概率。在多任务学习中,偏标签学习使得模型具备对类别不明确的样本进行回收风险预测的性能,而子任务则使得模型针对性的学习灰样本与黑样本之间关联性,因此多任务学习的模型设计缓解了标签噪声和不同类型样本之间分布不均衡的问题,提高了模型的预测准确性。
请参阅图5,图5为本说明书实施例提供的一种票据回收风险评估方法的流程示意图。
如图5所示,票据回收风险评估方法至少可以包括:
S502、获取至少一个待回票账单,待回票账单为需要回收预设类型票据的账单。
可选地,在实际应用场景中,为了对系统中的所有还未回收的票据账单进行统一的风险预测和管理,可以在终端中部署已经训练至收敛的回收风险预测模型,此时终端基于回收风险预测模型可以获取对需要回收预设类型票据的账单进行风险预测,预测这些还未回收票据的账单是否面临预期风险。那么进行风险预测时,首先确定需要进行预测的待回票账单,待回票账单为此时系统中所有的还未回票账单。
进一步地,请参阅图6,图6为本说明书实施例提供的一种票据回收风险预测系统的架构示意图。如图6所示,票据回收风险预测系统的平台能力包括欠票账单管理模块、回票账单管理模块、催收管理模块以及各模块下的功能,这些功能均用于支持相关工作人员的票据管理工作。在票据回收风险预测系统获取待回票账单时,数据来源可分为由上游结算系统产生的待回票账单、通过其他特殊渠道付款系统产生的待回票账单、以及企业采购人员线下付款需要手工录入的待回票账单。这些待回票账单被票据回收风险预测系统接收,便于票据回收风险预测系统调用内部预先部署的回收风险预测模型对各待回票账单进行回收风险预测。
需要说明的是,待回票账单的回收风险预测可以设定为每隔预设周期就自动进行一次,预设周期可以设定为一天、一周等,例如当固定周期设定为一天,那么系统每天都通过调用回收风险预测模型来预测截止本日的所有待回票账单的回收风险。
S504、将各待回票账单输入回收风险预测模型,确定回收风险预测模型对各待回票账单输出的回收风险概率。
可选地,请继续参阅图6,票据回收风险预测系统获取待回票账单之后,将各待回票账单输入回收风险预测模型,调用回收风险预测模型对各待回票账单进行回收风险预测,确定回收风险预测模型对各待回票账单输出的回收风险概率。
S506、根据各待回票账单对应的回收风险概率确定各待回票账单对应的风险评估结果。
进一步地,回收风险概率即为模型预测出的待回票账单的逾期可能性,那么根据各待回票账单对应的回收风险概率就可以进一步确定各待回票账单对应的风险评估结果,从风险评估结果可以直观地看出待回票账单的逾期风险为高还是低,便于后续相关工作人员根据不同的风险评估结果对不同的待回票账单进行适当的处理。
在本说明书实施例中,提供一种票据回收风险评估方法,获取至少一个待回票账单,待回票账单为需要回收预设类型票据的账单;将各待回票账单输入回收风险预测模型,确定回收风险预测模型对各待回票账单输出的回收风险概率;根据各待回票账单对应的回收风险概率确定各待回票账单对应的风险评估结果。在实际应用场景中,部署训练至收敛的回收风险预测模型,在需要对待回票账单进行回收的逾期风险预测时,直接调用回收风险预测模型来对待回票账单进行预测,得到待回票账单的逾期可能性,由于回收风险预测模型是基于偏标签学习和多任务学习训练得到的,其具有较强的泛化能力,风险预估结果会更加准确,因此使用该模型的回收风险预测模型可以有效提升票据回收效率,对待回票账单进行更精细化的管理,降低票据的逾期风险。
请参阅图7,图7为本说明书实施例提供的一种票据回收风险评估方法的流程示意图。
如图7所示,票据回收风险评估方法至少可以包括:
S702、获取至少一个待回票账单,待回票账单为需要回收预设类型票据的账单。
S704、将各待回票账单输入回收风险预测模型,确定回收风险预测模型对各待回票账单输出的回收风险概率。
关于步骤S702-S704,请参阅步骤S502中的详细记载,此处不再赘述。
S706、根据各待回票账单对应的回收风险概率确定各待回票账单对应的风险等级。
可选地,请参阅图8,图8为本说明书实施例提供的一种票据回收风险评估方法的交互流程图。如图8所示,存在票据回收管理系统,该系统用于对票据回收以及各种票据案件进行管理,每当需要进行票据回收风险评估时,票据回收管理系统从结算系统中同步待回票账单,然后调用回收风险预测模型对各待回票账单进行风险预测,模型会对待回票账单的回收风险进行预测并返回预测出的回收风险概率。
请进一步参阅图8,票据回收管理系统根据回收风险概率确定各待回票账单对应的风险等级,回收风险概率是模型预测出的待回票账单存在逾期风险的概率以及不存在逾期风险的概率,那么可以设定存在逾期风险的概率的范围与风险等级之间的对应关系,例如当待回票账单的存在逾期风险的概率超过0.9,可以认为其风险等级为“有较高逾期风险”;当待回票账单的存在逾期风险的概率超过0.7而低于0.9,可以认为其风险等级为“存在逾期风险”;当待回票账单的存在逾期风险的概率超过0.5而低于0.7,可以认为其风险等级为“有较低逾期风险”;当待回票账单的存在逾期风险的概率低于0.5,可以认为其风险等级为“没有逾期风险”。
S708、确定风险等级达到预设等级的目标待回票账单,对目标待回票账单生成催收案件,以及根据催收案件对目标待回票账单进行回收处理。
可选地,请继续参阅图8,票据回收管理系统确定各待回票账单的风险等级之后,确定风险等级达到预设等级的目标待回票账单为需要进行催收的账单,对目标待回票账单生成催收案件,以及根据催收案件对目标待回票账单进行回收处理。其中预设等级可以设置为“存在逾期风险”,以使得系统对风险等级达到“存在逾期风险”及以上的待回票账单统一生成催收案件。
可选地,请继续参阅图8,根据催收案件对目标待回票账单进行回收处理时,可以是根据催收案件向对应的工作人员发出通知预警,工作人员收到预警通知之后,在平台查看催收案件并认领处理,并且在成功回收票据之后录入票据信息并完结该催收案件。
进一步地,催收案件的催收策略往往与其对应的供应商、商品或者服务等账单信息相关,那么可以预先针对这些账单信息来配置各账单信息对应的回收规则,包括采用何种通知方式(短信、邮件、电话),以及催收策略执行的时间、执行的频次,例如A供应商的催收案件需要邮件通知、B供应商的催收案件需要电话通知;“存在逾期风险”的催收案件需要每隔三天催收一次、“有较高逾期风险”的催收案件需要每隔一天催收一次等等。
可选地,在预设规则池中预先配置好各账单信息对应的回收规则之后,就可以根据催收案件确定目标待回票账单的账单信息,并且在预设规则池中匹配目标待回票账单的账单信息对应的至少一条回收规则,组合各回收规则得到目标待回票账单对应的回收策略,通过规则之间的快速匹配组合,提升了催收策略的生成效率,有效降低了工作人员催收票据的工作量。
S710、获取目标周期内的新增完结案件,确定新增完结案件对应的微调样本数据。
可选地,请继续参阅图8,票据回收管理系统根据催收案件对相应的供应商进行催收之后,根据供应商的回票结果,完结系统中对应的催收案件,在这个过程中,每一笔催收案件的完结都为系统带来了一笔新的训练样本,系统会根据发票的录入时间以及催收案件完结的时间,完成样本的打标并添加到模型的训练集中,以便于使用新的训练集对模型进行持续性的微调训练,不断提高模型的准确性和鲁棒性。
可选地,微调训练的周期可以预设,例如设置为一周或者一天,每隔一个周期,就获取目标周期内的新增完结案件,对新增完结案件的数据进行处理,确定新增完结案件对应的微调样本数据。
S712、基于微调样本数据对回收风险预测模型进行微调训练,直至回收风险预测模型收敛并使用收敛后的回收风险预测模型替换微调训练前的回收风险预测模型。
可选地,请进一步参阅图8,基于微调样本数据对回收风险预测模型进行微调训练,直至回收风险预测模型收敛并使用收敛后的回收风险预测模型替换微调训练前的回收风险预测模型,这样不断的使用真实场景下的新的数据来完善模型性能,模型不会随着真实场景的变化而降低准确性。
在本说明书实施例中,提供一种票据回收风险评估方法,根据各待回票账单对应的回收风险概率确定各待回票账单对应的风险等级,确定风险等级达到预设等级的目标待回票账单,对目标待回票账单生成催收案件,以及根据催收案件对目标待回票账单进行回收处理,便于工作人员及时获知待回票账单的逾期风险程度,提升了催收策略的生成效率,有效降低了工作人员催收票据的工作量;获取目标周期内的新增完结案件,确定新增完结案件对应的微调样本数据,基于微调样本数据对回收风险预测模型进行微调训练,使用新的训练集对模型进行持续性的微调训练,不断提高模型的准确性和鲁棒性。
请参阅图9,图9为本说明书实施例提供的一种回收风险预测模型训练装置的结构框图。
如图9所示,回收风险预测模型训练装置900包括:
数据准备模块910,用于获取样本数据,样本数据的标准类别标签用于描述样本数据不存在逾期风险的概率以及样本数据存在逾期风险的概率;
预测输出模块920,用于将样本数据输入回收风险预测模型,得到样本数据对应的预测类别标签;
模型训练模块930,用于根据标准类别标签以及预测类别标签训练回收风险预测模型,直至回收风险预测模型收敛。
可选地,样本数据包括黑样本、白样本以及灰样本,黑样本为存在逾期风险的样本,白样本为不存在逾期风险的样本。
可选地,当回收风险预测模型中包括偏标签学习分支模型时,预测输出模块920,还用于将样本数据输入偏标签学习分支模型中,得到样本数据对应的第一预测类别标签,第一预测类别标签用于描述样本数据不存在逾期风险的概率以及样本数据存在逾期风险的概率;模型训练模块930,还用于根据标准类别标签、第一预测类别标签训练回收风险预测模型。
可选地,当回收风险预测模型中包括子任务学习分支模型时,预测输出模块920,还用于确定样本数据对应的仅包含灰样本的灰样本数据,将灰样本数据输入子任务学习分支模型中,得到灰样本数据对应的第二预测类别标签,第二预测类别标签用于描述灰样本数据存在逾期风险的概率;模型训练模块930,还用于根据标准类别标签、第一预测类别标签以及第二预测类别标签训练回收风险预测模型。
可选地,模型训练模块930,还用于根据标准类别标签以及预测类别标签计算回收风险预测模型的损失值;基于损失值训练回收风险预测模型。
在本说明书实施例中,提供一种回收风险预测模型训练装置,其中,数据准备模块,用于获取样本数据,样本数据的标准类别标签用于描述样本数据不存在逾期风险的概率以及样本数据存在逾期风险的概率;预测输出模块,用于将样本数据输入回收风险预测模型,得到样本数据对应的预测类别标签;模型训练模块,用于根据标准类别标签以及预测类别标签训练回收风险预测模型,直至回收风险预测模型收敛。由于样本数据的标准类别标签描述了样本数据不存在逾期风险的概率,以及样本数据存在逾期风险的概率,就说明样本数据中包含了不明确是否存在逾期风险的样本数据,那么使用这样的样本数据来训练回收风险预测模型,就可以使得回收风险预测模型学习到不明确标签的数据的特征,扩大样本数据的可用范围,增强模型对各类型数据的风险预测性能,最终提高模型在实际场景中的风险预测准确度,有效提升了票据回收的工作效率。
请参阅图10,图10为本说明书实施例提供的一种票据回收风险评估装置的结构框图。
如图10所示,票据回收风险评估装置1000包括:
账单获取模块1010,用于获取至少一个待回票账单,待回票账单为需要回收预设类型票据的账单;
风险预测模块1020,用于将各待回票账单输入回收风险预测模型,确定回收风险预测模型对各待回票账单输出的回收风险概率;
风险评估模块1030,用于根据各待回票账单对应的回收风险概率确定各待回票账单对应的风险评估结果;
其中,回收风险预测模型为上述任一实施例中包括的回收风险预测模型。
可选地,风险评估模块1030,还用于根据各待回票账单对应的回收风险概率确定各待回票账单对应的风险等级;确定风险等级达到预设等级的目标待回票账单,对目标待回票账单生成催收案件,以及根据催收案件对目标待回票账单进行回收处理。
可选地,风险评估模块1030,还用于根据催收案件确定目标待回票账单的账单信息;在预设规则池中匹配账单信息对应的至少一条回收规则,组合各回收规则得到目标待回票账单对应的回收策略;执行回收策略,以对目标待回票账单进行回收处理。
可选地,票据回收风险评估装置1000还包括:微调训练模块,用于获取目标周期内的新增完结案件,确定新增完结案件对应的微调样本数据;基于微调样本数据对回收风险预测模型进行微调训练,直至回收风险预测模型收敛并使用收敛后的回收风险预测模型替换微调训练前的回收风险预测模型。
在本说明书实施例中,提供一种票据回收风险评估装置,其中,账单获取模块,用于获取至少一个待回票账单,待回票账单为需要回收预设类型票据的账单;风险预测模块,用于将各待回票账单输入回收风险预测模型,确定回收风险预测模型对各待回票账单输出的回收风险概率;风险评估模块,用于根据各待回票账单对应的回收风险概率确定各待回票账单对应的风险评估结果;回收风险预测模型为上述任一实施例中包括的回收风险预测模型。在实际应用场景中,部署训练至收敛的回收风险预测模型,在需要对待回票账单进行回收的逾期风险预测时,直接调用回收风险预测模型来对待回票账单进行预测,得到待回票账单的逾期可能性,由于回收风险预测模型是基于偏标签学习和多任务学习训练得到的,其具有较强的泛化能力,风险预估结果会更加准确,因此使用该模型的回收风险预测模型可以有效提升票据回收效率,对待回票账单进行更精细化的管理,降低票据的逾期风险。
本说明书实施例提供一种包含指令的计算机程序产品,当计算机程序产品在计算机或处理器上运行时,使得计算机或处理器执行上述实施例中任一项的方法的步骤。
本说明书实施例还提供了一种计算机存储介质,计算机存储介质可以存储有多条指令,指令适于由处理器加载并执行如上述实施例中的任一项的方法的步骤。
请参见图11,图11为本说明书实施例提供的一种终端的结构示意图。如图11所示,终端1100可以包括:至少一个终端处理器1101,至少一个网络接口1104,用户接口1103,存储器1105,至少一个通信总线1102。
其中,通信总线1102用于实现这些组件之间的连接通信。
其中,用户接口1103可以包括显示屏(Display)、摄像头(Camera),可选用户接口1103还可以包括标准的有线接口、无线接口。
其中,网络接口1104可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。
其中,终端处理器1101可以包括一个或者多个处理核心。终端处理器1101利用各种接口和线路连接整个终端1100内的各个部分,通过运行或执行存储在存储器1105内的指令、程序、代码集或指令集,以及调用存储在存储器1105内的数据,执行终端1100的各种功能和处理数据。可选的,终端处理器1101可以采用数字信号处理(Digital SignalProcessing,DSP)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)、可编程逻辑阵列(Programmable Logic Array,PLA)中的至少一种硬件形式来实现。终端处理器1101可集成中央处理器(Central Processing Unit,CPU)、图像处理器(Graphics ProcessingUnit,GPU)和调制解调器等中的一种或几种的组合。其中,CPU主要处理操作系统、用户界面和应用程序等;GPU用于负责显示屏所需要显示的内容的渲染和绘制;调制解调器用于处理无线通信。可以理解的是,上述调制解调器也可以不集成到终端处理器1101中,单独通过一块芯片进行实现。
其中,存储器1105可以包括随机存储器(Random Access Memory,RAM),也可以包括只读存储器(Read-Only Memory,ROM)。可选的,该存储器1105包括非瞬时性计算机可读介质(non-transitory computer-readable storage medium)。存储器1105可用于存储指令、程序、代码、代码集或指令集。存储器1105可包括存储程序区和存储数据区,其中,存储程序区可存储用于实现操作系统的指令、用于至少一个功能的指令(比如触控功能、声音播放功能、图像播放功能等)、用于实现上述各个方法实施例的指令等;存储数据区可存储上面各个方法实施例中涉及到的数据等。存储器1105可选的还可以是至少一个位于远离前述终端处理器1101的存储装置。如图11所示,作为一种计算机存储介质的存储器1105中可以包括操作系统、网络通信模块、用户接口模块以及回收风险预测模型训练程序。
在图11所示的终端1100中,用户接口1103主要用于为用户提供输入的接口,获取用户输入的数据;而终端处理器1101可以用于调用存储器1105中存储的回收风险预测模型训练程序,并具体执行以下操作:
获取样本数据,样本数据的标准类别标签用于描述样本数据不存在逾期风险的概率以及样本数据存在逾期风险的概率;
将样本数据输入回收风险预测模型,得到样本数据对应的预测类别标签;
根据标准类别标签以及预测类别标签训练回收风险预测模型,直至回收风险预测模型收敛。
在一些实施例中,样本数据包括黑样本、白样本以及灰样本,黑样本为存在逾期风险的样本,白样本为不存在逾期风险的样本。
在一些实施例中,当回收风险预测模型中包括偏标签学习分支模型时,终端处理器1101在执行将样本数据输入回收风险预测模型,得到样本数据对应的预测类别标签时,具体执行以下步骤:将样本数据输入偏标签学习分支模型中,得到样本数据对应的第一预测类别标签,第一预测类别标签用于描述样本数据不存在逾期风险的概率以及样本数据存在逾期风险的概率;终端处理器1101在执行根据标准类别标签以及预测类别标签训练回收风险预测模型时,具体执行以下步骤:根据标准类别标签、第一预测类别标签训练回收风险预测模型。
在一些实施例中,当回收风险预测模型中包括子任务学习分支模型时,终端处理器1101在执行将样本数据输入回收风险预测模型,得到样本数据对应的预测类别标签时,具体执行以下步骤:确定样本数据对应的仅包含灰样本的灰样本数据,将灰样本数据输入子任务学习分支模型中,得到灰样本数据对应的第二预测类别标签,第二预测类别标签用于描述灰样本数据存在逾期风险的概率;终端处理器1101在执行根据标准类别标签以及预测类别标签训练回收风险预测模型时,具体执行以下步骤:根据标准类别标签、第一预测类别标签以及第二预测类别标签训练回收风险预测模型。
在一些实施例中,终端处理器1101在执行根据标准类别标签以及预测类别标签训练回收风险预测模型时,具体执行以下步骤:根据标准类别标签以及预测类别标签计算回收风险预测模型的损失值;基于损失值训练回收风险预测模型。
请参见图12,图12为本说明书另一实施例提供的一种终端的结构示意图。如图12所示,终端1200可以包括:至少一个终端处理器1201,至少一个网络接口1204,用户接口1203,存储器1205,至少一个通信总线1202。
其中,通信总线1202用于实现这些组件之间的连接通信。
其中,用户接口1203可以包括显示屏(Display)、摄像头(Camera),可选用户接口1203还可以包括标准的有线接口、无线接口。
其中,网络接口1204可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。
其中,终端处理器1201可以包括一个或者多个处理核心。终端处理器1201利用各种接口和线路连接整个终端1200内的各个部分,通过运行或执行存储在存储器1205内的指令、程序、代码集或指令集,以及调用存储在存储器1205内的数据,执行终端1200的各种功能和处理数据。可选的,终端处理器1201可以采用数字信号处理(Digital SignalProcessing,DSP)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)、可编程逻辑阵列(Programmable Logic Array,PLA)中的至少一种硬件形式来实现。终端处理器1201可集成中央处理器(Central Processing Unit,CPU)、图像处理器(Graphics ProcessingUnit,GPU)和调制解调器等中的一种或几种的组合。其中,CPU主要处理操作系统、用户界面和应用程序等;GPU用于负责显示屏所需要显示的内容的渲染和绘制;调制解调器用于处理无线通信。可以理解的是,上述调制解调器也可以不集成到终端处理器1201中,单独通过一块芯片进行实现。
其中,存储器1205可以包括随机存储器(Random Access Memory,RAM),也可以包括只读存储器(Read-Only Memory,ROM)。可选的,该存储器1205包括非瞬时性计算机可读介质(non-transitory computer-readable storage medium)。存储器1205可用于存储指令、程序、代码、代码集或指令集。存储器1205可包括存储程序区和存储数据区,其中,存储程序区可存储用于实现操作系统的指令、用于至少一个功能的指令(比如触控功能、声音播放功能、图像播放功能等)、用于实现上述各个方法实施例的指令等;存储数据区可存储上面各个方法实施例中涉及到的数据等。存储器1205可选的还可以是至少一个位于远离前述终端处理器1201的存储装置。如图12所示,作为一种计算机存储介质的存储器1205中可以包括操作系统、网络通信模块、用户接口模块以及票据回收风险评估程序。
在图12所示的终端1200中,用户接口1203主要用于为用户提供输入的接口,获取用户输入的数据;而终端处理器1201可以用于调用存储器1205中存储的票据回收风险评估程序,并具体执行以下操作:
获取至少一个待回票账单,待回票账单为需要回收预设类型票据的账单;
将各待回票账单输入回收风险预测模型,确定回收风险预测模型对各待回票账单输出的回收风险概率;
根据各待回票账单对应的回收风险概率确定各待回票账单对应的风险评估结果;
其中,回收风险预测模型为上述任一实施例中包括的回收风险预测模型。
在一些实施例中,终端处理器1201在执行根据各待回票账单对应的回收风险概率确定各待回票账单对应的风险评估结果时,具体执行以下步骤:根据各待回票账单对应的回收风险概率确定各待回票账单对应的风险等级;确定风险等级达到预设等级的目标待回票账单,对目标待回票账单生成催收案件,以及根据催收案件对目标待回票账单进行回收处理。
在一些实施例中,终端处理器1201在执行根据催收案件对目标待回票账单进行回收处理时,具体执行以下步骤:根据催收案件确定目标待回票账单的账单信息;在预设规则池中匹配账单信息对应的至少一条回收规则,组合各回收规则得到目标待回票账单对应的回收策略;执行回收策略,以对目标待回票账单进行回收处理。
在一些实施例中,终端处理器1201还具体执行以下步骤:获取目标周期内的新增完结案件,确定新增完结案件对应的微调样本数据;基于微调样本数据对回收风险预测模型进行微调训练,直至回收风险预测模型收敛并使用收敛后的回收风险预测模型替换微调训练前的回收风险预测模型。
在本说明书所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。
作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。上述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行上述计算机程序指令时,全部或部分地产生按照本说明书实施例上述的流程或功能。上述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。上述计算机指令可以存储在计算机可读存储介质中,或者通过上述计算机可读存储介质进行传输。上述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DigitalSubscriber Line,DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。上述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。上述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,数字多功能光盘(DigitalVersatile Disc,DVD))、或者半导体介质(例如,固态硬盘(Solid State Disk,SSD))等。
需要说明的是,对于前述的各方法实施例,为了简便描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本说明书实施例并不受所描述的动作顺序的限制,因为依据本说明书实施例,某些步骤可以采用其它顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定都是本说明书实施例所必须的。
另外,还需要说明的是,本说明书实施例所涉及的信息(包括但不限于用户设备信息、用户个人信息等)、数据(包括但不限于用于分析的数据、存储的数据、展示的数据等)以及信号,均为经用户授权或者经过各方充分授权的,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。例如,本说明书中涉及的样本数据、待回票账单、新增完结案件等都是在充分授权的情况下获取的。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其它实施例的相关描述。
以上为对本说明书实施例所提供的一种回收风险预测模型训练以及票据回收风险评估方法、装置的描述,对于本领域的技术人员,依据本说明书实施例的思想,在具体实施方式及应用范围上均会有改变之处,综上,本说明书内容不应理解为对本说明书实施例的限制。
Claims (14)
1.一种回收风险预测模型训练方法,所述方法包括:
获取样本数据,所述样本数据的标准类别标签用于描述所述样本数据不存在逾期风险的概率以及所述样本数据存在逾期风险的概率;
将所述样本数据输入回收风险预测模型,得到所述样本数据对应的预测类别标签;
根据所述标准类别标签以及所述预测类别标签训练所述回收风险预测模型,直至所述回收风险预测模型收敛。
2.根据权利要求1所述的方法,所述样本数据包括黑样本、白样本以及灰样本,所述黑样本为存在逾期风险的样本,所述白样本为不存在逾期风险的样本。
3.根据权利要求2所述的方法,当所述回收风险预测模型中包括偏标签学习分支模型时,所述将所述样本数据输入回收风险预测模型,得到所述样本数据对应的预测类别标签,包括:
将所述样本数据输入所述偏标签学习分支模型中,得到所述样本数据对应的第一预测类别标签,所述第一预测类别标签用于描述所述样本数据不存在逾期风险的概率以及所述样本数据存在逾期风险的概率;
所述根据所述标准类别标签以及所述预测类别标签训练所述回收风险预测模型,包括:
根据所述标准类别标签、所述第一预测类别标签训练所述回收风险预测模型。
4.根据权利要求3所述的方法,当所述回收风险预测模型中包括子任务学习分支模型时,所述将所述样本数据输入回收风险预测模型,得到所述样本数据对应的预测类别标签,包括:
确定所述样本数据对应的仅包含灰样本的灰样本数据,将所述灰样本数据输入所述子任务学习分支模型中,得到所述灰样本数据对应的第二预测类别标签,所述第二预测类别标签用于描述所述灰样本数据存在逾期风险的概率;
所述根据所述标准类别标签、所述第一预测类别标签训练所述回收风险预测模型,包括:
根据所述标准类别标签、所述第一预测类别标签以及所述第二预测类别标签训练所述回收风险预测模型。
5.根据权利要求1所述的方法,所述根据所述标准类别标签以及所述预测类别标签训练所述回收风险预测模型,包括:
根据所述标准类别标签以及所述预测类别标签计算所述回收风险预测模型的损失值;
基于所述损失值训练所述回收风险预测模型。
6.一种票据回收风险评估方法,所述方法包括:
获取至少一个待回票账单,所述待回票账单为需要回收预设类型票据的账单;
将各待回票账单输入回收风险预测模型,确定所述回收风险预测模型对各待回票账单输出的回收风险概率;
根据各待回票账单对应的回收风险概率确定各待回票账单对应的风险评估结果;
其中,所述回收风险预测模型为权利要求1至5任一项所述的回收风险预测模型。
7.根据权利要求6所述的方法,所述根据各待回票账单对应的回收风险概率确定各待回票账单对应的风险评估结果,包括:
根据各待回票账单对应的回收风险概率确定各待回票账单对应的风险等级;
确定所述风险等级达到预设等级的目标待回票账单,对所述目标待回票账单生成催收案件,以及根据所述催收案件对所述目标待回票账单进行回收处理。
8.根据权利要求7所述的方法,所述根据所述催收案件对所述目标待回票账单进行回收处理,包括:
根据所述催收案件确定所述目标待回票账单的账单信息;
在预设规则池中匹配所述账单信息对应的至少一条回收规则,组合各回收规则得到所述目标待回票账单对应的回收策略;
执行所述回收策略,以对所述目标待回票账单进行回收处理。
9.根据权利要求6所述的方法,所述方法还包括:
获取目标周期内的新增完结案件,确定所述新增完结案件对应的微调样本数据;
基于所述微调样本数据对所述回收风险预测模型进行微调训练,直至所述回收风险预测模型收敛并使用所述收敛后的回收风险预测模型替换所述微调训练前的回收风险预测模型。
10.一种回收风险预测模型训练装置,所述装置包括:
数据准备模块,用于获取样本数据,所述样本数据的标准类别标签用于描述所述样本数据不存在逾期风险的概率以及所述样本数据存在逾期风险的概率;
预测输出模块,用于将所述样本数据输入回收风险预测模型,得到所述样本数据对应的预测类别标签;
模型训练模块,用于根据所述标准类别标签以及所述预测类别标签训练所述回收风险预测模型,直至所述回收风险预测模型收敛。
11.一种票据回收风险评估装置,所述装置包括:
账单获取模块,用于获取至少一个待回票账单,所述待回票账单为需要回收预设类型票据的账单;
风险预测模块,用于将各待回票账单输入回收风险预测模型,确定所述回收风险预测模型对各待回票账单输出的回收风险概率;
风险评估模块,用于根据各待回票账单对应的回收风险概率确定各待回票账单对应的风险评估结果;
其中,所述回收风险预测模型为权利要求1至5任一项所述的回收风险预测模型。
12.一种包含指令的计算机程序产品,当所述计算机程序产品在计算机或处理器上运行时,使得所述计算机或所述处理器执行如权利要求1至5或者6至9任意一项所述方法的步骤。
13.一种计算机存储介质,所述计算机存储介质存储有多条指令,所述指令适于由处理器加载并执行如权利要求1至5或者6至9任意一项的所述方法的步骤。
14.一种终端,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至5或者6至9任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410183410.8A CN118037468A (zh) | 2024-02-18 | 2024-02-18 | 回收风险预测模型训练以及票据回收风险评估方法、装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410183410.8A CN118037468A (zh) | 2024-02-18 | 2024-02-18 | 回收风险预测模型训练以及票据回收风险评估方法、装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN118037468A true CN118037468A (zh) | 2024-05-14 |
Family
ID=90997908
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410183410.8A Pending CN118037468A (zh) | 2024-02-18 | 2024-02-18 | 回收风险预测模型训练以及票据回收风险评估方法、装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN118037468A (zh) |
-
2024
- 2024-02-18 CN CN202410183410.8A patent/CN118037468A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111507543B (zh) | 用于预测实体间业务关系的模型训练方法及装置 | |
US10817813B2 (en) | Resource configuration and management system | |
US20170323216A1 (en) | Determining retraining of predictive models | |
US11507908B2 (en) | System and method for dynamic performance optimization | |
CN110503564A (zh) | 基于大数据的保全案件处理方法、系统、设备及存储介质 | |
US20220374814A1 (en) | Resource configuration and management system for digital workers | |
CN112860672A (zh) | 标签权重的确定方法和装置 | |
CN115983902B (zh) | 基于用户实时事件的信息推送方法及系统 | |
CN115795345A (zh) | 信息处理方法、装置、设备及存储介质 | |
CN116091242A (zh) | 推荐产品组合生成方法及装置、电子设备和存储介质 | |
CN116091249A (zh) | 交易风险的评估方法、装置、电子设备和介质 | |
CN115994819A (zh) | 风险客户识别方法、装置、设备和介质 | |
CN118037468A (zh) | 回收风险预测模型训练以及票据回收风险评估方法、装置 | |
CN114897607A (zh) | 产品资源的数据处理方法及装置、电子设备、存储介质 | |
CN111429257B (zh) | 一种交易监控方法和装置 | |
CN110348190B (zh) | 基于用户操作行为的用户设备归属判断方法及装置 | |
CN114298825A (zh) | 还款积极度评估方法及装置 | |
CN113870007A (zh) | 一种产品推荐方法、装置、设备及介质 | |
CN113849580A (zh) | 一种主体评级预测方法、装置、电子设备及存储介质 | |
CN110300961A (zh) | 统一智能连接器 | |
CN116629639B (zh) | 评估信息确定方法、装置、介质与电子设备 | |
US20230401417A1 (en) | Leveraging multiple disparate machine learning model data outputs to generate recommendations for the next best action | |
CN114239985A (zh) | 汇率预测方法、装置、电子设备及存储介质 | |
CN118096170A (zh) | 风险预测方法及装置、设备、存储介质和程序产品 | |
CN116797343A (zh) | 风险评估方法、模型训练方法、装置、介质及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |