CN118429085A - 基于深度学习对医院采购发票的回款账期预测方法及系统 - Google Patents

基于深度学习对医院采购发票的回款账期预测方法及系统 Download PDF

Info

Publication number
CN118429085A
CN118429085A CN202410891146.3A CN202410891146A CN118429085A CN 118429085 A CN118429085 A CN 118429085A CN 202410891146 A CN202410891146 A CN 202410891146A CN 118429085 A CN118429085 A CN 118429085A
Authority
CN
China
Prior art keywords
invoice
training
neural network
period
refund
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202410891146.3A
Other languages
English (en)
Inventor
颜家琪
陈勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shengye Information Technology Service Shenzhen Co ltd
Original Assignee
Shengye Information Technology Service Shenzhen Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shengye Information Technology Service Shenzhen Co ltd filed Critical Shengye Information Technology Service Shenzhen Co ltd
Priority to CN202410891146.3A priority Critical patent/CN118429085A/zh
Publication of CN118429085A publication Critical patent/CN118429085A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了基于深度学习对医院采购发票的回款账期预测方法及系统,属于深度学习领域。该方法将发票对应的特征数据输入到目标神经网络模型中;根据所述神经网络模型的输出值,预测所述发票对应的回款账期。该目标神经网络模型是通过对具有至少两层隐藏层的深度学习模型训练得到的,深度信息在处理非线性的影响因素时具有更好的效果。在训练时使用的损失函数在预测值小于标签时,得到第一损失值,在预测值不小于标签时,得到第二损失值,第一损失值不小于第二损失值;因此使得预测出来的回款账期在满足预设精度要求的情况下,不小于真实回款账期,降低账期延期风险。

Description

基于深度学习对医院采购发票的回款账期预测方法及系统
技术领域
本发明涉及深度学习技术领域,特别涉及一种基于深度学习对医院采购发票的回款账期预测方法及系统。
背景技术
随着机器学习技术的发展,金融行业已经提出多种利用机器学习模型预测展开某些金融业务的风险的技术方案,如根据用户的历史数据来训练机器学习模型从而预测贷款业务中的还款日期或者供应链金融中的回款账期,预测得到的还款日期或回款账期可以在评估人员进行风险评估时提供参考,以此提升金融行业从业人员的工作效率。如专利文献1(公开号为CN108846520A)中披露了贷款逾期预测方法,该方法利用用户的画像信息和贷款的历史还款信息对机器学习模型进行训练,从而预测用户贷款是否会逾期。如专利文献2(公开号为CN113159926A)中披露了贷款业务的还款日期确定方法,该方法利用贷款客户多个维度的属性信息和贷款信息来对贷款还款日期预测模型进行训练,从而预测贷款客户办理目标贷款业务的还款日期。如专利文献3(公开号为CN110472815A)中披露了一种供应链金融业务中对融资企业的风险控制方法,该方法以历史订单的交易数据来训练机器学习模型,从而预测出回款账期。上述方案均可以在金融业务中为评估人员提供参考,提升工作效率。
在医疗行业的供应链金融业务中,医院需要向医药供应商采购药品并开具发票,医药供应商将对医院的应收账款转移给保理机构,保理机构向医药供应商提供即时资金,加速医药供应商的资金周转。为了进行风险控制,保理机构需要对应收账款对应的风险进行评估,因此需要机器学习帮助预测医院的回款账期以提升风险评估和业务决策的效率。一般地,保理机构能够采集到的医院相关数据包括历史发票数据、历史回款账期数据、当前发票数据等。因此可以采用专利文献3的方案以历史发票数据和历史回款账期数据来训练机器学习模型,从而预测出回款账期。
但是发明人经研究发现,如果使用专利文献3的方案来进行预测回款账期时,其使用的机器学习模型为梯度提升决策树模型,在处理非线性的影响因素时效果不佳,无法准确预测回款账期,预测精度无法满足实际需求。另一方面,如果使用专利文献3的方案来进行预测回款账期,也无法满足以下需求:预测出来的回款账期在满足预设精度要求的情况下,还需要不小于真实回款账期,降低账期延期风险。
发明内容
本发明的目的在于至少解决现有技术中存在的技术问题之一,提供一种基于深度学习对医院采购发票的回款账期预测方法及系统,能够在处理非线性的影响因素时具有更好的效果,并且使得预测出来的回款账期在满足预设精度要求的情况下,不小于真实回款账期,降低账期延期风险。
第一方面,本发明提供一种基于深度学习对医院采购发票的回款账期预测方法,所述方法包括如下步骤:
将发票对应的特征数据输入到目标神经网络模型中;其中,所述目标神经网络模型是使用多组训练数据对初始神经网络模型进行训练得到的,初始神经网络模型至少包括两层隐藏层,所述多组训练数据中的每一组训练数据均包括:历史发票对应的特征数据以及用于标记该发票对应的实际回款账期的标签;
根据所述神经网络模型的输出值,预测所述发票对应的回款账期;
所述使用多组训练数据对初始神经网络模型进行训练得到所述目标神经网络,具体包括:
S1,在初始神经网络模型完成对一个批次样本的前向传播后,利用损失函数计算初始神经网络模型的预测值与标签之间的误差作为损失值;其中,所述多组训练数据被划分为多个批次样本;所述损失函数为分段函数,在预测值小于标签时,得到第一损失值,在预测值不小于标签时,得到第二损失值,第一损失值不小于第二损失值;
S2,计算损失函数对初始神经网络模型各参数的偏导数;
S3,基于各参数的偏导数,使用梯度下降法更新初始神经网络模型中的各参数;
S4,迭代上述步骤S1至S3,遍历多个批次样本,直到损失函数收敛或达到预定的训练轮数,得到目标神经网络模型。
第二方面,本发明提供一种基于深度学习对医院采购发票的回款账期预测系统,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上所述的基于深度学习对医院采购发票的回款账期预测方法。
相较于现有技术,本发明提供的一种基于深度学习对医院采购发票的回款账期预测方法及系统至少具有如下的有益效果:
1.初始神经网络模型至少包括两层隐藏层,属于深度学习,通过多层隐藏层能够提取并学习到更多特征与预测结果之间的非线性关系,相较于梯度提升决策树模型具有更强的非线性拟合能力,在处理非线性的影响因素时具有更好的效果。
2.由于损失函数为分段函数,在预测值小于标签时,得到第一损失值,在预测值不小于标签时,得到第二损失值,第一损失值不小于第二损失值;因此使得预测出来的回款账期在满足预设精度要求(例如预测准确率大于95%)的情况下,不小于真实回款账期,降低账期延期风险。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
下面结合附图和实施例对本发明进一步地说明;
图1为一个实施例中一种基于深度学习对医院采购发票的回款账期预测方法的流程示意图;
图2为一个实施例中训练神经网络模型的流程示意图;
图3为一个实施例中确定训练数据对应标签的流程示意图;
图4为一个实施例中更新低风险医院集合的流程示意图。
具体实施方式
本部分将详细描述本发明的具体实施例,本发明之较佳实施例在附图中示出,附图的作用在于用图形补充说明书文字部分的描述,使人能够直观地、形象地理解本发明的每个技术特征和整体技术方案,但其不能理解为对本发明保护范围的限制。
如图1所示,在一个实施例中,提供了一种基于深度学习对医院采购发票的回款账期预测方法,所述方法包括如下步骤:
步骤S202,将发票对应的特征数据输入到目标神经网络模型中。其中,所述目标神经网络模型是使用多组训练数据对初始神经网络模型进行训练得到的,所述多组训练数据中的每一组训练数据均包括:历史发票对应的特征数据以及用于标记该发票对应的实际回款账期的标签。初始神经网络模型至少包括两层隐藏层。
步骤S204,根据所述神经网络模型的输出值,预测所述发票对应的回款账期。
如图2所示,在一个示例中,所述使用多组训练数据对初始神经网络模型进行训练得到所述目标神经网络,具体包括:
S1,在初始神经网络模型完成对一个批次样本的前向传播后,利用损失函数计算初始神经网络模型的预测值与标签之间的误差作为损失值。
具体的,本实施例中的初始神经网络模型的结构为前馈神经网络(FeedforwardNeural Network,FNN),前馈神经网络由多层的Logistic回归模型(连续的非线性函数)组成,在前馈神经网络中,各神经元分别属于不同的层,每一层的神经元可以接收前一层神经元的信号并产生信号输出到下一层,前馈神经网络可以通过逐层的信息传递,得到网络最后的输出,整个网络可以看作一个复合函数。前向传播的过程为,将向量x作为第1层的输入,将最后一层的输出作为整个函数的输出。其中,第1层称为输入层,最后一层称为输出层,其他中间层成为隐藏层。本实施例中隐藏层不小于两层,属于深度学习,通过多层隐藏层能够提取并学习到更多特征与预测结果之间的非线性关系,相较于梯度提升决策树模型具有更强的非线性拟合能力,在处理非线性的影响因素时具有更好的效果。
其中,所述多组训练数据被划分为多个批次样本;所述损失函数为分段函数,在预测值小于标签时,得到第一损失值,在预测值不小于标签时,得到第二损失值,第一损失值不小于第二损失值。
在一个实施例中,通过以下公式一确定所述损失函数
公式一:
其中,λ为预设的调节系数,λ大于1;用于表示神经网络模型,是参数为θ的函数,x表示发票对应的特征数据,输出为预测值;y为标签。
在一个示例中,在一轮训练当中,对于标签均为30的两组训练数据而言,其中一组训练数据经过模型预测得到的预测值为32,另一组训练数据经过模型预测得到的预测值为28,显然按照现有技术中的平方损失函数计算得到二者误差均为2,意味着若平方损失函数在误差为2附近收敛时并且预测准确率达到要求(例如达到95%)时,其训练得到的模型预测出来的回款账期会大量(接近一半)都是小于真实回款账期,从而导致评估人员评估发票对应的回款账期出现大量小于真实回款账期的情况下,存在大量回款延期的风险。
而本实施例中采用公式一作为损失函数,由于λ大于1,在预测值小于标签时,采用=计算得到第一损失值;在预测值不小于标签时,采用=计算得到第二损失值,第一损失值不小于第二损失值。取λ=3,在一轮训练当中,对于标签均为30的两组训练数据而言,其中一组训练数据经过模型预测得到的预测值为32,采用采用=计算得到第二损失值约等于2.1,另一组训练数据经过模型预测得到的预测值为28,采用=计算得到第一损失值约等于19.1,可见第二损失值接近收敛位置,但是由于第一损失值的缘故导致该轮训练对应的平均损失被增大,促使训练继续进行。直到使得这两组训练数据均大于30时,才能让损失函数收敛,因此通过公式一提供的损失函数训练出来的模型可以使得预测出来的回款账期会大量(几乎全部)都是不小于真实回款账期,使得评估人员评估发票对应的回款账期不小于真实回款账期,减少了大量回款延期的风险。
λ作为一个用于调节损失函数对不同方向的误差的敏感度的参数,其在预测值小于标签时,λ的值越大,惩罚越大,损失值也越大,即更新参数时梯度越大。其在预测值大于标签时,λ的值越小,惩罚越大,损失值也越大,即更新参数时梯度越大,即损失值越大。如果在当前轮训练中平均损失没有显著下降,则检测的比例,为该轮训练中出现预测值小于标签的情况的次数,为该轮训练中出现预测值大于标签的情况的次数。若/大于1,则增加λ,平均的损失值也更大,可以在下一轮训练中增加梯度加快收敛;若/小于1,则减小λ,平均的损失值也更大,可以在下一轮训练中增加梯度加快收敛。
S2,计算损失函数对初始神经网络模型各参数的偏导数。
具体而言,每一轮训练时,是以该轮训练对应的平均损失,来对各参数求偏导的。通过以下公式二确定一轮训练对应的平均损失
公式二:
其中,当前轮训练使用的该批次样本包括n组训练数据,为该批次样本中第i组训练数据的标签,为该批次样本中第i组训练数据中发票对应的特征数据。
S3,基于各参数的偏导数,使用梯度下降法更新初始神经网络模型中的各参数。
具体的,在第T轮训练时,使用以下的公式三对神经网络模型当前的参数进行更新,得到在第T+1轮训练时神经网络模型的新参数
公式三:
其中,η为学习率。
在本实施例中,由于为指数函数,且λ大于1,因此在预测值小于标签时,相较于现有技术中的平方损失函数计算得到的偏导数,即参数的梯度更大,意味着模型会迅速调整,以减少预测值小于标签的情况,可以减少训练的轮次,加快训练的速度。
S4,迭代上述步骤S1至S3,遍历多个批次样本,直到损失函数收敛或达到预定的训练轮数,得到目标神经网络模型。
由于损失函数为分段函数,在预测值小于标签时,得到第一损失值,在预测值不小于标签时,得到第二损失值,第一损失值不小于第二损失值;因此使得预测出来的回款账期在满足预设精度要求(例如预测准确率大于95%)的情况下,不小于真实回款账期,降低账期延期风险。
需要说明的是,在公式三中,由于为指数函数,且λ大于1,因此在预测值小于标签时,相较于现有技术中的平方损失函数计算得到的偏导数,即参数的梯度更大,意味着模型会迅速调整,以减少预测值小于标签的情况,可以减少训练的轮次,加快训练的速度,但是可能导致梯度爆炸问题。而在预测值大于标签时,梯度较小,意味着模型调整相对较慢,导致收敛过慢。
对此,本实施例中提供了能够加快模型调整速度并且降低梯度爆炸可能性的方案,具体的,该方案针对公式一采用的损失函数的特点,提供了公式四来调整每轮训练时所采用的学习率η,从而能够加快模型调整速度并且降低梯度爆炸可能性。重新回顾公式一:
可知,在一轮训练中,若该轮训练中出现预测值小于标签的情况的次数较多,例如达到八成,会导致则对各参数求偏导数会较大,即梯度过大,可能会导致梯度爆炸。若该轮训练中出现预测值大于标签且差值不是很大的情况的次数较多,例如达到八成,会导致则对各参数求偏导数会较小,即梯度过小,可能会导致收敛过慢,即梯度消失。而在一轮训练中,若大部分预测值无论是远大于或远小于标签,会导致则对各参数求偏导数会较大,即梯度过大,可能会导致梯度爆炸。因此,参见公式三:
有必要让学习率能够适应性针对每轮训练中可能存在的梯度过大或过小的情况进行反向调节,以此抑制梯度爆炸或梯度消失(即收敛过慢)。在机器学习中,梯度的大小通常指的是其绝对值。梯度的绝对值越大,表示梯度的变化越剧烈,对应的参数更新步幅也越大。具体的,通过以下公式四确定每轮训练时的学习率η;
公式四:
其中,为基准学习率,为该轮训练中出现预测值小于标签的情况的次数,为该轮训练中出现预测值大于标签的情况的次数,为预设的偏向敏感度,为预设的误差敏感度;均大于0。
在一个示例中,若在一轮训练中,若大部分预测值远大于或远小于标签,会导致增大,进而导致减小,从而使得学习率η减小,抑制梯度爆炸。
在一个示例中,若在一轮训练中,若该轮训练中出现预测值小于标签的情况的次数较多,例如达到八成,会导致增大,进而导致减小,从而使得学习率η减小,抑制梯度爆炸。
在一个示例中,若在一轮训练中,若该轮训练中出现预测值大于标签且差值不是很大的情况的次数较多,例如达到八成,会导致导致增大,进而导致增大,从而使得学习率η增大,抑制梯度消失。
综上可知,该公式四通过针对公式一提供的损失函数的特性来动态调整学习率,确保在梯度较小时,学习率能够自动增加,从而增强参数更新的力度,缓解梯度消失的问题;在梯度较大时,学习率减小,防止梯度爆炸。这种机制使得训练过程更加稳定和高效。
进一步的,为预设的偏向敏感度,它放大或缩小这一项对学习率的影响,从而对学习率的调整幅度进行细致控制。为预设的误差敏感度,它放大或缩小这一项对学习率的影响,从而对学习率的调整幅度进行细致控制。具体的,初始值为0.5,均初始值为0.1,为0.01。在训练模型过程中可以动态调整的值,例如,如果在连续几轮训练中平均损失值下降较慢,可以适当增加的值,例如增大到1,增大到0.2;如果在连续几轮训练中平均损失值来回波动,可以适当减小的值,例如减小到0.2,减小到0.05,以减弱学习率的敏感度。通过上述挑战的值,能够方便对训练过程进行控制,对于实现损失函数的收敛提供新的调节手段,以加快训练的过程。
在一个实施例中,还可以通过以下公式五确定所述损失函数
公式五:
其中,M为预设的调节系数;用于表示神经网络模型,是参数为θ的函数,x表示发票对应的特征数据,输出为预测值;y为标签。
通常在误差较大的情况下,通过公式五计算的梯度没有公式一的大,因此公式五的梯度爆炸问题不严重,然而相应的,其收敛速度也会没有使用公式一来的快,因此在最开始模型的参数初始化时,误差比较大,使用公式一的损失函数会对参数施加更大的更新力度,从而加快模型的收敛速度。但是公式五对平方损失函数进行改进,引入惩罚项,在时,可以起到公式一中的如下效果:使得预测出来的回款账期会大量(几乎全部)都是不小于真实回款账期,使得评估人员评估发票对应的回款账期不小于真实回款账期,减少了大量回款延期的风险。
在一个实施例中,如图3所示,通过以下步骤确定每组训练数据中的标签:
步骤S300,判断历史发票属于单期回款还是分期回款对应的发票。
具体的,根据历史发票对应的回款记录可以确定该历史发票对应的应收账款是单期回款还是分期回款。或者根据该历史发票对应的回款合同也可以判断历史发票属于单期回款还是分期回款对应的发票。
步骤S302,当历史发票属于单期回款时,将该发票对应的实际回款账期作为标签。
以该历史发票的开票日为时间起点,例如2018年1月1日,对应的回款日为时间终点,例如2018年2月1日,用时间终点减去时间起点得到实际回款账期,即31日。因此,对于该历史发票对应的特征数据,其中的标签为31。
步骤S304,当历史发票属于分期回款时,判断开具发票的医院是否属于低风险医院集合中的医院。其中,所述低风险医院集合为由合作次数大于预设次数并且在分期回款中各期的准时回款率超过预设回款率的医院所组成的集合。
例如预设次数为10次,合作次数为保理机构已经成功收到该医院10张发票对应的应收账款的全部回款。预设回款率为90%。
回款准时率的计算步骤:
1、数据收集:收集医院所有相关发票的数据,包括每张发票的开票日期、每期的应付款金额、实际付款日期等。
2、定义准时回款:根据合同或协议,确定每期回款的截止日期。通常,准时回款是指在截止日期前或当天支付的款项。
3、计算每期回款情况:对每张发票的每期回款进行评估,判断是否准时支付。记录准时支付的次数和总期数。
4、计算准时回款率:使用公式计算准时回款率:准时回款率=准时回款次数/总期数。
举例而言,假设某医院在过去一年有以下表1所示的分期付款记录:
表1
步骤1数据收集:从上述表格中收集所有相关数据。
步骤2定义准时回款:假设准时回款是指在应付款日期前或当天支付的款项。
步骤3计算每期回款情况:发票1:第一期:准时(2023-01-30),第二期:不准时(2023-03-05),第三期:准时(2023-04-01)。发票2:第一期:准时(2023-02-14),第二期:准时(2023-03-15),第三期:不准时(2023-04-20)。发票3:第一期:准时(2023-01-10),第二期:不准时(2023-02-12),第三期:准时(2023-03-09),第四期:准时(2023-04-10)。
步骤4计算准时回款率:统计准时回款次数和总期数:总期数=3(发票1)+3(发票2)+4(发票3)=10,准时回款次数=2(发票1)+2(发票2)+3(发票3)=7。计算准时回款率:准时回款率=7/10=70%。
步骤S306,若否,则将最后一期对应的实际分期回款账期作为标签。
显然,不属于低风险医院集合中的医院包括保理机构新接触的医院以及由于分期付款的准时回款率不满足保理机构要求的医院,这些医院对于保理机构而言其还款能力和还款信用受到保理机构质疑,所以得将最后一期对应的实际分期回款账期作为标签,避免保理机构评估时过于乐观,而错误评估这些医院的风险。
步骤S308,若是,则从第一期开始计算各期分期回款账期对应的累计回款金额对该发票总金额的占比,检测到该占比不小于预设比例时,将当前的分期回款账期作为标签。
显然,属于低风险医院集合中的医院是保理机构经常接触并且认为具有很好回款能力和信用的医院,保理机构由于长时间的接触对于这些医院的风险已经能够很好把控,所以为了提升医院购买药品的积极性,从而提升供应链金融的运行效率,保理机构愿意根据自身对这些医院的风险担当设置一个预设比例,例如保理机构认为对应这些低风险的医院,自己愿意程度损失10%的现金流的风险(即回款回款的风险),则预设比例就是90%,通过该设置可以提升医院的合作意向,也保证金融机构的风险控制。
需要说明的是,保理机构如果评估某些回款账期过长,则可能基于风险考虑拒绝购买某张发票对应的应收账款,从而导致医药供应商现金流短缺,从而减少与医院进行先交货后付款的采购模式的合作,最终也会影响到医院的采购意愿。而如果保理机构对于每一笔分期回款的发票对应的应收账款都按照第一期分期回款的账期来估计,会将回款账期评估过短,导致供应商很快拿到现金,最终乐意增加与医院进行先交货后付款的采购模式的合作,最终也会提升到医院的采购意愿,但是最好回款延期有可能影响保理机构的现金流。因此,针对以上的场景,本实施例的步骤S304至步骤S308,通过先将医院划分为是否低风险医院集合,再进一步对分期回款的发票赋予对应的标签,能够平衡风险管控和提升供应链金融的运行效率。具体的,就是除了依靠模型进行回款账期的预测之外,还根据历史合作中的合作数据找到回款能力和信用足够优秀的客户(即低风险医院集合中的医院),针对这些客户提供更高效的供应链金融服务。具体的,如图4所示,在一个实施例中,通过以下步骤更新所述低风险医院集合:
步骤S402,定期收集所有医院的历史合作数据。所述历史合作数据包括每家医院的合作次数和分期回款情况下各期的准时回款率。
步骤S404,根据历史合作数据筛选出符合低风险标准的医院。所述低风险标准为合作次数大于预设次数并且在分期回款中各期的准时回款率超过预设回款率。
步骤S406,判断符合低风险标准的医院是否为所述低风险医院集合中不存在的医院,若是,则将符合低风险标准的医院添加到所述低风险医院集合中。
步骤S408,判断不符合低风险标准的医院是否为所述低风险医院集合中存在的医院,若是,则将不符合低风险标准的医院从所述低风险医院集合中移除。
通过定期自动更新低风险医院集合,可以确保低风险医院集合的数据为最新数据,更加准确的实现风险控制。
在一个实施例中,每张发票对应的特征数据包括该发票上记录的数据、开具该发票时的季节、根据各历史发票上记录的数据统计得到的开具该发票的医院的采购频率数据、开具该发票的医院所在地的财政情况数据、开具该发票的医院的历史上的所有单期回款的平均回款账期以及开具该发票的医院的历史上的所有分期回款的准时回款率。
为了将每张发票对应的特征数据输入到神经网络模型中,需要对数据进行量化和特征处理。以下是获取和处理这些数据的步骤:
1、获取特征数据的步骤:
发票上的记录数据:直接从发票系统或数据库中提取,包括发票金额、发票日期、医院名称、药品种类、地址信息、付款次数、每次付款金额、最后付款日期等。
发票开具时的季节:根据发票日期,确定发票开具时的季节。通常将月份转换为季节,比如1-3月为春季,4-6月为夏季,7-9月为秋季,10-12月为冬季。
医院的采购频率数据:根据医院的历史发票数据,统计一定时间范围内(如一年内)每家医院的采购次数或采购金额总数,计算月度平均采购频率。
医院所在地的财政情况数据:获取医院所在地区的财政情况数据,可以通过政府公开的财政报告、经济数据等来源获取,并匹配到对应的医院。
医院历史上的单期回款平均回款账期:从历史发票数据中,筛选出单期回款的发票,计算每张发票的回款账期(即从发票开具到实际付款的天数),然后对这些账期取平均值。
医院历史上的分期回款准时回款率:从历史分期付款的发票数据中,计算每一期的回款是否在预定时间内完成(即准时回款),然后计算准时回款的比例,即准时回款率。
2、数据处理为神经网络输入的步骤
数据清洗和预处理:检查数据的完整性,处理缺失值和异常值,确保数据质量。
量化特征:将日期类型特征(如发票日期、最后付款日期)转换为数值(如时间戳或天数)。将类别特征(如医院名称、季节)转换为数值形式,通常使用独热编码(One-HotEncoding)将其转换为二进制向量。
特征标准化或归一化:对数值特征(如发票金额、采购频率、平均回款账期)进行标准化(均值为0,标准差为1)或归一化(缩放到0到1之间),使其具有相同的尺度,便于模型处理。
特征组合:将所有处理后的特征组合成一个矩阵,每一行代表一张发票的所有特征,每一列代表一个特征。确保所有特征数据的格式和数量一致。
划分数据集:将数据集划分为训练集、验证集和测试集,用于模型的训练、验证和评估。
输入到神经网络:将处理好的特征数据输入到神经网络模型中,进行训练和预测。神经网络模型的输入层将接受这个特征矩阵,隐含层和输出层进行相应的计算和预测。
通过上述步骤,可以从原始数据中提取和处理每张发票的特征数据,将其转换为神经网络模型可以接受的格式。这包括数据清洗、特征量化、标准化、特征组合和数据集划分等步骤。处理后的特征数据以矩阵形式输入到神经网络中,模型将根据这些特征进行训练和预测。
使用上述综合数据而不仅仅是单张发票的数据进行训练回款账期预测,具有显著的优势。
1. 提高预测准确性
单张发票数据只包含有限的特征,如发票金额、发票日期、付款次数等。这些特征可能无法全面反映影响回款账期的各种因素。而综合数据包括医院的采购频率、历史回款行为、季节因素、地区财政情况等。这些额外的特征能够提供更全面的信息,有助于更准确地预测回款账期。
例如,医院的历史回款行为可以揭示其付款习惯,地区财政情况可以反映经济环境对付款能力的影响,季节因素可以反映不同季节的财务压力、每家医院都有自己的医药消耗规律,这也影响了发票回款时间等。
2. 提供上下文信息
单张发票数据缺乏上下文信息,仅反映该特定交易的情况,无法捕捉到更广泛的背景和历史行为。而综合数据能够提供更丰富的上下文信息。例如,通过统计医院的采购频率和历史回款数据,可以了解该医院的整体信用水平和付款模式。这些信息有助于识别长期趋势和异常行为,提高预测的鲁棒性和可靠性。
3. 捕捉潜在模式和关系
仅使用单张发票数据,可能难以捕捉到复杂的模式和关系。例如,医院的付款行为可能受其历史行为、季节性因素和经济环境的共同影响,而这些复杂关系单凭单张发票数据难以识别。而综合数据可以帮助捕捉更复杂的模式和关系。通过结合多个维度的数据,机器学习模型可以学习到这些特征之间的相互作用,提高模型的预测能力。例如,历史上的单期回款账期和分期回款准时率可以共同作用,帮助更好地预测未来的回款账期。
4. 增强模型的泛化能力
单张发票数据时,模型可能过度依赖单张发票的数据,容易出现过拟合问题,对新数据的泛化能力较差。而综合数据通过引入更多维度的特征,可以增强模型的泛化能力。模型能够基于更广泛的特征进行学习,从而在面对新数据时表现更稳定、准确。综合数据的引入增加了样本的多样性,有助于模型在训练过程中更好地识别和适应不同的情况和变化。
在一个实施例中,还提供了一种基于深度学习对医院采购发票的回款账期预测,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时执行上述基于深度学习对医院采购发票的回款账期预测方法的步骤。此处基于深度学习对医院采购发票的回款账期预测方法的步骤可以是上述各个实施例的基于深度学习对医院采购发票的回款账期预测方法中的步骤。
在一个实施例中,还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行上述基于深度学习对医院采购发票的回款账期预测方法的步骤。此处基于深度学习对医院采购发票的回款账期预测方法的步骤可以是上述各个实施例的基于深度学习对医院采购发票的回款账期预测方法中的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRA)、存储器总线(Rambus)直接RAM(RDRA)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。

Claims (10)

1.一种基于深度学习对医院采购发票的回款账期预测方法,其特征在于,所述方法包括如下步骤:
将发票对应的特征数据输入到目标神经网络模型中;其中,所述目标神经网络模型是使用多组训练数据对初始神经网络模型进行训练得到的,初始神经网络模型至少包括两层隐藏层,所述多组训练数据中的每一组训练数据均包括:历史发票对应的特征数据以及用于标记该发票对应的实际回款账期的标签;
根据所述神经网络模型的输出值,预测所述发票对应的回款账期;
所述使用多组训练数据对初始神经网络模型进行训练得到所述目标神经网络,具体包括:
S1,在初始神经网络模型完成对一个批次样本的前向传播后,利用损失函数计算初始神经网络模型的预测值与标签之间的误差作为损失值;其中,所述多组训练数据被划分为多个批次样本;所述损失函数为分段函数,在预测值小于标签时,得到第一损失值,在预测值不小于标签时,得到第二损失值,第一损失值不小于第二损失值;
S2,计算损失函数对初始神经网络模型各参数的偏导数;
S3,基于各参数的偏导数,使用梯度下降法更新初始神经网络模型中的各参数;
S4,迭代上述步骤S1至S3,遍历多个批次样本,直到损失函数收敛或达到预定的训练轮数,得到目标神经网络模型。
2.根据权利要求1所述的方法,其特征在于,通过以下公式一确定所述损失函数
公式一:
其中,λ为预设的调节系数,λ大于1;用于表示神经网络模型,是参数为θ的函数,x表示发票对应的特征数据,输出为预测值;y为标签。
3.根据权利要求2所述的方法,其特征在于,通过以下公式二确定一轮训练对应的平均损失
公式二:
其中,当前轮训练使用的该批次样本包括n组训练数据,为该批次样本中第i组训练数据的标签,为该批次样本中第i组训练数据中发票对应的特征数据。
4.根据权利要求3所述的方法,其特征在于,在第T轮训练时,使用以下的公式三对神经网络模型当前的参数进行更新,得到在第T+1轮训练时神经网络模型的新参数
公式三:
其中,η为学习率。
5.根据权利要求4所述的方法,其特征在于,通过以下公式四确定每轮训练时的学习率η;
公式四:
其中,为基准学习率,为该轮训练中出现预测值小于标签的情况的次数,为该轮训练中出现预测值大于标签的情况的次数,为预设的偏向敏感度,为预设的误差敏感度。
6.根据权利要求1所述的方法,其特征在于,通过以下公式五确定所述损失函数
公式五:
其中,M为预设的调节系数;用于表示神经网络模型,是参数为θ的函数,x表示发票对应的特征数据,输出为预测值;y为标签。
7.根据权利要求1所述的方法,其特征在于,通过以下步骤确定每组训练数据中的标签:
当历史发票属于单期回款时,将该发票对应的实际回款账期作为标签;
当历史发票属于分期回款时,判断开具发票的医院是否属于低风险医院集合中的医院,若否,则将最后一期对应的实际分期回款账期作为标签;若是,则从第一期开始计算各期分期回款账期对应的累计回款金额对该发票总金额的占比,检测到该占比不小于预设比例时,将当前的分期回款账期作为标签;
其中,所述低风险医院集合为由合作次数大于预设次数并且在分期回款中各期的准时回款率超过预设回款率的医院所组成的集合。
8.根据权利要求7所述的方法,其特征在于,通过以下步骤更新所述低风险医院集合:
定期收集所有医院的历史合作数据;所述历史合作数据包括每家医院的合作次数和分期回款情况下各期的准时回款率;
根据历史合作数据筛选出符合低风险标准的医院;所述低风险标准为合作次数大于预设次数并且在分期回款中各期的准时回款率超过预设回款率;
判断符合低风险标准的医院是否为所述低风险医院集合中不存在的医院,若是,则将符合低风险标准的医院添加到所述低风险医院集合中;
判断不符合低风险标准的医院是否为所述低风险医院集合中存在的医院,若是,则将不符合低风险标准的医院从所述低风险医院集合中移除。
9.根据权利要求1所述的方法,其特征在于,每张发票对应的特征数据包括该发票上记录的数据、开具该发票时的季节、根据各历史发票上记录的数据统计得到的开具该发票的医院的采购频率数据、开具该发票的医院所在地的财政情况数据、开具该发票的医院的历史上的所有单期回款的平均回款账期以及开具该发票的医院的历史上的所有分期回款的准时回款率。
10.一种基于深度学习对医院采购发票的回款账期预测系统,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至9中任一项所述的基于深度学习对医院采购发票的回款账期预测方法。
CN202410891146.3A 2024-07-04 2024-07-04 基于深度学习对医院采购发票的回款账期预测方法及系统 Pending CN118429085A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410891146.3A CN118429085A (zh) 2024-07-04 2024-07-04 基于深度学习对医院采购发票的回款账期预测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410891146.3A CN118429085A (zh) 2024-07-04 2024-07-04 基于深度学习对医院采购发票的回款账期预测方法及系统

Publications (1)

Publication Number Publication Date
CN118429085A true CN118429085A (zh) 2024-08-02

Family

ID=92321894

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410891146.3A Pending CN118429085A (zh) 2024-07-04 2024-07-04 基于深度学习对医院采购发票的回款账期预测方法及系统

Country Status (1)

Country Link
CN (1) CN118429085A (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110472815A (zh) * 2019-06-28 2019-11-19 蔷薇信息技术有限公司 一种供应链金融业务中对融资企业的风险控制方法及系统
CN112668796A (zh) * 2020-12-31 2021-04-16 深圳银雁数据科技有限公司 回款预测方法及系统
CN113379536A (zh) * 2021-06-29 2021-09-10 百维金科(上海)信息科技有限公司 一种基于引力搜索算法优化递归神经网络的违约概率预测方法
US20220044116A1 (en) * 2020-07-30 2022-02-10 NavInfo Europe B.V. Computer-Implemented Method of Training a Computer-Implemented Deep Neural Network and Such a Network

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110472815A (zh) * 2019-06-28 2019-11-19 蔷薇信息技术有限公司 一种供应链金融业务中对融资企业的风险控制方法及系统
US20220044116A1 (en) * 2020-07-30 2022-02-10 NavInfo Europe B.V. Computer-Implemented Method of Training a Computer-Implemented Deep Neural Network and Such a Network
CN112668796A (zh) * 2020-12-31 2021-04-16 深圳银雁数据科技有限公司 回款预测方法及系统
CN113379536A (zh) * 2021-06-29 2021-09-10 百维金科(上海)信息科技有限公司 一种基于引力搜索算法优化递归神经网络的违约概率预测方法

Similar Documents

Publication Publication Date Title
Bellini IFRS 9 and CECL Credit Risk Modelling and Validation: A Practical Guide with Examples Worked in R and SAS
US8600854B2 (en) Method and system for evaluating customers of a financial institution using customer relationship value tags
US7668768B2 (en) Computer-implemented method for evaluating an investment
CN111507628A (zh) 一种财务风险预警处理系统
US20080021813A1 (en) Method for scoring accounts for retention and marketing accounts based on retention and profitability
WO2001057756A1 (en) Enhancing delinquent debt collection using statistical models of debt historical information and account events
Shim Dynamic prudential regulation: Is prompt corrective action optimal?
CN109740792A (zh) 数据预测方法、系统、终端及计算机存储介质
Bandyopadhyay Managing portfolio credit risk in banks
US20080300939A1 (en) Computer-Implemented Method for Evaluating an Investment
CN112766814A (zh) 一种信用风险压力测试模型的训练方法、装置及设备
Oosthuizen Institutional Housing Investors and the Great Recession
CN112200340A (zh) 预测逃废债区块链系统
Epor et al. EXPLORING THE ASYMMETRIC IMPACTS OF INFLATION ON INTEREST RATE SPREAD: EVIDENCE FROM NIGERIA WITH NONLINEAR ARDL AND ASYMMETRIC CAUSALITY.
CN118429085A (zh) 基于深度学习对医院采购发票的回款账期预测方法及系统
CN113205246A (zh) 市场风险预测方法、系统和计算机可读存储介质
EP1005683A1 (en) A method and system for evaluating customers of a financial institution using customer relationship value tags
Santoso et al. Determinants of Islamic Bank Non-Performing Financing By Financing Contract (Case Study: Bank BRIsyariah Private Company)
CN114240610B (zh) 资金自动归集方法、装置、计算机设备和存储介质
Gruenthaler Risk premia and option intermediation
KR102430125B1 (ko) P2p 금융을 위한 차주 계좌 리스크 관리 시스템 및 방법
Chebanova et al. Identification, Measurement and Reflection of Risks in Accounting
US20240070552A1 (en) Methods and systems for determining payment behaviours
Ilya Digitalization and predictability in the BRICS countries: what can be learned from information about the dynamics of stock prices
Kamitake et al. MODELING THE DEFAULT RISK OF CARD LOANS CONSIDERING INDIVIDUAL BEHAVIOR CHARACTERISTICS BASED ON BANK ACCOUNT DEPOSIT AND WITHDRAWAL DATA

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination