CN109711606A - 一种基于模型的数据预测方法及装置 - Google Patents

一种基于模型的数据预测方法及装置 Download PDF

Info

Publication number
CN109711606A
CN109711606A CN201811525793.3A CN201811525793A CN109711606A CN 109711606 A CN109711606 A CN 109711606A CN 201811525793 A CN201811525793 A CN 201811525793A CN 109711606 A CN109711606 A CN 109711606A
Authority
CN
China
Prior art keywords
prediction
data
medical insurance
expenditure
insurance fund
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811525793.3A
Other languages
English (en)
Inventor
张明
徐靖
许晓英
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Medical and Healthcare Management Co Ltd
Original Assignee
Ping An Medical and Healthcare Management Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Medical and Healthcare Management Co Ltd filed Critical Ping An Medical and Healthcare Management Co Ltd
Priority to CN201811525793.3A priority Critical patent/CN109711606A/zh
Publication of CN109711606A publication Critical patent/CN109711606A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本申请实施例提供一种基于模型的数据预测方法,所述方法包括:预测服务器接收终端发送的医保基金的支出预测请求,所述支出预测请求携带所述医保基金的预测维度;所述预测服务器从医保系统的数据库中提取所述预测维度对应的医保基金相关明细历史数据以响应所述支出预测请求;所述预测服务器调用所述预测维度对应的K个预测模型中的第一预测模型对所述医保基金相关明细历史数据进行处理,以得到所述医保基金的支出预测结果;所述预测服务器向所述终端发送携带所述医保基金的支出预测结果的支出预测响应。通过本方案可减少报销机构的基金损失,可将医保基金发放到需要的人手里,保证医保的社会公平性,提升对医保基金的管理效率。

Description

一种基于模型的数据预测方法及装置
技术领域
本申请涉及数据处理技术领域,具体涉及一种基于模型的数据预测方法及装置。
背景技术
在医保基金管理中,基金管理部门需要判断在基于当前医保制度下医保年度结束的时候,全年的医保基金支出是否会超出当前年度基金预算编制的金额,因此需要对基金支出进行预测。这里所指的医保制度可以包括城镇职工医疗保险制度,城镇/城乡居民医疗保险制度,以及新农合等不同医疗保险制度。
因此需要预测医保年度内不同维度下,剩余月份的基金支出金额。如:各个定点医疗机构下在剩余月份的医保基金支出金额,各个疾病下的月度医保基金支出金额,以及不同人群下的月度基金支出金额等。
目前解决这一问题的技术相对复杂,并没有完整且便利的解决方案。
发明内容
本申请实施例提供一种基于模型的数据预测方法及装置,能够准确、快速且有效的对数据进行短期预测。
本申请实施例的第一方面提供了一种基于模型的数据预测方法,所述方法包括:
预测服务器接收终端发送的医保基金的支出预测请求,所述支出预测请求携带所述医保基金的预测维度;
所述预测服务器从医保系统的数据库中提取所述预测维度对应的医保基金相关明细历史数据以响应所述支出预测请求;
所述预测服务器调用所述预测维度对应的K个预测模型中的第一预测模型对所述医保基金相关明细历史数据进行处理,以得到所述医保基金的支出预测结果,其中,所述第一预测模型的预测准确性高于所述K个预测模型中除第一预测模型之外的任意一个预测模型,K为正整数;
所述预测服务器向所述终端发送携带所述医保基金的支出预测结果的支出预测响应。
作为第一方面的第一种可能实施,所述预测维度包括医院种类,所述从医保系统的数据库中提取所述预测维度对应的医保基金相关明细历史数据,包括:
从医保系统的数据库中提取与所述医院种类相对应的医保基金相关明细历史数据,其中,所述医院种类包括各级医院或私人诊所或社区诊所,所述医保基金相关明细历史数据包括理赔年度数据、理赔月度数据、总费用数据和报销比例数据。
作为第一方面的第二种可能实施,所述调用所述预测维度对应的K个预测模型中的第一预测模型对所述医保基金相关明细历史数据进行处理,以得到所述医保基金的支出预测结果,包括:
选取所述医保基金相关明细历史数据中至少一年的数据作为基准数据;
调用所述预测维度对应的K个预测模型中的第一预测模型对所述基准数据进行处理,以得到所述医保基金的支出预测结果。
进一步,所述选取所述医保基金相关明细历史数据中至少一年的数据作为基准数据,包括:
选取所述医保基金相关明细历史数据中至少一年内的初始数据;
对所述至少一年内的初始数据进行完整性校验;
若完整性校验通过,则将所述至少一年内的初始数据作为基准数据;
若完整性校验未通过,则将距离缺失时段最近的一个等长时段的数据作为缺失时段的数据,将得到的所述缺失时段的数据填充到所述初始数据中以得到基准数据。
进一步,所述调用所述预测维度对应的K个预测模型中的第一预测模型,包括:
调用预测模型库中所述预测维度对应的K个预测模型中的每个预测模型对所述基准数据的前N个月的数据进行处理,以得到对应所述K个预测模型的K种预测支出值,所述K种预测支出值为对应所述基准数据的剩余M个月对应的的预测支出值,其中,所述N为不小于2的整数,且所述M为正整数;
调用医保基金支出算法对所述剩余M个月的数据进行处理,得到所述剩余M个月的实际支出值;
确定所述K种预测支出值中与所述实际支出值之间的误差值最小的第一预测支出值,其中,所述第一预测模型为所述K个预测模型中用于预测所述第一预测支出值的预测模型。
进一步,所述基准数据中的每个月数据的权重不同,所述基准数据中的每个月数据的权重大小与当月数据中的报销支出数据的报销比例成正比,所述基准数据的所述前N个月的数据的权重方差小于方差预设值。
其中,所述预测服务器接收终端发送的医保基金的支出预测请求之后,在所述预测服务器从医保系统的数据库中提取所述预测维度对应的医保基金相关明细历史数据以响应所述支出预测请求之前,还包括:
所述预测服务器对所述终端是否具备请求预测所述预测维度的权限进行校验;
若所述校验通过,则所述预测服务器发送同意预测所述终端发送的医保基金的支出预测请求的消息至所述终端;
若所述校验未通过,则所述预测服务器判断所述终端是否位于预设区域内;
若所述终端位于所述预设区域内,则所述预测服务器发送同意预测所述终端发送的医保基金的支出预测请求的消息至所述终端;
若若所述终端未位于所述预设区域内,则所述预测服务器发送不同意预测所述终端发送的医保基金的支出预测请求的消息至所述终端。
本申请实施例的第二方面提供了一种预测服务器,包括:
信息获取模块,用以接收终端发送的医保基金的支出预测请求,所述支出预测请求携带所述医保基金的预测维度;
数据获取模块,用以从医保系统的数据库中提取所述预测维度对应的医保基金相关明细历史数据以响应所述支出预测请求;
结果计算模块,用以调用所述预测维度对应的K个预测模型中的第一预测模型对所述医保基金相关明细历史数据进行处理,得到所述医保基金的支出预测结果,其中,所述第一预测模型的预测准确性高于所述K个预测模型中除第一预测模型之外的任意一个预测模型,K为正整数;
结果输出模块,用以向所述终端发送携带所述医保基金的支出预测结果的支出预测响应。
本申请实施例的第三方面提供一种预测服务器,包括处理器、输入设备、输出设备和存储器,所述处理器、输入设备、输出设备和存储器相互连接,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行如本申请实施例第一方面的步骤指令。
本申请实施例的第四方面提供了一种计算机可读存储介质,其中,上述计算机可读存储介质存储用于电子数据交换的计算机程序,其中,上述计算机程序使得计算机执行如本申请实施例第一方面中所描述的部分或全部步骤。
本申请实施例的第五方面提供了一种计算机程序产品,其中,上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,上述计算机程序可操作来使计算机执行如本申请实施例第一方面中所描述的部分或全部步骤。该计算机程序产品可以为一个软件安装包。
实施本申请实施例,至少具有如下有益效果:
通过本申请实施例,根据终端请求的预测维度,获取对应该预测维度的医保基金相关明细历史数据,通过调用对应所述预测维度的预测模型中预测准确度高的第一预测模型对上述数据进行处理,得到相应医保基金的支出预测结果。采用本方案,可相应获得医保基金的短期变化预测,确定在该年度的未来几个月内医保基金是否能保持收支平衡;对于预测到基金走势不合理,则医保报销机构可以根据预测结果对医保报销规则作出提前规划和响应,减少报销机构的基金损失,提升对医保基金的管理效率,有效提高了用户体验。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供了一种基于模型的数据预测的网络架构示意图;
图2为本申请实施例提供了一种基于模型的数据预测方法的交互示意图;
图3是本申请实施例提供了一种基于模型的数据预测方法流程示意图;
图4是本申请实施例提供了另一种基于模型的数据预测方法流程示意图;
图5是本申请实施例提供了另一种基于模型的数据预测方法流程示意图;
图6是本申请实施例提供了一种预测服务器的结构示意图;
图7是本申请实施例提供了一种预测服务器的系统示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书及上述附图中的术语“第一”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。
在本申请中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本申请所描述的实施例可以与其它实施例相结合。
参照图1,图1是本申请实施例提供了一种基于模型的数据预测的网络架构示意图。该网络架构包括终端101和终端101和预测服务器102。该终端101可以是安装有特定的APP应用的智能终端或者其他可以包括各种具有无线通信功能的手持设备、车载设备、可穿戴设备、计算设备或连接到无线调制解调器的其他处理设备,以及各种形式的用户设备(user equipment,UE),移动台(mobile station,MS),终端设备(terminal device)等等的电子装置。该预测服务器102可以是任何服务器,其可以接收终端101发送的请求,进行预测处理的任意服务器,如其可以为用户移动终端的服务器,或者其他设备的服务器。
参照图2,图2是本申请实施例提供了一种基于模型的数据预测的应用场景示意图。该应用场景包括终端201和预测服务器202,其中,终端201发送医保基金的支出预测请求至所述预测服务器202,所述支出预测请求携带所述医保基金的预测维度;所述预测服务器202接收所述终端201发送的医保基金的支出预测请求,并从医保系统的数据库中提取所述预测维度对应的医保基金相关明细历史数据以响应所述支出预测请求;然后所述预测服务器202调用所述预测维度对应的K个预测模型中的第一预测模型对所述医保基金相关明细历史数据进行处理,以得到所述医保基金的支出预测结果,其中,所述第一预测模型的预测准确性高于所述K个预测模型中除第一预测模型之外的任意一个预测模型,K为正整数;最后所述预测服务器202向所述终端201发送携带所述医保基金的支出预测结果的支出预测响应。以此,可相应获得医保基金的短期变化预测,确定在该年度或未来几个月内医保基金是否能保持收支平衡等。
参照图3,图3是本申请实施例公开了一种基于模型的数据预测方法的流程示意图,如图3所示,该数据预测方法包括步骤301-304,具体如下:
301、预测服务器接收终端发送的医保基金的支出预测请求,所述支出预测请求携带所述医保基金的预测维度。
其中,医保基金的支出预测请求包括终端想要预测的医保基金的预测维度信息等,该预测维度可以包括:将医保基金分为医院、疾病、人群等大的维度,还包括小的维度单元,如对于医院来说,其预测单元通常为各家医院,如果预测单元是医院,则需区分医院等级、类型和就诊类别;进一步地,根据需要可以按照医院等级分为一甲医院,二甲医院,三甲医院等,还包括将诊所分为私人诊所和社区诊所等;就诊类别区分为门诊、住院等;而在疾病维度下,预测单元可以为每种疾病,考虑到疾病诊断通常数量非常多,可以按照某种规则进行疾病分组,如按照ICD-10的二位码或三位码进行分组等,其也可以按照其他方式进行分组,如同一个类别下的疾病或者按照年龄等分类的疾病等;在人群维度下,存在不同的二级维度,如按照年龄、性别、身份、住址等不同维度分组成不同的预测单元。
302、所述预测服务器从医保系统的数据库中提取所述预测维度对应的医保基金相关明细历史数据以响应所述支出预测请求。
其中,医保基金相关明细历史数据包括与医保基金相关的各种费用数据,如支出数据或者收入数据等;在医院维度下,根据医保基金明细数据进行汇总医院维度所需要的关键历史数据,包括医院名称、理赔年度,理赔月度,医院等级如一级、二级、三级等,医院类别如私立医院、公立医院等,就诊类型如住院、门诊等,对应的基金支出,总费用,报销比例,就诊人次,就诊人数,次均费用,人均费用,次均基金支出,人均基金支出,住院天数,日均基金支出等。通过获取上述详细数据,才能进行精确的预测,使得预测结果更加准确。
303、所述预测服务器调用所述预测维度对应的K个预测模型中的第一预测模型对所述医保基金相关明细历史数据进行处理,以得到所述医保基金的支出预测结果,其中,所述第一预测模型的预测准确性高于所述K个预测模型中除第一预测模型之外的任意一个预测模型,K为正整数。
其中,各预测模型均位于预测模型库中,对应不同的预测维度则有多个不同的预测模型,所述第一预测模型的预测准确性高于所述K个预测模型中除第一预测模型之外的任意一个预测模型。
304、所述预测服务器向所述终端发送携带所述医保基金的支出预测结果的支出预测响应。
计算得到上述支出预测结果后,则将所述支出预测结果发送至所述终端。
通过本申请实施例,根据终端请求的预测维度,获取对应该预测维度的医保基金相关明细历史数据,通过调用对应所述预测维度的预测模型中预测准确度高的第一预测模型对上述数据进行处理,得到相应医保基金的支出预测结果。采用本方案,可相应获得医保基金的短期变化预测,确定在该年度的未来几个月内医保基金是否能保持收支平衡;对于预测到基金走势不合理,则医保报销机构可以根据预测结果对医保报销规则作出提前规划和响应,减少报销机构的基金损失,提升对医保基金的管理效率,有效提高了用户体验。
参照图4,图4为本申请实施例公开了另一种基于模型的数据预测方法的流程示意图,如图4所示,该数据预测方法包括步骤401-405,具体如下:
401、预测服务器接收终端发送的医保基金的支出预测请求,所述支出预测请求携带所述医保基金的预测维度,所述预测维度包括医院种类。
上述医保基金的支出预测请求还可以包括终端想要预测的医保基金的起始时间信息,如包括年、月、日等信息,通过明确时间点,作为预测的起始点,同时也是本年度已发放基金的结点,便于进行数据分类/分段;其中,所述预测的医保基金的起始时间信息也可以是系统设定的,即当检测到终端发送的xx医院/xx疾病/xx人群等信息后,自动调取数据库中与其相关的已发放基金时间结点信息,则自动推算出剩余未发放时间,默认作为预测请求时间,如完整年度的剩余月份的或者未来一年的等。优选的,可预设预测时间段为一年;或者基于用户的输入请求,获取到预测目标为某个月或某几个月甚至一年等;如用户预测2018年10月1日开始到2019年9月30日的医保基金支出,则选取2017年10月1日到2018年9月30日为一个完整医保年度,对该时间段内的数据进行获取。采用该设置,方便用户,十分智能化。
对于医院来说,其预测单元通常为各家医院,如果预测单元是医院,则需区分医院等级、类型和就诊类别;进一步地,根据需要可以按照医院等级分为一甲医院,二甲医院,三甲医院等,还包括将诊所分为私人诊所和社区诊所等;就诊类别区分为门诊、住院等;而在疾病维度下,预测单元可以为每种疾病,考虑到疾病诊断通常数量非常多,可以按照某种规则进行疾病分组,如按照ICD-10的二位码或三位码进行分组等,其也可以按照其他方式进行分组,如同一个类别下的疾病或者按照年龄等分类的疾病等;在人群维度下,存在不同的二级维度,如按照年龄、性别、身份、住址等不同维度分组成不同的预测单元。
402、所述预测服务器从医保系统的数据库中提取与所述医院种类对应的医保基金相关明细历史数据以响应所述支出预测请求。
其中该获取历史数据的手段可以是通过数据库进行调用;该数据库预先存储有大量的医院的、各种疾病的、各种人群的医保基金相关明细数据,通过调用该数据库的信息,则可以获取到历史数据;可替代的,也可以发送请求至各医院管理系统,各医院管理系统接收请求同意后,则发送相关数据信息;
当数据库中未查找到某医院的数据时,则可通过手动输入等手段进行补充输入,以确保数据信息的完整性,保障后续预测结果的准确度。
当获取到上述历史数据,则可以缓存至系统,以便下次使用时优选从缓存中获取,更加快速、方便。
403、所述预测服务器选取所述医保基金相关明细历史数据中至少一年的数据作为基准数据。
所述医保基金相关明细历史数据可包括预测时间点前的如一年的历史数据或者两年、三年、十年等的数据,如可设定一年的历史数据,其具有较高的借鉴价值。通过选取所述医保基金相关明细历史数据中至少一年的数据作为基准数据,减少了数据处理量,可提高计算效率。
404、调用所述预测维度对应的K个预测模型中的第一预测模型对所述基准数据进行处理,以得到所述医保基金的支出预测结果。其中,所述第一预测模型的预测准确性高于所述K个预测模型中除第一预测模型之外的任意一个预测模型,K为正整数。
该第一预测模型的预测准确性高于所述K个预测模型中除第一预测模型之外的任意一个预测模型,其可以通过计算平均预测值获取与实际值误差最小的预测模型作为第一预测模型。
405、所述预测服务器向所述终端发送携带所述医保基金的支出预测结果的支出预测响应。
计算得到上述支出预测结果后,则将所述支出预测结果发送至所述终端。
该方案获取到终端的预测请求,明确想要预测的医保基金分支下的预测维度的种类,进而进行特定预测。其中该预测请求,可以是针对各种大的预测维度或者小的预测维度下的预测,根据不同的预测请求获取相应的数据。且通过选取所述医保基金相关明细历史数据中至少一年的数据作为基准数据,减少了数据处理量,可提高计算效率。该方案获取终端输入请求的手段,可以是用户手动输入,或者语音输入等其他形式,此处不做限制。
参照图5,图5为本申请实施例公开了另一种基于模型的数据预测方法的流程示意图,如图5所示,该数据预测方法包括步骤501-506,具体如下:
501、预测服务器接收终端发送的医保基金的支出预测请求,所述支出预测请求携带所述医保基金的预测维度。
该预测维度可以为不同的医院、不同疾病、不同人群分类等。
其中所述预测服务器接收终端发送的医保基金的支出预测请求之后,在所述预测服务器从医保系统的数据库中提取所述预测维度对应的医保基金相关明细历史数据以响应所述支出预测请求之前,还包括:
所述预测服务器对所述终端是否具备请求预测所述预测维度的权限进行校验;该权限判断可以是检测该终端是否位于相应区域内或者是否满足其他设定的限制;
若所述校验通过,则所述预测服务器发送同意预测所述终端发送的医保基金的支出预测请求的消息至所述终端;
若所述校验未通过,则所述预测服务器判断所述终端是否位于预设区域内;
若所述终端位于所述预设区域内,则所述预测服务器发送同意预测所述终端发送的医保基金的支出预测请求的消息至所述终端;
若若所述终端未位于所述预设区域内,则所述预测服务器发送不同意预测所述终端发送的医保基金的支出预测请求的消息至所述终端。
通过对所述终端是否具备请求预测所述预测维度的权限进行校验,可以确保预测结果的私密性或安全性,所述权限的验证可以是对特定设备或者特定终端代码编号等的验证,其也可以是通过验证消息等方式进行验证。当上述权限校验未通过,则可进一步对该终端的位置进行验证,确认其是否位于预设区域内,该处的预设区域可以是如医院内或者医保基金管理处等区域,通过该设置,可以进一步确保数据的安全性,只有特定区域的终端才具备权限。
502、所述预测服务器从医保系统的数据库中提取所述预测维度对应的医保基金相关明细历史数据以响应所述支出预测请求。
如在医院维度下,例如输入“XX”医院,如为“二甲医院”,则从数据库中获取二甲医院对应的医保基金相关明细历史数据;此外,同样是二甲医院,但不同地区的报销政策不同,那么根据报销政策对预测模型进行分类,获得预测子单元,可继续进行子单元的匹配。
当预测疾病维度时,则根据医保基金相关明细数据进行汇总疾病维度所需要的关键历史数据,包括疾病名称,理赔年度,理赔月度,疾病分组信息,及对应的基金支出,总费用,报销比例,生病人次,生病人数,次均费用,人均费用,次均基金支出,人均基金支出,日均基金支出等。
503、选取所述医保基金相关明细历史数据中至少一年内的初始数据。
从所述医保基金相关明细历史数据中选取出至少一年内的初始数据,其中也可以是其他时段的数据,优选的选择一年的数据,其借鉴意义较大。
504、对所述至少一年内的初始数据进行完整性校验。
若完整性校验通过,则将所述至少一年内的初始数据作为基准数据;
若完整性校验未通过,则将距离缺失时段最近的一个等长时段的数据作为缺失时段的数据,将得到的所述缺失时段的数据填充到所述初始数据中以得到基准数据。
选取所述医保基金相关明细历史数据中至少一年内的初始数据,对所述至少一年内的初始数据进行完整性校验;若完整性校验通过,则将所述至少一年内的初始数据作为基准数据;若完整性校验未通过,则将距离缺失时段最近的一个等长时段的数据作为缺失时段的数据,将得到的所述缺失时段的数据填充到所述初始数据中以得到基准数据。其中,对于有缺失的数据,则可分别以往前最近一个月的数据做补填。如2018年7月的数据有缺失,则拿6月的数据做填补,使得每个月的数据都是完整的,不影响最终的预测结果。或者,某一天的数据缺失时,则将其相近天数的数据作为缺失天数的数据进行填充,其可以是该天前一天或者后一天,此处不做限定;其也可以是选取特定比较重要时段的数据来填补。
进一步地,如进行医院维度的历史数据处理时,可以把月度医疗费用太少的医院进行合并处理,以增加时间序列数据的平稳性;对于特殊手工报销或异常机构报销的数据也可做合并处理。采用该手段,将数据较少、较小的部分做合并处理,保障数据的稳定性,使得结果更精准。
505、调用所述预测维度对应的K个预测模型中的第一预测模型对所述基准数据进行处理,以得到所述医保基金的支出预测结果;其中,所述第一预测模型的预测准确性高于所述K个预测模型中除第一预测模型之外的任意一个预测模型,K为正整数。
其中,调用预测模型库中所述预测维度对应的K个预测模型中的每个预测模型对所述基准数据的前N个月的数据进行处理,以得到对应所述K个预测模型的K种预测支出值,所述K种预测支出值为对应所述基准数据的剩余M个月对应的的预测支出值,其中,所述N为不小于2的整数,且所述M为正整数;
调用医保基金支出算法对所述剩余M个月的数据进行处理,得到所述剩余M个月的实际支出值;
确定所述K种预测支出值中与所述实际支出值之间的误差值最小的第一预测支出值,其中,所述第一预测模型为所述K个预测模型中用于预测所述第一预测支出值的预测模型。
该第一预测模型是基于不同的请求、不同的维度、不同的历史数据通过特定的多种算法计算出多个预测值,同时与实际支出做误差比较,得出的最合适的预测模型。
其中,所述预测模型库中包含了各种预先设定的预测模型。每种预测模型可包括预测路径和预测方法。预测模型库可示例如下:
根据设定的多种不同的路径和指标,设置不同的预测方法;其中以时间序列预测方法示例,可包括采用以下方法:ARIMA模型和多项式拟合;预测方法优先选择ARIMA模型做时间序列预测,ARIMA模型,是指将非平稳时间序列转化为平稳时间序列,然后将因变量仅对它的滞后值以及随机误差项的现值和滞后值进行回归所建立的模型。ARIMA模型所需要的参数(p,d,q)将根据算法自动寻找最优参数;当数据不满足ARIMA模型要求,则将自动转到多项式预测,多项式预测所需的参数将根据最小拟合误差法自动实现估计。
具体地,根据获得的相关历史数据,通过选取测试集,如选定保留预测时点前3个月的数据作为测试集,剩余的月度如基准数据的剩下9个月的数据作为训练集;其也可以选取预测时点前6个月的数据作为测试集,其余6个月的数据作为训练集等。
当选定预测时点前3个月的数据作为测试集时,则通过预测模型库的各种模型,多次进行调用计算,预测剩下9个月的数据;然后比较不同预测值与实际支出之间的绝对值误差,即与前面9个月的历史数据进行比较,获取测试的绝对值误差,然后比较各种算法下的误差最小的预测方案是哪一个,进而筛选出满足所述请求的预测模型。
其中获取到的第一预测模型也可以是预测支出值与实际支出值之间的平方差值最小的预测值所对应的预测模型;所述第一预测模型也可以是所述K个预测模型中各个模型多次训练的预测支出值的平均值与实际支出值的误差值最小的第一预测支出值所对应的第一预测模型。
当然,此处并不做具体限定,如可以基于相应的权重、重要性等进行其他计算获取到准确度较高的预测模型的手段,也在本方案的保护范围内。
优选的,所述基准数据中的前N个月的数据可以为:所述基准数据中的每个月数据的权重大小与当月数据中的报销支出数据的报销比例成正比,所述基准数据的所述前N个月的数据的权重方差小于方差预设值。具体地,所述基准数据中的每个月数据的权重大小不同,根据基准数据中每个月数据的报销支出数据的报销比例的大小,来确定所述基准数据中的每个月数据的权重大小;选取权重方差小于方差预设值的连续月份的数据作为所述基准数据中的前N个月的数据。
506、所述预测服务器向所述终端发送携带所述医保基金的支出预测结果的支出预测响应。
获取到最适合的预测模型后,则基于用户输入的预测请求,以获取到的医保基金相关明细历史数据为基础,调用上述预测模型进行处理,可预测相应预测维度下未来几个月甚至一年等短期内的基金支出情况。其中,也可以以上述至少一年的基准数据为基础,调用上述预测模型进行处理,得到预测结果。该测试结果可以是某一预测维度的支出数据,或者通过叠加,计算得到整个大的维度的医保基金支出情况,该结果可以是具体的预测支出数据值,或者是范围值等。
上述预测模型是波动、变动的,其基于用户输入的维度信息及相应的历史数据信息获得最准确的模型,十分方便、智能,用户只需要输入需求,其他由系统进行处理,且输出结果速度快且准确,有效减少了大量人力成本。
得到上述支出预测结果后,则将所述支出预测结果发送至所述终端。
通过本申请实施例,根据终端请求的预测维度,获取对应该预测维度的医保基金相关明细历史数据,对上述医保基金相关明细历史数据进行数据处理,得到更加具有借鉴性的数据,并对上述数据进行训练,得到所述预测维度的预测模型中预测准确度高的第一预测模型,即选取出与实际支出值之间误差最小的第一预测模型,进而计算得到相应医保基金的支出预测结果。采用本方案,可精准、有效的获得医保基金的短期变化预测,确定在该年度的未来几个月内医保基金是否能保持收支平衡;对于预测到基金走势不合理,则医保报销机构可以根据预测结果对医保报销规则作出提前规划和响应,减少报销机构的基金损失,提升对医保基金的管理效率,有效提高了用户体验。本方案的实施方法并不局限于医保基金领域,其他基金的支出短期预测也适用本方法。如通过选择基金类型,然后基于具体类型再进一步选择预测维度信息等进行预测。
与上述实施例一致的,请参阅图6,图6为本申请实施例提供的一种预测服务器的结构示意图,如图6所示,包括处理器、输入设备、输出设备和存储器,所述处理器、输入设备、输出设备和存储器相互连接,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,上述程序包括用于执行本申请各方法实施例中的任意一种方法的部分或全部步骤的指令。
具体例如,上述程序包括用于执行如下步骤的指令:
接收终端发送的医保基金的支出预测请求,所述支出预测请求携带所述医保基金的预测维度;
从医保系统的数据库中提取所述预测维度对应的医保基金相关明细历史数据以响应所述支出预测请求;
调用所述预测维度对应的K个预测模型中的第一预测模型对所述医保基金相关明细历史数据进行处理,以得到所述医保基金的支出预测结果,其中,所述第一预测模型的预测准确性高于所述K个预测模型中除第一预测模型之外的任意一个预测模型,K为正整数;
向所述终端发送携带所述医保基金的支出预测结果的支出预测响应。
上述主要从方法侧执行过程的角度对本申请实施例的方案进行了介绍。可以理解的是,终端为了实现上述功能,其包含了执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到,结合本文中所提供的实施例描述的各示例的单元及算法步骤,本申请能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
本申请实施例可以根据上述方法示例对终端进行功能单元的划分,例如,可以对应各个功能划分各个功能单元,也可以将两个或两个以上的功能集成在一个处理单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。需要说明的是,本申请实施例中对单元的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
与上述一致的,请参阅图7,图7为本申请实施例提供了一种预测服务器的结构示意图。该预测服务器包括信息获取模块701、数据获取模块702、结果计算模块703和结果输出模块704,具体如下:
信息获取模块701,用以接收终端发送的医保基金的支出预测请求,所述支出预测请求携带所述医保基金的预测维度;
数据获取模块702,用以从医保系统的数据库中提取所述预测维度对应的医保基金相关明细历史数据以响应所述支出预测请求;
结果计算模块703,用以调用所述预测维度对应的K个预测模型中的第一预测模型对所述医保基金相关明细历史数据进行处理,以得到所述医保基金的支出预测结果,其中,所述第一预测模型的预测准确性高于所述K个预测模型中除第一预测模型之外的任意一个预测模型,K为正整数;
结果输出模块704,用以向所述终端发送携带所述医保基金的支出预测结果的支出预测响应。
可以看出,通过本申请实施例,根据终端请求的预测维度,获取对应该预测维度的医保基金相关明细历史数据,通过调用对应所述预测维度的预测模型中预测准确度高的第一预测模型对上述数据进行处理,得到相应医保基金的支出预测结果。采用本方案,可相应获得医保基金的短期变化预测,确定在该年度的未来几个月内医保基金是否能保持收支平衡;对于预测到基金走势不合理,则医保报销机构可以根据预测结果对医保报销规则作出提前规划和响应,减少报销机构的基金损失,提升对医保基金的管理效率,有效提高了用户体验。
本申请实施例还提供一种计算机存储介质,其中,该计算机存储介质存储用于存储计算机程序,该计算机程序被处理器执行,以实现如上述方法实施例中记载的任何一种基于模型的数据预测方法的部分或全部步骤。
本申请实施例还提供一种计算机程序产品,所述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,该计算机程序使得计算机执行如上述方法实施例中记载的任何一种基于模型的数据预测方法的部分或全部步骤。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在申请明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件程序模块的形式实现。
所述集成的单元如果以软件程序模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储器中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储器包括:U盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储器中,存储器可以包括:闪存盘、只读存储器、随机存取器、磁盘或光盘等。
以上对本申请实施例进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (10)

1.一种基于模型的数据预测方法,其特征在于,所述方法包括:
预测服务器接收终端发送的医保基金的支出预测请求,所述支出预测请求携带所述医保基金的预测维度;
所述预测服务器从医保系统的数据库中提取所述预测维度对应的医保基金相关明细历史数据以响应所述支出预测请求;
所述预测服务器调用所述预测维度对应的K个预测模型中的第一预测模型对所述医保基金相关明细历史数据进行处理,以得到所述医保基金的支出预测结果,其中,所述第一预测模型的预测准确性高于所述K个预测模型中除第一预测模型之外的任意一个预测模型,K为正整数;
所述预测服务器向所述终端发送携带所述医保基金的支出预测结果的支出预测响应。
2.根据权利要求1所述的方法,其特征在于,
所述预测维度包括医院种类,所述从医保系统的数据库中提取所述预测维度对应的医保基金相关明细历史数据,包括:
从医保系统的数据库中提取与所述医院种类相对应的医保基金相关明细历史数据,其中,所述医院种类包括各级医院或私人诊所或社区诊所,所述医保基金相关明细历史数据包括理赔年度数据、理赔月度数据、总费用数据和报销比例数据。
3.根据权利要求1所述的方法,其特征在于,所述调用所述预测维度对应的K个预测模型中的第一预测模型对所述医保基金相关明细历史数据进行处理,以得到所述医保基金的支出预测结果,包括:
选取所述医保基金相关明细历史数据中至少一年的数据作为基准数据;
调用所述预测维度对应的K个预测模型中的第一预测模型对所述基准数据进行处理,以得到所述医保基金的支出预测结果。
4.根据权利要求3所述的方法,其特征在于,所述选取所述医保基金相关明细历史数据中至少一年的数据作为基准数据,包括:
选取所述医保基金相关明细历史数据中至少一年内的初始数据;
对所述至少一年内的初始数据进行完整性校验;
若完整性校验通过,则将所述至少一年内的初始数据作为基准数据;
若完整性校验未通过,则将距离缺失时段最近的一个等长时段的数据作为缺失时段的数据,将得到的所述缺失时段的数据填充到所述初始数据中以得到基准数据。
5.根据权利要求3或4所述的方法,其特征在于,所述调用所述预测维度对应的K个预测模型中的第一预测模型,包括:
调用预测模型库中所述预测维度对应的K个预测模型中的每个预测模型对所述基准数据的前N个月的数据进行处理,以得到对应所述K个预测模型的K种预测支出值,所述K种预测支出值为对应所述基准数据的剩余M个月对应的的预测支出值,其中,所述N为不小于2的整数,且所述M为正整数;
调用医保基金支出算法对所述剩余M个月的数据进行处理,得到所述剩余M个月的实际支出值;
确定所述K种预测支出值中与所述实际支出值之间的误差值最小的第一预测支出值,其中,所述第一预测模型为所述K个预测模型中用于预测所述第一预测支出值的预测模型。
6.根据权利要求5所述的方法,其特征在于,所述基准数据中的每个月数据的权重不同,所述基准数据中的每个月数据的权重大小与当月数据中的报销支出数据的报销比例成正比,所述基准数据的所述前N个月的数据的权重方差小于方差预设值。
7.根据权利要求1或6所述的方法,其特征在于,所述预测服务器接收终端发送的医保基金的支出预测请求之后,在所述预测服务器从医保系统的数据库中提取所述预测维度对应的医保基金相关明细历史数据以响应所述支出预测请求之前,还包括:
所述预测服务器对所述终端是否具备请求预测所述预测维度的权限进行校验;
若所述校验通过,则所述预测服务器发送同意预测所述终端发送的医保基金的支出预测请求的消息至所述终端。
8.一种预测服务器,其特征在于,包括:
信息获取模块,用以接收终端发送的医保基金的支出预测请求,所述支出预测请求携带所述医保基金的预测维度;
数据获取模块,用以从医保系统的数据库中提取所述预测维度对应的医保基金相关明细历史数据以响应所述支出预测请求;
结果计算模块,用以调用所述预测维度对应的K个预测模型中的第一预测模型对所述医保基金相关明细历史数据进行处理,以得到所述医保基金的支出预测结果,其中,所述第一预测模型的预测准确性高于所述K个预测模型中除第一预测模型之外的任意一个预测模型,K为正整数;
结果输出模块,用以向所述终端发送携带所述医保基金的支出预测结果的支出预测响应。
9.一种预测服务器,其特征在于,包括处理器、输入设备、输出设备和存储器,所述处理器、输入设备、输出设备和存储器相互连接,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行如权利要求1-7任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机存储介质存储有计算机程序,所述计算机程序被处理器执行,以实现如权利要求1-7任一项所述的方法。
CN201811525793.3A 2018-12-13 2018-12-13 一种基于模型的数据预测方法及装置 Pending CN109711606A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811525793.3A CN109711606A (zh) 2018-12-13 2018-12-13 一种基于模型的数据预测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811525793.3A CN109711606A (zh) 2018-12-13 2018-12-13 一种基于模型的数据预测方法及装置

Publications (1)

Publication Number Publication Date
CN109711606A true CN109711606A (zh) 2019-05-03

Family

ID=66255816

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811525793.3A Pending CN109711606A (zh) 2018-12-13 2018-12-13 一种基于模型的数据预测方法及装置

Country Status (1)

Country Link
CN (1) CN109711606A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110136014A (zh) * 2019-05-23 2019-08-16 王为光 一种基于大数据的医保数据分析方法
CN110993096A (zh) * 2019-11-27 2020-04-10 医惠科技有限公司 一种脓毒血症的预警装置、设备及存储介质
CN111242793A (zh) * 2020-01-16 2020-06-05 上海金仕达卫宁软件科技有限公司 医保数据异常的检测方法和装置
CN112380131A (zh) * 2020-11-20 2021-02-19 北京百度网讯科技有限公司 模块测试方法、装置及电子设备
CN112561551A (zh) * 2019-09-26 2021-03-26 富士通株式会社 用于优化对象预测的方法、设备和存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006088350A1 (en) * 2005-02-21 2006-08-24 Chemometry Consultancy Method and system for selection of calibration model dimensionality, and use of such a calibration model
CN104125584A (zh) * 2013-04-27 2014-10-29 中国移动通信集团福建有限公司 一种针对网络业务的业务指标实现预测的方法及装置
CN105205297A (zh) * 2014-06-12 2015-12-30 腾讯科技(深圳)有限公司 一种时间序列预测方法及系统
CN106997493A (zh) * 2017-02-14 2017-08-01 云数信息科技(深圳)有限公司 基于多维度数据的彩票用户流失预测方法及其系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006088350A1 (en) * 2005-02-21 2006-08-24 Chemometry Consultancy Method and system for selection of calibration model dimensionality, and use of such a calibration model
CN104125584A (zh) * 2013-04-27 2014-10-29 中国移动通信集团福建有限公司 一种针对网络业务的业务指标实现预测的方法及装置
CN105205297A (zh) * 2014-06-12 2015-12-30 腾讯科技(深圳)有限公司 一种时间序列预测方法及系统
CN106997493A (zh) * 2017-02-14 2017-08-01 云数信息科技(深圳)有限公司 基于多维度数据的彩票用户流失预测方法及其系统

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110136014A (zh) * 2019-05-23 2019-08-16 王为光 一种基于大数据的医保数据分析方法
CN112561551A (zh) * 2019-09-26 2021-03-26 富士通株式会社 用于优化对象预测的方法、设备和存储介质
CN110993096A (zh) * 2019-11-27 2020-04-10 医惠科技有限公司 一种脓毒血症的预警装置、设备及存储介质
CN110993096B (zh) * 2019-11-27 2021-04-09 医惠科技有限公司 一种脓毒血症的预警装置、设备及存储介质
CN111242793A (zh) * 2020-01-16 2020-06-05 上海金仕达卫宁软件科技有限公司 医保数据异常的检测方法和装置
CN111242793B (zh) * 2020-01-16 2024-02-06 上海金仕达卫宁软件科技有限公司 医保数据异常的检测方法和装置
CN112380131A (zh) * 2020-11-20 2021-02-19 北京百度网讯科技有限公司 模块测试方法、装置及电子设备
CN112380131B (zh) * 2020-11-20 2024-02-20 北京百度网讯科技有限公司 模块测试方法、装置及电子设备

Similar Documents

Publication Publication Date Title
CN109711606A (zh) 一种基于模型的数据预测方法及装置
CN107784424A (zh) 任务管理方法、装置、计算机设备及存储介质
CN107515890A (zh) 一种识别常驻点的方法及终端
CN112926699A (zh) 异常对象识别方法、装置、设备及存储介质
CN109034505A (zh) 计量用表需求量在线预测方法及终端设备
CN108009932A (zh) 一种基于大数据分析的智能长期护理服务平台
CN107945088A (zh) 一种景区管理方法及系统
CN107220867A (zh) 对象控制方法及装置
CN109800363A (zh) 构建资信关系网络的方法、装置、设备及存储介质
CN109146661A (zh) 用户类型预测方法、装置、电子设备及存储介质
CN111444226A (zh) 业务预约网点数据的推送方法和系统
CN108595579A (zh) 联系人亲密度估算方法、装置、计算机设备和存储介质
CN110310153A (zh) 一种交易预测方法及装置
CN112927064A (zh) 延期还款数据处理方法、装置、电子设备及存储介质
CN109636311A (zh) 一种排号情况提示方法及终端设备
CN109903193A (zh) 房产交易中佣金的分配方法、装置、设备及存储介质
CN112488893A (zh) 服务数据处理方法、装置、存储介质及电子设备
CN109858735A (zh) 用户风险评分评定方法、装置、计算机设备及存储介质
CN107977855A (zh) 一种管理用户信息的方法及装置
CN110119951A (zh) 录单方法、装置、计算机设备及存储介质
CN110119979A (zh) 基于数据分析的房产评估系统推荐方法、装置及服务器
CN109658529A (zh) 虚拟停车场计费方法及相关产品
CN110135190A (zh) 数据管理方法、服务器及计算机存储介质
CN110427354A (zh) 一种分布式研判系统、方法及计算机存储介质、电子设备
CN105868217A (zh) 数值自动转换方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20190503

RJ01 Rejection of invention patent application after publication