CN112927092A - 理赔趋势预测方法、装置、设备及存储介质 - Google Patents

理赔趋势预测方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN112927092A
CN112927092A CN202110386280.4A CN202110386280A CN112927092A CN 112927092 A CN112927092 A CN 112927092A CN 202110386280 A CN202110386280 A CN 202110386280A CN 112927092 A CN112927092 A CN 112927092A
Authority
CN
China
Prior art keywords
data
settlement
trend
target
type
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110386280.4A
Other languages
English (en)
Other versions
CN112927092B (zh
Inventor
王雪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN202110386280.4A priority Critical patent/CN112927092B/zh
Publication of CN112927092A publication Critical patent/CN112927092A/zh
Application granted granted Critical
Publication of CN112927092B publication Critical patent/CN112927092B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/08Insurance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/067Enterprise or organisation modelling

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Economics (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Marketing (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Business, Economics & Management (AREA)
  • Development Economics (AREA)
  • Quality & Reliability (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Tourism & Hospitality (AREA)
  • Databases & Information Systems (AREA)
  • Technology Law (AREA)
  • Educational Administration (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本发明涉及大数据领域,公开了一种理赔趋势预测方法、装置、设备及存储介质。本方法包括:获取保险公司在预设时间段内的多份历史理赔数据,并对数据进行清洗,得到目标理赔数据;确定每份目标理赔数据对应的理赔类型,并将属于同一理赔类型的目标理赔数据组成理赔数据集合;调用预置理赔趋势预测模型,分别将每个理赔数据集合输入到理赔趋势预测模型执行正向运算,得到预测结果;根据预置理赔趋势曲线和目标预测结果,确定每个理赔类型的理赔趋势,并将理赔趋势返回至预设目标终端。本方案通过将事件和理赔趋势进行绑定,解决了理赔趋势预测准确率低的技术问题。本发明中的目标理赔数据可以存储于区块链中。

Description

理赔趋势预测方法、装置、设备及存储介质
技术领域
本发明涉及大数据领域,尤其涉及一种理赔趋势预测方法、装置、设备及存储介质。
背景技术
随着经济的发展,世界的联系愈加紧密,任何风吹草动都可能造成经济的波动。驱动经济发展的,正是一个个独立的事件,每次事件的发生,都可能是一次机遇。对于保险公司来说,事件发生对于理赔金额准备影响非常大,若突发重大事件后,没有及时准备足够的理赔金额,对于保险公司的信誉和客户体验都会造成巨大的影响。
对于公司来说,在没有理赔趋势预测方案支撑的情况下,除法律要求准备保险理赔金外,还需要额外准备大量流动资金,以备突发情况的不时之需。这样的话,有大量流动资金无法产生收益,对于保险公司来说,是个不小的损失。因此,理赔趋势的预测成为了本领域技术人员需要面临的技术问题。
发明内容
本发明的主要目的是提高理赔趋势预测的准确率,解决理赔趋势预测准确率低的技术问题。
本发明第一方面提供了一种理赔趋势预测方法,包括:
获取预设时间段内的历史理赔数据,其中,所述理赔数据包括理赔类型和理赔金额;
对所述历史理赔数据进行数据清洗,得到目标理赔数据;
对所述目标理赔数据进行识别,确定所述目标理赔数据对应的理赔类型,并将理赔类型相同的目标理赔数据组成一个理赔数据集合,得到至少一个理赔数据集合;
调用预置理赔趋势预测模型,分别将每个理赔数据集合输入到所述理赔趋势预测模型执行正向运算,得到目标预测结果;
接收待理赔数据,并分别对所述待理赔数据和所述目标理赔数据进行文本识别,得到理赔趋势曲线;
根据所述理赔趋势曲线和所述目标预测结果,确定每个理赔数据集合所属理赔类型的理赔趋势,并将所述理赔趋势返回至目标终端。
可选地,在本发明第一方面的第一种实现方式中,在所述获取预设时间段内的历史理赔数据之前,还包括:
预先设定多个理赔类型;
基于预置理赔数据库,获取与所述多个理赔类型中任意一个理赔类型相关的理赔数据,并将所述理赔数据作为训练数据集;
基于所述理赔数据,获取所述理赔类型的实际理赔趋势,并将所述实际理赔趋势作为所述训练数据集对应的验证集;
将所述训练数据集输入预置初始理赔趋势预测模型执行正向运算,得到对所述理赔类型对应的理赔趋势的第一预测结果。
可选地,在本发明第一方面的第二种实现方式中,在所述将所述训练数据集输入预置初始理赔趋势预测模型执行正向运算,得到对所述理赔类型对应的理赔趋势的第一预测结果之后,还包括:
将所述第一预测结果与所述验证集拟合,得到所述预测结果与所述验证集之间的拟合度;
判断所述拟合度是否小于预设阈值;
若是,则根据所述初始理赔趋势预测模型的损失函数,对所述初始理赔趋势预测模型进行迭代训练,直到所述拟合度大于预设阈值,得到目标理赔趋势预测模型。
可选地,在本发明第一方面的第三种实现方式中,所述对所述历史理赔数据进行数据清洗,得到目标理赔数据包括:
获取所述历史理赔数据的清洗请求;
根据所述历史理赔数据和所述清洗请求,确定所述历史理赔数据的目标清洗规则;
根据所述目标清洗规则,对所述历史理赔数据进行数据清洗,得到目标理赔数据。
可选地,在本发明第一方面的第四种实现方式中,所述调用预置理赔趋势预测模型,分别将每个理赔数据集合输入到所述理赔趋势预测模型执行正向运算,得到目标预测结果包括:
获取每个理赔数据集合所属的理赔类型的预设数据类型集;
提取所述每个理赔数据集合中每份理赔数据的实际数据类型集;
将所述实际数据类型集和所述预设数据类型集比对,确定所述每份理赔数据的实际数据类型集中缺少的数据类型,并将所述每份理赔数据中缺少的数据类型对应的数据补零,得到所述每份理赔数据对应的目标输入数据;
根据所述多个目标输入数据,生成目标输入数据矩阵;
将所述目标输入数据矩阵输入所述理赔趋势预测模型,执行正向运算,得到目标预测结果。
可选地,在本发明第一方面的第五种实现方式中,所述接收待理赔数据,并分别对所述待理赔数据和所述目标理赔数据进行文本识别,得到理赔趋势曲线包括:
接收待理赔数据;
对所述待理赔数据进行文本识别,得到第一文本数据,并根据所述第一文本数据得到所述待理赔数据对应的第一标签;
对所述目标理赔数据进行文本识别,得到第二文本数据,并根据所述第二文本数据得到所述待理赔数据对应的第二标签;
判断所述第一标签与所述第二标签是否匹配;
若是,则获取与所述第二标签关联的理赔趋势曲线。
可选地,在本发明第一方面的第六种实现方式中,在所述根据所述理赔趋势曲线和所述目标预测结果,确定每个理赔数据集合所属理赔类型的理赔趋势,并将所述理赔趋势返回至目标终端之后,还包括:
判断每个理赔数据集合所属的理赔类型的发展趋势是否异常;
若所述每个理赔数据集合所属的理赔类型的发展趋势异常,则确定所述每个理赔数据集合所属的理赔类型的发展趋势异常的异常原因;
将所述异常原因发送至与所述理赔类型对应的监控中心的网络设备,以调整所述理赔类型的理赔政策。
本发明第二方面提供了一种理赔趋势预测装置,包括:
第一获取模块,用于获取预设时间段内的历史理赔数据,其中,所述理赔数据包括理赔类型和理赔金额;
数据清洗模块,用于对所述历史理赔数据进行数据清洗,得到目标理赔数据;
识别模块,用于对所述目标理赔数据进行识别,确定所述目标理赔数据对应的理赔类型,并将理赔类型相同的目标理赔数据组成一个理赔数据集合,得到至少一个理赔数据集合;
运算模块,用于调用预置理赔趋势预测模型,分别将每个理赔数据集合输入到所述理赔趋势预测模型执行正向运算,得到目标预测结果;
识别模块,用于接收待理赔数据,并分别对所述待理赔数据和所述目标理赔数据进行文本识别,得到理赔趋势曲线;
第一确定模块,用于根据所述理赔趋势曲线和所述目标预测结果,确定每个理赔数据集合所属理赔类型的理赔趋势,并将所述理赔趋势返回至目标终端。
可选地,在本发明第二方面的第一种实现方式中,所述理赔趋势预测装置还包括:
设定模块,用于预先设定多个理赔类型;
第二获取模块,用于基于预置理赔数据库,获取与所述多个理赔类型中任意一个理赔类型相关的理赔数据,并将所述理赔数据作为训练数据集;基于所述理赔数据,获取所述理赔类型的实际理赔趋势,并将所述实际理赔趋势作为所述训练数据集对应的验证集;
运算模块,用于将所述训练数据集输入预置初始理赔趋势预测模型执行正向运算,得到对所述理赔类型对应的理赔趋势的第一预测结果。
可选地,在本发明第二方面的第二种实现方式中,理赔趋势预测装置还包括:
拟合模块,用于将所述预测结果与所述验证集拟合,得到所述预测结果与所述验证集之间的拟合度;
第一判断模块,用于判断所述拟合度是否小于预设阈值;
训练模块,用于当所述拟合度小于预设阈值时,根据所述初始理赔趋势预测模型的损失函数,对所述初始理赔趋势预测模型进行迭代训练,直到所述拟合度大于预设阈值,得到目标理赔趋势预测模型。
可选地,在本发明第二方面的第三种实现方式中,所述数据清洗模块具体用于:
获取所述历史理赔数据的清洗请求;
根据所述历史理赔数据和所述清洗请求,确定所述历史理赔数据的目标清洗规则;
根据所述目标清洗规则,对所述历史理赔数据进行数据清洗,得到目标理赔数据。
可选地,在本发明第二方面的第四种实现方式中,所述预测模块包括:
获取单元,用于获取每个理赔数据集合所属的理赔类型的预设数据类型集;
提取单元,用于提取所述每个理赔数据集合中每份理赔数据的实际数据类型集;
确定单元,用于将所述实际数据类型集和所述预设数据类型集比对,确定所述每份理赔数据的实际数据类型集中缺少的数据类型,并将所述每份理赔数据中缺少的数据类型对应的数据补零,得到所述每份理赔数据对应的目标输入数据;
生成单元,用于根据所述多个目标输入数据,生成目标输入数据矩阵;
预测单元,用于将所述目标输入数据矩阵输入所述理赔趋势预测模型,执行正向运算,得到目标预测结果。
可选地,在本发明第二方面的第五种实现方式中,所述接收模块具体用于:
接收待理赔数据;
对所述待理赔数据进行文本识别,得到第一文本数据,并根据所述第一文本数据得到所述待理赔数据对应的第一标签;对所述目标理赔数据进行文本识别,得到第二文本数据,并根据所述第二文本数据得到所述待理赔数据对应的第二标签;
判断所述第一标签与所述第二标签是否匹配;
当所述第一标签与所述第二标签匹配时,获取与所述第二标签关联的理赔趋势曲线。
可选地,在本发明第二方面的第五种实现方式中,所述理赔趋势预测装置还包括:
第二判断模块,用于判断每个理赔数据集合所属的理赔类型的发展趋势是否异常;
第二确定模块,用于当所述每个理赔数据集合所属的理赔类型的发展趋势异常时,确定所述每个理赔数据集合所属的理赔类型的发展趋势异常的异常原因;
调整模块,用于将所述异常原因发送至与所述理赔类型对应的监控中心的网络设备,以调整所述理赔类型的理赔政策。
本发明第三方面提供了一种理赔趋势预测设备,包括:存储器和至少一个处理器,所述存储器中存储有指令,所述存储器和所述至少一个处理器通过线路互连;
所述至少一个处理器调用所述存储器中的所述指令,以使得所述理赔趋势预测设备执行上述的理赔趋势预测方法。
本发明的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述的理赔趋势预测方法。
本发明提供的技术方案中,通过获取保险公司在预设时间段内的多份历史理赔数据,并对数据进行清洗,得到目标理赔数据;确定每份目标理赔数据对应的理赔类型,并将属于同一理赔类型的目标理赔数据组成理赔数据集合;调用预置理赔趋势预测模型,分别将每个理赔数据集合输入到理赔趋势预测模型执行正向运算,得到预测结果;根据预置理赔趋势曲线和目标预测结果,确定每个理赔类型的理赔趋势,并将理赔趋势返回至预设目标终端。本方案通过将事件和理赔趋势进行绑定,解决了理赔趋势预测准确率低的技术问题。
附图说明
图1为本发明理赔趋势预测方法的第一个实施例示意图;
图2为本发明理赔趋势预测方法的第二个实施例示意图;
图3为本发明理赔趋势预测方法的第三个实施例示意图;
图4为本发明理赔趋势预测方法的第四个实施例示意图;
图5为本发明理赔趋势预测方法的第五个实施例示意图;
图6为本发明理赔趋势预测装置的第一个实施例示意图;
图7为本发明理赔趋势预测装置的第二个实施例示意图;
图8为本发明理赔趋势预测设备的一个实施例示意图。
具体实施方式
本发明实施例提供了一种理赔趋势预测方法、装置、设备及存储介质,本发明的技术方案中,首先获取保险公司在预设时间段内的多份历史理赔数据,并对数据进行清洗,得到目标理赔数据;确定每份目标理赔数据对应的理赔类型,并将属于同一理赔类型的目标理赔数据组成理赔数据集合;调用预置理赔趋势预测模型,分别将每个理赔数据集合输入到理赔趋势预测模型执行正向运算,得到预测结果;根据预置理赔趋势曲线和目标预测结果,确定每个理赔类型的理赔趋势,并将理赔趋势返回至预设目标终端。本方案通过将事件和理赔趋势进行绑定,解决了理赔趋势预测准确率低的技术问题。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”或“具有”及其任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
为便于理解,下面对本发明实施例的具体流程进行描述,请参阅图1,本发明实施例中理赔趋势预测方法的第一个实施例包括:
101、获取预设时间段内的历史理赔数据,其中,理赔数据包括理赔类型和理赔金额;
本实施例中,理赔服务器上部署了数据库,数据库中存储了历史理赔数据。理赔数据包括出险车辆的车牌号、出险时间、出险地点以及出险原因等。不同保险公司的理赔服务器上所存储的理赔数据不同。多个保险公司的理赔服务器将理赔数据上传至行业服务器。行业服务器将接收到的理赔数据进行保存。
本实施例中,预设时间段可以为1个月、3个月、1年或者其他值。其中,每份理赔数据中包含本次理赔过程中的很多数据,例如,车辆信息、车主信息、理赔种类、理赔标准、理赔费用等等。本申请不对理赔数据的类型做唯一限定。
102、对历史理赔数据进行数据清洗,得到目标理赔数据;
本实施例中,历史理赔数据是指未经任何处理的理赔数据。数据处理服务器可访问相关的数据网站,获取该数据网站上的数据,作为源业务数据。还可接收数据操作员的终端所上传的数据,作为源业务数据。
数据清洗包括数据脱敏、数据校验和数据转换。其中,数据脱敏用于对源业务数据中的敏感数据进行加密处理。比如,该数据中包括个人的身份证号等,可对该身份证号进行加密。数据校验用于查询源业务数据中是否存在脏数据,并删除该脏数据,以消除脏数据对精算结果的影响。服务器针对各个类型的数据设置了脏数据判定方法,根据预设的判定方法检测是否为脏数据。比如,可设置每个类型的数据的字符长度范围或数值的大小范围等,当某一类型的数据的字符长度不处于预设范围之内,或数值的大小不处于预设的大小范围之内,则判定该数据为脏数据。数据校验是将存在多种不同表述方式的数据统一转换成同一种预设表述方式的过程。
服务器针对每种类型的数据设置了一种对应的表述方式,当检测到某一类型的数据与所设置的表述方式不一致时,可根据该类型数据的表述方式和所设置的表述方式之间的转换关系,将其转换成所设置的表述方式。比如,该数据为药品类数据,同一药品的编码在不同地区所使用的编码不同,服务器可设置该药品类数据的编码方式,并将检测到的编码方式与所设置的不同的数据,根据对应的转换关系,将其转换成对应设置的编码,从而形成统一的编码。在完成对源业务数据的清洗后,将清洗后的数据保存为基础数据。
本实施例中,通过对数据的清洗,生成基础数据,可便于后续对该基础数据的调用和计算,从而进一步提高了理赔趋势预测的准确性。
103、对目标理赔数据进行识别,确定目标理赔数据对应的理赔类型,并将类型相同的目标理赔数据组成一个理赔数据集合,得到至少一个理赔数据集合;
本实施例中,理赔类型具体指目标理赔数据的涉及的理赔范畴,具体可为:政治类、自然灾害类、公共卫生类、经济类等等。
可选的,识别所述多份目标理赔数据具体包括:对所述多份目标理赔数据进行关键词识别,提取每份目标理赔数据中的N个关键词,其中,每个关键词可对应多个理赔类型,例如,该目标理赔数据中包含出险车辆的车牌号、出险时间、出险地点以及出险原因等,所以每个关键词对应一个理赔类型集,依据N个关键词得到所述每份目标理赔数据的N个理赔类型集;设置最小支持度P,基于频繁模式增长FP-Growth算法和所述最小支持度P构建所述N个理赔类型集的频繁模式FP树,基于所述FP树确定所述N个理赔类型集中的频繁项集,确定所述频繁项集中的元素为所述每份目标理赔数据对应的理赔类型,其中,N为大于1的整数。
104、调用预置理赔趋势预测模型,分别将每个理赔数据集合输入到理赔趋势预测模型执行正向运算,得到目标预测结果;
本实施例中,在预测平台中嵌入通过包含各个理赔类型的理赔数据,预先训练好的理赔趋势预测模型,对预设时间段内获取到的理赔数据进行分类,得到若干个理赔数据集合,其中,每个理赔数据集合对应一个理赔类型,调用训练好的预测模型,将该理赔数据集合中的理赔数据组成输入数据输入到该训练好的模型,得到预测结果。
可选的,调用与每个理赔数据集合所属的理赔类型匹配的训练好的预测模型具体包括:获取所述训练好的预测模型对应的预设电压或者预设工作频率,生成电压调控信息,所述电压调控信息用于指示将处理器的工作电压或者工作频率调整为所述预设电压或者所述预设工作频率;调用所述训练好的预测模型对应的应用程序编程接口API,调转至所述API,以激活所述训练好的预测模型的运算功能,完成对所述训练好的预测模型的调用。
可选的,将所述每个理赔数据集合中的理赔数据组成输入数据时,由于对于预测模型来说,一般采用卷积运算,因此,在卷积运算时如输入数据中区域存在零时,可无需运算直接得到卷积结果,简化了运算过程,基于此,在将所述每个理赔数据集合中的理赔数据组成输入数据具体包括:提取所述每个理赔数据集合中每份理赔数据的实际数据类型集,将所述实际数据类型集和所述预设数据类型集比对,确定所述实际数据类型集中缺少的数据类型,将所述每份理赔数据中缺少的数据类型对应的数据补零(如该份理赔数据的缺少的数据类型与预设数据类型占比大于50%,则舍弃该份理赔数据,不再将该份理赔数据作为输入数据,即获取每份理赔数据的缺失度,如缺失度大于50%,则舍弃该份理赔数据),得到所述每份理赔数据对应的输入数据,例如,某项理赔数据中缺少出险时间时,将出险时间添加为0,得到该项理赔数据的输入数据;获取所述每个理赔数据集合中的多份理赔数据对应的多个输入数据,将所述多个输入数据中的零值相邻的排列在同一列或者同一行组成输入数据矩阵;将所述输入数据矩阵输入到所述每个理赔数据集合所属的理赔类型匹配的训练好的预测模型执行正向运算。
105、接收待理赔数据,并分别对待理赔数据和目标理赔数据进行文本识别,得到理赔趋势曲线;
本实施例中,待理赔数据是目标终端发送至服务器的,目标终端发送待理赔数据的时机可以为周期性地,比如可以设定为每24小时上传一次,也可以为触发性的,比如当车险理赔趋势出现异常时,获取当前的理赔事件,终端将理赔事件发送至服务器,另外,目标终端发送的待理赔数据的类型可以为各种可能影响公司车险理赔趋势的理赔事件的数据,比如政治类,自然灾害类,公共卫生类,经济类。这几种类型若突发,会导致日常理赔工作发生巨大变化等等,根据待处理理赔事件类型的不同,例如发生自然灾害类,山体滑坡时,发生山体滑坡地区,车险理赔工作会大幅增长;夏季常发生的雨季内涝,也会导致理赔事件凸量增长。
其中,本步骤是对全部的目标理赔数据进行识别。比如,有10万份目标理赔数据,其中,根据理赔类型的不同,将所述10万份目标理赔数据进行归类,得到a/b/c/d/e/f/g/h一共8个理赔数据集合。当接收到(一份)待理赔数据时,我们并不知道他是属于哪个集合的(但是它肯定是属于这八个集合其中的一个),此时,我们就拿它和全部的目标理赔数据进行文本识别,确定所述(一份)待理赔数据的理赔类型。
本实施例中,在服务器接收到终端上传的待理赔数据后,分别对待理赔数据和目标理赔数据进行文本识别,获取对应的标签。其中,预设的打标签算法可以为欧拉图谱新闻标签算法等打标签算法,打标签过程可以根据第一文本数据的数据特征分析结果对待处理理赔事件进行打标签,比如当待处理理赔事件为发生自然灾害类,发生山体滑坡地区的车险理赔事件,打标签算法可以对所述车险理赔事件打上“自然灾害类”、“季节”、“气候变化”等第一标签,通过第一标签可以了解待处理理赔事件的事件类型及特征。
本实施例中,理赔趋势曲线可以通过历史理赔事件发生的时间节点的理赔数据计算绘制得到。当服务器检测到存在与待处理理赔事件对应的第一标签匹配的历史理赔事件对应的第二标签时,获取与第二标签关联存储的理赔趋势曲线。
106、根据预置理赔趋势曲线和目标预测结果,确定每个理赔数据集合所属理赔类型的理赔趋势,并将理赔趋势返回至预设目标终端。
本实施例中,在该预测模型的全连接层采用不同的softmax分类器,将该全连接层的输出结果,输入到该softmax分类器得到该理赔数据集合的预测结果。例如,在该理赔数据集合所属的理赔类型为自然灾害类时,在经过该预测模型的卷积运算得到特征向量后,将该特征向量输入到softmax分类器中,将该特征向量与softmax分类器中的模板向量匹配,确定该特征向量与模板向量的欧式距离,如欧式结果大于或等于阈值,输出预测结果“合理”,即确定自然灾害类车险理赔的发展趋势合理,如该匹配结果小于阈值,输出预测结果“不合理”,确定自然灾害类车险理赔的发展趋势不合理,进一步地,在不合理时,可将该特征向量与模板向量相减,获取差值向量,确定差值向量中元素最大值时所在的维度,然后确定该维度代表的信息不合理原因,例如,如差值向量第i维度的差值最大,且第i维度数据代表费用信息,确定该车险理赔类型中的在理赔费用预测方面不合理,可输出不合理原因为“理赔金额预测不合理”。
本发明实施例中,通过获取保险公司在预设时间段内的多份历史理赔数据,并对数据进行清洗,得到目标理赔数据;确定每份目标理赔数据对应的理赔类型,并将属于同一理赔类型的目标理赔数据组成理赔数据集合;调用预置理赔趋势预测模型,分别将每个理赔数据集合输入到理赔趋势预测模型执行正向运算,得到预测结果;根据预置理赔趋势曲线和目标预测结果,确定每个理赔类型的理赔趋势,并将理赔趋势返回至预设目标终端。本方案通过将事件和理赔趋势进行绑定,解决了理赔趋势预测准确率低的技术问题。
请参阅图2,本发明实施例中理赔趋势预测方法的第二个实施例包括:
201、预先设定多个理赔类型;
本实施例中,通过业务人员上传和互联网主动采集的方式对客户基本信息、行为偏好、车险案件处理数据、车险案件赔付数据进行采集,并将车险数据进行筛选、加密和存储。同时,预先设定多个车险理赔类型,将理赔分为:政治类,自然灾害类,公共卫生类,经济类。这几种类型若突发,会导致日常理赔工作发生巨大变化。例如发生自然灾害类,山体滑坡时,发生山体滑坡地区,车险理赔工作会大幅增长;夏季常发生的雨季内涝,也会导致理赔事件凸量增长。
202、基于预置理赔数据库,获取与多个理赔类型中任意一个理赔类型相关的理赔数据,并将理赔数据作为训练数据集;
本实施例中,从车险理赔数据库中获取任一类型的多个相关的车险理赔数据,并将所述车险理赔数据作为训练样本数据。
203、基于理赔数据,获取理赔类型的实际理赔趋势,并将实际理赔趋势作为训练数据集对应的验证集;
本实施例中,在机器学习和模式识别等领域中,一般需要将样本分成独立的三部分训练集(train set),验证集(validation set)和测试集(test set)。其中训练集用来估计模型,验证集用来确定网络结构或者控制模型复杂程度的参数,而测试集则检验最终选择最优的模型的性能如何。一个典型的划分是训练集占总样本的50%,而其它各占25%,三部分都是从样本中随机抽取。
但是,当样本总量少的时候,上面的划分就不合适了。常用的是留少部分做测试集。然后对其余N个样本采用K折交叉验证法。就是将样本打乱,然后均匀分成K份,轮流选择其中K-1份训练,剩余的一份做验证,计算预测误差平方和,最后把K次的预测误差平方和再做平均作为选择最优模型结构的依据。特别的K取N,就是留一法(leave one out)。
本实施例中,由于大多数机器学习算法都有超参数,可以设置来控制算法的行为。有时一个选项被设为学习算法的超参数,是因为它太难优化了。更多的情况是,该选项必须是超参数,因为它不适合在训练集上学系。这适用于控制模型容量的所有超参数,如果在训练接上学习超参数,这些超参数总是趋向于最大可能的模型容量,导致过拟合。例如,相比低次多项式和正的权重衰减设定,更高次的多项式和权重衰减参数设定\tiny\lambda=0总能在训练集上更好地拟合。
为了解决这个问题,我们需要一个训练算法观测不到的验证集样本。特别地,我们将训练数据分成两个不相交的子集。其中一个用于学习参数。另一个作为验证集,用于估计训练中或训练后的泛化误差,更新超参数。用于学习参数的数据参数的数据子集被称为验证集。通常,80%的训练数据用于训练,20%用于验证。由于验证集是用来“训练”超参数的,尽管验证集的误差通常会比训练集误差小,验证集会低估泛化误差。所有超参数优化完成后,泛化误差可能会通过测试集来估计。
204、将训练数据集输入预置初始理赔趋势预测模型执行正向运算,得到对理赔类型对应的理赔趋势的第一预测结果;
本实施例中,基于所述训练数据集和所述验证集对初始模型训练具体包括:将所述理赔类型的训练数据集输入到初始模型执行正向运算,得到对所述理赔类型发展趋势的预测结果,将所述预测结果与所述验证集拟合,得到拟合度,如所述拟合度小于第一阈值,基于所述初始模型中的损失函数对所述初始模型执行反向训练,直至拟合度大于所述第一阈值或者训练次数大于第二阈值,完成对所述初始模型的训练,得到与所述理赔类型匹配的训练好的预测模型。其中,该初始模型中的初始权值梯度基于经验值设定。
205、将第一预测结果与验证集拟合,得到预测结果与验证集之间的拟合度;
本实施例中,拟合就是把平面上一系列的点,用一条光滑的曲线连接起来。因为这条曲线有无数种可能,从而有各种拟合方法。拟合的曲线一般可以用函数表示,根据这个函数的不同有不同的拟合名字。常用的拟合方法有如最小二乘曲线拟合法等,在MATLAB中也可以用polyfit来拟合多项式。拟合以及插值还有逼近是数值分析的三大基础工具,通俗意义上它们的区别在于:拟合是已知点列,从整体上靠近它们;插值是已知点列并且完全经过点列;逼近是已知曲线,或者点列,通过逼近使得构造的函数无限靠近它们。
拟合度,又叫拟合优度(Goodness of Fit)是指回归直线对观测值的拟合程度。度量拟合优度的统计量是可决系数(亦称确定系数)R2。R2最大值为1。R2的值越接近1,说明回归直线对观测值的拟合程度越好;反之,R2的值越小,说明回归直线对观测值的拟合程度越差。R2衡量的是回归方程整体的拟合度,是表达因变量与所有自变量之间的总体关系。R2等于回归平方和在总平方和中所占的比率,即回归方程所能解释的因变量变异性的百分比(在MATLAB中,R2=1-"回归平方和在总平方和中所占的比率")。实际值与平均值的总误差中,回归误差与剩余误差是此消彼长的关系。因而回归误差从正面测定线性模型的拟合优度,剩余误差则从反面来判定线性模型的拟合优度。
206、判断拟合度是否小于预设阈值;
本实施例中,判断拟合度是否小于预设阈值,根据至少包含梯度参数在内的参数对权重参数进行调整,以此生成新权重参数,可以理解的是,本步骤的目的是确保新权重参数相比于当前轮次迭代训练所使用的权重参数而言更趋近于合理的取值,因此需要考虑基于权重参数的训练模型对样本数据的处理结果与标准结果的差异,也就是权重参数相应的梯度参数,并且需要将该梯度参数作为对梯度参数进行调整的最主要参考依据。生成新权重参数后,通过新权重参数重新配置的训练模型相比于当前迭代轮次初始的训练模型而言更运算的准确性更高,进而在通过新权重参数重新配置的训练模型的基础山,进一步执行下一轮次的迭代训练,以此确保训练模型在迭代的过程中逐渐收敛,可用性逐渐提高。
207、当拟合度小于预设阈值时,根据初始理赔趋势预测模型的损失函数,对初始理赔趋势预测模型进行迭代训练,直到拟合度大于预设阈值,得到目标理赔趋势预测模型;
本实施例中,当最后一轮次的迭代训练结束时,迭代训练设备将生成的最终权重参数发送至参数服务器,需要注意的是,由于本方法的中的操作步骤是站在众多分布式迭代训练设备中的任意一台迭代训练设备的角度描述的,因此对于整个迭代训练的集群而言,各个迭代训练设备均需要在最后一轮次的迭代训练结束后,将最终权重参数发送至参数服务器。参数服务器在汇总到各个迭代训练设备传入的最终权重参数后,进行综合的计算生成结果权重参数,进而根据结果权重参数生成结果模型,该结果模型即为整个迭代训练过程中准确性最高的训练模型,也就是目标理赔趋势预测模型。
208、获取预设时间段内的历史理赔数据;
209、对历史理赔数据进行数据清洗,得到目标理赔数据;
210、对目标理赔数据进行识别,确定目标理赔数据对应的理赔类型,并将理赔类型相同的目标理赔数据组成一个理赔数据集合,得到至少一个理赔数据集合;
211、调用预置理赔趋势预测模型,分别将每个理赔数据集合输入到理赔趋势预测模型执行正向运算,得到目标预测结果;
212、接收待理赔数据,并分别对待理赔数据和目标理赔数据进行文本识别,得到理赔趋势曲线;
213、根据预置理赔趋势曲线和目标预测结果,确定每个理赔数据集合所属理赔类型的理赔趋势,并将理赔趋势返回至预设目标终端。
本实施例中步骤208-213与第一实施例中的步骤101-106类似,此处不再赘述。
本发明实施例中,通过获取保险公司在预设时间段内的多份历史理赔数据,并对数据进行清洗,得到目标理赔数据;确定每份目标理赔数据对应的理赔类型,并将属于同一理赔类型的目标理赔数据组成理赔数据集合;调用预置理赔趋势预测模型,分别将每个理赔数据集合输入到理赔趋势预测模型执行正向运算,得到预测结果;根据预置理赔趋势曲线和目标预测结果,确定每个理赔类型的理赔趋势,并将理赔趋势返回至预设目标终端。本方案通过将事件和理赔趋势进行绑定,解决了理赔趋势预测准确率低的技术问题。
请参阅图3,本发明实施例中理赔趋势预测方法的第三个实施例包括:
301、获取预设时间段内的历史理赔数据;
302、从预置数据库中获取与历史理赔数据对应的数据清洗规则;
本实施例中,不同的数据可以有对应的业务场景,不同的业务场景对应有数据需要满足的规则或条件。例如:对于理赔业务场景,通常理赔政策会设置一定的门槛,只有达到这个门槛的理赔申请才会进行理赔,或者,购物平台的促销活动,也需要满足一定的条件才能参与促销活动。本说明书实施例可以根据数据清洗请求,确定出数据清洗的业务场景,获取对应业务场景的业务需求,根据业务需求定义对应的数据清洗规则,数据清洗规则中可以包括清洗特征因子和清洗特征因子满足的清洗条件。其中,清洗特征因子可以表示数据清洗的关键特征,如:理赔申请金额、理赔申请类型、理赔申请来源、理赔申请时间等。
303、根据数据清洗规则,对历史理赔数据进行数据清洗,得到目标理赔数据;
本实施例中,不同的业务场景都可能需要进行数据清洗,如:某保险理赔平台需要对一笔理赔申请数据进行数据清洗,用户可以通过理赔平台或其他客户端向数据清洗装置发送数据清洗请求。数据清洗请求中可以包括一些数据清洗关键信息,如:若要对某个理赔申请数据进行数据清洗,则数据清洗请求中可以包括该笔理赔的出险车辆的车牌号、出险时间、出险地点以及出险原因等信息。数据清洗请求中还可以包括数据清洗的需求,如:将什么样的数据清洗出来。数据清洗请求还可以对应有数据清洗场景如:理赔数据清洗场景、理赔类型清洗场景等。本说明书实施例中的数据清洗请求可以包括离线数据清洗请求,离线数据清洗可以实现大数据量的清洗,如:针对过去三个月的车险理赔数据进行清洗,清洗出符合某出险原因的理赔数据。
本实施例中,在确定用于对待清洗数据进行数据清洗的目标清洗规则之后,即可根据该目标清洗规则对待清洗数据进行数据清洗,使得对待清洗数据的清洗效果满足前述清洗需求,最终得到所需的目标理赔数据。
304、对目标理赔数据进行识别,确定每份目标理赔数据对应的理赔类型,并将理赔类型相同的目标理赔数据组成一个理赔数据集合,得到至少一个理赔数据集合;
305、调用预置理赔趋势预测模型,分别将每个理赔数据集合输入到理赔趋势预测模型执行正向运算,得到目标预测结果;
306、接收待理赔数据,并分别对待理赔数据和目标理赔数据进行文本识别,得到理赔趋势曲线;
307、根据预置理赔趋势曲线和目标预测结果,确定每个理赔数据集合所属理赔类型的理赔趋势,并将理赔趋势返回至预设目标终端。
本实施例中步骤301、305-308与第一实施例中的步骤101、103-106类似,此处不再赘述。
本发明实施例中,通过获取保险公司在预设时间段内的多份历史理赔数据,并对数据进行清洗,得到目标理赔数据;确定每份目标理赔数据对应的理赔类型,并将属于同一理赔类型的目标理赔数据组成理赔数据集合;调用预置理赔趋势预测模型,分别将每个理赔数据集合输入到理赔趋势预测模型执行正向运算,得到预测结果;根据预置理赔趋势曲线和目标预测结果,确定每个理赔类型的理赔趋势,并将理赔趋势返回至预设目标终端。本方案通过将事件和理赔趋势进行绑定,解决了理赔趋势预测准确率低的技术问题。
请参阅图4,本发明实施例中理赔趋势预测方法的第四个实施例包括:
401、获取预设时间段内的历史理赔数据;
402、对历史理赔数据进行数据清洗,得到目标理赔数据;
403、对目标理赔数据进行识别,确定每份目标理赔数据对应的理赔类型,并将理赔类型相同的目标理赔数据组成一个理赔数据集合,得到至少一个理赔数据集合;
404、获取每个理赔数据集合所属的理赔类型的预设数据类型集;
本实施例中,根据理赔的类型,将理赔分为:政治类,自然灾害类,公共卫生类,经济类,这几种类型若突发,会导致日常理赔工作发生巨大变化。比如,发生自然灾害类,山体滑坡时,发生山体滑坡地区,车险理赔工作会大幅增长;夏季常发生的雨季内涝,也会导致理赔事件凸量增长。所以在对模型进行训练之前,需要获取对应的历史理赔事件的理赔数据,同时确定每个理赔数据对应所属理赔类型的预设数据类型集。
405、提取每个理赔数据集合中每份理赔数据的实际数据类型集;
本实施例中,将所述每个理赔数据集合中的理赔数据组成输入数据时,由于对于预测模型来说,一般采用卷积运算,因此,在卷积运算时如输入数据中区域存在零时,可无需运算直接得到卷积结果,简化了运算过程,基于此,在将所述每个理赔数据集合中的理赔数据组成输入数据具体包括:获取每个理赔数据集合所属的理赔类型的预设数据类型集,即每个理赔类型均有预先设定数据类型集,例如,理赔类型为自然灾害类时,其预先设定的数据类型集为在发生自然灾害类,山体滑坡时,发生山体滑坡地区的理赔数据,即保证运算时每个输入数据中必须包含预先设定数据类型。
406、将实际数据类型集和预设数据类型集比对,确定每份理赔数据的实际数据类型集中缺少的数据类型,将每份理赔数据中缺少的数据类型对应的数据补零,得到每份理赔数据对应的目标输入数据;
本实施例中,提取所述每个理赔数据集合中每份理赔数据的实际数据类型集,将所述实际数据类型集和所述预设数据类型集比对,确定所述实际数据类型集中缺少的数据类型,将所述每份理赔数据中缺少的数据类型对应的数据补零(如该份理赔数据的缺少的数据类型与预设数据类型占比大于50%,则舍弃该份理赔数据,不再将该份理赔数据作为输入数据,即获取每份理赔数据的缺失度,如缺失度大于50%,则舍弃该份理赔数据),得到所述每份理赔数据对应的输入数据,例如,某项理赔数据中缺少发病时间时,将发病时间添加为0,得到该项理赔数据的目标输入数据。
407、根据多个目标输入数据,生成目标输入数据矩阵;
本实施例中,获取所述每个理赔数据集合中的多份理赔数据对应的多个目标输入数据,将所述多个输入数据中的零值相邻的排列在同一列或者同一行组成输入数据矩阵。
本实施例中,数据矩阵一般指矩阵数据分析法。它是新的质量管理七种工具之一。
数据矩阵分析法的主要方法为主成分分析法(Principal component analysis),利用此法可从原始数据获得许多有益的情报。主成分分析法是一种将多个变量化为少数综合变量的一种多元统计方法,利用此法可从原始数据中获得许多有益的信息,但是由于这种方法需要借电子计算机来求解,且计算复杂,虽然是品质管理新七大手法之一,但在品质管理活动中应用较少。矩阵数据分析法,与矩阵图法类似。它区别于矩阵图法的是:不是在矩阵图上填符号,而是填数据,形成一个分析数据的矩阵。
408、将目标输入数据矩阵输入理赔趋势预测模型,执行正向运算,得到目标预测结果;
本实施例中,将所述输入数据矩阵输入到所述每个理赔数据集合所属的理赔领域匹配的训练好的预测模型执行正向运算。
409、接收待理赔数据,并分别对待理赔数据和目标理赔数据进行文本识别,得到理赔趋势曲线;
410、根据预置理赔趋势曲线和目标预测结果,确定每个理赔数据集合所属理赔类型的理赔趋势,并将理赔趋势返回至预设目标终端。
本实施例中步骤401-403、409-410与第一实施例中的步骤101-103、105-106类似,此处不再赘述。
本发明实施例中,通过获取保险公司在预设时间段内的多份历史理赔数据,并对数据进行清洗,得到目标理赔数据;确定每份目标理赔数据对应的理赔类型,并将属于同一理赔类型的目标理赔数据组成理赔数据集合;调用预置理赔趋势预测模型,分别将每个理赔数据集合输入到理赔趋势预测模型执行正向运算,得到预测结果;根据预置理赔趋势曲线和目标预测结果,确定每个理赔类型的理赔趋势,并将理赔趋势返回至预设目标终端。本方案通过将事件和理赔趋势进行绑定,解决了理赔趋势预测准确率低的技术问题。
请参阅图5,本发明实施例中理赔趋势预测方法的第五个实施例包括:
501、获取预设时间段内的历史理赔数据;
502、对历史理赔数据进行数据清洗,得到目标理赔数据;
503、对目标理赔数据进行识别,确定每份目标理赔数据对应的理赔类型,并将理赔类型相同的目标理赔数据组成一个理赔数据集合,得到至少一个理赔数据集合;
504、接收待理赔数据;
本实施例中,服务器接收目标终端发送的待理赔数据,其中,目标终端发送待理赔数据的时机可以为周期性地,比如可以设定为每24小时上传一次,也可以为触发性的,比如当理赔趋势出现异常时,获取当前的理赔事件,终端将理赔事件发送至服务器,另外,目标终端发送的待理赔数据的类型可以为各种可能影响公司理赔趋势的理赔事件的数据,比如政治类,自然灾害类,公共卫生类,经济类。这几种类型若突发,会导致日常理赔工作发生巨大变化等等,根据待处理理赔事件类型的不同,例如发生自然灾害类,山体滑坡时,发生山体滑坡地区,理赔工作会大幅增长;夏季常发生的雨季内涝,也会导致理赔事件凸量增长。
505、对待理赔数据进行文本识别,得到第一文本数据,并根据第一文本数据得到待理赔数据对应的第一标签;
本实施例中,在服务器接收到终端上传的待理赔数据后,对待理赔数据进行文本识别,文本识别后得到待理赔数据的第一文本数据,第一文本数据的内容可以表示待处理理赔事件的事件类型。服务器根据第一文本数据,通过预设的打标签算法得到第一文本数据对应的第一标签,其中,预设的打标签算法可以为欧拉图谱新闻标签算法等打标签算法,打标签过程可以根据第一文本数据的数据特征分析结果对待处理理赔事件进行打标签,比如当待处理理赔事件为发生自然灾害类,发生山体滑坡地区的理赔事件,打标签算法可以对所述理赔事件打上“自然灾害类”、“季节”、“气候变化”等第一标签,通过第一标签可以了解待处理理赔事件的事件类型及特征。
506、对目标理赔数据进行文本识别,得到第二文本数据,并根据第二文本数据得到待理赔数据对应的第二标签;
本实施例中,在服务器获取目标理赔(事件)数据后,对目标理赔数据进行文本识别,文本识别后得到目标理赔(事件)数据的第二文本数据,第二文本数据的内容可以大致表示目标理赔数据的事件类型,根据第二文本数据,通过预设的打标签算法得到第二文本数据对应的第二标签,通过第二标签可以了解目标理赔事件的事件类型及特征。
507、判断第一标签与第二标签是否匹配;
本实施例中,第二标签是服务器通过获取目标理赔(事件)数据,并根据目标理赔(事件)数据进行文本识别以及预设打标签算法得到的、与历史理赔事件对应的标签,并且根据目标理赔(事件)数据得到的第二标签与对应的历史理赔事件发生的时间节点的理赔趋势曲线是关联存储的。预设数据库用于存储第二标签。服务器将待处理理赔事件对应的第一标签与历史理赔事件对应的第二标签进行匹配,检测预设数据库中是否存在历史理赔事件对应的第二标签与待处理理赔事件对应的第一标签匹配,目的是为了在历史数据中查找与待处理理赔事件匹配的历史理赔事件。
508、当第一标签与第二标签匹配时,获取与第二标签关联的理赔趋势曲线;
本实施例中,标签匹配过程可以是在第二标签中查找是否存在与第一标签的标签类型完全相同的标签,这样匹配的结果可以查找到与第一标签对应的待处理理赔事件类型完全相同的历史理赔事件;也可以预设标签匹配相似程度,即模糊匹配,当第二标签中存在与第一标签的标签匹配相似程度到达预设值时,则存在与第一标签匹配的第二标签,比如当标签的相似程度达到80%以上时,则视为同类型标签,第一标签对应的待处理理赔事件与第二标签对应的历史理赔事件也可以视为同类型事件。根据第二标签对应的目标理赔(事件)数据可以得到关联存储的理赔趋势曲线,其中,理赔趋势曲线可以通过历史理赔事件发生的时间节点的理赔数据计算绘制得到。当服务器检测到存在与待处理理赔事件对应的第一标签匹配的历史理赔事件对应的第二标签时,获取与第二标签关联存储的理赔趋势曲线。
509、调用预置理赔趋势预测模型,分别将每个理赔数据集合输入到理赔趋势预测模型执行正向运算,得到目标预测结果;
510、接收待理赔数据,并分别对待理赔数据和目标理赔数据进行文本识别,得到理赔趋势曲线;
511、根据预置理赔趋势曲线和目标预测结果,确定每个理赔数据集合所属理赔类型的理赔趋势,并将理赔趋势返回至预设目标终端;
512、判断每个理赔数据集合所属的理赔类型的发展趋势是否异常;
本实施例中,确定每个理赔类型的对应的发展趋势的异常原因具体包括确定所述每个理赔数据集合中每份理赔数据的获取时间;提取所述每个理赔数据集合中每份理赔数据中任意一项理赔数据,以该项理赔数据在每份理赔数据中的数值为观察值、以及每份理赔数据的获取时间为横轴创建该项理赔数据对应的时间序列,得到该份理赔数据中的多项理赔数据对应的多个时间序列;处理所述多项理赔数据对应的多个时间序列,确定变化趋势不一致的时间序列,确定所述时间序列对应的一项理赔数据,将该项理赔数据对应的理赔指标标记为所述理赔领域的发展趋势异常的异常原因。
513、当每个理赔数据集合所属的理赔类型的发展趋势异常时,则确定每个理赔数据集合所属的理赔类型的发展趋势异常的异常原因,并将异常原因发送至与理赔类型对应的监控中心的网络设备,以调整理赔类型的理赔政策。
本实施例中,当每个理赔数据集合所属的理赔类型的发展趋势异常时,则确定每个理赔数据集合所属的理赔类型的发展趋势异常的异常原因。简化了处理理赔数据过程,且为理赔体系完善提供数据参考,提高理赔体系完善的说服力;而且整个预测过程完全依靠线上预测平台,避免人工参与带来的主观性,以及人工预测带来的延时问题。
本实施例中,将异常原因发送至与理赔类型对应的监控中心的网络设备,以调整理赔类型的理赔政策。在理赔领域的理赔发展趋势异常时,确定该理赔发展趋势的异常原因,将该异常原因发送至调控部门的网络侧设备,使调控部门基于异常原因针对性的调整理赔体制,优化理赔体系,提高调控部门应对异常理赔领域的能力,提升用户的理赔满意度。
本实施例中步骤501-503、509-511与第一实施例中的101-103、104-106类似,此处不再赘述。
在本发明实施例中,通过获取保险公司在预设时间段内的多份历史理赔数据,并对数据进行清洗,得到目标理赔数据;确定每份目标理赔数据对应的理赔类型,并将属于同一理赔类型的目标理赔数据组成理赔数据集合;调用预置理赔趋势预测模型,分别将每个理赔数据集合输入到理赔趋势预测模型执行正向运算,得到预测结果;根据预置理赔趋势曲线和目标预测结果,确定每个理赔类型的理赔趋势,并将理赔趋势返回至预设目标终端。本方案通过将事件和理赔趋势进行绑定,解决了理赔趋势预测准确率低的技术问题。
上面对本发明实施例中理赔趋势预测方法进行了描述,下面对本发明实施例中理赔趋势预测装置进行描述,请参阅图6,本发明实施例中理赔趋势预测装置的第一个实施例包括:
第一获取模块601,用于获取预设时间段内的历史理赔数据,其中,所述理赔数据包括理赔类型和理赔金额;
数据清洗模块602,用于对所述历史理赔数据进行数据清洗,得到目标理赔数据;
识别模块603,用于对所述目标理赔数据进行识别,确定所述目标理赔数据对应的理赔类型,并将理赔类型相同的目标理赔数据组成一个理赔数据集合,得到至少一个理赔数据集合;
预测模块604,用于调用预置理赔趋势预测模型,分别将每个理赔数据集合输入到所述理赔趋势预测模型执行正向运算,得到目标预测结果;
识别模块605,用于接收待理赔数据,并分别对所述待理赔数据和所述目标理赔数据进行文本识别,得到理赔趋势曲线;
第一确定模块606,用于根据所述理赔趋势曲线和所述目标预测结果,确定每个理赔数据集合所属理赔类型的理赔趋势,并将所述理赔趋势返回至目标终端。
本发明实施例中,通过获取保险公司在预设时间段内的多份历史理赔数据,并对数据进行清洗,得到目标理赔数据;确定每份目标理赔数据对应的理赔类型,并将属于同一理赔类型的目标理赔数据组成理赔数据集合;调用预置理赔趋势预测模型,分别将每个理赔数据集合输入到理赔趋势预测模型执行正向运算,得到预测结果;根据预置理赔趋势曲线和目标预测结果,确定每个理赔类型的理赔趋势,并将理赔趋势返回至预设目标终端。本方案通过将事件和理赔趋势进行绑定,解决了理赔趋势预测准确率低的技术问题。
请参阅图7,本发明实施例中理赔趋势预测装置的第二个实施例,该理赔趋势预测装置具体包括:
第一获取模块601,用于获取预设时间段内的历史理赔数据,其中,所述理赔数据包括理赔类型和理赔金额;
数据清洗模块602,用于对所述历史理赔数据进行数据清洗,得到目标理赔数据;
第一识别模块603,用于对所述目标理赔数据进行识别,确定所述目标理赔数据对应的理赔类型,并将理赔类型相同的目标理赔数据组成一个理赔数据集合,得到至少一个理赔数据集合;
预测模块604,用于调用预置理赔趋势预测模型,分别将每个理赔数据集合输入到所述理赔趋势预测模型执行正向运算,得到目标预测结果;
第二识别模块605,用于接收待理赔数据,并分别对所述待理赔数据和所述目标理赔数据进行文本识别,得到理赔趋势曲线;
第一确定模块606,用于根据所述理赔趋势曲线和所述目标预测结果,确定每个理赔数据集合所属理赔类型的理赔趋势,并将所述理赔趋势返回至目标终端。
本实施例中,所述理赔趋势预测装置还包括:
设定模块607,用于预先设定多个理赔类型;
第二获取模块608,用于基于预置理赔数据库,获取与所述多个理赔类型中任意一个理赔类型相关的理赔数据,并将所述理赔数据作为训练数据集;基于所述理赔数据,获取所述理赔类型的实际理赔趋势,并将所述实际理赔趋势作为所述训练数据集对应的验证集;
运算模块609,用于将所述训练数据集输入预置初始理赔趋势预测模型执行正向运算,得到对所述理赔类型对应的理赔趋势的第一预测结果。
本实施例中,所述理赔趋势预测装置还包括:
拟合模块610,用于将所述预测结果与所述验证集拟合,得到所述预测结果与所述验证集之间的拟合度;
第一判断模块611,用于判断所述拟合度是否小于预设阈值;
训练模块612,用于当所述拟合度小于预设阈值时,根据所述初始理赔趋势预测模型的损失函数,对所述初始理赔趋势预测模型进行迭代训练,直到所述拟合度大于预设阈值,得到目标理赔趋势预测模型。
本实施例中,所述数据清洗模块602具体用于:
获取所述历史理赔数据的清洗请求;
根据所述历史理赔数据和所述清洗请求,确定所述历史理赔数据的目标清洗规则;
根据所述目标清洗规则,对所述历史理赔数据进行数据清洗,得到目标理赔数据。
本实施例中,所述预测模块604包括:
获取单元6041,用于获取每个理赔数据集合所属的理赔类型的预设数据类型集;
提取单元6042,用于提取所述每个理赔数据集合中每份理赔数据的实际数据类型集;
确定单元6043,用于将所述实际数据类型集和所述预设数据类型集比对,确定所述每份理赔数据的实际数据类型集中缺少的数据类型,并将所述每份理赔数据中缺少的数据类型对应的数据补零,得到所述每份理赔数据对应的目标输入数据;
生成单元6044,用于根据所述多个目标输入数据,生成目标输入数据矩阵;
预测单元6045,用于将所述目标输入数据矩阵输入所述理赔趋势预测模型,执行正向运算,得到目标预测结果。
本实施例中,所述接收模块605具体用于:
接收待理赔数据;
对所述待理赔数据进行文本识别,得到第一文本数据,并根据所述第一文本数据得到所述待理赔数据对应的第一标签;
对所述目标理赔数据进行文本识别,得到第二文本数据,并根据所述第二文本数据得到所述待理赔数据对应的第二标签;
判断所述第一标签与所述第二标签是否匹配;
若是,则获取与所述第二标签关联的理赔趋势曲线。
本实施例中,所述理赔趋势预测装置还包括:
第二判断模块613,用于判断每个理赔数据集合所属的理赔类型的发展趋势是否异常;
第二确定模块614,用于当所述每个理赔数据集合所属的理赔类型的发展趋势异常时,确定所述每个理赔数据集合所属的理赔类型的发展趋势异常的异常原因;
调整模块615,用于将所述异常原因发送至与所述理赔类型对应的监控中心的网络设备,以调整所述理赔类型的理赔政策。
本发明实施例中,通过获取保险公司在预设时间段内的多份历史理赔数据,并对数据进行清洗,得到目标理赔数据;确定每份目标理赔数据对应的理赔类型,并将属于同一理赔类型的目标理赔数据组成理赔数据集合;调用预置理赔趋势预测模型,分别将每个理赔数据集合输入到理赔趋势预测模型执行正向运算,得到预测结果;根据预置理赔趋势曲线和目标预测结果,确定每个理赔类型的理赔趋势,并将理赔趋势返回至预设目标终端。本方案通过将事件和理赔趋势进行绑定,解决了理赔趋势预测准确率低的技术问题。
上面图6和图7从模块化功能实体的角度对本发明实施例中的理赔趋势预测装置进行详细描述,下面从硬件处理的角度对本发明实施例中理赔趋势预测设备进行详细描述。
图8是本发明实施例提供的一种理赔趋势预测设备的结构示意图,该理赔趋势预测设备800可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(central processing units,CPU)810(例如,一个或一个以上处理器)和存储器820,一个或一个以上存储应用程序833或数据832的存储介质830(例如一个或一个以上海量存储设备)。其中,存储器820和存储介质830可以是短暂存储或持久存储。存储在存储介质830的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对理赔趋势预测设备800中的一系列指令操作。更进一步地,处理器810可以设置为与存储介质830通信,在理赔趋势预测设备800上执行存储介质830中的一系列指令操作,以实现上述各方法实施例提供的理赔趋势预测方法的步骤。
理赔趋势预测设备800还可以包括一个或一个以上电源840,一个或一个以上有线或无线网络接口850,一个或一个以上输入输出接口860,和/或,一个或一个以上操作系统831,例如Windows Serve,Mac OS X,Unix,Linux,FreeBSD等等。本领域技术人员可以理解,图8示出的理赔趋势预测设备结构并不构成对本申请提供的理赔趋势预测设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
本发明还提供一种计算机可读存储介质,该计算机可读存储介质可以为非易失性计算机可读存储介质,该计算机可读存储介质也可以为易失性计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在计算机上运行时,使得计算机执行上述理赔趋势预测方法的步骤。
本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
所述领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种理赔趋势预测方法,其特征在于,所述理赔趋势预测方法包括:
获取预设时间段内的历史理赔数据,其中,所述理赔数据包括理赔类型和理赔金额;
对所述历史理赔数据进行数据清洗,得到目标理赔数据;
对所述目标理赔数据进行识别,确定所述目标理赔数据对应的理赔类型,并将理赔类型相同的目标理赔数据组成一个理赔数据集合,得到至少一个理赔数据集合;
调用预置理赔趋势预测模型,分别将每个理赔数据集合输入到所述理赔趋势预测模型执行正向运算,得到目标预测结果;
接收待理赔数据,并分别对所述待理赔数据和所述目标理赔数据进行文本识别,得到理赔趋势曲线;
根据所述理赔趋势曲线和所述目标预测结果,确定每个理赔数据集合所属理赔类型的理赔趋势,并将所述理赔趋势返回至预设目标终端。
2.根据权利要求1所述的理赔趋势预测方法,其特征在于,在所述获取预设时间段内的历史理赔数据之前,还包括:
预先设定多个理赔类型;
基于预置理赔数据库,获取与所述多个理赔类型中任意一个理赔类型相关的理赔数据,并将所述理赔数据作为训练数据集;
基于所述理赔数据,获取所述理赔类型的实际理赔趋势,并将所述实际理赔趋势作为所述训练数据集对应的验证集;
将所述训练数据集输入预置初始理赔趋势预测模型执行正向运算,得到对所述理赔类型对应的理赔趋势的第一预测结果。
3.根据权利要求2所述的理赔趋势预测方法,其特征在于,在所述将所述训练数据集输入预置初始理赔趋势预测模型执行正向运算,得到对所述理赔类型对应的理赔趋势的第一预测结果之后,还包括:
将所述第一预测结果与所述验证集拟合,得到所述预测结果与所述验证集之间的拟合度;
判断所述拟合度是否小于预设阈值;
若是,则根据所述初始理赔趋势预测模型的损失函数,对所述初始理赔趋势预测模型进行迭代训练,直到所述拟合度大于预设阈值,得到目标理赔趋势预测模型。
4.根据权利要求1所述的理赔趋势预测方法,其特征在于,所述对所述历史理赔数据进行数据清洗,得到目标理赔数据包括:
从预置数据库中获取与所述历史理赔数据对应的数据清洗规则;
根据所述数据清洗规则,对所述历史理赔数据进行数据清洗,得到目标理赔数据。
5.根据权利要求1所述的理赔趋势预测方法,其特征在于,所述调用预置理赔趋势预测模型,分别将每个理赔数据集合输入到所述理赔趋势预测模型执行正向运算,得到目标预测结果包括:
获取每个理赔数据集合所属的理赔类型的预设数据类型集;
提取所述每个理赔数据集合中每份理赔数据的实际数据类型集;
将所述实际数据类型集和所述预设数据类型集比对,确定所述每份理赔数据的实际数据类型集中缺少的数据类型,并将所述每份理赔数据中缺少的数据类型对应的数据补零,得到所述每份理赔数据对应的目标输入数据;
根据所述多个目标输入数据,生成目标输入数据矩阵;
将所述目标输入数据矩阵输入所述理赔趋势预测模型,执行正向运算,得到目标预测结果。
6.根据权利要求1所述的理赔趋势预测方法,其特征在于,所述接收待理赔数据,并分别对所述待理赔数据和所述目标理赔数据进行文本识别,得到理赔趋势曲线包括:
接收待理赔数据;
对所述待理赔数据进行文本识别,得到第一文本数据,并根据所述第一文本数据得到所述待理赔数据对应的第一标签;
对所述目标理赔数据进行文本识别,得到第二文本数据,并根据所述第二文本数据得到所述待理赔数据对应的第二标签;
判断所述第一标签与所述第二标签是否匹配;
若是,则获取与所述第二标签关联的理赔趋势曲线。
7.根据权利要求1所述的理赔趋势预测方法,其特征在于,在所述根据所述理赔趋势曲线和所述目标预测结果,确定每个理赔数据集合所属理赔类型的理赔趋势,并将所述理赔趋势返回至目标终端之后,还包括:
判断每个理赔数据集合所属的理赔类型的发展趋势是否异常;
若所述每个理赔数据集合所属的理赔类型的发展趋势异常,则确定所述每个理赔数据集合所属的理赔类型的发展趋势异常的异常原因;
将所述异常原因发送至与所述理赔类型对应的监控中心的网络设备,以调整所述理赔类型的理赔政策。
8.一种理赔趋势预测装置,其特征在于,所述理赔趋势预测装置包括:
第一获取模块,用于获取预设时间段内的历史理赔数据,其中,所述理赔数据包括理赔类型和理赔金额;
数据清洗模块,用于对所述历史理赔数据进行数据清洗,得到目标理赔数据;
识别模块,用于对所述目标理赔数据进行识别,确定所述目标理赔数据对应的理赔类型,并将理赔类型相同的目标理赔数据组成一个理赔数据集合,得到至少一个理赔数据集合;
预测模块,用于调用预置理赔趋势预测模型,分别将每个理赔数据集合输入到所述理赔趋势预测模型执行正向运算,得到目标预测结果;
识别模块,用于接收待理赔数据,并分别对所述待理赔数据和所述目标理赔数据进行文本识别,得到理赔趋势曲线;
第一确定模块,用于根据所述理赔趋势曲线和所述目标预测结果,确定每个理赔数据集合所属理赔类型的理赔趋势,并将所述理赔趋势返回预设至目标终端。
9.一种理赔趋势预测设备,其特征在于,所述理赔趋势预测设备包括:存储器和至少一个处理器,所述存储器中存储有指令,所述存储器和所述至少一个处理器通过线路互连;
所述至少一个处理器调用所述存储器中的所述指令,以使得所述理赔趋势预测设备执行如权利要求1-7中任一项所述的理赔趋势预测方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-7中任一项所述的理赔趋势预测方法的步骤。
CN202110386280.4A 2021-04-12 2021-04-12 理赔趋势预测方法、装置、设备及存储介质 Active CN112927092B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110386280.4A CN112927092B (zh) 2021-04-12 2021-04-12 理赔趋势预测方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110386280.4A CN112927092B (zh) 2021-04-12 2021-04-12 理赔趋势预测方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN112927092A true CN112927092A (zh) 2021-06-08
CN112927092B CN112927092B (zh) 2024-05-14

Family

ID=76173981

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110386280.4A Active CN112927092B (zh) 2021-04-12 2021-04-12 理赔趋势预测方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN112927092B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20230222597A1 (en) * 2022-01-10 2023-07-13 International Business Machines Corporation Predictive and Prescriptive Analytics for Managing High-Cost Claimants in Healthcare

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109255013A (zh) * 2018-08-14 2019-01-22 平安医疗健康管理股份有限公司 理赔决策方法、装置、计算机设备和存储介质
CN110610431A (zh) * 2019-08-15 2019-12-24 中国平安人寿保险股份有限公司 基于大数据的智能理赔方法及智能理赔系统
CN110942319A (zh) * 2019-11-20 2020-03-31 万力轮胎股份有限公司 一种产品理赔数据建模分析与预测的方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109255013A (zh) * 2018-08-14 2019-01-22 平安医疗健康管理股份有限公司 理赔决策方法、装置、计算机设备和存储介质
CN110610431A (zh) * 2019-08-15 2019-12-24 中国平安人寿保险股份有限公司 基于大数据的智能理赔方法及智能理赔系统
CN110942319A (zh) * 2019-11-20 2020-03-31 万力轮胎股份有限公司 一种产品理赔数据建模分析与预测的方法及装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20230222597A1 (en) * 2022-01-10 2023-07-13 International Business Machines Corporation Predictive and Prescriptive Analytics for Managing High-Cost Claimants in Healthcare

Also Published As

Publication number Publication date
CN112927092B (zh) 2024-05-14

Similar Documents

Publication Publication Date Title
CA3088899C (en) Systems and methods for preparing data for use by machine learning algorithms
CN112559900B (zh) 产品推荐方法、装置、计算机设备和存储介质
CN103782309A (zh) 用于机器学习分类器的自动数据清除
CN111652280B (zh) 基于行为的目标物数据分析方法、装置及存储介质
CN110991474A (zh) 一种机器学习建模平台
CN113051291A (zh) 工单信息的处理方法、装置、设备及存储介质
CN113420018A (zh) 用户行为数据分析方法、装置、设备及存储介质
CN112541635A (zh) 业务数据统计预测方法、装置、计算机设备及存储介质
CN112990989B (zh) 价值预测模型输入数据生成方法、装置、设备和介质
CN112927092A (zh) 理赔趋势预测方法、装置、设备及存储介质
CN112035775B (zh) 基于随机森林模型的用户识别方法、装置和计算机设备
CN109766440B (zh) 一种用于为对象文本描述确定默认分类信息的方法及系统
CN112217908A (zh) 基于迁移学习的信息推送方法、装置及计算机设备
US20020156603A1 (en) Modeling tool with controlled capacity
CN109977977B (zh) 一种识别潜在用户的方法及对应装置
CN110598772A (zh) 运营数据检测方法、装置、计算机设备和存储介质
CN112132498A (zh) 库存管理方法、装置、设备及存储介质
CN113656692B (zh) 基于知识迁移算法的产品推荐方法、装置、设备及介质
CN112232945B (zh) 一种确定个人客户授信的方法及装置
CN114861989A (zh) 一种加保业务的预测方法及装置
CN113627997A (zh) 数据处理方法、装置、电子设备及存储介质
CN114331728A (zh) 一种证券分析管理系统
CN113688206A (zh) 基于文本识别的趋势分析方法、装置、设备及介质
CN111754103A (zh) 企业风险画像方法、装置、计算机设备和可读存储介质
KR20200129132A (ko) 데이터 이활용에 관한 데이터 준비 방법 및 데이터 이활용 시스템

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant