CN109345397A - 智能分保方法、服务器及存储介质 - Google Patents

智能分保方法、服务器及存储介质 Download PDF

Info

Publication number
CN109345397A
CN109345397A CN201811080619.2A CN201811080619A CN109345397A CN 109345397 A CN109345397 A CN 109345397A CN 201811080619 A CN201811080619 A CN 201811080619A CN 109345397 A CN109345397 A CN 109345397A
Authority
CN
China
Prior art keywords
user
disease
insurance
probability
feature vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811080619.2A
Other languages
English (en)
Inventor
李治
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN201811080619.2A priority Critical patent/CN109345397A/zh
Publication of CN109345397A publication Critical patent/CN109345397A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/08Insurance

Landscapes

  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Engineering & Computer Science (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本发明涉及大数据技术,揭露了一种智能分保方法、服务器及存储介质,该方法统计用户购买保险所涉及的责任类型,筛选出涉及疾病类责任的保险的购买用户,并获取筛选后的用户的基本信息及相关信息。接着,该方法将所述筛选后的用户的基本信息、相关信息进行数据处理,生成该用户的多个特征向量,并将每个用户的每个特征向量分别输入到预先训练好的疾病分析模型,得到每个用户在预设时间内发生疾病的最终概率。最后,该方法判断用户在预设时间内发生疾病的最终概率是否大于预设值,若最终概率大于或等于预设值,则以预设方式将该用户购买疾病类保险的风险保额进行分保。利用本发明,能够对用户的风险保额进行灵活分保,促进公司盈利。

Description

智能分保方法、服务器及存储介质
技术领域
本发明涉及数据处理技术领域,尤其涉及一种智能分保方法、服务器及计算机可读存储介质。
背景技术
分保,是指保险公司在原保险合同的基础上,通过签订分保合同,将其所承担的部分风险和责任向再保公司进行保险的行为。保险公司通过分保的方式转移风险责任,减少了因投保人出险而造成的极大损失。目前,保险公司的分保方式包括溢额分保和成数分保。溢额分保是指将风险保额超过某预设数额的部分分给再保公司,例如,某责任的风险保额达到150万,预设数额为50万,则将超出预设数额的该责任的100万风险保额分给再保公司。成数分保是指将达到某预设数额的风险保额按照预设比例分给再保公司,例如,某责任的风险保额达到100万,预设数额为50,则按照4:6的比例将60%的风险保额,即60万的风险保额分给再保公司。所述溢额分保和成数分保的分保方式缺少灵活性,不能根据实际情况进行分保,甚至灵活调整预设数额或分保比例,从而不能为保险公司获取巨额盈利。
发明内容
鉴于以上内容,本发明提供一种智能分保方法、服务器及计算机可读存储介质,其主要目的在于灵活调整分保比例,为公司牟取巨额盈利。
为实现上述目的,本发明提供一种智能分保方法,该方法包括:
筛选步骤:统计用户购买保险所涉及的责任类型,筛选出涉及疾病类责任的保险的购买用户;
获取步骤:获取筛选后的用户的基本信息及相关信息;
处理步骤:将所述筛选后的用户的基本信息、相关信息进行数据处理,包括数据清洗、数据整合、特征提取构建,生成该用户的多个特征向量;
分析步骤:将每个用户的每个特征向量分别输入到预先训练好的疾病分析模型,得到每个用户在预设时间内发生疾病的最终概率;
分保步骤:判断用户在预设时间内发生疾病的最终概率是否大于预设值,若最终概率小于预设值,则无需对该用户购买疾病类保险的风险保额进行分保,若最终概率大于或等于预设值,则以预设方式将该用户购买疾病类保险的风险保额进行分保。
优选地,所述分析步骤包括:
利用预先训练好的疾病分析模型分析每个用户的每个特征向量所导致发生每种疾病的初始概率;
根据每个特征向量所导致发生每种疾病的初始概率,利用预设的权重分值公式计算出每个用户可能发生的每种疾病的总概率;
选择所述用户可能发生的每种疾病中总概率最大的疾病作为该用户最终发生的疾病,并将该疾病的总概率作为该用户发生该疾病的最终概率。
优选地,所述预设的权重分值公式为:
其中,Y代表某类疾病的总概率,n为整数且n>0,Pi代表第i个特征向量导致发生该类疾病的初始概率,ki代表第i个特征向量导致发生疾病的初始概率的权重系数。
优选地,所述预先训练好的疾病分析模型为随机森林模型,所述预先训练好的疾病分析模型的训练步骤如下:
获取预设数量用户的基本信息及相关信息,对所述用户的基本信息及相关信息进行数据清洗及数据整合,得到数据的特征值;
提取整合后的数据的特征值,将数据的特征值组成对应的特征向量,将每个用户对应的特征向量及该用户对应发生的疾病组成样本集;
从样本集中抽取第一比例的特征向量及对应发生的疾病作为训练集,从样本集中抽取第二比例的特征向量及对应发生的疾病作为验证集;
利用所述训练集对随机森林模型进行训练,得到所述疾病分析模型;及
利用所述验证集对所述疾病分析模型的准确率进行验证,若准确率大于或者等于预设准确率,则训练结束,若准确率小于预设准确率,则增加用户数量并重新执行训练步骤直至准确率大于或等于预设准确率。
优选地,所述预设方式包括:
将每个用户的最终概率划分为不同的取值范围,不同的取值范围设置对应的分保比例;及
根据最终概率所属的取值范围,利用相应的分保比例对所述用户购买疾病类保险的风险保额进行分保。
优选地,所述相关信息包括行为信息、饮食信息、运动信息、环境信息、医疗信息及职业信息。
此外,本发明还提供一种服务器,该服务器包括:存储器、处理器及显示器,所述存储器上存储智能分保程序,所述智能分保程序被所述处理器执行,可实现如下步骤:
筛选步骤:统计用户购买保险所涉及的责任类型,筛选出涉及疾病类责任的保险的购买用户;
获取步骤:获取筛选后的用户的基本信息及相关信息;
处理步骤:将所述筛选后的用户的基本信息、相关信息进行数据处理,包括数据清洗、数据整合、特征提取构建,生成该用户的多个特征向量;
分析步骤:将每个用户的每个特征向量分别输入到预先训练好的疾病分析模型,得到每个用户在预设时间内发生疾病的最终概率;
分保步骤:判断用户在预设时间内发生疾病的最终概率是否大于预设值,若最终概率小于预设值,则无需对该用户购买疾病类保险的风险保额进行分保,若最终概率大于或等于预设值,则以预设方式将该用户购买疾病类保险的风险保额进行分保。
优选地,所述分析步骤包括:
利用预先训练好的疾病分析模型分析每个用户的每个特征向量所导致发生每种疾病的初始概率;
根据每个特征向量所导致发生每种疾病的初始概率,利用预设的权重分值公式计算出每个用户可能发生的每种疾病的总概率;
选择所述用户可能发生的每种疾病中总概率最大的疾病作为该用户最终发生的疾病,并将该疾病的总概率作为该用户发生该疾病的最终概率。
优选地,所述预先训练好的疾病分析模型为随机森林模型,所述预先训练好的疾病分析模型的训练步骤如下:
获取预设数量用户的基本信息及相关信息,对所述用户的基本信息及相关信息进行数据清洗及数据整合,得到数据的特征值;
提取整合后的数据的特征值,将数据的特征值组成对应的特征向量,将每个用户对应的特征向量及该用户对应发生的疾病组成样本集;
从样本集中抽取第一比例的特征向量及对应发生的疾病作为训练集,从样本集中抽取第二比例的特征向量及对应发生的疾病作为验证集;
利用所述训练集对随机森林模型进行训练,得到所述疾病分析模型;及
利用所述验证集对所述疾病分析模型的准确率进行验证,若准确率大于或者等于预设准确率,则训练结束,若准确率小于预设准确率,则增加用户数量并重新执行训练步骤直至准确率大于或等于预设准确率。
此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质中包括智能分保程序,所述智能分保程序被处理器执行时,可实现如上所述智能分保方法中的任意步骤。
本发明提出的智能分保方法、服务器及计算机可读存储介质,通过获取购买疾病类保险的用户的基本信息及相关信息进行数据处理,生成对应的特征向量,接着,将每个用户的每个特征向量分别输入到预先训练好的疾病分析模型,得到每个用户在预设时间内发生疾病的最终概率,最后,判断用户在预设时间内发生疾病的最终概率是否大于预设值,若最终概率大于或等于预设值,则以预设方式将该用户购买疾病类保险的风险保额进行分保,从而避免分保方式不灵活造成公司的亏损。
附图说明
图1为本发明智能分保方法的应用环境示意图;
图2为本发明服务器较佳实施例的示意图;
图3为图2中智能分保程序较佳实施例的模块示意图;
图4为本发明智能分保方法较佳实施例的流程图;
图5为本发明疾病分析模型的训练流程图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
如图1所示,是本发明智能分保方法的应用环境示意图。
在本实施例中,该方法能够对用户进行大数据统计,从各个数据平台获取用户的相关数据,例如,从保险服务平台获取用户购买保险的数据,包括购买时间、保险类型、保险涉及的责任、保险的风险保额等。所述保险服务平台是用于记录保险公司的保险销售、出险等数据的平台。从医疗平台,如平安好医生,获取用户的医疗数据,包括疾病发生时间、疾病种类及体检数据等;从生活平台,如平安金管家等,获取生活数据,包括行为数据、饮食数据、运动数据、环境数据、职业数据等。接着,利用所获取的相关数据进行数据处理,存储到数据库中。最后,智能分析数据库中的数据,从用户行为、饮食、运动、环境、医疗、职业等维度来预测将来预设时间内用户发生疾病的概率,并根据概率的高低进行灵活分保。
如图2所示,是本发明服务器1较佳实施例的示意图。
在本实施例中,服务器1是指产品服务平台,该服务器1可以是服务器、平板电脑、个人电脑、便携计算机以及其它具有运算功能的电子设备。
该服务器1包括:存储器11、处理器12、显示器13及网络接口14。其中,网络接口14可选地可以包括标准的有线接口、无线接口(如WI-FI接口)。
存储器11至少包括一种类型的可读存储介质。所述至少一种类型的可读存储介质可为如闪存、硬盘、多媒体卡、卡型存储器等的非易失性存储介质。在一些实施例中,所述存储器11可以是所述服务器1的内部存储单元,例如该服务器1的硬盘。在另一些实施例中,所述存储器11也可以是所述服务器1的外部存储单元,例如所述服务器1上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。在本实施例中,所述存储器11不仅可以用于存储安装于所述服务器1的应用软件及各类数据,例如智能分保程序10及训练好的疾病分析模型等。
处理器12在一些实施例中可以是一中央处理器(Central Processing Unit,CPU),微处理器或其它数据处理芯片,用于运行存储器11中存储的程序代码或处理数据,例如执行智能分保程序10的计算机程序代码、执行疾病分析模型的训练等。
显示器13可以称为显示屏或显示单元。在一些实施例中显示器13可以是LED显示器、液晶显示器、触控式液晶显示器以及有机发光二极管(Organic Light-EmittingDiode,OLED)触摸器等。显示器13用于显示在服务器1中处理的信息以及用于显示可视化的工作界面,例如显示每个用户在预设时间内发生疾病的最终概率。
图2仅示出了具有组件11-14以及智能分保程序10的服务器1,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。
可选地,该服务器1还可以包括用户接口,用户接口可以包括输入单元比如键盘(Keyboard)、语音输出装置比如音响、耳机等,可选地用户接口还可以包括标准的有线接口、无线接口。
可选地,该服务器1还包括触摸传感器。所述触摸传感器所提供的供用户进行触摸操作的区域称为触控区域。此外,这里所述的触摸传感器可以为电阻式触摸传感器、电容式触摸传感器等。而且,所述触摸传感器不仅包括接触式的触摸传感器,也可包括接近式的触摸传感器等。此外,所述触摸传感器可以为单个传感器,也可以为例如阵列布置的多个传感器。用户可以通过触摸所述触控区域启动智能分保程序10。
此外,该服务器1的显示器13的面积可以与所述触摸传感器的面积相同,也可以不同。可选地,将显示器13与所述触摸传感器层叠设置,以形成触摸显示屏。该装置基于触摸显示屏侦测用户触发的触控操作。
该服务器1还可以包括射频(Radio Frequency,RF)电路、传感器和音频电路等等,在此不再赘述。
如图3所示,是图2中智能分保程序10较佳实施例的模块示意图。本发明所称的模块是指能够完成特定功能的一系列计算机程序指令段。
在本实施例中,智能分保程序10包括:筛选模块110、获取模块120、处理模块130、分析模块140及分保模块150,结合图1中智能分保方法的应用环境示意图,所述模块110-150所实现的功能或操作步骤如下:
筛选模块110,用于统计用户购买保险所涉及的责任类型,筛选出涉及疾病类责任的保险的购买用户。所述保险所涉及的责任类型包括:身故、残疾、重疾、轻症等,其中,所述疾病类责任包括重疾、轻症等。
获取模块120,用于获取筛选后的用户的基本信息及相关信息。其中,所述基本信息包括用户姓名、性别、身份证号码及联系方式。所述相关信息包括行为信息、饮食信息、运动信息、环境信息、医疗信息、职业信息。但不仅限于所列举的相关信息,还可以包括其他的相关信息。具体地,所述饮食信息包括饮食食物的种类、饮食规律及饮食食物搭配的合理度等,所述运动信息包括运动项目、运动时长及运动频率等,所述环境信息包括居住、工作环境的空气质量及是否存在污染源等,所述医疗信息包括:体检数据及历史医疗数据,如疾病发生时间、问诊的疾病种类等,所述职业信息包括职业危险度及职业病的存在情况等。
处理模块130,用于将所述筛选后的用户的基本信息、生活信息进行数据处理,包括数据清洗、数据整合、特征提取构建,生成对应的特征向量。下面将以运动信息生成运动特征向量为例,对特征向量的生成过程加以阐述。其中,所述数据清洗是指对采集的数据进行初步加工,将不符合基本要求的数据进行清洗。所述数据清洗步骤包括:缺失值清洗、格式内容清洗、逻辑错误清洗、无效数据清洗、关联性验证。所述数据清洗工具可以是DataWrangler、Google Refine、etlpy的一种或几种。例如,对运动信息进行数据清洗后,得到运动信息中的有效信息,如运动项目或运动类型,如长跑;运动时长,如一个小时;运动频率,如一个星期3次等。所述数据整合是指将不同数据源的数据以数据集成的方式整合到一个新数据源的数据处理方式。所述数据整合包括:数据校验、转换、匹配、容错及装载。所述整合工具可以是Kettle、Informatica、Datastage、Teradata的一种或几种。例如,将所述运动项目、运动时长、运动频率等有效信息整合成一个新的数据源。所述特征提取构建包括:提取整合后的数据的特征值,将各个生活数据的特征值分别组成该用户的多个特征向量。假设,所述特征向量包括行为特征向量、饮食特征向量、运动特征向量、环境特征向量、医疗特征向量、职业特征向量。提取新数据源中运动项目、运动时长、运动频率等有效信息映射成对应的特征值,组成所述运动特征向量。其他相关信息生成相应的特征向量过程类似,在此不再赘述。
分析模块140,用于将每个用户的每个特征向量分别输入到预先训练好的疾病分析模型,得到每个用户在预设时间内发生疾病的最终概率。具体地,先利用预先训练好的疾病分析模型分析每个用户的每个特征向量所导致发生每种疾病的初始概率,接着,根据每个特征向量所导致发生每种疾病的初始概率,利用预设的权重分值公式计算出每个用户可能发生的每种疾病的总概率,最后,选择所述用户可能发生的每种疾病中总概率最大的疾病作为该用户最终发生的疾病,并将该疾病的总概率作为该用户发生该疾病的最终概率。所述预设的权重分值公式为:
其中,Y代表某类疾病的总概率,n为整数且n>0,Pi代表第i个特征向量导致发生该类疾病的初始概率,ki代表第i个特征向量导致发生疾病的初始概率的权重系数。
所述预先训练好的疾病分析模型为随机森林(Random Forest,RF)模型。如图5所述,是疾病分析模型的训练流程图。所述预先训练好的疾病分析模型的训练步骤如下:
获取预设数量用户的基本信息及生活信息,对所述用户的基本信息及生活信息进行数据清洗及数据整合,得到数据的特征值;
提取整合后的数据的特征值,将数据的特征值组成对应的特征向量,将每个用户对应的特征向量及该用户对应发生的疾病组成样本集;
从样本集中抽取第一比例的特征向量及对应发生的疾病作为训练集,从样本集中抽取第二比例的特征向量及对应发生的疾病作为验证集;
利用所述训练集对随机森林模型进行训练,得到所述疾病分析模型;及
利用所述验证集对所述疾病分析模型的准确率进行验证,若准确率大于或者等于预设准确率,则训练结束,若准确率小于预设准确率,则增加用户数量并重新执行训练步骤直至准确率大于或等于预设准确率。
但应理解的是,所述疾病分析模型包括但不限于随机森林模型,还可以是线性回归(Linear Regression,LR)模型或支持向量机(Support Vector Machine,SVM)模型。
分保模块150,用于判断用户在预设时间内发生疾病的最终概率是否大于预设值,若最终概率小于预设值,则无需对该用户购买疾病类保险的风险保额进行分保,若最终概率大于或等于预设值,则以预设方式将该用户购买疾病类保险的风险保额进行分保。所述预设方式包括:将每个用户的最终概率划分为不同的取值范围,不同的取值范围设置对应的分保比例,例如,将最终概率划分为:第一取值范围、第二取值范围及第三取值范围,并设置相应的分保比例,包括第一预设比例、第二预设比例及第三预设比例。再根据最终概率所属的取值范围,利用相应的分保比例对所述用户购买疾病类保险的风险保额进行分保。但应理解的是,不仅限于将最终概率划分为三个不同的取值范围,还可以根据实际情况将最终概率划分为多个取值范围。
如图4所示,是本发明智能分保方法较佳实施例的流程图。
在本实施例中,处理器12执行存储器11中存储的智能分保程序10的计算机程序时实现智能分保方法包括:步骤S10-步骤S50:
步骤S10,筛选模块110统计用户购买保险所涉及的责任类型,筛选出涉及疾病类责任的保险的购买用户。所述保险所涉及的责任类型包括:身故、残疾、重疾、轻症等,其中,所述疾病类责任包括重疾、轻症等。例如,从保险服务平台获取所有用户购买保险产品的数据,统计所有用户购买产品涉及的责任类型,筛选出涉及疾病类责任的保险的购买用户。
步骤S20,获取模块120获取筛选后的用户的基本信息及相关信息。其中,所述基本信息包括用户姓名、性别、身份证号码及联系方式。所述相关信息包括行为信息、饮食信息、运动信息、环境信息、医疗信息、职业信息。具体地,行为信息包括用户是否存在熬夜、抽烟、酗酒等不良行为习惯,是否存在吸毒、嗑药的历史记录等。所述饮食信息包括饮食食物的种类、饮食规律及饮食食物搭配的合理度等,所述运动信息包括运动项目(如跑步、登山、游泳等)、运动时长及运动频率(如,每天、一个星期三次、两个星期一次或一个月一次等)等,所述环境信息包括居住、工作环境的空气质量及是否存在污染源等,所述医疗信息包括:体检数据及历史医疗数据,如疾病发生时间、问诊的疾病种类,包括感冒、发烧、乙肝、心脏病、癌症等,所述职业信息包括职业危险度(如高空作业、辐射等)及职业病的存在情况(如尘肺、职业性皮肤病等)。
步骤S30,处理模块130将所述筛选后的用户的基本信息、生活信息进行数据处理,包括数据清洗、数据整合、特征提取构建,生成对应的特征向量。下面将以运动信息生成运动特征向量为例,对特征向量的生成过程加以阐述。其中,所述数据清洗是指对采集的数据进行初步加工,将不符合基本要求的数据进行清洗。所述数据清洗步骤包括:缺失值清洗、格式内容清洗、逻辑错误清洗、无效数据清洗、关联性验证。所述数据清洗工具可以是DataWrangler、Google Refine、etlpy的一种或几种。例如,运动信息:“某用户在7月8日至7月14日进行3次长跑,每次长跑的时长约一个小时”。对运动信息进行数据清洗后,得到运动信息中的有效信息,如运动项目或运动类型,如长跑;运动时长,如一个小时;运动频率,如一个星期3次等。所述数据整合是指将不同数据源的数据以数据集成的方式整合到一个新数据源的数据处理方式。所述数据整合包括:数据校验、转换、匹配、容错及装载。所述整合工具可以是Kettle、Informatica、Datastage、Teradata的一种或几种。例如,将所述运动项目、运动时长、运动频率等有效信息整合成一个新的数据源。所述特征提取构建包括:提取整合后的数据的特征值,将各个生活数据的特征值分别组成该用户的多个特征向量。假设,所述特征向量包括行为特征向量、饮食特征向量、运动特征向量、环境特征向量、医疗特征向量、职业特征向量。提取新数据源中运动项目、运动时长、运动频率等有效信息映射成对应的特征值,组成所述运动特征向量。其他相关信息生成相应的特征向量过程类似,在此不再赘述。
步骤S40,分析模块140将每个用户的每个特征向量分别输入到预先训练好的疾病分析模型,得到每个用户在预设时间内发生疾病的最终概率。具体地,先利用预先训练好的疾病分析模型分析每个用户的每个特征向量所导致发生每种疾病的初始概率。例如,分别分析某用户的行为、饮食、运动、环境、医疗、职业等特征向量导致该用户发生感冒、发烧、乙肝、心脏病、癌症等疾病的初始概率,假设,用户的行为、饮食、运动、环境、医疗、职业导致该用户发生癌症的初始概率分别为98%、96%、92%、94%、92%、95%。接着,根据每个特征向量所导致发生每种疾病的初始概率,利用预设的权重分值公式计算出每个用户可能发生的每种疾病的总概率。所述预设的权重分值公式为:
其中,Y代表某类疾病的总概率,Pi代表第i个特征向量导致发生该类疾病的初始概率,ki代表第i个特征向量导致发生疾病的初始概率的权重系数。假设,k1、k2、k3、k4、k5、k6分别为0.3、0.15、0.1、0.1、0.3、0.05,则利用预设的权重分值公式计算出该用户发生癌症的总概率为94.75%。同理,算出该用户每个特征向量导致其他疾病的总概率。最后,选择所述用户可能发生的每种疾病中总概率最大的疾病作为该用户最终发生的疾病,并将该疾病的总概率作为该用户发生该疾病的最终概率。假设,该用户发生癌症的总概率最大,则将该用户发生癌症的概率作为该用户的最终发生疾病的概率。
其中,所述预先训练好的疾病分析模型为RF模型。如图5所示,是疾病分析模型的训练流程图。所述预先训练好的疾病分析模型的训练步骤如下:
获取预设数量用户的基本信息及生活信息,对所述用户的基本信息及生活信息进行数据清洗及数据整合,得到数据的特征值。例如,获取10万个用户的基本信息及生活信息,进行数据处理后得到数据的特征值。
提取整合后的数据的特征值,将数据的特征值组成对应的特征向量,将每个用户对应的特征向量及该用户对应发生的疾病组成样本集。例如,将数据的特征值分别组成行为特征向量、饮食特征向量、运动特征向量、环境特征向量、医疗特征向量、职业特征向量,并将每个用户对应的特征向量及该用户预设时间内,如一个星期内,发生疾病组成样本集。
从样本集中抽取第一比例的特征向量及对应发生的疾病作为训练集,从样本集中抽取第二比例的特征向量及对应发生的疾病作为验证集。例如,从样本集中随机抽取80%的特征向量及对应发生的疾病作为训练集,再从样本集中随机抽取20%的特征向量及对应发生的疾病作为验证集。在另一个实施例中,还可以按照4:1的比例将样本集随机分为训练集和验证集。
利用所述训练集对RF模型进行训练,得到所述疾病分析模型。例如,将80%的训练集输入到RF模型中训练,生成疾病分析模型。
利用所述验证集对所述疾病分析模型的准确率进行验证,若准确率大于或者等于预设准确率,则训练结束,若准确率小于预设准确率,则增加用户数量并重新执行训练步骤直至准确率大于或等于预设准确率。假设,预设准确率为90%,若准确率大于或者等于90%,则训练结束,若准确率小于90%,则增加用户数量并重新执行训练步骤,调整模型参数,直至准确率大于或等于90%,模型训练结束,输出该模型。但应理解的是,所述疾病分析模型包括但不限于RF模型,还可以是LR模型或SVM模型。
步骤S50,分保模块150判断用户在预设时间内发生疾病的最终概率是否大于预设值,若最终概率小于预设值,则无需对该用户购买疾病类保险的风险保额进行分保,若最终概率大于或等于预设值,则以预设方式将该用户购买疾病类保险的风险保额进行分保。假设,预设值为50%,若某用户在预设时间内发生疾病的最终概率小于50%,则无需对该用户购买疾病类保险的风险保额进行分保,若用户在预设时间内发生疾病的最终概率大于或等于50%,则以预设方式将该用户购买疾病类保险的风险保额进行分保。所述预设方式包括:将每个用户的最终概率划分为不同的取值范围,不同的取值范围设置对应的分保比例。假设,最终概率划分为:第一取值范围、第二取值范围及第三取值范围,并设置相应的分保比例,包括第一预设比例、第二预设比例及第三预设比例。例如,划分的第一取值范围、第二取值范围及第三取值范围分别为90%-100%、70%-90%、50%-70%,设置对应的分保比例为0:10、1:9、2:8。然后,根据最终概率所在的取值范围,利用相应的分保比例对所述用户购买疾病类保险的风险保额进行分保。例如,该用户发送癌症的最终概率为94.75%,在第一取值范围90%-100%内,则将该用户购买涉及重疾责任的保险的风险保额全部分保给再保公司。但应理解的是,不仅限于将最终概率划分为三个不同的取值范围,还可以根据实际情况将最终概率划分为多个取值范围。所述分保比例可以按照实际情况进行设置。
上述实施例提出的智能分保方法,通过获取购买疾病类保险的用户的基本信息及相关信息进行数据处理,生成对应的特征向量,接着,将每个用户的每个特征向量分别输入到预先训练好的疾病分析模型,得到每个用户在预设时间内发生疾病的最终概率,最后,判断用户在预设时间内发生疾病的最终概率是否大于预设值,若最终概率大于或等于预设值,则以预设方式将该用户购买疾病类保险的风险保额进行分保,从而进行动态分保,减少保险公司的损失。
此外,本发明实施例还提出一种计算机可读存储介质,所述计算机可读存储介质中包括智能分保程序10,所述智能分保程序10被处理器执行时实现如下操作:
筛选步骤:统计用户购买保险所涉及的责任类型,筛选出涉及疾病类责任的保险的购买用户;
获取步骤:获取筛选后的用户的基本信息及相关信息;
处理步骤:将所述筛选后的用户的基本信息、相关信息进行数据处理,包括数据清洗、数据整合、特征提取构建,生成该用户的多个特征向量;
分析步骤:将每个用户的每个特征向量分别输入到预先训练好的疾病分析模型,得到每个用户在预设时间内发生疾病的最终概率;
分保步骤:判断用户在预设时间内发生疾病的最终概率是否大于预设值,若最终概率小于预设值,则无需对该用户购买疾病类保险的风险保额进行分保,若最终概率大于或等于预设值,则以预设方式将该用户购买疾病类保险的风险保额进行分保。
优选地,所述分析步骤包括:
利用预先训练好的疾病分析模型分析每个用户的每个特征向量所导致发生每种疾病的初始概率;
根据每个特征向量所导致发生每种疾病的初始概率,利用预设的权重分值公式计算出每个用户可能发生的每种疾病的总概率;
选择所述用户可能发生的每种疾病中总概率最大的疾病作为该用户最终发生的疾病,并将该疾病的总概率作为该用户发生该疾病的最终概率。
优选地,所述预设的权重分值公式为:
其中,Y代表某类疾病的总概率,n为整数且n>0,Pi代表第i个特征向量导致发生该类疾病的初始概率,ki代表第i个特征向量导致发生疾病的初始概率的权重系数。
优选地,所述预先训练好的疾病分析模型为随机森林模型,所述预先训练好的疾病分析模型的训练步骤如下:
获取预设数量用户的基本信息及相关信息,对所述用户的基本信息及相关信息进行数据清洗及数据整合,得到数据的特征值;
提取整合后的数据的特征值,将数据的特征值组成对应的特征向量,将每个用户对应的特征向量及该用户对应发生的疾病组成样本集;
从样本集中抽取第一比例的特征向量及对应发生的疾病作为训练集,从样本集中抽取第二比例的特征向量及对应发生的疾病作为验证集;
利用所述训练集对随机森林模型进行训练,得到所述疾病分析模型;及
利用所述验证集对所述疾病分析模型的准确率进行验证,若准确率大于或者等于预设准确率,则训练结束,若准确率小于预设准确率,则增加用户数量并重新执行训练步骤直至准确率大于或等于预设准确率。
优选地,所述预设方式包括:
将每个用户的最终概率划分为不同的取值范围,不同的取值范围设置对应的分保比例;及
根据最终概率所属的取值范围,利用相应的分保比例对所述用户购买疾病类保险的风险保额进行分保。
优选地,所述相关信息包括行为信息、饮食信息、运动信息、环境信息、医疗信息及职业信息。
本发明之计算机可读存储介质的具体实施方式与上述智能分保方法的具体实施方式大致相同,在此不再赘述。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其它相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种智能分保方法,应用于服务器,其特征在于,所述方法包括:
筛选步骤:统计用户购买保险所涉及的责任类型,筛选出涉及疾病类责任的保险的购买用户;
获取步骤:获取筛选后的用户的基本信息及相关信息;
处理步骤:将所述筛选后的用户的基本信息、相关信息进行数据处理,包括数据清洗、数据整合、特征提取构建,生成该用户的多个特征向量;
分析步骤:将每个用户的每个特征向量分别输入到预先训练好的疾病分析模型,得到每个用户在预设时间内发生疾病的最终概率;
分保步骤:判断用户在预设时间内发生疾病的最终概率是否大于预设值,若最终概率小于预设值,则无需对该用户购买疾病类保险的风险保额进行分保,若最终概率大于或等于预设值,则以预设方式将该用户购买疾病类保险的风险保额进行分保。
2.根据权利要求1所述的智能分保方法,其特征在于,所述分析步骤包括:
利用预先训练好的疾病分析模型分析每个用户的每个特征向量所导致发生每种疾病的初始概率;
根据每个特征向量所导致发生每种疾病的初始概率,利用预设的权重分值公式计算出每个用户可能发生的每种疾病的总概率;
选择所述用户可能发生的每种疾病中总概率最大的疾病作为该用户最终发生的疾病,并将该疾病的总概率作为该用户发生该疾病的最终概率。
3.根据权利要求1或3所述的智能分保方法,其特征在于,所述预设的权重分值公式为:
其中,Y代表某类疾病的总概率,n为整数且n>0,Pi代表第i个特征向量导致发生该类疾病的初始概率,ki代表第i个特征向量导致发生疾病的初始概率的权重系数。
4.根据权利要求1或2所述的智能分保方法,其特征在于,所述预先训练好的疾病分析模型为随机森林模型,所述预先训练好的疾病分析模型的训练步骤如下:
获取预设数量用户的基本信息及相关信息,对所述用户的基本信息及相关信息进行数据清洗及数据整合,得到数据的特征值;
提取整合后的数据的特征值,将数据的特征值组成对应的特征向量,将每个用户对应的特征向量及该用户对应发生的疾病组成样本集;
从样本集中抽取第一比例的特征向量及对应发生的疾病作为训练集,从样本集中抽取第二比例的特征向量及对应发生的疾病作为验证集;
利用所述训练集对随机森林模型进行训练,得到所述疾病分析模型;及
利用所述验证集对所述疾病分析模型的准确率进行验证,若准确率大于或者等于预设准确率,则训练结束,若准确率小于预设准确率,则增加用户数量并重新执行训练步骤直至准确率大于或等于预设准确率。
5.根据权利要求1所述的智能分保方法,其特征在于,所述预设方式包括:
将每个用户的最终概率划分为不同的取值范围,不同的取值范围设置对应的分保比例;及
根据最终概率所属的取值范围,利用相应的分保比例对所述用户购买疾病类保险的风险保额进行分保。
6.根据权利要求1所述的智能分保方法,其特征在于,所述相关信息包括行为信息、饮食信息、运动信息、环境信息、医疗信息及职业信息。
7.一种服务器,其特征在于,所述服务器包括:存储器、处理器及显示器,所述存储器上存储有智能分保程序,所述智能分保程序被所述处理器执行,可实现如下步骤:
筛选步骤:统计用户购买保险所涉及的责任类型,筛选出涉及疾病类责任的保险的购买用户;
获取步骤:获取筛选后的用户的基本信息及相关信息;
处理步骤:将所述筛选后的用户的基本信息、相关信息进行数据处理,包括数据清洗、数据整合、特征提取构建,生成该用户的多个特征向量;
分析步骤:将每个用户的每个特征向量分别输入到预先训练好的疾病分析模型,得到每个用户在预设时间内发生疾病的最终概率;
分保步骤:判断用户在预设时间内发生疾病的最终概率是否大于预设值,若最终概率小于预设值,则无需对该用户购买疾病类保险的风险保额进行分保,若最终概率大于或等于预设值,则以预设方式将该用户购买疾病类保险的风险保额进行分保。
8.根据权利要求7所述的服务器,其特征在于,所述分析步骤包括:
利用预先训练好的疾病分析模型分析每个用户的每个特征向量所导致发生每种疾病的初始概率;
根据每个特征向量所导致发生每种疾病的初始概率,利用预设的权重分值公式计算出每个用户可能发生的每种疾病的总概率;
选择所述用户可能发生的每种疾病中总概率最大的疾病作为该用户最终发生的疾病,并将该疾病的总概率作为该用户发生该疾病的最终概率。
9.根据权利要求7或8所述的服务器,其特征在于,所述预先训练好的疾病分析模型为随机森林模型,所述预先训练好的疾病分析模型的训练步骤如下:
获取预设数量用户的基本信息及相关信息,对所述用户的基本信息及相关信息进行数据清洗及数据整合,得到数据的特征值;
提取整合后的数据的特征值,将数据的特征值组成对应的特征向量,将每个用户对应的特征向量及该用户对应发生的疾病组成样本集;
从样本集中抽取第一比例的特征向量及对应发生的疾病作为训练集,从样本集中抽取第二比例的特征向量及对应发生的疾病作为验证集;
利用所述训练集对随机森林模型进行训练,得到所述疾病分析模型;及
利用所述验证集对所述疾病分析模型的准确率进行验证,若准确率大于或者等于预设准确率,则训练结束,若准确率小于预设准确率,则增加用户数量并重新执行训练步骤直至准确率大于或等于预设准确率。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中包括智能分保程序,所述智能分保程序被处理器执行时,可实现如权利要求1至6中任一项所述智能分保方法的步骤。
CN201811080619.2A 2018-09-17 2018-09-17 智能分保方法、服务器及存储介质 Pending CN109345397A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811080619.2A CN109345397A (zh) 2018-09-17 2018-09-17 智能分保方法、服务器及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811080619.2A CN109345397A (zh) 2018-09-17 2018-09-17 智能分保方法、服务器及存储介质

Publications (1)

Publication Number Publication Date
CN109345397A true CN109345397A (zh) 2019-02-15

Family

ID=65305610

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811080619.2A Pending CN109345397A (zh) 2018-09-17 2018-09-17 智能分保方法、服务器及存储介质

Country Status (1)

Country Link
CN (1) CN109345397A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110009022A (zh) * 2019-03-26 2019-07-12 第四范式(北京)技术有限公司 吸毒人员信息的预测方法、装置与计算设备
CN113689928A (zh) * 2021-08-24 2021-11-23 平安国际智慧城市科技股份有限公司 保养及预防患病方案的推荐方法、装置、设备及存储介质
CN116029839A (zh) * 2023-02-10 2023-04-28 中国人民健康保险股份有限公司深圳分公司 一种业务系统操作自动化执行操作系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005050210A (ja) * 2003-07-30 2005-02-24 Mitsui Sumitomo Insurance Co Ltd 医療費予測システム、医療費予測サーバ、医療費予測方法、及びプログラム
CN105825429A (zh) * 2016-03-18 2016-08-03 深圳市前海安测信息技术有限公司 基于医学大数据的保险精算方法和系统
CN107146160A (zh) * 2016-02-26 2017-09-08 平安科技(深圳)有限公司 投保客户健康状况分析方法及服务器
CN107818513A (zh) * 2017-11-24 2018-03-20 泰康保险集团股份有限公司 风险评估方法及装置、存储介质、电子设备
CN107910068A (zh) * 2017-11-29 2018-04-13 平安健康保险股份有限公司 投保用户的健康风险预测方法、装置、设备及存储介质
CN108257030A (zh) * 2017-11-08 2018-07-06 中国平安人寿保险股份有限公司 一种保费调整方法、装置、终端设备及存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005050210A (ja) * 2003-07-30 2005-02-24 Mitsui Sumitomo Insurance Co Ltd 医療費予測システム、医療費予測サーバ、医療費予測方法、及びプログラム
CN107146160A (zh) * 2016-02-26 2017-09-08 平安科技(深圳)有限公司 投保客户健康状况分析方法及服务器
CN105825429A (zh) * 2016-03-18 2016-08-03 深圳市前海安测信息技术有限公司 基于医学大数据的保险精算方法和系统
CN108257030A (zh) * 2017-11-08 2018-07-06 中国平安人寿保险股份有限公司 一种保费调整方法、装置、终端设备及存储介质
CN107818513A (zh) * 2017-11-24 2018-03-20 泰康保险集团股份有限公司 风险评估方法及装置、存储介质、电子设备
CN107910068A (zh) * 2017-11-29 2018-04-13 平安健康保险股份有限公司 投保用户的健康风险预测方法、装置、设备及存储介质

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110009022A (zh) * 2019-03-26 2019-07-12 第四范式(北京)技术有限公司 吸毒人员信息的预测方法、装置与计算设备
CN113689928A (zh) * 2021-08-24 2021-11-23 平安国际智慧城市科技股份有限公司 保养及预防患病方案的推荐方法、装置、设备及存储介质
CN113689928B (zh) * 2021-08-24 2023-06-20 深圳平安智慧医健科技有限公司 保养及预防患病方案的推荐方法、装置、设备及存储介质
CN116029839A (zh) * 2023-02-10 2023-04-28 中国人民健康保险股份有限公司深圳分公司 一种业务系统操作自动化执行操作系统
CN116029839B (zh) * 2023-02-10 2023-09-26 中国人民健康保险股份有限公司深圳分公司 一种业务系统操作自动化执行操作系统

Similar Documents

Publication Publication Date Title
CN109242631A (zh) 产品智能推荐方法、服务器及存储介质
US8417660B2 (en) Modifying a patient adherence score
CN108776907A (zh) 广告智能推荐方法、服务器及存储介质
CN109298840A (zh) 基于数据湖的数据集成方法、服务器及存储介质
CN109345397A (zh) 智能分保方法、服务器及存储介质
CN110163476A (zh) 项目智能推荐方法、电子装置及存储介质
CN108510402A (zh) 险种信息推荐方法、装置、计算机设备及存储介质
KR102111223B1 (ko) 푸시 정보 대략 선택 정렬 방법, 디바이스 및 컴퓨터 저장 매체
CN109102371A (zh) 商品推荐方法、装置、计算机设备及存储介质
CN109544373A (zh) 基于人工智能的医保违规行为检测方法及相关装置
CN106462559A (zh) 任意大小内容项生成
CN110275952A (zh) 基于用户短期兴趣的新闻推荐方法、装置及介质
CN110852785B (zh) 用户分级方法、装置及计算机可读存储介质
CN110706783B (zh) 食谱推荐方法、装置、计算设备及计算机存储介质
CN103034640A (zh) 一种页面信息的分析方法和系统
CN110019662B (zh) 一种标签重建方法及装置
CN110032731A (zh) 企业经营范围判断方法、装置及计算机可读存储介质
Grady et al. The effectiveness of strategies to improve user engagement with digital health interventions targeting nutrition, physical activity, and overweight and obesity: Systematic review and meta-analysis
CN117611272A (zh) 商品推荐方法、装置及电子设备
CN117633340A (zh) 一种基于大数据的专病和症状的常用药品推荐方法和系统
Dobrzycki et al. Exploring the Use of Contrastive Language-Image Pre-Training for Human Posture Classification: Insights from Yoga Pose Analysis
KR20200036168A (ko) 개인의 신체 리듬 맞춤형 작물 매칭 시스템
CN109493106A (zh) 销售区域的价值评价方法、装置及计算机可读存储介质
CN107766904A (zh) 一种追溯秤合并打印追溯码方法及装置
KR102139316B1 (ko) 파충류 거래 플랫폼을 운용하는 서버 및 그 동작 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190215