CN107341731A - 保险业务风险评分系统及其构建方法 - Google Patents

保险业务风险评分系统及其构建方法 Download PDF

Info

Publication number
CN107341731A
CN107341731A CN201610286358.4A CN201610286358A CN107341731A CN 107341731 A CN107341731 A CN 107341731A CN 201610286358 A CN201610286358 A CN 201610286358A CN 107341731 A CN107341731 A CN 107341731A
Authority
CN
China
Prior art keywords
insurance
risk score
insurance business
business risk
score system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610286358.4A
Other languages
English (en)
Inventor
吕晓星
周雄志
陈京京
孙珏
雷少梅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Taikang Insurance Group Co Ltd
Original Assignee
Taikang Insurance Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Taikang Insurance Group Co Ltd filed Critical Taikang Insurance Group Co Ltd
Priority to CN201610286358.4A priority Critical patent/CN107341731A/zh
Publication of CN107341731A publication Critical patent/CN107341731A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/08Insurance

Landscapes

  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Engineering & Computer Science (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本公开是关于一种保险业务风险评分系统及其构建方法。该构建方法包括:S10.以是否出险作为待构建的保险业务风险评分系统的因变量;S20.通过数据挖掘方法获取与所述因变量相关的多个自变量;S30.通过Logistic回归方法利用一数据库中存储的第一部分所述自变量以及因变量生成所述保险业务风险评分系统;S40.利用所述数据库中存储的第二部分所述自变量以及因变量对所述保险业务风险评分系统进行验证。本公开可以利用大数据技术完成保险业务评分系统的构建,从而可以对风险进行量化评分。

Description

保险业务风险评分系统及其构建方法
技术领域
本公开涉及大数据技术领域,具体而言,涉及一种保险业务风险评分系统构建方法以及保险业务风险评分系统。
背景技术
随着社会经济的不断发展,人们越来越意识到保险的重要性。保险是指投保人根据合同约定,向保险人支付保险费,保险人对于合同约定的可能发生的风险所造成的损失承担赔偿保险金的行为。因此,保险人对于保险业务的风险评估极为重要。
现有技术中的核保核赔等保险业务审核及风险控制,通常是利用既往经验,通过设定包括地区、人群、客户年龄、保险金额、保险费等维度的组合判断标准与规则,进行日常投保、理赔业务的自动审核和人工审核的筛选。
然而,现有技术的技术方案,在风险评估的精准程度和对经验数据的深度挖掘方面仍有较大的改善空间。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本公开的目的在于提供一种保险业务风险评分系统构建方法以及保险业务风险评分系统,用于至少在一定程度上克服由于相关技术的限制和缺陷而导致的一个或者多个问题。
本公开的其他特性和优点将通过下面的详细描述变得清晰,或者部分地通过本公开的实践而习得。
根据本公开实施例的第一方面,提供一种保险业务风险评分系统构建方法,包括:
S10.以是否出险作为待构建的保险业务风险评分系统的因变量;
S20.通过数据挖掘方法获取与所述因变量相关的多个自变量;
S30.通过Logistic回归方法利用一数据库中存储的第一部分所述自变量以及因变量生成所述保险业务风险评分系统;
S40.利用所述数据库中存储的第二部分所述自变量以及因变量对所述保险业务风险评分系统进行验证。
在本公开的一种示例性实施例中,所述步骤S20包括:
S21.计算一第一变量集合中各变量的AUC系数,并获取所述第一变量集合中所述AUC系数最高的预设数量的变量为第二变量集合;
S22.基于SAS统计系统中的PROC GLMSELECT过程并采用SL筛选规则从所述第二变量集合中筛选出所述多个自变量。
在本公开的一种示例性实施例中,所述步骤S22中采用的是逐步回归算法。
在本公开的一种示例性实施例中,其中:
所述步骤S21之前还包括,对所述数据库中的所有变量进行初步筛选,获取所述第一变量集合;
所述步骤S21还包括,对所述第二变量集合进行人工校正。
在本公开的一种示例性实施例中,其中:
所述因变量为保险单在第一预设时间内是否出险;
所述自变量为所述保险单在第二预设时间内的信息参数。
在本公开的一种示例性实施例中,所述步骤S40包括:
S41.对所述保险业务风险评分系统进行系统验证样本验证;
S42.对所述保险业务风险评分系统进行跨时间验证样本验证。
在本公开的一种示例性实施例中,所述构建方法还包括:
划分多个细分群体;
对于各所述细分群体利用所述保险业务风险评分系统进行评分并获取评分准确性最高的细分群体进行群体分隔。
根据本公开实施例的第二方面,提供一种通过上述任意一种构建方法构建的保险业务风险评分系统;所述保险业务风险评分系统接收输入的自变量参数,并根据所述自变量参数获取出险的概率值以及与所述出险的概率值对应的评分分数。
在本公开的一种示例性实施例中,所述保险业务风险评分系统根据下述公式计算所述出险的概率值:
其中,β0为截距,{βi}是各个所述自变量对应的估计值。
在本公开的一种示例性实施例中,所述出险的概率值被划分为连续的预设数量的区间,每一所述区间对应一个所述评分。
在本公开的一种示例性实施例中,所述保险业务风险评分系统还包括:
色谱输出模块,用于将所述评分分数划分为多个评分范围,不同的所述评分范围对应不同的风险级别;每一所述风险级别通过一种预设的颜色进行标识。
在本公开的一种示例性实施例中,所述色谱输出模块还用于,输出指定的所述自变量与风险级别之间的定量关系,并采用色谱进行风险级别标记。
在本公开的一种示例性实施例中,所述的保险业务风险评分系统还用于分别获取保险单中多个险种的评分分数,并以其中的最高评分为所述保险单的评分分数。
在本公开的一种示例性实施例中,所述保险业务风险评分系统包括核保风险评分系统以及核赔风险评分系统。
本公开的一种实施例中的技术方案,利用既往保险单与客户数据,采取大数据统计分析和回归构建方法,完成保险业务评分系统的构建,从而可以对风险进行量化评分,发现更多当前在业务经验上比较模糊或未知的规律并为业务带来例如以下提升:更准确的在核保/核赔等业务识别风险,有效降低核保/核赔的成本;通过与目前系统的规则相结合,可以逐渐提高自动核保率,减少人工成本;有助于改善客户服务水平,提升客户满意度,有力支持销售,促进业务发展等。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示意性示出本公开示例性实施例中一种保险业务风险评分系统构建方法的流程图。
图2示意性示出本公开示例性实施例中观察期及表现期的划分图。
图3示意性示出本公开示例性实施例中自变量的筛选流程图。
图4示意性示出本公开示例性实施例中相对分数与绝对概率的映射表。
图5示意性示出本公开示例性实施例中相对分数的色谱输出图。
图6示意性示出本公开示例性实施例中自变量风险色谱输出图。
图7示意性示出本公开示例性实施例中一种保险业务风险评分系统的方框图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。在下面的描述中,提供许多具体细节从而给出对本公开的实施方式的充分理解。然而,本领域技术人员将意识到,可以实践本公开的技术方案而省略所述特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知技术方案以避免喧宾夺主而使得本公开的各方面变得模糊。
此外,附图仅为本公开的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
本示例实施方式中首先提供了一种保险业务风险评分系统构建方法,可以用于构建核保风险评分系统,例如构建个人长期寿险、重疾险、年金险、意外险的核保风险评分系统等;也可以用于构建核赔风险评分系统,例如个人医疗险的欺诈风险评分系统和个人医疗险中津贴险的挂床风险评分系统等,即本示例实施方式中并不特别限定所述保险业务风险评分系统构建方法的应用范围。
参考图1中所示,本示例实施方式中的所述保险业务风险评分系统构建方法可以包括以下步骤:
步骤S10.以是否出险作为待构建的保险业务风险评分系统的因变量。
步骤S20.通过数据挖掘方法获取与所述因变量相关的多个自变量。
步骤S30.通过Logistic回归方法利用一数据库中存储的第一部分所述自变量以及因变量生成所述保险业务风险评分系统。
步骤S40.利用所述数据库中存储的第二部分所述自变量以及因变量对所述保险业务风险评分系统进行验证。
此外,本示例实施方式中的保险业务风险评分系统构建方法是基于大数据技术,因此在构建保险业务风险评分系统之前,还可以包括:
步骤S01.准备存储有保险单信息的数据库,并对其中已有数据及其环境进行分析。
下面以构建核保风险评分系统为例,对本示例实施方式中的所述保险业务风险评分系统构建方法的各个步骤进行详细的说明。
步骤S01.准备存储有保险单信息的数据库,并对现有的数据及其环境进行研究和分析,理解数据,分析其是否能满足构建所述保险业务风险评分系统的数据需求,以及评估数据的质量。
举例而言,发明人准备了历史上大量保险单的每个保险合同,在投保当天,保险单的投保人、代理人、保险单的每个合同的被保人的所有历史情况,整合了多业务渠道进行汇总,并对于2013年7月1日之前所有保险合同(总共1亿条左右),每一单都进行了历史回顾。
例如,对于保险单Z,代理人为A,投保人为B,涉及3个保险合同,合同Z01和Z02的被保人为M,合同Z03的被保人为N,申请于2013年1月1日,则这张保险单分为3条记录,Z01,Z02,Z03各一条。为了便于索引,本示例实施方式中还利用数据库技术,通过代理人A的身份证号关联其在2013年1月1日之前的其他信息,从而得到代理人A在公司之前的所有数据,例如代理人A在2013年1月1日之前总共卖过多少保险单,代理人A的卖的保险单在2013年1月1日之前有多少已经出险等信息。
进一步的,如果逐条去关联各条历史数据,相当于1亿条数据每一条都要去关联这1亿条数据中代理人是A的数据,按照平均每个代理人5000条记录算,相当于数据库一共要读取5000亿条,数据库的性能可能无法支撑。发明人发现,一个代理人在同一天存在卖很多保险单的情况,这天该代理人的历史信息是一样的,没有必要全部计算,只需计算一次即可,因此可以生成一个各代理人及其都在哪天卖过保险单的中间表,再去关联到总的数据表,等待后续使用。
步骤S10.以是否出险作为待构建的保险业务风险评分系统的因变量。所述保险业务风险评分系统需要同时考虑欺诈风险及自然状态(非欺诈)下的出险风险。本示例实施方式中,保险业务风险评分系统的表现定义可以包括“好定义”以及“坏定义”,其中,“好定义”即保险单在第一预设时间内没有出险,“坏定义”即保险单在第一预设时间内出险。参考图2中所示,本示例实施方式中,可以将保险单历史数据分成观察期和表现期两个时间段的数据,其中所述第一预设时间即为所述表现期。
所述观察期是用于收集保险单申请信息和历史信息等以及获取保险单申请或历史特征变量的时间段,观察期代表的是评估时已知的信息,观察期的长短因评分系统和管理需要而异。观察期的起始点可以是提取保险单的申请或历史数据的最早和最晚时点。所述表现期是收集所要预测的行为的表现信息,获取风险表现、收益表现等目标变量的时间段,表现期代表的是评估时未知的但对评估效果非常重要而需要预测的信息,表现期的长短也因评分系统和管理需要而异。观察期和表现期的选取,一般需要保证窗口内有充足的样本供评分系统构建,同时样本窗口的业务情况不能与应用评分系统的时间点差距太大。
步骤S20.通过数据挖掘方法获取与所述因变量相关的多个自变量;本示例实施方式中,所述自变量为所述保险单在第二预设时间内的信息参数,所述第二预设时间即为上述观察期。自变量选择在整个保险业务风险评分系统的构建过程中起到至关重要的作用。通过数据挖掘方法筛选出得自变量也可以在一定程度上作为业务人员的参考,起到行业经验的补充和支持作用,从而帮助审核过程更高效的执行。如图3中所示,本示例实施方式中,所述步骤S20可以包括:
S21.计算一第一变量集合中各变量的AUC系数,并获取所述第一变量集合中所述AUC系数最高的预设数量的变量为第二变量集合。
在所述步骤S21之前,可以对所述数据库中的所有变量进行初步筛选,获取所述第一变量集合。初步筛选可以为手工筛选,例如包括:
去除缺失值占比高(如大于95%)的变量;例如,是否吸烟。
去除无意义编码型变量;例如,代理人员工代码。
去除拆分过细的变量;例如,分公司名称。
在初步筛选之后,可以通过单变量的LOGSITIC回归,基于现有样本计算单维度情况下每个变量的好坏区分指标—AUC(Area Under Curve)系数,并根据AUC系数对各变量进行排序,选取排名前50(当然也可以为其他数值)的变量为第二变量集合。
此外,本示例实施方式中所述步骤S21还可以包括,对所述第二变量集合进行人工校正。通过人工校正,可以结合本领域技术人员的业务经验,在自动选出的前50个变量的基础上补充一些业内上认为重要或值得进一步检测的变量。
S22.基于上述步骤S21筛选出的变量,可以从多维角度进一步精选重要的变量组合。本示例实施方式中,可以基于SAS统计系统中的PROC GLMSELECT过程并采用SL(Significance Level)筛选规则(Criteria)从所述第二变量集合中筛选出所述多个自变量。
本示例实施方式中,所述步骤S22不同于互联网技术领域通常所用到的降维方法(如因子分析,主成分分析等)是纯粹的变量分析,而是考虑变量对预测能力的影响,采用逐步回归(stepwise)算法。这主要是考虑到,在保险公司的核保业务中,通常采集投保人和被投保人相关信息的变量来计算核保的风险性。而发明人发现保险单的风险很大程度上还与保险销售人员相关,因此创造性地增加了保险销售人员相关信息的变量,但由于保险销售人员与投保人、被投保人之间毫无关系,因此不再使用降维方法进行分析。通过采用业内不太普遍使用的逐步回归算法(stepwise)进行分析,进而适合本示例实施方式中变量相关性弱的数据分析。
此外,本示例实施方式中所述步骤S22还可以包括,对筛选出的所述多个自变量进行人工校正。通过人工校正,可以以最大程度改进现有审核流程为宗旨,并结合本领域技术人员的业务经验一同验证自变量是否选取恰当并进行微调。
步骤S30.通过Logistic回归方法利用一数据库中存储的第一部分所述自变量以及因变量生成所述保险业务风险评分系统。
本示例实施方式中,可以从全部数据中选择两部分数据:第一部分所述自变量以及因变量,即开发样本;以及第二部分所述自变量以及因变量,即验证样本。开发样本是构建保险业务风险评分系统的的实际数据集。验证样本用于检查估计建立的保险业务风险评分系统的稳健性。保险业务风险评分系统应足够稳健从而可以在完全不同的账户集中具有同样的预测能力,验证样本是一种用于确定结果的样本。
以核保风险评分系统为例,其主要针对长险中的寿险,年金险,重疾险和意外险等。为了保证一定出险样本数,可以截取5年的历史数据(如2010/1/1到2015/7/31),提取该时间段生效的所有保险单。由于四种目标责任的保障范畴有所不同,可以针对每个责任分别搭建四个风险评分系统以提高风险预测的精准度。一个数据筛选规则是剔除特定附加责任限制相关的数据,另一个数据筛选规则是表现期满2年,所有近期进入的保险单(如2013年7月31号之后生效的保险单)都将排除在外。筛选出的数据可以进一步按例如6:4的比例随机截成两部分,其中60%的部分可以作为评分系统训练样本,另外的40%可以作为系统验证样本。
其中,上述数据中近两年内的保险单可以作为跨时间验证样本在评分系统开发完成后对最终评分系统进行跨时间验证。由于这部分保险单的表现期不满2年,无法确定“好”样本,因为暂时还未出险的保险单无法确定在接下来是否会出险。但是可以确定已经出险的保险单为“坏”样本。因此,可以只选择跨时间验证样本中的出险保险单来验证最终评分系统结果。
步骤S40.利用所述数据库中存储的第二部分所述自变量以及因变量,即上述验证样本对所述保险业务风险评分系统进行验证。如上所述,本示例实施方式中,所述验证样本包括系统验证样本和跨时间验证样本,因此所述步骤S40可以包括,对所述保险业务风险评分系统进行系统验证样本验证;以及,对所述保险业务风险评分系统进行跨时间验证样本验证。
此外,本示例实施方式中所述构建方法还可以包括细分分析,通过细分分析可以找出最佳的群体分隔,使得以此为基础建立的一组评分系统可使整个评分系统的预测能力最大化。本示例实施方式中,所述细分分析可以包括:划分多个细分群体,对于各所述细分群体利用所述保险业务风险评分系统进行评分并获取评分准确性最高的细分群体进行群体分隔。但需要说明的是,细分分析并非本示例实施方式中所述构建方法的必需步骤,本领域技术人员可根据需要选择是否必要进行。
进一步的,本示例实施方式中还提供了一种通过上述构建方法构建的保险业务风险评分系统;所述保险业务风险评分系统可以接收输入的自变量参数,并根据所述自变量参数获取出险的概率值(绝对风险概率)以及与所述出险的概率值对应的评分分数(相对风险分位数)。
为了更全面的展示风险,本示例实施方式中提供了两版分数:绝对风险概率和相对风险分位数。绝对风险概率定量的定义风险高低,而相对分数定性的给出相对风险分层。相对分数是绝对概率在历史数据上的百分位数,所以不同的责任无论平均风险的高低都将被统一到同样的尺度上(例如,1到100分),方遍后续的比较分析。相对分数的可比较性即可帮助核保人员综合各个分数从而做出合理的判断,所以保险单审核过成中可以主要参照相对分数。而绝对概率可以结合保额和其他信息用于损失金额的预测等方面。对于核赔审核流程,可以与核保类似使用相对分数帮助审核人员理解风险级别。本示例实施方式中,引入相对风险的概念,一个保险单里不同责任险种的分数统一到保险单层面同样的尺度之上,最后不仅得到每个险种的评分,还可以得到整个保险单的评分。
以寿险(其它险种计算公式和评分示意图雷同)为例,寿险风险评分系统有多个自变量,例如客户等级(X1)、被保人学历(X2)、缴费金额(X3)……缴费期限(Xn-1)以及等待期(Xn),预先计算各自变量的各个取值区间内对应的参数估计值,并保存至一查询表中;例如,变量X1具有5个取值区间,每个取值区间对应的参数估计值为Y11、Y12、Y13、Y14以及Y15;变量Xn具有4个取值区间,每个取值区间对应的参数估计值为Yn1、Yn2、Yn3以及Yn4等。
当一份受理寿险保险单的信息进入评分系统后,评分系统将会采集接收输入评分系统的上述多个自变量(X1~Xn)以及对应的取值,并从上述查询表中查询所述自变量的取值对应的参数估计值(简称β),例如,变量Xn的取值在所述查询表中的第二区间,则可以得知Xn对应的参数估计值为Yn2;然后将所述多个自变量的估计值以及截距进行加总,最后通过逻辑变换逆变换计算出出险的概率值。本示例实施方式中,所述保险业务风险评分系统根据下述公式计算所述出险的概率值:
其中,β0为截距(intercept),{βi}是各个所述自变量对应的估计值。
利用上述参数估计值表,评分系统的可以计算所有数据的绝对概率,之后计算绝对分数的对应的百分位数。这样我们就生成了绝对概率转相对分数(1-100分)的映射表。例如,样本为1000万个,那么按寿险风险P值从低到高将其分为100份10万个数据,其中最低的10万个数据中的最高P值为P1,因此将相对分数值1对应于绝对概率P1,后面依次。举例而言,绝对概率与相对分数对照表可以如图4中所示。
在上述示例性实施例中,所述出险的概率值被划分为连续的100个区间,每一所述区间对应一个所述评分,因此可以进行百分位数评分。但在本公开的其他示例性实施例中,所述出险的概率值例如也可以被划分为连续的10个或50个或1000个区间,每一所述区间对应一个所述评分,因此可以进行其他精度的评分,本示例实施方式中对此不做特殊限定。
进一步的,在评分系统生成评分结果的时候,可以不仅只显示出分数,还可以将分数通过色谱的形式展现出来,以方便核保人员快速准确的识别处保险单风险。举例而言,本示例实施方式中,评分系统可以包括一色谱输出模块,色谱输出模块可以用于将所述评分分数划分为多个评分范围,不同的所述评分范围对应不同的风险级别;每一所述风险级别通过一种预设的颜色进行标识。例如,参考图5中所示,1-50分为较低风险,51-75分为中等风险,76-90分为较高风险,91-100分为很高风险;其中,较低风险通过颜色A标识,中等风险通过颜色B标识,较高风险通过颜色C标识,较高风险通过颜色D标识。
此外,本示例实施方式中,所述色谱输出模块还可以用于输出指定的所述自变量与风险级别之间的定量关系,并采用色谱进行风险级别标记。通过根据各个自变量与风险的定量关系,采取四分位色谱(如颜色A、B、C、D)标记风险等级(例如图6中所示),可以给出每个评分系统的自变量的风险等级,方便核保人员准确的找到保险单的风险点在哪里,方便核保人员根据评分结果对保险单进行相应的调整,降低保险单风险。
进一步的,所述的保险业务风险评分系统还可以用于分别获取保险单中多个险种的评分分数,并以其中的最高评分为所述保险单的评分分数。举例而言,某保险单里中包含寿险、重疾险、意外险以及年金四个险种,对应的风险相对分数为寿险70分、重疾险80分、意外险85分以及年金90分,则保险单整体的风险分数为MAX(70,80,85,90)=90分。但容易理解的是,对于包含多个险种的保险单的风险评估也可以通过其他方式进行计算,均同样属于本公开的保护范围。
以实际应用为例,上述数据库每天批量获取当前所有代理人、客户截止到昨天的历史信息,存在表T_AGT(以代理人身份证为主键,存储该代理人截止至昨天的历史信息,如卖过几张保险单,卖过几张坏保险单等),T_CUST(以客户身份证号为主键,存储该客户截止至昨天的历史信息,如作为投保人买过几张保险单,作为被保人出险过几次等)中等待使用。例如有一张保险单Z,代理人A,投保人B,其下有四个保险合同,Z01是寿险,被保人是M,Z02是重疾险,被保人是M,Z03是寿险,被保人是N,Z04是年金险,被保人是N。
前端电投微投收到保险单Z的申请之后,将Json格式的报文推送给数据库,可以通过Java技术解析Json报文,将Z的保险合同拆解,得到Z01,Z02,Z03,Z04四个保险合同,并得到这四个保险合同的基本信息(如险种、被保人年龄、性别,代理人身份证号、投被保人身份证号等),存在数据库中,然后从CSC取这四个合同的保费保额等信息到数据库,再根据代理人的身份证号、投被保人身份证号关联T_AGT、T_CUST两张表的主键,得到历史信息,最后在数据库中形成一张宽表T_DETAIL(Z01,Z02,Z03,Z04各一条记录),涵盖保险合同所有评分的变量,然后调用评分系统,根据不同的险种类型进行评分,比如Z01是寿险,就进入寿险评分系统,得到20分,Z02是重疾险,就进入重疾险评分系统,得到30分,同理Z03进入寿险评分系统得到40分,Z04进入年金评分系统得到50分。
之后会根据保险单号+被保人进行汇总,每张保险单号的每个被保人得到四个评分,保险单Z的M被保人会显示“寿险20分”,“重疾险30分”,“无意外险种”,“无年金险种”,N被保人会显示“寿险40分”,“无重疾险种”,“无意外险种”,“年金险50分”。供核保员参考。同时,数据库也会把所有保险单评分的明细数据(包括输入评分系统的变量,每个变量的具体评分等)保存下来供分析使用。
综上所述,本示例实施方式中,利用既往保险单与客户数据,采取大数据统计分析和回归构建方法,完成保险业务评分系统的构建,从而可以对风险进行量化评分,发现更多当前在业务经验上比较模糊或未知的规律并为业务带来例如以下提升:更准确的在核保/核赔等业务识别风险,有效降低核保/核赔的成本;通过与目前系统的规则相结合,可以逐渐提高自动核保率,减少人工成本;有助于改善客户服务水平,提升客户满意度,有力支持销售,促进业务发展等。
应当注意,尽管在附图中以特定顺序描述了本公开中方法的各个步骤,但是,这并非要求或者暗示必须按照该特定顺序来执行这些步骤,或是必须执行全部所示的步骤才能实现期望的结果。附加的或备选的,可以省略某些步骤,将多个步骤合并为一个步骤执行,以及/或者将一个步骤分解为多个步骤执行等。
图7中示出根据本公开示例实施方式中上述保险业务风险评分系统400的一种示意图。参照图7,保险业务风险评分系统400包括处理组件422,其进一步包括一个或多个处理器,以及由存储器432所代表的存储器资源,用于存储可由处理组件422的执行的指令,例如应用程序。存储器432中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件422被配置为执行指令,以执行上述方法。
保险业务风险评分系统400还可以包括一个电源组件426被配置为执行保险业务风险评分系统400的电源管理,一个有线或无线网络接口450被配置为将保险业务风险评分系统400连接到网络,和一个输入输出(I/O)接口458。保险业务风险评分系统400可以操作基于存储在存储器432的操作系统,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM或类似。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由所附的权利要求指出。

Claims (14)

1.一种保险业务风险评分系统构建方法,其特征在于,包括:
S10.以是否出险作为待构建的保险业务风险评分系统的因变量;
S20.通过数据挖掘方法获取与所述因变量相关的多个自变量;
S30.通过Logistic回归方法利用一数据库中存储的第一部分所述自变量以及因变量生成所述保险业务风险评分系统;
S40.利用所述数据库中存储的第二部分所述自变量以及因变量对所述保险业务风险评分系统进行验证。
2.根据权利要求1所述的保险业务风险评分系统构建方法,其特征在于,所述步骤S20包括:
S21.计算一第一变量集合中各变量的AUC系数,并获取所述第一变量集合中所述AUC系数最高的预设数量的变量为第二变量集合;
S22.基于SAS统计系统中的PROC GLMSELECT过程并采用SL筛选规则从所述第二变量集合中筛选出所述多个自变量。
3.根据权利要求2所述的保险业务风险评分系统构建方法,其特征在于,所述步骤S22中采用的是逐步回归算法。
4.根据权利要求2所述的保险业务风险评分系统构建方法,其特征在于,其中:
所述步骤S21之前还包括,对所述数据库中的所有变量进行初步筛选,获取所述第一变量集合;
所述步骤S21还包括,对所述第二变量集合进行人工校正。
所述步骤S22还包括,对筛选出的所述多个自变量进行人工校正。
5.根据权利要求1~4所述的保险业务风险评分系统构建方法,其特征在于,其中:
所述因变量为保险单在第一预设时间内是否出险;
所述自变量为所述保险单在第二预设时间内的信息参数。
6.根据权利要求1所述的保险业务风险评分系统构建方法,其特征在于,所述步骤S40包括:
S41.对所述保险业务风险评分系统进行系统验证样本验证;
S42.对所述保险业务风险评分系统进行跨时间验证样本验证。
7.根据权利要求1所述的保险业务风险评分系统构建方法,其特征在于,所述构建方法还包括:
划分多个细分群体;
对于各所述细分群体利用所述保险业务风险评分系统进行评分并获取评分准确性最高的细分群体进行群体分隔。
8.一种通过权利要求1~7任意一项所述的构建方法构建的保险业务风险评分系统;所述保险业务风险评分系统接收输入的自变量参数,并根据所述自变量参数获取出险的概率值以及与所述出险的概率值对应的评分分数。
9.根据权利要求8所述的保险业务风险评分系统,其特征在于,所述保险业务风险评分系统根据下述公式计算所述出险的概率值:
其中,β0为截距,{βi}是各个所述自变量对应的估计值。
10.根据权利要求8所述的保险业务风险评分系统,其特征在于,所述出险的概率值被划分为连续的预设数量的区间,每一所述区间对应一个所述评分。
11.根据权利要求8所述的保险业务风险评分系统,其特征在于,所述保险业务风险评分系统还包括:
色谱输出模块,用于将所述评分分数划分为多个评分范围,不同的所述评分范围对应不同的风险级别;每一所述风险级别通过一种预设的颜色进行标识。
12.根据权利要求11所述的保险业务风险评分系统,其特征在于,所述色谱输出模块还用于,输出指定的所述自变量与风险级别之间的定量关系,并采用色谱进行风险级别标记。
13.根据权利要求8所述的保险业务风险评分系统,其特征在于,所述的保险业务风险评分系统还用于分别获取保险单中多个险种的评分分数,并以其中的最高评分为所述保险单的评分分数。
14.根据权利要求8~13任意一项所述的保险业务风险评分系统,其特征在于,所述保险业务风险评分系统包括核保风险评分系统以及核赔风险评分系统。
CN201610286358.4A 2016-05-03 2016-05-03 保险业务风险评分系统及其构建方法 Pending CN107341731A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610286358.4A CN107341731A (zh) 2016-05-03 2016-05-03 保险业务风险评分系统及其构建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610286358.4A CN107341731A (zh) 2016-05-03 2016-05-03 保险业务风险评分系统及其构建方法

Publications (1)

Publication Number Publication Date
CN107341731A true CN107341731A (zh) 2017-11-10

Family

ID=60222886

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610286358.4A Pending CN107341731A (zh) 2016-05-03 2016-05-03 保险业务风险评分系统及其构建方法

Country Status (1)

Country Link
CN (1) CN107341731A (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107767959A (zh) * 2017-11-15 2018-03-06 平安健康保险股份有限公司 基于性格特征的健康风险评估方法、装置及设备
CN107944771A (zh) * 2017-12-26 2018-04-20 泰康保险集团股份有限公司 再保危险单位的生成方法及装置
CN108876642A (zh) * 2018-09-12 2018-11-23 北京精友世纪软件技术有限公司 一种车险理赔智能风控系统
CN108985919A (zh) * 2018-06-11 2018-12-11 北京玖富普惠信息技术有限公司 一种等级信息统计方法、电子设备和可读存储介质
CN109214941A (zh) * 2018-11-14 2019-01-15 泰康保险集团股份有限公司 信用保险的核保方法、装置、介质及电子设备
CN109377399A (zh) * 2018-12-17 2019-02-22 泰康保险集团股份有限公司 用于保险产品风控的风险分析方法、介质及电子设备
CN109859060A (zh) * 2019-01-31 2019-06-07 泰康保险集团股份有限公司 风险确定方法、装置、介质及电子设备
TWI671702B (zh) * 2018-06-12 2019-09-11 台灣人壽保險股份有限公司 投保補件提示方法及系統
WO2019209171A1 (en) * 2018-04-23 2019-10-31 Trident Corporate Services (Singapore) Pte Limited As Trustee For The Oneplace Unit Trust Method and system for managing accolades
CN111652745A (zh) * 2020-05-28 2020-09-11 泰康保险集团股份有限公司 一种管理保险等待期的系统、方法、电子设备及存储介质
CN117011074A (zh) * 2023-07-25 2023-11-07 明亚保险经纪股份有限公司 风险预警方法及平台

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020103677A1 (en) * 2001-02-01 2002-08-01 Sexton Frank M. Method and system for disproportional allocation of multi-risk insurance policy
CN105260915A (zh) * 2015-10-21 2016-01-20 中国太平洋保险(集团)股份有限公司 一种基于大数据对用户行为建模的控制方法及装置
CN105488046A (zh) * 2014-09-16 2016-04-13 钛马信息网络技术有限公司 基于车辆保险业务的大数据分析系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020103677A1 (en) * 2001-02-01 2002-08-01 Sexton Frank M. Method and system for disproportional allocation of multi-risk insurance policy
CN105488046A (zh) * 2014-09-16 2016-04-13 钛马信息网络技术有限公司 基于车辆保险业务的大数据分析系统
CN105260915A (zh) * 2015-10-21 2016-01-20 中国太平洋保险(集团)股份有限公司 一种基于大数据对用户行为建模的控制方法及装置

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107767959A (zh) * 2017-11-15 2018-03-06 平安健康保险股份有限公司 基于性格特征的健康风险评估方法、装置及设备
CN107944771A (zh) * 2017-12-26 2018-04-20 泰康保险集团股份有限公司 再保危险单位的生成方法及装置
WO2019209171A1 (en) * 2018-04-23 2019-10-31 Trident Corporate Services (Singapore) Pte Limited As Trustee For The Oneplace Unit Trust Method and system for managing accolades
CN108985919A (zh) * 2018-06-11 2018-12-11 北京玖富普惠信息技术有限公司 一种等级信息统计方法、电子设备和可读存储介质
TWI671702B (zh) * 2018-06-12 2019-09-11 台灣人壽保險股份有限公司 投保補件提示方法及系統
CN108876642A (zh) * 2018-09-12 2018-11-23 北京精友世纪软件技术有限公司 一种车险理赔智能风控系统
CN109214941A (zh) * 2018-11-14 2019-01-15 泰康保险集团股份有限公司 信用保险的核保方法、装置、介质及电子设备
CN109377399A (zh) * 2018-12-17 2019-02-22 泰康保险集团股份有限公司 用于保险产品风控的风险分析方法、介质及电子设备
CN109859060A (zh) * 2019-01-31 2019-06-07 泰康保险集团股份有限公司 风险确定方法、装置、介质及电子设备
CN109859060B (zh) * 2019-01-31 2021-09-10 泰康保险集团股份有限公司 风险确定方法、装置、介质及电子设备
CN111652745A (zh) * 2020-05-28 2020-09-11 泰康保险集团股份有限公司 一种管理保险等待期的系统、方法、电子设备及存储介质
CN111652745B (zh) * 2020-05-28 2023-03-21 泰康保险集团股份有限公司 一种管理保险等待期的系统、方法、电子设备及存储介质
CN117011074A (zh) * 2023-07-25 2023-11-07 明亚保险经纪股份有限公司 风险预警方法及平台

Similar Documents

Publication Publication Date Title
CN107341731A (zh) 保险业务风险评分系统及其构建方法
CN110188198B (zh) 一种基于知识图谱的反欺诈方法及装置
US20060004595A1 (en) Data integration method
US20140172681A1 (en) Process for Verifying Data Identity for Lending Decisions
CN112132233A (zh) 一种基于有效影响因子的服刑人员危险行为预测方法及系统
KR20180060044A (ko) 클라우드 환경에서 개인정보 보호를 지원하는 p2p 중개 보안 시스템
Lin et al. CEOs’ military experience, agency costs and acquisition decisions
CN108460689B (zh) 一种保单分析方法、装置、终端设备及存储介质
CN112200583A (zh) 一种基于知识图谱的欺诈客户识别方法
CN112613977A (zh) 一种基于政务数据的个人信用贷款准入授信方法及系统
KR20180060005A (ko) 클라우드 환경에서 개인정보 보호를 지원하는 p2p 중개 보안 시스템
CN112907356A (zh) 逾期催收方法、装置、系统及计算机可读存储介质
CN113554310A (zh) 基于智能合约的企业信用动态评估模型
CN112633889A (zh) 一种企业基因测序系统及方法
Kirikkaleli et al. Co‐Movement of political risk and sovereign credit risk: a wavelet coherence analysis for Argentina, Brazil, and Venezuela
Guernsey et al. Classified boards: Endangered species or hiding in plain sight
Cohn et al. Quasi-insider shareholder activism: Corporate governance at the periphery of control
Pulejo et al. Plata y plomo: How higher wages expose politicians to criminal violence
Chersan et al. A circular causality analysis on the determinants of the audit fees within the NYSE-quoted companies
CN113835947B (zh) 一种基于异常识别结果确定异常原因的方法和系统
CN115879548B (zh) 一种用于客户身份识别的知识图谱构建方法和系统
Zehri et al. audit quality, corporate governance and earnings management in the context of Tunisian Firms
Rosli et al. the determinants of voluntary risk disclosures: the case of Shariah compliant companies in Malaysia
Walker et al. Hedging and company value–a comparison between South Africa and United States of America
CN111951099B (zh) 一种信用卡发卡模型及其运用方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20171110