CN104834983A - 业务数据处理方法及装置 - Google Patents

业务数据处理方法及装置 Download PDF

Info

Publication number
CN104834983A
CN104834983A CN201410822312.0A CN201410822312A CN104834983A CN 104834983 A CN104834983 A CN 104834983A CN 201410822312 A CN201410822312 A CN 201410822312A CN 104834983 A CN104834983 A CN 104834983A
Authority
CN
China
Prior art keywords
business
variable
model
loss
business paper
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410822312.0A
Other languages
English (en)
Other versions
CN104834983B (zh
Inventor
周涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN201410822312.0A priority Critical patent/CN104834983B/zh
Publication of CN104834983A publication Critical patent/CN104834983A/zh
Application granted granted Critical
Publication of CN104834983B publication Critical patent/CN104834983B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明涉及一种业务数据处理方法及装置,其方法包括:获取业务单据的属性指标数据;对业务单据的属性指标数据进行分析,从中提取模型变量;将提取的模型变量输入预先建立的业务流失预测模型,得到对应业务单据的业务流失估计分值。本发明可以精准预测保单期交保费可能性的高低,便于给业务员对难度保单提供相应的攻关方案,在不影响正常使用的情况下,可以极大预测识别出交费困难保单,并针对其影响因素提前与客户联系互动,减少了业务员在催收前对保单信息的收集,并能根据保单情况作重点催收,提高业务员的工作效率,在降低保单流失量的同时,增加了保费收入,增强了客户保障。

Description

业务数据处理方法及装置
技术领域
本发明涉及信息处理技术领域,尤其涉及一种业务数据处理方法及装置。
背景技术
目前的保险(比如寿险)续期催收系统会每月定期给业务员推送应收保单,展示保单的基本信息。但受限很多权限约束,保单关联信息、投保人关联信息等都无法获取,业务员只能通过经验去催收,很难精准识别保单续交保费的可能性,由此增大了人力成本。此外,随着续期保单量增多,运营督导难以提前发现交费困难的保单,不利于问题件重点攻关。导致保险公司保费收入和客户资源减少,客户保障受损。
因此,有必要提供一种解决方案,预测高可能流失保单,并制订相应的攻关策略。
发明内容
本发明的主要目的在于提供一种业务数据处理方法及装置,旨在自动识别出问题业务单据,提高业务人员工作效率,减少业务流失。
为了达到上述目的,本发明提出一种业务数据处理方法,包括:
获取业务单据的属性指标数据;
对所述业务单据的属性指标数据进行分析,从中提取模型变量;
将提取的所述模型变量输入预先建立的业务流失预测模型,得到对应业务单据的业务流失估计分值。
优选地,该方法还包括:
根据所述业务单据的业务流失估计分值,获取所述业务单据的流失影响因素,所述流失影响因素至少包括一种属性指标数据;
根据所述业务单据的流失影响因素获取相应的攻关策略;
将所述业务单据的业务流失估计分值、流失影响因素以及相应的攻关策略,推送给相关业务人员。
优选地,所述对业务单据的属性指标数据进行分析,从中提取模型变量的步骤包括:
从多个维度,对所述业务单据的属性指标数据进行分析和整理,获取所述业务单据的若干字段变量;
以第一计算规则,对所述业务单据的若干字段变量进行初步筛选,得到初步筛选后的变量;
对初步筛选后的变量,以第二计算规则,计算每一变量的信息值IV,所述IV为反映每一变量的预测能力的指标;
获取IV大于或等于预设阈值的变量作为模型变量。
优选地,所述获取IV大于或等于预设阈值的变量作为模型变量的步骤之后还包括:
对获取的模型变量进行相关性检验,获取具有相关性的变量组中IV最大的模型变量作为最终的模型变量。
优选地,所述获取业务单据的属性指标数据的步骤之前还包括:
构建所述业务流失预测模型,具体包括:
获取样本业务单据的属性指标数据;
对所述样本业务单据的属性指标数据进行分析,从中提取样本模型变量;
获取所述样本业务单据的业务流失估计分值;
根据所述样本模型变量,以及所述样本业务单据的业务流失估计分值,建立业务流失预测模型。
优选地,该方法还包括:
对所述业务流失预测模型进行验证。
本发明实施例还提出一种业务数据处理装置,包括:
数据获取模块,用于获取业务单据的属性指标数据;
分析提取模块,用于对所述业务单据的属性指标数据进行分析,从中提取模型变量;
处理模块,用于将提取的所述模型变量输入预先建立的业务流失预测模型,得到对应业务单据的业务流失估计分值。
优选地,该装置还包括:
策略推送模块,用于根据所述业务单据的业务流失估计分值,获取所述业务单据的流失影响因素,所述流失影响因素至少包括一种属性指标数据;根据所述业务单据的流失影响因素获取相应的攻关策略;将所述业务单据的业务流失估计分值、流失影响因素以及相应的攻关策略,推送给相关业务人员。
优选地,所述分析提取模块,还用于从多个维度,对所述业务单据的属性指标数据进行分析和整理,获取所述业务单据的若干字段变量;以第一计算规则,对所述业务单据的若干字段变量进行初步筛选,得到初步筛选后的变量;对初步筛选后的变量,以第二计算规则,计算每一变量的信息值IV,所述IV为反映每一变量的预测能力的指标;获取IV大于或等于预设阈值的变量作为模型变量;
所述分析提取模块,进一步还用于对获取的模型变量进行相关性检验,获取具有相关性的变量组中IV最大的模型变量作为最终的模型变量。
优选地,该装置还包括:
模型构建模块,用于构建所述业务流失预测模型,具体用于:
获取样本业务单据的属性指标数据;对所述样本业务单据的属性指标数据进行分析,从中提取样本模型变量;获取所述样本业务单据的业务流失估计分值;根据所述样本模型变量,以及所述样本业务单据的业务流失估计分值,建立业务流失预测模型;
模型验证模块,用于对所述业务流失预测模型进行验证。
本发明实施例提出的一种业务数据处理方法及装置,通过获取业务单据(比如保单)的属性指标数据;对业务单据的属性指标数据进行分析,从中提取模型变量;将提取的模型变量输入预先建立的业务流失预测模型,得到对应业务单据的业务流失估计分值,以保单为例,由此可以精准预测保单期交保费可能性的高低,便于给业务员对难度保单提供相应的攻关方案,在不影响正常使用的情况下,可以极大预测识别出交费困难保单,并针对其影响因素提前与客户联系互动,这样减少了业务员在催收前对保单信息的收集,并能根据保单情况作重点催收,降低与客户互动的时间、频次等,从而节约业务员时间,提高业务员的工作效率,在降低保单流失量的同时,增加了保 费收入,增强了客户保障。
附图说明
图1是本发明业务数据处理方法第一实施例的流程示意图;
图2是本发明业务数据处理方法第二实施例的流程示意图;
图3是本发明业务数据处理方法第三实施例的流程示意图;
图4是本发明业务数据处理装置第一实施例的功能模块示意图;
图5是本发明业务数据处理装置第二实施例的功能模块示意图;
图6是本发明业务数据处理装置第三实施例的功能模块示意图。
为了使本发明的技术方案更加清楚、明了,下面将结合附图作进一步详述。
具体实施方式
本发明实施例的解决方案主要是:基于寿险保单的关键因素、保单基本信息、客户信息、业务员信息、客户与公司动作关联信息等因素,精准预测保单期交保费可能性的高低,并在系统中给业务员对难度保单提供攻关方案。在不影响正常使用的情况下,系统可以极大预测识别出交费困难保单,并针对其影响因素提前与客户联系互动,这样减少了业务员在催收前对保单信息的收集,并能根据保单情况作重点催收,减少与客户互动的时间、频次等,从而节约业务员时间,提高其工作效率。在降低保单流失量的同时,增加了公司保费收入,增强了客户保障。
如图1所示,本发明第一实施例提出一种业务数据处理方法,包括:
步骤S101,获取业务单据的属性指标数据;
本发明实施例涉及的业务单据包括但不限于寿险系统的保单,还可以是其他业务相关的单据,本实施例以寿险系统的保单进行举例。
本实施例方案可以通过大数据挖掘,提前预测高可能流失保单,减少业务员在催收前对保单信息的收集,提高其工作效率,并可制订相应的攻关策略。
具体地,首先,获取业务单据的属性指标数据,其中,以保单为例,保 单的属性指标数据可以考虑以下因素:
基于寿险保单的关键因素、保单基本信息、客户信息、业务员信息、客户与公司动作关联信息等。
其中,要先清晰地定义出业务问题,确定哪些保单是不能正常交费保单,即定义问题件。
寿险保单有多达近20种的属性状态,每一状态的业务含义都不一样,如D死亡理赔、E展期、I交费有效、L失效、P交清、S现金解约、Z人为停效、……。这些都是客户的交费情况、交费方式,以及未交费的种种形态的体现。因此,需要明确哪些是客户非正常渠道资费和不交费,即问题保单。
然后,为了从所有保单中识别出可能交费意愿困难的保单,需要多维度,尽可能全面的考虑影响因素,由此,需要获取业务单据的各个属性指标数据。主要包括:
保单关键信息:如自保件、考核月自保件、投诉情况、理赔情况等;
保单的基本信息:如保单险种、年度、在/离职单、保费等;
业务员信息:业务员的基本人口信息、二次达成率、品质情况、拥有的保单情况等;
投保人信息:投保人的基本人口信息、关系、婚姻状况等;
投保人与公司交互动作信息:最近某段时间是否做过部分领取、保单贷款、保单还款、领取红利等。
从业务场景分析,并考虑时间窗,尝试探索这些维度指标在某一段时间的表现,梳理衍生多个(比如80个)字段变量,如选取合适的时间段看客户的保全动作,保全类型等。最后映射到对应的保单上,汇成最终的表格。
步骤S102,对所述业务单据的属性指标数据进行分析,从中提取模型变量;
对业务单据的属性指标数据进行分析,主要是研究数据的质量,以确定输入数据模型的变量。
优选地,对业务单据的属性指标数据进行分析,从中提取模型变量的步骤可以包括:
从多个维度,对所述业务单据的属性指标数据进行分析和整理,获取所述业务单据的若干字段变量;
以第一计算规则,对所述业务单据的若干字段变量进行初步筛选,得到初步筛选后的变量;
对初步筛选后的变量,以第二计算规则,计算每一变量的信息值IV,所述IV为反映每一变量的预测能力的指标;
获取IV大于或等于预设阈值的变量作为模型变量。
进一步地,还可以对获取的模型变量进行相关性检验,获取具有相关性的变量组中IV最大的模型变量作为最终的模型变量。
更为具体地,所述第一计算规则可以是:
数据分析包括计算单据各属性指标数据的最小值和最大值,计算平均偏差和标准偏差,以及查看数据的分布。
例如,通过查看最大值、最小值和平均值,可以确定数据并不能代表客户或业务流程,因此必须获取更多均衡数据或查看预期结果所依据的假定。
标准偏差和其他分发值可以提供有关结果的稳定性和准确性的有用信息。
为了进一步挑选具有很强预测能力的指标,将模型变量WOE编码方式离散化之后,运用logistic回归模型进行一种二分类变量的广义线性模型。模型变量WOE以及IV原理,为表述方便,本文将模型目标标量为1记为流失保单,对于目标变量为0记为正常交费保单;则WOE(weight of Evidence)其实就是自变量取某个值的时候对流失比例的一种影响。Woe公式如下:
woe i = ln ( P y 1 P y 0 ) = ln ( # B i / # B T # G i / # G T ) - - - ( 1.1 )
其中,Py1是目标变量为1的样本量占整体中为1的样本的比例;Py0是目标变量为0的样本量占整体中为0的样本的比例;Bi为某区间自变量中为1的样本量,BT为自变量中1的样本量,Gi为某区间自变量中为0的样本量,GT为自变量中0的样本量。
例如,保费(pol_prem)分段如下表1所示:
表1
通过表1可以看出,woe反映的是在自变量每个分组下,流失用户对正常用户占比和总体中流失用户对正常用户占比之间的差异;从而可以直观的认为woe蕴含了自变量取值对于目标变量(流失概率)的影响。再加上woe计算形式与logistic回归中目标变量的logistic转换(logist_p=ln(p/1-p))相似,因而可以将自变量woe值替代原先的自变量值;然后对iv求和(可以看成是对woe的加权求和),就得到IV(information value信息值),是衡量自变量对目标变量影响的指标之一。
IV值的计算如下:
IV i = ( # B i # B T - # G i # G T ) * ln ( # B i / # B T # G i / # G T ) IV = Σ k - 0 n IV i - - - ( 1.2 ) ;
一般挑选IV值大于等于0.06的变量进入模型。
上述计算规则即为本实施例中所述的第二计算规则。
初步筛选完变量后,需要对变量间的关联紧密程度分析,即多个变量反应了同一状况,这个时候只需挑选一个就能反应这一类状况,因此要做变量相关性检验。计算变量间的相关系数,在相关系数高(相似度高的)的变量组中,挑选IV值较高的变量。
步骤S103,将提取的所述模型变量输入预先建立的业务流失预测模型,得到对应业务单据的业务流失估计分值。
之后,将提取的模型变量输入预先建立的业务流失预测模型,得到对应 业务单据的业务流失估计分值。
其中,预先建立的业务流失预测模型包含了模型变量与对应单据的业务流失估计分值的对应关系,后续将详细阐述业务流失预测模型的详细构建过程。
在实际应用中,在保单催收系统中,植入模型打分的机制,通过收集每月应收保单的模型变量,打分判断该保单不交费的可能性高低,并分类出其影响因素,如业务员品质原因、客户经济原因、客户与公司纠纷等等,根据每类原因,制订相就的攻关策略,并提供最佳实践案例,供业务员催收参考。
本实施例通过上述方案,采用多维度,多因素预测分析保单对应客户交费可能性的高低,可以在不增加任何成本的基础上,使业务员及早识别难交费的保单,并重点介入挽留,在提高工作效率的同时,大大提高了公司的保费收入,减少客户流失,为客户带来更好的保障。
如图2所示,本发明第二实施例提出一种业务数据处理方法,基于上述图1所示的实施例,还包括:
步骤S104,根据所述业务单据的业务流失估计分值,获取所述业务单据的流失影响因素,所述流失影响因素至少包括一种属性指标数据;
步骤S105,根据所述业务单据的流失影响因素获取相应的攻关策略;
步骤S106,将所述业务单据的业务流失估计分值、流失影响因素以及相应的攻关策略,推送给相关业务人员。
相比上述第一实施例,本实施例还包括根据业务单据的业务流失估计分值,获取相应的攻关策略推送给业务人员的处理方案。
具有地,在获取到业务单据的业务流失估计分值后,选取正相关系数最高的前N个(比如5个)指标为影响保单流失的主要因素,制订挽留措施,或者从本地数据库中获取相应的攻关策略,并将所述业务单据的业务流失估计分值、流失影响因素以及相应的攻关策略(比如,哪些保单为重点催收保单,对于重点保单,提供相应的挽留措施等),推送给相关业务人员,以便业务人员根据保单情况作重点催收,降低与客户互动的时间、频次等。
本实施例通过上述方案,不仅可以精准预测保单期交保费可能性的高低,并给业务员对难度保单提供相应的攻关方案,在不影响正常使用的情况下, 可以极大预测识别出交费困难保单,并针对其影响因素提前与客户联系互动,这样减少了业务员在催收前对保单信息的收集,并能根据保单情况作重点催收,降低与客户互动的时间、频次等,从而节约业务员时间,提高业务员的工作效率,在降低保单流失量的同时,增加了保费收入,增强了客户保障。
如图3所示,本发明第三实施例提出一种业务数据处理方法,基于上述图2所示的实施例,还包括:
步骤S100,构建所述业务流失预测模型。
相比上述各实施例,本实施例还包括构建业务流失预测模型的方案。
具体包括:
首先,获取样本业务单据的属性指标数据。
其中,样本业务单据的业务流失估计分值已预先得知。
预先收集样本业务单据的属性指标数据,其中,以保单为例,保单的属性指标数据可以考虑以下因素:
基于寿险保单的关键因素、保单基本信息、客户信息、业务员信息、客户与公司动作关联信息等。
其中,要先清晰地定义出业务问题,确定哪些保单是不能正常交费保单,即定义问题件。
寿险保单有多达近20种的属性状态,每一状态的业务含义都不一样,如D死亡理赔、E展期、I交费有效、L失效、P交清、S现金解约、Z人为停效、……。这些都是客户的交费情况、交费方式,以及未交费的种种形态的体现。因此,需要明确哪些是客户非正常渠道资费和不交费,即问题保单。
然后,为了从所有保单中识别出可能交费意愿困难的保单,需要多维度,尽可能全面的考虑影响因素,由此,需要获取业务单据的各个属性指标数据。主要包括:
保单关键信息:如自保件、考核月自保件、投诉情况、理赔情况等;
保单的基本信息:如保单险种、年度、在/离职单、保费等;
业务员信息:业务员的基本人口信息、二次达成率、品质情况、拥有的保单情况等;
投保人信息:投保人的基本人口信息、关系、婚姻状况等;
投保人与公司交互动作信息:最近某段时间是否做过部分领取、保单贷款、保单还款、领取红利等。
从业务场景分析,并考虑时间窗,尝试探索这些维度指标在某一段时间的表现,梳理衍生多个(比如80个)字段变量,如选取合适的时间段看客户的保全动作,保全类型等。最后映射到对应的保单上,汇成最终的表格。
然后,对所述样本业务单据的属性指标数据进行分析,从中提取样本模型变量。
之后,获取所述样本业务单据的业务流失估计分值;根据所述样本模型变量,以及所述样本业务单据的业务流失估计分值,建立业务流失预测模型。
更为具体地,其中,数据分析包括计算单据各属性指标数据的最小值和最大值,计算平均偏差和标准偏差,以及查看数据的分布。
例如,通过查看最大值、最小值和平均值,可以确定数据并不能代表客户或业务流程,因此必须获取更多均衡数据或查看预期结果所依据的假定。
标准偏差和其他分发值可以提供有关结果的稳定性和准确性的有用信息。大型标准偏差可以指示添加更多数据以帮助改进模型。与标准分发偏差很大的数据可能已被扭曲,抑或准确反映了现实问题,但很难使模型适合数据。
为了进一步挑选具有很强预测能力的指标,将模型变量WOE编码方式离散化之后,运用logistic回归模型进行一种二分类变量的广义线性模型。模型变量WOE以及IV原理,为表述方便,本文将模型目标标量为1记为流失保单,对于目标变量为0记为正常交费保单;则WOE(weight of Evidence)其实就是自变量取某个值的时候对流失比例的一种影响。Woe公式如下:
woe i = ln ( P y 1 P y 0 ) = ln ( # B i / # B T # G i / # G T ) - - - ( 1.1 ) ;
其中,Py1是目标变量为1的样本量占整体中为1的样本的比例;Py0是目标变量为0的样本量占整体中为0的样本的比例;Bi为某区间自变量中为1的样本量,BT为自变量中1的样本量,Gi为某区间自变量中为0的样本量,GT为自变量中0的样本量。
例如,保费(pol_prem)分段如上表1所示:
通过表1可以看出,woe反映的是在自变量每个分组下,流失用户对正 常用户占比和总体中流失用户对正常用户占比之间的差异;从而可以直观的认为woe蕴含了自变量取值对于目标变量(流失概率)的影响。再加上woe计算形式与logistic回归中目标变量的logistic转换(logist_p=ln(p/1-p))相似,因而可以将自变量woe值替代原先的自变量值;然后对iv求和(可以看成是对woe的加权求和),就得到IV(information value信息值),是衡量自变量对目标变量影响的指标之一。
IV值的计算如下:
IV i = ( # B i # B T - # G i # G T ) * ln ( # B i / # B T # G i / # G T ) IV = Σ k - 0 n IV i - - - ( 1.2 ) ;
一般挑选IV值大于或等于0.06(当然,该值还可以灵活设置)的变量进入模型。
初步筛选完变量后,需要对变量间的关联紧密程度分析,即多个变量反应了同一状况,这个时候只需挑选一个就能反应这一类状况,因此要做变量相关性检验。计算变量间的相关系数,在相关系数高(相似度高的)的变量组中,挑选IV值较高的变量。
之后构建模型,具体计算过程如下:
Logit模型的应用广泛性的原因主要是因为其概率表达式的显性特点,模型的求解速度快,应用方便。当模型选择集没有发生变化,而仅仅是当各变量的水平发生变化时(如出行时间发生变化),可以方便的求解各选择枝在新环境下的各选择枝的被选概率。
首先,考虑具有p个独立变量的向量x′=(x1,x2,…xp),设条件概率P(Y=1|x)=p为根据观测量相对于某事件发生的概率。逻辑回归模型可表示为:
P ( Y = 1 | x ) = π ( x ) = 1 1 + e - g ( x ) ; - - - ( 1.3 )
上式右侧形式的函数称为逻辑函数。
其中,g(x)=β01x12x2+…+βpxp;(β0常规数值,β1、β2、β3、……、βp为p个变量的拟合系数)。如果含有名义变量,则将其变为虚拟变量。一 个具有k个取值的名义变量,将变为k-1个虚拟变量。这样,有:
g ( x ) = β 0 + β 1 x 1 + . . . + Σ l - 1 k - 1 β jl D jl + β p x p ; - - - ( 1.4 )
定义不发生事件的条件概率为:
P ( Y = 0 | x ) = 1 - P ( Y = 1 | x ) = 1 - e g ( x ) 1 + e g ( x ) = 1 1 + e g ( x ) ; - - - ( 1.5 )
那么,事件发生与事件不发生的概率之比为:
P ( x = 1 | x ) P ( x = 0 | x ) = p 1 - p = e g ( x ) ; - - - ( 1.6 )
这个比值称为事件的发生比(the odds of experiencing an event),简称为odds。因为0<p<1,故odds>0。对odds取对数,即得到线性函数:
log ( p 1 - p ) = &beta; 0 + &beta; 1 x 1 + . . . + &Sigma; l - 1 k - 1 &beta; jl D jl + &beta; p x p ; - - - ( 1.7 )
将选取的模型变量,通过逻辑回归作模型拟合,运用公式(1.7),计算模型中每个变量的系数β。由此完成模型的建立,后续即可依据当前实际业务的模型变量输入该模型中,结合每个变量的系数β,计算每一保单的概率值P,即为该保单的业务流失估计分值。
进一步地,还可以对已建立的模型进行准确度验证。
依据拟合结果用公式(1.3)计算每一保单的得分,得分越高,预示保单流失可能性越大。并且选取正相关系数最高的前5个指标为影响保单流失的主要因素,制订挽留措施。
根据所有保单的得分结果,从高到低排序,结果可以如下表2所示:
表2
其中,
1、排名(百分比)=区间保单数/全量保单数; 
2、命中率=排名区间流失保单数/排名区间累积保单数;
3、覆盖率=排名区间流失保单数/全量流失保单数;
4、提升度=命中率/整体流失率。 
从上述表2可知,保单的平均流失率为13%,通过模型计算得分后,前15%的保单,流失保单的占比为43.7%,流失保单占整个流失保单的49.7%,即能识别50%的问题件,并提取得分高的影响因素,以便后台制定相应的攻关策略。
本实施例方案,基于寿险保单的关键因素、保单基本信息、客户信息、业务员信息、客户与公司动作关联信息等因素,精准预测保单期交保费可能性的高低,并在系统中给业务员对难度保单提供攻关方案。在不影响正常使用的情况下,系统可以极大预测识别出交费困难保单,并针对其影响因素提前与客户联系互动。这样减少了业务员在催收前对保单信息的收集,并能根据保单情况作重点催收,减少与客户互动的时间、频次等,从而节约的业务员时间,提高他们的工作效率。在降低保单流失量的同时,增加了公司保费收入,增强了客户保障。
如图4所示,本发明第一实施例提出一种业务数据处理装置,包括:数据获取模块401、分析提取模块402以及处理模块403,其中:
数据获取模块401,用于获取业务单据的属性指标数据;
分析提取模块402,用于对所述业务单据的属性指标数据进行分析,从中 提取模型变量;
处理模块403,用于将提取的所述模型变量输入预先建立的业务流失预测模型,得到对应业务单据的业务流失估计分值。
本发明实施例涉及的业务单据包括但不限于寿险系统的保单,还可以是其他业务相关的单据,本实施例以寿险系统的保单进行举例。
本实施例方案可以通过大数据挖掘,提前预测高可能流失保单,减少业务员在催收前对保单信息的收集,提高其工作效率,并可制订相应的攻关策略。
具体地,首先,获取业务单据的属性指标数据,其中,以保单为例,保单的属性指标数据可以考虑以下因素:
基于寿险保单的关键因素、保单基本信息、客户信息、业务员信息、客户与公司动作关联信息等。
其中,要先清晰地定义出业务问题,确定哪些保单是不能正常交费保单,即定义问题件。
寿险保单有多达近20种的属性状态,每一状态的业务含义都不一样,如D死亡理赔、E展期、I交费有效、L失效、P交清、S现金解约、Z人为停效、……。这些都是客户的交费情况、交费方式,以及未交费的种种形态的体现。因此,需要明确哪些是客户非正常渠道资费和不交费,即问题保单。
然后,为了从所有保单中识别出可能交费意愿困难的保单,需要多维度,尽可能全面的考虑影响因素,由此,需要获取业务单据的各个属性指标数据。主要包括:
保单关键信息:如自保件、考核月自保件、投诉情况、理赔情况等;
保单的基本信息:如保单险种、年度、在/离职单、保费等;
业务员信息:业务员的基本人口信息、二次达成率、品质情况、拥有的保单情况等;
投保人信息:投保人的基本人口信息、关系、婚姻状况等;
投保人与公司交互动作信息:最近某段时间是否做过部分领取、保单贷款、保单还款、领取红利等。
从业务场景分析,并考虑时间窗,尝试探索这些维度指标在某一段时间的表现,梳理衍生多个(比如80个)字段变量,如选取合适的时间段看客户 的保全动作,保全类型等。最后映射到对应的保单上,汇成最终的表格。
之后,对业务单据的属性指标数据进行分析,主要是研究数据的质量,以确定输入数据模型的变量。
优选地,对业务单据的属性指标数据进行分析,从中提取模型变量的步骤可以包括:
从多个维度,对所述业务单据的属性指标数据进行分析和整理,获取所述业务单据的若干字段变量;
以第一计算规则,对所述业务单据的若干字段变量进行初步筛选,得到初步筛选后的变量;
对初步筛选后的变量,以第二计算规则,计算每一变量的信息值IV,所述IV为反映每一变量的预测能力的指标;
获取IV大于或等于预设阈值的变量作为模型变量。
进一步地,还可以对获取的模型变量进行相关性检验,获取具有相关性的变量组中IV最大的模型变量作为最终的模型变量。
更为具体地,所述第一计算规则可以是:
数据分析包括计算单据各属性指标数据的最小值和最大值,计算平均偏差和标准偏差,以及查看数据的分布。
例如,通过查看最大值、最小值和平均值,可以确定数据并不能代表客户或业务流程,因此必须获取更多均衡数据或查看预期结果所依据的假定。
标准偏差和其他分发值可以提供有关结果的稳定性和准确性的有用信息。
为了进一步挑选具有很强预测能力的指标,将模型变量WOE编码方式离散化之后,运用logistic回归模型进行一种二分类变量的广义线性模型。模型变量WOE以及IV原理,为表述方便,本文将模型目标标量为1记为流失保单,对于目标变量为0记为正常交费保单;则WOE(weight of Evidence)其实就是自变量取某个值的时候对流失比例的一种影响。Woe公式如下:
woe i = ln ( P y 1 P y 0 ) = ln ( # B i / # B T # G i / # G T ) - - - ( 1.1 )
其中,Py1是目标变量为1的样本量占整体中为1的样本的比例;Py0是 目标变量为0的样本量占整体中为0的样本的比例;Bi为某区间自变量中为1的样本量,BT为自变量中1的样本量,Gi为某区间自变量中为0的样本量,GT为自变量中0的样本量。
例如,保费(pol_prem)分段如上表1所示:
通过表1可以看出,woe反映的是在自变量每个分组下,流失用户对正常用户占比和总体中流失用户对正常用户占比之间的差异;从而可以直观的认为woe蕴含了自变量取值对于目标变量(流失概率)的影响。再加上woe计算形式与logistic回归中目标变量的logistic转换(logist_p=ln(p/1-p))相似,因而可以将自变量woe值替代原先的自变量值;然后对iv求和(可以看成是对woe的加权求和),就得到IV(information value信息值),是衡量自变量对目标变量影响的指标之一。
IV值的计算如下:
IV i = ( # B i # B T - # G i # G T ) * ln ( # B i / # B T # G i / # G T ) IV = &Sigma; k - 0 n IV i - - - ( 1.2 ) ;
一般挑选IV值大于等于0.06的变量进入模型。
上述计算规则即为本实施例中所述的第二计算规则。
初步筛选完变量后,需要对变量间的关联紧密程度分析,即多个变量反应了同一状况,这个时候只需挑选一个就能反应这一类状况,因此要做变量相关性检验。计算变量间的相关系数,在相关系数高(相似度高的)的变量组中,挑选IV值较高的变量。
之后,将提取的模型变量输入预先建立的业务流失预测模型,得到对应业务单据的业务流失估计分值。
其中,预先建立的业务流失预测模型包含了模型变量与对应单据的业务流失估计分值的对应关系,后续将详细阐述业务流失预测模型的详细构建过程。
在实际应用中,在保单催收系统中,植入模型打分的机制,通过收集每月应收保单的模型变量,打分判断该保单不交费的可能性高低,并分类出其影响因素,如业务员品质原因、客户经济原因、客户与公司纠纷等等,根据每类原因,制订相就的攻关策略,并提供最佳实践案例,供业务员催收参考。
本实施例通过上述方案,采用多维度,多因素预测分析保单对应客户交费可能性的高低,可以在不增加任何成本的基础上,使业务员及早识别难交费的保单,并重点介入挽留,在提高工作效率的同时,大大提高了公司的保费收入,减少客户流失,为客户带来更好的保障。
如图5所示,本发明第二实施例提出一种业务数据处理装置,基于上述图4所示的实施例,还包括:
策略推送模块404,用于根据所述业务单据的业务流失估计分值,获取所述业务单据的流失影响因素,所述流失影响因素至少包括一种属性指标数据;根据所述业务单据的流失影响因素获取相应的攻关策略;将所述业务单据的业务流失估计分值、流失影响因素以及相应的攻关策略,推送给相关业务人员。
相比上述第一实施例,本实施例还包括根据业务单据的业务流失估计分值,获取相应的攻关策略推送给业务人员的处理方案。
具有地,在获取到业务单据的业务流失估计分值后,选取正相关系数最高的前N个(比如5个)指标为影响保单流失的主要因素,制订挽留措施,或者从本地数据库中获取相应的攻关策略,并将所述业务单据的业务流失估计分值、流失影响因素以及相应的攻关策略,推送给相关业务人员,以便业务人员根据保单情况作重点催收,降低与客户互动的时间、频次等。
本实施例通过上述方案,不仅可以精准预测保单期交保费可能性的高低,并给业务员对难度保单提供相应的攻关方案,在不影响正常使用的情况下,可以极大预测识别出交费困难保单,并针对其影响因素提前与客户联系互动,这样减少了业务员在催收前对保单信息的收集,并能根据保单情况作重点催收,降低与客户互动的时间、频次等,从而节约业务员时间,提高业务员的工作效率,在降低保单流失量的同时,增加了保费收入,增强了客户保障。
如图6所示,本发明第三实施例提出一种业务数据处理装置,基于上述图5所示的实施例,还包括:
模型构建模块400,用于构建所述业务流失预测模型,具体用于:
获取样本业务单据的属性指标数据;对所述样本业务单据的属性指标数 据进行分析,从中提取样本模型变量;获取所述样本业务单据的业务流失估计分值;根据所述样本模型变量,以及所述样本业务单据的业务流失估计分值,建立业务流失预测模型;
模型验证模块405,用于对所述业务流失预测模型进行验证。
相比上述各实施例,本实施例还包括构建业务流失预测模型的方案。
具体包括:
首先,获取样本业务单据的属性指标数据。
其中,样本业务单据的业务流失估计分值已预先得知。
预先收集样本业务单据的属性指标数据,其中,以保单为例,保单的属性指标数据可以考虑以下因素:
基于寿险保单的关键因素、保单基本信息、客户信息、业务员信息、客户与公司动作关联信息等。
其中,要先清晰地定义出业务问题,确定哪些保单是不能正常交费保单,即定义问题件。
寿险保单有多达近20种的属性状态,每一状态的业务含义都不一样,如D死亡理赔、E展期、I交费有效、L失效、P交清、S现金解约、Z人为停效、……。这些都是客户的交费情况、交费方式,以及未交费的种种形态的体现。因此,需要明确哪些是客户非正常渠道资费和不交费,即问题保单。
然后,为了从所有保单中识别出可能交费意愿困难的保单,需要多维度,尽可能全面的考虑影响因素,由此,需要获取业务单据的各个属性指标数据。主要包括:
保单关键信息:如自保件、考核月自保件、投诉情况、理赔情况等;
保单的基本信息:如保单险种、年度、在/离职单、保费等;
业务员信息:业务员的基本人口信息、二次达成率、品质情况、拥有的保单情况等;
投保人信息:投保人的基本人口信息、关系、婚姻状况等;
投保人与公司交互动作信息:最近某段时间是否做过部分领取、保单贷款、保单还款、领取红利等。
从业务场景分析,并考虑时间窗,尝试探索这些维度指标在某一段时间 的表现,梳理衍生多个(比如80个)字段变量,如选取合适的时间段看客户的保全动作,保全类型等。最后映射到对应的保单上,汇成最终的表格。
然后,对所述样本业务单据的属性指标数据进行分析,从中提取样本模型变量。
之后,获取所述样本业务单据的业务流失估计分值;根据所述样本模型变量,以及所述样本业务单据的业务流失估计分值,建立业务流失预测模型。
更为具体地,其中,数据分析包括计算单据各属性指标数据的最小值和最大值,计算平均偏差和标准偏差,以及查看数据的分布。
例如,通过查看最大值、最小值和平均值,可以确定数据并不能代表客户或业务流程,因此必须获取更多均衡数据或查看预期结果所依据的假定。
标准偏差和其他分发值可以提供有关结果的稳定性和准确性的有用信息。大型标准偏差可以指示添加更多数据以帮助改进模型。与标准分发偏差很大的数据可能已被扭曲,抑或准确反映了现实问题,但很难使模型适合数据。
为了进一步挑选具有很强预测能力的指标,将模型变量WOE编码方式离散化之后,运用logistic回归模型进行一种二分类变量的广义线性模型。模型变量WOE以及IV原理,为表述方便,本文将模型目标标量为1记为流失保单,对于目标变量为0记为正常交费保单;则WOE(weight of Evidence)其实就是自变量取某个值的时候对流失比例的一种影响。Woe公式如下:
woe i = ln ( P y 1 P y 0 ) = ln ( # B i / # B T # G i / # G T ) - - - ( 1.1 ) ;
其中,Py1是目标变量为1的样本量占整体中为1的样本的比例;Py0是目标变量为0的样本量占整体中为0的样本的比例;Bi为某区间自变量中为1的样本量,BT为自变量中1的样本量,Gi为某区间自变量中为0的样本量,GT为自变量中0的样本量。
例如,保费(pol_prem)分段如上表1所示:
通过表1可以看出,woe反映的是在自变量每个分组下,流失用户对正常用户占比和总体中流失用户对正常用户占比之间的差异;从而可以直观的认为woe蕴含了自变量取值对于目标变量(流失概率)的影响。再加上woe计算形式与logistic回归中目标变量的logistic转换(logist_p=ln(p/1-p))相似,因 而可以将自变量woe值替代原先的自变量值;然后对iv求和(可以看成是对woe的加权求和),就得到IV(information value信息值),是衡量自变量对目标变量影响的指标之一。
IV值的计算如下:
IV i = ( # B i # B T - # G i # G T ) * ln ( # B i / # B T # G i / # G T ) IV = &Sigma; k - 0 n IV i - - - ( 1.2 ) ;
一般挑选IV值大于或等于0.06(当然,该值还可以灵活设置)的变量进入模型。
初步筛选完变量后,需要对变量间的关联紧密程度分析,即多个变量反应了同一状况,这个时候只需挑选一个就能反应这一类状况,因此要做变量相关性检验。计算变量间的相关系数,在相关系数高(相似度高的)的变量组中,挑选IV值较高的变量。
之后构建模型,具体计算过程如下:
Logit模型的应用广泛性的原因主要是因为其概率表达式的显性特点,模型的求解速度快,应用方便。当模型选择集没有发生变化,而仅仅是当各变量的水平发生变化时(如出行时间发生变化),可以方便的求解各选择枝在新环境下的各选择枝的被选概率。
首先,考虑具有p个独立变量的向量x′=(x1,x2,…xp),设条件概率P(Y=1|x)=p为根据观测量相对于某事件发生的概率。逻辑回归模型可表示为:
P ( Y = 1 | x ) = &pi; ( x ) = 1 1 + e - g ( x ) ; - - - ( 1.3 )
上式右侧形式的函数称为逻辑函数。
其中,g(x)=β01x12x2+…+βpxp;(β0常规数值,β1、β2、β3、……、βp为p个变量的拟合系数)。如果含有名义变量,则将其变为虚拟变量。一个具有k个取值的名义变量,将变为k-1个虚拟变量。这样,有:
g ( x ) = &beta; 0 + &beta; 1 x 1 + . . . + &Sigma; l - 1 k - 1 &beta; jl D jl + &beta; p x p ; - - - ( 1.4 )
定义不发生事件的条件概率为:
P ( Y = 0 | x ) = 1 - P ( Y = 1 | x ) = 1 - e g ( x ) 1 + e g ( x ) = 1 1 + e g ( x ) ; - - - ( 1.5 )
那么,事件发生与事件不发生的概率之比为:
P ( x = 1 | x ) P ( x = 0 | x ) = p 1 - p = e g ( x ) ; - - - ( 1.6 )
这个比值称为事件的发生比(the odds of experiencing an event),简称为odds。因为0<p<1,故odds>0。对odds取对数,即得到线性函数:
log ( p 1 - p ) = &beta; 0 + &beta; 1 x 1 + . . . + &Sigma; l - 1 k - 1 &beta; jl D jl + &beta; p x p ; - - - ( 1.7 )
将选取的模型变量,通过逻辑回归作模型拟合,运用公式(1.7),计算模型中每个变量的系数β。由此完成模型的建立,后续即可依据当前实际业务的模型变量输入该模型中,结合每个变量的系数β,计算每一保单的概率值P,即为该保单的业务流失估计分值。
进一步地,还可以对已建立的模型进行准确度验证。
依据拟合结果用公式(1.3)计算每一保单的得分,得分越高,预示保单流失可能性越大。并且选取正相关系数最高的前5个指标为影响保单流失的主要因素,制订挽留措施。
根据所有保单的得分结果,从高到低排序,结果可以如上表2所示,其中:
1、排名(百分比)=区间保单数/全量保单数; 
2、命中率=排名区间流失保单数/排名区间累积保单数;
3、覆盖率=排名区间流失保单数/全量流失保单数;
4、提升度=命中率/整体流失率。 
从上述表2可知,保单的平均流失率为13%,通过模型计算得分后,前15%的保单,流失保单的占比为43.7%,流失保单占整个流失保单的49.7%,即能识别50%的问题件,并提取得分高的影响因素,以便后台制定相应的攻关策略。
本实施例方案,基于寿险保单的关键因素、保单基本信息、客户信息、业务员信息、客户与公司动作关联信息等因素,精准预测保单期交保费可能性的高低,并在系统中给业务员对难度保单提供攻关方案。在不影响正常使 用的情况下,系统可以极大预测识别出交费困难保单,并针对其影响因素提前与客户联系互动。这样减少了业务员在催收前对保单信息的收集,并能根据保单情况作重点催收,减少与客户互动的时间、频次等,从而节约的业务员时间,提高他们的工作效率。在降低保单流失量的同时,增加了公司保费收入,增强了客户保障。
以上所述仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或流程变换,或直接或间接运用在其它相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种业务数据处理方法,其特征在于,包括:
获取业务单据的属性指标数据;
对所述业务单据的属性指标数据进行分析,从中提取模型变量;
将提取的所述模型变量输入预先建立的业务流失预测模型,得到对应业务单据的业务流失估计分值。
2.根据权利要求1所述的方法,其特征在于,还包括:
根据所述业务单据的业务流失估计分值,获取所述业务单据的流失影响因素,所述流失影响因素至少包括一种属性指标数据;
根据所述业务单据的流失影响因素获取相应的攻关策略;
将所述业务单据的业务流失估计分值、流失影响因素以及相应的攻关策略,推送给相关业务人员。
3.根据权利要求1所述的方法,其特征在于,所述对业务单据的属性指标数据进行分析,从中提取模型变量的步骤包括:
从多个维度,对所述业务单据的属性指标数据进行分析和整理,获取所述业务单据的若干字段变量;
以第一计算规则,对所述业务单据的若干字段变量进行初步筛选,得到初步筛选后的变量;
对初步筛选后的变量,以第二计算规则,计算每一变量的信息值IV,所述IV为反映每一变量的预测能力的指标;
获取IV大于或等于预设阈值的变量作为模型变量。
4.根据权利要求3所述的方法,其特征在于,所述获取IV大于或等于预设阈值的变量作为模型变量的步骤之后还包括:
对获取的模型变量进行相关性检验,获取具有相关性的变量组中IV最大的模型变量作为最终的模型变量。
5.根据权利要求1-4中任一项所述的方法,其特征在于,所述获取业务单据的属性指标数据的步骤之前还包括:
构建所述业务流失预测模型,具体包括:
获取样本业务单据的属性指标数据;
对所述样本业务单据的属性指标数据进行分析,从中提取样本模型变量;
获取所述样本业务单据的业务流失估计分值;
根据所述样本模型变量,以及所述样本业务单据的业务流失估计分值,建立业务流失预测模型。
6.根据权利要求5所述的方法,其特征在于,还包括:
对所述业务流失预测模型进行验证。
7.一种业务数据处理装置,其特征在于,包括:
数据获取模块,用于获取业务单据的属性指标数据;
分析提取模块,用于对所述业务单据的属性指标数据进行分析,从中提取模型变量;
处理模块,用于将提取的所述模型变量输入预先建立的业务流失预测模型,得到对应业务单据的业务流失估计分值。
8.根据权利要求7所述的装置,其特征在于,还包括:
策略推送模块,用于根据所述业务单据的业务流失估计分值,获取所述业务单据的流失影响因素,所述流失影响因素至少包括一种属性指标数据;根据所述业务单据的流失影响因素获取相应的攻关策略;将所述业务单据的业务流失估计分值、流失影响因素以及相应的攻关策略,推送给相关业务人员。
9.根据权利要求7所述的装置,其特征在于,
所述分析提取模块,还用于从多个维度,对所述业务单据的属性指标数据进行分析和整理,获取所述业务单据的若干字段变量;以第一计算规则,对所述业务单据的若干字段变量进行初步筛选,得到初步筛选后的变量;对初步筛选后的变量,以第二计算规则,计算每一变量的信息值IV,所述IV为反映每一变量的预测能力的指标;获取IV大于或等于预设阈值的变量作为模型变量;
所述分析提取模块,进一步还用于对获取的模型变量进行相关性检验,获取具有相关性的变量组中IV最大的模型变量作为最终的模型变量。
10.根据权利要求7、8或9所述的装置,其特征在于,还包括:
模型构建模块,用于构建所述业务流失预测模型,具体用于:
获取样本业务单据的属性指标数据;对所述样本业务单据的属性指标数据进行分析,从中提取样本模型变量;获取所述样本业务单据的业务流失估计分值;根据所述样本模型变量,以及所述样本业务单据的业务流失估计分值,建立业务流失预测模型;
模型验证模块,用于对所述业务流失预测模型进行验证。
CN201410822312.0A 2014-12-25 2014-12-25 业务数据处理方法及装置 Active CN104834983B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410822312.0A CN104834983B (zh) 2014-12-25 2014-12-25 业务数据处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410822312.0A CN104834983B (zh) 2014-12-25 2014-12-25 业务数据处理方法及装置

Publications (2)

Publication Number Publication Date
CN104834983A true CN104834983A (zh) 2015-08-12
CN104834983B CN104834983B (zh) 2018-05-04

Family

ID=53812857

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410822312.0A Active CN104834983B (zh) 2014-12-25 2014-12-25 业务数据处理方法及装置

Country Status (1)

Country Link
CN (1) CN104834983B (zh)

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106447498A (zh) * 2016-03-29 2017-02-22 平安科技(深圳)有限公司 保单垫付方法、装置和系统
CN106600414A (zh) * 2015-10-19 2017-04-26 阿里巴巴集团控股有限公司 一种业务处理方法和装置
WO2017107794A1 (zh) * 2015-12-22 2017-06-29 阿里巴巴集团控股有限公司 风险识别方法及装置
CN107230152A (zh) * 2016-03-24 2017-10-03 平安科技(深圳)有限公司 保单续期收费的提醒方法和装置
CN107292579A (zh) * 2016-04-13 2017-10-24 平安科技(深圳)有限公司 保单保全处理方法和装置
CN107679686A (zh) * 2017-08-28 2018-02-09 阿里巴巴集团控股有限公司 一种业务执行方法及装置
CN108074191A (zh) * 2016-11-14 2018-05-25 平安科技(深圳)有限公司 数据处理的方法及装置
CN108182638A (zh) * 2018-01-31 2018-06-19 泰康保险集团股份有限公司 保单流失的分析方法及装置
CN108257018A (zh) * 2017-03-17 2018-07-06 平安科技(深圳)有限公司 再保系统的检测报告生成方法和装置
CN108549973A (zh) * 2018-03-22 2018-09-18 中国平安人寿保险股份有限公司 识别模型构建及评估的方法、装置、存储介质及终端
WO2019041748A1 (zh) * 2017-08-30 2019-03-07 平安科技(深圳)有限公司 一种保单数据处理方法、装置、电子设备及介质
CN109918645A (zh) * 2019-01-28 2019-06-21 平安科技(深圳)有限公司 深度分析文本的方法、装置、计算机设备和存储介质
CN111401329A (zh) * 2020-04-26 2020-07-10 北京新致君阳信息技术有限公司 信息流向识别方法、装置、设备和存储介质
CN111724185A (zh) * 2019-03-21 2020-09-29 北京沃东天骏信息技术有限公司 用户维护方法和装置
CN113380407A (zh) * 2021-05-30 2021-09-10 重庆医科大学 构建认知障碍智能预测方法
CN116522102A (zh) * 2023-05-17 2023-08-01 联洋国融(北京)科技有限公司 基于隐私计算动态调整意外险模型数据库的方法及装置

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060136273A1 (en) * 2004-09-10 2006-06-22 Frank Zizzamia Method and system for estimating insurance loss reserves and confidence intervals using insurance policy and claim level detail predictive modeling
JP2007179494A (ja) * 2005-12-28 2007-07-12 Nippon Digital Kenkyusho:Kk データ管理装置、データ管理方法、データ管理プログラム
CN101620692A (zh) * 2008-06-30 2010-01-06 上海全成通信技术有限公司 一种移动通信业务的客户流失分析方法
US20110161245A1 (en) * 2005-11-03 2011-06-30 Equitynet, Llc Electronic System for Analyzing the Risk of an Enterprise
CN102156932A (zh) * 2010-02-11 2011-08-17 阿里巴巴集团控股有限公司 一种客户再次购买意向预测方法及装置
CN102385602A (zh) * 2010-09-03 2012-03-21 阿里巴巴集团控股有限公司 一种获得访客交易意向数据的方法及装置
CN102567807A (zh) * 2010-12-23 2012-07-11 上海亚太计算机信息系统有限公司 加油卡客户流失预测方法
US20130035964A1 (en) * 2009-11-23 2013-02-07 Hartford Fire Insurance Company System and method for data processing for term life insurance policies issued before comprehensive underwriting
CN103093280A (zh) * 2011-10-31 2013-05-08 铭传大学 信用违约预测方法与装置

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060136273A1 (en) * 2004-09-10 2006-06-22 Frank Zizzamia Method and system for estimating insurance loss reserves and confidence intervals using insurance policy and claim level detail predictive modeling
US20110161245A1 (en) * 2005-11-03 2011-06-30 Equitynet, Llc Electronic System for Analyzing the Risk of an Enterprise
JP2007179494A (ja) * 2005-12-28 2007-07-12 Nippon Digital Kenkyusho:Kk データ管理装置、データ管理方法、データ管理プログラム
CN101620692A (zh) * 2008-06-30 2010-01-06 上海全成通信技术有限公司 一种移动通信业务的客户流失分析方法
US20130035964A1 (en) * 2009-11-23 2013-02-07 Hartford Fire Insurance Company System and method for data processing for term life insurance policies issued before comprehensive underwriting
CN102156932A (zh) * 2010-02-11 2011-08-17 阿里巴巴集团控股有限公司 一种客户再次购买意向预测方法及装置
CN102385602A (zh) * 2010-09-03 2012-03-21 阿里巴巴集团控股有限公司 一种获得访客交易意向数据的方法及装置
CN102567807A (zh) * 2010-12-23 2012-07-11 上海亚太计算机信息系统有限公司 加油卡客户流失预测方法
CN103093280A (zh) * 2011-10-31 2013-05-08 铭传大学 信用违约预测方法与装置

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106600414A (zh) * 2015-10-19 2017-04-26 阿里巴巴集团控股有限公司 一种业务处理方法和装置
WO2017107794A1 (zh) * 2015-12-22 2017-06-29 阿里巴巴集团控股有限公司 风险识别方法及装置
CN106910078A (zh) * 2015-12-22 2017-06-30 阿里巴巴集团控股有限公司 风险识别方法及装置
CN107230152A (zh) * 2016-03-24 2017-10-03 平安科技(深圳)有限公司 保单续期收费的提醒方法和装置
CN106447498A (zh) * 2016-03-29 2017-02-22 平安科技(深圳)有限公司 保单垫付方法、装置和系统
CN107292579A (zh) * 2016-04-13 2017-10-24 平安科技(深圳)有限公司 保单保全处理方法和装置
CN108074191A (zh) * 2016-11-14 2018-05-25 平安科技(深圳)有限公司 数据处理的方法及装置
CN108257018A (zh) * 2017-03-17 2018-07-06 平安科技(深圳)有限公司 再保系统的检测报告生成方法和装置
CN107679686B (zh) * 2017-08-28 2024-03-29 创新先进技术有限公司 一种业务执行方法及装置
CN107679686A (zh) * 2017-08-28 2018-02-09 阿里巴巴集团控股有限公司 一种业务执行方法及装置
WO2019041748A1 (zh) * 2017-08-30 2019-03-07 平安科技(深圳)有限公司 一种保单数据处理方法、装置、电子设备及介质
CN108182638A (zh) * 2018-01-31 2018-06-19 泰康保险集团股份有限公司 保单流失的分析方法及装置
CN108549973A (zh) * 2018-03-22 2018-09-18 中国平安人寿保险股份有限公司 识别模型构建及评估的方法、装置、存储介质及终端
CN108549973B (zh) * 2018-03-22 2022-07-19 中国平安人寿保险股份有限公司 识别模型构建及评估的方法、装置、存储介质及终端
CN109918645B (zh) * 2019-01-28 2022-12-02 平安科技(深圳)有限公司 深度分析文本的方法、装置、计算机设备和存储介质
CN109918645A (zh) * 2019-01-28 2019-06-21 平安科技(深圳)有限公司 深度分析文本的方法、装置、计算机设备和存储介质
CN111724185A (zh) * 2019-03-21 2020-09-29 北京沃东天骏信息技术有限公司 用户维护方法和装置
CN111401329A (zh) * 2020-04-26 2020-07-10 北京新致君阳信息技术有限公司 信息流向识别方法、装置、设备和存储介质
CN111401329B (zh) * 2020-04-26 2021-10-29 北京新致君阳信息技术有限公司 信息流向识别方法、装置、设备和存储介质
CN113380407A (zh) * 2021-05-30 2021-09-10 重庆医科大学 构建认知障碍智能预测方法
CN116522102A (zh) * 2023-05-17 2023-08-01 联洋国融(北京)科技有限公司 基于隐私计算动态调整意外险模型数据库的方法及装置

Also Published As

Publication number Publication date
CN104834983B (zh) 2018-05-04

Similar Documents

Publication Publication Date Title
CN104834983A (zh) 业务数据处理方法及装置
Hu et al. Network-based modeling and analysis of systemic risk in banking systems
Ni et al. Using social media to predict traffic flow under special event conditions
Lee et al. Redlistr: tools for the IUCN Red Lists of ecosystems and threatened species in R
CN103370722B (zh) 通过小波和非线性动力学预测实际波动率的系统和方法
CN108062674B (zh) 基于gps的订单欺诈识别方法、系统、存储介质和电子设备
US20210035224A1 (en) Applying Telematics to Generate Dynamic Insurance Premiums
Sayarshad et al. Survey and empirical evaluation of nonhomogeneous arrival process models with taxi data
US20210311980A1 (en) System to determine a credibility weighting for electronic records
CN111127178A (zh) 数据处理方法与装置、存储介质、电子设备
CN101236638A (zh) 一种基于Web的银行卡风险监测方法及系统
CN111178675A (zh) 基于LR-Bagging算法的电费回收风险预测方法、系统、存储介质及计算机设备
CN110532301B (zh) 审计方法、系统和可读存储介质
US20140289007A1 (en) Scenario based customer lifetime value determination
CN109345109A (zh) 一种基于分类预测模型的员工评估方法及终端设备
Mills et al. The economy-energy-environment Nexus in IMF’s Top 2 biggest economies: a TY approach
CN113256324A (zh) 数据资产定价方法、装置、计算机设备和存储介质
CN106713267A (zh) 一种网络安全评估方法及系统
CN112419030B (zh) 财务舞弊风险评估的方法、系统及设备
CN108961037B (zh) 一种基于对车辆使用情况评估算法的车辆贷款风控方法及装置
WO2022165152A1 (en) Constructing a statistical model and evaluating model performance
WO2022015496A1 (en) Applying telematics to generate dynamic insurance premiums
CN108959596B (zh) 一种公交阶梯票价预测方法
WO2022015488A1 (en) Event-driven model refinement for insurance and risk management
CN113298637A (zh) 业务平台的用户导流方法、装置和系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
EXSB Decision made by sipo to initiate substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant