CN112767177A - 基于随机森林进行客户等级划分的保险客户信息管理系统 - Google Patents

基于随机森林进行客户等级划分的保险客户信息管理系统 Download PDF

Info

Publication number
CN112767177A
CN112767177A CN202011605935.4A CN202011605935A CN112767177A CN 112767177 A CN112767177 A CN 112767177A CN 202011605935 A CN202011605935 A CN 202011605935A CN 112767177 A CN112767177 A CN 112767177A
Authority
CN
China
Prior art keywords
customer
insurance
random forest
importance
client
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011605935.4A
Other languages
English (en)
Inventor
程思洲
叶积平
林志鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Data Center of China Life Insurance Co Ltd
Original Assignee
Shanghai Data Center of China Life Insurance Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Data Center of China Life Insurance Co Ltd filed Critical Shanghai Data Center of China Life Insurance Co Ltd
Priority to CN202011605935.4A priority Critical patent/CN112767177A/zh
Publication of CN112767177A publication Critical patent/CN112767177A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/08Insurance

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • Evolutionary Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Educational Administration (AREA)
  • General Business, Economics & Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Marketing (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Game Theory and Decision Science (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Technology Law (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种基于随机森林进行客户等级划分的保险客户信息管理系统,包括通讯录子模块和展业工具子模块,通讯录子模块显示有客户的基本个人信息、保单信息和客户等级,展业工具子模块包括多个业务功能单元;客户等级的确定包括以下步骤:从基本个人信息和保单信息中获取多个客户特征;基于多个客户特征构建随机森林;计算每个客户特征在整个随机森林的重要度;根据客户特征的重要度对客户特征进行排序,从而筛选出部分客户特征作为客户指标;根据客户指标,通过预先建立的客户等级模型,获取每个客户的评分,确定每个客户的客户等级。与现有技术相比,本发明具有对客户等级的确定更加高效全面、有利于提升工作效率和质量等优点。

Description

基于随机森林进行客户等级划分的保险客户信息管理系统
技术领域
本发明涉及保险客户信息管理领域,尤其是涉及基于随机森林进行客户等级划分的保险客户信息管理系统。
背景技术
对保险客户的经营活动是保险销售的重要一环,保险销售人员通过互联网拉近与潜在客户之间的距离,推销产品、提供保全和理赔服务,并持续保持与客户的密切联系。
当前市面上的保险客户经营管理系统,大部分缺乏对于营销员客户的合理分类和对于营销员活动的全流程引导,仅仅提供了客户的基本信息,没有针对性的分类、整理和建议。销售人员难以对不同类型的客户开展不同类型的展业活动,既缺乏对过往的客户经营情况进行的统计和存量数据分析,也缺乏对未来客养活动进行的分类规划设计。
部分系统尽管对客户进行了粗糙的分类,但主要依赖于专家经验,缺乏坚实的数理基础。专家经验是一种人工抉择的过程,只能根据历史经验进行统计和提炼,很难量化出分类特征的重要度。随着所采集的客户特征越来越多,要从海量特征中找出可能的指标,通过专家经验筛选过程需要耗费极大人力和资源。
发明内容
本发明的目的就是为了克服上述现有技术存在难以对不同类型的客户开展不同类型的展业活动,对客户的分类需要耗费极大人力和资源的缺陷而提供一种基于随机森林进行客户等级划分的保险客户信息管理系统。
本发明的目的可以通过以下技术方案来实现:
一种基于随机森林进行客户等级划分的保险客户信息管理系统,包括通讯录子模块和展业工具子模块,所述通讯录子模块显示有客户的基本个人信息、保单信息和客户等级,所述展业工具子模块包括多个业务功能单元;
所述客户等级的确定包括以下步骤:
从所述基本个人信息和保单信息中获取多个客户特征;
基于所述多个客户特征构建随机森林;
计算每个所述客户特征在整个所述随机森林的重要度;
根据所述客户特征的重要度对客户特征进行排序,从而筛选出部分客户特征作为客户指标;
根据所述客户指标,通过预先建立的客户等级模型,获取每个客户的评分,确定每个客户的客户等级。
进一步地,所述客户特征包括基本个人信息、保单类型、年缴金额、购买险种、累计保费和累计保额。
进一步地,所述多个业务功能单元包括电子优惠券发送单元、电子贺卡发送单元、保险产品图示单元和电子计划书单元。
进一步地,所述客户特征在整个所述随机森林的重要度的计算包括:
计算该客户特征在每个决策树各节点处的重要度;
分别在该客户特征的各个决策树中将该客户特征各节点处的重要度累加,计算各个决策树的重要度;
将各个决策树的重要度累加,计算该客户特征在整个随机森林的重要度。
进一步地,所述每个客户的评分的获取具体为:
根据客户的基本个人信息和保单信息,计算该客户的各个客户指标的评分,基于客户指标的重要度,确定各个客户指标的权重,将各个客户指标的评分和权重相乘,获得每个客户的评分。
进一步地,根据预设的等级划分区间,基于每个客户的评分,确定每个客户的客户等级。
进一步地,所述保险客户信息管理系统还包括概览子模块,分类显示了某保险营销员的客户数量和每月的拜访情况。
进一步地,所述保险客户信息管理系统还包括行事日历子模块,以日历的形式显示了过往对客户的拜访记录和对未来客户的拜访计划。
进一步地,所述保险客户信息管理系统还包括排行榜子模块,统计汇总拜访签到数据库中,保险营销员所在团队中所有保险营销员在多个时间维度里的拜访签到次数,以排行榜的形式列表展示。
进一步地,所述多个时间维度包括昨日、本周、本月、上月和本季。
与现有技术相比,本发明具有以下优点:
本发明提出的基于随机森林进行客户等级划分的保险客户信息管理系统,包括通讯录子模块和展业工具子模块,通讯录子模块显示有客户的基本个人信息、保单信息和客户等级,便于工作人员快速了解客户的基本情况,并且给出客户等级,提供直观的参考依据,设有展业工具子模块,工作人员能根据客户的基本情况方便地选择展业工具,有利于提升工作效率和质量;
客户等级的获取中,采用基于随机森林进行客户指标筛选的方式,从海量指标中筛选出与保险展业最相关的特征以及相关权重,并根据筛选后的保险客户指标进行加权计算,根据分值来划分客户等级;相对于传统的专家判断,选择的指标更全面,且量化出了分类特征的重要度;
基于客户分类开展保险营销活动,根据不同等级的客户进行不同类型的展业活动,并针对性地组合了一系列的保险客户经营相关的子模块,相对于传统营销辅助系统更个性化更高效。
附图说明
图1为本发明实施例中客户等级的确定流程示意图;
图2为本发明实施例中构建随机森林的流程示意图;
图3为本发明实施例中基于随机森林的客户指标筛选流程示意图。
具体实施方式
下面结合附图和具体实施例对本发明进行详细说明。本实施例以本发明技术方案为前提进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。
实施例1
本实施例提供一种基于随机森林进行客户等级划分的保险客户信息管理系统,包括通讯录子模块和展业工具子模块,通讯录子模块显示有客户的基本个人信息、保单信息和客户等级,展业工具子模块包括多个业务功能单元;
客户等级的确定包括以下步骤:
从基本个人信息和保单信息中获取多个客户特征;
基于多个客户特征构建随机森林;
计算每个客户特征在整个随机森林的重要度;
根据客户特征的重要度对客户特征进行排序,从而筛选出部分客户特征作为客户指标;
根据客户指标,通过预先建立的客户等级模型,获取每个客户的评分,确定每个客户的客户等级。
作为一种优选的实施方式,客户特征包括基本个人信息、保单类型、年缴金额、购买险种、累计保费和累计保额。
作为一种优选的实施方式,多个业务功能单元包括电子优惠券发送单元、电子贺卡发送单元、保险产品图示单元和电子计划书单元。
作为一种优选的实施方式,客户特征在整个随机森林的重要度的计算包括:
计算该客户特征在每个决策树各节点处的重要度;
分别在该客户特征的各个决策树中将该客户特征各节点处的重要度累加,计算各个决策树的重要度;
将各个决策树的重要度累加,计算该客户特征在整个随机森林的重要度。
作为一种优选的实施方式,每个客户的评分的获取具体为:
根据客户的基本个人信息和保单信息,计算该客户的各个客户指标的评分,基于客户指标的重要度,确定各个客户指标的权重,将各个客户指标的评分和权重相乘,获得每个客户的评分。
作为一种优选的实施方式,根据预设的等级划分区间,基于每个客户的评分,确定每个客户的客户等级。
作为一种优选的实施方式,保险客户信息管理系统还包括概览子模块,分类显示了某保险营销员的客户数量和每月的拜访情况。
作为一种优选的实施方式,保险客户信息管理系统还包括行事日历子模块,以日历的形式显示了过往对客户的拜访记录和对未来客户的拜访计划。
作为一种优选的实施方式,保险客户信息管理系统还包括排行榜子模块,统计汇总拜访签到数据库中,保险营销员所在团队中所有保险营销员在多个时间维度里的拜访签到次数,以排行榜的形式列表展示。
作为一种优选的实施方式,多个时间维度包括昨日、本周、本月、上月和本季。
将上述优选的实施方式进行组合可以得到一种最优的实施方式,下面对该最优的实施方式进行描述。
一种基于随机森林进行客户等级划分的保险客户信息管理系统,包括概览子模块、行事日历子模块、通讯录子模块、展业工具子模块和排行榜子模块。
下面对各子模块进行详细描述。
1、通讯录子模块
通讯录子模块显示有客户的基本个人信息、保单信息和客户等级,本实施例中通讯录子模块列表形式显示了营销员客户的个人详细信息,包括手机、性别、出生日期、收入、房产、购车、婚姻、职业等,以及保单信息和客户等级,保险客户信息管理系统通过采集与客户相关联的各种客户数据作为评估客户等级的指标并将其应用于一个评估模型来获得该客户的评分,进而判断出所述客户的经营等级。客户指标可以包括例如客户特性(例如年龄、性别、住址等)、职业(所属公司、职位、在职时间、收入等等)、业务类型(例如交易类型、资金流向等)以及其他各种指标。
所述客户等级的确定包括以下步骤:
S110:从各个数据源收集不同维度的客户特征数据。例如,可以从客户购买保险时的营销员签到位置获得客户的位置、从过往投保纪录中获得客户的已投保额信息等。这些客户特征数据中有些客户特征数据与客户经营等级密切相关,例如交易类型、已购保额等等,而有些客户特征数据却不太相关,例如位置和地址,所述不相关的客户特征数据对客户经营等级影响甚微。因此,需要对这些不同维度的客户特征数据进行筛选以选择出最能区分用户的特征。
S120:从大量客户特征数据中筛选出一些特征作为分类指标1,2,……,N。
S130:基于所述筛选出的经营指标1,2,……,N,通过客户经营等级模型分别计算出与之相对应的经营指标评分,例如经营指标1的评分S1、经营指标2的评分S2、……、经营指标N的评分SN。
S140:对所有计算出的经营指标评分进行加权求和以计算出该客户的经营等级总评分。基于所述总评分就可以评估出该客户的经营等级。其中,每个经营指标评分在总评分中的权重是由专家利用其人工经验来指定的,例如,已购保单类型、年收入等客户数据可以被分配高权重。或者,在确定了该客户的经营等级总评分之后,还可以通过将该总评分与一客户经营等级分类表中所设定的等级阈值范围相比较来确定该客户的对应等级。
具体地,步骤S120中,本实施例提出了一种基于随机森林对客户指标进行筛选的机制。通过对用户的特征集构建随机森林来筛选出最能区分用户风险的特征子集,以作为风险指标,可以清楚地指示出客户风险指标的重要度。
随机森林是一种利用多棵树对样本进行训练并预测的分类器,也即一种包含多棵决策树的机器学习分类算法,并且其输出的类别是由个别树输出的类别的众数而定。
其中,如图2所示,可以根据下列流程来建造随机森林中的每棵决策树:
S210:用n来表示训练用例(样本)的个数,M表示特征数目;
S220:从n个训练用例(样本)中以有放回抽样的方式,取样n次,形成一个训练集(即bootstrap取样),并用未抽到的用例(样本)作预测,评估其误差;
S230:在决策树(树分类器)形成过程中,对于每一个节点,随机选择r个特征,其中r应远小于M,然后从这r个特征中采用某种策略(如信息增益、信息增益率、基尼指数等等)来选择一个特征,作为该节点的分裂属性以进行树分类,一直到不能再分裂为止,注意整个决策树形成过程中没有剪枝;
4)按步骤S220-230建立大量决策树,如此形成随机森林,即步骤S240。
在随机森林中的决策树的主要工作就是选取特征对数据集进行划分,最后把数据贴上两类不同的标签。一个决策树相当于一个专家,通过自己在数据集中学到的知识对于新的数据进行分类。随机森林就是希望通过构建多棵决策树,使得最终的分类效果能够超过单个专家的一种算法。
基于上述流程,可以理解随机森林的构建主要涉及两个方面:1、数据的随机性选取;2、待选特征的随机选取。
1、数据的随机性选取;
首先,从原始的数据集中采取有放回的抽样,构造子数据集,子数据集的数据量是和原始数据集相同的。不同子数据集的元素可以重复,同一个子数据集中的元素也可以重复。第二,利用子数据集来构建子决策树,将这个数据放到每个子决策树中,每个子决策树输出一个结果。最后,如果有了新的数据需要通过随机森林得到分类结果,就可以通过对子决策树的判断结果的投票,得到随机森林的输出结果。假设随机森林中有3棵子决策树,2棵子树的分类结果是A类,1棵子树的分类结果是B类,那么随机森林的分类结果就是A类。
2、待选特征的随机选取
与数据集的随机选取类似,随机森林中的子树的每一个分裂过程并未用到所有的待选特征,而是从所有的待选特征中随机选取一定的特征,之后再在随机选取的特征中选取最优的特征。这样能够使得随机森林中的决策树都能够彼此不同,提升系统的多样性,从而提升分类性能。在分裂时,最优特征的选取可以采用下述算法:ID3算法(J.Ross Quinlan于1986年提出)采用信息增益最大的特征;C4.5算法(J.Ross Quinlan于1993年提出)采用信息增益比选择特征;CART算法(Breiman等人于1984年提出)利用基尼指数最小化准则等等。
构建“随机森林”的目的通常是用于分类,即通过在其中的决策树中进行投票汇总以决定样本的最终分类。通过研究“随机森林”的构建过程中的特点和算法,本公开的方案利用了“随机森林”中的部分特点和算法来计算出客户特征的重要度,从而根据重要度对所述客户特征进行筛选以选择出最能区分用户风险的客户特征子集来作为风险指标。
具体而言,在如上结合图2的“构建随机森林”的流程中所述,在步骤230中,在决策树形成过程中,在每一个节点的分裂过程中需要采用某种策略来从m个特征中选择一个特征作为分裂属性。为了使得所选的特征为最优分裂属性,所述策略可以包括例如使用基于信息增益的ID3算法、基于信息增益比的C4.5算法以及基于基尼系数(Gini Index)的分枝(CART)算法等等。在使用上述算法来选择用于后续分裂(分叉)的特征时,我们发现这些算法中的信息增益、信息增益比或基尼系数等参数同时也可以被用于评价特征的重要度。
下面结合图3来描述根据本公开的一个实施例的基于随机森林的客户指标筛选的具体流程。
如图3所示,首先,在步骤S310,收集客户特征数据。在评定客户等级时,可以从各种数据源收集到诸如客户姓名、年龄、职业、收入、地址、身份证号、手机号、银行账户、账户交易记录、物流信息、转账记录、消费记录等等数据特征。在这些客户特征中有些与例如“展业”活动有密切联系,例如已购保额、已购保单数等信息,但有些特征却关联不大,例如手机号、地址之类的信息。因此,需要对这些收集到的客户特征进行下面的有效筛选以提高评定客户等级的准确性和效率。
在收集完成之后,在步骤S320中,基于所收集的客户特征数据构建随机森林。所述随机森林的构建可以参考如图2所示的随机森林的构建流程,在此不再详细陈述。但需要说明,本公开所述的所述客户指标筛选流程可以在构建客户的随机森林的同时或者在所述随机森林构建完成之后被执行。当在构建随机森林的同时执行所述筛选流程时,一边计算特征在决策树的节点处的分裂属性,例如基尼指数或信息增益等参数,一边计算出该特征的相应的重要度(根据构建进度逐步计算节点处、决策树处和整个随机森林处的重要度)。而在构建完随机森林之后执行所述流程时,由于特征在各决策树的各个节点的例如基尼指数或信息增益之类的参数已经存在,可以直接计算该特征的整体重要度。具体而言,所述重要度计算流程如下所述:
假设在步骤S310中收集到M个客户特征,对于每个客户特征i(1≦i≦M),执行下述步骤:
在步骤S330,确定客户特征i在决策树t的各节点处的重要度Im。如上所述,如果所述决策树的分裂是基于CART算法,则确定客户特征i在决策树t的节点处的重要度为:Im=Ginim-Ginil-Ginir,即特征i在节点处的基尼指数减去特征i在其左右子节点处的基尼指数。而当所述决策树的分裂是基于ID3或C4.5算法时,所述Im=特征i在该节点的信息增益infoGain。如前所述,在构建决策树t的过程中,该客户特征i可能并不仅仅被用于节点m的分裂,它还有可能被用于其他节点的分裂。因此,对于每次使用特征i进行节点分裂时,都可根据上述的描述计算该特征i在相应节点处的重要度。
接着,在步骤S340,确定客户特征i在各个决策树中的重要度It。例如,可以将特征i在决策树t中的各个节点的重要度累加起来以获得该决策树t的重要度It。以相同的方式,通过将其他决策树中的各节点的重要度分别累加起来就能获得客户特征i在各个决策树中的重要度。
然后,在步骤S350,确定客户特征i在整个随机森林f中的重要度If。例如,可以将特征i在各个决策树中的重要度累加并求平均以获得在整个随机森林f中的最终重要度If。所述重要度If就是该客户特征i的最终的重要度。
在针对每个客户特征迭代执行上述步骤S330-350以获得与其相关联的重要度之后,在步骤S360,根据各客户特征的重要度对客户特征进行排序,并选择包含具有所需重要度的N个客户特征(例如最重要的Top N,N≥1,或者不低于某个重要度阈值)的子集作为客户指标。如此,根据本公开的基于随机森林的客户指标的筛选方案完成。
经过如图3所示的筛选过程,仅有少量具有高重要度的客户特征被选取作为客户指标。这些客户指标可以被应用于如图1所述的步骤S130和S140中,以计算客户的等级总评分,并根据该总评分确定出客户的等级。
下面结合一个具体应用场景来描述一下根据本公开的使用基于随机森林筛选后的客户指标来评估客户等级方案的流程图。
首先,在步骤S410,客户等级系统还是从各个数据源收集不同维度的客户特征数据。这些客户数据中有些客户特征数据与客户等级密切相关,例如保单类型、年缴金额等等,而有些客户数据却不太相关,例如位置和地址,所述不相关的客户数据对客户等级影响甚微,甚至可能会带来不必要的“噪声”。因此,需要对这些不同维度的客户数据进行筛选以选择出最能区分用户的特征。
因此,在步骤S420中,基于所述客户特征数据开始构建随机森林。也即如图2所示的那样,通过例如基于信息增益的ID3算法、基于信息增益比的C4.5算法或基于基尼系数(Gini Index)的分枝(CART)算法等等来构建包含多棵决策树的随机森林。在构建所述随机森林的同时或在构建完所述随机森林之后,根据如图3所示的基于随机森林的客户风险指标筛选的流程,利用构建实际森林时使用的各种与分裂相关的参数(例如CART算法的基尼指数,ID3和C4.5算法中的信息增益等等),可以针对每个客户特征计算出相应的重要度,请参见关于附图3的流程的内容。随后,根据所述重要度的大小对客户特征进行排序,筛选出例如TOP N个客户特征(即重要度排前N个的客户特征)的子集作为客户风险指标1,2,……,N。对于其他未被选中的客户特征,则可以将它们加入到候选集,以供在必要时由专家对它们进行人工筛选。
在步骤S430中,基于所述筛选出的客户指标1,2,……,N,通过客户等级模型分别计算出与之相对应的指标评分,例如指标1的评分S1、指标2的评分S2、……、指标N的评分SN。
然后,在步骤S440中,对所有计算出的客户指标评分进行加权求和以计算出该客户的等级总评分。其中,每个指标评分在总评分中的权重是由与该指标评分相关联的所筛选出的客户特征的重要度来决定的。重要度越高的客户特征,其对应的客户指标评分在总评分中所占的权重就越重。例如按重要度从大到小的顺序,假设客户特征“购买险种”排在第一、“累计保费”排在第二,而“累计保额”排在最后,则在计算总评分时,基于“购买险种”的指标评分的权重为最大(例如为0.6),其次是基于“累计保费”的指标评分的权重(例如为0.3),而最小权重的则是基于“累计保额”的指标评分的权重(例如0.1),这样,总评分=“购买险种”的指标评分x0.6+“累计保费”的指标评分x0.3+“累计保额”的指标评分x0.1。上述权重比例仅仅是出于示例说明的目的。事实上,可以根据各种算法来设定重要度和权重之间的关系。在此不再详述。
在另一个实施例中,在计算出该客户的风险指标总评分之后,可以根据例如一个客户等级分级表将该客户划分到相应的等级中去。例如,总评分在0-200的客户可以被划分到P等级,总评分在200-500的客户可以被划分到A等级,而总评分超过500的客户则被划分到C等级。所述等级划分评分范围可以根据实际需要调整。
在其他实施例中,当在步骤S420中基于随机森林筛选出一批高重要度的客户特征之后,还可以加入一个人工筛选的步骤,即将自动筛选出的这批客户特征提供给例如展业专家、增员专家作为推荐指标。随后,由专家审核是否使用该批客户特征作为指标,或者,更进一步地加入或删除部分客户特征后再提供给步骤430来计算指标评分。在了解了本公开的基于随机森林筛选后的客户指标来评估客户等级的方案之后,下面介绍一下与之相对应的用于实现所述方案的计算机系统。
二、其它子模块
概览子模块,分类显示了某营销员的客户数量和每月的拜访情况;
行事日历子模块,以日历的形式显示了过往对客户的拜访记录和对未来客户的拜访计划;
展业工具子模块,提供了电子优惠券、电子贺卡、保险产品图示、电子计划书等功能供销售人员开展业务时使用;
排行榜子模块,统计汇总拜访签到数据库中,保险营销员所在团队中所有保险营销员在多个时间维度(昨日、本周、本月、上月、本季)里的拜访签到次数,以排行榜的形式列表展示。
针对保险客户的不同等级,销售人员可以通过本发明提供的不同功能模块采用不同的销售策略进行展业活动。例如,销售人员通过优惠券、活动等资源获取和持续经营潜在客户,建立信任感。通过进一步分析客户的需求,结合场景提供种类齐全的短期类产品购买组合促使潜在客户快速购买产品转化为行动客户。保险销售人员通过体验式服务经营及专业的家庭规划,辅助以建议书、产说会等工具,灵活组合产品,满足客户的价值需要,促成长期类产品的购买,实现其向核心客户的蜕变。
以上详细描述了本发明的较佳具体实施例。应当理解,本领域的普通技术人员无需创造性劳动就可以根据本发明的构思做出诸多修改和变化。因此,凡本技术领域中技术人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案,皆应在由权利要求书所确定的保护范围内。

Claims (10)

1.一种基于随机森林进行客户等级划分的保险客户信息管理系统,其特征在于,包括通讯录子模块和展业工具子模块,所述通讯录子模块显示有客户的基本个人信息、保单信息和客户等级,所述展业工具子模块包括多个业务功能单元;
所述客户等级的确定包括以下步骤:
从所述基本个人信息和保单信息中获取多个客户特征;
基于所述多个客户特征构建随机森林;
计算每个所述客户特征在整个所述随机森林的重要度;
根据所述客户特征的重要度对客户特征进行排序,从而筛选出部分客户特征作为客户指标;
根据所述客户指标,通过预先建立的客户等级模型,获取每个客户的评分,确定每个客户的客户等级。
2.根据权利要求1所述的一种基于随机森林进行客户等级划分的保险客户信息管理系统,其特征在于,所述客户特征包括基本个人信息、保单类型、年缴金额、购买险种、累计保费和累计保额。
3.根据权利要求1所述的一种基于随机森林进行客户等级划分的保险客户信息管理系统,其特征在于,所述多个业务功能单元包括电子优惠券发送单元、电子贺卡发送单元、保险产品图示单元和电子计划书单元。
4.根据权利要求1所述的一种基于随机森林进行客户等级划分的保险客户信息管理系统,其特征在于,所述客户特征在整个所述随机森林的重要度的计算包括:
计算该客户特征在每个决策树各节点处的重要度;
分别在该客户特征的各个决策树中将该客户特征各节点处的重要度累加,计算各个决策树的重要度;
将各个决策树的重要度累加,计算该客户特征在整个随机森林的重要度。
5.根据权利要求1所述的一种基于随机森林进行客户等级划分的保险客户信息管理系统,其特征在于,所述每个客户的评分的获取具体为:
根据客户的基本个人信息和保单信息,计算该客户的各个客户指标的评分,基于客户指标的重要度,确定各个客户指标的权重,将各个客户指标的评分和权重相乘,获得每个客户的评分。
6.根据权利要求1所述的一种基于随机森林进行客户等级划分的保险客户信息管理系统,其特征在于,根据预设的等级划分区间,基于每个客户的评分,确定每个客户的客户等级。
7.根据权利要求1所述的一种基于随机森林进行客户等级划分的保险客户信息管理系统,其特征在于,所述保险客户信息管理系统还包括概览子模块,分类显示了某保险营销员的客户数量和每月的拜访情况。
8.根据权利要求1所述的一种基于随机森林进行客户等级划分的保险客户信息管理系统,其特征在于,所述保险客户信息管理系统还包括行事日历子模块,以日历的形式显示了过往对客户的拜访记录和对未来客户的拜访计划。
9.根据权利要求1所述的一种基于随机森林进行客户等级划分的保险客户信息管理系统,其特征在于,所述保险客户信息管理系统还包括排行榜子模块,统计汇总拜访签到数据库中,保险营销员所在团队中所有保险营销员在多个时间维度里的拜访签到次数,以排行榜的形式列表展示。
10.根据权利要求9所述的一种基于随机森林进行客户等级划分的保险客户信息管理系统,其特征在于,所述多个时间维度包括昨日、本周、本月、上月和本季。
CN202011605935.4A 2020-12-30 2020-12-30 基于随机森林进行客户等级划分的保险客户信息管理系统 Pending CN112767177A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011605935.4A CN112767177A (zh) 2020-12-30 2020-12-30 基于随机森林进行客户等级划分的保险客户信息管理系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011605935.4A CN112767177A (zh) 2020-12-30 2020-12-30 基于随机森林进行客户等级划分的保险客户信息管理系统

Publications (1)

Publication Number Publication Date
CN112767177A true CN112767177A (zh) 2021-05-07

Family

ID=75697438

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011605935.4A Pending CN112767177A (zh) 2020-12-30 2020-12-30 基于随机森林进行客户等级划分的保险客户信息管理系统

Country Status (1)

Country Link
CN (1) CN112767177A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113421027A (zh) * 2021-07-21 2021-09-21 北京优奥创思科技发展有限公司 一种基于数据运算对客户消费行为评级的方法
CN113449818A (zh) * 2021-08-27 2021-09-28 四川特号商盟科技有限公司 一种基于用户行为特征的优惠券额度动态调节方法
CN113837868A (zh) * 2021-09-30 2021-12-24 重庆富民银行股份有限公司 一种客群分层系统及方法
CN115358875A (zh) * 2022-08-24 2022-11-18 国任财产保险股份有限公司 一种保险产品管理系统
WO2023272834A1 (zh) * 2021-06-29 2023-01-05 未鲲(上海)科技服务有限公司 一种数据的处理方法、装置、设备以及可读介质
CN118364171A (zh) * 2024-04-12 2024-07-19 北京博瑞彤芸科技股份有限公司 一种为代理人提供展业方案的方法及装置

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104616116A (zh) * 2015-02-13 2015-05-13 武汉金锐达科技有限公司 一种银行客户服务系统及方法
WO2016053183A1 (en) * 2014-09-30 2016-04-07 Mentorica Technology Pte Ltd Systems and methods for automated data analysis and customer relationship management
CN108388955A (zh) * 2018-01-11 2018-08-10 国网山东省电力公司 基于随机森林和逻辑回归的客户服务策略制定方法、装置
CN108932585A (zh) * 2018-06-19 2018-12-04 腾讯科技(深圳)有限公司 一种商户运营管理方法及其设备、存储介质、电子设备
CN110334737A (zh) * 2019-06-04 2019-10-15 阿里巴巴集团控股有限公司 一种基于随机森林的客户风险指标筛选的方法和系统
AU2019101160A4 (en) * 2019-09-30 2019-10-31 Chen, Jingxuan MISS Application of decision tree and random forest in cash loan
CN110458587A (zh) * 2019-08-23 2019-11-15 焦点科技股份有限公司 一种分析保险电商平台客服工作的方法及系统
CN110659318A (zh) * 2019-08-15 2020-01-07 中国平安财产保险股份有限公司 基于大数据的策略推送方法、系统及计算机设备
US20200027103A1 (en) * 2018-07-23 2020-01-23 Adobe Inc. Prioritization System for Products Using a Historical Purchase Sequence and Customer Features

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016053183A1 (en) * 2014-09-30 2016-04-07 Mentorica Technology Pte Ltd Systems and methods for automated data analysis and customer relationship management
CN104616116A (zh) * 2015-02-13 2015-05-13 武汉金锐达科技有限公司 一种银行客户服务系统及方法
CN108388955A (zh) * 2018-01-11 2018-08-10 国网山东省电力公司 基于随机森林和逻辑回归的客户服务策略制定方法、装置
CN108932585A (zh) * 2018-06-19 2018-12-04 腾讯科技(深圳)有限公司 一种商户运营管理方法及其设备、存储介质、电子设备
US20200027103A1 (en) * 2018-07-23 2020-01-23 Adobe Inc. Prioritization System for Products Using a Historical Purchase Sequence and Customer Features
CN110334737A (zh) * 2019-06-04 2019-10-15 阿里巴巴集团控股有限公司 一种基于随机森林的客户风险指标筛选的方法和系统
CN110659318A (zh) * 2019-08-15 2020-01-07 中国平安财产保险股份有限公司 基于大数据的策略推送方法、系统及计算机设备
CN110458587A (zh) * 2019-08-23 2019-11-15 焦点科技股份有限公司 一种分析保险电商平台客服工作的方法及系统
AU2019101160A4 (en) * 2019-09-30 2019-10-31 Chen, Jingxuan MISS Application of decision tree and random forest in cash loan

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
王满;谢亚楠;: "随机森林算法在运营商告警推送中的应用研究", 工业控制计算机, vol. 30, no. 06, pages 108 - 109 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023272834A1 (zh) * 2021-06-29 2023-01-05 未鲲(上海)科技服务有限公司 一种数据的处理方法、装置、设备以及可读介质
CN113421027A (zh) * 2021-07-21 2021-09-21 北京优奥创思科技发展有限公司 一种基于数据运算对客户消费行为评级的方法
CN113449818A (zh) * 2021-08-27 2021-09-28 四川特号商盟科技有限公司 一种基于用户行为特征的优惠券额度动态调节方法
CN113449818B (zh) * 2021-08-27 2021-11-23 四川特号商盟科技有限公司 一种基于用户行为特征的优惠券额度动态调节方法
CN113837868A (zh) * 2021-09-30 2021-12-24 重庆富民银行股份有限公司 一种客群分层系统及方法
CN115358875A (zh) * 2022-08-24 2022-11-18 国任财产保险股份有限公司 一种保险产品管理系统
CN118364171A (zh) * 2024-04-12 2024-07-19 北京博瑞彤芸科技股份有限公司 一种为代理人提供展业方案的方法及装置

Similar Documents

Publication Publication Date Title
CN112767177A (zh) 基于随机森林进行客户等级划分的保险客户信息管理系统
CN109063945B (zh) 一种基于价值评估体系的售电公司360度客户画像构建方法
CN109509033B (zh) 一种消费金融场景下的用户购买行为大数据预测方法
Chen et al. A fuzzy credit-rating approach for commercial loans: a Taiwan case
Yoon et al. Multiple attribute decision making: an introduction
CN111160992A (zh) 一种基于用户画像体系的营销系统
US20040138958A1 (en) Sales prediction using client value represented by three index axes as criteron
CN110415084A (zh) 一种产品智能推荐方法及装置
CN109636482B (zh) 基于相似度模型的数据处理方法及系统
CN101385018A (zh) 使用估计的广告质量来进行广告过滤、排名和提升
KR20010103784A (ko) 입력이 없는 상황에서의 가치 평가 예측 모델
US20100228595A1 (en) System and method for scoring target lists for advertising
CN113469730A (zh) 一种非合同场景下的基于RF-LightGBM融合模型的客户复购预测方法及装置
CN101636757A (zh) 交易标识系统
CN115131101A (zh) 一种保险产品个性化智能推荐系统
CN115760202A (zh) 一种基于人工智能的产品运营管理系统及方法
Astaginy et al. Simple additive weighting for online platform evaluations in small business
CN117114744A (zh) 产品营销方法、装置、设备及存储介质
CN111861679A (zh) 一种基于人工智能的商品推荐方法
Rubi et al. Machine learning prediction of consumer travel insurance purchase behavior
CN111626864B (zh) 信息推送方法和装置、存储介质和电子装置
Ramanathan Successful transfer of environmentally sound technologies for greenhouse gas mitigation: a framework for matching the needs of developing countries
CN116663963B (zh) 一种评标监督专家的管理方法及系统
Steenkamp et al. Export market selection methods and the identification of realistic export opportunities for South Africa using a decision support model
CN112767114A (zh) 企业多元化决策方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination