CN112634061A - 一种用户数据处理方法及装置 - Google Patents

一种用户数据处理方法及装置 Download PDF

Info

Publication number
CN112634061A
CN112634061A CN202010704342.7A CN202010704342A CN112634061A CN 112634061 A CN112634061 A CN 112634061A CN 202010704342 A CN202010704342 A CN 202010704342A CN 112634061 A CN112634061 A CN 112634061A
Authority
CN
China
Prior art keywords
training
user data
user
prediction model
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010704342.7A
Other languages
English (en)
Other versions
CN112634061B (zh
Inventor
王雨晖
冯键
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Reinsurance Group Co ltd
Original Assignee
China Reinsurance Group Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Reinsurance Group Co ltd filed Critical China Reinsurance Group Co ltd
Priority to CN202010704342.7A priority Critical patent/CN112634061B/zh
Publication of CN112634061A publication Critical patent/CN112634061A/zh
Application granted granted Critical
Publication of CN112634061B publication Critical patent/CN112634061B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/08Insurance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Game Theory and Decision Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Technology Law (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本申请实施例公开了一种用户数据处理方法及装置,首先获取用户的用户数据,该用户数据包括该用户的个人信息以及财务信息,将该用户数据输入第一预测模型,获得该用户购买目标保险对应的承保保额。同时,将该用户行为数据输入第二预测模型,获得用户购买该目标保险的购买概率。再根据可承保保额和/或购买概率确定目标用户,进而向目标用户推荐该目标保险。即,在为用户推荐保险时,可以先利用该用户的用户数据、预先训练的第一预测模型和第二预测模型构建该用户的画像,进而根据该用户的画像对该用户进行定向推荐,提高推荐精准度。

Description

一种用户数据处理方法及装置
技术领域
本申请涉及数据处理技术领域,具体涉及一种用户数据处理方法及装置。
背景技术
银行保险作为一种新型的保险概念,在金融合作中,体现出银行与保险公司的强强联手,互联互动。银保渠道是保险的重要销售渠道,也是银行为客户丰富、完善资产配置的重要方式。
然而,由于银行端并不掌握丰富的保险专家经验和海量的保险数据,而保险端则无法掌握客户较为全面的财务相关数据。因此,传统的银保模式中,银行更多的只是一个销售渠道,且这个渠道中的工作人员并不具备足够的保险专业知识;保险公司则是一个单纯提供标准化保险的产品提供方,而无法直接掌握银行客户的具体情况,从而导致销售难、承保难、感受差等问题。
发明内容
有鉴于此,本申请实施例提供一种用户数据处理方法及装置,以实现更为合理有效地分析用户数据,以为用户推荐可能需要的保险信息。
为解决上述问题,本申请实施例提供的技术方案如下:
在本申请实施例第一方面,提供了一种用户数据处理方法,该方法可以包括:
针对任一用户,获取所述用户的用户数据,所述用户数据包括所述用户的个人信息、财务信息;
将所述用户数据输入第一预测模型,获取所述第一预测模型输出的承保保额,所述承保保额为所述用户对于目标保险的保额,所述第一预测模型是根据训练用户数据以及所述训练用户数据对应的第一标签训练生成的;
将所述用户数据输入第二预测模型,获取所述第二预测模型输出的购买概率,所述购买概率为所述用户购买所述目标保险的概率,所述第二预测模型是根据训练用户数据以及所述训练用户数据对应的第二标签训练生成的;
根据所述承保保额和/或所述购买概率确定所述目标保险对应的目标用户。
在一种可能的实现方式中,在将所述用户数据输入第一预测模型之前,所述方法还包括:
从所述用户数据中筛选可用字段,所述可用字段与所述承保保额的相似度不小于预设相似度阈值;
所述将所述用户数据输入第一预测模型,获取所述第一预测模型输出的承保保额,包括:
将所述可用字段输入第一预测模型,获取所述第一预测模型输出的承保保额。
在一种可能的实现方式中,所述将所述可用字段输入第一预测模型,获取所述第一预测模型输出的承保保额,包括:
针对任一可用字段,将所述可用字段与其对应的权重进行相乘,获得目标字段;
将各个所述目标字段输入第一预测模型,获取第一预测模型输出的承保保额。
在一种可能的实现方式中,所述根据所述承保保额和所述购买概率确定所述目标保险对应的目标用户,包括:
将所述承保保额不小于所述预设保额阈值以及所述购买概率不小于所述预设概率阈值的用户确定为所述目标保险对应的目标用户。
在一种可能的实现方式中,所述用户数据还包括:用户类别、资产配置信息、风险管理信息、个性化信息,所述个性化信息是根据用户数据获得的。
在一种可能的实现方式中,所述第一预测模型的训练过程包括:
获取训练用户数据以及所述训练用户数据对应的第一标签,所述第一标签为所述训练用户数据对应的用户购买所述目标保险时的承保保额,所述训练用户数据包括个人信息和财务信息;
利用所述训练用户数据以及所述第一标签对第一初始模型进行训练,生成所述第一预测模型。
在一种可能的实现方式中,所述第二预测模型的训练过程包括:
获取训练用户数据以及所述训练用户数据对应的第二标签,所述第二标签为购买或未购买,其中,所述第二标签为购买的训练用户数据为正样本训练数据,所述第二分类标签为未购买的训练用户数据为负样本训练数据,所述训练用户数据包括个人信息和财务信息;
利用所述正样本训练数据和所述负样本训练数据对第二初始模型进行训练,生成第二预测模型。
在一种可能的实现方式中,在利用所述训练用户数据以及所述第一标签,对第一初始模型进行训练之前,所述方法还包括:
从所述训练用户数据中筛选可用字段,所述可用字段与所述承保保额的相似度不小于预设相似度阈值;
所述利用所述训练用户数据以及所述第一标签,对第一初始模型进行训练,生成第一预测模型,包括:
利用所述可用字段以及所述第一标签,对第一初始模型进行训练,生成第一预测模型。
在一种可能的实现方式中,所述利用所述可用字段以及所述第一标签,对第一初始模型进行训练,生成第一预测模型,包括:
针对任一可用字段,将所述可用字段与其对应的权重进行相乘,获得目标字段;
利用各个所述目标字段以及所述第一标签,对第一初始模型进行训练,生成第一预测模型。
在一种可能的实现方式中,所述训练用户数据中包括训练用户的亲友信息,所述用户数据还包括所述用户的亲友信息。
在本申请实施例第二方面,提供了一种用户数据处理装置,所述装置包括:
第一获取单元,用于针对任一用户,获取所述用户的用户数据,所述用户数据包括所述用户的个人信息、财务信息;
第二获取单元,用于将所述用户数据输入第一预测模型,获取所述第一预测模型输出的承保保额,所述承保保额为所述用户对于目标保险的保额,所述第一预测模型是根据训练用户数据以及所述训练用户数据对应的第一标签训练生成的;
所述第二获取单元,还用于将所述用户数据输入第二预测模型,获取所述第二预测模型输出的购买概率,所述购买概率为所述用户购买所述目标保险的概率,所述第二预测模型是根据训练用户数据以及所述训练用户数据对应的第二标签训练生成的;
确定单元,用于根据所述承保保额和/或所述购买概率确定所述目标保险对应的目标用户。
由此可见,本申请实施例具有如下有益效果:
本申请实施例首先根据已经购买目标保险的训练用户以及该训练用户购买目标保险所对应的承保保额训练出用于预测各个用户购买目标保险的承保保额的第一预测模型以及预测用户购买目标保险概率的第二预测模型。在具体应用时,首先获取用户的用户数据,该用户数据包括该用户的个人信息以及财务信息,将该用户数据输入第一预测模型,获得该用户购买目标保险对应的承保保额。同时,将该用户行为数据输入第二预测模型,获得用户购买该目标保险的购买概率。再根据可承保保额和/或购买概率确定目标用户,进而向目标用户推荐该目标保险。
可见,通过本申请实施例提供的方法,在为用户推荐保险时,可以先利用该用户的用户数据、预先训练的第一预测模型和第二预测模型构建该用户的画像,进而根据该用户的画像对该用户进行定向推荐,提高推荐精准度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种用户数据处理方法流程图;
图2为本申请实施例提供的一种第一预测模型生成方法流程图;
图3为本申请实施例提供的一种第二预测模型生成方法流程图;
图4为本申请实施例提供的一种用户数据处理装置结构图。
具体实施方式
为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本申请实施例作进一步详细的说明。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是本发明还可以采用其他不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似推广,因此本发明不受下面公开的具体实施例的限制。
发明人在对传统的银保模式研究中发现,传统银保模式存在销售难——银行方缺乏专业技能来分析客户的保险需求;承保难——银行方缺乏专业技能来评估客户潜在的风险;感受差——保险公司承保审核周期长、流程复杂、成交率低下等问题。
基于上述问题,本申请实施例提供了一种用户数据处理方法,在安全合规的条件下,将银行方数据和保险方数据进行融合,获取已购买某一保险的用户的画像特征,并基于该类用户的画像特征训练预测模型。具体地,训练生成第一预测模型用于预测用户对应目标保险的保障缺口(承保保额)以及第二预测模型预测用户购买目标保险的概率,从而使得银行方在向用户推荐保险时,可以根据上述预测的结果向用户进行推荐,实现精准推荐。由于在进行上述预测时,已经根据用户的个人信息以及财务信息,当用户购买时无需用户反复提供财务证明材料,缩短审核周期,提高承保率和成功率,提升用户购买体验。
需要说明的是,在实际应用中,可以针对不同的险种类别分别训练每一种险种类别对应的预测模型,该预测模型中包括第一预测模型和第二预测模型。当需要推广该险种类别的保险时,可以利用该险种类别对应的预测模型获取目标用户,进而向目标用户推荐该险种类别的保险,实现精准推荐。
其中,承保保额即保险金额,是指一个保险合同项下保险公司承担赔偿或给付保险金责任的最高限额。
为便于理解本申请实施例提供的方法,下面将结合附图对本申请实施例提供的用户数据处理方法进行说明。
方法实施例一
参见图1,该图为本申请实施例提供的一种用户数据处理方法流程图,如图1所示,该方法可以包括:
S101:获取用户的用户数据,该用户数据包括用户的个人信息、财务信息。
本实施例中,当需要针对某一目标保险进行推广时,首先获取当前银行方所管理的用户数据,该用户数据包括用户的个人信息和财务信息。具体地,该用户数据还可以包括用户类别、资产配置信息、风险管理信息、个人性化信息、持有产品、用户行为数据等可以反映该用户特点的数据。
其中,个人信息可以包括该用户的年龄、性别、职业、国籍等基本信息。财务信息可以包括该用户的存款、贷款、银行流水等可以表示该用户的财务状况的信息。用户类别是指银行方针对用户在银行的所管护资产进行划分的,例如可以划分为普通客户、金卡客户、金葵花客户、钻石客户、私人银行客户等。资产配置信息,是指用户指根据投资需求将投资资金在不同资产类别之间进行分配,例如购买基金的占比为40%、购买股票25%、保险和债券5%等。持有产品,是指用户所购买持有的理财产品、保险产品、股票、贵金属等。风险管理信息,是指银行方对于用户的信用风险管理的相关数据信息。例如,确定用户是否出现在各类黑名单的管理,具体地,是否出现在征信黑名单、是否出现在贷款黑名单等。个性化信息,是根据用户数据获得的,可以反映用户特点的信息,例如用户的喜好。具体地,可以根据用户行为数据获得。其中,用户行为数据,是指用户自身操作所形成的数据,例如用户购买时的数据、转账数据、浏览数据等。
需要说明的是,S101所获取的用户数据和训练第一预测模型时和第二预测模型时所使用的用户数据一致。
在具体实现时,由于不同类别的保险其所对应的客户群体是不同的,例如针对儿童、成年人、老年人设置不同的保险,或者针对成年男性和成年女性设置不同的保险。因此,当银行方客户经理为用户推荐目标保险时,可以获取其所管理的各位用户的用户数据,以通过该用户数据确定是否为其推荐目标保险。
S102:将用户数据输入第一预测模型,获取第一预测模型输出的承保保额。
当获取到用户数据后,将该用户数据输入第一预测模型,以获得该第一预测模型输出的承保保额。其中,承保保额为用户购买该目标保险时对应的保额上限。其中,第一预测模型是根据训练用户数据以及训练用户数据对应的第一标签训练生成的,该第一标签是指训练用户数据对应的用户购买目标保险时对应的承保保额。具体地,可以从用户数据中提取用户特征,将该用户特征输入第一预测模型,从而获得承保保额。
也就是,通过第一预测模型可以预测出每位用户购买目标保险时对应的承保保额,关于第一预测模型的训练将在后续实施例进行说明。
在一些实现方式中,获取的用户数据中可以包括多个字段,但并不是每个字段对于预测承保保额均起作用,因此,在将用户数据输入第一预测模型之前,还可以进行可用字段的筛选,进而利用可用字段进行预测。具体为,从所述用户数据中筛选可用字段,该可用字段与承保保额的相似度不小于预设相似度阈值;将可用字段输入第一预测模型,获得第一预测模型输出的承保保额。也就是,从用户数据中提取与承保保额有较大关联的可用字段,以将该可用字段输入第一预测模型中对承保保额进行预测,提高预测的准确性。具体地,从可用字段中提取用户特征,将所提取的各个用户特征输入第一预测模型,以获得承保保额。具体地,可用字段可以为技术专家根据经验或实验预先设置的字段,当获取用户数据后,利用字符提取方法从该用户数据中提取对应的字段。
在一些实现方式中,当提取多个可用字段时,每个可用字段对于最终预测结果的作用程度可能是不相同的,因此,可以通过设置权重的方式来提高一些字段在最终预测结果中所起的作用。基于此,针对任一可用字段,将该可用字段与其对应的权重进行相乘,获得目标字段;将各个目标字段输入第一预测模型,获取第一预测模型输出的承保保额。具体地,针对任一可用字段,获取该可用字段对应的特征向量,将该特征向量与其对应的权重进行相乘,获得目标特征向量。将各个目标特征向量输入第一预测模型中,获取承保保额。即,通过加重对预测承保保额有较大关联的可用字段的方式,提高预测的准确性。
S103:将用户数据输入第二预测模型,获取第二预测模型输出的购买概率。
当通过S101获取用户的用户数据后,将该用户数据输入第二预测模型,获取该第二预测模型输出的购买概率。即,通过第二预测模型可以获取每位用户购买该目标保险的概率。其中,第二预测模型是根据训练用户数据以及训练用户数据对应的第二标签训练生成的,该第二标签为训练用户数据对应的用户购买目标保险或未购买目标保险。
也就是,通过第二预测模型可以预测每位用户购买目标保险的购买概率,关于第二预测模型的训练将在后续实施例进行说明。
需要说明的是,当同时利用第一预测模型和第二预测模型时,S102和S103可以同时进行,也可以先执行S103,再执行S102;当仅利用其中一个预测模型时,可以仅利用第一预测模型,也可以仅利用第二预测模型,具体使用方式可以根据实际应用情况设置,本实施例在此不做限定。
S104:根据承保保额和/或购买概率确定目标保险对应的目标用户。
当通过S102获取用户购买目标保险对应的承保保额,或通过S103获取用户购买目标保险对应的购买概率后,可以根据承保保额和/或购买概率确定目标保险对应的目标用户。
即,在实际应用时,可以仅根据承保保额确定目标保险对应的目标用户,也可以仅根据购买概率确定目标保险对应的目标用户,还可以同时根据承保保额以及购买概率确定目标保险对应的目标用户。
在一些实现方式中,当仅根据承保保额确定目标用户时,可以将承保保额大于预保额设阈值的用户确定为目标用户。当仅根据购买概率确定目标用户时,可以将购买概率大于预设概率阈值的用户确定为目标用户。
在实际应用时,考虑到一些用户虽然对于目标保险存在承保保额但购买概率较低或为零,或者一些用户虽然对于目标保险的购买概率较大但其对应的承保保额为零,为避免上述两种情况的出现,在确定目标用户时,将同时考虑承保保额以及购买概率。具体地,当根据承保保额以及购买概率确定目标用户,将承保保额不小于预设保额阈值以及购买概率不小于预设概率阈值的用户确定为目标用户。
此外,在实际应用中,当银行的客户经理需要为其管理的用户推荐某一保险时,可以利用上述方法可以获取每位用户对应的承保保额以及购买概率时,可以根据购买概率对用户进行排序,将购买概率不小于预设概率阈值的用户确定为目标用户,从而为目标用户进行推荐,从而实现精准推荐。
可见,通过上述方法可知,首先获取用户的用户数据,该用户数据包括该用户的个人信息以及财务信息,将该用户数据输入第一预测模型,获得该用户购买目标保险对应的承保保额。同时,将该用户行为数据输入第二预测模型,获得用户购买该目标保险的购买概率。再根据可承保保额以及购买概率确定目标用户,进而向目标用户推荐该目标保险。即,在为用户推荐保险时,可以先利用该用户的用户数据、预先训练的第一预测模型和第二预测模型构建该用户的画像,进而根据该用户的画像对该用户进行定向推荐,提高推荐精准度。
上述实施例说明了如何利用第一预测模型和第二预测模型确定目标用户,下面将结合实施例对第一预测模型和第二预测模型的训练过程进行说明。
方法实施例二
参见图2,该图为本申请实施例提供的一种第一预测模型生成方法流程图,如图2所示,该方法可以包括:
S201:获取训练用户数据以及训练用户数据对应的第一标签。
本实施例中,针对已经购买目标保险的用户,获取该用户的用户数据作为训练用户数据以及该用户对应的第一标签。其中,第一标签为该用户购买目标保险时对应的承保保额。
其中,训练用户数据包括用户的个人信息和财务信息。具体地,该用户数据还可以包括用户类别、资产配置信息、风险管理信息、个人性化信息、持有产品、用户行为数据等可以反映该用户特点的数据。
S202:利用训练用户数据以及第一标签,对第一初始模型进行训练,生成第一预测模型。
当获取大量的训练用户数据以及各自对应的第一标签时,利用训练用户数据以及第一标签对第一初始模型进行训练,生成第一预测模型。其中,第一初始模型可以为常见的神经网络模型或机器学习模型,例如,卷积神经网络模型、循环神经网络模型、长短期记忆神经网络模型、决策树模型、支持向量机模型等。具体地,可以从训练用户数据中提取训练用户特征,然后利用训练用户特征以及第一标签训练第一初始模型,以获得第一预测模型。
在一些实现方式中,在利用训练用户数据以及第一标签对第一初始模型进行训练之前,还可以从训练用户数据中筛选可用字段,其中可用字段与承保保额的相似度不小于预设相似度阈值;利用可用字段以及第一标签对第一初始模型进行训练,生成第一预测模型。具体地,当从训练用户数据筛选出可用字段后,从可用字段提取训练用户特征,利用该训练用户特征以及第一标签对第一初始模型进行训练,生成第一预测模型。
在一些实现方式中,利用可用字段以及第一标签对第一初始模型进行训练,生成第一预测模型,包括:针对任一可用字段,将该可用字段与其对应的权重进行相乘,获得目标字段;利用目标字段以及第一标签对第一初始模型进行训练,生成第一预测模型。
通过本申请实施例提供的方法,第一预测模型可以学习已购买目标保险用户的用户数据与承保保额之间的关系,从而当输入尚未购买目标保险的用户数据时,可以根据上述关系预测对应的承保保额。
参见图3,该图为本申请实施例提供的一种第二预测模型生成方法流程图,如图3所示,该方法可以包括:
S301:获取训练用户数据以及训练用户数据对应的第二标签。
本实施例中,为训练获得可以预测用户是否购买目标保险的模型,首先获取大量的训练用户数据,以及各个训练用户数据对应的第二标签。第二标签为购买目标保险或未购买目标保险。其中,第二标签为购买目标保险的训练用户数据为正样本训练数据,第二分类标签为未购买目标保险的训练用户数据为负样本训练数据,其中,训练用户数据包括个人信息和财务信息。
在具体实现时,可以确定两个不同的时间段,分别为观察期和表现期。其中,观察期表示获取训练用户数据的时间段,表现期表示收集用户是否购买目标保险的时间段。也就是,在观察期获取用于训练的各个用户的训练用户数据,在表现期获取上述各个用户分别对应的第二标签。将在表现期购买目标保险的用户所对应的训练用户数据作为正样本训练数据,将在表现期未购买目标保险的用户所对应的训练用户数据作为负样本训练数据。
S302:利用正样本训练数据和负样本训练数据对第二初始模型进行训练,生成第二预测模型。
当获取正样本训练数据和负样本训练数据后,利用正/负样本训练数据对第二初始模型进行训练,生成第二预测模型。其中,第二初始模型可以为常见的神经网络模型或机器学习模型,例如,卷积神经网络模型、循环神经网络模型、长短期记忆神经网络模型、决策树模型、支持向量机模型等。
在一些实现方式中,影响用户购买保险的因素,还可以包括其对应的亲友已经购买过该类保险,如果该用户的亲友购买过该类保险,则该用户购买的概率将相应提高,因此,在训练第二预测模型时,所获取的训练用户数据中还可以包括训练用户的亲友信息,对应地,S101中所获取的用户数据中将包括用户的亲友信息。
通过本申请实施例提供的方法,第二预测模型可以学习用户数据与购买概率之间的关系,从而当输入尚未购买目标保险的用户数据时,可以根据上述关系预测对应的购买概率。
通过上述方法实施例可知,本申请实施例具有以下特点:
1)选取了用户“基本信息”、“持有产品”、“客户行为”、“财务状况”、“资产配置”、“分析评价”、“风险管理”、“个性化指标”等八大维度作为入模特征,构建“千人千面”的用户画像。
2)应用安全多方计算的方式将保险公司已承保、已拒保、已理赔等关键保险数据信息,同银行用户特征数据展开融合。选择用户是否在表现期内已购买相应险种作为模型的标签数据,从而针对每一个不同的险种类别去单独构建模型,预测用户在该险种项下的保障缺口和购买意愿,与传统的做法相比,更加精准、更加符合业务和产品特点。
3)原有承保过程都是客户产生投保意愿后,按照保险公司要求提供存款证明、银行流水证明、房产车产证明等各类财务资料证明,再由保险公司核保审核,这样往往导致:审核周期非常长、通过成功率不高、承保金额低于客户预期等各种问题,使得客户感受非常差。本申请技术方案则是通过收集用户在银行端已有的所有客观财务数据,通过数据挖掘、AI算法等技术训练预测模型,直接给出了客户的可承保保额和购买意愿,而不再需要客户提供任何证明资料,只需客户确认投保,即可给出并确认客户可投保保额。
4)在过去,银行的客户经理由于缺乏专业的保险知识,因而在销售复杂保险产品时存在诸多困难,而一个客户经理名下往往管护多名客户,挨个销售的话,成功率极低且同客户的接触成本极高;另一方面,过往银行端的智能营销系统基本都是应用在APP上,并没有直接提供给客户经理的辅助营销系统。本申请实施例提供的技术方案可以直接根据客户经理的场景需求设计开发,对客户经理名下的客户进行排名,因此,客户经理可直接根据排名,按顺序接触客户即可,提高推荐的精准性。
基于上述方法实施例,本申请实施例还提供了一种用户数据处理装置,下面将结合附图进行说明。
装置实施例
参见图4,该图为本申请实施例提供的一种用户数据处理装置结构图,如图4所示,该装置可以包括:
第一获取单元401,用于针对任一用户,获取所述用户的用户数据,所述用户数据包括所述用户的个人信息、财务信息;
第二获取单元402,用于将所述用户数据输入第一预测模型,获取所述第一预测模型输出的承保保额,所述承保保额为所述用户对于目标保险的保额,所述第一预测模型是根据训练用户数据以及所述训练用户数据对应的第一标签训练生成的;
所述第二获取单元402,还用于将所述用户数据输入第二预测模型,获取所述第二预测模型输出的购买概率,所述购买概率为所述用户购买所述目标保险的概率,所述第二预测模型是根据训练用户数据以及所述训练用户数据对应的第二标签训练生成的;
确定单元403,用于根据所述承保保额和/或所述购买概率确定所述目标保险对应的目标用户。
在一种可能的实现方式中,所述装置还包括:
筛选单元,用于在将所述用户数据输入第一预测模型之前,从所述用户数据中筛选可用字段,所述可用字段与所述承保保额的相似度不小于预设相似度阈值;
所述第二获取单元,具体用于将所述可用字段输入第一预测模型,获取所述第一预测模型输出的承保保额。
在一种可能的实现方式中,所述第二获取单元,具体用于针对任一可用字段,将所述可用字段与其对应的权重进行相乘,获得目标字段;将各个所述目标字段输入第一预测模型,获取第一预测模型输出的承保保额。
在一种可能的实现方式中,所述确定单元,具体用于将所述承保保额不小于所述预设保额阈值以及所述购买概率不小于所述预设概率阈值的用户确定为所述目标保险对应的目标用户。
在一种可能的实现方式中,所述用户数据还包括:用户类别、资产配置信息、风险管理信息、个性化信息,所述个性化信息是根据用户数据获得的。
在一种可能的实现方式中,所述第一预测模型的训练过程包括:
获取训练用户数据以及所述训练用户数据对应的第一标签,所述第一标签为所述训练用户数据对应的用户购买所述目标保险时的承保保额,所述训练用户数据包括个人信息和财务信息;
利用所述训练用户数据以及所述第一标签对第一初始模型进行训练,生成所述第一预测模型。
在一种可能的实现方式中,所述第二预测模型的训练过程包括:
获取训练用户数据以及所述训练用户数据对应的第二标签,所述第二标签为购买或未购买,其中,所述第二标签为购买的训练用户数据为正样本训练数据,所述第二分类标签为未购买的训练用户数据为负样本训练数据,所述训练用户数据包括个人信息和财务信息;
利用所述正样本训练数据和所述负样本训练数据对第二初始模型进行训练,生成第二预测模型。
在一种可能的实现方式中,在利用所述训练用户数据以及所述第一标签,对第一初始模型进行训练之前,所述方法还包括:
从所述训练用户数据中筛选可用字段,所述可用字段与所述承保保额的相似度不小于预设相似度阈值;
所述利用所述训练用户数据以及所述第一标签,对第一初始模型进行训练,生成第一预测模型,包括:
利用所述可用字段以及所述第一标签,对第一初始模型进行训练,生成第一预测模型。
在一种可能的实现方式中,所述利用所述可用字段以及所述第一标签,对第一初始模型进行训练,生成第一预测模型,包括:
针对任一可用字段,将所述可用字段与其对应的权重进行相乘,获得目标字段;
利用各个所述目标字段以及所述第一标签,对第一初始模型进行训练,生成第一预测模型。
在一种可能的实现方式中,所述训练用户数据中包括训练用户的亲友信息,所述用户数据还包括所述用户的亲友信息。
需要说明的是,本实施例中各个单元的实现可以参见上述方法实施例,本实施例在此不再赘述。
另外,本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在终端设备上运行时,使得所述终端设备执行所述的用户数据处理方法。
本申请实施例提供了一种设备,包括:存储器,处理器,及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现所述用户数据处理方法。
首先根据已经购买目标保险的训练用户以及该训练用户购买目标保险所对应的承保保额训练出用于预测各个用户购买目标保险的承保保额的第一预测模型以及预测用户购买目标保险概率的第二预测模型。在具体应用时,首先获取用户的用户数据,该用户数据包括该用户的个人信息以及财务信息,将该用户数据输入第一预测模型,获得该用户购买目标保险对应的承保保额。同时,将该用户行为数据输入第二预测模型,获得用户购买该目标保险的购买概率。再根据可承保保额以及购买概率确定目标用户,进而向目标用户推荐该目标保险。
可见,通过本申请实施例提供的方法,在为用户推荐保险时,可以先利用该用户的用户数据、预先训练的第一预测模型和第二预测模型构建该用户的画像,进而根据该用户的画像对该用户进行定向推荐,提高推荐精准度。
需要说明的是,本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统或装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
应当理解,在本申请中,“至少一个(项)”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,用于描述关联对象的关联关系,表示可以存在三种关系,例如,“A和/或B”可以表示:只存在A,只存在B以及同时存在A和B三种情况,其中A,B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达,是指这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b或c中的至少一项(个),可以表示:a,b,c,“a和b”,“a和c”,“b和c”,或“a和b和c”,其中a,b,c可以是单个,也可以是多个。
还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种用户数据处理方法,其特征在于,所述方法包括:
针对任一用户,获取所述用户的用户数据,所述用户数据包括所述用户的个人信息、财务信息;
将所述用户数据输入第一预测模型,获取所述第一预测模型输出的承保保额,所述承保保额为所述用户对于目标保险的保额,所述第一预测模型是根据训练用户数据以及所述训练用户数据对应的第一标签训练生成的;
将所述用户数据输入第二预测模型,获取所述第二预测模型输出的购买概率,所述购买概率为所述用户购买所述目标保险的概率,所述第二预测模型是根据训练用户数据以及所述训练用户数据对应的第二标签训练生成的;
根据所述承保保额和/或所述购买概率确定所述目标保险对应的目标用户。
2.根据权利要求1所述的方法,其特征在于,在将所述用户数据输入第一预测模型之前,所述方法还包括:
从所述用户数据中筛选可用字段,所述可用字段与所述承保保额的相似度不小于预设相似度阈值;
所述将所述用户数据输入第一预测模型,获取所述第一预测模型输出的承保保额,包括:
将所述可用字段输入第一预测模型,获取所述第一预测模型输出的承保保额。
3.根据权利要求2所述的方法,其特征在于,所述将所述可用字段输入第一预测模型,获取所述第一预测模型输出的承保保额,包括:
针对任一可用字段,将所述可用字段与其对应的权重进行相乘,获得目标字段;
将各个所述目标字段输入第一预测模型,获取第一预测模型输出的承保保额。
4.根据权利要求1所述的方法,其特征在于,所述根据所述承保保额和所述购买概率确定所述目标保险对应的目标用户,包括:
将所述承保保额不小于所述预设保额阈值以及所述购买概率不小于所述预设概率阈值的用户确定为所述目标保险对应的目标用户。
5.根据权利要求1所述的方法,其特征在于,所述用户数据还包括:用户类别、资产配置信息、风险管理信息、个性化信息,所述个性化信息是根据用户数据获得的。
6.根据权利要求1所述的方法,其特征在于,所述第一预测模型的训练过程包括:
获取训练用户数据以及所述训练用户数据对应的第一标签,所述第一标签为所述训练用户数据对应的用户购买所述目标保险时的承保保额,所述训练用户数据包括个人信息和财务信息;
利用所述训练用户数据以及所述第一标签对第一初始模型进行训练,生成所述第一预测模型。
7.根据权利要求1所述的方法,其特征在于,所述第二预测模型的训练过程包括:
获取训练用户数据以及所述训练用户数据对应的第二标签,所述第二标签为购买或未购买,其中,所述第二标签为购买的训练用户数据为正样本训练数据,所述第二分类标签为未购买的训练用户数据为负样本训练数据,所述训练用户数据包括个人信息和财务信息;
利用所述正样本训练数据和所述负样本训练数据对第二初始模型进行训练,生成第二预测模型。
8.根据权利要求6所述的方法,其特征在于,在利用所述训练用户数据以及所述第一标签,对第一初始模型进行训练之前,所述方法还包括:
从所述训练用户数据中筛选可用字段,所述可用字段与所述承保保额的相似度不小于预设相似度阈值;
所述利用所述训练用户数据以及所述第一标签,对第一初始模型进行训练,生成第一预测模型,包括:
利用所述可用字段以及所述第一标签,对第一初始模型进行训练,生成第一预测模型。
9.根据权利要求8所述的方法,其特征在于,所述利用所述可用字段以及所述第一标签,对第一初始模型进行训练,生成第一预测模型,包括:
针对任一可用字段,将所述可用字段与其对应的权重进行相乘,获得目标字段;
利用各个所述目标字段以及所述第一标签,对第一初始模型进行训练,生成第一预测模型。
10.一种用户数据处理装置,其特征在于,所述装置包括:
第一获取单元,用于针对任一用户,获取所述用户的用户数据,所述用户数据包括所述用户的个人信息、财务信息;
第二获取单元,用于将所述用户数据输入第一预测模型,获取所述第一预测模型输出的承保保额,所述承保保额为所述用户对于目标保险的保额,所述第一预测模型是根据训练用户数据以及所述训练用户数据对应的第一标签训练生成的;
所述第二获取单元,还用于将所述用户数据输入第二预测模型,获取所述第二预测模型输出的购买概率,所述购买概率为所述用户购买所述目标保险的概率,所述第二预测模型是根据训练用户数据以及所述训练用户数据对应的第二标签训练生成的;
确定单元,用于根据所述承保保额和/或所述购买概率确定所述目标保险对应的目标用户。
CN202010704342.7A 2020-07-21 2020-07-21 一种用户数据处理方法及装置 Active CN112634061B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010704342.7A CN112634061B (zh) 2020-07-21 2020-07-21 一种用户数据处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010704342.7A CN112634061B (zh) 2020-07-21 2020-07-21 一种用户数据处理方法及装置

Publications (2)

Publication Number Publication Date
CN112634061A true CN112634061A (zh) 2021-04-09
CN112634061B CN112634061B (zh) 2024-08-02

Family

ID=75300009

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010704342.7A Active CN112634061B (zh) 2020-07-21 2020-07-21 一种用户数据处理方法及装置

Country Status (1)

Country Link
CN (1) CN112634061B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113129114A (zh) * 2021-05-13 2021-07-16 北京大米科技有限公司 一种业务推荐的方法、装置、可读存储介质和电子设备

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150339572A1 (en) * 2014-05-23 2015-11-26 DataRobot, Inc. Systems and techniques for predictive data analytics
CN107730389A (zh) * 2017-09-30 2018-02-23 平安科技(深圳)有限公司 电子装置、保险产品推荐方法及计算机可读存储介质
CN108711110A (zh) * 2018-08-14 2018-10-26 中国平安人寿保险股份有限公司 保险产品推荐方法、装置、计算机设备和存储介质
CN109165983A (zh) * 2018-09-04 2019-01-08 中国平安人寿保险股份有限公司 保险产品推荐方法、装置、计算机设备和存储介质
CN109242631A (zh) * 2018-09-17 2019-01-18 平安科技(深圳)有限公司 产品智能推荐方法、服务器及存储介质
KR20190017105A (ko) * 2017-08-10 2019-02-20 장윤식 보험 가입 희망자와 추천 보험 상품을 매칭시키는 방법
CN109493244A (zh) * 2018-11-07 2019-03-19 平安医疗健康管理股份有限公司 基于预测模型配置保险需求的方法及相关产品
CN110135942A (zh) * 2019-04-12 2019-08-16 深圳壹账通智能科技有限公司 产品推荐方法、装置及计算机可读存储介质
US20190311438A1 (en) * 2018-04-06 2019-10-10 Traffk, Llc Insurance risk evaluation systems and methods
CN110335157A (zh) * 2019-03-18 2019-10-15 中国人民财产保险股份有限公司 保险产品推荐方法、设备及存储介质
WO2019216825A1 (en) * 2018-05-06 2019-11-14 Inzsure Pte. Ltd. System and method for recommending insurance products
US10546340B1 (en) * 2015-10-06 2020-01-28 Massachusetts Mutual Life Insurance Company Systems and methods for assessing needs
US20200111169A1 (en) * 2018-10-09 2020-04-09 SafeAI, Inc. Autonomous vehicle premium computation using predictive models
CN111353901A (zh) * 2020-02-24 2020-06-30 阳光保险集团股份有限公司 风险识别监控方法、装置以及电子设备

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150339572A1 (en) * 2014-05-23 2015-11-26 DataRobot, Inc. Systems and techniques for predictive data analytics
US10546340B1 (en) * 2015-10-06 2020-01-28 Massachusetts Mutual Life Insurance Company Systems and methods for assessing needs
KR20190017105A (ko) * 2017-08-10 2019-02-20 장윤식 보험 가입 희망자와 추천 보험 상품을 매칭시키는 방법
CN107730389A (zh) * 2017-09-30 2018-02-23 平安科技(深圳)有限公司 电子装置、保险产品推荐方法及计算机可读存储介质
US20190311438A1 (en) * 2018-04-06 2019-10-10 Traffk, Llc Insurance risk evaluation systems and methods
WO2019216825A1 (en) * 2018-05-06 2019-11-14 Inzsure Pte. Ltd. System and method for recommending insurance products
CN108711110A (zh) * 2018-08-14 2018-10-26 中国平安人寿保险股份有限公司 保险产品推荐方法、装置、计算机设备和存储介质
CN109165983A (zh) * 2018-09-04 2019-01-08 中国平安人寿保险股份有限公司 保险产品推荐方法、装置、计算机设备和存储介质
CN109242631A (zh) * 2018-09-17 2019-01-18 平安科技(深圳)有限公司 产品智能推荐方法、服务器及存储介质
US20200111169A1 (en) * 2018-10-09 2020-04-09 SafeAI, Inc. Autonomous vehicle premium computation using predictive models
CN109493244A (zh) * 2018-11-07 2019-03-19 平安医疗健康管理股份有限公司 基于预测模型配置保险需求的方法及相关产品
CN110335157A (zh) * 2019-03-18 2019-10-15 中国人民财产保险股份有限公司 保险产品推荐方法、设备及存储介质
CN110135942A (zh) * 2019-04-12 2019-08-16 深圳壹账通智能科技有限公司 产品推荐方法、装置及计算机可读存储介质
CN111353901A (zh) * 2020-02-24 2020-06-30 阳光保险集团股份有限公司 风险识别监控方法、装置以及电子设备

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113129114A (zh) * 2021-05-13 2021-07-16 北京大米科技有限公司 一种业务推荐的方法、装置、可读存储介质和电子设备

Also Published As

Publication number Publication date
CN112634061B (zh) 2024-08-02

Similar Documents

Publication Publication Date Title
CN109034915B (zh) 一种可应用数字资产或积分作为交易媒介的人工智能型电子商务系统
US20230259857A1 (en) Systems and methods for vulnerability assessment and remedy identification
Tobback et al. Retail credit scoring using fine-grained payment data
Greenstein-Messica et al. Personal price aware multi-seller recommender system: Evidence from eBay
CN105490823B (zh) 一种数据处理方法及装置
CN112784039A (zh) 一种分配在线客服的方法、装置和存储介质
Chan Online auction customer segmentation using a neural network model
CN111199473A (zh) 基于交易记录信息的反作弊方法、装置和系统
Dellarocas The design of reliable trust management systems for electronic trading communities
Chaveesuk et al. Use of QR code technology in eastern Thailand: Entrepreneur perspective
CN112634061A (zh) 一种用户数据处理方法及装置
CN112330373A (zh) 用户行为分析方法、装置及计算机可读存储介质
CN112288475A (zh) 产品推荐方法、装置及电子设备
US11561963B1 (en) Method and system for using time-location transaction signatures to enrich user profiles
EP3420525A1 (en) Method and device for determining premium rates and discounts for insurance customers
CN116503092A (zh) 用户留资意向识别方法、装置、电子设备及存储介质
Tan et al. The impact of feature selection: A data‐mining application in direct marketing
CN116361542A (zh) 产品推荐方法、装置、计算机设备和存储介质
CN115660814A (zh) 风险预测方法、装置、计算机可读存储介质及电子设备
Dias et al. Adoption factors of P2P lending in India
CN113706258A (zh) 基于组合模型的产品推荐方法、装置、设备及存储介质
CN115860889A (zh) 一种基于人工智能的金融贷款大数据管理方法及系统
Khan A short review of the electronic banking system
CN111461863A (zh) 数据处理方法、装置、计算机设备及存储介质
Ramaswami et al. Electronic channel customers for financial products: test of ability-motivation-opportunity model

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant