CN116402625B - 客户评估方法、装置、计算机设备及存储介质 - Google Patents
客户评估方法、装置、计算机设备及存储介质 Download PDFInfo
- Publication number
- CN116402625B CN116402625B CN202310665397.5A CN202310665397A CN116402625B CN 116402625 B CN116402625 B CN 116402625B CN 202310665397 A CN202310665397 A CN 202310665397A CN 116402625 B CN116402625 B CN 116402625B
- Authority
- CN
- China
- Prior art keywords
- chromosome
- customer
- population
- gene
- sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000011156 evaluation Methods 0.000 title claims abstract description 75
- 210000000349 chromosome Anatomy 0.000 claims abstract description 329
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 246
- 238000006243 chemical reaction Methods 0.000 claims abstract description 84
- 230000002068 genetic effect Effects 0.000 claims abstract description 35
- 238000000034 method Methods 0.000 claims abstract description 30
- 238000010276 construction Methods 0.000 claims description 20
- 230000009466 transformation Effects 0.000 claims description 19
- 230000007614 genetic variation Effects 0.000 claims description 7
- 230000000717 retained effect Effects 0.000 claims description 2
- 238000000844 transformation Methods 0.000 claims 2
- 238000013473 artificial intelligence Methods 0.000 abstract description 7
- 108700028369 Alleles Proteins 0.000 description 15
- 238000005516 engineering process Methods 0.000 description 12
- 238000004364 calculation method Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 238000012216 screening Methods 0.000 description 6
- 230000001902 propagating effect Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 3
- 239000002699 waste material Substances 0.000 description 3
- 101150110188 30 gene Proteins 0.000 description 2
- 206010064571 Gene mutation Diseases 0.000 description 2
- 230000002759 chromosomal effect Effects 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000003066 decision tree Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 230000035772 mutation Effects 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 235000019800 disodium phosphate Nutrition 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000008303 genetic mechanism Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/08—Insurance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/12—Computing arrangements based on biological models using genetic models
- G06N3/126—Evolutionary algorithms, e.g. genetic algorithms or genetic programming
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Theoretical Computer Science (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Physics & Mathematics (AREA)
- Technology Law (AREA)
- Biomedical Technology (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- Economics (AREA)
- Development Economics (AREA)
- Physiology (AREA)
- Genetics & Genomics (AREA)
- Artificial Intelligence (AREA)
- General Business, Economics & Management (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请属于人工智能和医疗保险领域,涉及一种客户评估方法、装置、计算机设备及存储介质,方法包括:获取多个客户样本,客户样本包括转化标签和客户特征;构建各客户特征所对应的基因类型,并根据各基因类型生成基因库,每种基因类型包含多个基因;根据基因库生成多条染色体以构建种群,并计算各染色体的适应度,各染色体互不相同,且均包含各客户特征所对应的基因类型;基于适应度,通过遗传算法对种群中的各染色体进行迭代得到目标种群;获取候选客户的待评估样本,并根据目标种群中的目标染色体对待评估样本进行评估,得到客户评估结果。本申请还涉及区块链技术,客户样本可存储于区块链中。本申请提高了客户评估的准确性。
Description
技术领域
本申请涉及人工智能和医疗保险领域,尤其涉及一种客户评估方法、装置、计算机设备及存储介质。
背景技术
随着计算机技术的发展,各种计算机技术在医疗保险领域中的使用越来越广泛。例如,保险公司根据决策树或神经网络等构建判别模型,由判别模型对客户数据进行处理,从而评估客户购买医疗保险产品的意愿以及可能性。随着业务的不断推进,可能要在各种新的场景下进行客户评估,但是这时样本和特征数量较少,传统的决策树往往会得出局部最优解而无法得到全局最优解,机器学习会因为样本和特征较少导致过拟合或欠拟合,使得客户评估的准确性较低。
发明内容
本申请实施例的目的在于提出一种客户评估方法、装置、计算机设备及存储介质,以解决样本较少时客户评估准确性较低的问题。
为了解决上述技术问题,本申请实施例提供一种客户评估方法,采用了如下所述的技术方案:
获取多个客户样本,每个客户样本包括转化标签和第一数量的客户特征;
根据各客户样本,构建各客户特征所对应的基因类型,并根据各客户特征所对应的基因类型生成基因库,每种基因类型包含多个基因,且所述多个基因根据所述基因类型所对应客户特征的特征值构建得到;
根据所述基因库生成第二数量的染色体以构建种群,并根据所述种群中各染色体所对应客户样本的转化标签,计算所述各染色体的适应度,其中,所述各染色体互不相同,所述各染色体为包含所述各客户特征所对应基因类型的虚拟个体,所述种群为所述第二数量的染色体构成的集合;
基于得到的适应度,通过遗传算法对所述种群中的所述各染色体进行迭代,得到目标种群;
获取候选客户的待评估样本,并根据所述目标种群中的目标染色体对所述待评估样本进行评估,得到客户评估结果。
为了解决上述技术问题,本申请实施例还提供一种客户评估装置,采用了如下所述的技术方案:
样本获取模块,用于获取多个客户样本,每个客户样本包括转化标签和第一数量的客户特征;
基因构建模块,用于根据各客户样本,构建各客户特征所对应的基因类型,并根据各客户特征所对应的基因类型生成基因库,每种基因类型包含多个基因,且所述多个基因根据所述基因类型所对应客户特征的特征值构建得到;
种群构建模块,用于根据所述基因库生成第二数量的染色体以构建种群,并根据所述种群中各染色体所对应客户样本的转化标签,计算所述各染色体的适应度,其中,所述各染色体互不相同,所述各染色体为包含所述各客户特征所对应基因类型的虚拟个体,所述种群为所述第二数量的染色体构成的集合;
种群迭代模块,用于基于得到的适应度,通过遗传算法对所述种群中的所述各染色体进行迭代,得到目标种群;
样本评估模块,用于获取候选客户的待评估样本,并根据所述目标种群中的目标染色体对所述待评估样本进行评估,得到客户评估结果。
为了解决上述技术问题,本申请实施例还提供一种计算机设备,采用了如下所述的技术方案:
获取多个客户样本,每个客户样本包括转化标签和第一数量的客户特征;
根据各客户样本,构建各客户特征所对应的基因类型,并根据各客户特征所对应的基因类型生成基因库,每种基因类型包含多个基因,且所述多个基因根据所述基因类型所对应客户特征的特征值构建得到;
根据所述基因库生成第二数量的染色体以构建种群,并根据所述种群中各染色体所对应客户样本的转化标签,计算所述各染色体的适应度,其中,所述各染色体互不相同,所述各染色体为包含所述各客户特征所对应基因类型的虚拟个体,所述种群为所述第二数量的染色体构成的集合;
基于得到的适应度,通过遗传算法对所述种群中的所述各染色体进行迭代,得到目标种群;
获取候选客户的待评估样本,并根据所述目标种群中的目标染色体对所述待评估样本进行评估,得到客户评估结果。
为了解决上述技术问题,本申请实施例还提供一种计算机可读存储介质,采用了如下所述的技术方案:
获取多个客户样本,每个客户样本包括转化标签和第一数量的客户特征;
根据各客户样本,构建各客户特征所对应的基因类型,并根据各客户特征所对应的基因类型生成基因库,每种基因类型包含多个基因,且所述多个基因根据所述基因类型所对应客户特征的特征值构建得到;
根据所述基因库生成第二数量的染色体以构建种群,并根据所述种群中各染色体所对应客户样本的转化标签,计算所述各染色体的适应度,其中,所述各染色体互不相同,所述各染色体为包含所述各客户特征所对应基因类型的虚拟个体,所述种群为所述第二数量的染色体构成的集合;
基于得到的适应度,通过遗传算法对所述种群中的所述各染色体进行迭代,得到目标种群;
获取候选客户的待评估样本,并根据所述目标种群中的目标染色体对所述待评估样本进行评估,得到客户评估结果。
与现有技术相比,本申请实施例主要有以下有益效果:获取多个客户样本,客户样本包括转化标签和多种客户特征;构建各客户特征所对应的基因类型,基因类型下包含多个基因,并根据各客户特征所对应的基因类型生成基因库;根据基因库生成多条染色体以构建种群,染色体需包含各客户特征所对应的基因类型以实现特征覆盖;生成的染色体具有对应的客户样本,客户样本的转化标签反应了客户是否完成转化,根据各染色体所对应客户样本的转化标签,计算各染色体的适应度;在遗传算法的每一轮迭代中,根据种群中各染色体的适应度,对染色体进行选择、繁殖与进化,筛选出适应度较高的染色体,并在迭代结束后得到目标种群;获取候选客户的待评估样本,根据目标种群中目标染色体与待评估样本基因组的匹配度,对候选客户进行评估,得到表示客户转化可能性的客户评估结果;本申请通过遗传算法跳出局部最优解,在缺少样本和特征的情况下,寻找出转化率最高的个体,并根据其对候选客户进行评估,提高了客户评估的准确性。
附图说明
为了更清楚地说明本申请中的方案,下面将对本申请实施例描述中所需要使用的附图作一个简单介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请可以应用于其中的示例性系统架构图;
图2是根据本申请的客户评估方法的一个实施例的流程图;
图3是根据本申请的客户评估装置的一个实施例的结构示意图;
图4是根据本申请的计算机设备的一个实施例的结构示意图。
具体实施方式
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同;本文中在申请的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本申请;本申请的说明书和权利要求书及上述附图说明中的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。本申请的说明书和权利要求书或上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
为了使本技术领域的人员更好地理解本申请方案,下面将结合附图,对本申请实施例中的技术方案进行清楚、完整地描述。
如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如网页浏览器应用、购物类应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。
终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器( Moving Picture ExpertsGroup Audio Layer III,动态影像专家压缩标准音频层面3 )、MP4( Moving PictureExperts Group Audio Layer IV,动态影像专家压缩标准音频层面4 )播放器、膝上型便携计算机和台式计算机等等。
服务器105可以是提供各种服务的服务器,例如对终端设备101、102、103上显示的页面提供支持的后台服务器。
需要说明的是,本申请实施例所提供的客户评估方法一般由服务器执行,相应地,客户评估装置一般设置于服务器中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
继续参考图2,示出了根据本申请的客户评估方法的一个实施例的流程图。所述的客户评估方法,包括以下步骤:
步骤S201,获取多个客户样本,每个客户样本包括转化标签和第一数量的客户特征。
在本实施例中,客户评估方法运行于其上的电子设备(例如图1所示的服务器)可以通过有线连接方式或者无线连接方式与终端设备进行通信。需要指出的是,上述无线连接方式可以包括但不限于3G/4G/5G连接、WiFi连接、蓝牙连接、WiMAX连接、Zigbee连接、UWB( ultra wideband )连接、以及其他现在已知或将来开发的无线连接方式。
具体地,获取多个客户样本,客户样本是对已有客户的客户数据进行预处理以及特征采集得到的;客户数据中包含多种初始客户特征,对初始客户特征进行预处理(例如进行量化或者标准化处理),然后对初始客户特征进行筛选,留下第一数量的客户特征。
客户样本包括转化标签和第一数量的客户特征,其中,转化标签表示客户样本所对应的客户是否完成了转化(在医疗保险领域,可以是指客户是否购买了医疗保险产品或者医疗相关的服务)。客户特征包含客户的基本信息、职业信息、机构自有数据以及第三方数据;基本信息包括客户的年龄、性别、地区等;职业信息包括客户的行业、职位、收入等;机构自有数据是机构拥有的和客户相关的数据,通常和机构自身业务相关,对于保险公司等金融机构,机构自有数据可以包括历史询价信息、保单信息、理赔信息等;第三方数据包括同业数据等,同业数据是指与当前机构相同性质的其他机构所拥有的该客户的数据,例如其他保险公司中该客户的理赔信息。需要指出的是,本申请中的各种客户特征,是在得到客户授权许可的情况下获取的。
步骤S202,根据各客户样本,构建各客户特征所对应的基因类型,并根据各客户特征所对应的基因类型生成基因库,每种基因类型包含多个基因,且多个基因根据基因类型所对应客户特征的特征值构建得到。
具体地,本申请采用了遗传算法,表述中提到的基因、等位基因、基因库、染色体、种群、染色体交叉、基因变异等概念属于遗传算法中的概念,可以结合生物学领域中相应的概念进行理解,需要特别指出的是,上述基因、染色体等概念并非真实的基因、染色体等,且本申请并不涉及生物体的遗传资源。
对于每种客户特征,需要构建该客户特征所对应的基因类型,基因类型中包含多个等位基因。可以理解,构建某种客户特征A的基因类型时,需要依据全部客户样本中客户特征A所对应的特征值,从而确保创建出的基因类型可以覆盖全部的客户样本。
根据全部客户特征所对应的基因类型,可以生成基因库。
步骤S203,根据基因库生成第二数量的染色体以构建种群,并根据种群中各染色体所对应客户样本的转化标签,计算各染色体的适应度,其中,各染色体互不相同,各染色体为包含各客户特征所对应基因类型的虚拟个体,种群为所述第二数量的染色体构成的集合。
具体地,根据基因库生成第二数量的染色体,生成的染色体各不相同(或者,生成的染色体也可以相同,但是在后续处理中,将相同的染色体视作一个整体进行处理,例如将相同的染色体当作一个整体进行适应度的计算),并且,每条染色体均包含全部客户特征所对应的基因类型,假如有30个客户特征,则基因库中包含有30个基因类型,每个基因类型下包含多个等位基因,每个染色体上均包含30个基因类型,即染色体需要具有30种不同基因类型的基因,从而覆盖全部的客户特征;构建染色体时,对于基因类型A,从基因类型A的多个等位基因中,随机选取至少一个等位基因。
可以理解,基于基因库,可以确定各客户样本的基因组。本申请中构建出的染色体,需要有对应的客户样本,即,对于染色体,假设其有30个基因类型,现有染色体/>对应的客户样本/>,客户样本/>中的30个基因,都需要与染色体/>中30个对应的基因类型相匹配;比如,客户样本/>中有基因/>,当染色体/>中的基因类型A下具有基因/>或者/>时,客户样本/>中的基因/>与染色体/>中的基因类型A实现匹配;当染色体/>中的基因类型A下具有基因/>时,客户样本/>中的基因/>与染色体/>中的基因类型A不匹配。
每条染色体可以视作一个虚拟的生物个体,构建出的全部染色体可以构成种群。
对于种群中的每条染色体,获取染色体所对应的多个客户样本,客户样本具有转化标签,本申请是对客户转化可能性的评估(例如客户购买保险产品的意愿以及可能性),转化标签反应了客户样本所对应客户的转化情况,因此根据染色体所对应的多个客户样本的转化标签,计算该染色体的适应度。
进一步的,上述根据种群中各染色体所对应客户样本的转化标签,计算各染色体的适应度的步骤可以包括:对于种群中的每条染色体,获取与染色体实现基因匹配的各客户样本,并统计各客户样本的样本数量;根据各客户样本的转化标签,统计各客户样本中转化客户样本的转化数量;根据转化数量和样本数量,计算染色体的适应度。
其中,转化客户样本可以是指完成转化的客户所对应的客户样本,客户是否完成转化通过客户样本的转化标签确定。
具体地,对于种群中的每条染色体,获取与该染色体实现基因匹配(基因匹配的内涵在上文已进行解释)的各客户样本,并统计实现基因匹配的各客户样本的样本数量。转化标签可以显示客户样本是否完成了转化,则根据各客户样本的转化标签,可以统计出各客户样本中转化客户样本的转化数量;令转化数量除以样本数量,可以得到该染色体的适应度。
可以理解,在本申请中,染色体的适应度越高,代表该染色体所对应的客户样本中,已转化客户样本的比例越高,该染色体所代表的个体适应性越强、在种群中越强,并且进化程度越高。
本实施例中,对于每条染色体,获取与染色体实现基因匹配的各客户样本,并统计各客户样本的样本数量;根据各客户样本的转化标签,确定转化客户样本的转化数量;根据转化数量和样本数量,计算染色体的适应度,以便后续根据适应度对种群进行选择与进化。
步骤S204,基于得到的适应度,通过遗传算法对种群中的各染色体进行迭代,得到目标种群。
具体地,遗传算法(Genetic Algorithm,GA)是根据大自然中生物体进化规律而设计提出的一种算法。它是模拟达尔文生物进化论的自然选择和遗传学机理的生物进化过程的计算模型,是一种通过模拟自然进化过程搜索最优解的方法。
在生物进化过程中,生物对自然环境的适应度越高,生物越有可能繁殖后代并留下其基因。在遗传算法的每一轮迭代中,本申请可以计算出种群中各染色体的适应度,并选择适应度较高的染色体参与下一轮的迭代,从而模拟生物学中的自然选择、繁殖与进化,并逐步筛选出适应度较高的染色体。
迭代完成后得到目标种群,目标种群中具有至少一条目标染色体,目标染色体具有较高的适应度,其对应的客户群体具有较高的转化率。
步骤S205,获取候选客户的待评估样本,并根据目标种群中的目标染色体对待评估样本进行评估,得到客户评估结果。
具体地,在应用时,获取候选客户的待评估样本,并获取目标种群中的目标染色体,将待评估样本的基因组与目标染色体上基因组进行比对得到匹配度,匹配度以数值表示待评估样本与目标染色体的匹配程度,或者说待评估样本的基因组与目标染色体上基因组的相似程度。
目标染色体具有较高的适应度,待评估样本与目标染色体的匹配度越高,代表待评估样本的基因组与目标染色体上的基因组越相似,则待评估样本也具有较高的适应度,代表候选客户具有较高的转化可能性。
根据计算出的匹配度,可以生成候选客户的客户评估结果,客户评估结果可以表示候选客户的客户意向,该意向是指候选客户购买产品或服务、完成转化的可能性。
进一步的,上述步骤S205之后,还可以包括:当根据客户评估结果确定候选客户属于目标客户时,对目标客户进行产品推荐。
具体地,客户评估结果可以显示候选客户转化可能性的高低,当候选客户具有较高的转化可能性时,将候选客户确定为目标客户,并对目标客户进行产品推荐。目标客户具有较高的转化可能性,对目标客户进行产品推荐,可以提高客户转化率以及产品推荐的效率以及准确性,避免产品推荐中的资源浪费。
需要指出的是,本申请中的客户意向评估,除了对购买医疗保险产品的意愿评估,还可以是购买其他各种金融保险产品的评估;此外,还可以是购买其他各种产品的评估。
本实施例中,当根据客户评估结果确定候选客户具有较高的转化可能性时,将其确定为目标客户进行产品推荐,可以提高客户转化率、产品推荐的效率以及准确性,避免产品推荐中的资源浪费。
本实施例中,获取多个客户样本,客户样本包括转化标签和多种客户特征;构建各客户特征所对应的基因类型,基因类型下包含多个基因,并根据各客户特征所对应的基因类型生成基因库;根据基因库生成多条染色体以构建种群,染色体需包含各客户特征所对应的基因类型以实现特征覆盖;生成的染色体具有对应的客户样本,客户样本的转化标签反应了客户是否完成转化,根据各染色体所对应客户样本的转化标签,计算各染色体的适应度;在遗传算法的每一轮迭代中,根据种群中各染色体的适应度,对染色体进行选择、繁殖与进化,筛选出适应度较高的染色体,并在迭代结束后得到目标种群;获取候选客户的待评估样本,根据目标种群中目标染色体与待评估样本基因组的匹配度,对候选客户进行评估,得到表示客户转化可能性的客户评估结果;本申请通过遗传算法跳出局部最优解,在缺少样本和特征的情况下,寻找出转化率最高的个体,并根据其对候选客户进行评估,提高了客户评估的准确性。
进一步的,上述根据各客户样本,构建各客户特征所对应的基因类型的步骤可以包括:对于每种客户特征,根据各客户样本确定客户特征的特征范围;获取客户特征所对应的分位数;根据分位数划分特征范围,并将划分得到的各子范围分别构建成基因;根据得到的各基因生成客户特征所对应的基因类型。
具体地,对于某种客户特征A,根据全部客户样本中客户特征A所对应的特征值,确定客户特征A的特征范围;然后获取客户特征A所对应的分位数,分位数(Quantile)亦称分位点,是指将一个分布范围分为几个等份的数值点,例如中位数(即二分位数)、四分位数、百分位数等;对于不同的客户特征,其所对应的分位数不同。
根据分位数对客户特征A的特征范围进行划分,得到多个子范围,每个子范围可以构建为一个基因;根据客户特征A构建得到的全部基因组成客户特征A所对应的基因类型。
举例说明,在一个实施例中,假设客户特征A的特征范围是[0,100],分位数是十分位数,则将客户特征A的取值范围划分为十个子范围,每个子范围例如[0,10)、[10,20)可以分别构建为等位基因、/>。在另一种实施例中,根据第一个十分位数划分出取值范围[0,10)、[10,100],可以根据子范围[0,10)构建出等位基因/>,(下标10表示比第一个分位数小的子范围),根据子范围[10,100]构建出等位基因/>(下标11表示比第一个分位数大的子范围);同样地,根据第二个十分位数划分出取值范围[0,20)、[20,100],可以根据子范围[0,20)构建出等位基因/>,(下标20表示比第二个分位数小的子范围),根据子范围[20,100]构建出等位基因/>(下标21表示比第二个分位数大的子范围)。
本实施例中,对于每种客户特征,根据各客户样本确定客户特征的特征范围,以覆盖所有客户样本在客户特征上的取值;获取客户特征所对应的分位数;根据分位数划分特征范围,将得到的各子范围分别构建成基因;根据各基因生成客户特征所对应的基因类型,从而完成客户特征所对应基因类型的构建。
进一步的,上述根据基因库生成第二数量的染色体以构建种群的步骤可以包括:随机生成多条染色体,其中,各染色体互不相同,各染色体包含各客户特征所对应的基因类型,且各染色体中的每个基因类型包含至少一个基因类型下的基因;对于每条染色体,统计与染色体实现基因匹配的客户样本的样本数量;当样本数量大于等于预设的数量阈值时,保留染色体;当保留的染色体数量达到预设的第二数量时,根据第二数量的染色体构建种群。
具体地,随机生成多条染色体,通常,生成的各染色体互不相同,各染色体需包含全部客户特征所对应的基因类型。
由于每种基因类型包含多个等位基因,对于每条染色体,染色体上每种基因类型可以设置为一个具体的等位基因,也可以设置为多个等位基因。例如,对于基因类型A,其具有等位基因,从各等位基因中选取一个等位基因例如/>,并将染色体在基因类型A上的取值设置为/>;或者,选取/>这样一个范围内的等位基因,作为染色体在基因类型A上的取值范围。
对于每条染色体,统计与染色体实现基因匹配的客户样本的样本数量。本申请设置了数量阈值,如果样本数量大于等于数量阈值,表示该染色体对应的客户样本数量较多,达到观测要求,该染色体带来的数据具有更高的可靠性和准确性,保留该染色体;否则,表示该染色体没有对应的客户样本,或者该染色体对应的客户样本数量较少,对该染色体的观测不具备代表性,可以将其丢弃。例如,将数量阈值设置为30,如果染色体对应的客户样本数量为36,则保留该染色体,否则将该染色体丢弃。
需要指出的是,本申请中生成染色体可以是随机的,但是生成染色体后需要进行两步校验:第一步是校验染色体是否对应有真实的客户样本,如果生成的染色体没有对应真实的客户样本,表示染色体生成错误,需要丢弃;当染色体对应有真实的客户样本时,再校验染色体所对应客户样本的样本数量是否大于等于数量阈值,如果大于等于数量阈值,则将染色体保留,否则将染色体丢弃。服务器可以记录丢弃过的染色体,并不再生成同样的染色体。后文中提到通过染色体交叉或基因变异生成的染色体,也需要遵循上述规则。
本实施例中,随机生成多条染色体,各染色体互不相同,各染色体包含各客户特征所对应的基因类型,且各染色体中的每个基因类型包含至少一个基因类型下的基因;对于每条染色体,统计与染色体实现基因匹配的客户样本的样本数量;当样本数量大于等于预设的数量阈值时,表示染色体具备观测价值,保留染色体;当保留的染色体数量达到预设的第二数量时,根据第二数量的染色体构建种群,从而完成种群的构建。
进一步的,上述步骤S204可以包括:在种群中,选取适应度符合适应度条件的染色体,得到多条母染色体;对各母染色体分别进行基于遗传算法的染色体交叉或基因变异,得到多条子染色体;根据各子染色体所对应客户样本的转化标签,计算各子染色体的适应度;选取适应度符合适应度条件的子染色体作为新的母染色体进行迭代,直至达到预设的迭代停止条件,得到目标种群。
具体地,在种群中,选取适应度符合适应度条件的染色体,得到多条母染色体。适应度条件可以是染色体的适应度大于预设的适应度阈值,或者按照适应度对各染色体进行降序排序后,染色体的适应度排在前N位或者前n%。
对各母染色体分别进行染色体交叉或基因变异,得到多条子染色体;这里的染色体交叉和基因变异,是按照遗传算法中相应的概念进行处理。
根据各子染色体所对应客户样本的转化标签,计算各子染色体的适应度;选取适应度符合适应度条件的子染色体作为新的母染色体进行迭代,直至达到预设的迭代停止条件,得到目标种群。迭代停止条件可以是迭代次数达到预设数值,或者出现预设条数的、适应度达到预设阈值的染色体。
本实施例中,通过遗传算法对种群中的各染色体进行迭代,染色体交叉和基因变异的加入可以跳出局部最优解,在缺少样本和特征的情况下,快速寻找到转化率较高的个体。
进一步的,对于目标种群中目标染色体上的每个基因类型,均包含至少一个基因类型下的基因,则上述根据目标种群中的目标染色体对待评估样本进行评估,得到客户评估结果的步骤可以包括:确定待评估样本中各客户特征分别对应的基因;对于每个基因,判断基因与目标染色体上对应基因类型下的基因是否匹配,得到匹配判断结果;根据各匹配判断结果,计算待评估样本与目标染色体的匹配度;根据匹配度以及目标染色体的适应度,生成客户评估结果。
具体地,对于目标种群中目标染色体上的每个基因类型,均包含至少一个基因类型下的等位基因。
获取到待评估样本后,确定待评估样本中各客户特征分别对应的基因,得到待评估样本的基因组。对于基因组中的每个基因,判断基因与目标染色体上对应基因类型下的基因是否匹配,即,判断目标染色体上对应基因类型的取值范围是否包含基因组中的这个基因;如果包含,则表示匹配,如果不包含,则表示不匹配;并生成相应的匹配判断结果。
根据各匹配判断结果,计算待评估样本与目标染色体的匹配度,匹配度的计算可以是待评估样本基因组中能够匹配的基因数量,与基因类型数量的比值。例如,假如基因组中有15个基因能够匹配,基因类型数量为30,则匹配度为50%。
根据匹配度以及目标染色体的适应度,生成客户评估结果;可以理解,匹配度越高且目标染色体的适应度越高,则候选客户完成转化的可能性越高。在一个实施例中,将匹配度和目标染色体的适应度相乘,将相乘结果作为客户评估结果中的一种参数。
在一个实施例中,当目标染色体有多个时,可以选取适应度最高的目标染色体进行客户评估,也可以选择适应度最低的目标染色体进行客户评估,或者随机选取目标染色体进行客户评估。
本实施例中,确定待评估样本中各客户特征分别对应的基因;对于每个基因,判断基因与目标染色体上对应基因类型下的基因是否匹配,得到匹配判断结果;根据各匹配判断结果,计算待评估样本与目标染色体的匹配度;根据匹配度以及目标染色体的适应度,生成客户评估结果,目标染色体基于遗传算法得到,确保了客户评估结果的准确性。
需要强调的是,为进一步保证上述客户样本的私密和安全性,上述客户样本还可以存储于一区块链的节点中。
本申请所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
本申请实施例可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机可读指令来指令相关的硬件来完成,该计算机可读指令可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,前述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)等非易失性存储介质,或随机存储记忆体(Random Access Memory,RAM)等。
应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
进一步参考图3,作为对上述图2所示方法的实现,本申请提供了一种客户评估装置的一个实施例,该装置实施例与图2所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
如图3所示,本实施例所述的客户评估装置300包括:样本获取模块301、基因构建模块302、种群构建模块303、种群迭代模块304以及样本评估模块305,其中:
样本获取模块301,用于获取多个客户样本,每个客户样本包括转化标签和第一数量的客户特征。
基因构建模块302,用于根据各客户样本,构建各客户特征所对应的基因类型,并根据各客户特征所对应的基因类型生成基因库,每种基因类型包含多个基因,且多个基因根据基因类型所对应客户特征的特征值构建得到。
种群构建模块303,用于根据基因库生成第二数量的染色体以构建种群,并根据种群中各染色体所对应客户样本的转化标签,计算各染色体的适应度,其中,各染色体互不相同,各染色体为包含各客户特征所对应基因类型的虚拟个体,种群为所述第二数量的染色体构成的集合。
种群迭代模块304,用于基于得到的适应度,通过遗传算法对种群中的各染色体进行迭代,得到目标种群。
样本评估模块305,用于获取候选客户的待评估样本,并根据目标种群中的目标染色体对待评估样本进行评估,得到客户评估结果。
本实施例中,获取多个客户样本,客户样本包括转化标签和多种客户特征;构建各客户特征所对应的基因类型,基因类型下包含多个基因,并根据各客户特征所对应的基因类型生成基因库;根据基因库生成多条染色体以构建种群,染色体需包含各客户特征所对应的基因类型以实现特征覆盖;生成的染色体具有对应的客户样本,客户样本的转化标签反应了客户是否完成转化,根据各染色体所对应客户样本的转化标签,计算各染色体的适应度;在遗传算法的每一轮迭代中,根据种群中各染色体的适应度,对染色体进行选择、繁殖与进化,筛选出适应度较高的染色体,并在迭代结束后得到目标种群;获取候选客户的待评估样本,根据目标种群中目标染色体与待评估样本基因组的匹配度,对候选客户进行评估,得到表示客户转化可能性的客户评估结果;本申请通过遗传算法跳出局部最优解,在缺少样本和特征的情况下,寻找出转化率最高的个体,并根据其对候选客户进行评估,提高了客户评估的准确性。
在本实施例的一些可选的实现方式中,基因构建模块302可以包括:范围确定子模块、分位数获取子模块、基因构建子模块以及类型生成子模块,其中:
范围确定子模块,用于对于每种客户特征,根据各客户样本确定客户特征的特征范围。
分位数获取子模块,用于获取客户特征所对应的分位数。
基因构建子模块,用于根据分位数划分特征范围,并将划分得到的各子范围分别构建成基因。
类型生成子模块,用于根据得到的各基因生成客户特征所对应的基因类型。
本实施例中,对于每种客户特征,根据各客户样本确定客户特征的特征范围,以覆盖所有客户样本在客户特征上的取值;获取客户特征所对应的分位数;根据分位数划分特征范围,将得到的各子范围分别构建成基因;根据各基因生成客户特征所对应的基因类型,从而完成客户特征所对应基因类型的构建。
在本实施例的一些可选的实现方式中,种群构建模块303可以包括:染色体生成子模块、数量统计子模块、染色体保留子模块以及种群构建子模块,其中:
染色体生成子模块,用于随机生成多条染色体,其中,各染色体互不相同,各染色体包含各客户特征所对应的基因类型,且各染色体中的每个基因类型包含至少一个基因类型下的基因。
数量统计子模块,用于对于每条染色体,统计与染色体实现基因匹配的客户样本的样本数量。
染色体保留子模块,用于当样本数量大于等于预设的数量阈值时,保留染色体。
种群构建子模块,用于当保留的染色体数量达到预设的第二数量时,根据第二数量的染色体构建种群。
本实施例中,随机生成多条染色体,各染色体互不相同,各染色体包含各客户特征所对应的基因类型,且各染色体中的每个基因类型包含至少一个基因类型下的基因;对于每条染色体,统计与染色体实现基因匹配的客户样本的样本数量;当样本数量大于等于预设的数量阈值时,表示染色体具备观测价值,保留染色体;当保留的染色体数量达到预设的第二数量时,根据第二数量的染色体构建种群,从而完成种群的构建。
在本实施例的一些可选的实现方式中,种群构建模块303还可以包括:样本统计子模块、转化统计子模块以及适应度计算子模块,其中:
样本统计子模块,用于对于种群中的每条染色体,获取与染色体实现基因匹配的各客户样本,并统计各客户样本的样本数量。
转化统计子模块,用于根据各客户样本的转化标签,统计各客户样本中转化客户样本的转化数量。
适应度计算子模块,用于根据转化数量和样本数量,计算染色体的适应度。
本实施例中,对于每条染色体,获取与染色体实现基因匹配的各客户样本,并统计各客户样本的样本数量;根据各客户样本的转化标签,确定转化客户样本的转化数量;根据转化数量和样本数量,计算染色体的适应度,以便后续根据适应度对种群进行选择与进化。
在本实施例的一些可选的实现方式中,种群迭代模块304可以包括:染色体选取子模块、交叉变异子模块、计算子模块以及迭代子模块,其中:
染色体选取子模块,用于在种群中,选取适应度符合适应度条件的染色体,得到多条母染色体。
交叉变异子模块,用于对各母染色体分别进行基于遗传算法的染色体交叉或基因变异,得到多条子染色体。
计算子模块,用于根据各子染色体所对应客户样本的转化标签,计算各子染色体的适应度。
迭代子模块,用于选取适应度符合适应度条件的子染色体作为新的母染色体进行迭代,直至达到预设的迭代停止条件,得到目标种群。
本实施例中,通过遗传算法对种群中的各染色体进行迭代,染色体交叉和基因变异的加入可以跳出局部最优解,在缺少样本和特征的情况下,快速寻找到转化率较高的个体。
在本实施例的一些可选的实现方式中,对于目标种群中目标染色体上的每个基因类型,均包含至少一个基因类型下的基因,则样本评估模块305可以包括:基因确定子模块、匹配判断子模块、匹配度计算子模块以及结果生成子模块,其中:
基因确定子模块,用于确定待评估样本中各客户特征分别对应的基因。
匹配判断子模块,用于对于每个基因,判断基因与目标染色体上对应基因类型下的基因是否匹配,得到匹配判断结果。
匹配度计算子模块,用于根据各匹配判断结果,计算待评估样本与目标染色体的匹配度。
结果生成子模块,用于根据匹配度以及目标染色体的适应度,生成客户评估结果。
本实施例中,确定待评估样本中各客户特征分别对应的基因;对于每个基因,判断基因与目标染色体上对应基因类型下的基因是否匹配,得到匹配判断结果;根据各匹配判断结果,计算待评估样本与目标染色体的匹配度;根据匹配度以及目标染色体的适应度,生成客户评估结果,目标染色体基于遗传算法得到,确保了客户评估结果的准确性。
在本实施例的一些可选的实现方式中,客户评估装置300还可以包括:产品推荐模块,用于当根据客户评估结果确定候选客户属于目标客户时,对目标客户进行产品推荐。
本实施例中,当根据客户评估结果确定候选客户具有较高的转化可能性时,将其确定为目标客户进行产品推荐,可以提高客户转化率、产品推荐的效率以及准确性,避免产品推荐中的资源浪费。
为解决上述技术问题,本申请实施例还提供计算机设备。具体请参阅图4,图4为本实施例计算机设备基本结构框图。
所述计算机设备4包括通过系统总线相互通信连接存储器41、处理器42、网络接口43。需要指出的是,图中仅示出了具有组件41-43的计算机设备4,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。其中,本技术领域技术人员可以理解,这里的计算机设备是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(ApplicationSpecific Integrated Circuit,ASIC)、可编程门阵列(Field-Programmable GateArray,FPGA)、数字处理器 (Digital Signal Processor,DSP)、嵌入式设备等。
所述计算机设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述计算机设备可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。
所述存储器41至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,所述存储器41可以是所述计算机设备4的内部存储单元,例如该计算机设备4的硬盘或内存。在另一些实施例中,所述存储器41也可以是所述计算机设备4的外部存储设备,例如该计算机设备4上配备的插接式硬盘,智能存储卡(Smart Media Card, SMC),安全数字(Secure Digital, SD)卡,闪存卡(FlashCard)等。当然,所述存储器41还可以既包括所述计算机设备4的内部存储单元也包括其外部存储设备。本实施例中,所述存储器41通常用于存储安装于所述计算机设备4的操作系统和各类应用软件,例如客户评估方法的计算机可读指令等。此外,所述存储器41还可以用于暂时地存储已经输出或者将要输出的各类数据。
所述处理器42在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器42通常用于控制所述计算机设备4的总体操作。本实施例中,所述处理器42用于运行所述存储器41中存储的计算机可读指令或者处理数据,例如运行所述客户评估方法的计算机可读指令。
所述网络接口43可包括无线网络接口或有线网络接口,该网络接口43通常用于在所述计算机设备4与其他电子设备之间建立通信连接。
本实施例中提供的计算机设备可以执行上述客户评估方法。此处客户评估方法可以是上述各个实施例的客户评估方法。
本实施例中,获取多个客户样本,客户样本包括转化标签和多种客户特征;构建各客户特征所对应的基因类型,基因类型下包含多个基因,并根据各客户特征所对应的基因类型生成基因库;根据基因库生成多条染色体以构建种群,染色体需包含各客户特征所对应的基因类型以实现特征覆盖;生成的染色体具有对应的客户样本,客户样本的转化标签反应了客户是否完成转化,根据各染色体所对应客户样本的转化标签,计算各染色体的适应度;在遗传算法的每一轮迭代中,根据种群中各染色体的适应度,对染色体进行选择、繁殖与进化,筛选出适应度较高的染色体,并在迭代结束后得到目标种群;获取候选客户的待评估样本,根据目标种群中目标染色体与待评估样本基因组的匹配度,对候选客户进行评估,得到表示客户转化可能性的客户评估结果;本申请通过遗传算法跳出局部最优解,在缺少样本和特征的情况下,寻找出转化率最高的个体,并根据其对候选客户进行评估,提高了客户评估的准确性。
本申请还提供了另一种实施方式,即提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可读指令,所述计算机可读指令可被至少一个处理器执行,以使所述至少一个处理器执行如上述的客户评估方法的步骤。
本实施例中,获取多个客户样本,客户样本包括转化标签和多种客户特征;构建各客户特征所对应的基因类型,基因类型下包含多个基因,并根据各客户特征所对应的基因类型生成基因库;根据基因库生成多条染色体以构建种群,染色体需包含各客户特征所对应的基因类型以实现特征覆盖;生成的染色体具有对应的客户样本,客户样本的转化标签反应了客户是否完成转化,根据各染色体所对应客户样本的转化标签,计算各染色体的适应度;在遗传算法的每一轮迭代中,根据种群中各染色体的适应度,对染色体进行选择、繁殖与进化,筛选出适应度较高的染色体,并在迭代结束后得到目标种群;获取候选客户的待评估样本,根据目标种群中目标染色体与待评估样本基因组的匹配度,对候选客户进行评估,得到表示客户转化可能性的客户评估结果;本申请通过遗传算法跳出局部最优解,在缺少样本和特征的情况下,寻找出转化率最高的个体,并根据其对候选客户进行评估,提高了客户评估的准确性。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本申请各个实施例所述的方法。
显然,以上所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例,附图中给出了本申请的较佳实施例,但并不限制本申请的专利范围。本申请可以以许多不同的形式来实现,相反地,提供这些实施例的目的是使对本申请的公开内容的理解更加透彻全面。尽管参照前述实施例对本申请进行了详细的说明,对于本领域的技术人员来而言,其依然可以对前述各具体实施方式所记载的技术方案进行修改,或者对其中部分技术特征进行等效替换。凡是利用本申请说明书及附图内容所做的等效结构,直接或间接运用在其他相关的技术领域,均同理在本申请专利保护范围之内。
Claims (9)
1.一种客户评估方法,其特征在于,包括下述步骤:
获取多个客户样本,每个客户样本包括转化标签和第一数量的客户特征;
根据各客户样本,构建各客户特征所对应的基因类型,并根据各客户特征所对应的基因类型生成基因库,每种基因类型包含多个基因,且所述多个基因根据所述基因类型所对应客户特征的特征值构建得到;
根据所述基因库生成第二数量的染色体以构建种群,并根据所述种群中各染色体所对应客户样本的转化标签,计算所述各染色体的适应度,其中,所述各染色体互不相同,所述各染色体为包含所述各客户特征所对应基因类型的虚拟个体,所述种群为所述第二数量的染色体构成的集合;
基于得到的适应度,通过遗传算法对所述种群中的所述各染色体进行迭代,得到目标种群;
获取候选客户的待评估样本,并根据所述目标种群中的目标染色体对所述待评估样本进行评估,得到客户评估结果;
所述根据所述种群中各染色体所对应客户样本的转化标签,计算所述各染色体的适应度的步骤包括:
对于所述种群中的每条染色体,获取与所述染色体实现基因匹配的各客户样本,并统计所述各客户样本的样本数量;
根据所述各客户样本的转化标签,统计所述各客户样本中转化客户样本的转化数量;
令所述转化数量除以所述样本数量,得到所染色体的适应度。
2.根据权利要求1所述的客户评估方法,其特征在于,所述根据各客户样本,构建各客户特征所对应的基因类型的步骤包括:
对于每种客户特征,根据各客户样本确定所述客户特征的特征范围;
获取所述客户特征所对应的分位数;
根据所述分位数划分所述特征范围,并将划分得到的各子范围分别构建成基因;
根据得到的各基因生成所述客户特征所对应的基因类型。
3.根据权利要求1所述的客户评估方法,其特征在于,所述根据所述基因库生成第二数量的染色体以构建种群的步骤包括:
随机生成多条染色体,其中,各染色体互不相同,所述各染色体包含所述各客户特征所对应的基因类型,且所述各染色体中的每个基因类型包含至少一个所述基因类型下的基因;
对于每条染色体,统计与所述染色体实现基因匹配的客户样本的样本数量;
当所述样本数量大于等于预设的数量阈值时,保留所述染色体;
当保留的染色体数量达到预设的第二数量时,根据所述第二数量的染色体构建种群。
4.根据权利要求1所述的客户评估方法,其特征在于,所述基于得到的适应度,通过遗传算法对所述种群中的所述各染色体进行迭代,得到目标种群的步骤包括:
在所述种群中,选取适应度符合适应度条件的染色体,得到多条母染色体;
对各母染色体分别进行基于遗传算法的染色体交叉或基因变异,得到多条子染色体;
根据各子染色体所对应客户样本的转化标签,计算所述各子染色体的适应度;
选取适应度符合所述适应度条件的子染色体作为新的母染色体进行迭代,直至达到预设的迭代停止条件,得到目标种群。
5.根据权利要求1所述的客户评估方法,其特征在于,对于所述目标种群中目标染色体上的每个基因类型,均包含至少一个所述基因类型下的基因,所述根据所述目标种群中的目标染色体对所述待评估样本进行评估,得到客户评估结果的步骤包括:
确定所述待评估样本中各客户特征分别对应的基因;
对于每个基因,判断所述基因与所述目标染色体上对应基因类型下的基因是否匹配,得到匹配判断结果;
根据各匹配判断结果,计算所述待评估样本与所述目标染色体的匹配度;
根据所述匹配度以及所述目标染色体的适应度,生成客户评估结果。
6.根据权利要求1所述的客户评估方法,其特征在于,在所述获取候选客户的待评估样本,并根据所述目标种群中的目标染色体对所述待评估样本进行评估,得到客户评估结果的步骤之后,还包括:
当根据所述客户评估结果确定所述候选客户属于目标客户时,对所述目标客户进行产品推荐。
7.一种客户评估装置,其特征在于,包括:
样本获取模块,用于获取多个客户样本,每个客户样本包括转化标签和第一数量的客户特征;
基因构建模块,用于根据各客户样本,构建各客户特征所对应的基因类型,并根据各客户特征所对应的基因类型生成基因库,每种基因类型包含多个基因,且所述多个基因根据所述基因类型所对应客户特征的特征值构建得到;
种群构建模块,用于根据所述基因库生成第二数量的染色体以构建种群,并根据所述种群中各染色体所对应客户样本的转化标签,计算所述各染色体的适应度,其中,所述各染色体互不相同,所述各染色体为包含所述各客户特征所对应基因类型的虚拟个体,所述种群为所述第二数量的染色体构成的集合;
种群迭代模块,用于基于得到的适应度,通过遗传算法对所述种群中的所述各染色体进行迭代,得到目标种群;
样本评估模块,用于获取候选客户的待评估样本,并根据所述目标种群中的目标染色体对所述待评估样本进行评估,得到客户评估结果;
所述种群构建模块还用于对于所述种群中的每条染色体,获取与所述染色体实现基因匹配的各客户样本,并统计所述各客户样本的样本数量;根据所述各客户样本的转化标签,统计所述各客户样本中转化客户样本的转化数量;令所述转化数量除以所述样本数量,得到所染色体的适应度。
8.一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述处理器执行所述计算机可读指令时实现如权利要求1至6中任一项所述的客户评估方法的步骤。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机可读指令,所述计算机可读指令被处理器执行时实现如权利要求1至6中任一项所述的客户评估方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310665397.5A CN116402625B (zh) | 2023-06-07 | 2023-06-07 | 客户评估方法、装置、计算机设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310665397.5A CN116402625B (zh) | 2023-06-07 | 2023-06-07 | 客户评估方法、装置、计算机设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116402625A CN116402625A (zh) | 2023-07-07 |
CN116402625B true CN116402625B (zh) | 2023-08-29 |
Family
ID=87018322
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310665397.5A Active CN116402625B (zh) | 2023-06-07 | 2023-06-07 | 客户评估方法、装置、计算机设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116402625B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116883048B (zh) * | 2023-07-12 | 2024-03-15 | 卓盛科技(广州)有限公司 | 基于人工智能的客户数据处理方法、装置及计算机设备 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2436352A1 (en) * | 2001-01-19 | 2002-08-08 | Genalytics, Inc. | Process and system for developing a predictive model |
CN109325818A (zh) * | 2018-08-14 | 2019-02-12 | 中国平安人寿保险股份有限公司 | 一种产品推荐方法、计算机可读存储介质及终端设备 |
WO2019037202A1 (zh) * | 2017-08-24 | 2019-02-28 | 平安科技(深圳)有限公司 | 目标客户的识别方法、装置、电子设备及介质 |
CN111967971A (zh) * | 2020-08-18 | 2020-11-20 | 中国银行股份有限公司 | 银行客户数据处理方法及装置 |
CN114722945A (zh) * | 2022-04-12 | 2022-07-08 | 慧择保险经纪有限公司 | 一种存量客户投保意向预测方法及装置 |
CN115375357A (zh) * | 2022-08-16 | 2022-11-22 | 中国工商银行股份有限公司 | 客户流失预警方法和装置 |
CN115526652A (zh) * | 2022-08-25 | 2022-12-27 | 山东大学 | 一种基于机器学习的客户流失预警方法及系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10861594B2 (en) * | 2015-10-01 | 2020-12-08 | Dnanudge Limited | Product recommendation system and method |
-
2023
- 2023-06-07 CN CN202310665397.5A patent/CN116402625B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2436352A1 (en) * | 2001-01-19 | 2002-08-08 | Genalytics, Inc. | Process and system for developing a predictive model |
WO2019037202A1 (zh) * | 2017-08-24 | 2019-02-28 | 平安科技(深圳)有限公司 | 目标客户的识别方法、装置、电子设备及介质 |
CN109325818A (zh) * | 2018-08-14 | 2019-02-12 | 中国平安人寿保险股份有限公司 | 一种产品推荐方法、计算机可读存储介质及终端设备 |
CN111967971A (zh) * | 2020-08-18 | 2020-11-20 | 中国银行股份有限公司 | 银行客户数据处理方法及装置 |
CN114722945A (zh) * | 2022-04-12 | 2022-07-08 | 慧择保险经纪有限公司 | 一种存量客户投保意向预测方法及装置 |
CN115375357A (zh) * | 2022-08-16 | 2022-11-22 | 中国工商银行股份有限公司 | 客户流失预警方法和装置 |
CN115526652A (zh) * | 2022-08-25 | 2022-12-27 | 山东大学 | 一种基于机器学习的客户流失预警方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN116402625A (zh) | 2023-07-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112925911B (zh) | 基于多模态数据的投诉分类方法及其相关设备 | |
CN109102852A (zh) | 用户数据处理方法、装置、电子设备及计算机可读介质 | |
CN116402625B (zh) | 客户评估方法、装置、计算机设备及存储介质 | |
CN116977095A (zh) | 一种动态风控预警方法、装置、计算机设备及存储介质 | |
CN112507141B (zh) | 调查任务生成方法、装置、计算机设备及存储介质 | |
CN117314586A (zh) | 产品推荐方法、装置、计算机设备及存储介质 | |
CN117114901A (zh) | 基于人工智能的投保数据处理方法、装置、设备及介质 | |
CN117217812A (zh) | 一种用户行为预测方法、装置、计算机设备及存储介质 | |
CN116777646A (zh) | 基于人工智能的风险识别方法、装置、设备及存储介质 | |
CN116304352A (zh) | 消息推送方法、装置、设备及存储介质 | |
CN114565470A (zh) | 基于人工智能的金融产品推荐方法、及其相关设备 | |
CN117172632B (zh) | 一种企业异常行为检测方法、装置、设备及存储介质 | |
CN117350461B (zh) | 企业异常行为预警方法、系统、计算机设备及存储介质 | |
CN116805270A (zh) | 基于人工智能的检测方法、装置、计算机设备及存储介质 | |
CN116757771A (zh) | 基于人工智能的方案推荐方法、装置、设备及存储介质 | |
CN116757851A (zh) | 基于人工智能的数据配置方法、装置、设备及存储介质 | |
CN116720692A (zh) | 客服派工方法、装置、计算机设备及存储介质 | |
CN115730259A (zh) | 面向分类模型的用户电联服务方法及其相关设备 | |
CN117113209A (zh) | 保单分类方法、装置、计算机设备及存储介质 | |
CN116630059A (zh) | 基于人工智能的流失预测方法、装置、设备及存储介质 | |
CN118197626A (zh) | 基于人工智能的信息生成方法、装置、设备及存储介质 | |
CN116777641A (zh) | 模型构建方法、装置、计算机设备及存储介质 | |
CN117876021A (zh) | 基于人工智能的数据预测方法、装置、设备及存储介质 | |
CN117611352A (zh) | 一种车险理赔处理方法、装置、计算机设备及存储介质 | |
CN117078406A (zh) | 一种客户流失预警方法、装置、计算机设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |