CN115760201B - 智能销售线索推荐理由生成方法及系统 - Google Patents
智能销售线索推荐理由生成方法及系统 Download PDFInfo
- Publication number
- CN115760201B CN115760201B CN202310025598.9A CN202310025598A CN115760201B CN 115760201 B CN115760201 B CN 115760201B CN 202310025598 A CN202310025598 A CN 202310025598A CN 115760201 B CN115760201 B CN 115760201B
- Authority
- CN
- China
- Prior art keywords
- sample data
- recommendation
- shap
- matrix
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Abstract
本公开涉及一种智能销售线索推荐理由生成方法及系统,方法包括:获取与目标客户相关的M个预测样本数据,将M个预测样本数据输入推荐模型得到M个推荐结果;基于每个预测样本数据以及对应的推荐结果,通过SHAP模型计算每个预测样本数据对应的N个SHAP值;基于每个预测样本数据对应的N个SHAP值生成SHAP矩阵,计算每个预测样本数据中N个不同类型的样本数据的相关性以生成特征相关性矩阵,基于特征相关性矩阵将SHAP矩阵中SHAP值为零的SHAP值替换生成推荐理由重要系数矩阵;基于推荐理由重要系数矩阵对每个预测样本数据的N个不同的特征编码进行排序,基于排序结果和第一字典确定每个推荐结果对应的定制推荐理由。
Description
技术领域
本公开实施例涉及计算机技术领域,尤其涉及一种智能销售线索推荐理由生成方法及系统。
背景技术
面向企业客户的销售场景之下,使用基于机器学习或深度学习算法来挖掘推荐潜在的目标企业客户时,由于目前算法自身无法对推荐结果给出合理的推荐理由以及无法给出不同因素对推荐结果影响性大小,造成销售人员无法理解潜在目标企业客户的推荐逻辑,从而整体上使得难以组织制定合理准确的销售策略。
比如,在建立有申请知识产权需求的潜在企业客户推荐系统过程中,使用了企业专利数量、企业商标数量、企业品牌数量、企业成立时间等作为训练模型的特征数据,如果训练结束后的结果模型在最后推荐企业a作为最高可能性的潜在目标客户,则上述哪些特征数据(因素)导致其作为推荐结果,这些特征数据(因素)对推荐结果的影响程度大小如何难以给出,而解决这些问题对于企业的销售人员非常重要。
在上述场景下,当前业界并无相关解决方案。而在其他推荐场景下,有部分方案采用训练机器学习模型时所用的特征对最后训练得到的结果模型的贡献程度大小/特征重要性(Feature Importances),来代替对应特征对单一推荐结果的影响程度,从而生成每个预测结果的推荐理由。但是类似方法存在以下两个问题:
第一,某个特征对模型的重要性,并不能代表该特征对某个推荐结果的影响程度。特征重要性只能用来衡量在使用训练特征数据对原始模型进行训练时特征所起作用的重要程度,因此特征重要性并不能代表单个样本在推理过程所起作用的重要程度。比如对于训练结果模型,特征重要性最高的两个特征是特征A和B,其次是特征C,但是在推荐结果名单中,企业a作为推荐结果,如果其特征A和B的数值为0,而特征C为非0,此时以特征A或B作为企业a的推荐理由均不合适。
第二,特征共线性问题严重时,对特征重要性的解释性也会出现问题,从而造成推荐理由过少。在使用树模型或者基于树模型的集成算法时,当一个特征重要性为非0的特征A时,如果存在一个或以上的其他特征与特征A高度相关(如基于皮尔逊相关系数PearsonCorrelation Coefficient确定相关程度大小),如特征B和C,则特征B和C的特征重要性通常为0。这是由于特征A的信息增益率比特征B更高造成,具体推算过程不再累述。在上述销售场景下,由于特征数据的数量一般情况下不多,加上存在上述特征重要性为0的情况,这会导致出现推荐理由太少的问题,影响后续的销售策略准确制定。
综上,由于上述两个问题的存在,导致使用模型的特征重要性来代替推荐理由的相关方法在实际算法项目中效果不佳,即给出的推荐理由不够准确,另外在一些情况下给出的推荐理由数量太少,导致难以准确地制定销售策略。
发明内容
为了解决上述技术问题或者至少部分地解决上述技术问题,本公开实施例提供了一种智能销售线索推荐理由生成方法及系统。
第一方面,本公开实施例提供了一种智能销售线索推荐理由生成方法,包括:
获取与目标客户相关的M个预测样本数据,将所述M个预测样本数据输入推荐模型以得到对应的M个推荐结果;其中每个所述预测样本数据包括N个不同类型的样本数据,所述推荐模型是预先基于多个训练样本数据对机器学习模型训练得到的,每个所述训练样本数据包括N个不同类型的样本数据,N是大于或等于2的自然数,M是大于或等于1的自然数;
基于每个所述预测样本数据以及对应的推荐结果,通过SHAP模型计算每个所述预测样本数据对应的N个SHAP值,所述N个SHAP值一一对应每个所述预测样本数据中的N个不同类型的样本数据中的一个;
基于每个所述预测样本数据对应的N个SHAP值生成SHAP矩阵,计算每个所述预测样本数据中的N个不同类型的样本数据的相关性以生成特征相关性矩阵,基于所述特征相关性矩阵将所述SHAP矩阵中SHAP值为零的SHAP值替换掉以生成推荐理由重要系数矩阵;
基于所述推荐理由重要系数矩阵对每个所述预测样本数据对应的N个不同的特征编码进行排序,并基于排序结果和第一字典确定每个所述推荐结果对应的定制推荐理由;其中所述第一字典包括所述N个不同的特征编码与对应的定制推荐理由之间的对应关系,所述N个不同的特征编码预先设置且标识所述N个不同类型。
在一个实施例中,所述特征相关性矩阵是皮尔逊相关系数矩阵,所述基于所述特征相关性矩阵将所述SHAP矩阵中SHAP值为零的SHAP值替换掉以生成推荐理由重要系数矩阵,包括:
按照以下公式将所述SHAP矩阵中SHAP值为零的SHAP值替换掉以生成推荐理由重要系数矩阵:
其中,表示SHAP矩阵中第i个预测样本数据对应的第j个SHAP值,/>;/>表示特征相关性矩阵中的第n个类型的样本数据与第j个类型的样本数据之间的相关性值,表示/>被替换后的值,k表示SHAP矩阵中每个预测样本数据对应的SHAP值的总数。
在一个实施例中,该方法还包括:
获取与潜在的目标客户相关的画像数据,基于所述画像数据生成所述多个训练样本数据;
基于所述多个训练样本数据建立第二字典,所述第二字典包含所述N个不同的特征编码与对应的第一特征值之间的对应关系,每个所述第一特征值是占位符;
基于所述第二字典建立所述第一字典,其中所述第一字典中所述N个不同的特征编码各自对应的定制推荐理由中包含一个占位符。
在一个实施例中,该方法还包括:
生成每个所述预测样本数据中N个不同类型的样本数据各自对应的第二特征值;
所述基于排序结果和第一字典确定每个所述推荐结果对应的定制推荐理由,包括:
针对每个所述预测样本数据对应的每个所述推荐结果,根据所述排序结果中的N个特征编码的顺序,依次从所述第一字典中获取对应的N个定制推荐理由,并将所述N个定制推荐理由中的占位符替换为所述N个不同类型的样本数据各自对应的第二特征值。
在一个实施例中,所述基于所述推荐理由重要系数矩阵对每个所述预测样本数据对应的N个不同的特征编码进行排序之前,该方法还包括:将所述推荐理由重要系数矩阵中重要系数为零的重要系数删除。
在一个实施例中,所述基于所述推荐理由重要系数矩阵对每个所述预测样本数据对应的N个不同的特征编码进行排序,包括:
基于所述推荐理由重要系数矩阵中的重要系数的大小,对每个所述预测样本数据对应的N个不同的特征编码进行降序排序。
在一个实施例中,所述第一字典中所述N个不同的特征编码各自对应的定制推荐理由均是文本推荐理由。
第二方面,本公开实施例提供一种智能销售线索推荐理由生成系统,包括:
客户推荐模块,用于获取与目标客户相关的M个预测样本数据,将所述M个预测样本数据输入推荐模型以得到对应的M个推荐结果;其中每个所述预测样本数据包括N个不同类型的样本数据,所述推荐模型是预先基于多个训练样本数据对机器学习模型训练得到的,每个所述训练样本数据包括N个不同类型的样本数据,N是大于或等于2的自然数,M是大于或等于1的自然数;
数据计算模块,用于基于每个所述预测样本数据以及对应的推荐结果,通过SHAP模型计算每个所述预测样本数据对应的N个SHAP值,所述N个SHAP值一一对应每个所述预测样本数据中的N个不同类型的样本数据中的一个;
矩阵计算模块,用于基于每个所述预测样本数据对应的N个SHAP值生成SHAP矩阵,计算每个所述预测样本数据中的N个不同类型的样本数据的相关性以生成特征相关性矩阵,基于所述特征相关性矩阵将所述SHAP矩阵中SHAP值为零的SHAP值替换掉以生成推荐理由重要系数矩阵;
理由生成模块,用于基于所述推荐理由重要系数矩阵对每个所述预测样本数据对应的N个不同的特征编码进行排序,并基于排序结果和第一字典确定每个所述推荐结果对应的定制推荐理由;其中所述第一字典包括所述N个不同的特征编码与对应的定制推荐理由之间的对应关系,所述N个不同的特征编码预先设置且标识所述N个不同类型。
第三方面,本公开实施例提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述任一实施例所述智能销售线索推荐理由生成方法。
第四方面,本公开实施例提供一种电子设备,包括:
处理器;以及
存储器,用于存储计算机程序;
其中,所述处理器配置为经由执行所述计算机程序来执行上述任一实施例所述智能销售线索推荐理由生成方法。
本公开实施例提供的技术方案与现有技术相比具有如下优点:
本公开实施例提供的智能销售线索推荐理由生成方法及系统,获取与目标客户相关的M个预测样本数据,将所述M个预测样本数据输入推荐模型以得到对应的M个推荐结果,所述推荐模型是预先基于多个训练样本数据对机器学习模型训练得到的;基于每个所述预测样本数据以及对应的推荐结果,通过SHAP模型计算每个所述预测样本数据对应的N个SHAP值,所述N个SHAP值一一对应每个所述预测样本数据中的N个不同类型的样本数据中的一个;基于每个所述预测样本数据对应的N个SHAP值生成SHAP矩阵,计算每个所述预测样本数据中的N个不同类型的样本数据的相关性以生成特征相关性矩阵,基于所述特征相关性矩阵将所述SHAP矩阵中SHAP值为零的SHAP值替换掉以生成推荐理由重要系数矩阵;基于所述推荐理由重要系数矩阵对每个所述预测样本数据对应的N个不同的特征编码进行排序,并基于排序结果和第一字典确定每个所述推荐结果对应的定制推荐理由;其中所述第一字典包括所述N个不同的特征编码与对应的定制推荐理由之间的对应关系,所述N个不同的特征编码预先设置且标识所述N个不同类型。这样,本实施例的方案可以给出较为准确地推荐理由,且推荐理由的数量较多,从而可以辅助相关人员准确地制定销售策略。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本公开实施例智能销售线索推荐理由生成方法流程图;
图2为本公开另一实施例智能销售线索推荐理由生成方法流程图;
图3为本公开又一实施例智能销售线索推荐理由生成方法流程图;
图4为本公开实施例智能销售线索推荐理由生成系统示意图;
图5为本公开实施例的电子设备示意图。
具体实施方式
为了能够更清楚地理解本公开的上述目的、特征和优点,下面将对本公开的方案进行进一步描述。需要说明的是,在不冲突的情况下,本公开的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本公开,但本公开还可以采用其他不同于在此描述的方式来实施;显然,说明书中的实施例只是本公开的一部分实施例,而不是全部的实施例。应当理解,在下文中,“至少一个(项)”是指一个或者多个,“多个”是指两个或两个以上。
图1为本公开实施例的一种智能销售线索推荐理由生成方法流程图,该方法可以由计算机或者服务器来执行,具体可以包括以下步骤:
步骤S101:获取与目标客户相关的M个预测样本数据,将所述M个预测样本数据输入推荐模型以得到对应的M个推荐结果。其中每个所述预测样本数据包括N个不同类型的样本数据,所述推荐模型是预先基于多个训练样本数据对机器学习模型训练得到的,每个所述训练样本数据包括N个不同类型的样本数据,N是大于或等于2的自然数,M是大于或等于1的自然数。
示例性的,例如用户需要挖掘具有申请知识产权如专利需求的潜在目标企业客户,用户可以填写目标企业客户画像问卷。具体的,如果用户认为“企业成立时长”、“企业当期专利数量”、“企业当期商标数量”、“企业当期注册商品数量”等因素即不同类型的样本数据对推荐模型发现潜在目标企业客户有作用,则在训练原始机器学习模型如卷积神经网络模型前,把以上各因素对应的特征作为训练样本数据,然后对机器学习模型进行训练得到推荐模型,参考图3中所示。然后在具体应用时,获取多个目标客户相关的多个预测样本数据如图3中的样本1、样本2等等,每个预测样本数据可包含如“企业成立时长”、“企业当期专利数量”、“企业当期商标数量”、“企业当期注册商品数量”等不同类型的特征数据。然后多个预测样本数据输入推荐模型以得到对应的多个推荐结果,如给出推荐的目标企业名称等。
步骤S102:基于每个所述预测样本数据以及对应的推荐结果,通过SHAP模型计算每个所述预测样本数据对应的N个SHAP值。所述N个SHAP值一一对应每个所述预测样本数据中的N个不同类型的样本数据中的一个。
可以理解的是,SHAP(SHapley Additive exPlanation)模型通过构建一个加性的解释模型,一个训练样本数据中所有的特征都视为“贡献者”,通过计算一个特征加入到机器学习模型时的边际贡献,然后考虑到该特征在所有的不同特征序列的情况下不同的边际贡献,取均值即该特征的SHAP值。对于每个预测样本数据,推荐模型都产生一个预测值,SHAP值就是该预测样本数据中每个特征数据所分配到的数值。SHAP 模型能够很好地解释机器学习模型推理结果中每个预测样本数据的解释性问题。
在一个示例中,通过SHAP模型计算单个预测样本数据对应的SHAP值的过程如下:
定义 fx(S)=E[f(x)|xS] ,其中S是输入特征可能的子集合,E[f(x)|xS] 为输入特征的子集S的条件期望值。假设机器学习模型f在训练时一共使用p个特征{x1,x2, ... ,xp},则对于某单一样本{x1=a1,x2=a2, ... ,xp=ap},模型f对于该样本的预测值则解释为引入条件期望的每个特征的影响 Φj 的总和:
其中, Φj ∈R 是每个特征的归因值(SHAP值)
{x1,...,xp} 是所有输入特征的集合
p为所有输入特征的数目
{x1,...,xp}\{xj} 为不包括 {xj} 的所有输入特征可能的集合, fx(S) 为特征子集 S 的预测;
该式的权重 |S|!(p-|S|-1)!/p! 解释如下:
分母:p个特征在任意排序的情况下有p!种组合情况;
分子:在确定子集S后,p个特征在特定排序的情况下有|S|!(p-|S|-1)! 种组合。当确定了子集S后,特征的集合应为 {x1,...,x|S|,xj,x|S|+2,...,xp},因为子集S {x1,...,x|S|} 本身有|S|!种顺序组合,特征x|S|后面是特征xj,那么剩余的特征{x|S|+2,...,xp}有(p-|S|-1)!种组合,则确定子集S后有|S|!(p-|S|-1)! 种组合情况。所以 |S|!(p-|S|-1)!/p! 为子集S的特征组合情况占比,所有可能的子集S的特征组合情况占比之和等于1。关于SHAP值计算的更具体过程可以参考现有技术理解,此处不再赘述。
步骤S103:基于每个所述预测样本数据对应的N个SHAP值生成SHAP矩阵,计算每个所述预测样本数据中的N个不同类型的样本数据的相关性以生成特征相关性矩阵,基于所述特征相关性矩阵将所述SHAP矩阵中SHAP值为零的SHAP值替换掉以生成推荐理由重要系数矩阵。
具体的,例如一共有m个预测样本数据,每个预测样本数据有n个特征数据,则可以依据生成的SHAP值生成SHAP矩阵MΦ:
然后生成n个特征数据之间的特征相关性矩阵R(Pearson Correlation Matrix):
特征相关性矩阵R的具体生成方式可以参考现有技术理解,此处不再赘述。之后可基于特征相关性矩阵R将所述SHAP矩阵中SHAP值为零的SHAP值替换掉即可以生成推荐理由重要系数矩阵。推荐理由重要系数矩阵中的每个重要系数表示对应的预测样本数据中对应的一个特征数据的重要性。
步骤S104:基于所述推荐理由重要系数矩阵对每个所述预测样本数据对应的N个不同的特征编码进行排序,并基于排序结果和第一字典确定每个所述推荐结果对应的定制推荐理由。其中所述第一字典包括所述N个不同的特征编码与对应的定制推荐理由之间的对应关系,所述N个不同的特征编码预先设置且标识所述N个不同类型。
示例性的,本实施例中例如可以通过“潜客特征与推荐理由定制模块”预先建立一套潜在企业客户画像问卷系统,以把用户的业务经验转换为有效特征选择,通过建立不同特征数据(以不同特征编码标识)与定制推荐理由之间的逻辑关系即第一字典,为后续每个预测样本数据的特征值表征为带有业务逻辑的推荐理由而提供规则依据。
具体的,在一个实施例中,第一字典中N个不同的特征编码各自对应的定制推荐理由均是文本推荐理由。例如一个预测样本数据中的一个特征数据如“企业成立时长”对应编码“01”,而编码“01”对应定制推荐理由可以是“企业成立时长为{}个月,与种子客户相近”,其中“{}”为具体的该一个特征数据的样本特征值的占位符。本实施例中基于推荐理由重要系数矩阵中的重要系数可对单个预测样本数据对应的N个不同的特征编码进行排序,并基于排序结果中的编码如“01”从第一字典查询确定对应的定制推荐理由作为每个推荐结果对应的定制推荐理由。
本公开实施例的方案通过计算的特征相关性矩阵将SHAP矩阵中SHAP值为零的SHAP值替换掉以生成推荐理由重要系数矩阵,即通过共线特征逆向配对算法,把由于特征共线性而被机器学习模型排除的特征重新恢复到特征重要性排序列表中,从而解决在当前场景下推荐理由过少的问题。另外基于每个预测样本数据的每个特征数据的SHAP值以及共线特征逆向配对结果,生成每个预测样本数据的每个特征数据的推荐理由重要系数,以此作为推荐理由重要性排序的依据并给出最终的推荐理由,如此本实施例的方案不是用特征重要性代表单个预测样本数据在模型推理过程所起作用的重要程度,而是基于计算的单个预测样本数据中的每个特征数据的SHAP值以及共线特征逆向配对结果,生成每个预测样本数据的每个特征数据的推荐理由重要系数,再结合预先设置的字典最终确定推荐理由,这样可以给出较为准确地定制推荐理由,且推荐理由的数量较多,从而可以辅助相关人员准确地制定销售策略。
在一个实施例中,所述特征相关性矩阵是皮尔逊相关系数矩阵,所述基于所述特征相关性矩阵将所述SHAP矩阵中SHAP值为零的SHAP值替换掉以生成推荐理由重要系数矩阵,包括:
按照以下公式将所述SHAP矩阵中SHAP值为零的SHAP值替换掉以生成推荐理由重要系数矩阵:
其中,表示SHAP矩阵中第i个预测样本数据对应的第j个SHAP值,/>;/>表示特征相关性矩阵中的第n个类型的样本数据与第j个类型的样本数据之间的相关性值,表示/>被替换后的值,k表示SHAP矩阵中每个预测样本数据对应的SHAP值的总数。
矩阵MΦ记作MΦ 、,矩阵MΦ 、作为m个样本的推荐理由重要系数矩阵,以此作为每个预测样本数据的推荐理由重要系数的排序依据。
在一个实施例中,该方法还可包括以下步骤:获取与潜在的目标客户相关的画像数据,基于所述画像数据生成所述多个训练样本数据;基于所述多个训练样本数据建立第二字典,所述第二字典包含所述N个不同的特征编码与对应的第一特征值之间的对应关系,每个所述第一特征值是占位符;基于所述第二字典建立所述第一字典,其中所述第一字典中所述N个不同的特征编码各自对应的定制推荐理由中包含一个占位符。
示例性的,参考图2中所示,用户可以填写企业客户画像问卷。例如将“企业成立时长”、“企业当期专利数量”、“企业当期商标数量”、“企业当期注册商品数量”等因素作为训练特征数据构成训练样本数据。然后建立特征编码-特征值字典即第二字典。具体的,对训练样本数据中的以上每个特征数据进行编码得到特征编码如“01”、“02”、“03”、“04”,然后建立各特征编码-特征值字典,该字典可以采用键-值对的数据结构,键为特征编码,值此时为占位符如“{}”。之后,再建立特征编码-定制推荐理由字典即第一字典,该字典也采用键-值对的数据结构,对每一个特征编码建立定制推荐理由对应关系,如特征数据如“企业成立时长”对应编码“01”,而编码“01”对应的定制推荐理由可以是“企业成立时长为{}个月,与种子客户相近”,其中“{}”为具体样本特征值的占位符。
在一个实施例中,该方法还包括以下步骤:生成每个所述预测样本数据中N个不同类型的样本数据各自对应的第二特征值;步骤S104中基于排序结果和第一字典确定每个所述推荐结果对应的定制推荐理由,具体可以包括:针对每个所述预测样本数据对应的每个所述推荐结果,根据所述排序结果中的N个特征编码的顺序,依次从所述第一字典中获取对应的N个定制推荐理由,并将所述N个定制推荐理由中的占位符替换为所述N个不同类型的样本数据各自对应的第二特征值。
示例性的,参考图3所示,单个预测样本数据中N个不同类型的样本数据即特征数据各自对应的第二特征值可以是特征数据对应的特征值,例如单个预测样本数据中的一个特征数据是“企业成立时长为5个月”,则对应的第二特征值是“5”,另一个特征数据是“企业专利数量是22件”,则对应的第二特征值是“22”。对应的,步骤S104中具体可以是:针对单个预测样本数据对应的推荐结果,根据排序结果中的N个特征编码的顺序,依次从所述第一字典中获取对应的N个定制推荐理由,并将所述N个定制推荐理由中的占位符替换为所述N个不同类型的样本数据各自对应的第二特征值,例如样本1对应的定制推荐理由1“企业专利数量为22,与种子企业相近”、定制推荐理由2和定制推荐理由3等。这样,可以针对单个预测样本数据给出与其中的每个特征数据对应的定制推荐理由,即从不同方面给出了多个推荐理由,从而可以辅助相关人员更准确地制定销售策略。
在一个实施例中,所述基于所述推荐理由重要系数矩阵对每个所述预测样本数据对应的N个不同的特征编码进行排序之前,该方法还包括:将所述推荐理由重要系数矩阵中重要系数为零的重要系数删除。
在一个实施例中,所述基于所述推荐理由重要系数矩阵对每个所述预测样本数据对应的N个不同的特征编码进行排序,包括:基于所述推荐理由重要系数矩阵中的重要系数的大小,对每个所述预测样本数据对应的N个不同的特征编码进行降序排序。
本实施例中依据单个推荐结果对应的预测样本数据中各特征数据的特征值以及推荐理由重要系数,在排除重要系数依然为0的特征值后,按照重要系数的大小对特征编码进行降序排列,然后将“特征编码 - 特征值字典”填入“特征编码 - 推荐理由字典”,最终生成该预测样本数据的推荐理由文本。如此可以给出更为准确地定制推荐理由,从而可以辅助相关人员更准确地制定销售策略。
从算法原理可知,本公开实施例的基于SHAP模型和共线特征逆向配对算法的而生成的推荐理由,其推荐理由的合理性与推荐理由生成数量,以及推荐理由重要性排序的合理性,均优于基于模型特征重要性(feature importance)的现有系统,对比如下表所示。
本公开实施例的方案通过建立基于SHAP模型和共线特征逆向配对算法的智能销售线索推荐理由生成系统,通过加入SHAP模型解决了模型特征重要性无法解释单个预测样本数据推荐结果的问题,同时通过共线特征逆向配对算法弥补部分SHAP 值为零而导致的推荐理由不足的问题,从而为每个推荐结果给出相对更加合理准确的推荐理由,对推荐理由的重要性也可进行合理排序。
需要说明的是,尽管在附图中以特定顺序描述了本公开中方法的各个步骤,但是,这并非要求或者暗示必须按照该特定顺序来执行这些步骤,或是必须执行全部所示的步骤才能实现期望的结果。附加的或备选的,可以省略某些步骤,将多个步骤合并为一个步骤执行,以及/或者将一个步骤分解为多个步骤执行等。另外,也易于理解的是,这些步骤可以是例如在多个模块/进程/线程中同步或异步执行。
如图4所示,本公开实施例提供一种智能销售线索推荐理由生成系统,包括:
客户推荐模块401,用于获取与目标客户相关的M个预测样本数据,将所述M个预测样本数据输入推荐模型以得到对应的M个推荐结果;其中每个所述预测样本数据包括N个不同类型的样本数据,所述推荐模型是预先基于多个训练样本数据对机器学习模型训练得到的,每个所述训练样本数据包括N个不同类型的样本数据,N是大于或等于2的自然数,M是大于或等于1的自然数;
数据计算模块402,用于基于每个所述预测样本数据以及对应的推荐结果,通过SHAP模型计算每个所述预测样本数据对应的N个SHAP值,所述N个SHAP值一一对应每个所述预测样本数据中的N个不同类型的样本数据中的一个;
矩阵计算模块403,用于基于每个所述预测样本数据对应的N个SHAP值生成SHAP矩阵,计算每个所述预测样本数据中的N个不同类型的样本数据的相关性以生成特征相关性矩阵,基于所述特征相关性矩阵将所述SHAP矩阵中SHAP值为零的SHAP值替换掉以生成推荐理由重要系数矩阵;
理由生成模块404,用于基于所述推荐理由重要系数矩阵对每个所述预测样本数据对应的N个不同的特征编码进行排序,并基于排序结果和第一字典确定每个所述推荐结果对应的定制推荐理由;其中所述第一字典包括所述N个不同的特征编码与对应的定制推荐理由之间的对应关系,所述N个不同的特征编码预先设置且标识所述N个不同类型。
在一个实施例中,所述特征相关性矩阵是皮尔逊相关系数矩阵,所述矩阵计算模块基于所述特征相关性矩阵将所述SHAP矩阵中SHAP值为零的SHAP值替换掉以生成推荐理由重要系数矩阵,具体可以包括:按照以下公式将所述SHAP矩阵中SHAP值为零的SHAP值替换掉以生成推荐理由重要系数矩阵:
其中,表示SHAP矩阵中第i个预测样本数据对应的第j个SHAP值,/>;/>表示特征相关性矩阵中的第n个类型的样本数据与第j个类型的样本数据之间的相关性值,表示/>被替换后的值,k表示SHAP矩阵中每个预测样本数据对应的SHAP值的总数。
在一个实施例中,该系统还可以包括数据配置模块,用于:获取与潜在的目标客户相关的画像数据,基于所述画像数据生成所述多个训练样本数据;基于所述多个训练样本数据建立第二字典,所述第二字典包含所述N个不同的特征编码与对应的第一特征值之间的对应关系,每个所述第一特征值是占位符;基于所述第二字典建立所述第一字典,其中所述第一字典中所述N个不同的特征编码各自对应的定制推荐理由中包含一个占位符。
在一个实施例中,该理由生成模块还用于:生成每个所述预测样本数据中N个不同类型的样本数据各自对应的第二特征值;针对每个所述预测样本数据对应的每个所述推荐结果,根据所述排序结果中的N个特征编码的顺序,依次从所述第一字典中获取对应的N个定制推荐理由,并将所述N个定制推荐理由中的占位符替换为所述N个不同类型的样本数据各自对应的第二特征值。
在一个实施例中,所述理由生成模块基于所述推荐理由重要系数矩阵对每个所述预测样本数据对应的N个不同的特征编码进行排序之前,将所述推荐理由重要系数矩阵中重要系数为零的重要系数删除。
在一个实施例中,所述理由生成模块基于所述推荐理由重要系数矩阵对每个所述预测样本数据对应的N个不同的特征编码进行排序,包括:基于所述推荐理由重要系数矩阵中的重要系数的大小,对每个所述预测样本数据对应的N个不同的特征编码进行降序排序。
在一个实施例中,所述第一字典中所述N个不同的特征编码各自对应的定制推荐理由均是文本推荐理由。
关于上述实施例中的系统,其中各个模块执行操作的具体方式以及带来的相应技术效果已经在有关该方法的实施例中进行了对应的详细描述,此处将不做详细阐述说明。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。作为模块或单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现木公开方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
本公开实施例还提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述任一项实施例所述智能销售线索推荐理由生成方法。
示例性的,该可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
所述计算机可读存储介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读存储介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
本公开实施例还提供一种电子设备,包括处理器以及存储器,存储器用于存储计算机程序。其中,所述处理器配置为经由执行所述计算机程序来执行上述任一项实施例中智能销售线索推荐理由生成方法。
下面参照图5来描述根据本发明的这种实施方式的电子设备600。图5显示的电子设备600仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图5所示,电子设备600以通用计算设备的形式表现。电子设备600的组件可以包括但不限于:至少一个处理单元610、至少一个存储单元620、连接不同系统组件(包括存储单元620和处理单元610)的总线630、显示单元640等。
其中,所述存储单元存储有程序代码,所述程序代码可以被所述处理单元610执行,使得所述处理单元610执行本说明书上述方法实施例部分中描述的根据本发明各种示例性实施方式的步骤。例如,所述处理单元610可以执行如图1中所示方法的步骤。
所述存储单元620可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)6201和/或高速缓存存储单元6202,还可以进一步包括只读存储单元(ROM)6203。
所述存储单元620还可以包括具有一组(至少一个)程序模块6205的程序/实用工具6204,这样的程序模块6205包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线630可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
电子设备600也可以与一个或多个外部设备700(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备600交互的设备通信,和/或与使得该电子设备600能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口650进行。并且,电子设备600还可以通过网络适配器660与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。网络适配器660可以通过总线630与电子设备600的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备600使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、或者网络设备等)执行根据本公开实施方式的上述各实施例的智能销售线索推荐理由生成方法步骤。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅是本公开的具体实施方式,使本领域技术人员能够理解或实现本公开。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本公开的精神或范围的情况下,在其它实施例中实现。因此,本公开将不会被限制于本文所述的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (10)
1.一种智能销售线索推荐理由生成方法,其特征在于,包括:
获取与目标客户相关的M个预测样本数据,将所述M个预测样本数据输入推荐模型以得到对应的M个推荐结果;其中每个所述预测样本数据包括N个不同类型的样本数据,所述推荐模型是预先基于多个训练样本数据对机器学习模型训练得到的,每个所述训练样本数据包括N个不同类型的样本数据,N是大于或等于2的自然数,M是大于或等于1的自然数;
基于每个所述预测样本数据以及对应的推荐结果,通过SHAP模型计算每个所述预测样本数据对应的N个SHAP值,所述N个SHAP值一一对应每个所述预测样本数据中的N个不同类型的样本数据中的一个;
基于每个所述预测样本数据对应的N个SHAP值生成SHAP矩阵,计算每个所述预测样本数据中的N个不同类型的样本数据的相关性以生成特征相关性矩阵,基于所述特征相关性矩阵将所述SHAP矩阵中SHAP值为零的SHAP值替换掉以生成推荐理由重要系数矩阵;
基于所述推荐理由重要系数矩阵对每个所述预测样本数据对应的N个不同的特征编码进行排序,并基于排序结果和第一字典确定每个所述推荐结果对应的定制推荐理由;其中所述第一字典包括所述N个不同的特征编码与对应的定制推荐理由之间的对应关系,所述N个不同的特征编码预先设置且标识所述N个不同类型。
3.根据权利要求1或2所述的方法,其特征在于,该方法还包括:
获取与潜在的目标客户相关的画像数据,基于所述画像数据生成所述多个训练样本数据;
基于所述多个训练样本数据建立第二字典,所述第二字典包含所述N个不同的特征编码与对应的第一特征值之间的对应关系,每个所述第一特征值是占位符;
基于所述第二字典建立所述第一字典,其中所述第一字典中所述N个不同的特征编码各自对应的定制推荐理由中包含一个占位符。
4.根据权利要求3所述的方法,其特征在于,该方法还包括:
生成每个所述预测样本数据中N个不同类型的样本数据各自对应的第二特征值;
所述基于排序结果和第一字典确定每个所述推荐结果对应的定制推荐理由,包括:
针对每个所述预测样本数据对应的每个所述推荐结果,根据所述排序结果中的N个特征编码的顺序,依次从所述第一字典中获取对应的N个定制推荐理由,并将所述N个定制推荐理由中的占位符替换为所述N个不同类型的样本数据各自对应的第二特征值。
5.根据权利要求4所述的方法,其特征在于,所述基于所述推荐理由重要系数矩阵对每个所述预测样本数据对应的N个不同的特征编码进行排序之前,该方法还包括:将所述推荐理由重要系数矩阵中重要系数为零的重要系数删除。
6.根据权利要求5所述的方法,其特征在于,所述基于所述推荐理由重要系数矩阵对每个所述预测样本数据对应的N个不同的特征编码进行排序,包括:
基于所述推荐理由重要系数矩阵中的重要系数的大小,对每个所述预测样本数据对应的N个不同的特征编码进行降序排序。
7.根据权利要求4所述的方法,其特征在于,所述第一字典中所述N个不同的特征编码各自对应的定制推荐理由均是文本推荐理由。
8.一种智能销售线索推荐理由生成系统,其特征在于,包括:
客户推荐模块,用于获取与目标客户相关的M个预测样本数据,将所述M个预测样本数据输入推荐模型以得到对应的M个推荐结果;其中每个所述预测样本数据包括N个不同类型的样本数据,所述推荐模型是预先基于多个训练样本数据对机器学习模型训练得到的,每个所述训练样本数据包括N个不同类型的样本数据,N是大于或等于2的自然数,M是大于或等于1的自然数;
数据计算模块,用于基于每个所述预测样本数据以及对应的推荐结果,通过SHAP模型计算每个所述预测样本数据对应的N个SHAP值,所述N个SHAP值一一对应每个所述预测样本数据中的N个不同类型的样本数据中的一个;
矩阵计算模块,用于基于每个所述预测样本数据对应的N个SHAP值生成SHAP矩阵,计算每个所述预测样本数据中的N个不同类型的样本数据的相关性以生成特征相关性矩阵,基于所述特征相关性矩阵将所述SHAP矩阵中SHAP值为零的SHAP值替换掉以生成推荐理由重要系数矩阵;
理由生成模块,用于基于所述推荐理由重要系数矩阵对每个所述预测样本数据对应的N个不同的特征编码进行排序,并基于排序结果和第一字典确定每个所述推荐结果对应的定制推荐理由;其中所述第一字典包括所述N个不同的特征编码与对应的定制推荐理由之间的对应关系,所述N个不同的特征编码预先设置且标识所述N个不同类型。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1~7任一项所述智能销售线索推荐理由生成方法。
10.一种电子设备,其特征在于,包括:
处理器;以及
存储器,用于存储计算机程序;
其中,所述处理器配置为经由执行所述计算机程序来执行权利要求1~7任一项所述智能销售线索推荐理由生成方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310025598.9A CN115760201B (zh) | 2023-01-09 | 2023-01-09 | 智能销售线索推荐理由生成方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310025598.9A CN115760201B (zh) | 2023-01-09 | 2023-01-09 | 智能销售线索推荐理由生成方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115760201A CN115760201A (zh) | 2023-03-07 |
CN115760201B true CN115760201B (zh) | 2023-06-16 |
Family
ID=85348437
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310025598.9A Active CN115760201B (zh) | 2023-01-09 | 2023-01-09 | 智能销售线索推荐理由生成方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115760201B (zh) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115329207A (zh) * | 2022-10-17 | 2022-11-11 | 启客(北京)科技有限公司 | 智能销售信息推荐方法及系统 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110909241B (zh) * | 2019-11-20 | 2023-04-07 | 腾讯科技(深圳)有限公司 | 信息推荐方法、用户标识推荐方法、装置及设备 |
CN111652657A (zh) * | 2020-06-10 | 2020-09-11 | 创新奇智(南京)科技有限公司 | 商品销量预测方法、装置、电子设备及可读存储介质 |
CN112288337B (zh) * | 2020-12-15 | 2021-03-19 | 平安科技(深圳)有限公司 | 行为推荐方法、装置、设备及介质 |
CN114511037A (zh) * | 2022-02-18 | 2022-05-17 | 创新奇智(青岛)科技有限公司 | 一种自动化特征筛选方法、装置、电子设备及存储介质 |
CN114444986B (zh) * | 2022-04-11 | 2022-06-03 | 成都数之联科技股份有限公司 | 产品分析方法及系统及装置及介质 |
-
2023
- 2023-01-09 CN CN202310025598.9A patent/CN115760201B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115329207A (zh) * | 2022-10-17 | 2022-11-11 | 启客(北京)科技有限公司 | 智能销售信息推荐方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN115760201A (zh) | 2023-03-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Ferrari et al. | Simulating ordinal data | |
CN111552880B (zh) | 基于知识图谱的数据处理方法、装置、介质及电子设备 | |
CA3007853A1 (en) | End-to-end deep collaborative filtering | |
KR102476056B1 (ko) | 아이템 추천방법, 시스템, 전자기기 및 기록매체 | |
US20200050941A1 (en) | Machine learning systems and methods for attributed sequences | |
CN110268422A (zh) | 利用强化学习的设备布局优化 | |
WO2021027256A1 (zh) | 处理交互序列数据的方法及装置 | |
CN109241403B (zh) | 项目推荐方法、装置、机器设备和计算机可读存储介质 | |
US11763084B2 (en) | Automatic formulation of data science problem statements | |
JP7262539B2 (ja) | 会話推薦方法、装置及び機器 | |
CN109117442B (zh) | 一种应用推荐方法及装置 | |
CN111259647A (zh) | 基于人工智能的问答文本匹配方法、装置、介质及电子设备 | |
WO2022052744A1 (zh) | 会话信息处理方法、装置、计算机可读存储介质及设备 | |
US20200356360A1 (en) | Automated software selection using matrix factorization | |
CN112348592A (zh) | 广告推荐方法、装置、电子设备及介质 | |
CN111695024A (zh) | 对象评估值的预测方法及系统、推荐方法及系统 | |
CN111461757B (zh) | 信息处理方法及装置、计算机存储介质、电子设备 | |
CN112015788A (zh) | 向目标用户展示目标对象序列的方法和装置 | |
Wu | Can’t ridge regression perform variable selection? | |
US11263551B2 (en) | Machine learning based process flow engine | |
US11797281B2 (en) | Multi-language source code search engine | |
US20220083907A1 (en) | Data generation and annotation for machine learning | |
Chang et al. | Combining STRONG with screening designs for large-scale simulation optimization | |
CN115760201B (zh) | 智能销售线索推荐理由生成方法及系统 | |
CN112069404A (zh) | 一种商品信息的展示方法、装置、设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |