CN111680941A - 保价推荐方法、装置、设备及存储介质 - Google Patents
保价推荐方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN111680941A CN111680941A CN201910181709.9A CN201910181709A CN111680941A CN 111680941 A CN111680941 A CN 111680941A CN 201910181709 A CN201910181709 A CN 201910181709A CN 111680941 A CN111680941 A CN 111680941A
- Authority
- CN
- China
- Prior art keywords
- customer
- client
- characteristic information
- type
- premium
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 46
- 238000012545 processing Methods 0.000 claims abstract description 8
- 238000012549 training Methods 0.000 claims description 32
- 238000012360 testing method Methods 0.000 claims description 30
- 238000004590 computer program Methods 0.000 claims description 13
- 238000007637 random forest analysis Methods 0.000 claims description 3
- 206010063385 Intellectualisation Diseases 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 11
- 230000006870 function Effects 0.000 description 5
- 230000006399 behavior Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 230000001550 time effect Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 238000013210 evaluation model Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/08—Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
- G06Q10/083—Shipping
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
Landscapes
- Business, Economics & Management (AREA)
- Economics (AREA)
- Engineering & Computer Science (AREA)
- General Business, Economics & Management (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Marketing (AREA)
- Accounting & Taxation (AREA)
- Theoretical Computer Science (AREA)
- Strategic Management (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- Tourism & Hospitality (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Human Resources & Organizations (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本申请公开了一种保价推荐方法、装置、设备及存储介质,包括:获取客户的客户特征信息和运单特征信息,客户特征信息包括客户历史寄件数量及客户历史保价数量;根据客户历史寄件数量及客户历史保价数量,确定客户的客户类型;基于客户类型,将客户特征信息和运单特征信息输入到预先构建的与客户类型对应的保价预测模型以得到预测值;将预测值与保价预测模型对应的阈值进行比较,以确定用户是否需要推荐保价。该方法可以提高物流体系的智能化,以及提高业务处理效率。
Description
技术领域
本发明一般涉及物流技术领域,具体涉及保价推荐方法、装置、设备及存储介质。
背景技术
随着物流行业的迅速发展,不论是普通物品还是贵重物品,客户大部分都有可能会采用快递的方式运输,而在快递运输过程中,难免会出现物品遗失或损坏的现象,这样物流行业的保价业务就应用而生。
现有的物品快递时是否需要保价,主要是快递员凭借经验来主观推荐。这种保价推荐方式,快递的物品是否需要保价完全由快递员掌控。采用现有的保价推荐方式,需要提前对快递员进行培训,增加了成本,并且推荐是否保价时主观性比较强。
发明内容
鉴于现有技术中的上述缺陷或不足,期望提供一种保价推荐方法、装置、设备及存储介质。
第一方面,本发明提供了一种保价推荐方法,包括:获取客户的客户特征信息和运单特征信息,客户特征信息包括客户历史寄件数量及客户历史保价数量;
根据客户历史寄件数量及客户历史保价数量,确定客户的客户类型;
基于客户类型,将客户特征信息和运单特征信息输入到预先构建的与客户类型对应的保价预测模型以得到预测值;
将预测值与保价预测模型对应的阈值进行比较,以确定用户是否需要推荐保价。
在其中一个实施例中,根据客户历史寄件数量及客户历史保价数量,确定客户的客户类型,包括:
若在预设时间内客户的历史寄件数量等于第一阈值,确定客户为第一客户类型;
若在预设时间内客户的历史寄件数量大于第一阈值且客户的历史保价数量等于第二阈值,确定客户为第二客户类型;
若在预设时间内客户的历史寄件数量大于第一阈值且客户的历史保价数量介于第三阈值与第四阈值之间,确定客户为第三客户类型;
若在预设时间内客户的历史寄件数量大于第一阈值且客户的历史保价数量大于等于第五阈值,确定客户为第四客户类型。
在其中一个实施例中,基于客户类型,将客户特征信息和运单特征信息输入到与客户类型对应的保价预测模型得到预测值,包括:
如果客户类型为第一客户类型,则将运单特征信息输入到预先构建的第一保价预测模型,得到预测值;
或,
如果客户类型为第二客户类型,则将客户特征信息和运单特征信息输入到预先构建的第二保价预测模型,得到预测值;
或,
如果客户类型为第三客户类型,则将客户特征信息和运单特征信息输入到预先构建的第三保价预测模型,得到预测值;
或,
如果客户类型为第四客户类型,则将客户特征信息和运单特征信息输入到预先构建的第四保价预测模型,得到预测值。
在其中一个实施例中,第一保价预测模型为XGBoost模型。
在其中一个实施例中,预先构建第二保价预测模型通过如下步骤构建:
分别确定第二客户类型、第三客户类型和第四客户类型的客户在客户特征信息上的中心点坐标;
分别确定属于第二客户类型的客户与第二客户类型的客户的中心点坐标、第三客户类型的中心点坐标、及第四客户类型的中心点坐标之间的距离;
根据距离选择与之对应的保价预测模型作为第二保价预测模型或放弃保价策略。
在其中一个实施例中,第三保价预测模型和第四保价预测模型为随机森林模型。
在其中一个实施例中,客户特征信息还包括以下中的至少一种:首次寄件时间、客户总寄件重量、非法定工作日寄件量、时效件寄件量、寄件频率大于预设次数的网点;
运单特征信息包括以下中的至少一种:收件地址信息、寄件地址信息、货物重量、货物类型、服务类型。
在其中一个实施例中,阈值通过以下步骤得到:
根据客户特征信息和运单特征信息构建数据集,数据集包括训练集和测试集;
根据训练集,确定训练集上得到的最大分类概率值、最小分类概率值、最优阈值;
根据测试集,确定测试集上得到的最大分类概率值、最小分类概率值;
根据训练集上得到的最大分类概率值、最小分类概率值、最优阈值及测试集上得到的最大分类概率值、最小分类概率值,确定阈值。
第二方面,本申请实施例提供了一种保价推荐装置,包括:
获取模块,用于获取客户的客户特征信息和运单特征信息,客户特征信息包括客户历史寄件数量及客户历史保价数量;
确定模块,用于根据客户历史寄件数量及客户历史保价数量,确定客户的客户类型;
输入模块,用于基于客户类型,将客户特征信息和运单特征信息输入到预先构建的与客户类型对应的保价预测模型以得到预测值;
处理模块,用于将预测值与保价预测模型对应的阈值进行比较,以确定是否需要推荐保价。
第三方面,本申请实施例提供了一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现上述任一项的保价推荐方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述任一项的保价推荐方法。
本实施例提供的保价推荐方法中,基于不同的客户类型,将客户特征信息和运单特征信息输入到预先构建的与客户类型对应的保价预测模型,得到预测值,将预测值与保价预测模型对应的阈值进行比较,进而确定用户是否需要推荐保价,从而提高物流体系的智能化。本实施例中,可以针对不同的客户类型,采用不同的保价预测模型精准地判定用户是否需要推荐保价并且,采用本实施例提供的保价推荐方法,有效地节省了人力成本,提高了业务处理效率。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1为本发明的实施例提供的保价推荐方法的流程示意图;
图2为本发明的实施例提供的构建第二保价预测模型的流程示意图;
图3为本发明的实施例提供的获取阈值的流程示意图;
图4为本发明的实施例提供的保价推荐装置的结构示意图;
图5为本发明的实施例提供的一种计算机设备的结构示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
如背景技术中提到的,现有的物品快递时是否需要保价,主要是快递员凭借经验来主观推荐,这种保价推荐方式,快递的物品是否需要保价完全由快递员掌控。采用现有的保价推荐方式,需要提前对快递员进行培训,增加了成本,并且推荐是否保价时主观性比较强。
因此,希望提出一种保价推荐方法,能够降低成本,同时减弱推荐是否保价的主观性。
参照图1,其示出了根据本申请一个实施例描述的保价推荐方法的示例性流程图。
如图1所示,在步骤110中,获取客户的客户特征信息和运单特征信息,客户特征信息包括客户历史寄件数量及客户历史保价数量。
具体地,客户特征信息是指客户寄件的行为特征信息,客户特征信息可以包括客户历史寄件数量及客户历史保价数量。其中,客户历史寄件数量是指在预设时间内客户的寄件总数,客户历史保价数量是指在预设时间内客户寄件时保价次数。在一个实施例中,客户特征信息还可以包括以下中的至少一种:首次寄件时间、客户总寄件重量、非法定工作日寄件量、时效件寄件量、寄件频率大于预设次数的网点。其中,首次寄件时间是指在预设时间内客户首次寄件的时间;客户总寄件重量是指在预设时间内客户所有寄件物品的总重量;非法定工作日寄件量是指在预设时间内客户在非法定工作日的寄件数量,非法定工作日可以包括周六、周日及法定节假日;时效件寄件量是指在预设时间内客户邮寄的时效件的数量,时效件可以包括即日件、次日件等其他具有时效到达的快递;寄件频率大于预设次数的网点是指在预设时间内客户常用的寄件网点,预设次数可以根据具体的应用场景或者应用需求设置,例如,可以设置预设次数为5。上述的预设时间可以根据具体的应用场景或者应用需求设置,例如,可以设置预设时间为3个月。
另外,客户特征信息还可以包括其他与客户相关的特征信息,上述实施例中的客户特征信息可以采用卡方检验方法从所有客户特征信息中进行选取,采用卡方检验法验证每个客户特征信息与对应的保价结果的相关性,选取相关性大于预设阈值的客户特征信息,其中,预设阈值可以根据具体的应用场景或应用需求设置。
具体地,运单特征信息是指客户寄件时快递运单的特征信息。在一个实施例中,运单特征信息包括以下中的至少一种:收件地址信息、寄件地址信息、货物重量、货物类型、服务类型。其中,货物类型是指快递的物品类型,物品类型可以包括易碎品、贵重物品、普通物品等。
另外,运单特征信息还可以包括其他与快递运单相关的特征信息,上述实施例中的运单特征信息也可以采用卡方检验方法从所有运单特征信息中进行选取,采用卡方检验法验证每个运单特征信息与对应的保价结果的相关性,选取相关性大于预设阈值的运单特征信息,其中,预设阈值可以根据具体的应用场景或应用需求设置。
本申请实施例提供的保价推荐方法中,客户特征信息包括以下中的至少一种:首次寄件时间、客户总寄件重量、非法定工作日寄件量、时效件寄件量、寄件频率大于预设次数的网点;运单特征信息包括以下中的至少一种:收件地址信息、寄件地址信息、货物重量、货物类型、服务类型。本申请实施例中,客户特征信息及运单特征信息与对应的保价结果相关性较大,可以使得通过对应的保价预测模型得到的预测值更加准确,从而使得推荐保价的结果更加准确。
在步骤120中,根据客户历史寄件数量及客户历史保价数量,确定客户的客户类型。
其中,客户类型可以粗分为客户是无历史寄件行为的新客户,和有历史寄件行为的老客户等。还可以进一步将有历史寄件行为的老客户按照保价次数进行细分为高保价客户类型、潜在保价客户类型、无保价客户类型。
在一个实施例中,根据客户历史寄件数量及客户历史保价数量,确定客户的客户类型,包括:
若在预设时间内客户的历史寄件数量等于第一阈值,确定客户为第一客户类型;
若在预设时间内客户的历史寄件数量大于第一阈值且客户的历史保价数量等于第二阈值,确定客户为第二客户类型;
若在预设时间内客户的历史寄件数量大于第一阈值且客户的历史保价数量介于第三阈值与第四阈值之间,确定客户为第三客户类型;
若在预设时间内客户的历史寄件数量大于第一阈值且客户的历史保价数量大于等于第五阈值,确定客户为第四客户类型。
其中,预设时间是可以根据具体的应用场景或者应用需求设置,例如,可以设置预设时间为3个月。
第一阈值、第二阈值、第三阈值、第四阈值、第五阈值均可以根据具体的应用场景或者应用需求设置,例如,可以设置第一阈值为0,可以设置第二阈值为0,可以设置第三阈值为1,可以设置第四阈值为3,可以设置第五阈值为4。
例如按照上述设置,第一客户类型的客户为在预设时间内历史寄件数量等于0的客户,即第一客户类型的客户为新客户。第二客户类型的客户为在预设时间内历史寄件数量大于0且历史保价数量等于0的客户,即第二客户类型的客户为老客户且无保价客户。第三客户类型的客户为在预设时间内历史寄件数量大于0且历史保价数量介于1和3之间的客户,即第三客户类型的客户为老客户且潜在保价客户。第四客户类型的客户为在预设时间内历史寄件数量大于0且历史保价数量大于4的客户,即第四客户类型的客户为老客户且高保价客户。
本申请实施例提供的保价推荐方法中,按照客户历史寄件数量及客户历史保价数量,将客户分为不同的客户类型,结合后续步骤不同客户类型的客户对应不同的保价预测模型,得到的保价预测值更加准确,从而使得推荐保价的结果更加准确。
在步骤130中,基于客户类型,将客户特征信息和运单特征信息输入到预先构建的与客户类型对应的保价预测模型以得到预测值。
具体地,保价预测模型是指为客户推荐是否保价的模型。不同的客户类型对应不同的保价预测模型。
预测值为保价预测模型的输出值,根据预测值为客户推荐是否保价。
在一个实施例中,基于客户类型,将客户特征信息和运单特征信息输入到与客户类型对应的保价预测模型得到预测值,包括:
如果客户类型为第一客户类型,则将运单特征信息输入到预先构建的第一保价预测模型,得到预测值;
或,
如果客户类型为第二客户类型,则将客户特征信息和运单特征信息输入到预先构建的第二保价预测模型,得到预测值;
或,
如果客户类型为第三客户类型,则将客户特征信息和运单特征信息输入到预先构建的第三保价预测模型,得到预测值;
或,
如果客户类型为第四客户类型,则将客户特征信息和运单特征信息输入到预先构建的第四保价预测模型,得到预测值。
在一个实施例中,第一保价预测模型可以为XGBoost模型。例如,第一保价预测模型可以为基于boosting的XGBoost模型,选用该模型主要是由于样本数据的正负样本不均衡,基于boosting的建模方法可以提高正负样本不均衡分类的准确率。
具体地,第一保价预测模型的构建过程包括:
获取第一客户类型的客户的运单特征信息,将运单特征信息汇总在一起构成第一客户类型的客户的数据集,将数据集按7:3的比例构建第一客户类型的客户的训练集及测试集,利用训练集训练基于boosting的XGBoost模型,得到第一保价预测模型,利用测试集对训练好的第一保价预测模型进行测试,在测试时,可以采用例如精确率、召回率、AUC(Area Under Curve,曲线下的面积)等指标对模型进行评估,如果评估模型不合格,则重新获取数据集训练模型,直至评估模型合格为止。
在一个实施例中,参照图2,其示出了根据本申请一个实施例描述的构建第二保价预测模型的示例性流程图。
如图2所示,在步骤210中,分别确定第二客户类型、第三客户类型和第四客户类型的客户在客户特征信息上的中心点坐标。
具体地,分别获取第二客户类型、第三客户类型和第四客户类型的客户的客户特征信息,然后将获取到的客户特征信息进行预处理,得到客户特征信息的数字化特征,分别将第二客户类型、第三客户类型和第四客户类型的客户的客户特征信息的数字化特征在坐标系中标出,构成多维坐标系(客户特征信息包括多少个特征即为多少维坐标系)。
其中,每个客户特征信息为一维客户特征信息,将所有客户特征信息预处理为数字化特征时,为将每维客户特征信息均处理为(0,1)之间的数字。假设第j维客户特征信息中的坐标最大值为Kjmax,第j维客户特征信息中的坐标最小值为Kjmin,第j维客户特征信息的当前坐标值为Kj,则,第j维客户特征信息的数字化特征值vj为:
其中,j=1,…,m,m为客户特征信息总维数。
则,第i个客户的客户特征信息坐标vi为vi=(v1,...,vj),第二客户类型的客户的客户特征信息坐标为v1i,第三客户类型的客户的客户特征信息坐标为v2i,第四客户类型的客户的客户特征信息坐标为v3i,相应的,可以得到第二客户类型、第三客户类型、第四客户类型的客户在客户特征信息上的中心点坐标vc1、vc2、vc3分别为:
其中,n1、n2、n3分别为第二客户类型、第三客户类型、第四客户类型的客户的客户特征信息总维数。
在步骤220中,分别确定属于第二客户类型的客户与第二客户类型的客户的中心点坐标、第三客户类型的客户的中心点坐标、及第四客户类型的客户的中心点坐标之间的距离。
具体地,确定属于第二客户类型的客户与第二客户类型的客户的中心点坐标、第三客户类型的中心点坐标、及第四客户类型的中心点坐标之间的距离可以采用欧式距离进行计算,也可以采用其他距离公式进行计算,在此不进行限定。下面以采用欧式距离进行计算为例进行说明。
假设第二客户类型、第三客户类型、第四客户类型的客户在客户特征信息上的中心点坐标分别为vc1、vc2、vc3,第i个第二客户类型客户的第j个客户特征为vij,则第二客户类型的客户与第二客户类型的客户的中心点坐标、第三客户类型的中心点坐标、及第四客户类型的中心点坐标之间的欧式距离dist1、dist2、dist3分别为:
其中,上述n为第二客户类型的客户的总数,m为客户特征信息总维数。
在步骤230中,根据距离选择与之对应的保价预测模型作为第二保价预测模型或放弃保价策略。
根据上述确定的第二客户类型客户分别与第二客户类型的客户的中心点坐标、第三客户类型的客户的中心点坐标、及第四客户类型的客户的中心点坐标之间的距离,选取其中最小的距离,第二客户类型客户按照距离最小的客户类型对应的保价预测模型进行保价推荐,即如果第二客户类型客户距离第三客户类型客户或第四客户类型客户的中心点坐标的距离最近,则采用其对应的保价预测模型来推荐保价;如果其距离第二客户类型客户的中心点坐标的距离最近,则判断其为不保价。
例如,某运单中,寄件客户为第二客户类型客户,通过计算得到其与第三客户类型客户的中心点坐标的距离最近,所以采用第三保价预测模型对其进行预测。又例如,某运单中,寄件客户为第二客户类型客户,通过计算得到其与第二客户类型客户的中心点坐标的距离最近,则直接判定其不保价。
本实施例提供的保价推荐方法,通过第二客户类型客户分别与第二客户类型、第三客户类型、第四客户类型的客户的中心点坐标之间的距离构建第二保价预测模型,向第二客户类型客户推荐是否保价,降低了对快递员的培训成本,同时也可以为第二客户类型客户进行客户推荐保价。
在步骤140中,将预测值与保价预测模型对应的阈值进行比较,以确定用户是否需要推荐保价。
其中,各保价预测模型对应的阈值可以根据具体的应用场景或者应用需求设置,例如,均设置为0.5。各保价预测模型对应的阈值还可以通过下述实施例提供的方式计算得到。
本实施例提供的保价推荐方法中,基于不同的客户类型,将客户特征信息和运单特征信息输入到预先构建的与客户类型对应的保价预测模型,得到预测值,将预测值与保价预测模型对应的阈值进行比较,进而确定用户是否需要推荐保价。本实施例中,可以针对不同的客户类型,采用不同的保价预测模型确定用户是否需要推荐保价,推荐客户是否保价更加客观,并且,采用本实施例提供的保价推荐方法,无需提前对快递员进行培训,从而降低了成本。
在一个实施例中,参照图3,其示出了根据本申请一个实施例描述的获取阈值的示例性流程图。
如图3所示,在步骤310中,根据客户特征信息和运单特征信息构建数据集,数据集包括训练集和测试集。
具体地,不同客户类型客户分别构建其对应的数据集。
例如,第一客户类型客户的运单特征信息汇总构成第一客户类型客户的数据集,可选地,将第一客户类型客户的数据集按照设置的比例构建第一客户类型客户的训练集和测试集,例如7:3。
第二客户类型客户的客户特征信息和运单特征信息汇总构成第二客户类型客户的数据集,由于第二客户类型客户的保价结果全为0,无法进行训练,因此,将第二客户类型客户的数据集全部作为测试集。
第三客户类型客户的客户特征信息和运单特征信息汇总构成第三客户类型客户的数据集,可选地,将第三客户类型客户的数据集按照设置的比例构建第三客户类型客户的训练集和测试集,例如7:3。
第四客户类型客户的客户特征信息和运单特征信息汇总构成第四客户类型客户的数据集,可选地,将第四客户类型客户的数据集按照设置的比例构建第四客户类型客户的训练集和测试集,例如7:3。
在步骤320中,根据训练集,确定训练集上得到的最大分类概率值、最小分类概率值、最优阈值。
具体地,根据不同客户类型的训练集,确定不同客户类型分别对应的训练集上的最大分类概率值Maxtrain、最小分类概率值Mintrain、最优阈值Thresholdtrain。确定最大分类概率值、最小分类概率值、最优阈值均为现有技术,这里不再赘述。
在步骤330中,根据测试集,确定测试集上得到的最大分类概率值、最小分类概率值。
具体地,根据不同客户类型的测试集,确定不同客户类型分别对应的测试集上的最大分类概率值Maxtest、最小分类概率值Mintest、最优阈值Thresholdtest。确定最大分类概率值、最小分类概率值、最优阈值均为现有技术,这里不再赘述。
在步骤340中,根据训练集上得到的最大分类概率值、最小分类概率值、最优阈值及测试集上得到的最大分类概率值、最小分类概率值,确定阈值。
具体地,假设训练集上的最大分类概率值为Maxtrain、最小分类概率值为Mintrain、最优阈值为Thresholdtrain,测试集上的最大分类概率值为Maxtest、最小分类概率值为Mintest,则阈值Thresholdtest为:
以第四客户类型客户为例,计算其对应的阈值Thresholdtestgao为:
其中,Maxtraingao为第四客户类型客户训练集上得到的最大分类概率值,Mintraingao为第四客户类型客户训练集上得到的最小分类概率值,Thresholdtraingao为第四客户类型客户训练集上得到的最优阈值,Maxtestgao为第四客户类型客户测试集上得到的最大分类概率值,Mintestgao为第四客户类型客户测试集上得到的最小分类概率值。
本实施例提供的保价推荐方法中,通过训练集上得到的最大分类概率值、最小分类概率值、最优阈值及测试集上得到的最大分类概率值、最小分类概率值,确定阈值,该方式获得的阈值,可以使得保价推荐结果更准确。
如图4为本发明实施例提供的保价推荐装置400的结构示意图。如图4所示,该装置可以实现如图1所示的方法,该装置可以包括:
获取模块410,用于获取客户的客户特征信息和运单特征信息,客户特征信息包括客户历史寄件数量及客户历史保价数量;
确定模块420,用于根据客户历史寄件数量及客户历史保价数量,确定客户的客户类型;
输入模块430,用于基于客户类型,将客户特征信息和运单特征信息输入到预先构建的与客户类型对应的保价预测模型以得到预测值;
处理模块440,用于将预测值与保价预测模型对应的阈值进行比较,以确定是否需要推荐保价。
可选地,确定模块420还用于:
若在预设时间内客户的历史寄件数量等于第一阈值,确定客户为第一客户类型;
若在预设时间内客户的历史寄件数量大于第一阈值且客户的历史保价数量等于第二阈值,确定客户为第二客户类型;
若在预设时间内客户的历史寄件数量大于第一阈值且客户的历史保价数量介于第三阈值与第四阈值之间,确定客户为第三客户类型;
若在预设时间内客户的历史寄件数量大于第一阈值且客户的历史保价数量大于等于第五阈值,确定客户为第四客户类型。
可选地,输入模块430还用于:
如果客户类型为第一客户类型,则将运单特征信息输入到预先构建的第一保价预测模型,得到预测值;
或,
如果客户类型为第二客户类型,则将客户特征信息和运单特征信息输入到预先构建的第二保价预测模型,得到预测值;
或,
如果客户类型为第三客户类型,则将客户特征信息和运单特征信息输入到预先构建的第三保价预测模型,得到预测值;
或,
如果客户类型为第四客户类型,则将客户特征信息和运单特征信息输入到预先构建的第四保价预测模型,得到预测值。
可选地,第一保价预测模型为XGBoost模型。
可选地,该装置还用于:
分别确定第二客户类型、第三客户类型和第四客户类型的客户在客户特征信息上的中心点坐标;分别确定属于第二客户类型的客户与第二客户类型的客户的中心点坐标、第三客户类型的客户的中心点坐标、及第四客户类型的客户的中心点坐标之间的距离;根据距离选择与之对应的保价预测模型作为第二保价预测模型或放弃保价策略。
可选地,第三保价预测模型和第四保价预测模型为随机森林模型。
可选地,客户特征信息还包括以下中的至少一种:首次寄件时间、客户总寄件重量、非法定工作日寄件量、时效件寄件量、寄件频率大于预设次数的网点;运单特征信息包括以下中的至少一种:收件地址信息、寄件地址信息、货物重量、货物类型、服务类型。
可选地,该装置还用于:
根据客户特征信息和运单特征信息构建数据集,数据集包括训练集和测试集;根据训练集,确定训练集上得到的最大分类概率值、最小分类概率值、最优阈值;根据测试集,确定测试集上得到的最大分类概率值、最小分类概率值;根据训练集上得到的最大分类概率值、最小分类概率值、最优阈值及测试集上得到的最大分类概率值、最小分类概率值,确定阈值。
本实施例提供的保价推荐装置,可以执行上述方法的实施例,其实现原理和技术效果类似,在此不再赘述。
应当理解,装置400中记载的诸单元或模块与参考图1描述的方法中的各个步骤相对应。由此,上文针对方法描述的操作和特征同样适用于装置400及其中包含的单元,在此不再赘述。装置400可以预先实现在电子设备的浏览器或其他安全应用中,也可以通过下载等方式而加载到电子设备的浏览器或其安全应用中。装置400中的相应单元可以与电子设备中的单元相互配合以实现本申请实施例的方案。
在上文详细描述中提及的若干模块或者单元,这种划分并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
图5为本发明实施例提供的一种计算机设备的结构示意图。如图5所示,示出了适于用来实现本申请实施例的终端设备或服务器的计算机系统500的结构示意图。
如图5所示,计算机系统500包括中央处理单元(CPU)501,其可以根据存储在只读存储器(ROM)502中的程序或者从存储部分508加载到随机访问存储器(RAM)503中的程序而执行各种适当的动作和处理。在RAM 503中,还存储有系统500操作所需的各种程序和数据。CPU 501、ROM 502以及RAM 503通过总线504彼此相连。输入/输出(I/O)接口506也连接至总线504。
以下部件连接至I/O接口505:包括键盘、鼠标等的输入部分506;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分507;包括硬盘等的存储部分508;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分509。通信部分509经由诸如因特网的网络执行通信处理。驱动器510也根据需要连接至I/O接口506。可拆卸介质511,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器510上,以便于从其上读出的计算机程序根据需要被安装入存储部分508。
特别地,根据本公开的实施例,上文参考图1描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括有形地包含在机器可读介质上的计算机程序,计算机程序包含用于执行上述保价推荐方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分509从网络上被下载和安装,和/或从可拆卸介质511被安装。
附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,前述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的单元或模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元或模块也可以设置在处理器中。这些单元或模块的名称在某种情况下并不构成对该单元或模块本身的限定。
作为另一方面,本申请还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中前述装置中所包含的计算机可读存储介质;也可以是单独存在,未装配入设备中的计算机可读存储介质。计算机可读存储介质存储有一个或者一个以上程序,前述程序被一个或者一个以上的处理器用来执行描述于本申请的保价推荐方法。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
Claims (11)
1.一种保价推荐方法,其特征在于,包括:
获取客户的客户特征信息和运单特征信息,所述客户特征信息包括客户历史寄件数量及客户历史保价数量;
根据所述客户历史寄件数量及所述客户历史保价数量,确定所述客户的客户类型;
基于所述客户类型,将所述客户特征信息和所述运单特征信息输入到预先构建的与所述客户类型对应的保价预测模型以得到预测值;
将所述预测值与所述保价预测模型对应的阈值进行比较,以确定所述用户是否需要推荐保价。
2.根据权利要求1所述的保价推荐方法,其特征在于,所述根据所述客户历史寄件数量及所述客户历史保价数量,确定所述客户的客户类型,包括:
若在预设时间内所述客户的历史寄件数量等于第一阈值,确定所述客户为第一客户类型;
若在预设时间内所述客户的历史寄件数量大于所述第一阈值且所述客户的历史保价数量等于第二阈值,确定所述客户为第二客户类型;
若在预设时间内所述客户的历史寄件数量大于所述第一阈值且所述客户的历史保价数量介于第三阈值与第四阈值之间,确定所述客户为第三客户类型;
若在预设时间内所述客户的历史寄件数量大于所述第一阈值且所述客户的历史保价数量大于等于第五阈值,确定所述客户为第四客户类型。
3.根据权利要求2所述的保价推荐方法,其特征在于,基于所述客户类型,将所述客户特征信息和所述运单特征信息输入到与所述客户类型对应的保价预测模型得到预测值,包括:
如果所述客户类型为所述第一客户类型,则将所述运单特征信息输入到预先构建的第一保价预测模型,得到所述预测值;
或,
如果所述客户类型为所述第二客户类型,则将所述客户特征信息和所述运单特征信息输入到预先构建的第二保价预测模型,得到所述预测值;
或,
如果所述客户类型为所述第三客户类型,则将所述客户特征信息和所述运单特征信息输入到预先构建的第三保价预测模型,得到所述预测值;
或,
如果所述客户类型为所述第四客户类型,则将所述客户特征信息和所述运单特征信息输入到预先构建的第四保价预测模型,得到所述预测值。
4.根据权利要求3所述的保价推荐方法,其特征在于,所述第一保价预测模型为XGBoost模型。
5.根据权利要求3所述的保价推荐方法,其特征在于,预先构建所述第二保价预测模型通过如下步骤构建:
分别确定所述第二客户类型、第三客户类型和第四客户类型的客户在所述客户特征信息上的中心点坐标;
分别确定属于所述第二客户类型的客户与所述第二客户类型的客户的中心点坐标、所述第三客户类型的客户的中心点坐标、及所述第四客户类型的客户的中心点坐标之间的距离;
根据所述距离选择与之对应的保价预测模型作为所述第二保价预测模型或放弃保价策略。
6.根据权利要求3所述的保价推荐方法,其特征在于,所述第三保价预测模型和所述第四保价预测模型为随机森林模型。
7.根据权利要求1-6任一项所述的保价推荐方法,其特征在于,所述客户特征信息还包括以下中的至少一种:首次寄件时间、客户总寄件重量、非法定工作日寄件量、时效件寄件量、寄件频率大于预设次数的网点;
所述运单特征信息包括以下中的至少一种:收件地址信息、寄件地址信息、货物重量、货物类型、服务类型。
8.根据权利要求1-6任一项所述的保价推荐方法,其特征在于,所述阈值通过以下步骤得到:
根据所述客户特征信息和所述运单特征信息构建数据集,所述数据集包括训练集和测试集;
根据所述训练集,确定所述训练集上得到的最大分类概率值、最小分类概率值、最优阈值;
根据所述测试集,确定所述测试集上得到的最大分类概率值、最小分类概率值;
根据所述训练集上得到的最大分类概率值、最小分类概率值、最优阈值及所述测试集上得到的最大分类概率值、最小分类概率值,确定所述阈值。
9.一种保价推荐装置,其特征在于,包括:
获取模块,用于获取客户的客户特征信息和运单特征信息,所述客户特征信息包括客户历史寄件数量及客户历史保价数量;
确定模块,用于根据所述客户历史寄件数量及所述客户历史保价数量,确定所述客户的客户类型;
输入模块,用于基于所述客户类型,将所述客户特征信息和所述运单特征信息输入到预先构建的与所述客户类型对应的保价预测模型以得到预测值;
处理模块,用于将所述预测值与所述保价预测模型对应的阈值进行比较,以确定是否需要推荐保价。
10.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1~8中任一项所述方法。
11.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1~8中任一项所述方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910181709.9A CN111680941B (zh) | 2019-03-11 | 2019-03-11 | 保价推荐方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910181709.9A CN111680941B (zh) | 2019-03-11 | 2019-03-11 | 保价推荐方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111680941A true CN111680941A (zh) | 2020-09-18 |
CN111680941B CN111680941B (zh) | 2024-03-29 |
Family
ID=72451232
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910181709.9A Active CN111680941B (zh) | 2019-03-11 | 2019-03-11 | 保价推荐方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111680941B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113763645A (zh) * | 2020-09-28 | 2021-12-07 | 北京京东振世信息技术有限公司 | 寄件方法和寄件装置 |
CN113780957A (zh) * | 2021-09-18 | 2021-12-10 | 上海中通吉网络技术有限公司 | 快递保价信息录入方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106780052A (zh) * | 2017-01-10 | 2017-05-31 | 上海诺悦智能科技有限公司 | 基于分类客户行为分析的保险服务推荐方法及系统 |
CN107730389A (zh) * | 2017-09-30 | 2018-02-23 | 平安科技(深圳)有限公司 | 电子装置、保险产品推荐方法及计算机可读存储介质 |
CN108520444A (zh) * | 2018-04-12 | 2018-09-11 | 中国平安人寿保险股份有限公司 | 保险产品推荐方法、设备、装置及计算机可读存储介质 |
-
2019
- 2019-03-11 CN CN201910181709.9A patent/CN111680941B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106780052A (zh) * | 2017-01-10 | 2017-05-31 | 上海诺悦智能科技有限公司 | 基于分类客户行为分析的保险服务推荐方法及系统 |
CN107730389A (zh) * | 2017-09-30 | 2018-02-23 | 平安科技(深圳)有限公司 | 电子装置、保险产品推荐方法及计算机可读存储介质 |
CN108520444A (zh) * | 2018-04-12 | 2018-09-11 | 中国平安人寿保险股份有限公司 | 保险产品推荐方法、设备、装置及计算机可读存储介质 |
Non-Patent Citations (1)
Title |
---|
刘作义等: "运输商务", 中国铁道出版社, pages: 357 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113763645A (zh) * | 2020-09-28 | 2021-12-07 | 北京京东振世信息技术有限公司 | 寄件方法和寄件装置 |
WO2022062420A1 (zh) * | 2020-09-28 | 2022-03-31 | 北京京东振世信息技术有限公司 | 寄件方法和寄件装置 |
CN113780957A (zh) * | 2021-09-18 | 2021-12-10 | 上海中通吉网络技术有限公司 | 快递保价信息录入方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111680941B (zh) | 2024-03-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109711955B (zh) | 基于当前订单的差评预警方法、系统、黑名单库建立方法 | |
CN108734405A (zh) | 一种数据价值评估平台和方法 | |
CN109409964B (zh) | 优质品牌的识别方法及装置 | |
CN108090807B (zh) | 信息推荐方法及装置 | |
CN110298521A (zh) | 用车推荐方法及装置 | |
CN110378546B (zh) | 用于生成信息的方法和装置 | |
CN111680941A (zh) | 保价推荐方法、装置、设备及存储介质 | |
CN111105244B (zh) | 基于退款的服务方案确定方法及装置 | |
CN116029637A (zh) | 跨境电商物流渠道智能推荐方法及装置、设备、存储介质 | |
CN111666481A (zh) | 数据挖掘方法、装置、计算机可读介质及电子设备 | |
CN111222923B (zh) | 一种判断潜在客户的方法及装置、电子设备和存储介质 | |
CN113327132A (zh) | 多媒体推荐方法、装置、设备及存储介质 | |
CN112634057A (zh) | 基金相似度计算方法、平台、设备及可读存储介质 | |
CN111325495B (zh) | 异常件分类方法及系统 | |
CN111667208A (zh) | 一种物品存储控制方法、装置、设备及介质 | |
CN111598638A (zh) | 点击率确定方法、装置及设备 | |
CN108334522B (zh) | 确定海关编码的方法,以及确定类型信息的方法和系统 | |
CN111178927A (zh) | 基于多维度及策略的商品计价方法和系统 | |
CN113077292B (zh) | 一种用户分类方法、装置、存储介质及电子设备 | |
CN112051843B (zh) | 基于订单预估的路径规划方法、装置、机器人和存储介质 | |
CN115439079A (zh) | 项目分类方法及装置 | |
CN113971572A (zh) | 数据处理方法、交互方法、计算设备及计算机存储介质 | |
CN114723354A (zh) | 一种针对供应商的线上商机挖掘方法、设备及介质 | |
CN108109002B (zh) | 数据处理方法及装置 | |
CN109272382A (zh) | 一种物流竞标方法、设备及计算机存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |