CN118260618A

CN118260618A - 模型生成方法、客户识别方法、装置、设备及存储介质

Info

Publication number: CN118260618A
Application number: CN202211701030.6A
Authority: CN
Inventors: 严敏
Original assignee: SF Technology Co Ltd
Current assignee: SF Technology Co Ltd
Filing date: 2022-12-28
Publication date: 2024-06-28

Abstract

本申请公开了一种模型生成方法、客户识别方法、装置、设备及存储介质，该模型生成方法包括：获取多个客户的客户信息，客户信息包括多个客户中每个客户在多个第一时间点的寄件量时间序列；基于客户信息对多个客户进行分层，得到多个客户的多个分类客群；对多个分类客群中每个分类客群包含的客户的寄件量时间序列进行聚类，得到每个分类客群的聚类结果；基于聚类结果，确定多个客户的目标客群；对目标客群进行特征分析，得到目标客群的统计特征；基于目标客群及统计特征对预设网络模型进行训练，得到客户识别模型。本申请实施例得到的客户识别模型可以对仅有件量数据的候鸟特征客户群体进行识别，且客户识别模型的识别准确率高、识别覆盖率大。

Description

模型生成方法、客户识别方法、装置、设备及存储介质

技术领域

本申请涉及物流技术领域，具体涉及一种模型生成方法、客户识别方法、装置、设备及存储介质。

背景技术

随着移动互联网技术的发展，人们使用电商购物的频率越来越多，电商的兴起也带动了快递物流行业的飞速发展。互联网电商为了促进消费，会定义一些购物狂欢节，如“618”、“双十一”等。在“618”、“双十一”等节日中，经常会存在“侯鸟”类客户，所谓“侯鸟”类客户，是指平常不怎么寄件，但在“618”、“双十一”等节日中单量暴增的客户。由于“侯鸟”类客户在“618”、“双十一”等节日中的会出现单量暴增的情况，因此，有必要从多个客户中识别出“侯鸟”类客户。然而，现有方法通常是基于各个客户的特征文本信息，从多个客户中找出具有类似特征的客户群体，对于仅有件量数据的“侯鸟”类客户无法准确识别。

发明内容

本申请实施例提供一种模型生成方法、客户识别方法、装置、设备及存储介质，得到的客户识别模型可以对仅有件量数据的候鸟特征客户群体进行识别，且客户识别模型的识别准确率高、识别覆盖率大。

第一方面，本申请提供一种模型生成方法，所述模型生成方法包括：

获取多个客户的客户信息，所述客户信息包括所述多个客户中每个客户在预设的多个第一时间点的寄件量时间序列；

基于所述客户信息对所述多个客户进行分层，得到所述多个客户的多个分类客群；

对所述多个分类客群中每个分类客群包含的客户的寄件量时间序列进行聚类，得到所述每个分类客群的聚类结果；

基于所述聚类结果，确定所述多个客户的目标客群；

对所述目标客群进行特征分析，得到所述目标客群的统计特征；

基于所述目标客群及所述统计特征对预设网络模型进行训练，得到客户识别模型。

在本申请一些实施方案中，所述客户信息还包括所述每个客户在预设的多个第二时间点的累计寄件量及所述每个客户的状态信息，所述基于所述客户信息对所述多个客户进行分层，得到所述多个客户的多个分类客群，包括：

基于所述状态信息对所述多个客户进行筛选，得到多个初筛客户，所述状态信息用于表征所述每个客户的客户状态是否处于注销状态，所述多个初筛客户为所述多个客户中客户状态处于未注销状态的客户；

基于所述累计寄件量对所述多个初筛客户进行筛选，得到多个第一候选客户，所述多个第一候选客户为所述多个初筛客户中累计寄件量不高于第一件量值的客户，所述第一件量值基于所述累计寄件量值确定；

基于所述累计寄件量对所述多个第一候选客户进行分组，得到多个客户组；

基于所述寄件量时间序列对所述多个客户组中每个客户组的客户进行筛选，得到所述多个客户的多个分类客群。

在本申请一些实施方案中，所述多个第一时间点包括多个第三时间点和多个第四时间点，所述多个第四时间点为所述多个第三时间点之后的时间点，所述基于所述寄件量时间序列对所述多个客户组中每个客户组的客户进行筛选，得到所述多个客户的多个分类客群，包括：

基于所述寄件量时间序列，确定所述多个客户组中每个客户组的每个客户在所述多个第三时间点中每个第三时间点的寄件量及所述多个第四时间点中每个第四时间点的寄件量；

基于所述每个第三时间点的寄件量，确定所述每个客户组的每个客户在所述多个第三时间点的件量均值；

基于所述每个第四时间点的寄件量，确定所述每个客户组的每个客户在所述多个第四时间点的件量均值；

基于所述每个第三时间点的寄件量、所述多个第三时间点的件量均值及所述多个第四时间点的件量均值，从所述每个客户组中确定第二候选客户，所述第二候选客户为所述每个客户组中所述每个第三时间点的寄件量小于预设的第二件量值或所述多个第三时间点的件量均值小于所述多个第四时间点的件量均值的客户；

将所述第二候选客户从所述每个客户组中剔除，并将剔除所述第二候选客户的多个客户组确定为所述多个客户的多个分类客群。

在本申请一些实施方案中，所述聚类结果包括多个初始聚类簇及所述多个初始聚类簇中每个初始聚类簇的类中心曲线，所述多个初始聚类簇与多个聚类客群分别对应，所述基于所述聚类结果，确定所述多个客户的目标客群，包括：

基于所述类中心曲线从所述多个初始聚类簇中确定目标聚类簇，所述目标聚类簇为所述多个初始聚类簇中类中心曲线包含预设数量波峰的聚类簇；

将所述目标聚类簇对应的聚类客群，确定为所述多个客户的目标客群。

在本申请一些实施方案中，所述统计特征包括：

所述多个第三时间点的件量均值与所述多个第四时间点的件量均值的比值；

所述多个第三时间点的件量标准差与所述多个第四时间点的件量标准差的比值；

所述多个第三时间点的件量最小值与所述多个第四时间点的件量最小值的比值；

所述多个第三时间点的寄件量的四分之一分位数与所述多个第四时间点的寄件量的四分之一分位数的比值；

所述多个第三时间点的寄件量的中位数与所述多个第四时间点的寄件量的中位数的比值；

所述多个第三时间点的寄件量的四分之三分位数与所述多个第四时间点的寄件量的四分之三分位数的比值；

所述多个第三时间点的件量最大值与所述多个第四时间点的件量最大值的比值。

在本申请一些实施方案中，所述基于所述目标客群及所述统计特征对预设网络模型进行训练，得到客户识别模型，包括：

基于所述目标客群及所述统计特征构建训练数据集，所述训练数据集包括多个样本客户中每个样本客户的第一特征值及所述每个样本客户的真实标签，所述第一特征值为所述每个样本客户在所述统计特征下的特征值，所述多个样本客户包括属于所述目标客群的客户和不属于所述目标客群的客户；

将所述第一特征值输入预设网络模型，通过所述预设网络模型输出所述每个样本客户的预测标签；

基于所述真实标签、所述预测标签及所述预设网络模型的损失函数对所述预设网络模型进行训练，得到客户识别模型。

第二方面，本申请提供一种客户识别方法，所述客户识别方法应用于第一方面中任一项所述的模型生成方法生成的客户识别模型，所述客户识别方法包括：

获取待识别客户的第二特征值，所述第二特征值为所述待识别客户在所述统计特征下的特征值；

将所述第二特征值输入所述客户识别模型，通过所述客户识别模型输出所述待识别客户的识别结果，所述识别结果用于表征所述待识别客户是否属于所述目标客群中的客户。

第三方面，本申请提供一种模型生成装置，所述模型生成装置包括：

信息获取单元，用于获取多个客户的客户信息，所述客户信息包括所述多个客户中每个客户在预设的多个第一时间点的寄件量时间序列；

客户分层单元，用于基于所述客户信息对所述多个客户进行分层，得到所述多个客户的多个分类客群；

时序聚类单元，用于对所述多个分类客群中每个分类客群包含的客户的寄件量时间序列进行聚类，得到所述每个分类客群的聚类结果；

客群确定单元，用于基于所述聚类结果，确定所述多个客户的目标客群；

特征分析单元，用于对所述目标客群进行特征分析，得到所述目标客群的统计特征；

模型生成单元，用于基于所述目标客群及所述统计特征对预设网络模型进行训练，得到客户识别模型。

在本申请一些实施方案中，所述客户信息还包括所述每个客户在预设的多个第二时间点的累计寄件量及所述每个客户的状态信息，所述客户分层单元具体用于：

在本申请一些实施方案中，所述多个第一时间点包括多个第三时间点和多个第四时间点，所述多个第四时间点为所述多个第三时间点之后的时间点，所述客户分层单元具体还用于：

在本申请一些实施例中，所述聚类结果包括多个初始聚类簇及所述多个初始聚类簇中每个初始聚类簇的类中心曲线，所述多个初始聚类簇与多个聚类客群分别对应，所述客群确定单元具体用于：

在本申请一些实施例中，所述模型生成单元具体用于：

第四方面，本申请提供一种客户识别装置，所述客户识别装置包括：

特征获取单元，用于获取待识别客户的第二特征值，所述第二特征值为所述待识别客户在所述统计特征下的特征值；

客户识别单元，用于将所述第二特征值输入所述客户识别模型，通过所述客户识别模型输出所述待识别客户的识别结果，所述识别结果用于表征所述待识别客户是否属于所述目标客群中的客户。

第五方面，本申请还提供一种计算机设备，所述计算机设备包括：

一个或多个处理器；

存储器；以及

一个或多个应用程序，其中所述一个或多个应用程序被存储于所述存储器中，并配置为由所述处理器执行以实现第一方面中任一项所述的模型生成方法或第二方面中所述的客户识别方法。

第六方面，本申请还提供一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器进行加载，以执行第一方面任一项所述的模型生成方法中的步骤或第二方面所述的客户识别方法中的步骤。

本申请基于时序聚类从多个客户中挖掘具有候鸟特征的目标客群并找到目标客群的统计特征，再基于目标客群及统计特征对预设网络模型进行训练，得到的客户识别模型可以对仅有件量数据的具有候鸟特征的客户群体进行识别，且客户识别模型的识别准确率高、识别覆盖率大；对多个客户进行分层，再对分层得到的多个分类客群包含的客户的寄件量时间序列进行聚类，可以提升聚类速度及聚类结果的准确度。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的模型生成系统的场景示意图；

图2是本申请实施例中提供的模型生成方法的一个实施例流程示意图；

图3是本申请实施例中提供的模型生成方法的具体实施例流程示意图；

图4是本申请实施例中提供的对多个初筛客户进行筛选的原理图；

图5是本申请实施例中提供的客户识别方法的一个实施例流程示意图；

图6是本申请实施例中提供的模型生成装置的一个实施例结构示意图；

图7是本申请实施例中提供的客户识别装置的一个实施例结构示意图；

图8是本申请实施例中提供的计算机设备的一个实施例结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

在本申请的描述中，需要理解的是，术语“中心”、“纵向”、“横向”、“长度”、“宽度”、“厚度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本申请和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本申请的限制。此外，术语“第一”、“第二”、“第三”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”、“第三”的特征可以明示或者隐含地包括一个或者更多个所述特征。在本申请的描述中，“多个”的含义是两个或两个以上，除非另有明确具体的限定。

在本申请中，“示例性”一词用来表示“用作例子、例证或说明”。本申请中被描述为“示例性”的任何实施例不一定被解释为比其它实施例更优选或更具优势。为了使本领域任何技术人员能够实现和使用本申请，给出了以下描述。在以下描述中，为了解释的目的而列出了细节。应当明白的是，本领域普通技术人员可以认识到，在不使用这些特定细节的情况下也可以实现本申请。在其它实例中，不会对公知的结构和过程进行详细阐述，以避免不必要的细节使本申请的描述变得晦涩。因此，本申请并非旨在限于所示的实施例，而是与符合本申请所公开的原理和特征的最广范围相一致。

需要说明的是，本申请实施例方法由于是在计算机设备中执行，各计算机设备的处理对象均以数据或信息的形式存在，例如时间，实质为时间信息，可以理解的是，后续实施例中若提及尺寸、数量、位置等，均为对应的数据存在，以便计算机设备进行处理，具体此处不作赘述。

本申请实施例提供一种模型生成方法、客户识别方法、装置、设备及存储介质，以下分别进行详细说明。

请参阅图1，图1为本申请实施例所提供的模型生成系统的场景示意图，该模型生成系统可以包括计算机设备100，计算机设备100中集成有模型生成装置，如图1中的计算机设备。

本申请实施例中计算机设备100主要用于获取多个客户的客户信息，所述客户信息包括所述多个客户中每个客户在预设的多个第一时间点的寄件量时间序列；基于所述客户信息对所述多个客户进行分层，得到所述多个客户的多个分类客群；对所述多个分类客群中每个分类客群包含的客户的寄件量时间序列进行聚类，得到所述每个分类客群的聚类结果；基于所述聚类结果，确定所述多个客户的目标客群；对所述目标客群进行特征分析，得到所述目标客群的统计特征；基于所述目标客群及所述统计特征对预设网络模型进行训练，得到客户识别模型，得到的客户识别模型可以对仅有件量数据的候鸟特征客户群体进行识别，且客户识别模型的识别准确率高、识别覆盖率大。

本申请实施例中，该计算机设备100可以是独立的服务器，也可以是服务器组成的服务器网络或服务器集群，例如，本申请实施例中所描述的计算机设备100，其包括但不限于计算机、网络主机、单个网络服务器、多个网络服务器集或多个服务器构成的云服务器。其中，云服务器由基于云计算(Cloud Computing)的大量计算机或网络服务器构成。

可以理解的是，本申请实施例中所使用的计算机设备100可以是既包括接收和发射硬件的设备，即具有能够在双向通信链路上，执行双向通信的接收和发射硬件的设备。这种设备可以包括：蜂窝或其他通信设备，其具有单线路显示器或多线路显示器或没有多线路显示器的蜂窝或其他通信设备。具体的计算机设备100具体可以是台式终端或移动终端，计算机设备100具体还可以是手机、平板电脑、笔记本电脑等中的一种。

本领域技术人员可以理解，图1中示出的应用环境，仅仅是与本申请方案一种应用场景，并不构成对本申请方案应用场景的限定，其他的应用环境还可以包括比图1中所示更多或更少的计算机设备，例如图1中仅示出1个计算机设备，可以理解的，该模型生成系统还可以包括一个或多个其他服务，具体此处不作限定。

另外，如图1所示，该模型生成系统还可以包括存储器200，用于存储数据，如寄件量时间序列，例如客户从10月22日至11月20日每天的寄件量组成的寄件量时间序列等，如客户信息，例如多个第一时间点的寄件量时间序列、多个第二时间点的累计寄件量、状态信息等。

需要说明的是，图1所示的模型生成系统的场景示意图仅仅是一个示例，本申请实施例描述的模型生成系统以及场景是为了更加清楚的说明本申请实施例的技术方案，并不构成对于本申请实施例提供的技术方案的限定，本领域普通技术人员可知，随着模型生成系统的演变和新业务场景的出现，本申请实施例提供的技术方案对于类似的技术问题，同样适用。

首先，本申请实施例中提供一种模型生成方法，该模型生成方法的执行主体为模型生成装置，该模型生成装置应用于计算机设备，该模型生成方法包括：获取多个客户的客户信息，所述客户信息包括所述多个客户中每个客户在预设的多个第一时间点的寄件量时间序列；基于所述客户信息对所述多个客户进行分层，得到所述多个客户的多个分类客群；对所述多个分类客群中每个分类客群包含的客户的寄件量时间序列进行聚类，得到所述每个分类客群的聚类结果；基于所述聚类结果，确定所述多个客户的目标客群；对所述目标客群进行特征分析，得到所述目标客群的统计特征；基于所述目标客群及所述统计特征对预设网络模型进行训练，得到客户识别模型。

如图2所示，为本申请实施例中模型生成方法的一个实施例流程示意图，该模型生成方法可以包括如下步骤301～306，具体如下：

301、获取多个客户的客户信息，所述客户信息包括所述多个客户中每个客户在预设的多个第一时间点的寄件量时间序列。

多个客户为需要进行客群分析的客户，客户信息为多个客户的信息，客户信息包括多个客户中每个客户在预设的多个第一时间点的寄件量时间序列，寄件量时间序列为每个客户在多个第一时间点中每个第一时间点的寄件量组成的时间序列。

由于本实施例中是为了识别“618”、“双十一”等节日中的“侯鸟”类客户，多个第一时间点可以根据客户识别任务的不同而变化，例如，客户识别任务为识别“双十一”的“侯鸟”类客户，则多个第一时间点可以设置为10月22日至11月20的每一天，寄件量时间序列为客户在10月22日至11月20的每一天的寄件量组成的时间序列。

302、基于所述客户信息对所述多个客户进行分层，得到所述多个客户的多个分类客群。

分类客群为基于客户信息对多个客户进行分层，得到的多个客户的分类客户群体。考虑到多个客户的数量较大，直接对多个客户的寄件量时间序列进行聚类，聚类时间较长，且客户的表现差异较大。本实施例获取多个客户的客户信息后，基于客户信息对多个客户进行分层，得到多个客户的多个分类客群，再基于多个分类客群进行时序聚类，可以提高聚类速度及聚类结果的准确度。

303、对所述多个分类客群中每个分类客群包含的客户的寄件量时间序列进行聚类，得到所述每个分类客群的聚类结果。

聚类结果为对每个分类客群包含的客户的寄件量时间序列进行时序聚类(kshape聚类)，得到的每个分类客群包含的客户的寄件量时间序列的时序聚类结果。本实施例将多个客户分成多个分类客群后，对多个分类客群中每个分类客群包含的客户的寄件量时间序列进行聚类，得到每个分类客群的聚类结果。

304、基于所述聚类结果，确定所述多个客户的目标客群。

目标客群为每个分类客群中具有候鸟行为特征的客户组成的客户群体，本实施例得到每个分类客群的聚类结果后，基于聚类结果，从多个客户中挖掘出部分具有候鸟特征的客群，即目标客群，以便后续步骤中基于目标客群生成客户识别模型。

305、对所述目标客群进行特征分析，得到所述目标客群的统计特征。

多个第一时间点包括多个第三时间点和多个第四时间点，多个第四时间点为多个第三时间点之后的时间点，例如，多个第一时间点为10月22日至11月20的每一天时，多个第三时间点为11月1日至11月15的每一天，多个第四时间点为11月16日至11月20的每一天。

统计特征包括：多个第三时间点的件量均值与多个第四时间点的件量均值的比值；多个第三时间点的件量标准差与多个第四时间点的件量标准差的比值；多个第三时间点的件量最小值与多个第四时间点的件量最小值的比值；多个第三时间点的寄件量的四分之一分位数与多个第四时间点的寄件量的四分之一分位数的比值；多个第三时间点的寄件量的中位数与多个第四时间点的寄件量的中位数的比值；多个第三时间点的寄件量的四分之三分位数与多个第四时间点的寄件量的四分之三分位数的比值；多个第三时间点的件量最大值与多个第四时间点的件量最大值的比值。

本实施例确定多个客户的目标客群后，对目标客群进行特征分析，得到目标客群的统计特征。例如，如表1所示，客户识别模型用于对“双十一”具有候鸟行为特征的客户进行识别时，统计特征可以包括：双十一高峰期(11月1日至11月15)的件量均值与双十一高峰期后(11月16日至11月20)的件量均值的比值；双十一高峰期的件量标准差与双十一高峰期后的件量标准差的比值；双十一高峰期的件量最小值与双十一高峰期后的件量最小值的比值；双十一高峰期的寄件量的四分之一分位数与双十一高峰期后的寄件量的四分之一分位数的比值；双十一高峰期的寄件量的中位数与双十一高峰期后的寄件量的中位数的比值；双十一高峰期的寄件量的四分之三分位数与双十一高峰期后的寄件量的四分之三分位数的比值；双十一高峰期的件量最大值与双十一高峰期后的件量最大值的比值。

表1目标客群的特征分析结果

306、基于所述目标客群及所述统计特征对预设网络模型进行训练，得到客户识别模型。

客户识别模型用于识别客户是否为目标客群中的客户，即客户是否为具有候鸟行为特征的客户，客户识别模型基于目标客群和统计特征对预设网络模型训练得到。预设网络模型可以采用深度学习模型或机器学习模型，例如，卷积神经网络(ConvolutionalNeural Networks,CNN)、反卷积神经网络(De-Convolutional Networks,DN)等。

本实施例得到目标客群的统计特征后，基于目标客群及统计特征对预设网络模型进行训练，得到客户识别模型可以对仅有件量数据的具有候鸟行为特征的客户群体进行识别，且客户识别模型的识别准确率高、识别覆盖率大。

在一具体实施方式中，所述客户信息还包括所述每个客户在预设的多个第二时间点的累计寄件量及所述每个客户的状态信息，如图3所示，步骤302中所述基于所述客户信息对所述多个客户进行分层，得到所述多个客户的多个分类客群，可以包括如下步骤401～404，具体如下：

401、基于所述状态信息对所述多个客户进行筛选，得到多个初筛客户，所述状态信息用于表征所述每个客户的客户状态是否处于注销状态，所述多个初筛客户为所述多个客户中客户状态处于未注销状态的客户；

402、基于所述累计寄件量对所述多个初筛客户进行筛选，得到多个第一候选客户，所述多个第一候选客户为所述多个初筛客户中累计寄件量不高于第一件量值的客户，所述第一件量值基于所述累计寄件量值确定；

403、基于所述累计寄件量对所述多个第一候选客户进行分组，得到多个客户组；

404、基于所述寄件量时间序列对所述多个客户组中每个客户组的客户进行筛选，得到所述多个客户的多个分类客群。

客户信息还包括每个客户在预设的多个第二时间点的累计寄件量及每个客户的状态信息，状态信息用于表征每个客户是否处于注销状态，多个第二时间点可以根据客户识别任务进行设置，例如，客户识别任务为识别“双十一”的“侯鸟”类客户，则多个第一时间点可以设置为10月的每一天。

多个初筛客户为多个客户中处于未注销状态的客户，多个第一候选客户为多个初筛客户中累计寄件量不高于第一寄件量值的客户，第一寄件量值基于累计寄件量值确定。例如，如图4所示，根据二八原则分析多个初筛客户的累计寄件量，累计寄件量超出1300票的客户的累计寄件量占比为80％，累计寄件量不超出1300票的客户的累计寄件量占比为20％，则第一寄件量值为1300。

本实施例基于客户信息对多个客户进行分层时，首先基于状态信息对多个客户进行筛选，得到多个初筛客户，然后基于累计寄件量对多个初筛客户进行筛选，得到多个第一候选客户，再基于累计寄件量对多个第一候选客户进行分组，得到多个客户组，最后基于寄件量时间序列对多个客户组中每个客户组的客户进行筛选，得到多个客户的多个分类客群。

例如，当多个第一候选客户为多个初筛客户中累计寄件量不高于1300的客户时，按照累计寄件量0、(0，30]、(30，100]、(100，300]、(300，1300]，将多个第一候选客户划分成五个客户组，再基于寄件量时间序列对五个客户组中每个客户组的客户进行筛选，得到五个分类客群。

在一具体实施方式中，步骤404中所述基于所述寄件量时间序列对所述多个客户组中每个客户组的客户进行筛选，得到所述多个客户的多个分类客群，可以包括如下步骤501～504，具体如下：

501、基于所述寄件量时间序列，确定所述多个客户组中每个客户组的每个客户在所述多个第三时间点中每个第三时间点的寄件量及所述多个第四时间点中每个第四时间点的寄件量；

502、基于所述每个第三时间点的寄件量，确定所述每个客户组的每个客户在所述多个第三时间点的件量均值；

503、基于所述每个第四时间点的寄件量，确定所述每个客户组的每个客户在所述多个第四时间点的件量均值；

504、基于所述每个第三时间点的寄件量、所述多个第三时间点的件量均值及所述多个第四时间点的件量均值，从所述每个客户组中确定第二候选客户，所述第二候选客户为所述每个客户组中所述每个第三时间点的寄件量小于预设的第二件量值或所述多个第三时间点的件量均值小于所述多个第四时间点的件量均值的客户；

505、将所述第二候选客户从所述每个客户组中剔除，并将剔除所述第二候选客户的多个客户组确定为所述多个客户的多个分类客群。

前述步骤中提到多个第一时间点包括多个第三时间点和多个第四时间点，多个第四时间点为多个第三时间点之后的时间点。第二候选客户为每个客户组中每个第三时间点的寄件量小于预设的第二件量值或多个第三时间点的件量均值小于多个第四时间点的件量均值的客户。

本实施例基于寄件量时间序列对多个客户组中每个客户组的客户进行筛选时，首先基于寄件量时间序列，确定多个客户组中每个客户组的每个客户在多个第三时间点中每个第三时间点的寄件量及多个第四时间点中每个第四时间点的寄件量，然后基于每个第三时间点的寄件量，确定每个客户组的每个客户在多个第三时间点的件量均值，同时基于每个第四时间点的寄件量，确定每个客户组的每个客户在多个第四时间点的件量均值，再基于每个第三时间点的寄件量、多个第三时间点的件量均值及多个第四时间点的件量均值，从每个客户组中确定第二候选客户，最后将第二候选客户从每个客户组中剔除，并将剔除所示第二候选客户的多个客户组确定为多个客户的多个分类客群。

其中，第二件量值可以根据需要进行设置，例如，第二件量值为10，第二候选客户为双十一期间(11月1日至11月15日)每天寄件量均低于10，或双十一期间日均件量小于双11后(11月16日至11月20日)日均件量的客户。

在一具体实施方式中，所述聚类结果包括多个初始聚类簇及所述多个初始聚类簇中每个初始聚类簇的类中心曲线，所述多个初始聚类簇与多个聚类客群分别对应，如图3所示，步骤304中所述基于所述聚类结果，确定所述多个客户的目标客群，可以包括如下步骤405～406，具体如下：

405、基于所述类中心曲线从所述多个初始聚类簇中确定目标聚类簇，所述目标聚类簇为所述多个初始聚类簇中类中心曲线包含预设数量波峰的聚类簇；

406、将所述目标聚类簇对应的聚类客群，确定为所述多个客户的目标客群。

聚类结果包括多个初始聚类簇及多个初始聚类簇中每个初始聚类簇的类中心曲线，多个初始聚类簇与多个聚类客群分别对应。目标聚类簇为多个初始聚类簇中类中心曲线包含预设数量波峰的聚类簇。例如，目标聚类簇为多个初始聚类簇中类中心曲线包含单峰或双峰的聚类簇。

本实施例基于聚类结果确定每个分类客群的目标客群时，首先基于类中心曲线从多个初始聚类簇中确定目标聚类簇，然后将目标聚类簇对应的聚类客群，确定为每个分类客群的目标客群。

在一具体实施方式中，继续参照图3所示，步骤306中所述基于所述目标客群及所述统计特征对预设网络模型进行训练，得到客户识别模型，可以包括如下步骤407～409，具体如下：

407、基于所述目标客群及所述统计特征构建训练数据集，所述训练数据集包括多个样本客户中每个样本客户的第一特征值及所述每个样本客户的真实标签，所述第一特征值为所述每个样本客户在所述统计特征下的特征值，所述多个样本客户包括属于所述目标客群的客户和不属于所述目标客群的客户；

408、将所述第一特征值输入预设网络模型，通过所述预设网络模型输出所述每个样本客户的预测标签；

409、基于所述真实标签、所述预测标签及所述预设网络模型的损失函数对所述预设网络模型进行训练，得到客户识别模型。

训练数据集包括多个样本客户中每个样本客户的第一特征值及每个样本客户的真实标签，第一特征值为每个样本客户在统计特征下的特征值，多个样本客户包括属于目标客群的客户和不属于目标客群的客户。

本实施例基于目标客群及统计特征对预设网络模型进行训练时，首先基于目标客群及统计特征构建训练数据集，然后将训练数据集中的第一特征值输入预设网络模型，通过预设网络模型输出每个样本客户的预测标签，再基于真实标签、预测标签及预设网络模型的损失函数对预设网络模型进行训练，以得到客户识别模型。

在一具体实现方式中，基于真实标签、预测标签及预设网络模型的损失函数对预设网络模型进行训练时，首先基于真实标签、预测标签及预设网络模型的损失函数，确定损失值，当损失值不满足预设条件时，根据预设的参数学习率对预设网络模型的模型参数进行修正，并继续执行将第一特征值输入预设网络模型，通过预设网络模型输出每个客户的预测标签的步骤，直至损失值满足预设条件，从而得到客户识别模型。其中，损失值满足预设条件可以为损失值小于预设第一阈值，或者前后两次得到的损失值的差值小于预设第二阈值。

如图5所示，为本申请实施例中客户识别方法的一个实施例流程示意图，客户识别方法应用于上述所述的模型生成方法生成的客户识别模型，该模型生成方法可以包括如下步骤601～602，具体如下：

601、获取待识别客户的第二特征值，所述第二特征值为所述待识别客户在所述统计特征下的特征值；

602、将所述第二特征值输入所述客户识别模型，通过所述客户识别模型输出所述待识别客户的识别结果，所述识别结果用于表征所述待识别客户是否属于所述目标客群中的客户。

待识别客户为需要进行客户识别的客户，第二特征值为待识别客户在统计特征下的特征值，识别结果用于表征待识别客户是否为目标客群中的客户。本实施例基于客户识别模型对待识别客户进行识别时，首先获取待识别客户的多个第二特征值，然后将第二特征值输入客户识别模型，通过客户识别模型输出待识别客户的识别结果。

为了更好实现本申请实施例中模型生成方法，在模型生成方法基础之上，本申请实施例中还提供一种模型生成装置，如图6所示，所述模型生成装置700包括：

信息获取单元701，用于获取多个客户的客户信息，所述客户信息包括所述多个客户中每个客户在预设的多个第一时间点的寄件量时间序列；

客户分层单元702，用于基于所述客户信息对所述多个客户进行分层，得到所述多个客户的多个分类客群；

时序聚类单元703，用于对所述多个分类客群中每个分类客群包含的客户的寄件量时间序列进行聚类，得到所述每个分类客群的聚类结果；

客群确定单元704，用于基于所述聚类结果，确定所述多个客户的目标客群；

特征分析单元705，用于对所述目标客群进行特征分析，得到所述目标客群的统计特征；

模型生成单元706，用于基于所述目标客群及所述统计特征对预设网络模型进行训练，得到客户识别模型。

本申请实施例中，基于时序聚类从多个客户中挖掘具有候鸟特征的目标客群并找到目标客群的统计特征，再基于目标客群及统计特征对预设网络模型进行训练，得到的客户识别模型可以对仅有件量数据的具有候鸟特征的客户群体进行识别，且客户识别模型的识别准确率高、识别覆盖率大；对多个客户进行分层，再对分层得到的多个分类客群包含的客户的寄件量时间序列进行聚类，可以提升聚类速度及聚类结果的准确度。

在本申请一些实施方案中，所述客户信息还包括所述每个客户在预设的多个第二时间点的累计寄件量及所述每个客户的状态信息，所述客户分层单元702具体用于：

在本申请一些实施方案中，所述多个第一时间点包括多个第三时间点和多个第四时间点，所述多个第四时间点为所述多个第三时间点之后的时间点，所述客户分层单元702具体还用于：

在本申请一些实施例中，所述聚类结果包括多个初始聚类簇及所述多个初始聚类簇中每个初始聚类簇的类中心曲线，所述多个初始聚类簇与多个聚类客群分别对应，所述客群确定单元704具体用于：

在本申请一些实施例中，所述模型生成单元706具体用于：

为了更好实现本申请实施例中客户识别方法，在客户识别方法基础之上，本申请实施例中还提供一种客户识别装置，如图7所示，所述客户识别装置800包括：

特征获取单元801，用于获取待识别客户的第二特征值，所述第二特征值为所述待识别客户在所述统计特征下的特征值；

客户识别单元802，用于将所述第二特征值输入所述客户识别模型，通过所述客户识别模型输出所述待识别客户的识别结果，所述识别结果用于表征所述待识别客户是否属于所述目标客群中的客户。

本申请实施例还提供一种计算机设备，其集成了本申请实施例所提供的任一种模型生成装置，所述计算机设备包括：

一个或多个处理器；

存储器；以及

一个或多个应用程序，其中所述一个或多个应用程序被存储于所述存储器中，并配置为由所述处理器执行上述模型生成方法实施例中任一实施例中所述的模型生成方法中的步骤。

本申请实施例还提供一种计算机设备，其集成了本申请实施例所提供的任一种模型生成装置。如图8所示，其示出了本申请实施例所涉及的计算机设备的结构示意图，具体来讲：

该计算机设备可以包括一个或者一个以上处理核心的处理器901、一个或一个以上计算机可读存储介质的存储器902、电源903和输入单元904等部件。本领域技术人员可以理解，图8中示出的计算机设备结构并不构成对计算机设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。其中：

处理器901是该计算机设备的控制中心，利用各种接口和线路连接整个计算机设备的各个部分，通过运行或执行存储在存储器902内的软件程序和/或模块，以及调用存储在存储器902内的数据，执行计算机设备的各种功能和处理数据，从而对计算机设备进行整体监控。可选的，处理器901可包括一个或多个处理核心；优选的，处理器901可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作系统、用户界面和应用程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器901中。

存储器902可用于存储软件程序以及模块，处理器901通过运行存储在存储器902的软件程序以及模块，从而执行各种功能应用以及数据处理。存储器902可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等；存储数据区可存储根据计算机设备的使用所创建的数据等。此外，存储器902可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地，存储器902还可以包括存储器控制器，以提供处理器901对存储器902的访问。

计算机设备还包括给各个部件供电的电源903，优选的，电源903可以通过电源管理系统与处理器901逻辑相连，从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源903还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。

该计算机设备还可包括输入单元904，该输入单元904可用于接收输入的数字或字符信息，以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。

尽管未示出，计算机设备还可以包括显示单元等，在此不再赘述。具体在本实施例中，计算机设备中的处理器901会按照如下的指令，将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器902中，并由处理器901来运行存储在存储器902中的应用程序，从而实现各种功能，如下：

基于所述聚类结果，确定所述多个客户的目标客群；

本领域普通技术人员可以理解，上述实施例的各种方法中的全部或部分步骤可以通过指令来完成，或通过指令控制相关的硬件来完成，该指令可以存储于一计算机可读存储介质中，并由处理器进行加载和执行。

为此，本申请实施例提供一种计算机可读存储介质，该存储介质可以包括：只读存储器(ROM，Read Only Memory)、随机存取记忆体(RAM，Random Access Memory)、磁盘或光盘等。其上存储有计算机程序，所述计算机程序被处理器进行加载，以执行本申请实施例所提供的任一种模型生成方法中的步骤。例如，所述计算机程序被处理器进行加载可以执行如下步骤：

基于所述聚类结果，确定所述多个客户的目标客群；

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见上文针对其他实施例的详细描述，此处不再赘述。

具体实施时，以上各个单元或结构可以作为独立的实体来实现，也可以进行任意组合，作为同一或若干个实体来实现，以上各个单元或结构的具体实施可参见前面的方法实施例，在此不再赘述。

以上各个操作的具体实施可参见前面的实施例，在此不再赘述。

以上对本申请实施例所提供的一种模型生成方法、客户识别方法、装置、设备及存储介质进行了详细介绍，本文中应用了具体个例对本申请的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本申请的方法及其核心思想；同时，对于本领域的技术人员，依据本申请的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本申请的限制。

Claims

1.一种模型生成方法，其特征在于，所述模型生成方法包括：

基于所述聚类结果，确定所述多个客户的目标客群；

2.根据权利要求1所述的模型生成方法，其特征在于，所述客户信息还包括所述每个客户在预设的多个第二时间点的累计寄件量及所述每个客户的状态信息，所述基于所述客户信息对所述多个客户进行分层，得到所述多个客户的多个分类客群，包括：

3.根据权利要求2所述的模型生成方法，其特征在于，所述多个第一时间点包括多个第三时间点和多个第四时间点，所述多个第四时间点为所述多个第三时间点之后的时间点，所述基于所述寄件量时间序列对所述多个客户组中每个客户组的客户进行筛选，得到所述多个客户的多个分类客群，包括：

4.根据权利要求1所述的模型生成方法，其特征在于，所述聚类结果包括多个初始聚类簇及所述多个初始聚类簇中每个初始聚类簇的类中心曲线，所述多个初始聚类簇与多个聚类客群分别对应，所述基于所述聚类结果，确定所述多个客户的目标客群，包括：

5.根据权利要求3所述的模型生成方法，其特征在于，所述统计特征包括：

6.根据权利要求1所述的模型生成方法，其特征在于，所述基于所述目标客群及所述统计特征对预设网络模型进行训练，得到客户识别模型，包括：

7.一种客户识别方法，其特征在于，所述客户识别方法应用于如权利要求1至6任一项所述的模型生成方法生成的客户识别模型，所述客户识别方法包括：

8.一种模型生成装置，其特征在于，所述模型生成装置包括：

9.一种计算机设备，其特征在于，所述计算机设备包括：

一个或多个处理器；

存储器；以及

一个或多个应用程序，其中所述一个或多个应用程序被存储于所述存储器中，并配置为由所述处理器执行以实现权利要求1至6中任一项所述的模型生成方法或权利要求7所述的客户识别方法。

10.一种计算机可读存储介质，其特征在于，其上存储有计算机程序，所述计算机程序被处理器进行加载，以执行权利要求1至6任一项所述的模型生成方法中的步骤或权利要求7所述的客户识别方法中的步骤。