CN116228080B

CN116228080B - 模型训练方法、终端部署分析方法、装置、设备及介质

Info

Publication number: CN116228080B
Application number: CN202310048395.1A
Authority: CN
Inventors: 汪钦; 彭利
Original assignee: Shanghai Siwei Technology Co ltd
Current assignee: Shanghai Siwei Technology Co ltd
Priority date: 2023-01-31
Filing date: 2023-01-31
Publication date: 2023-09-19
Anticipated expiration: 2043-01-31
Also published as: CN116228080A

Abstract

本发明公开了一种模型训练方法、终端部署分析方法、装置、设备及介质。该方法包括：获取部署社群样本数据和非接入社群样本数据；对部署社群样本数据和非接入社群样本数据进行分析，确定目标影响因子；基于Logistic回归模型和目标影响因子，构建原始分析模型；采用所有训练样本数据对原始分析模型的回归系数进行分析，确定每一回归系数对应的原始参数值；采用所有训练样本数据对原始分析模型进行模型校验，获取模型校验结果；若模型校验结果为校验通过，则将回归系数对应的原始参数值确定为目标参数值，基于目标参数值，获取目标分析模型。该方法可保障目标分析模型进行部署结果分析的可靠性和准确性，有助于辅助用户进行冷链自助终端进行部署决策。

Description

模型训练方法、终端部署分析方法、装置、设备及介质

技术领域

本发明涉及智慧社区技术领域，尤其涉及一种模型训练方法、终端部署分析方法、装置、设备及介质。

背景技术

冷链自助终端是适用在冷链运输环节，用于供用户自助取货的终端，该冷链运输环节是指运输全过程使所运输的货物保持一定湿度的运输。在智慧社区中，可采用冷链自助终端传输并储放肉类、蔬菜、牛奶和其他需要冷链运输的物品，以使用户可从冷链自助终端自助购买所需物品或者提取已购买的物品。

目前社区冷链自助终端部署主要依赖前期的市场调研，调研方式不智能，数据噪音强，决策过程缺乏对用户习惯、关联用户分布区域和覆盖盲区等因素的关联考量，这种调研决策方式效率低且准确性较低，不利于冷链自助终端的推广性。

发明内容

本发明实施例提供一种模型训练方法、终端部署分析方法、装置、设备及介质，以解决现有冷链自助终端部署效率低且准确性较低的问题。

本发明实施例提供一种分析模型训练方法，包括：

获取训练样本数据，所述训练样本数据包括部署社群样本数据和非接入社群样本数据；

对所述部署社群样本数据和所述非接入社群样本数据进行分析，确定目标影响因子；

基于Logistic回归模型和所述目标影响因子，构建原始分析模型，确定所述原始分析模型对应的回归系数；

采用所有所述训练样本数据对所述原始分析模型的回归系数进行分析，确定每一所述回归系数对应的原始参数值；

采用所有所述训练样本数据对所述原始分析模型进行模型校验，获取所述原始分析模型对应的模型校验结果；

若所述模型校验结果为校验通过，则将所述回归系数对应的原始参数值确定为目标参数值，基于所述目标参数值，获取目标分析模型。

优选地，所述获取训练样本数据，包括：

获取冷链自助终端采集的终端埋点数据；

对所述终端埋点数据进行清洗，获取有效埋点数据；

对所述有效埋点数据进行用户行为分类，获取部署社群样本数据。

优选地，对所述部署社群样本数据和所述非接入社群样本数据进行分析，确定目标影响因子，包括：

对所述部署社群样本数据和所述非接入社群样本数据进行初步分析，确定原始影响因子；

基于所述部署社群样本数据和所述非接入社群样本数据，对所述原始影响因子进行结果关联分析，确定目标影响因子。

优选地，所述对所述采用所有所述训练样本数据对所述原始分析模型进行模型校验，获取所述原始分析模型对应的模型校验结果，包括：

采用所有所述训练样本数据对所述原始分析模型进行显著性校验，获取所述原始分析模型对应的显著性校验结果；

采用所有所述训练样本数据对所述原始分析模型进行拟合优度校验，获取所述原始分析模型对应的拟合优度校验结果；

采用所有所述训练样本数据对所述原始分析模型进行准确性校验，获取所述原始分析模型对应的准确性校验结果；

若所述显著性校验结果、所述拟合优度校验结果和所述准确性校验结果均为校验通过，则确定所述原始分析模型对应的模型校验结果为校验通过；

若所述显著性校验结果、所述拟合优度校验结果和所述准确性校验结果中的至少一个为校验不通过，则确定所述原始分析模型对应的模型校验结果为校验不通过。

本发明实施例提供一种终端部署分析方法，包括：

将目标区域的非接入社群样本数据和临近区域的部署社群样本数据，确定为目标区域对应的区域样本数据；

采用上述目标分析模型对所述目标区域对应的区域样本数据进行分析，获取所述目标区域对应的部署分析结果；

若所述目标区域对应的部署分析结果为需要部署冷链自助终端，则对所述目标区域对应的区域样本数据进行容量分析，获取目标区域对应的容量分析结果；

若所述容量分析结果为不存在冗余，则获取在所述目标区域部署所述冷链自助终端的目标部署策略；

若所述容量分析结果为存在冗余，则缩小所述目标区域的区域范围，执行所述将目标区域的非接入社群样本数据和临近区域的部署社群样本数据，确定为目标区域对应的区域样本数据。

优选地，所述对所述目标区域对应的区域样本数据进行容量分析，获取目标区域对应的容量分析结果，包括：

基于所述目标区域对应的区域样本数据中的取菜时间和/或送菜时间，对区域样本数据进行划分，确定多个时间周期对应的区域样本数据；

基于每一时间周期对应的区域样本数据进行容量分析，确定每一时间周期对应的相对容量；

基于所有所述时间周期对应的相对容量和预先设置的最大容量，确定最大负载量；

若所述最大负载量小于预设负载量，则获取不存在冗余的容量分析结果；

若所述最大负载量不小于预设负载量，则获取存在冗余的容量分析结果。

本发明实施例提供一种分析模型训练装置，包括：

训练样本数据获取模块，用于获取训练样本数据，所述训练样本数据包括部署社群样本数据和非接入社群样本数据；

目标影响因子确定模块，用于对所述部署社群样本数据和所述非接入社群样本数据进行分析，确定目标影响因子；

原始分析模型构建模块，用于基于Logistic回归模型和所述目标影响因子，构建原始分析模型，确定所述原始分析模型对应的回归系数；

原始参数值确定模块，用于采用所有所述训练样本数据对所述原始分析模型的回归系数进行分析，确定每一所述回归系数对应的原始参数值；

模型校验结果获取模块，用于采用所有所述训练样本数据对所述原始分析模型进行模型校验，获取所述原始分析模型对应的模型校验结果；

目标分析模型获取模块，用于若所述模型校验结果为校验通过，则将所述回归系数对应的原始参数值确定为目标参数值，基于所述目标参数值，获取目标分析模型。

本发明实施例提供一种终端部署分析装置，包括：

区域样本数据获取模块，用于将目标区域的非接入社群样本数据和临近区域的部署社群样本数据，确定为目标区域对应的区域样本数据；

部署分析结果获取模块，用于采用上述目标分析模型对所述目标区域对应的区域样本数据进行分析，获取所述目标区域对应的部署分析结果；

容量分析结果获取模块，用于若所述目标区域对应的部署分析结果为需要部署冷链自助终端，则对所述目标区域对应的区域样本数据进行容量分析，获取目标区域对应的容量分析结果；

目标部署策略确定模块，用于若所述容量分析结果为不存在冗余，则获取在所述目标区域部署所述冷链自助终端的目标部署策略；

目标区域范围更新模块，用于若所述容量分析结果为存在冗余，则缩小所述目标区域的区域范围，执行所述将目标区域的非接入社群样本数据和临近区域的部署社群样本数据，确定为目标区域对应的区域样本数据。

本发明实施例提供一种计算机设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述分析模型训练方法，或者处理器执行所述计算机程序时实现上述终端部署分析方法。

本发明实施例提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现上述分析模型训练方法，或者处理器执行所述计算机程序时实现上述终端部署分析方法。

上述模型训练方法、装置、设备及介质，先对部署社群样本数据和非接入社群样本数据进行分析，确定影响智慧社区部署冷链自助终端的目标影响因子，以保障目标影响因子与是否部署冷链自助终端的关联性，有助于保障后续目标分析模型的训练效率和可靠性；基于Logistic回归模型和所述目标影响因子，构建原始分析模型，确定所述原始分析模型对应的回归系数及每一回归系数的原始参数值，再采用所有样本训练数据对原始分析模型进行模型校验，在模型校验结果为校验通过时，才将该回归系数的原始参数值确定为目标参数值，基于目标参数值更新原始分析模型确定目标分析模型进行部署结果分析的可靠性和准确性，有助于辅助用户进行冷链自助终端进行部署决策。

上述终端部署分析方法、装置、设备及介质，将目标区域的非接入社群样本数据和临近区域的部署社群样本数据，确定为目标区域的区域样本数据，利用地域上临近的社群大概率具有相同或者相似的生活习惯、收入水平、奶菜需求和饮食习惯等，以增强未部署冷链自助终端的目标区域的样本数量，有助于保障后续分析处理的可靠性；再采用目标分析模型对目标区域的区域样本数据进行分析，可达到快速获取部署分析结果，并可保障部署分析结果的可靠性和准确性；在确定需要在目标区域部署冷链自助终端后，需进一步对目标区域的区域样本数据进行容量分析，以确定是否存在空间上的相对冗余，获取容量分析结果，基于容量分析结果确定在目标区域部署冷链自助终端的目标部署策略，使得目标区域部署的冷链自助终端不存在相对冗余，可实现成本最低，利益最大的目的。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对本发明实施例的描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本发明一实施例中分析模型训练方法的一流程图；

图2是图1中步骤S101的一流程图；

图3是图1中步骤S102的一流程图；

图4是图1中步骤S105的一流程图；

图5是本发明一实施例中终端部署分析方法的一流程图；

图6是图5中步骤S503的一流程图；

图7是本发明一实施例中分析模型训练装置的一示意图；

图8是本发明一实施例中终端部署分析装置的一示意图；

图9是本发明一实施例中一模型校验结果的一示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明实施例提供一种分析模型训练方法，该分析模型训练方法可应用在计算机设备上，该分析模型训练方法可对客观存在的样本数据进行处理，以训练形成目标分析模型，以便后续利用该目标分析模型实现对冷链自助终端进行部署分析，保障部署分析效率和准确性，有助于提高冷链自助终端的推广性。该计算机设备包括但不限于各种个人计算机、笔记本电脑和平板电脑。

在一实施例中，如图1所示，提供一种分析模型训练方法，以该分析模型训练方法应用在计算机设备为例进行说明，包括如下步骤：

S101：获取训练样本数据，训练样本数据包括部署社群样本数据和非接入社群样本数据；

S102：对部署社群样本数据和非接入社群样本数据进行分析，确定目标影响因子；

S103：基于Logistic回归模型和目标影响因子，构建原始分析模型，确定原始分析模型对应的回归系数；

S104：采用所有训练样本数据对原始分析模型的回归系数进行分析，确定每一回归系数对应的原始参数值；

S105：采用所有训练样本数据对原始分析模型进行模型校验，获取原始分析模型对应的模型校验结果；

S106：若模型校验结果为校验通过，则将回归系数对应的原始参数值确定为目标参数值，基于目标参数值，获取目标分析模型。

其中，训练样本数据是用于进行模型训练的数据，是当前时间之前客观存在的数据。部署社群样本数据是指已经部署冷链自助终端的社群所形成的样本数据。例如，该部署社群样本数据可以为当前时间之前，已经部署冷链自助终端的智慧社区对应的用户所在社群所形成的样本数据。非接入社群样本数据是指未部署冷链自助终端但发生关联行为的用户所在社群所形成的样本数据，此处的关联行为包括但不限于使用、了解、搜索、电话问询或者公众号关注冷链自助终端等相关行为。

作为一示例，步骤S101中，计算机设备可从数据库中，以非固定方式抽取一定数量的训练样本数据，该训练样本数据不仅包括已经部署冷链自助终端的部署社群样本数据，还包括虽然未部署冷链自助终端但发生相关行为的非接入社群样本数据。

其中，目标影响因子是指对部署社群样本数据和非接入社群样本数据进行分析，最终确定的会影响冷链自助终端部署的影响因子。

作为一示例，步骤S102中，计算机设备在获取所有部署社群样本数据和非接入社群样本数据后，可对部署社群样本数据和非接入社群样本数据进行初步分析，确定部署社群样本数据和非接入社群样本数据中出现的所有影响因子；然后，基于所有部署社群样本数据和非接入社群样本数据，分别确定其结果元为部署和不部署两种；接着，根据部署社群样本数据和非接入社群样本数据的结果元，分析确定与结果元之间关联关系较强的目标影响因子，具体分析出每一影响因子与是否部署冷链自助终端之间的关联关系，以便从所有影响因子中筛选出与部署结果关联性较强的目标影响因子，以保障结果关联性。例如，通过对所有部署社群样本数据和非接入社群样本数据进行分析，所确定的目标影响因子如下表一所示。

表一目标影响因子

作为一示例，步骤S103中，计算机设备在确定所有目标影响因子后，可基于Logistic回归模型和目标影响因子，构建原始分析模型，该原始分析模型包括初始化的回归系数，该初始化的回归系数是指初始化的未确定具体数值的回归系数。例如，将是否在智慧社区部署冷链自助终端的结果元设置为Y，若部署，则Y＝1；若不部署，则Y＝0，设有N个目标影响因子与结果元Y具有较强的关联关系，记为X＝(x₁,x₂,...x_n),则选择在某一非接入社群样本数据对应的智慧社区中部署冷链自助终端的概率为：

其中，β为初始化的回归系数，即初始化的未确定具体数值的回归系数。

作为一示例，步骤S104中，计算机设备在确定原始分析模型后，需将已经确定结果元的部署社群样本数据和非接入社群样本数据输入原始分析模型进行分析处理，以确定回归系数对应的原始参数值。

本示例中，可先对部署社群样本数据和非接入社群样本数据进行分类变量编码和统计，以达到所有目标影响因子对应的参数编码及频率。例如，对是否做饭和家庭成员是否喜好牛奶这两个目标影响因子进行分类变量编码和统计结果如下表二所示：

表二分类变量编码及统计结果

本示例中，在确定每一目标影响因子对应的参数编码及频率后，可将所有部署社群样本数据和非接入社群样本数据输入到原始分析模型进行分析处理，以确定订奶频次、区域机器数、住宅距离、订菜频次、收入水平、家庭成员是否喜好牛奶、是否做饭和社群规模等目标影响因子对应的回归系数的原始参数值。该回归系数是指采用Logistic回归模型对部署社群样本数据和非接入社群样本数据进行分析所确定的回归系数，如图9所示，订奶频次对应的回归系数的原始参数值β₁＝.160、区域机器数对应的回归系数的原始参数值β₂＝-.057、住宅距离对应的回归系数的原始参数值β₃＝.176、订菜频次对应的回归系数的原始参数值β₄＝.138、收入水平对应的回归系数的原始参数值β₅＝.001、家庭成员是否喜好牛奶对应的回归系数的原始参数值β₆＝.502、是否做饭对应的回归系数的原始参数值β₇＝.775、社群规模对应的回归系数的原始参数值β₈＝.000等目标影响因子对应的回归系数，以及常量对应的原始参数值β₀＝-8.265。

作为一示例，步骤S105中，计算机设备在分析确定每一目标影响因子对应的回归系数的原始参数值后，还需采用所有所述训练样本数据对所述原始分析模型进行模型校验，确定每一原始分析模型对应的模型校验结果。本示例中，计算机设备可基于所有所述训练样本数据，确定至少一个校验指标对应的实测校验值，再将该校验指标对应的实测校验值与该校验指标对应的预设校验值进行比较，若实测校验值达到预设校验值对应的评估标准，则确定该校验指标对应的校验结果为通过；若所有校验指标对应的校验结果均为校验通过，则获取校验通过的模型校验结果；若存在至少一个校验指标对应的校验结果为校验不通过，则获取校验不通过的模型校验结果。可理解地，采用至少一个校验指标，对回归系数对应的原始参数值进行校验，保障模型校验结果的可靠性。

作为一示例，步骤S106中，计算机设备在确定原始分析模型对应的模型校验结果为校验通过后，可将模型校验结果为校验通过的回归系数对应的原始参数值确定为目标参数值，保障目标参数值确定的可靠性。例如，在上述订奶频次、区域机器数、住宅距离、订菜频次、收入水平、家庭成员是否喜好牛奶、是否做饭和社群规模等目标影响因子对应的回归系数的原始参数值中，常数变量、订奶频次、区域机器数、住宅距离、订菜频次和收入水平这几个目标影响因子对应的回归系数的原始参数值所构建的原始分析模型进行校验，在模型校验结果为校验通过时，则将这几个回归系数的原始参数值确定为回归系数的目标参数值。

表三回归系数的目标参数值

本实施例中，在确定所有校验通过的回归系数对应的目标参数值后，可采用该回归系数对应的目标参数值更新原始分析模型，具体将确定回归系数对应的目标参数值及其对应的目标影响因子，确定目标分析模型，保障目标分析模型进行预测处理的准确性和可靠性。例如，表三所示回归系数的目标参数值所构建的目标分析模型如下：

本实施例中，先对部署社群样本数据和非接入社群样本数据进行分析，确定影响智慧社区部署冷链自助终端的目标影响因子，以保障目标影响因子与是否部署冷链自助终端的关联性，有助于保障后续目标分析模型的训练效率和可靠性；基于Logistic回归模型和目标影响因子，构建原始分析模型，确定原始分析模型对应的回归系数及确定每一回归系数的原始参数值，再采用所有样本训练数据对原始分析模型进行模型校验，在模型校验结果为校验通过时，才将该回归系数的原始参数值确定为目标参数值，基于目标参数值确定目标分析模型进行部署结果分析的可靠性和准确性，有助于辅助用户进行冷链自助终端进行部署决策。

在一实施例中，如图2所示，步骤S101，即获取训练样本数据，包括：

S201：获取冷链自助终端采集的终端埋点数据；

S202：对终端埋点数据进行清洗，获取有效埋点数据；

S203：对有效埋点数据进行用户行为分类，获取部署社群样本数据。

作为一示例，在将某一冷链自助终端部署在智慧社区后，冷链自助终端上电后完成初始化工作，例如，完成菜品信息下发、取货信息下发、终端温度调节和启动温度调节等操作后，会通过预先设置的埋点实时采集终端埋点数据；监测当前时间是否达到预设设置的上传时间；若当前时间达到上传时间，则将终端埋点数据上传至数据中心，存储在数据库中；若当前时间未达到上传时间，则继续执行通过预先设置的埋眯实时采集终端埋点数据。

作为一示例，步骤S201中，在需要训练分析模型时，计算机设备可从数据库中获取冷链自助终端采集的终端埋点数据，由于该终端埋点数据是已经部署在智慧社区中的冷链自助终端实时采集到的相关数据，可在一定程度上反映该智慧社区内使用该冷链自助终端的用户行为习惯。本示例中，计算机设备可从数据库中，以非固定方式提取一定规模的终端埋点数据，以保障其所获取到的终端埋点数据的多样性。

作为一示例，步骤S202中，计算机设备在获取终端埋点数据后，可对终端埋点数据进行清洗，以去除存在异常、缺失或者其他无效数据，获取清洗后的有效埋点数据。本示例中，对终端埋点数据进行数据清洗，可保障清洗后的有效埋点数据的有效性，避免异常、缺失或者其他无效数据对后续模型训练的干扰，有助于保障分析模型的训练效率和准确性。

作为一示例，步骤S203中，计算机设备在获取有效埋点数据后，可基于预先设置的用户行为基准，对有效埋点数据进行用户行为分类，获取可用于模型训练的部署社群样本数据。例如，通过对有效埋点数据进行用户行为分类，可统计分析出某一用户通过冷链自助终端订购牛奶的订奶频次、通过冷链自助终端订购菜品的订菜频次等，还可以根据订奶频次和订菜频次等进一步分析是否家庭成员是否喜好牛奶或者是否做饭等，以使该部署社群样本数据可反映已经部署冷链自助终端的智慧社区的用户行为习惯，以便后续基于部署社群样本数据进行分析模型训练，使得最终训练所得的目标分析模型可对用户行为习惯进行分析处理，有助于保障目标分析模型输出结果的客观性和普适性。

本示例中，计算机设备在获取有效埋点数据后，不仅可对有效埋点数据进行用户行为分类，以获取反映用户行为习惯的一部分部署社群样本数据；还可以从有效埋点数据中确定终端标识和用户标识，可根据终端标识确定该终端标识所在的智慧社区，进而获取该智慧社区对应的区域配送价格和区域机器数；根据用户标识，获取用户标识对应的目标用户信息，该目标用户信息可理解为用户预先注册的用户数据，可从目标用户信息中分析确定收入水平和住宅距离等部署社群样本数据；还可统计某一智慧社区内，所有冷链自助终端对应的用户进行分析，以确定相应的社群规模。

本实施例中，获取冷链自助终端采集的终端埋点数据，可保障终端埋点数据的客观性；对终端埋点数据进行数据清洗，可保障获取的有效埋点数据的有效性，避免异常、缺失或者其他无效数据对后续模型训练的干扰，进而有助于保障分析模型训练效率和准确性；对有效埋点数据进行用户行为分类，以使最终获取到的部署社群样本数据可在一定程度上反映用户行为习惯，以保障最终训练所得的目标分析模型可对用户行为习惯进行分析处理，有助于保障目标分析模型输出结果的客观性和普适性。

在一实施例中，如图3所示，步骤S102，即对部署社群样本数据和非接入社群样本数据进行分析，确定目标影响因子，包括：

S301：对部署社群样本数据和非接入社群样本数据进行初步分析，确定原始影响因子；

S302：基于部署社群样本数据和非接入社群样本数据，对原始影响因子进行结果关联分析，确定目标影响因子。

其中，原始影响因子是指根据部署社群样本数据和非接入社群样本数据进行初步分析所确定的影响因子，该原始影响因子可理解为影响社群接入冷链自助终端的影响因子。

作为一示例，步骤S301中，计算机设备在获取所有部署社群样本数据和非接入社群样本数据后，可对部署社群样本数据和非接入社群样本数据进行初步分析，确定部署社群样本数据和非接入社群样本数据中出现的所有样本影响因子；然后，统计每一样本影响因子对应的至少一个评估指标的实测指标值，将每一评估指标对应的实测指标值与该评估指标对应的预设指标值进行比较；若至少一个评估指标对应的实测指标值大于评估指标对应的预设指标值，则将样本影响因子确定为原始影响因子。其中，样本影响因子是指在部署社群样本数据和非接入社群样本数据中出现的影响因子，为样本数据中客观存在的影响因子。评估指标是指预先设置的用于评估影响可认定为原始影响因子的指标。实测指标值是根据所有部署社群样本数据和非接入社群样本数据统计分析出与评估指标相对应的具体数值。预设指标值是预先设置的用于评估是否满足认定为原始影响因子的与评估指标相对应的预设数值。可理解地，根据所有样本数据确定所有样本影响因子，在某一样本影响因子对应的至少一个评估指标对应的实测指标值大于预设指标值时，可确定从该评估指标的维度来看，认定其满足认定为原始影响因子的评估条件，因此，可将该样本影响因子确定为原始影响因子，以从所有样本影响因子中筛选出原始影响因子，既可有效控制原始影响因子的数量，又可保障原始影响因子确定的可靠性。

在一实施例中，步骤S301，即对部署社群样本数据和非接入社群样本数据进行初步分析，确定原始影响因子，包括：

S3011：根据部署社群样本数据和非接入社群样本数据，确定所有样本影响因子，统计每一样本影响因子对应的出现频次和实测重合度；

S3012：若样本影响因子对应的出现频次大于预设频次，和/或样本影响因子的实测重合度大于预设重合度，则将样本影响因子确定为原始影响因子。

其中，样本影响因子是指在部署社群样本数据和非接入社群样本数据中出现的影响因子，为样本数据中客观存在的影响因子。出现频次是指根据所有样本数据，统计出某一样本影响因子出现的频次，例如，在数量为Ssum个样本数据中，有Sa个样本数据中包含样本影响因子A，则样本影响因子的出现频次为Sa。实测重合度是指根据所有样本数据，统计出某一样本影响因子的重合度，例如，在数量为Ssum个样本数据中，有Sa个样本数据中包含样本影响因子A，则样本影响因子A对应的实测重合度为Sa/Ssum。此处的实测重合度和出现频次可理解为上述示例中的评估指标对应的实测指标值。

作为一示例，步骤S3031中，计算机设备在获取所有部署社群样本数据和非接入社群样本数据等Ssum个训练样本数据后，可先获取每一训练样本数据对应的样本影响因子；然后，将Ssum个训练样本数据对应的样本影响因子的并集，确定为所有样本影响因子；接着，可统计每一样本影响因子的出现次数，将其确定为该样本影响因子对应的出现频次；并将每一样本影响因子对应的出现频次与所有训练样本数据对应的样本数量Ssum的比值，确定为该样本影响因子对应的实测重合度。本示例中，每一样本影响因子对应的实测重合度和出现频次，可在一定程度上反映所有样本数据中每一样本影响因子的分布情况。

其中，预设重合度是预先设置的重合度，该预设重合度可理解为预先设置的用于评估是否满足认定为原始影响因子的重合度。预设频次是指预先设置的频次，该预设频次可理解为预先设置的用于评估是否满足认定为原始影响因子的频次。

作为一示例，步骤S3012中，计算机设备在统计每一样本影响因子对应的实测重合度和出现频次后，可将该实测重合度与预设重合度进行比较，并将该出现频次与预设频次进行比较；在某一样本影响因子的实测重合度大于预设重合度，和/或样本影响因子对应的出现频次大于预设频次，可认定在所有训练样本数据中，该样本影响因子的出现频次较大和/或实测重合度较大，说明较多训练样本数据中出现该样本影响因子，可将该样本影响因子确定为原始影响因子，既可有效控制原始影响因子的数量，又可保障原始影响因子确定的可靠性。

作为一示例，步骤S302中，计算机设备在从所有影响因子中筛选出原始影响因子后，可根据部署社群样本数据和非接入社群样本数据，确定样本数据中的结果元。此处的结果元包括部署和不部署两种结果，此处的部署是指已经在社群部署冷链自助终端，不部署是指还未在社群部署冷链自助终端。然后，分析验证每一原始影响因子与其对应的结果元之间的关联关系，即分析每一原始影响因子与是否在社群部署冷链自助终端之间的关联关系，从原始影响因子中进一步筛选出与部署结果关联性较强的目标影响因子。本示例中，计算机设备可采用但不限于正向逐步选择法、反向逐步选择法和混合逐步选择法，从所有原始影响因子中筛选出与结果元关联关系较强的目标影响因子，有助于保障目标影响因子的可靠性。

在一实施例中，步骤S302，即基于部署社群样本数据和非接入社群样本数据，对原始影响因子进行结果关联分析，确定目标影响因子，包括：

S3021：根据部署社群样本数据和非接入社群样本数据，对每一原始影响因子进行结果关联分析，确定每一原始影响因子的实测显著性；

3022：若原始影响因子的实测显著性显著关联条件，则将原始影响因子确定为目标影响因子。

其中，实测显著性是指实际测量到的显著性。显著关联条件是预先设置的用于评估显著性达到较显著标准的条件。

作为一示例，步骤S3021中，计算机设备在确定原始影响因子后，可基于部署社群样本数据和非接入社群样本数据，确定每一样本数据的结果元，例如，部署社群样本数据的结果元为部署，而非接入社群样本数据的结果元为未部署；然后，基于部署社群样本数据和非接入社群样本数据，对原始影响因子进行结果关联分析，确定每一原始影响因子的实测显著性。本示例中，计算机设备可以采用与显著性相关指标对应的统计方法，对原始影响因子进行统计分析，只需保障其获取到的实测显著性与结果元之间的关联性即可，例如，可将瓦尔德(Wald)统计量确定为实测显著性。

作为一示例，步骤S3022中，计算机设备在确定每一原始影响因子的实测显著性后，可将该原始影响因子的实测显著性与预先设置的显著关联条件进行比较，若实测显著性满足显著关联条件，则认定该原始影响因子与是否部署冷链自助终端的结果元之间关联性较强，可将该原始影响因子确定为目标影响因子；反之，可实测显著性不满足显著关联条件，则认定该原始影响因子与是否部署冷链自助终端的结果元之间关联性较弱，不将该原始影响因子确定为目标影响因子。

例如，在某一原始影响因子对应的实测显著性为瓦尔德(Wald)统计量时，其显著关联条件可设置为预设统计量，可将某一原始影响因子的瓦尔德(Wald)统计量与预设统计量进行比较，若瓦尔德(Wald)统计量小于预设统计量，证明该原始影响因子与是否部署冷链自助终端的结果元显著相关，可将该原始影响因子确定为目标影响因子；反之，若瓦尔德(Wald)统计量不小于预设统计量，证明该原始影响因子与是否部署冷链自助终端的结果元显著不相关，不予选择确定为目标影响因子。

本实施例中，通过对每一原始影响因子与结果元进行结果关联分析，确定每一原始影响因子的实测显著性，在实测显著性满足显著关联条件时，认定原始影响因子与结果元显著相关时，才将原始影响因子确定为目标影响因子，保证所确定的目标影响因子与是否部署冷链自助终端的关联性，有助于保障后续辅助决策的有效性。

本实施例中，先对部署社群样本数据和非接入社群样本数据进行分析，从中筛选出原始影响因子，再对原始影响因子进行结果关联分析，以从原始影响因子中筛选出与部署结果关联性较强的目标影响因子，保证所确定的目标影响因子与是否部署冷链自助终端的关联性，有助于保障后续辅助决策的有效性。

在一实施例中，如图4所示，步骤S105，即采用所有训练样本数据对原始分析模型进行模型校验，获取原始分析模型对应的模型校验结果，包括：

S401：采用所有训练样本数据对原始分析模型进行显著性校验，获取原始分析模型对应的显著性校验结果；

S402：采用所有训练样本数据对原始分析模型进行拟合优度校验，获取原始分析模型对应的拟合优度校验结果；

S403：采用所有训练样本数据对原始分析模型进行准确性校验，获取原始分析模型对应的准确性校验结果；

S404：若显著性校验结果、拟合优度校验结果和准确性校验结果均为校验通过，则确定原始分析模型对应的模型校验结果为校验通过；

S405：若显著性校验结果、拟合优度校验结果和准确性校验结果中的至少一个为校验不通过，则确定原始分析模型对应的模型校验结果为校验不通过。

作为一示例，步骤S401中，计算机设备可对原始分析模型中的每一回归系数的原始参数值进行显著性校验，具体采用SPSS软件对部署社群样本数据和非接入社群样本数据进行瓦尔德校验，确定原始分析模型对应的瓦尔德(Wald)校验值(如图9所示的瓦尔德这一列数值)；再将该瓦尔德(Wald)校验值与第一预设阈值进行比较，若该瓦尔德(Wald)校验值满足第一预设阈值对应的评估条件，则获取校验通过的显著性校验结果；反之，若该瓦尔德(Wald)校验值不满足第一预设阈值对应的评估条件，则获取校验不通过的显著性校验结果。其中，第一预设阈值是用于评估瓦尔德(Wald)校验值是否满足评估认定为满足显著性标准的阈值。

作为一示例，步骤S402中，计算机设备可对原始分析模型中的每一回归系数的原始参数值进行拟合优度校验，具体采用SPSS软件对部署社群样本数据和非接入社群样本数据进行考克斯-斯奈尔R方校验和内戈尔科R方校验，分别获取考克斯-斯奈尔R方值和内戈尔科R方值这两个拟合优度校验值；再将考克斯-斯奈尔R方值与第二预设阈值进行比较，将内戈尔科R方值与第三预设阈值进行比较；若考克斯-斯奈尔R方值大于第二预设阈值，且内戈尔科R方值大于第三预设阈值，则认定两个拟合优度校验值满足预设评估条件，可获取校验通过的拟合优度校验结果；反之，若考克斯-斯奈尔R方值不大于第二预设阈值，或者内戈尔科R方值不大于第三预设阈值，则认定两个拟合优度校验值不满足预设评估条件，则获取校验不通过的拟合优度校验结果。其中，第二预设阈值和第三预设阈值是预先设置的用于评估考克斯-斯奈尔R方值和内戈尔科R方值这两个拟合优度校验值是否满足评估认定为满足拟合优度标准的阈值，第二预设阈值和第三预设阈值可相同也可不同。本示例中，在考克斯-斯奈尔R方值大于第二预设阈值，且内戈尔科R方值大于第三预设阈值时，可认定原始分析模型能够很好地拟合观察数据。

作为另一示例，步骤S402中，计算机设备可对原始分析模型中的每一回归系数的原始参数值进行拟合优度校验，具体采用SPSS软件对部署社群样本数据和非接入社群样本数据进行霍斯默-莱梅肖检验，获取校验显著性，该校验显著性可理解为霍斯默-莱梅肖检验的输出结果；然后，将该校验显著性与第四预设阈值进行比较；若校验显著性大于第四预设阈值，则认定校验显著性满足第四预设阈值对应的评估条件，可获取校验通过的拟合优度校验结果；反之，若校验显著性不大于第四预设阈值，则认定校验显著性不满足第四预设阈值对应的评估条件，可获取校验通过的拟合优度校验结果。其中，第四预设阈值是预先设置的用于评估校验显著性是否满足认定满足拟合优度标准的阈值。本示例中，在校验显著性大于第四预设阈值时，可认定原始分析模型能够很好地拟合观察数据。

作为一示例，步骤S403中，计算机设备可对原始分析模型中的回归系数的原始参数值进行准确性校验，具体采用SPSS软件对部署社群样本数据和非接入社群样本数据进行准确性校验，获取原始分析模型对应的准确性校验结果。具体地，可将部署社群样本数据和非接入社群样本数据输入原始分析模型进行预测，确定每一训练样本数据对应的预测结果元，该预测结果元是指原始分析模型输出的预测是否部署的结果元，包括部署和未部署两种。然后，将每一训练样本数据对应的预测结果元和实际结果元进行分析，若两者结果一致，则认定预测成功；若两者结果不一致，则认定预测失败；最后，统计所有训练样本数据的预测成功率，若预测成功率大于成功率阈值，则获取校验通过的准确性校验结果；若预测成功率不大于成功率阈值，则获取校验不通过的准确性校验结果。

表四目标影响因子的准确性校验结果

例如，上述表四中，某一目标影响因子X1对应的所有训练样本数据中，实际结果元为未部署的非接入社群样本数据共324，针对这324件非接入社群样本数据进行预测后，有228个非接入社群样本数据输出未部署这一预测结果元，96件非接入社群样本数据输出部署这一结果元，即非接入社群样本数据的正确率百分比为228/(228+96)＝70.4％；实际结果元为部署的部署社群样本数据共744件，有24件部署社群样本数据输出未部署这一预测结果元，有702这部署社群样本数据输出部署这一预测结果元，则部署社群样本数据的正确率百分比为720/(720+24)＝96.8％；最终，计算非接入社群样本数据的正确率百分比和部署社群样本数据的正确率百分比的均值，将两者的均值确定为预测成功率，例如，(70.4％+96.8％)/2＝88.8％。

作为一示例，步骤S404中，计算机设备在显著性校验结果、拟合优度校验结果和准确性校验结果均为校验通过，说明其所确定的回归系数的原始参数值与预测结果具有较强关联性、较好的数据拟合度和较准确的预测成功率，因此，可确定原始分析模型对应的模型校验结果为校验通过。

作为一示例，步骤S405中，计算机设备在确定显著性校验结果、拟合优度校验结果和准确性校验结果中的至少一个为校验不通过时，说明存在回归系数的原始参数值与预测结果关联性较弱、数据拟合度较低或者预测成功率较低等情况，因此，可确定原始分析模型对应的模型校验结果为校验不通过。

本实施例中，通过对回归系数对应的原始参数值进行显著性校验、拟合优度校验和准确性校验，以保障校验通过的回归系数的原始参数值与预测结果具有较强关联性、较好的数据拟合度和较准确的预测成功率，以保障最终形成的目标分析模型进行预测的可靠性。

在一实施例中，如图5所示，提供一种终端部署分析方法，以该终端部署方法应用在计算机设备为例进行说明，包括如下步骤：

S501：将目标区域的非接入社群样本数据和临近区域的部署社群样本数据，确定为目标区域对应的区域样本数据；

S502：采用上述实施例中的目标分析模型对目标区域对应的区域样本数据进行分析，获取目标区域对应的部署分析结果；

S503：若目标区域对应的部署分析结果为需要部署冷链自助终端，则对目标区域对应的区域样本数据进行容量分析，获取目标区域对应的容量分析结果；

S504：若容量分析结果为不存在冗余，则获取在目标区域部署冷链自助终端的目标部署策略；

S504：若容量分析结果为存在冗余，则缩小目标区域的区域范围，执行将目标区域的非接入社群样本数据和临近区域的部署社群样本数据，确定为目标区域对应的区域样本数据。

其中，目标区域是指未部署冷链自助终端，需要评估是否部署的区域。临近区域是指临近目标区域的已经部署冷链自助终端的区域。

作为一示例，步骤S501中，在需要评估是否在目标区域部署冷链自助终端时，可将该目标区域的非接入社群样本数据和临近目标区域的临近区域的部署社群样本数据统称为目标区域的区域样本数据。一般来说，目标区域的非接入社群样本数据可真实反映居住在目标区域的用户的用户行为习惯；而临近区域的部署社群样本数据可真实反映居住在临近区域的用户使用冷链自助终端的用户行为习惯。根据局部性原理推测，在地域上临近的社群大概率具有相同或者相似的生活习惯、收入水平、奶菜需求和饮食习惯等，因此，可将目标区域的非接入社群样本数据和临近区域的部署社群样本数据，确定为目标区域对应的区域样本数据，以便基于该区域样本数据分析是否需要在目标区域部署冷链自助终端并确定具体的目标部署策略。

作为一示例，步骤S502中，计算机设备在确定目标区域对应的区域样本数据后，可采用上述实施例中的目标分析模型对目标区域对应的区域样本数据进行分析，获取目标区域对应的部署分析结果，该部署分析结果反映是否需要在目标区域部署冷链自助终端，包括需要部署冷链自助终端和不需要部署冷链自助终端两种。由于上述实施例中的目标分析模型具有较好的可靠性和准确性，利用目标分析模型直接对区域样本数据进行分析，不仅可保障输出部署分析结果的分析效率，还可保障输出部署分析结果的可靠性和准确性。

作为一示例，步骤S503中，计算机设备在确定目标区域对应的部署分析结果为需要部署冷链自助终端后，可对目标区域对应的区域样本数据进行容量分析，具体以目标区域对应的区域样本数据中的取菜时间和/或送菜时间，将所有区域样本数据划分为为M个时间周期，然后分析每一时间周期对应的相对容量；再基于所有时间周期的相对容量分析是否存在相对冗余；若存在相对冗余，则说明空间利用率未达到最大化，未达到成本最低，利益最大的目的，获取存在冗余的容量分析结果；反之，若不存在相对冗余，则说明空间利用率达到最大化，达到成本最低，利益最大的目的，获取不存在冗余的容量分析结果。

作为一示例，步骤S504中，计算机设备在目标区域的容量分析结果为不存在冗余，即在目标区域部署冷链自助终端不存在相对冗余，此时，在目标区域部署冷链自助终端可实现空间利用率最大化，进而实现部署成本最低，利益最大化的目的，因此，可获取在目标区域部署冷链自助终端的目标部署策略，以便后续基于该目标部署策略进行冷链自助终端部署。

作为一示例，步骤S505中，计算机设备在目标区域的容量分析结果为存在冗余，即在目标区域部署冷链自助终端存在相对冗余，此时，需缩限目标区域的区域范围，更新目标区域，以便基于更新后的目标区域重复执行步骤S501-S506，直到其容量分析结果为不存在冗余，进而保障冷链自助终端部署在目标区域，可实现空间利用率最大化，进而实现部署成本最低，利益最大的目的。

本实施例中，将目标区域的非接入社群样本数据和临近区域的部署社群样本数据，确定为目标区域的区域样本数据，利用地域上临近的社群大概率具有相同或者相似的生活习惯、收入水平、奶菜需求和饮食习惯等，以增强未部署冷链自助终端的目标区域的样本数量，有助于保障后续分析处理的可靠性；再采用上述实施例确定的目标分析模型对目标区域的区域样本数据进行分析，可达到快速获取部署分析结果，并可保障部署分析结果的可靠性和准确性；在确定需要在目标区域部署冷链自助终端后，需进一步对目标区域的区域样本数据进行容量分析，以确定是否存在空间上的相对冗余，获取容量分析结果，使得目标区域部署的冷链自助终端不存在相对冗余，可实现部署成本最低，利益最大的目的。

在一实施例中，如图6所示，步骤S503，即对目标区域对应的区域样本数据进行容量分析，获取容量分析结果，包括：

S601：基于目标区域对应的区域样本数据中的取菜时间和/或送菜时间，对区域样本数据进行划分，确定多个时间周期对应的区域样本数据；

S602：基于每一时间周期对应的区域样本数据进行容量分析，确定每一时间周期对应的相对容量；

S603：基于所有时间周期对应的相对容量和预先设置的最大容量，确定最大负载量；

S604：若最大负载量小于预设负载量，则获取不存在冗余的容量分析结果；

S605：若最大负载量不小于预设负载量，则获取存在冗余的容量分析结果。

作为一示例，步骤S601中，计算机设备可从目标区域对应的区域样本数据中，提取每一区域样本数据对应的取菜时间和/或送菜时间；将取菜时间和/或送菜时间与预先设置的时间周期进行对比；若取菜时间和/或送菜时间落入某一时间周期，则将该区域样本数据确定为该时间周期对应的区域样本数据。

作为一示例，步骤S602中，计算机设备在确定每个时间周期对应的区域样本数据后，可对该时间周期对应的区域样本数据进行统计分析，确定每一时间周期内被占用的空间容量，将其确定为该时间周期对应的相对容量。例如，可统计过去一个月内，在下午6：00-7：00这一时间周期对应的所有区域样本数据的样本数量，将过去一个月内所有样本数量的均值，确定为该时间周期对应的相对容量。

其中，预先设置的最大容量是指预先设置的某一时间周期内进行取菜和/或送菜的最大值，该最大容量可以为用户预先设置的经验值，该经验值来源于已经部署冷链自助终端定期临近到的空间使用程度。

作为一示例，步骤S603中，计算机设备在确定所有时间周期对应的相对容量后，可对所有时间周期对应的相对容量进行均值计算，确定所有时间周期对应的容量均值；再将所有时间周期对应的容量均值和预先设置的最大容量进行标准差计算，将计算结果确定为最大负载量。例如，可采用如下标准差公式进行计算：

/>

其中，D(Y)为最大负载值，i为第i个时间周期，n为时间周期的数量，Y_i为第i个时间周期的最大容量，为所有时间周期的容量均值。

其中，预设负载量是预先设置的负载量，该预设负载量可用于评估是否满足负载量标准的阈值。

作为一示例，步骤S604中，计算机设备在根据所有时间周期的相对容量和最大容量，确定最大负载量后，可将该最大负载量与预设负载量进行比较，若最大负载量小于预设负载量，说明所有时间周期的相对容量不存在相对冗余，空间利用率最较大，送菜速度和取菜速度持平，可实现成本最低，利益最大的目的，因此，可获取不存在冗余的容量分析结果。

作为一，步骤S605中，计算机设备在根据所有时间周期的相对容量和最大容量，确定最大负载量后，可将该最大负载量与预设负载量进行比较，若最大负载量不小于预设负载量，说明所有时间周期的相对容量存在相对冗余，空间利用率未达到最大化目的，送菜速度和取菜速度无法持平，未达到成本最低，利益最大的目的，因此，可获取存在冗余的容量分析结果。

本实施例中，先对所有区域样本数据进行时间周期划分，确定多个时间周期对应的区域样本数据；然后，对每一时间周期对应的区域样本数据进行容量分析，确定每一时间周期对应的相对容量，使得该相对容量反映任一时间周期内被占用的空间容量，保障空间容量确定的客观性和可靠性；再根据所有时间周期的相对容量和最大容量，确定最大负载量，以便根据最大负载量和预设负载量的比较结果，确定是否存在相对冗余，进而确定是否达到成本最低，利益最大的目的，确定容量分析结果，保障容量分析结果的可靠性。

应理解，上述实施例中各步骤的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本发明实施例的实施过程构成任何限定。

在一实施例中，提供一种分析模型训练装置，该分析模型训练装置与上述实施例中分析模型训练方法一一对应。如图7所示，该分析模型训练装置包括训练样本数据获取模块701、目标影响因子确定模块702、原始分析模型构建模块703、原始参数值确定模块704、模型校验结果获取模块705和目标分析模型获取模块706。各功能模块详细说明如下：

训练样本数据获取模块701，用于获取训练样本数据，训练样本数据包括部署社群样本数据和非接入社群样本数据；

目标影响因子确定模块702，用于对部署社群样本数据和非接入社群样本数据进行分析，确定目标影响因子；

原始分析模型构建模块703，用于基于Logistic回归模型和目标影响因子，构建原始分析模型，确定原始分析模型对应的回归系数；

原始参数值确定模块704，用于采用所有训练样本数据对原始分析模型的回归系数进行分析，确定每一回归系数对应的原始参数值；

模型校验结果获取模块705，用于采用所有训练样本数据对原始分析模型进行模型校验，获取原始分析模型对应的模型校验结果；

目标分析模型获取模块706，用于若模型校验结果为校验通过，则将回归系数对应的原始参数值确定为目标参数值，基于目标参数值，获取目标分析模型。

在一实施例中，训练样本数据获取模块701，包括：

终端埋点数据获取单元，用于获取冷链自助终端采集的终端埋点数据；

有效埋点数据获取单元，用于对终端埋点数据进行清洗，获取有效埋点数据；

部署社群样本数据获取单元，用于对有效埋点数据进行用户行为分类，获取部署社群样本数据。

在一实施例中，目标影响因子确定模块702，包括：

原始影响因子确定单元，用于对部署社群样本数据和非接入社群样本数据进行初步分析，确定原始影响因子；

目标影响因子确定单元，用于基于部署社群样本数据和非接入社群样本数据，对原始影响因子进行结果关联分析，确定目标影响因子。

在一实施例中，原始影响因子确定单元，包括：

样本影响因子统计子单元，用于根据部署社群样本数据和非接入社群样本数据，确定所有样本影响因子，统计每一样本影响因子对应的实测重合度和出现频次；

原始影响因子确定子单元，用于若样本影响因子的实测重合度大于预设重合度，和/或样本影响因子对应的出现频次大于预设频次，则将样本影响因子确定为原始影响因子。

在一实施例中，目标影响因子确定单元，包括：

实测显著性确定子单元，用于根据部署社群样本数据和非接入社群样本数据，对每一原始影响因子进行结果关联分析，确定每一原始影响因子的实测显著性；

目标影响因子确定子单元，用于若原始影响因子的实测显著性显著关联条件，则将原始影响因子确定为目标影响因子。

在一实施例中，模型校验结果获取模块705，包括：

显著性校验单元，用于采用所有训练样本数据对原始分析模型进行显著性校验，获取原始分析模型对应的显著性校验结果；

拟合优度校验单元，用于采用所有训练样本数据对原始分析模型进行拟合优度校验，获取原始分析模型对应的拟合优度校验结果；

准确性校验单元，用于采用所有训练样本数据对原始分析模型进行准确性校验，获取原始分析模型对应的准确性校验结果；

第一校验结果获取单元，用于若显著性校验结果、拟合优度校验结果和准确性校验结果均为校验通过，则确定原始分析模型对应的模型校验结果为校验通过；

第二校验结果获取单元，用于若显著性校验结果、拟合优度校验结果和准确性校验结果中的至少一个为校验不通过，则确定原始分析模型对应的模型校验结果为校验不通过。

关于分析模型训练装置的具体限定可以参见上文中对于分析模型训练方法的限定，在此不再赘述。上述分析模型训练装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一实施例中，提供一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，处理器执行计算机程序时实现上述实施例中分析模型训练方法，例如图1所示S101-S106，或者图2至图4中所示，为避免重复，这里不再赘述。或者，处理器执行计算机程序时实现分析模型训练装置这一实施例中的各模块/单元的功能，例如图7所示的训练样本数据获取模块701、目标影响因子确定模块702、原始分析模型构建模块703、原始参数值确定模块704、模型校验结果获取模块705和目标分析模型获取模块706的功能，为避免重复，这里不再赘述。

在一实施例中，提供一种计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器执行时实现上述实施例中分析模型训练方法，例如图1所示S101-S106，或者图2至图4中所示，为避免重复，这里不再赘述。或者，该计算机程序被处理器执行时实现上述分析模型训练装置这一实施例中的各模块/单元的功能，例如图8所示的训练样本数据获取模块701、目标影响因子确定模块702、原始分析模型构建模块703、原始参数值确定模块704、模型校验结果获取模块705和目标分析模型获取模块706的功能，为避免重复，这里不再赘述。

在一实施例中，提供一种终端部署分析装置，该终端部署分析装置与上述实施例中终端部署分析方法一一对应。如图8所示，该终端部署分析装置包括区域样本数据获取模块801、部署分析结果获取模块802、容量分析结果获取模块803和目标部署策略确定模块804。各功能模块详细说明如下：

区域样本数据获取模块801，用于将目标区域的非接入社群样本数据和临近区域的部署社群样本数据，确定为目标区域对应的区域样本数据；

部署分析结果获取模块802，用于采用上述目标分析模型对目标区域对应的区域样本数据进行分析，获取目标区域对应的部署分析结果；

容量分析结果获取模块803，用于若目标区域对应的部署分析结果为需要部署冷链自助终端，则对目标区域对应的区域样本数据进行容量分析，获取目标区域对应的容量分析结果；

目标部署策略确定模块804，用于若容量分析结果为不存在冗余，则获取在目标区域部署冷链自助终端的目标部署策略；

目标区域范围更新模块805，用于若容量分析结果为存在冗余，则缩小目标区域的区域范围，执行将目标区域的非接入社群样本数据和临近区域的部署社群样本数据，确定为目标区域对应的区域样本数据。

在一实施例中，容量分析结果获取模块803，包括：

样本数据划分单元，用于基于目标区域对应的区域样本数据中的取菜时间和/或送菜时间，对区域样本数据进行划分，确定多个时间周期对应的区域样本数据；

相对容量确定单元，用于基于每一时间周期对应的区域样本数据进行容量分析，确定每一时间周期对应的相对容量；

最大负载量确定单元，用于基于所有时间周期对应的相对容量和预先设置的最大容量，确定最大负载量；

第一分析结果确定单元，用于若最大负载量小于预设负载量，则获取不存在冗余的容量分析结果；

第二分析结果确定单元，用于若最大负载量不小于预设负载量，则获取存在冗余的容量分析结果。

关于终端部署分析装置的具体限定可以参见上文中对于终端部署分析方法的限定，在此不再赘述。上述终端部署分析装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一实施例中，提供一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，处理器执行计算机程序时实现上述实施例中终端部署分析方法，例如图5所示S501-S504，或者图6所示，为避免重复，这里不再赘述。或者，处理器执行计算机程序时实现终端部署分析装置这一实施例中的各模块/单元的功能，例如图8所示的区域样本数据获取模块801、部署分析结果获取模块802、容量分析结果获取模块803和目标部署策略确定模块804的功能，为避免重复，这里不再赘述。

在一实施例中，提供一种计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器执行时实现上述实施例中终端部署分析方法，例如图5所示S501-S504，或者图6所示，为避免重复，这里不再赘述。或者，该计算机程序被处理器执行时实现上述终端部署分析装置这一实施例中的各模块/单元的功能，例如图8所示的区域样本数据获取模块801、部署分析结果获取模块802、容量分析结果获取模块803和目标部署策略确定模块804的功能，为避免重复，这里不再赘述。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，仅以上述各功能单元、模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能单元、模块完成，即将所述装置的内部结构划分成不同的功能单元或模块，以完成以上描述的全部或者部分功能。

以上所述实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围，均应包含在本发明的保护范围之内。

Claims

1.一种终端部署分析方法，其特征在于，包括：

将目标区域的非接入社群样本数据和临近区域的部署社群样本数据，确定为目标区域对应的区域样本数据；非接入社群样本数据是指未部署冷链自助终端但发生关联行为的用户所在社群所形成的样本数据，部署社群样本数据是指已经部署冷链自助终端的社群所形成的样本数据；临近区域的部署社群样本数据反映居住在临近区域的用户使用冷链自助终端的用户行为习惯；

采用目标分析模型对所述目标区域对应的区域样本数据进行分析，获取所述目标区域对应的部署分析结果；其中，通过分析模型训练获取目标分析模型，分析模型训练包括：获取训练样本数据，所述训练样本数据包括部署社群样本数据和非接入社群样本数据；对所述部署社群样本数据和所述非接入社群样本数据进行分析，确定目标影响因子；基于Logistic回归模型和所述目标影响因子，构建原始分析模型，确定所述原始分析模型对应的回归系数；采用所有所述训练样本数据对所述原始分析模型的回归系数进行分析，确定每一所述回归系数对应的原始参数值；采用所有所述训练样本数据对所述原始分析模型进行模型校验，获取所述原始分析模型对应的模型校验结果；若所述模型校验结果为校验通过，则将所述回归系数对应的原始参数值确定为目标参数值，基于所述目标参数值，获取目标分析模型；所述获取训练样本数据，包括：获取冷链自助终端采集的终端埋点数据；对所述终端埋点数据进行清洗，获取有效埋点数据；对所述有效埋点数据进行用户行为分类，获取部署社群样本数据，终端埋点数据是已经部署在智慧社区中的冷链自助终端实时采集到的相关数据，反映该智慧社区内使用该冷链自助终端的用户行为习惯；若所述目标区域对应的部署分析结果为需要部署冷链自助终端，则对所述目标区域对应的区域样本数据进行容量分析，获取目标区域对应的容量分析结果；

若所述容量分析结果为存在冗余，则缩小所述目标区域的区域范围，执行所述将目标区域的非接入社群样本数据和临近区域的部署社群样本数据，确定为目标区域对应的区域样本数据，其中，所述对所述目标区域对应的区域样本数据进行容量分析，获取目标区域对应的容量分析结果，包括：

基于每一时间周期对应的区域样本数据进行容量分析，确定每一时间周期对应的相对容量，其中，相对容量为每一时间周期内被占用的空间容量；

基于所有所述时间周期对应的相对容量和预先设置的最大容量，确定最大负载量；预先设置的最大容量是指预先设置的某一时间周期内进行取菜和/或送菜的最大值；其中，确定最大负载量具体包括：对所有时间周期对应的相对容量进行均值计算，确定所有时间周期对应的容量均值；再将所有时间周期对应的容量均值和预先设置的最大容量进行标准差计算，将计算结果确定为最大负载量；

若所述最大负载量不小于预设负载量，则获取存在冗余的容量分析结果，预设负载量是预先设置的负载量，用于评估是否满足负载量标准的阈值。

2.如权利要求1所述的终端部署分析方法，其特征在于，对所述部署社群样本数据和所述非接入社群样本数据进行分析，确定目标影响因子，包括：

3.如权利要求2所述的终端部署分析方法，其特征在于，所述对所述部署社群样本数据和所述非接入社群样本数据进行初步分析，确定原始影响因子，包括：

根据所述部署社群样本数据和所述非接入社群样本数据，确定所有样本影响因子，统计每一所述样本影响因子对应的实测重合度和出现频次；

若所述样本影响因子的实测重合度大于预设重合度，和/或所述样本影响因子对应的出现频次大于预设频次，则将所述样本影响因子确定为原始影响因子。

4.如权利要求2所述的终端部署分析方法，其特征在于，所述基于所述部署社群样本数据和所述非接入社群样本数据，对所述原始影响因子进行结果关联分析，确定目标影响因子，包括：

根据所述部署社群样本数据和所述非接入社群样本数据，对每一所述原始影响因子进行结果关联分析，确定每一所述原始影响因子的实测显著性；

若所述原始影响因子的实测显著性显著关联条件，则将原始影响因子确定为目标影响因子。

5.如权利要求1所述的终端部署分析方法，其特征在于，所述采用所有所述训练样本数据对所述原始分析模型进行模型校验，获取所述原始分析模型对应的模型校验结果，包括：

6.一种用于实施如权利要求1至5任一项所述终端部署分析方法的终端部署分析装置，其特征在于，包括：

部署分析结果获取模块，用于采用目标分析模型对所述目标区域对应的区域样本数据进行分析，获取所述目标区域对应的部署分析结果；

7.一种计算机设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1至5任一项所述终端部署分析方法。

8.一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至5任一项所述终端部署分析方法。