CN113837383A

CN113837383A - 模型训练方法、装置、电子设备及存储介质

Info

Publication number: CN113837383A
Application number: CN202111210307.0A
Authority: CN
Inventors: 成晨; 肖天; 程新洲; 韩玉辉; 曹丽娟; 晁昆; 张涛; 郝若晶; 杨子敬; 郑雨婷
Original assignee: China United Network Communications Group Co Ltd
Current assignee: China United Network Communications Group Co Ltd
Priority date: 2021-10-18
Filing date: 2021-10-18
Publication date: 2021-12-24
Anticipated expiration: 2041-10-18
Also published as: CN113837383B

Abstract

本申请提供一种模型训练方法、装置、电子设备及存储介质，涉及信息处理技术领域，用于提高神经网络模型预测多个出行指标的预测准确度。该方法包括：获取目标用户的样本数据；将样本数据输入预设神经网络模型中，预测目标用户在第二时间段的多个出行指标中每个出行指标的预测准确度；第二时间段为第一时间段后的时间段；根据每个出行指标的预测准确度，以及每个出行指标的预测准确度对应的第一权重值，确定预设神经网络模型的预测准确度；根据预设神经网络模型的预测准确度，确定用户出行预测模型。这样，依据每个出行指标的预测准确度和权重值调整神经网络模型，可以使得最终确定的神经网络模型能够同时预测多个准确度较高的出行指标。

Description

模型训练方法、装置、电子设备及存储介质

技术领域

本申请涉及信息处理技术领域，尤其涉及一种模型训练方法、装置、电子设备及存储介质。

背景技术

目前，模型训练方法多以F1值或者均方误差(mean square error，MSE)，作为模型训练过程中的评价参数。一方面，F1值或者MSE作为评价参数，在训练过程中，只能对单一目标进行评价，使得训练完成的神经网络模型仅能对单一目标进行预测，无法同时预测两个目标或者多个目标。另一方面，F1值或者MSE作为评价参数，无法考虑时间跨度给神经网络模型的预测准确度带来的影响。例如，在神经网络模型需要同时预测7天内是否前往地点A，和24小时内是否前往地点A的场景中，假设模型训练过程仅对单一目标(24小时内是否前往地点A)进行训练，使得神经网络模型可以较为准确的预测24小时内是否前往地点A这一目标，而对另一目标(7天内是否前往地点A)的预测准确度较低。

因此，单一的F1值或者MSE作为评价参数的训练过程，无法满足神经网络模型需要对多个不同时间跨度目标预测的场景。

发明内容

本申请提供一种模型训练方法、装置、电子设备及存储介质，能够提高用户出行预测模型预测的对多个出行指标的预测准确度。

第一方面，提供一种模型训练方法，包括：获取目标用户的样本数据；样本数据为对第一时间段内目标用户的运营商数据进行处理后，得到的用于表征目标用户的出行特征的样本数据；将样本数据输入预设神经网络模型中，预测目标用户在第二时间段的多个出行指标中每个出行指标的预测准确度；第二时间段为第一时间段后的时间段；根据每个出行指标的预测准确度，以及每个出行指标的预测准确度对应的第一权重值，确定预设神经网络模型的预测准确度；根据预设神经网络模型的预测准确度，确定用户出行预测模型。

结合上述第一方面，在一种可能的实现方式中，该方法还包括：步骤1、确定当前神经网络模型的预测准确度是否大于预设阈值；当前神经网络模型为预设神经网络模型，或者当前神经网络模型为调整后的神经网络模型；步骤2、若满足，则确定当前神经网络模型为用户出行预测模型；步骤3、若不满足，则调整当前神经网络模型的参数，确定调整后的神经网络模型，将调整后的神经网络模型作为当前神经网络模型；步骤4、将样本数据输入当前神经网络模型，确定当前神经网络模型的预测准确度；执行步骤1、步骤2、步骤3，以及步骤4，直至确定用户出行预测模型。

结合上述第一方面，在一种可能的实现方式中，该方法还包括：确定第一出行指标；第一出行指标为多个出行指标中的任一个出行指标；将样本数据输入预设神经网络模型中，预测目标用户在第二时间段的子时间段内第一出行指标的预测准确度；根据目标用户在每个子时间段内第一出行指标的预测准确度，以及每个子时间段对应的第二权重值，确定第一出行指标的预测准确度；其中，第二权重值的大小与第一时长成反比；第一时长为子时间段和第二时间段的结束时间之间的时长。

结合上述第一方面，在一种可能的实现方式中，子时间段为第一子时间段和第二子时间段中的至少一个，第一子时间段和第二子时间段的时长不同；多个出行指标包括以下至少一项：每一第一子时间段是否前往预设地点；每一第二子时间段内是否前往预设地点；第一次前往预设地点的第一时间段；第一次前往预设地点的第二子时间段；

每一第一子时间段是否前往预设地点的第一预测准确度，满足以下公式：

其中，F₁为每一第一子时间段是否前往预设地点的第一预测准确度；第二时间段包括S个第一子时间段；F1_1,d为与S个第一子时间段中的与最后一个第一时间段之间相隔d-1个第一子时间段的第一子时间段的第一预测准确度；S和d均为正整数。

每一第二子时间段内是否前往预设地点的第二预测准确度，满足以下公式：

其中，F₂为第二预测准确度；第二时间段包括T个第二子时间段；F1_2,h为与T个第二子时间段中的最后一个时间段之间相隔h-1个第二子时间段的第二子时间段的第二预测准确度；T和h均为正整数；

第一次前往预设地点的第一时间段的第三预测准确度，满足以下公式：

其中，F₃为第三预测准确度；f₃(x_i)为预设神经网络模型预测的目标用户第一次前往预设地点的第一子时间段；y_3,i为目标用户实际第一次前往预设地点的第一子时间段；C₃为大小固定的权重系数。

第一次前往预设地点的第二子时间段的第四预测准确度，满足以下公式；

其中，F₄为第三预测准确度；f₄(x_i)为预设神经网络模型预测的目标用户第一次前往预设地点的第二子时间段；y_4,i为目标用户实际第一次前往预设地点的第二子时间段；C₄为大小固定的权重系数。

结合上述第一方面，在一种可能的实现方式中，预设神经网络模型的预测准确度满足以下公式：

其中，a₁为第一预测准确度对应的第一权重值；a₂为第二预测准确度对应的第一权重值；a₃为第三预测准确度对应的第一权重值；a₄为第四预测准确度对应的第一权重值。

结合上述第一方面，在一种可能的实现方式中，该方法还包括：获取目标用户在第三时间段内的样本数据；将第三时间段内的样本数据输入用户出行预测模型中，确定目标用于在第四时间段内的多个出行指标；其中，第四时间段为待预测目标用户的出行指标的时间段；第三时间段为第四时间段之前的时间段。

第二方面，提供一种模型训练装置，包括：获取单元和处理单元；获取单元，用于获取目标用户的样本数据；样本数据为对第一时间段内目标用户的运营商数据进行处理后，得到的用于表征目标用户的出行特征的样本数据；处理单元，用于将样本数据输入预设神经网络模型中，预测目标用户在第二时间段的多个出行指标中每个出行指标的预测准确度；第二时间段为第一时间段后的时间段；处理单元，还用于根据每个出行指标的预测准确度，以及每个出行指标的预测准确度对应的第一权重值，确定预设神经网络模型的预测准确度；处理单元，还用于根据预设神经网络模型的预测准确度，确定用户出行预测模型。

结合上述第二方面，在一种可能的实现方式中，处理单元，具体用于执行以下过程：步骤1、确定当前神经网络模型的预测准确度是否大于预设阈值；当前神经网络模型为预设神经网络模型，或者当前神经网络模型为调整后的神经网络模型；步骤2、若满足，则确定当前神经网络模型为用户出行预测模型；步骤3、若不满足，则调整当前神经网络模型的参数，确定调整后的神经网络模型，将调整后的神经网络模型作为当前神经网络模型；步骤4、将样本数据输入当前神经网络模型，确定当前神经网络模型的预测准确度；执行步骤1、步骤2、步骤3，以及步骤4，直至确定用户出行预测模型。

结合上述第二方面，在一种可能的实现方式中，处理单元，具体用于：确定第一出行指标；第一出行指标为多个出行指标中的任一个出行指标；将样本数据输入预设神经网络模型中，预测目标用户在第二时间段的子时间段内第一出行指标的预测准确度；根据目标用户在每个子时间段内第一出行指标的预测准确度，以及每个子时间段对应的第二权重值，确定第一出行指标的预测准确度；其中，第二权重值的大小与第一时长成反比；第一时长为子时间段和第二时间段的结束时间之间的时长。

结合上述第二方面，在一种可能的实现方式中，子时间段为第一子时间段和第二子时间段中的至少一个，第一子时间段和第二子时间段的时长不同；多个出行指标包括以下至少一项：每一第一子时间段是否前往预设地点；每一第二子时间段内是否前往预设地点；第一次前往预设地点的第一时间段；第一次前往预设地点的第二子时间段。

其中，F₂为第二预测准确度；第二时间段包括T个第二子时间段；F1_2,h为与T个第二子时间段中的最后一个时间段之间相隔h-1个第二子时间段的第二子时间段的第二预测准确度；T和h均为正整数。

结合上述第二方面，在一种可能的实现方式中，预设神经网络模型的预测准确度满足以下公式：

结合上述第二方面，在一种可能的实现方式中，获取单元，还用于获取目标用户在第三时间段内的样本数据；处理单元，还用于将第三时间段内的样本数据输入用户出行预测模型中，确定目标用于在第四时间段内的多个出行指标；其中，第四时间段为待预测目标用户的出行指标的时间段；第三时间段为第四时间段之前的时间段。

第三方面，本申请提供了一种模型训练装置，该训练装置包括：处理器和通信接口；通信接口和处理器耦合，处理器用于运行计算机程序或指令，以实现如第一方面和第一方面的任一种可能的实现方式中所描述的模型训练方法。

第四方面，本申请提供了一种计算机可读存储介质，计算机可读存储介质中存储有指令，当计算机可读存储介质中的指令由模型训练装置的处理器执行时，使得模型训练装置能够执行如第一方面和第一方面的任一种可能的实现方式中描述的模型训练方法。

第五方面，本申请提供一种包含指令的计算机程序产品，计算机程序产品包括计算机指令，当计算机指令在模型训练装置上运行时，使得模型训练装置执行如第一方面和第一方面的任一种可能的实现方式中所描述的模型训练方法。

第六方面，本申请提供一种芯片，芯片包括处理器和通信接口，通信接口和处理器耦合，处理器用于运行计算机程序或指令，以实现如第一方面和第一方面的任一种可能的实现方式中所描述的模型训练方法。

上述第二方面至第五方面中任一种实现方式所带来的技术效果可以参见第一方面对应设计所带来的技术效果，此处不再赘述。

在本申请中，上述数据处理装置的名字对设备或功能模块本身不构成限定，在实际实现中，这些设备或功能模块可以以其他名称出现。只要各个设备或功能模块的功能和本发明类似，属于本发明权利要求及其等同技术的范围之内。

本发明的这些方面或其他方面在以下的描述中会更加简明易懂。

本申请提供的技术方案至少带来以下有益效果：

模型训练装置以用户的运营商数据为基础确定用户的出行特征，对神经网络模型进行训练；在训练过程中，模型训练装置定义多个用户的出行指标并为这些指标设置不同的权重，模型训练装置根据神经网络的多个出行指标的预测准确度以及指标对应的权重确定神经网络模型的预测准确度，为调整神经网络模型提供依据。这样，可以使得训练得到的用户出行预测模型能够预测用户的多个出行指标，且预测的多个出行指标均具有较高的准确度。

此外，本申请中模型训练装置使用从运营商的数据库中获取的用户的出行特征数据作为训练神经网络模型的样本数据。由于运营商数据库中包括用户全量的网络数据，因此本申请使用这些数据训练得到的神经网络模型能够更加全面准确的预测用户的出行特征，且预测结果也更加精准。

附图说明

图1为本申请实施例提供的一种模型训练装置的结构示意图；

图2为本申请实施例提供的一种模型训练方法的流程示意图；

图3为本申请实施例提供的另一种模型训练方法的流程示意图；

图4为本申请实施例提供的一种用户出行预测方法的流程示意图；

图5为本申请实施例提供的另一种模型训练装置的结构示意图。

具体实施方式

本文中术语“和/或”，仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。

本申请的说明书以及附图中的术语“第一”和“第二”等是用于区别不同的对象，或者用于区别对同一对象的不同处理，而不是用于描述对象的特定顺序。

此外，本申请的描述中所提到的术语“包括”和“具有”以及它们的任何变形，意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元，而是可选的还包括其他没有列出的步骤或单元，或可选的还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。

需要说明的是，本申请实施例中，“示例性的”或者“例如”等词用于表示作例子、例证或说明。本申请实施例中被描述为“示例性的”或者“例如”的任何实施例或设计方案不应被解释为比其它实施例或设计方案更优选或更具优势。确切而言，使用“示例性的”或者“例如”等词旨在以具体方式呈现相关概念。

在本申请的描述中，除非另有说明，“多个”的含义是指两个或两个以上。

以下，对本申请实施例涉及的名词进行解释，以方便读者理解。

1、神经网络模型：是指由大量的、简单的处理单元广泛地互相连接而形成的复杂网络系统。神经网络模型具有大规模并行、分布式存储和处理、自组织、自适应、以及自学的特点，特别适合处理需要同时考虑许多因素和条件、以及不精确和模糊的信息来处理问题的场景。

需要说明的是，神经网络模型中不仅需要模型算法，还需要特征工程。

其中，模型算法主要用于训练神经网络模型，可以为梯度提升决策树(gradientboosting decision tree，GBDT)、梯度提升树(gradient boosting tree，GBT)、梯度提升机械(light gradient boosting machine，LightGBM)算法。

其中，特征工程包括用户输入的原始数据以及对用户输入的原始数据进行加权的权重值。对于检测不同目标的神经网络模型来说，需要构建不同的特征工程。

2、运营商通常采用两大系统(即业务支撑系统(business support system，BSS)和运营支撑系统(operation support system，OSS))进行数据管理。

其中，BSS是面对用户的业务支撑系统，主要用于对用户的套餐计费、用户的营业情况、用户的账务、以及用户的服务资料等数据进行管理。BSS所管理的数据称为BSS域数据。BSS域数据可以包括多种字段名、多种字段含义、以及多种字段类型。在本申请中，主要从BSS中获取用户的身份信息。

OSS是面向网络资源的后台支撑系统，主要用于对核心网络电路域数据、分组域数据、无线网络基础数据等数据进行管理。OSS所管理的数据称为OSS域数据。需要说明的是，OSS域数据可以通过通信接口来获取。

在本申请中主要从OSS中获取如下述表1至表示3记载的数据。

表1

其中，表1中的数据可以通过IUCS接口获取。

表2

列名	类型(长度)
		proctype	varchar(5)
sdrtype	varchar(5)
		starttime	timestamp
endtime	timestamp
		lac_enbid	varchar(20)
ci_eci	varchar(20)
		imsi	varchar(20)
msisdn	varchar(20)
		imei	varchar(20)

其中，表2中的数据可以通过S1MME接口获取。

表3

其中，表3中的数据可以通过S1UHTTP接口获取。

以上是对本申请实施例中涉及到的部分概念所做的简单介绍，以下不再赘述。

目前，根据用户的历史出行数据预测用户的行为意图能够为应急事件支撑、疫情防控、场景化精准营销等场景提供数据支持。相关技术中，提供了如下用户行为意图的预测方法。

方法1、终端设备根据用户的历史行为轨迹构建模型特征，以及为历史行为轨迹添加行为意图标签。根据构建的模型特征，以及意图标签训练得到行为预测模型。

在此之后，终端设备从用户的应用中获取用户的行为轨迹，并以多个预设时间窗口对用户的行为轨迹进行划分，对划分好的行为轨迹编码，构建模型特征；将构建好的模型特征输入到上述训练得到的行为预测模型中确定用户的行为意图预测结果。

但是上述只能根据用户的行为轨迹对未来用户的单一的行为意图进行预测，在预测其他行为意图时，需要重新对神经网络模型训练。

方法2、对电商用户历史行为数据集进行预处理操作，根据用户历史消费行为；以有交互的用户产品对关键字构建样本；采用时间窗口划分法，将样本划分为训练集和测试集；对特征群进行特征选择和对数据集进行不平衡数据的处理，随后采用两层模型迭代学习算法预测结果。

根据上述方法能够基于时间跨度为多天的电商用户历史行为数据建立预测模型，从而预测未来几天天用户是否下单候选商品集合P中的商品。

但是，上述方案主要针对用户的购买行为，无法确定用户的出行行为。且上述方法中模型训练的过程指标单一，使用该模型仅能预测用户的单一购买行为。

为上述现有技术中存在的问题，本申请提供了一种模型训练方法，本申请实施例提供的模型训练方法中，模型训练装置以用户的运营商数据为基础确定用户的出行特征，对神经网络模型进行训练；在训练过程中，模型训练装置定义多个用户的出行指标并为这些指标设置不同的权重，模型训练装置根据神经网络的多个出行指标的预测准确度以及指标对应的权重确定神经网络模型的预测准确度，为调整神经网络模型提供依据。这样，可以使得训练得到的用户出行预测模型能够预测用户的多个出行指标，且预测的多个出行指标均具有较高的准确度。

为了实现本申请实施例提供的模型训练方法，本申请实施例提供了一种模型训练装置，用于执行的模型训练方法，图1为本申请实施例提供的一种模型训练装置的结构示意图。如图1所示，该训练装置100包括至少一个处理器101，通信线路102，以及至少一个通信接口104，还可以包括存储器103。其中，处理器101，存储器103以及通信接口104三者之间可以通过通信线路102连接。

处理器101可以是一个中央处理器(central processing unit，CPU)，也可以是特定集成电路(application specific integrated circuit，ASIC)，或者是被配置成实施本申请实施例的一个或多个集成电路，例如：一个或多个数字信号处理器(digital signalprocessor，DSP)，或，一个或者多个现场可编程门阵列(field programmable gate array，FPGA)。

通信线路102可以包括一通路，用于在上述组件之间传送信息。

通信接口104，用于与其他设备或通信网络通信，可以使用任何收发器一类的装置，如以太网，无线接入网(radio access network，RAN)，无线局域网(wireless localarea networks，WLAN)等。

存储器103可以是只读存储器(read-only memory，ROM)或可存储静态信息和指令的其他类型的静态存储设备，随机存取存储器(random access memory，RAM)或者可存储信息和指令的其他类型的动态存储设备，也可以是电可擦可编程只读存储器(electricallyerasable programmable read-only memory，EEPROM)、只读光盘(compact disc read-only memory，CD-ROM)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于包括或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质，但不限于此。

一种可能的设计中，存储器103可以独立于处理器101存在，即存储器103可以为处理器101外部的存储器，此时，存储器103可以通过通信线路102与处理器101相连接，用于存储执行指令或者应用程序代码，并由处理器101来控制执行，实现本申请下述实施例提供的模型训练方法。又一种可能的设计中，存储器103也可以和处理器101集成在一起，即存储器103可以为处理器101的内部存储器，例如，该存储器103为高速缓存，可以用于暂存一些数据和指令信息等。

作为一种可实现方式，处理器101可以包括一个或多个CPU，例如图1中的CPU0和CPU1。作为另一种可实现方式，训练装置100可以包括多个处理器，例如图1中的处理器101和处理器107。作为再一种可实现方式，训练装置100还可以包括输出设备105和输入设备106。

如图2所示，本申请实施例提供的模型训练方法，应用于如图1所示的训练装置100中，该方法可以通过以下S200-S203实现，下面进行详细说明：

S200、模型训练装置获取目标用户的样本数据。

其中，样本数据为模型训练装置对第一时间段内目标用户的运营商数据进行处理后，得到的用于表征目标用户的出行特征的样本数据。

一种可能的实现方式中，本申请实施例中通过用户在不同时间的位置信息，以及用户使用的APP信息表征用户的出行特征。

具体来说，模型训练装置可以根据运营商OSS域中的数据确定目标用户的位置信息，目标用户使用的APP信息。模型训练装置可以根据运营商BSS域中的数据确定用户的身份信息。模型训练装置关联目标用户的身份信息以及目标用户的位置信息和目标用户使用的APP信息。在此之后，模型训练装置采用预设算法对关联后的数据进行预处理，确定目标用户的样本数据。

可选的，目标用户的样本数据包括以下用于表征目标用户的出行特征的样本数据中的至少一项：1、实时位置数据；2、导航类应用使用数据；3、出行类应用使用数据；4、出行方式；5、用户关注信息；6、用户年龄画像；7、用户的目的场景。此外，目标用户的样本数据还可以包括其他样本数据，本申请对此不做限定。

需要指出的是，本申请中记载的目标用户可以为一个用户也可以为多个用户，本申请对此不做限定。

S201、模型训练装置将样本数据输入预设神经网络模型中，预测目标用户在第二时间段的多个出行指标中每个出行指标的预测准确度。

其中，第二时间段为第一时间段后的时间段。

可选的，第二时间段还可以为当前时间段之前的时间段。此时，第二时间段内目标用户的多个出行指标中的每个出行指标均为已知的出行指标。

一种具体的实现方式中，上述预设神经网络模型的输入参数为目标用户的样本数据，输出参数为第二时间段内目标用户的多个出行指标。模型训练装置将样本数据输入预设神经网络模型中，得到预设神经网络模型预测的目标用户在第二时间段的多个出行指标中每个出行指标。在此之后，模型训练装置对比预设神经网络模型预测的每个出行指标与真实的第二时间段内目标用户的每个出行指标，确定每个出行指标的预测准确度。

可选的，子时间段为第一子时间段和第二子时间段中的至少一个，第一子时间段和第二子时间段的时长不同；多个出行指标包括以下至少一项：每一第一子时间段是否前往预设地点；每一第二子时间段内是否前往预设地点；第一次前往预设地点的第一时间段；第一次前往预设地点的第二子时间段。

一种示例，上述多个出行指标具体可以实现为：指标1、S天内的每一天是否前往预设地点；指标2、24小时内的每一小时是否前往目标地点；指标3、S天内第一次前往地点A的日期；指标4、24小时内第一次前往地点A的时间。其中，上述S天为上述第二时间段中的S天；上述24小时可以为S天中的每一天中的24个小时，也可以是上述S天中的第一天的24小时。在本申请中，主要以多个出行指标包括上述指标1至指标4为例进行说明。

模型训练装置将样本数据输入预设神经网络模型中，得到预设神经网络模型分别预测的指标1至指标4的预测结果。模型训练装置对比预设神经网络模型预测的指标1至指标4的预测结果与指标1与指标4的真实结果，确定指标1至指标4的准确度。

需要指出的是，在本申请中的目标用户为一个用户的情况下，模型训练装置通过对比该用户的预设神经网络模型预测每个出行指标，与真实的第二时间段内该用户的每个出行指标，确定每个出行指标的预测准确度

在本申请中的目标用户为多个用户的情况下，模型训练装置分别对比每个用户的每个预测的出行指标与真实的第二时间段内每个用户的每个出行指标，确定每个用户的每个出行指标的预测准确度。模型训练装置对每个出行指标中，每个用户对应的准确度进行加权平均，确定每个出行指标的预测准确度。

S202、模型训练装置根据每个出行指标的预测准确度，以及每个出行指标的预测准确度对应的第一权重值，确定预设神经网络模型的预测准确度。

可选的，上述每个出行指标的预测准确度对应的第一权重值不相同。

一种可能的实现方式中，出行指标的预测准确度的第一权重值的大小与出行指标的时间跨度有关。例如，出行指标的时间跨度越大，该出行指标的判断误差也会相应增大，此时为该出行指标设置较小的权重以降低该权重误差的影响。

一种具体的实现方式中，模型训练装置根据每个出行指标的预测准确度乘以该出行指标的预测准确度对应的第一权重值，确定每个出行指标加权后的预测准确度。模型训练装置将每个出行指标加权后的预测准确度求和，得到预设神经网络模型的预测准确度。

S203、模型训练装置根据预设神经网络模型的预测准确度，确定用户出行预测模型。

一种可能的实现方式中，模型训练装置确定预设神经网络模型的预测准确度是否大于预设阈值。

若大于，则模型训练装置确定当前的神经网络模型为用户出行预测模型。

若不大于，则模型训练装置调整神经网络模型的参数，得到调整后的神经网络模型。模型训练装置将样本数据输入到调整后的神经网络模型中，进行迭代训练，直至当前神经网络模型的预测准确度大于预设阈值。模型训练装置确定当前的神经网络模型为用户出行预测模型。

基于上述技术方案，本申请最少带来以下有益效果：模型训练装置以用户的运营商数据为基础确定用户的出行特征，对神经网络模型进行训练；在训练过程中，模型训练装置定义多个用户的出行指标并为这些指标设置不同的权重，模型训练装置根据神经网络的多个出行指标的预测准确度以及指标对应的权重确定神经网络模型的预测准确度，为调整神经网络模型提供依据。这样，可以使得训练得到的用户出行预测模型能够预测用户的多个出行指标，且预测的多个出行指标均具有较高的准确度。

在上述S203的一种可能的实现方式中，结合图2，如图3所示，模型训练装置根据预设神经网络模型的预测准确度，确定用户出行预测模型的过程具体可以通过以下S2031-S2034实现，以下对S2031和S2034进行具体说明：

S2031、模型训练装置确定当前神经网络模型的预测准确度是否大于预设阈值。

当前神经网络模型为预设神经网络模型，或者当前神经网络模型为调整后的神经网络模型；

具体来说，在将样本数据输入预设神经网络模型，确定预设神经网络模型的预测准确度的过程中，当前神经网络模型为预设神经网络模型。

在根据准确度调整了预设神经网络模型的参数之后，当前神经网络模型为最近一次调整后的神经网络模型。

其中，上述预设阈值可以预先配置在神经网络模型中的预设阈值。该预设阈值可以为固定值，也可以为根据出行指标数量变化的值。本申请对此不做限定。

需要指出的是，在S2031中包括以下两种情况：情况1、当前神经网络模型的预测准确度大于预设阈值；以及情况2、当前神经网络模型的预测准确度小于或等于预设阈值。

在情况1和情况2中，模型训练装置分别执行不同的步骤确定用户出行预测模型，以下分别进行具体说明：

情况1、当前神经网络模型的预测准确度大于预设阈值。

在情况1中，模型训练装置通过以下S2032确定用户出行预测模型。

S2032、模型训练装置确定当前神经网络模型为用户出行预测模型。

也即是说，在当前神经网络模型的预测准确度大于预设阈值的情况下，模型训练装置确定当前神经网络模型即可满足用户出行的预测需求。此时，模型训练装置确定当前神经网络模型为用户出行预测模型。

情况2、当前神经网络模型的预测准确度小于或等于预设阈值。

在情况2中，模型训练装置通过以下S2033和S2034确定用户出行预测模型。

S2033、模型训练装置调整当前神经网络模型的参数，确定调整后的神经网络模型，将调整后的神经网络模型作为当前神经网络模型。

也即是说，在当前神经网络模型的预测准确度小于或等于预设阈值的情况下，模型训练装置确定当前神经网络模型无法满足用户出行的预测需求。此时模型训练装置需要调整当前神经网络模型的参数，并继续对神经网络模型进行训练，直至得到能够满足用户出行的预测需求的神经网络模型。

需要指出的是，调整参数后的神经网络模型的预测结果与调整前的神经网络模型的预测结果可能不同。

S2034、模型训练装置将样本数据输入当前神经网络模型，确定当前神经网络模型的预测准确度。

可选的，S2034的具体实现方式可以参照以上S201和S202，本申请对此不在赘述。

在S2034之后，模型训练装置迭代执行上述S2031、S2032、S2033以及S2034，直至确定用户出行预测模型。

基于图3提供的技术方案，至少带来以下有益效果：根据图3中记载的技术方案，模型训练装置可以训练得到满足需求的用户出行预测模型。此外，模型训练装置依据神经网络模型的预测准确度调整神经网络模型的参数，而神经网络模型的预测准确度又是根据多个出行指标的预测准确度确定的。因此，本申请最终训练得到的用户出行预测模型能够同时预测多个出行指标，且每个出行指标均能实现较高的预测准确度。

以上，对S203的一种可能的实现方式进行了具体说明。以下，对S201的具体实现过程进行具体说明：

一种可能的实现方式中，结合图2，如图3所示，上述S201具体可以通过以下S2011至S2013实现，以下对S2011至S2013进行具体说明：

S2011、模型训练装置确定第一出行指标。

其中，第一出行指标为多个出行指标中的任一个出行指标。示例性的，结合上述S201，第一出行指标可以为指标1至指标4中的任一个出行指标。

S2012、模型训练装置将样本数据输入预设神经网络模型中，预测目标用户在第二时间段的子时间段内第一出行指标的预测准确度。

一种可能的实现方式中，上述子时间段为第一子时间段和第二子时间段中的至少一个。

例如，结合上述指标1至指标4；在指标1和指标3中，子时间段为S天中的每一天。在指标2和指标4中，子时间段为24小时内的每一小时。在该情况下，S天中的每一天记为第一子时间段；24小时内的每一小时记为第二子时间段。

一种可能的实现方式中，模型训练装置采用F1值表示指标1和指标2的准确度；模型训练装置采用MSE值表示指标3和指标4的准确度。

以下，结合上述指标1至指标4，对神经网络模型预测的目标用户在第二时间段的子时间段内第一出行指标的预测准确度进行举例说明：

示例1、模型训练装置确定的指标1中，与最后一个第一时间段之间相隔d-1个第一子时间段的第一子时间段的第一预测准确度为：F1_1,d。

示例2、模型训练装置确定的指标2中，与最后一个第二时间段之间相隔h-1个第二子时间段的第二子时间段的第二预测准确度为：F1_2,h。

示例3、模型训练装置确定的指标3中，神经网络模型预测的指标3的准确度为：(f₃(x_i)-y_3,i)²。其中，f₃(x_i)为预设神经网络模型预测的目标用户第一次前往预设地点的第一子时间段；y_3,i为目标用户实际第一次前往预设地点的第一子时间段。

示例4、模型训练装置确定的指标4中，神经网络模型预测的指标3的准确度为：(f₄(x_i)-y_4,i)²。其中，f₄(x_i)为预设神经网络模型预测的目标用户第一次前往预设地点的第二子时间段；y_4,i为目标用户实际第一次前往预设地点的第二子时间段。

S2013、模型训练装置确定目标用户在每个子时间段内第一出行指标的预测准确度，以及每个子时间段对应的第二权重值，确定第一出行指标的预测准确度。

其中，第二权重值的大小与第一时长成反比；第一时长为子时间段和第二时间段的结束时间之间的时长。

结合上述示例1、模型训练装置确定每一第一子时间段是否前往预设地点的第一预测准确度，满足以下公式1：

其中，F₁为每一第一子时间段是否前往预设地点的第一预测准确度；第二时间段包括S个第一子时间段；S和d均为正整数。

可选的，第二时间段的时长为一周，此时，S的值为7。第一时间段的时长为1天，d的最大值为7。第一子时间段对应的第二权重值为

可见，d的值越大，其对应的权重系数越小。结合上述示例2、模型训练装置确定每一第二子时间段内是否前往预设地点的第二预测准确度，满足以下公式2：

其中，F₂为第二预测准确度；第二时间段包括T个第二子时间段；T和h均为正整数。

可选的，第二时间段的时长为一周内的任一天，或一周内的每一天，此时，T的值为24。第二时间段的时长为1小时，d的最大值为24。第一子时间段对应的第二权重值为

可见，h的值越大，其对应的权重系数越小。

结合上述示例3、模型训练装置确定第一次前往预设地点的第一时间段的第三预测准确度，满足以下公式3：

其中，F₃为第三预测准确度；C₃为大小固定的权重系数。

为第二权重值，可见y_3,i的值越大，第二权重值越小。

结合上述示例4、模型训练装置确定第一次前往预设地点的第二子时间段的第四预测准确度，满足以下公式4；

其中，F₄为第四预测准确度；C₄为大小固定的权重系数。

为第二权重值，可见y_4,i的值越大，第二权重值越小。

基于上述公式1和公式4可知，针对每一指标在一个子时间段内的预测准确度，该子时间段距离第二时间段的结束时间越长，其权重值越小，距离第二时间段的结束时间越短，其权重值越大，从而保证了预测距离当前时间越近的时间段的预测结果越精确。

上述公式1至公式4、在S202的一种可能的实现方式中，模型训练装置确定预设神经网络模型的预测准确度满足以下公式：

其中，a₁为第一预测准确度对应的权重值；a₂为第二预测准确度对应的权重值；a₃为第三预测准确度对应的权重值；a₄为第四预测准确度对应的权重值。

以上，本申请实施例提供了一种模型训练方法，在训练得到上述用户出行预测模型之后，本申请实施例还提供了一种用户出行预测方法，用于预测用户的出行意图。如图4所示，本申请实施例提供的用户出行预测方法包括以下S400和S401。

S400、终端设备获取目标用户在第三时间段内的样本数据。

其中，S401的实现方式与上述S200的实现方式类似。区别在于S200中的样本数据为第一时间段内的样本数据。第三时间段的时长与第一时间段的时长相同；或者第三时间段的时长与第一时间段的时长减去第二时间段的时长之后的时长相同。本申请对S401的具体实现过程不在赘述。

S401、终端设备将第三时间段内的样本数据输入用户出行预测模型中，确定目标用于在第四时间段内的多个出行指标。

其中，第四时间段为待预测的时间段。

具体来说，在模型训练装置训练得到用户出行预测模型之后，终端设备可以根据该用户出行预测模型预测用户之后的多个出行指标。

例如，终端设备需要预测从当前时间开始之后的一周内(第四时间段)用户的出行指标。终端设备可以首先获取当前时间之前的一个月内(第三时间段)目标用户的样本数据。终端设备将之前一个月的样本数据输入到用户出行预测模型，得到之后一周内用户的多个出行指标。

需要指出的是，本申请中所记载的终端设备和模型训练装置可以为统一装置，也可以为不同的装置。例如，模型训练装置可以为专用于进行模型训练的服务器等。终端设备为用户使用的终端设备(如手机，计算机等)。此时，模型训练装置训练得到用户出行预测模型之后，可以将用户出行预测模型发送至终端设备中，由终端设备根据用户出行预测模型预测用户的出行指标。又例如，模型训练装置和终端设备为同一装置，模型训练装置训练得到用户出行预测模型之后，可以直接根据用户出行预测模型预测用户的出行指标。本申请不做模型训练装置和终端设备进行限定。

可以看出，上述主要从方法的角度对本申请实施例提供的技术方案进行了介绍。为了实现上述功能，其包含了执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到，结合本文中所公开的实施例描述的各示例的模块及算法步骤，本申请实施例能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

本申请实施例可以根据上述方法示例对模型训练装置进行功能模块的划分，例如，可以对应各个功能划分各个功能模块，也可以将两个或两个以上的功能集成在一个处理模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。可选的，本申请实施例中对模块的划分是示意性的，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式。

如图5所示，为本申请实施例提供的一种模型训练装置的结构示意图。该模型训练装置包括：获取单元501和处理单元502。

获取单元501和处理单元502；获取单元501，用于获取目标用户的样本数据；样本数据为对第一时间段内目标用户的运营商数据进行处理后，得到的用于表征目标用户的出行特征的样本数据；处理单元502，用于将样本数据输入预设神经网络模型中，预测目标用户在第二时间段的多个出行指标中每个出行指标的预测准确度；第二时间段为第一时间段后的时间段；处理单元502，还用于根据每个出行指标的预测准确度，以及每个出行指标的预测准确度对应的第一权重值，确定预设神经网络模型的预测准确度；处理单元502，还用于根据预设神经网络模型的预测准确度，确定用户出行预测模型。

可选的，处理单元502，具体用于执行以下过程：步骤1、确定当前神经网络模型的预测准确度是否大于预设阈值；当前神经网络模型为预设神经网络模型，或者当前神经网络模型为调整后的神经网络模型；步骤2、若满足，则确定当前神经网络模型为用户出行预测模型；步骤3、若不满足，则调整当前神经网络模型的参数，确定调整后的神经网络模型，将调整后的神经网络模型作为当前神经网络模型；步骤4、将样本数据输入当前神经网络模型，确定当前神经网络模型的预测准确度；执行步骤1、步骤2、步骤3，以及步骤4，直至确定用户出行预测模型。

可选的，处理单元502，具体用于：确定第一出行指标；第一出行指标为多个出行指标中的任一个出行指标；将样本数据输入预设神经网络模型中，预测目标用户在第二时间段的子时间段内第一出行指标的预测准确度；根据目标用户在每个子时间段内第一出行指标的预测准确度，以及每个子时间段对应的第二权重值，确定第一出行指标的预测准确度；其中，第二权重值的大小与第一时长成反比；第一时长为子时间段和第二时间段的结束时间之间的时长。

可选的，获取单元501，还用于获取目标用户在第三时间段内的样本数据；处理单元502，还用于将第三时间段内的样本数据输入用户出行预测模型中，确定目标用于在第四时间段内的多个出行指标；其中，第四时间段为待预测目标用户的出行指标的时间段；第三时间段为第四时间段之前的时间段。

可选的，该模型训练装置还可以包括存储模块，用于存储模型训练装置的程序代码和/或数据。

其中，处理模块502可以是处理器或控制器。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框，模块和电路。处理器也可以是实现计算功能的组合，例如包括一个或多个微处理器组合，DSP和微处理器的组合等等。通信模块501可以是收发电路或通信接口等。存储模块可以是存储器。当处理模块502为处理器，通信模块501为通信接口，存储模块为存储器时，本申请实施例所涉及的模型训练装置可以为图1所示模型训练装置。

通过以上的实施方式的描述，所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将网络节点的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。上述描述的系统，模块和网络节点的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

本申请实施例还提供一种计算机可读存储介质，计算机可读存储介质中存储有指令，当计算机执行该指令时，该计算机执行上述方法实施例所示的方法流程中的各个步骤。

本申请的实施例提供一种包含指令的计算机程序产品，当指令在计算机上运行时，使得计算机执行上述方法实施例中的训练方法。

其中，计算机可读存储介质，例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘。随机存取存储器(Random Access Memory，RAM)、只读存储器(Read-Only Memory，ROM)、可擦式可编程只读存储器(Erasable Programmable Read Only Memory，EPROM)、寄存器、硬盘、光纤、便携式紧凑磁盘只读存储器(Compact Disc Read-Only Memory，CD-ROM)、光存储器件、磁存储器件、或者上述的人以合适的组合、或者本领域数值的任何其他形式的计算机可读存储介质。一种示例性的存储介质耦合至处理器，从而使处理器能够从该存储介质读取信息，且可向该存储介质写入信息。当然，存储介质也可以是处理器的组成部分。处理器和存储介质可以位于特定用途集成电路(Application Specific Integrated Circuit，ASIC)中。在本发明实施例中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

由于本发明的实施例中的装置、设备、计算机可读存储介质、计算机程序产品可以应用于上述方法，因此，其所能获得的技术效果也可参考上述方法实施例，本申请实施例在此不再赘述。

以上所述，仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何在本申请揭露的技术范围内的变化或替换，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应该以权利要求的保护范围为准。

Claims

1.一种模型训练方法，其特征在于，所述训练方法包括：

获取目标用户的样本数据；所述样本数据为对第一时间段内所述目标用户的运营商数据进行处理后，得到的用于表征所述目标用户的出行特征的样本数据；

将所述样本数据输入预设神经网络模型中，预测所述目标用户在第二时间段的多个出行指标中每个出行指标的预测准确度；所述第二时间段为所述第一时间段后的时间段；

根据所述每个出行指标的预测准确度，以及所述每个出行指标的预测准确度对应的第一权重值，确定所述预设神经网络模型的预测准确度；

根据所述预设神经网络模型的预测准确度，确定用户出行预测模型。

2.根据权利要求1所述的方法，其特征在于，所述根据所述预设神经网络模型的预测准确度，确定所述用户出行预测模型，包括：

步骤1、确定所述当前神经网络模型的预测准确度是否大于预设阈值；所述当前神经网络模型为所述预设神经网络模型，或者所述当前神经网络模型为调整后的神经网络模型；

步骤2、若满足，则确定所述当前神经网络模型为所述用户出行预测模型；

步骤3、若不满足，则调整所述当前神经网络模型的参数，确定调整后的神经网络模型，将调整后的神经网络模型作为所述当前神经网络模型；

步骤4、将所述样本数据输入所述当前神经网络模型，确定所述当前神经网络模型的预测准确度；

执行所述步骤1、所述步骤2、所述步骤3，以及所述步骤4，直至确定所述用户出行预测模型。

3.根据权利要求1所述的方法，其特征在于，将所述样本数据输入预设神经网络模型中，预测所述目标用户在第二时间段的多个出行指标中每个出行指标的预测准确度，包括：

确定第一出行指标；所述第一出行指标为所述多个出行指标中的任一个出行指标；

将所述样本数据输入所述预设神经网络模型中，预测所述目标用户在所述第二时间段的子时间段内所述第一出行指标的预测准确度；

根据所述目标用户在每个所述子时间段内所述第一出行指标的预测准确度，以及每个所述子时间段对应的第二权重值，确定所述第一出行指标的预测准确度；其中，所述第二权重值的大小与第一时长成反比；所述第一时长为所述子时间段和所述第二时间段的结束时间之间的时长。

4.根据权利要求3所述的方法，其特征在于，所述子时间段为第一子时间段和第二子时间段中的至少一个，所述第一子时间段和所述第二子时间段的时长不同；所述多个出行指标包括以下至少一项：每一第一子时间段是否前往预设地点；每一第二子时间段内是否前往所述预设地点；第一次前往所述预设地点的第一时间段；第一次前往所述预设地点的第二子时间段；

所述每一第一子时间段是否前往预设地点的第一预测准确度，满足以下公式：

其中，F₁为所述每一第一子时间段是否前往预设地点的第一预测准确度；所述第二时间段包括S个第一子时间段；F1_1,d为与所述S个第一子时间段中的与最后一个第一时间段之间相隔d-1个第一子时间段的第一子时间段的第一预测准确度；S和d均为正整数；

所述每一第二子时间段内是否前往所述预设地点的第二预测准确度，满足以下公式：

其中，F₂为所述第二预测准确度；所述第二时间段包括T个第二子时间段；F1_2,h为与所述T个第二子时间段中的最后一个时间段之间相隔h-1个第二子时间段的第二子时间段的第二预测准确度；T和h均为正整数；

所述第一次前往所述预设地点的第一时间段的第三预测准确度，满足以下公式：

其中，F₃为所述第三预测准确度；f₃(x_i)为所述预设神经网络模型预测的所述目标用户第一次前往所述预设地点的第一子时间段；所述y_3,i为所述目标用户实际第一次前往所述预设地点的第一子时间段；C₃为大小固定的权重系数；

所述第一次前往所述预设地点的第二子时间段的第四预测准确度，满足以下公式；

其中，F₄为所述第四预测准确度；f₄(x_i)为所述预设神经网络模型预测的所述目标用户第一次前往所述预设地点的第二子时间段；所述y_4,i为所述目标用户实际第一次前往所述预设地点的第二子时间段；C₄为大小固定的权重系数。

5.根据权利要求4所述的方法，其特征在于，所述预设神经网络模型的预测准确度满足以下公式：

其中，a₁为所述第一预测准确度对应的权重值；a₂为所述第二预测准确度对应的权重值；a₃为所述第三预测准确度对应的权重值；a₄为所述第四预测准确度对应的权重值。

6.根据权利要求1-5任一项所述的方法，其特征在于，所述方法还包括：

获取所述目标用户在第三时间段内的样本数据；所述第三时间段为当前时间段之前的时间段；

将所述第三时间段内的样本数据输入所述用户出行预测模型中，确定所述目标用于在第四时间段内的多个出行指标；其中，所述第四时间段为待预测的时间段。

7.一种模型训练装置，其特征在于，所述训练装置包括：获取单元和处理单元；

所述获取单元，用于获取目标用户的样本数据；所述样本数据为对第一时间段内所述目标用户的运营商数据进行处理后，得到的用于表征所述目标用户的出行特征的样本数据；

所述处理单元，用于将所述样本数据输入预设神经网络模型中，预测所述目标用户在第二时间段的多个出行指标中每个出行指标的预测准确度；所述第二时间段为所述第一时间段后的时间段；

所述处理单元，还用于根据所述每个出行指标的预测准确度，以及所述每个出行指标的预测准确度对应的第一权重值，确定所述预设神经网络模型的预测准确度；

所述处理单元，还用于根据所述预设神经网络模型的预测准确度，确定用户出行预测模型。

8.根据权利要求7所述的装置，其特征在于，所述处理单元，具体用于执行以下过程：

9.根据权利要求7所述的装置，其特征在于，所述处理单元，具体用于：

10.根据权利要求9所述的装置，其特征在于，所述子时间段为第一子时间段和第二子时间段中的至少一个，所述第一子时间段和所述第二子时间段的时长不同；所述多个出行指标包括以下至少一项：每一第一子时间段是否前往预设地点；每一第二子时间段内是否前往所述预设地点；第一次前往所述预设地点的第一时间段；第一次前往所述预设地点的第二子时间段；

其中，F₄为所述第三预测准确度；f₄(x_i)为所述预设神经网络模型预测的所述目标用户第一次前往所述预设地点的第二子时间段；所述y_4,i为所述目标用户实际第一次前往所述预设地点的第二子时间段；C₄为大小固定的权重系数。

11.根据权利要求10所述的装置，其特征在于，所述预设神经网络模型的预测准确度满足以下公式：

其中，a₁为所述第一预测准确度对应的第一权重值；a₂为所述第二预测准确度对应的第一权重值；a₃为所述第三预测准确度对应的第一权重值；a₄为所述第四预测准确度对应的第一权重值。

12.根据权利要求7-11任一项所述的装置，其特征在于，所述获取单元，还用于获取所述目标用户在第三时间段内的样本数据；

所述处理单元，还用于将所述第三时间段内的样本数据输入所述用户出行预测模型中，确定所述目标用于在第四时间段内的多个出行指标；其中，所述第四时间段为待预测所述目标用户的出行指标的时间段；所述第三时间段为所述第四时间段之前的时间段。

13.一种电子设备，其特征在于，包括：处理器以及存储器；其中，所述存储器用于存储计算机执行指令，当所述电子设备运行时，所述处理器执行所述存储器存储的所述计算机执行指令，以使所述电子设备执行权利要求1-6中任一项所述的模型训练方法。

14.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质包括指令，所述指令当被电子设备执行时使所述计算机执行如权利要求1-6中任一项所述的模型训练方法。