CN111797858A

CN111797858A - 模型训练方法、行为预测方法、装置、存储介质及设备

Info

Publication number: CN111797858A
Application number: CN201910282139.2A
Authority: CN
Inventors: 陈仲铭; 何明
Original assignee: Guangdong Oppo Mobile Telecommunications Corp Ltd
Current assignee: Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority date: 2019-04-09
Filing date: 2019-04-09
Publication date: 2020-10-20

Abstract

一种模型训练方法、行为预测方法、装置、存储介质及设备，所述模型训练方法包括：获取用户的历史行为数据；将所述历史行为数据划分为多个数据段，每一数据段对应一时间段；对所述每一数据段进行特征提取，获得训练数据；对所述训练数据进行预处理，得到训练样本集；将所述训练样本集输入到时间序列模型中进行训练，得到行为预测模型。本申请的模型训练方法可以根据用户的历史行为数据训练得到行为预测模型，通过行为预测模型可以预测用户未来时间段的行为，从而使得电子设备可以根据预测结果为用户提供更贴切和个性化的服务推荐。

Description

模型训练方法、行为预测方法、装置、存储介质及设备

技术领域

本申请涉及电子技术领域，特别涉及一种模型训练方法、行为预测方法、装置、存储介质及设备。

背景技术

随着电子技术的发展，诸如智能手机等电子设备的智能化程度越来越高。例如，电子设备可以根据用户现有的行为习惯来预测用户的下一个行为，并针对预测结果为用户提供更贴切和个性化的移动互联网服务。

发明内容

本申请实施例提供一种模型训练方法、行为预测方法、装置、存储介质及电子设备，可以通过电子设备对用户未来时间段的行为进行预测。

本申请实施例提供一种模型训练方法，包括：

获取用户的历史行为数据；

将所述历史行为数据划分为多个数据段，每一数据段对应一时间段；

根据所述每一数据段获取至少一个行为向量；

将所述多个数据段的行为向量按照时间先后排列，集合形成训练数据；

将所述训练数据输入到时间序列模型中进行训练，得到行为预测模型。

本申请实施例还提供一种行为预测方法，包括：

接收用户行为的预测请求；

根据所述预测请求获取预设时间段；

根据所述预设时间段和预先训练好的行为预测模型，预测所述预设时间段的用户行为；

其中，所述行为预测模型根据用户的历史行为数据和时间序列模型进行模型训练得到。本申请实施例还提供一种模型训练装置，包括：

第一获取模块，用于获取用户的历史行为数据；

数据划分模块，用于将所述历史行为数据划分为多个数据段，每一数据段对应一时间段；

第二获取模块，用于根据所述每一数据段获取至少一个行为向量；

数据集合模块，用于将所述多个数据段的行为向量按照时间先后排列，集合形成训练数据；

训练模块，用于将所述训练数据输入到时间序列模型中进行训练，得到行为预测模型。

本申请实施例还提供一种存储介质，所述存储介质中存储有计算机程序，当所述计算机程序在计算机上运行时，实现上述本申请实施例提供的模型训练方法。

本申请实施例还提供一种电子设备，包括处理器和存储器，所述存储器中存储有计算机程序，所述处理器通过调用所述存储器中存储的所述计算机程序实现上述本申请实施例提供的模型训练方法。

本申请实施例的模型训练方法可以对用户的历史行为数据进行训练获得行为预测模型，行为预测模型可以预测用户未来时间段的行为，从而使得电子设备可以根据预测结果为用户提供更贴切和个性化的服务推荐。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍。显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的模型训练方法的应用场景示意图。

图2为本申请实施例提供的模型训练方法的第一种流程示意图。

图3为本申请实施例提供的模型训练方法的第二种流程示意图。

图4为本申请实施例提供的模型训练方法的第三种流程示意图。

图5为本申请实施例提供的模型训练方法的第四种流程示意图。

图6为本申请实施例提供的模型训练方法的第五种流程示意图。

图7为本申请实施例提供的模型训练方法的第六种流程示意图。

图8为本申请实施例提供的行为预测方法的流程示意图。

图9为本申请实施例提供的模型训练装置的第一种结构示意图。

图10为本申请实施例提供的模型训练装置的第二种结构示意图。

图11为本申请实施例提供的模型训练装置的第三种结构示意图。

图12为本申请实施例提供的模型训练装置的第四种结构示意图。

图13为本申请实施例提供的电子设备的第一种结构示意图。

图14为本申请实施例提供的电子设备的第二种结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述。显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域技术人员在没有付出创造性劳动前提下所获得的所有其他实施例，都属于本申请的保护范围。

参考图1，图1为本申请实施例提供的模型训练方法的应用场景示意图。所述模型训练方法应用于电子设备。所述电子设备中设置有全景感知架构。所述全景感知架构为电子设备中用于实现所述算法模型更新方法的硬件和软件的集成。

其中，全景感知架构包括信息感知层、数据处理层、特征抽取层、情景建模层以及智能服务层。

信息感知层用于获取电子设备自身的信息或者外部环境中的信息。所述信息感知层可以包括多个传感器。例如，所述信息感知层包括距离传感器、磁场传感器、光线传感器、加速度传感器、指纹传感器、霍尔传感器、位置传感器、陀螺仪、惯性传感器、姿态感应器、气压计、心率传感器等多个传感器。

其中，距离传感器可以用于检测电子设备与外部物体之间的距离。磁场传感器可以用于检测电子设备所处环境的磁场信息。光线传感器可以用于检测电子设备所处环境的光线信息。加速度传感器可以用于检测电子设备的加速度数据。指纹传感器可以用于采集用户的指纹信息。霍尔传感器是根据霍尔效应制作的一种磁场传感器，可以用于实现电子设备的自动控制。位置传感器可以用于检测电子设备当前所处的地理位置。陀螺仪可以用于检测电子设备在各个方向上的角速度。惯性传感器可以用于检测电子设备的运动数据。姿态感应器可以用于感应电子设备的姿态信息。气压计可以用于检测电子设备所处环境的气压。心率传感器可以用于检测用户的心率信息。

数据处理层用于对信息感知层获取到的数据进行处理。例如，数据处理层可以对信息感知层获取到的数据进行数据清理、数据集成、数据变换、数据归约等处理。

其中，数据清理是指对信息感知层获取到的大量数据进行清理，以剔除无效数据和重复数据。数据集成是指将信息感知层获取到的多个单维度数据集成到一个更高或者更抽象的维度，以对多个单维度的数据进行综合处理。数据变换是指对信息感知层获取到的数据进行数据类型的转换或者格式的转换等，以使变换后的数据满足处理的需求。数据归约是指在尽可能保持数据原貌的前提下，最大限度的精简数据量。

特征抽取层用于对数据处理层处理后的数据进行特征抽取，以提取所述数据中包括的特征。提取到的特征可以反映出电子设备自身的状态或者用户的状态或者电子设备所处环境的环境状态等。

其中，特征抽取层可以通过过滤法、包装法、集成法等方法来提取特征或者对提取到的特征进行处理。

过滤法是指对提取到的特征进行过滤，以删除冗余的特征数据。包装法用于对提取到的特征进行筛选。集成法是指将多种特征提取方法集成到一起，以构建一种更加高效、更加准确的特征提取方法，用于提取特征。

情景建模层用于根据特征抽取层提取到的特征来构建模型，所得到的模型可以用于表示电子设备的状态或者用户的状态或者环境状态等。例如，情景建模层可以根据特征抽取层提取到的特征来构建关键值模型、模式标识模型、图模型、实体联系模型、面向对象模型等。

智能服务层用于根据情景建模层所构建的模型为用户提供智能化的服务。例如，智能服务层可以为用户提供基础应用服务，可以为电子设备进行系统智能优化，还可以为用户提供个性化智能服务。

此外，全景感知架构中还可以包括多种算法，每一种算法都可以用于对数据进行分析处理，所述多种算法可以构成算法库。例如，所述算法库中可以包括马尔科夫算法、隐含狄里克雷分布算法、贝叶斯分类算法、支持向量机、K均值聚类算法、K近邻算法、条件随机场、残差网络、长短期记忆网络、卷积神经网络、循环神经网络等算法。

本申请实施例提供一种模型训练方法，所述模型训练方法可以应用于电子设备中。所述电子设备可以是智能手机、平板电脑、游戏设备、AR(Augmented Reality，增强现实)设备、汽车、数据存储装置、音频播放装置、视频播放装置、笔记本、桌面计算设备、可穿戴设备诸如手表、眼镜、头盔、电子手链、电子项链、电子衣物等设备。

参考图2，图2为本申请实施例提供的模型训练方法的第一种流程示意图。

110，获取用户的历史行为数据。

电子设备可以通过上述全景感知架构中的信息感知层来采集预设历史时间段内的行为数据。所述行为数据可以包括任意的数据。例如，所述行为数据可以包括时间、位置、网络连接、心率、移动轨迹、当前环境的图像信息、当前环境的音频信息等多种数据。

例如，预设历史时间段为1月1日早上7点至早上10点，电子设备可以获取到的行为数据包括1月1日早上7点至早上10点这一时间段内的多个时刻的图像信息、多个时刻的音频信息、多个时刻的位置信息、多个时刻的移动轨迹信息、多个时刻的心率信息、多个时刻的网络连接信息、多个时刻打开的APP信息等。

120，将所述历史行为数据划分为多个数据段，每一数据段对应一时间段。

电子设备获取预设历史时间段内的行为数据之后，可以按照预设划分规则将所述行为数据划分为多个数据段，每一数据段对应一时间段。

例如，预设历史时间段为1月1日早上7点至早上10点，预设划分规则为每小时为一个时间段，那么1月1日早上7点至早上10点这一时间段将按照预设划分规则划分为3个时间段，分别为早上7点至早上8点、早上8点至早上9点和早上9点至早上10点。其中，按照上述3个时间段，1月1日早上7点至早上10点这一时间段内的行为数据将被划分为三个数据段，分别为：早上7点至早上8点这一时间段所对应的数据段为第一数据段、早上8点至早上9点这一时间段所对应的数据段为第二数据段、以及早上9点至早上10点这一时间段所对应的数据段为第三数据段。

130，根据所述每一数据段获取至少一个行为向量；

电子设备将预设历史时间段内的行为数据划分为多个数据段后，可以根据所述每一数据段获取至少一个行为向量。其中，所述行为向量可以包括多个特征，所述行为向量用于对每一数据段进行量化，从而可以通过行为向量确定用户的历史行为。

例如，所述早上7点至早上10点对应的数据段可以为S，按照每小时为一个时间段的规则划分得到三个数据段S₁、S₂和S₃，即S(S1，S2，S3)，S1表示早上7点至8点为起床刷牙吃早餐，S2表示早上8点至9点为坐地铁去上班，S3表示早上9点至早上10点在公司上班。

其中每一行为向量包括多个特征值，诸如S1为一行为向量P1(A1，B1，C1)，A1，B1，C1均表示某一特征，例如A1可以表示时刻特征，B1可以表示位置特征，C1可以表示网络连接特征，通过所述行为向量P1(A1，B1，C1)即可表示用户的某一历史行为的情况。

140，将所述多个数据段的行为向量按照时间先后排列，集合形成训练数据。

电子设备获取所述每一数据段的行为向量后，将多个数据段的行为向量按照历史时间的先后顺序排列，并集合所述多个数据段的行为向量，形成训练数据。

例如，上述的三个数据段S₁、S₂和S₃，分别获取S₁、S₂和S₃这三个数据段的行为向量后，按照所述三个时间段所对应的时间段的发生时刻的先后顺序排列，即将S₁、S₂和S₃这三个数据段的行为向量按照早上7点至8点、早上8点至9点、早上9点至10点这一时间先后排列，集合得到训练数据。

150，将所述训练数据输入到时间序列模型中进行训练，得到行为预测模型。

电子设备获取到训练数据后，将训练数据内的每一行为向量按时间先后顺序输入到时间序列模型中进行训练。所述时间序列模型可以为ARIMA模型(整合移动平均自回归模型)或LSTM模型(长短期记忆模型)，也可以是其他的时间序列模型。

例如，电子设备获取用户从1月1日到1月10日的预设历史时间段的行为向量，假设该时间段为每天早上7点至早上10点，按照上述步骤对获取到的行为数据进行划分和行为向量的获取，获得10个第一行为向量、第二行为向量和第三行为向量。

将上述各时间段所包含的三个行为向量按照时间先后顺序输入到长短期记忆模型中，即依次将1月1日至1月10日中每一天的第一行为向量、第二行为向量和第三行为向量按时间先后输入到LSTM模型中，LSTM模型对输入1月1日到1月10日每天早上7点至早上10点的行为向量进行迭代训练，得到行为预测模型。

本申请实施例中的模型训练方法可以应用在图1中的全景架构层中。本申请实施例可以通过全景感知架构中的信息感知层获取数据，诸如通过心率传感器获取用户在预设时间段的心率数据。可以通过全景感知架构中的数据处理层对信息感知层获取到的数据进行数据处理，诸如对所述心率数据进行数据划分，将所述心率数据划分为多个心率数据段，每一心率数据段对应一时间段。可以通过特征抽取层对数据处理层的数据进行特征抽取，诸如特征抽取层可以从所述每一数据段获取至少一个行为向量，诸如从预设时间段的心率数据中获取睡觉这一行为向量。可以通过情景建模层对特征抽取层的数据进行处理，诸如情景建模层对将所述特征抽取层获取到的行为向量按照时间先后排列，集合形成训练数据，并结合算法库中的长短期记忆模型对所述训练数据进行训练，得到行为预测模型。

在一些实施例中，参考图3，图3为本申请实施例提供的模型训练方法的第二种流程示意图。

其中，步骤130，对所述每一数据段进行特征提取，获得训练数据，包括以下步骤：

131，通过每一所述数据段对应的特征提取模型从所述数据段中提取出多个特征；

132，通过每一所述数据段对应的特征提取模型从所述数据段中提取出多个特征；

133，根据每一所述数据段中提取到的多个所述特征确定至少一个行为向量。

电子设备中可以预先设置多个特征提取模型，每一个特征提取模型都用于对一种类型的数据进行特征提取。例如，电子设备中可以预先设置卷积神经网络模型、递归神经网络模型、词向量模型等。其中，卷积神经网络模型用于对图像数据进行处理，以从图像数据中提取图像特征；递归神经网络模型用于对音频数据进行处理，以从音频数据中提取音频特征；词向量模型用于对文本数据进行处理，以从文本数据中提取文本特征。

电子设备获取到每一时间段的每一数据段后，可以根据所述每一数据段的数据类型选择对应的特征提取模型。当所述每一数据段包括多种数据类型时，电子设备可以根据每一种数据类型选择一种对应的特征提取模型。

随后，电子设备通过选择的特征提取模型从所述每一数据段中提取出多个特征，根据每一所述数据段中提取到的多个所述特征确定每一数据段中所包含的行为向量。需要说明的是，每一数据段中包含至少一个行为向量，该行为向量通过特征确定。

其中每一数据段包括多个特征，该特征形成一个或多个行为向量。诸如，数据段S1可以为P1(A1，B1，C1)这一行为向量，数据段S2可以包括P21(A21，B21，C21，D21)和P22(A22，B22，C22)两个行为向量，数据段S3可以为P3(A3，B3)这一行为向量，其中A1、B1、C1、A21、B21、C21、D21、A22、B22、C22为多个特征，可以为时刻特征、位置特征、网络连接特征、图像特征、音频特征等。

电子设备通过特征提取模型对A1、B1、C1、A21、B21、C21、D21、A22、B22、C22、A3，B3等特征进行提取，并根据各个特征的关联关系确定行为向量，诸如A1为早上7点这一时刻特征，B1为这个时刻特征所对应的在卧室床上这一位置特征，C1为用户刷牙后坐在餐桌上吃早餐的图像特征，则根据三个特征所对应的时间关系，确定行为向量为P1(A1，B1，C1)，以此类推，确定A21、B21、C21、D21、A22、B22和C22形成两个行为向量P21(A21，B21，C21，D21)和P22(A22，B22，C22)；A3，B3形成行为向量P3(A3，B3)。

将P1(A1，B1，C1)、P21(A21，B21，C21，D21)、P22(A22，B22，C22)和P3(A3，B3)按照时间先后排序，集合形成训练数据。

在一些实施例中，参考图4，图4为本申请实施例提供的模型训练方法的第三种流程示意图。

其中，150，所述训练数据输入到时间序列模型中进行训练，得到行为预测模型步骤之前，包括：

170，对所述训练数据中的每一行为向量进行数据维度对齐处理，以使得处理后的所述每一行为向量的特征数量相等。

训练数据的每一行为向量作为时间序列模型的输入数据，可能具有数量不同的特征。电子设备获取到的行为向量之后，可以对每一行为向量进行数据维度对齐处理，使得每一行为向量都具有相同数量的特征。除此之外，还可以对行为向量进行数据清洗处理、数据归类处理、数据转换处理或数据归一化处理等。

例如，电子设备获取到的行为向量之后，可以对每一行为向量进行数据清洗，筛选出主要特征；然后根据行为类型对主要特征进行归类，诸如早上起床刷牙和刷朋友圈，刷牙和刷朋友圈为不同类型的行为，将早上起床刷牙和刷朋友圈归为早上起床刷牙和早上起床刷朋友圈两个不同的行为向量；针对归类后的数据，根据所选择的时间序列模型的数据表现形式要求，将归类后的训练数据进行转换处理，转换处理可以为对数转换、平方根转换、平方根反正弦转换、平方转换或倒数变换。

训练数据的每一行为向量作为时间序列模型的输入数据，可能具有数量不同的特征，需要对每一行为向量进行数据维度对齐处理，使得每一行为向量都具有相同数量的特征；最后将数据维度对齐处理后的每一行为向量进行归一化处理后方可输入时间序列模型，所述归一化处理可以采用线性归一化、标准差标准化或非线性归一化等方法。

在一些实施例中，参考图5，其中，步骤170，对所述训练数据中的每一行为向量进行数据维度对齐处理，以使得处理后的所述每一行为向量的特征数量相等，包括以下步骤：

171，依次计算每一行为向量中的特征数量，得到最大特征数量；

172、从所述训练数据的多个行为向量中筛选出特征数量未达到最大特征数量的行为向量；

173、对所述特征数量未达到最大特征数量的每一行为向量进行特征数量填充。

其中步骤173，可以包括以下步骤：

计算未达到最大特征数量的行为向量的特征数量与最大特征数量之间的差值；

根据所述差值，对所述未达到最大特征数量的每一行为向量进行零填充，以得到具有相同特征数量的行为向量。

例如，数据段S1可以为P1(A1，B1，C1)这一行为向量，数据段S2可以包括P21(A21，B21，C21，D21)和P22(A22，B22，C22)两个行为向量，数据段S3可以为P3(A3，B3)这一行为向量，其中A1、B1、C1、A21、B21、C21、D21、A22、B22、C22为多个特征值，可以为时刻特征、位置特征、网络连接特征、图像特征、音频特征等。

从上述可知，P1具有3个特征；P21具有4个特征；P22具有三个特征；P3具有2个特征。由此可知，这四个行为向量的最大特征数量为4，未达到最大特征数量的行为向量为P1、P22和P3；其中P1的特征数量与最大特征数量之间的差值为1，即需要补充1个特征；以此类推，P22需要补充1个特征，P3需要补充2个特征。

补充特征数量的方法可以在各个行为向量的同一位置上填充相同的特征，诸如在各个行为向量的所有的特征之前、所有的特征之后、第一个特征之后等，只要填充的位置相同即可。诸如，在所有特征之后进行零填充的方式进行特征数量填充，填充后的各个行为向量为P1(A1，B1，C1，0)、P22(A22，B22，C22，0)和P3(A3，B3，0，0)。

由于历史行为数据的数据量庞大、维度繁多，为了简化时间序列模型的输入数据，在一些实施例中，为每一行为向量进行了标签设置，将标签化后的行为向量输入到时间序列模型中，可以提升时间序列模型的训练速度，进而提升预测效率。具体参考图6，图6为本申请实施例提供的模型训练方法的第五种流程示意图。

180，为所述每一行为向量设置一行为类别标签；所述步骤180设置在将所述多个数据段的行为向量按照时间先后排列，集合形成训练数据步骤之前。

按照预设规则制定多种行为类别标签，诸如起床、上班、坐地铁、开车、坐公交、走路、跑步、开会、旅游、聚会、睡觉、逛街等。电子设备根据预设规则为所述每一行为向量设置行为类别标签，该行为类别标签在将所述多个数据段的行为向量按照时间先后排列，集合形成训练数据步骤之前，对训练数据中的每一行为向量进行标签设置。需要说明的是，该行为类别标签也可以在行为预测模型预测输出用户在未来预设时间段的行为时，对预测结果所获得的目标行为向量进行行为类别标签设置。

例如，早上7点至8点为起床刷牙吃早餐的数据段S1，数据段S1所对应的行为向量为P1(A1，B1，C1)，可以为P1设置一起床的行为类别标签，将设置有行为类别标签的行为向量P1输入到时间序列模型中，预测并输出用户某一天早上7点至8点的行为类别标签，即电子设备可以在早上7点至早上8点之前或之时输出“起床”这一行为类别标签。上述全景感知架构中的智能服务层根据输出的行为类别标签，推送适用于起床这一行为类别标签的智能化服务，诸如订早餐服务、订咖啡服务。

本实施例也可以直接将行为向量P1输入到时间序列模型中，预测出某一天早上7点至8点的用户行为，诸如预测出，起床刷牙吃早餐，电子设备对该行为设置一起床的行为类别标签后，输出该行为类别标签。

在一些实施例中，参考图7，图7为本申请实施例提供的用户行为预测方法的第六种流程示意图。

模型训练方法在将所述训练数据输入到时间序列模型中进行训练，得到行为预测模型之后还包括对训练结果进行评价，具体包括以下步骤：

191，根据所述行为预测模型获取预设时间段的预测结果；

192，获取所述预设时间段的真实结果；

193，采用交叉熵损失函数计算所述预测结果和所述真实结果之间的差异值；

194，判断所述差异值是否大于差异阈值；

195，若所述差异值大于所述差异阈值，对所述行为预测模型进行更新；

若所述差异值小于或等于所述差异阈值，维持所述行为预测模型。

例如，电子设备根据所述行为预测模型获取预设时间段的预测结果，并获取与预测结果相对应的时间的真实结果，并采用交叉熵损失函数计算行为预测模型得到的预测结果与真实结果之间的差异值。判断该差异值是否大于差异阈值；当差异值大于差异阈值时，对所述行为预测模型进行更新；当差异值小于或等于差异阈值时，维持所述行为预测模型。

所述对所述行为预测模型进行更新，可以为重新获取新预设历史时间段内的行为数据，也可以继续获取原预设历史时间段后的行为数据，诸如原预设历史时间段为用户近一年的行为数据，对所述近一年的行为数据进行训练获得行为预测模型，经判断得知该行为预测模型的差异值大于差异阈值，即预测准确率不高，可以重新设立一历史时间段，诸如用户近两年的行为数据，基于所述用户近两年的行为数据重新训练，直到差异值小于或等于差异阈值为止，停止训练，获得满足预设条件的行为预测模型；也可以继续重复获取近一年后的行为数据并重复步骤110至步骤194，差异值小于或等于差异阈值为止，停止训练，获得满足预设条件的行为预测模型，如图7所示。

所述交叉熵损失函数为

当交叉熵损失函数的损失值越小时，行为预测模型的预测准确率越高。其中，

为预测值，Y为与预测值时间相对应的真实值，M为训练数据的行数，N为训练数据的列数。

由上可知，本申请实施例提供的模型训练方法包括：获取用户的历史行为数据；将所述历史行为数据划分为多个数据段，每一数据段对应一时间段；根据所述每一数据段获取至少一个行为向量；将所述多个数据段的行为向量按照时间先后排列，集合形成训练数据；将所述训练数据输入到时间序列模型中进行训练，得到行为预测模型。所述模型训练方法可以根据用户的历史行为数据进行训练，获得行为预测模型，所述行为预测模型可以对预设时间段的用户行为进行预测，从而使得电子设备可以根据预测结果为用户提供更贴切和个性化的服务推荐。

图8是本申请实施例提供的行为预测方法的流程示意图，该行为预测方法可以应用于电子设备，该行为预测方法的流程可以包括：

210，接收用户行为的预测请求；

220，根据所述预测请求获取预设时间段；

230，根据所述预设时间段和预先训练好的行为预测模型，预测所述预设时间段的用户行为。

在210中，电子设备可以接收用户行为的预测请求。该预测请求可以由用户通过触发预测指令发出的，也可以在电子设备中提前设置预测指令的发出时间和频率，并在发出时间和频率到达时，处理器触发预测指令，发出预测请求。

在220中，电子设备在接收到预测请求后，进一步获取预设时间段。诸如，获取到明天早上7点至早上8点这一时间段，也即1月20日早上7点至早上8点这一时间段。

需要说明的是，本申请实施例中还预先训练有行为预测模型，该行为预测模型是通过时间序列模型根据用户的历史行为数据进行模型训练得到的。比如，电子设备在训练行为预测模型时，可以利用时间序列模型对用户的历史行为数据进行训练，其中该历史行为数据包括但不限于时间、位置、网络连接、心率、移动轨迹、当前环境的图像信息、当前环境的音频信息等多种数据。在230中，电子设备根据行为预测模型对用户在未来某一天预设时间段的行为进行预测，输出预测值。

例如，将1月20日早上7点至早上8点这一时间段输入到行为预测模型中，电子设备根据训练的结果，在行为预测模型中找到与该时间段匹配的历史行为数据，诸如匹配起床吃早餐刷朋友圈这一行为，则将“起床吃早餐刷朋友圈”这一预测结果进行输出，得到用户在1月20日早上7点至早上8点的行为。

在一些实施例中，上述申请实施例中的230，根据所述预设时间段和预先训练好的行为预测模型，预测所述预设时间段的用户行为可以包括以下步骤：

在所述行为预测模型中输入所述预设时间段；

根据所述预设时间段匹配到至少一个目标行为向量；

获取所述目标行为向量对应的目标行为类别标签；

根据所述目标行为类别标签输出预设时间段的用户行为。

电子设备可以在所述行为预测模型中输入用户未来预设时间段，诸如1月20日早上7点至8点，根据这一时间段在历史行为数据中匹配到至少一个目标行为向量，诸如匹配到早上起床刷牙吃早餐这一行为向量，该行为向量所对应的目标行为类别标签的起床，则根据起床这一目标行为类别标签，电子设备输出用户在1月20日早上7点至8点的行为，诸如输出起床。

本申请实施例还提供一种模型训练装置，所述模型训练装置可以集成在电子设备中。所述电子设备可以为智能手机、平板电脑、游戏设备、AR(Augmented Reality，增强现实)设备、汽车、数据存储装置、音频播放装置、视频播放装置、笔记本电脑、桌面计算设备、可穿戴设备诸如电子手表、电子眼镜、电子头盔、电子手链、电子项链、电子衣物等设备。

参考图9，图9为本申请实施例提供的模型训练装置的第一种结构示意图。其中，所述模型训练装置300包括：第一获取模块301、数据划分模块302、第二获取模块303、数据集合模块304、训练模块305。

第一获取模块301，用于获取用户的历史行为数据。

其中，第一获取模块301可以通过上述全景感知架构中的信息感知层来采集预设历史时间段内的行为数据。所述行为数据可以包括任意的数据。例如，所述行为数据可以包括时间、位置、网络连接、心率、移动轨迹、当前环境的图像信息、当前环境的音频信息等多种数据。

数据划分模块302，用于将所述历史行为数据划分为多个数据段，每一数据段对应一时间段。

数据划分模块302获取预设历史时间段内的行为数据之后，可以按照预设划分规则将所述历史行为数据划分为多个数据段，每一数据段对应一时间段。

例如，预设历史时间段为1月1日早上7点至早上10点，预设划分规则为每小时为一个时间段，那么1月1日早上7点至早上10点这一时间段将按照预设划分规则划分为3个时间段，分别为早上7点至早上8点、早上8点至早上9点和早上9点至早上10点。其中，按照上述3个时间段，1月1日早上7点至早上10点这一时间段内的历史行为数据将被划分为三个数据段，分别为：早上7点至早上8点这一时间段所对应的数据段为第一数据段、早上8点至早上9点这一时间段所对应的数据段为第二数据段、以及早上9点至早上10点这一时间段所对应的数据段为第三数据段。

第二获取模块303，用于根据所述每一数据段获取至少一个行为向量。

数据划分模块302将预设历史时间段内的行为数据划分为多个数据段后，第二获取模块303可以根据所述每一数据段获取至少一个行为向量。其中，所述行为向量可以包括多个特征，所述行为向量用于对每一数据段进行量化，从而可以通过行为向量确定用户的历史行为。

数据集合模块304，用于将所述多个数据段的行为向量按照时间先后排列，集合形成训练数据。

数据集合模块304获取所述每一数据段的行为向量后，将多个数据段的行为向量按照历史时间的先后顺序排列，并集合所述多个数据段的行为向量，形成训练数据。

训练模块305，将所述训练数据输入到时间序列模型中进行训练，得到行为预测模型。

训练模块305获取到训练数据后，将训练数据内的每一行为向量按时间先后顺序输入到时间序列模型中进行训练。所述时间序列模型可以为ARIMA模型(整合移动平均自回归模型)或LSTM模型(长短期记忆模型)，也可以是其他的时间序列模型。

训练模块305将上述各时间段所包含的三个行为向量按照时间先后顺序输入到长短期记忆模型中，即依次将1月1日至1月10日中每一天的第一行为向量、第二行为向量和第三行为向量按时间先后输入到LSTM模型中，LSTM模型对输入1月1日到1月10日每天早上7点至早上10点的行为向量进行迭代训练，得到行为预测模型。

在一些实施例中，第二获取模块303用于执行以下步骤：

通过每一所述数据段对应的特征提取模型从所述数据段中提取出多个特征；

根据每一所述数据段中提取到的多个所述特征确定至少一个行为向量。

在一些实施例中，参考图10，图10为本申请实施例提供的模型训练装置的第二种结构示意图。所述模型训练装置还包括数据处理模块307，所述数据处理模块307用于对所述训练数据中的每一行为向量进行数据维度对齐处理，以使得处理后的所述每一行为向量的特征数量相等。

训练数据的每一行为向量作为时间序列模型的输入数据，可能具有数量不同的特征。数据处理模块307获取到的行为向量之后，可以对每一行为向量进行数据维度对齐处理，使得每一行为向量都具有相同数量的特征。除此之外，还可以对行为向量进行数据清洗处理、数据归类处理、数据转换处理或数据归一化处理等。

例如，数据处理模块307获取到的行为向量之后，可以对每一行为向量进行数据清洗，筛选出主要特征；然后根据行为类型对主要特征进行归类，诸如早上起床刷牙和刷朋友圈，刷牙和刷朋友圈为不同类型的行为，将早上起床刷牙和刷朋友圈归为早上起床刷牙和早上起床刷朋友圈两个不同的行为向量；针对归类后的数据，根据所选择的时间序列模型的数据表现形式要求，将归类后的训练数据进行转换处理，转换处理可以为对数转换、平方根转换、平方根反正弦转换、平方转换或倒数变换。

在一些实施例中，数据处理模块307用于执行以下步骤：

依次计算每一行为向量中的特征数量，得到最大特征数量；

从所述训练数据的多个行为向量中筛选出特征数量未达到最大特征数量的行为向量；

对所述特征数量未达到最大特征数量的每一行为向量进行特征数量填充。

其中对所述特征数量未达到最大特征数量的每一行为向量进行特征数量填充，可以包括以下步骤：

由于历史行为数据的数据量庞大、维度繁多，为了简化时间序列模型的输入数据，在一些实施例中，模型训练装置还设置有标签设置模块207参考图11，图11为本申请实施例提供的模型训练装置的第三种结构示意图。

标签设置模块308，用于为所述每一行为向量设置一行为类别标签。所述为所述每一行为向量设置一行为类别标签这一步骤设置在将所述多个数据段的行为向量按照时间先后排列，集合形成训练数据步骤之前。

按照预设规则制定多种行为类别标签，诸如起床、上班、坐地铁、开车、坐公交、走路、跑步、开会、旅游、聚会、睡觉、逛街等行为类别标签。标签设置模块308根据预设规则为所述每一行为向量设置行为类别标签，该行为类别标签在将所述多个数据段的行为向量按照时间先后排列，集合形成训练数据步骤之前，对训练数据中的每一行为向量进行标签设置。需要说明的是，该行为类别标签也可以在行为预测模型预测输出用户在未来时间段的行为时，对预测结果所获得的目标行为向量进行行为类别标签设置。

在一些实施例中，参考图12，图12为本申请实施例提供的模型训练装置的第五种结构示意图。

所述模型训练装置还包括结果评价模块309，用于执行以下步骤：

根据所述行为预测模型获取预设时间段的预测结果；

获取所述预设时间段的真实结果；

采用交叉熵损失函数计算所述预测结果和所述真实结果之间的差异值；

判断所述差异值是否大于差异阈值；

若所述差异值大于所述差异阈值，对所述行为预测模型进行更新；

例如，结果评价模块209根据所述行为预测模型获取预设时间段的预测结果，并获取与预测结果相对应的时间的真实结果，再采用交叉熵损失函数计算行为预测模型得到的预测结果与真实结果之间的差异值；判断该差异值是否大于差异阈值；当差异值大于差异阈值时，对所述行为预测模型进行更新；当差异值小于或等于差异阈值时，维持所述行为预测模型。

所述对所述行为预测模型进行更新，可以为重新获取新预设历史时间段内的行为数据，也可以继续获取原预设历史时间段后的行为数据，诸如原预设历史时间段为用户近一年的行为数据，对所述近一年的行为数据进行训练获得行为预测模型，经判断得知该行为预测模型的差异值大于差异阈值，即预测准确率不高，可以重新设立一历史时间段，诸如用户近两年的行为数据，基于所述用户近两年的行为数据重新训练，直到差异值小于或等于差异阈值为止，停止训练，获得满足预设条件的行为预测模型；也可以继续重复获取近一年后的行为数据并重复上述步骤，差异值小于或等于差异阈值为止，停止训练，获得满足预设条件的行为预测模型。

所述交叉熵损失函数为

由上可知，本申请实施例提供的模型训练装置300，包括：第一获取模块，用于获取用户的历史行为数据；数据划分模块，用于将所述历史行为数据划分为多个数据段，每一数据段对应一时间段；第二获取模块，用于根据所述每一数据段获取至少一个行为向量；数据集合模块，用于将所述多个数据段的行为向量按照时间先后排列，集合形成训练数据；训练模块，用于将所述训练数据输入到时间序列模型中进行训练，得到行为预测模型。所述模型训练装置可以根据用户的历史行为数据进行训练，获得行为预测模型，所述行为预测模型可以对用户在未来时间段的行为进行预测，从而使得电子设备可以根据预测结果为用户提供更贴切和个性化的服务推荐。

本申请实施例还提供一种电子设备。所述电子设备可以为智能手机、平板电脑、游戏设备、AR(Augmented Reality，增强现实)设备、汽车、数据存储装置、音频播放装置、视频播放装置、笔记本电脑、桌面计算设备、可穿戴设备诸如电子手表、电子眼镜、电子头盔、电子手链、电子项链、电子衣物等设备。

参考图13，图13为本申请实施例提供的电子设备的第一种结构示意图。

其中，电子设备400包括处理器401和存储器402。其中，处理器401与存储器402电性连接。

处理器401是电子设备400的控制中心，利用各种接口和线路连接整个电子设备的各个部分，通过运行或调用存储在存储器402内的计算机程序，以及调用存储在存储器402内的数据，执行电子设备的各种功能和处理数据，从而对电子设备进行整体监控。

在本实施例中，电子设备400中的处理器401会按照如下的步骤，将一个或一个以上的计算机程序的进程对应的指令加载到存储器402中，并由处理器401来运行存储在存储器402中的计算机程序，从而实现各种功能：

获取用户的历史行为数据；

根据所述每一数据段获取至少一个行为向量；

在一些实施例中，根据所述每一数据段获取至少一个行为向量时，处理器401用于执行以下步骤：

根据所述每一数据段中的数据类型选择对应的特征提取模型；

在一些实施例中，对所述训练数据输入到时间序列模型中进行训练，得到行为预测模型步骤之前，处理器401用于执行以下步骤：

对所述训练数据中的每一行为向量进行数据维度对齐处理，以使得处理后的所述每一行为向量的特征数量相等。

在一些实施例中，对所述训练数据中的每一行为向量进行数据维度对齐处理，以使得处理后的所述每一行为向量的特征数量相等时，处理器301用于执行以下步骤：

依次计算每一行为向量中的特征数量，得到最大特征数量；

在一些实施例中，将所述多个数据段的行为向量按照时间先后排列，集合形成训练数据之前，处理器401用于执行以下步骤：

为所述每一行为向量设置一行为类别标签。

在一些实施例中，用所述行为预测模型预测用户在未来时间段的行为之后，处理器401还通过调用所述存储器中存储的所述计算机程序，用于执行以下步骤：

根据所述行为预测模型获取预设时间段的预测结果；

获取所述预设时间段的真实结果；

判断所述差异值是否大于差异阈值；

当所述差异值大于所述差异阈值时，对所述行为预测模型进行更新；

当所述差异值小于或等于所述差异阈值时，维持所述行为预测模型。

存储器402可用于存储计算机程序和数据。存储器402存储的计算机程序中包含有可在处理器中执行的指令。计算机程序可以组成各种功能模块。处理器401通过调用存储在存储器402的计算机程序，从而执行各种功能应用以及数据处理。

在一些实施例中，参考图14，图14为本申请实施例提供的电子设备300的第二种结构示意图。

其中，电子设备400还包括：显示屏403、控制电路404、输入单元405、传感器406以及电源407。其中，处理器401分别与显示屏403、控制电路404、输入单元405、传感器406以及电源407电性连接。

显示屏403可用于显示由用户输入的信息或提供给用户的信息以及电子设备的各种图形用户接口，这些图形用户接口可以由图像、文本、图标、视频和其任意组合来构成。

控制电路404与显示屏403电性连接，用于控制显示屏403显示信息。

输入模块405可用于接收输入的数字、字符信息或用户特征信息(例如指纹)，以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。其中，输入模块405可以包括指纹识别模组。

传感器406用于采集电子设备自身的信息或者用户的信息或者外部环境信息。例如，传感器406可以包括距离传感器、磁场传感器、光线传感器、加速度传感器、指纹传感器、霍尔传感器、位置传感器、陀螺仪、惯性传感器、姿态感应器、气压计、心率传感器等多个传感器。

电源407用于给电子设备400的各个部件供电。在一些实施例中，电源407可以通过电源管理系统与处理器401逻辑相连，从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。

尽管图14中未示出，电子设备400还可以包括摄像头、蓝牙模块等，在此不再赘述。

由上可知，本申请实施例提供了一种电子设备，所述电子设备执行以下步骤：获取用户的历史行为数据；将所述历史行为数据划分为多个数据段，每一数据段对应一时间段；根据所述每一数据段获取至少一个行为向量；将所述多个数据段的行为向量按照时间先后排列，集合形成训练数据；将所述训练数据输入到时间序列模型中进行训练，得到行为预测模型；利用所述行为预测模型预测用户在未来时间段的行为。所述电子设备可以根据用户的历史行为数据进行训练，获得行为预测模型，所述行为预测模型可以对用户在未来时间段的行为进行预测，从而使得电子设备可以根据预测结果为用户提供更贴切和个性化的服务推荐。

本申请实施例还提供一种存储介质，所述存储介质中存储有计算机程序，当所述计算机程序在计算机上运行时，所述计算机执行上述任一实施例所述的场景识别方法。

例如，在一些实施例中，当所述计算机程序在计算机上运行时，所述计算机执行以下步骤：

获取用户的历史行为数据；

根据所述每一数据段获取至少一个行为向量；

需要说明的是，本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过计算机程序来指令相关的硬件来完成，所述计算机程序可以存储于计算机可读存储介质中，所述存储介质可以包括但不限于：只读存储器(ROM，Read OnlyMemory)、随机存取存储器(RAM，Random Access Memory)、磁盘或光盘等。

以上对本申请实施例所提供的用户行为预测方法、装置、存储介质及电子设备进行了详细介绍。本文中应用了具体个例对本申请的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本申请的方法及其核心思想；同时，对于本领域的技术人员，依据本申请的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本申请的限制。

Claims

1.一种模型训练方法，其特征在于，包括：

获取用户的历史行为数据；

根据所述每一数据段获取至少一个行为向量；

2.根据权利要求1所述的模型训练方法，其特征在于，根据所述每一数据段获取至少一个行为向量，包括：

通过所述特征提取模型从所述数据段中提取出多个特征；

3.根据权利要求1所述的模型训练方法，其特征在于，所述训练数据输入到时间序列模型中进行训练，得到行为预测模型步骤之前，包括：

4.根据权利要求3所述的模型训练方法，其特征在于，对所述训练数据中的每一行为向量进行数据维度对齐处理，以使得处理后的所述每一行为向量的特征数量相等，包括：

依次计算每一行为向量中的特征数量，得到最大特征数量；

5.根据权利要求1所述的模型训练方法，其特征在于，将所述多个数据段的行为向量按照时间先后排列，集合形成训练数据之前，包括：

为每一所述行为向量设置一行为类别标签。

6.根据权利要求1所述的模型训练方法，其特征在于，所述将所述训练数据输入到时间序列模型中进行训练，得到行为预测模型之后，包括：

根据所述行为预测模型获取所述预设时间段的预测结果；

获取所述预设时间段的真实结果；

判断所述差异值是否大于差异阈值；

7.一种行为预测方法，其特征在于，包括：

接收用户行为的预测请求；

根据所述预测请求获取预设时间段；

其中，所述行为预测模型根据用户的历史行为数据和时间序列模型进行模型训练得到。

8.根据权利要求7所述的行为预测方法，其特征在于，所述根据所述预设时间段和预先训练好的行为预测模型，预测所述预设时间段的用户行为，包括：

在所述行为预测模型中输入所述预设时间段；

根据所述预设时间段匹配到至少一个目标行为向量；

获取所述目标行为向量对应的目标行为类别标签；

根据所述目标行为类别标签输出预设时间段的用户行为。

9.一种模型训练装置，其特征在于，所述装置包括：

第一获取模块，用于获取用户的历史行为数据；

10.根据权利要求9所述的模型训练装置，其特征在于，还包括数据处理模块，所述数据处理模块用于：

11.根据权利要求9所述的模型训练装置，其特征在于，还包括标签设置模块，所述标签设置模块用于为所述每一行为向量设置一行为类别标签。

12.根据权利要求9所述的模型训练装置模型训练装置，其特征在于，还包括结果评价模块，所述结果评价模块用于执行以下步骤：

根据所述行为预测模型获取所述预设时间段的预测结果；

获取所述预设时间段的真实结果；

采用交叉熵损失函数计算预测结果和真实结果之间的差异值；

判断所述差异值是否大于差异阈值；

13.一种存储介质，其特征在于，所述存储介质中存储有计算机程序，当所述计算机程序在计算机上运行时，实现如权利要求1至6中的任意一项所述的模型训练方法。

14.一种电子设备，其特征在于，所述电子设备包括处理器和存储器，所述存储器中存储有计算机程序，所述处理器通过调用所述存储器中存储的所述计算机程序实现如权利要求1至6中的任意一项所述的模型训练方法。