CN110705646B

CN110705646B - 一种基于模型动态更新的移动设备流式数据识别方法

Info

Publication number: CN110705646B
Application number: CN201910953689.2A
Authority: CN
Inventors: 詹德川; 杨杨; 周大蔚; 姜�远
Original assignee: Nanjing University
Current assignee: Nanjing University
Priority date: 2019-10-09
Filing date: 2019-10-09
Publication date: 2021-11-23
Anticipated expiration: 2039-10-09
Also published as: CN110705646A

Abstract

本发明公开一种基于模型动态更新的移动设备流式数据识别方法，包括增量模型的设计、训练和识别方法；对于资源受限环境下的模型训练需求（如手机等移动设备），环境中可训练的模型大小有限。本方法首先基于开放动态数据的特征，按照时序对设备数据进行采集，然后以在线学习的方式对数据进行学习，处理完即丢弃数据，以减少内存消耗，最后在实际使用中使用训练完毕的分类器，能够对开放动态环境下不同时序的输入数据均得到较好的分类结果。本发明的方法实施过程中占用资源少，且对于开放动态环境的数据鲁棒性强，易于部署。

Description

一种基于模型动态更新的移动设备流式数据识别方法

技术领域

本发明涉及开放动态环境下流式数据的学习技术，特别涉及一种利用个人手持移动设备如智能手机、PDA等对开放动态环境下的流式数据如时序图片分类的方法；本发明能够在开放动态环境下出现概念飘移时固定模型的重要参数，使得能够使用单个模型应对不同概念下的时序样本。

背景技术

目前，开放动态环境下的数据分类和回归已经成为热点问题，由于在开放动态环境下存在的概念飘移问题，随着流式数据不断地到来，模型对新概念的学习将会导致对旧概念的遗忘——此时如果需要模型对时序较前的数据进行分类，则模型倾向于记住最新的概念下的分类结果，而对旧概念下的一些样本无法给出正确的预测。例如，在时序图片的分类问题中存在着类似问题，前一批数据是以往款式的商品，随着时间流逝，新一批款式的商品逐渐出现，我们需要模型能够同时记住两个概念，即对新旧款式商品的图像均能给出正确的预测。然而在开放动态环境下，模型接受的流式数据样本无法被保存，我们在第二阶段只能对时序最新的图片样本进行学习，这样会导致模型学得的概念偏向第二阶段，如果此时想使用模型对第一阶段的图片进行分类，则准确率会相较于第一阶段差很多。另一个例子是应用推荐问题，人们的行为特征会随着时间逐渐变化，上一个时间段的用户对应用的行为特征和下一时间段的行为特征可能存在偏差，我们希望学得的单个模型能够对多个不同的用户群体均能够较好地推荐应用，而不希望模型在这种情况下随着时间流的变化只能学得最新的用户需求。

当前解决概念飘移下遗忘问题的方法可以分为两类：基于时间窗格对流式数据批处理的方法和基于扩充网络结构/扩充模型数目的方法。前者只适合训练简单的线性模型，无法适应处理大规模数据如图片分类问题和语音识别问题。后者虽然可以适用于大规模模型的训练，然而在某些资源受限环境下，如手持移动设备的训练需求，设备受制于计算资源，无法同时训练/存储大量样本与模型，所以不具备普遍适用性。

具有无线接入、信息管理并装载开放性操作系统的手持移动设备如智能手机近年来得到了极大的发展。特别是，随着5G通信的蓬勃发展，大部分移动设备可以以较高的速率和和较小的延迟接受外界输送的流式数据，如声音、图像的采集；另一方面，通信的高速发展使得传输延迟大大降低，某些需要极小延迟的预测问题，如流量预测中的流量信息可以以较小延迟输送到移动设备上进行训练和预测。因此，需要一种综合利用资源受限设备在开放动态环境下训练和预测样本的方法。

发明内容

发明目的：目前的开放动态环境下解决模型遗忘问题的方法往往不能解决大规模样本的学习问题，或者占用大量资源或者不具备普适性，无法在资源受限环境下部署。针对上述问题，本发明提供一种基于模型动态更新的移动设备流式数据识别方法。具体来说，首先对于开放动态环境下的流式数据样本，如时序图片，流量预测样本，通过通信模块发送到移动设备进行收集，然后采用能够利用模型内置的多层输出和注意力机制的学习方法对样本进行分类学习，最后在实际使用中利用训练完毕的分类器对新到来的不同时序下的数据进行分类和识别。

技术方案：一种基于模型动态更新的移动设备流式数据识别方法，其特征在于：包括增量模型训练步骤和增量模型识别步骤；

所述增量模型训练步骤具体为：

步骤100，初始化移动设备、待训练模型、参数重要性矩阵；

步骤101，通过移动设备通信模块接受外界开放动态环境下的图片样本，进行数据预处理；所述图片样本数据为多个时间段内的流式数据，由于时间跨度产生了概念飘移现象，使得图片分布产生变化；

步骤102，对于步骤100中的模型和步骤101中预处理后的数据，使用方法设计的损失函数对模型中的重要参数进行约束，损失函数由两部分构成，第一部分为预测结果对标记的交叉熵损失，用于强化分类器的学习能力；第二部分为当前模型对上一概念下的飘移量与参数重要性的乘积，用于固定模型之前已学得的概念，并将两部分的损失进行加权，以对模型进行训练；

步骤103，单个图片样本训练结束后即从内存中删除，以减少内存消耗，更新当前概念下的参数重要性矩阵，更新依据为，由模型对当前样本训练产生的交叉熵损失作用在当前参数上的梯度作为该参数的重要性量化结果；

步骤104，判断是否出现概念漂移现象，一般情况下按照时间戳划分不同概念，即认为同一天/周内的数据为同一概念。如果否，则继续使用当前模型继续对流式图片数据进行训练，转入步骤101；如果是，则将当前概念下积累的参数重要性矩阵固定到整个训练过程中的重要性矩阵中，并在新的概念下使用更新后的参数重要性矩阵进行训练，在更新参数重要性矩阵后转入步骤101，如果流式数据完全结束，则模型训练完毕，并取得识别模型M。

识别装置的识别步骤具体为：

步骤200，初始化移动设备；

步骤201，将移动设备内置传感器在线采集的信息进行数据预处理；

步骤202，使用识别模型M对预处理后的开放动态环境下的图片样本进行分类，判断后输出目前时刻图片样本所属的类别。

所述移动设备内置传感器包括加速度传感器、方向传感器、光线传感器等实时数据。

所述流式图片样本数据离线或者在线采集信息之前，还包括检测移动设备内置通信元件是否能正常工作的步骤，如果正常工作，则接收外界的流式数据；如果出现故障，则提示用户。

所述数据预处理，包括对接收到的信息进行信号滤波、去噪、缺失传感器数据填补的处理。

所述识别模型M训练工作流程为：本方法仅利用单个模型M对图片样本学习和分类——首先利用有标记的图片样本信息训练分类器M，M是一个多层的人工神经网络，它在每层均连有输出单元，可分别独立做出预测。在训练过程中通过参数重要性约束矩阵对之前阶段的图片数据知识固定，以防止在开放动态环境下概念飘移导致的模型遗忘；同时利用注意力机制对不同层次的输出结果进行加权，以体现模型对不同概念下图片数据的先验倾向；训练结束后使用模型M对未知时序的图片样本进行预测，模型将能够对不同概念下属于同一类的图片样本均正确地进行分类。

有益效果：与现有技术相比，模型不仅能够对于大规模样本进行学习，同时能够利用受限资源对模型进行训练，而不需利用大量计算资源。本发明的方法实施过程中占用资源少，且对于开放动态环境的数据鲁棒性强，易于部署，适用性强。

附图说明

图1为本发明实施例的模型训练工作流程图；

图2为本发明实施例的模型识别工作流程图。

具体实施方式

下面结合具体实施例，进一步阐明本发明，应理解这些实施例仅用于说明本发明而不用于限制本发明的范围，在阅读了本发明之后，本领域技术人员对本发明的各种等价形式的修改均落于本申请所附权利要求所限定的范围。

基于模型动态更新的移动设备流式数据识别方法的训练阶段工作流程如图1所示。手持设备在训练阶段需要收集一定数量的带标记的流式图片数据样本用于训练，对于分类任务，需要得到图片样本所属的具体类别，如植物，动物，建筑物等。具体来说，首先初始化移动设备、待训练的分类模型和参数重要性矩阵（步骤10）；然后有线或者无线（例如WIFI、蓝牙）接收流式图片样本，并进行数据预处理（信号滤波，去噪，缺失传感器数据填补，步骤11）；使用模型和参数重要性矩阵协同对该图片样本进行训练（步骤12），在单个图片样本训练结束后，即删除该图片样本，以节约存储消耗（步骤13）；判断是否出现概念飘移现象（步骤14），如果否，则继续回到训练阶段（步骤11）继续训练之后的图片样本；如果是，则转入步骤15——判断是否训练结束，如果此时训练结束，则输出模型M（步骤17），否则固定当前概念的参数重要性矩阵（步骤16），并继续回到步骤11，训练之后下一个概念内的样本。

基于模型动态更新的移动设备流式数据识别方法的识别阶段工作流程如图2所示。首先初始化移动设备（步骤20）；然后接收开放动态环境下的图片样本，并进行预处理（步骤21）；使用之前训练完毕的模型M对样本进行分类（步骤22），判断后输出目前输入样本的类别（步骤23）。使用模型M对图片分类的过程为：将图片输入到分类模型，模型作为一个包含多个隐含层的深度神经网络，在每个隐含层均单独连接预测层，模型将预测的分类结果输入到注意力网络，得到不同输出结果的标量权重，并进行加权，即对每个隐含层的预测结果进行线性组合，以最终所有隐含层的预测结果的线性加权作为最终输出。

Claims

1.一种基于模型动态更新的移动设备流式数据识别方法，其特征在于：包括增量模型训练步骤和增量模型识别步骤；

所述增量模型训练步骤具体为：

步骤100，初始化移动设备、训练模型、参数重要性矩阵；

步骤101，移动设备接收开放动态环境下的流式图片样本，进行数据预处理；

步骤102，对于步骤100中的模型和步骤101中处理后的数据，使用方法设计的损失函数对模型中的重要参数进行约束，同时进行训练；

步骤103，单个图片样本训练结束后即从内存中删除，以减少内存消耗，更新当前概念下的参数重要性矩阵；

步骤104，判断是否出现概念漂移现象，如果否，则继续使用当前模型继续对流式图片数据进行训练；如果是，则将当前概念下积累的参数重要性矩阵固定到整个训练过程中的重要性矩阵中，并在新的概念下使用更新后的参数重要性矩阵进行训练，在更新参数重要性矩阵后转入步骤101；如果流式数据完全结束，则模型训练完毕，并取得识别模型M；

识别装置的识别步骤具体为：

步骤200，初始化移动设备；

步骤201，移动设备接收开放动态环境下的流数据图片样本，进行数据预处理；

步骤202，使用识别模型M对预处理后的图片样本进行分类，判断后输出目前时刻流式图片数据所属的类别；

所述识别模型M训练工作流程为：利用单个模型M对图片样本学习和分类——首先利用有标记的样本信息训练分类器M，M是一个多层的人工神经网络，它在每层均连有输出单元，可分别独立做出预测；在训练过程中通过参数重要性约束矩阵对之前阶段的流数据知识固定，以防止在开放动态环境下概念飘移导致的模型遗忘；同时利用注意力机制对不同层次的输出结果进行加权，以体现模型对不同概念下数据的先验倾向；训练结束后使用模型M对未知时序的样本进行预测，模型将能够对不同概念下属于同一类的图片样本均正确地进行分类。

2.如权利要求1所述的利用移动设备对开放动态环境下流式数据识别的方法，其特征在于：所述流式数据离线或者在线采集信息之前，还包括检测移动设备内置通信元件是否能正常工作的步骤，如果正常工作，则接收外界的流式数据；如果出现故障，则提示用户。

3.如权利要求1所述的利用移动设备对开放动态环境下流式数据识别的方法，其特征在于：所述数据预处理，包括对接收到的信息进行信号滤波、去噪、缺失传感器数据填补的处理。

4.如权利要求1所述的利用移动设备对开放动态环境下流式数据识别的方法，其特征在于：所述图片样本数据为多个时间段内的流式数据，由于时间跨度产生了概念飘移现象，使得图片分布产生变化。