WO2021180243A1

WO2021180243A1 - 基于机器学习的图像信息识别的优化方法及装置

Info

Publication number: WO2021180243A1
Application number: PCT/CN2021/083875
Authority: WO
Inventors: 张国辉; 姜禹; 宋晨
Original assignee: 平安科技（深圳）有限公司
Priority date: 2020-11-02
Filing date: 2021-03-30
Publication date: 2021-09-16
Also published as: CN112308149B; CN112308149A

Abstract

一种基于机器学习的图像信息识别的优化方法及装置，涉及数据处理技术领域，主要目的在于解决现有处于局部最优或鞍点的深度学习模型对图片信息进行识别，影响对图像信息识别的准确性，导致图像信息识别效率较低，影响基于机器学习的图像信息的识别效果的问题。包括：获取主任务图像训练样本集以及至少一个分支任务图像训练样本集（S101）；基于所述主任务图像训练样本集、所述分支任务图像训练样本集对预设深度学习模型执行主任务训练及分支任务训练相切换的训练处理（S102）；基于完成训练的预设深度学习模型，对待识别的图像信息进行识别处理，得到所述图像信息的识别结果（S103）。

Description

基于机器学习的图像信息识别的优化方法及装置

本申请要求于2020年11月2日提交中国专利局、申请号为202011201765.3，发明名称为“基于机器学习的图像信息识别的优化方法及装置”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及一种数据处理技术领域，特别是涉及一种基于机器学习的图像信息识别的优化方法及装置。

背景技术

随着机器学习的快速发展，机器学习已经成为对数据处理的基础，尤其是利用深度学习模型来对图像信息进行处理。

目前，发明人意识到，现有的利用深度学习模型对图片信息进行处理前，对于深度学习模型的训练过程会选取特定的训练数据对深度学习模型进行训练，例如，作为一个训练任务的一个训练数据集对深度学习模型进行训练，且作为深度学习模型训练是否完成的一个判断依据的损失函数loss在不变化时，说明深度学习模型完成训练，可以表征为深度学习模型陷入局部最优解，或者处于鞍点，即深度学习模型的一阶导数等于零，深度学习模型无法在继续优化，但是此时对于深度学习模型来说，并没有完成最优的训练，利用此时的深度学习模型进行图像信息的识别，会影响对图像信息识别的准确性，导致图像信息识别效率较低，从而影响基于机器学习的图像信息的识别效果。

技术问题

有鉴于此，本申请提供一种基于机器学习的图像信息识别的优化方法及装置，主要目的在于解决现有处于局部最优或鞍点的深度学习模型对图片信息进行识别，影响对图像信息识别的准确性，导致图像信息识别效率较低，从而影响基于机器学习的图像信息的识别效果的问题。

技术解决方案

依据本申请一个方面，提供了一种基于机器学习的图像信息识别的优化方法，包括：获取主任务图像训练样本集以及至少一个分支任务图像训练样本集，所述主任务图像训练样本集与所述分支任务图像训练样本集相匹配；基于所述主任务图像训练样本集、所述分支任务图像训练样本集对预设深度学习模型执行主任务训练及分支任务训练相切换的训练处理，以使根据模型精度、损失值确定所述预设深度学习模型处于非局部最优、和/或非鞍点状态下完成训练处理；基于完成训练的预设深度学习模型，对待识别的图像信息进行识别处理，得到所述图像信息的识别结果。

依据本申请另一个方面，提供了一种基于机器学习的图像信息识别的优化装置，包括：获取模块，用于获取主任务图像训练样本集以及至少一个分支任务图像训练样本集，所述主任务图像训练样本集与所述分支任务图像训练样本集相匹配；训练模块，用于基于所述主任务图像训练样本集、所述分支任务图像训练样本集对预设深度学习模型执行主任务训练及分支任务训练相切换的训练处理，以使根据模型精度、损失值确定所述预设深度学习模型处于非局部最优、和/或非鞍点状态下完成训练处理；识别模块，用于基于完成训练的预设深度学习模型，对待识别的图像信息进行识别处理，得到所述图像信息的识别结果。

根据本申请的又一方面，提供了一种存储介质，所述存储介质中存储有至少一可执行指令，所述可执行指令使处理器执行以下方法：获取主任务图像训练样本集以及至少一个分支任务图像训练样本集，所述主任务图像训练样本集与所述分支任务图像训练样本集相匹配；基于所述主任务图像训练样本集、所述分支任务图像训练样本集对预设深度学习模型执行主任务训练及分支任务训练相切换的训练处理，以使根据模型精度、损失值确定所述预设深度学习模型处于非局部最优、和/或非鞍点状态下完成训练处理；基于完成训练的预设深度学习模型，对待识别的图像信息进行识别处理，得到所述图像信息的识别结果。

根据本申请的再一方面，提供了一种计算机设备，包括：处理器、存储器、通信接口和通信总线，所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信；所述存储器用于存放至少一可执行指令，所述可执行指令使所述处理器执行以下方法：获取主任务图像训练样本集以及至少一个分支任务图像训练样本集，所述主任务图像训练样本集与所述分支任务图像训练样本集相匹配；基于所述主任务图像训练样本集、所述分支任务图像训练样本集对预设深度学习模型执行主任务训练及分支任务训练相切换的训练处理，以使根据模型精度、损失值确定所述预设深度学习模型处于非局部最优、和/或非鞍点状态下完成训练处理；基于完成训练的预设深度学习模型，对待识别的图像信息进行识别处理，得到所述图像信息的识别结果。

有益效果

本申请有助于避免因对深度学习模型进行模型训练陷入局部最优或鞍点使得模型精度较差，大大提高了对深度学习模型的优化效果，并有效的解决了深度学习模型跳出不接最优的问题，从而实现了对图像信息进行识别时，基于机器学习的识别高精度的需求，提高图像信息的识别效率。

附图说明

图1示出了本申请实施例提供的一种基于机器学习的图像信息识别的优化方法流程图。

图2示出了本申请实施例提供的另一种基于机器学习的图像信息识别的优化方法流程图。

图3示出了本申请实施例提供的一种基于机器学习的图像信息识别的优化装置组成框图。

图4示出了本申请实施例提供的另一种基于机器学习的图像信息识别的优化装置组成框图。

图5示出了本申请实施例提供的一种计算机设备的结构示意图。

本发明的实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例，然而应当理解，可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本公开，并且能够将本公开的范围完整的传达给本领域的技术人员。

本申请的技术方案可涉及人工智能和/或大数据技术领域，如可具体涉及神经网络技术，以实现图像识别。可选的，本申请涉及的数据如训练样本和/或识别结果等可存储于数据库中，或者可以存储于区块链中，本申请不做限定。

本申请实施例提供了一种基于机器学习的图像信息识别的优化方法，如图1所示，该方法包括以下步骤。

101、获取主任务图像训练样本集以及至少一个分支任务图像训练样本集。

其中，主任务训练用于表征以主任务图像训练样本集为必须对预设深度学习模型执行的训练，分支任务训练用于表征以分支任务图像训练样本集为可选的对预设深度学习模型执行的训练，所述主任务图像训练样本集与所述分支任务图像训练样本集相匹配，具体的，对于图像信息的识别，根据图像信息的识别特征确定主任务图像训练样本集，以及至少一个分支任务图像训练样本集，从而实现以主任务训练为主要训练，以分支任务训练为辅助训练。另外，一个主任务图像训练样本集可以对应多个分支任务图像训练样本，根据不同的识别特征进行绑定对应关系，例如，识别特征为人脸年龄、人脸颜色、性别，则获取作为主任务训练的主任务图像训练样本集为人脸年龄，则分支任务图像训练样本集为人脸颜色、性别的图像信息集合，本申请实施例不做具体限定。

102、基于所述主任务图像训练样本集、所述分支任务图像训练样本集对预设深度学习模型执行主任务训练及分支任务训练相切换的训练处理。

其中，首先通过主任务图像训练样本对预设深度学习模型执行训练处理，然后当预设深度学习模型处于局部最优、和/或鞍点状态下切换为对已执行主任务训练的预设深度学习模型执行分支任务图像训练样本的分支任务训练处理，以使根据模型精度、损失值确定所述预设深度学习模型处于非局部最优、和/或非鞍点状态下完成训练处理。具体的，当基于分支任务训练的预设深度学习模型跳出局部最优、和/或鞍点状态，则重新执行主任务图像训练样本集的主任务训练，以完成预设深度学习模型的完整训练过程。

需要说明的是，由于分支任务训练可以为多个，因此，在切换分支任务训练时，可以按照预设的顺序对分支任务图像训练样本集进行分支任务训练。另外，本申请实施例中的预设深度学习模型为针对图像信息进行识别的模型，可以为神经网络模型、支持向量机模型等，不做具体限定。

103、基于完成训练的预设深度学习模型，对待识别的图像信息进行识别处理，得到所述图像信息的识别结果。

对于本申请实施例，为了当完成了对预设深度学习模型的训练后，此预设深度学习模型为处于非局部最优、和/或鞍点状态下图像识别精度达到预设精度阈值，因此，利用此预设深度学习模型对待识别的图像信息进行识别处理，大大提高了通过主任务、分支任务训练的机器学习模型对图像信息进行识别的识别精度，提高了模型训练的优化效果。

本申请实施例提供了一种基于机器学习的图像信息识别的优化方法。与现有技术相比，本申请实施例通过获取主任务图像训练样本集以及至少一个分支任务图像训练样本集，所述主任务图像训练样本集与所述分支任务图像训练样本集相匹配；基于所述主任务图像训练样本集、所述分支任务图像训练样本集对预设深度学习模型执行所述主任务训练及所述分支任务训练相切换的训练处理，以使根据模型精度、损失值确定所述预设深度学习模型处于非局部最优、和/或非鞍点状态下完成训练处理；基于完成训练的预设深度学习模型，对待识别的图像信息进行识别处理，得到所述图像信息的识别结果，避免因对深度学习模型进行模型训练陷入局部最优或鞍点使得模型精度较差，大大提高了对深度学习模型的优化效果，并有效的解决了深度学习模型跳出不接最优的问题，从而实现了对图像信息进行识别时，基于机器学习的识别高精度的需求，提高图像信息的识别效率。

本申请实施例提供了另一种基于机器学习的图像信息识别的优化方法，如图2所示，该方法包括以下步骤。

201、基于待训练的图像训练集中各图像信息的识别特征，构建一个主任务图像训练样本集，以及至少一个分支任务图像训练样本集。

对于本申请实施例，为了对图像信息的准确识别，并实现对预设深度学习模型的训练优化，基于各图像信息的识别特征，构建适用于预设深度学习模型的一个主任务图像训练样本集，以及至少一个分支任务图像训练样本集。其中，所述识别特征至少包括图像信息中五官特征、性别特征、年龄特征、表情特征、文字特征、数字特征之一，并且，对于主任务训练及分支任务训练的区分，主任务训练为需要对图像信息中进行分类识别的具体关键且必须特征的训练任务，例如人脸识别中，对于识别人脸年龄为主任务训练模型，分支任务训练为与主任务具有相关性的至少一个对图像信息中进行分类识别的非关键特征的训练任务。例如，若主任务训练为人脸年龄的训练任务，分支任务训练可以包括人脸颜色、性别识别的训练任务，或者在人脸识别模型训练时增加眉毛浓淡程度、鼻梁呈像的长宽比等的分支任务训练。因此，对于不同的主任务训练、分支任务训练，构建对应的训练样本。

具体的，本申请实施例中的一个实施场景中，图像信息以人脸识别为主要识别目标，因此，优选为识别出或者标记为五官特征的图像信息作为主任务图像训练样本集，将识别出或者标记为性别特征、年龄特征、表情特征、文字特征的图像信息作为分支任务图像训练样本集。

需要说明的是，对于分支任务图像训练样本集可以为一个、也可以为多个，对于分支任务图像训练样本集在针对主任务训练时可以使用，也可以不使用，例如，分支任务图像样本集包括a、b、c，对应的主任务图像训练样本集为S，当利用主任务图像训练样本集执行主任务训练处理后，预设深度学习模型陷入局部最优，则停止主任务训练，通过分支任务图像样本集a对已执行主任务训练的预设深度学习模型执行分支任务训练处理，当进行分支任务训练的预设深度学习模型跳出局部最优后，重新利用主任务图像训练样本集进行训练，当达到训练目标后，不再执行分支任务图像样本集b、c，本申请实施例不做具体限定。

202、获取主任务图像训练样本集以及至少一个分支任务图像训练样本集。

203、当执行主任务训练处理的所述预设深度学习模型处于局部最优、和/或鞍点状态，则根据与所述主任务图像训练样本集匹配的分支任务图像训练样本集对已执行主任务训练处理的所述预设深度学习模型执行分支任务训练处理。

对于本申请实施例，所述局部最优、鞍点状态用于表征预设深度学习模型的训练处于停滞状态，无法继续通过训练模型得到匹配训练目标，因此，此时需要利用分支任务图像样本集对此预设深度学习模型执行分支任务训练处理。即当主任务训练陷入局部最优，通过分支任务训练使得预设深度学习模型的权重进行更新，从而跳出局部最优。对于分支任务训练的选取和执行顺序，可以按照随机选取一个分支任务图像训练样本集训练一次，进行一定次数的分支任务训练的迭代后，进行主任务训练的执行，本申请实施例不做具体限定。

需要说明的是，主任务训练与分支任务训练的训练过程仅仅区别与训练样本集的不同，对于预设深度学习模型的训练步骤，完全相同，本申请实施例不做具体限定。

进一步地，为了实现对执行图像信息识别的机器学习模型的训练优化，步骤203之前，还包括：基于对执行主任务训练处理的所述预设深度学习模型的模型精度、损失值进行递归计算，当所述模型精度、损失值不变时，确定执行主任务训练处理的所述预设深度学习模型处于局部最优、和/或鞍点状态，所述预设深度学习模型为神经网络模型。

本申请实施例中，为了确定预设深度学习模型是否处于局部最优、鞍点状态，通过递归计算执行主任务训练处理的预设深度学习模型的模型精度、损失值，当模型精度、损失值不变，则说明预设深度学习模型处于局部最优、鞍点状态。具体的，为了实现对机器学习模型的优化目的，并结合图像信息识别场景，本申请实施例中，预设深度学习模型为神经网络模型。针对神经网络模型而言，当损失值loss或模型精度acc不变时，说明神经网络模型的一阶导数都为零，不能再继续进行梯度下降，即神经网络模型不能继续优化，处于局部最优，存在鞍点。

需要说明的是，损失函数是用来评估模型的预测值与真实值之间的差异程度，计算得到损失值。另外，损失函数也是神经网络中优化的目标函数，神经网络训练或者优化的过程就是最小化损失函数的过程，损失函数越小，说明神经网络模型的预测值就越接近真实值，准确性也就越好。由于本申请实施例中仅仅是计算神经网络模型的损失值或模型精度，以便确定是否进入分支任务，因此，本申请实施例中，对于神经网络的层数不做具体限定，可以为一层，也可以为多层，例如，对于一层神经网络，若干个输入和一个输出的感知机模型。损失函数可以为平方损失函数，对数损失函数、交叉熵损失函数等不同形式的损失函数，以计算出神经网络的损失值，本申请实施例不做具体限定。

204、当执行分支任务训练处理的所述预设深度学习模型跳出所述局部最优以及所述鞍点状态，则根据所述主任务图像训练样本集对所述预设深度学习模型重新执行主任务训练处理。

对于本申请实施例，由于处于局部最优、鞍点状态的判断为基于损失值以及模型精度，对应的，配置跳出局部最优、鞍点状态的判断依据为符合预设损失阈值，或者到达预设训练时间、迭代次数，确定为跳出局部最优、鞍点状态。因此，停止分支任务训练，通过主任务图像训练样本集对已进行分支任务训练的神经网络模型重新执行主任务训练处理。

需要说明的是，在特征不够明显的样本分类任务中，神经网络模型收敛速度慢，需要大量神经元去拟合相似的特征，使得在初始阶段的分支任务训练过程中要迭代次数尽量少，进而，还可以设定迭代次数为停止条件，例如分支任务迭代10次后继续主任务的训练。在特征比较鲜明或者样本量足够大的训练任务中，网络收敛速度足够快，不需要特别考虑权重偏移的问题，这时可以利用预设训练时间、预设损失阈值进行判断。

205、当重新执行主任务训练处理的所述预设深度学习模型的模型精度匹配预设精度阈值时，确定完成所述预设深度学习模型的训练。

对于本申请实施例，为了实现对模型训练的优化，以满足训练过程的完成需求，当重新执行主任务训练处理的神经网络模型的模型精度匹配预设精度阈值时，则确定此时的神经网络模型为完成训练处理。

进一步地，为了实现对机器学习模型的优化为可循环、可迭代的过程，从而满足对图像信息进行识别时，利用已优化的预设深度学习模型进行识别的高精度需求，本申请实施例中还包括：当重新执行主任务训练处理后，所述所述预设深度学习模型处于局部最优、和/或鞍点状态，则再次基于所述分支任务图像训练样本集重新对所述预设深度学习模型执行分支任务训练处理的步骤；当执行分支任务训练处理的所述预设深度学习模型跳出所述局部最优以及所述鞍点状态后，再次执行根据所述主任务图像训练样本集对所述预设深度学习模型重新执行主任务训练处理的步骤，直至所述预设深度学习模型的模型精度匹配预设精度阈值确定完成所述预设深度学习模型的训练。

具体的，为了避免在进行分支任务训练后重新执行主任务训练的预设深度学习模型再次陷入局部最优、鞍点状态，则当重新执行主任务训练处理的预设深度学习模型处于局部最优、鞍点状态时，再次利用分支任务图像训练样本集重新执行分支任务训练处理，当跳出局部最优后，再一次执行主任务训练，以此循环，直至对预设深度学习模型执行的主任务训练时，模型精度匹配预设精度阈值，则确定完成预设深度学习模型的训练。另外，对于再次执行分支任务训练的分支任务图像样本集的选取，可以依照预设的顺序依次进行。例如，分支任务图像样本集包括a、b、c，对应的主任务图像训练样本集为S，当利用主任务图像训练样本集执行主任务训练处理后，预设深度学习模型陷入局部最优，则停止主任务训练，通过分支任务图像样本集a对已执行主任务训练的预设深度学习模型执行分支任务训练处理，当进行分支任务训练的预设深度学习模型跳出局部最优后，重新利用主任务图像训练样本集进行训练，当再次处于局部最优、或鞍点时，停止主任务训练的执行，并利用分支任务图像样本集b对重新执行主任务训练的预设深度学习模型再次执行分支任务训练，当利用预设损失阈值、或迭代次数、训练时间确定跳出局部最优、鞍点状态时，重新执行主任务训练，以此循环，直至执行主任务训练的预设深度学习模型完成训练。

206、基于完成训练的预设深度学习模型，对待识别的图像信息进行识别处理，得到所述图像信息的识别结果。

具体的，本申请实施例中，对于完成训练的神经网络模型，适用但不限定于人脸图像信息、卡证图像信息进行分类识别，例如可以在卡证鉴伪系统中判断18版香港身份证中全息图是否存在，还可以增加相应区域图像是否高亮、颜色鲜艳程度、底色是否符合正常背景识别。

进一步地，为了提高利用主任训练、分支任务训练进行切换训练实现图像信息识别的准确性，所述方法还包括：解析得到所述图像信息的识别结果，基于解析出的识别特征对所述主任务图像训练样本集、所述分支任务图像训练样本集进行更新。

具体的，对于图像信息的识别结果中包含有对图像信息进行识别特征的分类，因此，作为对图像训练集的补充及优化，基于解析识别结果中的识别特征对主任务图像训练样本集、分支任务图像训练样本集进行更新。更新包括对相同图像信息不同识别特征的删除、合并、替换等，根据图像训练集中图像信息的个数确定具体的更新方式，本申请实施例不做具体限定。

本申请实施例提供了另一种基于机器学习的图像信息识别的优化方法。与现有技术相比，本申请实施例通过获取主任务图像训练样本集以及至少一个分支任务图像训练样本集，所述主任务图像训练样本集与所述分支任务图像训练样本集相匹配；基于所述主任务图像训练样本集、所述分支任务图像训练样本集对预设深度学习模型执行所述主任务训练及所述分支任务训练相切换的训练处理，以使根据模型精度、损失值确定所述预设深度学习模型处于非局部最优、和/或非鞍点状态下完成训练处理；基于完成训练的预设深度学习模型，对待识别的图像信息进行识别处理，得到所述图像信息的识别结果，避免因对深度学习模型进行模型训练陷入局部最优或鞍点使得模型精度较差，大大提高了对深度学习模型的优化效果，并有效的解决了深度学习模型跳出不接最优的问题，从而实现了对图像信息进行识别时，基于机器学习的识别高精度的需求，提高图像信息的识别效率。

进一步的，作为对上述图1所示方法的实现，本申请实施例提供了一种基于机器学习的图像信息识别的优化装置，如图3所示，该装置包括：获取模块31，用于获取主任务图像训练样本集以及至少一个分支任务图像训练样本集，所述主任务图像训练样本集与所述分支任务图像训练样本集相匹配；训练模块32，用于基于所述主任务图像训练样本集、所述分支任务图像训练样本集对预设深度学习模型执行所述主任务训练及所述分支任务训练相切换的训练处理，以使根据模型精度、损失值确定所述预设深度学习模型处于非局部最优、和/或非鞍点状态下完成训练处理；识别模块33，用于基于完成训练的预设深度学习模型，对待识别的图像信息进行识别处理，得到所述图像信息的识别结果。

本申请实施例提供了一种基于机器学习的图像信息识别的优化装置。与现有技术相比，本申请实施例通过获取主任务图像训练样本集以及至少一个分支任务图像训练样本集，所述主任务图像训练样本集与所述分支任务图像训练样本集相匹配；基于所述主任务图像训练样本集、所述分支任务图像训练样本集对预设深度学习模型执行所述主任务训练及所述分支任务训练相切换的训练处理，以使根据模型精度、损失值确定所述预设深度学习模型处于非局部最优、和/或非鞍点状态下完成训练处理；基于完成训练的预设深度学习模型，对待识别的图像信息进行识别处理，得到所述图像信息的识别结果，避免因对深度学习模型进行模型训练陷入局部最优或鞍点使得模型精度较差，大大提高了对深度学习模型的优化效果，并有效的解决了深度学习模型跳出不接最优的问题，从而实现了对图像信息进行识别时，基于机器学习的识别高精度的需求，提高图像信息的识别效率。

进一步的，作为对上述图2所示方法的实现，本申请实施例提供了另一种基于机器学习的图像信息识别的优化装置，如图4所示，该装置包括：获取模块41，用于获取主任务图像训练样本集以及至少一个分支任务图像训练样本集，所述主任务图像训练样本集与所述分支任务图像训练样本集相匹配；训练模块42，用于基于所述主任务图像训练样本集、所述分支任务图像训练样本集对预设深度学习模型执行所述主任务训练及所述分支任务训练相切换的训练处理，以使根据模型精度、损失值确定所述预设深度学习模型处于非局部最优、和/或非鞍点状态下完成训练处理；识别模块43，用于基于完成训练的预设深度学习模型，对待识别的图像信息进行识别处理，得到所述图像信息的识别结果。

进一步地，所述训练模块42包括：第一训练单元4201，用于当执行主任务训练处理的所述预设深度学习模型处于局部最优、和/或鞍点状态，则根据与所述主任务图像训练样本集匹配的分支任务图像训练样本集对已执行主任务训练处理的所述预设深度学习模型执行分支任务训练处理；第二训练单元4202，用于当执行分支任务训练处理的所述预设深度学习模型跳出所述局部最优以及所述鞍点状态，则根据所述主任务图像训练样本集对所述预设深度学习模型重新执行主任务训练处理；第一确定单元4203，用于当重新执行主任务训练处理的所述预设深度学习模型的模型精度匹配预设精度阈值时，确定完成所述预设深度学习模型的训练。

进一步地，所述第一训练单元4201，还用于当重新执行主任务训练处理后，所述所述预设深度学习模型处于局部最优、和/或鞍点状态，则再次基于所述分支任务图像训练样本集重新对所述预设深度学习模型执行分支任务训练处理的步骤；所述第二训练单元4202，还用于当执行分支任务训练处理的所述预设深度学习模型跳出所述局部最优以及所述鞍点状态后，再次执行根据所述主任务图像训练样本集对所述预设深度学习模型重新执行主任务训练处理的步骤，直至所述预设深度学习模型的模型精度匹配预设精度阈值确定完成所述预设深度学习模型的训练。

进一步地，所述第一训练单元4201，具体用于若所述分支任务图像训练样本集为多个时，基于所述分支任务图像训练样本集匹配的识别特征，以及识别特征与图像信息映射对应关系确定执行分支任务训练处理的顺序，并按照所述顺序对已执行主任务训练处理的所述预设深度学习模型执行多个分支任务训练处理。

进一步地，所述训练模块还包括：第二确定单元4204，用于基于对执行主任务训练处理的所述预设深度学习模型的模型精度、损失值进行递归计算，当所述模型精度、损失值不变时，确定执行主任务训练处理的所述预设深度学习模型处于局部最优、和/或鞍点状态，所述预设深度学习模型为神经网络模型。

进一步地，所述装置还包括：构建模块44，用于基于待训练的图像训练集中各图像信息的识别特征，构建一个主任务图像训练样本集，以及至少一个分支任务图像训练样本集，所述识别特征至少包括图像信息中五官特征、性别特征、年龄特征、表情特征、文字特征、数字特征之一。

进一步地，所述装置还包括：更新模块45，用于解析得到所述图像信息的识别结果，基于解析出的识别特征对所述主任务图像训练样本集、所述分支任务图像训练样本集进行更新。

本申请实施例提供了另一种基于机器学习的图像信息识别的优化装置。与现有技术相比，本申请实施例通过获取主任务图像训练样本集以及至少一个分支任务图像训练样本集，所述主任务图像训练样本集与所述分支任务图像训练样本集相匹配；基于所述主任务图像训练样本集、所述分支任务图像训练样本集对预设深度学习模型执行所述主任务训练及所述分支任务训练相切换的训练处理，以使根据模型精度、损失值确定所述预设深度学习模型处于非局部最优、和/或非鞍点状态下完成训练处理；基于完成训练的预设深度学习模型，对待识别的图像信息进行识别处理，得到所述图像信息的识别结果，避免因对深度学习模型进行模型训练陷入局部最优或鞍点使得模型精度较差，大大提高了对深度学习模型的优化效果，并有效的解决了深度学习模型跳出不接最优的问题，从而实现了对图像信息进行识别时，基于机器学习的识别高精度的需求，提高图像信息的识别效率。

根据本申请一个实施例提供了一种存储介质，所述存储介质存储有至少一可执行指令，该计算机可执行指令可执行上述任意方法实施例中的基于机器学习的图像信息识别的优化方法。

可选的，本申请涉及的存储介质可以是计算机可读存储介质，该存储介质如计算机可读存储介质可以是非易失性的，也可以是易失性的。

图5示出了根据本申请一个实施例提供的一种计算机设备的结构示意图，本申请具体实施例并不对计算机设备的具体实现做限定。

如图5所示，该计算机设备可以包括：处理器(processor)502、通信接口(Communications Interface)504、存储器(memory)506、以及通信总线508。

其中：处理器502、通信接口504、以及存储器506通过通信总线508完成相互间的通信。

通信接口504，用于与其它设备比如客户端或其它服务器等的网元通信。

处理器502，用于执行程序510，具体可以执行上述基于机器学习的图像信息识别的优化方法实施例中的相关步骤。

具体地，程序510可以包括程序代码，该程序代码包括计算机操作指令。

处理器502可能是中央处理器CPU，或者是特定集成电路ASIC（Application Specific Integrated Circuit），或者是被配置成实施本申请实施例的一个或多个集成电路。计算机设备包括的一个或多个处理器，可以是同一类型的处理器，如一个或多个CPU；也可以是不同类型的处理器，如一个或多个CPU以及一个或多个ASIC。

存储器506，用于存放程序510。存储器506可能包含高速RAM存储器，也可能还包括非易失性存储器（non-volatile memory），例如至少一个磁盘存储器。

程序510具体可以用于使得处理器502执行以下操作：获取主任务图像训练样本集以及至少一个分支任务图像训练样本集，所述主任务图像训练样本集与所述分支任务图像训练样本集相匹配；基于所述主任务图像训练样本集、所述分支任务图像训练样本集对预设深度学习模型执行主任务训练及分支任务训练相切换的训练处理；基于完成训练的预设深度学习模型，对待识别的图像信息进行识别处理，得到所述图像信息的识别结果。

显然，本领域的技术人员应该明白，上述的本申请的各模块或各步骤可以用通用的计算装置来实现，它们可以集中在单个的计算装置上，或者分布在多个计算装置所组成的网络上，可选地，它们可以用计算装置可执行的程序代码来实现，从而，可以将它们存储在存储装置中由计算装置来执行，并且在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤，或者将它们分别制作成各个集成电路模块，或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样，本申请不限制于任何特定的硬件和软件结合。

以上所述仅为本申请的优选实施例而已，并不用于限制本申请，对于本领域的技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包括在本申请的保护范围之内。

Claims

一种基于机器学习的图像信息识别的优化方法，包括：

获取主任务图像训练样本集以及至少一个分支任务图像训练样本集，所述主任务图像训练样本集与所述分支任务图像训练样本集相匹配；

基于所述主任务图像训练样本集、所述分支任务图像训练样本集对预设深度学习模型执行主任务训练及分支任务训练相切换的训练处理，以使根据模型精度、损失值确定所述预设深度学习模型处于非局部最优、和/或非鞍点状态下完成训练处理；

基于完成训练的预设深度学习模型，对待识别的图像信息进行识别处理，得到所述图像信息的识别结果。
根据权利要求1所述的方法，其中，所述基于所述主任务图像训练样本集、所述分支任务图像训练样本集对预设深度学习模型执行主任务训练及分支任务训练相切换的训练处理包括：

当执行主任务训练处理的所述预设深度学习模型处于局部最优、和/或鞍点状态，则根据与所述主任务图像训练样本集匹配的分支任务图像训练样本集对已执行主任务训练处理的所述预设深度学习模型执行分支任务训练处理；

当执行分支任务训练处理的所述预设深度学习模型跳出所述局部最优以及所述鞍点状态，则根据所述主任务图像训练样本集对所述预设深度学习模型重新执行主任务训练处理；

当重新执行主任务训练处理的所述预设深度学习模型的模型精度匹配预设精度阈值时，确定完成所述预设深度学习模型的训练。
根据权利要求2所述的方法，其中，所述方法还包括：

当重新执行主任务训练处理后，所述所述预设深度学习模型处于局部最优、和/或鞍点状态，则再次基于所述分支任务图像训练样本集重新对所述预设深度学习模型执行分支任务训练处理的步骤；

当执行分支任务训练处理的所述预设深度学习模型跳出所述局部最优以及所述鞍点状态后，再次执行根据所述主任务图像训练样本集对所述预设深度学习模型重新执行主任务训练处理的步骤，直至所述预设深度学习模型的模型精度匹配预设精度阈值确定完成所述预设深度学习模型的训练。
根据权利要求2所述的方法，其中，所述根据与所述主任务图像训练样本集匹配的分支任务图像训练样本集对已执行主任务训练处理的所述预设深度学习模型执行分支任务训练处理包括：

若所述分支任务图像训练样本集为多个时，基于所述分支任务图像训练样本集匹配的识别特征，以及识别特征与图像信息映射对应关系确定执行分支任务训练处理的顺序，并按照所述顺序对已执行主任务训练处理的所述预设深度学习模型执行多个分支任务训练处理。
根据权利要求2所述的方法，其中，所述方法还包括：

基于对执行主任务训练处理的所述预设深度学习模型的模型精度、损失值进行递归计算，当所述模型精度、损失值不变时，确定执行主任务训练处理的所述预设深度学习模型处于局部最优、和/或鞍点状态，所述预设深度学习模型为神经网络模型。
根据权利要求1-5任一项所述的方法，其中，所述方法还包括：

基于待训练的图像训练集中各图像信息的识别特征，构建一个主任务图像训练样本集，以及至少一个分支任务图像训练样本集，所述识别特征至少包括图像信息中五官特征、性别特征、年龄特征、表情特征、文字特征、数字特征之一。
根据权利要求6所述的方法，其中，所述方法还包括：

解析得到所述图像信息的识别结果，基于解析出的识别特征对所述主任务图像训练样本集、所述分支任务图像训练样本集进行更新。
一种基于机器学习的图像信息识别的优化装置，包括：

获取模块，用于获取主任务图像训练样本集以及至少一个分支任务图像训练样本集，所述主任务图像训练样本集与所述分支任务图像训练样本集相匹配；

训练模块，用于基于所述主任务图像训练样本集、所述分支任务图像训练样本集对预设深度学习模型执行主任务训练及分支任务训练相切换的训练处理，以使根据模型精度、损失值确定所述预设深度学习模型处于非局部最优、和/或非鞍点状态下完成训练处理；

识别模块，用于基于完成训练的预设深度学习模型，对待识别的图像信息进行识别处理，得到所述图像信息的识别结果。
一种存储介质，所述存储介质中存储有至少一可执行指令，其中，所述可执行指令使处理器执行以下方法：

获取主任务图像训练样本集以及至少一个分支任务图像训练样本集，所述主任务图像训练样本集与所述分支任务图像训练样本集相匹配；

基于所述主任务图像训练样本集、所述分支任务图像训练样本集对预设深度学习模型执行主任务训练及分支任务训练相切换的训练处理，以使根据模型精度、损失值确定所述预设深度学习模型处于非局部最优、和/或非鞍点状态下完成训练处理；

基于完成训练的预设深度学习模型，对待识别的图像信息进行识别处理，得到所述图像信息的识别结果。
根据权利要求9所述的存储介质，其中，执行所述基于所述主任务图像训练样本集、所述分支任务图像训练样本集对预设深度学习模型执行主任务训练及分支任务训练相切换的训练处理包括：

当执行主任务训练处理的所述预设深度学习模型处于局部最优、和/或鞍点状态，则根据与所述主任务图像训练样本集匹配的分支任务图像训练样本集对已执行主任务训练处理的所述预设深度学习模型执行分支任务训练处理；

当执行分支任务训练处理的所述预设深度学习模型跳出所述局部最优以及所述鞍点状态，则根据所述主任务图像训练样本集对所述预设深度学习模型重新执行主任务训练处理；

当重新执行主任务训练处理的所述预设深度学习模型的模型精度匹配预设精度阈值时，确定完成所述预设深度学习模型的训练。
根据权利要求10所述的存储介质，其中，所述可执行指令还使处理器执行：

当重新执行主任务训练处理后，所述所述预设深度学习模型处于局部最优、和/或鞍点状态，则再次基于所述分支任务图像训练样本集重新对所述预设深度学习模型执行分支任务训练处理的步骤；

当执行分支任务训练处理的所述预设深度学习模型跳出所述局部最优以及所述鞍点状态后，再次执行根据所述主任务图像训练样本集对所述预设深度学习模型重新执行主任务训练处理的步骤，直至所述预设深度学习模型的模型精度匹配预设精度阈值确定完成所述预设深度学习模型的训练。
根据权利要求10所述的存储介质，其中，所述可执行指令还使处理器执行：

基于对执行主任务训练处理的所述预设深度学习模型的模型精度、损失值进行递归计算，当所述模型精度、损失值不变时，确定执行主任务训练处理的所述预设深度学习模型处于局部最优、和/或鞍点状态，所述预设深度学习模型为神经网络模型。
根据权利要求9-12任一项所述的存储介质，其中，所述可执行指令还使处理器执行：

基于待训练的图像训练集中各图像信息的识别特征，构建一个主任务图像训练样本集，以及至少一个分支任务图像训练样本集，所述识别特征至少包括图像信息中五官特征、性别特征、年龄特征、表情特征、文字特征、数字特征之一。
根据权利要求13所述的存储介质，其中，所述可执行指令还使处理器执行：

解析得到所述图像信息的识别结果，基于解析出的识别特征对所述主任务图像训练样本集、所述分支任务图像训练样本集进行更新。
一种计算机设备，包括：处理器、存储器、通信接口和通信总线，所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信，

所述存储器用于存放至少一可执行指令，其中，所述可执行指令使所述处理器执行以下方法：

获取主任务图像训练样本集以及至少一个分支任务图像训练样本集，所述主任务图像训练样本集与所述分支任务图像训练样本集相匹配；

基于所述主任务图像训练样本集、所述分支任务图像训练样本集对预设深度学习模型执行主任务训练及分支任务训练相切换的训练处理，以使根据模型精度、损失值确定所述预设深度学习模型处于非局部最优、和/或非鞍点状态下完成训练处理；

基于完成训练的预设深度学习模型，对待识别的图像信息进行识别处理，得到所述图像信息的识别结果。
根据权利要求15所述的计算机设备，其中，执行所述基于所述主任务图像训练样本集、所述分支任务图像训练样本集对预设深度学习模型执行主任务训练及分支任务训练相切换的训练处理包括：

当执行主任务训练处理的所述预设深度学习模型处于局部最优、和/或鞍点状态，则根据与所述主任务图像训练样本集匹配的分支任务图像训练样本集对已执行主任务训练处理的所述预设深度学习模型执行分支任务训练处理；

当执行分支任务训练处理的所述预设深度学习模型跳出所述局部最优以及所述鞍点状态，则根据所述主任务图像训练样本集对所述预设深度学习模型重新执行主任务训练处理；

当重新执行主任务训练处理的所述预设深度学习模型的模型精度匹配预设精度阈值时，确定完成所述预设深度学习模型的训练。
根据权利要求16所述的计算机设备，其中，所述可执行指令还使处理器执行：

当重新执行主任务训练处理后，所述所述预设深度学习模型处于局部最优、和/或鞍点状态，则再次基于所述分支任务图像训练样本集重新对所述预设深度学习模型执行分支任务训练处理的步骤；

当执行分支任务训练处理的所述预设深度学习模型跳出所述局部最优以及所述鞍点状态后，再次执行根据所述主任务图像训练样本集对所述预设深度学习模型重新执行主任务训练处理的步骤，直至所述预设深度学习模型的模型精度匹配预设精度阈值确定完成所述预设深度学习模型的训练。
根据权利要求16所述的计算机设备，其中，所述可执行指令还使处理器执行：

基于对执行主任务训练处理的所述预设深度学习模型的模型精度、损失值进行递归计算，当所述模型精度、损失值不变时，确定执行主任务训练处理的所述预设深度学习模型处于局部最优、和/或鞍点状态，所述预设深度学习模型为神经网络模型。
根据权利要求15-18任一项所述的计算机设备，其中，所述可执行指令还使处理器执行：

基于待训练的图像训练集中各图像信息的识别特征，构建一个主任务图像训练样本集，以及至少一个分支任务图像训练样本集，所述识别特征至少包括图像信息中五官特征、性别特征、年龄特征、表情特征、文字特征、数字特征之一。
根据权利要求19所述的计算机设备，其中，所述可执行指令还使处理器执行：

解析得到所述图像信息的识别结果，基于解析出的识别特征对所述主任务图像训练样本集、所述分支任务图像训练样本集进行更新。