CN109242000B

CN109242000B - 图像处理方法、装置、设备及计算机可读存储介质

Info

Publication number: CN109242000B
Application number: CN201810902228.8A
Authority: CN
Inventors: 徐化永; 张永杰; 李颖超
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2018-08-09
Filing date: 2018-08-09
Publication date: 2021-08-31
Anticipated expiration: 2038-08-09
Also published as: CN109242000A

Abstract

本发明提供一种图像处理方法、装置、设备及计算机可读存储介质，方法包括：对待处理图像中的有效信息进行提取，获得只包含有效信息的第一待学习数据；通过所述第一待学习数据对预设的待训练模型进行训练，获得训练后的神经网络模型。通过只包含有效信息的第一待学习数据对预设的待训练模型进行训练，从而能够提高训练后神经网络模型的识别精度，还能够提高模型的识别效率。

Description

图像处理方法、装置、设备及计算机可读存储介质

技术领域

本发明涉及计算机领域，尤其涉及一种图像处理方法、装置、设备及计算机可读存储介质。

背景技术

深度学习是机器学习研究中的一个新的领域，其动机在于建立、模拟人脑进行分析学习的神经网络，它模仿人脑的机制来解释数据，其在计算机视觉、语音识别以及自然语言处理等多领域内有着广泛的应用。

当前计算机视觉方向的深度学习网络一般分为两个步骤，特征提取和具体任务处理，具体任务包括分类、检测、分割等。一般特征提取的噪声越少和后面具体任务越相关，后面具体任务也会得到更好的结果。

由于大部分具体任务中，只有目标对象的特征是有用的，背景信息特征不仅无用相反会带来噪声，但由于之前两个步骤一起训练方案没有主动控制特征的学习，而且由于训练数据有限性以及特征空间到具体任务结果的映射空间比较大，所以很容易就会把背景的特征信息保留下来，由于实际应用和训练无法完全保持一致，这样有噪声的特征在具体应用的时候有可能会导致任务的失败。

发明内容

本发明提供一种图像处理方法、装置、设备及计算机可读存储介质，用于解决现有技术中由于神经网络模型学习的数据中无用的数据太多而造成后续模型识别精准度不高、且学习效率较低的技术问题。

本发明的第一个方面是提供一种图像处理方法，包括：

对待处理图像中的有效信息进行提取，获得只包含有效信息的第一待学习数据；

通过所述第一待学习数据对预设的待训练模型进行训练，获得训练后的神经网络模型。

本发明的另一个方面是提供一种图像处理方法，包括：

接收待识别图像；

通过所述神经网络模型对所述待识别图像进行识别。

本发明的又一个方面是提供一种图像处理装置，包括：

提取模块，用于对待处理图像中的有效信息进行提取，获得只包含有效信息的第一待学习数据；

第一训练模块，用于通过所述第一待学习数据对预设的待训练模型进行训练，获得训练后的神经网络模型。

本发明的又一个方面是提供一种图像处理装置，包括：

接收模块，用于接收待识别图像；

识别模块，用于通过所述神经网络模型对所述待识别图像进行识别，所述神经网络模型是通过上述图像处理方法训练获得的。

本发明的又一个方面是提供一种图像处理设备，包括：存储器，处理器；

存储器；用于存储所述处理器可执行指令的存储器；

其中，所述处理器被配置为由所述处理器执行如上述的图像处理方法。

本发明的又一个方面是提供一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有计算机执行指令，所述计算机执行指令被处理器执行时用于实现如上述的图像处理方法。

存储器；用于存储所述处理器可执行指令的存储器；

其中，所述处理器被配置为由所述处理器执行如上述的图像处理方法，所述神经网络模型是通过上述的图像处理方法训练获得的。

本发明提供的图像处理方法、装置、设备及计算机可读存储介质，通过对待处理图像中的有效信息进行提取，获得只包含有效信息的第一待学习数据；通过所述第一待学习数据对预设的待训练模型进行训练，获得训练后的神经网络模型。通过只包含有效信息的第一待学习数据对预设的待训练模型进行训练，从而能够提高训练后神经网络模型的识别精度，还能够提高模型的识别效率。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，还可以根据这些附图获得其他的附图。

图1为本发明实施例一提供的图像处理方法的流程示意图；

图2为本发明实施例二提供的图像处理方法的流程示意图；

图3为本发明实施例三提供的图像处理方法的流程示意图；

图4为本发明实施例四提供的图像处理装置的结构示意图；

图5为本发明实施例四提供的图像处理装置的结构示意图；

图6为本发明实施例六提供的图像处理装置的结构示意图；

图7为本发明实施例七提供的图像处理设备的结构示意图；

图8为本发明实施例八提供的图像处理设备的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例所获得的所有其他实施例，都属于本发明保护的范围。

图1为本发明实施例一提供的图像处理方法的流程示意图，如图1所示，所述方法包括：

步骤101、对待处理图像中的有效信息进行提取，获得只包含有效信息的第一待学习数据。

在本实施方式中，由于大部分具体任务中，只有目标对象的特征是有用的，背景信息特征不仅无用相反会带来噪声，但是由于现有的计算机视觉方向的深度学习网络一般分为特征提取和具体任务处理两个步骤，并且两个步骤一起训练方案没有主动控制特征的学习，而且由于训练数据有限性以及特征空间到具体任务结果的映射空间比较大，所以很容易就会把背景的特征信息保留下来，由于实际应用和训练无法完全保持一致，这样有噪声的特征在具体应用的时候有可能会导致任务的失败。以实际应用举例来说，图像分类模型用于识别图像中的物体种类，因此，对于该任务来说，只需要学习图像中的具体物体的特征即可，不需要对图像的背景信息进行学习。若该图像分类模型在学习过程中学习大量包含背景的图像，往往会使学习的效率降低，此外，若当训练数据有限时，往往会造成后续模型识别不精准的缺陷，举例来说，若图像分类模型在学习过程中，学习到的猫的训练数据均是猫蹲在阳台上的图像，后续在图像分类模型的识别过程中，如果遇到窗台会有可能错误的认为是一只猫，或者是一只猫在其他场景如草地上，会识别不出来猫，也即图像分类模型的识别精度过低。

为了解决上述技术问题，可以对待处理图像中的有效信息进行提取，获得只包含有效信息的第一待学习数据。仍以图像分类模型举例来说，若当前的训练数据为多张包含各种动物的图像，图像分类模型需要学习的部分为包含动物的部分，而不包含动物的背景部分则不需要学习，因此，需要提取的有效信息则为各种动物。

步骤102、通过所述第一待学习数据对预设的待训练模型进行训练，获得训练后的神经网络模型。

在本实施方式中，提取到待处理图像中的有效信息之后，可以将只包含有效信息的第一待学习数据添加到预设的待训练模型中，对该待训练模型进行训练，获得训练后的神经网络模型。具体地，由于第一待学习数据中只包含有效信息，因此，待训练模型能够快速地学习到有效信息的内容，后续训练后的神经网络模型在识别过程中的精度也有所提高，此外，由于第一待学习数据中只包含有效信息，因此，神经网络模型需要学习的数据也大大减少，因此，能够有效地提高神经网络模型的学习效率。

本实施例提供的图像处理方法，通过对待处理图像中的有效信息进行提取，获得只包含有效信息的第一待学习数据；通过所述第一待学习数据对预设的待训练模型进行训练，获得训练后的神经网络模型。通过将只包含有效信息的第一待学习数据添加至预设的待训练模型中进行学习，从而能够降低待训练模型学习的数据量，能够提高神经网络模型的识别效率，此外，通过学习只包括有效信息的第一待学习数据，从而能够提高神经网络模型的识别精度。

进一步地，在上述实施例的基础上，所述方法包括：

分别对所述待处理图像中的有效信息与无效信息进行标注；

通过预设的对抗网络对标注后的所述待处理图像中的有效信息进行提取，获得只包含有效信息的第一待学习数据；

在本实施例中，为了实现对待处理图像中有效信息的获取，首先可以对待处理图像中的有效信息与无效信息进行标注。仍以图像分类模型举例来说，若待学习数据为多张小动物的图像，则有效信息则为小动物的图像，此时，为了使神经网络能够对待学习数据中的有效信息进行精准地获取，可以将包含小动物的区域标注为1，而背景信息标注为0，实现对有效信息与无效信息的区分。

对待处理图像中的有效信息与无效信息进行标注之后，为了提高获取到的有效信息的精度，可以通过对抗网络实现对标注后的待处理图像中的有效信息的提取，获得只包含有效信息的第一待学习数据。将第一待学习数据添加至预设的待训练模型中进行学习，从而能够提高神经网络模型的识别效率与精度。

本实施例提供的图像处理方法，通过预先对待处理图像中的有效信息进行标注，从而能够提高有效信息提取的效率，通过采用对抗网络对标注后的待处理图像的有效信息进行提取，从而能够提高有效信息提取的精度，为提高神经网络模型的学习效率与精度提供了基础。

进一步地，在上述任一实施例的基础上，所述方法包括：

分别对所述待处理图像中的有效信息与无效信息进行标注；

通过生成器对标注后的所述待处理图像中的有效信息进行提取；

通过判别器判断所述生成器提取的有效信息与真实有效信息的相似度是否小于预设的阈值；

若是，则获得只包含有效信息的第一待学习数据；

若否，则返回执行通过生成器对标注后的所述待处理图像中的有效信息进行提取的步骤，直至所述生成器提取的有效信息与预存的真实有效信息的相似度小于预设的阈值；

在本实施例中，分别对待处理图像进行标注之后，可以通过对抗网络中的生成器对标注后的待处理图像中的有效信息进行提取，目标是希望生成器提取的特征尽可能值包含有效信息的特征。相应的，判别器对生成器生成的有效信息与预存的真实有效信息进行判别，生成器生成的有效信息为假，预存的真实有效信息为真，生成器为了骗过判别器就会尽可能的把提取的特征接近真实有效信息。这样不断迭代优化过程中，生成器和判别器不断博弈，直至生成器生成的有效信息与预存的真实有效信息之间的差异小于预设的阈值，也即生成器生成的有效信息即为真实有效信息，从而能够提高提取的有效信息的精准度。获取到只包含有效信息的第一待学习数据之后，将第一待学习数据添加至预设的待训练模型中进行学习，从而能够提高神经网络模型的识别效率与精度。

本实施例提供的图像处理方法，通过采用对抗网络对待处理图像中的有效信息进行提取，生成器和判别器不断博弈，从而导致生成器提取到的有效信息即为真实有效信息，能够提高提取的有效信息的精准度，进而为后续提高神经网络模型的识别效率与精度提供了基础。

进一步地，在上述任一实施例的基础上，所述方法包括：

通过预设的向量转换模型对所述待处理图像进行处理，获得所述待处理图像对应的特征向量；

分别对所述特征向量中的有效信息与无效信息进行标注；

在本实施例中，为了实现对待处理图像中的有效信息与无效信息的标注，首先应该将待处理图像转换为计算机能够识别的形式。具体地，可以通过预设的向量转换模型对待处理图像进行处理，获得与待处理图像对应的特征向量。需要说明的是，可以采用任意一种能够实现向量转换的模型对待处理图像进行向量转换，本发明在此不做限制。获取待处理图像对应的特征向量之后，可以分别对特征向量中的有效信息进行标注，实现对有效信息与无效信息的区分。为了提高获取到的有效信息的精度，可以通过对抗网络实现对标注后的待处理图像中的有效信息的提取，获得只包含有效信息的第一待学习数据。将第一待学习数据添加至预设的待训练模型中进行学习，从而能够提高神经网络模型的识别效率与精度。

本实施例提供的图像处理方法，通过预设的向量转换模型对待处理图像进行处理，获得待处理图像对应的特征向量，从而能够实现对待处理图像中有效信息与无效信息的标注，进而为后续提高神经网络模型的识别效率与精度提供了基础。

图2为本发明实施例二提供的图像处理方法的流程示意图，在上述实施例的基础上，如图2所示，所述方法包括：

步骤201、对待处理图像中的有效信息进行提取，获得只包含有效信息的待学习数据；

步骤202、在所述第一待学习数据上随机添加不同的噪声，获得包含多种不同背景的第二待学习数据；

步骤203、通过所述第二待学习数据对预设的待训练模型进行训练，获得训练后的神经网络模型。

由于在神经网络训练过程中，过多的背景信息会导致神经网络的识别精度较低，且识别效率较低，而过少且样式单一的训练数据也会导致神经网络的识别精度较低。举例来说，若图像分类模型在学习过程中，学习到的猫的训练数据均是猫蹲在阳台上的图像，后续在图像分类模型的识别过程中，如果遇到窗台会有可能错误的认为是一只猫，或者是一只猫在其他场景如草地上，会识别不出来猫，也即图像分类模型的识别精度过低。

因此，为了解决上述技术问题，首先可以对待处理图像中的有效信息进行提取，获取到只包含有效信息的第一待学习数据。需要说明的是，可以通过任意一种方式实现对有效信息的获取，本发明再次不做限制。获取到只包含有效信息的第一待学习数据之后，为了增加训练数据的数量，可以在第一待学习数据添加随机噪声，获得多个不同场景下的第二待学习数据，通过所述第二待学习数据对预设的待训练模型进行训练，获得训练后的神经网络模型，则能够提高神经网络模型的识别精度。

以实际应用举例来说，当前有效信息为一把椅子的待学习数据，为了使神经网络能够实现只对有效信息椅子的学习，可以对待学习数据进行预处理，获得只包含椅子的图像信息，并将该图像信息添加至预设的模型中，获取椅子信息对应的向量信息。对椅子图像中增加噪声，获得包含多种不同背景的椅子的图像。将包含多种不同背景的椅子的图像添加至预设的神经网络模型中进行学习，从而在后续识别过程中，无论什么背景下的椅子，均能够实现对椅子的精准识别，能够提高神经网络模型的识别精度。

本实施例提供的图像处理方法，通过在提取到待处理图像中的有效信息之后，在第一待学习数据上添加随机噪声，获得多个不同背景下的第二待学习数据，将第二待学习数据添加至预设的待训练模型中进行学习，从而能够提高神经网络模型的识别精度。

图3为本发明实施例三提供的图像处理方法的流程示意图，在上述任一实施例的基础上，如图3所示，所述方法包括：

步骤301、接收待识别图像；

步骤302、通过所述神经网络模型对所述待识别图像进行识别。

在本实施例中，通过对待处理图像中的有效信息进行提取，获得只包含有效信息的第一待学习数据，并通过第一待学习数据对预设的待训练模型进行训练，获得训练后的神经网络模型之后，可以通过该神经网络模型实现对待识别图像的识别。具体地，可以接收待识别图像，并将该待识别图像添加至神经网络模型中进行识别。由于该神经网络模型学习只包括有效信息的第一待学习数据，因此，识别精度较高。

通过本实施例提供的图像处理方法，通过接收待识别图像，并将待识别图像添加至训练后的神经网络模型中进行识别，从而能够对图像信息进行快速地获取。

图4为本发明实施例四提供的图像处理装置的结构示意图，如图4所示，所述方法包括：

提取模块41，用于对待处理图像中的有效信息进行提取，获得只包含有效信息的第一待学习数据。

第一训练模块42，用于通过所述第一待学习数据对预设的待训练模型进行训练，获得训练后的神经网络模型。

本实施例提供的图像处理装置，通过对待处理图像中的有效信息进行提取，获得只包含有效信息的第一待学习数据；通过所述第一待学习数据对预设的待训练模型进行训练，获得训练后的神经网络模型。通过将只包含有效信息的第一待学习数据添加至预设的待训练模型中进行学习，从而能够降低待训练模型学习的数据量，能够提高神经网络模型的识别效率，此外，通过学习只包括有效信息的第一待学习数据，从而能够提高神经网络模型的识别精度。

进一步地，在上述实施例的基础上，所述装置包括：

提取模块具体包括：

标注单元，用于分别对所述待处理图像中的有效信息与无效信息进行标注；

提取单元，用于通过预设的对抗网络对标注后的所述待处理图像中的有效信息进行提取，获得只包含有效信息的第一待学习数据；

本实施例提供的图像处理装置，通过预先对待处理图像中的有效信息进行标注，从而能够提高有效信息提取的效率，通过采用对抗网络对标注后的待处理图像的有效信息进行提取，从而能够提高有效信息提取的精度，为提高神经网络模型的学习效率与精度提供了基础。

进一步地，在上述任一实施例的基础上，所述装置包括：

提取模块具体包括：

提取单元具体包括：

提取子单元，用于通过生成器对标注后的所述待处理图像中的有效信息进行提取；

判别子单元，用于通过判别器判断所述生成器提取的有效信息与真实有效信息的相似度是否小于预设的阈值；

获取子单元，用于若是，则获得只包含有效信息的第一待学习数据；

循环子单元，用于若否，则返回执行通过生成器对标注后的所述待处理图像中的有效信息进行提取的步骤，直至所述生成器提取的有效信息与预存的真实有效信息的相似度小于预设的阈值；

本实施例提供的图像处理装置，通过采用对抗网络对待处理图像中的有效信息进行提取，生成器和判别器不断博弈，从而导致生成器提取到的有效信息即为真实有效信息，能够提高提取的有效信息的精准度，进而为后续提高神经网络模型的识别效率与精度提供了基础。

进一步地，在上述任一实施例的基础上，所述装置包括：

标注单元具体包括：

向量转换子单元，用通过预设的向量转换模型对所述待处理图像进行处理，获得所述待处理图像对应的特征向量；

标注子单元，用于分别对所述特征向量中的有效信息与无效信息进行标注；

提取模块具体包括：

本实施例提供的图像处理装置，通过预设的向量转换模型对待处理图像进行处理，获得待处理图像对应的特征向量，从而能够实现对待处理图像中有效信息与无效信息的标注，进而为后续提高神经网络模型的识别效率与精度提供了基础。

图5为本发明实施例四提供的图像处理装置的结构示意图，在上述实施例的基础上，如图5所示，所述装置包括：

提取模块51，用于对待处理图像中的有效信息进行提取，获得只包含有效信息的待学习数据；

噪声添加模块52，用于在所述第一待学习数据上随机添加不同的噪声，获得包含多种不同背景的第二待学习数据；

第二训练模块53，用于通过所述第二待学习数据对预设的待训练模型进行训练，获得训练后的神经网络模型。

本实施例提供的图像处理装置，通过在提取到待处理图像中的有效信息之后，在第一待学习数据上添加随机噪声，获得多个不同背景下的第二待学习数据，将第二待学习数据添加至预设的待训练模型中进行学习，从而能够提高神经网络模型的识别精度。

图6为本发明实施例六提供的图像处理装置的结构示意图，在上述任一实施例的基础上，如图6所示，所述装置包括：

接收模块61，用于接收待识别图像；

识别模块62，用于通过所述神经网络模型对所述待识别图像进行识别。

通过本实施例提供的图像处理装置，通过接收待识别图像，并将待识别图像添加至训练后的神经网络模型中进行识别，从而能够对图像信息进行快速地获取。

图7为本发明实施例七提供的图像处理设备的结构示意图，如图7所示，所述图像处理设备，包括：存储器71，处理器72；

存储器71；用于存储所述处理器72可执行指令的存储器71；

其中，所述处理器72被配置为由所述处理器72执行如上述的图像处理方法。

本发明又一实施例还提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有计算机执行指令，所述计算机执行指令被处理器执行时用于实现如上述的图像处理方法。

图8为本发明实施例八提供的图像处理设备的结构示意图，如图8所示，所述图像处理设备，包括：存储器81，处理器82；

存储器81；用于存储所述处理器82可执行指令的存储器81；

其中，所述处理器82被配置为由所述处理器82执行如上述的图像处理方法。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的装置的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

本领域普通技术人员可以理解：实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时，执行包括上述各方法实施例的步骤；而前述的存储介质包括：ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

最后应说明的是：以上各实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述各实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims

1.一种图像处理方法，其特征在于，包括：

分别对待处理图像中的有效信息与无效信息进行标注；

若是，则获得只包含有效信息的第一待学习数据；

若否，则返回执行通过生成器对标注后的所述待处理图像中的有效信息进行提取的步骤，直至所述生成器提取的有效信息与真实有效信息的相似度小于预设的阈值；

在所述第一待学习数据上随机添加不同的噪声，获得包含多种不同背景的第二待学习数据；

通过所述第二待学习数据对预设的待训练模型进行训练，获得训练后的神经网络模型。

2.根据权利要求1所述的方法，其特征在于，所述分别对所述待处理图像中的有效信息与无效信息进行标注，包括：

分别对所述特征向量中的有效信息与无效信息进行标注。

3.一种图像处理方法，其特征在于，包括：

接收待识别图像；

通过神经网络模型对所述待识别图像进行识别，所述神经网络模型是利用权利要求1或2所述的图像处理方法训练获得的。

4.一种图像处理装置，其特征在于，包括：

标注单元，用于分别对待处理图像中的有效信息与无效信息进行标注；

提取单元，包括：

循环子单元，用于若否，则返回执行通过生成器对标注后的所述待处理图像中的有效信息进行提取的步骤，直至所述生成器提取的有效信息与真实有效信息的相似度小于预设的阈值；

噪声添加模块，用于在所述第一待学习数据上随机添加不同的噪声，获得包含多种不同背景的第二待学习数据；

第二训练模块，用于将所述第二待学习数据添加至预设的神经网络模型中进行学习。

5.根据权利要求4所述的装置，其特征在于，所述标注单元包括：

向量转换子单元，用于通过预设的向量转换模型对所述待处理图像进行处理，获得所述待处理图像对应的特征向量；

标注子单元，用于分别对所述特征向量中的有效信息与无效信息进行标注。

6.一种图像处理装置，其特征在于，包括：

接收模块，用于接收待识别图像；

识别模块，用于通过所述神经网络模型对所述待识别图像进行识别，所述神经网络模型是利用权利要求1或2所述的图像处理方法训练获得的。

7.一种图像处理设备，其特征在于，包括：存储器，处理器；

存储器；用于存储所述处理器可执行指令的存储器；

其中，所述处理器被配置为由所述处理器执行如权利要求1或2所述的图像处理方法。

8.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有计算机执行指令，所述计算机执行指令被处理器执行时用于实现如权利要求1或2所述的图像处理方法。

9.一种图像处理设备，其特征在于，包括：存储器，处理器；

存储器；用于存储所述处理器可执行指令的存储器；

其中，所述处理器被配置为由所述处理器执行如权利要求3所述的图像处理方法。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有计算机执行指令，所述计算机执行指令被处理器执行时用于实现如权利要求3所述的图像处理方法。