CN114677519A - 特征提取网络训练和图像识别方法、装置 - Google Patents
特征提取网络训练和图像识别方法、装置 Download PDFInfo
- Publication number
- CN114677519A CN114677519A CN202210240746.4A CN202210240746A CN114677519A CN 114677519 A CN114677519 A CN 114677519A CN 202210240746 A CN202210240746 A CN 202210240746A CN 114677519 A CN114677519 A CN 114677519A
- Authority
- CN
- China
- Prior art keywords
- network
- sample image
- preset
- image
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Image Analysis (AREA)
Abstract
本申请实施例提供了一种特征提取网络训练和图像识别方法、装置。方案如下:利用预设特征提取网络,对该第一样本图像进行特征提取,得到第一特征数据;将该第一样本图像的第一特征数据,输入至预设特征转换网络,生成第二特征数据;根据预设识别网络对每一第一样本图像对应第一特征数据和第二特征数据的识别结果,以及第一真实标签,调整预设特征提取网络的参数,并返回执行针对每一第一样本图像,利用预设特征提取网络,对该第一样本图像进行特征提取,得到该第一样本图像的第一特征数据的步骤,直至预设特征提取网络收敛,得到训练完成的特征提取网络。通过本申请实施例提供的技术方案,提高了训练得到的特征提取网络的性能。
Description
技术领域
本申请涉及图像处理技术领域,特别是涉及一种特征提取网络训练和图像识别方法、装置。
背景技术
目前在对图像进行处理分析时,可以利用特征提取网络对图像进行特征提取,得到特征数据,从而基于提取到的特征数据进行图像分析,如人脸识别、目标物检测、车牌识别等。
相关技术中,上述特征提取网络是利用训练数据训练得到的。然而在训练数据获取过程中,由于受到隐私保护、数据传输等原因限制,这将导致获取到的训练数据存在部分特征场景的训练数据较少,甚至缺失的问题。此时,基于获取到的训练数据所训练得到的特征提取网络的性能也将有所衰减。
发明内容
本申请实施例的目的在于提供一种特征提取网络训练和图像识别方法、装置,以在网络训练阶段生成图像在多种图像场景所对应的特征数据,实现在特征层面的数据拓展,从而提高训练得到的特征提取网络的性能。具体技术方案如下:
本申请实施例提供了一种特征提取网络训练方法,所述方法包括:
获取第一数据集,所述第一数据集包括多个第一样本图像和每一第一样本图像的第一真实标签;
针对每一第一样本图像,利用预设特征提取网络,对该第一样本图像进行特征提取,得到该第一样本图像的第一特征数据;
将该第一样本图像的第一特征数据,输入至该第一样本图像的图像场景对应的预设特征转换网络,生成该第一样本图像的第二特征数据,所述预设特征转换网络是利用不同图像场景的样本图像的特征数据进行训练得到的;
根据预设识别网络对每一第一样本图像对应第一特征数据和第二特征数据的识别结果,以及每一第一样本图像的第一真实标签,调整所述预设特征提取网络的参数,并返回执行所述针对每一第一样本图像,利用预设特征提取网络,对该第一样本图像进行特征提取,得到该第一样本图像的第一特征数据的步骤,直至所述预设特征提取网络收敛,得到训练完成的特征提取网络。
可选的,所述预设特征转换网络为预先训练好的循环对抗生成网络中的第一生成器或第二生成器;
在将该第一样本图像的第一特征数据,输入至该第一样本图像的图像场景对应的预设特征转换网络,生成该第一样本图像的第二特征数据之前,所述方法还包括:
获取第二数据集,所述第二数据集包括第一图像场景的第二样本图像的第三特征数据,以及第二图像场景的第三样本图像的第四特征数据;
将所述第二样本图像的第三特征数据输入预设循环对抗生成网络中的第一生成器,得到该第二样本图像在所述第二图像场景对应的第五特征数据;
将该第二样本图像对应的第五特征数据输入所述预设循环对抗生成网络中的第二生成器,得到该第二样本图像在所述第一图像场景的第一重构特征数据;
将第三样本图像对应的第四特征数据输入所述第二生成器,得到该第三样本图像在所述第一图像场景对应的第六特征数据;
将该第三样本图像对应的第六特征数据输入所述第一生成器,得到该第三样本图像在所述第二图像场景的第二重构特征数据;
基于所述第三特征数据、所述第四特征数据、所述第一重构特征数据和所述第二重构特征数据,计算所述预设循环对抗生成网络的第一损失值;
基于所述第一损失值调整所述预设循环对抗生成网络的参数,并返回执行所述将所述第二样本图像的第三特征数据输入预设循环对抗生成网络中的第一生成器,得到该第二样本图像在所述第二图像场景对应的第五特征数据的步骤,直至所述预设循环对抗生成网络收敛,得到训练好的循环对抗生成网络。
可选的,在针对每一第一样本图像,利用预设特征提取网络,对该第一样本图像进行特征提取,得到该第一样本图像的第一特征数据之前,所述方法还包括:
针对第三数据集中的每一目标物,获取该目标物在预设图像场景中的多个采集图像,所述第三数据集为所述预设识别网络训练的训练数据的集合;
针对每一采集图像,利用所述预设特征提取网络对该采集图像进行特征提取,得到该采集图像的第七特征数据;
计算所述多个采集图像的第七特征数据的平均值,更新所述预设识别网络中该目标物所对应的权重初始值。
可选的,所述根据预设识别网络对每一第一样本图像对应第一特征数据和第二特征数据的识别结果,以及每一第一样本图像的第一真实标签,调整所述预设特征提取网络的参数的步骤,包括:
根据所述多个第一样本图像对应的第一识别结果、第二识别结果和第一真实标签间的第二损失值,调整预设识别网络的参数,得到调整后的预设识别网络,所述第一识别结果为所述预设识别网络根据所述第一样本图像的第一特征数据进行目标识别得到的,所述第二识别结果为所述预设识别网络对所述第一样本图像的第二特征数据进行目标识别得到的;
根据所述多个第一样本数据对应的第三识别结果和第一真实标签间的第三损失值,调整所述预设特征提取网络的参数,所述第三识别结果为调整后的预设识别网络根据所述第一样本图像的第一特征数据进行目标识别得到的。
可选的,所述根据所述多个第一样本图像对应的第一识别结果、第二识别结果和第一真实标签间的第二损失值,调整预设识别网络的参数,得到调整后的预设识别网络的步骤,包括:
针对每一第一样本图像,利用预设识别网络,根据该第一样本图像的第一特征数据进行目标识别,得到该第一样本图像的第一识别结果,并根据所述第一识别结果确定该第一样本图像的第一预测标签;
利用所述预设识别网络,根据该第一样本图像的第二特征数据进行目标识别,得到该第一样本图像的第二识别结果,并根据所述第二识别结果确定该第一样本图像的第二预测标签;
计算该第一样本图像对应的第一预测标签与第一真实标签间的第四损失值;
计算该第一样本图像对应的第二预测标签与第一真实标签间的第五损失值;
根据所述多个第一样本图像对应的第四损失值和第五损失值,计算所述预设识别网络的第二损失值;
基于所述第二损失值对所述预设识别网络中各目标物对应的权重初始值进行调整,并返回执行针对每一第一样本图像,利用预设识别网络,根据该第一样本图像的第一特征数据进行目标识别,得到该第一样本图像的第一识别结果的步骤,直至所述预设识别网络收敛,得到调整后的预设识别网络。
可选的,所述根据所述多个第一样本数据对应的第三识别结果和第一真实标签间的第三损失值,调整所述预设特征提取网络的参数的步骤,包括:
针对每一第一样本图像,利用所述调整后的预设识别网络,根据该第一样本图像的第一特征数据进行目标识别,得到该第一样本图像的第三识别结果,并根据所述第三识别结果确定该第一样本图像的第三预测标签;
计算所述多个第一样本图像对应的第三预测标签和第一真实标签间的损失值,作为所述预设特征提取网络的第三损失值;
基于所述第三损失值,调整所述预设特征提取网络的参数。
可选的,在获取第一数据集之前,所述方法还包括:
获取第三数据集,所述第三数据集包括多个第四样本图像和每一第四样本图像的第二真实标签;
针对每一第四样本图像,利用第一网络模型对该第四样本图像进行特征提取,得到该第四样本图像的第七特征数据;
将该第四样本图像的第七特征数据输入第二网络模型,得到该第四样本图像的第四识别结果,并根据所述第四识别结果,确定该第四样本图像的第四预测标签;
根据所述多个第四样本图像对应的第四预测标签和第二真实标签,计算所述第一网络模型和所述第二网络模型的第六损失值;
基于所述第六损失值,调整所述第一网络模型和所述第二网络模型的参数,并返回执行所述针对每一第四样本图像,利用第一网络模型对该第四样本图像进行特征提取,得到该第四样本图像的第七特征数据的步骤,直至所述第一网络模型和所述第二网络模型收敛,将当前的第一网络模型确定为预设特征提取网络,并将当前的第二网络模型确定为预设识别网络。
本申请实施例还提供了一种图像识别方法,所述方法包括:
获取待识别人脸图像;
将所述待识别人脸图像输入特征提取网络,得到所述待识别人脸图像的人脸特征数据;其中,所述特征提取网络为上述任一特征提取网络训练方法中训练完成的特征提取网络;
基于所述人脸特征数据,得到人脸识别结果。
本申请实施例还提供了一种特征提取网络训练装置,所述装置包括:
第一获取模块,用于获取第一数据集,所述第一数据集包括多个第一样本图像和每一第一样本图像的第一真实标签;
第一提取模块,用于针对每一第一样本图像,利用预设特征提取网络,对该第一样本图像进行特征提取,得到该第一样本图像的第一特征数据;
第一生成模块,用于将该第一样本图像的第一特征数据,输入至该第一样本图像的图像场景对应的预设特征转换网络,生成该第一样本图像的第二特征数据,所述预设特征转换网络是利用不同图像场景的样本图像的特征数据进行训练得到的;
第一调整模块,用于根据预设识别网络对每一第一样本图像对应第一特征数据和第二特征数据的识别结果,以及每一第一样本图像的第一真实标签,调整所述预设特征提取网络的参数,并返回执行所述针对每一第一样本图像,利用预设特征提取网络,对该第一样本图像进行特征提取,得到该第一样本图像的第一特征数据的步骤,直至所述预设特征提取网络收敛,得到训练完成的特征提取网络。
可选的,所述预设特征转换网络为预先训练好的循环对抗生成网络中的第一生成器或第二生成器;
所述装置还包括:
第二获取模块,用于在将该第一样本图像的第一特征数据,输入至该第一样本图像的图像场景对应的预设特征转换网络,生成该第一样本图像的第二特征数据之前,获取第二数据集,所述第二数据集包括第一图像场景的第二样本图像的第三特征数据,以及第二图像场景的第三样本图像的第四特征数据;
第二生成模块,用于将所述第二样本图像的第三特征数据输入预设循环对抗生成网络中的第一生成器,得到该第二样本图像在所述第二图像场景对应的第五特征数据;
第三生成模块,用于将该第二样本图像对应的第五特征数据输入所述预设循环对抗生成网络中的第二生成器,得到该第二样本图像在所述第一图像场景的第一重构特征数据;
第四生成模块,用于将第三样本图像对应的第四特征数据输入所述第二生成器,得到该第三样本图像在所述第一图像场景对应的第六特征数据;
第五生成模块,用于将该第三样本图像对应的第六特征数据输入所述第一生成器,得到该第三样本图像在所述第二图像场景的第二重构特征数据;
第一计算模块,用于基于所述第三特征数据、所述第四特征数据、所述第一重构特征数据和所述第二重构特征数据,计算所述预设循环对抗生成网络的第三损失值;
第二调整模块,用于基于所述第三损失值调整所述预设循环对抗生成网络的参数,并返回执行所述将所述第二样本图像的第三特征数据输入预设循环对抗生成网络中的第一生成器,得到该第二样本图像在所述第二图像场景对应的第五特征数据的步骤,直至所述预设循环对抗生成网络收敛,得到训练好的循环对抗生成网络。
可选的,所述装置还包括:
第三获取模块,用于在针对每一第一样本图像,利用预设特征提取网络,对该第一样本图像进行特征提取,得到该第一样本图像的第一特征数据之前,针对第三数据集中的每一目标物,获取该目标物在预设图像场景中的多个采集图像,所述第三数据集为所述预设识别网络训练的训练数据的集合;
第二提取模块,用于针对每一采集图像,利用所述预设特征提取网络对该采集图像进行特征提取,得到该采集图像的第七特征数据;
第二计算模块,用于计算所述多个采集图像的第七特征数据的平均值,更新所述预设识别网络中该目标物所对应的权重初始值。
可选的,所述第一调整模块,包括:
第一调整子模块,用于根据所述多个第一样本图像对应的第一识别结果、第二识别结果和第一真实标签间的第一损失值,调整预设识别网络的参数,得到调整后的预设识别网络,所述第一识别结果为所述预设识别网络根据所述第一样本图像的第一特征数据进行目标识别得到的,所述第二识别结果为所述预设识别网络对所述第一样本图像的第二特征数据进行目标识别得到的;
第二调整子模块,用于根据所述多个第一样本数据对应的第三识别结果和第一真实标签间的第二损失值,调整所述预设特征提取网络的参数,所述第三识别结果为调整后的预设识别网络根据所述第一样本图像的第一特征数据进行目标识别得到的。
可选的,所述第一调整子模块,具体用于针对每一第一样本图像,利用预设识别网络,根据该第一样本图像的第一特征数据进行目标识别,得到该第一样本图像的第一识别结果,并根据所述第一识别结果确定该第一样本图像的第一预测标签;
利用所述预设识别网络,根据该第一样本图像的第二特征数据进行目标识别,得到该第一样本图像的第二识别结果,并根据所述第二识别结果确定该第一样本图像的第二预测标签;
计算该第一样本图像对应的第一预测标签与第一真实标签间的第四损失值;
计算该第一样本图像对应的第二预测标签与第一真实标签间的第五损失值;
根据所述多个第一样本图像对应的第四损失值和第五损失值,计算所述预设识别网络的第一损失值;
基于所述第一损失值对所述预设识别网络中各目标物对应的权重初始值进行调整,并返回执行针对每一第一样本图像,利用预设识别网络,根据该第一样本图像的第一特征数据进行目标识别,得到该第一样本图像的第一识别结果的步骤,直至所述预设识别网络收敛,得到调整后的预设识别网络。
可选的,所述第二调整子模块,具体用于针对每一第一样本图像,利用所述调整后的预设识别网络,根据该第一样本图像的第一特征数据进行目标识别,得到该第一样本图像的第三识别结果,并根据所述第三识别结果确定该第一样本图像的第三预测标签;
计算所述多个第一样本图像对应的第三预测标签和第一真实标签间的损失值,作为所述预设特征提取网络的第二损失值;
基于所述第二损失值,调整所述预设特征提取网络的参数。
可选的,所述装置还包括:
第四获取模块,用于在获取第一数据集之前,获取第三数据集,所述第三数据集包括多个第四样本图像和每一第四样本图像的第二真实标签;
第三提取模块,用于针对每一第四样本图像,利用第一网络模型对该第四样本图像进行特征提取,得到该第四样本图像的第七特征数据;
第一识别模块,用于将该第四样本图像的第七特征数据输入第二网络模型,得到该第四样本图像的第四识别结果,并根据所述第四识别结果,确定该第四样本图像的第四预测标签;
第三计算模块,用于根据所述多个第四样本图像对应的第四预测标签和第二真实标签,计算所述第一网络模型和所述第二网络模型的第六损失值;
第三调整模块,用于基于所述第六损失值,调整所述第一网络模型和所述第二网络模型的参数,并返回执行所述针对每一第四样本图像,利用第一网络模型对该第四样本图像进行特征提取,得到该第四样本图像的第七特征数据的步骤,直至所述第一网络模型和所述第二网络模型收敛,将当前的第一网络模型确定为预设特征提取网络,并将当前的第二网络模型确定为预设识别网络。
本申请实施例还提供了一种图像识别装置,所述装置包括:
第五获取模块,用于获取待识别人脸图像;
第四提取模块,用于将所述待识别人脸图像输入特征提取网络,得到所述待识别人脸图像的人脸特征数据;其中,所述特征提取网络为上述任一特征提取网络训练方法中训练完成的特征提取网络;
识别模块,用于基于所述人脸特征数据,得到人脸识别结果。
本申请实施例还提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现上述任一所述的特征提取网络训练方法步骤。
本申请实施例还提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现上述任一所述的图像识别方法步骤。
本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述任一所述的特征提取网络训练方法步骤。
本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述任一所述的图像识别方法步骤。
本申请实施例还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述任一所述的特征提取网络训练方法。
本申请实施例还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述任一所述的图像识别方法。
本申请实施例有益效果:
本申请实施例提供的技术方案,可以利用预设特征提取网络,对第一数据集中的每一第一样本图像进行特征提取,得到该第一样本图像的第一特征数据,针对每一第一样本图像,利用该第一样本图像的图像场景所对应的预设特征转换网络,生成第一样本图像在不同图像场景下的第二特征数据,从而根据预设识别网络对每一第一样本图像对应第一特征数据和第二特征数据的识别结果,以及每一第一样本图像的第一真实标签,调整预设特征提取网络的参数,重复对预设特征提取网络的训练过程,直至预设特征提取网络收敛,得到训练好的特征提取网络。
通过每一第一样本图像的图像场景所对应的预设特征转换网络,可以生成第一样本图像在不同图像场景中的第二特征数据,也就是在网络训练阶段生成了样本图像在不同图像场景所对应的特征数据,实现样本图像的特征数据在特征层面的数据拓展,有效提高了基于多种不同图像场景的特征数据训练得到的特征提取网络对不同图像场景的图像的适用性,使得训练得到的特征提取网络可以对不同图像场景中采集到的图像进行特征提取,提高了训练得到的特征提取网络的性能。
另外,在利用预设特征转换网络对每一样本图像的特征数据进行特征转换得到第二特征数据后,预设特征提取网络的参数调整过程不仅受到各样本图像对应第一特征数据的影响,还受到各样本图像对应第二特征数据的影响,这使得拓展得到的第二特征数据更加贴近真实图像场景所对应的特征数据,从而提高了基于多种不同图像场景的特征数据训练得到的特征提取网络的准确性。
当然,实施本申请的任一产品或方法并不一定需要同时达到以上所述的所有优点。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的实施例。
图1为本申请实施例提供的特征提取网络训练方法的第一种流程示意图;
图2为本申请实施例提供的循环对抗生成网络的一种示意图;
图3为本申请实施例提供的特征提取网络训练方法的第二种流程示意图;
图4为本申请实施例提供的特征提取网络训练方法的第三种流程示意图;
图5为本申请实施例提供的特征提取网络训练方法的第四种流程示意图;
图6为本申请实施例提供的特征提取网络训练方法的第五种流程示意图;
图7为本申请实施例提供的预设识别网络参数调整方法的一种流程示意图;
图8为本申请实施例提供的预设特征提取网络参数调整方法的一种流程示意图;
图9为本申请实施例提供的特征提取网络训练方法的第六种流程示意图;
图10为本申请实施例提供的图像识别方法的一种流程示意图;
图11为本申请实施例提供的特征提取网络训练装置的一种结构示意图;
图12为本申请实施例提供的图像识别装置的一种结构示意图;
图13为本申请实施例提供的电子设备的第一种结构示意图;
图14为本申请实施例提供的电子设备的第二种结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员基于本申请所获得的所有其他实施例,都属于本申请保护的范围。
为了解决相关技术中的问题,本申请实施例提供了一种特征提取网络训练方法。该方法可以应用于任一电子设备,如终端设备、服务器等。在此对该电子设备不作具体限定。
如图1所示,图1为本申请实施例提供的特征提取网络训练方法的第一种流程示意图。该方法包括以下步骤。
步骤S101,获取第一数据集,第一数据集包括多个第一样本图像和每一第一样本图像的第一真实标签。
步骤S102,针对每一第一样本图像,利用预设特征提取网络,对该第一样本图像进行特征提取,得到该第一样本图像的第一特征数据。
步骤S103,将该第一样本图像的第一特征数据,输入至该第一样本图像的图像场景对应的预设特征转换网络,生成该第一样本图像的第二特征数据,预设特征转换网络是利用不同图像场景的样本图像的特征数据进行训练得到的。
步骤S104,根据预设识别网络对每一第一样本图像对应第一特征数据和第二特征数据的识别结果,以及每一第一样本图像的第一真实标签,调整预设特征提取网络的参数,并返回执行针对每一第一样本图像,利用预设特征提取网络,对该第一样本图像进行特征提取,得到该第一样本图像的第一特征数据的步骤,直至预设特征提取网络收敛,得到训练完成的特征提取网络。
通过图1所示的方法,可以利用预设特征提取网络,对第一数据集中的每一第一样本图像进行特征提取,得到该第一样本图像的第一特征数据,针对每一第一样本图像,利用该第一样本图像的图像场景所对应的预设特征转换网络,生成第一样本图像在不同图像场景下的第二特征数据,从而根据预设识别网络对每一第一样本图像对应第一特征数据和第二特征数据的识别结果,以及每一第一样本图像的第一真实标签,调整预设特征提取网络的参数,重复对预设特征提取网络的训练过程,直至预设特征提取网络收敛,得到训练好的特征提取网络。
通过每一第一样本图像的图像场景所对应的预设特征转换网络,可以生成第一样本图像在不同图像场景中的第二特征数据,也就是在网络训练阶段生成了样本图像在不同图像场景所对应的特征数据,实现样本图像的特征数据在特征层面的数据拓展,有效提高了基于多种不同图像场景的特征数据训练得到的特征提取网络对不同图像场景的图像的适用性,使得训练得到的特征提取网络可以对不同图像场景中采集到的图像进行特征提取,提高了训练得到的特征提取网络的性能。
另外,在利用预设特征转换网络对每一样本图像的特征数据进行特征转换得到第二特征数据后,预设特征提取网络的参数调整过程不仅受到各样本图像对应第一特征数据的影响,还受到各样本图像对应第二特征数据的影响,这使得拓展得到的第二特征数据更加贴近真实图像场景所对应的特征数据,从而提高了基于多种不同图像场景的特征数据训练得到的特征提取网络的准确性。
下面通过具体的实施例,对本申请实施例进行说明。
针对上述步骤S101,即获取第一数据集,第一数据集包括多个第一样本图像和每一第一样本图像的第一真实标签。
在本步骤中,电子设备可以获取多个样本图像(记为第一样本图像),以及每一第一样本图像中目标物的标签(记为第一真实标签),得到训练数据集(记为第一数据集)。
上述第一样本图像中的目标物包括但不限于人脸、车牌等,每一第一样本图像的第一真实标签可以用于指示第一样本图像中目标物的属性信息,如人脸所对应的人员身份信息、车牌所对应的车牌号码等。在此,对上述第一样本图像中的目标物,以及每一第一样本图像的第一真实标签不作具体限定。
为便于理解,下面仅以样本图像为人脸图像、目标物为人脸、真实标签为人脸所对应人员的身份信息为例进行说明,并不起任何限定作用。
在本申请实施例中,对上述第一数据集中包括的第一样本图像的数量不作具体限定。
一个可选的实施例中,上述第一样本图像可以为预处理后的样本图像。
例如,当上述第一样本图像为人脸图像时,上述每一第一样本图像均为标准化处理后的人脸图像。也就是上述第一样本图像为经过人脸检测和人脸定位后的人脸图像。
上述人脸检测过程可以利用提升(boosting)算法、快速区域卷积网络(FastRegion-based Convolutional Network,fast RCNN)算法、更快的基于区域的卷积网络(Faster Region-based Convolutional Network,faster RCNN)算法、你只看一次(youonly look once,Yolo)、单射多盒探测(Single Shot MultiBox Detector,SSD)算法等机器学习方法或者手工标注的方式完成。
上述人脸对齐也可以利用机器学习的方法或者手工标注的方式得到人脸图像中的关键点所在的坐标,如相关技术中的3点、5点或68点等,然后按照特定的模板计算放射变换矩阵,并根据关键点所在的坐标以及放射变换矩阵,将人脸图像变换到标准模板上,得到人脸对齐处理后的人脸图像。
在本申请实施例中,根据上述第一样本图像中目标物的种类的不同,上述对样本图像的预处理方式也有不同。在此,第一上述预处理方式不作具体限定。
针对上述步骤S102,即针对每一第一样本图像,利用预设特征提取网络,对该第一样本图像进行特征提取,得到该第一样本图像的第一特征数据。
在本步骤中,电子设备可以获取预先训练得到的用于提取图像特征数据的预设特征提取网络。针对上述第一数据集中的每一第一样本图像,电子设备可以利用该预设特征提取网络,对该第一样本图像中的目标物进行特征提取,得到该第一样本图像的特征数据(记为第一特征数据)。
例如,电子设备可以利用上述预设特征提取网络,对上述人脸图像进行特征提取,得到人脸图像中目标人脸的人脸特征数据。
在本申请实施例中,上述预设特征提取网络可以通过预设训练集对第一网络模型进行训练得到。该预设训练集可以为上述第一数据集,也可以为其他数据集。关于第一网络模型的训练方法可参见下文描述,在此不作赘述。
上述第一网络模型可以为深度学习网络模型。也就是上述预设特征提取网络可以为深度学习网络模型。如卷积神经网络模型等。在此,对上述第一网络模型和预设特征提取网络的网络结构不作具体限定。
在本申请实施例中,电子设备在利用上述预设特征提取网络对上述第一样本图像进行特征提取时,可以获取预设特征提取网络中任一中间层所输出的特征数据,作为第一特征数据。
为便于理解,以预设特征提取网络为卷积神经网络模型为例进行说明。现假设该预设特征提取网络中包括多个卷积池化层,如5个卷积池化层。电子设备可以获取任一卷积池化层的输出数据作为上述第一特征数据。
例如,电子设备可以获取预设特征提取网络中第一个卷积池化层的输出结果作为第一特征数据,也可以获取预设特征提取网络中第五个卷积池化层的输出结果作为第一特征数据。
一个可选的实施例中,为了提高上述提取到的第一特征数据的准确性,电子设备在获取上述第一特征数据时,可以获取上述预设特征提取网络的输出特征作为第一特征数据,也就是获取预设特征提取网络中最后一层的输出数据作为第一特征数据。
针对上述步骤S103,即将该第一样本图像的第一特征数据,输入至该第一样本图像的图像场景对应的预设特征转换网络,生成该第一样本图像的第二特征数据,预设特征转换网络是利用不同图像场景的样本图像的特征数据进行训练得到的。
在本申请实施例中,上述预设特征转换网络可以用于将某一图像场景的图像的特征数据转换为另一图像场景所对应的特征数据。该预设特征转换网络转换前后的特征数据所对应的图像场景不同。
为便于理解,仍以上述人脸图像为例进行说明。现假设该人脸图像为第一图像场景中采集到的某一人员的人脸图像,例如该人员的正脸图像。电子设备在提取到该人脸图像的特征数据后,可以将该特征数据输入至上述预设特征转换网络,此时,预设特征转换网络将输出该人员在第二图像场景中对应的人脸图像,例如,该人员的侧脸图像。第一图像场景不同于第二图像场景。
在本申请实施例中,上述预设特征转换模块转换前的特征数据与转换后的特征数据所对应的图像场景是:根据该预设特征转换网络训练过程中参与训练的特征数据所对应样本图像的图像场景确定的。在此,对上述第一图像场景和第二图像场景不作具体限定。为便于理解,下面仅以第一图像场景的图像为可以采集到人员正脸的场景中采集到的人脸图像,第二图像场景的图像为采集到人员侧脸的场景中采集到的侧脸图像为例进行说明,并不起任何限定作用。
一个可选的实施例中,上述预设特征转换网络可以为预先训练好的循环对抗生成网络中的第一生成器或第二生成器。
上述第一生成器可以用于将上述第一图像场景的图像的特征数据转换为在上述第二图像场景中的特征数据。上述第二生成器可以用于将上述第二图像场景的图像的特征数据转换为在上述第一图像场景中的特征数据。
为便于理解,结合图2为例进行说明,图2为本申请实施例提供的循环对抗生成网络的一种示意图。
在图2所示的循环对抗生成网络中,X为第一图像场景的图像的特征数据,Y为第二图像场景的特征数据,G为上述第一生成器,F为上述第二生成器,DX为第一判别器,DY为第二判别器。其中,第一判别器DX用于判定输入的特征数据是否为上述第一图像场景的图像的特征数据,第二判别器DY用于判定输入的特征数据是否为上述第二图像场景的图像的特征数据
特征数据X通过第一生成器G可以转换为在第二图像场景中对应的特征数据;特征数据Y通过第二生成器F可以转换为在第一图像场景中对应的特征数据。
关于上述循环对抗生成网络的训练过程可参见下文描述,在此不作具体说明。
在本申请实施例中,上述第一样本图像中可以包括第一图像场景的样本图像,也可以包括第二图像场景的样本图像。
一个可选的实施例中,针对上述步骤S102,将该第一样本图像的第一特征数据,输入至该第一样本图像的图像场景对应的预设特征转换网络,生成该第一样本图像的第二特征数据,具体可以表示为:
针对每一第一样本图像,若该第一样本图像为第一图像场景的样本图像,则将该第一样本图像的第一特征数据输入至上述循环对抗生成网络中的第一生成器,得到该第一样本图像在第二图像场景中对应的第二特征数据;若该第一样本图像为第二图像场景中的样本图像,则将该第一样本图像的第一特征数据输入至上述循环对抗生成网络中的第二生成器,得到该第一样本图像在第一图像场景中的第二特征数据。
上述预设特征转换网络除了为上述循环对抗生成网络中的第一生成器或第二生成器以外,还可以为独立的多个特征转换网络,如多个对抗生成网络等。在此,对上述预设特征转换网络不作具体限定。
在上述实施例中,仅以两个图像场景,即上述第一图像场景和第二图像场景的图像的特征数据转换为例进行说明的。除此以外,上述预设特征转换网络还可以用于对多个不同图像场景的特征数据的转换。
例如,预设特征转换网络可以上述第一图像场景、第二图像场景以及第三图像场景的图像的特征数据间的转换。为便于理解,仍以上述图2所示的循环对抗生成网络为例,此时,该循环对抗生成网络中生成器和判别器的数量将相应增加。也就是在图2所示的循环对抗生成网络中增加第一图像场景和第三图像场景相互转换的生成器和判别器,和/或第二图像场景和第三图像场景相互转换的生成器和判别器。为便于理解,下面仅以图2所示的循环对抗网络为例进行说明,并不起任何限定作用。
关于多种不同图像场景的图像的特征数据间的转换可参照上述特征数据转换方式,在此不作具体说明。为便于理解,下面仅以两种图像场景的图像的特征数据间的转换为例进行说明,并不起任何限定作用。
针对上述步骤S104,即根据预设识别网络对每一第一样本图像对应第一特征数据和第二特征数据的识别结果,以及每一第一样本图像的第一真实标签,调整预设特征提取网络的参数,并返回执行针对每一第一样本图像,利用预设特征提取网络,对该第一样本图像进行特征提取,得到该第一样本图像的第一特征数据的步骤,直至预设特征提取网络收敛,得到训练完成的特征提取网络。
在本步骤中,电子设备可以利用预设识别网络分别根据每一样本图像对应第一特征数据和第二特征数据进行目标识别,得到对应的识别结果。根据目标识别得到的识别结果,以及每一第一样本图像的第一真实标签,电子设备可以进行损失值计算,得到预设特征提取网络的损失值,并基于该损失值,对预设特征识别网络的参数进行调整,并返回执行上述步骤S102,也就是返回执行针对每一第一样本图像,利用预设特征提取网络,对该第一样本图像进行特征提取,得到该第一样本图像的第一特征数据的步骤,直至预设特征提取网络收敛时,将当前时刻的预设特征提取网络确定为训练好的特征提取网络,完成对特征提取网络的训练过程。
上述电子设备所调整的预设特征提取网络的参数包括但不限于预设特征提取网络中的权重和偏置量。关于上述预设特征提取网络的参数调整方式可参见下文描述,在此不作具体说明。
一个可选的实施例中,当上述预设特征转换网络为预先训练好的循环对抗生成网络中的第一生成器或第二生成器时,根据图1所示的方法,本申请实施例还提供了一种特征提取网络训练方法。如图3所示,图3为本申请实施例提供的特征提取网络训练方法的第二种流程示意图。该方法包括以下步骤。
步骤S301,获取第一数据集,第一数据集包括多个第一样本图像和每一第一样本图像的第一真实标签。
步骤S302,针对每一第一样本图像,利用预设特征提取网络,对该第一样本图像进行特征提取,得到该第一样本图像的第一特征数据。
上述步骤S301-步骤S302与上述步骤S101-步骤S102相同。
步骤S303,获取第二数据集,第二数据集包括第一图像场景的第二样本图像的第三特征数据,以及第二图像场景的第三样本图像的第四特征数据。
上述第二数据集中包括的第三特征数据的数量可以为多个,上述第二数据集中包括的第四特征数据的数量也可以为多个。在此,对上述第三特征数据和第四特征数据的数量不作具体限定。
上述第三特征数据和第四特征数据的获取方式可参照上述第一特征数据的获取方式,在此不作具体说明。
在本申请实施例中,仅以第二数据集包括特征数据,即上述第三特征数据和第四特征数据为例,对上述预设特征转换网络的训练过程进行说明。除此以外,上述第二数据集中包括的数据也可以为样本图像。此时该第二数据集可以与上述第一数据集相同,也可以不同。
一个可选的实施例中,当上述第二数据集中包括的数据为样本图像时,电子设备在执行步骤S304之前,可以利用上述预设特征提取网络,对第二数据集中每一样本图像进行特征提取,得到每一样本图像的特征数据。该特征数据的提取方式可参照上述第一特征数据的提取方式,在此不作具体说明。
步骤S304,将第二样本图像的第三特征数据输入预设循环对抗生成网络中的第一生成器,得到该第二样本图像在第二图像场景对应的第五特征数据。
步骤S305,将该第二样本图像对应的第五特征数据输入预设循环对抗生成网络中的第二生成器,得到该第二样本图像在第一图像场景的第一重构特征数据。
为便于理解,结合上述图2对上述步骤S304和步骤S305进行说明。
针对每一第二样本图像的第三特征数据,电子设备可以将该第二样本图像的第三特征数据作为图2所示的特征数据X输入第一生成器G,第一生成器G将输出该第二样本图像在第二图像场景中的特征数据(记为第五特征数据)。
电子设备可以将第一生成器G输出的第五特征数据作为图2所示的特征数据Y输出第二生成器F,第二生成器F将输出该第二样本图像在第一图像场景中的重构特征数据(记为第一重构特征数据)。
步骤S306,将第三样本图像对应的第四特征数据输入第二生成器,得到该第三样本图像在第一图像场景对应的第六特征数据。
上述第六特征数据的获取方式可参照上述第一重构特征数据的获取方式,在此不作具体说明。
步骤S307,将该第三样本图像对应的第六特征数据输入第一生成器,得到该第三样本图像在第二图像场景的第二重构特征数据。
上述第二重构特征数据的获取方式可参照上述第五特征数据的获取方式,在此不作具体说明。
在本申请实施例中,对上述步骤S304-步骤S305与上述步骤S306-步骤S307的执行顺序不作具体限定。
步骤S308,基于第三特征数据、第四特征数据、第一重构特征数据和第二重构特征数据,计算预设循环对抗生成网络的第一损失值。
一个可选的实施例中,电子设备可以利用以下公式,计算上述预设循环对抗生成网络的损失值(记为第一损失值)。
L(G,F,DX,DY)=LGAN(G,DY,X,Y)+LGAN(F,DX,Y,X)+αLcyc(G,F)+βLcls
其中,L(G,F,DX,DY)为关于第一生成器G、第二生成器F、第一判别器Dx和第二判别器DY的整体损失函数,LGAN(G,DY,X,Y)为关于第一生成器G、判别器DY、特征数据X和特征数据Y间的损失函数,GAN表示损失函数名称,x和y为输入数据,为在特征数据Y的分布上的期望,DY( )为以括号中内容为输入数据时第二判别器的输出,log为对数操作,为在特征数据X分布上的期望,G( )为以括号中内容为输入数据时第一生成器的输出,LGAN(F,Dx,Y,X)为关于第二生成器F、判别器DX、特征数据Y和特征数据XY间的损失函数,DX( )为以括号中内容为输入数据时第一判别器的输出,α为平衡系数,Lcyc(G,F)为重构损失函数, || ||1为L1范数,F()为以括号中内容为输入数据时第一生成器的输出,β为平衡系数,Lcls为分类损失函数(如交叉熵损失函数等), X∪Y为所有输入特征数据的并集,为预设识别网络输出的预测值。
针对上述输入数据x和y,根据该输入数据所输入的生成器或判别器的不同,上述输入数据x和y也有所不同。为便于理解,以上述步骤S304为例,第五特征数据输入第二生成器后得到第一重构特征数据,此时,第一生成器G的输入数据x为上述第五特征数据,G(x)为上述第一重构特征数据。在此,对上述第一生成器、第一判别器、第二生成器和第二判别器的输入和输出不作具体说明。
上述L1范数可以理解为一种距离度量。在上述实施例中仅以L1范数为例进行说明,除此以外,还可以为其他范数,如L2范数等。
在本申请实施例中,上述第一损失值计算过程中根据特征数据所输入的生成器的不同,上述特征数据X和特征数据Y有所不同。例如,针对上述步骤S304和步骤S305,LGAN(G,DY,X,Y)中的特征数据X可以为上述第三特征数据,特征数据Y可以为上述第五特征数据。再例如,针对上述步骤S306和步骤S307,LGAN(F,DX,Y,X)中的特征数据X可以为上述第四特征数据,特征数据Y可以为上述第六特征数据。
步骤S309,基于第一损失值调整预设循环对抗生成网络的参数,并返回执行将第二样本图像的第三特征数据输入预设循环对抗生成网络中的第一生成器,得到该第二样本图像在第二图像场景对应的第五特征数据的步骤,直至预设循环对抗生成网络收敛,得到训练好的循环对抗生成网络。
在本申请实施例中,电子设备在确定上述预设循环对抗生成网络的第一损失值后,可以基于预设循环对抗生成网络的第一损失值和/训练次数,确定预设循环对抗生成网络是否收敛。
若预设循环对抗生成网络未收敛,则电子设备可以基于上述第一损失值,对预设循环对抗生成网络的参数进行调整,并返回执行上述步骤S304,也就是继续对预设循环对抗生成网络进行训练,直至预设循环对抗生成网络收敛。
若预设循环对抗生成网络收敛,则电子设备可以将当前时刻的预设循环对抗生成网络确定为训练好的循环对抗生成网络。也就是电子设备可以将当前时刻的预设循环对抗生成网络中的第一生成器和第二生成器确定为训练好的预设特征转换网络。
在上述循环对抗生成网络中,通过上述第一判别器和第二判别器迫使第一生成器和第二生成器生成特征数据更加贴近真实图像场景中采集到的图像的特征数据,有效保证了特征层面拓展得到的特征数据的准确性,从而保证了特征转换得到的特征数据中目标物属性信息的保留。
通过上述步骤S303-步骤S309,电子设备可以利用上述第二数据集训练得到上述预设特征转换网络,有效保证了训练得到的预设特征转换网络的准确性,从而保证利用该预设特征转换网络进行特征层面的数据拓展所得到的特征数据的准确性。
步骤S310,将该第一样本图像的第一特征数据,输入至该第一样本图像的图像场景对应的预设特征转换网络,生成该第一样本图像的第二特征数据,预设特征转换网络是利用不同图像场景的样本图像的特征数据进行训练得到的。
在本步骤中,针对每一第一样本图像,电子设备将该第一样本图像的第一特征数据输入至第一样本图像的图像场景对应的第一生成器或第二生成器(即上述步骤S309中训练好的循环对抗生成网络中的第一生成器或第二生成器),生成该第一样本图像的第二特征数据。
步骤S311,根据预设识别网络对每一第一样本图像对应第一特征数据和第二特征数据的识别结果,以及每一第一样本图像的第一真实标签,调整预设特征提取网络的参数,并返回执行针对每一第一样本图像,利用预设特征提取网络,对该第一样本图像进行特征提取,得到该第一样本图像的第一特征数据的步骤,直至预设特征提取网络收敛,得到训练完成的特征提取网络。
上述步骤S311与上述步骤S104相同。
一个可选的实施例中,根据上述图1所示的方法,本申请实施例还提供了一种特征提取网络训练方法。如图4所示,图4为本申请实施例提供的特征提取网络训练方法的第三种流程示意图。该方法包括以下步骤。
步骤S401,获取第一数据集,第一数据集包括多个第一样本图像和每一第一样本图像的第一真实标签。
上述步骤S401与上述步骤S101相同。
步骤S402,针对第三数据集中的每一目标物,获取该目标物在预设图像场景中的多个采集图像,第三数据集为预设识别网络训练的训练数据的集合。
在本申请实施例中,由于上述预设识别网络是通过第三数据集训练中的数据训练得到的,因此,训练得到的预设识别网络所能识别的目标物的数量与第三数据集所包括的目标物的数量对应。
以第三数据集为样本图像为例,当第三数据集中样本图像所对应的人员的数量为1000时,通过该第三数据集训练得到的预设识别网络所能识别的人员即为这1000人。
上述第三数据集中的训练数据可以为上述样本图像。该第三数据集中还包括每一样本图像的真实标签(记为第二真实标签)。
一个可选的实施例中,针对第三数据集中的每一目标物,电子设备在获取该目标物在预设图像场景中的多个采集图像时,电子设备可以从预先存储的目标物的图像集合中获取图像场景为预设图像场景的所有采集图像。
在本申请实施例中,对上述多个采集图像的获取方式不作具体限定。
上述采集图像的数量可以根据用户需求或用户经验值进行设定。另外,获取到的各目标物的采集图像的数量可以相同,也可以不同相同。在此,对上述获取到的采集图像的数量不作具体限定。
上述预设图像场景可以根据用户需求等进行设定,在此,对上述预设图像场景不作具体限定。
一个可选的实施例中,为了保证使得上述每一采集图像可以包括较多的图像信息,从而保证基于该采集图像提取到的特征数据的全面性,上述预设图像场景可以为包括目标物属性信息较多的图像场景。以采集图像为人脸图像为例进行说明,为了使得采集图像中包括较多的人脸属性信息,可以将证件照所对应的图像场景确定为上述预设图像场景。
一个可选的实施例中,当上述目标物在预设图像场景中的采集图像的数量相对较少,甚至没有时,电子设备可以获取其他图像场景,如上述第一图像场景或第二图像场景中的多个采集图像。
步骤S403,针对每一采集图像,利用预设特征提取网络对该采集图像进行特征提取,得到该采集图像的第七特征数据。
上述采集图像的第七特征数据的提取方法可参照上述第一特征数据的提取方法,在此不作具体说明。
步骤S404,计算多个采集图像的第七特征数据的平均值,更新预设识别网络中该目标物所对应的权重初始值。
一个可选的实施例中,若通过上述步骤S402获取到的每一目标物的采集图像的数量为N,通过上述步骤S403提取到的每一目标物的第七特征数据表示为:{fi,j}(i=1,2,...,N),则上述多个采集图像的第七特征数据的平均值可以表示为:
其中,wi为第i个目标物的多个采集图像的第七特征数据的平均值。
针对每一目标物,电子设备在计算得到该目标物的多个采集图像的第七特征数据的平均值后,可以利用该平均值更新上述预设识别网络中该目标物所对应的权重初始值。也就是将上述训练得到的预设识别网络中每一目标物所对应的第七特征数据的平均值更新为该目标物的权重初始值。
在本申请实施例中,通过将上述预设识别网络中每一目标物的权重初始值更新为该目标物的第七特征数据的平均值,可以使得预设识别网络中目标物的权重位于收敛区域附近,这可以有效缩短预设识别网络的训练时间,从而提高预设识别网络的训练效率。
步骤S405,针对每一第一样本图像,利用预设特征提取网络,对该第一样本图像进行特征提取,得到该第一样本图像的第一特征数据。
步骤S406,将该第一样本图像的第一特征数据,输入至该第一样本图像的图像场景对应的预设特征转换网络,生成该第一样本图像的第二特征数据,预设特征转换网络是利用不同图像场景的样本图像的特征数据进行训练得到的。
步骤S407,根据预设识别网络对每一第一样本图像对应第一特征数据和第二特征数据的识别结果,以及每一第一样本图像的第一真实标签,调整预设特征提取网络的参数,并返回执行针对每一第一样本图像,利用预设特征提取网络,对该第一样本图像进行特征提取,得到该第一样本图像的第一特征数据的步骤,直至预设特征提取网络收敛,得到训练完成的特征提取网络。
上述步骤S405-步骤S407与上述步骤S102-步骤S104相同。
一个可选的实施例中,根据图1所示的方法,本申请实施例提供还提供了一种特征提取网络训练方法。如图5所示,图5为本申请实施例提供的特征提取网络训练方法的第四种流程示意图。该方法包括以下步骤。
步骤S501,获取第一数据集,第一数据集包括多个第一样本图像和每一第一样本图像的第一真实标签。
步骤S502,针对每一第一样本图像,利用预设特征提取网络,对该第一样本图像进行特征提取,得到该第一样本图像的第一特征数据。
步骤S503,将该第一样本图像的第一特征数据,输入至该第一样本图像的图像场景对应的预设特征转换网络,生成该第一样本图像的第二特征数据,预设特征转换网络是利用不同图像场景的样本图像的特征数据进行训练得到的。
上述步骤S501-步骤S503与上述步骤S101-步骤S103相同。
步骤S504,根据多个第一样本图像对应的第一识别结果、第二识别结果和第一真实标签间的第二损失值,调整预设特征提取网络的参数,并返回执行针对每一第一样本图像,利用预设特征提取网络,对该第一样本图像进行特征提取,得到该第一样本图像的第一特征数据的步骤,直至预设特征提取网络收敛,得到训练完成的特征提取网络;其中,第一识别结果为预设识别网络根据第一样本图像的第一特征数据进行目标识别得到的,第二识别结果为预设识别网络对第一样本图像的第二特征数据进行目标识别得到的。
在本步骤中,电子设备可以根据预设识别网络对每一第一样本图像的第一特征数据和第二特征数据进行目标识别得到的第一识别结果和第二识别结果,以及每一第一样本图像的第一真实标签,计算第一识别结果、第二识别结果和第一真实标签间的损失值(记为第二损失值),作为预设特征提取网络的损失值。电子设备可以基于该第二损失值,调整预设特征提取网络的参数,并返回执行上述步骤S502,直至预设特征提取网络收敛,得到训练好的特征提取网络。
上述第二损失值是根据每一第一样本图像对应第一识别结果与第一真实标签间的损失值,以及每一样本图像对应第二识别结果与第一真实标签的损失值计算得到的。关于上述第二损失值的计算可参见下文描述,在此不作具体说明。
上述步骤S504是对上述步骤S104的细化。
在本申请实施例中,由于第二损失值是根据每一第一样本图像对应第一识别结果与第一真实标签间的损失值,以及每一样本图像对应第二识别结果与第一真实标签的损失值计算得到的,因此,第二损失值越小,则第一识别结果和第二识别结果的准确性越高,这有效提高了基于第二特征数据训练得到的特征提取网络的准确性。
另一个可选的实施例中,根据图1所示的方法,本申请实施例还提供了一种特征提取网络训练方法。如图6所示,图6为本申请实施例提供的特征提取网络训练方法的第五种流程示意图。该方法包括以下步骤。
步骤S601,获取第一数据集,第一数据集包括多个第一样本图像和每一第一样本图像的第一真实标签。
步骤S602,针对每一第一样本图像,利用预设特征提取网络,对该第一样本图像进行特征提取,得到该第一样本图像的第一特征数据。
步骤S603,将该第一样本图像的第一特征数据,输入至该第一样本图像的图像场景对应的预设特征转换网络,生成该第一样本图像的第二特征数据,预设特征转换网络是利用不同图像场景的样本图像的特征数据进行训练得到的。
上述步骤S601-步骤S603与上述步骤S101-步骤S103相同。
步骤S604,根据多个第一样本图像对应的第一识别结果、第二识别结果和第一真实标签间的第二损失值,调整预设识别网络的参数,得到调整后的预设识别网络,第一识别结果为预设识别网络根据第一样本图像的第一特征数据进行目标识别得到的,第二识别结果为预设识别网络对第一样本图像的第二特征数据进行目标识别得到的。
在本步骤中,电子设备在利用上述预设特征转换网络得到每一第一样本图像对应的第二特征数据后,可以利用预设识别网络分别根据每一样本图像的第一特征数据和第二特征数据进行目标识别,得到第一识别结果和第二识别结果,从而根据每一第一样本图像对应的第一识别结果与第一真实标签间的差异,以及每一第一样本图像对应第二识别结果与第一真实标签间的差异,计算该预设识别网络的第二损失值,并基于该第二损失值对预设识别网络的参数进行微调,得到调整后的预设识别网络。
在本申请实施例中,上述预设识别网络中包括多个目标物的参数,每一目标物的参数用于指示该目标物的权重。上述预设识别网络的识别结果即为该预设识别网络输出的预测值,该识别结果可以表示为识别数组,该识别数组中的每一数组元素用于指示该第一样本图像中目标物为预设识别网络中各目标物的概率。
上述预设识别网络中的多个目标物为该预设识别网络所识别出的目标物,根据训练预设识别网络的样本数据中目标物的不同,该预设识别网络所表示的目标物也有所不同的。
上述预设识别网络可以是与上述预设特征提取网络一起训练得到的。关于预设识别网络的训练过程可参见下文描述,在此不作赘述。
一个可选的实施例中,如图7所示,图7为本申请实施例提供的预设识别网络参数调整方法的一种流程示意图。该方法包括以下步骤。
步骤S701,针对每一第一样本图像,利用预设识别网络,根据该第一样本图像的第一特征数据进行目标识别,得到该第一样本图像的第一识别结果,并根据第一识别结果确定该第一样本图像的第一预测标签。
一个可选的实施例中,当上述识别结果可以表示为识别数组时,电子设备根据第一识别结果确定第一样本图像的第一预测标签,具体可以表示为:电子设备可以将识别数组中最大数组元素所对应的目标物的属性信息,确定为该第一样本图像的第一预测标签。
另一个可选的实施例中,上述识别结果中可以包括对应的预测标签,电子设备可以直接将第一识别结果中包括的预测标签,确定为第一样本图像的第一预测标签。
在此,对上述第一预测标签的确定方法不作具体限定。
步骤S702,利用预设识别网络,根据该第一样本图像的第二特征数据进行目标识别,得到该第一样本图像的第二识别结果,并根据第二识别结果确定该第一样本图像的第二预测标签。
上述第二识别结果的确定方式可参照上述第一识别结果的确定方式,上述第二预测标签的确定方式可参照上述第一预测标签的确定方式。在此,对上述第二识别结果和第二预测标签的确定过程不作具体说明。
步骤S703,计算该第一样本图像对应的第一预测标签与第一真实标签间的第四损失值。
在本步骤中,针对每一第一样本图像,电子设备可以利用预设损失函数,如交叉熵损失函数等,计算该第一样本图像的第一预测标签和第一真实标签间的损失值(记为第四损失值)。在此,对预设损失函数不作具体限定。
步骤S704,计算该第一样本图像对应的第二预测标签与第一真实标签间的第五损失值。
上述第五损失值的计算方式可参照上述第四损失值的计算方式,在此不作具体说明。
步骤S705,根据多个第一样本图像对应的第四损失值和第五损失值,计算预设识别网络的第二损失值。
一个可选的实施例中,在计算上述第二损失值时,电子设备可以计算每一第一样本图像对应的第四损失值和第五损失值间的和值,作为预设识别网络的第二损失值。
另一个可选的实施例中,在计算上述第二损失值时,电子设备可以计算每一第一样本图像对应的第四损失值和第五损失值间的加权和,作为预设识别网络的第二损失值。
在本申请实施例中,对上述第二损失值的计算方式不作具体限定。
步骤S706,基于第二损失值对预设识别网络中各目标物对应的权重初始值进行调整,并返回执行针对每一第一样本图像,利用预设识别网络,根据该第一样本图像的第一特征数据进行目标识别,得到该第一样本图像的第一识别结果的步骤,直至预设识别网络收敛,得到调整后的预设识别网络。
在本申请实施例中,电子设备在计算得到上述第二损失值后,可以基于该预设识别网络的第二损失值和/或训练次数,确定预设识别网络是否收敛。
若上述预设识别网络未收敛,则电子设备可以基于上述第二损失值对预设识别网络中每一目标物对应的权重进行调整,也就是对上述更新后的权重初始值进行调整,直至预设识别网络收敛。
若上述预设识别网络收敛,则电子设备可以将当前时刻的预设识别网络确定为调整后的预设识别网络。
在本申请实施例中,电子设备在基于上述第二损失值对上述权重初始值进行调整时,可以对上述权重初始值进行微调。也就是按照较小的调节步长,调整上述权重初始值。
通过上述步骤S701-步骤S706,电子设备可以准确计算得到预设识别网络的第二损失值,从而基于该第二损失值完成对预设识别网络的参数调整,提高了预设识别网络参数调整的准确性。
步骤S605,根据多个第一样本数据对应的第三识别结果和第一真实标签间的第三损失值,调整预设特征提取网络的参数,并返回执行针对每一第一样本图像,利用预设特征提取网络,对该第一样本图像进行特征提取,得到该第一样本图像的第一特征数据的步骤,直至预设特征提取网络收敛,得到训练完成的特征提取网络;第三识别结果为调整后的预设识别网络根据第一样本图像的第一特征数据进行目标识别得到的。
一个可选的实施例中,上述步骤S605中的根据多个第一样本数据对应的第三识别结果和第一真实标签间的第三损失值,调整预设特征提取网络的参数,可以包括以下步骤,具体如图8所示,图8为本申请实施例提供的预设特征提取网络参数调整方法的一种流程示意图。该方法包括以下步骤。
步骤S801,针对每一第一样本图像,利用调整后的预设识别网络,根据该第一样本图像的第一特征数据进行目标识别,得到该第一样本图像的第三识别结果,并根据第三识别结果确定该第一样本图像的第三预测标签。
在本步骤中,通过上述步骤S706得到上述调整后的预设识别网络后,针对上述每一第一样本图像,电子设备可以将该第一样本图像的第一特征数据输入调整后的预设识别网络中,得到该第一样本图像中目标物的识别结果(记为第三识别结果),并根据该第三识别结果确定该第一样本图像的预测标签(记为第三预测标签)。
上述第三识别结果的确定方式可参照上述第一识别结果的确定方式,上述第三预测标签的确定方式可参照上述第一预测标签的确定方式。在此,对上述第三识别结果和第三预测标签的确定过程不作具体说明。
步骤S802,计算多个第一样本图像对应的第三预测标签和第一真实标签间的损失值,作为预设特征提取网络的第三损失值。
在本步骤中,在确定每一第一样本图像对应的第三预测标签后,电子设备可以根据每一第一样本图像对应的第三预测标签和第一真实标签,利用预设损失函数,如交叉熵损失函数等,计算第三预测标签和第一真实标签间的损失值(记为第三损失值),作为预设特征提取网络的第三损失值。在此,对预设损失函数不作具体限定。
在上述步骤S801和步骤S802中,由于上述预设特征提取网络的输出结果仅为上述第一特征数据,并且,上述调整后的预设识别网络是通过上述第四损失值和第五损失值所计算得到的第二损失值进行参数调整的,因此,通过上述调整后的预设识别网络,在实现样本图像的特征数据在特征层面的数据拓展的同时,提高了基于第二特征数据进行参数调整后的预设识别网络的准确性,从而提高了利用调整后的预设识别网络所识别出的第三识别结果的准确性,以及基于第三预测标签和第一真实标签确定出预设特征提取网络所对应的损失值的准确性,便于后期对预设特征提取网络的参数调整过程,实现对预设特征提取网络的训练,提高了训练得到的特征提取网络对不同图像场景的图像的特征提取适应性。
在上述实施例中,上述步骤S801与步骤S802均由上述电子设备执行,除此以外,上述第三预测标签和第三损失值也可以由上述预设识别模型处理得到。也就是上述预设识别模型的输出结果包括上述第三预测标签和第三损失值。
步骤S803,基于第三损失值,调整预设特征提取网络的参数。
在本申请实施例中,电子设备在确定上述预设特征提取网络的第三损失值后,可以基于该预设特征提取网络的第三损失值和/或训练次数,确定该预设特征提取网络是否收敛。
若预设特征提取网络未收敛,则电子设备可以基于上述第三损失值,对该预设特征提取网络的参数进行调整,并返回执行上述步骤S602,也就是继续对预设特征提取网络进行训练,直至预设特征提取网络收敛。
若预设特征提取网络收敛,则电子设备可以将当前时刻的预设特征提取网络确定为训练好的特征提取网络。
一个可选的实施例中,在确定上述预设特征提取网络是否收敛时,电子设备可以将上述第三损失值与预设损失值阈值进行比较。当第三损失值大于预设损失值阈值时,电子设备可以确定预设特征提取网络未收敛。当第三损失值小于等于预设损失值阈值时,电子设备可以确定预设特征提取网络收敛。
另一个可选的实施例中,在确定上述预设特征提取网络是否收敛时,电子设备可以将预设特征提取网络的训练次数加1,并将训练次数与预设次数阈值进行比较。当训练次数小于预设次数阈值时,电子设备可以确定预设特征提取网络未收敛。当训练次数等于预设次数阈值时,电子设备可以确定预设特征提取网络收敛。
在此,对根据预设特征提取网络的第三损失值和训练次数确定该预设特征提取网络是否收敛的方法不作具体说明。
一个可选的实施例中,电子设备可以利用预设参数调整算法,对上述预设特征提取网络的参数进行调整。
上述预设参数调整算法包括但不限于随机梯度下降(stochastic gradientdescent,SGD)算法、自适应动量估计(Adaptive Moment Estimation,ADAM)算法。在此,对上述预设参数调整算法不作具体限定。
在本申请实施例中,上述预设循环对抗生成网络和预设识别网络收敛判断方法以及参数调整方法均可参照上述预设特征提取网络的收敛判断方法和参数调整方法,在此不作具体说明。
一个可选的实施例中,根据上述图1所示的方法,本申请实施例还提供了一种特征提取网络训练方法。如图9所示,图9为本申请实施例提供的特征提取网络训练方法的第六种流程示意图。该方法包括以下步骤。
步骤S901,获取第三数据集,第三数据集包括多个第四样本图像和每一第四样本图像的第二真实标签。
步骤S902,针对每一第四样本图像,利用第一网络模型对该第四样本图像进行特征提取,得到该第四样本图像的第七特征数据。
上述第七特征数据的提取方式可参照上述第一特征数据的提取方式,在此不作具体说明。
上述第一网络模型为上述预设特征提取网络未训练前对应的网络模型,该第一网络模型可以为神经网络模型,如上述卷积神经网络模型等,该第一网络模型用于对输入的图像中的目标物进行特征提取。在此,对上述第一网络模型不作具体限定。
步骤S903,将该第四样本图像的第七特征数据输入第二网络模型,得到该第四样本图像的第四识别结果,并根据第四识别结果,确定该第四样本图像的第四预测标签。
上述第四预测标签的确定方式可参照上述第一预测标签的确定方式,在此不作具体说明。
上述第二网络模型即为上述预设识别网络未训练前对应的网络模型,该第二网络模型可以为深度学习模型,也可以为机器学习模型。该第二网络模型可以用于根据输入的特征数据,对上述第一网络模型输入的图像中的目标物进行识别后分类等。在此,对上述第二网络模型不作具体限定。
步骤S904,根据多个第四样本图像对应的第四预测标签和第二真实标签,计算第一网络模型和第二网络模型的第六损失值。
上述第六损失值的计算方式可参照上述第三损失值的计算方式,在此,对上述第六损失值的计算过程不作具体说明。
步骤S905,基于第六损失值,调整第一网络模型和第二网络模型的参数,并返回执行针对每一第四样本图像,利用第一网络模型对该第四样本图像进行特征提取,得到该第四样本图像的第七特征数据的步骤,直至第一网络模型和第二网络模型收敛,将当前的第一网络模型确定为预设特征提取网络,并将当前的第二网络模型确定为预设识别网络。
在本申请实施例中,电子设备可以计算得到上述第六损失值后,可以根据上述第一网络模型和第二网络模型的第六损失值和/或训练次数,确定上述第一网络模型和第二网络模型是否收敛。
若上述第一网络模型和第二网络模型未收敛,则电子设备可以基于上述第六损失值调整第一网络模型和第二网络模型的参数,并返回执行上述步骤S902,也就是重新对第一网络模型和第二网络模型进行训练,直至第一网络模型和第二网络模型收敛。
若上述第一网络模型和第二网络模型收敛,则电子设备可以将当前时刻的第一网络模型确定为上述预设特征提取网络,并将上述第二网络模型确定为上述预设识别网络。
上述第一网络模型和第二网络模型的收敛判断方式以及参数调整方法可参照上述预设特征提取网络的收敛判断方式以及参数调整方法,在此不作具体说明。
通过上述步骤S901-步骤S905,电子设备可以利用上述第三数据集中的数据,完成对第一网络模型和第二网络模型的训练过程,使得第一网络模型具备对图像数据的特征提取功能,第二网络模型具备对第一网络模型提取到的特征数据的识别能力,从而便于对训练得到的预设特征提取网络进一步训练。
步骤S906,获取第一数据集,第一数据集包括多个第一样本图像和每一第一样本图像的第一真实标签。
步骤S907,针对每一第一样本图像,利用预设特征提取网络,对该第一样本图像进行特征提取,得到该第一样本图像的第一特征数据。
步骤S908,将该第一样本图像的第一特征数据,输入至该第一样本图像的图像场景对应的预设特征转换网络,生成该第一样本图像的第二特征数据,预设特征转换网络是利用不同图像场景的样本图像的特征数据进行训练得到的。
步骤S909,根据预设识别网络对每一第一样本图像对应第一特征数据和第二特征数据的识别结果,以及每一第一样本图像的第一真实标签,调整预设特征提取网络的参数,并返回执行针对每一第一样本图像,利用预设特征提取网络,对该第一样本图像进行特征提取,得到该第一样本图像的第一特征数据的步骤,直至预设特征提取网络收敛,得到训练完成的特征提取网络。
上述步骤S906-步骤S909与上述步骤S101-步骤S104相同。
基于同一种发明构思,根据上述本申请实施例提供的特征提取网络训练方法,本申请实施例还提供了一种图像识别方法。该方法可以应用于上述电子设备,也可以应用于其他电子设备。为便于理解,仍以上述电子设备为执行主体进行说明,并不起任何限定作用。
如图10所示,图10为本申请实施例提供的图像识别方法的一种流程示意图。该方法包括以下步骤。
步骤S1001,获取待识别人脸图像。
步骤S1002,将待识别人脸图像输入特征提取网络,得到待识别人脸图像的人脸特征数据。
在本步骤中,电子设备可以利用上述训练好的特征提取网络,对待识别人脸图像中的目标人脸进行特征提取,得到待识别人脸图像的人脸特征数据。
步骤S1003,基于人脸特征数据,得到人脸识别结果。
在本步骤中,电子设备根据上述人脸特征数据,利用识别网络确定待识别图像中目标人脸的属性信息,得到人脸识别结果。例如,电子设备可以利用身份识别网络,确定待识别人脸图像中目标人脸的身份信息。
在上述步骤S1001-步骤S1003中,由于特征提取网络是通过特征层面数据拓展得到的特征数据训练得到的,因此,特征提取网络可以对不同图像场景的待识别图像进行特征提取,有效保证了提取到的特征数据的准确性,从而便于基于该特征数据进行后续的图像处理,如图像识别、图像分类等。
基于同一种发明构思,根据上述本申请实施例提供的特征提取网络训练方法,本申请实施例还提供了一种特征提取网络训练装置。如图11所示,图11为本申请实施例提供的特征提取网络训练装置的一种结构示意图。该装置包括以下模块。
第一获取模块1101,用于获取第一数据集,第一数据集包括多个第一样本图像和每一第一样本图像的第一真实标签;
第一提取模块1102,用于针对每一第一样本图像,利用预设特征提取网络,对该第一样本图像进行特征提取,得到该第一样本图像的第一特征数据;
第一生成模块1103,用于将该第一样本图像的第一特征数据,输入至该第一样本图像的图像场景对应的预设特征转换网络,生成该第一样本图像的第二特征数据,预设特征转换网络是利用不同图像场景的样本图像的特征数据进行训练得到的;
第一调整模块1104,用于根据预设识别网络对每一第一样本图像对应第一特征数据和第二特征数据的识别结果,以及每一第一样本图像的第一真实标签,调整预设特征提取网络的参数,并返回执行针对每一第一样本图像,利用预设特征提取网络,对该第一样本图像进行特征提取,得到该第一样本图像的第一特征数据的步骤,直至预设特征提取网络收敛,得到训练完成的特征提取网络。
可选的,上述预设特征转换网络为预先训练好的循环对抗生成网络中的第一生成器或第二生成器;
上述特征提取网络训练装置还可以包括:
第二获取模块,用于在将该第一样本图像的第一特征数据,输入至该第一样本图像的图像场景对应的预设特征转换网络,生成该第一样本图像的第二特征数据之前,获取第二数据集,第二数据集包括第一图像场景的第二样本图像的第三特征数据,以及第二图像场景的第三样本图像的第四特征数据;
第二生成模块,用于将第二样本图像的第三特征数据输入预设循环对抗生成网络中的第一生成器,得到该第二样本图像在第二图像场景对应的第五特征数据;
第三生成模块,用于将该第二样本图像对应的第五特征数据输入预设循环对抗生成网络中的第二生成器,得到该第二样本图像在第一图像场景的第一重构特征数据;
第四生成模块,用于将第三样本图像对应的第四特征数据输入第二生成器,得到该第三样本图像在第一图像场景对应的第六特征数据;
第五生成模块,用于将该第三样本图像对应的第六特征数据输入第一生成器,得到该第三样本图像在第二图像场景的第二重构特征数据;
第一计算模块,用于基于第三特征数据、第四特征数据、第一重构特征数据和第二重构特征数据,计算预设循环对抗生成网络的第三损失值;
第二调整模块,用于基于第三损失值调整预设循环对抗生成网络的参数,并返回执行将第二样本图像的第三特征数据输入预设循环对抗生成网络中的第一生成器,得到该第二样本图像在第二图像场景对应的第五特征数据的步骤,直至预设循环对抗生成网络收敛,得到训练好的循环对抗生成网络。
可选的,上述特征提取网络训练装置还可以包括:
第三获取模块,用于在针对每一第一样本图像,利用预设特征提取网络,对该第一样本图像进行特征提取,得到该第一样本图像的第一特征数据之前,针对第三数据集中的每一目标物,获取该目标物在预设图像场景中的多个采集图像,第三数据集为预设识别网络训练的训练数据的集合;
第二提取模块,用于针对每一采集图像,利用预设特征提取网络对该采集图像进行特征提取,得到该采集图像的第七特征数据;
第二计算模块,用于计算多个采集图像的第七特征数据的平均值,更新预设识别网络中该目标物所对应的权重初始值。
可选的,上述第一调整模块1104,包括:
第一调整子模块,用于根据多个第一样本图像对应的第一识别结果、第二识别结果和第一真实标签间的第一损失值,调整预设识别网络的参数,得到调整后的预设识别网络,第一识别结果为预设识别网络根据第一样本图像的第一特征数据进行目标识别得到的,第二识别结果为预设识别网络对第一样本图像的第二特征数据进行目标识别得到的;
第二调整子模块,用于根据多个第一样本数据对应的第三识别结果和第一真实标签间的第二损失值,调整预设特征提取网络的参数,第三识别结果为调整后的预设识别网络根据第一样本图像的第一特征数据进行目标识别得到的。
可选的,上述第一调整子模块,具体可以用于针对每一第一样本图像,利用预设识别网络,根据该第一样本图像的第一特征数据进行目标识别,得到该第一样本图像的第一识别结果,并根据第一识别结果确定该第一样本图像的第一预测标签;
利用预设识别网络,根据该第一样本图像的第二特征数据进行目标识别,得到该第一样本图像的第二识别结果,并根据第二识别结果确定该第一样本图像的第二预测标签;
计算该第一样本图像对应的第一预测标签与第一真实标签间的第四损失值;
计算该第一样本图像对应的第二预测标签与第一真实标签间的第五损失值;
根据多个第一样本图像对应的第四损失值和第五损失值,计算预设识别网络的第一损失值;
基于第一损失值对预设识别网络中各目标物对应的权重初始值进行调整,并返回执行针对每一第一样本图像,利用预设识别网络,根据该第一样本图像的第一特征数据进行目标识别,得到该第一样本图像的第一识别结果的步骤,直至预设识别网络收敛,得到调整后的预设识别网络。
可选的,上述第二调整子模块,具体可以用于针对每一第一样本图像,利用调整后的预设识别网络,根据该第一样本图像的第一特征数据进行目标识别,得到该第一样本图像的第三识别结果,并根据第三识别结果确定该第一样本图像的第三预测标签;
计算多个第一样本图像对应的第三预测标签和第一真实标签间的损失值,作为预设特征提取网络的第二损失值;
基于第二损失值,调整预设特征提取网络的参数。
可选的,上述特征提取网络训练装置还可以包括:
第四获取模块,用于在获取第一数据集之前,获取第三数据集,第三数据集包括多个第四样本图像和每一第四样本图像的第二真实标签;
第三提取模块,用于针对每一第四样本图像,利用第一网络模型对该第四样本图像进行特征提取,得到该第四样本图像的第七特征数据;
第一识别模块,用于将该第四样本图像的第七特征数据输入第二网络模型,得到该第四样本图像的第四识别结果,并根据第四识别结果,确定该第四样本图像的第四预测标签;
第三计算模块,用于根据多个第四样本图像对应的第四预测标签和第二真实标签,计算第一网络模型和第二网络模型的第六损失值;
第三调整模块,用于基于第六损失值,调整第一网络模型和第二网络模型的参数,并返回执行针对每一第四样本图像,利用第一网络模型对该第四样本图像进行特征提取,得到该第四样本图像的第七特征数据的步骤,直至第一网络模型和第二网络模型收敛,将当前的第一网络模型确定为预设特征提取网络,并将当前的第二网络模型确定为预设识别网络。
基于同一种发明构思,根据上述本申请实施例提供的图像识别方法,本申请实施例还提供了一种图像识别装置。如图12所示,图12为本申请实施例提供的图像识别装置的一种结构示意图。该装置包括以下模块。
第五获取模块1201,用于获取待识别人脸图像;
第四提取模块1202,用于将待识别人脸图像输入特征提取网络,得到待识别人脸图像的人脸特征数据;其中,特征提取网络为上述任一特征提取网络训练方法中训练完成的特征提取网络;
识别模块1203,用于基于人脸特征数据,得到人脸识别结果。
通过本申请实施例提供的装置,可以利用预设特征提取网络,对第一数据集中的每一第一样本图像进行特征提取,得到该第一样本图像的第一特征数据,针对每一第一样本图像,利用该第一样本图像的图像场景所对应的预设特征转换网络,生成第一样本图像在不同图像场景下的第二特征数据,从而根据预设识别网络对每一第一样本图像对应第一特征数据和第二特征数据的识别结果,以及每一第一样本图像的第一真实标签,调整预设特征提取网络的参数,重复对预设特征提取网络的训练过程,直至预设特征提取网络收敛,得到训练好的特征提取网络。
通过每一第一样本图像的图像场景所对应的预设特征转换网络,可以生成第一样本图像在不同图像场景中的第二特征数据,也就是在网络训练阶段生成了样本图像在不同图像场景所对应的特征数据,实现样本图像的特征数据在特征层面的数据拓展,有效提高了基于多种不同图像场景的特征数据训练得到的特征提取网络对不同图像场景的图像的适用性,使得训练得到的特征提取网络可以对不同图像场景中采集到的图像进行特征提取,提高了训练得到的特征提取网络的性能。
另外,在利用预设特征转换网络对每一样本图像的特征数据进行特征转换得到第二特征数据后,预设特征提取网络的参数调整过程不仅受到各样本图像对应第一特征数据的影响,还受到各样本图像对应第二特征数据的影响,这使得拓展得到的第二特征数据更加贴近真实图像场景所对应的特征数据,从而提高了基于多种不同图像场景的特征数据训练得到的特征提取网络的准确性。
本申请实施例还提供了一种电子设备,如图13所示,包括处理器1301、通信接口1302、存储器1303和通信总线1304,其中,处理器1301,通信接口1302,存储器1303通过通信总线1304完成相互间的通信,
存储器1303,用于存放计算机程序;
处理器1301,用于执行存储器1303上所存放的程序时,实现如下步骤:
获取第一数据集,第一数据集包括多个第一样本图像和每一第一样本图像的第一真实标签;
针对每一第一样本图像,利用预设特征提取网络,对该第一样本图像进行特征提取,得到该第一样本图像的第一特征数据;
将该第一样本图像的第一特征数据,输入至该第一样本图像的图像场景对应的预设特征转换网络,生成该第一样本图像的第二特征数据,预设特征转换网络是利用不同图像场景的样本图像的特征数据进行训练得到的;
根据预设识别网络对每一第一样本图像对应第一特征数据和第二特征数据的识别结果,以及每一第一样本图像的第一真实标签,调整预设特征提取网络的参数,并返回执行针对每一第一样本图像,利用预设特征提取网络,对该第一样本图像进行特征提取,得到该第一样本图像的第一特征数据的步骤,直至预设特征提取网络收敛,得到训练完成的特征提取网络。
本申请实施例还提供了一种电子设备,如图14所示,包括处理器1401、通信接口1402、存储器1403和通信总线1404,其中,处理器1401,通信接口1402,存储器1403通过通信总线1404完成相互间的通信,
存储器1403,用于存放计算机程序;
处理器1401,用于执行存储器1403上所存放的程序时,实现如下步骤:
获取待识别人脸图像;
将待识别人脸图像输入特征提取网络,得到待识别人脸图像的人脸特征数据;其中,特征提取网络为基于上述任一特征提取网络训练方法训练完成的特征提取网络;
基于人脸特征数据,得到人脸识别结果。
通过本申请实施例提供的电子设备,可以利用预设特征提取网络,对第一数据集中的每一第一样本图像进行特征提取,得到该第一样本图像的第一特征数据,针对每一第一样本图像,利用该第一样本图像的图像场景所对应的预设特征转换网络,生成第一样本图像在不同图像场景下的第二特征数据,从而根据预设识别网络对每一第一样本图像对应第一特征数据和第二特征数据的识别结果,以及每一第一样本图像的第一真实标签,调整预设特征提取网络的参数,重复对预设特征提取网络的训练过程,直至预设特征提取网络收敛,得到训练好的特征提取网络。
通过每一第一样本图像的图像场景所对应的预设特征转换网络,可以生成第一样本图像在不同图像场景中的第二特征数据,也就是在网络训练阶段生成了样本图像在不同图像场景所对应的特征数据,实现样本图像的特征数据在特征层面的数据拓展,有效提高了基于多种不同图像场景的特征数据训练得到的特征提取网络对不同图像场景的图像的适用性,使得训练得到的特征提取网络可以对不同图像场景中采集到的图像进行特征提取,提高了训练得到的特征提取网络的性能。
另外,在利用预设特征转换网络对每一样本图像的特征数据进行特征转换得到第二特征数据后,预设特征提取网络的参数调整过程不仅受到各样本图像对应第一特征数据的影响,还受到各样本图像对应第二特征数据的影响,这使得拓展得到的第二特征数据更加贴近真实图像场景所对应的特征数据,从而提高了基于多种不同图像场景的特征数据训练得到的特征提取网络的准确性。
上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述电子设备与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,RAM),也可以包括非易失性存储器(Non-Volatile Memory,NVM),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital SignalProcessor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
基于同一种发明构思,根据上述本申请实施例提供的特征提取网络训练方法,本申请实施例一种计算机可读存储介质,该计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述任一特征提取网络训练方法的步骤。
基于同一种发明构思,根据上述本申请实施例提供的特征提取网络训练方法,本申请实施例一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一特征提取网络训练方法。
基于同一种发明构思,根据上述本申请实施例提供的图像识别方法,本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述任一图像识别方法的步骤。
基于同一种发明构思,根据上述本申请实施例提供的图像识别方法,本申请实施例还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一图像识别方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、电子设备、计算机可读存储介质及计算机程序产品等实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本申请的较佳实施例,并非用于限定本申请的保护范围。凡在本申请的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本申请的保护范围内。
Claims (10)
1.一种特征提取网络训练方法,其特征在于,所述方法包括:
获取第一数据集,所述第一数据集包括多个第一样本图像和每一第一样本图像的第一真实标签;
针对每一第一样本图像,利用预设特征提取网络,对该第一样本图像进行特征提取,得到该第一样本图像的第一特征数据;
将该第一样本图像的第一特征数据,输入至该第一样本图像的图像场景对应的预设特征转换网络,生成该第一样本图像的第二特征数据,所述预设特征转换网络是利用不同图像场景的样本图像的特征数据进行训练得到的;
根据预设识别网络对每一第一样本图像对应第一特征数据和第二特征数据的识别结果,以及每一第一样本图像的第一真实标签,调整所述预设特征提取网络的参数,并返回执行所述针对每一第一样本图像,利用预设特征提取网络,对该第一样本图像进行特征提取,得到该第一样本图像的第一特征数据的步骤,直至所述预设特征提取网络收敛,得到训练完成的特征提取网络。
2.根据权利要求1所述的方法,其特征在于,所述预设特征转换网络为预先训练好的循环对抗生成网络中的第一生成器或第二生成器;
在将该第一样本图像的第一特征数据,输入至该第一样本图像的图像场景对应的预设特征转换网络,生成该第一样本图像的第二特征数据之前,所述方法还包括:
获取第二数据集,所述第二数据集包括第一图像场景的第二样本图像的第三特征数据,以及第二图像场景的第三样本图像的第四特征数据;
将所述第二样本图像的第三特征数据输入预设循环对抗生成网络中的第一生成器,得到该第二样本图像在所述第二图像场景对应的第五特征数据;
将该第二样本图像对应的第五特征数据输入所述预设循环对抗生成网络中的第二生成器,得到该第二样本图像在所述第一图像场景的第一重构特征数据;
将第三样本图像对应的第四特征数据输入所述第二生成器,得到该第三样本图像在所述第一图像场景对应的第六特征数据;
将该第三样本图像对应的第六特征数据输入所述第一生成器,得到该第三样本图像在所述第二图像场景的第二重构特征数据;
基于所述第三特征数据、所述第四特征数据、所述第一重构特征数据和所述第二重构特征数据,计算所述预设循环对抗生成网络的第一损失值;
基于所述第一损失值调整所述预设循环对抗生成网络的参数,并返回执行所述将所述第二样本图像的第三特征数据输入预设循环对抗生成网络中的第一生成器,得到该第二样本图像在所述第二图像场景对应的第五特征数据的步骤,直至所述预设循环对抗生成网络收敛,得到训练好的循环对抗生成网络。
3.根据权利要求1所述的方法,其特征在于,在针对每一第一样本图像,利用预设特征提取网络,对该第一样本图像进行特征提取,得到该第一样本图像的第一特征数据之前,所述方法还包括:
针对第三数据集中的每一目标物,获取该目标物在预设图像场景中的多个采集图像,所述第三数据集为所述预设识别网络训练的训练数据的集合;
针对每一采集图像,利用所述预设特征提取网络对该采集图像进行特征提取,得到该采集图像的第七特征数据;
计算所述多个采集图像的第七特征数据的平均值,更新所述预设识别网络中该目标物所对应的权重初始值。
4.根据权利要求1所述的方法,其特征在于,所述根据预设识别网络对每一第一样本图像对应第一特征数据和第二特征数据的识别结果,以及每一第一样本图像的第一真实标签,调整所述预设特征提取网络的参数的步骤,包括:
根据所述多个第一样本图像对应的第一识别结果、第二识别结果和第一真实标签间的第二损失值,调整预设识别网络的参数,得到调整后的预设识别网络,所述第一识别结果为所述预设识别网络根据所述第一样本图像的第一特征数据进行目标识别得到的,所述第二识别结果为所述预设识别网络对所述第一样本图像的第二特征数据进行目标识别得到的;
根据所述多个第一样本数据对应的第三识别结果和第一真实标签间的第三损失值,调整所述预设特征提取网络的参数,所述第三识别结果为调整后的预设识别网络根据所述第一样本图像的第一特征数据进行目标识别得到的。
5.根据权利要求3或4所述的方法,其特征在于,所述根据所述多个第一样本图像对应的第一识别结果、第二识别结果和第一真实标签间的第二损失值,调整预设识别网络的参数,得到调整后的预设识别网络的步骤,包括:
针对每一第一样本图像,利用预设识别网络,根据该第一样本图像的第一特征数据进行目标识别,得到该第一样本图像的第一识别结果,并根据所述第一识别结果确定该第一样本图像的第一预测标签;
利用所述预设识别网络,根据该第一样本图像的第二特征数据进行目标识别,得到该第一样本图像的第二识别结果,并根据所述第二识别结果确定该第一样本图像的第二预测标签;
计算该第一样本图像对应的第一预测标签与第一真实标签间的第四损失值;
计算该第一样本图像对应的第二预测标签与第一真实标签间的第五损失值;
根据所述多个第一样本图像对应的第四损失值和第五损失值,计算所述预设识别网络的第二损失值;
基于所述第二损失值对所述预设识别网络中各目标物对应的权重初始值进行调整,并返回执行针对每一第一样本图像,利用预设识别网络,根据该第一样本图像的第一特征数据进行目标识别,得到该第一样本图像的第一识别结果的步骤,直至所述预设识别网络收敛,得到调整后的预设识别网络。
6.根据权利要求5所述的方法,其特征在于,所述根据所述多个第一样本数据对应的第三识别结果和第一真实标签间的第三损失值,调整所述预设特征提取网络的参数的步骤,包括:
针对每一第一样本图像,利用所述调整后的预设识别网络,根据该第一样本图像的第一特征数据进行目标识别,得到该第一样本图像的第三识别结果,并根据所述第三识别结果确定该第一样本图像的第三预测标签;
计算所述多个第一样本图像对应的第三预测标签和第一真实标签间的损失值,作为所述预设特征提取网络的第三损失值;
基于所述第三损失值,调整所述预设特征提取网络的参数。
7.根据权利要求1所述的方法,其特征在于,在获取第一数据集之前,所述方法还包括:
获取第三数据集,所述第三数据集包括多个第四样本图像和每一第四样本图像的第二真实标签;
针对每一第四样本图像,利用第一网络模型对该第四样本图像进行特征提取,得到该第四样本图像的第七特征数据;
将该第四样本图像的第七特征数据输入第二网络模型,得到该第四样本图像的第四识别结果,并根据所述第四识别结果,确定该第四样本图像的第四预测标签;
根据所述多个第四样本图像对应的第四预测标签和第二真实标签,计算所述第一网络模型和所述第二网络模型的第六损失值;
基于所述第六损失值,调整所述第一网络模型和所述第二网络模型的参数,并返回执行所述针对每一第四样本图像,利用第一网络模型对该第四样本图像进行特征提取,得到该第四样本图像的第七特征数据的步骤,直至所述第一网络模型和所述第二网络模型收敛,将当前的第一网络模型确定为预设特征提取网络,并将当前的第二网络模型确定为预设识别网络。
8.一种图像识别方法,其特征在于,所述方法包括:
获取待识别人脸图像;
将所述待识别人脸图像输入特征提取网络,得到所述待识别人脸图像的人脸特征数据;其中,所述特征提取网络为权利要求1-7任一项方法中训练完成的特征提取网络;
基于所述人脸特征数据,得到人脸识别结果。
9.一种特征提取网络训练装置,其特征在于,所述装置包括:
第一获取模块,用于获取第一数据集,所述第一数据集包括多个第一样本图像和每一第一样本图像的第一真实标签;
第一提取模块,用于针对每一第一样本图像,利用预设特征提取网络,对该第一样本图像进行特征提取,得到该第一样本图像的第一特征数据;
第一生成模块,用于将该第一样本图像的第一特征数据,输入至该第一样本图像的图像场景对应的预设特征转换网络,生成该第一样本图像的第二特征数据,所述预设特征转换网络是利用不同图像场景的样本图像的特征数据进行训练得到的;
第一调整模块,用于根据预设识别网络对每一第一样本图像对应第一特征数据和第二特征数据的识别结果,以及每一第一样本图像的第一真实标签,调整所述预设特征提取网络的参数,并返回执行所述针对每一第一样本图像,利用预设特征提取网络,对该第一样本图像进行特征提取,得到该第一样本图像的第一特征数据的步骤,直至所述预设特征提取网络收敛,得到训练完成的特征提取网络。
10.一种图像识别装置,其特征在于,所述装置包括:
第五获取模块,用于获取待识别人脸图像;
第四提取模块,用于将所述待识别人脸图像输入特征提取网络,得到所述待识别人脸图像的人脸特征数据;其中,所述特征提取网络为权利要求1-7任一项方法中训练完成的特征提取网络;
识别模块,用于基于所述人脸特征数据,得到人脸识别结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210240746.4A CN114677519A (zh) | 2022-03-10 | 2022-03-10 | 特征提取网络训练和图像识别方法、装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210240746.4A CN114677519A (zh) | 2022-03-10 | 2022-03-10 | 特征提取网络训练和图像识别方法、装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114677519A true CN114677519A (zh) | 2022-06-28 |
Family
ID=82072117
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210240746.4A Pending CN114677519A (zh) | 2022-03-10 | 2022-03-10 | 特征提取网络训练和图像识别方法、装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114677519A (zh) |
-
2022
- 2022-03-10 CN CN202210240746.4A patent/CN114677519A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109190482B (zh) | 多标签视频分类方法及系统、系统训练方法及装置 | |
CN112329619B (zh) | 一种人脸识别方法、装置、电子设备及可读存储介质 | |
CN110348362B (zh) | 标签生成、视频处理方法、装置、电子设备及存储介质 | |
CN108491794B (zh) | 面部识别的方法和装置 | |
CN113792741B (zh) | 文字识别方法、装置、设备及存储介质 | |
CN110909784B (zh) | 一种图像识别模型的训练方法、装置及电子设备 | |
CN110135505B (zh) | 图像分类方法、装置、计算机设备及计算机可读存储介质 | |
CN113128478B (zh) | 模型训练方法、行人分析方法、装置、设备及存储介质 | |
CN111739539A (zh) | 确定说话人数量的方法、装置及存储介质 | |
EP3779775A1 (en) | Media processing method and related apparatus | |
WO2019167784A1 (ja) | 位置特定装置、位置特定方法及びコンピュータプログラム | |
CN111783935B (zh) | 卷积神经网络构建方法、装置、设备及介质 | |
CN114973086A (zh) | 视频处理方法、装置、电子设备及存储介质 | |
CN114239805A (zh) | 跨模态检索神经网络及训练方法、装置、电子设备、介质 | |
CN113468322A (zh) | 关键词识别模型的训练、提取方法、装置、设备及介质 | |
CN111353514A (zh) | 模型训练方法、图像识别方法、装置及终端设备 | |
CN109101984B (zh) | 一种基于卷积神经网络的图像识别方法及装置 | |
CN114090401B (zh) | 处理用户行为序列的方法及装置 | |
CN113128526B (zh) | 图像识别方法、装置、电子设备和计算机可读存储介质 | |
CN114299304A (zh) | 一种图像处理方法及相关设备 | |
CN117315310A (zh) | 一种图像识别方法、图像识别模型训练方法及装置 | |
CN117493881A (zh) | 一种模型生成方法、装置、设备及存储介质 | |
CN110263196B (zh) | 图像检索方法、装置、电子设备及存储介质 | |
CN116958868A (zh) | 用于确定文本和视频之间的相似度的方法和装置 | |
CN116258906A (zh) | 一种对象识别方法、特征提取模型的训练方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |