CN109190499A - 图像处理方法、装置、设备及计算机可读存储介质 - Google Patents

图像处理方法、装置、设备及计算机可读存储介质 Download PDF

Info

Publication number
CN109190499A
CN109190499A CN201810903741.9A CN201810903741A CN109190499A CN 109190499 A CN109190499 A CN 109190499A CN 201810903741 A CN201810903741 A CN 201810903741A CN 109190499 A CN109190499 A CN 109190499A
Authority
CN
China
Prior art keywords
neural network
network model
learned
data
priori features
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810903741.9A
Other languages
English (en)
Other versions
CN109190499B (zh
Inventor
杨少雄
赵晨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu Online Network Technology Beijing Co Ltd
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201810903741.9A priority Critical patent/CN109190499B/zh
Publication of CN109190499A publication Critical patent/CN109190499A/zh
Application granted granted Critical
Publication of CN109190499B publication Critical patent/CN109190499B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/20Movements or behaviour, e.g. gesture recognition
    • G06V40/28Recognition of hand or arm movements, e.g. recognition of deaf sign language
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/107Static hand or arm

Abstract

本发明提供一种图像处理方法、装置、设备及计算机可读存储介质,方法包括:获取待学习数据的先验特征;根据所述先验特征为神经网络模型设置初始化参数;根据所述待学习数据对所述神经网络模型进行训练,获得训练后的神经网络模型。通过采用待学习数据的先验特征为神经网络模型设置初始化参数,从而能够有效提高神经网络模型的学习效率,进而能够提高神经网络模型的训练效率。

Description

图像处理方法、装置、设备及计算机可读存储介质
技术领域
本发明涉及计算机领域,尤其涉及一种图像处理方法、装置、设备及计算机可读存储介质。
背景技术
在图像处理领域,利用机器学习算法模型对图像进行识别成为主流方法。在各类的机器学习算法模型中,其内的初始化参数能够在很大程度上决定整个机器学习算法模型的训练质量。
针对一个神经网络模型,其一般具有多个不同的层级,现有技术中,针对每个层级一般都是由用户自行设置初始化参数,或者随机设置初始化参数,随后对设置初始化参数的神经网络模型进行训练。
但是,由于模型是对数据的学习,因此,采用上述方法对神经网络模型的初始化参数进行设置,那么该神经网络模型预先对待学习的内容不了解,因此,针对每一待学习数据学习时间较长,从而导致神经网络模型学习效率较低。
发明内容
本发明提供一种图像处理方法、装置、设备及计算机可读存储介质,用于解决现有技术中由用户自行设置初始化参数,或者随机设置初始化参数而导致的神经网络模型学习效率较低的技术问题。
本发明的第一个方面是提供一种图像处理方法,包括:
获取待学习数据的先验特征;
根据所述先验特征为神经网络模型设置初始化参数;
根据所述待学习数据对所述神经网络模型进行训练,获得训练后的神经网络模型。
本发明的另一个方面是提供一种图像处理方法,包括:
接收待识别图像;
通过训练后的神经网络模型对待识别图像进行识别,所述训练后的神经网络模型是利用上述的图像处理方法训练获得的。
本发明的又一个方面是提供一种图像处理装置,包括:
先验特征获取模块,用于获取待学习数据的先验特征;
初始化参数设置模块,用于根据所述先验特征为神经网络模型设置初始化参数;
训练模块,用于根据所述待学习数据对所述神经网络模型进行训练,获得训练后的神经网络模型。
本发明的又一个方面是提供一种图像处理装置,包括:
接收模块,用于接收待识别图像;
识别模块,用于通过训练后的神经网络模型对待识别图像进行识别,所述训练后的神经网络模型是利用上述的图像处理方法训练获得的。
本发明的又一个方面是提供一种图像处理设备,包括:存储器,处理器;
存储器;用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为由所述处理器执行如上述的图像处理方法。
本发明的又一个方面是提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如上述的图像处理方法。
本发明的又一个方面是提供一种图像处理设备,包括:存储器,处理器;
存储器;用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为由所述处理器执行如上述的图像处理方法。
本发明的又一个方面是提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如上述的图像处理方法。
本发明提供的图像处理方法、装置、设备及计算机可读存储介质,通过获取待学习数据的先验特征;根据所述先验特征为神经网络模型设置初始化参数;根据所述待学习数据对所述神经网络模型进行训练,获得训练后的神经网络模型。通过采用待学习数据的先验特征为神经网络模型设置初始化参数,从而能够有效提高神经网络模型的学习效率,进而能够提高神经网络模型的训练效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
图1为本发明实施例一提供的图像处理方法的流程示意图;
图2为本发明实施例二提供的图像处理方法的流程示意图;
图3为本发明实施例三提供的图像处理方法的流程示意图;
图4为本发明实施例四提供的图像处理方法的流程示意图;
图5为本发明实施例五提供的图像处理装置的结构示意图;
图6为本发明实施例六提供的图像处理装置的结构示意图;
图7为本发明实施例七提供的图像处理装置的结构示意图;
图8为本发明实施例八提供的图像处理装置的结构示意图;
图9为本发明实施例九提供的图像处理设备的结构示意图;
图10为本发明实施例十提供的图像处理设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明实施例一提供的图像处理方法的流程示意图,如图1所示,所述方法包括:
步骤101、获取待学习数据的先验特征。
需要说明的是,本发明提供的图像处理方法的执行主体具体可为图像处理装置,该图像处理装置可通过硬件和/或软件的方式实现。一般可集成于云端服务器中,与存放有各类图像的数据服务器配合使用,此外,图像处理所基于的服务器可与数据服务器为同一服务器,或者为隶属于同一服务器集群的不同服务器,本发明对此均不进行限制。
在本实施方式中,针对一个神经网络模型,其一般具有多个不同的层级,现有技术中,针对每个层级一般都是由用户自行设置初始化参数,或者随机设置初始化参数,随后对设置初始化参数的神经网络模型进行训练。但是,由于模型是对数据的学习,因此,采用上述方法对神经网络模型的初始化参数进行设置,那么该神经网络模型预先对待学习的内容不了解,因此,针对每一待学习数据学习时间较长,从而导致神经网络模型学习效率较低。为了提高神经网络模型的学习效率,首先可以主动获取待学习数据的先验特征,从而后续可以减少神经网络模型对待学习数据的学习时间,提高神经网络模型的学习效率。
一般来说,该神经网络模型的类型包括但不限于卷积神经网络、长短期记忆神经网络、深度信念网络、生成对抗式网络、循环神经网络等等,本发明对神经网络模型的类型不进行限制,本领域技术人员可根据实际需求自行构建。
步骤102、根据所述先验特征为神经网络模型设置初始化参数。
在本实施方式中,获取到待学习数据的先验特征之后,可以根据该先验知识为神经网络模型设置初始化参数。具体地,由于先验特征在一定程度上已经表征了待学习数据的特性,因此,根据先验特征为神经网络模型设置初始化参数相当于预先让神经网络模型学习到待学习数据的特性,从而在后续训练过程中,能够有效提高神经网络模型的学习效率。
步骤103、根据所述待学习数据对所述神经网络模型进行训练,获得训练后的神经网络模型。
在本实施方式中,根据先验特征为神经网络模型设置初始化参数之后,可以根据待学习数据对神经网络模型进行训练,获得训练后的神经网络模型。具体来说,在训练集中的待训练数据均包括相应的数据值和对该图像对应的识别结果;当利用训练集对神经网络模型进行迭代训练时,一旦其神经网络模型所输出的预测结果与识别结果之间的距离或交叉熵不再发生改变,即可称其为训练完毕。
以手势识别模型举例来说,手势识别模型具体用于对用户当前的手势进行识别,因此,在手势识别的训练过程需要对大量的手势图像进行学习。而针对大量的陌生的手势图像,通过手势识别模型直接对其学习往往学习效率较低,进而需要较长的学习时间。因此,为了提高手势识别模型的学习效率,可以首先主动获取手势图像的先验特征,并根据该先验特征为手势识别模型设置初始化参数,即相当于使手势识别模型对手势图像进行预先了解,从而能够提高手势识别模型的学习效率,进而能够有效降低手势识别模型的学习时间。
本实施例提供的图像处理方法,通过获取待学习数据的先验特征;根据所述先验特征为神经网络模型设置初始化参数;根据所述待学习数据对所述神经网络模型进行训练,获得训练后的神经网络模型。通过采用待学习数据的先验特征为神经网络模型设置初始化参数,从而能够有效提高神经网络模型的学习效率,进而能够提高神经网络模型的训练效率。
进一步地,在上述实施例的基础上,所述方法包括:
确定所述神经网络模型中层级的数量;
获取与所述层级的数量一致的所述待学习数据的先验特征;
根据所述先验特征为神经网络模型设置初始化参数;
根据所述待学习数据对所述神经网络模型进行训练,获得训练后的神经网络模型。
在本实施例中,针对任意一个神经网络模型,一般都具有多个层级,而针对每个层级均需要设置初始化参数,因此,首先确定待设置初始化参数的神经网络模型中层级的数量,并获取与层级数量一致的待学习数据的先验特征,从而能够实现对神经网络模型中每一层级的初始化参数的设置。获取到待学习数据的先验特征之后,可以根据该先验知识为神经网络模型设置初始化参数。根据先验特征为神经网络模型设置初始化参数相当于预先让神经网络模型学习到待学习数据的特性,从而在后续训练过程中,能够有效提高神经网络模型的学习效率。根据先验特征为神经网络模型设置初始化参数之后,可以根据待学习数据对神经网络模型进行训练,获得训练后的神经网络模型。
本实施例提供的图像处理方法,通过确定待设置初始化参数的神经网络模型中层级的数量,并获取与层级数量一致的待学习数据的先验特征,从而能够实现对神经网络模型中每一层级的初始化参数的设置。为提高神经网络的学习效率提供了基础。
进一步地,在上述任一实施例的基础上,所述方法包括:
确定所述神经网络模型中层级的数量;
获取与所述层级的数量一致的所述待学习数据的先验特征;
根据所述先验特征为神经网络模型中每一所述层级设置初始化参数;
根据所述待学习数据对所述神经网络模型进行训练,获得训练后的神经网络模型。
在本实施例中,确定待设置初始化参数的神经网络模型中层级的数量,并获取与层级数量一致的待学习数据的先验特征之后,可以根据获取的与层级数量一致的待学习数据的先验特征为神经网络模型中的每一个层级设置初始化参数,从而每一个层级都能够在训练之前对待学习数据的特征进行了解,进而能够提高学习效率。根据先验特征为神经网络模型设置初始化参数之后,可以根据待学习数据对神经网络模型进行训练,获得训练后的神经网络模型。
本实施例提供的图像处理方法,通过根据先验特征为神经网络模型中每一层级设置初始化参数从而每一个层级都能够在训练之前对待学习数据的特征进行了解,进而能够提高学习效率。
图2为本发明实施例二提供的图像处理方法的流程示意图,在上述任一实施例的基础上,如图2所示,所述先验特征包括待识别图像的尺寸特征;相应地,所述方法包括:
步骤201、获取所述待学习数据的尺寸信息;
步骤202、通过聚类和/或计算均值和/或计算中位数和/或计算众数方法获取所述尺寸信息的尺寸特征;
步骤203、根据所述先验特征为神经网络模型设置初始化参数;
步骤204、根据所述待学习数据对所述神经网络模型进行训练,获得训练后的神经网络模型。
在本实施例中,先验特征具体可以是待学习数据的尺寸特征。具体地,可以首先获取全部待学习数据的尺寸信息,并通过聚类和/或计算均值和/或计算中位数和/或计算众数方法获取尺寸信息的尺寸特征,从而可以根据尺寸信息为神经网络模型设置初始化参数。根据尺寸特征为神经网络模型设置初始化参数之后,可以根据待学习数据对神经网络模型进行训练,获得训练后的神经网络模型。
需要说明的是,获取待学习数据的尺寸特征的方法包括但不限于聚类和/或计算均值和/或计算中位数和/或计算众数方法,可以通过任意一种能够实现对尺寸特征的方法实现对待学习数据的尺寸特征获取,本发明在此不做限制。
仍以手部识别模型举例来说,为了实现对神经网络模型的初始化参数的设置,首先可以确定每一张手部图像的尺寸,并根据聚类和/或计算均值和/或计算中位数和/或计算众数方法确定手部图像的尺寸特征,并根据该不同的尺寸特征为神经网络模型设置初始化参数,从而神经网络模型即能够实现对多种不同尺寸手部图像的学习,进而能够提高学习效率。
本实施例提供的图像处理方法,通过获取所述待学习数据的尺寸信息;通过聚类和/或计算均值和/或计算中位数和/或计算众数方法获取所述尺寸信息的尺寸特征,从而能够使神经网络模型预先对待学习数据的尺寸特征进行了解,进而能够提高学习效率。
进一步地,在上述任一实施例的基础上,所述方法包括:
获取所述待学习数据的尺寸信息;
通过聚类和/或计算均值和/或计算中位数和/或计算众数方法获取与所述层级的数量一致的所述待学习数据的尺寸特征;
根据所述先验特征为神经网络模型设置初始化参数;
根据所述待学习数据对所述神经网络模型进行训练,获得训练后的神经网络模型。
在本实施例中,针对任意一个神经网络模型,一般都具有多个层级,而针对每个层级均需要设置初始化参数,因此,获取待学习数据的尺寸信息之后,需要确定待设置初始化参数的神经网络模型中层级的数量,并通过聚类和/或计算均值和/或计算中位数和/或计算众数方法获取与层级的数量一致的待学习数据的尺寸特征。根据尺寸特征为神经网络模型设置初始化参数之后,可以根据待学习数据对神经网络模型进行训练,获得训练后的神经网络模型。
本实施例提供的图像处理方法,通过聚类和/或计算均值和/或计算中位数和/或计算众数方法获取与所述层级的数量一致的所述待学习数据的尺寸特征,从而能够实现对神经网络模型中每一层级的初始化参数的设置。为提高神经网络的学习效率提供了基础。
进一步地,在上述任一实施例的基础上,所述方法包括:
获取所述待学习数据的尺寸信息;
通过聚类和/或计算均值和/或计算中位数和/或计算众数方法获取与所述层级的数量一致的所述待学习数据的尺寸特征;
根据所述尺寸特征为所述神经网络模型中每一层级设置初始化参数;
根据所述待学习数据对所述神经网络模型进行训练,获得训练后的神经网络模型。
在本实施例中,获取待学习数据的尺寸信息,并通过聚类和/或计算均值和/或计算中位数和/或计算众数方法获取与层级的数量一致的待学习数据的尺寸特征之后,可以根据与层级的数量一致的待学习数据的尺寸特征为神经网络模型中的每个层级设置初始化参数,并根据待学习数据对神经网络模型进行训练,获得训练后的神经网络模型,从而能够实现根据训练好的神经网络模型实现对待识别图像的识别。
本实施例提供的图像处理方法,通过根据与层级的数量一致的待学习数据的尺寸特征为神经网络模型中每一层级设置初始化参数从而每一个层级都能够在训练之前对待学习数据的特征进行了解,进而能够提高学习效率。
图3为本发明实施例三提供的图像处理方法的流程示意图,在上述任一实施例的基础上,如图3所示,所述先验特征包括色彩特征;相应地,所述方法包括:
步骤301、获取所述待学习数据的RGB色彩模式;
步骤302、通过聚类和/或计算均值和/或计算中位数和/或计算众数方法获取所述RGB色彩模式的色彩特征;
步骤303、根据所述先验特征为神经网络模型设置初始化参数;
步骤304、根据所述待学习数据对所述神经网络模型进行训练,获得训练后的神经网络模型。
在本实施例中,待学习数据的先验特征具体可以包括色彩特征。具体地,可以首先确定待学习数据对应的RGB色彩模式,并通过聚类和/或计算均值和/或计算中位数和/或计算众数方法获取RGB色彩模式的色彩特征,从而可以通过色彩特征实现对神经网络模型的初始化参数的设置。根据色彩特征为神经网络模型设置初始化参数之后,可以根据待学习数据对神经网络模型进行训练,获得训练后的神经网络模型。
需要说明的是,获取待学习数据的色彩特征的方法包括但不限于聚类和/或计算均值和/或计算中位数和/或计算众数方法,可以通过任意一种能够实现对色彩特征的方法实现对待学习数据的色彩特征获取,本发明在此不做限制。
仍以手部识别模型举例来说,为了实现对神经网络模型的初始化参数的设置,首先可以确定每一张手部图像的RGB色彩模式,并根据聚类和/或计算均值和/或计算中位数和/或计算众数方法确定手部图像的色彩特征,并根据该不同的色彩特征为神经网络模型设置初始化参数,从而神经网络模型即能够实现对多种不同色彩手部图像的学习,进而能够提高学习效率。
本实施例提供的图像处理方法,通过获取所述待学习数据的RGB色彩模式;通过聚类和/或计算均值和/或计算中位数和/或计算众数方法获取所述RGB色彩模式的色彩特征,从而能够使神经网络模型预先对待学习数据的色彩特征进行了解,进而能够提高学习效率。
进一步地,在上述任一实施例的基础上,所述方法包括:
获取所述待学习数据的RGB色彩模式;
通过聚类和/或计算均值和/或计算中位数和/或计算众数方法获取与所述层级的数量一致的所述待学习数据的色彩特征;
根据所述先验特征为神经网络模型设置初始化参数;
根据所述待学习数据对所述神经网络模型进行训练,获得训练后的神经网络模型。
在本实施例中,针对任意一个神经网络模型,一般都具有多个层级,而针对每个层级均需要设置初始化参数,因此,获取待学习数据的RGB色彩模式之后,需要确定待设置初始化参数的神经网络模型中层级的数量,并通过聚类和/或计算均值和/或计算中位数和/或计算众数方法获取与层级的数量一致的待学习数据的色彩特征。根据色彩特征为神经网络模型设置初始化参数之后,可以根据待学习数据对神经网络模型进行训练,获得训练后的神经网络模型。
本实施例提供的图像处理方法,通过聚类和/或计算均值和/或计算中位数和/或计算众数方法获取与所述层级的数量一致的所述待学习数据的色彩特征,从而能够实现对神经网络模型中每一层级的初始化参数的设置。为提高神经网络的学习效率提供了基础。
进一步地,在上述任一实施例的基础上,所述方法包括:
获取所述待学习数据的RGB色彩模式;
通过聚类和/或计算均值和/或计算中位数和/或计算众数方法获取与所述层级的数量一致的所述待学习数据的色彩特征;
根据所述色彩特征为所述神经网络模型中每一层级设置初始化参数;
根据所述待学习数据对所述神经网络模型进行训练,获得训练后的神经网络模型。
在本实施例中,获取待学习数据的RGB色彩模式,并通过聚类和/或计算均值和/或计算中位数和/或计算众数方法获取与层级的数量一致的待学习数据的色彩特征之后,可以根据与层级的数量一致的待学习数据的色彩特征为神经网络模型中的每个层级设置初始化参数,并根据待学习数据对神经网络模型进行训练,获得训练后的神经网络模型。
本实施例提供的图像处理方法,通过根据与层级的数量一致的待学习数据的色彩特征为神经网络模型中每一层级设置初始化参数从而每一个层级都能够在训练之前对待学习数据的特征进行了解,进而能够提高学习效率。
图4为本发明实施例四提供的图像处理方法的流程示意图,在上述任一实施例的基础上,如图4所示,所述方法包括:
步骤401、接收待识别图像;
步骤402、通过训练后的神经网络模型对待识别图像进行识别。
在本实施例中,通过获取待学习数据的先验特征;根据所述先验特征为神经网络模型设置初始化参数;根据所述待学习数据对所述神经网络模型进行训练,获得训练后的神经网络模型之后,可以根据训练后的神经网络模型对待识别图像进行识别。具体地,可以接受待识别图像,并通过训练后的神经网络模型实现对待识别图像的识别,获得识别结果。
本实施例提供的图像处理方法,通过接受待识别图像,并通过训练后的神经网络模型实现对待识别图像的识别,获得识别结果,从而能够快速地获得待识别图像的识别结果。
图5为本发明实施例五提供的图像处理装置的结构示意图,如图5所示,所述装置包括:
先验特征获取模块51,用于获取待学习数据的先验特征。
初始化参数设置模块52,用于根据所述先验特征为神经网络模型设置初始化参数。
训练模块53,用于根据所述待学习数据对所述神经网络模型进行训练,获得训练后的神经网络模型。
以手势识别模型举例来说,手势识别模型具体用于对用户当前的手势进行识别,因此,在手势识别的训练过程需要对大量的手势图像进行学习。而针对大量的陌生的手势图像,通过手势识别模型直接对其学习往往学习效率较低,进而需要较长的学习时间。因此,为了提高手势识别模型的学习效率,可以首先主动获取手势图像的先验特征,并根据该先验特征为手势识别模型设置初始化参数,即相当于使手势识别模型对手势图像进行预先了解,从而能够提高手势识别模型的学习效率,进而能够有效降低手势识别模型的学习时间。
本实施例提供的图像处理装置,通过获取待学习数据的先验特征;根据所述先验特征为神经网络模型设置初始化参数;根据所述待学习数据对所述神经网络模型进行训练,获得训练后的神经网络模型。通过采用待学习数据的先验特征为神经网络模型设置初始化参数,从而能够有效提高神经网络模型的学习效率,进而能够提高神经网络模型的训练效率。
进一步地,在上述实施例的基础上,所述装置包括:
先验特征获取模块具体包括:
数量确定单元,用于确定所述神经网络模型中层级的数量;
获取单元,用于获取与所述层级的数量一致的所述待学习数据的先验特征;
初始化参数设置模块,用于根据所述先验特征为神经网络模型设置初始化参数;
训练模块,用于根据所述待学习数据对所述神经网络模型进行训练,获得训练后的神经网络模型。
本实施例提供的图像处理装置,通过确定待设置初始化参数的神经网络模型中层级的数量,并获取与层级数量一致的待学习数据的先验特征,从而能够实现对神经网络模型中每一层级的初始化参数的设置。为提高神经网络的学习效率提供了基础。
进一步地,在上述任一实施例的基础上,所述装置包括:
先验特征获取模块具体包括:
数量确定单元,用于确定所述神经网络模型中层级的数量;
获取单元,用于获取与所述层级的数量一致的所述待学习数据的先验特征;
初始化参数设置模块具体包括:
第一设置单元,用于根据所述先验特征为神经网络模型中每一所述层级设置初始化参数;
训练模块,用于根据所述待学习数据对所述神经网络模型进行训练,获得训练后的神经网络模型。
本实施例提供的图像处理装置,通过根据先验特征为神经网络模型中每一层级设置初始化参数从而每一个层级都能够在训练之前对待学习数据的特征进行了解,进而能够提高学习效率。
图6为本发明实施例六提供的图像处理装置的结构示意图,在上述任一实施例的基础上,如图6所示,所述先验特征包括待识别图像的尺寸特征;相应地,所述装置包括:
所述先验特征获取模块61具体包括:
尺寸信息获取单元601,用于获取所述待学习数据的尺寸信息;
尺寸特征确定单元602,用于通过聚类和/或计算均值和/或计算中位数和/或计算众数方法获取所述尺寸信息的尺寸特征;
初始化参数设置模块62,用于根据所述先验特征为神经网络模型设置初始化参数;
训练模块63,用于根据所述待学习数据对所述神经网络模型进行训练,获得训练后的神经网络模型。
仍以手部识别模型举例来说,为了实现对神经网络模型的初始化参数的设置,首先可以确定每一张手部图像的尺寸,并根据聚类和/或计算均值和/或计算中位数和/或计算众数方法确定手部图像的尺寸特征,并根据该不同的尺寸特征为神经网络模型设置初始化参数,从而神经网络模型即能够实现对多种不同尺寸手部图像的学习,进而能够提高学习效率。
本实施例提供的图像处理装置,通过获取所述待学习数据的尺寸信息;通过聚类和/或计算均值和/或计算中位数和/或计算众数方法获取所述尺寸信息的尺寸特征,从而能够使神经网络模型预先对待学习数据的尺寸特征进行了解,进而能够提高学习效率。
进一步地,在上述任一实施例的基础上,所述装置包括:
所述先验特征获取模块具体包括:
尺寸信息获取单元,用于获取所述待学习数据的尺寸信息;
尺寸特征确定单元具体包括:
第一确定子单元,用于通过聚类和/或计算均值和/或计算中位数和/或计算众数方法获取与所述层级的数量一致的所述待学习数据的尺寸特征;
初始化参数设置模块,用于根据所述先验特征为神经网络模型设置初始化参数;
训练模块,用于根据所述待学习数据对所述神经网络模型进行训练,获得训练后的神经网络模型。
本实施例提供的图像处理装置,通过聚类和/或计算均值和/或计算中位数和/或计算众数方法获取与所述层级的数量一致的所述待学习数据的尺寸特征,从而能够实现对神经网络模型中每一层级的初始化参数的设置。为提高神经网络的学习效率提供了基础。
进一步地,在上述任一实施例的基础上,所述装置包括:
所述先验特征获取模块具体包括:
尺寸信息获取单元,用于获取所述待学习数据的尺寸信息;
尺寸特征确定单元具体包括:
第一确定子单元,用于通过聚类和/或计算均值和/或计算中位数和/或计算众数方法获取与所述层级的数量一致的所述待学习数据的尺寸特征;
初始化参数设置模块具体包括:
第二设置单元,用于根据所述尺寸特征为所述神经网络模型中每一层级设置初始化参数;
训练模块,用于根据所述待学习数据对所述神经网络模型进行训练,获得训练后的神经网络模型。
本实施例提供的图像处理装置,通过根据与层级的数量一致的待学习数据的尺寸特征为神经网络模型中每一层级设置初始化参数从而每一个层级都能够在训练之前对待学习数据的特征进行了解,进而能够提高学习效率。
图7为本发明实施例七提供的图像处理装置的结构示意图,在上述任一实施例的基础上,如图7所示,所述先验特征包括色彩特征;相应地,所述装置包括:
先验特征获取模块71具体包括:
色彩模式获取单元701,用于获取所述待学习数据的RGB色彩模式;
色彩特征确定单元702,用于通过聚类和/或计算均值和/或计算中位数和/或计算众数方法获取所述RGB色彩模式的色彩特征;
初始化参数设置模块72,用于根据所述先验特征为神经网络模型设置初始化参数;
训练模块73,用于根据所述待学习数据对所述神经网络模型进行训练,获得训练后的神经网络模型。
仍以手部识别模型举例来说,为了实现对神经网络模型的初始化参数的设置,首先可以确定每一张手部图像的RGB色彩模式,并根据聚类和/或计算均值和/或计算中位数和/或计算众数方法确定手部图像的色彩特征,并根据该不同的色彩特征为神经网络模型设置初始化参数,从而神经网络模型即能够实现对多种不同色彩手部图像的学习,进而能够提高学习效率。
本实施例提供的图像处理装置,通过获取所述待学习数据的RGB色彩模式;通过聚类和/或计算均值和/或计算中位数和/或计算众数方法获取所述RGB色彩模式的色彩特征,从而能够使神经网络模型预先对待学习数据的色彩特征进行了解,进而能够提高学习效率。
进一步地,在上述任一实施例的基础上,所述装置包括:
所述先验特征获取模块具体包括:
色彩模式获取单元,用于获取所述待学习数据的RGB色彩模式;
所述色彩特征确定单元具体包括:
第二确定子单元,用于通过聚类和/或计算均值和/或计算中位数和/或计算众数方法获取与所述层级的数量一致的所述待学习数据的色彩特征;
初始化参数设置模块,用于根据所述先验特征为神经网络模型设置初始化参数;
训练模块,用于根据所述待学习数据对所述神经网络模型进行训练,获得训练后的神经网络模型。
本实施例提供的图像处理装置,通过聚类和/或计算均值和/或计算中位数和/或计算众数方法获取与所述层级的数量一致的所述待学习数据的色彩特征,从而能够实现对神经网络模型中每一层级的初始化参数的设置。为提高神经网络的学习效率提供了基础。
进一步地,在上述任一实施例的基础上,所述装置包括:
所述先验特征获取模块具体包括:
色彩模式获取单元,用于获取所述待学习数据的RGB色彩模式;
所述色彩特征确定单元具体包括:
第二确定子单元,用于通过聚类和/或计算均值和/或计算中位数和/或计算众数方法获取与所述层级的数量一致的所述待学习数据的色彩特征;
所述初始化参数设置模块具体包括:
第三设置单元,用于根据所述色彩特征为所述神经网络模型中每一层级设置初始化参数;
训练模块,用于根据所述待学习数据对所述神经网络模型进行训练,获得训练后的神经网络模型。
本实施例提供的图像处理装置,通过根据与层级的数量一致的待学习数据的色彩特征为神经网络模型中每一层级设置初始化参数从而每一个层级都能够在训练之前对待学习数据的特征进行了解,进而能够提高学习效率。
图8为本发明实施例八提供的图像处理装置的结构示意图,在上述任一实施例的基础上,如图8所示,所述装置包括:
接收模块81,用于接收待识别图像;
识别模块82,用于通过训练后的神经网络模型对待识别图像进行识别。
本实施例提供的图像处理装置,通过接受待识别图像,并通过训练后的神经网络模型实现对待识别图像的识别,获得识别结果,从而能够快速地获得待识别图像的识别结果。
图9为本发明实施例九提供的图像处理设备的结构示意图,如图9所示,所述图像处理设备,包括:存储器91,处理器92;
存储器91;用于存储所述处理器92可执行指令的存储器91;
其中,所述处理器92被配置为由所述处理器92执行如上述的图像处理方法。
本发明的又一个实施例提供一种计算机可读存储介质,
所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如上述的图像处理方法。
图10为本发明实施例十提供的图像处理设备的结构示意图,如图10所示,所述图像处理设备,包括:存储器111,处理器112;
存储器111;用于存储所述处理器112可执行指令的存储器111;
其中,所述处理器112被配置为由所述处理器112执行如上述的图像处理方法。
本发明的又一个实施例提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如上述的图像处理方法。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (24)

1.一种图像处理方法,其特征在于,包括:
获取待学习数据的先验特征;
根据所述先验特征为神经网络模型设置初始化参数;
根据所述待学习数据对所述神经网络模型进行训练,获得训练后的神经网络模型。
2.根据权利要求1所述的方法,其特征在于,所述获取待学习数据的先验特征,包括:
确定所述神经网络模型中层级的数量;
获取与所述层级的数量一致的所述待学习数据的先验特征。
3.根据权利要求2所述的方法,其特征在于,所述根据所述先验特征为神经网络模型设置初始化参数,包括:
根据所述先验特征为神经网络模型中每一所述层级设置初始化参数。
4.根据权利要求2所述的方法,其特征在于,所述先验特征包括待识别图像的尺寸特征;
相应地,所述获取待学习数据的先验特征,包括:
获取所述待学习数据的尺寸信息;
通过聚类和/或计算均值和/或计算中位数和/或计算众数方法获取所述尺寸信息的尺寸特征。
5.根据权利要求4所述的方法,其特征在于,所述通过聚类和/或计算均值和/或计算中位数和/或计算众数方法获取所述待学习数据的尺寸特征,包括:
通过聚类和/或计算均值和/或计算中位数和/或计算众数方法获取与所述层级的数量一致的所述待学习数据的尺寸特征。
6.根据权利要求4所述的方法,其特征在于,所述根据所述先验特征为神经网络模型设置初始化参数,包括:
根据所述尺寸特征为所述神经网络模型中每一层级设置初始化参数。
7.根据权利要求2所述的方法,其特征在于,所述先验特征包括色彩特征;
相应地,所述获取待学习数据的先验特征,包括:
获取所述待学习数据的RGB色彩模式;
通过聚类和/或计算均值和/或计算中位数和/或计算众数方法获取所述RGB色彩模式的色彩特征。
8.根据权利要求7所述的方法,其特征在于,所述通过聚类和/或计算均值和/或计算中位数和/或计算众数方法获取所述RGB色彩模式的色彩特征,包括:
通过聚类和/或计算均值和/或计算中位数和/或计算众数方法获取与所述层级的数量一致的所述待学习数据的色彩特征。
9.根据权利要求7所述的方法,其特征在于,所述根据所述先验特征为神经网络模型设置初始化参数,包括:
根据所述色彩特征为所述神经网络模型中每一层级设置初始化参数。
10.一种图像处理方法,其特征在于,包括:
接收待识别图像;
通过训练后的神经网络模型对待识别图像进行识别,所述训练后的神经网络模型是利用权利要求1-9任一项所述的图像处理方法训练获得的。
11.一种图像处理装置,其特征在于,包括:
先验特征获取模块,用于获取待学习数据的先验特征;
初始化参数设置模块,用于根据所述先验特征为神经网络模型设置初始化参数;
训练模块,用于根据所述待学习数据对所述神经网络模型进行训练,获得训练后的神经网络模型。
12.根据权利要求11所述的装置,其特征在于,所述先验特征获取模块包括:
数量确定单元,用于确定所述神经网络模型中层级的数量;
获取单元,用于获取与所述层级的数量一致的所述待学习数据的先验特征。
13.根据权利要求12所述的装置,其特征在于,所述初始化参数设置模块包括:
第一设置单元,用于根据所述先验特征为神经网络模型中每一所述层级设置初始化参数。
14.根据权利要求12所述的装置,其特征在于,所述先验特征包括待识别图像的尺寸特征;
相应地,所述先验特征获取模块包括:
尺寸信息获取单元,用于获取所述待学习数据的尺寸信息;
尺寸特征确定单元,用于通过聚类和/或计算均值和/或计算中位数和/或计算众数方法获取所述尺寸信息的尺寸特征。
15.根据权利要求14所述的装置,其特征在于,所述尺寸特征确定单元包括:
第一确定子单元,用于通过聚类和/或计算均值和/或计算中位数和/或计算众数方法获取与所述层级的数量一致的所述待学习数据的尺寸特征。
16.根据权利要求15所述的装置,其特征在于,所述初始化参数设置模块包括:
第二设置单元,用于根据所述尺寸特征为所述神经网络模型中每一层级设置初始化参数。
17.根据权利要求12所述的装置,其特征在于,所述先验特征包括色彩特征;
相应地,所述先验特征获取模块包括:
色彩模式获取单元,用于获取所述待学习数据的RGB色彩模式;
色彩特征确定单元,用于通过聚类和/或计算均值和/或计算中位数和/或计算众数方法获取所述RGB色彩模式的色彩特征。
18.根据权利要求17所述的装置,其特征在于,所述色彩特征确定单元包括:
第二确定子单元,用于通过聚类和/或计算均值和/或计算中位数和/或计算众数方法获取与所述层级的数量一致的所述待学习数据的色彩特征。
19.根据权利要求17所述的装置,其特征在于,所述初始化参数设置模块包括:
第三设置单元,用于根据所述色彩特征为所述神经网络模型中每一层级设置初始化参数。
20.一种图像处理装置,其特征在于,包括:
接收模块,用于接收待识别图像;
识别模块,用于通过训练后的神经网络模型对待识别图像进行识别,所述训练后的神经网络模型是利用权利要求1-9任一项所述的图像处理方法训练获得的。
21.一种图像处理设备,其特征在于,包括:存储器,处理器;
存储器;用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为由所述处理器执行如所述权利要求1-9任一项所述的图像处理方法。
22.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如权利要求1至9任一项所述的图像处理方法。
23.一种图像处理设备,其特征在于,包括:存储器,处理器;
存储器;用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为由所述处理器执行如所述权利要求10所述的图像处理方法。
24.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如权利要求10所述的图像处理方法。
CN201810903741.9A 2018-08-09 2018-08-09 图像处理方法、装置、设备及计算机可读存储介质 Active CN109190499B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810903741.9A CN109190499B (zh) 2018-08-09 2018-08-09 图像处理方法、装置、设备及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810903741.9A CN109190499B (zh) 2018-08-09 2018-08-09 图像处理方法、装置、设备及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN109190499A true CN109190499A (zh) 2019-01-11
CN109190499B CN109190499B (zh) 2021-08-17

Family

ID=64921309

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810903741.9A Active CN109190499B (zh) 2018-08-09 2018-08-09 图像处理方法、装置、设备及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN109190499B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104463209A (zh) * 2014-12-08 2015-03-25 厦门理工学院 一种基于bp神经网络的pcb板上数字代码识别方法
CN105678231A (zh) * 2015-12-30 2016-06-15 中通服公众信息产业股份有限公司 一种基于稀疏编码和神经网络的行人图片检测方法
US20170076179A1 (en) * 2015-09-15 2017-03-16 Samsung Electronics Co., Ltd. Learning combinations of homogenous feature arrangements
CN106650922A (zh) * 2016-09-29 2017-05-10 清华大学 硬件神经网络转换方法、计算装置、编译方法和神经网络软硬件协作系统
CN107657602A (zh) * 2017-08-09 2018-02-02 武汉科技大学 基于两次迁移卷积神经网络的乳腺结构紊乱识别方法
CN107657239A (zh) * 2017-09-30 2018-02-02 清华大学深圳研究生院 掌纹图像性别分类方法及装置、计算机装置及可读存储介质
CN107909008A (zh) * 2017-10-29 2018-04-13 北京工业大学 基于多通道卷积神经网络和粒子滤波的视频目标跟踪方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104463209A (zh) * 2014-12-08 2015-03-25 厦门理工学院 一种基于bp神经网络的pcb板上数字代码识别方法
US20170076179A1 (en) * 2015-09-15 2017-03-16 Samsung Electronics Co., Ltd. Learning combinations of homogenous feature arrangements
CN105678231A (zh) * 2015-12-30 2016-06-15 中通服公众信息产业股份有限公司 一种基于稀疏编码和神经网络的行人图片检测方法
CN106650922A (zh) * 2016-09-29 2017-05-10 清华大学 硬件神经网络转换方法、计算装置、编译方法和神经网络软硬件协作系统
CN107657602A (zh) * 2017-08-09 2018-02-02 武汉科技大学 基于两次迁移卷积神经网络的乳腺结构紊乱识别方法
CN107657239A (zh) * 2017-09-30 2018-02-02 清华大学深圳研究生院 掌纹图像性别分类方法及装置、计算机装置及可读存储介质
CN107909008A (zh) * 2017-10-29 2018-04-13 北京工业大学 基于多通道卷积神经网络和粒子滤波的视频目标跟踪方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
YOSHIKI MIZUKAMI等: "A NEW FRAMEWORK OF NEURAL NETWORK FOR NON-LINEAR SYSTEM MODELING", 《IEEE》 *
岳永鹏: "深度无监督学习算法研究", 《中国优秀硕士学位论文全文数据库信息科技辑》 *

Also Published As

Publication number Publication date
CN109190499B (zh) 2021-08-17

Similar Documents

Publication Publication Date Title
CN108664893B (zh) 一种人脸检测方法及存储介质
US11176418B2 (en) Model test methods and apparatuses
CN107392973B (zh) 像素级手写体汉字自动生成方法、存储设备、处理装置
JP6382354B2 (ja) ニューラルネットワーク及びニューラルネットワークのトレーニング方法
CN108780519A (zh) 卷积神经网络中的结构学习
CN108229280A (zh) 时域动作检测方法和系统、电子设备、计算机存储介质
CN112257815A (zh) 模型生成方法、目标检测方法、装置、电子设备及介质
CN109416758A (zh) 神经网络及神经网络训练的方法
CN107886062B (zh) 图像处理方法、系统及服务器
CN110009057A (zh) 一种基于深度学习的图形验证码识别方法
CN104866868A (zh) 基于深度神经网络的金属币识别方法和装置
CN111027628B (zh) 一种模型确定方法和系统
CN109993164A (zh) 一种基于rcrnn神经网络的自然场景文字识别方法
CN105320945A (zh) 图像分类的方法及装置
CN109635833A (zh) 一种基于云平台和模型智能推荐的图像识别方法及系统
CN106599872A (zh) 用于验证活体人脸图像的方法和设备
CN108647634A (zh) 图像边框查找方法、装置、计算机设备及存储介质
CN109033945A (zh) 一种基于深度学习的人体轮廓提取方法
CN112508190A (zh) 结构化稀疏参数的处理方法、装置、设备及存储介质
CN105447566B (zh) 训练装置、训练方法以及检测装置
CN108182475A (zh) 一种基于自动编码机-超限学习机的多维度数据特征识别方法
CN110781976A (zh) 训练图像的扩充方法、训练方法及相关装置
CN110705531A (zh) 缺失字符检测、缺失字符检测模型的建立方法及装置
CN115410081A (zh) 一种多尺度聚合的云和云阴影辨识方法、系统、设备及存储介质
Khavalko et al. Image classification and recognition on the base of autoassociative neural network usage

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant