CN107735800A - 一种图像处理方法以及相关装置 - Google Patents
一种图像处理方法以及相关装置 Download PDFInfo
- Publication number
- CN107735800A CN107735800A CN201680000994.4A CN201680000994A CN107735800A CN 107735800 A CN107735800 A CN 107735800A CN 201680000994 A CN201680000994 A CN 201680000994A CN 107735800 A CN107735800 A CN 107735800A
- Authority
- CN
- China
- Prior art keywords
- partition model
- target
- image
- model
- target image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 22
- 238000005192 partition Methods 0.000 claims abstract description 302
- 238000012545 processing Methods 0.000 claims abstract description 92
- 238000000034 method Methods 0.000 claims abstract description 18
- 238000012549 training Methods 0.000 claims description 53
- 238000004891 communication Methods 0.000 claims description 10
- 238000013528 artificial neural network Methods 0.000 claims description 7
- 230000006870 function Effects 0.000 description 9
- 238000005516 engineering process Methods 0.000 description 4
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 238000003708 edge detection Methods 0.000 description 3
- 238000013145 classification model Methods 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 238000000638 solvent extraction Methods 0.000 description 2
- 238000007630 basic procedure Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
一种图像处理方法、图像处理装置以及计算设备,所述方法包括获取目标图像(201),通过分类器在N个分区模型中确定目标图像对应的目标分区模型(202),然后使用目标分区模型对目标图像进行分区,得到目标图像的分区结果(203)。所述图像处理装置没有采用单一的分区模型,而是在N个分区模型中采用分类器选择合适的分区模型,这样就保证了图像处理装置对所有类型的图像都能够选择精度与速度都较为适宜的分区模型来对目标图像进行分区,能够满足实际需求。
Description
本发明涉及图像处理领域,尤其涉及一种图像处理方法以及相关装置。
在图像处理领域,图像处理装置一般通过分区和分类两步操作来实现图像中目标的检测识别,如图1所示:图像分区模型接受输入的图像,并把输入的图像划分成大小不同的区域;图像分类模型采用卷积神经网络或其它分类算法,通过层次化结构不断提取图像每个区域的特征,最终识别出目标物体。
在实际应用中,图像的尺寸、构图、复杂度等千变万化,不同的图像适宜用不同的分区算法来进行分区。因此现阶段技术针对不同种类的图像开发了多种图像分区模型。其中,不同的图像分区模型采用不同的图像分区算法,故在对同一副图像进行分区时,得到的分区结果的精度以及分区操作消耗的时长均不相同。但一般的,同一个图像分区模型无法同时兼顾精度与速度,精度较高的图像分区模型往往分区速度较慢,分区操作耗时较长;而分区速度快的图像分区模型往往精度较低。因此,精度较高的图像分区模型适合处理较为复杂的图像,以增加图像分区的可信度;精度较低的图像分区模型适合处理较为简单的图像,以加快图像分区的速度。
不同的图像适宜采用的图像分区模型各不相同,因此图像处理装置无论采用高精度还是低精度的图像分区模型,都不能保证适合所有图像。这就导致现阶段的图像处理装置无法兼顾图像处理的精度和速度,不能满足实际的需求。
发明内容
本发明提供了一种图像处理方法以及装置,用于采用较为适宜的图像分区模型对目标图像进行分区。
本发明第一方面提供了一种图像处理方法,适用于图像处理装置。其中,图像处理装置获取待处理的目标图像,然后从N个分区模型中,使用分类器来确定目标图像对应的目标分区模型,N为大于1的整数。其中,分类器可以
是一个分类函数或分类模型,也可以是一种具有处理功能的硬件单元,该分类器用于把给定的图像映射到该N个分区模型中的一个分区模型上。图像处理装置将目标图像输入分类器,就能够根据分类器的输出确定目标分区模型。在确定了目标分区模型后,图像处理装置使用该目标分区模型对目标图像进行分区,得到目标图像的分区结果。本发明提供的图像处理方法中,图像处理装置没有采用单一的分区模型,而是在N个分区模型中采用分类器选择合适的分区模型,这样就保证了图像处理装置对所有类型的图像都能够选择精度与速度都较为适宜的分区模型来对目标图像进行分区,能够满足实际需求。
可选的,图像处理装置在使用分类器确定目标分区模型的同时,还可以并行的使用第一分区模型来对目标图像进行分区。其中,根据分类器确定目标分区模型的时间要短于使用第一分区模型对目标图像进行分区的时间,这样,若图像处理装置确定目标分区模型为第一分区模型,则继续使用第一分区模型对目标图像进行分区,这样相当于图像处理装置在获取目标图像后,直接使用第一分区模型对目标图像进行分区,可以节省使用分类器来确定目标分区模型的时间。若图像处理装置确定目标分区模型不为第一分区模型,则图像处理装置停止使用第一分区模型对目标图像进行分区的操作,并使用目标分区模型重新对目标图像进行分区,得到目标图像的分区结果。其中,该第一分区模型可以为该N个分区模型中精度最高的分区模型,或进行图像分区操作耗时最长的分区模型,或通过其它标准确定的分区模型。
可选的,该分类器可以由图像处理装置保存在本地,并在使用时从本地读取得到;也可以由图像处理装置从其他地方获取得到;也可以由图像处理装置通过神经网络的图像训练操作得到。
可选的,图像处理装置可以通过如下方法训练得到该分类器:预先获取P张训练图像;对每张训练图像都使用该N个分区模型进行分区,并确定每个分区模型对每张训练图像进行分区的精度和时间的比值;然后将对第i张训练图像进行分区的精度和时间的比值最大的分区模型,确定为第i张图像对应的分区模型,1≤i≤P。在确定了每张训练图像对应的分区模型后,采用误差反向传播(英文:back propagation,缩写:BP)算法或其它算法,得到分类器。只要P张训练图像覆盖了各种类型的图像,且P值取得足够大,就能保证分类
器具有满足实际需求的分类效果。通过这样的方法得到的分类器,能够将该N个分区模型中,对目标图像进行分区的精度和时间的比值最大的分区模型确定为该目标图像的目标分区模型。
可选的,在得到目标图像的分区结果后,图形处理装置还可以对目标图像的分区结果进行分类。其中,图像处理装置可以根据目标分区模型的精度,来确定其对应的分类模型的卷积核的目标大小,然后使用该目标大小的卷积核,对目标图像的分区结果进行分类,得到目标图像的分类结果。这样的方法能够使得较为复杂的图像由较大的卷积核来进行分类,较为简单的图像由较小的卷积核来进行分类,兼顾了分类计算的精度和速度。
可选的,图像处理装置还可以根据目标分区模型的精度,来确定其对应的分类模型的计算通道。具体的,若该目标分区模型是该N个分区模型中精度最高的分区模型,则图像处理装置可以并行使用浮点通道和定点通道对目标图像的分区结果进行分类,以加快分类操作的速度,提高图像分类的效率。若该目标分区模型不是该N个分区模型中精度最高的模型,则图像处理装置可以仅使用浮点通道对目标图像的分区结果进行分类,得到目标图像的分类结果。
本发明第二方面提供了一种图像处理装置,包括图像获取模块、模型确定模块和图像识别模块。其中,图像获取模块用于获取待处理的目标图像;模型确定模块用于在该N个分区模型中使用分类器确定目标图像对应的目标分区模型,N为大于1的整数;图像识别模块,用于识别图像,具体用于使用目标分区模型对目标图像进行分区,得到目标图像的分区结果。
可选的,图像识别模块具体用于:在使用分类器确定目标分区模型的同时,还可以并行的使用第一分区模型来对目标图像进行分区。其中,该第一分区模型可以为该N个分区模型中精度最高的分区模型,或进行图像分区操作耗时最长的分区模型,或通过其它标准确定的分区模型。若图像处理装置确定目标分区模型为第一分区模型,则继续使用第一分区模型对目标图像进行分区,这样相当于图像处理装置在获取目标图像后,直接使用第一分区模型对目标图像进行分区,可以节省使用分类器来确定目标分区模型的时间。若图像处理装置确定目标分区模型不为第一分区模型,则图像处理装置停止使用第一分区模型对目标图像进行分区的操作,并使用目标分区模型重新对目标图像进行分区,
得到目标图像的分区结果。其中,所述第一分区模型为所述N个分区模型中精度最高的分区模型或进行图像分区操作耗时最长的分区模型。
可选的,模型确定模块还用于:通过神经网络的图像训练操作得到分类器。
可选的,模型确定模块可以通过如下方法训练得到该分类器:预先获取P张训练图像;对每张训练图像都使用该N个分区模型进行分区,并确定每个分区模型对每张训练图像进行分区的精度和时间的比值;然后将对第i张训练图像进行分区的精度和时间的比值最大的分区模型,确定为第i张图像对应的分区模型,1≤i≤P。在确定了每张训练图像对应的分区模型后,采用BP算法或其它算法,得到分类器。
可选的,图像识别模块还用于:根据目标分区模型的精度,来确定其对应的分类模型的卷积核的目标大小,然后使用该目标大小的卷积核,对目标图像的分区结果进行分类,得到目标图像的分类结果。
可选的,图像识别模块还用于:根据目标分区模型的精度,来确定其对应的分类模型的计算通道。若该目标分区模型是该N个分区模型中精度最高的分区模型,则并行使用浮点通道和定点通道对目标图像的分区结果进行分类。若该目标分区模型不是该N个分区模型中精度最高的模型,则仅使用浮点通道对目标图像的分区结果进行分类,得到目标图像的分类结果。
本发明的第三方面提供了一种计算机设备,包括处理器、存储器和通信接口,通过调用述存储器中的指令,该处理器用于执行本发明第一方面提供的图像处理方法。
本发明提供的图像处理方法中,图像处理装置获取目标图像,通过分类器在N个分区模型中确定目标图像对应的目标分区模型,然后使用目标分区模型对目标图像进行分区,得到目标图像的分区结果。本发明中的图像处理装置没有采用单一的分区模型,而是在N个分区模型中采用分类器选择合适的分区模型,这样就保证了图像处理装置对所有类型的图像都能够选择精度与速度都较为适宜的分区模型来对目标图像进行分区,能够满足实际需求。
图1为图像处理装置对图像进行检测识别的原理示意图;
图2为本发明实施例中图像处理方法的一个实施例流程图;
图3为本发明实施例中图像处理装置的一个实施例结构图;
图4为本发明实施例中计算设备的一个实施例结构图。
本发明提供了一种图像处理方法以及装置,以下将分别进行描述。
在图像处理领域,图像处理装置一般通过分区和分类两步操作来实现图像中目标的检测识别,如图1所示:图像分区模型接受输入的图像,并把输入的图像划分成大小不同的区域;图像分类模型采用卷积神经网络或其它分类算法,通过层次化结构不断提取图像每个区域的特征,最终识别出目标物体。
在实际应用中,图像的尺寸、构图、复杂度等千变万化,不同的图像适宜用不同的分区算法来进行分区。因此现阶段技术针对不同种类的图像开发了多种分区模型。其中,不同的分区模型采用不同的图像分区算法,故在对同一副图像进行分区时,得到的分区结果的精度以及分区操作消耗的时长均不相同。但一般的,同一个分区模型无法同时兼顾精度与速度,精度较高的分区模型往往分区速度较慢,分区操作耗时较长;而分区速度快的分区模型往往精度较低。因此,精度较高的分区模型适合处理较为复杂的图像,以增加图像分区的可信度;精度较低的分区模型适合处理较为简单的图像,以加快图像分区的速度。
现阶段的技术中,图像处理装置往往采用单一固定的分区模型,而单一的分区模型不能满足所有图像对精度和速度的要求。为此,本发明提供了一种图像处理方法,能够针对不同的图像采用不同的分区模型,其基本流程请参阅图2,包括
201、获取待处理的目标图像;
202、使用分类器确定目标图像对应的目标分区模型;
本发明中,图像处理装置可以从N个分区模型中,确定目标图像对应的目标分区模型。其中,该N个分区模型可以由图像处理装置保存在本地,并在使用时从本地读取得到;也可以由图像处理装置从其他地方获取得到,此处不做限定。其中,N为大于1的整数。
其中,确定的该目标分区模型应为该N个分区模型中,最适宜用来处理目标图像的分区模型。衡量该N个分区模型中哪个分区模型最适宜用来处理目标图像的方法有很多,例如可以认为对目标图像进行分区操作的精度和时间的比值最大的分区模型,为最适宜用来处理目标图像的分区模型。
其中,确定目标分区模型的方法有很多,本发明中采用分类器(英文:classifier)来确定目标分区模型。分类器的实质可以是一个分类函数或一个分类模型,该函数或模型能够把给定的图像样本分为N类,每一类对应一个分区模型,从而实现将图像映射到该N个分区模型中的一个分区模型的功能。图像分类装置将目标图像输入到分类器,就能够根据分类器的输出确定目标分区模型。其中,该分类器可以由图像处理装置保存在本地,并在使用时从本地读取得到;也可以由图像处理装置从其他地方获取得到;或者由具有处理功能的硬件单元来作为分类器,接收图像分类装置输入的目标图像,输出确定的目标分区模型给图像分类装置,此处不做限定。
其中,图像处理装置也可以根据神经网络的训练操作,自行生成该分类器。具体的,图像处理装置可以预先获取P张训练图像,然后确定每张训练图像中边缘检测结果大于第一阈值的区域的第一个数,然后根据该第一个数,确定每张训练图像对应的分区模型;或,确定每张训练图像中置信度大于第二阈值的区域的第二个数,然后根据该第二个数,确定每张训练图像对应的分区模型;或,对每张训练图像都使用该N个分区模型进行分区,并确定每个分区模型对每张训练图像进行分区的精度和时间的比值,或每个分区模型对每张训练图像进行分区的置信度、或每个分区模型对每张训练图像进行分区的边缘检测结果。然后根据该比值、置信度或边缘检测结果确定每张训练图像对应的分区模型,例如:对第i张训练图像进行分区的精度和时间的比值最大的分区模型,就是第i张图像对应的分区模型,1≤i≤P。在确定了每张训练图像对应的分区模型后,就可以采用BP算法或其它算法,得到分类器。只要P张训练图像覆盖了各种类型的图像,且P值取得足够大,就能保证分类器具有满足实际需求的分类效果。通过这样的方法得到的分类器,能够将该N个分区模型中,对目标图像进行分区的精度和时间的比值最大的分区模型确定为该目标图像的目标分区模型。
203、使用目标分区模型对目标图像进行分区,得到目标图像的分区结果。
图像处理装置在确定了目标分区模型后,使用目标分区模型对目标图像进行分区,得到目标图像的分区结果。
上文的论述中提到,模型精度越高,则模型进行分区操作的时间就越长。因此若最终确定的目标分区模型为精度较高的模型,则后续还要花费较长的时间用于图像分区操作。为了缩短图像处理的时间,可选的,图像处理装置在执行步骤202的同时,还可以执行步骤204:
204、使用第一分区模型对目标图像进行分区。
图像处理装置使用第一分区模型对目标图像进行分区,其中,第一分区模型可以为该N个分区模型中精度最高的模型。也可以为该N个分区模型中进行图像分区操作耗时最长的模型。也可以为按照其它标准在该N个分区模型中确定的模型,此处不做限定。
由于第一分区模型的精度较高,图像分区操作时间较长,因此在图像处理装置执行完步骤202确定了目标分区模型后,步骤204并没有执行完成。此时,图像处理装置执行步骤203。具体的,若目标分区模型为第一分区模型,则继续使用第一分区模型对目标图像进行分区,并将第一分区模型的分区结果作为目标图像的分区结果。在这种情况下,由于步骤202与使用第一分区模型进行分区的操作同时进行,因此可以节约执行步骤202所花费的时间。若目标分区模型不为第一分区模型,则图像处理装置停止使用第一分区模型对目标图像进行分区的操作,并使用确定的目标分区模型对目标图像进行分区,得到目标图像的分区结果。
上文的论述中有提到,不同的分区模型采用了不同的算法,适宜处理不同类型的图像。因此在实际中并不一定能够严格确定哪个模型的精度最高或分区操作耗时最长。例如,假设对于图像1来说,采用模型1进行图像分区得到的分区结果的精度最高;但是对于图像2来说,采用模型1进行图像分区得到的分区结果的精度可能并不很高,反而采用模型2进行图像分区得到的分区结果的精度最高。因此,该第一分区模型实际上可以为该N个分区模型中人为指定的、或图像处理装置默认指定的分区模型。例如,图像处理装置中可以预置有该N个分区模型的精度高低关系,第一分区模型即为该N个分区模型中精
度最高的分区模型。或,图像处理装置中可以预置有该N个分区模型进行图像分区操作的耗时长短关系,第一分区模型即为该N个分区模型中进行图像分区操作耗时最长的分区模型。其中,该精度高低关系或耗时长短关系均可以由图像处理装置获取得到,或由图像处理装置自行确定,或由人为设定。
可选的,图像处理装置在执行步骤202的同时,除了并行使用第一分区模型对目标图像进行分区之外,也可以同时使用第二分区模型、第三分区模型或更多的分区模型执行对目标图像进行分区的操作,其原理与步骤204类似,此处不做赘述。但是,并行对图像进行分区操作的分区模型越多,图像处理装置的处理器的使用率就越高,内存占用率就越大。因此在实际应用中,应综合图像处理装置的性能,选择并行对目标图像进行图像分区操作的分区模型。
本发明实施例提供的图像处理方法中,图像处理装置获取目标图像,通过分类器在N个分区模型中确定目标图像对应的目标分区模型,然后使用目标分区模型对目标图像进行分区,得到目标图像的分区结果。本发明实施例中的图像处理装置没有采用单一的分区模型,而是在N个分区模型中采用分类器选择合适的分区模型,这样就保证了图像处理装置对所有类型的图像都能够选择精度与速度都较为适宜的分区模型来对目标图像进行分区,能够满足实际需求。
图像分区装置在对目标图像进行分区之后,还需要进行图像分类操作。具体的,图像处理装置可以通过分类模型,采用浮点或定点通道,使用固定大小的卷积核(英文:convolution matrix或convolution kernel)对目标图像进行分类。与图像分区操作类似的,对于较为复杂的图像适宜采用精度较高、速度较慢的分类模型,较为简单的图像适宜采用精度较低、速度较快的分类模型。而图像的复杂程度可以由目标分区模型的精度来体现。因此可选的,本发明中,图像处理装置可以根据目标分区模型的精度,来确定其对应的分类模型的卷积核的目标大小,然后使用该目标大小的卷积核,对目标图像的分区结果进行分类,得到目标图像的分类结果。这样的方法能够使得较为复杂的图像由较大的卷积核来进行分类,较为简单的图像由较小的卷积核来进行分类,兼顾了分类计算的精度和速度。
又可选的,图像处理装置可以根据目标分区模型的精度,来确定其对应的
分类模型的计算通道,例如:若该目标分区模型是该N个分区模型中精度最高的分区模型(或精度前n高的分区模型之一,n<N),则图像处理装置可以并行使用浮点通道和定点通道对目标图像的分区结果进行分类,得到目标图像的分类结果。并行使用浮点通道和定点通道能够加快分类操作的速度,提高图像分类的效率。若该目标分区模型不是该N个分区模型中精度最高的模型(或精度前n高的分区模型之一),则图像处理装置可以仅使用浮点通道对目标图像的分区结果进行分类。
图2所示的实施例介绍了本发明提供的图像处理方法,下面将介绍一种用于实现上述方法的图像处理装置,其基本结构请参阅图3,包括:
图像获取模块301,用于执行图2所示的实施例中的步骤201;
模型确定模块302,用于执行图2所示的实施例中的步骤202;
图像识别模块303,用于执行图2所示的实施例中的步骤203,可选的,还可以执行步骤204。
图像处理装置各模块的功能可以参考图2所示的方法实施例中的描述,此处不做赘述。
可选的,图像识别模块303还可以用于根据目标分区模型的精度,确定目标分区模型对应的卷积核的目标大小,并使用该目标大小的卷积核,对目标图像的分区结果进行分类得到分类结果。
可选的,图像识别模块还可用于在目标分区模型不是该N个分区模型中精度最高的分区模型时,并行使用浮点通道和定点通道对目标图像的分区结果进行分类得到目标图像的分类结果。
本发明实施例还提供了一种计算设备400,用于实现图2所示的实施例中的图像处理方法。其基本结构请参阅图4。该计算设备具体包括处理器401、存储器402、总线403和通信接口404。其中,处理器401、存储器402和通信接口404可以通过总线403实现彼此之间的通信连接,也可以通过无线传输等其他手段实现通信。
存储器402存储器可以包括易失性存储器(英文:volatile memory),例如随机存取存储器(英文:random-access memory,缩写:RAM);存储器也可以包括非易失性存储器(英文:non-volatile memory),例如只读存储器(英文:
read-only memory,缩写:ROM),快闪存储器(英文:flash memory),硬盘(英文:hard disk drive,缩写:HDD)或固态硬盘(英文:solid-state drive,缩写:SSD);存储器402还可以包括上述种类的存储器的组合。计算设备400运行时,存储器402加载该N个分区模型、该N个分区模型的精度高低关系或耗时长短关系、分类器、各分类模型等内容以供处理器401使用。在通过软件来实现本发明提供的技术方案时,用于实现本发明提供的图像处理方法的程序代码可以保存在存储器402中,并由处理器401来执行。
计算设备400通过通信接口404获取目标图像,并将对目标图像的分类结果通过通信接口404返回给用户。
处理器401可以为中央处理器(英文:central processing unit,简称:CPU)、图形处理器(英文:graphics processing unit,缩写:GPU)、数字信号处理(英文:digital signal processing,缩写:DSP)、现场可编程门阵列(英文:field-programmable gate array,缩写:FPGA)、硬件芯片等具有处理功能的硬件单元中的任意一种或几种的组合。处理器401主要用于获取待处理的目标图像;使用分类器确定目标图像对应的目标分区模型,同时使用第一分区模型对目标图像进行分区;在确定了目标分区模型后,使用目标分区模型对目标图像进行分区,得到目标图像的分区结果;根据目标分区模型的精度,来确定其对应的分类模型的卷积核的目标大小以及对应的浮点和/或定点计算通道,然后使用该目标大小的卷积核以及计算通道,对目标图像的分区结果进行分类,得到目标图像的分类结果。
在本申请所提供的几个实施例中,应该理解到,所揭露的计算设备,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一
个单元中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的模块如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (18)
- 一种图像处理方法,适用于图像处理装置,其特征在于,包括:获取待处理的目标图像;在N个分区模型中,使用分类器确定所述目标图像对应的目标分区模型,所述N为大于1的整数;使用所述目标分区模型对所述目标图像进行分区,得到所述目标图像的分区结果。
- 根据权利要求1所述的图像处理方法,其特征在于,所述方法在所述使用分类器确定所述目标图像对应的目标分区模型时,还包括:使用第一分区模型对所述目标图像进行分区,其中,所述第一分区模型为所述N个分区模型中精度最高的分区模型或进行图像分区操作耗时最长的分区模型;所述使用所述目标分区模型对所述目标图像进行分区,得到所述目标图像的分区结果包括:若所述目标分区模型为所述第一分区模型,则继续使用所述第一分区模型对所述目标图像进行分区,并将所述第一分区模型的分区结果作为所述目标图像的分区结果;若所述目标分区模型不为所述第一分区模型,则停止所述使用第一分区模型对所述目标图像进行分区的操作,并使用所述目标分区模型对所述目标图像进行分区,得到所述目标图像的分区结果。
- 根据权利要求1或2所述的图像处理方法,其特征在于,所述方法在所述获取待处理的目标图像之前还包括:通过神经网络的图像训练操作,得到所述分类器,所述分类器用于在所述N个分区模型中,确定所述目标图像对应的目标分区模型。
- 根据权利要求3所述的图像处理方法,其特征在于,所述通过神经网络的图像训练操作,得到所述分类器包括:获取P张训练图像;使用所述N个分区模型对所述P张训练图像进行分区,并分别确定每个分区模型对每张训练图像进行分区的精度和时间的比值;根据所述每个分区模型对每张训练图像进行分区的精度和时间的比值,确定每张训练图像对应的分区模型,其中,所述P张训练图像中的第i张训练图像对应的分区模型为:对所述第i张图像进行分区的精度和时间的比值最大的分区模型,1≤i≤P;根据所述P张训练图像对应的分区模型进行训练,得到所述分类器,所述分类器用于在所述N个分区模型中,将对所述目标图像进行分区的精度和时间的比值最大的分区模型确定为所述目标图像对应的目标分区模型。
- 根据权利要求1至4中任一项所述的图像处理方法,其特征在于,所述方法还包括:根据所述目标分区模型的精度,确定所述目标分区模型对应的卷积核的目标大小;使用所述目标大小的卷积核,对所述目标图像的分区结果进行分类,得到所述目标图像的分类结果。
- 根据权利要求1至5中任一项所述的图像处理方法,其特征在于,所述方法还包括:若所述目标分区模型不是所述N个分区模型中精度最高的分区模型,则并行使用浮点通道和定点通道对所述目标图像的分区结果进行分类,得到所述目标图像的分类结果。
- 一种图像处理装置,其特征在于,包括:图像获取模块,用于获取待处理的目标图像;模型确定模块,用于在N个分区模型中,使用分类器确定所述目标图像对应的目标分区模型,所述N为大于1的整数;图像识别模块,用于使用所述目标分区模型对所述目标图像进行分区,得到所述目标图像的分区结果。
- 根据权利要求1所述的图像处理装置,其特征在于,所述图像识别模块具体用于:在所述使用分类器确定所述目标图像对应的目标分区模型时,使用第一分区模型对所述目标图像进行分区,其中,所述第一分区模型为所述N个分区模型中精度最高的分区模型或进行图像分区操作耗时最长的分区模型;在所述模型确定模块得到所述目标图像的分区结果后,若所述目标分区模型为所述第一分区模型,则继续使用所述第一分区模型对所述目标图像进行分区,并将所述第一分区模型的分区结果作为所述目标图像的分区结果;若所述目标分区模型不为所述第一分区模型,则停止所述使用第一分区模型对所述目标图像进行分区的操作,并使用所述目标分区模型对所述目标图像进行分区,得到所述目标图像的分区结果。
- 根据权利要求7或8所述的图像处理装置,其特征在于,所述模型确定模块还用于:通过神经网络的图像训练操作,得到所述分类器,所述分类器用于在所述N个分区模型中,确定所述目标图像对应的目标分区模型。
- 根据权利要求9所述的图像处理装置,其特征在于,所述模型确定模块还用于:获取P张训练图像;使用所述N个分区模型对所述P张训练图像进行分区,并分别确定每个分区模型对每张训练图像进行分区的精度和时间的比值;根据所述每个分区模型对每张训练图像进行分区的精度和时间的比值,确定每张训练图像对应的分区模型,其中,第i张训练图像对应的分区模型为:对所述第i张图像进行分区的精度和时间的比值最大的分区模型,1≤i≤P;根据所述P张训练图像对应的分区模型进行训练,得到所述分类器,所述分类器用于在所述N个分区模型中,将对所述目标图像进行分区的精度和时间的比值最大的分区模型确定为所述目标图像对应的目标分区模型。
- 根据权利要求7至10中任一项所述的图像处理装置,其特征在于,所述图像识别模块还用于:根据所述目标分区模型的精度,确定所述目标分区模型对应的卷积核的目标大小;使用所述目标大小的卷积核,对所述目标图像的分区结果进行分类,得到所述目标图像的分类结果。
- 根据权利要求7至11中任一项所述的图像处理装置,其特征在于,所述图像识别模块还用于:在所述目标分区模型不是所述N个分区模型中精度最高的分区模型时, 并行使用浮点通道和定点通道对所述目标图像的分区结果进行分类,得到所述目标图像的分类结果。
- 一种计算机设备,其特征在于,包括处理器、存储器和通信接口,通过调用所述存储器中的指令,所述处理器用于:获取待处理的目标图像;在N个分区模型中,使用分类器确定所述目标图像对应的目标分区模型,所述N为大于1的整数;使用所述目标分区模型对所述目标图像进行分区,得到所述目标图像的分区结果。
- 根据权利要求13所述的计算设备,其特征在于,所述处理器还用于:使用第一分区模型对所述目标图像进行分区,其中,所述第一分区模型为所述N个分区模型中精度最高的分区模型或进行图像分区操作耗时最长的分区模型;所述使用所述目标分区模型对所述目标图像进行分区,得到所述目标图像的分区结果包括:若所述目标分区模型为所述第一分区模型,则继续使用所述第一分区模型对所述目标图像进行分区,并将所述第一分区模型的分区结果作为所述目标图像的分区结果;若所述目标分区模型不为所述第一分区模型,则停止所述使用第一分区模型对所述目标图像进行分区的操作,并使用所述目标分区模型对所述目标图像进行分区,得到所述目标图像的分区结果。
- 根据权利要求13或14所述的计算设备,其特征在于,所述处理器还用于:通过神经网络的图像训练操作,得到所述分类器,所述分类器用于在所述N个分区模型中,确定所述目标图像对应的目标分区模型。
- 根据权利要求15所述的计算设备,其特征在于,所述处理器还用于:获取P张训练图像;使用所述N个分区模型对所述P张训练图像进行分区,并分别确定每个分区模型对每张训练图像进行分区的精度和时间的比值;根据所述每个分区模型对每张训练图像进行分区的精度和时间的比值,确定每张训练图像对应的分区模型,其中,第i张训练图像对应的分区模型为:对所述第i张图像进行分区的精度和时间的比值最大的分区模型,1≤i≤P;根据所述P张训练图像对应的分区模型进行训练,得到所述分类器,所述分类器用于在所述N个分区模型中,将对所述目标图像进行分区的精度和时间的比值最大的分区模型确定为所述目标图像对应的目标分区模型。
- 根据权利要求13至16中任一项所述的计算设备,其特征在于,所述处理器还用于:根据所述目标分区模型的精度,确定所述目标分区模型对应的卷积核的目标大小;使用所述目标大小的卷积核,对所述目标图像的分区结果进行分类,得到所述目标图像的分类结果。
- 根据权利要求13至17中任一项所述的计算设备,其特征在于,所述处理器还用于:若所述目标分区模型不是所述N个分区模型中精度最高的分区模型,则并行使用浮点通道和定点通道对所述目标图像的分区结果进行分类,得到所述目标图像的分类结果。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/CN2016/073473 WO2017132933A1 (zh) | 2016-02-04 | 2016-02-04 | 一种图像处理方法以及相关装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107735800A true CN107735800A (zh) | 2018-02-23 |
CN107735800B CN107735800B (zh) | 2021-09-14 |
Family
ID=59499308
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201680000994.4A Active CN107735800B (zh) | 2016-02-04 | 2016-02-04 | 一种图像处理方法以及相关装置 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN107735800B (zh) |
WO (1) | WO2017132933A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110309033A (zh) * | 2019-07-15 | 2019-10-08 | 中国工商银行股份有限公司 | 故障监控方法、装置和系统 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101676953A (zh) * | 2008-08-22 | 2010-03-24 | 奥多比公司 | 自动视频图像分割 |
CN102799862A (zh) * | 2012-06-29 | 2012-11-28 | 陕西省交通规划设计研究院 | 高清视频监控图像的行人快速定位、事件检测系统及方法 |
CN103400156A (zh) * | 2013-07-04 | 2013-11-20 | 西安电子科技大学 | 基于cfar和稀疏表示的高分辨sar图像舰船检测方法 |
CN103679188A (zh) * | 2012-09-12 | 2014-03-26 | 富士通株式会社 | 图像分类器生成方法和装置及图像分类方法和装置 |
CN103854255A (zh) * | 2012-11-29 | 2014-06-11 | 比亚迪股份有限公司 | 图像增强方法及装置 |
CN104079942A (zh) * | 2014-06-25 | 2014-10-01 | 华为技术有限公司 | 一种图像处理方法、装置及系统 |
CN104537647A (zh) * | 2014-12-12 | 2015-04-22 | 中安消技术有限公司 | 一种目标检测方法及装置 |
CN104871212A (zh) * | 2012-12-21 | 2015-08-26 | 皇家飞利浦有限公司 | 用于从远程检测到的电磁辐射提取生理信息的系统和方法 |
-
2016
- 2016-02-04 WO PCT/CN2016/073473 patent/WO2017132933A1/zh active Application Filing
- 2016-02-04 CN CN201680000994.4A patent/CN107735800B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101676953A (zh) * | 2008-08-22 | 2010-03-24 | 奥多比公司 | 自动视频图像分割 |
CN102799862A (zh) * | 2012-06-29 | 2012-11-28 | 陕西省交通规划设计研究院 | 高清视频监控图像的行人快速定位、事件检测系统及方法 |
CN103679188A (zh) * | 2012-09-12 | 2014-03-26 | 富士通株式会社 | 图像分类器生成方法和装置及图像分类方法和装置 |
CN103854255A (zh) * | 2012-11-29 | 2014-06-11 | 比亚迪股份有限公司 | 图像增强方法及装置 |
CN104871212A (zh) * | 2012-12-21 | 2015-08-26 | 皇家飞利浦有限公司 | 用于从远程检测到的电磁辐射提取生理信息的系统和方法 |
CN103400156A (zh) * | 2013-07-04 | 2013-11-20 | 西安电子科技大学 | 基于cfar和稀疏表示的高分辨sar图像舰船检测方法 |
CN104079942A (zh) * | 2014-06-25 | 2014-10-01 | 华为技术有限公司 | 一种图像处理方法、装置及系统 |
CN104537647A (zh) * | 2014-12-12 | 2015-04-22 | 中安消技术有限公司 | 一种目标检测方法及装置 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110309033A (zh) * | 2019-07-15 | 2019-10-08 | 中国工商银行股份有限公司 | 故障监控方法、装置和系统 |
CN110309033B (zh) * | 2019-07-15 | 2022-12-09 | 中国工商银行股份有限公司 | 故障监控方法、装置和系统 |
Also Published As
Publication number | Publication date |
---|---|
WO2017132933A1 (zh) | 2017-08-10 |
CN107735800B (zh) | 2021-09-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20210224598A1 (en) | Method for training deep learning model, electronic equipment, and storage medium | |
Pestana et al. | A full featured configurable accelerator for object detection with YOLO | |
Xu et al. | A distributed canny edge detector: algorithm and FPGA implementation | |
US20190164043A1 (en) | Low-power hardware acceleration method and system for convolution neural network computation | |
CN110348294A (zh) | Pdf文档中图表的定位方法、装置及计算机设备 | |
TW201447776A (zh) | 透過圖形處理單元執行物件偵測運算 | |
CN109740752B (zh) | 深度模型训练方法及装置、电子设备及存储介质 | |
US11562554B1 (en) | Workload reduction for non-maximum suppression operation | |
CN110874627B (zh) | 数据处理方法、数据处理装置及计算机可读介质 | |
CN110738317A (zh) | 基于fpga的可变形卷积网络运算方法、装置和系统 | |
CN109416688B (zh) | 用于灵活的高性能结构化数据处理的方法和系统 | |
JP6559353B2 (ja) | 自動核セグメンテーション | |
US11423313B1 (en) | Configurable function approximation based on switching mapping table content | |
CN115223042A (zh) | 基于YOLOv5网络模型的目标识别方法及装置 | |
KR20210013659A (ko) | 경계 비트맵을 이용하는 이미지 분류 개선 기법 | |
US20200242467A1 (en) | Calculation method and calculation device for sparse neural network, electronic device, computer readable storage medium, and computer program product | |
CN110222652B (zh) | 行人检测方法、装置及电子设备 | |
Sanny et al. | Energy-efficient Histogram on FPGA | |
CN107735800A (zh) | 一种图像处理方法以及相关装置 | |
CN111126501A (zh) | 一种图像识别方法、终端设备及存储介质 | |
Mitsunari et al. | Hardware architecture for high-speed object detection using decision tree ensemble | |
CN112950652B (zh) | 机器人及其手部图像分割方法和装置 | |
CN113139617B (zh) | 一种输电线路自主定位方法、装置及终端设备 | |
US11288534B2 (en) | Apparatus and method for image processing for machine learning | |
Le et al. | An opencl-based sift accelerator for image features extraction on fpga in mobile edge computing environment |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |