CN110321908A - 图像识别方法、终端设备及计算机可读存储介质 - Google Patents
图像识别方法、终端设备及计算机可读存储介质 Download PDFInfo
- Publication number
- CN110321908A CN110321908A CN201810271036.1A CN201810271036A CN110321908A CN 110321908 A CN110321908 A CN 110321908A CN 201810271036 A CN201810271036 A CN 201810271036A CN 110321908 A CN110321908 A CN 110321908A
- Authority
- CN
- China
- Prior art keywords
- image
- processed
- images
- interference
- mentioned
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 103
- 238000012545 processing Methods 0.000 claims abstract description 177
- 238000000605 extraction Methods 0.000 claims abstract description 56
- 239000000284 extract Substances 0.000 claims description 33
- 241000208340 Araliaceae Species 0.000 claims description 6
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 claims description 6
- 235000003140 Panax quinquefolius Nutrition 0.000 claims description 6
- 235000008434 ginseng Nutrition 0.000 claims description 6
- 238000012549 training Methods 0.000 description 35
- 230000008569 process Effects 0.000 description 29
- 238000010586 diagram Methods 0.000 description 17
- 238000004422 calculation algorithm Methods 0.000 description 9
- 238000005516 engineering process Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 238000006073 displacement reaction Methods 0.000 description 5
- 238000003672 processing method Methods 0.000 description 5
- 230000009466 transformation Effects 0.000 description 5
- 238000001514 detection method Methods 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000013527 convolutional neural network Methods 0.000 description 3
- 230000002452 interceptive effect Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000011176 pooling Methods 0.000 description 2
- 229920000535 Tan II Polymers 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000035800 maturation Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 210000003739 neck Anatomy 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 238000004513 sizing Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/60—Rotation of whole images or parts thereof
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Image Analysis (AREA)
Abstract
本发明实施例公开了一种图像识别的方法、终端设备及计算机可读存储介质。该方法包括:确定图像干扰信息,并基于上述图像干扰信息去除输入源图像中的干扰信息以得到标准图像。确定上述图像干扰信息对应的多组图像处理参数,并根据各组图像处理参数对上述标准图像进行处理以得到多个待处理特征图像。通过多通道特征提取模型对上述多个待处理特征图像进行特征提取以得到多个图像特征,并从上述多个图像特征中确定出目标图像特征。将上述目标图像特征输入图像分类器,通过上述图像分类器确定出上述输入源图像中的目标对象。采用本发明实施例,可提高图像识别方法的准确率,降低图像识别方法的复杂度,提升图像识别方法的适用性。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种图像识别方法、终端设备及计算机可读存储介质。
背景技术
随着计算机技术的不断发展,图像识别技术的应用也越来越受到人们的重视。图像识别技术是只对图像进行对象识别,以分类各种不同模式的目标和对象的技术。它是立体视觉、运动分析、数据融合等实用技术的基础,在导航、自然资源分析、环境监测等许多领域均存在重要的应用价值。随着图像识别技术的应用范围不断扩展,人们对于图像识别技术的识别精度及效率的要求也日益提高。
现有技术中常用的图像识别方法为首先提取输入源图像的图像特征,然后根据上述图像特征确定出输入源图像中的目标对象。例如,假设输入源图像为人物图像,首先获取输入图像中的目标对象的轮廓特征,然后根据该轮廓特征确定该输入源图像是人物图像。但是,当输入源图像中存在一些如旋转或拉伸等干扰信息时,现有技术无法有效的提取输入图像所包含的具有变换不变性的图像特征,这就使得图像识别方法的准确度低,图像识别方法的适用性差。
发明内容
本发明实施例提供了一种图像识别的方法、终端设备及计算机可读存储介质,可提高图像识别方法的准确率,降低图像识别方法的复杂度,提升图像识别方法的适用性。
第一方面,本发明实施例提供了一种图像识别方法,该方法包括:确定出图像干扰信息,并基于上述图像干扰信息去除输入源图像中的干扰信息以得到标准图像。然后,确定出上述图像干扰信息对应的多组图像处理参数,并根据上述多组图像处理参数对上述标准图像进行处理以得到多个待处理特征图像。这里,一组图像处理参数应该对应一个待处理特征图像。其后,通过多通道特征提取模型对上述多个待处理特征图像进行特征提取以得到多个图像特征。从上述多个图像特征中提取出目标图像特征。最后,将上述目标图像特征输入到图像分类器中,并根据图像分类器的输出结果确定出输入源图像中的目标对象。采用本发明实施例,可提高图像识别方法的准确率,降低图像识别方法的复杂度,提升图像识别方法的适用性。
在一些可行的实施方式中,当图像干扰信息包括图像旋转时,可先获取输入源图像的主轴方向参量。然后,根据上述主轴方向参量和基准方向参量确定出该输入源图像的主轴方向和基准方向之间的第一夹角角度。最后,按照上述第一夹角角度对输入源图像进行旋转,即可获取去除该输入源图像中的旋转干扰信息后得到的标准图像。通过对输入源图像进行主轴方向的调整,可获取主轴方向和基准方向一致的标准图像。可降低后续特征提取过程中的旋转变换角度的随机性,减少特征提取过程的数据处理量,提升了特征提取效率。
在一些可行的实施方式中,上述图像干扰信息对应的多组图像处理参数中至少应该包括图像处理参数组A和图像处理参数组B。上述图像处理参数组A中至少包括旋转角度α,上述图像处理参数B中至少包括旋转角度β。可根据上述图像处理参数组A中包括的旋转角度α对上述标准图像进行旋转以得到第一待处理特征图像,再根据上述图像处理参数组B中包括的旋转角度β对上述标准图像进行旋转以得到第二待处理特征图像。同理,根据多组图像处理参数对标准图像进行多次不同角度的旋转处理,即可得到多个待处理特征图像。其中,上述多个待处理特征图像中至少包括上述第一待处理特征图像和上述第二待处理特征图像。在本发明实施例中,根据与后续的特征提取模型相关联的多组图像处理参数对标准图像进行旋转处理,得到满足上述特征提取模型内特征提取通道输入要求的多个待处理特征图像,可进一步避免旋转干扰信息导致的特征提取的错误率,提升了图像识别方法的准确率。
在一些可行的实施方式中,当上述图像干扰信息包括图像拉伸时,可确定输入源图像中目标对象所占据的第一像素区域,再确定上述图像干扰信息对应的多组图像去干扰参数。根据各组图像去干扰参数对上述第一像素区域进行拉伸处理以得到多个待处理拉伸图像。这里,一组图像去干扰参数对应处理得到一个待处理拉伸图像。最后,对上述多个待处理拉伸图像中任一待处理拉伸图像i执行如下操作:根据预设的灰度阈值确定出上述目标对象在上述待处理拉伸图像i中占据的第二像素区域。从上述待处理拉伸图像i中截取出上述第二像素区域,以得到与上述待处理拉伸图像i相对应的标准图像。同理,重复上述操作,即可得到多个待处理拉伸图像。在本发明实施例中,通过尺寸调整和图像截取操作对输入源图像进行处理以获取多个标准图像,可有效去除输入源图像中包含的拉伸干扰信息,以使得后续的特征提取进程能够更加有效的提取出输入源图像中的变换不变性特征。
在一些可行的实施方式中,上述多组图像去干扰参数至少包括图像去干扰参数组C和图像去干扰参数组D。上述图像去干扰参数组C至少包括拉伸系数c1和拉伸系数c2。上述图像去干扰参数组D至少包括拉伸系数d1和拉伸系数d2。可按照上述拉伸系数c1将上述第一像素区域在第一方向拉伸c1倍,并按照上述拉伸系数c2将上述第一像素区域在第二方向拉伸c2倍以得到第一待处理拉伸图像。按照上述拉伸系数d1将上述第一像素区域在第一方向拉伸d1倍,并按照上述拉伸系数d2将上述第一像素区域在第二方向拉伸d2倍以得到第二待处理拉伸图像。同理,多次重复上述操作,即可得到多个待处理拉伸图像。这里,上述多个待处理拉伸图像至少包括上述第一待处理拉伸图像和上述第二待处理拉伸图像。在本发明实施例中,根据多组图像去干扰参数对输入源图像中目标对象占据的第一像素区域进行拉伸以得到多个待处理拉伸图像,可提升变换不变性特征提取的准确率。
在一些可行的实施方式中,可根据上述多组图像去干扰参数确定出上述图像干扰信息对应的多组图像处理参数。其中,一组图像去干扰参数对应一组图像处理参数。上述多组图像处理参数至少包括上述图像去干扰参数组C对应的图像处理参数组C’和上述图像去干扰参数组D对应的图像处理参数组D’。特别的是,当输入源图像的尺寸满足后续特征提取模型的特征提取通道的输入要求时,图像去干扰参数组和图像处理参数组之间存在固定的换算关系。这里可以理解,以图像去干扰参数组C为例,图像去干扰处理参数组C中包括拉伸系数c1和拉伸系数c2,则图像去干扰处理参数组C对应的图像处理参数组C’中包括拉伸系数1/c1和拉伸系数1/c2。即图像去干扰参数组和图像处理参数组中对应拉伸方向上的拉伸系数为倒数关系,这就使得后续操作可根据图像处理参数组C’将标准图像的尺寸还原成输入源图像的尺寸,以得到满足特征提取模型内特征提取通道的输入要求的标准图像。在本发明中,根据上述多组图像去干扰参数确定出上述图像干扰信息对应的多组图像处理参数,可节省图像处理参数的人为设定过程,提升图像识别方法的效率。
在一些可行的实施方式中,上述多个标准图像中至少包括根据上述图像去干扰参数组C处理得到的第一标准图像和上述图像去干扰参数组D处理得到的第二标准图像。上述图像处理参数组C’中至少包括拉伸系数c1’和拉伸系数c2’。上述图像处理参数组D’中至少包括拉伸系数d1’和拉伸系数d2’。按照上述拉伸系数c1’将上述第一标准图像在第一方向拉伸c1’倍,并按照上述拉伸系数c2’将上述第一标准图像在第二方向拉伸c2’倍即可得到第一待处理特征图像。按照上述拉伸系数d1’将上述第二标准图像在第一方向拉伸d1’倍,并按照上述拉伸系数d2’将上述第二标准图像在第二方向拉伸d2’倍即可得到第二待处理特征图像。类似的,多次重复上述操作,即可得到多个待处理特征图像。这里,上述多个待处理特征图像中至少包括上述第一待处理特征图像和上述第二待处理特征图像。在本发明实施例中,根据多组图像处理参数对多个标准图像进行拉伸,可得到满足上述多通道特征提取模型内特征提取通道的输入要求的多个待处理特征图像,可进一步避免拉伸干扰信息导致的特征提取的错误率,提升了图像识别方法的准确率。
在一些可行的实施方式中,可通过上述多通道特征提取模型从上述多个图像特征中提取最大图像特征,并将所述最大图像特征确定为目标图像特征。在本发明实施例中,通过提取最大图像特征对多个图像特征进行融合,可减少图像识别方法的复杂度,提升图像识别方法的效率和适用性。
第二方面,本发明实施例提供了一种终端设备。该终端设备包括用于执行上述第一方面的任意一种可能的实现方式所提供的图像识别的方法的单元,因此也能实现第一方面提供的图像识别的方法所具备的有益效果(或者优点)。
第三方面,本发明实施例提供了一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当该指令在计算机上运行时,使得计算机执行上述第一方面中任意一种可能的实现方式所提供的图像识别的方法,也能实现第一方面提供的图像识别的方法所具备的有益效果。
第四方面,本申请实施例提供了一种包含指令的计算机程序产品,当该计算机程序产品在计算机上运行时,使得计算机执行上述第一方面提供的图像识别的方法,也能实现第一方面提供的图像识别的方法所具备的有益效果。
通过实施本发明实施例,可提高图像识别方法的准确率,降低图像识别方法的复杂度,提升图像识别方法的适用性。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍。
图1是本发明实施例提供的图像识别方法的流程示意图;
图2是本发明实施例提供的去干扰处理的一流程示意图;
图3是本发明实施例提供的去干扰处理的另一流程示意图;
图4是本发明实施例提供的图像识别终端设备的一结构示意图;
图5是本发明实施例提供的图像识别终端设备的另一结构示意图;
图6是本发明实施例提供的图像识别终端设备的又一结构示意图;
图7是本发明实施例提供的一种通信设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。
具体实现中,本发明实施例所描述的图像识别的方法可由手机、电脑等具备图像处理功能的终端设备实现,此处不作限定。对本发明实施例以终端设备为执行主体进行描述。本发明实施例提供的图像识别的方法和终端设备适用的识别对象为包含了目标对象的输入源图像。其中,上述目标对象可以为人物、物体、字符、建筑物、风景等,此处不作限定。对应的,可确定包含人物、物体、字符、建筑物、风景等目标对象的输入源图像为人物图像、物体图像、字符图、建筑物图或者风景图等,具体可根据实际应用场景确定,在此不做限制。
请参见图1,是本发明实施例提供的图像识别的方法的流程示意图。本发明实施例提供的图像识别的方法可包括步骤:
S101,确定图像干扰信息,并基于上述图像干扰信息去除输入源图像中的干扰信息以得到标准图像。
在一些可行的实施方式中,终端设备可通过其具备的摄像头等图像采集设备获取输入源图像。或者,终端设备还可从与其相连接的外部存储设备中获取输入源图像。其中,上述外部存储设备可包括软盘、移动硬盘、U盘等,此处不作限定。
在一些可行的实施方式中,上述图像干扰信息可包括图像旋转、图像拉伸、图像锐化、色彩空间等信息,此处不做限定。需要说明的是,上述图像干扰信息可由上述终端设备的默认出厂设置确定,也可由终端设备根据其所接收到的由用户输入的干扰信息设定指令来确定,此处不作限定。
在一些可行的实施方式中,当终端设备获取到输入源图像并确定图像干扰信息包括图像旋转后,可通过主轴调整算法等图像处理方法对上述输入源图像进行去干扰处理,以得到去除输入源图像中的旋转干扰信息后的标准图像。
可选的,请一并参加图2,图2是本发明实施例提供的去干扰处理一流程示意图。当终端设备获取到输入源图像并确定图像干扰信息包括图像旋转后,可根据输入源图像的主轴方向参量和预设的基准方向参量确定出输入源图像的主轴方向和基准方向之间的第一夹角角度,如图2中所示。其中,输入源图像的主轴方向为输入源图像中的目标对象的几何主轴方向。上述预设的基准方向为可用于定位输入源图像中各像素点位置的方向基准,如水平方向或垂直方向即可作为输入源图像的基准方向。例如,以输入源图像f(x,y)的中心为原点建立直角坐标系。假设输入源图像为f(x,y),则可定义输入源图像的p+q阶矩为输入源图像的重心坐标为其中,m00为输入源图像f(x,y)的0阶矩,m01和m10为输入源图像f(x,y)在x方向的1阶矩和y方向的1阶矩。输入源图像f(x,y)的p+q阶中心矩为:对输入源图像f(x,y)的p+q阶中心矩进行归一化处理,以得到其归一化中心矩为:其中,r=(p+q)/2+1。然后,可根据公式:tan2θ=2μ11/(μ20-μ02)计算出输入源图像f(x,y)的主轴方向和基准方向之间的第一夹角的角度值,其中,θ即为求取的角度值。当终端设备确定出输入源图像的主轴方向和基准方向之间的第一夹角角度后,可按照上述第一夹角角度对上述输入源图像进行旋,以得到去除输入源图像中的旋转干扰信息后的标准图像。这里可以理解,标准图像可指代主轴方向和上述基准方向一致的任一图像。例如,若确定出的第一夹角角度为+π/3,则将上述输入源图像按照顺时针方向旋转π/3的角度以得到去除旋转干扰信息后的标准图像。若确定出的第一夹角角度为-π/3,则将上述输入源图像按照逆时针方向旋转π/3的角度以得到去除旋转干扰信息后的标准图像。
在本发明实施例中,通过主轴调整算法等图像处理方法对输入源图像进行主轴方向的调整,以获取主轴方向和基准方向一致的标准图像,可降低图像的旋转变换角度的随机性,减少特征提取过程的数据处理量,提升了特征提取效率。
在一些可行的实施方式中,当终端设备获取到输入源图像并确定图像干扰信息包括图像拉伸后,可通过对输入源图像中的目标对象占据的像素区域进行拉伸和图像截取来获取去除输入源图像中的拉伸干扰信息后得到的标准图像。
可选的,终端设备在获取到输入源图像并确定图像干扰信息包括图像拉伸后,可确定出输入源图像中目标对象所占据的像素区域,下文以第一像素区域进行描述。其中,终端设备可通过目标检测方法从输入源图像中确定出上述第一像素区域。上述目标检测方法可包括帧间差分法、光流法和基于小波变换的目标检测方法等,此处不作限定。其后,终端设备可获取与拉伸干扰信息相对应的多组图像去干扰参数。其中,上述多组图像去干扰参数至少包括图像去干扰参数组C和图像去干扰参数组D。上述多组图像去干扰参数为对上述输入源图像中的第一像素区域进行多次尺寸调整所需的尺寸调整参数。上述多组图像去干扰参数中的每个图像去干扰参数组中至少包括两个系数。图像去干扰参数组C中至少包括拉伸系数c1和拉伸系数c2,图像去干扰参数组D中至少包括拉伸系数d1和拉伸系数d2。例如,假设图像去干扰参数组C的格式为[拉伸,X,c1,Y,c2],其中,拉伸这一系数可表明去干扰参数组C对应的尺寸调整为拉伸操作。X与c1两个系数表明在水平方向上拉伸c1倍。Y与c2两个系数表明在垂直方向上拉伸c2倍。当终端设备获取到多组图像去干扰参数后,可根据各组图像去干扰参数对上述第一像素区域进行处理以得到多个待处理拉伸图像。可选的,终端设备在获取到多组图像去干扰参数后,也可根据各组图像去干扰参数对输入源图像进行尺寸调整,以得到多个待处理拉伸图像,此处不作限定。其中,一个图像去干扰参数组对应一个待处理拉伸图像。例如,请一并参见图3,图3是本发明实施例提供的去干扰处理的另一流程示意图。其中,输入源图像中的目标对象即为数字5。假设上述输入源图像的尺寸为30*30像素,数字5占据的第一像素区域的尺寸为20*20像素。终端设备获取到25个图像去干扰参数组,上述25个图像去干扰参数组用于将上述第一像素区域在水平方向和垂直方向上以0.2倍为步长拉伸至原始尺寸的0.6倍至1.4倍。假设25个图像去干扰参数组中的图像去干扰参数组T格式为[拉伸,X,0.6,Y,0.6],则终端设备可按照图像去干扰参数组T将上述第一像素区域在水平方向和垂直方向上均拉伸至原始尺寸大小的0.6倍以得到图像去干扰参数组T对应的待处理拉伸图像。上述图像去干扰参数组T对应的待处理拉伸图像的尺寸为12*12像素。或者,终端设备还可按照图像去干扰参数组T将输入源图像的尺寸由30*30像素拉伸至18*18像素,此时,第一像素区域的尺寸也会被调整至12*12像素。按照25个图像去干扰参数组对输入源图像中的第一像素区域进行25次尺寸调整,即可得到25个待处理拉伸图像。
终端设备在获取到多个待处理拉伸图像后,可根据预设的灰度阈值对多个待处理拉伸图像中每个待处理拉伸图像进行图像截取操作,以得到多个待处理拉伸图像对应的多个标准图像。可以理解的是,上述每个待拉伸图像均为灰度图。若终端设备获取到的多个待处理拉伸图像并非灰度图,则需要先对每个待处理拉伸图像进行灰度化处理。下面以多个待处理拉伸图像中的任意一个待处理拉伸图像i为例对上述图像截取操作进行描述。首先,从待处理拉伸图像i中确定出灰度值小于上述灰度阈值的像素点所占据的像素区域的轮廓,即目标对象的轮廓。然后,在待处理拉伸图像i中确定出一个至少能完整包括目标对象轮廓的像素区域,并确定为第二像素区域。其中,上述第二像素区域的轮廓可为矩形、圆形、椭圆形等,此处不做限定。最后,通过图像截取方法从上述待处理拉伸图像i中截取出第二像素区域以得到待处理拉伸图像i对应的标准图像。重复上述操作,直至获取到多个待处理拉伸图像对应的多个标准图像。可选的,终端设备在获取到多个待处理拉伸图像后,还可通过帧间差分法、光流法或基于小波变换的目标检测等方法从各个待处理拉伸图像中确定出目标对象占据的第二像素区域,此处不作限定。请一并参见图3及上文示例,以终端设备获取到的25个待处理拉伸图像中的待处理拉伸图像i为例,假设预设的灰度阈值为0.5,目标对象即为数字5。确定出待处理拉伸图像i中灰度值小于0.5的像素点所占据的像素区域的轮廓,也就是数字5的轮廓。然后,在待处理拉伸图像i中确定一个至少能完整包括数字5的轮廓的像素区域,并将该像素区域确定为第二像素区域。通过直方图法从待处理拉伸图像i中截取出第二像素区域以得到待处理拉伸图像i对应的标准图像。重复上述操作,即可获取25个待处理拉伸图像对应的25个标准图像。
在本发明实施例中,终端设备通过拉伸和图像截取操作对输入源图像进行处理以获取多个标准图像,可有效去除输入源图像中包含的拉伸干扰信息,可使得后续的特征提取操作能够更加有效的提取出输入源图像中的变换不变性特征。
S102,确定上述图像干扰信息对应的多组图像处理参数,并根据各组图像处理参数对上述标准图像进行处理以得到多个待处理特征图像。
在一些可行的实施方式中,当终端设备基于图像干扰信息去除输入源图像中的干扰信息得到标准图像后,可确定出图像干扰信息对应的多组图像处理参数。其中,不同的图像干扰信息对应多组图像处理参数不同。然后,终端设备可根据各组图像处理参数对上述标准图像进行处理,以得到多个待处理特征图像。其中,一组图像处理参数对应一个待处理特征图像。
可选的,当终端设备获取到去除输入源图像中的旋转干扰信息得到的标准图像后,可获取旋转干扰信息对应的多组图像处理参数。上述多个图像处理参数中至少包括图像处理参数组A和图像处理参数组B。其中,上述图像处理参数组A中至少包括旋转角度α,上述图像处理参数组B中至少包括旋转角度β。例如,上述图像处理参数组A的格式可为[旋转,α],上述图像处理参数组B的格式可为[旋转,β]。可选的,上述图像处理参数组的个数、旋转角度α和β可与后续的特征提取模型的通道数相关联。例如,假设后续特征提取模型的通道数为N1,则可确定图像处理参数组的个数为N1,旋转步长a=360°/N1,n*(360°/N1)=α-β。其中,n为非零整数。假设通道数N1=4,则图像处理参数组的个数为4,a=90°。当α=0°时,β可为90°、180°或270°。需要说明的是,终端设备可直接从预设的图像参数库中提取出上述多组图像处理参数,也可根据其所接收到的由用户输入的图像处理参数组生成指令生成多组图像处理参数,还可根据其所接收到的由用户输入的数据来确定出多组图像处理参数,此处不作限定。终端设备在获取到上述多组图像处理参数后,可根据上述多组图像处理参数对上述标准图像进行不同角度的旋转处理,以得到多个待处理特征图像。根据上述图像处理参数组A中包括的旋转角度α对上述标准图像进行旋转以得到第一待处理特征图像,根据上述图像处理参数组B中包括的旋转角度β对上述标准图像进行旋转以得到第二待处理特征图像。重复上述操作,即可获取多个待处理特征图像。例如,请一并参见图2。假设通道数N1=4,则图像处理参数组的个数为4,上述多组图像处理参数具体可包括[旋转,0°]、[旋转,90°]、[旋转,180°]和[旋转,270°]。根据上述4个图像处理参数将标准图像分别旋转0°、90°、180°和270°,即可得到4个待处理特征图像。
在本发明实施例中,根据多组图像处理参数对标准图像进行旋转处理,得到满足上述特征提取模型的特征通道输入要求的多个待处理特征图像,可进一步避免旋转干扰信息导致的特征提取的错误率,提升了图像识别的准确率。
可选的,当终端设备获取到去除输入源图像中的拉伸干扰信息得到的多个标准图像后,可根据上述多组图像去干扰参数确定出拉伸干扰信息对应的多组图像处理参数。其中,一组图像去干扰参数对应一组图像处理参数。上述多组图像处理参数中至少应包括上述图像去干扰参数组C对应的图像处理参数组C’和图像去干扰参数组D对应的图像处理参数组D’。上述图像处理参数组C’中至少包括拉伸系数c1’和拉伸系数c2’。上述图像处理参数组D’中至少包括拉伸系数d1’和拉伸系数d2’。假设,图像处理参数组C’的格式为[拉伸,X,c1’,Y,c2’],则拉伸这一系数表明图像处理参数组C’对应的尺寸调整为拉伸操作,X与c1’两个系数表明在水平方向上拉伸c1’倍,Y与c2’两个系数表明在垂直方向上拉伸c2’倍。可以理解的是,终端设备可直接从预设的图像处理参数库中提取出上述多组图像处理参数,也可根据其所接收到的由用户输入的图像处理参数生成指令生成多组图像处理参数,此处不作限定。可选的,当输入源图像的尺寸满足后续特征提取模型内特征提取通道的输入要求时,上述图像去干扰参数组和上述图像处理参数组之间存在固定的换算关系,这种固定的换算关系使得图像处理参数组确定的第二次尺度调整操作的目的为对步骤S101中所描述的尺寸调整操作进行还原。以图像去干扰参数组C为例,图像去干扰参数组C中包括拉伸系数c1和拉伸系数c2,则图像去干扰参数组C对应的图像处理参数组C’中包括拉伸系数1/c1和拉伸系数1/c2。
终端设备在确定出与拉伸干扰信息相对应的多组图像处理参数后,可根据上述各组图像处理参数对上述多个标准图像进行处理,以得到多个待处理特征图像。其中,上述多个标准图像至少包括根据上述图像去干扰参数组C处理得到的第一标准图像。下面以与上述图像去干扰参数组C相对应的图像处理参数组C’为例,对获取待处理特征图像的过程进行描述。上述图像处理参数组C’中至少包括拉伸系数c1’和拉伸系数c2’。终端设备按照上述拉伸系数c1’将上述第一标准图像在第一方向拉伸c1’倍,并按照上述拉伸系数c2’将上述第标准图像在第二方向拉伸c2’倍以得到第一待处理特征图像。同理,终端设备可根据上述各组图像处理参数对上述多个标准图像进行处理,以得到满足后续特征提取模型中特征提取通道的输入要求的多个待处理特征图像。具体过程可参见步骤S101中所描述的针对第一像素区域的尺寸调整过程,此处便不再赘述。例如,请一并参见图3及上述示例,终端设备在获取到25个标准图像后,可获取25组图像处理参数。根据上述25组图像处理参数对上述25个标准图像进行尺寸调整,以得到25个待处理特征图像。
在本发明实施例中,根据多组图像处理参数对多个标准图像进行尺度调整,得到满足上述特征提取模型的特征提取通道输入要求(比如图像尺寸等要求)的多个待处理特征图像,可进一步避免拉伸干扰信息导致的特征提取的错误率,提升了图像识别的准确率。
S103,通过多通道特征提取模型对上述多个待处理特征图像进行特征提取以得到多个图像特征。从上述多个图像特征中确定出目标图像特征。
在一些可行的实施方式中,终端设备在获取到上述多个待处理特征图像后,可将上述多个待处理特征图像分别输入到多通道特征提取模型的各个通道中,以获取上述多个待处理特征图像对应的多个图像特征。然后,从上述多个图像特征中确定出目标图像特征。
可选的,终端设备在获取到多个待处理特征图像后,可根据预设的通道匹配关系将上述各个待处理特征图像依次输入到多通道特征提取模型的各个通道中去。其中,上述多通道特征提取模型可包括多通道并行卷积神经网络模型、多通道递归神经网络模型等,此处不做限定。上述预设的通道匹配关系用于确定多个待处理特征图像中一个待处理特征图像与多通道特征提取模型中的一个特征提取通道的对应关系。可选的,通过上述多通道特征提取模型对上述多个待处理特征图像进行特征提取时,各特征提取通道的网络模型相同并且采用的权重等参数相同。假设,由标准图像旋转0°、90°、180°和270°得到4个待处理特征图像,下面以从这4个待处理特征图像中提取图像特征为例对特征提取的过程进行描述。上述多通道特征提取模型为4通道的并行卷积神经网络模型。终端设备可根据预设的通道匹配关系将旋转0°对应的待处理特征图像(下文以第一待处理特征图像代替描述)输入至上述4个特征提取通道中的第一特征提取通道。上述第一特征提取通道通过卷积、激活、池化、全连接、循环等过程,提取并输出与第一待处理特征图像相对应的第一图像特征。同理,终端设备也可对剩余的3个待处理特征图像进行图像特征提取,以得到个4待处理特征图像对应的4个图像特征。
在一些可行的实施方式中,终端设备在获取到多个图像特征后,可通过特征融合算法对上述多个图像特征进行融合,以得到目标图像特征。可选的,终端设备可通过TI-pooling算子求取出上述多个图像特征中的最大图像特征,并将该最大图像特征确定为目标图像特征。使用TI-pooling算子求取目标图像特征,算法结构简单,易于实现,可提升图像识别的效率。
在本发明实施例中,通过多通道特征提取模型对多个待处理特征图像进行特征提取以得到多个图像特征,并对多个图像特征进行融合以得到目标图像特征,可增强输入到后续分类器的目标图像特征的变换不变性,可提升图像识别的效率和准确率。
S104,将上述目标图像特征输入图像分类器,通过该图像分类器确定出上述输入源图像中的目标对象。
在一些可行的实施方式中,终端设备获取到目标图像特征后,可将上述目标图像特征输入到图像分类器中,并通过该图像分类器的输出结果确定出上述输入源图像的中的目标对象。其中,上述图像分类器为训练后的图像分类器。上述图像分类器的输出结果为类别标签,上述类别标签可以用于标记人物、动物、建筑物等识别对象的属性。因此,终端设备可根据上述类别标签确定出输入源图像中的目标对象是人物、动物或者建筑物等。例如,终端设备将人物图像对应的目标图像特征输入到上述图像分类器中,上述图像分类器的就会输出与人物这个属性相对应的类别标签P。终端设备可根据类别标签P确定出输入源图像中的目标对象为人,进而可确定输入源图像为人物图像。在本发明实施例中,使用训练好的分类器对输入源图像进行分类,可提升图像识别的效率和精度。
可选的,上述图像分类器可由原始图像分类器通过训练得到。终端设备可获取M个训练图像组和M个类别标签。其中,一个训练图像组中可包含K张图像。一个训练图像组对应一个类别标签。M和K均为大于0的正整数。例如,终端设备可从MNIST数字识别的数据库中获取10个训练图像组,每个训练图像组中包含6000张训练图像。一个训练图像组对应一个用于标记数字0至9中任意一个数字的类别标签。下面以M个训练图像组中的训练图像A为例进行描述。终端设备可对训练图像A进行去干扰处理,以获取训练图像A对应的标准图像。再确定出多组图像处理参数,并根据多组处理参数对训练图像A对应的标准图像进行处理,以得到训练图像A对应的多个待处理特征图像。然后,终端设备通过上述多通道特征提取模型对上述训练图像A对应的多个待处理特征图像进行特征提取,以得到与上述训练图像A相对应的目标图像特征。同理,终端设备可获取M个训练图像组对应的M*K个目标图像特征。最后,使用上述M*K个目标图像特征和上述M个类别标签对原始图像分类器进行训练,以获取训练后的图像分类器。其中,上述训练后的图像分类器用于根据输入的待识别图像输出与上述待识别图像的目标对象相匹配的类别参量,终端设备可根据上述类别参量确定出上述待识别图像中的目标对象。
可选的,在本发明实施例中,上述多通道特征提取模型可采用卷积神经网络等机器学习算法。此时,上述多通道特征提取模型需有训练的过程。终端设备可直接使用其他已训练模型的模型参数对原始多通道特征提取模型进行初始化来得到上述多通道特征提取模型,以省略训练的过程,操作简单,可降低多通道特征提取模型的开发和训练所需的人力和时间成本。可选的,终端设备也可对联接在一起的原始多通道特征提取模型和原始图像分类器同时进行训练,以得到模型参数收敛后的多通道特征提取模型和图像分类器。对联接在一起的原始多通道特征提取模型和原始图像分类器同时进行训练,可提高图像识别方法的准确率。可选的,终端设备也可单独对上述原始多通道特征提取模型和原始图像分类器进行训练。具体的训练过程可参见前文描述的对原始图像分类器进行训练的过程,此处便不再赘述。
可选的,上述多通道特征提取模型可采用小波变换法、边界方向直方图法等非机器学习算法。此时,终端设备不需要对上述多通道特征提取模型进行训练,具体可根据实际应用场景确定,在此不做限制。
需要说明的是,在本发明实施例中,对输入源图像图进行去干扰处理并获得标准图像的过程采用了非学习的算法,不需要训练过程。对标准图像进行处理获得多个待处理特征图像也采用了非学习的算法,不需要训练过程。
在本发明实施例中,终端设备首先确定图像干扰信息,并基于上述图像干扰信息去除输入源图像中的干扰信息以得到标准图像。确定上述图像干扰信息对应的多组图像处理参数,并根据各组图像处理参数对上述标准图像进行处理以得到多个待处理特征图像。通过多通道特征提取模型对上述多个待处理特征图像进行特征提取以得到多个图像特征,并从上述多个图像特征中确定出目标图像特征。将上述目标图像特征输入图像分类器,通过上述图像分类器确定出上述输入源图像中的目标对象。采用本发明实施例,可提高图像识别方法的准确率,降低图像识别方法的复杂度,提升图像识别方法的适用性。
请参见图4,图4是本发明实施例提供的图像识别的终端设备的一结构示意图。本发明实施例所描述的图像识别的终端设备包括但不限于干扰去除单元10、特征图像获取单元20、特征提取单元30和分类单元40。可选的,请一并参见图5,图5是本发明实施例提供的图像识别的终端设备的另一结构示意图,本发明实施例所描述的图像识别的终端设备还可包括训练单元50。
其中,上述干扰去除单元10用于确定图像干扰信息,并基于上述图像干扰信息去除输入源图像中的干扰信息以得到标准图像。
特征图像获取单元20用于确定上述图像干扰信息对应的多组图像处理参数,并根据各组图像处理参数对上述干扰去除单元10得到的标准图像进行处理以得到多个待处理特征图像,其中,一组图像处理参数对应一个待处理特征图像。
特征提取单元30,用于通过多通道特征提取模型对上述特征图像获取单元20获取的多个待处理特征图像进行特征提取以得到多个图像特征,并从上述多个图像特征中确定出目标图像特征。
分类单元40,用于将上述特征提取单元30提取的上述目标图像特征输入图像分类器,通过上述图像分类器确定出上述输入源图像中的目标对象。
在一些可行的实施方式中,上述图像干扰信息包括图像旋转,上述干扰去除单元10用于:
获取输入源图像的主轴方向参量,并根据上述主轴方向参量和基准方向参量确定出上述输入源图像的主轴方向与基准方向之间的第一夹角角度。按照上述第一夹角角度对上述输入源图像进行旋转,以获取去除上述输入源图像中的旋转干扰信息后的标准图像。
在一些可行的实施方式中,上述图像干扰信息对应的多组图像处理参数中至少包括图像处理参数组A和图像处理参数组B,上述图像处理参数组A中至少包括旋转角度α,上述图像处理参数B至少包括旋转角度β。上述特征图像获取单元20用于:
根据上述图像处理参数组A中包括的旋转角度α对上述干扰去除单元10得到的上述标准图像进行旋转以得到第一待处理特征图像。根据上述图像处理参数组B中包括的旋转角度β对上述干扰去除单元10获取的上述标准图像进行旋转以得到第二待处理特征图像。对应的,上述多个待处理特征图像中至少包括上述第一待处理特征图像和上述第二待处理特征图像。
在一些可行的实施方式中,上述图像干扰信息包括图像拉伸,上述干扰去除单元10用于:
确定输入源图像中目标对象所占据的第一像素区域。确定上述图像干扰信息对应的多组图像去干扰参数,并根据各组图像去干扰参数对上述第一像素区域进行拉伸处理以得到多个待处理拉伸图像。其中,一组图像去干扰参数对应处理得到一个待处理拉伸图像。对上述多个待处理拉伸图像中任一待处理拉伸图像i执行如下操作:
根据灰度阈值确定出上述目标对象在上述待处理拉伸图像i中占据的第二像素区域。从上述待处理拉伸图像i中截取出上述第二像素区域,以得到与上述待处理拉伸图像i相对应的标准图像。对应的,上述多个待处理拉伸图像对应多个标准图像。
在一些可行的实施方式中,上述多组图像去干扰参数至少包括图像去干扰参数组C和图像去干扰参数组D。上述图像去干扰参数组C至少包括拉伸系数c1和拉伸系数c2。上述图像去干扰参数组D至少包括拉伸系数d1和拉伸系数d2。上述干扰去除单元10用于:
按照上述拉伸系数c1将上述第一像素区域在第一方向拉伸c1倍,并按照上述拉伸系数c2将上述第一像素区域在第二方向拉伸c2倍以得到第一待处理拉伸图像。按照上述拉伸系数d1将上述第二像素区域在第一方向拉伸d1倍,并按照上述拉伸系数d2将上述第二像素区域在第二方向拉伸d2倍以得到第二待处理拉伸图像。对应的,上述多个待处理拉伸图像至少包括上述第一待处理拉伸图像和上述第二待处理拉伸图像。
在一些可行的实施方式中,上述特征图像获取单元20用于:
根据上述干扰去除单元10确定的多组去干扰参数确定出上述图像干扰信息对应的多组图像处理参数,其中,一组去干扰参数对应一组图像处理参数。上述多组图像处理参数至少包括上述去干扰参数组C对应的图像处理参数组C’和上述去干扰参数组D对应的图像处理参数组D’。
在一些可行的实施方式中,上述干扰去除单元10得到的多个标准图像中至少包括根据上述去干扰参数组C处理得到的第一标准图像和上述去干扰参数组D处理得到的第二标准图像。上述图像处理参数组C’中至少包括拉伸系数c1’和拉伸系数c2’,上述图像处理参数组D’中至少包括拉伸系数d1’和拉伸系数d2’。上述特征图像获取单元20用于:
按照上述拉伸系数c1’将上述第一标准图像在第一方向拉伸c1’倍,并按照上述拉伸系数c2’将上述第一像素区域在第二方向拉伸c2’倍以得到第一待处理特征图像。按照上述拉伸系数d1’将上述第二标准图像在第一方向拉伸d1’倍,并按照上述拉伸系数d2’将上述第二标准图像在第二方向拉伸d2’倍以得到第二待处理特征图像。对应的,上述多个待处理特征图像中至少包括上述第一待处理特征图像和上述第二待处理特征图像。
在一些可行的实施方式中,上述特征提取单元30用于:
通过上述多通道特征提取模型从上述多个图像特征中提取最大图像特征,并将上述最大图像特征确定为目标图像特征。
在一些可行的实施方式中,干扰去除单元10可通过其具备的摄像头等图像采集设备获取输入源图像。或者,干扰去除单元10还可从与其相连接的外部存储设备中获取输入源图像。其中,上述外部存储设备可包括软盘、移动硬盘、U盘等,此处不作限定。在获取到输入源图像之后,干扰去除单元10可确定获取图像干扰信息,以确定与图像干扰信息相对应的干扰去除进程,上述干扰去除进程用于对上述输入源图像进行干扰去除。
可选的,当干扰去除单元10确定图像干扰信息包括图像旋转后,可通过主轴调整算法等图像处理方法对上述输入源图像进行去干扰处理,以得到去除输入源图像中的图像旋转干扰后的标准图像。干扰去除单元10去除输入源图像中的旋转干扰的过程可参见步骤S101中所描述的去除输入源图像中的旋转干扰的过程,此处不再赘述。干扰去除单元10通过对输入源图像进行主轴方向的调整,可降低后续特征提取过程中的旋转变换角度的随机性,减少特征提取过程的数据处理量,提升了特征提取效率。
可选的,当干扰去除单元10确定图像干扰信息包括图像拉伸后,可通过尺度调整和图像截取等图像处理方法对上述输入源图像进行去干扰处理,以得到去除输入源图像中的图像拉伸干扰后的标准图像。干扰去除单元10去除输入源图像中的拉伸干扰的过程可参见步骤S101中所描述的去除输入源图像中的拉伸干扰的过程,此处不再赘述。干扰去除单元10通过尺寸调整和图像截取操作对输入源图像进行处理以获取多个标准图像,可有效去除输入源图像中包含的拉伸干扰信息,以使得后续的特征提取进程能够更加有效的提取出输入源图像中的变换不变性特征。
当干扰去除单元10获取到标准图像后,特征图像获取单元20可确定出图像干扰信息对应的对组图像处理参数。其中,不同的图像干扰信息对应多组图像处理参数不同。然后,特征图像获取单元20可根据各组图像处理参数对上述标准图像进行处理,以得到多个待处理特征图像。
可选的,特征图像获取单元20可获取旋转干扰信息对应的多组图像处理参数。在获取到上述多组图像处理参数后,特征图像获取单元20可根据上述多组图像处理参数对上述标准图像进行不同角度的旋转处理,以得到多个待处理特征图像。特征图像获取单元20获取多个待处理特征图像的过程可参见步骤S102中所描述的获取多个待处理特征图像的过程,此处便不再赘述。图像特征获取单元20对标准图像进行旋转处理,得到满足上述特征提取模型的特征通道输入要求的多个待处理特征图像,可进一步避免旋转干扰信息导致的特征提取的错误率,提升了图像识别的准确率。
可选的,特征图像获取单元20还可根据上述多组图像去干扰参数确定出拉伸干扰信息对应的多组图像处理参数。再根据上述各组图像处理参数对上述多个标准图像进行尺度拉伸,以得到多个待处理特征图像。特征图像获取单元20通过尺度拉伸和图像截取处理获取多个待处理特征图像的过程可参见步骤S102中所描述的获取多个待处理特征图像的过程,此处便不再赘述。特征图像获取单元20对多个标准图像进行尺度拉伸,可得到满足上述特征提取模型的特征通道输入要求的多个待处理特征图像,可进一步避免拉伸干扰信息导致的特征提取的错误率,提升了图像识别方法的准确率。
当特征图像获取单元20获取到多个待处理特征图像后,特征提取单元30可将上述多个待处理特征图像分别输入到其内部的多通道特征提取模型的各个通道中,以获取上述多个待处理特征图像对应的多个图像特征。然后,特征提取单元30可从上述多个图像特征中确定出目标图像特征。具体过程可参见步骤S103中所描述的目标图像特征的获取过程,此处便不再赘述。特征提取单元30通过多通道特征提取模型从多个待处理特征图像中获取目标图像特征,可提升变换不变性特征的提取精度,并提升分类器的分类效率。
当特征提取单元30获取到目标图像特征后,可将上述目标图像特征输入图像分类单元40内的图像分类器中。分类单元40可通过该图像分类器的输出结果确定出上述输入源图像中的目标对象。
可选的,训练单元50需要对原始图像分类器进行训练,以得到上述图像分类器。训练单元50对原始图像分类器训练的过程可参见步骤S104中所描述的训练过程,此处便不再赘述。
可选的,请一并参见图6,图6是本发明实施例提供的图像识别终端设备的又一结构示意图。由图6可知,若上述多通道特征提取模型采用的是卷积神经网络等机器学习算法,训练单元50可同时对联接在一起的特征提取单元30和图像分类单元40中的原始多通道特征提取模型和原始图像分类器进行训练,以得到训练后的多通道特征提取模型和图像分类器。训练单元50也可单独对上述原始多通道特征提取模型和原始图像分类器进行训练。具体训练过程可参见步骤S104中所描述的训练过程,此处便不再赘述。若上述特征提取单元30中的多通道特征提取模型采用的是小波变换法、边界方向直方图法等非机器学习算法,则训练单元50不需要对上述多通道特征提取模型进行训练,仅对图像分类单元40中的原始图像分类器进行训练即可。
请参见图7,图7是本发明实施例提供的一种通信设备的结构示意图。本发明实施例提供的通信设备60包括处理器601、存储器602、收发器603和总线系统604。其中,上述处理器601、存储器602和收发器603通过总线系统604连接。
上述存储器602用于存放程序。具体地,程序可以包括程序代码,程序代码包括计算机操作指令。存储器602包括但不限于是随机存储记忆体(random access memory,RAM)、只读存储器(read-only memory,ROM)、可擦除可编程只读存储器(erasable programmableread only memory,EPROM)、或便携式只读存储器(compact disc read-only memory,CD-ROM)。图6中仅示出了一个存储器,当然,存储器也可以根据需要,设置为多个。
存储器602也可以是处理器601中的存储器,在此不做限制。
存储器602存储了如下的元素,可执行模块或者数据结构,或者它们的子集,或者它们的扩展集:
操作指令:包括各种操作指令,用于实现各种操作。
操作系统:包括各种系统程序,用于实现各种基础业务以及处理基于硬件的任务。
上述处理器601控制通信设备60的操作,处理器601可以是一个或多个中央处理器(central processing unit,CPU)。在处理器601是一个CPU的情况下,该CPU可以是单核CPU,也可以是多核CPU。
具体的应用中,通信设备60的各个组件通过总线系统604耦合在一起,其中总线系统604除包括数据总线之外,还可以包括电源总线、控制总线和状态信号总线等。但是为了清楚说明起见,在图6中将各种总线都标为总线系统604。为便于表示,图6中仅是示意性画出。
本发明实施例揭示的图像识别的方法可以应用于处理器601中,或者由处理器601实现。处理器601可能是一种集成电路芯片,具有信号的处理能力。
在实现过程中,上述方法的各步骤可以通过处理器601中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器601可以是通用处理器、数字信号处理器(digitalsignal processing,DSP)、专用集成电路(application specific integrated circuit,ASIC)、现场可编程门阵列(field-programmable gate array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件,可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。
通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器602,处理器601读取存储器602中的信息,结合其硬件执行上述各个实施例所描述数据处理方法步骤。
本发明的另一实施例中提供一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当该指令在计算机上运行时实现:确定图像干扰信息,并基于上述图像干扰信息去除输入源图像中的干扰信息以得到标准图像。确定上述图像干扰信息对应的多组图像处理参数,并根据各组图像处理参数对上述标准图像进行处理以得到多个待处理特征图像。通过多通道特征提取模型对上述多个待处理特征图像进行特征提取以得到多个图像特征,并从上述多个图像特征中确定出目标图像特征。将上述目标图像特征输入图像分类器,通过上述图像分类器确定出上述输入源图像中的目标对象。
上述计算机可读存储介质可以是前述任一实施例所述的终端设备的内部存储单元,例如终端设备的硬盘或内存。上述计算机可读存储介质也可以是上述终端设备的外部存储设备,例如所述终端设备上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,上述计算机可读存储介质还可以既包括上述终端设备的内部存储单元也包括外部存储设备。上述计算机可读存储介质用于存储上述计算机程序以及上述终端设备所需的其他程序和数据。上述计算机可读存储介质还可以用于暂时地存储已经输出或者将要输出的数据。
Claims (17)
1.一种图像识别的方法,其特征在于,所述方法包括:
确定图像干扰信息,并基于所述图像干扰信息去除输入源图像中的干扰信息以得到标准图像;
确定所述图像干扰信息对应的多组图像处理参数,并根据各组图像处理参数对所述标准图像进行处理以得到多个待处理特征图像;
通过多通道特征提取模型对所述多个待处理特征图像进行特征提取以得到多个图像特征,并从所述多个图像特征中确定出目标图像特征;
将所述目标图像特征输入图像分类器,通过所述图像分类器确定出所述输入源图像中的目标对象。
2.根据权利要求1所述的方法,其特征在于,所述图像干扰信息包括图像旋转,所述基于所述图像干扰信息去除输入源图像中的干扰信息以得到标准图像包括:
获取输入源图像的主轴方向参量,并根据所述主轴方向参量和基准方向参量确定出所述输入源图像的主轴方向与基准方向之间的第一夹角角度;
按照所述第一夹角角度对所述输入源图像进行旋转,以获取去除所述输入源图像中的旋转干扰信息后的标准图像。
3.根据权利要求2所述的方法,其特征在于,所述图像干扰信息对应的多组图像处理参数中至少包括图像处理参数组A和图像处理参数组B,所述图像处理参数组A中至少包括旋转角度α,所述图像处理参数B至少包括旋转角度β;
所述根据各组图像处理参数对所述标准图像进行处理以得到多个待处理特征图像包括:
根据所述图像处理参数组A中包括的旋转角度α对所述标准图像进行旋转以得到第一待处理特征图像;
根据所述图像处理参数组B中包括的旋转角度β对所述标准图像进行旋转以得到第二待处理特征图像;
对应的,所述多个待处理特征图像中至少包括所述第一待处理特征图像和所述第二待处理特征图像。
4.根据权利要求1所述的方法,其特征在于,所述图像干扰信息包括图像拉伸,所述基于所述图像干扰信息去除输入源图像中的干扰信息以得到标准图像包括:
确定输入源图像中目标对象所占据的第一像素区域;
确定所述图像干扰信息对应的多组图像去干扰参数,并根据各组图像去干扰参数对所述第一像素区域进行拉伸处理以得到多个待处理拉伸图像,其中,一组图像去干扰参数对应处理得到一个待处理拉伸图像;
对所述多个待处理拉伸图像中任一待处理拉伸图像i执行如下操作:
根据灰度阈值确定出所述目标对象在所述待处理拉伸图像i中占据的第二像素区域;
从所述待处理拉伸图像i中截取出所述第二像素区域,以得到与所述待处理拉伸图像i相对应的标准图像;
对应的,所述多个待处理拉伸图像对应多个标准图像。
5.根据权利要求4所述的方法,其特征在于,所述多组图像去干扰参数至少包括图像去干扰参数组C和图像去干扰参数组D,所述图像去干扰参数组C至少包括拉伸系数c1和拉伸系数c2,所述图像去干扰参数组D至少包括拉伸系数d1和拉伸系数d2;
所述根据各组图像去干扰参数对所述第一像素区域进行处理以得到多个待处理拉伸图像包括:
按照所述拉伸系数c1将所述第一像素区域在第一方向拉伸c1倍,并按照所述拉伸系数c2将所述第一像素区域在第二方向拉伸c2倍以得到第一待处理拉伸图像;
按照所述拉伸系数d1将所述第一像素区域在第一方向拉伸d1倍,并按照所述拉伸系数d2将所述第一像素区域在第二方向拉伸d2倍以得到第二待处理拉伸图像;
对应的,所述多个待处理拉伸图像至少包括所述第一待处理拉伸图像和所述第二待处理拉伸图像。
6.根据权利要求5所述的方法,其特征在于,所述确定所述图像干扰信息对应的多组图像处理参数包括:
根据所述多组去干扰参数确定出所述图像干扰信息对应的多组图像处理参数,其中,一组去干扰参数对应一组图像处理参数,所述多组图像处理参数至少包括所述去干扰参数组C对应的图像处理参数组C’和所述去干扰参数组D对应的图像处理参数组D’。
7.根据权利要求6所述的方法,其特征在于,所述多个标准图像中至少包括根据所述去干扰参数组C处理得到的第一标准图像和所述去干扰参数组D处理得到的第二标准图像,所述图像处理参数组C’中至少包括拉伸系数c1’和拉伸系数c2’,所述图像处理参数组D’中至少包括拉伸系数d1’和拉伸系数d2’;
所述根据各组图像处理参数对所述标准图像进行处理以得到多个待处理特征图像包括:
按照所述拉伸系数c1’将所述第一标准图像在第一方向拉伸c1’倍,并按照所述拉伸系数c2’将所述第一标准图像在第二方向拉伸c2’倍以得到第一待处理特征图像;
按照所述拉伸系数d1’将所述第二标准图像在第一方向拉伸d1’倍,并按照所述拉伸系数d2’将所述第二标准图像在第二方向拉伸d2’倍以得到第二待处理特征图像;
对应的,所述多个待处理特征图像中至少包括所述第一待处理特征图像和所述第二待处理特征图像。
8.根据权利要求1-7任意一项所述的方法,其特征在于,所述从所述多个图像特征中确定出目标图像特征包括:
通过所述多通道特征提取模型从所述多个图像特征中提取最大图像特征,并将所述最大图像特征确定为目标图像特征。
9.一种终端设备,其特征在于,所述终端设备包括:
干扰去除单元,用于确定图像干扰信息,并基于所述图像干扰信息去除输入源图像中的干扰信息以得到标准图像;
特征图像获取单元,用于确定所述图像干扰信息对应的多组图像处理参数,并根据各组图像处理参数对所述干扰去除单元得到的标准图像进行处理以得到多个待处理特征图像,其中,一组图像处理参数对应一个待处理特征图像;
特征提取单元,用于通过多通道特征提取模型对所述特征图像获取单元获取的多个待处理特征图像进行特征提取以得到多个图像特征,并从所述多个图像特征中确定出目标图像特征;
分类单元,用于将所述特征提取单元提取的所述目标图像特征输入图像分类器,通过所述图像分类器确定出所述输入源图像中的目标对象。
10.根据权利要求9所述的终端设备,其特征在于,所述图像干扰信息包括图像旋转,所述干扰去除单元用于:
获取输入源图像的主轴方向参量,并根据所述主轴方向参量和基准方向参量确定出所述输入源图像的主轴方向与基准方向之间的第一夹角角度;
按照所述第一夹角角度对所述输入源图像进行旋转,以获取去除所述输入源图像中的旋转干扰信息后的标准图像。
11.根据权利要求10所述的终端设备,其特征在于,所述图像干扰信息对应的多组图像处理参数中至少包括图像处理参数组A和图像处理参数组B,所述图像处理参数组A中至少包括旋转角度α,所述图像处理参数B至少包括旋转角度β;
所述特征图像获取单元用于:
根据所述图像处理参数组A中包括的旋转角度α对所述干扰去除单元得到的所述标准图像进行旋转以得到第一待处理特征图像;
根据所述图像处理参数组B中包括的旋转角度β对所述干扰去除单元获取的所述标准图像进行旋转以得到第二待处理特征图像;
对应的,所述多个待处理特征图像中至少包括所述第一待处理特征图像和所述第二待处理特征图像。
12.根据权利要求9所述的终端设备,其特征在于,所述图像干扰信息包括图像拉伸,所述干扰去除单元用于:
确定输入源图像中目标对象所占据的第一像素区域;
确定所述图像干扰信息对应的多组图像去干扰参数,并根据各组图像去干扰参数对所述第一像素区域进行拉伸处理以得到多个待处理拉伸图像,其中,一组图像去干扰参数对应处理得到一个待处理拉伸图像;
对所述多个待处理拉伸图像中任一待处理拉伸图像i执行如下操作:
根据灰度阈值确定出所述目标对象在所述待处理拉伸图像i中占据的第二像素区域;
从所述待处理拉伸图像i中截取出所述第二像素区域,以得到与所述待处理拉伸图像i相对应的标准图像;
对应的,所述多个待处理拉伸图像对应多个标准图像。
13.根据权利要求12所述的终端设备,其特征在于,所述多组图像去干扰参数至少包括图像去干扰参数组C和图像去干扰参数组D,所述图像去干扰参数组C至少包括拉伸系数c1和拉伸系数c2,所述图像去干扰参数组D至少包括拉伸系数d1和拉伸系数d2;
所述干扰去除单元用于:
按照所述拉伸系数c1将所述第一像素区域在第一方向拉伸c1倍,并按照所述拉伸系数c2将所述第一像素区域在第二方向拉伸c2倍以得到第一待处理拉伸图像;
按照所述拉伸系数d1将所述第二像素区域在第一方向拉伸d1倍,并按照所述拉伸系数d2将所述第二像素区域在第二方向拉伸d2倍以得到第二待处理拉伸图像;
对应的,所述多个待处理拉伸图像至少包括所述第一待处理拉伸图像和所述第二待处理拉伸图像。
14.根据权利要求13所述的终端设备,其特征在于,所述特征图像获取单元用于:
根据所述多组去干扰参数确定出所述图像干扰信息对应的多组图像处理参数,其中,一组去干扰参数对应一组图像处理参数,所述多组图像处理参数至少包括所述去干扰参数组C对应的图像处理参数组C’和所述去干扰参数组D对应的图像处理参数组D’。
15.根据权利要求14所述的终端设备,其特征在于,所述干扰去除单元得到的多个标准图像中至少包括根据所述去干扰参数组C处理得到的第一标准图像和所述去干扰参数组D处理得到的第二标准图像,所述图像处理参数组C’中至少包括拉伸系数c1’和拉伸系数c2’,所述图像处理参数组D’中至少包括拉伸系数d1’和拉伸系数d2’
所述特征图像获取单元用于:
按照所述拉伸系数c1’将所述第一标准图像在第一方向拉伸c1’倍,并按照所述拉伸系数c2’将所述第一像素区域在第二方向拉伸c2’倍以得到第一待处理特征图像;
按照所述拉伸系数d1’将所述第二标准图像在第一方向拉伸d1’倍,并按照所述拉伸系数d2’将所述第二标准图像在第二方向拉伸d2’倍以得到第二待处理特征图像;
对应的,所述多个待处理特征图像中至少包括所述第一待处理特征图像和所述第二待处理特征图像。
16.根据权利要求9-15任意一项所述的终端设备,其特征在于,所述特征提取单元用于:
通过所述多通道特征提取模型从所述多个图像特征中提取最大图像特征,并将所述最大图像特征确定为目标图像特征。
17.一种计算机可读存储介质,其特征在于,包括指令,所述指令在计算机上运行时,使得计算机执行如权利要求1-8任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810271036.1A CN110321908A (zh) | 2018-03-29 | 2018-03-29 | 图像识别方法、终端设备及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810271036.1A CN110321908A (zh) | 2018-03-29 | 2018-03-29 | 图像识别方法、终端设备及计算机可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110321908A true CN110321908A (zh) | 2019-10-11 |
Family
ID=68110804
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810271036.1A Pending CN110321908A (zh) | 2018-03-29 | 2018-03-29 | 图像识别方法、终端设备及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110321908A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111568199A (zh) * | 2020-02-28 | 2020-08-25 | 佛山市云米电器科技有限公司 | 接水容器的识别方法、系统及存储介质 |
CN112819007A (zh) * | 2021-01-07 | 2021-05-18 | 北京百度网讯科技有限公司 | 图像识别方法、装置、电子设备及存储介质 |
CN112893159A (zh) * | 2021-01-14 | 2021-06-04 | 陕西陕煤曹家滩矿业有限公司 | 一种基于图像识别的煤矸石分拣方法 |
CN116309193A (zh) * | 2023-05-23 | 2023-06-23 | 武汉大学人民医院(湖北省人民医院) | 一种免疫样本的图像处理方法及装置 |
CN116433664A (zh) * | 2023-06-13 | 2023-07-14 | 成都数之联科技股份有限公司 | 面板缺陷检测方法、装置、存储介质、设备及程序产品 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000123186A (ja) * | 1998-10-14 | 2000-04-28 | Canon Inc | 被写体認識装置 |
CA2307439A1 (en) * | 2000-05-02 | 2001-11-02 | Institut National D'optique | Method and apparatus for evaluating a scale factor and a rotation angle in image processing |
US20090015875A1 (en) * | 2007-06-20 | 2009-01-15 | Ctb/Mcgraw-Hill Companies, Inc. | Image manipulation of digitized images of documents |
US20120051652A1 (en) * | 2010-08-31 | 2012-03-01 | Samsung Electronics Co., Ltd. | Object recognition system and method |
CN105740872A (zh) * | 2016-01-29 | 2016-07-06 | 徐庆 | 图像特征提取方法及其装置 |
WO2017036921A1 (en) * | 2015-09-02 | 2017-03-09 | Ventana Medical Systems, Inc. | Image processing systems and methods for displaying multiple images of a biological specimen |
WO2017206392A1 (zh) * | 2016-06-01 | 2017-12-07 | 中兴通讯股份有限公司 | 图像校正方法、装置及投影仪 |
-
2018
- 2018-03-29 CN CN201810271036.1A patent/CN110321908A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000123186A (ja) * | 1998-10-14 | 2000-04-28 | Canon Inc | 被写体認識装置 |
CA2307439A1 (en) * | 2000-05-02 | 2001-11-02 | Institut National D'optique | Method and apparatus for evaluating a scale factor and a rotation angle in image processing |
US20090015875A1 (en) * | 2007-06-20 | 2009-01-15 | Ctb/Mcgraw-Hill Companies, Inc. | Image manipulation of digitized images of documents |
US20120051652A1 (en) * | 2010-08-31 | 2012-03-01 | Samsung Electronics Co., Ltd. | Object recognition system and method |
WO2017036921A1 (en) * | 2015-09-02 | 2017-03-09 | Ventana Medical Systems, Inc. | Image processing systems and methods for displaying multiple images of a biological specimen |
CN105740872A (zh) * | 2016-01-29 | 2016-07-06 | 徐庆 | 图像特征提取方法及其装置 |
WO2017206392A1 (zh) * | 2016-06-01 | 2017-12-07 | 中兴通讯股份有限公司 | 图像校正方法、装置及投影仪 |
Non-Patent Citations (1)
Title |
---|
朱慧玲等: "二代身份证快速图像识别关键技术研究", 《科技资讯》 * |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111568199A (zh) * | 2020-02-28 | 2020-08-25 | 佛山市云米电器科技有限公司 | 接水容器的识别方法、系统及存储介质 |
CN111568199B (zh) * | 2020-02-28 | 2023-11-07 | 佛山市云米电器科技有限公司 | 接水容器的识别方法、系统及存储介质 |
CN112819007A (zh) * | 2021-01-07 | 2021-05-18 | 北京百度网讯科技有限公司 | 图像识别方法、装置、电子设备及存储介质 |
CN112819007B (zh) * | 2021-01-07 | 2023-08-01 | 北京百度网讯科技有限公司 | 图像识别方法、装置、电子设备及存储介质 |
CN112893159A (zh) * | 2021-01-14 | 2021-06-04 | 陕西陕煤曹家滩矿业有限公司 | 一种基于图像识别的煤矸石分拣方法 |
CN112893159B (zh) * | 2021-01-14 | 2023-01-06 | 陕西陕煤曹家滩矿业有限公司 | 一种基于图像识别的煤矸石分拣方法 |
CN116309193A (zh) * | 2023-05-23 | 2023-06-23 | 武汉大学人民医院(湖北省人民医院) | 一种免疫样本的图像处理方法及装置 |
CN116309193B (zh) * | 2023-05-23 | 2023-08-25 | 武汉大学人民医院(湖北省人民医院) | 一种免疫样本的图像处理方法及装置 |
CN116433664A (zh) * | 2023-06-13 | 2023-07-14 | 成都数之联科技股份有限公司 | 面板缺陷检测方法、装置、存储介质、设备及程序产品 |
CN116433664B (zh) * | 2023-06-13 | 2023-09-01 | 成都数之联科技股份有限公司 | 面板缺陷检测方法、装置、存储介质、设备及程序产品 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110321908A (zh) | 图像识别方法、终端设备及计算机可读存储介质 | |
CN109558794B (zh) | 基于摩尔纹的图像识别方法、装置、设备和存储介质 | |
CN109522874B (zh) | 人体动作识别方法、装置、终端设备及存储介质 | |
CN107330364B (zh) | 一种基于cGAN网络的人群计数方法及系统 | |
CN108717524B (zh) | 一种基于双摄手机和人工智能系统的手势识别系统 | |
US9117105B2 (en) | 3D face recognition method based on intermediate frequency information in geometric image | |
CN103116763B (zh) | 一种基于hsv颜色空间统计特征的活体人脸检测方法 | |
CN105917353B (zh) | 用于生物认证的特征提取及匹配以及模板更新 | |
CN111091075B (zh) | 人脸识别方法、装置、电子设备及存储介质 | |
CN107679531A (zh) | 基于深度学习的车牌识别方法、装置、设备及存储介质 | |
CN112287940A (zh) | 一种基于深度学习的注意力机制的语义分割的方法 | |
CN109214273A (zh) | 人脸图像比对方法、装置、计算机设备及存储介质 | |
CN109635627A (zh) | 图片信息提取方法、装置、计算机设备及存储介质 | |
CN111507994A (zh) | 一种人像提取方法、人像提取装置及移动终端 | |
WO2019080203A1 (zh) | 一种机器人的手势识别方法、系统及机器人 | |
CN106709450A (zh) | 一种指纹图像识别方法及系统 | |
CN110070101A (zh) | 植物种类的识别方法及装置、存储介质、计算机设备 | |
CN109598234A (zh) | 关键点检测方法和装置 | |
CN110163111A (zh) | 基于人脸识别的叫号方法、装置、电子设备及存储介质 | |
CN110334605A (zh) | 基于神经网络的手势识别方法、装置、存储介质及设备 | |
WO2021147437A1 (zh) | 证卡边缘检测方法、设备及存储介质 | |
CN107704797B (zh) | 基于安防视频中行人和车辆的实时检测方法和系统及设备 | |
CN112132812B (zh) | 证件校验方法、装置、电子设备及介质 | |
CN109977832A (zh) | 一种图像处理方法、装置及存储介质 | |
CN108256520B (zh) | 一种识别硬币年份的方法、终端设备及计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20191011 |
|
WD01 | Invention patent application deemed withdrawn after publication |