CN103729649B - 一种图像旋转角度检测方法和装置 - Google Patents
一种图像旋转角度检测方法和装置 Download PDFInfo
- Publication number
- CN103729649B CN103729649B CN201410015078.0A CN201410015078A CN103729649B CN 103729649 B CN103729649 B CN 103729649B CN 201410015078 A CN201410015078 A CN 201410015078A CN 103729649 B CN103729649 B CN 103729649B
- Authority
- CN
- China
- Prior art keywords
- rotation
- image
- anglec
- angle
- confidence level
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
本发明公开了一种图像旋转角度检测方法,该方法包括:通过对样本图像的颜色特征和纹理特征的提取,训练多个预设旋转角度的分类器;提取需要检测旋转角度的图像的颜色特征和纹理特征,并分别输入训练完成的各分类器,根据各分类器输出的判别结果,确定需要检测旋转角度的图像的旋转角度。基于同样的发明构思,本发明还提出一种装置,能够检测出各种不同场景下的图像的旋转角度。
Description
技术领域
本发明涉及图像处理技术领域,特别涉及一种图像旋转角度检测方法和装置。
背景技术
现有的图像旋转方法,主要面对的是特定的图像,如待扫描复印的文字图像,待拍摄的人脸或人体图像等。根据这些特定的对象,设计特定的旋转角度检测算法,并根据所得结果对图像进行校正。所处理的旋转角度也多以大角度为主,如90,180,270等。
现有的图像旋转角度的检测方法存在以下缺点:
只针对特定图像,对于普通自然图像不具备普遍性。针对文本图像的旋转角度检测技术较为成熟,这是因为文本自身有比较明显的朝向属性,可以根据其实际朝向来精确判断图像的旋转角度;针对人脸图像的旋转角度技术也可以取得较高的识别精度,这是因为人脸的姿势特征也较为明显。但对于普通自然图像而言,大多数并没有明确的整体朝向特征,同样也缺乏明确的有朝向属性的前景物体,这样要确定它们的旋转角度,就显得更加困难。
待检测的旋转角度较少。由于检测的目标图像很多是拍摄时经过旋转的,其旋转角度一般为90度,270度等,故已有的很多旋转角度检测方法都是针对这几个常见角度的。对于普通的连续的旋转角度,由于其判别难度较大,因此,目前还未提出对任意旋转角度都能检测的方法。
发明内容
有鉴于此,本发明提供一种图像旋转角度检测方法和装置,能够检测出各种不同场景下的图像的旋转角度。
为解决上述技术问题,本发明的技术方案是这样实现的:
一种图像旋转角度检测方法,所述方法包括:
将样本图像中的各图像分别旋转n个预设旋转角度,组成样本图像库;对于所述样本图像库中的每个图像,提取该图像的颜色特征和纹理特征构成该图像的特征向量,将样本图像库中所有图像的特征向量组成特征样本库;并在该特征样本库上训练n个预设旋转角度对应的两类的分类器;其中,n为大于2的整数;
获取需要检测旋转角度的图像时,提取该图像的颜色特征和纹理特征构成该图像的特征向量,并分别输入所述各分类器内,获得各分类器的判别结果;
如果确定所述判别结果中出现两个以上置信度,且各置信度之间的差值均大于第一阈值,则选择输出的置信度最大的判别结果对应的预设旋转角度作为该图像的旋转角度;
如果确定所述各判别结果中的置信度均相同;或者确定各判别结果中出现两个以上置信度,且各置信度之间的差值均小于第二阈值,或各置信度均低于第三阈值,则确定不能检测出该图像的旋转角度。
一种装置,该装置包括:提取单元、训练单元和处理单元;
所述提取单元,用于将样本图像中的各图像分别旋转n个预设旋转角度,组成样本图像库;对于所述样本图像库中的每个图像,提取该图像的颜色特征和纹理特征构成该图像的特征向量,将样本图像库中所有图像的特征向量组成特征样本库;获取需要检测旋转角度的图像时,提取该图像的颜色特征和纹理特征构成该图像的特征向量;
所述训练单元,用于在所述提取单元中的特征样本库上训练n个预设旋转角度对应的两类的分类器;其中,n为大于2的整数;将所述提取单元提取的需要检测旋转角度的图像的特征向量分别输入所述各分类器内,并获得各分类器的判别结果;
所述处理单元,用于如果确定所述训练单元中获得的判别结果中出现两个以上置信度,且各置信度之间的差值均大于第一阈值,则选择输出的置信度最大的判别结果对应的预设旋转角度作为该图像的旋转角度;如果确定所述各判别结果中的置信度均相同;或者确定各判别结果中出现两个以上置信度,且各置信度之间的差值均小于第二阈值,或各置信度均低于第三阈值,则确定不能检测出该图像的旋转角度。
综上所述,本发明通过对样本图像的颜色特征和纹理特征的提取,训练多个预设旋转角度的分类器;提取需要检测旋转角度的图像的颜色特征和纹理特征,并分别输入训练完成的各分类器,根据各分类器输出的判别结果,确定需要检测旋转角度的图像的旋转角度,能够检测出各种不同场景下的图像的旋转角度。
附图说明
图1为本发明具体实施例中图像旋转角度检测方法流程示意图;
图2为本发明具体实施例中通过角度微调检测图像旋转角度的方法流程示意图;
图3为本发明具体实施例中应用于上述技术的装置的结构示意图。
具体实施方式
为使本发明的目的、技术方案及优点更加清楚明白,以下参照附图并举实施例,对本发明所述方案作进一步地详细说明。
本发明实施例中提出一种图像旋转角度检测方法,通过对样本图像的颜色特征和纹理特征的提取,训练多个预设旋转角度的分类器;提取需要检测旋转角度的图像的颜色特征和纹理特征,并分别输入训练完成的各分类器,根据各分类器输出的判别结果,确定需要检测旋转角度的图像的旋转角度,能够检测出各种不同场景下的图像的旋转角度。
本发明具体实施例中所提及的旋转角度均为沿着顺时针方向的旋转角度。
用于进行图像旋转角度检测的设备称为检测设备,检测设备会收集和整理大量自然样本图像,这些自然样本图像缺乏明确朝向属性,当然也可以包含具有朝向属性的样本图像。
收集的大量样本图像如果大小不一致,可以通过缩放将所有样本图像统一成相同大小。
检测设备将样本图像中的各图像分别旋转n个预设旋转角度,组成样本图像库。
n可以为8、12等,根据实际需要设置。
检测设备对于样本图像库中的每个图像,提取该图像的颜色特征和纹理特征,将样本图像库中所有图像的颜色特征和纹理特征作为特征样本库;并在该特征样本库上训练n个预设旋转角度对应的两类的分类器。
下面详细描述颜色特征和纹理特征的提取,以及分类器的训练。
检测设备对样本图像库中的每个图像进行分块操作,根据图像的实际大小,从该图像的边缘开始将该图像分为像素p×p的小块图像,对于图像正中的1/m×1/m图像丢弃;其中p、m为大于0的整数。
其中,p为预设像素值,如可以配置为32,对于图像正中的1/m2的图像忽略不计,如图像正中的1/4的图像直接舍弃。在具体实现时,假设按32×32的像素从边缘分割该图像为小块图像,可能到配置舍弃的图像之外的图像的像素不够一小块图像时,则将不够一块图像的图像也忽略。
提取图像的颜色特征,具体如下:
各图像分为多个小块图像之后,在图像的色调饱和度亮度(HSV)颜色空间下,分别计算每个小块图像的色调(Hue)、饱和度(Saturation)和亮度(Value)三个分量的均值、方差和偏度,将所有小块图像的三个分量的均值、方差和偏度构成该图像的颜色特征。
每个小块图像的三个分量的均值、方差和偏度,即该小块图像的一阶、二阶和三阶HSV空间颜色矩阵特征。三种矩阵特征的计算公式如下:
其中hij为第i个颜色分量中第j个像素点的值,n一个小块图像中像素点的个数。
对于一个小块图像的颜色矩为[μ1,μ2,μ3,σ1,σ2,σ3,s1,s2,s3]。
该图像被划分的各小块图像的颜色矩构成该图像的颜色特征。将各小块图像的颜色矩依次排列即可。
检测设备提取图像的纹理特征,具体步骤如下:
第一步,对于每个小块图像,检测设备获得该小块图像的灰度图,并将灰度值量化为第一预设值级。
第一预设值可以根据实际应用配置,如8等。
第二步,检测设备根据配置的预设窗口范围计算该小块图像的四个方向的灰度共生矩阵。
以计算每个小块图像的4个方向(0°,45°,90°,135°)的灰度共生矩阵为例。计算公式具体如下:
m(d,θ)(i,j)=card{[(x1,y1),(x2,y2)]∈S|f(x1,y1)=i&f(x2,y2)=j}
其中m(d,θ)(i,j)表示像素点i到像素点j在θ方向上的距离d;f(x,y)表示预设窗口范围内图像,S为具有特定空间联系的像素对的集合,即在同一预设窗口范围内的像素对,d表示两个像素点的距离,θ表示方向角度,即上面的0°,45°,90°,135°,card(S)表示集合S中对m(d,θ)(i,j)有贡献的元素个数,f(x1,y1)=i,表示像素点i的坐标为x1和y1。
第三步,检测设备分别计算四个灰度共生矩阵的7个统计量特征,获取计算的各统计量特征的平均值,并进行归一化计算。
7个统计量为相关性、对比度、熵、逆差矩、能量、和平均、和熵。
第四步,检测设备将进行归一化计算后的各统计量特征取四个方向的均值,获得基于灰度共生矩阵的纹理特征。
该图像的各个小块图像的基于灰度共生矩阵的纹理特征构成该图像的纹理特征。
将该图像的颜色特征和纹理特征即构成了该图像的特征向量。
样本图像库中所有图像的特征向量组成特征样本库;并在该特征样本库上训练n个预设旋转角度对应的两类的分类器。具体训练过程如下:
对于每个两类的分类器的训练,在该特征样本库中随机选择该分类器对应的预设旋转角度的X个图像的特征向量作为一类样本,并从这X个图像对应的其他预设旋转角度样本图像中选取Y个图像的特征向量作为另一类样本,进行训练获得一个两类的分类器,其中X不大于Y。
几个预设旋转角度,对应训练几个分类器。在具体实现时可以使用基于径向基核函数的支持向量机分类器来对图像的特征矢量进行训练学习。
如果n为8时,分别对应0,45,90,135,180,225,270,315度;n为12时,分别对应0,30,60,90,120,150,180,210,240,270,300,330度。
在样本图库中各图像的旋转角度也由n确定,每个旋转角度对应一个分类器。
以对0度分类器的训练为例,在特征样本库中随机选取0度N个图像的特征向量作为一类样本,从这N个0度图像对应的其他角度的图像的特征向量中,随机选择N到3N个特征向量作为另一类样本。进行训练得到一个0度的两类的分类器。
对于其他角度的分类器训练方法类似,这里不再一一描述。所有分类器训练完毕后,得到一个多角度的分类器组,用于检测图像的旋转角度。
下面结合附图,详细描述本发明具体实施例中如何实现图像旋转角度检测的。
参见图1,图1为本发明具体实施例中图像旋转角度检测方法流程示意图。具体步骤为:
步骤101,检测设备获取需要检测旋转角度的图像时,提取该图像的颜色特征和纹理特征构成该图像特征向量,并分别输入所述n个预设旋转角度对应的分类器内,获得各分类器的判别结果。
本步骤中需要检测旋转角度的图像需先确定同组成样本图库中的图像的大小是否一样,如果是,直接采用上文的分块方法进行分块,否则,先将该图像缩放到与样本图像库中的图像一样大小,在进行分块处理。
在提取该图像的颜色特征和纹理特征时,提取方法也同对样本图像库中图像的颜色特征和纹理特征,这里不再详细描述。
每个分类器都会输出一个判别结果,该判别结果包括旋转角度和置信度。即该图像为这个旋转角度的置信度。
步骤102,检测设备如果确定各判别结果中的置信度均相同;或者确定各判别结果中出现两个以上置信度,且各置信度之间的差值均小于第二阈值,或各置信度均低于第三阈值,则确定不能检测出该图像的旋转角度,结束本流程。
如果n个判别结果中的置信度都相同,则确定不能检测出该图像的旋转角度。
如果n个判别结果中的置信度为两个以上,且各置信度之间的差值都小于第二阈值,即各置信度比较接近,此时,也确定不能检测出该图像的旋转角度。
如果n个判别结果中置信度为两个以上,且各置信度均低于第三阈值,此时,也确定不能检测出该图像的旋转角度。
对于上述三种情况的处理,可以避免对一些本身朝向就不明显的图像出现错误判断,如一张足球图片。
步骤103,检测设备如果确定判别结果中出现两个以上置信度,且各置信度之间的差值均大于第一阈值,则选择输出的置信度最大的判别结果对应的旋转角度作为该图像的旋转角度。
步骤103中可以初步确定该图像的旋转角度。当训练的分类器越多,即样本旋转角度越多,则确定出的图像的旋转角度越精确。
本发明具体实施例中还给出了一种进行角度微调获得更精确的旋转角度的实现方法。
参见图2,图2为本发明具体实施例中通过角度微调检测图像旋转角度的方法流程示意图。具体步骤为:
步骤201,检测设备根据确定的该图像的初始旋转角度,以及与该初始旋转角度相邻的两个旋转角度对应的置信度的正负,将配置的预设角度调整值进行缩小,并确定调整范围区间。
本步骤中具体处理包括:将步骤103中确定的该图像的旋转角度作为初始旋转角度。
当与该初始旋转角度相邻的两个预设旋转角度对应的置信度均为正时,将预设角度调整值缩小为第一角度调整值;并根据该第一角度调整值和初始旋转角度确定调整范围区间。
当与该初始旋转角度相邻的两个预设旋转角度对应的置信度均为负时,将预设角度调整值缩小为第二角度调整值,并根据第二角度调整值和初始旋转角度确定调整范围区间。
当与初始旋转角度相邻的两个预设旋转角度对应的置信度为一正一负时,将预设角度调整值缩小为第三角度调整值,并根据置信度为正的相邻的预设旋转角度对应的置信度,以及第三角度调整值和初始旋转角度确定调整范围区间。
其中,第二角度调整值小于第一角度调整值。
步骤202,该检测设备确定缩小后的角度调整值是否小于第四阈值,如果是,执行步骤203;否则,执行步骤204。
步骤203,该检测设备选择当前获得最大置信度对应的角度作为该图像的最终旋转角度,结束本流程。
步骤204,该检测设备在确定的调整范围区间内随机选择一个角度并顺时针旋转,选择的角度与上一次确定的最大置信度对应的角度的差。
步骤205,该检测设备对旋转后的图像进行裁剪和放大,提取放大后的图像的颜色特征和纹理特征构成该图像的特征向量,并输入初始旋转角度对应的分类器内,获得判别结果。
该检测设备将图像进行裁剪后,图像要小于原始图像,因此,为了使图像与原始图像相同大小,且不引进新的像素点,则应该对裁剪后的图像进行放大,使放大后的图像像素均为原图像的像素。
提取图像的颜色特征和纹理特征也是先将图像分块,再分别进行特征提取,处理方式同上文描述,这里不再详细描述。
步骤206,该检测设备根据该次判别结果的置信度的正负,以及置信度的值,将当前角度调整值再次缩小,并确定角度调整值再次缩小后的调整范围区间,执行步骤202。
本步骤具体处理包括:
当该次判别结果中的置信度为正,且该置信度大于上次该分类器输出的置信度时,将角度调整值缩小为第四角度调整值,并根据随机选择的角度与第四角度调整值确定调整范围区间。
当该次判别结果中的置信度为正,且该置信度不大于上次该分类器输出的置信度时,将角度调整值缩小为第五角度调整值,并根据初始旋转角度值与第五角度调整值确定调整范围区间。
当该次判别结果中的置信度为负时,将角度调整值缩小为第六角度调整值,并根据初始旋转角度值与第六角度调整值确定调整范围区间。
其中,第五角度调整值小于第四角度调整值。
下面举具体例子,详细说明本发明具体实施例中如何进行角度微调确定图像旋转角度的。具体步骤如下:
步骤1:确定初步调整范围
需要根据上一步的检测结果来确定角度微调的范围。
配置的预设角度调整值为θ,θ初始值根据分类器的个数确定,如8个分类器,初始值配置为22.5度;如12个分类器,初始值配置为15度。
如在步骤103中的检测结果中,邻域的两个分类器输出的判别结果中的置信度也均为正,则将角度调整值大小缩小一半θ=θ/2,并将调整范围区间定为转至步骤2。
如在步骤103的检测结果中,邻域的两个分类器输出的判别结果中的置信度均为负,则将调整范围大小缩小至三分之一θ=θ/3,并将调整范围区间定为转至步骤2。
如在上一步的检测结果中,邻域的某一个分类器输出的判别结果中的置信度为负,另一个分类器输出的判别结果中的置信度为正,且为则将调整范围大小缩小至并将调整范围区间定为或转至步骤2。
步骤2:旋转微调角度。
如角度调整值大小θ小于某一阈值(如3度),则以当前最大置信度的判别结果对应的角度作为该图像的最终旋转角度,结束本流程。
否则,在当前的调整范围区间内,随机取一个角度值φ,并将待测图像顺时针旋转度。
对旋转后的图像进行裁剪,使其图像像素均为原图像像素。
将裁剪后的图像提取颜色特征和纹理特征,并输入角度的分类器进行识别。
步骤3:更新调整范围。
如果步骤2识别结果中的置信度为正,且其置信度大于上次置信度,则将调整范围大小缩小至并将调整范围区间定为(φ-θ,φ+θ),转至步骤2。
如果步骤2识别结果中的置信度为正,且其置信度小于上次置信度,则将调整范围大小缩小至并将调整范围区间定为或转至步骤2。
如设别结果中的置信度为负,则将调整范围大小缩小至并将调整范围区间定为转至步骤2。
本实施例中角度调整值缩小的比例,均为列举值,具体实现时,根据实际需要配置,并不限于本实施例中所给出的值。
基于同样的发明构思,本发明具体实施例中还提出一种装置。参见图3,图3为本发明具体实施例中应用于上述技术的装置的结构示意图。该装置包括:提取单元301、训练单元302和处理单元303。
提取单元301,用于将样本图像中的各图像分别旋转n个预设旋转角度,组成样本图像库;对于所述样本图像库中的每个图像,提取该图像的颜色特征和纹理特征构成该图像的特征向量,将样本图像库中所有图像的特征向量组成特征样本库;获取需要检测旋转角度的图像时,提取该图像的颜色特征和纹理特征构成该图像的特征向量;
训练单元302,用于在提取单元301中的特征样本库上训练n个预设旋转角度对应的两类的分类器;其中,n为大于2的整数;将提取单元301提取的需要检测旋转角度的图像的特征向量分别输入所述各分类器内,并获得各分类器的判别结果;
处理单元303,用于如果确定训练单元302中获得的判别结果中出现两个以上置信度,且各置信度之间的差值均大于第一阈值,则选择输出的置信度最大的判别结果对应的预设旋转角度作为该图像的旋转角度;如果确定所述各判别结果中的置信度均相同;或者确定各判别结果中出现两个以上置信度,且各置信度之间的差值均小于第二阈值,或各置信度均低于第三阈值,则确定不能检测出该图像的旋转角度。
较佳地,
提取单元301,具体用于提取该图像的颜色特征时,根据该图像的实际大小,从该图像的边缘开始将该图像分为像素p×p的小块图像,对于图像正中的1/m×1/m图像丢弃;其中p、m为大于0的整数;在图像的色调饱和度亮度HSV颜色空间下,分别计算每个小块图像的色调、饱和度和亮度三个分量的均值、方差和偏度,将该图像的所有小块图像的三个分量的均值、方差和偏度构成该图像的颜色特征。
较佳地,
提取单元301,具体用于提取该图像的纹理特征时,对于每个小块图像,计算获得该小块图像的灰度图,并将灰度值量化为第一预设值级;根据配置的预设窗口范围计算该小块图像的四个方向的灰度共生矩阵;分别计算四个灰度共生矩阵的7个统计量特征,获取计算的各统计量特征的平均值,并进行归一化计算;将进行归一化计算后的各统计量特征取四个方向的均值,获得基于灰度共生矩阵的纹理特征;该图像的各个小块图像的基于灰度共生矩阵的纹理特征构成该图像的纹理特征。
较佳地,
训练单元302,具体用于在该特征样本库上训练n个预设旋转角度对应的两类的分类器时,对于每个两类的分类器的训练,在该特征样本库中随机选择该分类器对应的预设旋转角度的X个图像的特征向量作为一类样本,并从这X个图像对应的其他预设旋转角度样本图像中选取Y个图像的特征向量作为另一类样本,进行训练获得一个两类的分类器,其中X不大于Y,且X、Y为大于1的整数。
较佳地,
处理单元303,进一步用于根据图像的初始旋转角度,以及与该初始旋转角度相邻的两个旋转角度对应的置信度的正负,将配置的预设角度调整值进行缩小,并确定调整范围区间;其中,所述初始旋转角度为所述选择输出的置信度最大的判别结果对应的预设旋转角度;确定缩小后的角度调整值是否小于第四阈值,如果是,选择当前获得最大置信度对应的角度作为该图像的最终旋转角度,结束本流程否则,在确定的调整范围区间内随机选择一个角度并顺时针旋转,选择的角度与上一次确定的最大置信度对应的角度的差;对旋转后的图像进行裁剪和放大,提取放大后的图像的颜色特征和纹理特征,并输入初始旋转角度对应的分类器内,获得判别结果;根据该次判别结果的置信度的正负,以及置信度的值,将当前角度调整值再次缩小,并确定角度调整值再次缩小后的调整范围区间,执行所述确定缩小后的角度调整值是否小于第四阈值操作及后续操作。
较佳地,
处理单元303,具体用于根据图像的初始旋转角度,以及与该初始旋转角度相邻的两个旋转角度对应的置信度的正负,将配置的预设角度调整值进行缩小,并确定调整范围区间时,当确定与该初始旋转角度相邻的两个预设旋转角度对应的置信度均为正时,将预设角度调整值缩小为第一角度调整值;并根据该第一角度调整值和初始旋转角度确定调整范围区间;当确定与该初始旋转角度相邻的两个预设旋转角度对应的置信度均为负时,将预设角度调整值缩小为第二角度调整值,并根据该第二角度调整值和初始旋转角度确定调整范围区间;当确定与初始旋转角度相邻的两个预设旋转角度对应的置信度为一正一负时,将预设角度调整值缩小为第三角度调整值,并根据置信度为正的相邻的预设旋转角度对应的置信度,以及所述第三角度调整值和初始旋转角度确定调整范围区间。
较佳地,
处理单元303,具体用于根据该次判别结果的置信度的正负,以及置信度的值,将当前角度调整值再次缩小,并确定角度调整值再次缩小后的调整范围区间时,当确定该次判别结果中的置信度为正,且该置信度大于上次该分类器输出的置信度时,将角度调整值缩小为第四角度调整值,并根据随机选择的角度与第四角度调整值确定调整范围区间;当确定该次判别结果中的置信度为正,且该置信度不大于上次该分类器输出的置信度时,将角度调整值缩小为第五角度调整值,并根据初始旋转角度值与第五角度调整值确定调整范围区间;当确定该次判别结果中的置信度为负时,将角度调整值缩小为第六角度调整值,并根据初始旋转角度值与第六角度调整值确定调整范围区间。
上述实施例的单元可以集成于一体,也可以分离部署;可以合并为一个单元,也可以进一步拆分成多个子单元。
综上所述,本发明通过对样本图像的颜色特征和纹理特征的提取,训练多个预设旋转角度的分类器;提取需要检测旋转角度的图像的颜色特征和纹理特征,并分别输入训练完成的各分类器,根据各分类器输出的判别结果,确定需要检测旋转角度的图像的旋转角度,能够检测出各种不同场景下的图像的旋转角度。
本发明具体实施中,还提出通过角度微调的方式,更准确地检测出图像的旋转角度。
以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (12)
1.一种图像旋转角度检测方法,其特征在于,所述方法包括:
将样本图像中的各样本图像分别旋转n个预设旋转角度,组成样本图像库;对于所述样本图像库中的每个样本图像,提取该样本图像的颜色特征和纹理特征构成该样本图像的特征向量,将样本图像库中所有样本图像的特征向量组成特征样本库;并在该特征样本库上训练n个预设旋转角度对应的两类的分类器;其中,n为大于2的整数;
获取需要检测旋转角度的图像时,提取该需要检测旋转角度的图像的颜色特征和纹理特征构成该需要检测旋转角度的图像的特征向量,并分别输入所述各分类器内,获得各分类器的判别结果;
如果确定所述判别结果中出现两个以上置信度,且各置信度之间的差值均大于第一阈值,则选择输出的置信度最大的判别结果对应的预设旋转角度作为该需要检测旋转角度的图像的旋转角度;
如果确定所述各判别结果中的置信度均相同;或者确定各判别结果中出现两个以上置信度,且各置信度之间的差值均小于第二阈值,或各置信度均低于第三阈值,则确定不能检测出该需要检测旋转角度的图像的旋转角度;
所述提取该需要检测旋转角度的图像的颜色特征,包括:
根据该需要检测旋转角度的图像的实际大小,从该需要检测旋转角度的图像的边缘开始将该需要检测旋转角度的图像分为像素p×p的小块图像,对于需要检测旋转角度的图像正中的1/m×1/m图像丢弃;其中p、m为大于0的整数;
在需要检测旋转角度的图像的色调饱和度亮度HSV颜色空间下,分别计算每个小块图像的色调、饱和度和亮度三个分量的均值、方差和偏度,将该需要检测旋转角度的图像的所有小块图像的三个分量的均值、方差和偏度构成该需要检测旋转角度的图像的颜色特征。
2.根据权利要求1所述的方法,其特征在于,所述提取该需要检测旋转角度的图像的纹理特征,包括:
对于每个小块图像,计算获得该小块图像的灰度图,并将灰度值量化为第一预设值级;
根据配置的预设窗口范围计算该小块图像的四个方向的灰度共生矩阵;
分别计算四个灰度共生矩阵的7个统计量特征,获取计算的各统计量特征的平均值,并进行归一化计算;
将进行归一化计算后的各统计量特征取四个方向的均值,获得基于灰度共生矩阵的纹理特征;
该需要检测旋转角度的图像的各个小块图像的基于灰度共生矩阵的纹理特征构成该需要检测旋转角度的图像的纹理特征。
3.根据权利要求1所述的方法,其特征在于,所述在该特征样本库上训练n个预设旋转角度对应的两类的分类器,包括:
对于每个两类的分类器的训练,在该特征样本库中随机选择该分类器对应的预设旋转角度的X个样本图像的特征向量作为一类样本,并从这X个样本图像对应的其他预设旋转角度样本图像中选取Y个样本图像的特征向量作为另一类样本,进行训练获得一个两类的分类器,其中X不大于Y,且X、Y为大于1的整数。
4.根据权利要求1-3任意一项所述的方法,其特征在于,所述方法进一步包括:
A、根据需要检测旋转角度的图像的初始旋转角度,以及与该初始旋转角度相邻的两个旋转角度对应的置信度的正负,将配置的预设角度调整值进行缩小,并确定调整范围区间;其中,所述初始旋转角度为所述选择输出的置信度最大的判别结果对应的预设旋转角度;
B、确定缩小后的角度调整值是否小于第四阈值,如果是,执行步骤C;否则,执行步骤D;
C、选择当前获得最大置信度对应的角度作为该需要检测旋转角度的图像的最终旋转角度,结束本流程;
D、在确定的调整范围区间内随机选择一个角度并顺时针旋转,计算选择的角度与上一次确定的最大置信度对应的角度的差值,将该需要检测旋转角度的图像顺时针旋转所述差值对应的角度;
E、对旋转后的需要检测旋转角度的图像进行裁剪和放大,提取放大后的需要检测旋转角度的图像的颜色特征和纹理特征,并输入初始旋转角度对应的分类器内,获得判别结果;
F、根据该次判别结果的置信度的正负,以及置信度的值,将当前角度调整值再次缩小,并确定角度调整值再次缩小后的调整范围区间,执行步骤B。
5.根据权利要求4所述的方法,其特征在于,步骤A包括:
当确定与该初始旋转角度相邻的两个预设旋转角度对应的置信度均为正时,将预设角度调整值缩小为第一角度调整值;并根据该第一角度调整值和初始旋转角度确定调整范围区间;
当确定与该初始旋转角度相邻的两个预设旋转角度对应的置信度均为负时,将预设角度调整值缩小为第二角度调整值,并根据该第二角度调整值和初始旋转角度确定调整范围区间;
当确定与初始旋转角度相邻的两个预设旋转角度对应的置信度为一正一负时,将预设角度调整值缩小为第三角度调整值,并根据置信度为正的相邻的预设旋转角度对应的置信度,以及所述第三角度调整值和初始旋转角度确定调整范围区间。
6.根据权利要求5所述的方法,其特征在于,步骤F包括:
当确定该次判别结果中的置信度为正,且该置信度大于上次该分类器输出的置信度时,将角度调整值缩小为第四角度调整值,并根据随机选择的角度与第四角度调整值确定调整范围区间;
当确定该次判别结果中的置信度为正,且该置信度不大于上次该分类器输出的置信度时,将角度调整值缩小为第五角度调整值,并根据初始旋转角度值与第五角度调整值确定调整范围区间;
当确定该次判别结果中的置信度为负时,将角度调整值缩小为第六角度调整值,并根据初始旋转角度值与第六角度调整值确定调整范围区间。
7.一种图像旋转角度检测装置,其特征在于,该装置包括:提取单元、训练单元和处理单元;
所述提取单元,用于将样本图像中的各样本图像分别旋转n个预设旋转角度,组成样本图像库;对于所述样本图像库中的每个样本图像,提取该样本图像的颜色特征和纹理特征构成该样本图像的特征向量,将样本图像库中所有样本图像的特征向量组成特征样本库;获取需要检测旋转角度的图像时,提取该需要检测旋转角度的图像的颜色特征和纹理特征构成该需要检测旋转角度的图像的特征向量;
所述训练单元,用于在所述提取单元中的特征样本库上训练n个预设旋转角度对应的两类的分类器;其中,n为大于2的整数;将所述提取单元提取的需要检测旋转角度的图像的特征向量分别输入所述各分类器内,并获得各分类器的判别结果;
所述处理单元,用于如果确定所述训练单元中获得的判别结果中出现两个以上置信度,且各置信度之间的差值均大于第一阈值,则选择输出的置信度最大的判别结果对应的预设旋转角度作为该需要检测旋转角度的图像的旋转角度;如果确定所述各判别结果中的置信度均相同;或者确定各判别结果中出现两个以上置信度,且各置信度之间的差值均小于第二阈值,或各置信度均低于第三阈值,则确定不能检测出该需要检测旋转角度的图像的旋转角度;
所述提取单元,具体用于提取该需要检测旋转角度的图像的颜色特征时,根据该需要检测旋转角度的图像的实际大小,从该需要检测旋转角度的图像的边缘开始将该需要检测旋转角度的图像分为像素p×p的小块图像,对于需要检测旋转角度的图像正中的1/m×1/m图像丢弃;其中p、m为大于0的整数;在需要检测旋转角度的图像的色调饱和度亮度HSV颜色空间下,分别计算每个小块图像的色调、饱和度和亮度三个分量的均值、方差和偏度,将该需要检测旋转角度的图像的所有小块图像的三个分量的均值、方差和偏度构成该需要检测旋转角度的图像的颜色特征。
8.根据权利要求7所述的装置,其特征在于,
所述提取单元,具体用于提取该需要检测旋转角度的图像的纹理特征时,对于每个小块图像,计算获得该小块图像的灰度图,并将灰度值量化为第一预设值级;根据配置的预设窗口范围计算该小块图像的四个方向的灰度共生矩阵;分别计算四个灰度共生矩阵的7个统计量特征,获取计算的各统计量特征的平均值,并进行归一化计算;将进行归一化计算后的各统计量特征取四个方向的均值,获得基于灰度共生矩阵的纹理特征;该需要检测旋转角度的图像的各个小块图像的基于灰度共生矩阵的纹理特征构成该需要检测旋转角度的图像的纹理特征。
9.根据权利要求7所述的装置,其特征在于,
所述训练单元,具体用于在该特征样本库上训练n个预设旋转角度对应的两类的分类器时,对于每个两类的分类器的训练,在该特征样本库中随机选择该分类器对应的预设旋转角度的X个样本图像的特征向量作为一类样本,并从这X个样本图像对应的其他预设旋转角度样本图像中选取Y个样本图像的特征向量作为另一类样本,进行训练获得一个两类的分类器,其中X不大于Y,且X、Y为大于1的整数。
10.根据权利要求7-9任意一项所述的装置,其特征在于,
所述处理单元,进一步用于根据需要检测旋转角度的图像的初始旋转角度,以及与该初始旋转角度相邻的两个旋转角度对应的置信度的正负,将配置的预设角度调整值进行缩小,并确定调整范围区间;其中,所述初始旋转角度为所述选择输出的置信度最大的判别结果对应的预设旋转角度;确定缩小后的角度调整值是否小于第四阈值,如果是,选择当前获得最大置信度对应的角度作为该需要检测旋转角度的图像的最终旋转角度,结束本流程,否则,在确定的调整范围区间内随机选择一个角度并顺时针旋转,计算选择的角度与上一次确定的最大置信度对应的角度的差值,将该需要检测旋转角度的图像顺时针旋转所述差值对应的角度;对旋转后的需要检测旋转角度的图像进行裁剪和放大,提取放大后的需要检测旋转角度的图像的颜色特征和纹理特征,并输入初始旋转角度对应的分类器内,获得判别结果;根据该次判别结果的置信度的正负,以及置信度的值,将当前角度调整值再次缩小,并确定角度调整值再次缩小后的调整范围区间,执行所述确定缩小后的角度调整值是否小于第四阈值操作及后续操作。
11.根据权利要求10所述的装置,其特征在于,
所述处理单元,具体用于根据需要检测旋转角度的图像的初始旋转角度,以及与该初始旋转角度相邻的两个旋转角度对应的置信度的正负,将配置的预设角度调整值进行缩小,并确定调整范围区间时,当确定与该初始旋转角度相邻的两个预设旋转角度对应的置信度均为正时,将预设角度调整值缩小为第一角度调整值;并根据该第一角度调整值和初始旋转角度确定调整范围区间;当确定与该初始旋转角度相邻的两个预设旋转角度对应的置信度均为负时,将预设角度调整值缩小为第二角度调整值,并根据该第二角度调整值和初始旋转角度确定调整范围区间;当确定与初始旋转角度相邻的两个预设旋转角度对应的置信度为一正一负时,将预设角度调整值缩小为第三角度调整值,并根据置信度为正的相邻的预设旋转角度对应的置信度,以及所述第三角度调整值和初始旋转角度确定调整范围区间。
12.根据权利要求11所述的装置,其特征在于,
所述处理单元,具体用于根据该次判别结果的置信度的正负,以及置信度的值,将当前角度调整值再次缩小,并确定角度调整值再次缩小后的调整范围区间时,当确定该次判别结果中的置信度为正,且该置信度大于上次该分类器输出的置信度时,将角度调整值缩小为第四角度调整值,并根据随机选择的角度与第四角度调整值确定调整范围区间;当确定该次判别结果中的置信度为正,且该置信度不大于上次该分类器输出的置信度时,将角度调整值缩小为第五角度调整值,并根据初始旋转角度值与第五角度调整值确定调整范围区间;当确定该次判别结果中的置信度为负时,将角度调整值缩小为第六角度调整值,并根据初始旋转角度值与第六角度调整值确定调整范围区间。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410015078.0A CN103729649B (zh) | 2014-01-14 | 2014-01-14 | 一种图像旋转角度检测方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410015078.0A CN103729649B (zh) | 2014-01-14 | 2014-01-14 | 一种图像旋转角度检测方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103729649A CN103729649A (zh) | 2014-04-16 |
CN103729649B true CN103729649B (zh) | 2017-03-01 |
Family
ID=50453713
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410015078.0A Active CN103729649B (zh) | 2014-01-14 | 2014-01-14 | 一种图像旋转角度检测方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103729649B (zh) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104537609A (zh) * | 2014-11-28 | 2015-04-22 | 上海理工大学 | 一种旋转图像校正方法 |
CN105825243A (zh) * | 2015-01-07 | 2016-08-03 | 阿里巴巴集团控股有限公司 | 证件图像检测方法及设备 |
CN106919889B (zh) * | 2015-12-25 | 2021-04-13 | 株式会社日立制作所 | 对视频图像中的人头进行检测的方法和装置 |
CN106874845B (zh) * | 2016-12-30 | 2021-03-26 | 东软集团股份有限公司 | 图像识别的方法和装置 |
CN107180413B (zh) * | 2017-05-05 | 2019-03-15 | 平安科技(深圳)有限公司 | 车损图片角度纠正方法、电子装置及可读存储介质 |
CN109345460B (zh) * | 2018-09-28 | 2020-04-24 | 百度在线网络技术(北京)有限公司 | 用于矫正图像的方法和装置 |
CN111339341A (zh) * | 2018-12-19 | 2020-06-26 | 顺丰科技有限公司 | 模型的训练方法及装置、定位方法及装置、设备 |
CN110223263B (zh) * | 2019-04-23 | 2021-07-13 | 上海上湖信息技术有限公司 | 成像方向检测方法及装置、可读存储介质 |
CN113128306A (zh) * | 2020-01-10 | 2021-07-16 | 北京字节跳动网络技术有限公司 | 垂直文本行识别方法、装置、设备及计算机可读存储介质 |
CN112348060A (zh) * | 2020-10-26 | 2021-02-09 | 上海眼控科技股份有限公司 | 分类向量生成方法、装置、计算机设备和存储介质 |
CN112257711B (zh) * | 2020-10-26 | 2021-04-09 | 哈尔滨市科佳通用机电股份有限公司 | 一种铁路货车地板破损故障检测方法 |
CN112348061A (zh) * | 2020-10-26 | 2021-02-09 | 上海眼控科技股份有限公司 | 分类向量生成方法、装置、计算机设备和存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE10003732A1 (de) * | 2000-01-28 | 2001-08-16 | Bosch Gmbh Robert | Vorrichtung |
CN1482453A (zh) * | 2003-07-11 | 2004-03-17 | 华东理工大学 | 一种基于模块化组合神经网络的机器嗅觉气味识别方法 |
CN101271515A (zh) * | 2007-03-21 | 2008-09-24 | 株式会社理光 | 能识别多角度目标的图像检测装置 |
CN101614775A (zh) * | 2009-07-15 | 2009-12-30 | 河北科技大学 | 基于多源信息融合的变压器状态评估系统及其评估方法 |
CN102799901A (zh) * | 2012-07-10 | 2012-11-28 | 辉路科技(北京)有限公司 | 一种多角度人脸检测方法 |
-
2014
- 2014-01-14 CN CN201410015078.0A patent/CN103729649B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE10003732A1 (de) * | 2000-01-28 | 2001-08-16 | Bosch Gmbh Robert | Vorrichtung |
CN1482453A (zh) * | 2003-07-11 | 2004-03-17 | 华东理工大学 | 一种基于模块化组合神经网络的机器嗅觉气味识别方法 |
CN101271515A (zh) * | 2007-03-21 | 2008-09-24 | 株式会社理光 | 能识别多角度目标的图像检测装置 |
CN101614775A (zh) * | 2009-07-15 | 2009-12-30 | 河北科技大学 | 基于多源信息融合的变压器状态评估系统及其评估方法 |
CN102799901A (zh) * | 2012-07-10 | 2012-11-28 | 辉路科技(北京)有限公司 | 一种多角度人脸检测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN103729649A (zh) | 2014-04-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103729649B (zh) | 一种图像旋转角度检测方法和装置 | |
CN106875373B (zh) | 基于卷积神经网络剪枝算法的手机屏幕mura缺陷检测方法 | |
CN107248159A (zh) | 一种基于双目视觉的金属工件缺陷检测方法 | |
CN105740910A (zh) | 一种车辆物件检测方法及装置 | |
CN107644418B (zh) | 基于卷积神经网络的视盘检测方法及系统 | |
CN108229458A (zh) | 一种基于运动检测和多特征提取的火焰智能识别方法 | |
CN107203990A (zh) | 一种基于模板匹配与图像质量评估的标贴破损检测方法 | |
CN105046206B (zh) | 基于视频中运动先验信息的行人检测方法及装置 | |
CN106529448A (zh) | 利用聚合通道特征进行多视角人脸检测的方法 | |
CN107330453A (zh) | 基于分步识别和融合关键部位检测的色情图像识别方法 | |
CN108960404B (zh) | 一种基于图像的人群计数方法及设备 | |
CN105335725A (zh) | 一种基于特征融合的步态识别身份认证方法 | |
CN103106668B (zh) | 基于颜色直方图来描述图像区域的方法和系统 | |
CN104318266B (zh) | 一种图像智能分析处理预警方法 | |
CN106886216A (zh) | 基于rgbd人脸检测的机器人自动跟踪方法和系统 | |
CN107240112B (zh) | 一种复杂场景下个体x角点提取方法 | |
CN112465752A (zh) | 一种基于改进的Faster R-CNN小目标检测方法 | |
CN110509273A (zh) | 基于视觉深度学习特征的机器人机械手检测及抓取方法 | |
CN107392929A (zh) | 一种基于人眼视觉模型的智能化目标检测及尺寸测量方法 | |
CN105005798B (zh) | 一种基于局部相似结构统计匹配的目标识别方法 | |
CN105930798A (zh) | 基于学习的面向手机应用的舌像快速检测分割方法 | |
CN108073940A (zh) | 一种非结构化环境中的3d目标实例物体检测的方法 | |
CN104050674B (zh) | 一种显著性区域检测方法及装置 | |
CN106504211A (zh) | 基于改进surf特征匹配的低照度成像方法 | |
CN110232306A (zh) | 一种基于图像检测的在座状态系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |