CN108805033B - 基于局部梯度分布的拍摄图像优选方法及装置 - Google Patents

基于局部梯度分布的拍摄图像优选方法及装置 Download PDF

Info

Publication number
CN108805033B
CN108805033B CN201810492704.3A CN201810492704A CN108805033B CN 108805033 B CN108805033 B CN 108805033B CN 201810492704 A CN201810492704 A CN 201810492704A CN 108805033 B CN108805033 B CN 108805033B
Authority
CN
China
Prior art keywords
image
evaluation value
target
candidate
edge information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810492704.3A
Other languages
English (en)
Other versions
CN108805033A (zh
Inventor
史存召
王淼
王春恒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Automation of Chinese Academy of Science
Original Assignee
Institute of Automation of Chinese Academy of Science
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Automation of Chinese Academy of Science filed Critical Institute of Automation of Chinese Academy of Science
Priority to CN201810492704.3A priority Critical patent/CN108805033B/zh
Publication of CN108805033A publication Critical patent/CN108805033A/zh
Application granted granted Critical
Publication of CN108805033B publication Critical patent/CN108805033B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/13Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/136Segmentation; Edge detection involving thresholding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/32Normalisation of the pattern dimensions

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Image Analysis (AREA)

Abstract

本发明属于模式识别领域,具体涉及一种基于局部梯度分布的拍摄图像优选方法及装置,旨在解决如何在获取的多张目标文档的图像中快速准确地选择出最清晰的一张图像的问题。为此目的,本发明提供的优选方法包括:获取目标文档的多张尺寸一致的拍摄图像,并设置多个大小一致的第一候选框;计算每个第一候选框内图像的第一边缘信息强度,根据第一边缘信息强度的降序选取第二候选框;对目标文档的每张拍摄图像,计算每张所述拍摄图像的第一评估值和第二评估值;从第一评估值最高的图像和第二评估值最高的图像中选取满足预设条件的图像,并作为优选拍摄图像。本发明提供的优选方法适用于多种类型的文档图像,对于文档图像识别性能的提高有着重要意义。

Description

基于局部梯度分布的拍摄图像优选方法及装置
技术领域
本发明属于模式识别领域,具体涉及一种基于局部梯度分布的拍摄图像优选方法及装置。
背景技术
随着人工智能的热潮日渐高涨,相关的技术如图像处理、模式识别、计算机视觉等也得到了迅速的发展。图像中的文字能表达高层语义信息,因此对图像中的文字进行自动检测和识别的需求越来越大,文字识别技术能够实现文字信息的高速、自动地输入,节约了大量的人力资源,而文档图像广泛存在于交通、金融、物流、税务、行政管理等各个领域中,文档识别技术具有极大的经济效益和广泛的社会价值。而随着智能终端快速普及,手机相机逐渐成为采集图像的重要方式,使得基于拍照的文档自动识别技术得到快速的发展。然而,拍照图像容易受到复杂背景、不均匀光照、低分辨率、抖动等各种因素的影响,给拍照文档的识别造成了困难,因此,如何获取高质量的文档图像,成为影响识别性能的重要环节,为此,本发明提出了一种基于局部梯度分布的拍摄图像优选方法及装置,能够从获取的多张文档图像中,快速准确地选择出最清晰的一张,用于后期的识别,对于文档图像识别性能的提高有着重要的意义。
发明内容
为了解决现有技术中的上述问题,即为了解决如何在获取的多张目标文档的图像中快速准确地选择出最清晰的一张图像的问题。为此目的,本发明的第一方面,提供了一种基于局部梯度分布的拍摄图像优选方法,包括:
获取目标文档的多张尺寸一致的拍摄图像;
基于所述拍摄图像的尺寸信息,设置多个大小一致的第一候选框;
基于任一所述拍摄图像,利用设定的第一边缘检测阈值,计算每个第一候选框内图像的第一边缘信息强度,根据所述第一边缘信息强度的降序选取设定数量的第一候选框,并定义为第二候选框;
对所述目标文档的每张所述拍摄图像,基于设定的第二边缘检测阈值和第三边缘检测阈值分别计算每个所述第二候选框内图像的第二边缘信息强度和第三边缘信息强度,并通过加权平均的方法得到每张所述拍摄图像的第一评估值和第二评估值,选取第一评估值最高的图像和第二评估值最高的图像;
从所述第一评估值最高的图像和所述第二评估值最高的图像中选取满足预设条件的图像,并作为优选拍摄图像。
进一步地,本发明提供的一个优选技术方案为:
所述方法还包括:
对拍摄图像进行灰度化处理;
将所述灰度处理化后的拍摄图像中目标候选框内的图像尺寸调整至预设的目标尺寸;
利用预设的像素图像检测算法,计算调整至所述目标尺寸的图像的梯度幅值并对所计算的梯度幅值进行归一化处理;
根据所述归一化处理后的梯度幅值和预设的目标阈值,获取所述目标候选框内图像的边缘信息强度;
其中,当所述目标候选框是第一候选框时,所述目标阈值是第一边缘检测阈值且所述边缘信息强度是第一边缘信息强度;当所述目标候选框是第二候选框时,所述目标阈值是第二边缘检测阈值和第三边缘检测阈值且所述边缘信息强度是第二边缘信息强度和第三边缘信息强度。
进一步地,本发明提供的一个优选技术方案为:
“通过加权平均的方法得到每张所述拍摄图像的第一评估值和第二评估值”的步骤包括:
按照下式所示的方法计算所述第一评估值和第二评估值:
Figure BDA0001668327330000031
其中,所述value_1为第一评估值,所述value_2为第二评估值,所述q为第二候选框的编号且q=1~n,所述value1q为第二边缘信息强度且
Figure BDA0001668327330000032
所述value2q为第三边缘信息强度且
Figure BDA0001668327330000033
所述s1是第二边缘检测阈值,所述s2是第三边缘检测阈值,s1≠s2,所述Wp为预设的加权系数;
所述加权系数Wp的计算公式为:
Figure BDA0001668327330000034
Figure BDA0001668327330000035
Figure BDA0001668327330000036
其中,所述p为第一候选框的编号,所述valuep为第p个第一候选框内图像的第一边缘信息强度,所述s3是第一边缘检测阈值,s3≥0,所述
Figure BDA0001668327330000038
为第一候选框内图像的梯度幅值为k的个数。
进一步地,本发明提供的一个优选技术方案为:
所述像素图像检测算法是基于Sobel算子或Roberts算子或Prewitt算子的像素图像检测算法。
进一步地,本发明提供的一个优选技术方案为:
“从所述第一评估值最高的图像和所述第二评估值最高的图像中选取满足预设条件的图像,并作为优选拍摄图像”的步骤包括:
根据设定的阈值T1和阈值T2,并利用下式从所述第一评估值最高的图像和所述第二评估值最高的图像中选取优选拍摄图像:
Figure BDA0001668327330000037
其中,所述k表示优选拍摄图像,所述k1表示第一评估值最高的图像,所述k2表示第二评估值最高的图像,所述value_1(k1)为图像k1的第一评估值,所述value_2(k2)为图像k2的第二评估值,所述null表示未选取出优选拍摄图像。
进一步地,本发明提供的一个优选技术方案为:
“将所述灰度处理化后的拍摄图像中目标候选框内的图像尺寸调整至预设的目标尺寸”的步骤包括:
利用双线性插值算法,对所述灰度处理化后的拍摄图像进行插值处理来将目标候选框内的图像尺寸调整至预设的目标尺寸。
进一步地,本发明提供的一个优选技术方案为:
“设置多个大小一致的第一候选框”的步骤包括:
基于所述拍摄图像尺寸信息均匀设置多个尺寸一致的第一候选框,或者在所述拍摄图像内随机生成多个尺寸一致的第一候选框。
进一步地,本发明提供的一个优选技术方案为:
通过具有连拍功能的图像采集装置以连拍的方式获取所述目标文档的多张尺寸一致的拍摄图像。
本发明的第二方面,还提供了一种存储装置,其中存储有多条程序,所述程序适于由处理器加载并执行以实现上述的基于局部梯度分布的拍摄图像优选方法。
本发明的第三方面,还提供了一种控制装置,包括:
处理器,适于执行各条程序;
存储设备,适于存储多条程序;
其特征在于,所述程序适于由处理器加载并执行以实现上述的基于局部梯度分布的拍摄图像优选方法。
与最接近的现有技术相比,上述技术方案至少具有如下有益效果:
本发明的技术方案中,根据图像的边缘信息强度,能够快速准确地从多张目标文档的拍摄图像中选择出最清晰的一张,提高文档图像的识别性能。
附图说明
图1为本发明实施例中一种基于局部梯度分布的拍摄图像优选方法的主要步骤示意图;
图2为本发明实施例中一张出租车发票的拍摄图片示意图;
图3为本发明实施例中一种选取的第一候选框的位置示意图;
图4为本发明实施例中一种包含文字区域的图片及该图片对应的梯度直方图示意图;
图5为本发明实施例中一种非文字区域的图片及该图片对应的梯度直方图示意图;
图6为本发明实施例中一种选取的第二候选框的位置示意图;
图7为本发明实施例中一种包含清晰文字区域的图像及该图像对应的梯度直方图示意图;
图8为本发明实施例中一种包含模糊文字区域的图像及该图像对应的梯度直方图示意图。
具体实施方式
下面参照附图来描述本发明的优选实施方式。本领域技术人员应当理解的是,这些实施方式仅仅用于解释本发明的技术原理,并非旨在限制本发明的保护范围。
本发明实施例提供了一种基于局部梯度分布的拍摄图像优选方法,能够在获取的多张目标文档的拍摄图中,快速准确地选择出最清晰的一张图像,该方法适用于多种类型的文档图像,有利于提高文档图像识别性能。
下面结合附图,对本发明提供的基于梯度分布的拍摄图像优选方法进行说明。
参阅附图1,图1示例性示出了本实施例中一种基于梯度分布的拍摄图像优选方法的主要步骤,如图1所示,本实施例中的基于梯度分布的拍摄图像优选方法可以包括下述内容:
步骤S101:获取目标文档的多张尺寸一致的拍摄图像。
具体地,可以通过具有连拍功能的图像采集装置以连拍的方式获取目标文档的多张尺寸一致的拍摄图像。目标文档的拍摄图像可以是应用于交通、金融、物流、税务、行政管理等各个领域中的文档资料的图像。本实施是以出租车发票为例,通过手机连拍获取三张尺寸一致的出租车发票的图像,
参阅附图2,图2示例性示出了本实施例中的一张出租车发票图像。如图2所示,该出租车发票图像包含单位编号、电话、车号、日期、时间、单价和里程等信息。
步骤S102:基于拍摄图像的尺寸信息,设置多个大小一致的第一候选框。
具体地,可以基于拍摄图像尺寸信息均匀设置多个尺寸一致的第一候选框,也可以是在拍摄图像内随机生成多个尺寸一致的第一候选框。需要说明的是,在选取的第一候选框中应当包含文字信息,且考虑计算的效率,第一候选框的面积不宜过大。
本实施例中采用出租车发票的拍摄图像,在出租车发票的拍摄图像上均匀的选取12个第一候选框。
参阅附图3,图3示例性示出了本实施例中选取的第一候选框的位置,如图3所示,拍摄图像的长边分辨率约为2000,且每个第一候选框的大小均为150×125,其中,第i个第一候选框的起始坐标定义为(ROI_c[i]×w,ROI_r[i]×h),w、h分别为拍摄图像的宽和高。本实施例中的12个第一候选框的ROI_c[i]的集合和ROI_r[i]的集合,如下式(1)、(2)所示:
ROI_c[12]={0.2,0.2,0.2,0.2,0.45,0.45,0.45,0.45,0.6,0.6,0.6,0.6}(1)
ROI_r[12]={0.25,0.45,0.65,0.8,0.25,0.45,0.65,0.8,0.25,0.45,0.65,0.8}
(2)
基于表达式(1)、(2)可以得到每个第一候选框的起始坐标,例如:第1个第一候选框的起始坐标为(0.2×w,0.25×h),第3个第一候选框的起始坐标为(0.2×w,0.65×h)。
步骤S103:基于任一拍摄图像,利用设定的第一边缘检测阈值,计算每个第一候选框内图像的第一边缘信息强度,根据第一边缘信息强度的降序选取设定数量的第一候选框,并定义为第二候选框。
具体地,从获取的多张目标文档的拍摄图像中,选取其中一张拍摄图像;对所选的拍摄图像进行灰度化处理;将灰度处理化后的拍摄图像中第一候选框内图像的尺寸调整至预设的目标尺寸;利用预设的像素图像检测算法,计算调整至目标尺寸的图像的梯度幅值并对所计算的梯度幅值进行归一化处理;根据归一化处理后的梯度幅值和预设的第一边缘检测阈值,获取每个第一候选框内图像的第一边缘信息强度;根据第一边缘信息强度的降序选取设定数量的第一候选框,并定义为第二候选框。需要说明的是,预设的像素图像检测算法即边缘检测算法,可以是基于Sobel算子或Roberts算子或Prewitt算子的边缘检测算法,其优选方案为基于Sobel算子的边缘检测算法;预设的第一边缘检测阈值是选取边缘点的阈值,边缘点是指某一像素点两边像素的灰度值有显著不同,当图像中像素点的梯度幅值大于该阈值时,则该像素点为边缘点,统计边缘点的个数得到图像的边缘信息强度。
第一边缘信息强度的计算公式如公式(3)所示:
Figure BDA0001668327330000071
Figure BDA0001668327330000072
其中,p为第一候选框的编号,valuep为第p个第一候选框内图像的第一边缘信息强度,s3是第一边缘检测阈值,s3≥0,
Figure BDA0001668327330000073
为第一候选框内图像的梯度幅值为k的个数。
图像最基本的特征是边缘,所谓边缘是指其周围像素灰度有阶跃变化的像素的集合。文字区域具有很强的边缘信息,第一候选框内图像的边缘信息强度越强,表明第一候选框内图像包含的文字信息越多;反之,第一候选框内的图像的边缘信息强度越弱,表明第一候选框内的图像包含的文字信息越少。
参阅附图4,图4示例性示出了本实施例中包含文字区域的图片及该图片对应的梯度直方图,如图4所示,可以看出包含文字信息的图像的边缘特征响应强烈。
继续参阅附图5,图5示例性示出了本实施例中非文字区域的图片及该图片对应的梯度直方图,如图5所示,可以看出不包含文字区域的图像的边缘特征响应很弱。基于此,通过计算第一候选框内图像的边缘信息强度可以快速准确地判断出第一候选框内图像包含文字信息量的多少。
本实施例中选取的是第一张出租车发票的拍摄图像,灰度化处理所选的拍摄图像;采用双线性插值算法将灰度化处理后的拍摄图像中第一候选框内图像的尺寸调整至300×250;采用Sobel算子卷积调整尺寸后的第一候选框内图像,求得第一候选框内图像的水平和竖直方向的梯度Gx,Gy。其中,Gx=Sx*I,Gy=Sy*I;I为调整尺寸后的第一候选框内图像;Sx、Sy为Sobel卷积模板,且Sx、Sy的表达式如下式(5)、(6)所示:
Figure BDA0001668327330000081
Figure BDA0001668327330000082
本实施中,基于公式(7)、(8)所示的公式,计算第一候选框内图像所有位置的水平和竖直方向的梯度:
Figure BDA0001668327330000083
Figure BDA0001668327330000084
其中,Gx(i,j)表示遍历图像所有位置的水平方向梯度幅值,Gy(i,j)表示遍历图像所有位置的竖直方向梯度幅值,(i,j)为图像的位置坐标,Sx(m,n)、Sy(m,n)为Sobel卷积模板,(m,n)为卷积模板的位置。
基于计算得到的第一候选框内图像所有位置的水平和竖直方向的梯度,按公式(9)计算第一候选框内图像的总的梯度:
G(i,j)=|Gx(i,j)|+|Gy(i,j)| (9)
将计算得到第一候选框内图像的总的梯度幅值归一化至0-255,并按公式(3)、(4)计算每个第一候选框内图像的第一边缘信息强度,需要说明的是,本实施中第一边缘检测阈值的为15。
根据第一边缘信息强度的降序选取5个的第一候选框,并定义为第二候选框。
参阅附图6,图6示例性示出了本实施例中选取的第二候选框的位置,如图6所示,可以看出基于本发明的方法可以准确识别出包含文字信息相对较多的图像区域。
步骤S104:对目标文档的每张拍摄图像,基于设定的第二边缘检测阈值和第三边缘检测阈值分别计算每个第二候选框内图像的第二边缘信息强度和第三边缘信息强度。
具体地,从获取的每张目标文档的拍摄图像进行灰度化处理;将灰度处理化后的拍摄图像中第二候选框内图像的尺寸调整至预设的目标尺寸;利用预设的像素图像检测算法,计算调整至目标尺寸的图像的梯度幅值并对所计算的梯度幅值进行归一化处理;根据归一化处理后的梯度幅值和预设的第二边缘检测阈值,获取每个第二候选框内图像的第二边缘信息强度;根据归一化处理后的梯度幅值和预设的第三边缘检测阈值,获取每个第二候选框内图像的第三边缘信息强度。
本实施例中,预设的目标尺寸为300×250;预设的像素图像检测算法为基于Sobel算子的像素图像检测算法;预设的第二边缘检测阈值为200,预设的第三边缘检测阈值为80。需要说明的是,预设的像素图像检测算法即边缘检测算法,可以是基于Sobel算子或Roberts算子或Prewitt算子的边缘检测算法,其优选方案为基于Sobel算子的边缘检测算法。本发明的目的是从多张目标文档的拍摄图像中选出最清晰的一张图像,所以设置的第二边缘检测阈值和第三边缘检测阈值,需要能够尽可能清晰地提取图像的边缘信息。
参阅附图7,图7示例性示出了本实施例中包含清晰文字区域的图像及该图像对应的梯度直方图,如图7所示,可以看出包含清晰文字区域的图像,其具有很强的边缘信息强度。
继续参阅附图8,图8示例性示出了本实施例中包含模糊文字区域的图像及该图像对应的梯度直方图,如图8所示,可以看出与图7相比,包含模糊文字区域的图像其边缘信息强度较弱。
步骤S105:通过加权平均的方法得到每张拍摄图像的第一评估值和第二评估值,选取第一评估值最高的图像和第二评估值最高的图像。
具体地,按照公式(10)所示的方法计算第一评估值和第二评估值:
Figure BDA0001668327330000101
其中,value_1为第一评估值,value_2为第二评估值,q为第二候选框的编号且q=1~n,value1q为第二边缘信息强度且
Figure BDA0001668327330000102
value2q为第三边缘信息强度且
Figure BDA0001668327330000103
s1是第二边缘检测阈值,s2是第三边缘检测阈值,s1≠s2,Wp为预设的加权系数。
加权系数Wp的计算公式如公式(11)所示:
Figure BDA0001668327330000104
Figure BDA0001668327330000105
Figure BDA0001668327330000106
其中,p为第一候选框的编号,valuep为第p个第一候选框内图像的第一边缘信息强度,s3是第一边缘检测阈值,s3≥0,
Figure BDA0001668327330000108
为第一候选框内图像的梯度幅值为k的个数。
步骤106:从第一评估值最高的图像和第二评估值最高的图像中选取满足预设条件的图像,并作为优选拍摄图像。
具体地,根据设定的阈值T1和阈值T2,并利用公式(14)从第一评估值最高的图像和第二评估值最高的图像中选取优选拍摄图像:
Figure BDA0001668327330000107
其中,k表示优选拍摄图像,k1表示第一评估值最高的图像,
k2表示第二评估值最高的图像,value_1(k1)为图像k1的第一评估值,value_2(k2)为图像k2的第二评估值,null表示未选取出优选拍摄图像。在本实施例中,设定的阈值T1=250,阈值T2=1100
进一步地,基于上述基于局部梯度分布的拍摄图像优选方法实施例,本发明还提供了一种存储装置,该存储装置中可以存储有多条程序,程序适于由处理器加载并执行如上述的基于局部梯度分布的拍摄图像优选方法。
再进一步地,基于上述基于局部梯度分布的拍摄图像优选方法实施例,本发明还提供了一种处理装置,该处理装置可以包括处理器、存储设备;处理器,适于执行各条程序;存储设备,适于存储多条程序;程序适于由处理器加载并执行如上述的基于局部梯度分布的拍摄图像优选方法。
所属技术领域的技术人员可以清楚地了解到,为了描述的方便和简洁,本发明实施例的装置的具体工作过程以及相关说明,可以参考前述实施例方法中的对应过程,且与上述方法具有相同的有益效果,在此不再赘述。
本领域技术人员应该能够意识到,结合本文中所公开的实施例描述的各示例的方法步骤及装置,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明电子硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以电子硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。本领域技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
术语“第一”、“第二”等是用于区别类似的对象,而不是用于描述或表示特定的顺序或先后次序。
至此,已经结合附图所示的优选实施方式描述了本发明的技术方案,但是,本领域技术人员容易理解的是,本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下,本领域技术人员可以对相关技术特征作出等同的更改或替换,这些更改或替换之后的技术方案都将落入本发明的保护范围之内。

Claims (9)

1.一种基于局部梯度分布的拍摄图像优选方法,其特征在于包括:
获取目标文档的多张尺寸一致的拍摄图像;
基于所述拍摄图像的尺寸信息,设置多个大小一致的第一候选框;
基于任一所述拍摄图像,利用设定的第一边缘检测阈值,计算每个第一候选框内图像的第一边缘信息强度,根据所述第一边缘信息强度的降序选取设定数量的第一候选框,并定义为第二候选框;
对所述目标文档的每张所述拍摄图像,基于设定的第二边缘检测阈值和第三边缘检测阈值分别计算每个所述第二候选框内图像的第二边缘信息强度和第三边缘信息强度,并通过加权平均的方法得到每张所述拍摄图像的第一评估值和第二评估值,选取第一评估值最高的图像和第二评估值最高的图像;其中,“通过加权平均的方法得到每张所述拍摄图像的第一评估值和第二评估值”的步骤包括:
按照下式所示的方法计算所述第一评估值和第二评估值:
Figure FDA0002671959820000011
其中,所述value_1为第一评估值,所述value_2为第二评估值,所述q为第二候选框的编号且q=1~n,所述value1q为第二边缘信息强度且
Figure FDA0002671959820000012
所述value2q为第三边缘信息强度且
Figure FDA0002671959820000013
所述s1是第二边缘检测阈值,所述s2是第三边缘检测阈值,s1≠s2,所述Wp为预设的加权系数;
所述加权系数Wp的计算公式为:
Figure FDA0002671959820000014
Figure FDA0002671959820000015
Figure FDA0002671959820000021
其中,所述p为第一候选框的编号,所述valuep为第p个第一候选框内图像的第一边缘信息强度,所述s3是第一边缘检测阈值,s3≥0,所述
Figure FDA0002671959820000022
为第一候选框内图像的梯度幅值为k的个数;
从所述第一评估值最高的图像和所述第二评估值最高的图像中选取满足预设条件的图像,并作为优选拍摄图像。
2.根据权利要求1所述的基于局部梯度分布的拍摄图像优选方法,其特征在于,所述方法还包括:
对拍摄图像进行灰度化处理;
将所述灰度处理化后的拍摄图像中目标候选框内的图像尺寸调整至预设的目标尺寸;
利用预设的像素图像检测算法,计算调整至所述目标尺寸的图像的梯度幅值并对所计算的梯度幅值进行归一化处理;
根据所述归一化处理后的梯度幅值和预设的目标阈值,获取所述目标候选框内图像的边缘信息强度;
其中,当所述目标候选框是第一候选框时,所述目标阈值是第一边缘检测阈值且所述边缘信息强度是第一边缘信息强度;当所述目标候选框是第二候选框时,所述目标阈值是第二边缘检测阈值和第三边缘检测阈值且所述边缘信息强度是第二边缘信息强度和第三边缘信息强度。
3.根据权利要求2所述的基于局部梯度分布的拍摄图像优选方法,其特征在于,所述像素图像检测算法是基于Sobel算子或Roberts算子或Prewitt算子的像素图像检测算法。
4.根据权利要求1-3中任一项所述的基于局部梯度分布的拍摄图像优选方法,其特征在于,“从所述第一评估值最高的图像和所述第二评估值最高的图像中选取满足预设条件的图像,并作为优选拍摄图像”的步骤包括:
根据设定的阈值T1和阈值T2,并利用下式从所述第一评估值最高的图像和所述第二评估值最高的图像中选取优选拍摄图像:
Figure FDA0002671959820000031
其中,所述k表示优选拍摄图像,所述k1表示第一评估值最高的图像,所述k2表示第二评估值最高的图像,所述value_1(k1)为图像k1的第一评估值,所述value_2(k2)为图像k2的第二评估值,所述null表示未选取出优选拍摄图像。
5.根据权利要求2所述的基于局部梯度分布的拍摄图像优选方法,其特征在于,“将所述灰度处理化后的拍摄图像中目标候选框内的图像尺寸调整至预设的目标尺寸”的步骤包括:
利用双线性插值算法,对所述灰度处理化后的拍摄图像进行插值处理来将目标候选框内的图像尺寸调整至预设的目标尺寸。
6.根据权利要求1-3中任一项所述的基于局部梯度分布的拍摄图像优选方法,其特征在于,“设置多个大小一致的第一候选框”的步骤包括:
基于所述拍摄图像尺寸信息均匀设置多个尺寸一致的第一候选框,或者在所述拍摄图像内随机生成多个尺寸一致的第一候选框。
7.根据权利要求1-3中任一项所述的基于局部梯度分布的拍摄图像优选方法,其特征在于,通过具有连拍功能的图像采集装置以连拍的方式获取所述目标文档的多张尺寸一致的拍摄图像。
8.一种存储装置,其中存储有多条程序,其特征在于,所述程序适于由处理器加载并执行以实现权利要求1-7中任一项所述的基于局部梯度分布的拍摄图像优选方法。
9.一种控制装置,包括:
处理器,适于执行各条程序;
存储设备,适于存储多条程序;
其特征在于,所述程序适于由处理器加载并执行以实现权利要求1-7中任一项所述的基于局部梯度分布的拍摄图像优选方法。
CN201810492704.3A 2018-05-22 2018-05-22 基于局部梯度分布的拍摄图像优选方法及装置 Active CN108805033B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810492704.3A CN108805033B (zh) 2018-05-22 2018-05-22 基于局部梯度分布的拍摄图像优选方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810492704.3A CN108805033B (zh) 2018-05-22 2018-05-22 基于局部梯度分布的拍摄图像优选方法及装置

Publications (2)

Publication Number Publication Date
CN108805033A CN108805033A (zh) 2018-11-13
CN108805033B true CN108805033B (zh) 2020-12-18

Family

ID=64091329

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810492704.3A Active CN108805033B (zh) 2018-05-22 2018-05-22 基于局部梯度分布的拍摄图像优选方法及装置

Country Status (1)

Country Link
CN (1) CN108805033B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112381820A (zh) * 2020-12-07 2021-02-19 深圳市福日中诺电子科技有限公司 一种基于一组同场景照片清晰度的评价方法
CN118524298B (zh) * 2024-07-22 2024-10-11 深圳市永泰光电有限公司 一种超清超广角鱼眼镜头的高分辨率控制方法
CN118606508A (zh) * 2024-08-07 2024-09-06 浙江大华技术股份有限公司 图像选择方法、计算机设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102375982A (zh) * 2011-10-18 2012-03-14 华中科技大学 一种融合多字符特征的车牌定位方法
CN102542268A (zh) * 2011-12-29 2012-07-04 中国科学院自动化研究所 用于视频中文本区域检测与定位的方法
CN103839062A (zh) * 2014-03-11 2014-06-04 东方网力科技股份有限公司 一种图像文字定位方法及装置
US9292739B1 (en) * 2013-12-12 2016-03-22 A9.Com, Inc. Automated recognition of text utilizing multiple images
CN106485183A (zh) * 2016-07-14 2017-03-08 深圳市华汉伟业科技有限公司 一种二维码定位方法及系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10902619B2 (en) * 2016-10-26 2021-01-26 Duke University Systems and methods for determining quality metrics of an image or images based on an edge gradient profile and characterizing regions of interest in an image or images

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102375982A (zh) * 2011-10-18 2012-03-14 华中科技大学 一种融合多字符特征的车牌定位方法
CN102542268A (zh) * 2011-12-29 2012-07-04 中国科学院自动化研究所 用于视频中文本区域检测与定位的方法
US9292739B1 (en) * 2013-12-12 2016-03-22 A9.Com, Inc. Automated recognition of text utilizing multiple images
CN103839062A (zh) * 2014-03-11 2014-06-04 东方网力科技股份有限公司 一种图像文字定位方法及装置
CN106485183A (zh) * 2016-07-14 2017-03-08 深圳市华汉伟业科技有限公司 一种二维码定位方法及系统

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
"Accurate videotextdetectionthroughclassificationoflowandhigh contrast images";Palaiahnakote Shivakumara等;《Pattern Recognition》;20101231;全文 *
"基于点锐度和平方梯度的图像清晰度评价方法";薛万勋等;《电子设计工程》;20170430;第25卷(第8期);第163-167页 *
"面向无参考图像的清晰度评价方法研究";李祚林等;《遥感技术与应用》;20110430;第26卷(第2期);全文 *

Also Published As

Publication number Publication date
CN108805033A (zh) 2018-11-13

Similar Documents

Publication Publication Date Title
CN113038018B (zh) 辅助用户拍摄车辆视频的方法及装置
CN111402135A (zh) 图像处理方法、装置、电子设备及计算机可读存储介质
EP2023596A2 (en) Apparatus and program for producing as panoramic image
CN109492642B (zh) 车牌识别方法、装置、计算机设备及存储介质
CN108805033B (zh) 基于局部梯度分布的拍摄图像优选方法及装置
US20050249429A1 (en) Method, apparatus, and program for image processing
CN108921823A (zh) 图像处理方法、装置、计算机可读存储介质和电子设备
EP3798975A1 (en) Method and apparatus for detecting subject, electronic device, and computer readable storage medium
CN109859227A (zh) 翻拍图像检测方法、装置、计算机设备及存储介质
WO2019221013A4 (en) Video stabilization method and apparatus and non-transitory computer-readable medium
JP4373840B2 (ja) 動物体追跡方法、動物体追跡プログラムおよびその記録媒体、ならびに、動物体追跡装置
CN111340749B (zh) 图像质量的检测方法、装置、设备及存储介质
CN111080542B (zh) 图像处理方法、装置、电子设备以及存储介质
WO2006081018A1 (en) Object-of-interest image capture
CN111383252B (zh) 多相机目标追踪方法、系统、装置及存储介质
CN109584198B (zh) 一种人脸图像质量评价方法、装置及计算机可读存储介质
CN110473189A (zh) 一种文本图像清晰度判断方法及系统
CN111832464B (zh) 一种基于近红外摄像头的活体检测方法及装置
CN108764139B (zh) 一种人脸检测方法、移动终端及计算机可读存储介质
CN107748882B (zh) 一种车道线检测方法及装置
CN117496019B (zh) 一种驱动静态图像的图像动画处理方法及系统
CN110378934A (zh) 主体检测方法、装置、电子设备和计算机可读存储介质
US20170352170A1 (en) Nearsighted camera object detection
CN110633705A (zh) 一种低照度成像车牌识别方法及装置
CN115115546A (zh) 一种图像处理方法、系统、电子设备及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant