CN1525387A - 检测图像模糊性的设备和方法 - Google Patents

检测图像模糊性的设备和方法 Download PDF

Info

Publication number
CN1525387A
CN1525387A CNA2004100025556A CN200410002555A CN1525387A CN 1525387 A CN1525387 A CN 1525387A CN A2004100025556 A CNA2004100025556 A CN A2004100025556A CN 200410002555 A CN200410002555 A CN 200410002555A CN 1525387 A CN1525387 A CN 1525387A
Authority
CN
China
Prior art keywords
mrow
block
blocks
msub
munder
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2004100025556A
Other languages
English (en)
Other versions
CN100433047C (zh
Inventor
�ֲɻ�
林采焕
张益熏
金南哲
金钟俒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of CN1525387A publication Critical patent/CN1525387A/zh
Application granted granted Critical
Publication of CN100433047C publication Critical patent/CN100433047C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/40Analysis of texture
    • G06T7/41Analysis of texture based on statistical description of texture
    • G06T7/42Analysis of texture based on statistical description of texture using transform domain methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/98Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns
    • G06V10/993Evaluation of the quality of the acquired pattern
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20021Dividing image into blocks, subimages or windows
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20048Transform domain processing
    • G06T2207/20052Discrete cosine transform [DCT]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30168Image quality inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30176Document

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Probability & Statistics with Applications (AREA)
  • Image Analysis (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Studio Devices (AREA)

Abstract

一种用于确定图像是否是模糊的设备和方法。该设备和方法包括一输入部分,用于接收图像;一块分类部分,用于将所接收到的图像划分成块并且将所划分的块分类成字符块和背景块;一字符块能量计算部分,用于计算字符块的平均能量比;以及一模糊检测部分,用于计算字符块的平均能量比并且根据比较平均能量比和预定阈值来确定该图像是否是模糊的。

Description

检测图像模糊性的设备和方法
技术领域
本发明通常涉及用于对图像信号进行预处理的设备和方法,尤其是涉及一种在识别图像中的字符之前即确定出该图像是否是模糊的预处理设备和方法。
背景技术
背景技术通常,执行预处理操作以识别图像中的字符。该“预处理操作”是指在识别图像中的字符之前对该图像所处理的操作。图像预处理操作可包括用于确定所输入的图像是否适于字符识别的操作、对输入图像的歪斜进行校正的操作、对输入图像的大小进行适当校正的操作、以及使图像信号二进制化的操作以便可识别图像信号的字符。
用于预处理的图象输入可以是由一架相机所拍摄的图像。当在拍摄过程中对象被离焦了或者被不正规的照明时,所摄影的图像成为模糊的。识别这种模糊图象中的字符可增大错误识别率。因此,最好是在识别图像中的字符之前就确定输入图像是否是模糊的。如果图像的分辨率太低而以致不能识别出其中的字符,那么最好是中断识别操作并且因此请求重新输入该图像。
发明内容
因此本发明的一个目的就是为用于识别图像中的字符的设备提出了一种在识别图像中的字符之前就可确定出该图像是否是模糊的设备和方法。
本发明的另一个目的就是为用于识别图像中的字符的设备提出了这样一种设备和方法,该设备和方法通过将输入图像分类成字符块和背景块并且仅对字符块进行分析即可确定出该图像是否是模糊的。
本发明的又一个目的就是为用于识别图像中的字符的设备提出了这样一种设备和方法,该设备和方法通过将输入图像分类成字符块和背景块并且仅对字符块的能量比进行分析即可确定出该图像是否是模糊的。
为了实现上述和其他目的,提出了一种可确定图像是否是模糊的设备。该设备包括一输入部分,用于接收图像;一块分类部分,用于将所接收到的图像划分成块并且将所划分的块分类成字符块和背景块;一字符块能量计算部分,用于计算字符块的平均能量比;以及一模糊检测部分,用于计算字符块的平均能量比并且通过比较平均能量比和预定阈值来确定该图像是否是模糊的。
附图说明
结合随后的附图,从下述详细的说明中可更显而易见的得出本发明的上述和其他目的、特征以及优点,在附图中:
图1给出了根据本发明实施例的用于检测图像模糊性的设备的结构方框图;
图2给出了根据本发明实施例的图1的块分类部分的结构详细框图;
图3A至3C给出了用于说明根据本发明实施例的图2的能量计算部分设置主要离散余弦转换(DCT)系数的点的方法示意图;
图3D至3E给出了根据本发明实施例的其被分类成字符块和背景块的图像的示例示意图;
图4给出了根据本发明实施例的图1的字符块能量计算部分的结构详细框图;
图5给出了M×M字符块中的DCT系数的点的示意图;
图6A至6F给出了根据本发明实施例的当计算字符块中的DCT系数的能量比时所使用的DCT系数以及对应特征的示意图;
图7给出了根据本发明实施例的当计算8×8字符块中的DCT系数的能量比时所使用的DCT系数的示意图;
图8给出了图7的DCT系数的平均能量比的分布示意图;
图9给出了根据本发明实施例的用于检测图像模糊性的过程的流程图;
图10给出了根据本发明的用于检测图像模糊性的过程的流程图;以及
图11A至11E给出了在执行图10的过程的处理中所产生的图像的示意图。
具体实施方式
在下述说明中,对诸如图像的大小以及字符块和背景块的大小进行了详细的描述作为示例。对于本领域普通技术人员来说显而易见的是无需示例或者对于示例的修改也很容易实现本发明。
在对本发明实施例的下述说明中,假定输入图像的大小是640×480像素。术语“块”是指字符块和背景块,并且在这里,假定每个块的大小均是8×8像素。
下面参考随后的附图对本发明的实施例进行详细的说明。
图1给出了根据本发明实施例的用于检测图像模糊性的设备的结构方框图。参考图1,输入部分110是一通信接口并且是包括有照相机、扫描仪、调制解调器、以及网络的计算机。这里假定图像是由640(行)×480(列)像素构成的。
块分类部分120将从输入部分110所接收到的图像划分成块,并且将所划分成的块分类成字符块(CB)和背景块(BB)。块分类部分120将块分类成字符块和背景块是仅仅通过利用包含有字符的区域即可确定该图像是否是模糊的。如上所述,在这里假定该块的大小是8×8像素。
平均字符块能量计算部分130计算块分类部分120所输出的字符块的平均能量比。计算字符块的平均能量比的理由是通过计算其形成了该图像的字符块的平均能量比从而仅使用包含有字符的区域即可确定该是否是模糊的。
模糊检测部分(或者模糊确定部分)140通过将平均字符块能量计算部分130所输出的字符块的平均能量比与预定阈值进行比较来确定该图像是否是模糊的。如果确定出该图像是模糊的,那么模糊检测部分140通过将该检测结果通知输入部分110而请求重新输入该图像。
如果从块检测部分140接收到非模糊图象判定信号,那么识别部分150对输入部分110所输出的图像中的字符进行识别。
图2给出了图1的块分类部分120的结构详图。该块分类部分120将该图像划分成具有预定大小的块,并且将该块分类成字符块和背景块。这里,块分类部分120对块进行分类是仅使用包含有字符的区域以便确定该图像是否是模糊的。
参考图2,块划分部分211将该图像划分成具有预定大小的块。如果该图像的大小是640×480像素并且每一块的大小是8×8像素,那么该块划分部分211将该图像划分成4800块。
将块划分部分211所输出的块提供给离散余弦变换(DCT)转换部分213,在离散余弦变换转换部分213中它们将受到DCT转换。能量计算部分215计算已DCT转换块中的主要DCT系数的绝对值总和。在这种情况下,该字符块的DCT系数的能量分布值大于背景块的DCT系数的能量分布值。
图3A给出了对字符块的DCT系数的能量分布与背景块的DCT系数的能量分布进行比较的示意图。在图3A中,Y轴表示以对数作为标度的绝对值总和的平均值,并且X轴表示DCT系数的锯齿形扫描序列。如图3A所示,值得注意的是字符块的DCT系数比背景块的DCT系数要大。图3B给出了字符块的DCT系数的能量分布示意图。在图3B中,Y轴表示以标准值作为标度的绝对值总和的平均值,并且X轴表示DCT系数的锯齿形扫描序列。如图3B所示,值得注意的是一些DCT系数具有大的绝对值总和的平均值。因此,在本发明的实施例中,假定在块分类过程中所使用的主要DCT系数是如图3C所示的D1至D9。因此,第k块中的主要DCT系数绝对值总和可以通过下式来计算:
S k = Σ i = 1 9 | D i k | - - - - - - - ( 1 )
在等式(1)中,|Di k|表示第k块的第i个主要DCT系数,并且Sk表示第k块中的主要DCT系数的绝对值总和。由此,在本发明的实施例中,计算主要DCT系数D1至D9的总和。
能量计算部分215对所有的块(k=0,1,2,…,4799)执行等式(1)的计算。将逐块所计算的能量值Sk(k=0,1,2,…,4799)提供给阈值计算部分217。
该图2的阈值计算部分21 7对逐块所计算的能量值Sk(k=0,1,2,…,4799)求和,并且通过将所有块的能量值总和除以块的总数目TBN来计算平均值<Sk>。根据下述等式(2)来计算该平均值<Sk>。平均值<Sk>成为了用于确定该块是字符块还是背景块的阈值。
< S k > = 1 TBN &Sigma; k = 1 TBN S k - - - - - - - ( 2 )
= Cth
在等式(2)中,TBN表示块的总数目。
块确定部分219顺序接收能量计算部分215所输出的各个块的能量值(主要DCT系数的绝对值总和),并且通过对所接收到的块能量值与阈值Cth进行比较来将该块分类为字符块或者背景块。如下述等式(3)所示的,如果Sk≥Cth,那么块确定部分219将第k块分类为字符块,并且如果Sk<Cth,那么将其分类为背景块。
如果Sk≥Cth 那么CB
                                      ........(3)
            否则BB
图3D和3E给出了块分类部分120将其分类成字符块和背景块的最终结果。在图3D和3E中,灰色区域对应于字符块,同时黑色区域对应于背景块。
块分类部分120所分类的块的像素可以具有0与255之间的灰度级。将块分类部分120所输出的字符块的图像输入到平均字符块能量计算部分130。该平均字符块能量计算部分130计算每一字符块的能量比,并且此后利用所计算的能量比来计算整个图像中的字符块的平均能量比。
图4给出了字符块能量计算部分130的结构详细框图。参考图4,能量比计算部分311计算块分类器120所分类的每一字符块中的DCT系数的能量比。图5给出了M×M字符块中的DCT系数所处位置的示意图。在这种情况下,通过下式来计算字符块的DCT系数比:
R k = &Sigma; m &Sigma; n ( m , n ) &Element; &Omega; L | L m , n k | &Sigma; m &Sigma; n ( m , n ) &Element; &Omega; L | L m , n k | + &Sigma; m &Sigma; n ( m , n ) &Element; &Omega; H | H m , n k | - - - - - - - ( 4 )
其中, &Omega; L = { ( m , n ) | m , n = 0 , . . . , M - 1 , m + n = 1 , . . . , M 4 } ;
&Omega; H = { ( m , n ) | m , n = 0 , . . . , M - 1 , m + n = M 4 + 1 , . . . , 3 M 4 } ;
Lm,n k表示第k块的(m,n)点上的低频分量的DCT系数;以及
Hm,n k表示第k块的(m,n)点上的高频分量的DCT系数;
如上所述的,这里假定每个块的大小是8×8像素(即M=8)。图6A至6F给出了试验结果的示意图,该试验结果可对所选择的计算字符块能量比所使用的低频分量与高频分量的DCT系数的位置的适当性进行核对。具体地说,图6A至6E给出了通过阶跃所分类的用于对各个字符块中的DCT能量比进行计算的DCT系数所处位置的示意图,并且根据阶跃所分类的DCT系数,图6F给出了由阶跃所分类的模糊变化的示意图。该试验结果通过提高模糊度而给出了字符块的平均能量比的变化。从该试验结果中应该注意到利用图6B的DCT系数所获得的结果平均能量比最易受到模糊度变化的影响。在本发明的实施例中,假定图6B的DCT系数用于计算字符块中的DCT系数的能量比。
在本发明的实施例中,图7给出了用于计算每个字符块的DCT系数能量比的DCT系数。在这种情况下,在上述等式(4)中,Lm,n表示m+1=1和2的点上的低频分量的DCT系数,并且Hm,n表示m+n=3,4,5,以及6的点上的高频分量的DCT系数。
按照这种方式,能量比计算部分311利用上述等式(4)来计算每个字符块的DCT系数的能量比Rk。平均能量比计算部分313计算整个图像的DCT系数的平均能量比<Rk>。换句话说,该平均能量比计算部分313按照下述等式(5)通过利用能量比计算部分311所计算的能量比Rk来计算整个图像的DCT系数的平均能量比<Rk>。
< R k > = 1 TCN &Sigma; k = 1 TCN R k - - - - - - - - - ( 5 )
在等式(5)中,TCN表示字符块的总数目。
如果按照上述已计算了整个图像的平均能量比<Rk>,那么模糊检测部分140对该平均能量比<Rk>与在实验上所获得的阈值Bth进行比较,如下述等式(6)所示,并且此后确定该输入图像是模糊的还是不模糊的。换句话说,如果<Rk>≥Bth,那么该模糊检测部分140确定出该输入图像是模糊的,并且此后请求输入部分1 10重新输入该图像。另一方面,如果<Rk><Bth,那么该模糊检测部分140确定出该输入图像不是模糊的,并且此后将此通知识别部分150以便对该输入图像进行识别。
IF<Rk>≥Bth  那么  模糊图像
                                  .........(6)
             否则  非模糊图像
在等式(6)中,根据该图像的字符信息在视觉上是否是可识别的以及二进制化输出的性能来选择阈值Bth。
图8给出了模糊图象和非模糊图象应用等式(5)的结果的示意图。在图8中,横轴表示不同的图像抽样,同时纵轴表示平均能量比<Rk>。从图8中可以看出模糊图象和非模糊图象呈现出不同的平均能量比<Rk>的分布。这说明了应用等式(5)来确定模糊(或者模糊检测)是合理的。
图9给出了根据本发明一实施例的对模糊图像进行检测的过程的流程图。参考图9,在步骤411中检测输入图像,并且在步骤413将输入图像划分成具有预定大小的块。在这里假定该图像的大小是640×480像素,并且每一块的大小是8×8像素。因而,很清楚该图像被分成4800块。
此后,在步骤415将块号码BN设置为0,并且在步骤417对块号码为BN的块进行存取。在步骤419对所存取的块#BN进行DCT转换,并且此后,计算已DCT转换的块#BN中的主要DCT系数的绝对值总和并且在步骤421对其进行保存。就此,字符块的DCT系数的能量分布值具有比背景块的DCT系数的能量分布值要大的值,并且字符块和背景块的DCT系数的能量分布具有如图3A所示的特征曲线。字符块的DCT系数的能量分布呈现出图3B的特征曲线。因此,根据等式(1)来计算块#BN中的DCT系数的绝对值总和Sk。这里,k是与BN相同的参数,并且表示块号码。在步骤421对Sk进行计算之后,在步骤423确定是否是对最后块的Sk进行计算。如果不是对最后块的Sk进行计算,那么在步骤425使块号码加一,并且此后该过程返回至步骤417以重复上述操作。
通过重复执行步骤41 7至423,通过对所有块(k=0,1,2,…,4799)执行等式(1)的计算来对每个块图像进行DCT转换。在步骤427,利用各个块的能量值Sk(k=0,1,2,…,4799)来计算阈值Cth。在步骤427计算阈值Cth的处理过程中,首先对为各个块所计算的能量值Sk(k=0,1  2,…,4799)进行求和,并且此后根据等式(2)通过使所有块的能量值总和除以块的总数目来计算平均值<Sk>。所计算的平均值<Sk>成为用于确定该图象块是字符块还是背景块的阈值Cth。
在计算出阈值Cth之后,执行将块分类成字符块和背景块的操作。随后,计算字符块的DCT系数的能量比Rk。在这里由BN来表示块号码,并且由CN来表示字符块号码。因而,在步骤429,将块号码BN和字符块号码CN均初始化为0,并且此后,在步骤431,对与块号码BN相对应的块的Sk进行存取。在步骤433,根据等式(3)利用该阈值Cth将输入块#BN的Sk值分类成字符块或背景块。在步骤433,如果Sk≥Cth,那么将对应块#BN分类成字符块,并且如果Sk<Cth,那么将对应块#BN分类成背景块。如果将对应块分类成字符块,那么在步骤435,能量比计算部分311利用等式(4)来计算对应块的DCT系数的能量比Rk,并且此后在步骤437使字符块号码CN加1。也就是说,在本发明的该实施例中,仅计算其被分类成字符块的DCT系数的能量比Rk。如下来计算该能量比Rk。首先,将各个低频分量的DCT系数加到图7所示的DCT系数上 ( &Sigma; m &Sigma; n ( m , n ) &Element; &Omega; L | L m , n k ) , 并且将各个高频分量的DCT系数也加到图7所示的DCT系数上 ( &Sigma; m &Sigma; n ( m , n ) &Element; &Omega; H | H m , n k ) . 第二,将低频分量的DCT分量与图7的DCT分量的总和加到高频分量的DCT分量与图7的DCT分量的总和上 ( &Sigma; m &Sigma; n ( m , n ) &Element; &Omega; L | L m , n k | + &Sigma; m &Sigma; n ( m , n ) &Element; &Omega; H | H m , n k ) . 第三,通过使低频分量的DCT分量与图7的DCT分量的总和 &Sigma; m &Sigma; n ( m , n ) &Element; &Omega; L | L m , n k | 除以第二步骤所相加的DCT分量的总和 &Sigma; m &Sigma; n ( m , n ) &Element; &Omega; L | L m , n k | + &Sigma; m &Sigma; n ( m , n ) &Element; &Omega; H | H m , n k | 来确定对应字符块的能量比Rk
此后,在步骤439确定所分类的块是否是最后的块(或者块结束)。如果所分类的块是最后的块,那么在步骤441使块号码加1,并且此后过程返回至步骤431以重复上述操作。当完成了这样的操作时,结束将输入图像块分类成字符块和背景块的操作。在这种状态下,计算出其被分类成字符块的DCT系数的能量比。
在计算出所有字符块的DCT系数的能量比之后,在步骤443中根据等式(5)来计算字符块的DCT系数的平均值<Rk>。通过对所计算出的字符块的所有能量比Rk进行求和并且此后通过使所求和的值除以字符块的总数目TCN来计算该图像的字符块的平均能量比<Rk>。
在步骤445,将字符块的平均能量比<Rk>与阈值Bth进行比较以确定输入图像是否是模糊的。根据图像的字符信息是否在视觉上是可识别的以及该图像的二进制化输出性能来选择该阈值Bth。如果在步骤445确定出字符块的平均能量比<Rk>小于阈值Bth,那么确定出该输入图像是可识别的图像并且在步骤447将此通知给识别部分150。该识别部分150因而对从输入部分110所接收到的图像执行识别操作。然而,如果在步骤445确定出字符块的平均能量比<Rk>大于或者等于阈值Bth,那么确定出该输入图像是模糊图象,并且将一重新输入请求信号提供给输入部分110。
图10给出了根据本发明实施例的用于检测输入图像模糊性的过程的流程图。图11A至11E给出了在执行图10的过程的处理中所产生的图像的示意图。
参考图10,在步骤510,输入部分110接收如图11A所示的输入图像。所接收到的图像的大小是640×480像素。在步骤520,块划分部分211将图11A的图像划分成图11B所示的其具有预定大小的块。每个块的大小是8×8像素,并且所划分的块的数目是4800。此后,在步骤530,DCT转换部分213对块划分部分211所划分的块进行DCT转换,并且在步骤540,能量计算部分215计算已DCT转换的块的主要DCT系数的绝对值总和Sk(k=BN=0,1,…,4799),并且输出计算结果以作为各个块的能量。在步骤550,阈值计算部分217通过根据等式(2)来计算块的主要DCT系数的绝对值总和的平均值来计算阈值Cth。该阈值Cth是通过计算整个图像中的块的主要DCT系数的绝对值总和的平均值所确定的值,并且该值成为了用于将块分类成字符块和背景块的阈值。此后,在步骤560,块确定部分219连续地接收块的主要DCT系数的绝对值总和Sk,并且将该值Sk与阈值Cth进行比较。比较的结果是,如果该值Sk大于或者等于该阈值Cth,那么块确定部分219将对应块分类为字符块,并且如果该值Sk小于该阈值Cth,那么块确定部分219将对应块分类为背景块。图11C给出了块判定块219所分类的一字符块的示意图。在步骤570,能量比计算部分311根据等式(4)来计算其被分类成字符块的DCT系数的能量比Rk,并且在步骤580,能量比计算部分313通过对字符块的DCT系数的能量比进行求和并根据等式(5)来计算该总和的平均值而计算整个图像中的字符块的平均能量比<Rk>。模糊检测部分140通过根据等式(6)来对字符块的平均能量比与用于模糊检测的阈值Bth进行比较来确定输入图像是否是模糊的。字符块的平均能量比<Rk>大于或者等于该阈值Bth,那么模糊检测部分140返回到步骤510,确定出该输入图像是模糊图象。图11D给出了其被模糊检测部分140确定为模糊图象的一图像的示例示意图。然而,如果字符块的平均能量比<Rk>小于阈值Bth,那么模糊检测部分140确定出该输入图像是非模糊图象,并且此后转到步骤600,在步骤600中向识别部分150通知该确定结果。该识别部分150因而对从输入部分110所接收到的图像中的字符执行识别操作。图11E给出了其被模糊检测部分140确定为可识别图像的一图像的示例示意图。
如上所述,本发明的实施例可在识别图像之前在预处理过程中就确定出该输入图像是否是模糊的,因而有助于提高识别率。另外,本发明的实施例仅确定出输入图像的字符块是否是模糊的,从而使模糊图象检测过程简单化。
虽然参考其特定的优选实施例说明了并描述了本发明,但是对于本领域普通技术人员来说应该明白的是,在不脱离由随后权利要求所定义的本发明的精神和范围的情况下可对其构成和细节做出各种变化。

Claims (12)

1.一种用于确定图像是否是模糊的设备,该设备包括:
一输入部分,用于接收图像;
一块分类部分,用于将所接收到的图像划分成块并且将所划分的块分类成字符块和背景块;
一字符块能量计算部分,用于计算字符块的平均能量比;以及
一模糊检测部分,用于计算字符块的平均能量比并且基于比较平均能量比和预定阈值来确定该图像是否是模糊的。
2.根据权利要求1的设备,其中块分类部分包括:
一块划分部分,用于将所接收到的图像划分成具有预定大小的块;
一离散余弦变换(DCT)转换部分,用于对块划分部分所输出的块进行DCT转换;
一能量计算部分,用于计算每一个已DCT转换的块中的主要DCT系数的绝对值总和,并且输出该总和以作为对应块的能量值;
一阈值计算部分,用于对能量计算部分所输出的各个块的能量值进行求和,并且通过使所求的能量值总和除以块的总数目以算出平均数而产生了阈值;以及
一块确定部分,用于连续地接收能量计算部分所输出的块的能量值,并且基于通过对所接收到的能量值与该阈值进行比较而将该块分类为字符块或者背景块。
3.根据权利要求2的设备,其中每个块的大小是8×8像素,并且通过下式来计算每个块的能量值:
S k = &Sigma; i = 1 9 | D i k |
其中|Di k|表示第k块的第i个主要DCT系数,并且Sk表示第k块中的主要DCT系数的绝对值总和。
4.根据权利要求2的设备,其中字符块能量计算部分包括:
一能量比计算部分,用于计算每个分类块的DCT系数的能量比;以及
一平均能量比计算部分,用于通过算出字符块能量比的平均值来计算字符块的平均能量比。
5.根据权利要求4的设备,其中能量比计算部分根据下述等式(1)来计算每个字符块的DCT系数的能量比,并且平均能量比计算部分根据下述等式(2)来计算平均能量比:
R k = ( m , n ) &Element; &Omega; L &Sigma; m &Sigma; n | L m , n k | ( m , n ) &Element; &Omega; L &Sigma; m &Sigma; n | L m , n k | + ( m , n ) &Element; &Omega; H &Sigma; m &Sigma; n | H m , n k | - - - ( 1 )
其中, &Omega; L = { ( m , n ) | m , n = 0 , . . . , M - 1 , m + n = 1 , . . . , M 4 } ;
&Omega; H = { ( m , n ) | m , n = 0 , . . . , M - 1 , m + n = M 4 + 1 , . . . , 3 M 4 } ;
Lm,n k表示第k块的(m,n)点上的低频分量的DCT系数;以及
Hm,n k表示第k块的(m,n)点上的高频分量的DCT系数;
&lang; R k &rang; = 1 TCN &Sigma; k = 1 TCN R k - - - ( 2 )
其中TCN表示字符块的总数目。
6.根据权利要求5的设备,其中在能量比计算部分中,对于Lm,n而言m+n=1和2,并且对于Hm,n而言m+n=3,4,5和6。
7.一种用于确定图像是否是模糊的方法,该方法包括:
接收图像;
将所接收到的图像划分成块并且将所划分的块分类成字符块和背景块;
计算字符块的平均能量比;以及
计算字符块的平均能量比并且通过比较平均能量比和预定阈值来确定该图像是否是模糊的。
8.根据权利要求7的方法,其中块分类步骤还包括步骤:
将收到的图像划分成为具有预定大小的块;
离散余弦变换(DCT)转换块;
计算主要DCT系数的绝对值总和,并且输出该总和以作为对应块的能量值;
对各个块的能量值进行求和,并且通过使所求的能量值总和除以块的总数目以算出平均数而产生了阈值;以及
连续地接收能块的能量值,并且基于接收到的能量值与该阈值进行比较而将该块分类为字符块或者背景块。
9.根据权利要求8的方法,其中每个块的大小是8×8像素,并且通过下式来计算每个块的能量值:
S k = &Sigma; i = 1 9 | D i k |
其中|Di k|表示第k块的第i个主要DCT系数,并且Sk表示第k块中的主要DCT系数的绝对值总和。
10.根据权利要求8的方法,其中计算字符块能量的步骤进一步包括步骤:
计算每个分类块的DCT系数的能量比;以及
通过算出字符块能量比的平均值来计算字符块的平均能量比。
11.根据权利要求10的方法,其中计算能量比的步骤还包括:
根据下述等式(1)来计算每个字符块的DCT系数的能量比,并且部分根据下述等式(2)来计算平均能量比:
R k = ( m , n ) &Element; &Omega; L &Sigma; m &Sigma; n | L m , n k | ( m , n ) &Element; &Omega; L &Sigma; m &Sigma; n | L m , n k | + ( m , n ) &Element; &Omega; H &Sigma; m &Sigma; n | H m , n k | - - - ( 1 )
其中, &Omega; L = { ( m , n ) | m , n = 0 , . . . , M - 1 , m + n = 1 , . . . , M 4 } ;
&Omega; H = { ( m , n ) | m , n = 0 , . . . , M - 1 , m + n = M 4 + 1 , . . . , 3 M 4 } ;
Lm,n k表示第k块的(m,n)点上的低频分量的DCT系数;以及
Hm,n k表示第k块的(m,n)点上的高频分量的DCT系数;
&lang; R k &rang; = 1 TCN &Sigma; k = 1 TCN R k - - - ( 2 )
其中TCN表示字符块的总数目。
12.根据权利要求10的方法,其中对于能量比计算的步骤而言,对于Lm,n而言m+n=1和2,并且对于Hm,n而言m+n=3,4,5和6。
CNB2004100025556A 2003-01-30 2004-01-30 检测图像模糊性的设备和方法 Expired - Fee Related CN100433047C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR6422/2003 2003-01-30
KR1020030006422A KR100943595B1 (ko) 2003-01-30 2003-01-30 영상신호의 블러링 판단장치 및 방법

Publications (2)

Publication Number Publication Date
CN1525387A true CN1525387A (zh) 2004-09-01
CN100433047C CN100433047C (zh) 2008-11-12

Family

ID=32768584

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2004100025556A Expired - Fee Related CN100433047C (zh) 2003-01-30 2004-01-30 检测图像模糊性的设备和方法

Country Status (4)

Country Link
US (1) US7321690B2 (zh)
EP (1) EP1457927A3 (zh)
KR (1) KR100943595B1 (zh)
CN (1) CN100433047C (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102013101A (zh) * 2010-11-27 2011-04-13 上海大学 一种经过模糊后处理的置换篡改图像盲检测方法
CN101799291B (zh) * 2009-02-05 2012-06-27 义隆电子股份有限公司 光学追踪感应器成像品质的检测方法
WO2013107037A1 (en) * 2012-01-20 2013-07-25 Thomson Licensing Blur measurement
CN106611417A (zh) * 2015-10-20 2017-05-03 佳能株式会社 将视觉元素分类为前景或背景的方法及装置

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100977713B1 (ko) * 2003-03-15 2010-08-24 삼성전자주식회사 영상신호의 글자 인식을 위한 전처리 장치 및 방법
JP4484806B2 (ja) * 2005-11-30 2010-06-16 キヤノン株式会社 記録システム、記録方法、ホスト装置、プログラム、及び、コンピュータ可読媒体
JP4513764B2 (ja) * 2006-02-20 2010-07-28 セイコーエプソン株式会社 画像判定装置および画像判定方法
KR100720871B1 (ko) * 2006-06-20 2007-05-23 삼성전자주식회사 휴대용 단말기의 저 왜곡 표시 장치 및 방법
US8150191B2 (en) * 2008-10-14 2012-04-03 Interra Systems Inc. Method and system for calculating blur artifacts in videos using user perception threshold
WO2011153500A2 (en) 2010-06-04 2011-12-08 Aperio Technologies, Inc. System and method to determine slide quality of a digitized microscope slide
CN105184806A (zh) * 2015-10-15 2015-12-23 南京工程学院 一种度量图像模糊程度的方法
KR20210158261A (ko) * 2020-06-23 2021-12-30 삼성전자주식회사 비디오 품질 평가 방법 및 장치

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5920349A (en) * 1990-11-05 1999-07-06 Canon Kabushiki Kaisha Image pickup device
JP3272776B2 (ja) * 1992-07-28 2002-04-08 株式会社日立製作所 文字パターン認識方法
MY117289A (en) * 1996-01-17 2004-06-30 Sharp Kk Image data interpolating apparatus
JPH10233693A (ja) * 1996-12-16 1998-09-02 Canon Inc 画像処理方法及び装置並びに記憶媒体
JP3449209B2 (ja) 1998-02-10 2003-09-22 セイコーエプソン株式会社 画像表示装置およびその装置を備えた電子機器並びに画像表示方法
JP3416058B2 (ja) 1998-07-28 2003-06-16 日本電信電話株式会社 濃淡画像の文字抽出方法及びそのプログラムを記録した記録媒体
JP3784268B2 (ja) * 2001-03-29 2006-06-07 シャープ株式会社 画像特徴領域分割装置および画像特徴領域分割方法
JP2003018599A (ja) * 2001-07-04 2003-01-17 Matsushita Electric Ind Co Ltd 画像符号化装置および方法
US7054461B2 (en) * 2002-02-15 2006-05-30 Pitney Bowes Inc. Authenticating printed objects using digital watermarks associated with multidimensional quality metrics

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101799291B (zh) * 2009-02-05 2012-06-27 义隆电子股份有限公司 光学追踪感应器成像品质的检测方法
CN102013101A (zh) * 2010-11-27 2011-04-13 上海大学 一种经过模糊后处理的置换篡改图像盲检测方法
WO2013107037A1 (en) * 2012-01-20 2013-07-25 Thomson Licensing Blur measurement
US9280813B2 (en) 2012-01-20 2016-03-08 Debing Liu Blur measurement
CN106611417A (zh) * 2015-10-20 2017-05-03 佳能株式会社 将视觉元素分类为前景或背景的方法及装置
CN106611417B (zh) * 2015-10-20 2020-03-31 佳能株式会社 将视觉元素分类为前景或背景的方法及装置

Also Published As

Publication number Publication date
EP1457927A3 (en) 2006-11-29
KR100943595B1 (ko) 2010-02-24
US7321690B2 (en) 2008-01-22
US20040252890A1 (en) 2004-12-16
EP1457927A2 (en) 2004-09-15
CN100433047C (zh) 2008-11-12
KR20040069869A (ko) 2004-08-06

Similar Documents

Publication Publication Date Title
US8351699B2 (en) Methods and apparatus for auto image binarization
US7769206B2 (en) Finger/palm print image processing system and finger/palm print image processing method
EP1781041B1 (en) JPEG detectors and JPEG image history estimators
CN1127562A (zh) 视频信号编码方法及设备和视频信号译码设备
US7876959B2 (en) Methods and systems for identifying text in digital images
CN1275190C (zh) 用于校正图像中的对象歪斜的方法和装置
US8620080B2 (en) Methods and systems for locating text in a digital image
WO2010091494A1 (en) Method and system for determining structural similarity between images
CN1525387A (zh) 检测图像模糊性的设备和方法
CN115908154B (zh) 基于图像处理的视频后期颗粒噪声去除方法
CN1540576A (zh) 用于找出图像分割的最佳阈值的方法
CN112509026A (zh) 一种绝缘子裂缝长度识别方法
CN1761285A (zh) 一种去除视频孤立噪声点的方法
CN117011302B (zh) 一种基于煤矸识别的智能干选系统
CN1207673C (zh) 半色调点消除方法及其系统
CN1193618C (zh) 用于运动估算的预处理方法
CN1189030C (zh) 定位型混沌脆弱数字水印嵌入与提取方法
CN1275191C (zh) 用于扩展在图象中的字符区域的设备及方法
Ahmed et al. Contrast-distorted image quality assessment based on curvelet domain features
CN1542684A (zh) 三面滚动指纹的采集和拼接方法
CN1488119A (zh) 通过最近相邻分类滤波提高分辨率
US6970268B1 (en) Color image processing method and apparatus thereof
CN115359449A (zh) 一种转辙机道岔缺口图像的自动识别方法和系统
CN1864175A (zh) 数字信号中的水印检测
Peng et al. Multi-Purpose Forensics of Image Manipulations Using Residual-Based Feature.

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20081112

Termination date: 20160130

EXPY Termination of patent right or utility model