CN102915429B - 一种扫描图片匹配方法和装置 - Google Patents

一种扫描图片匹配方法和装置 Download PDF

Info

Publication number
CN102915429B
CN102915429B CN201110227936.4A CN201110227936A CN102915429B CN 102915429 B CN102915429 B CN 102915429B CN 201110227936 A CN201110227936 A CN 201110227936A CN 102915429 B CN102915429 B CN 102915429B
Authority
CN
China
Prior art keywords
scanned picture
picture
content area
pixels
sub blocks
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201110227936.4A
Other languages
English (en)
Other versions
CN102915429A (zh
Inventor
黄磊
任智杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hanwang Technology Co Ltd
Original Assignee
Hanwang Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hanwang Technology Co Ltd filed Critical Hanwang Technology Co Ltd
Priority to CN201110227936.4A priority Critical patent/CN102915429B/zh
Publication of CN102915429A publication Critical patent/CN102915429A/zh
Application granted granted Critical
Publication of CN102915429B publication Critical patent/CN102915429B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Analysis (AREA)

Abstract

本发明公开了一种扫描图片匹配方法和装置,属于图像处理领域,用以解决现有技术中的扫描图片匹配准确率不高且效率低下的问题。该扫描图片匹配方法包括:根据扫描图片的色彩信息,对所述扫描图片进行二值化处理;将二值化处理后的扫描图片分成多个像素块,并对每个像素块内所有像素对应的像素值进行或运算,得到每个像素块的或运算结果组成该扫描图片的下采样图片;将得到的下采样图片划分为多个像素区域,通过对每个像素区域中所有像素点的或运算结果求和,获得组成扫描图片的每个像素区域的特征信息;进一步计算所述扫描图片与待匹配图片的相似度,并判断所述扫描图片与待匹配图片是否匹配。

Description

一种扫描图片匹配方法和装置
技术领域
本发明涉及图像处理领域,特别涉及一种扫描图片匹配方法和装置。
背景技术
由于古代纸质文件存在易损坏和丢失等缺陷,而计算机存储可以对扫描图片进行永久性地数据保存,所以现在越来越多的古文件被扫描存储于计算机中。而且,不光是古文件,现在的很多纸质文件出于传输便利、共享方便等方面的考虑,也常常需要进行扫描后存储到计算机中。但是,由于文件本身的完整性和连续性,需要对扫描得到的图片进行重复性判断,即将扫描到的图片与计算机中已经存储的图片进行相似度比较,如果相似度过高,则认为该扫描图片是重复的,从而减少存储的冗余以及检阅时的不便。
例如,在实际应用中,需要对扫描得到的图片进行判断,判断是否为重复扫描图片。由于存在扫描背景差异、扫描硬件不同、带扫描图片搁置的角度不同、尺寸大小不同等因素,因此,直接利用扫描图片进行对应像素的相似度比较时往往会严重降低比较结果的准确度。
另外,目前在进行扫描图片的相似度比较时,往往是采用逐像素比较的方式,效率十分低下。
发明内容
本发明提供了一种扫描图片匹配方法和装置,用以解决现有技术中的扫描图片匹配准确率不高且效率低下的问题。
一种扫描图片匹配方法,包括:
根据扫描图片的色彩信息,对所述扫描图片进行二值化处理;
将二值化处理后的扫描图片划分成多个互不重叠的像素块,并对每个像素块内所有像素对应的像素值进行或运算,得到的或运算结果组成所述扫描图片的下采样图片;
将获得的下采样图片划分成多个像素区域,将每个像素区域中所有像素块的或运算结果之和作为该像素区域的特征信息,其中,每个像素区域包括至少两个像素;
根据获得的每个像素区域特征信息判断所述扫描图片与预置的待匹配图片是否匹配。
一种扫描图片匹配装置,包括:
二值化单元,用于根据扫描图片的色彩信息,对所述扫描图片进行二值化处理;
或运算单元,用于将二值化处理后的扫描图片分成多个像素块,并对每个像素块内所有像素对应的像素值进行或运算,得到每个像素块的或运算结果组成所述扫描图片的下采样图片;
特征提取单元,用于将得到的下采样图片划分成多个像素区域,通过对每个像素区域中所有像素块的或运算结果求和,获得组成扫描图片的每个像素区域的特征信息,其中,每个像素区域包括至少两个像素;
匹配单元,用于根据获得的每个像素区域的特征信息,判断所述扫描图片与预置的待匹配图片是否匹配。
本发明中,首先将扫描图片进行二值化处理,然后将二值化处理后的扫描图片分成多个像素块,并对每个像素块内的像素的像素值进行或运算,根据或运算结果,计算扫描图片与待匹配图片的匹配度。通过二值化处理,可以简化运算量,从而提高匹配效率;通过或运算,可以增强图片的有效信息,从而提高匹配准确度。
附图说明
图1为本发明一个实施例提供的扫描图片匹配方法流程图;
图2为本发明一个优选实施例中初始状态的扫描图片;
图3为本发明优选实施例中一个矩形子块的示意图;
图4(a)表示从左到右读取像素色度值时相邻的两个矩形子块之间的位置关系图;
图4(b)表示从上到下读取像素色度值时相邻的两个矩形子块之间的位置关系图;
图5为本发明优选实施例中确定出了内容区域的四个顶点的扫描图片;
图6为本发明优选实施例中去除背景区域后的扫描图片;
图7为本发明优选实施例中经过二值化处理后的扫描图片;
图8为本发明优选实施例中一个像素块的示意图;
图9为本发明实施例提供的扫描图片匹配装置结构示意图。
具体实施方式
本发明实施例提供了一种扫描图片匹配方法和装置,可以解决现有技术中的扫描图片匹配准确率不高且效率低下的问题。
本发明实施例提供了一种扫描图片匹配方法,如图1所示,包括:
S201:根据扫描图片的色彩信息,对所述扫描图片进行二值化处理。
其中,所述扫描图片的色彩信息包括:色度、亮度(即灰度)或饱和度等。
S202:将二值化处理后的扫描图片分成多个像素块,并对每个像素块内所有像素对应的像素值进行或运算,得到每个像素块的或运算结果组成该扫描图片的下采样图片。
其中,设置像素块的大小时,可以使每个像素块包含2×2个像素,本发明对此不作限定。在具体实施时,将像素块内的像素对应的像素值进行或运算,或运算的结果作为下采样图片的一个像素点的像素值。
S203:将得到的先采样图片划分为多个像素区域,通过对每个像素区域中所有像素点的或运算结果求和,获得组成扫描图片的每个像素区域的特征信息。
较佳的,为了缩小运算量,提高匹配效率,且降低存储空间,具体实施时,可以将或运算处理后的扫描图片分成多个像素区域,每个像素区域包含至少两个像素点;每个像素区域的特征作为扫描图片的一维特征。计算每个像素区域中所有像素点的或运算结果之和,得到每个像素区域的特征信息。具体实现时,所述像素区域的个数可以为4×4个,这样,将得到一个16维的统计特征。本发明对像素区域的个数不做限定,像素区域个数越多,得到的统计特征维数相应增加。
S204:根据获得的每个像素区域的特征信息,判断所述扫描图片与预置的待匹配图片是否匹配。
首先计算所述扫描图片与待匹配图片的相似度,再根据计算得到的相似度判断所述扫描图片与预置的待匹配图片相似度得分是否达到预设的相似度阈值,判断所述扫描图片与预置的待匹配图片是否匹配。其中,所述扫描图片与待匹配图片的相似度可以通过欧式距离或余弦距离进行计算。
根据步骤S203获得的所有像素区域的特征信息,计算所述扫描图片与预置的待匹配图片的相似度。另外,为了消除由于扫描图片尺寸不同所带来的差异,在得到每个像素区域的特征信息之后,还可以对所有像素区域的特征信息进行归一化处理,从而简化运算量,并消除由于扫描图片的尺寸差异产生的影响。
并且,当所述扫描图片包含背景区域时,在步骤S201之前,还可以先根据所述扫描图片的色彩信息,确定扫描图片的背景区域与内容区域,并去除所述扫描图片的背景区域。具体实现时,可以按照预设的顺序,以固定大小的矩形子块为单位,读取所述扫描图片中像素的色彩信息值,将所述矩形子块等分为上下左右四个子区域,每读取一个矩形子块之后,根据预设的顺序移动小于矩形子块尺寸的距离,继续读取下一个矩形子块,直至将所述扫描图片全部读取完毕;根据每个矩形子块的四个子区域中像素的色彩信息值与预设的第一色彩阈值之间的关系,分别确定每个矩形子块的每个子区域属于背景区域或内容区域;将四个子区域中只有一个子区域属于内容区域的矩形子块的中心点确定为内容区域的一个顶点:将只有左上方的子区域为内容区域的矩形子块的中心点确定为内容区域的右下顶点,将只有右上方的子区域为内容区域的矩形子块的中心点确定为内容区域的左下顶点,将只有左下方的子区域为内容区域的矩形子块的中心点确定为内容区域的右上顶点,将只有右下方的子区域为内容区域的矩形子块的中心点确定为内容区域的左上顶点;根据确定的内容区域的四个顶点的位置,确定出扫描图片的背景区域与内容区域。另外,如果去除所述扫描图片的背景区域之后,该扫描图片为倾斜状态,则还可以通过几何旋转的方式调整该扫描图片,使该扫描图片的两条边呈竖直状态。
本实施例中,首先将扫描图片进行二值化处理,然后将二值化处理后的扫描图片分成多个像素块,并对每个像素块内的像素的像素值进行或运算,根据或运算结果,计算扫描图片与待匹配图片的匹配度。通过二值化处理,可以简化运算量,从而提高匹配效率;通过或运算,可以增强图片的有效信息,从而提高匹配准确度。
下面以一个优选实施例详细描述一下本发明实施例提供的扫描图片匹配方法的具体流程。在本优选实施例中,以背景技术中提到的实际应用中的扫描图片为例进行说明。该方法包括以下步骤:
步骤一、确定扫描图片的背景区域和内容区域,并去除背景区域。
以图2所示的扫描图片为例进行说明,根据图2可以看出,在实际应用中得到的扫描图片(古籍扫描图片)包含背景区域31和内容区域32两部分。由于扫描古籍时需要将古籍放置在一定的位置,例如,放置在桌子上,这样,扫描得到的扫描图片中不仅包含古籍,而且还会包含放置古籍的桌子。其中,古籍才是扫描图片中真正需要处理的部分,也可以称为扫描图片的内容区域32;而桌子则是扫描图片的背景区域31,是实际处理中不需要的部分。因此,在本实施例中首先要确定扫描图片的背景区域和内容区域,从而去除背景区域。
确定扫描图片的背景区域和内容区域时,可以根据背景区域和内容区域的色彩差异来实现。例如,在本实施例中,由于古籍的颜色和背景的颜色明显不同,因此,可以将扫描图片变换到HSV色彩空间,得到扫描图片中每个像素的HSV信息,包括色度(H)、饱和度(S)和亮度(V)。然后,根据各个像素的色度值来确定出内容区域和背景区域。具体地,可以预先设定一个色度阈值,将色度值大于该色度阈值的像素确定为内容区域的像素,将色度值小于该色度阈值的像素确定为背景区域的像素。
为了获得扫描图片中各个像素的色度值信息,可以对扫描图片进行扫描,以读取扫描图片中各个像素的色度值。具体实现时,可以预先定义尺寸为m×n(单位:像素)的矩形子块,以矩形子块为单位对扫描图片进行扫描,即每次扫描一个矩形子块区域内的像素,读取这些像素的色度值。具体地,可以按照从左到右、从上到下的顺序进行扫描,当然,也可以采用其他预设的顺序进行扫描,只要能够对扫描图片进行完整扫描即可。并且,为了提高准确度,可以进一步将该矩形子块等分为上下左右四个子区域。如图3所示,将该矩形子块等分为A、B、C和D四个子区域,分别获取这四个子区域内的像素的色度值。每读取完一个矩形子块内的全部像素的色度值之后,从该矩形子块的位置开始,向右水平移动m1(m1<m)的距离,得到下一个矩形子块的位置,继续读取下一个矩形子块内的像素的色度值,并得到下一个矩形子块内的四个子区域内的像素的色度值。按照这样的方式,一直到读取完该水平方向上最右侧的像素。然后,重新回到扫描图片的最左侧,并向下竖直移动n1(n1<n)的距离,得到下一个矩形子块的位置,开始读取下一行像素的色度值。依照这样的方式,直至读取完该扫描图片的所有像素。由于m1<m,且n1<n,所以相邻的矩形子块之间是有一定的重叠区域的。较佳的,可以设置m1=m/2,且n1=n/2,这时,m1和n1分别等于每个子区域在相应方向上的边长,即每个子区域对应的距离。这时,读取像素色度值时各个矩形子块的划分如图4(a)和图4(b)所示。图4(a)表示从左到右读取像素色度值时两个相邻矩形子块间的位置关系图,其中,虚线框表示上一个矩形子块的位置,实线框表示当前矩形子块的位置,从图中可以看出,从左到右读取像素色度值时,当前矩形子块相对于上一个矩形子块向右平移了一个子区域对应的距离。图4(b)表示当读取完水平方向的一行像素之后,需要先按照从上到下的顺序开始读取下一行的像素色度值时两个相邻矩形子块间的位置关系图,其中,虚线框表示与当前矩形子块相邻且位于当前矩形子块上方的矩形子块的位置,实线框表示当前矩形子块的位置,从图中可以看出,当前矩形子块相对于上一行相邻的矩形子块向下平移了一个子区域对应的距离。得到所有矩形子块的各个子区域的色度值之后,根据预先设定的色度阈值,确定各个矩形子块的子区域分别属于内容区域还是背景区域。然后,确定只有一个子区域属于内容区域,而其余三个子区域属于背景区域的矩形子块,将这样的矩形子块的中心点作为内容区域的顶点:将只有左上方的子区域为内容区域的矩形子块的中心点确定为内容区域的右下顶点,将只有右上方的子区域为内容区域的矩形子块的中心点确定为内容区域的左下顶点,将只有左下方的子区域为内容区域的矩形子块的中心点确定为内容区域的右上顶点,将只有右下方的子区域为内容区域的矩形子块的中心点确定为内容区域的左上顶点。具体实现时,如果只有左上方的子区域为内容区域的矩形子块的个数超过一个,则将位置最靠右且最靠下的矩形子块的中心点确定为右下顶点,其他顶点的确定过程与之类似。确定出的四个顶点如图5中的黑色圆点所示。当确定出四个顶点的位置后,由于古籍图片一般为矩形,则可以直接根据顶点的位置确定出扫描图片的内容区域。然后,去除背景区域,仅保留内容区域,这时得到的图片如图6所示。
通过上面的步骤,就去除了扫描图片的背景区域,这时,由于只有内容区域的像素信息被保留下来,因此,扫描图片的尺寸也会相应缩小。
步骤二、对去除背景区域之后的扫描图片进行调整。
由于在扫描过程中,古籍搁置的角度不同,扫描图片的内容区域会出现不同程度的旋转,从而导致去除背景区域之后,该扫描图片为倾斜状态,这时,还可以根据四个顶点的位置信息,通过几何旋转的方式校正该扫描图片,使该扫描图片的两条边呈竖直状态,以消除古籍搁置角度不同所带来的影响。
步骤三、确定去除背景区域并调整后的扫描图片的特征信息。
首先,由于扫描文件纸张破损和新旧程度不同以及扫描的设备不同,导致扫描图片的内容区域的纸张色彩信息会有较大差异,因此,直接利用扫描图片的色彩信息来提取扫描图片的特征信息时,准确度不高,且计算量繁重。为消除文件纸张色彩信息对匹配的影响,并结合古代古籍主要为黑色毛笔手写的特征,在本步骤中,首先,需要对去除背景区域并调整后的扫描图片进行二值化处理,得到每个像素对应的像素值,即:通过设定的第二阈值将灰度信息二值化,例如,二值化之后灰度值为0的像素表示纸张背景,灰度值为1的像素表示手写笔迹。在本优选实施例中,经过二值化处理之后的扫描图片如图7所示,从图7中可以看出,经过二值化处理之后,扫描图片中的有效内容,即手写笔画被清晰的识别出来。假设去除背景区域并调整后的扫描图片的像素尺寸为M×N,则经过二值化处理后得到的是一个M×N的数组,数组中的每个元素表示对应位置像素的像素值。
然后,在扫描过程中,由于设备以及扫描压力不同,导致扫描图片中手写字体的色彩存在一定的误差,从视觉上来看就是同一扫描文件扫描出的图片中手写笔画深浅或粗细会有差异。因此,为了增强被削弱的手写笔画,在进行二值化处理之后,将扫描图片划分为若干个大小相同且互不重叠的像素块。例如,依然假设这时扫描图片的像素尺寸为M×N,像素块大小则可以设置为k×i,则通过划分,可以得到(M/k)×(N/i)个像素块。其中,k<M,i<N,且k和i分别可以被M和N整除。当然,如果在实际情况中,扫描图片的尺寸不规则,或者,很难找到合适的k和i的取值,也可以将扫描图片划分为若干个大小并不完全相同的像素块。在本实施例中,以k=2,i=2为例进行描述。这时,像素块如图8所示,每个像素块内包含a、b、c和d共4个像素,对每个像素块内的四个像素进行或运算,得到每个像素块的或运算结果。例如,假设一个像素块内a像素的像素值为0,b像素的像素值为1,c像素的像素值为0,d像素的像素值为1,则将四个像素对应的像素值进行或运算,计算0∪1∪0∪1(∪表示或运算)的值。也就是说,只要一个像素块的四个像素中有一个像素的像素值为1,即有一个代表笔画信息的像素点,则该像素块的或运算结果则为1,反之为0。由于像素值为1的像素代表的是手写笔画,因此,通过对每个像素块进行或运算,可以增强被削弱的手写笔画。进行或运算之后,得到的是一个(M/k)×(N/i)的数组,数组中的每个元素表示对应位置的像素块的或运算结果。将像素块的或运算结果作为一个像素点的像素值,经过子块或运算后,所有像素块的或运算结果组成了扫描图片的下采样图片。
最后,将或运算之后的扫描图片,即扫描图片的下采样图片,划分为若干个像素区域,每个像素区域包含至少两个像素。其中,在划分像素区域时,优选的,可使各个像素区域的大小相同,当然,在实际情况中,各个像素区域的尺寸也可以不同。计算每个像素区域中所有像素的或运算结果之和,作为每个像素区域的特征信息。也可以将所有像素区域的特征信息理解为该扫描图片的统计特征。例如,在本实施例中,可以分为4×4共16个像素区域,这样,将得到一个16维的统计特征。为了进一步简化计算量,并且消除由于扫描图片尺寸差异所带来的影响,还可以对得到的16维的统计特征进行归一化处理。
步骤四、计算所述扫描图片与待匹配图片的相似度,根据相似度计算结果判断所述扫描图片与待匹配图片是否匹配。
在进行两张或者多张扫描图片的匹配时,本发明首先通过上述过程得到每张扫描图片的一个16维的统计特征,然后利用相似度度量,如欧式距离、余弦距离等,计算得出扫描图片间的相似得分。在是否重复扫描的问题中,首先计算扫描图片与库中存储的待匹配图片的相似得分,当得分小于给定阈值时,则认为该次扫描为重复扫描,反之不是。
通过上述步骤,就完成了扫描图片的匹配。在本优选实施例中,首先根据色彩差异将带有背景区域的扫描图片中的背景区域去除,然后对去除背景区域之后的扫描图片进行一定的几何调整,从而消除由于扫描时图片倾斜放置所带来的影响。接下来,根据扫描图片的色彩特征,对经过上述处理后的扫描图片进行二值化处理,从而识别出其中的有效内容,也就是本实施例中的手写笔画。然后,通过对像素块进行或运算,进一步增强被削弱的手写笔画。最后,通过划分像素区域并统计每个像素区域内所包含的像素点的或运算结果,来得到扫描图片的统计特征,从而实现匹配。
在本优选实施例中,是以古籍的扫描图片为例进行说明的,但是,本领域技术人员应当理解,其他的扫描图片,如照片、书籍等也可以采用上述步骤实现匹配。并且,在本优选实施例中,去除背景区域时所依据的色彩信息为色度,对扫描图片进行二值化处理时所依据的色彩信息为亮度,但是,在实际情况中,根据扫描图片本身的特征,完全可以采用其它的色彩信息,如亮度、饱和度或对比度等来实现上述过程。
本发明实施例还提供了一种扫描图片匹配装置,如图9所示,包括:
二值化单元1101,用于根据扫描图片的色彩信息,对所述扫描图片进行二值化处理;
或运算单元1102,用于将二值化处理后的扫描图片分成多个像素块,并对每个像素块内所有像素对应的像素值进行或运算,得到每个像素块的或运算结果组成该扫描图片的下采样图片;
特征提取单元1103,用于将得到的下采样图片划分成多个像素区域,通过对每个像素区域中所有像素点的或运算结果求和,获得组成扫描图片的每个像素区域的特征信息;
匹配单元1104,用于根据获得的每个像素区域的特征信息,判断所述扫描图片与预置的待匹配图片是否匹配。
较佳的,所述特征提取单元1103用于:将或运算处理后的达到的扫描图片的下采样图片分成多个像素区域,每个像素区域包含至少两个像素点;计算每个像素区域中所有像素点的或运算结果之和,得到每个像素区域的特征信息;
较佳的,所述装置还包括:内容区域确定单元,用于当所述扫描图片包含背景区域时,根据所述扫描图片的色彩信息,确定扫描图片的背景区域与内容区域,并去除所述扫描图片的背景区域。
较佳的,所述内容区域确定单元用于:按照预设的顺序,以固定大小的矩形子块为单位,读取所述扫描图片中像素的色彩信息值,将所述矩形子块等分为上下左右四个子区域,每读取一个矩形子块之后,根据预设的顺序移动小于矩形子块尺寸的距离,继续读取下一个矩形子块,直至将所述扫描图片全部读取完毕;根据每个矩形子块的四个子区域中像素的色彩信息值与预设的第一色彩阈值之间的关系,分别确定每个矩形子块的每个子区域属于背景区域或内容区域;将四个子区域中只有一个子区域属于内容区域的矩形子块的中心点确定为内容区域的一个顶点:将只有左上方的子区域为内容区域的矩形子块的中心点确定为内容区域的右下顶点,将只有右上方的子区域为内容区域的矩形子块的中心点确定为内容区域的左下顶点,将只有左下方的子区域为内容区域的矩形子块的中心点确定为内容区域的右上顶点,将只有右下方的子区域为内容区域的矩形子块的中心点确定为内容区域的左上顶点;根据确定的内容区域的四个顶点的位置,确定出扫描图片的背景区域与内容区域。
通过采用本实施例提供的扫描图片匹配装置,首先将扫描图片进行二值化处理,然后将二值化处理后的扫描图片分成多个像素块,并对每个像素块内的像素的像素值进行或运算,根据或运算结果,计算扫描图片与待匹配图片的匹配度。通过二值化处理,可以简化运算量,从而提高匹配效率;通过或运算,可以增强图片的有效信息,从而提高匹配准确度。
虽然上面结合实施例对本发明进行了描述,但是对于本领域技术人员来说,可以理解的是,上述实施例仅出于举例的目的,不应认为以此限定本发明之保护范围。本发明的保护范围仅仅由后附的权利要求来限制。虽然上述说明中,为便于理解,对方法的步骤采用了顺序性描述,但是应当指出,对于上述步骤的顺序并不作严格限制。另外,实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于计算机可读取存储介质中,如:ROM/RAM、磁碟、光盘等。还有,附图或实施例中所示的装置结构仅仅是示意性地表示逻辑结构。其中作为分离部件显示的模块可能是或者可能不是物理上分开的,作为模块显示的部件也可能是或者可能不是物理模块。
另外,在权利要求书中,术语“包括”并不排除存在其它部件或步骤。此外,尽管在不同的权利要求中包括了各个特征,但是这些特征可以被有利地组合,且各个特征包含在不同的权利要求中并不意味着这些特征的组合是不可行的和/或不利的。此外,单个的含义不排除多个。因此,“一个”等的含义不排除多个。
另外,本领域技术人员在不脱离本发明精神的前提下可以对其进行修改、变化或替换,但是,依照本发明所作的各种等同变化,仍属于本发明所涵盖的范围。

Claims (5)

1.一种扫描图片匹配方法,其特征在于,包括:
根据扫描图片的色彩信息,对所述扫描图片进行二值化处理;
将二值化处理后的扫描图片划分成多个互不重叠的像素块,并对每个像素块内所有像素对应的像素值进行或运算,得到的或运算结果组成所述扫描图片的下采样图片;
将获得的下采样图片划分成多个像素区域,将每个像素区域中所有像素点的或运算结果之和作为该像素区域的特征信息,其中,每个像素区域包括至少两个像素点;
根据获得的每个像素区域特征信息判断所述扫描图片与预置的待匹配图片是否匹配;
其中,所述根据扫描图片的色彩信息,对所述扫描图片进行二值化处理之前,还包括:
当所述扫描图片包含背景区域时,根据所述扫描图片的色彩信息,确定扫描图片的背景区域与内容区域,并去除所述扫描图片的背景区域;其中,所述根据所述扫描图片的色彩信息,确定扫描图片的背景区域与内容区域,进一步包括:
按照预设的顺序,以固定大小的矩形子块为单位,获取所述扫描图片中像素的色彩信息值,将所述矩形子块等分为上下左右四个子区域,每获取一个矩形子块之后,根据预设的顺序移动小于矩形子块尺寸的距离,继续获取下一个矩形子块,直至将所述扫描图片全部获取完毕;
根据每个矩形子块的四个子区域中像素的色彩信息值与预设的第一色彩阈值之间的关系,分别确定每个矩形子块的每个子区域属于背景区域或内容区域;
将四个子区域中只有一个子区域属于内容区域的矩形子块的中心点确定为内容区域的一个顶点:将只有左上方的子区域为内容区域的矩形子块的中心点确定为内容区域的右下顶点,将只有右上方的子区域为内容区域的矩形子块的中心点确定为内容区域的左下顶点,将只有左下方的子区域为内容区域的矩形子块的中心点确定为内容区域的右上顶点,将只有右下方的子区域为内容区域的矩形子块的中心点确定为内容区域的左上顶点;
根据确定的内容区域的四个顶点的位置,确定出扫描图片的背景区域与内容区域。
2.如权利要求1所述的方法,其特征在于,所述将每个像素区域中所有像素点的或运算结果之和作为该像素区域的特征信息之后,进一步包括:对所有像素区域的特征信息进行归一化处理。
3.如权利要求1所述的方法,其特征在于,在去除扫描图片的背景区域之后,还包括通过几何旋转的方式校正扫描图片。
4.如权利要求1所述的方法,其特征在于,每个像素块包含2×2个像素。
5.一种扫描图片匹配装置,其特征在于,包括:
二值化单元,用于根据扫描图片的色彩信息,对所述扫描图片进行二值化处理;
或运算单元,用于将二值化处理后的扫描图片分成多个像素块,并对每个像素块内所有像素对应的像素值进行或运算,得到每个像素块的或运算结果,得到的或运算结果组成所述扫描图片的下采样图片;
特征提取单元,用于将得到的下采样图片划分成多个像素区域,通过对每个像素区域中所有像素块的或运算结果求和,获得组成扫描图片的每个像素区域的特征信息,其中,像素区域至少包含两个像素;
匹配单元,用于根据获得的每个像素区域的特征信息,判断所述扫描图片与预置的待匹配图片是否匹配;
其中,所述的装置,还包括:
内容区域确定单元,用于当所述扫描图片包含背景区域时,根据所述扫描图片的色彩信息,确定扫描图片的背景区域与内容区域,并去除所述扫描图片的背景区域;其中,所述内容区域确定单元进一步用于:
按照预设的顺序,以固定大小的矩形子块为单位,获取所述扫描图片中像素的色彩信息值,将所述矩形子块等分为上下左右四个子区域,每获取一个矩形子块之后,根据预设的顺序移动小于矩形子块尺寸的距离,继续获取下一个矩形子块,直至将所述扫描图片全部获取完毕;
根据每个矩形子块的四个子区域中像素的色彩信息值与预设的第一色彩阈值之间的关系,分别确定每个矩形子块的每个子区域属于背景区域或内容区域;
将四个子区域中只有一个子区域属于内容区域的矩形子块的中心点确定为内容区域的一个顶点:将只有左上方的子区域为内容区域的矩形子块的中心点确定为内容区域的右下顶点,将只有右上方的子区域为内容区域的矩形子块的中心点确定为内容区域的左下顶点,将只有左下方的子区域为内容区域的矩形子块的中心点确定为内容区域的右上顶点,将只有右下方的子区域为内容区域的矩形子块的中心点确定为内容区域的左上顶点;
根据确定的内容区域的四个顶点的位置,确定出扫描图片的背景区域与内容区域。
CN201110227936.4A 2011-08-04 2011-08-04 一种扫描图片匹配方法和装置 Active CN102915429B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201110227936.4A CN102915429B (zh) 2011-08-04 2011-08-04 一种扫描图片匹配方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110227936.4A CN102915429B (zh) 2011-08-04 2011-08-04 一种扫描图片匹配方法和装置

Publications (2)

Publication Number Publication Date
CN102915429A CN102915429A (zh) 2013-02-06
CN102915429B true CN102915429B (zh) 2015-08-26

Family

ID=47613791

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110227936.4A Active CN102915429B (zh) 2011-08-04 2011-08-04 一种扫描图片匹配方法和装置

Country Status (1)

Country Link
CN (1) CN102915429B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104765630B (zh) * 2015-04-10 2019-02-01 百度在线网络技术(北京)有限公司 软件安装方法及装置
CN105787048B (zh) * 2016-02-26 2019-04-12 北京金山安全软件有限公司 一种图片识别方法、装置及电子设备
CN107094198B (zh) * 2017-05-18 2020-07-03 广东小天才科技有限公司 一种拨号方法及装置、用户设备
CN107328775B (zh) * 2017-06-23 2020-12-01 广东小天才科技有限公司 一种自动螺钉机安装螺钉时的异常检测方法及装置
CN108664626A (zh) * 2018-05-14 2018-10-16 北京奇艺世纪科技有限公司 一种标题一致性检测方法、装置及电子设备

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6226414B1 (en) * 1994-04-20 2001-05-01 Oki Electric Industry Co., Ltd. Image encoding and decoding method and apparatus using edge synthesis and inverse wavelet transform
JP2007026386A (ja) * 2005-07-21 2007-02-01 Fuji Xerox Co Ltd 画像検索システム及び方法
CN102034231B (zh) * 2009-09-25 2012-06-06 汉王科技股份有限公司 图像序列配准方法

Also Published As

Publication number Publication date
CN102915429A (zh) 2013-02-06

Similar Documents

Publication Publication Date Title
CN106156761B (zh) 面向移动终端拍摄的图像表格检测与识别方法
CN102915429B (zh) 一种扫描图片匹配方法和装置
US20140097246A1 (en) Method and device for batch scanning 2d barcodes
US8995768B2 (en) Methods and devices for processing scanned book's data
JP5488530B2 (ja) 画像処理装置及び画像処理プログラム
US7593600B2 (en) Black white image scaling for optical character recognition
CN102567300A (zh) 图片文档的处理方法及装置
CN110647882A (zh) 图像校正方法、装置、设备及存储介质
CN102890826B (zh) 一种扫描版文档重排版的方法
US10423851B2 (en) Method, apparatus, and computer-readable medium for processing an image with horizontal and vertical text
CN102737240B (zh) 分析数字文档图像的方法
CN110443235B (zh) 一种智能纸质试卷总分识别方法及系统
CN104298947A (zh) 一种对二维条码精确定位的方法及装置
CN110807454A (zh) 基于图像分割的文字定位方法、装置、设备及存储介质
CN113436222A (zh) 图像处理方法、图像处理装置、电子设备及存储介质
CN108052936B (zh) 一种盲文图像自动倾斜校正方法及系统
US10586125B2 (en) Line removal method, apparatus, and computer-readable medium
CN109741273A (zh) 一种手机拍照低质图像的自动处理与评分方法
US20160180164A1 (en) Method for converting paper file into electronic file
CN111626145A (zh) 一种简捷有效的残缺表格识别及跨页拼接方法
CN107958261B (zh) 一种盲文点检测方法及系统
CA2790210A1 (en) Resolution adjustment of an image that includes text undergoing an ocr process
US10115031B1 (en) Detecting rectangular page and content boundaries from smartphone video stream
CN112070708A (zh) 图像处理方法、图像处理装置、电子设备、存储介质
CN108133205B (zh) 复制图像中文本内容的方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant