CN110008954A

CN110008954A - 一种基于多阈值融合的复杂背景文本图像提取方法及系统

Info

Publication number: CN110008954A
Application number: CN201910250571.3A
Authority: CN
Inventors: 王翊; 辛沐霖; 文静
Original assignee: Chongqing University
Current assignee: Chongqing University
Priority date: 2019-03-29
Filing date: 2019-03-29
Publication date: 2019-07-12
Anticipated expiration: 2039-03-29
Also published as: CN110008954B

Abstract

本发明公开了一种基于多阈值融合的复杂背景文本图像提取方法及系统。该方法包括：S1，获取原始图像，依据图像类别信息获取局部二值化参数；S2，将原始图像转换为灰度图像；S3，利用第一处理算法获取灰度图像基于边缘的第一二值图；利用第二处理算法基于局部二值化参数对灰度图像进行局部二值化处理得到第二二值图；S4，将第一二值图和第二二值图进行逻辑“或”操作后输出，提取出的文本图像。将基于边缘的第一二值图与局部二值化处理得到的第二二值图进行融合，有效弥补第二二值图中因去除噪声而使得前景文字丢失的缺陷，局部二值化参数依据待处理图像的类别设置，这样对于笔画较浅的文字，处理效果很出色，提升了二值化图像质量。

Description

一种基于多阈值融合的复杂背景文本图像提取方法及系统

技术领域

本发明涉及一种计算机视觉技术领域，特别是涉及一种基于多阈值融合的复杂背景文本图像提取方法及系统。

背景技术

我们日常生活中，每天都会产生无数份纸质文档，而很多情况下，我们的纸质文档都需要进行电子扫描并存储为电子文件。一方面由于部分纸质文档的保存条件不好，可能文档文件会沾染污渍，或者产生折痕，这样扫描出来的电子文档的质量不高；另一方面因为扫描设备的问题，也有可能产生光照不均，文档歪斜等问题；再一方面若遇到双面书写的纸质文档，在扫描时，也会出现背面的文字影射到正面的现象；由于上述几方面，使得文本图像具有污渍、折痕、光照不均、文档歪斜以及背面的文字影射等情况(复杂背景)，成为复杂背景文本图像，如图2所示，使电子文档图像难以辨识，为后续对电子文档图像进行进一步操作造成阻碍。因此，一般情况下，我们都会对电子文档图像进行二值化，以便明确区分前景和背景。

现有技术中存在两类基于阈值的二值化方法，分别为全局二值化(例如： Otsu阈值法)和局部二值化(例如：Niblack阈值法)。其中，全局二值化适用于前后背景存在明显差值的图像，但是，当图像光照不均时，全局二值化会丢失图像信息。局部二值化是将图像分块进行二值化，因此对于退化和光照不均的图片，可以获得较好结果，但其对杂质敏感，导致最后的二值化图像噪声偏多。

现有技术中提供了一种通过多种二值化图像融合实现各种二值化方法优势互补的方法，主要是基于不同的阈值或者不同的方法获得多个二值图，对于如何将多个二值图融合，目前有两种使用较为广泛的方法，一种是基于投票机制法，一种是基于像素分类法。

投票机制是对多个二值图的同一个像素点进行取值判断，当有一半以上的值为前景像素则融合后为前景像素，反之为背景像素。这种方法没有考虑不同二值图之间的关系，而是直接统计个数。例如当进行融合的多个二值图中，基于全局二值化思想的方法多些，则这样直接统计个数，对数目偏少的局部二值化方法则不合理。

基于像素分类法是采用两种二值化方法获得两个二值图，当这两个二值图对应的像素值都为前景像素则为前景，都为背景像素则都为背景像素，当两个二值图对应的像素值一个为前景一个为后景则为不确定像素点，因此分为前景像素，后景像素和不确定像素，然后对不确定像素进行分类。以不确定像素为中心，向周围局部范围进行迭代，当局部范围内前景像素总和大于背景像素总和则其判别为前景像素，反之为后景像素，当总和相同，则扩大局部范围进行判断，这个方法是基于一种聚类的假设，认为相同类别的像素之间应该更加接近，由于文档图像虽然经过归一化后也能达到相同大小，但是此时里面的字符则不一样，无法达到一致的标准，因此不能简单用上面的二值化方法进行二值化，其效果并不好。

发明内容

本发明旨在至少解决现有技术中存在的技术问题，特别创新地提出了一种基于多阈值融合的复杂背景文本图像提取方法及系统。

为了实现本发明的上述目的，根据本发明的第一方面，本发明提供了一种基于多阈值融合的复杂背景文本图像提取方法，包括：

步骤S1，获取原始图像，得到图像类别信息，依据图像类别信息获取局部二值化参数；

步骤S2，将原始图像转换为灰度图像；

步骤S3，利用第一处理算法获取灰度图像基于边缘的第一二值图；利用第二处理算法基于局部二值化参数对灰度图像进行局部二值化处理得到第二二值图；

步骤S4，将第一二值图和第二二值图进行逻辑“或”操作后输出，即为提取出的文本图像。

上述技术方案的有益效果为：将基于边缘的第一二值图与局部二值化处理得到的第二二值图进行融合，能够有效的弥补第二二值图中因去除噪声而使得前景文字丢失的缺陷，另外，局部二值化参数依据待处理图像的类别设置，不同类型的图像，选取不同的局部二值化参数，这样对于笔画较浅的文字，处理效果很出色，提升了二值化之后的图像质量。该方法实现了局部二值化与基于边缘的二值化方法的有效互补，能够对多样化的文档图像进行有效的二值化，从而确保电子文档存储与审核系统的较高准确率，为电子文档的存储与审核提供了更为准确清晰的电子档案。

在本发明的一种优选实施方式中，在所述步骤S1中所述图像类别信息包括背景颜色类别、亮度大小类别或清晰度高低类别中的一个或几个。

上述技术方案的有益效果为：设置了图像信息中比较重要的主要特征作为类别判定信息，能够准确的表征图像的背景特征。

在本发明的一种优选实施方式中，判断所述背景颜色类别的过程包括：

将原始图像转换为YCbCr色彩空间图像，提取YCbCr色彩空间图像的Cb通道图像矩阵；

判断不等式mean(Cb>A)<0.9是否为真，若为真，认为原始图像的背景为非白色，若不为真，认为原始图像的背景为白色；

其中，mean()表示计算括号内矩阵的平均值，Cb表示图像的Cb通道图像矩阵，Cb>A得到的是一个只有0和1的布尔型矩阵，mean(Cb>A)<0.9表示Cb 通道图像矩阵中像素值大于A的像素点个数占Cb通道图像矩阵像素点总数的比例小于90％，A为背景像素判定阈值，为正整数；

判断所述亮度大小类别的过程为：

计算原始图像的平均像素值；

当原始图像的背景为白色时，若平均像素值大于B，则认为原始图像的亮度为高亮度，否则为低亮度；当原始图像的背景为非白色时，若平均像素值大于C，则认为原始图像的亮度为高亮度，否则为低亮度；0＜C＜B，其中，B、C均为平均像素判定阈值。

上述技术方案的有益效果为：提供了快速有效判断出图像背景颜色类别、亮度大小类别的方法。

在本发明的一种优选实施方式中，判断原始图像的清晰度高低类别的过程包括为：

步骤S10，构建并利用n*n高斯高斯滤波器对原始图像进行滤波得到滤波图像；所述n为正整数；

步骤S11，利用Sobel算子获得原始图像的第一梯度图像，利用Sobel算子获得滤波图像的第二梯度图像；

步骤S12,计算原始图像与第一梯度图像的结构相似性指数，计算滤波图像与第二梯度图像的结构相似性指数，求取两个结构相似性指数的平均值作为平均结构相似性指数mSSIM，计算梯度结构相似度NRSS，计算公式为： NRSS＝1-mSSIM；

若NRSS<D，认为原始图像清晰度高，否则认为原始图像清晰度低，其中，D 为清晰度判定阈值，0.0001＜D＜0.002。

上述技术方案的有益效果为：提供了准确判断出图像清晰度高低类别的一种方法。

在本发明的一种优选实施方式中，在所述步骤S1中，依据图像类别信息获取局部二值化参数的步骤包括：

所述局部二值化参数包括局部二值化的切割阈值T_s，获取局部二值化的切割阈值T_s的公式为：

T_s＝threshold1*xs1+xs2*deviation；

其中，threshold1为第二处理算法的初始分割阈值；deviation为偏差值；xs1和xs2分别为线性调整的系数值，均根据图像类别信息取值；

所述deviation的计算公式为：

deviation＝(meanSquare-mean²)^0.5，其中，meanSquare为原始图像平方操作后的二维均值滤波值，mean为原始图像的二维均值滤波值；

所述threshold1的计算公式为：

其中，R为deviation矩阵中的最大值；k为修正系数，0＜k＜1；

所述xs1和xs2的取值公式为：

上述技术方案的有益效果为：提供了根据原始图像类别信息获得局部二值化参数的方法，该方法简单，运算量少。

在本发明的一种优选实施方式中，所述步骤S2包括：

步骤S20,按照如下转换公式将原始图像转换为灰度图像：

Gray＝R×0.3+G×0.59+B×0.11；

其中，R，G，B分别代表原始图像中像素点在RGB空间中的红、绿、蓝三个通道分量，Cray为灰度图像中对应像素点的像素值；

步骤S21,对所述步骤S21的灰度图像进行边缘增强，具体包括：

对灰度图像进行水平扫描和/或竖直扫描卷积操作，获取相应的边缘增强的灰度图像，具体的卷积算子为：

竖直扫描卷积算子：

水平扫描卷积算子：

步骤S22,对所述步骤S21输出的边缘增强的灰度图像进行滤波降噪处理。

上述技术方案的有益效果为：能够将原始图像快速转换为灰度图像，对灰度图像进行边缘加强，有利于提高后续基于边缘的二值化处理的边缘效果。

在本发明的一种优选实施方式中，所述步骤S2还包括：

步骤S23,利用归一化公式对灰度图像进行归一化处理：

归一化公式如下：

其中x_max为灰度图像的最大像素值，x_min为灰度图像的最小像素值，x^*为归一化后像素点的像素值。

上述技术方案的有益效果为：有利于后续处理。

在本发明的一种优选实施方式中，在所述步骤S3中，利用第一处理算法获取灰度图像基于边缘的第一二值图的步骤包括：

步骤S30，使用Canny算法计算得到灰度图像的边缘信息；

步骤S31，求取边缘像素点邻域内最大像素值和最小像素值的平均值，将平均值作为该像素点邻域的二值化阈值，通过二值化阈值区分出像素点邻域内的前景像素点和背景像素点；

步骤S32，按照步骤S31完成灰度图像边缘上所有像素点邻域的二值化，获得第一二值图。

上述技术方案的有益效果为：公开了获取基于边缘的二值图的方法，该方法不容易受噪声干扰，能够检测到真正的弱边缘，另外通过增强边缘，然后二值化，可以确保更多字符信息保留。

在本发明的一种优选实施方式中，所述第二处理算法对灰度图像进行局部二值化处理包括：

求取原始图像的亮度背景图像，将原始图像减去亮度背景图像得到文本图像，在文本图像上依次以像素点为中心，在像素点的邻域内以根据原始图像类别信息得到的局部二值化参数作为切割阈值进行二值化处理，直至完成整个文本图像的二值化。

上述技术方案的有益效果为：对不同类别的文档图像二值化效果有显著增强，且稳定性很好。

为了实现本发明的上述目的，根据本发明的第二方面，本发明提供了一种图像处理系统，包括图像输入装置和图像处理器，所述图像输入装置将复杂背景文本图输入至图像处理器，所述图像处理器按照本发明所述的图像提取方法从原始图像中提取出文本图像。

上述技术方案的有益效果为：具有本发明所述的图像提取方法的有益效果。

附图说明

图1是本发明一具体实施方式中图像提取方法的流程示意图；

图2是具有复杂背景的原始文本图像；

图3是本发明一具体实施方式中边缘增强灰度图像的效果对比图，其中，图3(a)为三个原始图像，图3(b)为图3(a)中的三个原始图像经过灰度和边缘增强处理后的图像；

图4是本发明一具体实施方式中原始图像与本发明所述的图像提取方法提取得到的文本图像的对比图，其中，图4(a)为三个原始图像，图4(b)为使用本发明所述的图像提取方法从图4(a)中提取得到的三个文本图像。

具体实施方式

下面详细描述本发明的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，仅用于解释本发明，而不能理解为对本发明的限制。

在本发明的描述中，需要理解的是，术语“纵向”、“横向”、“上”、“下”、 “前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底” “内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。

在本发明的描述中，除非另有规定和限定，需要说明的是，术语“安装”、 “相连”、“连接”应做广义理解，例如，可以是机械连接或电连接，也可以是两个元件内部的连通，可以是直接相连，也可以通过中间媒介间接相连，对于本领域的普通技术人员而言，可以根据具体情况理解上述术语的具体含义。

本发明提供了一种基于多阈值融合的复杂背景文本图像提取方法，在一种优选实施方式中，如图1所示，该方法包括：

步骤S2，将原始图像转换为灰度图像；

在本实施方式中，第二处理算法优选但不限于为Sauvola算法。原始图像一般为彩色图像。局部二值化参数包括局部窗口大小和切割阈值两个典型的参数。经过该方法提取出的图像与原始图像的对比如图4所示。

在本实施方式中，将第一二值图设定为Output1，将第二二值图设定为 Output2，将这两幅图进行逻辑‘或’操作，通过下面的公式，我们可以得到最终的二值化结果，即提取的最终文本图像，

Output＝Output1|Output2。

在本发明的一种优选实施方式中，在骤S1中图像类别信息包括背景颜色类别、亮度大小类别或清晰度高低类别中一个或几个。

在本实施方式中，优选的，将一个原始图像分为多个图像区域，对每个图像区域进行图像类别判断，每个图像区域根据各自的图像类别获得局部二值化参数，依据该局部二值化参数进行二值化处理获得第二子图，另外，对每个图像区域获得基于边缘的二值化的第一子图，多个第一子图组合为第一二值图，多个第二子图组合为第二二值图。这样能够对一个原始图像进行分区域处理，获得局部优化处理，提取出的文本图像将更精准。

在本发明的一种优选实施方式中，判断背景颜色类别的过程包括：

其中，mean()表示计算括号内矩阵的平均值，CB表示图像的Cb通道图像矩阵，CB>A得到的是一个只有0和1的布尔型矩阵，mean(CB>A)<0.9表示Cb 通道图像矩阵中像素值大于A的像素点个数占Cb通道图像矩阵像素点总数的比例小于90％，A为背景像素判定阈值，为正整数,A优选的在110至130中，可选择120。

由于不论背景是什么样的颜色，都会在YCbCr空间中的Cb和Cr通道得到体现，因此，也可以通过Cr通道图像矩阵来判断原始图像的背景是否存在颜色，即为白色或非白色。优选的，将Cb通道图像矩阵和Cr通道图像矩阵相加得到图像矩阵M，判断不等式mean(M>A)<0.9是否为真，若为真，认为原始图像的背景为非白色，若不为真，认为原始图像的背景为白色。

判断亮度大小类别的过程为：

计算原始图像的平均像素值；

当原始图像的背景为白色时，若平均像素值大于B，则认为原始图像的亮度为高亮度，否则为低亮度；当原始图像的背景为非白色时，若平均像素值大于C，则认为原始图像的亮度为高亮度，否则为低亮度；0＜C＜B，其中，B、C均为平均像素判定阈值。B和C可在180-250之间选择，优选的，B为210，C为200。

在本实施方式中，原始图像包括但不限于老旧的中文档案图像，根据背景颜色、亮度、对比度以及清晰度等图像属性，将数据集内的文档图像分成若干类，例如：背景为黄色纸张或者白色纸张，图像亮度过明或者过暗等等。因此我们需要将原始输入的RGB三通道彩色图像转换为YCbCr格式的图像。YCbCr是通过有序的三元组来表示的，三元由Y(Luminance)、Cb(Chrominance-Blue)和 Cr(Chrominance-Red)组成，其中Y表示颜色的明亮度和浓度，而Cb和Cr则分别表示颜色的蓝色浓度偏移量和红色浓度偏移量。

步骤S10，构建并利用n*n高斯高斯滤波器对原始图像进行滤波得到滤波图像；n为正整数，优选的，n为7；

若NRSS<D，认为原始图像清晰度高，否则认为原始图像清晰度低，其中，D 为清晰度判定阈值，0.0001＜D＜0.002，优选的，D可为0.001。

优选的，图像类别信息还包括噪声大小，对原始图像进行噪声估计，获得噪声估计值，若噪声估计值大于E，则认为该原始图像噪声大，否则认为该原始图像噪声小，E为噪声判定阈值。对于图像噪声大的原始图像，其局部二值化参数中的平滑窗口小于图像噪声小的原始图像的平滑窗口，这样能够能够根据原始图像的噪声特性自适应匹配滑动窗口，即噪声少就用大窗口加快速度，噪声多就用小窗口确保精细。图像噪声估计的算法可参考现有技术CN104103039B和 CN102118546B中的方法。

在本发明的一种优选实施方式中，在步骤S1中，依据图像类别信息获取局部二值化参数的步骤包括：

局部二值化参数包括局部二值化的切割阈值T_s，获取局部二值化的切割阈值 T_s的公式为：

T_s＝threshold1*xs1+xs2*deviation；

deviation的计算公式为：

threshold1的计算公式为：

其中，R为deviation矩阵中的最大值；k为修正系数，0＜k＜1；

xs1和xs2的取值公式为：

在本发明的一种优选实施方式中，步骤S2包括：

步骤S20,按照如下转换公式将原始图像转换为灰度图像：

Gray＝R×0.3+G×0.59+B×0.11；

步骤S21,对步骤S21的灰度图像进行边缘增强，具体包括：

竖直扫描卷积算子：

水平扫描卷积算子：

步骤S22,对步骤S21输出的边缘增强的灰度图像进行滤波降噪处理。

原始图像灰度处理前后的对比如图3所示。

在本发明的一种优选实施方式中，步骤S2还包括：

步骤S23,利用归一化公式对灰度图像进行归一化处理：

归一化公式如下：

其中x_max为灰度图像的最大像素值，x_min为灰度图像的最小像素值，将原始数据线性化的方法转换到[0 1]的范围，x^*为归一化后像素点的像素值。

在本发明的一种优选实施方式中，在步骤S3中，利用第一处理算法获取灰度图像基于边缘的第一二值图的步骤包括：

步骤S30，使用Canny算法计算得到灰度图像的边缘信息；

在本实施方式中，首先通过图像的边缘信息进行二值化，如果像素点是边缘像素点，那么应该能够在其邻域中找到前景像素点和背景像素点。然后，对于每个像素点，我们计算以该像素点为中心的窗口上的灰度值的平均值作为其局部二值化的阈值。由于图像分辨率的问题，前景像素点可以靠近边缘或远离边缘。因此，这种平均过程需要足够大的窗口，该过程中需要滑动窗口大于前景文字的笔画宽度。

具体整体流程为：输入灰度图像后，使用Canny算法计算得到图像边缘信息，对于每一个边缘像素点，分别计算该像素点的邻域内的最大灰度值以及最小灰度值，通过这两个值，可以得到这两个值的平均值并将其作为二值化的阈值，因此可以将该区域的像素点分为前景像素点以及背景像素点。基于边缘的二值化方法通过增强边缘，然后二值化，可以确保更多字符信息保留。

在本发明的一种优选实施方式中，第二处理算法对灰度图像进行局部二值化处理包括：

求取原始图像的亮度背景图像，将原始图像减去亮度背景图像得到文本图像，在文本图像上依次以像素点为中心，在像素点的邻域内以根据原始图像类别信息得到的局部二值化参数作为切割阈值进行二值化处理，直至完成整个文本图像的二值化。对不同种类的文档图像二值化效果有显著增强，且稳定性很好。

在本实施方式中，亮度背景图像的获取过程可以为：手动获取原始图像中多个背景像素点的像素值的平均值，将该平均值赋值给所有像素点作为像素值，即获得亮度背景图像。亮度背景图像的获取过程还可以为：将原始图像转换为 HSV颜色空间图像，获取V通道图像中全部像素点像素值的平均值，将亮度背景图像中的所有像素点的像素值赋值为该平均值。

本发明还提供了一种图像处理系统，包括图像输入装置和图像处理器，图像输入装置将复杂背景文本图输入至图像处理器，图像处理器按照本发明所述的图像提取方法从原始图像中提取出文本图像。

在本实施方式中，图像处理器优选但不限于为PC电脑、嵌入式系统等，图像输入装置优选但不限于为图像采集卡等。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、 “具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不一定指的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

尽管已经示出和描述了本发明的实施例，本领域的普通技术人员可以理解：在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型，本发明的范围由权利要求及其等同物限定。

Claims

1.一种基于多阈值融合的复杂背景文本图像提取方法，其特征在于，包括：

步骤S2，将原始图像转换为灰度图像；

2.如权利要求1所述的基于多阈值融合的复杂背景文本图像提取方法，其特征在于，在所述步骤S1中图像类别信息包括背景颜色类别、亮度大小类别或清晰度高低类别中的一个或几个。

3.如权利要求2所述的基于多阈值融合的复杂背景文本图像提取方法，其特征在于，判断所述背景颜色类别的过程包括：

其中，mean()表示计算括号内矩阵的平均值，Cb表示图像的Cb通道图像矩阵，Cb>A得到的是一个只有0和1的布尔型矩阵，mean(Cb>A)<0.9表示Cb通道图像矩阵中像素值大于A的像素点个数占Cb通道图像矩阵像素点总数的比例小于90％，A为背景像素判定阈值，为正整数；

判断所述亮度大小类别的过程为：

计算原始图像的平均像素值；

4.如权利要求2所述的基于多阈值融合的复杂背景文本图像提取方法，其特征在于，判断原始图像的清晰度高低类别的过程包括为：

步骤S12,计算原始图像与第一梯度图像的结构相似性指数，计算滤波图像与第二梯度图像的结构相似性指数，求取两个结构相似性指数的平均值作为平均结构相似性指数mSSIM，计算梯度结构相似度NRSS，计算公式为：

NRSS＝1-mSSIM；

若NRSS<D，认为原始图像清晰度高，否则认为原始图像清晰度低，其中，D为清晰度判定阈值，0.0001＜D＜0.002。

5.如权利要求2所述的基于多阈值融合的复杂背景文本图像提取方法，其特征在于，在所述步骤S1中，依据图像类别信息获取局部二值化参数的步骤包括：

T_s＝threshold1*xs1+xs2*deviation；

所述deviation的计算公式为：

所述threshold1的计算公式为：

其中，R为deviation矩阵中的最大值；k为修正系数，0＜k＜1；

所述xs1和xs2的取值公式为：

6.如权利要求1所述的基于多阈值融合的复杂背景文本图像提取方法，其特征在于，所述步骤S2包括：

步骤S20,按照如下转换公式将原始图像转换为灰度图像：

Gray＝R×0.3+G×0.59+B×0.11；

步骤S21,对所述步骤S21的灰度图像进行边缘增强，具体包括：

竖直扫描卷积算子：

水平扫描卷积算子：

7.如权利要求1所述的基于多阈值融合的复杂背景文本图像提取方法，其特征在于，所述步骤S2还包括：

步骤S23,利用归一化公式对灰度图像进行归一化处理：

归一化公式如下：

8.如权利要求1所述的基于多阈值融合的复杂背景文本图像提取方法，其特征在于，在所述步骤S3中，利用第一处理算法获取灰度图像基于边缘的第一二值图的步骤包括：

步骤S30，使用Canny算法计算得到灰度图像的边缘信息；

9.如权利要求1所述的基于多阈值融合的复杂背景文本图像提取方法，其特征在于，所述第二处理算法对灰度图像进行局部二值化处理包括：求取原始图像的亮度背景图像，将原始图像减去亮度背景图像得到文本图像，在文本图像上依次以像素点为中心，在像素点的邻域内以根据原始图像类别信息得到的局部二值化参数作为切割阈值进行二值化处理，直至完成整个文本图像的二值化。

10.一种图像处理系统，其特征在于，包括图像输入装置和图像处理器，所述图像输入装置将复杂背景文本图输入至图像处理器，所述图像处理器按照权利要求1-9之一所述的图像提取方法从原始图像中提取出文本图像。