CN108604300A

CN108604300A - 从具有非均匀背景内容的电子扫描图像中提取文档页面图像

Info

Publication number: CN108604300A
Application number: CN201680080460.7A
Authority: CN
Inventors: D·M·贝范格; 查理斯·贾; 吴枫; 吴一枫
Original assignee: Hewlett Packard Development Co LP
Current assignee: Hewlett Packard Development Co LP
Priority date: 2016-04-28
Filing date: 2016-04-28
Publication date: 2018-09-28
Anticipated expiration: 2036-04-28
Also published as: EP3449420A4; EP3449420A1; CN108604300B; US20200274990A1; WO2017188960A1; US10893167B2

Abstract

一种技术包括获取表示通过抵靠背景对页面进行电子扫描产生的第一图像的数据。第一图像包含非均匀背景内容，该非均匀背景内容至少部分地归因于背景非均匀所引入的变化。该技术包括从第一图像中提取页面的图像，其中该提取包括将第一图像的背景内容特性化；至少部分地基于特性化的背景内容识别与页面相关联的候选像素；以及至少部分地基于识别的候选像素和用于页面的边界的模型，确定页面的边界。

Description

从具有非均匀背景内容的电子扫描图像中提取文档页面图像

背景技术

文档扫描系统可以包括图像捕获装置，该图像捕获装置用于产生针对由系统扫描文档页面或文档页的反射介质的反射率的空间变化的数字表示。捕获装置可以是例如接触式图像传感器(CIS)系统，其可以包括各种色彩的发光二极管(LED)的光源、分散光导和杆状透镜阵列。此外，CIS系统可以包括电荷耦合器件(CCD)半导体封装件或芯片，其可以端对端地布置以形成光敏元件阵列。CIS系统还可以包括用于将由光敏信号提供的信号转换为表示数字像素值的数据的硬件。

附图说明

图1是根据示例实施方式的用于扫描文档页面的电子扫描系统的示意图。

图2是根据示例实施方式的图1的扫描系统的辊的透视图。

图3、图4和图6是描绘根据示例实施方式的提取由扫描系统扫描文档页面的图像的技术的流程图。

图5A示出了根据示例实施方式的包含文档页面和背景内容的图像的扫描合成图像。

图5B示出了根据示例实施方式的从图5A的合成图像导出的较低分辨率缩略图像。

图5C示出了根据示例实施方式的与合成图像的背景内容相关联的扫描仪响应。

图5D示出了根据示例实施方式的在处理以移除特性化的背景内容之后的图5B的缩略图像。

图5E描绘了根据示例实施方式的缩略图像的进一步处理以对缩略图像的像素强度进行二值化。

图5F描绘了根据示例实施方式的噪声清除之后的二值化缩略图像。

图5G示出了根据示例实施方式的与文档页面图像的边界的相对粗略近似相关联的边界像素的识别。

图5H示出了根据示例实施方式的页面边界模型的初始化。

图5I和图5J示出了根据示例实施方式的使用最小二乘拟合技术的页边界模型来细化文档页面图像的边界的近似。

图5K示出了根据示例实施方式的提取的文档页面图像。

具体实施方式

设计文档扫描系统的一种方式是包括递送表示扫描文档页面的图像的数据的特征，使得图像的不表示文档页面的所有像素表示已知的背景响应。例如，一种解决方案可以是构造文档扫描系统以递送表示扫描图像的数据，其中图像的与扫描文档页面有关的部分之外的内容是均匀的(例如，均匀的白色背景)。

然而，其他文档扫描系统可能不递送表示具有此类均匀背景内容的扫描图像的数据。例如，文档扫描系统可以是紧凑系统，例如使用滚动式进纸设备的系统，并且在扫描期间直接抵靠支撑文档页面的进纸辊对文档页面进行成像。结果，由此类文档扫描系统递送的数据可以表示叠加在非均匀背景上的文档页面的图像。非均匀背景可能对数据的后续扫描和复制处理提出挑战，因为精确提取扫描文档页面的图像可能具有挑战性。

根据本文描述的示例实施方式，构造抵靠非均匀背景进行扫描的文档扫描系统以处理获取的扫描数据从而提取扫描文档页面的图像(本文中称为“文档页面图像”、“文档图像”、“页面图像”，等等)。更具体地，如本文所述，根据示例实施方式，文档扫描系统获取表示扫描文档页面和非均匀背景内容的合成图像的数据。扫描系统处理数据以将背景内容特性化并将页面边界模型应用于文档页面，以便确定合成图像中的文档页面的边界。然后，扫描系统可以至少部分地基于确定的边界从合成图像中提取文档页面的图像。

参考图1，作为更具体的示例，扫描系统100可以包括扫描传感器阵列和光学器件124，其感测来自文档页面的反射照明。对于图1描绘的示例实施方式，扫描系统100具有壳体101，扫描传感器阵列和光学器件124以及系统100的其他部件设置在壳体101中；并且壳体101包含输入槽102，其中待扫描文档页面被供给到输入槽102中。应注意，根据进一步的实施方式，扫描系统100可以采用其他形式并使用另一种类型的输入进纸器。

扫描传感器阵列和光学器件124可以包括线性传感器，例如，由例如端对端布置的CCD半导体封装件形成的传感器。根据示例实施方式，扫描系统100可以是滚动式进纸设备，其中文档页面被供给到输入槽102中并且由接触文档页面的一个或多个辊110推进。

根据示例实施方式，扫描传感器阵列和光学器件124直接抵靠辊110对文档页面进行成像。以这种方式，参考图2并结合图1，根据示例实施方式，对文档页面进行成像所抵靠的辊110可以是分段辊，其被构造成围绕纵向轴线203旋转以推进正被扫描的文档页面，并且辊110包括夹持文档页面并推进文档页面通过扫描系统100的滚柱(tire)200。如图2所示，辊110可以包括相邻滚柱200之间的间隙202。作为示例，滚柱200可以是深色(例如黑色)橡胶滚柱(即，滚柱200可以通常呈现非反射的成像表面)，并且间隙202可以暴露反射表面(例如，白色表面)。这导致由扫描系统100获取的扫描合成图像的非均匀背景。

应注意，图2的辊110是表面的示例，可以抵靠该表面对文档页面进行扫描以将非均匀背景内容赋予所得到的扫描合成图像。尽管根据示例实施方式，该示例非均匀背景内容具有由相对较小的较亮区域分隔的较大较暗区域，但相反的情况可能是真实的。此外，根据进一步的实施方式，非均匀背景内容可以不是重复的图案。通常，“非均匀背景内容”或“非均匀背景”意味着背景内容/背景是异构的，即，不与相同的像素色彩或像素强度相关联。

返回参考图1，文档扫描系统100可以包括页面传感器140，其用于感测扫描文档页面的后边缘(或其他边缘)。使用页面传感器140的输出，扫描系统100可以检测何时正在扫描纯背景内容(即，扫描系统100可以检测何时正在清楚地扫描分段辊110而不是正在扫描文档页面)。文档扫描系统100可以包括通信端口142(作为示例，通用串行总线(USB)或以太网端口)，其用于将表示提取的图像的数据传送到计算设备(台式计算机、平板计算机、膝上型计算机等等)。

如本文所述，扫描系统100可以包括一个或多个处理核132(作为示例，一个或多个中央处理单元(CPU)核)和存储器134。作为示例，存储器134可以是由半导体存储器设备、相变存储器设备、磁存储设备、记忆电阻器、这些或其他存储设备中的两个或更多个的组合等形成的非瞬态存储介质。存储器134可以存储程序指令138(即，机器可执行指令或“软件”)和数据136。作为示例，数据136可以是图像数据；或者与本文描述的任何图像处理技术相关联的初步、中间和/或最终结果数据。

根据示例实施方式，程序指令138在由(多个)处理核132执行时使得(多个)处理核132应用本文描述的成像处理技术以用于处理表示扫描合成图像的获取的数据，从而从合成图像中提取文档页面的图像。

更具体地，根据示例实施方式，一个或多个处理核132(图1)可以执行程序指令138(图1)，以用于执行图3中所示的技术300。参考图3，根据技术300的框304，处理表示扫描合成图像的数据以将扫描合成图像的背景内容特性化，并至少部分地基于特性化确定包含在扫描合成图像内的文档图像的边界的相对粗略近似。背景内容是非均匀的，这至少部分地归因于通过抵靠扫描仪的非均匀扫描背景进行成像而引入的变化。根据技术300，至少部分地基于用于文档图像的边界模型来细化(框306)文档图像的边界的粗略近似；并且至少部分地基于细化的结果，从扫描合成图像中提取(框308)文档图像。

更具体地，根据一些实施方式，一个或多个处理核132(图1)可以执行程序指令138(图1)，以用于执行图4中描绘的技术400。参考图4，根据技术400，获取(框402)数据，该数据表示通过抵靠背景对页面进行电子扫描而产生的第一图像。第一图像包含非均匀背景内容，这至少部分归因于背景(对页面进行扫描所抵靠的背景)非均匀而引入的变化。技术400包括从第一图像提取(框404)页面的图像。提取404包括将背景内容特性化(框406)并且至少部分地基于特性化的背景内容来识别(框408)与页面相关联的候选像素。技术400包括至少部分地基于识别的候选像素和用于页面的边界的模型来确定(框410)页面的边界。

给定由连续二维光谱反射率f_λ(x,y；λ)描述的文档页面，可以根据亮度响应函数来描述理想扫描系统。例如，红绿蓝(RGB)扫描系统可以通过三个亮度响应函数(一个函数对应于系统的红色、绿色和蓝色响应通道中的每一个)来描述，如下所述：

f_r(x,y)＝∫f_λ(x,y；λ)r(λ)dλ, 等式1

f_g(x,y)＝∫f_λ(x,y；λ)g(λ)dλ,和等式2

f_b(x,y)＝∫f_λ(x,y；λ)b(λ)dλ, 等式3

其中“r(λ)”、“g(λ)”和“b(λ)”表示相应的色彩通道的光谱响应度。这三个响应函数可以组合以形成RGB色彩图像函数，如下所述：

f(x,y)＝[f_r(x,y),f_g(x,y),f_b(x,y)]^T。等式4

由于扫描系统的离散性质，可以在由扫描的图像的空间分辨率所确定的规则间隔的方位处在空间上对图像函数f(x,y)进行采样。如果“X”和“Y”分别表示样本之间的水平间距和竖直间距，那么在其处获得图像样本的位置由(mX,nY)给出，其中“m”和“n”表示整数。因此，扫描图像f[m,n](本文中也称为“扫描合成图像”)可以与连续图像函数相关，如下所述：

f[m,n]＝f(mX,nY)。等式5

根据示例实施方式，文档扫描系统100的一个或多个处理核132(图1)可以执行程序指令138以使文档扫描系统通过下列操作来处理表示扫描合成图像的获取的数据：将扫描合成图像转换为较低分辨率图像(本文中称为“缩略图像”)；执行背景过扫描；识别方向图像特征；识别与文档页面图像相关联的候选像素；对文档页面图像的边界建模；以及使用模型来提取文档页面图像。这些处理步骤在下文进行描述。

将扫描合成图像转换为缩略图像

根据示例实施方式，作为初始步骤，文档扫描系统100可以从全分辨率扫描合成图像构造较低分辨率图像(本文中称为“缩略图像”)。这对于扫描系统100来说可能特别有利，以允许扫描系统100具有有限且较低成本的(多个)处理核和存储器，从而大大减少了所使用的计算资源。

为了获得扫描的图像的较低分辨率缩略图像，可以计算相邻区域上的一些平均或积分。这可以建模为卷积，如下所述：

g[i,j]＝Σ_nΣ_mf[iM+m,jN+n]h[m,n]，等式6

其中“M”和“N”分别表示水平子采样率和竖直子采样率；并且“h[m,n]”表示子采样滤波器的脉冲响应。例如，h[m,n]可以表示简单的局部平均，例如下面描述的：

根据示例实施方式，使用基于联合图像专家组(JPEG)标准的压缩对全分辨率的扫描合成图像进行下采样以产生缩略图像。

背景过扫描

为了分析低分辨率缩略图，文档扫描系统100可以获得并分析捕获背景视场的未被遮挡的扫描的过扫描。例如，可以对后面的过扫描的每个像素列进行平均以针对背景的每个列建立特性像素值。然后可以将缩略图的每个像素与其对应的背景特性进行比较，以帮助后续处理。

识别方向图像特征

为了分析低分辨率缩略图，文档扫描系统100可以使用方向选择性特征检测器。例如，竖直图像梯度(竖直导数)可以用于定位水平图像特征，例如目标页面的顶部和底部，同时允许诸如辊标记和灰尘条纹(作为示例)的竖直特征不受重视。

识别与文档页面图像相关联的候选像素

在分析缩略图像和任何对应的图像特征和背景特性时，文档扫描系统100可以针对每个像素确定像素属于目标页面或属于背景的可能性。例如，根据进一步的示例实施方式，可以将与对应的背景特性相差超过规定量的任何像素视为候选页面像素。作为进一步的示例，具有选择的方向特征的任何像素可以被包括以作为候选页面像素。为了从非页面像素中标记出页面像素，文档扫描系统100可以“二值化”图像缩略图，使得例如页面像素被赋值“1”并且非页面像素被赋值“0”。根据进一步的示例实施方式，文档扫描系统100可以使用其他技术来减少像素强度值的数量。

对页面和背景像素进行分离可能是相对嘈杂的过程，这可能导致页面像素的虚假标记。这种误报可能使后续分析复杂化，并且从这种考虑中移除分隔的页面像素可能是有利的。这可以通过各种噪声抑制方法来实现。例如，根据示例实施方式，文档扫描系统100可以将滤波器(例如5×5形态学开放过滤器)应用于二值化缩略图像，以便将隔离的页面像素重新标记为背景。

数学形态学是用于分析和处理几何结构的理论和技术，并且可以应用于二值图像。形态学操作将结构元素应用于输入图像，从而产生相同大小的输出图像。在形态学操作中，输出图像中的每个像素的值基于输入图像中的对应像素与其相邻像素的比较。通过选择邻域(neighborhood)的大小和形状，可以构造对输入图像中的特定形状敏感的形态学操作。

在形态学操作中，根据示例实施方式，可以通过将规则应用于输入图像中的对应像素及其相邻像素来进一步确定输出图像中的任何给定像素的状态。用于处理像素的规则定义了操作。由文档扫描系统100应用的形态学操作可以包括侵蚀和扩张功能。根据进一步的示例实施方式，可以使用侵蚀函数来移除对象边界上的像素。从图像中的对象移除的像素数量取决于用于处理图像的结构元素的大小和形状。对于侵蚀，输出像素的值是输入像素的邻域中的所有像素的最小值。在二值图像中，如果任何像素值为0，则输出像素设置为0。扩张函数将像素添加到图像中的对象的边界。添加到图像中的对象的像素数量取决于用于处理图像的结构元素的大小和形状。根据进一步的示例实施方式，对于扩张，输出像素的值是输入像素的邻域中的所有像素的最大值。在二值图像中，如果任何像素设置为值1，则输出像素设置为1。

形态学开放函数是通过共同结构元素对图像的侵蚀的扩张。形态学开放函数从图像的前景(页面像素)中移除少量对象，将它们放置在背景中。

因此，根据一些实施方式，使用二值隶属度(membership)函数来表示像素的页面隶属度。根据进一步的示例实施方式，可以使用指示隶属度的程度的隶属度函数。例如，隶属度函数可以是基于模糊逻辑的隶属度函数，其指示隶属度的程度而不仅仅是布尔(Boolean)值。也就是说，可以为像素分配与页面隶属度的程度成比例的数字(例如，像素可以被识别为10％页面和90％背景)。然后，这种模糊隶属度可以用于指导后续处理。因此，根据示例实施方式，识别候选像素可以包括至少部分地基于像素与特性化的背景内容的不相似水平来向像素分配页面隶属度的程度，以生成表示页面的图像；并过滤表示页面的图像以生成表示候选像素的图像。可以通过处理全分辨率的图像或通过处理缩略图像来进行识别和过滤，这取决于特定实施方式。根据示例实施方式，首先进行下采样以产生缩略图像，并且然后，包括背景特性的每个处理阶段以较低分辨率进行，其中最终结果被缩放回原始分辨率，如本文进一步描述的。

对文档页面图像的边界建模

关于选择的页面边界模型，将标记的候选页面像素的考虑限于包括目标页面的外周界的那些点可能是有利的。与考虑属于页面的所有点相比，限制待处理的页面像素的数量可以具有减少计算数量的益处。根据一些实施方式，为了将页面边界与其他页面像素隔离，文档扫描系统100提取经二值化和噪声过滤的图像的每列和每行中的第一个和最后一个页面像素以形成点坐标的集合，该点坐标的集合描述目标页面的近似或(粗略)轮廓的定位。

因此，根据示例实施方式，由文档扫描系统100执行的页面边界提取过程产生点坐标的集合，该点坐标的集合表示目标页面的粗糙轮廓，其可能受到显着噪声的影响。根据示例实施方式，为了改善信噪比稳健性，可以选择先验页面边界模型以拟合用于描述页面的边界数据。作为示例，根据一些实施方式，页面边界模型可以是最佳匹配边界像素的坐标方位的凸四边形。根据进一步的示例实施方式，其他几何形状可以用于页面边界模型。假设是四边形，为了确定最佳拟合四边形，可以使用聚类来解决该问题，其中聚类中心是形成四边形的边缘的四条直线。然后，为了计算聚类，文档扫描系统100可以应用k均值算法。

根据示例实施方式，文档扫描系统100通过选择包围边界点的最小轴对齐限位框(bounding block)来开始k均值算法。文档扫描系统100可以使用该限位框作为限位四边形的初始估计。随后，文档扫描系统100可以根据每个点最接近限位四边形的四个边缘中的哪个边缘而将该边界点的集合划分为四个分组。接下来，文档扫描系统100可以将线拟合到点的每个分组。

根据示例实施方式，文档扫描系统100迭代地拟合。更具体地，可以根据每个最接近的线重复地划分该点的集合，并且然后，可以将新线拟合到每个点分组。此过程可以继续，直到重新划分导致没有点被重新分配给不同的组。根据一些实施方式，允许的迭代数量可以限于预定义值。另外，根据一些实施方式，在划分边界点时，可以在任何特定迭代中忽略距离所有四边形边缘大于预选距离的那些边界点。

根据示例实施方式，文档扫描系统100可以使用加权的总体最小二乘优化来确定页面的边界。平面中的线可以描述如下：

a_x x+a_y y＝c，等式8

其中“a”，“b”和“c”表示实数常量，其中a和b不全为零。线到点(x₀,y₀)的距离可以描述如下：

可以以矢量符号重写等式9。为此，可以以矢量符号将等式9的参数重写如下：

从该线到点x₀的距离可以描述如下：

矢量a可以约束如下：

通过这种约束，距离公式(等式14)可以重写如下：

|d(a^Tx＝c,x₀)|＝|a^Tx₀-c|。等式16

因此，为了针对给定的点集{x_n|n∈N}计算至最佳拟合线的点集的总体最小二乘回归，a和c可以确定如下。表达式，

E＝Σ_n∈Nw_n(a^Tx_n-c)²，等式17

可以最小化，受以下约束：

||a||＝1。等式18

换句话说，a和c可以确定如下：

(a,c)＝argmin_(a,c)(Σ_n∈N w_n(a^T x_n-c)²+λ(a^T a-1))，等式19

其中“w_n”表示一些权重，从而提供每个点对优化的相对重要性。展开等式19得到以下等式：

(a,c)＝argmin_(a,c)(c²(Σ_n∈N w_n)-2c a^T(Σ_n∈N w_n x_n)+a^T(Σ_n∈N w_n x_n x_n ^T)a+λ(a^Ta-1))。等式20

等式20可以用更紧凑的形式写成如下：

其中应用于以下等式：

和

然后等式21可以重写如下：

为了确定参数a和参数c，可以计算以下微分：

可以求解等式27得出c如下：

将c(等式28)代入等式22，结果如下：

等式29是特征值问题，其中对应于2×2加权协方差矩阵的最小特征值的特征向量是期望的系数向量a：

Σ的特征值可以通过求解以下等式来确定：

|Σ+λI|＝0。等式31

换句话说，特征值可以如下确定：

因为Σ是正半正定的，所以最小特征值可以确定如下：

对应的特征向量可以描述如下：

Σa^(-)+λ^(-)a^(-)＝0。等式37

换句话说，特征值可以如下确定：

出于简化的目的，可以定义以下表达式

将Δ_xy(等式40)代入等式39，结果如下：

根据等式41的顶行，如果则可以描述如下

在矢量形式中，和可以描述如下：

其中“k”表示通过施加约束||a||＝1确定的比例常数。如以上在等式28中陈述的，

根据上述迭代方法，为了使解针对噪声和数据异常值更具稳健性，文档扫描系统100可以确定每个迭代处的权重集{w_n}。例如，然而对于所有n恒定的统一权重w_n＝1产生标准最小二乘回归，根据点与当前线估计的距离相反地设置权重提供近似于最小绝对偏差回归的解，如下所述：

其中“δ”表示为了避免被零除而选择的小值。

根据示例实施方式，文档扫描系统100可以进行如下模型调整。在选择的页面模型拟合到提取的页面边界点之后，可以检查模型参数以确保每个均由足够数量的边界像素产生。在没有足够数量的点可用的情况下，可以进行启发式校正以稳定模型。例如，可以将表示非足够数量的像素的任何边缘的斜率调整为与其相对的边缘平行。此外，如果相对的边缘也表示非足够数量的边界像素，则可以将两个边缘设置为竖直或水平，这取决于另外两个边缘的取向。如果所有四个边都表示非足够数量的像素，则可以使用最小轴对齐限位框。

根据示例实施方式，为了迫使期望的行为，文档扫描系统100可以识别已知的内部点(例如，平均页面像素的方位)，并且文档扫描系统100可以绕该识别的点以顺时针方向将边缘排序。根据示例实施方式，在排序之后，偶数索引的边缘可以假设为表示一对相对的边缘，而奇数索引的边缘可以假设为表示另一对边缘。

如上所述，根据进一步的示例实施方式，可以使用除了以上示例实施方式中描述的普通凸四边形页面边界模型之外的页面模型。作为示例，此类模型可以包括其中页面边界被约束为矩形的模型、其中可以使用由于过度歪斜(以及其他考虑因素)导致的不希望的裁剪而引起的缺失页面数据的明确核算的模型，等等。

使用模型提取文档页面图像

在通过分析缩略图完成页面建模之后，文档扫描系统100可以缩放得到的模型并通过适当地缩放模型的参数来将缩放的模型与全分辨率对齐。在缩放模型之后，文档扫描系统100可以逐个检查原始图像中的像素，以确定像素是否应被视为页面像素或背景像素。根据示例实施方式，针对最小轴对齐限位框内的像素计算该确定，并且不针对框外的像素计算该确定。

根据示例实施方式，关于凸四边形，文档扫描系统100可以进行相对简单的测试以识别建模的页面边界内的点。例如，文档扫描系统100可以计算线和点之间的带符号距离。以这种方式，关于线和点，线和点之间的带符号距离可以描述如下：

等式45是正的还是负的取决于该点在的线的哪一侧。以这种方式，正距离意味着该点位于线的一侧，负距离意味着该点位于线的另一侧，并且零意味着该点位于线上。矢量a的极性确定线的哪一侧是正的并且哪一侧是负的。

根据示例实施方式，出于训练页面模型的目的，可以定义所确定的四边形的边缘，使得内部点对应于到所有四个边缘的正的带符号距离。为了迫使该行为，文档扫描系统100可以识别已知的内部点(例如，平均页面像素的方位)，并且文档扫描系统100可以调整四边形边缘的极性，使得四个边缘对于该点是正的。随后，文档扫描系统100可以识别限位框内的检查点，以确定这些点是否也在四边形内。根据进一步的示例实施方式，类似的测试可以用于其他页面模型。

根据示例实施方式，带符号距离可以用于不对称地指导等式19的权重，例如，其中落在页面外的像素(如页面边界模型所指示)相比于页面内的像素被更重地加权。

图5A-图5K描绘了用于示例实施方式的处理文档扫描系统100，其中处理扫描合成图像500(图5A)以便从合成图像500中提取文档页面图像520。如图5A所示描绘的，合成图像500具有通过抵靠非均匀背景图像对文档页面进行扫描而产生的非均匀背景内容508(例如，图像505由图2的辊110产生)。以这种方式，如图5A所示，背景内容508可以包括较暗内容的区域514(例如，对应于辊110的滚柱210的区域)，其由较亮区域510(例如，由滚柱210之间的反射间隙202产生的区域)分隔。通常，文档520在图5A所示的方向524上进行扫描。此外，如图5A所描绘的，文档图像520可以包含各种色彩(这里是示例性色块521)，并且文档图像520可能是歪斜的，因为文档图像520的边界可能相对于合成图像500的边界歪斜，如图5A所示。

在表示合成图像500的数据的处理中，文档扫描系统100可以最初构造图5B中描绘的缩略图像530。缩略图像530通常是图5A的合成图像500的较低分辨率图像。以这种方式，缩略图像530包括文档图像520的较低分辨率图像532，以及与合成图像500的背景部分508对应的较低分辨率背景内容534。

参考图5C，文档扫描系统100可以接下来分析缩略图530以用于将背景内容534特性化。以这种方式，文档扫描系统100可以具有一个或多个传感器，例如页面传感器140(图1)，其用于识别合成图像500的明显是属于背景而不是文档图像532的区域的部分(以及相应地，缩略图530的部分)。在该识别的部分中，扫描系统100可以分析图5C的扫描仪响应440。在这方面，扫描仪响应440具有对应于高反射响应的峰值442(例如对应于部分510(参见图5A)的响应)和对应于较暗部分514的较低量值基区444(参见图5A)。然后，文档扫描系统100可以在图像530的识别的背景部分中从缩略图像530(图5B)中减去特性化的背景内容，以导出具有均匀背景内容552的缩略图像550(参见图5D)。如所指出的，尽管未在图5D中描绘，但缩略图像550不表示文档图像532与紧邻的背景内容之间的边界或边界区域的明显区别。

为了提取文档图像532，可以由文档扫描系统100执行以下附加步骤。参考图5E，首先，根据示例实施方式，文档扫描系统100可以对缩略图像进行二值化，即，将图像变换为两个不同的像素强度(例如，黑色和白色)，得到图5E中描绘的二值化缩略图像556。然后，文档扫描系统100可以过滤二值化缩略图像556以移除噪声，从而产生图5F中描绘的经过滤的二值化缩略图像560。

然后，文档扫描系统100可以识别文档页面图像的边界像素，如图5G中的边界566所描绘的。以这种方式，边界像素指缩略图像的背景内容与文档图像的边界处的像素；并且识别的边界560中的给定像素可以属于背景内容或属于文档图像。换句话说，文档扫描系统100确定文档页面的边界的相对粗糙或粗略的近似。

接下来，根据示例实施方式，文档扫描系统100将页面边界模型初始化为最小轴对齐限位框568(参见图5H)，其大致对应于识别的边界像素566。参考图5I，根据示例实施方式，扫描系统100执行拟合算法，以便调整由页面边界模型定义的边界以便将识别的边界点566拟合(即，文档扫描系统100对近似边界重新划线)。作为示例，根据一些实施方式，文档扫描系统100划分识别的边界点(参见图5I划分到页面的识别的点580)，并且然后对点划分执行最小二乘拟合以导出图5J中描绘的调整的页面模型定义的边界584。如上所述，该拟合可以迭代执行。拟合的结果是数学定义的限位框(或其他四边形或其他几何形状，取决于具体实施方式)；并且然后，扫描系统100可以使用该框来精确地定义缩略图像的文档图像532(参见图5D)的边界，使得可以确定合成图像500中的文档图像520(参见图5A)的对应边界。然后，文档扫描系统100可以使用文档页面图像520的边界来从合成图像500中提取图像即文档页面图像520，以导出新的合成图像590(参见图5K)，其中现在提取的文档图像592被施加在均匀背景591(例如，白色背景)上。这是裁剪的示例。根据进一步的示例实施方式，文档扫描系统100可以执行除裁剪之外的操作。例如，根据进一步的示例实施方式，文档扫描系统100可以执行其他操作，诸如缩放或歪斜校正提取的文档页面图像。

因此，参考图6，根据示例实施方式，扫描系统100可以执行图6中示出的技术600。参考图6，技术600包括处理(框604)表示合成图像的获取的数据，以提供合成图像的较低分辨率的缩略图像，该合成图像包括文档的图像和至少部分地由于辊的滚柱和间隙而导致的非均匀背景。技术600包括分析(框608)缩略图像以选择缩略图像的与文档的图像对应的候选像素；确定(框612)描述缩略图的选择的候选像素的边界的页面模型的参数；转换(块616)页面模型的参数以对应于合成图像中的文档的图像的边界；以及使用(框620)经转换的参数以从合成图像中提取文档的图像。

预期其他实施方式，其在所附权利要求的范围内。例如，尽管本文描述了其中文档扫描系统执行图像处理以提取扫描文档页面的图像的实施方式，但是根据进一步的示例实施方式，文档扫描系统之外的系统可以执行本文描述的一种或多种技术以提取文档图像。以这种方式，在这些实施方式中，文档扫描系统之外的计算系统(台式计算机、平板计算机、膝上型计算机等)的一个或多个处理器可以从文档扫描系统接收表示扫描合成图像的图像数据并执行本文描述的处理。

作为进一步的示例实施方式的示例，对于上述实施方式，执行机器可执行指令的(多个)处理器执行图像处理。然而，根据进一步的示例实施方式，专用硬件部件可以执行本文描述的图像处理。

虽然已经关于多个实施例描述了本技术，但是应当理解，可以从中应用许多修改和变化。所附权利要求旨在覆盖落入本技术范围内的所有这些修改和变化。

Claims

1.一种方法，包括：

获取表示通过抵靠背景对页面进行电子扫描而产生的第一图像的数据，其中所述第一图像包含非均匀背景内容，所述非均匀背景内容至少部分地归因于所述背景非均匀而引入的变化；以及

从所述第一图像提取所述页面的图像，所述提取包括：

将所述第一图像的所述背景内容特性化；

至少部分地基于特性化的背景内容来识别与所述页面相关联的候选像素；以及

至少部分地基于识别的候选像素和用于所述页面的边界的模型，确定所述页面的所述边界。

2.根据权利要求1所述的方法，进一步包括：

处理表示所述第一图像的所述数据以生成表示所述页面和所述背景的第二图像的第二数据，相比于所述第一图像的分辨率，所述第二图像具有较低的分辨率；以及

将所述第一图像的所述背景内容特性化，识别所述候选像素并使用所述第二图像确定所述页面的所述边界。

3.根据权利要求2所述的方法，其中确定所述页面的所述边界包括：

确定所述页面在所述第二图像中的边界；以及

缩放所述页面在所述第二图像中的所述边界以确定所述页面在所述第一图像中的的所述边界。

4.根据权利要求1所述的方法，其中识别所述候选像素包括：

至少部分地基于所述像素与所述特性化的背景内容的不相似水平来向所述像素分配页面隶属度的程度，以生成表示所述页面的图像；以及

过滤表示所述页面的所述图像以生成表示所述候选像素的图像。

5.根据权利要求4所述的方法，其中过滤表示所述页面的图像包括应用形态学开放过滤器。

6.根据权利要求1所述的方法，其中确定所述页面的所述边界包括：

使用表示所述识别的候选像素的图像，在所述页面的边界的近似之后识别像素的坐标；以及

至少部分地基于页面边界模型和识别的坐标来细化所述近似。

7.根据权利要求1所述的方法，其中所述非均匀背景内容至少部分地归因于通过抵靠电子扫描系统的分段辊进行成像而引入的变化。

8.根据权利要求1所述的方法，进一步包括：

至少部分地基于所述页面的确定的边界来处理表示所述第一图像的所述数据，其中处理表示扫描图像的所述数据包括裁剪、歪斜校正或缩放所述扫描图像的与所述页面对应的像素。

9.一种包括用于存储指令的非瞬态存储介质的物品，所述指令在由计算机执行时使所述计算机：

处理表示扫描合成图像的数据以将所述扫描合成图像的背景内容特性化，并且至少部分地基于所述特性化来确定包含在所述扫描合成图像内的文档图像的边界的相对粗略近似，其中至少部分地由于通过抵靠扫描仪的非均匀扫描背景进行成像而引入的变化，所述背景内容是非均匀的；

至少部分地基于用于所述文档图像的边界模型来细化所述文档图像的所述边界的所述粗略近似；以及

至少部分地基于所述粗略近似的所述细化的结果，从所述扫描合成图像中提取所述文档图像。

10.根据权利要求9所述的物品，所述存储介质存储在由所述计算机执行时使所述计算机执行以下操作中的至少一个的指令：歪斜校正所述文档图像、移除确定的边界之外的内容、裁剪所述文档图像和缩放所述文档图像。

11.根据权利要求9所述的物品，所述存储介质存储在由所述计算机执行时使所述计算机进行以下操作的指令：将所述扫描合成图像从较高分辨率下采样到较低分辨率，并使用经下采样的扫描合成图像来估计所述边界的所述粗略近似并细化所述粗略近似。

12.根据权利要求11所述的物品，所述存储介质存储在由所述计算机执行时使所述计算机进行以下操作的指令：

将与所述经下采样的扫描合成图像相关联的所述边界的坐标变换为与所述扫描合成图像相关联的所述边界的坐标，以从所述扫描合成图像中提取所述文档图像。

13.一种系统，包括：

辊，所述辊用于供给待扫描的文档，所述辊包括滚柱和所述滚柱之间的间隙；

成像传感器，所述成像传感器朝向所述辊定向以获取表示合成图像的数据，所述合成图像包括所述文档的图像和非均匀背景，所述非均匀背景至少部分地归因于所述辊的所述滚柱和所述间隙；以及

处理器，所述处理器用于：

处理获取的数据以提供所述合成图像的较低分辨率缩略图像；

分析所述缩略图像以选择所述缩略图像的与所述文档的所述图像对应的候选像素；

确定描述所述缩略图像的选择的候选像素的边界的页面模型的参数；

转换所述页面模型的所述参数以对应于所述合成图像中的所述文档的所述图像的边界；以及

使用变换的参数从所述合成图像提取所述文档的所述图像。

14.根据权利要求13所述的系统，进一步包括：

过扫描传感器，所述过扫描传感器用于检测所述合成图像的对应于所述背景的区域，其中所述处理器处理所述缩略图像以从所述缩略图像中移除背景内容。

15.根据权利要求13所述的系统，其中所述处理器根据像素方位确定背景强度，并且所述处理器至少部分地基于给定像素的强度与所述给定像素方位的像素方位的所述背景强度之间的比较来将所述给定像素选择成为候选像素。