CN101151882A - 处理扫描数据的系统和方法 - Google Patents

处理扫描数据的系统和方法 Download PDF

Info

Publication number
CN101151882A
CN101151882A CNA2006800091184A CN200680009118A CN101151882A CN 101151882 A CN101151882 A CN 101151882A CN A2006800091184 A CNA2006800091184 A CN A2006800091184A CN 200680009118 A CN200680009118 A CN 200680009118A CN 101151882 A CN101151882 A CN 101151882A
Authority
CN
China
Prior art keywords
data
group
processor
algorithm
parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2006800091184A
Other languages
English (en)
Inventor
罗兰·G·博雷
毛里蒂乌斯·A·R·施米特勒
罗伯特·A·泰勒
乔尔·S·费克特
哈里·S·阿舒尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kofax Inc
Original Assignee
Kofax Image Products Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kofax Image Products Inc filed Critical Kofax Image Products Inc
Publication of CN101151882A publication Critical patent/CN101151882A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Facsimiles In General (AREA)

Abstract

本发明公开了一种有效的方法和系统,用于提升模拟数据的数字采集装置。该方法和系统带来的提升对于本地和远程部署的用户都是可用的。通过使用虚拟二次采集,能够有效实现所获得数码数据质量的提升。如果由采集装置获得的数字数据的质量不够,该虚拟二次采集的方法能够补偿不必要的模拟数据的物理二次采集。该方法和系统包括:将来自数据捕获装置的原始或标准化数据存储于计算机可访问存储介质上;使用一个第一分析引擎分析所述原始或标准化数据中的至少一部分,以确定该原始数据是否在第一组参数内,以及如果否,则使用所述第一分析引擎产生第一组处理器设置;使用所述第一组处理器设置处理所述原始或标准化数据;以及使用一个第二分析引擎分析所述处理后的数据的至少一个部分以确定所述处理后的数据是否在第二组参数内,以及如果否,则使用所述第二分析引擎产生第二组处理器设置以重新处理所述原始或标准化数据。

Description

处理扫描数据的系统和方法
依据美国法典35卷119条(e)款,本申请要求以美国临时申请No.60/665,067作为在先申请的优先权,该申请的申请日为2005年3月24日,名称为“用于在本地和远程部署的模拟数据增强数字采集装置的系统和方法”,其所有内容以引用的方式结合在本文中。
技术领域
本发明涉及用于改进由数据采集装置获得的数据质量的系统和方法。用户可以位于该数据采集装置本地或者远端。
背景技术
用于模拟数据的数据采集装置将模拟数据转换为数字数据。一个典型的例子是扫描装置。其将印在一张纸上的图像作为输入,而输出这个物理图像的数字表示。由该采集装置获得的质量强烈依赖于采用适合给定模拟数据细节的设置来使用该装置。例如,扫描仪上用来获得日落的高质量扫描图像的设置不同于用来扫描在夏天白天拍摄的照片的设置。为模拟数据的给定细节找到更好或最佳的设置是耗费时间的过程,经常需要使用不同的采集装置多次获得模拟数据。当数字数据的接收器和数据采集装置处于不同的位置时,这就变得非常不切实际而且效率低。
下面的例子说明现有技术的效率低。传真的接收者对接收到的传真的质量不满意。为了获得更好质量的传真,该接收器只有,例如使用电话,通知位于该传真源位置的一个人而要求使用不同的设置发送传真。
而且,给定的临时模拟数据,在一个窄的时间帧内,使用物理方法重新取得模拟数据来确定改进的采集设置是不可能的或是不可行的。
在目前远程数据采集应用中,模拟数据需要转换为数字的来使用,例如,扫描装置或数字复制机器。然后,通过网络将数字化的数据传给远程的接收器。现有的远程数字采集应用的方法不能使远程接收器利用对数据采集装置的远程控制来获取数据。
发明内容
为了提高质量的目的,实施例包括数据的虚拟二次采集的方法。在一个实施例中,用于提高质量的虚拟二次采集可用于扫描设备,以及其它数据采集设备,例如数字复印机、传真机、多功能外围设备、红外线相机、声学相机、数码相机、具有内置数码相机的移动电话等等。虚拟二次采集可用于任何模拟或数字源,包括声音、用于监控设备的声学测量、温度、视频等等。
用于模拟数据的采集设备的输入流可以是离散的或连续的。另外,该数据流可以是时间或空间的一个函数。不考虑这些形态,结果数据包含在一个离散单元的有序集合中。该集合的顺序包含该输入流的时间或空间方向信息。在连续的输入流的情况下,该采集装置通过将该连续的输入流分割成多个文件而产生多个离散单元。例如,一个视频镜头的输入是连续的,并且由该镜头拍摄的象帧组成的有序集合给出该结果数据,每个象帧是前述离散单元的一个例子。输入扫描设备的一组纸张就是离散输入流的一个例子,并且该离散数据是由该纸张确定的。
一个实施例是用于增强数字数据的有效的方法和系统,该数据由用于模拟数据的采集设备获得。使用该模拟数据的虚拟二次采集而获得增强。该虚拟二次采集的方法在一个缓存中存储由该采集设备获得的原始数据。该数据处理器从该缓存访问该原始数据,允许该数据处理器重新处理该原始数据而无需利用该采集设备物理地二次采集该数据。
一个实施例在缓存中存储尽可能多的输入数据单元,在给定缓存大小的情况下。在特定的实施例中,用于输入数据的新的存储空间通过删除驻留缓存最长的数据单元而产生。另外,在其它实施例中,对数据单元赋以优先权,而具有较低优先权的数据单元会在具有较高优先权的数据单元之前被新的数据单元覆盖。
一个实施例具有虚拟二次采集通过该采集设备获得的最新或次新使用的数据单元的能力。或者,用户可以通过一个选择机构虚拟地重新获取存储在缓存中的原始数据或原始数据的分段。虚拟的二次采集的方法补偿了物理地二次采集该模拟数据所消耗的不必要的时间和劳动。进而,在不可能进行物理二次采集的情况下,例如时间依赖型输入流的情况,应用该虚拟二次采集是非常有价值的。
虚拟二次采集的额外的应用是当该采集设备的采集率对于输出通信系统来说过高,并且是作为默认方式,则传输压缩的低分辨率数据。使用虚拟二次采集,数据的接收器可以有选择地访问和重新处理该原始的高分辨率数据而不受传输带宽的限制。
另外,这里提供了一个使用虚拟二次采集以有效地确定改进的或最佳的采集设备设置的方法和系统的实施例。该改进的或最佳的设置可以实时和非实时交互的方式得到,由系统本身自动得到,或者使用它们的组合方式得到,这依赖于具体的实施例。而且,该方法和系统方便了数字采集设备的控制,通过警示用户在该输入流中潜在低质量数字数据或改变,这也许是用户感兴趣的,以及通过分析数据以及与用户定义的门槛进行比较。这个特征是有价值的,例如在使用或要求采集大量的模拟数据的运用中。
另外,在一个实施例中呈现了一种组合远程部署的虚拟二次采集的方法,提供了在大量的各种商业过程中获得巨大的有效收益的潜力,例如安全监控应用。例如,使用视频系统监视一栋建筑,并且由于可用带宽的缘故,低分辨率数据传输至一个中心位置。通过分析该数据,该系统检测可能对监视该系统的人有用的事件,并启动使用虚拟二次采集向该用户传输高分辨率数据。
通过默认地传输处理后的数据,而不是未压缩的原始数据,一个实施例的远程应用可有效使用存储器和网络,降低或最小化对存储器以及网络的硬件使用或要求。
此外,这里呈现的方法和系统的例子允许多个用户共享使用一个或多个模拟采集设备。每个用户可使用不同的处理器设置处理相同的原始数据,使得每个单独的用户可以根据他或她个人的喜好和需要处理该原始数据。
最后,该方法和系统的一个实施例可以独立地应用于获取的离散数据单元的分段,也就是,用户可以选取获取的数据单元的分段并不同地处理选取的分段。例如,给定一个扫描的图像,显示图像和文本,用户可以将获取的数据分为两个区域,一个包含该图像而另一个是文本,并且可以虚拟地使用最适合或较适合所选区域的设置来重新获取该区域。
如上所述,此处呈现的实施例的方法和系统,能够通过使用可能的一个或多个分析引擎,自动确定改进的或最佳的处理器设置。例如,一个第一分析引擎(引擎1)采用原始数据作为输入,而一个第二分析引擎(引擎2)使用处理后的数据作为输入。该第二分析引擎使用一个步长确定处理后数据的质量。其可以随机地或者依据该步长所确定的该处理后数据的质量来选择新的处理器设置。该原始数据使用该新的设置被重新处理。这个处理一直持续直至收敛,也就是,该步长无法检测处理后数据的质量的任何改进。该第一分析引擎执行的功能是,但不限于,页面边界检测、背景平滑、渗透检测、色彩检测、以及方向检测等等。
页面边界检测对于有效页面倾斜校正是有用的。在一个实施例中,该页面边界检测相对于各种背景检测该页面,并且因此允许对于白色背景扫描仪和黑色背景扫描仪进行页面倾斜校正和剪切。
一个背景平滑方法的实施例处理降低图像背景内颜色数量的需要和要求,以改进图像的外观,以及降低该图像压缩后的大小。该方法的一个例子如下工作。集聚在图像中发现的所有或部分颜色,并且选择那些包含足够多像素可认为是背景的颜色。然后,融合这些背景,并且该图像内属于背景簇的所有或部分像素在该簇内用平均颜色替换。
一个渗透检测的实施例检测在扫描文档的非空白面的渗透,以便在这些页面上执行进一步的图像处理。这个算法的一个实施例在正面和背面扫描图像内使用页面边界检测以近似地匹配两侧的等同物。然后,该算法使用已有颜色或灰度内容调整该匹配。这个额外的步骤是有用的,因为正面和背面镜头的光学和倾斜稍有不同。如果剩余(未解释)内容低于特定的密度标准,该页面就认为是空白的。
在一个实施例中,颜色检测处理在一个扫描图像内检测色彩内容的需要或需求,以及分辨前景和背景色彩的需要或要求。这个算法的一个实施例提供了一种机制,以清除背景颜色,如果它是文档中的主色或最主要的颜色。该算法的一个实施例检查在该扫描图像中的像素,并确定它们是彩色像素还是背景像素。这个确定使用像素的饱和度和亮度等级。
在一个实施例中,方向检测自动确定怎样直角旋转一个文本页以便于浏览。该算法的一个实施例从该页面内黑色的连接成分中选择可能的单独的字符,并且通过一个训练过的神经网络确定它们各自的方向。该算法使用以投票数为结果的方向决定该页面的哪个页面最好或较好。
在一个实施例中,虚拟二次采集被作为软件执行并独立于采集设备。采集设备的用户可以通过改变处理器的设置,以交互式地增强获取的模拟数据的数字显示的质量。可能的调整包括,但不限于,亮度、对比度、反差、腐蚀、方向、片段、色彩呈现、饱和度、分辨率、扭曲角度、失序检测、放大、斑点去除、以及倾斜角度。该实施例是有价值的,例如与采集设备相连,这些设备由于它们受限的硬件能力,以大量的各种模拟数据作为输入时通常不能产生稳定的高质量的数字数据。在这些情况下,该实施例是一个低成本的、用于增强采集设备的能力和可用性的方法。
此外,一个实施例允许采集设备的用户根据其个人的偏好和需要获取数字数据。
在一个实施例中的另一个优点是虚拟二次采集独立于采集设备。虚拟二次采集使用的算法的发展步伐通常比采集设备的硬件的改进要快得多。用户可以通过简单地升级虚拟二次采集软件而很容易地使用算法的改进。这个特征是有价值的,例如对于昂贵的高端扫描仪,可以减少或最小化扫描仪的损耗。
在另一个实施例中,上述实施例被应用于远程部署,并因此提供对一个或多个数字数据的远程接收器进行虚拟二次采集的能力。执行的工具可以是软件,固件,硬件,或软件、固件、或硬件的任意组合。
一个实施的例子是使用传真服务机。数据以高清晰度模拟形式提交,存储在传真通信服务器的数据缓存,通过使用默认设置和属性获得的二进制数据发送到它们各自的目的地。通过一个在传真服务机上执行的回叫协议,该传真的接收器可以从存储在传真服务器的图像中选取一个具体的图像或者一个图像的缩小区域,并指定用于该选取图像的处理器设置和属性。选定的图像或图像的缩小区域根据具体的设置被重新处理并且传送到该接收器。
图像集合存储在传真服务器缓存中。当缓存存满或者当图像被用户全部处理,图像可以被删除,被传送来的图像替代,存储在数据库,或者它们的任意组合。这个实施例使传真的接收器能够增强在其桌面或应用程序中直接接收的传真的质量,在图像质量不够的情况下,提供过时的传真的重发。
另外,前述的回叫协议允许接收器向发送器警示不可逆的潜在的问题,如空白页。最终,当发送该传真时,发送器不必猜测改进的或最佳的设置。
在另一个实施例中,虚拟二次采集通过一个分析引擎被增强,其以该采集设备的原始数据作为输入。该分析引擎自动确定用于采集设备的改进的或接近最佳的设置。另外,它还自动监测由采集设备获得的数字数据的质量,并在所述质量低于预定的门槛时警示用户。用户可按照他或她的偏好调整该门槛。另外,用户可以覆盖由该分析引擎确定的采集设备设置,以及当必需或者需要时交互式地手动调整这些设置。
在一个实施例中,所述交互式的调整可以非实时的方式进行,并且因此,不会中断输入数据流。这个实施例是有用的,例如,对于使用或要求大量模拟数据的采集的运用。其允许近乎自动的数据采集并仍能确保高质量的结果数字数据。典型的例子是使用扫描设备电子化归档大量纸件文档的复印机室或设备。
在一个实施例中,通过一个分析引擎增强的虚拟二次采集可以由软件,固件,硬件,或软件、固件、或硬件的任意组合来执行。相比软件执行,硬件执行在速度方面具有优势,并且允许快速高效地处理大量数据。
在另一个实施例中,由分析引擎增强的虚拟二次采集被远程配置。远程配置的、由分析引擎增强的虚拟二次采集可以由软件,固件,硬件,或软件、固件、或硬件的任意组合来执行。
在另一个实施例中,虚拟二次采集通过一个第一分析引擎和一个第二分析引擎增强。该第二分析引擎分析以特定的数据处理器设置从第一分析引擎获得的处理后的数字数据。利用这个信息,该第二分析引擎估算一组新的数据处理器设置,并且使用该新的设置虚拟地重新获得原始数据。
在一个实施例中,这个过程被不断重复,直到充分改进的设置或最佳的设置被自动确定。由该第一和第二分析引擎增强的虚拟二次采集可以由软件,固件,硬件,或软件、固件、或硬件的任意组合来执行。
在另一个实施例中,由该第一和第二分析引擎增强的虚拟二次采集被远程配置。远程配置的、由该第一和第二分析引擎增强的虚拟二次采集可以由软件,固件,硬件,或软件、固件、或硬件的任何组合来执行。
在一个实施例中,一个数据处理系统包括来自数据采集装置的原始的或标准化的数据,其中该原始的或标准化的数据存储在计算机可访问存储介质中,且一个第一采集控制器与所述原始的或标准化的数据进行通信。该第一采集控制器被配置成分析所述原始的或标准化的数据,以确定它们是否在第一组参数内。如果该原始的或标准化的数据不在该第一组参数内,该第一采集控制器产生第一组处理器设置。该数据处理系统还包括一个与该第一采集控制器通信的处理器,其中该处理器被配置成使用所述第一组处理器设置处理所述原始的或标准化的数据,以及一个与所述处理器通信的第二采集控制器。该第二图像采集控制器被配置成分析所述处理后的数据的至少一部分,以确定该处理后的数据是否在第二组参数内。如果该处理后的数据不在所述第二组参数内,该第二采集控制器产生第二组处理器设置,处理器使用该第二组处理器设置重新处理所述原始的或标准化的数据。
另一个实施例中,一种数据处理方法包括将来自一个数据采集装置的原始的或标准化的数据存储于计算机可访问存储介质上,以及使用一个第一分析引擎分析所述原始的或标准化的数据的至少一部分,以确定所述原始的或标准化的数据是否在第一组参数内。如果所述原始的或标准化的数据不在第一组参数内,则该方法包括使用所述第一分析引擎产生第一组处理器设置,使用该第一组处理器设置处理所述原始的或标准化的数据,以及使用一个第二分析引擎分析所述处理后的数据的至少一个部分,以确定所述处理后的数据是否在第二组参数内。如果该处理后的数据不在第二组参数内,则该方法进一步包括使用所述第二分析引擎产生第二组处理器设置,以重新处理所述原始的或标准化的数据。
在又一个实施例中,一个数据处理系统包括一个存储装置,用于存储来自一个数据采集装置的原始数据,一个与该原始数据通信的第一分析装置,用于分析所述原始数据的至少一部分,以确定所述原始数据是否在第一组参数内,如果否,则所述第一分析装置产生第一组处理器设置。该数据处理系统还包括一个与所述第一分析装置通信的处理装置,用于使用所述第一组处理器设置处理所述原始数据,和一个与所述处理装置通信的第二分析装置,用于分析所述处理后的数据的至少一部分,以确定所述处理后的数据是否在第二组参数内,以及如果否,则所述第二分析装置产生第二组处理器设置,所述处理装置使用该第二组处理器设置重新处理所述原始数据。
在另一个实施例中,一个文档处理系统包括来自一个数据采集装置的文档数据,其中该文档数据存储在计算机可访问存储介质中,以及一个与该文档数据通信的第一采集控制器。该第一采集控制器配置成分析所述文档数据的至少一部分,以确定该文档数据是否在第一组参数内。如果该文档数据不在第一组参数内,则第一采集控制器产生第一组处理器设置。该文档处理系统还包括一个与该第一采集控制器通信的处理器,其中该处理器配置成使用所述第一组处理器设置处理所述文档数据,和一个与该处理器通信的第二采集控制器。该第二采集控制器配置成分析所述处理后的文档数据的至少一部分,以确定所述处理后的文档数据是否在第二组参数内。如果所述处理后的文档数据不在第二组参数内,则第二采集控制器产生第二组处理器设置,所述处理器使用该第二组处理器设置重新处理所述文档数据。
在一个实施例中,一种文档处理方法包括在计算机可访问存储介质上存储来自一个数据采集装置的文档数据,以及使用一个第一分析引擎分析所述文档数据的至少一部分,以确定所述文档数据是否在第一组参数内。如果所述文档数据不在第一组参数内,则该方法进一步包括使用该第一分析引擎产生第一组处理器设置,使用所述第一组处理器设置处理所述文档数据,以及使用一个第二分析引擎分析处理后的文档数据的至少一个部分,以确定所述处理后的文档数据是否在第二组参数内。如果所述处理后的文档数据不在第二组参数内,则该方法进一步包括使用所述第二分析引擎产生第二组处理器设置以重新处理所述文档数据。
在另一个实施例中,一个文档处理系统包括一个存储装置,用于存储来自一个数据采集装置的文档数据,一个与该文档数据通信的第一分析装置,用于分析所述文档数据的至少一部分,以确定该文档数据是否在第一组参数内,以及如果否,则该第一分析装置产生第一组处理器设置。该文档处理系统还包括一个与该第一分析装置通信的处理装置,用于使用所述第一组处理器设置处理所述文档数据,一个与该处理装置通信的第二分析装置,用于分析处理后的文档数据的至少一部分,以确定所述处理后的文档数据是否在第二组参数内,以及如果否,则该第二分析装置产生第二组处理器参数,该处理装置使用该第二组处理器参数重新处理该文档数据。
在另一个实施例中,一个文档处理系统包括一个随机访问缓存,其接收来自扫描仪的文档,其中该文档在该随机访问缓存内存储为多个带并且以可随机访问的形式存储。该文档处理系统还包括一个与该随机访问缓存通信的处理器,其中该处理器配置成从该随机访问缓存获取文档,该处理器具有处理器控制设置,用于处理所述文档,以及一个与该处理器互连的采集控制器。该采集控制器配置成分析处理后的文档,以确定何时对所述文档内的至少一个带使用不同的处理器控制设置以及在什么位置随机地访问存储在所述随机访问缓存中的至少一个带,以使用所述不同的处理器控制设置重新处理该带。
在另一个实施例中,一种文档处理方法包括将来自扫描仪的文档在一个随机访问缓存中存储为多个带并以可随机访问的方式存储,从该随机访问缓存中获得所述文档,以及使用处理器控制设置处理所述文档。该方法还包括使用一个分析引擎分析所述处理后的文档以确定何时对该文档内的至少一个带使用不同的处理器控制设置,以及随机地访问存储在所述随机访问缓存中的至少一个带以使用所述不同的处理器控制设置重新处理该带。
在一个实施例中,一个文档处理系统包括一个存储装置,用于将从扫描仪接收的文档在该存储装置内存储为多个带并以可随机访问的方式存储,以及一个处理装置,用于从该存储装置获取所述文档,并以与所述处理装置相关的处理器控制设置来处理所述文档。该文档处理系统还包括一个分析装置,用来分析该处理后的文档以确定何时对所述文档内的至少一个带使用不同的处理器控制设置,以及一个访问装置,用于随机地访问存储在该随机访问缓存中的至少一个带以使用所述不同的处理器控制设置重新处理该带。
为了概述本发明,描述了本发明的特定的方面,优点和新颖的特征。可以理解的是并不是所有的这些优点都必需在任何一个本发明的特定实施例中实现。因此,本发明可以表达或实施为实现或最优化此处所教导的一个优点或者一组优点,而不必实现所教导或暗示的其它优点。
附图说明
参考附图,实现本发明的各种特征的一个常规架构将被描述。这些附图和相关的描述用来说明本发明的实施例而不是限制本发明的范围。所有附图中,重复使用标号以表明与标示部件之间的对应。另外,每个标号的第一个数字表明该部件第一次出现在的附图编号。
图1是数据采集和二次扫描系统的一个实施例的框图。
图2是远程部署的数据采集和二次扫描系统的一个实施例的框图。
图3是一个具有分析引擎的数据采集和二次扫描系统的一个实施例的框图。
图4是一个具有分析引擎的数据采集和二次扫描系统的硬件执行的实施例的框图。
图5是远程部署的具有分析引擎的数据采集和二次扫描系统的一个实施例的框图。
图6是远程部署的具有分析引擎的数据采集和二次扫描系统的硬件执行的实施例的框图。
图7是具有第一和第二分析引擎的数据采集和二次扫描系统的一个实施例的框图。
图8是具有第一和第二分析引擎的数据采集和二次扫描系统的硬件执行的实施例的框图。
图9是远程部署的具有第一和第二分析引擎的数据采集和二次扫描系统的一个实施例的框图。
图10是远程部署的具有第一和第二分析引擎的数据采集和二次扫描系统的硬件执行的实施例的框图。
图11是包括多个采集装置和多个用户的数据采集和二次扫描系统的一个实施例的框图。
具体实施方式
图1是数据采集和二次扫描系统150的一个实施例的框图。该数据采集和二次扫描系统150包括一个数据采集装置100,其包括一个数据捕获装置101,一个标准化处理器102和一个通信装置103。数据捕获装置101的例子包括,但不限于,扫描器、照相机、录像机、红外照相机、声学照相机、数码照相机、传真机、任何能够捕获图像的装置、声音传感器、任何具有声音传感器的装置等等。数据捕获装置101可以为非实时装置,例如扫描仪,或者数据采集装置101为实时装置,例如照相机和录像机。
该数据采集和二次扫描系统150还包括一个用户系统110,其包括一个与所述通信装置103通信的通信装置104,一个随机访问数据缓存105,一个数据处理器106,一个用户接口107,以及一个数据显示器108。在一个实施例中,该随机访问数据缓存将数据存储在至少一个分段、区段、带、图像条、数据条等等,并且是以可随机访问的方式。
该数据采集和二次扫描系统150还包括一个应用/存储装置109。该应用/存储装置109的例子包括,但不限于,计算机处理器,程序逻辑,控制电路,通用单芯片或多芯片微处理器,数字信号处理器,嵌入式微处理器,微控制器等等。数据存储器的例子包括易失性存储器和非易失性存储器,硬盘驱动器,DVD存储器,CD ROM存储器,光学和磁光存储器,可移动或者非可移动快速存储装置,或其它存储装置。
模拟数据呈现在采集装置100。模拟捕获装置101测量该模拟数据。标准化处理器102将测量的数据转换为标准化的数据。其校正和补偿已知的由传感器测量模拟数据而引入的错误和偏差,以产生标准化数据。
该标准化的原始数据,以后称为原始数据,经过一个使用通信装置103和104的快速连接被传输到用户系统110,并且存储在该随机访问数据缓存105中。该原始数据以带、图像条、数据条等存储在该随机访问缓存105中。在一个实施例中,该随机访问数据缓存分成65K字节的带。
除了该原始数据,该原始数据的附属数据,或每个带的元数据,也被存储在该缓存105中。这些元数据包括,但不限于,标识该数据和在缓存中位置的标记,采集的时间和日期标记,序列号,数据带的起点,数据带的终点,高度,宽度,指向下一个带的指针,等等。在一些实施例中,标记标识原始数据的分段或区段。
该数据处理器106使用默认数据处理设置处理该原始数据。
利用该数据处理器106处理该原始数据的顺页序自动地确定或者交互式地确定。在一个自动的实施例中,最先存储于缓存105中的当前或较当前的数据被处理。
在一个交互式的实施例中,用户使用数据标记或元数据识别特定的原始数据带或分段进行处理。这些带在缓存105中是可以随机访问的。这允许非实时的虚拟二次采集。
处理后的数据连同它们的元数据一起显示在数据显示器108上。该默认数据处理设置可通过用户接口107调整。设置的改变引起该数据处理器106使用改变的设置重新处理所选取的存储在随机访问缓存105中的数据,并且在数据显示器108上显示重新处理后的数据。通过交互式地重新调整处理设置,这些数据会一直被处理直到满足用户的喜好。
除了控制数据处理器106,用户接口107还控制随机访问数据缓存105。通过该用户接口107,用户可以访问原始数据的分段,区段,带,图像条,或数据条,以及为非实时交互式处理选取特定的原始数据。
用户可以将处理后的数据传输到应用/储存装置109,以进一步处理和存储。
图1所描述的数据采集和二次扫描系统150支持多用户使用。该数据采集装置100可被多个用户访问。在一个实施例中,该用户系统110还包括一个计算机(未示)。在一个实施例中,该用户系统100(至少一部分)在计算机上由软件执行。
图2为远程部署的数据采集和二次扫描系统250的一个实施例的框图。该数据采集和二次扫描系统250包括数据采集装置100,一个存储和处理系统212,一个用户系统210,以及采集/存储装置109。
该存储和处理系统212包括通信装置103,随机访问数据缓存105,数据处理器106,和一个通信装置203。
该用户系统210包括一个通信装置204,用户接口107和数据显示器108。
来自采集装置100的原始数据通过一个使用通信装置103和104的快速连接而被传输到存储和处理系统212。该原始数据和元数据存储在该随机访问数据缓存105中。该数据处理器106使用默认数据处理器设置处理该原始数据。
用户系统210通过一个使用通信装置203和204的通信媒介216与存储和处理系统212通信。
现在来关注通信媒介216,如图2所示,在一个实施例中,该通信媒介为互联网--一个计算机全球网络。在另一个实施例中,通信媒介216可以是任何通信系统,包括,举例来说,专用通信线路,电话网络,无线数据传输系统,红外数据传输系统,双向电缆系统,用户化计算机网络,交互式公用网络,等等。
处理后的数据与它们的元数据一起显示在该数据显示器108上。可以通过该用户接口107调整该默认数据处理器设置。改变该设置会引起该数据处理器106使用改变的设置重新处理所选取的存储在该随机访问数据缓存105中的原始数据。通过交互式地重新调整处理器设置,该数据被一直处理直到满足用户的偏好。
用户可以将处理后的数据传输到该应用/存储装置109,以进一步处理和存储。
数据采集和二次扫描系统250与数据采集和二次扫描系统150类似,只是用户系统210相对于数据采集装置100以及存储和处理系统212是远程部署。在远程使用的系统250中,数据缓存105与数据采集装置100位于同地。用户系统210不必使用一个快速连接与数据采集装置100连接以便确保该实施例的有效使用。该数据采集和二次扫描系统250(至少一部分)由软件、固件、或者软件和固件的任意组合执行。
图3是数据采集和二次扫描系统350的一个实施例的框图,包括一个分析引擎。该数据采集和二次扫描系统350包括数据采集装置100,一个用户系统310,和应用/存储装置109。该用户系统310包括通信装置104,随机访问数据缓存105,数据处理器106,用户接口107,数据显示器108,和一个分析引擎314。
模拟数据呈现在采集装置100。模拟采集装置101测量该模拟数据。该标准化处理器102将测量得到的数据转换为标准化的原始数据。该原始数据通过使用通信装置103和104的一个快速连接传输给用户系统310。在用户系统310,原始数据存储在随机访问数据缓存105中。
选取的原始数据通过分析引擎314进行分析。在一个实施例中,该分析引擎314是一个采集控制器314。选取机制可以是如前面的实施例所描述的自动的或者交互式的。由该分析引擎314所执行的分析为所选的原始数据的产生新的数据处理器设置。分析的例子包括,但不限于,页面分界检测,条纹检测,页面边界检测,空白页检测,将RGB色彩表示法转换为YCbCr色彩表示法,色调测量,饱和度测量,亮度测量,产生灰度色标强度柱状图,产生色彩柱状图,几何分析,色彩检测,亮度和色彩等级的伽马检测,以及文本定向等等。
这些设置被传送到数据处理器106,然后原始数据以这些新的设置被处理。处理后的数据显示在该数据显示器108上。数据处理器设置可以使用用户接口107交互式地调整。除了确定数据处理器设置,分析引擎314还自动检测那些有可能导致低质量处理数据的原始数据并且在用户通过用户系统310选取这些数据时给予警告。用户可通过用户接口107访问相应的俘获条件(例如,用户定义的参数指定质量门槛,如亮度范围,对比度反问,缺角,空白页等等)。用户通过该用户接口107可以控制获取数据的质量。
用户系统310可将处理后的数据传输到应用/存储装置109,以进一步处理和存储。另外,用户可以通过用户接口107访问存储在该随机访问数据缓存105中、需要由数据处理器106处理的原始数据的分段或区段。
数据采集和二次扫描系统350允许对特定的原始数据进行非实时交互式处理。数据采集和二次扫描系统350也支持多用户使用。数据采集装置100可以被多个用户系统310访问,每一个数据处理器106都具有唯一的处理器设置。在一个实施例中,数据采集和二次扫描系统350还包括一个计算机(未示)。在一个实施例中,该数据采集和二次扫描系统350(至少一部分)被计算机上的软件执行。
图4为数据采集和二次扫描系统450的一个实施例的框图,包括数据采集装置100,一个用户系统410,以及分析引擎314。该数据采集和二次扫描系统450以硬件执行图3所示的数据采集和二次扫描系统350。
随机访问数据缓存105,数据处理器106和分析引擎314在数据采集装置100上执行。该数据采集装置100还包括一个数据捕获装置101,标准化处理器102,和通信装置103。用户系统包括通信装置104,用户接口107,和数据显示器108。
图5是远程部署的数据采集和二次扫描系统550的一个实施例的框图,包括分析引擎314。该数据采集和二次扫描系统550包括数据采集装置100,一个存储和处理系统512,一个用户系统510,以及采集/存储装置109。
该存储和处理系统512包括通信装置104,随机访问数据缓存105,数据处理器106,分析引擎314,和一个通信装置503。
用户系统510包括一个通信装置504,用户接口107和数据显示器108。
来自采集装置100的原始数据通过使用通信装置103和104的一个快速连接被传送到存储和处理系统512。原始数据和元数据被存储于该缓存105中。数据处理器106使用默认数据处理器设置处理该原始数据。
所选取的原始数据通过分析引擎314被分析。该分析引擎314所执行的分析为选取的原始数据产生新的数据处理设置。这些设置被传送到该数据处理器106,然后原始数据使用这些新的设置被处理。
用户系统510通过使用通信装置503和504的通信媒介216与存储和处理系统512通信。处理后的数据显示在数据显示器108上。可以使用用户接口107交互式地调整该数据处理器设置。
通过用户系统510,用户可以将处理后的数据传送到应用/存储装置109,以进一步处理和存储。另外,用户可以通过该用户接口107访问存储在随机访问数据缓存中、需要由该数据处理器106处理的原始数据的分段或区段。
数据采集和二次扫描系统550允许非实时交互式处理特定的原始数据。该数据采集和二次扫描系统550类似于数据采集和二次扫描系统350,只是该用户系统510位于数据采集装置100以及存储和处理系统512的远程。在该远程部署的系统550中,数据缓存105和分析引擎314位于该数据采集装置100的本地。
该数据采集和二次扫描系统550也支持多用户使用。该数据采集装置100可以被多个用户系统510访问,每一个数据处理器106都具有唯一的处理器设置。该数据采集和二次扫描系统550(至少一部分)由软件、固件、或者软件和固件的组合执行。
图6是远程部署的数据采集和二次扫描系统650的硬件执行实施例的框图,包括分析引擎314。该数据采集和二次扫描系统650以远程部署执行图4所示的数据采集和二次扫描系统450。该数据采集和二次扫描系统650包括数据采集装置100,一个用户系统610,以及应用/存储装置109。
随机访问数据缓存105,数据处理器106和分析引擎314直接在该数据采集装置100以硬件执行。该数据采集装置100还包括数据捕获装置101,标准化处理器,和通信装置103。该用户系统610包括用户接口107,数据显示器108,和一个通信装置604。
该用户系统610通过使用通信装置103和604的通信媒介216与该数据采集装置100通信。
图7是数据采集和二次扫描系统750的一个实施例的框图,具有一个第一分析引擎714和一个第二分析引擎718。该数据采集和二次扫描系统750包括数据采集装置100和一个用户系统710。该数据采集装置100包括数据捕获装置101,标准化处理器102,和通信装置103。该用户系统710包括通信装置104,随机访问数据缓存105,数据处理器106,用户接口107,和数据显示器108。该用户系统710还包括第一分析引擎714和第二分析引擎718。在一个实施例中,该第一和第二分析引擎714、718分别为第一和第二采集控制器714、718。
模拟数据呈现在采集装置100。数据捕获装置101测量该模拟数据。标准化处理器102将测量得到的数据转换为标准化的原始数据。该原始数据通过使用通信装置103和104的一个快速连接被传递到该用户系统710。
在用户系统710,该原始数据被存储在缓存105中。该原始数据以带、图像条、数据条等存储在随机访问数据缓存105中。在一个实施例中,该随机访问数据缓存分为64K字节的带。
除了该原始数据,该原始数据的附属数据,或每个带的元数据,也存储在缓存105中。这些元数据包括但不限于,标识该数据和在缓存中位置的标记,采集的时间和日期标记,序列号,数据带的起点,数据带的终点,高度,宽度,指向下一个带的指针,等等。在一些实施例中,所述标记标识原始数据的分段或区段。
选取的原始数据由所述第一分析引擎714进行分析。选取机制可以是如前面的实施例所述的自动的或者交互式的。由该第一分析引擎714执行的分析为选取的原始数据的产生改进的或接近最佳的数据处理器设置。在一个实施例中,该第一分析引擎714执行几何处理,例如,文档定位,背景补偿,色彩补偿,文本提取,文本/背景分离,页面分界检测,条纹检测,页面边界检测,空白页检测,由RGB色彩表示法向YCbCr色彩表示法的转换,色调测量,饱和度测量,亮度测量,产生灰度色标强度柱状图,产生色彩柱状图,色彩检测,亮度和色彩等级的伽马检测,等等。
这些设置被传送给数据处理器106,然后使用这些设置处理该原始数据。
处理后的数据被传送至该第二分析引擎718。在一个实施例中,处理器106传送该处理后的数据至该第二分析引擎718以进行分析。在另一个实施例中,处理器106传送该处理后的数据至该第一分析引擎714,然后该第一分析引擎714传送该处理后的数据至该第二分析引擎718以进行分析。
在该第二分析引擎718,该处理后的数据被分析,然后改进的数据处理器设置被确定。该第二分析引擎718将该处理后的数据与一个预定的标准进行对比。根据由该标准确定的处理后数据的质量,该第二分析引擎718选取新的处理器设置。
在一个实施例中,该第二分析引擎执行特征或质量处理,例如,识别低光学特性识别区域,非线性伽马,高背景噪声,特征色彩失真等等。在一个实施例中,该第二分析引擎(至少一部分)替代在数据显示器108上的用户数据复查以及通过该用户接口107的用户校正处理器设置。
这些新的设置传递至数据处理器106,然后这些原始数据以这些新的设置被重新处理。在一个实施例中,该第二分析引擎718将包含该原始数据在该随机访问缓存105中位置的元数据和该新的处理器设置发送至处理器106。该处理器106使用该新的设置处理该数据。
在另一个实施例中,该第二分析引擎718将与该数据有关的元数据和新的处理器设置发送至该第一分析引擎714。该第一分析引擎714接收包含该原始数据在该随机访问缓存105中位置的元数据和该新的处理器设置,并将包含该原始数据在该随机访问缓存105中位置的元数据和该新的处理器设置发送至处理器106。该处理器使用新的处理器设置处理该原始数据。
在又一个实施例中,该第二分析引擎718将与该数据有关的元数据发送至该第一分析引擎714。该第一分析引擎714接收包含该原始数据在该随机访问缓存105中位置的元数据和该新的处理器设置,并使用这些新的处理器设置处理该原始数据的带。
处理后的数据发送至该第二分析引擎718以进行分析。在一个实施例中,该处理器106发送该处理后的数据至该第二分析引擎718以进行分析。在另一个实施例中,该第一分析引擎714将该处理后的数据发送至该第二分析引擎718以进行分析。
使用修正的数据处理器设置重新处理原始数据的步骤和分析处理后的数据并确定修正的数据处理器设置的步骤不断重复直到收敛,即,直到所述标准检测不到处理后数据在质量方面的任何改进。这产生改进的或最佳的处理器设置。
例如,一个扫描仪以600点每英寸(dpi)的分辨率扫描一个文档。该文档包括各种字体大小的正文。该原始数据,连同与每个原始数据的带相关的元数据一起,以带的形式存储在该随即访问数据缓存105中。
为了节省处理时间和用户存储空间,该第一分析引擎714发送该处理器106的设置,以在200dpi的分辨率处理该数据,例如,连同如上所述的其他可能的几何处理设置一起发送。
该处理器106使用来自该第一分析引擎714的设置处理该原始数据。处理后的数据和相关的元数据被传送至该第二分析引擎718。
该第二分析引擎718使用一个预定的标准分析该处理后的数据。例如,该第二分析引擎718确定该处理后数据的一个带不可识别,可能是因为该正文的大小对于200dpi的分辨率来说太小而不能识别。该第二分析引擎718将与该无法识别的数据的带相关的元数据连同新的处理器设置发送至该处理器106,以在400dpi的分辨率处理该数据。
该处理器106接收包含该原始数据在该随机访问缓存105中位置的元数据和该新的处理器设置,并以400dpi处理该原始数据的带。该处理器106将处理后的数据带及其相关的元数据发送至该第二分析引擎718以进行分析。
该第二分析引擎718确定处理后的数据带是否符合预定的标准。如果否,该第二分析引擎718将与该带相关的元数据连同新的处理器设置发送至处理器106以处理该原始数据的带。例如,该第二分析引擎718确定该带中的文本即使在400dpi的分辨率也无法识别,并将与该带相关的元数据连同新的处理器设置发送至该处理器106,以在600dpi的分辨率处理器原始数据的带。
分析数据和用新的处理器设置重新处理原始数据的过程一直持续,直到该第二分析引擎718确定处理后的数据符合预定的标准。处理该原始数据的带的部分的处理参数可以被改变而无需重新处理所有的原始数据。在一个实施例中,重新处理部分捕获的数据节省了处理时间和数据存储空间。
通过这些步骤获得的处理后的数据显示在该数据显示器108上。该数据处理器设置可以使用该用户接口107交互式地调整。
除了确定数据处理器的设置,该第一分析引擎714和第二分析引擎718还自动检测有可能导致低质量处理数据的原始数据。如前所述,用户可以通过该用户接口107访问相应的俘获条件,以使用户能够有效地控制所获取的数据的质量。
另外,用户可以通过该用户接口107访问存储在该随机访问数据缓存105中的、需要处理器106处理的原始数据的分段或区段。
该数据采集和二次扫描系统750也允许特定原始数据的非实时交互式处理。用户可以发送处理后的数据到应用/存储装置109,以进一步处理和存储。该数据采集和二次扫描系统750支持多用户使用。该采集装置100可被多个用户系统750访问,每个数据处理器都具有唯一的处理器设置。在一个实施例中,该数据采集和二次扫描系统750还包括一个计算机(未示)。在一个实施例中,该数据采集和二次扫描系统750(至少一部分)由该计算机上的软件执行。
图8是数据采集和二次扫描系统850的一个实施例的框图,包括第一分析引擎714和第二分析引擎718。该数据采集和二次扫描系统850以硬件执行图7所示的数据采集和二次扫描系统750。
该数据采集和二次扫描系统850包括数据采集装置100,一个用户系统810,和应用/存储装置109。该随机访问数据缓存105,数据处理器106,第一分析引擎714和第二分析引擎718在数据采集装置100被执行。该数据采集装置100还包括数据采集装置101,标准化处理器102,和通信装置103。该用户系统810包括通信装置104,用户接口107和数据显示器108。
图9是远程部署的数据采集和二次扫描系统950的一个实施例的框图,包括第一分析引擎714和第二分析引擎718。该数据采集和二次扫描系统950包括数据采集装置100,一个存储和处理系统912,一个用户系统910,以及采集/存储装置109。
该数据采集装置包括数据捕获装置101,标准化处理器,和通信装置103。
该存储和处理系统912包括通信装置104,随机访问数据缓存105,数据处理器106,第一分析引擎714,第二分析引擎718,以及一个通信装置903。
该用户系统910包括一个通信装置904,用户接口107,以及数据显示器108。
来自该采集装置100的原始数据通过使用通信装置103和104的一个快速连接被传递至该存储和处理系统912。该原始数据和元数据存储在该缓存105。数据处理器106使用默认数据处理器设置处理该原始数据。
在数据存储和处理系统912,原始数据被存储于该数据缓存105中。选取的数据由该第一分析引擎714分析。该选取机制可以是前述实施例中所描述的自动的或者交互式的。由该第一分析引擎714执行的分析产生给定的选取数据的改进的或者接近最佳的数据处理器设置。这些设置被传送到数据处理器106,然后原始数据使用这些给定的设置被处理。
处理后的数据被传送至该第二分析引擎718。在第二分析引擎718,分析该处理后的数据,然后改进的数据处理器设置被确定。该第二分析引擎718使用一个标准确定处理后的数据的质量。根据由该标准确定的处理后数据的质量,第二分析引擎718选择新的处理器设置。这些改进的设置被传送该数据处理器106,然后原始数据被重新处理。使用修正的数据处理器设置重新处理该处理后的数据,以及分析该处理后数据并确定修正的数据处理器设置的步骤不断重复直到收敛,即,直到该标准不能检测到处理后数据在质量上的任何改进,如前所述。这产生了改进或最佳的处理器设置。
该用户系统910通过一个使用通信装置903和904的通信媒介216与该存储和处理系统912通信。该处理后的数据显示在数据显示器108上。该数据处理器设置可以使用该用户接口107交互式地调整。
通过该用户系统910,用户可以将该处理后的数据传送至该应用/存储109,以进一步处理和存储。另外,用户可以,通过该用户接口107,访问存储在该随机访问数据缓存105中的、需要由数据处理器106处理的原始数据的分段或区段。
该数据采集和二次扫描系统950允许特定原始数据的非实时交互式处理。该数据采集和二次扫描系统950与所述数据采集和二次扫描系统750类似,只是用户系统910位于该数据采集装置100以及该存储和处理系统912的远程。在远程部署的系统950中,该数据缓存105,数据处理器106,第一分析引擎714,和第二分析引擎718位于该数据采集装置100的本地。
该数据采集和二次扫描系统950也支持多用户使用。该数据采集装置100可被多个用户系统910访问,每个数据处理器106都具有唯一的处理器设置。该数据采集和二次扫描系统950(至少一部分)由软件、固件、或者软件和固件的组合来执行。
图10是由硬件执行的、远程部署的数据采集和二次扫描系统1050的实施例的框图,包括第一分析引擎714和第二分析引擎718。该数据采集和二次扫描系统1050执行图8所示的、远程部署的数据采集和二次扫描系统850。该数据采集和二次扫描系统1050包括数据采集装置100,一个用户系统1010,以及应用/存储装置109。
随机访问数据缓存105,数据处理器106,第一分析引擎714,和第二分析引擎718在该采集装置100由硬件执行。该数据采集装置100还包括数据捕获装置101,标准化处理器102,和通信装置103。
该用户系统1010包括用户接口107,数据显示器108,和一个通信装置1004。该用户系统1010通过一个使用通信装置103和1004的通信媒介216与该数据采集装置100通信。
图11为数据采集和二次扫描系统1150的一个实施例的框图,包括多个数据采集装置100和多个用户系统1110。所述多个用户系统1110位于所述多个数据采集装置100的远程。
该数据采集装置100包括数据捕获装置101,标准化处理器102,通信装置103,随机访问数据缓存105,以及数据处理器106。在一个实施例中,该数据处理器106是低处理能力引擎。
该用户系统1110包括用户接口107,数据显示器108,一个通信装置1104,和一个分析引擎1114。在一个实施例中,该分析引擎1114是高性能分析处理器。
模拟数据呈现在该采集装置100。该模拟数据捕获装置101测量该模拟数据。该标准化处理器102将测量的数据转换为标准化的原始数据。该数据处理器106用于该数据的转换。转换后的数据存储在该随机访问数据缓存105中。数据处理的例子包括,但不限于,文档定位,背景补偿,色彩补偿,文本提取,文本/背景提取,起点,相关性,斑点去除,等等。
在实时广播推进模式下或者应至少一个用户系统1110的请求工作,选取的缓存数据由数据处理器106测量和压缩。该通信装置105通过一个使用通信装置103的通信媒介216将所述测量和压缩的数据,以及相关的标记或元数据发送至该用户系统1110。
在一个实施例中,该标记数据包括该采集装置的地址和该数据在该缓存105中的位置。在一个实施例中,该元数据包括,但不限于,标识该数据及其在该缓存中位置的标记,采集的时间和日期标记,序列号,数据带的起点,数据带的终点,高度,宽度,指向下一个带的指针,等等。该标记数据嵌入在该通信媒介216的通信网络协议中。
该用户系统1110通过该通信媒介216和通信装置1104接收数据。该数据由分析引擎1114分析。如果该分析检测到一些相关数据区域的检测结果特征是在用户确定的边界之外,该分析引擎1114通过发送与该数据相关的标记以及该数据范围内有关系的区域的位置而启动该用户接口107。
该用户接口107可以自动的或者手动操作。该用户接口107使用该标记内容和区域位置向该相应的数据采集装置100请求带有新的处理设置的一个新的数据集。该数据处理器106使用该新的设置重新处理选取的数据,然后采集装置100重新传输该重新处理后的数据至该用户系统1110。这个虚拟的二次扫描操作是一个交互式的过程,其使用不同的设置或窗口。
在上述交互式处理的过程中,该多个采集装置100持续向该多个用户系统1110实时传送该数据。在一个实施例,该用户,通过该数据显示器108,可以显示任何收到的数据。在一个实施例,接收数据的任何部分可由该应用/存储装置109存储。
在一个实施例中,该用户系统1110可在该一个或多个与该选取的数据相关的数据采集装置100的数据缓冲105锁定选取的数据。当该用户系统1110在需要的分辨率接收该选取的数据时,该用户系统1110解锁该数据。在一个实施例中,该用户系统1110具有一个授权级别以锁定数据。在该数据缓存105中的非锁定数据以先入先出的方式被覆盖。
示范性实施例
这部分的示范性实施例包括虚拟二次扫描流程,检测定向方法,检测渗透方法,色彩检测方法,背景平滑方法,和检测扫描页面分界的方法。
示范性虚拟二次扫描(VRS)流程
在一个实施例中,如果用户选择使用VRC处理来扫描图像,该VRS处理初始化该扫描仪以获取一个原始的(未处理的)主图像。如果用户选择黑白扫描,则该主图像具有灰度色标,此外,该主图像具有用户指定的灰度色标或色彩。
VRS处理还使用预先定义的扫描仪特异性设置初始化该扫描仪。这些设置帮助该VRS处理提高其性能。例如,这些设置中的一个是执行过扫描,即,扫描超过要求的尺寸,这样VRS可以执行一个好的抗扭斜操作。
扫描仪按照该特异性设置扫描一个图像,然后该原始图像从该扫描仪传输至该VRS缓存。
该VRS软件执行一个或多个图像处理算法。在一个实施例中,一个分析引擎包括该VRS。一个算法确定在扫描的原始图像中的实际页面边界。在一个实施例中,该扫描的图像包含由于过扫描导致的扫描仪引入的背景。为多个背景确定该页面边界,如黑色、白色、灰色、等等。类似条纹检测的技术被用于,例如,由脏的扫描仪镜头/灯、滚轴等引入的线纹。其他技术,如页面边界阴影检测,被用来确定页面的边界。
另一个图像处理算法确定扫描的页面是否为空白。当进行双面扫描时,页面可能包含从该页面另一侧渗透过来的色彩。如果该算法确定该页面没有内容,该页面可以根据用户设置被删除。
另一个图像处理算法将页面内容从RGB色彩表示法转换为YCbCr(亮度,色调和饱和度格式)。这允许在页面的色调和饱和度方面的许多色彩相关操作,因此,导致速度的改进。如果该扫描仪以黑白方式扫描,这一步就不执行。
另一个图形处理算法分析该图像。可能的分析是执行亮度分析并且提取该灰度色标强度信息形成柱状图,提取色彩信息形成色彩柱状徒,在页面上执行几何分析,等等。
另一个图像处理算法基于前面的分析检测文档是否具有色彩。如果没有色彩内容,该算法将该扫描仪设置设为指示该文档是黑白文档。如果文档具有背景色彩并且该背景色彩是占优势的色彩,该算法将该扫描仪设置设为指示该文档是彩色文档。另外,如果该文档包含色彩内容,用户可以调整该扫描仪设置以重新产生色彩或不重新产生色彩,根据该彩色内容是否与特定文档内容有关,或者是否是该文档的主要特征,如在黄色纸上的文档。
另一个图像处理算法执行在图像上的伽马校正以调整亮度和色彩等级。
一个进一步的图像处理算法基于前述的分析执行在页面图像上的抗扭斜和剪切。
另一个图像处理算法检测图像上的文本方向,并且如果需要,直角旋转该图像。
另一个图像处理算法执行其它操作,例如,条形码检测,线条过滤,斑点去除,使用背书字串注释,等等。
一个进一步的图像处理算法通过检测背景色彩并将它们融合在一起来执行背景平滑。
如果该图像有问题,不能自动地校正,该图像处理软件向用户显示处理后的图像和设置。用户然后确定图像的设置。当用户改变这些设置后,该图像处理软件使用用户指定的设置执行一个或多个上面讨论的图像处理算法并且向用户显示处理后的图像。当用户接受该图像,该图像处理软件使用由用户选择的最终设置重新处理该原始图像。
在另一个实施例中,一个第二分析引擎执行额外的分析以确定该处理后的图像是否符合预定的要求。如果该图像不不符合预定的要求,该第二分析引擎确定新的设置并使用该新的设置重新处理该原始图像。这个过程不断重复直到该图像符合该要求。
当该图像处理完成时,该图像处理软件将该图像发送给该应用程序。
示范性检测方向
在一个实施例中,该检测方向算法自动检测怎样直角旋转文本页面以观看。该算法从该页面内的黑色相连成分中选择可能的单独的字符。该算法然后通过使用训练过的神经网络确定该单独字符的方向。该算法使用该神经网络的方向结果来确定更好的页面方向。
该算法在页面图像内找到相连成分。由于这些成分中的部分可能包含图形元素,该算法使用许多约束条件以滤去该页面图像内的非字符。这些约束条件的例子是:超过预定门槛的像素的数目;宽度和高度都足够大;高度与宽度的比没有超过一个预定的门槛;相连成分中黑色像素的数目与它的边界框区域的比不是太大或者太小;这些成分的大小不接近该页面的大小;以及从白色转换为黑色和在水平或垂直方向沿横过该字符的一条线转回的数目不太大。
通过这个测试的一些部分可能包含粘合的字符,破碎字符的碎片,等等。在一个实施例中,假设合理的图形质量,具有统计学意义的多数包含单独的字符。
该算法按比例地缩放每一个组分以适合一个20×20像素的灰度色标正方形。该算法然后在灰度色标正方形的周围增加2个像素白色空白,并将所得到的24×24的图像发送至一个训练过的前馈神经网络以用于方向检测。
在一个实施例中,该算法中使用的神经网络具有预处理层,其将该576个输入转换为144个特征。这些特征分别穿过两个180个和80个节点的隐藏层。该神经网络的结果为四个输出,以“上”,“下”,“左”,“右”方向指明可信度。这个使用伽泊小波(Garbo Wavelets)的具有其相当独特的预处理的神经网络已在下文中被描述:“A Subspace Projection Approach toFeature Extraction:The Two-Dimensional Gabor Transform for CharacterRecognition”,Neural Networks,7(8),129-1301,1994,和“Neural NetworkPositioning and Classificaion of Handwritten Characters”,NeuralNetworks,9(4),685-693,1996。该神经网路的训练不是运行时算法的一部分,而是使用从一般商业化字体缩放的字符离线执行,这些商业化字体例如Arial,Times Roman,Courier等等。
接着,该算法决定是否接受该具有最高可信度等级的方向。该算法基于可信度决定超出预定门槛的比率。
为了增加或最大化精度,在一个实施例中,该页面分析使用在其中发现的组分。典型地,对于大多数文本页面,组分的小百分比足够做出可信的决定。为了在精度和速度之间取得一个合理的权衡,该页面被分为多组条带。每一组中的条带分散在页面上以拟随机的选取组分。在一个实施例中,如果在第一组中的较好连接的组分的数量超过预定的数量,并且得票数可信地确定获胜的方向,则算法返回该结果。反之,下一组条带被处理,然后再下一组......,直到符合结束的条件,或者直到页面上所有或预定百分率的成分都被检查到。
由于字体的大小和分辨率变得更小,识别字符形状变得更加困难。为了该算法很好的执行,在一个实施例中,二进制字符的高度超过16像素。该算法可表现出字符的适度降低,直到8个像素的高度。
在一个实施例中,该算法可假设页面上的大多数连接的组分是单独的字符。
该算法的实施例已经使用拉丁字母训练。由于在拉丁字母和西里尔字母之间,以及在拉丁字母和希腊字母之间,有许多共同的形状,该算法也可以较好地执行西里尔和拉丁字母。该算法可以为不同字符集进行特定的训练。
示范性检测渗透
检测渗透算法的一个实施例自动检测在扫描文档侧面的渗透,以在这些页面上执行进一步的图像处理。在一个实施例中,该算法在正面和背面扫描图像内使用页面边界检测以大致地匹配侧面等同物。然后,该算法使用已有的彩色或灰度内容对图像进行微调。这个额外的步骤可以使用是因为正面和背面照相机稍微不同的光学和倾斜。如果剩余的(未解释的)内容低于预定的密度标准,该算法确定该页面是空白的。
在一个实施例中,该算法相对于该扫描仪的背景检测该页面的每个面。接着,该算法在该页面的两面运行单独的空白页检测,以确定是否该页面的一个或两个面为空白,不管是否可能有渗透。如果一个或两个面是空白,则该算法结束。
如果一个或两个面不是空白,该算法确定该页面的两个面的主背景。接着,该算法选择具有更多内容的一面作为正面。随后,该算法使用页面相应的矩形将背面映射到正面。
色彩与该背景显著不同的深像素在两面被标记出来,以形成模糊图像。该算法一块接着一块的局部分析该模糊图像,以确定相对于粗糙图像的局部漂移。接着,该算法使用最小均方近似法完成背面到正面的映射。该算法在正面深色内容预定的距离内取消该背面的内容,然后该算法将剩余图像发送至该空白页检测步骤。
示范性色彩检测
色彩检测算法的一个实施例检测在扫描图像中的彩色内容,以及分辨前景色彩和背景色彩。该算法消除该背景色彩,如果它是文档中最主要的色彩。该算法检查该扫描图像中的像素,以及确定该像素是否为彩色像素和是否该像素是背景像素。该确定使用像素的饱和度和亮度等级。
在一个实施例中,该算法将图像从RGB表示法转换为YCbCr(光亮度和色度)表示法。该算法根据像素的饱和度组分以确定饱和度等级。饱和度提供一个像素的色彩总量的尺度。饱和度越高,色彩越鲜艳。这个值越低,则像素包含的色彩就越少。饱和度表示为0到182之间的一个数值,其由用于计算饱和度的数学公式得出。在一个实施例中,一个用户可调整的色彩门槛值被用于确定一个像素是否是彩色像素。如果该饱和度的值大于该门槛值,则该像素就是彩色的,否则就不是。
当扫描仪扫描一个文档时,该算法确定像素是否是一个背景像素,该文档和/或该扫描仪的白色或黑色背景可以表现为低饱和度的浅或深色。对于大多数图像,背景像素的数量在整个区域中占有一个大的百分比。为了消除图像的白色和/或黑色背景部分的影响,该色彩检测算法使用一个白色背景门槛,一个黑色背景门槛,和一个背景饱和度门槛以确定背景像素的成员资格。在一个实施例中,如果该像素的亮度高于该白色背景门槛或者低于该黑色背景门槛,且像素的饱和度低于该背景饱和度门槛,那么该像素被归类为一个背景像素。否则,该像素就是非背景像素。
该算法分析该非背景像素,通过基于像素的饱和度值建立的柱状图来确定各种色彩内容。一个扫描仪可能会由于灯光或镜头而向扫描的图像中引入一些色彩。例如,一个脏的镜头会增加色彩斑点。如果一个像素的色彩饱和度值低于一个预定的门槛,该算法确定该像素没有颜色。否则,该像素被认为具有有效的颜色。如果该文档包含任何有效颜色,该文档就被认为是一个彩色文档。
示范性背景平滑
一个背景平滑算法的实施例降低了图像背景中的色彩数目,以提高图像的外观,以及减少压缩后该图像的大小。
该算法把在该图像中找到的颜色集成簇并且将包含足够像素的颜色作为背景。
该算法确定该背景簇的共同出现以确定两个或多个簇是否实际上代表一个单一的背景。这些类型的背景是通过抖动或者使用微点产生的,人眼将它们感知为背景内的平均色彩。当该扫描仪以高分辨率扫描该图像时,可以看到每个像素的单独的颜色。该算法合并共同出现的簇并为这些簇计算一个平均的颜色。
然后,该算法确定背景是否具有稍微暗一些或亮一些的、相邻的颜色簇。通常,当扫描时,例如,纸张经过该传送器时会由于滚轴和加在该纸张上的力而弯曲,从而在该图像中产生阴影和高亮区。这些阴影和高亮区可以被感知为不同的簇,并且它们可以与该主背景融合。
通过搜索该图像,该算法一个像素接着一个像素地修改该图像,并确定像素的色彩是否属于这些背景簇中的一个。如果该像素属于一个背景簇,该算法将该像素颜色变为该簇的平均色。
示范性检测和扫描页面边界
检测扫描页面边界的算法自动地在扫描的图像内检测页面边界。通常,在工业上使用的页面倾斜检测算法仅对黑色背景扫描可以可靠地工作,在黑色背景扫描中该扫描仪的非常深的背景与典型的白色页面之间的对比不容易丢失。在一个实施例中,这个算法检测相对于任何背景的页面,因此,甚至对于白色背景扫描仪也执行页面倾斜校正和剪切。
由于在扫描仪背景和页面背景之间可能存在非常小的色彩或灰度等级的差别,检测页面边界点无法单独依赖该差别。由此,该算法计算和对比集中在分析像素居中位置的小窗口中的统计量。该算法将这些统计量与集中在扫描图像角的统计量的范围进行对比,其中,该算法需要该扫描仪的背景。
该算法计算在扫描图像四个角的统计量。如果这些角中的一部分不一致,当页面内容靠近该角时可能发生这种情况,该算法不考虑这些不一致的角。
如果这些角中的一些与其它角显著不同,则该算法选择占多数的相似的角。如果只能在相等数量的看似合理的对象中选择,该算法对比该扫描图像内部背景的角,以去掉过剪切页面的背景。
为了限定角,该算法合计扫描仪背景的统计量用于以后使用。
该算法扫描图像的行和栏,以显著区别于那些扫描仪背景的统计学特性寻找第一个和最后一个像素。预定的门槛确定该像素居中的窗口与该扫描仪背景范围的偏差的重要性。
检测到的第一和最后的非背景像素可用于确定候选边缘点。多个限制被用于滤去离群值。例如,如果搜索页面的左边界,该候选边缘点上面或下面具有最接近的邻居,通过连接不同片断形成的角度偏离垂直线在45度以内,并且互相接近。候选边缘点使用最小均方近似法的一个变量进行分析,以找到表示该页面主要矩形的最直的线。根据支持该矩形的边缘点与该边缘点最大可能数目的比值,该算法为找到的矩形分配一个可信的标准,这可以基于页面的大小,分辨率等等。
在该算法确定倾斜的角度之后,该算法检查在该页面主要矩形范围之外的单独的边缘点是否具有其邻居的足够的支持,以指示一个突出,或者存在的与假设的页面矩形形状的其它偏差。被认为有意义的边缘点用于确定剪切线。
在双面扫描的情况下,该算法使页面图像的正面和背面的倾斜角度一致。如果正面检测到的倾斜角度与背面的倾斜角度不同,很可能是其中一个错了。在这种情况下,该算法使用与更高可信度相关的角度并重新计算另一面的剪切线。
类似地,如果正面和背面的剪切线明显不同,该算法使页面图像正面和背面之间的剪切线一致。该算法考虑该页面主矩形与其剪切线之间的差异以确定和去除由于扫描仪伪像产生的延长。
在一个实施例中,页面边界检测算法假设扫描仪的背景是一致的,在扫描宽度上的单独的传感器之间的亮度变化不大,并且几乎没有无效或者校准差的传感器而导致条纹。
尽管描述了本发明特定的实施例,这些实施例仅用举例的方式表述,并且不限制本发明的范围。相反,此处所描述的新的方法和系统可以多种其它形式实现;进而,对于此处描述的方法和系统的删节,置换和改变并不背离本发明的精神。所附权利要求和它们的等同物涵盖本发明范围和精神内的形式及修改。

Claims (30)

1.一种计算机执行的数据处理方法,其特征在于包括:
将来自数据捕获装置的原始或标准化数据存储于计算机可访问存储介质上;
使用一个第一分析引擎分析所述原始或标准化数据中的至少一部分,以确定该原始数据是否在第一组参数内,以及如果否,则使用所述第一分析引擎产生第一组处理器设置;
使用所述第一组处理器设置处理所述原始或标准化数据;以及
使用一个第二分析引擎分析所述处理后的数据的至少一个部分以确定所述处理后的数据是否在第二组参数内,以及如果否,则使用所述第二分析引擎产生第二组处理器设置以重新处理所述原始或标准化数据。
2.根据权利要求1所述的方法,其特征在于还包括使用所述第二组处理器设置重新处理所述原始或标准化数据。
3.根据权利要求2所述的方法,其特征在于还包括重复以下步骤:
使用所述第二分析引擎分析所述处理后的数据的至少一部分,以确定所述处理后的数据是否在所述第二组参数内;
使用所述第二分析引擎产生所述第二组处理器设置,以重新处理所述原始数据;以及
使用所述第二组处理器设置重新处理所述原始数据,直到处理后的数据在所述第二组参数内。
4.根据权利要求1所述的方法,其特征在于,所述数据捕获装置是扫描仪,照相机,红外照相机,声学照相机,数码照相机,录像机,声音传感器或传真机。
5.根据权利要求1所述的方法,其特征在于,处理包括采用至少一种图像处理算法。
6.根据权利要求1所述的方法,其特征在于,处理包括采用至少一种数据处理算法。
7.根据权利要求1所述的方法,其特征在于,处理包括应用检测方向算法,检测渗透算法,色彩检测算法,背景平滑算法和检测扫描页面边界算法中的至少一种。
8.根据权利要求1所述的方法,其特征在于,所述第一组参数与原始或标准化数据的分析相关。
9.根据权利要求1所述的方法,其特征在于,所述第二组参数与处理后数据的分析相关。
10.根据权利要求1所述的方法,其特征在于,所述第二组参数与关于目标数据的处理后数据的分析相关。
11.根据权利要求1所述的方法,其特征在于,所述第二组参数是一个预定的标准。
12.一个数据处理系统,其特征在于包括:
来自数据捕获装置的原始或标准化数据,其中所述原始或标准化数据存储于计算机可访问存储介质中;
一个与所述原始或标准化数据通信的第一采集控制器,该第一采集控制器配置为分析所述原始或标准化数据的至少一部分以确定所述原始或标准化数据是否在第一组参数内,以及如果否,则所述第一采集控制器产生第一组处理器设置;
一个与所述第一采集控制器通信的处理器,其中该处理器配置为使用所述第一组处理器设置处理所述原始或标准化数据;和
一个与所述处理器通信的第二采集控制器,该第二采集控制器配置为分析所述处理后的数据的至少一部分以确定所述处理后的数据是否在第二组参数内,以及如果否,则所述第二采集控制器产生第二组处理器设置,所述处理器使用所述第二组处理器设置重新处理所述原始数据。
13.根据权利要求12所述的数据处理系统,其特征在于,所述数据采集装置是扫描仪,照相机,红外照相机,声学照相机,数码照相机,录像机,温度传感器,声音传感器,或传真机。
14.根据权利要求12所述的数据处理系统,其特征在于,处理包括应用至少一种图像处理算法。
15.根据权利要求12所述的数据处理系统,其特征在于,处理包括应用至少一种数据处理算法。
16.根据权利要求12所述的数据处理系统,其特征在于,处理包括应用检测方向算法,检测渗透算法,色彩检测算法,背景平滑算法,以及检测扫描页面边界算法中的至少一种。
17.根据权利要求12所述的数据处理系统,其特征在于,所述第一组参数与处理后的数据的分析相关。
18.根据权利要求12所述的数据处理系统,其特征在于,所述第一组参数与关于目标数据的处理后数据的分析相关。
19.根据权利要求12所述的数据处理系统,其特征在于,所述第二组参数与定性分析相关。
20.一个文档处理系统,其特征在于包括:
来自一个数据捕获装置的文档数据,其中该文档数据存储于计算机可访问存储介质中;
一个与所述文档数据通信的第一采集控制器,该第一采集控制器配置为分析所述文档数据的至少一部分以确定该文档数据是否在第一组参数内,以及如果否,则该第一采集控制器产生第一组处理器设置;
一个与所述第一采集控制器通信的处理器,其中该处理器配置为使用所述第一组处理器设置处理所述文档数据;和
一个与所述处理器通信的第二采集控制器,该第二采集控制器配置为分析所述处理后的文档数据的至少一部分以确定所述处理后的文档数据是否在第二组参数内,以及如果否,则所述第二采集控制器产生第二组处理器设置,所述处理器使用该第二组处理器设置重新处理所述文档数据。
21.根据权利要求20所述的文档处理系统,其特征在于,所述数据采集装置是扫描仪,照相机,红外照相机,声学照相机,数码照相机,录像机,声音传感器或传真机。
22.根据权利要求20所述的文档处理系统,其特征在于,处理包括采用至少一种图像处理算法。
23.根据权利要求20所述的文档处理系统,其特征在于,处理包括应用检测方向算法,检测渗透算法,色彩检测算法,背景平滑算法和检测扫描页面边界算法中的至少一种。
24.根据权利要求20所述的文档处理系统,其特征在于,所述第一组参数与几何分析相关。
25.根据权利要求20所述的文档处理系统,其特征在于,所述第二组参数与定性分析相关。
26.根据权利要求20所述的文档处理系统,其特征在于,所述第二组参数与关于光学特性识别的定性分析相关。
27.根据权利要求20所述的文档处理系统,其特征在于,所述第二组参数与关于分类的定性分析相关。
28.根据权利要求20所述的文档处理系统,其特征在于,所述第二组参数与关于文本分类的定性分析相关。
29.根据权利要求20所述的文档处理系统,其特征在于,所述第二组参数与关于图像分类的定性分析相关。
30.根据权利要求20所述的文档处理系统,其特征在于,所述第二组参数与关于形式识别的定性分析相关。
CNA2006800091184A 2005-03-24 2006-03-01 处理扫描数据的系统和方法 Pending CN101151882A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US66506705P 2005-03-24 2005-03-24
US60/665,067 2005-03-24
US11/329,999 2006-01-11

Publications (1)

Publication Number Publication Date
CN101151882A true CN101151882A (zh) 2008-03-26

Family

ID=39251336

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2006800091184A Pending CN101151882A (zh) 2005-03-24 2006-03-01 处理扫描数据的系统和方法

Country Status (1)

Country Link
CN (1) CN101151882A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102612833A (zh) * 2009-09-10 2012-07-25 萨热姆文献简易股份有限公司 用于检测空白页的方法以及相应的多功能机
CN103895343A (zh) * 2012-12-26 2014-07-02 北京大学 一种印刷物质量检查方法及系统
TWI478145B (zh) * 2012-09-25 2015-03-21 Shao Yang Wang 顯示裝置之顏色補償系統
CN106503629A (zh) * 2016-10-10 2017-03-15 语联网(武汉)信息技术有限公司 一种词典图片分割方法及装置
CN108781243A (zh) * 2016-07-14 2018-11-09 惠普打印机韩国有限公司 图像形成设备及其控制方法
CN112464720A (zh) * 2020-10-27 2021-03-09 中电金信软件有限公司 文档图像处理、模型训练方法、装置和计算机设备

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102612833A (zh) * 2009-09-10 2012-07-25 萨热姆文献简易股份有限公司 用于检测空白页的方法以及相应的多功能机
CN102612833B (zh) * 2009-09-10 2014-12-31 萨热姆文献简易股份有限公司 用于检测空白页的方法以及相应的多功能机
TWI478145B (zh) * 2012-09-25 2015-03-21 Shao Yang Wang 顯示裝置之顏色補償系統
CN103895343A (zh) * 2012-12-26 2014-07-02 北京大学 一种印刷物质量检查方法及系统
CN103895343B (zh) * 2012-12-26 2017-12-19 北京大学 一种印刷物质量检查方法及系统
CN108781243A (zh) * 2016-07-14 2018-11-09 惠普打印机韩国有限公司 图像形成设备及其控制方法
US10469713B2 (en) 2016-07-14 2019-11-05 Hp Printing Korea Co., Ltd. Image forming apparatus and control method of thereof
CN106503629A (zh) * 2016-10-10 2017-03-15 语联网(武汉)信息技术有限公司 一种词典图片分割方法及装置
CN112464720A (zh) * 2020-10-27 2021-03-09 中电金信软件有限公司 文档图像处理、模型训练方法、装置和计算机设备
CN112464720B (zh) * 2020-10-27 2021-11-23 中电金信软件有限公司 文档图像处理、模型训练方法、装置和计算机设备

Similar Documents

Publication Publication Date Title
US8115969B2 (en) Systems and methods of accessing random access cache for rescanning
US9129210B2 (en) Systems and methods of processing scanned data
US20140333971A1 (en) Systems and methods of processing scanned data
US9769354B2 (en) Systems and methods of processing scanned data
JP4565015B2 (ja) 画像処理装置、画像形成装置、画像処理システム、画像処理プログラムおよびその記録媒体
US6757081B1 (en) Methods and apparatus for analyzing and image and for controlling a scanner
US7623259B2 (en) Image processing apparatus and image processing method to store image data for subsequent retrieval
US8131083B2 (en) Image processing apparatus, image forming apparatus, image processing system, and image processing method having storage section, divided into a plurality of regions, for storing identification information for identifying reference image
CN101196897B (zh) 图像处理设备和图像处理方法
JP2004320701A (ja) 画像処理装置、画像処理プログラムおよび記憶媒体
JP4436858B2 (ja) 画像処理装置、画像形成装置、画像送信装置、画像読取装置、画像処理システム、画像処理方法、画像処理プログラムおよびその記録媒体
US20080292189A1 (en) Image processing apparatus, image forming apparatus, image processing system, and image processing method
JP4378413B2 (ja) 画像処理装置、画像形成装置、画像読取装置、画像処理システム、画像処理方法、画像処理プログラムおよびその記録媒体
JP4350778B2 (ja) 画像処理装置、画像処理プログラムおよび記録媒体
CN101151882A (zh) 处理扫描数据的系统和方法
JP2009015820A (ja) 画像処理装置、画像形成装置、画像送信装置、画像読取装置、画像処理システム、画像処理方法、画像処理プログラムおよびその記録媒体
US9123087B2 (en) Systems and methods for segmenting an image
US8284459B2 (en) Image processing apparatus and image processing method
US20100082698A1 (en) Information processing apparatus, control method thereof, computer program, and storage medium
JP4340714B2 (ja) 原稿抽出方法、原稿抽出装置、コンピュータプログラム及び記録媒体
JP2005110184A (ja) 画像処理装置、画像処理プログラムおよび記憶媒体
JP2022178371A (ja) 画像読取装置および画像読取方法
US20060269133A1 (en) Systems and methods for information handling in an image processing system
JP2007235367A (ja) 画像処理装置、画像処理方法、情報処理装置、プログラム、および記録媒体

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Open date: 20080326