CN104079730A - 文档处理装置和方法及包括该装置的多功能打印机 - Google Patents

文档处理装置和方法及包括该装置的多功能打印机 Download PDF

Info

Publication number
CN104079730A
CN104079730A CN201310103343.6A CN201310103343A CN104079730A CN 104079730 A CN104079730 A CN 104079730A CN 201310103343 A CN201310103343 A CN 201310103343A CN 104079730 A CN104079730 A CN 104079730A
Authority
CN
China
Prior art keywords
document processing
document
image
machine readable
quick response
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201310103343.6A
Other languages
English (en)
Other versions
CN104079730B (zh
Inventor
刘欣
陈仰彬
李一楠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to CN201310103343.6A priority Critical patent/CN104079730B/zh
Publication of CN104079730A publication Critical patent/CN104079730A/zh
Application granted granted Critical
Publication of CN104079730B publication Critical patent/CN104079730B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

本发明涉及一种文档处理装置和方法及包括该装置的多功能打印机。该文档处理装置包括:图像获取装置,被配置为获取文档的图像;识别装置,被配置为识别所获取的图像上的与用于处理文档的机器可读指令相关联的一个或更多个标记;定位装置,被配置为检测所获取的图像上的一个或更多个二维码并根据所检测到的二维码的位置判定所获取的图像中的至少一个区域;提取装置,被配置为从所获取的图像的所述至少一个区域中提取用于所述机器可读指令的参数;以及处理装置,被配置为使用由所述提取装置提取的参数来执行所述机器可读指令。

Description

文档处理装置和方法及包括该装置的多功能打印机
技术领域
本发明涉及文档处理装置和文档处理方法,更特别地涉及从文档提取参数并使用所提取的参数来处理文档的文档处理装置和文档处理方法。本发明还涉及包括该文档处理装置的多功能打印机。
背景技术
多功能打印机也称为多功能一体机,是一种具有打印、复印、传真、扫描等多项功能的打印机,允许在有限的空间内实现尽量多的功能,并具有操作方便成本较低的优点。
随着多功能打印机的普及,越来越多的文档处理是基于扫描的文档来进行的。特别地,一些文档处理需要应从文档中提取的参数。例如,在网络扫描仪中,用户总需要输入或选择扫描的图像的(电子邮寄、传真、存储等的)目的地,但实际上目的地的地址就存在于文档中。又例如,在一些商业模式中,为了提取手写体字符,来自扫描的文档的数字编号是非常有用的。然而,对应当提取参数的区域进行定位并非易事。
已知市场上可获得的打印机(如EPSON公司的EP901A型打印机)中,支持通过读取特定命令页来以不同参数打印多张照片。在一个应用场景中,用户在打印机提供的具有固定格式的特定命令页上进行选择,例如打印纸的类型、照片打印的数量等,然后打印机扫描已经进行选择的特定命令页来获取参数用于打印多张照片。
美国专利申请US8233165B2公开了使用固定格式页面来执行预定处理的装置。在该装置中使用标识符来识别固定格式页面,当扫描到具有已输入的条目的固定格式页面时,多功能机器执行第一文档处理过程。当前面已经扫描到固定格式页面时,如果扫描到与固定格式页面不同的页面,则多功能机器执行第二文档处理过程。当前面没有扫描到固定格式页面时,如果扫描到与固定格式页面不同的页面,则多功能机器执行普通处理。但该装置需要预先定义具有固定格式的可编辑的文档区域并将其存储为内部配置。如果用户希望改变可编辑的文档区域的定义,就需要访问机器内部。
美国专利申请US8194257B2公开了这样的扫描仪:检测扫描文档上的一个或多个预定标记,例如传真标记或电子邮寄标记,并在检测到这样的标记的情况下在显示屏上显示与预定标记相关联的菜单来选择参数(如传真或电子邮寄的目的地)对文档进行处理。但该扫描仪仅把检测到的标记映射到相关联的菜单,其并不需要从扫描文档中提取参数。
美国专利申请US6208436B1公开了通过扫描在文档的头页面上印制的控制信息来批处理文件的方法。头页面上的控制信息使用一维码以固定的格式描述了要对批量文档进行的处理,在控制信息中要处理的文档的页数是重要信息。在通过头页面识别装置提取控制信息之后,扫描仪根据控制信息来处理文档。虽然可以自动处理文档,但该方法依赖于头页面。因此需要额外的工作来准备头页面,并且还需要识别头页面的额外装置。此外,仅在扫描处理开始处执行一次头页面的扫描,如果在准备了头页面之后希望添加或删除被扫描的文件,就需要重新准备头页面。此外,难以对页数进行计数并且当要扫描很多页时容易因此错误计数。
美国专利申请US2008/0309988A1提供了在多功能打印机处处理多个书写页面的方法。在该方法中,对所有书写页面进行扫描并且找到与被打印的页面不同的封面页,使用OCR(光学字符识别)单元识别封面页中的预先定义的操作信息或附加处理命令来指示打印机如何处理文档。可见该方法也需要在封面页中预先定义操作信息或附加处理命令。此外,还需要特别的处理单元把封面页与被打印的页面中区分并且需要特别的OCR单元提取预先定义的操作信息或附加处理命令。
发明内容
从以上描述可见,现有技术中存在难以灵活地从非固定格式的扫描图像区域中提取需要的处理参数的问题。
本发明的目的在于提供一种通过在要被扫描的文档上在现场灵活地添加二维码来限定要提取参数的区域并且使用从该区域中提取的参数进行文档处理的文档处理装置和方法。
本发明的一方面涉及文档处理装置,其包括:图像获取装置,被配置为获取文档的图像;识别装置,被配置为识别所获取的图像上的与用于处理文档的机器可读指令相关联的一个或更多个标记;定位装置,被配置为检测所获取的图像上的一个或更多个二维码并根据所检测到的二维码的位置判定所获取的图像中的至少一个区域;提取装置,被配置为从所获取的图像的所述至少一个区域中提取用于所述机器可读指令的参数;以及处理装置,被配置为使用由所述提取装置提取的参数来执行所述机器可读指令。
本发明的另一方面涉及包括如上所述的文档处理装置的多功能打印机。
本发明的又一方面涉及文档处理方法,其包括:获取文档的图像;识别所获取的图像上的与用于处理文档的机器可读指令相关联的一个或更多个标记;检测所获取的图像上的一个或更多个二维码并根据所检测到的二维码的位置判定所获取的图像中的至少一个区域;从所获取的图像的所述至少一个区域中提取用于所述机器可读指令的参数;以及使用由所述提取装置提取的参数来执行所述机器可读指令。
因此,根据本发明的文档处理装置,能够灵活地从非固定格式的扫描图像区域中提取需要的处理参数。在用户现场根据需要在希望提取参数的区域附近布置二维码之后,就可以通过二维码检测来迅速定位要提取参数的区域以进行文档处理,从而在最大程度地减少用户交互的情况下执行使用参数的文档处理,并且大大地提高文档处理效率,而无需对文档的格式进行预先定义。
附图说明
下面结合具体的实施例,并参照附图,对本发明实施例的上述和其它目的和优点做进一步的描述。在附图中,相同的或对应的技术特征或部件将采用相同或对应的附图标记来表示。
图1示意性示出二维码的外观示例;
图2示出根据本发明的实施例的文档处理装置的配置的框图;
图3示出根据本发明的实施例的文档处理方法的流程图;
图4示出根据本发明的实施例的用于批处理多个文档的文档识别方法的流程图;
图5a-5c示出本发明的用于OCR识别文档的区域的具体实施例;
图6a-6c示出本发明的用于自动转帐支付的具体实施例;
图7a-7d示出本发明的用于批量发送传真的具体实施例;
图8a-8c示出本发明的用于对写字板的区域进行手写体识别的具体实施例;以及
图9示出能够实施本发明的实施例的计算机系统的硬件配置的框图。
具体实施方式
首先参照图1概括介绍与本发明有关的二维码的定位和识别原理。二维码现在广泛地应用于网络、证件或产品以便于迅速读取其中承载的信息。在对二维码编码时,在确定二维码要承载的信息后,通过确定编码的模式(如数字模式或字母模式等)、按预定规则将信息转换为二进制编码的序列、并且然后生成与该序列对应的置于最后面的纠错编码,来产生最终的二进制编码序列。该二进制编码序列可以被按照8比特一组为一个码字的形式来分成码字序列,并放入二维码矩阵中,例如从二维码的右下角开始逐列并连续地放入这些码字序列。
在使用图像获取装置得到含有二维码的图像之后,主要经过条码定位、分割和解码三个步骤实现条码的定位与识别。例如,可通过二值化处理、膨胀运算和边缘检测对图像中的二维码进行定位,通过交替执行区域增长和凸壳计算来分割出二维码的符号,以及通过网格采样构造位图来得到码字序列。
图1示出QR二维码的示例,其中在二维码的四个角中的三个角上,有三个较大的“回”字形,这三个“回”字形用于二维码的定位。具体而言,当在扫描的文档图像中通过二值化处理、膨胀运算和边缘检测而检测到这三个回字形时,即可根据几何原理唯一并且准确地判定整个二维码符号所在的位置,确定二维码所承载的数据的范围,并且允许阅读器以任何方向读取二维码的数据,即使是旋转180度仍然可以正确读取数据。
在定位之后对应地从右下角开始逐列连续地读取这些码字序列,然后根据编码时的预定规则的逆规则基于该码字序列逐步还原用户最初编辑的信息。例如,在图1的二维码中可以读取到信息“01234567”。虽然图1的二维码以数字信息为例,但显然二维码也可以承载各种字母、文字或其混合。
以上概要介绍了二维码的定位和识别原理。本领域技术人员应当理解其中的各种常用算法和原理。虽然此处以QR二维码为例进行了介绍,但其它二维码也是完全可用的,在此不再重复说明。
接下来参照图2描述根据本发明的一个实施例的文档处理装置200的配置框图。
文档处理装置200包括图像获取装置201、识别装置203、定位装置204、提取装置205以及处理装置206。
图像获取装置201获取文档的图像202,所述文档例如是会议记录、商业信函及身份证件等。可以使用任何能够获取文档的图像的装置。例如图像获取装置可以是扫描仪,通过扫描文档而获取文档的图像。或者,图像获取装置201可以是照相机,用于对文档进行拍照以获取文档的图像。所获取的图像202将被传送给要使用该图像的识别装置203、定位装置204以及提取装置205。
识别装置203从图像获取装置201接收图像202,用于识别所获取的图像202上的与用于该文档的机器可读指令相关联的一个或更多个标记。所述机器可读指令与多功能打印机提供的功能相关联,例如是发送传真或电子邮件、复印或者字符识别中的至少一个。所识别出的标记可被后面描述的处理装置206分析以关联到对应的机器可读指令,然后对于该文档执行该机器可读指令。
为了能够与文档中的常规文本相区别并能够被准确识别,这些标记通常具有特别的形式,例如环绕有圆圈或其它特别形状。此外,这些标记最好位于文档中的不易出现混淆的预定区域中,例如在页眉中。例如,所述标记是与发送电子邮件指令相关联的邮寄标记“”,用于指示把该文档通过电子邮件发送到目的地。或者,所述标记是与传真指令相关联的传真标记,用于指示把该文档传真到目的地。所述标记不限于这些形式,还可以包括与其他机器可读指令相关联的标记,例如用于识别手写记录的标记或转账标记等。
此外,这些标记可以是用户在现场手写的,也可以是预先打印出来的。识别装置可以使用任何能够识别这些标记的技术,例如光学字符识别OCR或手写体识别等。这些技术对于本领域技术人员都已经是能够理解的,所以此处不再重复描述。
在特别的实施例中,标记本身也可以是个二维码,在该二维码中记载了要执行的指令,这样就可以直接应用二维码扫描软件检测到要执行的指令。
定位装置204检测所获取的图像202上的一个或更多个二维码并根据所检测到的二维码的位置(比如二维码的右下顶点的坐标)来判定所获取的图像202中的至少一个区域。当用户把编辑好的二维码在现场根据需要添加(例如,粘贴)在希望的区域附近之后,定位装置204就可以使用二维码检测技术定位该二维码的位置,并根据所述位置判定用户希望的区域。例如,如果用户希望的区域是包含传真号码或电子邮件地址的矩形区域,则可以在现场在该矩形区域的四个顶点粘贴二维码,以通过二维码检测技术定位这四个顶点的位置从而判定用户希望的矩形区域。或者,用户可以在现场在该矩形区域的两个对角顶点粘贴二维码,以通过二维码检测技术定位这两个顶点的位置从而根据图像的朝向和对角线的顶点判定用户希望的矩形区域。或者,如果用户希望的是个圆形区域,则可以在圆心和直径的两端粘贴二维码,以通过二维码检测技术定位圆心和直径以判定所希望的圆形区域。
在另一方面,二维码中也可以被编辑有辅助定位的信息。例如,在一个二维码中编辑有该二维码的位置代表矩形的左上角的信息,并且在对应的另一二维码中编辑有该二维码的位置代表矩形的右下角的信息,则仅通过检测这一对二维码的位置并根据该信息即可判定矩形区域。或者,在一个二维码中编辑有该二维码的位置代表矩形的左上角以及矩形的长宽的信息,则仅通过检测该二维码的位置并根据该矩形的长宽信息即可判定矩形区域。尽管此处以矩形区域为例进行说明,但是对于其他形状区域的判定也可类似地适用,例如二维码中可以编辑有该二维码代表圆形区域的圆心以及半径的信息,这样就可以通过检测该二维码的位置并根据半径的信息来判定圆形区域。
提取装置205从所获取的图像202的至少一个区域中提取用于所述机器可读指令的参数。在根据检测到的二维码的位置判定出至少一个区域后,提取装置205将从该区域提取出将被用于与前面所识别的标记相关联的机器可读指令的参数,例如传真的号码或电子邮件的地址等等。
作为提取参数的一个示例,如果该区域中的内容是印刷体,则可以对该区域执行光学字符识别OCR处理,从而把该区域的图像数据转换为文本数据来提取参数,作为例如用于传真指令的传真号码或邮寄指令的电子邮件地址。
在另一个示例中,如果该区域的内容是手写体,则可以对该区域执行手写体识别以提取参数,作为例如用于传真指令的传真号码或邮寄指令的邮件地址。
在又一个示例中,在要提取的参数是用于图像比较的情况下,可以通过取得所获取的图像的该至少一个区域中的图像数据来提取参数,以与参考图像进行比较,来例如判断是否是具有公司盖章的文件。
光学字符识别和手写体识别所需的图像处理对于本领域技术人员是能够理解的,因此不再重复说明。
处理装置206接收与识别装置203识别出的标记相关联的机器可读指令和由提取装置205提取的参数。处理装置206使用由提取装置205提取的参数来对文档执行机器可读指令,例如按照传真号将该文档发送传真,或按照电子邮件地址将该文档发送电子邮件。
该文档处理装置200还可以包括确定装置207,确定装置207根据机器可读指令和所获取的图像202的至少一个区域来确定是否对该至少一个区域提取参数并执行机器可读指令,其中所述确定基于机器可读指令中的范围信息或基于预定策略。
在一个示例中,在存在要被处理的多个文档的情况下,可以在第一个文档上设置机器可读指令和该指令保持有效的范围信息,由此可以针对该范围内的文档编号提取参数并使用提取的参数执行机器可读指令,如果文档编号不在该范围内,则指令对该文档无效并且不对该区域提取信息并执行机器可读指令。
在又一个示例中,在该文档上存在多个与机器可读指令相关联的标记和多个区域的情况下,可以在二维码中预先定义区域或参数与其所关联的机器可读命令之间的映射关系,由此可以根据预定策略确定是否提取参数并执行机器可读指令。
以上描述的装置和以下要描述的装置是用于实施本公开中描述的处理的示例性和/或优选的模块。这些模块可以是硬件单元(诸如场可编程门阵列、数字信号处理器或专用集成电路等)和/或软件模块(诸如计算机可读程序)。以上并未详尽地描述用于实施各个步骤的模块。然而,只要有执行某个处理的步骤,就可以有用于实施同一处理的对应的功能模块或装置(由硬件和/或软件实施)。通过所描述的步骤以及与这些步骤对应的单元的所有组合限定的技术方案都被包括在本申请的公开内容中,只要它们构成的这些技术方案是完整并且可应用的。
此外,由各种装置构成的设备可以作为功能模块被并入到诸如计算机之类的硬件设备中。除了这些功能模块之外,计算机当然可以具有其他硬件或者软件部件。
接下来参照图3描述根据本发明的一个实施例的文档处理方法的流程图。
在步骤S301中,图像获取装置201获取文档的图像202。所获取的图像将被用于识别装置203、定位装置204以及提取装置205。
在步骤S302中,识别装置203识别所获取的图像202上的与用于处理文档的机器可读指令相关联的一个或更多个标记。
在步骤S303中,定位装置204检测所获取的图像202上的一个或更多个二维码并根据所检测到的二维码的位置判定所获取的图像202中的至少一个区域。在现场处理时,二维码由用户可以编辑信息并根据需要粘贴在希望提取参数的区域附近。
在步骤S304中,提取装置205从所获取的图像202的至少一个区域中提取用于机器可读指令的参数。
在步骤S305中,处理装置206使用提取出的参数来执行机器可读指令。
此外,该文档处理方法还可以包括根据机器可读指令和所获取的图像的至少一个区域来确定是否对至少一个区域提取信息并执行机器可读指令的步骤,其中所述确定基于机器可读指令中的范围信息或基于预定策略。
图4示出根据本发明的一个实施例的用于批处理多个文档的文档识别方法,例如用于需要把仅记载的传真号码不同的多份文档传真给多个客户的情况。
在步骤S401中,图像获取装置201获取文档的图像。所获取的图像将被用于识别装置203、定位装置204以及提取装置205。
在步骤S402中,识别装置203识别与新的机器可读指令相关联的标记。
在步骤S403中,确定装置207确定前一指令的有效范围。如前所述,机器可读指令中的范围信息可以限定指令保持有效的那些文档编号。通过步骤403可以确定前一指令对该文档是否仍然有效。
在步骤S404中,定位装置204针对新的指令检测所获取的图像上的二维码并判定区域。如前所述,借助二维码中的映射关系可以确定用于各指令的二维码并判定对应的区域。
在步骤S405中,提取装置205针对目前为止有效的所有指令提取参数。
在步骤S406中,处理装置206使用对应的参数执行各指令。
参照图5a-5c描述本发明的一个具体实施例,在该实施例中用户希望对一个文档进行扫描并仅把图5a中虚线围绕的矩形区域的图像部分进行OCR识别。
因此,用户仅需在现场把表示矩形左上角和右下角的位置的两个二维码相应地粘贴在矩形区域的左上角和右下角(如图5b所示)并且用户把预先定义好的与OCR指令相关联的标记手动添加在文档的空白处(如图5c中所示)。此后,通过根据本发明的识别装置就可以识别与OCR指令相关联的标记,通过定位装置借助于二维码检测来定位要被OCR识别的图像区域,然后提取装置提取该图像区域并且处理装置通过将该图像区域转换为文本数据来进行OCR识别。应当注意,参数不仅可以是一般意义上的用于机器可读指令的参数,而且要处理的图像区域本身也可充当参数,如该实施例中那样。
参照图6描述本发明的另一个具体实施例,在该实施例中用户希望针对信用卡账单上的在图6a中虚线围绕的区域中的金额进行自动转账支付。
因此,用户仅需在现场把表示矩形左上角和长宽范围的一个二维码相应地添加(例如,粘贴)在账单金额的数字的左上角(如图6b所示)并把预先定义好的与自动转账指令相关联的标记手动添加在文档的右下角空白处(如图6c所示)。从图6c可见,标记本身也可以是二维码。此后,通过本发明的识别装置就可以识别与自动转账指令相关联的标记,通过定位装置借助二维码检测并根据长宽信息来定位要提取参数的区域,然后提取装置提取该区域中的参数并且处理装置向该卡内自动转存与该参数对应的金额。
参照图7描述本发明的又一个具体实施例,在该实施例中用户(此处是物业公司)希望把一个通知文档批量传真给各个公司客户,如图7a所示,每个文档的上方的虚线区域包含相应客户的传真号码。
因此,用户仅需在现场把表示该区域的左上角和右下角的两个二维码相应地添加(例如,粘贴)在传真号码的左上角和右下角(如图7b所示)并把与传真发送指令相关联的标记手动添加在文档的空白处(如图7c所示)。此后,通过本发明的识别装置就可以识别与传真指令相关联的标记通过定位装置借助二维码检测来定位传真号码所在的区域,然后提取装置提取该区域中的参数并且处理装置向与该参数对应的传真号码发送传真。类似地,可以针对处于传真指令的范围信息内的如图7d所示的后续各个文档,继续提取参数并向各个用户发送传真。
参照图8描述本发明的再一个具体实施例,在该实施例中用户希望把记录在写字板上的由图8a的虚线区域中的内容进行手写体识别。
因此,用户仅需在现场把表示该区域的左上角和右下角的两个二维码相应地添加(例如,粘贴)在该区域的左上角和右下角(如图8b所示)并且把与手写体识别指令相关联的标记手动添加在文档的空白处(如图8c所示)。此后,通过本发明的图像获取装置(例如照相机)就可以通过拍照来获得写字板的图像,通过识别装置识别与手写体识别指令相关联的标记通过定位装置借助二维码检测来定位区域,然后提取装置提取该图像区域并且处理装置使用手写体识别技术将该图像区域转换为文本数据。
二维码可以具有较小的尺寸,例如小于1cm2的面积,但可以具有足够的用于检测和识别的像素数量,例如可以记录超过2K个字节。此外,相对于一维码而言,二维码具有对于识别方向不敏感、编码范围广以及容错能力强等优点。
通过以上对具体实施例的描述可见,根据本发明的文档处理方法和装置仅需要用户在现场根据需要布置与要执行的指令相关联的标记并且在希望提取参数的区域附近布置二维码之后,就可以通过二维码检测来迅速定位要提取参数的区域以提取参数进行文档处理,其无需如现有技术中那样对文档的格式进行预先定义,并避免用于识别或处理这些预定格式的特定操作和装置。因此,在最大程度上减少了用户交互的情况下使用提取的参数来处理扫描文档,并且大大地提高了文档处理效率。
图9是示出能够实施本发明的实施例的计算机系统的硬件配置的框图。
如图9中所示,计算机系统包括经由系统总线904连接的处理单元901、只读存储器902、随机存取存储器903、输入/输出接口904、输入单元906、输出单元907、存储单元908、通信单元909和驱动器910。程序可以预先记录在作为计算机中内置的记录介质的ROM(只读存储器)902或者存储单元908中。或者,程序可以存储(记录)在可移除介质911中。在本文中,可移除介质911包括例如软盘、CD-ROM(压缩光盘只读存储器)、MO(磁光)盘、DVD(数字多功能盘)、磁盘、半导体存储器等。
另外,除了通过驱动器910从以上提到的可移除介质911把程序安装到计算机的配置之外,可以通过通信网络或广播网络把程序下载到计算机以安装在内置存储单元908中。换言之,可以例如以无线方式通过用于数字卫星广播的卫星从下载点向计算机或者以有线方式通过诸如LAN(局域网)或互联网等的网络向计算机传输程序。
如果经由输入/输出接口905通过输入单元906的用户操控等输入命令,则CPU 901根据命令来执行ROM 902中存储的程序。或者,CPU 901把存储单元908中存储的程序加载在RAM 903上以执行程序。
因此,CPU 901执行根据以上提到的流程图的处理或者通过以上提到的框图的配置执行的处理。接下来,如果有必要,则CPU 901允许处理的结果例如通过输入/输出接口905从输出单元907输出、从通信单元909传输、在存储单元908中记录等。
另外,输入单元906配置有键盘、鼠标、麦克风等。另外,输出单元907配置有LCD(液晶显示器)、扬声器等。
另外,程序可以由一个计算机(处理器)执行。另外,程序可以由多个计算机以分布式的方式处理。另外,可以把程序传输给远程计算机执行。
图9所示的计算机系统仅仅是说明性的并且决不意图对本发明、其应用或用途进行任何限制。
图9所示的计算机系统可以被实施于任何实施例,可作为独立计算机,或者也可作为设备中的处理系统,可以移除一个或更多个不必要的组件,也可以向其添加一个或更多个附加的组件。例如,该计算机系统可被适配为适于被装入打印机的计算机系统。
可以通过许多方式来实施本发明的方法和装置。例如,可以通过软件、硬件、固件、或其任何组合来实施本发明的方法和装置。上述的方法步骤的次序仅是说明性的,本发明的方法步骤不限于以上具体描述的次序,除非以其他方式明确说明。此外,在一些实施例中,本发明还可以被实施为记录在记录介质中的程序,其包括用于实现根据本发明的方法的机器可读指令。因而,本发明还覆盖存储用于实现根据本发明的方法的程序的记录介质。
虽然已通过示例详细描述了本发明的一些具体实施例,但是本领域技术人员应当理解,上述示例仅是说明性的而不限制本发明的范围。本领域技术人员应该理解,上述实施例可以被修改而不脱离本发明的范围和实质。本发明的范围是通过所附的权利要求限定的。

Claims (19)

1.一种文档处理装置,包括:
图像获取装置,被配置为获取文档的图像;
识别装置,被配置为识别所获取的图像上的与用于处理文档的机器可读指令相关联的一个或更多个标记;
定位装置,被配置为检测所获取的图像上的一个或更多个二维码并根据所检测到的二维码的位置判定所获取的图像中的至少一个区域;
提取装置,被配置为从所获取的图像的所述至少一个区域中提取用于所述机器可读指令的参数;以及
处理装置,被配置为使用由所述提取装置提取的参数来执行所述机器可读指令。
2.根据权利要求1所述的文档处理装置,还包括确定装置,确定装置被配置为根据所述机器可读指令和所获取的图像的所述至少一个区域来确定是否对所述至少一个区域提取参数并执行所述机器可读指令,其中所述确定基于所述机器可读指令中的范围信息或基于预定策略。
3.根据权利要求1所述的文档处理装置,其中,所述定位装置进一步根据与所检测到的一个或更多个二维码相关联的信息来判断所述至少一个区域。
4.根据权利要求3所述的文档处理装置,其中,所述信息是所检测到的一对二维码的相对位置关系。
5.根据权利要求3所述的文档处理装置,其中,所述信息是与所检测到的二维码相关联的区域信息。
6.根据权利要求1所述的文档处理装置,其中,所述提取单元通过把图像数据转换为文本数据来提取参数。
7.根据权利要求6所述的文档处理装置,其中,所述提取单元通过执行手写识别来提取参数。
8.根据权利要求1所述的文档处理装置,其中,所述提取单元通过取得来自所获取的图像的所述至少一个区域中的图像数据来提取参数。
9.根据权利要求1所述的文档处理装置,其中,所述机器可读指令是传真、复印、发送电子邮件、字符识别中的至少一个。
10.根据权利要求1所述的文档处理装置,其中,所述一个或更多个标记是二维码。
11.一种多功能打印机,其特征在于包括如权利要求1-10之一所述的文档处理装置。
12.一种文档处理方法,包括:
获取文档的图像;
识别所获取的图像上的与用于处理文档的机器可读指令相关联的一个或更多个标记;
检测所获取的图像上的一个或更多个二维码并根据所检测到的二维码的位置判定所获取的图像中的至少一个区域;
从所获取的图像的所述至少一个区域中提取用于所述机器可读指令的参数;以及
使用由所述提取装置提取的参数来执行所述机器可读指令。
13.根据权利要求12所述的文档处理方法,还包括:根据所述机器可读指令和所获取的图像的所述至少一个区域来确定是否对所述至少一个区域提取参数并执行所述机器可读指令,其中所述确定基于所述机器可读指令中的范围信息或基于预定策略。
14.根据权利要求12所述的文档处理方法,其中,判定所获取的图像中的至少一个区域进一步包括根据与所检测到的一个或更多个二维码相关联的信息来判断所述至少一个区域。
15.根据权利要求14所述的文档处理方法,其中,所述信息是所检测到的一对二维码的相对位置关系。
16.根据权利要求14所述的文档处理方法,其中,所述信息是与所检测到的二维码相关联的区域信息。
17.根据权利要求12所述的文档处理方法,其中,提取用于所述机器可读指令的参数包括通过把图像数据转换为文本数据来提取参数。
18.根据权利要求17所述的文档处理方法,其中,提取用于所述机器可读指令的参数包括通过执行手写识别来提取参数。
19.根据权利要求12所述的文档处理方法,其中,提取用于所述机器可读指令的参数包括通过取得来自所获取的图像的所述至少一个区域中的图像数据来提取参数。
CN201310103343.6A 2013-03-28 2013-03-28 文档处理装置和方法及包括该装置的多功能打印机 Active CN104079730B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310103343.6A CN104079730B (zh) 2013-03-28 2013-03-28 文档处理装置和方法及包括该装置的多功能打印机

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310103343.6A CN104079730B (zh) 2013-03-28 2013-03-28 文档处理装置和方法及包括该装置的多功能打印机

Publications (2)

Publication Number Publication Date
CN104079730A true CN104079730A (zh) 2014-10-01
CN104079730B CN104079730B (zh) 2017-03-01

Family

ID=51600768

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310103343.6A Active CN104079730B (zh) 2013-03-28 2013-03-28 文档处理装置和方法及包括该装置的多功能打印机

Country Status (1)

Country Link
CN (1) CN104079730B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108121982A (zh) * 2016-11-30 2018-06-05 杭州海康机器人技术有限公司 面单图像的获取方法及装置
CN108932692A (zh) * 2017-05-26 2018-12-04 杭州海康机器人技术有限公司 面单信息的获取方法及装置
CN109146009A (zh) * 2017-06-16 2019-01-04 北京京华印象科技文化发展有限公司 一种基于标记识别的信息处理方法、装置及终端
CN109146010A (zh) * 2017-06-16 2019-01-04 北京京华印象科技文化发展有限公司 一种电子信息自动化处理方法与系统
CN109146011A (zh) * 2017-06-16 2019-01-04 北京京华印象科技文化发展有限公司 一种信息分类处理方法与装置
CN110909726A (zh) * 2019-11-15 2020-03-24 杨宏伟 一种基于图像识别的书面文档互动系统和方法
CN112540965A (zh) * 2020-12-07 2021-03-23 湖北航天信息技术有限公司 一种纸质合同管理方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6208436B1 (en) * 1998-02-09 2001-03-27 Hewlett-Packard Company Use of a header page to provide scan control information for a scan
US6360001B1 (en) * 2000-05-10 2002-03-19 International Business Machines Corporation Automatic location of address information on parcels sent by mass mailers
US8194257B2 (en) * 2007-11-15 2012-06-05 Hewlett-Packard Development Company, Lp. Simplified operation of scan based devices
JP2012244206A (ja) * 2011-05-16 2012-12-10 Canon Inc 画像形成装置
CN102567764B (zh) * 2012-01-13 2016-03-02 中国工商银行股份有限公司 一种提高电子影像识别效率的票据凭证及系统

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11037017B2 (en) 2016-11-30 2021-06-15 Hangzhou Hikrobot Technology Co., Ltd Method and device for obtaining image of form sheet
WO2018099132A1 (zh) * 2016-11-30 2018-06-07 杭州海康机器人技术有限公司 面单图像的获取方法及装置
CN108121982A (zh) * 2016-11-30 2018-06-05 杭州海康机器人技术有限公司 面单图像的获取方法及装置
CN108121982B (zh) * 2016-11-30 2020-02-07 杭州海康机器人技术有限公司 面单图像的获取方法及装置
CN108932692A (zh) * 2017-05-26 2018-12-04 杭州海康机器人技术有限公司 面单信息的获取方法及装置
CN108932692B (zh) * 2017-05-26 2021-12-31 杭州海康机器人技术有限公司 面单信息的获取方法及装置
CN109146009B (zh) * 2017-06-16 2021-12-10 北京京华印象科技文化发展有限公司 一种基于标记识别的信息处理方法、装置及终端
CN109146011A (zh) * 2017-06-16 2019-01-04 北京京华印象科技文化发展有限公司 一种信息分类处理方法与装置
CN109146010A (zh) * 2017-06-16 2019-01-04 北京京华印象科技文化发展有限公司 一种电子信息自动化处理方法与系统
CN109146010B (zh) * 2017-06-16 2021-12-21 北京京华印象科技文化发展有限公司 一种电子信息自动化处理方法与系统
CN109146011B (zh) * 2017-06-16 2021-12-21 北京京华印象科技文化发展有限公司 一种信息分类处理方法与装置
CN109146009A (zh) * 2017-06-16 2019-01-04 北京京华印象科技文化发展有限公司 一种基于标记识别的信息处理方法、装置及终端
CN110909726A (zh) * 2019-11-15 2020-03-24 杨宏伟 一种基于图像识别的书面文档互动系统和方法
CN110909726B (zh) * 2019-11-15 2022-04-05 杨宏伟 一种基于图像识别的书面文档互动系统和方法
CN112540965A (zh) * 2020-12-07 2021-03-23 湖北航天信息技术有限公司 一种纸质合同管理方法

Also Published As

Publication number Publication date
CN104079730B (zh) 2017-03-01

Similar Documents

Publication Publication Date Title
CN104079730A (zh) 文档处理装置和方法及包括该装置的多功能打印机
US8732570B2 (en) Non-symbolic data system for the automated completion of forms
US11245811B2 (en) Image processing apparatus, method and non-transitory computer readable medium storing image processing program
US8625136B2 (en) Method for direct transfer from a portable device to a scanning device using optical codes
US8391607B2 (en) Image processor and computer readable medium
JP2001034698A (ja) データ伝送及びデータ検索のための自動バーコード作成システム及びその方法
US20080309993A1 (en) Executing operations in connection with one or more images with a printer
US10049097B1 (en) Systems and methods for creating multi-layered optical character recognition (OCR) documents
US20220222284A1 (en) System and method for automated information extraction from scanned documents
US9521279B2 (en) Image reproducing method and digital processing machine using such method
US11321558B2 (en) Information processing apparatus and non-transitory computer readable medium
JP2009064439A (ja) カスタム化マルチメディア・グリーティング・カードを生成するシステムおよび方法
JP5942640B2 (ja) 画像処理装置およびコンピュータプログラム
US8593697B2 (en) Document processing
US10643097B2 (en) Image processing apparatuses and non-transitory computer readable medium
US9582230B1 (en) Method and system for automated form document fill-in via image processing
JP6191500B2 (ja) 画像処理装置、画像処理システム及び画像処理プログラム
CN109413294A (zh) 图像处理装置及其控制方法
CN109302543A (zh) 图像处理装置及存储介质
JP2002354212A (ja) スキャナ装置
JP6888410B2 (ja) 情報処理装置及び情報処理プログラム
US20240161451A1 (en) Information processing system, processing method, and recording medium
JP6019872B2 (ja) データ化キット
CN112633279A (zh) 文本识别方法、装置和系统
US20080071932A1 (en) Multiple media format support for printers

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant