CN102262615A - 表单制作装置以及表单制作方法 - Google Patents
表单制作装置以及表单制作方法 Download PDFInfo
- Publication number
- CN102262615A CN102262615A CN2011101361959A CN201110136195A CN102262615A CN 102262615 A CN102262615 A CN 102262615A CN 2011101361959 A CN2011101361959 A CN 2011101361959A CN 201110136195 A CN201110136195 A CN 201110136195A CN 102262615 A CN102262615 A CN 102262615A
- Authority
- CN
- China
- Prior art keywords
- image
- ocr
- mentioned
- set information
- list
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 20
- 238000012545 processing Methods 0.000 claims abstract description 48
- 238000004321 preservation Methods 0.000 claims description 37
- 238000007639 printing Methods 0.000 claims description 23
- 238000004519 manufacturing process Methods 0.000 claims description 21
- 230000000717 retained effect Effects 0.000 abstract 1
- 238000012015 optical character recognition Methods 0.000 description 113
- 238000010586 diagram Methods 0.000 description 22
- 230000014509 gene expression Effects 0.000 description 19
- 230000008676 import Effects 0.000 description 12
- 230000004048 modification Effects 0.000 description 9
- 238000012986 modification Methods 0.000 description 9
- 230000008569 process Effects 0.000 description 7
- 238000001914 filtration Methods 0.000 description 6
- 230000008878 coupling Effects 0.000 description 4
- 238000010168 coupling process Methods 0.000 description 4
- 238000005859 coupling reaction Methods 0.000 description 4
- 238000013461 design Methods 0.000 description 4
- 239000004065 semiconductor Substances 0.000 description 4
- 238000000926 separation method Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 238000003860 storage Methods 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000005401 electroluminescence Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000003086 colorant Substances 0.000 description 1
- 230000003750 conditioning effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000015654 memory Effects 0.000 description 1
- 238000004080 punching Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
- G06F40/174—Form filling; Merging
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Character Input (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Character Discrimination (AREA)
Abstract
提供一种表单制作装置以及表单制作方法,以往,利用OCR装置有时无法对扫描仪所读取的表单的图像数据适当地进行OCR处理。另外,以OCR处理的精度为优先而仅使表单的布局固定地形成。本发明确保布局的自由度并提高所生成表单的OCR处理精度。本发明的表单制作装置(110)具有保存部(164)和图像生成部(170),该保存部(164)保存设定信息的范围,该设定信息的范围规定适合于OCR处理的图像要素,该图像生成部(170)根据用户输入以及保存于保存部的设定信息的范围来生成表单图像。
Description
技术领域
本发明涉及一种制作表单的表单制作装置以及表单制作方法。
背景技术
近年来,在各领域中进行着无纸化,但是例如在组织的基础业务中,发票、考勤表、调查表、试卷等、在医院除此以外的诊断表等仍然使用印刷在纸张上的表单。用户为了有效地管理以后通过手写等填写在表单上的信息,利用扫描仪读取表单,利用OCR(Optical Character Reader:光符阅读机)装置实施OCR处理。
但是,在表单的布局、格式不合适的情况下,有时无法正确地进行OCR处理。因此,公开了一种技术,即根据由用户输入的OCR型号、行字段数、字符数,以预先规定的形式固定地决定表单的布局(例如专利文献1)。另外,提出了一种信息处理装置,即将从表单读取到的图像数据与作为选择基准的多个选择基准图像数据进行比较,选择对应的选择基准图像数据,根据该选择基准图像数据来进行OCR处理(例如专利文献2)。
专利文献1:日本特开平8-30659号公报
专利文献2:日本特开2000-132542号公报
发明内容
发明要解决的问题
以往,利用OCR装置有时无法对扫描仪所读取到的表单的图像数据正确地进行OCR处理。另外,以OCR处理的精度为优先而仅能固定地形成表单的布局。
因此,本发明是鉴于这种问题而完成的,目的在于提供一种确保布局的自由度并能够提高所生成的表单的OCR处理精度的表单制作装置、表单制作程序以及表单制作方法。
用于解决问题的方案
为了解决上述问题,本发明的表单制作装置具有:保存部,其保存设定信息的范围,该设定信息的范围用于规定适合于OCR处理的图像要素;以及图像生成部,其根据用户的输入以及保存于保存部的设定信息的范围来生成表单图像。
图像生成部也可以根据保存部所保存的设定信息的范围来设定构成表单图像的图像要素的设定信息的初始值。
还可以具有适合判断部,该适合判断部判断构成表单图像的各个图像要素是否适合于OCR处理。
适合判断部仅对构成表单图像的图像要素中的由用户指定的图像要素判断是否适合于OCR处理。
适合判断部也可以根据保存部所保存的设定信息的范围来判断是否适合于OCR处理。
还可以具有要素替换部,该要素替换部将构成表单图像的图像要素中的不适合于OCR处理的图像要素替换为适合于OCR处理的图像要素。
也可以保存部保存作为替换候选的图像要素的图案,要素替换部对构成表单图像的图像要素以及保存部所保存的图案进行图案匹配,将匹配于图案的图像要素替换为适合于OCR处理的图像要素。
也可以在设定信息中至少包含字符字体、字符尺寸、纸张尺寸、格线长度、格线线宽、格线方向、文本框大小、文本框线宽、复选框大小、复选框间隔、条形码种类、条形码大小、条形码单元宽度、条形码校验位、颜色、滤色、定位标记大小、定位标记配置、印刷时的倍率以及印刷后的图像要素大小中的任一个。
还可以具有输出控制部,该输出控制部在印刷表单图像的情况下控制图像形成装置以在预先设定的印刷条件下进行印刷。
为了解决上述问题,本发明的表单制作方法具有以下步骤:生成步骤,根据用户输入生成表单图像;判断步骤,判断构成表单图像的各个图像要素是否适合于OCR处理;以及显示步骤,显示判断结果。
发明的效果
如上所述,本发明是鉴于这种问题而完成的,确保布局的自由度并能够提高所生成的表单的OCR处理精度。
附图说明
图1是表示表单处理系统的概要的连接关系的说明图。
图2是表示表单制作装置的结构的功能框图。
图3是表示表单图像的一例的说明图。
图4是用于说明设定信息的说明图。
图5是用于说明适合判断部的判断处理的说明图。
图6是用于说明基于要素替换部的图案匹配的替换处理的说明图。
图7是表示OCR装置的结构的功能框图。
图8是表示表单制作方法的整体处理流程的流程图。
附图标记说明
110:表单制作装置;130:打印机(图像形成装置);164:保存部;170:图像生成部;172:适合判断部;174:要素替换部;176:数据输出部;178:输出控制部。
具体实施方式
下面,参照附图详细说明本发明的优选实施方式。上述实施方式示出的尺寸、材料、其它具体的数值等仅是用于容易地理解发明的例示,除了具有特别说明的情况以外,并不限定本发明。此外,在本说明书以及附图中,对实质上具有相同的功能、结构的要素附加相同的附图标记来省略重复说明,另外与本发明没有直接关系的要素省略图示。
(表单处理系统100)
图1是表示表单处理系统100的概要连接关系的说明图。表单处理系统100构成为包括表单制作装置110、OCR装置120、打印机(图像形成装置)130、扫描仪140。表单制作装置110通过因特网、LAN(Local Area Network:局域网)、专用线路等通信网150与OCR装置120相连接。另外,表单制作装置110例如通过LAN与打印机130相连接,OCR装置120例如通过LAN与扫描仪140相连接。并且,在通信网150上连接有企业等的基础系统的应用程序服务器152。
表单制作装置110当接收由用户输入的制作布局的输入时,表单制作装置110生成与图像要素组合在一起的表示表单154的布局的布局图像。并且,打印机130按照所生成的该布局来印刷表单154。用户在印刷出的表单154上例如通过手写、盖印以及冲压等记载业务上的信息。当向表单154的记载完成时,扫描仪140读取记载有信息的表单154,OCR装置120对读取到的该图像数据进行OCR处理,获取填写在表单154上的填写信息并输出到应用程序服务器152,由此能够在基础系统中利用填写信息。
例如,提出了一种表单制作装置,即根据由用户手动输入的OCR型号、行字段数、字符数来自动生成表单格式。但是,该提案中的表单制作装置仅是统一决定要制作的表单的文本框、表单尺寸。
在本实施方式所涉及的表单处理系统100中,表单制作装置110以适合于OCR处理的方式生成表单图像,因此能够确保布局的自由度并提高所生成的表单154的OCR处理精度。下面,按照表单制作装置110、OCR装置120的顺序详细说明表单制作装置110、OCR装置120的结构。
(表单制作装置110)
图2是表示表单制作装置110的结构的功能框图。表单制作装置110构成为包括显示部160、操作部162、保存部164、中央控制部166。
显示部160包括液晶显示器、有机EL(ElectroLuminescence:电致发光)显示器等。操作部162包括设置于显示部160的显示面上的触摸面板、设置有多个操作键的键盘、鼠标等指示装置、十字键以及操纵杆等。表单制作装置110在显示部160中显示表单制作图像,接受用户通过操作部162输入的操作而生成表单154的布局图像(以下简单称为表单图像)。
在表单制作装置110中在生成表单图像时准备以下模式作为设计模式:在设计上没有限制的普通模式;以及考虑了适合于OCR处理的OCR表单模式,按照用户通过操作部162的输入来切换。
另外,在OCR表单模式下,根据用户输入设定作为表单154的基本信息的颜色、滤色、扫描仪读取分辨率、扫描仪校正有无等。在颜色设定中,能够选择彩色、黑白等。在滤除的设定中,能够选择以下表单:使用了无法由扫描仪140识别的滤色的硬滤除表单;使通过OCR处理装置120中的OCR处理选择的滤除的软滤除表单;以及在扫描仪140的光源中使用多个颜色以避免任一颜色被滤除的非滤除表单等。在扫描仪读取分辨率的设定中,能够选择200/240/300/400dpi等。在扫描仪校正有无的设定中,能够选择是否对由扫描仪140读取到的表单154的图像数据进行例如倾斜校正等处理。
图3是表示表单图像的一例的说明图。如图3所示,作为表单图像的图像要素而例如设定文本框182a、字符182b、基准标记182c、条形码182d等的配置。在此,在OCR装置120对扫描仪140所读取的图像数据实施OCR处理时,基准标记182c成为表单154的方向以及布局位置的基准。另外,条形码182d是按照规定的规则对任意的信息进行编码而成,例如表示识别表单154的表单ID。
表单制作装置110根据用户通过操作部162的操作输入来生成图3示出的表单图像。此时,表单154包括多个输入区域184,该多个输入区域184是汇总具有规则性的输入方式的区域。输入区域184例如被文本框182a包围。在输入区域184中能够按照每个输入区域184而设定假设为要填写的字符种类(英文、数字、日文、符号等)、属性(手写字符、铅字等)等。
保存部164包括HDD(Hard Disk Drive:硬盘驱动器)、闪存存储器、非易失性RAM(Random Access Memory:随机存取存储器)等。在本实施方式中,保存部164与表单制作装置110一体地形成,但是并不限于上述情况,也可以是分开的例如NAS(Network Attached Storage:网络附加存储)、外置HDD、USB(Universal Serial Bus:通用串行总线)存储器等。
保存部164保存对表单图像中的适合于OCR处理的图像要素(例如格线)进行规定的设定信息(例如长度、粗细)的范围以及成为替换候选的图像要素的图案。后面详细说明图像要素的图案。在设定信息中至少包含字符字体、字符尺寸、纸张尺寸、格线长度、格线线宽、格线方向、文本框182a大小、文本框182a线宽、复选框大小、复选框间隔、条形码种类、条形码大小、条形码单元宽度、条形码校验位、颜色、滤色、定位标记大小、定位标记配置、印刷时的倍率以及印刷后的图像要素大小中的任一个。
设定信息中的字符字体的选择范围为明体或者哥特体,字符尺寸的选择范围为10~14点等。纸张尺寸的选择范围在普通纸张的情况下最大A4开,在滤色表单的情况下最大B4开等。格线长度的选择范围为5mm以上,格线的宽度的选择范围为0.2mm以上,格线的方向的选择范围为垂直方向或者水平方向等。另外,文本框182a大小由文本框182a的高度和宽度来定义,其选择范围为高度10mm以上、宽度7mm以上等。文本框182a的线宽的选择范围为0.2mm以上等。
设定信息中的条形码的种类的选择范围为NW-7、OODE39、OODE128、JAN13等,条形码大小的选择范围被指定为高度10mm以上、整体宽度100mm以下等。另外,作为构成条形码的每个条码或间隔的宽度的单元宽度的选择范围为最小宽度0.2mm(300/400dpi)、最小宽度0.3mm(200/240dpi)、最大宽度2.0mm等。条形码校验位的选择范围为NW-7(系数10/11/16)、OOE39(系数43)等。
设定信息中的颜色的选择范围为印刷浓度较高的黑色等。滤色的选择范围为鲜明的红色、绿色、蓝色系统的颜色等。另外,印刷时的倍率的选择范围为90%~110%等。
上述设定信息中的受到印刷时的倍率影响的例如字符大小、格线线宽等的设定信息的选择范围可以是印刷时的倍率为100%的情况下的尺寸(印刷后的图像要素大小),也可以是以任意指定的倍率印刷后的尺寸。
另外,在设定信息的选择范围中也可根据每个图像要素的种类或者相邻图像要素的组合示出与相邻图像要素之间的间隔的下限值。并且,在保存部164中也可以将表单图像整体视作一个图像要素,保存上述基本信息的选择范围作为该图像要素的设定信息的选择范围。
图4是用于说明设定信息的说明图。图4的(a)是用于说明复选框大小和间隔的说明图,图4的(b)是用于说明定位标记192大小和配置的说明图。
如图4的(a)所示,例如在作为图像要素的复选框190的设定信息中,以复选框190的宽度190a、高度190b等表示复选框190的大小,以相邻复选框190之间的横向间隔190c、纵向间隔190d等表示复选框190的间隔。在设定信息的选择范围中,宽度190a、高度190b分别为4mm以上,横向间隔190c、纵向间隔190d分别为2mm以上等。
另外,如图4的(b)所示,例如在作为图像要素的定位标记192的设定信息中,定位标记192的大小例如在定位标记192呈矩形的情况下以宽度192a、高度192b表示,例如在定位标记192呈环型的情况下以直径192c、线宽192d等表示,定位标记192的配置例如以定位标记192中心在表单图像上的位置坐标等表示。在设定信息的选择范围中,宽度192a为4.5mm~5.5mm,高度192b为2.5~3.5mm,直径192c为4.5mm~5.5mm,线宽192d为1.0~1.5mm等。另外,在设定信息为定位标记192中心的位置坐标的情况下,设定信息的选择范围是距表单图像的纵横的端的距离192e、192f,分别为1.0mm以上等。
关于保存部164,将上述设定信息的适合于OCR处理的范围保存于保存部164中。如上所述,本实施方式的表单制作装置110能够设定很多详细项目作为图像要素的设定信息,参照保存于保存部164中的设定信息的范围来生成表单图像,由此能够提高OCR处理的精度。
中央控制部166通过半导体集成电路来控制表单制作装置110整体,其中,半导体集成电路包括中央处理装置(CPU)、保存有程序等的ROM、作为工作区的RAM等。另外,中央控制部166还作为图像生成部170、适合判断部172、要素替换部174、数据输出部176、输出控制部178、定义输出部180而发挥功能。
图像生成部170根据用户通过操作部162的输入以及保存于保存部164中的设定信息的范围来生成表单图像。例如,在上述OCR表单模式下当存在生成表单图像的用户输入时,图像生成部170在保存于保存部164中的设定信息的范围内设定构成表单图像的图像要素的设定信息的初始值。
当存在指示图像要素例如格线、文本框182a、字符182b等的配置的用户输入时,图像生成部170根据保存在保存部164中的设定信息的范围来设定该图像要素的设定信息、例如格线的线宽、字符182b的大小等初始值并进行配置。根据上述结构,从开始就能够配置设定信息被设定了适合于OCR处理的初始值的图像要素,从而能够提高作业效率。
此时,图像生成部170根据用户输入将设定信息的初始值设定为保存于保存部164的设定信息的范围中的更适合于OCR处理的建议值或者设定信息的范围中的比较不适合于OCR处理的界限值。当使用建议值时,OCR处理的精度进一步提高,当使用界限值时,例如能够相对地缩小字符尺寸或者能够相对地缩小图像要素间的间隔,因此表单的布局自由度提高。另外,能够通过用户输入来变更初始值。还能够使通过用户输入变更后的初始值初始化到变更前的初始值。
另外,也可以设为保存于保存部164中的设定信息的范围例如按照每个OCR装置120的型号名称、使用于OCR装置120的OCR处理部中的OCR处理软件的名称以及版本来保存,图像生成部170根据用户输入或来自OCR装置120的控制信息来使用对应的设定信息的范围。
适合判断部172例如以从普通模式向OCR表单模式的切换、由用户进行的OCR表单模式的选择输入为契机,判断构成已经生成的表单图像的各个图像要素是否适合于OCR处理。适合判断部172例如根据保存于保存部164中的设定信息的范围、与其它图像要素之间的组合来判断是否适合于OCR处理。
图5是用于说明适合判断部172的判断处理的说明图。当适合判断部172判断构成表单图像的各个图像要素是否适合于OCR处理时,如图5所示,在显示部160中显示判断结果画面194来向用户通知判断结果。例如,在区域196a中显示如下内容;条形码“发票编号”(图像要素)的高度处在保存于保存部164中的设定信息的范围之外而成为不适合于OCR处理的高度,以及该范围的下限值。另外,在区域196b中显示如下内容:字母项目“顾客ID”的字符尺寸处在保存于保存部164中的设定信息的范围之外而成为不适合于OCR处理的大小,以及该范围的下限值。
另外,如图5的阴影所示,当通过用户输入选择区域196a时,例如在显示部160中并列地显示的表单图像中的对应的图像要素、即条形码“发票编号”本身被强调显示(高亮区),因此用户能够容易地掌握不适合于OCR处理的图像要素。
这样,根据参照保存于保存部164中的图像要素的设定信息的范围的结构,通过对图像要素的设定要素与范围进行比较这种简单的处理,能够判断是否适合于OCR处理。另外,保存部164还可以分别保存用于对新生成的图像要素的设定信息的初始值进行设定的设定信息的范围以及用于判断已经生成的图像要素是否适合于OCR处理的设定信息的范围。并且,适合判断部172根据用户输入,使用上述初始值的建议值来使判断基准严格或者使用初始值的界限值来使判断基准宽松。
根据具备适合判断部172的结构,例如即使在已经制作出的图像要素的设定信息不包含在保存于保存部164的设定信息的范围内而如果保持这样很有可能会使OCR处理精度变得不充分的情况下,也能够通过由图像生成部170通知判断为不包含在保存于保存部164的设定信息的范围内的设定信息的图像要素来催促用户修改。
另外,适合判断部172仅对构成表单图像的图像要素中的用户独立地或者在范围内指定的图像要素、其设定信息、或者针对所有图像要素指定的设定信息判断是否适合于OCR处理。
根据上述结构,例如甚至考虑到OCR处理精度足够的图像要素、滤色等有意地设为OCR处理对象外的图像要素等不需要判断是否适合于OCR处理的图像要素,从而能够避免进行多余的判断处理的情况,能够减轻处理负载并缩短处理时间。另外,例如在存在期望以特别严格的判断基准进行判断的设定信息的情况下,用户还能够仅选择该设定信息,使判断基准变得严格之后判断是否适合于OCR处理。
要素替换部174将构成表单图像的图像要素中的不适合于OCR处理的图像要素替换为适合于OCR处理的图像要素。
如图5所示,在判断结果画面194中,在上部中显示标记为“汇总自动修改”的按钮198a,在区域196a、196b内例如分别显示标记为“自动修改”的按钮198b、198c。当用户通过操作部162选择按钮198a时,在所有区域196a、196b内示出的图像要素的设定信息被替换为分别对应的范围内的值。另外,当用户选择按钮198b、198c时,能够个别地自动修改图像要素的设定信息。并且,并不限于自动修改,用户也可以通过操作部162输入任意的值来修改设定信息。
根据上述结构,能够将不适合于OCR处理的图像要素自动地替换为适合于OCR处理的图像要素,能够减轻用户修改图像要素的设定信息等以使之成为适合于OCR处理的图像要素的作业负担。
另外,要素替换部174对构成表单图像的图像要素以及保存于保存部164中的图案进行图案匹配,将对应于该图案的图像要素替换为适合于OCR处理的图像要素。
图6是用于说明基于要素替换部174的图案匹配的替换处理的说明图。在存在输入形式不适合于OCR处理的例如用户利用圆圈来包围“喜欢”“一般”“不喜欢”字符这种输入形式的图像要素、对一个文本框填写预先设定的形式的多个字符(例如多位数值)的图像要素的情况下,如图6所示,在图案替换画面200中显示针对成为建议替换的对象的图像要素的替换候选。
与图5中说明的判断结果画面194同样地,在图案替换画面200中也一样,对于通过用户输入选择的图像要素,在显示部160中并列地显示的表单图像中的对应的图像要素本身被强调显示(高亮区)。
当通过用户输入来选择按钮202a~202b、按钮204a~204d中的某一个时,要素替换部174替换为与所选择的该按钮202a~202b、按钮204a~204d对应的例如在“喜欢”“一般”“不喜欢”各个字符一侧设置复选框的图像要素以及添加将文本框分割为与字符数量相应的辅助线的图像要素等。另外,当选择“汇总自动修改”按钮206时,要素替换部174针对输入形式不适合于OCR处理的各个图像要素,根据预先设定的优先顺序,来自动地选择输入形式最适合于OCR处理的图像要素并进行替换。
根据上述结构,即使用户不知道不适合于OCR处理的输入形式,通过由要素替换部174通知输入形式不适合于OCR处理的图像要素并示出其替换候选,也能够设为由用户输入选择的适合于OCR处理的输入形式,从而能够提高OCR处理精度。
数据输出部176将表单图像变换为与印刷对应的形式后输出到打印机130。
在印刷表单图像的情况下,输出控制部178控制打印机130使其在预先设定的印刷条件下进行印刷。输出控制部178并不限于直接控制打印机130的情况,输出控制部178也可以将禁止变更的印刷条件等控制信息输出到打印机130,打印机130根据该控制信息来设定印刷条件。
即使设定为OCR处理精度提高的布局,当在打印机130中进行印刷条件变更而例如进行缩小印刷时,印刷出的表单的字符大小变小或者线粗细变细,从而有可能使OCR处理精度降低。输出控制部178控制打印机130使其在预先设定的印刷条件下进行印刷,由此能够避免这样的情况。
定义输出部180将图像生成部170所生成的表单图像以电子方式输出到OCR装置120。另外,定义输出部180并不限于输出表单图像的情况,也可以从表单图像生成用于进行OCR处理的表示定义的定义信息来输出到OCR装置120。
如上所述,本实施方式的表单制作装置110能够根据用户输入自由地进行表单设计,并且能够使图像要素的设定信息收敛在保存于保存部164的设定信息的范围内来以适合于OCR处理的方式生成表单图像。因此,能够提高针对表单154的OCR处理的精度。
(OCR装置120)
图7是表示OCR装置120的结构的功能框图。OCR装置120构成为包括显示部300、操作部302、中央控制部304。
显示部300包括液晶显示器、有机EL显示器等。操作部302包括设置于显示部300的显示画面上的触摸面板、设置有多个操作键的键盘、鼠标等指示装置、十字键、操纵杆等。
中央控制部304通过半导体集成电路来控制OCR装置120整体,其中,半导体集成电路包括中央处理装置(CPU)、存储有程序等的ROM、作为工作区的RAM等。另外,中央控制部304还作为图像获取部320、定义获取部322、OCR处理部324、服务器输出部326而发挥功能。
图像获取部320从扫描仪140获取读取表单154而生成的图像数据。
定义获取部322获取表单制作装置110的定义输出部180所输出的表单图像或者定义信息。在获取到表单图像的情况下,定义获取部322从该表单图像生成表示进行OCR处理的用于定义的定义信息。
OCR处理部324例如以图像获取部320所获取到的图像数据的图像中的基准标记182c的位置为基准,根据定义获取部322获取或者生成的定义信息,对扫描仪140所读取到的表单154的图像数据进行OCR处理(从图像数据抽取该图像数据所示出的字符、数字等内容的处理)。
服务器输出部326将OCR处理部324所进行的OCR处理的结果即抽取出的字符、数字等信息输出到应用程序服务器152。
以上,通过所说明的表单制作装置110、OCR装置120,能够在确保布局的自由度的同时提高所生成的表单154的OCR处理精度。另外,还提供使计算机作为表单制作装置110而发挥功能的表单制作程序、存储有该表单制作程序的计算机可读取的软盘、光磁盘、ROM、EPROM、EEPROM、CD(Compact Disc:致密光盘)、DVD(Digital Versatile Disk:数字多功能光盘)、BD(Blu-ray Disc:蓝光光盘)等存储介质。在此,程序是指利用任意语言、描述方法进行描述的数据处理单元。
另外,还可以将该表单制作程序存储于通过通信网150与表单制作装置110相连接的任意的应用程序服务器,还能够根据需要下载其全部或者一部分。
(表单制作方法)
接着,说明运用上述表单处理系统的表单制作方法。图8是表示表单制作方法的整体处理流程的流程图。
如图8所示,当存在指示制作表单图像的用户输入时(S400),图像生成部170判断当前的设计模式是否为OCR表单模式(S402),在为OCR表单模式的情况下(S402:“是”),图像生成部170根据基于操作部162的用户输入以及保存于保存部164的用于使设定信息适合于OCR处理的设定信息的范围来生成表单图像(S404)。在并非OCR表单模式而是普通模式的情况下(S402:“否”),图像生成部170仅根据用户输入来生成表单图像(S406)。
然后,在存在指示从普通模式向OCR表单模式切换或判断是否适合OCR处理的用户输入的情况下(S408:“是”),适合判断部172分别判断构成表单图像的各个图像要素是否适合于OCR处理(S410),在显示部160中显示表示其判断结果的判断结果画面(S412)。
要素替换部174判断是否存在指示自动或者手动修改的用户输入(S414),当存在指示修改的用户输入时(S414:“是”),将构成表单图像的图像要素中的不适合于OCR处理的图像要素替换为适合于OCR处理的图像要素(S416)。
在图像要素替换步骤S416之后,或者在适合判断用户输入判定步骤S408中不存在指示从普通模式向OCR表单模式切换或判断是否适合OCR处理的用户输入的情况下(S408:“否”),要素替换部174判断是否存在指示图案匹配的用户输入(S418)。当存在指示图案匹配的用户输入时(S418:“是”),对构成表单图像的图像要素以及保存于保存部164的图案进行图案匹配(S420),判断是否存在匹配的图像要素(S422)。在存在匹配的图像要素的情况下(S422:“是”),要素替换部174使显示部160显示图案替换画面(S424)。
要素替换部174判断是否存在选择替换候选并进行替换的用户输入(S426),当存在选择替换候选并进行替换的用户输入时(S426:“是”),要素替换部174将输入形式不适合于OCR处理的图像要素替换为所选择的输入形式适合于OCR处理的图像要素(S428)。
根据这种表单制作方法,能够在确保布局的自由度的同时提高所生成的表单154的OCR处理精度。
以上,参照附图说明了本发明的优选实施方式,但是当然本发明并不限于上述实施方式。本领域技术人员在记载于权利要求范围内的范畴中能够想得到各种变更例或者修改例是显而易见的,这些当然也属于本发明的技术范围。
此外,本说明书的表单制作方法中的各工序不一定按照记载为流程图的顺序以时间序列进行处理,也可以包括并列或者子程序的处理。
产业上的可利用性
能够将本发明利用于制作表单的表单制作装置、表单制作程序以及表单制作方法。
Claims (10)
1.一种表单制作装置,具有:
保存部,其保存设定信息的范围,该设定信息用于规定适合于OCR处理的图像要素;以及
图像生成部,其根据用户的输入以及保存于上述保存部的设定信息的范围来生成表单图像。
2.根据权利要求1所述的表单制作装置,其特征在于,
上述图像生成部根据上述保存部所保存的设定信息的范围来设定构成上述表单图像的图像要素的设定信息的初始值。
3.根据权利要求1或者2所述的表单制作装置,其特征在于,
还具有适合判断部,该适合判断部判断构成上述表单图像的各个图像要素是否适合于OCR处理。
4.根据权利要求3所述的表单制作装置,其特征在于,
上述适合判断部仅对构成上述表单图像的图像要素中的由用户指定的图像要素判断是否适合于OCR处理。
5.根据权利要求3或者4所述的表单制作装置,其特征在于,
上述适合判断部根据上述保存部所保存的设定信息的范围来判断上述图像要素是否适合于OCR处理。
6.根据权利要求1至5中的任一项所述的表单制作装置,其特征在于,
还具有要素替换部,该要素替换部将构成上述表单图像的图像要素中的不适合于OCR处理的图像要素替换为适合于OCR处理的图像要素。
7.根据权利要求6所述的表单制作装置,其特征在于,
上述保存部保存作为替换候选的图像要素的图案,
上述要素替换部对构成上述表单图像的图像要素以及上述保存部所保存的图案进行图案匹配,将匹配于上述图案的图像要素替换为适合于OCR处理的图像要素。
8.根据权利要求1至7中的任一项所述的表单制作装置,其特征在于,
在上述设定信息中至少包含字符字体、字符尺寸、纸张尺寸、格线长度、格线线宽、格线方向、文本框大小、文本框线宽、复选框大小、复选框间隔、条形码种类、条形码大小、条形码单元宽度、条形码校验位、颜色、滤色、定位标记大小、定位标记配置、印刷时的倍率以及印刷后的图像要素大小中的任一个。
9.根据权利要求1至8中的任一项所述的表单制作装置,其特征在于,
还具有输出控制部,在印刷上述表单图像的情况下该输出控制部控制图像形成装置以在预先设定的印刷条件下进行印刷。
10.一种表单制作方法,具有以下步骤:
生成步骤,根据用户的输入生成表单图像;
判断步骤,判断构成表单图像的各个图像要素是否适合于OCR处理;以及
显示步骤,显示上述判断结果。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010118806A JP5561856B2 (ja) | 2010-05-24 | 2010-05-24 | 帳票作成装置、帳票作成プログラム、および帳票作成方法 |
JP2010-118806 | 2010-05-24 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102262615A true CN102262615A (zh) | 2011-11-30 |
CN102262615B CN102262615B (zh) | 2016-09-28 |
Family
ID=44972291
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201110136195.9A Active CN102262615B (zh) | 2010-05-24 | 2011-05-24 | 表单制作装置以及表单制作方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US9047265B2 (zh) |
JP (1) | JP5561856B2 (zh) |
CN (1) | CN102262615B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103473010A (zh) * | 2013-09-02 | 2013-12-25 | 小米科技有限责任公司 | 一种辅助绘画的方法和装置 |
CN110942068A (zh) * | 2018-09-25 | 2020-03-31 | 富士施乐株式会社 | 信息处理装置、存储介质及信息处理方法 |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8977971B2 (en) * | 2010-12-24 | 2015-03-10 | General Electric Company | Metadata generation systems and methods |
JP2015215853A (ja) * | 2014-05-13 | 2015-12-03 | 株式会社リコー | システム、画像処理装置、画像処理方法およびプログラム |
US10229314B1 (en) * | 2015-09-30 | 2019-03-12 | Groupon, Inc. | Optical receipt processing |
US10910504B2 (en) * | 2015-12-07 | 2021-02-02 | Sony Semiconductor Solutions Corporation | Solid-state imaging element, imaging device, and method for manufacturing solid-state imaging element |
TWI680411B (zh) * | 2016-01-07 | 2019-12-21 | 葉振忠 | 電子表單建立系統及方法 |
JP6946649B2 (ja) * | 2017-01-31 | 2021-10-06 | ソニーグループ株式会社 | 電子機器、情報処理方法およびプログラム |
US20190096040A1 (en) * | 2017-09-25 | 2019-03-28 | Kabushiki Kaisha Toshiba | Image processing apparatus, image processing method and non-transitory readable storage medium |
JP7500513B2 (ja) * | 2021-08-31 | 2024-06-17 | キヤノン株式会社 | 印刷物の検査装置および方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1525378A (zh) * | 2003-02-24 | 2004-09-01 | 株式会社日立制作所 | 票据定义数据生成方法以及票据处理装置 |
CN1892642A (zh) * | 2005-07-06 | 2007-01-10 | 国际商业机器公司 | 处理表格的方法和系统 |
CN101266651A (zh) * | 2007-03-14 | 2008-09-17 | 株式会社理光 | 图像处理装置和图像处理方法 |
JP2008244545A (ja) * | 2007-03-26 | 2008-10-09 | Toshiba Corp | 画像処理装置 |
JP2009123024A (ja) * | 2007-11-15 | 2009-06-04 | Canon Inc | 画像処理装置及びシステム、方法及びプログラム |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0407935B1 (en) * | 1989-07-10 | 1999-10-06 | Hitachi, Ltd. | Document data processing apparatus using image data |
JPH03240880A (ja) * | 1990-02-19 | 1991-10-28 | Dainippon Printing Co Ltd | 光学式読取装置の指示枠チェック方法 |
EP0451485A3 (en) * | 1990-04-11 | 1992-12-30 | International Business Machines Corporation | A form authoring toolkit |
JP2579397B2 (ja) * | 1991-12-18 | 1997-02-05 | インターナショナル・ビジネス・マシーンズ・コーポレイション | 文書画像のレイアウトモデルを作成する方法及び装置 |
US5317646A (en) * | 1992-03-24 | 1994-05-31 | Xerox Corporation | Automated method for creating templates in a forms recognition and processing system |
JPH07160802A (ja) * | 1993-12-10 | 1995-06-23 | Hitachi Electron Eng Co Ltd | Ocr用帳票フォーム作成処理装置 |
JPH0823410A (ja) * | 1994-07-08 | 1996-01-23 | Toshiba Corp | ファクシミリ装置およびそのファクシミリ装置を使用した文字認識システム |
JPH0830659A (ja) | 1994-07-12 | 1996-02-02 | Nec Eng Ltd | Ocr帳票設計自動化システム |
JPH0896044A (ja) * | 1994-09-21 | 1996-04-12 | Toshiba Kansai Syst Kaihatsu Kk | 帳票設計・読取プログラム作成支援システム |
US6304272B1 (en) * | 1996-12-10 | 2001-10-16 | Micrografx, Inc. | Graphics system and method having objects conformed to a template |
JP3422924B2 (ja) * | 1998-03-27 | 2003-07-07 | 富士通株式会社 | 文字認識装置、文字認識方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP2000132542A (ja) | 1998-10-27 | 2000-05-12 | Hitachi Ltd | 情報処理装置およびその処理プログラムを記憶した記憶媒体 |
JP2001159962A (ja) * | 1999-12-01 | 2001-06-12 | Seiko Epson Corp | 印刷システム及び印刷設定装置 |
JP2001357126A (ja) | 2000-04-14 | 2001-12-26 | Canon Inc | サービス提供方法及び装置、表示方法及び装置、課金処理システム、装置、及び方法、コンピュータプログラム、並びにコンピュータ読み取り可能な記憶媒体 |
JP2006190080A (ja) * | 2005-01-06 | 2006-07-20 | Canon Inc | 文書登録システム、文書登録方法、コンピュータプログラム |
JP2007279828A (ja) * | 2006-04-03 | 2007-10-25 | Toshiba Corp | 帳票処理装置、帳票様式作成装置、帳票、帳票処理用のプログラム、帳票様式作成用のプログラム |
US20080225340A1 (en) | 2007-03-14 | 2008-09-18 | Ricoh Company, Limited | Image processing apparatus, image processing method, and computer program product |
JP4909311B2 (ja) * | 2008-03-31 | 2012-04-04 | 富士通フロンテック株式会社 | 文字認識装置 |
JP4825243B2 (ja) * | 2008-06-20 | 2011-11-30 | 富士通フロンテック株式会社 | 帳票認識装置、方法、データベース作成装置、方法、及びプログラム |
-
2010
- 2010-05-24 JP JP2010118806A patent/JP5561856B2/ja active Active
-
2011
- 2011-05-20 US US13/112,858 patent/US9047265B2/en active Active
- 2011-05-24 CN CN201110136195.9A patent/CN102262615B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1525378A (zh) * | 2003-02-24 | 2004-09-01 | 株式会社日立制作所 | 票据定义数据生成方法以及票据处理装置 |
CN1892642A (zh) * | 2005-07-06 | 2007-01-10 | 国际商业机器公司 | 处理表格的方法和系统 |
CN101266651A (zh) * | 2007-03-14 | 2008-09-17 | 株式会社理光 | 图像处理装置和图像处理方法 |
JP2008244545A (ja) * | 2007-03-26 | 2008-10-09 | Toshiba Corp | 画像処理装置 |
JP2009123024A (ja) * | 2007-11-15 | 2009-06-04 | Canon Inc | 画像処理装置及びシステム、方法及びプログラム |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103473010A (zh) * | 2013-09-02 | 2013-12-25 | 小米科技有限责任公司 | 一种辅助绘画的方法和装置 |
CN103473010B (zh) * | 2013-09-02 | 2016-08-17 | 小米科技有限责任公司 | 一种辅助绘画的方法和装置 |
CN110942068A (zh) * | 2018-09-25 | 2020-03-31 | 富士施乐株式会社 | 信息处理装置、存储介质及信息处理方法 |
CN110942068B (zh) * | 2018-09-25 | 2024-01-23 | 富士胶片商业创新有限公司 | 信息处理装置、存储介质及信息处理方法 |
Also Published As
Publication number | Publication date |
---|---|
US20110286023A1 (en) | 2011-11-24 |
JP5561856B2 (ja) | 2014-07-30 |
JP2011248480A (ja) | 2011-12-08 |
US9047265B2 (en) | 2015-06-02 |
CN102262615B (zh) | 2016-09-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102262615A (zh) | 表单制作装置以及表单制作方法 | |
WO2014098130A1 (ja) | 情報コード、情報コード生成方法、情報コード読取装置、及び情報コード利用システム | |
US9454696B2 (en) | Dynamically generating table of contents for printable or scanned content | |
CN101443790A (zh) | 数字图像中的非回流内容的有效处理 | |
CN102262616A (zh) | 表单处理系统、ocr装置、表单制作装置 | |
CN102331914A (zh) | 表单处理系统、ocr装置、表单制作装置及其处理方法 | |
CN101472027B (zh) | 图像记录设备和控制图像记录设备的方法 | |
US20070223013A1 (en) | Information processing device | |
JP2007004621A (ja) | 文書管理支援装置、文書管理支援方法およびプログラム | |
JP2017126360A (ja) | 情報コードの生成方法、情報コード、情報コード読取装置、及び情報コード利用システム | |
CN104641368A (zh) | 图像处理装置、图像形成装置以及记录介质 | |
US8857727B2 (en) | System for generating an incrementally completed 3D security mark | |
CN109274850A (zh) | 图像处理装置和图像处理装置的控制方法 | |
JP2006301695A (ja) | 文書処理装置およびプログラム | |
JP2007207184A (ja) | 画像処理装置、画像処理方法、プログラム及び記録媒体 | |
CN102331913A (zh) | 表单处理系统、表单制作装置以及表单处理方法 | |
US10452903B2 (en) | Information extraction device, image forming apparatus including information extraction device and method of controlling information extraction device | |
JP4807618B2 (ja) | 画像処理装置及び画像処理プログラム | |
CN109842733A (zh) | 图像处理装置 | |
JP2005234790A (ja) | 手書き帳票処理システム、手書き帳票処理方法 | |
CN110536043B (zh) | 信息处理装置、信息处理方法及存储介质 | |
US20110157659A1 (en) | Information processing apparatus, method for controlling the information processing apparatus, and storage medium | |
JP2004326582A (ja) | 複合記録担体 | |
JP2019153230A (ja) | 情報処理装置及び情報処理プログラム | |
JP2020099031A (ja) | 情報処理装置、及び情報処理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |