CN115410206A - 信息处理装置、记录介质及信息处理方法 - Google Patents
信息处理装置、记录介质及信息处理方法 Download PDFInfo
- Publication number
- CN115410206A CN115410206A CN202111284921.1A CN202111284921A CN115410206A CN 115410206 A CN115410206 A CN 115410206A CN 202111284921 A CN202111284921 A CN 202111284921A CN 115410206 A CN115410206 A CN 115410206A
- Authority
- CN
- China
- Prior art keywords
- character string
- corrected
- position information
- character
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 52
- 238000003672 processing method Methods 0.000 title claims description 5
- 238000012545 processing Methods 0.000 claims description 15
- 238000013523 data management Methods 0.000 description 39
- 238000012937 correction Methods 0.000 description 26
- 238000010586 diagram Methods 0.000 description 19
- 238000000605 extraction Methods 0.000 description 16
- 238000004891 communication Methods 0.000 description 11
- 239000000284 extract Substances 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000012015 optical character recognition Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 1
- 238000000034 method Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/418—Document matching, e.g. of document images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/38—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/383—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/5846—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using extracted text
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/412—Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Library & Information Science (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Character Discrimination (AREA)
Abstract
一种信息处理装置,其具有处理器,所述处理器进行如下处理:获取包含图像中所包含的字符串及该图像中的该字符串的位置信息的字符识别结果;显示所述字符识别结果中所包含的所述字符串;当所显示的所述字符串得到修正时,确定与所述字符识别结果中所包含的各字符串建立对应关联的所述位置信息中与修正后的所述字符串对应的位置信息。
Description
技术领域
本发明涉及一种信息处理装置、记录介质及信息处理方法。
背景技术
专利文献1中记载有如下内容:按照文档的读取结果,制作包含字符编码、表示产生有读取错误的字符位置的错误信息及文档整体的图像信息的中间文件,根据该中间文件中所包含的错误信息,检测产生有错误的字符所属的字段,从文档整体的图像信息剪切该字段的图像,显示由需修正的字段的字符读取结果及该字段的图像构成的错误修正用画面。
专利文献1:日本特开2000-105796号公报
发明内容
本发明目的在于确定与修正后的字符串对应的图像的位置。
本发明的方案1所涉及的信息处理装置具有处理器,所述处理器进行如下处理:获取包含图像中所包含的字符串及该图像中的该字符串的位置信息的字符识别结果;显示所述字符识别结果中所包含的所述字符串;当所显示的所述字符串得到修正时,确定与所述字符识别结果中所包含的各字符串建立对应关联的所述位置信息中与修正后的所述字符串对应的位置信息。
本发明的方案2所涉及的信息处理装置在方案1所述的结构中,所述处理器进行如下处理:显示与所述字符识别结果中所包含的第1字符串对应的第2字符串;当所述第2字符串得到修正时,确定与所述字符识别结果中所包含的各字符串建立对应关联的位置信息中与修正后的所述第2字符串对应的位置信息。
本发明的方案3所涉及的信息处理装置在方案2所述的结构中,所述处理器进行如下处理:当所述第1字符串得到修正时,确定与所述字符识别结果中所包含的各字符串建立对应关联的位置信息组中与修正后的第1字符串对应的位置信息。
本发明的方案4所涉及的信息处理装置在方案1至3中任一项所述的结构中,所述处理器进行如下处理:获取表示图像的图像数据;显示所获取的所述图像数据所表示的图像中所确定的所述位置信息所表示的位置的图像。
本发明的方案5所涉及的信息处理装置在方案4所述的结构中,所述处理器进行如下处理:显示所获取的所述图像数据所表示的图像中包含修正后的字符串的图像。
本发明的方案6所涉及的信息处理装置在方案1至5中任一项所述的结构中,所述处理器进行如下处理:当字符串得到修正时,且修正后的该字符串的一部分与所述字符识别结果中所包含的各字符串一致时,确定包含一致的一部分字符串的字符串的位置信息。
本发明的方案7所涉及的信息处理装置在方案1至6中任一项所述的结构中,所述处理器进行如下处理:当字符串得到修正时,在确定有复数个与所述字符识别结果中所包含的各字符串建立对应关联的位置信息组中与修正后的字符串对应的位置信息的情况下,显示该复数个位置信息所表示的位置的复数个图像;将从该复数个图像选择的图像显示为与得到修正的字符串对应的图像。
本发明的方案8所涉及的信息处理装置在方案1至7中任一项所述的结构中,所述处理器进行如下处理:当字符串得到修正时,在确定有复数个与所述字符识别结果中所包含的各字符串建立对应关联的位置信息组中与修正后的字符串对应的位置信息的情况下,确定关于各位置信息所表示的位置的复数个图像的优先度;根据所确定的所述优先度,将从该复数个图像选择的图像显示为与得到修正的字符串对应的图像。
本发明的方案9所涉及的信息处理装置在方案8所述的结构中,所述处理器使用用于确定所述优先度的复数个规则中的任一个。
本发明的方案10所涉及的信息处理装置在方案9所述的结构中,所述处理器使用所述复数个规则中与修正后的字符串相对应的规则。
本发明的方案11所涉及的信息处理装置在方案9所述的结构中,所述处理器使用所述复数个规则中与所述图像数据的属性相对应的规则。
本发明的方案12所涉及的信息处理装置在方案1至11中任一项所述的结构中,所述处理器进行如下处理:当字符串得到修正时,显示用于接收是否将与得到修正的字符串对应的图像设为字符识别对象的画面。
本发明的方案13所涉及的信息处理装置在方案12所述的结构中,所述处理器进行如下处理:显示用于指定在所述图像中成为字符识别对象的位置的画面。
本发明的方案14所涉及的记录介质记录有使计算机执行如下步骤的程序:
获取包含图像中所包含的字符串及该图像中的该字符串的位置的字符识别结果的步骤;
显示所述字符识别结果中所包含的字符串的步骤;及
当字符串得到修正时,确定与所述字符识别结果中所包含的各字符串建立对应关联的位置信息组中与修正后的字符串对应的位置信息的步骤。
本发明的方案15所涉及的信息处理方法包括如下步骤:
获取包含图像中所包含的字符串及该图像中的该字符串的位置的字符识别结果的步骤;
显示所述字符识别结果中所包含的字符串的步骤;及
当字符串得到修正时,确定与所述字符识别结果中所包含的各字符串建立对应关联的位置信息组中与修正后的字符串对应的位置信息的步骤。
发明效果
根据本发明的第1,14,15方案,能够确定与修正后的字符串对应的图像的位置。
根据本发明的第2方案所涉及的信息处理装置,当与字符识别结果中所包含的第1字符串对应的第2字符串得到修正时,能够确定与修正后的第2字符串对应的图像的位置。
根据本发明的第3方案所涉及的信息处理装置,当字符识别结果中所包含的第1字符串得到修正时,能够确定与修正后的第1字符串对应的图像的位置。
根据本发明的第4方案所涉及的信息处理装置,能够显示所确定的所述位置信息所表示的位置的图像。
根据本发明的第5方案所涉及的信息处理装置,能够显示包含修正后的字符串的图像。
根据本发明的第6方案所涉及的信息处理装置,能够确定包含与修正后的该字符串的一部分一致的字符串的字符串的位置信息。
根据本发明的第7方案所涉及的信息处理装置,在确定有复数个与修正后的字符串对应的位置信息的情况下,能够显示复数个位置信息所表示的位置的复数个图像中的任一个。
根据本发明的第8方案所涉及的信息处理装置,在确定有复数个与修正后的字符串对应的位置信息的情况下,根据优先度,能够显示复数个位置信息所表示的位置的复数个图像中的任一个。
根据本发明的第9方案所涉及的信息处理装置,按照复数个规则中的任一个,能够确定优先度。
根据本发明的第10方案所涉及的信息处理装置,在复数个规则中,能够根据与得到修正的字符串相对应的规则确定优先度。
根据本发明的第11方案所涉及的信息处理装置,在复数个规则中,能够根据与图像数据的属性相对应的规则确定优先度。
根据本发明的第12方案所涉及的信息处理装置,当字符串得到修正时,能够指定是否将与得到修正的字符串对应的图像设为字符识别对象。
根据本发明的第13方案所涉及的信息处理装置,能够指定在图像中成为字符识别对象的位置。
附图说明
根据以下附图,对本发明的实施方式进行详细叙述。
图1是例示本发明的一实施方式所涉及的信息处理系统的结构的框图;
图2是例示本实施方式所涉及的文档图像数据管理装置的硬件结构的框图;
图3是例示本实施方式所涉及的用户终端的硬件结构的框图;
图4是例示文档的图;
图5是例示存储于文档图像数据管理装置的字符识别结果的图;
图6是例示存储于文档图像数据管理装置的提取表的图;
图7是例示存储于文档图像数据管理装置的提取结果的图;
图8是表示文档图像数据管理装置的动作的流程图;
图9是例示显示于用户终端的修正用UI画面的图;
图10是表示存储于文档图像数据管理装置的提取结果的修正例的图;
图11是例示显示于用户终端的修正用UI画面的图;
图12是例示存储于文档图像数据管理装置的提取结果的修正例的图;
图13是例示显示于用户终端的修正用UI画面的图。
符号说明
1-文档图像数据管理装置,11-处理器,12-内存,13-存储器,14-通信IF,2-用户终端,21-处理器,22-内存,23-存储器,24-通信IF,25-UI部,100-信息处理系统。
具体实施方式
[1]结构
图1是例示本实施方式所涉及的信息处理系统100的结构的框图。信息处理系统100具备文档图像数据管理装置1及用户终端2。文档图像数据管理装置1及用户终端2均为计算机装置,且通过包含无线通信线路或有线通信线路的通信线路3连接。文档图像数据管理装置1为本发明中的信息处理装置的一例。
图2是例示文档图像数据管理装置1的硬件结构的图。处理器11为控制文档图像数据管理装置1的其他要件的处理器。内存12为作为处理器11用于执行程序的工作区而发挥功能的存储装置,例如包含RAM(Random Access Memory:随机存取存储器)。存储器13为存储各种程序及数据的存储装置,例如包含SSD(Solid State Drive:固态驱动器)或HDD(Hard Disk Drive:硬盘驱动器)。通过处理器11执行存储于内存12或存储器13的程序,在文档图像数据管理装置1中实现各种功能。通信IF(Interface:接口)14按照预先设定的无线或有线通信标准经由通信线路3与其他装置进行通信。
图3是例示用户终端2的硬件结构的图。处理器21为控制用户终端2的其他要件的处理器。内存22为作为处理器21用于执行程序的工作区而发挥功能的存储装置,例如包含RAM。存储器23为存储各种程序及数据的存储装置,例如包含SSD或HDD。通过处理器21执行存储于内存22或存储器23的程序,在用户终端2中实现各种功能。通信IF24按照预先设定的无线或有线通信标准,与其他装置进行通信。UI(User Interface:用户界面)部25例如具备显示器等显示装置及各种键等操作装置,并且显示对用户的UI画面,或接收用户的操作。
在信息处理系统100中,若用户通过未图示的扫描仪装置读取文档,则通过扫描仪装置生成表示其读取结果的文档图像数据,且存储于文档图像数据管理装置1。用户操作用户终端2而能够阅览存储于文档图像数据管理装置1的各种文档图像数据,或对这些文档图像数据赋予任意的字符串,该字符串例如为被称为标签或元数据的信息。
图4是例示本实施方式中的文档的图。在该例子中,示出了在相当于申请书的文档中包含相当于“申请书”“申请日期”“编号”……等的字符串t1~t7的情况。
文档图像数据管理装置1的处理器11对表示文档的文档图像数据进行OCR(Optical Character Recognition/Reader:光学字符识别)等字符识别处理。由此,处理器11获取包含文档图像数据中所包含的字符串及该文档图像数据中的字符串的位置的字符识别结果。字符识别结果存储于文档图像数据管理装置1的存储器13。图5是例示存储于文档图像数据管理装置1的存储器13的字符识别结果的图。图5例示了对图4所例示的文档进行了字符识别处理的结果。如图5所示,将经过字符识别处理识别出的字符串组与表示各字符串在文档中的位置的位置信息组建立对应关联并存储。与各字符串对应的各位置信息例如根据针对文档设定的XY直角坐标轴(参考图4),以包含该字符串的矩形(例如与字符串外切的外切矩形)中的任一个顶点的XY坐标值(x,y)、该矩形的X轴方向上的长度(width:宽度)及该矩形的Y轴方向上的长度(height:高度)来表现。例如,在图4中,“申请书”这一字符串t1的位置信息如图5所例示为“p01”,“发行日期”这一字符串t2的位置信息如图5所例示为“p02”,“ISSUE DATE”这一字符串t3的位置信息如图5所例示为“p03”,“2018年10月1日”这一字符串t4的位置信息如图5所例示为“p04”。
文档图像数据管理装置1的处理器11从识别出的字符串组提取被称为键及值的字符串,并且从上述文档图像数据提取相当于被称为值的字符串的图像数据。在此,键例如表示从文档的标题、该文档的发行日期及该文档所固有的编号等各文档中所包含的字符串组中预先确定的字符串的属性。相对于此,值为在各文档中相当于键的字符串其本身,键及值是成对的概念。例如,在相当于申请书的文档中,与键“标题”对应的值为“申请书”这一字符串,与键“发行日期”对应的值为“YYYY年MM月DD日”(Y、M、D为任意的数字)这一字符串,与键“编号”对应的值为“XXXXXXXXX”(X为任意的字符、记号或数字)这一字符串。另外,本实施方式中的相当于键的字符串为本发明中的第1字符串的一例,本实施方式中的相当于值的字符串为本发明中的第2字符串的一例。
文档图像数据管理装置1的处理器11存储有描述了用于从文档图像数据提取键及值的规则的提取表。图6是例示存储于文档图像数据管理装置1的存储器13的提取表的图。在该提取表中,在文档中可能会成为各键的字符串组与成为与各键对应的值的字符串的位置信息建立对应关联。在该提取表中,例如,与“标题”这一键对应的值定义为在文档中位于“最上段”的位置。并且,与“发行日期”这一键对应的值定义为在文档中位于该“键的右边”的位置。并且,与“编号”这一键对应的值定义为在文档中位于该“键的右边”的位置。另外,在图6中,将成为与各键对应的值的字符串的位置信息以“最上段”或“右边”来表现,但实际上,例如使用针对文档设定的XY直角坐标系中的坐标值来表现。例如,最上段的位置例如表示在针对文档设定的XY直角坐标轴中Y坐标值最大的字符串的位置信息。并且,键的右边的位置例如表示在针对文档设定的XY直角坐标轴中,相对于键,X坐标值第2大的字符串的位置信息。
文档图像数据管理装置1的处理器11按照该提取表,从识别出的字符串组提取被称为键及值的字符串,并且从上述文档图像数据提取相当于被称为值的字符串的图像数据。图7是例示存储于文档图像数据管理装置1的存储器13的提取结果的图。图7例示了对图4所例示的文档按照图6所例示的提取表进行提取的结果。如图7所示,提取有与键“标题”对应的值“申请书”这一字符串,而且,提取有相当于该值“申请书”的图像数据的位置信息“p01”。并且,提取有与键“发行日期”对应的值“ISSUE DATE”这一字符串,而且,提取有相当于该值“ISSUE DATE”的图像数据的位置信息“p03”。并且,提取有与键“编号”对应的值“INVOICE NUMBER”这一字符串,而且,提取有相当于该值“INVOICE NUMBER”的图像数据的位置信息“p06”。在此,提取相当于值的图像数据的位置信息相当于提取该图像数据。
然而,在图7中,作为与键“发行日期”对应的值提取有“ISSUE DATE”这一字符串,但这只是“发行日期”这一单词的英译,该值为与键“发行日期”对应的值即“YYYY年MM月DD日”(Y、M、D为任意的数字)这一字符串,即,在此应为“2018年10月1日”。同样地,作为与键“编号”对应的值提取有“INVOICE NUMBER”这一字符串,这只是“编号”这一单词的英译,该值应为“LI-K12554”。这种错误是因为,例如可想到如与键“发行日期”对应的值位于该键的右边的情况,并且如图4的例子那样与键“发行日期”对应的值隔着该键的英译位于右边的情况等,在各种文档中布局不同的事例。
在这种情况下,用户操作用户终端2,能够修正这些提取结果。以下,对与该修正相关的动作进行说明。
[2]动作
参考图8所示的流程图对文档图像数据管理装置1的动作进行说明。在图8中,文档图像数据管理装置1的处理器11在用户终端2中显示用户用于修正上述提取结果的修正用UI画面(步骤S0)。图9是例示修正用UI画面的图。图9所示的修正用UI画面G1例如为按照图7的内容显示有字符识别结果中所包含的相当于键的字符串、相当于值的字符串及文档图像数据所表示的图像中与相当于值的字符串对应的图像的UI画面。并且,图9所示的修正用UI画面G2为显示有图4所例示的文档图像数据所表示的文档图像整体的UI画面。这些修正用UI画面G1、G2例如两者排列显示于一个画面上,以便用户能够同时阅览。
在此,如前述,作为与键“发行日期”对应的值显示有“ISSUE DATE”这一字符串,而且显示有其图像,但该值原本应为“2018年10月1日”。因此,用户进行将作为与键“发行日期”对应的值来显示的“ISSUE DATE”修正为“2018年10月1日”的操作。该修正操作例如可以是用户在修正用UI画面G1中作为与键“发行日期”对应的值直接输入“2018年10月1日”这一字符串的操作,也可以是用户将在修正用UI画面G2中显示的“2018年10月1日”这一字符串指定为与键“发行日期”对应的值的操作。
若判断为值得到修正(步骤S1;“是”),则文档图像数据管理装置1的处理器11在图5所例示的字符识别结果中搜索修正后的相当于值即“2018年10月1日”的字符串,并判断存在几个相符的字符串(步骤S2)。在此,当在字符识别结果中不存在修正后的相当于值的字符串时(步骤S2;“无”),文档图像数据管理装置1的处理器11将规定的错误画面显示于用户终端2等,并结束图8的处理。
当在字符识别结果中存在一个修正后的相当于值的字符串时(步骤S2;“一个”),文档图像数据管理装置1的处理器11根据图5所例示的字符识别结果,确定相当于该字符串的图像的位置信息(步骤S3)。在此,如图5所例示,确定与“2018年10月1日”这一字符串对应的位置信息“p04”。
而且,文档图像数据管理装置1的处理器11在图7所例示的数据中,将作为与键“发行日期”对应的修正前的值的字符串“ISSUE DATE”改写为作为修正后的值的字符串“2018年10月1日”,并且将所对应的位置信息“p03”改写为所确定的位置信息“p04”(步骤S4)。由此,图7所例示的提取结果的内容改写为如图10所例示那样的提取结果。其结果,在修正用UI画面G1中,如图11所例示,显示与键“发行日期”对应的值“2018年10月1日”,而且显示与位置信息“p04”对应的图像(在文档图像中与“2018年10月1日”对应的图像)。
若用户以相同的顺序将作为与键“编号”对应的值来显示的“INVOICE NUMBER”修正为“LI-K12554”,则如图12所例示,文档图像数据管理装置1的处理器11在图7所例示的数据中,将作为与键“编号”对应的修正前的值的字符串“INVOICE NUMBER”改写为作为修正后的值的字符串“LI-K12554”,并且将与其对应的位置信息“p06”改写为位置信息“p07”。其结果,如图13所例示那样的修正用UI画面G1显示于用户终端2。
并且,当在字符识别结果中存在复数个修正后的相当于值的字符串时(步骤S2;“复数个”),文档图像数据管理装置1的处理器11根据某一优先顺序,在图5所例示的字符识别结果中选择其优先顺序最高的字符串(步骤S5)。
具体而言,文档图像数据管理装置1的处理器11按照图6的例示,将相当于值的复数个字符串各自的位置信息所表示的位置的复数个图像显示于用户终端2的修正用UI画面G2,将用户通过操作用户终端2从这些复数个图像中选择的图像作为与得到修正的字符串对应的图像显示于用户终端2。在进行该修正之后,如前述,字符串的提取结果得到改写,并显示与其改写结果相对应的修正用UI画面G1。
根据以上说明的本实施方式,能够确定文档中所包含的字符串组中与得到修正的字符串对应的图像的位置。而且,根据本实施方式,能够显示位于所确定的位置上的图像。
[3]变形例
上述实施方式只是实施本发明的一例,可以以如下方式进行变形。并且,上述实施方式及以下所示的各变形例可以根据需要组合实施。
(1)在上述实施方式中,文档图像数据管理装置1的处理器11将与从字符识别结果检测出的相当于键的字符串(第1字符串)对应的相当于值的字符串(第2字符串)显示于用户终端2,当相当于值的字符串(第2字符串)得到修正时,确定与字符识别结果中所包含的各字符串建立对应关联的位置信息组中与修正后的相当于值的字符串(第2字符串)对应的位置信息,但也可以使用户能够修正相当于键的字符串(第1字符串)。在该情况下,当第1字符串得到修正时,处理器11也可以确定与字符识别结果中所包含的各字符串建立对应关联的位置信息组中与修正后的第1字符串对应的位置信息,并且将位于所确定的位置上的图像显示于用户终端2。
(2)在上述实施方式中,当相当于值的字符串得到修正时,且修正后的字符串与字符识别结果中所包含的字符串一致时,文档图像数据管理装置1的处理器11确定一致的字符串的位置信息,并且将位于所确定的位置上的图像显示于用户终端2。关于该处理,当相当于值的字符串得到修正时,且修正后的字符串的一部分与字符识别结果中所包含的各字符串一致时,处理器11确定包含一致的一部分字符串的字符串的位置信息,并且将位于所确定的位置上的图像显示于用户终端2。即,修正后的字符串与字符识别结果中所包含的字符串可以局部性地一致。
(3)在上述实施方式中,当相当于值的字符串得到修正时,且确定有复数个与字符识别结果中所包含的各字符串建立对应关联的位置信息组中与修正后的字符串对应的位置信息时,文档图像数据管理装置1的处理器11将由用户选择的图像的位置信息用作优先度最高的信息,但并不限定于该优先度的实施方式的例子。
并且,处理器11也可以将用于确定上述优先度的复数个规则存储于存储器13,并且使用该复数个规则中的任一个。例如处理器11也可以使用复数个规则中与修正后的字符串相对应的规则。例如,当修正后的字符串为与“标题”对应的相当于值的字符串时,处理器11也可以提高尺寸最大的字符串或某一特定的字体的字符串的优先度。
并且,处理器11也可以使用复数个规则中与文档图像数据的属性相对应的规则。例如,在如对文档图像数据赋予表示其种类(属性)的元数据的那样的情况下,关于赋予了某一元数据A的文档图像数据,例如当修正后的字符串为与键“标题”对应的相当于值的字符串时,处理器11可以提高尺寸最大的字符串的优先度,并且,关于赋予了某一元数据B的文档图像数据,例如当修正后的字符串为与键“标题”对应的相当于值的字符串时,处理器11也可以提高某一特定的字体的字符串的优先度。
(4)当字符串得到修正时,文档图像数据管理装置1的处理器11也可以将用于接收是否将与修正后的字符串对应的图像设为之后的字符识别对象的UI画面显示于用户终端2。例如,当字符串得到修正时,文档图像数据管理装置1的处理器11也可以将用于指定成为字符识别对象的位置的画面显示于用户终端2。更具体而言,处理器11将用于向用户询问是否将图6中例示的成为与各键对应的值的字符串的位置信息改写为表示相当于修正后的字符串的图像在文档中的位置的位置信息的画面显示于用户终端2,当存在改写这一用户的回答时,改写为表示相当于修正后的字符串的图像在文档中的位置的位置信息。由此,图6中例示的字符串的位置信息即“最上段”或“右边”得到改写,从而之后用户无需修正字符串。
(5)在上述实施方式中,由文档图像数据管理装置1的处理器11或用户终端2的处理器21执行的程序可以经由互联网等通信线路下载。并且,这些程序可以以记录于磁记录介质(磁带、磁盘等)、光记录介质(光盘等)、磁光记录介质、半导体存储器等计算机可读取的记录介质的状态来提供。
上述本发明的实施方式是以例示及说明为目的而提供的。另外,本发明的实施方式并不全面详尽地包括本发明,并且并不将本发明限定于所公开的方式。很显然,对本发明所属的领域中的技术人员而言,各种变形及变更是自知之明的。本实施方式是为了最容易理解地说明本发明的原理及其应用而选择并说明的。由此,本技术领域中的其他技术人员能够通过对假定为各种实施方式的特定使用最优化的各种变形例来理解本发明。本发明的范围由以上的权利要求书及其等同物来定义。
Claims (15)
1.一种信息处理装置,其具有处理器,
所述处理器进行如下处理:
获取包含图像中所包含的字符串及所述图像中的所述字符串的位置信息的字符识别结果;
显示所述字符识别结果中所包含的所述字符串;
当所显示的所述字符串得到修正时,确定与所述字符识别结果中所包含的各字符串建立对应关联的所述位置信息中与修正后的所述字符串对应的位置信息。
2.根据权利要求1所述的信息处理装置,其中,
所述处理器进行如下处理:
显示与所述字符识别结果中所包含的第1字符串对应的第2字符串;
当所述第2字符串得到修正时,确定与所述字符识别结果中所包含的各字符串建立对应关联的位置信息中与修正后的所述第2字符串对应的位置信息。
3.根据权利要求2所述的信息处理装置,其中,
所述处理器进行如下处理:
当所述第1字符串得到修正时,确定与所述字符识别结果中所包含的各字符串建立对应关联的位置信息组中与修正后的第1字符串对应的位置信息。
4.根据权利要求1至3中任一项所述的信息处理装置,其中,
所述处理器进行如下处理:
获取表示图像的图像数据;
显示所获取的所述图像数据所表示的图像中所确定的所述位置信息所表示的位置的图像。
5.根据权利要求4所述的信息处理装置,其中,
所述处理器进行如下处理:
显示所获取的所述图像数据所表示的图像中包含修正后的字符串的图像。
6.根据权利要求1至5中任一项所述的信息处理装置,其中,
所述处理器进行如下处理:
当字符串得到修正时,且修正后的所述字符串的一部分与所述字符识别结果中所包含的各字符串一致时,确定包含一致的一部分字符串的字符串的位置信息。
7.根据权利要求1至6中任一项所述的信息处理装置,其中,
所述处理器进行如下处理:
获取表示图像的图像数据;
当字符串得到修正时,在确定有复数个与所述字符识别结果中所包含的各字符串建立对应关联的位置信息组中与修正后的字符串对应的位置信息的情况下,
显示所述复数个位置信息所表示的位置的复数个图像;
将从所述复数个图像选择的图像显示为与得到修正的字符串对应的图像。
8.根据权利要求1至7中任一项所述的信息处理装置,其中,
所述处理器进行如下处理:
获取表示图像的图像数据;
当字符串得到修正时,在确定有复数个与所述字符识别结果中所包含的各字符串建立对应关联的位置信息组中与修正后的字符串对应的位置信息的情况下,
确定关于各位置信息所表示的位置的复数个图像的优先度;
根据所确定的所述优先度,将从所述复数个图像选择的图像显示为与得到修正的字符串对应的图像。
9.根据权利要求8所述的信息处理装置,其中,
所述处理器使用用于确定所述优先度的复数个规则中的任一个。
10.根据权利要求9所述的信息处理装置,其中,
所述处理器使用所述复数个规则中与修正后的字符串相对应的规则。
11.根据权利要求9所述的信息处理装置,其中,
所述处理器使用所述复数个规则中与所述图像数据的属性相对应的规则。
12.根据权利要求1至11中任一项所述的信息处理装置,其中,
所述处理器进行如下处理:
当字符串得到修正时,显示用于接收是否将与得到修正的字符串对应的图像设为字符识别对象的画面。
13.根据权利要求12所述的信息处理装置,其中,
所述处理器进行如下处理:
显示用于指定在所述图像中成为字符识别对象的位置的画面。
14.一种记录介质,其记录有使计算机执行如下步骤的程序:
获取包含图像中所包含的字符串及所述图像中的所述字符串的位置的字符识别结果的步骤;
显示所述字符识别结果中所包含的字符串的步骤;及
当字符串得到修正时,确定与所述字符识别结果中所包含的各字符串建立对应关联的位置信息组中与修正后的字符串对应的位置信息的步骤。
15.一种信息处理方法,其包括如下步骤:
获取包含图像中所包含的字符串及所述图像中的所述字符串的位置的字符识别结果的步骤;
显示所述字符识别结果中所包含的字符串的步骤;及
当字符串得到修正时,确定与所述字符识别结果中所包含的各字符串建立对应关联的位置信息组中与修正后的字符串对应的位置信息的步骤。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021088281A JP2022181367A (ja) | 2021-05-26 | 2021-05-26 | 情報処理装置及びプログラム |
JP2021-088281 | 2021-05-26 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115410206A true CN115410206A (zh) | 2022-11-29 |
Family
ID=78806233
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111284921.1A Pending CN115410206A (zh) | 2021-05-26 | 2021-11-01 | 信息处理装置、记录介质及信息处理方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20220383023A1 (zh) |
EP (1) | EP4095716A1 (zh) |
JP (1) | JP2022181367A (zh) |
CN (1) | CN115410206A (zh) |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000105796A (ja) | 1998-09-28 | 2000-04-11 | Toshiba Corp | 文字読み取りシステムおよび同システムにおける読み取り結果訂正処理方法 |
JP6050843B2 (ja) * | 2015-01-30 | 2016-12-21 | 株式会社Pfu | 情報処理装置、方法およびプログラム |
JP2021077332A (ja) * | 2019-11-05 | 2021-05-20 | キヤノン株式会社 | 情報処理装置、サーバ、システム、情報処理方法、およびプログラム |
-
2021
- 2021-05-26 JP JP2021088281A patent/JP2022181367A/ja active Pending
- 2021-09-27 US US17/485,538 patent/US20220383023A1/en active Pending
- 2021-11-01 CN CN202111284921.1A patent/CN115410206A/zh active Pending
- 2021-11-02 EP EP21205989.3A patent/EP4095716A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
EP4095716A1 (en) | 2022-11-30 |
US20220383023A1 (en) | 2022-12-01 |
JP2022181367A (ja) | 2022-12-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8107727B2 (en) | Document processing apparatus, document processing method, and computer program product | |
US8015203B2 (en) | Document recognizing apparatus and method | |
JP4461769B2 (ja) | 文書検索・閲覧手法及び文書検索・閲覧装置 | |
AU2007202768B2 (en) | Document processing device, program, and document processing method | |
JP4347677B2 (ja) | 帳票ocrプログラム、方法及び装置 | |
JP5380040B2 (ja) | 文書処理装置 | |
CN103699891A (zh) | 图像处理装置及图像处理方法 | |
JP5661549B2 (ja) | 帳票上の文字を認識する文字認識装置、マスク処理方法、および、マスク処理プログラム | |
JP4470913B2 (ja) | 文字列検索装置およびプログラム | |
JP6931168B2 (ja) | 情報処理装置、制御方法、プログラム | |
JP4518212B2 (ja) | 画像処理装置及びプログラム | |
CN115410206A (zh) | 信息处理装置、记录介质及信息处理方法 | |
JP2005107931A (ja) | 画像検索装置 | |
JP4517822B2 (ja) | 画像処理装置及びプログラム | |
US20120154436A1 (en) | Information display apparatus and information display method | |
JP6947971B2 (ja) | 情報処理装置、制御方法、プログラム | |
WO2019087593A1 (ja) | 文書検索装置および方法 | |
JPWO2020240820A1 (ja) | ファイル管理装置、ファイル管理方法、及びプログラム | |
JP2006235715A (ja) | 画像検索装置、画像検索方法、プログラムおよび記録媒体 | |
JP2002259173A (ja) | ファイル管理プログラム、ファイル管理プログラムを記録したコンピュータ読取可能な記録媒体、ファイル管理装置およびファイル管理方法 | |
JP7377565B2 (ja) | 図面検索装置、図面データベース構築装置、図面検索システム、図面検索方法、及びプログラム | |
JP2013182459A (ja) | 情報処理装置、情報処理方法及びプログラム | |
KR101098500B1 (ko) | 문서파일의 데이터 레코드 운영 방법 | |
JP6536542B2 (ja) | 情報処理装置、制御方法、プログラム | |
JP6475288B2 (ja) | プログラム比較方法、プログラム比較装置およびプログラム比較プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |