CN112347831A - 信息处理装置以及表识别方法 - Google Patents
信息处理装置以及表识别方法 Download PDFInfo
- Publication number
- CN112347831A CN112347831A CN202010471657.1A CN202010471657A CN112347831A CN 112347831 A CN112347831 A CN 112347831A CN 202010471657 A CN202010471657 A CN 202010471657A CN 112347831 A CN112347831 A CN 112347831A
- Authority
- CN
- China
- Prior art keywords
- item name
- information processing
- processing apparatus
- different
- item
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 82
- 238000000034 method Methods 0.000 title claims abstract description 30
- 238000012545 processing Methods 0.000 claims abstract description 64
- 238000012937 correction Methods 0.000 claims description 11
- 238000000926 separation method Methods 0.000 description 35
- 238000001514 detection method Methods 0.000 description 15
- 238000010586 diagram Methods 0.000 description 15
- 230000006870 function Effects 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 5
- 239000000284 extract Substances 0.000 description 5
- 238000012790 confirmation Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 3
- 238000009434 installation Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 230000004931 aggregating effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/413—Classification of content, e.g. text, photographs or tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/412—Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/62—Text, e.g. of license plates, overlay texts or captions on TV images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- Character Input (AREA)
- Character Discrimination (AREA)
Abstract
提供一种信息处理装置以及表识别方法,能够将结合后的不同的多个表在含义上分解、识别。对包含不同的表区域结合而得到的结合表区域的输入图像进行表识别的信息处理装置中,对输入图像之中至少结合表区域进行字符识别处理,从由字符识别处理的结果得到的字符串提取项目名,若在结合表区域内,在以一个项目名为起点的列或者行内向一个方向前进的位置上检测到与一个项目名不同的项目名,则将不同的项目名以后识别为不同的表区域。
Description
技术领域
本发明涉及信息处理装置以及表识别方法。
背景技术
由于字符识别技术的普及,由人进行的作业的自动化正在发展。例如,将文档的记载内容输入至数据库的作业通过活用字符识别处理从而被自动化。近年,表的记载内容的数据库化也活用字符识别处理而被自动化。
为了将文档图像内的表的记载内容自动地数据库化,需要使用字符识别处理从表中获取字符串,从所获取的字符串之中提取表的项目名以及与该项目名对应的项目值。另外,项目名是指表示信息的类型的字符串,一般被记载于表的最上行或最左列的情况较多。此外,项目值是指与项目名对应的记载内容。将从表获取与所述的项目名以及项目值相应的字符串的处理在本说明书中称为表识别。
为了实现表识别,研究了将通过字符识别处理而获取到的字符串与预先准备的项目名字典进行对照,从而确定表中记载的项目名的坐标,确定对应的项目值的方法。
例如,在专利文献1中,公开了一种文档属性获取装置,其特征在于,具备:表区域估计部,从文档数据将包含其属性以及属性内容的区域估计为表区域;字符识别部,对所述表区域中的字符进行识别;属性识别部,基于所述字符识别部的识别结果对所述属性进行识别;以及提取部,将与由所述属性识别部识别出的所述属性对应的位置的字符串作为所述属性内容而与所述属性建立对应并提取。
使用专利文献1中记载的技术,从而能够对文档图像内的表区域进行估计,对表区域中的字符进行识别,提取表区域中的项目名和项目值,进行数据库化。
在先技术文献
专利文献
专利文献1:特开2006-92207号公报
发明内容
发明要解决的课题
专利文献1中记载的技术的处理对象是具有2行n列或者n行2列的结构,全部项目名被记载于同一行或者同一列的表。因此,有以下课题:不能识别行数以及列数更多的表、或项目名分散于表内的表等复杂的表。另外,项目名分散于表内的表区域被理解为结合具有含义上不同的多个表的表区域而构成的结合表区域。
本发明是鉴于上述的课题而完成的,因此提供能够将结合后的不同的多个表在含义上分解、识别的信息处理装置以及表分析方法。
用于解决课题的手段
为了解决上述课题,按照本发明的一个观点的信息处理装置是对包含不同的表区域结合而得到的结合表区域的输入图像进行表识别的信息处理装置,其特征在于,对输入图像之中至少结合表区域进行字符识别处理,从由字符识别处理的结果得到的字符串提取项目名,若在结合表区域内,在以一个项目名为起点的列或者行内向一个方向前进的位置上检测到与一个项目名不同的项目名,则将不同的项目名以后识别为不同的表区域。
发明效果
根据本发明,能够实现能够将结合后的不同的多个表在含义上分解、识别的信息处理装置以及表识别方法。
附图说明
图1是表示实施例所涉及的信息处理装置的概略结构的图。
图2是表示实施例所涉及的信息处理装置的动作的一例的流程图。
图3是表示实施例所涉及的布局数据的一例的图。
图4是表示实施例所涉及的字符识别结果数据的一例的图。
图5是表示作为输入图像的结合后的表图像的一例的图。
图6是表示实施例所涉及的信息处理装置所进行的表识别处理的结果的示意图。
图7是说明实施例所涉及的信息处理装置所进行的表分离以及项目名项目值建立对应处理的一例的流程图。
图8是说明实施例所涉及的信息处理装置所进行的项目名检测处理的一例的流程图。
图9是表示实施例所涉及的项目字典数据的一例的图。
图10是说明实施例所涉及的信息处理装置所进行的项目名项目值对应关系检测处理的一例的流程图。
图11是说明实施例所涉及的信息处理装置所进行的表识别结果修正处理的一例的流程图。
图12是表示实施例所涉及的信息处理装置的输出装置中显示的画面的一例的图。
标号说明
100……信息处理装置 101……处理器 102……输入装置 103……输出装置104……主存储装置 105……副存储装置 106……网络接口 111……布局分析程序112……字符识别程序 113……项目名项目值建立对应程序 114……表识别结果修正程序121……布局数据 122……字符识别结果数据
具体实施方式
以下,针对本发明的实施方式,参照附图进行说明。另外,在以下说明的实施方式并非限定专利权利要求书所涉及的发明,此外不限于在实施方式之中说明的各元素及其组合的全部为发明的解决手段所必须。
本实施方式的信息处理装置以及表识别方法作为一例而具有下面那样的结构。
本实施方式的目的在于,将结合后的不同的多个表在含义上分解,对分解后的各表进行识别。为了实现所述目的,在实施例中,着眼于表区域内的项目名,检测结合后的多个表的含义上的边界。一般来说,项目名被记载于表的最上行或最左列的情况较多。但是,在多个表结合的表区域中,在表的内部记载项目名的情况较多,所以将在表内部检测到的项目名理解为表的含义的变化而分离、识别。此外,在实施例中,提示用于项目名字典的扩充的GUI,该项目名字典被用于所述识别结果的确认、以及项目名检测。
另外,在说明实施例的图中,对具有同一功能的地方赋予同一标号,省略其反复的说明。
此外,在以下的说明中,有时作为信息的一例而使用“xxx数据”这样的表现,但信息的数据结构也可以是任意。即,为了表示信息不依赖于数据结构,能够将“xxx数据”称为“xxx表格”。此外,在以下的说明中,各信息的结构是一例,也可以将信息分割并保持,或结合并保持。
[实施例1]
首先,参照图1,说明实施例1的信息处理装置的硬件结构以及软件结构,在图2以后进行所述信息处理装置所执行的表识别方法的处理的说明。
图1是表示实施例所涉及的信息处理装置的概略结构的图。
信息处理装置100是能够进行各种信息处理的装置,作为一例而是计算机等信息处理装置。信息处理装置100执行与图像中的结合后的表区域的分离、以及表识别相关的处理。此外,还执行与用于表识别结果的确认以及修正的GUI相关的处理。
信息处理装置100具有处理器101、输入装置102、以及输出装置103、主存储装置104、副存储装置105、网络接口106。各硬件经由内部总线等而被相互连接。在图1中,各硬件的数目为一个,但也可以是两个以上。所连接的网络的种类没有被限定。也可以经由网络或直接的连接,与其他计算机或存储装置进行数据的发送接收或处理的分担。
处理器101例如具有CPU(中央处理单元(Central Processing Unit)),FPGA(现场可编程门阵列(Field-Programmable Gate Array))等运算元件,执行主存储装置104中储存的程序。处理器101按照程序而执行处理,从而实现特定的功能。在以后的说明中以程序为主语而说明处理的情况下,表示处理器101执行程序。
输入装置102是用于对信息处理装置100输入数据的装置。例如,输入装置102包含键盘、鼠标、以及触摸面板等用于计算机操作的机器。此外,输入装置102还包含扫描仪、数码相机以及智能手机等用于图像获取的机器。
输出装置103是输出数据的输入画面以及处理结果等的装置。输出装置103包含触摸面板以及显示器等。
主存储装置104储存处理器101所执行的程序以及程序所使用的信息。此外,主存储装置104包含程序临时使用的工作区域。主存储装置104例如考虑存储器等。
本实施例的主存储装置104储存布局分析程序111、字符识别程序112、表分离以及项目名项目值建立对应程序113、表识别结果修正程序114。程序111至114与图2的步骤S201、S202、S203、S204的处理分别对应。
此外,主存储装置104储存布局数据121、字符识别结果数据122、项目名字典数据123。针对布局数据121、字符识别结果数据122以及项目名字典数据123的细节,在图3、4、8中分别记载。针对主存储装置104所执行的各模块的处理的细节、以及主存储装置中储存的信息,在参照图2以后时叙述。
主存储装置104能够实现所需的一部分模块即可,不需要储存实现全部模块的程序以及信息。
副存储装置105将数据永久地储存。副存储装置105例如考虑HDD(硬盘驱动器(Hard Disk Drive))以及SSD(固态驱动器(Solid State Drive))等。另外,主存储装置104中储存的程序以及信息也可以被储存至副存储装置105。在该情况下,处理器101从副存储装置105读出程序以及信息,加载至主存储装置104。
图2是表示实施例所涉及的信息处理装置100的动作的一例的流程图,是表示信息处理装置100所进行的表识别处理的概要的流程图。
首先,信息处理装置100的布局分析程序111对输入图像实施布局分析处理。布局分析处理是指,作为字符识别的前处理而一般被实施的处理,能够使用公知的方法而实现。例如,考虑将输入图像设为黑白的二值图像,从图像提取连结的黑像素成分,而提取格线、字符行、表区域等。
布局分析程序111作为步骤S201的处理结果而获取布局数据121。针对布局数据121,使用图3在后面叙述。另外,步骤S201的输入图像除了从输入装置102获取的图像之外,也可以是副存储装置105或外部的存储装置等中储存的图像,也可以是经由网络接口106而获取的图像。
本实施例的信息处理装置100以及表识别方法中的输入图像是将被打印输出的(包含表区域的)文档使用扫描仪、数码相机以及智能手机等用于图像获取的机器而图像化的图像。对输入图像的格式没有特别的限定,能够应用位图图像、JPEG(联合摄影专家组(Joint Photographic Experts Group))图像等公知的格式的图像。此外,关于PDF(便携文件格式(Portable Document Format))文档,也能够在文本中容易地取出项目名或项目值,与表相关的信息被储存于图像等,因此,关于PDF文档也能够包含于此处所说的输入图像。
接着,信息处理装置100的字符识别程序112实施字符识别处理(步骤S202)。字符识别处理是指,对在步骤S201中提取的字符串进行的字符类型判别的处理,能够使用公知的方法而实现。例如,考虑从字符串图像提取方向特征,使用所述方向特征通过字符识别字典内的最近邻搜索而判别字符类型。
字符识别程序112作为步骤S202的处理结果而获取字符识别结果数据122。针对字符识别结果数据122,参照图4在后面叙述。
进而,信息处理装置100的表分离以及项目名项目值建立对应程序113实施表分离以及项目名项目值对应处理(步骤S203)。在表分离以及项目名项目值对应处理中,检测结合后的多个表的含义上的边界而将表在含义上分离,在分离后的各表中,进行项目名和项目值的建立对应,获取表识别结果。针对步骤S203的处理的细节,使用图6在后面叙述。
并且,信息处理装置100的表识别结果修正程序114将在步骤S203中获取到的表识别结果提示给GUI,接收确认以及修正信息(步骤S204)。针对步骤S204的处理的细节,参照图11在后面叙述。此外,针对GUI的细节,参照图12在后面叙述。
图3是表示实施例所涉及的布局数据121的一例的图。
布局数据121将在步骤S201的布局分析处理中提取到的对象设为条目。布局数据121具有对象序号301、属性名302、记载坐标303、以及结构表序号304。
对象序号301储存用于唯一地确定在步骤S201的布局分析处理中提取到的各对象的序号。
属性名302储存表示条目的属性的信息,纵格线、横格线、字符串等属性被赋予各条目。
记载坐标303储存条目的图像中的起点以及终点的坐标。
结构表序号304储存用于唯一地确定条目所成为结构元素的表的序号。
图4是表示实施例所涉及的字符识别结果数据122的一例的图。
字符识别结果数据122将在步骤S202的字符识别处理中获取到的字符类型判别的结果按每个字符串而汇总后的结果设为条目。字符识别结果数据122具有对象序号401、字符串402、表最上标志403、表最左标志404。
对象序号401储存有用于唯一地确定各对象的序号,与图3的对象序号301对应。
字符串402储存在字符识别处理中获取到的字符串。
表最上标志403是条目是否是被记载于表的最上段的字符的标志。
表最左标志404是条目是否是被记载于表的最左列的字符的标志。
图5是表示作为输入图像的结合后的表图像的一例的图,图6是表示实施例所涉及的信息处理装置100所进行的表识别处理的结果的示意图。
图5所示的结合表501是记载了某设计附图中的尺寸等的表的一例,在一个表区域之中,包含有安装位置、安装等级、垂直度(水平度)这样的三个不同的表。此时,实施例的信息处理装置100如图6所示,作为表识别处理结果,获取由安装位置表格502、安装等级表格503、垂直度表格504这样的三个分离的表格构成的数据库。另外,各表格作为原本的结合后的表之间的链接而具有结合表键,能够相互进行参照。
图7是说明实施例所涉及的信息处理装置100所进行的表分离以及项目名项目值建立对应处理的一例的流程图。
首先,信息处理装置100的表分离以及项目名项目值建立对应程序113对字符识别结果数据122和项目名字典数据123进行对照,从而检测项目名(步骤S601)。关于项目名检测处理,参照图8在后面叙述细节。
接着,信息处理装置100的表分离以及项目名项目值建立对应程序113实施表分离格线检测处理(步骤S602)。表分离格线检测处理检测被认为是将表在含义上分离的格线。例如,考虑基于图3的布局数据121的记载坐标303而算出格线的粗度,在粗度为阈值以上的情况下,判断为表分离格线的处理。此外,也能够以颜色的变化来检测表分离格线。
接着,信息处理装置100的表分离以及项目名项目值建立对应程序113实施表分离字体检测处理(步骤S603)。表分离字体检测处理检测被认为是将表在含义上分离的字体。例如,考虑检测字符串的粗度、颜色、字符类型的变化。
进而,信息处理装置100的表分离以及项目名项目值建立对应程序113基于步骤S601至S603的处理结果,进行表分离处理(步骤S604)。
具体而言,信息处理装置100的表分离以及项目名项目值建立对应程序113理解为在存在项目名、表分离格线、表分离字体的位置的前后表的含义发生变化,对结合表进行分离。在基于项目名或者表分离字体的情况下,将与该字符串相比更左以及上为止设为表1,将该字符串以及该字符串之下以及该字符串之右的区域设为表2。在基于表分离格线的情况下,将表分离格线之上或者左设为表1,将下或者右设为表2。
另外,本处理中的上下左右的处理的分支是设想了一般的表的分支,也可以根据应用对象而调换分支,也可以改变判定的方向。此外,在以后说明的其他处理中也可以同样地改变。
并且,信息处理装置100的表分离以及项目名项目值建立对应程序113实施项目名项目值建立对应处理(步骤S605)。对于项目名项目值建立对应处理,在步骤S601至步骤S604中分离的各表中,对项目名和项目值建立对应。针对处理的细节使用图10在后面叙述。
图8是说明实施例所涉及的信息处理装置100所进行的项目名检测处理的一例的流程图,是说明与图7的步骤S601对应的项目名检测处理的流程图。
首先,信息处理装置100的表分离以及项目名项目值建立对应程序113根据项目名字典数据123的有无而对处理进行分支(步骤S701)。在存在项目名字典数据的情况下,信息处理装置100的表分离以及项目名项目值建立对应程序113前进至步骤S702,在不存在的情况下,信息处理装置100的表分离以及项目名项目值建立对应程序113前进至步骤S703。另外,项目名字典数据是指,定义了成为项目名的字符串的数据,使用图8在后面叙述。
接着,信息处理装置100的表分离以及项目名项目值建立对应程序113对字符识别结果数据122和项目名字典数据123进行对照(步骤S702)。
接着,信息处理装置100的表分离以及项目名项目值建立对应程序113将对照匹配后的字符串的区域检测为项目名区域(步骤S703)。
接着,信息处理装置100的表分离以及项目名项目值建立对应程序113将存在于表的最左或者最上的字符串区域检测为项目名区域(步骤S704)。
并且,信息处理装置100的表分离以及项目名项目值建立对应程序113将被项目名夹着的字符串区域检测为项目名区域(步骤S705)。
图9是表示实施例所涉及的项目名字典数据123的一例的图。
项目名字典数据123将项目名字符串设为条目。字符识别结果数据具有字典序号801、项目名802。
图10是说明实施例所涉及的信息处理装置100所进行的项目名项目值对应关系检测处理的一例的流程图,是说明与图7的步骤S605对应的项目名项目值对应关系检测处理的流程图。项目名项目值对应关系检测处理按每个行或者列而实施。
首先,信息处理装置100的表分离以及项目名项目值建立对应程序113在图8的项目名检测处理中检测到的项目名区域的、存在于向右延伸的行或者向下延伸的列的字符串中,搜索不同的项目名(步骤S901)。
接着,信息处理装置100的表分离以及项目名项目值建立对应程序113根据不同的项目名的检测的有无而对处理进行分支(步骤S902)。在存在的情况下,信息处理装置100的表分离以及项目名项目值建立对应程序113前进至步骤S903,在不存在的情况下,信息处理装置100的表分离以及项目名项目值建立对应程序113前进至步骤S904。
接着,信息处理装置100的表分离以及项目名项目值建立对应程序113将至所检测到的不同的项目名为止的搜索行或者列判断为与成为搜索的起点的项目名为同一表区域,递归而前进至步骤S901(步骤S903)。
并且,信息处理装置100的表分离以及项目名项目值建立对应程序113将搜索到表的边缘为止的行或者列判断为与成为搜索的起点的项目名为同一表区域(步骤S904)。
图11是说明实施例所涉及的信息处理装置100所进行的表识别结果修正处理的一例的流程图。
首先,信息处理装置100的表识别结果修正程序114将输入图像和表识别结果显示于输出装置103(步骤S1001)。关于输出装置103中显示的GUI,参照图12在后面叙述。
接着,信息处理装置100的表识别结果修正程序114经由输入装置102接收根据GUI输入的项目名项目值对应关系的修正信息(步骤S1002)。在接收的情况下,信息处理装置100的表识别结果修正程序114前进至步骤S1003。在不接收的情况下,信息处理装置100的表识别结果修正程序114结束处理。
接着,信息处理装置100的表识别结果修正程序114将所接收到的修正反映至表识别结果(步骤S1003)。
并且,接着,信息处理装置100的表识别结果修正程序114将通过修正而新被指定为项目名的字符串追加到项目名字典数据123(步骤S1004)。另外,也可以不进行即时追加,而追加保留一定期间的处理、或对人提示而进行字典追加的判断的处理。
图12是表示实施例所涉及的信息处理装置100的输出装置103中显示的画面的一例的图,是表示在图11的表识别结果修正处理中使用的、表识别结果的确认修正GUI的一例的图。
1101是对于输入图像的表识别结果。首先,表识别结果的项目名以及项目值被显示。用户确认该表识别结果,若需要,则使用鼠标、触摸笔以及手指等,对待修正的项目名以及项目地的区域进行指定、输入。
1102是确认以及修正的完成按钮。
此外,也可以追加显示确认修正的输入图像的一览的窗口或将修正返回原样的功能等。
根据这样构成的本实施例,对包含不同的表区域结合的结合表区域的输入图像进行表识别的信息处理装置100对输入图像之中至少结合表区域进行字符识别处理,从字符识别处理的结果得到的字符串提取项目名,若在结合表区域内,在以一个项目名为起点的列或者行内向一个方向前进的位置上检测到与一个项目名不同的项目名,则将不同的项目名以后识别为不同的表区域。
因此,根据本实施例,能够将结合后的不同的多个表在含义上分解、识别。
另外,为了易于理解本发明而说明,详细说明了上述的实施例的结构,并非限定于必须具有所说明的全部结构。此外,能够将各实施例的结构的一部分对其他结构进行追加、删除、置换。
作为一例,在上述的实施例中,也可以针对通过表分离以及项目名项目值建立对应程序113而识别的表区域内,通过再次表分离以及项目名项目值建立对应程序113而递归地进行识别。
此外,在表识别结果修正程序114中被追加至项目名字典数据123的项目名也可以是已经被注册到项目名字典数据123的项目名的不同记载。
此外,就上述的各结构、功能、处理部、处理部件等而言,也可以将这些一部分或者全部通过例如在集成电路中设计等而以硬件来实现。此外,本发明也能够通过实现实施例的功能的软件的程序代码来实现。在该情况下,将记录了程序代码的存储介质提供给计算机,该计算机所具备的处理器读出存储介质中储存的程序代码。在该情况下,从存储介质读出的程序代码本身实现所述的实施例的功能,其程序代码本身、以及将其存储的存储介质构成本发明。作为这样的用于供应程序代码的存储介质,例如使用软磁盘、CD-ROM、DVD-ROM、硬盘、SSD(固态驱动器(Solid State Drive))、光盘、光磁盘、CD-R、磁带、非易失性的存储器卡、ROM等。
此外,实现本实施例中记载的功能的程序代码例如能够以汇编语言、C/C++、perl、Shell、PHP、Java(注册商标)等宽范围的程序或者脚本语言来安装。
进而,也可以通过将实现实施例的功能的软件的程序代码经由网络而分发,从而将其储存至计算机的硬盘或存储器等存储部件或者CD-RW、CD-R等存储介质,计算机所具备的处理器读出并执行该存储部件或该存储介质中储存的程序代码。
在上述的实施例中,控制线、信息线表示被认为是说明上需要的线,不限于在产品上必须表示全部控制线、信息线。也可以是全部结构被相互连接。
Claims (14)
1.一种信息处理装置,对包含不同的表区域结合而得到的结合表区域的输入图像进行表识别,其特征在于,
对所述输入图像之中至少所述结合表区域进行字符识别处理,
从由所述字符识别处理的结果得到的字符串提取项目名,
若在所述结合表区域内,在以一个所述项目名为起点的列或者行内向一个方向前进的位置上检测到与所述一个项目名不同的所述项目名,则将所述不同的所述项目名以后识别为不同的所述表区域。
2.如权利要求1所述的信息处理装置,其特征在于,
所述一个方向针对所述列为所述结合表区域的从上向下,针对所述行为所述结合表区域的从左向右。
3.如权利要求1所述的信息处理装置,其特征在于,
所述信息处理装置具有项目名字典,
对由所述字符识别处理的结果得到的所述字符串和所述项目名字典进行对照从而提取所述项目名。
4.如权利要求1所述的信息处理装置,其特征在于,
将所述结合表区域的最左且最上的字符串提取为所述项目名。
5.如权利要求1所述的信息处理装置,其特征在于,
若所提取到的多个所述项目名在所述结合表区域中在所述行方向上置于一行或者在所述列方向上置于一列而被提取,则将被夹于这些项目名的所述字符串提取为所述项目名。
6.如权利要求1所述的信息处理装置,其特征在于,
若在所述结合表区域内,在以一个所述项目名为起点的列或者行内向一个方向前进的位置上没有检测到与所述一个项目名不同的所述项目名,则将所述列或者行识别为是同一表区域。
7.如权利要求1所述的信息处理装置,其特征在于,
对所述结合表区域内的格线的粗度的变化以及/或者颜色的变化进行检测,夹着有变化的所述格线而将所述行方向或者所述列方向识别为不同的所述表区域。
8.如权利要求1所述的信息处理装置,其特征在于,
对所述结合表区域内的字体的字符类型的变化、所述字体的粗度的变化、或者颜色的变化的至少一个变化进行检测,夹着有变化的所述字体而将所述行方向或者所述列方向识别为不同的所述表区域。
9.如权利要求1、7、8的任一项所述的信息处理装置,其特征在于,
对于识别为不同的所述表区域的所述表区域,递归地进行所述不同的所述表区域的识别。
10.如权利要求1所述的信息处理装置,其特征在于,
将识别为所述不同的表区域的结果作为不同的表格而记录至数据库,在所述不同的表格内分别具有所述不同的表格之间的链接。
11.如权利要求1所述的信息处理装置,其特征在于,具有:
显示装置,显示所述表区域的识别结果;以及
输入装置,对于所述显示装置中显示的所述识别结果,接受所述项目名和项目值的对应关系的修正输入。
12.如权利要求11所述的信息处理装置,其特征在于,
所述信息处理装置具有项目名字典,
经由所述输入装置而将新被指定的所述项目名储存至所述项目名字典。
13.如权利要求12所述的信息处理装置,其特征在于,
所述新被指定的所述项目名包含所述项目名字典中已经包含的所述项目名的不同记载。
14.一种表识别方法,由对包含不同的表区域结合而得到的结合表区域的输入图像进行表识别的信息处理装置来实施,其特征在于,
对所述输入图像之中至少所述结合表区域进行字符识别处理,
从由所述字符识别处理的结果得到的字符串提取项目名,
若在所述结合表区域内,在以一个所述项目名为起点的列或者行内向一个方向前进的位置上检测到与所述一个项目名不同的所述项目名,则将所述不同的所述项目名以后识别为不同的所述表区域。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019-147653 | 2019-08-09 | ||
JP2019147653A JP2021028770A (ja) | 2019-08-09 | 2019-08-09 | 情報処理装置及び表認識方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112347831A true CN112347831A (zh) | 2021-02-09 |
Family
ID=74357440
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010471657.1A Pending CN112347831A (zh) | 2019-08-09 | 2020-05-29 | 信息处理装置以及表识别方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20210042555A1 (zh) |
JP (1) | JP2021028770A (zh) |
CN (1) | CN112347831A (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021114211A (ja) * | 2020-01-21 | 2021-08-05 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置及びプログラム |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000011071A (ja) * | 1998-06-24 | 2000-01-14 | Toshiba Corp | 文字認識装置、同装置に用いられるデータ編集方法及び記録媒体 |
JP2008108114A (ja) * | 2006-10-26 | 2008-05-08 | Just Syst Corp | 文書処理装置および文書処理方法 |
JP2009093305A (ja) * | 2007-10-05 | 2009-04-30 | Hitachi Computer Peripherals Co Ltd | 帳票認識装置 |
CN101430761A (zh) * | 2007-11-09 | 2009-05-13 | 富士通株式会社 | 计算机可读记录介质、表格数据提取装置和方法 |
JP2012141670A (ja) * | 2010-12-28 | 2012-07-26 | Fujitsu Frontech Ltd | 帳票認識装置、方法およびプログラム |
US20120237131A1 (en) * | 2011-03-17 | 2012-09-20 | Pfu Limited | Information processing apparatus to acquire character information |
CN102937948A (zh) * | 2012-10-31 | 2013-02-20 | 广东欧珀移动通信有限公司 | 一种移动终端的图文数据编辑方法 |
WO2016170330A1 (en) * | 2015-04-24 | 2016-10-27 | Oxford University Innovation Limited | Processing a series of images to identify at least a portion of an object |
CN107066997A (zh) * | 2016-12-16 | 2017-08-18 | 浙江工业大学 | 一种基于图像识别的电气元件报价方法 |
CN107491730A (zh) * | 2017-07-14 | 2017-12-19 | 浙江大学 | 一种基于图像处理的化验单识别方法 |
-
2019
- 2019-08-09 JP JP2019147653A patent/JP2021028770A/ja active Pending
-
2020
- 2020-03-16 US US16/819,257 patent/US20210042555A1/en not_active Abandoned
- 2020-05-29 CN CN202010471657.1A patent/CN112347831A/zh active Pending
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000011071A (ja) * | 1998-06-24 | 2000-01-14 | Toshiba Corp | 文字認識装置、同装置に用いられるデータ編集方法及び記録媒体 |
JP2008108114A (ja) * | 2006-10-26 | 2008-05-08 | Just Syst Corp | 文書処理装置および文書処理方法 |
JP2009093305A (ja) * | 2007-10-05 | 2009-04-30 | Hitachi Computer Peripherals Co Ltd | 帳票認識装置 |
CN101430761A (zh) * | 2007-11-09 | 2009-05-13 | 富士通株式会社 | 计算机可读记录介质、表格数据提取装置和方法 |
JP2012141670A (ja) * | 2010-12-28 | 2012-07-26 | Fujitsu Frontech Ltd | 帳票認識装置、方法およびプログラム |
US20120237131A1 (en) * | 2011-03-17 | 2012-09-20 | Pfu Limited | Information processing apparatus to acquire character information |
CN102708365A (zh) * | 2011-03-17 | 2012-10-03 | 株式会社Pfu | 信息处理装置、信息处理方法以及程序 |
JP2012194879A (ja) * | 2011-03-17 | 2012-10-11 | Pfu Ltd | 情報処理装置、情報処理方法及びプログラム |
CN102937948A (zh) * | 2012-10-31 | 2013-02-20 | 广东欧珀移动通信有限公司 | 一种移动终端的图文数据编辑方法 |
WO2016170330A1 (en) * | 2015-04-24 | 2016-10-27 | Oxford University Innovation Limited | Processing a series of images to identify at least a portion of an object |
CN107066997A (zh) * | 2016-12-16 | 2017-08-18 | 浙江工业大学 | 一种基于图像识别的电气元件报价方法 |
CN107491730A (zh) * | 2017-07-14 | 2017-12-19 | 浙江大学 | 一种基于图像处理的化验单识别方法 |
Non-Patent Citations (2)
Title |
---|
THOMAS G.KIENINGER: "Table structure Recognition Based on Robust Block Segmentation", 《WWW:HTTP://WWW.DFKI.UNI-KL.DE/DA/KIENI/》 * |
邓小宁 等: "基于HOG特征的财务报表图像识别", 《电子设计工程 * |
Also Published As
Publication number | Publication date |
---|---|
JP2021028770A (ja) | 2021-02-25 |
US20210042555A1 (en) | 2021-02-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8189920B2 (en) | Image processing system, image processing method, and image processing program | |
US8107727B2 (en) | Document processing apparatus, document processing method, and computer program product | |
US8429154B2 (en) | Document search device, imaging forming apparatus, and document search system | |
JP5402099B2 (ja) | 情報処理システム、情報処理装置、情報処理方法およびプログラム | |
US8340425B2 (en) | Optical character recognition with two-pass zoning | |
JP4785655B2 (ja) | 文書処理装置及び文書処理方法 | |
RU2571396C2 (ru) | Способ и система для верификации в процессе чтения | |
JP2018128996A (ja) | 情報処理装置、制御方法、およびプログラム | |
KR20100103351A (ko) | 문자 인식 장치, 문자 인식 프로그램, 및 문자 인식 방법 | |
RU2605078C2 (ru) | Сегментация изображения для верификации данных | |
US9881001B2 (en) | Image processing device, image processing method and non-transitory computer readable recording medium | |
KR20200128089A (ko) | 영상 처리 방법 및 영상 처리 시스템 | |
US11941903B2 (en) | Image processing apparatus, image processing method, and non-transitory storage medium | |
CN102883085B (zh) | 图像处理装置和图像处理方法 | |
JP2018042067A (ja) | 画像処理システム、画像処理方法、情報処理装置 | |
CN112347831A (zh) | 信息处理装置以及表识别方法 | |
US20150261735A1 (en) | Document processing system, document processing apparatus, and document processing method | |
JP2016018454A (ja) | 画像処理装置および画像処理装置の制御方法 | |
US10049107B2 (en) | Non-transitory computer readable medium and information processing apparatus and method | |
JP6700705B2 (ja) | 振り分けシステム、情報処理方法、及びプログラム | |
JP4807486B2 (ja) | 教材処理装置、教材処理方法および教材処理プログラム | |
CN112396046A (zh) | 信息处理装置及记录媒体 | |
JP5752073B2 (ja) | データ修正装置 | |
CN111444751A (zh) | 信息处理装置、储存介质及信息处理方法 | |
JP2013182459A (ja) | 情報処理装置、情報処理方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |