CN105373791B - 信息处理方法及信息处理装置 - Google Patents

信息处理方法及信息处理装置 Download PDF

Info

Publication number
CN105373791B
CN105373791B CN201510771802.7A CN201510771802A CN105373791B CN 105373791 B CN105373791 B CN 105373791B CN 201510771802 A CN201510771802 A CN 201510771802A CN 105373791 B CN105373791 B CN 105373791B
Authority
CN
China
Prior art keywords
list
sectioning image
column
band
coordinate value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510771802.7A
Other languages
English (en)
Other versions
CN105373791A (zh
Inventor
刘永波
李桂林
方红涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Construction Bank Corp
Original Assignee
China Construction Bank Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Construction Bank Corp filed Critical China Construction Bank Corp
Priority to CN201510771802.7A priority Critical patent/CN105373791B/zh
Priority to EP15893172.5A priority patent/EP3147825A4/en
Priority to SG11201610723SA priority patent/SG11201610723SA/en
Priority to PCT/CN2015/098836 priority patent/WO2016188104A1/zh
Publication of CN105373791A publication Critical patent/CN105373791A/zh
Application granted granted Critical
Publication of CN105373791B publication Critical patent/CN105373791B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/10Image acquisition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • G06V10/235Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition based on user input or interaction

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Character Input (AREA)

Abstract

本发明公开一种信息处理方法,首先确定表单中各列在该表单中的位置区域,确定各列的定位元素在表单中的位置区域,确定表单中各列包含的元素的数量,之后根据前述信息确定各个元素在表单中的位置区域,依据各个元素在表单中的位置区域进行切片处理,使得每个元素均切分为一个切片图像,之后对各个切片图像分别进行光学字符识别,获得切片图像包含的字符串并进行记录。基于本发明公开的信息处理方法,能够获取表单中的元素,并且能够降低数据的出错率。本发明还公开相应的信息处理装置。

Description

信息处理方法及信息处理装置
技术领域
本发明属于文本识别技术领域,尤其涉及信息处理方法及信息处理装置。
背景技术
在银行的日常业务中,需要对海量的表单进行处理。目前,工作人员在对纸质材料进行电子化处理过程中,要对大量的列表式信息进行人工录入,例如住房公积金归集过程中的公积金汇缴清册。
这些列表式信息具有以下特征:1、票据的数据量大;2、票据中位于同一列的各个元素的数据类型或者内容相同,位于同一行的各个元素的数据类型和内容不同;3、票据中位于同一行的各个元素的像素高度相同,位于同一列的各个元素的像素宽度相同。其中,票据中的元素指的是位于一个单元格中的字符或者字符串,也可以将元素理解为一条数据,例如:用户的姓名、日期、金额。
工作人员如果逐行录入列表式信息,往往需要频繁切换输入法,并调整手指在键盘上的操作区域,操作比较复杂。因此,工作人员通常是逐列录入列表式信息,由于位于同一列的元素的数据类型相同,视觉效果相似,这极易造成工作人员视觉疲劳,出现输入错位等问题。
为了降低工作人员的劳动强度,目前针对列表式信息出现了新的处理方式,具体的:利用文本识别工具对整个表单进行智能识别,获得表单中的数据并进行存储。
但是,申请人发现:采用上述方式对表单进行智能识别,获得的数据出错率较高。因此,如何对处理表单的方式进行改进,降低数据的出错率,是本领域技术人员亟待解决的问题。
发明内容
有鉴于此,本发明的目的在于提供一种信息处理方法和信息处理装置,用以获取表单中的元素,并降低获取到的数据的出错率。
为实现上述目的,本发明提供如下技术方案:
本发明公开一种信息处理方法,用于处理表单中的元素,所述表单为数字化图像,所述表单中的元素呈N列分布,其中,所述元素为一条数据,N为大于1的整数,所述信息处理方法包括:
分别确定所述表单中各列在所述表单中的位置区域;
分别确定所述表单中各列的定位元素在所述表单中的位置区域,其中,第n列的定位元素为:所述第n列所需录入的元素中、处于最上侧的元素,其中n=1,2,…N;
确定所述表单中各列包含的元素的数量;
利用所述各列在所述表单中的位置区域、各列的定位元素在所述表单中的位置区域、以及各列包含的元素的数量,分别确定所述表单中各个元素在所述表单中的位置区域;
依据各个元素在所述表单中的位置区域对所述表单进行切片处理,得到多个切片图像,其中每个切片图像包含一个元素,切片处理得到的切片图像的数量与所述表单包含的元素的数量一致;
分别对所述切片图像进行光学字符识别,获得所述切片图像包含的字符串;
按照预设规则记录获得的字符串。
可选的,上述信息处理方法中,所述分别对所述切片图像进行光学字符识别,具体为:逐个对位于同一列的切片图像进行光学字符识别,之后逐个对位于另一列的切片图像进行光学字符识别,直至对位于各列的切片图像均进行光学字符识别;其中,位于第n列的切片图像由对所述表单的第n列进行切片处理得到。
可选的,上述信息处理方法还包括:显示与第一切片图像对应的元素输入框,其中,所述第一切片图像是当前处于录入状态的切片图像;接收用户在所述元素输入框输入的字符串;比较用户输入的字符串和对所述第一切片图像进行光学字符识别产生的字符串,在两者不一致的情况下,发出提示。
可选的,上述信息处理方法中,在显示与第一切片图像对应的元素输入框之后,所述方法还包括:调整所述第一切片图像的显示效果,以使得所述第一切片图像的显示效果与其他切片图像的显示效果不同。
可选的,上述信息处理方法还包括:接收用户输入的缩放指令,响应所述缩放指令对所述第一切片图像进行相应的缩放处理。
可选的,上述信息处理方法中,所述表单中第n列在所述表单中的位置区域以(第一坐标值、第二坐标值、第三坐标值、第四坐标值)标定,其中,所述第一坐标值为所述第n列的左侧边与所述表单的左侧边之间的距离,所述第二坐标值为所述第n列的顶端与所述表单的上侧边之间的距离,所述第三坐标值为所述第n列的右侧边与所述表单的左侧边之间的距离,所述第四坐标值为所述第n列的底端与所述表单的上侧边之间的距离;
所述第n列的定位元素在所述表单中的位置区域以(第五坐标值、第六坐标值、第七坐标值、第八坐标值)标定,其中,所述第五坐标值为所述第n列的定位元素所处单元格的左侧边与所述表单的左侧边之间的距离,所述第六坐标值为所述第n列的定位元素所处单元格的顶端与所述表单的上侧边之间的距离,所述第七坐标值为所述第n列的定位元素所处单元格的右侧边与所述表单的左侧边之间的距离,所述第八坐标值为所述第n列的定位元素所处单元格的底端与所述表单的上侧边之间的距离。
本发明还公开一种信息处理装置,用于处理表单中的元素,所述表单为数字化图像,所述表单中的元素呈N列分布,其中,所述元素为一条数据,N为大于1的整数,所述信息处理装置包括:
列位置区域确定单元,用于分别确定所述表单中各列在所述表单中的位置区域;
定位元素位置区域确定单元,用于分别确定所述表单中各列的定位元素在所述表单中的位置区域,其中,第n列的定位元素为:所述第n列所需录入的元素中、处于最上侧的元素,其中n=1,2,…N;
元素数量确定单元,用于确定所述表单中各列包含的元素的数量;
元素位置区域确定单元,用于利用所述各列在所述表单中的位置区域、各列的定位元素在所述表单中的位置区域、以及各列包含的元素的数量,分别确定所述表单中各个元素在所述表单中的位置区域;
图像处理单元,用于依据各个元素在所述表单中的位置区域对所述表单进行切片处理,得到多个切片图像,其中每个切片图像包含一个元素,切片处理得到的切片图像的数量与所述表单包含的元素的数量一致;
字符识别单元,用于分别对所述切片图像进行光学字符识别,获得所述切片图像包含的字符串;
存储单元,用于按照预设规则记录获得的字符串。
可选的,上述信息处理装置中,所述字符识别单元具体用于:逐个对位于同一列的切片图像进行光学字符识别,之后逐个对位于另一列的切片图像进行光学字符识别,直至对位于各列的切片图像均进行光学字符识别;其中,位于第n列的切片图像由对所述表单的第n列进行切片处理得到。
可选的,上述信息处理装置还包括:控制单元,用于控制显示界面显示与第一切片图像对应的元素输入框,其中,所述第一切片图像是当前处于录入状态的切片图像;第一处理单元,用于接收用户在所述元素输入框输入的字符串,比较用户输入的字符串和对所述第一切片图像进行光学字符识别产生的字符串,在两者不一致的情况下,发出提示。
可选的,上述信息处理装置还包括第二处理单元;在所述显示界面显示与第一切片图像对应的元素输入框之后,所述第二处理单元调整所述第一切片图像的显示效果,以使得所述第一切片图像的显示效果与其他切片图像的显示效果不同。
可选的,上述信息处理装置还包括第三处理单元;所述第三处理单元用于接收用户输入的缩放指令,响应所述缩放指令对所述第一切片图像进行相应的缩放处理。
由此可见,本发明的有益效果为:
本发明公开的信息处理方法,首先确定表单中各列在该表单中的位置区域,确定各列的定位元素在表单中的位置区域,确定表单中各列包含的元素的数量,之后根据前述信息确定各个元素在表单中的位置区域,依据各个元素在表单中的位置区域进行切片处理,使得每个元素均切分为一个切片图像,之后对各个切片图像分别进行光学字符识别,获得切片图像包含的字符串并进行记录。基于本发明公开的信息处理方法,将表单中的各个元素分别划分为一个切片图像,后续针对各个切片图像分别进行光学字符识别,以获取切片图像包含的字符串,由于一次光学字符识别操作仅针对一个元素,因此可以基于多种数据类型对切片图像进行识别,直至识别出切片图像包含的字符串,能够降低数据的出错率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明公开的一种信息处理方法的流程图;
图2为本发明公开的另一种信息处理方法的流程图;
图3为本发明公开的一种信息处理装置的结构示意图;
图4为本发明公开的另一种信息处理装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明公开一种信息处理方法,用于处理表单中的元素。其中,该表单为数字化图像,可以为票据的扫描件或者对票据进行拍摄得到的图像,该表单中的元素呈N列分布,N为大于1的整数。
基于本发明公开的信息处理方法,能够获取表单中的元素,并降低获取到的数据的出错率。
参见图1,图1为本发明公开的一种信息处理方法的流程图。该信息处理方法包括:
步骤S11:分别确定表单中各列在表单中的位置区域。
实施中,表单中的各列在表单中的位置区域可以采用各列与表单的四个侧边的距离标定。用户可以人工确定各列在表单中的位置区域后,向运行该方法的设备输入上述数据。运行该方法的设备也可以利用现有的测距软件进行测量,以确定各列在表单中的位置区域。
步骤S12:分别确定表单中各列的定位元素在表单中的位置区域。其中,第n列的定位元素为:第n列所需录入的元素中、处于最上侧的元素,其中n=1,2,…N。
实施中,表单中各列的定位元素的位置区域可以采用定位元素所在单元格与列表的四个侧边的距离标定。这里需要说明的是:定位元素所在的单元格可以是用户可见的,也可以是用户不可见的(单元格的边框为无色)。用户可以人工确定各列的定位元素在表单中的位置区域后,向运行该方法的设备输入上述数据。运行该方法的设备也可以利用现有的测距软件进行测量,以确定各列的定位元素在表单中的位置区域。
步骤S13:确定表单中各列包含的元素的数量。
步骤S14:利用各列在表单中的位置区域、各列的定位元素在表单中的位置区域、以及各列包含的元素的数量,分别确定表单中各个元素在表单中的位置区域。
以表单中的第n列为例:根据第n列在表单中的位置区域以及第n列的定位元素在表单中位置区域,就可以确定第n列中全部元素的总高度,另外第n列所包含的元素数量是已确定的,由此可以确定第n列中每个元素的平均高度。之后,根据第n列的定位元素的位置,以及第n列中每个元素的平均高度就可以确定第n列中的各个元素在表单中的位置区域。
步骤S15:依据各个元素在表单中的位置区域对表单进行切片处理,得到多个切片图像,其中每个切片图像包含一个元素,切片处理得到的切片图像的数量与表单包含的元素的数量一致。
在执行步骤S14后,表单的各个元素在该表单中的位置区域已经确定,依据各个元素在表单中的位置区域进行切片处理,就可以将每个元素均切分为一个切片图像。也就是说,将获得M个切片图像,其中M与该表单包含的元素的数量一致,每个切片图像包含一个元素。
步骤S16:分别对各个切片图像进行光学字符识别(OCR),获得切片图像包含的字符串。
在现有技术中,是利用文本识别工具对表单进行整体智能识别。由于表单中包含多种数据类型的元素,同时对多种数据类型的元素进行识别,必然会导致识别率较低,相应的获得的数据容易出错。
而本发明中,是对切片图像进行光学字符识别,而且一个切片图像仅包含一个元素。由于一次光学字符识别操作仅针对一个元素,因此可以基于多种数据类型对切片图像进行识别,直至识别出切片图像包含的字符串,相对于现有技术中的整体识别,能够降低数据的出错率。
步骤S17:按照预设规则记录获取到的字符串。
实施中,可以将获取到的字符串记录于预设表格的特定位置,该特定位置由包含该字符串的元素在表单中的位置区域确定。
本发明公开的信息处理方法,首先确定表单中各列在该表单中的位置区域,确定各列的定位元素在表单中的位置区域,确定表单中各列包含的元素的数量,之后根据前述信息确定各个元素在表单中的位置区域,依据各个元素在表单中的位置区域进行切片处理,使得每个元素均切分为一个切片图像,之后对各个切片图像分别进行光学字符识别,获得切片图像包含的字符串并进行记录。基于本发明公开的信息处理方法,将表单中的各个元素分别划分为一个切片图像,后续针对各个切片图像分别进行光学字符识别,以获取切片图像包含的字符串,由于一次光学字符识别操作仅针对一个元素,因此可以基于多种数据类型对切片图像进行识别,直至识别出切片图像包含的字符串,能够降低数据的出错率。
实施中,表单中第n列在表单中的位置区域以(第一坐标值、第二坐标值、第三坐标值、第四坐标值)标定。其中,第一坐标值为第n列的左侧边与表单的左侧边之间的距离,第二坐标值为第n列的顶端与表单的上侧边之间的距离,第三坐标值为第n列的右侧边与表单的左侧边之间的距离,第四坐标值为第n列的底端与表单的上侧边之间的距离。
第n列的定位元素在表单中的位置区域以(第五坐标值、第六坐标值、第七坐标值、第八坐标值)标定。其中,第五坐标值为第n列的定位元素所处单元格的左侧边与表单的左侧边之间的距离,第六坐标值为第n列的定位元素所处单元格的顶端与表单的上侧边之间的距离,第七坐标值为第n列的定位元素所处单元格的右侧边与表单的左侧边之间的距离,第八坐标值为第n列的定位元素所处单元格的底端与表单的上侧边之间的距离。
当然,上述只是对表单中各列的位置区域以及各列中定位元素的位置区域的一种标定方式。实施中,第一坐标值至第八坐标值还可以配置为:
第一坐标值为第n列的左侧边与表单的左侧边之间的距离,第二坐标值为第n列的顶端与表单的上侧边之间的距离,第三坐标值为第n列的右侧边与表单的右侧边之间的距离,第四坐标值为第n列的底端与表单的下侧边之间的距离。
第五坐标值为第n列的定位元素所处单元格的左侧边与表单的左侧边之间的距离,第六坐标值为第n列的定位元素所处单元格的顶端与表单的上侧边之间的距离,第七坐标值为第n列的定位元素所处单元格的右侧边与表单的右侧边之间的距离,第八坐标值为第n列的定位元素所处单元格的底端与表单的下侧边之间的距离。
下面结合实例对确定表单中位于同一列的各个元素的位置区域的过程进行说明:
假如表单中第一列的位置区域为(leftA,TopA,RightA,BottomA),第一列的定位元素的位置区域为(leftA1,TopA1,RightA1,BottomA1),其中LeftA1等于LeftA,RightA1等于RightA。该列的最大行数为MaxColumn,也就是说第一列包含的元素的数量为MaxColumn。
可以确定,第一列中MaxColumn行元素的高度为BottomA-TopA1,第一列中各元素的平均高度Height为(BottomA-TopA1)/MaxColumn。之后,根据第一列的定位元素的位置区域,以及各元素的平均高度就可以确定第一列中MaxColumn行元素的位置区域,具体的:
位于第一列第一行的元素A1的位置区域为(LeftA,TopA1,RightA,TopA1+Height);
位于第一列第二行的元素A2的位置区域为(LeftA,TopA1+Height,RightA,TopA1+2*Height):
……;
位于第一列第MaxColumn行的元素Amax的位置区域为(LeftA,TopA1+Height*(MaxColumn-1),RightA,TopA1+Height*MaxColumn)。
作为优选方案,在确定某一列中各个元素的位置区域之后,利用特定颜色的矩形框在表单上标注各个元素的位置区域,例如利用红色虚线矩形框在表单上标注各个元素的位置区域。
用户基于标注的矩形框就可以直观的判断计算出的各个元素的位置区域与各个元素的实际位置区域是否相符。如果计算出的各个元素的位置区域与其实际位置区域存在偏差,用户可以对表单中各列的位置区域以及各列的定位元素的位置区域进行人工调整。
仍以表单中的第一列为例:第一列的位置区域调整为 第一列的定位元素的位置区域调整为其 中,为第一列的左侧边与表单的左侧边之间的距离的调整值,为第一列的顶端与表单 的上侧边之间的距离的调整值,为第一列的右侧边与表单的左侧边之间的距离的调整 值,为第一列的底端与表单的上侧边之间的距离的调整值,为第一列的定位元素所在 单元格的顶端与表单的上侧边之间的距离的调整值,为第一列的定位元素所在单元格 的底端与表单的上侧边之间的距离的调整值。
在这种情况下,第一列中MaxColumn行元素的高度为,第一列中各元素的平均高度为(。之后,根据第一列的定位元素的位置区域,以及各元素的平均高度就可以确定第一列中MaxColumn行元素的位置区域,具体的:
位于第一列第一行的元素A1的位置区域为
位于第一列第二行的元素A2的位置区域为
……;
位于第一列第MaxColumn行的元素Amax的位置区域为
在本发明图1所示的信息处理方法中,步骤S16中分别对各个切片图像进行光学字符识别,优选采用如下方式:
逐个对位于同一列的切片图像进行光学字符识别,之后逐个对位于另一列的切片图像进行光学字符识别,直至对位于各列的切片图像均进行光学字符识别。其中,位于第n列的切片图像由对所述表单的第n列进行切片处理得到。
也就是说,逐个对由位于同一列的元素产生的切片图像进行光学字符识别,在该列全部的切片图像完成光学字符识别后,再逐个对由位于另一列的元素产生的切片图像进行光学字符识别。
由于表单中位于同一列的元素的数据类型相同,甚至位于同一列的部分元素的内容也相同,因此一次性对位于同一列的切片图像进行光学字符识别,可以有效控制字符识别范围,能够提高识别率,同时也能够缩短识别操作所耗费的时间。
例如:姓名列的元素均为汉字字符数据类型。在对由姓名列产生的切片图像进行光学字符识别过程中,只需要利用与汉字字符数据类型对应的识别算法进行字符识别。
例如:金额列的元素均为浮点型数据类型。在对由金额列产生的切片图像进行光学字符识别过程中,只需要利用与浮点型数据类型对应的识别算法进行字符识别。
在本发明上述公开的信息处理方法的基础上,本发明还公开另一种优选方案,如图2所示。在步骤S17之后,还可以设置以下步骤:
步骤S18:显示与第一切片图像对应的元素输入框;
步骤S19:接收用户在该元素输入框输入的字符串,比较用户输入的字符串和对第一切片图像进行光学字符识别产生的字符串,在两者不一致的情况下,发出提示。
其中,第一切片图像是当前处于录入状态的切片图像。
基于图2所示的信息处理方法,用户针对某一切片图像进行录入操作,如果用户输入的字符串与对该切片图像进行光学字符识别产生的字符串不一致,表明用户输入的字符串可能出现错误,或者该切片图像的识别出现错误,或者两者均出现错误,此时向用户发出提示,以使得用户再次核对,以保证最终录入正确的字符串,能够进一步降低录入数据出现错误的概率,甚至消除录入数据出现错误的现象。
实施中,输出提示的具体方式可以采用但不限于:调整第一切片图像的显示颜色,或者发生语音提示。
另外,在图2所示信息处理方法的基础上,在显示与第一切片图像对应的元素输入框之后,还可以设置以下步骤:调整第一切片图像的显示效果,以使得第一切片图像的显示效果与其他切片图像的显示效果不同。
在用户人工录入的过程中,将用户将要执行录入操作的切片图像调整为不同的显示效果,以便用户能够在多个切片图像中更加直观的看到将要执行录入操作的切片图像。
考虑到表单多为白底黑字,作为一种实现方式,可以在第一切片图像的外周显示红色的虚线,以便用户更加直观的看到第一切片图像。
另外,表单中的局部区域可能存在字符不太清晰的问题,为了方便用户查看该区域,在图2所示信息处理方法的基础上,可以设置以下步骤:接收用户输入的缩放指令,响应该缩放指令对第一切片图像进行相应的缩放处理。
如果第一切片图像中的字符不太清晰,用户可以输入放大指令,控制设备对第一切片图像进行放大处理,以便能看清楚第一切片图像包含的元素,在用户在元素输入框输入字符串,并且用户输入的字符串与对第一切片图像进行光学字符识别产生的字符串一致时,用户可以输入缩小指令,控制设备对第一切片图像进行缩小处理,以便将第一切片图像恢复至原始大小。
本发明还公开一种信息处理装置,用于处理表单中的元素。其中,该表单为数字化图像,可以为票据的扫描件或者对票据进行拍摄得到的图像,该表单中的元素呈N列分布,N为大于1的整数。下文描述内容可与上述关于信息处理方法的描述内容相互对应参照。
参见图3,图3为本发明公开的一种信息处理装置的结构示意图。该信息处理装置包括列位置区域确定单元1、定位元素位置区域确定单元2、元素数量确定单元3、元素位置区域确定单元4、图像处理单元5、字符识别单元6和存储单元7。
其中:
列位置区域确定单元1,用于分别确定表单中各列在表单中的位置区域。
定位元素位置区域确定单元2,用于分别确定表单中各列的定位元素在表单中的位置区域,其中,第n列的定位元素为:第n列所需录入的元素中、处于最上侧的元素,其中n=1,2,…N。
元素数量确定单元3,用于确定表单中各列包含的元素的数量。
元素位置区域确定单元4,用于利用各列在表单中的位置区域、各列的定位元素在表单中的位置区域、以及各列包含的元素的数量,分别确定表单中各个元素在表单中的位置区域。
图像处理单元5,用于依据各个元素在表单中的位置区域对表单进行切片处理,得到多个切片图像。其中,每个切片图像包含一个元素,切片处理得到的切片图像的数量与表单包含的元素的数量一致。
字符识别单元6,用于分别对切片图像进行光学字符识别,获得切片图像包含的字符串。
存储单元7,用于按照预设规则记录获得的字符串。
本发明公开的信息处理装置,首先确定表单中各列在该表单中的位置区域,确定各列的定位元素在表单中的位置区域,确定表单中各列包含的元素的数量,之后根据前述信息确定各个元素在表单中的位置区域,依据各个元素在表单中的位置区域进行切片处理,使得每个元素均切分为一个切片图像,之后对各个切片图像分别进行光学字符识别,获得切片图像包含的字符串并进行记录。本发明公开的信息处理装置,将表单中的各个元素分别划分为一个切片图像,后续针对各个切片图像分别进行光学字符识别,以获取切片图像包含的字符串,由于一次光学字符识别操作仅针对一个元素,因此可以基于多种数据类型对切片图像进行识别,直至识别出切片图像包含的字符串,能够降低数据的出错率。
实施中,表单中第n列在表单中的位置区域以(第一坐标值、第二坐标值、第三坐标值、第四坐标值)标定。其中,第一坐标值为第n列的左侧边与表单的左侧边之间的距离,第二坐标值为第n列的顶端与表单的上侧边之间的距离,第三坐标值为第n列的右侧边与表单的左侧边之间的距离,第四坐标值为第n列的底端与表单的上侧边之间的距离。
第n列的定位元素在表单中的位置区域以(第五坐标值、第六坐标值、第七坐标值、第八坐标值)标定。其中,第五坐标值为第n列的定位元素所处单元格的左侧边与表单的左侧边之间的距离,第六坐标值为第n列的定位元素所处单元格的顶端与表单的上侧边之间的距离,第七坐标值为第n列的定位元素所处单元格的右侧边与表单的左侧边之间的距离,第八坐标值为第n列的定位元素所处单元格的底端与表单的上侧边之间的距离。
当然,上述只是对表单中各列的位置区域以及各列中定位元素的位置区域的一种标定方式。实施中,第一坐标值至第八坐标值还可以配置为:
第一坐标值为第n列的左侧边与表单的左侧边之间的距离,第二坐标值为第n列的顶端与表单的上侧边之间的距离,第三坐标值为第n列的右侧边与表单的右侧边之间的距离,第四坐标值为第n列的底端与表单的下侧边之间的距离。
第五坐标值为第n列的定位元素所处单元格的左侧边与表单的左侧边之间的距离,第六坐标值为第n列的定位元素所处单元格的顶端与表单的上侧边之间的距离,第七坐标值为第n列的定位元素所处单元格的右侧边与表单的右侧边之间的距离,第八坐标值为第n列的定位元素所处单元格的底端与表单的下侧边之间的距离。
作为优选方式,字符识别单元6具体用于:逐个对位于同一列的切片图像进行光学字符识别,之后逐个对位于另一列的切片图像进行光学字符识别,直至对位于各列的切片图像均进行光学字符识别。其中,位于第n列的切片图像由对表单的第n列进行切片处理得到。
也就是说,字符识别单元6逐个对由位于同一列的元素产生的切片图像进行光学字符识别,在该列全部的切片图像完成光学字符识别后,再逐个对由位于另一列的元素产生的切片图像进行光学字符识别。
由于表单中位于同一列的元素的数据类型相同,甚至位于同一列的部分元素的内容也相同,因此一次性对位于同一列的切片图像进行光学字符识别,可以有效控制字符识别范围,能够提高识别率,同时也能够缩短识别操作所耗费的时间。
参见图4,图4为本发明公开的另一种信息处理装置的结构示意图。与图3所示信息处理装置相比,进一步包括:控制单元8和第一处理单元9。
控制单元8用于控制显示界面显示与第一切片图像对应的元素输入框,其中,第一切片图像是当前处于录入状态的切片图像。
第一处理单元9用于接收用户在元素输入框输入的字符串,比较用户输入的字符串和对第一切片图像进行光学字符识别产生的字符串,在两者不一致的情况下,发出提示。
本发明图4所示的信息处理装置与图3所示信息处理装置相比,用户能够针对某一切片图像进行录入操作,如果用户输入的字符串与对该切片图像进行光学字符识别产生的字符串不一致,表明用户输入的字符串可能出现错误,或者该切片图像的识别出现错误,或者两者均出现错误,此时向用户发出提示,以使得用户再次核对,以保证最终录入正确的字符串,能够进一步降低录入数据出现错误的概率,甚至消除录入数据出现错误的现象。
实施中,输出提示的具体方式可以采用但不限于:调整第一切片图像的显示颜色,或者发生语音提示。
作为优选方案,在图4所示信息处理装置的基础上,还可以设置第二处理单元。其中,在显示界面显示与第一切片图像对应的元素输入框之后,第二处理单元调整第一切片图像的显示效果,以使得第一切片图像的显示效果与其他切片图像的显示效果不同。
另外,还可以在上述信息处理装置中进一步设置第三处理单元。第三处理单元用于接收用户输入的缩放指令,响应缩放指令对第一切片图像进行相应的缩放处理。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (9)

1.一种信息处理方法,其特征在于,用于处理表单中的元素,所述表单为数字化图像,所述表单中的元素呈N列分布,其中,所述元素为一条数据,N为大于1的整数,所述信息处理方法包括:
分别确定所述表单中各列在所述表单中的位置区域;
分别确定所述表单中各列的定位元素在所述表单中的位置区域,其中,第n列的定位元素为:所述第n列所需录入的元素中、处于最上侧的元素,其中n=1,2,…N;
确定所述表单中各列包含的元素的数量;
利用所述各列在所述表单中的位置区域、各列的定位元素在所述表单中的位置区域、以及各列包含的元素的数量,分别确定所述表单中各个元素在所述表单中的位置区域;
依据各个元素在所述表单中的位置区域对所述表单进行切片处理,得到多个切片图像,其中每个切片图像包含一个元素,切片处理得到的切片图像的数量与所述表单包含的元素的数量一致;
分别对所述切片图像进行光学字符识别,获得所述切片图像包含的字符串;
按照预设规则记录获得的字符串;
显示与第一切片图像对应的元素输入框,其中,所述第一切片图像是当前处于录入状态的切片图像;
接收用户在所述元素输入框输入的字符串,比较用户输入的字符串和对所述第一切片图像进行光学字符识别产生的字符串,在两者不一致的情况下,发出提示。
2.根据权利要求1所述的方法,其特征在于,所述分别对所述切片图像进行光学字符识别,具体为:
逐个对位于同一列的切片图像进行光学字符识别,之后逐个对位于另一列的切片图像进行光学字符识别,直至对位于各列的切片图像均进行光学字符识别;
其中,位于第n列的切片图像由对所述表单的第n列进行切片处理得到。
3.根据权利要求1或2所述的方法,其特征在于,在显示与第一切片图像对应的元素输入框之后,所述方法还包括:
调整所述第一切片图像的显示效果,以使得所述第一切片图像的显示效果与其他切片图像的显示效果不同。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
接收用户输入的缩放指令,响应所述缩放指令对所述第一切片图像进行相应的缩放处理。
5.根据权利要求1所述的方法,其特征在于,
所述表单中第n列在所述表单中的位置区域以(第一坐标值、第二坐标值、第三坐标值、第四坐标值)标定,其中,所述第一坐标值为所述第n列的左侧边与所述表单的左侧边之间的距离,所述第二坐标值为所述第n列的顶端与所述表单的上侧边之间的距离,所述第三坐标值为所述第n列的右侧边与所述表单的左侧边之间的距离,所述第四坐标值为所述第n列的底端与所述表单的上侧边之间的距离;
所述第n列的定位元素在所述表单中的位置区域以(第五坐标值、第六坐标值、第七坐标值、第八坐标值)标定,其中,所述第五坐标值为所述第n列的定位元素所处单元格的左侧边与所述表单的左侧边之间的距离,所述第六坐标值为所述第n列的定位元素所处单元格的顶端与所述表单的上侧边之间的距离,所述第七坐标值为所述第n列的定位元素所处单元格的右侧边与所述表单的左侧边之间的距离,所述第八坐标值为所述第n列的定位元素所处单元格的底端与所述表单的上侧边之间的距离。
6.一种信息处理装置,其特征在于,用于处理表单中的元素,所述表单为数字化图像,所述表单中的元素呈N列分布,其中,所述元素为一条数据,N为大于1的整数,所述信息处理装置包括:
列位置区域确定单元,用于分别确定所述表单中各列在所述表单中的位置区域;
定位元素位置区域确定单元,用于分别确定所述表单中各列的定位元素在所述表单中的位置区域,其中,第n列的定位元素为:所述第n列所需录入的元素中、处于最上侧的元素,其中n=1,2,…N;
元素数量确定单元,用于确定所述表单中各列包含的元素的数量;
元素位置区域确定单元,用于利用所述各列在所述表单中的位置区域、各列的定位元素在所述表单中的位置区域、以及各列包含的元素的数量,分别确定所述表单中各个元素在所述表单中的位置区域;
图像处理单元,用于依据各个元素在所述表单中的位置区域对所述表单进行切片处理,得到多个切片图像,其中每个切片图像包含一个元素,切片处理得到的切片图像的数量与所述表单包含的元素的数量一致;
字符识别单元,用于分别对所述切片图像进行光学字符识别,获得所述切片图像包含的字符串;
存储单元,用于按照预设规则记录获得的字符串;
控制单元,用于控制显示界面显示与第一切片图像对应的元素输入框,其中,所述第一切片图像是当前处于录入状态的切片图像;
第一处理单元,用于接收用户在所述元素输入框输入的字符串,比较用户输入的字符串和对所述第一切片图像进行光学字符识别产生的字符串,在两者不一致的情况下,发出提示。
7.根据权利要求6所述的信息处理装置,其特征在于,所述字符识别单元具体用于:
逐个对位于同一列的切片图像进行光学字符识别,之后逐个对位于另一列的切片图像进行光学字符识别,直至对位于各列的切片图像均进行光学字符识别;
其中,位于第n列的切片图像由对所述表单的第n列进行切片处理得到。
8.根据权利要求6或7所述的信息处理装置,其特征在于,还包括第二处理单元;在所述显示界面显示与第一切片图像对应的元素输入框之后,所述第二处理单元调整所述第一切片图像的显示效果,以使得所述第一切片图像的显示效果与其他切片图像的显示效果不同。
9.根据权利要求8所述的信息处理装置,其特征在于,还包括第三处理单元;所述第三处理单元用于接收用户输入的缩放指令,响应所述缩放指令对所述第一切片图像进行相应的缩放处理。
CN201510771802.7A 2015-11-12 2015-11-12 信息处理方法及信息处理装置 Active CN105373791B (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN201510771802.7A CN105373791B (zh) 2015-11-12 2015-11-12 信息处理方法及信息处理装置
EP15893172.5A EP3147825A4 (en) 2015-11-12 2015-12-25 Information processing method and information processing device
SG11201610723SA SG11201610723SA (en) 2015-11-12 2015-12-25 Information processing method and information processing device
PCT/CN2015/098836 WO2016188104A1 (zh) 2015-11-12 2015-12-25 信息处理方法及信息处理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510771802.7A CN105373791B (zh) 2015-11-12 2015-11-12 信息处理方法及信息处理装置

Publications (2)

Publication Number Publication Date
CN105373791A CN105373791A (zh) 2016-03-02
CN105373791B true CN105373791B (zh) 2018-12-14

Family

ID=55375974

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510771802.7A Active CN105373791B (zh) 2015-11-12 2015-11-12 信息处理方法及信息处理装置

Country Status (4)

Country Link
EP (1) EP3147825A4 (zh)
CN (1) CN105373791B (zh)
SG (1) SG11201610723SA (zh)
WO (1) WO2016188104A1 (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106775786A (zh) * 2017-03-23 2017-05-31 北京赛迈特锐医疗科技有限公司 优化复杂信息录入界面的系统及其方法
CN109344831B (zh) * 2018-08-22 2024-04-05 中国平安人寿保险股份有限公司 一种数据表识别方法、装置及终端设备
CN111104853A (zh) * 2019-11-11 2020-05-05 中国建设银行股份有限公司 图像信息录入方法、装置、电子设备及存储介质
CN111401365B (zh) * 2020-03-17 2024-03-22 海尔优家智能科技(北京)有限公司 Ocr图像自动生成方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101923643A (zh) * 2010-08-11 2010-12-22 中科院成都信息技术有限公司 通用表格识别方法
CN102117269A (zh) * 2010-01-06 2011-07-06 佳能株式会社 对文档进行数字化的装置及方法
CN104462044A (zh) * 2014-12-16 2015-03-25 上海合合信息科技发展有限公司 表格图像识别编辑方法及装置
CN104636117A (zh) * 2013-11-12 2015-05-20 江苏奥博洋信息技术有限公司 一种表格图像的自动切分方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004015619A1 (ja) * 2002-08-07 2004-02-19 Matsushita Electric Industrial Co., Ltd. 文字認識処理装置及び文字認識処理方法、並びに携帯端末装置
CN100362525C (zh) * 2005-06-06 2008-01-16 英华达(上海)电子有限公司 手机中使用图像识别进行名片信息的采集与录入的方法
JP2007279828A (ja) * 2006-04-03 2007-10-25 Toshiba Corp 帳票処理装置、帳票様式作成装置、帳票、帳票処理用のプログラム、帳票様式作成用のプログラム
JP5321109B2 (ja) * 2009-02-13 2013-10-23 富士ゼロックス株式会社 情報処理装置及び情報処理プログラム
CN102156855A (zh) * 2011-03-30 2011-08-17 信雅达系统工程股份有限公司 基于影像切割的银行凭证数据采集方法
CN102567764B (zh) * 2012-01-13 2016-03-02 中国工商银行股份有限公司 一种提高电子影像识别效率的票据凭证及系统
CN103020619B (zh) * 2012-12-05 2016-04-20 上海合合信息科技发展有限公司 一种自动切分电子化笔记本中手写条目的方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102117269A (zh) * 2010-01-06 2011-07-06 佳能株式会社 对文档进行数字化的装置及方法
CN101923643A (zh) * 2010-08-11 2010-12-22 中科院成都信息技术有限公司 通用表格识别方法
CN104636117A (zh) * 2013-11-12 2015-05-20 江苏奥博洋信息技术有限公司 一种表格图像的自动切分方法
CN104462044A (zh) * 2014-12-16 2015-03-25 上海合合信息科技发展有限公司 表格图像识别编辑方法及装置

Also Published As

Publication number Publication date
CN105373791A (zh) 2016-03-02
EP3147825A1 (en) 2017-03-29
EP3147825A4 (en) 2017-08-30
WO2016188104A1 (zh) 2016-12-01
SG11201610723SA (en) 2017-03-30

Similar Documents

Publication Publication Date Title
CN105373791B (zh) 信息处理方法及信息处理装置
US20210073531A1 (en) Multi-page document recognition in document capture
KR101446376B1 (ko) 고유 이미지 프로세스에 따른 미지 문서의 식별 및 검증
KR101515256B1 (ko) 동적 문서 식별 프레임워크를 사용한 문서 검증
US8185398B2 (en) Reading device with shortcut read function
EP2424207A1 (en) Monitoring system
CN110597806A (zh) 一种基于批阅识别的错题集生成与答题统计系统及方法
EP2624224A1 (en) Identification method for valuable file and identification device thereof
CN107590495B (zh) 答题卡图片纠偏方法、装置、可读存储介质以及电子设备
CN110490181B (zh) 一种基于ocr识别技术的表单填写审核方法、装置、设备以及计算机存储介质
US9471800B2 (en) Securing visual information on images for document capture
US20220415008A1 (en) Image box filtering for optical character recognition
CN104915668A (zh) 医学影像中的文字信息识别方法及装置
CN110427853B (zh) 一种智能票据信息提取处理的方法
CN107992483A (zh) 用于手势指点翻译的方法、装置及电子设备
JP7444495B2 (ja) Ocrベース文書分析システム及び方法
CN107392203A (zh) 规则图片信息识别方法及系统
US10216993B2 (en) Intelligent document elements harvest and presentation system and method
JP4983464B2 (ja) 帳票画像処理装置及び帳票画像処理プログラム
CN111046736A (zh) 一种提取文本信息的方法、装置和存储介质
US9678990B2 (en) Construction drawing evaluation systems and methods
US9690986B1 (en) Method for processing physical document images
CN108734167B (zh) 一种被污染的胶片文字识别方法
JP6028566B2 (ja) プログラム、表示制御方法及び表示制御装置
JP4701918B2 (ja) 教材処理装置、教材処理方法および教材処理プログラム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant