CN101650779B - 字符识别装置以及字符识别方法 - Google Patents
字符识别装置以及字符识别方法 Download PDFInfo
- Publication number
- CN101650779B CN101650779B CN2009101590895A CN200910159089A CN101650779B CN 101650779 B CN101650779 B CN 101650779B CN 2009101590895 A CN2009101590895 A CN 2009101590895A CN 200910159089 A CN200910159089 A CN 200910159089A CN 101650779 B CN101650779 B CN 101650779B
- Authority
- CN
- China
- Prior art keywords
- character
- length
- mentioned
- standard
- characters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/158—Segmentation of character regions using character size, text spacings or pitch estimation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Character Discrimination (AREA)
- Character Input (AREA)
Abstract
本发明提供字符识别装置、字符识别程序以及字符识别方法,即使是接触字符和基于纵横比变形字符的字符串也能正确进行字符识别。该字符识别装置具有:字符串图像取得单元,其取得字符串图像;测定字符长度取得单元,其从字符串图像取得单元所取得的字符串图像中,针对多个字符取得对字符串方向的字符长度进行测定而得的测定字符长度;字符临时识别单元,其通过临时匹配处理对测定字符长度内的字符进行临时识别;标准字符长度确定单元,其根据能够临时识别的字符的测定字符长度来确定标准字符长度;字符截取单元,其根据标准字符长度,从字符串图像中截取作为识别对象的全部字符;以及字符识别单元,其通过正式匹配处理对截取出的字符进行正式识别。
Description
技术领域
本发明涉及例如识别字符的字符识别装置、字符识别程序以及字符识别方法。
背景技术
一直以来利用以下的字符识别技术:通过数字照相机等摄像单元或数字扫描仪等来取得字符图像数据,并识别该字符图像数据内的字符。
在该字符识别技术中,从字符串中截取字符并将截取的字符与词典数据进行匹配,由此来识别字符。
在这样的字符识别中,针对例如字符与字符相接触的情况以及下述状况的字符等,产生很难截取正确字符的情况,该状况的字符是指:由在字符串方向上分离的多个字符要素组成的分离字符(例如,横写字符串中的「州」和「川」,竖写文书中的「二」和「三」等)、或由原本单独的字符要素组成的字符,因模糊而分离成多个字符要素。
已提出一些从这种包含接触字符或分离字符的字符串中也能进行正确字符截取的方法,这些方法是在推定了字符宽度后进行字符截取的(参照专利文献1~5)。
但是,在这些专利文献所述的技术中仍存在问题点。
详细地说,专利文献1所述的字符识别装置是在字符宽度固定的前提下进行字符截取的。因此,该字符识别装置无法良好地应对全角字符和半角字符混合的字符串。
专利文献2所述的字符识别装置预先针对全角字符和半角字符分别准备预定的字符宽度并进行字符截取。因此,可以应对全角字符和半角字符混合的字符串。但是,无法应对如中国所采用的纵横比例变形的字符。即,例如在中国的指示牌、广告牌及餐饮店的菜单等中,使用如图 10(A)所示由变形成竖长的竖长字符构成的字符串、或如图10(B)所示由变形成横宽的横宽字符构成的字符串等各种横竖比例变形的字符。并且,专利文献2所述的字符识别装置是以预定的字符宽度为前提,所以存在无法良好地应对这种横竖比例变形字符的问题。
另外,专利文献3所述的字符识别装置以预定的字符宽度为前提,考虑所提取的字符是一个字符的情况和是两个字符的情况二者。但是,专利文献3与上述专利文献2的情况相同,由于以预定的字符宽度为前提,因此无法良好地应对由竖长字符构成的字符串或由横宽字符构成的字符串等基于横竖比例变形字符的字符串。
另外,上述专利文献4所述的字符识别装置假定全角字符的横竖比例大致接近1∶1。因此,与上述专利文献2、3同样,无法良好地应对由竖长字符构成的字符串或由横宽字符构成的字符串等基于横竖比例变形字符的字符串。
另外,上述专利文献5所述的字符识别装置根据使黑像素(相当于字符的像素)投影到与字符串垂直的方向上而得的数据,来制作投影字符宽度的直方图,将其峰值作为字符宽度。因此,可能可以应对由竖长字符构成的字符串或由横宽字符构成的字符串等基于横竖比例变形字符的字符串。但是,例如在如图10(C)所示存在接触字符的情况下,由于接触字符的影响导致峰值成为W2,将实际字符宽度W1的倍数的尺寸W2推定为字符宽度。
【专利文献1】日本特开平5-128308号公报
【专利文献2】日本特开平5-128307号公报
【专利文献3】日本特开平3-53393号公报
【专利文献4】日本特开平7-271911号公报
【专利文献5】日本特开平1-78395号公报
发明内容
本发明是着眼于上述的现有问题而完成的,其目的是提供即使是接触字符和基于横竖比例变形字符的字符串也能够正确地进行字符识别的 字符识别装置、字符识别程序以及字符识别方法。
本发明提供一种字符识别装置,其特征是具有:字符串图像取得单元,其取得字符串图像;测定字符长度取得单元,其从由上述字符串图像取得单元取得的字符串图像中,针对多个字符取得对字符串方向的字符长度进行测定而得的测定字符长度;字符临时识别单元,其通过临时匹配处理对取得的测定字符长度内的字符进行临时识别;标准字符长度确定单元,其根据能够临时识别的字符的上述测定字符长度来确定标准字符长度;字符截取单元,其根据所确定的标准字符长度,从上述字符串图像中截取作为识别对象的全部字符;以及字符识别单元,其通过正式匹配处理对截取出的字符进行正式识别。
上述字符串图像取得单元例如是CCD照相机或CMOS照相机等摄像单元、或者从这样的摄像单元接收该摄像单元拍摄的字符串图像数据的接口等,可以由能够取得图像的适当单元来构成。
关于上述字符串方向,如果字符纵向排列则为纵向,如果字符横向排列则为横向等,可以设为排列字符的适当方向。
上述字符长度是指字符串方向上1个字符的长度,例如可以设为1字符在字符串方向上的像素数量。
上述字符临时识别单元例如可以是从字符图像中提取特征数据、将该特征数据与词典数据的特征数据进行匹配并识别是哪个字符的单元。此外,所谓能够临时识别可以是以被认为能够识别正确字符的程度得到匹配置信度的情况。
关于上述标准字符长度确定单元,由将多个测定字符长度的平均值作为标准字符长度的平均字符长度运算单元构成,或者由提取多个测定字符长度最集中的值的集中值提取单元构成等,可由确定标准字符长度的适当单元来构成。
上述字符识别单元例如可以是从字符图像中提取特征数据、将该特征数据与词典数据的特征数据进行匹配并识别是哪个字符的单元。
上述字符识别装置由半导体芯片等装置构成,或者由具有摄像单元、控制单元和存储单元的携带电话或PDA等信息处理终端来构成等,可以 由适当的装置构成,上述半导体芯片具有:执行信息处理的CPU等信息处理部、进行信息存储的存储器等信息存储部以及与外部装置连接的连接端子等接口部。
根据本发明,即使是接触字符和基于横竖比例变形字符的字符串,也能够正确地进行字符识别。
作为本发明的方式,可以构成为:当通过上述临时匹配处理临时识别的字符是上述字符串图像的字符串方向上配置的2个部首字符结合而成的1个结合字符时,上述标准字符长度确定单元从用于确定上述标准字符长度的测定字符长度中除去该结合字符的测定字符长度。
上述结合字符可以是字符串方向为左右方向时由左偏旁和右偏旁组成的字符,或者是字符串方向为上下方向时由字盖和字底组成的字符。
上述部首字符可以是相当于字符串方向为左右方向时上述结合字符的左偏旁或右偏旁的字符,或者是字符串方向为上下方向时由上述结合字符的字盖或字底构成的字符。
由此,可以防止将2个字符的字符长度用作1个字符的字符长度。具体而言例如考虑下述情况:针对字符“日”和字符“月”按顺序排列两个的字符串,错误地临时识别成“日”和“月”结合而成的1个字符“明”。在这样的情况下,由于临时识别出的“明”是结合字符,因此可以除去“明”的测定字符长度。因此,能够防止将“日”和“月”这2个字符的字符长度误用为“明”这1个字符的测定字符长度。
此外作为本发明的方式,可以构成为:当通过上述临时匹配处理临时识别的字符是字符串方向前后的任意一个字符与该字符结合时能够形成1个结合字符的部首字符时,上述标准字符长度确定单元从用于确定上述标准字符长度的测定字符长度中除去该部首字符的测定字符长度。
由此,能够防止将结合字符的部首字符的测定字符长度误用为1个字符的测定字符长度。具体而言考虑下述情况:在临时识别“明”这1个字符时,错误地临时识别为“日”和“月”这2个字符。在这样的情况下,能够除去可成为部首字符的“日”和“月”的测定字符长度。因此,能够防止将部首字符的测定字符长度误用为1字符的测定字符长度。
可构成为:所述字符截取单元制作将上述字符串图像投影到与字符串方向垂直的方向上而成的投影数据,并执行第1截取处理,该第1截取处理是截取从该投影数据的分开处或谷底到下一个分开处或谷底的临时字符长度相对于上述标准字符长度处于预定误差内的字符,上述字符识别单元对截取出的字符进行与全角字符匹配的全角字符正式匹配处理,作为上述正式匹配处理,当该全角字符正式匹配处理的匹配可靠度低于预定阈值时,上述字符截取单元执行第2截取处理,该第2截取处理是截取位于缩小字符长度内的字符,该缩小字符长度是在上述标准字符长度中从字符串前方切去了预定范围并从字符串后方切去了上述预定误差,上述字符识别单元对截取出的字符进行与半角字符匹配的半角字符正式匹配处理,作为上述正式匹配处理。
由此,能够正确地识别全角字符和半角字符。
此外作为本发明的方式,可以将上述预定误差设为上述标准字符长度的4分之1。
由此,能够适当地应对全角字符彼此间字符宽度的偏差。即,例如在字符“と”和字符“ど”中,字符宽度仅浊音部分稍微不同,能够适当地应对这样的字符宽度偏差。
此外作为本发明的方式,可以将上述规定范围设为上述标准字符长度的16分之1。
由此,即使针对“I”或“l”等字符宽度较小的字符也能够适当应对。
另外本发明可以提供使计算机执行以下步骤的字符识别程序,字符串取得步骤,通过字符串图像取得单元来取得字符串图像;测定字符长度取得步骤,从上述字符串图像中针对多个字符取得对字符串方向的字符长度进行测定而得的测定字符长度;字符临时识别步骤,通过临时匹配处理对取得的测定字符长度内的字符进行临时识别;标准字符长度确定步骤,根据能够临时识别的字符的上述测定字符长度来确定标准字符长度;字符截取步骤,根据所确定的标准字符长度从上述字符串图像中截取作为识别对象的全部字符;以及字符识别步骤,通过正式匹配处理对截取出的字符进行正式识别。
上述字符识别程序可以存储在CD(紧凑光盘,Compact Disc)、DVD(数字通用光盘,Digital Versatile Disk)、软盘、存储器、芯片或硬盘等适当的存储介质中。另外,上述字符识别程序可预先存储在与因特网等电气通信线路连接的服务器的存储单元中,并可以通过电气通信线路进行下载、或者可通过电气通信线路作为ASP(应用服务提供商,Application Service Provider)的服务来进行利用。
根据本发明,即使是接触字符和基于横竖比例变形字符的字符串,也能够利用适当的硬件来执行正确的字符识别。
另外,本发明可提供字符识别方法,该字符识别方法执行以下的步骤:字符串取得步骤,通过字符串图像取得单元来取得字符串图像;测定字符长度取得步骤,从上述字符串图像中针对多个字符取得对字符串方向的字符长度进行测定而得的测定字符长度;字符临时识别步骤,通过临时匹配处理对取得的测定字符长度内的字符进行临时识别;标准字符长度确定步骤,根据能够临时识别的字符的上述测定字符长度来确定标准字符长度;字符截取步骤,根据所确定的标准字符长度从上述字符串图像中截取作为识别对象的全部字符;以及字符识别步骤,通过正式匹配处理对截取出的字符进行正式识别。
本发明可提供即使是接触字符和基于横竖比例变形字符的字符串也能够正确地进行字符识别的字符识别装置、字符识别程序以及字符识别方法。
附图说明
图1是便携终端的立体图。
图2是便携终端的结构框图。
图3是字符匹配中使用的词典数据的结构图。
图4是显示在画面显示部上的识别画面的画面结构图。
图5是提取测定字符长度的方法的说明图。
图6是关于字符识别功能的流程图。
图7是关于字符识别功能的流程图。
图8是确定标准字符长度的过程的说明图。
图9是从截取开始位置截取预定截取范围的图像的全角字符截取处理。
图10是在中国的餐饮店菜单等中使用的变形字符的说明图。
标号说明:
1、便携终端;11、CPU;15、芯片;23、字符识别程序;32、字符长度候选提取处理部;33、标准字符长度计算部;34、字符截取处理部;35、字符识别处理部;52、投影数据;E1、截取范围;E2、截取范围;L、测定字符长度;La、标准字符长度;P、字符串图像;α、字符终端允许误差;β、字符开始端剪切范围
具体实施方式
参照以下附图来说明本发明的一个实施方式。
图1示出便携终端1的立体图,图2示出便携终端1的结构框图。
如图1所示,便携终端1设置有图像输入部3、操作部5以及画面显示部7。图像输入部3是拍摄图像的数字照相机,操作部5是可进行按下操作的按钮,画面显示部7是显示图像的液晶显示器或有机电致发光显示器。
如图2所示,便携终端1被设置成图像输入部3、操作部5和画面显示部7连同CPU 11、ROM 12和RAM 13与总线16连接。
图像输入部3是CCD照相机或CMOS照相机等数字照相机,其与总线16连接。图像输入部3所拍摄得到的摄像图像作为数字图像数据被发送到CPU 11。该数字图像数据也可以最终存储在其他的存储装置(非易失性存储器等)中。另外,图像输入部3从CPU 11接收拍摄信号而开始拍摄。
操作部5与总线16连接。该操作部5经由总线16将使用者进行了按下操作的按下信号发送至CPU 11。
画面显示部7具有作为显示操作画面的操作画面显示部7a的功能和作为显示字符识别的识别结果的识别结果显示部7b的功能。该操作画面 显示部7与总线16连接。当从CPU 11发送来图像数据时,该图像数据的图像显示在操作画面显示部7a或识别结果显示部7b中。
CPU 11是根据存储在ROM 12中的程序将RAM 13用作临时存储区域来进行各种动作的处理器,该CPU 11具有控制各部的控制功能21和字符识别功能22。
该字符识别功能22具有:投影数据取得部31、字符长度候选提取处理部32、标准字符长度计算部33、字符截取处理部34以及字符识别处理部35。
投影数据取得部31取得投影数据,该投影数据是对字符串图像进行二值化后将与字符串方向垂直的方向上的黑像素数(构成字符的像素数)排列在字符串方向上的直方图。
字符长度候选提取处理部32从投影数据中将没有黑像素的部分或黑像素较少的部分推测为字符分开处来提取作为标准字符长度的候选的测定字符长度。
标准字符长度计算部33根据测定字符长度来计算标准字符长度。
字符截取处理部34按照上述标准字符长度来截取字符串,分离成1个字符单位。
字符识别处理部35从截取出的字符中取得该字符的特征数据,匹配该特征数据是否与存储在ROM 12的词典数据25中的各个字符的特征数据一致或近似。
ROM 12存储有字符识别程序23、设定数据24以及词典数据25。设定数据24例如存储有标准字符长度计算条件等,该标准字符长度计算条件规定了判断已进行临时匹配处理的字符是否是求取标准字符长度时可使用的字符的条件。
RAM 13临时存储CPU 11在各种控制和运算中使用的数据,并且在图像存储器14中存储有字符串图像等图像。
另外,在便携终端1中还设置有进行无线通信的通信天线、进行声音输出的扬声器以及进行声音采集的麦克风等。由此,构成为可作为移动电话而利用。
另外,如图中假想线所示,CPU 11和ROM 12可构成为搭载在1个芯片15上的电子部件。在此情况下,只要在便携终端1中具有芯片15,就可简单地追加字符识别功能。
图3示出在字符匹配中使用的词典数据25的结构图。
词典数据25由字符代码、匹配信息、全角/半角区别、结合字符区别以及左部首字符区别等各个项目构成。
字符代码针对各个字符存储SHIFT-JIS或UTF-8等适当的字符代码。
匹配信息针对各个字符存储特征量数据。
全角/半角区别以“1”/“0”的方式来存储全角字符或半角字符的区别。
结合字符区别以“1”/“0”的方式来存储是否是结合字符的区别。
左部首字符区别以“1”/“0”的方式来存储是否是左侧部首字符的区别。
图4示出在画面显示部7中显示的识别画面40的画面结构图。
识别画面40将由图像输入部3取得的图像较大地显示在画面中,对其中希望识别的字符串图像P以利用识别对象确定框41包围的方式进行显示。另外,在图示的例中字符是横向排列的,因此字符长度成为通常所说的字符宽度。
在画面下方设置有返回按钮42、识别按钮43以及子菜单按钮44。
返回按钮42是当其被按下时返回前一画面的按钮。
识别按钮43是当其被按下时开始字符识别的按钮。
子菜单按钮44是当其被按下时显示具有各种功能的子菜单的按钮。另外,在该子菜单中,还显示可通过使用者的操作来任意变更识别对象确定框41的位置和范围的识别对象指定功能。
图5是说明从字符串图像中取得投影数据来提取测定字符长度的方法的说明图。
将图5(A)所示的字符串图像51以字符部分变黑的方式进行2值化,将与字符串方向垂直的方向(在图示例中为上下方向)上的黑像素数量以比特为单位排列在字符串方向上时,如图5(B)所示,获得使黑像素投影后的投影数据52。
该投影数据52是将纵轴作为黑像素数量、横轴作为字符串方向位置的直方图。
该投影数据52如图所示,字符串方向上的字符与字符之间位置的值成为0或极小值,该0或极小值部分可能是字符与字符的分界。
如图5(C)所示,根据这样的字符与字符的分界可得到各种测定字符长度的候选。在图5(C)中显示在最上段的测定字符长度L,是如果黑像素数量小于等于预定数(阈值B1)则推定为字符分开处的情况下的候选。对于显示在最下段的测定字符长度L,是仅将黑像素数量为0(阈值B6)的情形推定为字符分开处的情况下的候选。这两者之间的测定字符长度L是使推定为字符分开处的黑像素数量的值(阈值B2~B5)不同的例子。
这样,通过使作为字符分开处的黑像素数量的阈值B变化,来得到某种程度精度的测定字符长度L。不过如图所示,所得到的测定字符长度L并非完全正确。这样得到了具有某种程度可靠性的测定字符长度L,以下说明用于进一步进行准确性较高的字符识别的处理。
图6~图7示出关于CPU 11根据存储在ROM 12中的字符识别程序23所执行的字符识别功能22的流程图。
CPU 11从图像输入部3取得字符图像(步骤S1)。该字符图像的取得可以通过以下方式来取得:从操作部5接受使用者的摄像操作,根据该摄像操作来执行图像输入部3的摄像,将图像输入部3取得的摄像图像作为字符图像来进行数据接收。
CPU 11在画面显示部7中显示识别画面40,使用者利用操作部5对识别对象确定框41进行移动操作来接受识别对象范围的指定(步骤S2)。如图8(A)所示,上述步骤以后的说明是将“六月的宴会料理...”的字符图像指定为识别对象范围的情况作为例子来进行说明的。
CPU 11发挥作为投影数据取得部31的功能,针对指定的识别对象范围的字符串取得投影数据52(步骤S3)。
CPU 11发挥作为字符长度候选提取处理部32的功能,从投影数据52提取测定字符长度(步骤S4)。此时如图8(B)所示,区分成“六”“月”“白”“勺”“宴”“会”“米”“斗”“理”...的字符候选单位,提取出测定 字符长度。另外,对于区分后的字符候选和测定字符长度,如果字符串横向排列则可以从左向右依次标注编号,如果字符串纵向排列则可以从上到下依次标注编号。
CPU 11将变量“i”设为“0”进行初始化(步骤S5),针对存在于第i个测定字符长度内的字符候选进行临时匹配处理,计算匹配可靠度(步骤S6)。该匹配可靠度是通过以下方式来计算的:根据字符候选来计算特征量,并将该特征量与词典数据25的各字符的匹配信息进行比较。此时,仅与全角字符的匹配信息进行比较,而不使用半角字符。由此,可以将最终计算出的标准字符长度作为全角字符的字符长度,能够提高精度。另外,此时可通过临时匹配处理来临时识别字符,优选暂时存储该临时识别出的字符。
CPU 11判定计算出的匹配可靠度是否满足预定的标准字符长度计算条件(步骤S7)。该标准字符长度计算条件是指完全满足以下所示的条件1~条件3的条件。
“标准字符长度计算条件”
条件1:匹配可靠度是预定的基准值以上
条件2:通过匹配识别出的字符不对应于部首字符
条件3:通过匹配识别出的字符不对应于结合字符
条件1中的预定基准值可适当设定为认为能够识别正确字符的基准值。
条件2的部首字符例如可设为成为字符串方向前方(左偏旁或字盖)的前方部首字符,可设为成为字符串方向后方(右偏旁或字底)的后方部首字符,或者可设为上述二者。
另外,将前方部首字符作为排除对象时,优选的是,仅将字符的临时识别结果中、该前方部首字符与后方部首字符组合起来构成一个结合字符的情况作为排除对象。这样能够提高效率和精度。
此外,将后方部首字符作为排除对象时,优选的是,仅将字符的临时识别结果中、该后方部首字符与排列在其前方的字符识别结果结合而构成一个结合字符的情况作为排除对象。由此,能够提高效率和精度。
对于条件3的结合字符,如果字符串方向为横方向则是由“左偏旁”和“右偏旁”组成的字符,如果字符串方向为纵方向则是由“字盖”和“字底”组成的字符。
在图8(C)所示的例子中,可以作为满足标准字符长度计算条件而采用的字符是“六”“宴”“会”。另外的“月”“白”“勺”“米”“斗”“理”作为与部首字符或结合字符相应的字符而不满足条件。
在满足标准字符长度计算条件时(步骤S7的“是”),CPU 11将该测定字符长度设为标准计算用字符长度,将初始值为“0”的变量“字符数”递增1(步骤S8)。
在不满足标准字符长度计算条件时(步骤S7的“否”),CPU 11直接将处理进入步骤S9。
CPU 11判定是否收集了必要数量(例如4个字符)的标准计算用字符长度,即判定变量“字符数”是否到达了预定数量(例如4个)(步骤S9)。
当收集了必要数量的标准计算用字符长度时(步骤S9的“是”),CPU11根据取得的预定数量(例如4个字符)的标准计算用字符长度来计算标准字符长度(步骤S10),处理进入步骤S15。该标准字符长度优选为预定数量的标准计算用字符长度的平均值。另外,计算出的标准字符长度为全角字符的标准字符长度。
在未收集到必要数量的标准计算用字符长度时(步骤S9的“否”),CPU 11将变量“i”递增1(步骤S11),返回步骤S6反复进行处理,直到该变量“i”(即,变量“字符数”)到达标准计算用字符长度的数量为止(步骤S12的“是”)。
在变量“i”到达标准计算用字符长度的数量时(步骤S12的“否”),可识别为未收集到必要数量的标准计算用字符长度。因此,CPU 11判定标准计算用字符长度是否收集了一个以上(步骤S13)。
在标准计算用字符长度收集了一个以上时(步骤S13的“是”),CPU11将处理进行步骤S10,计算所收集到的标准计算用字符长度的平均值,并将其确定为标准字符长度(步骤S10)。
当一个标准计算用字符长度也未收集到时(步骤S13的“否”),CPU 11 根据默认设定来计算标准字符长度(步骤S14)。
对于基于该默认设定的标准字符长度,假定读取对象字符的纵横比是1∶1,将与字符串方向垂直的方向上的字符长度(在此实施例中是字符高度)设为标准字符长度。这样将纵横比设为1∶1是因为通常纵横比为1比1的字符多于除此以外的纵横比的字符。
执行到此为止的从步骤S6至S14的CPU 11作为标准字符长度计算部33发挥功能。
CPU 11根据所确定的标准字符长度,设定针对字符串图像的第一字符的截取开始位置(步骤S15)。
然后,CPU 11作为字符截取处理部34发挥功能,如图9(A)所示执行从截取开始位置截取预定截取范围的图像的全角字符截取处理(步骤S16)。这里的预定截取范围是标准字符长度La±α。即,全角字符截取处理将从截取开始位置离开标准字符长度La的位置作为中心的-α~+a作为搜索范围,将位于该搜索范围内的投影数据52的分开处或谷底确定为字符终端侧剪切位置。然后,在从截取开始位置到字符终端侧剪切位置的截取范围中截取图像。其中,α是字符终端允许误差,优选为标准字符长度La的1/4。
然后,CPU 11作为字符识别处理部35发挥功能,针对通过全角字符截取处理所截取的图像内的字符来执行全角字符识别处理(步骤S17)。该全角字符识别处理仅使用词典数据25中存储的匹配信息中的全角/半角区别为全角的匹配信息。另外,全角字符识别处理是根据所截取的字符图像来计算特征量、并从词典数据25检索与该特征量一致或最近似的匹配信息的处理。
CPU 11判定在全角字符识别处理中得到的匹配可靠度是否高于基准值(步骤S18)。该基准值设定成所识别的字符是正确字符的可能性高的值。并且,如果匹配可靠度比上述基准值高(步骤S18的“是”),则CPU11采用该字符(步骤S19)。
如果匹配可靠度低于一定值(步骤S18的“否”),则CPU 11作为字符截取处理部34发挥功能,执行半角字符截取处理(步骤S20)。如图9(B) 所示,该半角字符截取处理以「β<截取范围<标准字符长度La-α」的方式来截取图像。即,从全角字符的截取开始位置起切去字符开始端剪切范围β,并且在比标准字符长度La短字符终端允许误差α的部分处进行剪切,由此能够高精度地截取半角字符。
这里,字符开始端剪切范围β的图像剪切可以始终在从全角字符的截取开始位置离开字符开始端剪切范围β的位置处进行剪切,或者也可以在从全角字符的截取开始位置到字符开始端剪切范围β之间的投影数据52的分开处或者谷底进行剪切。另外,优选将字符开始端剪切范围β设为标准字符长度的1/16。
此外,作为字符终端侧剪切位置的“标准字符长度La-α”处的图像剪切,可以从全角字符的截取开始位置离开“标准字符长度La-α”的位置处进行剪切,或者也可以将从全角字符的截取开始位置离开“标准字符长度La-α”的位置、到离开标准字符长度La的位置的范围作为搜索范围,在位于该搜索范围的投影数据52的分开处或谷底进行剪切。
这样进行了半角字符截取处理后,CPU 11作为字符识别处理部35发挥功能,执行半角字符识别处理(步骤S21)。该半角字符识别处理仅使用词典数据25中存储的匹配信息中的全角/半角区别为半角的匹配信息。另外,半角字符识别处理是根据所截取的字符图像来计算特征量、并从词典数据25中检索与该特征量一致或者最近似的匹配信息的处理。
如果匹配处理的可靠度高,则CPU 11采用匹配后的字符,将该字符设定为识别成功(步骤S22)。
CPU 11判定是否是字符串图像最末尾的字符(步骤S23),如果不是最末尾的字符(步骤S23的“否”),则设定下一字符的截取开始位置(步骤S24),并返回步骤S20反复进行处理。下一字符的截取开始位置例如设为由步骤S16的全角字符截取处理或者步骤S20的半角字符截取处理所确定的字符终端侧剪切位置即可。
当在上述步骤S23中是最末尾字符时(步骤S23的“是”),CPU 11认为作为读取对象的全部字符的字符识别已结束而结束处理。这里,字符识别出的字符可以显示在作为识别结果显示部7b的画面显示部7上,或 者发送到翻译应用程序等其他程序,通过适当的输出单元进行输出。
通过以上的结构以及动作,即使是接触字符和基于纵横比变形字符的字符串,也能进行正确的字符识别。
在确定标准字符长度La时要满足匹配可靠度高于某阈值的条件,因此可以从标准字符长度La的计算中排除不能进行正确字符识别的字符,即接触字符、字符在中途分开或者反映了字符以外的噪声的图像。
此外,不仅匹配可靠度较高,而且是排除了可能是部首字符的字符以及可能是结合字符的字符而进行标准字符长度La的计算,因此能够防止弄错字符长度而进行识别的情况。即,例如,对于“日”和“月”等成为其他字符(“明”等)要素的概率较大的字符,当其实际上成为另外字符的要素时,即使从“明”中仅截取“日”或“月”的部分作为字符长度的候选的情况下,也能够将其排除而推定标准字符长度La。
此外,由于采用多个字符长度的平均值,因此能够提高字符长度的推定精度。
此外,从投影数据52进行的字符截取处理中,在成为投影数据52的分开处或谷底的位置截取字符并作为坐标的候选,由此即使是字符接触频发的字符串,也能够正确地截取1个字符来高精度地进行字符识别。
此外,使用字符终端允许误差α和字符开始端剪切范围β,在通过全角字符识别处理无法正确识别的情况下执行半角字符识别处理,由此能够任意读取全角字符和半角字符。
此外,由于利用相对于标准字符长度La的比率来确定字符终端允许误差α和字符开始端剪切范围β的值,因此与读取对象字符串是竖长(参照图8(D))还是横宽(参照图8(E))等的大小(纵横比)区别无关,都能够适当地识别字符。
此外,通过将字符开始端剪切范围β设为标准字符长度的1/16,由此即使针对“I”或“l”等字符宽度较小的字符也能适当地应对。
另外,在取得了预定数量(例如4个)的可用测定字符长度的时刻,确定标准字符长度La而不进行此后的临时识别,之后使用标准字符长度La来进行正式的识别,由此能够实现字符识别所需时间的缩短以及字符 识别精度的提高。
在本发明的结构与上述实施方式的对应中,本发明的字符识别装置对应于实施方式的便携终端1或芯片15,以下同样,字符串图像取得单元对应于执行步骤S1的CPU 11,测定字符长度取得单元对应于字符长度候选提取处理部32,字符临时识别单元对应于执行步骤S6的标准字符长度计算部33,标准字符长度确定单元对应于标准字符长度计算部33,字符截取单元对应于字符截取处理部34,字符识别单元对应于字符识别处理部35,临时字符长度对应于截取范围E1,缩小字符长度对应于截取范围E2,预定误差对应于字符终端允许误差α,预定范围对应于字符开始端剪切范围β,预定阈值对应于基准值,字符串取得步骤对应于步骤S1,测定字符长度取得步骤对应于步骤S4,临时匹配处理、临时识别和字符临时识别步骤对应于步骤S6,标准字符长度确定步骤对应于步骤S6~S14,第1截取处理对应于步骤S16,全角字符正式匹配处理对应于步骤S17,字符截取步骤对应于步骤S16、S20,字符识别步骤及正式匹配处理对应于步骤S17、S21,第2截取处理对应于步骤S20,半角字符正式匹配处理对应于步骤S21,但本发明不仅限于上述实施方式的结构,可以获得多个实施方式。
Claims (5)
1.一种字符识别装置,该字符识别装置具有:
字符串图像取得单元,其取得字符串图像;
测定字符长度取得单元,其从由上述字符串图像取得单元取得的字符串图像中,针对多个字符取得对字符串方向的字符长度进行测定而得的测定字符长度;
字符临时识别单元,其通过临时匹配处理对取得的测定字符长度内的字符进行临时识别;
标准字符长度确定单元,其根据能够临时识别的字符的上述测定字符长度来确定标准字符长度;
字符截取单元,其根据所确定的标准字符长度,从上述字符串图像中截取作为识别对象的全部字符;以及
字符识别单元,其通过正式匹配处理对截取出的字符进行正式识别,
当通过上述临时匹配处理临时识别的字符是上述字符串图像的字符串方向上配置的2个部首字符结合而成的1个结合字符时,上述标准字符长度确定单元从用于确定上述标准字符长度的测定字符长度中除去该结合字符的测定字符长度,
当通过上述临时匹配处理临时识别的字符是字符串方向前后的任意一个字符与该字符结合时能够形成1个结合字符的部首字符时,上述标准字符长度确定单元从用于确定上述标准字符长度的测定字符长度中除去该部首字符的测定字符长度,
其中,匹配可靠度是预定的基准值以上。
2.根据权利要求1所述的字符识别装置,其中,
该字符识别装置构成为:
所述字符截取单元制作将上述字符串图像投影到与字符串方向垂直的方向上而成的投影数据,并执行第1截取处理,该第1截取处理是截取从该投影数据的分开处或谷底到下一个分开处或谷底的临时字符长度相对于上述标准字符长度处于预定误差内的字符,
上述字符识别单元对截取出的字符进行与全角字符匹配的全角字符正式匹配处理,作为上述正式匹配处理,
当该全角字符正式匹配处理的匹配可靠度低于预定阈值时,
上述字符截取单元执行第2截取处理,该第2截取处理是截取位于缩小字符长度内的字符,该缩小字符长度是在上述标准字符长度中从字符串前方切去了预定范围并从字符串后方切去了上述预定误差,
上述字符识别单元对截取出的字符进行与半角字符匹配的半角字符正式匹配处理,作为上述正式匹配处理。
3.根据权利要求2所述的字符识别装置,其中,
上述预定误差为上述标准字符长度的4分之1。
4.根据权利要求2或3所述的字符识别装置,其中,
上述预定范围为上述标准字符长度的16分之1。
5.一种字符识别方法,该字符识别方法执行以下的步骤:
字符串取得步骤,通过字符串图像取得单元来取得字符串图像;
测定字符长度取得步骤,从上述字符串图像中针对多个字符取得对字符串方向的字符长度进行测定而得的测定字符长度;
字符临时识别步骤,通过临时匹配处理对取得的测定字符长度内的字符进行临时识别;
标准字符长度确定步骤,根据能够临时识别的字符的上述测定字符长度来确定标准字符长度;
字符截取步骤,根据所确定的标准字符长度从上述字符串图像中截取作为识别对象的全部字符;以及
字符识别步骤,通过正式匹配处理对截取出的字符进行正式识别,
当通过上述临时匹配处理临时识别的字符是上述字符串图像的字符串方向上配置的2个部首字符结合而成的1个结合字符时,上述标准字符长度确定步骤从用于确定上述标准字符长度的测定字符长度中除去该结合字符的测定字符长度,
当通过上述临时匹配处理临时识别的字符是字符串方向前后的任意一个字符与该字符结合时能够形成1个结合字符的部首字符时,上述标准字符长度确定步骤从用于确定上述标准字符长度的测定字符长度中除去该部首字符的测定字符长度,
其中,匹配可靠度是预定的基准值以上。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008-206722 | 2008-08-11 | ||
JP2008206722A JP5146190B2 (ja) | 2008-08-11 | 2008-08-11 | 文字認識装置、文字認識プログラム、および文字認識方法 |
JP2008206722 | 2008-08-11 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101650779A CN101650779A (zh) | 2010-02-17 |
CN101650779B true CN101650779B (zh) | 2013-01-23 |
Family
ID=41347204
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2009101590895A Expired - Fee Related CN101650779B (zh) | 2008-08-11 | 2009-08-06 | 字符识别装置以及字符识别方法 |
Country Status (4)
Country | Link |
---|---|
EP (1) | EP2154632B1 (zh) |
JP (1) | JP5146190B2 (zh) |
KR (1) | KR101050866B1 (zh) |
CN (1) | CN101650779B (zh) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8494284B2 (en) * | 2011-11-21 | 2013-07-23 | Nokia Corporation | Methods and apparatuses for facilitating detection of text within an image |
JP5906788B2 (ja) | 2012-02-17 | 2016-04-20 | オムロン株式会社 | 文字切り出し方法、およびこの方法を用いた文字認識装置およびプログラム |
JP6078953B2 (ja) | 2012-02-17 | 2017-02-15 | オムロン株式会社 | 文字認識方法、およびこの方法を用いた文字認識装置およびプログラム |
JP6055297B2 (ja) * | 2012-12-07 | 2016-12-27 | 株式会社日立情報通信エンジニアリング | 文字認識装置及び方法、文字認識プログラム |
CN103020621B (zh) * | 2012-12-25 | 2016-02-24 | 深圳深讯和科技有限公司 | 中英文混排文字图像的切割方法及装置 |
CN104134064B (zh) * | 2013-05-02 | 2018-05-04 | 百度国际科技(深圳)有限公司 | 文字识别方法和装置 |
CN104143093B (zh) * | 2013-05-10 | 2018-01-09 | 百度在线网络技术(北京)有限公司 | 文字识别方法和装置 |
CN105631450A (zh) * | 2015-12-28 | 2016-06-01 | 小米科技有限责任公司 | 字符识别方法及装置 |
JP6804292B2 (ja) * | 2016-12-28 | 2020-12-23 | オムロンヘルスケア株式会社 | 端末装置 |
JP2019159633A (ja) * | 2018-03-12 | 2019-09-19 | セイコーエプソン株式会社 | 画像処理装置、画像処理方法および画像処理プログラム |
CN111626038A (zh) * | 2019-01-10 | 2020-09-04 | 北京字节跳动网络技术有限公司 | 背诵文本的提示方法、装置、设备及存储介质 |
CN112215216A (zh) * | 2020-09-10 | 2021-01-12 | 中国东方电气集团有限公司 | 一种图像识别结果的字符串模糊匹配系统及方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0539158A2 (en) * | 1991-10-21 | 1993-04-28 | Canon Kabushiki Kaisha | Method and apparatus for character recognition |
CN1551038A (zh) * | 2003-04-14 | 2004-12-01 | 佳能株式会社 | 字符识别法 |
CN1719454A (zh) * | 2005-07-15 | 2006-01-11 | 清华大学 | 几何代价和语义-识别代价融合的脱机手写汉字切分方法 |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2548579B2 (ja) | 1987-09-19 | 1996-10-30 | 富士通株式会社 | 文字認識装置 |
JP2976445B2 (ja) | 1989-07-21 | 1999-11-10 | セイコーエプソン株式会社 | 文字認識装置 |
JPH0415776A (ja) * | 1990-05-01 | 1992-01-21 | Fuji Facom Corp | 文字のサイズ情報抽出方法 |
JPH05128307A (ja) | 1991-10-31 | 1993-05-25 | Toshiba Corp | 文字認識装置 |
JPH05128308A (ja) | 1991-11-08 | 1993-05-25 | Sumitomo Electric Ind Ltd | 文字認識装置 |
JPH05166009A (ja) * | 1991-12-13 | 1993-07-02 | Sumitomo Electric Ind Ltd | 文字切出し・認識方法及び装置 |
JPH05290211A (ja) * | 1992-04-09 | 1993-11-05 | Matsushita Electric Ind Co Ltd | 文字種等の判別方法 |
US5680479A (en) * | 1992-04-24 | 1997-10-21 | Canon Kabushiki Kaisha | Method and apparatus for character recognition |
JP3236732B2 (ja) | 1994-03-28 | 2001-12-10 | 松下電器産業株式会社 | 文字認識装置 |
JPH09106437A (ja) * | 1995-10-11 | 1997-04-22 | Ricoh Co Ltd | 文字切出し装置および文字切出し方法 |
JP3639126B2 (ja) * | 1998-01-22 | 2005-04-20 | 富士通株式会社 | 住所認識装置及び住所認識方法 |
KR100593986B1 (ko) * | 2002-09-11 | 2006-07-03 | 삼성전자주식회사 | 영상화면 내의 글자 이미지를 인식하는 장치 및 방법 |
KR20060050729A (ko) * | 2004-08-31 | 2006-05-19 | 엘지전자 주식회사 | 카메라로 촬영된 문서 영상 처리 방법과 장치 |
KR101128185B1 (ko) * | 2005-04-01 | 2012-03-23 | 엘지전자 주식회사 | 카메라 폰에서의 문자 인식 장치 및 방법 |
JP5041775B2 (ja) * | 2006-09-28 | 2012-10-03 | 沖電気工業株式会社 | 文字切出方法及び文字認識装置 |
JP5361574B2 (ja) * | 2009-07-01 | 2013-12-04 | キヤノン株式会社 | 画像処理装置、画像処理方法、及びプログラム |
-
2008
- 2008-08-11 JP JP2008206722A patent/JP5146190B2/ja active Active
-
2009
- 2009-07-31 KR KR1020090070357A patent/KR101050866B1/ko active IP Right Grant
- 2009-08-06 CN CN2009101590895A patent/CN101650779B/zh not_active Expired - Fee Related
- 2009-08-11 EP EP09167660.1A patent/EP2154632B1/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0539158A2 (en) * | 1991-10-21 | 1993-04-28 | Canon Kabushiki Kaisha | Method and apparatus for character recognition |
CN1551038A (zh) * | 2003-04-14 | 2004-12-01 | 佳能株式会社 | 字符识别法 |
CN1719454A (zh) * | 2005-07-15 | 2006-01-11 | 清华大学 | 几何代价和语义-识别代价融合的脱机手写汉字切分方法 |
Non-Patent Citations (3)
Title |
---|
JP平1-181177A 1989.07.19 |
JP特开平4-343192A 1992.11.30 |
JP特开平5-20496A 1993.01.29 |
Also Published As
Publication number | Publication date |
---|---|
JP2010044485A (ja) | 2010-02-25 |
KR20100019961A (ko) | 2010-02-19 |
KR101050866B1 (ko) | 2011-07-20 |
JP5146190B2 (ja) | 2013-02-20 |
CN101650779A (zh) | 2010-02-17 |
EP2154632A2 (en) | 2010-02-17 |
EP2154632B1 (en) | 2018-05-23 |
EP2154632A3 (en) | 2012-03-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101650779B (zh) | 字符识别装置以及字符识别方法 | |
US9177205B2 (en) | Image attribute discrimination apparatus, attribute discrimination support apparatus, image attribute discrimination method, attribute discrimination support apparatus controlling method, and control program | |
CN107977394B (zh) | 绘本识别方法及电子设备 | |
CN109597943B (zh) | 一种基于场景的学习内容推荐方法及学习设备 | |
KR101078086B1 (ko) | 문자 인식 장치, 문자 인식 프로그램, 및 문자 인식 방법 | |
WO2014014685A1 (en) | Character recognition of devanagari by redundant decoding of normal characters|and conjunct characters | |
WO2018103450A1 (zh) | 一种基于图像识别的通信方法和装置 | |
KR101462473B1 (ko) | 이미지상의 객체 인식을 통한 검색방법 및 그 검색방법에 의한 검색서버 | |
US20060290789A1 (en) | File naming with optical character recognition | |
CN109902759B (zh) | 图片集描述方法及装置 | |
EP3823270A1 (en) | Video processing method and device, and terminal and storage medium | |
CN113159000A (zh) | 人脸识别方法、装置及系统 | |
CN109919164B (zh) | 用户界面对象的识别方法及装置 | |
CN109299948B (zh) | 一种红包发送方法、装置、可穿戴设备及存储介质 | |
CN111291619A (zh) | 一种在线识别理赔单据中文字的方法、装置及客户端 | |
CN109213515B (zh) | 多平台下埋点归一方法及装置和电子设备 | |
JP2008250818A (ja) | 携帯端末装置用のプログラムおよび携帯端末装置 | |
JP4251643B2 (ja) | 画像撮像装置、および、プログラム | |
CN114997137A (zh) | 一种文档信息抽取方法、装置、设备及可读存储介质 | |
CN114677700A (zh) | 身份标识的识别方法和装置、存储介质及电子设备 | |
JP5223739B2 (ja) | 携帯式文字認識装置、文字認識プログラム及び文字認識方法 | |
JP2007323317A (ja) | 変換装置、変換方法及びプログラム | |
CN110673727A (zh) | Ar远程协助方法及系统 | |
CN111091035A (zh) | 一种科目识别方法及电子设备 | |
US20220075456A1 (en) | System and method for providing electric book based on reading type |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20130123 Termination date: 20190806 |
|
CF01 | Termination of patent right due to non-payment of annual fee |