CN101833661A - 字符识别装置、字符识别程序及字符识别方法 - Google Patents
字符识别装置、字符识别程序及字符识别方法 Download PDFInfo
- Publication number
- CN101833661A CN101833661A CN201010123535A CN201010123535A CN101833661A CN 101833661 A CN101833661 A CN 101833661A CN 201010123535 A CN201010123535 A CN 201010123535A CN 201010123535 A CN201010123535 A CN 201010123535A CN 101833661 A CN101833661 A CN 101833661A
- Authority
- CN
- China
- Prior art keywords
- character
- identification
- character recognition
- recognition
- matched data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Character Discrimination (AREA)
Abstract
提供字符识别装置、字符识别程序及字符识别方法,对包含字符的图像数据,使用简便的操作,实现高速的字符识别。通过便携终端(1),将主要由字母数字组成的第1识别用字母数字字符单元(24a)、由分类字符组成的第1识别用分类字符单元(24b)、以及包含这些字符之外的、字符量比这些字符量多的第2识别用字符单元(24c)可区分地存储,由第1识别用字母数字字符单元(24a)及第1识别用分类字符单元(24b)执行第1字符识别处理(步骤S4),并在该处理中的匹配可靠性较低时(步骤S5~S6),执行至少由第2识别用字符单元(24c)执行字符识别的第2字符识别处理(步骤S7)。
Description
技术领域
本发明涉及识别诸如图像数据所包含的字符的字符识别装置、字符识别程序、及字符识别方法。
背景技术
和英语等相比,日文、中文的字符数非常多,各自的仅第一标准汉字就有3000字以上,加上第2标准汉字则有6000字以上。因此,要识别日文或中文等的字符,在各自的字符识别处理中需要与3000-6000以上的字符进行核对的处理。其结果,对CPU成为负荷很重的处理,特别是在像便携式设备那样的简陋的CPU环境中,处理时间过长成为严重的问题。
另外,作为字符识别的对象,诸如存在名片等记载内容某种程度上被固定的印刷媒体。作为读取这样的字符印刷媒体的字符的装置,提出了识别名片字符的装置(参照特许文献1~3)。
特许文献1的名片识别装置,让用户用笔指定识别图像的范围,然后指定将该范围的识别字符登录到哪个属性(姓名、公司名、地址等)中。
特许文献2的字符识别装置,将字符识别所需的区域作为模板事先登录多个,在选择了模板后,识别由模板确定的区域内的字符。
特许文献3的字符识别装置,是通过键盘指定识别对象的区域,对该对象区域来识别字符。
哪个装置都不是一次处理整个名片,而是仅处理指定了区域的分类部分。因此,对用户希望的分类部分,可以快速地进行识别处理。也就是说,识别处理所进行的范围被压缩在了用户所希望的分类中,所以可以快速进行识别处理,减轻对CPU施加的负荷。
但是,这种以往的技术通过压缩字符识别的范围而缩短了识别处理所需的时间,但对于该压缩后的范围内的字符识别处理本身,并没有缩短时间。
另外,上述这种以往的技术中,有操作费时、繁琐的缺点。具体来说,上述以往的技术,让用户每张名片地指定被字符识别的范围(或模板),需要设定使该范围内的字符对应哪个分类。因此,要输入的名片数越多,越要求用户多次进行繁琐的操作。
另一方面,还提出一种名片OCR处理系统,将名片从终端装置作为图像数据读入,读入所得的图像数据通过通信网络发送到服务器,由服务器进行字符识别,将识别结果再从服务器通过通信网络发送到终端装置(参照特许文献4)。
根据这种方法,即使终端装置的CPU简陋,只要服务器的CPU处理能力强,也可以缩短识别处理时间。
但是,这种使用通信网络的方法,需要通信时间。通信时间随着网络的拥堵程度而为长时间。另外,由于必须进行通信,所以像手机那样进行无线通信的便携终端,还产生在在地下等电波到达不了的场所无法使用的问题。特许文献
【特许文献1】特开平10-55413号公报
【特许文献2】特开平2001-202475号公报
【特许文献3】特开平2-240787号公报
【特许文献4】特开2003-296353号公报
发明内容
鉴于以上问题,本发明的目的在于,提供字符识别装置、字符识别程序及字符识别方法,对包含字符的图像数据,用简便的操作实现高速的识别字符,并提高用户满意度。
本发明提供一种字符识别装置,具有:存储用于字符识别的匹配数据(matching data)的存储部件,获取图像数据的图像数据获取部件,根据所述匹配数据,识别所述图像数据中的字符的字符识别部件,其特征在于,所述匹配数据可区分地构成:预定的有关第1识别用字符的第1识别用匹配数据;以及包含所述第1识别用字符以外的字符的、字符数比该第1识别用字符多的关于第2识别用字符的第2识别用匹配数据,所述字符识别部件执行:第1字符识别处理,对所述图像数据通过所述第1识别用匹配数据进行字符识别;再识别要否判别处理,判别该第1字符识别处理的结果是否符合再识别的条件;以及第2字符识别处理,对通过该再识别要否判别处理判别为需要再识别的再识别对象,通过所述第2识别用匹配数据进行字符识别。
所述匹配数据由表示字符特征的特征数据等构成,可由用于字符识别的匹配的数据构成。
所述存储部件可由硬盘、非易失性存储器等存储数据的部件构成。
所述图像数据可以是彩色图像、灰度图像、二值黑白图像等适当的图像数据。
所述图像数据获取部件是指诸如CCD相机或CMOS相机等摄像部件,或者指从该摄像部件接受用这些摄像部件摄取的字符串图像数据的USB(Universal Serial Bus:通用串行总线)、LAN(Local Area Network:局域网)等通信接口,可由能获取图像数据的适当的部件构成。
所述字符识别部件可以是指,例如,从图像数据中的字符图像提取特征数据,将该特征数据和匹配数据的特征数据进行匹配,并识别是哪个字符的部件。
所述第1识别用字符是指,例如字母数字、判别分类的字符,以及这些字符的多个字符等事先确定的适当的字符。
所述第2识别用字符是指,例如平假名、片假名、汉字,以及这些字符的多个字符等事先确定的适当的字符。
所述字符识别装置是指由具有进行信息处理的CPU等信息处理单元、进行信息存储的存储器等信息存储单元、与外部装置连接的连接接头等接口单元的半导体芯片等装置构成,或者由具有摄像部件、控制部件、存储部件的手机、PDA(Personal Digital Assistant:个人数码助理(掌上电脑))、个人电脑等信息处理终端构成,及类似的适当的装置构成。
依据本发明,可以对图像数据用简便的操作来实现快速的字符识别,提高用户的满意度。
作为本发明的形态,所述字符识别部件执行对所述图像数据内的字符集的分类进行判别的分类判别处理,所述第1识别用匹配数据包含了用于所述分类判别的分类判别用字符。
所述分类判别字符,可以由诸如“E-Mail”、“URL”、“TEL”、“FAX”、“邮政编码”,以及这些字符的多个字符中所使用的字符等用于分类判别的字符来构成。
根据该形态,在第1字符识别处理时也可以执行分类判别。
作为本发明的形态,所述第1识别用匹配数据,对于在所述分类判别用字符中被分类为二个以上的部首的结合字符,包含了将该结合分离成不同要素的部首字符。
所述结合字符可以设为,在字符串方向为左右时,由偏和旁组成的字符,或者在字符方向为上下时,由字头和字身组成。具体地说,例如“话”、“住”、“所”等。
所述部首字符可以设为,在字符方向为左右时,所述结合字符的偏或旁所对应的字符,或者在字符方向为上下时,所述结合字符的字头或字身所对应的字符,具体地说,举例“言”和“舌”、“イ”和“主”、“戸”和“斤”等。
由此,即使一字符的结合字符被误识别为两字符的部首字符,在该误识别的状态下,也能正确判别分类。详细来说,比如一个结合字符“話”被识别成“言”和“舌”,即使字符串被识别成“電言舌”时,仍然可以识别为“電話”的分类。
作为本发明的形态,所述字符识别部件在所述分类判别处理中被判别了分类的字符集内判别是否包含不该被该分类使用的错认字符,并在包含了错认字符时执行将该错认字符修正为分类所使用的字符的修正处理。
由此,例如,将用“电话号码”的分类而识别为字母“Z”的字符可以修正为数字的“2”,从而可以高效地提高识别精度。
作为本发明的形态,所述修正处理通过在包含所述错认字符时,仅将分类所使用的字符作为识别对象再次执行字符识别来进行修正。
由此,由于可以仅用匹配数据中分类所使用的字符数据进行字符识别,因此可以高速、高精度地进行字符识别。
作为本发明的形态,所述第1字符识别处理从可靠性匹配可靠性较高的字符中求得多个字符候选并采用匹配可靠性最高的字符,所述修正处理在包含所述错认字符时,将其修正为在该错认字符的字符候选中的、该分类所使用的字符中匹配可靠性最高的字符。
由此,可以不用再次使用匹配数据进行字符识别而修正为正确的字符,可以高速、高精度地完成字符识别。
本发明可以是字符识别程序,在存储部件中存储匹配数据,所述匹配数据可区分地构成:预定的有关第1识别用字符的第1识别用匹配数据;以及包含所述第1识别用字符以外的字符的、字符数比该第1识别用字符多的有关第2识别用字符的第2识别用匹配数据,使计算机执行:图像数据获取步骤,通过图像数据获取部件获取图像数据;第1字符识别步骤,通过所述第1识别用匹配数据,由字符识别部件对所述图像数据用字符执行字符识别;再识别要否判别步骤,由所述字符识别部件判别该第1字符识别处理的结果是否符合再识别的条件;以及第2字符识别步骤,对通过该再识别要否判别处理判定为需要再识别的再识别对象,通过所述第2识别用匹配数据,由所述字符识别部件执行字符识别。
所述字符识别程序,可以存储在CD(Compact Disk)、DVD(Digital VersatileDisk)、软盘、内存、芯片、硬盘等适当的存储媒体中。
依据本发明,在电脑上安装字符识别程序后,可以对图像数据用简便的操作实现高速的字符识别。
本发明可以是字符识别方法,在存储部件中存储匹配数据,所述匹配数据可区分地构成:预定的有关第1识别用字符的第1识别用匹配数据;以及包含所述第1识别用字符以外的字符的、字符数比该第1识别用字符多的有关第2识别用字符的第2识别用匹配数据,所述字符识别方法执行:图像数据获取步骤,通过图像数据获取部件获取图像数据;第1字符识别步骤,通过所述第1识别用匹配数据,由字符识别部件对所述图像数据用字符执行字符识别;再识别要否判别步骤,由所述字符识别部件判别该第1字符识别处理的结果是否符合再识别的条件;以及第2字符识别步骤,对通过该再识别要否判别处理判定为需要再识别的再识别对象,通过所述第2识别用匹配数据,由所述字符识别部件执行字符识别。
由此,可以对图像数据用简便的操作进行高速的字符识别。
根据本发明,提供字符识别装置、字符识别程序及字符识别方法,对拍摄的名片图像等图像数据,用简便的操作实现高速的字符识别,可以提高用户的满意度。
附图说明
图1是便携终端的立体图。
图2是表示便携终端结构的框图。
图3的(A)~(B)是说明词典数据的结构的说明图。
图4是利用字符识别程序的字符识别处理的流程图。
图5的(A)~(C)是进行字符识别的摄影图像和识别字符的说明图。
符号的说明
1...便携终端、3...图像输入单元、11...CPU、13...RAM、23...字符识别程序、24...比对词典数据、24a...第1识别用字母数字字符单元、24b...第1识别用分类字符单元、24c...第2识别用字符单元
具体实施方式
用以下的图形说明本发明的一实施形态。
图1表示便携终端1的立体图,图2表示便携终端1的结构框图,图3表示词典数据的结构图。
如图1所示,便携终端1设有图像输入单元3、操作单元5、以及画面显示单元7。图像输入单元3是拍摄图像的数码相机,操作单元5是按键操作的按钮,画面显示单元7是显示图像的液晶显示屏或有机EL(电致发光)显示器。
如图2所示,便携终端1除了图像输入单元3、操作单元5、画面显示单元7,还连接到总线16来设有CPU11、ROM12及RAM13。
图像输入单元3为CCD相机或CMOS相机等数码相机,连接到总线16。图像输入单元3拍摄所得的图像作为数字图像数据被发送到CPU11。该数字图像数据也可以最终被保存在另外的存储装置(非易失性存储器等)中。再有,图像输入单元3从CPU11接收拍摄信号而开始拍摄。
操作单元5连接到总线16。该操作单元5将用户的按键操作信号通过总线16发送到CPU11。
画面显示单元7具有显示操作画面的操作画面显示单元7a的功能,以及显示字符识别结果的识别结果显示单元7b的功能。该操作画面显示单元7连接到总线16。从CPU11传送来图像数据后,将该图像数据的图像显示在操作画面显示单元7a或识别结果显示单元7b上。
CPU11是依据ROM12中存储的程序,用RAM13作为临时存储区域来进行各种动作的处理器,具有控制各个部分的控制功能21和字符识别功能22。
该字符识别处理功能22包含字符串提取处理单元31、字符提取处理单元32、字符识别处理单元33、识别可靠性判定处理单元34,分类判别处理单元35、及识别结果修正处理单元36。
字符串提取处理单元31执行从图像数据中提取字符串的处理。该字符串的提取采用适当的方法来执行,例如,将图像数据两值化后获取投影数据,从该投影数据中区分字符串和空白等。具体来说,对于名片等横向书写字符,由每行像素的黑色像素数量算出上下方向的直方图,超过规定数以上的黑像素的行所持续的范围定为字符串,或者,对于明信片的收件人等纵向书写字符,由每列像素的黑色像素数量算出左右方向的直方图,超过规定数以上的黑像素的列所持续的范围定为字符串等适当的方法来执行。
字符提取处理单元32执行从所述字符串提取字符的处理。该字符的提取,对于横向书写字符,由每列像素的黑色像素数量算出左右方向的直方图,超过规定数以上的黑像素所持续的范围定为一字符,或者,对于纵向书写字符,由每行像素的黑色像素数量算出上下方向的直方图,超过规定数以上的黑像素所持续的范围定为一字符等适当的方法来执行。
字符识别处理部33通过使用匹配用词典数据24的匹配信息来判别与哪个字符的匹配信息一致或近似,进行字符识别处理,并且执行求匹配可靠性的处理。在识别该字符的处理中,有包括仅高速地识别以字母数字为主的特定字符的特定字符识别处理和识别所有字符的全文字符识别处理。
识别可靠性判定处理单元34执行判定由字符识别处理单元33求得的匹配可靠性(识别可靠性)是否超过规定的阈值的处理。
分类判别处理35执行用分类判别用词典数据25判别字符串属于哪个分类的处理。
如果在字符串中有在该分类中不被使用的字符,则识别结果修正处理单元36执行将该字符修正为在分类中被使用的字符的处理。
ROM12存储字符识别程序23、比对词典数据24、分类判别用词典数据25。
如图3(A)所示,匹配用词典数据24由字符代码、匹配信息、以及对象分类构成。
字符代码为诸如Shift-JIS等适当方式的字符代码。
匹配信息中各个字符地存储了字符特征数据。
对象分类对一个字符登录多个种类。具体来说,作为对象分类,登录“E-Mail”、“URL”、“TEL”、“FAX”、“邮政编码”等。
该匹配用词典数据24所存储的数据,可区分地存储在第1识别用字母数字字符单元24a、第1识别用分类字符单元24b、以及第2识别使用的字符单元24c中。
第1识别用字母数字字符单元24a主要由字母、数字、符号等欧美类字符组成。
第1识别用分类字符单元24b由用于分类识别的字符组成,即由作为匹配用词典数据24的对象分类登录的“E-Mail”、“URL”、“TEL”、“FAX”、“邮政编码”中的任意一个使用的字符组成。
具体来说,包括对象分类的关键字的“メ”、“-”、“ル”、“ホ”、“ム”、“ペ”、“ジ”、“電”、“話”、“フ”、“ア”、“ッ”、“ク”、“ス”、“郵”、“便”、“番”、“号”等字符。另外,对于这些字符中的“話”、“便”等结合字符,也包括将其偏旁作为一字符的“言”、“舌”、“イ”、“更”等部首字符。
从结合字符分离的部首字符,最好至少在要识别的字符串方向上,部首字符并列成结合字符。所谓字符串方向可以设为,字符是纵方向排列时为纵方向,字符是横方向排列时为横方向等字符排列的适当的方向。
第2识别用字符单元24c,由既不在第1识别用字母数字字符单元24a,也不在第1识别用分类字符单元24b中的字符(主要是日语字符)构成。
第2识别用字符单元24c不包含第1识别用分类字符单元24b,但第2识别用字符单元24c的一部分可以作为第1识别用分类字符单元24b。
如图3的(B)所示,分类判别用词典数据25由分类不同的多个文件构成,在各个文件中,存储着作为该该分类进行判别的字符串。在字符串中,将登录了“電話”和“電言舌”等的、结合字符也作为了部首字符串来存储。分类判别用词典数据25中存储的字符串也可以设为字符代码的罗列。
RAM13临时存储CPU11进行各种控制和演算时使用的数据,同时在图像存储器14中存储字符串图像等图像。
再有,便携终端1中设有进行无线通信的通信天线、输出声音的扬声器、以及采集声音的话筒等。由此,可以作为手机来使用。
如图2的假想线所示,CPU11和ROM12也可以装载在一个芯片15内而作为电子零件来构成。此时,如果在便携终端1中装备了芯片15,就可以简单地追加字符识别功能。
图4是便携终端1的CPU11根据字符识别程序23执行的字符识别处理的流程图,图5是进行字符识别的摄影图像和识别字符的说明图。
首先,作为事前准备,CPU11根据用户的操作输入而被选择名片读取模式等字符识别处理时,通过图像输入单元3成为可进行图像拍摄的状态,在画面显示单元7上显示图5的(A)所示的操作画面显示单元7a。
该操作画面显示单元7包含:识别画面显示单元71,表示是进行字符识别的画面;预览图像显示单元72,动画显示图像输入单元3(相机)拍摄的预览图像;返回按钮73,用于返回到前画面;识别按钮74,用于开始识别处理;以及子菜单按钮75,用于显示子菜单。
用户选择识别按钮74后,CPU11利用图像输入单元3执行图像拍摄,从而获取字符图像(步骤S1)。
CPU11利用字符串提取处理单元31执行字符串提取处理,从字符图像中提取‘字符串(步骤S2)。此时,获取表示公司名部分的字符串、表示姓名部分的字符串、表示地址部分的字符串等多个字符串。
CPU11将在变量‘i’中代入‘0’而进行初始化(步骤S3),对第i提取的字符串,由字符识别处理单元33执行第1字符识别处理(步骤S4)。该第1字符识别处理中,对由字符提取处理单元32从字符串中提取出的各个字符,仅用匹配用词典数据24中的第1识别用字母数字字符单元24a和第1识别用分类字符单元24b,执行字符识别。
再有,字符提取处理单元32所进行的字符提取,相当于提取字符之间的分界的处理。例如对字符串图像,字符部分进行两值化处理以使其成为黑色,在字符串垂直方向将黑色像素进行投影处理,该投影数据的间断处作为字符和字符之间的分界的候选。
第1识别用字母数字字符单元24a由字母数字为中心而构成,第1识别用分类字符单元24b由用于分类判别的字符为中心而构成,所以与匹配用词典数据24的所有字符数相比,数量非常少。因此,第1字符识别处理比起后面所说明的第2字符识别处理,非常高速地完成。
CPU11通过识别可靠性判定处理单元34来判定第1识别处理的匹配可靠性(步骤S5)。这里,匹配可靠性的判定,例如确认各个字符的匹配可靠性,对匹配可靠性最低的字符,如果该匹配可靠性在作为重新识别条件的阈值以上时,则将字符串的匹配可靠性设为OK,如果不是如此,则设为NG。以此类推,求字符串中各个字符的匹配可靠性的平均值,如果该平均值在重新识别条件阈值以上,则将字符串的匹配可靠性设为OK,如果不是如此,则可以设为NG。
再有,判定该匹配可靠性时,对各个字符,可以将多个字符候选按匹配可靠性的从高到低的顺序存储规定个数。
CPU11在匹配可靠性的判定为OK时(步骤S6:“是”),将处理推进到步骤S8。
如果匹配可靠性的判定为NG(步骤S6:“否”),则CPU11对第i提取的字符串,通过字符识别处理单元33执行第2字符识别处理(步骤S7)。在该第2字符识别处理中,使用匹配用词典数据24的所有数据进行字符识别。
再有,也可以仅利用第2识别用字符单元24c进行字符识别,还包括第1字符识别处理中的匹配可靠性而将匹配可靠性最高的字符作为识别出的字符。
另外,在该第2字符识别处理中,从字符串提取字符时,为了不将结合字符错认为多个部首字符,也可以研究字符的边界候选,比第1字符识别处理高精准地分离出一字符。这种情况下,也可以识别一字符的长度,以该字符长度为单位来识别边界。该字符长度是指在字符串方向上一字符的长度,例如,可以设为一字符中的字符串方向上的像素数。由此,可以进一步提高字符的识别精度。
CPU11在变量‘i’上加‘1’(步骤S8),返回到步骤S4重复处理,直到i达到提取的字符串数为止(步骤S9:“是”),。
‘i’达到提取的字符串数时(步骤S9:“否”),CPU11在变量‘i’中代入‘0’进行初始化(步骤S10),对第i提取字符串,通过分类判别处理单元35执行分类判别处理(步骤S11)。
该分类判别处理,通过判别步骤S4、S7识别的字符的排列和分类判别用词典数据25中存储的各个分类的字符的排列是否一致来进行。如果一致(如果匹配可靠性比规定的阈值高),则判定是该分类。
CPU11通过识别结果修正处理单元36执行识别结果修正处理(步骤S12)。该识别结果修正处理,判别在第i提取的字符串中,是否包含在步骤S11判别出的分类中不使用的字符,如果包含,则进行修正。
进行该修正的识别结果修正处理单元36,根据步骤S5中存储的多个字符候选的匹配可靠性,用该分类中使用的字符中匹配可靠性最高的字符进行修正。如果该分类中使用的字符中没有匹配可靠性较高的字符,则仅以该分类中使用的字符为对象再次进行字符识别处理,修正为识别出的字符。
再有,该修正可以通过仅使用匹配用词典数据24中该分类的字符,再次进行字符识别等适当的方法来进行。
CPU11将变量‘i’加‘1’(步骤S13),返回步骤S11重复处理,直到‘i’达到提取的字符串数为止(步骤S14:“是”),。如果‘i’达到提取的字符串数(步骤S14:“否”),则CPU11将如图5的(B)所示的识别结果显示单元7b显示在画面显示单元7上,结束处理。
通过该字符识别处理,如果是图5所示的例子,则被如下处理。
首先,通过字符串提取处理(步骤S2),如图5的(B)所示,识别(1)~(9)的各个字符串。
通过对该(1)~(9)的各个字符串顺序地执行第1字符识别处理(步骤S4),可以识别能够用第1识别用字母数字字符单元24a和第1识别用分类字符单元24b识别的分类字符。也就是说,可以识别(4)的邮政编码、(6)的电话号码、(7)的FAX、(8)的E-Mail、及(9)的URL。
此时,由于在第1识别用分类字符单元24b中,也登录了将结合字符分离为部首的部首字符,如图5的(C)所示,即使在将结合字符的“話”分离成“言”和“舌而分出了字符的情况下,仍照样作为“言”和“舌”来识别。
由于图5(B)的(1)、(2)、(3)、(5)的匹配可靠性较低,所以执行第2字符识别处理(步骤S7),使用全部字符进行字符识别。由此,对于图5(B)的(1)、(2)、(3)、(5)也可进行字符识别。
之后,通过分类判别处理(步骤S11),可以判别各个字符串的分类。在该分类判别时,包含像“電話”这样的结合字符的分类,由于像“電言舌”这样结合字符变为部首字符的字符串也登录在分类判别用词典数据25中,所以可以高精度且容易地识别正确的分类。
也就是说,假如需要正确地识别结合字符,则为了提取字符时不要作为2个字符而需要研究字符的分界候选的处理,从而计算量增多。但是,不进行这样的处理,由于就作为2字符进行识别而判别分类,所以字符的分界只有一种,从而可以高速处理。处理分界的时间的消减量远大于因将结合字符识别为部首字符的集合的比较对象的增加所造成的时间增加量,因而可以缩短整体的处理时间。
而且,通过识别结果修正处理(步骤S12)对判别出的分类的字符串,修正为排除了在该分类中不使用的字符的识别,从而可以进行精度高的字符识别。
具体地说,例如,图5的(B)的(6)的“电话:(075)1234-5678”为分类是“TEL”的字符串。假设在第1字符识别处理中将其错认为“电话:(075)1Z34-5678”,由于“Z”不是分类“TEL”中使用的字符,对其进行修正处理,修正为在“TEL”分类中使用的“2”。由此,不仅提高识别精度,并且可以抑制输出使用户有不谐调感觉的识别结果。
通过以上的结构和动作,可以对图像数据通过简便的操作实现高速的识别字符,可以提高用户的满意度。
执行了受到限定的字符的第1字符识别处理后,由于仅对匹配可靠性比阈值低的字符串执行第2字符识别处理,所以可以减轻演算处理的负荷,即使像日语、中文那样字符数很多的语言,也可以作为整体而高速地进行字符识别。特别地,即使是简陋的CPU,也可以极高速地进行字符识别。
详细来说,在第1字符识别处理中,仅使用英文、数字、符号等欧美类字符(约100字)作为第1识别用字母数字字符单元24a,和更少的第1识别用分类字符单元24b,所以比进行全字符的核对下的情况能够快数倍以上高速地进行处理。
另外在读取名片时,表示“E-Mail”、“URL”、“TEL”、“FAX”、“邮政编码”的字符串一般由英文、数字、符号等欧美类字符组成。其中,特别是“E-Mail”、“URL”,与“姓名”、“公司名”等表示其他信息的字符串相比,多为长字符串。因此,一般在名片中英文、数字、符号等欧美类字符所占比例较大。最初仅对比例较大的英文、数字、符号等欧美类字符执行简单的第1字符识别处理,可以确定表示由这些字符组成的“E-Mail”、“URL”、“TEL”、“FAX”、“邮政编码”的字符串。然后,仅对除此以外的字符串,执行以日语或中文等为对象的重要的第2字符识别处理,其结果,整体上可以提高名片读取的处理速度。
另外,在第1字符识别处理中,通过第1识别用分类字符单元24b,表示分类的关键字的字符也作为对象,所以在第1字符识别处理中就可以准确地识别表示“E-Mail”、“URL”、“TEL”、“FAX”、“邮政编码”的字符串。
详细地说,作为表示“E-Mail”、“URL”、“TEL”、“FAX”、“邮政编码”等分类的关键字,有时在名片中也包含像“メ”“-”“ル”“ホ”“ム”“ペ”“ジ”那样的欧美类以外的字符。比如,“メ一ル:abc@****.co.jp”、“ホ一ムペ一ジ:http://www.****.co.jp”就是如此。
因此,假如在第1字符识别处理时,如果没有第1识别用分类字符单元24b的字符,则识别时的匹配可靠性变差,发生最初无法确定表示“E-Mail”、“URL”、“TEL”、“FAX”、“邮政编码”的字符串。对此,通过使用第1识别用分类字符单元24b,可以解决该问题。
另外,可以削减研究字符的分界的必要性,并高速地进行处理。具体来说,对由偏旁组成的结合字符“話”,要正确地识别,一般地必须进行研究分界的处理,以避免分别识别成两个分离出来的部首字符“言”和“舌”。但英文、数字、符号等欧美类字符没有这样的结合字符,所以不用研究分界。尽管为了识别“E-Mail”、“URL”、“TEL”、“FAX”、“邮政编码”这样的分类字符,但因偶尔混入“電話”等结合字符,所以若对所有字符执行分界研究处理,处理时间变长。
对此,在第1字符识别处理中,由于还登录将结合字符分离成部首的部首字符,因而不必研究字符的分界,可以高速地进行处理。
特别地,包含结合字符的情况,例如受限于“電話”、“邮政编码”的显示等表示分类的显示部分,不包括分类的内容信息(实际的电话号码和邮政编码)。因此,即使该分类的显示部分识别成“電言舌”,只要能知道是“電話”分类即可。利用该特性,还登录结合字符分离出的部首字符并进行识别,结合字符被识别成部首字符并不会产生弊害(例如即使识别成“電言舌”,并不是登录字符“電言舌”),从而可以高速地进行处理。
另外,对识别了分类的字符串,可以执行修正处理,所以提高了识别精度,并且可以抑制输出使用户感觉不谐调的识别结果。
另外,由字符串提取处理单元31提取字符串,直至用分类判别处理单元35判别分类,所以可以削减用户通过操作来指定字符识别区域的时间,和选择操作所指定的区域的分类的时间,可以提高操作的便利性。
再有,字符识别程序23存储在连接到因特网等电通信线路的服务器的存储部件中,可通过电通信线路下载,或者也可以是通过电通信线路作为ASP(Application Service Provider:应用服务提供商)的服务来使用的结构。这种情况下通信负荷加大,但可以减轻服务器演算处理的负荷。
在本发明的结构和上述实施形态的对应中,
本发明的字符识别装置及计算机,对应实施形态的便携终端1,
以下类似,
图像数据获取部件,对应图像输入单元3,
字符识别部件,对应CPU11,
存储部件,对应ROM12,
匹配数据,对应比对词典数据24,
第1识别使用的匹配数据,对应第1识别用字母数字字符单元24a和第1识别用分类字符单元24b,
第2识别用匹配数据,对应第1识别用字母数字字符单元24a、第1识别用分类字符单元24b及第2识别用字符单元24c,
分类判别用字符,对应第1识别用分类字符单元24b,
图像数据获取步骤,对应部步骤S1,
第1字符识别处理及第1字符识别步骤,对应步骤S4,
再识别要否判别处理及再识别要否判别步骤,对应步骤S5-S6,
第2字符识别处理及第2字符识别步骤,对应步骤S7,
分类判别处理,对应步骤S11,
修正处理,对应步骤S12,
第1识别用字符,对应字母、数字、符号、分类字符,
第2识别用字符,对应所有的字符,
但本发明不限定于上述的实施形态的结构,也可以得到多种实施形态。
工业实用性
本发明可以用于识别字符的装置,特别用于名片的读取、明信片和信封的地址读取等从某种程度上记载项目(分类)固定的字符显示媒体识别字符的装置。
Claims (8)
1.一种字符识别装置,具有:
存储用于字符识别的匹配数据的存储部件;
获取图像数据的图像数据获取部件;以及
根据所述匹配数据,识别所述图像数据中的字符的字符识别部件,
所述匹配数据可区分地构成:
预定的有关第1识别用字符的第1识别用匹配数据;以及
包含所述第1识别用字符以外的字符的、字符数比该第1识别用字符多的关于第2识别用字符的第2识别用匹配数据,
所述字符识别部件执行:
第1字符识别处理,对所述图像数据通过所述第1识别用匹配数据进行字符识别;
再识别要否判别处理,判别该第1字符识别处理的结果是否符合再识别的条件;以及
第2字符识别处理,对通过该再识别要否判别处理判别为需要再识别的再识别对象,通过所述第2识别用匹配数据进行字符识别。
2.如权利要求1所述的字符识别装置,
所述字符识别部件执行对所述图像数据内的字符集的分类进行判别的分类判别处理,
所述第1识别用匹配数据包含了用于所述分类判别的分类判别用字符。
3.如权利要求2所述的字符识别装置,
所述第1识别用匹配数据,对于在所述分类判别用字符中被分类为二个以上的部首的结合字符,包含了将该结合分离成不同要素的部首字符。
4.如权利要求2或3所述的字符识别装置,
所述字符识别部件在所述分类判别处理中被判别了分类的字符集内判别是否包含不该被该分类使用的错认字符,并在包含了错认字符时执行将该错认字符修正为分类所使用的字符的修正处理。
5.如权利要求4所述的字符识别装置,
所述修正处理通过
在包含所述错认字符时,仅将分类所使用的字符作为识别对象而再次执行字符识别来进行修正。
6.如权利要求4所述的字符识别装置,
所述第1字符识别处理从匹配可靠性较高的字符中求得多个字符候选并采用匹配可靠性最高的字符,
所述修正处理
在包含所述错认字符时,将其修正为在该错认字符的字符候选中的、该分类所使用的字符中匹配可靠性最高的字符。
7.一种字符识别程序,在存储部件中存储匹配数据,所述匹配数据可区分地构成:预定的有关第1识别用字符的第1识别用匹配数据;以及包含所述第1识别用字符以外的字符的、字符数比该第1识别用字符多的关于第2识别用字符的第2识别用匹配数据,使计算机执行:
图像数据获取步骤,通过图像数据获取部件获取图像数据;
第1字符识别步骤,通过所述第1识别用匹配数据,由字符识别部件对所述图像数据执行字符识别;
再识别要否判别步骤,由所述字符识别部件判别该第1字符识别处理的结果是否符合再识别的条件;以及
第2字符识别步骤,对通过该再识别要否判别处理判定为需要再识别的再识别对象,通过所述第2识别用匹配数据,由所述字符识别部件执行字符识别。
8.一种字符识别方法,在存储部件中存储匹配数据,所述匹配数据可区分地构成:预定的有关第1识别用字符的第1识别用匹配数据;以及包含所述第1识别用字符以外的字符的、字符数比该第1识别用字符多的关于第2识别用字符的第2识别用匹配数据,所述字符识别方法执行:
图像数据获取步骤,通过图像数据获取部件获取图像数据;
第1字符识别步骤,通过所述第1识别用匹配数据,由字符识别部件对所述图像数据执行字符识别;
再识别要否判别步骤,由所述字符识别部件判别该第1字符识别处理的结果是否符合再识别的条件;以及
第2字符识别步骤,对通过该再识别要否判别处理判定为需要再识别的再识别对象,通过所述第2识别用匹配数据,由所述字符识别部件执行字符识别。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP061148/09 | 2009-03-13 | ||
JP2009061148A JP2010217996A (ja) | 2009-03-13 | 2009-03-13 | 文字認識装置、文字認識プログラム、および文字認識方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101833661A true CN101833661A (zh) | 2010-09-15 |
Family
ID=42717725
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201010123535A Pending CN101833661A (zh) | 2009-03-13 | 2010-03-02 | 字符识别装置、字符识别程序及字符识别方法 |
Country Status (3)
Country | Link |
---|---|
JP (1) | JP2010217996A (zh) |
KR (1) | KR101078086B1 (zh) |
CN (1) | CN101833661A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105608453A (zh) * | 2014-11-17 | 2016-05-25 | 株式会社日立信息通信工程 | 字符识别系统及字符识别方法 |
CN106372634A (zh) * | 2015-07-21 | 2017-02-01 | 无锡天脉聚源传媒科技有限公司 | 一种繁体字的识别方法及装置 |
CN108564079A (zh) * | 2018-05-08 | 2018-09-21 | 东华大学 | 一种便携式字符识别装置及方法 |
CN110135425A (zh) * | 2018-02-09 | 2019-08-16 | 北京世纪好未来教育科技有限公司 | 样本标注方法及计算机存储介质 |
CN111476240A (zh) * | 2019-01-24 | 2020-07-31 | 富士施乐株式会社 | 信息处理装置、记录媒体及信息处理方法 |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012144039A1 (ja) * | 2011-04-20 | 2012-10-26 | 株式会社東芝 | 画像処理装置、および方法 |
JP6878034B2 (ja) | 2017-02-10 | 2021-05-26 | キヤノン株式会社 | 情報処理装置、制御方法、およびプログラム |
GB2571530B (en) | 2018-02-28 | 2020-09-23 | Canon Europa Nv | An image processing method and an image processing system |
JP7492226B2 (ja) | 2018-12-13 | 2024-05-29 | 成典 田中 | 移動物追跡装置 |
JP7274322B2 (ja) * | 2019-03-25 | 2023-05-16 | 東芝テック株式会社 | プログラム及び文字認識方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1215201A (zh) * | 1997-10-16 | 1999-04-28 | 富士通株式会社 | 字符识别/修正方式 |
CN1351312A (zh) * | 2000-11-01 | 2002-05-29 | 富士通株式会社 | 字符识别方法、程序以及记录介质 |
CN1741034A (zh) * | 2004-08-25 | 2006-03-01 | 富士施乐株式会社 | 字符识别装置和字符识别方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1055413A (ja) | 1996-08-09 | 1998-02-24 | Matsushita Electric Ind Co Ltd | 名刺認識装置 |
JP2001202475A (ja) | 2000-01-19 | 2001-07-27 | Sharp Corp | 文字認識装置及び文字認識装置の制御方法 |
JP4597644B2 (ja) * | 2003-11-28 | 2010-12-15 | シャープ株式会社 | 文字認識装置、プログラムおよび記録媒体 |
JP4759963B2 (ja) * | 2004-09-22 | 2011-08-31 | 沖電気工業株式会社 | 複数の認識辞書を利用した文字認識装置 |
JP4800144B2 (ja) * | 2006-08-08 | 2011-10-26 | シャープ株式会社 | 文字列判定装置、文字列判定方法、文字列判定プログラムおよびコンピュータ読み取り可能な記録媒体 |
-
2009
- 2009-03-13 JP JP2009061148A patent/JP2010217996A/ja active Pending
-
2010
- 2010-02-05 KR KR1020100010816A patent/KR101078086B1/ko active IP Right Grant
- 2010-03-02 CN CN201010123535A patent/CN101833661A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1215201A (zh) * | 1997-10-16 | 1999-04-28 | 富士通株式会社 | 字符识别/修正方式 |
CN1351312A (zh) * | 2000-11-01 | 2002-05-29 | 富士通株式会社 | 字符识别方法、程序以及记录介质 |
CN1741034A (zh) * | 2004-08-25 | 2006-03-01 | 富士施乐株式会社 | 字符识别装置和字符识别方法 |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105608453A (zh) * | 2014-11-17 | 2016-05-25 | 株式会社日立信息通信工程 | 字符识别系统及字符识别方法 |
CN105608453B (zh) * | 2014-11-17 | 2019-05-03 | 株式会社日立信息通信工程 | 字符识别系统及字符识别方法 |
CN106372634A (zh) * | 2015-07-21 | 2017-02-01 | 无锡天脉聚源传媒科技有限公司 | 一种繁体字的识别方法及装置 |
CN110135425A (zh) * | 2018-02-09 | 2019-08-16 | 北京世纪好未来教育科技有限公司 | 样本标注方法及计算机存储介质 |
CN108564079A (zh) * | 2018-05-08 | 2018-09-21 | 东华大学 | 一种便携式字符识别装置及方法 |
CN108564079B (zh) * | 2018-05-08 | 2022-07-19 | 东华大学 | 一种便携式字符识别装置及方法 |
CN111476240A (zh) * | 2019-01-24 | 2020-07-31 | 富士施乐株式会社 | 信息处理装置、记录媒体及信息处理方法 |
CN111476240B (zh) * | 2019-01-24 | 2023-07-25 | 富士胶片商业创新有限公司 | 信息处理装置、记录媒体及信息处理方法 |
Also Published As
Publication number | Publication date |
---|---|
KR101078086B1 (ko) | 2011-10-28 |
JP2010217996A (ja) | 2010-09-30 |
KR20100103351A (ko) | 2010-09-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101833661A (zh) | 字符识别装置、字符识别程序及字符识别方法 | |
Koga et al. | Camera-based kanji ocr for mobile-phones: Practical issues | |
EP1917636B1 (en) | Method and system for image matching in a mixed media environment | |
CN100388628C (zh) | 基于偏旁的自适应笔划顺序方法和系统 | |
KR102373884B1 (ko) | 텍스트 기반 이미지 검색을 위한 이미지 데이터 처리 방법 | |
KR101552525B1 (ko) | 폰트를 인식하고 폰트정보를 제공하는 시스템 및 그 방법 | |
JP4991407B2 (ja) | 情報処理装置、その制御プログラムおよび該制御プログラムを記録したコンピュータ読み取り可能な記録媒体、ならびに制御方法 | |
EP1917637A1 (en) | Data organization and access for mixed media document system | |
CN111553191A (zh) | 基于人脸识别的视频分类方法、装置及存储介质 | |
US8218876B2 (en) | Information processing apparatus and control method | |
JP5239419B2 (ja) | 文字認識プログラム、文字認識電子部品、文字認識装置、文字認識方法、およびデータ構造 | |
JP4597644B2 (ja) | 文字認識装置、プログラムおよび記録媒体 | |
JP4800144B2 (ja) | 文字列判定装置、文字列判定方法、文字列判定プログラムおよびコンピュータ読み取り可能な記録媒体 | |
JP2009276937A (ja) | 辞書作成装置、認識装置、認識方法及び認識プログラム | |
US10706581B2 (en) | Image processing apparatus for clipping and sorting images from read image according to cards and control method therefor | |
KR101773064B1 (ko) | 이미지 형태의 컨텐츠의 가독성 향상을 위한 장치 및 방법 | |
JP5090983B2 (ja) | 情報処理装置、情報処理方法、情報処理プログラム、及びこのプログラムを記録したコンピュータ読取可能な記録媒体 | |
CN112789624A (zh) | 字符候选提议装置、手写字符辨别系统、方法及程序 | |
JP2005044052A (ja) | 携帯型文字認識装置 | |
CN117493645B (zh) | 一种基于大数据的电子档案推荐系统 | |
US10776617B2 (en) | Sign-language automated teller machine | |
JP2001147990A (ja) | 画像データ処理装置及び方法並びにこれに利用される記憶媒体 | |
JP7268316B2 (ja) | 情報処理装置及びプログラム | |
JP2008123244A (ja) | 画像処理装置及び画像処理プログラム | |
JP2010218043A (ja) | 文字情報取得装置、文字情報取得プログラム、および文字情報取得方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C12 | Rejection of a patent application after its publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20100915 |