CN102110229A - 单词识别方法和信息处理装置 - Google Patents

单词识别方法和信息处理装置 Download PDF

Info

Publication number
CN102110229A
CN102110229A CN2010105219286A CN201010521928A CN102110229A CN 102110229 A CN102110229 A CN 102110229A CN 2010105219286 A CN2010105219286 A CN 2010105219286A CN 201010521928 A CN201010521928 A CN 201010521928A CN 102110229 A CN102110229 A CN 102110229A
Authority
CN
China
Prior art keywords
word
character
candidate
character string
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2010105219286A
Other languages
English (en)
Other versions
CN102110229B (zh
Inventor
相泽知祯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Omron Corp
Original Assignee
Omron Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Omron Corp filed Critical Omron Corp
Publication of CN102110229A publication Critical patent/CN102110229A/zh
Application granted granted Critical
Publication of CN102110229B publication Critical patent/CN102110229B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/26Techniques for post-processing, e.g. correcting the recognition result
    • G06V30/262Techniques for post-processing, e.g. correcting the recognition result using context analysis, e.g. lexical, syntactic or semantic context
    • G06V30/268Lexical context
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

提供一种单词识别方法和信息处理装置,能够缩短用于确定对应于识别对象的字符串的单词的处理。若对识别对象字符串的图像,以每个构成字符,与可靠度一同导出一个以上的候选字符,则单词识别处理部(105)将构成字符数与识别对象字符串一致的单词初始设定为候选单词之后,将识别对象字符串的各个字符按字符的排列顺序以一个字符一个字符设定为处理对象,从而对处理对象的每个字符执行两种筛选处理。在第1筛选处理中,从对处理对象的字符设定的候选字符中提取获得满足预定条件的可靠度的候选。在第2筛选处理中,从当前时刻的候选单词中,提取与识别对象字符串中的处理对象的字符相同位置的字符和通过第1筛选处理而筛选出的候选字符一致的单词。然后,从最终筛选出的候选单词中确定对应于识别对象字符串的单词。

Description

单词识别方法和信息处理装置
技术领域
本发明涉及以下技术:根据将通过由照相机或作图处理等而生成的字符串的图像作为对象的识别处理,构成字符串的各个字符的候选字符分别与可靠度一同导出的情况,识别对应于字符串的单词。
背景技术
在一般的字符识别处理中,将识别对象的字符串的图像进行2值化之后,从2值图像中分别切出与各个字符对应的区域,并将各个区域的图像分别与以字符的每个种类注册的样本图像进行比对,将与在获得最高相似度时使用的样本图像对应的字符确定为对应于图像中的字符的字符。
但是,由于存在根据处理对象的图像的状态而发生错误识别的情况,所以提出了考虑了这个点的识别处理方法。例如,在专利文献1中,记载了使用通过识别的字符而生成的字符串来检索词典,若在词典中有与检索对象的字符串相同的字符串,则判定为识别结果正确并确定字符串,在找不到与检索对象的字符串相同的字符串的情况下,重新进行字符识别处理。
此外,在专利文献2中,记载了以下等:对在字符识别对象数据中包含的每个字符生成多个识别候选字符和识别可靠度的组合之后,将各个识别候选字符组合成多个组而生成候选单词;依次使用优先度高的候选单词而检索单词词典,筛选在单词词典中包含的信息(词典单词);从筛选出的词典单词中选定与候选单词的相似度最高的单词。
【专利文献1】特开平5-46814号公报
【专利文献2】特开2006-163830号公报
如上述的各个文献所述,若采用通过候选字符的组合而比对单词数据库的方法,则存在设定多个组合,从而处理时间变长的顾虑。关于这一点,以下使用具体例子进行说明。
图10(1)是作为字符识别对象的图像的例子,表示通过拍摄“三三九度”这样的字符串而生成的图像。图10(2)是通过对于该图像中的4个字符的识别处理而导出的候选字符化为表的形式而制成表的图,在该例子中,作为对每个字符获得5个候选字符,将这些候选字符按照可靠度由高到低的顺序配置。
另外,在该说明书中所称的可靠度,基于在将从图像切出的字符区域与字符的样本图像比对时所获得的两者之间的相似度而设定。
根据图10(2)的例子,对识别对象的字符串的第2个字符“三”和第4个字符“度”,正确的字符分别设定为第1位的候选字符,但对于第1个字符“三”和第3个字符“九”,错误的字符分别设定为第1位的候选字符。
图10(3)相关联而示出图10(2)所示的各个候选字符的组合例子和使用通过组合而生成的字符串比对了单词数据库的结果(X标记表示没有找到对应的单词的情况,O标记表示找到了对应的单词的情况)。在该例子中,将各个候选字符以可靠度由高到低的顺序选择而设定组合,且每次以一个字符一个字符变更组合中的候选字符而与单词数据库内的单词比对,但由于上位的候选字符设定为错误的字符,所以比对不能顺利成功。因此,用于确定正确的单词需要相当长的时间。此外,若根据该方法,识别对象的字符串的字符串长度越长,则候选字符的组合数越增加,处理所需的时间也越长。
这样,在上述的方法中,存在虽然能够识别正确的单词,但处理时间相当长的可能性,所以难以应用于将其他处理并列执行的类型的设备。例如,在设定了字符识别功能的便携电话中,在进行字符识别处理时受到被叫的情况下,需要进行通知被叫的效果音的输出和显示,但若字符识别处理延长,则存在不能迅速地进行被叫的报告,对便携电话的基本功能产生妨碍的顾虑。
发明内容
本发明是着眼于上述的问题而完成的,其课题在于,缩短用于确定对应于识别对象的字符串的单词的处理时间。
本发明的单词识别方法是,作为字符串图像的识别处理结果,在构成字符串的每个字符取得了一个以上的候选字符后,使用注册了多个单词的单词数据库来识别对应于字符串的单词的方法。另外,在对于字符串的图像的识别处理中,优选对各个候选字符设定基于通过与字符识别时的样本图像的比对而导出的相似度的可靠度。表示可靠度的高度的数值,存在可靠度越高则变化为越大的值的情况,也有可靠度越高则变化为越小的值的情况。
在本发明的单词识别方法中,将在单词数据库中包含的规定数的单词设定为初始的候选单词。并且,在每次将构成识别对象的字符串的各个字符以一个字符一个字符设定为处理对象,并且设定处理对象的字符时,将该设定时的候选单词作为对象,执行将候选单词筛选为如下结构的单词的处理,即,在识别对象的字符串中,在与配置处理对象的字符的位置相同的位置配置对该处理对象的字符所取得的候选字符。
另外,“将在单词数据库中包含的规定数的单词设定为初始的候选单词”的处理,除了意味着将在单词数据库中包含的一部分单词作为初始的候选单词而提取的处理之外,还意味着将在单词数据库中包含的全部单词设定为初始的候选单词的处理。即,既可以对在单词数据库中包含的一部分单词作为对象进行第一次筛选处理,也可以对在单词数据库中包含的全部单词作为对象进行第一次筛选处理。
进而,在本发明的单词识别方法中,在结束了对于识别对象的字符串中的最后的处理对象的字符的筛选处理时,从在该时刻提取出的候选单词中确定对应于所述字符串的单词。
通过上述的方法,即使最初多个单词与对于识别对象的字符串的相似程度无关地设定为候选单词,通过将构成识别对象的字符串的各个字符以一个字符一个字符设定为处理对象,对处理对象的每个字符进行候选单词的筛选处理,候选单词也依次减少。此外,即使在当初的候选单词中包括了一部分字符与候选字符一致的单词的情况下,这样的单词也通过对于处于其他位置的、与候选字符不一致的字符的筛选处理而从候选单词中排除。因此,最终能够仅将如下结构的字符串并且是作为单词而注册在单词数据库中的单词作为候选单词而留下,即,与识别对象的字符串的各个构成字符对应的候选字符分别和对应的构成字符配置在相同位置。
此外,通过该方法,不是如以往那样以字符串的单位进行比对,而是将单词中的一个字符与候选字符进行比对即可,所以能够减轻比对中的负担。进而,随着处理的进行,比对对象的候选单词数减少,所以与以往相比,能够大幅缩短处理时间。
在上述方法的优选的实施方式中,在每次设定处理对象的字符时,从通过识别处理而对该处理对象的字符所取得的候选字符中,提取在该识别处理中获得了超过基于预定条件的容许值的可靠度的候选字符,将对象仅限定为提取出的候选字符,从而执行筛选候选单词的处理。
即使在字符识别中产生错误而不能将正确的字符设定为第1位的候选字符的情况下,若是正确的字符,则也能够获得某种程度的可靠度。因此,例如,基于试验性的字符识别的结果,设定能够将正确的字符作为候选字符而稳定地提取的条件,并从对处理对象的字符所取得的候选字符中提取获得了超过基于上述条件的容许值的可靠度的候选字符,则能够防止对应于识别对象的字符串的单词从候选单词中排除,并且能够限定候选字符数。
更优选地,也可以将获得了超过规定的阈值并且与对应于处理对象的字符的候选字符中最大的可靠度之差在预定的一定值以内的可靠度,作为提取候选字符的条件。若设定这样的条件,则即使是获得了超过阈值的可靠度的候选字符,也能够将该可靠度与最大的可靠度之差大的候选字符从筛选范围中排除,所以能够削减成为干扰的可能性高的候选字符。
在其他的优选方式的单词识别方法中,在所述单词数据库中注册的单词中,将构成字符数与所述识别对象的字符串一致的单词设定为初始的候选单词。若这样设定,即使最初是构成字符数与识别对象的字符串一致的单词全部设定为候选单词,但通过依次将识别对象的字符串的各个构成字符设定为处理对象而进行筛选处理,最终能够将候选单词筛选为对应于各个构成字符的候选字符分别与对应的构成字符配置在相同位置的字符串且作为单词而注册在单词数据库的候选单词。
在其他的优选方式的单词识别方法中,在结束了对于识别对象的字符串中的最后的处理对象的字符的筛选处理时提取出多个候选单词的情况下,对这些候选单词的每个候选单词,计算与构成该候选单词的各个字符对应的候选字符的可靠度的平均值,并将可靠度的平均值最高的候选单词确定为对应于字符串的单词。
一般,与识别对象的字符串完全一致的单词中,全部的构成字符处于在字符识别处理时获得高的可靠度的状态,所以可靠度的平均值比其他类似结构的单词高的可能性高。因此,通过在最终留下的候选单词中,将可靠度的平均值最高的候选单词确定为对应于字符串的单词,从而能够提高能够正确地识别对应的单词的概率。
接着,本发明的单词识别用的程序是用于使如下的计算机进行识别对应于所述字符串的单词的处理的程序,在所述计算机中设定了注册有多个单词的单词数据库,且作为对于字符串的图像的识别处理的结果,对构成该字符串的每个字符取得了一个以上的候选字符,其特征在于,使计算机作为以下的初始设定部件、筛选部件、单词确定部件、输出部件起作用。
初始设定部件,将在单词数据库中注册的规定数的单词初始设定为候选单词。另外,初始设定部件既可以将在单词数据库中包含的一部分单词设定为初始的候选单词,也可以将在单词数据库中包含的全部单词设定为初始的候选单词。
筛选部件,在每次将构成识别对象的字符串的各个字符以一个字符一个字符设定为处理对象,并且设定处理对象的字符时,将该设定时的候选单词作为对象,执行将候选单词筛选为如下结构的单词的处理,即,在识别对象的字符串中,在与配置处理对象的字符的位置相同的位置配置对该处理对象的字符所取得的候选字符。
单词确定部件,在结束了对于识别对象的字符串中的最后的处理对象的字符的筛选处理时,从在该时刻提取出的候选单词中确定对应于所述字符串的单词。输出部件,将通过单词确定部件所确定的单词作为识别结果而输出。
通过上述的程序,能够对具有字符识别功能的计算机进一步设定用于确定对应于识别对象的字符串的单词的功能,从而能够高精度且快速实施用于识别对应于识别对象的字符串的单词的处理。
输出部件,例如作为将通过单词确定部件所确定的单词显示在监视器的部件而构成,但并不限定于此,也还可以输出用于表示确定的单词的电子数据。此外,在字符识别处理中,在导出的各个候选字符中优先选择可靠度高的候选字符而组合识别字符串的情况下,上述的程序中还可以包括使计算机作为通过确定的单词来校正识别字符串的部件起作用的程序。
本发明的信息处理装置包括注册了多个单词的单词数据库;进行对于字符串的图像的识别处理,从而对构成该字符串的每个字符取得一个以上的候选字符的字符识别部件;以及使用所述单词数据库和所述字符识别部件的识别结果,识别对应于所述字符串的单词的单词识别部件。并且,本发明的信息处理装置具备上述的程序的初始设定部件、筛选部件、单词确定部件以及输出部件的各个部件。
通过本发明,基于通过对于字符串的图像的识别处理而取得的候选字符,从单词数据库中高效率地筛选候选单词,从而能够快速实施用于确定对应于图像中的字符串的单词的处理。
附图说明
图1是表示安装了字符识别用的应用程序的便携电话的外观的图。
图2是表示上述的便携电话的结构的方框图。
图3(1)~(2)是表示通过字符识别用的应用程序而提示的画面的例子的图。
图4是表示字符识别用的应用程序的结构的功能方框图。
图5是将对于识别对象字符串的字符识别处理的结果作为表的形式而制成表的图。
图6是表示通过基于候选字符的比对处理而筛选出候选单词的情况的图。
图7是表示通过字符识别处理部而执行的处理的步骤的流程图。
图8是表示接着图7的处理的步骤的流程图。
图9是表示未能进行单词的识别的情况下的显示画面的例子的图。
图10(1)~(3)是关于以往的识别处理,表示识别对象的字符串的图像、候选字符的设定例子、以及候选字符的组合和比对结果的对应关系的图。
标号说明
1便携电话
2照相机
3显示部
11CPU
12主存储器
13操作用存储器
100字符识别用的应用程序
101字符识别用数据库
102单词数据库
103前处理部
104字符识别处理部
105单词识别处理部
107显示控制部
具体实施方式
图1表示应用了本发明的便携电话的外观,图2表示该便携电话的电结构。
本实施例的便携电话1是在设置了显示部3和操作部4的壳体1A的内部容纳了照相机2、图像处理器5、通信线路6、控制电路10等的结构。显示部3由液晶面板构成,在操作部4中配置有包括数字键的多个键。
照相机2是具有CCD或CMOS的数字照相机,经由图像处理器5连接到控制部10。图像处理器5基于来自控制部10内的CPU11的指令而驱动照相机2,并将从照相机2输出的图像数据输出到CPU11。
在控制部10中除了CPU11之外,还包括主存储器12、操作用存储器13等。主存储器12是闪速存储器等的非易失性存储器,保存有程序或设定用的数据等。另一方面,操作用存储器13是易失性存储器(RAM),被用于将通过照相机2生成的图像数据、后述的候选字符、候选单词等暂时保存的目的。
在上述的便携电话1的控制部10中,安装了通过以字符串作为对象进行拍摄而生成的图像作为对象来执行字符识别的应用程序。图3表示根据识别处理而在显示部3中提示的画面的一例。
在该例子的画面上,除了显示从照相机2输入的图像的区域30之外,还设置有用于显示消息或识别结果等的区域31、表示操作对象的键的功能的区域32。
图中的左侧的画面(1)表示实施一系列的识别处理之前的状态,在区域30内显示的图像中,表示识别对象的字符串的提取范围的框R被重叠显示。此外,在区域31中,显示了用于催促识别对象范围的指定的消息。对于该显示,用户确认框R的范围,根据需要进行修正,并进行确定操作。根据该操作,执行用于识别框R内的字符串的处理,画面从(1)的状态变化到(2)的状态。变化后的画面的区域31被分割为显示已识别的字符串的栏31a和显示该字符串的词典数据的栏31b,在各个栏分别显示对应的信息。
图4是表示上述的字符识别用的应用程序的结构的功能方框图。该应用程序100包括:字符识别用数据库101、单词数据库102、前处理部103、字符识别处理部104、单词识别处理部105、识别结果校正部106、显示控制部107等。其中,字符识别用数据库101和单词数据库102是存储在主存储器12中的数据文件,其他结构的实体是通过存储在主存储器12中的程序而动作的CPU11。
在字符识别用数据库101中,多种字符的样本图像与表示该字符的数据(JIS码等的码信息)相关联而注册。在单词数据库102中,关于多个单词,分别注册了表示该单词的表述的字符串和表示含义等的词典数据。
若该应用程序100启动,则图像处理器5在每个一定时间使照相机进行拍摄,并将生成的图像输出到应用程序100。前处理部103获取从图像处理器5输出的每个时刻的图像,提取对于一个阶段之前的图像的变化量。进而,若提取出的变化量成为比阈值低的状态,则前处理部103从该时刻的图像提取包括字符串的区域,并将该区域的位置和大小联络到显示控制部107。
显示控制部107使在显示部3中呈现图3所示的画面,并在区域30内显示从图像处理器5提供的图像。此外,若通过来自前处理部103的联络而取得包括字符串的区域的位置和大小,则执行基于这些信息而在显示中的图像中重叠显示框R或者在区域31内显示消息等的处理。
若用户对上述的画面显示进行用于确定由框R所表示的识别对象范围的操作,则通过字符识别处理部104执行对于确定的范围内的图像的识别处理。该处理与以往相同,但以下简单说明。
首先,字符识别处理部104将框R内的图像进行2值化,并沿着水平、垂直的各个方向对2值图像进行投射,从而提取对应于各个字符的区域(字符区域)。接着,对提取出的每个字符区域,将该区域内的图像与字符识别用数据库101内的各个字符的样本图像进行比对而计算相似度,并将对应于相似度超过规定阈值的样本图像的字符设定为候选字符。进而,对设定的候选字符,将在上述的比对处理时算出的相似度作为可靠度进行组合。由此,在字符串包含在指定的范围的情况下,能够对构成该字符串的每个字符获得一组以上的候选字符和可靠度的组合。进而,本实施例的字符识别处理部104将各个字符的第1位的候选字符进行组合,将通过该组合而生成的字符串设定为表示识别结果的字符串。
以下,将成为该字符识别处理部104的识别对象的字符串(包含在框R内的字符串)称为“识别对象字符串”,将通过字符识别处理部104而设定为识别结果的字符串称为“识别结果字符串”。在本实施例中,将识别结果字符串提供给识别结果校正部106,并且将各个字符的候选字符和可靠度的组合提供给单词识别处理部105。单词识别处理部105基于提供的信息,与识别结果字符串无关地确定对应于识别对象字符串的单词。识别结果校正部106将通过单词识别处理部105所确定的单词与识别结果字符串进行比较,在两者不一致的情况下,由单词识别处理部105所确定的单词来置换识别结果字符串。
单词识别处理部105使用由字符识别处理部104所设定的候选字符,进行使用了单词数据库102的比对处理,从而渐渐地筛选有对应于识别对象字符串的可能性的单词的候选(以下,称为“候选单词”)。进而,单词识别处理部105从最终筛选出的候选单词中确定对应于识别对象字符串的单词,从单词数据库102中读出该单词的词典数据。确定的单词提供给识别结果校正部106,词典数据提供给显示控制部107。
显示控制部107使用经过了识别结果校正部106的处理的识别结果字符串和从单词识别处理部105提供的词典数据,显示图3的画面(2)。由此,对用户通知识别结果。
图5是将字符识别处理部104对于包含在图3的画面(1)中指定的范围内的字符串(识别对象字符串)的识别结果作为表的形式而制成表的图。在本实施例中,设为“三三九度”这样的识别对象字符串的4个构成字符被正确地切开,且对每个字符设定了5个候选字符。在图5中,对每个构成字符,将各个候选字符分别与可靠度相关联并按照可靠度由高到低的顺序排列。另外,可靠度的单位是%。
图6表示使用将比对对象的单词以纵列排列的列表,单词识别处理部105进行基于上述的候选字符的比对处理,从而筛选候选单词的情况。另外,在图中的列表中,由1、2、3、4的号码来表示各个单词的构成字符的位置。
在本实施例中,从注册在单词数据库102中的单词中提取与识别对象字符串相同的字符串长度的单词,并将这些单词设定为初始的候选单词。图6的列表A表示该初始状态的候选单词。
在本实施例中,将通过字符识别处理部104所提取的4个字符从开头开始依次设定为处理对象,并对处理对象的每个字符执行以下2组的筛选处理。
在第1筛选处理中,以
(1)获得60%以上的可靠度,
(2)对处理对象的字符所取得的可靠度的最大值与(1)的可靠度之差在20%以内,将这两个作为条件,从设定为处理对象的字符的候选字符中提取出满足条件(1)和(2)的字符。
在第2筛选处理中,将当前设定为有效的候选单词作为对象,将配置在与识别对象字符串中的处理对象的字符相同位置的字符和通过第1筛选处理而提取的候选字符进行比对,并提取两者一致的候选单词,将其他的候选单词排除。通过该比对处理,成为比对的对象的候选单词被逐渐削减,最终仅留下与通过第1筛选处理而筛选出的候选字符的组合一致的结构的单词。
图6的列表B~E分别表示将识别对象字符串的第1个、第2个、第3个、第4个字符作为处理对象,执行了包括候选字符和候选单词的比对处理的上述的筛选处理的结果。具体地说,对通过比对而识别出与候选字符的一致的字符的显示栏涂上图案,而对通过比对而未识别出与候选字符的一致并从候选单词排除的单词画上二重线。即使设定了涂上图案,也画上了二重线的单词,中途从候选单词中排除。
具体参照图5和图6说明通过单词识别处理部105而实施的处理的概要。
首先,基于图5,在将识别对象的字符串的开头字符(第1字符)作为处理对象,执行第1筛选处理的情况下,基于上述的(1)和(2)的条件,提取可获得85%至65%的范围的可靠度的候选字符。具体地说,在本例子中,提取出图中的“五”、“玉”、“王”、“三”、“二”的5个候选字符的全部。在此之后的第2筛选处理中,将初始的候选单词(图6的列表A)的第1个字符与上述5个候选字符进行比对,仅将识别出与任一个候选字符的一致的单词留作候选单词。
基于图6,在将第1字符作为处理对象的第2筛选处理中,对作为第1位的候选字符的“五”找出“五三昧所”、“五时五教”、“五日一石”的各个单词,对第3位的“王”找出“王道樂土”,对第4位的“三”找出“三五之隆”、“三顧之礼”、“三三九度”、“三三五五”的各个单词,对第5位的“二”找出“二度三度”、“二人三脚”的各个单词。因此,如图6的列表B所示那样,找出的10个单词留作候选单词,其他的单词从候选单词中排除。
接着,在将识别对象的字符串的第2个字符(第2字符)作为处理对象的情况下,在第1筛选处理中,提取可获得93%至73%的范围的可靠度的候选字符。因此,提取出“三”、“五”、“日”的3个候选。在第2筛选处理中,将通过对于第1字符的处理而筛选出的候选单词的第2个字符与这些候选字符进行比对,但在图中的列表B中,通过该比对而找出候选字符的是“五三昧所”、“五日一石”、“三五之隆”、“三三九度”、“三三五五”的5个。因此,如图6的列表C所示,候选单词被筛选为这5个单词,其他的单词(“王道樂土”、“五时五教”、“三顧之礼”、“二度三度”、“二人三脚”)从候选单词中排除。
在将识别对象的字符串的第3个字符(第3字符)作为处理对象的情况下,在第1筛选处理中,提取可获得89%至69%的范围的可靠度的候选字符。因此,提取出“丸”、“九”、“之”的3个候选。在第2筛选处理中,将通过对于第2字符的处理而筛选出的候选单词的第3个字符与这些候选字符进行比对,但在图中的列表C中,通过该比对而找出的是“三五之隆”和“三三九度”的2个单词。因此,如图6的列表D所示,候选单词被筛选为这2个单词,“五三昧所”、“五日一石”、“三三五五”从候选单词中排除。
在将识别对象的字符串的第4个字符(第4字符)作为处理对象的情况下,在第1筛选处理中,提取可获得95%至75%的范围的可靠度的候选字符。因此,提取出“度”、“庚”的2个候选。在第2筛选处理中,将通过对于第3字符的处理而筛选出的候选单词的第4个字符与这些候选字符进行比对,但在图中的列表D中,通过该比对而找出候选字符的仅仅是“三三九度”。因此,如列表E所示,在结束了对于识别对象字符串的全部字符的处理的时刻留作候选单词的仅仅是“三三九度”。
由此,在图5、6的例子中,将识别对象的字符串的各个构成字符从开头起依次设定为处理对象,对处理对象的每个字符执行第1和第2筛选处理,从而最终成为从4字符构成的单词中仅仅“三三九度”被筛选为候选单词的状态。因此,通过将该最终的候选单词确定为对应于识别对象的字符串的单词,从而能够正确地识别字符串。
如上所述,通过第1筛选处理,对识别对象字符串的每个构成字符,候选字符被筛选为只有对应于该字符的可能性高的字符,通过第2筛选处理,成为只有将筛选的候选字符进行组合的结构的字符串留作候选单词。因此,能够简单地确定对应于识别对象字符串的单词。此外,在第2筛选处理中,使用被限缩的数目的候选字符进行将一个字符作为对象的比对即可,且随着处理的进行,比对对象的候选单词数减少,所以与以往的比对处理相比,能够大幅缩短处理时间。
此外,在处理中受到被叫的情况下,还可以根据在该时刻的剩余的处理对象字符的数目和满足条件(1)、(2)的候选字符的数目以及候选单词的数目等,估计能够执行被叫的报告处理为止的时间。因此,由于能够基于该估计而进行有关被叫的报告的准备,所以能够防止对于被叫的响应大幅延迟的情况。
图7和图8表示通过单词识别处理部105而执行的处理的细节的步骤。以下,沿着该流程图,详细说明为了确定对应于识别对象字符串的单词而单词识别处理部105所执行的处理。
在该处理中,首先,从单词数据库102中提取对应于识别对象字符串的字符长度的单词,并将提取出的单词存储在操作用存储器13中(步骤S1)。此外,将此时的单词的提取数分别存储在单词总数W_num以及有效单词数TR_num中(步骤S2)。
接着,在该实施例中,由排列W(k)(k取1至W_num的值)来管理存储在操作用存储器13中的各个单词是否作为候选单词而被有效化。步骤S3将该排列W(k)的各个元素全部设定为“TRUE”,即设定为有效。在接下来的步骤S4中,将用于确定识别对象字符串中的字符的计数器i设定为“1”。由此,识别对象字符串的第1字符被设定为处理对象。
在步骤S5中,从对识别对象字符串的第i个字符设定的候选字符中,提取满足上述的条件(1)、(2)的字符。该处理相当于第1筛选处理。
之后,对表示比对对象的单词的计数器k设置初始值的“1”(步骤S6),以下,一边根据该k值而依次注目各个单词,一边执行比对处理(步骤S7~S13)。基于该步骤S7~S13的循环的处理相当于第2筛选处理。
说明该循环内的具体处理。首先,检验排列W(k)的值,若W(k)为TRUE(有效),则将第k个单词的第i个字符与在步骤S5中提取出的各个候选字符进行比对(步骤S8)。其中,在比对对象的字符与任一个候选字符一致的情况下(步骤S9为“是”),通过将计数器k加1,从而将比对对象变更为下一个单词(步骤S12)。另一方面,在比对对象的字符与任一个候选字符都不一致的情况下(步骤S9为“否”),执行将W(k)设定为FALSE(无效)的处理(步骤S10)和将有效单词数TR_num减1的处理(步骤S11)之后,进入步骤S12。通过步骤S10、S11的处理,第k个单词成为从候选单词排除的状态。
在识别对象字符串的第1个字符设定为处理对象的阶段,由于在步骤S1中提取出的全部单词设定为候选单词,所以对任一个单词都执行步骤S8、S9。因此,各个单词被划分为维持作为候选单词的单词和从候选单词排除的单词。若该划分处理结束(步骤S13为“否”),则通过将计数器i加1,将处理对象的字符变更为第2字符(步骤S14)。
对第2个到末尾的各个字符也通过与上述相同的步骤执行第1筛选处理(步骤S5)和第2筛选处理(步骤S7~S13)。由此,实现在图6中例示的候选单词的筛选。
若对于全部字符的处理结束而i的值成为超过识别对象字符串的字符串长度的状态(步骤S15为“否”),则检验在该时刻的有效单词数TR_num的值。其中,在TR_num成为0,即没有候选单词的情况下(步骤S16为“否”),单词识别处理部105对识别结果校正部106和显示控制部107联络没有对应于识别对象字符串的单词的意旨(步骤S17)。
相对于上述,在TR_num>0的情况下(步骤S16为“是”),单词识别处理部105基于值被设定为TRUE的排列W(k)的k的值,提取被筛选为候选单词的单词(步骤S18)。其中,在TR_num=1,即被筛选的候选单词为1的情况下(步骤S19为“否”),将在上述的步骤S18中提取的单词确定为对应于识别对象的字符串的单词(步骤S22)。
另一方面,在TR_num>1,即最终留下多个候选单词的情况下(步骤S19为“是”),对这些单词分别计算各个构成字符的可靠度的平均值(步骤S20),并将平均值最高的单词确定为对应于识别对象字符串的单词(步骤S21)。另外,在步骤S20中,作为各个构成字符的可靠度,使用与该构成字符一致的候选字符进行组合的可靠度。
在基于字符识别处理部104的字符识别处理中,如图5的例子所示,有虽然是正确的字符但未作为第1位的候选字符而识别的字符。但是,在提取出的候选字符的组合中构成具有含义的字符串的组合被限定,且在其中,对正确的字符的组合而求出的可靠度的平均值比对其他组合求出的可靠度的平均值高的可能性高。因此,在最终留下多个候选单词的情况下,通过进行步骤S20和S21的处理,能够高概率地确定正确的单词。
在最后的步骤S23中,单词识别处理部105将在上述的步骤S21或步骤S22中确定的单词联络至识别结果校正部106,将该单词的词典数据提供给显示控制部107。
受到上述的联络的识别结果校正部106将联络到的单词与从字符识别处理部104提供的识别结果字符串进行比对,在两者不同的情况下,根据从单词识别处理部105提供的单词来置换识别结果字符串。显示控制部107使用最终的识别结果字符串和从单词识别处理部105提供的词典数据,显示图3(2)所示的画面。
此外,在结束了对于全部字符的处理时的有效单词数TR_num成为0(步骤S16为“否”),对识别结果校正部106和显示控制部107联络没有对应的单词的意旨的情况下(步骤S17),识别结果校正部106不进行上述的校正,将从字符识别处理部104提供的识别结果字符串直接转交给显示控制部107。
图9表示生成未包括应成为识别对象的字符串“三三九度”中的开头字符的“三”的图像,从而执行了对于该图像的识别处理的情况下的结果显示画面的例子。
在该例子中,由于最终不会留下候选单词,未对显示控制部107转交词典数据,所以在词典数据的提示栏31b中显示“没有词典数据”的消息。此外,在其之上的识别结果字符串的显示栏31a中,通过字符识别处理部104而生成的识别结果字符串未进行校正而显示,这是因为在该例子中也假设了对图像中的字符“三”、“九”、“度”获得与图5所示相同的识别结果。此时,由于单词识别处理部105不能确定对应于识别对象字符串的单词,所以不进行基于识别结果校正部106的处理,通过对各个构成字符所设定的第1位的候选字符的组合,显示“三丸度”这样的错误的识别结果字符串。
如上述的例子所示,在不具有含义的字符串被设定为识别对象字符串的情况下,由于在单词数据库102中没有注册对应的单词,所以存在不能显示正确的识别结果的情况。但是,通过进行这样的显示,能够对用户通知词典数据的存在对识别的精度带来影响的情况。
另外,在图7、8所示的处理中,将成为初始的候选单词的各个单词从单词数据库102提取并存储到操作用存储器13的同时,由排列W(k)来管理这些单词的有效/无效,每次确认包括从候选单词排除的单词的全部单词的有效/无效,但算法并不限定于此。例如,也可以不设定排列W(k),从操作用存储器13删除从候选单词排除的候选,每次将留在操作用存储器13中的单词作为对象进行与候选字符的比对。若这样,由于不需要用于确认单词的有效/无效的处理,所以能够将处理更加快速化。
此外,在上述的实施例中,从单词数据库102中提取对应于识别对象字符串的字符长度(4字符)的单词,设定为初始的候选单词,但并不限定于此,也可以在初始的候选单词中包括构成字符数与识别对象字符数不同(构成字符数多或少)的字符数的单词。
此外,也可以将包含在单词数据库102中的全部单词作为初始的候选单词。进而,在从单词数据库102中提取一部分单词,并设定为初始的候选单词的情况下,在上述的实施例中,进行基于单词的字符长度的提取处理,但并不限定于此,也可以基于字符种类(例如,英文字符、汉字、片假名)等提取成为初始的候选单词的单词。
此外,在上述的实施例中,将识别对象字符串的各个构成字符从开头的字符起依次设定为处理对象而执行了第1和第2筛选处理,但也可以与此相反地从末尾的字符起沿着字符的排列方向依次选择处理对象字符而进行相同的筛选处理。
进而,识别对象字符串并不限定于日语,若整理单词数据库102的数据结构,则也可以进行将英语或韩语等的外语作为对象的识别处理。此外,识别对象字符串并不限定于通过照相机2而生成的图像中的字符串,也可以将通过作图用的应用程序而描画的字符串等作为对象。
除此之外,在上述的实施例中,将最终的识别结果字符串与词典数据一同进行了显示,但将该功能应用于OCR软件的情况下,也可以仅显示识别结果字符串。此外,也可以代替显示,对其他的应用程序(邮件编辑器、记事簿等)的操作用的数据文件输出识别结果字符串的文本数据或词典数据,或者将识别结果字符串进行语音转换并从扬声器输出。
此外,上述的识别处理并不限定于便携电话,也可以应用于其他的移动设备或个人计算机中。此外,若将图4的单词识别处理部105和识别结果校正部106的功能导入到安装了以往的OCR软件的个人计算机中,则能够通过OCR软件对识别的结果的错误进行校正。

Claims (5)

1.一种单词识别方法,作为字符串图像的识别处理结果,在构成所述字符串的每个字符取得了一个以上的候选字符后,使用注册了多个单词的单词数据库来识别对应于所述字符串的单词,其特征在于,
将在所述单词数据库中包含的规定数的单词设定为初始的候选单词,
在每次将构成所述识别对象的字符串的各个字符以一个字符一个字符设定为处理对象,并且设定处理对象的字符时,将该设定时的候选单词作为对象,执行将候选单词筛选为如下结构的单词的处理,即,在所述识别对象的字符串中,在与配置处理对象的字符的位置相同的位置配置对该处理对象的字符所取得的候选字符,
在结束了对于所述识别对象的字符串中的最后的处理对象的字符的筛选处理时,从在该时刻提取出的候选单词中确定对应于所述字符串的单词。
2.如权利要求1所述的单词识别方法,其中,
在每次设定所述处理对象的字符时,从通过所述识别处理而对该处理对象的字符所取得的候选字符中,提取在该识别处理中获得了超过基于预定条件的容许值的可靠度的候选字符,将对象仅限定为提取出的候选字符,从而执行筛选所述候选单词的处理。
3.如权利要求1所述的单词识别方法,其中,
在设定所述初始的候选单词的处理中,将在所述单词数据库中注册的单词中,构成字符数与所述识别对象的字符串一致的单词设定为初始的候选单词。
4.如权利要求1所述的单词识别方法,其中,
在结束了对于所述识别对象的字符串中的最后的处理对象的字符的筛选处理时提取出多个候选单词的情况下,对这些候选单词的每个候选单词,计算与构成该候选单词的各个字符对应的候选字符的可靠度的平均值,并将可靠度的平均值最高的候选单词确定为对应于所述字符串的单词。
5.一种信息处理装置,包括:单词数据库,注册了多个单词;字符识别部件,进行对于字符串的图像的识别处理,从而对构成该字符串的每个字符取得一个以上的候选字符;以及单词识别部件,使用所述单词数据库和所述字符识别部件的识别结果,识别对应于所述字符串的单词,其特征在于,所述信息处理装置还包括以下各部件:
初始设定部件,将在所述单词数据库中注册的规定数的单词初始设定为候选单词;
筛选部件,在每次将构成所述识别对象的字符串的各个字符以一个字符一个字符设定为处理对象,并且设定处理对象的字符时,将该设定时的候选单词作为对象,执行将候选单词筛选为如下结构的单词的处理,即,在所述识别对象的字符串中,在与配置处理对象的字符的位置相同的位置配置对该处理对象的字符所取得的候选字符;
单词确定部件,在结束了对于所述识别对象的字符串中的最后的处理对象的字符的筛选处理时,从在该时刻提取出的候选单词中确定对应于所述字符串的单词;以及
输出部件,将通过单词确定部件所确定的单词作为识别结果而输出。
CN201010521928.6A 2009-12-29 2010-10-26 单词识别方法和信息处理装置 Expired - Fee Related CN102110229B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP299227/09 2009-12-29
JP2009299227A JP5434586B2 (ja) 2009-12-29 2009-12-29 単語認識方法および単語認識用のプログラムならびに情報処理装置

Publications (2)

Publication Number Publication Date
CN102110229A true CN102110229A (zh) 2011-06-29
CN102110229B CN102110229B (zh) 2015-01-21

Family

ID=44174382

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201010521928.6A Expired - Fee Related CN102110229B (zh) 2009-12-29 2010-10-26 单词识别方法和信息处理装置

Country Status (4)

Country Link
US (1) US8855424B2 (zh)
JP (1) JP5434586B2 (zh)
KR (1) KR101199747B1 (zh)
CN (1) CN102110229B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102982012A (zh) * 2011-09-07 2013-03-20 百度在线网络技术(北京)有限公司 一种用于获取失序文本中的目标字符串的方法与设备
CN103473309A (zh) * 2013-09-10 2013-12-25 浙江大学 一种基于概率单词选择和监督主题模型的文本分类方法
CN103729634A (zh) * 2012-10-11 2014-04-16 富士施乐株式会社 字符识别装置和字符识别方法
CN105404903A (zh) * 2014-09-15 2016-03-16 联想(北京)有限公司 信息处理方法、装置及电子设备
CN110414450A (zh) * 2019-07-31 2019-11-05 北京字节跳动网络技术有限公司 关键词检测方法、装置、存储介质及电子设备
CN111274369A (zh) * 2020-01-09 2020-06-12 广东小天才科技有限公司 一种英文单词的识别方法及装置
CN113614737A (zh) * 2019-03-27 2021-11-05 三菱电机大楼技术服务株式会社 机器设备信息收集系统

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9147275B1 (en) 2012-11-19 2015-09-29 A9.Com, Inc. Approaches to text editing
US9043349B1 (en) 2012-11-29 2015-05-26 A9.Com, Inc. Image-based character recognition
DE112013006764T5 (de) * 2013-03-04 2015-11-19 Mitsubishi Electric Corporation Suchvorrichtung
JP6131765B2 (ja) * 2013-08-06 2017-05-24 富士ゼロックス株式会社 情報処理装置及び情報処理プログラム
CN104268603B (zh) 2014-09-16 2017-04-12 科大讯飞股份有限公司 用于文字性客观题的智能阅卷方法及系统
JP2019537103A (ja) * 2016-09-28 2019-12-19 シストラン インターナショナル カンパニー.,リミテッド.Systran International Co.,Ltd. 文字を翻訳する方法及びその装置
WO2018079426A1 (ja) * 2016-10-31 2018-05-03 パナソニックIpマネジメント株式会社 加熱調理器および加熱調理器の制御方法
JP6593303B2 (ja) * 2016-10-31 2019-10-23 京セラドキュメントソリューションズ株式会社 問題作成装置、問題作成方法、及び画像形成装置
US10467494B2 (en) 2016-12-16 2019-11-05 Tata Consultancy Services Limited Method and system for container code recognition
CN108984513B (zh) * 2017-06-05 2022-03-04 阿里巴巴集团控股有限公司 一种词串识别方法和服务器
KR20200010777A (ko) * 2018-07-23 2020-01-31 휴렛-팩커드 디벨롭먼트 컴퍼니, 엘.피. 유사 문자의 과거 인식 결과를 이용하는 문자 인식
KR20230164347A (ko) * 2022-05-25 2023-12-04 (주)그리드원 Ocr 대상 문자열에 대한 문자열 보정 방법 및 상기 문자열 보정 방법을 수행하는 컴퓨팅 장치

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08249427A (ja) * 1995-03-09 1996-09-27 Fujitsu Ltd 文字認識方法および装置
CN1158465A (zh) * 1995-12-13 1997-09-03 株式会社日立制作所 读取字符的方法和读取邮政地址的方法
CN1215201A (zh) * 1997-10-16 1999-04-28 富士通株式会社 字符识别/修正方式
US6014460A (en) * 1994-12-20 2000-01-11 Nec Corporation Character strings reading device

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS54854A (en) 1977-06-03 1979-01-06 Sharp Corp Multi-function analog signal process circuit
US4764972A (en) * 1985-05-23 1988-08-16 Nec Corporation Continuous characters recognition system
JPH0540854A (ja) * 1991-08-06 1993-02-19 Oki Electric Ind Co Ltd 文字認識結果の後処理方法
JPH0546814A (ja) 1991-08-20 1993-02-26 Nec Corp 文字読み取り装置
JPH07182465A (ja) * 1993-12-22 1995-07-21 Hitachi Ltd 文字認識方法
JPH0991386A (ja) * 1995-09-28 1997-04-04 Toshiba Corp 文書解析装置及び形態素解析方法
US7679534B2 (en) 1998-12-04 2010-03-16 Tegic Communications, Inc. Contextual prediction of user words and user actions
US6597809B1 (en) * 1999-03-19 2003-07-22 Raf Technology, Inc. Rollup functions for efficient storage presentation and analysis of data
JP2006163830A (ja) 2004-12-07 2006-06-22 Nec Corp 文字認識装置、文字認識方法、および文字認識プログラム
US8065135B2 (en) * 2006-04-06 2011-11-22 Research In Motion Limited Handheld electronic device and method for employing contextual data for disambiguation of text input
US8189919B2 (en) * 2007-12-27 2012-05-29 Chung Mong Lee Method and system for container identification

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6014460A (en) * 1994-12-20 2000-01-11 Nec Corporation Character strings reading device
JPH08249427A (ja) * 1995-03-09 1996-09-27 Fujitsu Ltd 文字認識方法および装置
CN1158465A (zh) * 1995-12-13 1997-09-03 株式会社日立制作所 读取字符的方法和读取邮政地址的方法
CN1215201A (zh) * 1997-10-16 1999-04-28 富士通株式会社 字符识别/修正方式

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102982012A (zh) * 2011-09-07 2013-03-20 百度在线网络技术(北京)有限公司 一种用于获取失序文本中的目标字符串的方法与设备
CN102982012B (zh) * 2011-09-07 2017-03-22 百度在线网络技术(北京)有限公司 一种用于获取失序文本中的目标字符串的方法与设备
CN103729634A (zh) * 2012-10-11 2014-04-16 富士施乐株式会社 字符识别装置和字符识别方法
CN103473309A (zh) * 2013-09-10 2013-12-25 浙江大学 一种基于概率单词选择和监督主题模型的文本分类方法
CN103473309B (zh) * 2013-09-10 2017-01-25 浙江大学 一种基于概率单词选择和监督主题模型的文本分类方法
CN105404903A (zh) * 2014-09-15 2016-03-16 联想(北京)有限公司 信息处理方法、装置及电子设备
CN105404903B (zh) * 2014-09-15 2020-06-23 联想(北京)有限公司 信息处理方法、装置及电子设备
CN113614737A (zh) * 2019-03-27 2021-11-05 三菱电机大楼技术服务株式会社 机器设备信息收集系统
CN113614737B (zh) * 2019-03-27 2023-08-29 三菱电机楼宇解决方案株式会社 机器设备信息收集系统
CN110414450A (zh) * 2019-07-31 2019-11-05 北京字节跳动网络技术有限公司 关键词检测方法、装置、存储介质及电子设备
CN111274369A (zh) * 2020-01-09 2020-06-12 广东小天才科技有限公司 一种英文单词的识别方法及装置

Also Published As

Publication number Publication date
CN102110229B (zh) 2015-01-21
US8855424B2 (en) 2014-10-07
JP2011138435A (ja) 2011-07-14
KR101199747B1 (ko) 2012-11-08
US20110158548A1 (en) 2011-06-30
KR20110076750A (ko) 2011-07-06
JP5434586B2 (ja) 2014-03-05

Similar Documents

Publication Publication Date Title
CN102110229A (zh) 单词识别方法和信息处理装置
US20110252062A1 (en) Electronic device for searching for entry word in dictionary data, control method thereof and program product
CN104718430A (zh) 具有用于手写识别的输入装置的机动车
CN101430758A (zh) 文档识别装置和方法
JP7054662B2 (ja) 画像認識装置、画像認識方法、及び画像認識プログラム
JP2012234344A (ja) 帳票上の文字を認識する文字認識装置、マスク処理方法、および、マスク処理プログラム
KR101090658B1 (ko) 사전기능을 구비한 전자기기
JP2005107931A (ja) 画像検索装置
JP2019175317A (ja) 文字認識装置、文字認識方法およびプログラム
JP2008027133A (ja) 帳票処理装置及び帳票処理方法ならびに帳票処理方法を実行するプログラムと記憶媒体
CN106250354A (zh) 处理文书的信息处理装置、信息处理方法以及程序
EP1758012A2 (en) Succession Chinese character input method
JP2703559B2 (ja) 文字認識支援装置
JP2917748B2 (ja) 文字入力装置
JP2019168935A (ja) 入力装置、入力方法、およびプログラム
CN115310434B (zh) 合同文书语法的纠错方法、装置、计算机设备及存储介质
JP3361258B2 (ja) 文字読取装置
JP4357240B2 (ja) 文字認識装置、文字認識方法、プログラムおよび記憶媒体
CN111814473B (zh) 特定领域的词向量增量方法、装置及存储介质
JP2011159079A (ja) 情報処理システム、プログラムおよび情報処理方法
JP2010211660A (ja) 電子機器及び情報表示プログラム
JP2001283156A (ja) 住所認識装置、住所認識方法、およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2016062442A (ja) 情報表示装置、情報表示プログラムおよび情報表示方法
JPH05346974A (ja) 文字認識装置
JP5061786B2 (ja) 候補単語表示装置及び候補単語表示プログラム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20150121

Termination date: 20201026

CF01 Termination of patent right due to non-payment of annual fee