CN1227374A - 文字识别装置 - Google Patents

文字识别装置 Download PDF

Info

Publication number
CN1227374A
CN1227374A CN 99101324 CN99101324A CN1227374A CN 1227374 A CN1227374 A CN 1227374A CN 99101324 CN99101324 CN 99101324 CN 99101324 A CN99101324 A CN 99101324A CN 1227374 A CN1227374 A CN 1227374A
Authority
CN
China
Prior art keywords
word
attribute information
result
literal
recognition result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN 99101324
Other languages
English (en)
Other versions
CN1160658C (zh
Inventor
川又武典
宫原景泰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Publication of CN1227374A publication Critical patent/CN1227374A/zh
Application granted granted Critical
Publication of CN1160658C publication Critical patent/CN1160658C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Character Discrimination (AREA)
  • Machine Translation (AREA)

Abstract

即使仅根据文字信息就能正确地识别文字,也需要输入文字属性信息,反之,如不输入文字属性信息,仅根据文字信息不能正确识别文字时,则无法改善识别能力。识别装置22根据输入装置21输入的书写信息进行文字识别,将识别结果存储在识别结果存储装置23中,并在识别结果显示装置24中显示,识别结果限定装置28根据选择输入装置27选择输入的文字属性信息,从在23中存储的识别结果中。对在24中显示的识别结果进行限定,实现文字识别。

Description

文字识别装置
本发明涉及识别输入文字的文字识别装置,特别是涉及对书写信息加上文字属性信息进行文字识别的文字识别装置。
现有技术1
图28是特开平5-20300号公报(文书处理装置)中公开的以前的文字识别装置的结构的框图。这个文字识别装置是利用文字的文字属性信息进行文字识别,在读取名片时,如果背面有英文表示,对这个信息一起读取。
在图中,1为读取名片的表面图象和背面图象的读取装置,2为根据这个读取装置1读取的表面图象和背面图象,识别名片的表面文字和背面文字的识别装置。3为对这个识别装置识别的背面文字是否是英文表示进行判定的判定装置,4为当这个判定装置判定出是英文表示时,将表面文字和背面文字分类成住所、姓名、电话号码等的各个住址名簿记录数据的分类装置。5为将这个分类装置分类的表面文字和背面文字的各个住址名簿数据分别予以比较,选择与表面文字的表示一致的背面文字的表示的选择装置,6是根据这个选择装置选择的背面文字的表示,生成与该表示相对应的标注假名的生成装置。7是将这个生成装置6生成的标注假名与和这个标注假名相对应的表面文字的表示相关联并存储的存储装置。
下面说明其工作过程。
首先,由读取装置1读取名片的表面图象和背面图象。由识别装置2识别读取图象上的表面文字和背面文字,由判定装置3判定该背面文字是否是英语表示。判定结果如是英语表示,由分类装置4将该表面文字和背面文字按住址、姓名、电话号码等各住址名簿数据分类。选择装置5将这个分类的表面文字和背面文字的各个住址名簿数据分别予以比较,选择与表面文字的表示一致的背面文字的表示。此时,表面文字的识别结果的表示与背面文字的表示不一致时,选择装置5在识别表面文字时与存储的后面的候选进行比较,选择最一致的部分。此后,生成装置6根据选择的背面文字的表示,生成与此表示相对应的标注假名,将生成的标注假名与和标注假名相对应的表面文字的表示相关联并存储在存储装置7中。
现有技术2
图29是特公平3-19589号公报(光学文字读取装置)公开的表示以前的文字识别装置的结构的框图。这个文字识别装置也是利用文字的文字属性信息进行文字识别,对于汉字部分的识别结果及假名部分的识别结果,利用单词信息提高准确度。
在图中,11是扫描票单,将该票单上记录的汉字及标注假名的假名文字进行光电变换,并输出各量化图象(二进制信号构成的文字图象)的扫描部。12是根据这个扫描部11输出的量化图象,以字符为单位对票单上的汉字及标注假名的假名文字进行识别处理的文字识别部。13是预先分别存储汉字及片假名文字的以单词为单位的识别用表(辞典),根据文字识别部输出的汉字及片假名文字的各个识别结果(以文字为单位)识别由各自的文字构成的各个单词的单词识别部。14是控制部,对该单词识别部13输出的汉字及片假名文字的各单词单位的识别结果进行检查,该检查结果若各单词单位的识别结果相互对应,此识别结果作为最终结果输出。另外,这个控制部14还控制扫描部11、文字识别部12及单词识别部13的各个动作。
下面说明其工作过程。
图30是输入的票单的一个例子的说明图,在这个票单上,如图所示,设有记录汉字15的汉字区域15a和记录该汉字15的标注假名用的片假名文字(以下称片假名)16的标注假名区域16a。首先,由扫描部11对图30所示票单进行扫描,该票单上的汉字区域15a中记录的汉字15和,标注假名区域16a中记录的片假名16,分别被变换成量化图象送到文字识别部12。文字识别部12根据从扫描部11来的各量化图象对汉字15及片假名16进行以字符为单位的识别处理。
图31表示该文字识别部12的识别结果的说明图,图中,17是片假名16的识别结果,18是汉字15的识别结果。在片假名16的识别结果17中,第1个文字和第2个文字分别限定成有一个候选文字[サ]和[カ],第3个文字有[ィ]和[ク]2个候选文字。同样地,在汉字15的识别结果18中,第2个文字限定成有1个候选文字[井],第1个文字有[板]和[坂]2个文字的候选文字。
这样,文字识别部12识别的以字符为单位的各个识别结果,按顺序输出到单词识别部13。单词识别部13首先根据得到的以字符为单位的各个识别结果(通常各文字存在多个候选文字),将它们予以组合制成候选单词。即,从片假名16的识别结果17制成2个候选单词[サ力ィ]和[サカク],从汉字15的识别结果18制成[板井]和[坂井]2个候选单词。然后单词识别部13检查这样制成的各候选单词在单词单位的识别用表中是否存在,存在的候选单词作为单词识别部13的识别结果输出。
图32是表示单词识别部13使用的单词单位的识别用表的内容的一个例子的说明图,这个单词单位的识别用表分为片假名区域19和汉字表示区域20。单词识别部13检查各候选单词在该单词单位的识别用表中是否存在。即将片假名单词与片假名区域19中的单词,汉字单词与汉字表示区域20中的单词分别比较。在此例中,片假名区域19中的[サカィ]和汉字表示区域20中的[坂井]和[板井]作为候选单词输出到控制部14。
控制部14对从单词识别部13输出的作为识别结果的候选单词进行检查,只将图32所示的单词单位的识别用表的同一行中存在的候选单词作为最终结果输出。在这个例子中,与片假名区域19中的[サカィ]同一行的汉字表示区域20中,对应的单词只有[坂井],所以它作为最终结果输出。
发明要解决的课题
如现有技术1及现有技术2所示,利用文字属性信息进行文字识别的文字识别装置具有以上的结构,因此通过读取装置1和扫描部11读取名片上印刷的文字和票单上用笔记录的文字,同时读取文字属性信息(标注假名),故存在着即使只用文字信息就可以正确识别时,也要输入文字属性信息,反之,没有输入文字属性信息时,只用文字信息无法正确识别的问题。
另外,因为现有技术1及现有技术2的文字识别装置对文字属性信息也进行识别处理,当不能正确识别文字属性信息时,即使能正确识别文字信息,也不能得到识别结果。
在现有技术2的文字识别装置中,文字属性信息是用手书写的,此时,需要对汉字及标注假名两者都书写,存在着书写量大,给书写者增加负担的问题。
现有技术2的文字识别装置是利用单词信息,需要对构成单词的文字和标注假名都书写,存在着不书写时不能利用单词信息,无法实现单词识别的问题。
当现有技术1和现有技术2应用于在图形输入板上用笔书写文字,并进行实时识别的联机文字识别装置时,因为在很多情况下,该联机文字识别装置没有物理键盘,更会增加输入文字属性信息的负担。
本发明的目的是得到一种能解决上述问题,即使在没有物理键盘的联机的文字识别装置中,也能容易地利用文字属性信息的文字识别装置。
本发明的另一个目的是得到一种在进行文字识别后,只有当文字识别结果不正确时,通过输入文字属性信息,由此能改善文字识别结果的文字识别装置。
本发明的另一个目的是得到一种利用文字属性信息,减轻文字识别处理的计算量的同时,提高文字识别的准确度的文字识别装置。
本发明的另一个目的是得到一种当书写构成单词的文字的一部分,根据一部分信息输出候选单词时,利用文字属性信息减少候选单词数量的文字识别装置。
本发明的另一个目的是得到一种在书写单词进行单词识别后,只当单词识别结果不正确时,才输入文字属性信息,从而改善单词识别结果的文字识别装置。
技术方案
本发明的文字识别装置,由识别装置在输入装置输入的书写信息的基础上进行识别文字,将识别结果存储在识别结果存储装置,并在识别结果显示装置中显示,识别结果限定装置根据该文字属性显示装置中显示的文字属性信息、并以用选择输入装置选择输入的文字属性信息为基础,从在识别结果存储装置中存储的识别结果中将在识别结果显示装置中显示的识别结果进行限定,由此实现识别文字。
本发明的文字识别装置设置了文字属性信息限定装置,根据在识别结果存储装置中存储的识别结果的文字属性信息、限定在文字属性显示装置中显示的文字属性信息。
本发明的文字识别装置设置有文字属性信息限定装置,提取在识别结果存储装置中存储的识别结果的文字属性信息,并对在文字属性显示装置中显示的文字属性信息进行限定,由此从多个文字属性信息中选择最适合的文字属性信息。
本发明的文字识别装置,由识别对象限定装置根据显示装置中显示的文字属性信息、以用选择输入装置选择输入的文字属性信息为基础,对识别对象的文字进行限定,根据限定后的识别对象文字信息和从输入文字的书写信息的输入装置中得到的信息,由识别装置识别文字,并将识别结果在识别结果显示装置中显示。
本发明的文字识别装置使用文字的母音信息作为文字属性信息。
本发明的文字识别装置,是将从识别装置识别的单词的一部分识别结果,经单词联想装置联想产生的联想结果,存储在单词联想结果存储装置中,并在单词联想结果显示装置中显示,由单词联想结果限定装置,根据选择输入装置选择输入的构成单词的文字的文字属性信息,从在单词联想结果存储装置中存储的单词联想结果,对在单词联想结果显示装置中显示的单词联想结果进行限定。由此实现文字的识别。
本发明的文字识别装置,设置有单词属性信息限定装置,根据在单词联想结果存储装置中存储的单词联想结果的文字属性信息,对在文字属性显示装置中显示的文字属性信息进行限定。
本发明的文字识别装置,设置有单词属性信息限定装置,提取在单词联想结果存储装置中存储的单词联想结果的文字属性信息,并对在文字属性显示装置中显示的文字属性信息进行限定,由此从多个文字属性信息中选择最适合的文字属性信息。
附图的简要说明
图1是本发明的实施例1的文字识别装置的结构方框图。
图2是本发明的实施例1的由控制装置控制的一个文字单元的处理的流程图。
图3是本发明的实施例1的书写到输入装置中的输入图象的一个例子。
图4是本发明的实施例1的识别装置进行识别后的,识别结果存储装置中存储的识别结果的内容的一个例子说明图。
图5是表示本发明的实施例1的识别结果显示装置显示的第1位的识别结果的一个例子的说明图。
图6是本发明的实施例1的文字属性显示装置中显示的文字属性信息的一个例子的说明图。
图7是本发明的实施例1的由选择输入装置选择输入的正确文字的文字属性信息的一个例子的说明图。
图8是本发明的实施例1的识别结果限定装置提取出识别结果的文字属性后的,识别结果存储装置的内容的一个例子的说明图。
图9是本发明的实施例1的识别结果限定装置根据文字属性信息对识别结果限定后的,识别结果存储装置的内容的一个例子的说明图。
图10是本发明的实施例1的识别结果显示装置中显示的新的识别结果的一个例子的说明图。
图11是表示本发明的实施例2的文字识别装置的结构的框图。
图12是表示本发明的实施例2的控制装置控制的一个文字单元的处理的流程图。
图13是表示本发明的实施例2的文字属性信息限定装置使用的文字属性信息之一例。
图14是表示本发明的实施例2的文字属性信息限定装置提取出的关于识别结果存储装置中存储的识别结果的文字属性信息的一个例子的说明图。
图15是表示本发明的实施例2的文字属性信息中显示的文字属性信息及其名称的一个例子的说明图。
图16是表示本发明的实施例3的文字识别装置的结构的框图。
图17是表示本发明的实施例3的控制装置控制的一个文字单元的处理的流程图。
图18是表示本发明的实施例4的文字识别装置的结构的框图。
图19是表示本发明的实施例4的控制装置控制的一个文字单元的处理的流程图。
图20是表示本发明的实施例4的构成单词的首位文字的识别处理完了后的状态的一个例子的说明图。
图21是表示本发明的实施例4的单词联想结果存储装置中存储的单词联想结果的一个例子的说明图。
图22是表示本发明的实施例4的单词联想装置对识别结果进行单词联想,在单词联想结果显示装置中显示其结果的状态的一个例子的说明图。
图23是表示本发明的实施例4的文字属性显示装置显示单词的第2位文字的文字属性信息的状态的一个例子的说明图。
图24是表示本发明的实施例4的由选择输入装置对文字属性信息选择后的状态的一个例子的说明图。
图25是表示本发明的实施例4的单词联想结果限定装置,提取出单词联想结果存储装置中的单词的文字属性信息的结果的一个例子的说明图。
图26是表示本发明的实施例4的单词联想结果限定装置使用选择输入的文字属性信息对单词联想结果存储装置中的文字限定后的状态的一个例子的说明图。
图27是表示本发明的实施例4的单词联想结果显示装置显示的候选单词的一个例子的说明图。
图28是表示现有技术1的文字识别装置的结构的框图。
图29是表示现有技术2的文字识别装置的结构的框图。
图30是表示现有技术2的输入票单的一个例子的说明图。
图31是表示现有技术2的文字识别结果一个例子的说明图。
图32是表示现有技术2的单词表的内容的一个例子的说明图。
以下说明本发明的实施例。
实施例1
图1表示本发明的实施例1的文字识别装置的结构图。在图中,21是输入书写信息的图形输入板或扫描器等的输入装置,22是根据这个输入装置21输出的书写信息识别文字,并输出识别结果的识别装置。23是存储这个识别装置22输出的识别结果的识别结果存储装置,24是显示这个识别结果存储装置23中的识别结果的识别结果显示装置。25是收集有文字的读音,笔画,部首信息等的文字属性信息的文字属性辞典,26是显示这个文字属性信息的文字属性显示装置。27是对在文字属性显示装置上显示的文字属性信息进行选择的选择输入装置,28是根据选择输入装置选择输入的文字属性信息,从在识别结果存储装置中存储的识别结果中,对在识别结果显示装置24中显示的识别结果进行限定的识别结果限定装置。29是控制这些输入装置21,识别装置22,识别结果存储装置23,识别结果显示装置24,文字属性辞典25,文字属性显示装置26,选择输入装置27,及识别结果限定装置28的控制装置。
下面说明工作过程。
图2是实施例1的由控制装置29控制的一个文字单元的处理的流程图。控制装置29首先在步骤ST10中指示输入装置输入书写的输入图象。图3表示书写入这个输入装置21中的输入图象的一个例子。图中的30是书写入这个输入装置21的输入图象,图中的例子书写的是中国文字[中]。24a是对识别这个书写的输入图象30的识别结果进行显示的识别结果显示装置24的显示外框。
接着进入步骤ST11,控制装置29将从输入装置21得到的书写信息输出到识别装置22,并指示识别装置22识别该书写信息。识别装置22根据输入的书写信息识别文字,并将识别结果送到识别结果存储装置23。
在步骤ST12中,识别结果存储装置23将从识别装置22得到的识别结果,按照准确度高的顺序存储在识别结果存储装置中。图4表示当得到4个识别结果时的识别结果存储装置23中存储的内容的一个例子。图中的例为,
[巾]、[申]、[币]、[中]
这4个识别结果被分别安排在第1位至第4位的的顺序,存储在识别结果存储装置23中。
接着,在步骤ST13中,识别结果显示装置24读出在识别结果存储装置23中存储的识别结果中的第1位的文字[巾],并在识别结果显示装置24的显示框24a中显示。图5表示该识别结果显示装置24的显示例。图中的32是在识别结果显示装置24的显示框24a中显示的,识别结果中为第1顺序位的文字[巾]。
接着,在步骤ST14中,文字属性显示装置26显示为选择文字属性信息所需要的信息。图6表示在这个文字属性显示装置26中显示的文字属性信息。在这个例子中,中国文字的5种母音信息用拼音(用英文字母表示汉语的发音方法,主要在中国大陆使用)来表示。图中的26a是在文字属性显示装置26中显示的、作为文字属性信息的中国文字的拼音中的5种母音信息。所有的中国文字用拼音表示时,必定包括这5个母音[a,i,u,e,o]中的某一个。
接着进入步骤ST15,由选择输入装置27检查是否已输入了文字属性信息。如果文字属性信息未被输入,则认为识别结果正确,这1个文字单元的识别处理完毕。另一方面,如果选择输入装置27输入了文字属性信息,则转入步骤ST16。
在这种情况下,识别结果的第1顺序位的文字是[巾],因为这个选择结果不正确,所以选择输入装置27输入正确文字的文字属性信息,即拼音的母音信息。图7表示该选择输入装置27选择输入的正确文字的文字属性信息。图中的33为该选择输入的正确文字的文字属性信息,并加了网格。图示的例中,5个母音信息26a中的、想要输入的文字的拼音[zhong]的母音信息[o]被选择输入。
接着处理由步骤ST15进入步骤ST16,识别结果限定装置28首先检索文字属性辞典25,提取出存储在识别结果存储装置23中的识别结果文字的文字属性信息,作为新的识别结果存储。这里图8表示提取出识别结果文字的文字属性信息后的识别结果存储装置23中的内容。图中的34是提取的拼音信息。如图8所示,识别结果限定装置28对于存储在识别结果23中存储的识别结果文字,提取出其文字属性信息(拼音)34。大部分中国文字,其文字的发音由一个来决定。
在步骤ST16中,识别结果限定装置28,根据提取识别结果文字的文字属性信息后的识别结果存储装置23的内容,对具有选择输入装置27选择输入的文字属性信息的文字予以限定,将限定后的结果作为新的识别结果存储在识别结果存储装置23中。图9表示识别结果限定装置28通过文字属性信息对识别结果被限定后的识别结果存储装置23的内容,图中的35是限定后的识别结果。即,使用选择输入装置27选择输入的文字属性信息o,对识别结果存储装置23的内容限定的结果,删除图8所示的拼音中不含有[o]的第1位至第3位文字,作为识别结果35,只留下了具有拼音的母音信息[o]的文字[中](zhong)。
接着进入步骤ST17,识别结果显示装置24将识别结果限定装置28限定的、识别结果存储装置23的文字中的,第1位的文字作为新的识别结果,在识别结果显示装置24的显示框24a中显示。该识别结果显示装置24的显示框24a中显示的、新的结果在图10中表示。图中的36为识别结果,在图示的例中,显示的是作为识别结果36的正确文字[中],这样得到了正确的识别结果。
在这个实施例1中,在识别结果选择装置24的显示框24a中显示的识别结果32,只是存储在识别结果存储装置23中的第1位的文字,但也可以同时显示多个候选文字。
在这个实施例1中,在识别结果显示装置24中显示识别结果后,在文字属性显示装置26中显示文字属性信息,但因为在文字属性显示装置26中显示的内容不依赖于识别结果,所以这个文字属性信息的显示,只要在选择输入装置27选择输入文字属性信息以前,任何时间都可以进行。
在这个实施例1中,文字属性显示装置26中显示的内容是中国文字的母音信息,但也可以使用文字的读音,笔画,部首信息等别的文字属性信息。
在这个实施例1中,识别结果限定装置28根据选择输入装置27选择输入的文字属性信息,删除和识别结果存储装置23中的文字属性信息不一致的识别结果,但也可以不删除,就这样留在识别结果存储装置23中,作为识别结果不进行选择。
如上所述,根据本实施例1,可以容易地显示可能输入的文字属性信息,在选择输入文字属性信息的情况下,因为可以用文字属性信息来限定识别结果,所以即使在书写潦草,文字识别的准确度不够时,也可以输入正确的文字。
根据本实施例1,即使文字识别结果有误时,因为没有必要对同一文字的书写信息再次输入,所以能够减轻书写者的书写量,特别地,即使在识别结果的候选文字(通常是10个左右)中不包括正确文字的情况下,输入时可以不用再次书写文字,能取得减轻书写者的负担的效果。
而且,根据本实施例1,在识别了文字后,若只在该识别结果错误的情况下输入文字属性信息,则可以改善文字的识别结果,能取得减轻文字属性信息的输入负担的效果。
根据本实施例1,因为选择输入的文字属性信息为汉语的母音信息(5种)即使没有物理键盘的携带信息终端也可以容易地选择输入,可以得到减轻输入文字属性信息的负担的效果。
实施例2
下面结合图11~图15说明本发明的实施例2。图11表示本发明的实施例2的文字识别装置的结构框图。图11中,与图1所示实施例1相同或相当的部分用同一标号表示,对其说明省略。在图中,40是根据由识别装置22识别、并存储在识别结果存储装置23中的识别结果,对在文字属性显示装置26中显示的文字属性信息进行限定的文字属性限定装置。实施例2与实施例1不同之处在于,实施例2的文字识别装置有文字属性信息限定装置40。
下面说明其工作过程。
图12是实施例2的由控制装置29控制的一个文字单元的处理的流程图。控制装置29在步骤20~23中与实施例1中的步骤10-13一样,进行输入装置21的书写信息的输入,识别装置22的文字识别,识别结果存储装置23的对识别结果的存储,识别结果显示装置24的对识别结果的显示的处理。
下面进入步骤24,控制装置29将存储在识别结果存储装置23中的识别结果送到文字属性信息限定装置40中。文字属性信息限定装置40,根据对应于识别结果的各文字的文字属性辞典25中的文字属性信息,分析取得的识别结果,选择文字属性信息,该文字属性信息在选择分支为k个以下,选择分支中的候选为j个以下的范围内,可以分类成各选择分支中的平均候选数、分散最少。
图13表示通过该文字属性信息限定装置40在分类时使用的文字属性信息的一个例子。图中,41是用英文表示中国文字发音,即拼音表示的母音信息,42是该拼音的首位字母的信息,43是拼音表示时字母数字的信息。44是汉语中的四声信息(4种+轻声共5种),45是文字的总笔画数的信息,46是部首信息,47是部首的笔画数信息。48是汉语的输入方法之一的五笔字型的字根形状的数码信息。这些信息按照选择的优先性,按1-8的优先顺序设定。
图14表示对于识别结果存储装置23中存储的识别结果,文字属性信息限定装置40提取出的文字属性信息的一个例子。图14表示,对于按第1位至第4位顺序在识别结果存储装置23中存储的
        [巾]、[申]、[币]、及[中]
4个识别结果,拼音的母音信息、首位字母及字母数信息、四声信息、文字的总笔画数信息、部首信息、部首的笔画数信息、五笔字形的字根形状的具体例子。
这里,用文字属性信息限定装置40来限定,当留下多个文字属性信息时,选择图13中优先顺序中的第1位的文字属性信息。在实施例2中,按k=5 j=1来限定时,由图14的结果,拼音的首位字母信息和拼音的字母数信息,其平均候选数为1,分散为0,但拼音的首位文字信息的优先顺序高于拼音的字母数,因此文字属性信息限定装置40选择拼音的首位字母信息。这样,文字属性信息限定装置40从多个文字属性信息中选择最适合的那个。
下面进入步骤25,文字属性显示装置26将文字属性信息限定装置40限定的文字属性信息及其名称在文字属性显示装置26上显示。图15表示文字属性显示装置26上显示的文字属性信息和名称的例子。图中,50是文字属性信息,51是表示文字属性信息50的种类的名称。在图示的例子中,显示在文字属性显示装置26上的是,作为文字属性信息50的拼音的首位字母信息[j,s,b,z],和作为其名称51的[首位字母]。
其后,在步骤26~步骤28中,与实施例1的步骤15~步骤17同样地,进行由选择输入装置27检查是否有文字属性信息的输入、由识别结果限定装置28限定识别结果、变更在识别结果显示装置24中显示的识别结果的处理。
在本实施例2中,文字属性信息限定装置40使用的文字属性信息的优先顺序按图13所示排列顺序,但也可以由使用者预先指定使用的文字属性信息及其优先顺序,文字属性信息限定装置40从中进行选择。
在本实施例中2中,对于文字属性信息限定装置40限定的文字属性信息,文字属性显示装置26显示的是文字属性信息及其名称,但也可以只显示文字属性信息。
如上所述,根据本实施例2,因为可以根据识别结果选择有效的文字属性信息,所以可以减少文字的识别处理的计算量,可以提高文字识别的准确度,并能减轻输入文字属性信息的负担,减轻选择正确文字的负担。
根据本实施例2,即使文字识别结果有错误,因为可以不用再次书写同一文字就能输入,所以能够减轻书写者的书写负担。
根据实施例2,识别文字后,只在识别结果有错误的情况下,才输入文字属性信息,因此可以减轻输入文字属性信息的负担。
实施例3
下面结合图16及图17说明本发明的实施例3。图16是表示本发明的实施例3的文字识别装置的结构的框图。图16中,与图1所示的实施例1相同或相当的部分用同一标号表示,并省略说明。在图中,60是根据选择输入装置27选择输入的正确文字的文字属性信息,对识别对象文字进行限定的识别对象限定装置。实施例3的文字识别装置中,用识别对象限定装置60替换识别结果存储装置23和识别结果限定装置28,这一点与实施例1不同。
下面说明工作过程。
图17是表示本实施例3的由控制装置29控制的1个文字单元的处理的流程图。控制装置29在步骤ST30及步骤ST31中,与实施例1的步骤ST14、步骤ST15同样地,由文字属性显示装置26显示文字属性信息,由选择输入装置27检查是否有文字属性信息的输入。在此,文字属性显示装置26显示文字的母音信息,选择输入装置27选择输入正确文字的母音信息[o]。
接着进入步骤ST32,控制装置29将选择输入装置27选择输入的文字属性信息(正确文字的母音信息[o])送到识别对象限定装置60,识别对象限定装置60将送来的与文字属性信息一致的文字,作为识别对象文字从文字属性辞典中选择。在本实施例3中,选择文字的拼音表示中的含有母音[o]的文字作为识别对象文字。
然后,在步骤ST33中,与实施例1的步骤ST10同样地,在输入装置21中输入书写的文字书写信息。然后进入步骤ST34,控制装置29与实施例1的步骤11同样地,将输入到输入装置21的书写信息和,识别对象限定装置60限定的识别对象文字信息送到识别装置22。识别装置22是在书写信息的基础上识别文字,而对识别对象的限定,是使用来自识别对象限定装置60的识别对象文字信息来进行。在本实施例3中,识别结果的文字全部是只有母音信息[o]的文字。
识别结果显示装置24在步骤ST35中,与实施例1的步骤ST13同样地,在识别结果显示装置24中显示从识别装置22送来的识别结果。
在步骤ST31中,选择输入装置27判定没有文字属性信息的输入时,直接转入步骤ST33,与通常的不使用文字属性信息的文字识别装置进行同样的处理。
在实施例3中,在文字属性显示装置26中显示的内容,为汉语文字的母音信息,但也可以是文字的读音、笔画数、部首信息等别的文字属性信息。
如上所示,根据本实施例3,在书写文字前,输入书写文字的文字属性信息,在这个信息的基础上限定识别对象文字,因此有可快速识别,并提高文字识别准确度的效果。
根据本实施例3,在没有输入文字属性信息的情况下,可以进行通常的不使用文字属性信息的文字识别处理,所以能减轻书写者输入文字属性信息的负担。
根据本实施例3,选择输入的文字属性信息是汉语的母音信息,所以即使没有物理键盘的携带信息终端也可以选择输入,能减轻输入文字属性信息的负担。
实施例4
下面结合图18~27说明本发明的实施例4。图18是表示本发明的实施例3的文字识别装置的结构的框图。图18中,与图1所示的实施例1相同或相当的部分用同一标号表示,并省略说明。在图中,70是根据识别结果存储装置23的单词的部分的识别结果信息联想单词,输出单词联想结果的单词联想装置。71是存储该单词联想装置70输出的单词联想结果的单词联想结果存储装置。72是根据选择输入装置27输入的未书写文字的文字属性信息,对单词联想结果存储装置71中的单词联想结果进行限定的单词联想结果限定装置。73是对该单词联想结果限定装置72限定的单词联想结果进行显示的单词联想结果显示装置。本实施例4的文字识别装置在具有单词联想装置70、单词联想结果存储装置71、单词联想结果限定装置72、及单词联想结果显示装置73这点上,与实施例1不同。
下面说明工作过程。
图19是表示本实施例的由控制装置29控制的1个文字单元的处理的流程图。控制装置29首先在步骤ST40中控制对构成单词的首位文字的识别的处理。步骤ST40的处理与实施例1的步骤ST10~ST17的处理相同,在此省略其详细说明。图20表示构成单词的首位文字的识别处理完了后的状态的一个例子。图中的36是这个单词的首位文字,在图示的例中,汉语文字[中]在识别结果显示装置24的显示框24a中显示。其余的部分,与图6所示实施例1中的部分相同或相当。
在步骤41中,控制装置29将识别结果存储装置23中存储的识别结果的第1位的文字送到单词联想装置70。单词联想装置70在事先在内部预备好的单词辞典中选择送来的单词的首位文字。此时,送来的是作为单词的首位文字的汉语文字[中],因此从单词辞典中选择以文字[中]开头的单词。
接着,控制装置29进入下一个步骤42,将由单词联想装置70选择的以文字[中]开头的单词,作为单词联想结果送到单词联想结果存储装置71。单词联想结果存储装置71存储这个送来的单词联想结果。图21表示存储在单词联想结果存储装置71中的单词联想结果。此时,如图所示,单词联想结果存储装置71中存储着作为单词联想结果的以汉语文字的[中]开头的[中班]、[中板]、[中保]、[中国]…。
下面进入步骤ST43,控制装置29将存储在单词联想结果存储装置71中的单词中的L个,送到单词联想结果显示装置73。单词联想结果显示装置73对送来的L个单词作为单词联想结果显示。图22中,单词联想装置70对识别结果进行单词联想,在单词联想结果显示装置73中显示结果。图中的74为显示的联想结果的单词。图22表示以L=3为例的情况。作为联想结果的单词74,在单词联想结果显示装置73中显示[中班]、[中板]、[中保]3个单词。这里,书写者想要输入的单词是[中国],但因为以[中]开头的单词数量非常多,在单词联想结果显示装置73中显示的3个联想结果的单词74中,没有显示正确单词。
为此,文字属性显示装置26在步骤ST44中,显示构成单词的下一个文字的文字属性信息。这个文字属性显示装置26显示的文字属性信息在图23中表示。在这个例子中,汉语文字的5种母音信息用拼音来表示。图中的75是第2位文字的文字属性信息,由汉语文字的拼音中的5个母音[a,i,u,e,o]来表示。
下面进入步骤45,选择输入装置27检查是否输入了文字属性信息。其结果,如果没输入文字属性信息,可以输入单词,结束单词输入处理。另一方面,如果选择输入装置27输入了文字属性信息时,则转入步骤ST46。
此时,书写者想要输入的单词是[中国],因为单词联想结果显示装置73中显示的3个联想结果的单词74中没有这个单词,所以选择输入装置27输入第2位文字的文字属性信息,即拼音的母音信息。图24表示选择输入装置27选择输入的文字属性信息。图中被加以网格的75a是选择输入的文字属性信息。在图示的例中,因为单词的第2位文字是汉语文字[国],所以将5种文字信息26a中的、该文字[国]的拼音[guo]的母音信息中的一个,例如[u]输入。
接着,在步骤ST46中,控制装置29将选择输入装置27选择输入的、单词的第2位文字的文字属性信息送到单词联想结果限定装置72。然后单词联想结果限定装置72提取在单词联想结果存储装置71中存储的单词联想结果的文字属性信息,选择有第2位文字的由选择输入装置27选择输入的文字属性信息的单词。
这里,单词联想结果限定装置72提取出的、单词联想结果存储装置71中的单词的文字属性信息的提取结果如图25所示。在图中,与单词联想结果存储装置71中存储的单词联想结果[中班]、[中板]、[中保]、[中国]…相对应的拼音信息[zhong ban]、[zhong ban]、[zhongbao]、[zhong guo]…被提取出。使用选择输入的文字属性信息,通过单词联想结果限定装置72的限定,最终选择的候选单词如图26所示。这里,只选择有第2位文字的拼音的母音信息[u]的单词
[中国](zhong guo)    、[中华](zhong hua)、
[中馈]](zhong kui)    、[中流](zhong liu)、
接着进入步骤ST47,控制装置29将从存储在单词联想结果存储装置71的单词联想结果中,经过单词联想结果限定装置72限定的最上面L个(3个)单词联想结果,作为候选单词送到单词联想结果显示装置73,单词联想结果显示装置73对送来的候选单词进行显示。图27表示单词联想结果显示装置73中显示的新的候选单词。图中的76是更新过的候选单词。在本例中,因为显示的候选单词中显示有正确单词[中国],所以,通过选择这个单词,结束输入处理。
在实施例4中,第2位文字的文字属性信息的显示,是在单词联想处理后进行,但只要这个显示是在选择输入文字属性信息以前,任何时间都可以进行。
在实施例4中,第2位文字的文字属性信息的显示,没有依赖于单词联想结果而进行,但按与实施例2同样的考虑方法,也可以最佳地选择单词联想结果的第2位文字的文字。即,提取单词联想结果存储装置71中存储的单词联想结果中的文字的文字属性信息,设置对文字属性显示装置26中显示的文字属性信息进行限定的单词属性信息限定装置,通过该单词属性信息限定装置从多个文字属性信息中选择最适当的文字属性信息,据此可以选择出选择单词联想结果的第2位文字的最佳文字。
在实施例4中,是书写首位文字,输入第2位文字的文字属性信息,也可以书写到n位文字,输入n+1位文字的文字属性信息。
在实施例4中,对首位文字的单词联想处理结果显示后,输入第2位文字的文字属性信息并进行限制,但在首位文字的书写后接着输入第2位文字的文字属性信息的情况下,也可以进行使用第2文字的文字属性信息的单词联想。
如上所述,根据本实施例4,在输入2个文字以上的单词的情况下,书写构成单词的文字的一部分,对于得到的单词联想结果,使用未书写文字的文字属性信息对候选单词进行限定,所以可以用文字属性信息减少候选单词的数量,可以提高候选单词多的文字的单词联想输入的效率。
在实施例4中,书写单词进行单词识别后,只在单词识别结果不正确时输入文字属性信息,所以可以改善单词识别结果,以更高的准确度输入单词。
发明的效果
如上所述,根据本发明,在书写信息的基础上由识别装置识别的文字识别结果,存储在识别结果存储装置,并在识别结果显示装置中显示,由识别结果限定装置通该显示的文字属性信息、并以选择输入装置选择输入的文字属性信息为基础,从在识别结果存储装置中存储的识别结果中,对在识别结果显示装置中显示的识别结果进行限定,由此实现识别文字,所以只在文字识别结果不正确的情况下,通过选择输入装置选择输入文字属性信息这种简单的文字属性信息的输入,便可以输入正确的文字,可以得到减少书写者的负担,改善文字识别结果,准确度高的识别文字的文字识别装置。
根据本发明,进一步设置文字属性信息限定装置,通过在识别结果存储装置中存储的识别结果的文字属性信息、对在文字属性显示装置中显示的文字属性信息进行限定,据此识别文字,因此,只在文字识别结果不正确的情况下输入正确文字时,其文字属性信息的输入可以更容易,可以取得减少文字的识别处理的计算量的效果。
根据本发明,文字属性信息限定装置提取在识别结果存储装置中存储的识别结果的文字属性信息,并对在文字属性显示装置中显示的文字属性信息进行限定,通过从多个文字属性信息中选择最适合的文字属性信息,实现文字识别,所以只在文字识别结果不正确的情况下进行的正确文字的输入,其文字属性信息的输入可以更容易。
根据本发明,识别对象限定装置通过显示装置中显示的文字属性信息、并以选择输入装置选择输入的文字属性信息为基础,对识别对象的文字进行限定,根据限定后的识别对象文字信息和从输入装置得到的信息,将识别装置识别的文字的识别结果在识别结果显示装置中显示,据此实现文字识别。因此往输入装置书写文字的同时,可以容易地输入文字属性信息,得到能高速、高准确度地识别文字的文字识别装置。
根据本发明,因为使用文字的母音信息作为文字属性信息,所以即使对于没有物理键盘的携带信息终端,也可以很容易地输入文字属性信息,取得减少输入的文字属性信息追加的效果。
根据本发明,从识别装置识别的单词的一部分识别结果,经单词联想装置联想产生的联想结果,存储在单词联想结果存储装置中,并将其在单词联想结果显示装置中显示,由单词联想结果限定装置,以选择输入装置选择输入的构成单词的文字的文字属性信息为基础,从在单词联想结果存储装置中的存储的单词联想结果,对在单词联想结果显示装置中显示的单词联想结果进行限定,从而实现识别文字,所以在输入由多个文字组成的单词时,书写构成单词的文字的一部分,利用未书写文字的文字属性信息,可以减少候选单词的数量,因此,可以得到高速并高精度地进行单词输入的文字识别装置。
根据本发明,进一步设置单词属性信息限定装置,通过对在单词联想结果存储装置中存储的单词联想结果的文字属性信息,对在文字属性显示装置中显示的文字属性信息进行限定,据此实现文字的识别,因此,只在单词识别结果不正确的情况下进行的文字属性信息的输入变得容易,具有可以高速、高准确度地输入单词的效果。
根据本发明,单词属性信息限定装置提取在单词联想结果存储装置中存储的单词联想结果的文字属性信息,并对在文字属性显示装置中显示的文字属性信息进行限定,通过在多个文字属性信息中选择最适合的文字属性信息,实现文字的识别,因此,只在单词识别结果不正确的情况下进行的文字属性信息的输入变得容易,具有可以高速、高准确度地输入单词的效果。

Claims (8)

1.一种文字识别装置,其特征在于,它包括:输入文字的书写信息的输入装置;根据所述输入装置输出的书写信息识别文字,并将该识别结果输出的识别装置;存储所述识别装置输出的识别结果的识别结果存储装置;对所述识别结果存储装置中存储的识别结果进行显示的识别结果显示装置;收存文字的文字属性信息的文字属性辞典;对所述文字属性信息进行显示的文字属性显示装置;对在文字属性显示装置中显示的文字属性信息进行选择的选择输入装置;根据所述选择输入装置选择输入的文字属性信息,从在所述识别结果存储装置中存储的识别结果中,对在所述识别结果显示装置中显示的识别结果进行限定的识别结果限定装置。
2.根据权利要求1所述的文字识别装置,其特征在于,设置有提取出在识别结果存储装置中存储的识别结果的文字属性信息,并对在文字属性显示装置中显示的文字属性信息进行限定的文字属性信息限定装置。
3.根据权利要求2所述的文字识别装置,其特征在于,文字属性信息限定装置提取出存储在识别结果存储装置中的识别结果的文字属性信息,从多个文字属性信息中选择最适合的文字属性信息。
4.一种文字识别装置,其特征在于,它包括:输入文字的书写信息的输入装置;收存文字的文字属性信息的文字属性辞典;对所述文字属性信息进行显示的文字属性显示装置;对在所述文字属性显示装置中显示的文字属性信息进行选择的选择输入装置;根据所述选择输入装置选择输入的文字属性信息,对识别对象的文字进行限定的识别对象限定装置;根据从所述输入装置得到的书写信息,及由所述识别对象限定装置限定的识别对象文字信息进行文字识别,并输出该识别结果的识别装置;对所述识别装置输出的识别结果进行显示的识别结果显示装置。
5.根据权利要求1或4所述的文字识别装置,其特征在于,作为文字属性信息,使用的是文字的母音信息。
6.根据权利要求1至5中的任一项所述的文字识别装置,其特征在于,它设置有:根据识别装置的单词的一部分的识别结果联想单词,并输出单词联想结果的单词联想装置;存储对所述单词联想装置输出的单词联想结果的单词联想结果存储装置;对所述单词联想结果存储装置中存储的单词联想结果进行显示的单词联想结果显示装置;根据选择输入装置选择输入的、构成单词的文字的文字属性信息,从在所述单词联想结果存储装置中存储的单词联想结果,对在单词联想结果显示装置中显示的单词联想结果进行限定的单词联想结果限定装置。
7.根据权利要求6所述的文字识别装置,其特征在于,它设置有提取在单词联想结果存储装置中存储的单词联想结果的文字的文字属性信息,并对在文字属性显示装置中显示的文字属性信息进行限定的单词属性信息限定装置。
8.根据权利要求7所述的文字识别装置,其特征在于,单词属性信息限定装置提取在单词联想结果存储装置中存储的单词联想结果的文字的文字属性信息,并从多个文字属性信息中选择最适合的文字属性信息。
CNB991013247A 1998-02-27 1999-01-19 文字识别装置 Expired - Fee Related CN1160658C (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP48239/98 1998-02-27
JP04823998A JP4101345B2 (ja) 1998-02-27 1998-02-27 文字認識装置
JP48239/1998 1998-02-27

Publications (2)

Publication Number Publication Date
CN1227374A true CN1227374A (zh) 1999-09-01
CN1160658C CN1160658C (zh) 2004-08-04

Family

ID=12797905

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB991013247A Expired - Fee Related CN1160658C (zh) 1998-02-27 1999-01-19 文字识别装置

Country Status (3)

Country Link
JP (1) JP4101345B2 (zh)
CN (1) CN1160658C (zh)
TW (1) TW407248B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102096828A (zh) * 2009-12-15 2011-06-15 富士通株式会社 文字辨识装置及文字辨识方法

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012079252A (ja) * 2010-10-06 2012-04-19 Fujitsu Ltd 情報端末装置、文字入力方法および文字入力プログラム
JP2017122952A (ja) * 2016-01-04 2017-07-13 独立行政法人国立文化財機構 出土文字資料解読システム及び解読装置
US10943363B2 (en) 2016-07-21 2021-03-09 Nec Corporation Image processing apparatus, and image processing method

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102096828A (zh) * 2009-12-15 2011-06-15 富士通株式会社 文字辨识装置及文字辨识方法

Also Published As

Publication number Publication date
JP4101345B2 (ja) 2008-06-18
JPH11250182A (ja) 1999-09-17
CN1160658C (zh) 2004-08-04
TW407248B (en) 2000-10-01

Similar Documents

Publication Publication Date Title
US7982922B2 (en) Image processing apparatus and image processing method for confirming electronic data character quality, and computer program therefor
CN1158627C (zh) 用于字符识别的方法和装置
US6766069B1 (en) Text selection from images of documents using auto-completion
US20060217958A1 (en) Electronic device and recording medium
JP2005508031A (ja) 部首に基づいた、適合化可能な画の書き順システム
CN1740943A (zh) 一种文档加密方法
CN1160658C (zh) 文字识别装置
US11941903B2 (en) Image processing apparatus, image processing method, and non-transitory storage medium
US6567548B2 (en) Handwriting recognition system and method using compound characters for improved recognition accuracy
US20010043742A1 (en) Communication document detector
Almohri et al. A real-time DSP-based optical character recognition system for isolated Arabic characters using the TI TMS320C6416T
JP2000322417A (ja) 画像ファイリング装置及び方法及び記憶媒体
CN1117338C (zh) 一种无笔画顺序的手写字符辨识系统
Tomaschek Evaluation of off-the-shelf OCR technologies
JPH05303619A (ja) 電子スクラップブック
CN1955979A (zh) 文章标题及关联信息的自动抽取装置、抽取方法及抽取程序
CN1177285C (zh) 超大型汉字信息处理装置及方法
CN1573662A (zh) 汉字输入输出方法及装置
Elliman et al. A truthing tool for generating a database of cursive words
CN210515330U (zh) 电子摘录笔
JP2662404B2 (ja) 光学文字読取装置における辞書作成方法
CN1020054C (zh) 光照输入手写印刷体汉字识别系统
JP7180076B2 (ja) 外字検索用プログラムおよび外字検索装置
Ramani et al. Optical character recognition for scripts and documents
CN1023917C (zh) 汉语文字处理之方法

Legal Events

Date Code Title Description
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C06 Publication
PB01 Publication
C14 Grant of patent or utility model
GR01 Patent grant
C19 Lapse of patent right due to non-payment of the annual fee
CF01 Termination of patent right due to non-payment of annual fee