JPH0546806A - 文字認識方法 - Google Patents

文字認識方法

Info

Publication number
JPH0546806A
JPH0546806A JP3232266A JP23226691A JPH0546806A JP H0546806 A JPH0546806 A JP H0546806A JP 3232266 A JP3232266 A JP 3232266A JP 23226691 A JP23226691 A JP 23226691A JP H0546806 A JPH0546806 A JP H0546806A
Authority
JP
Japan
Prior art keywords
kanji
word
yamada
furigana
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3232266A
Other languages
English (en)
Inventor
Tsuguo Hashimoto
承男 橋本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP3232266A priority Critical patent/JPH0546806A/ja
Publication of JPH0546806A publication Critical patent/JPH0546806A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【構成】 複数の漢字が単語としての区切りのない状態
で入力され、かつ、複数の漢字に対応するふりがなと共
に認識される場合、これら複数の漢字をある文字列の単
語として分割する。その後、分割された各単語と、ふり
がなに対応する漢字とを比較し、これら単語の漢字とふ
りがなによる漢字が一致した場合、この漢字を入力され
た漢字の認識結果とする。 【効果】 単語照合の精度が上がり、文字認識率を向上
させることができる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、手書き漢字OCR(光
学文字読取り装置)等における文字認識方法に関する。
【0002】
【従来の技術】一般に、金融機関における振込等では、
利用者が振込先等を手書きしてこれを文字認識し、所定
の処理を行う場合、手書き漢字OCRが用いられてい
る。この手書き漢字OCRとは、手書きされた漢字や平
仮名等を光学的に読取り、これを判読する装置である。
そして、このような手書き漢字OCRでは、その文字認
識を次のように行っていた。例えば、姓名が漢字とふり
がなとで入力され、これを文字認識する場合、漢字と、
そのふりがなに対応する漢字とを比較して、認識率を向
上させている。また、姓名漢字はその姓と名前とが区別
できるよう姓と名前との間に空白を入れて入力される場
合もあるが、姓と名前とが連続した状態で入力される場
合がある。このような場合、その文字認識は、連続した
状態で入力された漢字と、ふりがなに対応した漢字とを
比較し、その後これらの漢字が一致しない場合は、漢字
を所定の区切り方で区切った後、この区切った単語が単
語照合辞書にあるか否かで漢字とふりがなとの単語照合
を行っていた。
【0003】図2に、従来の文字認識方法のフローチャ
ートを示す。図の示した文字認識方法は、姓名の照合処
理の場合であり、かつその姓名漢字が連続した状態、い
わゆるべた書きされた状態で入力された場合の文字認識
方法である。先ず、ステップS1でふりがな付き単語の
単語照合が行われる。図3(a)は、べた書きされた姓
名漢字とそのふりがなの文字認識結果を示す。この図3
の(a)に示すように、姓名漢字は「山田太郎」とべた
書きされている。また、ふりがなの場合は通常、姓と名
前との間に空白(図中、□印で示す)が挿入され、姓と
名前とが区別されるようになっている。このため、ステ
ップS1では、漢字「山田太郎」と、ふりがな「ヤマ
ダ」に対応する漢字をふりがな辞書から検索する。ここ
で、ふりがな辞書とは、認識されたふりがなに対応する
漢字が格納されている辞書であり、例えば、「ヤマダ」
に対応する漢字は、図中Aに示すように、「山田」「矢
間田」…があるとする。
【0004】ところが、「山田太郎」は当然のことなが
ら、ふりがな辞書の、姓あるいは名前のみの漢字には存
在しないため、ステップS2では、正常終了、即ち漢字
とふりがなとが一致し照合が完了した状態とはならず、
ステップS3に移行する。ステップS3では、ふりがな
を考慮せず、認識された漢字のみを照合する。即ち、
「山田太郎」を姓名辞書から検索し、対応する単語があ
るか否かを判断する。また、姓名辞書とは姓あるいは名
前別に各種の姓名単語が格納されている辞書である。こ
こでは、図中Bに示すように、「山田太郎」という単語
は存在しないため、ステップS4では、正常終了せず、
ステップS5に移行する。ステップS5では、べた書き
処理を行うかどうかを判断するが、ここでは姓名漢字が
べた書き入力されているため、ステップS6に進み、姓
名漢字の切り分け処理を行う。この切り分け処理とは、
べた書きされた漢字をある所定の区切り方で切り分ける
処理である。例えば、漢字が4文字の場合は、2文字ず
つとし、漢字が5文字の場合は2文字と3文字とに切り
分ける。上記の場合は、漢字が4文字であるため、2文
字ずつに区切り、この切り分けた状態でステップS2に
戻り、再度、ふりがな無し単語の単語照合を行う。
【0005】図3(b)に、切り分け後の漢字とふりが
なを示す。このように、切り分け後は、漢字が「山田」
と「太郎」とに分割されており、この状態で姓名辞書の
検索を「山田」「太郎」の順に行う。今度の場合は、図
中CおよびDに示すように、それぞれの単語に対応する
単語があるため、ステップS4では正常終了し、ステッ
プS7に移行する。ステップS7では、全単語の照合が
終了したかどうかを判断し、終了していない場合はステ
ップS3に戻り、上記の処理を繰り返し、全単語が終了
した場合は、その処理結果、例えばこの場合は、判読結
果が、漢字「山田太郎」、ふりがな「ヤマダ タロウ」
となり、この判読結果が出力される(ステップS8)。
尚、上記動作において、例えば漢字が姓しか入力されな
い等の場合は、ふりがなから求められる漢字と一致する
ため、ステップS2において正常終了し、ステップS7
に移行する。
【0006】
【発明が解決しようとする課題】上記のように、従来の
文字認識方法は、べた書きされた漢字を複数の単語に切
り分けて単語照合を行う際には、ふりがなとの比較を行
っていなかった。しかしながら、べた書きされた漢字が
正常に文字認識された場合は、このような照合方法でも
ある程度正しい認識結果が得られるが、手書き入力の場
合は、漢字の文字認識が正確に行えない場合がある。例
えば、上記の例において、「山田太郎」が「山口太郎」
と文字認識されてしまった場合、図2のフローチャート
で、ステップS6で単語の切り分けが行われるのは上記
の例と同様である。ところが、ここで、「山口」と誤認
識された場合であっても姓名辞書には「山口」が存在す
るため、ステップS4では正常終了し、従って、ふりが
なが「ヤマダ タロウ」となっているにもかかわらず、
処理結果は「山口太郎」となってしまう。このように、
姓名漢字の誤認識があった場合は、そのまま誤認識結果
となってしまい、文字の認識率が低下するという問題点
があった。本発明は、上記従来の問題点を解決するため
になされたもので、文字認識率を向上させることのでき
る文字認識方法を提供することを目的とする。
【0007】
【課題を解決するための手段】本発明の文字認識方法
は、複数の漢字が単語としての区切りのない状態で入力
されると共に、前記複数の漢字に対応するふりがなとが
入力された場合、これら複数の漢字とふりがなとの文字
認識を行い、かつ、前記複数の漢字を所定の文字列の単
語に分割し、前記分割された単語の認識結果と、前記ふ
りがなの認識結果に対応して備えられた漢字が一致する
か否かを比較し、前記単語の認識結果と前記ふりがなに
対応して備えられた漢字とが一致した場合に、この漢字
を前記複数の漢字の認識結果とすることを特徴とするも
のである。
【0008】
【作用】本発明の文字認識方法においては、複数の漢字
が単語としての区切りのない状態で入力され、かつ、複
数の漢字に対応するふりがなと共に認識される場合、こ
れら複数の漢字をある文字列の単語として分割する。そ
の後、分割された各単語と、ふりがなに対応する漢字と
を比較し、これら単語の漢字とふりがなによる漢字が一
致した場合、この漢字を入力された漢字の認識結果とす
る。従って、単語照合の精度が上がり、文字認識率を向
上させることができる。
【0009】
【実施例】以下、本発明の実施例を図面を用いて詳細に
説明する。図1は本発明の文字認識方法の実施例を示す
フローチャートである。また、図4は、本実施例におけ
る切り分け前(a)と切り分け後(b)の状態を示す図
である。先ず、ステップS1において、べた書きされた
姓名漢字「山田太郎」をふりがな「ヤマダ」に対応する
ふりがな辞書の漢字「山田」「矢間田」…と比較するの
は従来と同様である。そして、この場合もステップS2
で正常終了しないため、ステップS3に進んで、ふりが
な無し単語の単語照合、即ち、姓名辞書に「山田太郎」
という単語があるかを検索する。ここでも、該当する単
語は存在しないため、ステップS4でも正常終了せず、
ステップS5に移行する。このステップS5において
は、姓名漢字がべた書きされた状態であるため、べた書
き処理を行うよう判断し、ステップS6で、べた書き単
語の切り分けを行う。尚、これまでの動作は従来と同様
である。
【0010】ステップS6において、姓名漢字が切り分
けられると、ステップS1に戻り、再度、ふりがな付き
単語の単語照合を行う。これが従来と異なる点であり、
本実施例の特徴点をなすものである。図4(b)に示す
ように、べた書きされた「山田太郎」は、「山田」と
「太郎」に切り分けられ、今度は、各単語について照合
が行われる。即ち、切り分けられた漢字「山田」と、ふ
りがなの「ヤマダ」からふりがな辞書で抽出された「山
田」「矢間田」…とを比較し、一致する単語があるか否
かを調べる。ここでは、「山田」が一致するため、ステ
ップS2では正常終了と判断し、ステップS7に移行す
る。そして、このような動作を全単語が終了するまで繰
り返し、全単語が終了した場合は、文字認識結果を出力
する(ステップS8)。
【0011】また、ふりがなの文字認識が誤っている場
合も考えられ、この場合は、ステップS3、S4の処理
を行う。図5は、ふりがなの誤認識例の説明図である。
この例では、姓の「ヤマダ」が「アマダ」と誤認識され
た例を示しており、従って、「アマダ」からふりがな辞
書で抽出される漢字は、「甘田」「亜間田」…となって
いる。このような場合は、ステップS6におけるべた書
き単語の切り分け処理以後のふりがな付き単語の単語照
合処理(ステップS1)では、当然「山田」と「アマ
ダ」に対応する漢字は一致しないため、ステップS2で
は正常終了とならず、ステップS3に移る。ステップS
3では、ふりがな無し単語の単語照合処理、即ち、姓名
漢字辞書で「山田」に対応する単語があるか否かを調
べ、一致した単語があった場合は、ステップS4で正常
終了とし、ステップS7に移行する。尚、この例では、
姓のふりがなが誤認識された場合を説明したが、名前が
誤認識された場合でも同様である。
【0012】次に、従来との比較を行うために漢字「山
田」が「山口」と誤認識された場合について説明する。
図6にこのような場合を示す。図中の認識結果は、「山
田」における各文字「山」「田」の文字認識処理結果を
示しており、この場合の「山」の認識結果は「山」
「川」の順であり、「田」の認識結果は「口」「田」
「甲」の順である。従って、「山田」の第1認識結果は
「山口」となる。この場合、図1のフローチャートにお
いて、ステップS1からステップS6でべた書き単語の
切り分けを行い、ステップS1に戻って「山口」のふり
がな付き単語の単語照合処理を行うまでは、上記実施例
の説明と同様である。一方、ステップS1の単語照合処
理において、「山口」に相当するふりがな「ヤマダ」の
漢字単語は存在しないため、「山」「田」の各第2認識
結果以降の漢字を探す。ここで、「田」の第2認識結果
は「田」であるため、「山」とこの「田」を組み合わせ
ると、ふりがな辞書から抽出した漢字「山田」に一致す
るとして、これを採用する。これにより従来は、「山
口」と誤認識された状態で処理結果となっていた文字が
「山田」と正確に認識され、認識率を向上させることが
できる。
【0013】尚、上記実施例では、文字認識方法の適用
例として、手書き漢字OCRに用いる場合を説明した
が、このような装置に限定されるものではなく、例え
ば、手書き漢字だけではなく、印刷文字の認識に用いて
もよいことは勿論である。また、上記実施例では漢字と
そのふりがなが入力された例として、姓名入力とした
が、この他にも住所等、漢字とそのふりがなとにより単
語照合が行えるものであれば、上記実施例と同様の効果
を奏する。
【0014】
【発明の効果】以上説明したように、本発明の文字認識
方法によれば、入力される複数の漢字がべた書きされた
状態の場合、各単語に分割した後にもふりがなデータと
の照合を行うようにしたので、単語照合の精度が上が
り、文字の認識率を向上させることができる。
【図面の簡単な説明】
【図1】本発明の文字認識方法の実施例を示すフローチ
ャートである。
【図2】従来の文字認識方法を示すフローチャートであ
る。
【図3】従来の文字認識方法における文字列分割の説明
図である。
【図4】本発明の文字認識方法における文字列分割の説
明図である。
【図5】本発明の文字認識方法におけるふりがな誤認識
の場合の説明図である。
【図6】本発明の文字認識方法における漢字誤認識の場
合の説明図である。

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 複数の漢字が単語としての区切りのない
    状態で入力されると共に、 前記複数の漢字に対応するふりがなとが入力された場
    合、 これら複数の漢字とふりがなとの文字認識を行い、 かつ、前記複数の漢字を所定の文字列の単語に分割し、 前記分割された単語の認識結果と、前記ふりがなの認識
    結果に対応して備えられた漢字が一致するか否かを比較
    し、 前記単語の認識結果と前記ふりがなに対応して備えられ
    た漢字とが一致した場合に、この漢字を前記複数の漢字
    の認識結果とすることを特徴とする文字認識方法。
JP3232266A 1991-08-20 1991-08-20 文字認識方法 Pending JPH0546806A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3232266A JPH0546806A (ja) 1991-08-20 1991-08-20 文字認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3232266A JPH0546806A (ja) 1991-08-20 1991-08-20 文字認識方法

Publications (1)

Publication Number Publication Date
JPH0546806A true JPH0546806A (ja) 1993-02-26

Family

ID=16936558

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3232266A Pending JPH0546806A (ja) 1991-08-20 1991-08-20 文字認識方法

Country Status (1)

Country Link
JP (1) JPH0546806A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113052179A (zh) * 2021-03-09 2021-06-29 安徽淘云科技股份有限公司 多音字处理方法、装置、电子设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5699573A (en) * 1980-01-09 1981-08-10 Hitachi Ltd Kanji (chinese character) distinction system using katakana (square form of japanese syllabary)
JPS6095689A (ja) * 1983-10-31 1985-05-29 Toshiba Corp 光学的文字読取装置
JPH01316889A (ja) * 1988-06-17 1989-12-21 Fujitsu Ltd 手書き文字認識方式
JPH0223490A (ja) * 1988-07-13 1990-01-25 Toshiba Corp 文字読取システム
JPH0247788A (ja) * 1988-08-09 1990-02-16 Glory Ltd 硬貨収納繰出装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5699573A (en) * 1980-01-09 1981-08-10 Hitachi Ltd Kanji (chinese character) distinction system using katakana (square form of japanese syllabary)
JPS6095689A (ja) * 1983-10-31 1985-05-29 Toshiba Corp 光学的文字読取装置
JPH01316889A (ja) * 1988-06-17 1989-12-21 Fujitsu Ltd 手書き文字認識方式
JPH0223490A (ja) * 1988-07-13 1990-01-25 Toshiba Corp 文字読取システム
JPH0247788A (ja) * 1988-08-09 1990-02-16 Glory Ltd 硬貨収納繰出装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113052179A (zh) * 2021-03-09 2021-06-29 安徽淘云科技股份有限公司 多音字处理方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
US5161245A (en) Pattern recognition system having inter-pattern spacing correction
JPH0546806A (ja) 文字認識方法
JPH06215184A (ja) 抽出領域のラベリング装置
JPS6239793B2 (ja)
JPS6262388B2 (ja)
JPH0256086A (ja) 文字認識の後処理方法
JP2618018B2 (ja) 文字認識装置
JP2560959B2 (ja) 文字認識後処理方式
JP2939945B2 (ja) ローマ字住所認識装置
JPH11120294A (ja) 文字認識装置および媒体
JPS60138689A (ja) 文字認識方法
JP3245415B2 (ja) 文字認識方法
JPH06309507A (ja) 文字認識装置
JPS646514B2 (ja)
JP2875678B2 (ja) 文字認識結果の後処理方法
JP3725206B2 (ja) 文字認識装置
JPH0239290A (ja) 単語照合方式
JPS60225987A (ja) パタ−ン認識装置
JPH06259595A (ja) 文字認識処理装置及び認識処理方法
JPH03156589A (ja) 誤読文字の検出,修正方法
JPH04318687A (ja) 文字認識装置
JPH0262659A (ja) 日本文訂正候補文字抽出装置
JPH056464A (ja) 文字列認識方法及びその装置
JPS63138479A (ja) 文字認識装置
JPH0786908B2 (ja) 単語照合装置