JPH05120494A - 文字認識方法及びその装置 - Google Patents

文字認識方法及びその装置

Info

Publication number
JPH05120494A
JPH05120494A JP3279088A JP27908891A JPH05120494A JP H05120494 A JPH05120494 A JP H05120494A JP 3279088 A JP3279088 A JP 3279088A JP 27908891 A JP27908891 A JP 27908891A JP H05120494 A JPH05120494 A JP H05120494A
Authority
JP
Japan
Prior art keywords
character
characters
candidate
recognition
character recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP3279088A
Other languages
English (en)
Other versions
JP3159745B2 (ja
Inventor
Toru Futaki
徹 二木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP27908891A priority Critical patent/JP3159745B2/ja
Publication of JPH05120494A publication Critical patent/JPH05120494A/ja
Application granted granted Critical
Publication of JP3159745B2 publication Critical patent/JP3159745B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】 高い精度で、かつ、高速に文字認識を実行す
る。 【構成】 文字認識処理を実行して生成した複数の候補
文字に対して、認識の確実度を表す指標である距離
(d)というパラメータを付加する。この距離(d)の
値に基づいて、認識の確実度が低い候補文字を要注意文
字として選び出す。次に、日本語の単語や文書の意味に
注目した文字と文字との結合度を表す結合確率の情報を
格納した結合確率テーブルを参照して、要注意文字の前
後に続く文字との結合度を考慮して、距離(d)の値を
補正する。最後に、補正された距離(d)の値に基づい
て、候補文字の優先順位をソーティングし直して、候補
文字から文字認識結果の文字を決定する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は文字認識方法及びその装
置に関し、特に、文字画像や手書き入力の文字を認識し
て文字コードを出力する文字認識方法及びその装置に関
するものである。
【0002】
【従来の技術】従来の文字認識装置では文字認識率を向
上させるために、日本語の単語辞書を用いた後処理がし
ばしば行われていた。この後処理の概略について、図5
と図6とを参照して説明する。
【0003】いま、文字認識結果の第1候補として、図
5に示すように「写直を撮る」という文字列が得られた
とする。認識処理では一般に複数の候補が出力される
が、この例でも同様に図5に示すような第2〜第3候補
が得られているとする。一方、図6にその一部を示すよ
うに日本語の単語を単語辞書として予め登録しておく。
さて、後処理では文字認識結果の第1候補の最初の文字
「写」に注目する。そして、「写」の文字をキーとして
単語辞書を検索することにより、辞書登録されている単
語「写真」が見いだされる。この単語は、図5に示す文
字認識結果の第3候補の2文字目の文字「真」と組み合
わせることによって得られる単語であることがわかる。
同様に、第2候補の「軍」や第3候補の「宇」で始まる
単語についても単語辞書を検索し、2文字目以降の候補
の文字と組み合わせて一致するような単語が存在するか
どうかを調べる。しかしながら、「軍」や「宇」で始ま
り、かつ、2文字目以降の候補の文字と組み合わせて一
致するような単語は存在しないので、その結果「写真」
が正しい認識結果と判定され、2文字目に関しては
「真」を新たに第1候補に、「直」及び「夏」を各々、
第2〜第3候補に置き換える。
【0004】以上の例では、文字列の1文字目から照合
を行っているが、文字列中においては、(1)上記のよ
うにして単語検索によって確定した次の文字から、及
び、(2)句読点の次の文字から、及び、(3)第1候
補に関して「ひらがな」→「漢字」となる部分が存在す
るとき、その「漢字」の部分から照合を行うという方法
が用いられている。
【0005】
【発明が解決しようとする課題】しかしながら上記従来
例では、次のような欠点があった。 (1)単語照合を始めるべき位置が必ずしも正確には得
られない。 (2)単語辞書利用のために一般に非常に大容量のメモ
リを必要とする。 (3)上記従来例では、第3候補までを対象としていた
が、候補数を増やすと可能な文字列の組み合わせの数が
爆発的に増加し、多大な照合時間を必要とする。 (4)単語とは言えない文字間(例えば、「…は、
…」、「…012…」、「…れば…」など)の結合度
(相関)を考慮していない。 (5)単語検索の結果、一致する単語が存在するか否か
で文字認識の結果を判定しているので、複数の単語が一
致した場合の順序付けが明確でない。
【0006】本発明は上記従来例に鑑みてなされたもの
で、より精度の高い文字認識を行うことが可能な文字認
識方法及びその装置を提供することを目的としている。
【0007】
【課題を解決するための手段】上記目的を達成するため
に本発明の文字認識方法は、以下のような工程からな
る。即ち、画像原稿を読み取って、前記画像原稿に描か
れている文字を認識する文字認識方法であって、前記画
像原稿を読み取る入力工程と、前記入力工程によって読
み取られた前記画像原稿に描かれている文字を一文字づ
つ認識して前記一文字づつについて複数の候補文字を生
成する認識工程と、前記複数の候補文字各々について、
文字認識の確実度を表す指標を生成する確実度生成工程
と、単語や文節の意味から考慮した文字と文字との結合
度を捉えた情報を格納した所定の辞書を参照して、前記
確実度が低い候補文字に対して、該候補文字の前後に続
く文字との前記結合度を考慮して前記指標を補正する補
正工程と、前記補正工程によって補正された指標に基づ
いて、前記複数の候補文字から最適な文字を文字認識の
文字として選択する選択工程とを有することを特徴とす
る文字認識方法を備える。
【0008】また他の発明によれば、画像原稿を読み取
って、前記画像原稿に描かれている文字を認識する文字
認識装置であって、前記画像原稿を読み取る入力手段
と、前記入力手段によって読み取られた前記画像原稿に
描かれている文字を一文字づつ認識して前記一文字づつ
について複数の候補文字を生成する認識手段と、前記複
数の候補文字各々について、文字認識の確実度を表す指
標を生成する確実度生成手段と、単語や文節の意味から
考慮した文字と文字との結合度を捉えた情報を格納した
所定の辞書を参照して、前記確実度が低い候補文字に対
して、該候補文字の前後に続く文字との前記結合度を考
慮して前記指標を補正する補正手段と、前記補正手段に
よって補正された指標に基づいて、前記複数の候補文字
から最適な文字を文字認識の文字として選択する選択手
段とを有することを特徴とする文字認識装置を備える。
【0009】
【作用】以上の構成により本発明は、文字認識を行って
生成した複数の候補文字各々に対して文字認識の確実度
を表す指標を付し、確実度の低い候補文字に対して、そ
の候補文字の前後に続く文字との組み合わせから、単語
や文節としての意味を考慮して指標を補正し、その補正
された指標に基づいて、複数の候補文字の中から最適な
文字を文字認識結果の文字として選択するよう動作す
る。
【0010】
【実施例】以下添付図面を参照して本発明の好適な実施
例を詳細に説明する。
【0011】[装置構成の概要(図1)]図1は本発明
の代表的な実施例である光学的文字認識装置の構成を表
すブロック図である。図1において、1は画像に光を照
射し、その反射光を受光してアナログ電気信号に変換す
るスキャナ、2はその電気信号を白黒画像に対応した2
値信号に変換するインタフェース回路、3はオペレータ
の操作指示を入力するキーボード、4はキーボード3か
らの入力指示を電気信号に変換するインタフェース回
路、5は装置全体の制御及び文字認識処理を実行するC
PU、6はCPU5が実行する制御プログラムや認識辞
書を格納するROM、7は画像データの展開や認識処理
のための作業領域として用いられるRAM、8は入力画
像や認識結果を表示するためのディスプレイ、9はディ
スプレイインタフェース回路、そして、10は各装置構
成要素を接続するCPUバスである。
【0012】[文字認識処理の概要(図2)]次に、上
記構成の文字認識装置を用いて実行する文字認識処理に
ついて、図2に示すフローチャートを参照して説明す
る。
【0013】まず、ステップS201でスキャナから文
書画像を入力し、アナログ電気信号に変換し、ステップ
S202でその電気信号を2値化する。ステップS20
3で文字画像を1文字分ずつ切り出す文字切り出し処理
を行う。そして、ステップS204では切り出された文
字画像に対して、予め登録してある標準パターンとの比
較によって最適な候補を選び出す認識処理を実行する。
この認識処理では最適な文字に近いと判定される上位3
個の候補が出力され、また各候補に対する“認識の確実
さ”の尺度として距離(d)というパラメータが出力さ
れる。距離(d)は、その値が小さいほど候補としての
確実度が高いものと定義する。ステップS205では後
に詳述する要注意候補の判定処理を行う。
【0014】次に、ステップS206では距離(d)の
値に基づいて、候補の確実度を推定する。ステップS2
07では候補の確実度の低いもの(以後、これを要注意
候補と呼ぶ)に対しては、その前後の文字との結合確率
に基づいて距離の補正処理を実行し、さらに要注意候補
に関しては、距離の補正後、距離の小さい順に候補文字
をソーティングして、最後にステップS208で、その
結果を出力する。
【0015】[要注意候補の判定及び距離の補正処理の
詳細(図3〜図4)]ここでは先に略述した文字認識処
理の処理ステップS205〜S207について詳しく説
明する。
【0016】一般的な日本語文書における字種(文字の
種類)や字種間の結合度は一定ではなく、特定のものに
集中しやすい。以下、文字列中に字種aが存在する時、
その次の字種がbである確率を結合確率と呼び、P(a
/b)で表すことにする。P(a/b)の値は母集団の
取り方に依存するため、普遍的な値を得ることはできな
いが、数多くの文書を調べることにより実用的な値を得
ることは可能である。図3はすべての字種に関してその
結合確率を調べた結合確率テーブルの例を示す図であ
る。図3において、左端の欄が字種を表し、右側は字種
ごとの結合確率を表している。ただし、このテーブルに
は左端に示されている基準となる字種に対して、一定の
閾値以上の結合確率をもつ字種しか登録してないので、
右側の登録字種数は一定にはならず、また、登録されて
いる字種の結合確率の和は1にならない。なお、図3に
は説明に必要な字種に関してしか示していない。
【0017】さて、ある文書画像に対して認識処理を行
った結果、図4に示すように「写直を揚る」という文字
列が得られたとする。そして、「直」と「揚」に関して
は認識の確実度が低い、要注意候補とみなされ、オーバ
バーが付加されて表されている。この要注意候補は以下
のようにして判定される。これが、ステップS205の
具体的な処理となる。
【0018】本実施例の認識処理過程では、認識の確実
さを定量的に表すために、距離(d)というパラメータ
を導入し、入力文字と候補字種との距離(d)を算出す
る。ここで第1候補C1 への距離をd1 、第2候補C2
への距離をd2 とすると、一般に認識結果が確実な時は
この差が大きい。
【0019】従って、 d2 −d1 <ε(C1 ) …(1) の時に、この候補を要注意候補と判定する。ここで、ε
(C1 )は、予め定めた閾値である。ε(C1 )は第1
候補に依存しない定数でもよい。以上の処理に基づい
て、図4に示すように、「直」と「揚」が要注意候補と
なる。なお、図4では要注意候補の「直」についてのみ
第2〜3候補まで示している。
【0020】次に、ステップS206で実行する距離の
補正処理について詳細に説明する。まず、この要注意候
補の第1候補「直」に注目する。このとき、第2〜3候
補は各々、「夏」、[真」である。「写」について、図
3の結合確率テーブルを参照すると、第1〜3候補の文
字の内、「真」だけが登録されている。これは、「写」
と「真」との結合確率が「直」や「夏」に比べて高いこ
とを意味している。また、「直」、「夏」、「真」のい
づれの文字に対しても「を」が結合確率テーブルには登
録されていない。これは、「直」、「夏」、「真」のい
づれの文字に対しても「を」の結合確率は低いことを意
味している。逆に、例えば、「私は」のように単語とは
言えなくとも結合確率が低くない組み合わせがあること
もある。
【0021】従って、「写」と「真」との結合確率が高
いと判断して、元々は第3候補であった「真」に対する
距離d(真)を次のように補正する。
【0022】 d′(真)=d(真)−αlog[1−(1−P(写/真)(1−P0 )] ただし、αは正の定数、logは自然対数、P0 は結合
確率の最低値として用いる値で定数である。登録されて
いる字種が結合確率テーブルになかった第1候補の
「直」と、第2候補の「夏」に関しては、P0 だけを用
いて補正するので次のようになる。
【0023】 d′(直)=d(直)−αlog[1−(1−P0 )(1−P0 )] d′(夏)=d(夏)−αlog[1−(1−P0 )(1−P0 )] 以上の関係を一般化すると、次のようになる。
【0024】即ち、注目する要注意候補をbi (i=
1,2,3)とし、その前後の候補がa1 ,c1 である
ような文字列“a1i1 ”(i=1,2,3)
が得られたとする。
【0025】このとき、テーブルを参照してbi に対す
る距離(d)を、 d′(bi )=d(bi )−αlog[1−{1−P(a1 /bi )} {1−P(bi /c1 )}] (2) と補正する。ただし、a1 ,c1 のいずれかまたは両方
が要注意候補であった時、あるいはbi との結合確率が
テーブルに登録されていない時は、P0 の値を代わりに
用いる。
【0026】最後にステップS207では距離の補正処
理後、d′(bi)に関してソーティングし、距離
(d)の小さい順に新たに第1〜3候補を作成する。そ
の結果、第3候補の文字であった「真」が補正処理後は
第1候補の文字となる。また、補正処理によって、第1
候補の文字となった「真」の距離(d)の値と補正処理
後の「直」や「夏」の距離(d)の値との差が大きい値
をもつようになるので、「真」の文字は文字認識の確実
度が高いものとして出力される。
【0027】従って本実施例に従えば、文字認識の後処
理に日本語文書における字種(文字の種類)や字種間の
結合確率を考慮した補正を施すことによって、より正確
な文字認識を行うことができる。また、上記説明した結
合確率テーブルは日本語の意味を考慮して任意の文字に
続く確率の高い文字を格納してあるので、従来例で説明
した単語を登録する単語辞書に比べて、その容量も小さ
く、また、検索する照合する回数も少ないので、より速
い文字認識を行うことができる。
【0028】なお本実施例では、文字画像を光電変換し
て認識する光学的文字認識装置を例として説明したが、
本発明はこれに限定されるものではない。本発明の本質
は文字認識結果とその認識の確実度に対する補正処理に
あり、文字画像の入力手段や認識アルゴリズムに限定さ
れるものではない。例えば、要注意候補の判定方法とし
て、(1)式を用いているが、本発明はこれに限定され
るものではなく、この式をより一般的に f(d1 ,d2 ,…)<ε(d1 ) と表すことも可能である。
【0029】また、距離の補正式(2)も、結合確率の
高い字種間に対しては相対的に距離が小さくなるような
補正ならばよく、より一般的には、 d′(bi )=d(bi )−g{P(a1 /bi ),P(bi /c1 )} と表すことも可能である。
【0030】尚、本発明は、複数の機器から構成される
システムに適用しても良いし、1つの機器から成る装置
に適用しても良い。また、本発明はシステム或は装置に
プログラムを供給することによって達成される場合にも
適用できることは言うまでもない。
【0031】
【発明の効果】以上説明したように本発明によれば、文
字認識を行って生成した複数の候補文字各々に対して文
字認識の確実度を表す指標を付し、確実度の低い候補文
字に対して、その候補文字の前後に続く文字との組み合
わせから、単語や文節としての意味を考慮して指標を補
正し、その補正された指標に基づいて、複数の候補文字
の中から最適な文字を文字認識結果の文字として選択す
るために、単語の意味や文書としての意味を捕らえた、
より正確な文字認識を行うことができる効果がある。さ
らに、単語や文節の意味から考慮した文字と文字との結
合度を捉えた情報を格納した所定の辞書を参照して補正
を行うので、単に文字と文字との組み合わせを考えて単
語辞書を参照する場合に比べて、辞書容量が小さく、ま
た、検索や照合回数が少なくなるので高速な文字認識を
行うことができる効果がある。
【図面の簡単な説明】
【図1】本発明の代表的な実施例である光学的文字認識
装置の構成を示すブロック図である。
【図2】文字認識処理を示すフローチャートである。
【図3】結合確率テーブルを示す図である。
【図4】出力結果の例を示す図である。
【図5】従来例に従う文字認識の出力結果の例を示す図
である。
【図6】従来例に従う単語テーブルを示す図ある。
【符号の説明】
1 スキャナ 3 キーボード 5 CPU 6 ROM 7 RAM 8 ディスプレイ

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 画像原稿を読み取って、前記画像原稿に
    描かれている文字を認識する文字認識方法であって、 前記画像原稿を読み取る入力工程と、 前記入力工程によって読み取られた前記画像原稿に描か
    れている文字を一文字づつ認識して前記一文字づつにつ
    いて複数の候補文字を生成する認識工程と、 前記複数の候補文字各々について、文字認識の確実度を
    表す指標を生成する確実度生成工程と、 単語や文節の意味から考慮した文字と文字との結合度を
    捉えた情報を格納した所定の辞書を参照して、前記確実
    度が低い候補文字に対して、該候補文字の前後に続く文
    字との前記結合度を考慮して前記指標を補正する補正工
    程と、 前記補正工程によって補正された指標に基づいて、前記
    複数の候補文字から最適な文字を文字認識の文字として
    選択する選択工程とを有することを特徴とする文字認識
    方法。
  2. 【請求項2】 画像原稿を読み取って、前記画像原稿に
    描かれている文字を認識する文字認識装置であって、 前記画像原稿を読み取る入力手段と、 前記入力手段によって読み取られた前記画像原稿に描か
    れている文字を一文字づつ認識して前記一文字づつにつ
    いて複数の候補文字を生成する認識手段と、 前記複数の候補文字各々について、文字認識の確実度を
    表す指標を生成する確実度生成手段と、 単語や文節の意味から考慮した文字と文字との結合度を
    捉えた情報を格納した所定の辞書を参照して、前記確実
    度が低い候補文字に対して、該候補文字の前後に続く文
    字との前記結合度を考慮して前記指標を補正する補正手
    段と、 前記補正手段によって補正された指標に基づいて、前記
    複数の候補文字から最適な文字を文字認識の文字として
    選択する選択手段とを有することを特徴とする文字認識
    装置。
JP27908891A 1991-10-25 1991-10-25 文字認識方法及びその装置 Expired - Lifetime JP3159745B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP27908891A JP3159745B2 (ja) 1991-10-25 1991-10-25 文字認識方法及びその装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP27908891A JP3159745B2 (ja) 1991-10-25 1991-10-25 文字認識方法及びその装置

Publications (2)

Publication Number Publication Date
JPH05120494A true JPH05120494A (ja) 1993-05-18
JP3159745B2 JP3159745B2 (ja) 2001-04-23

Family

ID=17606255

Family Applications (1)

Application Number Title Priority Date Filing Date
JP27908891A Expired - Lifetime JP3159745B2 (ja) 1991-10-25 1991-10-25 文字認識方法及びその装置

Country Status (1)

Country Link
JP (1) JP3159745B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009193603A (ja) * 1995-06-07 2009-08-27 Eistream Technologies Inc 走査された及びリアルタイムの手書き文字の識別を行う文字認識システム
US8169545B2 (en) 2007-11-15 2012-05-01 Canon Kabushiki Kaisha Display control apparatus and method for superimposing an object on a moving image

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009193603A (ja) * 1995-06-07 2009-08-27 Eistream Technologies Inc 走査された及びリアルタイムの手書き文字の識別を行う文字認識システム
US8169545B2 (en) 2007-11-15 2012-05-01 Canon Kabushiki Kaisha Display control apparatus and method for superimposing an object on a moving image

Also Published As

Publication number Publication date
JP3159745B2 (ja) 2001-04-23

Similar Documents

Publication Publication Date Title
JP3689455B2 (ja) 情報処理方法及び装置
US8755604B1 (en) Using shape similarity methods to improve OCR speed and accuracy
US8340425B2 (en) Optical character recognition with two-pass zoning
US6834121B2 (en) Apparatus for rough classification of words, method for rough classification of words, and record medium recording a control program thereof
JPH087033A (ja) 情報処理方法及び装置
EP2138959A1 (en) Word recognizing method and word recognizing program
JP3309174B2 (ja) 文字認識方法及び装置
JP3589007B2 (ja) 文書ファイリングシステムおよび文書ファイリング方法
US8549008B1 (en) Determining section information of a digital volume
JPH05120494A (ja) 文字認識方法及びその装置
JP3975825B2 (ja) 文字認識誤り訂正方法、装置及びプログラム
JP4677750B2 (ja) 文書属性取得方法および装置並びにプログラムを記録した記録媒体
JP2006163830A (ja) 文字認識装置、文字認識方法、および文字認識プログラム
JP3071745B2 (ja) 文字認識結果の後処理方法
JP2020047031A (ja) 文書検索装置、文書検索システム及びプログラム
JPH06223121A (ja) 情報検索装置
JP2827066B2 (ja) 数字列混在文書の文字認識の後処理方法
JPH0528324A (ja) 英文字認識装置
JP4261831B2 (ja) 文字認識処理方法、文字認識処理装置、文字認識プログラム
JPH0256086A (ja) 文字認識の後処理方法
JP2996823B2 (ja) 文字認識装置
JP2001022773A (ja) イメージ文書のキーワード抽出方法
JP2001283156A (ja) 住所認識装置、住所認識方法、およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JPH1069494A (ja) 画像検索方法とその装置
JPH0757059A (ja) 文字認識装置

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20010115

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080216

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090216

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100216

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100216

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110216

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120216

Year of fee payment: 11

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120216

Year of fee payment: 11