JPH06337966A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH06337966A
JPH06337966A JP5148616A JP14861693A JPH06337966A JP H06337966 A JPH06337966 A JP H06337966A JP 5148616 A JP5148616 A JP 5148616A JP 14861693 A JP14861693 A JP 14861693A JP H06337966 A JPH06337966 A JP H06337966A
Authority
JP
Japan
Prior art keywords
recognition
character
dictionary
hand
handwritten
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5148616A
Other languages
English (en)
Inventor
Akihiko Sakai
明彦 酒井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP5148616A priority Critical patent/JPH06337966A/ja
Publication of JPH06337966A publication Critical patent/JPH06337966A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】 オペレータの操作性が向上でき、しかも客観
的判断に基づく効果的な認識辞書の選択を行うことがで
きる文字認識装置を提供することを目的とする。 【構成】 文書画像の文字切り出し処理によって得られ
た手書き文字画像の1部に対して予め用意された複数の
手書き文字認識辞書を用いてそれぞれ認識を行い、それ
によって得られた複数の認識結果に基づいて、その手書
き文書画像全体の認識に最適な手書き文字認識辞書の選
択を自動的に行う。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、手書き文書画像を入力
して、該手書き文書画像の文字に認識処理を施す文字認
識装置に関するものである。
【0002】
【従来の技術】一般的な手書き文字においては、筆記者
特有の癖などの影響によりたとえ同じ文字であっても、
実際に記述された文字の場合その筆記者によりかなりの
違いがある。こうした筆記者の癖は、いくつかの癖のパ
ターンに分類することはある程度可能であるにしても、
ある一つのパターンで代表させることは難しい。
【0003】文字認識では通常、認識したい文字画像デ
ータに対して特徴の抽出を行い、その抽出された特徴抽
出量と予め求めておいた全ての認識対象文字の標準パタ
ーンとを比較して、どの程度マッチングがとれているを
調べ、その結果を基準にして正解文字を決定する。ここ
で、マッチングの対象とする全ての認識対象文字の標準
パターンとその文字を表す文字コードとのセットをまと
めて登録したものが認識辞書と呼ばれるものであるが、
唯一つの認識辞書によって手書き文字認識を行うこと
は、先に指摘したような手書き文字のパターンの多種多
様さを考えると大変困難である。
【0004】これを解決する手段としては、様々な手書
き文字のパターンに対応させた筆記者別あるいは筆記者
の癖パターン別の認識辞書を予め複数用意しておき、認
識対象とする手書き文書の認識に最も適していると思わ
れる辞書をオペレータがそのつど選択し、それに基づい
て認識を行うという方法があった。
【0005】
【発明が解決しようとする課題】しかしながら上記従来
例では、認識辞書の選択をオペレータが何らかの指示操
作によって行わなければならず面倒である上、辞書選択
のための判断基準もオペレータの主観に左右される部分
が大きく、常に効果的な辞書選択がなされているという
保証を得ることは大変困難であった。
【0006】本発明は上記従来の問題点に鑑み、オペレ
ータの操作性が向上でき、しかも客観的判断に基づく効
果的な認識辞書の選択を行うことができる文字認識装置
を提供することを目的とする。
【0007】
【課題を解決するための手段】上記目的を達成するため
に本発明は、入力された手書き文書画像に対して1文字
ずつの切り出しを行う切り出し手段と、切り出された手
書き文字画像群の1部分に対し異なる複数の手書き文字
認識辞書によって特徴抽出及びマッチングを行う第1の
認識手段と、前記特徴抽出及びマッチングにより得られ
た複数の認識結果に基づき該手書き文書画像全体の認識
に最適な手書き文字認識辞書を選択する辞書選択手段
と、選択された手書き文字認識辞書により該手書き文書
画像全体の特徴抽出及びマッチングを行う第2の認識手
段とを備え、前記第2の認識手段の認識結果に基づき正
解文字を決定するようにしたものである。
【0008】
【作用】上記構成により本発明によれば、文書画像の文
字切り出し処理によって得られた手書き文字画像の1部
に対して予め用意された複数の手書き文字認識辞書を用
いてそれぞれ認識を行い、それによって得られた複数の
認識結果に基づいて、その手書き文書画像全体の認識に
最適な手書き文字認識辞書の選択を自動的に行う。
【0009】
【実施例】以下、図面を参照して本発明の実施例を説明
する。
【0010】図1は、本発明に係る文字認識装置の実施
例の概略構成を示すブロック図である。
【0011】図中の101は、読取り対象から手書き文
字文書をアナログ信号に変換して読み取るスキャナであ
る。このスキャナ101の出力側には、スキャナ101
から出力されたアナログ信号を2値のデジタル信号に変
換する2値化回路102が接続されている。この2値化
回路102は以下に述べる他の構成要素と共に外部バス
ライン111に接続されている。外部バスライン111
は外部アドレス及び外部データバスを含む。
【0012】CPU(中央処理装置)103は、外部バ
スライン111を介して後述するROM105及び外部
記憶106のアドレッシングやデータのやり取り等を行
い、装置全体の動作を制御するものであり、割り込み入
力ポート、割込み制御回路、クロックパルス発生器、命
令デコーダ、レジスタ群、ALU、入力ポート、出力ポ
ート及びイメージ入力シフトレジスタを含む大規模集積
回路(LSI)よりなる。
【0013】ランダムアクセスメモリ(RAM)104
は、アドレスごとに割り付けられた読み書き可能な記憶
部を有し、CPU103のワークエリアとして使用され
ると共に、2値化回路102より入力された手書き文字
文書画像データ、手書き文字文書画像の一部分に対する
複数の筆記者別認識辞書による複数の認識結果データ及
び複数の筆記者別認識辞書より本手書き文書画像の認識
に最適であると決定された手書き認識辞書による手書き
文字文書画像全体の認識結果データを一時的に格納する
ための記憶領域として使用される。
【0014】リードオンリーメモリ(ROM)105
は、CPU103によって順次実行されるプログラム、
書き替え不可能な基本手書き認識辞書、及び各種判定等
で用いられる定数をコード化して収納している。なお、
基本手書き認識辞書には、一定レベルの認識性能を保つ
ことができるようにするために、書き替え不可能で且つ
筆記者を選ばない標準的な手書き認識辞書が記憶されて
いる。
【0015】外部記憶106は、RAM104に一時的
に格納した文書画像データや認識結果データ、及びオペ
レータによって登録された筆記者別認識辞書を長期的に
保存するための記憶領域として使用される。
【0016】CRTインターフェイス107は、出力デ
ータを受け取ってCRT108に表示するための信号を
発生させる。また、キーボード109とポインティング
デバイス110はオペレータが該文字認識装置に対する
指示を入力するための装置である。
【0017】図2は、図1中のCPU103の動作を説
明するフローチャートであり、この処理を実行する制御
プログラムはROM105に記憶されている。
【0018】まず、ステップS201で、スキャナ10
1においてオペレータによりセットされた読取り対象か
らの手書き文書画像情報をアナログ信号として読み込
み、さらに、2値化回路102によって該アナログ信号
を2値化してRAM104に記憶する。
【0019】続いてステップS202では、前記ステッ
プS201で入力した2値化された手書き文書画像デー
タに対して文字切り出し処理を行う。文字の切り出し処
理は、1文字ずつの手書き文字画像の外接矩形を求め、
その矩形の大きさの手書き文字画像データ群を次々とR
AM104に記憶されることによって行う。
【0020】次にステップS203では、前記ステップ
S202で切り出し処理を行った手書き文字画像データ
の認識に対して最適である手書き文書認識辞書の選択を
行う。この選択処理の詳細な手順を図3及び図4のフロ
ーチャートに示す。
【0021】本選択処理は、文字の切り出し処理によっ
て切り出された手書き文字画像データ群の中のある1部
分の切り出し文字画像群について、あらかじめROM1
05に記憶されているM個の筆記者別手書き文字認識辞
書を用いることにより、実際に認識を行い、それによっ
て得られた複数の認識結果を比較することによって該文
書画像全体の認識に最適な手書き文書認識辞書を選出す
るというものである。
【0022】この選択処理のための認識は、最初は切り
出された手書き文字画像データ群の中の第1文字目の文
字画像に対して行われ、以後第2文字目、第3文字目…
という順に選択処理が終了するまで行われる。
【0023】ステップS301では、この選択処理のた
めの認識が何文字目の切り出し文字画像データに対して
行われているかを示す文字画像データの番号iを1に初
期化している。
【0024】また、続いてのステップS302では、こ
の第i文字目の切り出し文字画像データに対する認識が
どの手書き文書認識辞書を用いて行われているかを示す
手書き文書認識辞書番号jを1に初期化している。
【0025】ステップS303では、第i文字目の切り
出し文字画像データの位置、傾き、線幅、濃度等に対す
る正規化処理を行う。
【0026】ステップS304では、正規化された第i
番目の切り出し文字画像データを認識部に送り込み、そ
れがどんな文字かを手書き文字認識辞書jを用いること
によって認識する。認識はまず正規化された切り出し文
字画像データに対して輪郭線特徴等の抽出を行い、その
抽出された特徴ベクトルと認識辞書における全ての文字
の標準パターンベクトルとのマッチングをとり、その際
最も確からしいとされた文字の文字コード及びマッチン
グによって得られた特徴ベクトルと標準パターンベクト
ル間の距離(以下ではこれをベクトル間距離という)と
を出力することにより行う。なお、ベクトル間距離は認
識結果の類似度の強さを示す尺度となるものであり、こ
の値が小さければ小さいほど認識結果の類似度は高いこ
とを示す。
【0027】このステップS304による結果は、第j
番目の筆記者別手書き文字認識辞書による認識結果デー
タとしてRAM104に記憶される。
【0028】ステップS305では、jの値をチェック
し、まだ値M以上になっていない場合にはjには1を加
算し、ステップS304以下の処理を繰り返す。即ち、
1番目からM番目までの筆記者別手書き文字認識辞書に
ついてステップS304の認識処理を行うこととなる。
これらの認識結果データの構造を図5に示す。
【0029】第M番目の筆記者別手書き文字認識辞書に
対する認識処理が終わると、ステップS306では、ス
テップS304〜305で得られたM個の認識結果文字
コードを調べ、過半数、即ち(M/2+1)個以上にお
いて同じ文字コードを認識結果として出力しているもの
が存在しているかをチェックする。もし存在するなら
ば、その過半数を占めた文字コードが正しい認識結果で
あると仮定しステップS307の処理を行う。
【0030】もし同じ文字コードを認識結果として出力
しているものが過半数に満たない場合には、どの文字コ
ードが正しい結果を示しているかを判断することが困難
であるため、その第i文字目の文字画像認識結果に基づ
く最適な認識辞書選択のための判断を中止し、iに1を
加算しステップS302以下の処理を繰り返す。すなわ
ち、i=1の初期状態の場合には、続く第2文字目の文
字画像認識結果に対してステップS302以下の処理を
行うこととなる。
【0031】一方、ステップS307では、ステップS
306で正解であるとした文字コードを認識結果として
いるものの中でそのベクトル間距離が最も小さい認識辞
書、すなわちこの第i番目の文字画像の認識にもっとも
適していると思われる認識辞書の番号mに対応した辞書
選択回数カウンタメモリCmを1つカウントする。辞書
選択回数カウンタメモリC1〜CMは、第1〜第M番目の
それぞれの認識辞書が最適であると判定された回数を記
憶するための記憶領域である。
【0032】続くステップS308ではステップS30
7でカウントされた辞書選択回数カウンタメモリC1〜
CMの値の最大値を調べ、その最大値を示した辞書選択
回数カウンタメモリCmaxの値がN以上になっている
かをチェックする。ここでもしCmaxの値がNより小
さい場合には、文書画像全体を認識するために最も適し
た認識辞書を決定するための判断材料が不十分であると
いう理由により判断保留の決定がなされ、iに1を加算
しステップS302以下の処理を繰り返す。
【0033】従って、iの値が初期状態の1であり、か
つN>1であるとすれば、第1文字目の文字画像に対す
るステップS301〜ステップS307の処理が行われ
た時点でこの条件が満たされることはなく、従って、処
理対象とする文字画像が最低N文字目になるまでは、続
く第2文字目、第3文字目の文字画像…というようにス
テップS302〜ステップS308の処理が繰り返され
ることとなる。
【0034】ステップS302〜ステップS308の処
理が何度か繰り返された後に辞書選択回数カウンタメモ
リC1〜CMのいずれかの値がN以上となった場合、ステ
ップS309以下において最適な手書き文字認識辞書の
決定が行われる。
【0035】ステップS309において辞書選択回数カ
ウンタメモリC1〜CMの値の最大値であるCmaxの値
がN以上であった場合を考えると、それに対応する筆記
者別手書き文字認識辞書は、筆記者別手書き文字認識辞
書1〜Mの中で本文書画像全体を認識するために最適な
辞書である可能性が高いといえる。
【0036】しかしながらこのCmaxの値がCmaxを除い
た他の辞書選択回数カウンタメモリの値とあまり大きな
差がない場合には、たとえCmaxが他の全ての辞書選択
回数カウンタメモリの値よりも大きかったとしても、C
maxに対応する筆記者別手書き文字認識辞書が本文書画
像全体を認識するために最適であるとはいい難い。
【0037】そこで、ステップS309ては、次のよう
な基準に基づき、本文書画像全体を認識するための手書
き文字認識辞書を選択する。
【0038】(1)最大値を示している辞書選択回数カ
ウンタメモリCmaxの値が、それを除く他の辞書選択回
数カウンタメモリの値の総和の2倍以上になっている場
合には、Cmaxに対応する筆記者別手書き文字認識辞書
を本文書画像全体を認識するために最適な辞書として選
択する。
【0039】(2)最大値を示している辞書選択回数カ
ウンタメモリCmaxの値が、それを除く他の辞書選択回
数カウンタメモリの値の総和の2倍以下になっている場
合には、予め登録されている筆記者別手書き文字認識辞
書1〜Mの中には本文書画像全体を認識するために最適
な辞書はないと判断し、ROM105に記憶された基本
手書き認識辞書を本文書画像全体を認識するための辞書
として選択する。
【0040】なお、図6に辞書選択回数カウンタメモリ
C1〜CMの内容に対応したステップS308、ステップ
S309における処理判断の分岐の例を示す。
【0041】ステップS203で選択された最適な手書
き文書認識辞書を用いて、ステップS204では全文字
画像データに対して認識処理が行われる。認識の手法は
ステップS303,ステップS304に示したものとほ
ぼ同様であり、まず正規化された切り出し文字画像デー
タに対し輪郭線特徴等の抽出を行い、その抽出された特
徴ベクトルと認識辞書における全ての文字の標準パータ
ンベクトルとのマッチングをとり、その際最も確からし
いとされた文字を第1候補とし、その後2番目、3番目
に確からしいものを第3候補…と以下同様に第8候補ま
で出力することによって行う。このステップS204に
よる結果は認識結果データとしてRAM104に記憶さ
れる。
【0042】最後にステップS205では、ステップS
204で作成された認識結果データを外部記憶106に
格納する。
【0043】なお、本発明は、図示の実施例に限定され
ず、種々の変形が可能である。例えば、その変形例とし
て次のようなものがある。
【0044】(1)複数の候補となる筆記者別手書認識
辞書のそれぞれの認識結果の比較に基づいて最適な筆記
者別手書き認識辞書を選択するのであれば、その具体的
な手法については上記実施例と異なっていてもよい。
【0045】(2)候補となる複数の手書き認識辞書は
上記実施例のようにオペレータによって登録された筆記
者別手書き認識辞書に限定することはなく、筆記者によ
く見られる一般的な癖や傾向(例えば、文字の大小や右
上がり文字、左上がり文字など)によくマッチするよう
な手書き認識辞書をメーカーが予め登録しておいたもの
であってもよい。
【0046】
【発明の効果】以上に説明したように、本発明によれ
ば、入力された手書き文書画像に対して1文字ずつの切
り出しを行う切り出し手段と、切り出された手書き文字
画像群の1部分に対し異なる複数の手書き文字認識辞書
によって特徴抽出及びマッチングを行う第1の認識手段
と、前記特徴抽出及びマッチングにより得られた複数の
認識結果に基づき該手書き文書画像全体の認識に最適な
手書き文字認識辞書を選択する辞書選択手段と、選択さ
れた手書き文字認識辞書により該手書き文書画像全体の
特徴抽出及びマッチングを行う第2の認識手段とを備
え、前記第2の認識手段の認識結果に基づき正解文字を
決定するようにしたので、オペレータの操作性が向上す
る上、客観的判断に基づく効果的な認識辞書の選択を行
うことができる。
【図面の簡単な説明】
【図1】本発明に係る文字認識装置の実施例の概略構成
を示すブロック図である。
【図2】図1中のCPU103の動作を説明するフロー
チャートである。
【図3】最適な手書き文書認識辞書の選択を行うための
手順を示すフローチャートである。
【図4】図3の続きのフローチャートである。
【図5】複数の認識辞書による認識結果データの記憶形
式を示す図である。
【図6】最適な手書き認識辞書の選択処理における辞書
選択回数カウンタメモリの内容に対応した処理判断の分
岐の例を示す図である。
【符号の説明】
101 スキャナ 102 2値化回路 103 CPU 104 RAM 105 ROM 106 外部記憶 107 CRTインターフェイス 108 CRT 109 キーボード 110 ポインティングデバイス 111 外部バスライン

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】入力された手書き文書画像に対して1文字
    ずつの切り出しを行う切り出し手段と、 切り出された手書き文字画像群の1部分に対し異なる複
    数の手書き文字認識辞書によって特徴抽出及びマッチン
    グを行う第1の認識手段と、 前記特徴抽出及びマッチングにより得られた複数の認識
    結果に基づき該手書き文書画像全体の認識に最適な手書
    き文字認識辞書を選択する辞書選択手段と、 選択された手書き文字認識辞書により該手書き文書画像
    全体の特徴抽出及びマッチングを行う第2の認識手段と
    を備え、 前記第2の認識手段の認識結果に基づき正解文字を決定
    することを特徴とする文字認識装置。
JP5148616A 1993-05-27 1993-05-27 文字認識装置 Pending JPH06337966A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5148616A JPH06337966A (ja) 1993-05-27 1993-05-27 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5148616A JPH06337966A (ja) 1993-05-27 1993-05-27 文字認識装置

Publications (1)

Publication Number Publication Date
JPH06337966A true JPH06337966A (ja) 1994-12-06

Family

ID=15456772

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5148616A Pending JPH06337966A (ja) 1993-05-27 1993-05-27 文字認識装置

Country Status (1)

Country Link
JP (1) JPH06337966A (ja)

Similar Documents

Publication Publication Date Title
US5410611A (en) Method for identifying word bounding boxes in text
US5539841A (en) Method for comparing image sections to determine similarity therebetween
US5394484A (en) Image recognition apparatus
JP2991779B2 (ja) 文字認識方法及び装置
US5621818A (en) Document recognition apparatus
US8103099B2 (en) Method and system for recognizing characters and character groups in electronically represented text
US4975974A (en) Character recognition apparatus
US6035062A (en) Character recognition method and apparatus
JP2986074B2 (ja) 近傍点検出方法及びパターン認識装置
JPH07160822A (ja) パターン認識方法
KR0186025B1 (ko) 후보 문자 분류 방법
JPH11272800A (ja) 文字認識装置
JPH07129713A (ja) 文字認識装置
JPH06337966A (ja) 文字認識装置
JPH0721303A (ja) 文字認識装置
JP3209197B2 (ja) 文字認識装置及び文字認識プログラムを記録した記録媒体
JP3548233B2 (ja) 文字認識装置及び方法
JP4633271B2 (ja) 辞書学習方法及び辞書学習プログラム
JPH05346974A (ja) 文字認識装置
JP2746345B2 (ja) 文字認識の後処理方法
JP3270551B2 (ja) 文字認識装置および文字認識方法
JP2993533B2 (ja) 情報処理装置及び文字認識装置
JP3320083B2 (ja) 文字認識装置及び方法
JP2792063B2 (ja) 文字認識辞書作成方式
JP2972443B2 (ja) 文字認識装置