JPH10154204A - パターン認識装置及びパターン認識方法 - Google Patents
パターン認識装置及びパターン認識方法Info
- Publication number
- JPH10154204A JPH10154204A JP9261291A JP26129197A JPH10154204A JP H10154204 A JPH10154204 A JP H10154204A JP 9261291 A JP9261291 A JP 9261291A JP 26129197 A JP26129197 A JP 26129197A JP H10154204 A JPH10154204 A JP H10154204A
- Authority
- JP
- Japan
- Prior art keywords
- character
- recognition
- pattern
- frame
- processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Character Input (AREA)
- Character Discrimination (AREA)
Abstract
処理を精度良く行う。 【解決手段】 環境認識手段1は、第1の状態〜第Nの
状態を入力画像から抽出し、第1〜第Nのパターン認識
手段2、4、6の中から、第1の状態〜第Nの状態に対
応するものを呼び出して認識処理を実行させる。
Description
びパターン認識方法に係わり、特に手書き用文字認識装
置のみならず、印刷文字認識装置や図面認識装置におけ
る文字、図形及び記号の認識を入力画像の様々な状態に
応じて正確に行うようにするものである。
の手書き文字認識装置は、会計帳票などに書かれている
文字を自動的に読み取って、文字を自動入力することに
より、会計帳票などから人手で文字を見つけ出し、文字
をキー入力するような手間を省くようにしていた。
成を示すブロック図である。図79において、帳票/文
書311をスキャナで読み込み、その帳票/文書311
の多値画像を得る。
画像の2値化、雑音除去、帳票/文書311の傾き補正
を行う。次に、文字切り出し部313において、予め定
義されている罫線情報や文字の位置情報を用いることに
より、文字を1文字づつ切り出す。
れの文字ごとに文字認識を行い、文字コードを出力す
る。ここで、この文字認識は、文字切り出し部313に
より切り出された未知の文字パターンの特徴のそれぞれ
に対し、認識辞書315に予め登録されている個々の文
字カテゴリの特徴と1つずつ照合することにより行われ
る。
徴を表す特徴空間上の特徴ベクトルに変換し、未知の文
字パターンと認識辞書315に予め登録されている文字
カテゴリとの類似度として、特徴空間上の特徴ベクトル
間の距離を算出する。そして、未知の文字パターンの特
徴ベクトルと認識辞書315に予め登録されている文字
カテゴリの特徴ベクトルとの間の距離が最も近いもの
を、未知の文字パターンに対応する文字カテゴリとして
認識する。
を文字と誤って認識し、文字の文字コードが非文字に対
して出力されることを防止するため、2つの特徴ベクト
ル間の距離に対してしきい値を設定しておく。そして、
2つの特徴ベクトル間の距離がこのしきい値以上の場
合、未知の文字パターンが認識辞書315に予め登録さ
れている文字カテゴリのどれに対応しているのかかわか
らないとするか、非文字であると判断してリジェクトコ
ードを出力するようにしていた。
字、かすれ文字、つぶれ文字のそれぞれの文字カテゴリ
の特徴を登録したものを用意しておき、高品質文字に対
しては、高品質文字についての認識辞書315を使用
し、かすれ文字に対しては、かすれ文字についての認識
辞書315を使用し、つぶれ文字に対しては、つぶれ文
字についての認識辞書315を使用することにより、帳
票/文書311の文字の品質の違いに対応できるように
していた。
手書き文字認識装置は、文字がかすれている場合であっ
ても、文字がつぶれている場合であっても、文字が高品
質文字であっても、切り出した1文字に対して、同一の
認識辞書315を用いて画一的に処理を行っていた。
かすれ文字についての情報が、高品質文字の認識処理を
行う際に悪影響を及ぼし、かすれ文字が認識辞書315
に登録してあるために、高品質文字が読めなくなってし
まうという問題があった。
罫線に接触しているなどの文字が書かれている環境は様
々なものがあり、画一的な認識辞書315で様々な環境
に対応しようとした場合、互いに相互作用を及ぼし合
い、認識処理の精度の大幅な改善は望めないという問題
があった。
いる環境に応じた適切な認識処理を精度よく行うことが
可能なパターン認識装置及びパターン認識方法を提供す
ることである。
ために、本発明によれば、処理対象の状態を入力画像か
ら抽出し、その状態に適した認識処理を処理対象ごとに
選択することにより、パターン認識を行うようにしてい
る。
画像に対し、それぞれの状態に適したパターン認識処理
を行うことができ、認識処理を精度よく行うことが可能
となる。
の状態を入力画像から抽出し、第1の状態を有する処理
対象に対しては、第1の状態専用のパターン認識処理を
行い、第2の状態を有する処理対象に対しては、第2の
状態専用のパターン認識処理を行うようにしている。
対象の認識処理と第2の状態を有する処理対象の認識処
理とが互いに相互作用を及ぼすことがなくなり、認識処
理を精度よく行うことが可能となる。
態を有する入力画像に対し、認識辞書を使い分けるよう
にしている。このことにより、例えば、かすれ文字やつ
ぶれ文字や高品質文字が入力画像の中に混在している場
合においても、かすれ文字に対してはかすれ文字に適し
た認識辞書を使用し、つぶれ文字に対してはつぶれ文字
に適した認識辞書を使用し、高品質文字に対しては高品
質文字に適した認識辞書を使用して認識処理を行うこと
ができ、認識処理を精度よく行うことが可能となる。
態を有する入力画像に対し、識別関数を使い分けるよう
にしている。このことにより、例えば、1文字枠に書か
れている文字についてはシティブロック距離を用いて文
字認識を行い、フリーピッチ枠に書かれている文字に対
しては判別関数を用いて文字の切り出し信頼度を考慮し
ながら文字認識を行うことができ、認識処理を精度よく
行うことが可能となる。
態を有する入力画像に対し、知識を使い分けるようにし
ている。このことにより、例えば、未知文字の変形が大
きくて、認識辞書に格納されている文字カテゴリとの対
応関係が取れない場合、文字セグメントに文字を分割す
ることにより、未知文字と文字カテゴリとの対応関係を
とるようにしたり、文字列から文字を切り出す場合、学
習パターンに基づいて生成した判別関数を用いて切り出
し信頼度を算出したり、枠接触文字についての文字認識
を行う場合、学習パターンにより得られた信頼度を用い
て、枠接触文字についての認識信頼度を評価したりする
ことができ、認識処理を精度よく行うことが可能とな
る。
理対象に対して複数の認識処理が呼ばれた場合、認識処
理による信頼度が所定の値以上となるまで、優先順位に
従って認識処理を行わせるようにしている。
ることができ、認識処理の精度を向上させることができ
る。また、本発明の一態様によれば、入力画像から非文
字を抽出し、この非文字についての認識処理を文字につ
いての認識処理と別々に行うようにしている。
たり、非文字が文字とみなされたりして認識処理が行わ
れることが減少し、認識処理を精度よく行うことが可能
となる。
ターン認識装置について図面を参照しながら説明する。
認識装置の機能的な構成を示すブロック図である。図1
において、環境認識手段1は、第1〜第Nの状態を入力
画像から抽出する。ここで、入力画像から抽出される状
態とは、例えば、1文字枠やフリーピッチ枠や表などの
いずれの形式で文字が書かれているかの状態、文字と枠
との接触状態、文字のかすれ状態、文字のつぶれ状態、
文字が消し線で消されている状態などである。
を有する処理対象についてのパターン認識処理を専用に
行い、第2のパターン認識手段4は、第2の状態を有す
る処理対象についてのパターン認識処理を専用に行い、
第Nのパターン認識手段6は、第Nの状態を有する処理
対象についてのパターン認識処理を専用に行う。
2、4、6は、それぞれの認識結果についての信頼度を
算出する信頼度算出手段3、5、7を備え、第1〜第N
のパターン認識手段2、4、6による認識結果について
の信頼度を算出する。
パターン認識手段2、4、6の中から、第1〜第Nの状
態に対応するものを呼び出して認識処理を実行させる。
例えば、環境認識手段1が、入力画像から第1の状態を
抽出した場合、その第1の状態の処理対象に対して、第
1のパターン認識手段2によるパターン認識処理を呼び
出し、入力画像から第2の状態を抽出した場合、その第
2の状態の処理対象に対して、第2のパターン認識手段
4によるパターン認識処理を呼び出し、入力画像から第
Nの状態を抽出した場合、その第Nの状態の処理対象に
対して、第Nのパターン認識手段6によるパターン認識
処理を呼び出す。
に対して、例えば、第1の状態及び第2の状態を抽出し
た場合、第1のパターン認識手段2によるパターン認識
処理及び第2のパターン認識手段4によるパターン認識
処理を、その同一の処理対象に対して呼び出す。
かれている状態であるとし、第2の状態がフリーピッチ
枠に文字列が書かれている状態であるとし、第3の状態
が文字と枠とが接触している状態であるとし、第4の状
態が文字のかすれ状態であるとし、第5の状態が文字の
つぶれ状態であるとし、第6の状態が文字が消し線で訂
正された状態であるとすると、第1のパターン認識手段
2は一文字枠に書かれている文字についての認識処理を
行い、第2のパターン認識手段4はフリーピッチ枠に書
かれている文字列についての認識処理を行い、第3のパ
ターン認識手段は枠接触文字についての認識処理を行
い、第4のパターン認識手段はかすれ文字についての認
識処理を行い、第5のパターン認識手段はつぶれ文字に
ついての認識処理を行い、第6のパターン認識手段は訂
正文字についての認識処理を行う。
一文字枠を抽出した場合、その一文字枠に書かれている
文字に対し、第1のパターン認識手段2により認識処理
を実行させ、環境認識手段1が、入力画像からフリーピ
ッチ枠を抽出した場合、そのフリーピッチ枠に書かれて
いる文字に対し、第2のパターン認識手段4により認識
処理を実行させ、環境認識手段1が、入力画像から枠接
触文字を抽出した場合、その枠接触文字に対し、第3の
パターン認識手段により認識処理を実行させ、環境認識
手段1が、入力画像からかすれ文字を抽出した場合、そ
のかすれ文字に対し、第4のパターン認識手段により認
識処理を実行させ、環境認識手段1が、入力画像からつ
ぶれ文字を抽出した場合、そのつぶれ文字に対し、第5
のパターン認識手段により認識処理を実行させ、環境認
識手段1が、入力画像から訂正文字の候補を抽出した場
合、その訂正文字の候補に対し、第6のパターン認識手
段により認識処理を実行させる。
像からフリーピッチ枠に接触している枠接触文字を抽出
した場合、そのフリーピッチ枠に接触している枠接触文
字に対し、パターン認識手段2及びパターン認識手段3
により認識処理を実行させ、入力画像からフリーピッチ
枠に接触している消し線付きの枠接触文字を抽出した場
合、そのフリーピッチ枠に接触している消し線付きの枠
接触文字に対し、第2のパターン認識手段4、第3のパ
ターン認識手段及び第6のパターン認識手段により認識
処理を実行させる。
状態が入力画像から抽出され、それに対応して複数のパ
ターン認識手段2、4、6が呼び出された場合、複数の
パターン認識手段2、4、6をどの順序で呼び出すかを
格納した処理順序テーブルに基づいて、複数のパターン
認識手段2、4、6による認識処理の順序を決定する。
そして、パターン認識手段2、4、6による認識処理に
より、所定のしきい値以上の信頼度が信頼度算出手段
3、5、7により得られるまで、複数のパターン認識手
段2、4、6による認識処理を呼び出し順序に従って順
次に実行する。
フリーピッチ枠に接触している枠接触文字を抽出した場
合、そのフリーピッチ枠に接触している枠接触文字に対
し、パターン認識手段3による認識処理を実行してから
パターン認識手段2による認識処理を実行し、入力画像
からフリーピッチ枠に接触している消し線付きの枠接触
文字を抽出した場合、そのフリーピッチ枠に接触してい
る消し線付きの枠接触文字に対し、第3のパターン認識
手段による認識処理を実行してから第6のパターン認識
手段による認識処理を実行し、さらに、第2のパターン
認識手段4による認識処理を実行させる。
の構成を示すブロック図である。図2において、状態抽
出手段1aは、第1〜第Nの状態を入力画像から抽出す
る。
aにより抽出された第1〜第Nの状態に対応させて、図
1の第1〜第Nのパターン認識手段2、4、6の中のい
ずれか1つ又は複数を呼び出して認識処理を行わせる。
ターン認識手段2、4、6の中から複数の認識手段が呼
び出された際に、これらの第1〜第Nのパターン認識手
段2、4、6をどのような順序で実行するかを示す処理
順序を格納する。
抽出手段1aにより抽出された第1〜第Nの状態に基づ
いて、第1〜第Nのパターン認識手段2、4、6の中か
らどの認識手段を呼び出すかを示す呼び出し手順を格納
する。
理順序制御ルール格納手段1dに格納されている呼び出
し手順及び処理順序テーブル1fに格納されている処理
順序に基づいて、第1〜第Nのパターン認識手段2、
4、6の実行順序を示す中間処理結果テーブルを作成す
る。
結果テーブルに記入された認識処理の実行結果に基づい
て、次の処理の実行を指示する手順を格納する。図3
は、本発明の一実施例によるパターン認識装置の具体的
な構成を示すブロック図である。
像の状態を抽出し、この抽出された状態に基づいて、文
字認識部12の基本文字認識部17、文字列認識部1
5、接触文字認識部13、かすれ文字認識部19、つぶ
れ文字認識部21又は非文字認識部25の消し線認識部
26及び雑音認識部28のいずれか1つ又は複数を呼び
出す。ここで、入力画像の状態を抽出するために、入力
画像のレイアウト解析、品質解析及び訂正解析を行う。
文字認識処理を行うもので、文字についての文字認識を
行う基本文字認識部17、文字列についての文字認識B
及び文字切り出しBを行う文字列認識部15、枠に接触
した文字についての文字認識A及び文字切り出しAを行
う接触文字認識部13、かすれ文字についての文字認識
C及び文字切り出しCを行うかすれ文字認識部19、つ
ぶれ文字についての文字認識D及び文字切り出しDを行
うつぶれ文字認識部21及びくせ字についての文字認識
E及び文字切り出しEを行うくせ字認識部23を備えて
いる。
15、接触文字認識部13、かすれ文字認識部19、つ
ぶれ文字認識部21及びくせ字認識部23はそれぞれ、
文字認識の手法についての知識を格納した知識テーブル
14、16、18、20、22、24を備えている。知
識テーブル14には、例えば、枠接触状態と認識の信頼
度に関する知識や重複の部分パターン法に関する知識が
格納され、知識テーブル16には、例えば、切り出しの
信頼度に関する知識や切り出しと認識の融合法に関する
知識が格納され、知識テーブル18には、例えば、詳細
識別法に関する知識が格納されている。
に非文字認識処理を行うもので、消し線についての非文
字認識F及び非文字切り出しFを行う消し線認識部2
6、雑音についての非文字認識G及び非文字切り出しG
を行う雑音認識部28を備えている。
8はそれぞれ、非文字認識の手法についての知識を格納
した知識テーブル27、29を備えている。図4は、環
境認識系11の全体的な処理の一例を示すフローチャー
トである。
ように、入力画像の前処理を行う。この入力画像の前処
理は、ファクシミリやスキャナなどにより2値化された
入力画像に対しラベリングを行い、入力画像とラベル画
像とを格納するものである。なお、入力画像とラベル画
像とは、これ以降の処理でいつでもアクセスできるよう
にしておく。
ローチャートである。図5において、ステップS11に
示すように、2値化された入力画像に対しラベリングを
行うことにより、連結パターンを抽出してラベル付けを
行い、抽出したラベル画像と入力画像とを格納する。こ
の際、ラベル付けされた連結パターンを外接矩形の加減
算で圧縮表現することにより、メモリ容量を削減する。
このラベル付けされた連結パターンの圧縮表現によれ
ば、例えば、400dpiの高解像度のスキャナで入力
したA4サイズ(約3000×4000)の文書/帳票
に対し、、数百キロバイト以内で表すことができる。
レイアウト解析を行う。このレイアウト解析は、ラベル
付けされた連結パターンのサイズや配置状態などに基づ
いて、テキスト認識、罫線抽出、枠抽出、枠の種類及び
表の判別、枠接触文字の有無の判断及び図認識を行う。
ーチャートである。図6において、まず、ステップS2
1に示すように、テキスト認識を行う。このテキスト認
識は、ラベル付けされた連結パターンのサイズを解析
し、連結パターンのサイズが比較的小さいものを抽出
し、これを文字の候補とみなす。そして、隣接する文字
の候補を統合することにより、テキストを抽出する。
抽出を行う。この罫線抽出は、ステップS21でテキス
トと認識されなかった連結パターンを対象として、縦又
は横方向のヒストグラム値が大きいものについての探索
を行うことにより、罫線を抽出する。
出を行う。この枠抽出は、ステップS22で抽出された
罫線から4辺に相当する罫線を見つけて枠を抽出する。
次に、ステップS24に示すように、枠の種類/表判別
を行う。この枠の種類/表判別は、ステップS23で抽
出された枠に対し、その枠の種類を判別して枠の種類の
属性を付与する。枠の種類の属性としては、一文字枠、
ブロック枠、フリーピッチ枠、表などがある。
触文字の有無の判断を行う。この枠接触文字の有無の判
断は、枠内を枠線に沿って探索した際に、交差するパタ
ーンがあるかどうかを検出し、交差するパターンがある
場合は、文字が枠に接触しているものと判断する。ここ
で、交差するパターンが存在していても、注目している
枠の隣の枠から、文字がはみ出している場合があるの
で、交差するパターンが隣の枠からはみ出しているもの
については、注目している枠に対し、接触文字でないと
する。
識を行う。この図認識は、テキストや枠や表などの属性
が付与されなかったサイズが比較的大きな連結パターン
に対して、図の属性を付与する。
品質解析を行う。この品質解析は、入力画像にかすれや
つぶれがあるかどうかを検出するもので、大局的品質解
析と局所的品質解析とがある。
(面積、縦/横の長さがそれぞれ所定のしきい値以下の
連結領域の数)/(前記所定の領域の全ての連結領域の
数)の値が、所定値よりも大きい時にかすれと判断す
る。
的に統合した情報を用いることにより、所定の領域につ
いて、(かすれた罫線を補完した際の補完された部分の
長さの合計)/(各罫線の長さの合計)の値が、所定値
よりも大きい時にかすれと判断する。
度が所定のしきい値より大きい連結領域の数)/(前記
所定の領域の全ての連結領域の数)の値が、所定値より
も大きい時につぶれと判断する。
ートである。図7において、まず、ステップS31に示
すように、大局的品質解析を行う。この大局的品質解析
は、文書/帳票全体に対して品質解析を行うもので、入
力画像を2値化する際のしきい値が適切であったかどう
か、ファクシミリで送られてきた文書/帳票に対してノ
イズが全体にのったため品質が不正常になっていないか
どうか、かすれやつぶれが発生していないかを解析す
る。
的品質解析を行う。この局所的品質解析は、レイアウト
解析により一文字枠やテキストやフリーピッチ枠や表な
どの属性が付与された領域ごとに かすれやつぶれが発
生していないかを調べたり、ノイズが発生していないか
を調べたりして品質解析を行うものである。
訂正解析を行う。この訂正解析は、入力画像から消し線
を抽出して、消し線で訂正された文字については、文字
の認識処理を省略できるようにするものである。
ートである。図8において、まず、ステップS41に示
すように、訂正特徴抽出を行う。この訂正特徴抽出は、
訂正文字に有効な特徴を抽出するもので、訂正文字に
は、つぶれた文字、2重線で消した文字、斜線で消した
文字及びばつで消した文字の大きく分けて4種類あり、
各訂正文字の特徴を黒画素線密度、線密度、オイラー
数、ヒストグラム値などを算出して抽出する。
文字候補抽出を行う。この訂正文字候補抽出は、訂正文
字の特徴を表す特徴空間で、訂正文字と訂正されていな
い通常文字との分布の違いから訂正文字の候補を抽出す
る。
文字認識/非文字認識の制御を行う。この文字認識/非
文字認識の制御は、図4のステップS2〜S4で抽出さ
れた入力画像の状態に基づいて、文字認識部12の基本
文字認識部17、文字列認識部15、接触文字認識部1
3、かすれ文字認識部19、つぶれ文字認識部21又は
非文字認識部25の消し線認識部26及び雑音認識部2
8のいずれを呼び出すかを決定するもので、中間処理結
果テーブルの読み込み/処理順序制御ルールの実行、終
了判定や処理実行ルールによる処理の実行を行う。
系11が抽出した状態に基づいて、文字認識部12の基
本文字認識部17、文字列認識部15、接触文字認識部
13、かすれ文字認識部19、つぶれ文字認識部21又
は非文字認識部25の消し線認識部26及び雑音認識部
28のいずれを呼び出すかの手順を示すものである。
ールにより呼ばれた認識処理の結果に基づいて、次にど
のような処理を行うのかの手順を示すものである。ま
た、中間処理結果テーブルは、レイアウト解析により一
文字枠やテキストやフリーピッチ枠や表などの属性が付
与された領域ごとに、図4のステップS2〜S4で抽出
された入力画像の状態を記入するとともに、入力処理順
序制御ルールにより呼ばれた処理を処理順序テーブルに
格納されている処理順序で記入するものである。
た場合、この文字に対しては、基本文字認識部17を呼
び出して認識処理を実行し、環境認識系11が、図6の
ステップS21でテキストを抽出した場合、このテキス
トに対しては、文字列認識部15を呼び出して認識処理
を実行し、環境認識系11が、図6のステップS25で
枠接触文字を抽出した場合、この枠接触文字に対して
は、接触文字認識部13を呼び出して認識処理を実行
し、環境認識系11が、図7のステップS32で、(面
積、縦/横の長さがそれぞれ所定のしきい値以下の連結
領域の数)/(前記所定の領域の全ての連結領域の数)
の値が所定値よりも大きいと判断した場合、この領域の
文字に対しては、かすれ文字認識部19を呼び出して認
識処理を実行し、環境認識系11が、図7のステップS
32で、(黒画素密度が所定のしきい値より大きい連結
領域の数)/(前記所定の領域の全ての連結領域の数)
の値が所定値よりも大きいと判断した場合、この領域の
文字に対しては、つぶれ文字認識部21を呼び出して認
識処理を実行し、環境認識系11が、図8のステップS
42で、訂正文字候補を抽出した場合、この訂正文字候
補に対しては、消し線認識部26を呼び出して認識処理
を実行し、環境認識系11が、図7のステップS32で
雑音を検出した場合、この雑音に対しては、雑音認識部
28を呼び出して認識処理を実行する。
御を示すフローチャートである。図9において、まず、
ステップ51に示すように、中間処理結果テーブルの読
み込み/処理順序制御ルールの実行を行う。
定を行う。この終了判定は、処理順序制御ルールに基づ
いて、中間処理結果テーブルの全ての処理が完了して中
間処理結果テーブルの全ての処理指示欄に終了が記入さ
れた場合、終了と判定する。終了判定で未終了と判定さ
れた場合、ステップ53に進んで、処理実行ルールによ
る処理を実行してステップ51に戻り、ステップ52の
終了判定で終了と判定されるまで以上の処理を繰り返
す。
ン認識装置のシステム構成を示すブロック図である。図
10において、画像格納部41は帳票画像を格納し、処
理条件格納部42は帳票のレイアウト構造や読み取り文
字情報、例えば、枠の位置、種類、サイズ、文字種、文
字数などの定義体を格納し、ラベル画像格納部43はラ
ベル付けされたラベル画像を圧縮表現により格納する。
び訂正解析部32を備え、環境認識系38はくせ字解析
部39及び終了判定処理部40を備え、文字認識系/非
文字認識系33は基本文字認識部34、黒枠接触文字認
識部35、フリーピッチ文字列認識部36及び消し線認
識部37を備えている。
部43に格納されているラベル画像について、処理条件
格納部42に格納されている定義体を参照しながら、罫
線抽出、枠抽出及び黒枠接触文字抽出を行う。ここで、
枠の位置やサイズなどのフォーマット情報及び傾きに関
する情報を予め帳票データとして格納しておき、この帳
票データに基づいて、罫線抽出や枠抽出を行う方法は、
例えば、特開昭62−21288号公報や特開平3−1
26186号公報に記載されている。
公報や特開平7−28937号公報に記載されているよ
うに、枠の位置やサイズなどのフォーマット情報の入力
を必要とせずに、罫線抽出や枠抽出を行うようにしても
よい。
い、くせ字解析部39は個人筆記特性によるくせ字の解
析を行い、終了判定処理部40は文字認識の終了判定を
行い、終了判定で終了と判定された場合、文字認識結果
の出力を行う。
出された文字の認識を行い、黒枠接触文字認識部35
は、黒枠接触文字から枠を除去し、その枠を除去するこ
とによりかすれた文字の補完を行ってから文字の認識を
行い、フリーピッチ文字列認識部36は、文字列から文
字を切り出す際の切り出し信頼度を考慮しながら文字列
についての文字認識を行い、消し線認識部37は、訂正
文字の黒画素線密度、線密度、オイラー数、ヒストグラ
ムなどに基づいて、消し線の認識を行う。
30、38により抽出された状態に基づいて、文字認識
系/非文字認識系33のいずれの処理を実行するかを示
す処理順序やその処理結果を格納する。
適用される文字認識システムの具体的な構成を示すブロ
ック図である。図11において、51は全体的な処理を
行う中央演算処理ユニット(CPU)、52はCPU5
1で実行されるプログラムを格納するプログラムメモ
リ、53は画像データをビットマップ形式で格納する画
像メモリ、54は画像処理に使用するワークメモリ、5
5は画像を光学的に読み取るスキャナ、56はスキャナ
55により読み取られた情報を一時的に格納するメモ
リ、57は各文字画像の特徴を格納した辞書ファイル、
58は認識結果を表示するディスプレイ、59は認識結
果を印刷するプリンタ、60はディスプレイ58及びプ
リンタ59の入出力インターフェイス、61はCPU5
1、プログラムメモリ52、画像メモリ53、ワークメ
モリ54、メモリ56、辞書ファイル57、入出力イン
ターフェイス60及びドライバ64を接続しているバ
ス、62は通信ネットワーク63を介してデータやプロ
グラムの送受信を行う通信インターフェイス、64はド
ライバ、65はハードディスク、66はICメモリカー
ド、67は磁気テープ、68はフロッピーディスク、6
9はCD−ROMやDVD−ROMなどの光ディスクで
ある。
より読み取った画像データをメモリ56に一時的に格納
し、その画像データをビットマップ形式で画像メモリ5
3に展開する。そして、画像メモリ53からワークメモ
リ54にコピーされた2値画像データに対してパターン
抽出処理を行う。その結果に基づいて、スキャナ55に
より読み取った画像データから文字画像の切り出しを行
い、切り出された文字画像の特徴と辞書ファイル57に
格納された特徴データとの比較を行い、文字の認識を行
う。その後、その認識結果を、ディスプレイ58又はプ
リンタ59に出力する。
のパターン抽出装置は、プログラムメモリ52に格納さ
れたプログラムに従って処理を行うCPU51の機能と
して実現される。ここで、パターン抽出処理を行うプロ
グラムは、プログラムメモリ52のROMに予め格納し
ておくことが可能である。また、パターン抽出処理を行
うプログラムを、ハードディスク65、ICメモリカー
ド66、磁気テープ67、フロッピーディスク68また
は光ディスク69などの記憶媒体からプログラムメモリ
52のRAMにロードした後、このプログラムをCPU
51で実行させるようにしてもよい。
ムを、通信インターフェイス62を介して通信ネットワ
ーク63から取り出すこともできる。通信インターフェ
イス62と接続される通信ネットワーク63として、例
えば、LAN(LocalArea Networ
k)、WAN(Wide Area Networ
k)、インターネット、アナログ電話網、デジタル電話
網(ISDN:Integral Service D
igital Network)、PHS(パーソナル
ハンディシステム)や衛星通信などの無線通信網などを
用いることが可能である。
12及び非文字認識部25の構成をより具体的に説明す
る。図12は、図5のステップS11のラベリング処理
を説明する図である。
る2値画像がラベリング処理部70に入力されると、ラ
ベリング処理部70は、連結した画素で構成される連結
パターンを入力された2値画像から抽出し、各連結パタ
ーンごとにラベルを付したラベル画像を生成して、ラベ
ル画像格納部71に格納する。例えば、“0”と“1”
とからなる2値画像72が入力された場合、各連結パタ
ーンごとにラベル“1”、“2”、“3”を付してラベ
ル画像73を生成する。
が1画像内に存在する場合、255個のラベルが必要と
なるため、1画素当たり8ビットを必要とし、ラベル画
像格納部71に必要な記憶容量は、1画像全体の画素数
の8倍となり、ラベル画像を格納するために多くの記憶
容量が必要となる。
表現することにより、ラベル画像格納部71に必要な記
憶容量を削減する方法を説明する図である。図13にお
いて、例えば、図13(a)の連結パターンA1 及び連
結パターンA2 のそれぞれに対し、図13(b)に示す
ように、ラベル“1”及びラベル“2”が付され、図1
3(c)に示すように、連結パターンA1 に外接する外
接矩形B1 及び連結パターンA2 に外接する外接矩形B
2 が生成されている。外接矩形B1 及び外接矩形B
2 は、図13(d)に示すように、その外接矩形B1 及
び外接矩形B2 の左上頂点の座標(x1 、y1 )及び右
下頂点の座標(x2 、y2)によって特定することがで
きる。
矩形B1 と連結パターンA2 に外接する外接矩形B2 と
が重なっているかどうかを判定し、連結パターンA1 に
外接する外接矩形B1 と連結パターンA2 に外接する外
接矩形B2 とが重なっていない場合、それぞれの外接矩
形B1 及び外接矩形B2 の左上頂点の座標(x1 、
y 1 )及び右下頂点の座標(x2 、y2 )を記憶する。
形B1 と連結パターンA2 に外接する外接矩形B2 とが
重なっている場合、他の外接矩形と重ならないようによ
り小さな矩形領域に外接矩形B1 及び外接矩形B2 を細
分化し、細分化された矩形領域が元の外接矩形B1 及び
外接矩形B2 のどちらに属するかを判定し、連結パター
ンA1 及び連結パターンA2 を、細分化された矩形領域
の和や差などの演算で表現する。
ーンA1 は、連結パターンA1 に属する最大の矩形領域
(1−1)及び矩形領域(1−1)に含まれる矩形領域
(1−2)を用いて、 A1 =(1−1)−(1−2) のように矩形領域(1−1)と矩形領域(1−2)との
差で表現することができる。
A2 に属する最大の矩形領域(2−1)、矩形領域(2
−1)に含まれる矩形領域(2−2)及び矩形領域(2
−2)に含まれる矩形領域(2−3)を用いて、 A2 =(2−1)−(2−2)+(2−3) のように矩形領域(2−1)と矩形領域(2−2)との
差及び矩形領域(2−3)との和で表現することができ
る。
の外接矩形で表現することにより、連結パターンを表現
する情報量を減らして、ラベル画像を格納するために必
要な記憶容量を削減することができる。
ついては、例えば、特開平8−55219号公報に記載
されている。図14は、図6のステップS21のテキス
ト認識処理の一実施例を示すフローチャートである。
示すように、スキャナで文書を読み込み、読み込んだ文
書の画像データをメモリに格納する。次に、ステップS
62に示すように、ステップS61で読み込んだ画像デ
ータのうち、横方向の特定の区間の短冊状の部分領域だ
けに注目し、その注目した部分領域の中でラベリングを
行い、黒連結画素の外接矩形を求める。
B、Cがあり、図15(a)の文書Aの文字列81の領
域が、図15(d)に示すように、区間Aの範囲内にあ
り、図15(b)の文書Bの文字列82の領域が、図1
5(d)に示すように、区間Aの範囲内にあり、図15
(c)の文書Cの文字列83の領域が、図15(d)に
示すように、区間Bの範囲内にある場合、この区間A,
Bの部分領域にのみ着目し、この部分領域の短冊状の中
でのみラベリング処理を行って、黒連結画素の外接矩形
を求める。
ップS62で求めた外接矩形の高さと、予め求めておい
た矩形の高さylenとの差がしきい値thy以内で、
かつステップS62で求めた外接矩形の幅と、予め求め
ておいた矩形の幅xlenとの差がしきい値thx以内
であるような外接矩形だけを抽出する。そして、その外
接矩形が存在しているy方向(縦方向)の座標を求め、
メモリに記憶する。
ップS63で求めたy方向の座標を中心として、ステッ
プS62で抽出した矩形を含む左右方向の長さが画像幅
に等しい横長部分領域に注目する。
ップS64で求めた横長部分領域に対してラベリングを
行うことにより、黒連結画素の外接矩形を求める。次
に、ステップS66に示すように、ステップS65で求
めた外接矩形の高さと、予め求めておいた矩形の高さy
lenとの差がしきい値thy以内で、かつステップS
65で求めた外接矩形の幅と、予め求めておいた矩形の
幅xlenとの差がしきい値thx以内であるような外
接矩形だけを抽出し、メモリに記憶する。
ップS66で抽出した矩形を対象にx座標でソートし、
抽出した矩形の中心線の間隔からピッチを計算し、この
計算により求めたピッチと予め求めておいたピッチpi
tchとの差がしきい値thpitch以内の矩形が横
方向に所定の数th個以上並んでいるものをテキストと
して出力する。
例えば、特開平8−171609号公報に記載されてい
る。次に、図6のステップS22の罫線抽出処理の一実
施例についてより具体的に説明する。
られた連結パターンを横方向及び縦方向に複数に分割
し、横方向及び縦方向に分割したそれぞれの範囲内で連
結パターンの隣接投影値を算出し、ある一定の長さの線
分又は直線の一部を矩形近似により検出することにより
罫線を抽出するものである。
の投影値に周囲の行又は列の投影値を足し合わせたもの
である。また、注目行又は注目列の投影値は、その行又
は列に存在する黒画素の総和をとったものである。
である。図16において、i行の投影値をp(i)とす
ると、隣接投影値P(i)は、(1)式により算出する
ことができる。
いたものである。図17は、部分パターンの投影値の例
を示す図である。
方向の長さがLX の矩形84の水平方向jの投影値Ph
(i)をHP(i)、矩形84の垂直方向iの投影値P
v(j)をVP(j)とすると、HP(1)=HP
(n)=m、HP(2)〜HP(n−1)=2、VP
(1)=VP(m)=n、VP(2)〜VP(m−1)
=2である。
在している部分は、その投影値が大きくなるので、この
投影値を算出することにより、罫線を構成している直線
を抽出することができる。
長との比が所定の閾値以上である部分パターンを検出す
ることにより、罫線を構成している直線の候補を抽出す
ることができる。
ートである。図18において、まず、ステップ601に
示すように、隣接投影値と縦横それぞれの分割長との比
が所定のしきい値以上であるかどうかを判定する。そし
て、隣接投影値と縦横それぞれの分割長との比が所定の
しきい値以上でないと判断された場合、ステップS60
2に進み、罫線を構成している線分が存在しないものと
みなす。
横それぞれの分割長との比が所定のしきい値以上である
と判断された場合、ステップS603に進み、罫線を構
成している線分が存在するものとみなす。
プS603で線分とみなされたパターンが、その上下に
存在する線分と接しているかどうかを判断する。そし
て、上記パターンが上下に存在する線分と接していない
と判断された場合、ステップS605に進み、そのパタ
ーンを矩形線分とする。
プS603で線分とみなされたパターンがその上下に存
在する線分と接していると判断された場合、ステップS
606に進み、上記パターンとその上下に存在する線分
とを統合する。そして、ステップS607で、ステップ
S606で統合した線分を矩形線分として検出する。例
えば、図19(a)に示すような3つの矩形線分85を
統合し、図19(b)に示す1つの矩形線分86を得
る。この後、ステップS605又はステップS607で
求めた矩形線分を対象として探索を行うことにより、罫
線を抽出する。
ば、特開平6−309498号公報に記載されている。
図20は、図6のステップS22の罫線抽出処理におい
て、かすれ罫線の補完を行いながら、探索を行う方法を
説明する図である。
するパターンの探索を行う際、探索の進行方向にパター
ンのない空白領域が存在しても、一定の画素数以下の空
白領域に対してはパターンがあるとみなして探索を行う
ようにするものである。
対して、この直線91を構成する画素92の検索を行う
場合、一定の画素数以下の空白領域93に対しては画素
92があるとみなして探索を行う。
線の補完方法を示すフローチャートである。図21にお
いて、まず、ステップS71に示すように、所定の矩形
範囲内のパターンのうち、最も細い部分のX座標を算出
する。
ップS71で算出したX座標におけるパターンの中心点
を算出する。そして、ステップS73に示すように、ス
テップS72で算出したパターンの中心点を探索の開始
点とする。ここで、探索の開始点をパターンの最も細い
部分とするのは、最も細い部分は文字である可能性が低
いため、枠となる直線の探索をより確実に行うことがで
きるからである。
右に設定する。次に、ステップS75に示すように、空
白領域の長さをカウントする変数Kの初期値を0に設定
する。
ップS73で求めた開始点をパターンの探索の現在地と
設定する。次に、ステップS77に示すように、ステッ
プS76で設定した探索の現在地が、ステップS71で
注目した矩形範囲の内部であるかどうかの判定を行い、
探索の現在地が、ステップS71で注目した矩形範囲の
内部でない場合、ステップS86に進む。
ステップS71で注目した矩形範囲の内部であると判定
された場合、ステップS78に進み、探索の現在地から
みて探索方向隣にパターンがあるかどうか判定する。こ
こで、探索の現在地からみて探索方向隣にパターンがあ
るとは、図22に示すように、パターン101からみて
右方向隣の位置にパターン102が存在していることを
意味している。そして、探索の現在地からみて探索方向
隣にパターン102があると判定された場合、ステップ
S81に進み、探索方向隣にあるパターン102を探索
の現在地とする。
みて探索方向隣にパターンがないと判定された場合、ス
テップS79に進み、探索の現在地からみて探索方向斜
め隣にパターンがあるかどうか判定する。
め隣にパターンがあるとは、図22に示すように、パタ
ーン103からみて右方向斜め隣の位置にパターン10
4a又はパターン104bが存在していることを意味し
ている。そして、探索の現在地からみて探索方向斜め隣
にパターン104a、104bがあると判定された場
合、ステップS83に進み、探索方向斜め隣にあるパタ
ーン104a、104bを探索の現在地とする。なお、
探索方向斜め隣にあるパターン104a、104bが2
つある場合はパターン104a、104bのどちらか一
方を探索の現在地とする。一方、ステップS79で探索
の現在地からみて探索方向斜め隣にパターン104a、
104bがないと判定された場合、ステップS80に進
み、空白領域の長さをカウントする変数Kがしきい値以
下であるかどうかを判定する。そして、空白領域の長さ
をカウントする変数Kがしきい値以下である場合、ステ
ップS84に進み、探索の現在地からみて探索方向隣に
ありパターンを構成しない画素を現在地とする。例え
ば、図20において、一定の画素数以下の空白領域93
に対してはパターンがあるとみなして探索を行う。
領域の長さをカウントする変数Kの値を1ドットだけ増
やし、ステップS77に戻る。一方、ステップS80で
空白領域の長さをカウントする変数Kがしきい値以下で
ないと判定された場合、ステップS86に進み、探索方
向は右に設定されているかどうかを判定する。そして、
探索方向は右に設定されていない場合、処理を終了す
る。
ている場合、ステップS87に進み、探索方向を左に設
定する。そして、探索方向を右に設定して行った処理と
同様に、ステップS75〜ステップS85の処理を繰り
返す。
う場合、探索の現在地からみて探索方向隣にパターンが
あるとは、図22に示すように、パターン105からみ
て左方向隣の位置にパターン106が存在していること
を意味している。また、探索の現在地からみて探索方向
斜め隣にパターンがあるとは、図22に示すように、パ
ターン107からみて左方向斜め隣の位置にパターン1
08a又はパターン108bが存在していることを意味
している。
は、例えば、特願平8−107568号の明細書及び図
面に記載されている。次に、図6のステップS23の枠
抽出処理について説明する。
示すフローチャートである。図23において、まず、ス
テップS91に示すように、図18の処理により矩形線
分として検出されたパターンに対し探索を行う。この
際、図21のフローチャートに示すように、所定の長さ
の空白領域に対しては、パターンが存在するものとみな
して探索を行い、かすれを補完する。
ップS91で探索を行った結果、パターンが所定の長さ
で途切れているかどうかを判断し、パターンが所定の長
さで途切れていない場合、図24のブロック枠抽出処理
に進む。一方、パターンが所定の長さで途切れている場
合、ステップS93に進み、探索された線分を統合して
直線を検出する。
ップS93で検出した直線のうち、4方を囲んでいる直
線を抽出する。次に、ステップS95に示すように、4
方を直線で囲まれた部分の大きさが、同一画像内の一文
字枠の大きさの所定範囲内であるかどうかを判断し、4
方を直線で囲まれた部分の大きさが、同一画像内の一文
字枠の大きさの所定範囲内であるか場合、ステップS9
6に進んで、4方を直線で囲まれた部分を一文字枠であ
るとみなし、4方を直線で囲まれた部分の大きさが、同
一画像内の一文字枠の大きさの所定範囲内でない場合、
ステップS97に進んで、4方を直線で囲まれた部分を
一文字枠でないとみなす。
を示すフローチャートである。図24において、まず、
ステップS101に示すように、探索により検出された
横直線が所定値以上の長さを有するかどうかを判断し、
探索により検出された横直線の長さが所定値より小さい
場合、ステップS102に進んで、その横直線を横枠で
ないとみなす。一方、探索により検出された横直線の長
さが所定値以上の場合、ステップS102に進み、探索
により検出された横直線を横枠であるとみなす。
テップS103で抽出された横枠から、互いに隣接する
2本の横枠を取り出す。次に、ステップS105に示す
ように、ステップS104で取り出した2本の横枠の間
に挟まれた範囲を1行のブロック枠とみなす。
18の処理により検出された矩形線分のうち、縦方向の
矩形線分を抽出して縦線を検出する。次に、ステップS
107に示すように、ステップS106で検出した縦線
の探索を行い、ステップS108において、縦線がステ
ップS104で取り出した上下の横枠に達したかどうか
を判断する。そして、縦線が上下の横枠に達しない場
合、ステップS109に進み、その縦線を縦枠の候補か
ら除外する。一方、縦線が上下の横枠に達した場合、ス
テップS110に進み、その縦線を縦枠の候補とする。
理の対象が規則的な表形式のブロック枠であるか、不規
則な表形式のブロック枠であるかを判断する。そして、
処理の対象が規則的な表形式のブロック枠である場合、
ステップS112に進み、ステップS110で縦枠の候
補とみなされた縦線同士の間隔を算出するとともに、算
出された縦線同士の間隔とその出現頻度との関係を示す
ヒストグラムを算出する。
いの隣接する2本の横枠の間に挟まれた範囲内の縦線の
うち、他の縦線と異なる間隔を形成する縦線を縦枠の候
補から除外し、残った縦線を縦枠として処理を終了す
る。
規則的な表形式のブロック枠であると判断された場合、
ステップS110で縦枠の候補とされたものを全て縦枠
として処理を終了する。
判別処理について説明する。図25は、図6のステップ
S23の枠抽出処理により抽出された枠や表の一例を示
す図である。
枠、図25(b)はフリーピッチ枠、図25(c)はブ
ロック枠、図25(d)は規則的な表、図25(e)は
不規則な表を示している。そして、一文字枠には一文字
枠の属性を付与し、フリーピッチ枠にはフリーピッチ枠
の属性を付与し、ブロック枠にはブロック枠の属性を付
与し、表には表の属性を付与する。
については、例えば、特開平7−28937号公報に記
載されている。次に、図6のステップS25の枠接触有
無の判断処理について説明する。ここでは、元の入力画
像をOR処理により縮小率1/nで縮小してから、枠接
触有無の判断処理を行う例について述べる。ここで、画
像の各画素に対応して座標が設定され、画像の横方向に
X座標、画像の縦方向にY座標を設定し、X座標は右向
きに増加し、Y座標は下向きに増加するものとしてい
る。
を示すフローチャートである。図26において、まず、
ステップS121に示すように、原画像を入力する。次
に、ステップS122に示すように、原画像の左上から
横n画素×縦n画素の範囲(左上座標(1,1)、右下
座標(X,Y))を設定する。
画像の設定された範囲内に黒画素があるかどうかを判断
し、原画像の設定された範囲内に黒画素がある場合、ス
テップS124に進み、縮小画像の座標(X/n,Y/
n)の画素を黒画素とし、原画像の設定された範囲内に
黒画素がない場合、ステップS125に進み、縮小画像
の座標(X/n,Y/n)の画素を白画素とする。
画像の右下まで処理が終了したかどうかを判断し、原画
像の右下まで処理が終了していない場合、ステップS1
27に進み、原画像の右端に達したかどうかを判断す
る。
合、処理した範囲の右隣に横n画素×縦n画素の範囲
(左上座標(x,y)、右下座標(X,Y))を設定
し、原画像の右端に達した場合、処理した範囲の下側
で、かつ、原画像の左端から横n画素×縦n画素の範囲
(左上座標(x,y)、右下座標(X,Y))を設定し
て、ステップS123に戻り、原画像の全ての範囲内に
ついて縮小処理が終了するまで以上の処理を繰り返す。
た圧縮画像データにおける枠線の内側を枠に沿って探索
することにより、文字が枠に接触しているかどうかの判
定を行い、文字の接触している辺に関して、矩形領域を
所定の距離だけ外側に拡大し、この拡大した矩形領域の
座標を原画像データにおける座標に変換する。
画像データの枠線の範囲110が抽出され、この枠線に
より囲まれた矩形領域内に「4」の文字112が存在
し、この「4」の文字112が下側の枠線111に接触
しているものとする。
内側に沿って真っ直ぐに探索を行い、探索の途中でパタ
ーンと交差した場合、枠線の近辺に文字が存在し、この
文字は枠線に接触している可能性が高いとみなして、こ
の枠線により囲まれた矩形領域内に存在する「4」の文
字112は枠と接触しているものとする。この例の場
合、「4」の文字112は下側の枠111と接触してい
るものとされる。
い、文字112が枠線111に接触しているとみなされ
た結果、図27(c)に示すように、文字112が接触
している枠線111から外側の方向へ枠線により囲まれ
た矩形領域を拡大し、この拡大した矩形領域113を文
字112が存在する文字領域とする。なお、文字が枠線
に接触していないとみなされた場合は、枠の内部をその
まま文字領域とする。
ら原画像データにおける文字領域を求めるため、図27
(c)の矩形領域113の座標を原画像データにおける
座標に変換する。このことにより、図27(d)に示す
ように、原画像データにおける矩形領域116を求める
ことができる。
ける枠線114についての投影処理を行い、枠線114
の枠座標を原画像データから算出する。この際、枠線1
14を所定の長さの短冊状の矩形によって表現する。そ
して、図27(e)に示すように、この矩形領域116
に存在するパターンを文字補完処理に送り、原画像デー
タから算出した枠線114の枠座標に基づいて、枠線1
14に接触している文字115の補完処理を行う。
例を示すフローチャートである。図28において、ま
ず、ステップS131に示すように、圧縮画像データに
よる矩形表現を、例えば、図26の処理により行う。
横4本の直線に囲まれた矩形部分を抽出する。次に、ス
テップS133に示すように、直線の内側を示す矩形の
左上及び右下を示す座標をそれぞれ算出する。
の内側を示す矩形の4辺(上側横枠、下側横枠、右側縦
枠、左側縦枠)に沿って圧縮画像の探索を行う。次に、
ステップS135に示すように、探索の途中で画像パタ
ーンと交差した場合、探索を行っていた辺に文字が接触
しているものとする。
の内側を示す矩形の座標値を原画像上の座標値に変換す
ることにより、圧縮画像データにおける矩形領域から原
画像データにおける矩形領域を算出する。
テップS136で算出された矩形領域を原画像データに
おける文字領域とする。次に、ステップS138に示す
ように、ステップS135の処理により文字が枠に接触
していたかどうかを判断し、文字が枠に接触している場
合、ステップS139〜S143の接触文字範囲獲得処
理を行う。
プS139において、文字の接触している辺から外側方
向に文字領域を拡大し、ステップS137で算出された
文字領域位置より一定の距離だけ外側の位置を文字領域
の端とする。
テップS139で算出された文字領域に含まれる枠線の
位置座標を原画像上の座標値に変換することにより、圧
縮画像データにおける枠線の位置座標から原画像データ
における枠線の位置座標を算出する。
テップS140で算出された原画像データにおける枠線
の位置座標に基づいて獲得した原画像データの枠線領域
について、横枠は横方向、縦枠は縦方向に投影処理を行
う。
影値が一定値以上の領域を原画像上の枠座標とする。次
に、ステップS143に示すように、算出した原画像上
の文字領域を示す座標値と文字領域内の枠線の位置を示
す座標値とを文字補完処理へ渡す。
出した原画像上の文字領域を示す座標値を文字領域とす
る。なお、枠接触有無の判断処理については、例えば、
特願平8−107568号の明細書及び図面に記載され
ている。
出処理及びステップS42の訂正文字候補抽出処理につ
いて説明する。図29は、訂正文字の一実施例を示す図
である。
線で消したものであり、訂正文字の形態として、図29
(a)に示すように、文字を“×”印により消したも
の、図29(b)に示すように、文字を横二重線により
により消したもの、図29(c)に示すように、文字を
斜め線により消したもの、図29(d)に示すように、
文字を波線により消したもの、図29(e)に示すよう
に、文字を真っ黒に塗りつぶすことにより消したものな
ど様々なものがある。
有な特徴を抽出する。この訂正文字に特有な特徴とし
て、「所定方向の線密度」、「オイラー数」、「黒画素
密度」などがある。
所定の一定方向に沿って走査した際に、白画素から黒画
素(又は黒画素から白画素)に変化する回数を計数した
値である。また、所定方向は、消し線として想定された
線分の方向と垂直方向に設定する。
ついて、縦方向の最大線密度を計数した例を示すもの
で、この場合の縦方向の最大線密度は3となっている。
訂正文字の「所定方向の線密度」は、通常文字の「所定
方向の線密度」に比べて大きくなる傾向があり、この
「所定方向の線密度」を算出することにより、訂正文字
の候補を抽出することができる。
結している連結成分の個数Cから、その画像が有する穴
の個数Hを引いた値である。例えば、図30(b)は、
互いに連結している連結成分が画像中に2つだけ存在
し、その画像中に穴が1つだけ存在する例を示すもの
で、この例の場合のオイラー数Eは、E=C−H=2−
1=1となる。
な負の値となる傾向があり、通常文字の「オイラー数」
は絶対値が小さな値(2〜−1)となる傾向がある。し
たがって、この「オイラー数」を算出することにより、
訂正文字の候補を抽出することができる。
面積(黒画素数)Bと注目する画像の外接矩形の面積S
との比である。例えば、図30(c)は、「4」の文字
について黒画素密度Dを算出した場合の例を示すもの
で、「4」の文字に外接している外接矩形の面積をS、
「4」の文字の面積をBとすると、D=B/Sとなる。
「黒画素密度」に比べて大きくなる傾向があり、この
「黒画素密度」を算出することにより、訂正文字の候補
を抽出することができる。
具体的に説明する。図31は、基本文字認識部17の構
成の一実施例を示すブロック図である。図31におい
て、特徴抽出部121は、入力された未知の文字パター
ンから文字の特徴を抽出し、この抽出した特徴を特徴ベ
クトルにより表す。一方、基本辞書122には、各文字
カテゴリの特徴ベクトルが格納されている。
1により抽出した未知の文字パターンの特徴ベクトル
を、基本辞書122に格納されている各文字カテゴリの
特徴ベクトルと照合し、特徴空間上での特徴ベクトル間
の距離Dij(iは未知文字の特徴ベクトル、jは基本辞
書122のカテゴリの特徴ベクトル)を算出する。その
結果、特徴ベクトル間の距離Dijを最小とするカテゴリ
jを未知文字iとして認識する。
距離Dijは、例えば、ユークリッド距離Σ(i−
j)2 、シティブロック距離Σ|i−j|、又は判別関
数などの識別関数を用いて算出することができる。
Dij1 、第2位のカテゴリとの距離をDij 2 とすると、
第1位のカテゴリj1、第2位のカテゴリj2、カテゴ
リ間の距離(Dij2 −Dij1 )及び信頼度に関するテー
ブル1を予め作成しておく。また、第1位のカテゴリと
の距離をDij1 、第1位のカテゴリj1及び信頼度に関
するテーブル2も予め作成しておく。そして、テーブル
1とテーブル2とからそれぞれ得られる信頼度の小さい
方を中間処理結果テーブルに格納する。
である。この例は、図32(a)の縦5×横4の合計2
0個の枡目に「2」の文字が書かれており、黒く塗りつ
ぶされた枡目を“1”、白抜きの枡目を“0”として、
枡目の左上から右下の順に枡目を見ていき、その時現れ
る“1”又は“0”の数値を順に並べたものを、特徴ベ
クトルとしたものである。
ルvectorAは、vectorA=(1、1、1、
1、0、0、0、1、1、1、1、1、1、0、0、
0、1、1、1、1、)となり、図32(c)の場合の
特徴ベクトルvectorBは、vectorB=
(0、1、1、1、0、0、0、1、1、1、1、1、
1、0、0、0、1、1、1、1、)となり、図32
(d)の場合の特徴ベクトルvectorCは、vec
torC=(1、1、1、1、0、0、0、1、0、
1、1、0、1、0、0、0、1、1、1、1、)とな
る。
j)により特徴ベクトル間の距離Dijを算出する例を示
す図である。ここで、シティブロック距離d(i,j)
は、特徴ベクトルの次元数をN、特徴ベクトルの番号を
iとすると、i番目の特徴ベクトルxi は、xi =(x
i1,xi2,xi3,・・・xiN)と表され、j番目の特徴
ベクトルxj は、xj =(x j1,xj2,xj3,・・・x
jN)と表される。そして、i番目の特徴ベクトルxiと
j番目の特徴ベクトルxj とのシティブロック距離d
(i,j)は、 d(i,j)=|xi −xj | ・・・(2) と定義される。
には、「1」、「2」、「3」、「4」の文字カテゴリ
の特徴ベクトルが登録されているものとする。ここで、
「1」の文字カテゴリの特徴ベクトルvector1
は、vector1=(0、1、1、0、0、1、1、
0、0、1、1、0、0、1、1、0、0、1、1、
0、)、「2」の文字カテゴリの特徴ベクトルvect
or2は、vector2=(1、1、1、1、0、
0、0、1、1、1、1、1、1、0、0、0、1、
1、1、1、)、「3」の文字カテゴリの特徴ベクトル
vector3は、vector3=(1、1、1、
1、0、0、0、1、1、1、1、1、0、0、0、
1、1、1、1、1、)、「4」の文字カテゴリの特徴
ベクトルvector4は、vector4=(1、
0、1、0、1、0、1、0、1、1、1、1、0、
0、1、0、0、0、1、0、)とする。
ector=(0、1、1、1、0、0、0、1、1、
1、1、1、1、0、0、0、1、1、1、1、)であ
る未知文字が入力された場合、この特徴ベクトルvec
torと、基本辞書122に登録されている「1」の文
字カテゴリの特徴ベクトルvector1、「2」の文
字カテゴリの特徴ベクトルvector2、「3」の文
字カテゴリの特徴ベクトルvector3、「4」の文
字カテゴリの特徴ベクトルvector4のそれぞれと
の間のシティブロック距離d(i,j)を(2)式によ
り算出する。
torと「1」の文字カテゴリの特徴ベクトルvect
or1との間のシティブロック距離d(i,j)は、d
(i,j)=|vector−vector1|=|0
−0|+|1−1|+|1−1|+|1−0|+|0−
0|+|0−1|+|0−1|+|1−0|+|1−0
|+|1−1|+|1−1|+|1−0|+|1−0|
+|0−1|+|0−1|+|0−0|+|1−0|+
|1−1|+|1−1|+|1−0|=11となる。
orと「2」の文字カテゴリの特徴ベクトルvecto
r2との間のシティブロック距離d(i,j)は、d
(i,j)=|vector−vector2|=1、
未知文字の特徴ベクトルvectorと「3」の文字カ
テゴリの特徴ベクトルvector3との間のシティブ
ロック距離d(i,j)は、d(i,j)=|vect
or−vector3|=3、未知文字の特徴ベクトル
vectorと「4」の文字カテゴリの特徴ベクトルv
ector4との間のシティブロック距離d(i,j)
は、d(i,j)=|vector−vector4|
=11となる。
orと、「1」の文字カテゴリの特徴ベクトルvect
or1、「2」の文字カテゴリの特徴ベクトルvect
or2、「3」の文字カテゴリの特徴ベクトルvect
or3、「4」の文字カテゴリの特徴ベクトルvect
or4のそれぞれとの間のシティブロック距離d(i,
j)のうち、未知文字の特徴ベクトルvectorと
「2」の文字カテゴリの特徴ベクトルvector2と
の間のシティブロック距離d(i,j)が最小となって
いる。
ector=(0、1、1、1、0、0、0、1、1、
1、1、1、1、0、0、0、1、1、1、1、)であ
る未知文字は、「2」の文字カテゴリに属すると判定さ
れる。
ーブル18に格納されている詳細識別法について説明す
る。この詳細識別法は、各文字カテゴリの局所的な部分
パターンを文字セグメントとして取り出し、未知文字の
文字セグメントの位置や角度変化量とセグメント辞書に
予め格納してある文字セグメントの位置や角度変化量と
を比較することにより、未知文字と文字カテゴリとの対
応を取りながら文字を認識する。
明する図である。図34(a)は、「2」の文字につい
ての2値画像パターンを示しており、斜線部分が黒画素
で表された文字部分を示している。
パターンから抽出された輪郭線を示しており、点線部分
は元の2値画像パターンを示している。図34(c)
は、図34(b)の輪郭線を文字セグメントS1、S2
と端点部分T1、2とに分割した状態を示している。こ
の端点部分T1、2は、図34(a)の「2」の文字の
書き始め及び書き終わりに対応するものである。
ある。図35において、端点は輪郭線の傾きが急激に変
化する場所として検出され、具体的には、一定間隔だけ
離れた3点A、B、Cを輪郭線S上にとり、その3点
A、B、Cを結んだ真ん中の点Aを頂点としてなす角θ
が所定値以下となる輪郭線上の領域を、端点として検出
する。
り、文字セグメントを2値画像パターンから抽出する
と、例えば、文字セグメント上に代表点X、Y、Zを一
定の距離ごとにとる。そして、連続する代表点X、Y、
Zのなす角度を求め、各代表点X、Y、Zでの特徴量と
して、文字セグメント上の最初の代表点から各代表点ま
での角度変化量の累積値を求める。
図である。図36において、任意の間隔だけ離れた代表
点X、Y、Zを輪郭線S上にとり、代表点Xから代表点
Yに引いたベクトルXYと、代表点Yから代表点Zに引
いたベクトルYZとを作り、ベクトルXYとベクトルY
Zとのなす角θ2 が代表点Yでの角度変化となる。
点Xでの角度変化は、文字の重心Gから代表点Xに引い
たベクトルGXとベクトルXYとのなす角θ1 を代表点
Xでの角度変化とする。
化の初期値を有する代表点Xから各代表点Y、Zまでの
角度変化を累積した値で表し、例えば、代表点Yでの特
徴量は、θ1 +θ2 の値となる。
角度変化量の累積値を求めた後、この未知文字の文字セ
グメントについての代表点とセグメント辞書に格納して
ある文字セグメントの代表点との対応をとる。すなわ
ち、未知文字の文字セグメントについての代表点の角度
変化量の累積値と、セグメント辞書に格納してある文字
セグメントの代表点の角度変化量の累積値との距離を算
出し、この距離が最も小さくなるセグメント辞書の文字
セグメントの代表点を未知文字の文字セグメントの代表
点に対応させる。
トの代表点とセグメント辞書の文字セグメントの代表点
との対応関係を示す図である。図37(a)において、
代表点a1 〜a8 は、未知文字の文字セグメント上の代
表点を表し、代表点b1 〜b8 は、セグメント辞書に格
納されている文字セグメント上の代表点を表している。
そして、未知文字の文字セグメントについての代表点a
1 〜a8 はそれぞれ、セグメント辞書に格納されている
文字セグメントの代表点b1 〜b8 に対応している。
メント辞書の文字セグメントの代表点との対応関係を求
めた後、セグメント辞書に格納されている文字セグメン
ト上の基準点に対応する未知文字の文字セグメントにつ
いての代表点を検査点とする。
関係を示す図である。図37(b)において、セグメン
ト辞書に格納されている文字セグメントの基準点d1 、
d2 はそれぞれ、未知文字の文字セグメントの検査点c
1 、c2 に対応している。
未知文字の文字セグメントの検査点c1 、c2 について
の検査情報を算出する。この検査情報は、例えば、1つ
の検査点に対しては、その検査点が文字画像全体の中で
どの位置に存在しているかという個々の検査点の絶対位
置情報や、2つの検査点に対しては、それらの検査点間
の距離や方向などの相対位置情報や、2つの以上の検査
点に対しては、それらの検査点間の角度変化や直線性な
どの情報からなっている。
した結果、所定の判定条件を満たす場合、判定条件を満
たしたセグメント辞書に格納されている文字セグメント
の文字カテゴリを未知文字の認識結果として出力する。
文字セグメント上の検査点c1 から文字セグメントに沿
って検査点c2 までの角度変化を検査情報とした場合、
この角度変化が60度以上である文字セグメントの文字
画像が、その文字セグメントに対応して格納されている
セグメント辞書の「2」の文字カテゴリに属するとした
場合、図37(b)の文字セグメント上の検査点c1 か
ら文字セグメントに沿って検査点c2 までの角度変化を
算出することにより、図34(a)の文字パターンが
「2」の文字カテゴリに属すると認識できる。
を示すフローチャートである。図38において、まず、
ステップS150に示すように、文字認識の対象となる
帳票などをスキャナで走査し、読み込んだ文字画像を白
黒2値の画像に2値化する。
テップS150で得られた2値画像データから文字セグ
メントを抽出する。次に、ステップS152に示すよう
に、セグメント辞書に格納されている複数の文字セグメ
ントから、未知文字の文字セグメントとの対応関係が付
けられていない文字セグメントを取り出す。
グメント辞書から取り出した文字セグメントと未知文字
の文字セグメントとの対応関係を付ける。次に、ステッ
プS154に示すように、未知文字の文字セグメント上
にとった代表点の中から検査点を決定し、この検査点に
ついての検査情報を算出する。
テップS154で算出した検査情報に基づいて、セグメ
ント辞書から取り出した文字セグメントと未知文字の文
字セグメントとを比較し、セグメント辞書から取り出し
た文字セグメントの検査情報と未知文字の文字セグメン
トの検査情報とが一致するかどうかを判定することによ
り、未知文字に対する文字候補の決定処理を行う、次
に、ステップS156に示すように、未知文字に対する
文字候補の決定処理で、文字候補が決定した場合、ステ
ップS153で取り出した文字セグメントに対応する文
字カテゴリを認識結果として出力する。一方、文字候補
が決定しない場合、ステップS157に進み、未知文字
の文字セグメントとの対応関係が付けられていない未処
理の文字セグメントがセグメント辞書にあるかどうかを
判断し、未処理の文字セグメントがセグメント辞書にあ
る場合、ステップS152に戻って、以上の処理を繰り
返す。
関係が付けられていない未処理の文字セグメントがセグ
メント辞書にない場合、入力された未知文字は認識不能
であると判断して、認識不能という認識結果を出力す
る。
開平6−309501号公報に記載されている。次に、
図3の接触文字認識部13の一実施例について説明す
る。
処理を説明する図である。この文字補完処理では、枠接
触文字の2値画像から枠だけを抽出してこの枠を除去す
る。この際、枠接触文字の枠に接触している文字線分の
枠接触部分がかすれてしまい、文字線分が複数の部分に
途切れてしまうので、途切れた文字線分について、各ラ
ベルが付与された文字線分間の距離や方向性等の幾何学
的構造を評価して、それを補完する。
「3」を表している文字パターン131と枠132とが
接触したために連結している2値画像にラベル“1”が
付されている。そして、図39(a)の2値画像から枠
132を抽出し、この枠132を除去することにより、
図39(b)に示すように、「3」を表している文字パ
ターン131が3個に分割されて、ラベル“1”、ラベ
ル“2”及びラベル“3”が付与された3個の文字線分
が生成される。
ル“3”が付与された3個の文字線分について、各ラベ
ルが付与された文字線分間の距離や方向性等の幾何学的
構造を評価して、それを補完する。これにより、ラベル
“1”、ラベル“2”及びラベル“3”が付与された3
個の文字線分が連結されて、図39(c)に示すよう
に、ラベル“1”が付された「3」を表している文字補
完パターン132が生成される。
は、認識文字の候補として認識処理が行われる。この認
識処理では、文字カテゴリ辞書に登録されている標準パ
ターンと照合して、相違度が最も小さい文字カテゴリの
コードを出力する。
理を説明する図である。この再補完処理では、枠に平行
な文字線分が枠に接触し、枠を除去したために枠に平行
な文字線分が消滅した場合に、この文字線分を補完する
もので、予め、枠接触文字をラベリングによる連結性を
用いて抽出しておき、文字補完処理により補完された文
字補完パターンと枠接触文字の連結性が一致することを
検出することにより、枠に平行な文字線分を補完する。
「7」を表している文字パターン141と枠142とが
接触したために連結している2値画像にラベル“1”が
付されている。そして、図40(a)の2値画像から枠
142を抽出し、この枠142を除去することにより、
図40(b)に示すように、「7」を表している文字パ
ターン141が3個に分割されて、ラベル“1”、ラベ
ル“2”及びラベル“3”が付与された3個の文字線分
が生成される。
ル“3”が付与された3個の文字線分について、各ラベ
ルが付与された文字線分間の距離や方向性等の幾何学的
構造を評価して、それを補完する。これにより、ラベル
“1”及びラベル“2”が付与された2個の文字線分が
連結されて、図40(c)に示すように、ラベル“1”
及びラベル“2”が付与された2個の文字線分からなる
文字補完パターン142が生成される。
は、図40(b)のラベル”1”が付与されていた部分
とラベル”2”が付与されていた部分との間のみで、図
40(b)のラベル”1”が付与されていた部分とラベ
ル”3”が付与されていた部分については、補完するこ
とができない。この図40(b)のラベル”1”が付与
されていた部分とラベル”3”が付与されていた部分の
補完は、再補完処理により行う。
ベリングによる連結性を用いて抽出しておき、図40
(c)のパターンと枠接触文字の連結性が一致すること
を検出することにより、枠に平行な文字線分を補完す
る。すなわち、図40(c)のラベル”1”が付与され
たパターンとラベル”2”が付与されたパターンとは、
図40(a)に示すように、枠を除去する前は互いに連
結していたので、図40(c)のラベル”1”が付与さ
れたパターンとラベル”2”が付与されたパターンと
を、枠に平行な線分を用いて互いに連結する。
とラベル”2”の2つの文字線分に分かれていた「7」
の2値画像が補完され、図40(d)に示すように、ラ
ベル“1”が付された「7」を表している再補完パター
ン143が生成される。
認識文字の候補として認識処理が行われる。この認識処
理では、文字カテゴリ辞書に登録されている標準パター
ンと照合して、相違度が最も小さい文字カテゴリのコー
ドを出力する。
(c)に示す文字補完パターン142は、「リ」の文字
カテゴリに属すものと認識される。また、図40(d)
に示す再補完パターン143は、「7」の文字カテゴリ
に属すものと認識される。そして、「リ」よりも「7」
のほうが相違度が小さいと判断されて、最終的に「7」
と認識され、その文字コードが出力される。
ーブル14を参照しながら認識処理を行う場合について
説明する。図41は、誤読文字対を学習し、知識テーブ
ル14に登録しておくことにより、枠接触文字を認識す
る例を説明する図である。
に、「2」を表している文字パターン151と枠152
とが接触したために連結している2値画像にラベル
“1”が付されている。そして、図41(a)の2値画
像から枠152を抽出し、この枠152を除去すること
により、図41(b)に示すように、「2」を表す文字
151がラベル“1”とラベル“2”の2つの部分パタ
ーンに分離される。
完処理により、図41(b)のラベル“1”とラベル
“2”の2つの部分パターンが連結され、文字補完パタ
ーン153が生成される。
ン151の下線部分が枠152に接触し、その接触部分
がほぼ完全に枠152に重なっている。このため、再補
完処理を用いても、「2」を表している文字パターン1
51の下線部分を補完することができず、「2」の文字
を、誤って「7」と認識してしまう可能性が高くなる。
み出すことなく、枠に完全に重なっているため、他の文
字と誤って認識してしまう場合、誤読文字対を学習して
登録しておくことにより、枠接触文字が正しく認識され
るようにする。
ことにより、枠接触文字を認識する方法について説明す
る。図42は、図3の接触文字認識部13において、誤
読文字対を学習する構成を示すブロック図である。
れた枠に未接触の学習文字を枠に重ね合わせて、枠接触
文字を生成する。ここで、枠に対する学習文字の変動の
方法により、同一の学習文字に対して複数の枠接触文字
が生成される。図42では、「2」を表している学習文
字168が枠接触文字の自動生成部161に入力され、
文字「2」の下辺と下枠とが重なった枠接触文字169
を生成した例を示している。枠接触文字の自動生成部1
61により生成された情報は、知識テーブル167に登
録される。
類は、例えば、「文字枠に対する文字の変動」と「文字
枠の変動」の2種類があり、「文字枠に対する文字の変
動」には、例えば、「位置ずれ」、「サイズ変動」及び
「傾き変動」などがあり、「文字枠の変動」には、例え
ば、「傾き変動」、「枠幅変動」、「サイズ変動」及び
「枠の凹凸」などがある。
すパラメータとして以下のパラメータがある。なお、垂
直方向にx軸を、水平方向にy軸を設定するものとす
る。 1.文字枠に対する文字の変動 位置ずれ:dx、dy、 ここで、dx(図43で黒丸で示した位置)、dy(図
43で ×で示した位置)は、それぞれ、文字の重心と
文字枠の重心の位置の差のx方向、y方向の大きさを表
す。
y方向の大きさを表す。
y方向の大きさを表す。
た文字枠の品質劣化等を考慮した文字枠の凹凸を制御す
るパラメータである。例えば、文字枠の周囲長をLとす
ると、fδは、このサイズLの配列fδ〔L]として表
現され、この配列の各要素fδ〔i](i=1、2、
3,・・・)は、乱数発生により決定される−β〜+β
の範囲内の整数値をとる。
て、学習文字に対して操作F(dx,dy,dsx,d
sy,dα,w,fsx,fsy,fα、fδ)を施す
ことにより、枠接触文字を生成する。
対して枠172を合成することにより、枠接触文字を生
成する例を示す図である。図43(a)に示すように、
「7」を表す学習文字171に対して変換操作F(d
x,dy,dsx,dsy,dα,w,fsx,fs
y,fα、fδ)を施すことにより、図43(b)に示
すように、枠172に接触する「7]の枠接触文字を生
成する。
対して変換操作F(dx,dy,dsx,dsy,d
α,w,fsx,fsy,fα、fδ)を施し、学習文
字171と枠172とを重ね合わせることにより、枠接
触文字を生成する。この場合、例えば、枠172の方の
重心の位置を固定しながら変換操作F(dx,dy,d
sx,dsy,dα,w,fsx,fsy,fα、f
δ)を実行する。
y方向のサイズ変動fsyを固定し、枠の大きさを固定
した場合について、「3」の学習文字に対して生成した
各種枠接触文字の例を示す図である。
れ”の場合の例であり、変動量がdx=0、dy>0の
場合である。この場合、「3」の文字が枠の下にはみ出
すことになる(下位置変動)。
動”の場合の例であり、変動量がdsx=fsx,ds
y=fsyの場合である。この場合、「3」の文字が枠
の上下、左右に接触することになり、「3」の外接矩形
が枠に等しくなる。
き変動”の例であり、変動量がdα=10度の場合であ
る。図44(d)は、変動の種類が“文字枠の傾き変
動”の例であり、変動量がfα=−10度の場合であ
る。
動”の例であり、変動量がw=5の場合である。図44
(f)は、変動の種類が、“枠の凹凸”の例であり、変
動量fδ〔L]の各要素fδ〔i]を制御した場合であ
る。
文字の自動生成部161により生成された枠接触文字か
ら枠のみを抽出し、この枠を除去して得られたかすれ文
字についての画像データを、文字補完部163に出力す
る。
って枠が除去された文字の画像データを、ラベルが付与
された文字線分間の距離や方向性等の幾何学的構造を評
価して補完する。図42は、枠接触文字の自動生成部1
61により生成された枠接触文字169から枠を除去し
た後、文字補完部163により補完を行って文字補完パ
ターン170を生成した例を示している。
って補完しきれなかった領域について、予め、枠接触文
字をラベリングによる連結性を用いて抽出しておき、文
字補完部163により補完されたパターンと枠接触文字
の連結性が一致することを検出することにより、枠に平
行な文字線分を補完する。
補完パターンと再補完部164によって補完された再補
完パターンとは、基本文字認識部165に入力される。
基本文字認識部165は、文字補完部163によって補
完された文字補完パターンと再補完部164によって補
完された再補完パターンについて、文字認識を実行す
る。そして、各学習文字についての認識結果を枠接触状
態と認識の知識獲得部166に出力する。
基本文字認識部165から出力される認識結果を予め与
えられている正解データと比較して、全サンプルデータ
に対する認識率を得る。そして、この認識率を信頼度と
して、また、誤読文字(誤って認識した文字)と正解の
文字との組み合わせを誤読文字対として、知識テーブル
167に登録する。なお、上記誤読文字対は、例えば、
文字コードにより登録される。また、枠接触状態と認識
の知識獲得部166は、枠と文字の接触状態の特徴を示
すパラメータを抽出して、これも知識テーブル167に
登録する。
は、各文字カテゴリについて、枠と文字の様々な接触状
態におけるその文字に対する認識率が、その誤読文字対
とともに登録される。
ブル167の一例を示す図である。図45において、知
識テーブル167には、例えば、誤読文字対(2、7)
及び信頼度77%が、“下位置ずれ変動”の変動量dy
=5、W=5等と共に登録され、変動量が、dy=5、
W=5の“下位置ずれ”の「2」の枠接触文字の場合、
基本文字認識部165は、23%の確率で、「2」を誤
って「7」と認識してしまうことが示される。すなわ
ち、この場合、基本文字認識部165が「7」と認識し
たとしても、その信頼度は77%であり、実際の文字が
「2」である可能性が22%ある旨が知識テーブル16
7を参照することにより判断できる。
いても、“変動量”、“枠の線幅”、“誤読文字対”及
び信頼度が、枠接触状態と認識の知識獲得部166によ
って知識テーブル167に登録される。
は、文字「L1」が文字「L2」に誤って認識されてし
まう場合を示すものである。また、上記文字「L1」、
「L2」には、例えば、該当する文字「L1」、「L
2」の文字コードが登録される。
動量dy=5,W=5の“下位置ずれ変動”以外にも、
図46に示すように“文字枠に対する文字の傾き変動”
(この場合、左枠接触)などの図43に示す各種変動に
ついて、各文字カテゴリ毎に登録される。
“下位置ずれ”変動については、例えば、dx=「−
3」〜「+3」、dy=5、w=5、dsy=1、dα
=「−10」〜「+10」、fα=「−10」〜「+1
0」が登録される。このように、同じ”下位置ずれ”変
動であっても、知識テーブル167に登録される変動量
は、x方向の位置ずれdx、y方向の位置ずれdyのみ
でなく、その他の変動量が登録される場合がある。ま
た、“左枠接触の文字枠に対する文字の傾き変動”につ
いては、例えば、dx=「−3」〜「+3」、dy=
「−3」〜「+3」、w=5,dsy=1,dα=「−
20」〜「+20」、fα=「−10」〜「+10」が
登録される。
い値(例えば、90%)以下の誤読文字対(L1,L
2)について、信頼度がその所定のしきい値以上となる
ような文字認識方法を学習し、学習した文字認識方法を
知識テーブル167に登録する。
w=5の”下位置ずれ”の状態の「2」の枠接触文字の
文字認識の信頼度は77%であり、「7」と誤って認識
される確率が高いので、文字補完部163により補完さ
れた文字補完パターンまたは再補完部164により補完
された再補完パターンを、例えば、領域強調の手法によ
り再認識すれば認識率が向上することを学習して知識テ
ーブル167に登録しておく。
る領域強調の手法を図47を参照しながら説明する。ま
ず、図47(a)に示すように、文字補完部163によ
り補完された文字補完パターンまたは再補完部164に
より補完された再補完パターンの外接矩形180を、縦
の行がm個、横の列がn個のm×n個の分割領域に分割
する。そして、図47(b)にハッチングで示すよう
に、外接矩形180の上半分のm/2×n個の領域を特
に強調して、文字認識を再度行う。
パラメータを抽出して、文字補完部163により補完さ
れた文字補完パターンまたは再補完部164により補完
された再補完パターンが「2」または「7」のいずれで
あるかを調べる。この領域強調の手法により、認識度が
95%まで向上する。図45の知識テーブル167に
は、誤読文字対が(2、7)の行に、再認識方法として
「領域強調」を、再認識領域として「m/2×n」を、
さらに再認識信頼度として「95%」を登録する。
すような枠接触文字の場合にも有効である。図48
(a)は、「2」を表している文字パターンの下部が文
字枠182に接触している例である。
8(b)に示すような「7」に類似する文字補完パター
ン183が得られる。この文字補完パターン183に対
して図48(c)に示す外接矩形184を算出する。そ
して、この外接矩形184を、図47に示すように、m
×n個の領域に分割した後、上半分のm/2×n個の部
分領域185を特に強調して文字認識すれば、文字補完
パターン183が「2」と認識される確率が高い、すな
わち、正解率(信頼度)が高くなることを学習し、枠接
触による誤読文字対(2、7)に対する再認識方法とし
て、上記領域強調の手法を知識テーブル167に登録す
る。
再認識方法を示すフローチャートである。図49におい
て、まず、ステップS601に示すように、知識テーブ
ル167から信頼度の低い誤読文字対のデータを取り出
す。そして、この誤読文字対の左側に登録されている文
字について、2値の学習データとしての文字パターン
と、文字補完部163により補完された文字補完パター
ンまたは再補完部164により補完された再補完パター
ンとを入力する。
ンは、知識テーブル167に登録されている変動量パラ
メータによって規定されるパターンであり、同一カテゴ
リであっても複数の形状のパターンを取りうる。
テップS601で入力された学習データとしての文字パ
ターンと、文字補完部163により補完された文字補完
パターンまたは再補完部164により補完された再補完
パターンとを、m×nの領域に分割する。
このm×nの領域内のX×Yの部分パターンについて文
字認識を実行する。そして、この場合の認識率zを求め
る。上記X×Yの部分パターンは、再認識領域である。
このとき、X,Yは、それぞれ、m×nの領域のX方
向、Y方向の長さを表す変数であり、X≦m,Y≦nで
ある。また、上記認識率zは、上記X×Yの部分パター
ンを用いて文字認識を行った際の、正解となる確率であ
る。
ンの部分パターンの文字認識結果を正解とみなす。そし
て、文字補完部163により補完された文字補完パター
ンまたは再補完部164により補完された再補完パター
ンについての複数の部分パターンに対する文字認識結果
を、学習データとしての文字パターンの部分パターンの
文字認識結果と比較していくことにより、文字補完部1
63により補完された文字補完パターンまたは再補完部
164により補完された再補完パターンについての部分
パターンの認識率zを求める。
認識率zが最大認識率maxよりも大きいか否かを判別
する。この最大認識率maxは、X×Yの部分パターン
を変化させていった場合における認識率zの最大値を記
憶する変数であり、最初はある初期値(例えば、
「0」)が設定される。
も大きければ、ステップS605に進んで、この認識率
zを最大認識率maxに代入し、続いて、ステップS6
06に進んで、長さX,Yを変更可能か否か調べる。一
方、ステップS604で、認識率zが最大認識率max
以下であれば、直ちに、このステップS606に移行す
る。
さX,Yの大きさの変更である。また、X×Yの部分パ
ターンのm×nの領域内での位置変更操作を含んでいて
もよい。
能であると判別すると、ステップS603に戻り、長さ
X,Yの変更操作を行い、新たなX×Yの部分パターン
を決定し、この部分パターンに対して文字認識を行う。
処理を、上記ステップS506で長さX,Yを変更でき
ないと判別するまで繰り返す。そして、ステップS60
6で長さX,Yを変更できないと判別すると、最大識別
率maxとその最大識別率maxが得られたX×Yの部
分パターンを、それぞれ、再認識信頼度、再認識領域と
して知識テーブル167に登録する。また、再認識方法
として「領域強調」を知識テーブル167に登録する。
強調」の手法を用いて再文字認識の方法を学習する例で
あるが、「領域強調」の手法以外についても、再文字認
識の方法を学習するようにしてもよい。
ル167を用いて枠接触文字の文字認識を行う構成を示
すブロック図である。図50において、枠接触状態の検
出部191は、入力された未知の枠接触文字について、
枠と文字との接触状態を検出する。ここでは、図50
(a)の下枠が「2」の下辺と部分的に重なっている枠
接触文字パターン201と、図50(b)の下枠が
「2」の下辺と完全に重なっている枠接触文字パターン
203とが入力された例について示している。そして、
枠接触状態の検出部191は、枠接触文字パターン20
1及び枠接触文字パターン203を検出する。
91により検出された枠接触文字パターンから枠を除去
する。文字補完部193は、枠除去部192により枠が
除去された文字パターンについて、ラベルが付与された
文字線分間の距離や方向性等の幾何学的構造を評価して
補完する。
って補完しきれなかった領域について、予め、枠接触文
字をラベリングによる連結性を用いて抽出しておき、文
字補完部163により補完されたパターンと枠接触文字
の連結性が一致することを検出することにより、枠に平
行な文字線分を補完する。ここで、再補完パターン20
2は、図50(a)の枠接触文字パターン201に対
し、再補完部194の再補完処理により補完されたパタ
ーンを示し、再補完パターン204は、図50(b)の
枠接触文字パターン203に対し、再補完部194の再
補完処理により補完することができなかったパターンを
示している。
3によって補完された文字補完パターンと再補完部19
4によって補完された再補完パターンとのそれぞれに対
し、文字認識を実行する。この結果、例えば、図50
(a)の再補完パターン202に対しては、「2」の文
字コードが出力され、図50(b)の再補完パターン2
04に対しては、「7」の文字コードが出力される。そ
して、その認識結果により得られた文字コードを、枠接
触状態と認識の知識参照部196に出力する。
文字補完部193によって補完された文字補完パターン
又は再補完部194によって補完された再補完パターン
の外接矩形の位置情報及び図50(a)の枠接触文字パ
ターン201又は図50(b)の枠接触文字パターン2
03から抽出された文字枠の位置情報や幅情報などを基
に、変動の種類を求める。
位置ずれ”、”サイズ変動”、”傾き変動”などの文字
枠に対する文字の変動、または、”傾き変動”、枠幅変
化”、”枠の凹凸”などの文字枠の変動を求める。さら
に、求めた各変動の種類について、変動量dx,dy,
dsx,dsy,dα、w,fsx,fsy,fα、f
δを算出する。
報と、基本文字認識部195から入力される文字コード
とをキー項目として、知識テーブル167を検索し、こ
のキー項目に一致する変動種類情報、変動量情報及び誤
読文字対を有する行が知識テーブル167に登録されて
いるか否か調べる。
場合には、この行に登録されている信頼度が所定のしき
い値以上であるか否かを判別し、そのしきい値未満であ
れば、文字補完部193によって補完された文字補完パ
ターン又は再補完部194によって補完された再補完パ
ターンを再文字認識部197に出力し、その行に登録さ
れている再認識方法に従って、文字認識を再度行う。
された文字補完パターン又は再補完部194によって補
完された再補完パターン、あるいは未知文字の2値画像
データを用いて、基本文字認識部195による手法とは
別の手法で未知画像データに含まれる枠接触文字の再認
識を実行する。そして、再認識により得られた文字コー
ドを出力する。
部194によって補完された再補完パターン204の認
識結果として、「7」の文字コードを出力した場合、枠
接触状態と認識の知識参照部196は、再補完パターン
204の外接矩形の位置情報と枠接触文字パターン20
3から抽出した文字枠の位置情報及び幅情報とを基に、
変動の種類及び変動量を求める。この結果、変動の種類
として“下位置ずれ”が算出され、この“下位置ずれ”
の変動量として「dy=5」が算出され、文字枠の幅と
して「w=5」が算出される。
96は、変動の種類として“下位置ずれ”、“下位置ず
れ”の変動量として「dy=5」、文字枠の幅として
「w=5」、及び基本文字認識部195から入力された
文字コード「7」をキー項目として、図45の知識テー
ブル167を検索する。この検索の結果、これらのキー
項目に対応する行には誤読文字対(2、7)が登録さ
れ、基本文字認識部195で認識された文字コード
「7」の信頼度は77%であり、23%の確率で「2」
を「7」と読み間違えていることを知る。
に登録されている信頼度は所定のしきい値よりも低いの
で、再文字認識部197は、基本文字認識部195によ
る手法とは別の手法で未知画像データに含まれる枠接触
文字パターン203の再認識を実行する。この際、再文
字認識部197は、知識テーブル167のキー項目に対
応する行を参照し、再認識方法を特定する。
方法として、「領域強調」を行うことを教えられるとと
もに、「領域強調」を行う場合の再認識領域として、再
補完パターン204の上半分のm/2×nの部分領域2
05だけを強調して再認識することを教えられる。ま
た、この場合の再認識信頼度が95%であることも教え
られる。
7に登録されている再認識方法に従って、再補完パター
ン204の上半分の部分領域205のみについての再認
識を行う。そして、再補完パターン204の部分領域2
05は、文字コード「2」に対応する文字パターン20
6の部分領域207に95%の確率で一致し、文字コー
ド「7」に対応する文字パターン208の部分領域20
9に5%の確率で一致することを知り、未知の枠接触文
字パターン203の枠に接触した文字の認識結果とし
て、文字コード「2」を出力する。
196の動作を示すフローチャートである。図51にお
いて、まず、ステップS171に示すように、未知の枠
接触文字パターンから抽出した枠と、枠接触文字パター
ンから分離した文字パターンとに基づいて、文字の枠に
対する変動量を算出し、この変動量をキー項目として知
識テーブル167を探索する。そして、この算出された
変動量に一致する変動量を登録している行が知識テーブ
ル167に存在するか否かを調べる。
っている「2」の文字について、その変動量としてdx
=5,w=5が算出されると、図45に示す知識テーブ
ル167の最上位の行が検出される。
合、ステップS172に進み、基本文字認識部195か
ら入力される文字コード(文字認識コード)を誤読文字
対に含んでいる行が、変動量が一致する行の中に存在す
るか否かを調べる。
っている「2」の文字の場合、図45に示す知識テーブ
ル167の最上位の行が検出される。そして、ステップ
S173に示すように、基本文字認識部195から入力
される文字コードを誤読文字対に含んでいる行が、変動
量が一致する行の中に存在する場合、知識テーブル16
7の該当する行に登録されている再認識信頼度と基本文
字認識部195により算出された信頼度とを比較し、知
識テーブル167の該当する行に登録されている再認識
信頼度が基本文字認識部195により算出された信頼度
よりも大きいか否か判別する。
っている「2」の文字の場合、図45に示す知識テーブ
ル167の最上位の行に登録されている再認識信頼度及
び基本文字認識部195により算出された信頼度が、そ
れぞれ、「95%」及び「77%」であり、知識テーブ
ル167の該当する行に登録されている再認識信頼度が
基本文字認識部195により算出された信頼度よりも大
きいと判別される。
れている再認識信頼度が基本文字認識部195により算
出された信頼度よりも大きい場合、ステップS174に
進み、知識テーブル167の該当する行に登録されてい
る再認識信頼度が予め定められたしきい値th1よりも
大きいか否かを判別し、しきい値th1よりも大きけ
ば、ステップS175に進み、知識テーブル167のス
テップS172で検出した行に登録されている「再認識
方法」及び「再認識領域」を参照する。
字補完部193によって補完された文字補完パターン又
は再補完部194によって補完された再補完パターンか
ら、知識テーブル167で示される「再認識領域」を切
り出し、この切り出した領域について、知識テーブル1
67で示される「再認識方法」により文字認識を実行す
る。そして、その文字認識により得られた文字コードを
出力する。
「95%」よりも小さい場合、基本文字認識部195に
より入力される下位置ずれ変動となっている「2」の文
字の補完パターンについて、上半分の「m/2×n」の
領域を用いた「領域強調」手法により、文字認識が再度
実行され、最終的に「2」の文字コードが出力される。
例えば、特願平7−205564号の明細書及び図面に
記載されている。次に、図3の文字列認識部15の一実
施例について説明する。
S2のレイアウト解析により抽出された文字列に対し、
この文字列から文字を一文字ずつ切り出す際に用いる特
性値としてのパラメータについて、文字の統合判定を行
うの際の閾値をヒューリスティクに決定するのではな
く、統計的に妥当な値を設定するようにしたものであ
る。
タ値とそのパラメータ値に対する文字の統合の成功又は
失敗に関する統計データをとる。そして、各パラメータ
を個別に評価するのではなく、全てのパラメータを多次
元空間上の1点として捉え、多変量解析の手法を用い
て、統合が成功した場合と統合が失敗した場合との2群
を分離する判別面を上記多次元空間内で求めるようにす
る。
性値からなるサンプルデータを、切り出し成功を示す第
1の群と切り出し失敗を示す第2の群とに分類し、第1
の群と第2の群との判別面をP次元空間において生成す
るものである。
求めることができる。すなわち、判別面を線形な判別関
数により構成する場合、その判別関数の係数ベクトル
は、 Σ-1(μ1 −μ2 ) ・・・(3) で与えられる。
は、前記第1の群と前記第2の群の各重心から等距離と
なるように構成される。なお、この判別関数の係数ベク
トルは、第1の群と第2の群との間の群間変動の群内変
動に対する比を最大にするという基準に基づいて、算出
することもできる。
パターンの外接矩形の位置、サイズ、並びなどからパタ
ーン同士を統合していく統計的処理と、文字列中の濁
点、分離文字などを処理するためにパターン形状に着目
する非統計的処理に分けて実行する。
置、縦横比、平均文字サイズに対するサイズ比、隣接す
るパターン同士の距離、統合したときのサイズ、パター
ン同士の重なり幅、文字列の粗密度などを切り出しパラ
メータとして用いる。
距離a、 2)外接矩形211の左枠と外接矩形212の右枠との
距離b、 3)外接矩形211の右枠と外接矩形212の左枠との
距離aと外接矩形211の左枠と外接矩形212の右枠
との距離bとの比c、 4)外接矩形211の左枠と外接矩形212の右枠との
距離bと外接矩形平均幅MXとの比d、 5)外接矩形213の下枠と外接矩形213の下枠の中
点から外接矩形214の下枠の中点とを結ぶ直線とのな
す角度e、 6)外接矩形213の下枠と外接矩形213の右下の頂
点から外接矩形214の左下の頂点とを結ぶ直線とのな
す角度f、 7)外接矩形215と外接矩形216とが重なっている
場合、外接矩形215の右枠と外接矩形216の左枠と
の距離pと外接矩形215の左枠と外接矩形216の右
枠との距離qとの比g、を切り出しパラメータとして用
いる。
トを参照しながら説明する。まず、ステップS181に
示すように、連結パターンの外接矩形を取り出す。次
に、ステップS182に示すように、ステップS181
で取り出した外接矩形の右隣に他の外接矩形があるかど
うか調べる。そして、ステップS181で取り出した外
接矩形の右隣に他の外接矩形がない場合、ステップS1
81で取り出した外接矩形を統計的処理の対象から除外
する。
プS181で取り出した外接矩形の右隣に他の外接矩形
があると判断された場合、ステップS184に進む。ま
た、ステップS183に示すように、文字列の外接矩形
の平均文字サイズを算出する。ここで、文字列の外接矩
形の平均文字サイズを算出する場合、1文字ごとの切り
出しがまだ行われていないので、厳密には、正確な平均
文字サイズを算出することができない。
を仮統合することにより、暫定的に平均文字サイズを算
出する。仮統合の方法として、近接する連結パターンを
統合した際の縦横比Pが、例えば、 N(=0.8)<P<M(=1.2) を満たす場合、仮統合を行う。そして、仮統合を行った
後の平均文字サイズを算出する。なお、文字列の外接矩
形の平均文字サイズは、外接矩形のサイズ別の頻度ヒス
トグラムを生成して求めるようにしてもよい。
52のパラメータa〜gを算出する。非統計的処理で
は、文字列中の濁点や分離文字などを対象にしており、
分離文字処理と濁点処理とに分ける。
き、線密度、隣接するパターン同士を統合したときのサ
イズ、パターン同士の距離を切り出しパラメータとして
用いる。
距離aと外接矩形221の左枠と外接矩形222の右枠
との距離bとの比p、 9)外接矩形221の左枠と外接矩形222の右枠との
距離bと外接矩形平均幅MXとの比q、 10)外接矩形21の面積cと外接矩形22の面積dと
の積と外接矩形平均幅MXと外接矩形平均高さMYとの
積の平方との比r、を切り出しパラメータとして用い
る。
ートを参照しながら説明する。この分離文字処理は、例
えば、“ハ”又は“ル”などのように2つ以上の連結パ
ターンから構成される分離文字を検出するものである。
結パターンのうち、右上がりとなっているパターンがあ
るかどうか判断する。そして、右上がりとなっているパ
ターンがない場合、分離文字処理の対象から除外する。
りとなっているパターンであると判断された場合、ステ
ップS192に進み、右上がりとなっているパターンの
右隣に隣接し、且つ右下がりとなっているパターン、す
なわち、例えば、“ハ”に対応するパターン、又は、右
上がりとなっているパターンの右隣に隣接し、且つ直角
方向に探索した場合のパターンと交差する回数(直角線
密度)が2となるパターン、すなわち、例えば、“ル”
に対応するパターンがあるかどうか判断する。そして、
これらの“ハ”又は“ル”などのような形状のパターン
でなければ、分離文字処理の対象から除外する。
又は“ル”などのような形状のパターンであると判断し
た場合、ステップS194に進む。また、上記ステップ
S191、S192とは別に、ステップS193で、文
字列の外接矩形の平均文字サイズを算出する。
た後、ステップS194で、図54に示されたパラメー
タp〜rの値を算出する。また、濁点処理では、濁点候
補パターンに着目し、例えば、そのパターンとその隣接
パターンを統合したときのサイズ、両パターン間の距
離、及びそれらと平均文字サイズとの比を、切り出しパ
ラメータとして用いる。
の距離aと外接矩形231の左枠と外接矩形232の右
枠との距離bとの比p、 12)外接矩形231の左枠と外接矩形232の右枠と
の距離bと外接矩形平均幅MXとの比q、 13)外接矩形231の面積cと外接矩形232の面積
dとの積と外接矩形平均幅MXと外接矩形平均高さMY
との積の平方との比rを、切り出しパラメータとして用
いる。
(9)式と同様に表すことができる。次に、濁点処理を
図57のフローチャートを参照しながら、説明する。
るパターンを抽出する。すなわち、例えば、連結パター
ン抽出手段1により抽出された連結パターンが2つ隣接
して存在する場合で、且つそれらを統合した時のサイズ
と文字列の外接矩形の平均文字サイズとの比が所定のし
きい値以下、例えば、1/4以下である場合、濁点候補
となるパターンとして抽出する。
点候補となるパターンの左隣に隣接する外接矩形がある
かどうかを調べる。そして、濁点候補となるパターンの
左隣に隣接する外接矩形がない場合、濁点候補となるパ
ターンを濁点処理の対象から除外する。
補となるパターンの左隣に隣接する外接矩形があると判
断された場合、ステップS204に進む。また、上記ス
テップS201、S202とは別に、ステップS203
で、文字列の外接矩形の平均文字サイズを算出する。そ
して、上記ステップS202、S203の処理が終了し
た後、ステップS204で、図56に示されたパラメー
タp〜rの値を算出する。
文字列に対する文字の切り出しの信頼度を算出するため
の判別面を設定し、パラメータ数がnの場合、切り出し
が成功した群と切り出しが失敗した群との2群をn次元
の空間上に生成する。
法を示すフローチャートである。図58において、ま
ず、ステップS211で、事前に集めた学習データに対
して、着目する外接矩形とそれに隣接する外接矩形とを
統合して1文字になるかどうかを目視により判断する。
そして、着目する外接矩形とそれに隣接する外接矩形と
を統合して1文字になる場合、ステップS212に進
み、着目する外接矩形とそれに隣接する外接矩形とを統
合して1文字にならない場合、ステップS213に進
む。
とそれに隣接する外接矩形とを統合して1文字になる統
合成功の場合について、その着目する外接矩形とそれに
隣接する外接矩形におけるパラメータの値を記録する。
ここで、着目する外接矩形とそれに隣接する外接矩形に
おけるパラメータは、統計的処理の場合、図48のパラ
メータa〜gを用いることができ、非統計的処理の場
合、図54、56のパラメータp〜rを用いることがで
きる。
接矩形とそれに隣接する外接矩形とを統合して1文字に
ならない統合失敗の場合について、その着目する外接矩
形とそれに隣接する外接矩形におけるパラメータの値を
記録する。
における切り出しパラメータと非統計的処理における切
り出しパラメータの値を算出し、このパラメータの値に
よって定まる多次元空間上の点に対し、学習データによ
り得られている判別面からの距離を求め、これを切り出
しの信頼度として定量化する。
図59に示すように、切り出し成功と切り出し失敗との
2群を判別する判別面をH、判別面Hの単位法線ベクト
ルをnとし、あるパラメータの値がpのベクトル値をと
るとき、そのパラメータの値に対応する3次元空間内の
点pの判別面からの距離hは、 h=OP・n ・・・(10) と表される。ここで、OPは、3次元空間内の原点Oか
ら3次元空間内の点pに向けたベクトルである。
か負をとるかで、パラメータの値がどちらの群、すなわ
ち、切り出しが成功した方の群または切り出しが失敗し
た方の群のいづれの群に属するか、また、パラメータの
値が判別面Hからどの程度離れているかが分かる。
の学習データの全パラメータに対して、判別面Hからの
距離hに基づいて、切り出し成功のヒストグラム分布2
41と切り出し失敗のヒストグラム分布242をとる。
一般的に、このヒストグラム分布241、242は正規
分布になるので、ヒストグラム分布241、242を正
規分布で近似する。これらの正規分布は、通常、部分的
に重なる領域が生ずる。
切り出しパラメータを有する隣接パターンについての切
り出しの信頼度に加え、文字認識の信頼度を加味してそ
れらを統合するか否かを判定する。
を示すフローチャートである。図61において、まず、
ステップS221に示すように、複数のパラメータの値
によって定まる多次元空間上の点に対する判別面Hから
の距離hを、前記(10)式により算出する。
習データにより得られた複数のパラメータの値のヒスト
グラム分布を正規分布で近似する。すなわち、例えば、
図62に示すように、切り出し成功のヒストグラム分布
を正規分布251で近似し、切り出し失敗のヒストグラ
ム分布を正規分布252で近似する。
領域を算出する。例えば、図62に示すように、切り出
し成功の正規分布251と切り出し失敗の正規分布25
2とが重なる領域を2群の重なり領域254として算出
する。また、このとき、切り出し成功の正規分布251
の内、上記2群の重なり領域254以外の領域253を
切り出し成功領域と設定する。さらに、切り出し失敗の
正規分布252の内、上記2群の重なり領域254以外
の領域255を切り出し失敗領域と設定する。
知文字についての入力パラメータの値のヒストグラム分
布上での位置を判定する。次に、ステップS225に示
すように、未知文字についての入力パラメータの値のヒ
ストグラム分布上での位置を判定した結果、未知文字に
ついての入力パラメータの値が2群の重なり領域254
に含まれる場合、ステップS226に進む。そして、2
群の重なり領域254での未知文字についての入力パラ
メータの値の位置に基づいて、切り出し信頼度を算出す
る。
字についての入力パラメータの値が2群の重なり領域2
54に含まれないと判断された場合、ステップS226
に進み、未知文字についての入力パラメータの値が切り
出し成功領域253に含まれるかどうかを判断する。
タの値が切り出し成功領域253に含まれると判断され
た場合、ステップS228に進み、切り出し信頼度を
“1”とし、未知文字についての入力パラメータの値が
切り出し成功領域253に含まれないと判断された場
合、ステップS229に進み、切り出し信頼度を“0”
とする。
ての入力パラメータの値に対する判別面からの距離を算
出した結果、未知文字についての入力パラメータの値の
判別面からの距離が重なり領域254に含まれる場合、
未知文字についての入力パラメータの値の判別面からの
距離に基づいて、切り出し信頼度を算出する。また、未
知文字についての入力パラメータの値の判別面からの距
離が切り出し成功領域253に含まれる場合、その切り
出し信頼度を“1”とする。また、未知文字についての
入力パラメータの値の判別面からの距離が切り出し失敗
領域255に含まれる場合、その切り出し信頼度を
“0”に設定する。
例を示すフローチャートである。図63において、ま
ず、ステップS231に示すように、学習データから得
られた切り出し成功のヒストグラム分布と切り出し失敗
のヒストグラム分布のそれぞれについて、ヒストグラム
261の平均値mと分散値vとを算出する。
のヒストグラム分布と切り出し失敗のヒストグラム分布
について、正規分布曲線262とヒストグラム261と
の2乗誤差の総和dを算出する。
記の(11)式により算出する。 T=d/S ・・・(11) ここで、Sは正規分布曲線262の面積である。
262の中心から端までの距離Lを下記の(12)式に
より算出する。 L=k×(1+T)×v1/2 ・・・(12) ここで、kは比例定数である。また、v1/2 は、標準偏
差に等しい。
263の右端267から正規分布曲線264の左端26
6までの間の領域を、2群の重なり領域265として設
定する。
の処理により求めた切り出し信頼度に基づいて認識処理
を行うかどうかを決定する。この場合、例えば、切り出
し信頼度が高い切り出し文字の候補に対しては認識処理
を行わず、切り出し信頼度が低い切り出し文字の候補に
対してのみ認識処理を行うようにする。
て、それらに対する認識の信頼度だけでなく、切り出し
の信頼度も考慮して切り出し文字を決定する。このこと
により、部分的に見ると文字のように見えるが、文字列
全体から見ると間違っているような候補文字を、切り出
し文字から除外することができる。例えば、各隣接パタ
ーンまたは切り出し確定部の切り出し信頼度をαi 、認
識信頼度をβi 、重み係数をjとすると、全体の信頼度
Rは、 R=Σ(j・αi +βi ) ・・・(13) と表せる。
ら全体の信頼度Rが最も大きいものを、最終的な切り出
し文字として選択する。図64は、“グンマ”という文
字列から文字を1文字ずつ切り出す場合を示す図であ
る。ここで、“グンマ”という文字列の切り出しを行う
のに先立ち、学習データを用いて、統計的処理と非統計
的処理とに対する判別面とヒストグラム値の正規分布曲
線を、それぞれ、個別に求める。
しの成功又は失敗を判定するためのパラメータとして、
図52のパラメータc、e、fを用い、学習データによ
り得られた判別面の式は、 0.84x0+0.43x1+0.33x2−145.25=0・・(14) であるものとする。
成功を示すヒストグラム分布の平均値mは128.94
2、標準偏差は34.77となり、適合度Tは(11)
式より0.12となる。また、比例定数kを2とする
と、分布中心から端までの距離Lは(12)式より7
7.8となる。
失敗を示すヒストグラム分布の平均値mは71.12
9、標準偏差は36.26となり、適合度Tは(11)
式より0.35となる。また、比例定数kを2とする
と、分布中心から端までの距離Lは(10)式より9
2.2となる。
に示すように、イメージ入力により未知文字についての
入力パターンを読み込む。次に、ステップS242で、
ラベリングにより連結パターンを抽出し、抽出された各
連結パターンに対して図64に示すようにラベル番号
〜を付す。
テップS243の統計的処理及びステップS244の非
統計的処理に基づいて、切り出し信頼度の定量化を行
う。ステップS243の統計的処理では、互いに隣接す
る連結パターンを統合した場合の切り出し信頼度を、パ
ラメータc、e、fの値を有する3次元空間上の点に対
する判別面からの距離hに基づいて算出する。この切り
出し信頼度αは、例えば、 α=(h−w1 )/(w2 −w1 )×100 ・・・(15) で表すことができる。
番号のパターンとを統合した場合の切り出し信頼度は
80、ラベル番号のパターンとラベル番号のパター
ンとを統合した場合の切り出し信頼度は12、ラベル番
号のパターンとラベル番号のパターンとを統合した
場合の切り出し信頼度は28、ラベル番号のパターン
とラベル番号のパターンとを統合した場合の切り出し
信頼度は92、ラベル番号のパターンとラベル番号
のパターンとを統合した場合の切り出し信頼度は5とな
る。
は、濁点候補を有するパターン“グ”についての切り出
し信頼度を、図56のパラメータp〜rの値を有する3
次元空間上の点に対する判別面からの距離hに基づいて
算出する。
ル番号のパターン及びラベル番号のパターンからな
る切り出し確定部271の濁点パターンとを統合した場
合の切り出し信頼度は85となる。
ける切り出し信頼度の算出方法を図65に示す。まず、
ステップS251で、濁点候補となるパターン272を
抽出する。例えば、連結パターンが2つ隣接して存在す
る場合で、且つ、それらを統合した時のサイズと文字列
の外接矩形の平均文字サイズとの比が所定のしきい値以
下である場合、濁点候補となるパターンとする。
るパターン272の左隣に隣接する外接矩形281があ
るかどうかを調べ、この場合、濁点候補となるパターン
272の左隣に隣接する外接矩形281があると判断さ
れた結果、ステップS253に進み、図56のパラメー
タp〜rの値を算出する。
距離 b:外接矩形281の左枠と外接矩形272の右枠との
距離 c:外接矩形281の面積 d:外接矩形272の面積 MX:外接矩形平均幅 MY:外接矩形平均高さ である 次に、ステップS254に示すように、パラメータp〜
rの値を有する3次元空間上の点に対する判別面293
からの距離を算出する。
空間上の点に対する判別面293からの距離を算出する
ために、学習パターンに基づいて判別面293を算出し
ておく。この判別面293は、例えば、学習パターンの
文字列の切り出しの成功を示すヒストグラム分布292
及び失敗を示すヒストグラム分布291に基づいて、
(3)式により求めることができ、濁点抽出のパラメー
タp〜rを用いた場合の判別面293の式は、例えば、 0.17x0+0.75x1+0.64x2+30.4=0・・(19) で表され、3次元空間内の平面の方程式となる。
(16)〜(18)の値を(19)式に代入して、 h=0.17×0.1−0.75×1.3+0.64×0.3+30.4 =29.6 ・・・(20) となる。
ストグラム分布292の平均値mは38、標準偏差は2
5となり、適合度Tは(11)式より0.2となり、学
習データの切り出し失敗を示すヒストグラム分布291
の平均値mは−34、標準偏差は28となり、適合度T
は(11)式より0.3となる。
ストグラム分布292の左端w1 は、比例定数kを2と
すると、(12)式より、 w1 =38−2×(1+0.2)×25=−22 ・・・(21) となる。
ストグラム分布291の右端w2 は、比例定数kを2と
すると、(12)式より、 w2 =−34+2×(1+0.3)×28=38.8 ・・・(22) となる。
面からの距離が−22〜38.8の間の領域となる。次
に、ステップS255で、切り出し信頼度αを求める。
この切り出し信頼度αは、(20)〜(22)の値を
(15)式に代入して、 α=(29.6−(−22))/(38.8−(−22))×100 =85 ・・・(23) となる。
とが統合されて切り出し確定部271となる。次に、図
64のステップS246で、統計的処理と非統計的処理
の信頼度を合成する。このとき、切り出し確定部があれ
ば、それを優先する。従って、切り出し確定部271の
信頼度が優先して合成される。
出し確定部271のパターンとを統合した場合の切り出
し信頼度は85、切り出し確定部271のパターンとラ
ベル番号のパターンとを統合した場合の切り出し信頼
度は30、ラベル番号のパターンとラベル番号のパ
ターンとを統合した場合の切り出し信頼度は92、ラベ
ル番号のパターンとラベル番号のパターンとを統合
した場合の切り出し信頼度は5となる。
しきい値(例えば、90)より大きいか又は、切り出し
信頼度が所定のしきい値(例えば、70)より大きく且
つ、その隣の切り出しパターンの切り出し信頼度との比
が所定の値(例えば、5)より大きい場合、パターンの
統合を行う。
(例えば、8)より小さい場合、パターンの統合を行わ
ない。例えば、ラベル番号のパターンと切り出し確定
部271のパターンとを統合した場合の切り出し信頼度
は85で、その隣のラベル番号のパターンに対する切
り出し信頼度の比は、85/30=2.8であるので、
ラベル番号のパターンと切り出し確定部271のパタ
ーンとを統合しない。また、切り出し確定部271のパ
ターンとラベル番号のパターンとを統合した場合の切
り出し信頼度は30であり、切り出し確定部271のパ
ターンとラベル番号のパターンとを統合しない。
号のパターンとを統合した場合の切り出し信頼度は9
2であるので、ラベル番号のパターンとラベル番号
のパターンとを統合する。また、ラベル番号のパター
ンとラベル番号のパターンとを統合した場合の切り出
し信頼度は5であり、ラベル番号のパターンとラベル
番号のパターンとを統合しない。
ベル番号のパターンとを統合した切り出し確定部27
3に対応する外接矩形275、ラベル番号のパターン
に対応する外接矩形276が生成される。
73のパターンと切り出し確定部271のパターンとを
統合した場合の切り出し信頼度を求める。この切り出し
信頼度は、図64の例では、60となる。
り出し信頼度によるパターンの統合が終了した時点で、
切り出し候補1及び切り出し候補2を抽出する。そし
て、切り出し候補1及び切り出し候補2のそれぞれの文
字に対して認識処理を行い、切り出し候補1及び切り出
し候補2における文字内の切り出し信頼度αと認識信頼
度βとをそれぞれの文字について求め、切り出し信頼度
αと認識信頼度βとの総和をとったものを全体の信頼度
Rとする。
275、276、278を切り出した場合、外接矩形2
78内のパターンに対して文字認識を行った場合の認識
信頼度βは80となり、外接矩形275内のパターンに
対して文字認識を行った場合の認識信頼度βは90とな
り、外接矩形276内のパターンに対して文字認識を行
った場合の認識信頼度βは85となる。
確定部271のパターンとを統合した場合の切り出し信
頼度αは85であるので、全体の信頼度Rは、重み係数
jを1とすると、(13)式により、345となる。
76、281、282を切り出した場合、外接矩形28
1内のパターンに対して文字認識を行った場合の認識信
頼度βは83となり、外接矩形282内のパターンに対
して文字認識を行った場合の認識信頼度βは55とな
り、外接矩形276内のパターンに対して文字認識を行
った場合の認識信頼度βは85となる。
切り出し確定部273のパターンとを統合した場合の切
り出し信頼度αは60であり、全体の信頼度Rは283
となる。
1又は切り出し候補2のうち、全体の信頼度Rが大きい
方の切り出し候補1を切り出し成功の文字候補として選
択する。この結果、“グンマ”という文字列から、
“グ”、“ン”、“マ”の各文字を1文字ずつ正しく切
り出すことができる。
しながら文字の認識処理を行う方法については、例え
ば、特願平7−234982号の明細書及び図面に記載
されている。
について具体的に説明する。図66は、かすれ文字認識
部19の構成の一実施例を示すブロック図である。図6
6において、特徴抽出部301は、かすれ文字パターン
から文字の特徴を抽出し、この抽出した特徴を特徴ベク
トルにより表す。一方、かすれ辞書302には、かすれ
文字についての各カテゴリの特徴ベクトルが格納されて
いる。そして、照合部303は、特徴抽出部301によ
り抽出した文字パターンの特徴ベクトルを、かすれ辞書
302に格納されている各カテゴリの特徴ベクトルと照
合し、特徴空間上での特徴ベクトル間の距離Dij(iは
未知文字の特徴ベクトル、jはかすれ辞書302のカテ
ゴリの特徴ベクトル)を算出する。その結果、特徴ベク
トル間の距離Dijを最小とするカテゴリjを未知文字i
として認識する。
距離Dijは、例えば、ユークリッド距離Σ(i−
j)2 、シティブロック距離Σ|i−j|、又は判別関
数などの識別関数を用いて算出する。
Dij1 、第2位のカテゴリとの距離をDij 2 とすると、
第1位のカテゴリj1、第2位のカテゴリj2、カテゴ
リ間の距離(Dij2 −Dij1 )及び信頼度に関するテー
ブル1を予め作成しておく。また、第1位のカテゴリと
の距離をDij1 、第1位のカテゴリj1及び信頼度に関
するテーブル2も予め作成しておく。そして、テーブル
1とテーブル2とからそれぞれ得られる信頼度の小さい
方を中間処理結果テーブルに格納する。
字認識部19のかすれ辞書302の代わりに、つぶれ文
字についての各カテゴリの特徴ベクトルを格納したつぶ
れ辞書を用いることを除いて、かすれ文字認識部19と
同様の構成とすることができる。
について説明する。この消し線認識部26は、図4のス
テップS4の訂正解析により抽出された訂正文字の候補
に対し、例えば、横方向の画素数の和をとったヒストグ
ラムを作成し、このヒストグラム値が所定の値を越えた
領域に横消し線が存在するものとして、この領域に存在
している横線を除去する。
れた部分を補完し、この補完後のパターンについて辞書
照合を行うことにより、文字認識を行う。この結果、文
字と認識されたものについては、訂正文字の候補を消し
線付き文字とみなし、リジェクトされたものについて
は、訂正文字の候補を通常文字とみなす。
として、横二重線により訂正された状態の「5」が入力
され、この横二重線を除去して補完したパターンが
「5」のカテゴリとして認識された結果、入力されたパ
ターンは訂正文字とみなされる。また、訂正文字の候補
として、「5」が入力され、この「5」の横線を除去し
たパターンがリジェクトされた結果、入力されたパター
ンは訂正文字でないとみなされる。
について説明する。このくせ字解析部23は、同一のカ
テゴリに属すると認識された手書き文字を所定のクラス
タ数にクラスタリングし、異なるカテゴリに属するクラ
スタ間の距離の小さいものについては、要素数が少ない
方のクラスタの文字カテゴリを要素数が多い方のクラス
タの文字カテゴリに修正することにより、別のカテゴリ
に属するものと誤って認識された手書き文字を正読化す
る。
と判定された手書き文字の特徴ベクトルによるクラスタ
リング処理を示す図である。図68には、認識辞書に格
納されている「4」の文字カテゴリの特徴ベクトルとの
距離が近いため、「4」の認識結果カテゴリに属すると
判定された手書き文字が示されている。ここで、この認
識処理では、「2」と手書きされた文字が「4」の認識
結果カテゴリに属すると誤って認識されている。
は、「4」の文字カテゴリに属すると判定された手書き
文字をそれぞれ1つのクラスタとみなし、2回目のクラ
スタリング処理では、クラスタとみなされた手書き文字
の間での特徴ベクトルの距離を算出し、特徴ベクトルの
距離が最も近いものを1つのクラスタに統合する。この
結果、図68の例では、クラスタ数が11から1つだけ
減少して10になっている。
も、クラスタ間での特徴ベクトルの距離を算出し、特徴
ベクトルの距離が最も近いものを統合することにより、
クラスタ数を減少させ、11回目のクラスタリング処理
でクラスタ数は1となる。
素数が1のクラスタ、すなわち、特徴ベクトル同士の距
離の比較には、例えば、シティブロック距離を用いる。
要素数が複数のクラスタ同士の場合、例えば、重心法を
用いる。この重心法は、要素数がM個のクラスタのi番
目(i=1、2、3、・・・、M)の要素の特徴ベクト
ルxi をxi =(xi1、xi2、xi3、・・・、xiN)と
表した時、そのクラスタを代表する代表ベクトルx
m を、そのクラスタの要素の特徴ベクトルxi の平均で
表し、
ついてのシティブロック距離を算出することにより、要
素数が複数のクラスタ同士の距離の比較を行うものであ
る。
リング処理を続けると、「4」の文字カテゴリに属する
と誤って認識された「2」の手書き文字も、「4」の文
字カテゴリに属すると正しく認識された「4」の手書き
文字と同一のクラスタに属するようになるので、クラス
タリング処理を途中で打ち切るクラスタリング打ち切り
条件を設定する。
は、例えば、(1)最終クラスタ数が所定の数(例え
ば、3)になった時、(2)クラスタ統合時のクラスタ
間距離が所定のしきい値以上になった時、(3)クラス
タ統合時のクラスタ間距離の増加率が所定のしきい値以
上になった時、のいずれかの条件を用いることができ
る。
ーチャートである。図69において、まず、ステップS
261に示すように、ある文字カテゴリに属すると認識
された手書き文字の特徴ベクトルだけを抽出し、抽出さ
れたそれぞれの手書き文字の特徴ベクトルを1つのクラ
スタとみなす。
ラスタリング処理を途中で打ち切るクラスタリング打ち
切り条件を設定する。次に、ステップS263に示すよ
うに、ある文字カテゴリについての全てのクラスタの中
で、最も距離の近い2つのクラスタを選択する。
テップS262で設定したクラスタリング打ち切り条件
を満たしているかどうかを判断し、クラスタリング打ち
切り条件を満たしていない場合、ステップ265に進ん
で、ステップS263で選択した2つのクラスタ同士を
統合し、ステップS263に戻り、クラスタを統合する
処理を繰り返す。
した結果、ステップS264でクラスタリング打ち切り
条件を満たすと判断された場合、ステップ266に進ん
で、全ての文字カテゴリに対してクラスタリング処理を
行ったかどうかを判断し、全ての文字カテゴリに対して
クラスタリング処理を行っていない場合、ステップ26
1に戻り、クラスタリング処理を行っていない文字カテ
ゴリについてのクラスタリング処理を行う。
リに対してクラスタリング処理を行ったと判断された場
合、ステップ267に進んで、クラスタリング結果をメ
モリに格納する。
クラスタリング結果に基づいて、別のカテゴリに属する
ものと誤って認識された手書き文字を正読化する。図7
0は、「2」と手書きされた文字が「4」の文字カテゴ
リに属すると誤って認識された認識結果を、正しい文字
カテゴリ「2」に正読化する処理を示す図である。
属すると判定された手書き文字及び「4」の認識結果カ
テゴリに属すると判定された手書き文字が示されてい
る。ここで、「3」と手書きされた文字が「2」の認識
結果カテゴリに属すると誤って認識され、「2」と手書
きされた文字が「4」の認識結果カテゴリに属すると誤
って認識され、「4」と手書きされた文字がいずれの認
識結果カテゴリにも属さないとしてリジェクトされてい
る。
一カテゴリ内における最終クラスタ数が3になった時に
設定して、クラスタリング処理を行うことにより、
「2」の認識結果カテゴリについてはクラスタa、b、
cが生成され、「4」の認識結果カテゴリについてはク
ラスタd、e、fが生成され、リジェクトされた3つの
「4」の手書き文字についてはそれぞれクラスタg、
h、iが生成されている。
クラスタa、b、cと「4」の認識結果カテゴリに属す
るクラスタd、e、fとの中から、文字数の少ないクラ
スタa、dを誤読候補クラスタとして抽出する。
ラスタb、c、d、e、fのそれぞれとの距離及び誤読
候補クラスタdとそれ以外のクラスタa、b、c、e、
fのそれぞれとの距離を算出する。そして、誤読候補ク
ラスタaと最も距離が近いクラスタとしてクラスタbを
抽出し、誤読候補クラスタaとクラスタbとの間の距離
が所定の値以下であるかどうかを判定し、誤読候補クラ
スタaとクラスタbとの間の距離は所定の値以下でない
ので、誤読候補クラスタaはリジェクト化される。
すると誤って認識された「3」と手書きされた文字が、
「2」の認識結果カテゴリから除外される。また、誤読
候補クラスタdと最も距離が近いクラスタとしてクラス
タbを抽出し、誤読候補クラスタdとクラスタbとの間
の距離が所定の値以下であるかどうかを判定し、誤読候
補クラスタdとクラスタbとの間の距離は所定の値以下
なので、誤読候補クラスタdはクラスタbと統合されク
ラスタjが生成されるとともに、クラスタjは、要素数
が多い方のクラスタbの属していた「2」の認識結果カ
テゴリに属すると判定されて、「4」と誤読されたため
に誤読候補クラスタdに属するとされた「2」の手書き
文字が正読化される。
さないとしてリジェクトされたクラスタg、h、iとそ
れ以外のクラスタa〜fとの距離を算出する。そして、
クラスタgと最も距離が近いクラスタとしてクラスタe
を抽出し、クラスタgとクラスタeとの間の距離が所定
の値以下であるかどうかを判定し、クラスタgとクラス
タeとの間の距離は所定の値以下なので、クラスタgは
クラスタeと統合される。
タとしてクラスタeを抽出し、クラスタhとクラスタe
との間の距離が所定の値以下であるかどうかを判定し、
クラスタhとクラスタeとの間の距離は所定の値以下な
ので、クラスタhはクラスタeと統合される。クラスタ
g及びクラスタhがクラスタeに統合された結果、クラ
スタkが生成されるとともに、クラスタkは、要素数が
多い方のクラスタeの属していた「4」の認識結果カテ
ゴリに属すると判定されて、認識不能としてリジェクト
された「4」の手書き文字が正読化される。
タとしてクラスタeを抽出し、クラスタiとクラスタe
との間の距離が所定の値以下であるかどうかを判定し、
クラスタiとクラスタeとの間の距離は所定の値以下で
ないので、クラスタiはクラスタeと統合しないように
する。
を示すフローチャートである。図71において、まず、
ステップS271に示すように、図69のクラスタリン
グ処理により得られたクラスタリング結果についてのデ
ータをメモリから読み出す。
69のクラスタリング処理により得られた全てのカテゴ
リの全てのクラスタについて、各クラスタ間での距離を
算出し、各クラスタ間の距離を比較する。
ラスタ間の距離がしきい値以下のクラスタが存在するか
どうかを判断し、クラスタ間の距離がしきい値以下のク
ラスタが存在する場合、ステップS274に進んで、そ
れらのクラスタ同士を統合し、クラスタ間の距離がしき
い値以下のクラスタが存在しない場合、それらのクラス
タをリジェクトする。
離のしきい値として、例えば、2つのクラスタのうち、
要素数が多い方のクラスタ内のベクトル間距離の定数倍
を用いる。すなわち、要素数がM個のクラスタAと要素
数がN(M>N)個のクラスタBとを統合する場合、ク
ラスタAの代表ベクトルをxam、クラスタBの代表ベ
クトルをxbm、クラスタA内の特徴ベクトルをxai
(i=1、2、・・・、M)とすると、クラスタA内の
ベクトル間距離dt hは、
する条件は、例えば、1.5に定数を設定すると、 |xam−xbm|<1.5dt h となる。
テップS274で統合された全てのクラスタについて、
クラスタ内の文字カテゴリの判定を行う。次に、ステッ
プS276に示すように、統合されたクラスタ同士の文
字カテゴリが異なるかどうかを判断し、クラスタ同士の
文字カテゴリが異なる場合、ステップS277に進み、
要素数が少ない方のクラスタの文字カテゴリを要素数が
多い方のクラスタの文字カテゴリに修正してから、ステ
ップS278に進む。一方、クラスタ同士の文字カテゴ
リが一致する場合、ステップS277をスキップしてス
テップS278に進む。
ラスタ内の文字について、その文字カテゴリを出力す
る。次に、本発明の一実施例によるパターン認識装置の
動作について、図72の帳票を処理する場合を例にとっ
て、より具体的に説明する。
ン認識装置に入力される帳票の例を示す図である。図7
2の帳票には、枠番号1のフリーピッチ枠、枠番号2、
3、4の一文字枠、枠番号5のブロック枠、枠番号6の
不規則な表が設けられている。また、枠番号1のフリー
ピッチ枠には、枠に接触した状態で且つ横二重線により
訂正されている「5」、枠に接触した状態の「3」、
「2」、枠に接触した状態で且つかすれた状態の
「7」、くせ字の「4」、「6」、枠からはみ出した状
態で且つくせ字の「4」が記入されている。
れ、枠番号3の一文字枠には「3」が記入され、枠番号
4の一文字枠には枠からはみ出した状態で且つ横二重線
により訂正されている「8」が記入されている。枠番号
5のブロック枠のうち、枠番号5−1の枠には横二重線
により訂正されているくせ字の「6」が記入され、枠番
号5−2の枠には枠に接触した状態で「2」が記入さ
れ、枠番号5−3の枠にはくせ字の「4」が記入されて
いる。
1−1の枠には、枠からはみ出した状態の「3」、
「2」、「1」が記入され、枠番号6−1−2の枠に
は、「6」、「3」、「8」が記入され、枠番号6−1
−3の枠、枠番号6−1−4−1の枠、枠番号6−1−
4−2の枠、枠番号6−1−4−3の枠、枠番号6−2
−1の枠、枠番号6−2−2の枠及び枠番号6−2−3
の枠はそれぞれ空欄となっており、枠番号6の不規則な
表全体が×印により訂正されている。
帳票に対し、図5〜図8の処理を行うことにより、入力
画像の状態を図72の帳票から抽出する。例えば、図6
のレイアウト解析により、図72の帳票から、枠番号1
のフリーピッチ枠、枠番号2、3、4の一文字枠、枠番
号5のブロック枠及び枠番号6の不規則な表を抽出する
とともに、枠番号1のフリーピッチ枠からは、8つのパ
ターンが文字の候補として抽出され、枠番号2、3、4
の一文字枠からは、それぞれ1つのパターンが文字の候
補として抽出され、枠番号5のブロック枠からは、3つ
のパターンが文字の候補として抽出され、 枠番号6−
1−1の枠からは、3つのパターンが文字の候補として
抽出され、枠番号6−1−2の枠からは、3つのパター
ンが文字の候補として抽出され、枠番号6−1−3の
枠、枠番号6−1−4−1の枠、枠番号6−1−4−2
の枠、枠番号6−1−4−3の枠、枠番号6−2−1の
枠、枠番号6−2−2の枠及び枠番号6−2−3の枠か
らは、文字の候補は抽出されない。
るには、例えば、図14及び図15に示したテキスト抽
出方法を使用し、図72の帳票から罫線を抽出するに
は、例えば、図16〜図22に示した罫線抽出方法を使
用し、図72の帳票から枠や表を抽出するには、例え
ば、図23及び図24に示した枠抽出方法を使用する。
出された第1番目のパターン、第2番目のパターン、第
5番目のパターン、第8番目のパターンは、枠接触文字
の候補とされる。また、枠番号4の一文字枠から抽出さ
れたパターン、枠番号5−2の枠から抽出されたパター
ン、枠番号6−1−1の枠から抽出された第1番目のパ
ターンも、枠接触文字の候補とされる。
補を抽出するには、例えば、図27及び図28に示した
枠接触文字抽出方法を使用する。また、図7の品質解析
により、図72の帳票から、かすれ状態やつぶれ状態や
高品質文字などを検出する。この例では、画像の品質は
正常で、かすれ状態やつぶれ状態や高品質文字などは検
出されない。
票から訂正文字候補を抽出する。この例では、枠番号1
のフリーピッチ枠から抽出された第1番目のパターン、
枠番号2、4の一文字枠から抽出されたパターン、枠番
号5−1の枠から抽出されたパターン及び枠番号6の不
規則な表から抽出されたパターンは、訂正文字候補とさ
れる。
を抽出するには、例えば、図30に示した特徴量抽出方
法を使用する。次に、環境認識系11は、入力画像から
抽出した文字の候補ごとに、図5〜図8の処理により帳
票から抽出した状態を記入した中間処理結果テーブルを
作成する。
ら抽出した状態を記入した中間処理結果テーブルを示す
図である。図73において、枠番号1の欄には、「枠種
類」として「フリーピッチ」、「文字数」として「8」
が記入され、枠番号1の第1番目のパターンの欄には、
「枠接触有無」として「有」、「消し線」として「有
2」、「品質」として「正常」が記入され、枠番号1の
第2番目のパターンの欄には、「枠接触有無」として
「有」、「消し線」として「無」、「品質」として「正
常」が記入され、枠番号1の第8番目のパターンの欄に
は、「枠接触有無」として「有」、「消し線」として
「無」、「品質」として「正常」が記入されている。
文字に対して消し線候補が存在していることを示し、
「消し線」の欄の「有2」は一文字に対して消し線候補
が存在していることを示している。
文字」、「枠接触有無」として「無」、「消し線」とし
て「有2」、「品質」として「正常」、「文字数」とし
て「1」が記入され、 枠番号3の欄には、「枠種類」
として「一文字」、「枠接触有無」として「無」、「消
し線」として「無」、「品質」として「正常」、「文字
数」として「1」が記入され、枠番号4の欄には、「枠
種類」として「一文字」、「枠接触有無」として
「有」、「消し線」として「有2」、「品質」として
「正常」、「文字数」として「1」が記入されている。
しご」、「文字数」として「3」が記入され、枠番号5
−1の欄には、「枠接触有無」として「無」、「消し
線」として「有2」、「品質」として「正常」、「文字
数」として「1」が記入され、枠番号5−2の欄には、
「枠接触有無」として「有」、「消し線」として
「無」、「品質」として「正常」、「文字数」として
「1」が記入され、枠番号5−3の欄には、「枠接触有
無」として「無」、「消し線」として「無」、「品質」
として「正常」、「文字数」として「1」が記入されて
いる。
「表」が記入され、枠番号6−1−1の欄には、「枠種
類」として「フリーピッチ」、「枠接触有無」として
「有」、「消し線」として「有1」、「品質」として
「正常」が記入され、枠番号6−2−2の欄には、「枠
種類」として「フリーピッチ」、「枠接触有無」として
「無」、「消し線」として「有1」、「品質」として
「正常」が記入されている。
理により帳票から抽出した状態に基づいて、図9の処理
を行う。すなわち、図73の中間処理結果テーブルに記
入された入力画像の状態に基づいて、図3の文字認識部
12の基本文字認識部17、文字列認識部15、接触文
字認識部13、かすれ文字認識部19、つぶれ文字認識
部21、又は非文字認識部25の消し線認識部26及び
雑音認識部28のいずれの処理を呼び出すかを処理順序
制御ルールを参照しながら決定し、決定した処理を図7
3の中間処理結果テーブルの「処理呼出し」の欄に記入
する。そして、図73の中間処理結果テーブルの「処理
呼出し」の欄に記入された処理をどのような順序で実行
するかを、処理順序テーブルを参照しながら決定し、決
定した順序を図73の中間処理結果テーブルの「処理順
序」の欄に記入する。
1)もし、ある処理対象に対し、中間処理結果テーブル
の状態を示す欄が「有」で、その状態に対応する処理が
実行されていないならば、その状態に対応する処理を中
間処理結果テーブルの「処理呼出し」の欄に記入する、
(A2)もし、ある処理対象に対し、中間処理結果テー
ブルの状態を示す全ての欄が「無」、または「正常」
で、基本文字認識部17の処理が実行されていないなら
ば、中間処理結果テーブルの「処理呼出し」の欄に「基
本」と記入する、(A3)もし、ある処理対象に対し、
中間処理結果テーブルに記入された状態に対応する処理
が複数個存在しているならば、複数個の処理の順序を決
定している処理順序テーブルをアクセスして「処理呼出
し」の欄の順序を並び替える、(A4)もし、ある処理
対象に対し、中間処理結果テーブルに記入された状態に
対応する処理が終了したならば、終了した処理を中間処
理結果テーブルの「処理完了」の欄に記入するととも
に、次に行うべき指示や処理の中断や終了を示す指示を
中間処理結果テーブルの「処理指示」の欄に記入し、そ
れらの情報に基づいて、中間処理結果テーブルの「処理
呼出し」の欄の順序を並び替える、などがある。
図である。図74において、処理順序テーブルには、例
えば、(B1)ある処理対象に対し、中間処理結果テー
ブルの「処理呼出し」の欄に1つの処理しか記入されて
いない場合は、中間処理結果テーブルの「処理順序」の
欄にその処理を記入する、(B2)ある処理対象に対
し、中間処理結果テーブルの「処理呼出し」の欄に「黒
枠/フリーピッチ」と記入された場合は、中間処理結果
テーブルの「処理順序」の欄に「黒枠→フリーピッチ」
と記入する、(B3)ある処理対象に対し、中間処理結
果テーブルの「処理呼出し」の欄に「消し線(有2)/
黒枠」と記入された場合は、「黒枠→一文字消し線」と
記入する、(B4)ある処理対象に対し、中間処理結果
テーブルの「処理呼出し」の欄に「黒枠/フリーピッチ
/消し線(有2)」と記入された場合は、中間処理結果
テーブルの「処理順序」の欄に「黒枠→一文字消し線→
フリーピッチ」と記入する、(B5)ある処理対象に対
し、中間処理結果テーブルの「処理呼出し」の欄に「黒
枠/フリーピッチ/消し線(有1)」と記入された場合
は、中間処理結果テーブルの「処理順序」の欄に複数文
字の「消し線→黒枠→フリーピッチ」と記入する、(B
6)ある処理対象に対し、中間処理結果テーブルの「処
理呼出し」の欄に「フリーピッチ/消し線(有1)」と
記入された場合は、中間処理結果テーブルの「処理順
序」の欄に「複数文字の消し線→フリーピッチ」と記入
する、(B7)ある処理対象に対し、中間処理結果テー
ブルの「処理呼出し」の欄に「処理A、B、C」と記入
され、中間処理結果テーブルの「処理順序」の欄に「処
理B→処理A→処理C」と記入されている場合で、中間
処理結果テーブルの「処理完了」の欄に「処理B」と記
入された場合、中間処理結果テーブルの「処理順序」の
欄を「処理A→処理C」に更新する、(B8)ある処理
対象に対し、中間処理結果テーブルの「処理呼出し」の
欄に「処理A、B、C」と記入され、中間処理結果テー
ブルの「処理順序」の欄に「処理B→処理A→処理C」
と記入されている場合で、中間処理結果テーブルの「処
理完了」の欄に「処理B」と記入され、中間処理結果テ
ーブルの「処理指示」の欄に「処理Cにスキップ」と記
入された場合、中間処理結果テーブルの「処理順序」の
欄を「処理C」に更新する、(B9)ある処理対象に対
し、中間処理結果テーブルの「処理呼出し」の欄に「処
理A、B、C」と記入され、中間処理結果テーブルの
「処理順序」の欄に「処理B→処理A→処理C」と記入
されている場合で、中間処理結果テーブルの「処理完
了」の欄に「処理B」と記入され、中間処理結果テーブ
ルの「処理指示」の欄に「処理Cと処理Aとの順序逆
転」と記入された場合、中間処理結果テーブルの「処理
順序」の欄を「処理C→処理A」に更新する、(B1
0)ある処理対象に対し、中間処理結果テーブルの「処
理呼出し」の欄に「処理B、A」と記入され、中間処理
結果テーブルの「処理完了」の欄に「処理A」と記入さ
れ、中間処理結果テーブルの「処理指示」の欄に「終
了」と記入された場合、中間処理結果テーブルの「処理
順序」の欄を「終了」とする、などの手順が格納されて
いる。
に記入された入力画像の状態に基づいて呼び出す処理を
「処理呼出し」の欄に記入するとともに、「処理呼出
し」の欄に記入された処理を実行する順序を「処理順
序」の欄に記入した例を示す図である。
種類」として「フリーピッチ」が記入され、枠番号1の
第1番目のパターンの欄には、「枠接触有無」として
「有」、「消し線」として「有2」が記入されているの
で、処理順序制御ルールの(A1)に従って「処理呼び
出し」の欄に「黒枠/フリーピッチ/消し線(有2)」
と記入するとともに、処理順序制御ルールの(A3)に
従って処理順序テーブルの(B4)を参照し、「処理順
序」の欄に「黒枠→一文字消し線→フリーピッチ」と記
入する。
「枠接触有無」として「有」、「消し線」として
「無」、「品質」として「正常」が記入されているの
で、処理順序制御ルールの(A1)に従って「処理呼び
出し」の欄に「黒枠/フリーピッチ」と記入するととも
に、処理順序制御ルールの(A3)に従って処理順序テ
ーブルの(B2)を参照し、「処理順序」の欄に「黒枠
→フリーピッチ」と記入する。
「枠接触有無」として「有」、「消し線」として
「無」、「品質」として「正常」が記入されているの
で、処理順序制御ルールの(A1)に従って「処理呼び
出し」の欄に「黒枠/フリーピッチ」と記入するととも
に、処理順序制御ルールの(A3)に従って処理順序テ
ーブルの(B2)を参照し、「処理順序」の欄に「黒枠
→フリーピッチ」と記入する。
文字」、「枠接触有無」として「無」、「消し線」とし
て「有2」、「品質」として「正常」が記入されている
ので、処理順序制御ルールの(A1)に従って「処理呼
び出し」の欄に「消し線(有2)」と記入するととも
に、処理順序制御ルールの(A1)に従って「処理順
序」の欄に「一文字消し線」と記入する。
文字」、「枠接触有無」として「無」、「消し線」とし
て「無」、「品質」として「正常」が記入されているの
で、処理順序制御ルールの(A2)に従って「処理呼び
出し」の欄に「基本」と記入するとともに、処理順序制
御ルールの(A1)に従って「処理順序」の欄に「基
本」と記入する。
文字」、「枠接触有無」として「有」、「消し線」とし
て「有2」、「品質」として「正常」が記入されている
ので、処理順序制御ルールの(A1)に従って「処理呼
び出し」の欄に「黒枠/消し線(有2)」と記入すると
ともに、処理順序制御ルールの(A3)に従って処理順
序テーブルの(B3)を参照し、「処理順序」の欄に
「黒枠→一文字消し線」と記入する。
しご」が記入され、枠番号5−1の欄には、「枠接触有
無」として「無」、「消し線」として「有2」、「品
質」として「正常」が記入されているので、処理順序制
御ルールの(A1)に従って「処理呼び出し」の欄に
「消し線(有2)」と記入するとともに、処理順序制御
ルールの(A1)に従って「処理順序」の欄に「一文字
消し線」と記入する。
して「有」、「消し線」として「無」、「品質」として
「正常」が記入されているので、処理順序制御ルールの
(A1)に従って「処理呼び出し」の欄に「黒枠」と記
入するとともに、処理順序制御ルールの(A1)に従っ
て「処理順序」の欄に「黒枠」と記入する。
して「無」、「消し線」として「無」、「品質」として
「正常」が記入されているので、処理順序制御ルールの
(A2)に従って「処理呼び出し」の欄に「基本」と記
入するとともに、処理順序制御ルールの(A1)に従っ
て「処理順序」の欄に「基本」と記入する。
「表」が記入され、枠番号6−1−1の欄には、「枠種
類」として「フリーピッチ」、「枠接触有無」として
「有」、「消し線」として「有1」、「品質」として
「正常」が記入されているので、処理順序制御ルールの
(A1)に従って「処理呼び出し」の欄に「黒枠/フリ
ーピッチ/消し線(有1)」と記入するとともに、処理
順序制御ルールの(A3)に従って処理順序テーブルの
(B5)を参照し、「処理順序」の欄に「複数文字の消
し線→黒枠→フリーピッチ」と記入する。
して「フリーピッチ」、「枠接触有無」として「無」、
「消し線」として「有1」、「品質」として「正常」が
記入されているので、処理順序制御ルールの(A1)に
従って「処理呼び出し」の欄に「フリーピッチ/消し線
(有1)」と記入するとともに、処理順序制御ルールの
(A3)に従って処理順序テーブルの(B6)を参照
し、「処理順序」の欄に複数文字の「複数文字の消し線
→フリーピッチ」と記入する。
序」の欄が記入された図75の中間処理結果テーブルに
基づいて、処理実行ルールを参照しながら最初の認識処
理を実行する。そして、処理が完了した認識処理を中間
処理結果テーブルの「処理完了」の欄に記入するととも
に、その時の認識処理で得られた信頼度を中間処理結果
テーブルの「信頼度」の欄に記入する。
序」の欄を、図74の処理順序テーブルの(B7)〜
(B9)に従って更新するとともに、処理実行ルールに
よって指示される次の処理がある場合は、中間処理結果
テーブルの「処理指示」の欄にその処理を記入する。
1)もし、ある処理対象に対し、中間処理結果テーブル
の「処理順序」の欄に記入されている処理が存在するな
らば、優先順位の最も高い処理を実行する。そして、実
行した処理が終了したならば、中間処理結果テーブルの
「処理完了」の欄に終了した処理を記入し、中間処理結
果テーブルの「処理順序」の欄からその処理を削除す
る。また、次に実行する処理を指示する場合は、中間処
理結果テーブルの「処理指示」の欄にその処理を記入す
る、(C2)もし、ある処理を実行した結果、あるパタ
ーンが非文字ではなく、文字であると判断され、その文
字コードが所定の値以上の信頼度で算出されたならば、
「個人筆記特性」による文字認識処理を呼び出すことを
中間処理結果テーブルの「処理指示」の欄に記入する、
(C3)もし、ある処理を実行した結果、あるパターン
が消し線であると判断され、その消し線が所定の値以上
の信頼度で算出されたならば、中間処理結果テーブルの
「処理指示」の欄に「終了」と記入し、中間処理結果テ
ーブルの「処理順序」の欄に記入されているそれ以降の
処理を打ち切って、処理を終了させる、(C4)もし、
中間処理結果テーブルの「処理順序」の欄の最初に「フ
リーピッチ」と記入され、同じ枠番号の他の処理対象に
ついての「フリーピッチ」より前の処理が未処理である
ならば、同じ枠番号の全て処理対象の「処理順序」の欄
の最初に「フリーピッチ」と記入された後、同じ枠番号
の全て処理対象の「フリーピッチ」の処理を同時に実行
する、(C5)もし、中間処理結果テーブルの「処理順
序」の欄に記入された全ての処理が終了し、全ての処理
対象について、中間処理結果テーブルの「処理指示」の
欄に「終了」と記入されるか、又は「個人筆記特性」と
記入されたならば、「処理指示」の欄に「個人筆記特
性」と記入されている処理対象に対して、「個人筆記特
性」による文字認識処理を呼び出してその処理を実行
し、「個人筆記特性」による文字認識処理が終了したな
らば、中間処理結果テーブルの「処理指示」の欄に「終
了」と記入する、(C6)もし、全ての処理対象につい
て、中間処理結果テーブルの「処理指示」の欄に終了と
記入されたならば、全ての処理を終了して認識結果を出
力する、などがある。
に基づいて、処理実行ルールを参照しながら認識処理を
実行し、その時の認識処理で得られた信頼度を中間処理
結果テーブルの「信頼度」の欄に記入し、処理実行ルー
ルに基づいて中間処理結果テーブルの「処理順序」の欄
を更新するとともに、中間処理結果テーブルの「処理指
示」の欄に記入を行った例を示す図である。
番号1の第1番目のパターンの「処理順序」の欄におい
て、最初に「黒枠」と指示されているので、処理実行ル
ールの(C1)に従って、図72の枠番号1のフリーピ
ッチ枠から抽出された第1番目のパターンに対し、「黒
枠」に対応する図3の接触文字認識部13の処理を実行
する。
39及び図40に示したように、枠を除去したパターン
に対して文字補完や再補完を行うことにより、枠接触文
字についての文字認識を行う。また、文字補完や再補完
を用いても十分な信頼度が得られないパターンについて
は、知識テーブル14を参照し、図42〜図51に示し
た学習文字に対する再文字認識を行うことにより、枠接
触文字についての文字認識を行う。
り、図72の枠番号1のフリーピッチ枠から抽出された
第1番目のパターンの認識信頼度が20%と算出された
結果、図72の枠番号1のフリーピッチ枠から抽出され
た第1番目のパターンは文字でないとみなされ、中間処
理結果テーブルの「文字コード」の欄に「リジェクト」
と記入されるとともに、中間処理結果テーブルの「信頼
度」の欄に「20%」と記入される。
了」の欄に「黒枠」と記入され、中間処理結果テーブル
の「処理順序」の欄が「一文字消し線→フリーピッチ」
に更新される。
番号1の第2番目のパターンの「処理順序」の欄におい
て、最初に「黒枠」と指示されているので、処理実行ル
ールの(C1)に従って、図72の枠番号1のフリーピ
ッチ枠から抽出された第2番目のパターンに対し、「黒
枠」に対応する図3の接触文字認識部13の処理を実行
し、枠接触文字についての文字認識を行う。
り、図72の枠番号1のフリーピッチ枠から抽出された
第2番目のパターンは、認識信頼度が60%の確率で文
字カテゴリ「3」であると認識され、中間処理結果テー
ブルの「文字コード」の欄に「3」と記入されるととも
に、中間処理結果テーブルの「信頼度」の欄に「60
%」と記入される。
了」の欄に「黒枠」と記入され、中間処理結果テーブル
の「処理順序」の欄が「フリーピッチ」に更新される。
次に、図75の中間処理結果テーブルの枠番号1の第8
番目のパターンの「処理順序」の欄において、最初に
「黒枠」と指示されているので、処理実行ルールの(C
1)に従って、図72の枠番号1のフリーピッチ枠から
抽出された第8番目のパターンに対し、「黒枠」に対応
する図3の接触文字認識部13の処理を実行し、枠接触
文字についての文字認識を行う。
り、図72の枠番号1のフリーピッチ枠から抽出された
第8番目のパターンは、認識信頼度が95%の確率で文
字カテゴリ「4」であると認識され、中間処理結果テー
ブルの「文字コード」の欄に「4」と記入されるととも
に、中間処理結果テーブルの「信頼度」の欄に「95
%」と記入される。
了」の欄に「黒枠」と記入され、中間処理結果テーブル
の「処理順序」の欄が「フリーピッチ」に更新される。
次に、図75の中間処理結果テーブルの枠番号2の「処
理順序」の欄において、「一文字消し線」と指示されて
いるので、処理実行ルールの(C1)に従って、図72
の枠番号2の一文字枠から抽出されたパターンに対し、
「一文字消し線」に対応する図3の消し線認識部26の
処理を実行する。
7に示したように、訂正文字の候補として抽出されたパ
ターンから所定値以上のヒストグラム値を有する横線を
除去し、この横線を除去したパターンが、文字と認識さ
れた場合は、除去した横線を消し線とみなすことによ
り、訂正文字の候補として抽出されたパターンを訂正文
字と認識し、所定値以上のヒストグラム値を有する横線
を除去したパターンが、リジェクトされた場合は、除去
した横線を消し線を文字に一部とみなして消し線でない
とすることにより、訂正文字の候補として抽出されたパ
ターンを通常文字と認識する。
り、図72の枠番号2の一文字枠から抽出されたパター
ンの認識信頼度が10%と算出された結果、図72の枠
番号2の一文字枠から抽出されたパターンは訂正文字で
ないとみなされ、中間処理結果テーブルの「信頼度」の
欄に「10%」と記入されるとともに、中間処理結果テ
ーブルの「処理指示」の欄に「基本」と記入される。
了」の欄に「消し線」と記入され、中間処理結果テーブ
ルの「処理順序」の欄に「基本」と記入される。次に、
図75の中間処理結果テーブルの枠番号3の「処理順
序」の欄において、「基本」と指示されているので、処
理実行ルールの(C1)に従って、図72の枠番号3の
一文字枠から抽出されたパターンに対し、「基本」に対
応する図3の基本文字認識部17の処理を実行する。
31に示したように、入力された未知文字の特徴を抽出
し、この未知文字の特徴を特徴ベクトルにより表し、基
本辞書に予め格納されている各カテゴリの特徴ベクトル
と照合することにより、特徴空間上での特徴ベクトル間
の距離を算出し、特徴ベクトル間の距離を最小とする文
字カテゴリを未知文字として認識する。
輪郭の凹凸の個数を算出することにより、未知文字の変
形度を算出する。そして、未知文字の変形度が大きく
て、認識率が低下する場合は、知識テーブル18を参照
し、図34〜図38に示した詳細識別法を用いて文字認
識を実行する。
り、図72の枠番号3の一文字枠から抽出されたパター
ンは、認識信頼度が95%の確率で文字カテゴリ「3」
である1認識され、中間処理結果テーブルの「文字コー
ド」の欄に「3」と記入されるとともに、中間処理結果
テーブルの「信頼度」の欄に「95%」と記入される。
了」の欄に「基本」と記入され、中間処理結果テーブル
の「処理順序」の欄は空欄となる。次に、図75の中間
処理結果テーブルの枠番号4の「処理順序」の欄におい
て、最初に「黒枠」と指示されているので、処理実行ル
ールの(C1)に従って、図72の枠番号4の一文字枠
から抽出されたパターンに対し、「黒枠」に対応する図
3の接触文字認識部13の処理を実行し、枠接触文字に
ついての文字認識を行う。
り、図72の枠番号4の一文字枠から抽出されたパター
ンの認識信頼度が15%と算出された結果、図72の枠
番号4の一文字枠から抽出されたパターンは文字でない
とみなされ、中間処理結果テーブルの「文字コード」の
欄に「リジェクト」と記入されるとともに、中間処理結
果テーブルの「信頼度」の欄に「15%」と記入され
る。
了」の欄に「黒枠」と記入され、中間処理結果テーブル
の「処理順序」の欄が「一文字消し線」に更新される。
次に、図75の中間処理結果テーブルの枠番号5−1の
「処理順序」の欄において、「一文字消し線」と指示さ
れているので、処理実行ルールの(C1)に従って、図
72の枠番号5−1の枠から抽出されたパターンに対
し、「一文字消し線」に対応する図3の消し線認識部2
6の処理を実行し、訂正文字の候補として抽出されたパ
ターンの認識処理を行う。
り、図72の枠番号5−1の枠から抽出されたパターン
の認識信頼度が95%と算出された結果、図72の枠番
号5−1の枠から抽出されたパターンは訂正文字とみな
され、中間処理結果テーブルの「信頼度」の欄に「95
%」と記入されるとともに、中間処理結果テーブルの
「処理完了」の欄に「消し線」と記入される。
示」の欄に「終了」と記入されるとともに、中間処理結
果テーブルの「処理順序」の欄は空欄となる。次に、図
75の中間処理結果テーブルの枠番号5−2の「処理順
序」の欄において、「黒枠」と指示されているので、処
理実行ルールの(C1)に従って、図72の枠番号5−
2の枠から抽出されたパターンに対し、「黒枠」に対応
する図3の接触文字認識部13の処理を実行し、枠接触
文字についての文字認識を行う。
出されたパターンは、下線部分が枠と接触し、図39の
文字補完や図40の再補完による処理では十分な信頼度
が得られないので、図50(b)に示したように、図4
5の知識テーブル167を参照することにより、誤読文
字対(2、7)を獲得し、図47に示した領域強調の手
法により、再文字認識を行う。
り、図72の枠番号5−2の枠から抽出されたパターン
は、認識信頼度が95%の確率で文字カテゴリ「2」で
あると認識され、中間処理結果テーブルの「文字コー
ド」の欄に「2」と記入されるとともに、中間処理結果
テーブルの「信頼度」の欄に「95%」と記入される。
了」の欄に「黒枠」と記入され、中間処理結果テーブル
の「処理順序」の欄は空欄となる。次に、図75の中間
処理結果テーブルの枠番号5−3の「処理順序」の欄に
おいて、「基本」と指示されているので、処理実行ルー
ルの(C1)に従って、図72の枠番号5−3の枠から
抽出されたパターンに対し、「基本」に対応する図3の
基本文字認識部17の処理を実行し、基本文字について
の文字認識処理を行う。
り、図72の枠番号5−3の枠から抽出されたパターン
は、認識信頼度が90%の確率で文字カテゴリ「6」で
あると認識され、中間処理結果テーブルの「文字コー
ド」の欄に「6」と記入されるとともに、中間処理結果
テーブルの「信頼度」の欄に「90%」と記入される。
了」の欄に「基本」と記入され、中間処理結果テーブル
の「処理順序」の欄は空欄となる。次に、図75の中間
処理結果テーブルの枠番号6−1−1の「処理順序」の
欄において、最初に「複数文字の消し線」と指示されて
いるので、処理実行ルールの(C1)に従って、「複数
文字の消し線」に対応する図3の消し線認識部26の処
理を実行し、消し線の認識処理を行う。
り、枠番号6の表から消し線が抽出され、その消し線の
認識信頼度が98%と算出された結果、図72の枠番号
6−1−1の枠から抽出されたパターンは訂正文字とみ
なされ、中間処理結果テーブルの「文字コード」の欄に
「消し線」と記入されるとともに、中間処理結果テーブ
ルの「信頼度」の欄に「98%」と記入され、中間処理
結果テーブルの「処理完了」の欄に「消し線」と記入さ
れる。
て、中間処理結果テーブルの「処理指示」の欄に「終
了」と記入されるとともに、中間処理結果テーブルの
「処理順序」の欄は空欄となる。
番号6−2−2の「処理順序」の欄において、最初に
「複数文字の消し線」と指示されているので、処理実行
ルールの(C1)に従って、「複数文字の消し線」に対
応する図3の消し線認識部26の処理を実行し、消し線
の認識処理を行う。
り、枠番号6の表から消し線が抽出され、その消し線の
認識信頼度が98%と算出された結果、図72の枠番号
6−2−2の枠から抽出されたパターンは訂正文字とみ
なされ、中間処理結果テーブルの「文字コード」の欄に
「消し線」と記入されるとともに、中間処理結果テーブ
ルの「信頼度」の欄に「98%」と記入され、中間処理
結果テーブルの「処理完了」の欄に「消し線」と記入さ
れる。
て、中間処理結果テーブルの「処理指示」の欄に「終
了」と記入されるとともに、中間処理結果テーブルの
「処理順序」の欄は空欄となる。
テーブルが生成される。ここで、図76の中間処理結果
テーブルの「処理順序」の欄には、次に呼び出す処理が
記入されているので、処理実行ルール(C1)に従って
処理を続行する。
に基づいて認識処理を続行し、その際に得られた結果を
示す図である。まず、図76の中間処理結果テーブルの
枠番号1の第1番目のパターンの「処理順序」の欄にお
いて、最初に「一文字消し線」と指示されているので、
処理実行ルールの(C1)に従って、図72の枠番号1
のフリーピッチ枠から抽出された第1番目のパターンに
対し、「一文字消し線」に対応する図3の消し線認識部
26の処理を実行し、訂正文字についての認識処理を行
う。
2の枠番号1のフリーピッチ枠から抽出された第1番目
のパターンの認識信頼度が96%と算出された結果、図
72の枠番号1のフリーピッチ枠から抽出された第1番
目のパターンは訂正文字とみなされ、中間処理結果テー
ブルの「文字コード」の欄に「消し線」と記入されると
ともに、中間処理結果テーブルの「信頼度」の欄に「9
6%」と記入され、中間処理結果テーブルの「処理完
了」の欄に「黒枠/消し線」と記入される。
示」の欄に「終了」と記入されるとともに、中間処理結
果テーブルの「処理順序」の欄は空欄となる。次に、図
75の中間処理結果テーブルの枠番号1の第2番目のパ
ターンの「処理順序」の欄において、「フリーピッチ」
と指示されているので、処理実行ルールの(C4)に従
って、図72の枠番号1のフリーピッチ枠から抽出され
た第2番目のパターンに対し、同じ枠番号1の他の全て
のパターンの「処理順序」の欄が「フリーピッチ」とな
るまで待機し、枠番号1の全てのパターンの「処理順
序」の欄が「フリーピッチ」となった時に、枠番号1の
フリーピッチ枠から抽出された全てのパターンを対象と
して、「フリーピッチ」に対応する図3の文字列認識部
15の処理を実行し、文字の切り出し信頼度を考慮しな
がら文字認識を行う。
番号1の第8番目のパターンの「処理順序」の欄におい
て、「フリーピッチ」と指示されているので、処理実行
ルールの(C4)に従って、図72の枠番号1のフリー
ピッチ枠から抽出された第8番目のパターンに対し、同
じ枠番号1の他の全てのパターンの「処理順序」の欄が
「フリーピッチ」となるまで待機し、枠番号1の全ての
パターンの「処理順序」の欄が「フリーピッチ」となっ
た時に、枠番号1のフリーピッチ枠から抽出された全て
のパターンを対象として、「フリーピッチ」に対応する
図3の文字列認識部15の処理を実行し、文字の切り出
し信頼度を考慮しながら認識処理を行う。
理順序」の欄が「フリーピッチ」となった場合、図72
の枠番号1のフリーピッチ枠から抽出された全てのパタ
ーンを対象として、文字列認識部15の文字認識処理を
行う。
枠から抽出された第1番目のパターンについては、図7
7の中間処理結果テーブルの枠番号1の第1番目のパタ
ーンの「処理指示」の欄が「終了」となっているので、
図72の枠番号1のフリーピッチ枠から抽出された第1
番目のパターンを文字列認識部15の処理対象から除外
し、図72の枠番号1のフリーピッチ枠から抽出された
第2番目のパターンから第8番目のパターンについて、
文字列認識部15の認識処理を実行する。
2〜図65に示したように、文字を切り出した際の信頼
度を判別面からの距離に基づいて算出し、(文字切り出
しの信頼度)と(文字認識の信頼度)との積が最大とな
るものを、切り出し文字とする。
2の枠番号1のフリーピッチ枠から抽出された第2番目
のパターンは、認識信頼度が95%の確率で文字カテゴ
リ「3」であると認識され、中間処理結果テーブルの
「文字コード」の欄に「3」と記入されるとともに、中
間処理結果テーブルの「信頼度」の欄に「95%」と記
入される。
て、中間処理結果テーブルの「処理完了」の欄に「黒枠
/フリーピッチ」と記入され、中間処理結果テーブルの
「処理順序」の欄が空欄となり、処理実行ルールの(C
4)に従って、中間処理結果テーブルの「処理指示」の
欄に「個人筆記特性」と記入される。
出された第8番目のパターンは、認識信頼度が98%の
確率で文字カテゴリ「4」であると認識され、中間処理
結果テーブルの「文字コード」の欄に「4」と記入され
るとともに、中間処理結果テーブルの「信頼度」の欄に
「98%」と記入される。
て、中間処理結果テーブルの「処理完了」の欄に「黒枠
/フリーピッチ」と記入され、中間処理結果テーブルの
「処理順序」の欄が空欄となり、処理実行ルールの(C
4)に従って、中間処理結果テーブルの「処理指示」の
欄に「個人筆記特性」と記入される。
から抽出された第3番目のパターンは、文字カテゴリ
「2」であると認識され、図72の枠番号1のフリーピ
ッチ枠から抽出された第4番目のパターンと図72の枠
番号1のフリーピッチ枠から抽出された第5番目のパタ
ーンとは、文字列認識部15の認識処理により1つの文
字に統合され、文字カテゴリ「7」であると認識され、
図72の枠番号1のフリーピッチ枠から抽出された第6
番目のパターンは、文字カテゴリ「4」であると認識さ
れ、図72の枠番号1のフリーピッチ枠から抽出された
第7番目のパターンは、文字カテゴリ「6」であると認
識される。
の「文字数」の欄は「7」に変更される。次に、図76
の中間処理結果テーブルの枠番号2の「処理順序」の欄
において、「基本」と指示されているので、処理実行ル
ールの(C1)に従って、図72の枠番号2の一文字枠
から抽出されたパターンに対し、「基本」に対応する図
3の基本文字認識部17の処理を実行し、基本文字につ
いての文字認識処理を行う。
り、図72の枠番号2の一文字枠から抽出されたパター
ンは、認識信頼度が97%の確率で文字カテゴリ「5」
であると認識され、中間処理結果テーブルの「文字コー
ド」の欄に「5」と記入されるとともに、中間処理結果
テーブルの「信頼度」の欄に「97%」と記入される。
出し」の欄に「消し線(有2)/基本」と記入され、中
間処理結果テーブルの「処理完了」の欄に「消し線/基
本」と記入され、中間処理結果テーブルの「処理順序」
の欄は空欄となり、処理実行ルールの(C4)に従っ
て、中間処理結果テーブルの「処理指示」の欄に「個人
筆記特性」と記入される。
番号3の「処理順序」の欄は空欄となっているので、処
理実行ルールの(C4)に従って、中間処理結果テーブ
ルの「処理指示」の欄に「個人筆記特性」と記入され
る。
番号4の「処理順序」の欄において、「一文字消し線」
と指示されているので、処理実行ルールの(C1)に従
って、図72の枠番号4の一文字枠から抽出されたパタ
ーンに対し、「一文字消し線」に対応する図3の消し線
認識部26の処理を実行し、訂正文字の候補として抽出
されたパターンの認識処理を行う。
り、図72の枠番号4の一文字枠から抽出されたパター
ンの認識信頼度が95%と算出された結果、図72の枠
番号4の一文字枠から抽出されたパターンは訂正文字と
みなされ、中間処理結果テーブルの「信頼度」の欄に
「95%」と記入されるとともに、中間処理結果テーブ
ルの「処理完了」の欄に「黒枠/消し線」と記入され
る。
示」の欄に「終了」と記入されるとともに、中間処理結
果テーブルの「処理順序」の欄は空欄となる。次に、図
76の中間処理結果テーブルの枠番号5−1の「処理指
示」の欄に「終了」と記入されているので、図72の枠
番号5−1の枠から抽出されたパターンについては、処
理を行わない。
番号5−2の「処理順序」の欄は空欄となっているの
で、処理実行ルールの(C4)に従って、中間処理結果
テーブルの「処理指示」の欄に「個人筆記特性」と記入
される。
番号5−3の「処理順序」の欄は空欄となっているの
で、処理実行ルールの(C4)に従って、中間処理結果
テーブルの「処理指示」の欄に「個人筆記特性」と記入
される。
番号6−1−1の「処理指示」の欄に「終了」と記入さ
れているので、図72の枠番号6−1−1の枠から抽出
されたパターンについては、処理を行わない。
番号6−2−2の「処理指示」の欄に「終了」と記入さ
れているので、図72の枠番号6−1−1の枠から抽出
されたパターンについては、処理を行わない。
テーブルが生成される。ここで、図77の中間処理結果
テーブルの「処理指示」の欄には、「個人筆記特性」と
記入されているものがあるので、処理実行ルール(C
5)に従って処理を続行する。
に基づいて認識処理を続行し、その際に得られた結果を
示す図である。まず、図76の中間処理結果テーブルの
枠番号1の第1番目のパターンの「処理指示」の欄に
「終了」と記入されているので、図72の枠番号1のフ
リーピッチ枠から抽出された第1番目のパターンについ
ては、処理を行わない。
番号1の第2番目のパターンの「処理指示」の欄に「個
人筆記特性」と記入されているので、処理実行ルールの
(C5)に従って、図72の枠番号1のフリーピッチ枠
から抽出された第2番目のパターンに対し、「個人筆記
特性」に対応する図3のくせ字解析部23の処理を実行
する。
〜図71に示したように、同一筆者が書いた手書き文字
を各カテゴリごとにクラスタリングし、クラスタリング
により得られた手書き文字の第1のクラスタと距離が近
く、且つ他のカテゴリに属する第2のクラスタで要素数
が少ないものを第1のクラスタに統合することにより、
第2のクラスタに属する手書き文字のカテゴリを第1の
クラスタのカテゴリに修正する。
2の枠番号1のフリーピッチ枠から抽出された第2のパ
ターンは、認識信頼度が97%の確率で文字カテゴリ
「3」であると認識され、中間処理結果テーブルの「文
字コード」の欄に「3」と記入されるとともに、中間処
理結果テーブルの「信頼度」の欄に「97%」と記入さ
れる。
了」の欄に「黒枠/フリーピッチ/個人筆記特性」と記
入されるとともに、中間処理結果テーブルの「処理指
示」の欄に「終了」と記入される。
番号1の第8番目のパターンの「処理指示」の欄に「個
人筆記特性」と記入されているので、処理実行ルールの
(C5)に従って、図72の枠番号1のフリーピッチ枠
から抽出された第8番目のパターンに対し、「個人筆記
特性」に対応する図3のくせ字解析部23の処理を実行
する。
2の枠番号1のフリーピッチ枠から抽出された第8番目
のパターンは、認識信頼度が98%の確率で文字カテゴ
リ「4」であると認識され、中間処理結果テーブルの
「文字コード」の欄に「4」と記入されるとともに、中
間処理結果テーブルの「信頼度」の欄に「98%」と記
入される。
了」の欄に「黒枠/フリーピッチ/個人筆記特性」と記
入されるとともに、中間処理結果テーブルの「処理指
示」の欄に「終了」と記入される。
番号2の「処理指示」の欄に「個人筆記特性」と記入さ
れているので、処理実行ルールの(C5)に従って、図
72の枠番号2の一文字枠から抽出されたパターンに対
し、「個人筆記特性」に対応する図3のくせ字解析部2
3の処理を実行する。
2の枠番号2の一文字枠から抽出されたパターンは、認
識信頼度が97%の確率で文字カテゴリ「5」であると
認識され、中間処理結果テーブルの「文字コード」の欄
に「5」と記入されるとともに、中間処理結果テーブル
の「信頼度」の欄に「97%」と記入される。
了」の欄に「黒枠/フリーピッチ/個人筆記特性」と記
入されるとともに、中間処理結果テーブルの「処理指
示」の欄に「終了」と記入される。
番号3の「処理指示」の欄に「個人筆記特性」と記入さ
れているので、処理実行ルールの(C5)に従って、図
72の枠番号3の一文字枠から抽出されたパターンに対
し、「個人筆記特性」に対応する図3のくせ字解析部2
3の処理を実行する。
2の枠番号3の一文字枠から抽出されたパターンは、認
識信頼度が97%の確率で文字カテゴリ「3」であると
認識され、中間処理結果テーブルの「文字コード」の欄
に「3」と記入されるとともに、中間処理結果テーブル
の「信頼度」の欄に「97%」と記入される。
了」の欄に「黒枠/フリーピッチ/個人筆記特性」と記
入されるとともに、中間処理結果テーブルの「処理指
示」の欄に「終了」と記入される。
番号4の「処理指示」の欄に「終了」と記入されている
ので、図72の枠番号4の一文字枠から抽出されたパタ
ーンについては、処理を行わない。
番号5−1の「処理指示」の欄に「終了」と記入されて
いるので、図72の枠番号5−1の枠から抽出されたパ
ターンについては、処理を行わない。
番号5−2の「処理指示」の欄に「個人筆記特性」と記
入されているので、処理実行ルールの(C5)に従っ
て、図72の枠番号5−2の枠から抽出されたパターン
に対し、「個人筆記特性」に対応する図3のくせ字解析
部23の処理を実行する。
2の枠番号5−2の枠から抽出されたパターンは、認識
信頼度が97%の確率で文字カテゴリ「2」であると認
識され、中間処理結果テーブルの「文字コード」の欄に
「2」と記入されるとともに、中間処理結果テーブルの
「信頼度」の欄に「97%」と記入される。
了」の欄に「黒枠/フリーピッチ/個人筆記特性」と記
入されるとともに、中間処理結果テーブルの「処理指
示」の欄に「終了」と記入される。
番号5−3の「処理指示」の欄に「個人筆記特性」と記
入されているので、処理実行ルールの(C5)に従っ
て、図72の枠番号5−3の枠から抽出されたパターン
に対し、「個人筆記特性」に対応する図3のくせ字解析
部23の処理を実行する。
2の枠番号5−3の枠から抽出されたパターンは、認識
信頼度が96%の確率で文字カテゴリ「4」であると認
識され、中間処理結果テーブルの「文字コード」の欄が
「4」に変更されるとともに、中間処理結果テーブルの
「信頼度」の欄に「96%」と記入される。
了」の欄に「黒枠/フリーピッチ/個人筆記特性」と記
入されるとともに、中間処理結果テーブルの「処理指
示」の欄に「終了」と記入される。
番号6−1−1の「処理指示」の欄に「終了」と記入さ
れているので、図72の枠番号6−1−1の枠から抽出
されたパターンについては、処理を行わない。
番号6−2−2の「処理指示」の欄に「終了」と記入さ
れているので、図72の枠番号6−1−1の枠から抽出
されたパターンについては、処理を行わない。
テーブルが生成される。ここで、図78の中間処理結果
テーブルの「処理指示」の欄は、全ての処理対象に対し
て「終了」と記入されているので、処理実行ルール(C
6)に従って、全ての処理を終了する。
れば、文字認識部12及び非文字認識部25では、環境
認識系11で認識された入力画像の状態を処理するため
に適合した認識処理を行う。
文字を抽出した場合、罫線に接触した文字についての認
識処理を専用に行う接触文字認識部13を使用し、環境
認識系11がフリーピッチ文字列を抽出した場合、フリ
ーピッチ文字列についての認識処理を専用に行う文字列
認識部15を使用し、環境認識系11がかすれ文字を抽
出した場合、かすれ文字についての認識処理を専用に行
うかすれ文字認識部19を使用し、環境認識系11がつ
ぶれ文字を抽出した場合、つぶれ文字についての認識処
理を専用に行うつぶれ文字認識部21を使用し、環境認
識系11が非文字を抽出した場合、非文字についての認
識処理を専用に非文字認識部25を使用する。
5の認識結果についての信頼度を算出し、信頼度が低い
文字や非文字については、環境認識系11、文字認識部
19及び非文字認識部25の間で相互にフィードバック
を行うようにして他の処理をやり直すようにし、信頼度
が高くなるか、又は実行できる処理がなくなった場合に
全体の処理を終了する。
字が書かれている環境に応じて、文字を認識する際に使
用する特徴及び識別法をアダプティブに変化させて認識
処理を実行することができるので、文書や帳票の様々な
環境に対応した高精度な文字認識が可能となる。
力するだけでなく、環境認識系11による環境認識結果
を文字認識結果と同時に出力することができるととも
に、環境認識結果と文字認識結果とが相互に一致した時
に文字認識結果を出力することが可能となり、文字認識
結果に対する確認機能及び信頼性を向上させることがで
きる。
非文字認識を文字認識と独立して行うことができるの
で、文字認識及び非文字認識の信頼性を向上させること
ができる。
応じた独立な認識処理を行うことができるので、各認識
処理における辞書や知識を増加させることにより、認識
信頼度を向上させることができる。
処理対象の状態を入力画像から抽出し、その状態に適し
た認識処理を処理対象ごとに選択することにより、様々
な状態を有する入力画像に対し、それぞれの状態に適し
たパターン認識処理を行うことができ、認識処理を精度
よく行うことが可能となる。また、処理対象の評価が、
その状態を抽出する時と、その処理対象についての認識
処理を行う時の両方で行われるので、認識処理の精度を
より一層向上させることができる。
の状態を入力画像から抽出し、第1の状態を有する処理
対象に対しては、第1の状態専用のパターン認識処理を
行い、第2の状態を有する処理対象に対しては、第2の
状態専用のパターン認識処理を行うことにより、第1の
状態を有する処理対象の認識処理と第2の状態を有する
処理対象の認識処理とが互いに相互作用を及ぼすことが
なくなり、認識処理を精度よく行うことが可能となる。
態を有する入力画像に対し、認識辞書を使い分けること
により、それぞれの状態に対して最適な認識辞書を使用
することができ、認識処理の精度を向上させることが可
能となる。
態を有する入力画像に対し、識別関数を使い分けること
により、それぞれの状態に対して最適な識別関数を使用
しながら認識処理を行うことができ、認識処理の精度を
向上させることが可能となる。
態を有する入力画像に対し、知識を使い分けることによ
り、それぞれの状態に対して最適な知識を使用しながら
認識処理を行うことができ、認識処理の精度を向上させ
ることが可能となる。
による信頼度が所定の値以上となるまで、同一の処理対
象に対して複数の認識処理を行うようにすることによ
り、認識処理の信頼度を上げることができ、認識処理の
精度を向上させることができる。
ついての認識処理と文字についての認識処理とを別々に
行うようにすることにより、文字を非文字とみなした
り、非文字を文字とみなしたりして認識処理が行われる
ことが減少し、認識処理を精度よく行うことが可能とな
る。
能的な構成を示すブロック図である。
施例を示すブロック図である。
一実施例を示すブロック図である。
示すフローチャートである。
チャートである。
すフローチャートである。
ーチャートである。
ーチャートである。
の一実施例を示すフローチャートである。
システム構成を示すブロック図である。
より具体的なシステム構成を示すブロック図である。
ラベリング処理の一例を示す図である。
ラベリング処理の圧縮表現を示す図である。
テキスト抽出処理の一例を示す図である。
テキスト抽出処理における部分領域の一例を示す図であ
る。
罫線抽出処理における隣接投影法を説明する図である。
罫線抽出処理におけるパターンの投影結果を示す図であ
る。
罫線抽出処理を示すフローチャートである。
罫線抽出処理を示す図である。
罫線抽出処理におけるかすれ罫線の補完方法を説明する
図である。
かすれ罫線の補完方法を示すフローチャートである。
かすれ罫線の補完の際の探索方向を示す図である。
一文字枠抽出処理を示すフローチャートである。
ブロック枠抽出処理を示すフローチャートである。
枠及び表の種類を示す図である。
画像縮小処理を示すフローチャートである。
枠接触有無判断処理を説明する図である。
枠接触有無判断処理を示すフローチャートである。
消し線の種類を示す図である。
訂正文字の特徴量の算出方法を説明する図である。
ク図である。
の算出方法の一例を示す図である。
間の距離の算出方法の一例を示す図である。
文字セグメントの抽出方法を説明する図である。
端点の検出方法を説明する図である。
角度変化の検出方法を説明する図である。
文字セグメントの対応関係を説明する図である。
処理を示すフローチャートである。
法を示す図である。
を示す図である。
の例を示す図である。
法の一例を示すブロック図である。
生成方法を説明する図である。
生成例を示す図である。
の一例を示す図である。
に登録される変動種類及び変動量の一例を示す図であ
る。
識領域の一例を示す図である。
識方法を説明する図である。
識処理を示すフローチャートである。
方法の一例を示すブロック図である。
処理を示すフローチャートである。
メータの図形的意味を説明する図である。
ーチャートである。
ラメータの図形的意味を説明する図である。
ローチャートである。
ータの図形的意味を説明する図である。
チャートである。
タの算出処理を示すフローチャートである。
定量化方法を示す図である。
示す図である。
算出方法を示すフローチャートである。
成功及び切り出し失敗のヒストグラム分布の一例を示す
図である。
成功及び切り出し失敗の2群の重なり領域算出法を示す
図である。
処理の流れを示す図である。
文字の切り出し処理の流れを示す図である。
ック図である。
ある。
理の流れを示す図である。
理を示すフローチャートである。
結果修正処理の流れを示す図である。
結果修正処理を示すフローチャートである。
処理対象となる帳票の例を示す図である。
中間処理結果テーブルの一例を示す図である。
処理順序テーブルの一例を示す図である。
中間処理結果テーブルの一例を示す図である。
中間処理結果テーブルの一例を示す図である。
中間処理結果テーブルの一例を示す図である。
中間処理結果テーブルの一例を示す図である。
ク図である。
識テーブル 30 環境認識系 31 レイアウト解析部 32 訂正解析部 33 文字認識系/非文字認識系 34 基本文字認識部 35 黒枠接触文字認識部 36 フリーピッチ文字列認識部 37 消し線認識部 38 環境認識系 39 くせ字解析部 40 終了判定処理部 41 画像格納部 42 処理条件格納部 43 ラベル画像格納部 44 中間処理結果テーブル 50 プログラムメモリ 51 中央演算処理ユニット 52 画像メモリ 53 ワークメモリ 54 バス 55 インターフェイス回路 56 ディスプレイ 57 プリンタ 58 メモリ 59 スキャナ 60 辞書ファイル
Claims (39)
- 【請求項1】 入力画像のレイアウトを解析するレイア
ウト解析手段と、 前記入力画像の品質を分析する品質分析手段と、 前記入力画像の訂正状態を解析する訂正解析手段と、 前記入力画像の処理対象の状態ごとにパターン認識処理
を行うパターン認識手段と、 前記レイアウト、前記品質又は前記訂正状態に基づいて
前記入力画像の処理対象の状態を抽出し、処理対象の状
態ごとに前記パターン認識処理のいずれか1つ又は複数
を選択して認識処理を行わせる環境認識手段とを備える
ことを特徴とするパターン認識装置。 - 【請求項2】 前記処理対象の状態ごとにパターンの切
り出しを行うパターン切り出し手段をさらに備えること
を特徴とする請求項1に記載のパターン認識装置。 - 【請求項3】 前記環境認識手段は、前記処理対象の状
態についての判断結果に基づいて、前記パターン認識手
段による状態ごとの認識処理を前記処理対象ごとに記入
した中間処理結果テーブルを作成する中間処理結果テー
ブル作成手段を備えることを特徴とする請求項1に記載
のパターン認識装置。 - 【請求項4】 前記環境認識手段は、同一の処理対象に
対して複数の認識処理が呼ばれた場合、前記認識処理に
よる信頼度が所定の値以上となるまで、優先順位に従っ
て認識処理を行わせることを特徴とする請求項1に記載
のパターン認識装置。 - 【請求項5】 前記パターン認識手段は、文字の品質ご
とに設けられた認識辞書を備え、前記品質分析手段によ
り分析された品質に基づいて、前記認識辞書を使い分け
て文字の認識処理を行うことを特徴とする請求項1に記
載のパターン認識装置。 - 【請求項6】 前記認識辞書は、標準辞書、かすれ文字
用の辞書、つぶれ文字用の辞書、白抜き文字用の辞書、
又は背景がテクスチャの文字用の辞書のうちの少なくと
も1つからなることを特徴とする請求項5に記載のパタ
ーン認識装置。 - 【請求項7】 前記パターン認識手段は、前記処理対象
の状態に基づいて、知識を使い分けながら認識処理を行
うことを特徴とする請求項1に記載のパターン認識装
置。 - 【請求項8】 前記パターン認識手段は、前記処理対象
の状態に基づいて、識別関数を使い分けながら認識処理
を行うことを特徴とする請求項1に記載のパターン認識
装置。 - 【請求項9】 前記環境認識手段は、前記パターン認識
手段による状態ごとの認識処理を文書又は帳票のペ−ジ
単位で複数実行させることを特徴とする請求項1に記載
のパターン認識装置。 - 【請求項10】 前記品質分析手段は、所定の領域につ
いて、(面積、縦/横の長さがそれぞれ所定のしきい値
以下の連結領域の数)/(前記所定の領域の全ての連結
領域の数)の値が、所定値よりも大きい時にかすれと判
断することを特徴とする請求項1に記載のパターン認識
装置。 - 【請求項11】 前記品質分析手段は、所定の領域につ
いて、(かすれた罫線を補完した際の補完された部分の
長さの合計)/(各罫線の長さの合計)の値が、所定値
よりも大きい時にかすれと判断することを特徴とする請
求項1に記載のパターン認識装置。 - 【請求項12】 前記品質分析手段は、所定の領域につ
いて、(黒画素密度が所定のしきい値より大きい連結領
域の数)/(前記所定の領域の全ての連結領域の数)の
値が、所定値よりも大きい時につぶれと判断することを
特徴とする請求項1に記載のパターン認識装置。 - 【請求項13】 処理対象の状態を入力画像から抽出す
る状態抽出手段と、 前記処理対象の状態ごとにパターン認識処理を行うパタ
ーン認識手段と、 前記状態抽出手段により抽出された前記処理対象の状態
ごとに、前記パターン認識処理のいずれか1つ又は複数
を呼び出して認識処理を行わせる認識処理制御手段とを
備えることを特徴とするパターン認識装置。 - 【請求項14】 前記状態抽出手段は、 入力画像から所定の範囲の大きさを有する連結パターン
を文字の候補として抽出する文字抽出手段と、 前記文字の候補のうち、隣接して存在するものを文字列
の候補として抽出する文字列抽出手段と、 前記入力画像から罫線を抽出する罫線抽出手段と、 前記罫線で4方を囲むパターンを枠として抽出する枠抽
出手段と、 前記枠と接触している文字を抽出する接触文字抽出手段
と、 前記入力画像のかすれ状態を分析するかすれ分析手段
と、 前記入力画像のつぶれ状態を分析するつぶれ分析手段
と、 前記入力画像の訂正状態を抽出する訂正特徴抽出手段と
を備えることを特徴とする請求項13に記載のパターン
認識装置。 - 【請求項15】 前記枠抽出手段は、 前記罫線の連結状態及び枠の大きさに基づいて、一文字
枠、ブロック枠、フリーピッチ枠、規則的な表、又は不
規則な表のうちのいずれか1つの属性を前記枠に付与す
る属性付与手段を備えることを特徴とする請求項14に
記載のパターン認識装置。 - 【請求項16】 前記接触文字抽出手段は、 前記枠抽出手段により抽出された枠の内側を枠に沿って
走査する走査手段と、 前記走査により交差するパターンが存在するかどうかを
検出する交差検出手段と、 前記交差検出手段により交差するパターンが検出された
場合、前記パターンを走査した枠についての枠接触文字
であると判断する判断手段と、 前記パターンが走査した枠の外側から内側にはみだした
ものであるかどうかを検出するはみだし検出手段と、 枠の外側から内側にはみだしているパターンを、走査し
た枠についての枠接触文字から除外する除外手段とを備
えることを特徴とする請求項14に記載のパターン認識
装置。 - 【請求項17】 前記訂正特徴抽出手段は、 矩形内の画像を所定の一定方向に沿って走査した際の、
白画素から黒画素又は黒画素から白画素に変化する回数
を計数することにより、所定方向の線密度を算出する線
密度算出手段と、 画像中での互いに連結している連結成分の個数から、そ
の画像が有する穴の個数を減算することにより、オイラ
ー数を算出するオイラー数算出手段と、 注目する画像自体の面積と注目する画像の外接矩形の面
積との比を計算することにより、黒画素密度を算出する
黒画素密度算出手段と、 前記線密度が所定の値以上の場合、前記矩形内の画像を
訂正文字の候補とする線密度判定手段と、 前記オイラー数の絶対値が所定の値以上で、且つ負の値
となる場合、前記画像を訂正文字の候補とするオイラー
数判定手段と、 前記黒画素密度が所定の値以上の場合、前記画像を訂正
文字の候補とする黒画素密度判定手段とを備えることを
特徴とする請求項14に記載のパターン認識装置。 - 【請求項18】 前記パターン認識手段は、 文字についてのパターン認識を行う文字認識手段と、 文字列についてのパターン認識を行う文字列認識手段
と、 枠に接触した文字についてのパターン認識を行う接触文
字認識手段と、 かすれ文字についてのパターン認識を行うかすれ文字認
識手段と、 つぶれ文字についてのパターン認識を行うつぶれ文字認
識手段と、 訂正文字についてのパターン認識を行う訂正文字認識手
段と、 くせ字についてのパターン認識を行うくせ字認識手段と
を備えることを特徴とする請求項14に記載のパターン
認識装置。 - 【請求項19】 前記文字認識手段は、 入力された未知文字の特徴を特徴ベクトルとして抽出す
る特徴抽出部と、 文字カテゴリの特徴を特徴ベクトルとして予め格納して
いる基本辞書と、 前記未知文字の特徴ベクトルと前記文字カテゴリの特徴
ベクトルとの間の距離を算出し、前記特徴ベクトル間の
距離を最小とする文字カテゴリを前記未知文字として認
識する照合部とを備えることを特徴とする請求項18に
記載のパターン認識装置。 - 【請求項20】 前記文字認識手段は、 未知文字の輪郭の凹凸の個数を算出することにより、前
記未知文字の変形度を算出する変形度算出手段と、 文字カテゴリの特徴を特徴ベクトルとして予め格納して
いるセグメント辞書と、 文字の輪郭を端点で分割し、文字セグメントを生成する
文字セグメント生成部と、 前記変形度が所定値以上の場合、前記文字セグメントの
角度変化の累積値が互いに最も近くなるように、未知文
字の文字セグメントと前記文字カテゴリの文字セグメン
トとの対応関係を生成する対応関係生成部と、 前記対応関係に基づいて、前記未知文字の特徴ベクトル
と前記文字カテゴリの特徴ベクトルとの間の距離を算出
し、前記特徴ベクトル間の距離を最小とする文字カテゴ
リを前記未知文字として認識する照合部とを備えること
を特徴とする請求項18に記載のパターン認識装置。 - 【請求項21】 前記文字列認識手段は、 パターンの特徴を示すP個の特性値により表されるサン
プルデータを、切り出し成功を示す第1の群と切り出し
失敗を示す第2の群とに分類し、前記第1の群と前記第
2の群の各重心から等距離となるように構成された判別
面をP次元空間内に生成する判別面生成手段と、 前記P次元空間内において、入力データについてのP個
の特性値の位置が、前記判別面からどのくらい離れてい
るかを示す距離を求め、前記距離に基づいて、前記入力
データの切り出し信頼度を算出する切り出し信頼度算出
手段と、 前記入力データの切り出し信頼度と切り出された入力デ
ータの認識信頼度とに基づいて、入力データの切り出し
位置を決定する切り出し決定手段とを備えることを特徴
とする請求項18に記載のパターン認識装置。 - 【請求項22】 前記接触文字認識手段は、 枠接触文字から枠を除去する枠除去手段と、 枠を除去することにより分離した線分の方向に基づい
て、前記枠を除去することによりかすれた文字を補完す
る文字補完手段と、 枠を除去することにより分離したパターンのうち、前記
枠接触文字の状態の時に互いに連結していたパターンの
間を連結することにより、前記枠に重なっていた線分を
補完する再補完手段と、 文字と枠とを所定の条件で接触させた学習パターンを生
成する学習パターン生成手段と、 前記学習パターンの認識信頼度を前記所定の条件ととも
に格納し、前記認識信頼度が所定の値以下の場合、前記
学習パターンについての再文字認識方法を格納している
知識テーブルと、 前記文字補完手段により補完されたパターン又は前記再
補完手段により補完されたパターンが、前記所定の条件
を満たす場合、知識テーブルに格納された再文字認識方
法により再文字認識を行う再文字認識手段とを備えるこ
とを特徴とする請求項18に記載のパターン認識装置。 - 【請求項23】 前記かすれ文字認識手段は、 入力された未知文字の特徴を特徴ベクトルとして抽出す
る特徴抽出部と、 かすれ文字についての文字カテゴリの特徴を特徴ベクト
ルとして予め格納しているかすれ辞書と、 前記未知文字の特徴ベクトルと前記文字カテゴリの特徴
ベクトルとの間の距離を算出し、前記特徴ベクトル間の
距離を最小とする文字カテゴリを前記未知文字として認
識する照合部とを備えることを特徴とする請求項18に
記載のパターン認識装置。 - 【請求項24】 前記つぶれ文字認識手段は、 入力された未知文字の特徴を特徴ベクトルとして抽出す
る特徴抽出部と、 つぶれ文字についての文字カテゴリの特徴を特徴ベクト
ルとして予め格納しているつぶれ辞書と、 前記未知文字の特徴ベクトルと前記文字カテゴリの特徴
ベクトルとの間の距離を算出し、前記特徴ベクトル間の
距離を最小とする文字カテゴリを前記未知文字として認
識する照合部とを備えることを特徴とする請求項18に
記載のパターン認識装置。 - 【請求項25】 前記訂正文字認識手段は、 訂正文字の候補として抽出されたパターンの所定方向の
ヒストグラム値を算出するヒストグラム値算出手段と、 前記ヒストグラム値が所定値以上の線分を除去する線分
除去手段と、 前記線分を除去することにより、前記パターンのかすれ
た部分を補完して補完パターンを生成する補完手段と、 前記補完パターンについての文字認識を行う文字認識手
段と、 前記補完パターンが文字と認識された場合は、前記線分
除去手段により除去した線分を消し線とみなし、前記補
完パターンがリジェクトされた場合は、前記線分除去手
段により除去した線分を文字の一部とみなす消し線認識
手段とを備えることを特徴とする請求項18に記載のパ
ターン認識装置。 - 【請求項26】 前記くせ字認識手段は、 同一筆者が書いた手書き文字を各カテゴリごとにクラス
タリングすることにより、前記手書き文字を要素とする
複数のクラスタを各カテゴリ内に生成するクラスタリン
グ手段と、 前記クラスタリング手段により生成されたクラスタか
ら、要素数が所定値以下のクラスタを抽出するクラスタ
抽出手段と、 前記クラスタ抽出手段により抽出された第1のクラスタ
と、他のカテゴリに属する第2のクラスタとのクラスタ
間距離を算出するクラスタ間距離算出手段と、 前記第1のクラスタと第2のクラスタとの間の距離が所
定値以下の場合、第1のクラスタと第2のクラスタとを
統合し、前記第1のクラスタに属する手書き文字のカテ
ゴリを前記第2のクラスタのカテゴリに修正するカテゴ
リ修正手段とを備えることを特徴とする請求項18に記
載のパターン認識装置。 - 【請求項27】 前記認識処理制御手段は、 前記文字抽出手段が文字の候補を抽出した場合、前記文
字認識手段を呼び出し、前記文字列抽出手段が文字列の
候補を抽出した場合、前記文字列認識手段を呼び出し、
前記接触文字抽出手段が枠と接触している文字を抽出し
た場合、前記接触文字認識手段を呼び出し、前記かすれ
分析手段が前記入力画像のかすれ状態を抽出した場合、
前記かすれ文字認識手段を呼び出し、前記つぶれ分析手
段が前記入力画像のつぶれ状態を抽出した場合、前記つ
ぶれ文字認識手段を呼び出し、前記訂正特徴抽出が前記
入力画像の訂正状態を抽出した場合、前記訂正文字認識
手段を呼び出すことを特徴とする請求項18に記載のパ
ターン認識装置。 - 【請求項28】 前記認識処理制御手段は、前記文字認
識手段による文字としての信頼度が所定の値以上の場
合、前記くせ字認識手段を呼び出すことを特徴とする請
求項18に記載のパターン認識装置。 - 【請求項29】 前記認識処理制御手段は、 処理対象の状態の入力画像からの抽出結果に基づいて、
前記パターン認識手段による認識処理のいずれを呼び出
すかを示す呼び出し手順を格納している処理順序制御ル
ール格納手段と、 同一の処理対象に対する複数の認識処理が前記パターン
認識手段から呼び出された際の呼び出し順序を格納した
処理順序テーブルと、 前記呼び出し手順及び前記呼び出し順序に基づいて、前
記パターン認識手段による認識処理の実行順序を前記処
理対象ごとに示した中間処理結果テーブルを作成する中
間処理結果テーブル作成手段と、 前記中間処理結果テーブルに記入された認識処理の実行
結果に基づいて、次の処理の実行を指示する手順を格納
している処理実行ルール格納手段とを備えることを特徴
とする請求項13に記載のパターン認識装置。 - 【請求項30】 入力画像から文字を抽出する文字抽出
手段と、 入力画像から非文字を抽出する非文字抽出手段と、 文字についての認識処理を行う文字認識手段と、 非文字についての認識処理を行う非文字認識手段と、 前記文字抽出手段が文字を抽出した場合、前記文字認識
手段により認識処理を行わせ、前記非文字抽出手段が非
文字を抽出した場合、前記非文字認識手段により認識処
理を行わせる環境認識手段とを備えることを特徴とする
パターン認識装置。 - 【請求項31】 前記環境認識手段は、 前記文字抽出手段が文字を抽出した場合、前記文字認識
手段による認識結果についての確からしさを示す信頼度
を算出し、前記文字認識手段による認識結果の信頼度が
所定の値より小さい場合、前記文字抽出手段が抽出した
文字を非文字とみなして前記非文字認識手段により認識
処理を行わせることを特徴とする請求項30に記載のパ
ターン認識装置。 - 【請求項32】 前記環境認識手段は、 前記非文字抽出手段が非文字を抽出した場合、前記非文
字認識手段による認識結果についての確からしさを示す
信頼度を算出し、前記非文字認識手段による認識結果の
信頼度が所定の値より小さい場合、前記非文字抽出手段
が抽出した非文字を文字とみなして前記文字認識手段に
より認識処理を行わせることを特徴とする請求項30に
記載のパターン認識装置。 - 【請求項33】 入力画像から所定の特徴量を抽出する
環境認識手段と、 前記環境認識手段により抽出された特徴量に基づいて、
パターン認識処理を変更して実行可能なパターン認識手
段とを備えることを特徴とするパターン認識装置。 - 【請求項34】 第1の状態を有する処理対象について
のパターン認識処理を行う第1のパターン認識手段と、 第2の状態を有する処理対象についてのパターン認識処
理を行う第2のパターン認識手段と、 前記処理対象についての状態を入力画像から抽出し、前
記第1の状態を有する処理対象については、前記第1の
パターン認識手段による認識処理を行わせ、前記第2の
状態を有する処理対象については、前記第2のパターン
認識手段による認識処理を行わせる環境認識手段とを備
えることを特徴とするパターン認識装置。 - 【請求項35】 前記環境認識手段は、 前記第1の状態と前記第2の状態とを同一の処理対象か
ら抽出した場合、その処理対象については、前記第1の
パターン認識手段による認識処理と前記第2のパターン
認識手段による認識処理とを行わせることを特徴とする
請求項34に記載のパターン認識装置。 - 【請求項36】 前記環境認識手段は、前記第1のパタ
ーン認識手段による認識結果及び前記第2のパターン認
識手段による認識結果についての確からしさを示す信頼
度を算出し、前記信頼度が所定の値以上の場合、その認
識結果を最終結果として出力することを特徴とする請求
項34に記載のパターン認識装置。 - 【請求項37】 処理対象の状態を入力画像から抽出
し、その状態に適した認識処理を前記処理対象ごとに選
択することにより、パターン認識を行うことを特徴とす
るパターン認識方法。 - 【請求項38】 処理対象についての状態を入力画像か
ら抽出するステップと、 第1の状態を有する処理対象に対し、前記第1の状態専
用のパターン認識処理を行うステップと、 第2の状態を有する処理対象に対し、前記第2の状態専
用のパターン認識処理を行うステップとを備えることを
特徴とするパターン認識方法。 - 【請求項39】 処理対象についての状態を入力画像か
ら抽出する機能と、 第1の状態を有する処理対象に対し、第1の状態専用の
パターン認識処理を行う機能と、 第2の状態を有する処理対象に対し、前記第2の状態専
用のパターン認識処理を行う機能とをコンピュータに実
行させるプログラムを格納したコンピュータ読み取り可
能な記憶媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP26129197A JP4176175B2 (ja) | 1996-09-27 | 1997-09-26 | パターン認識装置 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP8-255217 | 1996-09-27 | ||
JP25521796 | 1996-09-27 | ||
JP26129197A JP4176175B2 (ja) | 1996-09-27 | 1997-09-26 | パターン認識装置 |
Related Child Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006298257A Division JP2007058882A (ja) | 1996-09-27 | 2006-11-01 | パターン認識装置 |
JP2006298258A Division JP2007026470A (ja) | 1996-09-27 | 2006-11-01 | パターン認識装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH10154204A true JPH10154204A (ja) | 1998-06-09 |
JP4176175B2 JP4176175B2 (ja) | 2008-11-05 |
Family
ID=26542087
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP26129197A Expired - Fee Related JP4176175B2 (ja) | 1996-09-27 | 1997-09-26 | パターン認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4176175B2 (ja) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002074269A (ja) * | 2000-08-28 | 2002-03-15 | Nippon Digital Kenkyusho:Kk | 文字認識方法 |
US6643401B1 (en) | 1998-12-16 | 2003-11-04 | Fujitsu Limited | Apparatus and method for recognizing character |
JP2009069951A (ja) * | 2007-09-11 | 2009-04-02 | Hitachi Computer Peripherals Co Ltd | 文字認識装置及び文字認識装置における文字認識方法 |
JP2009259291A (ja) * | 2000-11-01 | 2009-11-05 | Fujitsu Ltd | 文字認識方法,プログラム及び記録媒体 |
JP2011018311A (ja) * | 2009-07-07 | 2011-01-27 | Sharp Corp | 画像検索装置、画像検索プログラムおよび記録媒体 |
JP2018112839A (ja) * | 2017-01-10 | 2018-07-19 | 富士通株式会社 | 画像処理プログラム、画像認識プログラム、画像処理装置、画像認識装置、画像認識方法、及び画像処理方法 |
US11568276B1 (en) | 2021-08-25 | 2023-01-31 | International Business Machines Corporation | Adaptive document understanding |
-
1997
- 1997-09-26 JP JP26129197A patent/JP4176175B2/ja not_active Expired - Fee Related
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6643401B1 (en) | 1998-12-16 | 2003-11-04 | Fujitsu Limited | Apparatus and method for recognizing character |
JP2002074269A (ja) * | 2000-08-28 | 2002-03-15 | Nippon Digital Kenkyusho:Kk | 文字認識方法 |
JP4580520B2 (ja) * | 2000-08-28 | 2010-11-17 | 株式会社日本デジタル研究所 | 文字認識方法および文字認識装置 |
JP2009259291A (ja) * | 2000-11-01 | 2009-11-05 | Fujitsu Ltd | 文字認識方法,プログラム及び記録媒体 |
JP2009069951A (ja) * | 2007-09-11 | 2009-04-02 | Hitachi Computer Peripherals Co Ltd | 文字認識装置及び文字認識装置における文字認識方法 |
JP2011018311A (ja) * | 2009-07-07 | 2011-01-27 | Sharp Corp | 画像検索装置、画像検索プログラムおよび記録媒体 |
JP2018112839A (ja) * | 2017-01-10 | 2018-07-19 | 富士通株式会社 | 画像処理プログラム、画像認識プログラム、画像処理装置、画像認識装置、画像認識方法、及び画像処理方法 |
WO2018131451A1 (ja) * | 2017-01-10 | 2018-07-19 | 富士通株式会社 | 画像処理プログラム、画像認識プログラム、画像処理装置、画像認識装置、画像認識方法、及び画像処理方法 |
US10915799B2 (en) | 2017-01-10 | 2021-02-09 | Fujitsu Limited | Image processing apparatus and image recognition apparatus |
US11568276B1 (en) | 2021-08-25 | 2023-01-31 | International Business Machines Corporation | Adaptive document understanding |
Also Published As
Publication number | Publication date |
---|---|
JP4176175B2 (ja) | 2008-11-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100248917B1 (ko) | 패턴인식장치및방법 | |
US6917706B2 (en) | Ruled line extracting apparatus for extracting ruled line from normal document image and method thereof | |
US8442319B2 (en) | System and method for classifying connected groups of foreground pixels in scanned document images according to the type of marking | |
US6970601B1 (en) | Form search apparatus and method | |
CN113158808B (zh) | 中文古籍字符识别、组段与版面重建方法、介质和设备 | |
Lacerda et al. | Segmentation of connected handwritten digits using Self-Organizing Maps | |
JP2007058882A (ja) | パターン認識装置 | |
JPH08305796A (ja) | パターン抽出装置、パターン再認識用テーブル作成装置及びパターン認識装置 | |
JP3411472B2 (ja) | パターン抽出装置 | |
JPH08167000A (ja) | 文字認識装置および方法 | |
CN109389050A (zh) | 一种流程图连接关系识别方法 | |
CN115311666A (zh) | 图文识别方法、装置、计算机设备及存储介质 | |
JP4176175B2 (ja) | パターン認識装置 | |
JP4810853B2 (ja) | 文字画像切出装置、文字画像切出方法およびプログラム | |
JP2007026470A (ja) | パターン認識装置 | |
JP4117648B2 (ja) | 帳票、帳票処理方法、帳票処理プログラム、帳票処理プログラムを記録した記録媒体及び帳票処理装置 | |
JP3476595B2 (ja) | 画像領域分割方法、および画像2値化方法 | |
JP2002312719A (ja) | 文字切り出し装置及び文字切り出し方法並びに文字切り出し用プログラム | |
Sahle | Segmentation of Real Life Amharic Documents for Improving Recognition | |
JP2000207491A (ja) | 文字列読取方法及び装置 | |
Bobier et al. | Evaluation of binarization algorithms | |
JPH1040334A (ja) | パターン抽出装置及びパターン領域の切り出し方法 | |
JP2001060249A (ja) | 帳票識別用文字列照合方式 | |
JPH02125393A (ja) | 辞書および文字認識方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20060831 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060905 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20061101 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20061219 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070207 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20070302 |
|
A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20070323 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080820 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110829 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120829 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120829 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130829 Year of fee payment: 5 |
|
LAPS | Cancellation because of no payment of annual fees |