JP3466449B2 - パターン認識方法および装置とパターン認識方法をコンピュータに実行させるためのプログラムを記録した記録媒体 - Google Patents

パターン認識方法および装置とパターン認識方法をコンピュータに実行させるためのプログラムを記録した記録媒体

Info

Publication number
JP3466449B2
JP3466449B2 JP34329297A JP34329297A JP3466449B2 JP 3466449 B2 JP3466449 B2 JP 3466449B2 JP 34329297 A JP34329297 A JP 34329297A JP 34329297 A JP34329297 A JP 34329297A JP 3466449 B2 JP3466449 B2 JP 3466449B2
Authority
JP
Japan
Prior art keywords
pattern
dictionary
deterioration
deterioration index
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP34329297A
Other languages
English (en)
Other versions
JPH11175662A (ja
Inventor
美奈子 澤木
洋 村瀬
紀博 萩田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP34329297A priority Critical patent/JP3466449B2/ja
Publication of JPH11175662A publication Critical patent/JPH11175662A/ja
Application granted granted Critical
Publication of JP3466449B2 publication Critical patent/JP3466449B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文字や図形などが
1つもしくはそれ以上含まれている入力パターンの認識
を行うパターン認識方法に関し、特に入力パターンが劣
化した場合の認識率の向上を図るための方法に関する。
【0002】
【従来の技術】OCR(Optical Charac
ter Reader:光学式文字読取り装置)等に用
いられているパターン認識方法は、印刷漢字、手書き漢
字、英数字、記号、数式、図形など多くの文字・図形カ
テゴリの入力パターンを認識する対象としている。
【0003】従来、文字認識処理装置や図面認識装置で
は、情景内文字のような劣化が大きなパターンを認識す
る場合に、パターンの単色性および複雑さなどのヒュー
リスティックな特徴に基づいて画像から認識すべき領域
を抽出し、その後に既存の認識手法により認識を行う場
合が多い。これらの手法では、前処理により認識しやす
い状態のパターンを抽出することに重点がおかれ、その
後段にくる認識部分については余り考察されてこなかっ
た。
【0004】しかし、情景内文字のような劣化が大きな
パターンは、既存の文字認識処理装置や図面認識処理装
置が対象とするようなパターンとはその性質が大きく異
なる。例えば、情景内の文字を例にとると、文字部分と
背景部分のコントラストが低い場合や、画像の部分によ
って文字と背景の条件が異なる場合がある上に、照明状
況などの観測条件が大きく変化するために、観測された
文字は、大きく劣化したり、汚れやかすれなどの雑音が
残ることがしばしば起こる。そのために、単純な類似度
を用いた照合や、あるいは比較的雑音に強いと言われる
補完類似度による照合を用いても、これらの文字を認識
した場合には、必ずしも高い認識率が得られない。
【0005】これらの大きな劣化を吸収するためには、
劣化に不変な特徴量もしくは識別関数を用いる手法が提
案されている。例えば、文字の輪郭方向に基づいた特徴
量は字形劣化にロバストであることが報告されている。
また、参照パターンを変形させて入力パターンと照合す
る手法の検討もなされている。しかし、これらの手法
は、汚れやかすれのような雑音に影響を受けやすいた
め、劣化したパターンを十分な認識精度で認識すること
ができない。
【0006】
【発明が解決しようとする課題】上述した従来のパター
ン認識方法では、劣化が大きな入力パターンを正しく認
識することができないという問題点があった。
【0007】本発明の目的は、劣化が大きな入力パター
ンの認識率を向上することができるパターン認識方法お
よび装置を提供することである。
【0008】
【課題を解決するための手段】上記目的を達成するため
に、本発明のパターン認識方法は、1つもしくはそれ以
上の画像パターンからなる入力パターンを認識するパタ
ーン認識方法において、認識する対象である複数の各文
字・図形カテゴリ毎に1つの多値パターンを用意し、こ
の多値パターンを異なる複数のしきい値により二値化す
ることにより得られ複数のパターンをそれぞれ有する複
数の辞書を作成し、画像パターンの劣化の程度を表す指
数である劣化指数毎に複数の学習パターンをそれぞれ有
する複数の劣化学習パターンを順次選択して、作成した
前記複数の辞書を用いてパターン認識を行い、最大の認
識率が得られた辞書に、その劣化学習パターンの劣化指
数を対応づけて記憶しておく辞書作成過程と、前記入力
パターンの劣化指数を推定する劣化指数推定過程と、
め作成された前記複数の辞書の中から、推定された該劣
化指数に対応した辞書を選択する辞書選択過程と、選択
された前記辞書を用いて前記入力パターンのパターン認
識を行う認識過程を有することを特徴とする。
【0009】本発明は、入力パターンに対する劣化指数
を推定し、劣化指数毎に用意された複数の辞書の中から
適切な辞書を選択し、その辞書を用いてその入力パター
ンのパターン認識を行うようにする。
【0010】したがって、パターン認識を行う入力パタ
ーンの劣化の程度に応じた参照パターンを用いてパター
ン認識を行うことができ認識率を向上することができ
る。
【0011】また、請求項2記載のパターン認識方法
は、前記劣化指数推定過程における前記劣化指数を推定
する方法が、前記複数の辞書の中から予め任意に選択し
た1つの辞書である初期辞書に含まれる複数の参照パタ
ーンのうち前記入力パターンに最も近似している参照パ
ターンを最近傍参照パターンとして選択し、前記入力パ
ターンを該最近傍参照パターンと比較することにより前
記劣化指数を推定する方法である。
【0012】本発明は、最近傍参照パターンを用いて入
力パターンの劣化指数を推定するので、劣化指数を安定
して推定することができる。
【0013】また、請求項3記載のパターン認識方法
は、前記入力パターンと最近傍参照パターンとを比較す
ることにより前記劣化指数を推定する方法が、前記入力
パターンと前記最近傍参照パターンの黒画素数の比を求
め、該黒画素数の比を前記劣化指数とする方法である。
【0014】本発明は、最近傍参照パターンと入力パタ
ーンの黒画素数の比を求め、その比を入力パターンの劣
化指数として推定するので、劣化指数を安定して推定す
ることができる。
【0015】上記目的を達成するために、請求項4記載
のパターン認識装置は、認識される1もしくはそれ以上
の画像パターンを入力パターンとして記憶するためのパ
ターン記憶部と、認識する対象である複数の各文字・図
形カテゴリ毎に1つの多値パターンを用意し、この多値
パターンを異なる複数のしきい値により二値化すること
により得られ複数のパターンをそれぞれ有する複数の辞
書を作成し、画像パターンの劣化の程度を表す指数であ
劣化指数毎に複数の学習パターンをそれぞれ有する複
数の劣化学習パターンを順次選択して、作成した前記複
数の辞書を用いてパターン認識を行い、最大の認識率が
得られた辞書に、その劣化学習パターンの劣化指数を対
応づける辞書作成部と、前記辞書作成部により生成され
た複数の辞書および前記複数の辞書の中から予め任意に
選択した1つの辞書である初期辞書を記憶するための辞
書記憶部と、前記パターン記憶部から認識すべき入力パ
ターンを読み込み、前記辞書記憶部に記憶されている初
期辞書に含まれている複数の参照パターンの中から、前
記入力パターンと最も近似している参照パターンを選び
出し最近傍参照パターンとし、該最近傍参照パターンと
前記入力パターンの黒画素数の比を劣化指数として推定
する劣化指数推定部と、前記劣化指数推定部によって推
定された劣化指数と前記辞書記憶部に記憶されている複
数の辞書を比較し、前記劣化指数に対応した辞書の辞書
番号を選択する辞書選択部と、前記辞書選択部によって
選択された辞書番号の辞書を前記辞書記憶部から入力
し、該辞書と前記入力パターンを照合することによりパ
ターン認識を行う認識部とを有する。
【0016】
【0017】
【発明の実施の形態】次に、本発明の実施形態について
図面を参照して詳細に説明する。
【0018】図1は本発明の一実施形態のパターン認識
装置の構成を示すブロック図である。
【0019】本実施形態のパターン認識装置は、パター
ン記憶部1と、辞書記憶部2と、劣化指数推定部3と、
辞書選択部4と、認識部5と、辞書作成部6と、学習パ
ターン記憶部7とから構成されている。
【0020】パターン記憶部1は、認識される1もしく
はそれ以上の画像パターンを入力パターンとして記憶し
ている。これらの画像パターンはn画素からなり、例え
ば、2値画像パターンの場合には各画素は「0」または
「1」で示されている。また、例えば、多値パターンの
場合には各画素は0から1の間の実数値で示されてい
る。
【0021】学習パターン記憶部7は、様々な劣化指数
の学習パターンを記憶している。ここで、劣化指数と
は、入力パターンの劣化の程度を表わした指数である。
また、学習パターンはn画素からなり、例えば、2値画
像パターンの場合には各画素は「0」または「1」で示
されている。また、例えば、学習パターンが、多値パタ
ーンの場合には各画素は0から1の間の実数値で示され
ている。
【0022】辞書作成部6では、学習パターン記憶部7
に記憶されている学習パターンから、劣化指数の異なる
複数の劣化学習パターンを劣化指数毎に作成する。
た、辞書作成部6は、複数の各文字・図形カテゴリ毎に
1つの多値パターンを用意し、この多値パターンを異な
る複数のしきい値により二値化することにより得られ複
数のパターンをそれぞれ有する複数の辞書を作成する。
そして、その辞書のうちの任意の1つを初期辞書として
設定する。初期辞書は、任意に選択辞書としたが、通常
は劣化の少ない奇麗な学習パターンを参照パターンとし
て記憶している辞書を初期辞書に設定する。
【0023】辞書記憶部2は、辞書作成部6によって作
成された劣化指数毎の辞書を記憶している。ここで、辞
書記憶部2に記憶されている辞書には初期辞書も当然含
まれている。
【0024】劣化指数推定部3は、パターン記憶部1か
ら認識すべき入力パターンを読み込み、その入力パター
ンの劣化指数101を求め、その劣化指数101を辞書
選択部4に出力する。ここで、劣化指数推定部3が劣化
指数を求める具体的な方法を下記に述べる。
【0025】先ず、劣化指数推定部3は、辞書記憶部2
に記憶されている初期辞書に含まれている複数の参照パ
ターンの中から、入力パターンと最も近似している参照
パターンを選び出し最近傍参照パターンとする。そし
て、その最近傍参照パターンと入力パターンの黒画素数
の比を劣化指数101とする。一般に、劣化は汚れとか
すれの2種類に大別され、同時に起こることは稀である
ことが報告されているため、黒画素数比により、劣化の
度合いを近似的に表すことができる。入力パターンと最
近傍参照パターンの照合の方法としては、例えば、既存
の方法である補完類似度によるずらし照合を行う。
【0026】このように、入力パターンと最近傍パター
ンの黒画素数の比を劣化指数としているため、初期辞書
に含まれる参照パターンの劣化指数は1となる。
【0027】辞書選択部4は、劣化指数推定部3から出
力された劣化指数101と辞書記憶部2に記憶されてい
る複数の辞書を比較し、入力された劣化指数101に対
応した辞書の辞書番号102を選択して認識部5に出力
する。
【0028】認識部5では、辞書選択部4から入力され
た辞書番号102の辞書を辞書記憶部2から入力し、そ
の辞書と入力パターンを照合することによりパターン認
識を行いその認識結果を出力する。
【0029】次に、本実施形態のパターン認識装置の動
作を図2の具体的な入力パターンのパターン認識を行う
場合について図3のフローチャートを用いて説明する。
【0030】先ず、劣化指数推定部3は、図2に示され
ている3種類の入力パターン201、202、203に
対し、辞書記憶部2に記憶されている初期辞書の参照パ
ターンから最近傍参照パターン204を選択したとする
(ステップ301)。その場合、例えば、入力パターン
201、202、203と最近傍参照パターン204の
黒画素数の比を劣化指数とする。この例では、入力パタ
ーン202と最近傍参照パターン204の黒画素の数は
等しいため、入力パターン202の劣化指数は1と推定
される。また、入力パターン201、203に対して
は、それぞれ1よりも小さい劣化指数、1よりも大きい
劣化指数が推定される(ステップ302)。
【0031】1つの入力パターン内に複数のパターンが
存在する場合には、それぞれのパターンごとに劣化指数
を推定し、その劣化指数の平均を入力パターン全体の劣
化指数とすることにより、初期辞書による認識誤りの影
響を少なくし、安定して劣化指数を推定することができ
る。
【0032】このようにして、劣化指数推定部3により
求められた劣化指数101は、辞書選択部4に入力され
る。
【0033】辞書選択部4は、入力された劣化指数10
1と辞書記憶部2に記憶されている複数の辞書を比較
し、入力された劣化指数に対応した辞書番号102を選
択し、認識部5に出力する(ステップ303)。
【0034】認識部5では、入力された辞書番号102
の辞書を、辞書記憶部2から読み出し、入力パターンと
照合する。照合の際には、例えば、単純類似度や補完類
似度によるずらし照合を行う。次に、照合した結果を認
識結果として出力する。結果の出力の前に、言語処理な
どの後処理を加えてもよい(ステップ304)。
【0035】次に、辞書作成部6により初期辞書を含む
辞書が生成される過程を詳しく説明する。図4は、辞書
作成部6によって行われる辞書作成の過程を示したフロ
ーチャートである。
【0036】先ず、学習パターン記憶部7に記憶されて
いる学習パターンのカテゴリごとに平均パターンを作成
し、それらを異なったしきい値で二値化することにより
複数の辞書D1〜DMを作成する。しきい値は、例え
ば、0から1の間で0.1刻みで設定する(ステップ4
01)。
【0037】次に、各劣化指数の劣化学習パターンL1
〜LMを作成する。例えば、初期辞書内の同じカテゴリ
の参照パターンとの黒画素の比を劣化指数とすると、あ
らかじめ学習パターン記憶部7に蓄えられている学習パ
ターンを、膨張させたり収縮させて黒画素数を変化させ
ることにより、それぞれの劣化指数に対応する劣化学習
パターンを作成することができる。ここで、初期辞書と
同じ黒画素数の劣化学習パターンは、劣化指数1となる
(ステップ402)。
【0038】次に、それぞれの劣化学習パターンL1〜
LMを順番に1つづつ選択して、各辞書D1〜DMによ
る認識を行う。そして、最大の認識率をとった辞書に、
その劣化学習パターンと同じ劣化指数を付与する。この
ため、1つの辞書に複数の劣化指数が付与されることも
生じる(ステップ404〜408)。
【0039】次に、図5に本実施形態における、パター
ン認識動作の概念図を示す。
【0040】先ず、パターン認識の前に劣化指数R1〜
RNに対応した辞書1〜Nが準備されている。“AB
C”という入力パターンが入力されると、劣化指数Ri
が推定され、その劣化指数Riに対応した辞書iが選択
される。そして、その選択された辞書iを用いて入力パ
ターン“ABC”の認識が行われ、認識結果が出力され
る。
【0041】次に、本実施形態のパターン認識装置を用
いて、本棚上の雑誌の背に印刷された文字を認識する例
について説明する。
【0042】図6に、パターン認識処理のフローチャー
トを示す。パターン認識処理は大きく分けて、前処理
部、認識部、後処理部からなる。ここで、本実施形態
は、認識部に使われている。
【0043】(1)前処理部 二値化(ステップ601) デジタルカメラで入力されたカラー画像を濃淡画像に変
換した後に、適当なしきい値で二値化する。濃淡画像の
例を図7の画像701に、二値化された画像の例を図7
の画像702に示す。画像701では、実際の濃淡画像
を表現することが困難なため、濃淡画像を簡易的に画像
701のように表わしている。
【0044】傾き抽出(ステップ602) 本棚上の本や雑誌は、しばしば傾いて置かれているた
め、傾き補正を行う。本の境界部分には、影により黒っ
ぽい線が入るため、例えば、ランレングスに基づいて本
の境界部分を検出し、その傾き角を求める。
【0045】具体的な例としては、まず、境界部分の黒
画素の連結(ラン)が雑音などにより分断される場合が
あるため、それをつなぐために二値画像を垂直方法に上
下2画素ずつ膨張させる。その画像上の各x座標(x軸
は水平方向とする)において、垂直方向に対し±2度の
間の0.2度刻みで複数回走査し、最大ランレングスを
与える角度をそのx座標における傾き角とする。また、
最大ランレングスが一定値以上の部分を本の境界線とす
る。
【0046】射影による文字列抽出(ステップ60
3) 次に、境界部分で囲まれた範囲の中の文字列の幅を求め
る。文字列抽出には、例えば、文字列部分は、背景部分
に比べ、エッジ部分が多いと仮定し、白黒反転回数によ
り文字列部分を特定する。
【0047】具体的例としては、各x座標において、求
められた傾き角に応じた方向に走査し、画素値の黒白の
反転回数の射影分布をとる。この回数が、一定値より多
い範囲を文字列領域とする。求められた文字列領域の幅
の中心のx座標における傾き角をその文字列領域の傾き
角とし、その角度に応じて文字列画像を回転し、傾き補
正を行う。図7の画像703には、この処理で抽出され
た文字列を矩形領域として示してある。
【0048】(2)認識部 初期辞書による認識(ステップ604) 得られた傾き補正後の文字列画像中の文字は、例えば、
ずらし照合により認識する。各文字列上を認識用観測窓
710を垂直方向に走査し、各認識用観測窓710と初
期辞書内の参照パターンとの照合を行う。また、照合に
は例えば、補完類似度を用い、位置ずれを考慮して垂直
方向のみでなく水平方向への走査も行う。照合した各位
置での最大類似度があらかじめ学習してある各文字カテ
ゴリの類似度しきい値を越えた場合、そのカテゴリを初
期辞書による認識結果とする。初期辞書による認識を行
った際の、最大類似度分布および最大類似度をとった参
照パターンおよびそのカテゴリを図7の704に左から
順に示す。
【0049】劣化状態に対応した辞書の選択(ステッ
プ605) 初期辞書による認識結果から入力画像の劣化指数を推定
する。ここでは、複数文字が存在するため、各文字ごと
に推定された劣化指数の平均値をとり、その文字列の劣
化指数とする。その後に、劣化指数に対応する辞書を選
択する。
【0050】選択された辞書による認識(ステップ6
06) 選択された辞書を用いて、ずらし照合を再度文字列画像
に適用して文字を認識する。選択された辞書による認識
を行った際の、最大類似度分布および最大類似度をとっ
た参照パターンおよびそのカテゴリを図7の705に左
から順に示す。
【0051】(3)後処理部(ステップ607) ある限られた対象分野での文字認識においては文脈に基
づき後処理が有効である。例えば、あらかじめ登録され
ている連結する可能性のある2カテゴリ(例えば、
[‘e’の後には‘b’か‘c’か‘m’か‘p’か
‘r’しかこない、など」)に基づいた後処理を行い、
認識結果を出力する。後処理の結果の例を図7の認識結
果706に示す。
【0052】図1には示されていないが、本実施形態の
パターン認識装置は、プログラムを記録した記録媒体を
備えている。この記録媒体は磁気ディスク、半導体メモ
リまたはその他の記録媒体であってもよい。
【0053】このプログラムは、記録媒体からパターン
認識装置に読み込まれ、パターン認識装置の動作を制御
する。パターン認識装置は読み込まれたプログラムの制
御により上記で説明した処理を実行する。
【0054】
【発明の効果】以上説明したように、本発明は、入力パ
ターンの劣化状況に応じた辞書を選択してパターン認識
を行うことができ認識率が向上するという効果を有す
る。
【図面の簡単な説明】
【図1】本発明の一実施形態のパターン認識装置の構成
を示したブロック図である。
【図2】本発明の一実施形態のパターン認識方法におけ
る劣化指数の推定方法を具体的に示すための図である。
【図3】本発明の一実施形態のパターン認識方法におけ
るパターン認識を説明するためのフローチャートであ
る。
【図4】本発明の一実施形態のパターン認識方法におけ
る辞書作成方法を説明するためのフローチャートであ
る。
【図5】本発明の一実施形態のパターン認識方法におけ
る認識の概念図を示した図である。
【図6】本発明の一実施形態のパターン認識方法を用い
た情景内文字認識処理の流れを示したフローチャートで
ある。
【図7】本発明の一実施形態のパターン認識方法を用い
た情景内文字認識処理の認識結果の具体例を示した図で
ある。
【符号の説明】
1 パターン記憶部 2 辞書記憶部 3 劣化指数推定部 4 辞書選択部 5 認識部 6 辞書作成部 7 学習パターン記憶部 101 劣化指数 102 辞書番号 201〜203 入力パターン 204 最近傍参照パターン 301〜304 ステップ 401〜408 ステップ 601〜607 ステップ 701〜706 画像、認識結果等 710 認識用観測窓
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平8−137987(JP,A) 特開 昭62−245391(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06K 9/00 - 9/76

Claims (7)

    (57)【特許請求の範囲】
  1. 【請求項1】 1つもしくはそれ以上の画像パターンか
    らなる入力パターンを認識するパターン認識方法におい
    て、認識する対象である複数の各文字・図形カテゴリ毎に1
    つの多値パターンを用意し、この多値パターンを異なる
    複数のしきい値により二値化することにより得られ複数
    のパターンをそれぞれ有する複数の辞書を作成し、 画像
    パターンの劣化の程度を表す指数である劣化指数毎に複
    数の学習パターンをそれぞれ有する複数の劣化学習パタ
    ーンを順次選択して、作成した前記複数の辞書を用いて
    パターン認識を行い、最大の認識率が得られた辞書に、
    その劣化学習パターンの劣化指数を対応づけて記憶して
    おく辞書作成過程と、 前記入力パターンの劣化指数を推定する劣化指数推定過
    程と、予め作成された前記 複数の辞書の中から、推定された該
    劣化指数に対応した辞書を選択する辞書選択過程と、 選択された前記辞書を用いて前記入力パターンのパター
    ン認識を行う認識過程を有することを特徴とするパター
    ン認識方法。
  2. 【請求項2】 前記劣化指数推定過程における前記劣化
    指数を推定する方法が、 前記複数の辞書の中から予め任意に選択した1つの辞書
    である初期辞書に含まれる複数の参照パターンのうち前
    記入力パターンに最も近似している参照パターンを最近
    傍参照パターンとして選択し、前記入力パターンを該最
    近傍参照パターンと比較することにより前記劣化指数を
    推定する方法である請求項1記載のパターン認識方法。
  3. 【請求項3】 前記入力パターンと最近傍参照パターン
    とを比較することにより前記劣化指数を推定する方法
    が、 前記入力パターンと前記最近傍参照パターンの黒画素数
    の比を求め、該黒画素数の比を前記劣化指数とする方法
    である請求項2記載のパターン認識方法
  4. 【請求項4】 認識される1もしくはそれ以上の画像パ
    ターンを入力パターンとして記憶するためのパターン記
    憶部と、認識する対象である複数の各文字・図形カテゴリ毎に1
    つの多値パターンを用 意し、この多値パターンを異なる
    複数のしきい値により二値化することにより得られ複数
    のパターンをそれぞれ有する複数の辞書を作成し、 画像
    パターンの劣化の程度を表す指数である劣化指数毎に複
    数の学習パターンをそれぞれ有する複数の劣化学習パタ
    ーンを順次選択して、作成した前記複数の辞書を用いて
    パターン認識を行い、最大の認識率が得られた辞書に、
    その劣化学習パターンの劣化指数を対応づける辞書作成
    部と、 前記辞書作成部により生成された複数の辞書および前記
    複数の辞書の中から予め任意に選択した1つの辞書であ
    る初期辞書を記憶するための辞書記憶部と、 前記パターン記憶部から認識すべき入力パターンを読み
    込み、前記辞書記憶部に記憶されている初期辞書に含ま
    れている複数の参照パターンの中から、前記入力パター
    ンと最も近似している参照パターンを選び出し最近傍参
    照パターンとし、該最近傍参照パターンと前記入力パタ
    ーンの黒画素数の比を劣化指数として推定する劣化指数
    推定部と、 前記劣化指数推定部によって推定された劣化指数と前記
    辞書記憶部に記憶されている複数の辞書を比較し、前記
    劣化指数に対応した辞書の辞書番号を選択する辞書選択
    部と、 前記辞書選択部によって選択された辞書番号の辞書を前
    記辞書記憶部から入力し、該辞書と前記入力パターンを
    照合することによりパターン認識を行う認識部とを有す
    るパターン認識装置。
  5. 【請求項5】 1つもしくはそれ以上の画像パターンか
    らなる入力パターンを認識するパターン認識方法をコン
    ピュータに実行させるためのプログラムを記録した記録
    媒体において、認識する対象である複数の各文字・図形カテゴリ毎に1
    つの多値パターンを用意し、この多値パターンを異なる
    複数のしきい値により二値化することにより得られ複数
    のパターンをそれぞれ有する複数の辞書を作成し、 画像
    パターンの劣化の程度を表す指数である劣化指数毎に複
    数の学習パターンをそれぞれ有する複数の劣化学習パタ
    ーンを順次選択して、作成した前記複数の辞書を用いて
    パターン認識を行い、最大の認識率が得られた辞書に、
    その劣化学習パターンの劣化指数を対応づけて記憶して
    おく辞書作成過程と、 前記入力パターンの劣化指数を 推定する劣化指数推定過
    程と、予め作成された前記 複数の辞書の中から、推定された該
    劣化指数に対応した辞書を選択する辞書選択過程と、 選択された前記辞書を用いて前記入力パターンのパター
    ン認識を行う認識過程とを有するパターン認識方法をコ
    ンピュータに実行させるためのプログラムを記録した記
    録媒体。
  6. 【請求項6】 前記劣化指数推定過程における前記劣化
    指数を推定する処理方法が、 前記複数の辞書の中から予め任意に選択した1つの辞書
    である初期辞書に含まれる複数の参照パターンのうち前
    記入力パターンに最も近似している参照パターンを最近
    傍参照パターンとして選択し、前記入力パターンを該最
    近傍参照パターンと比較することにより前記劣化指数を
    推定する方法である請求項記載のパターン認識方法を
    コンピュータに実行させるためのプログラムを記録した
    記録媒体。
  7. 【請求項7】 前記入力パターンと最近傍参照パターン
    とを比較することにより前記劣化指数を推定する方法
    が、 前記入力パターンと前記最近傍参照パターンの黒画素数
    の比を求め、該黒画素数の比を前記劣化指数とする方法
    である請求項記載のパターン認識方法をコンピュータ
    に実行させるためのプログラムを記録した記録媒体。
JP34329297A 1997-12-12 1997-12-12 パターン認識方法および装置とパターン認識方法をコンピュータに実行させるためのプログラムを記録した記録媒体 Expired - Fee Related JP3466449B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP34329297A JP3466449B2 (ja) 1997-12-12 1997-12-12 パターン認識方法および装置とパターン認識方法をコンピュータに実行させるためのプログラムを記録した記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP34329297A JP3466449B2 (ja) 1997-12-12 1997-12-12 パターン認識方法および装置とパターン認識方法をコンピュータに実行させるためのプログラムを記録した記録媒体

Publications (2)

Publication Number Publication Date
JPH11175662A JPH11175662A (ja) 1999-07-02
JP3466449B2 true JP3466449B2 (ja) 2003-11-10

Family

ID=18360395

Family Applications (1)

Application Number Title Priority Date Filing Date
JP34329297A Expired - Fee Related JP3466449B2 (ja) 1997-12-12 1997-12-12 パターン認識方法および装置とパターン認識方法をコンピュータに実行させるためのプログラムを記録した記録媒体

Country Status (1)

Country Link
JP (1) JP3466449B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100369051C (zh) * 2005-01-11 2008-02-13 富士通株式会社 灰度字符词典的生成装置
JP4952567B2 (ja) * 2007-12-21 2012-06-13 富士ゼロックス株式会社 画像検索システム、画像検索装置、プログラム
JP4869364B2 (ja) * 2009-02-06 2012-02-08 株式会社東芝 画像処理装置および画像処理方法
JP6390248B2 (ja) * 2014-08-04 2018-09-19 富士通株式会社 情報処理装置、ぼけ具合計算方法、及びプログラム
JP6341059B2 (ja) 2014-10-31 2018-06-13 オムロン株式会社 文字認識装置、文字認識方法、およびプログラム

Also Published As

Publication number Publication date
JPH11175662A (ja) 1999-07-02

Similar Documents

Publication Publication Date Title
US7292375B2 (en) Method and apparatus for color image processing, and a computer product
CN107609549B (zh) 一种自然场景下证件图像的文本检测方法
JP3904840B2 (ja) 多値画像から罫線を抽出する罫線抽出装置
US8265350B2 (en) Method and apparatus for detecting and processing specific pattern from image
JP4031210B2 (ja) 文字認識装置、文字認識方法、及び記録媒体
US5539841A (en) Method for comparing image sections to determine similarity therebetween
US8644616B2 (en) Character recognition
US5640466A (en) Method of deriving wordshapes for subsequent comparison
US6327384B1 (en) Character recognition apparatus and method for recognizing characters
US5781658A (en) Method of thresholding document images
Attivissimo et al. An automatic reader of identity documents
JPH0863546A (ja) 情報抽出方法および画像修復方法並びに画像修復システム
US6813367B1 (en) Method and apparatus for site selection for data embedding
EP2545498B1 (en) Resolution adjustment of an image that includes text undergoing an ocr process
JP3466449B2 (ja) パターン認識方法および装置とパターン認識方法をコンピュータに実行させるためのプログラムを記録した記録媒体
CN115410191B (zh) 文本图像识别方法、装置、设备和存储介质
EP1296283A2 (en) Half-tone dot elimination method and system thereof
Rampurkar et al. An approach towards text detection from complex images using morphological techniques
Ozawa et al. A character image enhancement method from characters with various background images
US7599556B2 (en) Apparatus, system, and method for scanning segmentation
JP2700131B2 (ja) パターン認識方法
Bern et al. Scanner-model-based document image improvement
Bal et al. Interactive degraded document enhancement and ground truth generation
JP4841881B2 (ja) 文字認識プログラム、文字認識装置及び文字認識方法
Winger et al. Low-complexity character extraction in low-contrast scene images

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080829

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080829

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090829

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees