JPH11175662A - パターン認識方法および装置とパターン認識方法をコンピュータに実行させるためのプログラムを記録した記録媒体 - Google Patents
パターン認識方法および装置とパターン認識方法をコンピュータに実行させるためのプログラムを記録した記録媒体Info
- Publication number
- JPH11175662A JPH11175662A JP9343292A JP34329297A JPH11175662A JP H11175662 A JPH11175662 A JP H11175662A JP 9343292 A JP9343292 A JP 9343292A JP 34329297 A JP34329297 A JP 34329297A JP H11175662 A JPH11175662 A JP H11175662A
- Authority
- JP
- Japan
- Prior art keywords
- pattern
- dictionary
- deterioration index
- recognition
- deterioration
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Character Discrimination (AREA)
Abstract
(57)【要約】
【課題】 劣化が大きな入力パターンの認識率を向上さ
せる。 【解決手段】 劣化指数推定部3において入力パターン
の劣化指数を推定し、辞書選択部4では、辞書記憶部2
を検索することにより劣化指数に対応した辞書の辞書番
号102を出力する。認識部5では、辞書番号102に
よって示される辞書を辞書記憶部2から読み込み入力パ
ターンの認識を行うことにより、入力パターンの劣化に
対応した参照パターンを用いたパターン認識が行われ認
識率が向上する。
せる。 【解決手段】 劣化指数推定部3において入力パターン
の劣化指数を推定し、辞書選択部4では、辞書記憶部2
を検索することにより劣化指数に対応した辞書の辞書番
号102を出力する。認識部5では、辞書番号102に
よって示される辞書を辞書記憶部2から読み込み入力パ
ターンの認識を行うことにより、入力パターンの劣化に
対応した参照パターンを用いたパターン認識が行われ認
識率が向上する。
Description
【0001】
【発明の属する技術分野】本発明は、文字や図形などが
1つもしくはそれ以上含まれている入力パターンの認識
を行うパターン認識方法に関し、特に入力パターンが劣
化した場合の認識率の向上を図るための方法に関する。
1つもしくはそれ以上含まれている入力パターンの認識
を行うパターン認識方法に関し、特に入力パターンが劣
化した場合の認識率の向上を図るための方法に関する。
【0002】
【従来の技術】OCR(Optical Charac
ter Reader:光学式文字読取り装置)等に用
いられているパターン認識方法は、印刷漢字、手書き漢
字、英数字、記号、数式、図形など多くの文字・図形カ
テゴリの入力パターンを認識する対象としている。
ter Reader:光学式文字読取り装置)等に用
いられているパターン認識方法は、印刷漢字、手書き漢
字、英数字、記号、数式、図形など多くの文字・図形カ
テゴリの入力パターンを認識する対象としている。
【0003】従来、文字認識処理装置や図面認識装置で
は、情景内文字のような劣化が大きなパターンを認識す
る場合に、パターンの単色性および複雑さなどのヒュー
リスティックな特徴に基づいて画像から認識すべき領域
を抽出し、その後に既存の認識手法により認識を行う場
合が多い。これらの手法では、前処理により認識しやす
い状態のパターンを抽出することに重点がおかれ、その
後段にくる認識部分については余り考察されてこなかっ
た。
は、情景内文字のような劣化が大きなパターンを認識す
る場合に、パターンの単色性および複雑さなどのヒュー
リスティックな特徴に基づいて画像から認識すべき領域
を抽出し、その後に既存の認識手法により認識を行う場
合が多い。これらの手法では、前処理により認識しやす
い状態のパターンを抽出することに重点がおかれ、その
後段にくる認識部分については余り考察されてこなかっ
た。
【0004】しかし、情景内文字のような劣化が大きな
パターンは、既存の文字認識処理装置や図面認識処理装
置が対象とするようなパターンとはその性質が大きく異
なる。例えば、情景内の文字を例にとると、文字部分と
背景部分のコントラストが低い場合や、画像の部分によ
って文字と背景の条件が異なる場合がある上に、照明状
況などの観測条件が大きく変化するために、観測された
文字は、大きく劣化したり、汚れやかすれなどの雑音が
残ることがしばしば起こる。そのために、単純な類似度
を用いた照合や、あるいは比較的雑音に強いと言われる
補完類似度による照合を用いても、これらの文字を認識
した場合には、必ずしも高い認識率が得られない。
パターンは、既存の文字認識処理装置や図面認識処理装
置が対象とするようなパターンとはその性質が大きく異
なる。例えば、情景内の文字を例にとると、文字部分と
背景部分のコントラストが低い場合や、画像の部分によ
って文字と背景の条件が異なる場合がある上に、照明状
況などの観測条件が大きく変化するために、観測された
文字は、大きく劣化したり、汚れやかすれなどの雑音が
残ることがしばしば起こる。そのために、単純な類似度
を用いた照合や、あるいは比較的雑音に強いと言われる
補完類似度による照合を用いても、これらの文字を認識
した場合には、必ずしも高い認識率が得られない。
【0005】これらの大きな劣化を吸収するためには、
劣化に不変な特徴量もしくは識別関数を用いる手法が提
案されている。例えば、文字の輪郭方向に基づいた特徴
量は字形劣化にロバストであることが報告されている。
また、参照パターンを変形させて入力パターンと照合す
る手法の検討もなされている。しかし、これらの手法
は、汚れやかすれのような雑音に影響を受けやすいた
め、劣化したパターンを十分な認識精度で認識すること
ができない。
劣化に不変な特徴量もしくは識別関数を用いる手法が提
案されている。例えば、文字の輪郭方向に基づいた特徴
量は字形劣化にロバストであることが報告されている。
また、参照パターンを変形させて入力パターンと照合す
る手法の検討もなされている。しかし、これらの手法
は、汚れやかすれのような雑音に影響を受けやすいた
め、劣化したパターンを十分な認識精度で認識すること
ができない。
【0006】
【発明が解決しようとする課題】上述した従来のパター
ン認識方法では、劣化が大きな入力パターンを正しく認
識することができないという問題点があった。
ン認識方法では、劣化が大きな入力パターンを正しく認
識することができないという問題点があった。
【0007】本発明の目的は、劣化が大きな入力パター
ンの認識率を向上することができるパターン認識方法お
よび装置を提供することである。
ンの認識率を向上することができるパターン認識方法お
よび装置を提供することである。
【0008】
【課題を解決するための手段】上記目的を達成するため
に、本発明のパターン認識方法は、1つもしくはそれ以
上の画像パターンからなる入力パターンを認識するパタ
ーン認識方法において、画像パターンの劣化の程度を表
す指数である劣化指数を、前記入力パターンに対して推
定する劣化指数推定過程と、認識する対象である複数の
文字・図形カテゴリからなる画像パターンである参照パ
ターンを劣化指数毎に複数有した複数の辞書の中から、
推定された該劣化指数に対応した辞書を選択する辞書選
択過程と、選択された前記辞書を用いて前記入力パター
ンのパターン認識を行う認識過程を有することを特徴と
する。
に、本発明のパターン認識方法は、1つもしくはそれ以
上の画像パターンからなる入力パターンを認識するパタ
ーン認識方法において、画像パターンの劣化の程度を表
す指数である劣化指数を、前記入力パターンに対して推
定する劣化指数推定過程と、認識する対象である複数の
文字・図形カテゴリからなる画像パターンである参照パ
ターンを劣化指数毎に複数有した複数の辞書の中から、
推定された該劣化指数に対応した辞書を選択する辞書選
択過程と、選択された前記辞書を用いて前記入力パター
ンのパターン認識を行う認識過程を有することを特徴と
する。
【0009】本発明は、入力パターンに対する劣化指数
を推定し、劣化指数毎に用意された複数の辞書の中から
適切な辞書を選択し、その辞書を用いてその入力パター
ンのパターン認識を行うようにする。
を推定し、劣化指数毎に用意された複数の辞書の中から
適切な辞書を選択し、その辞書を用いてその入力パター
ンのパターン認識を行うようにする。
【0010】したがって、パターン認識を行う入力パタ
ーンの劣化の程度に応じた参照パターンを用いてパター
ン認識を行うことができ認識率を向上することができ
る。
ーンの劣化の程度に応じた参照パターンを用いてパター
ン認識を行うことができ認識率を向上することができ
る。
【0011】また、請求項2記載のパターン認識方法
は、前記劣化指数推定過程における前記劣化指数を推定
する方法が、前記複数の辞書の中から予め任意に選択し
た1つの辞書である初期辞書に含まれる複数の参照パタ
ーンのうち前記入力パターンに最も近似している参照パ
ターンを最近傍参照パターンとして選択し、前記入力パ
ターンを該最近傍参照パターンと比較することにより前
記劣化指数を推定する方法である。
は、前記劣化指数推定過程における前記劣化指数を推定
する方法が、前記複数の辞書の中から予め任意に選択し
た1つの辞書である初期辞書に含まれる複数の参照パタ
ーンのうち前記入力パターンに最も近似している参照パ
ターンを最近傍参照パターンとして選択し、前記入力パ
ターンを該最近傍参照パターンと比較することにより前
記劣化指数を推定する方法である。
【0012】本発明は、最近傍参照パターンを用いて入
力パターンの劣化指数を推定するので、劣化指数を安定
して推定することができる。
力パターンの劣化指数を推定するので、劣化指数を安定
して推定することができる。
【0013】また、請求項3記載のパターン認識方法
は、前記入力パターンと最近傍参照パターンとを比較す
ることにより前記劣化指数を推定する方法が、前記入力
パターンと前記最近傍参照パターンの黒画素数の比を求
め、該黒画素数の比を前記劣化指数とする方法である。
は、前記入力パターンと最近傍参照パターンとを比較す
ることにより前記劣化指数を推定する方法が、前記入力
パターンと前記最近傍参照パターンの黒画素数の比を求
め、該黒画素数の比を前記劣化指数とする方法である。
【0014】本発明は、最近傍参照パターンと入力パタ
ーンの黒画素数の比を求め、その比を入力パターンの劣
化指数として推定するので、劣化指数を安定して推定す
ることができる。
ーンの黒画素数の比を求め、その比を入力パターンの劣
化指数として推定するので、劣化指数を安定して推定す
ることができる。
【0015】上記目的を達成するために、請求項4記載
のパターン認識装置は、認識される1もしくはそれ以上
の画像パターンを入力パターンとして記憶するためのパ
ターン記憶部と、認識する対象である複数の文字・図形
カテゴリからなる画像パターンである参照パターンを劣
化指数毎に複数有した複数の辞書および前記複数の辞書
の中から予め任意に選択した1つの辞書である初期辞書
を記憶するための辞書記憶部と、前記パターン記憶部か
ら認識すべき入力パターンを読み込み、前記辞書記憶部
に記憶されている初期辞書に含まれている複数の参照パ
ターンの中から、前記入力パターンと最も近似している
参照パターンを選び出し最近傍参照パターンとし、該最
近傍参照パターンと前記入力パターンの黒画素数の比を
劣化指数として推定する劣化指数推定部と、前記劣化指
数推定部によって推定された劣化指数と前記辞書記憶部
に記憶されている複数の辞書を比較し、前記劣化指数に
対応した辞書の辞書番号を選択する辞書選択部と、前記
辞書選択部によって選択された辞書番号の辞書を前記辞
書記憶部から入力し、該辞書と前記入力パターンを照合
することによりパターン認識を行う認識部とを有する。
のパターン認識装置は、認識される1もしくはそれ以上
の画像パターンを入力パターンとして記憶するためのパ
ターン記憶部と、認識する対象である複数の文字・図形
カテゴリからなる画像パターンである参照パターンを劣
化指数毎に複数有した複数の辞書および前記複数の辞書
の中から予め任意に選択した1つの辞書である初期辞書
を記憶するための辞書記憶部と、前記パターン記憶部か
ら認識すべき入力パターンを読み込み、前記辞書記憶部
に記憶されている初期辞書に含まれている複数の参照パ
ターンの中から、前記入力パターンと最も近似している
参照パターンを選び出し最近傍参照パターンとし、該最
近傍参照パターンと前記入力パターンの黒画素数の比を
劣化指数として推定する劣化指数推定部と、前記劣化指
数推定部によって推定された劣化指数と前記辞書記憶部
に記憶されている複数の辞書を比較し、前記劣化指数に
対応した辞書の辞書番号を選択する辞書選択部と、前記
辞書選択部によって選択された辞書番号の辞書を前記辞
書記憶部から入力し、該辞書と前記入力パターンを照合
することによりパターン認識を行う認識部とを有する。
【0016】また、本発明のパターン認識装置は、複数
の劣化指数の画像パターンを学習パターンとして記憶し
ている学習パターン記憶部と、前記学習パターン記憶部
に記憶されている学習パターンから、劣化指数が同じで
ある複数の学習パターンを参照パターンとして記憶する
複数の辞書を劣化指数毎に作成し、該辞書のうちの任意
の1つを初期辞書として設定する辞書作成部とをさらに
有する。
の劣化指数の画像パターンを学習パターンとして記憶し
ている学習パターン記憶部と、前記学習パターン記憶部
に記憶されている学習パターンから、劣化指数が同じで
ある複数の学習パターンを参照パターンとして記憶する
複数の辞書を劣化指数毎に作成し、該辞書のうちの任意
の1つを初期辞書として設定する辞書作成部とをさらに
有する。
【0017】
【発明の実施の形態】次に、本発明の実施形態について
図面を参照して詳細に説明する。
図面を参照して詳細に説明する。
【0018】図1は本発明の一実施形態のパターン認識
装置の構成を示すブロック図である。
装置の構成を示すブロック図である。
【0019】本実施形態のパターン認識装置は、パター
ン記憶部1と、辞書記憶部2と、劣化指数推定部3と、
辞書選択部4と、認識部5と、辞書作成部6と、学習パ
ターン記憶部7とから構成されている。
ン記憶部1と、辞書記憶部2と、劣化指数推定部3と、
辞書選択部4と、認識部5と、辞書作成部6と、学習パ
ターン記憶部7とから構成されている。
【0020】パターン記憶部1は、認識される1もしく
はそれ以上の画像パターンを入力パターンとして記憶し
ている。これらの画像パターンはn画素からなり、例え
ば、2値画像パターンの場合には各画素は「0」または
「1」で示されている。また、例えば、多値パターンの
場合には各画素は0から1の間の実数値で示されてい
る。
はそれ以上の画像パターンを入力パターンとして記憶し
ている。これらの画像パターンはn画素からなり、例え
ば、2値画像パターンの場合には各画素は「0」または
「1」で示されている。また、例えば、多値パターンの
場合には各画素は0から1の間の実数値で示されてい
る。
【0021】学習パターン記憶部7は、様々な劣化指数
の学習パターンを記憶している。ここで、劣化指数と
は、入力パターンの劣化の程度を表わした指数である。
また、学習パターンはn画素からなり、例えば、2値画
像パターンの場合には各画素は「0」または「1」で示
されている。また、例えば、学習パターンが、多値パタ
ーンの場合には各画素は0から1の間の実数値で示され
ている。
の学習パターンを記憶している。ここで、劣化指数と
は、入力パターンの劣化の程度を表わした指数である。
また、学習パターンはn画素からなり、例えば、2値画
像パターンの場合には各画素は「0」または「1」で示
されている。また、例えば、学習パターンが、多値パタ
ーンの場合には各画素は0から1の間の実数値で示され
ている。
【0022】辞書作成部6では、学習パターン記憶部7
に記憶されている学習パターンから、同じ劣化指数を有
する学習パターンを参照パターンとして記憶する辞書を
劣化指数毎に作成する。そして、その辞書のうちの任意
の1つを初期辞書として設定する。初期辞書は、任意に
選択辞書としたが、通常は劣化の少ない奇麗な学習パタ
ーンを参照パターンとして記憶している辞書を初期辞書
に設定する。
に記憶されている学習パターンから、同じ劣化指数を有
する学習パターンを参照パターンとして記憶する辞書を
劣化指数毎に作成する。そして、その辞書のうちの任意
の1つを初期辞書として設定する。初期辞書は、任意に
選択辞書としたが、通常は劣化の少ない奇麗な学習パタ
ーンを参照パターンとして記憶している辞書を初期辞書
に設定する。
【0023】辞書記憶部2は、辞書作成部6によって作
成された劣化指数毎の辞書を記憶している。ここで、辞
書記憶部2に記憶されている辞書には初期辞書も当然含
まれている。
成された劣化指数毎の辞書を記憶している。ここで、辞
書記憶部2に記憶されている辞書には初期辞書も当然含
まれている。
【0024】劣化指数推定部3は、パターン記憶部1か
ら認識すべき入力パターンを読み込み、その入力パター
ンの劣化指数101を求め、その劣化指数101を辞書
選択部4に出力する。ここで、劣化指数推定部3が劣化
指数を求める具体的な方法を下記に述べる。
ら認識すべき入力パターンを読み込み、その入力パター
ンの劣化指数101を求め、その劣化指数101を辞書
選択部4に出力する。ここで、劣化指数推定部3が劣化
指数を求める具体的な方法を下記に述べる。
【0025】先ず、劣化指数推定部3は、辞書記憶部2
に記憶されている初期辞書に含まれている複数の参照パ
ターンの中から、入力パターンと最も近似している参照
パターンを選び出し最近傍参照パターンとする。そし
て、その最近傍参照パターンと入力パターンの黒画素数
の比を劣化指数101とする。一般に、劣化は汚れとか
すれの2種類に大別され、同時に起こることは稀である
ことが報告されているため、黒画素数比により、劣化の
度合いを近似的に表すことができる。入力パターンと最
近傍参照パターンの照合の方法としては、例えば、既存
の方法である補完類似度によるずらし照合を行う。
に記憶されている初期辞書に含まれている複数の参照パ
ターンの中から、入力パターンと最も近似している参照
パターンを選び出し最近傍参照パターンとする。そし
て、その最近傍参照パターンと入力パターンの黒画素数
の比を劣化指数101とする。一般に、劣化は汚れとか
すれの2種類に大別され、同時に起こることは稀である
ことが報告されているため、黒画素数比により、劣化の
度合いを近似的に表すことができる。入力パターンと最
近傍参照パターンの照合の方法としては、例えば、既存
の方法である補完類似度によるずらし照合を行う。
【0026】このように、入力パターンと最近傍パター
ンの黒画素数の比を劣化指数としているため、初期辞書
に含まれる参照パターンの劣化指数は1となる。
ンの黒画素数の比を劣化指数としているため、初期辞書
に含まれる参照パターンの劣化指数は1となる。
【0027】辞書選択部4は、劣化指数推定部3から出
力された劣化指数101と辞書記憶部2に記憶されてい
る複数の辞書を比較し、入力された劣化指数101に対
応した辞書の辞書番号102を選択して認識部5に出力
する。
力された劣化指数101と辞書記憶部2に記憶されてい
る複数の辞書を比較し、入力された劣化指数101に対
応した辞書の辞書番号102を選択して認識部5に出力
する。
【0028】認識部5では、辞書選択部4から入力され
た辞書番号102の辞書を辞書記憶部2から入力し、そ
の辞書と入力パターンを照合することによりパターン認
識を行いその認識結果を出力する。
た辞書番号102の辞書を辞書記憶部2から入力し、そ
の辞書と入力パターンを照合することによりパターン認
識を行いその認識結果を出力する。
【0029】次に、本実施形態のパターン認識装置の動
作を図2の具体的な入力パターンのパターン認識を行う
場合について図3のフローチャートを用いて説明する。
作を図2の具体的な入力パターンのパターン認識を行う
場合について図3のフローチャートを用いて説明する。
【0030】先ず、劣化指数推定部3は、図2に示され
ている3種類の入力パターン201、202、203に
対し、辞書記憶部2に記憶されている初期辞書の参照パ
ターンから最近傍参照パターン204を選択したとする
(ステップ301)。その場合、例えば、入力パターン
201、202、203と最近傍参照パターン204の
黒画素数の比を劣化指数とする。この例では、入力パタ
ーン202と最近傍参照パターン204の黒画素の数は
等しいため、入力パターン202の劣化指数は1と推定
される。また、入力パターン201、203に対して
は、それぞれ1よりも小さい劣化指数、1よりも大きい
劣化指数が推定される(ステップ302)。
ている3種類の入力パターン201、202、203に
対し、辞書記憶部2に記憶されている初期辞書の参照パ
ターンから最近傍参照パターン204を選択したとする
(ステップ301)。その場合、例えば、入力パターン
201、202、203と最近傍参照パターン204の
黒画素数の比を劣化指数とする。この例では、入力パタ
ーン202と最近傍参照パターン204の黒画素の数は
等しいため、入力パターン202の劣化指数は1と推定
される。また、入力パターン201、203に対して
は、それぞれ1よりも小さい劣化指数、1よりも大きい
劣化指数が推定される(ステップ302)。
【0031】1つの入力パターン内に複数のパターンが
存在する場合には、それぞれのパターンごとに劣化指数
を推定し、その劣化指数の平均を入力パターン全体の劣
化指数とすることにより、初期辞書による認識誤りの影
響を少なくし、安定して劣化指数を推定することができ
る。
存在する場合には、それぞれのパターンごとに劣化指数
を推定し、その劣化指数の平均を入力パターン全体の劣
化指数とすることにより、初期辞書による認識誤りの影
響を少なくし、安定して劣化指数を推定することができ
る。
【0032】このようにして、劣化指数推定部3により
求められた劣化指数101は、辞書選択部4に入力され
る。
求められた劣化指数101は、辞書選択部4に入力され
る。
【0033】辞書選択部4は、入力された劣化指数10
1と辞書記憶部2に記憶されている複数の辞書を比較
し、入力された劣化指数に対応した辞書番号102を選
択し、認識部5に出力する(ステップ303)。
1と辞書記憶部2に記憶されている複数の辞書を比較
し、入力された劣化指数に対応した辞書番号102を選
択し、認識部5に出力する(ステップ303)。
【0034】認識部5では、入力された辞書番号102
の辞書を、辞書記憶部2から読み出し、入力パターンと
照合する。照合の際には、例えば、単純類似度や補完類
似度によるずらし照合を行う。次に、照合した結果を認
識結果として出力する。結果の出力の前に、言語処理な
どの後処理を加えてもよい(ステップ304)。
の辞書を、辞書記憶部2から読み出し、入力パターンと
照合する。照合の際には、例えば、単純類似度や補完類
似度によるずらし照合を行う。次に、照合した結果を認
識結果として出力する。結果の出力の前に、言語処理な
どの後処理を加えてもよい(ステップ304)。
【0035】次に、辞書作成部6により初期辞書を含む
辞書が生成される過程を詳しく説明する。図4は、辞書
作成部6によって行われる辞書作成の過程を示したフロ
ーチャートである。
辞書が生成される過程を詳しく説明する。図4は、辞書
作成部6によって行われる辞書作成の過程を示したフロ
ーチャートである。
【0036】先ず、学習パターン記憶部7に記憶されて
いる学習パターンのカテゴリごとに平均パターンを作成
し、それらを異なったしきい値で二値化することにより
複数の辞書D1〜DMを作成する。しきい値は、例え
ば、0から1の間で0.1刻みで設定する(ステップ4
01)。
いる学習パターンのカテゴリごとに平均パターンを作成
し、それらを異なったしきい値で二値化することにより
複数の辞書D1〜DMを作成する。しきい値は、例え
ば、0から1の間で0.1刻みで設定する(ステップ4
01)。
【0037】次に、各劣化指数の劣化学習パターンL1
〜LMを作成する。例えば、初期辞書内の同じカテゴリ
の参照パターンとの黒画素の比を劣化指数とすると、あ
らかじめ学習パターン部7に蓄えられている学習パター
ンを、膨張させたり収縮させて黒画素数を変化させるこ
とにより、それぞれの劣化指数に対応する劣化学習パタ
ーンを作成することができる。ここで、初期辞書と同じ
黒画素数の劣化学習パターンは、劣化指数1となる(ス
テップ402)。
〜LMを作成する。例えば、初期辞書内の同じカテゴリ
の参照パターンとの黒画素の比を劣化指数とすると、あ
らかじめ学習パターン部7に蓄えられている学習パター
ンを、膨張させたり収縮させて黒画素数を変化させるこ
とにより、それぞれの劣化指数に対応する劣化学習パタ
ーンを作成することができる。ここで、初期辞書と同じ
黒画素数の劣化学習パターンは、劣化指数1となる(ス
テップ402)。
【0038】次に、それぞれの劣化学習パターンL1〜
LMを順番に1つづつ選択して、各辞書D1〜DMによ
る認識を行う。そして、最大の認識率をとった辞書に、
その劣化学習パターンと同じ劣化指数を付与する。この
ため、1つの辞書に複数の劣化指数が付与されることも
生じる(ステップ404〜408)。
LMを順番に1つづつ選択して、各辞書D1〜DMによ
る認識を行う。そして、最大の認識率をとった辞書に、
その劣化学習パターンと同じ劣化指数を付与する。この
ため、1つの辞書に複数の劣化指数が付与されることも
生じる(ステップ404〜408)。
【0039】次に、図5に本実施形態における、パター
ン認識動作の概念図を示す。
ン認識動作の概念図を示す。
【0040】先ず、パターン認識の前に劣化指数R1〜
RNに対応した辞書1〜Nが準備されている。“AB
C”という入力パターンが入力されると、劣化指数Ri
が推定され、その劣化指数Riに対応した辞書iが選択
される。そして、その選択された辞書iを用いて入力パ
ターン“ABC”の認識が行われ、認識結果が出力され
る。
RNに対応した辞書1〜Nが準備されている。“AB
C”という入力パターンが入力されると、劣化指数Ri
が推定され、その劣化指数Riに対応した辞書iが選択
される。そして、その選択された辞書iを用いて入力パ
ターン“ABC”の認識が行われ、認識結果が出力され
る。
【0041】次に、本実施形態のパターン認識装置を用
いて、本棚上の雑誌の背に印刷された文字を認識する例
について説明する。
いて、本棚上の雑誌の背に印刷された文字を認識する例
について説明する。
【0042】図6に、パターン認識処理のフローチャー
トを示す。パターン認識処理は大きく分けて、前処理
部、認識部、後処理部からなる。ここで、本実施形態
は、認識部に使われている。
トを示す。パターン認識処理は大きく分けて、前処理
部、認識部、後処理部からなる。ここで、本実施形態
は、認識部に使われている。
【0043】(1)前処理部 二値化(ステップ601) デジタルカメラで入力されたカラー画像を濃淡画像に変
換した後に、適当なしきい値で二値化する。濃淡画像の
例を図7の画像701に、二値化された画像の例を図7
の画像702に示す。画像701では、実際の濃淡画像
を表現することが困難なため、濃淡画像を簡易的に画像
701のように表わしている。
換した後に、適当なしきい値で二値化する。濃淡画像の
例を図7の画像701に、二値化された画像の例を図7
の画像702に示す。画像701では、実際の濃淡画像
を表現することが困難なため、濃淡画像を簡易的に画像
701のように表わしている。
【0044】傾き抽出(ステップ602) 本棚上の本や雑誌は、しばしば傾いて置かれているた
め、傾き補正を行う。本の境界部分には、影により黒っ
ぽい線が入るため、例えば、ランレングスに基づいて本
の境界部分を検出し、その傾き角を求める。
め、傾き補正を行う。本の境界部分には、影により黒っ
ぽい線が入るため、例えば、ランレングスに基づいて本
の境界部分を検出し、その傾き角を求める。
【0045】具体的な例としては、まず、境界部分の黒
画素の連結(ラン)が雑音などにより分断される場合が
あるため、それをつなぐために二値画像を垂直方法に上
下2画素ずつ膨張させる。その画像上の各x座標(x軸
は水平方向とする)において、垂直方向に対し±2度の
間の0.2度刻みで複数回走査し、最大ランレングスを
与える角度をそのx座標における傾き角とする。また、
最大ランレングスが一定値以上の部分を本の境界線とす
る。
画素の連結(ラン)が雑音などにより分断される場合が
あるため、それをつなぐために二値画像を垂直方法に上
下2画素ずつ膨張させる。その画像上の各x座標(x軸
は水平方向とする)において、垂直方向に対し±2度の
間の0.2度刻みで複数回走査し、最大ランレングスを
与える角度をそのx座標における傾き角とする。また、
最大ランレングスが一定値以上の部分を本の境界線とす
る。
【0046】射影による文字列抽出(ステップ60
3) 次に、境界部分で囲まれた範囲の中の文字列の幅を求め
る。文字列抽出には、例えば、文字列部分は、背景部分
に比べ、エッジ部分が多いと仮定し、白黒反転回数によ
り文字列部分を特定する。
3) 次に、境界部分で囲まれた範囲の中の文字列の幅を求め
る。文字列抽出には、例えば、文字列部分は、背景部分
に比べ、エッジ部分が多いと仮定し、白黒反転回数によ
り文字列部分を特定する。
【0047】具体的例としては、各x座標において、求
められた傾き角に応じた方向に走査し、画素値の黒白の
反転回数の射影分布をとる。この回数が、一定値より多
い範囲を文字列領域とする。求められた文字列領域の幅
の中心のx座標における傾き角をその文字列領域の傾き
角とし、その角度に応じて文字列画像を回転し、傾き補
正を行う。図7の画像703には、この処理で抽出され
た文字列を矩形領域として示してある。
められた傾き角に応じた方向に走査し、画素値の黒白の
反転回数の射影分布をとる。この回数が、一定値より多
い範囲を文字列領域とする。求められた文字列領域の幅
の中心のx座標における傾き角をその文字列領域の傾き
角とし、その角度に応じて文字列画像を回転し、傾き補
正を行う。図7の画像703には、この処理で抽出され
た文字列を矩形領域として示してある。
【0048】(2)認識部 初期辞書による認識(ステップ604) 得られた傾き補正後の文字列画像中の文字は、例えば、
ずらし照合により認識する。各文字列上を認識用観測窓
710を垂直方向に走査し、各認識用観測窓710と初
期辞書内の参照パターンとの照合を行う。また、照合に
は例えば、補完類似度を用い、位置ずれを考慮して垂直
方向のみでなく水平方向への走査も行う。照合した各位
置での最大類似度があらかじめ学習してある各文字カテ
ゴリの類似度しきい値を越えた場合、そのカテゴリを初
期辞書による認識結果とする。初期辞書による認識を行
った際の、最大類似度分布および最大類似度をとった参
照パターンおよびそのカテゴリを図7の704に左から
順に示す。
ずらし照合により認識する。各文字列上を認識用観測窓
710を垂直方向に走査し、各認識用観測窓710と初
期辞書内の参照パターンとの照合を行う。また、照合に
は例えば、補完類似度を用い、位置ずれを考慮して垂直
方向のみでなく水平方向への走査も行う。照合した各位
置での最大類似度があらかじめ学習してある各文字カテ
ゴリの類似度しきい値を越えた場合、そのカテゴリを初
期辞書による認識結果とする。初期辞書による認識を行
った際の、最大類似度分布および最大類似度をとった参
照パターンおよびそのカテゴリを図7の704に左から
順に示す。
【0049】劣化状態に対応した辞書の選択(ステッ
プ605) 初期辞書による認識結果から入力画像の劣化指数を推定
する。ここでは、複数文字が存在するため、各文字ごと
に推定された劣化指数の平均値をとり、その文字列の劣
化指数とする。その後に、劣化指数に対応する辞書を選
択する。
プ605) 初期辞書による認識結果から入力画像の劣化指数を推定
する。ここでは、複数文字が存在するため、各文字ごと
に推定された劣化指数の平均値をとり、その文字列の劣
化指数とする。その後に、劣化指数に対応する辞書を選
択する。
【0050】選択された辞書による認識(ステップ6
06) 選択された辞書を用いて、ずらし照合を再度文字列画像
に適用して文字を認識する。選択された辞書による認識
を行った際の、最大類似度分布および最大類似度をとっ
た参照パターンおよびそのカテゴリを図7の705に左
から順に示す。
06) 選択された辞書を用いて、ずらし照合を再度文字列画像
に適用して文字を認識する。選択された辞書による認識
を行った際の、最大類似度分布および最大類似度をとっ
た参照パターンおよびそのカテゴリを図7の705に左
から順に示す。
【0051】(3)後処理部(ステップ607) ある限られた対象分野での文字認識においては文脈に基
づき後処理が有効である。例えば、あらかじめ登録され
ている連結する可能性のある2カテゴリ(例えば、
[‘e’の後には‘b’か‘c’か‘m’か‘p’か
‘r’しかこない、など」)に基づいた後処理を行い、
認識結果を出力する。後処理の結果の例を図7の認識結
果706に示す。
づき後処理が有効である。例えば、あらかじめ登録され
ている連結する可能性のある2カテゴリ(例えば、
[‘e’の後には‘b’か‘c’か‘m’か‘p’か
‘r’しかこない、など」)に基づいた後処理を行い、
認識結果を出力する。後処理の結果の例を図7の認識結
果706に示す。
【0052】図1には示されていないが、本実施形態の
パターン認識装置は、プログラムを記録した記録媒体を
備えている。この記録媒体は磁気ディスク、半導体メモ
リまたはその他の記録媒体であってもよい。
パターン認識装置は、プログラムを記録した記録媒体を
備えている。この記録媒体は磁気ディスク、半導体メモ
リまたはその他の記録媒体であってもよい。
【0053】このプログラムは、記録媒体からパターン
認識装置に読み込まれ、パターン認識装置の動作を制御
する。パターン認識装置は読み込まれたプログラムの制
御により上記で説明した処理を実行する。
認識装置に読み込まれ、パターン認識装置の動作を制御
する。パターン認識装置は読み込まれたプログラムの制
御により上記で説明した処理を実行する。
【0054】
【発明の効果】以上説明したように、本発明は、入力パ
ターンの劣化状況に応じた辞書を選択してパターン認識
を行うことができ認識率が向上するという効果を有す
る。
ターンの劣化状況に応じた辞書を選択してパターン認識
を行うことができ認識率が向上するという効果を有す
る。
【図1】本発明の一実施形態のパターン認識装置の構成
を示したブロック図である。
を示したブロック図である。
【図2】本発明の一実施形態のパターン認識方法におけ
る劣化指数の推定方法を具体的に示すための図である。
る劣化指数の推定方法を具体的に示すための図である。
【図3】本発明の一実施形態のパターン認識方法におけ
るパターン認識を説明するためのフローチャートであ
る。
るパターン認識を説明するためのフローチャートであ
る。
【図4】本発明の一実施形態のパターン認識方法におけ
る辞書作成方法を説明するためのフローチャートであ
る。
る辞書作成方法を説明するためのフローチャートであ
る。
【図5】本発明の一実施形態のパターン認識方法におけ
る認識の概念図を示した図である。
る認識の概念図を示した図である。
【図6】本発明の一実施形態のパターン認識方法を用い
た情景内文字認識処理の流れを示したフローチャートで
ある。
た情景内文字認識処理の流れを示したフローチャートで
ある。
【図7】本発明の一実施形態のパターン認識方法を用い
た情景内文字認識処理の認識結果の具体例を示した図で
ある。
た情景内文字認識処理の認識結果の具体例を示した図で
ある。
1 パターン記憶部 2 辞書記憶部 3 劣化指数推定部 4 辞書選択部 5 認識部 6 辞書作成部 7 学習パターン記憶部 101 劣化指数 102 辞書番号 201〜203 入力パターン 204 最近傍参照パターン 301〜304 ステップ 401〜408 ステップ 601〜607 ステップ 701〜706 画像、認識結果等 710 認識用観測窓
Claims (8)
- 【請求項1】 1つもしくはそれ以上の画像パターンか
らなる入力パターンを認識するパターン認識方法におい
て、 画像パターンの劣化の程度を表す指数である劣化指数
を、前記入力パターンに対して推定する劣化指数推定過
程と、 認識する対象である複数の文字・図形カテゴリからなる
画像パターンである参照パターンを劣化指数毎に複数有
した複数の辞書の中から、推定された該劣化指数に対応
した辞書を選択する辞書選択過程と、 選択された前記辞書を用いて前記入力パターンのパター
ン認識を行う認識過程を有することを特徴とするパター
ン認識方法。 - 【請求項2】 前記劣化指数推定過程における前記劣化
指数を推定する方法が、 前記複数の辞書の中から予め任意に選択した1つの辞書
である初期辞書に含まれる複数の参照パターンのうち前
記入力パターンに最も近似している参照パターンを最近
傍参照パターンとして選択し、前記入力パターンを該最
近傍参照パターンと比較することにより前記劣化指数を
推定する方法である請求項1記載のパターン認識方法。 - 【請求項3】 前記入力パターンと最近傍参照パターン
とを比較することにより前記劣化指数を推定する方法
が、 前記入力パターンと前記最近傍参照パターンの黒画素数
の比を求め、該黒画素数の比を前記劣化指数とする方法
である請求項2記載のパターン認識装置。 - 【請求項4】 認識される1もしくはそれ以上の画像パ
ターンを入力パターンとして記憶するためのパターン記
憶部と、 認識する対象である複数の文字・図形カテゴリからなる
画像パターンである参照パターンを劣化指数毎に複数有
した複数の辞書および前記複数の辞書の中から予め任意
に選択した1つの辞書である初期辞書を記憶するための
辞書記憶部と、前記パターン記憶部から認識すべき入力
パターンを読み込み、前記辞書記憶部に記憶されている
初期辞書に含まれている複数の参照パターンの中から、
前記入力パターンと最も近似している参照パターンを選
び出し最近傍参照パターンとし、該最近傍参照パターン
と前記入力パターンの黒画素数の比を劣化指数として推
定する劣化指数推定部と、 前記劣化指数推定部によって推定された劣化指数と前記
辞書記憶部に記憶されている複数の辞書を比較し、前記
劣化指数に対応した辞書の辞書番号を選択する辞書選択
部と、 前記辞書選択部によって選択された辞書番号の辞書を前
記辞書記憶部から入力し、該辞書と前記入力パターンを
照合することによりパターン認識を行う認識部とを有す
るパターン認識装置。 - 【請求項5】 複数の劣化指数の画像パターンを学習パ
ターンとして記憶している学習パターン記憶部と、 前記学習パターン記憶部に記憶されている学習パターン
から、劣化指数が同じである複数の学習パターンを参照
パターンとして記憶する複数の辞書を劣化指数毎に作成
し、該辞書のうちの任意の1つを初期辞書として設定す
る辞書作成部とをさらに有する請求項記載のパターン認
識装置。 - 【請求項6】 1つもしくはそれ以上の画像パターンか
らなる入力パターンを認識するパターン認識方法をコン
ピュータに実行させるためのプログラムを記録した記録
媒体において、 画像パターンの劣化の程度を表す指数である劣化指数
を、前記入力パターンに対して推定する劣化指数推定過
程と、 認識する対象である複数の文字・図形カテゴリからなる
画像パターンである参照パターンを劣化指数毎に複数有
した複数の辞書の中から、推定された該劣化指数に対応
した辞書を選択する辞書選択過程と、 選択された前記辞書を用いて前記入力パターンのパター
ン認識を行う認識過程とを有するパターン認識方法をコ
ンピュータに実行させるためのプログラムを記録した記
録媒体。 - 【請求項7】 前記劣化指数推定過程における前記劣化
指数を推定する処理方法が、 前記複数の辞書の中から予め任意に選択した1つの辞書
である初期辞書に含まれる複数の参照パターンのうち前
記入力パターンに最も近似している参照パターンを最近
傍参照パターンとして選択し、前記入力パターンを該最
近傍参照パターンと比較することにより前記劣化指数を
推定する方法である請求項6記載のパターン認識方法を
コンピュータに実行させるためのプログラムを記録した
記録媒体。 - 【請求項8】 前記入力パターンと最近傍参照パターン
とを比較することにより前記劣化指数を推定する方法
が、 前記入力パターンと前記最近傍参照パターンの黒画素数
の比を求め、該黒画素数の比を前記劣化指数とする方法
である請求項6記載のパターン認識方法をコンピュータ
に実行させるためのプログラムを記録した記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP34329297A JP3466449B2 (ja) | 1997-12-12 | 1997-12-12 | パターン認識方法および装置とパターン認識方法をコンピュータに実行させるためのプログラムを記録した記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP34329297A JP3466449B2 (ja) | 1997-12-12 | 1997-12-12 | パターン認識方法および装置とパターン認識方法をコンピュータに実行させるためのプログラムを記録した記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH11175662A true JPH11175662A (ja) | 1999-07-02 |
JP3466449B2 JP3466449B2 (ja) | 2003-11-10 |
Family
ID=18360395
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP34329297A Expired - Fee Related JP3466449B2 (ja) | 1997-12-12 | 1997-12-12 | パターン認識方法および装置とパターン認識方法をコンピュータに実行させるためのプログラムを記録した記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3466449B2 (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006195991A (ja) * | 2005-01-11 | 2006-07-27 | Fujitsu Ltd | 多値文字辞書生成装置 |
JP2009151609A (ja) * | 2007-12-21 | 2009-07-09 | Fuji Xerox Co Ltd | 画像検索システム、画像検索装置、プログラム |
JP2010182166A (ja) * | 2009-02-06 | 2010-08-19 | Toshiba Corp | 画像処理装置および画像処理方法 |
JP2016035670A (ja) * | 2014-08-04 | 2016-03-17 | 富士通株式会社 | 情報処理装置、ぼけ具合計算方法、及びプログラム |
WO2016068325A1 (ja) * | 2014-10-31 | 2016-05-06 | オムロン株式会社 | 文字認識装置、文字認識方法、およびプログラム |
-
1997
- 1997-12-12 JP JP34329297A patent/JP3466449B2/ja not_active Expired - Fee Related
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006195991A (ja) * | 2005-01-11 | 2006-07-27 | Fujitsu Ltd | 多値文字辞書生成装置 |
JP2009151609A (ja) * | 2007-12-21 | 2009-07-09 | Fuji Xerox Co Ltd | 画像検索システム、画像検索装置、プログラム |
JP2010182166A (ja) * | 2009-02-06 | 2010-08-19 | Toshiba Corp | 画像処理装置および画像処理方法 |
JP2016035670A (ja) * | 2014-08-04 | 2016-03-17 | 富士通株式会社 | 情報処理装置、ぼけ具合計算方法、及びプログラム |
WO2016068325A1 (ja) * | 2014-10-31 | 2016-05-06 | オムロン株式会社 | 文字認識装置、文字認識方法、およびプログラム |
JP2016091186A (ja) * | 2014-10-31 | 2016-05-23 | オムロン株式会社 | 文字認識装置、文字認識方法、およびプログラム |
US10049309B2 (en) | 2014-10-31 | 2018-08-14 | Omron Corporation | Character recognition device, character recognition method and program |
Also Published As
Publication number | Publication date |
---|---|
JP3466449B2 (ja) | 2003-11-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107609549B (zh) | 一种自然场景下证件图像的文本检测方法 | |
US8265350B2 (en) | Method and apparatus for detecting and processing specific pattern from image | |
JP3904840B2 (ja) | 多値画像から罫線を抽出する罫線抽出装置 | |
US7292375B2 (en) | Method and apparatus for color image processing, and a computer product | |
US5539841A (en) | Method for comparing image sections to determine similarity therebetween | |
JP4031210B2 (ja) | 文字認識装置、文字認識方法、及び記録媒体 | |
US9613299B2 (en) | Method of identifying pattern training need during verification of recognized text | |
WO2011142977A2 (en) | Segmentation of a word bitmap into individual characters or glyphs during an ocr process | |
WO2007063705A1 (ja) | パターン認識装置、パターン認識方法、およびパターン認識プログラム | |
CN108830278B (zh) | 一种字符串图像识别方法 | |
US5781658A (en) | Method of thresholding document images | |
JP3851742B2 (ja) | 帳票処理方法及び装置 | |
US6813367B1 (en) | Method and apparatus for site selection for data embedding | |
US8311331B2 (en) | Resolution adjustment of an image that includes text undergoing an OCR process | |
CN115410191B (zh) | 文本图像识别方法、装置、设备和存储介质 | |
JP3466449B2 (ja) | パターン認識方法および装置とパターン認識方法をコンピュータに実行させるためのプログラムを記録した記録媒体 | |
Rampurkar et al. | An approach towards text detection from complex images using morphological techniques | |
JP3215163B2 (ja) | 罫線識別方法及び領域識別方法 | |
JPH08190690A (ja) | ナンバープレート決定方法 | |
JP2001222683A (ja) | 画像処理方法、画像処理装置、文字認識方法、文字認識装置及び記憶媒体 | |
KR101937859B1 (ko) | 360도 이미지에서의 공통 객체 탐색 시스템 및 방법 | |
Timofte et al. | Automatic stave discovery for musical facsimiles | |
JP4471202B2 (ja) | 画像処理装置、画像処理方法及び同方法に用いるプログラム | |
JP2001236467A (ja) | パターン認識方法、装置、およびパターン認識プログラムを記録した記録媒体 | |
JP2003317107A (ja) | 罫線抽出方法及び装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080829 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080829 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090829 Year of fee payment: 6 |
|
LAPS | Cancellation because of no payment of annual fees |