JPH10240866A - 文字認識装置 - Google Patents
文字認識装置Info
- Publication number
- JPH10240866A JPH10240866A JP9039267A JP3926797A JPH10240866A JP H10240866 A JPH10240866 A JP H10240866A JP 9039267 A JP9039267 A JP 9039267A JP 3926797 A JP3926797 A JP 3926797A JP H10240866 A JPH10240866 A JP H10240866A
- Authority
- JP
- Japan
- Prior art keywords
- hypothesis
- character
- input
- difference
- association
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Character Discrimination (AREA)
Abstract
(57)【要約】
【課題】 計算回数が比較的少なくて済み、かつ、文字
切れや掠れがあっても適応基準パターンが得られる。 【解決手段】 入力文字によるオブジェクトと、参照文
字によるオブジェクトを比較評価するため、前回設定オ
ブジェクトを仮説検証結果の変更指示で、ある確率で交
換と結合と分離操作を行い、新しい設定オブジェクトを
生成する仮説生成手段と、設定オブジェクトの入力文字
オブジェクトとの相違度を求める相違度評価手段と、こ
の相違度に基づく確率と仮説受理確率とを比較して大き
ければ仮説が受理可能として設定オブジェクトと対応す
る相違度を記憶し、かつ仮説検証結果の変更指示として
仮説生成手段に新しい参照文字の設定オブジェクトの生
成の指示をする仮説検証手段とを備えた。
切れや掠れがあっても適応基準パターンが得られる。 【解決手段】 入力文字によるオブジェクトと、参照文
字によるオブジェクトを比較評価するため、前回設定オ
ブジェクトを仮説検証結果の変更指示で、ある確率で交
換と結合と分離操作を行い、新しい設定オブジェクトを
生成する仮説生成手段と、設定オブジェクトの入力文字
オブジェクトとの相違度を求める相違度評価手段と、こ
の相違度に基づく確率と仮説受理確率とを比較して大き
ければ仮説が受理可能として設定オブジェクトと対応す
る相違度を記憶し、かつ仮説検証結果の変更指示として
仮説生成手段に新しい参照文字の設定オブジェクトの生
成の指示をする仮説検証手段とを備えた。
Description
【0001】
【発明の属する技術分野】この発明は、入力文字パター
ンと参照文字パターンとからそれぞれ抽出した構造的な
特徴の多くの対応付けを行って、それらの文字パターン
間の相違度を繰り返して算出して最適な参照パターンを
定める文字認識装置に関するものである。
ンと参照文字パターンとからそれぞれ抽出した構造的な
特徴の多くの対応付けを行って、それらの文字パターン
間の相違度を繰り返して算出して最適な参照パターンを
定める文字認識装置に関するものである。
【0002】
【従来の技術】構造解析的文字認識装置としては、評価
対象の入力文字パターンと、評価基準である参照文字パ
ターンからそれぞれ構造的な特徴(以降、オブジェクト
と呼ぶ)を抽出し、入力文字パターンから抽出したオブ
ジェクトと、参照文字パターンから抽出したオブジェク
トとを対応付けることで、入力・参照文字パターン間の
相違度を計算するものがある。以降、入力文字パターン
から抽出されたオブジェクトを入力オブジェクト、参照
文字パターンから抽出されたオブジェクトを参照オブジ
ェクトと呼ぶ。このような従来の構造解析的文字認識装
置として、例えば、“Relaxation Optimizing Processe
s in Extended Probabilistic Space”(ICDAR ’95, V
ol.1,pp.266-269, 1995)に示された装置がある。図1
5から図18は、この従来装置の動作を説明するための
図である。
対象の入力文字パターンと、評価基準である参照文字パ
ターンからそれぞれ構造的な特徴(以降、オブジェクト
と呼ぶ)を抽出し、入力文字パターンから抽出したオブ
ジェクトと、参照文字パターンから抽出したオブジェク
トとを対応付けることで、入力・参照文字パターン間の
相違度を計算するものがある。以降、入力文字パターン
から抽出されたオブジェクトを入力オブジェクト、参照
文字パターンから抽出されたオブジェクトを参照オブジ
ェクトと呼ぶ。このような従来の構造解析的文字認識装
置として、例えば、“Relaxation Optimizing Processe
s in Extended Probabilistic Space”(ICDAR ’95, V
ol.1,pp.266-269, 1995)に示された装置がある。図1
5から図18は、この従来装置の動作を説明するための
図である。
【0003】ここで、図15は、装置の全体構成を示す
ブロック図である。図において、1は入力文字パター
ン、2は参照文字パターン、3は特徴抽出手段、4は仮
想オブジェクト作成手段、5は弛緩整合手段、6は相違
度算出手段、7は相違度出力手段である。また、図16
は、特徴抽出手段3で抽出したオブジェクトの例を示
す。図において、211は入力文字パターンの例、21
2は参照文字パターンの例、213は入力文字パターン
211から抽出された入力オブジェクト、214は参照
文字パターン212から抽出された参照オブジェクトを
示す。215と216は各々入力オブジェクトと参照オ
ブジェクトの属性値を記した入力オブジェクトリストと
参照オブジェクトリストである。
ブロック図である。図において、1は入力文字パター
ン、2は参照文字パターン、3は特徴抽出手段、4は仮
想オブジェクト作成手段、5は弛緩整合手段、6は相違
度算出手段、7は相違度出力手段である。また、図16
は、特徴抽出手段3で抽出したオブジェクトの例を示
す。図において、211は入力文字パターンの例、21
2は参照文字パターンの例、213は入力文字パターン
211から抽出された入力オブジェクト、214は参照
文字パターン212から抽出された参照オブジェクトを
示す。215と216は各々入力オブジェクトと参照オ
ブジェクトの属性値を記した入力オブジェクトリストと
参照オブジェクトリストである。
【0004】また、図17は、仮想オブジェクト作成手
段4の動作を説明する図である。図において、220は
仮想オブジェクトの情報、221は仮想オブジェクト作
成手段4の出力である。また、図18は、弛緩整合手段
5の動作を説明する図である。図において、230は参
照オブジェクト1Bに対する対応付けの候補、231は
参照オブジェクトと対応付いた入力、仮想オブジェクト
である。
段4の動作を説明する図である。図において、220は
仮想オブジェクトの情報、221は仮想オブジェクト作
成手段4の出力である。また、図18は、弛緩整合手段
5の動作を説明する図である。図において、230は参
照オブジェクト1Bに対する対応付けの候補、231は
参照オブジェクトと対応付いた入力、仮想オブジェクト
である。
【0005】以下、従来の構造解析的文字認識装置の動
作を、図15及至図18を用いて説明する。入力文字パ
ターン1と参照文字パターン2を本装置に入力すると、
特徴抽出手段3は、まず双方の文字パターンからオブジ
ェクトを抽出する。ここでオブジェクトは、例えば、文
字の輪郭線を直線近似して得た直線要素である。次に、
特徴抽出手段3は、各オブジェクトの始終点位置及び方
向等の属性値を求め、属性値を一覧表示したオブジェク
トリストを作成する。そして、入力文字パターン1から
作成したオブジェクトリストを仮想オブジェクト作成手
段4に、参照文字パターン2から作成したオブジェクト
リストを弛緩整合手段5に送出する。例えば、特徴抽出
手段3は、入力文字パターン211から213に示す入
力オブジェクト(1Aから14A)を抽出し、抽出され
たオブジェクトの属性値を記した入力オブジェクトリス
ト215を出力する。同様に、参照文字パターン212
から214に示す参照オブジェクト(1Bから11B)
を抽出し、参照オブジェクトリスト216を出力する。
作を、図15及至図18を用いて説明する。入力文字パ
ターン1と参照文字パターン2を本装置に入力すると、
特徴抽出手段3は、まず双方の文字パターンからオブジ
ェクトを抽出する。ここでオブジェクトは、例えば、文
字の輪郭線を直線近似して得た直線要素である。次に、
特徴抽出手段3は、各オブジェクトの始終点位置及び方
向等の属性値を求め、属性値を一覧表示したオブジェク
トリストを作成する。そして、入力文字パターン1から
作成したオブジェクトリストを仮想オブジェクト作成手
段4に、参照文字パターン2から作成したオブジェクト
リストを弛緩整合手段5に送出する。例えば、特徴抽出
手段3は、入力文字パターン211から213に示す入
力オブジェクト(1Aから14A)を抽出し、抽出され
たオブジェクトの属性値を記した入力オブジェクトリス
ト215を出力する。同様に、参照文字パターン212
から214に示す参照オブジェクト(1Bから11B)
を抽出し、参照オブジェクトリスト216を出力する。
【0006】次に、仮想オブジェクト作成手段4は、特
徴抽出手段3で抽出した入力オブジェクトリストから仮
想オブジェクトを作成し、作成した仮想オブジェクトを
入力オブジェクトリストに追加する。そして、仮想オブ
ジェクトを追加した新たな入力オブジェクトリストを弛
緩整合手段5に送出する。ここで仮想オブジェクトは、
例えば、互いに位置が隣接し、かつ、同じ方向を持つ入
力オブジェクト同士を統合して作成したオブジェクトで
あり、入力オブジェクトと同じく始終点位置や方向等の
属性値を持つ。例えば、入力オブジェクトリスト215
を仮想オブジェクト作成手段4に入力すると、仮想オブ
ジェクト作成手段4は、作成した仮想オブジェクトの情
報220を入力オブジェクトリスト215に追加して、
新たな入力オブジェクトリストを作成する。ここで、仮
想オブジェクト作成手段の出力221である新たな入力
オブジェクトリスト中に示した16A{1A+7A}
は、仮想オブジェクト16Aが入力オブジェクト1Aと
7Aとを統合して作成されたことを示す。
徴抽出手段3で抽出した入力オブジェクトリストから仮
想オブジェクトを作成し、作成した仮想オブジェクトを
入力オブジェクトリストに追加する。そして、仮想オブ
ジェクトを追加した新たな入力オブジェクトリストを弛
緩整合手段5に送出する。ここで仮想オブジェクトは、
例えば、互いに位置が隣接し、かつ、同じ方向を持つ入
力オブジェクト同士を統合して作成したオブジェクトで
あり、入力オブジェクトと同じく始終点位置や方向等の
属性値を持つ。例えば、入力オブジェクトリスト215
を仮想オブジェクト作成手段4に入力すると、仮想オブ
ジェクト作成手段4は、作成した仮想オブジェクトの情
報220を入力オブジェクトリスト215に追加して、
新たな入力オブジェクトリストを作成する。ここで、仮
想オブジェクト作成手段の出力221である新たな入力
オブジェクトリスト中に示した16A{1A+7A}
は、仮想オブジェクト16Aが入力オブジェクト1Aと
7Aとを統合して作成されたことを示す。
【0007】次に、弛緩整合手段5は、特徴抽出手段3
で得た参照オブジェクトリストと仮想オブジェクト作成
手段4で得た新たな入力オブジェクトリストを入力と
し、確率的弛緩法を用いて各参照オブジェクトを入力、
仮想オブジェクトと対応付ける。そして、対応付け結果
を相違度算出手段6に送出する。ここで、確率的弛緩法
は、オブジェクト同士の相対関係を考慮しながら、対応
付けの確率を更新して行くことにより、整合性の高い対
応付け結果を得る計算方式である。この弛緩整合手段5
では、まず、各参照オブジェクトと各入力、仮想オブジ
ェクトとが対応付く確率を求める。そして、各参照オブ
ジェクト毎に、高い対応付け確率を持つN個の入力、仮
想オブジェクトを対応付け候補として選択する。ここ
で、対応付け確率は、参照オブジェクトの属性値と各入
力、仮想オブジェクトの属性値が類似するほど高い値を
持つようにする。例えば、230は参照オブジェクト1
Bの対応付け候補であり、1Bは230に示した対応付
けの候補の1つと対応付けられる。ただし、対応付けの
候補は、230に示すように、参照オブジェクトがいず
れの入力、仮想オブジェクトとも対応付かない状態“N
omatch”を含む。
で得た参照オブジェクトリストと仮想オブジェクト作成
手段4で得た新たな入力オブジェクトリストを入力と
し、確率的弛緩法を用いて各参照オブジェクトを入力、
仮想オブジェクトと対応付ける。そして、対応付け結果
を相違度算出手段6に送出する。ここで、確率的弛緩法
は、オブジェクト同士の相対関係を考慮しながら、対応
付けの確率を更新して行くことにより、整合性の高い対
応付け結果を得る計算方式である。この弛緩整合手段5
では、まず、各参照オブジェクトと各入力、仮想オブジ
ェクトとが対応付く確率を求める。そして、各参照オブ
ジェクト毎に、高い対応付け確率を持つN個の入力、仮
想オブジェクトを対応付け候補として選択する。ここ
で、対応付け確率は、参照オブジェクトの属性値と各入
力、仮想オブジェクトの属性値が類似するほど高い値を
持つようにする。例えば、230は参照オブジェクト1
Bの対応付け候補であり、1Bは230に示した対応付
けの候補の1つと対応付けられる。ただし、対応付けの
候補は、230に示すように、参照オブジェクトがいず
れの入力、仮想オブジェクトとも対応付かない状態“N
omatch”を含む。
【0008】次に、弛緩整合手段5は、全ての対応付け
確率を、オブジェクト同士の相対関係を考慮して更新す
る。この対応付け確率の更新を一定回数繰り返した結
果、最も高い確率を持つ対応付けの候補と参照オブジェ
クトとが対応付いたと考える。例えば、図18におい
て、繰り返し回数Itが4の場合、対応付け確率が最も
高い対応付けの候補231が各参照オブジェクトと対応
付いたことになる。つまり、1Bは仮想オブジェクト1
6Aに、2Bは入力オブジェクト2Aに、11Bは仮想
オブジェクト20Aに対応付く。最後に、弛緩整合手段
5は、求めた対応付けの結果を相違度算出手段6に送出
する。
確率を、オブジェクト同士の相対関係を考慮して更新す
る。この対応付け確率の更新を一定回数繰り返した結
果、最も高い確率を持つ対応付けの候補と参照オブジェ
クトとが対応付いたと考える。例えば、図18におい
て、繰り返し回数Itが4の場合、対応付け確率が最も
高い対応付けの候補231が各参照オブジェクトと対応
付いたことになる。つまり、1Bは仮想オブジェクト1
6Aに、2Bは入力オブジェクト2Aに、11Bは仮想
オブジェクト20Aに対応付く。最後に、弛緩整合手段
5は、求めた対応付けの結果を相違度算出手段6に送出
する。
【0009】次に、相違度算出手段6は、弛緩整合手段
5で求めた対応付けの結果から、入力参照文字パターン
間の相違度を求め、求めた相違度を相違度出力手段7に
送出する。ここで、相違度は、例えば、対応付いたオブ
ジェクト同士の属性差と、対応付かずに余った入力オブ
ジェクトに対するペナルティの合計値で表わす。最後
に、相違度出力手段7は、相違度算出手段6で求めた相
違度を本文字認識装置の外部に出力する。
5で求めた対応付けの結果から、入力参照文字パターン
間の相違度を求め、求めた相違度を相違度出力手段7に
送出する。ここで、相違度は、例えば、対応付いたオブ
ジェクト同士の属性差と、対応付かずに余った入力オブ
ジェクトに対するペナルティの合計値で表わす。最後
に、相違度出力手段7は、相違度算出手段6で求めた相
違度を本文字認識装置の外部に出力する。
【0010】
【発明が解決しようとする課題】従来の構造解析的文字
認識装置は、上記のように構成されているので、確率的
弛緩法を用いることで、2次元平面上の位相関係を考慮
しながら、構造的特徴点同士の対応付けが可能となる利
点がある。しかし、確率的弛緩法は、オブジェクト同士
の相対関係を考慮しながら、全ての対応付け候補に対す
る対応付け確率を繰り返し計算するため、計算規模が大
きくなるという課題があった。更に、文字の切れや掠れ
に対処するために仮想オブジェクトを作成して弛緩整合
手段4への入力データに加えると、対応付けの候補が増
えるため、計算規模が更に増加する課題がある。更に、
弛緩整合手段5と相違度算出手段6とは独立に存在して
いるため、弛緩整合手段5で求めたオブジェクト同士の
対応付け結果が、必ずしも相違度算出手段6で求める相
違度を最小にしないという課題がある。
認識装置は、上記のように構成されているので、確率的
弛緩法を用いることで、2次元平面上の位相関係を考慮
しながら、構造的特徴点同士の対応付けが可能となる利
点がある。しかし、確率的弛緩法は、オブジェクト同士
の相対関係を考慮しながら、全ての対応付け候補に対す
る対応付け確率を繰り返し計算するため、計算規模が大
きくなるという課題があった。更に、文字の切れや掠れ
に対処するために仮想オブジェクトを作成して弛緩整合
手段4への入力データに加えると、対応付けの候補が増
えるため、計算規模が更に増加する課題がある。更に、
弛緩整合手段5と相違度算出手段6とは独立に存在して
いるため、弛緩整合手段5で求めたオブジェクト同士の
対応付け結果が、必ずしも相違度算出手段6で求める相
違度を最小にしないという課題がある。
【0011】この発明は、上述の課題を解決するために
なされたものであり、文字の切れや掠れが生じた場合も
正しく対応付けを行うことができ、対応付けに要する計
算規模が小さく、かつ、パターン間の相違度が最小とな
るようにオブジェクト同士を対応付ける文字認識装置を
得ることを目的とする。
なされたものであり、文字の切れや掠れが生じた場合も
正しく対応付けを行うことができ、対応付けに要する計
算規模が小さく、かつ、パターン間の相違度が最小とな
るようにオブジェクト同士を対応付ける文字認識装置を
得ることを目的とする。
【0012】
【課題を解決するための手段】この発明に係る文字認識
装置は、評価対象の入力文字によるオブジェクトと、評
価基準である参照文字によるオブジェクトを比較評価す
るために、前回の演算における評価基準の参照文字の設
定オブジェクトを仮説検証結果の変更指示に基づいて所
定の確率で交換と結合と分離の操作を行って新しい参照
文字の設定オブジェクトを生成する仮説生成手段と、こ
の仮説生成手段で生成した新しい参照文字の設定オブジ
ェクトと、評価対象の入力文字のオブジェクトとの相違
度を所定の基準で求める相違度評価手段と、この相違度
評価手段で求めた相違度に基づく受理確率と、仮の確率
とを比較して大きければ仮説が受理可能として参照文字
の設定オブジェクトと対応する相違度を記憶し、かつ仮
説検証結果の変更指示として仮説生成手段に新しい参照
文字の設定オブジェクトの生成の指示をする仮説検証手
段とを備え、仮説生成手段の動作から仮説検証手段の動
作を所定回数以上繰り返して、仮説検証手段が記憶する
参照文字の設定オブジェクト値を所定の値として出力す
るようにした。
装置は、評価対象の入力文字によるオブジェクトと、評
価基準である参照文字によるオブジェクトを比較評価す
るために、前回の演算における評価基準の参照文字の設
定オブジェクトを仮説検証結果の変更指示に基づいて所
定の確率で交換と結合と分離の操作を行って新しい参照
文字の設定オブジェクトを生成する仮説生成手段と、こ
の仮説生成手段で生成した新しい参照文字の設定オブジ
ェクトと、評価対象の入力文字のオブジェクトとの相違
度を所定の基準で求める相違度評価手段と、この相違度
評価手段で求めた相違度に基づく受理確率と、仮の確率
とを比較して大きければ仮説が受理可能として参照文字
の設定オブジェクトと対応する相違度を記憶し、かつ仮
説検証結果の変更指示として仮説生成手段に新しい参照
文字の設定オブジェクトの生成の指示をする仮説検証手
段とを備え、仮説生成手段の動作から仮説検証手段の動
作を所定回数以上繰り返して、仮説検証手段が記憶する
参照文字の設定オブジェクト値を所定の値として出力す
るようにした。
【0013】また更に、相違度評価手段は、参照文字の
設定オブジェクトと評価対象の入力文字のオブジェクト
との相違度を求める際に、特定部分の評価の寄与度が低
くなるような対応付け確率係数を設けて、総合相違度を
求めるようにした。
設定オブジェクトと評価対象の入力文字のオブジェクト
との相違度を求める際に、特定部分の評価の寄与度が低
くなるような対応付け確率係数を設けて、総合相違度を
求めるようにした。
【0014】また更に、相違度評価手段は、参照文字の
設定オブジェクトと評価対象の入力文字のオブジェクト
との相違度を求める際に、低次特徴を抽出し、この抽出
した低次特徴を併用して総合相違度を求めるようにし
た。
設定オブジェクトと評価対象の入力文字のオブジェクト
との相違度を求める際に、低次特徴を抽出し、この抽出
した低次特徴を併用して総合相違度を求めるようにし
た。
【0015】また更に、相違度評価手段は、低次特徴を
抽出する際に、この抽出領域を変更するようにした。
抽出する際に、この抽出領域を変更するようにした。
【0016】また更に、評価対象の入力文字によるオブ
ジェクトと、評価基準である参照文字によるオブジェク
トを比較評価するのに先立ち、入力文字または参照文字
のいずれかまたは両方を前処理として変換して比較入力
とするパターン変換手段を付加した。
ジェクトと、評価基準である参照文字によるオブジェク
トを比較評価するのに先立ち、入力文字または参照文字
のいずれかまたは両方を前処理として変換して比較入力
とするパターン変換手段を付加した。
【0017】また更に、仮説生成手段の動作から仮説検
証手段の動作を所定回数以上繰り返して、仮説検証手段
が記憶する相違度が所定の値以上である場合に、パター
ン変換の内容を変更するようにした。
証手段の動作を所定回数以上繰り返して、仮説検証手段
が記憶する相違度が所定の値以上である場合に、パター
ン変換の内容を変更するようにした。
【0018】
実施の形態1.この発明の主旨である仮説生成手段と仮
説検証手段を用いて細分化オブジェクトの比較を繰り返
して評価動作をする文字認識装置について説明する。図
1は、本実施の形態における文字認識装置の主要部分の
構成ブロック図である。図において、10は最適化手法
の1つである焼きなまし法(Simulated An
nealing)を基にして、オブジェクト同士を対応
付ける特徴点対応付け手段である。ここで、特徴点対応
付け手段10は、本発明の重要な構成要素である仮設生
成手段11と、相違度評価手段12と、同じく重要な構
成要素である仮説検証手段13により構成する。その他
の従来例の装置中の要素と同一又は相当部分は、同一の
符号を付し、その説明を省略する。
説検証手段を用いて細分化オブジェクトの比較を繰り返
して評価動作をする文字認識装置について説明する。図
1は、本実施の形態における文字認識装置の主要部分の
構成ブロック図である。図において、10は最適化手法
の1つである焼きなまし法(Simulated An
nealing)を基にして、オブジェクト同士を対応
付ける特徴点対応付け手段である。ここで、特徴点対応
付け手段10は、本発明の重要な構成要素である仮設生
成手段11と、相違度評価手段12と、同じく重要な構
成要素である仮説検証手段13により構成する。その他
の従来例の装置中の要素と同一又は相当部分は、同一の
符号を付し、その説明を省略する。
【0019】仮説生成手段11は、初期状態においては
特徴抽出手段3で得た入力オブジェクトリストと参照オ
ブジェクトリストを基に対応付け仮説を作成する。ま
た、その後の繰り返し演算状態以降では、現状の対応付
け仮説を一部変更した新たな対応付け仮説を作成する。
後に詳細な説明をするが、ある確率で入力又は参照オブ
ジェクトの一部を変換(Swap)、結合(Combi
ne)、分離(Divide)のいずれか又は組み合わ
せで変更して、新しい入力又は参照オブジェクトを生成
する重要な要素である。相違度評価手段12は、仮説生
成手段11で作成した対応付け仮説に対して、その仮説
に従ってオブジェクト同士を対応付けた場合の相違度、
例えば、座標値差、線分の傾きの差を算出する。また、
仮説検証手段13は、相違度評価手段12で得た相違度
に従い、仮説生成手段11で作成した仮説を受理するか
否か判定する。これも後に詳細を説明するが、相違度評
価手段で得られた相違度の確率換算と受理確率とを比較
して、受理可能なら、その相違度と対応設定オブジェク
トを今後の基準として記憶するもので、焼きなまし法を
文字認識に導入した重要な要素である。
特徴抽出手段3で得た入力オブジェクトリストと参照オ
ブジェクトリストを基に対応付け仮説を作成する。ま
た、その後の繰り返し演算状態以降では、現状の対応付
け仮説を一部変更した新たな対応付け仮説を作成する。
後に詳細な説明をするが、ある確率で入力又は参照オブ
ジェクトの一部を変換(Swap)、結合(Combi
ne)、分離(Divide)のいずれか又は組み合わ
せで変更して、新しい入力又は参照オブジェクトを生成
する重要な要素である。相違度評価手段12は、仮説生
成手段11で作成した対応付け仮説に対して、その仮説
に従ってオブジェクト同士を対応付けた場合の相違度、
例えば、座標値差、線分の傾きの差を算出する。また、
仮説検証手段13は、相違度評価手段12で得た相違度
に従い、仮説生成手段11で作成した仮説を受理するか
否か判定する。これも後に詳細を説明するが、相違度評
価手段で得られた相違度の確率換算と受理確率とを比較
して、受理可能なら、その相違度と対応設定オブジェク
トを今後の基準として記憶するもので、焼きなまし法を
文字認識に導入した重要な要素である。
【0020】また、図2は、初期状態の対応付け仮説を
説明するものであり、20は初期状態で参照オブジェク
トと対応付いた入力オブジェクト、21は参照オブジェ
クト1Bの対応付け候補である。図3は、仮説生成手段
11の動作を説明するもので、31〜33は現状の対応
付け仮説を変更して作成した新たな対応付け仮説であ
る。これら図2,図3におけるオブジェクトの欄内の数
字と記号、例えば、1B,1A,3A,2A等は、図1
6の213,214内のオブジェクトのそれに対応して
いる。また、図4は、特徴点対応付け手段10の動作を
説明するフローチャートである。図5は、図4のフロー
チャートにおけるステップST6の詳細なフローチャー
トである。
説明するものであり、20は初期状態で参照オブジェク
トと対応付いた入力オブジェクト、21は参照オブジェ
クト1Bの対応付け候補である。図3は、仮説生成手段
11の動作を説明するもので、31〜33は現状の対応
付け仮説を変更して作成した新たな対応付け仮説であ
る。これら図2,図3におけるオブジェクトの欄内の数
字と記号、例えば、1B,1A,3A,2A等は、図1
6の213,214内のオブジェクトのそれに対応して
いる。また、図4は、特徴点対応付け手段10の動作を
説明するフローチャートである。図5は、図4のフロー
チャートにおけるステップST6の詳細なフローチャー
トである。
【0021】以下に、図1及至図5を用いて、本実施の
形態における文字認識装置の動作を説明する。まず、本
装置に入力文字パターン1と参照文字パターン2を提示
すると、従来例と同様、特徴抽出手段3は、双方の文字
パターンからオブジェクトを抽出し、抽出されたオブジ
ェクトの属性を記した入力オブジェクトリストと参照オ
ブジェクトリストを作成する。そして、作成したオブジ
ェクトリストを特徴点対応付け手段10へ送出する。
形態における文字認識装置の動作を説明する。まず、本
装置に入力文字パターン1と参照文字パターン2を提示
すると、従来例と同様、特徴抽出手段3は、双方の文字
パターンからオブジェクトを抽出し、抽出されたオブジ
ェクトの属性を記した入力オブジェクトリストと参照オ
ブジェクトリストを作成する。そして、作成したオブジ
ェクトリストを特徴点対応付け手段10へ送出する。
【0022】次に、特徴点対応付け手段10は、特徴抽
出手段3で得た入力オブジェクトリストと参照オブジェ
クトリストを基に、相違度が最小となるようにオブジェ
クト同士を対応付ける。以下に、特徴点対応付け手段1
0の動作を、図4のフローチャートに従って説明する。
まず、特徴点対応付け手段10に入力オブジェクトリス
トと参照オブジェクトリストを提示すると、特徴点対応
付け手段10は、初期化処理を行なう。初期化処理で
は、特徴点対応付け手段10の内部パラメータである温
度Tと更新回数Itを設定する。ここで、温度Tには十
分に大きな値を設定する(具体的な値は後で述べる)。
また、It=0とし、以降、It=0の状態を初期状態
とする(ステップST1)。
出手段3で得た入力オブジェクトリストと参照オブジェ
クトリストを基に、相違度が最小となるようにオブジェ
クト同士を対応付ける。以下に、特徴点対応付け手段1
0の動作を、図4のフローチャートに従って説明する。
まず、特徴点対応付け手段10に入力オブジェクトリス
トと参照オブジェクトリストを提示すると、特徴点対応
付け手段10は、初期化処理を行なう。初期化処理で
は、特徴点対応付け手段10の内部パラメータである温
度Tと更新回数Itを設定する。ここで、温度Tには十
分に大きな値を設定する(具体的な値は後で述べる)。
また、It=0とし、以降、It=0の状態を初期状態
とする(ステップST1)。
【0023】初期状態において、まず、仮説生成手段1
1は、入力オブジェクトリストと参照オブジェクトリス
トから対応付け仮説を作成する(ステップST2)。ここ
で、仮説生成手段11は、まず、参照オブジェクトと各
入力オブジェクト間で式(1)に従い、評価値Sを算出
する。ここで、Sの値は入力・参照オブジェクト間の属
性差を示す。 式(1)において、iは参照オブジェクトの番号、kは
入力オブジェクトの番号、Diはオブジェクトiの方向
を示す。更に、Xsi,Ysi,Xei,Yeiは、X
Y座標軸上におけるオブジェクトiの始点及び終点位置
を示す。つまり、上述の例では、各オブジェクトを線分
の和で近似し、各線分の傾きと位置の差を属性差Sとし
ている。式(1)の第1項は、参照オブジェクトiと入
力オブジェクトkとの方向差を示す。また、第2項は、
オブジェクトiとkとの始点位置のずれ量を、第3項
は、オブジェクトiとkとの終点位置のずれ量を示す。
従って、オブジェクトiとkが持つ属性値(方向、始
点、終点等)が異なっているほど、Sの値は大きくな
る。
1は、入力オブジェクトリストと参照オブジェクトリス
トから対応付け仮説を作成する(ステップST2)。ここ
で、仮説生成手段11は、まず、参照オブジェクトと各
入力オブジェクト間で式(1)に従い、評価値Sを算出
する。ここで、Sの値は入力・参照オブジェクト間の属
性差を示す。 式(1)において、iは参照オブジェクトの番号、kは
入力オブジェクトの番号、Diはオブジェクトiの方向
を示す。更に、Xsi,Ysi,Xei,Yeiは、X
Y座標軸上におけるオブジェクトiの始点及び終点位置
を示す。つまり、上述の例では、各オブジェクトを線分
の和で近似し、各線分の傾きと位置の差を属性差Sとし
ている。式(1)の第1項は、参照オブジェクトiと入
力オブジェクトkとの方向差を示す。また、第2項は、
オブジェクトiとkとの始点位置のずれ量を、第3項
は、オブジェクトiとkとの終点位置のずれ量を示す。
従って、オブジェクトiとkが持つ属性値(方向、始
点、終点等)が異なっているほど、Sの値は大きくな
る。
【0024】次に、仮説生成手段11は、各参照オブジ
ェクト毎にSの値が小さい入力オブジェクトN個を選択
し、これを対応付けの候補とする。ただし、対応付けの
候補には、参照オブジェクトがいずれのオブジェクトと
も対応付かない状態“Nomatch”も加える。最後
に、仮説生成手段11は、各参照オブジェクトがSの値
が最小の入力オブジェクトに対応付く状態を示す対応付
け仮説を作成し、この対応付け仮説を相違度評価手段1
2と仮説検証手段13に送出する。
ェクト毎にSの値が小さい入力オブジェクトN個を選択
し、これを対応付けの候補とする。ただし、対応付けの
候補には、参照オブジェクトがいずれのオブジェクトと
も対応付かない状態“Nomatch”も加える。最後
に、仮説生成手段11は、各参照オブジェクトがSの値
が最小の入力オブジェクトに対応付く状態を示す対応付
け仮説を作成し、この対応付け仮説を相違度評価手段1
2と仮説検証手段13に送出する。
【0025】例えば、図2は、入力オブジェクトリスト
215と参照オブジェクトリスト216から作成した対
応付けの候補例である。図において、21は参照オブジ
ェクト1Bの対応付け候補である。ここで、対応付けの
候補は、左からSの値が小さい順に並んでいる。初期の
対応付け仮説において、各参照オブジェクトはSの値が
最小の入力オブジェクト20と対応付いている。
215と参照オブジェクトリスト216から作成した対
応付けの候補例である。図において、21は参照オブジ
ェクト1Bの対応付け候補である。ここで、対応付けの
候補は、左からSの値が小さい順に並んでいる。初期の
対応付け仮説において、各参照オブジェクトはSの値が
最小の入力オブジェクト20と対応付いている。
【0026】次に、相違度評価手段12は、仮説生成手
段11で得た対応付け仮説を用いて相違度を算出し、求
めた相違度を仮説検証手段13に送出する(ステップS
T3)。ここで、パターン間の相違度は、例えば、オブ
ジェクト同士の属性差を表わす上述の式(1)の評価値
Sと、オブジェクトの相対関係のずれ量を表わす評価値
R及び各種ペナルティ量Pの合計値で表わすことができ
る。 D=S+R+P (2) ここで、ペナルティ量Pは、入力オブジェクトが対応付
かずに余ったり、複数の参照オブジェクトが1つの入力
オブジェクトに対応付いたり、参照オブジェクトの対応
付け結果が“Nomatch”となった場合のペナルテ
ィを合計した値である。この具体的な値としては、上述
の場合について0〜1の中間の値を付与しておく。ま
た、相対関係のずれ量Rは、例えば、式(3)で表わす
ことができる。
段11で得た対応付け仮説を用いて相違度を算出し、求
めた相違度を仮説検証手段13に送出する(ステップS
T3)。ここで、パターン間の相違度は、例えば、オブ
ジェクト同士の属性差を表わす上述の式(1)の評価値
Sと、オブジェクトの相対関係のずれ量を表わす評価値
R及び各種ペナルティ量Pの合計値で表わすことができ
る。 D=S+R+P (2) ここで、ペナルティ量Pは、入力オブジェクトが対応付
かずに余ったり、複数の参照オブジェクトが1つの入力
オブジェクトに対応付いたり、参照オブジェクトの対応
付け結果が“Nomatch”となった場合のペナルテ
ィを合計した値である。この具体的な値としては、上述
の場合について0〜1の中間の値を付与しておく。ま
た、相対関係のずれ量Rは、例えば、式(3)で表わす
ことができる。
【0027】上述の式(3)において、iは参照オブジ
ェクトの番号、jは参照オブジェクトiに隣接する参照
オブジェクトの番号、i’はiに対応付いた入力オブジ
ェクトの番号、j’はjに対応付いた入力オブジェクト
の番号を示す。Xsi,Ysi,Xei,Yeiは、先
に説明したよう、にオブジェクトiの始終点位置を示
す。従って、参照オブジェクトi,jの相対位置関係
と、i,jに対応付いた入力オブジェクト同士の相対位
置関係とが類似するほど、Rの値は小さくなる。
ェクトの番号、jは参照オブジェクトiに隣接する参照
オブジェクトの番号、i’はiに対応付いた入力オブジ
ェクトの番号、j’はjに対応付いた入力オブジェクト
の番号を示す。Xsi,Ysi,Xei,Yeiは、先
に説明したよう、にオブジェクトiの始終点位置を示
す。従って、参照オブジェクトi,jの相対位置関係
と、i,jに対応付いた入力オブジェクト同士の相対位
置関係とが類似するほど、Rの値は小さくなる。
【0028】次に、仮説検証手段13は、仮説生成手段
11で得た初期の対応付け仮説を現状の対応付け仮説と
して、また、初期の対応付け仮説から相違度算出手段1
2で得た相違度を現状の相違度として、仮説検証手段1
3の内部メモリに保存する。そして、現状の対応付け仮
説を仮説生成手段11に送出する(ステップST4)。
次に、特徴点対応付け手段10は、内部パラメータであ
る更新回数Itの値をインクリメントする(ステップS
T5)。以上が、初期状態(It=0)における特徴点
対応付け手段10内部での処理である。
11で得た初期の対応付け仮説を現状の対応付け仮説と
して、また、初期の対応付け仮説から相違度算出手段1
2で得た相違度を現状の相違度として、仮説検証手段1
3の内部メモリに保存する。そして、現状の対応付け仮
説を仮説生成手段11に送出する(ステップST4)。
次に、特徴点対応付け手段10は、内部パラメータであ
る更新回数Itの値をインクリメントする(ステップS
T5)。以上が、初期状態(It=0)における特徴点
対応付け手段10内部での処理である。
【0029】初期状態以降において、仮説生成手段11
は、仮説検証手段13で得た現状の対応付け仮説の一部
を変更して、新たな対応付け仮説を生成する。仮説の変
更は、以下に示すSwap,Combine,Divi
deの3つの変更処理の1つを確率的に選択し、その変
更処理を実行することで行う(ステップST6)。以
降、ステップST6の詳細を、図19のフローチャート
に従い説明する。ここでは、まず、仮定の確率Pt (0
≦Pt ≦1)を乱数表に従い求める(ステップST80
1)。次に、Pt の値に従い、変更処理を1つ選択す
る。例えば、0≦Pt ≦0.9の場合はSwap処理
を、0.9<Pt ≦0.95の場合はCombine処
理を、その他の場合はDivide処理を選択する。
は、仮説検証手段13で得た現状の対応付け仮説の一部
を変更して、新たな対応付け仮説を生成する。仮説の変
更は、以下に示すSwap,Combine,Divi
deの3つの変更処理の1つを確率的に選択し、その変
更処理を実行することで行う(ステップST6)。以
降、ステップST6の詳細を、図19のフローチャート
に従い説明する。ここでは、まず、仮定の確率Pt (0
≦Pt ≦1)を乱数表に従い求める(ステップST80
1)。次に、Pt の値に従い、変更処理を1つ選択す
る。例えば、0≦Pt ≦0.9の場合はSwap処理
を、0.9<Pt ≦0.95の場合はCombine処
理を、その他の場合はDivide処理を選択する。
【0030】ここで、Swap処理は、現状の対応付け
仮説において、ある参照オブジェクトに対応付いた入力
オブジェクトを別の入力オブジェクトに変更する。具体
的に、Swap処理では、まず、1個の参照オブジェク
トをランダムに選択する(ステップST803)。次
に、選択した参照オブジェクトに対応付いた入力オブジ
ェクトを別の入力オブジェクトに変更する(ステップS
T804)。ここで、どの入力オブジェクトに変更する
かもランダムに決定する。例えば、図2に示した現状の
対応付け仮説にSwap処理を加えると、参照オブジェ
クト2Bに対応付く入力オブジェクトが、2Aから4A
に変更された新たな対応付け仮説31が作成される。
仮説において、ある参照オブジェクトに対応付いた入力
オブジェクトを別の入力オブジェクトに変更する。具体
的に、Swap処理では、まず、1個の参照オブジェク
トをランダムに選択する(ステップST803)。次
に、選択した参照オブジェクトに対応付いた入力オブジ
ェクトを別の入力オブジェクトに変更する(ステップS
T804)。ここで、どの入力オブジェクトに変更する
かもランダムに決定する。例えば、図2に示した現状の
対応付け仮説にSwap処理を加えると、参照オブジェ
クト2Bに対応付く入力オブジェクトが、2Aから4A
に変更された新たな対応付け仮説31が作成される。
【0031】更に、Combine処理は、現状の対応
付け仮説において、ある参照オブジェクトに対応付いた
入力オブジェクトを別の入力オブジェクトと統合する。
具体的に、Combine処理では、まず、1個の参照
オブジェクトをランダムに選択する(ステップST80
5)。次に、選択した参照オブジェクトに対応付いた入
力オブジェクトを別の入力オブジェクトと統合する(ス
テップST806)。ここでは、ある参照オブジェクト
に対応付いた入力オブジェクトに対して、位置が隣接
し、かつ、方向が類似した入力オブジェクトを統合の対
象とする。例えば、図2に示した現状の対応付け仮説に
対してCombine処理を加え、参照オブジェクト1
Bに対応付いた入力オブジェクト1Aが入力オブジェク
ト7Aと統合されるとする。この場合、現状の対応付け
仮説中に存在する全ての入力オブジェクト1Aと7A
を、統合されたオブジェクト{1A+7A}に変更す
る。その結果、新たな対応付け仮説32が作成される。
ここで、新たな対応付け仮説32は、図2中の入力オブ
ジェクト1Aと7Aを全て{1A+7A}に置き換えた
ものとなる。
付け仮説において、ある参照オブジェクトに対応付いた
入力オブジェクトを別の入力オブジェクトと統合する。
具体的に、Combine処理では、まず、1個の参照
オブジェクトをランダムに選択する(ステップST80
5)。次に、選択した参照オブジェクトに対応付いた入
力オブジェクトを別の入力オブジェクトと統合する(ス
テップST806)。ここでは、ある参照オブジェクト
に対応付いた入力オブジェクトに対して、位置が隣接
し、かつ、方向が類似した入力オブジェクトを統合の対
象とする。例えば、図2に示した現状の対応付け仮説に
対してCombine処理を加え、参照オブジェクト1
Bに対応付いた入力オブジェクト1Aが入力オブジェク
ト7Aと統合されるとする。この場合、現状の対応付け
仮説中に存在する全ての入力オブジェクト1Aと7A
を、統合されたオブジェクト{1A+7A}に変更す
る。その結果、新たな対応付け仮説32が作成される。
ここで、新たな対応付け仮説32は、図2中の入力オブ
ジェクト1Aと7Aを全て{1A+7A}に置き換えた
ものとなる。
【0032】更に、Divide処理は、現状の対応付
け仮説において、ある参照オブジェクトに対応付いた入
力オブジェクトが、既に統合されてできたオブジェクト
である場合、そのオブジェクトを統合前のオブジェクト
に戻す。具体的に、Divide処理では、まず、1個
の参照オブジェクトをランダムに選択する(ステップS
T807)。次に、選択した参照オブジェクトに対応付
いた入力オブジェクトが、既に統合されてできたオブジ
ェクトであるか否かを判定する(ステップST80
8)。ここで、統合されたオブジェクトである場合は、
そのオブジェクトを統合前のオブジェクトに戻す(ステ
ップST809)。例えば、対応付け仮説32にDiv
ide処理を加えて、参照オブジェクト1Bに対応付い
た入力オブジェクト{1A+7A}を分解するとする。
この場合、対応付け仮説32中に存在する全ての入力オ
ブジェクト{1A+7A}を、統合前の入力オブジェク
トに戻す。その結果、新たな対応付け仮説33が作成さ
れる。具体的に、新たな対応付けの仮説33は、変更処
理を加える前の対応付け仮説32中に存在するオブジェ
クト{1A+7A}を初期状態の対応付け仮説(図2)
において、それと同じ位置にある入力オブジェクトに置
き換えたものとなる。
け仮説において、ある参照オブジェクトに対応付いた入
力オブジェクトが、既に統合されてできたオブジェクト
である場合、そのオブジェクトを統合前のオブジェクト
に戻す。具体的に、Divide処理では、まず、1個
の参照オブジェクトをランダムに選択する(ステップS
T807)。次に、選択した参照オブジェクトに対応付
いた入力オブジェクトが、既に統合されてできたオブジ
ェクトであるか否かを判定する(ステップST80
8)。ここで、統合されたオブジェクトである場合は、
そのオブジェクトを統合前のオブジェクトに戻す(ステ
ップST809)。例えば、対応付け仮説32にDiv
ide処理を加えて、参照オブジェクト1Bに対応付い
た入力オブジェクト{1A+7A}を分解するとする。
この場合、対応付け仮説32中に存在する全ての入力オ
ブジェクト{1A+7A}を、統合前の入力オブジェク
トに戻す。その結果、新たな対応付け仮説33が作成さ
れる。具体的に、新たな対応付けの仮説33は、変更処
理を加える前の対応付け仮説32中に存在するオブジェ
クト{1A+7A}を初期状態の対応付け仮説(図2)
において、それと同じ位置にある入力オブジェクトに置
き換えたものとなる。
【0033】次に、相違度評価手段12は、仮説生成手
段11で作成した新たな対応付け仮説を用いて相違度を
算出する(ステップST7)。次に、仮説検証手段13
は、仮説生成手段11で作成した新たな対応付け仮説と
相違度評価手段12で求めた相違度で定まる受理確率P
L (0≦PL ≦1)と、仮に設定した確率Pn (0≦P
n ≦1)を比較して、PL >Pn の場合に、新たな対応
付け仮説を受理する(ステップST8)。具体的に、受
理確率PL は、次式(4)で求める。 PL =EXP{−(Ca−Cb)/T} (4) ここで、Caは新たな対応付け仮説に対して相違度評価
手段12で求めた相違度、Cbは現状の対応付け仮説に
対して得られた相違度、Tは先に述べた温度パラメータ
である。そして、乱数表に従い求めた確率Pn の値が
0.2、上述の式(4)PL が0.5であれば、受理確
率PL は充分満足されるとして、新たな対応付け仮説が
受理されると判定する。そして、仮説が受理されると判
定された場合、仮説検証手段13は、新たな対応付け仮
説とその相違度Caを、現状の対応付け仮説とその相違
度Cbとして内部メモリに格納する(ステップST
9)。PL が小さい場合は、前回の仮説、つまり、設定
オブジェクトの各値と相違度Cbがそのまま保存され
る。最後に、仮説検証手段13は、内部メモリに格納し
た現状の対応付け仮説を仮説作成手段11に送出する。
段11で作成した新たな対応付け仮説を用いて相違度を
算出する(ステップST7)。次に、仮説検証手段13
は、仮説生成手段11で作成した新たな対応付け仮説と
相違度評価手段12で求めた相違度で定まる受理確率P
L (0≦PL ≦1)と、仮に設定した確率Pn (0≦P
n ≦1)を比較して、PL >Pn の場合に、新たな対応
付け仮説を受理する(ステップST8)。具体的に、受
理確率PL は、次式(4)で求める。 PL =EXP{−(Ca−Cb)/T} (4) ここで、Caは新たな対応付け仮説に対して相違度評価
手段12で求めた相違度、Cbは現状の対応付け仮説に
対して得られた相違度、Tは先に述べた温度パラメータ
である。そして、乱数表に従い求めた確率Pn の値が
0.2、上述の式(4)PL が0.5であれば、受理確
率PL は充分満足されるとして、新たな対応付け仮説が
受理されると判定する。そして、仮説が受理されると判
定された場合、仮説検証手段13は、新たな対応付け仮
説とその相違度Caを、現状の対応付け仮説とその相違
度Cbとして内部メモリに格納する(ステップST
9)。PL が小さい場合は、前回の仮説、つまり、設定
オブジェクトの各値と相違度Cbがそのまま保存され
る。最後に、仮説検証手段13は、内部メモリに格納し
た現状の対応付け仮説を仮説作成手段11に送出する。
【0034】次に、特徴点対応付け手段10は、(更新
回数It>一定回数)の場合に対応付け処理を終了し
て、仮説検証手段13の内部メモリに格納された相違度
Cbを相違度出力手段7に送出する(ステップST1
0)。その他の場合、特徴点対応付け手段10は、温度
パラメータTを徐々に下げながら、ステップST5から
ステップST10までの処理を繰り返す。最後に、相違
度出力手段7は、特徴点対応付け手段10で得た相違度
Cbを本文字認識装置の外部に出力する。焼きなまし法
は、温度Tを下げながら、式(4)に従って状態を変化
させることで局所解にとらわれることなく、評価値の値
が最小となる状態を探索する手法である。従って、上記
処理は、焼きなまし法に基づいて、相違度Cbを最小と
するオブジェクト同士の対応付け状態を探索する機能を
持つ。上記処理において、初期状態の温度Tは、式
(4)で求めるPL の値が十分に大きくなるように設定
し、かつ、次式(5)に従ってTの値を低下させる。こ
れは、本条件を用いて焼きなまし法を行うことにより、
確率1で関数の最小解にたどり着くことが証明されてい
るためである。 T=1/1n(It) (5)
回数It>一定回数)の場合に対応付け処理を終了し
て、仮説検証手段13の内部メモリに格納された相違度
Cbを相違度出力手段7に送出する(ステップST1
0)。その他の場合、特徴点対応付け手段10は、温度
パラメータTを徐々に下げながら、ステップST5から
ステップST10までの処理を繰り返す。最後に、相違
度出力手段7は、特徴点対応付け手段10で得た相違度
Cbを本文字認識装置の外部に出力する。焼きなまし法
は、温度Tを下げながら、式(4)に従って状態を変化
させることで局所解にとらわれることなく、評価値の値
が最小となる状態を探索する手法である。従って、上記
処理は、焼きなまし法に基づいて、相違度Cbを最小と
するオブジェクト同士の対応付け状態を探索する機能を
持つ。上記処理において、初期状態の温度Tは、式
(4)で求めるPL の値が十分に大きくなるように設定
し、かつ、次式(5)に従ってTの値を低下させる。こ
れは、本条件を用いて焼きなまし法を行うことにより、
確率1で関数の最小解にたどり着くことが証明されてい
るためである。 T=1/1n(It) (5)
【0035】本実施の形態によれば、仮説生成手段11
は入力オブジェクトを統合する(Combine)、統
合した入力オブジェクトを元に戻す(Divide)等
の仮説を生成する。そのため、文字の切れや掠れによ
り、本来1個のオブジェクトは複数個のオブジェクトに
分割された場合でも、正しく対応付けを行うことができ
る。
は入力オブジェクトを統合する(Combine)、統
合した入力オブジェクトを元に戻す(Divide)等
の仮説を生成する。そのため、文字の切れや掠れによ
り、本来1個のオブジェクトは複数個のオブジェクトに
分割された場合でも、正しく対応付けを行うことができ
る。
【0036】更に、特徴点対応付け手段10は、確率的
弛緩法に比べ計算規模が小さい焼きなまし法を基に対応
付けを行うため、認識に要する計算規模が小さくて済
む。また、文字の切れや掠れに対処するために仮想オブ
ジェクトを生成する必要がなく、対応付けの候補数を減
らすことができるため、計算規模が更に削減できる。具
体的に、参照オブジェクト数をNf、入力オブジェクト
数をNI、仮想オブジェクト数をNvとした時、弛緩法
を用いた従来の構造解析的文字認識装置は、O(Nf×
(NI+Nv)2 )の計算規模を要するが、本装置はO
(Nf×NI)の計算規模で済む。更に、特徴点対応付
け手段10は、相違度評価手段12で定義した相違度を
最小とするようにオブジェクト同士を対応付ける。その
ため、従来装置のように、求めたオブジェクト同士の対
応付け結果が、必ずしも相違度を最小にしないというこ
とがなくなる。
弛緩法に比べ計算規模が小さい焼きなまし法を基に対応
付けを行うため、認識に要する計算規模が小さくて済
む。また、文字の切れや掠れに対処するために仮想オブ
ジェクトを生成する必要がなく、対応付けの候補数を減
らすことができるため、計算規模が更に削減できる。具
体的に、参照オブジェクト数をNf、入力オブジェクト
数をNI、仮想オブジェクト数をNvとした時、弛緩法
を用いた従来の構造解析的文字認識装置は、O(Nf×
(NI+Nv)2 )の計算規模を要するが、本装置はO
(Nf×NI)の計算規模で済む。更に、特徴点対応付
け手段10は、相違度評価手段12で定義した相違度を
最小とするようにオブジェクト同士を対応付ける。その
ため、従来装置のように、求めたオブジェクト同士の対
応付け結果が、必ずしも相違度を最小にしないというこ
とがなくなる。
【0037】なお、本実施の形態では、入力文字パター
ン1と参照文字パターン2から同時に特徴抽出を行う構
成としたが、全ての参照文字パターンからの特徴抽出結
果を予めメモリに保存しておき、認識時には入力文字パ
ターン1からのみ特徴抽出を行う構成としてもよい。ま
た、本実施の形態では、従来例と同じく文字の輪郭線を
直線近似して求めた直線要素をオブジェクトとして用い
たが、例えば、文字パターンを細線化して求めた交点や
端点座標値等の様々な構造的特徴をオブジェクトとして
も、同様な効果が得られる。本実施の形態では、更新回
数Itが一定回数以上の場合に対応付け処理を終了する
としたが、仮説検証手段13において、過去一定回数以
上生成された仮説が受理されていなかったら、対応付け
処理を終了してもよい。
ン1と参照文字パターン2から同時に特徴抽出を行う構
成としたが、全ての参照文字パターンからの特徴抽出結
果を予めメモリに保存しておき、認識時には入力文字パ
ターン1からのみ特徴抽出を行う構成としてもよい。ま
た、本実施の形態では、従来例と同じく文字の輪郭線を
直線近似して求めた直線要素をオブジェクトとして用い
たが、例えば、文字パターンを細線化して求めた交点や
端点座標値等の様々な構造的特徴をオブジェクトとして
も、同様な効果が得られる。本実施の形態では、更新回
数Itが一定回数以上の場合に対応付け処理を終了する
としたが、仮説検証手段13において、過去一定回数以
上生成された仮説が受理されていなかったら、対応付け
処理を終了してもよい。
【0038】本実施の形態では、相違度評価手段12で
求める相違度をS+R+Pの値で説明したが、その他任
意の評価関数を用いて相違度を定義しても、同様な効果
が得られる。
求める相違度をS+R+Pの値で説明したが、その他任
意の評価関数を用いて相違度を定義しても、同様な効果
が得られる。
【0039】実施の形態2.実施の形態1における相違
度評価手段12では、任意の評価関数を用いてよいの
で、ここでは参照オブジェクトが入力オブジェクトに対
応付く確率を評価項目に加える場合を説明する。つま
り、各オブジェクトを線分の和で表現する場合、特定の
線分については対応付けが行われなくてもペナルティP
の値を低くして、その対応付けの重要度は相対的に低い
ことを表現する。本実施の形態における文字認識装置の
構成は、実施の形態1、つまり、図1と同じである。ま
た、図6は、本実施の形態の装置の動作を説明する図で
ある。図において、52は参照パターンの例、53は入
力文字パターンの例、54は参照パターンの例52から
抽出した参照オブジェクト、55は入力文字パターン5
3の例から抽出した入力オブジェクト、51は入力オブ
ジェクトに対応付かない参照オブジェクトである。
度評価手段12では、任意の評価関数を用いてよいの
で、ここでは参照オブジェクトが入力オブジェクトに対
応付く確率を評価項目に加える場合を説明する。つま
り、各オブジェクトを線分の和で表現する場合、特定の
線分については対応付けが行われなくてもペナルティP
の値を低くして、その対応付けの重要度は相対的に低い
ことを表現する。本実施の形態における文字認識装置の
構成は、実施の形態1、つまり、図1と同じである。ま
た、図6は、本実施の形態の装置の動作を説明する図で
ある。図において、52は参照パターンの例、53は入
力文字パターンの例、54は参照パターンの例52から
抽出した参照オブジェクト、55は入力文字パターン5
3の例から抽出した入力オブジェクト、51は入力オブ
ジェクトに対応付かない参照オブジェクトである。
【0040】以下、本実施の形態の装置の動作を図6を
用いて説明する。図6において、参照オブジェクト54
と入力オブジェクト55とを実施の形態1に示す方法で
対応付けると、はねの部分から抽出された参照オブジェ
クト51は、入力オブジェクトと対応付かない。この
際、もし何の考慮も払わなければ、参照オブジェクト5
4と入力オブジェクト55は同一カテゴリ“2”に属す
るにもかかわらず、参照オブジェクト51が対応付かな
いためにペナルティPの値が増加し、相違度が大きくな
る。しかし、参照オブジェクト51の部分は、カテゴリ
“2”にある場合もない場合もあるので、この部分のオ
ブジェクトとしての重要度は低い。そこで、参照オブジ
ェクト51の部分が対応付かないペナルティPの値を予
め低く設定しておく。このように、予め各参照オブジェ
クトが入力オブジェクトと対応付く確率を求めておき、
その特定部分の対応付け確率を低く設定しておく。従っ
て、ある参照オブジェクトが入力オブジェクトと対応付
かず、対応付けの結果が“Nomatch”と判定され
た場合でも、その参照オブジェクトの対応付け確率が低
い場合はペナルティPの値は増えず、相違度への影響が
少なくなる。
用いて説明する。図6において、参照オブジェクト54
と入力オブジェクト55とを実施の形態1に示す方法で
対応付けると、はねの部分から抽出された参照オブジェ
クト51は、入力オブジェクトと対応付かない。この
際、もし何の考慮も払わなければ、参照オブジェクト5
4と入力オブジェクト55は同一カテゴリ“2”に属す
るにもかかわらず、参照オブジェクト51が対応付かな
いためにペナルティPの値が増加し、相違度が大きくな
る。しかし、参照オブジェクト51の部分は、カテゴリ
“2”にある場合もない場合もあるので、この部分のオ
ブジェクトとしての重要度は低い。そこで、参照オブジ
ェクト51の部分が対応付かないペナルティPの値を予
め低く設定しておく。このように、予め各参照オブジェ
クトが入力オブジェクトと対応付く確率を求めておき、
その特定部分の対応付け確率を低く設定しておく。従っ
て、ある参照オブジェクトが入力オブジェクトと対応付
かず、対応付けの結果が“Nomatch”と判定され
た場合でも、その参照オブジェクトの対応付け確率が低
い場合はペナルティPの値は増えず、相違度への影響が
少なくなる。
【0041】オブジェクトの部分毎の対応付けの確率
は、例えば、以下のように求めることができる。まず、
ある参照パターンと、その参照パターンと同じカテゴリ
に属する複数の入力パターンを用意し、実施の形態1に
示した方法により、オブジェクト同士を対応付ける。対
応付けの結果、参照オブジェクトが入力オブジェクトと
対応付かず“Nomatch”となった場合、その参照
オブジェクトは“対応不能”であるとし、その他の場合
は“対応可”とする。この処理を用意した、例えば、1
000個の複数の入力パターンに対して行い、各参照オ
ブジェクトが“対応可”となる確率を対応付け確率とす
る。上述のカテゴリ“2”の最後のはねの部分は、10
00個の入力パターン中にある場合もない場合もあり、
ある場合は、“Nomatch”となる。しかし、それ
でも同一カテゴリになるので、このはねの部分の“No
match”の際のペナルティは低くする。
は、例えば、以下のように求めることができる。まず、
ある参照パターンと、その参照パターンと同じカテゴリ
に属する複数の入力パターンを用意し、実施の形態1に
示した方法により、オブジェクト同士を対応付ける。対
応付けの結果、参照オブジェクトが入力オブジェクトと
対応付かず“Nomatch”となった場合、その参照
オブジェクトは“対応不能”であるとし、その他の場合
は“対応可”とする。この処理を用意した、例えば、1
000個の複数の入力パターンに対して行い、各参照オ
ブジェクトが“対応可”となる確率を対応付け確率とす
る。上述のカテゴリ“2”の最後のはねの部分は、10
00個の入力パターン中にある場合もない場合もあり、
ある場合は、“Nomatch”となる。しかし、それ
でも同一カテゴリになるので、このはねの部分の“No
match”の際のペナルティは低くする。
【0042】実施の形態2によれば、参照オブジェクト
が入力オブジェクトと対応付く確率を比較する各部分毎
に考慮して相違度をある部分は低くして計算するため、
入力オブジェクトと対応付く確率が低い参照オブジェク
トによる相違度の増加を抑制して、高精度な認識が可能
となる。
が入力オブジェクトと対応付く確率を比較する各部分毎
に考慮して相違度をある部分は低くして計算するため、
入力オブジェクトと対応付く確率が低い参照オブジェク
トによる相違度の増加を抑制して、高精度な認識が可能
となる。
【0043】実施の形態3.実施の形態1,2では、参
照オブジェクトと入力オブジェクトの対応付け結果を基
に相違度を算出したが、この相違度の算出に従来の特徴
マッチングによる相違度を併用して加算してもよい。以
下、本実施の形態の装置を図7及至図10に基づいて説
明する。図7は、実施の形態における文字認識装置の構
成を示すブロック図である。図7中、先の実施の形態1
と同一又は相当部分の要素は同一の符号を付し、その説
明を省略する。図において、60は低次特徴抽出手段で
あり、一般に特徴マッチング的文字認識方式で使用され
る輪郭方向コード特徴や濃淡特徴等の特徴(低次特徴)
を文字パターンから抽出する。
照オブジェクトと入力オブジェクトの対応付け結果を基
に相違度を算出したが、この相違度の算出に従来の特徴
マッチングによる相違度を併用して加算してもよい。以
下、本実施の形態の装置を図7及至図10に基づいて説
明する。図7は、実施の形態における文字認識装置の構
成を示すブロック図である。図7中、先の実施の形態1
と同一又は相当部分の要素は同一の符号を付し、その説
明を省略する。図において、60は低次特徴抽出手段で
あり、一般に特徴マッチング的文字認識方式で使用され
る輪郭方向コード特徴や濃淡特徴等の特徴(低次特徴)
を文字パターンから抽出する。
【0044】図8は、一般的な低次特徴を説明する図で
ある。図において、70は入力文字パターンの例、71
は入力文字パターン70の例から抽出された低次特徴で
ある。また、図9は、低次特徴抽出手段60の動作を説
明する図である。図において、80は参照オブジェクト
例、81は入力オブジェクト例、82は参照オブジェク
ト、83は参照オブジェクト82と対応付く入力オブジ
ェクト、84は参照文字パターンの領域分割、85はオ
ブジェクト対応付け結果を考慮した入力文字パターンの
領域分割である。また、図10は、本実施の形態の動作
を示すフローチャートである。
ある。図において、70は入力文字パターンの例、71
は入力文字パターン70の例から抽出された低次特徴で
ある。また、図9は、低次特徴抽出手段60の動作を説
明する図である。図において、80は参照オブジェクト
例、81は入力オブジェクト例、82は参照オブジェク
ト、83は参照オブジェクト82と対応付く入力オブジ
ェクト、84は参照文字パターンの領域分割、85はオ
ブジェクト対応付け結果を考慮した入力文字パターンの
領域分割である。また、図10は、本実施の形態の動作
を示すフローチャートである。
【0045】以降、図7に示す構造解析的文字認識装置
の動作を図10のフローチャートに従い説明する。ま
ず、実施の形態1と同様に、特徴抽出手段3は、入力・
参照文字パターンからオブジェクトを抽出する(ステッ
プST91)。次に、仮説生成手段11は、抽出したオ
ブジェクトから対応付け仮説を作成し、作成した対応付
け仮説を低次特徴抽出手段60と相違度評価手段12と
仮説検証手段13に送出する(ステップST92)。
の動作を図10のフローチャートに従い説明する。ま
ず、実施の形態1と同様に、特徴抽出手段3は、入力・
参照文字パターンからオブジェクトを抽出する(ステッ
プST91)。次に、仮説生成手段11は、抽出したオ
ブジェクトから対応付け仮説を作成し、作成した対応付
け仮説を低次特徴抽出手段60と相違度評価手段12と
仮説検証手段13に送出する(ステップST92)。
【0046】次に、低次特徴抽出手段60は、仮説生成
手段11で作成した対応付け仮説を基にして、入力文字
パターン1と参照文字パターン2の双方から低次特徴を
抽出する(ステップST93)。この低次特徴として
は、例えば、輪郭方向特徴を抽出する。一般に、輪郭方
向特徴とは、文字パターンを縦横N等分して作成した各
小領域の中で、特定の方向を持つ文字の輪郭点の数を合
計し、この値を特徴値として抽出する。例えば、図8中
の71は入力文字パターン70を縦横5等分し、水平
(H)、垂直(V)、右上がり(R)、左下がり(L)
の方向を持つ場合の輪郭方向特徴(5×5領域、4方向
の計100次元)を示す。以降、参照文字パターンと入
力文字パターンから求めた低次特徴を、各々参照特徴、
入力特徴と呼ぶ。
手段11で作成した対応付け仮説を基にして、入力文字
パターン1と参照文字パターン2の双方から低次特徴を
抽出する(ステップST93)。この低次特徴として
は、例えば、輪郭方向特徴を抽出する。一般に、輪郭方
向特徴とは、文字パターンを縦横N等分して作成した各
小領域の中で、特定の方向を持つ文字の輪郭点の数を合
計し、この値を特徴値として抽出する。例えば、図8中
の71は入力文字パターン70を縦横5等分し、水平
(H)、垂直(V)、右上がり(R)、左下がり(L)
の方向を持つ場合の輪郭方向特徴(5×5領域、4方向
の計100次元)を示す。以降、参照文字パターンと入
力文字パターンから求めた低次特徴を、各々参照特徴、
入力特徴と呼ぶ。
【0047】低次特徴抽出手段60では、参照文字パタ
ーンに対して上記方法により輪郭方向特徴を抽出する。
ただし、入力文字パターンに対しては、文字パターンを
縦横N等分して小領域を作成する代わりに、仮説生成手
段11で作成した対応付け仮説に基づいて小領域を作成
する。具体的には、i行j列番の小領域に含まれる参照
オブジェクトに対応付いた入力オブジェクトが、同じく
i行j列番の小領域に含まれるように、入力文字パター
ンの領域分割を歪める。例えば、図9中の参照オブジェ
クト80と入力オブジェクト81に対して、仮説生成手
段11は、参照オブジェクト82と入力オブジェクト8
3とが対応付くような対応付け仮説を作成したとする。
この場合、低次特徴抽出手段60は、参照オブジェクト
82と入力オブジェクト83が同じ小領域に含まれるよ
うに、入力オブジェクトの領域分割を変更する。その結
果、参照文字パターンの領域分割結果84に対して、入
力文字パターンの領域分割は85に示すように変形した
形態となる。
ーンに対して上記方法により輪郭方向特徴を抽出する。
ただし、入力文字パターンに対しては、文字パターンを
縦横N等分して小領域を作成する代わりに、仮説生成手
段11で作成した対応付け仮説に基づいて小領域を作成
する。具体的には、i行j列番の小領域に含まれる参照
オブジェクトに対応付いた入力オブジェクトが、同じく
i行j列番の小領域に含まれるように、入力文字パター
ンの領域分割を歪める。例えば、図9中の参照オブジェ
クト80と入力オブジェクト81に対して、仮説生成手
段11は、参照オブジェクト82と入力オブジェクト8
3とが対応付くような対応付け仮説を作成したとする。
この場合、低次特徴抽出手段60は、参照オブジェクト
82と入力オブジェクト83が同じ小領域に含まれるよ
うに、入力オブジェクトの領域分割を変更する。その結
果、参照文字パターンの領域分割結果84に対して、入
力文字パターンの領域分割は85に示すように変形した
形態となる。
【0048】次に、相違度算出手段12は、実施の形態
1と同様な方式により、仮説生成手段11で作成した対
応付け仮説に対して相違度を求める。更に、低次特徴抽
出手段60で求めた参照特徴と入力特徴とのユークリッ
ド距離値を計算し、この距離値を相違度に加算する(ス
テップST94)。
1と同様な方式により、仮説生成手段11で作成した対
応付け仮説に対して相違度を求める。更に、低次特徴抽
出手段60で求めた参照特徴と入力特徴とのユークリッ
ド距離値を計算し、この距離値を相違度に加算する(ス
テップST94)。
【0049】以降の処理は、実施の形態1と同じであ
る。まず、仮説検証手段13は対応付け仮説を受理する
か否かを判定し(ステップST95)、受理する場合
は、対応付け仮説を現状の対応付け仮説として保存する
(ステップST96)。そして、現状の対応付け仮説を
仮説生成手段11へ送出する。
る。まず、仮説検証手段13は対応付け仮説を受理する
か否かを判定し(ステップST95)、受理する場合
は、対応付け仮説を現状の対応付け仮説として保存する
(ステップST96)。そして、現状の対応付け仮説を
仮説生成手段11へ送出する。
【0050】次に、特徴点対応付け手段10は、更新回
数Itが一定以上である場合に対応付け処理を終了し、
求めた相違度を相違度出力手段7に送出する(ステップ
ST97)。その他の場合は、Itをインクリメントし
ながら、上記ステップST92からステップST97を
繰り返す。最後に、相違度出力手段7は求めた相違度を
外部に出力する。
数Itが一定以上である場合に対応付け処理を終了し、
求めた相違度を相違度出力手段7に送出する(ステップ
ST97)。その他の場合は、Itをインクリメントし
ながら、上記ステップST92からステップST97を
繰り返す。最後に、相違度出力手段7は求めた相違度を
外部に出力する。
【0051】本実施の形態によれば、低次特徴抽出手段
60は、対応付けの仮説に基づいて特徴抽出のための領
域分割を行い、参照文字パターンにあわせて字形の変動
を吸収した低次特徴が抽出される。更に、オブジェクト
の対応関係に基づいた相違度と低次特徴の差から求めた
相違度の合計値が最小となるように、オブジェクト同士
を対応付ける。そのため、構造的な特徴と低次の特徴の
双方からみて最適な対応付けの結果を得ることができ、
高精度に文字を認識することが可能となる。本実施の形
態では、低次特徴として輪郭方向特徴を例に説明した
が、ペリフェラル特徴や濃淡特徴等の別の特徴を用いて
も、同様な効果を得ることができる。また、本実施の形
態では、ユークリッド距離値を用いて低次特徴間の距離
値を求めたが、内積値やシティブロック距離値を用いて
も、同様な効果を得ることができる。
60は、対応付けの仮説に基づいて特徴抽出のための領
域分割を行い、参照文字パターンにあわせて字形の変動
を吸収した低次特徴が抽出される。更に、オブジェクト
の対応関係に基づいた相違度と低次特徴の差から求めた
相違度の合計値が最小となるように、オブジェクト同士
を対応付ける。そのため、構造的な特徴と低次の特徴の
双方からみて最適な対応付けの結果を得ることができ、
高精度に文字を認識することが可能となる。本実施の形
態では、低次特徴として輪郭方向特徴を例に説明した
が、ペリフェラル特徴や濃淡特徴等の別の特徴を用いて
も、同様な効果を得ることができる。また、本実施の形
態では、ユークリッド距離値を用いて低次特徴間の距離
値を求めたが、内積値やシティブロック距離値を用いて
も、同様な効果を得ることができる。
【0052】上述の実施の形態において、低次特徴抽出
手段60は、入力文字パターン1と参照文字パターン2
の双方から低次特徴を抽出し、その低次特徴間の距離値
を相違度に加えた。しかし、低次特徴抽出手段60は、
入力文字パターン1からのみ低次特徴を抽出し、相違度
評価手段12は、低次特徴辞書に格納した辞書データを
用いた特徴マッチング的文字認識方式により、低次特徴
抽出手段で抽出された低次特徴を認識して距離値を求
め、相違度に加算してもよい。図11は、本実施の形態
の構成を示すブロック図であり、図11中、図7の要素
と同一又は相当部分は同一の符号を付し、その説明を省
略する。図において、100は低次特徴辞書である。
手段60は、入力文字パターン1と参照文字パターン2
の双方から低次特徴を抽出し、その低次特徴間の距離値
を相違度に加えた。しかし、低次特徴抽出手段60は、
入力文字パターン1からのみ低次特徴を抽出し、相違度
評価手段12は、低次特徴辞書に格納した辞書データを
用いた特徴マッチング的文字認識方式により、低次特徴
抽出手段で抽出された低次特徴を認識して距離値を求
め、相違度に加算してもよい。図11は、本実施の形態
の構成を示すブロック図であり、図11中、図7の要素
と同一又は相当部分は同一の符号を付し、その説明を省
略する。図において、100は低次特徴辞書である。
【0053】このように構成した構造解析的認識方式に
おいて、低次特徴辞書100は、単に参照文字パターン
から抽出した低次特徴を格納するだけでなく、統計情報
を考慮した特徴マッチング的認識方式を行うのに必要な
特徴値の平均値や分散及び固有値や固有ベクトル等の情
報を格納する。また、相違度評価手段12は、低次特徴
辞書100に格納された辞書データを用いた特徴マッチ
ング的文字認識方式により、低次特徴抽出手段60で入
力文字パターンから求めた低次特徴を認識して距離値を
求める。そして、実施の形態1と同じ方法で求めた相違
度に、求めた距離値を加算する。
おいて、低次特徴辞書100は、単に参照文字パターン
から抽出した低次特徴を格納するだけでなく、統計情報
を考慮した特徴マッチング的認識方式を行うのに必要な
特徴値の平均値や分散及び固有値や固有ベクトル等の情
報を格納する。また、相違度評価手段12は、低次特徴
辞書100に格納された辞書データを用いた特徴マッチ
ング的文字認識方式により、低次特徴抽出手段60で入
力文字パターンから求めた低次特徴を認識して距離値を
求める。そして、実施の形態1と同じ方法で求めた相違
度に、求めた距離値を加算する。
【0054】上述の構成によれば、低次特徴辞書100
は、特徴マッチング的文字認識を行うのに必要な特徴値
の平均値や分散及び固有値や固有ベクトル等のデータを
格納し、相違度評価手段12は、これらのデータを用い
た高精度な特徴マッチング的文字認識により相違度を計
算する。そのため、高精度な文字の認識が可能となる。
なお、本実施の形態では、低次特徴辞書100に格納す
る情報として平均値や分散及び固有値や固有ベクトル等
の統計情報を用いて説明したが、特徴マッチング的認識
方式を、例えば、バックプロパゲーションモデルやLV
Qモデル等のニューラルネットで構成し、ニューラルネ
ットワークの内部データ(シナプス荷重値等)を低次特
徴辞書100に格納しても、同様な効果を得ることがで
きる。
は、特徴マッチング的文字認識を行うのに必要な特徴値
の平均値や分散及び固有値や固有ベクトル等のデータを
格納し、相違度評価手段12は、これらのデータを用い
た高精度な特徴マッチング的文字認識により相違度を計
算する。そのため、高精度な文字の認識が可能となる。
なお、本実施の形態では、低次特徴辞書100に格納す
る情報として平均値や分散及び固有値や固有ベクトル等
の統計情報を用いて説明したが、特徴マッチング的認識
方式を、例えば、バックプロパゲーションモデルやLV
Qモデル等のニューラルネットで構成し、ニューラルネ
ットワークの内部データ(シナプス荷重値等)を低次特
徴辞書100に格納しても、同様な効果を得ることがで
きる。
【0055】実施の形態4.なお、実施の形態1〜3で
は、予め用意した参照文字パターン2から参照オブジェ
クトを抽出してオブジェクト対応付けに用いたが、オブ
ジェクトの抽出に先立って前処理として、予め用意した
参照文字パターンに傾き処理や太め処理等のパターン変
換処理を加えるようにしてもよい。以下、本発明の実施
の形態の文字認識装置を図12と図13に基づいて説明
する。
は、予め用意した参照文字パターン2から参照オブジェ
クトを抽出してオブジェクト対応付けに用いたが、オブ
ジェクトの抽出に先立って前処理として、予め用意した
参照文字パターンに傾き処理や太め処理等のパターン変
換処理を加えるようにしてもよい。以下、本発明の実施
の形態の文字認識装置を図12と図13に基づいて説明
する。
【0056】図12は、本実施の形態における構造解析
的文字認識装置の構成を示すブロック図である。図12
中、先の実施の形態1と同一又は相当部分は同一の符号
を付し、その説明を省略する。図において、111は外
部命令及び入力文字パターン1の状態に従って、参照文
字パターン2に傾き処理や太め処理等のパターン変換処
理を加えるパターン変換手段であり、太め処理、傾き処
理、飾り付け処理、白抜き処理等のパターン変換処理を
有する。また、図13は、パターン変換手段111の動
作例を示す図であり、図において、120は元の参照文
字パターン、121〜124はパターン変換処理を加え
て作成した参照文字パターンの例である。
的文字認識装置の構成を示すブロック図である。図12
中、先の実施の形態1と同一又は相当部分は同一の符号
を付し、その説明を省略する。図において、111は外
部命令及び入力文字パターン1の状態に従って、参照文
字パターン2に傾き処理や太め処理等のパターン変換処
理を加えるパターン変換手段であり、太め処理、傾き処
理、飾り付け処理、白抜き処理等のパターン変換処理を
有する。また、図13は、パターン変換手段111の動
作例を示す図であり、図において、120は元の参照文
字パターン、121〜124はパターン変換処理を加え
て作成した参照文字パターンの例である。
【0057】図12に示す構成の構造解析的文字認識装
置において、入力文字パターン1と参照文字パターン2
を提示すると、まず、パターン変換手段111は、外部
からの命令又は入力文字パターンの状態に従って、特定
のパターン変換処理を参照文字パターンに加える。ここ
で外部からの命令は、文字パターンに加えるパターン変
換処理の種類を指定する。
置において、入力文字パターン1と参照文字パターン2
を提示すると、まず、パターン変換手段111は、外部
からの命令又は入力文字パターンの状態に従って、特定
のパターン変換処理を参照文字パターンに加える。ここ
で外部からの命令は、文字パターンに加えるパターン変
換処理の種類を指定する。
【0058】また、入力文字パターンの状態に従って、
特定のパターン変換処理を選択する場合は、例えば、入
力文字パターン1において、輪郭点数/黒画素数が一定
値以下の場合は、入力文字パターン1が太い文字である
と仮定して、参照文字パターン2に太め処理を加える。
逆に、輪郭点数/黒画素数が一定値より大きい場合は、
入力文字パターン1が白抜き文字であると仮定して、参
照文字パターン2に白抜き処理を加える。例えば、12
1〜124は参照文字パターン例120に、ぞれぞれ飾
りの付け処理、白抜き処理、傾き処理、太め処理等のパ
ターン変換処理を加えて得られた文字パターンである。
特定のパターン変換処理を選択する場合は、例えば、入
力文字パターン1において、輪郭点数/黒画素数が一定
値以下の場合は、入力文字パターン1が太い文字である
と仮定して、参照文字パターン2に太め処理を加える。
逆に、輪郭点数/黒画素数が一定値より大きい場合は、
入力文字パターン1が白抜き文字であると仮定して、参
照文字パターン2に白抜き処理を加える。例えば、12
1〜124は参照文字パターン例120に、ぞれぞれ飾
りの付け処理、白抜き処理、傾き処理、太め処理等のパ
ターン変換処理を加えて得られた文字パターンである。
【0059】次に、パターン変換手段111は、パター
ン変換処理を加えて作成した文字パターンを参照文字パ
ターン2とする。以降、先の実施の形態と同様に、オブ
ジェクト同士を対応付け、相違度を求める。
ン変換処理を加えて作成した文字パターンを参照文字パ
ターン2とする。以降、先の実施の形態と同様に、オブ
ジェクト同士を対応付け、相違度を求める。
【0060】本実施の形態によれば、パターン変換手段
111で各種の変換処理を加えた参照文字パターンを用
いて、以降のオブジェクト対応付け処理を行うことで、
参照文字パターンの数を増やすことなく、白抜き文字や
太字、傾いた文字等のさまざまなバリエーションの文字
を認識することができる。なお、本実施の形態では、パ
ターン変換手段111では、1種類のパターン変換処理
を参照文字パターンに加えた場合を説明したが、参照文
字パターンに対して同時に複数のパターン変換処理を加
えてもよい。
111で各種の変換処理を加えた参照文字パターンを用
いて、以降のオブジェクト対応付け処理を行うことで、
参照文字パターンの数を増やすことなく、白抜き文字や
太字、傾いた文字等のさまざまなバリエーションの文字
を認識することができる。なお、本実施の形態では、パ
ターン変換手段111では、1種類のパターン変換処理
を参照文字パターンに加えた場合を説明したが、参照文
字パターンに対して同時に複数のパターン変換処理を加
えてもよい。
【0061】上述の実施の形態4では、外部からの命令
又は入力文字パターン1の状態によってパターン変換処
理の種類を選択するとしたが、更に制限を加えて、相違
度出力手段7に入力された相違度が一定値以上の場合に
は、パターン変換手段111で前回と異なったパターン
変換処理を選択して、再度、特徴抽出手段3以降の処理
を行うようにしてもよい。以下、この場合の装置を図1
4に基づいて説明する。図14は、上述の構造解析的文
字認識装置の構成を示すブロック図である。
又は入力文字パターン1の状態によってパターン変換処
理の種類を選択するとしたが、更に制限を加えて、相違
度出力手段7に入力された相違度が一定値以上の場合に
は、パターン変換手段111で前回と異なったパターン
変換処理を選択して、再度、特徴抽出手段3以降の処理
を行うようにしてもよい。以下、この場合の装置を図1
4に基づいて説明する。図14は、上述の構造解析的文
字認識装置の構成を示すブロック図である。
【0062】図14に示すように構成した構造解析的文
字認識装置において、相違度出力手段7は、特徴点対応
付け手段10で求めた相違度が一定値よりも小さい場合
に、相違度を外部に出力する。その他の場合、相違度出
力手段7は、パターン変換手段111に対して、パター
ン変換の要求を送る。パターン変換手段111は、相違
度出力手段7からパターン変換の要求を受け取ると、前
回と異なったパターン変換処理を参照文字パターンに加
える。そして、再び参照パターンから特徴抽出を行い、
相違度を算出する。このように、パターンに変換を加え
て相違度を再計算する処理を、相違度が一定値以下とな
るまで繰り返す。もし、全てのパターン変換処理を加え
ても相違度が一定値以上の場合、相違度出力手段7は、
求められた相違度の内で最小の相違度を外部に出力し、
処理を終了する。
字認識装置において、相違度出力手段7は、特徴点対応
付け手段10で求めた相違度が一定値よりも小さい場合
に、相違度を外部に出力する。その他の場合、相違度出
力手段7は、パターン変換手段111に対して、パター
ン変換の要求を送る。パターン変換手段111は、相違
度出力手段7からパターン変換の要求を受け取ると、前
回と異なったパターン変換処理を参照文字パターンに加
える。そして、再び参照パターンから特徴抽出を行い、
相違度を算出する。このように、パターンに変換を加え
て相違度を再計算する処理を、相違度が一定値以下とな
るまで繰り返す。もし、全てのパターン変換処理を加え
ても相違度が一定値以上の場合、相違度出力手段7は、
求められた相違度の内で最小の相違度を外部に出力し、
処理を終了する。
【0063】
【発明の効果】以上のようにこの発明によれば、特徴抽
出された入力・参照文字の各オブジェクト同士を交換・
結合・分離して、繰り返し演算毎に新しく対応付けした
仮説を選ぶ仮設生成手段と、相違度評価して受理可能な
仮説の値と相違度を記憶する仮説検証手段を備えたの
で、計算規模が小さい焼きなまし法に基づいた方式であ
り、計算規模が小さく、しかも、文字の切れや掠れによ
り入力文字パターンのオブジェクトが細かく分割された
場合も、正しく対応付けを行える効果がある。また、特
徴点対応付け手段は、相違度の値を基にオブジェクトの
対応関係を求めるため、従来の欠点である求めたオブジ
ェクトの対応付け結果と相違度を最小とが対応しないこ
ともあるという不具合をなくす効果もある。
出された入力・参照文字の各オブジェクト同士を交換・
結合・分離して、繰り返し演算毎に新しく対応付けした
仮説を選ぶ仮設生成手段と、相違度評価して受理可能な
仮説の値と相違度を記憶する仮説検証手段を備えたの
で、計算規模が小さい焼きなまし法に基づいた方式であ
り、計算規模が小さく、しかも、文字の切れや掠れによ
り入力文字パターンのオブジェクトが細かく分割された
場合も、正しく対応付けを行える効果がある。また、特
徴点対応付け手段は、相違度の値を基にオブジェクトの
対応関係を求めるため、従来の欠点である求めたオブジ
ェクトの対応付け結果と相違度を最小とが対応しないこ
ともあるという不具合をなくす効果もある。
【0064】また更に、相違度評価の際に、各参照オブ
ジェクトが入力オブジェクトと対応付く確率を予め求め
ておき、特定オブジェクトについては、対応付けの確率
によるペナルティを加減するので、存在確率の低い参照
オブジェクトの悪影響を除くことができる効果がある。
ジェクトが入力オブジェクトと対応付く確率を予め求め
ておき、特定オブジェクトについては、対応付けの確率
によるペナルティを加減するので、存在確率の低い参照
オブジェクトの悪影響を除くことができる効果がある。
【0065】また更に、相違度評価に際して、各領域か
ら特徴を抽出する低次特徴抽出手段を併用したので、低
次の特徴と構造的な特徴の双方からみて、最適なオブジ
ェクトの対応付け結果が得られる効果がある。
ら特徴を抽出する低次特徴抽出手段を併用したので、低
次の特徴と構造的な特徴の双方からみて、最適なオブジ
ェクトの対応付け結果が得られる効果がある。
【0066】また更に、特徴抽出に先立ち、文字パター
ンに所定のパターン変形処理を加えて新たな文字パター
ンを作成するパターン変換手段を付加したので、1つの
参照パターンで各種変形の加わった入力文字パターンを
認識でき、辞書のサイズを小さくできる効果がある。
ンに所定のパターン変形処理を加えて新たな文字パター
ンを作成するパターン変換手段を付加したので、1つの
参照パターンで各種変形の加わった入力文字パターンを
認識でき、辞書のサイズを小さくできる効果がある。
【0067】また更に、相違度の値が一定値以下となる
と、順次異なったパターン変換処理をするようにしたの
で、相違度が小さくなるパターン変換処理を見つけて処
理し、各種変形の加わった文字を認識できる効果があ
る。
と、順次異なったパターン変換処理をするようにしたの
で、相違度が小さくなるパターン変換処理を見つけて処
理し、各種変形の加わった文字を認識できる効果があ
る。
【図1】 この発明の実施の形態1における文字認識装
置の構成を示すブロック図である。
置の構成を示すブロック図である。
【図2】 実施の形態1における初期状態の対応付け仮
説を説明する図である。
説を説明する図である。
【図3】 実施の形態1における仮説生成手段の動作を
説明する図である。
説明する図である。
【図4】 実施の形態1における特徴点対応付け手段の
動作を示すフローチャート図である。
動作を示すフローチャート図である。
【図5】 図4におけるステップST6の詳細フローチ
ャート図である。
ャート図である。
【図6】 実施の形態2の装置の動作を説明する図であ
る。
る。
【図7】 実施の形態3における文字認識装置の構成を
示すブロック図である。
示すブロック図である。
【図8】 低次特徴の抽出動作を説明する図である。
【図9】 実施の形態3における低次特徴の抽出例を示
す図である。
す図である。
【図10】 実施の形態3の装置の動作を示すフローチ
ャート図である。
ャート図である。
【図11】 実施の形態3における他の文字認識装置の
構成を示すブロック図である。
構成を示すブロック図である。
【図12】 実施の形態4における文字認識装置の構成
を示すブロック図である。
を示すブロック図である。
【図13】 実施の形態4におけるパターン変換手段の
動作を説明する図である。
動作を説明する図である。
【図14】 実施の形態4における他の文字認識装置の
構成を示すブロック図である。
構成を示すブロック図である。
【図15】 従来装置の全体構成を示すブロック図であ
る。
る。
【図16】 従来装置において抽出されたオブジェクト
の例を示す図である。
の例を示す図である。
【図17】 従来装置における仮想オブジェクト作成手
段の動作を説明する図である。
段の動作を説明する図である。
【図18】 従来装置における弛緩整合手段の動作を説
明する図である。
明する図である。
1 入力文字パターン、2 参照文字パターン、3 特
徴抽出手段、4 仮想オブジェクト作成手段、5 弛緩
整合手段、6 相違度算出手段、7 相違度出力手段、
10 特徴点対応付け手段、11 仮説生成手段、12
相違度評価手段、13 仮説検証手段、20 初期状
態で参照オブジェクトと対応付いた入力オブジェクト、
21 参照オブジェクト1Bの対応付け候補、31〜3
3 新たな対応付け仮説、51 対応付かない参照オブ
ジェクト、52 参照パターン例、53 入力文字パタ
ーン例、54 参照オブジェクト、55 入力オブジェ
クト、60 低次特徴抽出手段、70 入力文字パター
ン例、71 低次特徴の例、80 参照オブジェクト
例、81 入力オブジェクト例、82 参照オブジェク
ト、83 参照オブジェクトと対応付く入力オブジェク
ト、84 参照文字パターンの領域分割、85 入力文
字パターンの領域分割、100 低次特徴辞書、111
パターン変換手段、121 参照文字パターン例、1
21〜124パターン変換処理を加えた参照文字パター
ン例、211 入力文字パターン例、212 参照文字
パターン、213 入力オブジェクト、214 参照オ
ブジェクト、215 入力オブジェクトリスト、216
参照オブジェクトリスト、220 仮想オブジェクト
の情報、221 仮想オブジェクト作成手段の出力、2
30 参照オブジェクト1Bの対応付け候補例、231
参照オブジェクトと対応付いた入力、仮想オブジェク
ト。
徴抽出手段、4 仮想オブジェクト作成手段、5 弛緩
整合手段、6 相違度算出手段、7 相違度出力手段、
10 特徴点対応付け手段、11 仮説生成手段、12
相違度評価手段、13 仮説検証手段、20 初期状
態で参照オブジェクトと対応付いた入力オブジェクト、
21 参照オブジェクト1Bの対応付け候補、31〜3
3 新たな対応付け仮説、51 対応付かない参照オブ
ジェクト、52 参照パターン例、53 入力文字パタ
ーン例、54 参照オブジェクト、55 入力オブジェ
クト、60 低次特徴抽出手段、70 入力文字パター
ン例、71 低次特徴の例、80 参照オブジェクト
例、81 入力オブジェクト例、82 参照オブジェク
ト、83 参照オブジェクトと対応付く入力オブジェク
ト、84 参照文字パターンの領域分割、85 入力文
字パターンの領域分割、100 低次特徴辞書、111
パターン変換手段、121 参照文字パターン例、1
21〜124パターン変換処理を加えた参照文字パター
ン例、211 入力文字パターン例、212 参照文字
パターン、213 入力オブジェクト、214 参照オ
ブジェクト、215 入力オブジェクトリスト、216
参照オブジェクトリスト、220 仮想オブジェクト
の情報、221 仮想オブジェクト作成手段の出力、2
30 参照オブジェクト1Bの対応付け候補例、231
参照オブジェクトと対応付いた入力、仮想オブジェク
ト。
Claims (6)
- 【請求項1】 評価対象の入力文字によるオブジェクト
と、評価基準である参照文字によるオブジェクトを比較
評価するために、 前回の演算における評価基準の参照文字の設定オブジェ
クトを仮説検証結果の変更指示に基づいてある確率で交
換と結合と分離の少なくともいずれかの操作を行って新
しい参照文字の設定オブジェクトを生成する仮説生成手
段と、 上記仮説生成手段で生成した新しい参照文字の設定オブ
ジェクトと、評価対象の入力文字のオブジェクトとの相
違度を所定の基準で求める相違度評価手段と、 上記相違度評価手段で求めた相違度に基づく受理確率
と、仮の確率とを比較して大きければ仮説が受理可能と
して上記参照文字の設定オブジェクトと対応する相違度
を記憶し、かつ仮説検証結果の変更指示として上記仮説
生成手段に新しい参照文字の設定オブジェクトの生成の
指示をする仮説検証手段とを備え、 上記仮説生成手段の動作から仮説検証手段の動作を所定
回数以上繰り返して、上記仮説検証手段が記憶する参照
文字の設定オブジェクト値を所定の値として出力するよ
うにした文字認識装置。 - 【請求項2】 相違度評価手段は、参照文字の設定オブ
ジェクトと評価対象の入力文字のオブジェクトとの相違
度を求める際に、特定部分の評価の寄与度が低くなるよ
うな対応付け確率係数を設けて、総合相違度を求めるよ
うにしたことを特徴とする請求項1記載の文字認識装
置。 - 【請求項3】 相違度評価手段は、参照文字の設定オブ
ジェクトと評価対象の入力文字のオブジェクトとの相違
度を求める際に、低次特徴を抽出し、該抽出した低次特
徴を併用して総合相違度を求めるようにしたことを特徴
とする請求項1記載の文字認識装置。 - 【請求項4】 相違度評価手段は、低次特徴を抽出する
際に、該抽出領域を変更するようにしたことを特徴とす
る請求項3記載の文字認識装置。 - 【請求項5】 評価対象の入力文字によるオブジェクト
とし、評価基準である参照文字によるオブジェクトを比
較評価するのに先立ち、上記入力文字または参照文字の
いずれかまたは両方を前処理として変換して比較入力と
するパターン変換手段を付加したことを特徴とする請求
項1記載の文字認識装置。 - 【請求項6】 仮説生成手段の動作から仮説検証手段の
動作を所定回数以上繰り返して、上記仮説検証手段が記
憶する相違度が所定の値以上である場合に、パターン変
換の内容を変更するようにしたことを特徴とする請求項
5記載の文字認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP9039267A JPH10240866A (ja) | 1997-02-24 | 1997-02-24 | 文字認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP9039267A JPH10240866A (ja) | 1997-02-24 | 1997-02-24 | 文字認識装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH10240866A true JPH10240866A (ja) | 1998-09-11 |
Family
ID=12548377
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP9039267A Pending JPH10240866A (ja) | 1997-02-24 | 1997-02-24 | 文字認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH10240866A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015059930A1 (en) * | 2013-10-25 | 2015-04-30 | Wacom Co., Ltd. | Dynamic handwriting verification, handwriting-baseduser authentication, handwriting data generation, and handwriting data preservation |
US9235748B2 (en) | 2013-11-14 | 2016-01-12 | Wacom Co., Ltd. | Dynamic handwriting verification and handwriting-based user authentication |
US10032065B2 (en) | 2013-10-25 | 2018-07-24 | Wacom Co., Ltd. | Dynamic handwriting verification, handwriting-based user authentication, handwriting data generation, and handwriting data preservation |
-
1997
- 1997-02-24 JP JP9039267A patent/JPH10240866A/ja active Pending
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015059930A1 (en) * | 2013-10-25 | 2015-04-30 | Wacom Co., Ltd. | Dynamic handwriting verification, handwriting-baseduser authentication, handwriting data generation, and handwriting data preservation |
CN105556566A (zh) * | 2013-10-25 | 2016-05-04 | 株式会社和冠 | 动态手写验证、基于手写的用户认证、手写数据生成和手写数据保存 |
US10032065B2 (en) | 2013-10-25 | 2018-07-24 | Wacom Co., Ltd. | Dynamic handwriting verification, handwriting-based user authentication, handwriting data generation, and handwriting data preservation |
US10496872B2 (en) | 2013-10-25 | 2019-12-03 | Wacom Co., Ltd. | Dynamic handwriting verification, handwriting-based user authentication, handwriting data generation, and handwriting data preservation |
US10846510B2 (en) | 2013-10-25 | 2020-11-24 | Wacom Co., Ltd. | Dynamic handwriting verification, handwriting-based user authentication, handwriting data generation, and handwriting data preservation |
US9235748B2 (en) | 2013-11-14 | 2016-01-12 | Wacom Co., Ltd. | Dynamic handwriting verification and handwriting-based user authentication |
US9747491B2 (en) | 2013-11-14 | 2017-08-29 | Wacom Co., Ltd. | Dynamic handwriting verification and handwriting-based user authentication |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9785867B2 (en) | Character recognition device, image display device, image retrieval device, character recognition method, and computer program product | |
US7711156B2 (en) | Apparatus and method for generating shape model of object and apparatus and method for automatically searching for feature points of object employing the same | |
US20030219147A1 (en) | Object tracking apparatus and method | |
JP2012160178A (ja) | オブジェクト認識デバイス、オブジェクト認識を実施する方法および動的アピアランスモデルを実施する方法 | |
US20200327726A1 (en) | Method of Generating 3D Facial Model for an Avatar and Related Device | |
JP7163356B2 (ja) | ディープラーニングに基づく画像補正方法及びシステム | |
CN111401193B (zh) | 获取表情识别模型的方法及装置、表情识别方法及装置 | |
CN113378812A (zh) | 一种基于Mask R-CNN和CRNN的数字表盘识别方法 | |
CN111144466B (zh) | 一种图像样本自适应的深度度量学习方法 | |
CN110826534B (zh) | 一种基于局部主成分分析的人脸关键点检测方法及系统 | |
US7171047B2 (en) | Adaptive Sem edge recognition algorithm | |
JP2021068141A (ja) | 領域分割装置、領域分割方法および領域分割プログラム | |
JPH10240866A (ja) | 文字認識装置 | |
CN115205956B (zh) | 左右眼检测模型训练方法、识别左右眼的方法及装置 | |
JP2007157112A (ja) | 累積和基盤の変化点分析を利用した虹彩認識方法及びその装置 | |
JP3995181B2 (ja) | 個体識別装置 | |
JP4460277B2 (ja) | 画像の対応点探索方法、対応点探索装置および対応点探索プログラム | |
JPH10124662A (ja) | 図形整形装置および図形整形方法 | |
JP4034523B2 (ja) | 画像照合装置および画像照合方法 | |
JP2009205558A (ja) | 類似情報分類参照装置および類似情報分類参照方法 | |
WO2014129016A1 (ja) | 文字認識装置、文字認識方法及び記録媒体 | |
EP3731132A1 (en) | Method of generating 3d facial model for an avatar and related device | |
JP3029765B2 (ja) | 太め細め文字生成装置 | |
CN115359490A (zh) | 文本方向识别方法、装置、设备及存储介质 | |
CN117671685A (zh) | 一种文本中字符位置确定方法以及装置 |