JP3079202B2

JP3079202B2 - 文字認識方法及び文字認識装置

Info

Publication number: JP3079202B2
Application number: JP05075071A
Authority: JP
Inventors: 由美中山; 敏夫堤田
Original assignee: NTT Data Corp
Current assignee: NTT Data Group Corp
Priority date: 1993-03-10
Filing date: 1993-03-10
Publication date: 2000-08-21
Anticipated expiration: 2015-08-21
Also published as: JPH06259603A

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、文字認識装置（ＯＣ
Ｒ）における文字単位の認識結果の確からしさ（認識結
果の信頼性を数量化したもの：以下、候補確度と称す
る）を調べた上でリジェクト判定，或いは文字列照合等
の後処理を行う文字認識技術に関する。

【０００２】

【従来の技術】文字認識は、従来、図４に示すような構
成の文字認識装置により行われている。この種の文字認
識装置では、まず、帳票上の認識対象文字列をスキャナ
又は文字切り出し装置等の読取り手段（図示省略）によ
って文字単位に２値変換してパタン化し、それを特徴抽
出部１に入力している。特徴抽出部１では、入力された
文字パタンの特徴を解析し、その特徴ベクトルを表す信
号を識別部３に出力している。識別部３では、辞書メモ
リ２から取り出した認識対象カテゴリの標準的な特徴を
表す標準ベクトルと前述の特徴ベクトルとを照合し、両
者の類似度、例えば距離値を計算して、類似度の高い順
（距離値であればその距離が小さい順）に上位候補とな
るカテゴリ群を生成し、認識結果として、より上位候補
のカテゴリ情報とそのときの距離値情報とを出力してい
る。この距離値情報は、通常、後段のリジェクト判定、
或いは後処理のために候補確度を示す値として付加され
る。

【０００３】図５は、図４に示す文字認識装置による認
識結果の一例であって、マハラノビス距離（特徴間の統
計的相関を補う距離測度）を用いたときの距離値情報に
関する並び、即ち距離値列を示したものである。

【０００４】この距離値列において、ｘ軸方向は認識結
果の候補順位（上位１位から１０位まで）を表わし、ｙ
軸方向は各候補順位における夫々の距離値の大きさを表
わしている。

【０００５】ここで、一般的には、候補確度を代用する
尺度として、標準パタンとの類似性を重視し、第１位候
補やその次候補、即ち、第２位候補の独立性を考慮し
て、第１位候補の距離値の大きさと第２位候補の距離値
の大きさとの距離差の絶対値に着目するか、或いは、更
にこれらの２変数を組み合わせることによって、候補確
度の安定化を図っている。

【０００６】

【発明が解決しようとする課題】しかしながら、認識対
象文字パタンについて類似カテゴリが存在するか否か、
或いは当該文字パタンのカテゴリが漢字か非漢字か等の
カテゴリの相違により、カテゴリ毎の距離値の分布形
状、例えば、その平均値，分散等は、カテゴリ間で大き
く異なっているのが通常である。

【０００７】加えて、図５に示すパタンＡ，パタンＢの
ような２つの距離値列において、標準パタンと第１位候
補との類似性から見ればパタンＡが、又第２位候補以下
との独立性から見ればパタンＢが、夫々認識結果として
確からしく見えてしまう。こうした場合、上述した文字
認識装置のように、距離値という一次元的で個別な尺度
による手法では、いずれのパタンが確かであるかの判断
ができなくなることがある。

【０００８】要するに、従来の文字認識装置の場合、候
補文字のカテゴリ情報と距離値列とを複合的に扱ってい
ないので、前述の分布形状の全体を表現することができ
ず、候補確度の妥当性や安定性を高めることができない
という問題点があった。

【０００９】本発明は、かかる問題点を解消すべくなさ
れたもので、その目的とするところは、文字パタンの認
識結果に対して最適且つ安定的に候補確度を決定し得る
文字認識方法及び文字認識装置を提供することにある。

【００１０】本発明の文字認識方法は、入力された文字
パタンの特徴を表す特徴ベクトルと認識対象カテゴリの
標準的な特徴を表す標準ベクトルとを照合し、標準ベク
トルからの距離が小さい順に上位となる複数の候補カテ
ゴリと各候補カテゴリについての距離値ｄとを認識結果
として出力するステップを有する文字認識方法におい
て、互いに類似するカテゴリ群をグループ化した類似カ
テゴリグループ毎に、予め判別分析によってカテゴリ群
の正読傾向と誤読傾向とを判別するように判別係数値ｗ
を求めておき、前記認識結果に含まれる複数の候補カテ
ゴリの距離値ｄの分布形状を表す差分値データｄ’を作
成するとともに第１位候補カテゴリＣ１が属する類似カ
テゴリグループに対応する前記判別係数値ｗを特定し、
特定した判別係数値ｗと前記距離値ｄの内積と、特定し
た判別係数値ｗと前記差分値データｄ’の内積との総和
からなる判別関数値Ｈ（＝ｆ（ｗ、ｄ、ｄ’））を算出
し、この判別関数値Ｈを前記認識結果の確からしさを表
す候補確度として当該認識結果に付加することを特徴と
する。

【００１１】本発明の文字認識装置は、入力された文字
パタンの特徴を表す特徴ベクトルと認識対象カテゴリの
標準的な特徴を表す標準ベクトルとを照合し、標準ベク
トルからの距離が小さい順に上位となる複数の候補カテ
ゴリと各候補カテゴリについての距離値ｄとを認識結果
として出力する文字認識装置において、互いに類似する
カテゴリ群をグループ化した類似カテゴリグループを識
別するためのグループ番号を、入力が予定される文字パ
タンの各々のカテゴリを識別するためのカテゴリ番号と
対応付けて格納した第一のメモリと、類似カテゴリグル
ープ毎に、カテゴリ群の正読傾向と誤読傾向とを判別す
るように予め判別分析によって求めた判別係数値ｗを前
記グループ番号と対応付けて格納した第二のメモリと、
前記認識結果に含まれる複数の候補カテゴリの距離値ｄ
の分布形状を表す差分値データｄ’を作成する分布情報
作成手段と、前記認識結果に含まれる第１位候補カテゴ
リＣ１のカテゴリ番号に対応するグループ番号を第一メ
モリから抽出し、抽出したグループ番号に基づいて対応
する判別係数値ｗを第二のメモリから抽出するととも
に、抽出した判別係数値ｗと前記距離値ｄの内積と、抽
出した判別係数値ｗと算出された前記差分値データｄ’
の内積との総和からなる判別関数値Ｈ（＝ｆ（ｗ、ｄ、
ｄ’））を算出する候補確度算出手段とを設け、算出し
た判別関数値Ｈを前記認識結果の確からしさを表す候補
確度として当該認識結果と共に出力することを特徴とす
る。

【００１２】

【００１３】

【作用】文字パタンの認識処理により複数の候補カテゴ
リと各候補カテゴリ間の距離値情報が得られる。分布情
報生成手段は、この距離値情報から各候補カテゴリの分
布情報、例えば各候補カテゴリ間の距離値の列全体の分
布形状を表す差分値データを生成する。候補確度導出手
段は、個々の候補カテゴリが属する類似カテゴリグルー
プを特定し、特定した類似カテゴリグループの識別情報
を第一メモリから抽出するとともに、この識別情報に基
づいて対応する判別係数値を第二のメモリから抽出し、
抽出した判別係数値と分布情報とに基づいて候補確度を
個々の候補カテゴリ毎に導出する。このように、距離値
情報を複合的に扱い、候補カテゴリの分布情報を反映さ
せながら候補確度を導出することで、当該文字パタンを
認識する上で最も妥当な候補確度が導出される。

【００１４】

【実施例】以下に実施例を挙げ、本発明の文字認識方法
及び文字認識装置について、図面を参照して詳細に説明
する。図１は、本発明の文字認識方法の実施に適した文
字認識装置のブロック構成例を示した図である。なお、
図４に示した従来の文字認識装置と同一機能の構成部分
には同一符号を付してその説明を省略する。

【００１５】図１に示されるように、本実施例の文字認
識装置は、係数インデックス用メモリ１４、係数メモリ
１５、係数選択部１６、差分値作成部１７及び候補確度
算出部１８を備えている。

【００１６】係数インデックス用メモリ１４は、認識対
象となる文字パタンのカテゴリが属する類似カテゴリグ
ループのグループ番号を、入力が予定される文字パタン
の全カテゴリ分について格納している。また、係数メモ
リ１５は、類似カテゴリグループ毎に、正読傾向（文字
パタンが正しく読まれる傾向にあるカテゴリ群）と誤読
傾向（文字パタンが誤って読まれる傾向にあるカテゴリ
群）とを判別するように公知の判別分析を用いて学習し
た判別係数値を格納している。「判別分析」は、多変量
解析の分野で一般的に用いられている公知の分類手法で
あり、２つの群が与えられているときに、新たに与えら
れたパタンがどちらの群に属するかを判別する手法であ
る。本実施例に即していえば、文字パタンが正読傾向と
誤読傾向のどちらに属するかを判別する。この判別分析
の詳細については、以下の文献等に紹介されている。１）K.Fukunaga:“Statistical Pattern Recognition"S
econd Edition P.441-507,Academic Press,Inc(1990)、２）古谷野亘：“多変量解析ガイド”、P81-90，川島
書店(1988) ３）柳井晴夫，高木広文：“多変量解析ハンドブッ
ク”、現代数学社(1989)「学習」とは、正読傾向と誤読
傾向とを最も良く判別できるような境界を設定する処理
をいう。この処理についても、上記文献に詳しく紹介さ
れている。

【００１７】係数選択部１６は、係数インデックス用メ
モリ１４におけるグループ番号と識別部３から認識結果
として送られるカテゴリ情報とに基づいて、認識対象文
字パタンが属する類似カテゴリグループを決定すると共
に、係数メモリ１５から、そのときの判別係数値を出力
する。差分値作成部１７は、識別部３からの距離値情報
から距離値列全体の分布形状を表す複数の差分値データ
を求める。「距離値列全体の分布形状」としては、例え
ば標準パタンから第１位候補までの距離値が小さい／大
きい、第１位候補と第２位候補との距離値が大きい／小
さい、類似カテゴリが存在する場合に第１位候補と第２
位候補との距離値が小さい等が挙げられる。候補確度算
出部１８は、差分値作成部１７から得られる複数の差分
値データと係数選択部１６によって選択された判別係数
値との間で所定の判別関数を用いて内積をとり、その値
を各候補カテゴリの候補確度として導出する。

【００１８】図２は、係数インデックス用メモリ１４の
内容例を示した図であり、符号２０はカテゴリ番号、符
号２１は対応する類似カテゴリが属するグループのグル
ープ番号を表す。また、図３は係数メモリ１５の内容例
を示した図であり、符号３１は、図２に示した類似カテ
ゴリが属するグループのグループ番号２１に対応するグ
ループ毎の判別係数値を表す。このグループ毎の判別係
数値３１は予め設定されている。

【００１９】次に、この文字認識装置による実行される
文字認識方法、特に、候補確度を導出する処理を具体的
に説明する。ここでは、識別部３から以下に示すような
認識結果が得られた場合を想定して説明する。

【００２０】対象とする最大候補カテゴリ数をＫとする
と、カテゴリ情報Ｃは、下式で表わされる。

【００２１】

【数１】Ｃ＝｛Ｃk｜k=1,2,・・・,K｝（但し、Ｃkは第ｋ位の候補カテゴリ）

【００２２】また、距離値情報（距離値列）ｄは下式で
表わされる。

【数２】ｄ＝｛ｄk｜=1,2,・・・,K｝（但し、ｄkは第ｋ位の候補距離値）最初に第１位候補
カテゴリＣ1 に着目し、係数選択部１６で候補確度の算
出時に用いる判別係数値ｗを選択する。例えば第１位候
補カテゴリＣ1のカテゴリ番号が“３”であったとする
と、図２及び図３を参照すれば、このときの判別係数値
ｗは、下式の如く表わされる。

【００２３】

【数３】ｗ＝（ｗ21，ｗ22，・・・，ｗ2K，ｗ2(2・K-1)）差分値作成部１７は、上述した距離値列ｄを受けて距離
値列全体の分布形状に着目した差分値データ列ｄ´を求
める。

【００２４】

【数４】この差分値データ列ｄ´は下式の如く表わされ
る。ｄ´＝｛ｄ´k:ｄk+1-ｄk｜k=1,2,・・・,K-1｝（但し、ｄ´kは第ｋ位の候補距離値）次に、候補確度
算出部１８において、認識結果の距離値列ｄと、差分値
作成部１７で求めた差分値データ列ｄ´と、係数選択部
１６で求めた判別係数値ｗとをパラメタとした判別関数
ｆ（ｗ，ｄ，ｄ´）に基づいて認識結果の候補確度Ｈを
下式のように算出する。

【００２５】

【数５】Ｈ＝ｆ（ｗ，ｄ，ｄ´）＝ｗ21ｄ1＋ｗ22ｄ2 ＋・・・ｗ2・KｄK ＋ｗ2(K+1)ｄ´K＋ｗ2(K+2)ｄ´2＋・・・＋ｗ2(2・K-1)ｄ´K-1 この後、得られた候補確度Ｈを、認識結果の確からしさ
を数量化した値として後段のリジェクト判定処理や後処
理に適用させる。

【００２６】尚、上述した実施例における距離値の引用
及び差分値データｄ´の作成は、サンプル的に行ってい
るので、他の方法によっても行い得る。

【００２７】このように、本実施例では、各候補カテゴ
リの傾向に対応した判別係数値ｗ、距離値列ｄ、及び差
分値データ列ｄ´を求め、距離値系列全体の分布形状が
わかるように距離値情報を複合的に表現して候補確度を
導出するようにしたので、従来のように部分的な距離値
情報のみで表現した場合に比べて認識結果の妥当性が格
段に高まる。これにより、最適で、且つ、安定な候補確
度が得られ、従来の課題が解決される。

【００２８】なお、本発明は、この実施例の構成に拘束
されるものでなく、その要旨を逸脱しない範囲で任意に
変更が可能である。

【００２９】

【発明の効果】以上詳細に説明したように、本発明の文
字認識方法によれば、個々の類似カテゴリグループに対
して最適な候補確度が得られる。また、距離値情報を複
合的に扱い、候補カテゴリの分布情報を把握し得るよう
にしたので、当該文字パタンに対して最も妥当な候補確
度が安定的に得られるようになる。

【００３０】また、本発明の文字認識処理装置によれ
ば、最適な候補確度が得られるので、高精度なリジェク
ト判定処理、あるいは後処理の実現に寄与することが容
易になる。

【００３１】本発明は、私的機関あるいは公共機関での
データエントリー業務で使用されるＯＣＲ等に広く適用
が可能である。

【図面の簡単な説明】

【図１】本発明の一実施例に係る文字認識装置の要部ブ
ロック図である。

【図２】図１に示す文字認識装置が備える係数インデッ
クス用メモリの内容を示したものである。

【図３】図１に示す文字認識装置が備える係数メモリの
内容を示したものである。

【図４】従来の文字認識装置を示したブロック図であ
る。

【図５】図４に示す文字認識装置による文字認識処理に
係る候補順位と距離値との関係を示したものである。

【符号の説明】

１特徴抽出部２辞書メモリ３識別部１４係数インデックス用メモリ１５係数メモリ１６係数選択部１７差分値作成部１８候補確度算出部

Claims

(57)【特許請求の範囲】

【請求項１】入力された文字パタンの特徴を表す特徴
ベクトルと認識対象カテゴリの標準的な特徴を表す標準
ベクトルとを照合し、標準ベクトルからの距離が小さい
順に上位となる複数の候補カテゴリと各候補カテゴリに
ついての距離値ｄとを認識結果として出力するステップ
を有する文字認識方法において、互いに類似するカテゴリ群をグループ化した類似カテゴ
リグループ毎に、予め判別分析によってカテゴリ群の正
読傾向と誤読傾向とを判別するように判別係数値ｗを求
めておき、前記認識結果に含まれる複数の候補カテゴリの距離値ｄ
の分布形状を表す差分値データｄ’を作成するとともに
第１位候補カテゴリＣ１が属する類似カテゴリグループ
に対応する前記判別係数値ｗを特定し、特定した判別係
数値ｗと前記距離値ｄの内積と、特定した判別係数値ｗ
と前記差分値データｄ’の内積との総和からなる判別関
数値Ｈ（＝ｆ（ｗ、ｄ、ｄ’））を算出し、この判別関
数値Ｈを前記認識結果の確からしさを表す候補確度とし
て当該認識結果に付加することを特徴とする、文字認識方法。
【請求項２】入力された文字パタンの特徴を表す特徴
ベクトルと認識対象カテゴリの標準的な特徴を表す標準
ベクトルとを照合し、標準ベクトルからの距離が小さい
順に上位となる複数の候補カテゴリと各候補カテゴリに
ついての距離値ｄとを認識結果として出力する文字認識
装置において、互いに類似するカテゴリ群をグループ化した類似カテゴ
リグループを識別するためのグループ番号を、入力が予
定される文字パタンの各々のカテゴリを識別するための
カテゴリ番号と対応付けて格納した第一のメモリと、類似カテゴリグループ毎に、カテゴリ群の正読傾向と誤
読傾向とを判別するように予め判別分析によって求めた
判別係数値ｗを前記グループ番号と対応付けて格納した
第二のメモリと、前記認識結果に含まれる複数の候補カテゴリの距離値ｄ
の分布形状を表す差分値データｄ’を作成する分布情報
作成手段と、前記認識結果に含まれる第１位候補カテゴリＣ１のカテ
ゴリ番号に対応するグループ番号を第一メモリから抽出
し、抽出したグループ番号に基づいて対応する判別係数
値ｗを第二のメモリから抽出するとともに、抽出した判
別係数値ｗと前記距離値ｄの内積と、抽出した判別係数
値ｗと算出された前記差分値データｄ’の内積との総和
からなる判別関数値Ｈ（＝ｆ（ｗ、ｄ、ｄ’））を算出
する候補確度算出手段とを設け、算出した判別関数値Ｈを前記認識結果の確からしさを表
す候補確度として当該認識結果と共に出力することを特
徴とする、文字認識装置。