JP3349243B2 - 文字列読み取り装置 - Google Patents

文字列読み取り装置

Info

Publication number
JP3349243B2
JP3349243B2 JP02807094A JP2807094A JP3349243B2 JP 3349243 B2 JP3349243 B2 JP 3349243B2 JP 02807094 A JP02807094 A JP 02807094A JP 2807094 A JP2807094 A JP 2807094A JP 3349243 B2 JP3349243 B2 JP 3349243B2
Authority
JP
Japan
Prior art keywords
character
character string
template
correlation
cross
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP02807094A
Other languages
English (en)
Other versions
JPH07239912A (ja
Inventor
信太郎 熊野
一正 宮本
賢一 木下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Heavy Industries Ltd
Original Assignee
Mitsubishi Heavy Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Heavy Industries Ltd filed Critical Mitsubishi Heavy Industries Ltd
Priority to JP02807094A priority Critical patent/JP3349243B2/ja
Publication of JPH07239912A publication Critical patent/JPH07239912A/ja
Application granted granted Critical
Publication of JP3349243B2 publication Critical patent/JP3349243B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、定型定数文字列等の文
字パターンを含む画像データから文字位置、文字種類の
推定と文字列認識を行なう文字列読み取り装置に関す
る。
【0002】
【従来の技術】従来、例えば文字列の文字パターンを含
む画像データから文字列を読み取る場合には、まず文字
列の文字パターンを1文字毎の文字パターンに分解する
文字切り出し処理を行ない、次に切り出された1文字1
文字の文字パターンについて文字認識する手順が一般的
である。
【0003】文字切り出し処理は、一般的には、画像デ
ータの輝度情報に基づいて、文字部分と背景部分を分離
する輝度しきい値を求め、このしきい値により画像デー
タの二値化を行なう。そして、図14に示すように二値
化により連結する1かたまり(以下、連結成分とする)
を1文字とみなして分解する第1の手法か、あるいは図
15に示すように文字列が横書きの場合には縦方向に射
影をとり横方向の輝度分布を求め(文字列が縦書きの場
合には横方向に射影をとり縦方向の輝度分布を求め)、
これに対し輝度分布を表わす射影ヒストグラムの凸凹か
ら文字の切れ目を推定して分解するという第2の手法を
用いている。
【0004】
【発明が解決しようとする課題】このように従来では、
文字列の画像データから文字を読み取るためには文字切
り出しを行なわねばならず、文字切り出し処理では1文
字が1つの連結成分になるように輝度のしきい値を求め
るか、あるいは射影により文字の切れ目を推定する必要
があった。
【0005】ところが、従来の第1及び第2の手法によ
る文字切り出し処理には、それぞれ次のような問題があ
った。まず、第1の手法では、次のような問題があっ
た。
【0006】一般には、画像データ中の1つの文字の中
でも輝度の分布があるため、1文字が1つの連結成分と
なるようにしきい値をとることが困難または画像データ
によっては不可能となる場合があった。
【0007】具体的には、1文字を1つの連結成分にす
るためにしきい値を求めると、隣接する他の文字と1つ
の連結成分となったり、逆に隣接する他の文字と完全に
分離させるためにしきい値を求めると、1つの文字が2
つ以上の連結成分に分離する場合があるという問題が生
じてしまう。
【0008】また、金属等に刻印された文字を1方向か
ら光を照射して得られる刻印文字の画像の場合では、元
々影により文字を浮き上がらせているため、1つの文字
の影が連結していない場合が多い。従って、従来の方式
では、刻印文字の画像データには対処出来ないという問
題点があった。
【0009】図16には連結成分を1文字として文字の
切り出しを行なう状況を示している。図16(a)に示
す画像データには、本来、2文字からなる文字列「A
B」の文字パターンが含まれているが、所定のしきい値
によって二値化した結果、4つの連結成分ができてい
る。従って、図16(b)に示すように、(1)〜
(4)のパターンがそれぞれ1文字として切り出され
る。このため、切り出された各文字毎について文字認識
しても、当然ながら本来の文字「AB」の認識結果を得
ることができない。
【0010】次に、第2の手法では、次のような問題が
あった。射影ヒストグラムをとった場合、異なる文字の
間に必ず射影値0の部分ができ、1文字の全範囲内で射
影値0より大であれば問題がないが、背景部分のノイズ
や一部の欠落により、こうした条件が満たされない場合
がしばしば起こる。
【0011】射影値が0か否かによって文字の切れ目を
判別するのではなく、射影分布の凸凹の形状から文字の
切れ目を推定するには、文字の幅(縦書きの場合には高
さ)がわかっている必要もある。例えば、文字種類によ
って文字幅が異なる場合には、文字数と文字の隙間がわ
かっても、文字の切り出しが正確には行なえないという
問題点があった。
【0012】具体的には、「W」のように横に広い文字
と「I」のように細い文字とが存在する文字列では、背
景部分の輝度ムラも考慮に入れると、射影輝度の形状だ
けから信頼性の高い文字切り出しを行なうことはできな
かった。
【0013】また、第1の手法と同様に、刻印文字の画
像などの場合には、1つの文字が連結しないので射影成
分に偽の文字切れ目が多く発生し正確な文字切り出しが
できなかった。
【0014】図17には射影成分の分布により1文字切
り出しを行なう状況を示している。図17(a)に示す
画像データには、本来、3文字からなる文字列「HB
F」の文字パターンが含まれているが、図17(b)の
射影ヒストグラムの凸凹から推定すると1〜5の文字切
れ目候補が得られる。すなわち、真の切れ目が2つ(文
字切れ目候補2,4)であるにもかかわらず、この切れ
目のみを正確に求めることができない。従って、文字切
れ目候補で切り出された各文字毎について文字認識して
も、当然ながら本来の文字「HBF」の認識結果を得る
ことができない。
【0015】本発明は前記のような事情を考慮してなさ
れたもので、文字列の文字パターンを含む画像データか
ら正確に文字位置を推定し、正しい認識結果の取得が可
能な文字列読み取り装置を提供することを目的とする。
【0016】
【課題を解決するための手段】本発明は、文字列の文字
パターンを含む画像データから各文字についての文字認
識結果を求める文字列読み取り装置において、前記文字
列を含む画像データから前記文字パターンを含む文字列
領域を求める文字列領域計算装置と、読み取りの対象と
する全文字種類についてのサンプル画像であるテンプレ
ートを記憶するためのテンプレート記憶装置と、前記テ
ンプレート記憶装置に記憶されたテンプレートを読みだ
すテンプレート読みだし装置と、前記テンプレート読み
だし装置によって読みだされたテンプレートの位置を、
前記文字列領域計算装置によって得られた文字列領域内
で変更しながら、各位置での文字領域内の画像データと
前記テンプレートとの相互相関値を求める相互相関計算
装置と、前記相互相関計算装置によって各位置で求めた
前記相互相関値のうち、相関度の高い所定数個分の位置
を求める高相関位置検出装置と、処理対象とする文字列
の文字数を示す情報を含む、文字列に関する情報を記憶
するための文字列情報記憶装置と、前記文字列情報記憶
装置に記憶された文字列に関する情報に基づいて、処理
対象とする文字列に関する規則基準値を設定する規則基
準値設定装置と、前記相互相関計算装置によって求めら
れた相互相関値と、前記高相関位置検出装置によって求
められた高相関位置と、前記規則基準値設定装置によっ
て設定された規則基準値を用いてDPマッチング(動的
計画法)を行なうための設定を行なうDP定式化装置
と、前記DP定式化装置によって設定された内容に応じ
て、DPマッチング(動的計画法)の手法を用いて、各
テンプレート毎に求められた、前記相互相関値と前記高
相関位置と同相互相関値及び同高相関位置を求める際に
用いたテンプレートを示すテンプレート名を含むテンプ
レート相関結果を、文字列の文字順に対応づけするDP
マッチング装置と、前記DPマッチング装置による対応
づけの結果に基づいて、最終的な文字列に対する読み取
り結果を決定する文字列認識装置とを具備したことを特
徴とする。
【0017】
【作用】このような構成によれば、文字位置の推定と文
字の認識において、各文字のテンプレートを用いた正規
化相互相関による高相関位置の検出と相関度の計算を行
ない、文字列の長さ、文字隙間の知識等の規則基準値、
相関値および高相関位置検出結果を使ったDPマッチン
グにより各文字位置の推定と文字種類の認識を同時に行
なわれる。
【0018】文字の見本としてテンプレートを持つこと
により、文字部が非連結になりやすい刻印文字等であっ
ても1つの文字として扱うことができ、正規化相互相関
により、背景の輝度ムラやノイズ、文字部の切れや結合
にあまり影響を受けない文字の認識を行なえる。
【0019】
【実施例】以下、図面を参照して本発明の一実施例を説
明する。図1は本発明の一実施例に係わる定型定数文字
列読み取り装置の構成を示すブロック図である。本実施
例における定型定数文字列読み取り装置は、定型(各文
字毎に大きさは異なり得る)文字列を含む画像データ、
文字列の文字数情報、及び処理対象とする全文字種類に
ついてのサンプル画像(テンプレート)が与えられた場
合に、文字列内に例えば文字間の隙間が一定という規則
で配列された文字列を読み取るものである。
【0020】図1に示すように、定型定数文字列読み取
り装置は、処理対象画像データ抽出手段10、テンプレ
ート設定手段12、テンプレート相関結果検出手段1
4、文字列規則設定手段16、DPマッチング処理手段
18、及び読取り結果出力制御手段20を有している。
【0021】処理対象画像データ抽出手段10は、文字
列領域計算装置30を有し、文字列読み取りの処理対象
となる定型文字列を含む画像データ(文字列領域)を抽
出するものである。
【0022】テンプレート設定手段12は、テンプレー
ト読み出し装置32及びテンプレート記憶装置34を有
し、文字列領域に対する処理に際し、文字列領域中の各
文字位置の推定と各文字種類の認識の基準となるテンプ
レートを設定するものである。
【0023】テンプレート相関結果検出手段14は、相
互相関計算装置36及び高相関位置検出装置38を有
し、テンプレート設定手段12によって設定されたテン
プレートに基づいて、文字列領域の画像データに対する
テンプレート相関結果(相互相関値、高相関位置、テン
プレート名)を求めるものである。
【0024】文字列規則設定手段16は、規則基準値設
定装置40及び文字列情報記憶装置44を有し、テンプ
レート相関結果検出手段14によって検出されたテンプ
レート毎のテンプレート相関結果に対するDPマッチン
グ処理に際し、同処理で用いられる処理対象とする文字
列に関する規則を設定するものである。
【0025】DPマッチング処理手段18は、DP定式
化装置46及びDPマッチング装置48を有し、テンプ
レート相関結果検出手段14によって検出されたテンプ
レート毎のテンプレート相関結果を、DPマッチング
(動的計画法)の手法を用いて文字列中の各文字に対応
づけを行なうものである。
【0026】読取り結果出力制御手段20は、文字認識
装置50を有し、DPマッチング処理手段18による処
理結果を、最終的に出力すべきかを制御するものであ
る。文字列領域計算装置30は、定型文字列の文字パタ
ーンを含む画像データを入力して記憶装置、例えばRA
M等のメモリ装置に格納し、文字パターンを含む文字列
領域を求めるものである。
【0027】テンプレート読み出し装置32は、テンプ
レート記憶装置34に記憶された複数のテンプレート
(詳細について後述する)を、1つずつ読みだして相互
相関計算装置36に供給するものである。
【0028】テンプレート記憶装置34は、例えばテン
プレート用のデータベースとして構成され、ハードディ
スク装置等の外部記憶装置によって実現される。テンプ
レート記憶装置34に記憶されるテンプレートは、画像
データ中の文字パターンに対して文字位置推定と文字認
識を行なうための基になる文字パターン情報であって、
本実施例では各画素の輝度値を成分とする二次元の画像
データである。テンプレート記憶装置34には、読み取
りの対象とする全ての文字種類についてのテンプレート
が記憶されている。また、テンプレートの大きさは、全
ての文字について同じではなく、文字種類によって異な
り得るものである。また、同じ文字について異なる形
状、大きさのテンプレートを用意しておくことも当然可
能である。さらに、図2に示すように、刻印文字のよう
に照明により文字部の一部が光り、他が影になるように
見える状態そのままをテンプレートとして登録しておく
こともできる。従って、処理対象とする文字パイプライ
ンの文字部が非連結となる場合であっても1つの文字と
して扱うことができ、背景の輝度ムラやノイズ、文字部
の切れや結合に影響されにくい文字の認識が可能とな
る。
【0029】相互相関計算装置36は、文字列領域計算
装置30によって求められた文字列領域内の画像につい
て、テンプレート読みだし装置32によってテンプレー
ト記憶装置34から読み出された各テンプレートを、文
字列領域内で移動させながら各位置で相関度を求めるも
のである。
【0030】高相関位置検出装置38は、相互相関計算
装置36によって各テンプレート毎に求められた各位置
での相関度のうち、相関度の高かった位置(高相関位
置)を上位から所定個(最大n個)求めるものである。
nは、各テンプレートに対応する文字が、現在処理対象
としている文字列の中に出現し得る回数分とする。ただ
し、高相関位置検出装置38は、文字認識の結果に何等
影響しない無意味な処理を省いて全体の処理を高速化す
るために、相関度が予め設定されたしきい値以下であれ
ばn個分求めず、しきい値を越えた個数分だけ求めてお
くようにしても良い。
【0031】規則基準値設定装置40は、文字列情報記
憶装置44に記憶された文字列情報(詳細については後
述する)を読みだし、文字列情報に基づいて処理対象と
する文字列に関する規則基準値(詳細については後述す
る)を設定するものである。
【0032】文字列情報記憶装置44は、メモリ装置や
ハードディスク装置等の外部記憶装置によって実現さ
れ、規則基準値設定装置40において設定される文字列
に関する規則基準値のもとになる文字列情報を記憶する
ためのものである。文字列情報には、処理対象とする文
字列の文字数、テンプレートの総数、各テンプレートの
幅を少なくとも1つを含む文字数情報や、既知となって
いる処理対象とする文字列の文字間の隙間を示す情報を
含む規則情報等が記憶される。
【0033】DP定式化装置46は、相互相関計算装置
36によって求められた相互相関値と、高相関位置検出
装置38によって求められた高相関位置と、規則基準値
設定装置40によって設定された規則基準値に基づい
て、テンプレート相関結果と規則基準値をDPマッチン
グ(動的計画法)にかけるための定式化、すなわち各テ
ンプレートに対応するテンプレート相関結果の順序関係
を定義する。なお、テンプレート相関結果とは、相互相
関値、高相関位置、テンプレート名の各情報が含まれて
いるものとする。
【0034】DPマッチング装置48は、DPマッチン
グ(動的計画法)の手法を用いて、DP定式化装置46
によって定義されたテンプレート相関結果の順序関係に
応じて、テンプレート相関結果と処理対象とする文字列
中の各文字との対応づけを行なうものである。
【0035】文字認識装置50は、DPマッチング装置
48によるテンプレート相関結果と処理対象とする文字
列中の各文字との対応づけを用いて、文字列中の各文字
を認識して、最終的な文字列を決定、もしくは認識不能
を判断するものである。
【0036】次に、本実施例の動作について説明する。
本実施例では、図3に示すような、横書きの英文字の刻
印文字を読み取る場合を例にして説明する。本実施例で
は、英文字を対象としているので、少なくともテンプレ
ート記憶装置34には、予め英文字の全ての文字種類に
ついて、テンプレートがデータベースとして用意されて
いるものとする。
【0037】また、刻印文字は、文字の線に所定の幅が
あり、かつ一方向からの照明により文字の証明側の線に
沿って発生する影によって表されるので、全ての文字種
類について刻印文字として見える状態そのままがテンプ
レートとして登録されているものとする(図2に1つの
刻印文字「M」に対応するテンプレートを示す)。
【0038】文字列領域計算装置30は、定型文字列の
文字パターンを含む画像データを入力し、画像データか
ら認識すべき文字列の文字パターンを含む文字列領域を
次のようにして求める。
【0039】まず、文字列領域計算装置30は、図3に
示すような画像データを入力すると、所定の手法によっ
て、文字列とその背景部分だけからなる領域を切り出
す。例えば、図3に示す画像データに対する手法とし
て、まず図4に示すような特定のパターンを検出する。
そして、検出したパターンから、上方向の所定の幅を文
字列領域を含む領域として求める。
【0040】次に、場合によっては、所定の手法により
文字列が水平方向に並ぶように画像に回転をかける(横
書きの場合これにより文字は直立する)。例えば、図5
(a)に示すような文字領域を含む領域に対して、図5
(b)に示すように慣性主軸を求め、この主軸が水平と
なるように回転をかける。
【0041】なお、以上の手法は一例であって他の手法
を用いることも可能である。また、対象とする画像デー
タの内容によっても手法、手順を決定しても良い。次
に、文字列領域計算装置30は、文字列とその背景部分
だけからなる領域から図6に示すように文字領域を求め
る。まず、図6(a)に示す背景部分を含む領域の画像
データについて、図6(b)に示すように、輝度値を横
方向に射影し、縦方向に関する輝度射影分布を求める。
また、図6(c)に示すように、輝度値を縦方向に射影
し、横方向に関する輝度射影分布を求める。
【0042】この分布は背景の輝度ムラやノイズ、文字
部の切れや結合等で各文字毎に切り出しを行なうには不
完全に情報の危険性がある。しかし、大局的にみた場
合、文字列の領域なのかそれ以外の領域であるかは、背
景部と文字部の平均輝度が異なる場合には輝度射影分布
をしきい値処理し、しきい値を越える最右点と最左点を
求めることにより判断可能である。
【0043】この場合、上から下、あるいは左から右に
射影分布を調べ、初めてしきい値を越えたところから最
後にしきい値を越えたところまでの領域を文字列領域と
する。この結果、図6(d)に示すように、破線で囲ん
だ部分が文字列領域として求められる。
【0044】文字列領域計算装置30は、規則基準値設
定装置40において読取り対象とする文字列に関して文
字間の隙間の推定が必要な場合には、文字列領域から求
められる文字列の幅を示すWstringを規則基準値設定装
置40に出力する。
【0045】一方、テンプレート読みだし装置32は、
テンプレート記憶装置34からまずテンプレートを一つ
読み出す。テンプレートは、輝度値を成分とする二次元
の画像データであり、ここではベクトルti と表される
ものとする。ただし、iは、テンプレート記憶装置34
から読み出されたi番目(すなわち文字種類i)のテン
プレートを表わす添字である。ベクトルti の要素は各
画素の輝度値であり、二値画像の場合は0か1、多値画
像の場合はその輝度範囲に応じた数値をとる。
【0046】図7に二値画像のテンプレート(文字
「W」に関する)を概略的に示している。この場合、ベ
クトルti は、ベクトルti =(10001 1010
1 10101 01010 01010)となる。す
なわち、各画素の輝度値を左上隅から横方向に順次並べ
たものである。
【0047】なお、注意すべきことは、テンプレート記
憶装置34に記憶されたテンプレートの大きさは文字種
類iによって異なりうるもので、ベクトルti の次元数
と、他のベクトルtj の次元数は同じとは限らないとい
うことである。例えば文字「W」のテンプレートは、文
字「I」のテンプレートと高さは同じものの幅が異なる
ため、次元(=幅×高さ)は異なる。
【0048】次に、相互相関計算装置36は、テンプレ
ート読みだし装置32によってテンプレート記憶装置3
4から読み出されたテンプレートを、図8(a)に示す
ように、文字列領域計算装置30によって求められた入
力画像の文字列領域内で移動させながら、対象とするテ
ンプレートに関する文字列領域の画像データとの相関値
を求める。
【0049】テンプレートと重なっている部分の入力画
像はテンプレートと同じ次元のベクトルであり、ベクト
ルr(x,y) と表わす。ここで(x,y) は、テンプレートの
基準点(ここでは画像の左上の点)が入力画像の(x,y)
の位置にあるときにテンプレートと重なる部分を表わ
す。
【0050】図9にはテンプレートと入力画像(文字列
領域)が重なった状態の一例を示している。図9に示す
入力画像で、テンプレートが太線で示す位置となった場
合、ベクトルr(4,2) は、ベクトルr(4,2) =(010
101010)となる。(テンプレートの基準点(左上
の点)が入力画像の(4,2)の位置にある)。このと
き相関値s(i,x,y) は、以下に示す式(1)で求められ
る。
【0051】
【数1】
【0052】ここで「・」はベクトルの内積を、「‖
‖」はベクトルの大きさを表わす。相互相関計算装置3
6は、全てのテンプレートiについて、入力画像全体の
各位置(x,y)に移動させながら、各位置でのテンプ
レートiについての相関値s(i,x,y) を求める。
【0053】図8(b)には文字列領域内のある位置か
ら横方向にテンプレートiを移動させた各位置での、各
テンプレート(英文字「A」〜「Z」)によって求ま
る、それぞれの相関値s(i,x,y) の変化を示している。
【0054】次に、高相関位置検出装置38は、相互相
関計算装置36によって各テンプレートiについて得ら
れた相関値s(i,x,y) が大きかった位置(x,y)を、
高相関位置として、予め設定された最大n個分求める。
なお、nは各テンプレートの表わす文字が、現在対象と
している文字列領域の中に出現しうる回数分とする。ま
た、所定のしきい値を設定しておき、しきい値を越える
相関値のみを対象とする場合であれば、必ずしもn個分
求めず、しきい値を越えた個数分の相関値s(i,x,y) だ
け求めておくようにしても良い。
【0055】なお、相関値s(i,x,y) は、ベクトルti
とベクトルri の向きが近い程大きな値となり、すなわ
ち図9に示す状態でテンプレートと入力画像とが類似し
ている程、相関度が高くなる。
【0056】図10には、相互相関計算装置36によっ
て求まった図8(b)で示す各位置での相関値s(i,x,
y) から、各テンプレート毎に求まった高相関位置を示
している。図10はテンプレート「A」「W」「X」
「Y」についてはそれぞれ1つの高相関位置を示し、テ
ンプレート「V」については2つの高相関位置を示し、
テンプレート「B」「Z」については高相関位置が求め
られなかった例を示している。
【0057】一方、規則基準値設定装置40は、読取り
の対象とする文字列に関する規則基準値を設定する。例
えば規則基準値設定装置40は、文字の隙間が一定であ
り、その値が既知である場合には、文字隙間の規則基準
値を1文字目と2文字目、2文字目と3文字目等々、全
てについてその既知の値を、文字列情報記憶装置44の
規則情報から読みだして設定する。
【0058】また、図11(a)に示すように、文字列
の隙間が一定だが値は未知である場合には、規則基準値
設定装置40は、文字列情報記憶装置44の文字数情報
から必要な情報を読みだして、これらの情報を用いて文
字間の隙間を推定して求め、規則基準値として設定す
る。具体的には、各テンプレートの文字幅の平均値Wch
arを以下の式(2)によって求める。
【0059】
【数2】
【0060】従って、規則基準値設定装置40は、文字
列領域計算装置30で求めた文字列の幅をWstringと
し、文字数をlとすると、文字隙間の規則基準値Wgap
を以下の式(3)によって求める。
【0061】
【数3】
【0062】その他文字の隙間も一定ではない場合、規
則基準値設定装置40は、図11(a)に示すように、
文字列情報記憶装置44の規則情報から読みだして1文
字目と2文字目の隙間がいくら、というように直接値を
設定する。
【0063】次に、DP定式化装置46は、相互相関計
算装置36及び高相関位置検出装置38によって求めら
れたテンプレート相関結果と、規則基準値設定装置40
によって設定された文字列の規則基準値をDPマッチン
グにかけるための定式化を行なう。なお、テンプレート
相関結果は、テンプレートiと画像データとの相互相関
値を示す相関値s(i,x,y) 、相関度が高かった高相関位
置を示す相関位置(x,y)、及び相互相関を求める際
に用いたテンプレートを示すテンプレート名iを含んで
いる。
【0064】まず、DP定式化装置46は、高相関位置
検出装置38で求めた高相関位置(x,y)をx座標が
小さい順にソートする。高相関位置(x,y)のx座標
が同じ場合には、y座標が小さい順にソートする。こう
して、DP定式化装置46は、高相関位置検出装置38
で求めた全ての高相関位置(x,y)を1次元に並べる
ことにより、テンプレート相関結果に順序関係を定義す
る。
【0065】例えば、図10に示すように、高相関位置
が求められている場合には、図12に示すように、文字
種類が「A」「Y」「V」「W」「X」のように、テン
プレート相関結果に順序関係が定義される。
【0066】次に、DPマッチング装置48は、DP定
式化装置46によって定義されたテンプレート相関結果
の高相関位置(x,y)の列と、文字列の何文字目かを
最適に対応付けする。
【0067】一般に、DPマッチングに関する説明を行
なう場合、対応付けられる対象を横軸、対応付けの基準
となるものを縦軸にとり、対応グラフを発見する問題と
して表現することが多いため、ここでもその方式を用い
て説明する。
【0068】例えば横軸をA軸、縦軸をB軸と表わす。
A軸上には、1次元にソートされたテンプレート相関結
果を配置し、B軸上には、1文字目、2文字目・・・の
文字順を配置する。DPマッチングそのものは公知の技
術であるので内容は説明しないが、DPマッチングに用
いる評価関数は本発明において独自の点であるので以下
に説明する。
【0069】DPマッチングはA軸上に配置された要素
(a1 ,a2 ,・・・,aN )とB軸上に配置された要
素(b1 ,b2 ,・・・,bM )との対応付けを(本実
施例におけるテンプレート相関結果と文字順との対応づ
け)、ある評価関数を最大にするように求める手法であ
る。
【0070】ここで、DPマッチング装置48によるD
Pマッチングにより次のような対応が求まったとする。 (a1,b1 )−(a2,b2 )−・・・−(an,bm ) これはb1 文字目はa1 で表されるテンプレート相関結
果である、という判断を表わす。具体例を図13に示し
ている。テンプレート相関結果には文字種類i、及び文
字位置(x,y)が含まれているので、これにより文字
列のb1 文字目の文字種類と文字位置とが認識されたこ
とになる。(ai ,bj )を対応付けする評価関数は、
以下の式(4)で表す。
【0071】
【数4】
【0072】ここで、Φ(ai,bj )は、bj 文字目が
ai の文字種類である確度を意味し、本発明では要素a
i の相関値を用いる。ψ(ak,bl,ai,bj )は、bj
文字目にai で表される文字が書かれていた仮定した場
合に、その1つ前であるbl文字目がak で表される確
度を意味し、Max(ak,bl) {ψ(ak,bl,ai,b
j)}はψ(ak,bl,ai,bj )の内の最大値を表わ
す。ψ(ak,bl,ai,bj )は、以下の式(5)で定義
される。
【0073】
【数5】
【0074】Absは絶対値、xakは要素ak の存在する
位置(X座標)、Width(ak )はak 要素の表わす文
字種類のテンプレートの幅である。Wgap は規則基準値
設定装置40によって設定された文字隙間を示す規則基
準値である。また、Constは十分に大きい一定の正数と
し、bj =1(1文字目)の時はψ=0とする。本適用
例では1文字目、2文字目、3文字目というように、B
軸の要素は必ずA軸上の要素のどれかと対応付けられな
くてはならない。従ってbj の1つ前であるbl は、b
l =bj −1とした。
【0075】α及びβは2種類の評価関数を足し込む際
の重み付けを表わす係数である。Φ(ai,bj )を決定
する時、Max(ak,bi) {ψ(ak,bl,ai,bj )を満
足したak ,bl を併せて記憶しておく(具体的には
(ai,bl )から(ak,bl )へのポインタをもつ。) こうして、DPマッチング装置48は、各(ai,bj )
についてΦを求めた後、Φ(an,M)の内の最大値Ma
x(an,M){Φ(an,M)}を求め、その点から前述した
ポインタをたどることで全ての文字の認識に相当する対
応付けが得られる。このときのMax(an,M){Φ(an,
M)}の値が文字列全体の認識結果の確度となる。
【0076】図12に示すDP定式化装置46による結
果に対しては、図13中の最適のパスで示す全ての文字
の認識に相当する対応付け、すなわち1文字目から順に
「A」「Y」「W」「X」の認識結果が得られる。
【0077】次に、文字列認識装置50は、DPマッチ
ング装置48によって求められた対応結果を用いて文字
列の各文字を認識する。具体的には、得られた対応付け
が (ai1,1)−(ai2,2)−・・・−(aiM,M) であったとすると、文字列の1文字目はai1のテンプレ
ート相関結果が表わす位置(xai1,yai1 )に存在し、
文字内容はそのテンプレートの文字、その文字である確
度はΦ(ai1,1)である。
【0078】文字毎に確度が低い場合や、文字列全体の
確度が低い場合には、文字を誤認識している危険性があ
るためリジェクトの判断を行なう。それ以外の場合には
文字列認識結果を、文字列領域計算装置30に入力され
た画像データに対する文字読取り結果として出力する。
【0079】このようにして、読み取りの対象とする全
文字種類のテンプレートをテンプレート記憶装置34に
用意し、このテンプレートを用いた文字列領域の画像デ
ータに対する領域内の各位置における相関度の計算、及
び正規化相互相関による高相関位置の検出を行ない、規
則基準値設定装置40によって文字列の長さ、文字隙間
の知識等の規則基準値、相関値及び高相関位置を使った
DPマッチングにより、各文字位置の推定と文字種類の
認識を同時に行なうことができる。
【0080】テンプレートは、処理対象とする画像デー
タ中の文字に応じて予め用意しておくことができるの
で、文字部が非連結になりやすい刻印文字等であっても
1つの文字として扱うことができ、正規化相互相関によ
り、背景の輝度ムラやノイズ、文字部の切れや結合にあ
まり影響を受けない文字の認識を行なうことができる。
【0081】
【発明の効果】以上のように本発明によれば、定型文字
列の認識において、背景部分の輝度ムラやノイズ、文字
部の切れや複数文字の結合などによる文字切り出しの失
敗と、これによる文字認識失敗を防ぎ、文字列の規則を
利用して確度の高い文字切り出し、文字認識を同時に行
なうことができるものである。
【図面の簡単な説明】
【図1】本発明の一実施例に係る全体構成を示すブロッ
ク図。
【図2】本実施例における刻印文字に対応するテンプレ
ートの一例を示す図。
【図3】本実施例における処理対象となる横書き刻印文
字を含む画像データの一例を示す図。
【図4】本実施例における文字列領域計算装置30によ
る文字列とその背景部分だけからなる領域を切り出す手
法を説明するための図。
【図5】本実施例における文字列領域計算装置30によ
る画像を回転させる手法を説明するための図。
【図6】本実施例における文字列領域計算装置30によ
る文字列領域を求める処理を説明するための図。
【図7】本実施例におけるテンプレートを説明するため
の図。
【図8】本実施例における相互相関計算装置36の動作
を説明するための図。
【図9】本実施例における相互相関計算装置36の相関
値を求め動作を説明するための図。
【図10】本実施例における高相関位置計算装置38に
よって求まった高相関位置を示す図。
【図11】本実施例における規則基準値設定装置40の
動作を説明するための図。
【図12】本実施例におけるDP定式化装置46の動作
を説明するための図。
【図13】本実施例におけるDPマッチング装置48の
動作を説明するための図。
【図14】従来技術において連結部分を1文字として1
文字切り出しを行なう手法を説明するための図。
【図15】従来技術において射影部分の分布により1文
字切り出しを行なう手法を説明するための図。
【図16】従来技術において連結成分を1文字として1
文字切り出しを行なう手法の問題点を説明するための
図。
【図17】従来技術において射影部分の分布により1文
字切り出しを行なう手法の問題点を説明するための図。
【符号の説明】
10…処理対象画像データ抽出手段、 12…テンプ
レート設定手段、14…テンプレート相関結果検出手
段、 16…文字列規則設定手段、18…DPマッチン
グ処理手段、 20…読取り結果出力制御手段、
30…文字列領域計算装置、 32…テンプ
レート読み出し装置、34…テンプレート記憶装置、
36…相互相関計算装置、38…高相関位置検
出装置、 40…規則基準値設定装置、44
…文字列情報記憶装置、 46…DP定式化
装置、48…DPマッチング装置、 50…
文字認識装置。
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 昭59−66786(JP,A) 特開 平5−159056(JP,A) 特開 平3−51982(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06K 9/00 - 9/82

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】 文字列の文字パターンを含む画像データ
    から各文字についての文字認識結果を求める文字列読み
    取り装置において、 前記文字列を含む画像データから前記文字パターンを含
    む文字列領域を求める文字列領域計算装置と、 読み取りの対象とする全文字種類についてのサンプル画
    像であるテンプレートを記憶するためのテンプレート記
    憶装置と、 前記テンプレート記憶装置に記憶されたテンプレートを
    読みだすテンプレート読みだし装置と、 前記テンプレート読みだし装置によって読みだされたテ
    ンプレートの位置を、前記文字列領域計算装置によって
    得られた文字列領域内で変更しながら、各位置での文字
    領域内の画像データと前記テンプレートとの相互相関値
    を求める相互相関計算装置と、 前記相互相関計算装置によって各位置で求めた前記相互
    相関値のうち、相関度の高い所定数個分の位置を求める
    高相関位置検出装置と、 処理対象とする文字列の文字数を示す情報を含む、文字
    列に関する情報を記憶するための文字列情報記憶装置
    と、 前記文字列情報記憶装置に記憶された文字列に関する情
    報に基づいて、処理対象とする文字列に関する規則基準
    値を設定する規則基準値設定装置と、 前記相互相関計算装置によって求められた相互相関値
    と、前記高相関位置検出装置によって求められた高相関
    位置と、前記規則基準値設定装置によって設定された規
    則基準値を用いてDPマッチング(動的計画法)を行な
    うための設定を行なうDP定式化装置と、 前記DP定式化装置によって設定された内容に応じて、
    DPマッチング(動的計画法)の手法を用いて、各テン
    プレート毎に求められた、前記相互相関値と前記高相関
    位置と同相互相関値及び同高相関位置を求める際に用い
    たテンプレートを示すテンプレート名を含むテンプレー
    ト相関結果を、文字列の文字順に対応づけするDPマッ
    チング装置と、 前記DPマッチング装置による対応づけの結果に基づい
    て、最終的な読み取り結果を決定する文字列認識装置
    と、 を具備したことを特徴とする文字列読み取り装置。
JP02807094A 1994-02-25 1994-02-25 文字列読み取り装置 Expired - Lifetime JP3349243B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP02807094A JP3349243B2 (ja) 1994-02-25 1994-02-25 文字列読み取り装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP02807094A JP3349243B2 (ja) 1994-02-25 1994-02-25 文字列読み取り装置

Publications (2)

Publication Number Publication Date
JPH07239912A JPH07239912A (ja) 1995-09-12
JP3349243B2 true JP3349243B2 (ja) 2002-11-20

Family

ID=12238516

Family Applications (1)

Application Number Title Priority Date Filing Date
JP02807094A Expired - Lifetime JP3349243B2 (ja) 1994-02-25 1994-02-25 文字列読み取り装置

Country Status (1)

Country Link
JP (1) JP3349243B2 (ja)

Also Published As

Publication number Publication date
JPH07239912A (ja) 1995-09-12

Similar Documents

Publication Publication Date Title
US5120940A (en) Detection of barcodes in binary images with arbitrary orientation
JPH0467234B2 (ja)
US8027978B2 (en) Image search method, apparatus, and program
CN110288040A (zh) 一种基于拓扑验证的图像相似评判方法及设备
JP3416058B2 (ja) 濃淡画像の文字抽出方法及びそのプログラムを記録した記録媒体
JP2898562B2 (ja) ナンバープレート決定方法
US20010043732A1 (en) Irradiation field extracting method and apparatus and recording medium
JP3349243B2 (ja) 文字列読み取り装置
JP2002032766A (ja) 画像認識装置及びその方法
Khan et al. Segmentation of single and overlapping leaves by extracting appropriate contours
JP3388918B2 (ja) 文字列読み取り装置
JP2002245404A (ja) 領域切り出しプログラムおよび装置
JPH05342414A (ja) テンプレート作成装置及びパターン認識装置
CN108961532B (zh) 冠字号图像处理方法、装置、设备及存储介质
CN115546226A (zh) 验证码图像识别方法、模板生成方法、装置和存储介质
JP2001291058A (ja) 文字認識装置及び記録媒体
JP2768289B2 (ja) 文字切り出し装置
JPH09120432A (ja) 文字認識方法、文字読取装置
JP3763966B2 (ja) 画像認識方法、装置および記録媒体
JPH06215139A (ja) 図形認識方法
JP2001357401A (ja) 画像処理方法
CN112733829A (zh) 一种特征块识别方法、电子设备及计算机可读存储介质
JPH03219384A (ja) 文字認識装置
JP2658153B2 (ja) 文字識別方式
CN114792427A (zh) 一种可识别分析作业人员行为的方法、智能终端及装置

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20020806

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080913

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080913

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090913

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090913

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100913

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110913

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110913

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120913

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120913

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130913

Year of fee payment: 11

EXPY Cancellation because of completion of term