JPH08147414A

JPH08147414A - 文字列読み取り装置

Info

Publication number: JPH08147414A
Application number: JP6283551A
Authority: JP
Inventors: Shintaro Kumano; 信太郎熊野; Kazumasa Miyamoto; 一正宮本
Original assignee: Mitsubishi Heavy Industries Ltd
Current assignee: Mitsubishi Heavy Industries Ltd
Priority date: 1994-11-17
Filing date: 1994-11-17
Publication date: 1996-06-07
Anticipated expiration: 2018-03-24
Also published as: JP3388918B2

Abstract

(57)【要約】【目的】文字数が不定もしくは不明な対象に対して
も、正確に文字位置を推定し、正しい認識結果を取得で
きる文字列読み取り装置を提供する。【構成】文字列に含まれる文字数に関する仮説を発生
する文字数仮説発生装置１５と、文字列に関する規則情
報及び上記仮説文字数に基づいて、処理対象とする文字
列に関する規則基準値を設定する規則基準値設定装置１
６と、相互相関値と高相関位置と規則基準値を用いてＤ
Ｐマッチングを行なうための設定を行なうＤＰ定式化装
置１７と、このＤＰ定式化装置１７により設定された内
容に応じて、相互相関値と高相関位置とテンプレート名
を含むテンプレート相関結果を、文字列の文字順に対応
づけするＤＰマッチング装置１８と、文字数仮説発生装
置１５で発生した全ての仮説文字数についての上記ＤＰ
マッチング装置１８の結果から最終的な文字列を決定す
る文字列認識装置５０を備える。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、定型文字列等の文字パ
ターンを含む画像データから文字数、文字位置、文字種
類の推定と認識を行なう文字列読み取り装置に関する。

【０００２】

【従来の技術】従来、例えば文字列の文字パターンを含
む画像データから文字列を読み取る場合には、まず文字
列の文字パターンを１文字毎の文字パターンに分解する
文字切り出し処理を行ない、次に切り出された１文字１
文字の文字パターンについて文字認識する手順が一般的
である。

【０００３】文字切り出し処理は、一般的には、画像デ
ータの輝度情報に基づいて、文字部分と背景部分を分離
する輝度しきい値を求め、このしきい値により画像デー
タの二値化を行なう。そして、図６に示すように二値化
により連結する１かたまり（以下、連結成分とする）を
１文字とみなして分解する第１の手法か、あるいは図７
に示すように文字列が横書きの場合には縦方向に射影を
取り、縦方向の輝度分布を求め（文字列が縦書きの場合
には横方向に射影を取り、横方向の輝度分布を求め
る）、これに対して輝度分布を表す射影ヒストグラムの
凸凹から文字の切れ目を推定して分解するという第２の
手法を用いている。

【０００４】このように従来では、文字列の画像データ
から文字を読み取るためには文字切り出しを行なわねば
ならず、文字切り出し処理では１文字が１つの連結成分
になるように輝度のしきい値を求めるか、あるいは射影
により文字の切れ目を推定する必要があった。ところ
が、従来の第１及び第２の手法による文字切り出し処理
には、それぞれ次のような問題がある。

【０００５】まず、第１の手法では、次のような問題が
ある。一般には、画像データ中の１つの文字の中でも輝
度の分布があるため１文字が１つの連結成分となるよう
にしきい値をとることが困難または画像データによって
は不可能となる場合があった。

【０００６】具体的には、１文字を１つの連結成分にす
るためにしきい値を求めると、隣接する他の文字と１つ
の連結成分となったり、逆に隣接する他の文字と完全に
分離指せるためにしきい値を求めると、１つの文字が２
つ以上の連結成分に分離する場合があるという問題が生
じてしまう。

【０００７】また、金属等に刻印された文字を１方向か
ら光を照射して得られる刻印文字の画像の場合では、元
々影により文字を浮き上がらせているため、１つの文字
の影が連結していない場合が多い。従って、従来の方式
では、刻印文字の画像データには対処できないという問
題があった。

【０００８】図８には連結成分を１文字として文字の切
り出しを行なう状況を示している。図８（ａ）に示す画
像データには、本来、２文字からなる文字列「ＡＢ」の
文字パターンが含まれているが、所定のしきい値によっ
て二値化した結果、４つの連結成分ができている。従っ
て、図８（ｂ）に示すように、（１）〜（４）のパター
ンがそれぞれ１文字として切り出される。このため、切
り出された各文字毎について文字認識しても、当然なが
ら本来の文字「ＡＢ」の認識結果を得ることができな
い。

【０００９】次に、第２の手法では、次のような問題が
ある。射影ヒストグラムをとった場合、異なる文字の間
に必ず射影値０の部分ができ、１文字の全範囲内で射影
値０より大であれば問題がないが、背景部分のノイズや
一部の欠落により、こうした条件が満たされない場合が
しばしば起こる。

【００１０】射影値が０か否かによって文字の切れ目を
判別するのではなく、射影分布の凸凹の形状から文字の
切れ目を推定するには、文字の幅（縦書きの場合には高
さ）が分かっている必要もある。例えば、文字種類によ
って文字幅が異なる場合には、文字数と文字の隙間が分
かっていても、文字の切り出しが正確には行なえないと
いう問題がある。

【００１１】具体的には、「Ｗ」のように横に広い文字
と「Ｉ」のように細い文字とが存在する文字列では、背
景部分の輝度ムラも考慮に入れると、射影輝度の形状だ
けから信頼性の高い文字切り出しを行なうことはできな
かった。

【００１２】また、第１の手法と同様に、刻印文字の画
像などの場合には、１つの文字が連結しないので、射影
成分に偽の文字切れ目が多く発生し、正確な文字切り出
しができなかった。

【００１３】図９には射影成分の分布により１文字切り
出しを行なう状況を示している。図９（ａ）に示す画像
データには、本来、３文字からなる文字列「ＨＢＦ」の
文字パターンが含まれているが、図９（ｂ）の射影ヒス
トグラムの凸凹から推定すると、１〜５の文字切れ目候
補が得られる。すなわち、真の切れ目が２つ（文字切れ
目候補２，４）であるにもかかわらず、この切れ目のみ
を正確に求めることができない。従って、文字切れ目候
補で切り出された各文字毎について文字認識しても、当
然ながら本来の文字「ＨＢＦ」の認識結果を得ることが
できない。

【００１４】このような問題を解決するため、本出願人
は先に特願平６−２８０７０号にて文字列読み取り装置
を出願した。この文字列読み取り装置は、前提として文
字数が分かっていることを利用し、これをＤＰマッチン
グでの前処理として文字認識を行なうようにしたもので
ある。

【００１５】

【発明が解決しようとする課題】この文字列読み取り装
置によれば、文字列の文字パターンを含む画像データか
ら正確に文字位置を推定し、正しい認識結果を取得でき
るものであるが、文字認識を行なうために文字数を予め
知っておく必要があり、文字数が不定もしくは不明な対
象に対しては適用できないという問題がある。具体的に
は、ＤＰマッチングを行なう際の文字列知識として、画
像を何文字と対応付けするかの情報、即ち文字数に関す
る情報がＤＰ定式化装置において必要であった。

【００１６】本発明は上記の事情を考慮してなされたも
ので、文字数が不定もしくは不明な対象に対しても、文
字列の文字パターンを含む画像データから正確に文字位
置を推定し、正しい認識結果を取得できる文字列読み取
り装置を提供することを目的とする。

【００１７】

【課題を解決するための手段】本発明は、文字列の文字
パターンを含む画像データから各文字についての文字認
識結果を求める文字列読み取り装置において、上記文字
列を含む画像データから上記文字パターンを含む文字列
領域を求める文字列領域計算装置と、予めテンプレート
記憶装置に記憶された読み取りの対象とする全文字種類
についてのサンプル画像であるテンプレートを読み出す
テンプレート読み出し装置と、上記テンプレート読み出
し装置によって読み出されたテンプレートの位置を、上
記文字列領域計算装置によって得られた文字列領域内で
変更しながら、各位置での文字領域内の画像データと上
記テンプレートとの相互相関値を求める相互相関計算装
置と、上記相互相関計算装置によって各位置で求めた上
記相互相関値のうち、相関度の高い所定数個分の位置を
求める高相関位置検出装置と、処理対象とする文字列に
含まれる文字数に関する仮説を発生する文字数仮説発生
装置と、文字列に関する規則情報及び上記文字数仮説発
生装置で発生した仮説文字数に基づいて、処理対象とす
る文字列に関する規則基準値を設定する規則基準値設定
装置と、上記相互相関計算装置によって求められた相互
相関値と、上記高相関位置検出装置によって求められた
高相関位置と、上記規則基準値設定装置によって設定さ
れた規則基準値を用いてＤＰマッチング（動的計画法）
を行なうための設定を行なうＤＰ定式化装置と、上記Ｄ
Ｐ定式化装置によって設定された内容に応じて、ＤＰマ
ッチングの手法を用いて、各テンプレート毎に求められ
た、上記相互相関値と上記高相関位置と同相互相関値及
び同高相関位置を求める際に用いたテンプレートを示す
テンプレート名を含むテンプレート相関結果を、文字列
の文字順に対応づけするＤＰマッチング装置と、上記文
字数仮説発生装置で発生した全ての仮説文字数について
の上記ＤＰマッチング装置の結果から最終的な文字列を
決定し、もしくは認識不能を判断する文字列認識装置
と、を具備したことを特徴とする。

【００１８】

【作用】文字数仮説発生装置により、仮説文字数を最小
可能文字数から最大可能文字数＋１まで変化させ、その
仮説文字数を前提として、ＤＰマッチングにより文字列
の認識を行なう。真の文字数より多い文字数を仮定した
場合には、対応する画像がないため文字列認識の評価値
が悪くなることを利用して、各仮説文字数についての結
果から、最終的な文字数と読み取り結果を文字列認識装
置により推定する。

【００１９】上記のように文字数仮説発生装置で文字数
に関する仮説を発生し、文字列情報及び文字数仮説発生
装置で発生する全ての仮説文字数に基づいてＤＰマッチ
ングを行なって最終的な文字列を決定することにより、
文字数が不定もしくは不明な対象に対しても、文字列の
文字パターンを含む画像データから正確に文字位置を推
定し、正しい認識結果を得ることができる。

【００２０】

【実施例】以下、図面を参照して本発明の一実施例を説
明する。図１は、本発明の一実施例に係る文字列読み取
り装置の構成を示すブロック図である。本実施例におけ
る文字列読み取り装置は、定型（各文字毎に大きさは異
なり得る）文字列を含む画像データ及び処理対象とする
全文字種類についてのサンプル画像（テンプレート）が
与えられた場合に、文字列内に例えば文字間の隙間が一
定という規則で配列された文字列を読み取るものであ
る。

【００２１】図１において、１１は定型文字列を含む画
像データが入力される文字列領域計算装置である。この
文字列領域計算装置１１は、入力される画像データを例
えばＲＡＭ等のメモリに格納し、文字パターンを含む文
字列領域を求めて相互相関計算装置１３及び規則基準値
設定装置１６へ出力する。また、１２はテンプレート読
み出し装置で、テンプレート記憶装置（図示せず）に格
納されている複数のテンプレートを１つずつ読み出して
相互相関計算装置１３へ出力する。上記テンプレート記
憶装置には、読み取りの対象とする全文字種類について
のサンプル画像であるテンプレートがデータベースとし
て予め記憶されている。

【００２２】この相互相関計算装置１３は、文字列領域
計算装置１１によって求められた文字列領域内の画像に
ついて、テンプレート読み出し装置１２によって読み出
された各テンプレートを、文字列領域内で移動させなが
ら各位置で相関度を求め、その結果を高相関位置検出装
置１４及びＤＰ定式化装置１７へ出力する。

【００２３】また、１５は文字数仮説発生装置で、文字
列の文字数に関する仮説を発生する。この文字数仮説発
生装置１５で発生する仮説文字数Ｐの値は、対象が最小
Ｐmin 、最大Ｐmax の文字を含む場合、Ｐmin ＜Ｐ＜Ｐ
max ＋１である。上記文字数仮説発生装置１５から出力
される仮説文字数Ｐは、規則基準値設定装置１６及びＤ
Ｐ定式化装置１７へ送られる。上記規則基準値設定装置
１６には、規則情報記憶装置（図示せず）に記憶されて
いる規則情報が与えられる。この規則情報は、規則基準
値設定装置１６において設定される文字列に関する規則
基準値の基になる情報である。この規則基準値設定装置
１６は、文字数仮説発生装置１５から与えられる仮説文
字数及び上記規則情報に基づいて処理対象とする文字列
に関する規則基準値を設定し、その規則基準値をＤＰ定
式化装置１７へ出力する。

【００２４】このＤＰ定式化装置１７は、相互相関計算
装置１３によって求められた相互相関値と、高相関位置
検出装置１４によって求められた高相関位置と、規則基
準値設定装置１６によって設定された規則基準値に基づ
いて、テンプレート相関結果と規則基準値をＤＰマッチ
ング（動的計画法）にかけるための定式化、すなわち各
テンプレートに対応するテンプレート相関結果の順序関
係を定義する。なお、テンプレート相関結果とは、相互
相関値、高相関位置、テンプレート名の各情報が含まれ
ているものとする。

【００２５】上記ＤＰ定式化装置１７により設定された
内容は、ＤＰマッチング装置１８へ送られる。このＤＰ
マッチング装置１８は、ＤＰマッチング（動的計画法）
の手法を用いて、ＤＰ定式化装置１７により定義された
テンプレート相関結果の順序関係に応じて、テンプレー
ト相関結果と処理対象とする文字列中の各文字との対応
付けを行ない、その結果を文字列認識装置１９へ出力す
る。また、ＤＰマッチング装置１８は、ＤＰマッチング
の処理を終了する毎に処理終了を示す信号を文字数仮説
発生装置１５へ出力する。この文字数仮説発生装置１５
は、ＤＰマッチング装置１８から処理終了を示す信号が
送られてくると、他の仮説文字数を発生する。これによ
り文字数仮説発生装置１５が発生する全ての仮説文字数
に対してＤＰマッチング装置１８がＤＰマッチング処理
を実行し、その結果を文字列認識装置１９へ出力する。

【００２６】文字列認識装置１９は、文字数仮説発生装
置１５で発生した全ての仮説文字数についての上記ＤＰ
マッチングの結果から最終的な文字列を決定し、もしく
は認識不能を判断し、その認識結果を文字数と共に出力
する。

【００２７】次に上記実施例の動作を説明する。予め全
ての文字種類についてテンプレートをデータベース（図
示せず）に用意する。刻印文字のように照明により文字
部の一部が光り、他が影になるような場合も見える状態
そのままをテンプレートとして登録しておく。

【００２８】そして、文字列領域計算装置１１におい
て、画像データより文字列領域を次のように計算する。
まず、何らかのアドホックな手法により文字列とその背
景部分だけからなる領域を切り出す。同じくアドホック
な手法により文字列が水平方向に並ぶように場合によっ
ては画像に回転をかける（横書きの場合これにより文字
は直立する）。その領域について、輝度値を縦方向に射
影し、横方向に関する輝度射影分布を求める。この分布
は背景の輝度ムラやノイズ、文字部の切れや結合等で各
文字毎に切り出しを行なうには不完全な情報の危険性が
ある。しかし、大局的にみた場合、文字列の領域なのか
それ以外の領域であるかは背景部と文字部の平均輝度が
異なる場合には輝度射影分布をしきい値処理し、しきい
値を越える最右点と最左点を求めることにより判断可能
である。この場合、左から右に射影分布を調べ、初めて
しきい値を越えたところから最後にしきい値を越えたと
ころまでの領域を文字列領域とする。

【００２９】次にテンプレート読み出し装置１２によ
り、まずテンプレートを一つ読み出す。テンプレート
は、輝度値を成分とする二次元の画像データであり、こ
こでベクトルｔi と表す。但し、ここでｉはｉ番目のテ
ンプレートを表す添字である。ｔi の要素は各画素の輝
度値であり、二値画像の場合は０か１、多値画像の場合
はその輝度範囲に応じた数値をとる。注意すべきこと
は、テンプレートの大きさは文字種類ｉによって異なり
得るので、ｔi の次元数とｔj の次元数は同じとは限ら
ないということである。例えば文字「Ｗ」のテンプレー
トは文字「Ｉ」のテンプレートと高さは同じものの幅が
異なるため、次元（＝幅×高さ）は異なる。

【００３０】相互相関計算装置１３は、テンプレート読
み出し装置１２により読み出されたテンプレートを入力
画像の文字列領域内で移動させながら相関値を計算す
る。テンプレートと重なっている部分の入力画像はテン
プレートと同じ次元のベクトルであり、ｒ（ｘ，ｙ）と
表す。ここで（ｘ，ｙ）はテンプレートの基準点（ここ
では画像の左上の点）が入力画像の（ｘ，ｙ）の位置に
あるときにテンプレートと重なる部分を表す。このとき
相関度ｓ（ｉ，ｘ，ｙ）は

【００３１】

【数１】で求められる。ここで「・」はベクトルの内積を、「‖
・‖」はベクトルの大きさを表す。

【００３２】上記相関度ｓ（ｉ，ｘ，ｙ）を全てのテン
プレートｉを入力画像全体の（ｘ，ｙ）について動かし
て求め、高相関位置検出装置１４に出力する。高相関位
置検出装置１４は、各テンプレートｉについて上記相関
度ｓ（ｉ，ｘ，ｙ）の高い位置（ｘ，ｙ）を最大ｎ個求
める。ｎは各テンプレートの表す文字が、現在対象とし
ている文字列の中に出現し得る回数分とする。但し、後
の処理を高速化するために、相関度がしきい値以下であ
ればｎ個分求めず、しきい値を越えた個数分求めておく
等のバリエーションが考えられる。

【００３３】一方、文字数仮説発生装置１５により、文
字列の文字数に関する仮説を発生し、規則基準値設定装
置１６に入力する。対象が最小Ｐmin 、最大Ｐmax の文
字を含む場合には、仮説文字数Ｐは、Ｐmin ＜Ｐ＜Ｐma
x ＋１である。

【００３４】規則基準値設定装置１６は、文字列に関す
る知識を設定する。例えば文字の隙間が一定、既知であ
れば文字隙間の規則基準値を１文字目と２文字目、２文
字目と３文字目等々すべてについてその既知の値に設定
する。文字列の隙間は一定であるが値は未知である場合
には、ここで隙間の推定を行なう。具体的には、各テン
プレートの文字幅の平均値Ｗcharを

【００３５】

【数２】で計算する。

【００３６】そして、文字列領域計算装置１１で求めた
文字列の幅をＷstringとし、仮説文字数をＰとすると、
文字隙間の基準値Ｗgap はＷgap ＝（Ｗstring−Ｗchar×Ｐ）／（Ｐ−１）で求まる。

【００３７】ＤＰ定式化装置１７は、テンプレート相関
結果と文字列の規則基準値をＤＰマッチングにかけるた
めの定式化を行なう。まず、高相関位置検出装置１４で
求めた高相関位置（ｘ，ｙ）をｘ座標により左から右へ
ソートする。ｘ座標が同じ場合にはｙ座標が小さい
（上）から大きい（下）へソートし、高相関位置検出装
置１４で求めた全ての（ｘ，ｙ）を１次元に並べること
により、テンプレート相関結果（相関位置（ｘ，ｙ）、
テンプレート名ｉ、相関度ｓ（ｉ，ｘ，ｙ））に順序関
係を定義する。

【００３８】次に、ＤＰマッチング装置１８により、上
で求めた高相関位置列と文字列の何文字目かを最適に対
応付けする。ＤＰマッチングでは対応付けられる対象を
横軸、対応づけの基準となるものを縦軸にとり、対応グ
ラフを発見する問題として表現することが多いため、こ
こでもその方式で説明する。横軸をＡ軸、縦軸をＢ軸と
表す。Ａ軸上には、１次元にソートされたテンプレート
相関結果を配置し、Ｂ軸は、１文字目、２文字目、…を
表す軸とする。ＤＰマッチングそのものは公知の技術で
あるので内容は説明しないが、ＤＰマッチングに用いる
評価関数は本発明において独自に工夫した点であるので
以下に説明する。

【００３９】ＤＰマッチングはＡ軸上に配置された要素
（ａ1 ，ａ2 ，…，ａN ）とＢ軸上に配置された要素
（ｂ1 ，ｂ2 ，…，ｂM ）との対応付けを、ある評価関
数を最大にするように求める手法である。今、ＤＰマッ
チングにより次のような対応が求まったとする。

【００４０】（ａ1 ，ｂ1 ）−（ａ2 ，ｂ2 ）−・・・
−（ａn ，ｂm ）これはｂ1 文字目はａ1 で表されるテンプレート相関結
果である、という判断を表す。テンプレート相関結果に
は文字種類ｉ、文字位置（ｘ，ｙ）が含まれているの
で、これにより文字列のｂ1 文字目の文字種類と文字位
置とが認識されたことになる。

【００４１】（ａi ，ｂj ）を対応付けする評価関数は Φ（ａi ，ｂj ）＝αφ（ａi ，ｂj ）＋βＭax(ak,b
l) ｛ψ（ａk ，ｂl ，ａi ，ｂj ）｝で表す。ここでφ（ａi ，ｂj ）はｂj 文字目がａi の
文字種類である確度を意味し、本発明では要素ａi の相
関値を用いる。ψ（ａk ，ｂl ，ａi ，ｂj ）はｂj 文
字目にａi で表される文字が書かれていたと仮定した場
合に、その１つ前であるｂl 文字目がａk で表される確
度を意味し、 ψ（ａk ，ｂl ，ａi ，ｂj ）＝Ｃonst −（Ａbs
（（ｘai−ｘak）−Ｗidth（ａk ）−Ｗgap ）＋φ（ａ
k ，ｂl ）＋Ａbs（ｙai−ｙak））で定義する。Ａbsは絶対値、ｘakは要素ａk の存在する
位置（Ｘ座標）、Ｗidth（ａk ）はａk 要素の表す文字
種類のテンプレート幅である。Ｗgap は規則基準値設定
装置１６で推定または設定された文字隙間である。ま
た、Ｃonstは一定の正数とし、ｂj ＝１（１文字目）の
時はψ＝０とする。本適用例では１文字目、２文字目、
３文字目というように、Ｂ軸の要素は必ずＡ軸上の要素
のどれかと対応付けられなくてはならない。従ってｂj
の１つ前であるｂi は、ｂi ＝ｂj −１とした。

【００４２】α及びβは２種類の評価関数を足し込む際
の重み付けを表す係数である。Φ（ａi ，ｂj ）を決定
する時、Ｍax(ak,bl) ψ（ａk ，ｂl ，ａi ，ｂj ）を
満足したａk ，ｂl を併せて記憶しておく（具体的には
（ａi ，ｂj ）から（ａk ，ｂl ）へのポインタをも
つ）。

【００４３】こうして各（ａi ，ｂj ）についてΦを求
めた後、Ｍax(an,M)｛Φ（ａn ，Ｍ）｝を計算し、その点から上で説明したポインタをたどるこ
とで全ての文字の認識に相当する対応付けが得られる。
この時のＭax(an,M)｛Φ（ａn ，Ｍ）｝の値が文字列全
体の認識結果の確度である。

【００４４】文字列認識装置１９により、上記ＤＰ定式
化装置１７で求めた対応結果を用いて文字数と文字列の
各文字を認識する。具体的には、Ｍ文字と仮定した時に
得られた対応付けが（ａi1，１）−（ａi2，２）−・・・−（ａiM，Ｍ）であったとすると、文字列の１文字目はａi1のテンプレ
ート相関結果が表す位置（ｘai1 ，ｙai1 ）に存在し、
文字内容はテンプレートの文字、その文字である確度は
Φ（ａi1，１）である。文字数は次のように推定する。
Ｍ文字と仮定した時の各文字の文字確度は、φ（ａ1 ，
１），…φ（ａM ，Ｍ）であり、１文字の平均確度Ｔ
（Ｍ）は

【００４５】

【数３】である。一般に本手法の場合、図２に示すように実際の
文字数以下の文字数を仮定した場合には実際の文字数の
部分集合を認識するので、１文字の平均確度は大きい。
図２は、実際の文字数が「５」である場合に、仮説文字
数を「３」として文字列領域２１から文字を切り出した
場合の例を示したもので、例えば「ＨＢＦ３Ｃ」の文字
列に対し、３文字の「Ｈ」，「Ｆ」，「Ｃ」に関しては
正しい位置ａ，ｂ，ｃで切り出しており、文字確度は高
い。

【００４６】しかし、図３に示すように実際の文字数よ
り多い文字数を仮定した場合には、対応する画像がな
く、むりやり文字の書かれていない部分をある文字と読
もうとするので文字の平均確度は低下する。図３（ａ）
は、実際の文字数が「５」である場合に、仮説文字数を
「６」として文字列領域２１から文字を切り出した場合
の例を示したもので、例えば「ＨＢＦ３Ｃ」の５文字に
対してａ〜ｆの６箇所で文字の切り出しを行なうので、
文字の切り出しが正確に行なわれない。図３において、
ａの切り出し位置は、「Ｈ」の文字の左側であるので、
「１」の文字確度が高い。また、ｃの切り出し位置は、
丁度「Ｂ」の位置に一致するので「Ｂ」の文字確度が高
い。その他、ｂ，ｄ，ｅ，ｆの切り出し位置は、文字の
位置とずれるので、文字確度が低くなる。

【００４７】図３（ｂ）は、図３（ａ）と同様に実際の
文字数が「５」である場合に、仮説文字数を「６」とし
て文字列領域２１から文字を切り出した場合であるが、
文字列領域２１の先頭部分にノイズ２２がある場合の例
を示したものである。この図３（ｂ）の例では、ノイズ
２２の影響で文字列領域２１が大きめにとられ、ノイズ
２２部分も文字であるとしてａ〜ｆの位置で文字の切り
出しが行なわれた場合であり、ａの切り出し位置がノイ
ズ２２に対応し、ｂ〜ｆの切り出し位置が「ＨＢＦ３
Ｃ」の５文字に対応した状態となっている。従って、ａ
の切り出し位置は文字確度は低いが、ｂ〜ｆの切り出し
位置は文字角度が高くなっている。

【００４８】本発明では、上記のような文字確度に変化
を考慮し、図４及び図５に示すように仮定文字数Ｐを最
小から最大＋１まで動かして、急に平均文字確度Ｔ
（Ｍ）の低下した文字数を検出し、その１つ前の文字数
を推定文字数とする。図４は、文字数が「Ｐx ＜Ｐmax
」の場合の例を示したもので、仮説文字数ＰがＰx か
らＰx ＋１に変化させた時に平均文字確度Ｔ（Ｍ）が急
に低下している。従って、この場合には、Ｐx が推定文
字数となる。図５は、仮説文字数ＰがＰmax の場合の例
を示したもので、仮説文字数ＰがＰmax からＰmax ＋１
に変化させた時に平均文字確度Ｔ（Ｍ）が急に低下して
いる。従って、この場合には、Ｐmax が推定文字数とな
る。

【００４９】推定した文字数での結果において、文字毎
に確度が低い場合や、文字列全体の確度が低い場合に
は、文字を誤認識している危険性があるためリジェクト
の判断を行なう。それ以外の場合には文字認識結果を出
力する。なお、上記実施例では、横書きの英字列の文字
を認識する場合について説明したが、縦書き文字列つい
ても上記実施例と同様にして認識することができる。

【００５０】

【発明の効果】以上詳記したように本発明によれば、文
字数仮説発生装置で文字列に含まれる文字数に関する仮
説を発生し、文字列情報及び文字数仮説発生装置で発生
する全ての仮説文字数に基づいてＤＰマッチングを行な
い、その結果から最終的な文字列を決定するようにした
ので、文字数が不定もしくは不明な対象に対しても、文
字列の文字パターンを含む画像データから正確に文字位
置を推定し、正しい認識結果を得ることができる。ま
た、背景部分の輝度ムラ、ノイズ、文字部の切れ、複数
文字の結合などによる文字切り出し失敗や、これによる
文字認識失敗を防ぎ、文字列の規則を利用して文字数の
推定も含め、確度の高い文字切り出し、文字認識を同時
に行なうことができる。

【図面の簡単な説明】

【図１】本発明の一実施例に係る文字列読み取り装置の
全体構成を示すブロック図。

【図２】同実施例における仮説文字数が実際の文字数以
下の場合の切り出し動作を説明するための図。

【図３】同実施例における仮説文字数が実際の文字数よ
り大きい場合の切り出し動作を説明するための図。

【図４】同実施例における仮説文字数が最大値より小さ
い場合の文字数の推定動作を説明するための図。

【図５】同実施例における仮説文字数が最大値の場合の
文字数の推定動作を説明するための図。

【図６】従来技術において連結部分を１文字として１文
字切り出しを行なう手法を説明するための図。

【図７】従来技術において射影部分の分布により１文字
切り出しを行なう手法を説明するための図。

【図８】従来技術において連結部分を１文字として１文
字切り出しを行なう手法の問題点を説明するための図。

【図９】従来技術において射影部分の分布により１文字
切り出しを行なう手法の問題点を説明するための図。

【符号の説明】

１１文字列領域計算装置１２テンプレート読み出し装置１３相互相関計算装置１４高相関位置検出装置１５文字数仮説発生装置１６規則基準値設定装置１７ＤＰ定式化装置１８ＤＰマッチング装置１９文字列認識装置２１文字列領域２２ノイズ

Claims

【特許請求の範囲】

【請求項１】文字列の文字パターンを含む画像データ
から各文字についての文字認識結果を求める文字列読み
取り装置において、上記文字列を含む画像データから上記文字パターンを含
む文字列領域を求める文字列領域計算装置と、予めテンプレート記憶装置に記憶された読み取りの対象
とする全文字種類についてのサンプル画像であるテンプ
レートを読み出すテンプレート読み出し装置と、上記テンプレート読み出し装置によって読み出されたテ
ンプレートの位置を、上記文字列領域計算装置によって
得られた文字列領域内で変更しながら、各位置での文字
領域内の画像データと上記テンプレートとの相互相関値
を求める相互相関計算装置と、上記相互相関計算装置によって各位置で求めた上記相互
相関値のうち、相関度の高い所定数個分の位置を求める
高相関位置検出装置と、処理対象とする文字列に含まれる文字数に関する仮説を
発生する文字数仮説発生装置と、文字列に関する規則情報及び上記文字数仮説発生装置で
発生した仮説文字数に基づいて、処理対象とする文字列
に関する規則基準値を設定する規則基準値設定装置と、上記相互相関計算装置によって求められた相互相関値
と、上記高相関位置検出装置によって求められた高相関
位置と、上記規則基準値設定装置によって設定された規
則基準値を用いてＤＰマッチング（動的計画法）を行な
うための設定を行なうＤＰ定式化装置と、上記ＤＰ定式化装置によって設定された内容に応じて、
ＤＰマッチングの手法を用いて、各テンプレート毎に求
められた、上記相互相関値と上記高相関位置と同相互相
関値及び同高相関位置を求める際に用いたテンプレート
を示すテンプレート名を含むテンプレート相関結果を、
文字列の文字順に対応づけするＤＰマッチング装置と、上記文字数仮説発生装置で発生した全ての仮説文字数に
ついての上記ＤＰマッチング装置の結果から最終的な文
字列を決定し、もしくは認識不能を判断する文字列認識
装置と、を具備したことを特徴とする文字列読み取り装
置。