JPH08147414A - 文字列読み取り装置 - Google Patents

文字列読み取り装置

Info

Publication number
JPH08147414A
JPH08147414A JP6283551A JP28355194A JPH08147414A JP H08147414 A JPH08147414 A JP H08147414A JP 6283551 A JP6283551 A JP 6283551A JP 28355194 A JP28355194 A JP 28355194A JP H08147414 A JPH08147414 A JP H08147414A
Authority
JP
Japan
Prior art keywords
character
character string
correlation
template
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP6283551A
Other languages
English (en)
Other versions
JP3388918B2 (ja
Inventor
Shintaro Kumano
信太郎 熊野
Kazumasa Miyamoto
一正 宮本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Heavy Industries Ltd
Original Assignee
Mitsubishi Heavy Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Heavy Industries Ltd filed Critical Mitsubishi Heavy Industries Ltd
Priority to JP28355194A priority Critical patent/JP3388918B2/ja
Publication of JPH08147414A publication Critical patent/JPH08147414A/ja
Application granted granted Critical
Publication of JP3388918B2 publication Critical patent/JP3388918B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】 文字数が不定もしくは不明な対象に対して
も、正確に文字位置を推定し、正しい認識結果を取得で
きる文字列読み取り装置を提供する。 【構成】 文字列に含まれる文字数に関する仮説を発生
する文字数仮説発生装置15と、文字列に関する規則情
報及び上記仮説文字数に基づいて、処理対象とする文字
列に関する規則基準値を設定する規則基準値設定装置1
6と、相互相関値と高相関位置と規則基準値を用いてD
Pマッチングを行なうための設定を行なうDP定式化装
置17と、このDP定式化装置17により設定された内
容に応じて、相互相関値と高相関位置とテンプレート名
を含むテンプレート相関結果を、文字列の文字順に対応
づけするDPマッチング装置18と、文字数仮説発生装
置15で発生した全ての仮説文字数についての上記DP
マッチング装置18の結果から最終的な文字列を決定す
る文字列認識装置50を備える。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、定型文字列等の文字パ
ターンを含む画像データから文字数、文字位置、文字種
類の推定と認識を行なう文字列読み取り装置に関する。
【0002】
【従来の技術】従来、例えば文字列の文字パターンを含
む画像データから文字列を読み取る場合には、まず文字
列の文字パターンを1文字毎の文字パターンに分解する
文字切り出し処理を行ない、次に切り出された1文字1
文字の文字パターンについて文字認識する手順が一般的
である。
【0003】文字切り出し処理は、一般的には、画像デ
ータの輝度情報に基づいて、文字部分と背景部分を分離
する輝度しきい値を求め、このしきい値により画像デー
タの二値化を行なう。そして、図6に示すように二値化
により連結する1かたまり(以下、連結成分とする)を
1文字とみなして分解する第1の手法か、あるいは図7
に示すように文字列が横書きの場合には縦方向に射影を
取り、縦方向の輝度分布を求め(文字列が縦書きの場合
には横方向に射影を取り、横方向の輝度分布を求め
る)、これに対して輝度分布を表す射影ヒストグラムの
凸凹から文字の切れ目を推定して分解するという第2の
手法を用いている。
【0004】このように従来では、文字列の画像データ
から文字を読み取るためには文字切り出しを行なわねば
ならず、文字切り出し処理では1文字が1つの連結成分
になるように輝度のしきい値を求めるか、あるいは射影
により文字の切れ目を推定する必要があった。ところ
が、従来の第1及び第2の手法による文字切り出し処理
には、それぞれ次のような問題がある。
【0005】まず、第1の手法では、次のような問題が
ある。一般には、画像データ中の1つの文字の中でも輝
度の分布があるため1文字が1つの連結成分となるよう
にしきい値をとることが困難または画像データによって
は不可能となる場合があった。
【0006】具体的には、1文字を1つの連結成分にす
るためにしきい値を求めると、隣接する他の文字と1つ
の連結成分となったり、逆に隣接する他の文字と完全に
分離指せるためにしきい値を求めると、1つの文字が2
つ以上の連結成分に分離する場合があるという問題が生
じてしまう。
【0007】また、金属等に刻印された文字を1方向か
ら光を照射して得られる刻印文字の画像の場合では、元
々影により文字を浮き上がらせているため、1つの文字
の影が連結していない場合が多い。従って、従来の方式
では、刻印文字の画像データには対処できないという問
題があった。
【0008】図8には連結成分を1文字として文字の切
り出しを行なう状況を示している。図8(a)に示す画
像データには、本来、2文字からなる文字列「AB」の
文字パターンが含まれているが、所定のしきい値によっ
て二値化した結果、4つの連結成分ができている。従っ
て、図8(b)に示すように、(1)〜(4)のパター
ンがそれぞれ1文字として切り出される。このため、切
り出された各文字毎について文字認識しても、当然なが
ら本来の文字「AB」の認識結果を得ることができな
い。
【0009】次に、第2の手法では、次のような問題が
ある。射影ヒストグラムをとった場合、異なる文字の間
に必ず射影値0の部分ができ、1文字の全範囲内で射影
値0より大であれば問題がないが、背景部分のノイズや
一部の欠落により、こうした条件が満たされない場合が
しばしば起こる。
【0010】射影値が0か否かによって文字の切れ目を
判別するのではなく、射影分布の凸凹の形状から文字の
切れ目を推定するには、文字の幅(縦書きの場合には高
さ)が分かっている必要もある。例えば、文字種類によ
って文字幅が異なる場合には、文字数と文字の隙間が分
かっていても、文字の切り出しが正確には行なえないと
いう問題がある。
【0011】具体的には、「W」のように横に広い文字
と「I」のように細い文字とが存在する文字列では、背
景部分の輝度ムラも考慮に入れると、射影輝度の形状だ
けから信頼性の高い文字切り出しを行なうことはできな
かった。
【0012】また、第1の手法と同様に、刻印文字の画
像などの場合には、1つの文字が連結しないので、射影
成分に偽の文字切れ目が多く発生し、正確な文字切り出
しができなかった。
【0013】図9には射影成分の分布により1文字切り
出しを行なう状況を示している。図9(a)に示す画像
データには、本来、3文字からなる文字列「HBF」の
文字パターンが含まれているが、図9(b)の射影ヒス
トグラムの凸凹から推定すると、1〜5の文字切れ目候
補が得られる。すなわち、真の切れ目が2つ(文字切れ
目候補2,4)であるにもかかわらず、この切れ目のみ
を正確に求めることができない。従って、文字切れ目候
補で切り出された各文字毎について文字認識しても、当
然ながら本来の文字「HBF」の認識結果を得ることが
できない。
【0014】このような問題を解決するため、本出願人
は先に特願平6−28070号にて文字列読み取り装置
を出願した。この文字列読み取り装置は、前提として文
字数が分かっていることを利用し、これをDPマッチン
グでの前処理として文字認識を行なうようにしたもので
ある。
【0015】
【発明が解決しようとする課題】この文字列読み取り装
置によれば、文字列の文字パターンを含む画像データか
ら正確に文字位置を推定し、正しい認識結果を取得でき
るものであるが、文字認識を行なうために文字数を予め
知っておく必要があり、文字数が不定もしくは不明な対
象に対しては適用できないという問題がある。具体的に
は、DPマッチングを行なう際の文字列知識として、画
像を何文字と対応付けするかの情報、即ち文字数に関す
る情報がDP定式化装置において必要であった。
【0016】本発明は上記の事情を考慮してなされたも
ので、文字数が不定もしくは不明な対象に対しても、文
字列の文字パターンを含む画像データから正確に文字位
置を推定し、正しい認識結果を取得できる文字列読み取
り装置を提供することを目的とする。
【0017】
【課題を解決するための手段】本発明は、文字列の文字
パターンを含む画像データから各文字についての文字認
識結果を求める文字列読み取り装置において、上記文字
列を含む画像データから上記文字パターンを含む文字列
領域を求める文字列領域計算装置と、予めテンプレート
記憶装置に記憶された読み取りの対象とする全文字種類
についてのサンプル画像であるテンプレートを読み出す
テンプレート読み出し装置と、上記テンプレート読み出
し装置によって読み出されたテンプレートの位置を、上
記文字列領域計算装置によって得られた文字列領域内で
変更しながら、各位置での文字領域内の画像データと上
記テンプレートとの相互相関値を求める相互相関計算装
置と、上記相互相関計算装置によって各位置で求めた上
記相互相関値のうち、相関度の高い所定数個分の位置を
求める高相関位置検出装置と、処理対象とする文字列に
含まれる文字数に関する仮説を発生する文字数仮説発生
装置と、文字列に関する規則情報及び上記文字数仮説発
生装置で発生した仮説文字数に基づいて、処理対象とす
る文字列に関する規則基準値を設定する規則基準値設定
装置と、上記相互相関計算装置によって求められた相互
相関値と、上記高相関位置検出装置によって求められた
高相関位置と、上記規則基準値設定装置によって設定さ
れた規則基準値を用いてDPマッチング(動的計画法)
を行なうための設定を行なうDP定式化装置と、上記D
P定式化装置によって設定された内容に応じて、DPマ
ッチングの手法を用いて、各テンプレート毎に求められ
た、上記相互相関値と上記高相関位置と同相互相関値及
び同高相関位置を求める際に用いたテンプレートを示す
テンプレート名を含むテンプレート相関結果を、文字列
の文字順に対応づけするDPマッチング装置と、上記文
字数仮説発生装置で発生した全ての仮説文字数について
の上記DPマッチング装置の結果から最終的な文字列を
決定し、もしくは認識不能を判断する文字列認識装置
と、を具備したことを特徴とする。
【0018】
【作用】文字数仮説発生装置により、仮説文字数を最小
可能文字数から最大可能文字数+1まで変化させ、その
仮説文字数を前提として、DPマッチングにより文字列
の認識を行なう。真の文字数より多い文字数を仮定した
場合には、対応する画像がないため文字列認識の評価値
が悪くなることを利用して、各仮説文字数についての結
果から、最終的な文字数と読み取り結果を文字列認識装
置により推定する。
【0019】上記のように文字数仮説発生装置で文字数
に関する仮説を発生し、文字列情報及び文字数仮説発生
装置で発生する全ての仮説文字数に基づいてDPマッチ
ングを行なって最終的な文字列を決定することにより、
文字数が不定もしくは不明な対象に対しても、文字列の
文字パターンを含む画像データから正確に文字位置を推
定し、正しい認識結果を得ることができる。
【0020】
【実施例】以下、図面を参照して本発明の一実施例を説
明する。図1は、本発明の一実施例に係る文字列読み取
り装置の構成を示すブロック図である。本実施例におけ
る文字列読み取り装置は、定型(各文字毎に大きさは異
なり得る)文字列を含む画像データ及び処理対象とする
全文字種類についてのサンプル画像(テンプレート)が
与えられた場合に、文字列内に例えば文字間の隙間が一
定という規則で配列された文字列を読み取るものであ
る。
【0021】図1において、11は定型文字列を含む画
像データが入力される文字列領域計算装置である。この
文字列領域計算装置11は、入力される画像データを例
えばRAM等のメモリに格納し、文字パターンを含む文
字列領域を求めて相互相関計算装置13及び規則基準値
設定装置16へ出力する。また、12はテンプレート読
み出し装置で、テンプレート記憶装置(図示せず)に格
納されている複数のテンプレートを1つずつ読み出して
相互相関計算装置13へ出力する。上記テンプレート記
憶装置には、読み取りの対象とする全文字種類について
のサンプル画像であるテンプレートがデータベースとし
て予め記憶されている。
【0022】この相互相関計算装置13は、文字列領域
計算装置11によって求められた文字列領域内の画像に
ついて、テンプレート読み出し装置12によって読み出
された各テンプレートを、文字列領域内で移動させなが
ら各位置で相関度を求め、その結果を高相関位置検出装
置14及びDP定式化装置17へ出力する。
【0023】また、15は文字数仮説発生装置で、文字
列の文字数に関する仮説を発生する。この文字数仮説発
生装置15で発生する仮説文字数Pの値は、対象が最小
Pmin 、最大Pmax の文字を含む場合、Pmin <P<P
max +1である。上記文字数仮説発生装置15から出力
される仮説文字数Pは、規則基準値設定装置16及びD
P定式化装置17へ送られる。上記規則基準値設定装置
16には、規則情報記憶装置(図示せず)に記憶されて
いる規則情報が与えられる。この規則情報は、規則基準
値設定装置16において設定される文字列に関する規則
基準値の基になる情報である。この規則基準値設定装置
16は、文字数仮説発生装置15から与えられる仮説文
字数及び上記規則情報に基づいて処理対象とする文字列
に関する規則基準値を設定し、その規則基準値をDP定
式化装置17へ出力する。
【0024】このDP定式化装置17は、相互相関計算
装置13によって求められた相互相関値と、高相関位置
検出装置14によって求められた高相関位置と、規則基
準値設定装置16によって設定された規則基準値に基づ
いて、テンプレート相関結果と規則基準値をDPマッチ
ング(動的計画法)にかけるための定式化、すなわち各
テンプレートに対応するテンプレート相関結果の順序関
係を定義する。なお、テンプレート相関結果とは、相互
相関値、高相関位置、テンプレート名の各情報が含まれ
ているものとする。
【0025】上記DP定式化装置17により設定された
内容は、DPマッチング装置18へ送られる。このDP
マッチング装置18は、DPマッチング(動的計画法)
の手法を用いて、DP定式化装置17により定義された
テンプレート相関結果の順序関係に応じて、テンプレー
ト相関結果と処理対象とする文字列中の各文字との対応
付けを行ない、その結果を文字列認識装置19へ出力す
る。また、DPマッチング装置18は、DPマッチング
の処理を終了する毎に処理終了を示す信号を文字数仮説
発生装置15へ出力する。この文字数仮説発生装置15
は、DPマッチング装置18から処理終了を示す信号が
送られてくると、他の仮説文字数を発生する。これによ
り文字数仮説発生装置15が発生する全ての仮説文字数
に対してDPマッチング装置18がDPマッチング処理
を実行し、その結果を文字列認識装置19へ出力する。
【0026】文字列認識装置19は、文字数仮説発生装
置15で発生した全ての仮説文字数についての上記DP
マッチングの結果から最終的な文字列を決定し、もしく
は認識不能を判断し、その認識結果を文字数と共に出力
する。
【0027】次に上記実施例の動作を説明する。予め全
ての文字種類についてテンプレートをデータベース(図
示せず)に用意する。刻印文字のように照明により文字
部の一部が光り、他が影になるような場合も見える状態
そのままをテンプレートとして登録しておく。
【0028】そして、文字列領域計算装置11におい
て、画像データより文字列領域を次のように計算する。
まず、何らかのアドホックな手法により文字列とその背
景部分だけからなる領域を切り出す。同じくアドホック
な手法により文字列が水平方向に並ぶように場合によっ
ては画像に回転をかける(横書きの場合これにより文字
は直立する)。その領域について、輝度値を縦方向に射
影し、横方向に関する輝度射影分布を求める。この分布
は背景の輝度ムラやノイズ、文字部の切れや結合等で各
文字毎に切り出しを行なうには不完全な情報の危険性が
ある。しかし、大局的にみた場合、文字列の領域なのか
それ以外の領域であるかは背景部と文字部の平均輝度が
異なる場合には輝度射影分布をしきい値処理し、しきい
値を越える最右点と最左点を求めることにより判断可能
である。この場合、左から右に射影分布を調べ、初めて
しきい値を越えたところから最後にしきい値を越えたと
ころまでの領域を文字列領域とする。
【0029】次にテンプレート読み出し装置12によ
り、まずテンプレートを一つ読み出す。テンプレート
は、輝度値を成分とする二次元の画像データであり、こ
こでベクトルti と表す。但し、ここでiはi番目のテ
ンプレートを表す添字である。ti の要素は各画素の輝
度値であり、二値画像の場合は0か1、多値画像の場合
はその輝度範囲に応じた数値をとる。注意すべきこと
は、テンプレートの大きさは文字種類iによって異なり
得るので、ti の次元数とtj の次元数は同じとは限ら
ないということである。例えば文字「W」のテンプレー
トは文字「I」のテンプレートと高さは同じものの幅が
異なるため、次元(=幅×高さ)は異なる。
【0030】相互相関計算装置13は、テンプレート読
み出し装置12により読み出されたテンプレートを入力
画像の文字列領域内で移動させながら相関値を計算す
る。テンプレートと重なっている部分の入力画像はテン
プレートと同じ次元のベクトルであり、r(x,y)と
表す。ここで(x,y)はテンプレートの基準点(ここ
では画像の左上の点)が入力画像の(x,y)の位置に
あるときにテンプレートと重なる部分を表す。このとき
相関度s(i,x,y)は
【0031】
【数1】 で求められる。ここで「・」はベクトルの内積を、「‖
・‖」はベクトルの大きさを表す。
【0032】上記相関度s(i,x,y)を全てのテン
プレートiを入力画像全体の(x,y)について動かし
て求め、高相関位置検出装置14に出力する。高相関位
置検出装置14は、各テンプレートiについて上記相関
度s(i,x,y)の高い位置(x,y)を最大n個求
める。nは各テンプレートの表す文字が、現在対象とし
ている文字列の中に出現し得る回数分とする。但し、後
の処理を高速化するために、相関度がしきい値以下であ
ればn個分求めず、しきい値を越えた個数分求めておく
等のバリエーションが考えられる。
【0033】一方、文字数仮説発生装置15により、文
字列の文字数に関する仮説を発生し、規則基準値設定装
置16に入力する。対象が最小Pmin 、最大Pmax の文
字を含む場合には、仮説文字数Pは、Pmin <P<Pma
x +1である。
【0034】規則基準値設定装置16は、文字列に関す
る知識を設定する。例えば文字の隙間が一定、既知であ
れば文字隙間の規則基準値を1文字目と2文字目、2文
字目と3文字目等々すべてについてその既知の値に設定
する。文字列の隙間は一定であるが値は未知である場合
には、ここで隙間の推定を行なう。具体的には、各テン
プレートの文字幅の平均値Wcharを
【0035】
【数2】 で計算する。
【0036】そして、文字列領域計算装置11で求めた
文字列の幅をWstringとし、仮説文字数をPとすると、
文字隙間の基準値Wgap は Wgap =(Wstring−Wchar×P)/(P−1) で求まる。
【0037】DP定式化装置17は、テンプレート相関
結果と文字列の規則基準値をDPマッチングにかけるた
めの定式化を行なう。まず、高相関位置検出装置14で
求めた高相関位置(x,y)をx座標により左から右へ
ソートする。x座標が同じ場合にはy座標が小さい
(上)から大きい(下)へソートし、高相関位置検出装
置14で求めた全ての(x,y)を1次元に並べること
により、テンプレート相関結果(相関位置(x,y)、
テンプレート名i、相関度s(i,x,y))に順序関
係を定義する。
【0038】次に、DPマッチング装置18により、上
で求めた高相関位置列と文字列の何文字目かを最適に対
応付けする。DPマッチングでは対応付けられる対象を
横軸、対応づけの基準となるものを縦軸にとり、対応グ
ラフを発見する問題として表現することが多いため、こ
こでもその方式で説明する。横軸をA軸、縦軸をB軸と
表す。A軸上には、1次元にソートされたテンプレート
相関結果を配置し、B軸は、1文字目、2文字目、…を
表す軸とする。DPマッチングそのものは公知の技術で
あるので内容は説明しないが、DPマッチングに用いる
評価関数は本発明において独自に工夫した点であるので
以下に説明する。
【0039】DPマッチングはA軸上に配置された要素
(a1 ,a2 ,…,aN )とB軸上に配置された要素
(b1 ,b2 ,…,bM )との対応付けを、ある評価関
数を最大にするように求める手法である。今、DPマッ
チングにより次のような対応が求まったとする。
【0040】(a1 ,b1 )−(a2 ,b2 )−・・・
−(an ,bm ) これはb1 文字目はa1 で表されるテンプレート相関結
果である、という判断を表す。テンプレート相関結果に
は文字種類i、文字位置(x,y)が含まれているの
で、これにより文字列のb1 文字目の文字種類と文字位
置とが認識されたことになる。
【0041】(ai ,bj )を対応付けする評価関数は Φ(ai ,bj )=αφ(ai ,bj )+βMax(ak,b
l) {ψ(ak ,bl ,ai ,bj )} で表す。ここでφ(ai ,bj )はbj 文字目がai の
文字種類である確度を意味し、本発明では要素ai の相
関値を用いる。ψ(ak ,bl ,ai ,bj )はbj 文
字目にai で表される文字が書かれていたと仮定した場
合に、その1つ前であるbl 文字目がak で表される確
度を意味し、 ψ(ak ,bl ,ai ,bj )=Const −(Abs
((xai−xak)−Width(ak )−Wgap )+φ(a
k ,bl )+Abs(yai−yak)) で定義する。Absは絶対値、xakは要素ak の存在する
位置(X座標)、Width(ak )はak 要素の表す文字
種類のテンプレート幅である。Wgap は規則基準値設定
装置16で推定または設定された文字隙間である。ま
た、Constは一定の正数とし、bj =1(1文字目)の
時はψ=0とする。本適用例では1文字目、2文字目、
3文字目というように、B軸の要素は必ずA軸上の要素
のどれかと対応付けられなくてはならない。従ってbj
の1つ前であるbi は、bi =bj −1とした。
【0042】α及びβは2種類の評価関数を足し込む際
の重み付けを表す係数である。Φ(ai ,bj )を決定
する時、Max(ak,bl) ψ(ak ,bl ,ai ,bj )を
満足したak ,bl を併せて記憶しておく(具体的には
(ai ,bj )から(ak ,bl )へのポインタをも
つ)。
【0043】こうして各(ai ,bj )についてΦを求
めた後、 Max(an,M){Φ(an ,M)} を計算し、その点から上で説明したポインタをたどるこ
とで全ての文字の認識に相当する対応付けが得られる。
この時のMax(an,M){Φ(an ,M)}の値が文字列全
体の認識結果の確度である。
【0044】文字列認識装置19により、上記DP定式
化装置17で求めた対応結果を用いて文字数と文字列の
各文字を認識する。具体的には、M文字と仮定した時に
得られた対応付けが (ai1,1)−(ai2,2)−・・・−(aiM,M) であったとすると、文字列の1文字目はai1のテンプレ
ート相関結果が表す位置(xai1 ,yai1 )に存在し、
文字内容はテンプレートの文字、その文字である確度は
Φ(ai1,1)である。文字数は次のように推定する。
M文字と仮定した時の各文字の文字確度は、φ(a1 ,
1),…φ(aM ,M)であり、1文字の平均確度T
(M)は
【0045】
【数3】 である。一般に本手法の場合、図2に示すように実際の
文字数以下の文字数を仮定した場合には実際の文字数の
部分集合を認識するので、1文字の平均確度は大きい。
図2は、実際の文字数が「5」である場合に、仮説文字
数を「3」として文字列領域21から文字を切り出した
場合の例を示したもので、例えば「HBF3C」の文字
列に対し、3文字の「H」,「F」,「C」に関しては
正しい位置a,b,cで切り出しており、文字確度は高
い。
【0046】しかし、図3に示すように実際の文字数よ
り多い文字数を仮定した場合には、対応する画像がな
く、むりやり文字の書かれていない部分をある文字と読
もうとするので文字の平均確度は低下する。図3(a)
は、実際の文字数が「5」である場合に、仮説文字数を
「6」として文字列領域21から文字を切り出した場合
の例を示したもので、例えば「HBF3C」の5文字に
対してa〜fの6箇所で文字の切り出しを行なうので、
文字の切り出しが正確に行なわれない。図3において、
aの切り出し位置は、「H」の文字の左側であるので、
「1」の文字確度が高い。また、cの切り出し位置は、
丁度「B」の位置に一致するので「B」の文字確度が高
い。その他、b,d,e,fの切り出し位置は、文字の
位置とずれるので、文字確度が低くなる。
【0047】図3(b)は、図3(a)と同様に実際の
文字数が「5」である場合に、仮説文字数を「6」とし
て文字列領域21から文字を切り出した場合であるが、
文字列領域21の先頭部分にノイズ22がある場合の例
を示したものである。この図3(b)の例では、ノイズ
22の影響で文字列領域21が大きめにとられ、ノイズ
22部分も文字であるとしてa〜fの位置で文字の切り
出しが行なわれた場合であり、aの切り出し位置がノイ
ズ22に対応し、b〜fの切り出し位置が「HBF3
C」の5文字に対応した状態となっている。従って、a
の切り出し位置は文字確度は低いが、b〜fの切り出し
位置は文字角度が高くなっている。
【0048】本発明では、上記のような文字確度に変化
を考慮し、図4及び図5に示すように仮定文字数Pを最
小から最大+1まで動かして、急に平均文字確度T
(M)の低下した文字数を検出し、その1つ前の文字数
を推定文字数とする。図4は、文字数が「Px <Pmax
」の場合の例を示したもので、仮説文字数PがPx か
らPx +1に変化させた時に平均文字確度T(M)が急
に低下している。従って、この場合には、Px が推定文
字数となる。図5は、仮説文字数PがPmax の場合の例
を示したもので、仮説文字数PがPmax からPmax +1
に変化させた時に平均文字確度T(M)が急に低下して
いる。従って、この場合には、Pmax が推定文字数とな
る。
【0049】推定した文字数での結果において、文字毎
に確度が低い場合や、文字列全体の確度が低い場合に
は、文字を誤認識している危険性があるためリジェクト
の判断を行なう。それ以外の場合には文字認識結果を出
力する。なお、上記実施例では、横書きの英字列の文字
を認識する場合について説明したが、縦書き文字列つい
ても上記実施例と同様にして認識することができる。
【0050】
【発明の効果】以上詳記したように本発明によれば、文
字数仮説発生装置で文字列に含まれる文字数に関する仮
説を発生し、文字列情報及び文字数仮説発生装置で発生
する全ての仮説文字数に基づいてDPマッチングを行な
い、その結果から最終的な文字列を決定するようにした
ので、文字数が不定もしくは不明な対象に対しても、文
字列の文字パターンを含む画像データから正確に文字位
置を推定し、正しい認識結果を得ることができる。ま
た、背景部分の輝度ムラ、ノイズ、文字部の切れ、複数
文字の結合などによる文字切り出し失敗や、これによる
文字認識失敗を防ぎ、文字列の規則を利用して文字数の
推定も含め、確度の高い文字切り出し、文字認識を同時
に行なうことができる。
【図面の簡単な説明】
【図1】本発明の一実施例に係る文字列読み取り装置の
全体構成を示すブロック図。
【図2】同実施例における仮説文字数が実際の文字数以
下の場合の切り出し動作を説明するための図。
【図3】同実施例における仮説文字数が実際の文字数よ
り大きい場合の切り出し動作を説明するための図。
【図4】同実施例における仮説文字数が最大値より小さ
い場合の文字数の推定動作を説明するための図。
【図5】同実施例における仮説文字数が最大値の場合の
文字数の推定動作を説明するための図。
【図6】従来技術において連結部分を1文字として1文
字切り出しを行なう手法を説明するための図。
【図7】従来技術において射影部分の分布により1文字
切り出しを行なう手法を説明するための図。
【図8】従来技術において連結部分を1文字として1文
字切り出しを行なう手法の問題点を説明するための図。
【図9】従来技術において射影部分の分布により1文字
切り出しを行なう手法の問題点を説明するための図。
【符号の説明】
11 文字列領域計算装置 12 テンプレート読み出し装置 13 相互相関計算装置 14 高相関位置検出装置 15 文字数仮説発生装置 16 規則基準値設定装置 17 DP定式化装置 18 DPマッチング装置 19 文字列認識装置 21 文字列領域 22 ノイズ

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 文字列の文字パターンを含む画像データ
    から各文字についての文字認識結果を求める文字列読み
    取り装置において、 上記文字列を含む画像データから上記文字パターンを含
    む文字列領域を求める文字列領域計算装置と、 予めテンプレート記憶装置に記憶された読み取りの対象
    とする全文字種類についてのサンプル画像であるテンプ
    レートを読み出すテンプレート読み出し装置と、 上記テンプレート読み出し装置によって読み出されたテ
    ンプレートの位置を、上記文字列領域計算装置によって
    得られた文字列領域内で変更しながら、各位置での文字
    領域内の画像データと上記テンプレートとの相互相関値
    を求める相互相関計算装置と、 上記相互相関計算装置によって各位置で求めた上記相互
    相関値のうち、相関度の高い所定数個分の位置を求める
    高相関位置検出装置と、 処理対象とする文字列に含まれる文字数に関する仮説を
    発生する文字数仮説発生装置と、 文字列に関する規則情報及び上記文字数仮説発生装置で
    発生した仮説文字数に基づいて、処理対象とする文字列
    に関する規則基準値を設定する規則基準値設定装置と、 上記相互相関計算装置によって求められた相互相関値
    と、上記高相関位置検出装置によって求められた高相関
    位置と、上記規則基準値設定装置によって設定された規
    則基準値を用いてDPマッチング(動的計画法)を行な
    うための設定を行なうDP定式化装置と、 上記DP定式化装置によって設定された内容に応じて、
    DPマッチングの手法を用いて、各テンプレート毎に求
    められた、上記相互相関値と上記高相関位置と同相互相
    関値及び同高相関位置を求める際に用いたテンプレート
    を示すテンプレート名を含むテンプレート相関結果を、
    文字列の文字順に対応づけするDPマッチング装置と、 上記文字数仮説発生装置で発生した全ての仮説文字数に
    ついての上記DPマッチング装置の結果から最終的な文
    字列を決定し、もしくは認識不能を判断する文字列認識
    装置と、を具備したことを特徴とする文字列読み取り装
    置。
JP28355194A 1994-11-17 1994-11-17 文字列読み取り装置 Expired - Lifetime JP3388918B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP28355194A JP3388918B2 (ja) 1994-11-17 1994-11-17 文字列読み取り装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP28355194A JP3388918B2 (ja) 1994-11-17 1994-11-17 文字列読み取り装置

Publications (2)

Publication Number Publication Date
JPH08147414A true JPH08147414A (ja) 1996-06-07
JP3388918B2 JP3388918B2 (ja) 2003-03-24

Family

ID=17666995

Family Applications (1)

Application Number Title Priority Date Filing Date
JP28355194A Expired - Lifetime JP3388918B2 (ja) 1994-11-17 1994-11-17 文字列読み取り装置

Country Status (1)

Country Link
JP (1) JP3388918B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009211432A (ja) * 2008-03-04 2009-09-17 Fujitsu Ltd 文書認識プログラム、文書認識装置、および文書認識方法
CN112215216A (zh) * 2020-09-10 2021-01-12 中国东方电气集团有限公司 一种图像识别结果的字符串模糊匹配系统及方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009211432A (ja) * 2008-03-04 2009-09-17 Fujitsu Ltd 文書認識プログラム、文書認識装置、および文書認識方法
CN112215216A (zh) * 2020-09-10 2021-01-12 中国东方电气集团有限公司 一种图像识别结果的字符串模糊匹配系统及方法

Also Published As

Publication number Publication date
JP3388918B2 (ja) 2003-03-24

Similar Documents

Publication Publication Date Title
CN111474184B (zh) 基于工业机器视觉的aoi字符缺陷检测方法和装置
US5410611A (en) Method for identifying word bounding boxes in text
US7340089B2 (en) Geometric pattern matching using dynamic feature combinations
US8019164B2 (en) Apparatus, method and program product for matching with a template
CN111161243A (zh) 基于样本增强的工业产品表面缺陷检测方法
CN112215216A (zh) 一种图像识别结果的字符串模糊匹配系统及方法
CN114936997A (zh) 检测方法、装置、电子设备及可读存储介质
CN116503733B (zh) 遥感图像目标检测方法、设备及存储介质
JP2005128628A (ja) パターン識別における照合に用いられるテンプレートの生成ならびに同テンプレートを用いたパターン識別のための方法、装置、およびプログラム
CN115546219B (zh) 检测板式生成方法、板卡缺陷检测方法、装置及产品
JPH11306325A (ja) 対象物検出装置及び対象物検出方法
JP2000048120A (ja) 濃淡画像の文字領域抽出方法及びそのプログラムを記録した記録媒体
JPH08147414A (ja) 文字列読み取り装置
JP2002032766A (ja) 画像認識装置及びその方法
JPWO2016143106A1 (ja) 部品種類自動判別方法及び部品種類自動判別システム並びに画像処理用部品データ作成方法及び画像処理用部品データ作成システム
JP2004094427A (ja) 帳票画像処理装置及び該装置を実現するためのプログラム
JP3349243B2 (ja) 文字列読み取り装置
JP2002245404A (ja) 領域切り出しプログラムおよび装置
JP4674853B2 (ja) 画像処理用部品データ作成方法及び画像処理用部品データ作成装置
JPH08263655A (ja) パターン認識方法
JPH05342414A (ja) テンプレート作成装置及びパターン認識装置
JP3074691B2 (ja) 文字認識装置
JP2001357401A (ja) 画像処理方法
CN118261874A (en) Fishing rod fishing performance analysis method based on image segmentation large model and multi-element high-order regression fitting
JP2658153B2 (ja) 文字識別方式

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20021203

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080117

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090117

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100117

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110117

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110117

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120117

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130117

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140117

Year of fee payment: 11

EXPY Cancellation because of completion of term