JPH04268987A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH04268987A
JPH04268987A JP3053348A JP5334891A JPH04268987A JP H04268987 A JPH04268987 A JP H04268987A JP 3053348 A JP3053348 A JP 3053348A JP 5334891 A JP5334891 A JP 5334891A JP H04268987 A JPH04268987 A JP H04268987A
Authority
JP
Japan
Prior art keywords
character
image
binarization
binarized
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3053348A
Other languages
English (en)
Inventor
Yukio Sato
幸雄 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Steel Corp
Original Assignee
Nippon Steel Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Steel Corp filed Critical Nippon Steel Corp
Priority to JP3053348A priority Critical patent/JPH04268987A/ja
Publication of JPH04268987A publication Critical patent/JPH04268987A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は画像処理技術を用いて文
字(数字)を認識する文字認識装置に関する。
【0002】
【従来の技術】撮像装置(ビデオカメラやイメージリー
ダ)によって得た文字画像データに基いて文字認識を行
う文字認識装置が従来より知られている。認識の一手法
として、文字の2値化画像と予め記憶した辞書データと
のパターンマッチングをとって文字を特定する方式が知
られている。
【0003】
【発明が解決しようとする課題】このような画像処理に
基く文字認識の精度は、画像の2値化のレベルの適正さ
に大きく依存する。一般には、2値化のしきいレベルは
固定であるので、文字の濃度が低い場合には、辞書デー
タより細目の文字或いは欠けがある文字になり易い。ま
た2値化のしきい値を下げると、文字は太くなるが、背
景の明るい部分が残ってしまう。逆に、文字の濃度が高
い場合には、辞書データより太めの2値化が行われる。 太めの文字に対しては、凝縮、細線化のデータ処理を施
すことが可能であるが、文字に欠けが生じ易くなる。従
って文字の濃度が低いものから高いもの全てにわたって
適正な2値化を行うことは困難である。2値化が適正で
なく、辞書より細目又は太目であったり欠けが多いと、
マッチング精度が著しく低下する。本発明は、上述の問
題にかんがみ、適正な2値化によりマッチング精度を高
めることを目的とする。
【0004】
【課題を解決するための手段】本発明の文字認識装置は
、図1に示すように、入力画像に対して最小値フィルタ
1の処理を行い、その処理結果に対し最大値フィルタ2
の処理を行って背景を抽出し、入力画像から背景を減算
器3で減算して文字部分を抽出する文字抽出手段4と、
抽出された文字部分の画像を所定の初期しきい値で2値
化する2値化手段5と、2値化画像の直交2軸への投影
分布データを作成し、文字の座標情報を求める投影分布
作成手段6と、文字の座標情報と予め設定された基準値
8とを比較し、比較結果により上記2値化手段のしきい
値を最適化する比較手段7と、最適しきい値によって2
値化された画像に基いて切出された個々の文字を認識す
る認識手段9とを具備する。
【0005】
【作用】入力画像に照明の当たり具合に起因する濃度む
らがあっても、最小値フィルタ、最大値フィルタ及び差
分抽出により、濃度むらを含む背景画像を除去した文字
部分を抽出することができる。従って次の2値化におい
て背景の濃度むらによる影響は生じない。また2値化画
像の投影分布データに基いて文字の切出し位置(座標)
をチェックし、その結果で2値化のしきい値を変更する
ので、最適な2値化が行われる。よって辞書データとの
パターンマッチングによる文字認識の精度が向上する。
【0006】
【実施例】図2は本発明の文字認識装置の一実施を示す
鋼材ナンバリングシステムのブロック図であり、図3は
図2のコード番号読取装置の詳細を示すブロック図であ
る。
【0007】図2において、板材或いはパイプなどの鋼
材10上には、品種、等級、製造ロット、製造者コード
等を示す複数桁の数字又はアルファベットから成る製造
コード番号12が、刻印又はペイントにより予め付され
ている。図2のシステムは、製品の生産管理のために製
造コード番号を読取って、管理用コンピュータに出力す
る。
【0008】鋼材10はコンベアで矢印A方向に搬送さ
れる。鋼材10のコード番号12の部分はITVカメラ
14で撮像され、その映像出力がコード番号読取装置1
6に供給される。ITVカメラ14の映像出力が適当な
解像度を持つように、コンベアの両側には照明装置18
が設けられている。コード番号読取装置16は、読取っ
たコード番号をプロセスコンピュータ20を介して管理
コンピュータ22に送出する。管理コンピュータ22は
、生産計画表に基いて予定番号と読取ったコード番号と
を照合する。プロセスコンピュータ20は、鋼材10の
コード番号12が生産計画表の番号と合致する場合、払
出指令をシーケンサ24に出力する。シーケンサ24は
コンベアを制御して、鋼材10を次工程に送り出すと共
に、位置センサ26のセンサ出力を受けて、次の鋼材1
0の位置決めを行う。
【0009】コード番号読取装置16は、図3に示すよ
うに、データバス30を介してCPU32に接続された
画像処理プロセッサ34、画像メモリ36、ディスプレ
イ38、プリンタ40、フロッピードライブ42、キー
ボード44等から成るコンピュータで構成されている。 コード番号12を撮像するITVカメラ14の出力は、
A/Dコンバータ46でディジタル化され、データバス
30を介して画像メモリ36に蓄積される。CPU32
の制御により、画像メモリ36の画像データは画像処理
プロセッサ34に転送され、予めプログラムされた認識
アルゴリズムに基いて文字認識が行われる。認識結果は
、上位CPU(プロセスコンピュータ20)に送られる
【0010】図4は、コード番号読取装置16において
行われる画像処理の概略フロー図であって、ITVカメ
ラ14によって取込まれた画像データは、ステップS1
で背景平準化の処理を受ける。この処理は照明の反射に
よる画像の濃度むらを除去するために行われる。次にス
テップS2で背景を除去した文字の部分の切出しが行わ
れる。次にステップS3で各文字ごとに設定した複数(
例えば3つ)の分割セグメントごとに原画像に対する2
値化が行われる。2値化のしきい値は各セグメントごと
に最適化されている。2値化された各セグメントは合成
され、一文字全体でしきい値が補正された後、一文字ご
とに次のステップS4で辞書データとのパターンマッチ
ングの処理がなされる。マッチングがとれると、認識出
力が管理コンピュータ22に送出される。
【0011】図5は図4の概略フロー図の詳細を示すフ
ロー図である。まずステップS10で読取装置のCPU
32内のカウンタ、ワークエリア等を初期化し、またレ
ジスタに読取用の諸定数を設定する。次にステップS1
1でITVカメラ14から画像データを取込み、更にス
テップS12で濃度補正の処理を行う。この濃度補正処
理は図1の文字抽出手段4内の処理に対応し、また図4
の背景平準化処理S1に相当する。
【0012】濃度補正の処理S12は、図6〜図8で示
すようなMIN−MAX差分法及びスムージングにより
行われる。なお図6及び図7の横軸は画像のX軸方向の
画素の並びに対応し、縦軸は各画素の濃度に対応する。 原画像は図6に示すように文字部a、bと背景cとから
成る。背景cは鋼材10に対する照明の当たり具合や反
射により部分的に異なるレベルを示し、段差dを有して
いる。
【0013】この原画像に対し、まずスムージングフィ
ルタをかけ、次に最小値(MIN)フィルタ1(図1)
をかける。このMINフィルタ処理においては、図8に
示すように、処理対象画素f22を中心とした3×3の
画素fij中の最小濃度値を処理結果の画素F22の値
として画像メモリに格納し、これを全画素について行う
。このMINフィルタ処理を文字の基準太さに対応した
画素数の1/2回繰り返すことにより、文字部a、bを
消去し、背景cを取出すことができる。この背景cに対
し、次に最大値(MAX)フィルタ2(図1)を同一回
数だけかけ、MINフィルタ処理で生じた画像の歪みを
補正する。このMAXフィルタ処理では、図8示す処理
と同様に、処理対象の画素を中心とした3×3の画素中
の最大濃度値を処理結果の画素濃度とする。MAXフィ
ルタの処理により、図6のeで示すような背景が取出さ
れる。
【0014】次に原画像(a、b、c)から背景eを減
算すると、図7に示すような文字部a、bを含む画像を
濃度むらのある背景から分離して抽出することができる
【0015】濃度補正処理により抽出された文字画像デ
ータに対し、次に図5のステップS13〜S17から成
る文字の切出し処理(図4のステップS2)が行われる
。この処理は、図1の2値化手段5、投影分布作成手段
6、位置比較手段7、基準値8から成る部分におけるデ
ータ処理に相当する。
【0016】まず図5のステップS13では、暫定的な
しきい値で文字画像の2値化が行われる。2値化のしき
い値は、図9に示すような周知のパーセンタイル法(P
タイル法)で決定することができる。このPタイル法で
は、画像の濃度値(例えば0〜255レベル)の夫々に
対応した画素数のヒストグラムを作成し、例えば高濃度
側から矢印Nで示す積算方向に画素個数を積算し、積算
値Sが画像の全画素数のP%に達した位置の濃度nをし
きい値とする。
【0017】次にステップS14で、画像両端のノイズ
を除去する処理を行う。画像の左右両端分では、図10
に示すように照明装置18(図2)の影響を受けて濃度
が不自然に上昇していることがある。このため点線P、
Qで示すX座標の両外側を文字認識の画像領域から削除
する。位置P、Qは予め設定した固定位置であってよい
【0018】次にステップS15及びS16で文字列の
切出し及び列ごとの各文字の切出し(抽出)を順次行う
。これらの切出し処理は、図11に示すようにX軸方向
及びY軸方向に2値化画像を投影することにより、文字
の座標位置を決定することにより行う。まずステップS
15では、Y軸への投影分布をとり、画像の文字列を抽
出する。Y軸への投影分布は、Y軸座標の各画素位置に
おいてX軸と平行な全ての画素の値(1又は0)を加算
することにより得られる。この投影分布に対し、Y軸に
沿って隣接画素ごとに差分をとり、差分が一定値(例え
ば5画素分)を越える所を文字列のエッジ(立上り及び
立下り)として、その座標位置を決定する。これにより
、図11に示す第0列、第1列、第2列に位置する各文
字列を原画像から切出すことができる。
【0019】同様にして、ステップS16では、各列ご
との2値化画像に対し、X軸への投影分布を取り、分布
データの立上り、立下りの各座標位置を決定する。この
位置データを用いて0、1、2の各列を構成する各文字
C0〜C4を原画像から個別に抽出することができる。
【0020】次にステップS17で切り出しの列位置及
び文字位置の妥当性のチェックを行う。このチェックは
、図11に示すY軸上の列間距離L1 、X軸上の文字
距離L2 及び個々の文字間隔を基準値と比較すること
により行われる。また各列の文字数もチェックする。こ
れらのチェックにより切出し位置が不適当であると判断
した場合には、図5に示すようにステップS13におけ
る2値化のしきい値を変更し、以後のステップS14〜
S17を再度行う(リトライ)。
【0021】リトライにより、切出し位置が妥当である
と判断された場合には、ステップS17から次のステッ
プS19に進む。
【0022】なお、図5のステップS17における妥当
性のチェックは、ステップS15の文字列の切出し及び
ステップS16の文字抽出の各処理ごとに行ってもよい
。この場合、文字列の切出しに対するチェックで不適当
の判断が生じたとき、しきい値を変更してステップS1
3の2値化処理からステップS14、S15を再試行す
る。また文字抽出の切出しに対するチェックで不適当の
判断が生じたとき、しきい値を変更してステップS13
の2値化処理を行った後、ステップS16の文字抽出か
ら再試行する。
【0023】図5のステップS19においては、図12
に示すように、各列の各文字ごとに領域(枠)を設定し
、領域を上、中、下の3つのセグメントに分割する。 文字枠Wの座標はステップS15、S16の投影分布デ
ータに基いて決定する。各分割領域P1〜P3のY座標
は、文字枠Wの両端から一定距離の位置とする。次にス
テップS20で、各分割領域ごとにPタイル法にて概算
しきい値を決定し、文字枠Wの画像を2値化する。次に
ステップS21で、各分割領域ごとに、2値化画像の面
積率(分割領域の全体に対する画素値1を持つ画素の割
合)が予め定められた所定の範囲に入るまで、各分割領
域のしきい値を補正する。
【0024】次にステップS22で、3つの分割領域か
ら1つの文字を合成し、文字枠W内で文字の占める割合
が基準値の範囲に入るまで、各分割領域ごとに設定され
ているしきい値を等量ずつ変更する。この処理により、
図13に示すように、各分割領域のしきい値の相違によ
る不自然な領域境界が是正され、スムーズにされた合成
文字が得られる。
【0025】次にステップS23で、文字枠を最終補正
する。即ち図12に示すように、初期文字枠W内の2値
化画像データのY軸及びX軸への投影分布をとり、各投
影分布波形Sy 、Sx の両端エッジ(立上り、立下
り)を算出し、最終文字枠Wx 、Wy の座標を決定
する。そして最終文字枠においてステップS22で設定
されたしきい値にて原画像に対する2値化を行ない、辞
書と照合するための文字データを得る。
【0026】次に、ステップS24で辞書データとの照
合及び判定が行われる。辞書データはビットパターンデ
ータであり、図14に一例(数字0)を示すように、基
準位置のデータD1 、横及び縦方向に例えば2画素ず
つ変位させた左上、右上、左下、右下の各位置のデータ
D2 〜D5 から成る。原画像の2値化によって得ら
れた文字データは、これらの基準位置のデータ及び変位
させたデータの全てとビットマッチングにより比較され
る。即ち、辞書データ列と文字データ列との排他的論理
和をとって、差異のあるビットを検出し、それを計数す
ることにより、相関値(類似度)を得る。この照合処理
を辞書中の全てのデータと抽出された一文字分のデータ
とについて行い、類似度が最も高い照合結果により文字
を特定する。
【0027】なお、図14の基準位置の辞書データのみ
を用意し、辞書メモリの読出し位置のシフト操作により
、辞書データを各斜め方向にずらしながら抽出文字デー
タとの照合処理を順次行うようにしてもよい。或いは、
抽出した文字データの位置を左上、右上、左下、右下の
ようにシフトして、一つの辞書データと比較してもよい
。図15は上述の辞書データのずらし処理を模式的に示
したものである。
【0028】以上の処理を全列の文字について順次行っ
て各文字を特定する。ステップS24で得られた照合結
果は、次のステップS25でホストコンピュータ(プロ
セスコンピュータ20又は管理コンピュータ22)に送
信されると共に、読取装置のディスプレイ38上に表示
される。
【0029】以上の実施例はコード番号12の認識シス
テムについて述べられているが、本発明は数字だけでな
く、アルファベット、かな文字、漢字等の認識に適用可
能である。
【0030】
【発明の効果】本発明の文字認識装置は上述のように、
入力画像の濃度むらを除去した後に2値化し、2値化画
像の投影分布を基準と比較しながら2値化のしきい値を
修正して、最適なしきい値にて2値化した画像から文字
の切出しを行い、個々の文字の認識を行うことを特徴と
する。従って、本発明によると、照明の当たり具合等に
よる濃度むらがあってもその影響を除去した2値化が可
能であり、また常に文字の切出し位置が適正となるよう
に2値化のしきい値を修正するので、切り出された個々
の文字についての認識精度が著しく向上する。
【図面の簡単な説明】
【図1】本発明の文字認識装置の要素的特徴を示すブロ
ック図である。
【図2】本発明の文字認識装置が適用される鋼材ナンバ
リングシステムの要部ブロック図である。
【図3】図2のコード番号読取装置の構成例を示すブロ
ック図である。
【図4】文字認識のための画像処理の概略フローチャー
トである。
【図5】文字認識のための画像処理の詳細フローチャー
トである。
【図6】MIN−MAX差分法による画像処理を示す画
像濃度のグラフである。
【図7】MIN−MAX差分法により抽出された文字画
像の濃度グラフである。
【図8】MINフィルタ、MAXフィルタの画像処理を
説明する図である。
【図9】Pタイル法によるしきい値設定処理を示す画像
ヒストグラムである。
【図10】2値化画像の両端処理を示す濃度グラフであ
る。
【図11】2値化画像のX−Y投影分布図である。
【図12】文字枠の分割及び最終文字枠の設定を示す図
である。
【図13】合成文字に対するスムージング処理を示す図
である。
【図14】辞書データの展開例を示す図である。
【図15】辞書データのずらし処理を示す図である。
【符号の説明】
1  最大値フィルタ 2  最小値フィルタ 3  減算器 4  文字抽出手段 5  2値化手段 6  投影分布作成手段 7  位置比較手段 8  基準値 9  認識手段 10  鋼材 12  製造コード番号 14  ITVカメラ 16  コード番号読取装置

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】  入力画像に対して最小値フィルタの処
    理を行い、その処理結果に対し最大値フィルタの処理を
    行って背景を抽出し、入力画像から背景を減算して文字
    部分を抽出する文字抽出手段と、抽出された文字部分の
    画像を所定の初期しきい値で2値化する2値化手段と、
    2値化画像の直交2軸への投影分布データを作成し、文
    字の座標情報を求める投影分布作成手段と、文字の座標
    情報と予め設定された基準値とを比較し、比較結果によ
    り上記2値化手段のしきい値を最適化する比較手段と、
    最適しきい値によって2値化された画像に基いて切り出
    された個々の文字を認識する認識手段とを具備する文字
    認識装置。
  2. 【請求項2】  上記2値化手段が、上記抽出手段の画
    像出力の濃度−画素数のヒストグラムを作成し、Pタイ
    ル法により上記ヒストグラムの所定の濃度を初期しきい
    値として設定して画像の2値化を行うことを特徴とする
    請求項1に記載の文字認識装置。
  3. 【請求項3】  上記比較手段における上記基準値が、
    文字の列(行)間隔又は文字間隔に対応する座標相対値
    であることを特徴とする請求項1に記載の文字認識装置
  4. 【請求項4】  上記認識手段が2値化文字画像と辞書
    データとのパターンマッチングをとって、相関度により
    文字を特定することを特徴とする請求項1に記載の文字
    認識装置。
JP3053348A 1991-02-25 1991-02-25 文字認識装置 Pending JPH04268987A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3053348A JPH04268987A (ja) 1991-02-25 1991-02-25 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3053348A JPH04268987A (ja) 1991-02-25 1991-02-25 文字認識装置

Publications (1)

Publication Number Publication Date
JPH04268987A true JPH04268987A (ja) 1992-09-24

Family

ID=12940272

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3053348A Pending JPH04268987A (ja) 1991-02-25 1991-02-25 文字認識装置

Country Status (1)

Country Link
JP (1) JPH04268987A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5889885A (en) * 1995-01-31 1999-03-30 United Parcel Service Of America, Inc. Method and apparatus for separating foreground from background in images containing text
JP2000003454A (ja) * 1998-04-14 2000-01-07 General Electric Co <Ge> 構造画像成分を識別する方法及び装置
US6728391B1 (en) 1999-12-03 2004-04-27 United Parcel Service Of America, Inc. Multi-resolution label locator

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62175887A (ja) * 1986-01-30 1987-08-01 Hitachi Ltd 画像処理方法
JPH01197891A (ja) * 1988-02-03 1989-08-09 Alpine Electron Inc 文字認識装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62175887A (ja) * 1986-01-30 1987-08-01 Hitachi Ltd 画像処理方法
JPH01197891A (ja) * 1988-02-03 1989-08-09 Alpine Electron Inc 文字認識装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5889885A (en) * 1995-01-31 1999-03-30 United Parcel Service Of America, Inc. Method and apparatus for separating foreground from background in images containing text
JP2000003454A (ja) * 1998-04-14 2000-01-07 General Electric Co <Ge> 構造画像成分を識別する方法及び装置
US6728391B1 (en) 1999-12-03 2004-04-27 United Parcel Service Of America, Inc. Multi-resolution label locator

Similar Documents

Publication Publication Date Title
US5138668A (en) Character discrimination system employing height-to-width ratio and vertical extraction position information
JP2002133426A (ja) 多値画像から罫線を抽出する罫線抽出装置
WO1991017519A1 (en) Row-by-row segmentation and thresholding for optical character recognition
JPH04268987A (ja) 文字認識装置
JPH04270485A (ja) 印刷文字認識装置
JPH04268989A (ja) 文字認識方法及び装置
JPH0927056A (ja) 画像識別方法および画像識別装置
KR100295360B1 (ko) 쉐이딩알고리즘을이용한영상처리방법
JPH04268988A (ja) 文字認識装置
JP3838091B2 (ja) パターン認識装置およびパターン認識用のモデル登録のためのプログラム
JP4194309B2 (ja) 文書方向推定方法および文書方向推定プログラム
JP2005250786A (ja) 画像認識方法
JPH10207978A (ja) 文字等パターン照合方法及び装置
JP4415702B2 (ja) 画像照合装置、および画像照合処理プログラム、画像照合方法
JP3046653B2 (ja) 文字原稿の傾き補正方法
CN111161247B (zh) 用于可变码识读字符质量验证的检测方法
JPH1069524A (ja) 文字切り出し方法
JP3705216B2 (ja) 文字記入枠検出方法、文字記入枠検出装置及びプログラム
JP3126491B2 (ja) パターン認識方法
JP2972516B2 (ja) インクジェットプリンタの印刷パターン検査装置
JP2805476B2 (ja) 文字の認識方法
JP2000339408A (ja) 文字切り出し装置
CN114495120A (zh) 一种基于数字结构特征的发票编码识别方法及系统
JPH06309437A (ja) パターン検査装置
JP3606218B2 (ja) 文書分類装置、文字読み取り装置及び真贋判定装置、並びにこれらの方法