JPH06274689A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH06274689A
JPH06274689A JP5064502A JP6450293A JPH06274689A JP H06274689 A JPH06274689 A JP H06274689A JP 5064502 A JP5064502 A JP 5064502A JP 6450293 A JP6450293 A JP 6450293A JP H06274689 A JPH06274689 A JP H06274689A
Authority
JP
Japan
Prior art keywords
character
peak position
density value
dot
maximum density
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5064502A
Other languages
English (en)
Inventor
Masato Suda
正人 須田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP5064502A priority Critical patent/JPH06274689A/ja
Publication of JPH06274689A publication Critical patent/JPH06274689A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】ドットで形成された文字画像に対して、簡易な
手法で常に安定した結果の得られる文字認識装置を提供
する。 【構成】検出切出された多値の画素からなるドット文字
画像をX及びY軸方向に走査し1走査線上での最大濃度
値データをX及びy軸方向について検出する手段(1
2)と、前記最大濃度値データの局所ピーク位置をY及
びX軸方向について検出する手段(14)と、前記X及
びY方向の局所ピーク位置を基にX及びY軸方向の識別
用マスクを生成する手段(15)と、前記各ドットが前
記識別用マスク内に存在するかどうか判定する手段(1
9)と、前記判定手段の判定結果から文字のドット構造
を解析し、文字を判別する手段(20)を具備する文字
認識装置。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は文字認識装置に関し、特
に画像内の文字領域を判断する光学文字認識装置に関す
る。
【0002】
【従来の技術】従来、文字認識装置においては、多値の
画素からなる文字画像を二値の画素からなる文字画像に
変換した後、射影、ラベリング等の画像処理を施して各
文字単位に検出切出する。そして、検出切出された各文
字は主にパターンマッチングを用いて文字の認識が行わ
れる。更に手書き数字等においてはその補助手段として
文字ストロークの端点、直線、凹凸等の解析から得られ
る輪郭特徴による構造解析手法が用いられることが多
い。一方、ドットで構成する文字の読取においても、安
定した性能を確保するためにパターンマッチングによる
手法が用いられている。
【0003】
【発明が解決しようとする課題】文字がドットで形成さ
れている場合は、各ドットが文字構成上の特徴を有して
いる。これらをパターンマッチング手法で識別するのは
有効な手段である。しかし、パターンマッチング手法の
みによる識別は、刻印圧の違いによるドットの強弱によ
って、リジェクト、誤読を生じかねない。そのため、そ
の補助手段として構造解析手法が要求されるが、対象が
ドット文字であることから、従来の輪郭特徴手法の適用
は困難である。
【0004】従って本発明の目的はドットで構成される
文字を読取る装置を提供することであり、更に、各ドッ
ト画像に刻印圧の違いによる強弱がある場合でも、リジ
ェクト、誤読などを生じない文字認識装置を提供するこ
とである。
【0005】
【課題を解決するための手段】上記目的を達成するため
に第1の発明による文字認識装置は、検出切出された多
値の画素からなるドット文字画像をX及Yび軸方向に走
査し各走査線上での最大濃度値データをX及びY軸方向
について検出する手段と、前記最大濃度値データの局所
ピーク位置をX及びY軸について検出する手段と、前記
X軸方向の局所ピーク位置を中心とした所定画素幅の短
冊ウインドウをY軸方向と平行に生成する手段と、Y軸
について検出された前記局所ピーク位置を中心に所定画
素幅の識別マスクを生成する手段と、前記短冊ウインド
ウ内の多値画像をX軸方向にラスター走査し各短冊内の
ピーク位置を検出する手段と、前記短冊内のピークが前
記識別マスク内に存在するかどうか判定する手段と、前
記判定手段の判定結果から文字のドット構造を解析し、
文字を判別する手段を具備する。
【0006】上記目的を達成するために第2の発明によ
る文字認識装置は、多値の画素からなるドット文字画像
をX及びY軸方向に走査し、各走査線上での最大濃度値
データを検出する手段と、前記最大濃度値データの局所
ピーク位置を検出する手段と、前記各ピーク位置を起点
としてX及びY軸に平行に生成される直線の交点を中心
に所定の大きさの認識窓を各々生成する手段と、前記識
別窓内の画素の有無を判断し、それにより文字のドット
構造を解析し、文字を判別する手段とを具備する。
【0007】
【作用】多値の画素からなる文字画像データから検出切
出された文字は、X及びY軸方向に走査され、各走査線
上での最大濃度値データがX及びY軸方向について検出
される。この最大濃度値データを基に、X及びY軸方向
に文字識別用のマスクが形成される。更にX方向のマス
クを基に、Y軸に平行な複数の短冊ウインドウが形成さ
れ、各ウインドウ内のドットがY軸方向のマスク内にあ
るか否かが判断される。このようにして各ドットの相対
的な位置が解析され、検出切出された文字はドットマト
リクスに変換される。このドットマトリクスは辞書デー
タと比較され、最終的に文字が識別される。
【0008】
【実施例】以下、本発明の一実施例について図面を参照
して説明する。図1は実施例装置の概略構成図である。
図1において、図示しない撮像部から入力された光信号
からなる文字画像列は光電変換部1で光電変換され、光
信号に対応する電気信号が発生される。光電変換部1か
らのアナログ信号はA/D変換部2において多値のデジ
タル信号に変換されて多値画像メモリ3に格納される。
多値画像メモリ3に格納された文字画像列は、行検出切
出部4で文字行の検出切出、文字検出切出部5において
は各文字単位での検出切出が行われる。そして、文字識
別処理部6で各文字の識別が行われ認識結果が出力され
る。以下に本発明による識別処理について詳細に説明す
る。
【0009】図2はピーク位置を用いた本発明の、図1
で示した文字識別処理部の第1実施例を示す概略構成図
である。図3はピーク検出処理の対象となる多値画像デ
ータである。検出切出された多値の画素からなるドット
文字画像50は多値画像メモリ11に格納されている。
最大濃度値検出部12は多値画像メモリ11に格納され
ているドット文字画像50をY軸方向にラスター走査
し、1走査線上での最大濃度値を抽出することでデータ
52を得る。同図から分かるように画像の黒い部分ほど
値が大きい。又、X軸方向にラスター走査して1走査線
上の最大濃度値を抽出することでデータ51が得られ
る。背景ノイズ除去部13は、データ53に示すように
最大濃度値データの最大値をGmax 、最小値をGmin
した場合、以下の式により背景レベルの閾値をGx とし
て求める。ここでkは定数であり例えば8に設定され
る。 Gx =Gmin +(Gmax −Gmin )/k
【0010】次段のピーク位置検出部14はGx 以上の
データのみを評価対象として、それらのデータからそれ
ぞれの局所ピーク位置を検出する。局所ピークは図4に
示すようにFi-1 <Fi 且つ Fi ≧Fi+1 が成立
するときFiの位置をピークとする。その結果、図5に
示すようなドット文字についてはX方向にはxm1からx
m5がピークとして検出され、Y方向にはym1からym9
それぞれがピークとして検出される。サンプリングマス
ク生成部15は各ピーク位置を起点にサンプリングマス
クを生成する。X方向のサンプリングマスクXSはピー
ク位置xm1から、xm1を中心に幅wのマスクxs1が生成
される。同様にxm2に対してはxs2が、そしてxs5まで
生成される。一方Y方向のサンプリングマスクYSにつ
いてもX方向と同様の処理により、各ピークを中心とし
て幅hのサンプリングマスクys1からys9が生成され
る。尚、これらの幅w、hは予め値が設定されている。
又ピーク位置から例えば2ビットを幅とする等してもよ
い。短冊ウインドウ生成部16は図5のX方向サンプリ
ングマスク(xs1,xs2,xs3,xs4,xs5)をX方向
の幅として、図6に示すR1 、R2 、R2 、R3
4 、R5 の短冊ウインドウを生成する。
【0011】この短冊ウインドウの生成方法としては、
例えば以下のようになる。ここではR1 について説明す
るが、ピーク位置Xm1が認識され又幅wも予め設定され
ているため、Xs1の形成されるX軸方向の範囲が座標に
よって認識可能である。この座標とY軸方向への1走査
線上での始点および終点の座標で包囲される範囲を短冊
ウインドウとして指定する。
【0012】次に短冊最大濃度値検出部17は、図6に
示すように短冊ウインドウで指定された多値画像メモリ
の各領域内をX方向にラスター走査することにより、各
短冊ウインドウでの最大濃度値データを図6のP1 、P
2 、P3 、P4 、P5 として生成する。短冊ウインドウ
1 が濃度値データP1 に、R2 がP2 にR3 がP3
4 がP4 にR5 がP5 にそれぞれ対応する。短冊ピー
ク位置検出部18は、最大濃度値データP1 、P2 、P
3 、P4 、P5 の背景レベル閾値を上記同様設定した
後、各最大濃度値データの局所ピーク位置を検出する。
局所ピークは上記同様、Fi-1 <Fi 且つ Fi ≧F
i+1 が成立するときFi の位置として検出される。そ
の結果、濃度値データP1 ではt1 、t2 、t3 が、P
2 ではt4、、t 5 、t6 、P3 ではt7 、t8 、t9 、P
4 ではt10、t11、t12、P5ではt13、t14、t15
16、t17がピークとして検出される。
【0013】次に、画像有無判定部19はサンプリング
マスク生成部15で生成した図5に示すY方向のサンプ
リングマスクys1からys9のマスク内にピーク位置が存
在するかどうか判定し、存在する場合は”1”、存在し
ない場合は”0”に符号化し図7に示すようにマトリッ
クスデータを作成する。例えば、濃度値データP1 のt
1 はys2に、t2 はys7に、t3 はys8に対応するの
で、図7に示すマトリックスデータの左の縦列には01
0000110が格納される。P2 からP5 も同様処理
で横5列、縦9行のマトリックスデータが得られる。次
に、一致度計算部20でマトリックス辞書21とマトリ
ックスデータの一致度を判定する。一致度計算は未知入
力パターンから生成した前記マトリックスデータと、事
前に作成した5×9のマトリックス辞書21とを各々対
応するメッシュ同志で比較し、一致度を計算して出力す
る。
【0014】図8は識別窓を用いた本発明による文字識
別装置の第2実施例を示す概略構成図である。図8の多
値画像メモリ11からサンプリングマスク生成部(3、
12、13、14、15)までは図2に示した構成と同
一であり、上記同様な処理を行い図5のサンプリングマ
スクXS及びYSが生成される。次の識別窓生成部31
はY軸と平行のサンプリングマスクxs1からxs5と、X
軸と平行のys1からys9が各々交差する位置に、図9に
示す幅w、高さHの窓swをそれぞれ作成し、画像有無
判定部32にそれらの窓swを転送する。多値画像メモ
リ11の画像は二値化処理部33で1、0の画像に二値
化され画像有無判定部32に転送される。画像有無判定
部32は識別窓領域内で二値画像の占める割合を判断し
て、その窓を”1”または”0”に符号化する。例え
ば、窓swにおいて、画素の占める割合が半分以上であ
れば”1”とし、それ以外は”0”とする。その結果、
図7に示す5×9のマトリックスデータが生成される。
そして、前記同様一致度計算部20において5×9のマ
トリックス辞書21とマトリックスデータの間で対応す
るメッシュ毎に比較を行い、一致度を計算して出力す
る。
【0015】
【発明の効果】以上詳述したように本発明によれば、ド
ットの配列構造から文字の識別を行うことにより、ドッ
トで形成された文字画像に対して、簡易な手法で常に安
定した文字認識装置を提供できる。又、本発明はパター
ンマッチングの補助手段としても有効である。
【図面の簡単な説明】
【図1】図1は本発明による実施例装置の概略構成図。
【図2】図2はピーク位置を用いた本発明による文字識
別処理部の第1実施例を示す概略構成図。
【図3】図3はピーク検出処理の対象となる多値画像デ
ータを示す図。
【図4】図4はドット画像のピーク検出を説明するため
の図。
【図5】図5はサンプリングマスクを説明するための
図。
【図6】図6は短冊内のピーク検出を説明するための
図。
【図7】図7は文字に対応するマトリックスデータを示
す図。
【図8】図8は識別窓を用いた本発明による文字識別装
置の第2実施例を示す概略構成図。
【図9】図9は識別窓による画像検知を説明するための
図。
【符号の説明】
1…光電変換部、2…A/D変換部、3…多値画像メモ
リ、4…行検出切出部、5…文字検出切出部、6…文字
検出切出部、12…最大濃度検出部、13…背景ノイズ
除去部、14…ピーク位置検出部、15…サンプリング
マスク生成部、16…短冊ウインドウ生成部、17…短
冊最大濃度値検出部、18…短冊ピーク位置検出部、1
9・32…画像有無判定部、20…一致度計算部、21
…マトリックス辞書、33…二値化処理部。

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】多値の画素からなるドット文字画像をX及
    びY軸方向に走査し各走査線上での最大濃度値データを
    X及びY軸方向について検出する手段と、 前記最大濃度値データの局所ピーク位置をX及びY軸に
    ついて検出する手段と、 前記X軸方向の局所ピーク位置を中心とした所定画素幅
    の短冊ウインドウをY軸と平行に生成する手段と、 Y軸について検出された前記局所ピーク位置を中心に所
    定画素幅の識別マスクを生成する手段と、 前記短冊ウインドウ内の多値画像をX軸方向にラスター
    走査し各短冊内のピーク位置を検出する手段と、 前記短冊内のピーク位置が前記識別マスク内に存在する
    かどうか判定する手段と、 前記判定手段の判定結果から文字のドット構造を解析
    し、文字を判別する手段と、を具備することを特徴とす
    る文字認識装置。
  2. 【請求項2】多値の画素からなるドット文字画像をX及
    びY軸方向に走査し、各走査線上での最大濃度値データ
    を検出する手段と、 前記最大濃度値データの局所ピーク位置を検出する手段
    と、 前記各ピーク位置を起点としてX及びY軸に平行に生成
    される直線の交点を中心に所定の大きさの識別窓を各々
    生成する手段と、 前記識別窓内の画素の有無を判断し、それにより文字の
    ドット構造を解析し、文字を判別する手段と、を具備す
    ることを特徴とする文字認識装置。
JP5064502A 1993-03-24 1993-03-24 文字認識装置 Pending JPH06274689A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5064502A JPH06274689A (ja) 1993-03-24 1993-03-24 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5064502A JPH06274689A (ja) 1993-03-24 1993-03-24 文字認識装置

Publications (1)

Publication Number Publication Date
JPH06274689A true JPH06274689A (ja) 1994-09-30

Family

ID=13260047

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5064502A Pending JPH06274689A (ja) 1993-03-24 1993-03-24 文字認識装置

Country Status (1)

Country Link
JP (1) JPH06274689A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014531656A (ja) * 2011-09-16 2014-11-27 ウェセックス テクノロジー オプト−エレクトロニック プロダクツ リミテッドWessex Technology Opto−Electronic Products Limited 印刷されたデータの機械読み取り

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014531656A (ja) * 2011-09-16 2014-11-27 ウェセックス テクノロジー オプト−エレクトロニック プロダクツ リミテッドWessex Technology Opto−Electronic Products Limited 印刷されたデータの機械読み取り

Similar Documents

Publication Publication Date Title
JP4232800B2 (ja) ラインノイズ除去装置、ラインノイズ除去方法、ラインノイズ除去プログラム
EP0622750A2 (en) Pattern recognition
JP2005523530A (ja) 取り込み画像データから文字列を識別して抜出するシステムおよび方法
JP2002208007A (ja) スキャンした文書の自動式検出
JPH06274689A (ja) 文字認識装置
JP2002133424A (ja) 文書の傾き角度及び境界の検出方法
JP2998443B2 (ja) 文字認識方法及びそのための装置
JP2674475B2 (ja) 文字読取装置
JP3936039B2 (ja) 網がけ領域抽出装置
JP2894111B2 (ja) 光学式活字文字認識装置における認識結果の総合判定方式
JPH0916715A (ja) 文字認識装置および方法
JPH02166583A (ja) 文字認識装置
JPH096909A (ja) 文字読取装置
JP2004152048A (ja) 車両ナンバー読み取り装置
JP2004110369A (ja) 文字認識方法および文字認識装置
JP2000231601A (ja) 画像処理装置
JPH03125569A (ja) 画像2値化装置
JP2902904B2 (ja) 文字認識装置
JPH11175659A (ja) 文字認識装置
JPH01269190A (ja) 文字認識装置
JPH10111382A (ja) 燃料番号認識方法及び装置
JPH07159341A (ja) インクジェットプリンタの印刷パターン検査装置
JPS6232587A (ja) 文字認識方式
JPH05258106A (ja) 光学的文字読取装置
JPH02253386A (ja) 文字認識装置