JPH07120392B2 - 文字パターン切り出し装置 - Google Patents

文字パターン切り出し装置

Info

Publication number
JPH07120392B2
JPH07120392B2 JP1115162A JP11516289A JPH07120392B2 JP H07120392 B2 JPH07120392 B2 JP H07120392B2 JP 1115162 A JP1115162 A JP 1115162A JP 11516289 A JP11516289 A JP 11516289A JP H07120392 B2 JPH07120392 B2 JP H07120392B2
Authority
JP
Japan
Prior art keywords
character
mask
pattern
character string
evaluation value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP1115162A
Other languages
English (en)
Other versions
JPH02294791A (ja
Inventor
文夫 依田
啓二 小林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP1115162A priority Critical patent/JPH07120392B2/ja
Publication of JPH02294791A publication Critical patent/JPH02294791A/ja
Publication of JPH07120392B2 publication Critical patent/JPH07120392B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Description

【発明の詳細な説明】 [産業上の利用分野] この発明は、文字認識装置等に使用される文字パターン
切り出し装置に関するものである。
特に、文字列パターンにノイズが混入したり、文字同士
が接触したりしても、正確に文字を切り出すことができ
る文字パターン切り出し装置に関するものである。
[従来の技術] 文字を認識するには、撮像した文字列を光電変換し、文
字の部分と背景の部分とを“1"(黒画素に対応)と“0"
(白画素に対応)の信号に2値化した文字列パターンか
ら、個々の文字を正確に切り出さなければならない。従
来、この種の装置においては、フォーマット情報により
文字の切り出し位置を指定して個々の文字を切り出す方
式がある。
しかしながら、この方式では、文字に対するフォーマッ
ト指定の制限が非常に厳しく、また位置ずれに極端に不
安定であるため、特に入力部分の位置合わせを高精度に
しなければならないという欠点があった。
上述した欠点を解決するために文字サイズ等の1文字の
大きさに関する標準文字サイズ情報をフォーマット情報
として入力し、1文字づつ切り出す方式が提案されてい
る。
提案されている従来例の構成を第7図を参照しながら説
明する。
第7図は、例えば「文字認識概論」橋本新一郎編著(昭
和57年3月20日オーム社発行)第62頁に示された従来の
文字パターン切り出し装置を示すブロック図である。
第7図において、従来の文字パターン切り出し装置は、
撮像手段(1)と、この撮像手段(1)に接続された文
字列パターン記憶手段(2)と、この文字列パターン記
憶手段(2)に接続されたヒストグラム作成手段(3)
と、標準文字幅格納手段(4)と、ヒストグラム作成手
段(3)及び標準文字幅格納手段(4)に接続された文
字領域検出手段(5)と、文字列パターン記憶手段
(2)及び文字領域検出手段(5)に接続された文字パ
ターン切り出し手段(6)とから構成されている。
つぎに、上述した従来例の動作を第8図及び第9図を参
照しながら説明する。
第8図(a)〜(c)及び第9図(a)〜(c)は、従
来の文字パターン切り出し装置の動作過程を示す説明図
である。
第8図(a)は、黒画素(*)と白画素(・)によって
表される文字列パターン“足立46"を示し、第8図
(b)は、文字列パターンの上下方向の走査毎の黒画素
の数を表すヒストグラムを示し、第8図(c)は、文字
列パターンから切り出した文字“足”、“立”、“4"、
“6"を示している。
第9図(a)〜(c)は、第8図(a)〜(c)と同様
で、ノイズが混入している場合の文字列パターン“足立
22"を示している。
自動車のナンバープレート「足立46」を撮像したとき
に、読み取った文字列パターンにノイズ等がない場合の
文字の切り出しについて説明する。
まず、撮像手段(1)は、読み取った文字を光電変換
し、文字の部分と背景の部分とにそれぞれ対応する文字
列パターンに変換する。
文字列パターン記憶手段(2)は、文字列パターンを、
第8図(a)で示すように、1列分の文字が2値の電気
信号として、2次元マトリックス状に記憶する。
次に、ヒストグラム作成手段(3)は、文字列パターン
記憶手段(2)内に記憶されている文字列パターンをY
軸方向(矢印SY)に走査し、1列中の黒画素の数を計数
する。つづいて、走査経路の始点をX軸方向(矢印SX)
にずらし、各列について順次上下方向の走査を行い、第
8図(b)で示すように、黒画素の数を度数とするヒス
トグラムを求める。
文字領域検出手段(5)は、ヒストグラムの値があらか
じめ定められたしきい値K(この例では、K=1とす
る。)以上であり、X軸方向で連続している領域を調べ
る。そして、各領域について、その左端の座標をXSn、
右端の座標をXEnとし、各領域の幅Wn(=XEn−XSn+
1)と、標準文字幅格納手段(4)にフォーマット情報
として格納されている標準文字幅Wとを比較する。
Wn−W<δ …… 但し、δは正の定数である。
式の条件を満たす場合、その領域の左端の座標XSn及
び右端の座標XEnを1つの文字の領域を特定するための
情報として文字パターン切り出し手段(6)に出力す
る。
文字パターン切り出し手段(6)は、文字領域検出手段
(5)から出力された情報に基づいて、第8図(c)で
示すように、文字列パターン“足立46"から各文字パタ
ーン“足”、“立”、“4"、“6"を切り出す。
自動車のナンバープレート「足立22」を撮像したとき
に、読み取った文字列パターンにノイズが混入し文字同
士が接触した場合の文字の切り出しについて説明する。
第9図(a)で示す文字列パターンのヒストグラムを求
めると、第9図(b)で示すようになる。ここで、しき
い値K以上の値を連続的に満たす領域は、W5、W6、W7
なり、それぞれノイズを含んだり、2文字分を含んだ領
域となる。
上述した領域の幅W5は、上記式の条件を満足するた
め、ノイズを1文字として切り出すことになる。また、
上述した領域の幅W6、W7は、いずれも式の条件を満た
さないことになり、個々の文字を正しく分離して切り出
すことができない。
〔発明が解決しようとする課題〕
上述したような従来の文字パターン切り出し装置では、
ノイズがのっている場合このノイズを文字として切り出
したり、また、2つ以上の文字が接触している場合個々
の文字を正しい位置で分離することが難しいという問題
点があった。
この発明は、上述した問題点を解決するためになされた
もので、文字列パターンにノイズがのっていたり、隣合
う文字が接触していても、1つ1つの文字を正しく切り
出すことができる文字パターン切り出し装置を得ること
を目的とする。
[課題を解決するための手段] この発明に係る文字パターン切り出し装置は、2値化さ
れた複数の文字パターンからなる文字列パターンを記憶
する文字列パターン記憶手段と、上記文字列パターンを
走査し画素数を計数してヒストグラムを作成するヒスト
グラム作成手段と、切り出す文字配列の文字部をマスク
としその文字部の左右端の位置をマスク情報として格納
するマスク情報格納手段と、上記マスクを上記文字列パ
ターンの方向へずらしながら、上記マスクに対応する上
記ヒストグラムの画素数と上記マスク以外の領域に対応
する上記ヒストグラムの画素数との関数で定義されるマ
スク評価値を、各々求めるマスク評価値算出手段と、上
記マスク評価値算出手段により求めたマスク評価値の大
きさに基づいて切り出しマスクを決定する文字境界決定
手段と、上記切り出しマスクに基づいて上記文字列パタ
ーンから上記文字パターンを切り出す文字パターン切り
出し手段とを備えたものである。
[作用] この発明においては、文字列パターン記憶手段によっ
て、2値化された複数の文字パターンからなる文字列パ
ターンが記憶され、ヒストグラム作成手段によって、上
記文字列パターンが走査され画素数が計数されてヒスト
グラムが作成される。また、マスク情報格納手段によっ
て、切り出す文字配列の文字部がマスクとされ、その文
字部の左右端の位置がマスク情報として格納される。さ
らに、マスク評価値算出手段によって、上記マスクが上
記文字列パターンの方向へずらされながら、上記マスク
に対応する上記ヒストグラムの画素数と上記マスク以外
の領域に対応する上記ヒストグラムの画素数との関数で
定義されるマスク評価値が、各々求められる。そして、
文字境界決定手段によって、上記マスク評価値算出手段
により求めたマスク評価値の大きさに基づいて切り出し
マスクが決定され、文字パターン切り出し手段によっ
て、上記切り出しマスクに基づいて上記文字列パターン
から上記文字パターンが切り出される。
[実施例] この発明の実施例の構成を第1図を参照しながら説明す
る。
第1図は、この発明の一実施例を示すブロック図であ
り、撮像手段(1)〜ヒストグラム作成手段(3)、文
字パターン切り出し手段(6)は上記従来装置のものと
全く同一である。
第1図において、この発明の一実施例は、上述した従来
装置のものと全く同一のものと、マスク情報格納手段
(7)と、ヒストグラム作成手段(3)及びマスク情報
格納手段(7)に接続されたマスク評価値算出手段
(8)と、このマスク評価値算出手段(8)に入力側が
接続されかつ文字パターン切り出し手段(6)に出力側
が接続された文字境界決定手段(9)とから構成されて
いる。
つぎに、上述した実施例の動作を第2図、第3図、第4
図、第5図及び第6図を参照しながら説明する。
第2図は、この発明の一実施例で用いるマスク情報を示
す説明図である。
第2図において、斜線部が切り出す文字配列の文字部を
示すマスクである。具体的なマスク情報としては、文字
配列の文字部の左端の座標MSX1(i=1,2,…,N)と、右
端の座標MEX1があり、それらをマスク情報格納手段
(7)に格納しておく。ここでは、N=4の場合が示さ
れている。
第3図(a)〜(e)は、この発明の一実施例の動作過
程を示す説明図である。
第3図(a)及び(b)は、第9図(a)及び(b)と
同一であり、第3図(c)〜(e)は、“ずらしマス
ク”を示している。
第4図は、この発明の一実施例のマスクのシフト量とマ
スク評価値との関係を示す特性図である。
第4図において、横軸はマスクのシフト量、縦軸はマス
ク評価値を示している。
第5図及び第6図は、この発明の一実施例の動作過程を
示す説明図である。
第5図(a)及び(b)は、第3図(b)及び(d)と
同一であり、第5図(c)はマスクの文字部に存在する
黒画素を示している。
撮像手段(1)からヒストグラム作成手段(3)までの
動作は、従来装置と同様である。
マスク評価値算出手段(8)は、フォーマット情報とし
て与えられた第2図に示す文字配列のマスクの情報と、
第3図(b)で示すような、ヒストグラム作成手段
(3)で求めた文字列パターンのヒストグラムとに基づ
いて、マスクを1画素づつ右へずらして発生させたマス
ク(以後このマスクを“ずらしマスク”という。)と、
文字列パターンの配列とがどの程度正しく一致するかを
定量化した値であるマスク評価値を算出する。
すなわち、マスク評価値算出手段(8)は、まず、マス
クの左端つまり第1文字部の左端座標MSX1を第3図
(a)で示す文字列パターンの左端の座標と対応づけ
て、第3図(c)で示すような、第1のずらしマスクを
作成する。そして、この第1のずらしマスクと、第3図
(b)で示すヒストグラムとの整合をとり、第1のずら
しマスクがどの程度正しく文字配列に一致するかを定量
化したマスク評価値F(1)を求める。
つづいて、第1のずらしマスクを1画素右にシフトして
得られる第2のずらしマスクを発生させ、この第2のず
らしマスクに対するマスク評価値F(2)を求める。
以下同様にして、第1のずらしマスクを2画素右にシフ
トして得られる第3のずらしマスクに対するマスク評価
値F(3)を求め、第3図(d)で示すように、(i−
1)画素右にシフトして得られる第iのずらしマスクに
対するマスク評価値F(i)を順次求め、これらのマス
ク評価値を文字境界決定手段(9)に転送する。
ここで、マスク評価値を算出する一例を説明する。
第iのずらしマスクに対するマスク評価値は、マスクの
文字部に対応するヒストグラムの黒画素の総数Piと、マ
スクの文字部以外の領域に対応するヒストグラムの黒画
素の総数Qiの関数で定義する。具体的には、式でマス
ク評価値F(i)を求める。
F(i)=Pi−Qi …… この式で求まるマスク評価値F(i)は、第iのずら
しマスクの文字部に文字列パターンの黒画素が多く含ま
れ、文字部以外の領域に存在する黒画素の数が少ないほ
ど大きな値をとる。
一般に、文字は多くの黒画素から構成されている。ま
た、文字と文字の間には黒画素が存在しない場合がほと
んどであり、2つ以上の文字が接触している場合でも、
接触部に存在する黒画素の数は少ない。このため、第4
図で示すように、マスク評価値F(i)は、ずらしマス
クの文字部と文字列パターンの文字部とが一致したとき
に最大の値をとる。
文字境界決定手段(9)は、マスク評価値が最大となる
ずらしマスクを最適な切り出しマスクとして決定する。
具体的には、上述したマスク評価値算出手段(8)から
転送された第1、第2、…、第i、…、第Lのずらしマ
スクに対応するマスク評価値F(1)、F(2)、…、
F(i)、…、F(L)の中で最大値をとる第iのずら
しマスクを求め、この第iのずらしマスクを切り出しマ
スクとして決定する。
そして、第6図で示すように、この切り出しマスクの文
字部の左端と右端の座標(XS1 *、XE1 *)、(XS2 *
XE2 *)(XS3 *、XE3 *)、(XS4 *、XE4 *)を個々の文字パ
ターンの左端と右端の切り出し位置情報として、文字パ
ターン切り出し手段(6)に転送する。
最終的に、文字パターン切り出し手段(6)は、切り出
し位置情報に基づいて、文字列パターン記憶手段(2)
に記憶されている文字列パターンから、個々の文字に相
当する文字パターン“足”、“立”、“2"、“2"を切り
出す。
この発明の一実施例は、上述したようにフォーマット情
報としてあらかじめ与えられた文字配列のマスク情報を
格納しているマスク情報格納手段と、文字列パターンか
ら求めたヒストグラムと文字配列を示すマスクとの一致
度を評価値として計算するマスク評価値算出手段と、最
も高い一致度が得られるマスク評価値に基づいて文字パ
ターンの切り出し位置を決定する文字境界決定手段を備
えているので、文字同士が接触したり、ノイズがのって
いる場合でも、正確にし文字づつ文字パターンを切り出
すことができるという効果を奏する。
なお、上記実施例ではマスク情報格納手段に、4文字配
列のマスク情報だけを格納して文字を切り出す場合につ
いて説明したが、複数種類のマスク情報を格納して、こ
れらの複数種類のマスク情報を用いて切り出すことも可
能である。
また、上記実施例では横書きの文字列の場合について説
明したが、縦書きの文字列でも利用できることはいうま
でもない。
[発明の効果] この発明は、以上説明したとおり、2値化された複数の
文字パターンからなる文字列パターンを記憶する文字列
パターン記憶手段と、上記文字列パターンを走査し画素
数を計数してヒストグラムを作成するヒストグラム作成
手段と、切り出す文字配列の文字部をマスクとしその文
字部の左右端の位置をマスク情報として格納するマスク
情報格納手段と、上記マスクを上記文字列パターンの方
向へずらしながら、上記マスクに対応する上記ヒストグ
ラムの画素数と上記マスク以外の領域に対応する上記ヒ
ストグラムの画素数との関数で定義されるマスク評価値
を、各々求めるマスク評価値算出手段と、上記マスク評
価値算出手段により求めたマスク評価値の大きさに基づ
いて切り出しマスクを決定する文字境界決定手段と、上
記切り出しマスクに基づいて上記文字列パターンから上
記文字パターンを切り出す文字パターン切り出し手段と
を備えたので、文字列パターンにノイズがのっていた
り、隣合う文字が接触していても、1つ1つの文字を正
しく切り出すことができるという効果を奏する。
【図面の簡単な説明】
第1図はこの発明の一実施例を示すブロック図、第2図
はこの発明の一実施例で用いるマスク情報を示す説明
図、第3図はこの発明の一実施例の動作過程を示す説明
図、第4図はこの発明の一実施例のマスクのシフト量と
マスク評価値との関係を示す特性図、第5図(a)〜
(c)及び第6図はこの発明の一実施例の動作過程を示
す説明図、第7図は従来の文字パターン切り出し装置を
示すブロック図、第8図(a)〜(c)及び第9図
(a)〜(c)は従来の文字パターン切り出し装置の動
作過程を示す説明図である。 図において、 (1)……撮像手段、(2)……文字列パターン記憶手
段、(3)……ヒストグラム作成手段、(6)……文字
パターン切り出し手段、(7)……マスク情報格納手
段、(8)……マスク評価値算出手段、(9)……文字
境界決定手段である。 なお、各図中、同一符号は同一、又は相当部分を示す。

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】2値化された複数の文字パターンからなる
    文字列パターンを記憶する文字列パターン記憶手段と、 上記文字列パターンを走査し画素数を計数してヒストグ
    ラムを作成するヒストグラム作成手段と、 切り出す文字配列の文字部をマスクとしその文字部の左
    右端の位置をマスク情報として格納するマスク情報格納
    手段と、 上記マスクを上記文字列パターンの方向へずらしなが
    ら、上記マスクに対応する上記ヒストグラムの画素数と
    上記マスク以外の領域に対応する上記ヒストグラムの画
    素数との関数で定義されるマスク評価値を、各々求める
    マスク評価値算出手段と、 上記マスク評価値算出手段により求めたマスク評価値の
    大きさに基づいて切り出しマスクを決定する文字境界決
    定手段と、 上記切り出しマスクに基づいて上記文字列パターンから
    上記文字パターンを切り出す文字パターン切り出し手段
    と を備えたことを特徴とする文字パターン切り出し装置。
JP1115162A 1989-05-10 1989-05-10 文字パターン切り出し装置 Expired - Lifetime JPH07120392B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1115162A JPH07120392B2 (ja) 1989-05-10 1989-05-10 文字パターン切り出し装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1115162A JPH07120392B2 (ja) 1989-05-10 1989-05-10 文字パターン切り出し装置

Publications (2)

Publication Number Publication Date
JPH02294791A JPH02294791A (ja) 1990-12-05
JPH07120392B2 true JPH07120392B2 (ja) 1995-12-20

Family

ID=14655871

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1115162A Expired - Lifetime JPH07120392B2 (ja) 1989-05-10 1989-05-10 文字パターン切り出し装置

Country Status (1)

Country Link
JP (1) JPH07120392B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9273353B2 (en) 1998-05-16 2016-03-01 Life Technologies Corporation Instrument for monitoring polymerase chain reaction of DNA
US9285318B2 (en) 1999-05-17 2016-03-15 Applied Biosystems, Llc Optical instrument including excitation source

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9122953B2 (en) * 2013-04-15 2015-09-01 Xerox Corporation Methods and systems for character segmentation in automated license plate recognition applications

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6119172A (ja) * 1984-07-05 1986-01-28 Nec Corp Mos型半導体装置の製造方法
JPS6172373A (ja) * 1984-09-17 1986-04-14 Fujitsu Ltd 認識装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9273353B2 (en) 1998-05-16 2016-03-01 Life Technologies Corporation Instrument for monitoring polymerase chain reaction of DNA
US9285318B2 (en) 1999-05-17 2016-03-15 Applied Biosystems, Llc Optical instrument including excitation source

Also Published As

Publication number Publication date
JPH02294791A (ja) 1990-12-05

Similar Documents

Publication Publication Date Title
EP0669593B1 (en) Two-dimensional code recognition method
JP2986383B2 (ja) ライン走査画像のためのスキューを補正する方法及びその装置
US8254683B2 (en) Code image processing method
JP3193240B2 (ja) 画像処理装置
US6141444A (en) Method for deleting ruled lines and a recording medium storing programs for performing the method
JP3006466B2 (ja) 文字入力装置
CN110543798B (zh) 二维码的识别方法及装置
EP1156444A1 (en) Detection of circular pattern in digital image
JPH07120392B2 (ja) 文字パターン切り出し装置
JP2868134B2 (ja) 画像処理方法及び装置
JP3698867B2 (ja) 円形パターン判定方法、装置および記録媒体
JP3058791B2 (ja) 画像認識装置の図形の切出し方法
JP2002133424A (ja) 文書の傾き角度及び境界の検出方法
JPS62121589A (ja) 文字切出し方法
JP3848792B2 (ja) 文字列認識方法及び記録媒体
JP3381803B2 (ja) 傾き角検出装置
JP2993533B2 (ja) 情報処理装置及び文字認識装置
JP2954218B2 (ja) 画像処理方法及び装置
JP2888885B2 (ja) 文字切出し装置
JP4544691B2 (ja) 文字読取装置
JPH05274472A (ja) 画像認識装置
JP3566738B2 (ja) 網掛け領域処理方法および網掛け領域処理装置
JP2929710B2 (ja) 文字読み取り方法
JP2505605B2 (ja) 文字パタ―ン切り出し装置
JPH0250284A (ja) 特徴抽出回路

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071220

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081220

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091220

Year of fee payment: 14

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091220

Year of fee payment: 14