JPH02294791A - 文字パターン切り出し装置 - Google Patents

文字パターン切り出し装置

Info

Publication number
JPH02294791A
JPH02294791A JP1115162A JP11516289A JPH02294791A JP H02294791 A JPH02294791 A JP H02294791A JP 1115162 A JP1115162 A JP 1115162A JP 11516289 A JP11516289 A JP 11516289A JP H02294791 A JPH02294791 A JP H02294791A
Authority
JP
Japan
Prior art keywords
character
mask
character string
string pattern
pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP1115162A
Other languages
English (en)
Other versions
JPH07120392B2 (ja
Inventor
Fumio Yoda
依田 文夫
Keiji Kobayashi
啓二 小林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP1115162A priority Critical patent/JPH07120392B2/ja
Publication of JPH02294791A publication Critical patent/JPH02294791A/ja
Publication of JPH07120392B2 publication Critical patent/JPH07120392B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [産業上の利用分野] この発明は、文字認識装置等に使用される文字パターン
切り出し装置に関するしのである.特に、文字列パター
ンにノイズが混入したり、文字同士が接触したりしても
、正確に文字と切り出すことができる文字パターン切り
出し装置に関するものである。
[従来の技術1 文字を認識するには、撮像した文字列を充電変換し、文
字の部分と背景の部分とを゛1” (黒画素に対応》と
゜′0゜゜ (白画素に対応)の信号に2値化した文字
列パターンがら、個々の文字を正確に切り出さなければ
ならない。従来、この種の装置においては、フォーマッ
ト情報により文字の切り出し位置を指定して個々の文字
を切り出す方式がある, しかしながら、この方式では、文字に対するフォーマッ
ト指定の制限が非常に厳しく、また位置ずれに極端に不
安定であるため、特に入力部分の位置合わせを高精度に
しなければならないという欠点があった. 上述した欠点を解決するために文字サイズ等の1文字の
大きさに関する標準文字サイズ情報をフォーマッI・情
報として入力し、1文字づつ切り出すH式が提案されて
いる。
提案されている従来例の構成を第7図をづ照しなからX
+t明する。
第7図は、例えばC文字認識概論』橋本新一郎編著(昭
和57年3月20日オーム社発行)第62頁に示された
従来の文字パターン切り出し装置を示すブロック図であ
る. 第7図において、従来の文字パターン切り出し装置は、
撮像手段(1)と、この樋像手Uσ(1》に接続された
文字列パターン記憶手段(2)と、この文字列パターン
記憶千段(2)に接続されたヒストグラム作成手段(3
)と、標準文字幅格納手段(4)と、ヒス1・グラム牛
成手段(3)及び標準文字幅格納手段(4)に接続され
た文−7′領域検出千段(5》と、文字列パターン記憶
手段(2)及び文字領域検出手段(5〉に接続された文
字パターン切り出し手段(6》とから構成されている.
つぎに、上述した従来例の動作を第8図及び第9図を参
照しながら説明する. 第8図(a)〜(C)及び第9図(a)〜(C>は、従
来の文字パターン切り出し装置の動作過程を示す説明図
である. 第8図(a)は、黒画素(ネ)と白画素(・)によって
表される文字列パターン′゛足立46”を示し、第8図
(b>は、文字列パターンの上下方向の捜査毎の黒画素
の数を表すヒストグラムを示し、第8図(c)は、文字
列パターンがら切り出した文字”足”、“立゛、゛4”
、”6″を示している. 第9図(a)〜(c)は、第8図(a)〜<c)と同様
で、ノイズが混入している場合の文字列パターン゛足立
22”を示している。
自動車のナンバープレート[足立461を撮像したとき
に、読み取った文字列パターンにノイズ等がない場合の
文字の切り出しについて説明する。
まず、撮像手段(1)は、読み取った文字を光電変換し
,文字の部分と背景の部分とにそれぞれ対応する文字列
パターンに変換する. 文字列パターン記憶手段(2)は、文字列パターンを、
第8図(a)で示すように、1列分の文字が2値の電気
信号として、2次元マトリックス状に記憶する. 次に、ヒストグラム作成手段(3)は、文字列パターン
記憶千段く2)内に記憶されている文字列パターンをY
軸方向(矢印SY)に走査し、1列中の黒画素の数を計
数する。つづいて、走査経路の始点をX軸方向(矢印S
X)にずらし、各列について順次上下方向の走査を行い
、第8図(b)で示すように、黒画素の数を度数とする
ヒストグラムを求める. 文字領域検出手段(5》は、ヒストグラムの値かあらか
じめ定められたしきい値K(この例では、K=1とする
.》以上であり、X軸方向で連続している領域を調べる
.そして、各領域について、その左端の座標をX.、右
端の座標をX tnとし、各領域の幅W, (=Xt.
−X9.+ 1 >と、標準文字幅格納手段(4)にフ
ォーマット情報として格納されている標準文字幅Wとを
比較する.Wh−W<δ     ・・・ ■ 但し、δは正の定数である. ■式の条件を満たす場合、その領域の左端の座標X a
n及び右端の座標Xε。を1つの文字の領域を特定する
ための情報として文字パターン切り出し手段(6)に出
力する6 文字パターン切り出し手段(6)は、文字領域検出手段
(5)から出力された情報に基づいて、第8[J(c)
で示すように、文字列パターン゛足立46″から各文字
パターン“足”、“立“′“4″  “6”を切り出す
. 自動車のナンバープレート「足立22」を撮像したとき
に、読み収った文字列パターンにノイズが混入し文字同
士が接触した場合の文字の切り出しについて説明する。
第9図(a>で示す文字列パターンのヒス1・ダラムを
求めると、第9図(b)で示すようになる。
ここで、しきい値K以上の値を連続的に満たすfa域は
、W5、W6、W7となり、それぞれノイズを含んだり
、2文字分を含んだ領域となる。
上述した領域の幅W5は、上記の式の条件を溝゛足する
なめ、ノイズを1文字として切り出すことになる,また
、上述した領域の幅W6、W,は、いずれも■式の条件
を満たさないことになり、個々の文字を正しく分離して
切り出すことができない.[発明が解決しようとする課
題] 上述したような従来の文字パターン切り出し装置では、
ノイズがのっている場合このノイズを文字として切り出
したり、また、2つ以上の文字が接触している場合個々
の文字を正しい位置で分離することが難しいという問題
点があった.この発明は、上述した問題点を解決するた
めになされたもので、文字列パターンにノイズがのって
いたり、隣合う文字が接触していても、1つ1つの文字
を正しく切り出すことができる文字パターン切り出し装
置を得ることを目的とする.[課題を解決するための千
段1 この発明に係る文字パターン切り出し装置は,以下に述
べるような手段を備えたものである。
(i>、複数の文字パターンからなる文字列パターンを
記憶する文字列パターン記憶手段.(ii>.上記文字
列パターンの列方向と直交する方向に走査し文字部分に
相当する画素の数を計数しヒストグラムを作成するヒス
トグラム作成手段。
( iii ) .文字配列のマスク情報を格納してい
るマスク情報格納手段。
(iv).上記ヒストグラム及びマスク情報に基づいて
マスク評価値を算出するマスクyP価gI.算出手段. (V).上記マスク評価値に基づいて上記文字列パター
ンの切り出し位箕を決定する文字境界決定手段. (vi).上記文字列パターンの切り出し位置の情報に
基づいて上記文字列パターンから1文字パターンづつ切
り出す文字パターン切り出し手段。
「作用] この発明においては、文字列パターン記憶手段によって
、複数の文字パターンからなる文字列パターンが記憶さ
れる。
また、ヒスl・グラム作成手段によって、上記文字列パ
ターンの列方向と直交する方向に走査され、文字部分に
相当する画素の数が計数され、ヒストグラムが作成され
る. さらに、マスク情報格納手段によって、文字配列のマス
ク情報が格納されている. またさらに、マスク評価値算出手段によって、−l一記
ヒストグラム及びマスク情報に基づいてマスク評価値が
算出される。
またさらに、文字境界決定手段によって、上記マスク評
価値に基づいて上記文字列パターンの切り出し位置が決
定される. そして、文字パターン切り出し手段によって、上記文字
列パターンの切り出し位置の情報に基づいて上記文字列
パターンから1文字パターンづつ切り出される. [実施IDI この発明の実施例の楕成を第1図を参照しながら説明す
る. 第1図は、この発明の一実施例を示すブロック?であり
、撮像手段〈1)〜ヒストグラノ、作成手段(3)、文
字パターン切り出し手段(6)はト記従来装置のものと
全く同一である. 第1図において、この発明の一実施例は、上述した従来
装置のものと全く同一のものと、マスク情報格納手段(
7)と、ヒス1ヘグラム作成手段(3)及びマスク情報
格納千段(7)に接続されたマスク評価値算出手段(8
)と、このマスク評価値算出手段(8)に入力側が接続
されかつ文字パターン切り出し手段(6)に出力側が接
続された文字境界決定手段(9)とから構成されている
.つぎに、上述した実施例の動作を第2図、第3図、第
4図、第5図及び第6図を参照しながら.TI2明する
. 第2図は、この発明の一実施例で用いるマスク情報を示
す説明図である. 第2図において、斜線部が切り出す文字配列の文字部を
示すマスクである。具体的なマスク情報としては、文字
配列の文字部の左端の座標M.■(i=1.2,・・・
,N)と、右端の座標M E+zがあり、それらをマス
ク情報格納千段(7)に格納しておく.ここでは、N=
4の場合が示されている。
第3図(a)〜(e)は、この発明の一実施例の動作過
程を示す説明図である。
第3図(a)及び(b)は、第9図(a)及び(b)と
同一であり、第3図(C冫〜(e冫は、゛ずらしマスク
“を示している. 第4図は、この発明の一実施例のマスクのシフト量とマ
スク評価値との関係を示す特性図である.第4図におい
て,横軸はマスクのシフトしi!1軸はマスク評価値を
示している。
第5図及び第6図は、この発明の一実施例の動作過程を
示す説明図である。
第5図(a)及び<b>は、第3図(b)及び(d)と
同一であり、第5図(c)はマスクの文字部に存在する
黒両票を示している。
撮像手段(1)からヒストグラム作成手段(3)までの
動作は、従来装置と同様である.マスクFF価値算出手
段(8)は、フォーマット情報として与えられた第2図
に示す文字配列のマスクの情報と、第3図(b)で示す
ような、ヒス1・ダラム作成手段(3〉で求めた文字列
パターンのヒストグラムとに基づいて、マスクを1両素
づつ右へずらして発生させたマスク(以後このマスクを
゛ずらしマスク”という、)と、文字列パターンの配列
とがどの程度正しく一致するかを定量化した値であるマ
スク評価値を算出する.すなわち、マスク評価値算出手
段(8)は、まず、マスクの左端つまり第1文字部の左
端座標M m x +を第3図(a)で示す文字列パタ
ーンの左端の座捏と対応づけて、第3図(C)で示すよ
うな、第1のずらしマスクを作成する。そして、この第
1のずらしマスクと、第3図(b)で示すヒストグラム
との整合をとり.第1のずらしマスクがどの程度正しく
文字配列に一致するかを定量化したマスク評価値F (
i)を求める。
つづいて、第1のずらしマスクを1画素右にシフトして
得られる第2のずらしマスクを発生させ、この第2のず
らしマスクに対するマスク評価値F(2)を求める. 以下同様にして、第1のずらしマスクを2画素右にシフ
トして得られる第3のずらしマスクに対するマスク評価
値F(3)を求め、第3図(d)で示すように、(i−
1)画素右にシフI− Lて得られる第iのずらしマス
クに対するマスク評価値F(i)を順次求め、これらの
マスク評価値を文字境界決定手段(9)に転送する. ここで、マスク評価値を算出する一例を説明する. 第iのずらしマスクに対するマスク評価値は、マスクの
文字部に対応するヒストグラムの黒画素の総数P1と、
マスクの文字部以外の領域に対応するヒストグラムの黒
画素の総数Qiの関数で定義する.具体的には、■式で
マスク評価値F (i)を求める. F(i>−Pi−Qi       ・・・ ■この■
式で求まるマスク評価値F (i)は、第iのずらしマ
スクの文字部に文字列パターンの黒画素が多く含まれ、
文字部以外の領域に存在する黒画素の数が少ないほど大
きな値をとる。
?般に、文字は多くの黒画素から構成されている。また
、文字と文字の間には黒画素が存在しない場合がほとん
どであり、2つ以上の文字が接触している場合でも、接
触部に存在する黒画素の数は少ない.このため、第4図
で示すように、マスク評価値F (i)は、ずらしマス
クの文字部と文字列パターンの文字部とが一致したとき
に最大の値をとる. 文字境界決定手段(9)は、マスク評価値が最大となる
ずらしマスクを最適な切り出しマスクとして決定する.
具体的には、上述したマスク評価値算出手段(8)から
転送された第1、第2、・・・第i、・・・、第Lのず
らしマスクに対応するマスク評価値F(1》、F(2)
、・・・、F (i)、・・・、F(1.)の巾で最大
値をとる第iのずらしマスクを求め、この第1のずらし
マスクを切り出しマスクとして決定する. そして、第6図で示すように、この切り出しマスクの文
字部の左端と右端の座標( X s + 、X * l
” >( X −2 、,X−z廖)  < X−’s
 、X−s”>、(X■、Xt4”)を個々の文字パタ
ーンの左端と右端の切り出し位置情報として、文字パタ
ーン切り出し手段(6)に転送する. 最終的に、文字パターン切り出し手段(6)は、切り出
し位置情報に基づいて、文字列パターン記憶手[9 (
 2 >に記憶されている文字列パターンから、個々の
文字に相当する文字パターン“足”“立”、“2”、”
2゜゜を切り出す.この発明の一実施例は、上述したよ
うにフォーマット情報としてあらかじめ与えられた文字
配列のマスク情報を格納しているマスク情報格納手段と
、文字列パターンから求めたヒスI・ダラムと文字配列
を示すマスクとの一致度を評価値として計算するマスク
評価値算出手段と、最も高い一致度が得られるマスク評
価値に基づいて文字パターンの切り出し位置を決定する
文字境界決定手段を備えているので、文字同士が接触し
たり、ノイズがのっている場合でも、正確に1文字づつ
文字パターンを切り出すことができるという効果を奏す
る.なお、上記実施例ではマスク情報格納手段に、4文
字配列のマスク情報だけを格納して文字を切り出す場合
について説明したが、複数種類のマスク情報を格納して
、これらの複数種類のマスク情報を用いて切り出すこと
も可能である。
また、上記実施例では横書きの文字列の場合について説
明したが、縦書きの文字列でも利用できることはいうま
でもない. [発明の効果コ この発明は、以上説明したとおり、複数の文字パターン
からなる文字列パターンを記憶する文字列パターン記憶
手段と、上記文字列パターンの列方向と直交する方向に
走査し文字部分に相当する画素の数3計数しヒストグラ
ムを作成するヒス1〜グラム作成手段と、文字配列のマ
スク情報を格納しているマスク情報格納手段と、上記ヒ
ストグラム及びマスク情報に基づいてマスク評価値を算
出するマスク評価値算出手段と、−11記マスク評価値
に基づいて上記文字列パターンの切り出し位置を決定す
る文字境界決定手段と、上記文字列パターンの切り出し
位置の情報に基づいて上記文字列パターンから1文字パ
ターンづつ切り出す文字パターン切り出し手段とを備え
たので、文字列パターンにノイズがのっていたり、隣合
う文字が接触していても、1つ1つの文字を正しく切り
出すことができるという効果を奏する.
【図面の簡単な説明】
第1図はこの発明の一実施例を示すブロック図、第2図
はこの発明の一実施例で用いるマスク情報を示す説明図
、第3図はこの発明の一実施例の動作過程を示す説明図
、第4図はこの発明の一実施例のマスクのシフト量とマ
スク評価値との関係を示す特性図、第5図(a)〜(c
)及び第6図はこの発明の一実施例の動作過程を示す説
明図、第7図は従来の文字パターン切り出し装置を示す
ブロック図、第8図(a)〜(c)及び第9図(a)〜
(c)は従来の文字パターン切り出し装置の動作過程を
示す説明図である. 図において、 (1) ・・・ 撮像手段、 (2) ・・・ 文字列パターン記憶手段、なお、 を示ず。 ヒストグラl\作成手段、 文字パターン切り出し手段、 マスク情報格納手段、 ・・・ マスク評価値算出手段、 ・・・ 文字墳界決定手段である。

Claims (1)

    【特許請求の範囲】
  1. 複数の文字パターンからなる文字列パターンを記憶する
    文字列パターン記憶手段、上記文字列パターンの列方向
    と直交する方向に走査し文字部分に相当する画素の数を
    計数しヒストグラムを作成するヒストグラム作成手段、
    文字配列のマスク情報を格納しているマスク情報格納手
    段、上記ヒストグラム及びマスク情報に基づいてマスク
    評価値を算出するマスク評価値算出手段、上記マスク評
    価値に基づいて上記文字列パターンの切り出し位置を決
    定する文字境界決定手段、並びに上記文字列パターンの
    切り出し位置の情報に基づいて上記文字列パターンから
    1文字パターンづつ切り出す文字パターン切り出し手段
    を備えたことを特徴とする文字パターン切り出し装置。
JP1115162A 1989-05-10 1989-05-10 文字パターン切り出し装置 Expired - Lifetime JPH07120392B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1115162A JPH07120392B2 (ja) 1989-05-10 1989-05-10 文字パターン切り出し装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1115162A JPH07120392B2 (ja) 1989-05-10 1989-05-10 文字パターン切り出し装置

Publications (2)

Publication Number Publication Date
JPH02294791A true JPH02294791A (ja) 1990-12-05
JPH07120392B2 JPH07120392B2 (ja) 1995-12-20

Family

ID=14655871

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1115162A Expired - Lifetime JPH07120392B2 (ja) 1989-05-10 1989-05-10 文字パターン切り出し装置

Country Status (1)

Country Link
JP (1) JPH07120392B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014206973A (ja) * 2013-04-15 2014-10-30 ゼロックス コーポレイションXerox Corporation 自動ナンバープレート認識アプリケーションにおける文字切り出しのための方法およびシステム

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6818437B1 (en) 1998-05-16 2004-11-16 Applera Corporation Instrument for monitoring polymerase chain reaction of DNA
US20050279949A1 (en) 1999-05-17 2005-12-22 Applera Corporation Temperature control for light-emitting diode stabilization

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6119172A (ja) * 1984-07-05 1986-01-28 Nec Corp Mos型半導体装置の製造方法
JPS6172373A (ja) * 1984-09-17 1986-04-14 Fujitsu Ltd 認識装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6119172A (ja) * 1984-07-05 1986-01-28 Nec Corp Mos型半導体装置の製造方法
JPS6172373A (ja) * 1984-09-17 1986-04-14 Fujitsu Ltd 認識装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014206973A (ja) * 2013-04-15 2014-10-30 ゼロックス コーポレイションXerox Corporation 自動ナンバープレート認識アプリケーションにおける文字切り出しのための方法およびシステム

Also Published As

Publication number Publication date
JPH07120392B2 (ja) 1995-12-20

Similar Documents

Publication Publication Date Title
EP0669593B1 (en) Two-dimensional code recognition method
US4903311A (en) Character region extracting method and apparatus capable of implementing the method
US7170647B2 (en) Document processing apparatus and method
EP1909215A2 (en) Image region detection method, recording medium, and device therefor
CN114121179B (zh) 化学结构式的提取方法及提取装置
JPH0256708B2 (ja)
CN115410191B (zh) 文本图像识别方法、装置、设备和存储介质
JPH02294791A (ja) 文字パターン切り出し装置
JP3698867B2 (ja) 円形パターン判定方法、装置および記録媒体
Peng et al. Document image matching based on component blocks
JP3095470B2 (ja) 文字認識装置
US5313529A (en) System for representing line drawings by polygonal lines
JP3307782B2 (ja) 文字マーク認識装置
JP3756660B2 (ja) 画像認識方法、装置および記録媒体
JPS622382A (ja) 画像処理方法
JP2993533B2 (ja) 情報処理装置及び文字認識装置
JPS6411990B2 (ja)
JP3162414B2 (ja) 罫線認識方法及び表処理方法
JPH01269184A (ja) 文書中の領域境界抽出方式
JPH05274472A (ja) 画像認識装置
JPH06325197A (ja) バーコード認識方法
JP3009237B2 (ja) 特徴抽出方法
Okun et al. Text/graphics separation for technical papers
JPS63184181A (ja) 光学文字認識装置
JPH05128309A (ja) 文字認識におけるエツジ検出方法

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071220

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081220

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091220

Year of fee payment: 14

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091220

Year of fee payment: 14