JPH0289193A

JPH0289193A - パターン変換方式

Info

Publication number: JPH0289193A
Application number: JP63240212A
Authority: JP
Inventors: Atsushi Shimoyama; 霜山　篤
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1988-09-26
Filing date: 1988-09-26
Publication date: 1990-03-29

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】〔産業上の利用分野〕本発明は、パターン認識装置に入力されたノイターンの
２値化情報を変換するパターン変換方式番こ関する。

３、発明の詳細な説明（従来の技術）従来から、文字認識装置に於いて、文字を認識する為に
、スキャナー等で、読み取られた文字の大きさを正規化
することが、−ｉに行われている。

正規化とは、ある文字の外接四辺形の大きさが所定の大
きさより大きい時に、又は、前記文字の外接四辺形が小
さい時に、前記文字が含まれる外接四辺形の大きさを所
定の大きさに変更することを言う。

第６図と、第７図は、文字の２値化情報の変換の過程を
示す図である。

以下、図面に従って、従来例を説明する。

先ず、第６図と、第７図を使用して、文字読み取りから
認識迄の処理を説明する。

最初に、スキャナーから紙に書かれた文字の１ペ一ジ分
の情報が２値化され、イメージメモリに記憶される（以
下、２値化された情報をイメージと呼ぶことがある）。

その後、文字位置検出プログラムが起動し、前記２値化
された文字の外接四辺形を求める。第６図（ａ）は、前
記２値化されたイメージである。用紙の左上の隅を（０
，０）とし、前記外接四辺形の左上の隅の座標を（ｘ、
ｙ）前記外接四辺形の横縦の長さをそれぞれ、ｗ、　　
ｈとし、１文字毎の（ｘ、ｙ、ｗ、ｂ）を文字位置メモ
リに記憶する。

次いで、前記イメージを、左右上下に、２値情報が、そ
れぞれ、４８個並ぶ領域に正規化する。

４８Ｘ４　Ｂの領域の２値化情報で文字が表される（こ
の、２値化された情報の領域の大きさをイメージサイズ
と呼ぶ）、以下、正規化の処理を、第７図（ａ）、　（
ｂ）、　（Ｃ）を使って、詳しく説明する。

この処理は、イメージメモリと文字位置メモリのメモリ
から１文字分の２値イメージを読み出し、左右の長さＷ
が、４８以上の時は、左右の１走査線上の、前記２値化
された文字領域（外接四辺形）の２値化情報を、幾つか
ごとに間引き、４８個の２値化情報にする。つまり、第
７図（ａ）の２値イメージの左右幅が、９６あるとする
と、前記９６の２値イメージを、１つ置きに減らし、左
右幅を４８にする。最初は、左右の幅を４８に変換して
、前記イメージを正規化−時イメージ（第７図（ｂ））
に格納する。その後、正規化−時イメージメモリに格納
された２値イメージ（第７図う））を上下の走査線につ
いても大きさを変換する。上下幅が９６あるとすると、
前記左右の場合と同様１つ置きに間引いて行く。そして
、変換後の情報を正規化イメージメモリ（第７図（Ｃ）
）に格納する。また、前記文字の左右幅Ｗが、４８以下
の時は、前記Ｗ個の中の、幾つかの２値化情報を追加し
て、左右幅を４８にする。上下幅についても同様である
。つまり、前記正規化前の文字領域の大きさが、所定の
大きさでない時は、前記正規化前の走査線上の２値情報
の内、幾つかの２値情報を、幾つか毎に減らすか、若し
くは、増やすかして、文字領域を所定の大きさに変換す
る。

その後、特徴抽出プログラムが起動し、正規化イメージ
メモリに記憶された１文字分の２値化イメージを、左右
、縦横等に走査して、特徴を抽出し、特徴抽出メモリに
記憶される。

前記特徴抽出メモリのデータを、照合ハードウェアによ
り、辞書と比較し、相違点の最も少ないものから順に、
答の出力用メモリに格納する。

その後、入力された文字が複数字であれば、同様の処理
を行う。全ての文字について処理が終われば、処理は終
了する。第６図の）は、変換前と変換後の文字を示す図
である。左が変換前の文字、右が変換後の文字である。

大きい文字６Ｉ、複雑な文字６２、小さい文字６３に関
係なく、どの文字も一定の大きさに変換される。

〔発明が解決しようする課題］さて、文字を認識するためには、文字を正規化した後に
、正規化イメージを左右、上下に走査して、前記文字の
特徴を抽出する。その後、前記抽出された特徴を辞書と
照合して、文字を認識する。

前記特徴抽出処理は、前記正規化イメージの１走査線上
に、白（０）の部分が、どの位置にどれだけ存在し、ま
た、どれだけ連続しで続くかを抽出するものである。ま
た特徴抽出処理は、左右上下の走査線にそって、２方向
からおこなわれる。従って、文字認識処理に於いて、前
記処理が占める時間の割合は、非常に高く、時間の短縮
がかねてから求められていた。

前記処理は、文字の２値化イメージのサイズによって速
度が変わる。従って、正規化イメージを小さくすれば、
特徴抽出の時間は、削減できるが、文字によっては、正
規化イメージを小さくすることによって、特徴が失われ
てしまうことがある。

即ち、画数が少ない文字、例えば、ｒ±ｊ等は、正規化
イメージが小さくても、前記文字の特徴は抽出できるが
、画数が多い文字「冨」、「通」等は、正規化イメージ
を小さくすると、正規化処理の過程で、減らされる２値
化情報の内、文字の特徴を構成するものまで、減らされ
、前記文字の特徴が失われてしまい、認識が困難となる
。

従って、本発明は、前記課題を悉く解決し、／％−ドウ
エアを増加することなしに、文字の面積を小さ（して、
特徴抽出の時間を短縮する方式を提供するものである。

前記２値化されたパターン情報の外接四辺形内の領域を
所定の方向に走査し、その走査線上の２値化情報の２値
の変化点を求め、前記変化点の数を求める手段と、前記
変化点の数によって、前記パターンが変換される大きさ
を決定する手段と、前記大きさを決定する手段によって
決定された大きさに、前記パターンの２値化情報を変換
する手段を設ける構成とする。

〔作用〕

外接四辺形の一走査線上の２値化されたパターン情報の
２値の変化点を求め、前記変化点の位置と、前記変化点
の数を求める手段により、前記数を求める。正規化の大
きさは、定められた一つの大きさでは無く、前記数によ
り、変換後の大きさを決定する。その後、前記手段によ
って決定された大きさに合わせて、パターンの２値化情
報を変換する。

〔課題を解決する為の手段］〔実施例〕

第１図は、本発明の一実施例のブロック図、第２図及び
第３図は、実施例動作時におけるフローチャート図、第
４図及び第５図は実施例文字処理時における説明図であ
る。

以下、図面に従って、実施例を説明する。

（）内の番号は、フローチャート内の処理番号に対応す
る。

先ず、第１図と、第２図と第４図を使用して、文字読み
取りから、認識迄の処理を説明する。

最初に、スキャナー２から紙に書かれた文字の１ペ一ジ
分の情報が２値化され、イメージメモリ３に記憶される
（第２図、２２）。

その後、文字位置検出プログラム４が起動し、前記２値
化された文字の外接四辺形を求める。第４図（ａ）は、
前記２値化されたイメージである。用紙の左上の隅を（
０，０）とし、前記外接四辺形の左上の隅の座標を、ｘ
、ｙ、前記外接四辺形の横縦の長さをそれぞれ、ｗ、　
　ｈとし、−文字毎の（ｘ、ｙ、ｗ、ｈ）を文字位置メ
モリ５に記憶する（第２図、２３）、以上の処理は、従
来と同様である。

次いで、文字の正規化（第２図、２４）を行う。

この処理は、イメージメモリ２と文字位置検出メモリ５
を利用して、正規化を行い、正規化イメージメモリｌｌ
に記憶する。（文字の正規化については、後行説明する
。）その後、特徴抽出プログラム１２が起動し、正規化イメ
ージメモリに記憶された、１文字分の２値化イメージを
、左右、縦横等に走査して、特徴を抽出し、特徴メモリ
１３に記憶される。

次いで、前記特徴メモリ１３内のデータの、補正を行う
（第２図、２６）。この補正についても、後はど説明す
る。その後前記補正されたデータを、照合ハードウェア
１５により、辞書と比較しく２７）、相違点の最も少な
いものから順に、答の出力用メモリ１４に格納する（２
８）。

そして、全ての文字について、処理が終了したら、答え
の出力用メモリ１４に格納された記憶をホストインター
フェース制御部１７に入力する（２０１）。

入力された用紙が複数枚であれば、同様の処理を行う。

全ての用紙について、処理が終われば、処理は終了する
。

以上、文字認識の処理の流れを説明した。

以下、文字の正規化と特＠量の補正について、説明する
。第３図は、前記文字の正規化のフローチャートである
。第４図及び第５図は、正規化処理を説明する図面であ
る。

まず、イメージメモリ２と文字位置メモリ５のメモリか
ら１文字分の２値イメージを読み出す。

前記２値イメージは、第４図（ａ）だとする。

その後、エツジアドレステーブル作成プログラム６が起
動し、前記文字の２値イメージの左右を走査して、白（
０）から黒（１）、黒（１）から白（０）の変化点の位
置を求める（前記変化点の位置をエツジ点と呼ぶ）、２
値化情報は、白を“°０”で、黒を”１”で表している
。第４図（ｂ）では、２値イメージの一番上の左右の走
査で、前記エツジ点がａとｂの位置だったとする。前記
情報は、エツジアドレステーブルメモリ７に記憶される
。前記エツジアドレステーブルメモリ７は、第４図（ロ
）の様に記憶されていて、上から６番目の走査線のエツ
ジ点は、ｍ、ｎ、ｐ、ｑで、エツジ数は４である（３２
）。

その後前記２値化イメージの左右の走査が、全て行われ
、エツジアドレステーブルメモリ７にエツジ点を格納す
る（３３）。

次いで、少なくとも同じエツジ数を有する走査線が３本
存在するエツジ数の内、最大のエツジ数をｋとする（３
４）。何故、少なくとも３本かと言うと、前記イメージ
メモリの２値化情報を、紙面からスキャナーを通して読
み取った際に、細かい埃等が付いているかも知れないか
らである。細かい埃が付いていると、エツジ数は、２増
えることになる。従って、単純に、最大の走査線の数を
ｋとせず、少なくとも同じエツジ数を有する走査線が３
本存在するエツジ数の内、最大のエツジ数をｋとする。

前記にの値が８以上ならば、正規化後の左右の幅を４８
にする（３６）、また前記にの値が８より小さければ左
右の幅を３６とする（３７）。つまり、エツジ点が多い
と言うことは、文字が複雑と言うことであるから、幅を
４８にする。また、エツジ点が少ない場合は、幅を３６
にする。前記決定された左右の幅３６又は４８を八、と
する。

前記Ａ１の値が２値価された文字イメージの外接四辺形
の左右幅Ｗよりも、小さいときに（３８）、イメージ作
成プログラム１０が起動し、エツジアドレステーブルメ
モリのデータと、入力のイメージサイズＷ、出力（正規
化後のイメージサイズ）サイズＡ、より、各々の変換後
のエツジ点を、次の様に求める。

各エツジ点をｄとすると、変換後のエツジ点ｆは、ｆ＝
ｄＸ＾１÷Ｗで求められる。前記ｆの値は、四捨五入、
切り上げ等で整数値で求められる。

尚、この時の計算で、計算値が前のエツジの値と同じに
なる場合、即ち線が近接している２値化イメージの場合
は、■走査を削除するように、エツジデータの黒から白
の変化点と、次の白から黒の変化点を削除する。この方
式は、特開昭５８−１１２１６６　　画素密度変換方式
で公知であるから、詳しい説明は省略する。

前記変換されたエツジ点間を、変換前のエツジ点の前後
の２値情報から、黒づめするか、白づめするかを決定し
て、イメージを生成し、結果のイメージを正規化−時メ
モリ９に格納する（３９）。

その後、上下の走査線についても同様の処理を行う。以
下、説明する。前記正規化−時メモリ９を上下に走査し
、上下のエツジアドレステーブル７をテーブル作成プロ
グラム６により左右の場合と同様に作成し格納する（３
０１）。

左右の走査線の変換処理同様、少なくとも同じエツジ数
を有する走査線が３本存在するエツジ数の内、最大のエ
ツジ数をｋとする（３０３）前記にの値が８以上ならば
、正規化後の左右の幅を４８にする（３０５）、また前
記にの値が８より小さければ左右の幅を３６とする（３
０６）。

前記決定された左右の幅をＡ２とする。

前記Ａ２の値が２値化された文字イメージの外接四辺形
の上下幅りよりも、小さいときは、前記幅ｈをＡ２に変
更する。その後、イメージ作成プログラム１０が起動し
、エツジアドレステーブルメモリのデータと、入力のイ
メージサイズｈ、出力（正規化後のイメージサイズ）サ
イズ八、より、各々のエツジアドレスを、次の様に求め
る。

各エツジのアドレスをｄとすると、出力アドレスｒは、
ｆ＝ｄｘＡｚ＋ｈで求め、左右の走査線の変換の時と同
様の処理を行い、前記変換された結果は、正規化イメー
ジメモリ１１に格納される（３０８）。以上の処理で、
文字の正規化は終了する（３０４）。また、処理３８と
処理３０７で、変換前の横縦幅のサイズ、ｗ、ｈとＡ、
、　Ａｔの比較を行ったが、これは、ｗ、ｈがそれぞれ
、前記変換サイズＡ、、　Ａ、よりも小さい場合は、エ
ツジ点の変換を行わないで正規化サイズＡ、、　Ａ！に
格納するためである。これは、正規化サイズが、実際の
文字よりも、大きい場合は、前記変換式（ｆ＝ｄＸ＾ｔ
＋Ｗ、ｆ＝ｄＸＡ、−’−，ｈ）で、変換すると、文字
を拡大することになるからである。小さな文字を拡大し
ても、文字の特徴は変わらないので、この場合は変換し
ない。上記の様に、変換しない場合は、文字を正規化サ
イズＡｒ、　Ａｔの’６７１　Ｍに左づめする。

この結果、文字の２値価イメージの大きさは、縦横４８
Ｘ４Ｂ、４８Ｘ３６，３６Ｘ４Ｂ、３６×３６の何れか
になる。つまり、この正規化は、エツジ点が少ない場合
は、３６のサイズにし、エツジ点が多い場合は４８にし
ている。エツジ点が多いというのは、文字が複雑な場合
で、前記の場合は、正規化後の幅を、大きいほうの４８
にする。

エツジ点が少ない場合、つまり、文字が単純な場合は、
正規化の幅を、小さいほうの３６にする。

第５図は、正規化される前の文字の大きさと、正規化後
の文字の大きさを説明するための図面である。左から、
正規化前のイメージ、正規化−時イメージ、正規化イメ
ージの順である。第５図に示す様に、単純な文字５２．
５４は、縦横３６×３６の２値化イメージに変換され、
複雑な文字５３は、４８Ｘ４８の２値化イメージに変換
される。

また、イメージメモリ入力時から、小さい文字５２は、
３６Ｘ３６の領域に変換される。上下方向のみ複雑な文
字は、縦横４８ｘ３６の２値化イメージに変換される。

以上、正規化について説明した。以下、特徴の読み出し
について、説明する。

前記正規化イメージメモリ１１に格納された文字を上下
左右に走査して、前記文字の特徴を抽出する。前記左右
上下の特徴は、前記正規化されたイメージの左右上下そ
れぞれの１走査線の２値情報の中で、白の部分がどの位
置にどれだけあるかを抽出する。この処理時間は、正規
化イメージの面積に比例する。よって、幅が３６の、正
規化イメージの前記処理は、当然、幅４８のものよりも
早い。

その後、前記正規化イメージの大きさの縦横何れかの大
きさが、３６であれば、前記特徴量を補正する。よって
前記特徴量は、４　Ｂ／３６倍される。つまり、その後
前記特徴を照合ハードウェア１５で、辞書メモリ１６内
の情報と比較するのであるが、前記辞書メモリ１６内の
情報は、正規化イメージメモリが縦横４８Ｘ４８の大き
さの場合の特徴が、入っているからである。以上、実施
例によれば、正規化イメージサイズの幅を２通り用意し
、文字が複雑かどうかをエツジ数で判断し、前記判断に
より、変換後の幅を選択することによって、特徴抽出処
理の速度を高めることできる。

以上、本発明の実施例について詳しく説明した。

実施例では、前記正規化の幅を２通り用意したが、３通
りでも、４通りでも一向に構わない。

本発明は、本発明の要旨に従い、種々の変形が可能で有
り、本発明はそれらを排除するものではない。

〔効果〕

本発明によれば、特徴抽出処理を、ハードウェアの増加
すること無しに、容易に行える。

【図面の簡単な説明】

第１図は、本発明の一実施例のブロック図、第２図及び
第３図は、実施例動作時におけるフローチャート図、第
４図及び第５図は実施例文字処理時における良明図であ
る。第６図は、第７図は、従来の文字の２値化情報の変
換の過程を示す図である。ｌ・・・中央処理装置２・・・スキャナー３・・・イメージメモリ４・・・文字位置検出プログラム５・・・文字位置メモリ６・・・エツジアドレステーブル作成プログラム７・・
・エツジアドレステーブルメモリ８・・・正規化サイズ
判定プログラム９・・・正規化−時イメージメモリ１０・・・イメージ作成プログラム１１・・・正規化イメージメモリ１２・・・特徴抽出プログラムメモリ１３・・・特徴メモリ１４・・・答えの出力用メモリ１５・・・照合ハードウェア１６・・・辞書メモリ１７・１８・・・ホストインターフェース制御部・・基本プログラム天万ｔイ’ｉ”ｌ、ｎプロ・・！り因ｖ−ｌ　　図、：ＸＮＨ聾＼　Ｎｌ’ｎ　　略　噂　（ト　〜　）　）第６田ｔθノ女芋尺理時１１３ＬＦＪＰＩ口東５図従来ｔｎＺ樋化情報７１棲ｊ連４−訛明図をＩ：、図（
ｂ） −１−Ｉ旨９奴森１硅、Ｊ−１旨Ｃ−麺：蟹、Ｌ１％ｑ奴宿璧

Claims

【特許請求の範囲】パターンを２値化する手段を有するパターン認識装置に
於いて、前記２値化されたパターン情報の外接四辺形内の領域を
所定の方向に走査し、その走査線上の２値化情報の２値
の変化点を求め、前記変化点の数を求める手段（６）と
、前記変化点の数によって、前記パターンが変換される大
きさを決定する手段（８）と、前記大きさを決定する手段によって決定された大きさに
、前記パターンの２値化情報を変換する手段（１０）を
有することを特徴とする文字変換方式。