JPH03217993A - 文字サイズ認識装置 - Google Patents
文字サイズ認識装置Info
- Publication number
- JPH03217993A JPH03217993A JP9014190A JP1419090A JPH03217993A JP H03217993 A JPH03217993 A JP H03217993A JP 9014190 A JP9014190 A JP 9014190A JP 1419090 A JP1419090 A JP 1419090A JP H03217993 A JPH03217993 A JP H03217993A
- Authority
- JP
- Japan
- Prior art keywords
- character
- image
- template
- character string
- size
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Character Input (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〈産業上の利用分野〉
この発明は、認識対象の文字列につき文字サイズを認識
するのに用いられる文字サイズ認識装置に関する。
するのに用いられる文字サイズ認識装置に関する。
く従来の技術〉
例えば活字文字より成る文字列を文字認識するに際し、
その文字認識処理に先立ち、文字列の文字サイズを把握
するための前処理が必要である。
その文字認識処理に先立ち、文字列の文字サイズを把握
するための前処理が必要である。
従来、この種の前処理には、認識対象の文字列の画像に
つき各行毎および各列毎に文字構成画素(この場合、黒
画素)の数を計数して、第7図(1)(2)に示すよう
な行および列方向の濃度ヒストグラムH T + ,
H T 2を求めた後、これらヒストグラムHT,,H
T.から黒画素の切れ目を見付けて文字1を切り出し、
その切り出された文字1より文字サイズを求めるという
手法が用いられている。
つき各行毎および各列毎に文字構成画素(この場合、黒
画素)の数を計数して、第7図(1)(2)に示すよう
な行および列方向の濃度ヒストグラムH T + ,
H T 2を求めた後、これらヒストグラムHT,,H
T.から黒画素の切れ目を見付けて文字1を切り出し、
その切り出された文字1より文字サイズを求めるという
手法が用いられている。
〈発明が解決しようとする問題点〉
しかしながらこのような従来技術では、第8図に示すよ
うに、文字1,1間にノイズ3がある場合は、そのヒス
トグラムHTにおいて本来切れ目であるべき箇所2.2
′が切れ目として検出されず、文字の切出しおよび文字
サイズの認識が困難になる。
うに、文字1,1間にノイズ3がある場合は、そのヒス
トグラムHTにおいて本来切れ目であるべき箇所2.2
′が切れ目として検出されず、文字の切出しおよび文字
サイズの認識が困難になる。
また第9図に示すように、複数の文字lにわたってアン
ダーライン4が存在する場合も、そのヒストグラムHT
において、本来切れ目であるべき箇所2が切れ目として
、現れず、やはり文字サイズの認識が困難である。
ダーライン4が存在する場合も、そのヒストグラムHT
において、本来切れ目であるべき箇所2が切れ目として
、現れず、やはり文字サイズの認識が困難である。
第10図に示す例は、文字列が傾いて各文字が回転して
いる場合を示すが、同図のヒストグラムHTにおいて、
文字列1a,lbO間、すなわち行間5に相当する切れ
目が現れず、やはり文字サイズの認識が困難となる。
いる場合を示すが、同図のヒストグラムHTにおいて、
文字列1a,lbO間、すなわち行間5に相当する切れ
目が現れず、やはり文字サイズの認識が困難となる。
この発明は、上述の技術的課題に対してなされたもので
あって、文字列の画像上に現れたノイズ、複数の文字間
にわたるアンダーラインの存在、文字列の傾きなどに影
響されることなく、確実に文字サイズの認識が可能な文
字サイズ認識装置を提供するこきを目的とする。
あって、文字列の画像上に現れたノイズ、複数の文字間
にわたるアンダーラインの存在、文字列の傾きなどに影
響されることなく、確実に文字サイズの認識が可能な文
字サイズ認識装置を提供するこきを目的とする。
〈問題点を解決するための手段〉
この発明は、認識対象の文字列につき文字サイズを認識
するための文字サイズ認識装置であって、特定文字の文
字サイズが段階的に異なる複数のテンプレートを記憶す
る記憶手段と、認識対象の文字列の画像に対し前記記憶
手段に記憶された各テンプレートを順次走査しテンプレ
ートマッチングを行って、各走査位置での画像の一致度
を算出する一致度算出手段と、一致度算出手段で求めた
一致度が所定のしきい値を越える回数を各テンプレート
毎に計数してその計数値が最大となるテンプレートの文
字サイズを認識対象の文字列の文字サイズとして決定す
る文字サイズ決定手段とを具備している。
するための文字サイズ認識装置であって、特定文字の文
字サイズが段階的に異なる複数のテンプレートを記憶す
る記憶手段と、認識対象の文字列の画像に対し前記記憶
手段に記憶された各テンプレートを順次走査しテンプレ
ートマッチングを行って、各走査位置での画像の一致度
を算出する一致度算出手段と、一致度算出手段で求めた
一致度が所定のしきい値を越える回数を各テンプレート
毎に計数してその計数値が最大となるテンプレートの文
字サイズを認識対象の文字列の文字サイズとして決定す
る文字サイズ決定手段とを具備している。
く作用〉
認識対象の文字列の画像に対し、特定文字の文字サイズ
が段階的に異なる複数のテンプレートを用いてテンプレ
ートマッチングを行うことにより前記文字列の文字サイ
ズを認識するので、文字列の画像上にノイズがのってい
ても、また複数の文字にわたるアンダーラインが存在し
ていても、文字サイズの認識に支障は生じない。
が段階的に異なる複数のテンプレートを用いてテンプレ
ートマッチングを行うことにより前記文字列の文字サイ
ズを認識するので、文字列の画像上にノイズがのってい
ても、また複数の文字にわたるアンダーラインが存在し
ていても、文字サイズの認識に支障は生じない。
また文字列が傾いて各文字が傾き方向に回転していても
、小さな回転であれば、パターンマソチングの結果に殆
ど悪影響を及ぼさず、文字サイズの認識が可能である。
、小さな回転であれば、パターンマソチングの結果に殆
ど悪影響を及ぼさず、文字サイズの認識が可能である。
〈実施例〉
第1図は、この発明の一実施例にかかる文字サイズ認識
装置1lの全体構成を示している。
装置1lの全体構成を示している。
図示例の装置1lは、画像入力装置12,画像メモリ1
3,マッチング処理部14,CP−U15などを構成と
して含み、CPU15にはキーボードなどの操作部18
と、外部インターフエイス回路19を介してホストコン
ピュータ20とが接続されている。
3,マッチング処理部14,CP−U15などを構成と
して含み、CPU15にはキーボードなどの操作部18
と、外部インターフエイス回路19を介してホストコン
ピュータ20とが接続されている。
画像入力装置12は、ティーチングモードで登録すべき
テンプレートの基本となる基準画像を取り込んで画像メ
モリ13に格納し、また認識モードで認識対象の文字列
の画像を入力してその画像データをマッチング処理部1
4へ与える。
テンプレートの基本となる基準画像を取り込んで画像メ
モリ13に格納し、また認識モードで認識対象の文字列
の画像を入力してその画像データをマッチング処理部1
4へ与える。
画像メモリl3に記憶された基準画像は、対象文字を含
む領域が指定されてCPU15により読み出され、その
読み出された画像は基準サイズのテンプレートとしてパ
ターンメモリ16に登録される。英文の場合、最も出現
頻度が高い文字は「e」とされており、ここではテンプ
レートの対象文字として文字「e」を用いている。
む領域が指定されてCPU15により読み出され、その
読み出された画像は基準サイズのテンプレートとしてパ
ターンメモリ16に登録される。英文の場合、最も出現
頻度が高い文字は「e」とされており、ここではテンプ
レートの対象文字として文字「e」を用いている。
前記パターンメモリ16には拡大/縮小処理部17が接
続され、前記基準サイズのテンプレートから文字サイズ
が段階的に異なる複数のテンプレートが生成されてパタ
ーンメモリ16に登録される。
続され、前記基準サイズのテンプレートから文字サイズ
が段階的に異なる複数のテンプレートが生成されてパタ
ーンメモリ16に登録される。
マッチング処理部14は、画像入力装置12より認識対
象の文字列の画像を入力し、この入力画像につき文字サ
イズの異なる複数のテンプレートを用いてテンプレート
マッチングを行うための部分である。
象の文字列の画像を入力し、この入力画像につき文字サ
イズの異なる複数のテンプレートを用いてテンプレート
マッチングを行うための部分である。
第2図は、このテンプレートマッチングの原理を示す。
図中、P0は基準サイズのテンプレートを、またP1〜
P,は拡大または縮小処理で得た他のテンプレートを、
それぞれ示しており、各テンプレートを認識対象の文字
列の画像D、に対し順次全面走査してテンプレートマッ
チングを行い、各走査位置での画像の一致度を算出する
。
P,は拡大または縮小処理で得た他のテンプレートを、
それぞれ示しており、各テンプレートを認識対象の文字
列の画像D、に対し順次全面走査してテンプレートマッ
チングを行い、各走査位置での画像の一致度を算出する
。
第3図は、認識モードにおけるCPU15による制御手
順、すなわち上記テンプレートマッチングの方法を用い
た文字サイズの認識手順を示している。
順、すなわち上記テンプレートマッチングの方法を用い
た文字サイズの認識手順を示している。
まず同図のステップ1(図中rsT1」で示す)では、
画像人力装置l2から認識対象の文字列の画像が入力さ
れ、その入力画像はマッチング処理部14へ与えられる
。つぎのステップ2でCPU’l5はパターンメモリI
6から最初のテンプレート(たとえばpo)をマ,冫チ
ング処理部14ヘロードし、つぎのステップ3で入力画
像に対しこのテンプレートP oによるテンプレートマ
ッチングを実行させる。
画像人力装置l2から認識対象の文字列の画像が入力さ
れ、その入力画像はマッチング処理部14へ与えられる
。つぎのステップ2でCPU’l5はパターンメモリI
6から最初のテンプレート(たとえばpo)をマ,冫チ
ング処理部14ヘロードし、つぎのステップ3で入力画
像に対しこのテンプレートP oによるテンプレートマ
ッチングを実行させる。
このテンプレートマソチングでは、ロードされたテンプ
レートP。を画像全面にわたって走査しつつ人力画像と
照合し、各走査位置での画像の一致度を計数して、その
計数値(一致度)をCPU15へ出力する。
レートP。を画像全面にわたって走査しつつ人力画像と
照合し、各走査位置での画像の一致度を計数して、その
計数値(一致度)をCPU15へ出力する。
第4図は、英文字「QJのテンプレートPを拡大して例
示してある。同図中、各枡目は一画素を示し、*で示す
画素が黒画素に相当する。
示してある。同図中、各枡目は一画素を示し、*で示す
画素が黒画素に相当する。
いまこのテンプレートと入力画像とを照合する場合、例
えば*で示す画素位置の入力画像の黒画素数と、*以外
の画素位置の入力画像の白画素との合計値を画像の一致
度として算出する。
えば*で示す画素位置の入力画像の黒画素数と、*以外
の画素位置の入力画像の白画素との合計値を画像の一致
度として算出する。
この画像の一致度がテンプレートの走査位置毎にマッチ
ング処理部14よりCPUl5へ出力されると、CPU
I 5はその一致度が所定のしきい値を越えるか否かを
判断すると共に、しきい値を越えた回数を計数してその
計数値を所定の記憶領域に記憶する。
ング処理部14よりCPUl5へ出力されると、CPU
I 5はその一致度が所定のしきい値を越えるか否かを
判断すると共に、しきい値を越えた回数を計数してその
計数値を所定の記憶領域に記憶する。
このようなテンプレートマッチングが異なる文字サイズ
の他のテンプレートについても実行され、同様の方法で
一致度の算出やしきい値との比較が行われ、−4度が所
定のしきい値を越えた回数の計数およびその計数値の記
憶が行われることになる。
の他のテンプレートについても実行され、同様の方法で
一致度の算出やしきい値との比較が行われ、−4度が所
定のしきい値を越えた回数の計数およびその計数値の記
憶が行われることになる。
ステップ4は、すべてのテンプレートについてのマッチ
ング処理が行われたか否かを判断しており、その判定が
“YES″であれば、つぎのステップ5でCPU15は
、前記計数値の最大値を探索し、その最大値を与えるテ
ンプレートの文字サイズを認識対象の文字列の文字サイ
ズとして決定する。
ング処理が行われたか否かを判断しており、その判定が
“YES″であれば、つぎのステップ5でCPU15は
、前記計数値の最大値を探索し、その最大値を与えるテ
ンプレートの文字サイズを認識対象の文字列の文字サイ
ズとして決定する。
なお上記実施例では、入力画像やテンプレートとして濃
淡画像の2値画像を用いているが、この2値画像データ
を微分して得たエッジ画像を用いることもできる。
淡画像の2値画像を用いているが、この2値画像データ
を微分して得たエッジ画像を用いることもできる。
第5図は、エッジ画像を用いた英文字「QJのテンプレ
ートP′を拡大して示している。このテンプレートと入
力画像(エッジ画像)とを照合する場合は、ネで示す画
素位置の入力画像の黒画素数のみを数え、*以外の画素
位置の入力画像の白画素数は数えず、前者の計数値をも
って画像の一致度とする。
ートP′を拡大して示している。このテンプレートと入
力画像(エッジ画像)とを照合する場合は、ネで示す画
素位置の入力画像の黒画素数のみを数え、*以外の画素
位置の入力画像の白画素数は数えず、前者の計数値をも
って画像の一致度とする。
このようにして文字サイズの12識処理を実行するとき
、第6図に示すように、入力画像D.にノイズ22がの
っていたり、複数の文字にわたるアンダーライン23が
存在してしたり、文字列が傾いていたりしても、文字サ
イズの認識が可能である。
、第6図に示すように、入力画像D.にノイズ22がの
っていたり、複数の文字にわたるアンダーライン23が
存在してしたり、文字列が傾いていたりしても、文字サ
イズの認識が可能である。
〈発明の効果〉
この発明は上記の如く、認識対象の文字列の画像に対し
、特定文字の文字サイズが段階的に異なる複数のテンプ
レートを用いてテンプレートマッチングを行うことによ
り前記文字列の文字サイズを認識するようにしたから、
文字列の画像上にノイズがのっていても、また複数の文
字にわたるアンダーラインが存在していても、また文字
列が傾いて各文字が傾き方向に回転していても、それら
の悪影響を受けずに確実に文字サイズの認識が可能であ
るなど、発明目的を達成した顕著な効果を奏する。
、特定文字の文字サイズが段階的に異なる複数のテンプ
レートを用いてテンプレートマッチングを行うことによ
り前記文字列の文字サイズを認識するようにしたから、
文字列の画像上にノイズがのっていても、また複数の文
字にわたるアンダーラインが存在していても、また文字
列が傾いて各文字が傾き方向に回転していても、それら
の悪影響を受けずに確実に文字サイズの認識が可能であ
るなど、発明目的を達成した顕著な効果を奏する。
第1図はこの発明の一実施例にかかる文字サイズ認識装
置のブロック図、第2図はこの発明の原理を示す説明図
、第3図は文字サイズの認識手順を示すフローチャート
、第4図はテンプレートの一例を拡大して示す説明図、
第5図はテンプレートの他の例を示す説明図、第6図は
この発明の効果を説明するための説明図、第7図は従来
の文字サイズの認識方法を示す説明図、第8図,第9図
および第10図は従来例の課題を説明するための説明図
である。 l1・・・・文字サ,イズ認識装置 l4・・・・マッチング処理部 15・・・・CPU 16・・・・パターンメモリ 17・・・・拡大/縮小処理部
置のブロック図、第2図はこの発明の原理を示す説明図
、第3図は文字サイズの認識手順を示すフローチャート
、第4図はテンプレートの一例を拡大して示す説明図、
第5図はテンプレートの他の例を示す説明図、第6図は
この発明の効果を説明するための説明図、第7図は従来
の文字サイズの認識方法を示す説明図、第8図,第9図
および第10図は従来例の課題を説明するための説明図
である。 l1・・・・文字サ,イズ認識装置 l4・・・・マッチング処理部 15・・・・CPU 16・・・・パターンメモリ 17・・・・拡大/縮小処理部
Claims (1)
- 【特許請求の範囲】 認識対象の文字列につき文字サイズを認識するための文
字サイズ認識装置であって、 特定文字の文字サイズが段階的に異なる複数のテンプレ
ートを記憶する記憶手段と、 認識対象の文字列の画像に対し前記記憶手段に記憶され
た各テンプレートを順次走査しテンプレートマッチング
を行って各走査位置での画像の一致度を算出する一致度
算出手段と、 一致度算出手段で求めた一致度が所定のしきい値を越え
る回数を各テンプレート毎に計数してその計数値が最大
となるテンプレートの文字サイズを認識対象の文字列の
文字サイズとして決定する文字サイズ決定手段とを備え
て成る文字サイズ認識装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2014190A JP2867531B2 (ja) | 1990-01-23 | 1990-01-23 | 文字サイズ認識装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2014190A JP2867531B2 (ja) | 1990-01-23 | 1990-01-23 | 文字サイズ認識装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH03217993A true JPH03217993A (ja) | 1991-09-25 |
| JP2867531B2 JP2867531B2 (ja) | 1999-03-08 |
Family
ID=11854208
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2014190A Expired - Lifetime JP2867531B2 (ja) | 1990-01-23 | 1990-01-23 | 文字サイズ認識装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2867531B2 (ja) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2010267155A (ja) * | 2009-05-15 | 2010-11-25 | Fuji Xerox Co Ltd | 画像処理装置及び画像処理プログラム |
| JP2011018175A (ja) * | 2009-07-08 | 2011-01-27 | Mitsubishi Heavy Ind Ltd | 文字認識装置及び文字認識方法 |
-
1990
- 1990-01-23 JP JP2014190A patent/JP2867531B2/ja not_active Expired - Lifetime
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2010267155A (ja) * | 2009-05-15 | 2010-11-25 | Fuji Xerox Co Ltd | 画像処理装置及び画像処理プログラム |
| JP2011018175A (ja) * | 2009-07-08 | 2011-01-27 | Mitsubishi Heavy Ind Ltd | 文字認識装置及び文字認識方法 |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2867531B2 (ja) | 1999-03-08 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US5410611A (en) | Method for identifying word bounding boxes in text | |
| JP4607633B2 (ja) | 文字方向識別装置、画像形成装置、プログラム、記憶媒体および文字方向識別方法 | |
| US5539841A (en) | Method for comparing image sections to determine similarity therebetween | |
| US6643401B1 (en) | Apparatus and method for recognizing character | |
| JPH0424781A (ja) | 文書処理装置 | |
| JPH03217993A (ja) | 文字サイズ認識装置 | |
| JP2751865B2 (ja) | 文字列認識装置 | |
| JP2788506B2 (ja) | 文字認識装置 | |
| JP3074691B2 (ja) | 文字認識装置 | |
| JP3388918B2 (ja) | 文字列読み取り装置 | |
| JP2902097B2 (ja) | 情報処理装置及び文字認識装置 | |
| JP3345246B2 (ja) | 文字認識装置及び文字認識方法 | |
| JP3052438B2 (ja) | 表認識装置 | |
| JPS5949671A (ja) | 光学的文字読取装置 | |
| JP2743378B2 (ja) | 文字認識方法 | |
| JP3756660B2 (ja) | 画像認識方法、装置および記録媒体 | |
| JP3345469B2 (ja) | 単語間隔度演算方法、単語間隔度演算装置、及び文字読取り方法、文字読取り装置 | |
| JPS6222186A (ja) | 図面読取り装置 | |
| JP2972443B2 (ja) | 文字認識装置 | |
| JP2954218B2 (ja) | 画像処理方法及び装置 | |
| JP2918363B2 (ja) | 文字分類方法及び文字認識装置 | |
| JP3320083B2 (ja) | 文字認識装置及び方法 | |
| JP2000187704A (ja) | 文字認識装置及びその方法及び記憶媒体 | |
| JPH05189604A (ja) | 光学的文字読取装置 | |
| JPH05174178A (ja) | 文字認識方法 |