JP2867531B2 - 文字サイズ認識装置 - Google Patents

文字サイズ認識装置

Info

Publication number
JP2867531B2
JP2867531B2 JP2014190A JP1419090A JP2867531B2 JP 2867531 B2 JP2867531 B2 JP 2867531B2 JP 2014190 A JP2014190 A JP 2014190A JP 1419090 A JP1419090 A JP 1419090A JP 2867531 B2 JP2867531 B2 JP 2867531B2
Authority
JP
Japan
Prior art keywords
character
image
template
character size
size
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2014190A
Other languages
English (en)
Other versions
JPH03217993A (ja
Inventor
悟 有田
芳徳 山口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Omron Corp
Original Assignee
Omron Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Omron Corp filed Critical Omron Corp
Priority to JP2014190A priority Critical patent/JP2867531B2/ja
Publication of JPH03217993A publication Critical patent/JPH03217993A/ja
Application granted granted Critical
Publication of JP2867531B2 publication Critical patent/JP2867531B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Description

【発明の詳細な説明】 <産業上の利用分野> この発明は、認識対象の文字列につき文字サイズを認
識するのに用いられる文字サイズ認識装置に関する。
<従来の技術> 例えば活字文字より成る文字列を文字認識するに際
し、その文字認識処理に先立ち、文字列の文字サイズを
把握するための前処理が必要である。
従来、この種の前処理には、認識対象の文字列の画像
につき各行毎および各列毎に文字構成画素(この場合、
黒画素)の数を計数して、第7図(1)(2)に示すよ
うな行および列方向の濃度ヒストグラムHT1,HT2を求め
た後、これらヒストグラムHT1,HT2から黒画素の切れ目
を見付けて文字1を切り出し、その切り出された文字1
より文字サイズを求めるという手法が用いられている。
<発明が解決しようとする問題点> しかしながらこのような従来技術では、第8図に示す
ように、文字1,1間にノイズ3がある場合は、そのヒス
トグラムHTにおいて本来切れ目であるべき箇所2,2′が
切れ目として検出されず、文字の切出しおよび文字サイ
ズの認識が困難になる。
また第9図に示すように、複数の文字1にわたってア
ンダーライン4が存在する場合も、そのヒストグラムHT
において、本来切れ目であるべき箇所2が切れ目とし
て、現れず、やはり文字サイズの認識が困難である。
第10図に示す例は、文字列が傾いて各文字が回転して
いる場合を示すが、同図のヒストグラムHTにおいて、文
字列1a,1bの間、すなわち行間5に相当する切れ目が現
れず、やはり文字サイズの認識が困難となる。
この発明は、上述の技術的課題に対してなされたもの
であって、文字列の画像上に現れたノイズ、複数の文字
間にわたるアンダーラインの存在、文字列の傾きなどに
影響されることなく、確実に文字サイズの認識が可能な
文字サイズ認識装置を提供するこきを目的とする。
<問題点を解決するための手段> この発明は、認識対象の文字列につき文字サイズを認
識するための文字サイズ認識装置であって、特定文字の
サイズが段階的に異なる複数のテンプレートを記憶する
記憶手段と、認識対象の文字列の画像に対し前記記憶手
段に記憶された各テンプレートを順次走査しテンプレー
トマッチングを行って、各走査位置での画像の一致度を
算出する一致度算出手段と、一致度算出手段で求めた一
致度が所定のしきい値を越える回数を各テンプレート毎
に計数してその計数値が最大となるテンプレートの文字
サイズを認識対象の文字列の文字サイズとして決定する
文字サイズ決定手段とを具備している。
<作用> 認識対象の文字列の画像に対し、特定文字の文字サイ
ズが段階的に異なる複数のテンプレートを用いてテンプ
レートマッチングを行うことにより前記文字列の文字サ
イズを認識するので、文字列の画像上にノイズがのって
いても、また複数の文字にわたるアンダーラインが存在
していても、文字サイズの認識に支障は生じない。また
文字列が傾いて各文字が傾き方向に回転していても、小
さな回転であれば、パターンマッチングの結果に殆ど悪
影響を及ぼさず、文字サイズの認識が可能である。
<実施例> 第1図は、この発明の一実施例にかかる文字サイズ認
識装置11の全体構成を示している。
図示例の装置11は、画像入力装置12,画像メモリ13,マ
ッチング処理部14,CPU15などを構成として含み、CPU15
にはキーボードなどの操作部18と、外部インターフェイ
ス回路19を介してホストコンピュータ20とが接続されて
いる。
画像入力装置12は、ティーチングモードで登録すべき
テンプレートの基本となる基準画像を取り込んで画像メ
モリ13に格納し、また認識モードで認識対象の文字列の
画像を入力してその画像データをマッチング処理部14へ
与える。
画像メモリ13に記憶された基準画像は、対象文字を含
む領域が指定されてCPU15により読み出され、その読み
出された画像は基準サイズのテンプレートとしてパター
ンメモリ16に登録される。英文の場合、最も出現頻度が
高い文字は「e」とされており、ここではテンプレート
の対象文字として文字「e」を用いている。
前記パターンメモリ16には拡大/縮小処理部17が接続
され、前記基準サイズのテンプレートから文字サイズが
段階的に異なる複数のテンプレートが生成されてパター
ンメモリ16に登録される。
マッチング処理部14は、画像入力装置12より認識対象
の文字列の画像を入力し、この入力画像につき文字サイ
ズの異なる複数のテンプレートを用いてテンプレートマ
ッチングを行うための部分である。
第2図は、このテンプレートマッチングの原理を示
す。図中、P0は基準サイズのテンプレートを、またP1
P5は拡大または縮小処理で得た他のテンプレートを、そ
れぞれ示しており、各テンプレートを認識対象の文字列
の画像Diに対し順次全面走査してテンプレートマッチン
グを行い、各走査位置での画像の一致度を算出する。
第3図は、認識モードにおけるCPU15による制御手
順、すなわち上記テンプレートマッチングの方法を用い
た文字サイズの認識手順を示している。
まず同図のステップ1(図中「ST1」で示す)では、
画像入力装置12から認識対象の文字列の画像が入力さ
れ、その入力画像はマッチング処理部14へ与えられる。
つぎのステップ2でCPU15はパターンメモリ16から最初
のテンプレート(たとえばP0)をマッチング処理部14へ
ロードし、つぎのステップ3で入力画像に対しこのテン
プレートP0によるテンプレートマッチングを実行させ
る。
このテンプレートマッチングでは、ロードされたテン
プレートP0を画像全面にわたって走査しつつ入力画像と
照合し、各走査位置での画像の一致度を計数して、その
計数値(一致度)をCPU15へ出力する。
第4図は、英文字「Q」のテンプレートPを拡大して
例示してある。同図中、各枡目は一画素を示し、*で示
す画素が黒画素に相当する。いまこのテンプレートと入
力画像とを照合する場合、例えば*で示す画素位置の入
力画像の黒画素数と、*以外の画素位置の入力画像の白
画素との合計値を画像の一致度として算出する。
この画像の一致度がテンプレートの走査位置毎にマッ
チング処理部14よりCPU15へ出力されると、CPU15はその
一致度が所定のしきい値を越えるか否かを判断すると共
に、しきい値を越えた回数を計数してその計数値を所定
の記憶領域に記憶する。
このようなテンプンレートマッチングが異なる文字サ
イズの他のテンプレートについても実行され、同様の方
法で一致度の算出やしきい値との比較が行われ、一致度
が所定のしきい値を越えた回数の計数およびその計数値
の記憶が行われることになる。
ステップ4は、すべてのテンプレートについてのマッ
チング処理が行われたか否かを判断しており、その判定
が“YES"であれば、つぎのステップ5でCPU15は、前記
計数値の最大値を探索し、その最大値を与えるテンプレ
ートの文字サイズを認識対象の文字列の文字サイズとし
て決定する。
なお上記実施例では、入力画像やテンプレートとして
濃淡画像の2値画像を用いているが、この2値画像デー
タを微分して得たエッジ画像を用いることもできる。
第5図は、エッジ画像を用いて英文字「Q」のテンプ
レートP′を拡大して示している。このテンプレートと
入力画像(エッジ画像)とを照合する場合は、*で示す
画素位置の入力画像の黒画素数のみを数え、*以下の画
素位置の入力画像の白画素数は数えず、前者の計数値を
もって画像の一致度とする。
このようにして文字サイズの認識処理を実行すると
き、第6図に示すように、入力画像Diのノイズ22がのっ
ていたり、複数の文字にわたるアンダーライン23が存在
してしたり、文字列が傾いていたりしても、文字サイズ
の認識が可能であ。
<発明の効果> この発明は上記の如く、認識対象の文字列の画像に対
し、特定文字の文字サイズが段階的に異なる複数のテン
プレートを用いてテンプレートマッチングを行うことに
より前記文字列の文字サイズを認識するようにしたか
ら、文字列の画像上にノイズがのっていても、また複数
の文字にわたるアンダーラインが存在していても、また
文字列が傾いて各文字が傾き方向に回転していても、そ
れらの悪影響を受けずに確実に文字サイズの認識が可能
であるなど、発明目的を達成した顕著な効果を奏する。
【図面の簡単な説明】
第1図はこの発明の一実施例にかかる文字サイズ認識装
置のブロック図、第2図はこの発明の原理を示す説明
図、第3図は文字サイズの認識手順を示すフローチャー
ト、第4図はテンプレートの一例を拡大して示す説明
図、第5図はテンプレートの他の例を示す説明図、第6
図はこの発明の効果を説明するための説明図、第7図は
従来の文字サイズの認識方法を示す説明図、第8図,第
9図および第10図は従来例の課題を説明するための説明
図である。 11……文字サイズ認識装置 14……マッチング処理部 15……CPU 16……パターンメモリ 17……拡大/縮小処理部

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】認識対象の文字列につき文字サイズを認識
    するための文字サイズ認識装置であって、 特定文字の文字サイズが段階的に異なる複数のテンプレ
    ートを記憶する記憶手段と、 認識対象の文字列の画像に対し前記記憶手段に記憶され
    た各テンプレートを順次走査しテンプレートマッチング
    を行って各走査位置での画像の一致度を算出する一致度
    算出手段と、 一致度算出手段で求めた一致度が所定のしきい値を越え
    る回数を各テンプレート毎に計数してその計数値が最大
    となるテンプレートの文字サイズを認識対象の文字列の
    文字サイズとして決定する文字サイズ決定手段とを備え
    て成る文字サイズ認識装置。
JP2014190A 1990-01-23 1990-01-23 文字サイズ認識装置 Expired - Lifetime JP2867531B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014190A JP2867531B2 (ja) 1990-01-23 1990-01-23 文字サイズ認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014190A JP2867531B2 (ja) 1990-01-23 1990-01-23 文字サイズ認識装置

Publications (2)

Publication Number Publication Date
JPH03217993A JPH03217993A (ja) 1991-09-25
JP2867531B2 true JP2867531B2 (ja) 1999-03-08

Family

ID=11854208

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014190A Expired - Lifetime JP2867531B2 (ja) 1990-01-23 1990-01-23 文字サイズ認識装置

Country Status (1)

Country Link
JP (1) JP2867531B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5526596B2 (ja) * 2009-05-15 2014-06-18 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
JP5439069B2 (ja) * 2009-07-08 2014-03-12 三菱重工業株式会社 文字認識装置及び文字認識方法

Also Published As

Publication number Publication date
JPH03217993A (ja) 1991-09-25

Similar Documents

Publication Publication Date Title
US6643401B1 (en) Apparatus and method for recognizing character
JP4607633B2 (ja) 文字方向識別装置、画像形成装置、プログラム、記憶媒体および文字方向識別方法
US5539841A (en) Method for comparing image sections to determine similarity therebetween
US5410611A (en) Method for identifying word bounding boxes in text
JPH1139428A (ja) 文書映像の方向修正方法
EP0949580B1 (en) Classification-driven thresholding of a normalized grayscale image
JP2867531B2 (ja) 文字サイズ認識装置
JPH0424781A (ja) 文書処理装置
JPH11272800A (ja) 文字認識装置
EP0433359A1 (en) Image recognition
JPH10162102A (ja) 文字認識装置
JP3074691B2 (ja) 文字認識装置
JP3052438B2 (ja) 表認識装置
JP3060248B2 (ja) 表認識装置
JP2743378B2 (ja) 文字認識方法
JPH0573725A (ja) 手書き文字・図形認識装置
JP3428504B2 (ja) 文字認識装置
JP4011859B2 (ja) 単語画像正規化装置,単語画像正規化プログラム記録媒体および単語画像正規化プログラム
JP3220226B2 (ja) 文字列方向判別方法
Babczyński et al. Direct Tensor Voting in line segmentation of handwritten documents
JP3329528B2 (ja) ドキュメント読取り装置
JP2957707B2 (ja) 行方向判定装置
JP2972443B2 (ja) 文字認識装置
JPS62281082A (ja) 文字認識装置
JPH10214308A (ja) 文字判別方法