JP3121091B2 - 文字認識に於ける文字画像の正規化方法 - Google Patents

文字認識に於ける文字画像の正規化方法

Info

Publication number
JP3121091B2
JP3121091B2 JP04028391A JP2839192A JP3121091B2 JP 3121091 B2 JP3121091 B2 JP 3121091B2 JP 04028391 A JP04028391 A JP 04028391A JP 2839192 A JP2839192 A JP 2839192A JP 3121091 B2 JP3121091 B2 JP 3121091B2
Authority
JP
Japan
Prior art keywords
character image
character
image
aspect ratio
normalization
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP04028391A
Other languages
English (en)
Other versions
JPH0581479A (ja
Inventor
佳誠 麻生川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Omron Corp
Original Assignee
Omron Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Omron Corp filed Critical Omron Corp
Priority to JP04028391A priority Critical patent/JP3121091B2/ja
Publication of JPH0581479A publication Critical patent/JPH0581479A/ja
Application granted granted Critical
Publication of JP3121091B2 publication Critical patent/JP3121091B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文字認識に於ける文字
画像の正規化方法に関し、特に文字列より切り出された
1文字の画像の位置、大きさを正規化する方法に関する
ものである。
【0002】
【従来の技術】文字認識に於いては、特徴抽出、識別の
前処理として、文字列より切り出された1文字の画像の
位置、大きさを正規化することが行われる。この文字画
像の主たる正規化方法としては、文字画像の外接矩形枠
が正規化矩形枠のサイズに合致するように、文字画像の
外接矩形枠の縦サイズと横サイズを、これの外接矩形枠
の縦横比率に関係関係なく拡大、縮小する縦横比率非保
存による正規化法と、文字画像の外接矩形枠の縦サイズ
と横サイズを、これの外接矩形枠の縦横比率に従って拡
大、縮小する縦横比率保存による正規化法と、文字画像
の重心位置を正規化画像の中心として非線形に正規化す
る正規化法とが知られている。
【0003】
【発明が解決しようとする課題】上述の如き縦横比率非
保存による正規化法、縦横比率保存による正規化法は、
単一字種(フォント)の文字の認識に於いては問題を生
じないが、しかし同一の文字カテゴリに於いて、多様な
字形が存在するような多数のフォントを扱う場合には、
同一カテゴリの文字に於いてもセリフの有無等により正
規化後の文字画像の変動が著しく大きく、このため一つ
の文字カテゴリについて一つの標本辞書では対応でき
ず、複数種類の標本辞書を準備する必要が生じる。
【0004】文字画像の重心位置を利用した正規化法に
於いても、上述の如き不具合はほんんど解消されず、し
かもこの場合は、文字画像の重心位置の算出等のために
処理時間が長く、高速処理することが難しいと云う問題
点がある。
【0005】また切り出し文字画像の大きさ、縦横比率
の変動に応じて複数の正規化手段、識別手段を組み合わ
せる手法が提案されているが、しかしこれに於いても、
同一カテゴリの文字に於いて正規化後の文字画像の変動
が著しく大きい場合は、一つの文字カテゴリに対してそ
れぞれの識別手段に対する標本辞書を用いなければなら
ず、このため文字認識装置のシステムが大きくなる。
【0006】本発明は、従来の文字認識に於ける文字画
像の正規化方法に於ける上述の如き問題点に着目してな
されたものであり、長い処理時間を必要とすることなく
安定した文字画像の正規化を行い、字形の変化が大きい
多数のフォントによる文字が一つの標本辞書、一つの識
別手段により効率よく認識され得るようにする文字画像
の正規化方法を提供することを目的としている。
【0007】
【課題を解決するための手段】上述の如き目的は、本発
明によれば、切り出された文字画像の外接矩形枠の縦横
比率より、その文字画像が縦長文字画像、横長文字画
像、略正方形状文字画像の何れであるかを判別し、該判
別結果より切り出された文字画像の正規化を行う文字認
識に於ける文字画像の正規化方法において、 文字画像の
縦寸法をH、横寸法をWとして、縦横比率RをR=H/
Wと定義した場合、 (1)文字画像の縦横比率RがR>(第1の閾値Th
1)で縦長の文字画像であるときは、縦横比率RがR/
Th1となるよう正規化し、 (2)文字画像の縦横比率Rが第1の閾値Th1より小
さく、R<(第2の閾値Th2)で横長の文字画像であ
るときは、縦横比率RがR/Th2となるよう正規化
し、 (3)文字画像の縦横比率Rが(第1の閾値Th1)≧
R≧(第2の閾値Th2)で文字画像が略正方形状文字
画像であるときは縦横比率Rを変化させることなく正規
化を行う ことを特徴とする文字認識に於ける文字画像の
正規化方法によって達成される。
【0008】
【作用】上述の如き文字画像の正規化方法によれば、切
り出しされた文字画像の外接矩形枠の縦横比率に応じて
縦横比率保存による正規化法と縦横比率非保存による正
規化法とが使い分けられ、これにより同一カテゴリの文
字に於いてフォントの違いにより正規化後の文字画像の
変動が大きくなることが回避される。
【0009】
【実施例】以下に添付の図を参照して本発明を実施例に
ついて詳細に説明する。図1は本発明による文字認識に
於ける文字画像の正規化方法を実施する文字認識装置の
一例を示している。文字認識装置は、文字画像の正規化
等の前処理を行うCPU1と、1文字ずつ文字の識別を
行う文字識別部3と、図示されていない文字読み取り部
より文字画像信号を一行ずつ取り込み、また文字認識結
果を一行ずつ外部へ出力する通信制御部5と、一行分の
文字画像のデータを保存する画像保存用RAM7と、文
字切り出し・制御のプログラムを格納した文字切り出し
・制御プログラム用ROM9と、演算データ用RAM1
1とを有し、これらはバス13により相互に接続されて
いる。
【0010】図2は上述の如き文字認識装置による文字
認識の一般的な処理手順を示している。文字認識は、先
ず画像読み取り手段により読み取った文字の画像入力を
行い(ステップ10)、次に一行分の文字画像の行切り
出し、1文字分の文字画像の文字切り出しを行い(ステ
ップ20、30)、この後に文字画像の正規化を行う
(ステップ40)。そして正規化された文字画像と標本
辞書の標本文字データとの比較により文字の識別を行う
(ステップ50)。
【0011】本発明による文字画像の正規化方法に於い
ては、基本的には、切り出しされた1文字分の文字画像
の外接矩形枠の縦横比率を算出し、この縦横比率より、
その文字画像が縦長文字画像、横長文字画像、略正方形
状文字画像の何れであるかを判別し、文字画像が縦長文
字画像、或は横長文字画像である場合は縦横比率保存に
よる正規化を行い、文字画像が略正方形状文字画像であ
る場合は縦横比率非保存による正規化を行う。
【0012】図3は本発明による文字画像の正規化方法
の具体的実施例を示している。これに於いては、先ず1
文字分の切り出し文字の画像入力を行い(ステップ4
1)、この文字画像について縦横比率Rを算出する(ス
テップ42)。この縦横比率Rは、図4に示されている
如く、文字画像の外接矩形枠Fiの縦寸法をH、横寸法
をWとすると、R=H/Wで示される。
【0013】次に縦横比率Rが所定のしきい値Th1 よ
り大きいか否かの判別を行う(ステップ43)。R>T
h1 であれば、即ち縦長の文字画像である時は、下式に
従った正規化を行う(ステップ44)。尚、この正規化
は一辺の寸法がnの正方形枠Fnを対象として行うもの
とする。 Nh=(n/H)H Nw=(n・Th1 /H)W=n(th1 /R) 正規化後の文字画像の外接矩形枠の縦寸法はNh、横寸
法はNwにより示されており、この場合、横方向の変換
比率にTh1 が掛けられていることにより、入力文字画
像の縦横比率Rを残しながら、縦横比率Rがしきい値T
h1 付近の文字画像に対する正規化画像の分布が入力文
字のフォントの違いに対し連続したものになる。
【0014】R>Th1 でない場合は、次に縦横比率R
が所定のしきい値Th2 より小さいかか否かの判別を行
う(ステップ45)。R<Th2 であれば、即ち横長の
文字画像である時は、下式に従った正規化を行う(ステ
ップ46)。 Nh=(n/Th2 ・W)H=n(R/th2 ) Nw=(n/W)W この場合、縦方向の変換比率に1/Th2 が掛けられて
いることにより、入力文字画像の縦横比率Rを残しなが
ら、縦横比率Rがしきい値Th2 付近の文字画像に対す
る正規化画像の分布が入力文字のフォントの違いに対し
連続したものになる。
【0015】R<Th2 でない場合は、縦横比率Rが、
Th1≧R≧Th2である場合に該当し、入力文字画像
が略正方形状文字画像である場合である。この場合には
下式に従った正規化を行う(ステップ47)。 Nh=(n/H)H Nw=(n/W)W これにより、この場合は、正規化後の文字画像の外接矩
形枠は正方形枠Fnと等しいものになる。即ち正方形状
に正規化される。上述の何れかの方式により正規化され
た文字画像のデータは識別のために出力される(ステッ
プ48)。
【0016】図5〜図7は各々、各種フォントによる文
字画像の正規化を本発明による方法に従って行った場合
と従来法によって行った場合との比較例を示している。
図5〜図7の各々に於て、(A)は入力文字画像を、
(B)は本発明による正規化方法に従って行った場合の
正規化文字画像を、(C)は従来法によって行った場合
の正規化文字画像を各々示している。
【0017】図5は縦長文字の場合を示しており、この
場合は(C)に示されている如く、縦横比率非保存によ
る正規化が行われると、正規化文字画像のパターンはフ
ォントの違いにより大きく変動することになるが、本発
明による正規化方法に於ける如く、この場合には縦横比
率保存による正規化が行われると、(B)に示されてい
る如く、正規化文字画像のパターンはフォントの違いに
より大きく変動することがない。
【0018】図6は略正方形状文字の場合を示してお
り、この場合は(C)に示されている如く、縦横比率保
存による正規化が行われると、正規化文字画像のパター
ンはフォントの違いにより変動することになるが、本発
明による正規化方法に於ける如く、この場合には縦横比
率非保存による正規化が行われると、(B)に示されて
いる如く、正規化文字画像のパターンはフォントの違い
により変動することがない。
【0019】また図7は縦長文字と略正方形状文字につ
いて文字画像の重心位置を利用して正規化を行った場合
と、本発明による正規化方法により正規化を行った場合
とを示している。この図より、文字画像の重心位置を利
用した正規化法に於いては、略正方形状の文字である場
合は正規化文字画像のパターンがフォントの違いにより
大きく変動することはないが、縦長文字の場合は縦横比
率非保存による正規化法に於ける場合と同様に正規化文
字画像のパターンはフォントの違いにより大きく変動す
ることが解る。これに対し本発明による正規化方法に於
いては、縦長文字と略正方形状文字の何れに於いても正
規化文字画像のパターンがフォントの違いにより大きく
変動することがないことが解る。
【0020】また図8は本発明による文字画像の正規化
方法に於いて、入力文字画像のフォントの違いにより、
あるフォントのものは縦長文字画像あるいは横長文字画
像であると判別されて縦横比率保存による正規化が行わ
れ、他のフォントのものは略正方形状文字画像であると
判別されて縦横比率非保存による正規化が行われる場合
の例を示している。図8に於いて、(A)は入力文字画
像を、(Ba)は単純な縦横比率保存による正規化法と
縦横比率非保存による正規化法との組合せによる場合の
正規化文字画像を、(Bb)は、上述の如く、縦長の文
字画像である場合は横方向の変換比率にTh1 を掛け、
横長の文字画像である時は縦方向の変換比率に1/Th
2 を掛ける縦横比率保存による正規化法と縦横比率非保
存による正規化法との組合せによる場合の正規化文字画
像を各々示している。
【0021】この図8より、縦横比率Rがしきい値Th
1 、Th2 付近の文字画像に対しては、単純な縦横比率
保存による正規化法と縦横比率非保存による正規化法と
の組合せによる場合に比して、縦長の文字画像である場
合は横方向の変換比率にTh1 を掛け、横長の文字画像
である時は縦方向の変換比率に1/Th2 を掛ける縦横
比率保存による正規化法と縦横比率非保存による正規化
法との組合せによる場合のほうが、正規化文字画像の分
布が入力文字のフォントの違いに対し、より一層連続し
たものになることが理解されよう。
【0022】
【発明の効果】以上の説明から理解される如く、本発明
による文字画像の正規化方法によれば、切り出しされた
文字画像の外接矩形枠の縦横比率に応じて縦横比率保存
による正規化法と縦横比率非保存による正規化法とが使
い分けられ、これにより同一カテゴリの文字に於いてフ
ォントの違いにより正規化後の文字画像の変動が大きく
なることが回避されるから、長い処理時間を必要とする
ことなく安定した文字画像の正規化が行われ、字形の変
化が大きい多数のフォントによる文字が一つの標本辞
書、一つの識別手段により効率よく認識され得るように
なる。
【図面の簡単な説明】
【図1】本発明による文字認識に於ける文字画像の正規
化方法を実施する文字認識装置の一例を示すブロック線
図。
【図2】文字認識装置による文字認識の一般的な処理手
順を示すゼネラルフローチャート。
【図3】本発明による文字画像の正規化方法の具体的実
施例を示すフローチャート。
【図4】入力文字画像と外接矩形枠と正規化の正方形枠
との関係を示す解図。
【図5】(A)、(B)、(C)は各々入力文字画像と
本発明による文字画像の正規化方法による正規化文字画
像と従来法による正規化文字画像とを示す解図。
【図6】(A)、(B)、(C)は各々入力文字画像と
本発明による文字画像の正規化方法による正規化文字画
像と従来法による正規化文字画像とを示す解図。
【図7】(A)、(B)、(C)は各々入力文字画像と
本発明による文字画像の正規化方法による正規化文字画
像と従来法による正規化文字画像とを示す解図。
【図8】(A)、(Ba)、(Bb)は各々入力文字画
像と本発明による文字画像の正規化方法による正規化文
字画像と更に改善された本発明による文字画像の正規化
方法による正規化文字画像とを示す解図。
【符号の説明】
1 CPU 3 文字識別部 5 通信制御部 7 画像保存用RAM 9 文字切り出し・制御プログラム用ROM 11 演算データ用RAM 13 バス Fi 外接矩形枠 Fn 正規化の正方形枠

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】 切り出された文字画像の外接矩形枠の縦
    横比率より、その文字画像が縦長文字画像、横長文字画
    像、略正方形状文字画像の何れであるかを判別し、該判
    別結果より切り出された文字画像の正規化を行う文字認
    識に於ける文字画像の正規化方法において、 文字画像の縦寸法をH、横寸法をWとして、縦横比率R
    をR=H/Wと定義した場合、 (1)文字画像の縦横比率RがR>(第1の閾値Th
    1)で縦長の文字画像であるときは、縦横比率RがR/
    Th1となるよう正規化し、 (2)文字画像の縦横比率Rが第1の閾値Th1より小
    さく、R<(第2の閾値Th2)で横長の文字画像であ
    るときは、縦横比率RがR/Th2となるよう正規化
    し、 (3)文字画像の縦横比率Rが(第1の閾値Th1)≧
    R≧(第2の閾値Th2)で文字画像が略正方形状文字
    画像であるときは縦横比率Rを変化させることなく正規
    化を行う ことを特徴とする文字認識に於ける文字画像の
    正規化方法。
JP04028391A 1991-07-25 1992-02-14 文字認識に於ける文字画像の正規化方法 Expired - Fee Related JP3121091B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP04028391A JP3121091B2 (ja) 1991-07-25 1992-02-14 文字認識に於ける文字画像の正規化方法

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP18646791 1991-07-25
JP3-186467 1991-07-25
JP04028391A JP3121091B2 (ja) 1991-07-25 1992-02-14 文字認識に於ける文字画像の正規化方法

Publications (2)

Publication Number Publication Date
JPH0581479A JPH0581479A (ja) 1993-04-02
JP3121091B2 true JP3121091B2 (ja) 2000-12-25

Family

ID=26366492

Family Applications (1)

Application Number Title Priority Date Filing Date
JP04028391A Expired - Fee Related JP3121091B2 (ja) 1991-07-25 1992-02-14 文字認識に於ける文字画像の正規化方法

Country Status (1)

Country Link
JP (1) JP3121091B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004265205A (ja) * 2003-03-03 2004-09-24 Ishida Co Ltd ラベル良否判定方法及びラベル良否判定装置

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5041775B2 (ja) * 2006-09-28 2012-10-03 沖電気工業株式会社 文字切出方法及び文字認識装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004265205A (ja) * 2003-03-03 2004-09-24 Ishida Co Ltd ラベル良否判定方法及びラベル良否判定装置

Also Published As

Publication number Publication date
JPH0581479A (ja) 1993-04-02

Similar Documents

Publication Publication Date Title
US7567730B2 (en) Detecting an orientation of characters in a document image
US20030063802A1 (en) Image processing method, apparatus and system
US7580571B2 (en) Method and apparatus for detecting an orientation of characters in a document image
US5046114A (en) Method and structure for separating joined patterns for use in pattern and character recognition system
US5150425A (en) Character recognition method using correlation search
US5526440A (en) Hand-written character recognition apparatus
JP3121091B2 (ja) 文字認識に於ける文字画像の正規化方法
CN115545009B (zh) 一种获取目标文本的数据处理系统
JP2000105836A (ja) 論理構造抽出装置
JP3187899B2 (ja) 文字認識装置
JP3009078B2 (ja) 文字認識装置
JP2867531B2 (ja) 文字サイズ認識装置
JP2938276B2 (ja) 文字認識装置
JPH0816719A (ja) 文字切り出し方法とこれを用いた文字認識方法及び装置
JPH0950488A (ja) 異サイズ混在文字列の読取り方法
JPH08147314A (ja) 認識型文書ファイリング装置及びその制御方法
JPH05189604A (ja) 光学的文字読取装置
JPH03126188A (ja) 文字認識装置
JP3320083B2 (ja) 文字認識装置及び方法
JPH05166009A (ja) 文字切出し・認識方法及び装置
JPS63150785A (ja) 文字認識装置
JPS63150783A (ja) 文字認識装置
JPH11232388A (ja) 文書・帳票認識システム
JPS61206090A (ja) 文字読取装置
JPH05159098A (ja) 文字間の空白認識方法

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20000922

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071020

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081020

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091020

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees