JPS63150784A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPS63150784A
JPS63150784A JP61297776A JP29777686A JPS63150784A JP S63150784 A JPS63150784 A JP S63150784A JP 61297776 A JP61297776 A JP 61297776A JP 29777686 A JP29777686 A JP 29777686A JP S63150784 A JPS63150784 A JP S63150784A
Authority
JP
Japan
Prior art keywords
pattern
character
power variation
normalized
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61297776A
Other languages
English (en)
Inventor
Toshiaki Yagasaki
矢ケ崎 敏明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP61297776A priority Critical patent/JPS63150784A/ja
Publication of JPS63150784A publication Critical patent/JPS63150784A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は、文字認識装置、特に前処理として認識過程に
引き渡すための文字の大きさの正規化を行う文字認識装
置に関するものである。
[従来の技術] 従来、この種の装置は書かれた文字の位置が規定されて
おり、且つ文字の大きさに関しても所定の記入枠の中に
ある程度の大きさで書くことが限定されていた。一方、
フリーなフォーマットで任意の位置に書かれた文字を認
識する場合には、文字単位に切り出すことと、切り出さ
れた文字の大きさが未定のため大きさを正規化する必要
とが生しる。一般に大きさを正規化をするには、−文字
毎に切り出された文字パターンの外接枠から認識パター
ンへの変倍率を算出して、パターンを当てはめる手順を
とる。さらに、この変倍率も上記文字パターンのX方向
、X方向独立の変倍率を採用しているものが多い。この
場合、例えば“1”のような文字パターンが“口”のよ
うに正規化されたり、“O“や“0”のよりなX方向と
X方向とが微妙に違うパターンに関しては全くの同一の
認識パターンに正規化される。このような場合にX方向
、X方向の変倍率を変えることによって、つまり変倍率
の小さい方を基準に正規化を行なうという手段によって
容易に問題を解決できることも明らかになっている。
ところが、特殊文字の認識、つまり(“、” ・“、”
 ・ “。”・・・)のような文字の認識においては、
上記の正規化手段では区別できなかったり、正規化によ
り別の文字になってしまうことがある。
[発明が解決しようとする問題点] 本発明は、上述従来例の欠点を除去し、サイズの違う類
似文字やパターンの位置の異なる類似文字を識別して認
識する文字認識装置を提供することを目的とする。
[問題点を解決するための手段] 上記目的を達成するために本発明の文字認識装置は以下
のような構成から成る。
即ち、配列された文字を認識する文字認識装置において
、所定方向に配列されたパターンを分離する分離手段と
、該分離手段により分離されたパターンを変倍して所定
の大きさに正規化する変倍手段とを備える。
[作用コ 以上の構成において、配列された文字を認識する文字認
識装置において、所定方向に配列されたパターンを分離
する分離手段と、該分離手段により分離されたパターン
を変倍して所定の大きさに正規化する変倍手段とを備え
、変倍手段は、個々のパターンの変倍比率と複数のパタ
ーンの平均変倍比率とに基づいて、変倍比率を決定する
ように動作する。
[実施例] 第2図(a)は従来の文字認識装置の構成を示すブロッ
ク図、第2図(b)は従来の文字認識装置の処理フロー
チャートである。
従来の文字認識装置は、人力部21とCPU22とRO
M23とRAM24と認識辞書25と出力部26とを備
え、人力部21より文書をイメージデータで人力すると
、CPU22はROM23に格納された処理プログラム
に従って、RAM24をイメージデータの記憶及び補助
記憶として使いながら文字の切り出し一正規化一認識を
行い、表示装置や記憶装置等の出力部26より出力する
その動作を第2図(b)のフローチャートに従って説明
する。ステップ5200で入力部21からの人力文書デ
ータが入力される。ここではスキャナで入力する。この
スキャナは入力文章をイメージデータに変換するが、一
般的にCCD等のセンサを使うとイメージデータはアナ
ログ値を示す。このアナログ値を2値化(0,1のパタ
ーン)するのがステップ5201である。2値化された
イメージデータはイメージメモリのRAM24に格納さ
れ、ステップ5202で文字の切り出しが行なわれる。
文字の切り出しを第3図の人力文書例に従って説明する
。イメージデータをX方向にスキャンしてX方向の濃度
ヒストグラムHYを求め、ライン毎に発生するパルス波
形毎に文字列の判別を行なう。第3図においては、■〜
■が文字列とみなされる。さらに文字列毎に分離して、
それぞれに対してX方向の濃度ヒストグラムピケをとる
第3図には0列の濃度ヒストグラムHxが示してあり、
これにより■・・・■のように1文字車位に文字が切り
出される。
第4図は1文字車位に切り出された文字例を表わしたの
ものである。第4図に示されるように、X方向の幅はす
べて同一の間隔であることがわかる。一方、X方向の幅
は文字の横の大きさで変化する。つまり、“ピ”、“キ
”はほぼ文字外形のままに切り出され、“−”は外形と
しては“ピ”とほぼ同じになるがX方向の幅の中心部の
みに片寄っている。“1“、“。”等は細長のデータが
切り出される。
ステップ5203では、ステップ5202で切り出され
た文字の平滑化処理がなされる。特にここでは孤立画像
の除去(ノイズ除去)が中心である。ステップ5204
では、第5図に示されるように文字外形の矩形抽出が行
なわれる。ステップ5205では、ステップ5204で
抽出された矩形図形f(i)と特徴描出される画像パタ
ーンの大きさFとの縦幅と横幅の倍率から、大きさの正
規化をするための変倍率gが計算される。例えば、ステ
ップ5204で求められた第5図の矩形図形f(i)が
32x32の画素からなっていて、特徴描出される画像
パターンFが64X64のときは、変倍率g=2が得ら
れる。
この変倍率gだけf (i)を変倍することによって、
ステップ5206では正規化パターンF(i)(正規化
される最終の画像パターン)が作り出される。ステップ
5207では正規化パターンF (i)の特徴描出が実
行され、ステップ3208で予め認識辞書25に記憶さ
れたパラメータとの比較によって識別処理がなされ、ス
テップ5209で認識結果が出力部26に出力される。
この場合、候補文字という形で複数個を出力することが
多い。
第1図(a)は第1の実施例の文字認識装置のブロック
図、第1図(b)、(C)は第1の実施例の処理フロー
チャートである。
第1の実施例の文字認識装置は、人力部11とCPU1
2とROM13とRAM14と認識辞書15と認識辞書
16と出力部17とを備え、人力部11より文書をイメ
ージデータで人力すると、CPU12はROM13に格
納された処理プログラムに従って、RAM14をイメー
ジデータの記憶及び補助記憶として使用しながら、文字
の切り出しと正規化が実行される。正規化されたパター
ンに基づいて認識辞書15と認識辞書16とが選択され
て文字認識が実行され、表示装置や記憶装置等の出力部
17より出力する。
その動作を第1図(b)、(c)の処理フローチャート
に従って説明する。ステップ3100〜ステツプ510
3は前述のステップ3200〜ステツプ5203と同一
の処理を行なう。ステップ5104では、連続したn文
字の切り出しパターンデータから、第5図で示されるよ
うな矩形データf (1) 、  f (2) 、 ・
・・、  f (n)を得る。
ステップ5105において、得られた矩形データのX成
分の平均値f′8とX成分の平均値f′7とが、次式 %式% により算出される。尚、fx(k)、fy(k)はf 
(k)のX成分とX成分である。以下、X成分とX成分
とは処理が同じなので、第1図(b)ではX、Yを区別
せず共通の書き方をする。ステップ5106においては
、平均値f′と認識文字のサイズFとから変倍率g=F
/f’を算出する。
ステップ5107で各々の文字の変倍率g’ (k) 
−F/f (k)を算出する。kは各文字の順番とする
。ステップ5108では、gとg’(k)との比較がな
される。これは、各々の文字の変倍率g’(k)が平均
変倍率gに所定値Aを加えた値より犬ぎければ、ステッ
プ5109で平均値変倍率をとることにより、異常に大
きな変倍が実行されないことになる。たとえば、切り出
された文字が第5図の“。”、“、”等の場合に与えら
れることになる。尚、本例のようにX、Yの区別をせず
全体の平均値・変倍率を算出して処理をしても良い。
一方、ステップ5108で各々の文字の変倍率g′(k
)が平均変倍率gに所定値Aを加えた値以下ならば、従
来のように各々の文字の変倍率g (k)を使用する。
ステップ5109,110で変倍された文字はステップ
5111で正規化パターンF (k)として、以下ステ
ップ3112〜115で特徴抽出して文字の認識を行い
、出力部17に出力する。
この場合、第1図(a)のブロック図で、特殊文字の認
識辞書15を別に設けて、ステップ5113で認識辞書
15と16の選択を行い、ステップ5109に進んだ場
合は特徴抽出後に認識辞書15にアクセスがかかるよう
にすれば、認識時間の大幅な削減も達成できる。つまり
、第1の実施例では認識辞書15は特殊文字認識辞書で
あり、認識辞書16は他の文字となる。又、特殊文字の
認識辞書15が与えられるために、特殊文字に対する認
識処理において、文字データの認識不良が回避できる。
更に、小文字のアルファベットや促音(や、ゆ、っ・・
・)などが判別できるために、これらの文字を認識辞書
15に格納すれば、大文字と類似の小文字に対する判別
が達成できる。
第6図(a)は第2の実施例の文字認識装置のブロック
図、第6図(b)、(c)は第2の実施例の処理フロー
チャートである。
第2の実施例の文字認識装置は、人力部61とCPU6
2とROM63とRAM64と認識辞書15a、15b
、65c、 ・・・と出力部67とを備え、人力部61
より文書イメージデータで人力すると、CPU62はR
OM63に格納された処理プログラムに従って、RAM
64をイメージデータの記憶及び補助記憶として使用し
ながら、文字の切り出しと正規化が実行される。正規化
された結果、つまり正規化された手順に基づいて、認識
辞書65a、65b、65c、・・・が選択されて文字
認識が実行され、表示装置や記憶装置等の出力部66よ
り出力する。
その動作を、第6図(b)、(C)の処理フローチャー
トに従って説明する。ステップ3600〜ステツプ56
03は、従来例の5200〜5203と同一の処理を行
なう。ステップ5604では、切り出し文字パターンの
図形の重心が算出される。重心というのは、切り出され
た文字が例えば第7図に示されるような図形の場合には
、A点を基準にA(0,0)。
B (Wl 、 O)、 C(0,hl )、 D (
Wl 。
h2)なる座標を設け、−例として、f (x。
y)が座標(x、y)における画素の濃度値とすると、 を算出することで(x+ 、yr )が重心の座標とし
て求まる。ステップ5605においては、求められたX
 + + 3’ +の値に応じて第8図のように重心の
位置g(i)の割り当てを行う。iは1〜9の整数で、
第7図のパターンはg(5)が割りつけられる。′、″
のようなパターンはg(3)が割りつけられることにな
る。
ステップ5606では、上記パターンの外形図形が求め
られる。外形図形というのは、パターンの始めと終りの
位置をX方向、X方向につめることである。この時のX
方向の幅をf (x)、X方向の幅をf (y)とする
。ステップ5607では、所定値Aとt (x)、  
f (y)をそれぞれ比較して両方ともf (x)、 
 f (y)のほうが小さいならば、つまり促音文字や
特殊文字ならば、ステップ3608に進む。その他の文
字の場合はステップ5609に進むことになる。
ステップ5609では、 g  ′ =Min  (Fx/f(x)、Fy/f(
y))でX方向とX方向の幅の変倍率の内で小さい値の
ほうが選択される。これで、“−”のような文字ではX
方向の変倍率がとられ、“1”のような文字の場合には
X方向の変倍率が選ばれることになる。尚、Fx、Fy
は、認識パターンが(64゜64)のパターンであると
するとFx=64゜F3/=64となる。
一方、ステップ3608では、上記算出されたg (i
)によってフローが異なる。g(1)のとき、つまり“
°”のような文字に対してはステップ5610aに進み
、g(2)のとき、つまり°゛*”のような文字のとき
はステップ5610bに進み、g(3)のとき、つまり
“、′のような文字のときはステップ5610cの処理
をする。
第6図(b)にはg(1)〜g(3)の場合しか図示し
なかったが、g(4)・・・g (9) ノWN 合ニ
もそれぞれの処理を行う。又、g(1)。
g (4) 、 g (7)をg(1)で代表させる処
理も考えられる。ステップ5610a、610b。
610 c 、−・−の処理は、F/f詳しくは、Mi
n(Fx/f (x) 、 Fy/f (y) )で変
倍率が求められ、さらに1/4.1/3.1/2.・・
・をかけることにより正規化変倍率を異ならしめる。こ
れは、“°”と“、”との正規化後の特徴ベクトル空間
のパターンを異ならしめるもので、認識率の向上がはか
れる。
ステップ5611では、ステップ5610a。
610b、610c、・・・で求められたg′の変倍率
によって入力データの正規化が実行されF (x)、 
 F (y)の正規化パターンが求まることになる。正
規化パターンはステップ5612で特徴抽出が実行され
る。ステップ5613では、特徴抽出されたベクトルf
 (a)・・・但a=1〜64、に前述のステップで求
められたg′。
g(i)を付加することで、識別処理を行なう最終的な
ベクトル空間−が求められることになる。
第2の実施例では、g’、g(i)の2つの値をベクト
ル空間に付けているが、どちらか一方でも大きな効果が
出る。ステップ5614では、g’、g(i)の値によ
って認識辞書65a。
65b、65c、・・・の選択が実行される。g′とg
(i)の組み合わせのそれぞれに対して認識辞書を設け
るならば、第6図(b)のフローで示しただけでも4X
9=36種類の認識辞書を作ることがでとる。認識辞書
の数は、コストとシステムの必要性に応じて設ければ良
く、重心位置の決定のための区分けも9つに限らない。
又、第1の実施例と同様にX成分とy成分を分けずに処
理をしてもよい。以下、ステップ5615で選択された
認識辞書を基に文字の識別が行なわれ、ステップ561
6で候補文字が出力される。
以上述べてきたように本実施例によりサイズの違いによ
る類似文字“ヤ”、“ヤ”などに関しての識別に関して
有効な手段を提供するものである。そのために、切り出
された文字の矩形図形。
X方向の長さ、X方向の長さを算出することで、パター
ンの複数のX方向の平均値、X方向の平均値を求め、平
均値を基準にしてパターンデータの個々の長さを比較す
る手段を有し、比較結果に応じてパターンデータの変倍
率を決定することにある。又、上記変倍率は、各パター
ンデータによって独立に設けられることと、各パターン
の正規化への変倍率に応じて、平均値の変倍率か各パタ
ーンに対応する変倍率かが選択的に決められることを特
徴とする。
さらに、本実施例によると、フリーフォーストで書かれ
る文章に対して、句読点や“目°°。
“日”、“1″などの縦長の文章、又横長の文字に対し
ても読取りパターンデータを忠実に保ちながら、正規化
する手段を提供することで文字の認識率そのものを向上
することが可能となる。
さらに、本実施例では、切り出された文字の画像パター
ンの重心の位置を算出し、重心の位置と画像パターンの
大きさに応じて正規化のための変倍手段を変える。これ
により、パターンの位置関係によって異なる類似文字“
、”、“パなとの識別に関して有効な手段を提供するも
のである。
つまり、本実施例においては、上記類似文字には重心の
位置の違いが生じている点に着目して、文字外形図形パ
ターンからの大きさによる認識図形パターンへの変倍率
を異にすることで特徴ベクトルを空間の性質を違えてし
まう。
ざらに、本実施例は、上記手段において正規化された認
識図形パターンより特徴抽出することと、抽出によって
求められた特徴ベクトル空間に上記手段によって求めら
れた変倍率を特徴パラメータとして付加することを特徴
とする。又、上記手段において正規化され求められた特
徴ベクトル空間に、文字切り出し後に求められた重心の
アドレス位置のパラメータを付加することを特徴とする
。もちろん、上述の変倍パラメータ及び重心アドレス位
置のパラメータは独立した2つのベクトル空間として付
けることも可能である。
[発明の効果] 本発明により、サイズの違う類似文字やパターンの位置
の異なる類似文字を識別して認識する文字認識装置を提
供できる。
【図面の簡単な説明】
第1図(a)は第1の実施例の文字認識装置のブロック
図、 第1図(b)、(C)は第1の実施例の処理フローチャ
ート、 第2図(a)は従来の文字認識装置のブロック図、 第2図(b)は従来の処理フローチャート、第3図は人
力文字例を示す図、 第4図は切り出した文字例を示す図、 第5図は第4図の文字に対応する矩形図形を示す図、 第6図(a)は第2の実施例の文字認識装置のブロック
図、 第6図(b)、(C)は第↓の実施例の処理フローチャ
ート、 第7図は第2の実施例の重心の算出を説明する図、 第8図は第2の実施例の重心の割り当て位置を説明する
図である。 図中、11・・・入力部、12・・・CPU、13・・
・ROM、14・・・RAM、15.16・・・認識辞
書、17・・・出力部、61・・・人力部、62・・・
cpu。 63・ROM、64・RAM、65a、65b。 65c・・・認識辞書、66・・・出力部である。 特許出願人   キャノン株式会社 第1図 (0) 第1面 (C’) 第2図  (0) 第6図 (0) 第6図 (C) 第8図

Claims (3)

    【特許請求の範囲】
  1. (1)配列された文字を認識する文字認識装置において
    、所定方向に配列されたパターンを分離する分離手段と
    、該分離手段により分離された前記パターンを変倍して
    所定の大きさに正規化する変倍手段とを備え、 前記変倍手段は、個々のパターンの変倍比率と複数のパ
    ターンの平均変倍比率とに基づいて、変倍比率を決定す
    ることを特徴とする文字認識装置。
  2. (2)変倍手段は、縦方向と横方向とを別々に変倍する
    ことを特徴とする特許請求の範囲第1項記載の文字認識
    装置。
  3. (3)変倍手段は、個々のパターンの変倍比率と複数の
    パターンの平均変倍比率とを比較する比較手段と、該比
    較手段の比較結果から個々のパターンの変倍比率が複数
    のパターンの平均変倍比率より大きい場合には複数のパ
    ターンの平均変倍比率を、個々のパターンの変倍比率が
    複数のパターンの平均変倍比率より小さい場合には個々
    のパターンの変倍比率を正規化の変倍比率に決定する変
    倍比率決定手段とを備えることを特徴とする特許請求の
    範囲第1項記載の文字認識装置。
JP61297776A 1986-12-16 1986-12-16 文字認識装置 Pending JPS63150784A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61297776A JPS63150784A (ja) 1986-12-16 1986-12-16 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61297776A JPS63150784A (ja) 1986-12-16 1986-12-16 文字認識装置

Publications (1)

Publication Number Publication Date
JPS63150784A true JPS63150784A (ja) 1988-06-23

Family

ID=17851031

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61297776A Pending JPS63150784A (ja) 1986-12-16 1986-12-16 文字認識装置

Country Status (1)

Country Link
JP (1) JPS63150784A (ja)

Similar Documents

Publication Publication Date Title
JP3259993B2 (ja) 語形測定方法及び画像信号処理方法
EP0543592A2 (en) Optical word recognition by examination of word shape
CN110992374A (zh) 一种基于深度学习的头发精细化分割方法及系统
Verma et al. Removal of obstacles in Devanagari script for efficient optical character recognition
Pechwitz et al. Comparison of two different feature sets for offline recognition of handwritten arabic words
JPS63150784A (ja) 文字認識装置
Farkya et al. Hindi speech synthesis by concatenation of recognized hand written devnagri script using support vector machines classifier
US11270146B2 (en) Text location method and apparatus
JPS63150783A (ja) 文字認識装置
JPS63150785A (ja) 文字認識装置
JPS63150786A (ja) 文字認識装置
JPS63269267A (ja) 文字認識方法
Lakshmi et al. A high accuracy OCR system for printed Telugu text
Oladayo Yorùbá language and numerals’ offline interpreter using morphological and template matching
KR100479349B1 (ko) 자소기반 문자인식기 성능 향상방법
JP2788506B2 (ja) 文字認識装置
JP2918666B2 (ja) 文字画像切出し方法
JP3140079B2 (ja) 罫線認識方法及び表処理方法
JP2840485B2 (ja) 画像処理方法及び装置
KR950011065B1 (ko) 문자 인식방법
JP2963474B2 (ja) 類似文字識別方法
JP3245241B2 (ja) 文字認識装置および方法
JPS6089290A (ja) パタ−ン認識方法
KR930012141B1 (ko) 온라인 필기체 문자인식방법
Asavareongchai et al. Recognition of Thai characters and text from document templates