JP2832035B2 - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JP2832035B2
JP2832035B2 JP1122543A JP12254389A JP2832035B2 JP 2832035 B2 JP2832035 B2 JP 2832035B2 JP 1122543 A JP1122543 A JP 1122543A JP 12254389 A JP12254389 A JP 12254389A JP 2832035 B2 JP2832035 B2 JP 2832035B2
Authority
JP
Japan
Prior art keywords
character
unit
width
height
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP1122543A
Other languages
English (en)
Other versions
JPH02300988A (ja
Inventor
義弘 北村
尚史 齋鹿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Consejo Superior de Investigaciones Cientificas CSIC
Original Assignee
Consejo Superior de Investigaciones Cientificas CSIC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Consejo Superior de Investigaciones Cientificas CSIC filed Critical Consejo Superior de Investigaciones Cientificas CSIC
Priority to JP1122543A priority Critical patent/JP2832035B2/ja
Publication of JPH02300988A publication Critical patent/JPH02300988A/ja
Application granted granted Critical
Publication of JP2832035B2 publication Critical patent/JP2832035B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 <産業上の利用分野> この発明は、「一」,「1」および「−」等のよう
に、水平方向または垂直方向に延在する一本の線によっ
て概略構成される特定文字を精度よく認識することがで
きる文字認識装置に関する。
<従来の技術> 文章の文字情報をコンピュータ処理等によって認識す
る文字認識装置として光学式文字読取装置(OCR)が知
られている。このOCRは、例えば手書き文字や印刷文字
等の認識対象文字の文字情報を光電変換し、この光電変
換されて得られた電気信号に基づく文字画像情報を1文
字単位で切り出す。そして、認識部において、この1文
字単位で切り出された文字画像情報に基づいて、所定の
認識アルゴリズムに従って1文字ずつ入力文字を認識す
る。
従来、上述のようなOCRにおいて入力文字を認識する
場合には、まず入力文字の文字画像情報の大局的特徴
(例えば、複雑指数や四辺コード等)に基づいて大分類
を行い、幾つかの候補文字を選択する。次に、上記文字
画像情報の詳細な特徴(例えば、複合類似度や混合類似
度等)に基づいて、大分類によって選択された候補文字
の中から、さらに詳細認識を行うようにしている。
<発明が解決しようとする課題> しかしながら、上記OCRにおける従来の文字認識方法
では、大分類あるいは詳細認識いずれの場合において
も、1文字(カテゴリ)単位の分類アルゴリズムあるい
は認識アルゴリズムを用意していないので、分類対象あ
るいは認識対象の複数の文字の総てを同一のアルゴリズ
ムに従って分類あるいは認識しなければならない。その
ために、正規化処理によって「一」,「1」および
「−」等の特定文字も所定の幅と高さになるように引き
伸ばされ、文字領域を構成する黒情報で満たされた略矩
形となってしまう。したがって、上記特定文字は他の画
数の多い(すなわち、文字領域を構成する黒情報の多
い)文字と誤認識される場合があり、上記特定文字の認
識率が低くなるという問題がある。ところが、上記特定
文字の認識率を高めるためには、複雑な認識アルゴリズ
ムに基づく複雑な処理を必要とし、文字認識装置のコス
トアップを招くという問題が生じる。
そこで、この発明の目的は、簡単な処理によって、
「一」,「1」,「−」等の特定文字を高速かつ正確に
認識できる文字認識装置を提供することにある。
<課題を解決するための手段> 上記目的を達成するため、この発明は、入力された文
字画像情報に従って、入力文字の幅と高さを幅/高さ抽
出部によって抽出し、この抽出された文字の幅の値と高
さの値とに基づいて、入力文字の幅および高さが所定の
値になるように幅/高さ伸縮部によって伸縮処理を行
い、この伸縮処理が行われた文字画像情報に基づいて入
力文字を認識する文字認識装置において、上記伸縮処理
が行われた文字画像情報に基づいて、入力文字の上下お
よび左右が共に接する矩形の文字枠の面積を算出する文
字枠面積算出部と、上記伸縮処理が行われた文字画像情
報に基づいて、入力文字の文字領域を構成する要素の数
を計測する文字構成要素数計測部と、上記文字枠面積算
出部からの文字枠面積の値と上記文字構成要素数計測部
からの文字構成要素数とに基づいて、上記文字構成要素
数と文字枠面積との比を求め、この文字構成要素数と文
字枠面積との比の値が所定の範囲内に入るような入力文
字を特定文字と判定する特定文字判定部を備えたことを
特徴としている。
また、この発明の文字認識装置は、上記特定文字判定
部を、上記幅/高さ抽出部によって抽出された入力文字
の幅の値と高さの値とに基づいて、縦長の特定文字と横
長の特定文字とを識別するように成すことが望ましい。
<作用> 文字画像情報が入力されると、入力された文字画像情
報に従って、入力文字の幅と高さが幅/高さ抽出部によ
って抽出され、この抽出された文字の幅の値と高さの値
とに基づいて、入力文字の幅および高さが所定の値にな
るように幅/高さ伸縮部によって伸縮処理が行われる。
そうすると、この伸縮処理が行われた文字画像情報に基
づいて、入力文字の上下および左右が共に接する矩形の
文字枠の面積が文字枠面積算出部によって算出される。
一方、上記伸縮処理が行われた文字画像情報に基づい
て、入力文字の文字領域を構成する要素の数が文字構成
要素数計測部によって計測される。そして、上記文字枠
面積算出部からの文字枠面積の値と上記文字構成要素数
計測部からの文字構成要素数とに基づいて、上記文字構
成要素数と文字枠面積との比が特定文字判定部によって
求められると共に、この文字構成要素数と文字枠面積と
の比の値が所定の範囲内に入るような入力文字が上記特
定文字判定部によって特定文字であると判定される。し
たがって、このようにして特定文字であると判定された
入力文字に対しては、認識処理を実行する必要がなくな
る。
また、上記文字認識装置は、上記特定文字判定部を、
上記幅/高さ抽出部によって抽出された入力文字の幅の
値と高さの値とに基づいて、縦長の特定文字と横長の特
定文字とを識別するように成せば、縦長の特定文字と横
長の特定文字とを識別して上記特定文字を判定できる。
<実施例> 以下、この発明を図示の実施例により詳細に説明す
る。
第1図はこの発明の文字認識装置のブロック図であ
る。イメージスキャナ等から成る入力部1から入力され
た文字画像情報は、前処理部2によって2値化されて雑
音除去の処理が施される。さらに、この2値化されて雑
音が除去された文字画像情報に基づいて文字切り出しが
行われると共に、正規化等の処理が施された後に認識部
3に出力される。認識部3では、前処理部2からの1文
字単位の画像情報に従って文字パターンの特徴パラメー
タが抽出され、この抽出された特徴パラメータと標準パ
ターンとのパターンマッチングが行われて入力文字の認
識が行われる。そして、認識結果が認識結果表示部4に
表示されると共に、誤認識されたリジェクト文字の修正
が行われる。制御部5は入力部1,前処理部2,認識部3お
よび認識結果表示部4を制御して、文字認識動作を実行
する。
第2図は第1図における前処理部2の詳細なブロック
図である。通信部21は、OCR本体の制御部5と情報を交
換するためのものであり、入力部1から入力されて制御
部5から送出された文字画像情報は通信部21を介して取
り込まれる。画像受信部22は、雑音除去部23および正規
化部24において後に述べるような画像処理を実行する際
に用いられるバッファであり、通信部21を介して取り込
まれた文字画像情報はこの画像受信部22に一旦格納され
る。
上記雑音除去部23は、文字画像情報における数ビット
以下の独立領域を消去して、汚れ等の雑音を除去する。
そして、文字切出部24は、雑音除去部23によって雑音が
除去された文字画像情報を1文字単位で切り出す。その
後、正規化部25は雑音が除去されて1文字単位に切り出
された文字画像情報に基づいて正規化処理を実行し、文
字の大きさ,傾き,位置および線幅等の変動を除去して
文字の大きさ等を一定にする。さらに、正規化部25は、
後に詳述するようにしてこの発明に係る特定文字判定処
理を実行する。そして、雑音除去部23あるいは正規化部
25によって所定の処理が行われた後の1文字単位の文字
画像情報は、通信部21を介して制御部5へ送出される。
第3図は上記正規化部25における特定文字判定処理に
係る部分の更に詳細なブロック図である。以下、第3図
に従ってこの発明に係る「一」,「1」および「−」等
の特定文字の判定処理について詳細に述べる。
上記通信部21を介して取り込まれ、雑音除去部23によ
って雑音が除去されて画像受信部22に格納された文字画
像情報は、正規化部25に読み込まれて幅/高さ抽出部25
1に入力される。この幅/高さ抽出部251においては、入
力された1文字単位の文字画像情報に基づいて、当該文
字の幅と高さが抽出される。そうすると、幅/高さ伸縮
部252は、幅/高さ抽出部251からの当該文字の幅の値と
高さの値とに基づいて、当該文字の幅と高さが所定の正
規化基準値になるように伸縮処理を行う。その際におけ
る伸縮処理は例えば次のようにして行う。すなわち、予
め設定した所定の大きさを有する矩形の枠に、当該文字
の上下および左右が共に接するように当該文字を縦方向
および横方向に伸縮するのである。
すなわち、伸縮処理が施された例えば特定文字「1」
の場合は、所定の幅になるまで横方向に引き伸ばされる
ために、上記矩形の枠が文字領域を構成する黒情報で十
分に満たされることになるのである。
上記幅/高さ抽出部251および幅/高さ伸縮部252によ
って実行される正規化処理は、従来からよく行われてい
る正規化処理である。
上記幅/高さ伸縮部252によって伸縮処理を施された
文字画像情報は文字枠面積算出部253および文字構成要
素数計測部254に出力される。文字枠面積算出部253は、
入力された文字画像情報に基づいて当該文字を囲む最小
矩形(すなわち、当該文字の上下および左右が共に接す
る矩形)の文字枠の面積wを算出する。一方、文字構成
要素数計測部254は、入力された文字画像情報に基づい
て文字領域を構成するビット数aを計測する。
そうすると、特定文字判定部255は、文字枠面積算出
部253からの文字枠の面積wの値と文字構成要素数計測
部254からの文字領域を構成するビット数aの値とに基
づいて、判定定数C=a/wを算出する。この判定定数C
は上記文字枠の面積に対する文字領域の面積を表し、そ
の値が大きいほど文字枠の面積と文字領域の面積とが略
等しく、文字枠は文字領域を構成する黒情報で十分に満
たされていることを表す。すなわち、判定定数Cの値が
ある閾値Θ以上になるような文字画像情報は、「一」,
「1」および「−」等の特定文字が幅/高さ伸縮部252
によって伸縮された文字画像情報であると言うことがで
きる。
この場合、画数の多い文字の場合は、文字画像情報に
対して幅/高さ伸縮部252によって伸縮処理が施されて
も、上記特定文字の場合のように文字枠が文字領域を構
成する黒情報で十分に満たされることはなく、判定定数
Cの値はある程度小さな値を示すために、上記特定文字
と識別することが容易である。そこで、特定文字判定部
255は、判定定数Cの値が上記閾値Θより大きい場合に
は、当該文字の認識カテゴリは「一」,「1」および
「−」等の特定文字であると判定するのである。
さらに、特定文字判定部255は、上記幅/高さ抽出部2
51で抽出された当該文字の幅の値と高さの値とに基づい
て、上述のようにして判定された特定文字が「1」およ
び「I」等の縦長の特定文字であるか「一」,「−」お
よび「ー」等の横長の特定文字であるかを識別するので
ある。
このようにして、入力文字が縦長の特定文字であるか
横長の特定文字であるかが特定文字判定部255によって
判定され、その判定結果が第2図における通信部21を介
して第1図における制御部5に出力される。そうする
と、上記特定文字に対する認識処理の必要がなくなるの
で、制御部5は認識部3に対して上記特定文字に対する
認識処理を実行しないように指示するのである。こうす
ることによって、特定文字に対する認識を高速、かつ、
正確に実施できるのである。
その際に、上記特定文字が傾きをもって書き込まれた
り印刷された場合には、上述の判定方法によっては特定
文字と判定されない恐れがある。そこで、他の文字の場
合と同様に予め「一」,「1」および「−」等の特定文
字の標準パターンも用意しておけば、認識部3によって
傾きをもった特定文字を認識することができる。
このように、本実施例の文字認識装置は、前処理部2
の正規化部25に、幅/高さ抽出部251,幅/高さ伸縮部25
2,文字枠面積算出部253,文字構成要素計測部254および
特定文字判定部255を備える。そして、幅/高さ伸縮部2
52によって入力文字の幅および高さを正規化する。そし
て、文字枠面積算出部253によって算出された当該文字
を囲む最小矩形の文字枠の面積wと文字構成要素計測部
254によって計測された当該文字を構成するビット数a
とに基づく判定定数C(=a/w)の値が、閾値Θより大
きい場合に、特定文字判定部255によって当該文字の認
識カテゴリは「一」,「1」および「−」等の特定文字
であると判定する。さらに、上記幅/高さ抽出部251に
よって抽出された当該文字の幅の値と高さの値とに基づ
いて、当該文字が縦長であるか横長であるかを特定文字
判定部255によって判定して、上記特定文字が縦長の特
定文字であるか横長の特定文字であるかを識別するよう
にしている。したがって、認識部3で実施されるパター
ンマッチングによる認識処理を行わずに、簡単な処理に
よって高速に上記特定文字を識別できる。また、幅およ
び高さが正規化された入力文字を構成するビット数に基
づく判定定数Cで上記特定文字を判定するので、確実に
上記特定文字を認識できる。
上記実施例においては、特定文字判定に係る文字枠面
積算出部253,文字構成要素計測部254および特定文字判
定部255を前処理部2の正規化部25に設けている。しか
しながら、この発明はこれに限定されるものではなく、
正規化部25と独立して設けてもよい。また、認識部3に
設けて認識処理の前処理として特定文字判定処理を実施
してもよい。
上記実施例においては、傾いた特定文字に対しては認
識部3で通常の認識処理によって認識するようにしてい
る。しかしながら、この発明はこれに限定されるもので
はない。すなわち、上記閾値Θの値より小さな値の閾値
Θを設け、この閾値Θに従って特定文字を判定(あ
る程度傾いた特定文字も含まれる)する。そして、上記
判定定数cの値がΘ≦C≦Θの範囲にある場合には、
その文字画像情報に対して正規化部25において回転正規
化を実施した後再度判定定数Cを算出する。その結果、
得られた判定定数Cの値C′がC′>Θとなる場合に当
該文字を上記特定文字であると確定するようにしてもよ
い。
<発明の効果> 以上より明らかなように、この発明の文字認識装置
は、文字枠面積算出部,文字構成要素数計測部および特
定文字判定部を備えて、幅/高さ抽出部および幅/高さ
伸縮部によって伸縮処理が行われた文字画像情報に基づ
いて、上記特定文字判定部によって、上記文字構成要素
数計測部で計測された文字構成要素数と上記文字枠面積
算出部で算出された入力文字の上下および左右が共に接
する矩形の文字枠の面積との比を求めて、この比の値が
所定の範囲内に入るような入力文字を「一」,「1」お
よび「−」等の特定文字と判定するようにしたので、パ
ターンマッチング等による認識処理を実行することな
く、簡単な処理によって、高速かつ正確に上記特定文字
を認識できる。
また、この発明の文字認識装置は、上記特定文字判定
部を、上記幅/高さ抽出部によって抽出された入力文字
の幅の値と高さの値とに基づいて、縦長の特定文字と横
長の特定文字とを識別するように成したので、縦長の特
定文字と横長の特定文字とを区別して上記特定文字を判
定でき、さらに正確に上記特定文字を認識できる。
【図面の簡単な説明】
第1図はこの発明に係る文字認識装置のブロック図、第
2図は第1図における前処理部の詳細なブロック図、第
3図は第2図における正規化部の特定文字判定処理に係
る部分の更に詳細なブロック図である。 1……入力部、2……前処理部、3……認識部、 4……認識結果表示部、5……制御部、21……通信部、 22……画像受信部、23……雑音除去部、 24……文字切出部、25……正規化部、 251……幅/高さ抽出部、252……幅/高さ伸縮部、 253……文字枠面積算出部、 254……文字構成要素数計測部、 255……特定文字判定部。
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.6,DB名) G06K 9/42 G06K 9/52

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】入力された文字画像情報に従って、入力文
    字の幅と高さを幅/高さ抽出部によって抽出し、この抽
    出された文字の幅の値と高さの値とに基づいて、入力文
    字の幅および高さが所定の値になるように幅/高さ伸縮
    部によって伸縮処理を行い、この伸縮処理が行われた文
    字画像情報に基づいて入力文字を認識する文字認識装置
    において、 上記伸縮処理が行われた文字画像情報に基づいて、入力
    文字の上下および左右が共に接する矩形の文字枠の面積
    を算出する文字枠面積算出部と、 上記伸縮処理が行われた文字画像情報に基づいて、入力
    文字の文字領域を構成する要素の数を計測する文字構成
    要素計測部と、 上記文字枠面積算出部からの文字枠面積の値と上記文字
    構成要素数計測部からの文字構成要素数とに基づいて、
    上記文字構成要素数と文字枠面積との比を求め、この文
    字構成要素数と文字枠面積との比の値が所定の範囲内に
    入るような入力文字を特定文字と判定する特定文字判定
    部を備えたことを特徴とする文字認識装置。
  2. 【請求項2】上記特定文字判定部は、上記幅/高さ抽出
    部によって抽出された入力文字の幅の値と高さの値とに
    基づいて、縦長の特定文字と横長の特定文字とを識別す
    るように成したことを特徴とする上記請求項1に記載の
    文字認識装置。
JP1122543A 1989-05-16 1989-05-16 文字認識装置 Expired - Lifetime JP2832035B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1122543A JP2832035B2 (ja) 1989-05-16 1989-05-16 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1122543A JP2832035B2 (ja) 1989-05-16 1989-05-16 文字認識装置

Publications (2)

Publication Number Publication Date
JPH02300988A JPH02300988A (ja) 1990-12-13
JP2832035B2 true JP2832035B2 (ja) 1998-12-02

Family

ID=14838475

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1122543A Expired - Lifetime JP2832035B2 (ja) 1989-05-16 1989-05-16 文字認識装置

Country Status (1)

Country Link
JP (1) JP2832035B2 (ja)

Also Published As

Publication number Publication date
JPH02300988A (ja) 1990-12-13

Similar Documents

Publication Publication Date Title
US6643401B1 (en) Apparatus and method for recognizing character
JP3453134B2 (ja) 複数の記号ストリングの等価性を判定する方法
JPH0772905B2 (ja) 記号列の認識方法
CN101855640B (zh) 尤其是用于移动无线设备的图像分析方法
EP0809205A2 (en) Character line detecting apparatus using simplified projection information and method thereof and character recognition apparatus thereof and method thereof
US4596038A (en) Method and apparatus for character recognition
JP2832035B2 (ja) 文字認識装置
JP2002245404A (ja) 領域切り出しプログラムおよび装置
JPH10162139A (ja) 画像処理装置、および画像処理プログラムを記録した媒体
JPS6316795B2 (ja)
JP3344062B2 (ja) カタカナ手書き文字切り出し回路
JP2788506B2 (ja) 文字認識装置
JP3074691B2 (ja) 文字認識装置
JP3391223B2 (ja) 文字認識装置
JP2993252B2 (ja) 同形異文字判別方法および装置
JP2902097B2 (ja) 情報処理装置及び文字認識装置
JP2902694B2 (ja) 光学式文字読取装置
JPH07141465A (ja) 文書画像の傾き検出方法
JP2972443B2 (ja) 文字認識装置
JP3009237B2 (ja) 特徴抽出方法
JP2918363B2 (ja) 文字分類方法及び文字認識装置
JPS6334682A (ja) 文字認識装置
JPS58165178A (ja) 文字読取り装置
JP2878327B2 (ja) 文字切り出し装置
JPH06251195A (ja) 文字位置推定方法

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080925

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080925

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090925

Year of fee payment: 11

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090925

Year of fee payment: 11