JPH0490084A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH0490084A
JPH0490084A JP2205230A JP20523090A JPH0490084A JP H0490084 A JPH0490084 A JP H0490084A JP 2205230 A JP2205230 A JP 2205230A JP 20523090 A JP20523090 A JP 20523090A JP H0490084 A JPH0490084 A JP H0490084A
Authority
JP
Japan
Prior art keywords
character
size
feature vector
pattern
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2205230A
Other languages
English (en)
Inventor
Tetsuomi Tanaka
哲臣 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2205230A priority Critical patent/JPH0490084A/ja
Priority to EP91307004A priority patent/EP0471472B1/en
Priority to DE69129284T priority patent/DE69129284T2/de
Publication of JPH0490084A publication Critical patent/JPH0490084A/ja
Priority to US08/317,841 priority patent/US5715336A/en
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は文字認識装置、特に特徴抽出方法に特徴を有す
る文字認識装置に関するものである。
[従来の技術] 第3A図は文字認識装置の概略構成を示すブロック図で
ある。11はCOD等の画像読み取り装置からの画像を
入力する画像入力部、12は入力された画像から文字領
域を分離する文字領域判別部、13は文字領域内の文字
を判別出来る大きさに分割して切り出す文字切り出し部
、14は切り出された文字パターンの特徴を抽出する特
徴抽出部、15は特徴抽出部14の特徴抽出と対応して
予め文字と特徴とを関連づけて記憶する辞書部、16は
特徴抽出部14からの特徴と辞書部15からの特徴とを
比較して、例えばその距離等から文字を判別して候補を
選び出すマツチング部、17は判別文字を文字コードで
出力する文字コード出力部である。
従来の文字認識装置における特徴抽出部14は第3B図
のように構成されている。Aは入力端であり、文字切出
し部13より文字パターンと大きさの情報とが入力され
る。31は正規化部であり、第4図に示すように各文字
画像はNXNの大きさに変換正規化される。32はスム
ージング部であり、第5図に示すように正規化画像の各
画素に3×3のフィルタをかけ、正規化によるひずみを
小さくする。33は特徴ベクトルカウント部であり、第
6図に示すようにNXNの正規化画像を4×4のブロッ
クに分割し、各ブロックの2x2のマスクにより方向指
数1〜4のヒストグラムをとる。Bは出力端であり、カ
ウント部33で得られた方向指数を特徴ベクトルとして
マツチング部16に出力する。制御部34は各段の入出
力制御を行なう。
[発明が解決しようとしている課題] しかしながら、上記従来例では、正規化部31において
文字パターンの大小に関係なく一定の大きさNXNに正
規化されてしまうため、変倍率が大きい場合に特徴ベク
トルが大きくひずんでしまう。具体的に説明すると、第
2図(a)に示すよりな3×3の画素があるとする。こ
の原画像の方向指数は、方向指数1が○、方向指数2が
2.方向指数3が0.方向指数4が2となる。これを第
2図(b)のように12X12に正規化すると、方向指
数1が18.方向指数2が2、方向指数3が18.方向
指数4が2となり、原画像の特徴を現わさなくなる。こ
れにスムージング処理を加えた場合が第2図(C)であ
り、方向指数1が6.方向指数2が8.方向指数3が6
、方向指数4が8となり改善はされるが、さらに変倍率
が高くなるとひずみが大きすぎ、しだいにスムージング
等では補正出来なくなる。
逆に、原画像が第2図(b)であり変倍率が1の場合は
、スムージングが改善ではなく特徴ベクトルのひずみを
大きくしてしまう。つまり、第2図(a)は小さいひし
形、第2図(b)は十字形という全く異なる画像によっ
て得られる特徴ベクトルが同じパターンになってしまう
また、縮小の場合にもひずみが生じてしまう。
すなわち、拡大するほどななめ方向成分が消えて縦、構
成分が増え、逆に縮小するほど縦、構成分が消えてなな
め成分が増える。これは、いかなるスムージングを行な
っても補正しきれない。
本発明は、前記従来の欠点を除去し、正規化やスムージ
ング等の処理による特徴ベクトルの劣化をなくし、高い
認識率を有する文字認識装置を提供する。
[課題を解決するための手段] この課題を解決するために、本発明の文字認識装置は、
入力された画像より文字領域を抽出して文字パターンの
切出しを行ない、切出された前記文字パターンから抽出
された特徴データと予め記憶された特徴データとのマツ
チングに基づいて、文字パターンを文字コードに変換す
る文字認識装置であって、 切り出された前記文字パターンのサイズに対応して複数
種類の正規化サイズを持つ正規化手段と、該正規化手段
により正規化されたパターンの特徴ベクトルを抽出する
特徴ベクトル抽出手段と、得られた前記特徴ベクトルを
前記文字パターンのサイズに対応して単位ベクトル化す
る特徴ベクトル正規化手段とを備える。
[作用] かかる構成によれば、文字パターンの正規化時にパター
ンのサイズにより正規化サイズを変化させ、得られた特
徴ベクトルを前述の分類情報から正規化することにより
、原文字パターンに近い特徴ベクトルを得ることが出来
るため、認識率の向上がはかれる。
[実施例] 以下、添付図面に従って、本発明の詳細な説明する。
〈実施例1〉 第1図は本実施例の特徴抽出部の構成を示すブロック図
である。Aは従来例同様の文字画像および文字切り情報
入力端、1は入力端Aからの文字切り情報を受けて分類
し、サイズ情報を発生する正規化サイズ分類部、2は制
御部5からの制御信号により正規化サイズを変えて入力
端Aからの文字画像を正規化する文字画像正規化部、3
は文字画像正規化部2で得られた正規化画像に対してブ
ロック化を行ない、ブロックごとの方向指数をカウント
する方向指数カウント部、4は方向指数カウント部3で
得られた方向指数を画像正規化サイズに応じて変倍し、
特徴ベクトルを出力するベクトル正規化部、Bは得られ
たベクトルを次段のマツチング部に出力する特徴ベクト
ル出力端である。5は図示しないCPU、ROM。
RAMから成り全体の制御を行なう制御部である。
まず、入力端Aより、前出の第2図(a)および(b)
の画像がそれぞれ入力されたとする。正規化サイズIと
して3.サイズ■として12を持っていたとすると、正
規化サイズ分類部1では、第2図(a)の画像はサイズ
II 、第2図(b)の画像はサイズIIと分類し、サ
イズ情報を後述の制御部5へ送る。文字画像正規化部2
では制御部5よりの制御信号と入力端よりの文字画像お
よび文字切り情報とを受け、サイズを変えて画像の正規
化を行ない、正規化された文字パターンを方向指数カウ
ント部3に出力する。本例の場合、各画像サイズに等し
い正規化サイズがあるため、第2図(a)、(b)の画
像がそのまま出力される。
方向指数カウント部3は正規化文字パターンを受けて方
向指数をカウントする。ここで、説明の簡略化のためブ
ロック分割しないとすると、第2図(a)の画像の方向
指数は、方向指数lがO1方向指数2は2.方向指数3
は0.方向指数4は2となり、第2図(b)の画像の方
向指数はそれぞれ18.2,18.2となる0次に、ベ
クトル正規化部4において、基準値に対する比で方向指
数カウント部3で求められた方向指数を正規化する。各
正規化サイズに対する方向指数(2x2のマスク)の個
数は、(サイズ+1)2となる。これをブロック分割し
た場合は各ブロック当り((サイズ+1)/ブロック分
割数)2個の方向指数となる。ここで、4×4のときは
ブロック分割数には4がはいる。通常は(正規化サイズ
+1)をブロック分割数のn倍(nは自然数)に選ぶと
ブロック分割しやすくなる。よって、正規化サイズ=n
x(ブロック分割数)−1(n=1.2,3.・・・)
となる。
正規化サイズをこれを基準に複数えらべば、ブロック分
割しやすいためハード化もしやすい。
説明を簡略化するため、ブロック分割数とIXIとする
と、サイズ■では16.サイズIIでは169となる。
ここで、仮に基準値を169(サイズII )とすると
、 得られた係数を、それぞれの方向指数にかけることによ
って、第2図(a)の画像の特徴ベクトルは、それぞれ
0.10.6.0.10.6となり、第2図(b)の画
像では18,2,18.2となる。このように、本実施
例では原画像に近い比率の特徴ベクトルを得ることが出
来る。得られた特徴ベクトルを出力端Bよりマツチング
部16に出力する。制御部5はサイズのコントロールと
各段の入出力制御を行なう。
〈実施例2〉 第7図、第8図は第2の実施例であり、実施例1にぼか
し処理部6が加わった例である。
ぼかし処理とは、例えば4×4ブロツクの特徴ベクトル
を求めるために、−反方向指数カウント部3において7
×7ブロツクで方向指数をカウントし、その7×7をガ
ウスフィルタ(尚、第10図(a)にガウスフィルタの
例を示す)をかけることによって、4X4ブロツクの特
徴ベクトルを求める処理である。
〈実施例3〉 第9図は第3の実施例であり、実施例1のベクトル正規
化部4をベクトル正規化とぼかし処理とを同時に実行す
るベクトル正規化ぼかし処理部7に置き代えた例である
ぼかし処理とは、第10図(a)に示すような係数をも
つフィルタ処理である。そこで、本実施例では、第10
図(b)〜(d)のようにこのフィルタ係数に各ベクト
ル正規化係数をかけたテーブルを各正規化サイズごとに
持つことで、実施例2のようにベクトル正規化とばかし
との処理を1回の処理ですますことが出来る。
[発明の効果コ 本発明により、正規化やスムージング等の処理による特
徴ベクトルの劣化をなくし、高い認識率を有する文字認
識装置を提供できる。
すなわち、文字画像の大きさによらず、原文字画像に近
い特徴ベクトルが得られるため、認識率の向上がはかれ
る。更に、文字画像サイズのまま方向指数をカウントし
てその後変倍しても同様の効果があるが、正規化サイズ
をブロック分けの倍数で選定すると正規化サイズがほぼ
固定なため、ハード化しやすく高速化しやすい。
【図面の簡単な説明】
第1図は特徴抽出部の第1の実施例の構成を示すブロッ
ク図、 第2図は文字画像の単一サイズの正規化あるいはスムー
ジングによるパターンのひずみを説明する図、 第3A図は文字認識装置の構成を示すブロック図、 第3B図は従来の特徴抽出部の構成を示す第5図はスム
ージング処理を示す図、 第6図は方向指数の抽出処理を示す図、第7図、第8図
は特徴抽出部の第2の実施例の構成を示すブロック図、 第9図は特徴抽出部の第3の実施例の構成を示すブロッ
ク図、 第10図(a)〜(d)はフィルタ係数を説明する図で
ある。 図中、A・・・文字画像及び文字切り情報入力端、B・
・・特徴ベクトル出力端、1・・・正規化サイズ分類部
、2・・・文字画像正規化部、3・・・方向指数カウン
ト部、4・・・ベクトル正規化部、5・・・制御部、1
1・・・画像入力部、12・・・文字領域判別部、13
・・・文字切り出し部、14・・・特徴抽出部、15・
・・辞書部、16・・・マツチング部、17・・・文字
コード出力部である。

Claims (1)

  1. 【特許請求の範囲】 入力された画像より文字領域を抽出して文字パターンの
    切出しを行ない、切出された前記文字パターンから抽出
    された特徴データと予め記憶された特徴データとのマッ
    チングに基づいて、文字パターンを文字コードに変換す
    る文字認識装置であつて、 切り出された前記文字パターンのサイズに対応して複数
    種類の正規化サイズを持つ正規化手段と、 該正規化手段により正規化されたパターンの特徴ベクト
    ルを抽出する特徴ベクトル抽出手段と、 得られた前記特徴ベクトルを前記文字パターンのサイズ
    に対応して単位ベクトル化する特徴ベクトル正規化手段
    とを備えることを特徴とする文字認識装置。
JP2205230A 1990-08-03 1990-08-03 文字認識装置 Pending JPH0490084A (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2205230A JPH0490084A (ja) 1990-08-03 1990-08-03 文字認識装置
EP91307004A EP0471472B1 (en) 1990-08-03 1991-07-31 Image processing method and apparatus therefor
DE69129284T DE69129284T2 (de) 1990-08-03 1991-07-31 Gerät und Verfahren zur Bildverarbeitung
US08/317,841 US5715336A (en) 1990-08-03 1994-10-04 Character recognition method and apparatus that re-inputs image data at a second resolution derived from the character size and a selected normalization size

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2205230A JPH0490084A (ja) 1990-08-03 1990-08-03 文字認識装置

Publications (1)

Publication Number Publication Date
JPH0490084A true JPH0490084A (ja) 1992-03-24

Family

ID=16503563

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2205230A Pending JPH0490084A (ja) 1990-08-03 1990-08-03 文字認識装置

Country Status (1)

Country Link
JP (1) JPH0490084A (ja)

Similar Documents

Publication Publication Date Title
US7054485B2 (en) Image processing method, apparatus and system
JP4077094B2 (ja) カラー文書画像認識装置
JPH05225378A (ja) 文書画像の領域分割システム
KR100439697B1 (ko) 컬러 영상 처리 방법 및 그 장치
CN111080723A (zh) 基于Unet网络的图像元素分割方法
CN110688998A (zh) 票据识别方法及装置
EP0471472B1 (en) Image processing method and apparatus therefor
US6983071B2 (en) Character segmentation device, character segmentation method used thereby, and program therefor
JPH0490084A (ja) 文字認識装置
JP2840485B2 (ja) 画像処理方法及び装置
JPH07160824A (ja) 文字認識装置
JPH08101880A (ja) 文字認識装置
JP3115075B2 (ja) 読取装置
Pietikäinen et al. Nonparametric texture analysis with simple spatial operators
Gebretinsae Video-based finger spelling recognition for Ethiopian sign language using center of mass and finite state of automata
KR950011065B1 (ko) 문자 인식방법
JP2917396B2 (ja) 文字認識方式
JP3277977B2 (ja) 文字認識方法
JPS63150783A (ja) 文字認識装置
JPH04339471A (ja) 画像領域識別装置
Mony et al. A Novel Edge Detection Method on the Effect of Illumination for Reducing Noise on a Color Image
JPH11175659A (ja) 文字認識装置
JPH10240868A (ja) 文字読取装置
JPH0644404A (ja) 印刷物の検査装置
JPH08315079A (ja) 文字認識装置及び文字認識方法