JP3238776B2 - 大分類辞書作成方法及び文字認識装置 - Google Patents

大分類辞書作成方法及び文字認識装置

Info

Publication number
JP3238776B2
JP3238776B2 JP01826693A JP1826693A JP3238776B2 JP 3238776 B2 JP3238776 B2 JP 3238776B2 JP 01826693 A JP01826693 A JP 01826693A JP 1826693 A JP1826693 A JP 1826693A JP 3238776 B2 JP3238776 B2 JP 3238776B2
Authority
JP
Japan
Prior art keywords
feature
large classification
category
value
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP01826693A
Other languages
English (en)
Other versions
JPH06231309A (ja
Inventor
利夫 宮澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP01826693A priority Critical patent/JP3238776B2/ja
Publication of JPH06231309A publication Critical patent/JPH06231309A/ja
Application granted granted Critical
Publication of JP3238776B2 publication Critical patent/JP3238776B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文字(記号、図形等を
含む)の認識技術に係り、特に、文字認識プロセスにお
いて認識結果候補を絞り込むための大分類の技術に関す
る。
【0002】
【従来の技術】帳票などに書かれている文字を認識する
装置は、イメージスキャナーなどで帳票上の文字の画像
を読み取り、その画像データの2値化データより特徴量
を抽出し、この特徴量と予め用意された認識辞書とのマ
ッチングによって文字を認識する。このマッチングは、
基本的には、認識辞書に登録されている各文字種の特徴
量と、入力文字の特徴量との距離計算によって行なわれ
るが、認識辞書に登録されている全文字種について順に
距離計算を行なうと、非常に長い処理時間を必要とす
る。
【0003】これを解決するには、認識辞書との特徴量
のマッチング(詳細マッチング)に先だって、大分類に
よって候補の絞り込みを行なうと効果がある。
【0004】この大分類に関して、文字種毎の特徴量の
平均値や最大値もしくは最小値を用いて、大分類のため
の特徴量範囲を算出する方法が知られている。
【0005】また、文字種別の特徴量の平均値及び分散
値の辞書と入力文字との不一致度を計算することによっ
て候補文字種を絞り込み(大分類)、候補に挙がった文
字種に関して、特徴量の次元毎に分散比を計算し、この
分散比を重み係数として用いて辞書との不一致度の再計
算を行なうことにより、最終的な候補文字種を決定する
方法が知られている(特公昭60−37957)。
【0006】
【発明が解決しようとする課題】従来、文字種別の平均
値等や特徴量範囲を計算する際に複数のフォントの特徴
量を一括して扱い、また、その特徴量分布を正規分布で
あると仮定している。
【0007】しかし、個々のフォント毎の特徴量分布は
正規分布と見做すことができるが、複数フォントを一緒
くたに扱ったのでは、かなり多くの文字種で特徴量分布
は複数のピークが生じる等、正規分布からのずれがかな
り大きくなる。かかる文字種については、正規分布を前
提として特徴量の平均値等や特徴量範囲を適切に計算す
ることができない。その結果、従来は、大分類で候補と
なるべき文字種が候補から漏れたり、あるいは不適当な
文字種が候補に挙がったりし、期待するような大分類を
達成できない場合が少なくなかった。
【0008】本発明は、かかる問題点を解決し、より確
実・効率的な大分類を達成する手段を提供しようとする
ものである。
【0009】
【課題を解決するための手段】本発明の大分類辞書作成
方法によれば、1文字種が複数のフォントから構成さ
れ、1文字種または類似した複数文字種の組を大分類の
1グループとし、グループ別に、各フォント毎に複数の
画像データより抽出された特徴量のデータから各文字種
の各フォント毎の特徴量をカテゴリー内特徴量として
算し、該カテゴリー内特徴量から各文字種毎の特徴量を
カテゴリー間特徴量として計算し、該カテゴリー間特徴
量及び該カテゴリー内特徴量から大分類のための特徴量
範囲を計算する。
【0010】より具体的には、カテゴリー内特徴量とし
て、各フォントの画像データより抽出された特徴量の分
布の平均値及び分散値を算出し、カテゴリー間特徴量と
してカテゴリー内平均値の分布の平均値もしくは中央値
及び分散値を計算する。そして、カテゴリー間分散値に
ある係数を乗じた値及びカテゴリー内分散値にある係数
を乗じた値をカテゴリー間平均値もしくは中央値に加減
算することによって、大分類のための特徴量範囲の上限
及び下限を求める。
【0011】また、本発明によれば改良された大分類手
段を備えた文字認識装置が提供される。この文字認識装
置は、前述の本発明の方法により予め求められた大分類
グループ別の特徴量範囲のデータを格納した大分類辞書
メモリと、入力した文字画像データより特徴量を抽出す
る特徴抽出部と、該特徴抽出部によって抽出された特徴
量と該大分類辞書メモリに格納された特徴量範囲とを比
較することにより候補グループを決定する大分類マッチ
ング部とを有する。
【0012】
【作用】本発明の方法は、カテゴリー毎の特徴量分布か
ら、グループ全体の特徴量の分布を推測する形をとって
いる。個々のフォントの特徴量分布は正規分布と見做す
ことができるので、カテゴリー内特徴量を必要な精度で
計算可能であり、このカテゴリー内特徴量から計算され
るカテゴリー間特徴量についても必要な精度を得られ
る。したがって、本発明の方法によれば、1文字種につ
いて多種類のフォントがある場合においても、大分類グ
ループ別の特徴量範囲を適切に決定し、従来よりも高精
度の大分類が可能な辞書を作成できる。
【0013】また、そのような大分類辞書を用いた本発
明の文字認識装置によれば、従来よりも確実・効率的な
大分類を達成することが可能で、結果として最終的な認
識率の向上を期待できる。
【0014】
【実施例】図1は、本発明の一実施例を示すブロック図
である。まず、大分類辞書の作成処理に関して説明す
る。
【0015】本実施例では、1文字種つまり一つの文字
コードがn種類のフォントから構成されるとする。ま
た、一つの文字コードを大分類の1グループとする。た
だし、類似した2以上の文字種の組を大分類グループと
してもよい。
【0016】大分類辞書を作成する場合、各フォント毎
に複数の文字画像データを入力し、それぞれの特徴量を
特徴抽出部1で抽出して特徴量メモリ2に格納する。
【0017】各文字コードのフォント毎の特徴量のある
次元の分布は、図2に模式的に示すように正規分布と見
做すことができる。カテゴリー内特徴量計算部3では、
各フォント毎の特徴量分布を正規分布と仮定して、文字
コード別に、各カテゴリー内特徴量を次元毎に計算す
る。本実施例では、各フォント(=カテゴリー)の特徴
量の次元毎の分布の平均値(クラス内平均)と分散値
(クラス内標準偏差)をカテゴリー内特徴量として算出
する。
【0018】カテゴリー間特徴量計算部4は、各文字コ
ードの次元毎のクラス内平均の分布を図3に示すような
正規分布と仮定して、文字コード別に、次元毎にクラス
内平均の平均値(クラス間平均)と分散値(クラス間標
準偏差)をカテゴリー間特徴量として算出する。なお、
クラス間平均に代えてクラス内平均の中央値などを求め
てもよい。
【0019】特徴量範囲計算部5は、図4に示すような
特徴量範囲の上限と下限を、各文字コードについて次元
毎に計算する。計算式は次のとおりである。
【0020】 上限=mean+k1×SD1+k3×SD2 (1) 下限=mean−k2×SD1+k4×SD2 (2) ただし、k1,k2は任意の値(例えば3)である。S
D1は当該グループについてのクラス間標準偏差であ
る。SD2は当該グループについて計算されたクラス内
標準偏差であるが、1グループ当たり複数のクラス内標
準偏差が求められているので、その代表値、例えば最大
値または平均値を計算に用いる。meanはクラス間平
均であるが、クラス内平均の中央値などを用いてもよ
い。
【0021】計算された各文字コードの次元毎の特徴量
範囲の上限及び下限のデータは大分類辞書メモリ6に格
納されるが、その際に、特徴量範囲計算部5において、
ある特定の1次元(例えば第1次元)の特徴量範囲の上
限または下限の値をキーとして文字コードのソートを行
なう。このようにして、ある次元の特徴量範囲の上限ま
たは下限の値の大きい順あるいは小さい順にソートされ
た大分類辞書がメモリ6上に作成される。
【0022】なお、画像データの特徴量の一部次元に限
定して、カテゴリー内特徴量、カテゴリー間特徴量及び
特徴量範囲を算出してもよい。
【0023】次に、文字認識処理に関して説明する。入
力した文字画像データの特徴量が特徴抽出部1で抽出さ
れて特徴量メモリ2に格納される。大分類マッチング部
7は、この特徴量と大分類辞書メモリ6内の特徴量範囲
データとを対応次元間で比較することによって、候補文
字コードを検索して出力する。この大分類マッチングは
様々な方法で行なうことが可能であるが、例えば、大分
類辞書作成時のソートのキーとして用いられた次元につ
いて最初に比較し、この次元について入力文字の特徴量
が特徴量範囲から外れているときは、当該文字コードの
残りの次元の比較を省略し、他の文字コードとのマッチ
ングを進む。そして、ある文字コードの特徴量範囲内
に、全次元(大分類辞書の作成の際に利用された次元の
み)が包含されるときに、その文字コードを候補文字コ
ードとする。詳細マッチング部8は、大分類で候補に挙
がった各文字コードに関して、認識辞書メモリ9内の特
徴量との詳細マッチングを行なって、最終的な認識結果
を得る。認識辞書の内容及び詳細マッチングの処理内容
は従来と同様でよい。
【0024】
【発明の効果】以上に説明した如く、本発明によれば、
正規分布と見做すことができる各フォント毎の特徴量よ
りカテゴリー内特徴量を高精度に計算し、このカテゴリ
ー内特徴量からカテゴリー間特徴量を計算し、両特徴量
に基づいて大分類のための特徴量範囲を計算することに
よって、多種類のフォントがある場合にも確実・効率的
な大分類が可能な大分類辞書を作成できる。
【0025】また、本発明によれば、文字認識装置の大
分類性能を高めることによって、最終的な認識率の向上
を図ることが可能である。
【図面の簡単な説明】
【図1】本発明の一実施例を示すブロック図である。
【図2】各フォント毎の特徴量分布とクラス平均を模式
的に示す。
【図3】クラス内平均の分布を模式的に示す。
【図4】特徴量範囲の計算方法の説明図である。
【符号の説明】
1 特徴抽出部 2 特徴量メモリ 3 カテゴリー内特徴量計算部 4 カテゴリー間特徴量計算部 5 特徴量範囲計算部 6 大分類辞書メモリ 7 大分類マッチング部 8 詳細マッチング部 9 認識辞書メモリ
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平2−138682(JP,A) 特開 昭60−142788(JP,A) 特開 平4−320592(JP,A) 特開 平4−111085(JP,A) 特開 平4−80891(JP,A) 特開 昭60−142787(JP,A) 特公 昭60−37957(JP,B2) (58)調査した分野(Int.Cl.7,DB名) G06K 9/62 - 9/68 JICSTファイル(JOIS)

Claims (4)

    (57)【特許請求の範囲】
  1. 【請求項1】 1文字種が複数のフォントから構成さ
    れ、1文字種または類似した複数文字種の組からなる大
    分類グループ別に、各フォント毎に複数の画像データよ
    り抽出された特徴量のデータから各文字種の各フォント
    毎の特徴量をカテゴリー内特徴量として計算し、該カテ
    ゴリー内特徴量から各文字種毎の特徴量をカテゴリー間
    特徴量として計算し、該カテゴリー間特徴量及び該カテ
    ゴリー内特徴量から大分類のための特徴量範囲を計算す
    る大分類辞書作成方法。
  2. 【請求項2】 カテゴリー内特徴量として各フォントの
    画像データより抽出された特徴量の平均値及び分散値を
    用い、カテゴリー間特徴量としてカテゴリー内平均値の
    平均値もしくは中央値及び分散値を用いることを特徴と
    する請求項1記載の大分類辞書作成方法。
  3. 【請求項3】 カテゴリー間分散値にある係数を乗じた
    値及びカテゴリー内分散値にある係数を乗じた値をカテ
    ゴリー間平均値もしくは中央値に加減算することによっ
    て、大分類のための特徴量範囲の上限及び下限を求める
    ことを特徴とする請求項2記載の大分類辞書作成方法。
  4. 【請求項4】 請求項3記載の方法により予め求められ
    た大分類グループ別の特徴量範囲のデータを格納した大
    分類辞書メモリと、入力した文字画像データより特徴量
    を抽出する特徴抽出部と、該特徴抽出部によって抽出さ
    れた特徴量と該大分類辞書メモリに格納された特徴量範
    囲とを比較することにより候補グループを決定する大分
    類マッチング部とを有することを特徴とする文字認識装
    置。
JP01826693A 1993-02-05 1993-02-05 大分類辞書作成方法及び文字認識装置 Expired - Lifetime JP3238776B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP01826693A JP3238776B2 (ja) 1993-02-05 1993-02-05 大分類辞書作成方法及び文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP01826693A JP3238776B2 (ja) 1993-02-05 1993-02-05 大分類辞書作成方法及び文字認識装置

Publications (2)

Publication Number Publication Date
JPH06231309A JPH06231309A (ja) 1994-08-19
JP3238776B2 true JP3238776B2 (ja) 2001-12-17

Family

ID=11966866

Family Applications (1)

Application Number Title Priority Date Filing Date
JP01826693A Expired - Lifetime JP3238776B2 (ja) 1993-02-05 1993-02-05 大分類辞書作成方法及び文字認識装置

Country Status (1)

Country Link
JP (1) JP3238776B2 (ja)

Also Published As

Publication number Publication date
JPH06231309A (ja) 1994-08-19

Similar Documents

Publication Publication Date Title
Kanai et al. Automated evaluation of OCR zoning
US4685142A (en) Method and device for handwritten letter recognition
US5369714A (en) Method and apparatus for determining the frequency of phrases in a document without document image decoding
Biswas et al. Writer identification of Bangla handwritings by radon transform projection profile
US5621818A (en) Document recognition apparatus
EP0432937B1 (en) Hand-written character recognition apparatus
EP2073146A1 (en) Pattern recognizing device for recognizing input pattern by using dictionary pattern
Soryani et al. Application of genetic algorithms to feature subset selection in a Farsi OCR
JP3238776B2 (ja) 大分類辞書作成方法及び文字認識装置
JP2556477B2 (ja) パタン照合装置
Duneau et al. On-line cursive script recognition: A user-adaptive system for word identification
KR900007727B1 (ko) 문자 인식 장치
CN109447058B (zh) 一种基于矩阵分块的残缺汉字识别方法
JP3207566B2 (ja) 文字認識方法
Sarfraz et al. Towards automatic recognition of fonts using genetic approach
Goraine et al. Recognition of typewritten Arabic characters in different fonts
Arica et al. One dimensional representation of two dimensional information for HMM based handwritten recognition
JP2917396B2 (ja) 文字認識方式
Thi et al. Combining Feature Extraction Methods and Principal Component Analysis for Recognition of Vietnamese Off-Line Handwritten Uppercase Accented Characters
JP3446769B2 (ja) 文字認識装置
JP3100786B2 (ja) 文字認識後処理方式
JP3281530B2 (ja) 文字認識装置
JPH081660B2 (ja) オンライン手書き図形認識装置
Ahmed et al. A novel intelligent system for defining similar symbols
JP2792063B2 (ja) 文字認識辞書作成方式

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071005

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081005

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081005

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091005

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101005

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111005

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121005

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131005

Year of fee payment: 12

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131005

Year of fee payment: 12