JP3238776B2 - 大分類辞書作成方法及び文字認識装置 - Google Patents
大分類辞書作成方法及び文字認識装置Info
- Publication number
- JP3238776B2 JP3238776B2 JP01826693A JP1826693A JP3238776B2 JP 3238776 B2 JP3238776 B2 JP 3238776B2 JP 01826693 A JP01826693 A JP 01826693A JP 1826693 A JP1826693 A JP 1826693A JP 3238776 B2 JP3238776 B2 JP 3238776B2
- Authority
- JP
- Japan
- Prior art keywords
- feature
- large classification
- category
- value
- character
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Landscapes
- Character Discrimination (AREA)
Description
含む)の認識技術に係り、特に、文字認識プロセスにお
いて認識結果候補を絞り込むための大分類の技術に関す
る。
装置は、イメージスキャナーなどで帳票上の文字の画像
を読み取り、その画像データの2値化データより特徴量
を抽出し、この特徴量と予め用意された認識辞書とのマ
ッチングによって文字を認識する。このマッチングは、
基本的には、認識辞書に登録されている各文字種の特徴
量と、入力文字の特徴量との距離計算によって行なわれ
るが、認識辞書に登録されている全文字種について順に
距離計算を行なうと、非常に長い処理時間を必要とす
る。
のマッチング(詳細マッチング)に先だって、大分類に
よって候補の絞り込みを行なうと効果がある。
平均値や最大値もしくは最小値を用いて、大分類のため
の特徴量範囲を算出する方法が知られている。
値の辞書と入力文字との不一致度を計算することによっ
て候補文字種を絞り込み(大分類)、候補に挙がった文
字種に関して、特徴量の次元毎に分散比を計算し、この
分散比を重み係数として用いて辞書との不一致度の再計
算を行なうことにより、最終的な候補文字種を決定する
方法が知られている(特公昭60−37957)。
値等や特徴量範囲を計算する際に複数のフォントの特徴
量を一括して扱い、また、その特徴量分布を正規分布で
あると仮定している。
正規分布と見做すことができるが、複数フォントを一緒
くたに扱ったのでは、かなり多くの文字種で特徴量分布
は複数のピークが生じる等、正規分布からのずれがかな
り大きくなる。かかる文字種については、正規分布を前
提として特徴量の平均値等や特徴量範囲を適切に計算す
ることができない。その結果、従来は、大分類で候補と
なるべき文字種が候補から漏れたり、あるいは不適当な
文字種が候補に挙がったりし、期待するような大分類を
達成できない場合が少なくなかった。
実・効率的な大分類を達成する手段を提供しようとする
ものである。
方法によれば、1文字種が複数のフォントから構成さ
れ、1文字種または類似した複数文字種の組を大分類の
1グループとし、グループ別に、各フォント毎に複数の
画像データより抽出された特徴量のデータから各文字種
の各フォント毎の特徴量をカテゴリー内特徴量として計
算し、該カテゴリー内特徴量から各文字種毎の特徴量を
カテゴリー間特徴量として計算し、該カテゴリー間特徴
量及び該カテゴリー内特徴量から大分類のための特徴量
範囲を計算する。
て、各フォントの画像データより抽出された特徴量の分
布の平均値及び分散値を算出し、カテゴリー間特徴量と
してカテゴリー内平均値の分布の平均値もしくは中央値
及び分散値を計算する。そして、カテゴリー間分散値に
ある係数を乗じた値及びカテゴリー内分散値にある係数
を乗じた値をカテゴリー間平均値もしくは中央値に加減
算することによって、大分類のための特徴量範囲の上限
及び下限を求める。
段を備えた文字認識装置が提供される。この文字認識装
置は、前述の本発明の方法により予め求められた大分類
グループ別の特徴量範囲のデータを格納した大分類辞書
メモリと、入力した文字画像データより特徴量を抽出す
る特徴抽出部と、該特徴抽出部によって抽出された特徴
量と該大分類辞書メモリに格納された特徴量範囲とを比
較することにより候補グループを決定する大分類マッチ
ング部とを有する。
ら、グループ全体の特徴量の分布を推測する形をとって
いる。個々のフォントの特徴量分布は正規分布と見做す
ことができるので、カテゴリー内特徴量を必要な精度で
計算可能であり、このカテゴリー内特徴量から計算され
るカテゴリー間特徴量についても必要な精度を得られ
る。したがって、本発明の方法によれば、1文字種につ
いて多種類のフォントがある場合においても、大分類グ
ループ別の特徴量範囲を適切に決定し、従来よりも高精
度の大分類が可能な辞書を作成できる。
明の文字認識装置によれば、従来よりも確実・効率的な
大分類を達成することが可能で、結果として最終的な認
識率の向上を期待できる。
である。まず、大分類辞書の作成処理に関して説明す
る。
コードがn種類のフォントから構成されるとする。ま
た、一つの文字コードを大分類の1グループとする。た
だし、類似した2以上の文字種の組を大分類グループと
してもよい。
に複数の文字画像データを入力し、それぞれの特徴量を
特徴抽出部1で抽出して特徴量メモリ2に格納する。
次元の分布は、図2に模式的に示すように正規分布と見
做すことができる。カテゴリー内特徴量計算部3では、
各フォント毎の特徴量分布を正規分布と仮定して、文字
コード別に、各カテゴリー内特徴量を次元毎に計算す
る。本実施例では、各フォント(=カテゴリー)の特徴
量の次元毎の分布の平均値(クラス内平均)と分散値
(クラス内標準偏差)をカテゴリー内特徴量として算出
する。
ードの次元毎のクラス内平均の分布を図3に示すような
正規分布と仮定して、文字コード別に、次元毎にクラス
内平均の平均値(クラス間平均)と分散値(クラス間標
準偏差)をカテゴリー間特徴量として算出する。なお、
クラス間平均に代えてクラス内平均の中央値などを求め
てもよい。
特徴量範囲の上限と下限を、各文字コードについて次元
毎に計算する。計算式は次のとおりである。
D1は当該グループについてのクラス間標準偏差であ
る。SD2は当該グループについて計算されたクラス内
標準偏差であるが、1グループ当たり複数のクラス内標
準偏差が求められているので、その代表値、例えば最大
値または平均値を計算に用いる。meanはクラス間平
均であるが、クラス内平均の中央値などを用いてもよ
い。
範囲の上限及び下限のデータは大分類辞書メモリ6に格
納されるが、その際に、特徴量範囲計算部5において、
ある特定の1次元(例えば第1次元)の特徴量範囲の上
限または下限の値をキーとして文字コードのソートを行
なう。このようにして、ある次元の特徴量範囲の上限ま
たは下限の値の大きい順あるいは小さい順にソートされ
た大分類辞書がメモリ6上に作成される。
定して、カテゴリー内特徴量、カテゴリー間特徴量及び
特徴量範囲を算出してもよい。
力した文字画像データの特徴量が特徴抽出部1で抽出さ
れて特徴量メモリ2に格納される。大分類マッチング部
7は、この特徴量と大分類辞書メモリ6内の特徴量範囲
データとを対応次元間で比較することによって、候補文
字コードを検索して出力する。この大分類マッチングは
様々な方法で行なうことが可能であるが、例えば、大分
類辞書作成時のソートのキーとして用いられた次元につ
いて最初に比較し、この次元について入力文字の特徴量
が特徴量範囲から外れているときは、当該文字コードの
残りの次元の比較を省略し、他の文字コードとのマッチ
ングを進む。そして、ある文字コードの特徴量範囲内
に、全次元(大分類辞書の作成の際に利用された次元の
み)が包含されるときに、その文字コードを候補文字コ
ードとする。詳細マッチング部8は、大分類で候補に挙
がった各文字コードに関して、認識辞書メモリ9内の特
徴量との詳細マッチングを行なって、最終的な認識結果
を得る。認識辞書の内容及び詳細マッチングの処理内容
は従来と同様でよい。
正規分布と見做すことができる各フォント毎の特徴量よ
りカテゴリー内特徴量を高精度に計算し、このカテゴリ
ー内特徴量からカテゴリー間特徴量を計算し、両特徴量
に基づいて大分類のための特徴量範囲を計算することに
よって、多種類のフォントがある場合にも確実・効率的
な大分類が可能な大分類辞書を作成できる。
分類性能を高めることによって、最終的な認識率の向上
を図ることが可能である。
的に示す。
Claims (4)
- 【請求項1】 1文字種が複数のフォントから構成さ
れ、1文字種または類似した複数文字種の組からなる大
分類グループ別に、各フォント毎に複数の画像データよ
り抽出された特徴量のデータから各文字種の各フォント
毎の特徴量をカテゴリー内特徴量として計算し、該カテ
ゴリー内特徴量から各文字種毎の特徴量をカテゴリー間
特徴量として計算し、該カテゴリー間特徴量及び該カテ
ゴリー内特徴量から大分類のための特徴量範囲を計算す
る大分類辞書作成方法。 - 【請求項2】 カテゴリー内特徴量として各フォントの
画像データより抽出された特徴量の平均値及び分散値を
用い、カテゴリー間特徴量としてカテゴリー内平均値の
平均値もしくは中央値及び分散値を用いることを特徴と
する請求項1記載の大分類辞書作成方法。 - 【請求項3】 カテゴリー間分散値にある係数を乗じた
値及びカテゴリー内分散値にある係数を乗じた値をカテ
ゴリー間平均値もしくは中央値に加減算することによっ
て、大分類のための特徴量範囲の上限及び下限を求める
ことを特徴とする請求項2記載の大分類辞書作成方法。 - 【請求項4】 請求項3記載の方法により予め求められ
た大分類グループ別の特徴量範囲のデータを格納した大
分類辞書メモリと、入力した文字画像データより特徴量
を抽出する特徴抽出部と、該特徴抽出部によって抽出さ
れた特徴量と該大分類辞書メモリに格納された特徴量範
囲とを比較することにより候補グループを決定する大分
類マッチング部とを有することを特徴とする文字認識装
置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP01826693A JP3238776B2 (ja) | 1993-02-05 | 1993-02-05 | 大分類辞書作成方法及び文字認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP01826693A JP3238776B2 (ja) | 1993-02-05 | 1993-02-05 | 大分類辞書作成方法及び文字認識装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH06231309A JPH06231309A (ja) | 1994-08-19 |
JP3238776B2 true JP3238776B2 (ja) | 2001-12-17 |
Family
ID=11966866
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP01826693A Expired - Lifetime JP3238776B2 (ja) | 1993-02-05 | 1993-02-05 | 大分類辞書作成方法及び文字認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3238776B2 (ja) |
-
1993
- 1993-02-05 JP JP01826693A patent/JP3238776B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JPH06231309A (ja) | 1994-08-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Kanai et al. | Automated evaluation of OCR zoning | |
US4685142A (en) | Method and device for handwritten letter recognition | |
US5369714A (en) | Method and apparatus for determining the frequency of phrases in a document without document image decoding | |
Biswas et al. | Writer identification of Bangla handwritings by radon transform projection profile | |
US5621818A (en) | Document recognition apparatus | |
EP0432937B1 (en) | Hand-written character recognition apparatus | |
EP2073146A1 (en) | Pattern recognizing device for recognizing input pattern by using dictionary pattern | |
Soryani et al. | Application of genetic algorithms to feature subset selection in a Farsi OCR | |
JP3238776B2 (ja) | 大分類辞書作成方法及び文字認識装置 | |
JP2556477B2 (ja) | パタン照合装置 | |
Duneau et al. | On-line cursive script recognition: A user-adaptive system for word identification | |
KR900007727B1 (ko) | 문자 인식 장치 | |
CN109447058B (zh) | 一种基于矩阵分块的残缺汉字识别方法 | |
JP3207566B2 (ja) | 文字認識方法 | |
Sarfraz et al. | Towards automatic recognition of fonts using genetic approach | |
Goraine et al. | Recognition of typewritten Arabic characters in different fonts | |
Arica et al. | One dimensional representation of two dimensional information for HMM based handwritten recognition | |
JP2917396B2 (ja) | 文字認識方式 | |
Thi et al. | Combining Feature Extraction Methods and Principal Component Analysis for Recognition of Vietnamese Off-Line Handwritten Uppercase Accented Characters | |
JP3446769B2 (ja) | 文字認識装置 | |
JP3100786B2 (ja) | 文字認識後処理方式 | |
JP3281530B2 (ja) | 文字認識装置 | |
JPH081660B2 (ja) | オンライン手書き図形認識装置 | |
Ahmed et al. | A novel intelligent system for defining similar symbols | |
JP2792063B2 (ja) | 文字認識辞書作成方式 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20071005 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081005 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081005 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091005 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101005 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111005 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121005 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131005 Year of fee payment: 12 |
|
EXPY | Cancellation because of completion of term | ||
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131005 Year of fee payment: 12 |