JPH06348903A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH06348903A
JPH06348903A JP16743493A JP16743493A JPH06348903A JP H06348903 A JPH06348903 A JP H06348903A JP 16743493 A JP16743493 A JP 16743493A JP 16743493 A JP16743493 A JP 16743493A JP H06348903 A JPH06348903 A JP H06348903A
Authority
JP
Japan
Prior art keywords
classification
correlation coefficient
result
categories
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP16743493A
Other languages
English (en)
Inventor
Shoji Shimomura
昭二 下村
Yasuo Hongo
保夫 本郷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fuji Electric Co Ltd
Fuji Facom Corp
Original Assignee
Fuji Electric Co Ltd
Fuji Facom Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Electric Co Ltd, Fuji Facom Corp filed Critical Fuji Electric Co Ltd
Priority to JP16743493A priority Critical patent/JPH06348903A/ja
Publication of JPH06348903A publication Critical patent/JPH06348903A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Image Analysis (AREA)
  • Character Discrimination (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

(57)【要約】 【目的】 大分類処理結果を用いて詳細分類処理結果を
補正することにより認識精度を向上する。 【構成】 入力文字画像から抽出した特徴を、大分類回
路5において類似度演算をしてN個の候補カテゴリを求
め、類似度に応じてソートする。さらに、N個の候補カ
テゴリを詳細分類回路9において、詳細に類似度演算を
して類似度に応じて再度ソートする。これらのソート結
果を、データバス15を介してCPU13が読み込む。
CPU13は、読み込んだ大分類処理結果と詳細分類処
理結果との相関係数ρxy Mを求める。ここで、相関係数
ρxy Mと、相関係数テーブルメモリ14に予め記憶され
ているカテゴリごとの相関係数ρxy (l)との差を求め、
さらに得られた差と予め設定されている相関係数の許容
誤差εと比較し、詳細分類の処理結果のソート順位を補
正し認識結果とする。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、光学的に入力された文
字画像を認識して文字コードに変換する文字認識装置
(OCR)に関する。
【0002】
【従来の技術】従来の文字認識装置では、パターンマッ
チングを用いて文字を認識することが多い。図4はパタ
ーンマッチングによる文字認識の処理概要を示すフロー
チャートである。図において、最初に文字画像が入力さ
れると(S41)、正規化処理(S42)として文字画
像の幾何学的変換を行い、入力画像の位置ズレやサイズ
の違いを補正する。
【0003】次に入力画像の特徴を抽出し(S43)、
その特徴量を標準パターンと比較して大分類処理を行う
(S44)。この標準パターンとは、各カテゴリごとに
収集した複数のサンプルに対して、特徴抽出を行い、そ
の特徴量に平均化等の処理をしてつくられるものであ
り、各カテゴリに対して少なくとも1つ以上の標準パタ
ーンが予め用意されている。大分類処理の結果は、その
まま認識結果とするのではなく、入力文字に対する類似
度の高い標準パターンをN個抽出して、認識候補カテゴ
リとする。
【0004】この候補カテゴリに対し、次の詳細分類処
理(S45)で精度の高いパターンマッチングを行い、
類似度が第1位となった候補カテゴリを認識結果として
出力する(S46)。このように従来の認識処理では分
類を2段階にし、詳細分類で密な特徴量(高次特徴)に
よるパターンマッチングを行う前に、大分類として比較
的粗な特徴量(低次特徴)を用いてパターンマッチング
を行うことにより、文字認識の処理速度を高速にしてい
る。
【0005】つまり、認識対象のカテゴリが数千にもお
よぶ漢字の認識では、計算量の少ない低次特徴のパター
ンマッチングにより、数千のカテゴリの中からN個の候
補カテゴリに絞り込み、次いでN個の候補カテゴリにつ
いてのみ演算量が多い高次特徴によるパターンマッチン
グを行う。それにより、認識精度を落とすことなく処理
の高速化が可能になる。
【0006】
【発明が解決しようとする課題】ところで上述した2段
階による分類では、大分類が単に処理速度を向上させる
ためだけに機能しており、認識精度の向上については何
等利用されていない。つまり、大分類の処理結果と詳細
分類の処理結果との間には相関関係を有する場合が多く
あるにもかかわらず、大分類の処理結果が詳細分類には
活用されずにむだに捨てられているのが実情である。本
発明は上記の点に鑑みてなされたもので、その目的とす
るところは、大分類処理による認識結果を詳細分類の認
識結果にも利用することにより認識精度を向上すること
ができる文字認識装置を提供することにある。
【0007】
【課題を解決するための手段】上記目的を達成するため
に、本発明は、入力された文字画像を正規化してから特
徴を抽出し、その特徴について大分類処理をして予め定
められたL個の認識対象カテゴリの中のN個のカテゴリ
を選び出し、さらに詳細分類処理をしてその中の1つを
選択するパターンマッチング方式の文字認識装置におい
て、大分類処理により得られたN個のカテゴリ順位を変
量xiとし、詳細分類処理により得られたN個のカテゴ
リ順位を変量yiとし、両変量間の相関係数ρxyを求め
る手段と、カテゴリごとに標準パターンを作成するとき
に用いた文字サンプルより予め求めて記憶しておいた相
関係数ρxy lと前記未知文字についての相関係数ρxy
を比較し、両者の差の小さい順に詳細分類処理結果のカ
テゴリ順位をソートして補正する手段とを備えたことを
特徴とする。
【0008】
【作用】本発明においては、大分類処理により得られた
N個の候補カテゴリ順位が変量xiとされ、同様にして
詳細分類処理により得られたN個の候補カテゴリ順位が
変量yiとされ、両変量についての相関係数ρxyが求め
られる。次に、カテゴリごとに標準パターンを作成する
ときに用いた文字サンプルより予め求めて記憶しておい
た相関係数ρxy lと前記未知文字についての相関係数ρ
xyとが比較され、両者の差の小さい順に詳細分類処理結
果のカテゴリ順位がソートされて補正される。
【0009】
【実施例】初めに、本発明における処理の概要を説明す
る。本発明では、認識精度を向上させるため大分類の処
理結果と詳細分類の処理結果との相関関係を利用する。
ここでは、両者の相関関係に関して統計における相関係
数を導入して表すようにした。それには、大分類および
詳細分類の処理結果をそれぞれ変量xi、yiとして表
す。
【0010】また、入力文字Mに対して、大分類処理に
よりN個の候補カテゴリが得られるものとすると、分類
の過程においてN個の候補カテゴリは、1位からN位ま
での順位が付けられる。この順位に従い、各候補カテゴ
リに0からN−1の整数を順に割り付ける。さらに、大
分類の処理結果を表す変量xiを次式のように定義す
る。
【0011】
【数1】xi=i−1
【0012】ここで、iは1からNまでの順位であり、
iは第i位の候補カテゴリに割り付けられた値であ
る。同様に、詳細分類の処理結果を表す変量yiについ
ても次式のように定義する。
【0013】
【数2】yi=i−1
【0014】これら2つの変量の相関係数ρxyは次式に
より求められる。
【0015】
【数3】
【0016】ここでσxyは共分散であり、次式により求
められる。
【0017】
【数4】
【0018】この数式中のμx、μyはそれぞれ次式によ
り求められる。
【0019】
【数5】
【0020】
【数6】
【0021】また、σx,σyはともに分散であり、それ
ぞれ次式により求められる。
【0022】
【数7】
【0023】
【数8】
【0024】このように定義された相関係数を、標準パ
ターンを作成するときに用いた文字サンプルについてカ
テゴリごとに予め求めておく。これをρxy (l)とする。
lは個々のカテゴリを表す添字である。また、ある未知
の入力文字についての大分類と詳細分類の処理結果から
得られた相関係数をρxy Mとする。これらの相関係数ρ
xy Mとρxy (l)を用いることにより、詳細分類の処理結果
を補正して認識精度を向上させる。
【0025】以下、図に沿って本発明の実施例の具体的
な処理を説明する。図1は本発明に係る実施例の構成を
示すブロック図である。図において、入力文字画像はイ
メージスキャナ1に読み取られて、文字画像メモリ2へ
いったん記憶される。次いで、入力文字画像は正規化回
路3へ送られて正規化され、さらに特徴抽出回路4へ送
られて大分類用特徴と詳細分類用特徴とが抽出され、そ
れぞれ大分類回路5および詳細分類回路9へ送られる。
【0026】大分類回路5では、大分類用類似度演算回
路6において、送られた大分類用特徴と大分類用標準パ
ターンとの類似度を求める演算が行われる。大分類用標
準パターンは、カテゴリごとに用意されており、大分類
用標準パターンメモリ8に記憶されている。ここでカテ
ゴリ数がNk個である場合は、類似度演算がNk回実行
される。求められたNk個の類似度は大分類用ソーティ
ング回路7に送られてから降順にソートされ、第1位か
ら第N位までのN個の候補カテゴリが求められる。
【0027】同様に、詳細分類回路9では、詳細分類用
類似度演算回路10において、送られた詳細分類用特徴
とN個の候補カテゴリの詳細分類用標準パターンとの類
似度が求められ、さらに詳細分類用ソーティング回路1
1で降順にソートされて詳細分類処理結果となる。な
お、詳細分類用標準パターンは、詳細分類用標準パター
ンメモリ12に記憶されている。これら大分類回路5、
詳細分類回路9における処理が終了した時点で、CPU
13が大分類用ソーティング回路7および詳細分類用ソ
ーティング回路11からそれぞれの処理結果をデータバ
ス15を介して読み込む。
【0028】次いで、CPU13は、読み込んだ大分類
処理結果と詳細分類処理結果との相関係数ρxy Mを求め
る。ここで、相関係数テーブルメモリ14にはカテゴリ
ごとに予め求めておいた相関係数ρxy (l)が記憶されて
いる。次に、相関係数ρxy Mと相関係数ρxy (l)と予め設
定しておいた相関係数の許容誤差εとから、詳細分類の
処理結果を補正し認識結果とする。
【0029】図2に示すフローチャートは、ここで行わ
れる補正処理を示すものである。この図中における相関
係数の添字K1,K2,K3は、詳細分類の処理結果の
第1位、第2位、第3位の各候補カテゴリを指すもので
ある。図では、第1位から第3位までの候補カテゴリに
ついてそれぞれ相関係数ρxy (l)と、未知文字について
の相関係数ρxy Mとの差を求め、その差が許容誤差εよ
りも大きければ棄却し(S24)、許容誤差εよりも小
さければその差の大小により候補カテゴリの順位を昇順
にソートして補正する(S25)。
【0030】ところで、候補カテゴリの第n位までに正
しい認識結果が含まれるかどうかを第n位認識率として
求めた場合、一般には、図3に示すようにある点(第n
a位)で認識率は飽和する。上述の実施例では、第3位
候補カテゴリまでについて補正を行うようにしたが、図
示されたように認識率が飽和する第na位までの候補順
位の補正を行うようにすれば、最高の認識精度が得られ
る。このように実施例では、大分類の処理結果と詳細分
類の処理結果の相関関係を用いて、詳細分類の処理結果
を補正することにより、文字認識の精度を向上させるこ
とができる。
【0031】
【発明の効果】以上述べたように本発明によれば、大分
類処理結果であるカテゴリ順位の変量xiと詳細分類処
理結果であるカテゴリ順位の変量yiとの相関係数ρxy
を求め、これと予めカテゴリごとに求められていた相関
係数ρxy lとを比較し、その差の小さい順に詳細分類処
理結果のカテゴリ順位をソートして、認識結果を補正す
る。それにより、従来、詳細分類処理では用いられるこ
とがなかった大分類処理結果も有効に活用することによ
り認識精度が向上する。
【図面の簡単な説明】
【図1】本発明の実施例を示すブロック図である。
【図2】実施例の処理動作を示すフローチャートであ
る。
【図3】実施例における認識率の変化を示すグラフであ
る。
【図4】パターンマッチングによる文字認識の概要を示
すフローチャートである。
【符号の説明】
1 イメージスキャナ 2 文字画像メモリ 3 正規化回路 4 特徴抽出回路 5 大分類回路 6 大分類用類似度演算回路 7 大分類用ソーティング回路 8 大分類用標準パターンメモリ 9 詳細分類回路 10 詳細分類用類似度演算回路 11 詳細分類用ソーティング回路 12 詳細分類用標準パターンメモリ 13 CPU 14 相関係数テーブルメモリ 15 データバス

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 入力された文字画像を正規化してから特
    徴を抽出し、その特徴について大分類処理をして予め定
    められたL個の認識対象カテゴリの中のN個のカテゴリ
    を選び出し、さらに詳細分類処理をしてその中の1つを
    選択するパターンマッチング方式の文字認識装置におい
    て、 大分類処理により得られたN個のカテゴリ順位を変量x
    iとし、詳細分類処理により得られたN個のカテゴリ順
    位を変量yiとし、両変量間の相関係数ρxyを求める手
    段と、 カテゴリごとに標準パターンを作成するときに用いた文
    字サンプルより予め求めて記憶しておいた相関係数ρxy
    lと前記未知文字についての相関係数ρxyとを比較し、
    両者の差の小さい順に詳細分類処理結果のカテゴリ順位
    をソートして補正する手段と、 を備えたことを特徴とする文字認識装置。
JP16743493A 1993-06-14 1993-06-14 文字認識装置 Withdrawn JPH06348903A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP16743493A JPH06348903A (ja) 1993-06-14 1993-06-14 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP16743493A JPH06348903A (ja) 1993-06-14 1993-06-14 文字認識装置

Publications (1)

Publication Number Publication Date
JPH06348903A true JPH06348903A (ja) 1994-12-22

Family

ID=15849640

Family Applications (1)

Application Number Title Priority Date Filing Date
JP16743493A Withdrawn JPH06348903A (ja) 1993-06-14 1993-06-14 文字認識装置

Country Status (1)

Country Link
JP (1) JPH06348903A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08180138A (ja) * 1994-12-27 1996-07-12 Nagano Nippon Denki Software Kk 文字認識装置
JP2009146245A (ja) * 2007-12-17 2009-07-02 Nec Corp 画像照合方法及び画像照合装置並びに画像照合プログラム
CN117152539A (zh) * 2023-10-27 2023-12-01 浙江由由科技有限公司 基于降维特征机器校验的生鲜商品分类修正方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08180138A (ja) * 1994-12-27 1996-07-12 Nagano Nippon Denki Software Kk 文字認識装置
JP2009146245A (ja) * 2007-12-17 2009-07-02 Nec Corp 画像照合方法及び画像照合装置並びに画像照合プログラム
US8401310B2 (en) 2007-12-17 2013-03-19 Nec Corporation Image comparing method, apparatus and program
CN117152539A (zh) * 2023-10-27 2023-12-01 浙江由由科技有限公司 基于降维特征机器校验的生鲜商品分类修正方法
CN117152539B (zh) * 2023-10-27 2024-01-26 浙江由由科技有限公司 基于降维特征机器校验的生鲜商品分类修正方法

Similar Documents

Publication Publication Date Title
EP0325233B1 (en) Character string recognition system
US6246794B1 (en) Method of reading characters and method of reading postal addresses
US6021220A (en) System and method for pattern recognition
EP0355748A2 (en) A pattern recognition apparatus and method for doing the same
US5005205A (en) Handwriting recognition employing pairwise discriminant measures
US5909510A (en) Method and apparatus for document classification from degraded images
KR19990022352A (ko) 필기 입력의 문자 인식 방법 및 장치
US6834121B2 (en) Apparatus for rough classification of words, method for rough classification of words, and record medium recording a control program thereof
JPH0139154B2 (ja)
JPH11134499A (ja) 最大クリークの評価による指紋整合
KR100617292B1 (ko) 지문 인식 방법 및 그 장치
Chi et al. Separation of single-and double-touching handwritten numeral strings
JP2986074B2 (ja) 近傍点検出方法及びパターン認識装置
JPH06348903A (ja) 文字認識装置
US5596657A (en) Method of sorting out candidate characters in character recognition system
Suters et al. Connected handwritten digit separation using external boundary curvature
JP2950023B2 (ja) パターン認識辞書生成装置およびパターン認識装置
JP3706646B2 (ja) Ocrの制御方法並びに分類方法及び装置
JP2766205B2 (ja) 文字認識装置
JP2697790B2 (ja) 文字タイプ決定方法
JP2728117B2 (ja) 文字認識装置
CN116343232A (zh) 一种基于预分类的古籍数学符号识别方法
JP2890753B2 (ja) 特徴選択方法
JP2851865B2 (ja) 文字認識装置
JPH0830734A (ja) 文字列認識装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20000905