JPH0546812A - 文字の大分類認識方法 - Google Patents

文字の大分類認識方法

Info

Publication number
JPH0546812A
JPH0546812A JP3232362A JP23236291A JPH0546812A JP H0546812 A JPH0546812 A JP H0546812A JP 3232362 A JP3232362 A JP 3232362A JP 23236291 A JP23236291 A JP 23236291A JP H0546812 A JPH0546812 A JP H0546812A
Authority
JP
Japan
Prior art keywords
group
feature amount
large classification
character
dimension
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3232362A
Other languages
English (en)
Inventor
Teruyuki Maruyama
輝幸 丸山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP3232362A priority Critical patent/JPH0546812A/ja
Publication of JPH0546812A publication Critical patent/JPH0546812A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 詳細認識処理の前処理として、認識対象の文
字画像を大分類にグループ分けする際、大分類グループ
の境界をぼかすことで、辞書サイズを大きくすることな
しに、文字画像にのった歪みや雑音によるグループの誤
認識を解消する。 【構成】 処理装置12は、文字画像データファイル1
4のサンプル文字画像データ群について多次元の特徴量
を抽出し、各次元の特徴量に対して閾値を設定して各文
字種をグループ分けし、各グループのグループ内要素文
字の各次元の特徴量の分布を求めて大分類辞書とし、辞
書メモリ17に登録する。イメージスキャナ11から読
み込んだ文字画像は、入力画像用メモリ15を介して作
業用メモリ16に設定する。処理装置12は該文字画像
の特徴量を抽出し、辞書メモリ17の分布データを用い
て大分類候補を決定する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、光学的文字認識装置
(OCR)などにおいて、詳細認識処理の前処理とし
て、読み込まれた多数、多種類の文字画像データを大分
類にグループ分けする大分類認識方法に関する。
【0002】
【従来の技術】OCRなどにおいては、認識処理時間の
短縮を目的として、読み込まれた多数及び多種類の文字
画像データについて、まず、大分類にグループ分けし、
次に、この大分類グループを対象に詳細認識する手法を
用いることが多々ある。
【0003】この種の従来技術では、例えば特開平1−
161592号公報に記載のように認識辞書内のすべて
の文字を、似通った特徴量を持つ文字群のグループに振
り分け、これらの平均の特徴量などにより標準特徴量を
求め、グループの特徴量として大分類辞書を作成する。
そして、入力された文字画像データの特徴量を抽出し、
各グループの標準特徴量とマッチングをとり、最も距離
の近いグループを求める(大分類)。その後、この求ま
ったグループに含まれる各文字の特徴量とのマッチング
を行い、最終的な文字候補を決定する。
【0004】
【発明が解決しようとする課題】上記従来技術は、大分
類処理においてグループの代表特徴量との距離を用いる
ものであるが、大分類グループの境界が厳しく、境界近
くでは、文字が歪んだり、雑音がのっていると、他のグ
ループ領域に入り、グループの誤認が起こりやすい。ま
た、このような誤認識を解消するため、境界近くの文字
を隣り合う二つのグループにまたがって登録すると、本
来よりも辞書サイズが大きくなってしまう。
【0005】本発明の目的は、大分類グループの境界を
ぼかし、辞書サイズを大きくすることなしに、大分類グ
ループの境界近くにおいて文字画像にのった歪みや雑音
によるグループの誤認を解消する文字の大分類認識方法
を提供することにある。
【0006】
【課題を解決するための手段】上記目的を達成するため
に、請求項1及び2の発明では、サンプル文字画像デー
タ群について多次元の特徴量を抽出しすると共に、各文
字種の各次元の平均特徴量を抽出して、各次元の特徴量
に対する一つあるいは複数の閾値を決定し、該決定した
閾値を基準に各文字種をグループ分けし、各グループの
要素文字種より各グループの各次元毎の特徴量の分布デ
ータを求めて大分類辞書とし、認識対象の入力文字画像
データについて多次元の特徴量を抽出し、該抽出した各
次元の特徴量を前記大分類辞書の分布データと比較して
詳細認識対象グループを選択するようにしたことであ
る。
【0007】また、請求項3の発明では、サンプル文字
画像データ群について多次元の特徴量を抽出すると共
に、各文字種の各次元毎の最大特徴量及び最小特徴量を
抽出し、前記抽出した特徴量より各次元の特徴量に対す
る閾値を決定し、前記各文字種の最大及び最小特徴量と
前記決定した閾値により各文字種をグループ分けし、各
グループの要素文字種より各グループの各次元毎の特徴
量の分布データを求めて大分類辞書とし、認識対象の入
力文字画像データについて多次元の特徴量を抽出し、該
抽出した各次元の特徴量を前記大分類辞書の分布データ
と比較して詳細認識対象グループを選択するようにした
ことである。
【0008】
【作用】請求項1および2では、各文字種の平均特徴量
に対し、各グループに含まれる文字種数がほぼ等しくな
るように一つあるいは複数の閾値を設定して各文字種を
グルーピングし、サンプル文字画像データ群を、その文
字種の平均特徴量が属するグループの要素として、各グ
ループの要素の特徴量の各次元の分布を求めて大分類辞
書とする。また、請求項3では、閾値に加えて各文字種
の最大及び最小特徴量により各文字種をグルーピング
し、各グループの要素文字種より各グループの各次元の
分布を求めて大分類辞書とする。大分類処理では、認識
対象の文字画像データの各次元の特徴量を上記大分類辞
書の各グループの分布と比較して大分類候補を認識す
る。いずれにしても、大分類処理においてグループの代
表特徴量との距離を用いずに、各次元の特徴量に於ける
大分類グループ内の要素の分布を用いることで、大分類
グループの境界をぼかし、辞書サイズを大きくすること
なしに歪み又は雑音によるグループの誤認を解消するこ
とができる。
【0009】
【実施例】図1は本発明が適用される文字認識装置の一
実施例のブロック図を示す。文字画像データファイル1
4は大分類辞書や詳細認識辞書を作成するためのサンプ
ルデータとなる多数の文字画像データを保持している。
処理装置12は、文字画像データファイル14にあらか
じめ保持されている文字画像データを用いて大分類辞書
や詳細認識辞書を作成して辞書メモリ17に格納する。
認識対象の手書又は印刷された文書はイメージスキャナ
11で読み込まれ、黒領域は1、白領域は0の画像デー
タに変換される。入力画像用メモリ15は該イメージス
キャナ11で読み込まれた入力画像データを格納する。
処理装置12は、入力画像用メモリ15より入力画像デ
ータを一文字ずつ切り出して作業用メモリ16に格納
し、その特徴量を抽出した後、まず、辞書メモリ17の
大分類辞書を用いて詳細認識対象グループを決定し(大
分類認識処理)、次に、該グループに着目して詳細認識
処理を行い、最終的に候補文字を決定する。ディスプレ
ィ13は処理装置12で求まった候補文字を表示するの
に用いられる。なお、作業用メモリ16は、処理装置1
2が文字画像データファイル14の文字画像データを用
いて辞書を作成する際にも使用される。
【0010】以下、処理装置12での本発明にかかわる
大分類辞書作成、入力文字に対する大分類処理の各実施
例について詳述する。
【0011】実施例1 これは請求項1に対応するものである。該実施例1の大
分類辞書作成のフローチャートを図2に、大分類処理の
フローチャートを図3に示す。
【0012】初めに、図2に基づいて大分類辞書の作成
を説明する。
【0013】多次元特徴量の抽出(ステップ101);
文字画像データファイル14には、1文字種あたり複数
の文字画像データずつ、認識対象の全文字種のサンプル
文字画像データ群があらかじめ用意されている。この文
字画像データファイル14の各文字画像データについて
多次元の特徴量を抽出する。ここでは64次元の特徴量
を抽出するとする。特徴量としては方向コード、その
他、何でもよい。抽出した特徴量は、例えば文字画像デ
ータファイル14内に、文字画像データ対応に保持して
おく。
【0014】有意特徴次元の決定(ステップ102);
まず、各文字種ごとの複数の文字画像データの特徴量よ
り、各文字種の各次元における特徴量の平均を、次式
(1)により求める。
【数1】 但し、m;文字種番号 N;1文字種当りの文字画像データ数 fm(i);m文字種のi次元の平均特徴量
【0015】次に、求まった各文字種の平均特徴量を用
い、全文字種を母集合としたときの各次元における特徴
量の文字種間の分散f(i)を求める。さらに、文字画
像データの特徴量および各文字種の各次元における特徴
量の平均より、各文字種の各次元における特徴量の文字
種内分散を、次式(2)により求める。
【数2】 但し、m;文字種番号 N;1文字種当りの文字画像データ数 gm(i);m文字種のi次元の特徴量の分散
【0016】この得られた各文字種の特徴量の文字種内
分散を用い、全文字種を母集合としたときの各次元にお
ける特徴量の文字種内分散の平均g(i)を求める。こ
のようにして求められた各次元における文字種内分散の
平均と文字種間分散の比g(i)/f(i)の小さい上
位所定数の次元を決定する。ここでは、上位3次元とす
る。つまり、最も文字の分類に対し有意義な特徴量を6
4次元より3次元求める。得られた上位3次元を最上位
よりD0、D1、D2とする(例えば、D0は第34次
元、D1は第20次元、D2は第44次元。ただし、6
4次元内)。
【0017】大分類グルーピング(ステップ103,1
04);上記求められた有意な特徴次元Di(i=0,
1,2)の各次元に於て、各文字種の特徴量の平均に対
する閾値ThDiを設定し、全文字種のうち特徴量の平
均がこの閾値未満の文字種をグループDLDi、全文字
種のうち特徴量の平均がこの閾値以上の文字種をグルー
プGHDiにグルーピングする。ただし、各グループに
含まれる文字種数はほぼ等しくなるように閾値を設定す
る。
【0018】図4に閾値設定の様子を示す。図4におい
て、一つ一つの黒丸がDi(i=0,1,2)における
各文字種の平均特徴量を示している。(a)は、次元D
0の平均特徴量fm(D0)に着目して文字種数(要素
数)の分布を求め、二分した各グループGLD0、GH
D0に含まれる文字種数の総和がほぼ等しくなるように
閾値ThD0を設定する様子を示した図である。同様
に、(b)は次元D1の平均特徴量fm(D1)に対し
て閾値ThD1を設定した図、(c)は次元D2の平均
特徴量fm(D2)に対して閾値ThD2を設定した図
である。
【0019】上記のグルーピングにより8つの大分類グ
ループが得られる。図5はこの様子を示したもので、太
線で囲ったブロックはそれぞれグループ、各ブロック上
の番号は大分類グループ番号を示す。即ち、第1大分類
グループ(番号1)は、GLD0かつGLD1かつGL
D2に含まれる文字種によって構成される。第2大分類
グループ(番号2)は、GHD0かつGLD1かつGL
D2に含まれる文字種によって構成される。第3大分類
グループ(番号3)は、GLD0かつGHD1かつGL
D2に含まれる文字種によって構成される。第4大分類
グループ(番号4)は、GHD0かつGHD1かつGL
D2に含まれる文字種によって構成される。第5大分類
グループ(番号5)は、GLD0かつGLD1かつGH
D2に含まれる文字種によって構成される。第6大分類
グループ(番号6)は、GHD0かつGLD1かつGH
D2に含まれる文字種によって構成される。第7大分類
グループ(番号7)は、GLD0かつGHD1かつGH
D2に含まれる文字種によって構成される。第8大分類
グループ(番号8)は、GHD0かつGHD1かつGH
D2に含まれる文字種によって構成される。
【0020】大分類辞書の作成・登録(ステップ105
〜110);文字画像データファイル14内の各文字種
の平均特徴量を求めるために用いたすべての文字画像デ
ータ(サンプルデータ)の特徴量(ただし、64次元特
徴量の内の上記有意な3次元の特徴量)を、その文字種
の平均特徴量が属するグループGLDiまたはGHDi
の要素とし、グループGLD0及びGHD0の要素の特
徴量の次元D0における分布H0g(f)、グループG
LD1及びGHD1の要素の特徴量の次元D1における
分布H1g(f)、グループGLD2及びGHD2の要
素の特徴量の次元D2における分布H2g(f)をそれ
ぞれ求める。そして、この求めた各グループに於ける特
徴量の分布H0g(f)、H1g(f)、H2g(f)
を大分類辞書として辞書メモリ17に登録する。ここ
で、gはグループ(L=GLDiまたはGHDi)、f
は特徴量を意味する。
【0021】図6の(a)、(b)、(c)に、図4の
(a)、(b)、(c)に対応する各特徴量の分布H0
g(f)、H1g(f)、H2g(f)の様子を示す。
図6(a)、(b)、(c)において、一つ一つの黒丸
がDi(i=0、1、2)における各文字種の平均特徴
量であり、その周囲の網掛けした部分が同文字種のサン
プルデータの特徴量(要素)の分布を示している。
【0022】次に、図3に基づいて入力文字画像データ
の認識処理について説明する。
【0023】特徴量の抽出(ステップ121) 位置合わせや傾き修正などの所定の前処理を施こした
後、作業用メモリ16に切り出された一文字ずつの入力
文字画像データについて、多次元(64次元)の特徴量
を抽出し、さらにその中から大分類処理に用いる3次元
(前記大分類辞書作成で決定されたD0、D2、D3)
の特徴量f(Di)を抽出する。
【0024】大分類処理(ステップ122〜126);
この抽出した特徴量f(Di)(i=1,2,3)につ
いて、辞書メモリ17に登録されている大分類辞書の分
布データ(図6)を参照し、以下のようにして大分類グ
ループを選択する。図5に示したように、大分類グルー
プは第1大分類グループ乃至第8大分類グループよりな
る。 (1) もしグループGLD0の特徴量の分布H0L(f
(Di))が0であったら、第1大分類グループ、第3
大分類グループ、第5大分類グループ、第7大分類グル
ープを大分類候補(詳細認識対象グループ候補)から外
す。もしグループGHD0の特徴量の分布H0H(f
(Di))が0であったら、第2大分類グループ、第4
大分類グループ、第6大分類グループ、第8大分類グル
ープを大分類候補(詳細認識対象グループ候補)から外
す。図(a)に、このケースの一例を示す。 (2) もしグループGLD1の特徴量の分布H1L(f
(Di))が0であったら、第1大分類グループ、第2
大分類グループ、第5大分類グループ、第6大分類グル
ープを大分類候補(詳細認識対象グループ候補)から外
す。もしグループGHD1の特徴量の分布H1H(f
(Di))が0であったら、第3大分類グループ、第4
大分類グループ、第7大分類グループ、第8大分類グル
ープを大分類候補(詳細認識対象グループ候補)から外
す。図7(b)に、このケースの一例を示す。 (3) もしグループGLD2の特徴量の分布H2L(f
(Di))が0であったら、第1大分類グループ、第2
大分類グループ、第3大分類グループ、第4大分類グル
ープを大分類候補(詳細認識対象グループ候補)から外
す。もしグループGHD2の特徴量の分布H2H(f
(Di))が0であったら、第5大分類グループ、第6
大分類グループ、第7大分類グループ、第8大分類グル
ープを大分類候補(詳細認識対象グループ候補)から外
す。図7(b)に、このケースの一例を示す。 (4) (1)、(2)、(3)の処理により候補グループが存在し
なくなってしまう場合、すべてのグループを大分類候補
とする。
【0025】詳細認識処理(ステップ127);大分類
候補として残った大分類グループを詳細認識対象とし
て、辞書メモリ17の詳細辞書を用いて認識処理を行
い、最終的に候補文字を決定する。この処理は従来と同
様であり、また本発明に直接関係する所はではないの
で、これ以上の説明は省略する。
【0026】実施例2 これは請求項2に対応するものである。実施例1との相
違点は、大分類グルーピングにおいて、有意特徴量次元
Di(実施例では、i=0,1,2)の各次元につい
て、各文字種の特徴量の平均に対する閾値を、Th0D
i、Th1Diの二つ設定し、全文字種のうち特徴量の
平均が閾値Th0Di未満の文字種をグループGLD
i、全文字種のうち特徴量の平均が閾値Th1Di以上
の文字種をグループGHDi、全文字種のうち上記以外
の文字種をグループGMDiにグルーピングしたことで
ある。ただし、各グループに含まれる文字種数がほぼ等
しくなるように閾値を設定することは実施例1の場合と
同様である。図8に、実施例2における閾値設定の様子
を示す。
【0027】図8から分かるように、この実施例2では
27の大分類グループが得られる。各大分類グループは
次のようになる。 第1大分類グループは、GLD0かつGLD1かつGLD2に含まれる文字種 によって構成される。 第2大分類グループは、GMD0かつGLD1かつGLD2に含まれる文字種 によって構成される。 第3大分類グループは、GHD0かつGLD1かつGLD2に含まれる文字種 によって構成される。 第4大分類グループは、GLD0かつGMD1かつGLD2に含まれる文字種 によって構成される。 第5大分類グループは、GMD0かつGMD1かつGLD2に含まれる文字種 によって構成される。 第6大分類グループは、GHD0かつGMD1かつGLD2に含まれる文字種 によって構成される。 第7大分類グループは、GLD0かつGHD1かつGLD2に含まれる文字種 によって構成される。 第8大分類グループは、GMD0かつGHD1かつGLD2に含まれる文字種 によって構成される。 第9大分類グループは、GHD0かつGHD1かつGLD2に含まれる文字種 によって構成される。 ………………………………………………………………………… 第27大分類グループは、GHD0かつGHD1かつGHD2に含まれる文字 種によって構成される。
【0028】便宜上、第1大分類グループ乃至第9大分
類グループについて示すと図9のようになる。
【0029】大分類辞書の作成では、各文字種の平均特
徴量を求めるために用いたすべての文字データの特徴量
(ただし、64次元特徴量の内の上記3次元の特徴量)
を、その文字種の平均特徴量が属するグループGLD
i、GMDiまたはGHDiの要素とし、グループGL
Di、GMDi及びGHDiの要素の特徴量の次元D1
における分布Hig(f)を求める。そして、各グルー
プに於ける特徴量の分布Hig(f)を大分類辞書とす
る。ただし、i=0,1,2であり、また、gはグルー
プ(LDi、M=GMDiまたはH=GHDi)、fは
特徴量である。図10に、この様子を示す。
【0030】入力文字画像データの大分類処理では、抽
出した特徴量f(Di)(i=0,1,2)について、
上記大分類辞書の分布データを参照し、大分類グループ
を選択する。説明の簡単化のため、D0、D1の場合
(i=0,1)について記述すると以下のようになる。 (1) もしグループGLD0の特徴量の分布H0L(f
(Di))が0であったら、第1大分類グループ、第4
大分類グループ、第7大分類グループを大分類候補(詳
細認識対象グループ候補)から外す。もしグループGM
D0の特徴量の分布H0M(f(Di))が0であった
ら、第2大分類グループ、第5大分類グループ、第8大
分類グループを大分類候補(詳細認識対象グループ候
補)から外す。もしグループGHD0の特徴量の分布H
0H(f(Di))が0であったら、第3大分類グルー
プ、第6大分類グループ、第9大分類グループを大分類
候補(詳細認識対象グループ候補)から外す。 (2) もしグループGLD0の特徴量の分布H1L(f
(Di))が0であったら、第1大分類グループ、第1
大分類グループ、第3大分類グループを大分類候補から
外す。もしグループGMD1の特徴量の分布H1M(f
(Di))が0であったら、第4大分類グループ、第5
大分類グループ、第6大分類グループを大分類候補から
外す。もしグループGHD1の特徴量の分布H1H(f
(Di))が0であったら、第7大分類グループ、第8
大分類グループ、第9大分類グループを大分類候補から
外す。 (3) (1)、(2)の処理により候補グループが存在しなくな
ってしまった場合は、すべてのグループを大分類候補と
する。
【0031】実際には、D0、D1に加えてD2もある
ため、処理の対象は第1大分類グループから第27大分
類グループまで存在する。図11はその様子を示したも
ので、(a)はD0に着目した場合、(b)はD1に着
目した場合、(c)はD2に着目した場合のそれぞれの
大分類候補の一例である。
【0032】実施例3 これは請求項3に対応するものである。該実施例3の大
分類辞書作成のフローチャートを図12に、入力文字画
像データに対する大分類処理のフローチャートを図13
に示す。
【0033】初めに、図12に基づいて大分類辞書の作
成を説明する。
【0034】特徴量の抽出、有意特徴次元の決定(ステ
ップ201,202);実施例1と同様にして、文字画
像データファイル14中のサンプル文字画像データ群に
ついて多次元(64次元)の特徴量を抽出し、それより
最も文字の分類に対して有意な上位3次元Di(i=
0,1,2)を決定する。実施例3では、さらに文字画
像データファイル14中の全文字画像データのD0、D
1、D2次元の特徴量について、各文字種の各次元にお
ける特徴量の最大値、最小値を求める。
【0035】大分類グルーピング(ステップ203,2
04);上記求めたDi(i=0,1,2)の各次元に
於て、各文字種の特徴量に対する閾値ThDiを設定
し、全文字種のうち特徴量の最大値がこの閾値ThDi
未満の文字種をグループGLDi、全文字種のうち特徴
量の最小値がこの閾値Th1Di以上の文字種をグルー
プGHDi、全文字種のうち上記以外の文字種をグルー
プGMDiにグルーピングする。ただし、各グループに
含まれる文字種数が等しくなるように閾値を設定する。
【0036】図14に、一例としてD0次元におけるグ
ループ分けの様子を示す。図14において、曲線a、
b、cは各々一文字種の特徴量分布を示し、白丸は各文
字種のD0での最大特徴量、黒丸は最小特徴量を示す。
Th0は閾値である。この例の場合、曲線aの文字種は
GLD0に、曲線bの文字種はGMD0に、曲線cの文
字種はGHD0に、それぞれグルーピングされることに
なる。
【0037】上記のグルーピングにより、実施例2の場
合と同じく27の大分類グループが求まる。即ち、大分
類グループは次のようになる。 第1大分類グループは、GLD0かつGLD1かつGLD2に含まれる文字種 によって構成される。 第2大分類グループは、GMD0かつGLD1かつGLD2に含まれる文字種 によって構成される。 第3大分類グループは、GHD0かつGLD1かつGLD2に含まれる文字種 によって構成される。 第4大分類グループは、GLD0かつGMD1かつGLD2に含まれる文字種 によって構成される。 第5大分類グループは、GMD0かつGMD1かつGLD2に含まれる文字種 によって構成される。 第6大分類グループは、GHD0かつGMD1かつGLD2に含まれる文字種 によって構成される。 ………………………………………………………………………… 第27大分類グループは、GHD0かつGHD1かつGHD2に含まれる文字 種によって構成される。
【0038】大分類辞書の作成・登録(ステップ205
〜211);これも実施例2と基本的に同じである。各
文字種の平均特徴量を求めるために用いたすべての文字
データの特徴量(64次元特徴量の内の上記3次元の特
徴量)を、その文字種の平均特徴量が属するグループG
LDi、GMDiまたはGHDiの要素とし、グループ
GLD0、GMD0の要素の特徴量の次元D0における
分布H0g(f)、グループGLD1、GMD1及びG
HD1の要素の特徴量の次元D1における分布H1g
(f)、グループGLD2、GMD2及びGHD2の要
素の特徴量の次元D2における分布H2g(f)を求め
る。そして、各グループに於ける特徴量の分布H0g
(f)、H1g(f)及びH2g(f)を大分類辞書と
する。ただし、gグループ(L=GLDi、M=GMD
iまたはH=GHDi)、fは特徴量である。図15に
この様子を示す。
【0039】次に、図13に基づいて入力文字画像デー
タの認識処理について説明する。
【0040】特徴量の抽出(ステップ221);実施例
1、2と同様に、切り出された入力文字画像データにつ
いて、64次元の特徴量の抽出処理を行い、その中から
大分類処理に用いる3次元(D0,D1,D2)の特徴
量f(Di)(i=0,1,2)を抽出する。
【0041】大分類処理(ステップ000〜227);
上記特徴量f(Di)(i=0,1,2)について、大
分類辞書の分布データ(図15)を用い、大分類グルー
プを選択する。ここでも、簡略化してD0、D1(i=
0,1)の場合について以下に記述する。 (1) もしグループGLD0の特徴量の分布H0L(f
(Di))が0であったら、第1大分類グループ、第4
大分類グループ、第7大分類グループを大分類候補(詳
細認識対象グループ候補)から外す。もしグループGM
D0の特徴量の分布H0M(f(Di))が0であった
ら、第2大分類グループ、第5大分類グループ、第8大
分類グループを大分類候補から外す。もしグループGH
D0の特徴量の分布H0H(f(Di))が0であった
ら、第3大分類グループ、第6大分類グループ、第9大
分類グループを大分類候補から外す。 (2) もしグループGLD1の特徴量の分布H1L(f
(Di))が0であったら、第1大分類グループ、第2
大分類グループ、第3大分類グループを大分類候補から
外す。もしグループGMD1の特徴量の分布H1M(f
(Di))が0であったら、第4大分類グループ、第5
大分類グループ、第6大分類グループを大分類候補から
外す。もしグループGHD1の特徴量の分布H1H(f
(Di))が0であったら、第7大分類グループ、第8
大分類グループ、第9大分類グループを大分類候補から
外す。 (3) (1)、(2)の処理により候補グループが存在しなくな
ってしまった場合は、すべてのグループを大分類候補と
する。
【0042】実施例3でも、D0、D1に加えてD2の
3次元の特徴量があるため、実際には処理の対象は第1
大分類グループから第27大分類グループまでとなる。
図16はその様子を示したものである。図16におい
て、(a)はGLD0グループを大分類候補とした場
合、(b)はGHD1グループまたはGMD1グループ
を大分類候補とした場合、(c)はGLD2を大分類候
補とした場合の例である。
【0043】詳細認識処理(ステップ228);大分類
候補として残った大分類グループを詳細認識対象とし
て、辞書メモリ17の詳細辞書を用いて認識処理を行
い、最終的に候補文字を決定する。この処理は本発明と
直接関係する所ではないので、これ以上の説明は省略す
る。
【0044】
【発明の効果】本発明では、大分類処理においてグルー
プの代表特徴量との距離を用いずに、各次元の特徴量に
於ける大分類グループ内の要素の分布を用いることで、
大分類グループの境界をぼかし、辞書サイズを大きくす
ることなしに歪み又は雑音によるグループの誤認を解消
することができる。また、大分類アルゴリズムが簡単に
なるため、大分類処理の格段の高速化が図れる。
【図面の簡単な説明】
【図1】本発明が適用される文字認識装置の一実施例の
ブロック図である。
【図2】本発明の実施例1の大分類辞書作成のフローチ
ャートである。
【図3】本発明の実施例1の大分類処理のフローチャー
トである。
【図4】本発明の実施例1における閾値の設定を説明す
る図である。
【図5】本発明の実施例1における大分類グループ分け
を説明する図である。
【図6】本発明の実施例1における大分類辞書の作成を
説明する図である。
【図7】本発明の実施例1における大分類処理でのグル
ープ選択を説明する図である。
【図8】本発明の実施例2における閾値の設定を説明す
る図である。
【図9】本発明の実施例2における大分類グループ分け
を説明する図である。
【図10】本発明の実施例2における大分類辞書の作成
を説明する図である。
【図11】本発明の実施例2における大分類処理でのグ
ループ選択を説明する図である。
【図12】本発明の実施例3における大分類辞書作成の
フローチャートである。
【図13】本発明の実施例3における大分類処理でのフ
ローチャートである。
【図14】本発明の実施例3における大分類グループ分
けを説明する図である。
【図15】本発明の実施例3における大分類辞書の作成
を説明する図である。
【図16】本発明の実施例3における大分類処理でのグ
ループ選択を説明する図である。
【符号の説明】
11 イメージスキャナ 12 処理
装置 13 ディスプレィ 14 文字
画像データファイル 15 入力画像用メモリ 16 作成
用メモリ 17 辞書メモリ

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 詳細認識処理の前処理として、認識対象
    の入力文字画像データを大分類にグループ分けする方法
    において、 サンプル文字画像データ群について多次元の特徴量を抽
    出すると共に、各文字種の各次元の平均特徴量を抽出し
    て、各次元の特徴量に対する閾値を決定し、該決定した
    閾値を基準に各文字種をグループ分けし、各グループの
    要素文字種より各グループの各次元毎の特徴量の分布デ
    ータを求めて大分類辞書とし、 認識対象の入力文字画像データについて多次元の特徴量
    を抽出し、該抽出した各次元の特徴量を前記大分類辞書
    の分布データと比較して詳細認識対象グループを選択す
    ることを特徴とする文字の大分類認識方法。
  2. 【請求項2】 サンプル文字画像データ群について多次
    元の特徴量を抽出すると共に、各文字種の各次元の平均
    特徴量を抽出し、各次元の特徴量に対して複数の閾値を
    決定し、該決定した複数の閾値を基準に各文字種をグル
    ープ分けし、各グループの要素文字種より各グループの
    各次元毎の特徴量の分布データを求めて大分類辞書とす
    ることを特徴とする請求項1記載の文字の大分類認方
    法。
  3. 【請求項3】 詳細認識処理の前処理として、認識対象
    の入力文字画像データを大分類にグループ分けする方法
    において、 サンプル文字画像データ群について多次元の特徴量を抽
    出すると共に、各文字種の各次元毎の最大特徴量及び最
    小特徴量を抽出し、前記抽出した特徴量より各次元の特
    徴量に対する閾値を決定し、前記各文字種の最大及び最
    小特徴量と前記決定した閾値により各文字種をグループ
    分けし、各グループの要素文字種より各グループの各次
    元毎の特徴量の分布データを求めて大分類辞書とし、 認識対象の入力文字画像データについて多次元の特徴量
    を抽出し、該抽出した各次元の特徴量を前記大分類辞書
    の分布データと比較して詳細認識対象グループを選択す
    ることを特徴とする文字の大分類認識方法。
JP3232362A 1991-08-20 1991-08-20 文字の大分類認識方法 Pending JPH0546812A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3232362A JPH0546812A (ja) 1991-08-20 1991-08-20 文字の大分類認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3232362A JPH0546812A (ja) 1991-08-20 1991-08-20 文字の大分類認識方法

Publications (1)

Publication Number Publication Date
JPH0546812A true JPH0546812A (ja) 1993-02-26

Family

ID=16938028

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3232362A Pending JPH0546812A (ja) 1991-08-20 1991-08-20 文字の大分類認識方法

Country Status (1)

Country Link
JP (1) JPH0546812A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011100245A (ja) * 2009-11-05 2011-05-19 Fujitsu Ltd パターン認識装置、パターン認識プログラム、パターン認識方法
US8379983B2 (en) 2008-05-13 2013-02-19 Fujitsu Limited Dictionary creating apparatus, recognizing apparatus, and recognizing method

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8379983B2 (en) 2008-05-13 2013-02-19 Fujitsu Limited Dictionary creating apparatus, recognizing apparatus, and recognizing method
JP2011100245A (ja) * 2009-11-05 2011-05-19 Fujitsu Ltd パターン認識装置、パターン認識プログラム、パターン認識方法

Similar Documents

Publication Publication Date Title
US6151423A (en) Character recognition with document orientation determination
JP2001092919A (ja) 2次元バーコードのねじれ角決定法
US5841905A (en) Business form image identification using projected profiles of graphical lines and text string lines
CN111401099B (zh) 文本识别方法、装置以及存储介质
EP0482187A1 (en) Row-by-row segmentation and thresholding for optical character recognition (system and method)
JPH05225378A (ja) 文書画像の領域分割システム
JPH11345339A (ja) 画像セグメンテ―ション方法及び装置及びシステム及びコンピュ―タ可読メモリ
CN114663665B (zh) 基于梯度的对抗样本生成方法与系统
JPH0546812A (ja) 文字の大分類認識方法
JPH11272800A (ja) 文字認識装置
Mita et al. Improvement of video text recognition by character selection
JP2832928B2 (ja) 文字認識方法
JPH09305707A (ja) 画像抽出方式
JP2785747B2 (ja) 文字読取装置
JP2891211B2 (ja) 光学式文字読取装置および方法
JP2974167B2 (ja) 文字の大分類認識方法
JP3277977B2 (ja) 文字認識方法
JPH0795336B2 (ja) 文字認識方式
JP3463255B2 (ja) 多値画像パターンの認識処理方法
Takebe et al. Character string extraction from newspaper headlines with a background design by recognizing a combination of connected components
JP3127413B2 (ja) 文字認識装置
JP3009237B2 (ja) 特徴抽出方法
JPH05174193A (ja) 文字認識方法
JPS63131287A (ja) 文字認識方式
Chen et al. Global automatic thresholding with edge information and moving average on histogram