JPH103518A - 文字認識方法,記憶媒体および文字認識装置 - Google Patents

文字認識方法,記憶媒体および文字認識装置

Info

Publication number
JPH103518A
JPH103518A JP8154644A JP15464496A JPH103518A JP H103518 A JPH103518 A JP H103518A JP 8154644 A JP8154644 A JP 8154644A JP 15464496 A JP15464496 A JP 15464496A JP H103518 A JPH103518 A JP H103518A
Authority
JP
Japan
Prior art keywords
similarity
character
candidate
candidate character
character recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8154644A
Other languages
English (en)
Inventor
Toshihiro Suzuki
俊博 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP8154644A priority Critical patent/JPH103518A/ja
Publication of JPH103518A publication Critical patent/JPH103518A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【課題】 認識処理時間の増大およびメモリ量の増大を
極力抑えつつ,認識精度の向上を図ること。 【解決手段】 画像データから文字領域を切り出し(S
202),切り出した文字領域から特徴量を抽出し(S
203),抽出した特徴量と辞書に格納されているモデ
ルまたは標準パターンとを比較して類似度を算出し(S
204,S205),算出した類似度に基づいて前記文
字領域の候補文字組を生成する(S206)。このと
き,ステップS204,S205において,複数の異な
る類似度算出方法を用いて同一の特徴量と同一の辞書か
ら複数の類似度(第1類似度および第2類似度)を算出
し,ステップS206において,算出された類似度に基
づいて,それぞれの類似度の候補文字組を生成した後,
それぞれの類似度およびそれぞれの候補文字組に基づい
て,最終的な候補文字組を生成する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は,文字認識方法,記
憶媒体および文字認識装置に関し,より詳細には,メモ
リ量の増大や,処理時間の増大を極力抑えつつ,認識精
度の向上を図れるようにした文字認識方法,記憶媒体お
よび文字認識装置に関する。
【0002】
【従来の技術】従来の文字認識方法では,画像データか
ら文字領域を切り出し,切り出した文字領域から特徴量
を抽出し,抽出した特徴量と辞書に格納されているモデ
ルまたは標準パターンとを比較して類似度を算出し,算
出した類似度に基づいて文字認識の対象である文字領域
の候補文字組を生成する方法が一般的である。
【0003】このような文字認識方法において,さらに
文字の認識精度を向上させるために,例えば,使用する
特徴を豊富にする方法や,辞書の内容を豊富にする方法
等が考えられる。
【0004】後者の方法としては,例えば,特開昭62
−49581号公報『文字認識装置』に開示されるよう
に,複数の辞書を用いて辞書の内容を豊富する装置が提
案されている。
【0005】
【発明が解決しようとする課題】しかしながら,上記従
来の文字認識方法において,さらに文字の認識精度を向
上させるために,例えば,使用する特徴を豊富にする方
法を適用した場合,認識精度は向上するものの認識処理
時間が増大するという問題点があった。
【0006】また,辞書の内容を豊富にする方法を適用
した場合,辞書を記憶するためのメモリ量が増大すると
いう問題点があった。
【0007】換言すれば,上記従来の技術によれば,認
識精度の向上は,認識処理時間の増大またはメモリ量の
増大を招来するものであり,これらの増大を招くことな
く認識精度の向上を図ることは困難であった。
【0008】一方,メモリ量の増大を招くことなく認識
精度を向上させるものとして,例えば,特開平1−28
2691号公報『文字認識方式』が開示されている。こ
れは,複数の類似度(相違度)を用いるものであり,具
体的には,通常の相違度とずらしに関する相違度とを併
用することで文字変形を吸収し,これによって認識精度
の向上を図るものであるが,ずらしに関する相違度を算
出するためのパラメータ抽出処理が追加されることによ
って,認識処理時間の増大が避けられないという問題点
が発生する。
【0009】本発明は上記に鑑みてなされたものであっ
て,認識処理時間の増大およびメモリ量の増大を極力抑
えつつ,認識精度の向上を図ることを目的とする。
【0010】
【課題を解決するための手段】上記の目的を達成するた
めに,請求項1に係る文字認識方法は,画像データから
文字領域を切り出し,切り出した文字領域から特徴量を
抽出し,抽出した特徴量と辞書に格納されているモデル
または標準パターンとを比較して類似度を算出し,算出
した類似度に基づいて前記文字領域の候補文字組を生成
する文字認識方法において,前記類似度を算出する工程
が,複数の異なる類似度算出方法を用いて同一の特徴量
と同一の辞書から複数の類似度を算出可能な工程を含
み,前記候補文字組を生成する工程が,前記算出された
類似度に基づいて,それぞれの類似度の候補文字組を生
成した後,前記それぞれの類似度およびそれぞれの候補
文字組に基づいて,最終的な候補文字組を生成する工程
を含むものである。
【0011】また,請求項2に係る文字認識方法は,請
求項1記載の文字認識方法において,前記類似度を算出
する工程が,複数の異なる類似度算出方法を用いて同一
の特徴量と同一の辞書から複数の類似度を算出する場合
に,前記複数の類似度の算出を所定の順序で逐次的に実
行し,かつ,先行して算出した類似度が低い類似性を示
して認識不能と判断された場合にのみ,次の類似度の算
出を行うものである。
【0012】また,請求項3に係る文字認識方法は,請
求項1記載の文字認識方法において,前記辞書が,前記
モデルまたは標準パターン毎に,それぞれの類似度を算
出する際に使用する少なくとも1つの類似度算出方法を
指定した指定情報を有しており,前記類似度を算出する
工程が,前記指定情報で指定された類似度算出方法に基
づいて,類似度を算出するものである。
【0013】また,請求項4に係る文字認識方法は,請
求項1記載の文字認識方法において,前記候補文字組を
生成する工程が,前記それぞれの類似度の候補文字組を
キーとして,あらかじめ定められたテーブルを参照して
前記最終的な候補文字組を生成するものである。
【0014】また,請求項5に係る文字認識方法は,請
求項4記載の文字認識方法において,前記候補文字組を
生成する工程が,前記それぞれの類似度の候補文字組の
第1位候補文字を比較し,全ての候補文字組の第1位候
補文字が同一であれば,前記テーブルを参照することな
く,第1位候補文字を最終的な候補文字として生成する
ものである。
【0015】また,請求項6に係る文字認識方法は,請
求項4記載の文字認識方法において,前記テーブルの内
容が,何れの類似度算出方法の算出結果に従うかを示す
フラグ情報からなるものである。
【0016】また,請求項7に係る記憶媒体は,請求項
1ないし6記載の文字認識方法の機能を実現するソフト
ウェアを格納したものである。
【0017】また,請求項8に係る文字認識装置は,画
像データから文字領域を切り出す文字領域切出手段と,
前記文字領域切出手段で切り出した文字領域から,あら
かじめ定められた特徴量を抽出する特徴量抽出手段と,
読み取り対象字種に応じたモデルまたは標準パターンを
格納した辞書手段と,前記特徴量抽出手段で抽出した特
徴量と前記辞書手段のモデルまたは標準パターンとを比
較して類似度を算出する類似度算出手段と,前記類似度
算出手段で算出した類似度に基づいて,前記文字領域の
候補文字組を生成する候補文字組生成手段と,を備えた
文字認識装置において,前記類似度算出手段が,複数の
異なる類似度算出方法を用いて同一の特徴量と同一の辞
書手段から複数の類似度を算出可能であり,前記候補文
字組生成手段が,前記類似度算出手段で算出された類似
度に基づいて,それぞれの類似度の候補文字組を生成し
た後,前記それぞれの類似度およびそれぞれの候補文字
組に基づいて,最終的な候補文字組を生成するものであ
る。
【0018】また,請求項9に係る文字認識装置は,請
求項8記載の文字認識装置において,前記類似度算出手
段が,複数の異なる類似度算出方法を用いて同一の特徴
量と同一の辞書手段から複数の類似度を算出する場合
に,前記複数の類似度の算出を所定の順序で逐次的に実
行する構成であり,かつ,先行して算出した類似度が低
い類似性を示して認識不能と判断された場合にのみ,次
の類似度の算出を行うものである。
【0019】また,請求項10に係る文字認識装置は,
請求項8記載の文字認識装置において,前記辞書手段
が,前記モデルまたは標準パターン毎に,それぞれの類
似度を算出する際に使用する少なくとも1つの類似度算
出方法を指定した指定情報を有しており,前記類似度算
出手段が,前記指定情報で指定された類似度算出方法に
基づいて,類似度を算出するものである。
【0020】また,請求項11に係る文字認識装置は,
請求項8記載の文字認識装置において,前記候補文字組
生成手段が,前記それぞれの類似度の候補文字組をキー
として,あらかじめ定められたテーブルを参照して前記
最終的な候補文字組を生成するものである。
【0021】また,請求項12に係る文字認識装置は,
請求項11記載の文字認識装置において,前記候補文字
組生成手段が,前記それぞれの類似度の候補文字組の第
1位候補文字を比較し,全ての候補文字組の第1位候補
文字が同一であれば,前記テーブルを参照することな
く,第1位候補文字を最終的な候補文字として生成する
ものである。
【0022】また,請求項13に係る文字認識装置は,
請求項11記載の文字認識装置において,前記テーブル
の内容が,何れの類似度算出方法の算出結果に従うかを
示すフラグ情報からなるものである。
【0023】
【発明の実施の形態】以下,本発明の文字認識方法,記
憶媒体および文字認識装置について,〔本発明の原
理〕,〔実施の形態1〕,〔実施の形態2〕,〔実施の
形態3〕,〔実施の形態4〕,〔実施の形態5〕,〔実
施の形態6〕の順で,図面を参照して詳細に説明する。
【0024】〔本発明の原理〕本発明の文字認識方法,
記憶媒体および文字認識装置は,同一の特徴量と同一の
辞書から複数の類似度を算出し,これらを統合すること
で認識精度の向上を図るものである。換言すれば,複数
の類似度算出方法(すなわち,複数の文字認識方法)を
統合するにあたり,標準パターンの集合である辞書と特
徴抽出処理とを同一にすることによって,メモリ空間
(メモリ量)の増大と認識処理時間の増大を抑えつつ,
認識精度の向上を図れるようにしたものである。
【0025】〔実施の形態1〕図1は,実施の形態1の
文字認識装置100の概略構成を示すブロック図であ
る。文字認識装置100は,イメージスキャナまたはタ
ブレット等の入力装置200から画像データを入力する
ための入力インターフェース(I/F)101と,装置
全体を制御するCPU102と,各種制御プログラムお
よび各種データを格納したROM103と,CPU10
2のワークエリアとして使用されるRAM104と,ホ
ストコンピュータ等の外部装置300に文字の認識結果
を出力するための出力インターフェース(I/F)10
5とから構成される。なお,図において,106はバス
を示す。
【0026】また,ROM103には,辞書(本発明の
辞書手段)が格納されていると共に,本発明の文字認識
方法の機能を実現するソフトウェアが後述する制御プロ
グラムとして格納されている。RAM104には,入力
I/F101を介して入力した画像データが格納され
る。
【0027】以上の構成において,その動作を説明す
る。図2はROM103に記憶されている制御プログラ
ム(実施の形態1の文字認識方法)の概略フローチャー
トを示し,この制御プログラムをCPU102で実行す
ることにより,実施の形態1の文字認識方法が実行され
る。
【0028】先ず,CPU102は,入力I/F101
を介して入力装置200から画像データを入力し,RA
M104に格納する(S201)。次に,画像データか
ら一文字単位で文字画像(文字領域)を切り出し(S2
02),特徴抽出処理を実行して前記切り出した文字画
像から特徴量を抽出する(S203)。
【0029】続いて,ステップS204およびS205
で,抽出した特徴量と辞書(ROM103)に格納され
ている標準パターン(またはモデル)とを比較して類似
度を算出する。
【0030】具体的には,得られた特徴量をN次元特徴
ベクトルIとして式(1)のように定義し,K個の標準
パターン(N次元ベクトル)からなる辞書Mを式(2)
のように定義する。次に,標準パターンMjについての
第1類似度D1 および第2類似度D2 をそれぞれ式
(3),式(4)に示すように定義する。ここで,第1
類似度D1 は二乗誤差総和に基づく類似度(距離)であ
り,この値が大きいほど類似性が低いことを表す。ま
た,第2類似度D2 はいわゆる市街区距離と呼ばれるも
のであり,この値も大きいほど類似性が低いことを表
す。
【0031】
【数1】
【0032】処理の流れとしては,先ず全ての標準パタ
ーンについて,第1類似度D1 を求め(S204),次
に全ての標準パターンについて,第2類似度D2 を求め
る(S205)。
【0033】続いて,ステップS206において,先
ず,算出した第1類似度D1 に基づいて第1類似度D1
の値が小さい順に全ての標準パターンをソートし,類似
度D1の値の小さい上位の数組(例えば,5組)の標準
パターンを候補文字組として生成し,同様に,算出した
第2類似度D2 に基づいて,候補文字組を生成する。し
たがって,それぞれの類似度に基づいて,二種類の候補
文字組が得られることになる。次に,第1類似度D1
候補文字組と第2類似度D2 の候補文字組を加えて,類
似度(第1類似度D1 および第2類似度D2 )でソート
して一元化し,最終的な類似度の小さい順に最終的な候
補文字組(例えば,5組)を生成する。
【0034】この最終的な候補文字組を認識結果として
出力し(S207),これが最後の文字(文字領域)で
あるか否かを判定し(S208),最後の文字(文字領
域)であれば処理を終了し,そうでなければステップS
202へ戻って,次の文字(文字領域)の切り出しを行
う。
【0035】前述したように実施の形態1によれば,同
一特徴量と同一辞書を用いて,複数の類似度を算出する
ので,辞書サイズと特徴抽出処理を追加することなく,
文字認識精度の向上を図ることができる。換言すれば,
認識処理時間の増大およびメモリ量の増大を極力抑えつ
つ,認識精度の向上を図ることができる。
【0036】なお,実施の形態1では,2種類の類似度
を算出する例を示したが,特にこれに限定するものでは
なく,3種類,4種類等のように複数の類似度を算出し
ても良い。
【0037】〔実施の形態2〕実施の形態2の文字認識
方法および文字認識装置では,図1に示した実施の形態
1と同様の構成において,複数の異なる類似度算出方法
を用いて同一の特徴量と同一の辞書から複数の類似度を
算出する場合に,複数の類似度の算出を所定の順序で逐
次的に実行し,かつ,先行して算出した類似度が低い類
似性を示して認識不能と判断された場合にのみ,次の類
似度の算出を行うようにしたものである。
【0038】以下,実施の形態2の動作を説明する。図
3はROM103に記憶されている制御プログラム(実
施の形態2の文字認識方法)の概略フローチャートを示
し,この制御プログラムをCPU102で実行すること
により,実施の形態2の文字認識方法が実行される。
【0039】先ず,CPU102は,入力I/F101
を介して入力装置200から画像データを入力し,RA
M104に格納する(S301)。次に,画像データか
ら一文字単位で文字画像(文字領域)を切り出し(S3
02),特徴抽出処理を実行して前記切り出した文字画
像から特徴量を抽出する(S303)。
【0040】続いて,全ての標準パターンについて,実
施の形態1と同様に第1類似度D1を求め(S30
4),求めた第1類似度D1 の値から類似性が十分か否
かを判定する(S305)。具体的には,求めた第1類
似度D1 の最小値はもっとも類似する標準パターンと特
徴ベクトルとの類似性を示すものであるので,第1類似
度D1 の最小値とあらかじめ定めたしきい値と比較し,
しきい値よりも小さい場合に十分に類似していると判定
する。
【0041】ステップS305で類似性が十分であると
判定された場合には,この第1類似度D1 に基づいて,
第1類似度D1 の値が小さい順に全ての標準パターンを
ソートし,類似度D1 の値の小さい上位の数組(例え
ば,5組)の標準パターンを最終的な候補文字組として
生成し(S307),この最終的な候補文字組を認識結
果として出力し(S308),これが最後の文字(文字
領域)であるか否かを判定し(S309),最後の文字
(文字領域)であれば処理を終了し,そうでなければス
テップS302へ戻って,次の文字(文字領域)の切り
出しを行う。
【0042】一方,ステップS305で類似性が十分で
ないと判定された場合には,全ての標準パターンについ
て,第2類似度D2 を求め(S306),この第2類似
度D 2 に基づいて,第2類似度D2 の値が小さい順に全
ての標準パターンをソートし,類似度D2 の値の小さい
上位の数組(例えば,5組)の標準パターンを最終的な
候補文字組として生成し(S307),この最終的な候
補文字組を認識結果として出力し(S308),これが
最後の文字(文字領域)であるか否かを判定し(S30
9),最後の文字(文字領域)であれば処理を終了し,
そうでなければステップS302へ戻って,次の文字
(文字領域)の切り出しを行う。
【0043】前述したように実施の形態2によれば,必
要に応じて同一特徴量と同一辞書を用いて,複数の類似
度を算出するので,辞書サイズと特徴抽出処理を追加す
ることなく,文字認識精度の向上を図ることができる。
換言すれば,認識処理時間の増大およびメモリ量の増大
を極力抑えつつ,認識精度の向上を図ることができる。
【0044】さらに,第1類似度D1 で十分な類似性が
得られない場合にのみ,第2類似度D2 を算出するの
で,実施の形態1と比較して,全体の認識処理時間を短
縮することができる。
【0045】〔実施の形態3〕実施の形態3の文字認識
方法および文字認識装置では,図1に示した実施の形態
1と同様の構成において,辞書(ROM103)の標準
パターン毎に,それぞれの類似度を算出する際に使用す
る少なくとも1つの類似度算出方法を指定した指定情報
を格納しておき,類似度を算出する際に,指定情報で指
定された類似度算出方法に基づいて類似度を算出するも
のである。
【0046】なお,実施の形態3では,辞書に格納され
ている全ての標準パターン毎に指定情報を設定してお
く。この指定情報は,具体的には,『0』,『1』,
『2』の3通りのフラグとして設定されており,それぞ
れ以下の意味である。『0』は第1類似度D1 を算出す
る(すなわち,第1類似度D1 の算出方法を用いて類似
度を算出する)。『1』は第2類似度D2 を算出する
(すなわち,第2類似度D2 の算出方法を用いて類似度
を算出する)。『2』は第1類似度D1 および第2類似
度D2 の両方を算出する(すなわち,第1類似度D1
算出方法を用いて類似度を算出すると共に第2類似度D
2 の算出方法を用いて類似度を算出する)。
【0047】以下,実施の形態3の動作を説明する。図
4はROM103に記憶されている制御プログラム(実
施の形態3の文字認識方法)の概略フローチャートを示
し,この制御プログラムをCPU102で実行すること
により,実施の形態3の文字認識方法が実行される。
【0048】先ず,CPU102は,入力I/F101
を介して入力装置200から画像データを入力し,RA
M104に格納する(S401)。次に,画像データか
ら一文字単位で文字画像(文字領域)を切り出し(S4
02),特徴抽出処理を実行して前記切り出した文字画
像から特徴量を抽出する(S403)。
【0049】続いて,辞書(ROM103)から標準パ
ターンを順に取り出し(S404),取り出しだ標準パ
ターンのフラグ(指定情報)は何かを判定する(S40
5)。ここで,フラグが『0』であれば,ステップS4
06へ進んで第1類似度D1のみを算出し,フラグが
『1』であれば,ステップS407へ進んで第2類似度
2 のみを算出し,フラグが『2』であれば,ステップ
S408へ進んで第1類似度D1 および第2類似度D2
の両方を算出する。
【0050】ステップS406〜S408で類似度を算
出すると,全ての標準パターンを取り出したか否かを判
定し(S409),全ての標準パターンを取り出してい
なければ,ステップS404へ戻り,次に標準パターン
を辞書から取り出して同様の処理を繰り返す。
【0051】一方,全ての標準パターンを取り出してい
れば,すなわち,全ての標準パターンについて類似度を
算出していれば,得られた類似度の小さい順に全ての標
準パターンをソートし,類似度の値の小さい上位の数組
(例えば,5組)の標準パターンを最終的な候補文字組
として生成し(S410),この最終的な候補文字組を
認識結果として出力し(S411),これが最後の文字
(文字領域)であるか否かを判定し(S412),最後
の文字(文字領域)であれば処理を終了し,そうでなけ
ればステップS402へ戻って,次の文字(文字領域)
の切り出しを行う。
【0052】なお,ステップS410において,最終的
な候補文字組を生成する際に,得られた類似度が,第1
類似度D1 のみの場合には第1類似度D1 に従って最終
的な候補文字組が生成され,第2類似度D2 のみの場合
には第2類似度D2 に従って最終的な候補文字組が生成
され,第1類似度D1 および第2類似度D2 の両方の場
合には第1類似度D1 または第2類似度D2 のうちの小
さいものに従って候補文字組が生成されることになる。
【0053】前述したように実施の形態3によれば,辞
書中の標準パターンに追加フラグ(指定情報)を持たせ
て,標準パターン毎に適切な類似度算出方法を指定する
ので,不要な類似度計算を避けることができ,文字認識
精度の向上と認識処理速度の向上の両立を図ることがで
きる。
【0054】〔実施の形態4〕実施の形態4の文字認識
方法および文字認識装置では,図1に示した実施の形態
1と同様の構成において,最終的な候補文字組を生成す
る際に,複数の類似度によって生成されたそれぞれの候
補文字組をキーとして,あらかじめ定められたテーブル
を参照して最終的な候補文字組を生成するものである。
【0055】以下,実施の形態4の動作を説明する。図
5はROM103に記憶されている制御プログラム(実
施の形態4の文字認識方法)の概略フローチャートを示
し,この制御プログラムをCPU102で実行すること
により,実施の形態4の文字認識方法が実行される。
【0056】先ず,CPU102は,入力I/F101
を介して入力装置200から画像データを入力し,RA
M104に格納する(S501)。次に,画像データか
ら一文字単位で文字画像(文字領域)を切り出し(S5
02),特徴抽出処理を実行して前記切り出した文字画
像から特徴量を抽出する(S503)。
【0057】続いて,全ての標準パターンについて,第
1類似度D1 を求め(S504),次に全ての標準パタ
ーンについて,第2類似度D2 を求める(S505)。
【0058】さらに,ステップS506において,先
ず,算出した第1類似度D1 に基づいて第1類似度D1
の値が小さい順に全ての標準パターンをソートし,類似
度D1の値の小さい上位の数組(例えば,5組)の標準
パターンを候補文字組として生成し,同様に,算出した
第2類似度D2 に基づいて,候補文字組を生成する。し
たがって,それぞれの類似度に基づいて,二種類の候補
文字組が得られることになる。次に,それぞれの候補文
字組から第1位候補(最も類似度の値の小さい候補文
字)を取り出して,2つの第1位候補をキーとして,あ
らかじめROM103に格納してあるテーブルを検索
し,対応する内容を取り出して該当する文字を最終的な
候補文字とする。
【0059】2つの第1位候補をキーとして,あらかじ
めROM103に格納してあるテーブルを検索する具体
な方法としては,例えば,第1位候補として文字α(α
は任意の文字)と文字β(βは任意の文字)が存在する
場合に,この2つの文字α,βの組み合わせから最も確
からしいと思われる文字(多くはαまたはβの何れか)
を候補文字として特定できるようにK×Kのテーブル
(Kは辞書で取り扱う文字数に相当する)を作成し,こ
のテーブルをあらかじめROM103に格納しておく。
ここで,説明を簡単にするために,図6に示す0〜9の
数字を認識対象とした10×10のテーブルを例として
説明する。なお,同図において,『?』は認識不能と判
断すべきことを意味する。
【0060】図6において,2つの第1位候補の文字を
キーとして,テーブルを検索し,対応する内容を取り出
して,これを最終的な候補とする。例えば,第1類似度
1に基づく第1位候補が『3』で,第2類似度D2
基づく第1位候補が『2』であるとすれば,対応する内
容は『2』であるから,この場合の最終的な候補は
『2』となる。
【0061】この最終的な候補文字を認識結果として出
力し(S507),これが最後の文字(文字領域)であ
るか否かを判定し(S508),最後の文字(文字領
域)であれば処理を終了し,そうでなければステップS
502へ戻って,次の文字(文字領域)の切り出しを行
う。
【0062】なお,上記ステップS506では,第1位
候補のみをキーとして最終的な候補文字を作成したが,
同様に第1類似度D1 および第2類似度D2 の第2位候
補をキーとして最終的な第2位候補を作成し,複数の候
補文字を組(候補文字組)として生成することも可能で
ある。
【0063】前述したように実施の形態4によれば,同
一特徴量と同一辞書を用いて,複数の類似度を算出する
ので,辞書サイズと特徴抽出処理を追加することなく,
文字認識精度の向上を図ることができる。換言すれば,
認識処理時間の増大およびメモリ量の増大を極力抑えつ
つ,認識精度の向上を図ることができる。
【0064】また,あらかじめ格納してあるテーブルを
検索して最終的な候補文字組を生成するので,簡単な構
成で柔軟な制御が可能となり,文字認識精度の向上と文
字認識処理速度の向上を図ることができる。
【0065】〔実施の形態5〕実施の形態5は,実施の
形態4と同様の構成および動作において,図5のステッ
プS506の処理において,それぞれの類似度の第1位
候補を比較し,第1位候補が同一であれば,テーブルを
参照することなく,第1位候補を最終的な候補文字とし
て生成するものである。
【0066】実施の形態5によれば,必要に応じて,テ
ーブルの検索処理を省略できるので,さらに文字認識処
理速度の向上を図ることができる。
【0067】〔実施の形態6〕実施の形態6は,実施の
形態4と同様の構成および動作において,図5のステッ
プS506の処理において用いるテーブルの内容が,最
終的に選択されるべき文字カテゴリそのものではなく,
何れの類似度(すなわち,何れの類似度算出方法の算出
結果)に従うかを示すフラグ情報からなるものである。
【0068】図7は,実施の形態6のテーブル例を示
し,機能的には図6のテーブルと同一であるが,表現の
仕方が異なっている。フラグ『0』は第1類似度D1
基づく第1位候補を最終結果とすることを意味し,フラ
グ『1』は第2類似度D2 に基づく第1位候補を最終結
果とすることを意味し,フラグ『−1』は認識不能とす
べきことを意味する。例えば,第1類似度D1 に基づく
第1位候補が『3』で,第2類似度D2 に基づく第1位
候補が『2』であるとすれば,対応するフラグは『1』
であるから,この場合の最終的な候補は第2類似度D2
に基づく第1位候補である『2』となる。
【0069】実施の形態6によれば,テーブルの内容と
してフラグ情報を用いるので,実施の形態4と比較して
テーブルサイズを小さくすることができる。
【0070】
【発明の効果】以上説明したように,本発明の文字認識
方法(請求項1)および文字認識装置(請求項8)は,
複数の異なる類似度算出方法を用いて同一の特徴量と同
一の辞書から複数の類似度を算出し,算出された類似度
に基づいてそれぞれの類似度の候補文字組を生成した
後,それぞれの類似度およびそれぞれの候補文字組に基
づいて,最終的な候補文字組を生成するため,認識処理
時間の増大およびメモリ量の増大を極力抑えつつ,認識
精度の向上を図ることができる。
【0071】また,本発明の文字認識方法(請求項2)
および文字認識装置(請求項9)は,請求項1記載の文
字認識方法または請求項8記載の文字認識装置におい
て,複数の異なる類似度算出方法を用いて同一の特徴量
と同一の辞書から複数の類似度を算出する場合に,複数
の類似度の算出を所定の順序で逐次的に実行し,かつ,
先行して算出した類似度が低い類似性を示して認識不能
と判断された場合にのみ,次の類似度の算出を行うた
め,全体の認識処理時間の短縮を図ることができる。
【0072】また,本発明の文字認識方法(請求項3)
および文字認識装置(請求項10)は,請求項1記載の
文字認識方法または請求項8記載の文字認識装置におい
て,前記辞書が,前記モデルまたは標準パターン毎に,
それぞれの類似度を算出する際に使用する少なくとも1
つの類似度算出方法を指定した指定情報を有しており,
前記類似度を算出する際に,前記指定情報で指定された
類似度算出方法に基づいて,類似度を算出するため,不
要な類似度計算を避けることができ,文字認識精度の向
上と認識処理速度の向上の両立を図ることができる。
【0073】また,本発明の文字認識方法(請求項4)
および文字認識装置(請求項11)は,請求項1記載の
文字認識方法または請求項8記載の文字認識装置におい
て,前記候補文字組を生成する際に,前記それぞれの類
似度の候補文字組をキーとして,あらかじめ定められた
テーブルを参照して前記最終的な候補文字組を生成する
ため,簡単な構成で柔軟な制御が可能となり,文字認識
精度の向上と文字認識処理速度の向上を図ることができ
る。
【0074】また,本発明の文字認識方法(請求項5)
および文字認識装置(請求項12)は,請求項4記載の
文字認識方法または請求項11記載の文字認識装置にお
いて,前記候補文字組を生成する際に,前記それぞれの
類似度の候補文字組の第1位候補文字を比較し,全ての
候補文字組の第1位候補文字が同一であれば,前記テー
ブルを参照することなく,第1位候補文字を最終的な候
補文字として生成するため,必要に応じてテーブルの検
索処理を省略でき,さらに文字認識処理速度の向上を図
ることができる。
【0075】また,本発明の文字認識方法(請求項6)
および文字認識装置(請求項13)は,請求項4記載の
文字認識方法または請求項11記載の文字認識装置にお
いて,前記テーブルの内容が,何れの類似度算出方法の
算出結果に従うかを示すフラグ情報からなるため,テー
ブルサイズを小さくすることができる。換言すれば,メ
モリ量の増大をさらに小さくすることができる。
【0076】また,本発明の記憶媒体(請求項7)は,
請求項1ないし6記載の文字認識方法の機能を実現する
ソフトウェアを格納したため,認識処理時間の増大およ
びメモリ量の増大を極力抑えつつ,認識精度の向上を図
れる文字認識方法を容易に提供できる。
【図面の簡単な説明】
【図1】実施の形態1の文字認識装置の概略構成を示す
ブロック図である。
【図2】ROMに記憶されている制御プログラム(実施
の形態1の文字認識方法)の概略フローチャートであ
る。
【図3】ROMに記憶されている制御プログラム(実施
の形態2の文字認識方法)の概略フローチャートであ
る。
【図4】ROMに記憶されている制御プログラム(実施
の形態3の文字認識方法)の概略フローチャートであ
る。
【図5】ROMに記憶されている制御プログラム(実施
の形態4の文字認識方法)の概略フローチャートであ
る。
【図6】実施の形態4のテーブル例を示す説明図であ
る。
【図7】実施の形態6のテーブル例を示す説明図であ
る。
【符号の説明】
100 文字認識装置 101 入力インターフェース(I/F) 102 CPU 103 ROM 104 RAM 105 出力インターフェース(I/F) 106 バス 200 入力装置 300 外部装置

Claims (13)

    【特許請求の範囲】
  1. 【請求項1】 画像データから文字領域を切り出し,切
    り出した文字領域から特徴量を抽出し,抽出した特徴量
    と辞書に格納されているモデルまたは標準パターンとを
    比較して類似度を算出し,算出した類似度に基づいて前
    記文字領域の候補文字組を生成する文字認識方法におい
    て,前記類似度を算出する工程が,複数の異なる類似度
    算出方法を用いて同一の特徴量と同一の辞書から複数の
    類似度を算出可能な工程を含み,前記候補文字組を生成
    する工程が,前記算出された類似度に基づいて,それぞ
    れの類似度の候補文字組を生成した後,前記それぞれの
    類似度およびそれぞれの候補文字組に基づいて,最終的
    な候補文字組を生成する工程を含むことを特徴とする文
    字認識方法。
  2. 【請求項2】 請求項1記載の文字認識方法において,
    前記類似度を算出する工程が,複数の異なる類似度算出
    方法を用いて同一の特徴量と同一の辞書から複数の類似
    度を算出する場合に,前記複数の類似度の算出を所定の
    順序で逐次的に実行し,かつ,先行して算出した類似度
    が低い類似性を示して認識不能と判断された場合にの
    み,次の類似度の算出を行うことを特徴とする文字認識
    方法。
  3. 【請求項3】 請求項1記載の文字認識方法において,
    前記辞書が,前記モデルまたは標準パターン毎に,それ
    ぞれの類似度を算出する際に使用する少なくとも1つの
    類似度算出方法を指定した指定情報を有しており,前記
    類似度を算出する工程が,前記指定情報で指定された類
    似度算出方法に基づいて,類似度を算出することを特徴
    とする文字認識方法。
  4. 【請求項4】 請求項1記載の文字認識方法において,
    前記候補文字組を生成する工程が,前記それぞれの類似
    度の候補文字組をキーとして,あらかじめ定められたテ
    ーブルを参照して前記最終的な候補文字組を生成するこ
    とを特徴とする文字認識方法。
  5. 【請求項5】 請求項4記載の文字認識方法において,
    前記候補文字組を生成する工程が,前記それぞれの類似
    度の候補文字組の第1位候補文字を比較し,全ての候補
    文字組の第1位候補文字が同一であれば,前記テーブル
    を参照することなく,第1位候補文字を最終的な候補文
    字として生成することを特徴とする文字認識方法。
  6. 【請求項6】 請求項4記載の文字認識方法において,
    前記テーブルの内容が,何れの類似度算出方法の算出結
    果に従うかを示すフラグ情報からなることを特徴とする
    文字認識方法。
  7. 【請求項7】 請求項1ないし6記載の文字認識方法の
    機能を実現するソフトウェアを格納したことを特徴とす
    る記憶媒体。
  8. 【請求項8】 画像データから文字領域を切り出す文字
    領域切出手段と,前記文字領域切出手段で切り出した文
    字領域から,あらかじめ定められた特徴量を抽出する特
    徴量抽出手段と,読み取り対象字種に応じたモデルまた
    は標準パターンを格納した辞書手段と,前記特徴量抽出
    手段で抽出した特徴量と前記辞書手段のモデルまたは標
    準パターンとを比較して類似度を算出する類似度算出手
    段と,前記類似度算出手段で算出した類似度に基づい
    て,前記文字領域の候補文字組を生成する候補文字組生
    成手段と,を備えた文字認識装置において,前記類似度
    算出手段が,複数の異なる類似度算出方法を用いて同一
    の特徴量と同一の辞書手段から複数の類似度を算出可能
    であり,前記候補文字組生成手段が,前記類似度算出手
    段で算出された類似度に基づいて,それぞれの類似度の
    候補文字組を生成した後,前記それぞれの類似度および
    それぞれの候補文字組に基づいて,最終的な候補文字組
    を生成することを特徴とする文字認識装置。
  9. 【請求項9】 請求項8記載の文字認識装置において,
    前記類似度算出手段が,複数の異なる類似度算出方法を
    用いて同一の特徴量と同一の辞書手段から複数の類似度
    を算出する場合に,前記複数の類似度の算出を所定の順
    序で逐次的に実行する構成であり,かつ,先行して算出
    した類似度が低い類似性を示して認識不能と判断された
    場合にのみ,次の類似度の算出を行うことを特徴とする
    文字認識装置。
  10. 【請求項10】 請求項8記載の文字認識装置におい
    て,前記辞書手段が,前記モデルまたは標準パターン毎
    に,それぞれの類似度を算出する際に使用する少なくと
    も1つの類似度算出方法を指定した指定情報を有してお
    り,前記類似度算出手段が,前記指定情報で指定された
    類似度算出方法に基づいて,類似度を算出することを特
    徴とする文字認識装置。
  11. 【請求項11】 請求項8記載の文字認識装置におい
    て,前記候補文字組生成手段が,前記それぞれの類似度
    の候補文字組をキーとして,あらかじめ定められたテー
    ブルを参照して前記最終的な候補文字組を生成すること
    を特徴とする文字認識装置。
  12. 【請求項12】 請求項11記載の文字認識装置におい
    て,前記候補文字組生成手段が,前記それぞれの類似度
    の候補文字組の第1位候補文字を比較し,全ての候補文
    字組の第1位候補文字が同一であれば,前記テーブルを
    参照することなく,第1位候補文字を最終的な候補文字
    として生成することを特徴とする文字認識装置。
  13. 【請求項13】 請求項11記載の文字認識装置におい
    て,前記テーブルの内容が,何れの類似度算出方法の算
    出結果に従うかを示すフラグ情報からなることを特徴と
    する文字認識装置。
JP8154644A 1996-06-14 1996-06-14 文字認識方法,記憶媒体および文字認識装置 Pending JPH103518A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8154644A JPH103518A (ja) 1996-06-14 1996-06-14 文字認識方法,記憶媒体および文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8154644A JPH103518A (ja) 1996-06-14 1996-06-14 文字認識方法,記憶媒体および文字認識装置

Publications (1)

Publication Number Publication Date
JPH103518A true JPH103518A (ja) 1998-01-06

Family

ID=15588735

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8154644A Pending JPH103518A (ja) 1996-06-14 1996-06-14 文字認識方法,記憶媒体および文字認識装置

Country Status (1)

Country Link
JP (1) JPH103518A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103714338A (zh) * 2012-09-28 2014-04-09 欧姆龙株式会社 图像处理装置和图像处理方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103714338A (zh) * 2012-09-28 2014-04-09 欧姆龙株式会社 图像处理装置和图像处理方法

Similar Documents

Publication Publication Date Title
JP3689455B2 (ja) 情報処理方法及び装置
JP2726568B2 (ja) 文字認識方法及び装置
JPH0981730A (ja) パターン認識方法及び装置及びコンピュータ制御装置
JPH11184894A (ja) 論理要素抽出方法および記録媒体
JP2011065255A (ja) データ処理装置、データ名生成方法及びコンピュータプログラム
JPH103518A (ja) 文字認識方法,記憶媒体および文字認識装置
CN115858797A (zh) 一种基于ocr技术生成中文近义词的方法及系统
JPH05314320A (ja) 認識距離の差と候補順を利用した認識結果の評価方式
JP2001043316A (ja) 文書画像処理方法、文書画像処理装置及び記録媒体
JP3009078B2 (ja) 文字認識装置
CN117573839B (zh) 文档检索方法、人机交互方法、电子设备及存储介质
CN117113268B (zh) 多尺度数据融合方法、装置、介质及电子设备
CN118015385B (zh) 一种基于多模态模型的长尾目标检测方法、装置和介质
JPH05346974A (ja) 文字認識装置
JP4328511B2 (ja) パターン認識装置、パターン認識方法、プログラムおよび記憶媒体
JPH1166230A (ja) 文書認識装置、文書認識方法及び媒体
JPH0830725A (ja) 画像処理装置及び方法
JP2740506B2 (ja) 画像認識方法
JP2001184460A (ja) 手書き文字認識装置および方法
JPH1166232A (ja) 帳票定義方法
JP2002162986A (ja) 情報処理装置及びその方法、コンピュータ可読メモリ
JP2013246721A (ja) 文字列認識装置、文字列認識プログラム、及び記録媒体
JPH10307839A (ja) テキスト検索装置及び方法
JPS62281082A (ja) 文字認識装置
JPH0620098A (ja) 文字認識装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040622

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040914

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20050510