JP3251704B2 - 認識処理装置 - Google Patents
認識処理装置Info
- Publication number
- JP3251704B2 JP3251704B2 JP12609693A JP12609693A JP3251704B2 JP 3251704 B2 JP3251704 B2 JP 3251704B2 JP 12609693 A JP12609693 A JP 12609693A JP 12609693 A JP12609693 A JP 12609693A JP 3251704 B2 JP3251704 B2 JP 3251704B2
- Authority
- JP
- Japan
- Prior art keywords
- dictionary
- recognition processing
- recognition
- similarity
- character
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Landscapes
- Character Discrimination (AREA)
Description
(OCR)、オンライン手書き文字認識、音声認識等に
好適な、入力パターンに対して登録辞書中から解を検知
する認識処理装置に関する。
R)、オンライン手書き文字認識、音声認識等の分野で
は、入力された処理対象とする入力パターンについて、
予め登録された辞書とのマッチングを行なうことで解
(認識結果)を求めている。
文字認識処理における辞書マッチングでは、未知パター
ンが入力される毎に、毎回、辞書に登録された全ての辞
書データとの照合を行なう。そして、最高の類似度(類
似性の度合い)を与える辞書データを解として出力す
る。従って、文字認識処理に供される文書等に含まれる
文字数に比例して、認識処理時間を要することになる。
認識処理では、入力パターンに対して、毎回、登録辞書
の全ての辞書パターンとのマッチングを行なっているた
めに、入力文字数に比例する処理時間を要していた。従
って、長文の文書等の処理を行なう際には、非常に長い
処理時間が必要となってしまう。本発明は前記のような
点に鑑みてなされたもので、認識処理の処理速度を向上
させた認識処理装置を提供することを目的とする。
出力されるイメージから1文字毎に文字パターンを切り
出し、その切り出された文字イメージと認識辞書とを照
合して文字認識を行なう認識部とを備える認識処理装置
において、認識可能な全てのパターンに対する辞書デー
タが格納され、文字毎に第2の辞書への登録フラグが設
けられる第1の辞書と、前記第1の辞書に格納された一
部の辞書データが動的に格納され、その文字毎に決定類
似度が設けられる第2の辞書と、前記文字イメージと前
記第1の辞書とを照合して得られた類似度の中から最高
の類似度を持つ辞書データを前記第2の辞書に登録する
と共に、その類似度を決定類似度として格納する第2の
辞書登録手段と、認識対象とする文字イメージと前記第
2の辞書と照合して得られた認識文字の類似度が、対応
する前記第2の辞書に格納された前記決定類似度を超え
ている場合、当該認識文字を解として出力する第1の認
識処理手段と、前記第1の認識処理手段での前記類似度
が前記決定類似度を超えていない場合、前記文字イメー
ジと前記第1の辞書と照合して、類似度が最も高い文字
の辞書データを解として出力する第2の認識処理手段
と、前記第2の認識処理手段によって得られた前記辞書
データの前記登録フラグを参照して、解として出力され
て前記辞書データが既に前記第2の辞書に格納されてい
る場合、前記第2の認識処理手段で得られた類似度を第
2の辞書の対応する決定類似度に上書きし、前記辞書デ
ータが前記第2の辞書に格納されていない場合、前記辞
書データを前記第2の辞書に登録すると共に、前記第1
の辞書データの前記登録フラグをセットする手段とを具
備したことを特徴とする。
納手段に格納された辞書データを示す情報に対応づけ
て、前記情報が示す辞書データを用いた認識処理の結果
を解とすべきかを判別するための基準と、前記情報が示
す辞書データを用いた認識処理の結果を解とすべきと判
別された頻度とが登録されることを特徴とする。
認識処理によって解とすべき認識結果が得られた場合
に、該当する辞書データを示す情報が前記動的辞書手段
に登録されていなければ、前記頻度の最も低い情報に代
えて登録されることを特徴とする。
合、以前認識した文字を再度認識する可能性が高い。こ
のため、以前認識した文字について、その際の辞書デー
タを示す情報(辞書アドレス)を登録するための動的辞
書手段(動的辞書テーブル)と、同テーブルに登録する
た否かを判別する登録手段(テーブル登録処理部)を設
けることで、認識処理の時間の短縮が図れる。
明する。図1は本発明の一実施例に係わる光学的等文字
読取装置(OCR)の構成を示すブロック図である。図
1に示すように光学的文字読取装置(OCR)は、制御
装置10、スキャナ装置12、認識処理装置20によっ
て構成されている。
識処理装置20を制御するもので、CRT等の表示装
置、キーボード等の入力装置を備えている。スキャナ装
置12は、一般印刷物、帳票、手書き文書等に記録され
たイメージを、光学的に走査することにより取り込むも
のである。
のもとに、スキャナ装置12によって取り込まれたイメ
ージから文字列を検出し、さらに各文字イメージを切り
出し、対応する文字コード等の情報(認識結果)を制御
装置10に出力するものである。
辞書メモリ24、動的辞書テーブル26が設けられてい
る。認識処理部22は、認識処理装置20全体を制御す
るもので、辞書メモリ24に格納された辞書データを参
照しながら認識処理を行なう。認識処理部22には認識
処理を行なうための各処理部が設けられており、テーブ
ル登録処理部221、第1認識処理部222、及び第2
認識処理部223を含んでいる。
ーブル26へのデータの登録、変更、参照等を行なう。
第1認識処理部222は、動的辞書テーブル26が示す
辞書データを参照して認識処理を行なう。第2認識処理
部223は、辞書メモリ24に格納された全ての辞書デ
ータを参照して認識処理を行なう。
る文字認識処理でマッチングされる辞書データを格納す
るためのものである。辞書メモリ24には、図2に示す
ように、認識可能な全ての文字毎に辞書データが用意さ
れ、各辞書データに対応して、動的辞書テーブル26に
セットされているか否かを示すための登録フラグが設け
られている。本実施例では、動的辞書テーブル26にセ
ットされている場合(詳細については後述する)、登録
フラグは“1”とする。各辞書データは、辞書アドレス
によって指定される。
文字、すなわち認識結果として該当した辞書データを示
す辞書アドレスを格納するためのものである。動的辞書
テーブル26は、例えば図3に示すような構造になって
いる。動的辞書テーブル26には、M個分の辞書アドレ
スを格納することができ、各辞書アドレスに対応づけて
決定類似度(0.00〜1.00までのフロート値)及
び頻度が格納される。決定類似度は、対応する辞書アド
レスが示す辞書データを用いた認識処理における類似度
の比較対象となるもので、動的辞書テーブル26に格納
された辞書アドレスが示す辞書データを解とすべきか判
別するためのものである。頻度は、対応する辞書アドレ
スが示す辞書データを用いた認識処理による類似度が、
対応する決定類似度を超えた回数を示す。なお、動的辞
書テーブル26は、初期値が全て“NULL”であり、
認識処理が行なわれることによって、順次前述したよう
なデータが格納される。図3は、3文字を認識した後の
動的辞書テーブル26の内容を示している。
まず、スキャナ装置12において処理対象とする文書等
のイメージが読取られ、認識処理装置20に転送され
る。認識処理装置20は、イメージ中から文字列の検
出、文字イメージの切り出しを行なう。認識処理部22
は、切り出され文字イメージについて、図4に示すフロ
ーチャートに従って認識処理を実行する。
書アドレスがM個分登録されて準備が完了してから、第
1認識処理部222によって参照されるものとする(ス
テップS1)。従って、少なくともM個の文字イメージ
について、第2認識処理部223は、辞書メモリ24に
格納された全ての辞書データとのマッチングを行ない、
最高の類似度を与える辞書データを解(認識結果)とし
て取得する(ステップS6)。
2認識処理部223によって取得された辞書データに該
当する辞書アドレス、及び認識処理により求められた類
似度を動的辞書テーブル26に格納する(NULLの領
域に対して優先的に格納する)と共に、頻度を1インク
リメント(この時は頻度1)する(ステップS7,S
8)。第2認識処理部223によって取得された認識結
果は、制御装置10に出力される(ステップS5)。
個分登録されて準備が完了してから(ステップS1)、
次の文字イメージについての認識処理から動的辞書テー
ブル26が参照される。第1認識処理部222は、動的
辞書テーブル26に格納された辞書アドレスが示す辞書
データを用いて認識処理を行なう(ステップS2)。
辞書アドレスと対応する決定類似度を超えるものがある
場合、動的辞書テーブル26の辞書アドレスと対応する
頻度を1インクリメントすると共に(ステップS4)、
解として出力する(ステップS5)。この場合、最大で
もM個の辞書データとのマッチングを行なうだけにな
る。
(ステップS3)、第2認識処理部223は、辞書メモ
リ24に格納された全ての辞書データとのマッチングを
行ない、最高の類似度を与える辞書データを解(認識結
果)として取得する(ステップS6)。
データの登録フラグが“1”である場合(ステップS
7)、すなわち動的辞書テーブル26に辞書アドレスが
登録されている場合、テーブル登録処理部221は、認
識処理によって得られた類似度を、辞書アドレスに対応
する決定類似度に上書きする(ステップS9)。
ージ)は、動的辞書テーブル26に解とする辞書データ
の辞書アドレスが登録されているにもかかわらず、入力
パターンの変形等のために、前回の同じ文字の文字イメ
ージについての認識処理による類似度を超えることがで
きなかったことになる。類似度を上書きして変更するこ
とにより(決定類似度の値は低くなる)、次回、同じ文
字の文字イメージについての認識処理を行なう際、前述
のように多少イメージが変形していても、動的辞書テー
ブル26を用いた第1認識処理部222による認識処理
で解を取得することができる。
理の結果である辞書データの登録フラグが“0”である
場合(ステップS7)、テーブル登録処理部221は、
該当する辞書データの辞書アドレスを動的辞書テーブル
26に登録する(ステップS8)。
辞書アドレスが既に登録されているため、テーブル登録
処理部221は、動的辞書テーブル26中の頻度の最も
低い辞書アドレスに代えて、第2認識処理部223によ
る認識処理の結果である辞書データの辞書アドレス、類
似度、及び頻度を登録する。なお、類似度は認識処理の
結果より若干低めとし(sim−Δsimの値を登
録)、頻度は1とする。また、書き替えられた辞書アド
レスに対応する辞書メモリ24中の辞書データの登録フ
ラグを“1”とする。
果、動的辞書テーブル26には、認識対象として出現頻
度の高い文字の辞書データを示す辞書アドレスが登録さ
れることになる。従って、動的辞書テーブル26を用い
た第1認識処理部222による認識処理を優先して行な
うことにより、認識処理の短縮が実現される。
アドレスの個数Mを100、動的辞書テーブル26のヒ
ット率を50%、認識辞書データ総数を4000字、1
文字にかかる認識時間をαとし、認識対象とする文書の
文字数を1000字とすると以下に示す程度の処理速度
の短縮が可能となる。
は文字数に比例する1000α時間要するが、本発明の
認識装置による処理時間は、 100α+((100α/4000)×450)×2+
450α=572.5α となり、40%弱の短縮となる。(なお、データ登録処
理時間を無視するものとする。)このようにして、認識
対象として出現頻度の高い文字の辞書データを示す辞書
アドレスを動的辞書テーブル26に登録し、この動的辞
書テーブル26を用いた認識処理を優先して行なうこと
により、長文の文書では同じ文字が多く含まれるので、
辞書メモリ24中の全ての辞書データを用いた認識処理
が行なわれず、大幅な認識時間の短縮が可能となる。
ーブル26にM個の辞書アドレスが登録され準備が完了
してから、第1認識処理部222による動的辞書テーブ
ル26を用いた認識処理を行なうものとして説明した
が、登録数に関係なく優先して行なうようにしても良
い。
た「徴」「微」のような文字については、先に動的辞書
テーブル26に登録されたものに解が傾く場合がある
が、このような似た文字については両方の文字を優先的
に動的テーブル26に登録するようにしても良い。
字読取装置(OCR)における文字認識を例にして説明
したが、オンライン手書き文字認識、音声認識などの登
録辞書から解を求める分野で適用可能である。
を行なう毎に動的辞書テーブルを生成し、次の認識対象
とするパターンについて動的辞書テーブルを利用して認
識処理を行なうことにより、認識処理の処理速度を向上
させることが可能となるものである。
を示すブロック図。
図。
ト。
装置、22…認識処理部、24…辞書メモリ、26…動
的辞書テーブル、221…テーブル登録処理部、222
…第1認識処理部、223…第2認識処理部。
Claims (1)
- 【請求項1】 スキャナから出力されるイメージから1
文字毎に文字パターンを切り出し、その切り出された文
字イメージと認識辞書とを照合して文字認識を行なう認
識部とを備える認識処理装置において、 認識可能な全てのパターンに対する辞書データが格納さ
れ、文字毎に第2の辞書への登録フラグが設けられる第
1の辞書と、 前記第1の辞書に格納された一部の辞書データが動的に
格納され、その文字毎に決定類似度が設けられる第2の
辞書と、 前記文字イメージと前記第1の辞書とを照合して得られ
た類似度の中から最高の類似度を持つ辞書データを前記
第2の辞書に登録すると共に、その類似度を決定類似度
として格納する第2の辞書登録手段と、 認識対象とする文字イメージと前記第2の辞書と照合し
て得られた認識文字の類似度が、対応する前記第2の辞
書に格納された前記決定類似度を超えている場合、当該
認識文字を解として出力する第1の認識処理手段と、 前記第1の認識処理手段での前記類似度が前記決定類似
度を超えていない場合、前記文字イメージと前記第1の
辞書と照合して、類似度が最も高い文字の辞書データを
解として出力する第2の認識処理手段と、 前記第2の認識処理手段によって得られた前記辞書デー
タの前記登録フラグを参照して、解として出力されて前
記辞書データが既に前記第2の辞書に格納されている場
合、前記第2の認識処理手段で得られた類似度を第2の
辞書の対応する決定類似度に上書きし、前記辞書データ
が前記第2の辞書に格納されていない場合、前記辞書デ
ータを前記第2の辞書に登録すると共に、前記第1の辞
書データの前記登録フラグをセットする手段と、 を具備したことを特徴とする認識処理装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP12609693A JP3251704B2 (ja) | 1993-05-27 | 1993-05-27 | 認識処理装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP12609693A JP3251704B2 (ja) | 1993-05-27 | 1993-05-27 | 認識処理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH06337964A JPH06337964A (ja) | 1994-12-06 |
JP3251704B2 true JP3251704B2 (ja) | 2002-01-28 |
Family
ID=14926514
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP12609693A Expired - Lifetime JP3251704B2 (ja) | 1993-05-27 | 1993-05-27 | 認識処理装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3251704B2 (ja) |
-
1993
- 1993-05-27 JP JP12609693A patent/JP3251704B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JPH06337964A (ja) | 1994-12-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPH05143707A (ja) | 符号化画像データの処理方法および装置 | |
JP3251704B2 (ja) | 認識処理装置 | |
US5854860A (en) | Image filing apparatus having a character recognition function | |
JPH06290251A (ja) | 電子ファイル装置の文書画像処理方法 | |
JP2751865B2 (ja) | 文字列認識装置 | |
JP2932667B2 (ja) | 情報の検索方法および情報蓄積装置 | |
JP3114446B2 (ja) | 文字認識装置 | |
JPH0516069B2 (ja) | ||
JP3725953B2 (ja) | 文字認識装置 | |
JPH10198688A (ja) | 定型文書読み取り装置 | |
JP2640472B2 (ja) | 文字認識方法 | |
JP3085508B2 (ja) | 電子帳票検索システム | |
JP3305367B2 (ja) | データベースへのデータ入力装置 | |
JP3360030B2 (ja) | 文字認識装置および文字認識方法および文字認識方法をプログラムの形で記録した記録媒体 | |
JP2902097B2 (ja) | 情報処理装置及び文字認識装置 | |
JP2977244B2 (ja) | 文字認識方法及び文字認識装置 | |
JPH07152856A (ja) | 光学的文字読取装置 | |
JP3058706B2 (ja) | 住所カナの漢字変換方法 | |
JP3419425B2 (ja) | 認識文字補正装置 | |
JP3116453B2 (ja) | 英文字認識装置 | |
JP4261831B2 (ja) | 文字認識処理方法、文字認識処理装置、文字認識プログラム | |
JP3243389B2 (ja) | 文書識別方法 | |
JP2746345B2 (ja) | 文字認識の後処理方法 | |
JP2784004B2 (ja) | 文字認識装置 | |
JP2839515B2 (ja) | 文字読取システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20071116 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081116 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081116 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091116 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101116 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101116 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111116 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111116 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121116 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131116 Year of fee payment: 12 |
|
EXPY | Cancellation because of completion of term |