JP3251704B2 - 認識処理装置 - Google Patents

認識処理装置

Info

Publication number
JP3251704B2
JP3251704B2 JP12609693A JP12609693A JP3251704B2 JP 3251704 B2 JP3251704 B2 JP 3251704B2 JP 12609693 A JP12609693 A JP 12609693A JP 12609693 A JP12609693 A JP 12609693A JP 3251704 B2 JP3251704 B2 JP 3251704B2
Authority
JP
Japan
Prior art keywords
dictionary
recognition processing
recognition
similarity
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP12609693A
Other languages
English (en)
Other versions
JPH06337964A (ja
Inventor
正則 寺崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP12609693A priority Critical patent/JP3251704B2/ja
Publication of JPH06337964A publication Critical patent/JPH06337964A/ja
Application granted granted Critical
Publication of JP3251704B2 publication Critical patent/JP3251704B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、光学的文字読取装置
(OCR)、オンライン手書き文字認識、音声認識等に
好適な、入力パターンに対して登録辞書中から解を検知
する認識処理装置に関する。
【0002】
【従来の技術】一般に、光学的文字読取装置(OC
R)、オンライン手書き文字認識、音声認識等の分野で
は、入力された処理対象とする入力パターンについて、
予め登録された辞書とのマッチングを行なうことで解
(認識結果)を求めている。
【0003】以下、文字認識処理を例にして説明する。
文字認識処理における辞書マッチングでは、未知パター
ンが入力される毎に、毎回、辞書に登録された全ての辞
書データとの照合を行なう。そして、最高の類似度(類
似性の度合い)を与える辞書データを解として出力す
る。従って、文字認識処理に供される文書等に含まれる
文字数に比例して、認識処理時間を要することになる。
【0004】
【発明が解決しようとする課題】このように従来の文字
認識処理では、入力パターンに対して、毎回、登録辞書
の全ての辞書パターンとのマッチングを行なっているた
めに、入力文字数に比例する処理時間を要していた。従
って、長文の文書等の処理を行なう際には、非常に長い
処理時間が必要となってしまう。本発明は前記のような
点に鑑みてなされたもので、認識処理の処理速度を向上
させた認識処理装置を提供することを目的とする。
【0005】
【課題を解決するための手段】本発明は、スキャナから
出力されるイメージから1文字毎に文字パターンを切り
出し、その切り出された文字イメージと認識辞書とを照
合して文字認識を行なう認識部とを備える認識処理装置
において、認識可能な全てのパターンに対する辞書デー
が格納され、文字毎に第2の辞書への登録フラグが設
けられる第1の辞書と、前記第1の辞書に格納された一
部の辞書データが動的に格納され、その文字毎に決定類
似度が設けられる第2の辞書と、前記文字イメージと前
記第1の辞書とを照合して得られた類似度の中から最高
の類似度を持つ辞書データを前記第2の辞書に登録する
と共に、その類似度を決定類似度として格納する第2の
辞書登録手段と、認識対象とする文字イメージと前記第
2の辞書と照合して得られた認識文字の類似度が、対応
する前記第2の辞書に格納された前記決定類似度を超え
ている場合、当該認識文字を解として出力する第1の認
識処理手段と、前記第1の認識処理手段での前記類似度
が前記決定類似度を超えていない場合、前記文字イメー
ジと前記第1の辞書と照合して、類似度が最も高い文字
の辞書データを解として出力する第2の認識処理手段
と、前記第2の認識処理手段によって得られた前記辞書
データの前記登録フラグを参照して、解として出力され
て前記辞書データが既に前記第2の辞書に格納されてい
る場合、前記第2の認識処理手段で得られた類似度を第
2の辞書の対応する決定類似度に上書きし、前記辞書デ
ータが前記第2の辞書に格納されていない場合、前記辞
書データを前記第2の辞書に登録すると共に、前記第1
の辞書データの前記登録フラグをセットする手段とを具
備したことを特徴とする。
【0006】また、前記動的辞書手段には、前記辞書格
納手段に格納された辞書データを示す情報に対応づけ
て、前記情報が示す辞書データを用いた認識処理の結果
を解とすべきかを判別するための基準と、前記情報が示
す辞書データを用いた認識処理の結果を解とすべきと判
別された頻度とが登録されることを特徴とする。
【0007】また、前記動的辞書手段には、前記第2の
認識処理によって解とすべき認識結果が得られた場合
に、該当する辞書データを示す情報が前記動的辞書手段
に登録されていなければ、前記頻度の最も低い情報に代
えて登録されることを特徴とする。
【0008】
【作用】例えば、長文の文書の文字について認識する場
合、以前認識した文字を再度認識する可能性が高い。こ
のため、以前認識した文字について、その際の辞書デー
タを示す情報(辞書アドレス)を登録するための動的辞
書手段(動的辞書テーブル)と、同テーブルに登録する
た否かを判別する登録手段(テーブル登録処理部)を設
けることで、認識処理の時間の短縮が図れる。
【0009】
【実施例】以下、図面を参照して本発明の一実施例を説
明する。図1は本発明の一実施例に係わる光学的等文字
読取装置(OCR)の構成を示すブロック図である。図
1に示すように光学的文字読取装置(OCR)は、制御
装置10、スキャナ装置12、認識処理装置20によっ
て構成されている。
【0010】制御装置10は、スキャナ装置12及び認
識処理装置20を制御するもので、CRT等の表示装
置、キーボード等の入力装置を備えている。スキャナ装
置12は、一般印刷物、帳票、手書き文書等に記録され
たイメージを、光学的に走査することにより取り込むも
のである。
【0011】認識処理装置20は、制御装置10の制御
のもとに、スキャナ装置12によって取り込まれたイメ
ージから文字列を検出し、さらに各文字イメージを切り
出し、対応する文字コード等の情報(認識結果)を制御
装置10に出力するものである。
【0012】認識処理装置20には、認識処理部22、
辞書メモリ24、動的辞書テーブル26が設けられてい
る。認識処理部22は、認識処理装置20全体を制御す
るもので、辞書メモリ24に格納された辞書データを参
照しながら認識処理を行なう。認識処理部22には認識
処理を行なうための各処理部が設けられており、テーブ
ル登録処理部221、第1認識処理部222、及び第2
認識処理部223を含んでいる。
【0013】テーブル登録処理部221は、動的辞書テ
ーブル26へのデータの登録、変更、参照等を行なう。
第1認識処理部222は、動的辞書テーブル26が示す
辞書データを参照して認識処理を行なう。第2認識処理
部223は、辞書メモリ24に格納された全ての辞書デ
ータを参照して認識処理を行なう。
【0014】辞書メモリ24は、認識処理部22におけ
る文字認識処理でマッチングされる辞書データを格納す
るためのものである。辞書メモリ24には、図2に示す
ように、認識可能な全ての文字毎に辞書データが用意さ
れ、各辞書データに対応して、動的辞書テーブル26に
セットされているか否かを示すための登録フラグが設け
られている。本実施例では、動的辞書テーブル26にセ
ットされている場合(詳細については後述する)、登録
フラグは“1”とする。各辞書データは、辞書アドレス
によって指定される。
【0015】動的辞書テーブル26は、以前に認識した
文字、すなわち認識結果として該当した辞書データを示
す辞書アドレスを格納するためのものである。動的辞書
テーブル26は、例えば図3に示すような構造になって
いる。動的辞書テーブル26には、M個分の辞書アドレ
スを格納することができ、各辞書アドレスに対応づけて
決定類似度(0.00〜1.00までのフロート値)及
び頻度が格納される。決定類似度は、対応する辞書アド
レスが示す辞書データを用いた認識処理における類似度
の比較対象となるもので、動的辞書テーブル26に格納
された辞書アドレスが示す辞書データを解とすべきか判
別するためのものである。頻度は、対応する辞書アドレ
スが示す辞書データを用いた認識処理による類似度が、
対応する決定類似度を超えた回数を示す。なお、動的辞
書テーブル26は、初期値が全て“NULL”であり、
認識処理が行なわれることによって、順次前述したよう
なデータが格納される。図3は、3文字を認識した後の
動的辞書テーブル26の内容を示している。
【0016】次に、本実施例の動作について説明する。
まず、スキャナ装置12において処理対象とする文書等
のイメージが読取られ、認識処理装置20に転送され
る。認識処理装置20は、イメージ中から文字列の検
出、文字イメージの切り出しを行なう。認識処理部22
は、切り出され文字イメージについて、図4に示すフロ
ーチャートに従って認識処理を実行する。
【0017】本実施例では、動的辞書テーブル26に辞
書アドレスがM個分登録されて準備が完了してから、第
1認識処理部222によって参照されるものとする(ス
テップS1)。従って、少なくともM個の文字イメージ
について、第2認識処理部223は、辞書メモリ24に
格納された全ての辞書データとのマッチングを行ない、
最高の類似度を与える辞書データを解(認識結果)とし
て取得する(ステップS6)。
【0018】この際、テーブル登録処理部221は、第
2認識処理部223によって取得された辞書データに該
当する辞書アドレス、及び認識処理により求められた類
似度を動的辞書テーブル26に格納する(NULLの領
域に対して優先的に格納する)と共に、頻度を1インク
リメント(この時は頻度1)する(ステップS7,S
8)。第2認識処理部223によって取得された認識結
果は、制御装置10に出力される(ステップS5)。
【0019】動的辞書テーブル26に辞書アドレスがM
個分登録されて準備が完了してから(ステップS1)、
次の文字イメージについての認識処理から動的辞書テー
ブル26が参照される。第1認識処理部222は、動的
辞書テーブル26に格納された辞書アドレスが示す辞書
データを用いて認識処理を行なう(ステップS2)。
【0020】この認識処理によって得られた類似度が、
辞書アドレスと対応する決定類似度を超えるものがある
場合、動的辞書テーブル26の辞書アドレスと対応する
頻度を1インクリメントすると共に(ステップS4)、
解として出力する(ステップS5)。この場合、最大で
もM個の辞書データとのマッチングを行なうだけにな
る。
【0021】決定類似度を超える辞書データがない場合
(ステップS3)、第2認識処理部223は、辞書メモ
リ24に格納された全ての辞書データとのマッチングを
行ない、最高の類似度を与える辞書データを解(認識結
果)として取得する(ステップS6)。
【0022】ここで取得した認識処理の結果である辞書
データの登録フラグが“1”である場合(ステップS
7)、すなわち動的辞書テーブル26に辞書アドレスが
登録されている場合、テーブル登録処理部221は、認
識処理によって得られた類似度を、辞書アドレスに対応
する決定類似度に上書きする(ステップS9)。
【0023】つまり、この時の入力パターン(文字イメ
ージ)は、動的辞書テーブル26に解とする辞書データ
の辞書アドレスが登録されているにもかかわらず、入力
パターンの変形等のために、前回の同じ文字の文字イメ
ージについての認識処理による類似度を超えることがで
きなかったことになる。類似度を上書きして変更するこ
とにより(決定類似度の値は低くなる)、次回、同じ文
字の文字イメージについての認識処理を行なう際、前述
のように多少イメージが変形していても、動的辞書テー
ブル26を用いた第1認識処理部222による認識処理
で解を取得することができる。
【0024】また、第2認識処理部223による認識処
理の結果である辞書データの登録フラグが“0”である
場合(ステップS7)、テーブル登録処理部221は、
該当する辞書データの辞書アドレスを動的辞書テーブル
26に登録する(ステップS8)。
【0025】この時、動的辞書テーブル26にはM個の
辞書アドレスが既に登録されているため、テーブル登録
処理部221は、動的辞書テーブル26中の頻度の最も
低い辞書アドレスに代えて、第2認識処理部223によ
る認識処理の結果である辞書データの辞書アドレス、類
似度、及び頻度を登録する。なお、類似度は認識処理の
結果より若干低めとし(sim−Δsimの値を登
録)、頻度は1とする。また、書き替えられた辞書アド
レスに対応する辞書メモリ24中の辞書データの登録フ
ラグを“1”とする。
【0026】以上の処理を繰り返して行なう。この結
果、動的辞書テーブル26には、認識対象として出現頻
度の高い文字の辞書データを示す辞書アドレスが登録さ
れることになる。従って、動的辞書テーブル26を用い
た第1認識処理部222による認識処理を優先して行な
うことにより、認識処理の短縮が実現される。
【0027】例えば、動的辞書テーブル26の登録辞書
アドレスの個数Mを100、動的辞書テーブル26のヒ
ット率を50%、認識辞書データ総数を4000字、1
文字にかかる認識時間をαとし、認識対象とする文書の
文字数を1000字とすると以下に示す程度の処理速度
の短縮が可能となる。
【0028】すなわち、従来の認識装置による認識時間
は文字数に比例する1000α時間要するが、本発明の
認識装置による処理時間は、 100α+((100α/4000)×450)×2+
450α=572.5α となり、40%弱の短縮となる。(なお、データ登録処
理時間を無視するものとする。)このようにして、認識
対象として出現頻度の高い文字の辞書データを示す辞書
アドレスを動的辞書テーブル26に登録し、この動的辞
書テーブル26を用いた認識処理を優先して行なうこと
により、長文の文書では同じ文字が多く含まれるので、
辞書メモリ24中の全ての辞書データを用いた認識処理
が行なわれず、大幅な認識時間の短縮が可能となる。
【0029】なお、前記実施例においては、動的辞書テ
ーブル26にM個の辞書アドレスが登録され準備が完了
してから、第1認識処理部222による動的辞書テーブ
ル26を用いた認識処理を行なうものとして説明した
が、登録数に関係なく優先して行なうようにしても良
い。
【0030】また、実用上の問題として、例えば類似し
た「徴」「微」のような文字については、先に動的辞書
テーブル26に登録されたものに解が傾く場合がある
が、このような似た文字については両方の文字を優先的
に動的テーブル26に登録するようにしても良い。
【0031】また、前記実施例においては、光学的等文
字読取装置(OCR)における文字認識を例にして説明
したが、オンライン手書き文字認識、音声認識などの登
録辞書から解を求める分野で適用可能である。
【0032】
【発明の効果】以上のように本発明によれば、認識処理
を行なう毎に動的辞書テーブルを生成し、次の認識対象
とするパターンについて動的辞書テーブルを利用して認
識処理を行なうことにより、認識処理の処理速度を向上
させることが可能となるものである。
【図面の簡単な説明】
【図1】本発明の一実施例に係わる認識処理装置の構成
を示すブロック図。
【図2】辞書メモリ24の構造を説明するための図。
【図3】動的辞書テーブル26の構造を説明するための
図。
【図4】認識処理の動作を説明するためのフローチャー
ト。
【符号の説明】
10…制御装置、12…スキャナ装置、20…認識処理
装置、22…認識処理部、24…辞書メモリ、26…動
的辞書テーブル、221…テーブル登録処理部、222
…第1認識処理部、223…第2認識処理部。
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G06K 9/68 JICSTファイル(JOIS)

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】 スキャナから出力されるイメージから1
    文字毎に文字パターンを切り出し、その切り出された文
    字イメージと認識辞書とを照合して文字認識を行なう認
    識部とを備える認識処理装置において、 認識可能な全てのパターンに対する辞書データが格納さ
    れ、文字毎に第2の辞書への登録フラグが設けられる第
    1の辞書と、 前記第1の辞書に格納された一部の辞書データが動的に
    格納され、その文字毎に決定類似度が設けられる第2の
    辞書と、 前記文字イメージと前記第1の辞書とを照合して得られ
    た類似度の中から最高の類似度を持つ辞書データを前記
    第2の辞書に登録すると共に、その類似度を決定類似度
    として格納する第2の辞書登録手段と、 認識対象とする文字イメージと前記第2の辞書と照合し
    て得られた認識文字の類似度が、対応する前記第2の辞
    書に格納された前記決定類似度を超えている場合、当該
    認識文字を解として出力する第1の認識処理手段と、 前記第1の認識処理手段での前記類似度が前記決定類似
    度を超えていない場合、前記文字イメージと前記第1の
    辞書と照合して、類似度が最も高い文字の辞書データを
    解として出力する第2の認識処理手段と、 前記第2の認識処理手段によって得られた前記辞書デー
    タの前記登録フラグを参照して、解として出力されて前
    記辞書データが既に前記第2の辞書に格納されている場
    合、前記第2の認識処理手段で得られた類似度を第2の
    辞書の対応する決定類似度に上書きし、前記辞書データ
    が前記第2の辞書に格納されていない場合、前記辞書デ
    ータを前記第2の辞書に登録すると共に、前記第1の辞
    書データの前記登録フラグをセットする手段と、 を具備したことを特徴とする認識処理装置。
JP12609693A 1993-05-27 1993-05-27 認識処理装置 Expired - Lifetime JP3251704B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP12609693A JP3251704B2 (ja) 1993-05-27 1993-05-27 認識処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP12609693A JP3251704B2 (ja) 1993-05-27 1993-05-27 認識処理装置

Publications (2)

Publication Number Publication Date
JPH06337964A JPH06337964A (ja) 1994-12-06
JP3251704B2 true JP3251704B2 (ja) 2002-01-28

Family

ID=14926514

Family Applications (1)

Application Number Title Priority Date Filing Date
JP12609693A Expired - Lifetime JP3251704B2 (ja) 1993-05-27 1993-05-27 認識処理装置

Country Status (1)

Country Link
JP (1) JP3251704B2 (ja)

Also Published As

Publication number Publication date
JPH06337964A (ja) 1994-12-06

Similar Documents

Publication Publication Date Title
JPH05143707A (ja) 符号化画像データの処理方法および装置
JP3251704B2 (ja) 認識処理装置
US5854860A (en) Image filing apparatus having a character recognition function
JPH06290251A (ja) 電子ファイル装置の文書画像処理方法
JP2751865B2 (ja) 文字列認識装置
JP2932667B2 (ja) 情報の検索方法および情報蓄積装置
JP3114446B2 (ja) 文字認識装置
JPH0516069B2 (ja)
JP3725953B2 (ja) 文字認識装置
JPH10198688A (ja) 定型文書読み取り装置
JP2640472B2 (ja) 文字認識方法
JP3085508B2 (ja) 電子帳票検索システム
JP3305367B2 (ja) データベースへのデータ入力装置
JP3360030B2 (ja) 文字認識装置および文字認識方法および文字認識方法をプログラムの形で記録した記録媒体
JP2902097B2 (ja) 情報処理装置及び文字認識装置
JP2977244B2 (ja) 文字認識方法及び文字認識装置
JPH07152856A (ja) 光学的文字読取装置
JP3058706B2 (ja) 住所カナの漢字変換方法
JP3419425B2 (ja) 認識文字補正装置
JP3116453B2 (ja) 英文字認識装置
JP4261831B2 (ja) 文字認識処理方法、文字認識処理装置、文字認識プログラム
JP3243389B2 (ja) 文書識別方法
JP2746345B2 (ja) 文字認識の後処理方法
JP2784004B2 (ja) 文字認識装置
JP2839515B2 (ja) 文字読取システム

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071116

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081116

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081116

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091116

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101116

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101116

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111116

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111116

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121116

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131116

Year of fee payment: 12

EXPY Cancellation because of completion of term