JPH076201A - 文字認識パラメータ制御方法 - Google Patents

文字認識パラメータ制御方法

Info

Publication number
JPH076201A
JPH076201A JP5146370A JP14637093A JPH076201A JP H076201 A JPH076201 A JP H076201A JP 5146370 A JP5146370 A JP 5146370A JP 14637093 A JP14637093 A JP 14637093A JP H076201 A JPH076201 A JP H076201A
Authority
JP
Japan
Prior art keywords
character
operator
recognition
character recognition
range
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP5146370A
Other languages
English (en)
Inventor
Ryuichi Nakamura
隆一 中村
Atsuko Niimura
敦子 新村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
N T T DATA TSUSHIN KK
NTT Data Corp
Original Assignee
N T T DATA TSUSHIN KK
NTT Data Communications Systems Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by N T T DATA TSUSHIN KK, NTT Data Communications Systems Corp filed Critical N T T DATA TSUSHIN KK
Priority to JP5146370A priority Critical patent/JPH076201A/ja
Publication of JPH076201A publication Critical patent/JPH076201A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】 文字認識装置を操作するオペレータに対応し
て好適な文字認識パラメータを設定する文字認識パラメ
ータ制御方法に関し、文字認識で設定されるパラメータ
の設定を自動化し、オペレータの負担を軽減すると共
に、正しい文字の認識率および処理速度を向上させるこ
とを目的とする。 【構成】 記述されている文字をイメージデータに変換
し、該イメージデータを文字認識して文字コードに変換
し、誤って認識した文字を正しい文字に置き換えて入力
した文字を正しくコード化する方法において、前記文字
認識で使用するパラメータ値を、オペレータの習熟度か
ら推定した結果に基づき動的に設定する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、イメージデータから、
対象となる文字の認識を行う文字認識処理装置に係り、
さらに詳しくは文字認識装置を操作するオペレータに対
応して好適な文字認識パラメータを設定する文字認識パ
ラメータ制御方法に関する。
【0002】
【従来の技術】現在、OCR(光学式文字読み取り装
置)など、コンピュータを利用して、イメージデータか
ら対象となる文字の認識を行って文字コードを出力する
文字認識装置が開発され実用化している。文字認識装置
は、一般的に認識の対象となる文字の入力パターンに類
似する参照パターンを抽出し、最も類似する参照パター
ンを認識結果として出力している。
【0003】例えば以下の如く動作する。CCDのライ
ンセンサ等によって読み取るべき文字をイメージデータ
に変換し、装置内に取り込む。そしてそのイメージデー
タから必要な文字領域を認識し、その文字領域内に入っ
ているイメージデータから個々の文字を認識している。
この認識は、それぞれの参照文字すなわち辞書の文字の
各特徴と入力文字の特徴との距離等により最も入力文字
であろうと予測される文字を第1候補とし、さらに例え
ば予め設定されている数の候補文字をオペレータに対し
表示する。
【0004】このような文字認識装置において、誤って
文字を認識する場合があるので、オペレータに対し認識
した文字コードから表示イメージを求めて表示装置に表
示し確認の表示を行っている。オペレータはこの確認の
表示を見て、正しい文字が読み取られたか否かを判別
し、正しく読み取られていない場合には、正しい候補文
字を指示すべき操作あるいは目的の文字の入力操作を行
っている。なお、予め上位何番目の候補までかを予め指
定した数分表示するので、オペレータはそのうちの正し
いものを指示することによって訂正を行う。
【0005】このようにして、文字認識装置によって認
識された結果はオペレータによる確認がなされ、誤って
認識した文字についてはオペレータにより正しい文字に
修正されている。
【0006】
【発明が解決しようとする課題】この従来の文字認識装
置において、各種の認識のためのパラメータの適正値
は、予め想定した環境での評価測定により求めた値を、
固定的に設定している。そのため、オペレータの熟練度
の違いなどによる変化に対しては、このパラメータ値が
適正値に設定されていない状態で、文字認識が行われる
こととなる。
【0007】たとえば、認識した個々の候補の文字コー
ドをさらに単語辞書から求める場合、候補文字の数に依
存して単語辞書のサーチにかかる時間が多くなる。この
為、認識に係るパラメータの一種である候補文字の数を
減らすと処理時間が短くなるが、誤認識が多くなるので
オペレータ操作が多く必要となり、トータル時間が長く
なっていた。また、認識すべき入力文字をオペレータが
書いた場合、習熟度によって各認識すべき文字単位での
認識率が変化する。しかしながら、従来では認識に係る
各種のパラメータを設定する為の習熟度を得ることがで
きなかった。この為、オペレータの習熟度に対応したパ
ラメータの適性値の設定が要求されていた。
【0008】従来このようなパラメータを適正値に保た
め、オペレータにより再設定が行われていた。再設定し
た後も同様に、誤認識文字修正時間の個人の違い等の熟
練度の変化に対応して、再々設定が必要となるため、オ
ペレータに負担がかかってしまっていた。すなわち、従
来の技術では、文字認識で設定されるパラメータを、オ
ペレータの介在なしに適正値に保つことができないとい
う問題を有していた。
【0009】本発明は、文字認識で使用されるパラメー
タの設定を自動化し、オペレータの負担を軽減すると共
に、正しい文字の認識率および処理速度を向上させる文
字認識パラメータ制御方法を提供することを目的とす
る。
【0010】
【課題を解決するための手段とその作用】本発明は指示
されている文字をイメージデータに変換し、該イメージ
データを文字認識して文字コードに変換し、誤って認識
した文字を正しい文字に置き換えて、入力した文字を正
しくコード化する文字認識方法におけるものである。
【0011】指示されている文字をイメージデータに変
換して認識した際、得られた文字コードは常に正しいと
は限らず、複数の候補の中に適正な文字が存在する場合
が多い。この候補文字の認識率はオペレータの習熟度に
よって決まるものであり、文字認識後にそれを表示する
際、オペレータの習熟度から候補とする文字の範囲を限
定する。例えばオペレータの習熟度とはオペレータの修
正作業を行う際の時間を計測し、その処理時間によって
候補範囲の表示を設定する。また、認識における他のパ
ラメータをもその習熟度によって変更しオペレータに対
応させる。
【0012】たとえば、文字認識の結果からさらに単語
辞書を用いて候補を選択し、確認の表示を行う場合であ
っても最も適した候補文字の数をオペレータの習熟度に
あわせて変化させるので、全システムでの修正を含む認
識時間を短くすることができる。
【0013】また、オペレータが認識すべき入力文字を
書いた場合等は習熟度によって個々の文字の認識率が変
わるので、各種パラメータを変化させることにより、操
作性を向上した認識装置を得る。
【0014】このようにオペレータに対し常に適切なパ
ラメータが設定できるので、認識の効率、さらに処理時
間の高速化を図ることができる。
【0015】
【実施例】以下、図面を用いて本発明を詳細に説明す
る。図1は本発明の実施例の文字認識処理装置の全体構
成図である。
【0016】帳票読取装置1はCCDラインセンサと帳
票移動体等よりなるイメージデータ読取装置であり、例
えばイメージスキャナである。文字認識前処理装置2は
前述の帳票読取装置1で読み取ったイメージデータから
目的の文字領域を切り出す装置である。これは予め読ま
せるべき文章の領域等がわかっているので、その入力文
章に対応した読み取るべき領域を切り出す装置である。
この文字認識前処理装置2は、例えばワク等によって囲
まれた領域を切り出す。
【0017】文字認識装置3は文字認識前処理装置2に
よって切り出した文字領域の文字を認識して、類似する
文字候補を複数文字コードに変換して出力する。文字認
識後処理装置4は文字認識装置3によって得られた候補
文字コードから単語辞書等に格納してある単語と文字候
補を照合する。この照合によって候補文字の中から正し
い文字が選択される。尚、単語辞書を使用しても誤った
認識をする場合もあり、この時にはオペレータの操作で
修正される。
【0018】オペレータ操作装置5はディスプレイおよ
びキーボード等よりなる。オペレータが文字認識後処理
装置4より出力され表示された候補文字のうち前述した
誤認識文字の修正をこのキーボードを操作して行う。
【0019】パラメータ制御装置6はオペレータ操作装
置5のオペレータの操作によって得られたオペレータの
習熟度例えば認識結果の修正操作時間によって文字認識
後処理装置4でサーチすべき候補の範囲を指定する。こ
の指定する範囲によって文字認識後処理装置4はその範
囲内の候補のみを使用して単語辞書を参照し最終的な文
章を表示する。また、オペレータの書いた文字を認識す
る場合には1文字の文字認識に係るパラメータを文字認
識装置に送出する。
【0020】帳票読取り装置1で読み込んだイメージデ
ータを文字認識前処理装置2は例えば一文字ごとにその
領域を切り出す。そして文字認識装置3は切り出した領
域の文字を認識し、複数の候補より成る認識候補文字列
を出力する。そして文字認識後処理装置4において、文
字認識装置3で出力された認識候補文字列が文字認識後
処理装置4内に予め有する単語辞書にあるかを照合し
て、単語として存在する文書を作成し、その結果をオペ
レータ操作装置5に渡す。
【0021】オペレータ操作装置5はその結果を表示す
る。オペレータはその結果と帳票を比較して誤認識文字
を修正する。オペレータ操作装置5は入力した修正情報
をパラメータ制御装置6に出力する。この時オペレータ
操作装置5はオペレータの操作時間も計測しており、パ
ラメータ制御装置6では、オペレータ操作装置5からの
前述の誤認識文字修正時間を基に、文字認識後処理装置
4で使用する単語照合の照合範囲を指定するパラメータ
の制御を行う。パラメータ制御装置6で設定されたパラ
メータは文字認識後処理装置4に渡され次の帳票で使用
される。
【0022】図2は、図1におけるパラメータ制御装置
6の本発明に係る実施例を示すフローチャートである。
前回のパラメータ値を最適値に設定した際の誤認識文字
修正時間を基軸とし、基軸から一定の値を加減した比率
を閾値とする。ただし最初は任意の初期値を閾値とす
る。パラメータ制御装置6ではオペレータ操作装置5か
らのオペレータ習熟度である修正の操作時間すなわち誤
認識文字修正時間をステップS1で受け取る。
【0023】続いてステップS2で誤認識文字修正時間
が閾値を越えたかどうかを判定する。閾値を越えない場
合(NO)はパラメータ制御処理を終了する。図3は閾
値の説明図である。ある決められた処理時間をS0と
し、その上下特定の時間を閾値としている。例えば図3
においては処理時間S0に対し小さい方の閾値をL、大
きい方の閾値をMとしている。この閾値内にあればステ
ップS2では閾値を越えてないと判断する。
【0024】ステップS2での判断結果が閾値を越えて
いるならば(YES)、記憶しているパラメータ値と誤
認識文字修正時間の組み合わせすなわち関係を記憶した
ものから、現誤認識文字修正時間をステップS3で照合
する。記憶したパラメータ値と誤認識文字修正時間の組
み合わせの中に、該当するものがあれば、そのパラメー
タ値を適正値としステップS5以降の処理を行う。記憶
したパラメータ値と誤認識文字修正時間の組み合わせの
中に、該当するものがない場合(NO)には、ステップ
S4で、全域のパラメータ値について一定間隔ごとのパ
ラメータ値での評価を行いパラメータ適正値を検出す
る。そしてステップS5で決定された適正値をパラメー
タ値に設定する。続いてステップS6で設定したパラメ
ータ適正値とその時の誤認識文字修正時間を記憶し、ス
テップS7で現在の誤認識文字修正時間を基軸として、
閾値を設定する。
【0025】誤認識修正方法は以下の如くである。 オペレータが使用する端末のディスプレイに認識結果
文字と文字のイメージデータを並べて表示する。
【0026】オペレータは認識結果と文字のイメージ
データを見比べ、誤って認識した文字の削除指示をキー
ボードから入力し、さらに正解文字の入力を行う。誤認
識文字の削除と正解文字の入力は認識結果の表示に対し
て行われ、その操作方法はワープロなどと同様である。
【0027】以上のような操作によってオペレータは誤
認識文字を修正するが、その修正においてはオペレータ
の習熟度により修正時間が異なる。本発明の実施例にお
いては、オペレータがその機械に慣れるにつれ、オペレ
ータのその操作が早くなるのを習熟度として求め、この
習熟度に対応しパラメータを変更する。このパラメータ
は例えば前述した認識した候補文字の数である。特に単
語照合をする場合、候補文字が多ければそれだけ単語辞
書における照合の速度は遅くなる。なぜならば、照合回
数が多くなるからである。
【0028】本発明の実施例においては、この修正時間
によって単語照合に使用する正解文字候補の候補順位の
範囲等のパラメータを設定する。例えばこの範囲の最小
値は1、最大値は16候補までとする。通常この範囲を
小さくすると単語照合の精度は下がるが処理速度は速く
なる。大きくすると単語照合の精度は上がるが、処理速
度は遅くなる。この為、パラメータ制御装置6は適正値
を設定する。
【0029】適正値は、単語照合の精度、処理速度のバ
ランスが一番とれているところであり、例えば照合範囲
を8候補のときが適正値であるならば、これ以上照合範
囲を増やしても単語照合精度の向上はあまりなく、処理
速度は照合範囲を増やした分に比例して増えてしまう。
【0030】以下に単語照合のイメージを示す。図4は
単語照合の説明図である。例えば読み込んだ文字が「N
TTデータ通信」であり、それぞれ候補文字として、 第一候補 「N T H テ ー な 通 開」 第二候補 「は 十 と い ぃ タ 送 隆」 第三候補 「む 員 T デ 十 巣 電 事」 第四候補 「端 ト 部 品 達 用 新 信」 とした場合、単語登録にNTT、データ、通信等がある
ので、順次それらの単語登録と候補文字とを選択するこ
とにより目的の単語を得る。これによって正しい「NT
Tデータ通信」を得ることができる。
【0031】図4においては第四候補までに全てが入っ
ているが、これは習熟度によって変わっていく。この第
一候補「N T H テ ー な 通 開」の種類によ
り例えば慣れたオペレータがした場合には第4候補で充
分であっても、習熟度が低いオペレータに対しては例え
ば1文字の修正に多くの時間がかかるような場合、文字
認識の速度が落ちても単語照合の確率の高いものの方が
良い。このためこれらの単語照合の精度と処理速度のバ
ランスが一番とれている適正値を求め、その適正値に対
応した候補を使用する。
【0032】図5は単語照合の範囲とその処理速度や認
識率の関係説明図である。処理速度を高めるため単語照
合範囲を狭くした場合、逆に文字認識率は低下する。す
なわち単語照合後の文字認識率が低下する。これに対し
照合速度を遅くする、すなわち特定時間単位の処理する
単語の数を減らすと文字認識率は上がるが単語照合の処
理速度は低下し目的の例えば文章を読み取る場合、それ
に要する時間は多く必要とする。このため、オペレータ
の習熟度によって順次このようなパラメータをダイナミ
ックに変更することにより効率のよい動的なパラメータ
設定が可能となる。
【0033】尚、前述した修正時間の求め方は認識結果
表示処理直後と修正処理終了直後に測定タイマを設け、
その差を計算し修正時間とする。さらに特定時間キーが
操作されない場合には、次にキーが操作されるまでの時
間をはぶき、例えばオペレータがその装置の前から離れ
た時間としてその間を0とする。
【0034】前述した本発明の実施例では単語辞書を参
照する候補文字の数を変化させているが、本発明は単語
辞書を使用しない場合でも応用可能である。たとえば、
オペレータが習熟するに従い、そのオペレータが書いた
文字を認識する率は高くなる。ニンベンはどのように書
けば誤らなくなるか等は経験的にそのオペレータが知る
ものであり、そのようなこの機械に対する特性を理解す
ることにより認識率が向上する。この為、図1点線の如
く、パラメータ制御装置6より文字認識装置にパラメー
タを送出し、そのパラメータに対応して文字認識を行え
ば確実な認識が可能となる。
【0035】
【発明の効果】本発明によれば、文字認識パラメータ制
御システムにおいて、文字認識システムで設定されるパ
ラメータを動的に設定し、上記、文字認識システムで設
定されるパラメータを、オペレータに対応して常時適正
値に保ことができ、オペレータの負荷を軽減すると共
に、正しい文字の認識率および処理速度を向上させるこ
とができる。
【図面の簡単な説明】
【図1】本発明の実施例の文字認識処理装置の全体構成
図である。
【図2】文字認識後処理制御の流れ図である。
【図3】閾値の説明図である。
【図4】単語照合の説明図である。
【図5】単語照合の範囲とその処理速度や認識率の関係
説明図である。
【符号の説明】
1 帳票読取装置 2 文字認識前処理装置 3 文字認識装置 4 文字認識後処理装置 5 オペレータ操作装置 6 パラメータ制御装置

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 記述されている文字をイメージデータに
    変換し、該イメージデータを文字認識して文字コードに
    変換し、誤って認識した文字を正しい文字に置き換えて
    入力した文字を正しくコード化する方法において、 前記文字認識で使用するパラメータ値を、オペレータの
    習熟度から推定した結果に基づき動的に設定することを
    特徴とする文字認識パラメータ制御方法。
  2. 【請求項2】 前記オペレータの習熟度は誤って認識し
    た文字を正しい文字に置き換える誤認識文字修正作業を
    行う時間に係る関数であることを特徴とする請求項1記
    載の文字認識パラメータ制御方法。
JP5146370A 1993-06-17 1993-06-17 文字認識パラメータ制御方法 Withdrawn JPH076201A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5146370A JPH076201A (ja) 1993-06-17 1993-06-17 文字認識パラメータ制御方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5146370A JPH076201A (ja) 1993-06-17 1993-06-17 文字認識パラメータ制御方法

Publications (1)

Publication Number Publication Date
JPH076201A true JPH076201A (ja) 1995-01-10

Family

ID=15406189

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5146370A Withdrawn JPH076201A (ja) 1993-06-17 1993-06-17 文字認識パラメータ制御方法

Country Status (1)

Country Link
JP (1) JPH076201A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015176242A (ja) * 2014-03-13 2015-10-05 株式会社東芝 文字認識装置、区分機、およびプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015176242A (ja) * 2014-03-13 2015-10-05 株式会社東芝 文字認識装置、区分機、およびプログラム

Similar Documents

Publication Publication Date Title
EP0687991A2 (en) Information processing method and apparatus
JPH04211883A (ja) 文字認識方法及び装置
JPH10333818A (ja) オンライン文字入力装置
JPH0696263A (ja) パターン認識装置
JPH076201A (ja) 文字認識パラメータ制御方法
JPH05120472A (ja) 文字認識装置
JP2899377B2 (ja) 文字認識装置
KR950001061B1 (ko) 문서인식 수정장치
JP3037727B2 (ja) Ocrシステム
JPH05314317A (ja) 文字認識装置
JP2002207960A (ja) 認識文字修正方法及び認識文字修正プログラム
JPH0562008A (ja) 文字認識方法
JPH0612520A (ja) 文字認識装置の確認修正方式
JPH0721303A (ja) 文字認識装置
JPH06251187A (ja) 文字認識誤り修正方法及び装置
JP2677271B2 (ja) 文字認識装置
JPH06333083A (ja) 光学式文字読取装置
JPS61226883A (ja) 文字認識装置
JPH07239913A (ja) 文字認識装置
JPH01134584A (ja) 文字認識装置
JPH07105202A (ja) 文書作成装置及び同装置の入力モード/シフト切替方法
JPH0562020A (ja) 文字認識装置
JPH06231299A (ja) 認識文字の修正方法
JPH06187507A (ja) 文字認識装置
JPH04268684A (ja) 認識文字の修正方法

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20000905