JP2954968B2 - 光学的文字読取装置及び光学的読取装置におけるサブセット情報の追加方法 - Google Patents

光学的文字読取装置及び光学的読取装置におけるサブセット情報の追加方法

Info

Publication number
JP2954968B2
JP2954968B2 JP2066820A JP6682090A JP2954968B2 JP 2954968 B2 JP2954968 B2 JP 2954968B2 JP 2066820 A JP2066820 A JP 2066820A JP 6682090 A JP6682090 A JP 6682090A JP 2954968 B2 JP2954968 B2 JP 2954968B2
Authority
JP
Japan
Prior art keywords
character
subset information
recognition
subset
correction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2066820A
Other languages
English (en)
Other versions
JPH03268089A (ja
Inventor
克巳 矢口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2066820A priority Critical patent/JP2954968B2/ja
Publication of JPH03268089A publication Critical patent/JPH03268089A/ja
Application granted granted Critical
Publication of JP2954968B2 publication Critical patent/JP2954968B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 [発明の目的] (産業上の利用分野) 本発明は光学的文字読取装置(OCR)及び光学的文字
読取装置におけるサブセット情報の追加方法に関するも
のである。
(従来の技術) 従来、OCRにおいては読取精度を向上させるために、
文字記入欄毎に読取対象文字種を限定して文字認識する
手法が行われている。例えば、金額欄等のように数字の
みが記入されることが予め判っているような場合には
「数字」を読取対象文字として指定し、また、フリガナ
欄等のようにカタカナのみが記入される欄の場合には
「カタカナ」を読取対象文字として指定する。同様に、
氏名欄や住所欄等のように漢字が記入される欄の場合に
は漢字を読取対象文字として指定すべきであるが、漢字
の場合には字種が多いため(JIS−第1水準だけでも約2
000字種以上)、同じ漢字でも氏名欄では氏名によく使
用される文字種のみを読取対象文字として指定し、住所
欄では住所によく使用される文字種のみを読取対象文字
として指定する。このような指定をサブセット指定また
は単にサブセットと称し、この指定の範囲の文字の情報
をサブセット情報という。
(発明が解決しようとする課題) しかしながら、このような従来のOCRではサブセット
指定を行った場合に、サブセット情報に含まれていない
文字があると誤認識となったり、認識不能となったりす
る。例えば、銀行の振込依頼書などの帳票を読取る場合
には、振込先の銀行名、支店名などの記入欄は、それぞ
れ銀行名サブセット、支店名サブセットにより読み取り
を行うのであるが、新規に銀行または支店ができた場合
において、この銀行名、または支店名がサブセットに含
まれていなければ、誤読または認識不能となるのであ
る。
従って、かかる場合にはオペレータが介入して結果の
修正等を行わねばならず、処理が煩しいという問題点が
生じていた。
本発明はこのような従来のOCRの問題点を解決せんと
してなされたもので、その目的は、サブセット情報に含
まれぬ文字が登場してオペレータにより修正された場合
に、それ以後では当該文字を含めたサブセット情報によ
り文字認識がなされ得る光学的文字読取装置及び光学的
文字読取装置におけるサブセット情報の追加方法を提供
することを目的とする。
[発明の構成] (課題を解決するための手段) 本発明は、帳票イメージを光電変換して画信号を得る
光電変換手段と、文字認識に用いる各種パラメータを格
納した認識辞書部と、認識に係わる文字の範囲を限定す
るサブセット情報を格納したサブセット情報記憶手段
と、前記サブセット情報記憶手段に格納されているサブ
セット情報により文字範囲を限定して前記認識辞書部に
格納されたパラメータを参照し、前記光電変換手段によ
り得られた画信号に基づき文字認識を行う文字認識手段
と、この文字認識手段の認識結果を修正する修正手段
と、この修正手段による修正結果を前記サブセット情報
記憶手段に記憶されたサブセット情報に追加するサブセ
ット情報管理手段とを備えて光学的文字認識装置を構成
した。
(作用) このように構成すると、文字認識結果の文字が修正さ
れた際、その修正された文字をサブセット情報に追加す
る。
(実施例) 以下、図面を参照して本発明の一実施例を説明する。
第1図は本発明の一実施例のブロック図である。同図に
おいて、1は光電変換部を示し、例えばCCD等のイメー
ジスキャナ、ノイズ除去回路、A/D変換回路等が含ま
れ、光電変換したアナログ信号を文字認識に供されるデ
ィジタル画信号に変換して文字認識部2へ与える。文字
認識部2には、パターンマッチング法や特徴抽出法など
のために用いられる類似度検出用のパラメータが格納さ
れた認識辞書部21が含まれており、上記手法等を用いて
文字認識を行う。3はサブセット情報記憶部を示し、前
述した如くの認識に係る文字の範囲を限定するサブセッ
ト情報が格納されている。文字認識部2は読取制御部4
から指示があると、サブセット情報記憶部3内の該当サ
ブセット情報により文字範囲を限定して認識を行う。読
取制御部4はキーボード入力装置等により構成される操
作部5からサブセットの指示を受け取りこれを文字認識
部2へ与えるのである。文字認識部2により認識された
結果はキャラクタコードとされて読取制御部4へ与えら
れる。読取制御部4はこのキャラクタコードを表示部6
へ与える。表示部6には、例えば、CRT及びそのコント
ローラまたパターンジュネレータ等が含まれ、読取制御
部4から与えられたキャラクタコードをパターン化して
対応する文字を表示する。このとき、操作部5は修正手
段として機能する。即ち、操作部には訂正キー、カーソ
ルキー、次候補指示キーあるいは文字キーなどが備えら
れていて、修正すべき文字の下部にカーソルを位置さ
せ、訂正キーを操作し、次候補指示キーあるいは文字キ
ーの操作によって正しい文字を入力する。この文字のキ
ャラクタコードは操作部5から、あるいは、文字認識部
2から読取制御部4を介して表示部6へ与えられ、表示
される。正しい文字が表示されるとカーソルを移動させ
同様に訂正を続ける。訂正後のデータは、確定を指示す
る操作部5のキーの操作により図示せぬ記憶装置へ転送
されて保持される。
上記のサブセット情報を用いた文字認識後の訂正動作
時には、例えば、CPUで構成される読取制御部4内のサ
ブセット情報管理手段41が第2図のフローチャートに従
って動作する。即ち、操作部5からの訂正の入力がなさ
れるか否かを検出し(S101)、ある場合には前述のよう
な表示に係る制御を行うとともに、訂正された内容(キ
ャラクタコード)を保持する(S102)。そして、訂正が
終了するまでステップS101,S102を繰り返す(S103)。
ここで具体例で説明すると、第3図に示されるような銀
行の振込依頼書の帳票において銀行名の欄の読取りが行
われたとする。このとき、銀行名のサブセット指定がな
されるが、「竹芝銀行」が新規な銀行であり、このサブ
セット情報には「芝」の字が含まれておらず、誤認識さ
れる。そこで、訂正が行われ「芝」の字が表示部6にて
表示されるとともに、そのキャラクタコードがサブセッ
ト情報管理手段41に保持される。この「芝」の字だけが
修正されると終了となる場合には、サブセット情報管理
手段41は操作部5から、保持内容(ここでは「芝」の文
字)を銀行名のサブセット情報に追加するための指示キ
ー(キー操作)がなされるかを検出する(S104)。ここ
で指示があった場合には読取モード切換となったか(つ
まり、他のサブセットによる読取へ移行するか)を検出
し(S105)、切換えとなっていれば当該サブセット情報
(銀行名のサブセット情報)内を検索し(S106)、保持
内容の文字が含まれているかを調べることにより追加す
べきかを検出する(S107)。上記例では「芝」の文字が
銀行名のサブセットに含まれているか否かを調べ含まれ
ていなければ追加を行う(S108)。そして他に訂正内容
がないかを調べ(S109)、あるときにはステップS106へ
戻って動作を続け、訂正内容に関する処理がなくなる
と、メインのプログラムへリターンする。かくして、サ
ブセット情報には新たな文字の範囲が追加され、次回か
らの認識に供され、誤認識、認識不能による訂正動作を
行わなくてもよいようになる。このように本実施例で
は、サブセット情報管理手段41が、第1図に示される通
りに、修正結果の文字を当該サブセット情報に追加すべ
きか否かを判定する(例えば、ステップS104,S105)判
定手段410及び、この判定手段410の判定結果に応じてサ
ブセット情報記憶手段内のサブセット情報の書き換えを
行う書換手段420からなるものである。
しかしながら、常に自動的に修正内容をサブセット情
報に取り込むようにするならば、ステップS104は不要で
ある。また、サブセット情報の検索という負荷が多少多
くなってもよい場合には、ステップS105は不要である。
[発明の効果] 以上説明したように本発明によれば、認識結果の修正
が行われた場合にはサブセット情報管理手段が働き、サ
ブセット情報記憶手段内のサブセット情報に修正が反映
され得るので、修正が反映されたときにはその後新しい
サブセット情報により文字範囲が限定されるからサブセ
ットの範囲の変化に対応して認識がなされ、逐一修正を
行う煩わしさを少なくできる。
【図面の簡単な説明】
第1図は本発明の一実施例のブロック図、第2図は本発
明の一実施例の動作を説明するためのフローチャート、
第3図は本発明の一実施例により読取られる帳票の平面
図である。 1……光電変換部 2……文字認識部 3……サブセット情報記憶部 4……読取制御部 5……操作部 6……表示部 21……認識辞書部 41……サブセット情報管理手段 410……判定部 420……書換手段

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】帳票イメージを光電変換して画信号を得る
    光電変換手段と、 文字認識に用いる各種パラメータを格納した認識辞書部
    と、 認識に係わる文字の範囲を限定するサブセット情報を格
    納したサブセット情報記憶手段と、 前記サブセット情報記憶手段に格納されているサブセッ
    ト情報により文字範囲を限定して前記認識辞書部に格納
    されたパラメータを参照し、前記光電変換手段により得
    られた画信号に基づき文字認識を行う文字認識手段と、 この文字認識手段の認識結果を修正する修正手段と、 この修正手段による修正結果を前記サブセット情報記憶
    手段に記憶されたサブセット情報に追加するサブセット
    情報管理手段と を備えたことを特徴とする光学的文字読取装置。
  2. 【請求項2】前記サブセット情報管理手段は、 前記修正結果の文字が前記サブセット情報記憶手段にサ
    ブセット情報として記憶されているか否かに基づいて前
    記サブセット情報に追加すべきか否かを判定する判定手
    段と、 この判定手段が前記判定結果の文字を追加すべきである
    と判定した場合、前記修正結果の文字を前記サブセット
    情報記憶手段に追加記憶する追加記憶手段と を備えることを特徴とする請求項(1)に記載の光学的
    文字読取装置。
  3. 【請求項3】文字認識に係わる文字の範囲を限定するサ
    ブセット情報を格納したサブセット情報記憶手段を持つ
    光学的文字読取装置において、 文字認識結果を修正した際、この修正結果を前記サブセ
    ット情報記憶手段に記憶されたサブセット情報として追
    加記憶することを特徴とする光学的文字読取装置におけ
    るサブセット情報の追加方法。
JP2066820A 1990-03-19 1990-03-19 光学的文字読取装置及び光学的読取装置におけるサブセット情報の追加方法 Expired - Lifetime JP2954968B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2066820A JP2954968B2 (ja) 1990-03-19 1990-03-19 光学的文字読取装置及び光学的読取装置におけるサブセット情報の追加方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2066820A JP2954968B2 (ja) 1990-03-19 1990-03-19 光学的文字読取装置及び光学的読取装置におけるサブセット情報の追加方法

Publications (2)

Publication Number Publication Date
JPH03268089A JPH03268089A (ja) 1991-11-28
JP2954968B2 true JP2954968B2 (ja) 1999-09-27

Family

ID=13326872

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2066820A Expired - Lifetime JP2954968B2 (ja) 1990-03-19 1990-03-19 光学的文字読取装置及び光学的読取装置におけるサブセット情報の追加方法

Country Status (1)

Country Link
JP (1) JP2954968B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02136986A (ja) * 1988-11-17 1990-05-25 Sanyo Electric Co Ltd 手書き文字認識装置
JPH05128314A (ja) * 1991-11-07 1993-05-25 Mitsubishi Electric Corp 文字認識装置
JP2007233489A (ja) * 2006-02-27 2007-09-13 Nec Engineering Ltd 光学式記号読取装置

Also Published As

Publication number Publication date
JPH03268089A (ja) 1991-11-28

Similar Documents

Publication Publication Date Title
JPH07121664A (ja) 自動ヨーロッパ言語決定装置
JP2954968B2 (ja) 光学的文字読取装置及び光学的読取装置におけるサブセット情報の追加方法
US5233672A (en) Character reader and recognizer with a specialized editing function
JP3230641B2 (ja) 文字列検索装置
JP3221968B2 (ja) 文字認識装置
KR100352170B1 (ko) 지문 입력 센서를 이용한 숫자코드 발생 장치 및 방법
KR950001061B1 (ko) 문서인식 수정장치
JP2913103B2 (ja) パターン認識装置
JP2002207960A (ja) 認識文字修正方法及び認識文字修正プログラム
JP3149859B2 (ja) ビデオコーディングシステム及び方法
JP3101073B2 (ja) 文字認識の後処理方法
JP2006343797A (ja) 文字認識装置、文字認識方法およびコンピュータプログラム
JPH0749924A (ja) 手書き文字認識装置
JP2000132635A (ja) 認識データ確認方法
JP2683711B2 (ja) 文字・記号データの認識・修正方法
JPS58125183A (ja) 光学文字読取装置における認識不能文字表示方法
JP2504054B2 (ja) 文字入力制御方式
JPH05120471A (ja) 文字認識装置
JPH06251187A (ja) 文字認識誤り修正方法及び装置
JPH0221029B2 (ja)
JP2669897B2 (ja) 誤読文字の修正方法
JPS61198383A (ja) 文字修正装置
JPS63208180A (ja) 文字認識装置
JPH06187450A (ja) パターン認識方法と認識装置
JPS61226883A (ja) 文字認識装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080716

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090716

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090716

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100716

Year of fee payment: 11

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100716

Year of fee payment: 11