JPH05303669A - 光学的文字読み取り装置 - Google Patents

光学的文字読み取り装置

Info

Publication number
JPH05303669A
JPH05303669A JP4109602A JP10960292A JPH05303669A JP H05303669 A JPH05303669 A JP H05303669A JP 4109602 A JP4109602 A JP 4109602A JP 10960292 A JP10960292 A JP 10960292A JP H05303669 A JPH05303669 A JP H05303669A
Authority
JP
Japan
Prior art keywords
character
recognition
dictionary
characters
recognized
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP4109602A
Other languages
English (en)
Other versions
JP3217442B2 (ja
Inventor
Kenji Mishima
健司 三縞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP10960292A priority Critical patent/JP3217442B2/ja
Publication of JPH05303669A publication Critical patent/JPH05303669A/ja
Application granted granted Critical
Publication of JP3217442B2 publication Critical patent/JP3217442B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 (修正有) 【目的】文字をあらかじめ定めた順序で認識し、途中の
文字を認識する際は、それまでに認識した文字の認識結
果によって、辞書サブセットを動的に可変とする。 【構成】認識順序制御部で文字認識部による文字の認識
順序を制御22し、辞書サブセット制御部の制御に従
い、既に認識を行った文字の認識結果により、次に認識
しようとする文字に照合する辞書サブセットを可変2
5,27とする。文字認識部は、あらかじめ用意された
認識辞書を照合して文字を認識する。辞書サブセット制
御部は、既に認識を行った文字の認識結果23,24,
25により、次に認識しようとする文字に照合する辞書
サブセットを制御する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、辞書サブセットを動
的に制御する光学的文字読み取り装置に関する。
【0002】
【従来の技術】近年、OCR(光学的文字認識装置)
は、文字認識技術の進歩に伴い、小型、高性能化が図ら
れ、比較的安価に供給されるようになった。このOCR
は一般に広く普及され、最近では比較的高性能なパーソ
ナルコンピュータの周辺装置としても接続されるように
なり、あらゆるアプリケーションに頻繁に使用されるよ
うになった。
【0003】OCRは、スキャナによって帳票を走査し
て、その帳票イメージをイメージデータに変換し、イメ
ージデータから文字パターンを切り出し、この文字パタ
ーンと内蔵する認識辞書との比較照合により文字認識を
行なう。
【0004】ところで、上述したOCRは、従来、図4
に示す読み取り帳票の金額欄のように、さまざまな書式
で記入あるいは印字された帳票(a)〜(f)を認識す
る場合、全て同じ辞書サブセットを用いることにより行
われる。即ち、図4の例では、“0〜9”、“*”、
“¥”を用いて認識している。
【0005】
【発明が解決しようとする課題】上述した従来例に従え
ば、「数字」を認識する場合であっても“*”や“¥”
の辞書と照合する必要があるため、高速化の妨げとな
り、また、図4に示す(b)を“¥123¥*”等と不
自然に誤認識する可能性があったりして認識率が良くな
い。
【0006】この発明は上記事情に鑑みてなされたもの
であり、文字をあらかじめ定めた順序で認識し、途中の
文字を認識する際は、それまでに認識した文字の認識結
果によって、辞書サブセットを動的に可変とすることに
より、認識時間を短縮し、かつ認識率を向上させた光学
的文字読み取り装置を提供することを目的とする。
【0007】
【課題を解決するための手段】本発明の光学的文字読み
取り装置は、帳票を走査しイメージデータに変換するイ
メージスキャナと、読み取ったイメージデータを格納す
るイメージメモリと、ここで得られるイメージデータか
ら文字パターンを切り出す文字切り出し部と、この文字
パターンと辞書メモリにあらかじめ用意された認識辞書
を照合して文字を認識する文字認識部と、この文字認識
部による文字の認識順序を制御する認識順序制御部と、
既に認識を行った文字の認識結果により、次に認識しよ
うとする文字に照合する辞書サブセットを可変とする辞
書サブセット制御部とを具備することを特徴とする。
【0008】
【作用】本発明は上述した構成にて、まずスキャナによ
って帳票上を走査し、その帳票イメージのイメージデー
タを得て、そのイメージデータから文字パターンを切り
出し、この文字パターンと内蔵する認識辞書との比較照
合により文字認識を行なう。このとき、認識順序制御部
は、左側から順に認識するように文字認識部に指示を与
え、辞書サブセット制御部はまず初期の辞書サブセット
を通常のものとし、その後、書式に従うある定められた
ルールに基づき辞書サブセットを変化させる。即ち、辞
書サブセット制御部は、既に認識を行った文字の認識結
果により、次に認識しようとする文字に照合する辞書サ
ブセットを制御する。このことにより、認識時間の短縮
化が図れ、認識率の向上が図れる。
【0009】
【実施例】以下、図面を使用して本発明の実施例につい
て説明する。図1は本発明の実施例を示すブロック図で
ある。
【0010】図において、符号1はスキャナであり、帳
票を走査し、イメージデータに変換するコンポーネント
である。符号2はイメージメモリであり、スキャナを介
して得られるイメージデータが格納される。符号3は文
字切出部であり、イメージメモリ2に格納されたイメー
ジデータから文字パターンを切り出すコンポーネントで
ある。符号4は文字認識部であり、切り出された文字パ
ターンと後述する認識辞書とを照合して文字を認識する
コンポーネントである。符号5は辞書メモリであり、認
識辞書を格納する。符号6は認識辞書制御部であり、文
字の認識順序を制御する。
【0011】符号7は本発明のポイントとなる辞書サブ
セット制御部であり、既に認識を行った文字の認識結果
により、次に認識しようとする文字に照合する辞書サブ
セットを制御する。図2は本発明実施例の動作を示すフ
ローチャートである。
【0012】以下、図1に示す本発明実施例の動作につ
いて図2を参照しながら詳細に説明する。ここでは図4
に示した金額欄を認識する場合を例示する。この場合に
扱う書式は次の(A)〜(F)で示す6通りとする。 (A)数字のみ (B)数字の前に“¥”が一文字 (C)数字の前が“*”文字 (D)数字の前に“*”が複数文字 (E)数字の前に“¥”が一文字、その前に“*”が一
文字または複数文字 (F)数字の前に“*”が一文字または複数文字、その
前に“¥”が一文字 つまり、金額欄を左側から順に見ていくと、(A)は数
字の後は数字、(b)は¥の後に¥は現れない、(c)
は“*”の後は数字でなければならない。
【0013】そこで、認識順序制御部6は、左側から順
に認識するように、文字認識部4を制御する。辞書サブ
セット制御部7は、まず初期の辞書サブセットを“0〜
9”、“*”、“¥”とし、その後、上記(A)、
(B)、(C)を満たすように、図2に示すフローチャ
ートに従って辞書サブセットを変化させる。即ち、認識
結果が数字であるか否かをチェックし、数字であれば、
辞書サブセットを“0〜9”とし、繰り返し次の文字を
認識するステップに移る。否であれば続いて認識結果が
¥であるか否かをチェックする。ここで“¥”であれば
辞書サブセットから¥を取り除き、前の文字の認識結果
は*であることをチェックする。ここで*であることが
認識されたら辞書サブセッを0〜9とし、否であれば繰
り返し次の文字を認識するステップに移る。これによ
り、不必要な辞書との照合を無くし、また、不自然な誤
読を無くすことができる。
【0014】図3に具体例を示す。図3のような住所欄
を認識する場合、都道府県欄の認識結果により、次の市
郡区欄を認識する際の辞書セブセットを限定することが
できる。例えば、都道府県欄の認識結果が“東京都”で
ある場合、市郡区欄は、東京都内の市郡区名に含まれる
文字の辞書サブセットで認識すればよい。
【0015】
【発明の効果】以上説明のように本発明によれば、既に
認識を行った文字の認識結果により、次に認識しようと
する文字に照合する辞書サブセットを動的に制御するこ
とにより、認識時間の短縮化ならびに認識率の向上に寄
与する。
【図面の簡単な説明】
【図1】本発明の実施例を示すブロック図。
【図2】本発明実施例の動作を示すフローチャート。
【図3】本発明実施例の動作を説明するための文字認識
帳票の一例を示す図。
【図4】従来における文字認識帳票の一例を示す図。
【符号の説明】
1…スキャナ、2…イメージメモリ、3…文字切り出し
部、4…文字認識部、5…辞書メモリ、6…認識順序制
御部、7…辞書サブセット制御部。

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 帳票上を走査し帳票のイメージデータを
    得るイメージスキャナと、このイメージスキャナで読取
    ったイメージデータを格納するイメージメモリと、この
    イメージメモリに格納されたイメージデータから文字パ
    ターンを切り出す文字切り出し部と、この文字切り出し
    部で切り出した文字パターンと辞書メモリに用意された
    認識辞書とを照合して文字を認識する文字認識部と、こ
    の文字認識部による文字の認識順序を制御する認識順序
    制御部と、既に認識を行なった文字の認識結果により、
    次に認識しようとする文字に照合する辞書サブセットを
    可変とする辞書サブセット制御部とを具備することを特
    徴とする光学的文字読み取り装置。
JP10960292A 1992-04-28 1992-04-28 光学的文字読み取り装置 Expired - Lifetime JP3217442B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10960292A JP3217442B2 (ja) 1992-04-28 1992-04-28 光学的文字読み取り装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10960292A JP3217442B2 (ja) 1992-04-28 1992-04-28 光学的文字読み取り装置

Publications (2)

Publication Number Publication Date
JPH05303669A true JPH05303669A (ja) 1993-11-16
JP3217442B2 JP3217442B2 (ja) 2001-10-09

Family

ID=14514446

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10960292A Expired - Lifetime JP3217442B2 (ja) 1992-04-28 1992-04-28 光学的文字読み取り装置

Country Status (1)

Country Link
JP (1) JP3217442B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3564101B1 (de) 2016-08-30 2021-11-10 Ergon International GmbH Fahrradsattel

Also Published As

Publication number Publication date
JP3217442B2 (ja) 2001-10-09

Similar Documents

Publication Publication Date Title
JPH07121664A (ja) 自動ヨーロッパ言語決定装置
JPH05303669A (ja) 光学的文字読み取り装置
JPH06150061A (ja) 文書認識装置
JPH0388062A (ja) 文書作成装置
US5878194A (en) Method and device for outputting multicolor document
JP2584973B2 (ja) 文字認識装置における認識結果出力方法
JPS6120887B2 (ja)
KR950011809B1 (ko) 레이저 프린터의 한글 모아쓰기 방법
JP2986255B2 (ja) 文字認識装置
JPS594358Y2 (ja) 文字修正における文字制御装置
JPH0520300A (ja) 文書処理装置
JPH0373913B2 (ja)
JP2784004B2 (ja) 文字認識装置
JP2674887B2 (ja) ワードプロセッサ
JP2931485B2 (ja) 文字切出し装置及び方法
JP3272536B2 (ja) 仮名漢字変換方法
JPH0546814A (ja) 文字読み取り装置
JP2623292B2 (ja) 辞書データの作成方法
JPS62251884A (ja) 記録装置
JPS6327992A (ja) 個人用辞書作成方法
JPH0273467A (ja) 電子ファイリングシステム
JPH04293185A (ja) ファイリング装置
JPH0689276A (ja) 文書処理装置
JPH0636069A (ja) 文字認識装置
JPH0554145B2 (ja)

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070803

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080803

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090803

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100803

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100803

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110803

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120803

Year of fee payment: 11

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120803

Year of fee payment: 11