JPH05303669A - 光学的文字読み取り装置 - Google Patents
光学的文字読み取り装置Info
- Publication number
- JPH05303669A JPH05303669A JP4109602A JP10960292A JPH05303669A JP H05303669 A JPH05303669 A JP H05303669A JP 4109602 A JP4109602 A JP 4109602A JP 10960292 A JP10960292 A JP 10960292A JP H05303669 A JPH05303669 A JP H05303669A
- Authority
- JP
- Japan
- Prior art keywords
- character
- recognition
- dictionary
- characters
- recognized
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Character Discrimination (AREA)
Abstract
文字を認識する際は、それまでに認識した文字の認識結
果によって、辞書サブセットを動的に可変とする。 【構成】認識順序制御部で文字認識部による文字の認識
順序を制御22し、辞書サブセット制御部の制御に従
い、既に認識を行った文字の認識結果により、次に認識
しようとする文字に照合する辞書サブセットを可変2
5,27とする。文字認識部は、あらかじめ用意された
認識辞書を照合して文字を認識する。辞書サブセット制
御部は、既に認識を行った文字の認識結果23,24,
25により、次に認識しようとする文字に照合する辞書
サブセットを制御する。
Description
的に制御する光学的文字読み取り装置に関する。
は、文字認識技術の進歩に伴い、小型、高性能化が図ら
れ、比較的安価に供給されるようになった。このOCR
は一般に広く普及され、最近では比較的高性能なパーソ
ナルコンピュータの周辺装置としても接続されるように
なり、あらゆるアプリケーションに頻繁に使用されるよ
うになった。
て、その帳票イメージをイメージデータに変換し、イメ
ージデータから文字パターンを切り出し、この文字パタ
ーンと内蔵する認識辞書との比較照合により文字認識を
行なう。
に示す読み取り帳票の金額欄のように、さまざまな書式
で記入あるいは印字された帳票(a)〜(f)を認識す
る場合、全て同じ辞書サブセットを用いることにより行
われる。即ち、図4の例では、“0〜9”、“*”、
“¥”を用いて認識している。
ば、「数字」を認識する場合であっても“*”や“¥”
の辞書と照合する必要があるため、高速化の妨げとな
り、また、図4に示す(b)を“¥123¥*”等と不
自然に誤認識する可能性があったりして認識率が良くな
い。
であり、文字をあらかじめ定めた順序で認識し、途中の
文字を認識する際は、それまでに認識した文字の認識結
果によって、辞書サブセットを動的に可変とすることに
より、認識時間を短縮し、かつ認識率を向上させた光学
的文字読み取り装置を提供することを目的とする。
取り装置は、帳票を走査しイメージデータに変換するイ
メージスキャナと、読み取ったイメージデータを格納す
るイメージメモリと、ここで得られるイメージデータか
ら文字パターンを切り出す文字切り出し部と、この文字
パターンと辞書メモリにあらかじめ用意された認識辞書
を照合して文字を認識する文字認識部と、この文字認識
部による文字の認識順序を制御する認識順序制御部と、
既に認識を行った文字の認識結果により、次に認識しよ
うとする文字に照合する辞書サブセットを可変とする辞
書サブセット制御部とを具備することを特徴とする。
って帳票上を走査し、その帳票イメージのイメージデー
タを得て、そのイメージデータから文字パターンを切り
出し、この文字パターンと内蔵する認識辞書との比較照
合により文字認識を行なう。このとき、認識順序制御部
は、左側から順に認識するように文字認識部に指示を与
え、辞書サブセット制御部はまず初期の辞書サブセット
を通常のものとし、その後、書式に従うある定められた
ルールに基づき辞書サブセットを変化させる。即ち、辞
書サブセット制御部は、既に認識を行った文字の認識結
果により、次に認識しようとする文字に照合する辞書サ
ブセットを制御する。このことにより、認識時間の短縮
化が図れ、認識率の向上が図れる。
て説明する。図1は本発明の実施例を示すブロック図で
ある。
票を走査し、イメージデータに変換するコンポーネント
である。符号2はイメージメモリであり、スキャナを介
して得られるイメージデータが格納される。符号3は文
字切出部であり、イメージメモリ2に格納されたイメー
ジデータから文字パターンを切り出すコンポーネントで
ある。符号4は文字認識部であり、切り出された文字パ
ターンと後述する認識辞書とを照合して文字を認識する
コンポーネントである。符号5は辞書メモリであり、認
識辞書を格納する。符号6は認識辞書制御部であり、文
字の認識順序を制御する。
セット制御部であり、既に認識を行った文字の認識結果
により、次に認識しようとする文字に照合する辞書サブ
セットを制御する。図2は本発明実施例の動作を示すフ
ローチャートである。
いて図2を参照しながら詳細に説明する。ここでは図4
に示した金額欄を認識する場合を例示する。この場合に
扱う書式は次の(A)〜(F)で示す6通りとする。 (A)数字のみ (B)数字の前に“¥”が一文字 (C)数字の前が“*”文字 (D)数字の前に“*”が複数文字 (E)数字の前に“¥”が一文字、その前に“*”が一
文字または複数文字 (F)数字の前に“*”が一文字または複数文字、その
前に“¥”が一文字 つまり、金額欄を左側から順に見ていくと、(A)は数
字の後は数字、(b)は¥の後に¥は現れない、(c)
は“*”の後は数字でなければならない。
に認識するように、文字認識部4を制御する。辞書サブ
セット制御部7は、まず初期の辞書サブセットを“0〜
9”、“*”、“¥”とし、その後、上記(A)、
(B)、(C)を満たすように、図2に示すフローチャ
ートに従って辞書サブセットを変化させる。即ち、認識
結果が数字であるか否かをチェックし、数字であれば、
辞書サブセットを“0〜9”とし、繰り返し次の文字を
認識するステップに移る。否であれば続いて認識結果が
¥であるか否かをチェックする。ここで“¥”であれば
辞書サブセットから¥を取り除き、前の文字の認識結果
は*であることをチェックする。ここで*であることが
認識されたら辞書サブセッを0〜9とし、否であれば繰
り返し次の文字を認識するステップに移る。これによ
り、不必要な辞書との照合を無くし、また、不自然な誤
読を無くすことができる。
を認識する場合、都道府県欄の認識結果により、次の市
郡区欄を認識する際の辞書セブセットを限定することが
できる。例えば、都道府県欄の認識結果が“東京都”で
ある場合、市郡区欄は、東京都内の市郡区名に含まれる
文字の辞書サブセットで認識すればよい。
認識を行った文字の認識結果により、次に認識しようと
する文字に照合する辞書サブセットを動的に制御するこ
とにより、認識時間の短縮化ならびに認識率の向上に寄
与する。
帳票の一例を示す図。
部、4…文字認識部、5…辞書メモリ、6…認識順序制
御部、7…辞書サブセット制御部。
Claims (1)
- 【請求項1】 帳票上を走査し帳票のイメージデータを
得るイメージスキャナと、このイメージスキャナで読取
ったイメージデータを格納するイメージメモリと、この
イメージメモリに格納されたイメージデータから文字パ
ターンを切り出す文字切り出し部と、この文字切り出し
部で切り出した文字パターンと辞書メモリに用意された
認識辞書とを照合して文字を認識する文字認識部と、こ
の文字認識部による文字の認識順序を制御する認識順序
制御部と、既に認識を行なった文字の認識結果により、
次に認識しようとする文字に照合する辞書サブセットを
可変とする辞書サブセット制御部とを具備することを特
徴とする光学的文字読み取り装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP10960292A JP3217442B2 (ja) | 1992-04-28 | 1992-04-28 | 光学的文字読み取り装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP10960292A JP3217442B2 (ja) | 1992-04-28 | 1992-04-28 | 光学的文字読み取り装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH05303669A true JPH05303669A (ja) | 1993-11-16 |
JP3217442B2 JP3217442B2 (ja) | 2001-10-09 |
Family
ID=14514446
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP10960292A Expired - Lifetime JP3217442B2 (ja) | 1992-04-28 | 1992-04-28 | 光学的文字読み取り装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3217442B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3564101B1 (de) | 2016-08-30 | 2021-11-10 | Ergon International GmbH | Fahrradsattel |
-
1992
- 1992-04-28 JP JP10960292A patent/JP3217442B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JP3217442B2 (ja) | 2001-10-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPH07121664A (ja) | 自動ヨーロッパ言語決定装置 | |
JPH05303669A (ja) | 光学的文字読み取り装置 | |
JPH06150061A (ja) | 文書認識装置 | |
JPH0388062A (ja) | 文書作成装置 | |
US5878194A (en) | Method and device for outputting multicolor document | |
JP2584973B2 (ja) | 文字認識装置における認識結果出力方法 | |
JPS6120887B2 (ja) | ||
KR950011809B1 (ko) | 레이저 프린터의 한글 모아쓰기 방법 | |
JP2986255B2 (ja) | 文字認識装置 | |
JPS594358Y2 (ja) | 文字修正における文字制御装置 | |
JPH0520300A (ja) | 文書処理装置 | |
JPH0373913B2 (ja) | ||
JP2784004B2 (ja) | 文字認識装置 | |
JP2674887B2 (ja) | ワードプロセッサ | |
JP2931485B2 (ja) | 文字切出し装置及び方法 | |
JP3272536B2 (ja) | 仮名漢字変換方法 | |
JPH0546814A (ja) | 文字読み取り装置 | |
JP2623292B2 (ja) | 辞書データの作成方法 | |
JPS62251884A (ja) | 記録装置 | |
JPS6327992A (ja) | 個人用辞書作成方法 | |
JPH0273467A (ja) | 電子ファイリングシステム | |
JPH04293185A (ja) | ファイリング装置 | |
JPH0689276A (ja) | 文書処理装置 | |
JPH0636069A (ja) | 文字認識装置 | |
JPH0554145B2 (ja) |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20070803 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080803 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090803 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100803 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100803 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110803 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120803 Year of fee payment: 11 |
|
EXPY | Cancellation because of completion of term | ||
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120803 Year of fee payment: 11 |