JPS6226587A - 光学文字読取装置の文字フイ−ルドフリ−ピツチ処理方式 - Google Patents
光学文字読取装置の文字フイ−ルドフリ−ピツチ処理方式Info
- Publication number
- JPS6226587A JPS6226587A JP60165723A JP16572385A JPS6226587A JP S6226587 A JPS6226587 A JP S6226587A JP 60165723 A JP60165723 A JP 60165723A JP 16572385 A JP16572385 A JP 16572385A JP S6226587 A JPS6226587 A JP S6226587A
- Authority
- JP
- Japan
- Prior art keywords
- character
- white area
- area
- data
- length
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Character Input (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
[発明の技術分野]
本発明は、文字フィールドに文字ピッチを設定せず、文
字フィールドの黒領域を認識する毎にこの黒領域を切り
出して読み取り処理を行なう光学文字読取装置(以下O
CRと記す)の文字フィールドフリーピッチ処理方式(
以下単にフリーピッチ処理方式と記す)に関する。
字フィールドの黒領域を認識する毎にこの黒領域を切り
出して読み取り処理を行なう光学文字読取装置(以下O
CRと記す)の文字フィールドフリーピッチ処理方式(
以下単にフリーピッチ処理方式と記す)に関する。
[発明の技術的背景]
従来、OCRによる読み取り処理は、文字フィールドの
始端から終端まで所定の文字ピッチで切り出しを行なっ
た後、処理するものが一般的であった。しかし、このよ
うな処理のし方では、帳票の切断ミス等が発生したとき
、読み取り位置と帳票上の文字フィールドの位置との間
に誤差が生じるため、正確な文字切り出しが行なえず、
リジェクト、誤読が発生しやすいという欠点があった。
始端から終端まで所定の文字ピッチで切り出しを行なっ
た後、処理するものが一般的であった。しかし、このよ
うな処理のし方では、帳票の切断ミス等が発生したとき
、読み取り位置と帳票上の文字フィールドの位置との間
に誤差が生じるため、正確な文字切り出しが行なえず、
リジェクト、誤読が発生しやすいという欠点があった。
このような欠点を解消するため、フリーピッチ処理方式
が開発された。この方式によれば、文字フィールドの始
端、終端は読み取り位置の始端、終端夫々と厳密に一致
しなくとも良いので、帳票の切断ミスが発生しても文字
の切り出しを正確に行なうことができる。
が開発された。この方式によれば、文字フィールドの始
端、終端は読み取り位置の始端、終端夫々と厳密に一致
しなくとも良いので、帳票の切断ミスが発生しても文字
の切り出しを正確に行なうことができる。
[背景技術の問題点]
しかし、フリーピッチ処理方式によれば、更に次のよう
な問題が生じることになる。フリーピッチ処理方式は文
字フィールドに所定の文字ピッチを設定しないものであ
るから、例えば帳票上には第4図に示す如く記載されて
いても、その読み取り結果は第5図に示すようになる(
第4図中Δ印はスペース文字を示す)。すなわち、スペ
ース文字であるべき領域が、単なる文字間の余白として
処理されるのである。このため、文字フィールド中にス
ペース文字が存在し、このスペース文字をも読み取る必
要がある場合には、フリーピッチ処理方式を適用するこ
とは不可能であった。
な問題が生じることになる。フリーピッチ処理方式は文
字フィールドに所定の文字ピッチを設定しないものであ
るから、例えば帳票上には第4図に示す如く記載されて
いても、その読み取り結果は第5図に示すようになる(
第4図中Δ印はスペース文字を示す)。すなわち、スペ
ース文字であるべき領域が、単なる文字間の余白として
処理されるのである。このため、文字フィールド中にス
ペース文字が存在し、このスペース文字をも読み取る必
要がある場合には、フリーピッチ処理方式を適用するこ
とは不可能であった。
[発明の目的]
本発明はこのような欠点に鑑みなされたもので、その目
的は、文字フィールド中にスペース文字が存在する場合
であってもフリーピッチ処理方式によってそのスペース
文字をも認識し、処理することができるようにすること
である。
的は、文字フィールド中にスペース文字が存在する場合
であってもフリーピッチ処理方式によってそのスペース
文字をも認識し、処理することができるようにすること
である。
[発明の概要]
そこで本発明では、OCRのフリーピッチ処理方式にお
いて、文字フィールドの白領域が、所定長さ以上でおる
ことを検出するとこの白領域はスペース文字であると判
断し、前記所定長さに満たないことを検出するとこの白
領域は通常の文字間隔であると判断し、夫々の判断に応
じた処理を行なうようにして上記の目的を達成している
。
いて、文字フィールドの白領域が、所定長さ以上でおる
ことを検出するとこの白領域はスペース文字であると判
断し、前記所定長さに満たないことを検出するとこの白
領域は通常の文字間隔であると判断し、夫々の判断に応
じた処理を行なうようにして上記の目的を達成している
。
[発明の実施例]
以下本発明の一実施例を図面を参照して説明する。
第1図は本発明方式が適用されているOCRの構成ブロ
ック図である。図中1は切り出し処理部2は黒領域取り
出し部、3は白領域取り出し部、4は辞書照合部、5は
判断部でおる。切り出し処理部1は入力端子aからCC
D (charge coupl−ed device
)のLSIスキャナ(図示せず)の出力信号をイメー
ジとして記憶し、このイメージを文字が描かれている黒
領域と余白である白領域とに分けて順次出力するもので
ある。黒領域取り出し部2は、切り出し処理部1から黒
領域のデータが出力されたときにこれを検出して辞書照
合部4に出力するものであり、白領域取り出し部3は、
切り出し処理部2から白領域のデータが出力されたとき
にこれを検出して判断部5に出力するものである。辞書
照合部4は与えられた黒領域のイメージはいずれの文字
に相当するかを検索し、出力端子すからその文字に対応
する文字コードを出力するものである。判断部5は白領
域取り出し部3から白領域のデータを与えられると、そ
の領域の長さのデータを予め設定されている長さのデー
タと比較し、設定されている長さよりも長いか又は同じ
であると判断すればスペース文字の文字コードを出力端
子Cから出力し、その設定されている長さより短いと判
断すればその白領域は通常の文字間の余白であるとして
、その旨を示す信号を信号線dを介して切り出し処理部
1に出力するものである。
ック図である。図中1は切り出し処理部2は黒領域取り
出し部、3は白領域取り出し部、4は辞書照合部、5は
判断部でおる。切り出し処理部1は入力端子aからCC
D (charge coupl−ed device
)のLSIスキャナ(図示せず)の出力信号をイメー
ジとして記憶し、このイメージを文字が描かれている黒
領域と余白である白領域とに分けて順次出力するもので
ある。黒領域取り出し部2は、切り出し処理部1から黒
領域のデータが出力されたときにこれを検出して辞書照
合部4に出力するものであり、白領域取り出し部3は、
切り出し処理部2から白領域のデータが出力されたとき
にこれを検出して判断部5に出力するものである。辞書
照合部4は与えられた黒領域のイメージはいずれの文字
に相当するかを検索し、出力端子すからその文字に対応
する文字コードを出力するものである。判断部5は白領
域取り出し部3から白領域のデータを与えられると、そ
の領域の長さのデータを予め設定されている長さのデー
タと比較し、設定されている長さよりも長いか又は同じ
であると判断すればスペース文字の文字コードを出力端
子Cから出力し、その設定されている長さより短いと判
断すればその白領域は通常の文字間の余白であるとして
、その旨を示す信号を信号線dを介して切り出し処理部
1に出力するものである。
次に、本発明方式による文字の読み取り処理の例を第2
図を参照して説明する。第2図は帳票の文字フィールド
に手書きで記入された数字を示したものでおる。この数
字を第1図に示したOCRが読み取るものとする。
図を参照して説明する。第2図は帳票の文字フィールド
に手書きで記入された数字を示したものでおる。この数
字を第1図に示したOCRが読み取るものとする。
図示せぬLSIスキャナによって、第2図に示されたパ
ターンは電気信号に変換され、入力端子aを介して切り
出し処理部1に入力される。切り出し処理部1は与えら
れた信号をイメージとして記憶した後、文字の切り出し
を行なう。最初に切り出される領域は「2」の黒領域で
ある。この黒領域のデータは黒領域取り出し部2で取り
出され、辞書照合部4で照合が行なわれ、数字「2」に
対応する文字コードに変換されて出力端子すから出力さ
れる。次に切り出し処理部1から出力される領域は長さ
pの白領域である。この白領域のデータは白領域取り出
し部3で取り出された後、判断8i5に至り、その長ざ
pと所定長さpとの比較が行なわれる。p<Jであると
すると判断部5は、この白領域は通常の文字間の余白で
あると判断しその旨の信号を切り出し処理部1に出力す
る。この信号により切り出し処理部1は、次の切り出し
処理を行なう。以下同様にして「3」の黒領域、「3」
と「4」の間の余白の白領域、「4」の黒領域が順次切
り出され、処理される。「4」の黒領域が処理された後
、切り出し処理部1は長さj!sの白領域を切り出し、
これを出力する。この領域のデータは白領域取り出し部
で取り出され、判断部5でその長さ、l!3と所定長さ
9との比較が行なわれる。、Q3>、l! (またはp
、−ρ)であるとすると判断部5は、この白領域はスペ
ース文字であると判断し、スペース文字の文字コードを
出力端子Cに出力する。以下、前述した「2」、「3」
、「4」の黒領域およびこれらの間にある白領域と同様
にして、「5」の黒vA域、「5」と「6」の余白の白
領域、「6」の黒領域が切り出され、処理される。
ターンは電気信号に変換され、入力端子aを介して切り
出し処理部1に入力される。切り出し処理部1は与えら
れた信号をイメージとして記憶した後、文字の切り出し
を行なう。最初に切り出される領域は「2」の黒領域で
ある。この黒領域のデータは黒領域取り出し部2で取り
出され、辞書照合部4で照合が行なわれ、数字「2」に
対応する文字コードに変換されて出力端子すから出力さ
れる。次に切り出し処理部1から出力される領域は長さ
pの白領域である。この白領域のデータは白領域取り出
し部3で取り出された後、判断8i5に至り、その長ざ
pと所定長さpとの比較が行なわれる。p<Jであると
すると判断部5は、この白領域は通常の文字間の余白で
あると判断しその旨の信号を切り出し処理部1に出力す
る。この信号により切り出し処理部1は、次の切り出し
処理を行なう。以下同様にして「3」の黒領域、「3」
と「4」の間の余白の白領域、「4」の黒領域が順次切
り出され、処理される。「4」の黒領域が処理された後
、切り出し処理部1は長さj!sの白領域を切り出し、
これを出力する。この領域のデータは白領域取り出し部
で取り出され、判断部5でその長さ、l!3と所定長さ
9との比較が行なわれる。、Q3>、l! (またはp
、−ρ)であるとすると判断部5は、この白領域はスペ
ース文字であると判断し、スペース文字の文字コードを
出力端子Cに出力する。以下、前述した「2」、「3」
、「4」の黒領域およびこれらの間にある白領域と同様
にして、「5」の黒vA域、「5」と「6」の余白の白
領域、「6」の黒領域が切り出され、処理される。
第3図の左側に、帳票の文字フィールドに記入された文
字を示し、これらの文字を、上記実施例と同様にして読
み取り処理した結果をその右側に示す。
字を示し、これらの文字を、上記実施例と同様にして読
み取り処理した結果をその右側に示す。
本実施例によれば、文字フィールドに記入された文字間
の余白が所定長1以上であれば、その余白は1つのスペ
ース文字として処理されることになる。尚、上記実施例
において白領域の艮ざgxがnfJ ’;、B 、 <
(n+1)fl (n : 21J、上の自然数)
のときは、その白領域を、スペース文字がn個連続して
成るものとして処理するようにしても良い。
の余白が所定長1以上であれば、その余白は1つのスペ
ース文字として処理されることになる。尚、上記実施例
において白領域の艮ざgxがnfJ ’;、B 、 <
(n+1)fl (n : 21J、上の自然数)
のときは、その白領域を、スペース文字がn個連続して
成るものとして処理するようにしても良い。
[発明の効果]
以上説明したように、本発明によれば文字フィールド中
にスペース文字が存在する場合であってもフリーピッチ
処理によって、そのスペース文字を認識して処理するこ
とができる。文字フィールドに記載された文字が活字印
刷によるものであれば、文字ピッチは所定の間隔(例え
ば1710インチ)に定められている。このような文字
を読み取る際、先頭文字サーチ方式を用いれば帳票の切
断ミスから生じる読み取り位置と文字フィールドの位置
とにずれが発生しても正確に1文字ずつ切り出すことが
でき、スペース文字も認識することができる。
にスペース文字が存在する場合であってもフリーピッチ
処理によって、そのスペース文字を認識して処理するこ
とができる。文字フィールドに記載された文字が活字印
刷によるものであれば、文字ピッチは所定の間隔(例え
ば1710インチ)に定められている。このような文字
を読み取る際、先頭文字サーチ方式を用いれば帳票の切
断ミスから生じる読み取り位置と文字フィールドの位置
とにずれが発生しても正確に1文字ずつ切り出すことが
でき、スペース文字も認識することができる。
しかし、文字フィールドに記載された文字が手書きによ
るものである場合、文字ピッチは一定ではないから先頭
文字サーチ方式によってはスペース文字を正確に切り出
すことはできない。このような場合に本発明方式を用い
れば特に有効となる。
るものである場合、文字ピッチは一定ではないから先頭
文字サーチ方式によってはスペース文字を正確に切り出
すことはできない。このような場合に本発明方式を用い
れば特に有効となる。
更に、本発明のフリーピッチ処理方式によれば、フリー
ピッチ文字フィールドのサブフィールド(1つの文字フ
ィールドが更に複数のフィールドに分割されたもの)扱
いが可能となる。
ピッチ文字フィールドのサブフィールド(1つの文字フ
ィールドが更に複数のフィールドに分割されたもの)扱
いが可能となる。
第1図は本発明方式が適用されるOCRの構成ブロック
図、第2図は第1図に示したOCRによって処理される
帳票に記載された文字例を示す図第3図は同様の帳票に
記載された文字例とその読み取り結果を示す図、第4図
、第5図は従来のフリーピッチ処理方式を説明するため
に用いた文字例を示す図である。 1・・・切り出し処理部 2・・・黒領域取り出し
部3・・・白領域取り出し部 4・・・辞書照合部5
・・・判断部 代理人 弁理士 則 近 憲 イも 周 山王 − 第1図 第2図 第3図 +2345△ΔABC△△00 第4図 + 2345ABCOO 第5図
図、第2図は第1図に示したOCRによって処理される
帳票に記載された文字例を示す図第3図は同様の帳票に
記載された文字例とその読み取り結果を示す図、第4図
、第5図は従来のフリーピッチ処理方式を説明するため
に用いた文字例を示す図である。 1・・・切り出し処理部 2・・・黒領域取り出し
部3・・・白領域取り出し部 4・・・辞書照合部5
・・・判断部 代理人 弁理士 則 近 憲 イも 周 山王 − 第1図 第2図 第3図 +2345△ΔABC△△00 第4図 + 2345ABCOO 第5図
Claims (1)
- 文字フィールドに文字ピッチを設定せず文字フィールド
の黒領域を検出する毎にこの黒領域を切り出して読み取
り処理を行なう光学文字読取装置の文字フィールドフリ
ーピッチ処理方式において、文字フィールドの白領域が
、所定長さ以上であることを検出するとこの白領域はス
ペース文字であると判断し、前記所定長さに満たないこ
とを検出するとこの白領域は通常の文字間隔であると判
断し、夫々の判断に応じた処理を行なうことを特徴とす
る光学文字読取装置の文字フィールドフリーピッチ処理
方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP60165723A JPS6226587A (ja) | 1985-07-29 | 1985-07-29 | 光学文字読取装置の文字フイ−ルドフリ−ピツチ処理方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP60165723A JPS6226587A (ja) | 1985-07-29 | 1985-07-29 | 光学文字読取装置の文字フイ−ルドフリ−ピツチ処理方式 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS6226587A true JPS6226587A (ja) | 1987-02-04 |
Family
ID=15817846
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP60165723A Pending JPS6226587A (ja) | 1985-07-29 | 1985-07-29 | 光学文字読取装置の文字フイ−ルドフリ−ピツチ処理方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS6226587A (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01300385A (ja) * | 1988-05-30 | 1989-12-04 | Fuji Electric Co Ltd | 空白文字の切出し方法 |
JPH01302483A (ja) * | 1988-05-31 | 1989-12-06 | Fuji Electric Co Ltd | 文書読取装置 |
US5226800A (en) * | 1989-09-22 | 1993-07-13 | Kabushiki Kaisha Komatsu Seisakusho | Displacement controlling circuit system for variable displacement pump |
JP2007321672A (ja) * | 2006-06-01 | 2007-12-13 | Hitachi Constr Mach Co Ltd | 建設機械の排ガス浄化装置 |
JP2007321671A (ja) * | 2006-06-01 | 2007-12-13 | Hitachi Constr Mach Co Ltd | 建設機械の排ガス浄化装置 |
JP2016194851A (ja) * | 2015-04-01 | 2016-11-17 | 富士通株式会社 | 認識プログラム、認識方法及び認識装置 |
-
1985
- 1985-07-29 JP JP60165723A patent/JPS6226587A/ja active Pending
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01300385A (ja) * | 1988-05-30 | 1989-12-04 | Fuji Electric Co Ltd | 空白文字の切出し方法 |
JPH01302483A (ja) * | 1988-05-31 | 1989-12-06 | Fuji Electric Co Ltd | 文書読取装置 |
US5226800A (en) * | 1989-09-22 | 1993-07-13 | Kabushiki Kaisha Komatsu Seisakusho | Displacement controlling circuit system for variable displacement pump |
JP2007321672A (ja) * | 2006-06-01 | 2007-12-13 | Hitachi Constr Mach Co Ltd | 建設機械の排ガス浄化装置 |
JP2007321671A (ja) * | 2006-06-01 | 2007-12-13 | Hitachi Constr Mach Co Ltd | 建設機械の排ガス浄化装置 |
JP2016194851A (ja) * | 2015-04-01 | 2016-11-17 | 富士通株式会社 | 認識プログラム、認識方法及び認識装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US4949392A (en) | Document recognition and automatic indexing for optical character recognition | |
JPH0789363B2 (ja) | 文字認識装置 | |
JPS6226587A (ja) | 光学文字読取装置の文字フイ−ルドフリ−ピツチ処理方式 | |
JPH0291789A (ja) | 文字認識方法 | |
JPS62133585A (ja) | 単語切出方式 | |
JPS6316795B2 (ja) | ||
JPH0514952B2 (ja) | ||
JP2746345B2 (ja) | 文字認識の後処理方法 | |
JP2930996B2 (ja) | 画像認識方法および画像認識装置 | |
JP3595081B2 (ja) | 文字認識方法 | |
JPH01311390A (ja) | 文字置換制御方式 | |
JPH01277989A (ja) | 文字列パターン読み取り装置 | |
JPH09167206A (ja) | 日英混在文書のスペース検出方法、ピッチ書式判定方法、定ピッチ英数文字列のスペース検出方法、及びプロポーショナルピッチ英数文字列のスペース検出方法 | |
JPS61114388A (ja) | 文字入力装置 | |
JPS59106084A (ja) | 文字読取り装置 | |
JP2503259B2 (ja) | 全角,半角文字の決定方法 | |
JPH01171080A (ja) | 誤り自動訂正文字認識装置 | |
JPS60138689A (ja) | 文字認識方法 | |
JPS62281090A (ja) | パタ−ン情報認識方法 | |
JPH08297720A (ja) | 一般文書読み取り装置 | |
JPS6139171A (ja) | 文字認識方式 | |
JPH0272497A (ja) | 光学的文字読取装置 | |
JPS62281091A (ja) | パタ−ン情報認識方法 | |
JPH0632074B2 (ja) | 正規化方法 | |
JPS61107485A (ja) | 光学的文字読取装置 |