JPS6014381A - 光学文字読取装置 - Google Patents
光学文字読取装置Info
- Publication number
- JPS6014381A JPS6014381A JP58122117A JP12211783A JPS6014381A JP S6014381 A JPS6014381 A JP S6014381A JP 58122117 A JP58122117 A JP 58122117A JP 12211783 A JP12211783 A JP 12211783A JP S6014381 A JPS6014381 A JP S6014381A
- Authority
- JP
- Japan
- Prior art keywords
- character
- frame
- entry frame
- character entry
- coordinates
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Character Input (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
本発明は光学文字読取装置(以下OCRと略す)に関し
1%に用紙に記入された文字群の文字切出し方式に関す
る。
1%に用紙に記入された文字群の文字切出し方式に関す
る。
従来OCRが読み取シを行なう用紙上には光学的に感知
しない色(以下ドロップアウトカシ−と称す)で1文字
ごとに文字記入枠を印刷し、その中に文字を記入するよ
うになっていた。OCRはその用紙を光学的に走査(7
、得られたイメージから文字記入枠と文字とを分離し、
文字部分のみを抽出して文字記入枠が文字認識のだめの
特徴抽出に影響を与えない様にしていた。
しない色(以下ドロップアウトカシ−と称す)で1文字
ごとに文字記入枠を印刷し、その中に文字を記入するよ
うになっていた。OCRはその用紙を光学的に走査(7
、得られたイメージから文字記入枠と文字とを分離し、
文字部分のみを抽出して文字記入枠が文字認識のだめの
特徴抽出に影響を与えない様にしていた。
この具体例を第1図を参照して説明すると、OCRKは
帳票1′上のドロップアウトカラーで印刷された文字記
入枠2の読取対象領域(以下フィールドと略す)に対し
て、帳票の上端からフィールドの中心位置までの距離”
1 m ” 2 b帳票の右端からフィールドの左端
までの距離M111M21 b文字枠の大きさ1文字枠
のピッチおよび1フイールド中の文字枠の数の情報が与
えられておシ、これらの情報によって文字枠の位置を知
シ1文字ずつ文字を分離(切シ出し)していた。
帳票1′上のドロップアウトカラーで印刷された文字記
入枠2の読取対象領域(以下フィールドと略す)に対し
て、帳票の上端からフィールドの中心位置までの距離”
1 m ” 2 b帳票の右端からフィールドの左端
までの距離M111M21 b文字枠の大きさ1文字枠
のピッチおよび1フイールド中の文字枠の数の情報が与
えられておシ、これらの情報によって文字枠の位置を知
シ1文字ずつ文字を分離(切シ出し)していた。
従って従来のo c ttの帳票1′は文字記入枠2を
ドロッグアウトカ2−で印刷し、それ以外の部分。
ドロッグアウトカ2−で印刷し、それ以外の部分。
例えば帳票の種別を示す部分や記入者への注意事項を明
示する部分等は1文字記入者が見易い様に非ドロッグア
ウトカラーで印刷する必要がちり。
示する部分等は1文字記入者が見易い様に非ドロッグア
ウトカラーで印刷する必要がちり。
通常2色以ヒの多色印刷を行なわねばならなかった。
また帳票1を作成するにあたっては多色印刷が不可能な
複写機によって行なうことができなかった。
複写機によって行なうことができなかった。
従って本発明の目的は、ドロップアウトカラーを使用し
ていない用紙上の文字を認識することのできる光学文字
読取装置を提供することにある。
ていない用紙上の文字を認識することのできる光学文字
読取装置を提供することにある。
本発明によれば、メモリ上に記憶された文字記入枠とそ
の内側に記入された認識対象文字とのビットパターンイ
メージに対して、文字記入枠の特定位置の座標を検出し
て帳票上の認識対象フィールドの位11を知り、文字記
入枠内の文字全1文字ずつ切出すことを特徴とする光学
文字読取装置が得られる。
の内側に記入された認識対象文字とのビットパターンイ
メージに対して、文字記入枠の特定位置の座標を検出し
て帳票上の認識対象フィールドの位11を知り、文字記
入枠内の文字全1文字ずつ切出すことを特徴とする光学
文字読取装置が得られる。
次に本発明の一実施例を示す南面全参照1−で本発明の
詳細な説明する。
詳細な説明する。
第2図において、帳票Ifには非ドロップアウトカラー
で文字記入枠3が印1+:11されている。
で文字記入枠3が印1+:11されている。
回路構成のブロック図を示す第3図において。
光学変換素子4は帳票1にに印刷された文字記入枠とそ
の枠内に記入された文字とを走査する。その結果得られ
るアナログ信号けA−I)変換器5で二値化信吟に変換
される。行バッファメモリ6は帳票l上の1行分のデー
タを格納する。
の枠内に記入された文字とを走査する。その結果得られ
るアナログ信号けA−I)変換器5で二値化信吟に変換
される。行バッファメモリ6は帳票l上の1行分のデー
タを格納する。
文字枠検出部8 i、i:行バッファ6に格納されたパ
ターンを43査し1文字枠と検出し、文字枠の座標を文
字切り出し部9−5送出する。文字切り出し部9で切り
出された文字は文字認識部IOに送られて認識される。
ターンを43査し1文字枠と検出し、文字枠の座標を文
字切り出し部9−5送出する。文字切り出し部9で切り
出された文字は文字認識部IOに送られて認識される。
制御部7は各回路の動作?を制御する0
次に、この回路の動作について説明する。文字枠検出動
作を示す第・1図において、二値信号化された帳票の1
行分のデータは行バッファ6に入力されるが、フォーマ
ット清報によυ文字記入枠の縦方向の中心位置が、6の
Y方向の中心位置に入る様に制御部7でff1lJ m
9されている。文字枠構1ij部8には予め文字記入枠
3の位置1′#報M1! + Ellが与えられており
、文字枠検出部8は行バッフ16に入力された文字記入
枠3の左端距離X1.右端距離X2を算出し、文字枠検
出のための基準点A。
作を示す第・1図において、二値信号化された帳票の1
行分のデータは行バッファ6に入力されるが、フォーマ
ット清報によυ文字記入枠の縦方向の中心位置が、6の
Y方向の中心位置に入る様に制御部7でff1lJ m
9されている。文字枠構1ij部8には予め文字記入枠
3の位置1′#報M1! + Ellが与えられており
、文字枠検出部8は行バッフ16に入力された文字記入
枠3の左端距離X1.右端距離X2を算出し、文字枠検
出のための基準点A。
B、C,D、EおよびFの座標位置をめる。
A点は文字記入枠3の左辺、B点は文字記入枠3の右辺
、0点は文字記入枠3の左上辺、D点は文字記入枠3の
右上辺、E点は文字記入枠3の左下辺、F点は文字記入
枠3の右下辺を検出するだめの基準点である。これらの
基準点の位置座標(NX。
、0点は文字記入枠3の左上辺、D点は文字記入枠3の
右上辺、E点は文字記入枠3の左下辺、F点は文字記入
枠3の右下辺を検出するだめの基準点である。これらの
基準点の位置座標(NX。
Ny)は下式によりめられる。
字記入枠の高さ、α、d、eは定数である。
文字記入枠3の左辺を検出するため(1)式でめ〜 5
− たA点からY方向にα、X方向に79(定数)の矩形領
域I(1,を矢印の方向に黒ビットをサーチし、第5図
(a)に示すような各行の黒ビット数のヒストグラムを
める。このヒストグラムにおいて、黒ビット数の値がθ
を越える部分の巾Waの中心値でのアドレスA′を文字
記入枠の左辺のX座標として登録する。同様な方法で基
準点Bを起点とする領域Rbにおける黒点数のヒストグ
ラムをめ文字記入枠の右辺のX座標B′を登録する。
− たA点からY方向にα、X方向に79(定数)の矩形領
域I(1,を矢印の方向に黒ビットをサーチし、第5図
(a)に示すような各行の黒ビット数のヒストグラムを
める。このヒストグラムにおいて、黒ビット数の値がθ
を越える部分の巾Waの中心値でのアドレスA′を文字
記入枠の左辺のX座標として登録する。同様な方法で基
準点Bを起点とする領域Rbにおける黒点数のヒストグ
ラムをめ文字記入枠の右辺のX座標B′を登録する。
次に文字記入枠の左上辺を検出するため(1)式でめた
0点からX方向にα、Y方向にβの矩形領域R,c内を
第4図に示す矢印の方向にサーチして第5図(blに示
す黒点数のヒストグラムを作成する。
0点からX方向にα、Y方向にβの矩形領域R,c内を
第4図に示す矢印の方向にサーチして第5図(blに示
す黒点数のヒストグラムを作成する。
このヒストグラムにおいて、黒点数の値がθを越える部
分のd]Waの中心値でのアドレスC′を文字記入枠の
左上辺のX座標として登録する。同様の方法で基準点り
、E、Fを起点とする領域Rd 、 Re。
分のd]Waの中心値でのアドレスC′を文字記入枠の
左上辺のX座標として登録する。同様の方法で基準点り
、E、Fを起点とする領域Rd 、 Re。
RfKおける黒点数のヒストグラムをめ、文字記入枠の
右上辺、左下辺、右下辺の°YX座標p/。
右上辺、左下辺、右下辺の°YX座標p/。
I;/l F/ を登録する。
6−
この方法で検出された名座椋A、’ 、 B’ 、 C
’ 、 I)’。
’ 、 I)’。
E′および1・”′け文字切出1〜部9へ転送される。
文字切り出し部9け1文字枠3内の文字を認識するため
にX座標および)′座板について次の式を満足する範囲
の走−fを行ガう。す々わち、X座標についてti (A’−(−q)〜(I3’−q)(q:定数)の恥、
σ11を、)′座標に関しては、の範囲の紺青を行なう
。こhによって、文字枠3d走育、領域から外される。
にX座標および)′座板について次の式を満足する範囲
の走−fを行ガう。す々わち、X座標についてti (A’−(−q)〜(I3’−q)(q:定数)の恥、
σ11を、)′座標に関しては、の範囲の紺青を行なう
。こhによって、文字枠3d走育、領域から外される。
ここで、(2)式においてp一定数、Xはサーチ開始時
における行バッファ」:のX座標である。
における行バッファ」:のX座標である。
埒らに、V−チした結果のイメージの文字切り出しを行
なうために、最初に黒が検出さtまた点がら1次に黒か
ら白への変換点1でのX沖標の距離CWl(0リ−切出
された黒点部分のブロック番号)を測定する。こわが1
・式 %式%(3) を満足りる場合、その範囲に文字が存在するものとして
、イの間のイメー・ンを夕字認嵩1部10へ転送する。
なうために、最初に黒が検出さtまた点がら1次に黒か
ら白への変換点1でのX沖標の距離CWl(0リ−切出
された黒点部分のブロック番号)を測定する。こわが1
・式 %式%(3) を満足りる場合、その範囲に文字が存在するものとして
、イの間のイメー・ンを夕字認嵩1部10へ転送する。
なお、K)、l予め設定された定数である。
第6図に訃けるサーチ領域の一部を示−j第7図におい
て、最初の文字′″2″については最初に黒が検出され
る点がX’aであり黒から白への変換点がxbでありC
W1=Xb−Xa となる。次に黒が検出さノ17Sノ
1ズ点についてし]、CW 2 = X’、d X c
となり、その次の文字1゛3“についてはCW3=xf
−Xcとなる。K′51・・適当な値、すなわち、最小
の一文字の#Aを示1″値に設定する事により CWl
>K 、CW2(K 、CW3〉Kど12ル。(3)式
を満だ1′場合にのみそのイメージを文字認識部IOへ
送るよう番でしであるので文学観2°2.13″のイメ
ージは認識部JOへ移送され、文字″′2″と3″と間
のノイズ−10へ移送さ′hない。従うで、文字枠3内
に文字以外の汚れ、記入ミヌ晴がある1、3にもぞのイ
メージは文字認識部10へは送られず、誤認識されるこ
とはない。
て、最初の文字′″2″については最初に黒が検出され
る点がX’aであり黒から白への変換点がxbでありC
W1=Xb−Xa となる。次に黒が検出さノ17Sノ
1ズ点についてし]、CW 2 = X’、d X c
となり、その次の文字1゛3“についてはCW3=xf
−Xcとなる。K′51・・適当な値、すなわち、最小
の一文字の#Aを示1″値に設定する事により CWl
>K 、CW2(K 、CW3〉Kど12ル。(3)式
を満だ1′場合にのみそのイメージを文字認識部IOへ
送るよう番でしであるので文学観2°2.13″のイメ
ージは認識部JOへ移送され、文字″′2″と3″と間
のノイズ−10へ移送さ′hない。従うで、文字枠3内
に文字以外の汚れ、記入ミヌ晴がある1、3にもぞのイ
メージは文字認識部10へは送られず、誤認識されるこ
とはない。
本発明d、以」二説明した様に1文字記入枠の座標位置
ケ検出し、文字記入枠の内部領域をサーチすることによ
って、非ドロップアウトカラーで記入された文字記入枠
の内部に記入された文字を切出す事が可能となり1文字
認識用の帳票作成の工程を低減させることができる。
ケ検出し、文字記入枠の内部領域をサーチすることによ
って、非ドロップアウトカラーで記入された文字記入枠
の内部に記入された文字を切出す事が可能となり1文字
認識用の帳票作成の工程を低減させることができる。
第1図は従来のo c n、帳票を示す図、第2図は本
発明の文字認識装置に使用される帳票の一例を示す図、
第3図は本発明の一実施例を示う°ブロン2図、第4図
は文字記入枠の座標を検出する方法を説明するだめの図
、第5図は文字枠の座標と黒点数の関係を示すヒストダ
ラム、第6図は一文字記入枠内をサーチする方法を説明
するだめの図、第7図は、文字の分離方法について説明
するための図である。 l・・・・・・OCR帳票、3・・・・・・文字記入枠
、4・・・・・・光9− 電変投部、5・・・・・・A /’ D変換部1.6・
・・・−行バツフアメモリ、?・・・・−・制御部、8
・・・・・・文字枠検出部。 9・・・・・・文字切出し部、10・・・・・・文字認
識部。 10− v:)′3図 −488− 第 17図
発明の文字認識装置に使用される帳票の一例を示す図、
第3図は本発明の一実施例を示う°ブロン2図、第4図
は文字記入枠の座標を検出する方法を説明するだめの図
、第5図は文字枠の座標と黒点数の関係を示すヒストダ
ラム、第6図は一文字記入枠内をサーチする方法を説明
するだめの図、第7図は、文字の分離方法について説明
するための図である。 l・・・・・・OCR帳票、3・・・・・・文字記入枠
、4・・・・・・光9− 電変投部、5・・・・・・A /’ D変換部1.6・
・・・−行バツフアメモリ、?・・・・−・制御部、8
・・・・・・文字枠検出部。 9・・・・・・文字切出し部、10・・・・・・文字認
識部。 10− v:)′3図 −488− 第 17図
Claims (1)
- 文字記入枠と前記文字記入枠内に記入された文字列とを
含む帳票上のイメージを記憶する記憶手段と、前記記憶
手段内のイメージの予め定められた領域の走査を行なっ
て前記文字記入枠の特定位置の座標を算出する手段と、
前記特定位置の座標に基いて前記文字記入枠内の走査領
域を算出し前記文字記入枠内の文字切シ出しを行う手段
とを具備することを特徴とする光学文字読取装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP58122117A JPS6014381A (ja) | 1983-07-05 | 1983-07-05 | 光学文字読取装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP58122117A JPS6014381A (ja) | 1983-07-05 | 1983-07-05 | 光学文字読取装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS6014381A true JPS6014381A (ja) | 1985-01-24 |
Family
ID=14828044
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP58122117A Pending JPS6014381A (ja) | 1983-07-05 | 1983-07-05 | 光学文字読取装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS6014381A (ja) |
-
1983
- 1983-07-05 JP JP58122117A patent/JPS6014381A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPS58103266A (ja) | 文字画像処理装置 | |
US5038393A (en) | Method of effectively reading data written on data sheet, and data reading apparatus therefor | |
US5448692A (en) | Digital image processing device involving processing of areas of image, based on respective contour line traces | |
JPS6014381A (ja) | 光学文字読取装置 | |
JP2823350B2 (ja) | マルチメディア入力装置 | |
JPS60110085A (ja) | 光学式文字読取装置の文字切出し装置 | |
JPH0557632B2 (ja) | ||
JPH036552B2 (ja) | ||
JPS6134683A (ja) | 光学文字読取装置 | |
JPS5972577A (ja) | 図面読取装置 | |
JPH01245376A (ja) | 文字読取装置の文字切出し装置 | |
JPH01144181A (ja) | 光学的文字読取装置 | |
JPH06309499A (ja) | 帳票処理装置 | |
JPS59111578A (ja) | フアクシミリによる文字読取方式 | |
JPS5831028B2 (ja) | 文字認識装置 | |
JPS63184181A (ja) | 光学文字認識装置 | |
JPS60142480A (ja) | 印刷文字読み取り装置 | |
JPS5860381A (ja) | スキユ−検出方式 | |
JPS60160486A (ja) | 光学的文字読取装置 | |
JPS61148583A (ja) | エンボスカ−ドの複写文字読取方式 | |
JPS61289479A (ja) | 繋がり文字を読取る文字認識装置 | |
JPS60254382A (ja) | 文字行検出方式 | |
JPH06301813A (ja) | 文字読取方法 | |
JPH03189783A (ja) | フアクシミリ画像用文字認識装置 | |
JPS5887667A (ja) | 手書き情報切出し方式 |