JPS58203580A - 文字読取装置 - Google Patents
文字読取装置Info
- Publication number
- JPS58203580A JPS58203580A JP57086071A JP8607182A JPS58203580A JP S58203580 A JPS58203580 A JP S58203580A JP 57086071 A JP57086071 A JP 57086071A JP 8607182 A JP8607182 A JP 8607182A JP S58203580 A JPS58203580 A JP S58203580A
- Authority
- JP
- Japan
- Prior art keywords
- code string
- code
- smoothing
- character
- line segment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/18—Extraction of features or characteristics of the image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Discrimination (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
この発明は、帳票に記録された数字、ローマ字、かな文
字等の文字を読取る文字読取装置に関するものである。
字等の文字を読取る文字読取装置に関するものである。
すなわち、読取りの対象となる文字の種類は比較的小数
であり、かつ帳票上所定の枠内に入る大きさの文字を対
象とした読取装置である。
であり、かつ帳票上所定の枠内に入る大きさの文字を対
象とした読取装置である。
この種の装置として従来用いられているものに第1図に
示すものがあった。第1図において111 Fiパター
ン観測記憶装置、(2)は輪郭線分検出装置、(3)は
符号列検出装置、(4)は辞書、(5)は整合判別装置
である。
示すものがあった。第1図において111 Fiパター
ン観測記憶装置、(2)は輪郭線分検出装置、(3)は
符号列検出装置、(4)は辞書、(5)は整合判別装置
である。
@票上に記録された文字をテレビジョンカメラの如き光
電変換装置によって走査し、文字が記録されている枠の
面をそれぞれ小面積の多数の画素に分解したと考えたと
き各画素の濃度を表す電気信号を得てこれらの電気信号
を製電の白黒に対応する2値信号「0」、「1」に変換
し、上記画素の配列に相似な配列の記憶素子に上記2値
信号を格納して文字パターンを得ることは従来よく知ら
れている。パターン観測記tm装置(1)は上述の手段
により文字パターンを作成してこれを記憶する。
電変換装置によって走査し、文字が記録されている枠の
面をそれぞれ小面積の多数の画素に分解したと考えたと
き各画素の濃度を表す電気信号を得てこれらの電気信号
を製電の白黒に対応する2値信号「0」、「1」に変換
し、上記画素の配列に相似な配列の記憶素子に上記2値
信号を格納して文字パターンを得ることは従来よく知ら
れている。パターン観測記tm装置(1)は上述の手段
により文字パターンを作成してこれを記憶する。
第2図はパターン観測記憶装置(1)内に記憶される文
字パターンの一例を示す図で、斜線の部分に配列された
記憶素子には「1」のビットが他の部分の記憶素子(記
憶素子配列の外側境界は第2図には示してない)にtま
すべて「0」のビットが格納さねているとする。図中(
6)は文字パターンを衣[7、斜線内の正方形の区画は
文字パターン(6)の各記憶素子ブロックを示し1個又
はn2(nは2以上の整数)個の6己憶素子の集合から
なる。(7)は輪郭追跡の開始ブロックを示し、輪郭は
第2図に矢印で示すように反時計方向に追跡される。輪
郭は「0」のビットに隣接する「1」のビットで表され
るから文字パターン(6)の輪郭を求めることは容易で
ある。
字パターンの一例を示す図で、斜線の部分に配列された
記憶素子には「1」のビットが他の部分の記憶素子(記
憶素子配列の外側境界は第2図には示してない)にtま
すべて「0」のビットが格納さねているとする。図中(
6)は文字パターンを衣[7、斜線内の正方形の区画は
文字パターン(6)の各記憶素子ブロックを示し1個又
はn2(nは2以上の整数)個の6己憶素子の集合から
なる。(7)は輪郭追跡の開始ブロックを示し、輪郭は
第2図に矢印で示すように反時計方向に追跡される。輪
郭は「0」のビットに隣接する「1」のビットで表され
るから文字パターン(6)の輪郭を求めることは容易で
ある。
輪郭線分検出装置(2)では、まず輪郭線分の方向を検
出して方向コードによって表示する。第3−1は方向を
表すフリーマンコードを示す図で反時計方向45°ごと
に数値1を加え0〜7の数字で各方向を表している。第
4図に符号(8)で示すコードは第2図の文字パターン
をブロック(7)から開始して方向コードを表した方向
コード列である。ブロックの輪郭中心から次のブロック
の輪郭中心に到る線分の方向を第3図の方向コードによ
って表すと第4図のとおりKなる。
出して方向コードによって表示する。第3−1は方向を
表すフリーマンコードを示す図で反時計方向45°ごと
に数値1を加え0〜7の数字で各方向を表している。第
4図に符号(8)で示すコードは第2図の文字パターン
をブロック(7)から開始して方向コードを表した方向
コード列である。ブロックの輪郭中心から次のブロック
の輪郭中心に到る線分の方向を第3図の方向コードによ
って表すと第4図のとおりKなる。
第5図は第4図の方向コード列から線分の種類を決定す
る操作を示す図で、(9)は第4図の方向コード列の数
イーからその左側のΦV値を減算(但し8進法)した数
値によって構成した屈折度列を示す。
る操作を示す図で、(9)は第4図の方向コード列の数
イーからその左側のΦV値を減算(但し8進法)した数
値によって構成した屈折度列を示す。
したがって、屈折度率+1は反時計方向へ45°屈折し
たことを示す、 従来の装置では屈折度列を所定の法則により平坦化した
上で輪郭線分の種類を決定する。それは文字パターンに
混入されるノイズによって端点以外の部分で屈折率が和
激にかつ微細に管化することがあり得るのでこのような
部分はノイズによるものと兄做して平坦化するのである
。たとえば屈折度列において、正負の値が隣り合うjJ
J合、正の屈折度から数値1を減じ負の屈折度に数値1
を増加して平滑処理を村う。第5図1の屈折度列(9)
において−1+2−1と連続する所は両側の−1にそれ
ぞれ1が加算され+2の屈折度は両隣りの影醤のため合
計2が減ぜられて000となる。601はこのようにし
て平滑化した屈折度列である。
たことを示す、 従来の装置では屈折度列を所定の法則により平坦化した
上で輪郭線分の種類を決定する。それは文字パターンに
混入されるノイズによって端点以外の部分で屈折率が和
激にかつ微細に管化することがあり得るのでこのような
部分はノイズによるものと兄做して平坦化するのである
。たとえば屈折度列において、正負の値が隣り合うjJ
J合、正の屈折度から数値1を減じ負の屈折度に数値1
を増加して平滑処理を村う。第5図1の屈折度列(9)
において−1+2−1と連続する所は両側の−1にそれ
ぞれ1が加算され+2の屈折度は両隣りの影醤のため合
計2が減ぜられて000となる。601はこのようにし
て平滑化した屈折度列である。
符号列検出’Ij#(3)は平滑化した屈折度列(l(
車から屈折度の分類を行う。−tなわち、屈折18′3
以上の部分を端、1又は20部分を凸、−1以下の部分
を凹とする。第5図01)はこのようにして決定した屈
折度分類を示す。次に、屈折母分類0珍における端は輪
郭線分の端漬部とし、端又は凸に挾まれかつ凹のみを含
む領域を四部とし、上記端点部と凹部以外の部を凸部と
する。第5図03はこのようにして決定した輪郭線分種
類を示す。次に端点部、凹部、凸部にそれぞれ2.3.
1の符号を付して輪郭線分の出現順に配列すると第5図
Q3に示す符号夕II K−得る。この符号列が符号列
検出装置(3)から整合判別装置(5)へ出力される。
車から屈折度の分類を行う。−tなわち、屈折18′3
以上の部分を端、1又は20部分を凸、−1以下の部分
を凹とする。第5図01)はこのようにして決定した屈
折度分類を示す。次に、屈折母分類0珍における端は輪
郭線分の端漬部とし、端又は凸に挾まれかつ凹のみを含
む領域を四部とし、上記端点部と凹部以外の部を凸部と
する。第5図03はこのようにして決定した輪郭線分種
類を示す。次に端点部、凹部、凸部にそれぞれ2.3.
1の符号を付して輪郭線分の出現順に配列すると第5図
Q3に示す符号夕II K−得る。この符号列が符号列
検出装置(3)から整合判別装置(5)へ出力される。
一方、@糸上に記録されることのあるすべての文字の基
準形の文字(正確な形に表示した文字)に対1.パター
ン観測記憶装置(1)、輪郭線分検出装置(2)、符号
列検出装置(3)によりあらかじめ上述の処理を施して
得たそれぞれの符号列が辞書(4)に格納されている。
準形の文字(正確な形に表示した文字)に対1.パター
ン観測記憶装置(1)、輪郭線分検出装置(2)、符号
列検出装置(3)によりあらかじめ上述の処理を施して
得たそれぞれの符号列が辞書(4)に格納されている。
整合判別装置(5)は符号列検出装置(3)から出力さ
れた符号列に最もよく近似している(同一のものがあれ
ば、同一のものが鹸もよく近似している本のである)符
号列を辞書(4)から求めこの符号列に灼応する文字パ
ターンであると決定する。
れた符号列に最もよく近似している(同一のものがあれ
ば、同一のものが鹸もよく近似している本のである)符
号列を辞書(4)から求めこの符号列に灼応する文字パ
ターンであると決定する。
従来のg置は以−ヒのように動作するので、屈折度列(
9)から平滑化した屈折度列(1f)はIfIjl類し
か作成されずしたがって1つの文字パターン(6)に対
応する符号夕11Q3は1種類しか作成されないので、
平滑化の程度を増加すると文字パターンの本来の特徴が
失われて整合判別装置(5)における判定が困難となり
、他方、平滑化の程度を減少すれば、ノイズの影響を符
号列検出装置(3)で除去することができないため、整
合判別装# t51において誤った判定が行われるとい
う欠点があった。
9)から平滑化した屈折度列(1f)はIfIjl類し
か作成されずしたがって1つの文字パターン(6)に対
応する符号夕11Q3は1種類しか作成されないので、
平滑化の程度を増加すると文字パターンの本来の特徴が
失われて整合判別装置(5)における判定が困難となり
、他方、平滑化の程度を減少すれば、ノイズの影響を符
号列検出装置(3)で除去することができないため、整
合判別装# t51において誤った判定が行われるとい
う欠点があった。
この発明は従来のものの上記の欠点を除去するためにな
されたもので、屈折度列に対する平滑化の程度を少くと
も2段階設け、一つの文字パターンについて上記各段階
ごとの符号列を作成し、基準の文字パターンに対し7あ
らかじめ作成して辞書中に格納しておいた上記各段階ご
とあ符号列と比較することにより信軸度の高い読取結果
か得られる文字読1i7装置を提供することを目的とし
ている。
されたもので、屈折度列に対する平滑化の程度を少くと
も2段階設け、一つの文字パターンについて上記各段階
ごとの符号列を作成し、基準の文字パターンに対し7あ
らかじめ作成して辞書中に格納しておいた上記各段階ご
とあ符号列と比較することにより信軸度の高い読取結果
か得られる文字読1i7装置を提供することを目的とし
ている。
以下、図面についてこの発明の詳細な説明する。最も簡
単な実んれ例は平滑化の程度を2段階とし、第1の段階
としては伺等平滑化処理を行わないもの、第2の段階き
しては従来の4し置と同一の程度の平滑化処理を行う場
合を考える。従ってこの発明の装置の構成は第1図に示
す従来のものと同一であって、ただ符号列検出装置(3
)はさきに第5図について説明したように平滑化した屈
折度列+tdに対応する符号列(至)を作成する回路の
ほかに、平滑化前の屈折度列(9)に対応する符号列に
対応する一1路を備え、辞書(4)には同一の基準文字
パターンに対し上記第1及び第2段階にそれぞれ対応す
る符号列を格納しており、整合判別装置(5)では上記
第1及び第2段階にそれぞれ対応して整合判別を行う回
路を備えている。
単な実んれ例は平滑化の程度を2段階とし、第1の段階
としては伺等平滑化処理を行わないもの、第2の段階き
しては従来の4し置と同一の程度の平滑化処理を行う場
合を考える。従ってこの発明の装置の構成は第1図に示
す従来のものと同一であって、ただ符号列検出装置(3
)はさきに第5図について説明したように平滑化した屈
折度列+tdに対応する符号列(至)を作成する回路の
ほかに、平滑化前の屈折度列(9)に対応する符号列に
対応する一1路を備え、辞書(4)には同一の基準文字
パターンに対し上記第1及び第2段階にそれぞれ対応す
る符号列を格納しており、整合判別装置(5)では上記
第1及び第2段階にそれぞれ対応して整合判別を行う回
路を備えている。
第6図は平滑化前の屈折度列(9)に対する符号列の作
成手順を示す図で、(9)→04 、04→(至)、0
!3→α0に用いられる法則Fi第5図において(9)
→(10、+1+j→0す、0η→(6)、(6)→(
至)の変換に用いられる法則とそれぞれ同一である。a
hFi平滑化を施さない場合の符号列を示す。
成手順を示す図で、(9)→04 、04→(至)、0
!3→α0に用いられる法則Fi第5図において(9)
→(10、+1+j→0す、0η→(6)、(6)→(
至)の変換に用いられる法則とそれぞれ同一である。a
hFi平滑化を施さない場合の符号列を示す。
たとえば、読取りの対象となる文字パターンに対し平滑
化した場合の符号列(第5図03)としてr 2323
21 J を得たとする。辞書(4)の基準文字パタ
ーンに対し平滑化した場合の符号列でr 232321
−となっているものを調査すると片かなの「す」とロー
マ字のrTJを得る。第7図は「す」の文字パターン0
ηと平滑化[7た場合の符号列0→及び平滑化しない場
合の符号列α傷を示し、第8図はITJの文字パターン
田と平滑化した場合の符号列シυ及び平滑化しない場合
の符号列(ハ)を示す。したがって符号列検出装置(3
)の出力のうち平滑化した符号列0;lの「23232
1」 を辞4(4)を参照すると「す」又はITJで
あることがわかり、次に平滑化しない符号列00のr
23232313 J を辞書(4)を参照すること
により、符号列検出装[(31から出力された文字パタ
ーンは「す」であると決定することができる。以上に説
明したような2段階の整合によりノイズに強くかつ高信
頼度で文字を読取ることができる。
化した場合の符号列(第5図03)としてr 2323
21 J を得たとする。辞書(4)の基準文字パタ
ーンに対し平滑化した場合の符号列でr 232321
−となっているものを調査すると片かなの「す」とロー
マ字のrTJを得る。第7図は「す」の文字パターン0
ηと平滑化[7た場合の符号列0→及び平滑化しない場
合の符号列α傷を示し、第8図はITJの文字パターン
田と平滑化した場合の符号列シυ及び平滑化しない場合
の符号列(ハ)を示す。したがって符号列検出装置(3
)の出力のうち平滑化した符号列0;lの「23232
1」 を辞4(4)を参照すると「す」又はITJで
あることがわかり、次に平滑化しない符号列00のr
23232313 J を辞書(4)を参照すること
により、符号列検出装[(31から出力された文字パタ
ーンは「す」であると決定することができる。以上に説
明したような2段階の整合によりノイズに強くかつ高信
頼度で文字を読取ることができる。
以上の実施例では、平滑化の程度を2種類とし従って単
一の文字パターンに対し2種類の符号列 。
一の文字パターンに対し2種類の符号列 。
を出力したが、この発明はこれに限らず平滑化の程度を
3種類以上とすることもできる。又、上記の4・施例は
1つの文字に対し1個の輪郭線が得られる場合を示した
が、2個以上の輪郭線が得られる場合も同様である。更
に上記実施例では方向コードを用いて輪郭線分の稽類を
決定する場合を鰭。
3種類以上とすることもできる。又、上記の4・施例は
1つの文字に対し1個の輪郭線が得られる場合を示した
が、2個以上の輪郭線が得られる場合も同様である。更
に上記実施例では方向コードを用いて輪郭線分の稽類を
決定する場合を鰭。
明したが、他のどのような方法によって輪郭線分を決定
してもよい。
してもよい。
以上のようにこの発明によればノイズに強い線分検出方
法と、倣小な凹凸情報を保つことができる線分検出方法
とにより1つの文字パターンに対し少くとも2種類の符
号列を作hνするので、ノイズに強く、かつ精度の高い
文字認識を行うことができる。
法と、倣小な凹凸情報を保つことができる線分検出方法
とにより1つの文字パターンに対し少くとも2種類の符
号列を作hνするので、ノイズに強く、かつ精度の高い
文字認識を行うことができる。
第1図は文字読取装置の構成を示すブロック図、第2図
は文字パターンの一例を示す図、第3図はフリーマンの
方向コードを示す図、第4図は第2図の一郭線の方向コ
ード列を示す図、第5図は第4図の方向コード列から屈
折度列、平滑化した屈折度列を介して符号列を生成する
)1卜序を示す図、第6図は第5図の屈折度列から符号
列を生成する順序を示す図、iA7図及び第8図は文字
パターンと平滑化した場合の符号列及び平滑化しない場
合の符号列との対応金ボす図である。 +11・・・パターン観劇記憶装m、(21・・・輪郭
線分検出装置、(3)・・・符号列検出装置、(4)・
・・辞書、(5)・・・整合判別装置it、(6) 、
0η、 C!l・・・それぞれ文字パターン、03
、 (II 、 Gl!])・・・それぞれ平滑化した
ときの符号列、on 、 al、 cg・・・それぞれ
平滑しないときの符号列。 代理人 葛 野 信 − 第7図 17 18、、 3 □ 3 。 第8図 J 1 3
は文字パターンの一例を示す図、第3図はフリーマンの
方向コードを示す図、第4図は第2図の一郭線の方向コ
ード列を示す図、第5図は第4図の方向コード列から屈
折度列、平滑化した屈折度列を介して符号列を生成する
)1卜序を示す図、第6図は第5図の屈折度列から符号
列を生成する順序を示す図、iA7図及び第8図は文字
パターンと平滑化した場合の符号列及び平滑化しない場
合の符号列との対応金ボす図である。 +11・・・パターン観劇記憶装m、(21・・・輪郭
線分検出装置、(3)・・・符号列検出装置、(4)・
・・辞書、(5)・・・整合判別装置it、(6) 、
0η、 C!l・・・それぞれ文字パターン、03
、 (II 、 Gl!])・・・それぞれ平滑化した
ときの符号列、on 、 al、 cg・・・それぞれ
平滑しないときの符号列。 代理人 葛 野 信 − 第7図 17 18、、 3 □ 3 。 第8図 J 1 3
Claims (1)
- 帳票上に記録キれた文字を光学的に走査して各部分の画
素の4冴に対応する2値信号に変換しこの2値信号を上
記画素の配夕1jと相似形に配列された記憶素子に格納
することによって文字パターンを記憶するパターン観測
記憶装−と、このパターン観測記す、は装置の6己憶内
容から上記文字パターンの輪郭線分を検出する一郭籾分
検出装置と、この輪郭線分検出装(σで検出した輪郭線
分に対し互に杵度の異なる平滑処理を施した後、上記平
滑処理稜の輪郭線分をH[定の法則に従って凹部、凸部
、端点部の3桟類の部分に分類し、それぞれの線分種類
にそれぞれの符号を対応させ、線分の出現順に従って当
該性分の柚類を表す符号を配列して、上61互に程度の
異なる平滑処理ごとに符号列を作成する符号列検出装置
と、上記帳票上に記録されることのあるすべての文字の
基準形の文字に対しかつ上記互に程度の異なる平滑処理
ごとにあらかじめ作成された符号列が格納されている辞
書と、上記符号列検出装置により作成された符号列を上
記辞書内の上記平滑程度の互に同一なすべての符号夕+
1と対比してその近似度の最も大なるものを検出する整
合判別装置とを備えた文字読取装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP57086071A JPS58203580A (ja) | 1982-05-21 | 1982-05-21 | 文字読取装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP57086071A JPS58203580A (ja) | 1982-05-21 | 1982-05-21 | 文字読取装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS58203580A true JPS58203580A (ja) | 1983-11-28 |
Family
ID=13876468
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP57086071A Pending JPS58203580A (ja) | 1982-05-21 | 1982-05-21 | 文字読取装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS58203580A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03127291A (ja) * | 1989-10-13 | 1991-05-30 | Internatl Business Mach Corp <Ibm> | 手書きストロークの認識装置及び方法 |
-
1982
- 1982-05-21 JP JP57086071A patent/JPS58203580A/ja active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03127291A (ja) * | 1989-10-13 | 1991-05-30 | Internatl Business Mach Corp <Ibm> | 手書きストロークの認識装置及び方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US4087788A (en) | Data compression system | |
DK175021B1 (da) | Optisk maskinlæselig, binær kode, samt fremgangsmåde til aflæsning og frembringelse heraf | |
Sanfeliu et al. | A distance measure between attributed relational graphs for pattern recognition | |
US4408342A (en) | Method for recognizing a machine encoded character | |
US4288779A (en) | Method and apparatus for character reading | |
US4817187A (en) | Apparatus and method for vectorization of incoming scanned image data | |
JPS605037B2 (ja) | 図面読取装置 | |
US5038384A (en) | Information reading apparatus | |
US4628533A (en) | Pattern recognition apparatus | |
JPH06282686A (ja) | 文字認識方法 | |
JPS58203580A (ja) | 文字読取装置 | |
EP0288820A2 (en) | A slip and method of and apparatus for automatic reading of the slip | |
JPH041385B2 (ja) | ||
JP2590099B2 (ja) | 文字読取方式 | |
JPS6252911B2 (ja) | ||
JPS58125183A (ja) | 光学文字読取装置における認識不能文字表示方法 | |
JPS58105387A (ja) | 文字認識方法 | |
JPH04112276A (ja) | 2値画像輪郭線チェイン符号化装置 | |
Tavakoli | A new approach to pattern recognition | |
JP2771045B2 (ja) | 文書画像の領域分割方法 | |
JPH0460782A (ja) | パターン処理装置 | |
JPS5914078A (ja) | 帳票読取装置 | |
JPS61156486A (ja) | 画像処理装置 | |
JPS61125293A (ja) | モザイクコ−ド化装置 | |
JPS6349982A (ja) | 3隣接画素コ−ド化処理方式 |