JPH0432433B2 - - Google Patents

Info

Publication number
JPH0432433B2
JPH0432433B2 JP57039007A JP3900782A JPH0432433B2 JP H0432433 B2 JPH0432433 B2 JP H0432433B2 JP 57039007 A JP57039007 A JP 57039007A JP 3900782 A JP3900782 A JP 3900782A JP H0432433 B2 JPH0432433 B2 JP H0432433B2
Authority
JP
Japan
Prior art keywords
mark
standard pattern
character
characters
standard
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP57039007A
Other languages
English (en)
Other versions
JPS58155484A (ja
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed filed Critical
Priority to JP57039007A priority Critical patent/JPS58155484A/ja
Publication of JPS58155484A publication Critical patent/JPS58155484A/ja
Publication of JPH0432433B2 publication Critical patent/JPH0432433B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/186Templates

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 本発明は標準パターン選択装置に関し、さらに
詳しくは、読取対象文字・記号を、あらかじめ定
められた範囲内で自由に変更する事ができる標準
パターン選択装置に関するものである。
第1図は従来知られている文字読取装置の一例
を示したものであるが、図において帳票1の上に
書かれた文字の画像は、レンズ2により光電変換
素子3の上に結ばれる。光電変換素子3として
は、一次元の半導体イメージセンサを使う事が多
いが、この場合は、帳票1を矢印11で示した方
向に動かし、帳票の画像を光電変換素子3の上で
移動させて、画像の各行に対応した電気信号を光
電変換素子3から、順次画像信号として得るよう
にしてある。この画像信号は2値化回路4で2値
化された後記憶装置5に記憶される。文字切り出
し装置6は、記憶装置5に記憶された画像信号か
ら1文字分の画像信号を順次切り出し、類似度計
算回路8へ送る。類似度計算回路8では、この1
文字分の画像信号と、記憶装置7に記憶された複
数の標準パターンとの類似度を順次計算し、その
計算結果を類似度比較回路9へ送る。類似度比較
回路9では、これらの計算結果を比較して最大の
類似度を求め、その最大の類似度を与えた標準パ
ターンに対応したカテゴリーを磁気テープ等の外
部記憶装置10へ認識結果とし出力する。
さて、ここで説明した、記憶装置7に記憶され
た標準パターンは、従来、数字用、英字用、カナ
文字用といつたように、あらかじめ決められた文
字グループ毎に作られており、文字読取装置の使
用者は、フオーマツトプログラム等でどの文字グ
ループの標準パターンを使用するかは指定できた
ものの、どの文字の標準パターンを使用するかを
一文字ずつ指定する事はできなかつた。これは、
第1図で示した構成と異なつた構成を持つ文字読
取装置においても同様である。文字読取装置の読
取対象文字数が少く、数字、英字、カナ文字位ま
でしか読めない場合は、これでもさして問題はな
かつたが、読取対象文字数が多くなり、漢字とカ
ナ文字が混在する和文まで読むよううになると、
このような文字種毎の標準パターン指定法では大
きな不都合が生じてくる。まず第1に、漢字の文
字種は数万字もあり、これらすべての文字の標準
パターンと入力文字との類似度を求めていたので
は、処理時間が大変長くなり、かつ文字の認識精
度が悪くなる。読み取る文章の分野を限れば1000
字程度の漢字で間に合う事も多く、いつも数万字
の標準パターンとの一致を調べるのは不都合であ
る。第2に漢字の己と己や未と末のように紛らわ
しい文字の出現確率が高くなるので、各文字の字
形に強い制限を加えるか、これらの文字の区別を
ある程度であきらめるかしなければならなくな
る。このように従来の文字種毎の標準パターン指
定法では和文を読むOCRでは大きな不都合が生
じている。
本発明の目的は、このような不都合を解消した
標準パターン選択装置を提供する事にある。
本発明によれば、あらかじめ内部に記憶された
複数の標準パターンの位置と、帳票上のあらかじ
め定められた複数の印記入欄の位置とがそれぞれ
対応して成された帳票の前記印記入欄に選択的に
つけられた印の有無とその位置を検知する手段
と、検知された印の有無に従い、あらかじめ内部
に記憶された標準パターンより、印記入欄の位置
に対応したものを選択する手段を有し、前記選択
手段により選択されたパターンを標準パターンと
することを特徴とする標準パターン選択装置が得
られる。
第2図は標準パターンを選択する為に用いる帳
票の一例であり、図中12はタイミングマーク、
13は印記入欄である。帳票にあらかじめ印刷さ
れた文字または記号の内、使用するものに対応し
た印記入欄に横線等を記入して、使用する文字、
記号を指定する。文字種が多く、数枚の帳票にわ
たる場合は、各帳票の区別が容易にできるよう
に、番号又は印が特定の位置にあらかじめ印刷さ
れる。
第3図は第2図におけるタイミングマーク12
と印記入欄13を拡大したものであり、第7図の
理解を助けるために、第5図における実施例に従
いこれらを電気信号に変換した場合の出力
INDATAにおける、印記入欄の大きさと、印記
入欄とタイミングマークの間の間隔も第7図に合
せて配してあるが、これらの値は一例として示し
たものにすぎない。
第4図は本発明による標準パターン選択装置の
一実施例をブロツク図で示したものである。図に
おいて、80は画像入力装置であり、帳票の画像
を電気信号に変換し、2値に量子化する。81は
画像信号記憶装置で、画像入力装置80で得られ
た画像の信号を記憶する。82はタイミングマー
ク検知装置であり、画像信号記憶装置81に記憶
した画像信号より、タイミングマークの位置を検
知する。83は印記入欄切り出し装置で、タイミ
ングマーク検知装置82で得られたタイミングマ
ークの位置より印記入欄の位置を計算し、その位
置における画像信号を画像入力装置80より取り
込む。84は黒ビツト数カウント装置で、印記入
欄切り出し装置83で切り出した画像信号の中の
黒である点の数を数える。85は標準パターン編
集装置で、黒ビツト数カウント装置84で数えた
黒ビツトの数が一定値以上であれば印記入欄に印
が記入されているとし、その位置の印記入欄に対
応した標準パターンを別のメモリに移送し、標準
パターンの編集を行う。なおこの標準パターン編
集装置の代りに、各印記入欄における印の有無の
みを記憶し、文字を認識する時に、印がつけられ
ていた印記入欄に対応した標準パターンのみを選
択して一致を調べる方法を用いる事も可能であ
る。
尚、黒ビツト数カウント装置84において黒ビ
ツトをカウンしたが、文字認識の他の手法、例え
ば縁追跡法、位相構造化法、細線化後の芯線追跡
法、などによつて特徴を抽出し、標準パターン編
集装置85において印と判定するための辞書と照
合するようにしても良い。
また、黒ビツト数カウント装置84、標準パタ
ーン編集装置85において標準の印パターンとの
パターンマツチングを行うことによつて、代行さ
せることも出来る。この方法は、活字認識に多く
は採用されている手法である。
第5図〜第8図は第4図を一例を用いてさらに
詳しく説明したものであり、第4図の各ブロツク
に対応する部分を点線で示してある。第5図にお
いて帳票20は第2図に示したものと同じであ
り、矢印21の方向に移動する。光源22は帳票
20を照射し、レンズ23は帳票20の画像を一
次元光電変換素子24の上に結ぶ。ここでは一次
元光電変換素子24として、128ビツトの半導体
イメージセンサを用いるものとする。一次元光電
変換素子24の出力は増幅器25で増幅され、2
値化回路26で2値化される。128ビツトのシフ
トレジスタ27は2本直列につながれており、信
号28(SHIFTP)で2値化回路26の出力
INDATAを順次シフトして記憶する。シフトレ
ジスタ27の内容は、信号29()でクリ
アーされる。
第6図はタイミングマーク検知装置
(TMARK)の発生条件を示したものであり、2
本のシフトレジスタ27の内容が同図bに示した
状態になつた時、信号TMARKを発生する。但
し図において方眼の中の1は黒、0は白、空白は
どちらでもよい状態を示す。第6図aは同図bの
条件を回路記号で示したものであり、30と31
はANDゲート、32はNANDゲートである。
第7図においてフリツプフロツプ33は
TMARKでセツトされ、各印記入欄検知の最初
に現われる信号でリセツトされる。カウン
タ34はフリツプフロツプ33がセツトされてい
る間、信号の発生回数をカウントし、
NORゲート35は印記入欄の高さ32に対応し
て1列で128回発生するSCLOCKの内32回で1,
96回で0を出力する。カウンタ45はフリツプフ
ロツプ33がセツトされた後、各列の処理の最初
に発生する信号2の数を数える。この数が
5に達するとNANDゲート46の出力が0とな
り、フリツプフロツプ47がセツトされる。これ
は第3図における、タイミングマークの左端と印
記入欄の左端の差5を検知するものである。カウ
ンタ45の内容が64に達すると、各列の処理の
最初に発生する信号RST1に同期してNANDゲ
ート48が0となり、フリツプフロツプ49がセ
ツトされEND信号が発生する。これは第3図に
おけるタイミングマーク12の左端から、印記入
欄13の右端までの信号処理が終了した事を意味
する。
これらより、アンドゲート36の出力は印記入
欄の中でのみ1となる。アンドゲート36の出力
が1の時INDATAが1であると、に同
期してその数をカウントするカウンタ37は、印
記入欄の中にある黒ビツトの数を数える。この数
が8に達すると印が記入されているとみなされ、
フリツプフロツプ38がセツトされる。
カウンタ51は、END信号が発生した後の信
号2の数を数える。カウンタ51の内容が
3に達するとANDゲート53の出力が1となり
信号RST1に同期してNANDゲート42の出力
が0となり、この時フリツプフロツプ38がセツ
トされているとORゲート39の出力が0となり
メモリ41にメモリ44の内容が書き込まれ、メ
モリ41のアドレスカウンタ40に1が加えられ
る。メモリ44のアドレスカウンタ43は、フリ
ツプフロツプ38がセツトされていてもいなくて
もNANDゲート42の出力で1が加えられる。
このようにして、メモリ44にあらかじめ記憶
されていた標準パターンの内、印記入欄に印が記
入されていたものに対応する標準パターンのみが
メモリ41に移される。なお、ここでは1文字の
標準パターンがメモリ44の中で1ワードで表現
されていると仮定したが、数ワードで表現されて
いても同様にして簡単にメモリ41に移せる事は
明らかである。
カウンタ51の内容が4に達するとアンドゲー
ト52の出力はRST1に同期して1となり、
NORゲート54の出力CSTが0となる。これは
印記入欄における印の有無を検知したあと、次の
タイミングマーク検知に移るまでに4列分の画像
信号を無視する事を意味し、タイミングマーク検
知を確実に行う為の手法である。なおCSTは、
1行の処理の最初に発生する信号GSTが発生し
ても0となる。CSTが0となると、フリツプフ
ロツプ33,38,47,49がリセツトされ、
カウンタ34,37,45がクリアーされる。カ
ウンタ51はフリツプフロツプ49がリセツト状
態の時、2が発生するとNANDゲート50
の出力が0となりクリアーされる。NANDゲー
ト55はフリツプフロツプ49がリセツト状態の
間、SHIFTPから信号を作る。
第8図は第5図〜第7図で用いられる信号のタ
イムチヤートである。
以上で詳しく説明したように第5図〜第7図で
示した装置を用いる事により、あらかじめメモリ
に記憶された標準パターンの内帳票上の印で指定
された標準パターンのみを選択する事ができる。
なお第5図,第6図で示した部分は、文字読み取
り時に必要な画像入力部をそのまま用いる事がで
きるので、ここで示した本発明の標準パターン選
択装置を備える為に必要なハードエアの追加はあ
まり多くない。
次に本発明の他の実施例を第9図に示す。第9
図は印記入欄における印の有無を従来知られてい
るマーク読取装置を用いて識別する方法の一例で
ある。第9図において、帳票60は矢印61の方
向に移動される。帳票60には各行毎につけられ
たラインマーク62と各文字、記号に対応した印
記入欄63が印刷されており、選択する文字、記
号に対応した印記入欄には印がつけられている。
光源64の光はグラスフアイバー65でラインマ
ーク62と印記入欄63の位置に照射され、その
反射光がグラスフアイバー66で光電変換素子6
7の上に導かれる。光電変換素子67の出力は増
幅器68で増幅された後2値化回路69で2値化
される。さて、タイミングマーク62に対応した
2値化出力TMが黒の状態(0)になつた時、こ
の信号に同期して各印記入欄63に対応した2値
化出力をレジスタ70に記憶すれば、これらが各
印記入欄における印の有無を表わすように、タイ
ミングマークと、各印記入欄の位置とグラスフア
イバーの位置が定められているので、このように
して得られたレジスタ70の内容は、第7図にお
けるフリツプフロツプ38の出力に相当する。従
つて後は第7図の場合と同様にして印記入欄に印
が付けられた文字、記号に対応した標準パターン
のみをあらかじめ用意して記憶された標準パター
ンから選択して別のメモリに記憶する事ができ
る。
第9図で示した標準パターン選択装置を用いた
場合、文字読み取り時には別の帳票入力装置が必
要となるが、第5図〜第7図に示した方法に比べ
て高速に標準パターンの選択を行う事ができる。
なおここでは文字、記号選択法として1文字に
対応して1つの印記入欄があり、選択する場合は
その中に印をつける方法を説明したが、選択しな
い場合に印をつける方法や、複数個の文字、記号
に対応して1つの印記入欄を設ける方法も同様に
して実現可能な事は明らかである。又、印記入欄
の位置はタイミングマークやラインマークがなく
ても帳票の端からの位置で知る事もできる。
以上で詳しく説明したように、本発明による標
準パターン選択装置を用いれば、文字、記号読み
取り装置内で入力文字との一致を調べる標準パタ
ーンを、あらかじめ用意して記憶された標準パタ
ーンの中から、用途に応じて1文字ずつ自由に選
択して、その中だけに限る事ができるので文字、
記号の読み取り速度と認識精度を大幅に上げる事
ができる。また、類似した文字、記号の内片方の
みしか使用しない場合は、片方のみを選択する事
により、文字、記号に何ら制限をつける事なく、
認識精度を大幅に向上させる事ができる。
【図面の簡単な説明】
第1図は従来知られている文字読取装置の一例
のブロツク図、第2図は本発明による標準パター
ン選択装置で用いる帳票の一例を示す図、第3図
は第2図のタイミングマークと印記入欄の拡大
図、第4図は本発明の一実施例のブロツク図、第
5図〜第7図は第4図の各ブロツクの具体的な例
を示すブロツク図、第8図は第5図〜第7図で用
いた信号のタイムチヤート、第9図は本発明の他
の実施例を示すブロツク図である。 図において、1……帳票、2……レンズ、3…
…光電変換素子、4……2値化回路、5……画像
信号の記憶装置、6……文字切り出し装置、7…
…標準パターンの記憶装置、8……類似度計算回
路、9……類似度比較回路、10……外部記憶装
置、11……帳票の移動方向、12……タイミン
グマーク、13……印記入欄、20……帳票、2
1……帳票の移動方向、22……光源、23……
レンズ、24……一次元光電変換素子、25……
増幅器、26……2値化回路、27……シフトレ
ジスタ、28,29……信号、30,31……
ANDゲート、32……NANDゲート、33,3
8,47,49……フリツプフロツプ、34,3
7,40,43,45,51……カウンタ、3
5,54……NORゲート、36,52,53…
…ANDゲート、39……ORゲート、41,44
……メモリ、42,46,48,50,55……
NANDゲート、60……帳票、61……帳票の
移動方向、62……ラインマーク、63……印記
入欄、64……光源、65,66……グラスフア
イバー、67……光電変換素子、68……増幅
器、69……2値化回路、70……レジスタ、8
0……画像入力装置、81……画像信号記憶装
置、82……タイミングマーク検知装置、83…
…印記入欄切り出し装置、84……黒ビツト数カ
ウント装置、85……標準パターン編集装置、で
ある。

Claims (1)

    【特許請求の範囲】
  1. 1 あらかじめ内部に記憶された複数の標準パタ
    ーンの位置と、帳票上のあらかじめ定められた複
    数の印記入欄の位置とがそれぞれ対応して形成さ
    れた帳票の前記印記入欄に選択的につけられた印
    の有無とその位置を検知する手段と、検知された
    印の有無に従いあらかじめ内部に記憶された標準
    パターンより印記入欄の位置に対応したものを選
    択する手段を有し、前記選択手段により選択され
    たパターンを標準パターンとすることを特徴とす
    る標準パターン選択装置。
JP57039007A 1982-03-12 1982-03-12 標準パタ−ン選択装置 Granted JPS58155484A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57039007A JPS58155484A (ja) 1982-03-12 1982-03-12 標準パタ−ン選択装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57039007A JPS58155484A (ja) 1982-03-12 1982-03-12 標準パタ−ン選択装置

Publications (2)

Publication Number Publication Date
JPS58155484A JPS58155484A (ja) 1983-09-16
JPH0432433B2 true JPH0432433B2 (ja) 1992-05-29

Family

ID=12541044

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57039007A Granted JPS58155484A (ja) 1982-03-12 1982-03-12 標準パタ−ン選択装置

Country Status (1)

Country Link
JP (1) JPS58155484A (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0466666U (ja) * 1990-10-12 1992-06-12
JPH0467760U (ja) * 1990-10-24 1992-06-16

Also Published As

Publication number Publication date
JPS58155484A (ja) 1983-09-16

Similar Documents

Publication Publication Date Title
US4319331A (en) Curve follower
US3050711A (en) Automatic character analyzer
JPS59161786A (ja) 手書き文字の認識方法
US3611291A (en) Character recognition system for reading a document edited with handwritten symbols
EP0524797B1 (en) Image processing method and apparatus
US4132976A (en) Operator readable and machine readable character recognition systems
US3559170A (en) Methods and apparatus for data input to a computer
JPS62254282A (ja) 重畳するパタ−ンを分離する方法及び装置
EP3477547B1 (en) Optical character recognition systems and methods
JPH0432433B2 (ja)
CN111611986B (zh) 一种基于手指交互的焦点文本提取和识别方法及系统
US5984189A (en) Sheet for data codes and method of recognizing these codes
JPS6316795B2 (ja)
US3247485A (en) Character recognition system
JPS58149574A (ja) 標準パタ−ン登録装置
JPS6054082A (ja) 光学文字読取装置
JPS58155485A (ja) 標準パタ−ン登録装置
US3752964A (en) Apparatus for performing division and base conversion
JPH039505B2 (ja)
JPS62134767A (ja) 記号名・線分名の自動抽出装置
JPH04309B2 (ja)
JP2953162B2 (ja) 文字認識装置
JPS6020786B2 (ja) 文字読取装置
JPH0420506B2 (ja)
JPS6129976A (ja) 文字認識方法