JPS58155485A - 標準パタ−ン登録装置 - Google Patents

標準パタ−ン登録装置

Info

Publication number
JPS58155485A
JPS58155485A JP57039008A JP3900882A JPS58155485A JP S58155485 A JPS58155485 A JP S58155485A JP 57039008 A JP57039008 A JP 57039008A JP 3900882 A JP3900882 A JP 3900882A JP S58155485 A JPS58155485 A JP S58155485A
Authority
JP
Japan
Prior art keywords
signal
character
standard pattern
stored
storage device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP57039008A
Other languages
English (en)
Inventor
Nobuhiko Mori
森 宣彦
Hiroshi Asai
淺井 紘
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp, Nippon Electric Co Ltd filed Critical NEC Corp
Priority to JP57039008A priority Critical patent/JPS58155485A/ja
Publication of JPS58155485A publication Critical patent/JPS58155485A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 本発明は標準パターン登録装置、さらに詳しくは、認識
すべき文字・記号1認識する時に用いる標準パターンを
使用者が自由に登録する事ができる標準パターン登録装
置に関するものである。
1i1図は従来知られている文字認識装置の一例を示し
たもので、図において帳票lの上に書かれた文字の画像
は、レンズ2によシ光電交換素子3の上に結ばれる。光
電変換素子3としては、−次元の半導体イメージセンサ
音便う事が多いが、この場合は、帳Nil矢印11で示
した方向に動かし、帳票のIliIigIIヲ光電変換
素子3の上で移動させて1画像の各行に対応した電気信
号を光電変換素子3から順次画像信号として得るように
しである。
この1thif#!信号は2値化回路4で2値化された
後記憶装置t5に記憶される1文字切り出し装置6は、
記憶装置5に記憶された1llii儂信号から1文字分
の画像信号を順次切9出し、類似度計算回路8へ送る。
#A似度計算回路′―では、この1文字分の画像信号と
、記憶装置7に記憶された複数の標準パターンとの類似
度を順次計算し、その計算結果を類似度比較回路9へ送
る。St似震度比較回路9は。
これらの計算結果を比較して最大の類似度を求め、その
最大の類似度を与えた標準パターンに対応したカテゴリ
ーを磁気テープ等の外部記憶装置1゜へ認識結果として
出力する。
さて、ここで説明した記憶装置7に記憶される標準パタ
ーンは、従来、数字用、英字用、カナ文字用といったよ
うKあらかじめ決められた種類の文字毎に作られて、文
字ia!識装置の中に組み込まれており、使用者側でそ
の中にない記号等を追加して読ませる事は不可能であっ
た。これは第1図で示した構成と異なる構成を持つ文字
認識装置においても同様である。文字読取装置の読取対
象文字数が少なく、数字、英字、カナ文字位までしか読
めない場合は、これでもあまり問題はなかったが、読取
対象文字数が多くなり、漢字とカナ文字が混在する和文
まで読むようになると、このような方法では大きな問題
が生じてくる。っまシ1通常用いる漢字は常用漢字とし
て定められている1945字の中にtlぼ入っているが
、固有名詞の中で用いらnる漢字にはこの中に入ってい
ないものが多く、常用漢字とカナ文字のみしか読まない
文字認識装置では、その使途が大幅に制限されてしまう
のである。だからといって、数万字の漢字すべてを読む
文字認識装置を作ると、装置の規模が大きく高価になり
、かつ2文字を認識する速度が遅く認識精度が悪くなる
。しかし、一般に1文字1I111織装置で読ませる和
文の種類管限れば、その中で使われる常用漢字以外の漢
字の数はあt、b多くないとhう事が知られている。
本発明の目的は、上記の問題を解決するために1文字認
識装置の内部にあらかじめ用意して記憶されている標準
パターンに他の文字の標準パターンを簡単に追加する事
ができる標準パターン登録装置を備えた文字riim装
置を提供する事にあゐ、また、本発明の他の目的は特殊
な記号や文字や略字の標準パターンを簡単に登録する事
ができる標準パターン登録装置を備えた文字−繊装置を
提供し、文字IIa!識装置の読取対象文字における柔
軟性を大幅に向上させる事にある。
本発明によれば、帳票の画1象を光学的に得る手段と、
該画像を電気信号に変換し画像信号とする手段と、該画
像信号よシ文字・記号の信号と該文字・記号に対応した
符号の信号を切り出す手段と、前記文字中記号の信号を
その11.もしくけ、前記文字・記号の信号より特徴を
抽出し標準パターンとして記憶する手段と、前記文字・
記号に対応した符号の信号よシ符号を識別しその識別結
果を前記標準パターンに対応して記憶する手段を有する
ことt−特徴とする標準パターン登録装置が得られる。
以下5本発明の詳細を図面を参照して説明する。
第2図は標準パターンを登録する為忙用いる帳票の一例
を示す図である1図中12はタイミングマーク、13け
文字枠であり、あらかじめ印刷されている。1行にある
文字枠の内、左端の文字枠には標準パターンとして登録
したい文字・記号の形が、他の文字枠には、その文字・
記号に与える符号が数字等で書き込まれる。第3図Fi
第2図におけるタイミングマーク12と文字枠131に
拡大したものであシ、第7図の理解を助けるためにUS
図における実施例に従い、これらを電気信号に変換し九
場合の出力INDATAにおける文字枠の大きさと。
文字枠とタイミングマークの間の間隔も合せて記しであ
るが、これらの値は一例として示したものにすぎない。
$4図は本発明による標準パターン登録装置の一実施例
をブロック図で示したものである1図において80は一
儂入力装置であり、帳票の画像を電気信号に変換し、2
値に量子化する。81は画像信号記憶装置で1画儂入カ
装置8oで得られた1儂の信号を記憶する。82F!タ
イ7ングマーク検知装置であり、画像信号記憶装置81
に記憶した画像信号よりタイミングマークの′位置を検
知する。83Vi文字枠切シ出し装置で、タイミングマ
ーク検知装置82で得られたタイミングマークの位置よ
り、文字枠の位置を計算し、その位置における1IIi
像信号を80よシMRシ込む、84は標準パターン記憶
装置で、左端の文字枠内の信号をそのまま、または、そ
の信号よ〕特徴を抽出し、標準パターンとして記憶する
0文字枠内の信号をその11標準パターンとして用いる
のは、印字文字。
制限手書文字の場合で、常用手書文字、自由手書文字の
場合は特徴を抽出して標準パターンとするのが一般的で
ある。85蝉符号信号記憶装置で。
左端以外の文字枠内の信号を記憶すゐ、86は符号識別
装置で、符号信号記憶装置85に記憶された文字枠内の
符号信号よシ符号を識別する。符号が数字で書かれてい
る場合は、数字g識装置となる。87は符号記憶装置で
、符号識別装置86の識別結果を標準パターン記憶装置
84に記憶した標準パターンに対応した位置に記憶する
第5図〜I!!8図は、第4図を一例を用いてさらに詳
しく説明したものであシ、第4図の各ブロックに対応す
る部分を点線で示しである。
@5図において帳票20は112図に示したものと同じ
であシ、矢印21の方向に移動する。光源22は帳票2
0t−照射し、レンズ23は帳JI1200画儂を一次
元光電変換素子24の上に結ぶ、ここでは−次元光電変
換索子24として、128ビツトの半導体イメージセン
サを用いるものとする。
−次元光電変換素子24の出力は増幅器25で増幅され
%2値化回路26で2値化される。128ビツトのシフ
トレジスタ27Fi2本直列につながれておシー信号2
f3 (8HIFTP)で2値化回路26の出力IND
ATAを順次シフトして配憶する。り7トレジスタ27
の内容は、信号29 (G8T)でクリアーされる。
第6因はタインンタマーク検知信号(TMARK)の発
生条件を示したものであり、2本のシフトレジスタ27
の内容が同図(b)K示した状M(Kなった時、信号T
MARK Yr発生する。但し図において方眼の中の1
は黒、0は白、空白はどちらでもよい状態を示す、第6
図(農)は同図(b)の条件を回路記号で示したもので
あり、30と31はANDゲート。
32FiNANDゲートである。
第7図においてフリップフロップ33はTMARKでセ
ットされ、各文字枠検知の最初に現われる信号C8Tで
リセットされる。カウンタ34はフリップフロップ33
がセットされている間、信号8CLαXの発生回数tカ
ウントし、インバータ56は文字枠の高さ64に対応し
て、1列で128回発生する5CLOCKO内信号’1
’MARKが発生した位置から上側64回で1.他の6
4回で0を出力する。カウンタ46Fiフリツプフロツ
プ33がセットされた後の、各列の処理の最初に発生す
る信号R8T2の数を数える。この数が5に達するとN
ANDゲート48の出力がOとなり、プリップフロップ
50がセットされる。これは第3図におけるタイミング
マークの左肩と文字枠の左端の差5を検知するものであ
る。カウンタ46の内容が48に達すると、各列の処理
の最初に発生する信号R8Tlに同期して、NANDゲ
ート47の出力が0となり17リツプフロツグ49がセ
ットされ、END信号が発生する。これは、第3図にお
ける、タイミングマーク12の左端から文字枠13の右
端までの信号処理が終了した事を意味する。
これらよりアンドゲート35の出力は、文字枠の中での
み1となる。アンドゲート35の出力が1の時、画像信
号INDATAはメモリ42かメモリ43に書き込まれ
る。つまり、1行の処理の最初で発生する信号GETが
発生すると、フリップフロップ37がセットされるので
、ANDゲート35が1ならば8CLOCKはアンドゲ
ート36を通シ、NANDゲー)38f通ってメモリ4
2の書き込み信号となる。しかし一度END信号が発生
すると、フリップ70ツブ37がリセットされるので、
8CLOCKはアンドゲート36を通っ、た後、NAN
Dゲー)39を通シメモリ43の書き込み信号となる。
これらより、1行の左端の文字枠に書かれた文字・記号
の信号はメモl742に書かれ、その他の文字枠に書か
れた文字・記号に与える符号の信号はメモリ43に書か
れる。ここでは文字枠内のl11i儂信号をそのまま標
準パターンとしてメモリ42に書き込む場合について述
べる。カウンタ40と41はそれぞれメモリ42.43
のアドレスカウンタであり、メモリに信号が書き込まれ
ると1その書き込み信号の後端でカウントアツプされる
メモ1743に書き込まれた符号の信号は、数字認識装
置44に1文字分ずつ取シ出され認識されて、その認識
結果がメモ!745に書き込まれる。
カウンタ51はEND信号が発生した後の信号R8T2
の数を数える。カウンタ51の内容が4に達すると信号
R8Tlに同期して、各文字枠検知の最初に発生する信
号CAT 1r発生する。このカウンタ51の内容4#
:を各文字枠内の信号をメモリに配憶したあと、次の文
字枠のタイミングマーク検知に移る壕でに4列分の1儂
信号を無視する事を意味し、タイミングマーク検知を確
実に行う為の手法である。NORゲート55忙よ多信号
CATは信号G8Tが発生した時にも発生する。信号C
8Tが発生すると7リツプフロツプ33.49.50が
リセットされ、カウンタ34,46がクリアーされる。
カウンタ51Fiアリツグフロツプ49がリセット状態
の時%NANDゲート52を通して信号R8T2でクリ
アーされる。NANDゲート53i1t7リツグ70ツ
ブ49がリセット状態の時、信号5HIFTPから信号
8CLOCKを作る。
第8図は第5図〜第8図図で用いられる信号のタイムチ
ャートである。
このようKしてメモリ42に新たに標準パターンとして
登録する文字・記号の形の信号が、メモ記憶されるので
、これらをあらかじめ文字gR装置内に配憶されている
標準パターン忙追加して。
与えられた文字の認識に用いる事が可能である。
なおメモリ42の内容はそのtt用いるのではなく、そ
こから特徴抽出を行った俵用いる方法もある。
@9図は本発明による標準パターン登録装置で用いる帳
票の他の例を示したものである。左端の文字枠に標準パ
ターンとして登録する文字・記号の形を書き込むのけ第
2図の場合と同じであるが、その文字・記号に与える符
号は右側の印記入欄に印を記入する事により指定する。
このような印の有無の検知は帳票の1儂信号をメモリに
記憶した後、各印紀入欄の位置にある黒ビットの数を数
える事により容易に実行する事ができる。
また、符号をバーコードで指定する事も可能である。こ
のように符号を印又はバーコードで指定した方が、数字
で書き込むよシ符号のam−is夷に行う事ができるが
、帳票の大きさが大きくなるといった欠点がある。
なおここでは、文字枠の位置を知るためにタイミングマ
ークを用いる方法を説明したが、タイミングマークがな
くても帳票の端からの位置で文字枠の位置を知る事は可
能である。またここでは標準パターン登録装置で登録さ
れた標準パターンをあらかじめ用意されている標準パタ
ーンに追加して文字iI繊を行う方法について述べたが
、標準パターン登録装置で登録された標準パターンのみ
を用いて文字認mを行う事も可能な事は明らかである。
以上で詳しく説明したように%本発明による標準パター
ン登録装置を用いると、文字gII&装置にあらかじめ
用意されていない文字・記号の標準パターンを容易に追
加して登録する事ができるので、文字認識装置の読取対
象文字における柔軟性を大幅に向上させる事ができると
共に、和文feeむ文字認識装置においては、特殊な漢
字の標準パターンをその都度登録する事によυ、内部に
記憶する漢字の標準パターンの数を大幅に減らし、文字
認識速度と文字認識精度を大幅に向上させることができ
る。
【図面の簡単な説明】
第1図は従来知られている文字iil識装置の一例のブ
ロック図、第2図は本発明による標準パターン登録装置
で用いる帳票の一例を示す図、第3図は第2図のタイミ
ングマークと文字枠の拡大図、第4図は本発明の一実施
例のブロック図、@5図〜第7図は′@4図の各ブロッ
クの具体的な一例のブロック図、sg図は第5図〜第8
図で用いた信号のタイムチャート、第9図は本発明によ
る標準パターン登録装置で用いる帳票の他の例を示す図
である。 図において% l・・・・・・帳票、2・・・・・・レ
ンズ、3・・・・・・光電変換素子、4・・・・・・2
値化回路、5・・・・・・1儂信号の記憶装置、6・・
・・・・文字切シ出し装置、7・・・・・・標準パター
ンの記憶装置、8・・・・・・類似度計算回路、9・・
・・・・類似度比較回路slO・・・・・・外部記憶装
置t、11・・・・・・帳票の移動方向、12・・・・
・・タインングマーク、13・・・・・・文字枠b20
・旧・・帳票、21・・・・・・帳票の移動方向、22
・・・・・・光源、23・・・・・・レンズ、24・・
・・・・−次元光電変換素子、25・・・・・・増幅a
、26・・・・・・2値化回路、27・・・・・・シフ
トレジスタ%28.29・・・・・・Kf1号s 30
 、31・・・・・・ANDゲート、32・・・・・・
NANDゲート、33.37,49゜50・・・・・・
フリップフロップ、34*40,41.46.5t・・
・・・・カウンタ、35,36.54・旧・・ANDゲ
ー)、38゜39.47.48,52.53・・・・・
・NANDゲー)、42,43゜45・・・・・・メモ
リ、44・・・・・・数字認識装置% 55・・・・°
NORゲート、56・・・・・・インバーター、80・
・曲画儂入力装置、81・・・・・・1儂信号記憶装置
、82・・・・・・タインングマーク検知装置、83・
・・・・・文字枠切シ出し装置%84・・・・・・標準
パターン配憶装置、85・・・・・・符号信号記憶装置
、86・旧・・符号識別装置、87・・・・・・符号記
憶装置、である。

Claims (1)

    【特許請求の範囲】
  1. 帳票の画像を光学的に得る手段と、該画像を電気信号に
    変換し画像信号とする手段と、咳画儂信号よシ文字・記
    号の信号と該文字・記号に対応した符号の信号を切り出
    す手段と、前記文字・記号の信号をそのtま、もしくは
    、前記文字・記号の信号より特徴を抽出し標準パターン
    として記憶する手段と、前記文字・記号に対応した符号
    の信号よシ符号を識別しその識別結果を前記標準パター
    ンに対応して記憶する手段を有する事を特徴とする標準
    パターン登録装置。
JP57039008A 1982-03-12 1982-03-12 標準パタ−ン登録装置 Pending JPS58155485A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57039008A JPS58155485A (ja) 1982-03-12 1982-03-12 標準パタ−ン登録装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57039008A JPS58155485A (ja) 1982-03-12 1982-03-12 標準パタ−ン登録装置

Publications (1)

Publication Number Publication Date
JPS58155485A true JPS58155485A (ja) 1983-09-16

Family

ID=12541073

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57039008A Pending JPS58155485A (ja) 1982-03-12 1982-03-12 標準パタ−ン登録装置

Country Status (1)

Country Link
JP (1) JPS58155485A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60207952A (ja) * 1984-03-31 1985-10-19 Toshiba Corp 外字登録方式
JPS62105292A (ja) * 1985-10-31 1987-05-15 Toshiba Corp 光学的文字認識装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60207952A (ja) * 1984-03-31 1985-10-19 Toshiba Corp 外字登録方式
JPS62105292A (ja) * 1985-10-31 1987-05-15 Toshiba Corp 光学的文字認識装置

Similar Documents

Publication Publication Date Title
US4910787A (en) Discriminator between handwritten and machine-printed characters
JP2575539B2 (ja) 書類上の金額フィールドの位置特定方法および識別方法
US3140466A (en) Character recognition system
US3780270A (en) Bar/half-bar optical code reader
SE7502837L (sv) Sett och anordning for automatisk fotoelektrisk avlesning av tecken och monster
US2964734A (en) Method and apparatus for sensing handwriten or printed characters
WO2022148396A1 (zh) 芯片采集方法和芯片定位方法
US3559170A (en) Methods and apparatus for data input to a computer
Chidiac et al. A robust algorithm for text extraction from images
EP0144006B1 (en) An improved method of character recognitionand apparatus therefor
JPS58155485A (ja) 標準パタ−ン登録装置
EP3477547B1 (en) Optical character recognition systems and methods
Harmon A line-drawing pattern recognizer
GB982695A (en) Automatic written or printed character-recognition method
JPS56149676A (en) Pattern recognizer
Ting et al. Form recognition using linear structure
JPS58155484A (ja) 標準パタ−ン選択装置
JPS6316795B2 (ja)
US3247485A (en) Character recognition system
US3229252A (en) Character recognition
JPS6054082A (ja) 光学文字読取装置
US3772648A (en) Electro-optical character reader
JPS58149574A (ja) 標準パタ−ン登録装置
Ting et al. A syntactic business form classifier
JPH01201789A (ja) 文字読取装置