JPS58149574A - 標準パタ−ン登録装置 - Google Patents

標準パタ−ン登録装置

Info

Publication number
JPS58149574A
JPS58149574A JP57032760A JP3276082A JPS58149574A JP S58149574 A JPS58149574 A JP S58149574A JP 57032760 A JP57032760 A JP 57032760A JP 3276082 A JP3276082 A JP 3276082A JP S58149574 A JPS58149574 A JP S58149574A
Authority
JP
Japan
Prior art keywords
signal
character
character frame
standard pattern
picture
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP57032760A
Other languages
English (en)
Inventor
Nobuhiko Mori
森 宣彦
Yukio Hoshino
幸夫 星野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp, Nippon Electric Co Ltd filed Critical NEC Corp
Priority to JP57032760A priority Critical patent/JPS58149574A/ja
Publication of JPS58149574A publication Critical patent/JPS58149574A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/10Image acquisition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 本発明は標準パターン登録装置、さらに詳しくは、認識
すべき文字・記号tl−認識する時に用いる標準パター
ンを使用者が自由に登録する事ができる標準パターン登
録装置に関するものである。
第1図は従来知られている文字認識装置の一例を示した
もので、図において帳票1の上に書かれた文字の画像は
、レンズ2によ如光電変換素子3の上に結ばれる。光電
変換素子3としては、−次元の半導体イメージ・センサ
を使う事が多いが、この場合は、帳票1を矢印11で示
した方向に動かし帳票の画像を光電変換素子3の上で移
動させて、画像の各行に対応した電気信号を光電変換素
子3から順次画像信号として得るようにしである。
この画像信号は2値化回路4で2値化された後記憶装置
5に記憶される。文字切り田し装置6は、記憶装置5に
記憶された画像信号から1文字分の画像信号を順次切り
出し、類似度計算回路8へ送る。類似度計算回路8では
、この1文字分の画像信号と、記憶装置7に記憶された
複数の標準パターンとの類似度を順次計算し、その計算
結果を類似度比較回路9へ送る。類似度比較回路9では
、これらの計算結果を比較して最大の類似度を求め1そ
の最大の類似度を与えた標準パターンに対応したカテゴ
IJ  i磁気テープ等の外部記憶装置1゜へ認識結果
として出力する。
さて、ここで説明した、記憶装置7に記憶される標準パ
ターンは、従来、数字用、英字用、カナ文字用といった
ように、あらかじめ決められた種類の文字毎に作られて
、文字認識装置の中に組み込まれており、使用者側でそ
の中にない記号等全追加して読ませる事は不可能であっ
た。これは第1図で示した構成と異なる構成を持つ文字
認識装置においても同様である。文字読取装置の読取対
象文字数が少く、数字、英字、カナ文字位までしか読め
ない場合は、これでもあまり問題はなかったが、読取対
象文字数が多くなり、漢字とカナ文字が混在する和文ま
で読むようになると、このような方法では大きな問題が
生じてくる。つまり通常用いる漢字は常用漢字として定
められている1945字の中にほぼ入っているが、固有
名詞の中で用いられる漢字には、この中に入っていない
ものが多く、常用漢字とカナ文字のみしか読まない文字
認識装置では、その使途が大幅に制限されてしまうので
ある。だからといって、数万字の漢字すべてを読む文字
認識装置を作ると、装置の規模が大きく、高価になり、
かつ、文字を認識する速度が遅く、認識精度が悪くなる
。しかし、一般に、文字認識装置で読ませる和文の種類
を限れば、その中で使われる常用漢字以外の漢字の数は
あまり多くないという事が知られている。
本発明の目的は、上記の問題を解決するために、文字認
識装置の内部にあらかじめ用意して記憶されている標準
パターンに他の文字の標準パターンを簡単に追加する事
ができる標準パターン登録装置を備えた文字認識装置を
提供する事にある。また、本発明の他の目的は、特殊な
記号や文字や略字の標準パターン全簡単に登録する事が
できる標準パターン登録装置を備えた文字認識装置を提
供し、文字認識装置の読取対象文字における柔軟性を大
幅に向上させる事にある。また、本発明のさらに他の目
的は、人それぞれにくせのある文字を標準パターンとし
て登録する事により、その人の書いた文字の認識率を大
幅に向上させる事にある。
本発明によれば、帳票の画像を光学的に得る手段と、該
画像を電気信号に変換し画像信号とする手段と、該画像
信号より文字・記号の書かれている位置を検知する手段
と、該文字・記号の書かれている位置における文字・記
号の信号を1文字分ずつ取り出しその信号音そのままも
しくはその信号より特徴を抽出し標準パターンとして記
憶する手段と、前記検知した文字・記号の書かれている
位置よりその文字・記号に与える符号を決定し前記標準
パターンに対応して記憶する手段を有することを特徴と
する標準パターン登録装置が得られる。
以下、本発明の詳細を、図面を参照して説明する。第2
図は標準パターンを登録する為に用いる帳票の一例を示
す図である。図中12はタイミング・マーク、13は文
字枠であり、文字枠の上の漢字と共にあらかじめ印刷さ
れている。これらの漢字の中に文字認識装置で認識させ
たい漢字があ 5− ると、その下の文字枠の中に、標準パターンとして登録
する漢字の字形を記入する。第3図は第2図における、
タイミング・マーク12と文字枠13を拡大したもので
あり、第7図の理解を助けるために第5図における実施
例に従い、これらを電気信号に変換した場合の出力IN
DATA における、文字枠の大きさと、文字枠とタイ
ミング・マークの間の間隔も合せて記しであるが、これ
らの値は一例として示したものにすぎない。
第4図は本発明による標準パターン登録装置の一実施例
をブロック図で示したものである。図において、80は
画像入力装置であり、帳票の画像を電気信号に変換し、
2値に量子化する。81は画像信号記憶装置で、画像入
力装置80で得られた画像の信号を記憶する。82はタ
イミング・マーク検知装置であり、画像信号記憶装置8
1に記憶した画像信号より、タイミング・マークの位置
を検知する。83は文字枠切り出し装置で、タイミング
・マーク検知装置82で得られたタイミング・マークの
位置より文字枠の位置を計算し、そ6− の位置における画像信号を画像入力装置80より取り込
む。84は記入文字枠検知装置で、文字枠切り出し装置
83で切り出した画像信号の中の黒である点の数を数え
、その数が一定値以上ならば、文字枠の中に文字・記号
が書かれていると判断し、他の場合は、空白の文字枠で
あると判断する。85は標準パターン記憶装置で、文字
枠が空白でない場合、文字枠内の信号をそのまま、また
は、その信号よV%徴を油田し、標準パターンとして記
憶する。文字枠内の信号をそのまま標準パターンとして
用いるのは印字文字、制限手書文字の場合で、常用手書
文字、自由手書文字の場合は特徴全抽出して標準パター
ンとするのが一般的である。86は符号記憶装置で、文
字枠内に文字・記号が書かれており、標準パターン記憶
装置85にその標準パターンが記憶された時、その標準
パターンに対応した符号全文字枠の位置から決定し、記
憶する。
第5図〜第8図は、第4図を一例を用いてさらに詳しく
説明したものであυ、第4図の各ブロックに対応する部
分を点線で示しである。
第5図において帳票20は第2図に示したものと同じで
あり、矢印21の方向に移動する。光源22は帳票20
を照射し、レンズ23は帳票20の画像を一次元光電変
換累子24の上に結ぶ。ここでは−次元光電変換素子2
4として、128ビツトの牛導体イメージ・センサを用
いるものとする。−次元光電変換素子24の出力は増幅
器25で増幅され、2値化回路26で2値化される。
128ビツトのシフト−レジスタ27は2本直列につな
がれており、信号28 (SHIFTP)  で2値化
回路26の出力、INDATA  t−順次シフトして
記憶する。シフト・レジスタ27の内容は、信号29(
GST)でクリアーされる。
第6図は、タイミング働マーク検知信号(TMARK)
の発生条件會示したものであり、2本のシフト・レジス
タ27の内容が同図(blに示した状態になった時、信
号TMARKt−発生する。但し図において方眼の中の
1は黒、0は白、空白はどちらでもよい状態を示す。第
6図(a)は同図(blの条件を回路記号で示したもの
であり、30と31はAND・ゲート、32はNAND
・ゲートである。
第7図において、フリップ・70ツブ33はTMARK
でセットされ、各文字枠検知の最初に現われる信号C8
Tでリセットされる。カウンタ34はフリップ・フロッ
プ33がセットされている間、信号S CLOCK の
発生回数をカウントし、インバータ56は文字枠の高さ
64に対応して、1列で128回発生する5CLOCK
O内信号TMARKが発生した位置から上側64回で1
.他の64回でθを出力する。カウンタ46はフリップ
噛フロップ33がセットされた後の、各列の処理の最初
に発生する信号R8T2の数を数える。この数が5に達
するとNANDゲート48の出力が0となり、フリップ
・フロップ50がセットされる。
これは第3図における、タイミング・マークの左端と文
字枠の左端の差5を検知するものである。
カウンタ46の内容が68に達すると、各列の処理の最
初に発生する信号R8T1に同期して、NANDゲート
47の出力が0となり、フリップ・フロップ49がセッ
トされ、END信号が発生ず9− る。これは、第3図におけるタイミング・マーク12の
左端から、文字枠13の右端までの信号処理が終了した
事を意味する。
これらより、アン)%ゲート35の出力は、文字枠の中
でのみ1となる。アンド・ゲート35の出力が1の時、
NANDゲート36は信号5CLOCK全通し、カウン
タ37は画像信号INDATAが1である回数をカウン
トし、メモリ45はINDATAの内容を記憶する。つ
まりカウンタ37には文字枠内の黒ビットの数がカウン
トされ、メモリ45には文字枠内の画像信号が記憶され
る。ここでは文字枠内の画像信号をそのまま標準パター
ンとしてメモリ45に書き込む場合について述べる。メ
モリ45のアドレスφカウンタ60は、アンド・ゲート
59全通しメモリ45の書き込みパルスの後端でカウン
ト・アップされる。カウンタ37の内容が16に達する
と、文字枠内に文字が記入されているとみなされ、フリ
ップ・フロップ38がセットされる。
カウンタ51は、END信号が発生した後の侶10− 号R8T2の数を数える。カウンタ51の内容が3に達
すると、NANDゲート52の出力が0となり、NAN
Dゲート54は信号R8Tlを通す。
この時フリップ・フロップ38がリセット状態であると
、信号R8TlはきらにORゲート39とANDゲート
59を通り、カウンタ6oの書き込ミパルスとなり、カ
ウンタ60にレジスタ61の内容を書き込む。カウンタ
60はNANDゲート52の出力が0になると書き込み
状態になる。レジスタ61には文字枠検知の最初に発生
する信号C8Tにより、カウンタ60の内容が書き込ま
れているので、カウンタ60にレジスタ61の内容が書
き込まれるとカウンタ60の内容が、この文字枠の処理
を実行する前の状態に戻った事になり、従って、次にメ
モリ45に書く次の文字枠内の信号情報は、令書いた信
号情報を壊し、その上に再び書かれる事になる。
フリップ・フロップ38がセット状態の時は、カウンタ
60の書き込みパルスが発生しないので、メモリ45に
書かれた今の文字枠内の信号情報は壊されず保存される
。また、フリップ・フロップ38がセット状態の時は、
信号R8TlはNANDゲート54.ORゲート40を
通りメモリ43の書き込みパルスとなり、メモリ43に
メモリ44の内容を書き込む。メモリ44には、各文字
枠に対応して、そこに書かれている文字・記号に与える
符号が記憶されており、メモリ44のアドレス・カウン
タ42は、フリップ・フロップ38がセットされている
といないとにかかわらず、各文字枠の処理が終了する毎
にNANDゲート54全通し、信号R8Tl0後端でカ
ウント中アップされるので、メモリ43にはメモリ45
に記憶された文字・記号の信号に対応した符号が記憶さ
れる事になる。
メモリ43のアドレス・カウンタ41は、メモリ43の
書き込みパルスの後端でカウント・アップされる。
次にカウンタ51の内容が4に達すると、アンドゲート
53とNORゲート55を通り、信号R8Tlは、各文
字枠検知の最初に発生する信号C8Tとなる。信号C8
TはNORゲート55により1行の処理の最初に発生す
る信号GSTが発生した時にも発生する。カウンタ51
により信号ENDが発生してから信号C8Tが発生する
まで、4列分の画像信号を無視しているのは、文字枠か
ら右にはみ出して書かれた文字線を、タイミング・マー
クと誤って検知する事がないようにする為である。
信号C8Tが発生すると、フリップ優フロップ33.3
8,49.50がリセツトされ、カウンタ34゜37.
46がクリアーされ、レジスタ61にカウンタ60の内
容が書き込まれる。カウンタ51は、フリップ・フロッ
プ49がリセット状態の時、NANDゲート57全通し
て信号R8T2でクリアーされる。NANDゲート58
は、フリップ・フロップ49がリセット状態の時、信号
5HIFTPから信号5CLOCK′Jk作る。
第8図は第5図〜第7図で用いられる信号のタイム拳チ
ャートである。
このように、第5図〜g7図で示した一実施例による標
準パターン登録装置を用いると、メモリ13− 45には標準パターンとして用いる文字・記号の画像信
号が、メモリ43にはそれらの標準パターンと一致した
時に与えるべき符号が記憶されるので、これらをあらか
じめ文字認識装置内に記憶されている標準パターンに追
加して、与えられた文字の認識に用いる事が可能である
。なおメモリ45に記憶された文字・記号の画像信号は
、そのまま用いるのではなく、そこから特徴抽出を行っ
た抜用いる方法もある。
第9図は、本発明による標準パターン登録装置で用いる
帳票の他の例を示したものである。文字枠の上に符号を
あらかじめ印刷しておき、その符号を帳票上で並んでい
る順番にメモリに記憶しておくと、文字枠の中に書かれ
た文字・記号の画像信号全標準パターンとして登録した
時、対応する符号として文字枠の上に書かれた符号を与
える事が可能である。特殊な記号等の標準パターンは、
このような帳票を用いて登録する事ができる。なお、文
字枠の位置と符号との対応がついていれば、文字枠の上
に符号を印刷する事は必ずしも必要で14− はない。
なお、ここでは、文字枠の位置を知るために、タイミン
グ・マークを用いる方法を説明したが、タイミングeマ
ークがなくても、帳票の端からの位置で、文字枠の位置
全知る事は可能である。
以上で詳しく説明したように、本発明による標準パター
ン登録装置を用いると、文字認識装置にあらかじめ用意
されていない文字轡記号の標準パターンを容易に追加し
て登録する事ができるので、文字認識装置の読取対象文
字における柔軟性を大幅に向上させる事ができると共に
、和文を読む文字認識装置においては、特殊な漢字の標
準パターンをその都度登録する事により、内部に記憶す
る漢字の標準パターンの数を大幅に減らし、文字認識速
度と文字認識精度を大幅に向上させる事ができる。また
、標準パターンとして、内部にあらかじめ用意して記憶
されているものを用いず、本発明による標準パターン登
録装置で日常自分が使用している通りの字形を登録して
用いると、あらかじめ示された字形に従って文字を書く
必要がなく、日常自分が使用している通りの字形の文字
を用いて書く事ができ、かつその文字を文字認識装置で
高精度で読み取る事ができるので、文字認識装置が大変
使い易くなり、また帳票作成の速度が速くなる。
【図面の簡単な説明】
第1図は従来知られている文字認識装置の一例のブロッ
ク図、第2図は本発明による標準パターン登録装置で用
いる帳票の一例を示す図、第3図は第2図のタイミング
・マークと文字枠の拡大図、第4図は本発明の一実施例
のブロック図、第5図〜第7図は第4図の各ブロックの
具体的な一例のブロック図、第8図は第5図〜第7図で
用いた信号のタイム・チャート、第9図は本発明による
標準パターン登録装置で用いる帳票の他の例を示す図で
ある。 図において、1・・・・・・帳票、2・・・・・・レン
ズ、3・・・・・・光電変換素子、4・・・・・・2値
化回路、5・・・・・・画像信号の記憶装置、6・・・
・・・文字切ね出し装置、7・・・・・・標準パターン
の記憶装置、8・・・・・・類似度計算回路、9・・・
・・・類似度比較回路、10・・・・・・外部記憶装置
、11・・・・・・帳票の移動方向、12・・・・・・
タイミング・マーク、13・・・・・・文字枠、20・
・・・・・帳票、21・・・・・・帳票の移動方向、2
2・・・・・・光源、23・・・・・・レンズ24・・
・・・・−次元光電変換素子、25・・・・・・増幅器
、26・・・・・・2値化回路、 27・・・・・・シ
フト・レジスタ、28.29・・・・・・信号、ao、
ai・・・・・・ANDゲート、32・・・・・・NA
NDゲート、 33.38,49.50・・・・・・フ
リップ・フロップ、34,37,41,42,46,5
1.60・・・・・・カウンタ、35,53.59・・
・・・・ANDゲート、36゜47.4B 、52.5
4.57.58・・・・・・NANDゲート、39.4
0・・・・・・ORゲート、 43.44.45・・・
・・・メモリ、55・・・・・・NORゲート、56・
・・・・・インバータ、61・・・・・・レジスタ% 
80・・・・・・画像入力装置、81・・・・・・画像
信号記憶装置、82・・・・・・タイミング・マーク検
知装置、83・・・・・・文字枠切り出し装置、84・
・・・・・記入文字枠検知装置、85・・・・・・標準
パターン記501

Claims (1)

    【特許請求の範囲】
  1. 帳票の画像を光学的に得る手段と、該画像を電気信号に
    変換し画像信号とする手段と、該画像信号よシ文字・記
    号の書かれている位置を検知する手段と、該文字拳記号
    の書かれている位置における文字・記号の信号′t−1
    文字分ずつ取り出しその信号をそのままもしくはその信
    号より特徴を抽出し標準パターンとして記憶する手段と
    、前記検知した1文字・記号の書かれている位置よシそ
    の文字・記号に与える符号を決定し夕前記標準パターン
    に対応して記憶する手段を有する事t−特徴とする標準
    パターン登録装置。
JP57032760A 1982-03-02 1982-03-02 標準パタ−ン登録装置 Pending JPS58149574A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57032760A JPS58149574A (ja) 1982-03-02 1982-03-02 標準パタ−ン登録装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57032760A JPS58149574A (ja) 1982-03-02 1982-03-02 標準パタ−ン登録装置

Publications (1)

Publication Number Publication Date
JPS58149574A true JPS58149574A (ja) 1983-09-05

Family

ID=12367794

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57032760A Pending JPS58149574A (ja) 1982-03-02 1982-03-02 標準パタ−ン登録装置

Country Status (1)

Country Link
JP (1) JPS58149574A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60217487A (ja) * 1984-04-12 1985-10-31 Toshiba Corp 文字認識装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60217487A (ja) * 1984-04-12 1985-10-31 Toshiba Corp 文字認識装置

Similar Documents

Publication Publication Date Title
EP0114249B1 (en) Method for distinguishing between complex character sets
JPS63261486A (ja) 書体識別装置
JPH0157836B2 (ja)
EP0524797B1 (en) Image processing method and apparatus
US3177469A (en) Character recognition
EP0496531A2 (en) Method and system for layout analysis of a document image
JPH0430070B2 (ja)
JPS58149574A (ja) 標準パタ−ン登録装置
CN111611986A (zh) 一种基于手指交互的焦点文本提取和识别方法及系统
JPH0247788B2 (ja)
JPH0432433B2 (ja)
JPS6054082A (ja) 光学文字読取装置
JPS6231485A (ja) バ−コ−ド読取装置
JPS58155485A (ja) 標準パタ−ン登録装置
JPH0528319A (ja) 画像処理方法及び装置
JPH045231B2 (ja)
JPS58101378A (ja) 手書文書読取方法
JPS6227887A (ja) 文字種分離方式
JPS62134767A (ja) 記号名・線分名の自動抽出装置
JPH07160810A (ja) 文字認識装置
JPH0426153B2 (ja)
US3188610A (en) Machine readable characters and process of translating characters
JP2851102B2 (ja) 文字切出し方法
JPS6129976A (ja) 文字認識方法
JPH039505B2 (ja)