JPH0252312B2 - - Google Patents

Info

Publication number
JPH0252312B2
JPH0252312B2 JP56196341A JP19634181A JPH0252312B2 JP H0252312 B2 JPH0252312 B2 JP H0252312B2 JP 56196341 A JP56196341 A JP 56196341A JP 19634181 A JP19634181 A JP 19634181A JP H0252312 B2 JPH0252312 B2 JP H0252312B2
Authority
JP
Japan
Prior art keywords
character
code string
circuit
shift register
code
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP56196341A
Other languages
English (en)
Other versions
JPS5897784A (ja
Inventor
Yoshihisa Tanabe
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Tokyo Shibaura Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tokyo Shibaura Electric Co Ltd filed Critical Tokyo Shibaura Electric Co Ltd
Priority to JP56196341A priority Critical patent/JPS5897784A/ja
Publication of JPS5897784A publication Critical patent/JPS5897784A/ja
Publication of JPH0252312B2 publication Critical patent/JPH0252312B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • G06V30/182Extraction of features or characteristics of the image by coding the contour of the pattern
    • G06V30/1823Extraction of features or characteristics of the image by coding the contour of the pattern using vector-coding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 本発明は、光学的文字読取装置等の文字識別装
置に関するものである。
光学的文学読取方式に於いては、一般的に、文
学パターンを細めるなり、中心線を求めるなどし
て、これらを線図形に変換したパターンを8方向
コードなどのコード列で、又は文字パターンから
部分特徴を抽出し、特徴コード列で表現し、事前
にコード化された標準パターンとのマツチングを
とつたり、順序論理回路を通すなどして、文字を
認識する方式が用いられている。
特に、類似度を用いた文字識別方式において
は、文字パターンを正規化して、大きさをそろえ
た後、情報圧縮したパターンを作り、これと辞書
内に保持される標準パターンとの類似度を計算し
答を出している。
又、この方法は、メモリなどの発達によつて辞
書の作成が容易である特長を有する。
ところで、文字を表わす特徴としては、文字を
構成している要素、つまり「黒い」部分の全部を
用いないものがある。
例えば、文字の線縁(文字パターンの輪郭)は
比較的よく文字の特徴を示すものとして知られて
おり、近年多くの識別方法に用いられている。
しかし、この線縁情報を用いた特徴抽出による
文字の識別は、情報の処理は簡単であるが、情報
量が多くなる為、多大な労力を要することも知ら
れている。
本発明は、上記事情に基づきなされたもので、
類似度方式の有する辞書作成の容易さと、高精度
さ、そして、特徴(原始)パターン抽出方式の有
する取り扱いがしやすいという利点を生かした文
字識別装置を提供することを目的とする。
以下、図面を参照して、本発明の一実施例を詳
述する。
第1図は、本発明の一実施例である。
ここで、文字の線縁を追跡することにより得ら
れた情報を変換し、各方向の1次元コードストリ
ングを得る手段は、第1図1に示されるように、
方向コード化回路4、分類回路5、ゲート6、特
徴点抽出回路7、光電変換回路8、同期信号発生
回路9、領域信号発生回路10からなるものであ
る。
方向コード化回路4は、分類回路5に接続さ
れ、8又は16方向に分類されたコードを2進
(8方向なら3ビツト、16方向なら4ビツト)の
データに変換するものである。
分類回路5は、ゲート6に接続され、特徴点が
検出された信号を8又は16に分類するものであ
る。
ゲート6は、特徴点検出回路7と領域信号発生
回路10に接続され、特徴点検出回路7から受け
た信号を、領域信号発生回路10の信号に同期し
て出力するものである。
特徴点検出回路7は、光電変換回路8に接続さ
れ、この回路から送られて来る信号が線縁の部分
特徴を検出するものである。
光電変換回路8は、同期信号回路9に接続さ
れ、文字パターンをCCDなどで、ブロツク毎に
デジタル信号に変換するものである。
同期信号発生回路9は、領域信号発生回路10
に接続され、光電変換回路8が文字上を走査する
ための信号を発生するものである。
領域信号発生回路10は、同期信号発生回路9
に接続され、この信号を受け、ブロツク毎にデー
タを区切る為の信号を発生するものである。
次に、1次元コードストリングを圧縮又は伸長
し、一定長とする手段は、第1図2に示されるよ
うに、 シフトレジスタ11、シフトレジスタ12、コ
ンパレータ13、カウンタ14、ゲート15から
なるものである。
シフトレジスタ11は、方向コード化回路4に
接続され、これより得られた2進データを、シフ
トクロツク(図示せず)に同期して取込み、ラツ
チし、シフトするものである。
シフトレジスタ12は、シフトレジスタ11に
接続され、これより得られた信号を取り込み、ラ
ツチし、シフトするものである。
コンパレータ13は、シフトレジスタ11とシ
フトレジスタ12に接続され、これらの出力信号
の比較を行なうものである。
カウンタ14は、コンパレータ13に接続さ
れ、コンパレータ13の出力をカウントし、1次
元コードストリングの長さの決定を行なうもので
ある。
ゲート15は、コンパレータ13、シフトレジ
スタ12に接続され、コンパレータ13の出力信
号によつてシフトレジスタ12の出力を、バツフ
ア17へ送るものである。
次に、各種文字が有する1次元コードストリン
グの標準パターンを記憶している手段と、該手段
より得られる標準パターンの1次元コードストリ
ングと一定長に変換された1次元コードストリン
グを比較し、識別する手段は、第1図3に示され
るように、 CPU16、バツフア17、メモリ18、バス
19からなるものである。
CPU16は、バス19を介してバツフア17、
メモリ18などの制御を行なうものである。
バツフア17は、ゲート15に接続され、シフ
トレジスタからの出力を一時保持するものであ
る。
メモリ18は、事前に標準パターンのコードス
トリングが記憶されていて、CPU16からの指
令により、これらを出力するものである。
以上が、本発明の一実施例の構成である。
次に図面を参照して動作の説明をする。
例えば、第2図に示されるように、「2」と言
う文字を識別する場合、 文字パターンは、同期信号発生回路9の信号
に同期して走査されるCCDなどによつて、デ
ジタル信号に変換される。
所定の始点を基準にして、第3図aの如く
8方向に線縁を検出し、これを順次ブロツク毎
に追跡していく。まず、8方向であるから、線
縁の向きは真上、斜右上、右、斜右下、真下、
斜左下、左、斜左上に分類されるが、ここで
は、これらに順に、1,2,3,4,5,6,
7,8と番号を付けておくことにする。又、こ
れら各方向を2進3ビツトで表現すると、例え
ば、「000」「001」「010」「011」「100」「101」
「110」「111」の如くなる。
次に、第2図に示される文字「2」につい
て、方向コードと2進3ビツトで線縁の向きを
考えると、始点の線縁方向を3の向き(つま
り、2進で「010」)とすると、次は3〔010〕、
次は4〔011〕、次は4〔011〕、次は5〔100〕と言
う具合になり、結果は、このコードストリング
Sとすると、S
3344566665543335577777711111222287677222で
あり、コードストリングの長さをlとすると、
l=40となる。
コードストリングを正規化するには、圧縮そ
して伸長の二つの場合があるが、ここで圧縮に
ついて考えてみると、コードストリング中での
線縁方向は、文字を分割するブロツクが十分小
さい場合、連続することに着目して、これら連
続するコードを一つのコードとすれば良い。
a○ 方向コード化回路4から送られてきた2進
データは、シフトクロツクに同期して、シフ
トレジスタ11にラツチされる。
b○ このシフトレジスタ11にラツチ、シフト
され出力されたデータは、再びカスケード接
続されているシフトレジスタ12に入力さ
れ、シフトされる。
c○ データが2進3ビツトでシフトレジスタ1
1,12のビツト数が3ビツトであると、シ
フトレジスタ11の出力とカスケード接続さ
れたシフトレジスタ12の出力は、必らず3
ビツト異なるものとなる。
例えば、S=33445666…が順にシフトされ
てくる場合、先頭の「3・3」に注目し、こ
れを2進で表わすと「010・010」となる。
しかし、3ビツトのシフトレジスタがカス
ケード接続されているので、先に入つたコー
ドビツトの先頭が下の段のシフトレジスタ1
2から出力されると同時に後から入つた3ビ
ツト遅れのコードビツトの先頭が上の段のシ
フトレジスタ11から出力される。結果とし
て、2つのシフトレジスタからの出力は、0
と0、1と1、0と0となる。
d○ これら出力(0と0、1と1、0と0)は
コンパレータの入力に加えられるが、これら
の比較を行なつてもコンパレータの出力は
「0」である。
e○ カウンタ14は、コンパレータ13の出力
をカウントし、コードストリングの長さlを
決定するが、この場合は出力がないのでカウ
ントしない。
f○ コンパレータ13の出力がない場合は、ゲ
ートの出力もないので、バツフア17へのデ
ータ出力もない。
以上によつて、方向コードが二つ連続して
「33」となつている場合は、正規化によつて
「3」とされる、以下同様にしてS全体にこの
操作がくり返され、又、カウンタ14によつて
この長さも所定のものとされる。その結果の出
力をSとすると、S
345665433577711122876722となり、l=24とな
る。
又、方向コードが異なる場合、例えば「2・
6」では、これらは2進では「010・101」とな
り、コンパレータへの各入力は、0と1、1と
0、0と1で異なるものであるので、コンパレ
ータ13は出力を出し、カウンタはカウントを
更新し、バツフア17へのデータの出力も行な
われる。
なお、以上では、コードの全ビツトが異なる
場合を想定したが、1ビツトのみ、又2ビツト
のみ異なる場合は適当な論理演算を行なえば、
同様にして処理することができる。
又、コードストリングを伸長する場合には、
これらストリングを左詰めとして、カウンタに
よつて所定の長さとするために、不足コード分
として意味付されたコードを付け加えれば良
い。
正規化されたコードストリングは、バツフア
17に保持される。このバツフア17は英、
数、カナ記号の場合、128ワード程度のもので
十分である。
これらコードストリングからなる文字を識別
するには、CPU16からの制御によつて、一
般に辞書と呼ばれている標準的な文字のパター
ンコードストリングが記憶されているメモリ
(他の記憶媒体から転送されたコードストリン
グのデータが保持されている場合もある)か
ら、コードストリングを読み出す。当然のこと
ながらこれは一つとは限らない。
CPU16は、これら読み出されたコードス
トリングと入力データから正規化されたコード
ストリングを比較し、最も確からしいものを答
として選択する。
これは、例えば、CPU16が有する各レジ
スタ(図示せず)にこれらコードストリングの
データ、そして標準パターンのコードストリン
グのデータを格納し、論理演算をするなり、加
算してフラグをみるなどして、判定すれば良
い。
又、CPU16の機能を使用して、二つのシ
フトレジスタ、カウンタ、ゲートの部分を省略
して、CPU16にバツフア17を介して直接
正規化されたコードストリングを転送し、ソフ
ト的に処理しても良い。
識別結果は、CPU16の制御によつて外部
へ出力される。
以上が本発明の実施例の動作である。
本発明による効果は、以下の如くである。
類似度法が有する辞書作成の自動化を用いるこ
とができるので、高精度の辞書を短期間で作成す
ることが可能である。
マツチングすべきパターンが文字線縁(周辺)
情報だけで、しかも情報量が圧縮(例えば、コー
ド長40のものが24へ)されている上、取扱い
が簡単である。このため、パターン処理時間を短
かくすることができ、又必要とするメモリが少な
くなるので、ハード量が減少する。
以上のように、本発明は文字の線縁を識別情報
に用い、類似度を計算し、文字を識別することに
より、装置の簡素化を図ることを特徴とするもの
である。
【図面の簡単な説明】
第1図は本発明の一実施例を示すブロツク図、
第2図は文字の線縁を追跡する時の手順を示す平
面図、第3図は線縁の具体的分類を示す平面図。 1…原始特徴抽出回路、2…正規化回路、3…
辞書及び類似度識別回路、4…方向コード化回
路、5…分類回路、6…ゲート、7…特徴点抽出
回路、8…光電変換回路、9…同期信号発生回
路、10…領域信号発生回路、11…シフトレジ
スタ、12…シフトレジスタ、13…コンパレー
タ、14…カウンタ、15…ゲート、16…
CPU、17…バツフア、18…メモリ、19…
バス。

Claims (1)

  1. 【特許請求の範囲】 1 文字の線縁を追跡することによりその文字の
    線縁特徴を方向コードの1次元コードストリング
    に変換する手段と、 該手段により得られた1次元コードストリング
    を圧縮又は伸長し、一定長とする手段と、 各種文字が有する1次元コードストリングの標
    準パターンを記憶している手段と、 該手段より得られる標準パターンの1次元コー
    ドストリングと前記一定長とする手段より得られ
    る1次元コードストリングを比較し識別する手
    段、とからなることを特徴とする文字識別装置。
JP56196341A 1981-12-08 1981-12-08 文字識別装置 Granted JPS5897784A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP56196341A JPS5897784A (ja) 1981-12-08 1981-12-08 文字識別装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP56196341A JPS5897784A (ja) 1981-12-08 1981-12-08 文字識別装置

Publications (2)

Publication Number Publication Date
JPS5897784A JPS5897784A (ja) 1983-06-10
JPH0252312B2 true JPH0252312B2 (ja) 1990-11-13

Family

ID=16356216

Family Applications (1)

Application Number Title Priority Date Filing Date
JP56196341A Granted JPS5897784A (ja) 1981-12-08 1981-12-08 文字識別装置

Country Status (1)

Country Link
JP (1) JPS5897784A (ja)

Also Published As

Publication number Publication date
JPS5897784A (ja) 1983-06-10

Similar Documents

Publication Publication Date Title
US5287275A (en) Image recognition apparatus and method for recognizing a pattern within an image
GB1567287A (en) Pattern encoding apparatus
US4288779A (en) Method and apparatus for character reading
JPS6140684A (ja) 輪郭追跡装置
Amin et al. Hand printed Arabic character recognition system
EP0309655A2 (en) Image processing apparatus and method
EP0349677B1 (en) Image coding system
JPS6133299B2 (ja)
JPH0252312B2 (ja)
JP2003087575A (ja) 画像表示装置
US4121258A (en) Method for coding facsimile signal
US3970991A (en) Character recognition system
KR100598115B1 (ko) 고속 문자인식방법 및 장치
JPH1117959A (ja) 2値画像のランレングス符号化方法およびランレングス符号化プログラムを記録した記録媒体
JPS6043556B2 (ja) 文字読取装置
JPS5960690A (ja) 2値化装置
JPS5814710B2 (ja) パタ−ン分類装置
JPS59205681A (ja) 文字読取装置
Simonett Quantitative data extraction and analysis of remote sensor images
KR890003724B1 (ko) 문자패턴 스트링의 최소화 방법과 이 방법을 수행하기 위한 회로
JPH0376065B2 (ja)
JPH0677270B2 (ja) 文字認識装置
JPS59197969A (ja) 光学的文字読取装置
JPH04205271A (ja) 最適2値化しきい値決定方法
JPS60110091A (ja) 文字認識方式