JP2933927B2 - パターン認識方法及び情報処理装置 - Google Patents

パターン認識方法及び情報処理装置

Info

Publication number
JP2933927B2
JP2933927B2 JP62040356A JP4035687A JP2933927B2 JP 2933927 B2 JP2933927 B2 JP 2933927B2 JP 62040356 A JP62040356 A JP 62040356A JP 4035687 A JP4035687 A JP 4035687A JP 2933927 B2 JP2933927 B2 JP 2933927B2
Authority
JP
Japan
Prior art keywords
pattern
pixel group
information
run
partial
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP62040356A
Other languages
English (en)
Other versions
JPS63208181A (ja
Inventor
正己 久貝
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP62040356A priority Critical patent/JP2933927B2/ja
Publication of JPS63208181A publication Critical patent/JPS63208181A/ja
Application granted granted Critical
Publication of JP2933927B2 publication Critical patent/JP2933927B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 [産業上の技術分野] 本発明はパターン認識方法及び情報処理装置、特に入
力した画像情報から検出される画素の特徴に応じて入力
画像を識別するパターン認識方法及び情報処理装置に関
するものである。 [従来の技術] 従来、文字認識装置では、一般に文字を光学的に読み
取り2値化された文字画像から複数個の特徴量を抽出
し、予め学習データから抽出された特徴量を格納してあ
る辞書内の標準パターンとの類似度や距離を求めて認識
を行つていた。 ところが、これらの方法において殆どの場合、特徴抽
出で文字画像を殆どすべての画素について何回も走査す
る処理が必要であつたり、類似度計算や距離計算のため
に多数の積和演算が必要であつたりしたので、処理時間
短縮のための特徴抽出回路や、類似度・距離計算回路等
の専用のハードウエア回路が要求され、コスト高な装置
となつていた。 [発明が解決しようとする課題] 本発明は、前記従来の欠点を除去し、特徴抽出や距離
計算用の専用のハードウエア構成を必要とせず、汎用の
情報処理装置のみで実現可能なコスト安のパターン認識
方法及び情報処理装置を提供する。 また、入力画像の識別のためのアルゴリズムの改良や
メンテナンスがし易く、はやくて処理率の良好な画像識
別処理を可能にするパターン認識方法及び情報処理装置
を提供する。 また、変形画像への対処も柔軟にすることができるパ
ターン認識方法及び情報処理装置を提供する。 [課題を解決するための手段] この課題を解決するために、本発明のパターン認識方
法は、入力した画像から第1の方向に連続する画素群を
抽出し、前記抽出された画素群ごとに、前記第1の方向
とは異なる第2の方向へ他の画素群との連続性を判断
し、該連続性に基づいて、連結すべき複数の画素群を1
つの部分パターンとして分類し、前記分類された部分パ
ターンごとに、該部分パターンに含まれる画素群の長さ
情報と、該部分パターンに接続する他の部分パターンへ
のポインタとを含む部分パターン情報を作成し、前記部
分パターン情報に含まれるポインタにより接続される複
数の部分パターンの構造を表す部分パターン構造情報を
作成し、前記作成された部分パターン構造情報と、予め
辞書に記憶されている標準パターンの情報とを比較し
て、当該比較により情報が一致したと判断された標準パ
ターンを、前記入力画像の認識結果として出力すること
を特徴とする。 また、本発明の情報処理装置は、入力した画像から第
1の方向に連続する画素群を抽出する画素群抽出手段
と、前記画素群抽出手段により抽出された画素群ごと
に、前記第1の方向とは異なる第2の方向への他の画素
群との連続性を判断する連続性判断手段と、前記連続性
判断手段により判断された連続性に基づいて、連結すべ
き複数の画素群を1つの部分パターンとして分類する分
類手段と、前記分類手段により分類された部分パターン
ごとに、該部分パターンに含まれる画素群の長さ情報
と、該部分パターンに接続する他の部分パターンへのポ
インタとを含む部分パターン情報を作成する部分パター
ン情報作成手段と、前記部分パターン情報に含まれるポ
インタにより接続される複数の部分パターンの構造を表
す部分パターン構造を作成する部分パターン構造情報作
成手段と、前記作成された部分パターン構造情報と、予
め辞書に記憶されている標準パターンの情報とを比較し
て、当該比較により情報が一致したと判定された標準パ
ターンを、前記入力画像の認識結果として出力する認識
手段とを有することを特徴とする。 [作用] かかる構成により、第1の方向に連続する画素群の第
2の方向への他の画素群との連続性に基づいて、連結す
べき複数の画素群を1つの部分パターンとして分類し、
前記部分パターンの部分パターン情報に含まれるポイン
タにより接続される複数の部分パターンの構造を表す部
分パターン構造情報を作成して、該部分パターン構造情
報と予め辞書に記憶されている標準パターンの情報との
比較で、入力画像のパターンを認識する。 [実施例] 以下、図面を参照しながら本発明の実施例を説明す
る。尚、本実施例の“文字”との文言は記号等の他のパ
ターンをも含むものである。 第1図は本実施例の文字認識装置のハードウエア構成
図である。10は処理手順を実行するCPU、11は辞書を格
納するためのROM、12は処理手順を記憶するROM、13は処
理手順の作業用及び原稿1頁分のイメージデータを記憶
するバツフア用のRAM、14はスキヤナ用インタフエー
ス、15は原稿を光学的に読取り電気信号に変換し白黒2
値のイメージデータにするスキヤナ、16は認識結果を外
部へ出力するためのインタフエースである。 第2図は本実施例の処理を示す概略の論理ブロツク図
である。20は文字の書かれた原稿、21は光情報を電気情
報に変換する光電変換部、22は多値情報を2値化する2
値化処理部、23は文字枠を切り出す文字切出し部、24は
黒画素の連続した列(ランと呼ぶ)を各行毎に抽出する
ラン抽出部、25はランの連続性から文字の構造を分析す
るノードデータ構造作成部、26はノードデータ構造をコ
ード化するコード化部、27はコード化部26で作成された
コードと辞書部28に予め記憶されたコードとを比較して
該当文字を識別する識別部、28はコードと文字を対応し
て記憶する辞書部である。 次に、ROM12に格納された第10図(a)、第11図
(a)の処理フローチヤートに沿つて処理の手順を説明
する。スキヤナ15によつて原稿を読み取ると、光電変換
・2値処理がスキヤナ15内部でなされ、白黒2値のイメ
ージデータがRAM13内部のバツフアに転送される。ここ
までのフローは図示されていない。 第10図(a)のステツプS100では、公知の技術により
1文字の文字画像が切り出されRAM13内部に記憶されて
文字が形成される。第3図は形成された“ア”の文字画
像の例を示す。ここで、RAM13内の各アドレスには白黒
2値のデータが格納されており、第3図はこれを模式的
に示したものである。尚、第3図で横方向をx軸,縦方
向をy軸として以下説明する。ステツプS101では、文字
画像を左から右へラスタスキヤンして白から黒及び黒か
ら白への変化点を検出し、ランを各行毎に抽出する。第
3図のR1〜R20は各ランに付したラン番号である。さら
に、ランの抽出と同時に、前行のランと現在行のランの
各々のx軸への斜影が重なる場合は、これらのランは上
下方向に接続すると定義し、すべてのランの接続の状況
を調べる。ここで、一つのランを第4図に示すデータ構
造(ランデータと呼ぶ)で表現することにする。第4図
中、P1,P2,P3は、上の行の接続するランデータへのポイ
ンタであり、P1,P2,P3の順に左から右へのランに対応
し、ポインタ値が0の場合はそれ以降の接続するランデ
ータは存在しない。P4,P5,P6は同様にして下の行の接続
するランデータへのポインタである。この時点で作業用
フラグ1は、OFFとなつている。 このようにして文字画像の1回のラスタ走査が終わる
と、第5図に示すような互いの接続関係を示したランデ
ータの集まりからなる文字パターン全体のデータ構造
(文字パターンデータと呼ぶ)が得られる。文字パター
ンデータは、元の文字画像を忠実に再現可能なデータと
なつている。第5図中、50は前行に接続するランへのポ
インタを持たないランデータ(この例ではR1とR7、ヘツ
ドランと呼ぶ)へのポインタの配列である。 ステツプS102とステツプS103では配列50の各ヘツドラ
ンへのポインタについてノード生成の処理をするループ
ステツプであり、ステツプS103ではヘツドランのランデ
ータを引数として再帰的関数ノード生成のサブルーチン
を呼び出す。 ここで、第11図(a)に従って再帰的関数ノード生成
の処理を説明する。 まず、ステツプS200で引数として渡されたランデータ
の作業用フラグ1がONかどうかを調べ、ONであれば当関
数は関数値を“0"としてリターンする。作業用フラグ1
がOFFであればステツプS210へ進み、第6図で示される
ノードデータの領域を確保し、ノードデータの作業用フ
ラグ2を“0"クリアする。ステツプS220ではランデータ
のラン長(終点座標−始点座標+1)が予め決められた
ラン長判定用しきい値(例えば4)と比較し、ラン長判
定用しきい値以上であれば、ノードデータのノード種に
“1"(長いことを示す)をセツトし、ラン表判定用しき
い値未満であれば“0"(短いことを示す)をセツトす
る。 ステツプS230では、ステツプS240→S250a→S260a→S2
80のループカウンタのランポインタにランデータのアド
レスをセツトし、変数lにランデータのラン長を代入す
る。次に、ステツプS240ではランポインタの指すランデ
ータの作業用フラグ1をONにする。ステツプS250aで
は、ラン長変化量Vを次式によつて計算する。 ランポインタの指すランデータのラン長をl′として if (l>l′) then V=(l*100)/l′ else X=(l′*100)/l ステツプS260aでは、Vが予め定められたラン長変化
率しきい値(例えば110)を超えるかどうかを調べ、超
えなければラン長が一致しているものとみなし、ステツ
プS280を進み、ランポインタに次のランデータのアドレ
ス、即ちランポインタの指すランデータのP4の値をセツ
トしてステツプS240へ戻りループする。ステツプS260で
Vがラン長変化率しきい値を超えれば、ランデータの連
続性が途切れたものとみなしてステツプS270へ進み、ノ
ードデータの最後のランデータアドレスにランポインタ
の値をセツトしノードデータの作業用フラグ2を“0"に
クリアしてノードデータを完成する。 次にステツプS290ではランポインタの指すランデータ
に子のランデータであるかどうか(即ち、ランポインタ
の指すランデータのP4〜P6が“0"でないかどうか)を調
べ、子のランデータがなければノードデータのアドレス
を関数値にしてリターンする。子のランデータがあれ
ば、子のランデータを引数としてステツプS300でノード
生成の関数を再帰的に呼び出す。ステツプS310ではステ
ツプS300を読んだ関数の関数値の指すノードデータを子
とし、ノードデータを親として互いにポインタで結び合
わせる。次にステツプS290へ戻り、次の子ランデータが
あるかどうかを調べ、なければノードデータのアドレス
を関数値としてリターンする。 このようにして第5図の文字パターンデータは、第6
図(a)で示されるノードデータのつながりである第7
図のようなノードデータ構造に変換される。第6図
(a)でQ1,Q2,Q3は親のノードへのポインタ、Q4,Q5,Q6
は子のノードへのポインタである。第7図の四角のブロ
ツクはノードデータであり、N1〜N5はノードの名称で第
5図のN1〜N5に対応する。四角いブロツクの下半分に記
載されたL,Sはノード種である。Lは長い、Sは短いを
表す。 第10図(a)に戻つて、ステツプS102で未処理のヘツ
ドランがなくなれば、ステツプS104に進み、ノードデー
タ構造の各ノードデータに番号付けを行う。番号付け
は、ヘツドランのポインタ配列50の左から右の順にヘツ
ドランを走査し、ヘツドランからQ4の子ノードを下へ辿
つて辿り着いたところから逆に姉妹ノード、親ノードの
順に逆のぼつて行う。第8図は、第7図のノードデータ
構造を番号付けしたものである。次にステツプS105で
は、ノードデータ構造をノード番号の順に各ノードを32
ビツトのコードに変換してノードデータ構造のコード化
を行う。ノードのコード化は第9図で示されるように、
ノード番号,ノード種,Q1〜Q6のノード番号を各々4ビ
ツトで表して行う。 最後にステツプS106では、ステツプS105で求まつたノ
ードデータ構造のコードと、辞書部28内の標準パターン
のコードとを比較し、一致した標準パターンの文字類を
認識結果とする。 前記実施例ではラン長の変化を前のランとのラン長と
の比が予め定められたしきい値をこえているかどうかで
検出しているが、他の実施例として次のものがある。 n個前のランをRn,Rnのラン長をlnとする。関数f(l
1,l2,…lr)は、r個の前のランRr〜R1のラン長からR1
の次のラン(R0とする)のラン長l0を予測する関数でラ
ンR0のラン長l0とf(l1,l2,…lr)の差が一定値dより
も大きいかどうかでラン長の変化を検出する。関数fの
例としては、例えば次のようなものが考えられる。 if (l2>l1) then f(l1,l2)=l1−(l2−l1) else f(l1,l2)=l1+(l1−l2) 本実施例はラン長の長短の判定を固定しきい値よりも
長いか短いかの絶対的なものとせずに、前のランのラン
長に対して相対的に長いか短いかとしたので、水平スト
ロークの傾斜から生ずる長いランの下の短いランを上の
長いランと同じノードに属させることにより、水平スト
ロークの傾斜変形に対する対策とストローク付近のノイ
ズ吸収が図られることから認識率の向上が大であり、且
つ全ての文字画像の画素毎の追跡処理を行わずに、ラン
データのみの処理にて認識を可能ならしめる。従つて、
特別の専用ハードウエア回路を必要とせずに、文字認識
装置を実現できる。 次にノードデータに、その属性値を持たせた場合の例
を示す。第6図(b)は属性値を持つたノードデータ、
第11図(b)は属性値を持たせるノード生成サブルーチ
ンのフローチヤートである。尚、第11図(b)のフロー
で第11図(a)と同様である部分は図示していない。 ステツプS250bでは、ノードデータの属性値にランポ
インタが指すランデータの黒画素数(即ち、ラン長=終
点座標−始点座標+1)の足し込みを行う。 ステツプS260aでは、ランポインタの指すランデータ
のラン長をラン長判定用しきい値と比較し、長いか短い
かを求めてノードデータのノード種と一致するかどうか
を判定する。一致すれば、ランポインタに次のランデー
タのアドレス(即ち、ランポインタの指すランデータの
P4の値)をセツトしステツプS240へ戻り、一致しなけれ
ば、ランの縦方向の連続性が途切れたものとみなし、ス
テツプS270へ進む。ステツプS270ではノードデータの最
後、ランデータアドレスにランポインタの値をセツトす
る。 第6図(b)でQ1,Q2,Q3は親のノードへのポインタ、
Q4,Q5,Q6は子のノードへのポインタであり、属性値には
ノードに含まれる黒画素数が入つている。 この場合は、第10図(a)の最後のステツプS106の識
別は、ステツプS105で求まつたノードデータ構造のコー
ドと、辞書部28内の標準パターンのコードとを比較し、
一致した標準パターンの文字類を認識候補とする。辞書
部28にはノードデータ構造のコードと各ノードの属性値
(ノードに含まれる黒画素の平均個数)及び文字コード
とが一組になつて文字類の種類数だけ格納されている。 更に、認識候補となつた文字類(i=1,2,…,n)につ
いて観測文字パターンの距離Diを次式で求める。 ここで、Xk(k=1,…m)は観測文字パターンのノー
ドデータ構造のk番目ノードの属性値、ak iは第i番目
の候補のk番目ノードの属性値である。 {Di|i=1,…n}で最小の距離Diをもつ文字類を認識
結果とする。かくして、ノードデータ構造のコードによ
り候補を絞り、次にノードデータ構造のノードに含まれ
る黒画素数を比較することにより識別を行つた。 前記実施例では、ノードに含まれる黒画素数をノード
の属性値としたが、他にも以下のような量を属性値とし
た同様の実施例が考えられる。 (1)ストロークの方向を属性値とする。 各ノードは縦方向に接続したランの集まりであるの
で、ノード種が短い(ラン長が短い)場合に、各ランの
中点の集まりに最も近似的な直線を求めて、この直線の
傾きを属性値とする。ランの集まりは、ストロークを構
成するので直線の傾きはストロークの方向になつてい
る。 (2)接点の位置を属性値とする。 親のノード種が長いので子のノード種が短いランの場
合において、両ノードを線分で近似して親ノードの線分
を左,中央,右の三つの部分に分割し、子ノードの線分
上部が親ノードの線分のどの三つの部分に接しているか
を求め、この接点の位置を属性値とする。 本実施例では、文字画像を一回だけラスタ走査するこ
とによりノードデータ構造とノードの属性値を求めるこ
とができ、文字画像を画素毎に追跡して特徴を抽出する
他の方法に比べ簡単に処理が行え、コードのマツチング
とノードの属性値の比較という簡単な方法で識別が行え
ることができるので、特別のハードウエア回路を必要と
せず、且つ汎用のマイクロプロセツサの標準的な構成で
文字認識装置が実現できるため、低価格の文字認識装置
を提供できる。 更に、第11図(c)のようにステツプS240からステツ
プS260に飛んで、ラン長の比較を単にL,Sの比較で行う
と処理は簡単となる。又、ラン長の変化点を見出してラ
ンの連続性の途切れとして各ランの集まりをノード化し
たが、他の実施例として、文字パターンのストロークの
合流点・分岐点や屈折点等をランの接続状態より見出す
ことができるので、これらの点をランの連続性の途切れ
としてノード化することが考えられる。 前記実施例で示されたように、文字画像を一回ラスタ
走査することにより、ランデータの集合からなる文字パ
ターンデータがつくられ、以後は文字パターンデータを
処理するだけで特徴抽出が行える。文字画像をN×N
(画素)とすると、他の一般の文字認識方法では、N2
画素数に比例した処理量が必要なのに比べ、本発明では
ランのみを処理するので処理量が格段に少なくなる。
又、認識は距離計算を行う必要がなく、単純なコードの
マツチングだけでよい。従つて、特別な専用ハードウエ
ア回路が必要なく、汎用のマイクロプロセツサの標準的
な構成で文字認識装置が実現できるため、低価格の文字
認識装置を提供できる。 第10図(b)はノードデータ構造の補正を行うステツ
プS110がステツプS104のノード番号付けの前に挿入され
たフローチヤートである。 ステツプS102で未処理のヘツドランがなくなればステ
ツプS110へ進み、ノードデータ構造補正サブルーチンを
呼び出す。 次に第12図に従つて、ノードデータ構造補正の処理を
説明する。第7図で上への連結するノードをもたないヘ
ツドノードはN1とN3である。ステツプS400とステツプS4
10は全てのヘツドノードについて処理をするループステ
ツプである。ステツプS400で未処理のヘツドノードがあ
れば、ステツプS410へ進み、ヘツドノードから下へ順に
ノードをたどり、各ノードについてノードに含まれるす
べてのランの黒画素数の和を計算する。これは、ノード
データが第6図(a),(b)に示す如く先頭ランデー
タアドレスと最後ランデータアドレスを含むので、ノー
ドに含まれるランデータをたどることによつて計算可能
である。 黒画素数の和がある一定値よりも小さければ、このノ
ードはノイズやハネによつて生じたもので本来は生ずべ
きではないから、ノードデータを第13図に一例を示すよ
うにノードデータ構造から削除する。そして、このノー
ドデータと連結するノードデータのポインタQ1〜Q6を訂
正する。但し、黒画素数の和が一定値よりも小さくて
も、注目のノードデータが上又は下に2個以上のノード
データと連結する場合(即ち、合流点又は分岐点となつ
ているノードデータ)は、ノードデータ構造から削除し
ない。 ステツプS400で未処理のヘツドノードが無ければ、ス
テツプS420へ進む。ステツプS420,ステツプS430も全て
のヘツドノードについて処理をするループステツプであ
る。ステツプS420で未処理のヘツドノードがあれば、ス
テツプS430へ進み、ヘツドノードから下へすべてのノー
ドをたどつて第13図に一例を示すようにノードの削除に
よつて発生した、本来一つになるべき分離したノードデ
ータ同士を統合して一つのノードデータにする処理を行
う。ステツプS420で未処理のヘツドノードがなければサ
ブルーチンは終了しリターンする。 前記実施例ではノードに含まれるランの黒画素数の和
が一定値以下の場合にノードの削除を行つたが、他の実
施例としてノードに含まれるランの個数が一定個数以下
の場合にノードの削除を行う方法もある。 本実施例によれば、文字の変形に対処できる文字認識
装置を特徴抽出や距離計算用の専用のハードウエア回数
を必要とすることなく、汎用のマイクロプロセツサのみ
で実現可能にしている。 尚、本実施例では文字の認識を黒点を対象に行つた
が、白黒は相対的なものであつて白点による認識であつ
ても良いし、また所定の色等を考えても良い。又、本実
施例は文字の認識を縦・横の連続性に基づいて行ない、
特に縦の連続性の抽出結果がより有効で簡単になるよう
に工夫されたものである。しかし、縦・横も相対的なも
のであり、本実施例の方向は何ら限定されたものでな
く、斜め方向,同心円方向,放射方向等であつても良
い。 [発明の効果] 本発明により、特徴抽出や距離計算用の専用のハード
ウエア構成を必要とせず、汎用の情報処理装置のみで実
現可能なコスト安のパターン認識方法及び情報処理装置
を提供できる。 また、入力画像の識別のためのアルゴリズムの改良や
メンテナンスがし易く、はやくて処理率の良好な画像識
別処理を可能にすることができる。 また、変形画像への対処も柔軟にすることができる。
【図面の簡単な説明】 第1図は実施例の文字認識装置のハードウエア構成図、 第2図は実施例の文字認識装置の論理的なブロツク構成
図、 第3図は文字画像を示す図、 第4図はランデータを示す図、 第5図は文字パターンデータを示す図、 第6図(a),(b)はノードデータを示す図、 第7図はノードデータ構造を示す図、 第8図は番号付けされたノードデータ構造を示す図、 第9図はコード化されたノードを示す図、 第10図(a),(b)は文字認識のフローチヤート、 第11図(a),(b),(c)はノード生成サブルーチ
ンのフローチヤート、 第12図はノードデータ構造補正サブルーチンのフローチ
ヤート、 第13図はノードの削除と統合を示す図である。 図中、10……CPU、11……辞書用ROM、12……処理手順用
ROM、13……RAM、14……スキヤナ用インタフエース、15
……スキヤナ、16……出力用インタフエース、20……原
稿、21……光電変換部、22……2値化処理部、23……文
字切出し部、24……ラン抽出部、25……ノードデータ構
造作成部、26……コード化部、27……識別部、28……辞
書部である。

Claims (1)

  1. (57)【特許請求の範囲】 1.入力した画像から第1の方向に連続する画素群を抽
    出し、 前記抽出された画素群ごとに、前記第1の方向とは異な
    る第2の方向への他の画素群との連続性を判断し、 該連続性に基づいて、連結すべき複数の画素群を1つの
    部分パターンとして分類し、 前記分類された部分パターンごとに、該部分パターンに
    含まれる画素群の長さ情報と、該部分パターンに接続す
    る他の部分パターンへのポインタとを含む部分パターン
    情報を作成し、 前記部分パターン情報に含まれるポインタにより接続さ
    れる複数の部分パターンの構造を表す部分パターン構造
    情報を作成し、 前記作成された部分パターン構造情報と、予め辞書に記
    憶されている標準パターンの情報とを比較して、当該比
    較により情報が一致したと判断された標準パターンを、
    前記入力画像の認識結果として出力することを特徴とす
    るパターン認識方法。 2.前記連続性の判断の条件として、画素群の長さの所
    定値との長短が一致する条件を含むことを特徴とする特
    許請求の範囲第1項に記載のパターン認識方法。 3.前記連続性の判断の条件として、画素群の長さの変
    化率が所定値より小さい条件を含むことを特徴とする特
    許請求の範囲第1項に記載のパターン認識方法。 4.前記標準パターンは文字を表すことを特徴とする特
    許請求の範囲第1項に記載のパターン認識方法。 5.前記文字は記号を含むことを特徴とする特許請求の
    範囲第4項に記載のパターン認識方法。 6.入力した画像から第1の方向に連続する画素群を抽
    出する画素群抽出手段と、 前記画素群抽出手段により抽出された画素群ごとに、前
    記第1の方向とは異なる第2の方向への他の画素群との
    連続性を判断する連続性判断手段と、 前記連続性判断手段により判断された連続性に基づい
    て、連結すべき複数の画素群を1つの部分パターンとし
    て分類する分類手段と、 前記分類手段により分類された部分パターンごとに、該
    部分パターンに含まれる画素群の長さ情報と、該部分パ
    ターンに接続する他の部分パターンへのポインタとを含
    む部分パターン情報を作成する部分パターン情報作成手
    段と、 前記部分パターン情報に含まれるポインタにより接続さ
    れる複数の部分パターンの構造を表す部分パターン構造
    を作成する部分パターン構造情報作成手段と、 前記作成された部分パターン構造情報と、予め辞書に記
    憶されている標準パターンの情報とを比較して、当該比
    較により情報が一致したと判定された標準パターンを、
    前記入力画像の認識結果として出力する認識手段とを有
    することを特徴とする情報処理装置。 7.前記連続性判断手段は、画素群の長さの所定値との
    長短が一致する場合に、連続であると判断することを特
    徴とする特許請求の範囲第6項に記載の情報処理装置。 8.前記連続性判断手段は、画素群の長さの変化率が所
    定値より小さい場合に、連続であると判断することを特
    徴とする特許請求の範囲第6項に記載の情報処理装置。 9.前記標準パターンは文字を表すことを特徴とする特
    許請求の範囲第6項に記載の情報処理装置。 10.前記文字は記号を含むことを特徴とする特許請求
    の範囲第9項に記載の情報処理装置。
JP62040356A 1987-02-25 1987-02-25 パターン認識方法及び情報処理装置 Expired - Lifetime JP2933927B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62040356A JP2933927B2 (ja) 1987-02-25 1987-02-25 パターン認識方法及び情報処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62040356A JP2933927B2 (ja) 1987-02-25 1987-02-25 パターン認識方法及び情報処理装置

Publications (2)

Publication Number Publication Date
JPS63208181A JPS63208181A (ja) 1988-08-29
JP2933927B2 true JP2933927B2 (ja) 1999-08-16

Family

ID=12578361

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62040356A Expired - Lifetime JP2933927B2 (ja) 1987-02-25 1987-02-25 パターン認識方法及び情報処理装置

Country Status (1)

Country Link
JP (1) JP2933927B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2763033B2 (ja) * 1992-03-11 1998-06-11 株式会社リコー 文字認識方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58182791A (ja) * 1982-04-20 1983-10-25 Ricoh Co Ltd 文字パタ−ンの特徴抽出法および分類法
JPS6116380A (ja) * 1984-07-03 1986-01-24 Ricoh Co Ltd 領域分割方式

Also Published As

Publication number Publication date
JPS63208181A (ja) 1988-08-29

Similar Documents

Publication Publication Date Title
JP3139521B2 (ja) 自動言語決定装置
JP2940496B2 (ja) パタンマッチング符号化装置及び方法
US8155445B2 (en) Image processing apparatus, method, and processing program for image inversion with tree structure
JPH0713995A (ja) 自動テキスト特徴決定装置
EP1300779B1 (en) Form recognition system, form recognition method, program and storage medium
Amin et al. Hand printed Arabic character recognition system
JPH0256708B2 (ja)
GB2366108A (en) Vectorization of raster images
JP2933927B2 (ja) パターン認識方法及び情報処理装置
US20050238235A1 (en) Run length based connected components and contour following for enhancing the performance of circled region extraction algorithm
JPH0656618B2 (ja) 画像情報の文字・図形分離方法
KR20000025647A (ko) 쉐이딩 알고리즘을 이용한 영상 처리 방법
JP3582734B2 (ja) 表のベクトル化装置
JP3586911B2 (ja) 枠線認識装置
KR100334624B1 (ko) 클러스터링기반문서영상분할방법
JPH07160824A (ja) 文字認識装置
JPH03268181A (ja) 文書読み取り装置
JP2800205B2 (ja) 画像処理装置
JP3104355B2 (ja) 特徴抽出装置
JP2683711B2 (ja) 文字・記号データの認識・修正方法
JP2763033B2 (ja) 文字認識方法
JP2507949B2 (ja) 文字/図形領域判定装置
JPH0495178A (ja) 線図形折線化処理装置
JPH07152862A (ja) 文字認識用の文字切り出し装置
JPH05282489A (ja) 文章画像の属性判別方法

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term