JPH1021339A - パターン認識方法及び装置 - Google Patents

パターン認識方法及び装置

Info

Publication number
JPH1021339A
JPH1021339A JP8171447A JP17144796A JPH1021339A JP H1021339 A JPH1021339 A JP H1021339A JP 8171447 A JP8171447 A JP 8171447A JP 17144796 A JP17144796 A JP 17144796A JP H1021339 A JPH1021339 A JP H1021339A
Authority
JP
Japan
Prior art keywords
pattern
line segment
combination mode
item
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP8171447A
Other languages
English (en)
Other versions
JP3069771B2 (ja
Inventor
Yasuhiko Takeda
靖彦 武田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
FUROMU NIIHAMA KK
Original Assignee
FUROMU NIIHAMA KK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by FUROMU NIIHAMA KK filed Critical FUROMU NIIHAMA KK
Priority to JP8171447A priority Critical patent/JP3069771B2/ja
Publication of JPH1021339A publication Critical patent/JPH1021339A/ja
Application granted granted Critical
Publication of JP3069771B2 publication Critical patent/JP3069771B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 認識対象パターンの形状、サイズ、位置を問
わず、高精度且つ高速のパターン認識を簡易な構成によ
って実現するパターン認識技術を提供する。 【解決手段】 文字パターンを含む画像データから文字
の存在が予想されるパターン領域を検出して該パターン
領域における画素の延びに対応する有効エレメント(線
分要素)を線分抽出部11で抽出する。この抽出した有
効エレメント間の相対配置からパターン領域内の規則性
線分図形とアイテムの少なくとも一方及びその組合せ態
様をパターン特定部12で特定する。文字認識辞書13
には予め規則性線分図形やアイテムの組合せ態様の情報
をカテゴリと対応付けて蓄積してあり、照合部14は、
パターン特定部12で特定された組合せ態様と文字認識
辞書13の蓄積情報とを照合して該当するカテゴリを認
識結果として出力する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、例えば文字、数
字、記号その他の図形からなる活字パターンや手書きパ
ターンを簡易且つ高速に認識するためのパターン認識技
術に関する。
【0002】
【従来の技術】従来の一般的なパターン認識装置では、
スキャナ等で取り込んだ画像データをほぼ一定の形状、
サイズの単位領域毎に切り出して各単位領域の特徴ベク
トルを抽出し、抽出した特徴ベクトルとパターン認識辞
書に収められている参照ベクトルとの比較照合を行って
いる。そして、比較照合の結果、相違度の小さい参照ベ
クトルのカテゴリを当該単位領域における認識結果ない
し認識候補として特定している。このようなパターン認
識装置は、例えば光学的文字認識装置(OCR)や図形
認識装置、あるいは色相認識装置として実用化されてい
る。
【0003】また、近年は、活字文字や定型図形等の認
識のほか、手書き文字や図形のような曖昧要素をもつパ
ターンの認識技術の開発も盛んに行われている。手書き
パターンの認識には、例えばタッチペンやポインティン
グデバイスによって入力された随時認識と、イメージス
キャナ等によって入力された大量の認識対象パターンを
含む画像データの一括認識とがある。前者の場合は、ベ
クトルの始点(書き始め)と終点(書き終わり)とを確
定することで線分の長さや向きの組合せを特定し、特定
した組合せに対応した文字や図形を認識結果として出力
する。このような手法では、イメージ処理を伴わないか
ら高速認識が可能であるが、既に手書きされたパターン
については認識することができない。また、書き順が変
わると正しい認識が行われない場合もある。一方、後者
の場合は、取り込んだ画像データから所定領域の切り出
しを行った後、切り出した領域に存する画像の特徴をパ
ターンらしさを表す確度情報に変換し、この確度情報に
基づいて認識を行っている。このような手法では、既に
手書きされたパターンの認識は可能であるが、画像デー
タからの切り出し確度の精度を高めないと認識率が低下
する。
【0004】
【発明が解決しようとする課題】ところで、含まれるパ
ターンが活字か手書きかに拘わらず、スキャナ等によっ
て取り込まれた画像データにはノイズ成分が含まれるこ
とが多い。そのため、一括認識方式による従来のパター
ン認識装置では、ノイズ除去を行うための前処理手段を
設けるのが通常であり、装置構成や処理内容を簡略にす
ることができなかった。また、従来のパターン認識装置
では、パターン形成領域の大きさや形成位置がまちまち
の場合、その切り出し確度を高めるための処理は複雑で
あり、しかも、抽出された特徴ベクトルと全てのカテゴ
リに対応する参照ベクトルとを比較照合しているので、
比較照合に要する処理量を低減することができない。そ
のため、パーソナルコンピュータのような簡易なコンピ
ュータ装置を用いて、高精度且つ高速のパターン認識装
置を実現することができない、という問題があった。さ
らに、パターンの形成要素の一部が欠落した場合、従来
のパターン認識装置では正しい認識結果が得られないと
いう問題もあった。
【0005】本発明の課題は、かかる問題点を解消し、
認識対象となるパターンの形状、サイズ、位置を問わ
ず、また、パターンの形成要素の一部が欠落した場合で
あっても、高精度且つ高速のパターン認識を簡易な構成
によって実現することができる、改良されたパターン認
識技術を提供することにある。
【0006】
【課題を解決するための手段】上記課題を解決するた
め、本発明は、コンピュータ装置上で実現される改良さ
れたパターン認識方法を提供する。この方法は、入力さ
れた画像データに含まれる画素形成パターンを検出する
ステップと、検出された画素形成パターンにおける画素
の延びに対応した有効線分要素を抽出するステップと、
抽出された有効線分要素間の相対配置を調べて、前記画
素形成パターンにおける規則性線分図形と該規則線分図
形をグループ化してなるアイテムの少なくとも一方及び
その組合せ態様を特定するステップと、特定された組合
せ態様に対応するパターン情報を認識結果として出力す
るステップと、を少なくともこの順にコンピュータ装置
上で実行することを特徴とする。
【0007】この方法において、アイテムは、理想的な
構成態様の標準アイテムと、この標準アイテムからの変
形範囲が段階的に異なる複数の変形アイテムとを含む。
この場合、各変形アイテムには、前記変形範囲を定量化
した情報が付加される。
【0008】本発明は、また、上記方法の実施に適した
パターン認識装置をも提供する。このパターン認識装置
は、認識対象となる画素形成パターンを含む画像データ
を入力する画像データ入力手段と、入力された画像デー
タから前記画素形成パターンの存在が予想されるパター
ン領域を検出して該パターン領域における画素の延びに
対応する有効線分要素を抽出する線分抽出手段と、抽出
した有効線分要素間の相対配置を調べて、その相対配置
から前記パターン領域内の規則性線分図形と該規則線分
図形をグループ化してなるアイテムの少なくとも一方及
びその組合せ態様を特定するパターン特定手段と、予め
規則性線分図形とアイテムの少なくとも一方及びその組
合せ態様を所定のカテゴリと対応付けて蓄積したパター
ン認識辞書と、前記パターン特定手段により特定された
組合せ態様と前記パターン認識辞書の蓄積情報とを照合
する照合手段と、を備えるものである。
【0009】前記線分抽出手段は、例えば、前記画像デ
ータから画像形成パターンの存在が推定される領域を検
出してパターン領域のサイズを確定する領域確定部と、
サイズが確定した個々のパターン領域に含まれる画素の
延びを線分要素に変換する線分変換部と、変換された線
分要素から有効線分要素のみを抽出する線分選択部と、
を備えるように構成する。
【0010】また、前記照合手段は、例えば、前記パタ
ーン特定手段により特定された組合せ態様に一致する蓄
積情報が前記パターン認識辞書に存在するときは対応す
るカテゴリを前記画素形成パターンの認識結果として索
出するとともに、前記特定された組合せ態様に一致する
蓄積情報が存在しないときは前記組合せ態様を当該画素
形成パターンに対応する新たなカテゴリと共に前記パタ
ーン認識辞書に蓄積するように構成する。なお、一致性
の判定は、前記パターン領域における規則性線分図形や
アイテムの相対的位置が同一となる組合せ態様が前記パ
ターン認識辞書の蓄積情報に含まれているか否かにより
判定することが好ましい。
【0011】本発明は、また、コンピュータ装置によっ
て読み取られ、該コンピュータ装置によって実行される
命令群を実体化して、パターン認識についての処理ステ
ップを前記コンピュータ装置上で実現する命令記憶媒体
をも提供する。命令記憶媒体における前記処理ステップ
は、前記コンピュータ装置に入力された画像データに含
まれる画素形成パターンを検出するステップと、検出さ
れた画素形成パターンにおける画素の延びに対応した有
効線分要素を抽出するステップと、抽出された有効線分
要素間の相対配置を調べて、前記画素形成パターンにお
ける規則性線分図形と該規則線分図形をグループ化して
なるアイテムの少なくとも一方及びその組合せ態様を特
定するステップと、特定された組合せ態様に対応するパ
ターン情報を認識結果として出力するステップとを含む
ことを特徴とする。
【0012】
【発明の実施の形態】以下、本発明を文字認識装置に適
用した場合の実施の形態を図面を参照して詳細に説明す
る。但し、これは本発明の適用範囲を限定するものでは
ない。図1は、本実施形態に係る文字認識装置のブロッ
ク構成図である。この文字認識装置は、情報蓄積手段を
備えたコンピュータ装置上に、画像データ入力部10、
線分抽出部11、パターン特定部12、文字認識辞書1
3、照合部14、及び認識結果出力部15の機能ブロッ
クを形成してなる。各機能ブロックは、予め命令記憶手
段に記憶された命令群(プログラムと必要なデータ)に
従って、コンピュータ装置のマイクロプロセッサユニッ
トが所要の処理を実行することにより形成される。な
お、上述の命令群は、コンピュータ装置が読取可能且つ
コンピュータ装置によって実行可能な形態で、フレキシ
ブルディスクやCD−ROM(コンパクトディスク型R
OM)上に物理的に実体化したものであってもよい。ま
た、命令群の始点と終点とが明確で取引単位として把握
できる場合は、通信媒体上で実体化されるものであって
もよい。
【0013】まず、上記文字認識装置における各部の機
能ないし動作について説明する。画像データ入力部10
は、例えばスキャナから認識対象となる文字パターンを
含む画像データをページ単位で取り込む。イメージスキ
ャナに代えて、あるいはイメージスキャナと共に、磁気
ディスクやCD−ROM等の媒体に格納された画像デー
タを取り込むようにしてもよい。また、ポインティング
デバイスによって手書き文字画像を実時間で入力するよ
うにしてもよい。
【0014】線分抽出部11では、領域確定部111に
おいて、画像データ入力部10で取り込んだ画像データ
のサイズを縮小して文字の存在が予想される領域を画素
の連続性の有無を基準に探索する。文字の存在が予想さ
れる領域を検出した場合は、その領域の基準位置、例え
ば中心部を起点に領域拡大して文字領域のサイズを確定
する。そして、サイズが確定した個々の文字領域に含ま
れる画素の延びを線分変換部112で線分要素に変換す
る。個々の線分要素をエレメントと称する。変換された
エレメントの中には文字の認識に必ずしも必要とされな
い冗長成分が含まれているので、線分選択部113で有
効エレメントのみを抽出する。
【0015】パターン特定部12では、線分抽出部11
により抽出された有効エレメント間の相対配置を調べ
て、文字領域内の規則性線分要素及びアイテムの組合せ
態様(パターン)を特定する。規則性線分要素及びアイ
テムについては後述する。文字認識辞書13には、予
め、規則性線分図形やアイテムの組合せ態様を表す情報
と、各情報に対応するカテゴリとが格納されている。カ
テゴリは例えば特定の文字フォントに対応するJISコ
ードである。照合部14は、パターン特定部12で特定
された組合せ態様と文字認識辞書13内の組合せ態様と
の照合を行う。そして、対応する組合せ態様が存在する
ときは、該当するカテゴリを当該画素形成パターンの認
識結果としてパターン認識辞書13より索出する。一
方、対応する組合せ態様とカテゴリが存在しないとき
は、パターン特定部12で特定された組合せ態様とそれ
に対応するカテゴリを当該画素形成パターンに対応する
新たな情報として文字認識辞書13に蓄積する。文字認
識辞書13から索出されたカテゴリは、認識結果出力部
15へ出力される。認識結果出力部15は、このカテゴ
リを図示しない表示装置へ送出して画面表示させ、ある
いはプリンタ装置へ送出して印刷を行わせる。
【0016】次に、本実施形態で用いる規則性線分図形
とアイテムについて詳述する。規則性線分図形は、複数
のエレメントが一定の規則をもって集合した図形であ
り、例えば図2(a)に示すように、始点線分または終
点線分の単独要素からなる「端点」、同(b)に示すよ
うに、隣接の線分要素が連続する「連続」、同(c)に
示すように、対角線上に存する隣接の線分要素が互いに
所定角をもつ「角」等からなる。この「角」からは、左
上向き、右上向き、左下向き、右下向きのくの字形「括
弧」を形成することができる。これらの規則性線分図形
の組合せによって全ての文字(狭義の文字、数字、記号
を含む)を表現することができる。しかし、規則性線分
図形のみの場合は、組合せ態様数が非常に多くなるた
め、本実施形態では、一定規則のもとで複数の規則性線
分図形を纏めてグループ化し、これをアイテムとして使
用する。そして、アイテムのみ、あるいはアイテムと規
則性線分図形の組合せを文字の構成要素として用いる。
なお、組合せ態様数を問題としない位メモリ容量を確保
することができ、その認識処理の際に高速のマイクロプ
ロセッサユニットを使用できる場合は、規則性線分図形
のみの組合せ態様のみを使用してもよいのは勿論であ
る。
【0017】ここでいうアイテムは、例えば数字や漢字
等の文字構造の共通特徴部分を規則性線分図形の組合せ
によって模式化したものであり、その例としては、「閉
合」、「交差」、「連続」等が挙げられる。「閉合」は
一対の「括弧」の内角が対向するアイテムであり、図3
(a)に示すように、左下向き括弧と右上向き括弧の対
からなる第1閉合、右下向き括弧と左上向き括弧の対か
らなる第2閉合、下向き括弧と上向き括弧の対からなる
第3閉合、及び右向き括弧と左向き括弧の対からなる第
4閉合がある。また、「交差」は一対の「括弧」の内角
が背反するアイテムであり、図3(b)に示すように、
左上向き括弧と右下向き括弧との交差対からなる第1交
差、右上向き括弧と左下向き括弧の交差対からなる第2
交差、上向き括弧と下向き括弧との交差対からなる第3
交差、及び左向き括弧と右向き括弧の交差対からなる第
4交差がある。「連続」は一対の規則性線分図形や他の
アイテムが縦横あるいは対角領域で連なるアイテムであ
る。図3(c)はこの「連続」の例を示すものであり、
端点が連続する場合は、規則性線分図形の「連続」と同
一となる。
【0018】本実施形態では、上記アイテムの一部構成
要素を変形した変形アイテムを必要に応じて用いる。変
形アイテムにおける変形の度合いは、図3(a)〜
(c)に示した標準アイテムを満点とした場合の減点度
合いで表す。例えば満点を100点としたときの閉合や
交差のうち、一方の括弧を除いた変形アイテムは50点
減点、一方の括弧を端点に置き換えた変形アイテムは3
0点減点、括弧の一方の線分の長さを他方の線分よりも
長くした変形アイテムについては10点減点、・・・と
いう具合である。
【0019】このようなアイテム及び規則性線分図形を
併用して表現した数字の例を図4に示す。図4におい
て、数字「1」は、文字領域の鉛直方向に並ぶ「連続」
とその上下端の「端点」の組合せにより表される。ま
た、数字「2」は、文字領域の右上部の左下向き括弧
(50点の第2閉合)と左下部の右上向き括弧(50点
の第2閉合)とを斜め方向の「連続」で連結した組合せ
により表される。なお、数字「2」については100点
の「第2閉合」と斜め方向の「連続」との組合せのよう
に把握することもできる。数字「3」は、文字領域の上
部の右下向き括弧(50点の第2閉合)と下部の左上向
き括弧(50点の第1閉合)とを鉛直方向の「連続」で
連結した組合せにより表される。他の数字についても同
様に各アイテムや規則性線分図形の組合せにより表され
る。なお、数字「5」は数字「2」と括弧」と「連続」
の向きのみが異なる。また、本実施形態では、数字
「2」、「3」、「5」、「6」、「7」にみられるよ
うに、左方向または右方向が開いた括弧を含む数字につ
いては、それぞれの括弧の端部に他方向に開く括弧が存
在し、さらに当該他方向に開く括弧の端部に「端点」が
存在するものも同一の数字として表すものとする。
【0020】図5は漢字の例であり、カテゴリ、分解
図、及びアイテム等の組合せ態様をそれぞれ対応付けて
示したものである。図5において、漢字の「田」は「第
1または第2閉合」とその内部の「交差」との組合せ、
「回」は外部及び内部の二つの「第1または第2閉合」
の組合せ、「囲」は「第1または第2閉合」とその内部
で対角配置された二つの「交差」との組合せ、「国」は
「第1または第2閉合」とその内部の斜め「交差」とこ
の斜め「交差」の上下に位置する「端点」との組合せに
よりそれぞれ表される。「拍」は、文字領域の左側上下
で連続する二つの「交差」と、文字領域の右側中央部の
「第1または第2閉合」とその内部及び上部に位置する
「端点」との組合せより表される。なお、以上はいずれ
も満点のアイテムの組合せの例であるが、他の漢字に間
違える心配がない場合は、その一部が減点要素のあるア
イテムに置き換わっていても同一の漢字として取り扱
う。この関係を図6に示す。
【0021】図6に示す例では、「閉合」の内部の「交
差」において括弧の一つが欠けていたり(50点の交差
アイテム)、括弧の一つが端点に置き換わっていても
(70点の交差アイテム)、他に類似の組合せがない場
合は、満点の場合と同様、「国」や「回」、あるいは
「抗」として取り扱う。このような取り扱いについて
は、他の漢字の場合も同様である。
【0022】また、括弧の数をなるべく少なくして処理
の高速化を図るとともに、図6のような例外パターンを
避けるような組合せも可能である。図7はこの例を示す
ものである。例えば、「囲」という漢字の場合、図5に
示した組合せのほかに、「第1または第2閉合」の内部
に二本の横方向「連続」と二本の縦方向「連続」が存在
する組合せが可能である。「国」や「抗」、あるいは
「唐」の場合も、括弧の代わりに複数の「連続」の組合
せを置き換えることが可能である。
【0023】図4〜図7に示した規則性線分図形やアイ
テムの組合せ態様を表す情報(上記数値情報を含む)
は、各情報に対応するカテゴリと共に文字辞書13に格
納されて使用される。
【0024】次に、上記のように構成される文字認識装
置の動作手順を具体的に説明する。まず、図8の手順説
明図及び図9の画像説明図を参照して領域確定部111
の処理内容を説明する。いま、図9(a)に示すよう
に、サイズや位置がまちまちな複数の文字を含む画像デ
ータが入力されたとする。領域確定部111では、この
画像データの全探索領域を、例えば16分の1、あるい
は24分の1に縮小して複数のドット領域を形成すると
ともに(S101)、個々のドット領域における画素デ
ータの有無を0(無)、1(有)に置き換えて画像デー
タ毎のドットマップを生成する(S102)。図9
(b)はドットマップのイメージ図であり、文字の存在
領域がドットの拡がりによって把握することができるよ
うになっている。このドットマップは、図示しないメモ
リ上に保持される。
【0025】領域確定部111は、上記ドットマップを
参照して文字の存在が推定される領域を特定する(S1
03)とともに、文字領域の基準位置、例えば中心部を
割り出す(S104)。そして中心部を起点として領域
拡大して個々の文字のサイズを確定する(S105)。
拡大は画素データ有りの領域が連続する範囲で行われ
る。図9(c)は先頭文字「あ」について確定された文
字領域の例を示すものである。このようにして領域確定
を行うことにより、サイズの異なる文字が混在している
場合であっても容易に文字領域の確定を行うことができ
る。確定した領域内の画素は、それぞれ線分変換部11
2でエレメントに変換された後、線分選択部113でそ
の有効成分のみが抽出される。その後、有効エレメント
の相対配置に基づいてアイテムと規則性線分図形の組合
せ態様が特定される。
【0026】図10は線分変換部112、線分選択部1
13、及びパターン特定部12における処理の手順説明
図であり、図11は、各処理過程におけるデータの内容
説明図である。
【0027】線分変換部112では、画素データが文字
領域単位に入力された場合(S201)、その文字領域
内の画素の延びをエレメントに変換する(S202)。
具体的には、図9(a)に示すように、画素をその延び
の方向が変化する度にベクトル化して長さ成分と向きを
もつエレメントを生成する。線分選択部114は、生成
された各エレメントを横方向のエレメント(横線エレメ
ント)、縦方向のエレメント(縦線エレメント)、縦横
に交差する複数のエレメント(縦横線エレメント)に分
類して画像データ毎のラインリストを線分選択部113
とパターン特定部12が解読可能な形式で作成する(S
203)。
【0028】ラインリストには各エレメントの存在する
X,Y座標、エレメントの延びの方向、及び文字のエレ
メントとして存在し得る確率値を含むようにする。ここ
で文字のエレメントとして存在し得る確率値とは、近接
する複数のエレメントのうち、どれが文字の構成要素と
してより有効かどうかを定量化したものであり、例えば
近接のエレメント間の距離や個々のエレメントの長さを
指標にすることができる。具体的には、比較的長めのエ
レメントは「連続」に相当する可能性があるので、上記
確率値を相対的に大きくする。また、短めのエレメント
であっても、その近くに「連続」に相当する横線エレメ
ントか縦線エレメントのいずれかが存在する場合は「端
点」に相当する可能性があるので、上記確率値を高めに
する。これに対し、縦横線エレメントのような複雑なエ
レメントの場合は、それを単純化するために、先に引か
れたエレメントの確率値を相対的に高くする。
【0029】線分選択部113は、ラインリストを参照
して確率値が所定のしきい値を越えるエレメントを有効
エレメントとして抽出する(S204)。つまり、それ
以外のエレメントは、ノイズ成分であるとして除外され
る。パターン特定部12は、抽出された有効エレメント
とその延びの方向、位置をラインリストより読み出し、
規則性線分図形とアイテムの配置、及びそれらの組合せ
態様を特定する(S205)。図11(a)のようなエ
レメント群からは、同(b)に示すように、上部中央に
位置する第1交差、下部左下に位置する第4交差、下部
右下に位置する第2閉合、第2閉合の下部に位置する端
点の組合せ態様が特定される。この特定された組合せ態
様は、例えば同(c)に示されるように、文字領域にお
ける個々の規則性線分図形とアイテムの相対的位置情報
の対情報として照合部14に渡される。
【0030】照合部14では、上記対情報と文字認識辞
書13内の蓄積情報とを比較照合する。そして、文字認
識辞書13内に対情報と一致するものがあれば、それに
対応するカテゴリ(フォント)を認識結果として索出
し、これを出力部15へ送る。照合部14における一致
性の判定は、文字領域における規則性線分図形やアイテ
ムの相対的位置が同一か否かによって行う。つまり、文
字の形状や大きさではなく、文字の構造に着目して、規
則性線分図形やアイテム(変形アイテムを含む)が所定
領域に存在しているか否かによって行う。文字の構造
は、フォントの形状が変わっても、あるいは手書きであ
っても共通なので、認識対象となる文字の書き方には拘
束されない。また、一部に文字の構成要素が欠落した場
合であっても、それが規則性線分図形やアイテムの特徴
を著しく損ねる場合を除き、問題とされない。なお、文
字認識辞書13内の変形アイテムに、標準アイテムから
の変形度合いを表す数値情報が付加されている場合は、
認識結果となるカテゴリと共にその数値情報も索出し、
これを画面表示等によって操作者に報知する。
【0031】一方、比較照合の結果、該当する蓄積情報
が存在しない場合は、その旨と対情報を登録するか否か
を問うメッセージを出力し、操作者に報知する。操作者
から登録が選択された場合は、今回の認識結果をそれに
対応するカテゴリと共に文字認識辞書13に蓄積する。
新たに蓄積された情報は、次回の文字認識の際に使用さ
れる。
【0032】このように本実施形態の文字認識装置で
は、文字の構造に着目した規則性線分図形とアイテムの
組合せ態様を表す情報によって当該文字の認識がなされ
るので、文字の位置や大きさ、活字/手書きの種別、文
字の形成要素の一部欠落の有無を問わず、認識解析の対
象にすることが可能になる。また、解析手法自体に、ノ
イズ除去処理が含まれているので、特別なノイズ除去の
ための前処理手段が不要になり、構成の簡略化が可能に
なる。さらに、イメージ処理を殆ど伴わないので、従来
装置よりも処理量が格段に低減される。
【0033】なお、以上は、認識対象となるパターンが
文字の場合の例であるが、本発明は、文字認識装置以外
にも、図形認識や色相認識、あるいはシルエット認識に
も同様に適用することができる。また、パーソナルコン
ピュータを利用した”外界認識システムの構築も本発明
によっれば可能になる。この外界認識システムは、例え
ば画像データ中に含まれる対象物(人物や物体)を簡易
且つ高速に認識して、人間の視覚機能をコンピュータ装
置上で実現して従来にない制御システムを実現するもの
である。
【0034】
【発明の効果】以上の説明から明らかなように、本発明
によれば、認識対象となるパターンの形状、サイズ、位
置を問わず、また、パターンの形成要素の一部が欠落し
ているか否かを問わず、高精度且つ高速のパターン認識
が簡易な装置構成によって実現される、という特有の効
果がある。
【図面の簡単な説明】
【図1】本発明の一実施形態に係る文字認識装置のブロ
ック構成図。
【図2】規則性線分図形の説明図であり、(a)は「端
点」、(b)は「連続」、(c)は「角」の例を示すも
のである。
【図3】規則性線分図形の組合せからなるアイテムの説
明図であり、(a)は「閉合」、(b)「交差」、
(c)は「連続」の例を示すものである。
【図4】規則性線分図形及びアイテムを併用して表現し
た数字の説明図。
【図5】規則性線分図形及びアイテムを併用して表現し
た漢字の説明図。
【図6】組合せ態様の例外パターンを示す説明図。
【図7】漢字の他の組合せの例を示す説明図。
【図8】領域確定部における処理の手順説明図。
【図9】(a)はサイズや位置がまちまちな複数の文字
を含む画像データの例、(b)は画像データを縮小して
得たドットマップのイメージ例、(c)は先頭文字
「あ」について確定された文字領域の例を示すものであ
る。
【図10】線分変換部、線分選択部、及びパターン特定
部における組合せ態様の特定処理の手順説明図。
【図11】組合せ態様の特定処理過程におけるデータの
内容説明図であり、(a)は文字「あ」に対応する画素
データをベクトル化した状態を示す図、(b)は文字
「あ」より特定されるアイテムとその相対的配置を示す
図、(c)は特定された組合せ態様を表す対情報の例を
示す図である。
【符号の説明】
10 画像データ入力部 11 線分抽出部 12 パターン特定部 13 文字認識辞書 14 照合部 15 認識結果出力部

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】 コンピュータ装置を用いたパターン認識
    方法であって、 入力された画像データに含まれる画素形成パターンを検
    出するステップと、 検出された画素形成パターンにおける画素の延びに対応
    した有効線分要素を抽出するステップと、 抽出された有効線分要素間の相対配置を調べて、前記画
    素形成パターンにおける規則性線分図形と該規則線分図
    形をグループ化してなるアイテムの少なくとも一方、及
    びその組合せ態様を特定するステップと、 特定された組合せ態様に対応するパターン情報を認識結
    果として出力するステップと、を少なくともこの順に前
    記コンピュータ装置上で実行することを特徴とするパタ
    ーン認識方法。
  2. 【請求項2】 前記アイテムは、理想的な構成態様の標
    準アイテムと、この標準アイテムからの変形範囲が段階
    的に異なる複数の変形アイテムとを含み、各変形アイテ
    ムには、前記変形範囲を定量化した情報が付加されるこ
    とを特徴とする請求項1記載のパターン認識方法。
  3. 【請求項3】 認識対象となる画素形成パターンを含む
    画像データを入力する画像データ入力手段と、 入力された画像データから前記画素形成パターンの存在
    が予想されるパターン領域を検出して該パターン領域に
    おける画素の延びに対応する有効線分要素を抽出する線
    分抽出手段と、 抽出した有効線分要素間の相対配置を調べて、その相対
    配置から前記パターン領域内の規則性線分図形と該規則
    線分図形をグループ化してなるアイテムの少なくとも一
    方、及びその組合せ態様を特定するパターン特定手段
    と、 予め規則性線分図形とアイテムの少なくとも一方、及び
    その組合せ態様を所定のカテゴリと対応付けて蓄積した
    パターン認識辞書と、 前記パターン特定手段により特定された組合せ態様と前
    記パターン認識辞書の蓄積情報とを照合する照合手段
    と、 を備えることを特徴とするパターン認識装置。
  4. 【請求項4】 前記線分抽出手段は、前記画像データか
    ら画像形成パターンの存在が推定される領域を検出して
    パターン領域のサイズを確定する領域確定部と、サイズ
    が確定した個々のパターン領域に含まれる画素の延びを
    線分要素に変換する線分変換部と、変換された線分要素
    から有効線分要素のみを抽出する線分選択部と、を有す
    ることを特徴とする請求項3記載のパターン認識装置。
  5. 【請求項5】 前記照合手段は、前記パターン特定手段
    により特定された組合せ態様に一致する蓄積情報が前記
    パターン認識辞書に存在するときは対応するカテゴリを
    前記画素形成パターンの認識結果として索出するととも
    に、前記特定された組合せ態様に一致する蓄積情報が存
    在しないときは前記組合せ態様を当該画素形成パターン
    に対応する新たなカテゴリと共に前記パターン認識辞書
    に蓄積することを特徴とする請求項3記載のパターン認
    識装置。
  6. 【請求項6】 前記照合手段は、前記パターン領域にお
    ける規則性線分図形やアイテムの相対的位置が同一とな
    る組合せ態様が前記パターン認識辞書の蓄積情報に含ま
    れているか否かにより前記一致性を判定することを特徴
    とする請求項5記載のパターン認識装置。
  7. 【請求項7】 コンピュータ装置によって読み取られ、
    該コンピュータ装置によって実行される命令群を実体化
    して、パターン認識についての処理ステップを前記コン
    ピュータ装置上で実現する命令記憶媒体であって、 前記処理ステップは、 前記コンピュータ装置に入力された画像データに含まれ
    る画素形成パターンを検出するステップと、 検出された画素形成パターンにおける画素の延びに対応
    した有効線分要素を抽出するステップと、 抽出された有効線分要素間の相対配置を調べて、前記画
    素形成パターンにおける規則性線分図形と該規則線分図
    形をグループ化してなるアイテムの少なくとも一方及び
    その組合せ態様を特定するステップと、 特定された組合せ態様に対応するパターン情報を認識結
    果として出力するステップとを含むことを特徴とする命
    令記憶媒体。
JP8171447A 1996-07-01 1996-07-01 パターン認識方法及び装置 Expired - Fee Related JP3069771B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8171447A JP3069771B2 (ja) 1996-07-01 1996-07-01 パターン認識方法及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8171447A JP3069771B2 (ja) 1996-07-01 1996-07-01 パターン認識方法及び装置

Publications (2)

Publication Number Publication Date
JPH1021339A true JPH1021339A (ja) 1998-01-23
JP3069771B2 JP3069771B2 (ja) 2000-07-24

Family

ID=15923285

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8171447A Expired - Fee Related JP3069771B2 (ja) 1996-07-01 1996-07-01 パターン認識方法及び装置

Country Status (1)

Country Link
JP (1) JP3069771B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6826354B2 (en) 1998-10-15 2004-11-30 Fujitsu Limited Buffer control method and buffer control device

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6826354B2 (en) 1998-10-15 2004-11-30 Fujitsu Limited Buffer control method and buffer control device

Also Published As

Publication number Publication date
JP3069771B2 (ja) 2000-07-24

Similar Documents

Publication Publication Date Title
JP3345224B2 (ja) パターン抽出装置、パターン再認識用テーブル作成装置及びパターン認識装置
EP1374148B1 (en) Method and device for recognition of a handwritten pattern
US5579408A (en) Character recognition method and apparatus
JPH11120293A (ja) 文字認識/修正方式
JPH03161891A (ja) 表形式文書読取装置
US6282316B1 (en) Image processing method and apparatus that use handwritten gestures for editing
JPH1011531A (ja) 帳票読取装置
US6947596B2 (en) Character recognition method, program and recording medium
JPH11161736A (ja) 文字認識方法
JP3069771B2 (ja) パターン認識方法及び装置
JP5455364B2 (ja) 情報処理装置及び軌跡データ認識方法
JP3977473B2 (ja) 手書き文字認識方法及び手書き文字認識装置
CN112183538B (zh) 一种满文识别方法及系统
JP3066530B2 (ja) オンライン手書文字認識装置
JP3507720B2 (ja) オンライン手書き文字認識装置及びコンピュータ読み取り可能な記録媒体
JP2001092924A (ja) パターン認識方法および装置
JP2519782B2 (ja) 文字分離方式
JP2677271B2 (ja) 文字認識装置
JP2962911B2 (ja) 文字認識装置
JPH06195519A (ja) 文字認識装置および文字認識方法
JP3017899B2 (ja) 個人識別装置および方法
JP3725944B2 (ja) 文字認識装置
JP2851865B2 (ja) 文字認識装置
JP3138665B2 (ja) 手書き文字認識方式および記録媒体
JPH03214350A (ja) 部首検索方法

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees