JPH06274694A - 文字認識方法 - Google Patents
文字認識方法Info
- Publication number
- JPH06274694A JPH06274694A JP5058433A JP5843393A JPH06274694A JP H06274694 A JPH06274694 A JP H06274694A JP 5058433 A JP5058433 A JP 5058433A JP 5843393 A JP5843393 A JP 5843393A JP H06274694 A JPH06274694 A JP H06274694A
- Authority
- JP
- Japan
- Prior art keywords
- character
- data
- vertical phase
- series
- code
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Character Discrimination (AREA)
Abstract
(57)【要約】
【目的】 辞書の作成を容易にする。
【構成】 2値化処理部1は画像データを2値化し、ラ
ンレングスデータ生成部2は2値化された画像データか
らランレングスデータを作成し、縦位相表現データ生成
部3は、縦位相表現を作成する。中分類条件生成部4
は、縦位相表現におけるランの位置を用いて中分類条件
を生成する。方向コード生成部5は、部分輪郭に対して
方向コードを生成する。生成された方向コードが文字認
識部7に渡され、文字認識部7では、方向コードをn次
元ベクトルとみなして複合類似度法を用いて認識処理す
る。
ンレングスデータ生成部2は2値化された画像データか
らランレングスデータを作成し、縦位相表現データ生成
部3は、縦位相表現を作成する。中分類条件生成部4
は、縦位相表現におけるランの位置を用いて中分類条件
を生成する。方向コード生成部5は、部分輪郭に対して
方向コードを生成する。生成された方向コードが文字認
識部7に渡され、文字認識部7では、方向コードをn次
元ベクトルとみなして複合類似度法を用いて認識処理す
る。
Description
【0001】
【産業上の利用分野】本発明は、辞書作成を容易にした
文字認識方法に関する。
文字認識方法に関する。
【0002】
【従来の技術】2値化された文字画像を認識する方法に
おいて、本出願人は先に、2値化された画像データから
行毎にランデータを生成し、隣接する行間のランデータ
パターンが異なる一対の行(位相変化ペア)を抽出し、
該一対の行の連なりによって線図形を表現し(縦位相表
現)、該縦位相表現を用いて文字を認識する方法を提案
した(特願平4−46574号)。この縦位相表現を用
いた方法は、画素全体に対してノイズ除去を行っていた
従来の方法に比べて、圧縮された非常に少ないデータ上
でノイズ除去(前掲した出願では、これをつの削り処理
という)が行えるので、高速であるという利点がある。
おいて、本出願人は先に、2値化された画像データから
行毎にランデータを生成し、隣接する行間のランデータ
パターンが異なる一対の行(位相変化ペア)を抽出し、
該一対の行の連なりによって線図形を表現し(縦位相表
現)、該縦位相表現を用いて文字を認識する方法を提案
した(特願平4−46574号)。この縦位相表現を用
いた方法は、画素全体に対してノイズ除去を行っていた
従来の方法に比べて、圧縮された非常に少ないデータ上
でノイズ除去(前掲した出願では、これをつの削り処理
という)が行えるので、高速であるという利点がある。
【0003】縦位相表現を用いた文字認識方法について
簡単に説明すると、2値化された画像データ(図7)
は、位相変化ペア21〜24で構成された縦位相に表現
される(図8の25)。
簡単に説明すると、2値化された画像データ(図7)
は、位相変化ペア21〜24で構成された縦位相に表現
される(図8の25)。
【0004】縦位相表現の接続状態情報を一つの文字列
で表現したものを、縦位相表現におけるトポロジーコー
ドといい、“モデル”とも呼ばれる。分類は、モデルが
辞書にあるものと同一か否かを判定することにより行
う。図9には、10種類のトポロジーコード(ただし、
その他のコード*を含む)を示す。例えば、数字「2」
については、d,A,pI,pとなる(図10)。先に
提案した文字認識方法では、縦位相表現のトポロジーコ
ードの組み合わせによって文字を大分類した。
で表現したものを、縦位相表現におけるトポロジーコー
ドといい、“モデル”とも呼ばれる。分類は、モデルが
辞書にあるものと同一か否かを判定することにより行
う。図9には、10種類のトポロジーコード(ただし、
その他のコード*を含む)を示す。例えば、数字「2」
については、d,A,pI,pとなる(図10)。先に
提案した文字認識方法では、縦位相表現のトポロジーコ
ードの組み合わせによって文字を大分類した。
【0005】しかしながら、図11に示すような文字を
認識する場合、文字“6”,“4”,“0”のいずれも
同一のトポロジーコード(d,Id,IA,VI,V,
p)となるので、縦位相表現のトポロジーコードを用い
るだけでは不十分であった。このように、縦位相表現の
トポロジーコードは、文字の大分類までしか行うことが
できず、したがって更に詳細に分類を行う必要がある。
認識する場合、文字“6”,“4”,“0”のいずれも
同一のトポロジーコード(d,Id,IA,VI,V,
p)となるので、縦位相表現のトポロジーコードを用い
るだけでは不十分であった。このように、縦位相表現の
トポロジーコードは、文字の大分類までしか行うことが
できず、したがって更に詳細に分類を行う必要がある。
【0006】このような点を解決した文字認識方法とし
て、本出願人は、giデータを用いた文字認識方法およ
び方向コードを用いた文字認識方法を既に提案した(特
願平4−52213号)。すなわち、giデータによる
分類は、縦位相表現から容易に得られる量(数値)の情
報を用いて行う分類であり、縦位相表現に含まれている
位相変化ペアの高さ情報と、縦位相表現の示すランの位
置情報を用いる。そして、分類は、閾値による分類を組
み合わせた簡単な論理式によって行われる。
て、本出願人は、giデータを用いた文字認識方法およ
び方向コードを用いた文字認識方法を既に提案した(特
願平4−52213号)。すなわち、giデータによる
分類は、縦位相表現から容易に得られる量(数値)の情
報を用いて行う分類であり、縦位相表現に含まれている
位相変化ペアの高さ情報と、縦位相表現の示すランの位
置情報を用いる。そして、分類は、閾値による分類を組
み合わせた簡単な論理式によって行われる。
【0007】例えば、図12のトポロジーコード(d,
Id,IA,VI,V,p)を生成する文字は、98文
字であり、その内訳は文字“6”が96例、文字“0”
および文字“4”がそれぞれ1例ずつであった。そし
て、図12のモデル(d,Id,IA,VI,V,p)
において、各位相変化ペアを上から順に、gi0,gi
1,・・・gi5とし、gi5とgi4の高さの差を
a、gi1とgi0の高さの差をb、gi4とgi2の
高さの差をc、gi5とgi0の高さの差をhとしたと
き、上記したモデル(d,Id,IA,VI,V,p)
に属する98文字のデータは、a,b,c,hを用いた
次の条件によって完全に分離することができた。
Id,IA,VI,V,p)を生成する文字は、98文
字であり、その内訳は文字“6”が96例、文字“0”
および文字“4”がそれぞれ1例ずつであった。そし
て、図12のモデル(d,Id,IA,VI,V,p)
において、各位相変化ペアを上から順に、gi0,gi
1,・・・gi5とし、gi5とgi4の高さの差を
a、gi1とgi0の高さの差をb、gi4とgi2の
高さの差をc、gi5とgi0の高さの差をhとしたと
き、上記したモデル(d,Id,IA,VI,V,p)
に属する98文字のデータは、a,b,c,hを用いた
次の条件によって完全に分離することができた。
【0008】文字“6”の条件:a/h<0.15かつ
0.25≦b/h<0.80 文字“0”の条件:a/h<0.15かつb/h<0.
15 文字“4”の条件:0.25≦a/h<0.60。
0.25≦b/h<0.80 文字“0”の条件:a/h<0.15かつb/h<0.
15 文字“4”の条件:0.25≦a/h<0.60。
【0009】また、方向コードによる分類は、giデー
タを用いた方法では分類できない数字の分類を可能とす
るものであり、この方向コード(図13)は、輪郭の一
部分に対して等間隔でサンプリング点をとり、各点の傾
きをコード化して並べたものである。そして、詳細分類
は、文字認識用のオートマトンを用いて行う。
タを用いた方法では分類できない数字の分類を可能とす
るものであり、この方向コード(図13)は、輪郭の一
部分に対して等間隔でサンプリング点をとり、各点の傾
きをコード化して並べたものである。そして、詳細分類
は、文字認識用のオートマトンを用いて行う。
【0010】
【発明が解決しようとする課題】しかしながら、上記し
た詳細分類の方法では、データを参照しながらオートマ
トンの構成を考えなければならず、オートマトン作成に
多大の労力を要するという問題がある。また、上記した
方法は、オートマトンが人の直観と離れているため、オ
ートマトン作成に訓練を必要とするという欠点もある。
た詳細分類の方法では、データを参照しながらオートマ
トンの構成を考えなければならず、オートマトン作成に
多大の労力を要するという問題がある。また、上記した
方法は、オートマトンが人の直観と離れているため、オ
ートマトン作成に訓練を必要とするという欠点もある。
【0011】本発明の目的は、辞書作成を容易にした文
字認識方法を提供することにある。
字認識方法を提供することにある。
【0012】
【課題を解決するための手段】前記目的を達成するため
に、請求項1記載の発明では、2値化された画像データ
から行毎にランデータを生成し、隣接する行間のランデ
ータパターンが異なる位相変化ペアを抽出し、該位相変
化ペアにおけるランの接続状態で構成された縦位相表現
を用いて文字を認識し、さらに文字画像の輪郭の一部を
指定し、該指定された輪郭の所定位置における傾きを求
め、一連の傾き情報を用いて文字を詳細分類する文字認
識方法において、該一連の傾き情報をn次元ベクトルと
みなして複合類似度法により文字を認識することを特徴
としている。
に、請求項1記載の発明では、2値化された画像データ
から行毎にランデータを生成し、隣接する行間のランデ
ータパターンが異なる位相変化ペアを抽出し、該位相変
化ペアにおけるランの接続状態で構成された縦位相表現
を用いて文字を認識し、さらに文字画像の輪郭の一部を
指定し、該指定された輪郭の所定位置における傾きを求
め、一連の傾き情報を用いて文字を詳細分類する文字認
識方法において、該一連の傾き情報をn次元ベクトルと
みなして複合類似度法により文字を認識することを特徴
としている。
【0013】請求項2記載の発明では、前記一連の傾き
情報をn次元ベクトルとみなして、重き付き距離を用い
て文字を認識することを特徴としている。
情報をn次元ベクトルとみなして、重き付き距離を用い
て文字を認識することを特徴としている。
【0014】請求項3記載の発明では、前記一連の傾き
情報をn次元ベクトルとみなして、ニューラルネットワ
ークを用いて文字を認識することを特徴としている。
情報をn次元ベクトルとみなして、ニューラルネットワ
ークを用いて文字を認識することを特徴としている。
【0015】
【作用】2値化処理部では画像データを2値化し、ラン
レングスデータ生成部では2値化された画像データから
ランレングスデータを作成し、縦位相表現データ生成部
では、縦位相表現を作成する。中分類条件生成部は、縦
位相表現におけるランの位置を用いて中分類条件を生成
する。方向コード生成部では、部分輪郭に対して方向コ
ードを生成し、生成された方向コードが文字認識部に渡
される。文字認識部では、方向コードをn次元ベクトル
とみなして複合類似度法、重き付き距離を用いて認識処
理する。
レングスデータ生成部では2値化された画像データから
ランレングスデータを作成し、縦位相表現データ生成部
では、縦位相表現を作成する。中分類条件生成部は、縦
位相表現におけるランの位置を用いて中分類条件を生成
する。方向コード生成部では、部分輪郭に対して方向コ
ードを生成し、生成された方向コードが文字認識部に渡
される。文字認識部では、方向コードをn次元ベクトル
とみなして複合類似度法、重き付き距離を用いて認識処
理する。
【0016】
【実施例】以下、本発明の一実施例を図面を用いて具体
的に説明する。図1は、本発明の実施例のブロック構成
図である。図において、1は、画像を読み取って2値化
する2値化処理部、2は、2値化された画像データから
ランレングスデータを生成するランレングスデータ生成
部、3は、隣接する行のランレングスデータから位相変
化ペアを抽出して縦位相表現を生成する縦位相表現デー
タ生成部である。これら2値化処理部1、ランレングス
データ生成部2、縦位相表現データ生成部3は、前掲し
た出願(特願平4−46574号)に記載されたものと
同一の機能、構成を有するものである。
的に説明する。図1は、本発明の実施例のブロック構成
図である。図において、1は、画像を読み取って2値化
する2値化処理部、2は、2値化された画像データから
ランレングスデータを生成するランレングスデータ生成
部、3は、隣接する行のランレングスデータから位相変
化ペアを抽出して縦位相表現を生成する縦位相表現デー
タ生成部である。これら2値化処理部1、ランレングス
データ生成部2、縦位相表現データ生成部3は、前掲し
た出願(特願平4−46574号)に記載されたものと
同一の機能、構成を有するものである。
【0017】4は、縦位相表現におけるランの位置を用
いて中分類条件を生成する中分類条件生成部であり、縦
位相表現データとランレングスデータを参照しながら簡
単な算術式と閾値を用いて中分類条件を生成する。5
は、輪郭の一部分に対して等間隔のサンプリング点をと
り、各サンプリング点毎に輪郭の方向をコード化する方
向コード生成部である。これら中分類条件生成部4、方
向コード生成部5は、前掲した出願(特願平4−522
13号)に記載されたものと同一の機能、構成を有する
ものである(ただし、本発明では、先の出願のgiデー
タ分類部を中分類条件生成部という)。
いて中分類条件を生成する中分類条件生成部であり、縦
位相表現データとランレングスデータを参照しながら簡
単な算術式と閾値を用いて中分類条件を生成する。5
は、輪郭の一部分に対して等間隔のサンプリング点をと
り、各サンプリング点毎に輪郭の方向をコード化する方
向コード生成部である。これら中分類条件生成部4、方
向コード生成部5は、前掲した出願(特願平4−522
13号)に記載されたものと同一の機能、構成を有する
ものである(ただし、本発明では、先の出願のgiデー
タ分類部を中分類条件生成部という)。
【0018】6は、縦位相表現データを参照してつの削
り処理を行うノイズ除去部であり、縦位相表現データと
ランレングスデータに変更を加える。このノイズ除去部
は、前掲した出願(特願平4−46574号)に記載さ
れたものと同一の機能、構成を有している。7は、縦位
相表現、中分類条件、および方向コードに基づいて詳細
認識を行う文字認識部である。
り処理を行うノイズ除去部であり、縦位相表現データと
ランレングスデータに変更を加える。このノイズ除去部
は、前掲した出願(特願平4−46574号)に記載さ
れたものと同一の機能、構成を有している。7は、縦位
相表現、中分類条件、および方向コードに基づいて詳細
認識を行う文字認識部である。
【0019】図2に示す画像データを例にして、本発明
の文字認識方法について詳述する。図2に示すように、
2値化処理部1によって2値化された画像データから、
ランレングスデータ生成部2はランレングスデータを作
成し、縦位相表現データ生成部3は、このランレングス
データから前述したようにして縦位相表現を作成する。
図2の画像データの縦位相表現(トポロジーコード)
は、“d,A,V,p”となる。
の文字認識方法について詳述する。図2に示すように、
2値化処理部1によって2値化された画像データから、
ランレングスデータ生成部2はランレングスデータを作
成し、縦位相表現データ生成部3は、このランレングス
データから前述したようにして縦位相表現を作成する。
図2の画像データの縦位相表現(トポロジーコード)
は、“d,A,V,p”となる。
【0020】中分類条件生成部4は、図3に示すような
中分類条件を生成する。つまり、モデル“d,A,V,
p”に対して、x=a/bとしたとき、x<0.85
(グループ1),0.85≦x<1.25(グループ
2),1.25≦x(グループ3)によってデータを分
類する。図2に示す画像データは、“d,A,V,p”
のグループ1に分類される。
中分類条件を生成する。つまり、モデル“d,A,V,
p”に対して、x=a/bとしたとき、x<0.85
(グループ1),0.85≦x<1.25(グループ
2),1.25≦x(グループ3)によってデータを分
類する。図2に示す画像データは、“d,A,V,p”
のグループ1に分類される。
【0021】方向コード生成部5は、図4に示すよう
に、分類された“d,A,V,p”のグループ1の部分
輪郭aに対して、方向コードを生成する。この方向コー
ドとしては、“1223578434”が生成される。
に、分類された“d,A,V,p”のグループ1の部分
輪郭aに対して、方向コードを生成する。この方向コー
ドとしては、“1223578434”が生成される。
【0022】このようにして生成された方向コードが文
字認識部7に渡され、文字認識部7では、複合類似度法
を用いた方法、重み付き距離を用いた方法、ニューラル
ネットワークを用いた方法によって、認識処理する。
字認識部7に渡され、文字認識部7では、複合類似度法
を用いた方法、重み付き距離を用いた方法、ニューラル
ネットワークを用いた方法によって、認識処理する。
【0023】〈複合類似度法を用いた方法〉図5は、複
合類似度法を用いた場合の文字認識部の処理フローチャ
ートである。以下、図5を参照して認識動作を説明する
と、ステップ501では、方向コードが与えられる。コ
ードの桁数をnとする。上記した例ではコードは“12
23578434”で、n=10である。
合類似度法を用いた場合の文字認識部の処理フローチャ
ートである。以下、図5を参照して認識動作を説明する
と、ステップ501では、方向コードが与えられる。コ
ードの桁数をnとする。上記した例ではコードは“12
23578434”で、n=10である。
【0024】ステップ502では、この方向コードをn
次元ベクトルをみなし、xとする。ステップ503で
は、モデル番号k=1とする。ステップ504では、全
モデル数Nとkを比較する。モデル数は「“d,A,
V,p”の“グループ1”」のような分岐毎に定まる数
で、その分岐に落ちたデータのうち認識すべき形状パタ
ーンが何通りかを定める。この処理フローチャートで
は、ステップ504−ステップ506のループをN回ま
わることで各モデルと入力との距離を求め、それに基づ
いて認識を行う。ここでは、例えばN=10とすると、
k<Nであるので、ステップ505に進む。
次元ベクトルをみなし、xとする。ステップ503で
は、モデル番号k=1とする。ステップ504では、全
モデル数Nとkを比較する。モデル数は「“d,A,
V,p”の“グループ1”」のような分岐毎に定まる数
で、その分岐に落ちたデータのうち認識すべき形状パタ
ーンが何通りかを定める。この処理フローチャートで
は、ステップ504−ステップ506のループをN回ま
わることで各モデルと入力との距離を求め、それに基づ
いて認識を行う。ここでは、例えばN=10とすると、
k<Nであるので、ステップ505に進む。
【0025】ステップ505では、複合類似度S(k)
を図中の式に従って計算する。複合類似度については、
詳しくは例えば“IEEE Computer soc
iety Press,August30−Septe
mber3,1992.”“Proc.1st ICP
R,pp.50−56,1973.”などを参照された
い。
を図中の式に従って計算する。複合類似度については、
詳しくは例えば“IEEE Computer soc
iety Press,August30−Septe
mber3,1992.”“Proc.1st ICP
R,pp.50−56,1973.”などを参照された
い。
【0026】複合類似度は、予め定めてある固有値のう
ちM個を用いて計算される。MはM≦nの範囲で分岐毎
に適当に定められる。λi(k)は、後述する行列K
(k)の固有値であり、λ1(k)≧λ2(k)≧λ3
(k)....の順に並べ替えてあるものとする。φi
(k)は固有値λi(k)に対応する固有ベクトルであ
る。
ちM個を用いて計算される。MはM≦nの範囲で分岐毎
に適当に定められる。λi(k)は、後述する行列K
(k)の固有値であり、λ1(k)≧λ2(k)≧λ3
(k)....の順に並べ替えてあるものとする。φi
(k)は固有値λi(k)に対応する固有ベクトルであ
る。
【0027】ステップ506ではkを1増す。ここでは
k=2となり、ステップ504に戻る。このように、ス
テップ504−506のループをN回まわるとステップ
507に行く。ステップ507では、S(k)が最大と
なるkに対応するモデルを認識結果(「文字9」など)
として出力する。
k=2となり、ステップ504に戻る。このように、ス
テップ504−506のループをN回まわるとステップ
507に行く。ステップ507では、S(k)が最大と
なるkに対応するモデルを認識結果(「文字9」など)
として出力する。
【0028】上記した行列K(k)は次のようにして求
められる。学習データを人間がまず分け、「モデルkに
対応する学習データ」を作る。このデータ数をmとす
る。この作業は、通常は正答つきのデータを正答毎に分
けるだけであるので、機械的に行うことができる。この
データについてn桁の方向コードを求め、Gj(k)と
する。Gj(k)は1×nの行ベクトルである。jは1
≦j≦mの範囲のデータ番号である。K(k)は、 K(k)=(1/m)ΣGj(k)T・Gj(k) (ただし、Σはj=1からmまで) で求められる。ただし、Gj(k)TはGj(k)の転
置行列である(詳しくは前掲した論文を参照)。本実施
例では、K(k)の固有値と固有ベクトルを予め求め
て、辞書を構成している。
められる。学習データを人間がまず分け、「モデルkに
対応する学習データ」を作る。このデータ数をmとす
る。この作業は、通常は正答つきのデータを正答毎に分
けるだけであるので、機械的に行うことができる。この
データについてn桁の方向コードを求め、Gj(k)と
する。Gj(k)は1×nの行ベクトルである。jは1
≦j≦mの範囲のデータ番号である。K(k)は、 K(k)=(1/m)ΣGj(k)T・Gj(k) (ただし、Σはj=1からmまで) で求められる。ただし、Gj(k)TはGj(k)の転
置行列である(詳しくは前掲した論文を参照)。本実施
例では、K(k)の固有値と固有ベクトルを予め求め
て、辞書を構成している。
【0029】〈重み付き距離を用いた方法〉図6は、重
み付き距離を用いた場合の文字認識部の処理フローチャ
ートである。以下、図6を参照して認識動作を説明す
る。ステップ601では、方向コードが与えられる。コ
ードの桁数をnとする。上記した例ではコードは“12
23578434”で、n=10である。
み付き距離を用いた場合の文字認識部の処理フローチャ
ートである。以下、図6を参照して認識動作を説明す
る。ステップ601では、方向コードが与えられる。コ
ードの桁数をnとする。上記した例ではコードは“12
23578434”で、n=10である。
【0030】ステップ602では、各桁のコードをai
とする。この例ではa1=1,a2=2,a3=
2,...となる。ステップ603では、モデル番号k
=1とする。ステップ604では、全モデル数Nとkを
比較する。モデル数は「“d,A,V,p”の“グルー
プ1”」のような分岐毎に定まる数で、その分岐に落ち
たデータのうち認識すべき形状パターンが何通りかを定
める。ここでは、例えばN=10とすると、k<Nであ
るので、ステップ605に進む。
とする。この例ではa1=1,a2=2,a3=
2,...となる。ステップ603では、モデル番号k
=1とする。ステップ604では、全モデル数Nとkを
比較する。モデル数は「“d,A,V,p”の“グルー
プ1”」のような分岐毎に定まる数で、その分岐に落ち
たデータのうち認識すべき形状パターンが何通りかを定
める。ここでは、例えばN=10とすると、k<Nであ
るので、ステップ605に進む。
【0031】ステップ605では、重み付き距離s
(k)を計算する。ここでは、各桁毎に平均μi(k)
と標準偏差σi(k)を求めたものを辞書として構成
し、図中の式を計算する。
(k)を計算する。ここでは、各桁毎に平均μi(k)
と標準偏差σi(k)を求めたものを辞書として構成
し、図中の式を計算する。
【0032】ステップ606ではkを1増す。ここでは
k=2となり、ステップ604に戻る。このように、ス
テップ604−606のループをN回まわるとステップ
607に行く。ステップ607では、s(k)が最小と
なるkに対応するモデルを認識結果(「文字9」など)
として出力する。
k=2となり、ステップ604に戻る。このように、ス
テップ604−606のループをN回まわるとステップ
607に行く。ステップ607では、s(k)が最小と
なるkに対応するモデルを認識結果(「文字9」など)
として出力する。
【0033】ステップ605における各桁毎の平均μi
(k)と標準偏差σi(k)は次のようにして作成され
る。学習データを人間がまず分け、「モデルkに対応す
る学習データ」を作る。この作業は、通常は正答つきの
データを正答毎に分けるだけであるので、十分に機械的
に行うことができる。このデータについてn桁の方向コ
ードを求め、各桁毎に平均μi(k)と標準偏差σi
(k)を求める。本実施例では、これらの値によって辞
書を構成している。
(k)と標準偏差σi(k)は次のようにして作成され
る。学習データを人間がまず分け、「モデルkに対応す
る学習データ」を作る。この作業は、通常は正答つきの
データを正答毎に分けるだけであるので、十分に機械的
に行うことができる。このデータについてn桁の方向コ
ードを求め、各桁毎に平均μi(k)と標準偏差σi
(k)を求める。本実施例では、これらの値によって辞
書を構成している。
【0034】〈ニューラルネットワークを用いる方法〉
文字認識部7はニューラルネットで構成されている。そ
して、指定された方向コードが文字認識部7に渡され、
該方向コードに基づいてニューラルネットの手法を用い
て文字認識を行う。このように、本実施例では従来から
の方法を用いて認識処理することができる(なお、ニュ
ーラルネットを用いた文字認識方法としては、例えば特
願平1−127389号などがある)。
文字認識部7はニューラルネットで構成されている。そ
して、指定された方向コードが文字認識部7に渡され、
該方向コードに基づいてニューラルネットの手法を用い
て文字認識を行う。このように、本実施例では従来から
の方法を用いて認識処理することができる(なお、ニュ
ーラルネットを用いた文字認識方法としては、例えば特
願平1−127389号などがある)。
【0035】本発明は、上記したものに限定されるもの
ではなく、例えば上記した認識方法を組み合わせたり、
あるいは場合に応じて最適な方法を用いるなど種々の変
更が可能である。
ではなく、例えば上記した認識方法を組み合わせたり、
あるいは場合に応じて最適な方法を用いるなど種々の変
更が可能である。
【0036】
【発明の効果】以上、説明したように、請求項1、2記
載の発明によれば、サンプルデータから統計的手法を用
いて辞書を作成することができるので、辞書の作成が容
易になる。
載の発明によれば、サンプルデータから統計的手法を用
いて辞書を作成することができるので、辞書の作成が容
易になる。
【0037】請求項3記載の発明によれば、サンプルデ
ータから自動的に辞書を作成することができるので、辞
書の作成が容易になる。
ータから自動的に辞書を作成することができるので、辞
書の作成が容易になる。
【図1】本発明の実施例のブロック構成図である。
【図2】2値化された画像データの例である。
【図3】モデル“d,A,V,p”の中分類条件を説明
する図である。
する図である。
【図4】着目される部分輪郭を示す図である。
【図5】複合類似度法を用いた場合の文字認識部の処理
フローチャートである。
フローチャートである。
【図6】重み付き距離を用いた場合の文字認識部の処理
フローチャートである。
フローチャートである。
【図7】2値化された画像データである。
【図8】図7の縦位相表現図である。
【図9】トポロジーコードを示す図である。
【図10】数字2の縦位相表現とトポロジーコードを示
す図である。
す図である。
【図11】トポロジーコードのみでは文字を分類できな
い例を示す図である。
い例を示す図である。
【図12】giデータによる分類を説明する図である。
【図13】方向コードを示す図である。
1 2値化処理部 2 ランレングスデータ生成部 3 縦位相表現データ生成部 4 中分類条件生成部 5 方向コード生成部 6 ノイズ除去部 7 文字認識部
Claims (3)
- 【請求項1】 2値化された画像データから行毎にラン
データを生成し、隣接する行間のランデータパターンが
異なる位相変化ペアを抽出し、該位相変化ペアにおける
ランの接続状態で構成された縦位相表現を用いて文字を
認識し、さらに文字画像の輪郭の一部を指定し、該指定
された輪郭の所定位置における傾きを求め、一連の傾き
情報を用いて文字を詳細分類する文字認識方法におい
て、該一連の傾き情報をn次元ベクトルとみなして複合
類似度法により文字を認識することを特徴とする文字認
識方法。 - 【請求項2】 前記一連の傾き情報をn次元ベクトルと
みなして、重き付き距離を用いて文字を認識することを
特徴とする請求項1記載の文字認識方法。 - 【請求項3】 前記一連の傾き情報をn次元ベクトルと
みなして、ニューラルネットワークを用いて文字を認識
することを特徴とする請求項1記載の文字認識方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP5058433A JPH06274694A (ja) | 1993-03-18 | 1993-03-18 | 文字認識方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP5058433A JPH06274694A (ja) | 1993-03-18 | 1993-03-18 | 文字認識方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH06274694A true JPH06274694A (ja) | 1994-09-30 |
Family
ID=13084261
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP5058433A Pending JPH06274694A (ja) | 1993-03-18 | 1993-03-18 | 文字認識方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH06274694A (ja) |
-
1993
- 1993-03-18 JP JP5058433A patent/JPH06274694A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP0355748B1 (en) | A pattern recognition apparatus and method for doing the same | |
Chi et al. | ID3-derived fuzzy rules and optimized defuzzification for handwritten numeral recognition | |
JP2010134957A (ja) | パターン認識方法 | |
JPH02238588A (ja) | 文字認識装置 | |
US5689584A (en) | Method of and apparatus for pattern recognition and method of creating pattern recognition dictionary | |
JP3634574B2 (ja) | 情報処理方法及び装置 | |
CN113688715A (zh) | 面部表情识别方法及系统 | |
EP0709800A2 (en) | Method for designing classification trees | |
CN108052867A (zh) | 一种基于词袋模型的单样本人脸识别方法 | |
JPH06274694A (ja) | 文字認識方法 | |
Ramel et al. | A structural representation adapted to handwritten symbol recognition | |
JP2004094644A (ja) | 画像処理装置、画像処理方法、記憶媒体及びプログラム | |
CN111914652A (zh) | 一种基于两层自组织神经网络的人脸特征二进制编码与识别方法 | |
Cho | Recognition of unconstrained handwritten numerals by doubly self-organizing neural network | |
Niharmine et al. | Tifinagh handwritten character recognition using genetic algorithms | |
JPS5922179A (ja) | 文字認識方法 | |
JP2763033B2 (ja) | 文字認識方法 | |
Horiuchi et al. | Analysis of material representation of manga line drawings using convolutional neural networks | |
Tambouratzis | Improving the clustering performance of the scanning n-tuple method by using self-supervised algorithms to introduce subclasses | |
JPS5827550B2 (ja) | 図形認識装置 | |
JP2991750B2 (ja) | 辞書作成方法 | |
JPH11120291A (ja) | パタン認識システム | |
JP2728117B2 (ja) | 文字認識装置 | |
Zaman et al. | Image character through signal and pattern formation | |
JP2924192B2 (ja) | パターン認識装置 |