JPH05258113A - 文字認識方法 - Google Patents
文字認識方法Info
- Publication number
- JPH05258113A JPH05258113A JP4052213A JP5221392A JPH05258113A JP H05258113 A JPH05258113 A JP H05258113A JP 4052213 A JP4052213 A JP 4052213A JP 5221392 A JP5221392 A JP 5221392A JP H05258113 A JPH05258113 A JP H05258113A
- Authority
- JP
- Japan
- Prior art keywords
- data
- character
- contour
- code
- phase change
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Character Discrimination (AREA)
Abstract
(57)【要約】
【目的】 縦位相表現の特徴を失うことなく、大分類さ
れた文字グループを詳細に認識する。 【構成】 2値化処理部1は、画像を読み取って2値化
し、ランレングスデータ生成部2でランデータが生成さ
れる。縦位相表現データ生成部3では、隣接する行のラ
ンレングスデータから位相変化ペアを抽出して縦位相表
現を生成する。giデータ分類部4は、縦位相表現のト
ポロジーコードを分類し、文字認識部7は、giデータ
を用いて詳細認識する。giデータで識別できない文字
については、方向コード生成部6から出力される、輪郭
の方向をコード化した方向コードを用いて詳細認識す
る。
れた文字グループを詳細に認識する。 【構成】 2値化処理部1は、画像を読み取って2値化
し、ランレングスデータ生成部2でランデータが生成さ
れる。縦位相表現データ生成部3では、隣接する行のラ
ンレングスデータから位相変化ペアを抽出して縦位相表
現を生成する。giデータ分類部4は、縦位相表現のト
ポロジーコードを分類し、文字認識部7は、giデータ
を用いて詳細認識する。giデータで識別できない文字
については、方向コード生成部6から出力される、輪郭
の方向をコード化した方向コードを用いて詳細認識す
る。
Description
【0001】
【産業上の利用分野】本発明は、縦位相表現を用いて文
字を認識する文字認識方法に関する。
字を認識する文字認識方法に関する。
【0002】
【従来の技術】2値化された文字画像を認識する方法に
おいて、本出願人は先に、2値化された画像データから
行毎にランデータを生成し、隣接する行間のランデータ
パターンが異なる一対の行(位相変化ペア)を抽出し、
該一対の行の連なりによって線図形を表現し(縦位相表
現)、該縦位相表現を用いて文字を認識する方法を提案
した(特願平3−253186号)。この縦位相表現に
は、位相的情報である接続状態情報と、若干の量的情報
が含まれる。
おいて、本出願人は先に、2値化された画像データから
行毎にランデータを生成し、隣接する行間のランデータ
パターンが異なる一対の行(位相変化ペア)を抽出し、
該一対の行の連なりによって線図形を表現し(縦位相表
現)、該縦位相表現を用いて文字を認識する方法を提案
した(特願平3−253186号)。この縦位相表現に
は、位相的情報である接続状態情報と、若干の量的情報
が含まれる。
【0003】すなわち、2値化された画像データ(図1
9)は、位相変化ペア201〜204で構成された縦位
相に表現される(図20の205)。これはまたスタン
プ(白丸と黒丸)によっても表現される(図21)。
9)は、位相変化ペア201〜204で構成された縦位
相に表現される(図20の205)。これはまたスタン
プ(白丸と黒丸)によっても表現される(図21)。
【0004】
【発明が解決しようとする課題】縦位相表現の接続状態
情報を一つの文字列で表現したものを、縦位相表現にお
けるトポロジーコードといい、図22には、10種類の
トポロジーコード(ただし、その他のコード*を含む)
を示す。例えば、数字「2」については、d,A,p
I,pとなる(図23)。先に提案した文字認識方法で
は、縦位相表現のトポロジーコードの組み合わせによっ
て文字を大分類した。
情報を一つの文字列で表現したものを、縦位相表現にお
けるトポロジーコードといい、図22には、10種類の
トポロジーコード(ただし、その他のコード*を含む)
を示す。例えば、数字「2」については、d,A,p
I,pとなる(図23)。先に提案した文字認識方法で
は、縦位相表現のトポロジーコードの組み合わせによっ
て文字を大分類した。
【0005】しかしながら、図24に示すような文字を
認識する場合、文字“6”,“4”,“0”のいずれも
同一のトポロジーコード(d,Id,IA,VI,V,
p)となるので、縦位相表現のトポロジーコードを用い
るだけでは不十分であった。このように、縦位相表現の
トポロジーコードは、文字の大分類までしか行うことが
できず、したがって更に詳細に分類を行う必要がある。
認識する場合、文字“6”,“4”,“0”のいずれも
同一のトポロジーコード(d,Id,IA,VI,V,
p)となるので、縦位相表現のトポロジーコードを用い
るだけでは不十分であった。このように、縦位相表現の
トポロジーコードは、文字の大分類までしか行うことが
できず、したがって更に詳細に分類を行う必要がある。
【0006】本発明の目的は、縦位相表現の特徴を失う
ことなく、大分類された文字グループを詳細に認識する
方法を提供することにある。
ことなく、大分類された文字グループを詳細に認識する
方法を提供することにある。
【0007】
【課題を解決するための手段】前記目的を達成するため
に、請求項1記載の発明では、2値化された画像データ
から行毎にランデータを生成し、隣接する行間のランデ
ータパターンが異なる位相変化ペアを抽出し、該位相変
化ペアで構成された縦位相表現を用いて文字を認識する
方法において、前記縦位相表現中の所定位置のランデー
タを参照することにより、文字を詳細分類することを特
徴としている。
に、請求項1記載の発明では、2値化された画像データ
から行毎にランデータを生成し、隣接する行間のランデ
ータパターンが異なる位相変化ペアを抽出し、該位相変
化ペアで構成された縦位相表現を用いて文字を認識する
方法において、前記縦位相表現中の所定位置のランデー
タを参照することにより、文字を詳細分類することを特
徴としている。
【0008】請求項2記載の発明では、文字画像の輪郭
の一部を、位相変化ペアとランデータへのインデックス
によって指定し、該指定された輪郭の所定位置における
傾きを求め、一連の傾き情報を用いて文字を詳細分類す
ることを特徴としている。
の一部を、位相変化ペアとランデータへのインデックス
によって指定し、該指定された輪郭の所定位置における
傾きを求め、一連の傾き情報を用いて文字を詳細分類す
ることを特徴としている。
【0009】請求項3記載の発明では、前記輪郭の指定
は、位相変化ペアとランデータへのインデックスを指示
することにより行うことを特徴としている。
は、位相変化ペアとランデータへのインデックスを指示
することにより行うことを特徴としている。
【0010】
【作用】2値化処理部では、画像を読み取って2値化処
理し、ランレングスデータ生成部においてランレングス
データが生成され、縦位相表現データ生成部では、隣接
する行のランレングスデータから位相変化ペアを抽出し
て縦位相表現を生成する。giデータ分類部では、縦位
相表現のトポロジーコードを分類し、その分類データを
文字認識部に渡す。文字認識部は、giデータを用いて
文字を詳細認識する。さらに、giデータで識別できな
い文字については、プロファイル指定された輪郭の方向
をコード化した方向コードを用いて詳細認識する。
理し、ランレングスデータ生成部においてランレングス
データが生成され、縦位相表現データ生成部では、隣接
する行のランレングスデータから位相変化ペアを抽出し
て縦位相表現を生成する。giデータ分類部では、縦位
相表現のトポロジーコードを分類し、その分類データを
文字認識部に渡す。文字認識部は、giデータを用いて
文字を詳細認識する。さらに、giデータで識別できな
い文字については、プロファイル指定された輪郭の方向
をコード化した方向コードを用いて詳細認識する。
【0011】
【実施例】以下、本発明の一実施例を図面を用いて具体
的に説明する。図1は、本発明の実施例のブロック構成
図である。図において、1は、画像を読み取って2値化
する2値化処理部、2は、2値化された画像データから
ランレングスデータを生成するランレングスデータ生成
部、3は、隣接する行のランレングスデータから位相変
化ペアを抽出して縦位相表現を生成する縦位相表現デー
タ生成部である。これら2値化処理部1、ランレングス
データ生成部2、縦位相表現データ生成部3は、前掲し
た出願に記載されたものと同一の機能、構成を有するも
のである。4は、縦位相表現から得られる情報を用い
て、縦位相表現のトポロジーコードを分類するgiデー
タ分類部、5は、部分輪郭の集合を指定するプロファイ
ル指定部、6は、プロファイル指定された輪郭の一部分
に対して等間隔のサンプリング点をとり、各サンプリン
グ点毎に輪郭の方向をコード化する方向コード生成部、
7は、giデータ、方向コードを用いて詳細認識する文
字認識部である。
的に説明する。図1は、本発明の実施例のブロック構成
図である。図において、1は、画像を読み取って2値化
する2値化処理部、2は、2値化された画像データから
ランレングスデータを生成するランレングスデータ生成
部、3は、隣接する行のランレングスデータから位相変
化ペアを抽出して縦位相表現を生成する縦位相表現デー
タ生成部である。これら2値化処理部1、ランレングス
データ生成部2、縦位相表現データ生成部3は、前掲し
た出願に記載されたものと同一の機能、構成を有するも
のである。4は、縦位相表現から得られる情報を用い
て、縦位相表現のトポロジーコードを分類するgiデー
タ分類部、5は、部分輪郭の集合を指定するプロファイ
ル指定部、6は、プロファイル指定された輪郭の一部分
に対して等間隔のサンプリング点をとり、各サンプリン
グ点毎に輪郭の方向をコード化する方向コード生成部、
7は、giデータ、方向コードを用いて詳細認識する文
字認識部である。
【0012】〈giデータ分類部〉giデータ分類部4
は、縦位相表現から得られる以下(1)、(2)に記載
の情報を用いて、モデル(つまり縦位相表現のトポロジ
ーコードまたは、トポロジーコードに該当するデータ)
を分類し、文字認識部7は、該分類された文字データを
用いて詳細認識する。すなわち、 (1)縦位相表現における各位相変化ペアの行番号(つ
まり高さであり、言い替えると各スタンプに対応するラ
ンのy座標)を用いる。 (2)縦位相表現が表すランの端の横方向の位置(x座
標)を用いる。 なお、ここでの縦位相表現は、隣合う二行の他に、隣合
う二列、あるいは斜め方向に対して処理することによっ
て作成される。
は、縦位相表現から得られる以下(1)、(2)に記載
の情報を用いて、モデル(つまり縦位相表現のトポロジ
ーコードまたは、トポロジーコードに該当するデータ)
を分類し、文字認識部7は、該分類された文字データを
用いて詳細認識する。すなわち、 (1)縦位相表現における各位相変化ペアの行番号(つ
まり高さであり、言い替えると各スタンプに対応するラ
ンのy座標)を用いる。 (2)縦位相表現が表すランの端の横方向の位置(x座
標)を用いる。 なお、ここでの縦位相表現は、隣合う二行の他に、隣合
う二列、あるいは斜め方向に対して処理することによっ
て作成される。
【0013】上記(1)の各位相変化ペアの行番号を用
いた分類を具体例を挙げて説明すると、緩い筆記制限の
もとに得た約13000字の手書き数字データのうち、
図2のトポロジーコード(d,Id,IA,VI,V,
p)を生成する文字は、98文字であり、その内訳は文
字“6”が96例、文字“0”および文字“4”がそれ
ぞれ1例ずつであった。
いた分類を具体例を挙げて説明すると、緩い筆記制限の
もとに得た約13000字の手書き数字データのうち、
図2のトポロジーコード(d,Id,IA,VI,V,
p)を生成する文字は、98文字であり、その内訳は文
字“6”が96例、文字“0”および文字“4”がそれ
ぞれ1例ずつであった。
【0014】図2のモデル(d,Id,IA,VI,
V,p)において、各位相変化ペアを上から順に、gi
0,gi1,・・・gi5とする。そして、gi5とg
i4の高さの差をa、gi1とgi0の高さの差をb、
gi4とgi2の高さの差をc、gi5とgi0の高さ
の差をhとする。
V,p)において、各位相変化ペアを上から順に、gi
0,gi1,・・・gi5とする。そして、gi5とg
i4の高さの差をa、gi1とgi0の高さの差をb、
gi4とgi2の高さの差をc、gi5とgi0の高さ
の差をhとする。
【0015】上記したモデル(d,Id,IA,VI,
V,p)に属する98文字のデータは、上記したa,
b,c,hを用いた次の条件によって完全に分離するこ
とができる。 文字“6”の条件:a/h<0.15かつ0.25≦b
/h<0.80 文字“0”の条件:a/h<0.15かつb/h<0.
15 文字“4”の条件:0.25≦a/h<0.60 さらに、これらのデータは、何れも0.15≦c/h<
0.60を満たしているので、この条件を文字“6”、
文字“0”、文字“4”の確認用に用いることができ
る。図3は、モデル(d,Id,IA,VI,V,p)
を分類するフローチャートである。
V,p)に属する98文字のデータは、上記したa,
b,c,hを用いた次の条件によって完全に分離するこ
とができる。 文字“6”の条件:a/h<0.15かつ0.25≦b
/h<0.80 文字“0”の条件:a/h<0.15かつb/h<0.
15 文字“4”の条件:0.25≦a/h<0.60 さらに、これらのデータは、何れも0.15≦c/h<
0.60を満たしているので、この条件を文字“6”、
文字“0”、文字“4”の確認用に用いることができ
る。図3は、モデル(d,Id,IA,VI,V,p)
を分類するフローチャートである。
【0016】上記(2)について説明する。前述したよ
うに、縦位相表現は、スタンプによっても表すことがで
き、各スタンプに対して原図形におけるランが一意に定
まる。図4は、原図形と、その黒スタンプに対応するラ
ンを英数字で示す。そして、各ランは、1つのy座標と
2つのx座標を持つ。例えば、図4のランaは、y座標
=2、x座標=3(黒ランの左端xl),6(黒ランの
右端xr)である。
うに、縦位相表現は、スタンプによっても表すことがで
き、各スタンプに対して原図形におけるランが一意に定
まる。図4は、原図形と、その黒スタンプに対応するラ
ンを英数字で示す。そして、各ランは、1つのy座標と
2つのx座標を持つ。例えば、図4のランaは、y座標
=2、x座標=3(黒ランの左端xl),6(黒ランの
右端xr)である。
【0017】上記(2)は、各スタンプに対応するラン
のx座標(xl,xr)を用いるものである。具体例を
挙げて説明すると、緩い筆記制限のもとに得た約130
00字の手書き数字データのうち、図5のトポロジーコ
ード(d,Id,V,A,Ip,p)を生成するデータ
は、104文字あり、これらは何れも数字の“4”であ
った。
のx座標(xl,xr)を用いるものである。具体例を
挙げて説明すると、緩い筆記制限のもとに得た約130
00字の手書き数字データのうち、図5のトポロジーコ
ード(d,Id,V,A,Ip,p)を生成するデータ
は、104文字あり、これらは何れも数字の“4”であ
った。
【0018】図5のモデル(d,Id,V,A,Ip,
p)において、各位相変化ペアを上から順に、gi0,
gi1,・・・gi5とする。そして、gi3とgi2
の高さの差をa、gi5とgi0の高さの差をh、gi
4の上側の2つの黒スタンプに対応する2つの黒ランに
おいて、左側の黒ランの左端から右側の黒ランの右端ま
での距離をb(このbは、ランレングスデータの行番号
と何番目のランであるかを指定することで、直ちに分か
る)とする。
p)において、各位相変化ペアを上から順に、gi0,
gi1,・・・gi5とする。そして、gi3とgi2
の高さの差をa、gi5とgi0の高さの差をh、gi
4の上側の2つの黒スタンプに対応する2つの黒ランに
おいて、左側の黒ランの左端から右側の黒ランの右端ま
での距離をb(このbは、ランレングスデータの行番号
と何番目のランであるかを指定することで、直ちに分か
る)とする。
【0019】上記したモデル(d,Id,V,A,I
p,p)に属する104例のデータは、上記したa,
b,hを用いた次の何れの条件をも満たしていた。 a/h<0.27 0.18≦b/h<0.82 そこで、本実施例では、この条件を、数字“4”の確認
用の条件とした。
p,p)に属する104例のデータは、上記したa,
b,hを用いた次の何れの条件をも満たしていた。 a/h<0.27 0.18≦b/h<0.82 そこで、本実施例では、この条件を、数字“4”の確認
用の条件とした。
【0020】〈方向コードによる分類〉本実施例の方向
コードによる分類は、前述したgiデータを用いた方法
では分類できない「d,A,V,p」における数字
“0”と数字“4”の分類を可能とするものである。
コードによる分類は、前述したgiデータを用いた方法
では分類できない「d,A,V,p」における数字
“0”と数字“4”の分類を可能とするものである。
【0021】本実施例の方向コードとは、輪郭の一部分
に対して等間隔でサンプリング点をとり、各点の傾きを
コード化して並べたものである。輪郭のどの部分に対し
てサンプリングするか、またサンプリング点数を幾つに
するかは重要であり、本実施例では、これを後述するよ
うな方法で行うが、辞書に格納するようにしてもよい。
さらに、これら方向コードを、文字認識用のオートマト
ンを用いて分類する。
に対して等間隔でサンプリング点をとり、各点の傾きを
コード化して並べたものである。輪郭のどの部分に対し
てサンプリングするか、またサンプリング点数を幾つに
するかは重要であり、本実施例では、これを後述するよ
うな方法で行うが、辞書に格納するようにしてもよい。
さらに、これら方向コードを、文字認識用のオートマト
ンを用いて分類する。
【0022】方向コードを用いた分類における計算量
は、giデータを用いた場合よりも多くなるが、計算時
間の実測値は十分に実用的な範囲内に収まった(ランレ
ングスデータを得るのに要する時間が7.5msecの
とき、その計算時間は3msec未満であった)。
は、giデータを用いた場合よりも多くなるが、計算時
間の実測値は十分に実用的な範囲内に収まった(ランレ
ングスデータを得るのに要する時間が7.5msecの
とき、その計算時間は3msec未満であった)。
【0023】以下、「輪郭の一部」を表現する場合の本
実施例の具体的な方法、本実施例の方向コードの詳細、
方向コードを用いた認識方法について、詳述する。
実施例の具体的な方法、本実施例の方向コードの詳細、
方向コードを用いた認識方法について、詳述する。
【0024】〈プロファイル指定部〉図6は、数字
“0”と数字“4”を分離する際に着目した「輪郭の一
部」を示す図で、図6の「二重線の部分」の如く、形状
に関する情報は、その表現が難しい。これを文字列で表
現できると文字認識装置の辞書作成等が容易になり、か
つ効率良く作成することができる。本実施例では、「輪
郭の一部を表現する方法」を、以下、プロファイル指定
という。
“0”と数字“4”を分離する際に着目した「輪郭の一
部」を示す図で、図6の「二重線の部分」の如く、形状
に関する情報は、その表現が難しい。これを文字列で表
現できると文字認識装置の辞書作成等が容易になり、か
つ効率良く作成することができる。本実施例では、「輪
郭の一部を表現する方法」を、以下、プロファイル指定
という。
【0025】一つのプロファイル指定は、輪郭上で連続
な部分を指定する。プロファイル指定は、コンマで区切
られた一般に複数のフィールドからなり、各フィールド
は二つの位相変化ペア間にある一つの輪郭を意味する。
な部分を指定する。プロファイル指定は、コンマで区切
られた一般に複数のフィールドからなり、各フィールド
は二つの位相変化ペア間にある一つの輪郭を意味する。
【0026】具体例で説明すると、図7に示す図形の輪
郭は、外周(A−B−C−D−E−F−G−H)と内周
(I−J−K−L)とからなる。これらを位相変化ペア
の部分で切ったものを部分輪郭と呼ぶことにする。すな
わち、y=2とy=3の間の線、y=5とy=6の間の
線、y=10とy=11の間の線、y=13とy=14
の間の線が、その切断の場所を表している。これによっ
て、この例では、外周はA〜Hの8個の部分輪郭に、内
周はI〜Lの4個の部分輪郭に分けられる。
郭は、外周(A−B−C−D−E−F−G−H)と内周
(I−J−K−L)とからなる。これらを位相変化ペア
の部分で切ったものを部分輪郭と呼ぶことにする。すな
わち、y=2とy=3の間の線、y=5とy=6の間の
線、y=10とy=11の間の線、y=13とy=14
の間の線が、その切断の場所を表している。これによっ
て、この例では、外周はA〜Hの8個の部分輪郭に、内
周はI〜Lの4個の部分輪郭に分けられる。
【0027】これらの部分輪郭を指定するものが、前述
したプロファイル指定におけるフィールドであり、部分
輪郭の集合(例えば、H&G&F)を指定するものがプ
ロファイル指定である。この部分輪郭を指定するには、
隣合う位相変化ペアおよびそのペアの間で左から何番目
であるか(インデックス)の情報が必要である。
したプロファイル指定におけるフィールドであり、部分
輪郭の集合(例えば、H&G&F)を指定するものがプ
ロファイル指定である。この部分輪郭を指定するには、
隣合う位相変化ペアおよびそのペアの間で左から何番目
であるか(インデックス)の情報が必要である。
【0028】例えば、図8の場合、部分輪郭Bは、位相
変化ペアgi0とgi1の間で左端(インデックス=
0)となり、部分輪郭Hは、位相変化ペアgi0とgi
1の間で左から2番目(インデックス=1)となる。
変化ペアgi0とgi1の間で左端(インデックス=
0)となり、部分輪郭Hは、位相変化ペアgi0とgi
1の間で左から2番目(インデックス=1)となる。
【0029】図9の場合は、部分輪郭Cは、位相変化ペ
アgi1とgi2の間で左端(インデックス=0)とな
り、部分輪郭Jは、位相変化ペアgi1とgi2の間で
左から2番目(インデックス=1)となり、部分輪郭L
は、位相変化ペアgi1とgi2の間で左から3番目
(インデックス=2)となり、部分輪郭Gは、位相変化
ペアgi1とgi2の間で左から4番目(インデックス
=3)となる。
アgi1とgi2の間で左端(インデックス=0)とな
り、部分輪郭Jは、位相変化ペアgi1とgi2の間で
左から2番目(インデックス=1)となり、部分輪郭L
は、位相変化ペアgi1とgi2の間で左から3番目
(インデックス=2)となり、部分輪郭Gは、位相変化
ペアgi1とgi2の間で左から4番目(インデックス
=3)となる。
【0030】このように、部分輪郭は、コロン「:」で
区切られた3個の数字からなり、すなわち、初めの位相
変化ペア、2番目の位相変化ペア、ランレングスデータ
へのインデックスから構成される。従って、図10の部
分輪郭Hは、0:1:1と表現され、部分輪郭Gは、
1:2:3と表現され,部分輪郭Fは、2:3:1と表
現され、図10の二重線で示す輪郭の一部は、“0:
1:1,1:2:3,2:3:1”となる。
区切られた3個の数字からなり、すなわち、初めの位相
変化ペア、2番目の位相変化ペア、ランレングスデータ
へのインデックスから構成される。従って、図10の部
分輪郭Hは、0:1:1と表現され、部分輪郭Gは、
1:2:3と表現され,部分輪郭Fは、2:3:1と表
現され、図10の二重線で示す輪郭の一部は、“0:
1:1,1:2:3,2:3:1”となる。
【0031】また、複数の連続するフィールドに対応し
て、上記した記法を次のように省略することができる。
すなわち、 数字−数字:数字 第1番目の数字は、初めの位相変化ペアを表し、2番目
の数字は、終わりの位相変化ペアを表し、3番目の数字
は、初めの位相変化ペアと2番目の位相変化ペアにおけ
るランレングスデータへのインデックスを表す。なお、
2番目の位相変化ペアと3番目の位相変化ペアの間以降
のインデックスは、指定する輪郭が連続となるように選
ばれるものとする。
て、上記した記法を次のように省略することができる。
すなわち、 数字−数字:数字 第1番目の数字は、初めの位相変化ペアを表し、2番目
の数字は、終わりの位相変化ペアを表し、3番目の数字
は、初めの位相変化ペアと2番目の位相変化ペアにおけ
るランレングスデータへのインデックスを表す。なお、
2番目の位相変化ペアと3番目の位相変化ペアの間以降
のインデックスは、指定する輪郭が連続となるように選
ばれるものとする。
【0032】図10の二重線で示す輪郭の一部(H&G
&F)を、この省略した記法で表すと、“0−2:1”
となる(なお、図10の図形は、d,A,V,pであ
る)。ここで、3番目の数字“1”は、「gi0とgi
1の間ではインデックスは1」、即ち、部分輪郭Hから
始まることを示しており、後続する輪郭が連結するよう
に上から下へとたどることにより、二重線で示す輪郭の
一部(H&G&F)が得られる。
&F)を、この省略した記法で表すと、“0−2:1”
となる(なお、図10の図形は、d,A,V,pであ
る)。ここで、3番目の数字“1”は、「gi0とgi
1の間ではインデックスは1」、即ち、部分輪郭Hから
始まることを示しており、後続する輪郭が連結するよう
に上から下へとたどることにより、二重線で示す輪郭の
一部(H&G&F)が得られる。
【0033】さらに、本実施例では、sオプションおよ
びeオプションの使用が可能である。すなわち、図7に
おいて、部分輪郭の内、A,I,K,E等を単独で表現
する方法がないので、部分輪郭の集合として、これらを
含めるか否かを指定する方法がプロファイル指定におけ
るオプションである。例えば、 H&G&F(オプションなし) 0:1:1,1:2:
3,2:3:1 A&H&G&F(sオプション) s0:1:1,1:
2:3,2:3:1 H&G&F&E(eオプション) 0:1:1,1:
2:3,2:3:1e A&H&G&F&E(sオプションおよびeオプショ
ン) s0:1:1,1:2:3,2:3:1e となる。
びeオプションの使用が可能である。すなわち、図7に
おいて、部分輪郭の内、A,I,K,E等を単独で表現
する方法がないので、部分輪郭の集合として、これらを
含めるか否かを指定する方法がプロファイル指定におけ
るオプションである。例えば、 H&G&F(オプションなし) 0:1:1,1:2:
3,2:3:1 A&H&G&F(sオプション) s0:1:1,1:
2:3,2:3:1 H&G&F&E(eオプション) 0:1:1,1:
2:3,2:3:1e A&H&G&F&E(sオプションおよびeオプショ
ン) s0:1:1,1:2:3,2:3:1e となる。
【0034】オプションが指定できることにより、文字
認識装置における認識の精度を向上させることができ
る。例えば、図11に示す図形を「2」と認識する時、
図の二重線の部分の存在に着目することにより識別が容
易になる。この部分は、図形全体の傾きに応じて、図の
輪郭Bに含まれたり、あるいはDに含まれたり、Cとし
て単独で現われたりするので、認識時にオプションによ
って、B&C,D&Cの指定を行い、認識率の向上を図
る。
認識装置における認識の精度を向上させることができ
る。例えば、図11に示す図形を「2」と認識する時、
図の二重線の部分の存在に着目することにより識別が容
易になる。この部分は、図形全体の傾きに応じて、図の
輪郭Bに含まれたり、あるいはDに含まれたり、Cとし
て単独で現われたりするので、認識時にオプションによ
って、B&C,D&Cの指定を行い、認識率の向上を図
る。
【0035】〈方向コード生成部〉方向コード生成部6
は、方向コードのサンプリング点数をwとすると、各点
について輪郭の傾きを調べ、その傾きを量子化し、0〜
8のコードを割り当てて、出力する。図12は、方向コ
ードを示し、0は真左、8は真右、4は真下を表す。本
実施例では、輪郭の一部として輪郭上で上から下に向か
う部分を用いているので、上記したコードで十分である
が、これを360度全ての方向についてコードを割り当
てるようにしてもよい。
は、方向コードのサンプリング点数をwとすると、各点
について輪郭の傾きを調べ、その傾きを量子化し、0〜
8のコードを割り当てて、出力する。図12は、方向コ
ードを示し、0は真左、8は真右、4は真下を表す。本
実施例では、輪郭の一部として輪郭上で上から下に向か
う部分を用いているので、上記したコードで十分である
が、これを360度全ての方向についてコードを割り当
てるようにしてもよい。
【0036】図13は、プロファイル指定から方向コー
ドを生成する方向コード生成部6におけるフローチャー
トである。図14に示す図形(トポロジーコードはd,
p)を例にして方向コードの生成処理を説明する。ステ
ップAでは、まずプロファイル指定を解釈し、ランレン
グスデータを抽出する。例えば、プロファイル指定が
0:1:1であるとすると、これは、図14の輪郭
{a,b,c,d,e,f,g,h,i,j,k,l,
m,n,o,p,q,r,s,t,u}を指定するもの
であり、この指定された輪郭に対応するランレングスデ
ータから、点a,b,c,d,e,i,j,k,l,
m,q,r,s,t,uの座標が得られ、これを図15
に示すように行輪郭データとして一時的に保持してお
く。
ドを生成する方向コード生成部6におけるフローチャー
トである。図14に示す図形(トポロジーコードはd,
p)を例にして方向コードの生成処理を説明する。ステ
ップAでは、まずプロファイル指定を解釈し、ランレン
グスデータを抽出する。例えば、プロファイル指定が
0:1:1であるとすると、これは、図14の輪郭
{a,b,c,d,e,f,g,h,i,j,k,l,
m,n,o,p,q,r,s,t,u}を指定するもの
であり、この指定された輪郭に対応するランレングスデ
ータから、点a,b,c,d,e,i,j,k,l,
m,q,r,s,t,uの座標が得られ、これを図15
に示すように行輪郭データとして一時的に保持してお
く。
【0037】ステップBにおいては、行輪郭データから
輪郭を復元する。図16に示すように、復元されたデー
タを点列データという。
輪郭を復元する。図16に示すように、復元されたデー
タを点列データという。
【0038】ステップCでは、h=max(4,N/
w)を求める(Nは、点の数)。図14に示す例につい
て、説明の便宜上、点aから点uを点0〜20と呼ぶ
(点19は、点tを意味し、Nは21である)。例え
ば、3桁の方向コードを得る場合(つまり、サンプリン
グ点数w=3)を考えると、hは h=max(4,N/w)=7 となる。
w)を求める(Nは、点の数)。図14に示す例につい
て、説明の便宜上、点aから点uを点0〜20と呼ぶ
(点19は、点tを意味し、Nは21である)。例え
ば、3桁の方向コードを得る場合(つまり、サンプリン
グ点数w=3)を考えると、hは h=max(4,N/w)=7 となる。
【0039】次いで、ステップDでは、各サンプリング
点毎に輪郭の方向を求める。初めのサンプリング点はN
/2w番目の点、以降N/wの間隔でサンプリング点を
とる。図14の例では、初めのサンプリング点は、点3
(=点d)、2番目のサンプリング点は、点10(=点
k)、3番目のサンプリング点はrとなる。そして、初
めのサンプリング点について、その点から+h/2、−
h/2にある2点によって作られるベクトルの方向を求
める。図14の場合は、図16の点列データにおいて、
初めのサンプリング点4(点d)について、−h/2の
点は、点0(点a)となり、+h/2の点は、点6(点
g)となる。そして、点aと点gを結ぶ線の傾きが、求
めるべき輪郭の方向となる。次のサンプリング点kにつ
いても、同様にして+h/2、−h/2にある2点を求
める。
点毎に輪郭の方向を求める。初めのサンプリング点はN
/2w番目の点、以降N/wの間隔でサンプリング点を
とる。図14の例では、初めのサンプリング点は、点3
(=点d)、2番目のサンプリング点は、点10(=点
k)、3番目のサンプリング点はrとなる。そして、初
めのサンプリング点について、その点から+h/2、−
h/2にある2点によって作られるベクトルの方向を求
める。図14の場合は、図16の点列データにおいて、
初めのサンプリング点4(点d)について、−h/2の
点は、点0(点a)となり、+h/2の点は、点6(点
g)となる。そして、点aと点gを結ぶ線の傾きが、求
めるべき輪郭の方向となる。次のサンプリング点kにつ
いても、同様にして+h/2、−h/2にある2点を求
める。
【0040】ステップEでは、求められた方向を量子化
した0〜8のコードを出力する。図14の2点、aとg
の作る方向は、点a,gのx方向の差分がdx=4、y
方向の差分がdy=5であるので、方向コードは“6”
となる。以上の処理を全てのサンプリング点について行
う(ステップF)。このようにして、サンプリング点毎
に0〜8の方向コードを得て、w桁の方向コードの文字
列を得る。図17は、方向コードの例を示す。なお、h
個の点列は、サンプリング点から+h/2、−h/2に
ある2点をとることによって得られるが、+h/2だけ
進む前に、点列データの端に至る場合には、h個より少
ない点列で上記した処理を行う。
した0〜8のコードを出力する。図14の2点、aとg
の作る方向は、点a,gのx方向の差分がdx=4、y
方向の差分がdy=5であるので、方向コードは“6”
となる。以上の処理を全てのサンプリング点について行
う(ステップF)。このようにして、サンプリング点毎
に0〜8の方向コードを得て、w桁の方向コードの文字
列を得る。図17は、方向コードの例を示す。なお、h
個の点列は、サンプリング点から+h/2、−h/2に
ある2点をとることによって得られるが、+h/2だけ
進む前に、点列データの端に至る場合には、h個より少
ない点列で上記した処理を行う。
【0041】〈方向コードによる認識〉上述した方向コ
ードは、文字認識部7においてそれぞれの文字認識用に
作成されたオートマトンを用いて認識される。オートマ
トンは、一般的に各プロファイル指定毎に複数個作成さ
れる。方向コード全体を8のw乗個の要素を持つ空間と
した時、各オートマトンはそのごく一部にしかマッチし
ないように作成される。そして、一つの文字毎に一般に
複数のオートマトンが対応し、何れか一つのオートマト
ンにマッチしたら、その文字であると識別する。本実施
例の方向コードによる認識は、輪郭の一箇所だけでな
く、何個所かについての結果を総合することによって行
ってもよい。
ードは、文字認識部7においてそれぞれの文字認識用に
作成されたオートマトンを用いて認識される。オートマ
トンは、一般的に各プロファイル指定毎に複数個作成さ
れる。方向コード全体を8のw乗個の要素を持つ空間と
した時、各オートマトンはそのごく一部にしかマッチし
ないように作成される。そして、一つの文字毎に一般に
複数のオートマトンが対応し、何れか一つのオートマト
ンにマッチしたら、その文字であると識別する。本実施
例の方向コードによる認識は、輪郭の一箇所だけでな
く、何個所かについての結果を総合することによって行
ってもよい。
【0042】具体例を挙げて説明すると、緩い筆記制限
のもとに得た約13000字の手書き数字データのう
ち、トポロジーコード(d,A,V,p)を生成する文
字は、2977文字あり、このモデルには数字“6”、
“0”、“4”、“9”等が入る。まず、これらをgi
データで大分類し、3つのグループに分ける。すなわ
ち、図18のa/bを閾値0.85および1.25で分
ける。a/bの小さい順にグループ1,2,3と分ける
と、数字“9”は全てグループ1に入り、数字“6”は
全てグループ3に入り、数字“0”は一個の例外的デー
タを除いてグループ2に入った。しかし、数字“4”
は、グループ1と2にまたがって入り、かつ数字“9”
と数字“4”、数字“4”と数字“0”をgiデータで
分離することができなかった。
のもとに得た約13000字の手書き数字データのう
ち、トポロジーコード(d,A,V,p)を生成する文
字は、2977文字あり、このモデルには数字“6”、
“0”、“4”、“9”等が入る。まず、これらをgi
データで大分類し、3つのグループに分ける。すなわ
ち、図18のa/bを閾値0.85および1.25で分
ける。a/bの小さい順にグループ1,2,3と分ける
と、数字“9”は全てグループ1に入り、数字“6”は
全てグループ3に入り、数字“0”は一個の例外的デー
タを除いてグループ2に入った。しかし、数字“4”
は、グループ1と2にまたがって入り、かつ数字“9”
と数字“4”、数字“4”と数字“0”をgiデータで
分離することができなかった。
【0043】例えば、グループ2の場合、数字“0”ま
たは数字“4”からなり、合わせて1355字あり、そ
の内訳は数字“0”が1319字、数字“4”が36字
であった。これらについて、図6の2重線で示す部分で
w=10の方向コードを作成し、作成されたコードの
内、頻度の多いものから数個について、頻度順の方向コ
ードを示した図が図17である。この図17から明らか
なように、数字“0”と数字“4”とに共通する方向コ
ードは出現していない。これは重要な点で、もし共通す
る方向コードが出現した場合には、数字“0”と数字
“4”の区別が不可能になるので、そのような時にはサ
ンプリング点数wを大きくするか、輪郭をとる場所を変
更する必要がある。本実施例によると、1355個の方
向コードは、数字“0”について3種類のオートマト
ン、数字“4”について4種類のオートマトンを作成す
ることによって認識することができた。
たは数字“4”からなり、合わせて1355字あり、そ
の内訳は数字“0”が1319字、数字“4”が36字
であった。これらについて、図6の2重線で示す部分で
w=10の方向コードを作成し、作成されたコードの
内、頻度の多いものから数個について、頻度順の方向コ
ードを示した図が図17である。この図17から明らか
なように、数字“0”と数字“4”とに共通する方向コ
ードは出現していない。これは重要な点で、もし共通す
る方向コードが出現した場合には、数字“0”と数字
“4”の区別が不可能になるので、そのような時にはサ
ンプリング点数wを大きくするか、輪郭をとる場所を変
更する必要がある。本実施例によると、1355個の方
向コードは、数字“0”について3種類のオートマト
ン、数字“4”について4種類のオートマトンを作成す
ることによって認識することができた。
【0044】
【発明の効果】以上、説明したように、請求項1記載の
発明によれば、縦位相表現中の所定位置のランデータを
用いて文字を詳細分類しているので、文字認識を高速に
行うことが可能となる。請求項2記載の発明によれば、
輪郭の傾きを用いて文字を詳細分類しているので、請求
項1記載の方法によって分類できない文字についても、
詳細に分類することが可能となり、文字認識の認識精度
を更に向上させることができる。請求項3記載の発明に
よれば、輪郭の一部が文字列によって表現されるので、
文字認識装置における辞書の作成を容易に行うことがで
きる。
発明によれば、縦位相表現中の所定位置のランデータを
用いて文字を詳細分類しているので、文字認識を高速に
行うことが可能となる。請求項2記載の発明によれば、
輪郭の傾きを用いて文字を詳細分類しているので、請求
項1記載の方法によって分類できない文字についても、
詳細に分類することが可能となり、文字認識の認識精度
を更に向上させることができる。請求項3記載の発明に
よれば、輪郭の一部が文字列によって表現されるので、
文字認識装置における辞書の作成を容易に行うことがで
きる。
【図1】本発明の実施例のブロック構成図である。
【図2】モデル(d,Id,IA,VI,V,p)のg
iデータによる分類を説明する図である。
iデータによる分類を説明する図である。
【図3】モデル(d,Id,IA,VI,V,p)を分
類するフローチャートである。
類するフローチャートである。
【図4】原図形とその黒スタンプに対応するランを示す
図である。
図である。
【図5】モデル(d,Id,V,A,Ip,p)のgi
データによる分類を説明する図である。
データによる分類を説明する図である。
【図6】数字“0”と数字“4”を分離する際に着目し
た「輪郭の一部」を示す図である。
た「輪郭の一部」を示す図である。
【図7】図形の輪郭を説明する図である。
【図8】部分輪郭の表現方法を説明する図である。
【図9】部分輪郭の表現方法を説明する図である。
【図10】輪郭の一部の表現方法を説明する図である。
【図11】オプションを用いた文字認識を説明する図で
ある。
ある。
【図12】方向コードを示す図である。
【図13】プロファイル指定から方向コードを生成する
方向コード生成部におけるフローチャートである。
方向コード生成部におけるフローチャートである。
【図14】方向コードの生成処理を説明するための図形
例である。
例である。
【図15】行輪郭データを示す図である。
【図16】点列データを示す図である。
【図17】方向コードの例を示す図である。
【図18】モデル(d,A,V,p)のgiデータによ
る分類を説明する図である。
る分類を説明する図である。
【図19】2値化された画像データである。
【図20】図19の画像データの縦位相表現図である。
【図21】図20をスタンプで表した図である。
【図22】縦位相表現のトポロジーコードを示す図であ
る。
る。
【図23】数字2の縦位相表現とトポロジーコードを示
す図である。
す図である。
【図24】トポロジーコードのみでは文字を分類できな
い例を示す図である。
い例を示す図である。
1 2値化処理部 2 ランレングスデータ生成部 3 縦位相表現データ生成部 4 giデータ分類部 5 プロファイル指定部 6 方向コード生成部 7 文字認識部
Claims (3)
- 【請求項1】 2値化された画像データから行毎にラン
データを生成し、隣接する行間のランデータパターンが
異なる位相変化ペアを抽出し、該位相変化ペアで構成さ
れた縦位相表現を用いて文字を認識する方法において、
前記縦位相表現中の所定位置のランデータを参照するこ
とにより文字を詳細分類することを特徴とする文字認識
方法。 - 【請求項2】 文字画像の輪郭の一部を指定し、該指定
された輪郭の所定位置における傾きを求め、一連の傾き
情報を用いて文字を詳細分類することを特徴とする請求
項1記載の文字認識方法。 - 【請求項3】 前記輪郭の指定は、位相変化ペアとラン
データへのインデックスを指示することにより行うこと
を特徴とする請求項2記載の文字認識方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP4052213A JP2763033B2 (ja) | 1992-03-11 | 1992-03-11 | 文字認識方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP4052213A JP2763033B2 (ja) | 1992-03-11 | 1992-03-11 | 文字認識方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH05258113A true JPH05258113A (ja) | 1993-10-08 |
JP2763033B2 JP2763033B2 (ja) | 1998-06-11 |
Family
ID=12908484
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP4052213A Expired - Lifetime JP2763033B2 (ja) | 1992-03-11 | 1992-03-11 | 文字認識方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2763033B2 (ja) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS53144636A (en) * | 1977-05-23 | 1978-12-16 | Sharp Corp | Character pattern recognition system |
JPS53145426A (en) * | 1977-05-24 | 1978-12-18 | Sharp Corp | Character pattern recognizing system |
JPS63133765A (ja) * | 1986-11-25 | 1988-06-06 | Nippon Telegr & Teleph Corp <Ntt> | パタ−ン検出処理方式 |
JPS63208181A (ja) * | 1987-02-25 | 1988-08-29 | Canon Inc | パターン認識方法及び情報処理装置 |
-
1992
- 1992-03-11 JP JP4052213A patent/JP2763033B2/ja not_active Expired - Lifetime
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS53144636A (en) * | 1977-05-23 | 1978-12-16 | Sharp Corp | Character pattern recognition system |
JPS53145426A (en) * | 1977-05-24 | 1978-12-18 | Sharp Corp | Character pattern recognizing system |
JPS63133765A (ja) * | 1986-11-25 | 1988-06-06 | Nippon Telegr & Teleph Corp <Ntt> | パタ−ン検出処理方式 |
JPS63208181A (ja) * | 1987-02-25 | 1988-08-29 | Canon Inc | パターン認識方法及び情報処理装置 |
Also Published As
Publication number | Publication date |
---|---|
JP2763033B2 (ja) | 1998-06-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Brown et al. | Handprinted symbol recognition system | |
EP0355748A2 (en) | A pattern recognition apparatus and method for doing the same | |
EP0542566A2 (en) | Character recognition method and apparatus thereof | |
JP2763033B2 (ja) | 文字認識方法 | |
JP3586949B2 (ja) | 帳票認識装置 | |
Ramesh | A generalized character recognition algorithm: a graphical approach | |
Ablameyko et al. | A complete system for interpretation of color maps | |
US5894525A (en) | Method and system for simultaneously recognizing contextually related input fields for a mutually consistent interpretation | |
JP3024680B2 (ja) | 手書きパターン蓄積検索装置 | |
JPH0458073B2 (ja) | ||
JPH10198761A (ja) | 文字認識方法および文字認識装置 | |
JPH06274694A (ja) | 文字認識方法 | |
JP2933927B2 (ja) | パターン認識方法及び情報処理装置 | |
JP2864777B2 (ja) | 線画像照合装置 | |
JPH02206894A (ja) | 文字認識方法 | |
JPH08212292A (ja) | 枠線認識装置 | |
JPS58105387A (ja) | 文字認識方法 | |
JPH06274695A (ja) | 文字認識方法 | |
JPH10154207A (ja) | 文字切出し方法および文字切出し装置 | |
JP2851865B2 (ja) | 文字認識装置 | |
JPH0773228A (ja) | 図面自動認識方法 | |
Ogier et al. | Technical map interpretation: A distributed approach | |
GB2259798A (en) | Recognizing handwritten characters | |
JPH05290217A (ja) | 文字認識方法 | |
Chou et al. | Representation and recognition of handprinted Chinese characters by string-matching |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090327 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100327 Year of fee payment: 12 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110327 Year of fee payment: 13 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120327 Year of fee payment: 14 |
|
EXPY | Cancellation because of completion of term |