JPH0547871B2 - - Google Patents
Info
- Publication number
- JPH0547871B2 JPH0547871B2 JP58152998A JP15299883A JPH0547871B2 JP H0547871 B2 JPH0547871 B2 JP H0547871B2 JP 58152998 A JP58152998 A JP 58152998A JP 15299883 A JP15299883 A JP 15299883A JP H0547871 B2 JPH0547871 B2 JP H0547871B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- pattern
- coordinate
- barycenter
- coordinates
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000009826 distribution Methods 0.000 claims description 12
- 230000005484 gravity Effects 0.000 claims description 8
- 239000011159 matrix material Substances 0.000 claims description 8
- 238000000034 method Methods 0.000 claims description 7
- 230000008569 process Effects 0.000 claims description 2
- 238000000605 extraction Methods 0.000 description 8
- 230000008859 change Effects 0.000 description 7
- 238000001514 detection method Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 239000000284 extract Substances 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000003491 array Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- UFFSXJKVKBQEHC-UHFFFAOYSA-N heptafluorobutyric anhydride Chemical compound FC(F)(F)C(F)(F)C(F)(F)C(=O)OC(=O)C(F)(F)C(F)(F)C(F)(F)F UFFSXJKVKBQEHC-UHFFFAOYSA-N 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
Landscapes
- Character Discrimination (AREA)
Description
(技術分野)
本発明は高速で認識精度の良い文字認識方法に
関するものである。 (背景技術) 従来、文字図形パターンより所望の方向のスト
ローク成分をあらわすサブパターンを抽出し、前
記サブパターンについて前記文字図形パターンの
方形外接文字枠の4辺のうち2辺以上の各辺上の
各点から所定の方向に走査して走査線上における
文字線の位置を検出し、走査を開始した辺上の点
と前記検出したそれぞれの文字線との距離のN乗
和を特徴量(以下辺距離特徴という)として抽出
して、前記外接文字枠の各辺をM個の区間に分割
し、各区間内の前記特徴量の平均値を要素として
M×K次元(K:特徴を抽出した総辺数)の特徴
マトリクスを抽出し、あらかじめ用意した辞書を
参照して、文字図形の認識を行なう文字認識方式
が提案されている。この方式における文字ストロ
ークの位置情報は分割単位領域に保持され、分割
単位領域の設定は認識率を左右する一要素とな
る。文字枠のX軸、Y軸方向を夫々均等に分割し
て、分割単位領域を設定した場合は、印刷文字で
は字体の相違に基づくストロークの位置変動の影
響、あるいは手書文字では個人差に基づくストロ
ークの位置変動の影響が大きく現われる。 第1図は、漢字「図」のストロークの位置が異
つた2つの例を示しており、ORGAとORGBは
漢字「回」の入力文字図形パターン、HFTA、
HFTB、HFBA、HFBBはそれら水平サブパタ
ーンの文字枠上辺および下辺に対する辺距離特徴
である。第1図に示した例で、一点鎖線で示すよ
うに、文字枠のX軸方向を均等に4分割して分割
単位領域v1〜v4を設定した場合、水平サブパター
ンに対して、辺距離特徴HFTA、HFTB間と
HFBA、HFBB間で異なるものとなり、従つて
2つの入力文字図形パターンORGA、ORGBに
対する特徴マトリクスも異つたものとなり、結果
として認識率が低下するか又は文字変形を考慮し
た多くの辞書が必要となる。 (発明の課題) 本発明の目的は、以上のような欠点を除去する
ために分割座標をストロークの位置変動に追従し
て設定することによりストローク位置変動の影響
を軽減することにある。 (発明の構成および作用) 第3図は本発明による文字認識装置の実施例を
示したものである。 第2図は特徴抽出結果例である。 本実施例の動作は、読取機構にセツトされた帳
票上の文字は光電変換部2において2値の量子化
されたデジタル電気信号に変換され、パターンレ
ジスタ3に格納される。それと同時に、文字線幅
計算部4において入力パターンの線幅(W)が計算さ
れる。サブパターン抽出部5は、パターンレジス
タについて垂直スキヤンを全面行なつて、黒ビツ
トの連続長さと線幅計算部4において計算された
線幅との関係より垂直サブパターン(VSP)を
抽出する。同様に、水平スキヤンにより水平サブ
パターン(HSP)を、右斜め45゜スキヤンにより
右斜めサブパターン(RSP)を、左斜め45゜スキ
ヤンにより左斜めサブパターン(LSP)を抽出す
る。文字枠検出部6はパターンレジスタ内の文字
図形パターンに外接する方形の枠(以後文字枠と
称する)を検出し、パターンレジスタで定義され
る2次元平面における前記文字枠を規定する為の
位置座標を特徴抽出部10へ送出する。以後の説
明については文字枠の左下を原点とし、水平方向
をX軸、垂直方向をY軸とする座標系を使用す
る。特徴抽出部10はまず垂直サブパターンにつ
いて、文字枠を構成する4辺のうち垂直な辺であ
る左辺上の点P(0,y)から水平走査を開始し、
白点から黒点への変化点をすべて検出し、検出し
た変化点と前記走査を開始した垂直辺上の点Pと
の間の距離すなわちX座標の差を文字枠のX方向
の長さを正規化定数として正規化した値のN乗
(Nは定数、本実施例ではN=2)の値の計算を
前記検出したすべての変化点について行ないそれ
ぞれの変化点について垂直辺との距離のN乗の総
和を配列Vl(y)に格納する。但し前記白点(あるい
は白ビツト)とは文字背景部を表わしP(x,y)
=0である。黒点(あるいは黒ビツト)は文字線
部を表しP(x,y)=1である。また式(1)は前記
のVl(y)を式で表わしたものであり、式中の△xkは
それぞれの変化点と文字枠辺との距離を表わす。
但しk=1,…,VK,VKは検出された変化点
個数を表わす。又式(1)中の△Xは文字枠の水平方
向の長さであり、Cは整数化定数であり本実施例
においてはC=50とした。 Vl(y)=Vk 〓k=1 {△Xk/△X×C}2 ……(1) 上記の様な処理を文字枠の2つの垂直辺上のす
べての点を開始点として行ない、垂直サブパター
ンについて、文字枠の左左辺上の点から水平走査
を開始して作成する配列Vl(i)、文字枠の右辺上の
点から水平走査を開始して作成する配列Vr(i)を
抽出する。但しi=0,……,YT9,YTは文字
枠上辺のY座標である。同様な処理により、水平
サブパターン、右斜めサブパターン、左斜めサブ
パターンについては文字枠の2個の水平辺上のす
べての点から垂直走査を行なつて、水平サブパタ
ーンについて配列Hb(j),Ht(j),右斜めサブパタ
ーンについての配列Rb(j),Rt(j)、左斜めサブパ
ターンについての配列Lb(j),Lt(j)を抽出する。但
しj=0,……,XR,XRは文字枠右辺のX座
標である。又Hb(j),Ht(j),Rb(j),Rt(j),Lb(j),
Lt(j)を抽出する際における、走査開始点と前記変
化点との距離の正規化定数としては文字枠の垂直
方向の長さ△Yを使用した。 次に、文字投影作成部7はパターンレジスタの
入力文字パターンをX軸、Y軸(夫々パターンレ
ジスタの2次元座標における水平方向、垂直方
向)へ投影して黒ビツト数の分布を求め、黒ビツ
ト数分布SX(x),SY(y)を作成する。 SX(x)=y=YT 〓y=0 P(x,y) SY(y)=x=XR 〓x=0 P(x,y) 但し、x,yはパターンレジスタ3における2
次元座標である。 第1図に示した漢字「回」の2つの入力文字パ
ターンORGA、ORGBに対する黒ビツト分布SX
(x),SY(y)と水平サブパターンに対する辺距離特
徴HFTA、HFTBを第4図に示す。重心検出部
8は、文字枠のX、Y各軸方向の全範囲O〜
XR,O〜YT及び前の過程で検出した重心座標
でその範囲O〜XR,O〜YTを分割した各範囲
を対象として、入力文字パターンの夫々の黒ビツ
ト数分布SX(x),SY(y)の重心座標系列X(Mp),
Y(Mq)を求めるものであり、各範囲の1次モー
メントの和をその範囲の黒ビツト和で除算するこ
とによつて求めるものである。但し、Mp,Mqは
座標値の大きさの順に付した重心座標番号であ
り、Mp=1〜MX(MXはX軸方向の重心の個数
であつて奇数)Mq=1〜MY(MYはY軸方向の
重心の個数であつて奇数)である。X軸方向の重
心座標の個数MXとしては、15個程度の比較的多
い数(分割数に比べて)を採用することが望まし
いが、説明の簡略化のために7個の重心座標X
(Mp)を検出する場合について述べると、まず、
文字枠のX軸方向の範囲O〜XRを対象として、
次式に示すように入力文字パターンの黒ビツト数
分布SX(x)の1次モーメント和をその範囲の黒ビ
ツト和で除算することによつて、中央の重心座標
番号M4の重心座標X(M4)を求める(第4図参
照)。 X(M4)=x=XR 〓x=0 SX(x)・x/x=XR 〓x=0 SX(x) 次いで、その重心座標X(M4)で分割された
夫々の範囲、O0〜X(M4),X(M4)〜XRを対象
として2つの重心座標X(M2),X(M6)を求め
る。 X(M2)=x=X(M4) 〓x=0 SX(x)・x/x=X(M4) 〓x=0 SX(x) X(M6)=x=XR 〓x=(M4) SX(x)・x/x=XR 〓x=(M4) SX(x) 次いで、これまで検出された重心座標X(M2),
X(M4),X(M6)で分割された範囲O〜X
(M2),X(M2)〜X(M4),X(M4)〜X(M6),
X(M6)〜XRrを対象として4個の重心座標X
(M1),X(M3),X(M5),X(M7)を求める。 X(M1)=x=X(M2) 〓x=0 SX(x)・x/x=(M2) 〓x=0 SX(x) X(M3)=x=X(M4) 〓x=X(M2) SX(x)・x/x=X(M4) 〓x=X(M2) SX(x) 〓 X(M7)=x=XR 〓x=X(M6) SX(x)・x/x=XR 〓x=X(M6) SX(x) Y軸方向の重心座標Y(Mq)の検出も検出する
重心座標個数MYを7個とした場合、まず、文字
枠の範囲O〜YTを対象として入力文字パターン
の黒ビツト分布SY(y)の重心座標Y(M4)を検出
し、次いで方形文字外接枠を重心座標で2分した
範囲O〜Y(M4),Y(M4)〜YTそれぞれを対象
として黒ビツト分布SY(y)の重心座標Y(M2),Y
(M6)を検出し、更にこれまでに検出された重心
座標Y(M2),Y(M4),Y(M6)でY軸方向の方
形文字外接枠を分割した夫々の範囲O〜Y(M2),
Y(M2)〜Y(M4),Y(M4)〜Y(M6),Y(M6)
〜YTを対象として黒ビツト分布SY(y)の重心座
標を検出することによつて、計7個の重心座標Y
(M1)〜Y(M7)を検出する。 文字枠分割点決定部9は、各サブパターン対応
のX,Y軸方向の分割数をNX,NYとし、各サ
ブパターン対応のX,Y軸各方向の分割座標系列
をX(ki),Y(kj)として、X,Y軸各方向の重
心座標系列X(Mp)Y(Mq)を分割座標候補とし
て、重心座標番号Mp,Mqを分割座標番号koi,kj
にほぼ均等に対応づけて分割座標X(ki),Y(kj)
を決定するものである。 この実施例における分割単位領域の分割形式
は、全てのサブパターンHSP,VSP,LSP,
RSPに対して同一であり、X軸Y軸ともに同一
数の分割領域に分割するものである。文字枠を
NXあるいはNYなる個数の分割単位領域に分割
し分割座標系列X(ki),Y(kj)を決定する。こ
の実施例においてはNX=NY=M=8である。
X,Y軸各方向の重心座標番号Mp,MqとX,Y
軸方向の分割座標番号ki,kjをほぼ均等に対応づ
けて分割座標系列X(ki),K(kj)を決定するた
めに、次記に示す如きテーブルが用意されてい
て、X,Y軸各方向の分割数NX,NYに対応し
てこのテーブルから重心座標番号Mp,Mqを読み
出し、その重心座標番号Mp,Mqに対応した重心
座標X(Mp),Y(Mq)を分割座標X(ki),Y(kj)
として決定する。
関するものである。 (背景技術) 従来、文字図形パターンより所望の方向のスト
ローク成分をあらわすサブパターンを抽出し、前
記サブパターンについて前記文字図形パターンの
方形外接文字枠の4辺のうち2辺以上の各辺上の
各点から所定の方向に走査して走査線上における
文字線の位置を検出し、走査を開始した辺上の点
と前記検出したそれぞれの文字線との距離のN乗
和を特徴量(以下辺距離特徴という)として抽出
して、前記外接文字枠の各辺をM個の区間に分割
し、各区間内の前記特徴量の平均値を要素として
M×K次元(K:特徴を抽出した総辺数)の特徴
マトリクスを抽出し、あらかじめ用意した辞書を
参照して、文字図形の認識を行なう文字認識方式
が提案されている。この方式における文字ストロ
ークの位置情報は分割単位領域に保持され、分割
単位領域の設定は認識率を左右する一要素とな
る。文字枠のX軸、Y軸方向を夫々均等に分割し
て、分割単位領域を設定した場合は、印刷文字で
は字体の相違に基づくストロークの位置変動の影
響、あるいは手書文字では個人差に基づくストロ
ークの位置変動の影響が大きく現われる。 第1図は、漢字「図」のストロークの位置が異
つた2つの例を示しており、ORGAとORGBは
漢字「回」の入力文字図形パターン、HFTA、
HFTB、HFBA、HFBBはそれら水平サブパタ
ーンの文字枠上辺および下辺に対する辺距離特徴
である。第1図に示した例で、一点鎖線で示すよ
うに、文字枠のX軸方向を均等に4分割して分割
単位領域v1〜v4を設定した場合、水平サブパター
ンに対して、辺距離特徴HFTA、HFTB間と
HFBA、HFBB間で異なるものとなり、従つて
2つの入力文字図形パターンORGA、ORGBに
対する特徴マトリクスも異つたものとなり、結果
として認識率が低下するか又は文字変形を考慮し
た多くの辞書が必要となる。 (発明の課題) 本発明の目的は、以上のような欠点を除去する
ために分割座標をストロークの位置変動に追従し
て設定することによりストローク位置変動の影響
を軽減することにある。 (発明の構成および作用) 第3図は本発明による文字認識装置の実施例を
示したものである。 第2図は特徴抽出結果例である。 本実施例の動作は、読取機構にセツトされた帳
票上の文字は光電変換部2において2値の量子化
されたデジタル電気信号に変換され、パターンレ
ジスタ3に格納される。それと同時に、文字線幅
計算部4において入力パターンの線幅(W)が計算さ
れる。サブパターン抽出部5は、パターンレジス
タについて垂直スキヤンを全面行なつて、黒ビツ
トの連続長さと線幅計算部4において計算された
線幅との関係より垂直サブパターン(VSP)を
抽出する。同様に、水平スキヤンにより水平サブ
パターン(HSP)を、右斜め45゜スキヤンにより
右斜めサブパターン(RSP)を、左斜め45゜スキ
ヤンにより左斜めサブパターン(LSP)を抽出す
る。文字枠検出部6はパターンレジスタ内の文字
図形パターンに外接する方形の枠(以後文字枠と
称する)を検出し、パターンレジスタで定義され
る2次元平面における前記文字枠を規定する為の
位置座標を特徴抽出部10へ送出する。以後の説
明については文字枠の左下を原点とし、水平方向
をX軸、垂直方向をY軸とする座標系を使用す
る。特徴抽出部10はまず垂直サブパターンにつ
いて、文字枠を構成する4辺のうち垂直な辺であ
る左辺上の点P(0,y)から水平走査を開始し、
白点から黒点への変化点をすべて検出し、検出し
た変化点と前記走査を開始した垂直辺上の点Pと
の間の距離すなわちX座標の差を文字枠のX方向
の長さを正規化定数として正規化した値のN乗
(Nは定数、本実施例ではN=2)の値の計算を
前記検出したすべての変化点について行ないそれ
ぞれの変化点について垂直辺との距離のN乗の総
和を配列Vl(y)に格納する。但し前記白点(あるい
は白ビツト)とは文字背景部を表わしP(x,y)
=0である。黒点(あるいは黒ビツト)は文字線
部を表しP(x,y)=1である。また式(1)は前記
のVl(y)を式で表わしたものであり、式中の△xkは
それぞれの変化点と文字枠辺との距離を表わす。
但しk=1,…,VK,VKは検出された変化点
個数を表わす。又式(1)中の△Xは文字枠の水平方
向の長さであり、Cは整数化定数であり本実施例
においてはC=50とした。 Vl(y)=Vk 〓k=1 {△Xk/△X×C}2 ……(1) 上記の様な処理を文字枠の2つの垂直辺上のす
べての点を開始点として行ない、垂直サブパター
ンについて、文字枠の左左辺上の点から水平走査
を開始して作成する配列Vl(i)、文字枠の右辺上の
点から水平走査を開始して作成する配列Vr(i)を
抽出する。但しi=0,……,YT9,YTは文字
枠上辺のY座標である。同様な処理により、水平
サブパターン、右斜めサブパターン、左斜めサブ
パターンについては文字枠の2個の水平辺上のす
べての点から垂直走査を行なつて、水平サブパタ
ーンについて配列Hb(j),Ht(j),右斜めサブパタ
ーンについての配列Rb(j),Rt(j)、左斜めサブパ
ターンについての配列Lb(j),Lt(j)を抽出する。但
しj=0,……,XR,XRは文字枠右辺のX座
標である。又Hb(j),Ht(j),Rb(j),Rt(j),Lb(j),
Lt(j)を抽出する際における、走査開始点と前記変
化点との距離の正規化定数としては文字枠の垂直
方向の長さ△Yを使用した。 次に、文字投影作成部7はパターンレジスタの
入力文字パターンをX軸、Y軸(夫々パターンレ
ジスタの2次元座標における水平方向、垂直方
向)へ投影して黒ビツト数の分布を求め、黒ビツ
ト数分布SX(x),SY(y)を作成する。 SX(x)=y=YT 〓y=0 P(x,y) SY(y)=x=XR 〓x=0 P(x,y) 但し、x,yはパターンレジスタ3における2
次元座標である。 第1図に示した漢字「回」の2つの入力文字パ
ターンORGA、ORGBに対する黒ビツト分布SX
(x),SY(y)と水平サブパターンに対する辺距離特
徴HFTA、HFTBを第4図に示す。重心検出部
8は、文字枠のX、Y各軸方向の全範囲O〜
XR,O〜YT及び前の過程で検出した重心座標
でその範囲O〜XR,O〜YTを分割した各範囲
を対象として、入力文字パターンの夫々の黒ビツ
ト数分布SX(x),SY(y)の重心座標系列X(Mp),
Y(Mq)を求めるものであり、各範囲の1次モー
メントの和をその範囲の黒ビツト和で除算するこ
とによつて求めるものである。但し、Mp,Mqは
座標値の大きさの順に付した重心座標番号であ
り、Mp=1〜MX(MXはX軸方向の重心の個数
であつて奇数)Mq=1〜MY(MYはY軸方向の
重心の個数であつて奇数)である。X軸方向の重
心座標の個数MXとしては、15個程度の比較的多
い数(分割数に比べて)を採用することが望まし
いが、説明の簡略化のために7個の重心座標X
(Mp)を検出する場合について述べると、まず、
文字枠のX軸方向の範囲O〜XRを対象として、
次式に示すように入力文字パターンの黒ビツト数
分布SX(x)の1次モーメント和をその範囲の黒ビ
ツト和で除算することによつて、中央の重心座標
番号M4の重心座標X(M4)を求める(第4図参
照)。 X(M4)=x=XR 〓x=0 SX(x)・x/x=XR 〓x=0 SX(x) 次いで、その重心座標X(M4)で分割された
夫々の範囲、O0〜X(M4),X(M4)〜XRを対象
として2つの重心座標X(M2),X(M6)を求め
る。 X(M2)=x=X(M4) 〓x=0 SX(x)・x/x=X(M4) 〓x=0 SX(x) X(M6)=x=XR 〓x=(M4) SX(x)・x/x=XR 〓x=(M4) SX(x) 次いで、これまで検出された重心座標X(M2),
X(M4),X(M6)で分割された範囲O〜X
(M2),X(M2)〜X(M4),X(M4)〜X(M6),
X(M6)〜XRrを対象として4個の重心座標X
(M1),X(M3),X(M5),X(M7)を求める。 X(M1)=x=X(M2) 〓x=0 SX(x)・x/x=(M2) 〓x=0 SX(x) X(M3)=x=X(M4) 〓x=X(M2) SX(x)・x/x=X(M4) 〓x=X(M2) SX(x) 〓 X(M7)=x=XR 〓x=X(M6) SX(x)・x/x=XR 〓x=X(M6) SX(x) Y軸方向の重心座標Y(Mq)の検出も検出する
重心座標個数MYを7個とした場合、まず、文字
枠の範囲O〜YTを対象として入力文字パターン
の黒ビツト分布SY(y)の重心座標Y(M4)を検出
し、次いで方形文字外接枠を重心座標で2分した
範囲O〜Y(M4),Y(M4)〜YTそれぞれを対象
として黒ビツト分布SY(y)の重心座標Y(M2),Y
(M6)を検出し、更にこれまでに検出された重心
座標Y(M2),Y(M4),Y(M6)でY軸方向の方
形文字外接枠を分割した夫々の範囲O〜Y(M2),
Y(M2)〜Y(M4),Y(M4)〜Y(M6),Y(M6)
〜YTを対象として黒ビツト分布SY(y)の重心座
標を検出することによつて、計7個の重心座標Y
(M1)〜Y(M7)を検出する。 文字枠分割点決定部9は、各サブパターン対応
のX,Y軸方向の分割数をNX,NYとし、各サ
ブパターン対応のX,Y軸各方向の分割座標系列
をX(ki),Y(kj)として、X,Y軸各方向の重
心座標系列X(Mp)Y(Mq)を分割座標候補とし
て、重心座標番号Mp,Mqを分割座標番号koi,kj
にほぼ均等に対応づけて分割座標X(ki),Y(kj)
を決定するものである。 この実施例における分割単位領域の分割形式
は、全てのサブパターンHSP,VSP,LSP,
RSPに対して同一であり、X軸Y軸ともに同一
数の分割領域に分割するものである。文字枠を
NXあるいはNYなる個数の分割単位領域に分割
し分割座標系列X(ki),Y(kj)を決定する。こ
の実施例においてはNX=NY=M=8である。
X,Y軸各方向の重心座標番号Mp,MqとX,Y
軸方向の分割座標番号ki,kjをほぼ均等に対応づ
けて分割座標系列X(ki),K(kj)を決定するた
めに、次記に示す如きテーブルが用意されてい
て、X,Y軸各方向の分割数NX,NYに対応し
てこのテーブルから重心座標番号Mp,Mqを読み
出し、その重心座標番号Mp,Mqに対応した重心
座標X(Mp),Y(Mq)を分割座標X(ki),Y(kj)
として決定する。
【表】
このテーブルは、重心検出部8で検出する重心
座標の個数MX,MYが7個の場合であるが、一
般的な場合においても、X,Y軸各方向の分割単
位内の重心個数が均一に含まれるように対応さ
せ、且つその際余分の重心座標が残つた場合は両
端の領域から順に1個多い重心座標が含まれるよ
うに対応させることによつて作ることができる。 特徴マトリクス抽出部11は特徴抽出部10に
おいて抽出された8種(V1(i),Vk(i),Hb(j),Ht
(j),Rb(j),Rt(j),Lb(j),Lt(j))の配列を使用し、
前記分割座標からきまる複数の分割単位領域に分
割し各分割領域毎の値の平均値を計算することに
より(分割数)×8次元の特徴マトリクスF(m,
n)を抽出する。但しm=1,…,M,n=1,
…,8識別部12は特徴マトリクス抽出部7で抽出
された特徴マトリクスと、同形式で記述された標
準文字マスク(m,n)との間の式(2)で示され
る距離(D)を計算しその距離が最も小さい値を与え
る標準文字マスクのカテゴリ名を文字名出力13
へ出力する。 D=√〓{(,)−(,)}2 ……(2) (発明の効果) 以上説明した様に本実施例においては、方形文
字外接枠のX軸,Y軸各方向を分割領域に分割し
て分割単位領域を設定する場合、X,Y軸方向で
ストロークの位置変動が保存されている黒ビツト
数分布の重心座標系列に基づいているため、印刷
文字で字体の相違に基づくストロークの位置変動
の影響、あるいは手書文字では個人差に基づくス
トロークの位置変動の影響を吸収出来る利点があ
る。 本発明は方形文字外接枠の分割座標を文字図形
パターンのX軸,Y軸各方向の黒ビツト数分布の
重心座標を基準として決定しているので、字体あ
るいは個人差などによるストロークの変動に対し
てもストロークの含まれる分割単位領域の位置が
安定であり、精度の高い認識が出来るという利点
がある。
座標の個数MX,MYが7個の場合であるが、一
般的な場合においても、X,Y軸各方向の分割単
位内の重心個数が均一に含まれるように対応さ
せ、且つその際余分の重心座標が残つた場合は両
端の領域から順に1個多い重心座標が含まれるよ
うに対応させることによつて作ることができる。 特徴マトリクス抽出部11は特徴抽出部10に
おいて抽出された8種(V1(i),Vk(i),Hb(j),Ht
(j),Rb(j),Rt(j),Lb(j),Lt(j))の配列を使用し、
前記分割座標からきまる複数の分割単位領域に分
割し各分割領域毎の値の平均値を計算することに
より(分割数)×8次元の特徴マトリクスF(m,
n)を抽出する。但しm=1,…,M,n=1,
…,8識別部12は特徴マトリクス抽出部7で抽出
された特徴マトリクスと、同形式で記述された標
準文字マスク(m,n)との間の式(2)で示され
る距離(D)を計算しその距離が最も小さい値を与え
る標準文字マスクのカテゴリ名を文字名出力13
へ出力する。 D=√〓{(,)−(,)}2 ……(2) (発明の効果) 以上説明した様に本実施例においては、方形文
字外接枠のX軸,Y軸各方向を分割領域に分割し
て分割単位領域を設定する場合、X,Y軸方向で
ストロークの位置変動が保存されている黒ビツト
数分布の重心座標系列に基づいているため、印刷
文字で字体の相違に基づくストロークの位置変動
の影響、あるいは手書文字では個人差に基づくス
トロークの位置変動の影響を吸収出来る利点があ
る。 本発明は方形文字外接枠の分割座標を文字図形
パターンのX軸,Y軸各方向の黒ビツト数分布の
重心座標を基準として決定しているので、字体あ
るいは個人差などによるストロークの変動に対し
てもストロークの含まれる分割単位領域の位置が
安定であり、精度の高い認識が出来るという利点
がある。
第1図a〜dは入力図形パターン例を示す図、
第2図は特徴例を示す図、第3図は本発明の文字
認識装置における実施例を示す図、第4図a〜h
は入力図形パターン例と重心座標系列との関係を
示す図である。 1……光入力、2……光電変換部、3……パタ
ンレジスタ、4……文字線幅計算部、5……サブ
パタン抽出部、6……文字枠検出部、7……文字
投影作成部、8……重心検出部、9……文字枠分
割点決定部、10……特徴抽出部、11……特徴
マトリクス抽出部、12……識別部、13……文
字名出力。
第2図は特徴例を示す図、第3図は本発明の文字
認識装置における実施例を示す図、第4図a〜h
は入力図形パターン例と重心座標系列との関係を
示す図である。 1……光入力、2……光電変換部、3……パタ
ンレジスタ、4……文字線幅計算部、5……サブ
パタン抽出部、6……文字枠検出部、7……文字
投影作成部、8……重心検出部、9……文字枠分
割点決定部、10……特徴抽出部、11……特徴
マトリクス抽出部、12……識別部、13……文
字名出力。
Claims (1)
- 【特許請求の範囲】 1 文字図形パターンを所望の方向に走査して、
当該走査方向における文字線の断面を検出し、断
面長が前記文字図形パターンの文字線幅より十分
長い断面を抽出することによりサブパターンを抽
出し、前記サブパターンについて前記文字図形パ
ターンの方形文字外接枠の4辺のうち、少なくと
も2辺以上の辺上の各点から所定の方向へ走査し
て走査線上におけるすべての文字線の位置を検出
し走査を開始した辺上の点と前記検出した文字線
との距離を前記文字外接枠の前記所定の方向の大
きさで正規化した値のN乗和(N:定数)を抽出
したものを文字図形パターンに特徴量とし、方形
文字外接枠の各辺をM個の区間に分割し、分割単
位領域内の前記特徴量の平均値を要素としてM×
K次元(K:走査した辺の総数)の特徴マトリク
スを抽出し、あらかじめ用意した標準文字マスク
を前記特徴マトリクス同形式で記述した辞書を参
照して文字図形パターンの認識を行う文字認識方
法であり、入力文字図形パターンをX軸とY軸と
に夫々投影して夫々の黒ビツト数分布を求める段
階と、 まず、文字枠の範囲を対象として夫々の黒ビツ
ト数分布の夫々の重心座標を決定し次いでそれま
でに検出した夫々の重心座標で文字枠を分割した
夫々の範囲を対象として夫々の前記黒ビツト数分
布の重心座標を決定する過程を複数回繰返して夫
夫の重心座標系列を求める段階と、 座標値の大きさの順に付した夫々の重心座標系
列における重心座標番号と座標値の大きさの順に
付したX軸、Y軸の分割座標系列における夫々の
分割座標番号とをほぼ均等に対応させて重心座標
系列における1つの重心座標を1つの分割座標に
対応づけて夫々の分割座標系列を決定する段階と
を備え、2系統の前記分割座標で方形文字外接枠
の各辺を分割した領域を前記分割単位領域として
設定することを特徴とする文字認識方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP58152998A JPS6045885A (ja) | 1983-08-24 | 1983-08-24 | 文字認識方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP58152998A JPS6045885A (ja) | 1983-08-24 | 1983-08-24 | 文字認識方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS6045885A JPS6045885A (ja) | 1985-03-12 |
JPH0547871B2 true JPH0547871B2 (ja) | 1993-07-19 |
Family
ID=15552714
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP58152998A Granted JPS6045885A (ja) | 1983-08-24 | 1983-08-24 | 文字認識方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS6045885A (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02287894A (ja) * | 1989-04-28 | 1990-11-27 | Oki Electric Ind Co Ltd | 文字認識装置 |
-
1983
- 1983-08-24 JP JP58152998A patent/JPS6045885A/ja active Granted
Also Published As
Publication number | Publication date |
---|---|
JPS6045885A (ja) | 1985-03-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPH0547871B2 (ja) | ||
JPH0147829B2 (ja) | ||
JPH0475553B2 (ja) | ||
JP2616994B2 (ja) | 特徴抽出装置 | |
JPH0147835B2 (ja) | ||
JPS6019287A (ja) | 文字認識方法 | |
JPH0656625B2 (ja) | 特徴抽出方式 | |
JP3083609B2 (ja) | 情報処理装置及びそれを用いた文字認識装置 | |
JP2749947B2 (ja) | 文字認識方法 | |
JP2827288B2 (ja) | 文字認識装置 | |
JPH0545992B2 (ja) | ||
JP2749946B2 (ja) | 文字認識方法 | |
JPS60181884A (ja) | 文字認識方式 | |
JPH0632080B2 (ja) | 文字認識方式 | |
JPH02287894A (ja) | 文字認識装置 | |
JPS5837780A (ja) | 文字認識方式 | |
JPH0664629B2 (ja) | 文字認識方式 | |
JPH0545991B2 (ja) | ||
JPS58123178A (ja) | 文字認識方式 | |
JPS6363952B2 (ja) | ||
JPH01152586A (ja) | 文字図形認識方法 | |
JPH0656624B2 (ja) | 特徴抽出方式 | |
JPH03670B2 (ja) | ||
JPH0632081B2 (ja) | 文字認識方式 | |
JPH0799536B2 (ja) | 文字図形認識方式 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
LAPS | Cancellation because of no payment of annual fees |