JPH0869506A - 手書き文字の認識方法および装置 - Google Patents
手書き文字の認識方法および装置Info
- Publication number
- JPH0869506A JPH0869506A JP7185824A JP18582495A JPH0869506A JP H0869506 A JPH0869506 A JP H0869506A JP 7185824 A JP7185824 A JP 7185824A JP 18582495 A JP18582495 A JP 18582495A JP H0869506 A JPH0869506 A JP H0869506A
- Authority
- JP
- Japan
- Prior art keywords
- character
- vector
- recognition
- characters
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Character Discrimination (AREA)
Abstract
(57)【要約】
【課題】 ハングル手書き文字を無制約に信頼性よく認
識できる装置が具現される、手書き文字の認識方法およ
び装置を提供する。 【解決手段】 I×J大きさで文字映像を入力する段階
と、前記入力された文字映像から有限個の座標からなる
特徴ベクトルを統計的な方法で計算する段階と、認識対
象文字に対応する代表ベクトル集合内で前記計算された
特徴ベクトルと最も類似した代表ベクトルを捜す段階
と、前記捜された代表ベクトルに該当する認識対象文字
と該文字を含む候補文字群を求める段階と、前記候補文
字群のサンプル文字パターンから有限個の座標からなる
特徴ベクトルを使用して構成した神経網を通じ前記求め
られた候補文字群のうちで1つの文字を最終認識結果と
出力する段階とを備える。
識できる装置が具現される、手書き文字の認識方法およ
び装置を提供する。 【解決手段】 I×J大きさで文字映像を入力する段階
と、前記入力された文字映像から有限個の座標からなる
特徴ベクトルを統計的な方法で計算する段階と、認識対
象文字に対応する代表ベクトル集合内で前記計算された
特徴ベクトルと最も類似した代表ベクトルを捜す段階
と、前記捜された代表ベクトルに該当する認識対象文字
と該文字を含む候補文字群を求める段階と、前記候補文
字群のサンプル文字パターンから有限個の座標からなる
特徴ベクトルを使用して構成した神経網を通じ前記求め
られた候補文字群のうちで1つの文字を最終認識結果と
出力する段階とを備える。
Description
【0001】
【発明の属する技術分野】本発明は手書き文字認識方法
および装置に係り、特に手書きハングル文字の認識方法
および装置に関する。
および装置に係り、特に手書きハングル文字の認識方法
および装置に関する。
【0002】
【従来の技術】光学文字認識(OCR:Optical
Character Recognition)とは
スキャナーを通じて入力された文字映像で文字に該当す
る部分の内容を認識する技術を意味する。このようなO
CR技術は印刷体文字を認識する場合と手書き文字を認
識する場合とに大別されて研究開発されつつある。印刷
体文字を認識する技術は急速な発展を続けているが、手
書き文字の認識は不特定多数の手書き者および不規則な
手書き習慣による手書き文字の多様性のために優れた手
書き文字の認識装置の出現が困難であった。
Character Recognition)とは
スキャナーを通じて入力された文字映像で文字に該当す
る部分の内容を認識する技術を意味する。このようなO
CR技術は印刷体文字を認識する場合と手書き文字を認
識する場合とに大別されて研究開発されつつある。印刷
体文字を認識する技術は急速な発展を続けているが、手
書き文字の認識は不特定多数の手書き者および不規則な
手書き習慣による手書き文字の多様性のために優れた手
書き文字の認識装置の出現が困難であった。
【0003】手書き文字を認識するための代表的な技法
としては円形整合(Template Matchin
g)方法、NNC(Nearest Neighbor
Classification)方法、構造的方法、
人工神経網方法、隠匿マルコブ(Marcov)モデル
を利用した方法などがあるが、これらの大部分は認識対
象文字数の少ない数字や欧文手書きのための方法であっ
てハングルにそのまま適用するのは難しい。したがっ
て、現在活発に研究されている手書き漢字およびアラビ
ア数字の認識はさまざまな認識技法を結合した方式を採
っている((1)T.H.Hildebrandt a
nd W.Liu,Optical Recognit
ion of Handwritten Chines
e Characters:Advances Sin
ce 1980,PatternRecognitio
n,Vol.26,No.2,1983,205−22
5 (2)E.Cohen,J.J.Hull and
S.N.Srihari,Understanding
Handwritten text in aStr
uctured Environment:Deter
mining ZIP Codes from Add
resses,in Characterand Ha
ndwritting Recognition:Ex
panding Frontiers,P.S.P W
ang ed.,World Scientific
Publishing Company,1991,2
21−264)。
としては円形整合(Template Matchin
g)方法、NNC(Nearest Neighbor
Classification)方法、構造的方法、
人工神経網方法、隠匿マルコブ(Marcov)モデル
を利用した方法などがあるが、これらの大部分は認識対
象文字数の少ない数字や欧文手書きのための方法であっ
てハングルにそのまま適用するのは難しい。したがっ
て、現在活発に研究されている手書き漢字およびアラビ
ア数字の認識はさまざまな認識技法を結合した方式を採
っている((1)T.H.Hildebrandt a
nd W.Liu,Optical Recognit
ion of Handwritten Chines
e Characters:Advances Sin
ce 1980,PatternRecognitio
n,Vol.26,No.2,1983,205−22
5 (2)E.Cohen,J.J.Hull and
S.N.Srihari,Understanding
Handwritten text in aStr
uctured Environment:Deter
mining ZIP Codes from Add
resses,in Characterand Ha
ndwritting Recognition:Ex
panding Frontiers,P.S.P W
ang ed.,World Scientific
Publishing Company,1991,2
21−264)。
【0004】NNC方法は有限個の認識対象文字に対す
る代表値を任意に求めた後、入力文字パターンを認識す
る際には入力文字パターンから抽出した特徴値と最も類
似した代表値を捜して該当する文字又は文字集合を求め
るパターン認識方法である。一般的にNNC方法は他の
パターン認識方法に比べて具現および応用が容易であ
り、処理速度の側面において性能が優れるので、ハング
ルや漢字のように認識対象文字数の多い場合に効果的に
使用され得る。
る代表値を任意に求めた後、入力文字パターンを認識す
る際には入力文字パターンから抽出した特徴値と最も類
似した代表値を捜して該当する文字又は文字集合を求め
るパターン認識方法である。一般的にNNC方法は他の
パターン認識方法に比べて具現および応用が容易であ
り、処理速度の側面において性能が優れるので、ハング
ルや漢字のように認識対象文字数の多い場合に効果的に
使用され得る。
【0005】これまで発表されてきた大部分のハングル
認識方法および装置は楷書体や初声、中声、終声が連結
しないように手書きした字素分離体、又は初声、中声、
終声を上下に分離して作成したセンムル体(Saem−
mul characters)に局限されている。ま
た、常用ハングル2350字の全てを認識対象とせず通
常主に用いられるハングル100字ないし1000字を
選んでこれらのみを対象と認識しており一般的な環境に
適用しにくかった。
認識方法および装置は楷書体や初声、中声、終声が連結
しないように手書きした字素分離体、又は初声、中声、
終声を上下に分離して作成したセンムル体(Saem−
mul characters)に局限されている。ま
た、常用ハングル2350字の全てを認識対象とせず通
常主に用いられるハングル100字ないし1000字を
選んでこれらのみを対象と認識しており一般的な環境に
適用しにくかった。
【0006】常用ハングルの文字数は2350字で認識
の対象が多すぎて、多数の手書き者による手書き文字が
さまざまであるために、従来に提案された方法では優れ
た性能を有する認識装置が提供しにくく、新しい認識方
法が要求されてきた。
の対象が多すぎて、多数の手書き者による手書き文字が
さまざまであるために、従来に提案された方法では優れ
た性能を有する認識装置が提供しにくく、新しい認識方
法が要求されてきた。
【0007】
【発明が解決しようとする課題】本発明の目的は、この
ような従来の技術の問題点を解決するために、認識性能
の優れた手書きハングル文字の認識方法および装置を提
供することにある。
ような従来の技術の問題点を解決するために、認識性能
の優れた手書きハングル文字の認識方法および装置を提
供することにある。
【0008】
【課題を達成するための手段】前記目的を達成するため
の本発明の方法は、I×J大きさで文字映像を入力する
段階と、前記入力された文字映像のパタ−ンに対する特
徴として有限個の座標からなる特徴ベクトルを統計的な
方法で計算する段階と、認識対象文字に対応する代表ベ
クトル集合内で前記計算された特徴ベクトルと最も類似
した代表ベクトルを捜す段階と、前記捜された代表ベク
トルに該当する認識対象文字と該文字を含む候補文字群
を求める段階と、前記候補文字群の文字パターンに対す
る有限個の座標からなる特徴ベクトルを使用して構成し
た神経網を通じ前記求められた候補文字群のうちで1つ
の文字を最終認識結果として出力する段階とを備えるこ
とを特徴とする。
の本発明の方法は、I×J大きさで文字映像を入力する
段階と、前記入力された文字映像のパタ−ンに対する特
徴として有限個の座標からなる特徴ベクトルを統計的な
方法で計算する段階と、認識対象文字に対応する代表ベ
クトル集合内で前記計算された特徴ベクトルと最も類似
した代表ベクトルを捜す段階と、前記捜された代表ベク
トルに該当する認識対象文字と該文字を含む候補文字群
を求める段階と、前記候補文字群の文字パターンに対す
る有限個の座標からなる特徴ベクトルを使用して構成し
た神経網を通じ前記求められた候補文字群のうちで1つ
の文字を最終認識結果として出力する段階とを備えるこ
とを特徴とする。
【0009】本発明の装置は、手書き文字映像を二進映
像としてディジタイジングする入力部と、入力された二
進映像を分離して1文字ずつ出力する前処理部と、各認
識対象文字を代表とし、該認識対象文字を含める候補文
字群からなる候補文字群を貯蔵した候補文字群記憶部
と、前記集めた認識対象文字に対応する全ての特徴ベク
トルを貯蔵する代表ベクトル記憶部と、前記前処理部を
経て入力された文字パターンの特徴ベクトルを求め、求
められた特徴ベクトルと最も類似した代表ベクトルを前
記代表ベクトル記憶部から探し、捜された代表ベクトル
に対する認識対象文字と該認識対象文字に対する候補文
字群を前記候補文字記憶部から捜す大分類部と、前記候
補文字群記憶部に貯蔵された各候補文字群に対する神経
網からなる神経網記憶部と、前記神経網記憶部に貯蔵さ
れた当該神経網を通じて前記大分類部から捜された候補
文字群のうちで1つの文字を最終認識結果と認識した
後、前記前処理部に制御信号を提供して次に認識しよう
とする文字を同様の方式で供給するようにする詳細分類
部とを備えることを特徴とする。
像としてディジタイジングする入力部と、入力された二
進映像を分離して1文字ずつ出力する前処理部と、各認
識対象文字を代表とし、該認識対象文字を含める候補文
字群からなる候補文字群を貯蔵した候補文字群記憶部
と、前記集めた認識対象文字に対応する全ての特徴ベク
トルを貯蔵する代表ベクトル記憶部と、前記前処理部を
経て入力された文字パターンの特徴ベクトルを求め、求
められた特徴ベクトルと最も類似した代表ベクトルを前
記代表ベクトル記憶部から探し、捜された代表ベクトル
に対する認識対象文字と該認識対象文字に対する候補文
字群を前記候補文字記憶部から捜す大分類部と、前記候
補文字群記憶部に貯蔵された各候補文字群に対する神経
網からなる神経網記憶部と、前記神経網記憶部に貯蔵さ
れた当該神経網を通じて前記大分類部から捜された候補
文字群のうちで1つの文字を最終認識結果と認識した
後、前記前処理部に制御信号を提供して次に認識しよう
とする文字を同様の方式で供給するようにする詳細分類
部とを備えることを特徴とする。
【0010】
【作用】本発明の方法は、鋳型マッチング方法を利用し
て入力された手書き文字パターンから認識対象文字群、
すなわち候補文字群を構成し、認識対象文字群に対する
遂行力の優れた神経網を通じて候補文字群のうちの1つ
の文字を最終認識結果として出力することにより、ハン
グル手書きの認識における無制限の文字認識が可能であ
る。
て入力された手書き文字パターンから認識対象文字群、
すなわち候補文字群を構成し、認識対象文字群に対する
遂行力の優れた神経網を通じて候補文字群のうちの1つ
の文字を最終認識結果として出力することにより、ハン
グル手書きの認識における無制限の文字認識が可能であ
る。
【0011】
【発明の実施の形態】以下、添付した図面に基づき本発
明の実施例を詳細に説明する。
明の実施例を詳細に説明する。
【0012】本発明の方法は、I×J大きさで文字映像
を入力し、前記入力された文字映像のパターンに対する
特徴として有限個の座標からなる特徴ベクトルを統計的
な方法で計算し、認識対象文字に対応する代表ベクトル
集合内で前記計算された特徴ベクトルと最も類似した代
表ベクトルを探し、前記捜された代表ベクトルに該当す
る文字と該文字を含む候補文字群を求めて候補文字群に
該当する神経網を通じて前記求められた候補文字群のう
ちで1つの文字を最終認識結果と認識するようになる。
を入力し、前記入力された文字映像のパターンに対する
特徴として有限個の座標からなる特徴ベクトルを統計的
な方法で計算し、認識対象文字に対応する代表ベクトル
集合内で前記計算された特徴ベクトルと最も類似した代
表ベクトルを探し、前記捜された代表ベクトルに該当す
る文字と該文字を含む候補文字群を求めて候補文字群に
該当する神経網を通じて前記求められた候補文字群のう
ちで1つの文字を最終認識結果と認識するようになる。
【0013】図1は本発明による手書き文字認識装置の
ブロック図である。図1の装置は手書き文字映像をスキ
ャナを通じて二進映像化して入力する入力部10と、該
入力部10を通じて入力された二進映像を分離して1文
字ずつ出力する前処理部20と、認識対象文字に該当す
る候補文字群を貯蔵した候補文字群記憶部30と、各認
識対象文字に該当する各代表特徴ベクトルを貯蔵する代
表ベクトル記憶部40と、前記前処理部20を経て入力
された文字パターンの特徴ベクトルを求め、求められた
特徴ベクトルと最も類似した代表ベクトルを前記代表ベ
クトル記憶部40から探し、捜された代表ベクトルに対
する認識対象文字と該文字についての候補文字群を前記
候補文字記憶部30に貯蔵された全ての候補文字群に対
する神経網からなる神経網記憶部60と、前記神経網記
憶部60に貯蔵された当該神経網を通じて前記大分類部
50から捜された候補文字群のうちで1つの文字を最終
認識結果と認識した後、前記前処理部20に制御信号を
提供して次に認識しようとする文字を同一の方式で供給
するようにする詳細分類部70とを含む。この過程は入
力文書内のすべての文字が認識されるまで繰り返され
る。
ブロック図である。図1の装置は手書き文字映像をスキ
ャナを通じて二進映像化して入力する入力部10と、該
入力部10を通じて入力された二進映像を分離して1文
字ずつ出力する前処理部20と、認識対象文字に該当す
る候補文字群を貯蔵した候補文字群記憶部30と、各認
識対象文字に該当する各代表特徴ベクトルを貯蔵する代
表ベクトル記憶部40と、前記前処理部20を経て入力
された文字パターンの特徴ベクトルを求め、求められた
特徴ベクトルと最も類似した代表ベクトルを前記代表ベ
クトル記憶部40から探し、捜された代表ベクトルに対
する認識対象文字と該文字についての候補文字群を前記
候補文字記憶部30に貯蔵された全ての候補文字群に対
する神経網からなる神経網記憶部60と、前記神経網記
憶部60に貯蔵された当該神経網を通じて前記大分類部
50から捜された候補文字群のうちで1つの文字を最終
認識結果と認識した後、前記前処理部20に制御信号を
提供して次に認識しようとする文字を同一の方式で供給
するようにする詳細分類部70とを含む。この過程は入
力文書内のすべての文字が認識されるまで繰り返され
る。
【0014】入力部10は、映像スキャナー又はCCD
カメラのようなイメージピックアップ装置からなり、映
像をコンピューターが判読可能な二進映像のディジタル
パターンに変換して入力する。この時、文字領域は黒点
にディジタイズされ、背景は白点にディジタイズされ
る。
カメラのようなイメージピックアップ装置からなり、映
像をコンピューターが判読可能な二進映像のディジタル
パターンに変換して入力する。この時、文字領域は黒点
にディジタイズされ、背景は白点にディジタイズされ
る。
【0015】前処理部20は、入力部10で生成した入
力パターンから文字パターン以外の雑音成分を除去し、
それぞれのハングル文字を分離して1文字ずつ出力す
る。前処理部の構成を簡略にするために文書を構成する
際、手書き文字領域を除いた絵や説明文などは入力部1
0の映像ピックアップ装置が感知できない色を使用して
印刷処理するのが望ましい。
力パターンから文字パターン以外の雑音成分を除去し、
それぞれのハングル文字を分離して1文字ずつ出力す
る。前処理部の構成を簡略にするために文書を構成する
際、手書き文字領域を除いた絵や説明文などは入力部1
0の映像ピックアップ装置が感知できない色を使用して
印刷処理するのが望ましい。
【0016】大分類部50では次のような方法で前処理
部20から入力された入力文字パターンの特徴ベクトル
を求める。
部20から入力された入力文字パターンの特徴ベクトル
を求める。
【0017】文字パターンに対する大分類特徴として有
限個の座標からなるベクトルを統計的な方法で計算す
る。特徴ベクトルを求めるためには、先ずI×J大きさ
の入力映像をM×N大きさのセルに分割(I≧M,J≧
Nであり、I,J,M,Nは0より大きい整数)し、多
数の手書き者の文字多様性による問題点を解決するため
に非線形的な方式を適用する(Y.Yamashit
a, K.Higuchi, Y.Yamada an
d Y.Haga, Classification
of Handprinted Kanji Char
acters bythe structured s
egment matching method,pa
tterrn recognition letter
s,Vol.1,1983,475〜479)。すなわ
ち、入力映像を垂直方向のM個のストリップに分割し、
各ストリップ内で黒画素の個数を均一にする。同様の方
法で水平方向へもN個のストリップに分割すると、入力
映像がMN個のセルに分割される。各セルに対して2つ
の特徴値、すなわち垂直方向成分値FV と水平方向成分
値FH とを次のように計算する。
限個の座標からなるベクトルを統計的な方法で計算す
る。特徴ベクトルを求めるためには、先ずI×J大きさ
の入力映像をM×N大きさのセルに分割(I≧M,J≧
Nであり、I,J,M,Nは0より大きい整数)し、多
数の手書き者の文字多様性による問題点を解決するため
に非線形的な方式を適用する(Y.Yamashit
a, K.Higuchi, Y.Yamada an
d Y.Haga, Classification
of Handprinted Kanji Char
acters bythe structured s
egment matching method,pa
tterrn recognition letter
s,Vol.1,1983,475〜479)。すなわ
ち、入力映像を垂直方向のM個のストリップに分割し、
各ストリップ内で黒画素の個数を均一にする。同様の方
法で水平方向へもN個のストリップに分割すると、入力
映像がMN個のセルに分割される。各セルに対して2つ
の特徴値、すなわち垂直方向成分値FV と水平方向成分
値FH とを次のように計算する。
【0018】Fv=Bv/Bp FH=BH/Bp (但し、Bpは入力映像内の全体黒画素の個数で、Bv
はセル内に存在する垂直方向成分に属する黒画素の個数
で、BHはセル内に存在する水平方向成分に属する黒画
素の個数である。) ここで、垂直、水平方向成分は垂直水平方向のラン(R
UN:スキャンライン内の連続する黒画素)のうちでそ
の長さが臨界値Tより大きいランの集合をいう。臨界値
Tは与えられた文字画の厚さWに応じて動的に設定し、
例えば文字画の厚さの2.5倍と設定する。文字画の厚
さWは下記の式の通りである。
はセル内に存在する垂直方向成分に属する黒画素の個数
で、BHはセル内に存在する水平方向成分に属する黒画
素の個数である。) ここで、垂直、水平方向成分は垂直水平方向のラン(R
UN:スキャンライン内の連続する黒画素)のうちでそ
の長さが臨界値Tより大きいランの集合をいう。臨界値
Tは与えられた文字画の厚さWに応じて動的に設定し、
例えば文字画の厚さの2.5倍と設定する。文字画の厚
さWは下記の式の通りである。
【0019】W=Bp/(Bp−Wp) (ただし、Bpは入力映像内で黒画素の個数で、Wpは
ピクセルと並んで配列された2×2ウインドー内に3つ
の隣画素が有する黒画素の個数である) これまで説明した方法により入力文字映像から2MN個
の特徴値を求める実行例を図2Aないし図2Cに示し
た。また、入力映像を45°に回転させたパターンに対
しても前記と同一の方法を適用してさらに他の2MN個
の特徴値を計算する。回転された映像から抽出した水平
および垂直成分は元の映像から斜線および逆斜線成分に
該当する。結果として4MN個の値からなる特徴ベクト
ルを構成する。
ピクセルと並んで配列された2×2ウインドー内に3つ
の隣画素が有する黒画素の個数である) これまで説明した方法により入力文字映像から2MN個
の特徴値を求める実行例を図2Aないし図2Cに示し
た。また、入力映像を45°に回転させたパターンに対
しても前記と同一の方法を適用してさらに他の2MN個
の特徴値を計算する。回転された映像から抽出した水平
および垂直成分は元の映像から斜線および逆斜線成分に
該当する。結果として4MN個の値からなる特徴ベクト
ルを構成する。
【0020】代表ベクトル記憶部40には前述したよう
に認識対象文字、例えばハングル手書きの場合には23
50字の各代表文字に対する特徴ベクトルが同一の方法
で求められ貯蔵されたものである。すなわち、それぞれ
のこれらは認識対象文字に対するサンプルパターンの特
徴ベクトルを平均して得て、訓練サンプルが多いほど信
頼性ある代表ベクトルを得ることができる。
に認識対象文字、例えばハングル手書きの場合には23
50字の各代表文字に対する特徴ベクトルが同一の方法
で求められ貯蔵されたものである。すなわち、それぞれ
のこれらは認識対象文字に対するサンプルパターンの特
徴ベクトルを平均して得て、訓練サンプルが多いほど信
頼性ある代表ベクトルを得ることができる。
【0021】大分類部50では代表ベクトル記憶部40
に貯蔵された代表ベクトル集合内で入力文字から求めら
れた特徴ベクトルと最も類似したものを捜す。入力文字
パターンから抽出した特徴ベクトルVと代表ベクトル集
合内の任意の代表ベクトルMi の間の類似度Si は特徴
ベクトルの分布された空間上での距離で測定し、その公
式は次の通りである。
に貯蔵された代表ベクトル集合内で入力文字から求めら
れた特徴ベクトルと最も類似したものを捜す。入力文字
パターンから抽出した特徴ベクトルVと代表ベクトル集
合内の任意の代表ベクトルMi の間の類似度Si は特徴
ベクトルの分布された空間上での距離で測定し、その公
式は次の通りである。
【0022】 ここで、V=v1,v2,v3,…,vm、Mi=mi
1,mi2,mi3,…,minで、n=4MN、1≦
i≦2350である。それで、Siの値が小さくなるほ
ど両ベクトルの類似度は高いとみなされ最も高い類似度
を有する代表ベクトルを捜す。
1,mi2,mi3,…,minで、n=4MN、1≦
i≦2350である。それで、Siの値が小さくなるほ
ど両ベクトルの類似度は高いとみなされ最も高い類似度
を有する代表ベクトルを捜す。
【0023】候補文字群記憶部30では認識対象文字の
候補文字群を貯蔵する所、次のように候補文字群が定め
られる。候補文字群を構成するために訓練サンプルに対
する枠整合(Template Matching)を
遂行して得られる混沌対集合(誤認識類型、confu
sion matrix)を利用する。すなわち、Ci
以外の他の文字Cjが大分類部によ
候補文字群を貯蔵する所、次のように候補文字群が定め
られる。候補文字群を構成するために訓練サンプルに対
する枠整合(Template Matching)を
遂行して得られる混沌対集合(誤認識類型、confu
sion matrix)を利用する。すなわち、Ci
以外の他の文字Cjが大分類部によ
【0024】
【外1】
【0025】字に関する情報を各文字別に集めて、該文
字を頻度順に整列してこれらのうちの上位のいくつかを
選択すればCiに対する候補文字群を構成することがで
きる。結果として、こうして予め構成された候補文字群
を候補文字群記憶部30に貯蔵しておく。本発明の実施
例では認識対象文字のそれぞれに対して候補文字群に対
する正認識率、すなわち、与えられたサンプル文字パタ
ーンに対する認識対象文字が鋳型マッチングにより見い
だされた候補文字群に含まれる可能性が99%以上を保
ち、各文字群の大きさが20字を越さないように制限し
た。
字を頻度順に整列してこれらのうちの上位のいくつかを
選択すればCiに対する候補文字群を構成することがで
きる。結果として、こうして予め構成された候補文字群
を候補文字群記憶部30に貯蔵しておく。本発明の実施
例では認識対象文字のそれぞれに対して候補文字群に対
する正認識率、すなわち、与えられたサンプル文字パタ
ーンに対する認識対象文字が鋳型マッチングにより見い
だされた候補文字群に含まれる可能性が99%以上を保
ち、各文字群の大きさが20字を越さないように制限し
た。
【0026】以上のように大分類部50では入力文字パ
ターンの特徴ベクトルを求めた後、代表ベクトル記憶部
40を参照して最も類似した代表ベクトルを探し、捜さ
れた代表ベクトルに対する文字と該文字を含む候補文字
群を候補文字群記憶部30を参照して捜す過程を遂行す
る。
ターンの特徴ベクトルを求めた後、代表ベクトル記憶部
40を参照して最も類似した代表ベクトルを探し、捜さ
れた代表ベクトルに対する文字と該文字を含む候補文字
群を候補文字群記憶部30を参照して捜す過程を遂行す
る。
【0027】神経網部60は、大分類部による候補文字
群から1つの文字を最終的に捜すために神経網を貯蔵す
るものであり、各神経網は次のように構成される。
群から1つの文字を最終的に捜すために神経網を貯蔵す
るものであり、各神経網は次のように構成される。
【0028】文字パターンに対する神経網の特徴として
有限個の座標からなるベクトルを統計的な方法で計算す
る。神経網に用いられる特徴を抽出するために、大分類
部50の特徴ベクトルの場合のように水平および垂直の
両方向に対して文字映像をN×Mセルに非線形分割した
後、各セル内の黒画素の属する水平ランと垂直ランとの
割合を求めてセル特徴値を計算する。神経網のための特
徴抽出の実施例を図4に示した。先ず、水平および垂直
方法のそれぞれについて文字映像をN×Mセルに非線形
分割した後、それぞれの黒画素Px,y(0≦x≦W、
0≦y≦H;Wは文字映像の幅、Hは文字映像の高さで
ある)が属する水平ランの長さRLHx,yと垂直ラン
の長さRLVx,yとを求める。次にはそれぞれのP
x,yにおいて横方向の寄与度DCHx,yと縦方向の
寄与度DCVx,yとを次のように求める。
有限個の座標からなるベクトルを統計的な方法で計算す
る。神経網に用いられる特徴を抽出するために、大分類
部50の特徴ベクトルの場合のように水平および垂直の
両方向に対して文字映像をN×Mセルに非線形分割した
後、各セル内の黒画素の属する水平ランと垂直ランとの
割合を求めてセル特徴値を計算する。神経網のための特
徴抽出の実施例を図4に示した。先ず、水平および垂直
方法のそれぞれについて文字映像をN×Mセルに非線形
分割した後、それぞれの黒画素Px,y(0≦x≦W、
0≦y≦H;Wは文字映像の幅、Hは文字映像の高さで
ある)が属する水平ランの長さRLHx,yと垂直ラン
の長さRLVx,yとを求める。次にはそれぞれのP
x,yにおいて横方向の寄与度DCHx,yと縦方向の
寄与度DCVx,yとを次のように求める。
【0029】DCHx,y=RLHx,y/(RLH
x,y+RLVx,y) DCVx,y=RLVx,y/(RLHx,y+RLV
x,y) 最後に非線形分割されたN×Mセル内に存在する全ての
黒画素に対するDCHx,y、DCVx,yの平均値を
求めて2(N×M)次元の特徴ベクトルを計算する。ま
た、これまで説明した方法を白画素に対しても適用し、
さらに他の2(N×M)次元の特徴ベクトルを計算して
最終的に4(N×M)次元の特徴ベクトルを求める。
x,y+RLVx,y) DCVx,y=RLVx,y/(RLHx,y+RLV
x,y) 最後に非線形分割されたN×Mセル内に存在する全ての
黒画素に対するDCHx,y、DCVx,yの平均値を
求めて2(N×M)次元の特徴ベクトルを計算する。ま
た、これまで説明した方法を白画素に対しても適用し、
さらに他の2(N×M)次元の特徴ベクトルを計算して
最終的に4(N×M)次元の特徴ベクトルを求める。
【0030】本発明で採択した神経網構造は図5と同様
である。ここで、入力ノードは入力文字映像から抽出し
た特徴値の個数に該当する4(N×M)で、出力層は認
識対象文字数ほどのノードからなり、中間ノードの個数
は出力ノード数×2+1個からなる。ここで、入力層と
中間層にそれぞれ1つずつの誤差補正ノードを使用し
た。図5のような神経網で手書きハングル文字を認識す
る実行例を図6に示した。
である。ここで、入力ノードは入力文字映像から抽出し
た特徴値の個数に該当する4(N×M)で、出力層は認
識対象文字数ほどのノードからなり、中間ノードの個数
は出力ノード数×2+1個からなる。ここで、入力層と
中間層にそれぞれ1つずつの誤差補正ノードを使用し
た。図5のような神経網で手書きハングル文字を認識す
る実行例を図6に示した。
【0031】神経網部60は前述した神経網からなる
が、神経網部を構成する神経の個数は候補文字群記憶部
内の候補文字群の個数と同様なので、認識対象文字の神
経網の個数と同様である。神経網部60は当該符号文字
群に属するサンプルに対する学習を通じて認識の程度を
増加させ得る。
が、神経網部を構成する神経の個数は候補文字群記憶部
内の候補文字群の個数と同様なので、認識対象文字の神
経網の個数と同様である。神経網部60は当該符号文字
群に属するサンプルに対する学習を通じて認識の程度を
増加させ得る。
【0032】詳細分類部70では大分類部50から捜し
た入力文字パターンに対応する候補文字群から神経網部
60を通じて最終的に1つの文字を捜して手書き文字を
認識する。認識以後には前処理部20に制御信号を提供
して次に認識しようとする文字パターンを大分類部50
に供給する。
た入力文字パターンに対応する候補文字群から神経網部
60を通じて最終的に1つの文字を捜して手書き文字を
認識する。認識以後には前処理部20に制御信号を提供
して次に認識しようとする文字パターンを大分類部50
に供給する。
【0033】本発明では完成型ハングル2350字の集
合又はその部分集合に該当する手書き文字を認識対象と
する。本発明の方法および装置の性能実験のために通常
よく用いられるハングル990字を対象として認識シス
テムを構成した。構成されたシステムの構成要素は99
0個の7×7×4次元の代表ベクトル、平均5.7字の
候補文字からなる990個の候補文字群、平均大きさが
(7×7×4)×12.4×5.7である990個の神経
網、入力部前処理部、大分類部および詳細分類部であ
る。構成されたシステムを浦項工大(Pohang U
niversity of Science and
Technology)で公開した手書き文字データ
(D.W.Kim、S.Y.Bang、ハングル手書き
映像データベースPE92の紹介、文書分析と認識に関
する第2次国際会議抄録集(1993年10月日本の筑
波、pp470〜473)の全体99000字のうちの
約70%に該当する693000字を学習させ、残りの
297000字で認識したみた時、約90%の正認識率
を示した。
合又はその部分集合に該当する手書き文字を認識対象と
する。本発明の方法および装置の性能実験のために通常
よく用いられるハングル990字を対象として認識シス
テムを構成した。構成されたシステムの構成要素は99
0個の7×7×4次元の代表ベクトル、平均5.7字の
候補文字からなる990個の候補文字群、平均大きさが
(7×7×4)×12.4×5.7である990個の神経
網、入力部前処理部、大分類部および詳細分類部であ
る。構成されたシステムを浦項工大(Pohang U
niversity of Science and
Technology)で公開した手書き文字データ
(D.W.Kim、S.Y.Bang、ハングル手書き
映像データベースPE92の紹介、文書分析と認識に関
する第2次国際会議抄録集(1993年10月日本の筑
波、pp470〜473)の全体99000字のうちの
約70%に該当する693000字を学習させ、残りの
297000字で認識したみた時、約90%の正認識率
を示した。
【0034】
【発明の効果】本発明の手書きハングル文字の認識方法
および装置によると、人間が任意の手書き道具を使用し
て任意の紙上に作成したハングル文字を自動に認識する
ことにより、多量の手書き情報をコンピューターに自動
入力したり多量の郵便物を自動に分類するなどの作業が
可能である。したがって、手作業に依存する既存文書の
内容および新規に発生する情報の入力作業を自動化して
時間、人力および金銭的な側面において多くの利益を創
出することができる。
および装置によると、人間が任意の手書き道具を使用し
て任意の紙上に作成したハングル文字を自動に認識する
ことにより、多量の手書き情報をコンピューターに自動
入力したり多量の郵便物を自動に分類するなどの作業が
可能である。したがって、手作業に依存する既存文書の
内容および新規に発生する情報の入力作業を自動化して
時間、人力および金銭的な側面において多くの利益を創
出することができる。
【図1】本発明による手書き文字認識システムのブロッ
ク図である。
ク図である。
【図2】(A)ないし(C)は図1に示した大分類部に
おける入力文字映像から特徴抽出を説明するための図で
ある。
おける入力文字映像から特徴抽出を説明するための図で
ある。
【図3】図1に示した大分類部と詳細分類部における認
識対象文字の候補文字群を形成する方法を説明するため
の図である。
識対象文字の候補文字群を形成する方法を説明するため
の図である。
【図4】詳細分類部における入力文字映像から水平およ
び垂直特徴を抽出することを説明するための図である。
び垂直特徴を抽出することを説明するための図である。
【図5】神経網記憶部の神経網構成を説明するための図
である。
である。
【図6】本発明による手書き文字認識を遂行した結果の
一実施例を示した図である。
一実施例を示した図である。
10…入力部、 20…前処理部、 30…候補文字群記憶部、 40…代表ベクトル記憶部、 50…大分類部、 60…神経網記憶部、 70…詳細分類部。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 李 相奎 大韓民国ソウル特別市麻浦區阿▲ヨン▼洞 663−15番地
Claims (8)
- 【請求項1】 I×J大きさで文字映像を入力する段階
と、 前記入力された文字映像のパターンに対する特徴として
有限個の座標からなる特徴ベクトルを統計的な方法で計
算する段階と、 認識対象文字に対応する代表ベクトル集合内で前記計算
された特徴ベクトルと最も類似した代表ベクトルを捜す
段階と、 前記捜された代表ベクトルに該当する認識対象文字と該
文字を含む候補文字群を求める段階と、 前記候補文字群の文字パターンに対する有限個の座標か
らなる特徴ベクトルを使用して構成した神経網を通じ前
記求められた候補文字群のうちで1つの文字を最終認識
結果として出力する段階とを備えることを特徴とする手
書き文字認識方法。 - 【請求項2】 前記特徴ベクトルを計算する方法は、 I×J大きさの入力映像を垂直方向のM個のストリップ
に分割し水平方向へN個のストリップに分割してM×N
大きさのセルに非線形分割(I≧M,J≧Nであり、
I,J,M,Nは0より大きい整数)する段階と、 分割された各セルに対して垂直方向成分値FV と水平方
向成分値FH を下記の式 Fv=Bv/Bp FH=BH/Bp (但し、Bpは入力映像内の全体黒画素の個数で、Bv
はセル内に存在する垂直方向成分に属する黒画素の個数
で、BHはセル内に存在する水平方向成分に属する黒画
素の個数である)により求めて2MN個の特徴値を計算
する段階と、 入力映像を45°に回転させたパターンに対しても前記
と同一の方法を適用してさらに他の2MN個の特徴値を
計算する段階と、 前記垂直、水平、斜線および逆斜線成分に対する4MN
個の特徴値を入力文字パターンの特徴ベクトルとして提
供する段階とからなることを特徴とする請求項1に記載
の手書き文字認識方法。 - 【請求項3】 前記垂直、水平方向成分は垂直水平方向
のランのうちでその長さが臨界値Tより大きいランの集
合であることを特徴とする請求項2に記載の手書き文字
認識方法。 - 【請求項4】 前記臨界値Tは認識される文字画の厚さ
であるWに応じて動的に得られることを特徴とする請求
項3に記載の手書き文字認識方法。 - 【請求項5】 前記文字画の厚さは下記の式 W=Bp/(Bp−Wp) (但し、Bpは入力映像内で黒画素の個数で、Wpはピ
クセルと並んで配列された2×2ウインドー内に3つの
隣画素が有する黒画素の個数である。)により求められ
ることを特徴とする請求項4に記載の手書き文字認識方
法。 - 【請求項6】 前記候補文字群はある文字Ciから、文
字のうちにはある特徴ベクトルCjの代表ベクトルまで
の距離が特徴ベクトルCjの代表ベクトルまでの距離よ
り近くてCiと誤認識される文字についての情報を集め
る段階と、この文字を頻度順に整列する段階と、これら
のうちの上位のいくつをCiに対する候補文字群と決定
する段階とにより成されることを特徴とする請求項1に
記載の手書き文字認識方法。 - 【請求項7】 前記神経網の出力を計算するための特徴
ベクトルは、水平および垂直の両方向に対して文字映像
をN×Mに非線形分割する段階と、 それぞれの黒画素Px,y(0≦x≦W、0≦y≦H;
Wは文字映像の幅、Hは文字映像の高さ)が属する水平
ランの長さRLHx,yと垂直ランの長さRLVx,y
とを求める段階と、 次にはそれぞれのPx,yにおいて横方向の寄与度DC
Hx,yと縦方向の寄与度DCVx,yとを下記の式 DCHx,y=RLHx,y/(RLHx,y+RLV
x,y) DCVx,y=RLVx,y/(RLHx,y+RLV
x,y) により求める段階と、 最後に非線形分割されたN×Mセル内に存在する全ての
黒画素に対するDCHx,y、DCVx,yの平均値を
求めて2(N×M)次元の特徴ベクトルを計算する段階
と、 これまでの過程を白画素に対しても適用し、さらに他の
2(N×M)次元の特徴ベクトルを計算して最終的に4
(N×M)次元の特徴ベクトルを求めることを特徴とす
る請求項1に記載の手書き文字認識方法。 - 【請求項8】 手書き文字映像を二進文字映像として入
力する入力部と、 入力された文字映像を分離して1文字ずつ出力する前処
理部と、 各認識対象文字を代表とし、該認識対象文字を含める候
補文字からなる候補文字群を貯蔵した候補文字群記憶部
と、 前記全ての認識対象文字に対応する全ての特徴ベクトル
を貯蔵する代表ベクトル記憶部と、 前記前処理部を経て入力された文字パターンの特徴ベク
トルを求め、求められた特徴ベクトルと最も類似した代
表ベクトルを前記代表ベクトル記憶部から探し、捜され
た代表ベクトルに対する認識対象文字と該認識対象文字
に対する候補文字群を前記候補文字記憶部から捜す大分
類部と、 前記候補文字群記憶部に貯蔵された各候補文字群に対す
る神経網からなる神経網記憶部と、 前記神経網記憶部に貯蔵された当該神経網を通じて前記
大分類部から捜された候補文字群のうちで1つの文字を
最終認識結果と認識した後、前記前処理部に制御信号を
提供して次に認識しようとする文字を入力文字映像内の
すべての文字が認識されるまで供給するようにする詳細
分類部とを備えることを特徴とする手書き文字認識装
置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1019940020288A KR0170656B1 (ko) | 1994-08-17 | 1994-08-17 | 필기체문자 인식방법 및 장치 |
KR94P20288 | 1994-08-17 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH0869506A true JPH0869506A (ja) | 1996-03-12 |
JP2997403B2 JP2997403B2 (ja) | 2000-01-11 |
Family
ID=19390547
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP7185824A Expired - Fee Related JP2997403B2 (ja) | 1994-08-17 | 1995-07-21 | 手書き文字の認識方法および装置 |
Country Status (4)
Country | Link |
---|---|
JP (1) | JP2997403B2 (ja) |
KR (1) | KR0170656B1 (ja) |
CN (1) | CN1081366C (ja) |
TW (1) | TW417055B (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104751263A (zh) * | 2013-12-31 | 2015-07-01 | 南京理工大学常熟研究院有限公司 | 面向计量检定业务的客户等级智能分类方法 |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100440189C (zh) * | 2003-06-04 | 2008-12-03 | 无敌科技(西安)有限公司 | 结合图形描绘的语言学习系统及其运作方法 |
CN1317673C (zh) * | 2004-03-18 | 2007-05-23 | 致伸科技股份有限公司 | 利用神经网络分辨影像中文字与图形的系统及其方法 |
KR100638585B1 (ko) * | 2005-03-23 | 2006-10-26 | 엔에이치엔(주) | 문자 입력 장치 및 상기 문자 입력 장치에서의 문자 입력방법 |
US7929769B2 (en) * | 2005-12-13 | 2011-04-19 | Microsoft Corporation | Script recognition for ink notes |
US7817857B2 (en) | 2006-05-31 | 2010-10-19 | Microsoft Corporation | Combiner for improving handwriting recognition |
CN101561712B (zh) * | 2008-04-14 | 2012-01-25 | 崔学仙 | 一种应用十二键朝鲜文字键盘输入朝鲜文字的方法 |
CN102663388B (zh) * | 2012-03-27 | 2014-01-08 | 复旦大学 | 从背景图片中对手写体字符进行分割的方法 |
CN105938558B (zh) * | 2015-03-06 | 2021-02-09 | 松下知识产权经营株式会社 | 学习方法 |
CN106022273A (zh) * | 2016-05-24 | 2016-10-12 | 华东理工大学 | 基于动态样本选择策略的bp神经网络手写体识别系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5191622A (en) * | 1987-07-17 | 1993-03-02 | Hitachi, Ltd. | Hand-written character recognition apparatus with a personal dictionary preparation function |
-
1994
- 1994-08-17 KR KR1019940020288A patent/KR0170656B1/ko not_active IP Right Cessation
-
1995
- 1995-06-20 TW TW84106312A patent/TW417055B/zh not_active IP Right Cessation
- 1995-06-28 CN CN95107775A patent/CN1081366C/zh not_active Expired - Fee Related
- 1995-07-21 JP JP7185824A patent/JP2997403B2/ja not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104751263A (zh) * | 2013-12-31 | 2015-07-01 | 南京理工大学常熟研究院有限公司 | 面向计量检定业务的客户等级智能分类方法 |
Also Published As
Publication number | Publication date |
---|---|
CN1081366C (zh) | 2002-03-20 |
JP2997403B2 (ja) | 2000-01-11 |
TW417055B (en) | 2001-01-01 |
KR0170656B1 (ko) | 1999-03-30 |
CN1118902A (zh) | 1996-03-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103093240A (zh) | 书法字识别方法 | |
CN112818951A (zh) | 一种票证识别的方法 | |
CN105117741A (zh) | 一种书法字风格的识别方法 | |
CN113139457A (zh) | 一种基于crnn的图片表格提取方法 | |
Basha et al. | A novel approach for optical character recognition (OCR) of handwritten Telugu alphabets using convolutional neural networks | |
CN114677687A (zh) | 一种融合ViT与卷积神经网络的毛笔字体类型快速识别方法 | |
CN110781898A (zh) | 一种中文ocr后处理的无监督学习方法 | |
JP2997403B2 (ja) | 手書き文字の認識方法および装置 | |
Mariyathas et al. | Sinhala handwritten character recognition using convolutional neural network | |
CN114005127A (zh) | 一种基于深度学习的图像光学文字识别方法,存储装置及服务器 | |
Aravinda et al. | Template matching method for Kannada handwritten recognition based on correlation analysis | |
Hewavitharana et al. | Off-Line Sinhala Handwriting Recognition Using Hidden Markov Models. | |
CN107292255B (zh) | 基于特征矩阵相似度分析的手写数字识别方法 | |
Malakar et al. | An improved offline handwritten character segmentation algorithm for Bangla script. | |
Rajput et al. | Recognition and editing of devnagari handwriting using neural network | |
Basu et al. | Segmentation of offline handwritten Bengali script | |
Rocha et al. | A solution to the problem of touching and broken characters | |
Bhandare et al. | Handwritten (Marathi) compound character recognition | |
Chi et al. | Hierarchical content classification and script determination for automatic document image processing | |
Choksi et al. | Hindi optical character recognition for printed documents using fuzzy k-nearest neighbor algorithm: a problem approach in character segmentation | |
Siddhartha et al. | Avoidance of confusion between Similar looking Characters in Neuro-fuzzy based License Plate Recognition | |
Rodrigues et al. | Character feature extraction using polygonal projection sweep (contour detection) | |
JPH0581474A (ja) | 文字列抽出方法および文字領域検出方法 | |
Tingre et al. | An approach for segmentation of characters in CAPTCHA | |
Yadav et al. | Offline Handwritten Character Recognition using Neural Networks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20071029 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081029 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091029 Year of fee payment: 10 |
|
LAPS | Cancellation because of no payment of annual fees |