JP3274825B2 - 手書き文字認識方法と装置 - Google Patents

手書き文字認識方法と装置

Info

Publication number
JP3274825B2
JP3274825B2 JP27059697A JP27059697A JP3274825B2 JP 3274825 B2 JP3274825 B2 JP 3274825B2 JP 27059697 A JP27059697 A JP 27059697A JP 27059697 A JP27059697 A JP 27059697A JP 3274825 B2 JP3274825 B2 JP 3274825B2
Authority
JP
Japan
Prior art keywords
image
standard
displacement
input
functional
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP27059697A
Other languages
English (en)
Other versions
JPH1196300A (ja
Inventor
嘉樹 水上
Original Assignee
嘉樹 水上
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 嘉樹 水上 filed Critical 嘉樹 水上
Priority to JP27059697A priority Critical patent/JP3274825B2/ja
Publication of JPH1196300A publication Critical patent/JPH1196300A/ja
Application granted granted Critical
Publication of JP3274825B2 publication Critical patent/JP3274825B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、手書き文字認識方
法と装置に係り、より詳細には、例えば、アルファベッ
トと異なり、形状が複雑で、しかもカテゴリー数の多い
手書き漢字についても認識性能を向上させ得る手書き文
字認識方法と装置に関する。
【0002】
【従来の技術】従来、形状が複雑で、カテゴリー数の多
い手書き文字の認識方法としては、種々の方法が知られ
ている。この方法は、大別すると、構造解析的手法と、
文字パターン整合手法の2種類に分類することができ
る。手書き漢字のように認識対象カテゴリー数の多い文
字にあっては、文字パターン整合手法が多く採用されて
いる。
【0003】
【発明が解決しようとする課題】しかし、この手書き漢
字等の文字パターンは、高次元のデータであるため、該
文字パターンから直接、入力パターンと標準パターンを
比較・識別することは情報量、計算量的に困難である。
そこで、近年では、入力パターンについて、特徴抽出処
理を行い、予め、辞書として登録してある標準パターン
の特徴データとの距離値、あるいは類似性を計算し、最
小距離値あるいは最大類似度値をとる文字カテゴリーを
識別結果とする方法を用いている。またこの識別方法に
おいて、文字パターンについて太め処理、細め処理を行
ったり、部分的にストロークを接続する方法、あるいは
文字パターン全体を線形・非線形写像関数により幾何学
的に変形することで、その識別精度を向上させることも
知られている。このように文字パターンについて特徴抽
出を行うことで、情報量、計算量を削減することがで
き、計算コストを低下させ得ると共に、限られたサンプ
ル数の範囲内で整合性を求めることができる。
【0004】本発明は、このような手法と同じく、情報
量、計算量を削減することができ、計算コストを低下さ
せ得ると共に、限られたサンプル数の範囲内で整合性を
求めることができ、アルファベットと異なり、形状が複
雑で、しかもカテゴリー数の多い手書き漢字についても
認識性能を向上させ得る手書き文字認識方法と装置を提
供することにある。
【0005】
〔ここで、汎関数Pは標準パターン画像と入力パターン画像の抽出変位を考慮したうえでの重なり合わせの良さを表す汎関数、汎関数Sは抽出変位の滑らかさを表す汎関数、λは汎関数Sの重みを制御する正則化パラメータ、u及びvは水平及び垂直方向の変位を表す実数値関数である。〕
を最小化する条件下における前記標準特徴画像と前記入
力特徴画像との変形変位を抽出する工程と、抽出された
変形変位により、前記両パターン画像の類似性を識別す
る工程、を有することを特徴とする手書き文字認識方法
を提供する。
【0006】また、本発明の手書き文字認識方法は、前
記発明において、前記標準特徴画像が、標準パターン画
像の輪郭あるいは特定の個所や点から水平、右下、垂
直、および左下のそれぞれの方向に対応した特徴画像で
あり、また前記入力特徴画像が、入力パターン画像の輪
郭から水平、右下、垂直、および左下のそれぞれの方向
に対応した特徴画像であることを特徴とする。また、前
記標準特徴画像と入力特徴画像との変形変位を抽出する
際、該標準特徴画像として、準備した複数個の前記標準
特徴画像のうち、該標準特徴画像と入力特徴画像との間
の距離を測定し、該距離の小さい値から複数個の標準特
徴画像を用いることを特徴とする。更に前記標準特徴画
像と入力特徴画像との変形変位を抽出する際、該標準特
徴画像として、準備した複数個の前記標準特徴画像のう
ち、該標準特徴画像と入力特徴画像を重ね合わせて、該
入力特徴画像との類似度の高い上位複数個の標準特徴画
像を用いることを特徴とする。更にまた、前記入力パタ
ーン画像と標準パターン画像の整合性を識別する際、共
分散または分散値を用いることを特徴とする。
【0007】また、本発明の第2の解決手段によると、
標準となる文字の標準パターン画像の輪郭あるいは特定
の個所から異なる方向のそれぞれの方向に対応した標準
特徴画像を作成する手段と、識別する手書き文字を画像
入力した入力パターン画像の輪郭あるいは特定の個所か
ら異なる方向のそれぞれの方向に対応した入力特徴画像
を作成する手段と、 エネルギー汎関数E=P(u,v)+λS(u,v) 〔ここで、汎関数Pは標準パターン画像と入力パターン
画像の抽出変位を考慮したうえでの重なり合わせの良さ
を表す汎関数、汎関数Sは抽出変位の滑らかさを表す汎
関数、λは汎関数Sの重みを制御する正則化パラメー
タ、u及びvは水平及び垂直方向の変位を表す実数値関
数である。〕 を最小化する条件下における前記標準特徴画像と前記入
力特徴画像との変形変位を抽出する手段と、抽出された
変形変位により、前記両パターン画像の類似性を識別す
る手段、を有することを特徴とする手書き文字認識装置
を提供する。
【0008】
【発明の効果】本発明の手書き文字認識方法と装置によ
れば、入力パターン画像と標準パターン画像のそれぞれ
について、その輪郭あるいは特定の個所(点を含む)か
ら異なる方向のそれぞれの方向に対応した入力特徴画像
と、標準特徴画像を作成した後、エネルギー汎関数E=
P(u,v)+λS(u,v)を最小化する条件下にお
ける前記標準特徴画像と入力特徴画像との変形変位を抽
出し、その両特徴画像を識別するので、安定な認識性能
が得られるという効果を有する。
【0009】
【発明の実施の形態】以下、図面を参照しながら、本発
明を具体化した好ましい実施の形態について説明する。
本実施形態の手書き文字認識方法は、手書き漢字の認識
方法であって、概略すると、入力パターン読み込み・
前処理工程、特徴画像作成工程、入力パターン識別
用標準特徴画像選択工程、変位抽出工程、識別工
程、の5つの工程を有する。以下、各工程について説明
する。ここで、入力パターン画像を入力パターン画像
f′(x,y)、正規化後の入力パターン画像を入力パ
ターン画像f(x,y)とする。
【0010】−入力パターン読み込み・前処理工程− 本工程は、識別(認識)しようとする手書き文字を画像
入力すると共に、該画像中に含まれるノイズを除去する
工程である。通常、画像入力は、手書き文字をイメージ
により入力し、入力パターン画像f′(x,y)を得て
いる。この入力パターン画像は、イメージセンサーにキ
ズがあったりすると、これがノイズとなるため、これを
除去する必要がある。該ノイズの除去は、一般的な2値
化処理により画像中に含まれるノイズを除去する。次
に、入力パターン画像f′(x,y)中に含まれる文字
パターン(図1(a)参照)が、64×64の枠に内接
するように位置・大きさの正規化を行なう。そして、原
画像中の文字パターンの外接枠の幅と高さを幅(wid
th)および高さ(height)とし、画像原点と、
外接枠の左上位置の水平および垂直方向にずれをδx,
δyで表現すると、正規化後の画像f(x,y)は次式
により与えられる(図1(b)参照)。
【数1】 但し、「−」のような平らな形状を持つ文字に対して大
きさの正規化を施すことを避けるために、幅(widt
h)>3×高さ(height)が成り立つ場合は、縦
横比を保存して外接枠の横幅が64画素(pixel
s)になるように正規化を行なう。
【0011】−特徴画像作成工程− 本工程は、手書きされた識別する文字パターンを画像入
力し、該入力パターン画像f′(x,y)の正規化後の
入力パターン画像f(x,y)の輪郭から異なる方向の
それぞれの方向に対応した入力特徴画像fk(k=1,
2,3,4)を作成し、また標準となる文字パターンの
標準パターン画像g(x,y)の輪郭から異なる方向の
それぞれの方向に対応した標準特徴画像gk(k=1,
2,3,4)を作成する工程である。この工程では、2
段階の手順に従い、入力パターン画像f(x,y)の輪
郭から水平方向、右下方向、垂直方向、および左下方向
のそれぞれの方向に対応した特徴画像を作成する。具体
的には、次のようにして作成する。まず、輪郭線上の各
画素点において輪郭方向を測定し、得られた方向に対応
する輪郭方向分布画像(64×64画素)に値1を設定
する(図1(c)参照)。但し、傾きの測定時に、雑音
的な輪郭形状の変化に対する安定性の向上のために、注
目画素点の2つの前と後の2輪郭点を結ぶ線分から輪郭
方向を求める。また、このとき得られた方向が4方向の
どれにも完全に一致しない場合は、適当な重みを用いて
その周辺の傾きをもつ輪郭方向分布画像に値が分配され
る。次に、特徴次元数の削減を目的として、輪郭方向分
布画像のそれぞれについて等間隔に16×16点のサン
プリングを行なう(図1(d)参照)。ここでは、領域
分割による影響を少なくするために、ガウシアンフィル
タ(δ=4)を用いた平滑化を行なう。以上の操作によ
って得られた4枚の画像を線素方向特徴画像と呼ぶもの
とし、それぞれfk(k=1,2,3,4)として表
す。ところで、標準特徴画像gk(k=1,2,3,
4)は、予め作成しておいても、入力特徴画像fk(k
=1,2,3,4)を作成する際に、作成してもよい。
その作成方法は、入力特徴画像fk(k=1,2,3,
4)と同様にして作成する。しかし、この他に、例え
ば、複数のサンプルを集めて、その平均値を求める方法
で作成してもよい。
【0012】 −入力パターン識別用標準特徴画像選択工程(大分類工
程)− 本工程は、後工程で、入力パターン画像の入力特徴画像
k(k=1,2,3,4)と、標準特徴画像gk(k=
1,2,3,4)との変位抽出を行う際、複数個の標準
パターン画像のうち何れの標準パターン画像との変位抽
出を行えばよいかについての選択を行う工程である。カ
テゴリ数が膨大である手書き漢字の認識においては、事
前に大まかな分類を行い識別候補を絞り込むことが計算
コストの点から有利である。ここでは、各カテゴリ毎に
準備・作成された標準特徴画像gk(k=1,2,3,
4)と入力特徴画像fkのユークリッド距離を測定し、
小さな値を与えるものから10位までを候補として選択
する。この選択は、手書き漢字により、任意の個数選ぶ
ことができる。
【0013】−変位抽出工程− 本工程は、エネルギー汎関数E=P(u,v)+λS
(u,v) を最小化する条件下における前記標準特徴画像gkと入
力特徴画像fkとの変形変位を抽出する工程である。入
力特徴画像fkは、入力パターン識別用標準特徴画像選
択工程で絞り込まれた各標準特徴画像gKに対して変形
抽出を行う。但し、求める変形変位は、特徴画像間の
ユークリッド距離を小さくすること、変位の水平およ
び垂直方向の変化は滑らかであること、が必要となる。
ここで、標準特徴画像gKの任意の離散点(x,y)に
おける水平および垂直方向の変位を表す実数値関数u
(x,y)およびv(x,y)を導入する(図2参
照)。このとき、先の2つの条件を満たす変位関数u,
vは、次式に示されるエネルギー汎関数Eを最小化する
はずである。
【数2】 ここで、汎関数Pは、抽出変位を考慮した特徴画像間の
ユークリッド距離の自乗値であり、汎関数Sは抽出変位
の滑らかさを表している。よって、変位関数u,vにつ
いて各汎関数値を最小化することは、先の2条件をそれ
ぞれに満たすような変形変位を決定することになる。な
お、λはSの重みを制御する正則化パラメータである。
エネルギー汎関数Eのついてのオイラー・ラグランジェ
方程式は次式のように示することができる。
【数3】 上式について有限差分近似を用いることにより、Gau
ss−Seidel法の反復式が得られる。
【数4】 但し、
【数5】 ここで、tは計算反復回数を表す。また、数値計算時の
安定性の向上のために、後述する式(7)(8)に関し
ては、数値安定性の向上のために、右辺第2項のut
tの値についても式(9)(10)で示されるut,v
tの値を用いるとよい。
【0014】ところで、上述した変位抽出アルゴリズム
に基づいた数値計算を行う場合には、局所解への落ち込
みの回避と、計算コストの削減のために、多解像度画像
を用いた疎密探索を行うことが有効である。本実施形態
方法においては、2段階の階層的構造を用いる。第1段
階においては、特徴抽出部において生成された16×1
6画素の入力特徴画像fkから8×8画素の平滑化入力
特徴画像fk を作成する。
【数6】 同様の計算により平滑化標準特徴画像gK を作成し、
それらに基づき漸化式(7)(8)を反復的に用いて変
位関数u,vを計算する。但し、変位関数u,v
上の各格子点での初期値は0を用いる。また、第2段
階では、変位関数u,vの初期値は、既に得られた
,vの値から次式を用いて設定する。
【数7】 入力特徴画像fkおよび標準特徴画像gKに基づき、漸化
式(7)(8)を反復的に用いて変位関数u,vを計算
する。
【0015】−識別工程− 本工程は、標準特徴画像gkと入力特徴画像fkとの変形
変位により、前記入力パターン画像f(x,y)と、標
準パターン画像g(x,y)の類似性(換言すれば、標
準特徴画像gkと入力特徴画像fkの類似性)を識別する
工程である。ここでは、得られた変位関数u,vを考慮
した重み付きユークリッド距離dを用いて統計的な識別
を行う。距離dは次式のように示すことができる。
【数8】 ここで、vk(x,y)は第k番目の方向特徴画像の座
標(x,y)における特徴量についての分散値であり、
パラメータαはこれに関する重みである。距離dはα=
0のときに正規化ユークリッド距離と等しくなり、α=
1のときにユークリッド距離Pと同様の性質をもつ。分
散値vk(x,y)は、次式で推定できる。
【数9】 ここで、fnkはn番目のサンプルから生成された方向k
に対応する線素方向特徴画像を表しており、fkはそれ
らの平均画像である。また、Nは利用できるい各カテゴ
リ毎のサンプル数である。共分散情報を用いるマハラノ
ビス距離等を比較すると、分散情報のみを用いる距離d
は膨大な計算資源を必要としない、という長所をもつ。
重み付きユークリッド距離dだけでなく、抽出変位の滑
らかさを表す汎関数Sを考慮することも識別に有利であ
る。なぜなら、異種カテゴリに属する特徴画像に対して
得られる変位に比べて、同カテゴリに属する特徴画像に
対して得られる変位はより滑らかであることが期待でき
るからである。そこで、抽出変位を考慮した距離dと抽
出変位の滑らかさSの線形和で定義されるパターン間距
離d’をパターン間距離として用いる。
【数10】 ここで、パラメータβは滑らかさSの重みである。
【0016】そして、このような工程を経て、手書き文
字の識別・認識を行った処、変形に対して安定な認識性
能が得られた。これは、入力パターンから線素方向特徴
を抽出した後に、ユークリッド距離と抽出変位の滑らか
さの項からなるエネルギー汎関数を最小化することで、
得られた特徴画像に基づき変位抽出を行い、入力パター
ンに含まれる変位量を考慮して識別を行うためである。
【0017】次に、本実施形態の効果を確認するため
に、最初に、2つの漢字パターンを用いて変位抽出試験
を行い、次に、手書き文字集合を用いて計算機による認
識試験を行った。そして、この試験により本実施形態の
認識性能について検討した。ところで、正則化パラメー
タλは、システムの認識性能を左右する重要なパラメー
タの一つである。λは小さな値を用いると式(2)にお
けるユークリッド距離Pの影響が相対的に強くなるため
に、本実施形態の方法における変位抽出能力は高くな
る。しかし、強力すぎる変位抽出能力は過対応のために
良好な認識を妨げる。そこで、いくつかの予備実験の結
果から、本試験では、正則化パラメータλの値は0.0
03、0.010、漸化式(7)(8)の計算反復回数
は20(各段階として、10回づつ)とした。また変位
関数u,v上の各格子点での初期値は0を設定した。式
(7)(8)に関しては、数値安定性の向上のために、
右辺第2項のut ,vt の値についても式(9)(1
0)で示されるut ,vt の値を用いた。なお、変位関
数は実数値をもつが、格子点以外の座標においては画像
間数fk の値が明示的に与えられない。そこで、近傍の
4画素の値に基づいた線形補間値を用いた。
【0018】−変位抽出試験− 本実施形態方法では、2つの原パターンからではなく、
それから生成される特徴画像から間接的に変形変位を抽
出した。そこで、このようにして得られた変位が妥当な
ものであるか、について検討を行い、更に、アルゴリズ
ムの数値的安定性を明らかにするために、各汎関数値
E,P,Sの動向について検討した。具体的には、図3
(a)に示される2つの漢字パターン(64×64画
素)を用いて変位抽出試験を行った。図中において、パ
ターンfおよびパターンgの黒画素は、記号□と●によ
りそれぞれ示している。これから生成される線素方向特
徴画像(図3(b)参照)から得られた変位関数u,v
をグラフネットを用いて図4〜図5に示す。図4は、第
1段階における計算過程に対応しており、初期状態t=
0、t=1、t=2、t=5、t=10の様子を示して
いる。また図5は第2段階に対応しており、ここでは、
第1段階の最終結果(t=10)を初期状態とし、t=
11、t=12、t=15、t=20(最終的な結果)
の様子を示している。t=20が最終的に抽出された変
位である。次に、アルゴリズムの安定性について述べ
る。図6に示すように、第1層、第2層において、反復
回数が5を超えた辺りから各汎関数の値がほとんど変化
していない。また、エネルギー汎関数Eの減少傾向は安
定している。t=20での各関数値の不連続は、階段的
構造による計算対象画像およびパラメータλの相違に起
因する。
【0019】−認識試験− 手書き文字集合を用いた計算機による認識性能を調べ
た。データベースは、881カテゴリの手書き漢字集合
が含まれており、各カテゴリ毎のサンプル数は160で
ある。また、文字パターンは64×64の画素で構成さ
れており、既に2値化処理が施されている。よって、前
処理部では位置・大きさの正規化処理のみを行った。標
準特徴画像gK(k=1,2,3,4)は、各カテゴリ
毎に含まれるサンプルの奇数集合から設定した。具体的
には、個々の文字サンプルから得られる線素方向特徴画
像に対して、各カテゴリ毎に平均処理を行うことにより
標準特徴画像を作成した(式(15)の第2式目参
照)。そして、各カテゴリ毎に、これらの特徴画像集合
から分散値vk(x,y)を推定した(式(15)の第
1式参照)。一方、サンプルの偶数集合は認識対象文字
集合として用いた(総数70480文字)。
【0020】そして、変位抽出試験と認識試験から、抽
出変位を考慮したユークリッド距離P、滑らかさの項S
およびエネルギー汎関数Eのそれぞれを識別要素として
用いた場合の認識率は、表1に示す通りであった。な
お、変位抽出を行わない従来手法の認識率も表1に示
す。
【表1】 この表1から、従来のユークリッド距離の結果と比較す
ると、汎関数Pを用いた場合には3.63%の改善が見
られる。汎関数Sの場合については、低い認識率である
が、それらの線形和であるところのエネルギー汎関数E
の場合には3.95%の改善が見られる。このことは、
入力特徴画像と同カテゴリに属する標準特徴画像に対し
て変位抽出を行う場合には、抽出変位の滑らかさを維持
しつつ、パターン間のユークリッド距離が最小化できる
傾向があることを示している。なお、前記入力パターン
識別用標準特徴画像選択工程における10位累積分類率
は98.67%であった。以上の結果から、基本性能の
高さが判った。
【0021】更に、重み付きユークリッド距離dを用い
た統計的識別についても検討を行った。図7は、パラメ
ータαを変化させた場合の認識性能の推移を表してい
る。また、抽出変位を考慮しない場合の重み付きユーク
リッド距離の結果も比較のために示している。分散情報
を考慮する従来手法の認識率の最大値は94.59%で
あった。これに対して、提案手法において分散情報を用
いた場合の最大値は96.62%であった。これらの認
識率の差異2.03%は、変位抽出処理の効果によるも
のである。どちらの場合においても推定分散値を適度に
加味することで、認識結果が大幅に改善できる。但し、
αの値が小さ過ぎると認識率が低下してしまう。これ
は、サンプル数が十分でないために推定分散値v
k(x,y)に誤差が含まれることと、特徴量がガウス
分布に厳密には従っていないことが原因として考えられ
る。また、推定分散値を用いることの効果に関しては、
これを用いない場合(α=1.0)の認識結果94.7
1%(表1)と比較して1.91%の改善が実現でき
る。よって、変位抽出を用いる認識手法において推定分
散値を考慮することの有効性が確認できた。
【0022】更にまた、重み付きユークリッド距離に加
えて、抽出変位の滑らかさSを考慮することによる認識
性能の向上を検討した。重み付きユークリッド距離dと
滑らかさの項Sの線形和で表されるパターン間距離d’
を用いた場合の認識率を、パラメータβの関数として図
8に示す。但し、パラメータαの値に関しては、2.5
×10-4を用いた。β=5.0の場合に96.73%の
認識率が得られた。これは、Sを考慮しない場合の認識
率96.62%(β=0.0)に比べて大幅な改善とは
いえないが、表1に示すように、Sのみを用いた場合の
認識性能が82.11%であるにも関わらず、これを加
味することで認識性能を向上させることができる。
【0023】以上のように、本発明の手書き文字認識方
法と装置は、手書き漢字に対する認識性能の向上を目的
として、線素方向特徴画像を用いた変位抽出を行ったこ
とに特徴がある。ここでは、入力文字から特徴を抽出し
た後に、ユークリッド距離と抽出変位の滑らかさからな
るエネルギー汎関数を最小化することにより、文字に含
まれる変形変位が抽出できる。そして、変位抽出時の局
所解の回避および計算コストの削減のために変位抽出時
に階層的構造を導入した。また、識別時においては推定
分散値を用いた重み付きユークリッド距離と抽出変位の
滑らかさの線形和で定義されるパターン間距離を用い
た。
【0024】なお、本発明は、上述した実施形態に限定
されるものでなく、本発明の趣旨を逸脱しない範囲内で
変形実施できる構成を含む。ところで、前述した実施形
態においては、分散値を用いた統計的識別器を用いた
が、該分散値の代わりに共分散値を用いても同様の効果
を得ることができる。また、前述した実施形態では、特
徴画像の作成を、パターン画像の輪郭から異なる方向の
それぞれの方向に対応して作成しているが、該パターン
画像の特定の個所(点を含む)から異なる方向のそれぞ
れの方向に対応して作成してもよいことは当然である。
【図面の簡単な説明】
【図1】本発明の実施形態における入力・前処理工程と
特徴抽出工程での入力パターン画像と、その特徴抽出画
像の説明図である。
【図2】特徴画像上の変位関数の説明図である。
【図3】図3(a)は2つの漢字(入力、標準)パター
ン画像、図3(b)は線素方向特徴画像である。
【図4】線素方向特徴画像から得られた変位関数をグラ
フネットとして表した第1段階の説明図である。
【図5】線素方向特徴画像から得られた変位関数をグラ
フネットとして表した第2段階の説明図である。
【図6】計算反復回数に対する重ね合わせの度合いP、
滑らかさの度合いλS、そしてその線型和Eとの関係を
示した図である。
【図7】パラメータαを変化させた場合の認識性能の推
移を表すグラフである。
【図8】重さ付きユークリッド距離と滑らかさの項Sの
線形和で表されるパターン間距離をd′とした場合の認
識率を表すグラフである。
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平8−161431(JP,A) 特開 昭63−113690(JP,A) 水上嘉樹 他,変位抽出を行う手書き 文字認識システム,電子情報通信学会論 文誌,日本,社団法人電子情報通信学 会,1997年1月25日,D−2 Vol. J80 No.1,p.63−72 水上嘉樹 他,階層的変位抽出アルゴ リズムを用いた手書き文字認識システ ム,電子情報通信学会論文誌,日本,社 団法人電子情報通信学会,1994年12月25 日,D−2 Vol.J77 No.12, p.2390−2393 (58)調査した分野(Int.Cl.7,DB名) G06K 9/46 - 9/62 JICSTファイル(JOIS)

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】識別するための手書き文字を入力して、ノ
    イズを除去し、位置及び大きさの正規化を行い、入力パ
    ターン画像を得るための入力パターン読込み・前処理工
    程と、 標準となる文字の標準パターン画像の輪郭あるいは特定
    の個所から水平、右下、垂直および左下を含む異なる複
    数方向のそれぞれの方向に対応した複数の標準特徴画像
    を作成し、且つ、前記入力パターン読込み・前処理工程
    により得られた入力パターン画像の輪郭あるいは特定の
    個所から水平、右下、垂直および左下を含む異なる複数
    方向のそれぞれの方向に対応した入力特徴画像を作成す
    る特徴画像作成工程と、 前記特徴画像作成工程により作成された複数の各標準特
    徴画像と入力特徴画像との距離を測定し、その距離の小
    さなものから所定数の標準特徴画像候補を選択する標準
    特徴画像選択工程と、 前記標準特徴画像選択工程により選択された標準特徴画
    像候補について、 エネルギー汎関数E=P(u,v)+λS(u,v) 〔ここで、汎関数Pは標準パターン画像と入力パターン
    画像の抽出変位を考慮したうえでの重なり合わせの良さ
    を表す汎関数、汎関数Sは抽出変位の滑らかさを表す汎
    関数、λは汎関数Sの重みを制御する正則化パラメー
    タ、u及びvは水平及び垂直方向の変位を表す実数値関
    数である。〕 を用いて、汎関数Pにより特徴画像間のユークリッド距
    離を小さくし、且つ、汎関数Sにより変位の水平及び垂
    直方向の変化を滑らかにする条件を満たすように、エネ
    ルギー汎関数Eを最小化する条件下における前記標準特
    徴画像と前記入力特徴画像との変形変位u,vを抽出す
    る変位抽出工程と、 前記変位抽出工程により抽出された変形変位u,vを用
    いて入力特徴画像と選択された標準特徴画像候補との重
    みつき距離を求め、その距離に基づき入力パターン画像
    と標準パターン画像との類似性を識別する識別工程、 を含む手書き文字認識方法。
  2. 【請求項2】前記識別工程は、入力パターン画像と標準
    パターン画像との類似性を識別する際、共分散、分散値
    または抽出変位の滑らかさを示す汎関数Sを用いること
    を特徴とする請求項1に記載の手書き文字認識方法。
  3. 【請求項3】識別するための手書き文字を入力して、ノ
    イズを除去し、位置及び大きさの正規化を行い、入力パ
    ターン画像を得るための入力パターン読込み・前処理手
    段と、 標準となる文字の標準パターン画像の輪郭あるいは特定
    の個所から水平、右下、垂直および左下を含む異なる複
    数方向のそれぞれの方向に対応した複数の標準特徴画像
    を作成し、且つ、前記入力パターン読込み・前処理手段
    により得られた入力パターン画像の輪郭あるいは特定の
    個所から水平、右下、垂直および左下を含む異なる複数
    方向のそれぞれの方向に対応した入力特徴画像を作成す
    る特徴画像作成手段と、 前記特徴画像作成手段により作成された複数の各標準特
    徴画像と入力特徴画像との距離を測定し、その距離の小
    さなものから所定数の標準特徴画像候補を選択する標準
    特徴画像選択手段と、 前記標準特徴画像選択手段により選択された標準特徴画
    像候補について、 エネルギー汎関数E=P(u,v)+λS(u,v) 〔ここで、汎関数Pは標準パターン画像と入力パターン
    画像の抽出変位を考慮したうえでの重なり合わせの良さ
    を表す汎関数、汎関数Sは抽出変位の滑らかさを表す汎
    関数、λは汎関数Sの重みを制御する正則化パラメー
    タ、u及びvは水平及び垂直方向の変位を表す実数値関
    数である。〕 を用いて、汎関数Pにより特徴画像間のユークリッド距
    離を小さくし、且つ、汎関数Sにより変位の水平及び垂
    直方向の変化を滑らかにする条件を満たすように、エネ
    ルギー汎関数Eを最小化する条件下における前記標準特
    徴画像と前記入力特徴画像との変形変位u,vを抽出す
    る変位抽出手段と、 前記変位抽出手段により抽出された変形変位u,vを用
    いて入力特徴画像と選択された標準特徴画像候補との重
    みつき距離を求め、その距離に基づき入力パターン画像
    と標準パターン画像との類似性を識別する識別手段、 を備えた手書き文字認識装置。
JP27059697A 1997-09-16 1997-09-16 手書き文字認識方法と装置 Expired - Fee Related JP3274825B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP27059697A JP3274825B2 (ja) 1997-09-16 1997-09-16 手書き文字認識方法と装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP27059697A JP3274825B2 (ja) 1997-09-16 1997-09-16 手書き文字認識方法と装置

Publications (2)

Publication Number Publication Date
JPH1196300A JPH1196300A (ja) 1999-04-09
JP3274825B2 true JP3274825B2 (ja) 2002-04-15

Family

ID=17488313

Family Applications (1)

Application Number Title Priority Date Filing Date
JP27059697A Expired - Fee Related JP3274825B2 (ja) 1997-09-16 1997-09-16 手書き文字認識方法と装置

Country Status (1)

Country Link
JP (1) JP3274825B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4524514B2 (ja) * 1999-08-05 2010-08-18 ソニー株式会社 画像処理装置、画像処理方法、および記録媒体
CN105607752B (zh) * 2015-10-22 2018-06-19 王向阳 形易汉字输入法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
水上嘉樹 他,変位抽出を行う手書き文字認識システム,電子情報通信学会論文誌,日本,社団法人電子情報通信学会,1997年1月25日,D−2 Vol.J80 No.1,p.63−72
水上嘉樹 他,階層的変位抽出アルゴリズムを用いた手書き文字認識システム,電子情報通信学会論文誌,日本,社団法人電子情報通信学会,1994年12月25日,D−2 Vol.J77 No.12,p.2390−2393

Also Published As

Publication number Publication date
JPH1196300A (ja) 1999-04-09

Similar Documents

Publication Publication Date Title
Liu et al. Handwriting recognition: soft computing and probabilistic approaches
US6873732B2 (en) Method and apparatus for resolving perspective distortion in a document image and for calculating line sums in images
US6735337B2 (en) Robust method for automatic reading of skewed, rotated or partially obscured characters
Mahmoud Recognition of writer-independent off-line handwritten Arabic (Indian) numerals using hidden Markov models
US7965890B2 (en) Target recognition system and method
JP2977032B2 (ja) 距離及び方向に鑑みたパターン整合装置及びその方法
US20020128796A1 (en) Information processing method and apparatus
CN111860309A (zh) 一种人脸识别方法及系统
CN105894037B (zh) 一种基于sift训练样本提取的遥感图像全监督分类方法
JP4300098B2 (ja) オブジェクト識別方法とその装置、プログラム及び記録媒体
Hamida et al. A novel feature extraction system for cursive word vocabulary recognition using local features descriptors and gabor filter
Shen et al. Satellite objects extraction and classification based on similarity measure
US6507830B1 (en) Retrieval system, retrieval method and computer readable recording medium that records retrieval program
JP3819236B2 (ja) パターン認識方法及びパターン認識を行わせるプログラムを記憶したコンピュータ読み取り可能な記憶媒体
JP3274825B2 (ja) 手書き文字認識方法と装置
Houtinezhad et al. Off-line signature verification system using features linear mapping in the candidate points
CN112766082B (zh) 基于宏微观特征的中文文本笔迹鉴别方法、装置及存储介质
Adamski et al. Binary handwriting image enhancement by directional field-guided morphology
JP3370934B2 (ja) 光学的文字読み取り方法とその装置
JP4176175B2 (ja) パターン認識装置
Busch Revision of built-up areas in a GIS using satellite imagery and GIS data
CN111311586A (zh) 基于非线性健康分析系统数据多指标动态整合算法和系统
Joshi et al. Investigating the impact of thresholding and thinning methods on the performance of partial fingerprint identification systems: a review
CN118314336B (zh) 一种基于梯度方向的异源图像目标定位方法
Wigati et al. Combination of Salient Object Detection and Image Matching for Object Instance Recognition

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110201

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees