JP3855467B2 - 手書き文字正規化方法及び手書き文字正規化装置並びに手書き文字正規化処理プログラムを記録した記録媒体 - Google Patents
手書き文字正規化方法及び手書き文字正規化装置並びに手書き文字正規化処理プログラムを記録した記録媒体 Download PDFInfo
- Publication number
- JP3855467B2 JP3855467B2 JP16397598A JP16397598A JP3855467B2 JP 3855467 B2 JP3855467 B2 JP 3855467B2 JP 16397598 A JP16397598 A JP 16397598A JP 16397598 A JP16397598 A JP 16397598A JP 3855467 B2 JP3855467 B2 JP 3855467B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- deformation
- angle
- vertical
- rotation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Images
Landscapes
- Character Input (AREA)
Description
【発明の属する技術分野】
本発明は、手書きによって回転・せん断変形した文字からその回転変形とせん断変形(以下では、回転変形とせん断変形を別々に説明する以外は両者を総称して回転・せん断変形と表現する)を検出してそれを是正する手書き文字正規化方法及び手書き文字正規化装置並びに手書き文字正規化処理プログラムを記録した記録媒体に関する。
【0002】
【従来の技術】
主な手書き文字変形として、アフィン変換で記述できる線形変形と、不規則で文字の部分的な変形である非線形変形がある。このような手書き文字変形があると、たとえば、その手書き文字を文字認識する必要のある場合、認識率が大幅に低下するおそれがある。したがって、文字認識を行う前に、文字パターンから変形パラメータを抽出して、これらの変形を是正する正規化が行われる。
【0003】
筆記する枠や書き方などに制限が設けられて書かれた制限付き手書き文字では、計算量が少なく変形の是正効果の高い外接矩形による位置・大きさの線形正規化と、線形正規化では吸収できない変形を吸収し、認識率の大幅な向上が期待できる非線形正規化が行われることが多い。
【0004】
線形正規化のうち、回転変形の正規化では、2次モーメントが使われるが、文字全体を回転楕円体で近似するため、漢字など複雑な文字の正規化が難しい。そこで、日本語の文字は直線成分が多いことから、ストローク情報を使う方法が多く研究されている。
【0005】
文字全体が平行四辺形のようにつぶれるせん断変形を含めた線形変形は、2次モーメントや変形辞書などの対処方法は検討されているが、正規化は殆ど検討されていないのが現状である。また、これまでに種々の手書き文字の変形が分析されているが、回転・せん断変形について着目した分析はない、これは、制限付き手書き文字の場合、回転・せん断の線形変形は起こりにくく、回転・せん断変形の正規化は余り必要ないと考えられていたためであり、これまでは、位置・大きさの線形変形や非線形変形の正規化に重点がおかれていたものと推測される。
【0006】
一方、自由手書き文字は、制限付き手書き文字のように、指定された枠内に文字を書いたり、書き方に制限が設けられているわけではないので、文字を書くときの姿勢、紙の位置などが自由となり、回転やせん断などの線形変形が生ずる頻度が、制限付き手書き文字にくらべると高くなり、変形も大きいと考えられる。このような自由手書きによる変形は、手書きのレポートなどでよく見かける。実際に分析を行って見ると、ごく少数の文字種についての分析結果ではあるが、回転やせん断のようなパターン全体がアフィン変換で記述できる変換が、自由手書き文字の漢字に約50%、漢字以外の文字に約30%見られることが報告されている。
【0007】
また、このような回転・せん断変形が文字に生じていると、その文字の認識を行う際、認識率の低下が問題となっている。このような回転・せん断変形の生じている文字の認識率を向上させるためには、それを補正した上で認識を行えば良好な結果が得られる。たとえば、制限付き手書き文字について、右肩上がりの文字に対し、右肩を下げるように15度程度回転させるアフィン変換を施すと、認識率が向上することが実験により確かめられている。
【0008】
【発明が解決しようとする課題】
以上のことから、回転・せん断変形した文字を正規化することは、自由手書き文字の認識率を向上させる上で大変有効であると考えられる。このような回転・せん断変形した文字の正規化を行う際、文字がどの方向にどの程度傾いているかなどを検出する必要があるが、これを検出する方法として、たとえば、ハフ変換、フーリエ変換、2次モーメントなどがある。
【0009】
しかしながら、どのような方法を採用したとしても、従来の文字正規化手法では、1つ1つの文字について、回転・せん断変形の検出を行い、その検出結果に基づいて是正する処理を行うのが一般的であった。したがって、回転・せん断変形の検出とその是正処理に多くの時間を要し、特に、処理対象となる文字が多数存在する場合には、きわめて多くの処理時間を必要とする問題があった。
【0010】
したがって、このような文字正規化手法を文字認識の前処理として用いる場合には、文字の正規化にも多くの時間を必要とするため、文字認識を含めた全体の処理時間が長くなるという問題がある。
【0011】
そこで本発明は、回転・せん断変形の変形具合の傾向を把握し、その傾向に基づいて文書全体の回転・せん断変形を検出し、それを是正することで、効率のよい回転・せん断検出とその是正処理を可能とし、処理時間の大幅な短縮を図ることを目的としている。
【0012】
【課題を解決するための手段】
前述した目的を達成するために、本発明の手書き文字正規化方法は、手書き文字の手書き変形である回転変形とせん断変形を検出し、それに対する是正を行うことで手書き文字の正規化を行う手書き文字正規化方法において、前記回転変形とせん断変形の変形具合の傾向を示すデータを得て、この変形具合の傾向を示すデータに基づいて前記文字の回転変形とせん断変形を是正するに必要なパラメータを算出し、算出されたパラメータに基づいて正規化処理するようにしている。
【0013】
そして、前記回転変形とせん断変形の変形具合の傾向は、不特定多数の書き手によって書かれた複数の文字から統計的に得られた回転変形とせん断変形の変形具合を示す一般的な傾向と、ある個人によって書かれた複数の文字から得られたその個人固有の回転変形とせん断変形の変形具合を示す個人的な傾向の少なくとも一方である。
【0014】
さらに、前記一般的な傾向と個人的な傾向の少なくとも一方に基づいて前記文字の回転変形とせん断変形を是正するに必要なパラメータを算出する処理は、処理対象文書の所定部分に着目してその着目した部分について行うようにしている。
【0015】
さらに、前記算出されたパラメータに基づいて正規化を行う正規化処理は、求められた前記回転変形とせん断変形を是正するに必要なパラメータを、前記処理対象文書全体に適用して行うようにしている。
【0016】
また、前記個人的な傾向を、回転変形とせん断変形を是正するに必要なパラメータ算出に用いる場合、文書から得られた個人的な傾向を示すデータを保存し、それを個人データとして用いるようにしている。
【0017】
そして、前記処理対象となる文字の回転変形とせん断変形は文字の外接矩形の形状で表し、その回転変形とせん断変形を表現するそれぞれのパラメータは、当該外接矩形の縦方向の一辺と座標上のある基準軸との角度および当該外接矩形の前記縦方向の一辺に直角な基準線と当該外接矩形の横方向の一辺との角度で表し、これらの角度を前記文字の縦方向ストローク位置と横方向ストローク位置から求めるようにしている。
【0018】
そして、前記文字の縦方向ストローク位置と横方向ストローク位置は、当該文字の重心を座標上の中心に一致させたときのその座標のある基準軸を基点とした角度で表し、これらの角度、すなわち、縦方向ストローク角度および横方向ストローク角度は、当該文字に対しいろいろな角度から射影をとり、射影をとった各角度と積算画素数の関係に基づく射影関数を得て、その変曲点部分から推察するようにしている。
【0019】
また、本発明の手書き文字正規化装置は、手書き文字の手書き変形である回転変形とせん断変形を検出し、それに対する是正を行うことで手書き文字の正規化を行う手書き文字正規化装置において、前記回転変形とせん断変形の変形具合の傾向を示すデータに基づいて前記文字の回転変形とせん断変形を是正するに必要な各種パラメータを算出する回転・せん断変形検出手段、この回転・せん断検出手段により得られた各種パラメータを用いて文字の変形を是正する文字変形是正手段と、この文字変形是正手段により是正された文字を出力する出力手段とを有した構成としている。
【0020】
そして、前記回転変形とせん断変形の変形具合の傾向は、不特定多数の書き手によって書かれた複数の文字から統計的に得られた回転変形とせん断変形の変形具合を示す一般的な傾向と、ある個人によって書かれた複数の文字から得られたその個人固有の回転変形とせん断変形の変形具合を示す個人的な傾向の少なくとも一方であって、これらの傾向を示すデータを格納する記憶手段を設けている。
【0021】
さらに、前記一般的な傾向と個人的な傾向の少なくとも一方に基づいて前記文字の回転変形とせん断変形を是正するに必要なパラメータを算出する処理は、処理対象文書の所定部分に着目してその着目した部分について行うようにしている。
【0022】
さらに、前記算出されたパラメータに基づいて正規化を行う正規化処理は、求められた前記回転変形とせん断変形を是正するに必要なパラメータを、前記処理対象文書全体に適用して行うようにしている。
【0023】
また、前記個人的な傾向を、回転変形とせん断変形を是正するに必要なパラメータ算出に用いる場合、文書から得られた個人的な傾向を示すデータを保存し、それを個人データとして用いるようにしている。
【0024】
そして、前記処理対象となる文字の回転変形とせん断変形は文字の外接矩形の形状で表し、その回転変形とせん断変形を表現するそれぞれのパラメータは、当該外接矩形の縦方向の一辺と座標上のある基準軸との角度および当該外接矩形の前記縦方向の一辺に直角な基準線と当該外接矩形の横方向の一辺との角度で表し、これらの角度を前記文字の縦方向ストローク位置と横方向ストローク位置から求めるようにしている。
【0025】
そして、前記文字の縦方向ストローク位置と横方向ストローク位置は、当該文字の重心を座標上の中心に一致させたときのその座標のある基準軸を基点とした角度で表し、これらの角度、すなわち、縦方向ストローク角度および横方向ストローク角度は、当該文字に対しいろいろな角度から射影をとり、射影をとった各角度と積算画素数の関係に基づく射影関数を得て、その変曲点部分から推察するようにしている。
【0026】
また、手書き文字正規化処理プログラムを記録した記録媒体は、手書き文字の手書き変形である回転変形とせん断変形を検出し、それに対する是正を行うことで手書き文字の正規化を行う手書き文字正規化処理プログラムを記録した記録媒体であって、その処理プログラムは、前記回転変形とせん断変形の変形具合の傾向を示すデータに基づいて前記文字の回転変形とせん断変形を是正するに必要なパラメータを算出する手順と、この回転・せん断検出手段により得られた各種パラメータを用いて文字の変形を是正する手順とを含むことを特徴としている。
【0027】
そして、前記回転変形とせん断変形の変形具合の傾向は、不特定多数の書き手によって書かれた複数の文字から統計的に得られた回転変形とせん断変形の変形具合を示す一般的な傾向と、ある個人によって書かれた複数の文字から得られたその個人固有の回転変形とせん断変形の変形具合を示す個人的な傾向の少なくとも一方である。
【0028】
本発明は、回転・せん断変形の変形具合の傾向を把握し、その傾向に基づいて文書全体の回転・せん断変形を効率よく検出し、それを是正することで、処理時間の大幅な短縮を図るように発明であり、具体的には、前記回転・せん断変形の変形具合の傾向として、不特定多数の書き手によって書かれた複数の文字から統計的に得られた回転・せん断変形の変形具合を示す一般的な傾向と、ある個人によって書かれた複数の文字から得られたその個人固有の回転・せん断変形を示す個人的な傾向の少なくとも一方を用いて、このような傾向を考慮して回転・せん断変形を是正するに必要なパラメータを得るようにしている。
【0029】
このように変形具合の傾向を知った上でパラメータを得る処理を行うことによって、パラメータを得るために無駄な処理を大幅に省くことができ、効率よく短時間でパラメータ検出から是正までを行うことができる。
【0030】
また、前記一般的な傾向と個人的な傾向の少なくとも一方に基づいて前記文字の回転・せん断変形を是正するに必要なパラメータを算出する処理は、処理対象文書の所定部分に着目してその着目した部分について行うことにより、処理の効率化が図れる。
【0031】
これは、たとえば、個人的な傾向に基づいてパラメータの算出を行う場合を例に取れば、処理対象文書の所定部分として、たとえば、文書の始めから幾つかの文字、あるいはランダムに何箇所か選ばれた文字というように、所定部分の文字について、その個人的な傾向に基づいてパラメータの算出を行うものである。ある一人の書き手が書いた文書の変形具合は、その文書内においてはほぼ一定と考えられるので、所定部分から、まず、その書き手の個人的な傾向を得て、その個人的な機構に基づいて前記パラメータを算出するようにすればよいので、前記処理対象文書全体を構成する個々の文字ごとに処理を行わないで済むため、処理を大幅に簡素化することができる。
【0032】
なお、ここでいう処理対象文書とは、変形具合の傾向の変わらない範囲であって、個人的な傾向を用いる場合は、ある一人の書き手によって書かれる範囲の文書を指し、たとえば、1段落分、画面上の1ページ分などである。
【0033】
そして、算出されたパラメータを用いて変形の是正を行う際は、前記算出されたパラメータを前記処理対象文書全体に適用して是正処理する。これによれば、前記処理対象文書全体を構成する個々の文字ごとに求められたパラメータによって個々の文字ごとに是正処理を行わないで済むため、処理を大幅に簡素化することができる。
【0034】
また、前述したように処理対象文書から得られた個人的な傾向を示すデータは、それを保存しておくことで、個人データとして多方面に利用できる。たとえば、携帯用情報機器においてこのような個人的な傾向を示すデータを保存することで、個人識別が可能となり、個人識別がなされた場合のみ、その機器の使用を可能とするというようなこともできる。また、このような個人データを他のシステムに転送して、転送先のシステムでの使用も可能となる。
【0035】
また、本発明は、文字の回転変形とせん断変形を外接矩形の形状で表現し、この外接矩形の形状を文字の縦方向および横方向ストロークの位置から求めるようにすることも可能である。具体的には、図2に示すように、文字の回転変形とせん断変形を表現するそれぞれのパラメータを、外接矩形OABCの縦方向の一辺OA'と座標上のある基準軸(y軸)との角度θ1および外接矩形の横方向の一辺OC'と外接矩形の縦方向の一辺OA'に直角な基準線x'との角度θ2で表し、これらの角度は前記文字の縦方向ストローク位置と横方向ストローク位置から求めるようにしている。
【0036】
そして、文字の縦方向ストローク位置と横方向ストローク位置は、図5に示すように、当該文字の重心を座標上の中心に一致させたときの当該座標のある基準軸(y軸)を基点とした角度α、βで表し、これら角度α、βは、当該文字に対しいろいろな角度から射影をとり、射影をとったそれぞれの角度と積算画素数の関係に基づく射影関数を得て、その極値から縦方向ストローク角度と横方向ストローク角度を推察するようにしている。
【0037】
具体的には、図6に示すように射影のエントロピを求め、最もエントロピの値の少なくなる極値(この場合、極小)部分から縦方向ストローク角度と横方向ストローク角度を推定するようにしている。
【0038】
これにより、少ない計算量で正確な縦方向および横方向ストローク角度の検出が可能となる。このような縦方向および横方向ストローク角度の検出手法を用いることによって、本発明が行う回転・せん断変形の変形具合の傾向に基づいて回転・せん断を是正するに必要なパラメータを求める処理を高精度に行うことができる。
【0039】
【発明の実施の形態】
以下、本発明の実施の形態について説明する。本発明は、文字変形の傾向を把握し、その傾向に基づいて文書全体の回転・せん断変形を効率よく検出し、それを是正するようにしたものである。一般に、回転・せん断変形には次のような傾向がある。
【0040】
(A)いろいろな文字における回転・せん断変形角度の分布を調べると、ある範囲に特に集中する傾向が見られる。
【0041】
(B)ある個人における文書内の変形傾向はほぼ一定である。
【0042】
このような2つの傾向において、(A)に示される傾向は、不特定多数の書き手によって書かれた複数の文字から統計的に得られた回転・せん断変形の変形具合を示す一般的な傾向であるといえる。また、(B)に示される傾向は、ある個人によって書かれた複数の文字から得られたその個人固有の回転・せん断変形の変形具合を示す個人的な傾向であるといえる。
【0043】
この(A)、(B)のような傾向を利用すれば、回転・せん断変形した文字を1文字づつ・回転・せん断変形を調べる必要はない。つまり、(A)と(B)の傾向があるとの仮定のもとで、実際に回転・せん断変形を検出して行けば、処理対象文書を構成する文字すべてについて、個々の文字ごとに回転・せん断変形を検出する必要はなくなり、処理量を大幅に削減でき、処理時間を短くすることができる。
【0044】
ここで、文字の回転・せん断変形について説明する。図1は回転・せん断変形している文字の例を示すもので、これは、自由手書き文字として収集した文書から取り出したものである。
【0045】
これらの文字を観察したところ、文字全体が回転・せん断変形を受けていることから、回転・せん断変形はそれぞれの文字の外接矩形の形状で表現できると考えられる。
【0046】
次に、外接矩形を用いた回転・せん断変形の表現の仕方を図2を参照しながら説明する。図2(a)で示される文字「あ」の外接矩形OABC(O点がxy座標の原点に一致)が、手書きによる変形を受けて、図2(b)に示されるように、縦方向の辺OA'とC'B'が平行で、かつ、横方向の辺A'B'とOC'が平行な外接矩形OA'B'C'になったとする。なお、ここでいう外接矩形とは、文字の重心に中心を一致させた正方形を考え、その正方形の辺が文字の一部に外接した状態となっている正方形の矩形を外接矩形という。
【0047】
この図2(b)において、y軸と縦方向の辺OA'の成す角をθ1、この辺OA'に直角なある基準先(x'軸で表す)と横方向の辺OC'の成す角をθ2とする。なお、これらθ1、θ2はx'軸、y軸の正の部分を基準に反時計回り方向を正の角度とする。
【0048】
ここで、ある文字画像にθ1の回転、θ2のせん断変形が加えられたとする。このとき、回転・せん断が加えられる前の文字画像の座標(x,y)は回転・せん断変形後の座標(x',y')となり、この回転・せん断変形後の座標(x',y')は、次のアフィン変換で求められる。
【0049】
【数1】
【0050】
この(1)式において、T11、T12、T21、T22、T13、T23は次のように表される。なお、x0,y0は文字を回転させた際の中心座標である。
【0051】
図3はこの(1)式から(7)式を用いて正方形を実際に回転・せん断変形させた状態を示す模式図であり、回転・せん断変形を表現するそれぞれのパラメータθ1とθ2がどのくらいだと、どのような変形を受けるのかのイメージをつかむことができる。
【0052】
この図3について少し説明する。正方形aは回転変形とせん断変形を共に受けていない状態を示し、このときは、θ1=0、θ2=0である。このような正方形aを前述の(1)式により、θ1、θ2を20度づつ変化させてたときの変形具合を示している。θ1=0であれば、せん断変形のみが生じた場合であり、θ2=0であれば、回転変形のみが生じた場合であり、また、θ1とθ2が共に0でなければ、回転変形とせん断変形の両方が生じた場合である。
【0053】
たとえば、θ1=0でθ2=20度とすると、正方形aは四辺形fのようにせん断変形し、θ1=0でθ2=40度とすると、正方形aは四辺形gのようにせん断変形し、θ1=0でθ2=−20度とすると、正方形aは四辺形hのようにせん断変形し、θ1=0でθ2=−40度とすると、正方形aは四辺形iのようにせん断変形する。
【0054】
また、θ2=0でθ1=20度とすると、正方形aは四辺形bのように回転変形し、θ2=0でθ1=40度とすると、正方形aは四辺形cのように回転変形し、θ2=0でθ1=−20度とすると、正方形aは四辺形dのように回転変形し、θ2=0でθ1=−40度とすると、正方形aは四辺形eのように回転変形する。
【0055】
さらに、θ1=θ2=20度とすると、正方形aは四辺形jのように回転・せん断変形し、θ1=20度でθ2=−20度とすると、正方形aは四辺形kのように回転・せん断変形し、θ1=−20でθ2=20度とすると、正方形aは四辺形lのように回転・せん断変形し、θ1=−20でθ2=−20度とすると、正方形aは四辺形mのように回転・せん断変形する。
【0056】
このような回転・せん断変形を是正するには、検出した回転・せん断変形を表現するパラメータθ1、θ2を用いて文字画像を逆アフィン変換(−θ1,−θ2)すればよい。したがって、回転・せん断変形を表現するパラメータであるθ1とθ2を如何に簡単な処理で効率よく、しかも、的確に検出するかが重要な課題となる。
【0057】
なお、以上の説明は、回転・せん断変形を外接矩形の形状で表現する例であったが、これ以外の方法で回転・せん断変形を表現するようにしてもよいが、ここでは、外接矩形の形状を用いた前述の方法についての説明を行う。
【0058】
日本語文字は主に直線で構成されたいるので、外接矩形の形状は文字の縦方向ストローク(以下では垂直ストロークという)と横方向ストローク(以下では水平ストロークという)の角度で推定できると考えられる。すなわち、垂直ストローク方向が図2(b)の外接矩形OA'B'C'の縦方向の辺OA'、水平ストローク方向が横方向の辺OC'に対応すると考えることができる。
【0059】
この垂直・水平ストロークを検出する方法は本発明を実施するに際して限定されるものではないが、ここでは、垂直ストロークと水平ストロークを文字画像から検出する方法として射影を用いる。この射影による方法は、アルゴリズムが簡単で文字の水平・垂直成分がよく保存され、ノイズにも強く、文字認識の分野でも広く用いられている方法である。
【0060】
この射影によって文字画像から垂直ストロークと水平ストロークを検出する方法は、たとえば、図4(a)に示すように、射影方向Sが文字(ここでは「間」という文字を例にしている)の垂直ストローク方向に一致すると、射影は先鋭(射影の幅w1が狭く尖り、高さの最大値が大きい状態)となり、図4(b)、(c)に示すように、射影方向Sが垂直ストローク方向から外れると、射影の幅w2,w3は図4(a)の幅w1に比べて広く平坦なものとなり先鋭さが薄れる。
【0061】
また、「つ」や「る」のような文字にあっては、垂直・水平成分の片方が明確に存在していない(これらの文字の場合、特に垂直方向成分が明確に存在しない)場合、ストロークの角度の頻度分布が2峰性にならないため、他のストローク検出方法では、垂直・水平の一方のストロークしか検出されない場合があるが、射影を用いれば、文字が回転・せん断変形を受けない正立した状態における射影はその幅が狭くなるので、射影の幅の変化で回転角度を推定できる。
【0062】
したがって、垂直・水平ストローク方向は、高さの最大値と射影の幅の組み合わせから推定可能である。しかし、変数が2つあるため推定は複雑になる。そこで、射影をとったそれぞれの角度と画素の積算値の関係に基づく射影関数として、画像の先鋭さが一意に評価できる射影のエントロピによる検出アルゴリズムを利用する。エントロピは画像が先鋭になるほど小さくなる性質があり、計算も容易であるので、たとえば、文字変動評価などにも利用されている。
【0063】
このエントロピを用いた検出アルゴリズムの基本原理について説明する。最初に、垂直・水平ストロークの角度を定義する。図5に各種パラメータが示されている。図5に示すように、座標の中心(原点)oに文字(ここでは「間」という文字)の重心を一致させ、座標の中心oを中心に、この場合は、y軸の負の部分を基準に反時計回り方向を正とし、y軸の負の部分に対する「間」の垂直ストローク方向vの角度をα、y軸の負の部分に対する水平ストローク方向hの角度をβとおく。
【0064】
これにより、θ1はθ1=αで表され、θ2はθ2=β−α−90度で表されるので、このα、βによって、回転・せん断変形を表現するパラメータとしての角度θ1,θ2が求められることになる。たとえば、α=10度、β=80度とすれば、θ1=αであるからθ=10度となり、θ2は、θ2=80−10−90から、θ2=ー20度と求められる。つまり、θ1はy軸の正の部分から10度(正であるから反時計回り方向)の角度であり、θ2はx'軸から−20度(負であるから時計回り方向)の角度である。
【0065】
そして、これらθ1、θ2が求められれば、それを用いて逆アフィン変換(−θ1,−θ2)することにより、回転・せん断変形を受けた文字の変形を是正することができる。
【0066】
次に、文字を1度づつ回転させながらx軸(水平)方向への射影を求める。文字重心を中心に時計回りを正として、角度φ回転させた文字画像のxy平面上の分布nφ(x,y)を、 nφ(x,y)=1を画素有り、 nφ(x,y)=0を画素無しとする。
【0067】
そして、文字画像のxy平面上での分布nφ(x,y)のx軸への射影pφ(x)は、
【0068】
【数2】
【0069】
で表されるので、射影pφ(x)のエントロピh(φ)は、
【0070】
【数3】
【0071】
となる。
【0072】
図6は「木」という文字を、図5で示した「間」と同様に、「木」の重心を中心に回転させた場合の、角度φと(9)式より求めた射影エントロピh(φ)の関係を示した例である。
【0073】
射影方向とストローク方向が一致すると、射影は先鋭となりエントロピが小さくなるので、図6のように、 h(φ)が下に凸となっている極小(微分係数h'(φ)が負から正に変化する変曲点)の部分の角度(−30度、0度、30度、90度)に、「木」の各ストロークが対応すると考えられる。すなわち、「木」の垂直ストロークをs1,水平ストロークをs2,斜めストロークをs3,s4とすれば、−30度と+30度の極小部分は斜めストロークs3,s4に対応し、0度の極小部分は垂直ストロークs1に対応し、90度の極小部分は水平ストロークs2に対応していると考えられる。
【0074】
図6に示す「木」は、回転・せん断変形を受けていないので、その垂直ストロークs1の角度αは、0度付近に存在するストロークに対応する角度φiであり、水平ストロークs2は、90度付近に存在するストロークに対応する角度φiであるといえる。もし、回転・せん断変形を受けた場合は、垂直ストロークs1の角度αは0度付近を基準にある範囲(変形した角度程度)内に存在するストロークに対応する角度φiとなると考えられ、水平ストロークs2の角度βは、垂直ストロークs1の角度α+90度付近を基準にある範囲(変形した角度程度)内に存在するストロークに対応する角度φiとなると考えられる。
【0075】
また、文字が正立している状態の垂直ストロークs1と水平ストロークs2の方向は、斜めストロークs3,s4に比べて射影そのものの幅が狭くなるため、エントロピの値が小さくなり、その微分係数h'(φ)は小さくなる傾向にある。
【0076】
これらのことから、垂直ストローク角度αは、0度を基準とするある範囲に存在するφiのうちの微分係数h'(φ)が大きいもの、水平ストローク角度βは、α+90度を基準とするある範囲に存在するφiのうちの微分係数h'(φ)が大きいものであると考えられる。なお、この0度とα+90度を以下では基準角度という。
【0077】
ここで、φiは所定の範囲の任意の角度を表すものであり、垂直ストローク角度αの候補および水平ストローク角度βの候補といえる。この角度候補φiより最初に垂直ストローク、次に水平ストロークという順序で実際の角度を決定して行く。
【0078】
ところで、活字であっても印刷の仕方やコピーの失敗によって多少の回転・せん断変形を受けた程度のもの、あるいは、非常に丁寧に書かれた楷書であれば、回転・せん断変形の度合いが少ないので、基準角度0、α+90度を基準とするある範囲に存在するφiから容易に文字の垂直・水平方向を知ることができる。
【0079】
しかしながら、実際の手書き文字は、回転・せん断変形だけではなく、ストロークの伸びなど種々の変形があるので、何らかの手段によって、前述した基準角度0、α+90度を基準とするある範囲に存在するφiの中から垂直ストローク角度候補と水平ストローク角度候補の絞り込みを行って、その中から求めるべき垂直ストローク角度αと水平ストローク角度βを決定する必要がある。この求めるべき垂直ストローク角度αと水平ストローク角度βを決定する方法として、垂直ストローク角度候補をαi(i=1,2,・・・,n)、水平ストローク角度候補をβj(j=1,2,・・・,m)とすれば、それぞれのα、βの組み合わせ(n×m組)の中から、前述の(A)で示される一般的な傾向と、(B)で示される個人的な傾向を用いて、求めるべき垂直ストローク角度αと水平ストローク角度βを決定する処理を行う。
【0080】
まず、文書内の全文字について、各文字ごとに垂直ストローク角度αiと水平ストローク角度βjより、前述の(A)で示される一般的な傾向から外れるαi、βjの組み合わせを除く。ここで、(A)で示される一般的な傾向について説明する。
【0081】
自由手書きによる漢字とひらがなについて、あるアルゴリズムを用いて垂直ストローク角度αおよび水平ストローク角度βを検出し、検出されたα、βを用いて回転・せん断変形を表現するそれぞれのパラメータθ1、θ2を求めたところ、図7(a)、(b)のような分布が得られた。図7(a)はひらがな、同図(b)は漢字における回転・せん断変形を表現するそれぞれのパラメータθ1、θ2の分布を示すものである。これは、自由手書きによるものであるが制限付き手書きの場合も分布の広がりには多少違いが出るものの傾向はほぼ同じである。
【0082】
このようなθ1、θ2の分布を図3に対応させると、正方形aを中心に、四辺形h,f,i,kのような変形を受けた文字が多く見られるという傾向がわかる。
【0083】
このような傾向は予め情報として持つことができるので、頻度の小さい四辺形に対応するα、βの組み合わせは除くようにする。たとえば、図3で示される四辺形g,e,m,cなどのような変形を表すθ1、θ2は、その出現頻度は、ごく小さいものとして、このようなθ1、θ2を得たα、βの組み合わせは除外する。
【0084】
これは、予め、頻度の小さい四辺形に対応するα、βの組み合わせをメモリ内にデータベースとして格納しておき、実際に得られた候補としての垂直ストローク角度αiと水平ストローク角度βjをデータベースの内容と比較することにより判定できる。そして、除外されずに残された垂直ストローク角度αと水平ストローク角度βの平均を取り、その平均の垂直ストローク角度と水平ストローク角度を求めるべき垂直ストローク角度αと水平ストローク角度βとする。
【0085】
このように、(A)で示される傾向を予めデータベースなどとして持っていれば、候補として得られた垂直ストローク角度αiと水平ストローク角度βjの中から求めるべき垂直ストローク角度αと水平ストローク角度βは、データベースの内容を参照するだけで、一般的な傾向から大きく外れた候補を除外することができ、処理を効率的に進めることができる。
【0086】
以上のようにしてデータベースの内容と比較して求めるべき垂直ストローク角度αおよび水平ストローク角度βを検出する処理は、処理対象文書を構成する全ての文字について個々の文字ごとに行ってもよいが、処理対象文書量が多い場合は、その処理対象文書から適当な箇所をスポッティングして、そのスポッティングした箇所から平均を求めるようにしてもよい。
【0087】
特に、前述した(B)の傾向、つまり、ある個人が書いた処理対象文書内の変形傾向はほぼ一定であるということを考慮すれば、少なくとも、1つのセンテンス、あるいは、1つの段落、さらには、携帯機器であれば画面上に開かれている1ページ分などの1まとまりの内容は、一人の書き手によって書かれた可能性が高いといえる。したがって、このような1まとまりの内容については、その1まとまりの内容の中から所定箇所をスポッティングして、そのスポッティングした部分について、前述したような処理によって、求めるべき垂直ストローク角度αおよび水平ストローク角度βを決定する。
【0088】
また、1まとまりの内容が長文であるような場合は、その1まとまりの内容について複数箇所をスポッティングする。スポッティングする箇所としては、その1まとまりの内容の中でランダムに複数文字をスポッティングする、そのコンテンツ内の最初の数文字をスポッティングする、そのコンテンツ内で最初の一行をスポッティングするなど、複数の文字を適当に選んで、選ばれた文字について、垂直ストローク角度α、水平ストローク角度βを個々の文字ごとに求め、これら求められたα、βの平均を求める。
【0089】
ある一人の書き手が書いた文字は文字ごとに回転・せん断変形が大きく変化することはないので、このようにして求められた平均の垂直ストローク角度と水平ストローク角度は、その書き手の書いた文書全体の傾向を表すものとして用いることができる。
【0090】
このようにして、平均の垂直ストローク角度と水平ストローク角度が求められると、それを個々の文字について、垂直ストローク角度と水平ストローク角度を求める処理を行う過程で、候補として求められた垂直ストローク角度αiと水平ストローク角度βjが、その平均の平均の垂直ストローク角度と水平ストローク角度に大きく外れる場合はそれを除外する。ただし、ここで除外されたものであっても確からしさがあるものは残しておくというような措置を行う。
【0091】
また、平均の垂直ストローク角度と水平ストローク角度が求められると、それを処理対象文書全体の垂直ストローク角度αと水平ストローク角度βとして用いるようにしてもよい。
【0092】
なお、(A)で示される一般的な傾向と、(B)で示される個人的な傾向は、それぞれ単独で用いることもできるが、両方を組み合わせて用いることもできる。
【0093】
また、文書が数ページにも渡るような場合は、それぞれのページごとに、前述したようなスポッティングを行う。これは、ページが変わると書き手も変わってその変形具合の傾向が変わる可能性があるからである。また、携帯用情報機器など画面が狭い場合には、1画面で手書き入力が継続されている間は、その手書き入力に対してはすべてスポッティングするなどの措置を行うようにしてもよい。
【0094】
以上のように、文書全体から見たある一定の傾向を利用することにより、幾つかの候補として挙げられた垂直ストロークαiと水平ストロークβjの中から、求めるべき垂直ストロークαと水平ストロークβをより効率的に短時間で決定することができる。
【0095】
このようにして、幾つかの候補として得られた垂直ストローク角度αiと水平ストローク角度βjの中から、求めるべき垂直ストロークαと水平ストロークβが決定されると、それを用いて、回転・せん断変形を表現するそれぞれのパラメータθ1、θ2を求めて、求められたθ1、θ2により逆変換することで変形を受けた文字の是正を行うことができる。
【0096】
この是正処理は、処理対象文書を構成する文字について、個々の文字ごとに行うようにしてもよいが、平均の垂直ストローク角度と水平ストローク角度が求められると、それを処理対象文書全体の垂直ストローク角度αと水平ストローク角度βとして用い、処理対象文書内の各文字に共通の回転・せん断変形を表すそれぞれのパラメータθ1、θ2を求め、このθ1、θ2により逆変換することで処理対象文書を一括して是正処理するようにしてもよい。
【0097】
このように、平均の垂直ストローク角度と水平ストローク角度に基づいて、処理対象文書を一括して是正処理することで、従来のように、1文字ごとに、回転・せん断変形を検出し、垂直ストロークと水平ストロークを決定し、それを用いて文字画像を一旦、元に戻してそれは正しく是正されたか否かを見るというような処理を文字ごとに行う必要がなくなり、処理をきわめて効率よく行うことができ、処理時間の大幅な短縮が可能となる。
【0098】
以上説明したように、予めわかっている一定の傾向や個人的な傾向を利用することにより、幾つかの候補として挙げられた垂直ストロークαiと水平ストロークβjの中から、求めるべき垂直ストロークαと水平ストロークβをより効率的に短時間で決定することができ、その決定された垂直ストロークαと水平ストロークβを用いて回転・せん断変形を表現するパラメータθ1、θ2を求めて、求められたθ1、θ2により逆変換することで変形を受けた文字の是正が行えるので、回転・せん断変形の検出から是正までの処理が効率よく、短時間で行うことができる。
【0099】
さらに、本発明の手法により是正された後の文字画像は、変形が少なくなり読みやすいものとなる。これは、単に、文字認識の性能を向上させるだけではなく、文字データの可読性を高くする上で重要なことである。特に、携帯用情報機器でのペン入力では、筆跡の時系列データ(インクデータ)をそのまま表示することが多いので、本発明手法を用いた手書き文字の補正は、取り込んだインクデータを後で読み出して表示する場合に有益である。補正には多少の時間がかかるが、データの取り込み時間以外の時間に処理するなどで対応できる。
【0100】
さらに、前述したように処理対象文書から得られた個人的な傾向を示すデータは、それを保存しておくことで、個人データとして多方面に利用できる。たとえば、携帯用情報機器においてこのような個人的な傾向を示すデータを保存することで、個人識別が可能となり、個人識別がなされた場合のみ、その機器の使用を可能とするというようなこともできる。また、このような個人データを他のシステムに転送して、転送先のシステムでの使用も可能となる。
【0101】
図8は、手書き文字正規化装置の概略的な構成を示すブロック図であり、処理対象文書などから文字列を切り出し、個々の文字を抽出する文字抽出手段1、抽出された個々の文字について雑音除去や大きさの正規化(一定の大きさの矩形に入るように文字の大きさの拡大・縮小を行う)を行う前処理手段2、この前処理手段2により所定の前処理が施された文字に対し、図1から図7を参照しながらこれまで説明した本発明の回転・せん断変形検出処理やそれに基づく是正処理を行う文字字正規化手段3、正規化された文字を出力する出力手段4などから構成されている。
【0102】
文字正規化手段3は、前述した(A)で示される一般的な傾向に基づいて予め作成されたα、βの組み合わせをデータとして有する記憶部31、文字抽出手段1により抽出され前処理手段2により前処理が施された文字に対し、記憶部31に記憶されている一般的な傾向を参照したり、前述した(B)で示される個人的な傾向を用いて、回転・せん断変形を是正するに必要な各種パラメータ(求めるべき垂直ストローク角度αと水平ストローク角度β、回転・せん断変形を表現するそれぞれのパラメータθ1、θ2など)を求める回転・せん断検出部32と、この回転・せん断検出部32により得られた各種パラメータを用いて文字の変形を是正する文字変形是正部33から構成される。
【0103】
このような文字正規化手段3は、これまで説明したように、前述の(A)で示される一般的な傾向、(B)で示される個人的な傾向を用いて、垂直および水平ストローク角度α、βを得て、得られたα、βを用いて、回転・せん断変形を表現するパラメータθ1、θ2を求め、求められたパラメータによって逆アフィン変換を行うが、この文字正規化手段3が行う処理については、既に詳細に説明したのでここではその詳細な説明は省略する。
【0104】
なお、(B)で示される個人的な傾向は、前述したように、処理対象文書内の所定箇所の文字から求められるが、求められた個人的な傾向を示すデータは、前記記憶部31に記憶させておく。この個人的な傾向を示すデータは、前述したように、それを保存しておくことで、個人データとして多方面に利用できる。たとえば、携帯用情報機器においてこのような個人的な傾向を示すデータを保存することで、個人識別が可能となり、個人識別がなされた場合のみ、その機器の使用を可能とするというようなこともできる。また、このような個人データを他のシステムに転送して、転送先のシステムでの使用も可能となる。
【0105】
出力手段4は文字正規化手段3で正規化された文字を出力するもので、たとえば、文字認識装置に適用する場合であれば、正規化されたデータを文字認識部に渡し、また、情報を表示する機能を有していればで、正規化後のデータを表示手段に渡し、正規化後の文字を表示部に表示させることも可能である。さらに、前述したように、個人データを他のシステムに転送することも可能であり、これを行うには、記憶部31に格納された個人的な傾向を示すデータを読み出して、それを他の機器に転送する。
【0106】
本発明の文字正規化処理を文字認識装置における認識の前処理として行うことで、回転・せん断変形を受けた文字であっても、その回転・せん断変形が是正されるので、文字認識率の大幅な向上が期待できる。さらに、本発明の文字正規化処理を行う過程で得られた変形量(回転・せん断を表現するパラメータθ1、θ2など)を、文字認識を行う際に利用することができる。すなわち、文字認識は、認識処理を行う際、文字のいろいろな方向から走査することが行われるので、文字にどのような変形が生じているか文字認識側に知らせることで、その方向に走査して得られた特徴量は、信頼性が低く、重要視しないなどの処置をとることができるので、認識率の向上に寄与できる。
【0107】
また、本発明は、文字認識装置だけではなく、携帯用情報機器などのタブレットでのペン入力によるインクデータの整形などにも適応でき、手書き文字を扱う機器に広く適用することができる。
【0108】
このような手書き入力が可能な情報用情報機器において、ユーザの書いた文字に大きな回転・せん断変形が生じている場合は、その都度、それを整形しながら表示することも可能であり、また、書き込んだ後に、それを読み出して表示する際に、整形した状態で表示させることも可能である。なお、このような整形処理(回転・せん断の検出からそれを是正する処理を含む)は、手書き入力が行われていないときに行うようにして、CPUに負担をかけないようにすることが望ましい。
【0109】
なお、本発明は以上説明した実施の形態に限定されるものではなく、種々変形実施可能となるものである。たとえば、文字の回転・せん断変形は、前述の実施の形態では、外接矩形の形状で表現したが、これ以外の方法で回転・せん断変形を表現するようにしてもよく、また、回転・せん断変形を表現するそれぞれのパラメータを文字の垂直ストロークと水平ストロークによって求めるようにしたが、これ以外の方法で求めてもよい。また、文字の垂直ストロークと水平ストロークによって求める場合であっても、その垂直・水平ストロークを求める方法は前述の実施例に記載されたような射影によって求める方法に限られるものではない。
【0110】
また、以上説明した本発明の文字正規化処理を行う処理プログラムは、フロッピィディスク、光ディスク、ハードディスクなどの記録媒体に記録させておくことができ、本発明はその記録媒体をも含むものである。また、ネットワークから処理プログラムを得るようにしてもよい。
【0111】
【発明の効果】
以上説明したように本発明によれば、文字の回転・せん断変形の変形具合を示す傾向として、不特定多数の書き手によって書かれた複数の文字から統計的に得られた回転・せん断変形の変形具合の一般的な傾向と、ある個人によって書かれた複数の文字から得られたその個人固有の回転・せん断変形の変形具合の個人的な傾向の少なくとも一方を用いて、このような傾向を考慮して回転変形とせん断変形を是正するに必要なパラメータを得るようにしている。
【0112】
このように変形具合の傾向を知った上でパラメータを得る処理を行うことによって、パラメータを得るために無駄な処理を大幅に省くことができ、効率よく短時間でパラメータ検出から是正までを行うことができる。
【0113】
また、前記一般的な傾向と個人的な傾向の少なくとも一方に基づいて前記文字の回転変形とせん断変形を是正するに必要な種々のパラメータを算出する処理は、処理対象文書の所定部分に着目してその着目した部分について行うことにより、処理の効率化が図れる。これは、たとえば、個人的な傾向に基づいてパラメータの算出を行う場合を例に取れば、処理対象文書の所定部分として、たとえば、文書の始めから幾つかの文字、あるいはランダムに何箇所か選ばれた文字というように、所定箇所部分の文字について、その個人的な傾向に基づいてパラメータの算出を行うものである。ある一人の書き手が書いた文書の変形具合は、その文書内においてはほぼ一定と考えられるので、所定部分から、まず、その書き手の個人的な傾向を得て、その個人的な傾向に基づいて前記パラメータを算出するようにすればよいので、前記処理対象文書全体を構成する個々の文字ごとに処理を行わないで済むため、処理を大幅に簡素化することができる。
【0114】
そして、算出されたパラメータを用いて変形の是正を行う際は、前記算出されたパラメータを前記処理対象文書全体に適用して是正処理する。これによれば、前記処理対象文書全体を構成する個々の文字ごとに求められたパラメータによって個々の文字ごとに是正処理を行わないで済むため、処理を大幅に簡素化することができる。
【0115】
また、前述したように処理対象文書から得られた個人的な傾向を示すデータは、それを保存しておくことで、個人データとして多方面に利用できる。たとえば、携帯用情報機器においてこのような個人的な傾向を示すデータを保存することで、個人識別が可能となり、個人識別がなされた場合のみその機器の使用を可能とするというようなこともできる。また、このような個人データを他のシステムに転送して、転送先のシステムでの使用も可能となる。
【0116】
さらに、本発明は、文字認識装置や手書き入力が可能な電子手帳的な携帯用情報機器などに組み込むことが可能であり、文字認識を行う前処理として本発明を適用すれば、ユーザによって手書き入力された文字に大きな回転・せん断変形があってもそれを効率よく短時間で是正することができる。これにより、認識率の向上が図れることは勿論、文字認識を行うための前処理を効率よく短時間で行うことができるので、文字認識までを含めた全体的な処理時間を大幅に短縮することができる。
【0117】
また、手書き入力が可能な機器にあっては、ユーザの書いた文字に大きな回転・せん断変形が生じている場合は、それを整形して表示することも可能となる。これは、文字データの可読性を高くする上で重要なことである。特に、携帯用情報機器でのペン入力では、インクデータをそのまま表示することが多いので、本発明手法を用いた手書き文字の補正は、取り込んだインクデータを後で読み出して表示する場合に有益である。
【図面の簡単な説明】
【図1】回転・せん断変形を受けた文字の例を示す図である。
【図2】本発明の実施の形態を説明する上で必要な外接矩形を用いた回転・せん断変形の表現の仕方を説明する図である。
【図3】正方形の外接矩形を回転・せん断変形させた例を示す図であり、回転・せん断を表すパラメータθ1、θ2の大きさに対する外接矩形の形状を示す図である。
【図4】文字の垂直および水平ストロークを射影を用いて検出する例を説明する図である。
【図5】文字の垂直ストローク角度αおよび水平ストローク角度βの定義を説明する図である。
【図6】射影のエントロピにより文字の垂直ストローク角度および水平ストローク角度を推察する方法を説明する図である。
【図7】不特定多数の書き手によって書かれた複数の文字から得られた回転・せん断変形を表現するそれぞれのパラメータθ1、θ2の分布を示す図で、同図(a)はひらがな、同図(b)は漢字におけるθ1、θ2の分布を示す図である。
【図8】本発明の手書き文字正規化装置の構成を説明するブロック図である。
【符号の説明】
1 文字抽出手段
2 前処理手段
3 文字正規化手段
4 出力手段
31 記憶部
32 回転・せん断検出部
33 文字変形是正手部
OABC 外接矩形
θ1、θ2 回転・せん断変形を表現するパラメータ
α 垂直(縦方向)ストローク角度
β 水平(横方向)ストローク角度
Claims (3)
- 手書き文字の手書き変形である回転変形とせん断変形を検出し、それに対する是正を行うことで手書き文字の正規化を行う手書き文字正規化方法において、
処理対象となる文字の回転変形とせん断変形は文字の外接矩形の形状で表し、その回転変形とせん断変形を表現するそれぞれのパラメータは、当該外接矩形の縦方向の一辺と座標上のある基準軸との角度および当該外接矩形の前記縦方向の一辺に直角な基準線と当該外接矩形の横方向の一辺との角度で表し、これらの角度を前記文字の縦方向ストローク位置と横方向ストローク位置から求め、
前記文字の縦方向ストローク位置と横方向ストローク位置は、当該文字の重心を座標上の中心に一致させたときのその座標のある基準軸を基点とした縦方向ストローク角度および横方向ストローク角度で表し、該縦方向ストローク角度および横方向ストローク角度は、当該文字に対しいろいろな角度から射影をとり、射影をとった各角度と積算画素数の関係に基づく射影関数を得て、その変曲点部分から推察することにより求め、
文書内の全文字について、各文字毎の前記垂直ストローク角度と前記水平ストローク角度より、一般的な傾向から外れる垂直ストローク角度と水平ストローク角度の組み合わせを除き、除外されずに残された垂直ストローク角度と水平ストローク角度の平均を取り、その平均の垂直ストローク角度と水平ストローク角度を求めるべき垂直ストローク角度と水平ストローク角度とすることにより前記回転変形とせん断変形を表現するそれぞれのパラメータを算出し、算出されたパラメータに基づいて正規化処理することを特徴とする手書き文字正規化方法。 - 手書き文字の手書き変形である回転変形とせん断変形を検出し、それに対する是正を行うことで手書き文字の正規化を行う手書き文字正規化装置において、
処理対象となる文字の回転変形とせん断変形は文字の外接矩形の形状で表し、その回転変形とせん断変形を表現するそれぞれのパラメータを算出する回転・せん断変形検出手段と、
前記回転・せん断検出手段により得られた各種パラメータを用いて文字の変形を是正する文字変形是正手段と、
この文字変形是正手段により是正された文字を出力する出力手段とを備え、
前記回転・せん断変形検出手段は、
回転変形とせん断変形を表現するそれぞれのパラメータを、当該外接矩形の縦方向の一辺と座標上のある基準軸との角度および当該外接矩形の前記縦方向の一辺に直角な基準線と当該外接矩形の横方向の一辺との角度で表し、これらの角度を前記文字の縦方向ストローク位置と横方向ストローク位置から求め、
前記文字の縦方向ストローク位置と横方向ストローク位置は、当該文字の重心を座標上の中心に一致させたときのその座標のある基準軸を基点とした縦方向ストローク角度および横方向ストローク角度で表し、該縦方向ストローク角度および横方向ストローク角度は、当該文字に対しいろいろな角度から射影をとり、射影をとった各角度と積算画素数の関係に基づく射影関数を得て、その変曲点部分から推察することにより求め、
文書内の全文字について、各文字毎の前記垂直ストローク角度と前記水平ストローク角度より、一般的な傾向から外れる垂直ストローク角度と水平ストローク角度の組み合わせを除き、除外されずに残された垂直ストローク角度と水平ストローク角度の平均を取り、その平均の垂直ストローク角度と水平ストローク角度を求めるべき垂直ストローク角度と水平ストローク角度とすることにより前記回転変形とせん断変形を表現するそれぞれのパラメータを算出する
ことを特徴とする手書き文字正規化装置。 - 手書き文字の手書き変形である回転変形とせん断変形を検出し、それに対する是正を行うことで手書き文字の正規化を行う文字正規化処理プログラムを記録したコンピュータ読み取り可能な記録媒体であって、
前記文字正規化処理プログラムは、
処理対象となる文字の回転変形とせん断変形は文字の外接矩形の形状で表し、その回転変形とせん断変形を表現するそれぞれのパラメータを算出する回転・せん断変形検出手順と、
前記回転・せん断検出手順により得られた各種パラメータを用いて文字の変形を是正する文字変形是正手順と、
この文字変形是正手段により是正された文字を出力する出力手順と
をコンピュータに行わせ、
前記回転・せん断変形検出手順は、
回転変形とせん断変形を表現するそれぞれのパラメータを、当該外接矩形の縦方向の一辺と座標上のある基準軸との角度および当該外接矩形の前記縦方向の一辺に直角な基準線と当該外接矩形の横方向の一辺との角度で表し、これらの角度を前記文字の縦方向ストローク位置と横方向ストローク位置から求め、
前記文字の縦方向ストローク位置と横方向ストローク位置は、当該文字の重心を座標上の中心に一致させたときのその座標のある基準軸を基点とした縦方向ストローク角度および横方向ストローク角度で表し、該縦方向ストローク角度および横方向ストローク角度は、当該文字に対しいろいろな角度から射影をとり、射影をとった各角度と積算画素数の関係に基づく射影関数を得て、その変曲点部分から推察することにより求め、
文書内の全文字について、各文字毎の前記垂直ストローク角度と前記水平ストローク角度より、一般的な傾向から外れる垂直ストローク角度と水平ストローク角度の組み合わせを除き、除外されずに残された垂直ストローク角度と水平ストローク角度の平均を取り、その平均の垂直ストローク角度と水平ストローク角度を求めるべき垂直ストローク角度と水平ストローク角度とすることにより前記回転変形とせん断変形を表現するそれぞれのパラメータを算出することを特徴とする手書き文字正規化プログラムを記録した記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP16397598A JP3855467B2 (ja) | 1998-06-11 | 1998-06-11 | 手書き文字正規化方法及び手書き文字正規化装置並びに手書き文字正規化処理プログラムを記録した記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP16397598A JP3855467B2 (ja) | 1998-06-11 | 1998-06-11 | 手書き文字正規化方法及び手書き文字正規化装置並びに手書き文字正規化処理プログラムを記録した記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2000003408A JP2000003408A (ja) | 2000-01-07 |
JP3855467B2 true JP3855467B2 (ja) | 2006-12-13 |
Family
ID=15784383
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP16397598A Expired - Lifetime JP3855467B2 (ja) | 1998-06-11 | 1998-06-11 | 手書き文字正規化方法及び手書き文字正規化装置並びに手書き文字正規化処理プログラムを記録した記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3855467B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111079769B (zh) * | 2019-08-02 | 2024-03-22 | 广东小天才科技有限公司 | 一种书写内容的识别方法及电子设备 |
-
1998
- 1998-06-11 JP JP16397598A patent/JP3855467B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JP2000003408A (ja) | 2000-01-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Bhattacharya et al. | Offline signature verification using pixel matching technique | |
US5410611A (en) | Method for identifying word bounding boxes in text | |
US8605982B2 (en) | Check boundary detection by string literal analysis | |
CN112183038A (zh) | 一种表格识别套打方法、计算机设备及计算机可读存储介质 | |
US20240221004A1 (en) | Fraud detection via automated handwriting clustering | |
Konya et al. | Fast seamless skew and orientation detection in document images | |
Shafii | Optical character recognition of printed persian/arabic documents | |
Yadav et al. | Text extraction in document images: highlight on using corner points | |
WO2021218183A1 (zh) | 证件边沿检测方法、装置、设备及介质 | |
CN112434689A (zh) | 识别图片中信息的方法、装置、设备及存储介质 | |
WO2019071476A1 (zh) | 一种基于智能终端的快递信息录入方法及录入系统 | |
Goswami et al. | Classification of printed Gujarati characters using low-level stroke features | |
Ubul et al. | Off-line Uyghur signature recognition based on modified grid information features | |
Daniels et al. | Discriminating features for writer identification | |
JP3855467B2 (ja) | 手書き文字正規化方法及び手書き文字正規化装置並びに手書き文字正規化処理プログラムを記録した記録媒体 | |
JP3855466B2 (ja) | 手書き文字正規化方法及び手書き文字正規化装置並びに手書き文字正規化処理プログラムを記録した記録媒体 | |
JP2013152558A (ja) | 筆跡鑑定方法,筆跡鑑定装置及び筆跡鑑定プログラム | |
Piekarczyk et al. | Hierarchical Graph-Grammar Model for Secure and Efficient Handwritten Signatures Classification. | |
JP2013190911A (ja) | 文字認識装置、認識辞書生成装置及び正規化方法 | |
Su et al. | Automatic seal imprint verification systems using edge difference | |
Nadia et al. | Personal identification based on texture analysis of Arabic handwriting text | |
Adamski et al. | Signature verification by only single genuine sample in offline and online systems | |
Hutchison et al. | Fourier–Mellin registration of line-delineated tabular document images | |
Mandal | An Unprecedented Approach of Skew Detection and Correction for Online Bengali Handwritten Words | |
Khorissi et al. | Application of the wavelet and the Hough transform for detecting the skew angle in Arabic printed documents |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20051206 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20051227 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060206 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060509 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060707 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20060822 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20060904 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090922 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100922 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100922 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110922 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120922 Year of fee payment: 6 |