JP2000099630A - 文字認識方法、文字認識装置および記憶媒体 - Google Patents

文字認識方法、文字認識装置および記憶媒体

Info

Publication number
JP2000099630A
JP2000099630A JP10271935A JP27193598A JP2000099630A JP 2000099630 A JP2000099630 A JP 2000099630A JP 10271935 A JP10271935 A JP 10271935A JP 27193598 A JP27193598 A JP 27193598A JP 2000099630 A JP2000099630 A JP 2000099630A
Authority
JP
Japan
Prior art keywords
character
character recognition
difference
feature
writing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP10271935A
Other languages
English (en)
Other versions
JP3357847B2 (ja
Inventor
Masayoshi Okamoto
正義 岡本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanyo Electric Co Ltd
Original Assignee
Sanyo Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanyo Electric Co Ltd filed Critical Sanyo Electric Co Ltd
Priority to JP27193598A priority Critical patent/JP3357847B2/ja
Publication of JP2000099630A publication Critical patent/JP2000099630A/ja
Application granted granted Critical
Publication of JP3357847B2 publication Critical patent/JP3357847B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【課題】 文字の折れ曲がり個所を屈曲して筆記するか
湾曲して筆記するかに拘わらず、精度良く文字認識を行
なえるようにすること。 【解決手段】 筆記文字の屈曲点Smと、当該屈曲点に
向かう筆記ストロークの方向Vm−1と当該屈曲点から
出て行く筆記ストロークの方向Vm+1との間の方向差
分Fmとを特徴要素として文字認識を行う。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文字認識方法に関
し、特に文字の折れ曲がり個所を屈曲して筆記するか湾
曲して筆記するかに拘わらず認識精度を維持し得る文字
認識方法に関する。
【0002】
【従来の技術】PDCなどに搭載される表示入力一体型
タブレットにおいては、手書き入力された文字の認識精
度が、商品価値を評価する上で重要な要素となってい
る。かかる文字認識の方法として、文字ストロークの筆
記方向を特徴要素とするものが公知である。しかし、か
かる方法によれば、筆記者の書き癖により所定のストロ
ークの筆記方向が基準の辞書情報とずれる場合があり、
このような場合には、正しく文字を認識できない恐れが
ある。
【0003】そこで、出願人は、筆記文字ストロークの
屈曲点を特徴要素として、文字認識を行う手法を開発
し、先に、特願平8−310936号を出願した。かか
る方法は、筆記文字ストロークの屈曲点の位置と屈曲角
度を検出し、これを辞書情報と比較して文字を認識する
ものである。かかる方法によれば、上記従来例のように
所定ストロークの筆記方向が筆記者によって様々であっ
ても、屈曲点の位置と屈曲角度はそれ程変動することは
なく、よって、文字認識の精度を改善できるようにな
る。
【0004】しかしながら、かかる方法においては、筆
記文字の折れ曲がり点が、屈曲している場合と湾曲して
いる場合とでは、方向変化特徴に違いが生じ、誤認識を
招くケースがある。例えば、図1の(a)と(b)は、
どちらも「日」の筆記文字であり、WとW'の個所が湾曲
して筆記されているか、屈曲して筆記されているかが異
なっている。かかる場合、どちらかの一方の筆記文字の
特徴量が偏って認識辞書に反映された場合、もしくは、
どちらか一方だけの特徴量によって認識辞書を作成した
場合、他方の形状の文字を筆記すると、WとW'における
湾曲しているか屈曲しているかの違いが大きな特徴量の
違いになって、正しく認識できないことがある。
【0005】図2、図3、図4は、従来例による手法で
前記2つの文字から特徴を抽出する例を示す。まず、筆
記された文字を、文字が所定範囲に収まるように、且
つ、字形変動によって冗長的に長くなった線分を短くす
るなど、文字の特徴を安定的に抽出するできるように、
線密度による非線形正規化を行う。線密度による非線形
正規化については、"線密度イコライゼーションー相関
法のための非線形正規化法ー"(電子情報通信学会論文,
vol.J67-D,No.11,pp.1379-1383,1984.11)に詳しい。
【0006】かかる非線形正規化後、筆記文字から方向
変化の個所Wm(図2)を検出し、方向変化後の方向Fm、
方向変化量Gmを求める。そして、基準となる8方向(図
5参照)毎に準備された8パターンのメッシュ領域(メ
ッシュメモリ)の内、方向変化後の方向(図2では、右
下斜め方向)に応じたメッシュ領域に対し、点Smの個所
に特徴値を代入することで、特徴量を抽出するようにな
っている。
【0007】ここで、方向変化後の方向が上記基準とな
る8方向に一致している場合には、特徴量を1とし、8
方向の内、基準となる2方向の間にある場合には各方向
の比例按分する。たとえば、図5の場合には、変化後の
方向(大きさF)に対し、D1方向の特徴量はZ8/F
となり、D2方向の特徴量はZ1/Fとなる。そして、
この場合には、D1方向のメッシュ領域とD2方向のメ
ッシュ領域のぞれぞれに、かかる特徴量が代入される。
【0008】図3においても、上記と同様に特徴量を抽
出される。この文字の場合、W'mの個所では、方向変化
後の方向が真下であるため、真下方向用のメッシュ領域
のS'm位置へ特徴値(方向変化量G7m)が代入される。図
4は、前記2つの文字に対して、方向変化後の方向別の
特徴空間へ全ての特徴量を抽出した結果を示す。S1は、
図2のWmでの特徴を表し、S2、S3は、同Wm-1での特
徴、S5は同Wm+1での特徴を表す。また、S'1は、図3の
W'mでの特徴を表す。なお、メッシュ内の濃度は特徴値
の大きさを表す。
【0009】2つの文字の特徴量を比較すると、湾極点
Wmに対応するS1と屈曲点W'mに対応するS'1の特徴空間が
それぞれ別の特徴空間になっている。認識処理では、位
置ずれに対応するため特徴量をぼかし処理した後、特徴
空間別に筆記文字と文字認識辞書との特徴量の照合を行
うようになっているが、特徴空間自体が異なっておれ
ば、S1とS'mは照合しようがない。例えば、2つの文字
の一方S'mが文字認識辞書の特徴量であり、他方Smが筆
記文字の特徴量とすると、両者は照合しにくくなり、正
しく認識できないことがある。S5とS'mが同じ特徴空間
にあるが、これらは位置が2メッシュも離れているた
め、ぼかし処理を行っても両者は照合しにくい。
【0010】
【発明が解決しようとする課題】そこで、本発明は、文
字の折れ曲がり個所を屈曲して筆記するか湾曲して筆記
するかに拘わらず、精度良く文字認識を行い得る文字認
識方法を提供しようとするものである。
【0011】
【課題を解決するための手段】上記課題を解決すべく、
本発明は、それぞれ以下の特徴を有する。請求項1の発
明は、筆記文字の屈曲点を検出するステップと、当該屈
曲点に向かう筆記ストロークの方向と当該屈曲点から出
て行く筆記ストロークの方向との間の方向差分を検出す
るステップとを備え、前記屈曲点の位置と前記方向差分
とを特徴要素として文字認識を行うことを特徴とする。
【0012】請求項2の発明は、請求項1において、前
記方向差分の内、方向のみを特徴要素として用いること
を特徴とする。請求項3の発明は、請求項1または2に
おいて、指標となる基準方向を準備し、前記方向差分の
方向を当該基準方向でもって抽出したことを特徴とす
る。請求項4の発明は、請求項3において、前記方向差
分の方向が前記基準方向の隣り合う2つの方向の間に位
置する場合には、当該2つの基準方向への接近度に応じ
て比例按分した寄与度でもって、前記方向差分の方向を
抽出することを特徴とする。
【0013】請求項5の発明は、請求項2〜4の何れか
において、前記屈曲点の周囲に対しても、当該方向差分
の特徴要素を所定の比率で割り振ることを特徴とする。
請求項6の発明は、請求項2〜5の何れかにおいて、筆
記文字のストローク線分の方向を検出するステップを備
え、かかるストローク線分方向を特徴要素としてさらに
用いることを特徴とする。
【0014】請求項7の発明は、上記請求項1〜6の
内、少なくとも一つの文字認識方法を実現する制御手段
と認識辞書とを有する文字認識装置である。請求項8の
発明は、上記請求項1〜6の内、少なくとも一つの文字
認識方法を実行するためのプログラムを記憶した記憶媒
体である。請求項9の発明は、上記請求項1〜6の内、
少なくとも一つの文字認識方法を実行するための認識辞
書を記憶した記憶媒体である。
【0015】
【発明の実施の形態】以下、本発明に係る実施の形態を
図6〜図15に基づき詳述する。図6は、本発明による
第1の実施例の機能構成を示すブロック図である。図に
おいて、表示入力一体型タブレット1(以下、タブレッ
トと称する)はLCD表示部1a(以下表示部)とペン
の座標検出部1bが一体になった装置であり、1aの座
標と1bの座標は1対1で対応している。
【0016】主制御部2は、装置全体を制御する部分で
ある。タブレット上でペンにより文字を筆記すると、座
標検出部1bによりペンの座標やペンDown/Up状態を検
出して、主制御部2で受け取り、座標データ(ペン座
標、ペンDown/UP状態)を文字認識部3に付属の文字筆
記データ記憶主制御部31に記憶していく。主制御部2
は、一定時間のペンUP状態の継続により、1文字分の
筆記終了と判定して、文字認識部3へ文字認識の開始指
示を出し、文字認識部3は、文字筆記データ記憶用メモ
リーのデータに対して文字認識を行う。文字認識が終了
すると、文字認識部3から文字認識結果を主制御部2へ
送り、主制御部2は文字認識結果を、タブレット1の表
示部1aへ表示する。
【0017】以下、文字認識部3の文字認識処理につい
て詳述する。図7は、文字認識処理のフローチャートで
ある。まず、1文字分の筆跡データ(時系列のペン座標
データ)を、文字が所定範囲(64x64ドット)のに
収まるように、且つ、字形変動によって冗長的に長くな
った線分を短くするなど、文字の特徴を安定的に抽出す
るできるように、線密度による非線形正規化を行う(ス
テップS701)。図10のFA11が筆記文字データであ
り、FA12が非線形正規化後の文字データである。
【0018】非線形正規化後、方向特徴の抽出(ステッ
プS702)と、方向変化差分特徴の抽出(ステップS
703)を行う。ここで、方向特徴の抽出は、筆記文字
の各座標点におけるストローク方向を特徴量とするもの
で、文字認識の精度を向上させるための手法として、屈
曲点の特徴量抽出に組み合わされたものである。かかる
方向特徴の抽出は、基準となる4方向(水平、垂直、右
下がり斜め、右上がり斜め)別に、それぞれの方向をも
つ座標点がどのメッシュ領域にあるかを抽出ものであ
る。なお、かかる手法については、”手書き漢字の方向
パターン・マッチング法による解析”(電子情報通信学
会,Vol.J65-D,No.5,pp.550-557,1982.5)に詳説されてい
る。本実施の形態では、方向別に各8x8メッシュ(8
x8次元)の特徴空間(配列:メモリ)を準備し、筆記
ストロークの存在する個所に特徴量を代入する。
【0019】たとえば、図11において、筆記データの
各座標点を追跡し、各座標点Wnの方向を検出し、その
方向と同じ方向の特徴空間(配列)における、座標点W
nの位置に対応する非線形正規化後の位置Snが含まれ
る配列位置に特徴値を代入していく。この時、各座標点
の方向が基準の4方向のいずれかに一致していれば、一
致している方向への寄与度1.0を特徴値とする。各座
標点の方向が基準の4方向のうちの隣合う2方向の間に
ある場合は、その2方向別の寄与度(各座標点の方向ベ
クトルの2方向の軸へのそれぞれの射影率)を求め、2
方向の特徴空間へそれぞれの寄与度を特徴値として代入
する。
【0020】図12に筆記文字F1001に対する方向
特徴の抽出結果例を示す。図中、メッシュの濃度は、特
徴値の大きさを表す。次に、図7のS703に係る方向
差分特徴抽出について説明する。かかる方向変化差分特
徴は、どの位置でどのような方向変化がおきたか、すな
わち、方向変化後の方向と方向変化前の方向との間の差
ベクトルを求め、この差ベクトルの方向を特徴抽出に用
いるものである。
【0021】図9に、かかる方向変化差分特徴を抽出す
るためのフローチャートを示す。まず、方向変化個所を
検出する(ステップS901)。かかる方向変化個所の検出
は、筆記文字の座標点に対し、直前の座標点からその座
標点へ向かうベクトルと、その座標点から直後の座標点
へ向かうベクトルとの間の変位角が所定のしきい値を超
えたか否かで判別する。なお、ここで、比較対象とすべ
き座標点は、筆記文字の全ての座標点ではなく、かかる
座標点を適当に間引いたものとする。たとえば、一定の
時間間隔で間引いた座標点を比較対象とすればよい。
【0022】このようにして筆記文字の方向変化個所が
検出されれば、次に、その方向変化個所Wm(図13)に
おける方向変化差分の方向Fm(図13)を検出する(ス
テップS903)。その後、方向変化個所Wmに対応する
非線形正規化後の点Sm(図13)を求め(ステップS9
05)、Smに対応するFm方向(左下斜め方向)の方向差
分特徴用の特徴空間(メッシュ)へ特徴値(方向寄与
度)を代入する(ステップS906)。
【0023】ここで、方向変化差分の方向は、個所Wmに
向かうベクトルVm-1と個所Wmから出て行くベクトルVm+1
とをそれぞれ単位ベクトルとし、これらを減算して求め
たベクトルFmの方向を用いるものとする。なお、本実施
の形態では、Fmの大きさは特徴量として用いず、その方
向のみを特徴要素として用いる。このようにして、方向
変化個所を全て検出し終わったら、特徴抽出処理を終了
する。文字Wmに対する方向変化差分特徴の抽出結果例を
図15のF151からF153に示す。
【0024】特徴を抽出した後(図10のFA13)、それ
ぞれの特徴量(特徴空間の配列の値)に対して、ガウシ
ャン・フィルターによる特徴量のぼかし処理を行う(ス
テップS704、図10のFA14)。その後、筆記された文字
に対する全ての特徴量(図10のFA15)と、予め作成し
ておいた文字認識辞書内の各1文字の特徴量(図10のFA
21)とを照合して、照合度を求める(図7、ステップ
S705)。全認識対象の文字(認識辞書内の文字)に
対して照合度を求め(ステップS706、S705のル
ープ)、最も照合度の高い文字を認識結果とする(ステ
ップS707)。
【0025】以下、文字認識辞書の作成手順について、
図8のフローで説明する。文字認識辞書の作成には、複
数人分の筆記データを用いる。まず、同一文字の複数人
分の筆記データに対して、それぞれ、非線形正規化(ス
テップS801、FA17)、方向特徴抽出(ステップS802)、
回転特徴抽出(S803)を行い(F7A18)、全人数分を繰り
返し(S804)、1文字分の平均特徴量(全人数分の特徴
量の平均)を算出する(ステップS805、FA19)。この
平均特徴量に対して、特徴量のぼかし処理を行い(ステ
ップS806)、1文字分の認識辞書とする(FA21)。以
上の処理を全文字に対して行い、全文字の認識辞書を作
成する。
【0026】図14に、文字W'に対して特徴を抽出した
場合の例を示す。この文字の例では、方向変化点W'mで
の方向変化差分方向F'mが左下斜め方向であるので、左
下斜め方向用の特徴空間のS'mの位置へ特徴値(方向寄
与度=1.0)が代入される。この文字W'での方向変化
の個所はW'mだけであり、特徴抽出結果は、図15のF15
4からF156のようになる。
【0027】図15を参照して分かるように、Wmに対す
る特徴S1の特徴空間とW'mに対する特徴S'1の特徴空間
は一致している。また、S1とS'1の位置のずれは1メッ
シュだけである。よって、特徴量のぼかし処理を行え
ば、屈曲個所は照合しやすくなる。仮に、一方の文字W'
の特徴量を文字認識辞書に用いた場合、他方の文字Wの
文字を筆記したとしても、照合度が高いため、正しく認
識できる。
【0028】以上、本発明の実施の形態について説明し
たが、本発明はかかる実施の形態に限定されるものでは
なく、他に種々の変更が可能であることは言うまでもな
い。
【0029】
【発明の効果】本発明によれば、文字の折れ曲がり個所
を屈曲して筆記するか湾曲して筆記するかに拘わらず、
精度良く文字認識を行い得る。
【図面の簡単な説明】
【図1】 従来例を説明するための図
【図2】 従来例を説明するための図
【図3】 従来例を説明するための図
【図4】 従来例を説明するための図
【図5】 従来例を説明するための図
【図6】 実施の形態の構成を示す図
【図7】 実施の形態に係るフローチャートを示す図
【図8】 実施の形態に係るフローチャートを示す図
【図9】 実施の形態に係るフローチャートを示す図
【図10】 実施の形態の作用を説明するための図
【図11】 実施の形態の作用を説明するための図
【図12】 実施の形態の作用を説明するための図
【図13】 実施の形態の作用を説明するための図
【図14】 実施の形態の作用を説明するための図
【図15】 実施の形態の作用を説明するための図
【符号の説明】
1 表示入力一体型タブレット 2 主制御部 3 文字認識部 4 文字認識辞書 31 文字筆記データ記憶用メモリ

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】 筆記文字の屈曲点を検出するステップ
    と、当該屈曲点に向かう筆記ストロークの方向と当該屈
    曲点から出て行く筆記ストロークの方向との間の方向差
    分を検出するステップとを備え、前記屈曲点の位置と前
    記方向差分とを特徴要素として文字認識を行うことを特
    徴とする文字認識方法。
  2. 【請求項2】 請求項1において、前記方向差分の内、
    方向のみを特徴要素として用いることを特徴とする文字
    認識方法。
  3. 【請求項3】 請求項1または2において、指標となる
    基準方向を準備し、前記方向差分の方向を当該基準方向
    でもって抽出したことを特徴とする文字認識方法。
  4. 【請求項4】 請求項3において、前記方向差分の方向
    が前記基準方向の隣り合う2つの方向の間に位置する場
    合には、当該2つの基準方向への接近度に応じて比例按
    分した寄与度でもって、前記方向差分の方向を抽出する
    ことを特徴とする文字認識方法。
  5. 【請求項5】 請求項2〜4の何れかにおいて、前記屈
    曲点の周囲に対しても、当該方向差分の特徴要素を所定
    の比率で割り振ることを特徴とする文字認識方法。
  6. 【請求項6】 請求項2〜5の何れかにおいて、筆記文
    字のストローク線分の方向を検出するステップを備え、
    かかるストローク線分方向を特徴要素としてさらに用い
    ることを特徴とする文字認識方法。
  7. 【請求項7】 上記請求項1〜6の内、少なくとも一つ
    の文字認識方法を実現する制御手段と認識辞書とを有す
    る文字認識装置。
  8. 【請求項8】 上記請求項1〜6の内、少なくとも一つ
    の文字認識方法を実行するためのプログラムを記憶した
    記憶媒体。
  9. 【請求項9】 上記請求項1〜6の内、少なくとも一つ
    の文字認識方法を実行するための認識辞書を記憶した記
    憶媒体。
JP27193598A 1998-09-25 1998-09-25 文字認識方法、文字認識装置および記憶媒体 Expired - Fee Related JP3357847B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP27193598A JP3357847B2 (ja) 1998-09-25 1998-09-25 文字認識方法、文字認識装置および記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP27193598A JP3357847B2 (ja) 1998-09-25 1998-09-25 文字認識方法、文字認識装置および記憶媒体

Publications (2)

Publication Number Publication Date
JP2000099630A true JP2000099630A (ja) 2000-04-07
JP3357847B2 JP3357847B2 (ja) 2002-12-16

Family

ID=17506900

Family Applications (1)

Application Number Title Priority Date Filing Date
JP27193598A Expired - Fee Related JP3357847B2 (ja) 1998-09-25 1998-09-25 文字認識方法、文字認識装置および記憶媒体

Country Status (1)

Country Link
JP (1) JP3357847B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009134383A (ja) * 2007-11-29 2009-06-18 Sony Corp 画像処理装置および方法、並びにプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009134383A (ja) * 2007-11-29 2009-06-18 Sony Corp 画像処理装置および方法、並びにプログラム

Also Published As

Publication number Publication date
JP3357847B2 (ja) 2002-12-16

Similar Documents

Publication Publication Date Title
US6289124B1 (en) Method and system of handwritten-character recognition
US7313277B2 (en) Method and device for recognition of a handwritten pattern
JP2933801B2 (ja) 文字の切り出し方法及びその装置
JP3335538B2 (ja) 手書き文字列の照合方法および装置
CN107545223B (zh) 图像识别方法及电子设备
JP4817297B2 (ja) 文字検索装置
JP4704601B2 (ja) 文字認識方法,プログラム及び記録媒体
JP2015099566A (ja) 特徴算出装置、方法及びプログラム
JP3357847B2 (ja) 文字認識方法、文字認識装置および記憶媒体
JP3470541B2 (ja) オンライン手書き文字認識装置
JP2000163514A (ja) 文字認識方法、文字認識装置および記憶媒体
JP3422634B2 (ja) 手書き文字認識方法及び装置
JP3977473B2 (ja) 手書き文字認識方法及び手書き文字認識装置
JP3817281B2 (ja) 情報処理装置及び方法
JPH0729002A (ja) 手書き図形認識装置
JP4059841B2 (ja) 文字認識方法、文字認識装置および記憶媒体
KR100290606B1 (ko) 온라인 한글 필기체 문자 인식방법
EP0377129A2 (en) Fast spatial segmenter for handwritten characters
JP3749035B2 (ja) 文字認識方法、文字認識装置および記憶媒体
JP3365538B2 (ja) オンライン文字認識方法および装置
JP3198218B2 (ja) オンライン手書き文字認識方法
JPH045231B2 (ja)
JP2519782B2 (ja) 文字分離方式
CN112183538A (zh) 一种满文识别方法及系统
JP2665488B2 (ja) 個人辞書登録方式

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081004

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091004

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101004

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111004

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees