JPH0962788A - オンライン手書き文字認識方法 - Google Patents

オンライン手書き文字認識方法

Info

Publication number
JPH0962788A
JPH0962788A JP7218407A JP21840795A JPH0962788A JP H0962788 A JPH0962788 A JP H0962788A JP 7218407 A JP7218407 A JP 7218407A JP 21840795 A JP21840795 A JP 21840795A JP H0962788 A JPH0962788 A JP H0962788A
Authority
JP
Japan
Prior art keywords
segment
virtual line
line segment
character
feature amount
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7218407A
Other languages
English (en)
Inventor
Shinobu Yamamoto
忍 山本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP7218407A priority Critical patent/JPH0962788A/ja
Publication of JPH0962788A publication Critical patent/JPH0962788A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 少ないモデル数で様々な続け字のパターンを
認識する。 【解決手段】 前処理部2は、入力装置1から時系列座
標点列として入力された手書き文字に対して正規化、ノ
イズ除去などの前処理を行う。ストローク接続部3は、
ストロークのペンアップ点とペンダウン点の間を仮想線
分で接続し、セグメント分解部4は、ストロークの筆記
方向が所定量以上変化する点において、ストロークを分
解してセグメントの列を作成する。特徴抽出部5では、
各セグメントの長さ、方向、始点の座標、仮想線分の有
無などの特徴量を抽出し、マッチング部7では、辞書6
のモデルの特徴量と入力文字の特徴量を比較してマッチ
ングスコアを算出し、最もスコアの小さいモデルを認識
結果として出力する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、辞書に登録するモ
デル数を増大させることなく続け文字も認識するオンラ
イン手書き文字認識方法に関する。
【0002】
【従来の技術】手書き文字は、ストロークが接続されて
本来の文字よりも画数が少なくなる続け文字となること
が多い。一般にオンライン手書き文字認識においては、
辞書に登録したモデルとストローク毎にマッチングをと
って距離を算出して、その距離が小さいものを認識結果
として出力しているため、画数が異なると正しく認識で
きない。そこで、続け文字を認識するために、あり得る
続け字のパターンの全てを登録することによってこれを
解決した手書き文字認識装置が提案されている(例え
ば、特開平2−250194号公報を参照)。
【0003】
【発明が解決しようとする課題】しかし、上記した方法
では続け字のパターンも辞書のモデルとして登録しなけ
ればならず、辞書のサイズが増大するという欠点があ
る。また、続け字に対応した文字認識方法も提案されて
いるが、辞書のモデルから続け字を発生させる方法で
は、モデルの接続させるべきストロークの対応を求めて
から実際のマッチングを行うため、処理時間が膨大にな
るという問題がある。
【0004】本発明の目的は、文字のすべてのストロー
クを仮接続し、一筆書きの状態でマッチングを行い、仮
接続した部分の特徴を一つの数値で表現することによ
り、ストロークの接続箇所を選択する必要がなく、少な
いモデル数で様々な続け字のパターンを認識するオンラ
イン手書き文字認識方法を提供することにある。
【0005】
【課題を解決するための手段】前記目的を達成するため
に、請求項1記載の発明では、時系列座標点列として入
力される手書き文字を認識するオンライン手書き文字認
識方法において、文字を構成するストロークのペンアッ
プ点とペンダウン点との間を筆記順に仮想線分で接続
し、一筆書きされた文字の各ストロークの方向を、所定
の方向コードを基にセグメントの組に分解し、各セグメ
ントについて、その長さ、方向コード、始点の座標、該
セグメント内の仮想線分の有無を特徴量として抽出し、
抽出された入力文字の各セグメントの特徴量と予め登録
されている文字のモデルの各セグメントの特徴量との差
を基に、該モデルと入力文字間の距離を算出し、該距離
が最小となる文字のモデルを、入力文字の認識結果とし
て出力することを特徴としている。
【0006】請求項2記載の発明では、前記セグメント
の特徴量として、セグメント内の仮想線分の長さを用い
ることを特徴としている。
【0007】請求項3記載の発明では、前記セグメント
の特徴量として、セグメント内の仮想線分の位置する位
置コードを用いることを特徴としている。
【0008】請求項4記載の発明では、前記距離を算出
するとき、仮想線分の存在するセグメントの方向に応じ
て、前記仮想線分の有無の特徴量の重みを変化させるこ
とを特徴としている。
【0009】請求項5記載の発明では、前記距離を算出
するとき、入力文字のストローク数に応じて、前記仮想
線分の有無の特徴量の重みを変化させることを特徴とし
ている。
【0010】請求項6記載の発明では、前記距離を算出
するとき、仮想線分の長さに応じて、前記仮想線分の有
無の特徴量の重みを変化させることを特徴としている。
【0011】
【実施例】以下、本発明の一実施例を図面を用いて具体
的に説明する。図1は、本発明の実施例の構成を示す。
本実施例は、タブレットなどの入力装置1と、時系列座
標点列として入力されたオンライン手書き文字に対し
て、大きさの正規化とノイズ除去と折線近似を行う前処
理部2と、ストロークのペンアップ点とペンダウン点を
仮想線分で接続するストローク接続部3と、ストローク
の筆記方向が所定量以上変化する点において、ストロー
クを順次分解してセグメント列を作成するセグメント分
解部4と、各セグメントについてセグメントの長さ、方
向、始点の座標、終点の座標、仮想線分の有無などの特
徴量を計算する特徴抽出部5と、文字のモデルを登録し
た辞書6と、予め登録された辞書の文字のモデルの特徴
量と入力文字の特徴量を比較計算してマッチングスコア
を算出し、最もスコアの小さいモデルが表す文字を認識
結果として出力するマッチング部7と、認識結果を表示
する出力装置8から構成されている。
【0012】〈実施例1〉タブレットなどの入力装置1
によって時系列座標点列として入力されたオンライン手
書き文字に対して前処理を実行する。まず、公知の技術
を用いて折線近似を行い、点状のストロークをノイズと
して除去し、文字の縦横比を変えずに縦横の内、大きい
方が所定の定数値(例えば1)になるように正規化し、
座標の原点を文字の中心にとる。
【0013】次に、ストロークのペンアップ点とペンダ
ウン点を仮想線分を用いて接続する。図2は、仮想線分
を用いて入力文字を接続した例を示す。図において、点
Cはペンアップ点であり、点Dはペンダウン点であり、
破線の線分CDが仮想線分となる。同様に、破線の線分
FGが仮想線分となる。
【0014】接続の結果として一筆書き状となった文字
のストロークの筆記方向を図3に示す8方向の方向コー
ドで表し、この方向コードが変化する点においてストロ
ークを分解する。分解された部分をセグメントと呼ぶ。
【0015】次いで、各セグメントの特徴量を抽出す
る。セグメントの特徴量は、セグメントの長さ、方向コ
ード、始点の座標、セグメントの中に仮想線分が含まれ
ているか否かを表す仮想線分フラグである。仮想線分フ
ラグは、セグメントの中に仮想線分が含まれていれば
“1”、そうでなければ“0”の値をとる。長さと座標
値は、正規化された後の座標を基準とする。図2の文字
をセグメントに分解して得られたセグメントの特徴量の
例を、図4に示す。
【0016】予め、基準とする文字から特徴量を算出し
て辞書6にモデルとして登録しておき、マッチング部7
は、辞書6に登録されているすべてのモデルについて入
力文字とのマッチングを行う。すなわち、まず、モデル
と入力文字の各セグメントの特徴量の差異を表す距離を
計算する。セグメント間の距離は以下の式によって計算
する。モデルと入力文字のセグメントの長さをそれぞれ
s0、s1、方向コードの値をそれぞれa0、a1、仮
想線分フラグをそれぞれv0、v1とし、始点の座標間
のユークリッド距離をtとすると、セグメント間の距離
dは、 d=|s0−s1|+w1・angle(a0,a1)
+w2・t+w3・|v0−v1| ただし、|a0−a1|<5のとき、 angle(a0,a1)=|a0−a1| |a0−a1|>4のとき、 angle(a0,a1)=8−|a0−a1| w1〜w3は重み係数であり、予め定数として設定して
おく。例えば、w1=0.2、w2=0.3、w3=
0.05のように設定する。
【0017】続いてセグメント間の対応付けを行う。モ
デルと入力文字のセグメントの全ての組み合わせにおい
て距離を算出してマトリックスを作成し、最も距離値の
小さい組み合わせを基準に他のセグメントの対応を決定
する。このとき所定の閾値を設けて、その値以上の距離
をもつ組み合わせは対応させないようにする。また、各
セグメントは筆記順に接続されているので、マトリック
ス状で対応したセグメントの並びは、左上から右下方向
へと単調にならなければならない。図5は、モデルの例
を示し、図6は図5のモデルの特徴量を示す。図7は、
図4と図6から作成した距離マトリックスを示す。最も
距離値の小さいIJとRSの組を基準にとり、例えば閾
値を0.5にとって対応していくと、対応するセグメン
トはマトリックスの丸印を付けた組み合わせとなる。
【0018】そして、対応付けられたセグメントの距離
の和をとり、対応しなかったセグメントの数だけペナル
ティ値を加えて、モデルと入力文字のマッチングスコア
とする。ペナルティ値は適当な値を予め設定しておく。
例えば、0.3と設定すると、図7の例では、ABとJ
KとPQの3つが対応できなかったため、対応したセグ
メントの距離の総和0.86(=0.113+0.04
4+,,,+0.015)に0.9(=0.3×3)を
加えてマッチングスコアは1.76となる。
【0019】辞書に登録されているモデル全てについて
同様の処理を行ってマッチングスコアを求め、マッチン
グスコアが最小のものを入力結果として出力する。
【0020】このように実施例1では、文字のストロー
クを仮想線分を用いて筆記順に接続し、一筆書き状とな
ったストロークを基に認識処理を行うことによって、続
け文字に対しても辞書に登録するモデルの数を増加させ
ることなく正しい認識結果を出力することができる。ま
た、セグメントが仮想線分を含むか否かのフラグを用い
ることによって、「う」と「ろ」のような一筆書きにす
ると区別ができなくなる文字についても、仮想線分があ
る「う」と仮想線分がない「ろ」とを区別することがで
き、辞書のサイズを大幅に増加させることなく誤認識を
防ぐことができる。
【0021】〈実施例2〉本実施例は、実施例1の特徴
抽出の部分において、仮想線分フラグを、セグメントの
中に仮想線分が含まれているか否かではなく、仮想線分
の長さとセグメントの長さの比を表すように変更する。
比は、セグメントの長さを5として、0から5までの6
段階に量子化して表す。これに応じてセグメントの距離
の計算式における重み係数w3の値を変更する。実施例
1ではフラグの値は0または1であったので、距離が大
きく変化しないように、例えばw3=0.01とする。
【0022】図8の「う」と「ら」のような文字では、
セグメントBCとHJがどちらも仮想線分を含み、他の
特徴量も全て類似していて、他のセグメントもほぼ同じ
特徴量を持つため誤認識する恐れがある。仮想線分フラ
グの値を仮想線分の長さに応じた値にすることによって
(例えば、仮想線分BCのフラグ値は6であり、仮想線
分HIのフラグ値は4である)、このような文字間の誤
認識を防ぐことができる。
【0023】〈実施例3〉本実施例は、実施例2の特徴
抽出の部分において、仮想線分の長さとセグメントの長
さの比を表す仮想線分フラグに加え、仮想線分がセグメ
ントの中のどの位置に存在するかというコードを表す仮
想線分フラグ2を設ける。仮想線分の位置コードは、図
9に示すように、セグメントの始点側に存在すれば1、
セグメントの中央付近に存在すれば2、終点側に存在す
れば3を与える。また、セグメントに仮想線分が存在し
なければ0、セグメント全体が仮想線分であれば2を与
える。これに応じてセグメント間の距離dを求める式を
以下のように変更する。
【0024】d=|s0−s1|+w1・angle
(a0,a1)+w2・t+w3・(|v0−v1|+
position(p0,p1)) ただし、|a0−a1|<5のとき、 angle(a0,a1)=|a0−a1| |a0−a1|>4のとき、 angle(a0,a1)=8−|a0−a1| |p0−p1|<3のとき、 position(p0,p1)=|p0−p1| |p0−p1|>2のとき、 position(p0,p1)=4−|p0−p1| 図10に示す「う」と「ら」のような文字では、セグメ
ントBDとIKの仮想線分の長さがほぼ等しいため(C
D=IJ)、誤認識する恐れがある。仮想線分の位置を
表す仮想フラグ2を加えることによって、図10の
「う」の仮想線分CDに対しては位置コード3が付与さ
れ、「ら」の仮想線分IJに対しては位置コード1が付
与され、このような文字間の誤認識を防ぐことができ
る。
【0025】〈実施例4〉本実施例は、実施例3のセグ
メント間の距離を算出する式において、辞書のモデルの
セグメントの方向a0に応じて重み係数w3の値を図1
1のように変化させるように変更する。
【0026】あるストロークの終点から次のストローク
の始点への方向が、右上から左下へ向かう方向(つま
り、図3の方向コードが5)であると、ストロークがつ
ながりやすく、続け字となる可能性が高いと考えられ
る。漢字の部首である「さんずい」や「ごんべん」の例
が顕著である。このような文字では、セグメント間の距
離が大きくなって閾値を超え、正しく対応付けが行われ
ないこともある。このようなストロークがつながりやす
い方向において重み係数を小さくすることによって、セ
グメントの対応が正しく行われ、誤認識を防ぐことがで
きる。
【0027】〈実施例5〉実施例3のセグメント間の距
離を算出する式において、本実施例では、辞書のモデル
の文字の画数が多くなるにしたがって、重み係数w3の
値を減少させるように変更する。例えば、辞書のモデル
の文字の画数をnとして、w3を図12のグラフのよう
に設定する。
【0028】漢字などのストローク数が多い文字におい
ては、どこかでストロークがつながる可能性が高くな
る。距離の計算式を低画数の文字と同じものにしている
と、セグメント間の距離が大きくなって閾値を超え、正
しく対応付けが行われないこともある。画数の多い文字
で重み係数を減少させることで、セグメントの対応が正
しく行われ、誤認識を防ぐことができる。
【0029】〈実施例6〉実施例3のセグメント間の距
離を算出する式において、本実施例では、辞書のモデル
の仮想線分の長さが大きくなるにしたがって重み係数w
3の値を増加させるように変更する。仮想線分の長さu
は、セグメントの長さs0と仮想フラグv0を用いて、
u=(s0・v0)/5で表される。例えば、w3をu
に応じて図13のグラフのように設定する。
【0030】仮想線分が長い部分は、続け字においても
接続する可能性が低いと考えられる。このような仮想線
分が長い部分に対しても同様の重み係数w3を与えた場
合は、長い仮想線分の有無によって区別できる文字が誤
認識されてしまう。例えば、図14(a)は、文字
「2」のモデルであり、(b)は、文字「こ」のモデル
である。いま、(c)に示すような少し崩れた文字
「こ」が入力されたとき、係数w3が同じであるとする
と、仮想線分の特徴の違いがあるにも係らず、入力文字
(c)がモデル(a)とマッチングしてしまう。
【0031】そこで、長い仮想線分が存在するセグメン
トで重み係数w3の値を大きくすることによって、
(a)と(c)がマッチングすることを防止する。
【0032】
【発明の効果】以上、説明したように、請求項1記載の
発明によれば、文字のストローク間を筆記順に仮想線分
を発生させて接続しているので、辞書に登録するモデル
数を増大させることなく、続き文字も認識することがで
きる。また、仮想線分の特徴を一つの数値で表してマッ
チングスコアの計算に用いているので、一筆書きにする
と類似するような文字も正しく認識することができる。
【0033】請求項2記載の発明によれば、仮想線分の
特徴として、仮想線分の長さを用いているので、仮想線
分の長さの違いでしか区別されないような文字を正しく
認識することができる。
【0034】請求項3記載の発明によれば、仮想線分の
位置する位置コードを用いることによって、仮想線分の
位置の違いでしか区別されないような文字を正しく認識
することができる。
【0035】請求項4記載の発明によれば、発生した仮
想線分の方向に応じて、マッチングスコアの計算式にお
ける仮想線分の特徴の重みを変化させることによって、
続け字が起きやすい方向の仮想線分を多く持つ文字の誤
認識を減少させることができる。
【0036】請求項5記載の発明によれば、文字の画数
に応じて、マッチングスコアの計算式における仮想線分
の特徴の重みを変化させることによって、続け字の起き
やすい画数が多い文字の誤認識を減少させることができ
る。
【0037】請求項6記載の発明によれば、仮想線分の
長さに応じて、マッチングスコアの計算式における仮想
線分の特徴の重みを変化させることによって、歪が大き
い入力文字の誤認識を防ぐことができる。
【図面の簡単な説明】
【図1】本発明の実施例の構成を示す。
【図2】入力された文字の例を示す。
【図3】8方向の方向コードを示す。
【図4】図2の文字の特徴量を示す。
【図5】辞書内のモデル例を示す。
【図6】モデルの特徴量を示す。
【図7】入力文字とモデルのセグメントの対応を示す。
【図8】仮想線分の有無だけで識別できない文字の例を
示す。
【図9】セグメント内で仮想線分の位置する位置コード
を示す。
【図10】仮想線分の長さだけで識別できない文字の例
を示す。
【図11】セグメントの方向フラグと重み係数の関係を
示す。
【図12】ストローク数と重み係数の関係を示す。
【図13】仮想線分の長さと重み係数の関係を示す。
【図14】(a)、(b)、(c)は、歪のために、仮
想線分の特徴の違いがあっても誤認識する例を示す。
【符号の説明】
1 入力装置 2 前処理部 3 ストローク接続部 4 セグメント分解部 5 特徴抽出部 6 辞書 7 マッチング部 8 出力装置

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 時系列座標点列として入力される手書き
    文字を認識するオンライン手書き文字認識方法におい
    て、文字を構成するストロークのペンアップ点とペンダ
    ウン点との間を筆記順に仮想線分で接続し、一筆書きさ
    れた文字の各ストロークの方向を、所定の方向コードを
    基にセグメントの組に分解し、各セグメントについて、
    その長さ、方向コード、始点の座標、該セグメント内の
    仮想線分の有無を特徴量として抽出し、抽出された入力
    文字の各セグメントの特徴量と予め登録されている文字
    のモデルの各セグメントの特徴量との差を基に、該モデ
    ルと入力文字間の距離を算出し、該距離が最小となる文
    字のモデルを、入力文字の認識結果として出力すること
    を特徴とするオンライン手書き文字認識方法。
  2. 【請求項2】 前記セグメントの特徴量として、セグメ
    ント内の仮想線分の長さを用いることを特徴とする請求
    項1記載のオンライン手書き文字認識方法。
  3. 【請求項3】 前記セグメントの特徴量として、セグメ
    ント内の仮想線分の位置する位置コードを用いることを
    特徴とする請求項1記載のオンライン手書き文字認識方
    法。
  4. 【請求項4】 前記距離を算出するとき、仮想線分の存
    在するセグメントの方向に応じて、前記仮想線分の有無
    の特徴量の重みを変化させることを特徴とする請求項1
    記載のオンライン手書き文字認識方法。
  5. 【請求項5】 前記距離を算出するとき、入力文字のス
    トローク数に応じて、前記仮想線分の有無の特徴量の重
    みを変化させることを特徴とする請求項1記載のオンラ
    イン手書き文字認識方法。
  6. 【請求項6】 前記距離を算出するとき、仮想線分の長
    さに応じて、前記仮想線分の有無の特徴量の重みを変化
    させることを特徴とする請求項1記載のオンライン手書
    き文字認識方法。
JP7218407A 1995-08-28 1995-08-28 オンライン手書き文字認識方法 Pending JPH0962788A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7218407A JPH0962788A (ja) 1995-08-28 1995-08-28 オンライン手書き文字認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7218407A JPH0962788A (ja) 1995-08-28 1995-08-28 オンライン手書き文字認識方法

Publications (1)

Publication Number Publication Date
JPH0962788A true JPH0962788A (ja) 1997-03-07

Family

ID=16719434

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7218407A Pending JPH0962788A (ja) 1995-08-28 1995-08-28 オンライン手書き文字認識方法

Country Status (1)

Country Link
JP (1) JPH0962788A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1999016013A1 (fr) * 1997-09-22 1999-04-01 Hitachi, Ltd. Dispositif de reconnaissance de caracteres
KR100454541B1 (ko) * 1998-04-27 2004-11-03 산요덴키가부시키가이샤 수기 문자 인식 방법 및 시스템
JP2007213433A (ja) * 2006-02-10 2007-08-23 Fujitsu Ltd 文字検索装置
JP2014235551A (ja) * 2013-05-31 2014-12-15 株式会社東芝 検索装置、方法及びプログラム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1999016013A1 (fr) * 1997-09-22 1999-04-01 Hitachi, Ltd. Dispositif de reconnaissance de caracteres
US6718060B1 (en) 1997-09-22 2004-04-06 Renesas Technology Corporation Character recognizer
KR100454541B1 (ko) * 1998-04-27 2004-11-03 산요덴키가부시키가이샤 수기 문자 인식 방법 및 시스템
JP2007213433A (ja) * 2006-02-10 2007-08-23 Fujitsu Ltd 文字検索装置
JP2014235551A (ja) * 2013-05-31 2014-12-15 株式会社東芝 検索装置、方法及びプログラム

Similar Documents

Publication Publication Date Title
US6956969B2 (en) Methods and apparatuses for handwriting recognition
US5787197A (en) Post-processing error correction scheme using a dictionary for on-line handwriting recognition
WO1997044758A9 (en) Methods and apparatuses for handwriting recognition
JP3761937B2 (ja) パターン認識方法及び装置及びコンピュータ制御装置
JPH0962788A (ja) オンライン手書き文字認識方法
JPH0150954B2 (ja)
KR100301216B1 (ko) 온라인문자인식장치
KR940015910A (ko) 온라인 필기체 인식 시스템
JP2930996B2 (ja) 画像認識方法および画像認識装置
JP3115139B2 (ja) 文字切り出し方法
JP3345469B2 (ja) 単語間隔度演算方法、単語間隔度演算装置、及び文字読取り方法、文字読取り装置
JP3198218B2 (ja) オンライン手書き文字認識方法
JP3338575B2 (ja) オンライン手書き文字認識装置
JPH06295356A (ja) オンライン文字認識装置
JPH0776980B2 (ja) 文字認識方法
KR850003609A (ko) 패턴인식의 방법과 장치
JP3100786B2 (ja) 文字認識後処理方式
JP2962984B2 (ja) 文字認識装置
JP2972443B2 (ja) 文字認識装置
JPS60217487A (ja) 文字認識装置
JPS63301383A (ja) 筆記文字認識装置
JPH0580711B2 (ja)
JPH01213772A (ja) オンライン文字認識方式
JPH0766418B2 (ja) 手書き文字認識装置
JPH06187500A (ja) オンライン文字認識装置