JP3216800B2 - 手書き文字認識方法 - Google Patents
手書き文字認識方法Info
- Publication number
- JP3216800B2 JP3216800B2 JP22684297A JP22684297A JP3216800B2 JP 3216800 B2 JP3216800 B2 JP 3216800B2 JP 22684297 A JP22684297 A JP 22684297A JP 22684297 A JP22684297 A JP 22684297A JP 3216800 B2 JP3216800 B2 JP 3216800B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- stroke
- writing
- handwritten
- component
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Character Input (AREA)
- Character Discrimination (AREA)
- Document Processing Apparatus (AREA)
Description
【0001】
【発明の属する技術分野】本発明は、タブレットや電子
黒板などの手書き文字入力装置から入力された手書き文
字を認識する手書き文字列認識方法に関するものであ
る。
黒板などの手書き文字入力装置から入力された手書き文
字を認識する手書き文字列認識方法に関するものであ
る。
【0002】
【従来の技術】従来、この種の手書き文字認識方法ある
いは認識装置として、次のようなものが提案されてい
る。
いは認識装置として、次のようなものが提案されてい
る。
【0003】(1)特開昭61−29982号(名称:
オンライン手書き文字列認識方式) (2)特開平5−174185号(名称:日本語文字認
識装置) (3)特開平6−162269号(名称:手書き文字認
識装置) (4)特開平8−50632号(名称:手書き文字切り
出し方法および装置) 特開昭61−29982号公報に開示されたオンライン
手書き文字列認識方法は、データタブレット上に自由形
式で筆記された文字列を認識する際の制約を解消すると
共に、文字のセグメンテーションを正しく行うことを目
的とし、データタブレットから入力されたストローク列
を複数の基本セグメント列に分割し、次に、その基本セ
グメントを組み合わせて候補文字を生成し、次に、生成
された候補文字を標準文字との照合によって逐次認識
し、認識結果の文字名称と相違度を蓄積する処理を、全
ての候補文字に対して反復実行し、入力ストローク列に
対し相違度の総和を最小とする文字名称の系列を最小経
路探索アルゴリズムを用いて割り当てるようにしたもの
である。
オンライン手書き文字列認識方式) (2)特開平5−174185号(名称:日本語文字認
識装置) (3)特開平6−162269号(名称:手書き文字認
識装置) (4)特開平8−50632号(名称:手書き文字切り
出し方法および装置) 特開昭61−29982号公報に開示されたオンライン
手書き文字列認識方法は、データタブレット上に自由形
式で筆記された文字列を認識する際の制約を解消すると
共に、文字のセグメンテーションを正しく行うことを目
的とし、データタブレットから入力されたストローク列
を複数の基本セグメント列に分割し、次に、その基本セ
グメントを組み合わせて候補文字を生成し、次に、生成
された候補文字を標準文字との照合によって逐次認識
し、認識結果の文字名称と相違度を蓄積する処理を、全
ての候補文字に対して反復実行し、入力ストローク列に
対し相違度の総和を最小とする文字名称の系列を最小経
路探索アルゴリズムを用いて割り当てるようにしたもの
である。
【0004】次に、特開平5−174185号公報に開
示された日本語文字認識装置は、スキャナなどからオン
ラインもしくはオフラインで入力された日本語文字列の
誤切り出しおよび誤認識を最小限にすることを目的と
し、分離文字あるいは半角文字が並んでいる可能性のあ
る文字列の範囲を検出し、その範囲で全ての切り出し候
補を求め、認識を行い、切り出し優先順位と認識類似度
との相互判断で最も確からしい認識文字コードを出力す
るために、文字部分の連結部分の外接図形を抽出し、隣
接する外接図形が、横書き文書ならば上下方向に、縦書
き文書ならば左右方向に重なっている場合に統合を行っ
て基本矩形を作成し、その基本矩形が単独で1文字とし
て決定できるか否かを判定し、決定できない場合、その
基本矩形の範囲を検出し、この範囲に対し、切り出し候
補として隣接する基本矩形の統合の組合せを求め、夫々
に優先順位を付け、全切り出し候補を認識し、切り出し
優先順位および認識類似度より最も確からしい認識文字
コードを出力するようにしたものである。
示された日本語文字認識装置は、スキャナなどからオン
ラインもしくはオフラインで入力された日本語文字列の
誤切り出しおよび誤認識を最小限にすることを目的と
し、分離文字あるいは半角文字が並んでいる可能性のあ
る文字列の範囲を検出し、その範囲で全ての切り出し候
補を求め、認識を行い、切り出し優先順位と認識類似度
との相互判断で最も確からしい認識文字コードを出力す
るために、文字部分の連結部分の外接図形を抽出し、隣
接する外接図形が、横書き文書ならば上下方向に、縦書
き文書ならば左右方向に重なっている場合に統合を行っ
て基本矩形を作成し、その基本矩形が単独で1文字とし
て決定できるか否かを判定し、決定できない場合、その
基本矩形の範囲を検出し、この範囲に対し、切り出し候
補として隣接する基本矩形の統合の組合せを求め、夫々
に優先順位を付け、全切り出し候補を認識し、切り出し
優先順位および認識類似度より最も確からしい認識文字
コードを出力するようにしたものである。
【0005】次に、特開平6−162269号公報に開
示された手書き文字認識装置は、任意の位置に任意の速
度で円滑に手書き文字を入力可能にすることを目的と
し、入力された手書き文字のストローク間の距離および
方向、始点の位置を検出し、座標データを文字単位で識
別し、文字単位の座標データによって該ストロークが表
現する文字を認識するようにしたものである。
示された手書き文字認識装置は、任意の位置に任意の速
度で円滑に手書き文字を入力可能にすることを目的と
し、入力された手書き文字のストローク間の距離および
方向、始点の位置を検出し、座標データを文字単位で識
別し、文字単位の座標データによって該ストロークが表
現する文字を認識するようにしたものである。
【0006】次に、特開平8−50632号公報に開示
された手書き文字切り出し方法および装置は、入力枠を
設けずに文字の切り出しを可能にすることを目的とし、
入力された手書き文字列の高さHを求め、この文字列高
さHに基づいて幅Lを決定し、基点Oから水平方向に幅
Lの範囲を予備探索範囲とし、その予備探索範囲内にお
いてストロークの数Sと最大高さhと形状特徴量x(空
白長の最大のもの)を求め、変数S,h,xに応じて探
索範囲を決定し、その探索範囲内でヒストグラムが最小
値をとる区間を探索し、その区間のうち最長のものが後
続の文字との間の切れ目であるとして1文字の切り出し
を行うようにしたものである。
された手書き文字切り出し方法および装置は、入力枠を
設けずに文字の切り出しを可能にすることを目的とし、
入力された手書き文字列の高さHを求め、この文字列高
さHに基づいて幅Lを決定し、基点Oから水平方向に幅
Lの範囲を予備探索範囲とし、その予備探索範囲内にお
いてストロークの数Sと最大高さhと形状特徴量x(空
白長の最大のもの)を求め、変数S,h,xに応じて探
索範囲を決定し、その探索範囲内でヒストグラムが最小
値をとる区間を探索し、その区間のうち最長のものが後
続の文字との間の切れ目であるとして1文字の切り出し
を行うようにしたものである。
【0007】
【発明が解決しようとする課題】しかしながら、上記の
公報に記載された手書き文字認識方法にあっては、いず
れも、筆記方向が横書きまたは縦書きとして予め指定さ
れるか、固定されていることを前提とし、さらに改行位
置も指定されることを前提としているため、筆記方向や
改行位置が指定されない手書き文字文書、例えば電子黒
板に筆記された複数行の手書き文書をオンラインで取り
込み、これを一括して認識することができないという問
題がある。
公報に記載された手書き文字認識方法にあっては、いず
れも、筆記方向が横書きまたは縦書きとして予め指定さ
れるか、固定されていることを前提とし、さらに改行位
置も指定されることを前提としているため、筆記方向や
改行位置が指定されない手書き文字文書、例えば電子黒
板に筆記された複数行の手書き文書をオンラインで取り
込み、これを一括して認識することができないという問
題がある。
【0008】また、特開昭61−29982号公報に開
示されたオンライン手書き文字列認識方式にあっては、
入力されたストローク列を基本セグメント列に区分する
手法として、横書きの手書き入力文字パターンに対し
て、各ストロークの横軸への投影の重なり具合と手書き
入力文字パターンの外接図形の高さの比と閾値とを比較
してストロークを分割し、分割された各ストロークの組
を基本セグメントとしているため、手書き文字が斜め方
向に傾いて筆記された場合、外接図形の高さが文字高さ
より異常に大きくなってしまい、その結果として、隣の
文字を構成するセグメント列を含んだ形で1つの組の基
本セグメント列として区分してしまう。この結果、斜め
方向に傾いて筆記された手書き入力文字を正しく認識す
ることができなくなるという問題がある。
示されたオンライン手書き文字列認識方式にあっては、
入力されたストローク列を基本セグメント列に区分する
手法として、横書きの手書き入力文字パターンに対し
て、各ストロークの横軸への投影の重なり具合と手書き
入力文字パターンの外接図形の高さの比と閾値とを比較
してストロークを分割し、分割された各ストロークの組
を基本セグメントとしているため、手書き文字が斜め方
向に傾いて筆記された場合、外接図形の高さが文字高さ
より異常に大きくなってしまい、その結果として、隣の
文字を構成するセグメント列を含んだ形で1つの組の基
本セグメント列として区分してしまう。この結果、斜め
方向に傾いて筆記された手書き入力文字を正しく認識す
ることができなくなるという問題がある。
【0009】また、特開平5−174185号公報に開
示された日本語文字認識装置にあっては、横書きの場合
は縦方向に、縦書きの場合は横方向に重なり合うストロ
ーク同士を結合し、1つの文字を構成し得る基本セグメ
ントとしているため、すなわち重なりが有るか無いかと
いう決定論的な手法によって基本セグメントに分割して
いるため、文字間隔が狭くて隣接する文字との外接図形
が重なっている場合には、複数の文字のストロークを1
つの文字の基本セグメントに統合してしまう危険性があ
り、文字間隔の狭い手書き入力文字を正しく認識できな
くなる恐れがある。
示された日本語文字認識装置にあっては、横書きの場合
は縦方向に、縦書きの場合は横方向に重なり合うストロ
ーク同士を結合し、1つの文字を構成し得る基本セグメ
ントとしているため、すなわち重なりが有るか無いかと
いう決定論的な手法によって基本セグメントに分割して
いるため、文字間隔が狭くて隣接する文字との外接図形
が重なっている場合には、複数の文字のストロークを1
つの文字の基本セグメントに統合してしまう危険性があ
り、文字間隔の狭い手書き入力文字を正しく認識できな
くなる恐れがある。
【0010】また、特開平6−162269号公報に開
示された手書き文字認識装置にあっては、複数の手書き
文字を1文字づつ切り出す際に、第1ストロークの始点
に注目し、直前の文字の最後のストロークの始点位置が
予め定めた閾値よりも下部に有り、かつ当該文字の第1
ストロークの始点位置が前記閾値より上部に有ることを
検出したならば、この部分を1文字の境界候補とした
後、直前の文字の第1ストロークと注目文字の第1スト
ロークの始点間距離および方向を調べ、その始点間距離
が閾値より大きく、かつ文字入力方向と同一であれば、
1文字の切り出し候補に決定し、その切り出し候補の外
接ボックスを作成し、直前に作成した外接ボックスとの
重なり関係を調べ、重なる場合は2つの外接ボックスを
同一文字のストローク群として統合し、重ならない場合
は1つ前の切り出し候補のストローク群を1文字分とし
て切り出すようにしているため、第1ストロークの始点
位置が直前の文字の最後のストロークの始点位置よりも
常に下部になる縦書き形式の手書き文字認識には適用で
きないという問題がある。また、横書き形式であって
も、同様の理由により、1行全体の文字が右下がり方向
に傾いた斜め書き形式の手書き文字の場合に、注目文字
の第1ストロークの始点位置が直前の文字の最後のスト
ロークの始点位置より下部になっていれば、当該第1ス
トロークは直前の文字を構成するストロークとして区分
されてしまい、切り出しが正しく行われなくなるという
問題がある。
示された手書き文字認識装置にあっては、複数の手書き
文字を1文字づつ切り出す際に、第1ストロークの始点
に注目し、直前の文字の最後のストロークの始点位置が
予め定めた閾値よりも下部に有り、かつ当該文字の第1
ストロークの始点位置が前記閾値より上部に有ることを
検出したならば、この部分を1文字の境界候補とした
後、直前の文字の第1ストロークと注目文字の第1スト
ロークの始点間距離および方向を調べ、その始点間距離
が閾値より大きく、かつ文字入力方向と同一であれば、
1文字の切り出し候補に決定し、その切り出し候補の外
接ボックスを作成し、直前に作成した外接ボックスとの
重なり関係を調べ、重なる場合は2つの外接ボックスを
同一文字のストローク群として統合し、重ならない場合
は1つ前の切り出し候補のストローク群を1文字分とし
て切り出すようにしているため、第1ストロークの始点
位置が直前の文字の最後のストロークの始点位置よりも
常に下部になる縦書き形式の手書き文字認識には適用で
きないという問題がある。また、横書き形式であって
も、同様の理由により、1行全体の文字が右下がり方向
に傾いた斜め書き形式の手書き文字の場合に、注目文字
の第1ストロークの始点位置が直前の文字の最後のスト
ロークの始点位置より下部になっていれば、当該第1ス
トロークは直前の文字を構成するストロークとして区分
されてしまい、切り出しが正しく行われなくなるという
問題がある。
【0011】また、特開平8−50632号公報に開示
された手書き文字切り出し方法にあっては、入力された
手書き文字列の高さHを求め、この文字列高さHに基づ
いて幅Lを決定し、基点Oから水平方向に幅Lの範囲を
予備探索範囲とし、その予備探索範囲内においてストロ
ークの数Sと最大高さhと形状特徴量x(空白長の最大
のもの)を求め、変数S,h,xに応じて探索範囲を決
定し、その探索範囲内でヒストグラムが最小値をとる区
間を探索し、その区間のうち最長のものが後続の文字と
の間の切れ目であるとして1文字の切り出しを行うよう
にしているため、例えば3桁の数字「111」を縦長に
筆記した場合、これらの数字が1つの文字を構成するス
トローク列として切り出され、漢字の「川」という文字
に誤認識されてしまう恐れがある。また、複数行の手書
き文字については改行位置で行の区分を行うようにして
いるが、改行位置をどのようにして検出するかについて
は考慮されていない。このため、複数行に渡って筆記さ
れた手書き文字をそれぞれの行別に一括して認識するこ
とができないという問題がある。
された手書き文字切り出し方法にあっては、入力された
手書き文字列の高さHを求め、この文字列高さHに基づ
いて幅Lを決定し、基点Oから水平方向に幅Lの範囲を
予備探索範囲とし、その予備探索範囲内においてストロ
ークの数Sと最大高さhと形状特徴量x(空白長の最大
のもの)を求め、変数S,h,xに応じて探索範囲を決
定し、その探索範囲内でヒストグラムが最小値をとる区
間を探索し、その区間のうち最長のものが後続の文字と
の間の切れ目であるとして1文字の切り出しを行うよう
にしているため、例えば3桁の数字「111」を縦長に
筆記した場合、これらの数字が1つの文字を構成するス
トローク列として切り出され、漢字の「川」という文字
に誤認識されてしまう恐れがある。また、複数行の手書
き文字については改行位置で行の区分を行うようにして
いるが、改行位置をどのようにして検出するかについて
は考慮されていない。このため、複数行に渡って筆記さ
れた手書き文字をそれぞれの行別に一括して認識するこ
とができないという問題がある。
【0012】本発明の第1の目的は、電子黒板等に筆記
方向が指定されずに筆記された手書き文字をオンライン
で取り込み、その手書き文字の筆記方向を正確に判定
し、その判定結果に従って手書き文字を一括して認識す
ることができる手書き文字認識方法を提供することにあ
る。
方向が指定されずに筆記された手書き文字をオンライン
で取り込み、その手書き文字の筆記方向を正確に判定
し、その判定結果に従って手書き文字を一括して認識す
ることができる手書き文字認識方法を提供することにあ
る。
【0013】本発明の第2の目的は、電子黒板等に改行
位置が指定されずに筆記された手書き文字をオンライン
で取り込み、その手書き文字の改行位置を正確に判定
し、その判定結果に従って複数行に渡る手書き文字を一
括して認識することができる手書き文字認識方法を提供
することにある。
位置が指定されずに筆記された手書き文字をオンライン
で取り込み、その手書き文字の改行位置を正確に判定
し、その判定結果に従って複数行に渡る手書き文字を一
括して認識することができる手書き文字認識方法を提供
することにある。
【0014】本発明の第3の目的は、斜め書きや文字間
隔が狭い手書き文字であっても、各文字の切り出しを正
確に行い、その切り出し結果に従って任意行の手書き文
字を一括して認識することができる手書き文字認識方法
を提供することにある。
隔が狭い手書き文字であっても、各文字の切り出しを正
確に行い、その切り出し結果に従って任意行の手書き文
字を一括して認識することができる手書き文字認識方法
を提供することにある。
【0015】本発明の第4の目的は、縦書き横書きの種
別、行数、筆記枠の有無に関係なく、電子黒板等に筆記
された手書き文字をオンラインで取り込み、その手書き
文字を一括して認識することができる手書き文字認識方
法を提供することにある。
別、行数、筆記枠の有無に関係なく、電子黒板等に筆記
された手書き文字をオンラインで取り込み、その手書き
文字を一括して認識することができる手書き文字認識方
法を提供することにある。
【0016】
【課題を解決するための手段】本願において開示される
発明のうち、代表的なものの概要を簡単に説明すれば、
下記の通りである。 即ち、本発明は、手書き文字入力装
置からストローク順に入力された複数ストローク群から
成る複数の手書き文字列を認識する手書き文字認識方法
であって、前記複数ストローク群を対象として、そのス
トローク群の中のストローク入力時刻において隣合うス
トロークの終点から始点へのベクトルを求め、そのベク
トルの右方向成分および下方向成分を同一方向成分同士
で加算し、その加算した右方向成分と下方向成分の比
と、横書き判定用閾値および縦書き判定用閾値とを比較
し、前記加算した右方向成分と下方向成分の比が、前記
横書き判定用閾値以上ならば筆記方向が横書き、前記縦
書き判定用閾値未満ならば筆記方向が縦書きと判定し、
また、前記加算した右方向成分と下方向成分の比が、横
書き判定用閾値未満で縦書き判定用閾値以上ならば、入
力された手書き文字列全体の外接矩形の高さと幅の比に
よって、筆記方向が横書きか、縦書きかを判定し、この
筆記方向の判定結果に従って前記複数ストローク群から
成る手書き文字列を認識することを特徴とする。
発明のうち、代表的なものの概要を簡単に説明すれば、
下記の通りである。 即ち、本発明は、手書き文字入力装
置からストローク順に入力された複数ストローク群から
成る複数の手書き文字列を認識する手書き文字認識方法
であって、前記複数ストローク群を対象として、そのス
トローク群の中のストローク入力時刻において隣合うス
トロークの終点から始点へのベクトルを求め、そのベク
トルの右方向成分および下方向成分を同一方向成分同士
で加算し、その加算した右方向成分と下方向成分の比
と、横書き判定用閾値および縦書き判定用閾値とを比較
し、前記加算した右方向成分と下方向成分の比が、前記
横書き判定用閾値以上ならば筆記方向が横書き、前記縦
書き判定用閾値未満ならば筆記方向が縦書きと判定し、
また、前記加算した右方向成分と下方向成分の比が、横
書き判定用閾値未満で縦書き判定用閾値以上ならば、入
力された手書き文字列全体の外接矩形の高さと幅の比に
よって、筆記方向が横書きか、縦書きかを判定し、この
筆記方向の判定結果に従って前記複数ストローク群から
成る手書き文字列を認識することを特徴とする。
【0017】また、本発明は、手書き文字入力装置から
ストローク順に入力された複数ストローク群から成る複
数の手書き文字列を認識する手書き文字認識方法であっ
て、前記複数ストローク群を対象として、そのストロー
ク群の中のストローク入力時刻において隣合うストロー
クの終点から始点へのベクトルを求め、そのベクトルの
右方向成分および下方向成分を同一方向成分同士で加算
し、その加算した右方向成分と下方向成分の比と、横書
き/縦書き判定用の閾値とを比較し、前記加算した右方
向成分と下方向成分の比が、前記横書き/縦書き判定用
の閾値以上ならば筆記方向が横書き、前記横書き/縦書
き判定用の閾値未満ならば筆記方向が縦書きと判定する
と共に、前記複数ストローク群の筆記方向へのヒストグ
ラムを求め、そのヒストグラムにより筆記点が少ない部
分を改行位置候補に選定し、さらに前記ストローク群の
中のストローク入力時刻において隣合うストロークの終
点から始点へのベクトルおよびそのベクトルの長さの平
均を求め、前記改行位置候補内で前記ベクトルの長さの
平均が改行判定用の閾値を超える位置を改行位置として
判定し、この改行位置の判定結果および前記筆記方向の
判定結果に従って前記複数ストローク群から成る手書き
文字列を認識することを特徴とする。
ストローク順に入力された複数ストローク群から成る複
数の手書き文字列を認識する手書き文字認識方法であっ
て、前記複数ストローク群を対象として、そのストロー
ク群の中のストローク入力時刻において隣合うストロー
クの終点から始点へのベクトルを求め、そのベクトルの
右方向成分および下方向成分を同一方向成分同士で加算
し、その加算した右方向成分と下方向成分の比と、横書
き/縦書き判定用の閾値とを比較し、前記加算した右方
向成分と下方向成分の比が、前記横書き/縦書き判定用
の閾値以上ならば筆記方向が横書き、前記横書き/縦書
き判定用の閾値未満ならば筆記方向が縦書きと判定する
と共に、前記複数ストローク群の筆記方向へのヒストグ
ラムを求め、そのヒストグラムにより筆記点が少ない部
分を改行位置候補に選定し、さらに前記ストローク群の
中のストローク入力時刻において隣合うストロークの終
点から始点へのベクトルおよびそのベクトルの長さの平
均を求め、前記改行位置候補内で前記ベクトルの長さの
平均が改行判定用の閾値を超える位置を改行位置として
判定し、この改行位置の判定結果および前記筆記方向の
判定結果に従って前記複数ストローク群から成る手書き
文字列を認識することを特徴とする。
【0018】また、本発明は、手書き文字入力装置から
ストローク順に入力された複数ストローク群から成る複
数の手書き文字列を認識する手書き文字認識方法であっ
て、前記複数ストローク群を対象として、そのストロー
ク群の中のストローク入力時刻において隣合うストロー
クの終点から始点へのベクトルを求め、そのベクトルの
右方向成分および下方向成分を同一方向成分同士で加算
し、その加算した右方向成分と下方向成分の比と、横書
き/縦書き判定用の閾値とを比較し、前記加算した右方
向成分と下方向成分の比が、前記横書き/縦書き判定用
の閾値以上ならば筆記方向が横書き、前記横書き/縦書
き判定用の閾値未満ならば筆記方向が縦書きと判定する
と共に、前記複数ストローク群の筆記方向へのヒストグ
ラムを求め、そのヒストグラムにより筆記点が少ない部
分を改行位置候補に選定し、さらに前記ストローク群の
中のストローク入力時刻において隣合うストロークの終
点から始点へのベクトルおよびそのベクトルの長さの平
均を求め、前記改行位置候補内のベクトルの長さと前記
ベクトルの長さの平均を比較し、改行判定用の閾値を超
えるベクトルの位置を改行位置として判定し、さらに前
記複数ストローク群を構成する各ストローク間の距離を
予め定めた関係式に従って行単位に評価し、その評価し
た距離が仮結合用の閾値よりも小さいストローク同士を
結合する処理を結合可能な文字要素がなくなるまで繰り
返すことにより、複数ストローク群を複数の文字要素に
分割した後、各文字要素の外接矩形を求め、当該外接矩
形の高さの最大値または平均値と、当該外接矩形の幅の
最大値または平均値を手書き文字の標準文字サイズとし
て推定し、この推定の標準文字サイズの空間において隣
接する文字要素間の関係を表すパラメータを予め定めた
関係式に従って算出し、その算出したパラメータが仮結
合用の閾値よりも小さい文字要素同士を結合する処理を
結合可能な文字要素がなくなるまで繰り返すことによ
り、複数の文字要素を複数の文字要素集合に分割し、そ
の文字要素集合によって辞書を探索し、辞書に登録され
た手書き文字パターンに対する評価値が最大になる文字
を認識結果として出力することを特徴とする。
ストローク順に入力された複数ストローク群から成る複
数の手書き文字列を認識する手書き文字認識方法であっ
て、前記複数ストローク群を対象として、そのストロー
ク群の中のストローク入力時刻において隣合うストロー
クの終点から始点へのベクトルを求め、そのベクトルの
右方向成分および下方向成分を同一方向成分同士で加算
し、その加算した右方向成分と下方向成分の比と、横書
き/縦書き判定用の閾値とを比較し、前記加算した右方
向成分と下方向成分の比が、前記横書き/縦書き判定用
の閾値以上ならば筆記方向が横書き、前記横書き/縦書
き判定用の閾値未満ならば筆記方向が縦書きと判定する
と共に、前記複数ストローク群の筆記方向へのヒストグ
ラムを求め、そのヒストグラムにより筆記点が少ない部
分を改行位置候補に選定し、さらに前記ストローク群の
中のストローク入力時刻において隣合うストロークの終
点から始点へのベクトルおよびそのベクトルの長さの平
均を求め、前記改行位置候補内のベクトルの長さと前記
ベクトルの長さの平均を比較し、改行判定用の閾値を超
えるベクトルの位置を改行位置として判定し、さらに前
記複数ストローク群を構成する各ストローク間の距離を
予め定めた関係式に従って行単位に評価し、その評価し
た距離が仮結合用の閾値よりも小さいストローク同士を
結合する処理を結合可能な文字要素がなくなるまで繰り
返すことにより、複数ストローク群を複数の文字要素に
分割した後、各文字要素の外接矩形を求め、当該外接矩
形の高さの最大値または平均値と、当該外接矩形の幅の
最大値または平均値を手書き文字の標準文字サイズとし
て推定し、この推定の標準文字サイズの空間において隣
接する文字要素間の関係を表すパラメータを予め定めた
関係式に従って算出し、その算出したパラメータが仮結
合用の閾値よりも小さい文字要素同士を結合する処理を
結合可能な文字要素がなくなるまで繰り返すことによ
り、複数の文字要素を複数の文字要素集合に分割し、そ
の文字要素集合によって辞書を探索し、辞書に登録され
た手書き文字パターンに対する評価値が最大になる文字
を認識結果として出力することを特徴とする。
【0019】
【0020】
【発明の実施の形態】以下、本発明の実施形態について
図面により詳細に説明する。
図面により詳細に説明する。
【0021】図1は、本発明を適用した手書き文字認識
装置の実施の形態を示すブロック構成図であり、タブレ
ットあるいは電子黒板等で構成され、ペン1で入力面に
筆記された手書き文字の筆点座標をストローク順に出力
する手書き文字入力装置2と、手書き文字の認識結果を
表示する表示装置3と、手書き文字入力装置2から入力
された手書き文字の複数ストローク群を文字要素候補別
に結合/分割し、辞書との照合によって認識する中央処
理装置(CPU)4と、認識処理に必要な各種のパラメ
ータやコマンドを入力するキーボード5、手書き文字認
識プログラム61や辞書62等を記憶した記憶装置6と
で構成されている。
装置の実施の形態を示すブロック構成図であり、タブレ
ットあるいは電子黒板等で構成され、ペン1で入力面に
筆記された手書き文字の筆点座標をストローク順に出力
する手書き文字入力装置2と、手書き文字の認識結果を
表示する表示装置3と、手書き文字入力装置2から入力
された手書き文字の複数ストローク群を文字要素候補別
に結合/分割し、辞書との照合によって認識する中央処
理装置(CPU)4と、認識処理に必要な各種のパラメ
ータやコマンドを入力するキーボード5、手書き文字認
識プログラム61や辞書62等を記憶した記憶装置6と
で構成されている。
【0022】ここで、手書き文字入力装置2は、電子黒
板やタブレットに限定されるものではなく、手書き文字
の筆点座標をストローク順に出力する構成のものであれ
ば全て使用することができる。また、透明タブレットの
下面に表示画面を実装した構造の入力装置を使用するこ
ともできる。
板やタブレットに限定されるものではなく、手書き文字
の筆点座標をストローク順に出力する構成のものであれ
ば全て使用することができる。また、透明タブレットの
下面に表示画面を実装した構造の入力装置を使用するこ
ともできる。
【0023】本実施形態の手書き文字認識装置にあって
は、図2に示すように、手書き文字入力装置2の入力面
21上には手書き文字の入力枠は設けられておらず、入
力面21上でペン1によって図示のような任意の手書き
文字「枠無し手書き文字の認識について」を任意の位置
に複数行に渡って入力した後、「認識」のコマンドボタ
ン22を選択操作すると、入力面21上に筆記された手
書き文字が一括して認識され、その認識結果が表示装置
3の表示画面に文字表示される。この場合、認識結果に
誤りがあったならば、「再認識」のコマンドボタン23
を選択操作することにより、筆記方向を認識する処理か
ら始まる一連の処理が再度実行され、再認識結果が表示
される。また、誤った手書き文字を筆記した場合、「取
消し」のコマンドボタン24を選択操作することによ
り、1文字単位で取り消すことができる。
は、図2に示すように、手書き文字入力装置2の入力面
21上には手書き文字の入力枠は設けられておらず、入
力面21上でペン1によって図示のような任意の手書き
文字「枠無し手書き文字の認識について」を任意の位置
に複数行に渡って入力した後、「認識」のコマンドボタ
ン22を選択操作すると、入力面21上に筆記された手
書き文字が一括して認識され、その認識結果が表示装置
3の表示画面に文字表示される。この場合、認識結果に
誤りがあったならば、「再認識」のコマンドボタン23
を選択操作することにより、筆記方向を認識する処理か
ら始まる一連の処理が再度実行され、再認識結果が表示
される。また、誤った手書き文字を筆記した場合、「取
消し」のコマンドボタン24を選択操作することによ
り、1文字単位で取り消すことができる。
【0024】ここで、本明細書中で使用する用語の定義
について説明しておく。
について説明しておく。
【0025】(1)ストローク ストロークとは、ペン1が入力装置2の入力面21に接
触してから離れるまでに書かれる1本の手書き線を意味
し、日本語でいうところの「一画」に対応する。1つの
手書き文字は、句読点などを除き複数のストロークで構
成される。
触してから離れるまでに書かれる1本の手書き線を意味
し、日本語でいうところの「一画」に対応する。1つの
手書き文字は、句読点などを除き複数のストロークで構
成される。
【0026】(2)筆点 筆点とは、それぞれのストロークを構成する最小単位の
点を意味し、入力面21におけるペン1の押圧座標値、
あるいはその押圧座標値から導き出される論理的な座標
値で表現され、ストロークの始点や終点といった属性を
備える。
点を意味し、入力面21におけるペン1の押圧座標値、
あるいはその押圧座標値から導き出される論理的な座標
値で表現され、ストロークの始点や終点といった属性を
備える。
【0027】(3)文字要素 文字要素とは、1文字に含まれることが明らかなストロ
ークの集合のことを指し、任意のストロークの集合に対
して交点を持つストローク同士の結合、距離の近いスト
ローク同士の結合等の処理を経ることによって得られ
る。図3にストローク、文字要素の区別を例示してい
る。
ークの集合のことを指し、任意のストロークの集合に対
して交点を持つストローク同士の結合、距離の近いスト
ローク同士の結合等の処理を経ることによって得られ
る。図3にストローク、文字要素の区別を例示してい
る。
【0028】(4)手書きパターン 手書きパターンとは、図3に例示するように、入力装置
2の入力面に筆記された認識対象の手書き文字を構成す
るストローク群の全体を指し、何処までを認識対象とす
るかは、ユーザが区切りであることをボタンやメニュー
等で明示的に指示する方法、あるいはペン1が入力面2
1から離れて一定時間以上接触操作が行われなかった時
点を区切りとして指示する方法がある。
2の入力面に筆記された認識対象の手書き文字を構成す
るストローク群の全体を指し、何処までを認識対象とす
るかは、ユーザが区切りであることをボタンやメニュー
等で明示的に指示する方法、あるいはペン1が入力面2
1から離れて一定時間以上接触操作が行われなかった時
点を区切りとして指示する方法がある。
【0029】(5)裏ストローク 裏ストロークとは、あるストロークの終点から次のスト
ロークの始点へのベクトルを指す。本発明では、文字内
裏ストローク、文字間裏ストローク、改行裏ストローク
に細分される。
ロークの始点へのベクトルを指す。本発明では、文字内
裏ストローク、文字間裏ストローク、改行裏ストローク
に細分される。
【0030】(6)文字内裏ストローク 文字内裏ストロークとは、1文字内に含まれる連続した
2ストローク間で発生する裏ストローク。
2ストローク間で発生する裏ストローク。
【0031】(7)文字間裏ストローク 文字間裏ストロークとは、ある文字の最後のストローク
の終点と次の文字の始点との間で発生する裏ストロー
ク。
の終点と次の文字の始点との間で発生する裏ストロー
ク。
【0032】(8)改行裏ストローク 改行裏ストロークとは、ある行の最後の文字の最後のス
トロークの終点と次の行の先頭の文字の最初のストロー
クの始点との間で発生する裏ストローク。
トロークの終点と次の行の先頭の文字の最初のストロー
クの始点との間で発生する裏ストローク。
【0033】図4は、本実施形態の手書き文字入力装置
の機能構成図であり、入力装置2の入力面21で手書き
文字が筆記されると、その手書き文字の各ストロークを
構成する複数の筆点の座標データ列が入力装置2からス
トローク順に出力される。この各ストロークの筆点座標
データ列は、記憶装置6に順次格納される。
の機能構成図であり、入力装置2の入力面21で手書き
文字が筆記されると、その手書き文字の各ストロークを
構成する複数の筆点の座標データ列が入力装置2からス
トローク順に出力される。この各ストロークの筆点座標
データ列は、記憶装置6に順次格納される。
【0034】任意の手書き文字の入力が終了し、ユーザ
が「認識」のコマンドボタン22を選択操作すると、手
書き文字認識プログラム61が起動され、記憶装置6に
格納された手書き文字の筆点座標データ列を読出し、筆
記方向の判別処理、改行位置の判別処理、文字サイズの
判別処理、ストローク群の分割/結合処理、文字要素の
分割/結合処理、辞書62を用いた認識処理を行う。
が「認識」のコマンドボタン22を選択操作すると、手
書き文字認識プログラム61が起動され、記憶装置6に
格納された手書き文字の筆点座標データ列を読出し、筆
記方向の判別処理、改行位置の判別処理、文字サイズの
判別処理、ストローク群の分割/結合処理、文字要素の
分割/結合処理、辞書62を用いた認識処理を行う。
【0035】手書き文字認識プログラム61は、筆記方
向取得部611、改行位置取得部612、標準文字サイ
ズ取得部613、枠無し手書き文字列認識部614とか
ら構成される。このうち、枠無し手書き文字列認識部6
14は、図5に示すように、仮結合処理部615、仮分
割処理部616、評価・探索処理部617とから構成さ
れる。以下、この手書き文字認識プログラム61を構成
する各部の構成および処理内容について詳細に説明す
る。
向取得部611、改行位置取得部612、標準文字サイ
ズ取得部613、枠無し手書き文字列認識部614とか
ら構成される。このうち、枠無し手書き文字列認識部6
14は、図5に示すように、仮結合処理部615、仮分
割処理部616、評価・探索処理部617とから構成さ
れる。以下、この手書き文字認識プログラム61を構成
する各部の構成および処理内容について詳細に説明す
る。
【0036】(1)記憶装置6に格納される筆点座標デ
ータ列の構成 入力装置2から出力される手書き文字の各ストローク筆
点座標データ列は、図6に示すように、基本的にはスト
ローク番号631と各筆点のx,y座標値632とから
構成され、認識処理の過程で各ストロークが何文字目の
ストロークに属するかなどのストローク間関係属性63
3、改行位置に相当するストロークであることを示す改
行位置フラグ634などが付加されるようになってい
る。
ータ列の構成 入力装置2から出力される手書き文字の各ストローク筆
点座標データ列は、図6に示すように、基本的にはスト
ローク番号631と各筆点のx,y座標値632とから
構成され、認識処理の過程で各ストロークが何文字目の
ストロークに属するかなどのストローク間関係属性63
3、改行位置に相当するストロークであることを示す改
行位置フラグ634などが付加されるようになってい
る。
【0037】(2)筆記方向取得部611 筆記方向取得部611は、図7および図8で示される手
順に従って手書きパターンが縦書きか、横書きかを判定
する。図7は、裏ストローク及び縦書き横書き判別ベク
トルの説明図である。裏ストロークとは、前述したよう
に、あるストロークの終点から次のストロークの始点へ
のベクトルである。直感的には、手書きパターンの入力
中のタブレットから離れた状態でのペン1の移動が裏ス
トロークである。裏ストロークはさらに文字内裏ストロ
ークと文字間裏ストロークに分類できる。文字内裏スト
ロークとは、1文字に含まれるストローク間に生じる裏
ストロークである。文字間裏ストロークとは、ある文字
の最後のストロークの終点から次の文字の最初のストロ
ークの始点への裏ストロークである。
順に従って手書きパターンが縦書きか、横書きかを判定
する。図7は、裏ストローク及び縦書き横書き判別ベク
トルの説明図である。裏ストロークとは、前述したよう
に、あるストロークの終点から次のストロークの始点へ
のベクトルである。直感的には、手書きパターンの入力
中のタブレットから離れた状態でのペン1の移動が裏ス
トロークである。裏ストロークはさらに文字内裏ストロ
ークと文字間裏ストロークに分類できる。文字内裏スト
ロークとは、1文字に含まれるストローク間に生じる裏
ストロークである。文字間裏ストロークとは、ある文字
の最後のストロークの終点から次の文字の最初のストロ
ークの始点への裏ストロークである。
【0038】図7の手書きパターンでは、BS1,BS
2,BS4,BS6が文字内裏ストローク、BS3,BS
5が文字間裏ストロークである。
2,BS4,BS6が文字内裏ストローク、BS3,BS
5が文字間裏ストロークである。
【0039】筆記方向取得部611は、認識対象の手書
きパターンの全てのストローク群を対象として、各裏ス
トロークに含まれる右方向の成分R3,R4,R5と下
方向の成分D6のみを加算し、縦書き横書き判別ベクト
ルを求める。図7ではVtotalが縦書き横書き判別ベク
トルである。
きパターンの全てのストローク群を対象として、各裏ス
トロークに含まれる右方向の成分R3,R4,R5と下
方向の成分D6のみを加算し、縦書き横書き判別ベクト
ルを求める。図7ではVtotalが縦書き横書き判別ベク
トルである。
【0040】日本語の場合、横書きの文字列では文字間
裏ストロークは右方向の成分を多く含み、縦書きの文字
列では文字間裏ストロークは下方向の成分を多く含む。
この性質を利用し、筆記方向取得部611は図8のよう
な手順で縦書き横書きの判定を行なっている。
裏ストロークは右方向の成分を多く含み、縦書きの文字
列では文字間裏ストロークは下方向の成分を多く含む。
この性質を利用し、筆記方向取得部611は図8のよう
な手順で縦書き横書きの判定を行なっている。
【0041】まず、図7で示した縦書き横書き判別ベク
トルを求める(ステップ801)。次に、縦書き横書き
判別ベクトルの右方向の成分を下方向の成分で割った値
A(下方向成分に対する右方向成分の比)と、横書き判
定用の閾値Th及び縦書き判定用の閾値Tvとを比較
し、前記の値AがTh以上であれば横書き、Tv以下で
あれば縦書きとして判定する(ステップ802)。上記
処理で判定できなかった場合は、筆記された文字数が少
ないと判断し、筆記された手書きパターン全体の外接矩
形の縦横比(高さに対する幅の比)が「1」以上か否か
を調べ、「1」以上ならば横書き、「1」未満ならば縦
書きとして判定する(ステップ803)。
トルを求める(ステップ801)。次に、縦書き横書き
判別ベクトルの右方向の成分を下方向の成分で割った値
A(下方向成分に対する右方向成分の比)と、横書き判
定用の閾値Th及び縦書き判定用の閾値Tvとを比較
し、前記の値AがTh以上であれば横書き、Tv以下で
あれば縦書きとして判定する(ステップ802)。上記
処理で判定できなかった場合は、筆記された文字数が少
ないと判断し、筆記された手書きパターン全体の外接矩
形の縦横比(高さに対する幅の比)が「1」以上か否か
を調べ、「1」以上ならば横書き、「1」未満ならば縦
書きとして判定する(ステップ803)。
【0042】従って、図7に示したように、判別ベクト
ルの下方向成分に対する右方向成分の比が横書き判定用
の閾値Thを超えるものについては、正確に「横書き」
として判定される。このようにして横書きか、縦書きか
を判定することにより、ユーザは予め筆記方向を指定す
る必要がなくなり、手書き文字を筆記する際の煩わしさ
から解放される。
ルの下方向成分に対する右方向成分の比が横書き判定用
の閾値Thを超えるものについては、正確に「横書き」
として判定される。このようにして横書きか、縦書きか
を判定することにより、ユーザは予め筆記方向を指定す
る必要がなくなり、手書き文字を筆記する際の煩わしさ
から解放される。
【0043】(3)改行位置取得部612 改行位置取得部612は、入力装置2から入力された手
書き文字の複数ストローク群を対象とし、その筆記方向
へのヒストグラムを求め、そのヒストグラムにより筆記
点が少ない部分を改行位置候補に選定し、さらに前記ス
トローク群の中のストローク入力時刻において隣合うス
トロークの終点から始点へのベクトルおよびそのベクト
ルの長さの平均を求め、前記改行位置候補内のベクトル
の長さと前記ベクトルの長さの平均を比較し、改行判定
用の閾値を超えるベクトルの位置を改行位置として判定
する。
書き文字の複数ストローク群を対象とし、その筆記方向
へのヒストグラムを求め、そのヒストグラムにより筆記
点が少ない部分を改行位置候補に選定し、さらに前記ス
トローク群の中のストローク入力時刻において隣合うス
トロークの終点から始点へのベクトルおよびそのベクト
ルの長さの平均を求め、前記改行位置候補内のベクトル
の長さと前記ベクトルの長さの平均を比較し、改行判定
用の閾値を超えるベクトルの位置を改行位置として判定
する。
【0044】すなわち、改行位置取得部612は、図1
1のフローチャートに示すように、筆記方向取得部部6
11が判定した筆記方向の判定結果に基づき、ストロー
ク群の筆記方向へのヒストグラムを求める(ステップ1
101)。横書きの場合、図9に示すように、ヒストグ
ラム901の「谷」に相当する位置が改行位置であると
推定される。そこで、ヒストグラム901で筆点分布度
数が小さい部分(谷の部分)をまたぐ裏ストロークを改
行位置候補に選定する(ステップ1102)。
1のフローチャートに示すように、筆記方向取得部部6
11が判定した筆記方向の判定結果に基づき、ストロー
ク群の筆記方向へのヒストグラムを求める(ステップ1
101)。横書きの場合、図9に示すように、ヒストグ
ラム901の「谷」に相当する位置が改行位置であると
推定される。そこで、ヒストグラム901で筆点分布度
数が小さい部分(谷の部分)をまたぐ裏ストロークを改
行位置候補に選定する(ステップ1102)。
【0045】改行裏ストロークとは、文字間裏ストロー
クの一種であり、図10に示すように、ある行の末尾の
文字の最後のストロークの終点から次の行の先頭の文字
の最初のストロークの始点への裏ストロークという意味
である。日本語の場合、横書きの文章中の改行裏ストロ
ークは左下方向、縦書きの文章中の裏ストロークは左上
方向である。
クの一種であり、図10に示すように、ある行の末尾の
文字の最後のストロークの終点から次の行の先頭の文字
の最初のストロークの始点への裏ストロークという意味
である。日本語の場合、横書きの文章中の改行裏ストロ
ークは左下方向、縦書きの文章中の裏ストロークは左上
方向である。
【0046】そこで、縦書きの場合は、ヒストグラム9
01で筆点分布度数が小さい部分(谷の部分)をまたぐ
左上方向の裏ストロークを、横書きの場合は左下方向の
裏ストロークを改行裏ストローク候補として選択する。
次に、横書きの場合、上記処理で選択した裏ストローク
の左方向水平成分Wcrが改行判定用の閾値を超えるも
のを改行裏ストロークと判定し、縦書きの場合は、上記
処理で選択した裏ストロークの上方向鉛直成分Hcrが
改行判定用の閾値を超えるものを改行裏ストロークと判
定する(ステップ1103)。
01で筆点分布度数が小さい部分(谷の部分)をまたぐ
左上方向の裏ストロークを、横書きの場合は左下方向の
裏ストロークを改行裏ストローク候補として選択する。
次に、横書きの場合、上記処理で選択した裏ストローク
の左方向水平成分Wcrが改行判定用の閾値を超えるも
のを改行裏ストロークと判定し、縦書きの場合は、上記
処理で選択した裏ストロークの上方向鉛直成分Hcrが
改行判定用の閾値を超えるものを改行裏ストロークと判
定する(ステップ1103)。
【0047】この場合、改行裏ストロークの水平成分W
crおよび鉛直成分Hcrの大きさは、1行の文字数に
よって異なる。そこで、手書き文字の1文字の標準サイ
ズが図10に示すように既知であるか、推定できる場
合、その標準文字サイズの幅Wsで水平成分Wcrを割
った値が閾値を超えるものを横書きの場合の改行裏スト
ロークとして選定し、また標準文字サイズの高さHsで
鉛直成分Hcrを割った値が閾値を超えるものを縦書き
の場合の改行裏ストロークとして選定することにより、
判定精度がさらに向上する。
crおよび鉛直成分Hcrの大きさは、1行の文字数に
よって異なる。そこで、手書き文字の1文字の標準サイ
ズが図10に示すように既知であるか、推定できる場
合、その標準文字サイズの幅Wsで水平成分Wcrを割
った値が閾値を超えるものを横書きの場合の改行裏スト
ロークとして選定し、また標準文字サイズの高さHsで
鉛直成分Hcrを割った値が閾値を超えるものを縦書き
の場合の改行裏ストロークとして選定することにより、
判定精度がさらに向上する。
【0048】ところで、手書き文字が斜め方向に傾いて
筆記された場合、水平成分Wcrおよび鉛直成分Hcr
が算定できなくなる恐れがあるが、斜め書きの場合は、
手書き文字パターンを正規直交座標系に変換する補正処
理を施すことによって水平成分Wcrおよび鉛直成分H
crを正常に算定することが可能である。この場合、斜
め書きであるか否かは、例えば、各手書き文字の外接矩
形の中心を結ぶ線を求め、その線の傾斜によって判定す
ることができる。
筆記された場合、水平成分Wcrおよび鉛直成分Hcr
が算定できなくなる恐れがあるが、斜め書きの場合は、
手書き文字パターンを正規直交座標系に変換する補正処
理を施すことによって水平成分Wcrおよび鉛直成分H
crを正常に算定することが可能である。この場合、斜
め書きであるか否かは、例えば、各手書き文字の外接矩
形の中心を結ぶ線を求め、その線の傾斜によって判定す
ることができる。
【0049】このようにして改行位置を判定することに
より、ユーザは筆記途中で改行位置を指定する必要がな
くなり、手書き文字を筆記する際の煩わしさから解放さ
れる。
より、ユーザは筆記途中で改行位置を指定する必要がな
くなり、手書き文字を筆記する際の煩わしさから解放さ
れる。
【0050】(4)標準文字サイズ取得部613 標準文字サイズ取得部613は、入力装置2から入力さ
れた手書き文字の複数ストローク群を構成する各ストロ
ーク間の距離を、予め定めた関係式に従って評価し、そ
の評価した距離が仮結合用の閾値よりも小さいストロー
ク同士を結合する仮結合処理を結合可能なストロークが
なくなるまで繰り返すことにより、複数ストローク群を
複数の文字要素に分割した後、各文字要素の外接矩形を
求め、その外接矩形の高さの最大値または平均値と幅の
最大値または平均値を手書き文字の標準文字サイズとし
て推定する。
れた手書き文字の複数ストローク群を構成する各ストロ
ーク間の距離を、予め定めた関係式に従って評価し、そ
の評価した距離が仮結合用の閾値よりも小さいストロー
ク同士を結合する仮結合処理を結合可能なストロークが
なくなるまで繰り返すことにより、複数ストローク群を
複数の文字要素に分割した後、各文字要素の外接矩形を
求め、その外接矩形の高さの最大値または平均値と幅の
最大値または平均値を手書き文字の標準文字サイズとし
て推定する。
【0051】仮結合処理におけるストローク間の距離
は、図12および図13に示すような各パラメータに係
数を乗じて加算した値で評価する。ここで、Lは図12
(a)に示すように1つのストロークの標準サイズ(1
辺の長さ)、Sは1つのストロークの標準の面積であ
る。1つのストロークの標準サイズLおよび標準面積S
は、図12(b)に破線で示すような各ストロークの外
接矩形を求め、その外接矩形の高さおよび幅のうち、長
い方の値のみを選択し、さらに全てのストロークの高さ
および幅のうち最大のものを選択し、これから1つのス
トロークの標準サイズLおよび標準面積S推定する。
は、図12および図13に示すような各パラメータに係
数を乗じて加算した値で評価する。ここで、Lは図12
(a)に示すように1つのストロークの標準サイズ(1
辺の長さ)、Sは1つのストロークの標準の面積であ
る。1つのストロークの標準サイズLおよび標準面積S
は、図12(b)に破線で示すような各ストロークの外
接矩形を求め、その外接矩形の高さおよび幅のうち、長
い方の値のみを選択し、さらに全てのストロークの高さ
および幅のうち最大のものを選択し、これから1つのス
トロークの標準サイズLおよび標準面積S推定する。
【0052】なお、後述する文字要素間の結合処理にお
いては、Lは1つの文字要素の標準サイズ、Sは1つの
文字要素の標準面積となる。
いては、Lは1つの文字要素の標準サイズ、Sは1つの
文字要素の標準面積となる。
【0053】(a)評価パラメータ=d/L 図12(b)に示すように、隣合うストロークの外接図
形(破線で図示)の筆記方向の変位dの1文字の標準サ
イズLに対する割合い、 (b)評価パラメータ=c/S 図12(c)に示すように、隣合うストロークの外接図
形(破線で図示)の重なり部分の面積cの1文字の標準
面積Sに対する割合い、 (c)評価パラメータ=d/L 図12(d)に示すように、隣合うストロークの重心座
標のユークリッド距離dの1文字の標準サイズLに対す
る割合い、 (d)評価パラメータ=d/L 図13(a)に示すように、隣合うストロークの重心座
標の筆記方向の変位dの1文字の標準サイズLに対する
割合い、 (e)評価パラメータ=d/L 図13(b)に示すように、先のストロークの末尾の筆
点と後のストロークの先頭の筆点のユークリッド距離d
の1文字の標準サイズLに対する割合い、 (f)評価パラメータ=d/L 図13(c)に示すように、先のストロークの末尾の筆
点と後のストロークの先頭の筆点の筆記方向の変位dの
1文字の標準サイズLに対する割合い。
形(破線で図示)の筆記方向の変位dの1文字の標準サ
イズLに対する割合い、 (b)評価パラメータ=c/S 図12(c)に示すように、隣合うストロークの外接図
形(破線で図示)の重なり部分の面積cの1文字の標準
面積Sに対する割合い、 (c)評価パラメータ=d/L 図12(d)に示すように、隣合うストロークの重心座
標のユークリッド距離dの1文字の標準サイズLに対す
る割合い、 (d)評価パラメータ=d/L 図13(a)に示すように、隣合うストロークの重心座
標の筆記方向の変位dの1文字の標準サイズLに対する
割合い、 (e)評価パラメータ=d/L 図13(b)に示すように、先のストロークの末尾の筆
点と後のストロークの先頭の筆点のユークリッド距離d
の1文字の標準サイズLに対する割合い、 (f)評価パラメータ=d/L 図13(c)に示すように、先のストロークの末尾の筆
点と後のストロークの先頭の筆点の筆記方向の変位dの
1文字の標準サイズLに対する割合い。
【0054】これらの評価パラメータの中から少なくと
も2つを予め選定しておき、その選定した複数の評価パ
ラメータによる評価値が求まったならば、その各評価値
に所定の係数を乗じて加算し、その加算値と仮結合用の
閾値と比較する。この比較処理の結果、加算値が小さい
ものについては、1文字の中に含まれると判定し、その
1対のストロークを同一集合に結合し、1つの文字要素
候補に選定する。この仮結合処理は、閾値以下のストロ
ークがいずれかの文字要素に全て結合されるまで再帰的
に繰り返す。
も2つを予め選定しておき、その選定した複数の評価パ
ラメータによる評価値が求まったならば、その各評価値
に所定の係数を乗じて加算し、その加算値と仮結合用の
閾値と比較する。この比較処理の結果、加算値が小さい
ものについては、1文字の中に含まれると判定し、その
1対のストロークを同一集合に結合し、1つの文字要素
候補に選定する。この仮結合処理は、閾値以下のストロ
ークがいずれかの文字要素に全て結合されるまで再帰的
に繰り返す。
【0055】例えば、図14(a)に示すように「ソフ
ト」というカナ文字が入力された場合、このカナ文字を
構成するストロークST1〜ST5について、互いに隣接
するストローク同士で図12(b)〜図13(c)に示
す評価パラメータを求め、その評価パラメータを全部使
って総合評価を行い、どのストロークを結合して1つの
文字要素とするかを決定する。図14(b)に各評価パ
ラメータの値の例を示している。ここで、図14(b)
における評価パラメータ(a)〜(c)は図12(a)
〜(c)の評価パラメータ、評価パラメータ(d)〜
(f)は図13(a)〜(c)の評価パラメータに該当
する。算出した各評価パラメータは、小さいほど結合の
度合いが強いことを示している。
ト」というカナ文字が入力された場合、このカナ文字を
構成するストロークST1〜ST5について、互いに隣接
するストローク同士で図12(b)〜図13(c)に示
す評価パラメータを求め、その評価パラメータを全部使
って総合評価を行い、どのストロークを結合して1つの
文字要素とするかを決定する。図14(b)に各評価パ
ラメータの値の例を示している。ここで、図14(b)
における評価パラメータ(a)〜(c)は図12(a)
〜(c)の評価パラメータ、評価パラメータ(d)〜
(f)は図13(a)〜(c)の評価パラメータに該当
する。算出した各評価パラメータは、小さいほど結合の
度合いが強いことを示している。
【0056】図14(b)の評価パラメータに対し、
「仮結合の閾値=−4.0」、「仮分割の閾値=−5.
0」を設定した場合、総合評価はストロークST1,S
T2間が「−3.2」、ストロークST2,ST3間が
「−5.45」、ストロークST3,ST4間が「−7.
4」、ストロークST4,ST5間が「−1.41」であ
るので、ストロークST1,ST2間は「結合」、ストロ
ークST2,ST3間は「分割」、ストロークST3,S
T4間は「分割」、ストロークST4,ST5間は「結
合」となる。
「仮結合の閾値=−4.0」、「仮分割の閾値=−5.
0」を設定した場合、総合評価はストロークST1,S
T2間が「−3.2」、ストロークST2,ST3間が
「−5.45」、ストロークST3,ST4間が「−7.
4」、ストロークST4,ST5間が「−1.41」であ
るので、ストロークST1,ST2間は「結合」、ストロ
ークST2,ST3間は「分割」、ストロークST3,S
T4間は「分割」、ストロークST4,ST5間は「結
合」となる。
【0057】ここで、X軸方向(横書き方向)の単なる
重なり度合いによって「結合」か「分割」かを従来の決
定論的な方法によって判断するようにした場合、例え
ば、ストロークST2,ST3間の距離d2よりも小さ
い距離を仮結合用の閾値に設定した場合、ストロークS
T4,ST5間の距離d3はd2>d3であるのでスト
ロークST4,ST5は「結合」となる。しかし、スト
ロークST1,ST2間の距離d1はd1>d2である
ので、これらストロークST1,ST2間は「分割」と
なり、ストロークST2,ST3間は「結合」となり、
ストローク同士の結合および分割が正しく行われなくな
る。
重なり度合いによって「結合」か「分割」かを従来の決
定論的な方法によって判断するようにした場合、例え
ば、ストロークST2,ST3間の距離d2よりも小さ
い距離を仮結合用の閾値に設定した場合、ストロークS
T4,ST5間の距離d3はd2>d3であるのでスト
ロークST4,ST5は「結合」となる。しかし、スト
ロークST1,ST2間の距離d1はd1>d2である
ので、これらストロークST1,ST2間は「分割」と
なり、ストロークST2,ST3間は「結合」となり、
ストローク同士の結合および分割が正しく行われなくな
る。
【0058】一方、本発明のように、複数の評価パラメ
ータの総合評価によってストローク同士の結合および分
割を決定することにより、ストローク同士の結合および
分割を精度良く行うことができる。
ータの総合評価によってストローク同士の結合および分
割を決定することにより、ストローク同士の結合および
分割を精度良く行うことができる。
【0059】標準文字サイズ取得部613は、以上のよ
うにしてストロークの結合および分割を行い、文字要素
となる候補を定めるこの結果、入力装置2から入力され
た手書き文字の複数ストローク群は、図15に破線で囲
んで示すように、複数の文字要素に分割される。
うにしてストロークの結合および分割を行い、文字要素
となる候補を定めるこの結果、入力装置2から入力され
た手書き文字の複数ストローク群は、図15に破線で囲
んで示すように、複数の文字要素に分割される。
【0060】そこで、次に、図15に破線で示すような
各文字要素の外接矩形を求め、その外接矩形の大きさか
ら1文字の大きさを推定する。文字の大きさは、高さと
幅をそれぞれ別個に計算する。計算には各外接矩形の高
さおよび幅のうち、長い方の値のみを利用する。図14
のような手書きパターンが与えられた時は、高さの計算
にはH1,H3,H4,H5,H6を、幅の計算にはW2,W
7を利用する。計算に用いるデータを選択した後、それ
ぞれのデータの平均値と標準偏差を求め、平均値との差
を標準偏差で割った値が閾値以上のものはノイズを含ん
でいるものと見做してデータから削除する。最後に残っ
たデータの最大値もしくは平均値を標準文字の高さ、あ
るいは幅の推定値とする。
各文字要素の外接矩形を求め、その外接矩形の大きさか
ら1文字の大きさを推定する。文字の大きさは、高さと
幅をそれぞれ別個に計算する。計算には各外接矩形の高
さおよび幅のうち、長い方の値のみを利用する。図14
のような手書きパターンが与えられた時は、高さの計算
にはH1,H3,H4,H5,H6を、幅の計算にはW2,W
7を利用する。計算に用いるデータを選択した後、それ
ぞれのデータの平均値と標準偏差を求め、平均値との差
を標準偏差で割った値が閾値以上のものはノイズを含ん
でいるものと見做してデータから削除する。最後に残っ
たデータの最大値もしくは平均値を標準文字の高さ、あ
るいは幅の推定値とする。
【0061】この場合、最終的にデータ不足で高さHあ
るいは幅Wの片方が算出できなかった場合、算出できた
方の値を算出できなかった方の値にも利用する。例え
ば、高さHだけが算出でき、幅Wが求められなかった場
合は幅W=高さHとする。図14の例では、文字の高さ
=H6、幅=W7として算出している。
るいは幅Wの片方が算出できなかった場合、算出できた
方の値を算出できなかった方の値にも利用する。例え
ば、高さHだけが算出でき、幅Wが求められなかった場
合は幅W=高さHとする。図14の例では、文字の高さ
=H6、幅=W7として算出している。
【0062】このようにすることにより、筆記方向や行
数の指定が無い場合でも、文字の大きさの推定が可能に
なる。そして、筆記方向や行数の情報が筆記方向判別処
理および改行位置判別処理で判明すれば、仮結合処理の
精度がさらに向上し、結果として、手書き文字の標準サ
イズの推定精度が向上するという利点がある。
数の指定が無い場合でも、文字の大きさの推定が可能に
なる。そして、筆記方向や行数の情報が筆記方向判別処
理および改行位置判別処理で判明すれば、仮結合処理の
精度がさらに向上し、結果として、手書き文字の標準サ
イズの推定精度が向上するという利点がある。
【0063】特に、斜め書きや文字間隔が狭い手書き文
字であっても、各文字要素の切り出しを行うための標準
文字サイズを正確に推定することができる。
字であっても、各文字要素の切り出しを行うための標準
文字サイズを正確に推定することができる。
【0064】例えば、図16(a)に示すように斜め書
きの手書き文字が入力された場合、仮結合処理によって
図16(b)に示すように結合または分割された文字要
素単位に、その文字要素の外接矩形を求め、その外接矩
形の大きさから1文字の大きさを推定するため、標準文
字サイズを斜め書きの場合であっても正確に推定するこ
とができる。
きの手書き文字が入力された場合、仮結合処理によって
図16(b)に示すように結合または分割された文字要
素単位に、その文字要素の外接矩形を求め、その外接矩
形の大きさから1文字の大きさを推定するため、標準文
字サイズを斜め書きの場合であっても正確に推定するこ
とができる。
【0065】(5)枠無し手書き文字列認識部614 枠無し手書き文字列認識部614は、図5に詳細を示し
たように仮結合処理部615、仮分割処理部616、評
価・探索処理部617とで構成される。
たように仮結合処理部615、仮分割処理部616、評
価・探索処理部617とで構成される。
【0066】仮結合処理部615における処理は、標準
文字サイズ取得部613における仮結合処理と全く同様
である。但し、標準文字サイズ取得部613における仮
結合処理は個々のストロークを結合し、「1つの文字に
含まれることが明らかな状態の文字要素」を作成するこ
とであるのに対し、仮結合処理部615における仮結合
処理は標準文字サイズの推定値を参照し、各文字要素を
さらに結合することである。この場合、文字要素を結合
する際に用いる評価パラメータおよび手順は、標準文字
サイズ取得部613における仮結合処理と全く同様のも
のを用いることができる。但し、標準サイズLは1つの
文字要素の外接矩形の長さの大きい方の値、標準面積S
は標準サイズLの正方形の面積を使用する点が異なる。
なお、文字要素の結合に専用に設定した評価パラメータ
を用いてもよい。
文字サイズ取得部613における仮結合処理と全く同様
である。但し、標準文字サイズ取得部613における仮
結合処理は個々のストロークを結合し、「1つの文字に
含まれることが明らかな状態の文字要素」を作成するこ
とであるのに対し、仮結合処理部615における仮結合
処理は標準文字サイズの推定値を参照し、各文字要素を
さらに結合することである。この場合、文字要素を結合
する際に用いる評価パラメータおよび手順は、標準文字
サイズ取得部613における仮結合処理と全く同様のも
のを用いることができる。但し、標準サイズLは1つの
文字要素の外接矩形の長さの大きい方の値、標準面積S
は標準サイズLの正方形の面積を使用する点が異なる。
なお、文字要素の結合に専用に設定した評価パラメータ
を用いてもよい。
【0067】この文字要素の再帰的な仮結合処理によっ
て、例えば図17に示すように「問」という漢字につい
ては、「門構え」内の「口」という文字要素は最後に筆
記された文字要素であるにも拘らず、「門構え」内に結
合され、「問」という1つの漢字の文字要素集合とな
る。
て、例えば図17に示すように「問」という漢字につい
ては、「門構え」内の「口」という文字要素は最後に筆
記された文字要素であるにも拘らず、「門構え」内に結
合され、「問」という1つの漢字の文字要素集合とな
る。
【0068】文字要素がさらに結合され、新たな文字要
素集合が作成されたならば、仮分割処理部616におい
て仮分割処理を行う。
素集合が作成されたならば、仮分割処理部616におい
て仮分割処理を行う。
【0069】仮分割処理とは、文字要素間の距離を評価
し、仮分割用の閾値よりも大きい距離の文字要素間に、
そこが文字の区切りであることを示す属性フラグを設定
するという処理である。この場合、文字要素間の距離の
評価方法は前述した仮結合処理と同様である。
し、仮分割用の閾値よりも大きい距離の文字要素間に、
そこが文字の区切りであることを示す属性フラグを設定
するという処理である。この場合、文字要素間の距離の
評価方法は前述した仮結合処理と同様である。
【0070】この処理によって、文字区切りの属性フラ
グが設定された2つの文字要素のうち先に筆記された文
字要素の末尾のストロークと、後に筆記された文字要素
の先頭のストロークの間は「文字の区切りであることが
明らかな状態」になる。図6においては、この属性フラ
グを文字の順番号で例示している。属性フラグの表現方
法としては、他の方法を用いても何等構わない。
グが設定された2つの文字要素のうち先に筆記された文
字要素の末尾のストロークと、後に筆記された文字要素
の先頭のストロークの間は「文字の区切りであることが
明らかな状態」になる。図6においては、この属性フラ
グを文字の順番号で例示している。属性フラグの表現方
法としては、他の方法を用いても何等構わない。
【0071】この枠無し文字列認識部614における仮
結合処理および仮分割処理は、後続の評価・探索処理部
617における探索空間を小さくするための処理である
ので、処理時間が問題にならない場合(高速の処理時間
を必要としない場合)は省略することができる。
結合処理および仮分割処理は、後続の評価・探索処理部
617における探索空間を小さくするための処理である
ので、処理時間が問題にならない場合(高速の処理時間
を必要としない場合)は省略することができる。
【0072】次に、評価・探索処理部617において、
各文字要素集合によって辞書62を探索し、辞書62に
登録された手書き文字パターンに対する評価値が最大に
なる文字を判定し、その文字のコードを認識結果として
表示装置3に出力し、表示装置3において文字コードに
対応した文字を表示させる。
各文字要素集合によって辞書62を探索し、辞書62に
登録された手書き文字パターンに対する評価値が最大に
なる文字を判定し、その文字のコードを認識結果として
表示装置3に出力し、表示装置3において文字コードに
対応した文字を表示させる。
【0073】前記の仮分割処理部616の処理が終了し
た段階では、入力装置2から入力された手書きパターン
に含まれる全ての隣接したストローク間の状態は、「1
文字に含まれることが明らかな状態」、「文字の区切り
であることが明らかな状態」、「曖昧な状態」のいずれ
かである。この段階で存在する「曖昧な状態」について
それぞれ、1文字に含まれていると見做すか、文字の区
切りであると見做すかによって、1つの「切り出しパタ
ーン」が定義できる。探索空間にある「切り出しパター
ン」の数は「あいまいな状態」の数をnとすると、2の
n乗である。
た段階では、入力装置2から入力された手書きパターン
に含まれる全ての隣接したストローク間の状態は、「1
文字に含まれることが明らかな状態」、「文字の区切り
であることが明らかな状態」、「曖昧な状態」のいずれ
かである。この段階で存在する「曖昧な状態」について
それぞれ、1文字に含まれていると見做すか、文字の区
切りであると見做すかによって、1つの「切り出しパタ
ーン」が定義できる。探索空間にある「切り出しパター
ン」の数は「あいまいな状態」の数をnとすると、2の
n乗である。
【0074】この評価・探索処理は、探索空間に含まれ
る「全切り出しパターン」の中から以下で説明する評価
値を最大にする「切り出しパターン」を探索するという
処理である。この場合の探索手法には、動的計画法、全
探索、ビーム探索等の既存の探索手法が利用可能であ
る。本実施形態では、探索空間を図18に示すように2
分木で表現し、その2分木に対するビーム探索を行うよ
うにしている。
る「全切り出しパターン」の中から以下で説明する評価
値を最大にする「切り出しパターン」を探索するという
処理である。この場合の探索手法には、動的計画法、全
探索、ビーム探索等の既存の探索手法が利用可能であ
る。本実施形態では、探索空間を図18に示すように2
分木で表現し、その2分木に対するビーム探索を行うよ
うにしている。
【0075】切り出しパターンの評価値は、次に示す評
価パラメータに係数を乗じて加算した値を用いている。
価パラメータに係数を乗じて加算した値を用いている。
【0076】(a)切り出された各手書きパターンと辞
書に登録されている手書きパターンとの距離から得られ
る評価パラメータ、(b)各認識結果文字間の遷移確率
から得られる評価パラメータ、(c)切り出された各手
書きパターンのサイズの標準の文字サイズに対する割合
から得られる評価パラメータ、(d)1文字に含まれる
と判断した隣接のストローク間の、文字要素間の距離の
評価値と、仮結合の閾値から得られる評価パラメータ、
(e)文字の区切りであると判断した隣接ストローク間
の、文字要素間の距離の評価値と、仮分割処理の閾値か
ら得られる評価パラメータ。
書に登録されている手書きパターンとの距離から得られ
る評価パラメータ、(b)各認識結果文字間の遷移確率
から得られる評価パラメータ、(c)切り出された各手
書きパターンのサイズの標準の文字サイズに対する割合
から得られる評価パラメータ、(d)1文字に含まれる
と判断した隣接のストローク間の、文字要素間の距離の
評価値と、仮結合の閾値から得られる評価パラメータ、
(e)文字の区切りであると判断した隣接ストローク間
の、文字要素間の距離の評価値と、仮分割処理の閾値か
ら得られる評価パラメータ。
【0077】図18において、1点鎖線は区切りになる
かどうかが曖昧な部分を示し、破線矢印は分割処理、実
線矢印は結合処理によって各文字要素が分割または結合
されることを示している。例えば、手書き文字「晴れ」
をの曖昧部分で結合した後、の曖昧部分で分割した
場合は「晴れ」という文字に認識される。しかし、の
曖昧部分も結合した場合は認識不可能であることを示し
ている。
かどうかが曖昧な部分を示し、破線矢印は分割処理、実
線矢印は結合処理によって各文字要素が分割または結合
されることを示している。例えば、手書き文字「晴れ」
をの曖昧部分で結合した後、の曖昧部分で分割した
場合は「晴れ」という文字に認識される。しかし、の
曖昧部分も結合した場合は認識不可能であることを示し
ている。
【0078】評価・探索処理部617は、各文字要素間
の結合関係が曖昧な部分を左から順に、文字の区切りと
判断する場合は左側に、1文字に含まれると判断する場
合は右側に進むものとすると、図18の2分木の各ノー
ドの日本語の文字列としての確からしさを以下に述べる
手法で評価しながら、2分木の葉の中から最も確からし
い葉を探索し、その葉に相当する文字列を認識結果とす
る。これは、上記(c)の評価方法に該当する。
の結合関係が曖昧な部分を左から順に、文字の区切りと
判断する場合は左側に、1文字に含まれると判断する場
合は右側に進むものとすると、図18の2分木の各ノー
ドの日本語の文字列としての確からしさを以下に述べる
手法で評価しながら、2分木の葉の中から最も確からし
い葉を探索し、その葉に相当する文字列を認識結果とす
る。これは、上記(c)の評価方法に該当する。
【0079】ある手書きパターンXが文字列Cである確
率は、ベイズの定理により次の「数1」によって表すこ
とができる。
率は、ベイズの定理により次の「数1」によって表すこ
とができる。
【0080】
【数1】
【0081】ここで、P(X)は事象Xの起こる確率、
P(X│Y)は事象Yのもとで事象Xの起きる条件つき
確率である。すなわち、 P(X│C); 文字列CがパターンXのように書かれる確率、 P(C) ; 文字列Cが書かれる確率、 P(X) ; パターンXが書かれる確率 ; (Cとは独立であるので定数として考える)、 である。
P(X│Y)は事象Yのもとで事象Xの起きる条件つき
確率である。すなわち、 P(X│C); 文字列CがパターンXのように書かれる確率、 P(C) ; 文字列Cが書かれる確率、 P(X) ; パターンXが書かれる確率 ; (Cとは独立であるので定数として考える)、 である。
【0082】P(C)は近似的に、「数2」によって表
すことができる。
すことができる。
【0083】
【数2】
【0084】但し、P(Ci+1│Ci)はi番目の文字と
i+1番目の文字が連続して書かれる確率のことで、予
め統計を取って用意して有る表から求める。Nは文字数
である。
i+1番目の文字が連続して書かれる確率のことで、予
め統計を取って用意して有る表から求める。Nは文字数
である。
【0085】P(X│C)は近似的に、「数3」によっ
て表すことができる。
て表すことができる。
【0086】
【数3】
【0087】但し、P(Xi│Ci)は文字列C中のi番
目の文字Ciが手書きパターンXを1文字毎に分割した
中のi番目の手書きパターンXiのように書かれる確率
であり、文字Ciに対応する辞書パターンと手書きパタ
ーンXiをオンライン枠有り文字認識装置で比較するこ
とにより求めている。
目の文字Ciが手書きパターンXを1文字毎に分割した
中のi番目の手書きパターンXiのように書かれる確率
であり、文字Ciに対応する辞書パターンと手書きパタ
ーンXiをオンライン枠有り文字認識装置で比較するこ
とにより求めている。
【0088】P(区切りor結合│dk)はk番目の文
字要素とk+1番目の文字要素間の距離がdkの場合に
その2つの文字要素間が、文字の区切りに成っている確
率、あるいは1文字に含まれている確率である。どちら
の確率を求めるかは、手書きパターンXの分割の仕方に
依存する。
字要素とk+1番目の文字要素間の距離がdkの場合に
その2つの文字要素間が、文字の区切りに成っている確
率、あるいは1文字に含まれている確率である。どちら
の確率を求めるかは、手書きパターンXの分割の仕方に
依存する。
【0089】評価中の手書きパターンの分割法で、k番
目の文字要素とk+1番目の文字要素が1文字に含まれ
ていなければ文字になる確率を、1文字に含まれていれ
ば1文字に含まれる確率を求める。
目の文字要素とk+1番目の文字要素が1文字に含まれ
ていなければ文字になる確率を、1文字に含まれていれ
ば1文字に含まれる確率を求める。
【0090】P(SIZEi│標準サイズ)は、1文字
の標準の大きさが標準サイズである時の、i番目の文字
の大きさSIZEiの確からしさである。
の標準の大きさが標準サイズである時の、i番目の文字
の大きさSIZEiの確からしさである。
【0091】次に、コンピュータで計算することを考慮
した場合、「数3」では乗算が多く、(2i+k)回の
乗算が必要になる。そこで、「数3」を「数4」に示す
ような対数項を持つ計算式に置き換え、この「数4」の
計算結果を統計的評価値として採用する。
した場合、「数3」では乗算が多く、(2i+k)回の
乗算が必要になる。そこで、「数3」を「数4」に示す
ような対数項を持つ計算式に置き換え、この「数4」の
計算結果を統計的評価値として採用する。
【0092】
【数4】
【0093】このように日本語としての確からしさを評
価し、その評価値が最大となる文字を認識結果として出
力することにより、文字間隔が不揃いな手書き文字、斜
めに傾いて筆記された手書き文字が存在したとしても、
複数行にわたる文字列の文脈に適合する認識結果が得ら
れ、文字単位の認識では得られない高精度の認識結果を
一括して得ることができる。
価し、その評価値が最大となる文字を認識結果として出
力することにより、文字間隔が不揃いな手書き文字、斜
めに傾いて筆記された手書き文字が存在したとしても、
複数行にわたる文字列の文脈に適合する認識結果が得ら
れ、文字単位の認識では得られない高精度の認識結果を
一括して得ることができる。
【0094】例えば、図16(a)の手書き文字は同図
(c)に示すような文字要素の結合によって正しく認識
される。
(c)に示すような文字要素の結合によって正しく認識
される。
【0095】なお、本発明は、上記実施形態に限定され
るものではなく、筆記方向取得部611、改行位置取得
部612、標準文字サイズ取得部612、枠無し手書き
文字認識部614における処理を新規の要素技術とし
て、既存の文字認識処理の中に組み込んで構成すること
ができる。
るものではなく、筆記方向取得部611、改行位置取得
部612、標準文字サイズ取得部612、枠無し手書き
文字認識部614における処理を新規の要素技術とし
て、既存の文字認識処理の中に組み込んで構成すること
ができる。
【0096】また、手書き文字認識プログラムは、CD
・ROM等の記録媒体に格納されてユーザに提供され
る。または、インタネット等の通信媒体を通じて有償で
提供される。以上説明したように、本実施の形態によれ
ば、電子黒板等に筆記方向が指定されずに筆記された手
書き文字の筆記方向を正確に判定し、その判定結果に従
って手書き文字を認識することができる。 また、電子黒
板等に改行位置が指定されずに筆記された手書き文字の
改行位置を正確に判定し、その判定結果に従って複数行
に渡る手書き文字を認識することができる。 さらに、斜
め書きや文字間隔が狭い手書き文字であっても、各文字
要素の切り出しを正確に行い、その切り出し結果に従っ
て任意行の手書き文字を認識することができる。 また、
縦書き横書きの種別、行数、筆記枠の有無に関係なく、
電子黒板等に筆記された手書き文字を高精度で認識する
ことができる。
・ROM等の記録媒体に格納されてユーザに提供され
る。または、インタネット等の通信媒体を通じて有償で
提供される。以上説明したように、本実施の形態によれ
ば、電子黒板等に筆記方向が指定されずに筆記された手
書き文字の筆記方向を正確に判定し、その判定結果に従
って手書き文字を認識することができる。 また、電子黒
板等に改行位置が指定されずに筆記された手書き文字の
改行位置を正確に判定し、その判定結果に従って複数行
に渡る手書き文字を認識することができる。 さらに、斜
め書きや文字間隔が狭い手書き文字であっても、各文字
要素の切り出しを正確に行い、その切り出し結果に従っ
て任意行の手書き文字を認識することができる。 また、
縦書き横書きの種別、行数、筆記枠の有無に関係なく、
電子黒板等に筆記された手書き文字を高精度で認識する
ことができる。
【0097】
【発明の効果】以上説明したように、本発明によれば、
電子黒板等に筆記方向が指定されずに筆記された手書き
文字の筆記方向を正確に判定し、その判定結果に従って
手書き文字を認識することが可能となる。
電子黒板等に筆記方向が指定されずに筆記された手書き
文字の筆記方向を正確に判定し、その判定結果に従って
手書き文字を認識することが可能となる。
【0098】また、縦書き横書きの種別、行数、筆記枠
の有無に関係なく、電子黒板等に筆記された手書き文字
を高精度で認識することが可能となる。
の有無に関係なく、電子黒板等に筆記された手書き文字
を高精度で認識することが可能となる。
【0099】
【0100】
【図1】本発明を適用した手書き文字認識装置の実施形
態を示すブロック構成図である。
態を示すブロック構成図である。
【図2】手書き文字入力装置の入力面に筆記された手書
き文字の一例を示す説明図である。
き文字の一例を示す説明図である。
【図3】手書き文字の中のデータの単位を示す説明図で
ある。
ある。
【図4】図1の手書き文字認識装置の機能構成図であ
る。
る。
【図5】枠無し文字列認識部の詳細構成図である。
【図6】記憶装置に格納される手書き文字のデータ構成
の一例を示す図である。
の一例を示す図である。
【図7】縦書き横書き判別ベクトルの説明図である。
【図8】縦書き横書きの判別処理を示すフローチャート
である。
である。
【図9】改行位置の判別に使用するヒストグラムの例を
示す説明図である。
示す説明図である。
【図10】改行裏ストロークの説明図である。
【図11】改行位置の判定処理を示すフローチャートで
ある。
ある。
【図12】ストローク間の仮結合処理に用いる評価パラ
メータの説明図である。
メータの説明図である。
【図13】ストローク間の仮結合処理に用いる評価パラ
メータの説明図である。
メータの説明図である。
【図14】ストロークの仮結合処理の対象となる入力ス
トロークの例と評価パラメータの算出例を示す説明図で
ある。
トロークの例と評価パラメータの算出例を示す説明図で
ある。
【図15】文字要素の外接矩形から標準文字サイズを推
定する処理の説明図である。
定する処理の説明図である。
【図16】斜め書きの手書き文字の文字要素への仮結合
処理の一例を示す図である。
処理の一例を示す図である。
【図17】文字要素の再帰的な処理によって結合可能な
手書き文字の一例を示す説明図である。
手書き文字の一例を示す説明図である。
【図18】手書き文字を辞書内で探索する際に用いる2
分木の一例を示す説明図である。
分木の一例を示す説明図である。
1…ペン、2…手書き文字入力装置、3…表示装置、4
…CPU、6…記憶装置、21…手書き文字の入力面、
61…手書き文字認識プログラム、62…辞書、611
…筆記方向取得部、612…改行位置取得部、613…
標準文字サイズ取得部、614…枠無し手書き文字列認
識部、615…仮結合処理部、616…仮分割処理部、
617…評価・探索処理部。
…CPU、6…記憶装置、21…手書き文字の入力面、
61…手書き文字認識プログラム、62…辞書、611
…筆記方向取得部、612…改行位置取得部、613…
標準文字サイズ取得部、614…枠無し手書き文字列認
識部、615…仮結合処理部、616…仮分割処理部、
617…評価・探索処理部。
フロントページの続き (56)参考文献 特開 平10−97372(JP,A) 特開 平5−67236(JP,A) 特開 昭62−159291(JP,A) 特開 昭57−161894(JP,A) 「電子情報通信学会技術研究報告 P RU95−13」Vol.95 No.43 P RU95−1〜20 p.93−100(1995) 岡田正義 他 ”物理的特徴量を用いた オンライン文字自動切り出し手法" (58)調査した分野(Int.Cl.7,DB名) G06K 9/20 - 9/62 G06F 3/03 380 G06F 17/22 506 JICSTファイル(JOIS)
Claims (3)
- 【請求項1】 手書き文字入力装置からストローク順に
入力された複数ストローク群から成る複数の手書き文字
列を認識する手書き文字認識方法であって、 前記複数ストローク群を対象として、そのストローク群
の中のストローク入力時刻において隣合うストロークの
終点から始点へのベクトルを求め、そのベクトルの右方
向成分および下方向成分を同一方向成分同士で加算し、
その加算した右方向成分と下方向成分の比と、横書き判
定用閾値および縦書き判定用閾値とを比較し、前記加算
した右方向成分と下方向成分の比が、前記横書き判定用
閾値以上ならば筆記方向が横書き、前記縦書き判定用閾
値未満ならば筆記方向が縦書きと判定し、また、前記加
算した右方向成分と下方向成分の比が、横書き判定用閾
値未満で縦書き判定用閾値以上ならば、入力された手書
き文字列全体の外接矩形の高さと幅の比によって、筆記
方向が横書きか、縦書きかを判定し、この筆記方向の判
定結果に従って前記複数ストローク群から成る手書き文
字列を認識することを特徴とする手書き文字認識方法。 - 【請求項2】 手書き文字入力装置からストローク順に
入力された複数ストローク群から成る複数の手書き文字
列を認識する手書き文字認識方法であって、 前記複数ストローク群を対象として、そのストローク群
の中のストローク入力時刻において隣合うストロークの
終点から始点へのベクトルを求め、そのベクトルの右方
向成分および下方向成分を同一方向成分同士で加算し、
その加算した右方向成分と下方向成分の比と、横書き/
縦書き判定用の閾値とを比較し、前記加算した右方向成
分と下方向成分の比が、前記横書き/縦書き判定用の閾
値以上ならば筆記方向が横書き、前記横書き/縦書き判
定用の閾値未満ならば筆記方向が縦書きと判定すると共
に、前記複数ストローク群の筆記方向へのヒストグラム
を求め、そのヒストグラムにより筆記点が少ない部分を
改行位置候補に選定し、さらに前記ストローク群の中の
ストローク入力時刻において隣合うストロークの終点か
ら始点へのベクトルおよびそのベクトルの長さの平均を
求め、前記改行位置候補内で前記ベクトルの長さの平均
が改行判定用の閾値を超える位置を改行位置として判定
し、この改行位置の判定結果および前記筆記方向の判定
結果に従って前記複数ストローク群から成る手書き文字
列を認識 することを特徴とする手書き文字認識方法。 - 【請求項3】 手書き文字入力装置からストローク順に
入力された複数ストローク群から成る複数の手書き文字
列を認識する手書き文字認識方法であって、前記複数ス
トローク群を対象として、そのストローク群の中のスト
ローク入力時刻において隣合うストロークの終点から始
点へのベクトルを求め、そのベクトルの右方向成分およ
び下方向成分を同一方向成分同士で加算し、その加算し
た右方向成分と下方向成分の比と、横書き/縦書き判定
用の閾値とを比較し、前記加算した右方向成分と下方向
成分の比が、前記横書き/縦書き判定用の閾値以上なら
ば筆記方向が横書き、前記横書き/縦書き判定用の閾値
未満ならば筆記方向が縦書きと判定すると共に、前記複
数ストローク群の筆記方向へのヒストグラムを求め、そ
のヒストグラムにより筆記点が少ない部分を改行位置候
補に選定し、さらに前記ストローク群の中のストローク
入力時刻において隣合うストロークの終点から始点への
ベクトルおよびそのベクトルの長さの平均を求め、前記
改行位置候補内のベクトルの長さと前記ベクトルの長さ
の平均を比較し、改行判定用の閾値を超えるベクトルの
位置を改行位置として判定し、さらに前記複数ストロー
ク群を構成する各ストローク間の距離を予め定めた関係
式に従って行単位に評価し、その評価した距離が仮結合
用の閾値よりも小さいストローク同士を結合する処理を
結合可能な文字要素がなくなるまで繰り返すことによ
り、複数ストローク群を複数の文字要素に分割した後、
各文字要素の外接矩形を求め、当該外接矩形の高さの最
大値または平均値と、当該外接矩形の幅の最大値または
平均値を手書き文字の標準文字サイズとして推定し、こ
の推定の標準文字サイズの空間において隣接する文字要
素間の関係を表すパラメータを予め定めた関係式に従っ
て算出し、その算出したパラメータが仮結合用の閾値よ
りも小さい文字要素同士を結合する処理を結合可能な文
字要素がなくなるまで繰り返すことにより、複数の文字
要素を複数の文字要素集合に分割し、その文字要素集合
によって辞書を探索し、辞書に登録された手書き文字パ
ターンに対する評価値が最大になる文字を認識結果とし
て出力することを特徴とする手書き文字認識方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP22684297A JP3216800B2 (ja) | 1997-08-22 | 1997-08-22 | 手書き文字認識方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP22684297A JP3216800B2 (ja) | 1997-08-22 | 1997-08-22 | 手書き文字認識方法 |
Related Child Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001183718A Division JP2002063548A (ja) | 2001-06-18 | 2001-06-18 | 手書き文字認識方法 |
JP2001183717A Division JP3897999B2 (ja) | 2001-06-18 | 2001-06-18 | 手書き文字認識方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH1166238A JPH1166238A (ja) | 1999-03-09 |
JP3216800B2 true JP3216800B2 (ja) | 2001-10-09 |
Family
ID=16851431
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP22684297A Expired - Fee Related JP3216800B2 (ja) | 1997-08-22 | 1997-08-22 | 手書き文字認識方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3216800B2 (ja) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4050055B2 (ja) | 2002-01-10 | 2008-02-20 | 株式会社リコー | 手書き文字一括変換装置、手書き文字一括変換方法およびプログラム |
JP5581448B2 (ja) * | 2010-08-24 | 2014-08-27 | ノキア コーポレイション | 重なった手書き文字のストロークを一つ又は複数のグループにグループ分けする方法及び装置 |
EP2712433B1 (en) * | 2012-05-31 | 2016-11-02 | MultiTouch Oy | User interface for drawing with electronic devices |
JP5567097B2 (ja) | 2012-10-26 | 2014-08-06 | 株式会社東芝 | 電子機器、手書き文書表示方法、及び表示プログラム |
JP2014215752A (ja) | 2013-04-24 | 2014-11-17 | 株式会社東芝 | 電子機器および手書きデータ処理方法 |
JP6290003B2 (ja) * | 2014-05-28 | 2018-03-07 | 株式会社東芝 | 電子機器及び方法 |
CN107967105A (zh) * | 2016-10-19 | 2018-04-27 | 夏普株式会社 | 手写内容编辑设备和方法 |
CN111046802B (zh) * | 2019-12-11 | 2024-01-05 | 新方正控股发展有限责任公司 | 基于矢量字的评测方法、装置、设备和存储介质 |
CN112861694A (zh) * | 2021-02-02 | 2021-05-28 | 周斌 | 一种基于模板的联机书写评分方法 |
CN113159031B (zh) * | 2021-04-21 | 2024-05-10 | 广州逅艺文化科技有限公司 | 一种手写文本检测方法、装置及存储介质 |
CN115937861B (zh) * | 2022-11-30 | 2023-09-08 | 广东保伦电子股份有限公司 | 一种基于触摸屏的多人同步书写识别方法及系统 |
-
1997
- 1997-08-22 JP JP22684297A patent/JP3216800B2/ja not_active Expired - Fee Related
Non-Patent Citations (1)
Title |
---|
「電子情報通信学会技術研究報告 PRU95−13」Vol.95 No.43 PRU95−1〜20 p.93−100(1995)岡田正義 他 "物理的特徴量を用いたオンライン文字自動切り出し手法" |
Also Published As
Publication number | Publication date |
---|---|
JPH1166238A (ja) | 1999-03-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109614944B (zh) | 一种数学公式识别方法、装置、设备及可读存储介质 | |
Shafait et al. | Performance evaluation and benchmarking of six-page segmentation algorithms | |
AU737039B2 (en) | Methods and apparatuses for handwriting recognition | |
US6393395B1 (en) | Handwriting and speech recognizer using neural network with separate start and continuation output scores | |
US7630551B2 (en) | Method and system for line extraction in digital ink | |
US5687254A (en) | Searching and Matching unrecognized handwriting | |
EP0690408B1 (en) | Handwriting recognition system | |
JP3452774B2 (ja) | 文字認識方法 | |
US7970213B1 (en) | Method and system for improving the recognition of text in an image | |
JP3216800B2 (ja) | 手書き文字認識方法 | |
CN111340020A (zh) | 一种公式识别方法、装置、设备及存储介质 | |
Dutta et al. | Cnn based extraction of panels/characters from bengali comic book page images | |
JP2008225695A (ja) | 文字認識誤り修正装置およびプログラム | |
CN109389050A (zh) | 一种流程图连接关系识别方法 | |
CN102314252B (zh) | 一种手写字符串的字符切分方法和装置 | |
JP2002063548A (ja) | 手書き文字認識方法 | |
JP2015099566A (ja) | 特徴算出装置、方法及びプログラム | |
JP3917349B2 (ja) | 文字認識結果を利用して情報を検索する検索装置および方法 | |
JP3897999B2 (ja) | 手書き文字認識方法 | |
JP3179280B2 (ja) | 表を含む帳票処理装置 | |
JP2940747B2 (ja) | 文字切り出し装置 | |
JP4810853B2 (ja) | 文字画像切出装置、文字画像切出方法およびプログラム | |
Nguyen et al. | Semi-incremental recognition of on-line handwritten Japanese text | |
JP3374762B2 (ja) | 文字認識方法及びその装置 | |
Bhardwaj et al. | An OCR based approach for word spotting in Devanagari documents |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100803 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130803 Year of fee payment: 12 |
|
LAPS | Cancellation because of no payment of annual fees |