JP2003196593A - 文字認識装置および文字認識方法および文字認識プログラム - Google Patents
文字認識装置および文字認識方法および文字認識プログラムInfo
- Publication number
- JP2003196593A JP2003196593A JP2001401296A JP2001401296A JP2003196593A JP 2003196593 A JP2003196593 A JP 2003196593A JP 2001401296 A JP2001401296 A JP 2001401296A JP 2001401296 A JP2001401296 A JP 2001401296A JP 2003196593 A JP2003196593 A JP 2003196593A
- Authority
- JP
- Japan
- Prior art keywords
- character
- recognition
- gesture
- stroke
- input device
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Character Discrimination (AREA)
Abstract
(57)【要約】
【課題】ユーザに負担をかけずに文字認識モードの指定
を可能にした、快適な手書き文字環境を提供する。 【解決手段】座標入力装置上でに予め設けられた文字筆
記領域内でペンにより筆記された文字を表すストローク
列をもとに文字認識を行うものであって、少なくとも1
つのストロークからなり、少なくとも認識すべき文字の
種類を指定するためのジェスチャを、前記座標入力装置
上に前記文字筆記領域とは別の領域として用意されたジ
ェスチャ筆記入力のための領域(ジェスチャ筆記領域)
内で、ペンが当該座標入力装置に触れてから離れるまで
の間に当該座標入力装置により検出されるペン先の座標
系列で表現されるストロークの列をもとに認識し、前記
文字筆記領域内でペンにより筆記された文字を表すスト
ローク列をもとに認識すべき文字の種類を、前記認識さ
れたジェスチャに対応する文字の種類に切り替える。
を可能にした、快適な手書き文字環境を提供する。 【解決手段】座標入力装置上でに予め設けられた文字筆
記領域内でペンにより筆記された文字を表すストローク
列をもとに文字認識を行うものであって、少なくとも1
つのストロークからなり、少なくとも認識すべき文字の
種類を指定するためのジェスチャを、前記座標入力装置
上に前記文字筆記領域とは別の領域として用意されたジ
ェスチャ筆記入力のための領域(ジェスチャ筆記領域)
内で、ペンが当該座標入力装置に触れてから離れるまで
の間に当該座標入力装置により検出されるペン先の座標
系列で表現されるストロークの列をもとに認識し、前記
文字筆記領域内でペンにより筆記された文字を表すスト
ローク列をもとに認識すべき文字の種類を、前記認識さ
れたジェスチャに対応する文字の種類に切り替える。
Description
【0001】
【発明の属する技術分野】本発明は、座標入力装置を介
して手書き入力される文字列筆跡(ストローク列)情報
から、随時自動的に文字を切り出して認識し、結果を表
示する文字認識装置に関する。
して手書き入力される文字列筆跡(ストローク列)情報
から、随時自動的に文字を切り出して認識し、結果を表
示する文字認識装置に関する。
【0002】
【従来の技術】従来からある、座標入力タブレット等の
座標入力装置を介して手書き入力される文字列筆跡情報
から、自動的に文字を切り出して認識し、結果を表示す
るオンライン文字認識装置において、例えば、英文字、
数字、平仮名、片仮名、記号などの各種キャラクタの混
在した文字列を筆記入力する場面を考えてみる。
座標入力装置を介して手書き入力される文字列筆跡情報
から、自動的に文字を切り出して認識し、結果を表示す
るオンライン文字認識装置において、例えば、英文字、
数字、平仮名、片仮名、記号などの各種キャラクタの混
在した文字列を筆記入力する場面を考えてみる。
【0003】縦棒「|」の形状を筆記したときに、これ
が英文字の「l(エル)」であるのか、数字の「1(イ
チ)」であるのか、平仮名の「し」であるのか、記号の
「|」であるのかを筆跡の形状だけから判定することは
困難である。このような場合、たとえば認識モードとし
て「英文字、数字、平仮名、片仮名、記号」の5つの文
字種に対応した認識モードを用意しておき、文字筆記前
にこれから筆記する筆跡の認識モードを指定してから縦
棒を筆記すれば所望の文字として正しく認識することが
可能になる。
が英文字の「l(エル)」であるのか、数字の「1(イ
チ)」であるのか、平仮名の「し」であるのか、記号の
「|」であるのかを筆跡の形状だけから判定することは
困難である。このような場合、たとえば認識モードとし
て「英文字、数字、平仮名、片仮名、記号」の5つの文
字種に対応した認識モードを用意しておき、文字筆記前
にこれから筆記する筆跡の認識モードを指定してから縦
棒を筆記すれば所望の文字として正しく認識することが
可能になる。
【0004】従来の文字認識装置では、上記のような認
識モードを指定する手法としては、次のようなものがあ
る。
識モードを指定する手法としては、次のようなものがあ
る。
【0005】(1)認識モード指定ボタンと文字筆記領
域を設け、認識モード指定ボタンにより指定された認識
モードで文字筆記領域に筆記された文字を認識する手
法。
域を設け、認識モード指定ボタンにより指定された認識
モードで文字筆記領域に筆記された文字を認識する手
法。
【0006】(2)文字筆記領域が複数の領域に分割さ
れており、各文字筆記領域には予めそれぞれの認識モー
ドが定められており、各文字筆記領域に筆記された文字
を、その筆記領域ごとに定められた認識モードにより認
識する手法。
れており、各文字筆記領域には予めそれぞれの認識モー
ドが定められており、各文字筆記領域に筆記された文字
を、その筆記領域ごとに定められた認識モードにより認
識する手法。
【0007】(3)認識モードを持たず、筆記された文
字をモードレスで認識する手法。
字をモードレスで認識する手法。
【0008】
【発明が解決しようとする課題】従来の上記(1)の手
法は、画面上に、認識結果表示領域や文字筆記領域を設
ける他に、平仮名認識モード指定ボタン、片仮名認識モ
ード指定ボタン、英文字認識モード指定ボタン、数字認
識モード指定ボタン、記号認識モード指定ボタンなどの
各認識モードの指定ボタンを表示し、これにペンで触れ
ることにより認識モードを切り替えるようになってい
る。この手法では、認識モードが多くなると認識モード
指定ボタンの数も増えるため、ユーザにとって認識モー
ドの指定操作が煩雑となり、快適な文字入力を妨げてい
る。また、携帯情報端末のような小型機器への実装にお
いては、画面の大きさの制約上、認識モード指定ボタン
の増加により各ボタンの大きさを小さくせざるを得ず、
その結果、認識モード指定ボタンを押しづらくなり快適
な文字入力を妨げている。
法は、画面上に、認識結果表示領域や文字筆記領域を設
ける他に、平仮名認識モード指定ボタン、片仮名認識モ
ード指定ボタン、英文字認識モード指定ボタン、数字認
識モード指定ボタン、記号認識モード指定ボタンなどの
各認識モードの指定ボタンを表示し、これにペンで触れ
ることにより認識モードを切り替えるようになってい
る。この手法では、認識モードが多くなると認識モード
指定ボタンの数も増えるため、ユーザにとって認識モー
ドの指定操作が煩雑となり、快適な文字入力を妨げてい
る。また、携帯情報端末のような小型機器への実装にお
いては、画面の大きさの制約上、認識モード指定ボタン
の増加により各ボタンの大きさを小さくせざるを得ず、
その結果、認識モード指定ボタンを押しづらくなり快適
な文字入力を妨げている。
【0009】上記(2)の手法は、画面上に、認識結果
表示領域と、文字筆記領域として、予め認識モードの定
められた複数の領域、すなわち、平仮名筆記領域、片仮
名筆記領域、英文字筆記領域、数字筆記領域、記号筆記
領域を設けている。このように、画面上に認識モード毎
の複数の筆記領域を設け、平仮名筆記領域に筆記された
文字は平仮名として認識し、数字筆記領域に筆記された
文字は数字として認識する、という具合に動作する。こ
の手法では上記(1)のような認識モード指定をボタン
により行う煩雑さを避けることは可能ではあるが、認識
モードが多くなると、モードの数だけ文字筆記領域を用
意せねばならないため、領域による書き分け操作そのも
のがユーザの負担となり快適な文字入力を妨げている。
また、小型機器への実装においては、画面の大きさの制
約上、筆記領域の増加により各筆記領域を小さくせざる
を得ず、小さい筆記領域への文字筆記はユーザの負担と
なり快適な文字入力を妨げている。
表示領域と、文字筆記領域として、予め認識モードの定
められた複数の領域、すなわち、平仮名筆記領域、片仮
名筆記領域、英文字筆記領域、数字筆記領域、記号筆記
領域を設けている。このように、画面上に認識モード毎
の複数の筆記領域を設け、平仮名筆記領域に筆記された
文字は平仮名として認識し、数字筆記領域に筆記された
文字は数字として認識する、という具合に動作する。こ
の手法では上記(1)のような認識モード指定をボタン
により行う煩雑さを避けることは可能ではあるが、認識
モードが多くなると、モードの数だけ文字筆記領域を用
意せねばならないため、領域による書き分け操作そのも
のがユーザの負担となり快適な文字入力を妨げている。
また、小型機器への実装においては、画面の大きさの制
約上、筆記領域の増加により各筆記領域を小さくせざる
を得ず、小さい筆記領域への文字筆記はユーザの負担と
なり快適な文字入力を妨げている。
【0010】上記(3)の手法は、認識モードの指定を
なくすことでユーザの負担を減らそうというものである
が、先の縦棒の例や、数字の「3」と平仮名の「ろ」、
数字の「2」と英文字の「Z」のように、筆跡形状だけ
による文字種の判定は本質的に困難であるため、意図す
る文字と別の認識結果が得られることは避けがたく、そ
の結果、かえってユーザに認識結果修正の負担をかける
こととなり、快適な文字入力を妨げている。
なくすことでユーザの負担を減らそうというものである
が、先の縦棒の例や、数字の「3」と平仮名の「ろ」、
数字の「2」と英文字の「Z」のように、筆跡形状だけ
による文字種の判定は本質的に困難であるため、意図す
る文字と別の認識結果が得られることは避けがたく、そ
の結果、かえってユーザに認識結果修正の負担をかける
こととなり、快適な文字入力を妨げている。
【0011】本発明は上記事情を考慮してなされたもの
で、その目的は、ユーザに負担をかけずに文字認識モー
ドの指定を可能にして、小さな筆記スペースしか用意で
きない携帯可能な小型情報機器においても快適な手書き
文字環境を提供できる文字認識装置を提供することにあ
る。
で、その目的は、ユーザに負担をかけずに文字認識モー
ドの指定を可能にして、小さな筆記スペースしか用意で
きない携帯可能な小型情報機器においても快適な手書き
文字環境を提供できる文字認識装置を提供することにあ
る。
【0012】本発明の他の目的は、ユーザに負担をかけ
ずに、編集処理などの各種の処理の実行を指示すること
ができる文字認識装置を提供することにある。
ずに、編集処理などの各種の処理の実行を指示すること
ができる文字認識装置を提供することにある。
【0013】
【課題を解決するための手段】本発明は、座標入力装置
上でに予め設けられた文字筆記領域内でペンにより筆記
された文字を表すストローク列をもとに文字認識を行う
ものであって、少なくとも1つのストロークからなり、
少なくとも認識すべき文字の種類を指定するためのジェ
スチャを、前記座標入力装置上に前記文字筆記領域とは
別の領域として用意されたジェスチャ筆記入力のための
領域(ジェスチャ筆記領域)内で、ペンが当該座標入力
装置に触れてから離れるまでの間に当該座標入力装置に
より検出されるペン先の座標系列で表現されるストロー
クの列をもとに認識し、前記文字筆記領域内でペンによ
り筆記された文字を表すストローク列をもとに認識すべ
き文字の種類を、前記認識されたジェスチャに対応する
文字の種類に切り替える(すなわち、認識モードを切り
替える)ことを特徴とする。すなわち、文字認識モード
の変更は、文字筆記領域内に文字を筆記するのと同様に
して、ジェスチャ筆記領域内にジェスチャとしての1つ
または複数の文字を書き込むだけでよく、簡単な文字
(好ましくは簡単な記号等)をジェスチャ筆記領域内に
筆記するという通常の文字筆記と同様な手法で文字認識
モードの切り替えが行える。これにより、ユーザは文字
認識モードの指定のための細かく煩雑なボタン操作や、
多数の文字認識モード別筆記領域への書き分けの手間か
ら開放され、文字認識モードの切り替えをストレスなく
行え、快適な文字入力が可能となる。また、文字認識モ
ードにて認識すべき文字の種別が予め絞られているので
(文字認識のために参照する辞書が必要最小限ですむの
で)、文字認識処理が効率よく行える。すなわち、文字
認識処理の速度と文字認識精度の向上が図れる。
上でに予め設けられた文字筆記領域内でペンにより筆記
された文字を表すストローク列をもとに文字認識を行う
ものであって、少なくとも1つのストロークからなり、
少なくとも認識すべき文字の種類を指定するためのジェ
スチャを、前記座標入力装置上に前記文字筆記領域とは
別の領域として用意されたジェスチャ筆記入力のための
領域(ジェスチャ筆記領域)内で、ペンが当該座標入力
装置に触れてから離れるまでの間に当該座標入力装置に
より検出されるペン先の座標系列で表現されるストロー
クの列をもとに認識し、前記文字筆記領域内でペンによ
り筆記された文字を表すストローク列をもとに認識すべ
き文字の種類を、前記認識されたジェスチャに対応する
文字の種類に切り替える(すなわち、認識モードを切り
替える)ことを特徴とする。すなわち、文字認識モード
の変更は、文字筆記領域内に文字を筆記するのと同様に
して、ジェスチャ筆記領域内にジェスチャとしての1つ
または複数の文字を書き込むだけでよく、簡単な文字
(好ましくは簡単な記号等)をジェスチャ筆記領域内に
筆記するという通常の文字筆記と同様な手法で文字認識
モードの切り替えが行える。これにより、ユーザは文字
認識モードの指定のための細かく煩雑なボタン操作や、
多数の文字認識モード別筆記領域への書き分けの手間か
ら開放され、文字認識モードの切り替えをストレスなく
行え、快適な文字入力が可能となる。また、文字認識モ
ードにて認識すべき文字の種別が予め絞られているので
(文字認識のために参照する辞書が必要最小限ですむの
で)、文字認識処理が効率よく行える。すなわち、文字
認識処理の速度と文字認識精度の向上が図れる。
【0014】また、認識されるジェスチャには、少なく
とも編集処理を含む各種の処理の実行を指示するジェス
チャを含み、この処理の実行を指示するジェスチャが認
識されたときには、そのジェスチャに対応する処理の実
行を行うことにより、ユーザに負担をかけずに、編集処
理などの各種の処理の実行を指示することができる。
とも編集処理を含む各種の処理の実行を指示するジェス
チャを含み、この処理の実行を指示するジェスチャが認
識されたときには、そのジェスチャに対応する処理の実
行を行うことにより、ユーザに負担をかけずに、編集処
理などの各種の処理の実行を指示することができる。
【0015】好ましくは、ジェスチャ筆記領域は、前記
座標入力装置の座標入力面のすみに、前記文字筆記領域
に隣接するように設けられている。
座標入力装置の座標入力面のすみに、前記文字筆記領域
に隣接するように設けられている。
【0016】
【発明の実施の形態】以下、本発明の実施の形態につき
図面を参照して説明する。
図面を参照して説明する。
【0017】図1は本発明の一実施形態に係わる文字認
識装置を実現する情報機器のハードウェア構成を示す。
図1の情報機器は、例えば携帯情報端末等の小型情報機
器であり、CPU1、ROM2、RAM3、タブレット
(タブレット装置)4、ディスプレイ(ディスプレイ装
置)5、データ読み込み装置6、記憶媒体7、及びイン
タフェース部(I/F)8,9,10等から構成されて
いる。
識装置を実現する情報機器のハードウェア構成を示す。
図1の情報機器は、例えば携帯情報端末等の小型情報機
器であり、CPU1、ROM2、RAM3、タブレット
(タブレット装置)4、ディスプレイ(ディスプレイ装
置)5、データ読み込み装置6、記憶媒体7、及びイン
タフェース部(I/F)8,9,10等から構成されて
いる。
【0018】CPU1は、図1の情報機器の中枢をな
し、各種データ処理のための演算やシステム全体の制御
を行う演算・制御手段である。ROM2は基本ソフトウ
ェア等が予め格納された不揮発性メモリ(記憶媒体)、
RAM3はCPU1の作業エリア等に利用される揮発性
メモリである。タブレット4は筆跡データの入力が可能
な座標入力装置、ディスプレイ5は各種情報を表示する
液晶ディスプレイ等の表示装置である。
し、各種データ処理のための演算やシステム全体の制御
を行う演算・制御手段である。ROM2は基本ソフトウ
ェア等が予め格納された不揮発性メモリ(記憶媒体)、
RAM3はCPU1の作業エリア等に利用される揮発性
メモリである。タブレット4は筆跡データの入力が可能
な座標入力装置、ディスプレイ5は各種情報を表示する
液晶ディスプレイ等の表示装置である。
【0019】記憶媒体7は、ハードディスク、フロッピ
ー(登録商標)ディスク、CD−ROM、光ディスク等
のコンピュータ読み取り可能な記憶手段である。この記
憶媒体7には、データ及びプログラムが格納されてい
る。データ読み込み装置6は、記憶媒体7に格納されて
いるデータやプログラムを読み込むことのできる、ハー
ドディスクドライブ、フロッピーディスクドライブ、C
D−ROMドライブ、光ディスクドライブ等のデータ読
み込み手段である。
ー(登録商標)ディスク、CD−ROM、光ディスク等
のコンピュータ読み取り可能な記憶手段である。この記
憶媒体7には、データ及びプログラムが格納されてい
る。データ読み込み装置6は、記憶媒体7に格納されて
いるデータやプログラムを読み込むことのできる、ハー
ドディスクドライブ、フロッピーディスクドライブ、C
D−ROMドライブ、光ディスクドライブ等のデータ読
み込み手段である。
【0020】インタフェース部8、インタフェース部9
及びインタフェース部10は、それぞれ、タブレット
4、ディスプレイ5及びデータ読み込み装置6のインタ
フェースをなす。
及びインタフェース部10は、それぞれ、タブレット
4、ディスプレイ5及びデータ読み込み装置6のインタ
フェースをなす。
【0021】記憶媒体7には、上記プログラムとして、
入力筆跡の文字認識を行うための文字認識プログラムが
予め格納されている。この文字認識プログラムは、装置
の起動時にデータ読み込み装置6によって読み込まれて
RAM3に格納される。CPU1はRAM3に格納され
た文字認識プログラムに従って入力筆跡の文字認識処理
を行う。
入力筆跡の文字認識を行うための文字認識プログラムが
予め格納されている。この文字認識プログラムは、装置
の起動時にデータ読み込み装置6によって読み込まれて
RAM3に格納される。CPU1はRAM3に格納され
た文字認識プログラムに従って入力筆跡の文字認識処理
を行う。
【0022】なお、文字認識プログラムがROM2に予
め格納されているものであっても構わない。この場合、
CPU1は当該ROM内の文字認識プログラムに従って
入力筆跡の文字認識処理を行えばよい。また、装置の起
動時に、ROM2からRAM3に文字認識プログラムを
転送し、このRAM3内の文字認識プログラムに従って
入力筆跡の文字認識処理を行うようにしても構わない。
また、文字認識プログラムが通信回線を介してダウンロ
ードされるものであっても構わない。
め格納されているものであっても構わない。この場合、
CPU1は当該ROM内の文字認識プログラムに従って
入力筆跡の文字認識処理を行えばよい。また、装置の起
動時に、ROM2からRAM3に文字認識プログラムを
転送し、このRAM3内の文字認識プログラムに従って
入力筆跡の文字認識処理を行うようにしても構わない。
また、文字認識プログラムが通信回線を介してダウンロ
ードされるものであっても構わない。
【0023】タブレット4は例えば透明であり、ディス
プレイ5の表示画面上に重ねて配置されている。タブレ
ット4の入力面には文字筆記領域301(図5参照)が
設けられている。この筆記領域にユーザが専用ペンPを
利用して文字を筆記すると、その筆跡データ(座標値の
時系列情報)がタブレット装置4により検出され、イン
タフェース部8を通じてCPU1に転送される。
プレイ5の表示画面上に重ねて配置されている。タブレ
ット4の入力面には文字筆記領域301(図5参照)が
設けられている。この筆記領域にユーザが専用ペンPを
利用して文字を筆記すると、その筆跡データ(座標値の
時系列情報)がタブレット装置4により検出され、イン
タフェース部8を通じてCPU1に転送される。
【0024】ペンPがタブレット4に触れてから離れる
までの間の座標データ列、つまり筆跡の座標データ列を
ストロークと呼ぶひとまとまりのデータとして扱い、こ
れをストロークデータとして取得する。
までの間の座標データ列、つまり筆跡の座標データ列を
ストロークと呼ぶひとまとまりのデータとして扱い、こ
れをストロークデータとして取得する。
【0025】ここで、本実施形態に係る文字認識装置の
認識モードについて説明する。
認識モードについて説明する。
【0026】本実施形態に係る文字認識装置には、大き
く分けて2つの認識モードがある。文字認識モードとジ
ェスチャ認識モードである。
く分けて2つの認識モードがある。文字認識モードとジ
ェスチャ認識モードである。
【0027】文字認識モードは、従来同様の文字認識を
行うもので、ここでは、英文字、数字、平仮名、片仮
名、記号といった複数の種類のキャラクタを文字認識す
る。ここでは、認識対象の文字は、上記のような複数種
類のキャラクタである。以後の説明は、認識する文字の
種類は、英文字、数字、平仮名、片仮名、記号といった
種類のキャラクタであるとする。
行うもので、ここでは、英文字、数字、平仮名、片仮
名、記号といった複数の種類のキャラクタを文字認識す
る。ここでは、認識対象の文字は、上記のような複数種
類のキャラクタである。以後の説明は、認識する文字の
種類は、英文字、数字、平仮名、片仮名、記号といった
種類のキャラクタであるとする。
【0028】文字認識モードには、認識対象の文字の種
類に応じて、英文字認識モードと数字認識モードと平仮
名認識モードと片仮名認識モードと記号認識モードとが
ある。例えば、英文字認識モードでは、英文字が認識対
象である。
類に応じて、英文字認識モードと数字認識モードと平仮
名認識モードと片仮名認識モードと記号認識モードとが
ある。例えば、英文字認識モードでは、英文字が認識対
象である。
【0029】ジェスチャとは、少なくとも1つの上記ス
トロークからなり(上記文字であってもよく)、ここで
は、上記のような文字認識モードの設定コマンドや、一
文字消去や大文字から子文字への変換処理などの編集処
理の実行などのコマンドとしての意味をもつものであ
る。どの文字(あるいは、文字の組合せ)をどのような
コマンドに対応させるかは、予め登録されている。
トロークからなり(上記文字であってもよく)、ここで
は、上記のような文字認識モードの設定コマンドや、一
文字消去や大文字から子文字への変換処理などの編集処
理の実行などのコマンドとしての意味をもつものであ
る。どの文字(あるいは、文字の組合せ)をどのような
コマンドに対応させるかは、予め登録されている。
【0030】1つのジェスチャを構成するものは、少な
くとも1つのストロークであり、上記のような文字とし
ての本来の意味をもつものもあるが、上記文字には存在
しないようなパターンのものもあってもよい。しかし、
その実体はストロークであり、上記文字と何ら変わるも
のでもない。従って、ジェスチャを構成する少なくとも
1つのストロークは、広い意味で上記文字としてのキャ
ラクタの一種である。
くとも1つのストロークであり、上記のような文字とし
ての本来の意味をもつものもあるが、上記文字には存在
しないようなパターンのものもあってもよい。しかし、
その実体はストロークであり、上記文字と何ら変わるも
のでもない。従って、ジェスチャを構成する少なくとも
1つのストロークは、広い意味で上記文字としてのキャ
ラクタの一種である。
【0031】「ジェスチャ」といえども、その実体は上
記ストロークであり、(しかも上記文字である場合もあ
り)、従って、本実施形態に係る文字認識装置では、ジ
ェスチャは、従来からある文字認識手法により上記文字
(列)と同様にして、文字として認識する。そして、認
識されたジェスチャに対応して予め登録された制御(少
なくとも、認識モードの設定)や処理の実行(少なくと
も編集処理を含む各処理の実行)を行う。
記ストロークであり、(しかも上記文字である場合もあ
り)、従って、本実施形態に係る文字認識装置では、ジ
ェスチャは、従来からある文字認識手法により上記文字
(列)と同様にして、文字として認識する。そして、認
識されたジェスチャに対応して予め登録された制御(少
なくとも、認識モードの設定)や処理の実行(少なくと
も編集処理を含む各処理の実行)を行う。
【0032】図2は図1の情報機器により実現される文
字認識装置の機能構成を示すブロック図である。
字認識装置の機能構成を示すブロック図である。
【0033】この文字認識装置は、図1中のタブレット
4に相当する手書き文字入力装置101と、筆跡情報取
得部102、認識部103、認識結果表示部104の文
字認識のための基本的な各機能部と、筆跡領域判定部1
05と認識モード切替部106と認識結果編集部107
といった各機能部と、さらに、文字構造辞書108と文
字間構造辞書109とジェスチャ認識辞書110の各辞
書と、図1中のディスプレイ5に相当するディスプレイ
112とから構成される。
4に相当する手書き文字入力装置101と、筆跡情報取
得部102、認識部103、認識結果表示部104の文
字認識のための基本的な各機能部と、筆跡領域判定部1
05と認識モード切替部106と認識結果編集部107
といった各機能部と、さらに、文字構造辞書108と文
字間構造辞書109とジェスチャ認識辞書110の各辞
書と、図1中のディスプレイ5に相当するディスプレイ
112とから構成される。
【0034】筆跡情報取得部102、認識部103、認
識結果表示部104は、図1中のCPU1がRAM3に
格納された文字認識プログラムを読み込み、実行するこ
とにより実現される。文字認識処理の際、発生する(生
成される)各種データは、例えばRAM3上に一時記憶
されるようになっている。
識結果表示部104は、図1中のCPU1がRAM3に
格納された文字認識プログラムを読み込み、実行するこ
とにより実現される。文字認識処理の際、発生する(生
成される)各種データは、例えばRAM3上に一時記憶
されるようになっている。
【0035】文字構造辞書108、文字間構造辞書10
9、ジェスチャ認識辞書110は、上記文字認識プログ
ラムと共に例えば図1中の記憶媒体7に予め格納されて
おり、当該プログラムがデータ読み込み装置6によって
読み込まれてRAM3に格納される際に、このRAM3
に格納される。なお、これら辞書108〜110をRO
M2に予め格納しておくことも可能である。
9、ジェスチャ認識辞書110は、上記文字認識プログ
ラムと共に例えば図1中の記憶媒体7に予め格納されて
おり、当該プログラムがデータ読み込み装置6によって
読み込まれてRAM3に格納される際に、このRAM3
に格納される。なお、これら辞書108〜110をRO
M2に予め格納しておくことも可能である。
【0036】手書き文字入力装置101は、例えばタブ
レットであり、ペンPが当該タブレットに触れている間
のペン先の位置を表す2次元座標データを一定時間間隔
でサンプリングする。
レットであり、ペンPが当該タブレットに触れている間
のペン先の位置を表す2次元座標データを一定時間間隔
でサンプリングする。
【0037】なお、本実施形態ではタブレット上には、
少なくとも、ユーザが文字を筆記するための文字筆記領
域と、ユーザがこの文字筆記領域に文字を筆記するのと
同様にしてジェスチャとして予め定義された(登録され
た)ストローク(文字の場合もある)を入力するための
ジェスチャ筆記領域とが設けられている(図5参照)。
この2つの領域は互いに重なり合わないように設けられ
ている。手書き文字入力装置(すなわち、タブレット)
101で得られた座標データは筆跡情報取得部102に
送られる。
少なくとも、ユーザが文字を筆記するための文字筆記領
域と、ユーザがこの文字筆記領域に文字を筆記するのと
同様にしてジェスチャとして予め定義された(登録され
た)ストローク(文字の場合もある)を入力するための
ジェスチャ筆記領域とが設けられている(図5参照)。
この2つの領域は互いに重なり合わないように設けられ
ている。手書き文字入力装置(すなわち、タブレット)
101で得られた座標データは筆跡情報取得部102に
送られる。
【0038】筆跡情報取得部102は、ペンPがタブレ
ットに触れてから離れるまでの間の座標データ列、つま
り筆跡の座標データ列をストロークと呼ぶひとまとまり
のデータとして扱い、これをストロークデータとして取
得する。
ットに触れてから離れるまでの間の座標データ列、つま
り筆跡の座標データ列をストロークと呼ぶひとまとまり
のデータとして扱い、これをストロークデータとして取
得する。
【0039】なお、上記したように、タブレット上に
は、文字筆記領域とジェスチャ筆記領域とが互いに重な
り合わないように設けられている。従って、どちらの領
域に筆記されたストロークであるかは、その最初の(す
なわち、ペンPがタブレットに触れた時点の)座標デー
タから、あるいは、ストロークデータ全体から容易に判
断できる。このように、筆跡情報取得部102で取得さ
れたストロークデータから、その筆跡(ストローク)が
どちらの領域上で筆記されたものかを判定するのが、筆
跡領域判定部105である。
は、文字筆記領域とジェスチャ筆記領域とが互いに重な
り合わないように設けられている。従って、どちらの領
域に筆記されたストロークであるかは、その最初の(す
なわち、ペンPがタブレットに触れた時点の)座標デー
タから、あるいは、ストロークデータ全体から容易に判
断できる。このように、筆跡情報取得部102で取得さ
れたストロークデータから、その筆跡(ストローク)が
どちらの領域上で筆記されたものかを判定するのが、筆
跡領域判定部105である。
【0040】認識モード切替部106の第1の機能は、
筆跡領域判定部105の判定結果に基づき、認識部10
3の認識モードを切り替えることである。すなわち、筆
跡領域判定部105で、ペンPがタブレットに触れた領
域が(ストロークデータから)文字筆記領域であると判
定したときには、認識部103を通常の文字認識モード
に切り替え、ジェスチャ筆記領域であると判定したとき
には、認識部103をジェスチャ認識モードに切り替え
る。認識モード切替部106が認識モードを切り替える
とは、認識部103が文字認識時に用いる辞書を切り替
えるということである。
筆跡領域判定部105の判定結果に基づき、認識部10
3の認識モードを切り替えることである。すなわち、筆
跡領域判定部105で、ペンPがタブレットに触れた領
域が(ストロークデータから)文字筆記領域であると判
定したときには、認識部103を通常の文字認識モード
に切り替え、ジェスチャ筆記領域であると判定したとき
には、認識部103をジェスチャ認識モードに切り替え
る。認識モード切替部106が認識モードを切り替える
とは、認識部103が文字認識時に用いる辞書を切り替
えるということである。
【0041】文字認識モードでは、さらに、例えば、英
文字認識モード、数字認識モード、平仮名認識モード、
片仮名認識モード、記号認識モードといったように、詳
細なモードが用意されている。このいずれかのモードを
設定するために、前述の「ジェスチャ」を用いる。
文字認識モード、数字認識モード、平仮名認識モード、
片仮名認識モード、記号認識モードといったように、詳
細なモードが用意されている。このいずれかのモードを
設定するために、前述の「ジェスチャ」を用いる。
【0042】さて、筆跡情報取得部102でストローク
データが取得されるたびに、それは認識部103に送ら
れるようになっている。
データが取得されるたびに、それは認識部103に送ら
れるようになっている。
【0043】認識部103は、ペンPがタブレットに触
れた時点では、認識モード切替部106により、文字認
識モードかジェスチャ認識モードのいずれかに設定され
ている。文字認識モードであれば、さらに、英文字認識
モード、数字認識モード、平仮名認識モード、片仮名認
識モード、記号認識モードのいずれかに設定されてい
る。
れた時点では、認識モード切替部106により、文字認
識モードかジェスチャ認識モードのいずれかに設定され
ている。文字認識モードであれば、さらに、英文字認識
モード、数字認識モード、平仮名認識モード、片仮名認
識モード、記号認識モードのいずれかに設定されてい
る。
【0044】文字認識モードの場合には、認識部103
は、文字構造辞書108と文字間構造辞書109を用い
て文字認識を行い、ジェスチャ認識モードの場合には、
認識部103は、ジェスチャ認識辞書110を用いて文
字認識を行う。
は、文字構造辞書108と文字間構造辞書109を用い
て文字認識を行い、ジェスチャ認識モードの場合には、
認識部103は、ジェスチャ認識辞書110を用いて文
字認識を行う。
【0045】文字構造辞書108および文字間構造辞書
109には、それぞれ、英文字用、数字用、平仮名用、
片仮名用、記号用といった、認識すべきキャラクタの種
類に応じた複数の文字間構造辞書から構成されている。
そして、文字認識モードの上記いずれかの認識モードで
は、そのモードで認識すべきキャラクタの種類に応じた
辞書を用いて文字認識を行うようになっている。すなわ
ち、平仮名認識モードでは、文字筆記領域内にストロー
クデータが入力するたびに、それまでに入力されたスト
ロークデータから、平仮名用の文字構造辞書108と文
字間構造辞書109とを用いて、最適な文字列を認識す
る。
109には、それぞれ、英文字用、数字用、平仮名用、
片仮名用、記号用といった、認識すべきキャラクタの種
類に応じた複数の文字間構造辞書から構成されている。
そして、文字認識モードの上記いずれかの認識モードで
は、そのモードで認識すべきキャラクタの種類に応じた
辞書を用いて文字認識を行うようになっている。すなわ
ち、平仮名認識モードでは、文字筆記領域内にストロー
クデータが入力するたびに、それまでに入力されたスト
ロークデータから、平仮名用の文字構造辞書108と文
字間構造辞書109とを用いて、最適な文字列を認識す
る。
【0046】文字構造辞書108は、認識対象となる各
文字の構造が表現されたデータ(文字構造辞書情報)、
すなわち、各文字について、その文字を構成するストロ
ークの形状やストローク間の位置関係(構造)などの特
徴情報を登録した辞書である。例えば、平仮名用の文字
構造辞書は、平仮名を構成するストロークの形状やスト
ローク間の位置関係(構造)などの特徴情報が登録され
ている。同様に、英文字用、数字用、片仮名用、記号用
の文字構造辞書も、英文字、数字、片仮名、記号のそれ
ぞれを構成するストロークの形状やストローク間の位置
関係(構造)などの特徴情報が登録されている。
文字の構造が表現されたデータ(文字構造辞書情報)、
すなわち、各文字について、その文字を構成するストロ
ークの形状やストローク間の位置関係(構造)などの特
徴情報を登録した辞書である。例えば、平仮名用の文字
構造辞書は、平仮名を構成するストロークの形状やスト
ローク間の位置関係(構造)などの特徴情報が登録され
ている。同様に、英文字用、数字用、片仮名用、記号用
の文字構造辞書も、英文字、数字、片仮名、記号のそれ
ぞれを構成するストロークの形状やストローク間の位置
関係(構造)などの特徴情報が登録されている。
【0047】文字間構造辞書109は、文字構造辞書1
08に登録された複数の文字のうちの続けて筆記される
各2文字の組み合わせについて、その2文字の間の構造
関係が表現されたデータ(文字間辞書情報)を登録した
辞書である。例えば、平仮名用の文字間構造辞書は、平
仮名用の文字構造辞書108に登録された複数の平仮名
文字のうちの続けて筆記される各2文字の組み合わせに
ついて、その2文字の間の構造関係が表現されたデータ
(文字間辞書情報)を登録した辞書である。同様に、英
文字用、数字用、片仮名用、記号用の文字間構造辞書
も、英文字用、数字用、片仮名用、記号用のそれぞれの
文字構造辞書108に登録された複数の文字のうちの続
けて筆記される各2文字の組み合わせについて、その2
文字の間の構造関係が表現されたデータ(文字間辞書情
報)を登録した辞書である。
08に登録された複数の文字のうちの続けて筆記される
各2文字の組み合わせについて、その2文字の間の構造
関係が表現されたデータ(文字間辞書情報)を登録した
辞書である。例えば、平仮名用の文字間構造辞書は、平
仮名用の文字構造辞書108に登録された複数の平仮名
文字のうちの続けて筆記される各2文字の組み合わせに
ついて、その2文字の間の構造関係が表現されたデータ
(文字間辞書情報)を登録した辞書である。同様に、英
文字用、数字用、片仮名用、記号用の文字間構造辞書
も、英文字用、数字用、片仮名用、記号用のそれぞれの
文字構造辞書108に登録された複数の文字のうちの続
けて筆記される各2文字の組み合わせについて、その2
文字の間の構造関係が表現されたデータ(文字間辞書情
報)を登録した辞書である。
【0048】タブレット上の文字筆記領域、ジェスチャ
筆記領域のそれぞれには、連続する2文字が左右に並べ
て筆記される場合もあれば、重ねて筆記される場合(例
えば、ペンで文字を筆記するための文字筆記領域が1文
字分だけである場合)もある。前者の場合の文字間辞書
情報とは、2文字が左右に並べて筆記される場合の一方
の文字のストロークと他方の文字のストロークとの間の
位置関係(構造)の特徴情報であり、後者の場合の文字
間辞書情報とは、2文字が重ねて筆記される場合の一方
の文字のストロークと他方の文字のストロークとの間の
位置関係(構造)の特徴情報である。
筆記領域のそれぞれには、連続する2文字が左右に並べ
て筆記される場合もあれば、重ねて筆記される場合(例
えば、ペンで文字を筆記するための文字筆記領域が1文
字分だけである場合)もある。前者の場合の文字間辞書
情報とは、2文字が左右に並べて筆記される場合の一方
の文字のストロークと他方の文字のストロークとの間の
位置関係(構造)の特徴情報であり、後者の場合の文字
間辞書情報とは、2文字が重ねて筆記される場合の一方
の文字のストロークと他方の文字のストロークとの間の
位置関係(構造)の特徴情報である。
【0049】一方、ジェスチャ認識モードの場合には、
認識部103は、ジェスチャ認識辞書110を用いて文
字認識を行うが、このジェスチャ認識辞書110には、
少なくとも1つのストロークからなり(1つまたは複数
の文字からなる場合もあり、また、上記したように、広
い意味の少なくとも1つの文字からなるものなので、以
下、ジェスチャは少なくとも1つの文字からなるという
言い方をする)ジェスチャとそのジェスチャに対応する
コマンドとが登録されたジェスチャ登録辞書110c
と、このジェスチャ登録辞書110cに登録されている
各ジェスチャを構成する文字についての文字構造辞書1
10aと文字間構造辞書110bから構成されている。
認識部103は、ジェスチャ認識辞書110を用いて文
字認識を行うが、このジェスチャ認識辞書110には、
少なくとも1つのストロークからなり(1つまたは複数
の文字からなる場合もあり、また、上記したように、広
い意味の少なくとも1つの文字からなるものなので、以
下、ジェスチャは少なくとも1つの文字からなるという
言い方をする)ジェスチャとそのジェスチャに対応する
コマンドとが登録されたジェスチャ登録辞書110c
と、このジェスチャ登録辞書110cに登録されている
各ジェスチャを構成する文字についての文字構造辞書1
10aと文字間構造辞書110bから構成されている。
【0050】文字構造辞書110aと文字間構造辞書1
10bとは、前述の文字構造辞書108と文字間構造辞
書109とほぼ同様とであり、異なるのは、文字構造辞
書110a、文字間構造辞書110bには、ジェスチャ
登録辞書110cに登録されている各ジェスチャを構成
する文字についての文字構造辞書情報、文字間辞書情報
のみが登録されているということである。
10bとは、前述の文字構造辞書108と文字間構造辞
書109とほぼ同様とであり、異なるのは、文字構造辞
書110a、文字間構造辞書110bには、ジェスチャ
登録辞書110cに登録されている各ジェスチャを構成
する文字についての文字構造辞書情報、文字間辞書情報
のみが登録されているということである。
【0051】すなわち、文字構造辞書110aには、ジ
ェスチャを構成する各文字について、その文字を構成す
るストロークの形状やストローク間の位置関係(構造)
などの特徴情報を登録した辞書である。また、文字間構
造辞書110bは、文字構造辞書110aに登録された
複数の文字のうちの続けて筆記される各2文字の組み合
わせについて、その2文字の間の構造関係が表現された
データ(文字間辞書情報)を登録した辞書である。
ェスチャを構成する各文字について、その文字を構成す
るストロークの形状やストローク間の位置関係(構造)
などの特徴情報を登録した辞書である。また、文字間構
造辞書110bは、文字構造辞書110aに登録された
複数の文字のうちの続けて筆記される各2文字の組み合
わせについて、その2文字の間の構造関係が表現された
データ(文字間辞書情報)を登録した辞書である。
【0052】ジェスチャ認識モードでは、ジェスチャ筆
記領域内にストロークデータが入力するたびに、それま
でに入力されたストロークデータから、ジェスチャ認識
辞書110のうち、まず、文字構造辞書110aと文字
間構造辞書110bとを用いて、最適な文字列(すなわ
ち、ここではジェスチャ)を認識する。そして、その認
識されたジェスチャに対応するコマンドをジェスチャ登
録辞書110cから読みとる。
記領域内にストロークデータが入力するたびに、それま
でに入力されたストロークデータから、ジェスチャ認識
辞書110のうち、まず、文字構造辞書110aと文字
間構造辞書110bとを用いて、最適な文字列(すなわ
ち、ここではジェスチャ)を認識する。そして、その認
識されたジェスチャに対応するコマンドをジェスチャ登
録辞書110cから読みとる。
【0053】ジェスチャ登録辞書の一例を図6に示す。
【0054】図6に示したジェスチャ登録辞書には、ジ
ェスチャとしては例えば「a」を筆記すれば英文字認識
モード、「1」を筆記すれば数字認識モード、「ひ」を
筆記すれば平仮名認識モード、「カ」を筆記すれば片仮
名認識モード、「@」を筆記すれば記号認識モードに
と、それぞれ認識モードの設定を意味するコマンドとし
て登録されている。また、例えば、「右から左方向への
横棒」というジェスチャに対し、「一文字後退削除」を
意味する編集コマンドを対応付けて登録してもよいし、
「大」や「小」というジェスチャに対し、「(英文字認
識モード時)子文字から大文字への変換処理の実行」
「(英文字認識モード時)大文字から子文字への変換処
理の実行」を意味する編集コマンドをそれぞれ対応付け
て登録してもよい。
ェスチャとしては例えば「a」を筆記すれば英文字認識
モード、「1」を筆記すれば数字認識モード、「ひ」を
筆記すれば平仮名認識モード、「カ」を筆記すれば片仮
名認識モード、「@」を筆記すれば記号認識モードに
と、それぞれ認識モードの設定を意味するコマンドとし
て登録されている。また、例えば、「右から左方向への
横棒」というジェスチャに対し、「一文字後退削除」を
意味する編集コマンドを対応付けて登録してもよいし、
「大」や「小」というジェスチャに対し、「(英文字認
識モード時)子文字から大文字への変換処理の実行」
「(英文字認識モード時)大文字から子文字への変換処
理の実行」を意味する編集コマンドをそれぞれ対応付け
て登録してもよい。
【0055】例えば、ジェスチャ筆記領域内に入力され
たストロークデータから、ジェスチャ認識辞書110の
うち、まず、文字構造辞書110aと文字間構造辞書1
10bとを用いて、「ひ」というジェスチャを認識する
と、ジェスチャ登録辞書110cから、その認識された
ジェスチャ「ひ」に対応するコマンドが「平仮名認識モ
ードの設定」であることを読みとることができる。
たストロークデータから、ジェスチャ認識辞書110の
うち、まず、文字構造辞書110aと文字間構造辞書1
10bとを用いて、「ひ」というジェスチャを認識する
と、ジェスチャ登録辞書110cから、その認識された
ジェスチャ「ひ」に対応するコマンドが「平仮名認識モ
ードの設定」であることを読みとることができる。
【0056】1つまたは複数の文字を組み合わせてなる
複数のジェスチャを登録し、それぞれに、図6に示した
ようなコマンドや、それ以外の種々のコマンドを対応付
けることもできる。
複数のジェスチャを登録し、それぞれに、図6に示した
ようなコマンドや、それ以外の種々のコマンドを対応付
けることもできる。
【0057】認識部103で認識されたジェスチャが、
認識モードの設定コマンドである場合には当該コマンド
は認識モード切替部106に渡され、各種処理の実行を
指示するコマンド(ここでは、そのうちの一例として、
編集処理の実行を指示するコマンド)である場合には当
該コマンドは認識結果編集部107へ渡される。
認識モードの設定コマンドである場合には当該コマンド
は認識モード切替部106に渡され、各種処理の実行を
指示するコマンド(ここでは、そのうちの一例として、
編集処理の実行を指示するコマンド)である場合には当
該コマンドは認識結果編集部107へ渡される。
【0058】認識モード切替部106の第2の機能は、
認識部103での認識結果としての認識モードの設定コ
マンドを受け取り、そのコマンドに対応する認識モード
に認識部103の認識モードを切り替えることである。
すなわち、英文字認識モードの設定コマンドであれば認
識部103を英文字認識モードに切り替え、数字認識モ
ードの設定コマンドであれば認識部103を数字認識モ
ードに切り替え、平仮名認識モードの設定コマンドであ
れば認識部103を平仮名認識モードに切り替え、片仮
名認識モードの設定コマンドであれば認識部103を片
仮名認識モードに切り替え、記号認識モードの設定コマ
ンドであれば認識部103を記号認識モードに切り替え
る。
認識部103での認識結果としての認識モードの設定コ
マンドを受け取り、そのコマンドに対応する認識モード
に認識部103の認識モードを切り替えることである。
すなわち、英文字認識モードの設定コマンドであれば認
識部103を英文字認識モードに切り替え、数字認識モ
ードの設定コマンドであれば認識部103を数字認識モ
ードに切り替え、平仮名認識モードの設定コマンドであ
れば認識部103を平仮名認識モードに切り替え、片仮
名認識モードの設定コマンドであれば認識部103を片
仮名認識モードに切り替え、記号認識モードの設定コマ
ンドであれば認識部103を記号認識モードに切り替え
る。
【0059】認識部103は、認識モード切替部106
により、英文字認識モードに切り替えられると、それ以
後に、文字筆記領域内にストロークデータが入力するた
びに、それまでに入力されたストロークデータから、英
文字用の文字構造辞書108と文字間構造辞書109と
を用いて、最適な文字列を認識する。このように、認識
モード切替部106が、認識部103を文字認識モード
のうちのいずれかの認識モードに切り替えるということ
は、認識部103で文字認識の際に用いる辞書を、当該
認識モードに対応する辞書に切り替えるということであ
る。
により、英文字認識モードに切り替えられると、それ以
後に、文字筆記領域内にストロークデータが入力するた
びに、それまでに入力されたストロークデータから、英
文字用の文字構造辞書108と文字間構造辞書109と
を用いて、最適な文字列を認識する。このように、認識
モード切替部106が、認識部103を文字認識モード
のうちのいずれかの認識モードに切り替えるということ
は、認識部103で文字認識の際に用いる辞書を、当該
認識モードに対応する辞書に切り替えるということであ
る。
【0060】認識結果表示部104は、認識部103で
求められた最適な文字列をディスプレイ112に出力す
る。認識部103が文字認識モードの場合はもちろんの
こと、ジェスチャ認識モードの場合にも、その認識され
た文字列をディスプレイ112上の所定の領域に表示す
ることが望ましい。
求められた最適な文字列をディスプレイ112に出力す
る。認識部103が文字認識モードの場合はもちろんの
こと、ジェスチャ認識モードの場合にも、その認識され
た文字列をディスプレイ112上の所定の領域に表示す
ることが望ましい。
【0061】なお、タブレットの文字筆記領域、ジェス
チャ筆記領域のそれぞれには、複数文字分の筆記領域が
確保されているものと、1文字分の筆記領域のみしか確
保されていないものもあるが、いずれの場合であっても
本実施形態は適用可能である。両者の異なる点は、上記
の文字間辞書情報のみである。
チャ筆記領域のそれぞれには、複数文字分の筆記領域が
確保されているものと、1文字分の筆記領域のみしか確
保されていないものもあるが、いずれの場合であっても
本実施形態は適用可能である。両者の異なる点は、上記
の文字間辞書情報のみである。
【0062】認識結果編集部107は、認識結果表示部
104でディスプレイ上の所定の領域に表示された文字
を、認識部103から渡された編集コマンドに対応した
操作を行う。例えば、ユーザが、ジェスチャ筆記領域内
に「右から左方向への横棒」というジェスチャを筆記
し、その結果、上記の「一文字後退削除」を意味する編
集コマンドが認識されたときには、ディスプレイ上の現
在のカーソル位置のすぐ左側にある1文字を削除する。
すなわち、後述する認識結果バッファ210(図4参
照)から最後尾の1文字を削除する。
104でディスプレイ上の所定の領域に表示された文字
を、認識部103から渡された編集コマンドに対応した
操作を行う。例えば、ユーザが、ジェスチャ筆記領域内
に「右から左方向への横棒」というジェスチャを筆記
し、その結果、上記の「一文字後退削除」を意味する編
集コマンドが認識されたときには、ディスプレイ上の現
在のカーソル位置のすぐ左側にある1文字を削除する。
すなわち、後述する認識結果バッファ210(図4参
照)から最後尾の1文字を削除する。
【0063】図5(a)は図1の情報機器の外観の平面
図であり、図5(b)は、図5(a)のA−A矢示断面
図である。
図であり、図5(b)は、図5(a)のA−A矢示断面
図である。
【0064】図5(a)示すように、情報機器の筐体3
00には窓が設けられていて、この窓内にディスプレイ
5(112)が埋め込まれている。筐体300とディス
プレイ5(112)の境界には窓の内側を囲むように境
界枠305がはめ込まれている図5(a)に示すよう
に、図1の情報機器の主面、即ちディスプレイ5(11
2)の表示画面上に透明なタブレット4(101)が積
層された面には、文字筆記領域301とジェスチャ筆記
領域302と認識結果表示領域303が設けられてい
る。
00には窓が設けられていて、この窓内にディスプレイ
5(112)が埋め込まれている。筐体300とディス
プレイ5(112)の境界には窓の内側を囲むように境
界枠305がはめ込まれている図5(a)に示すよう
に、図1の情報機器の主面、即ちディスプレイ5(11
2)の表示画面上に透明なタブレット4(101)が積
層された面には、文字筆記領域301とジェスチャ筆記
領域302と認識結果表示領域303が設けられてい
る。
【0065】文字筆記領域301は、ユーザがペンPで
タブレット4(101)に文字を筆記するためのもの
で、ジェスチャ筆記領域302は、ユーザがペンPでタ
ブレット4(101)にジェスチャを筆記するためのも
のである。
タブレット4(101)に文字を筆記するためのもの
で、ジェスチャ筆記領域302は、ユーザがペンPでタ
ブレット4(101)にジェスチャを筆記するためのも
のである。
【0066】認識結果表示領域303には、文字筆記領
域301とジェスチャ筆記領域302に筆記された筆跡
を文字列として認識した結果311、312と、文字挿
入位置を示すカーソルCとを表示するようになってい
る。認識結果311は、文字筆記領域301に筆記され
た筆跡を文字列として認識した結果であり、認識結果3
12は、ジェスチャ筆記領域302に筆記された筆跡
(すなわち、ジェスチャ)を文字列として認識した結果
である。
域301とジェスチャ筆記領域302に筆記された筆跡
を文字列として認識した結果311、312と、文字挿
入位置を示すカーソルCとを表示するようになってい
る。認識結果311は、文字筆記領域301に筆記され
た筆跡を文字列として認識した結果であり、認識結果3
12は、ジェスチャ筆記領域302に筆記された筆跡
(すなわち、ジェスチャ)を文字列として認識した結果
である。
【0067】図5(a)では、ディスプレイ5(11
2)の表示画面全面に透明なタブレット4(101)を
積層している。
2)の表示画面全面に透明なタブレット4(101)を
積層している。
【0068】ジェスチャ筆記領域302は、タブレット
の積層された表示画面のコーナーエリアに設けられてい
ることが望ましい。また、ジェスチャ筆記領域302
は、文字筆記領域301に隣接するように設けられてい
ることが好ましい。例えば、図5(a)に示すように、
ジェスチャ筆記領域302と文字筆記領域301は、デ
ィスプレイ5(112)の下方に、その下辺に沿って2
つ並べて設けられている。しかも、ジェスチャ筆記領域
302は、ディスプレイ5(112)のコーナーに設け
られている。図5(b)に示すように、ジェスチャ筆記
領域302の範囲は、紙面に向かって右側および下側
は、境界枠305に至るまでの範囲であり、紙面に向か
って左側は、文字筆記領域301に至るまでの範囲であ
る。
の積層された表示画面のコーナーエリアに設けられてい
ることが望ましい。また、ジェスチャ筆記領域302
は、文字筆記領域301に隣接するように設けられてい
ることが好ましい。例えば、図5(a)に示すように、
ジェスチャ筆記領域302と文字筆記領域301は、デ
ィスプレイ5(112)の下方に、その下辺に沿って2
つ並べて設けられている。しかも、ジェスチャ筆記領域
302は、ディスプレイ5(112)のコーナーに設け
られている。図5(b)に示すように、ジェスチャ筆記
領域302の範囲は、紙面に向かって右側および下側
は、境界枠305に至るまでの範囲であり、紙面に向か
って左側は、文字筆記領域301に至るまでの範囲であ
る。
【0069】図5に示したように、ジェスチャ筆記領域
302が、筐体300に設けられた窓の紙面に向かって
左下のコーナーエリアに設けられるとともに、ジェスチ
ャ筆記領域302の紙面に向かって右側に、文字筆記領
域301がジェスチャ筆記領域302と隣接して設けら
れていることにより、ユーザはジェスチャを筆記しよう
として、ジェスチャ筆記領域302へのペンPの移動を
視線で追うという細かい注意を払うことなく、ジェスチ
ャ筆記領域302は、「(紙面に向かって)右下のコー
ナーエリアにある」という大まかな空間把握で、ペンを
その見当に移動させれば、ジェスチャの入力をすること
が可能となる。したがって、文字筆記領域301とジェ
スチャ筆記領域302の間のペンPの行き来きに伴うユ
ーザの負担を軽減し、快適な文字入力手段を提供するこ
とができる。
302が、筐体300に設けられた窓の紙面に向かって
左下のコーナーエリアに設けられるとともに、ジェスチ
ャ筆記領域302の紙面に向かって右側に、文字筆記領
域301がジェスチャ筆記領域302と隣接して設けら
れていることにより、ユーザはジェスチャを筆記しよう
として、ジェスチャ筆記領域302へのペンPの移動を
視線で追うという細かい注意を払うことなく、ジェスチ
ャ筆記領域302は、「(紙面に向かって)右下のコー
ナーエリアにある」という大まかな空間把握で、ペンを
その見当に移動させれば、ジェスチャの入力をすること
が可能となる。したがって、文字筆記領域301とジェ
スチャ筆記領域302の間のペンPの行き来きに伴うユ
ーザの負担を軽減し、快適な文字入力手段を提供するこ
とができる。
【0070】また、図5に示したように、ジェスチャ筆
記領域302を文字筆記領域301の紙面に向かって右
側に隣接するように、しかも、ジェスチャ筆記領域30
2の紙面に向かって左側および下側は、境界枠305に
至るまでをジェスチャ筆記領域302とすることで、文
字筆記領域301で文字を筆記した後、画面上をジェス
チャ筆記領域302のある方向(例えば、この場合、紙
面に向かって右側)に向かってペンPを滑らせれば、ペ
ンPが境界枠305にぶつかるため、ユーザはペンPが
ジェスチャ筆記領域302内にあることを視線に頼らず
とも触覚により容易に把握することができ、さらに快適
な入力が可能となる。
記領域302を文字筆記領域301の紙面に向かって右
側に隣接するように、しかも、ジェスチャ筆記領域30
2の紙面に向かって左側および下側は、境界枠305に
至るまでをジェスチャ筆記領域302とすることで、文
字筆記領域301で文字を筆記した後、画面上をジェス
チャ筆記領域302のある方向(例えば、この場合、紙
面に向かって右側)に向かってペンPを滑らせれば、ペ
ンPが境界枠305にぶつかるため、ユーザはペンPが
ジェスチャ筆記領域302内にあることを視線に頼らず
とも触覚により容易に把握することができ、さらに快適
な入力が可能となる。
【0071】次に、図2に示したような構成の文字認識
装置における文字認識処理の手順について、図3のフロ
ーチャートを参照して説明する。
装置における文字認識処理の手順について、図3のフロ
ーチャートを参照して説明する。
【0072】ステップS1では、文字筆記領域301あ
るいはジェスチャ筆記領域302内で、ストロークが1
本筆記されると、そのストロークの座標データ列、即ち
ストロークデータが、筆跡情報取得部102によって取
り込まれて、筆跡領域判定部105と認識部103との
それぞれに送られる。
るいはジェスチャ筆記領域302内で、ストロークが1
本筆記されると、そのストロークの座標データ列、即ち
ストロークデータが、筆跡情報取得部102によって取
り込まれて、筆跡領域判定部105と認識部103との
それぞれに送られる。
【0073】まず、筆跡領域判定部105で、入力され
たストロークデータから、当該ストロークが筆記された
領域が文字筆記領域301であるかジェスチャ筆記領域
であるかを判断する(ステップS2)。当該入力された
ストロークが文字筆記領域301に筆記されたストロー
クであれば、認識モード切替部106は、認識部103
を文字認識モードに設定する。この場合、認識モード切
替部106は、認識モードを切り替えたときの履歴を記
録しておくようにし、今回文字認識モードに切り替える
ときには、当該履歴を参照し、例えば当該履歴に、前回
文字認識モードであったときに平仮名認識モードであっ
たときには、今回も平仮名認識モードに認識部103を
設定するようにしてもよい。一方、当該入力されたスト
ロークがジェスチャ筆記領域302に筆記されたストロ
ークであれば、認識モード切替部106は、認識部10
3をジェスチャ認識モードに設定する。
たストロークデータから、当該ストロークが筆記された
領域が文字筆記領域301であるかジェスチャ筆記領域
であるかを判断する(ステップS2)。当該入力された
ストロークが文字筆記領域301に筆記されたストロー
クであれば、認識モード切替部106は、認識部103
を文字認識モードに設定する。この場合、認識モード切
替部106は、認識モードを切り替えたときの履歴を記
録しておくようにし、今回文字認識モードに切り替える
ときには、当該履歴を参照し、例えば当該履歴に、前回
文字認識モードであったときに平仮名認識モードであっ
たときには、今回も平仮名認識モードに認識部103を
設定するようにしてもよい。一方、当該入力されたスト
ロークがジェスチャ筆記領域302に筆記されたストロ
ークであれば、認識モード切替部106は、認識部10
3をジェスチャ認識モードに設定する。
【0074】入力されたストロークデータが文字筆記領
域301に筆記されたストロークのものであるならば、
ステップS3へ進む。このとき、認識部103は、例え
ば、上記のようにして、平仮名認識モードに設定されて
いるので、それまでに入力されたストロークデータか
ら、平仮名用の文字構造辞書108および文字間構造辞
書109とを用いて、最適な文字列を認識する。例え
ば、この認識処理により、それまでに入力されたストロ
ークのうち確かにその文字字列が筆記されたと断定でき
る認識確定文字と、最もそれらしい文字(認識未確定文
字)と、筆記途中の文字のストローク(認識未確定スト
ローク)とを推定することができる。
域301に筆記されたストロークのものであるならば、
ステップS3へ進む。このとき、認識部103は、例え
ば、上記のようにして、平仮名認識モードに設定されて
いるので、それまでに入力されたストロークデータか
ら、平仮名用の文字構造辞書108および文字間構造辞
書109とを用いて、最適な文字列を認識する。例え
ば、この認識処理により、それまでに入力されたストロ
ークのうち確かにその文字字列が筆記されたと断定でき
る認識確定文字と、最もそれらしい文字(認識未確定文
字)と、筆記途中の文字のストローク(認識未確定スト
ローク)とを推定することができる。
【0075】ステップS4では、認識結果表示部104
は、認識部103で認識された最適な文字列(例えば、
認識確定文字列と認識未確定文字列)をディスプレイ1
12に表示する。
は、認識部103で認識された最適な文字列(例えば、
認識確定文字列と認識未確定文字列)をディスプレイ1
12に表示する。
【0076】以上のステップS1〜S4を、ストローク
の入力が終了するまで、あるいは、それまでに入力され
た全ての入力ストロークが認識確定文字列として推定さ
れるまで、あるいは、認識モードが変更されるまで繰り
返す(ステップS5)。これにより、ユーザが文字の区
切りを意識することなく、手書き文字入力装置101に
ただ文字を続けて筆記していくだけで、図2のオンライ
ン文字認識装置では、その筆跡を自動的に文字列として
認識することができる。
の入力が終了するまで、あるいは、それまでに入力され
た全ての入力ストロークが認識確定文字列として推定さ
れるまで、あるいは、認識モードが変更されるまで繰り
返す(ステップS5)。これにより、ユーザが文字の区
切りを意識することなく、手書き文字入力装置101に
ただ文字を続けて筆記していくだけで、図2のオンライ
ン文字認識装置では、その筆跡を自動的に文字列として
認識することができる。
【0077】一方、ステップS2で、入力されたストロ
ークデータがジェスチャ筆記領域302に筆記されたジ
ェスチャのものであるならば、ステップS11へ進む。
このとき、認識部103は、ジェスチャ認識モードに設
定されているので、ステップS11では、それまでに入
力されたストロークデータから、ジェスチャ認識辞書1
10を用いて、最適な文字列を認識する。まず、文字構
造辞書110aと文字間構造辞書110bとを用いて、
最適な文字列(すなわち、ここではジェスチャ)を認識
する。例えば、この認識処理により、それまでに入力さ
れたストロークのうち確かにその文字列が筆記されたと
断定できる認識確定文字と、最もそれらしい文字(認識
未確定文字)と、筆記途中の文字のストローク(認識未
確定ストローク)とを推定することができる。
ークデータがジェスチャ筆記領域302に筆記されたジ
ェスチャのものであるならば、ステップS11へ進む。
このとき、認識部103は、ジェスチャ認識モードに設
定されているので、ステップS11では、それまでに入
力されたストロークデータから、ジェスチャ認識辞書1
10を用いて、最適な文字列を認識する。まず、文字構
造辞書110aと文字間構造辞書110bとを用いて、
最適な文字列(すなわち、ここではジェスチャ)を認識
する。例えば、この認識処理により、それまでに入力さ
れたストロークのうち確かにその文字列が筆記されたと
断定できる認識確定文字と、最もそれらしい文字(認識
未確定文字)と、筆記途中の文字のストローク(認識未
確定ストローク)とを推定することができる。
【0078】ステップS12では、1ストローク入力後
のジェスチャ認識処理により認識確定文字列が更新され
たかどうかを判定する。認識確定文字列が更新された場
合にはステップS14へ、更新されない場合にはステッ
プS13へ進む。
のジェスチャ認識処理により認識確定文字列が更新され
たかどうかを判定する。認識確定文字列が更新された場
合にはステップS14へ、更新されない場合にはステッ
プS13へ進む。
【0079】ステップS13では、最後のストロークが
入力されたからの時間経過を測定し、一定時間以上次の
ストローク入力がない場合にはジェスチャ入力が終了し
たと判定しステップS14へ進む。ストローク入力があ
る場合にはステップS1に戻る。
入力されたからの時間経過を測定し、一定時間以上次の
ストローク入力がない場合にはジェスチャ入力が終了し
たと判定しステップS14へ進む。ストローク入力があ
る場合にはステップS1に戻る。
【0080】ステップS14では、その時点における認
識確定文字列、すなわち、ジェスチャに対応するコマン
ドをジェスチャ登録辞書110cから読みとる。このと
き、ジェスチャとして認識された「最適な文字列」に対
応するコマンドがジェスチャ登録辞書110cに登録さ
れていれば、ステップS15へ進み、登録されていなけ
れば、ステップS16へ進み、そのようなジェスチャは
登録されていないか、あるいは、入力ミス等である可能
性があり、認識できなかった旨のメッセージをディスプ
レイ112に表示する(エラー表示を行う)。
識確定文字列、すなわち、ジェスチャに対応するコマン
ドをジェスチャ登録辞書110cから読みとる。このと
き、ジェスチャとして認識された「最適な文字列」に対
応するコマンドがジェスチャ登録辞書110cに登録さ
れていれば、ステップS15へ進み、登録されていなけ
れば、ステップS16へ進み、そのようなジェスチャは
登録されていないか、あるいは、入力ミス等である可能
性があり、認識できなかった旨のメッセージをディスプ
レイ112に表示する(エラー表示を行う)。
【0081】ステップS15では、認識部103で認識
されたジェスチャが、認識モードの設定コマンドである
場合には当該コマンドは認識モード切替部106に渡さ
れ、編集コマンドである場合には当該コマンドは認識結
果編集部107へ渡される。そして、認識モード切替部
106,認識結果編集部107で、当該コマンドに対応
する制御(例えば、ここでは認識モードの設定)・処理
の実行(例えば、ここでは変種処理の実行)が行われ
る。
されたジェスチャが、認識モードの設定コマンドである
場合には当該コマンドは認識モード切替部106に渡さ
れ、編集コマンドである場合には当該コマンドは認識結
果編集部107へ渡される。そして、認識モード切替部
106,認識結果編集部107で、当該コマンドに対応
する制御(例えば、ここでは認識モードの設定)・処理
の実行(例えば、ここでは変種処理の実行)が行われ
る。
【0082】次に、図3のステップS3やステップS1
1における文字やジェスチャの認識処理について、より
詳細に説明する。前述したように、ジェスチャの実体
は、少なくとも1つのストロークからなる文字なので、
認識に用いる辞書が異なる点以外は、ステップS3とス
テップS11における処理は同様である。また、タブレ
ット101上にストロークが筆記されると、ストローク
筆跡情報取得部102と認識部103を経て文字認識さ
れ、認識結果を認識結果表示部104にて表示されると
いった基本的な構成と処理動作は全く同様である。そこ
で、この基本的な構成と処理動作について説明する。な
お、これは従来技術の範囲であるので、簡単に説明す
る。詳細は、特願2001−274147号に記載され
ている。
1における文字やジェスチャの認識処理について、より
詳細に説明する。前述したように、ジェスチャの実体
は、少なくとも1つのストロークからなる文字なので、
認識に用いる辞書が異なる点以外は、ステップS3とス
テップS11における処理は同様である。また、タブレ
ット101上にストロークが筆記されると、ストローク
筆跡情報取得部102と認識部103を経て文字認識さ
れ、認識結果を認識結果表示部104にて表示されると
いった基本的な構成と処理動作は全く同様である。そこ
で、この基本的な構成と処理動作について説明する。な
お、これは従来技術の範囲であるので、簡単に説明す
る。詳細は、特願2001−274147号に記載され
ている。
【0083】図4は、図2に示した、文字認識の基本構
成(タブレット101、ストローク筆跡情報取得部10
2、認識部103、認識結果表示部104からなる文字
認識とジェスチャ認識に共通する構成)のより詳細な機
能構成を説明するためのブロック図である。
成(タブレット101、ストローク筆跡情報取得部10
2、認識部103、認識結果表示部104からなる文字
認識とジェスチャ認識に共通する構成)のより詳細な機
能構成を説明するためのブロック図である。
【0084】図4に示した文字認識装置は、図2中のタ
ブレット101、図1中のタブレット4に相当するタブ
レット201と、筆跡情報取得部202、認識候補文字
列生成部203、文字列尤度計算部204、入力文字列
推定部205、バッファ更新部206、及び認識結果表
示部207の各機能手段と、ストロークバッファ20
8、認識候補バッファ209及び認識結果バッファ21
0の各バッファと、文字構造辞書211及び文字間構造
辞書212の各辞書と、図2中のディスプレイ112、
図1中のディスプレイ5に相当するディスプレイ213
とから構成される。
ブレット101、図1中のタブレット4に相当するタブ
レット201と、筆跡情報取得部202、認識候補文字
列生成部203、文字列尤度計算部204、入力文字列
推定部205、バッファ更新部206、及び認識結果表
示部207の各機能手段と、ストロークバッファ20
8、認識候補バッファ209及び認識結果バッファ21
0の各バッファと、文字構造辞書211及び文字間構造
辞書212の各辞書と、図2中のディスプレイ112、
図1中のディスプレイ5に相当するディスプレイ213
とから構成される。
【0085】筆跡情報取得部202、認識候補文字列生
成部203、文字列尤度計算部204、入力文字列推定
部205、バッファ更新部206、及び認識結果表示部
207は、図1中のCPU1がRAM3に格納された文
字認識プログラムを読み込み実行することにより実現さ
れる。
成部203、文字列尤度計算部204、入力文字列推定
部205、バッファ更新部206、及び認識結果表示部
207は、図1中のCPU1がRAM3に格納された文
字認識プログラムを読み込み実行することにより実現さ
れる。
【0086】ストロークバッファ208、認識候補バッ
ファ209及び認識結果バッファ210は、例えば図1
中のRAM3上に確保される。
ファ209及び認識結果バッファ210は、例えば図1
中のRAM3上に確保される。
【0087】文字構造辞書211及び文字構造辞書21
2は、上記文字認識プログラムと共に例えば図1中の記
憶媒体7に予め格納されており、当該プログラムがデー
タ読み込み装置6によって読み込まれてRAM3に格納
される際に、このRAM3に格納される。なお、文字構
造辞書211及び文字間構造辞書212をROM2に予
め格納しておくことも可能である。
2は、上記文字認識プログラムと共に例えば図1中の記
憶媒体7に予め格納されており、当該プログラムがデー
タ読み込み装置6によって読み込まれてRAM3に格納
される際に、このRAM3に格納される。なお、文字構
造辞書211及び文字間構造辞書212をROM2に予
め格納しておくことも可能である。
【0088】図4の筆跡情報取得部202は、図2の筆
跡情報取得部102に対応し、図4の認識候補文字列生
成部203と文字列尤度計算部204と入力文字列推定
部205とバッファ更新部206は、図2の認識部10
3に対応し、図4の認識結果表示部207は、図2の認
識結果表示部104に対応する。また、図4の文字構造
辞書211は図2の文字構造辞書108、110aに対
応し、図4の文字間構造辞書212は、図2の文字間構
造辞書109、110bに対応する。
跡情報取得部102に対応し、図4の認識候補文字列生
成部203と文字列尤度計算部204と入力文字列推定
部205とバッファ更新部206は、図2の認識部10
3に対応し、図4の認識結果表示部207は、図2の認
識結果表示部104に対応する。また、図4の文字構造
辞書211は図2の文字構造辞書108、110aに対
応し、図4の文字間構造辞書212は、図2の文字間構
造辞書109、110bに対応する。
【0089】タブレット201は、ペンPが当該タブレ
ット201に触れている間のペン先の位置を表す2次元
座標データを一定時間間隔でサンプリングする。得られ
た座標データは筆跡情報取得部202に送られる。筆跡
情報取得部202は、ペンPがタブレット201に触れ
てから離れるまでの間の座標データ列、つまり筆跡の座
標データ列をストロークと呼ぶひとまとまりのデータと
して扱い、ストロークバッファ208に格納する。
ット201に触れている間のペン先の位置を表す2次元
座標データを一定時間間隔でサンプリングする。得られ
た座標データは筆跡情報取得部202に送られる。筆跡
情報取得部202は、ペンPがタブレット201に触れ
てから離れるまでの間の座標データ列、つまり筆跡の座
標データ列をストロークと呼ぶひとまとまりのデータと
して扱い、ストロークバッファ208に格納する。
【0090】認識候補文字列生成部203は、ストロー
クバッファ208内のストローク(ストロークデータ)
の列に対する認識候補となる認識候補文字列群を生成
し、認識候補バッファ209に格納する。文字列尤度計
算部204は、認識候補バッファ209内の各認識候補
文字列についてその照合用辞書(文字列構造辞書)を文
字構造辞書211と文字間構造辞書212とから作成
し、それとストロークバッファ208中のストローク列
との照合を行う。文字列尤度計算部204は、認識候補
文字列の各々について、ストローク列と認識候補文字列
との照合結果として、当該ストローク列がその文字列で
ある確からしさ(尤度)と、当該ストローク列中のどの
ストロークがどの文字に対応しているかを示す文字切り
出し結果とを取得する。文字列尤度計算部204は、取
得した認識候補文字列毎の照合結果を当該認識候補文字
列と対応付けて認識候補バッファ209に格納する。
クバッファ208内のストローク(ストロークデータ)
の列に対する認識候補となる認識候補文字列群を生成
し、認識候補バッファ209に格納する。文字列尤度計
算部204は、認識候補バッファ209内の各認識候補
文字列についてその照合用辞書(文字列構造辞書)を文
字構造辞書211と文字間構造辞書212とから作成
し、それとストロークバッファ208中のストローク列
との照合を行う。文字列尤度計算部204は、認識候補
文字列の各々について、ストローク列と認識候補文字列
との照合結果として、当該ストローク列がその文字列で
ある確からしさ(尤度)と、当該ストローク列中のどの
ストロークがどの文字に対応しているかを示す文字切り
出し結果とを取得する。文字列尤度計算部204は、取
得した認識候補文字列毎の照合結果を当該認識候補文字
列と対応付けて認識候補バッファ209に格納する。
【0091】入力文字列推定手段205は、認識候補バ
ッファ209内の認識候補文字列とその照合結果から、
認識確定文字列、認識未確定文字列、及び認識未確定ス
トローク列情報を求め、認識結果バッファ210に格納
する。認識確定文字列とは、ストローク列(入力ストロ
ーク列)で構成される文字列のうち、この文字列が入力
されたと断定できる文字列部分である。認識未確定文字
列とは、入力ストローク列で構成される文字列のうち、
断定はできないがこの文字列が入力されたと推測される
文字列部分である。認識未確定ストローク列情報とは、
1文字筆記途中のストロークと推測されるストロークが
入力ストローク列中に存在するかどうかを示す情報であ
る。
ッファ209内の認識候補文字列とその照合結果から、
認識確定文字列、認識未確定文字列、及び認識未確定ス
トローク列情報を求め、認識結果バッファ210に格納
する。認識確定文字列とは、ストローク列(入力ストロ
ーク列)で構成される文字列のうち、この文字列が入力
されたと断定できる文字列部分である。認識未確定文字
列とは、入力ストローク列で構成される文字列のうち、
断定はできないがこの文字列が入力されたと推測される
文字列部分である。認識未確定ストローク列情報とは、
1文字筆記途中のストロークと推測されるストロークが
入力ストローク列中に存在するかどうかを示す情報であ
る。
【0092】認識結果表示部206は、入力文字列推定
部205によって推定された認識結果バッファ210内
の推定入力文字列(認識確定文字列、認識未確定文字
列、及び認識未確定ストローク列情報)をディスプレイ
213に出力する。バッファ更新部207は、認識結果
バッファ210内の情報を基に、ストロークバッファ2
08と認識候補バッファ209とから認識確定文字列に
対応する部分の情報を削除し内容を更新する。
部205によって推定された認識結果バッファ210内
の推定入力文字列(認識確定文字列、認識未確定文字
列、及び認識未確定ストローク列情報)をディスプレイ
213に出力する。バッファ更新部207は、認識結果
バッファ210内の情報を基に、ストロークバッファ2
08と認識候補バッファ209とから認識確定文字列に
対応する部分の情報を削除し内容を更新する。
【0093】図7は図4中のストロークバッファ208
のデータ構造例を示す。ストロークバッファ208に格
納されるストローク列の情報は、当該バッファ208内
のストロークの数(ストローク数)を示すNSTRKとNSTRK
個のストロークデータから構成される。第Iストローク
データ(I=1〜NSTRK)は、それを構成する(座標点の数
を示す)座標点数NPOINT[I]と、NPOINT[I]個のx,y座標
データからなる。ここで、第Iストロークデータの第J点
(J=1〜NPOINT[I])のx,y座標データは、x[I][J],y
[I][J]のように表される。
のデータ構造例を示す。ストロークバッファ208に格
納されるストローク列の情報は、当該バッファ208内
のストロークの数(ストローク数)を示すNSTRKとNSTRK
個のストロークデータから構成される。第Iストローク
データ(I=1〜NSTRK)は、それを構成する(座標点の数
を示す)座標点数NPOINT[I]と、NPOINT[I]個のx,y座標
データからなる。ここで、第Iストロークデータの第J点
(J=1〜NPOINT[I])のx,y座標データは、x[I][J],y
[I][J]のように表される。
【0094】図7は認識候補バッファ209のデータ構
造例を示す。認識候補バッファ209は、ストロークバ
ッファ208内のストローク列に対する認識候補となる
文字列と照合結果とを格納するのに用いられる。本実施
形態において認識候補バッファ209に格納される情報
(認識候補情報)は、候補(認識候補文字列)数を示す
NCANDとNCAND個の候補(候補データ)とから構成され
る。
造例を示す。認識候補バッファ209は、ストロークバ
ッファ208内のストローク列に対する認識候補となる
文字列と照合結果とを格納するのに用いられる。本実施
形態において認識候補バッファ209に格納される情報
(認識候補情報)は、候補(認識候補文字列)数を示す
NCANDとNCAND個の候補(候補データ)とから構成され
る。
【0095】候補#I、即ち第I候補(I=1〜NCAND)のデ
ータは文字切り出し結果を含む。この文字切り出し結果
は、第I候補が認識棄却対象であるかどうかを示す棄却
フラグCNAD_REJFLAG[I]と、その候補を構成する文字列
(認識候補文字列)の文字数CAND_NCODE[I]と、CAND_NC
ODE[I]個の文字(第J文字(J=1〜CAND_NCODE[I]))の
各々の文字構造辞書211中のエントリ番号CAND_REFID
[I][J]と、その候補文字列の総ストローク数CAND_NSTRK
[I]と、その候補文字列の最終文字に対応するストロー
クバッファ208内の入力ストロークの本数CAND_STRKC
TR[I]と、CAND_NCODE[I]個の文字(第J文字)の各々に
対応するストロークバッファ208内の入力ストローク
列の開始ストローク番号CAND_BS[I][J]及び終了ストロ
ーク番号CAND_ES[I][J]とからなる。
ータは文字切り出し結果を含む。この文字切り出し結果
は、第I候補が認識棄却対象であるかどうかを示す棄却
フラグCNAD_REJFLAG[I]と、その候補を構成する文字列
(認識候補文字列)の文字数CAND_NCODE[I]と、CAND_NC
ODE[I]個の文字(第J文字(J=1〜CAND_NCODE[I]))の
各々の文字構造辞書211中のエントリ番号CAND_REFID
[I][J]と、その候補文字列の総ストローク数CAND_NSTRK
[I]と、その候補文字列の最終文字に対応するストロー
クバッファ208内の入力ストロークの本数CAND_STRKC
TR[I]と、CAND_NCODE[I]個の文字(第J文字)の各々に
対応するストロークバッファ208内の入力ストローク
列の開始ストローク番号CAND_BS[I][J]及び終了ストロ
ーク番号CAND_ES[I][J]とからなる。
【0096】第I候補(I=1〜NCAND)のデータは、上記
した文字切り出し結果と、CAND_NCODE[I]個の文字(第J
文字)の文字構造辞書211と対応する入力ストローク
列を照合した結果の尤度の対数値(対数尤度)CAND_L1
[I][J]と、第J文字と第J+1文字の間の文字間構造辞書2
12と対応する入力ストローク間構造特徴(第J文字の
最後のストロークと次の第J+1文字の最初のストローク
との間の構造特徴)を照合した結果の対数尤度CAND_L2
[I][J]と、対数尤度の総和、即ち第I候補の文字列と入
力ストローク列全体とを照合した結果の対数尤度CAND_L
[I]とから構成される。
した文字切り出し結果と、CAND_NCODE[I]個の文字(第J
文字)の文字構造辞書211と対応する入力ストローク
列を照合した結果の尤度の対数値(対数尤度)CAND_L1
[I][J]と、第J文字と第J+1文字の間の文字間構造辞書2
12と対応する入力ストローク間構造特徴(第J文字の
最後のストロークと次の第J+1文字の最初のストローク
との間の構造特徴)を照合した結果の対数尤度CAND_L2
[I][J]と、対数尤度の総和、即ち第I候補の文字列と入
力ストローク列全体とを照合した結果の対数尤度CAND_L
[I]とから構成される。
【0097】図8の例では、認識候補バッファ209内
の候補(認識候補文字列)は第1候補(候補#1)乃至第
10候補(候補#10)の10個存在する。第1候補につ
いては、棄却フラグは0にセットされており、認識候補
文字列は文字構造辞書211の第1エントリ「あ」と第
2エントリ「い」とからなる2文字長の文字列「あい」
である。この認識候補文字列の総ストローク数は5本で
ある。ここでは、認識候補文字列「あい」の最後の文字
「い」の第1ストロークまでが入力されて照合された結
果が格納されている。認識候補文字列「あい」の第1文
字「あ」に対応する入力ストロークは第1ストロークか
ら第3ストロークまでの3本である。認識候補文字列
「あい」の第2文字「い」に対応する入力ストロークは
第4ストロークの1本だけである。つまり「い」の左側
の1画までが入力されている。
の候補(認識候補文字列)は第1候補(候補#1)乃至第
10候補(候補#10)の10個存在する。第1候補につ
いては、棄却フラグは0にセットされており、認識候補
文字列は文字構造辞書211の第1エントリ「あ」と第
2エントリ「い」とからなる2文字長の文字列「あい」
である。この認識候補文字列の総ストローク数は5本で
ある。ここでは、認識候補文字列「あい」の最後の文字
「い」の第1ストロークまでが入力されて照合された結
果が格納されている。認識候補文字列「あい」の第1文
字「あ」に対応する入力ストロークは第1ストロークか
ら第3ストロークまでの3本である。認識候補文字列
「あい」の第2文字「い」に対応する入力ストロークは
第4ストロークの1本だけである。つまり「い」の左側
の1画までが入力されている。
【0098】認識候補文字列「あい」の第1文字「あ」
の文字構造辞書211と、第1ストロークから第3スト
ロークまでの入力ストローク列とを照合した結果の尤度
の対数値(対数尤度)は-0.70である。「あ」と「い」
の間の文字間構造辞書212と、第3ストローク
(「あ」の最後のストローク)と第4ストローク
(「い」の最初のストローク)とのストローク間構造と
の照合をした結果の尤度の対数値(文字間対数尤度)は
-0.36である。「い」の文字構造辞書211中の先頭ス
トローク部分と、入力ストローク列の第4ストロークと
を照合した結果の尤度の対数値(対数尤度)は-0.22で
ある。「あ」の対数尤度、「あ」と「い」の文字間対数
尤度、「い」の最初のストロークの対数尤度を足し合わ
せた全体の対数尤度が-1.28である。
の文字構造辞書211と、第1ストロークから第3スト
ロークまでの入力ストローク列とを照合した結果の尤度
の対数値(対数尤度)は-0.70である。「あ」と「い」
の間の文字間構造辞書212と、第3ストローク
(「あ」の最後のストローク)と第4ストローク
(「い」の最初のストローク)とのストローク間構造と
の照合をした結果の尤度の対数値(文字間対数尤度)は
-0.36である。「い」の文字構造辞書211中の先頭ス
トローク部分と、入力ストローク列の第4ストロークと
を照合した結果の尤度の対数値(対数尤度)は-0.22で
ある。「あ」の対数尤度、「あ」と「い」の文字間対数
尤度、「い」の最初のストロークの対数尤度を足し合わ
せた全体の対数尤度が-1.28である。
【0099】図9は文字構造辞書211のデータ構造例
を示す。文字構造辞書211は認識対象となる文字の構
造が表現されたデータ(文字構造辞書情報)を登録した
辞書である。この文字構造辞書211は、認識対象とな
る文字の数を示すNREFと、NREF個の文字各々の構造辞書
からなる。
を示す。文字構造辞書211は認識対象となる文字の構
造が表現されたデータ(文字構造辞書情報)を登録した
辞書である。この文字構造辞書211は、認識対象とな
る文字の数を示すNREFと、NREF個の文字各々の構造辞書
からなる。
【0100】第I番目(I=1〜NREF)の文字の構造辞書
(辞書#I)は、その文字をコード(例えばSHIFT-JISコ
ード)で表したREF_CODE[I]と、その文字を構成する総
ストローク数REF_NSTRK[I]と、REF_NSTRK[I]個のストロ
ーク(第Jストローク(J=1〜REF_NSTRK[I]))の特徴と
しての形状特徴の平均ベクトルs[I][J][1〜6]及び共分
散ベクトルσ[I][J][1〜6]と、第J-1ストロークと第Jス
トロークとの間のストローク間構造特徴の平均ベクトル
s2[I][J][1〜2]及び共分散ベクトルσ2[I][J][1〜2]と
から構成される。ここでs[I][J][1〜6]はs[I][J][1],s
[I][J][2],…s[I][J][6]からなる6次元ベクトルを表
現するものとする。σ[I][J][1〜6],s2[I][J][1〜2]、
σ2[I][J][1〜2]についても同様のベクトル表現であ
る。ストローク形状特徴とストローク間構造特徴につい
ては後述する。
(辞書#I)は、その文字をコード(例えばSHIFT-JISコ
ード)で表したREF_CODE[I]と、その文字を構成する総
ストローク数REF_NSTRK[I]と、REF_NSTRK[I]個のストロ
ーク(第Jストローク(J=1〜REF_NSTRK[I]))の特徴と
しての形状特徴の平均ベクトルs[I][J][1〜6]及び共分
散ベクトルσ[I][J][1〜6]と、第J-1ストロークと第Jス
トロークとの間のストローク間構造特徴の平均ベクトル
s2[I][J][1〜2]及び共分散ベクトルσ2[I][J][1〜2]と
から構成される。ここでs[I][J][1〜6]はs[I][J][1],s
[I][J][2],…s[I][J][6]からなる6次元ベクトルを表
現するものとする。σ[I][J][1〜6],s2[I][J][1〜2]、
σ2[I][J][1〜2]についても同様のベクトル表現であ
る。ストローク形状特徴とストローク間構造特徴につい
ては後述する。
【0101】図10は文字間構造辞書212のデータ構
造例を示す。文字間構造辞書212は、文字構造辞書2
11に登録されたNREF個の文字(認識可能文字)のうち
の続けて筆記される各2文字の組み合わせについて、そ
の2文字の間の構造関係が表現されたデータ(文字間辞
書情報)を登録した辞書である。図10では、1組の2
文字について、その文字間の構造関係を表す文字間構造
辞書情報のデータ構造を示してある。この文字間構造情
報は、文字間構造特徴の平均ベクトルz[1〜2]と共分散
ベクトルθ[1〜2]とから構成される。文字間構造特徴と
しては、前の文字の最終ストロークと後ろの文字の先頭
ストロークとの間のストローク構造特徴を用いる。
造例を示す。文字間構造辞書212は、文字構造辞書2
11に登録されたNREF個の文字(認識可能文字)のうち
の続けて筆記される各2文字の組み合わせについて、そ
の2文字の間の構造関係が表現されたデータ(文字間辞
書情報)を登録した辞書である。図10では、1組の2
文字について、その文字間の構造関係を表す文字間構造
辞書情報のデータ構造を示してある。この文字間構造情
報は、文字間構造特徴の平均ベクトルz[1〜2]と共分散
ベクトルθ[1〜2]とから構成される。文字間構造特徴と
しては、前の文字の最終ストロークと後ろの文字の先頭
ストロークとの間のストローク構造特徴を用いる。
【0102】次に、以上のように構成された文字認識装
置における文字認識処理の概略手順について、図11に
示したフローチャートを参照して説明する。
置における文字認識処理の概略手順について、図11に
示したフローチャートを参照して説明する。
【0103】ステップ801は、文字認識装置内の各バ
ッファを初期化するステップである。
ッファを初期化するステップである。
【0104】ステップ802では、文字筆記領域301
あるいはジェスチャ筆記領域302内にストロークが1
本筆記されると、そのストロークの座標データ列、即ち
ストロークデータが、筆跡情報取得部202によってス
トロークバッファ208に取り込まれ、当該ストローク
データの特徴抽出がなされる。
あるいはジェスチャ筆記領域302内にストロークが1
本筆記されると、そのストロークの座標データ列、即ち
ストロークデータが、筆跡情報取得部202によってス
トロークバッファ208に取り込まれ、当該ストローク
データの特徴抽出がなされる。
【0105】ステップ803では、ストロークバッファ
208に取り込まれているストローク列に対する認識候
補となり得る候補文字列(認識候補文字列)が認識候補
文字列生成部203によって生成されて認識候補バッフ
ァ209に格納される。
208に取り込まれているストローク列に対する認識候
補となり得る候補文字列(認識候補文字列)が認識候補
文字列生成部203によって生成されて認識候補バッフ
ァ209に格納される。
【0106】ステップ804では、ステップ803で生
成された認識候補バッファ209内の認識候補文字列と
ステップ802で取り込まれたストローク列とが文字列
尤度計算部204によって照合され、その認識候補文字
列としてストローク列が筆記された確からしさが計算さ
れる。
成された認識候補バッファ209内の認識候補文字列と
ステップ802で取り込まれたストローク列とが文字列
尤度計算部204によって照合され、その認識候補文字
列としてストローク列が筆記された確からしさが計算さ
れる。
【0107】ステップ805では、ステップ804での
各認識候補文字列との照合結果に基づき、入力ストロー
ク列のうち確かにその認識候補文字列が筆記されたと断
定できる認識確定文字列部分と、最もそれらしい文字列
(認識未確定文字列)部分と、文字筆記途中のストロー
ク列(認識未確定ストローク列)部分とが、入力文字列
推定部205によって推定される。
各認識候補文字列との照合結果に基づき、入力ストロー
ク列のうち確かにその認識候補文字列が筆記されたと断
定できる認識確定文字列部分と、最もそれらしい文字列
(認識未確定文字列)部分と、文字筆記途中のストロー
ク列(認識未確定ストローク列)部分とが、入力文字列
推定部205によって推定される。
【0108】ステップ806では、ステップ805にお
ける推定結果が認識結果表示部207によって認識結果
表示領域311に表示される。ステップ807,808
では、ストロークバッファ208と認識候補バッファ2
09とがバッファ更新部206によって更新される。
ける推定結果が認識結果表示部207によって認識結果
表示領域311に表示される。ステップ807,808
では、ストロークバッファ208と認識候補バッファ2
09とがバッファ更新部206によって更新される。
【0109】以上のステップ802〜808を、全ての
入力ストローク列が認識確定文字列として推定されるま
で(認識候補バッファ209が空になるまで)繰り返す
(ステップ809)。これにより、ユーザが文字の区切
りを意識することなく、文字筆記領域301あるいはジ
ェスチャ筆記領域302にただ文字を続けて筆記してい
くだけで、図4の文字認識装置では、その筆跡を自動的
に文字列として認識することができる。
入力ストローク列が認識確定文字列として推定されるま
で(認識候補バッファ209が空になるまで)繰り返す
(ステップ809)。これにより、ユーザが文字の区切
りを意識することなく、文字筆記領域301あるいはジ
ェスチャ筆記領域302にただ文字を続けて筆記してい
くだけで、図4の文字認識装置では、その筆跡を自動的
に文字列として認識することができる。
【0110】以上説明したように、上記実施形態によれ
ば、座標入力装置(タブレット)上に文字筆記領域とジ
ェスチャ筆記領域とを設け、文字筆記領域内に筆記され
たストローク列を基に認識すべき文字の種類(例えば、
平仮名、英文字、数字、片仮名、記号のうちの1つ)
を、ジェスチャ筆記領域内に筆記されたストローク列に
基づき認識されたジェスチャによって切り替える(すな
わち、文字認識モードを切り替える)。すなわち、文字
認識モードの変更は、文字筆記領域内に文字を筆記する
のと同様にして、ジェスチャ筆記領域内にジェスチャと
しての1つまたは複数の文字を書き込むだけでよく、簡
単な文字(好ましくは簡単な記号等)をジェスチャ筆記
領域内に筆記するという通常の文字筆記と同様な手法で
文字認識モードの切り替えが行える。これにより、ユー
ザは文字認識モードの指定のための細かく煩雑なボタン
操作や、多数の文字認識モード別筆記領域への書き分け
の手間から開放され、文字認識モードの切り替えをスト
レスなく行え、快適な文字入力が可能となる。また、文
字認識モードにて認識すべき文字の種別が予め絞られて
いるので(文字認識のために参照する辞書が必要最小限
ですむので)、文字認識処理が効率よく行える。すなわ
ち、文字認識処理の速度と文字認識精度の向上が図れ
る。
ば、座標入力装置(タブレット)上に文字筆記領域とジ
ェスチャ筆記領域とを設け、文字筆記領域内に筆記され
たストローク列を基に認識すべき文字の種類(例えば、
平仮名、英文字、数字、片仮名、記号のうちの1つ)
を、ジェスチャ筆記領域内に筆記されたストローク列に
基づき認識されたジェスチャによって切り替える(すな
わち、文字認識モードを切り替える)。すなわち、文字
認識モードの変更は、文字筆記領域内に文字を筆記する
のと同様にして、ジェスチャ筆記領域内にジェスチャと
しての1つまたは複数の文字を書き込むだけでよく、簡
単な文字(好ましくは簡単な記号等)をジェスチャ筆記
領域内に筆記するという通常の文字筆記と同様な手法で
文字認識モードの切り替えが行える。これにより、ユー
ザは文字認識モードの指定のための細かく煩雑なボタン
操作や、多数の文字認識モード別筆記領域への書き分け
の手間から開放され、文字認識モードの切り替えをスト
レスなく行え、快適な文字入力が可能となる。また、文
字認識モードにて認識すべき文字の種別が予め絞られて
いるので(文字認識のために参照する辞書が必要最小限
ですむので)、文字認識処理が効率よく行える。すなわ
ち、文字認識処理の速度と文字認識精度の向上が図れ
る。
【0111】また、文字筆記領域やジェスチャ筆記領域
が1文字分だけであり、2文字が重ねて筆記されるよう
な場合には、前述したように、文字間構造辞書には、2
文字が重ねて筆記される場合の一方の文字のストローク
と他方の文字のストロークとの間の位置関係(構造)の
特徴情報が登録されていればよく、この場合において
も、上記実施形態と同様にして適用可能である。すなわ
ち、本実施形態は、文字筆記領域やジェスチャ筆記領域
が1文字分だけの小さなスペースしか用意できないよう
な小型情報機器等においても適用可能である。しかも、
この場合には、それぞれの筆記領域の大きさを1文字分
とはいいながらも可能な限り大きくとることが可能とな
るため文字(ジェスチャ)の筆記入力がし易くなり、快
適な手書き文字入力手段を提供することができる。
が1文字分だけであり、2文字が重ねて筆記されるよう
な場合には、前述したように、文字間構造辞書には、2
文字が重ねて筆記される場合の一方の文字のストローク
と他方の文字のストロークとの間の位置関係(構造)の
特徴情報が登録されていればよく、この場合において
も、上記実施形態と同様にして適用可能である。すなわ
ち、本実施形態は、文字筆記領域やジェスチャ筆記領域
が1文字分だけの小さなスペースしか用意できないよう
な小型情報機器等においても適用可能である。しかも、
この場合には、それぞれの筆記領域の大きさを1文字分
とはいいながらも可能な限り大きくとることが可能とな
るため文字(ジェスチャ)の筆記入力がし易くなり、快
適な手書き文字入力手段を提供することができる。
【0112】また、文字認識装置の筐体に設けられた窓
に、その表示画面上に透明なタブレットが積層されディ
スプレイが埋め込まれているとき、ジェスチャ筆記領域
は、例えば図5(a)に示すように、タブレットの紙面
に向かって左下のコーナーエリアに設けられるととも
に、ジェスチャ筆記領域の紙面に向かって右側に、文字
筆記領域がジェスチャ筆記領域と隣接して設けられてい
ることにより、ユーザはジェスチャを筆記しようとし
て、ジェスチャ筆記領域へのペンPの移動を視線で追う
という細かい注意を払うことなく、だいたいの見当でペ
ンを紙面に向かって右方向に移動させれば、ジェスチャ
の入力をすることが可能となる。したがって、文字筆記
領域とジェスチャ筆記領域の間のペンPの行き来きに伴
うユーザの負担を軽減し、快適な文字入力手段を提供す
ることができる。
に、その表示画面上に透明なタブレットが積層されディ
スプレイが埋め込まれているとき、ジェスチャ筆記領域
は、例えば図5(a)に示すように、タブレットの紙面
に向かって左下のコーナーエリアに設けられるととも
に、ジェスチャ筆記領域の紙面に向かって右側に、文字
筆記領域がジェスチャ筆記領域と隣接して設けられてい
ることにより、ユーザはジェスチャを筆記しようとし
て、ジェスチャ筆記領域へのペンPの移動を視線で追う
という細かい注意を払うことなく、だいたいの見当でペ
ンを紙面に向かって右方向に移動させれば、ジェスチャ
の入力をすることが可能となる。したがって、文字筆記
領域とジェスチャ筆記領域の間のペンPの行き来きに伴
うユーザの負担を軽減し、快適な文字入力手段を提供す
ることができる。
【0113】上記各手段は、ハードウェア構成によって
も実現できるが、当該手段として機能させるためのプロ
グラムをコンピュータのCPUが読み込み実行すること
によって実現することも可能である。この場合、本発明
の文字認識装置を、携帯情報端末等の情報機器により容
易に実現できる。
も実現できるが、当該手段として機能させるためのプロ
グラムをコンピュータのCPUが読み込み実行すること
によって実現することも可能である。この場合、本発明
の文字認識装置を、携帯情報端末等の情報機器により容
易に実現できる。
【0114】なお、以上の文字認識装置に係る本発明
は、方法(文字認識方法)に係る発明としても成立す
る。
は、方法(文字認識方法)に係る発明としても成立す
る。
【0115】また、本発明は、コンピュータに当該発明
に相当する手順を実行させるための(或いはコンピュー
タを当該発明に相当する各手段として機能させるため
の、或いはコンピュータに当該発明に相当する機能を実
現させるための)プログラムを記憶したコンピュータ読
み取り可能な記憶媒体に係る発明としても成立し、更に
当該プログラム自体に係る発明としても成立する。
に相当する手順を実行させるための(或いはコンピュー
タを当該発明に相当する各手段として機能させるため
の、或いはコンピュータに当該発明に相当する機能を実
現させるための)プログラムを記憶したコンピュータ読
み取り可能な記憶媒体に係る発明としても成立し、更に
当該プログラム自体に係る発明としても成立する。
【0116】なお、本発明は、上記実施形態に限定され
るものではなく、実施段階ではその要旨を逸脱しない範
囲で種々に変形することが可能である。更に、上記実施
形態には種々の段階の発明が含まれており、開示される
複数の構成要件における適宜な組み合わせにより種々の
発明が抽出され得る。例えば、実施形態に示される全構
成要件から幾つかの構成要件が削除されても、発明が解
決しようとする課題の欄で述べた課題の少なくとも1つ
が解決でき、発明の効果の欄で述べられている効果の少
なくとも1つが得られる場合には、この構成要件が削除
された構成が発明として抽出され得る。
るものではなく、実施段階ではその要旨を逸脱しない範
囲で種々に変形することが可能である。更に、上記実施
形態には種々の段階の発明が含まれており、開示される
複数の構成要件における適宜な組み合わせにより種々の
発明が抽出され得る。例えば、実施形態に示される全構
成要件から幾つかの構成要件が削除されても、発明が解
決しようとする課題の欄で述べた課題の少なくとも1つ
が解決でき、発明の効果の欄で述べられている効果の少
なくとも1つが得られる場合には、この構成要件が削除
された構成が発明として抽出され得る。
【0117】
【発明の効果】以上説明したように本発明によれば、ユ
ーザに負担をかけずに文字認識モードの指定を可能にし
て、文字認識精度と文字認識速度の向上が図れるととも
に、小さな筆記スペースしか用意できない携帯可能な小
型情報機器においても快適な手書き文字環境を提供でき
る。
ーザに負担をかけずに文字認識モードの指定を可能にし
て、文字認識精度と文字認識速度の向上が図れるととも
に、小さな筆記スペースしか用意できない携帯可能な小
型情報機器においても快適な手書き文字環境を提供でき
る。
【0118】また、ユーザに負担をかけずに、編集処理
などの各種の処理の実行を指示することができる。
などの各種の処理の実行を指示することができる。
【図1】本発明の一実施形態に係わる文字認識装置を実
現する情報機器のハードウェア構成を示すブロック図。
現する情報機器のハードウェア構成を示すブロック図。
【図2】本発明の一実施形態に係わる文字認識装置の機
能構成を示すブロック図。
能構成を示すブロック図。
【図3】図2の文字認識装置における文字認識処理全体
の手順を説明するためのフローチャート。
の手順を説明するためのフローチャート。
【図4】図1の情報機器により実現される文字認識装置
のより詳細な機能構成を示すブロック図。
のより詳細な機能構成を示すブロック図。
【図5】図1の情報機器の外観を示す図。
【図6】ジェスチャ登録辞書の登録内容の一例を示す
図。
図。
【図7】図4中のストロークバッファ208のデータ構
造例を示す図。
造例を示す図。
【図8】図4中の認識候補バッファ209のデータ構造
例を示す図。
例を示す図。
【図9】図4中の文字構造辞書211のデータ構造例を
示す図。
示す図。
【図10】図4中の文字間構造辞書212のデータ構造
例を示す図。
例を示す図。
【図11】図1の情報機器により実現される図4の文字
認識装置における文字認識処理全体の手順を説明するた
めのフローチャート。
認識装置における文字認識処理全体の手順を説明するた
めのフローチャート。
1…CPU
2…ROM
3…RAM
4,201…タブレット(座標入力装置)
5,213…ディスプレイ(表示装置)
6…データ読み込み装置
7…記憶媒体
101…手書き文字入力装置
102…筆跡情報取得部
103…認識部
104…認識結果表示部
105…筆跡領域判定部
106…認識モード切替部
107…認識結果編集部
108…文字構造辞書
109…文字間構造辞書
110…ジェスチャ認識辞書
112…ディスプレイ
201…タブレット
202…筆跡情報取得手段
203…認識候補文字列生成手段
204…文字列尤度計算手段(照合手段)
205…入力文字列推定手段
206…バッファ更新手段
207…認識結果表示手段
208…ストロークバッファ
209…認識候補バッファ
210…認識結果バッファ
211…文字構造辞書
212…文字間構造辞書
213…ディスプレイ
300…筐体
301…文字筆記領域
302…ジェスチャ筆記領域
303…認識結果表示領域
305…境界枠
303…1文字後退削除ボタン
P…ペン
C…カーソル
Claims (8)
- 【請求項1】座標入力装置上に予め設けられた文字筆記
領域内で、ペンが当該座標入力装置に触れてから離れる
までの間に当該座標入力装置により検出されるペン先の
座標系列で表現されるストロークの列をもとに文字認識
を行う文字認識装置であって、 少なくとも1つのストロークからなり、自装置に対し、
認識対象の文字の種類に応じて異なる認識モードの設定
や、少なくとも編集処理を含む各種処理の実行を指示す
るジェスチャを、前記座標入力装置上に前記文字筆記領
域とは別の領域として用意されたジェスチャ筆記入力の
ための領域内で、ペンが当該座標入力装置に触れてから
離れるまでの間に当該座標入力装置により検出されるペ
ン先の座標系列で表現されるストロークの列をもとに認
識するジェスチャ認識手段と、 このジェスチャ認識手段にて認識されたジェスチャに対
応する認識モードの設定や処理の実行を行う手段と、 を具備したことを特徴とする文字認識装置。 - 【請求項2】前記ジェスチャ筆記入力のための領域は、
前記座標入力装置の座標入力面のすみに、前記文字筆記
領域に隣接するように設けられていることを特徴とする
請求項1記載の文字認識装置。 - 【請求項3】座標入力装置上に予め設けられた第1の領
域内で、ペンが当該座標入力装置に触れてから離れるま
での間に当該座標入力装置により検出されるペン先の座
標系列で表現されるストロークの列をもとに文字認識を
行う文字認識手段と、 前記座標入力装置上に予め設けられた前記第1の領域と
は異なる第2の領域内で、ペンが当該座標入力装置に触
れてから離れるまでの間に当該座標入力装置により検出
されるペン先の座標系列で表現されるストロークの列を
もとに、少なくとも前記文字認識手段で認識すべき文字
の種類を指定するためのジェスチャを認識するジェスチ
ャ認識手段と、 前記文字認識手段で認識する文字の種類を、前記ジェス
チャ認識手段にて認識されたジェスチャに対応する文字
の種類に切り替える手段と、 を具備したことを特徴とする文字認識装置。 - 【請求項4】前記ジェスチャ認識手段で認識される前記
ジェスチャには、少なくとも編集処理を含む各種の処理
の実行を指示するジェスチャを含み、 前記ジェスチャ認識手段で前記処理の実行を指示するジ
ェスチャが認識されたときには、そのジェスチャに対応
する処理の実行を行う手段と、 をさらに具備したことを特徴とする請求項3記載の文字
認識装置。 - 【請求項5】前記ジェスチャ筆記領域は、前記座標入力
装置の座標入力面のすみに、前記文字筆記領域に隣接す
るように設けられていることを特徴とする請求項3記載
の文字認識装置。 - 【請求項6】座標入力装置上でに予め設けられた文字筆
記領域内でペンにより筆記された文字を表すストローク
列をもとに文字認識を行う文字認識方法において、 少なくとも1つのストロークからなり、少なくとも認識
すべき文字の種類を指定するためのジェスチャを、前記
座標入力装置上に前記文字筆記領域とは別の領域として
用意されたジェスチャ筆記入力のための領域内で、ペン
が当該座標入力装置に触れてから離れるまでの間に当該
座標入力装置により検出されるペン先の座標系列で表現
されるストロークの列をもとに認識するジェスチャ認識
ステップと、 前記文字筆記領域内でペンにより筆記された文字を表す
ストローク列をもとに認識すべき文字の種類を、前記ジ
ェスチャ認識ステップにて認識されたジェスチャに対応
する文字の種類に切り替えるステップと、 を具備したことを特徴とする文字認識方法。 - 【請求項7】前記ジェスチャ認識ステップで認識される
前記ジェスチャには、少なくとも編集処理を含む各種の
処理の実行を指示するジェスチャを含み、 前記ジェスチャ認識ステップで前記処理の実行を指示す
るジェスチャが認識されたときには、そのジェスチャに
対応する処理の実行を行うステップと、 をさらに具備したことを特徴とする請求項6記載の文字
認識方法。 - 【請求項8】座標入力装置上でに予め設けられた文字筆
記領域内でペンにより筆記された文字を表すストローク
列をもとに文字認識を行う文字認識プログラムであっ
て、 コンピュータに、 少なくとも1つのストロークからなり、少なくとも認識
すべき文字の種類を指定するためのジェスチャを、前記
座標入力装置上に前記文字筆記領域とは別の領域として
用意されたジェスチャ筆記入力のための領域内で、ペン
が当該座標入力装置に触れてから離れるまでの間に当該
座標入力装置により検出されるペン先の座標系列で表現
されるストロークの列をもとに認識するジェスチャ認識
ステップと、 前記文字筆記領域内でペンにより筆記された文字を表す
ストローク列をもとに認識すべき文字の種類を、前記ジ
ェスチャ認識ステップにて認識されたジェスチャに対応
する文字の種類に切り替えるステップと、 を実行させる文字認識プログラム。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2001401296A JP2003196593A (ja) | 2001-12-28 | 2001-12-28 | 文字認識装置および文字認識方法および文字認識プログラム |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2001401296A JP2003196593A (ja) | 2001-12-28 | 2001-12-28 | 文字認識装置および文字認識方法および文字認識プログラム |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2003196593A true JP2003196593A (ja) | 2003-07-11 |
Family
ID=27605363
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2001401296A Pending JP2003196593A (ja) | 2001-12-28 | 2001-12-28 | 文字認識装置および文字認識方法および文字認識プログラム |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2003196593A (ja) |
Cited By (12)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2008246041A (ja) * | 2007-03-30 | 2008-10-16 | Kenwood Corp | ゲームシステム、読取機器およびゲーム用操作コマンドの生成方法 |
| US8131080B2 (en) | 2007-03-29 | 2012-03-06 | Kabushiki Kaisha Toshiba | Handwriting determination apparatus and method and program |
| WO2012105195A1 (ja) * | 2011-01-31 | 2012-08-09 | パナソニック株式会社 | 手書き文字入力装置 |
| JP2013069352A (ja) * | 2013-01-25 | 2013-04-18 | Panasonic Corp | 入力装置 |
| JP2013069351A (ja) * | 2013-01-25 | 2013-04-18 | Panasonic Corp | 入力装置および入力方法 |
| JP2015122114A (ja) * | 2015-03-04 | 2015-07-02 | パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America | 入力装置 |
| JP2016015165A (ja) * | 2015-09-24 | 2016-01-28 | ソニー株式会社 | 情報処理装置および方法、プログラム、並びに記録媒体 |
| US9665273B2 (en) | 2011-06-07 | 2017-05-30 | Sony Corporation | Information processing terminal and method, program, and recording medium |
| CN108140361A (zh) * | 2016-09-23 | 2018-06-08 | 苹果公司 | 观影模式 |
| US10878782B1 (en) | 2019-09-09 | 2020-12-29 | Apple Inc. | Techniques for managing display usage |
| US11257464B2 (en) | 2017-05-16 | 2022-02-22 | Apple Inc. | User interface for a flashlight mode on an electronic device |
| US12182373B2 (en) | 2021-04-27 | 2024-12-31 | Apple Inc. | Techniques for managing display usage |
-
2001
- 2001-12-28 JP JP2001401296A patent/JP2003196593A/ja active Pending
Cited By (22)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US8131080B2 (en) | 2007-03-29 | 2012-03-06 | Kabushiki Kaisha Toshiba | Handwriting determination apparatus and method and program |
| US8600163B2 (en) | 2007-03-29 | 2013-12-03 | Kabushiki Kaisha Toshiba | Handwriting determination apparatus and method and program |
| JP2008246041A (ja) * | 2007-03-30 | 2008-10-16 | Kenwood Corp | ゲームシステム、読取機器およびゲーム用操作コマンドの生成方法 |
| WO2012105195A1 (ja) * | 2011-01-31 | 2012-08-09 | パナソニック株式会社 | 手書き文字入力装置 |
| JP2012159899A (ja) * | 2011-01-31 | 2012-08-23 | Panasonic Corp | 手書き文字入力装置 |
| US9665273B2 (en) | 2011-06-07 | 2017-05-30 | Sony Corporation | Information processing terminal and method, program, and recording medium |
| JP2013069352A (ja) * | 2013-01-25 | 2013-04-18 | Panasonic Corp | 入力装置 |
| JP2013069351A (ja) * | 2013-01-25 | 2013-04-18 | Panasonic Corp | 入力装置および入力方法 |
| JP2015122114A (ja) * | 2015-03-04 | 2015-07-02 | パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America | 入力装置 |
| JP2016015165A (ja) * | 2015-09-24 | 2016-01-28 | ソニー株式会社 | 情報処理装置および方法、プログラム、並びに記録媒体 |
| CN108140361A (zh) * | 2016-09-23 | 2018-06-08 | 苹果公司 | 观影模式 |
| CN108140361B (zh) * | 2016-09-23 | 2022-03-11 | 苹果公司 | 观影模式 |
| US11307757B2 (en) | 2016-09-23 | 2022-04-19 | Apple Inc. | Watch theater mode |
| US12050771B2 (en) | 2016-09-23 | 2024-07-30 | Apple Inc. | Watch theater mode |
| US11257464B2 (en) | 2017-05-16 | 2022-02-22 | Apple Inc. | User interface for a flashlight mode on an electronic device |
| US11955100B2 (en) | 2017-05-16 | 2024-04-09 | Apple Inc. | User interface for a flashlight mode on an electronic device |
| US12293741B2 (en) | 2017-05-16 | 2025-05-06 | Apple Inc. | User interface for a flashlight mode on an electronic device |
| US10878782B1 (en) | 2019-09-09 | 2020-12-29 | Apple Inc. | Techniques for managing display usage |
| US10908559B1 (en) | 2019-09-09 | 2021-02-02 | Apple Inc. | Techniques for managing display usage |
| US10936345B1 (en) | 2019-09-09 | 2021-03-02 | Apple Inc. | Techniques for managing display usage |
| US12373079B2 (en) | 2019-09-09 | 2025-07-29 | Apple Inc. | Techniques for managing display usage |
| US12182373B2 (en) | 2021-04-27 | 2024-12-31 | Apple Inc. | Techniques for managing display usage |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP3974359B2 (ja) | オンライン文字認識装置及び方法並びにコンピュータ読み取り可能な記憶媒体及びオンライン文字認識プログラム | |
| US20210406578A1 (en) | Handwriting-based predictive population of partial virtual keyboards | |
| US7283126B2 (en) | System and method for providing gesture suggestions to enhance interpretation of user input | |
| JP7105695B2 (ja) | デジタルインク対話性のためのシステムおよび方法 | |
| JPH05324903A (ja) | パターン認識装置 | |
| JP2003162687A (ja) | 手書き文字入力装置、手書き文字認識プログラム | |
| JPH06332610A (ja) | 手書き情報入力処理方式 | |
| JPWO2014147712A1 (ja) | 情報処理装置、情報処理方法及びプログラム | |
| JP2003196593A (ja) | 文字認識装置および文字認識方法および文字認識プログラム | |
| JP4686502B2 (ja) | オンライン文字認識装置 | |
| JP2005025566A (ja) | 手書き入力装置、手書き入力方法、手書き入力プログラム、および、プログラム記録媒体 | |
| JPH07182462A (ja) | 文字認識装置及び方法 | |
| JP4393415B2 (ja) | 手書き入力装置、手書き入力プログラム、および、プログラム記録媒体 | |
| JP2989084B2 (ja) | 情報処理装置 | |
| JPWO2016031016A1 (ja) | 電子機器、方法及びプログラム | |
| JPH10162101A (ja) | 手書き文字認識装置および手書き文字認識方法 | |
| JPH07320001A (ja) | 文字認識装置,認識辞書の参照方法 | |
| JPH0816571A (ja) | 漢字入力装置 | |
| JPH07152754A (ja) | 文章作成補助機能を持つ文章作成装置 | |
| JPH07182464A (ja) | 文字認識装置及び方法 | |
| JP2003308317A (ja) | 文字列変換方法および文字認識方法および文字認識装置および文字認識プログラム | |
| JPH08180137A (ja) | 文字入力装置 | |
| JPH06103415A (ja) | 文章作成装置 | |
| JPH07311818A (ja) | 文字認識装置 | |
| JPH07182463A (ja) | 文字認識装置及び方法 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20060817 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060822 |
|
| A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20070206 |