JP4877621B1 - 文字認識装置及びプログラム - Google Patents
文字認識装置及びプログラム Download PDFInfo
- Publication number
- JP4877621B1 JP4877621B1 JP2010171830A JP2010171830A JP4877621B1 JP 4877621 B1 JP4877621 B1 JP 4877621B1 JP 2010171830 A JP2010171830 A JP 2010171830A JP 2010171830 A JP2010171830 A JP 2010171830A JP 4877621 B1 JP4877621 B1 JP 4877621B1
- Authority
- JP
- Japan
- Prior art keywords
- character
- plane
- acceleration
- writing
- vector sequence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Character Discrimination (AREA)
Abstract
【課題】文字を手書き入力する際のユーザの負担を大幅に軽減しながら平面内で書かれた文字を加速度センサの計測結果に基づいて円滑かつ確実に文字を認識できるようにする。
【解決手段】制御部1は、3軸の加速度センサ7を内蔵した筺体が空間平面内で移動されながら行われた文字を書く動作を認識する場合に、筺体が移動されながら行われた文字を書く動作を、1文字分の時系列の加速度ベクトルとして取得し、この1文字分の加速度ベクトル列のうち、ベクトルの大きさが大きい値で、かつ互いに略直交する複数本の加速度ベクトルを選択して、この複数本の加速度ベクトルにより張られる平面を特定した後、1文字分の加速度ベクトル列を、特定された平面内の直交する2成分の加速度ベクトル列に変換することにより得られた入力文字データと予め用意されている文字認識用の基本文字データを照合することにより文字認識を行う。
【選択図】 図1
【解決手段】制御部1は、3軸の加速度センサ7を内蔵した筺体が空間平面内で移動されながら行われた文字を書く動作を認識する場合に、筺体が移動されながら行われた文字を書く動作を、1文字分の時系列の加速度ベクトルとして取得し、この1文字分の加速度ベクトル列のうち、ベクトルの大きさが大きい値で、かつ互いに略直交する複数本の加速度ベクトルを選択して、この複数本の加速度ベクトルにより張られる平面を特定した後、1文字分の加速度ベクトル列を、特定された平面内の直交する2成分の加速度ベクトル列に変換することにより得られた入力文字データと予め用意されている文字認識用の基本文字データを照合することにより文字認識を行う。
【選択図】 図1
Description
本発明は、加速度センサを内蔵した筺体が平面内で移動されながら行われた文字を書く動作を加速度センサの計測結果に基づいて認識する文字認識装置及びプログラムに関する。
従来、人が文字を書く動作を慣性センサによって計測してコンピューターに取り込む技術としては、多々提案されている。例えば、ペン先に加速度センサを収容することによって、この加速度センサの計測結果をペン先の移動軌跡として抽出するようにした技術(特許文献1参照)が提案され、また、携帯電話装置において加速度センサの検出結果に応じた装置本体の移動情報に基づいて手書き動作により特定される入力情報を認識するようにした技術(特許文献2参照)が提案されるなど、色々な提案がなされている。
しかしながら、加速度センサを使用して文字認識を行う技術の多くは、加速度センサの計測結果を2回積分することにより加速度から速度を算出するとともに、この速度から位置を算出し、この位置の移動軌跡を文字認識に利用するようにしているが、このような方法では、積分初期状態(書き始め位置)不明の問題や積分誤差の問題があり、さらには重力という強力な外乱を計測データから除去するために重力方向の変化の追跡に角速度センサの出力を積分する必要があり、その積分にも上述の積分初期状態不明の問題や積分誤差の問題が存在しているために確実な文字認識を実現することは極めて困難であった。一方、ユーザにあっても、いつでも筺体を同じ姿勢にしなければならず、文字を書く平面も同じにしなければならないなど、文字を手書き入力する際の操作に注意を払いながら行う必要があり、ユーザの負担も大きかった。
本発明の課題は、文字を手書き入力する際のユーザの負担を大幅に軽減しながら平面内で書かれた文字を加速度センサの計測結果に基づいて円滑かつ確実に文字を認識できるようにすることである。
上述した課題を解決するために請求項1記載の発明は、
3軸の加速度センサを内蔵した筺体が平面内で移動されながら行われた文字を書く動作を前記加速度センサの計測結果に基づいて認識する文字認識装置であって、
前記筺体が移動されながら行われた文字を書く動作に応じた前記加速度センサからの計測結果を、1文字分の時系列の加速度ベクトル列として取得する取得手段と、
前記取得手段により取得された1文字分の加速度ベクトル列のうち、ベクトルの大きさが大きい値で、かつ互いに略直交する複数本の加速度ベクトルを選択する選択手段と、
前記選択手段により選択された複数本の加速度ベクトルにより張られる平面を特定する平面特定手段と、
前記取得手段により取得された前記1文字分の加速度ベクトル列を前記平面特定手段により特定された平面内の直交する2成分の加速度ベクトル列に変換する第1の変換手段と、
前記第1の変換手段により変換された平面内の2成分の加速度ベクトル列を入力文字データとし、この入力文字データと予め用意されている文字認識用の基本文字データを照合することにより文字認識を行う文字認識手段と、
を具備したことを特徴とする。
3軸の加速度センサを内蔵した筺体が平面内で移動されながら行われた文字を書く動作を前記加速度センサの計測結果に基づいて認識する文字認識装置であって、
前記筺体が移動されながら行われた文字を書く動作に応じた前記加速度センサからの計測結果を、1文字分の時系列の加速度ベクトル列として取得する取得手段と、
前記取得手段により取得された1文字分の加速度ベクトル列のうち、ベクトルの大きさが大きい値で、かつ互いに略直交する複数本の加速度ベクトルを選択する選択手段と、
前記選択手段により選択された複数本の加速度ベクトルにより張られる平面を特定する平面特定手段と、
前記取得手段により取得された前記1文字分の加速度ベクトル列を前記平面特定手段により特定された平面内の直交する2成分の加速度ベクトル列に変換する第1の変換手段と、
前記第1の変換手段により変換された平面内の2成分の加速度ベクトル列を入力文字データとし、この入力文字データと予め用意されている文字認識用の基本文字データを照合することにより文字認識を行う文字認識手段と、
を具備したことを特徴とする。
請求項1に従属する発明として、
前記選択手段は、加速度ベクトルの大きさが大きい値で、かつ互いに略直交する複数本のベクトルを複数組選択し、
前記平面特定手段は、前記選択手段により選択された組毎に平面をそれぞれ特定するとともに、この組毎に特定された平面の中から一つの平面を文字が書かれた文字平面として特定する、
ようにしたことを特徴とする、請求項2記載の発明であってもよい。
前記選択手段は、加速度ベクトルの大きさが大きい値で、かつ互いに略直交する複数本のベクトルを複数組選択し、
前記平面特定手段は、前記選択手段により選択された組毎に平面をそれぞれ特定するとともに、この組毎に特定された平面の中から一つの平面を文字が書かれた文字平面として特定する、
ようにしたことを特徴とする、請求項2記載の発明であってもよい。
請求項1に従属する発明として、
前記第1の変換手段は、前記3軸の加速度センサの各軸に対応する三つの成分のうち、そのいずれか一つの成分の重力加速度がゼロとなる平面に一致するように前記平面特定手段により特定された平面を回転させたような2成分の加速度ベクトル列に変換する、
ようにしたことを特徴とする、請求項3記載の発明であってもよい。
前記第1の変換手段は、前記3軸の加速度センサの各軸に対応する三つの成分のうち、そのいずれか一つの成分の重力加速度がゼロとなる平面に一致するように前記平面特定手段により特定された平面を回転させたような2成分の加速度ベクトル列に変換する、
ようにしたことを特徴とする、請求項3記載の発明であってもよい。
請求項1に従属する発明として、
前記第1の変換手段により変換された2成分の加速度ベクトル列の中から1文字の書き始めの方向を特定する特定手段と、
前記特定手段により特定された1文字の書き始めの方向を、前記文字認識用の基本文字データ内に記憶されている該基本文字の書き始めの方向に一致させるように、前記平面特定手段により特定された平面内の2成分の加速度ベクトル列を回転変換する第2の変換手段と、
をさらに備え、
前記文字認識手段は、前記第2の変換手段により変換された平面内の2成分の加速度ベクトル列を入力文字データとし、この入力文字データと前記基本文字データを照合する、
ようにしたことを特徴とする、請求項4記載の発明であってもよい。
前記第1の変換手段により変換された2成分の加速度ベクトル列の中から1文字の書き始めの方向を特定する特定手段と、
前記特定手段により特定された1文字の書き始めの方向を、前記文字認識用の基本文字データ内に記憶されている該基本文字の書き始めの方向に一致させるように、前記平面特定手段により特定された平面内の2成分の加速度ベクトル列を回転変換する第2の変換手段と、
をさらに備え、
前記文字認識手段は、前記第2の変換手段により変換された平面内の2成分の加速度ベクトル列を入力文字データとし、この入力文字データと前記基本文字データを照合する、
ようにしたことを特徴とする、請求項4記載の発明であってもよい。
請求項4に従属する発明として、
前記第2の変換手段により変換された平面内の2成分の加速度ベクトル列を、前記文字の書き始めの方向を軸として該平面を裏返したように回転する、
ようにしたことを特徴とする、請求項5記載の発明であってもよい。
前記第2の変換手段により変換された平面内の2成分の加速度ベクトル列を、前記文字の書き始めの方向を軸として該平面を裏返したように回転する、
ようにしたことを特徴とする、請求項5記載の発明であってもよい。
請求項1に従属する発明として、
前記取得手段により取得された加速度ベクトル列に基づいて1文字の書き始めと書き終わりを判別する判別手段をさらに備え、
前記選択手段は、前記判別手段により1文字の書き始めが判別されてから書き終わりが判別されるまでの間、前記取得手段により順次取得された加速度ベクトル列のうち、ベクトルの大きさが大きい値で、かつ互いに略直交する複数本のベクトルを選択する、
ようにしたことを特徴とする、請求項6記載の発明であってもよい。
前記取得手段により取得された加速度ベクトル列に基づいて1文字の書き始めと書き終わりを判別する判別手段をさらに備え、
前記選択手段は、前記判別手段により1文字の書き始めが判別されてから書き終わりが判別されるまでの間、前記取得手段により順次取得された加速度ベクトル列のうち、ベクトルの大きさが大きい値で、かつ互いに略直交する複数本のベクトルを選択する、
ようにしたことを特徴とする、請求項6記載の発明であってもよい。
請求項6に従属する発明として、
前記判別手段は、前記加速度センサの計測結果を前記平面内で分離した直交する各成分の加速度における合成ベクトルの大きさが所定の閾値以上で所定時間以上連続しているか否かに基づいて1文字の書き始めと書き終わりを判別する、
ようにしたことを特徴とする、請求項7記載の発明であってもよい。
前記判別手段は、前記加速度センサの計測結果を前記平面内で分離した直交する各成分の加速度における合成ベクトルの大きさが所定の閾値以上で所定時間以上連続しているか否かに基づいて1文字の書き始めと書き終わりを判別する、
ようにしたことを特徴とする、請求項7記載の発明であってもよい。
また、上述した課題を解決するために請求項8記載の発明は、
コンピュータに対して、
3軸の加速度センサを内蔵した筺体が平面内で移動されながら行われた文字を書く動作を前記加速度センサの計測結果に基づいて認識する場合に、前記筺体が移動されながら行われた文字を書く動作に応じた前記加速度センサからの計測結果を、1文字分の時系列の加速度ベクトル列として取得する機能と、
前記取得された1文字分の加速度ベクトル列のうち、ベクトルの大きさが大きい値で、かつ互いに略直交する複数本の加速度ベクトルを選択する機能と、
前記選択された複数本の加速度ベクトルにより張られる平面を特定する機能と、
前記取得された前記1文字分の加速度ベクトル列を前記特定された平面内の直交する2成分の加速度ベクトル列に変換する機能と、
前記変換された平面内の2成分の加速度ベクトル列を入力文字データとし、この入力文字データと予め用意されている文字認識用の基本文字データを照合することにより文字認識を行う機能と、
を実現させるためのプログラム、であることを特徴とする。
コンピュータに対して、
3軸の加速度センサを内蔵した筺体が平面内で移動されながら行われた文字を書く動作を前記加速度センサの計測結果に基づいて認識する場合に、前記筺体が移動されながら行われた文字を書く動作に応じた前記加速度センサからの計測結果を、1文字分の時系列の加速度ベクトル列として取得する機能と、
前記取得された1文字分の加速度ベクトル列のうち、ベクトルの大きさが大きい値で、かつ互いに略直交する複数本の加速度ベクトルを選択する機能と、
前記選択された複数本の加速度ベクトルにより張られる平面を特定する機能と、
前記取得された前記1文字分の加速度ベクトル列を前記特定された平面内の直交する2成分の加速度ベクトル列に変換する機能と、
前記変換された平面内の2成分の加速度ベクトル列を入力文字データとし、この入力文字データと予め用意されている文字認識用の基本文字データを照合することにより文字認識を行う機能と、
を実現させるためのプログラム、であることを特徴とする。
本発明によれば、文字を手書き入力する際のユーザの負担を大幅に軽減しながら平面内で書かれた文字を加速度センサの計測結果に基づいて円滑かつ確実な文字認識が可能となり、実用性に富んだものとなる。
以下、図1〜図5を参照して本発明の実施形態を説明する。
この実施形態は、文字認識装置として適用した文字認識機能付きの撮像装置(デジタルカメラ)に適用した場合を例示したもので、図1は、文字認識機能付きのデジタルカメラの基本的な構成要素を示したブロック図である。
デジタルカメラは、携帯型のコンパクトカメラを構成するもので、撮像機能、計時機能などの基本機能のほかに、空間平面内で書かれた文字を認識する文字認識機能を有し、制御部1を中核として動作するようになっている。制御部1は、二次電池を備えた電源部2からの電力供給によって動作し、記憶部3内の各種のプログラムに応じてこのデジタルカメラの全体動作を制御するもので、この制御部1には図示しないCPU(中央演算処理装置)やメモリなどが設けられている。
この実施形態は、文字認識装置として適用した文字認識機能付きの撮像装置(デジタルカメラ)に適用した場合を例示したもので、図1は、文字認識機能付きのデジタルカメラの基本的な構成要素を示したブロック図である。
デジタルカメラは、携帯型のコンパクトカメラを構成するもので、撮像機能、計時機能などの基本機能のほかに、空間平面内で書かれた文字を認識する文字認識機能を有し、制御部1を中核として動作するようになっている。制御部1は、二次電池を備えた電源部2からの電力供給によって動作し、記憶部3内の各種のプログラムに応じてこのデジタルカメラの全体動作を制御するもので、この制御部1には図示しないCPU(中央演算処理装置)やメモリなどが設けられている。
記憶部3は、ROM、RAMなどの内部メモリで、図示しないプログラム領域とデータ領域とを有し、この記憶部3内のプログラム領域には、後述する図4及び図5に示す動作手順に応じて本実施形態を実現するためのプログラムが格納されている。また、記憶部3内のデータ領域には、文字認識用の基本文字データを記憶する認識辞書メモリDM、撮影された画像を記憶保存する画像メモリFMのほか、各種のフラグ情報、デジタルカメラの動作に必要な各種の情報が記憶される。なお、記憶部3は、例えば、SDカード、ICカードなど、着脱自在な可搬型メモリ(記録メディア)を含む構成であってもよく、あるいは図示しない所定の外部サーバ上に記憶部3を有する構成であってもよい。
操作部4は、文字入力、コマンド入力などを行うもので、この操作部4には、図示しないが、カメラ機能をオン/オフさせるオン/オフキー、シャッタキーなどが設けられている。制御部1は、操作部4からの操作信号に応じた処理として、例えば、カメラオン/オフ処理、撮影処理など、各種の処理を行う。表示部5は、例えば、高精細液晶あるいは有機ELを使用し、例えば、日時情報、保存画像などを表示するほか、カメラ機能の使用時にはライブビュー画像(モニタ画像)を表示するファインダ画面となる。
撮像部6は、デジタルカメラ機能を構成する構成要素で、静止画撮影のほかに動画撮影も可能なもので、カメラレンズ部、撮像素子(例えば、CCDあるいはCMOS)、画像信号処理部、アナログ処理部、圧縮伸張部、各種センサ部(測距センサ、光量センサなど)などを有し、光学ズームを調整制御したり、オートフォーカス時の駆動制御、シャッタ駆動制御、露出、ホワイトバランスなどを制御したり、シャッタ速度(露光時間)を測定したりする。また、撮像部6は、被写体に応じて望遠/広角の切り替えができる2焦点式レンズやズームレンズを備え、焦点距離を可変する画角変更機構を作動させて望遠/広角やズーム撮影を行うようにしている。
加速度センサ7は、デジタルカメラ本体(筺体)に内蔵された3軸の加速度センサであり、文字認識機能を構成する要素の一つであるが、例えば、歩数計を構成する加速度センサを文字認識機能に兼用するようにしてもよい。制御部1は、文字認識機能の作動中に加速度センサ7の計測結果に基づいて文字認識を行うようにしている。すなわち、制御部1は、加速度センサ7の計測結果、つまり、互いに直交する3軸方向(X・Y・Z方向)の加速度成分に基づいて重力方向に対して並行な2次元平面(垂直面)を特定し、この平面内において直交する2軸の成分に分離した加速度データ、つまり、第1軸(第1成分)の加速度データと第2軸(第2成分)の加速度データに基づいて文字認識を行うようにしている。
ここで、制御部1は、重力方向に対して並行な2次元平面内において分離された直交する2軸の成分の加速度データに基づいて1文字の書き始めと書き終わりを判別するようにしている。そして、制御部1は、1文字の書き始めから書き終わりまでの間、加速度センサ7の計測結果を、1文字分の時系列の加速度ベクトルとして取得し、この1文字分の加速度ベクトル列のうち、ベクトルの大きさが大きい値で、かつ互いに略直交する(直交又は直交に近い状態の)複数本(例えば、2本)の加速度ベクトルを選択する。すなわち、加速度センサ7の計測結果である1文字分の時系列の加速度ベクトルには、加速度センサ7自身の微小なノイズや微妙な手振れ、1文字入力中での筐体の姿勢の“ずれ”などの影響を少なくするために、複数本の加速度ベクトルを選択する際に、ベクトルの大きさが大きい値で、かつ互いに略直交する加速度ベクトルを選択するようにしている。
これによって選択した複数本の加速度ベクトルに基づいて、その複数本の加速度ベクトルにより張られる平面を特定するようにしている。この場合、どのような加速度ベクトルを選択するかによっては、特定される平面は若干異なるために、本実施形態においては、さらに加速度ベクトルの大きさが大きい値で、かつ互いに略直交する複数本(例えば、2本)のベクトルを複数組選択し、この組毎に文字平面をそれぞれ特定した後、この組毎の平面の中から一つの平面を文字が書かれた文字平面として特定するようにしている。
そして、制御部1は、上述のように特定した文字平面の重力方向に対する傾きを検出し、Z軸の重力加速度が“0”となる傾きとなるように、つまり、特定した文字平面が”Z軸=0”の面に一致するように当該文字平面内の直交する2成分の加速度ベクトル列を変換した後、変換した2成分の加速度ベクトル列を入力文字データとし、この入力文字データと認識辞書メモリDM内の全ての基本文字データを照合することにより基本文字毎に入力文字との類似度を算出して文字認識を行うようにしている。
図2は、認識辞書メモリDM内の基本文字データを説明するための図である。
認識辞書メモリDMは、文字認識用として予め用意されている基本文字データを記憶するもので、S文字分の基本文字データを記憶する構成となっている。ここで、基本文字(0)、基本文字(1)、…基本文字(S)は、0文字目の基本文字データ、1文字目の基本文字データ、…S文字目の基本文字データで、直交する2軸の成分に対応した2次元加速度データから成っている。そして、この基本文字の中には、その文字の書き初めのストローク方向(書き初め時点でのベクトル方向)を示すデータが記憶されている。
認識辞書メモリDMは、文字認識用として予め用意されている基本文字データを記憶するもので、S文字分の基本文字データを記憶する構成となっている。ここで、基本文字(0)、基本文字(1)、…基本文字(S)は、0文字目の基本文字データ、1文字目の基本文字データ、…S文字目の基本文字データで、直交する2軸の成分に対応した2次元加速度データから成っている。そして、この基本文字の中には、その文字の書き初めのストローク方向(書き初め時点でのベクトル方向)を示すデータが記憶されている。
次に、本実施形態におけるデジタルカメラの動作概念を図4及び図5に示すフローチャートを参照して説明する。ここで、これらのフローチャートに記述されている各機能は、読み取り可能なプログラムコードの形態で格納されており、このプログラムコードにしたがった動作が逐次実行される。また、ネットワークなどの伝送媒体を介して伝送されてきた上述のプログラムコードに従った動作を逐次実行することもできる。すなわち、記録媒体のほかに、伝送媒体を介して外部供給されたプログラム/データを利用して本実施形態特有の動作を実行することもできる。
ここで、図4及び図5に示すフローチャートを説明する前に、図3を参照して、ユーザが文字を手書き入力する際の操作手順や操作方法を説明しておく。
先ず、ユーザは、文字認識機能をオンさせた後、デジタルカメラ本体(筺体)を手に持って空間平面内を移動させながら文字を書くようにする。すなわち、筺体を手に持って空間平面内を移動させながら文字を書くが、1文字を書き始める前には筐体を略静止させた後に(図3のステップA1)、文字の書き始め位置まで筐体をゆっくり滑らかに移動させる(ステップA2)。
先ず、ユーザは、文字認識機能をオンさせた後、デジタルカメラ本体(筺体)を手に持って空間平面内を移動させながら文字を書くようにする。すなわち、筺体を手に持って空間平面内を移動させながら文字を書くが、1文字を書き始める前には筐体を略静止させた後に(図3のステップA1)、文字の書き始め位置まで筐体をゆっくり滑らかに移動させる(ステップA2)。
そして、重力方向に対して並行な2次元平面内で文字を書くようにし、1文字の入力中は筺体の姿勢を大きく変化させないものとし、かつ、1画(ストローク)毎に筐体を移動させるが、この場合、1文字入力中は書く動きを止めずに一筆書きのように連続して滑らかに書くようにし、1つの画の終点から次の画の始点への移動も滑らに行う(ステップA3)。そして、1文字が書き終わった時点で再び、筐体を略静止させる(ステップA4)。その後、次の文字の書き始め位置までゆっくり滑らかに筐体を移動させた後(ステップA5)、次の文字を書き始める。以下、文字入力を終了させるまで(ステップA6でNO)、上述のステップA3に戻り、手書き操作を繰り返すことにより複数の文字を順次手書き入力する。
図4は、デジタルカメラの全体動作のうち、本実施形態の特徴部分の動作概要として、文字認識機能がオンされて文字認識が開始された場合の概要動作を示したフローチャートである。なお、この図4のフローから抜けた際には、全体動作のメインフロー(図示省略)に戻る。
先ず、制御部1は、加速度センサ7の計測結果から重力分をキャンセルするための処理を行う(図4のステップB1)。すなわち、例えば、加速度センサ7の垂直方向の計測結果(加速度成分)には、重力加速度として上向き1Gが含まれているので、加速度を計測する毎に、その計測結果から上向き1Gを減算するための準備として、文字を書き始める前に筐体の姿勢に応じた重力加速度を計測して記憶部3内のRAMに一時記憶しておく。
先ず、制御部1は、加速度センサ7の計測結果から重力分をキャンセルするための処理を行う(図4のステップB1)。すなわち、例えば、加速度センサ7の垂直方向の計測結果(加速度成分)には、重力加速度として上向き1Gが含まれているので、加速度を計測する毎に、その計測結果から上向き1Gを減算するための準備として、文字を書き始める前に筐体の姿勢に応じた重力加速度を計測して記憶部3内のRAMに一時記憶しておく。
そして、2成分の加速度合成ベクトルの大きさが所定の閾値以上で所定時間(所定回数)以上連続しているか否かに基づいて文字を書き始めたか否かを調べる(ステップB2)。ここで、ユーザは、2次元平面内で分離した直交する2つの加速度合成ベクトルの大きさが所定の閾値以上で所定時間以上連続しないように、つまり、所定の閾値以上の加速度合成ベクトルが所定時間(所定回数)以上連続しないように、ゆっくり滑らかに筐体を文字の書き始め位置までに移動させた後、文字を書き始める。これによって所定の閾値以上の加速度合成ベクトルが所定時間(所定回数)以上連続していることが検出される(ステップB2でYES)。
このようにして文字の書き始めを検出すると、1文字の入力時間を計時するための1文字入力タイマ(図示省略)の計測動作を開始させる(ステップB3)。そして、1文字入力中の加速度データを蓄える処理に移り(ステップB4)、加速度センサ7の計測結果から重力加速度を減算することにより重力分をキャンセルした2成分の加速度を書き始めの計測結果として記憶部3内のRAMに記憶させた後、所定の閾値未満の加速度合成ベクトルが所定時間(所定回数)以上連続していることが検出されたかに基づいて1文字を書き終えたかを調べる(ステップB5)。この場合、ユーザは、筐体の姿勢を保ったまま1文字を書き終わるまでは筐体を連続して移動させながら文字を書く手を止めずに一筆書きのようにして書き、1つの画の終点から次の画の始点へは滑らかな軌跡を描くように筐体を移動させ、1文字を書き終えたら筐体の移動を止めるようにしているため、1文字を書き終えた際には、所定の閾値未満の加速度合成ベクトルが所定時間(所定回数)以上連続していることが検出される(ステップB5でYES)。
いま、1文字入力中にあっては、所定の閾値以上の加速度合成ベクトルが所定時間(所定回数)以上連続していることが検出されるため(ステップB5でNO)、以下、上述のステップB4に戻り、1文字入力中の加速度データを記憶部3内のRAMに蓄える処理を繰り返す。このようにして加速度センサ7の計測結果を蓄える動作を例えば、1秒間に100回程度で行う。これによって記憶部3内のRAMには、1文字の書き始めから書き終わりまでの間、順次取得した各成分の加速度データが、画と画との間の加速度を含めて文字の1画目から最後の画まで時間的に連続した一連の加速度データとして順次記憶される。すなわち、1文字の書き始めから書き終わりまでの間、加速度センサ7の計測結果を、1文字分の時系列の加速度ベクトルとして取得して、記憶部3内のRAMに順次蓄える。
1文字を書き終えたことを検出すると(ステップB5でYES)、上述の1文字入力タイマの計測動作を停止させた後(ステップB6)、その計測時間(1文字の入力時間)は所定の閾値以上の長さ(例えば、漢数字の「一」のように簡素な文字の入力に要する時間以上)であるかを調べ(ステップB7)、その閾値未満の長さであれば(ステップB7でNO)、今回の加速度センサ7での計測結果を無効とするために記憶部3内のRAMに蓄えた今回の一連の加速度データを消去した後(ステップB8)、文字の書き始めを検出するステップB2に戻る。いま、1文字の入力時間が所定の閾値以上の長さであれば(ステップB7でYES)、記憶部3内のRAMに蓄えられている1文字分の時系列の加速度データに基づいて、後述する文字平面検出・文字方向検出・文字判別処理を実行する(ステップB9)。
図5は、文字平面検出・文字方向検出・文字判別処理(図4のステップB9)を詳述するためのフローチャートである。
先ず、制御部1は、文字平面検出処理を実行する(ステップC1〜C3)。すなわち、制御部1は、1文字を手書き入力している間の加速度センサ7の計測結果(1文字分の時系列の加速度ベクトル)のうち、ベクトルの大きさが大きい値で、かつ互いに略直交する複数本(例えば、2本)の加速度ベクトルを選択して、複数本の加速度ベクトルにより張られる平面を特定する(ステップC1)。このような平面特定処理を複数回繰り返すことで複数の平面を特定する(ステップC2)。すなわち、色々な方向の平面を複数特定するために、加速度ベクトルの大きさが大きい値で、かつ互いに略直交する複数本(例えば、2本)のベクトルを複数組選択して、この組毎に平面をそれぞれ特定する。これによって特定した複数の平面の中から最小2乗法や重み付け平均(加重平均法)などにより一つの平面を文字平面として選択(特定)する(ステップC3)。
先ず、制御部1は、文字平面検出処理を実行する(ステップC1〜C3)。すなわち、制御部1は、1文字を手書き入力している間の加速度センサ7の計測結果(1文字分の時系列の加速度ベクトル)のうち、ベクトルの大きさが大きい値で、かつ互いに略直交する複数本(例えば、2本)の加速度ベクトルを選択して、複数本の加速度ベクトルにより張られる平面を特定する(ステップC1)。このような平面特定処理を複数回繰り返すことで複数の平面を特定する(ステップC2)。すなわち、色々な方向の平面を複数特定するために、加速度ベクトルの大きさが大きい値で、かつ互いに略直交する複数本(例えば、2本)のベクトルを複数組選択して、この組毎に平面をそれぞれ特定する。これによって特定した複数の平面の中から最小2乗法や重み付け平均(加重平均法)などにより一つの平面を文字平面として選択(特定)する(ステップC3)。
このようにして文字平面を特定した後は、この文字平面の重力方向に対する傾きを検出する(ステップC4)。そして、この文字平面においてそのZ軸の重力加速度が“0”となる傾きとなるように、つまり、特定した文字平面が”Z軸=0”の面に一致するように当該文字平面を回転させる“回転行列”を一つ算出した後(ステップC5)、この“回転行列”を用いて、1文字分の時系列の加速度ベクトルを全て回転させる(ステップC6)。これによって1文字分の時系列の加速度ベクトルは、全て回転後の平面内のデータに変換されることになる。
次に、文字方向検出処理に移り、上述のステップC6で回転させた後の1文字分の加速度ベクトルにおいて、そのX軸に対応する成分(x成分)、Y軸に対応する成分(y成分)の合成ベクトルの中から1文字の書き始めの方向、つまり、文字の書き初めのストローク方向(書き初め時点でのベクトル方向)を検出(特定)する(ステップC7)。そして、認識辞書メモリDMに記憶されている各基本文字のうち、その先頭の基本文字を照合対象として指定した後(ステップC8)、上述のステップC7で特定した文字方向(文字の書き初め時点でのベクトル方向)が、指定した基本文字における書き初め時点でのベクトル方向に一致するように文字平面内で回転させるための“回転行列”を算出する(ステップC9)。そして、この“回転行列”を用いて、1文字分の時系列の加速度ベクトルを全て回転させる(ステップC10)。これによって1文字分の時系列の加速度ベクトルは、基本文字の天地の方向に合ったデータに変換されることになる。
そして、上述のように回転変換した1文字分の加速度ベクトル列を入力文字データとし、この入力文字データと指定の基本文字データを照合しながらそれらの類似度を算出する(ステップC11)。その後、上述のステップC10で回転変換した1文字分の加速度ベクトル列を、その文字の書き初め時点でのベクトル方向を軸として、文字平面を裏返すように回転させるための“回転行列”を算出する(ステップC12)。そして、この“回転行列”を用いて、1文字分の時系列の加速度ベクトルを全て回転させる(ステップC13)。これによって1文字分の時系列の加速度ベクトルは、その文字の表裏関係のデータに変換されることになる。このようにして裏返すように回転変換した1文字分の加速度ベクトル列を入力文字データとし、この入力文字データと指定の基本文字データを照合しながらそれらの類似度を算出する(ステップC14)。
このようにして1文字に対して2種類の類似度を求めた後は、認識辞書メモリDM内の全基本文字を指定し終わったかを調べ(ステップC15)、全文字を指定し終わるまで(ステップC15でNO)、次の基本文字を指定した後(ステップC16)、上述のステップC9に戻り、次の基本文字と照合しながらその類似度を算出する処理を繰り返す(ステップC9〜C16)。その結果、全ての基本文字に対応してその類似度を求めた後は(ステップC16でYES)、類似度が最も高い基本文字を認識文字(入力候補)として決定する(ステップC17)。
このようにして文字判別処理が終わると(図4のステップB9)、この文字判別処理により決定された認識文字を表示部5に入力候補として表示させる(ステップB10)。そして、この状態において、次候補を指示する操作が行われたかを調べたり(ステップB11)、文字認識機能がオフされたか、つまり、文字入力の終了がユーザ操作により指示されたかを調べたりする(ステップB12)。いま、次候補操作が行われた場合には(ステップB11でYES)、次候補を読み出して(ステップB13)、表示部5に入力候補として表示させる(ステップB10)。また、文字入力の終了が指示されなければ(ステップB12でNO)、上述のステップB2に戻り、以下、上述の動作を繰り返すことにより次の手書き文字に対する文字認識を行うが、文字入力の終了が指示されたときには(ステップB12でYES)、この時点で図4のフローの終了となる。
以上のように、この実施形態において制御部1は、3軸の加速度センサ7を内蔵した筺体が平面内で移動されながら行われた文字を書く動作を認識する場合に、筺体が移動されながら行われた文字を書く動作を、1文字分の時系列の加速度ベクトルとして取得し、この1文字分の加速度ベクトル列のうち、ベクトルの大きさが大きい値で、かつ互いに略直交する複数本の加速度ベクトルを選択して、この複数本の加速度ベクトルにより張られる平面を特定した後、1文字分の加速度ベクトル列を、特定された平面内の直交する2成分の加速度ベクトル列に変換することにより得られた入力文字データと、予め用意されている文字認識用の基本文字データを照合することにより文字認識を行うようにしたので、いつでも筺体を同じ姿勢にしたり、文字を書く平面も同じにしたりしなくてもよく、文字を手書き入力する際のユーザの負担を大幅に軽減しながら平面内で書かれた文字を加速度センサ7の計測結果に基づいて円滑かつ確実に文字を認識することが可能となり、実用性に富んだものとなる。
すなわち、加速度データを使用しているので重力の影響は免れないが、加速度を積分して軌跡を出すものとは異なり加速度をそのまま文字認識に使用するようにしているので、文字入力途中に筐体の姿勢が変化することによる重力方向の少々の変化や揺らぎに対して対応可能となり、文字認識のロバスト性があるほか、ジャイロなど加速度センサ以外のセンサも不用となり、かつ、筐体がどのような姿勢で持たれていても、平面が垂直でも水平でも斜めでも文字認識が可能となり、ユーザの負担を大幅に軽減することができる。
1文字分の加速度ベクトル列のうち、加速度ベクトルの大きさが大きい値で、かつ互いに略直交する複数本のベクトルを複数組選択し、組毎に特定した平面の中から一つの平面を文字が書かれた文字平面として特定するようにしたので、文字平面を適切に特定することができる。
特定した文字平面が“Z軸=0”の面に一致するように当該文字平面を回転させたような加速度ベクトル列に変換するようにしたので、筐体がどのような姿勢で持たれたとしても、文字を書く平面が垂直でも水平でも斜めでも文字認識が可能となる。
加速度ベクトル列の中から特定した1文字の書き始めの方向を、文字認識用の基本文字データ内に記憶されている該基本文字の書き始めの方向に一致させるように、文字平面内の加速度ベクトル列を回転変換したものを入力文字データとして、基本文字データを照合するようにしたので、文字平面内において文字の天地をどの方向にしたとしても文字認識が可能となる。
さらに平面内の2成分の加速度ベクトル列を、文字の書き始めの方向を軸として該平面を裏返したように回転するようにしたので、入力文字と基本文字とが表裏が逆の関係でも文字認識することができる。
1文字分の加速度ベクトル列に基づいて1文字の書き始めと書き終わりを判別するようにしたので、文字を構成する要素(画=ストローク)の分離を必要とする文字認識の方法では無く、空中で文字を書くという状況においてペンアップやペンダウンに相当する面倒でやりづらい操作や動きを必要とせずに、1文字入力を判別することができる。
加速度センサ7の計測結果を平面内で分離した直交する各成分の加速度における合成ベクトルの大きさが所定の閾値以上で所定時間以上連続しているか否かに基づいて1文字の書き始めと書き終わりを判別するようにしたので、ユーザにあっては1文字を書き始める前に筐体を略静止させた後に文字の書き始め位置まで筐体をゆっくり滑らかに移動させればよく、1文字が書き終わった時点で再び筐体を略静止させればよく、極自然な動作により1文字の書き始めと書き終わりを判別することができる。
なお、上述した実施形態においては、特定した文字平面が“Z軸=0”の面に一致するように当該文字平面を回転させたような加速度ベクトル列に変換するようにしたが、“Z軸=0”に限らず、“X軸=0”又は“Y軸=0”の面に一致するように当該文字平面を回転させたような加速度ベクトル列に変換するようにしてもよい。
また、上述した各実施形態においては、文字を空間平面内で書くようにしたが、例えば、壁面などに接触させながら文字を書くようにしてもよく、空間平面内で文字を書く場合に限らない。
また、上述した実施形態においては、文字認識装置として、文字認識機能付きのデジタルカメラに適用した場合を示したが、文字認識機能付きの携帯電話機・卓上電子計算機・腕時計・パーソナルコンピュータ(ノートパソコン)・PDA・音楽プレイヤーなどに適用するようにしてもよい。
その他、上述した実施形態において示した“装置”や“機”とは、機能別に複数の筐体に分離されていてもよく、単一の筐体に限らない。また、上述したフローチャートに記述した各ステップは、時系列的な処理に限らず、複数のステップを並列的に処理したり、別個独立して処理したりするようにしてもよい。
1 制御部
3 記憶部
4 操作部
5 表示部
7 加速度センサ
DM 認識辞書メモリ
3 記憶部
4 操作部
5 表示部
7 加速度センサ
DM 認識辞書メモリ
Claims (8)
- 3軸の加速度センサを内蔵した筺体が平面内で移動されながら行われた文字を書く動作を前記加速度センサの計測結果に基づいて認識する文字認識装置であって、
前記筺体が移動されながら行われた文字を書く動作に応じた前記加速度センサからの計測結果を、1文字分の時系列の加速度ベクトル列として取得する取得手段と、
前記取得手段により取得された1文字分の加速度ベクトル列のうち、ベクトルの大きさが大きい値で、かつ互いに略直交する複数本の加速度ベクトルを選択する選択手段と、
前記選択手段により選択された複数本の加速度ベクトルにより張られる平面を特定する平面特定手段と、
前記取得手段により取得された前記1文字分の加速度ベクトル列を前記平面特定手段により特定された平面内の直交する2成分の加速度ベクトル列に変換する第1の変換手段と、
前記第1の変換手段により変換された平面内の2成分の加速度ベクトル列を入力文字データとし、この入力文字データと予め用意されている文字認識用の基本文字データを照合することにより文字認識を行う文字認識手段と、
を具備したことを特徴とする文字認識装置。 - 前記選択手段は、加速度ベクトルの大きさが大きい値で、かつ互いに略直交する複数本のベクトルを複数組選択し、
前記平面特定手段は、前記選択手段により選択された組毎に平面をそれぞれ特定するとともに、この組毎に特定された平面の中から一つの平面を文字が書かれた文字平面として特定する、
ようにしたことを特徴とする請求項1記載の文字認識装置。 - 前記第1の変換手段は、前記3軸の加速度センサの各軸に対応する三つの成分のうち、そのいずれか一つの成分の重力加速度がゼロとなる平面に一致するように前記平面特定手段により特定された平面を回転させたような2成分の加速度ベクトル列に変換する、
ようにしたことを特徴とする請求項1記載の文字認識装置。 - 前記第1の変換手段により変換された2成分の加速度ベクトル列の中から1文字の書き始めの方向を特定する特定手段と、
前記特定手段により特定された1文字の書き始めの方向を、前記文字認識用の基本文字データ内に記憶されている該基本文字の書き始めの方向に一致させるように、前記平面特定手段により特定された平面内の2成分の加速度ベクトル列を回転変換する第2の変換手段と、
をさらに備え、
前記文字認識手段は、前記第2の変換手段により変換された平面内の2成分の加速度ベクトル列を入力文字データとし、この入力文字データと前記基本文字データを照合する、
ようにしたことを特徴とする請求項1記載の文字認識装置。 - 前記第2の変換手段により変換された平面内の2成分の加速度ベクトル列を、前記文字の書き始めの方向を軸として該平面を裏返したように回転する、
ようにしたことを特徴とする請求項4記載の文字認識装置。 - 前記取得手段により取得された加速度ベクトル列に基づいて1文字の書き始めと書き終わりを判別する判別手段をさらに備え、
前記選択手段は、前記判別手段により1文字の書き始めが判別されてから書き終わりが判別されるまでの間、前記取得手段により順次取得された加速度ベクトル列のうち、ベクトルの大きさが大きい値で、かつ互いに略直交する複数本のベクトルを選択する、
ようにしたことを特徴とする請求項1記載の文字認識装置。 - 前記判別手段は、前記加速度センサの計測結果を前記平面内で分離した直交する各成分の加速度における合成ベクトルの大きさが所定の閾値以上で所定時間以上連続しているか否かに基づいて1文字の書き始めと書き終わりを判別する、
ようにしたことを特徴とする請求項6記載の文字認識装置。 - コンピュータに対して、
3軸の加速度センサを内蔵した筺体が平面内で移動されながら行われた文字を書く動作を前記加速度センサの計測結果に基づいて認識する場合に、前記筺体が移動されながら行われた文字を書く動作に応じた前記加速度センサからの計測結果を、1文字分の時系列の加速度ベクトル列として取得する機能と、
前記取得された1文字分の加速度ベクトル列のうち、ベクトルの大きさが大きい値で、かつ互いに略直交する複数本の加速度ベクトルを選択する機能と、
前記選択された複数本の加速度ベクトルにより張られる平面を特定する機能と、
前記取得された前記1文字分の加速度ベクトル列を前記特定された平面内の直交する2成分の加速度ベクトル列に変換する機能と、
前記変換された平面内の2成分の加速度ベクトル列を入力文字データとし、この入力文字データと予め用意されている文字認識用の基本文字データを照合することにより文字認識を行う機能と、
を実現させるためのプログラム。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010171830A JP4877621B1 (ja) | 2010-07-30 | 2010-07-30 | 文字認識装置及びプログラム |
US13/189,744 US8571321B2 (en) | 2010-07-26 | 2011-07-25 | Character recognition device and recording medium |
CN2011102086925A CN102346859B (zh) | 2010-07-26 | 2011-07-25 | 文字识别装置 |
US13/778,253 US8538156B2 (en) | 2010-07-26 | 2013-02-27 | Character recognition device and recording medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010171830A JP4877621B1 (ja) | 2010-07-30 | 2010-07-30 | 文字認識装置及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP4877621B1 true JP4877621B1 (ja) | 2012-02-15 |
JP2012032994A JP2012032994A (ja) | 2012-02-16 |
Family
ID=45781986
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010171830A Expired - Fee Related JP4877621B1 (ja) | 2010-07-26 | 2010-07-30 | 文字認識装置及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4877621B1 (ja) |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08320756A (ja) * | 1995-05-24 | 1996-12-03 | Sharp Corp | データ入力手段を持つ電子機器 |
CN100377043C (zh) * | 2002-09-28 | 2008-03-26 | 皇家飞利浦电子股份有限公司 | 三维手写识别的方法及其系统 |
JP4675718B2 (ja) * | 2005-08-26 | 2011-04-27 | シャープ株式会社 | 動作判別装置、動作判別プログラムおよびコンピュータ読取り可能な記録媒体 |
-
2010
- 2010-07-30 JP JP2010171830A patent/JP4877621B1/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2012032994A (ja) | 2012-02-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8538156B2 (en) | Character recognition device and recording medium | |
CN108596976B (zh) | 相机姿态追踪过程的重定位方法、装置、设备及存储介质 | |
CN108615248B (zh) | 相机姿态追踪过程的重定位方法、装置、设备及存储介质 | |
CN104350509B (zh) | 快速姿势检测器 | |
US7952561B2 (en) | Method and apparatus for controlling application using motion of image pickup unit | |
US10126825B2 (en) | Method for recognizing handwriting on a physical surface | |
JP5051305B2 (ja) | 画像表示装置、画像表示方法及びコンピュータプログラム | |
CN106060379B (zh) | 摄像设备和摄像设备的控制方法 | |
CN107609489B (zh) | 书法书写路径评价装置、方法及电子设备 | |
US10817072B2 (en) | Method and apparatus for performing motion recognition using motion sensor fusion, and associated computer program product | |
CN102906671A (zh) | 手势输入装置及手势输入方法 | |
US20160334877A1 (en) | Real-time 3d gesture recognition and tracking system for mobile devices | |
EP2851868A1 (en) | 3D Reconstruction | |
CN107832736B (zh) | 实时人体动作的识别方法和实时人体动作的识别装置 | |
CN105487644B (zh) | 辨识装置、智能装置以及信息提供方法 | |
CN112927259A (zh) | 基于多相机的裸手追踪显示方法、装置及系统 | |
JP6197702B2 (ja) | 入力方法,プログラム及び入力装置 | |
CN105991928A (zh) | 图像处理装置以及图像处理方法 | |
JP2015043141A (ja) | ジェスチャ認識装置および制御プログラム | |
JP2017191426A (ja) | 入力装置、入力制御方法、コンピュータプログラム、及び記憶媒体 | |
JP6201282B2 (ja) | 携帯電子機器、その制御方法及びプログラム | |
JP4877621B1 (ja) | 文字認識装置及びプログラム | |
EP2765477A2 (en) | Method and apparatus for performing motion recognition using motion sensor fusion, and associated computer program product | |
JP4947501B2 (ja) | 文字認識装置及びプログラム | |
JP4675718B2 (ja) | 動作判別装置、動作判別プログラムおよびコンピュータ読取り可能な記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20111117 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4877621 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20141209 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |