JP5455364B2 - 情報処理装置及び軌跡データ認識方法 - Google Patents

情報処理装置及び軌跡データ認識方法 Download PDF

Info

Publication number
JP5455364B2
JP5455364B2 JP2008334758A JP2008334758A JP5455364B2 JP 5455364 B2 JP5455364 B2 JP 5455364B2 JP 2008334758 A JP2008334758 A JP 2008334758A JP 2008334758 A JP2008334758 A JP 2008334758A JP 5455364 B2 JP5455364 B2 JP 5455364B2
Authority
JP
Japan
Prior art keywords
gesture
data
character
trajectory
trajectory data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2008334758A
Other languages
English (en)
Other versions
JP2010157078A (ja
JP2010157078A5 (ja
Inventor
常一 新井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2008334758A priority Critical patent/JP5455364B2/ja
Priority to US12/642,703 priority patent/US8644612B2/en
Publication of JP2010157078A publication Critical patent/JP2010157078A/ja
Publication of JP2010157078A5 publication Critical patent/JP2010157078A5/ja
Application granted granted Critical
Publication of JP5455364B2 publication Critical patent/JP5455364B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/142Image acquisition using hand-held instruments; Constructional details of the instruments
    • G06V30/1423Image acquisition using hand-held instruments; Constructional details of the instruments the instrument generating sequences of position coordinates corresponding to handwriting

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)

Description

本発明は、情報処理装置及び軌跡データ認識方法に関する。
従来、タッチパネル等の入力手段を持った機器では、入力枠や様々な文字切り方法によって一文字分の軌跡データを抽出し、このデータを認識処理の入力データとする一文字単位の文字認識を行っている。この時、軌跡データには、認識文字を構成する軌跡データ以外の軌跡データは含まれないことが前提となっている。つまり、文字認識処理では文字の認識のみを行っている。又は、ジェスチャ認識が行なわれる時は、認識処理はジェスチャ認識のみを行なっていた。
特開平06−208654号公報 特開平8−305821号公報 特許第03416268号明細書
しかし、特許文献1のペン入力図形編集システムでは、編集要求と文字との入力が同時に入力されることを想定していない為、独立に判断される。特許文献1のペン入力図形編集システムでは、大きさや位置が曖昧な場合等は、編集要求と文字とのどちらに判定されるかは不明である。また、特許文献1のペン入力図形編集システムでは、編集要求が正しく認識されても、次の文字を間違うことも起こりやすかった。
また、特許文献2のデータ処理装置では、所定の軌跡しか抜き出せないので、何番目に、ジェスチャが書かれ、何番目からは文字が書かれると決まっていれば対応が可能であるが、順番が不規則の場合は対応が取れなかった。
また、特許文献3の画像認識装置では、入力された軌跡群をジェスチャ認識手段、文字認識手段、図形認識手段等で認識を行ない、複数の認識結果から一番よい結果を選択するのみである。したがって、特許文献3の画像認識装置では、軌跡群にジェスチャと文字とが混在している場合等の分離に関しては何も考えられていなかった。
従来のジェスチャ認識手段、文字認識手段の組み合わせで、全ての軌跡の組み合わせに対して認識処理を行ない、最適な結果を出力する方法も考えられるが。組み合わせの数が多くなり実用的な計算時間では認識することができない。また、この技術では、組み合わせによっては、間違った組み合わせでも辞書パターンと合致してしまうことがあり、誤認識につながり、実用的ではなかった。また、この技術では、ある軌跡が両方の分離データに含まれる組み合わせで分離認識結果ができてしまう場合もあった。
文字のように書かれる場合、従来の技術等で分離が可能であるが、ジェスチャと文字との混在時は、従来の分離アルゴリズムを用いた技術では不適当で分離ができない事例が多かった。例えば、○のジェスチャ軌跡の中に制御コマンドのパラメータが書かれている場合等は、従来の方式であると1文字のデータとなってしまい認識不能であった。また、書かれたジェスチャ軌跡の外接矩形枠内に制御コマンドのパラメータが書かれている場合等は、従来の方式であると、ジェスチャ及び文字の一部の軌跡と、文字の残り軌跡とに分離される場合、両方の軌跡データとも認識不能になっていた。
本発明はこのような問題点に鑑みなされたもので、ジェスチャ軌跡と文字軌跡とが混在している軌跡群から、実用時間内にジェスチャ軌跡と文字軌跡とを正しく分離することを目的とする。
そこで、本発明は、入力された入力軌跡データの特徴データと、ジェスチャ辞書データに含まれるジェスチャ形状特徴データと、に基づいて、前記入力軌跡データに含まれるジェスチャ軌跡データを認識する処理を実行し、前記処理の結果を出力するジェスチャ軌跡データ認識手段と、前記ジェスチャ軌跡データ認識手段における前記処理の結果に基づいて、前記入力軌跡データからジェスチャ軌跡データと、ジェスチャパラメータ軌跡データと、を分離する分離手段と、前記処理の結果に基づいて、文字数を設定する設定手段と、前記分離手段において分離された前記ジェスチャパラメータ軌跡データの特徴データと、文字辞書データに含まれる文字の軌跡特徴データと、に基づいて、前記ジェスチャパラメータ軌跡データに含まれる、前記文字数を上限とする数の文字の軌跡データを認識する処理を実行し、前記処理の結果を出力する文字軌跡データ認識手段と、を有することを特徴とする。
係る構成とすることにより、ジェスチャ軌跡と文字軌跡とが混在している軌跡群から、実用時間内にジェスチャ軌跡と文字軌跡とを正しく分離することができる。
また、本発明は、軌跡データ認識方法、プログラム及び記憶媒体としてもよい。
本発明によれば、ジェスチャ軌跡と文字軌跡とが混在している軌跡群から、実用時間内にジェスチャ軌跡と文字軌跡とを正しく分離することができる。また、本発明の一態様によれば、ジェスチャ軌跡と付随する文字軌跡との関係から、入力される文字軌跡を限定する事により文字軌跡の分離率、認識率を高める事を実現できる。また、本発明の一態様によれば、同一形状の軌跡でも、軌跡の相対的位置関係の条件設定により、ジェスチャ軌跡と文字軌跡とに分離を実現できる。
以下、本発明の実施形態について図面に基づいて説明する。
<第1の実施形態>
図1は、実施形態に係るシステムのシステム構成の一例を示す図である。情報処理装置の一例である情報端末1には、記録媒体の一例である記録メディア等に記録されている静止画を表示するソフトウェアが組み込まれている。図1の画像上に軌跡が書かれているのは、ユーザが、後述する指示入力装置6等を用いて手書き軌跡を入力し、情報端末1が液晶表示装置7の画面上に手書き軌跡を表示した一例である。
ペン2は、一般的な透明抵抗膜デジタイザ用のペンである。
図2は、情報端末1のハードウェア構成の一例を示す図である。
USBインターフェイス3は、他の機器との接続を行ない、データの入出力を行なう。キーSW4は、機器上のSWの押下等を検出し、検出した結果をCPU8に知らされる。ローカルエリアネットワークのIF(LAN)5は、ネットワーク上の他の機器とのデータのやり取りを実現する。
指示入力装置6は、透明抵抗膜デジタイザで構成される位置座標を入力する装置であって、図1のペン2等で表面上を押下されると、押下された位置のXY位置座標データを、システムバス12を介してCPU8に送る。
液晶表示装置7は、液晶表示素子、液晶制御回路、表示メモリから構成され、システムバス12を介してCPU8と接続されている。液晶表示装置7は、CPU8からの指示に基づいて、軌跡の表示や文字の表示を実行する。
CPU8は、システムバス12を介して、RAM9、ROM10、液晶表示装置7等と接続されており、ROM10に記憶されている後述するプログラム等に基づき、認識処理等を行なう。
RAM9は、ワーク領域として使われる。
ROM10には、実施形態に係る認識処理のプログラムや、後述する辞書等が記憶されている。
メモリカード11には、例えば画像情報等が記憶されている。
システムバス12は、CPU8と、RAM9やROM10、他のデバイス等とのデータのやり取りを担う。
図3は、情報端末1の機能構成等の一例を示す図(その1)である。
図3の14、16、17、18、19、21等に示される各部は、CPU8がROM10等に記憶されているプログラムを実行することによって実現される。
指示入力装置6は、上述したように、ペン2で書かれた軌跡等の位置座標データを検出し、CPU8に軌跡として入力する。入力された軌跡は、CPU8によって、RAM9等の特定領域(後述する軌跡記憶部13)に記憶される。
軌跡記憶部13は、入力された軌跡の位置座標データ列を軌跡単位で記録する。ジェスチャ認識部14は、軌跡記憶部13から軌跡データ(軌跡の位置座標データ列)を取得する。
ジェスチャ認識部14は、取得した軌跡の位置座標データ列から、軌跡の特徴データを抽出し、抽出した特徴データと、ジェスチャ辞書15のデータ(例えばジェスチャ形状特徴)と、のマッチング処理を実行する。ジェスチャ認識部14は、例えば抽出した特徴データと一番近いジェスチャ形状特徴(ジェスチャ形状特徴データ)のジェスチャコード(ジェスチャ形状を現すコード)、又はコマンド種類等を認識結果として出力する。
ジェスチャ辞書15は、登録されているジェスチャのジェスチャコード、ジェスチャ形状特徴(軌跡形状特徴)、ジェスチャパラメータ条件等を含む辞書データである。
分離部16は、ジェスチャ軌跡(ジェスチャ軌跡データ)と他の軌跡(他の軌跡データ)とを分離する。より具体的に説明すると、分離部16は、ジェスチャ軌跡と文字軌跡とが同時に入力されたときに、その軌跡をジェスチャ認識部14の認識結果に応じて分離する。
認識条件設定部17は、ジェスチャ辞書15に記述されているジェスチャパラメータ条件に応じて文字切り部18に文字数等を設定する。
文字切り部18は、認識条件設定部17から送られてくる文字数を上限として、分離部16から送られて来る文字軌跡群を1文字ずつの軌跡データに分離する。
文字認識部19は、文字切り部18から送られてくる1文字ずつの軌跡データの特徴データと、文字辞書データの一例である文字認識辞書20の例えば文字の軌跡特徴データと、のマッチングを行なう。そして、文字認識部19は、一番一致する軌跡データの文字の文字コードを認識結果として出力する。
コマンド処理部21は、ジェスチャ認識部14から送られてくるコマンド種類と、文字認識部19から送られてくる文字コードが現すジェスチャコマンドパラメータと、に応じて、コマンドに係る処理(例えば印刷サイズA4の表示、設定等)を行なう。
また、コマンド処理部21は、例えばジェスチャ認識部14等からの軌跡の表示指示をトリガーに、軌跡の表示や、認識結果等を液晶表示装置7に表示する。
図4は、ジェスチャ辞書データの構成の一例を示した図(その1)である。図4に示されるように、1つのジェスチャ辞書データは、ジェスチャコード、ジェスチャ形状特徴(ジェスチャ形状の特徴データ)、ジェスチャパラメータ条件、ジェスチャ分離条件、コマンド種類のデータから構成されている。登録されているジェスチャ形状特徴は、通常の英数字、かな、漢字の文字を形成する1筆とは異なる形状で、ユニークな書き方のデータが登録されている。
例えば、0002のジェスチャコードは、印刷を実行するジェスチャコードで、丸い軌跡と印刷枚数を指定する数字とから構成されている。0002のジェスチャコードは、通常の文字の0とは異なる開始点から書かれている。
例えば、0002のジェスチャと数字の3とがペン2を用いてユーザによって書かれた場合、情報端末1は、「3枚印刷する」と指示されたと認識することになる。又は、ペン2を用いてユーザによって0002のジェスチャと数字の11とが書かれた場合、情報端末1は、「11枚印刷する」と指示されたと認識する。
本実施形態では、ジェスチャ辞書は、ジェスチャ軌跡だけが登録されている構成であるが、ジェスチャ軌跡と、文字と、を形成する軌跡、例えば"/−3"もジェスチャ辞書に登録するようにしてもよい。このような構成とした場合、情報端末1は、文字軌跡を表わす文字軌跡コードを認識結果とする。
図5は、軌跡の入力の一例を示した図(その1)である。22は、表示入力画面である。23、24の四角で表示されているのが縮小表示されている静止画である。
図6は、軌跡データの一例を示す図(その1)である。25は、1筆目の始点である。26は、1筆目の第2点である。30は、1筆目の終了点である。31は、2筆目の始点である。32は、3筆目の始点である。33は、4筆目の始点である。34は、5筆目の始点である。35は、6筆目の始点である。
図7は、ジェスチャ認識処理(ジェスチャ軌跡データ認識の処理)の一例を示すフローチャートである。
ここで説明する処理が開始される状態は、ジェスチャ軌跡と、ジェスチャコマンドパラメータである文字軌跡と、の入力が終了した時点である。なお、軌跡が入力される毎に認識を行なっていく処理方法も採用可能であるが、説明を簡単にする為に、全軌跡が入力されてから図7に示す処理が開始されることとする。ユーザが入力し、一定時間経過したか、認識処理開始指示エリアとして、入力領域外をペンで押下すると、以下の処理が開始されることとする。例えば、図6のような軌跡25、・・・、30、31、32、34、35、が入力された後、処理が開始されたものとする。
ジェスチャ認識処理が開始されると、ジェスチャ認識部14によって、ワーク領域が確保され、初期化され、入力されている全軌跡の位置座標データ列が読み込まれる。入力された軌跡は、辞書化時と同じ値の座標範囲に正規化される。例えば0から100の範囲に正規化される。
ステップS72において、ジェスチャ認識部14は、1軌跡(1ストローク)のデータを読み込む処理を行なう。例えば、図6の軌跡であれば、1筆目の軌跡データ25、・・・、30がジェスチャ認識部14によって記憶バッファに読み込まれる。
ステップS73において、ジェスチャ認識部14によって、軌跡の特徴抽出処理が行われる。例えば、ジェスチャ認識部14は、軌跡を等距離で10等分し、その位置座標点を特徴点として出力する。
ステップS74において、ジェスチャ認識部14は、ジェスチャ辞書15のジェスチャ形状特徴を読み込む処理を行なう。まずジェスチャ認識部14は、ジェスチャ0001のジェスチャ形状特徴の位置座標を読み込む。次にジェスチャ認識部14は、ジェスチャ0002、0003、0004のジェスチャ形状特徴を読み込む。
ステップS75において、ジェスチャ認識部14は、軌跡の特徴データと、ジェスチャ辞書15のジェスチャ形状特徴のデータと、の一致度を計算する処理を行う。例えば、ジェスチャ認識部14は、正規化した軌跡の10等分した位置座標点と、ジェスチャ辞書15に登録されているジェスチャ形状特徴の位置座標点と、が全て同一であれば、一致度100%とする。
例えば、ジェスチャ認識部14は、図6の例の、軌跡の1筆目25、・・・、30は、ジェスチャ辞書15のジェスチャコード0003と一致度90%であると判断する。なお、ジェスチャ認識部14は、次の軌跡の31は、該当するジェスチャ辞書15のジェスチャ形状特徴が存在しないと判断する。
ステップS76において、ジェスチャ認識部14は、軌跡の認識結果を記憶する処理を行なう。ここで、ジェスチャ認識部14は、順次、1筆目、2筆目、・・・、最後の軌跡までの認識結果を認識結果のバッファに記憶する。
ステップS77において、ジェスチャ認識部14は、全ての軌跡の評価が終了したか否かの判断を行なう。ジェスチャ認識部14は、終了したと判断した場合、ステップS78に進み、未処理の軌跡があると判断した場合、次の軌跡を処理する為にステップS72に戻る。
ステップS78において、ジェスチャ認識部14は、軌跡の評価の中で一致度が高いジェスチャコードを記憶する処理を行なう。図6の例の場合、ジェスチャ認識部14は、1筆目の軌跡と一致度が90%であると判断したジェスチャコード0003を記憶する。
そして、ジェスチャ認識部14は、ジェスチャ認識処理を終了する。
図7に示す処理によって、軌跡の中で、通常は1筆が入力ジェスチャとして認識され、ジェスチャ認識の結果が記憶され、それ以外はジェスチャの認識の結果、該当無し、又は、一致度が低いジェスチャ認識の結果が出力される。ユーザが、正しいジェスチャを書かなければ、全ての軌跡のジェスチャ認識の結果が該当無しとなる場合もあるが、この場合は以後の処理は意味をなさないので情報端末1は、処理を中断する。
なお、本実施形態では、ジェスチャ辞書15に登録されている各ジェスチャ(ジェスチャ形状特徴)は1筆で構成されているものとして説明を行っている。しかし、ジェスチャ辞書15を、2筆のジェスチャ形状特徴と1筆のジェスチャ形状特徴とが登録されているように構成してもよい。この場合、図7のフローチャートの処理が以下の様になる。
まず、ジェスチャ認識部14は、1筆のジェスチャ辞書のデータで、全軌跡を認識処理し、一番一致度が高い軌跡と一致度とを記憶しておく。次にジェスチャ認識部14は、2筆のジェスチャ辞書のデータで、入力軌跡の2つの軌跡の組み合わせを認識処理し、一番一致度が高い2つの軌跡の組み合わせと一致度とを記憶しておく。ジェスチャ認識部14は、2筆に係る一致度と1筆に係る一致度とを比較し、一致度が高い方のジェスチャコード等をジェスチャ認識の結果として採用する。これにより、情報端末1は、軌跡から、認識結果に応じて、次の図8の軌跡分離処理によって、2筆か又は1筆をジェスチャ軌跡(ジェスチャ軌跡データ)として分離し、それ以外(ジェスチャ軌跡データ以外)を文字軌跡として分離することができる。3筆のジェチャがあればそれも同様な構成となる。なお、2筆のジェスチャ辞書データとマッチングする軌跡の組み合わせであるが、"1筆目2筆目3筆目4筆目5筆目"の入力軌跡データ例で説明すると。"12"と"23"と"34"と"45"等の近辺にある軌跡又は、入力順に近い軌跡等が組み合わせの候補になる。
次に軌跡分離処理を説明する。図8は、軌跡分離処理の一例を示すフローチャート(その1)である。軌跡分離処理が開始されると、分離部16によって、ワーク領域等が確保され初期化が行なわれる。
ステップS82において、分離部16は、1軌跡の認識結果を読み込む。より具体的に説明すると、分離部16は、図7で示した認識結果を読み込む。例えば、図6の第1軌跡の認識結果がジェスチャコード0003と一致度90%とになっていた場合、分離部16は、これらを認証結果として読み込む。
ステップS83において、分離部16は、認識結果の評価値(一致度)がジェスチャ分離条件以下か否かを判定する。分離部16は、ジェスチャ分離条件以下の評価値であれば、ステップS84に進み、そうでなければステップS82に戻る。例えば、その軌跡の認識結果がジェスチャコード0003と一致度90%との場合、ジェスチャコード0003のジェスチャ分離条件は一致度80%以上なので、分離部16は、ステップS82に戻る。つまり、分離部16は、この軌跡を文字軌跡群に記憶しない。認識結果として、ジェスチャコードが該当無しの場合、分離部16は、其のまま文字軌跡群として分離する。
ステップS84において、分離部16は、ステップS82で読み込んだ軌跡を文字軌跡として記憶バッファに記憶する。全ての文字軌跡のデータがそろったと判定した場合、分離部16は、文字軌跡群を文字切り部18に渡す。
ステップS85において、分離部16は、全軌跡の処理が終わったか否かの判定を行なう。分離部16は、処理が終わったと判定すると、図8に示す処理を終了し、そうでないと判定した場合、次の軌跡データを読み込む為にステップS82に戻る。
次に文字軌跡の分離処理を説明する。図9は、分離処理の一例を示すフローチャートである。なお、以下に示す分離処理は、簡単に説明すると、複数文字からなる文字軌跡の位置座標データを1文字毎の位置座標データに区切る処理である。
文字軌跡の分離処理が開始されると、文字切り部18は、ワーク領域を確保し、初期化を行なう。
ステップS92において、認識条件設定部17は、ジェスチャ辞書から条件情報の一例であるジェスチャパラメータ条件を読み込み、文字切り部18に設定する。認識条件設定部17は、図4で表した、ジェスチャ辞書の該当するジェスチャコードのジェスチャパラメータ条件を読み込み、文字切り部18に設定する。例えば、ユーザは、ジェスチャが印刷ジェスチャであれば、何枚印刷するかを印刷ジェスチャ入力時に同時に指定することができる。本実施形態では、例えば99枚まで指示することができるとしているため、2桁までの数字がジェスチャパラメータ条件となっている。なお、図6の入力例では、ジェスチャコードは0003の印刷サイズなので、ジェスチャパラメータ条件は2桁の英数字となる。例えば、A4、A3、B5等である。なお、葉書、封筒等を考慮し、ジェスチャパラメータ条件を2桁の英数字、漢字としてもよい。
ステップS93において、文字切り部18は、図8の処理で分離部16が記憶バッファに記憶した文字軌跡群を読み込む。
ステップS94において、文字切り部18は、読み込んだジェスチャパラメータ条件の文字数と、軌跡群の外接枠と、に基づいて、1文字分の仮想文字枠を作成する。例えば、ジェスチャコードが0003で、ジェスチャパラメータ条件が2桁の英数字、文字軌跡が"A4"の場合、文字切り部18は、2個の仮想文字枠□□を作成する。
ステップS95において、文字切り部18は、1軌跡を読み込む処理を行なう。より具体的に説明すると、文字切り部18は、1軌跡の位置座標データ列をワーク領域に読み込む。
ステップS96において、文字切り部18は、全軌跡の処理が終了したか否かの判定を行なう。文字切り部18は、終了したと判定した場合、ステップS910に進み、終了していないと判定した場合、そうでなければ、ステップS97に進む。
ステップS97において、文字切り部18は、ステップS95で読み込んだ軌跡が現在注目している仮想文字枠の中か否かを判断する。即ち、1文字目の仮想文字枠のチェック、2文字目のチェックと順次処理する。文字切り部18は、中であると判断した場合、ステップS99に進み、中でないと判断した場合、ステップS98に進む。ステップS97の判断で、文字切り部18は、最初に仮想文字枠□□の左の枠内の文字軌跡を1文字目として切り出し、次に右の枠内の文字軌跡を2文字目として切り出す。
ステップS98において、文字切り部18は、次の仮想文字枠のデータを切り出す為の準備を行なう。より具体的に説明すると、文字切り部18は、仮想文字枠の位置データを左の枠から右の枠にする為に移動し、軌跡のカウンターを減算する。
ステップS99において、文字切り部18は、文字切り結果のN文字の軌跡データを記憶していく。
ステップS910において、文字切り部18は、ステップS99で1文字毎に分離、記憶した文字軌跡データを文字認識部19に送る。
次に文字認識処理を説明する。図10は、文字認識処理(文字軌跡データ認識の処理)の一例を示すフローチャートである。
文字認識処理が開始されると、文字認識部19は、ワーク領域を確保し、初期化を行なう。
ステップS102において、認識条件設定部17は、ジェスチャ辞書からパラメータの文字種を読み込み、文字認識部19に設定する。例えば、図6の入力例の場合、ジェスチャコードが0003なので、認識条件設定部17は、文字種として英数字がジェスチャ辞書から読み込み、文字認識部19に設定する。
ステップS103において、文字認識部19は、文字認識エンジンの文字種の設定を行なう。図6の入力例の場合、文字認識部19は、文字種として英数字を文字認識エンジンにセットする。このことによって、文字認識辞書が英数字に限定される。
ステップS104において、文字認識部19は、1文字分の軌跡をワーク領域に読み込む。
ステップS105において、文字認識部19は、軌跡データの特徴データを抽出する。例えば、文字認識部19は、1軌跡を10等分し、その等分した軌跡を8方向のベクトルデータに変換する。
ステップS106において、文字認識部19は、設定された文字種の文字認識辞書の辞書データを読み込む。例えば、文字種が英数字に設定されている場合、文字認識部19は、英数字の文字認識辞書の辞書データだけを読み込む。
ステップS107において、文字認識部19は、軌跡データの特徴データと、文字認識辞書の辞書データに含まれる文字の軌跡特徴データと、のマッチング処理を行ない、一番類似度が高い辞書軌跡特徴データの文字コードを認識結果とする。
ステップS108において、文字認識部19は、軌跡全文字の処理が終了したか否かの判断を行なう。文字認識部19は、全ての軌跡全文字の処理が終了したと判断した場合、ステップS109に進み、そうでなければ、次の文字軌跡データを読み込む為にステップS104に戻る。
ステップS109において、文字認識部19は、認識結果として、認識した文字の文字コードをコマンド処理部21に出力する処理を行なう。
図11は、ジェスチャ認識等の結果、表示される画面の一例を示す図(その1)である。
図5のように入力された軌跡が、ジェスチャ認識部14において印刷サイズを設定するコマンドのジェスチャが認識され、文字認識部19において"A4"が認識された結果、コマンド処理部21によって、図11に示されるような画面が液晶表示装置7に表示される。なお、表示は一例であり、コマンド処理部21は、"A4"をフォントの文字で表示し、ジェスチャは軌跡又はコマンドを表すアイコンで表示するようにしてもよい。
また、コマンド処理部21は、各文字、アイコン表示上をペン2等で押下されると、別の候補を表示(例えばA4をB4等に変更して表示)するようにしてもよい。
以上、情報端末1が上述した処理を実行することにより、枠が無い自由な平面に自由な順番で書かれた手書きジェスチャ軌跡と文字軌跡とを適切に分離、認識し、処理することができる。
なお、上述した処理を実行することにより、情報端末1は、ジェスチャ軌跡、文字軌跡の順でも、文字軌跡、ジェスチャ軌跡の順でも、文字軌跡、ジェスチャ軌跡、文字軌跡でもあっても適切に分離、認識することができる。
<第2の実施形態>
第1の実施形態では、ジェスチャの形状、書き方は特殊なものなので、ジェスチャ認識の結果でジェスチャ軌跡とジェスチャコマンドパラメータである文字の軌跡とを分離した。しかし、実装機器によっては通常の文字の書き方と同じ形状の軌跡をジェスチャとする実施形態も考えられる。
第2の実施形態では、第1の実施形態の構成に加え、ジェスチャ軌跡と他の軌跡との位置条件判定部を設ける構成とする。
図12は、情報端末1の機能構成等の一例を示す図(その2)である。なお、第1の実施形態と異なる点を主に説明する。
位置条件判定部37は、ジェスチャ辞書に記録されている位置条件を、該当するジェスチャ軌跡が満たしているか否かの判定を行なう。
図13は、ジェスチャ辞書データの構成の一例を示した図(その2)である。1つのジェスチャ辞書データは、ジェスチャコード、ジェスチャ形状特徴(ジェスチャ形状の特徴データ)、ジェスチャパラメータ条件、ジェスチャ分離条件、コマンド種類、位置条件のデータから構成されている。
位置条件とは、ジェスチャ軌跡と、同時に書くジェスチャコマンドパラメータである文字軌跡と、の位置条件である。例えば、ジェスチャコード0002の場合、パラメータ文字軌跡はジェスチャ軌跡の中に書くことと位置条件が設定されている。
文字として"◎"みたいなものが辞書に登録されている場合、軌跡の位置条件は内包する軌跡は、2筆以上とか、細かくは軌跡の形の組み合わせ条件等を記憶しておけばよい。
図14は、軌跡の入力の一例を示した図(その2)である。38が1筆目の軌跡である。39が2筆目の軌跡である。40が3筆目の軌跡である。
図15は、軌跡データの一例を示す図(その2)である。
図16は、位置条件判定処理の一例を示すフローチャートである。なお、図16に示す処理が開始される前に、
この処理が呼ばれる前に、ジェスチャ認識部14によるジェスチャ認識処理は終了しているものとする。
位置条件判定処理が開始されると、位置条件判定部37は、ワーク領域を確保し、初期化を行なう。
ステップS162において、位置条件判定部37は、1軌跡の結果をワーク領域に読み込む。より具体的に説明すると、位置条件判定部37は、例えば、図14の入力例の場合、軌跡40を表すジェスチャコード0002等を読み込む。
ステップS163において、位置条件判定部37は、読み込んだジェスチャコードに応じてジェスチャ辞書の位置条件を読み込む。軌跡40がジェスチャコード0002と認識されていれば、ジェスチャコード0002の位置条件である文字軌跡はジェスチャ軌跡内に存在するという位置条件が読み込まれる。
ステップS164において、位置条件判定部37は、他の軌跡を検査用ワーク領域に読み込む。
ステップS165において、位置条件判定部37は、ステップS163で読み込んだ位置条件をS164で読み込んだ軌跡が全て条件を満たすか否かを判定する。位置条件を満たす場合、位置条件判定部37は、ステップS166に進み。位置条件を満たさない場合、位置条件判定部37は、ステップS167に進む。
例えば、図14の入力例の場合、外側"○"軌跡40の認識結果がジェスチャコード0002の場合、ジェスチャコマンドパラメータの文字軌跡はジェスチャ軌跡内に存在するという条件が読み込まれている。この場合、1筆目、2筆目の軌跡38"1"、39"○"が中に書かれているので位置条件判定部37は、位置条件を満たすと判定する。一方、2筆目の39"○"の認識結果もジェスチャコード0002であるが、1筆目、3筆目共に外側に書かれているので、位置条件判定部37は、位置条件を満たさないと判定する。
ステップS166において、位置条件判定部37は、位置条件を満たした、軌跡の番号とこの軌跡のジェスチャコードとを記憶する。
ステップS167において、位置条件判定部37は、全ての軌跡を処理したか否かを判定する。位置条件判定部37は、全ての軌跡を処理したと判定した場合、ステップS166で記憶した条件を満たした、軌跡の番号とジェスチャコードとを出力し、図16に示す処理を終了する。位置条件判定部37は、一方、全ての軌跡を処理していないと判定した場合、ステップS162に戻る。
図17は、軌跡分離処理の一例を示すフローチャート(その2)である。軌跡分離処理が開始されると、分離部16によって、ワーク領域等が確保され初期化が行なわれる。
ステップS172において、分離部16は、1軌跡の認識結果を読み込む。この1軌跡の認識結果は、位置条件の判定処理が行なわれた後の認識結果である。1軌跡目の"1"38は、該当するジェスチャが無いのでジェスチャコードは無い。2軌跡目"○"39は、位置条件を満たさないのでジェスチャコードは無い。3軌跡目"○"40は、位置条件を満たすのでジェスチャコードが存在し、0002である。
ステップS173において、分離部16は、ステップS172で読み込んだ軌跡がジェスチャ軌跡であるか否かを判定する。分離部16は、ジェスチャ軌跡であると判定した場合、ステップS172に進み、ジェスチャ軌跡でないと判定した場合、ステップS174に進む。
ステップS174において、分離部16は、ステップS172で読み込んだ軌跡を文字軌跡として、記憶バッファに記憶する。例えば、図14の入力例の場合、ジェスチャ認識の結果と、軌跡の位置条件の結果と、から、1筆目と2筆目との"1○"の軌跡が文字軌跡として記憶される。
ステップS175において、分離部16は、全軌跡を処理したか否かの判定を行なう。分離部16は、全軌跡を処理したと判定した場合、図17に示す処理を終了し、全軌跡を処理していないと判定した場合、次の軌跡を処理する為にステップS172に戻る。
その後の処理は、実施形態1と同一になる。
図14の38、39、40"10○"が印刷10枚のよう認識されると、コマンド処理部21によって、図18の50に示すような画面(確認画面)が液晶表示装置7上に表示される。図18は、ジェスチャ認識等の結果、表示される画面の一例を示す図(その2)である。
以上、情報端末1が上述した処理を実行することにより、ジェスチャ軌跡と文字の軌跡とが同一でも、位置条件によってジェスチャか文字かを判別することができる。つまり、ジェスチャ軌跡と文字軌跡とを同時に書いても適切に分離し、正しい認識処理を実行することができる。これにより、登録するジェスチャの形状を自由に設定することができるのでユーザが書き易い形や、形からコマンド種別を連想できるもの等を登録することができる情報端末1を提供することができる。
<その他の実施形態>
また、本発明の目的は、以下のようにすることによって達成される。即ち、上述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体(又は記録媒体)を、システム或いは装置に供給する。そして、そのシステム或いは装置の中央演算処理手段(CPUやMPU)が記憶媒体に格納されたプログラムコードを読み出し実行する。この場合、記憶媒体から読み出されたプログラムコード自体が上述した実施形態の機能を実現することになり、そのプログラムコードを記録した記憶媒体は本発明を構成することになる。
また、システム或いは装置の前記中央演算処理手段が読み出したプログラムコードを実行することにより、そのプログラムコードの指示に基づき、システム或いは装置上で稼働しているオペレーティングシステム(OS)等が実際の処理の一部又は全部を行う。その処理によって上述した実施形態の機能が実現される場合も含まれる。
更に、記憶媒体から読み出されたプログラムコードが、前記システム或いは装置に挿入された機能拡張カードや、接続された機能拡張ユニットに備わるメモリに書込まれたとする。その後、そのプログラムコードの指示に基づき、その機能拡張カードや機能拡張ユニットに備わるCPU等が実際の処理の一部又は全部を行ない、その処理によって上述した実施形態の機能が実現される場合も含まれる。
本発明を前記記憶媒体に適用する場合、その記憶媒体(コンピュータ読み取り可能な記憶媒体)には、先に説明したフローチャートに対応するプログラムコードが格納されることになる。
以上、上述した各実施形態によれば、ユーザの自由な順番で書かれた軌跡を認識し、軌跡が示す指示に応じた処理を実行することができる。また、上述した各実施形態によれば、ジェスチャ軌跡と付随する文字軌跡との関係から、文字軌跡の分離率、認識率を高めることもできる。
また、第2の実施形態によれば、同一形状の軌跡でも、ジェスチャ軌跡とジェスチャコマンドパラメータ文字軌跡との位置関係の条件設定により分離を行なえるので、より使いやすくなる。
また、ジェスチャ辞書に登録するジェスチャ軌跡を1筆の軌跡のみとすると、辞書サイズを小型にすることができ、高速処理を実現することができる。
上述した各実施形態によれば、ジェスチャ軌跡と文字軌跡とが混在している軌跡群から、実用時間内にジェスチャ軌跡と文字軌跡とを正しく分離することができる。
以上、本発明の好ましい実施形態について詳述したが、本発明は係る特定の実施形態に限定されるものではなく、特許請求の範囲に記載された本発明の要旨の範囲内において、種々の変形・変更が可能である。
実施形態に係るシステムのシステム構成の一例を示す図である。 情報端末1のハードウェア構成の一例を示す図である。 情報端末1の機能構成等の一例を示す図(その1)である。 ジェスチャ辞書のデータの構成の一例を示した図(その1)である。 軌跡の入力の一例を示した図(その1)である。 軌跡データの一例を示す図(その1)である。 ジェスチャ認識処理の一例を示すフローチャートである。 軌跡分離処理の一例を示すフローチャート(その1)である。 分離処理の一例を示すフローチャートである。 文字認識処理の一例を示すフローチャートである。 ジェスチャ認識等の結果、表示される画面の一例を示す図(その1)である。 情報端末1の機能構成等の一例を示す図(その2)である。 ジェスチャ辞書のデータの構成の一例を示した図(その2)である。 軌跡の入力の一例を示した図(その2)である。 軌跡データの一例を示す図(その2)である。 位置条件判定処理の一例を示すフローチャートである。 軌跡分離処理の一例を示すフローチャート(その2)である。 ジェスチャ認識等の結果、表示される画面の一例を示す図(その2)である。
符号の説明
1 情報端末
2 ペン

Claims (10)

  1. 入力された入力軌跡データの特徴データと、ジェスチャ辞書データに含まれるジェスチャ形状特徴データと、に基づいて、前記入力軌跡データに含まれるジェスチャ軌跡データを認識する処理を実行し、前記処理の結果を出力するジェスチャ軌跡データ認識手段と、
    前記ジェスチャ軌跡データ認識手段における前記処理の結果に基づいて、前記入力軌跡データからジェスチャ軌跡データと、ジェスチャパラメータ軌跡データと、を分離する分離手段と、
    前記処理の結果に基づいて、文字数を設定する設定手段と、
    前記分離手段において分離された前記ジェスチャパラメータ軌跡データの特徴データと、文字辞書データに含まれる文字の軌跡特徴データと、に基づいて、前記ジェスチャパラメータ軌跡データに含まれる、前記文字数を上限とする数の文字の軌跡データを認識する処理を実行し、前記処理の結果を出力する文字軌跡データ認識手段と、
    を有することを特徴とする情報処理装置。
  2. 記設定手段で設定された前記文字数を上限として、前記ジェスチャパラメータ軌跡データを1文字ずつの文字の軌跡データに分離する文字切り手段を更に有し、
    前記文字軌跡データ認識手段は、前記文字切り手段で分離された1文字ずつの文字の軌跡特徴データと、文字辞書データに含まれる文字の軌跡特徴データと、に基づいて、前記ジェスチャパラメータ軌跡データに含まれる1文字ずつの文字の軌跡データを認識する処理を実行し、前記処理の結果を出力することを特徴とする請求項1に記載の情報処理装置。
  3. 前記設定手段は、前記ジェスチャ軌跡データに係るジェスチャパラメータ条件情報に基づいて、前記文字数を設定することを特徴とする請求項2に記載の情報処理装置。
  4. 前記ジェスチャ軌跡データ認識手段による前記処理の結果、認識されたジェスチャ軌跡データと、ジェスチャパラメータ軌跡データと、が、前記ジェスチャ軌跡データ認識手段による前記処理に用いられた前記入力軌跡データに含まれる前記ジェスチャ軌跡データと、ジェスチャパラメータ軌跡データと、の位置条件を満たすか否かを判定する判定手段を更に有し、
    前記分離手段は、前記判定手段において前記位置条件を満たすと判定された場合、前記軌跡データからジェスチャ軌跡データと、ジェスチャパラメータ軌跡データと、を分離することを特徴とする請求項1乃至3の何れか1項に記載の情報処理装置。
  5. 情報処理装置が実行する軌跡データ認識方法であって、
    入力された入力軌跡データの特徴データと、ジェスチャ辞書データに含まれるジェスチャ形状特徴データと、に基づいて、前記入力軌跡データに含まれるジェスチャ軌跡データを認識する処理を実行し、前記処理の結果を出力するジェスチャ軌跡データ認識ステップと、
    前記ジェスチャ軌跡データ認識ステップにおける前記処理の結果に基づいて、前記軌跡データからジェスチャ軌跡データと、ジェスチャパラメータ軌跡データと、を分離する分離ステップと、
    前記処理の結果に基づいて、文字数を設定する設定ステップと、
    前記分離ステップにおいて分離された前記ジェスチャパラメータ軌跡データの特徴データと、文字辞書データに含まれる文字の軌跡特徴データと、に基づいて、前記ジェスチャパラメータ軌跡データに含まれる、前記文字数を上限とする数の文字の軌跡データを認識する処理を実行し、前記処理の結果を出力する文字軌跡データ認識ステップと、
    を含むことを特徴とする軌跡データ認識方法。
  6. 記設定ステップで設定された前記文字数を上限として前記ジェスチャパラメータ軌跡データを1文字ずつの文字の軌跡データに分離する文字切りステップを更に含み、
    前記文字軌跡データ認識ステップでは、前記文字切りステップで分離された1文字ずつの文字の軌跡特徴データと、文字辞書データに含まれる文字の軌跡特徴データと、に基づいて、前記ジェスチャパラメータ軌跡データに含まれる1文字ずつの文字の軌跡データを認識する処理を実行し、前記処理の結果を出力することを特徴とする請求項5に記載の軌跡データ認識方法。
  7. 前記設定ステップでは、前記ジェスチャ軌跡データに係るジェスチャパラメータ条件情報に基づいて、前記文字数を設定することを特徴とする請求項6に記載の軌跡データ認識方法。
  8. 前記ジェスチャ軌跡データ認識ステップにおける前記処理の結果、認識されたジェスチャ軌跡データと、ジェスチャパラメータ軌跡データと、が、前記ジェスチャ軌跡データ認識ステップでの前記処理に用いられた前記入力軌跡データに含まれる前記ジェスチャ軌跡データと、ジェスチャパラメータ軌跡データと、の位置条件を満たすか否かを判定する判定ステップを更に有し、
    前記分離ステップでは、前記判定ステップにおいて前記位置条件を満たすと判定された場合、前記軌跡データからジェスチャ軌跡データと、ジェスチャパラメータ軌跡データと、を分離することを特徴とする請求項5乃至7の何れか1項に記載の軌跡データ認識方法。
  9. コンピュータを、
    入力された入力軌跡データの特徴データと、ジェスチャ辞書データに含まれるジェスチャ形状特徴データと、に基づいて、前記入力軌跡データに含まれるジェスチャ軌跡データを認識する処理を実行し、前記処理の結果を出力するジェスチャ軌跡データ認識手段と、
    前記ジェスチャ軌跡データ認識手段における前記処理の結果に基づいて、前記入力軌跡データからジェスチャ軌跡データと、ジェスチャパラメータ軌跡データと、を分離する分離手段と、
    前記処理の結果に基づいて、文字数を設定する設定手段と、
    前記分離手段において分離された前記ジェスチャパラメータ軌跡データの特徴データと、文字辞書データに含まれる文字の軌跡特徴データと、に基づいて、前記ジェスチャパラメータ軌跡データに含まれる、前記文字数を上限とする数の文字の軌跡データを認識する処理を実行し、前記処理の結果を出力する文字軌跡データ認識手段と、
    して機能させることを特徴とするプログラム。
  10. 請求項9に記載のプログラムを記憶したコンピュータにより読み取り可能な記憶媒体。
JP2008334758A 2008-12-26 2008-12-26 情報処理装置及び軌跡データ認識方法 Active JP5455364B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2008334758A JP5455364B2 (ja) 2008-12-26 2008-12-26 情報処理装置及び軌跡データ認識方法
US12/642,703 US8644612B2 (en) 2008-12-26 2009-12-18 Information processing apparatus and locus data recognition method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008334758A JP5455364B2 (ja) 2008-12-26 2008-12-26 情報処理装置及び軌跡データ認識方法

Publications (3)

Publication Number Publication Date
JP2010157078A JP2010157078A (ja) 2010-07-15
JP2010157078A5 JP2010157078A5 (ja) 2012-02-09
JP5455364B2 true JP5455364B2 (ja) 2014-03-26

Family

ID=42285064

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008334758A Active JP5455364B2 (ja) 2008-12-26 2008-12-26 情報処理装置及び軌跡データ認識方法

Country Status (2)

Country Link
US (1) US8644612B2 (ja)
JP (1) JP5455364B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102799365A (zh) * 2012-06-29 2012-11-28 鸿富锦精密工业(深圳)有限公司 电子设备及其圈选打印及传真方法
JP5843166B2 (ja) * 2012-09-13 2016-01-13 ブラザー工業株式会社 印刷装置
CN112204505A (zh) * 2018-06-06 2021-01-08 索尼公司 信息处理装置、信息处理方法和程序

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2531882B2 (ja) * 1991-12-11 1996-09-04 インターナショナル・ビジネス・マシーンズ・コーポレイション オンライン手書き文字認識
JPH06208654A (ja) 1993-01-08 1994-07-26 Hitachi Software Eng Co Ltd ペン入力図形編集システム
US5812697A (en) * 1994-06-10 1998-09-22 Nippon Steel Corporation Method and apparatus for recognizing hand-written characters using a weighting dictionary
JP3416268B2 (ja) 1994-06-30 2003-06-16 キヤノン株式会社 画像認識装置及びその方法
JPH08305821A (ja) 1995-04-28 1996-11-22 Canon Inc データ処理方法とその装置
JP3839877B2 (ja) * 1996-07-05 2006-11-01 キヤノン株式会社 手書きパターン処理装置及び手書きパターン処理方法
JP2001265481A (ja) * 2000-03-21 2001-09-28 Nec Corp ページ情報表示方法及び装置並びにページ情報表示用プログラムを記憶した記憶媒体
JP2004213521A (ja) * 2003-01-08 2004-07-29 Canon Inc ペン入力情報処理方法
JP5042562B2 (ja) * 2006-08-22 2012-10-03 株式会社リコー 画像処理装置、手書き情報認識方法、手書き情報認識プログラム

Also Published As

Publication number Publication date
JP2010157078A (ja) 2010-07-15
US20100166313A1 (en) 2010-07-01
US8644612B2 (en) 2014-02-04

Similar Documents

Publication Publication Date Title
US7630551B2 (en) Method and system for line extraction in digital ink
JP3744997B2 (ja) 文字認識装置及びその方法
JP2007317022A (ja) 手書文字処理装置及び手書文字処理方法
JPH03161891A (ja) 表形式文書読取装置
JPH02266485A (ja) 情報認識装置
JP5455364B2 (ja) 情報処理装置及び軌跡データ認識方法
JPH07146918A (ja) 手書き文字認識装置
US7133556B1 (en) Character recognition device and method for detecting erroneously read characters, and computer readable medium to implement character recognition
JPH05225399A (ja) 文書処理装置
JP4128325B2 (ja) 文字認識装置及び文字認識方法
JPS61272882A (ja) 情報認識装置
JP3075808B2 (ja) 文書処理装置
JPS61150081A (ja) 文字認識装置
JPH01103787A (ja) 個人辞書作成機能付手書文字認識装置
JP3780023B2 (ja) 文字認識装置及びその方法
JPS62190565A (ja) 手書き図形清書装置
JPS608991A (ja) オンライン手書文字認識辞書登録方式
JP2972443B2 (ja) 文字認識装置
AU2004214901B2 (en) Line extraction in digital ink
JPH04353964A (ja) 文書作成装置
JPS6375990A (ja) 文字編集装置
JPH06208660A (ja) オンライン文字認識装置
JPH10269319A (ja) オンライン手書き文字入力方法ならびに装置
JPH01298483A (ja) 画像認識装置
JPH0520503A (ja) 文字認識装置

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111220

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20111220

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130424

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130430

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130625

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20131210

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140107

R151 Written notification of patent or utility model registration

Ref document number: 5455364

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151