JP5897726B2 - ユーザインタフェース装置、ユーザインタフェース方法、プログラム及びコンピュータ可読情報記憶媒体 - Google Patents

ユーザインタフェース装置、ユーザインタフェース方法、プログラム及びコンピュータ可読情報記憶媒体 Download PDF

Info

Publication number
JP5897726B2
JP5897726B2 JP2014539804A JP2014539804A JP5897726B2 JP 5897726 B2 JP5897726 B2 JP 5897726B2 JP 2014539804 A JP2014539804 A JP 2014539804A JP 2014539804 A JP2014539804 A JP 2014539804A JP 5897726 B2 JP5897726 B2 JP 5897726B2
Authority
JP
Japan
Prior art keywords
character string
conversion
character
stored
conversion destination
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014539804A
Other languages
English (en)
Other versions
JPWO2014054717A1 (ja
Inventor
正人 萩原
正人 萩原
宗 益子
宗 益子
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Rakuten Group Inc
Original Assignee
Rakuten Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Rakuten Inc filed Critical Rakuten Inc
Application granted granted Critical
Publication of JP5897726B2 publication Critical patent/JP5897726B2/ja
Publication of JPWO2014054717A1 publication Critical patent/JPWO2014054717A1/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/017Gesture based interaction, e.g. based on a set of recognized hand gestures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/109Font handling; Temporal or kinetic typography
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/232Orthographic correction, e.g. spell checking or vowelisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/53Processing of non-Latin text

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • User Interface Of Digital Computer (AREA)
  • Character Discrimination (AREA)
  • Position Input By Displaying (AREA)
  • Input From Keyboards Or The Like (AREA)

Description

本発明はユーザインタフェース装置、ユーザインタフェース方法、プログラム及びコンピュータ可読情報記憶媒体に関し、特に、空中に手書きジェスチャを行うことで文字入力するユーザインタフェース技術に関する。
空中に手書きジェスチャを行うことで文字入力するシステムが検討されている(下記非特許文献1参照)。このシステムでは、ユーザがウェアラブルカメラを頭部に装着し、眼前にて指で空中に1つの文字を書く動作を行うと、手の動きに基づいて文字が認識される。
このような文字入力インタフェースでは、ユーザが意図している語又は文を、より少ない文字数で入力できるようにすることが望ましい。そこで本願発明者らは、ユーザが意図している語又は文を、あ行以外の文字について子音文字(kstnhmyrw)に続く母音文字(aiueo)を省略したローマ字表記で入力する、子音入力の採用を検討している(下記非特許文献2参照)。こうした子音入力によれば、あ行以外の文字については母音を空中に書くことが必要なくなり、少ない文字数で意図している語や文を入力できるようになる。たとえば、「桜」や「有り難う」の語は、通常のローマ字表記であれば「sakura」や「arigatou」と表されるところ、子音入力によると「skr」や「argtu」と表され、入力文字数を大幅に削減できる。
園田智也,村岡洋一,「空中での手書き文字入力システム」,電子情報通信学会論文誌,一般社団法人電子情報通信学会,2003年7月,D-II J86-D-II(7),p. 1015-1025 田中久美子,犬塚祐介,武市正人,「携帯電話における日本語入力 −子音だけで日本語が入力できるか」,情報処理学会論文誌,一般社団法人情報処理学会,2002年10月,vol. 43 No. 10, p. 3087-3096
しかし、空中に手書きするジェスチャを用いるユーザインタフェースは、極めて自然なユーザインタフェースであり、あ行以外の文字について、誤って、ユーザが子音文字に続けて母音文字を書いてしまうことも想定される。この場合、期待されているように母音を省略しなかったからといって、意図している語又は文が入力できないというのでは、あまりに利便性を損なう。
本発明は上記課題に鑑みてなされたものであって、その目的は、子音入力の際に誤って母音も入力したとしても、意図している語又は文を入力することができるユーザインタフェース装置、ユーザインタフェース方法、プログラム及びコンピュータ可読情報記憶媒体を提供することにある。
上記課題を解決するために、本発明に係るユーザインタフェース装置は、ユーザが空中に文字を順に書くジェスチャをする場合に、該ジェスチャに係る文字列を判断するユーザインタフェース装置において、複数の変換先文字列のそれぞれに関連づけて、子音のみを含むアルファベット文字列である1つの変換元文字列とともに、子音及び母音を含むアルファベット文字列である変換元文字列を少なくとも1つ記憶する辞書記憶手段と、前記ジェスチャに基づいて認識されるアルファベット文字列の一部又は全部が、前記辞書記憶手段に記憶されるいずれかの変換元文字列と一致する場合に、該記憶される変換元文字列に関連づけて記憶される変換先文字列を取得する変換先文字列取得手段と、取得される変換先文字列に基づいて前記ジェスチャに係る文字列を決定する決定手段と、を含む。
また、本発明に係るユーザインタフェース装置は、ユーザが文字を手書きする場合に、該手書きに係る文字列を判断するユーザインタフェース装置において、複数の変換先文字列のそれぞれに関連づけて、子音のみを含むアルファベット文字列である1つの変換元文字列とともに、子音及び母音を含むアルファベット文字列である変換元文字列を少なくとも1つ記憶する辞書記憶手段と、手書きされたアルファベット文字列の一部又は全部が、前記辞書記憶手段に記憶されるいずれかの変換元文字列と一致する場合に、該記憶される変換元文字列に関連づけて記憶される変換先文字列を取得する変換先文字列取得手段と、取得される変換先文字列に基づいて前記手書きに係る文字列を決定する決定手段と、を含む。
また、複数の変換先文字列のそれぞれに関連づけて、その読みを示す片仮名又は平仮名の文字列である仮名文字列を記憶する仮名文字列記憶手段と、前記仮名文字列記憶手段に記憶される前記仮名文字列を、子音のみを含む1つのアルファベット文字列、及び子音及び母音を含む1以上のアルファベット文字列に変換する変換手段と、をさらに含んでよい。また、前記辞書記憶手段は、前記仮名文字列記憶手段に記憶される前記複数の変換先文字列のそれぞれに関連づけて、前記変換手段により生成される前記各アルファベット文字列をそれぞれ変換元文字列として記憶してよい。
また、前記ユーザにより入力される文字に基づいて、前記変換先文字列の読み仮名に対応する子音のみを含むアルファベット文字列である変換元文字列、又は子音及び母音を含むアルファベット文字列である変換元文字列のいずれかを、前記辞書記憶手段から除去することにより、前記辞書記憶手段の内容を再構成する除去手段をさらに含んでよい。
また、前記除去手段は、前記変換先文字列の読み仮名に対応する子音及び母音を含むアルファベット文字列である変換元文字列を除去してよい。
また、本発明に係るユーザインタフェース方法は、ユーザが空中に文字を順に書くジェスチャをする場合に、該ジェスチャに係る文字列を判断するユーザインタフェース方法において、複数の変換先文字列のそれぞれに関連づけて、子音のみを含むアルファベット文字列である1つの変換元文字列とともに、子音及び母音を含むアルファベット文字列である変換元文字列を少なくとも1つ記憶する辞書記憶手段を参照し、前記ジェスチャに基づいて認識されるアルファベット文字列の一部又は全部が、前記辞書記憶手段に記憶されるいずれかの変換元文字列と一致する場合に、該記憶される変換元文字列に関連づけて記憶される変換先文字列を取得する変換先文字列取得ステップと、取得される変換先文字列に基づいて前記ジェスチャに係る文字列を決定する決定ステップと、を含む。
また、本発明に係るユーザインタフェース方法は、ユーザが文字を手書きする場合に、該手書きに係る文字列を判断するユーザインタフェースユーザインタフェース方法において、複数の変換先文字列のそれぞれに関連づけて、子音のみを含むアルファベット文字列である1つの変換元文字列とともに、子音及び母音を含むアルファベット文字列である変換元文字列を少なくとも1つ記憶する辞書記憶手段を参照し、手書きされたアルファベット文字列の一部又は全部が、前記辞書記憶手段に記憶されるいずれかの変換元文字列と一致する場合に、該記憶される変換元文字列に関連づけて記憶される変換先文字列を取得する変換先文字列取得ステップと、取得される変換先文字列に基づいて前記手書きに係る文字列を決定する決定ステップと、を含む。
また、本発明に係るプログラムは、ユーザが空中に文字を順に書くジェスチャをする場合に、該ジェスチャに係る文字列を判断するようコンピュータを動作させるプログラムにおいて、複数の変換先文字列のそれぞれに関連づけて、子音のみを含むアルファベット文字列である1つの変換元文字列とともに、子音及び母音を含むアルファベット文字列である変換元文字列を少なくとも1つ記憶する辞書記憶手段、前記ジェスチャに基づいて認識されるアルファベット文字列の一部又は全部が、前記記憶手段に記憶されるいずれかの変換元文字列と一致する場合に、該記憶される変換元文字列に関連づけて記憶される変換先文字列を取得する変換先文字列取得手段、及び取得される変換先文字列に基づいて前記ジェスチャに係る文字列を決定する決定手段として前記コンピュータを機能させるためのプログラムである。このプログラムはコンピュータ可読情報記憶媒体に格納されてよい。
また、本発明に係るプログラムは、ユーザが文字を手書きする場合に、該手書きに係る文字列を判断するようコンピュータを動作させるプログラムにおいて、複数の変換先文字列のそれぞれに関連づけて、子音のみを含むアルファベット文字列である1つの変換元文字列とともに、子音及び母音を含むアルファベット文字列である変換元文字列を少なくとも1つ記憶する辞書記憶手段、手書きされたアルファベット文字列の一部又は全部が、前記記憶手段に記憶されるいずれかの変換元文字列と一致する場合に、該記憶される変換元文字列に関連づけて記憶される変換先文字列を取得する変換先文字列取得手段、及び取得される変換先文字列に基づいて前記手書きに係る文字列を決定する決定手段として前記コンピュータを機能させるためのプログラムである。このプログラムはコンピュータ可読情報記憶媒体に格納されてよい。
本発明の実施形態に係るユーザインタフェース装置の外観斜視図である。 画面に表示されるユーザインタフェース画像の一例を示す図である。 本発明の実施形態に係るユーザインタフェース装置の機能ブロック図である。 文字認識処理を示すフロー図である。 手の軌跡を示す3次元座標列の計測を説明する図である。 3次元座標列の投影を示す図である。 投影面に投影された手の軌跡を示す図である。 投影面の変形例を示す図である。 文字のテンプレートの一例を示す図である。 DPマッチングに用いるコストテーブルの一例を模式的に示す図である。 DPマッチングを説明する図である。 入力データと各文字のテンプレートとの類似度評価値の推移を示す図である。 候補文字の判定基準を説明する図である。 文字認識部から出力される候補文字データを示す図である。 基本辞書を示す図である。 文字変換テーブルを示す図である。 変換済み辞書を示す図である。 変換処理を示すフロー図である。 変換語候補のグラフ構造を示す図である。 ユーザインタフェース処理を示すフロー図である。 腕の長さを入力するためのユーザインタフェース画面の一例を示す図である。
以下、本発明の実施形態について図面に基づき詳細に説明する。
図1は、本発明の実施形態に係るユーザインタフェース装置の外観斜視図である。同図に示されるように、ユーザインタフェース装置10は、テレビ受像機やパーソナルコンピュータ用モニタなどの表示装置12と、空間計測装置14と、本体16と、を含んでいる。本体16はパーソナルコンピュータやコンピュータゲームシステムなどのコンピュータであり、表示装置12及び空間計測装置14が接続されている。
空間計測装置14は、正面をリアルタイムに撮像し、2次元画像を取得する動画カメラとしての機能と、動画カメラにより映し出される2次元画像(フレーム画像)の各位置までの距離の情報(距離画像)を取得する距離センサ(デプスセンサ)としての機能と、を有している。距離センサは、例えば正面側に特定の2次元パターンの赤外光を照射し、それを赤外線カメラで撮影し、映し出される2次元パターンと元の2次元パターンとの相違から、正面を映し出した画像の各位置までの距離を計算するものであってよい。或いは、距離センサからレーザ光を出射し、レーザ光が正面の物体により反射され、再び距離センサまで戻ってくるまでの時間を計測して、その時間から距離をしてもよい。この場合、レーザ光を走査すれば、広範囲について距離情報を得ることができる。他にも、種々の方式の距離センサが知られており、これらを適宜採用することができる。空間計測装置14は、上記2つの機能により、正面を映し出した動画像と、動画像を構成するフレーム画像に表れた各位置の3次元座標の情報(距離画像)と、を取得できる。
空間計測装置14は、表示装置12の上に、表示装置12の表示面が向く方向に向けて配置されている。ユーザUが表示装置12の前に立つか、又は座って、空中で文字を書く動作(ジェスチャ)をすれば、その様子を示す動画像及び距離画像が本体16に入力される。本体16では、これら動画像及び距離画像から、後述のようにユーザUの利き手(ここでは右手とする)の位置の3次元座標列を認識するようになっており、その手の位置の軌跡18に基づいて、ユーザが書いた文字が認識される。
図2は、表示装置12の画面に映し出されるユーザインタフェース画像の一例を示している。同図に示されるように、画面には空間計測装置14で撮影された動画像を左右反転させた動画像(鏡像)が背景として全面に表示されている。ここでは動画像にユーザUが映し出されている。
ユーザUの利き手側の肩、すなわち右肩(基準部位)が映し出された位置22を中心とした仮想的な円26(不可視)の周上には、変換文字列の候補を示す選択候補画像(選択要素)20が略等間隔に配置されており、ユーザUはそれらのうち1つに右手の表示位置を重ねることにより、当該1つの選択候補画像20が示す変換文字列を選択することができる。選択された変換文字列は、例えば他のプログラムに渡され、検索キーワードなどとして用いられたり、メールなどのコミュニケーションツールの送信メッセージに用いられたりする。なお、選択要素としては、上記のような変換文字列の候補を示すものに限らず、他の文字列を示す画像やテキストデータそのものであってもよい。或いは、電子商取引サイトで取り扱う商品などの写真画像であってもよい。円26の外側には、さらに入力済みの文字を削除するためのバックスペースボタンの画像など、特定機能を発動するためのボタン画像28が配置されている。ユーザUは、ボタン画像28に右手を重ねることにより、特定機能を発動させることができる。ここで、円26の径は、ユーザUの腕が画面に表示されたときの長さを基準に、例えばその8割と決定されてよい。或いは、平均的な人の腕が画面に表示されたときの長さを基準として、例えばその8割と決定されてもよい。
また、円26の内側には、ユーザUが利き手で文字を書く動作をする領域(空書領域)が設定されている。この空書領域は円形領域であってよい。また、該円形領域は円26と同心であってよく、また、円26より小径であってよい。ユーザUは、自分の右手が映し出された位置24が空書領域内に収まるようにして、右手で任意の文字を書く。右手の位置24の所定時間ごとに本体16で認識されており、新しく認識されたものから順に所定数の位置は、画面に丸印等の識別画像により表示される(図中黒丸)。なお、空所領域から右手の位置24が出た場合には、認識された位置24に基づく文字の認識処理を停止してよい。こうすれば、ユーザUが選択候補画像20に右手を重ねる動きを、文字を書く動きと認識せずに済み、処理効率を向上させることができる。
同図に示されるユーザインタフェースによれば、左右反転したユーザUの画像を表示しつつ、利き手の位置24の軌跡が丸印等の画像群により示されるので、ユーザUは自分が空書領域にどのような文字を書いているかを、画面内容から容易に理解できる。また、ユーザUは腕を伸ばさないと、自分の利き手の位置24を選択項目画像20やボタン画像28に重ねられないので、文字を書いている途中に誤って選択項目画像20やボタン画像28を選択してしまうことが無くなる。
なお、本体16では、空間計測装置14により取得された動画像及び距離画像に基づき、動画像に表れた人の主要部位の3次元位置座標を計算する。動画像及び距離画像から人の主要部位(左右の肩及び手の位置を含む。)の3次元位置座標を計算するには、例えば動画像に表れた人の主要部位を認識し、その3次元座標を動画像及び距離画像から取得する。また、動画像に表れない部位については、時間的に前後する動画像及び距離画像から補間したり、同部位に連結された部位の3次元位置座標から推定したりできる。この計算結果は、例えばマイクロソフトコーポレーションのキネクト(商標)を用いることで、容易に利用できる。そして、認識された位置を、空間計測装置14の正面に仮想的に配置される投影面に投影することにより、利き手側の肩の位置22及び利き手の位置24を取得する。
なお、ここではユーザUの右手を、文字を書くジェスチャを書く際の筆記部位や、選択項目画像20を選択するための選択部位とし、その位置24を筆記位置や選択位置としたが、ユーザUの利き手が左の場合には、左手を筆記部位や選択部位とし、左手の位置を筆記位置や選択位置としてよい。また、手以外にも、指などの他の体の部位を筆記部位や選択部位としてよい。また、以上の説明では利き手の位置を選択位置とし、利き手側の肩を基準部位としたが、選択位置よりも体幹側であって、選択位置を動かすための関節が存在する部位を、選択位置の種類に応じて基準部位として適宜選択してよい。例えば、指先の位置を選択位置とし、手首を基準部位としてよい。また、手が表示される位置の認識は、以上の方法に限らない。例えば、特定色の手袋をユーザUが装着し、該特定色の位置を筆記位置や選択位置として動画像から認識してよい。また、手で直接文字を書いたり選択項目画像20を選択しなくても、何らかの物体(筆記具に似せた棒状の物体など)で文字を書いたり選択項目画像20を選択するようにしてよい。この場合、当該物体の先端位置が筆記位置や選択位置となる。例えば、特定色及び/又は特定形状の物体を手に持ってユーザUが文字を書く場合には、色又は形状を頼りに当該物体の先端の表示位置を筆記位置や選択位置として認識してよい。こうした場合、空間計測装置14は必ずしも必要無く、動画カメラで代用できる。
図3は、ユーザインタフェース装置10の機能ブロック図である。同図に示されるように、ユーザインタフェース装置10は、モーション取得部30、文字認識部32、変換部34、ユーザインタフェース部36、アプリケーション部38、文字テンプレート記憶部40、コストテーブル記憶部42、基本辞書記憶部44、変換済み辞書記憶部46及び文字変換テーブル記憶部48を含んでいる。これらの要素は、本体16に本発明の実施形態に係るプログラムが実行されることにより実現される。このプログラムは、CD−ROMやDVD−ROMなどのコンピュータ可読情報記憶媒体に格納され、そこから本体16にインストールされてもよいし、インターネットなどの情報通信ネットワークを介して本体16にダウンロードされ、インストールされてもよい。
モーション取得部30は、空間計測装置14からユーザUの動画像及び距離画像を取得する。また、それら画像に基づいて、ユーザUの利き手側の肩及び利き手の3次元座標を計算する。
文字認識部32は、ユーザの利き手の3次元座標に基づき、ユーザUが書く文字を順次認識する。変換部34は、文字認識部32により順次認識される文字を順次文字列(単語や文)に変換する。ユーザインタフェース部36は、図2に示されるユーザインタフェース画像を表示装置12の画面に表示する。このため、変換部34により変換された文字列を取得し、それを選択候補画像20として表示する。また、モーション取得部30により取得される動画像を背景として表示するとともに、ユーザUの利き手の位置を表示する。さらに、利き手の位置が選択候補画像20の位置から所定距離内にある場合には、同選択候補画像20に対応する変換文字列が選択されたことをアプリケーション部38に通知する。
アプリケーション部38は、ユーザインタフェース部36から通知される変換文字列に基づき、所定の情報処理を実行する。この情報処理は、どのような処理であってもよいが、例えば通知される変換文字列を検索キーとしてデータベースから情報を検索する処理や、通知される変換文字列に基づいて送信メッセージを生成する処理であってよい。
文字テンプレート記憶部40及びコストテーブル記憶部42は、後述する文字テンプレート(図9参照)及びコストテーブル(図10参照)をそれぞれ記憶する。これらは、文字認識部32における文字認識処理に用いられる。また、基本辞書記憶部44、変換済み辞書記憶部46及び文字変換テーブル記憶部48は、後述する基本辞書(図15参照)、変換済み辞書(図17参照)及び文字変換テーブル(図16参照)をそれぞれ記憶する。これらは、変換部34における変換処理に用いられる。
ここで、文字認識部34による文字認識処理を詳細に説明する。図4は、文字認識部34よる文字認識処理を示すフロー図であり、同図に示される処理は所定時間ごとに実行される。同図に示されるように、まず文字認識部34はモーション取得部30により取得される最新の利き手の3次元位置座標を取得する(S101)。次に、S101で取得した3次元位置座標を所定の投影面に投影する(S102)。具体的には、図5に示されるように、ユーザUの利き手の3次元位置の軌跡18が存在する空間領域と、空間計測装置14の位置と、の間に投影面50が設定される。投影面50は、空間計測装置14の正面方向と垂直に予め設けられ、左右方向にX軸が設定され、上下方向にY軸が設定される。そして、図6に示されるように、S101で取得されたユーザUの利き手の3次元位置52は、投影面50に垂直投影される。図7は、投影面50に投影された、ユーザUの利き手の位置の軌跡18の一例を示しており、同図にはユーザUが空所領域に「R」の文字を書いた場合の投影面50が示されている。
なお、ここでは図5に示されるように、空間計測装置14の前方に、該空間計測方向14の正面方向と垂直となるよう投影面50が設定されるようにしたが、ユーザUが空間計測装置14に正しく向かって字を書くとは限らない。例えば、ユーザUが横を向いて字を書くと、投影面50に投影された利き手の位置の軌跡18は、左右に縮小されてしまい、どの文字をユーザUが書いたかを判別するのが困難となる。
そこで、図8に示されるように、ユーザUの利き手の軌跡18を構成する3次元位置52のうち、3以上を選択し、それらの3次元位置52から決まる平面を投影面50aとしてもよい。この場合、投影面50aは空間計測装置14の正面方向と垂直に設定されるとは限らない。投影面50aは、選択された3次元位置52の全ての座標を含む平面であってもよいし、選択された3次元位置52の平均などの統計的位置を含む平面であってよい。或いは、それら平面に平行な平面であってよい。また、選択される3次元位置52は、軌跡18からランダムに選択されてもよいし、取得された時間が所定時間間隔となるように選択されてもよい。或いは、選択される3次元位置52の間の距離ができるだけ大きくなるように、互いの距離に従って選択されてもよい。さらに、軌跡18における特徴点を通過する平面を投影面50aとしてもよい。特徴点は、軌跡18の各部の曲率に基づいて判断してよい。或いは、ハフ変換を用いて、軌跡における特徴点を通過する平面を投影面50aとして算出してもよい。このようにすれば、ユーザUがどのような方向を向いて字を書いても、正しく文字を認識することができる。
図4に戻り、文字認識部34は、次に各時刻における投影後の位置座標から、直前に取得された投影後の位置座標を減算し、ユーザUが文字を書く位置の移動方向を示すベクトルデータを得る。さらに、このベクトルデータを9種類の方向のうちいずれかに分類することにより、方向分類データを得る(S103)。すなわち、ベクトルデータの大きさが所定値未満であれば、移動していない旨を示すベクトルデータであると分類し、同分類を示す方向分類データを割り当てる。この分類を添付図面では点(・)で示す。また、ベクトルデータの大きさが所定値以上であれば、ベクトルデータの向きにより8方向のいずれかを示すベクトルデータであると分類する。すなわち、ベクトルデータの方向が、上方向(Y方向)を基準として−23度以上+22度未満であれば、上方向を示すベクトルデータであると分類し、同分類を示す方向分類データを割り当てる。この分類を添付図面では上方向の矢印で示す。+22度以上+67度未満であれば、右斜め上方向を示すベクトルデータであると分類し、同分類を示す方向分類データを割り当てる。この分類を添付図面では右斜め上方向の矢印で示す。+67度以上+112度未満であれば、右方向を示すベクトルデータであると分類し、同分類を示す方向分類データを割り当てる。この分類を添付図面では右方向の矢印で示す。+112度以上+157度未満であれば、右斜め下方向を示すベクトルデータであると分類し、同分類を示す方向分類データを割り当てる。この分類を添付図面では右斜め下方向の矢印で示す。+157度以上+202度未満であれば、下方向を示すベクトルデータであると分類し、同分類を示す方向分類データを割り当てる。この分類を添付図面では下方向の矢印で示す。+202度以上+247度未満であれば、左斜め下方向を示すベクトルデータであると分類し、同分類を示す方向分類データを割り当てる。この分類を添付図面では左斜め下方向の矢印で示す。+247度以上+292度未満であれば、左方向を示すベクトルデータであると分類し、同分類を示す方向分類データを割り当てる。この分類を添付図面では左方向の矢印で示す。+292度以上+337度未満であれば、左斜め上方向を示すベクトルデータであると分類し、同分類を示す方向分類データを割り当てる。この分類を添付図面では左斜め上方向の矢印で示す。
次に、最新の方向分類データを一端とする、所定数の時間的に連続する方向分類データからなる入力データ(評価対象データ)と、各文字のテンプレートと、の類似度評価値(類似度評価情報)を計算する。なお、文字認識処理の開始時には、所定数の時間的に連続する方向分類データが存在しないが、その場合にはS104以降の処理は実行せず、処理を終了する。
類似度評価値の計算のため、文字テンプレート記憶部40には、図9に模式的に示されるテンプレートのデータが全ての文字(ここでは、アルファベット23文字、0から9までの数字、長音を示すハイフン(「−」)の合計34種の文字)について記憶されている。テンプレートは、各文字を空中に書く動作をした場合の利き手の位置の推移を示しており、図9に示されるように、上述した方向分類データを時間順に並べたものとなっている。各文字のテンプレートは、標準的な体格を有する者が空中で該文字を書く動作を行い、それに対してS101乃至S103の処理を所定時間ごとに繰り返して適用することにより容易に得ることができる。なお、テンプレートは各文字について複数用意されてもよい。
また、コストテーブル記憶部42には、図10に模式的に示されるコストテーブルのデータが記憶されているコストテーブルは、方向分類データ間のコスト(かい離度)を示しており、ここでは、同じ方向分類データ間のコストは0であり、隣り合う方向を示す方向分類データ間のコストは1であり、90度以上135度以下のずれで異なる方向を示す方向分類データ間のコストは2であり、反対方向を示す方向分類データ間のコストは3である。また、移動していない旨の方向分類データ(・)と他の種類の方向分類データとの間のコストは、いずれも1である。類似度評価値の計算のため、文字認識部12はこれらのデータにアクセスすることができるようになっている。
DPマッチングでは、概念的には、図11に示されるように、入力データを構成する方向分類データを横軸に時刻順に並べられるとともに、任意の1文字のテンプレートデータを構成する方向分類データも同様に縦軸に時刻順に並べられたマトリックスが用意される。そして、入力データを構成する方向分類データと、テンプレートデータを構成する方向分類データとのすべての組み合わせに対し、コストテーブルからコストを読み出し、図11に示されるマトリックスにおける、対応するマトリックス要素にそれぞれ格納する。その後、入力データを構成する方向分類データのうち最も遅い(新しい)時刻に取得された方向分類データと、テンプレートデータを構成する方向分類データのうち最も遅い時刻に取得された方向分類データの組に対応するマトリックス要素(図中右下)を注目要素とし、そこに格納されたコスト(ここでは0)を取得する。次に、同マトリックス要素の上、左斜め上、左のいずれかにあるマトリックス要素に注目要素を推移させ、そこに格納されたコストを取得するとともに、既に取得されたコストに加算する。こうして、注目要素を、最上行のマトリックス要素、すなわち、テンプレートを構成する方向分類データのうち時間的に最も早い(古い)時刻に取得された方向分類データに対応するマトリックス要素まで移動させ、コストの総和を得る。このとき、複数の注目要素の経路のうち、コストの総和を最小化するよう経路を選択する。そして、同経路のコストの総和(つまりコストの総和の最小値)を、入力データと当該文字のテンプレートの類似度評価値とする。なお、ここでは類似度評価値の値が小さいほど類似していることとなる。文字認識部12では、図4のS101において、入力データと各文字のテンプレートとの類似度評価値を上述のようにして計算する。上述のDPマッチングによれば、テンプレートを生成した際の文字を書くスピードと、ユーザUが文字を書くスピードと、にずれがある場合にも、適切に文字認識することができる。
文字認識部12では、次に所定値以下の類似度評価値のテンプレートが存在するか否かを判断する(S105)。そして、そのようなテンプレートが存在すれば、同テンプレートに対応する文字及び類似度評価値を本体のメモリに用意されたバッファに格納してから(S106)。処理を終了する。なお、所定値以下の類似度評価値のテンプレートが複数存在する場合には、それらに対応する全ての文字及び類似度評価値をバッファに格納する。以下では、所定値以下の類似度評価値のテンプレートに対応する文字を、「検出された文字」と記すことにする。S105において、所定値以下の類似度評価値のテンプレートが存在しないと判断されれば、変換部34を起動し、該変換部34が、バッファに既に格納されている文字及び類似度評価値に基づき、候補文字のデータを出力する(S107)。
図12は、入力データと各文字のテンプレートとの類似度評価値の推移の一例を示す図である。同図において横軸は時間を示しており、縦軸は類似度評価値を示している。上述のように、文字認識部12は、所定時間ごとに入力データと各文字のテンプレートとの類似度評価値を計算しており、ユーザUが文字を書き終わるタイミングにて、類似度評価値が所定値以下となるテンプレートが発生することになる。ここでは、ユーザUがR、K、Tの文字を順に空中に書いた場合を示しており、これらの文字に対応する類似度評価値が順に、所定値以下となり、再び所定値を超えている。すなわち、R、K、Tの文字が順に検出されている。
図13は、S107における候補文字の出力方法を説明する図である。同図には、何らかの文字が検出され、どの文字も検出されなくなるまでの間、検出された文字を左から右に順に示している。本実施形態では、何らかの文字が検出され、どの文字も検出されなくなるまでの期間を、文字判定期間としている。
同図(a)に示されるように、文字判定期間において、1つの文字(ここでは「A」)だけが連続して検出される場合、S107において、文字認識部12は当該文字及びその類似度評価値を、候補文字のデータとして出力する。候補データは、例えば({文字:類似度評価値})のような所定の形式をとってよい(同図(a)の場合、({A:1.5})のようになる。)。また、類似度評価値は、バッファに格納される同文字に対する類似度評価値のうち、最小のものであってもよいし、平均値などの統計値であってもよい。また、文字認識部12は、同図(a)の場合、2以上の所定回数(例えば3回)以上にわたり連続して1つの文字が検出される場合にだけ、その文字及びその類似度評価値を候補文字のデータと出力し、所定回数未満しか連続して検出されない場合には、候補文字のデータを出力しないようにしてよい。こうすれば、誤認識を防止できる。
また、同図(b)に示されるように、文字判定期間において、1つの文字(ここでは「F」)が連続して検出され、その途中から、別の文字(ここでは「E」)が検出される場合、後に検出された文字についてのみ、文字及びその類似度評価値を候補文字データとして出力してよい。この場合は、後に検出された文字の一部に先に検出された文字が含まれる場合と推定されるからである。同図(b)では、「E」を書く途中で「F」が検出された例を示している。なお、後に検出された文字の一部に先に検出された文字が含まれる場合は、「E」と「F」など特定の文字対に限られる。そこで、こうした先に検出される文字(先文字)とその直後に検出される文字(後文字)の対を関連文字として予め記憶しておいてよい。そして、文字判定期間において、予め記憶された先文字が連続して検出され、その途中から、対応する後文字が検出される場合に、後文字及びその類似度評価値を候補文字データとして出力してよい。
また、同図(c)に示されるように、文字判定期間において、1つの文字(ここでは「1」)が連続して検出され、その途中から、別の文字(ここでは「H」)が検出され、さらにその途中から、さらに別の文字(ここでは「2」)が検出される場合、2番目の文字(ここでは「H」)を書いたのか、1番目の文字(ここでは「1」)と3番目の文字(ここでは「2」)を連続して書いたのか、不明である。そこで、同図(c)の場合には、上記2つの可能性を両方とも候補文字データとして出力する。例えば、({文字2:類似度評価値2}|{文字1:類似度評価値1}{文字3:類似度評価値3})のような形式であってよい(同図(c)の場合、({H:2.0}|{1:1.3}{2:1.0})のようになる。)。
このように、文字認識部12では、何らかの文字が検出され、どの文字も検出されなくなるまでの間を文字判定期間とし、該文字判定期間における文字の検出パターンに応じて候補文字データを生成している。このようにすることで、より尤もらしい候補文字データを生成することができるようになる。
図14は、文字認識部12から順に出力される候補文字データを模式的に示している。同図は、図13(a)の状況が生じてAの文字についての候補文字データが出力され、次に図13(b)の状況が生じてEの文字について候補文字データが出力され、最後に図13(c)の状況が生じてH、1及び2の文字について候補文字データが出力された例を示している。この場合、文字認識部12からは、例えば({A:1.5})({E:1.3})({H:2.0}|{1:1.3}{2:1.0})のように、候補文字データが順に出力される。
変換部34では、以上のようにして候補文字データが出力される度に、既に出力された候補文字データに基づいて、ユーザUのジェスチャに係る文字列を生成する。変換部34における変換処理のために、上述のように基本辞書記憶部44、変換済み辞書記憶部46及び文字変換テーブル記憶部48は、基本辞書、変換済み辞書、文字変換テーブルをそれぞれ記憶している。基本辞書は、図15に示されるように、多数の単語のそれぞれに関連づけて、読み仮名及び品詞を記憶している。また、文字変換テーブルは、図16にその一部が示されるように、全ての仮名文字について、そのアルファベット表記を関連づけて記憶している。ここで、か行〜わ行の文字については、少なくとも2つのアルファベット表記が関連づけられている。すなわち、ヘボン式の表記、つまり子音とそれに続く母音から構成される表記と、母音を省略して子音のみから構成される表記と、の2つの表記が少なくとも関連づけられている。また、仮名文字の「し」のように、ヘボン式では「Shi」と表記されるものの、他の方式(訓令式)で「Si」とも表記される場合、それぞれについて母音を省略し、「Sh」や「S」も、仮名文字「し」に関連づけられている。また、変換済み辞書は、基本辞書に収録される各単語に関連づけて、その単語のアルファベット表記を記憶している。これは、変換済み辞書は、変換部34が文字変換テーブルを参照しながら基本辞書を変換することにより生成されるものである。具体的には、ある単語についての読み仮名を基本辞書から読み出し、読み仮名を構成する各仮名文字を、文字変換テーブルに従ってアルファベット表記に変換する。上述のように、多くの仮名文字には複数のアルファベット表記が関連づけられており、変換済み辞書では、1つの単語に対して、その読み仮名を構成する仮名文字のアルファベット表記のすべての組み合わせが関連づけられている。つまり、1つの単語について、変換済み辞書では、Πn(i)個のアルファベット表記が関連づけて記憶されている。ここでn(i)は、文字変換テーブルにおいて、単語の読み仮名を構成するi番目の仮名文字に関連付けられたアルファベット表記の数である。また、Πは、iが1〜N(N:読み仮名の文字数)までの積を示している。
図18は、変換部34による変換処理を示すフロー図である。この処理は、文字認識部32から文字候補データが出力される度に実行される。まず、既に文字認識部32から出力された文字候補データから生成されるアルファベット文字列のうち1つを選択する(S201)。例えば、図14に示される文字候補データからは、「AEH」と「AE12」の2つのアルファベット文字列が生成されるが、そのうち1つが選択される。つまり、変換部34は、文字候補データにより示されるアルファベット文字を順に連結することによりアルファベット文字列を生成する。また、1つの文字候補データにより複数のアルファベット文字又は文字列が書かれた可能性が示されている場合には、それらを選択的に用いて、他の文字候補データにより示されるアルファベット文字又は文字列と連結することにより、複数のアルファベット文字列(一次文字列)を生成し、そのうち1つを選択する。
次に、S201で選択されたアルファベット文字列の第1のスコアを算出する(S202)。例えば、アルファベット文字列を構成する各文字に対応する類似度評価値を文字候補データから抽出し、それらの逆数を乗算することにより第1のスコアを算出する。さらに、S201で選択されたアルファベット文字列に対応する単語又は単語列を判断し、それらのグラフ、つまり連結状態を示すデータを生成する(図19参照)。
具体的には、S201で選択されたアルファベット文字列の全体又は任意の長さの先頭部分に一致するアルファベット文字列を変換済み辞書から検索し、該アルファベット文字列に関連づけられた単語(変換辞書の見出し語)を取得する。S201で選択されたアルファベット文字列の先頭部分に一致するアルファベット文字列が変換済み辞書に記憶されている場合には、残りの部分の全体又は任意の長さの先頭部分に一致するアルファベット文字列を変換済み辞書から検索し、該アルファベット文字列に関連づけられた単語を取得する。こうして、S201で選択されたアルファベット文字列に対応する単語又は単語列(ユーザUのジェスチャに係る文字列の候補)を取得する。
次に変換部34では、S201で選択されたアルファベット文字列に対応する全ての単語又は単語列について第2のスコアを算出する(S204)。例えば、各単語又は単語列について、それら単語や単語列の出現頻度、日本語としての尤もらしさ、各単語の品詞の並び順などに基づいて、第2のスコアを算出することができる。さらに、S201で選択されたアルファベット文字列に対応する全ての単語又は単語列について、総合スコア(候補評価値)を算出する。総合スコアは、例えば第1のスコアと第2のスコアとを乗算したり、又は加算したりすることにより算出することができる。その後、S201で生成される全てのアルファベット文字列についてS201〜S204の処理を繰り返す(S205)。そして、総合スコアの大きいな順から所定個数の単語又は単語列を出力する(S206)。
ユーザインタフェース部36は、上述したように、変換部34により出力される単語又は単語列、モーション取得部30により取得される動画像に基づき、図2に示されるユーザインタフェース画像を表示装置12の画面に表示する。また、モーション取得部30により取得されるユーザUの利き手の位置を表示する。
図20は、ユーザインタフェース部36によるユーザインタフェース処理を示すフロー図である。同図に示される処理は、所定時間ごとに実行されるものであり、まずモーション取得部30から出力される動画像を構成する最新のフレーム画像をメモリに背景として描画する(S301)。次に、モーション取得部30から取得される、フレーム画像におけるユーザUの利き手側の肩の位置座標を取得する(S302)。さらに、フレーム画像におけるユーザUの利き手の位置座標を取得する(S303)。そして、S302で取得される利き手側の肩の位置座標を中心とした円26の周上に、選択項目画像20を配置する位置を決定する(S304)。選択項目画像20の位置は、例えば上記円26の周上に等間隔に設定してよい。さらに、S303で取得される利き手の位置と、S304で決定された各位置と、の距離を計算し、S303で決定された各位置を、計算された距離に従ってソートする(S305)。そして、総合スコアが高いほど利き手の位置に近い位置に配置されるよう、変換部34から出力される単語又は単語列をS303で決定された位置に配置する(S306)。さらに、特定機能を発動するためのボタン画像28を円26の外側に配置する(S307)。また、S303で取得されるユーザUの利き手の位置に丸印などの識別画像を配置する(S308)。以上のようにして、図2に示されるユーザインタフェース画像を生成し、これを表示装置12の画面に表示する。
なお、上述のように円26の径は、ユーザUの腕が画面に表示されたときの長さを基準に決定してもよいし、平均的な人の腕が画面に表示されたときの長さを基準として決定してもよい。ユーザUの腕が画面に表示されたときの長さを基準とする場合には、図21に示されるように利き手を伸ばすようユーザUに要求するメッセージを画面に表示して、利き手の位置24と利き手側の肩の位置22との距離を取得すればよい。
以上説明したユーザインタフェース装置10では、筆記位置である利き手の位置が取得されるごとに、新しく取得されたものから順に所定数の利き手の位置からなる入力データを生成し、該入力データと各文字に係るテンプレートとの類似度評価値を算出している。そして、筆記位置である利き手の位置が取得されるごとに、類似度評価値に基づいてユーザUのジェスチャに係る文字列を決定している。このため、各文字を書き始めるタイミングや書き終わったタイミングで明示的な操作をしなくても、複数の文字を順に認識させることができ、極めて使い勝手の良いユーザインタフェースを実現できる。
また、変換済み辞書には、各見出し語に関連付けて、子音のみを含むアルファベット文字列が記憶されているので、ユーザUは少数の文字を入力するだけで、意図した文字列を得ることができる。また、各見出し語に関連づけて、子音のみを含むアルファベット文字列のみならず、子音と母音を含むアルファベット文字列が記憶されているので、ユーザUが誤って子音と母音とを含むアルファベット文字列を入力したとしても、ユーザUが意図した文字列を得ることができる。
また、ユーザUの利き手側の肩の位置を基準として、選択要素である選択項目画像20を画面に表示するようにしているので、ユーザUは容易に各選択項目画像20を選択することができる。
なお、本発明は上記実施形態に限定されず、種々の変形実施が可能である。
例えば、以上の説明では、ユーザUの肩の位置を中心とした円周上に選択項目画像20を配置したが、楕円弧上に選択項目画像20を配置してもよい。また、ユーザUの肩の位置を基準として該位置から離間して配置された種々の曲線や直線上に選択項目画像20を配置してよい。また、利き手側の肩の位置を基準とする代わりに、利き手側の肘の位置を基準としてもよい。筆記位置や選択位置である手、指、筆記具の位置よりも体幹側に位置する、肩や肘などの関節の位置を基準として、そこから離間した位置に選択項目画像20を配置すれば、ユーザUは容易に同選択項目画像20を選択できるようになる。
また、以上の説明では基本辞書及び文字変換テーブルから変換済み辞書を生成するようにしたが、生成された変換済み辞書のみをユーザインタフェース装置10に記憶しておいてもよい。また、基本辞書の見出し語及び読み仮名をユーザが任意に追加する場合には、追加された見出し語に対応するアルファベット文字列を、文字変換テーブルに基づいて生成し、それらを変換済み辞書に登録するようにしてもよい。また、変換済み辞書の見出し語は、基本辞書の見出し語に限らず、任意の文字列であってよい。
また、子音のみを用いて文字列の入力を正しく行い、子音と母音とを用いた入力は利用しないユーザも存在する。逆に、子音と母音を用いた入力だけを行い、子音のみを用いた入力を利用しないユーザも存在する。そこで、ユーザUのジェスチャにより入力される文字に基づいて、変換済み辞書の見出し語に対応するアルファベット文字列のうち、子音と母音の両方を含むアルファベット文字列、又は子音のみを含むアルファベット文字列のいずれかを除去するようにしてよい。この場合、変換済み辞書から、それらアルファベット文字列を直接消去してよい。或いは、子音と母音の両方を含むアルファベット文字列、又は子音のみを含むアルファベット文字列の一方のみを含むよう、変換済み辞書を基本辞書及び文字変換テーブルから再度生成してもよい。
また、以上の説明では、アルファベット、数字及びハイフンをユーザのジェスチャにより入力し、日本語の文字列に変換する例について説明したが、本発明は種々の文字、種々の言語に適用できる。例えば、日本語その他の言語のあらゆる文字からテンプレートを用意する文字を選んでよい。こうすれば、テンプレートが用意された様々な文字を、ユーザUのジェスチャから判断できるようになる。
また、変換済み辞書の見出し語は、日本語以外の、子音と母音の区別がある言語であってよい。例えば、見出し語を英単語のフルスペルとし、それに対応する子音のみを含むアルファベット文字列、及び子音及び少なくとも1つ母音を含むアルファベット文字列を、該見出し語に関連づけて変換済み辞書に記憶しておけば、子音のみからなるアルファベット文字列、或いは子音及び少なくとも1つの母音を含むアルファベット文字列をジェスチャで順に入力することで、任意の英単語をシステムに入力することができる。例えば、「Japan」の見出し語に、「Jpn」「Japn」「Jpan」「Japan」を関連づけて変換済み辞書に記憶しておけば、ユーザUが想定に反して、「Japn」などの母音を含むアルファベット文字列を入力したとしても、正しく「Japan」と変換されることになる。なお、見出し語を英単語とする場合、「image」のように語頭に母音が配置された単語については、子音のみからなるアルファベット文字列「mg」に代えて、語頭だけは母音をそのまま含み、それ以外の母音が省略されたアルファベット文字列「img」を変換済み辞書に記憶するようにしてよい。
また、以上の説明では空中で手書きするジェスチャを行うことにより文字入力するシステムに本発明を適用する例について説明したが、他の手書き文字入力にも適用できる。例えば、ユーザがタッチパネルに文字を手書きする場合において、該手書きに係る文字列を判断する場合にも、本発明は同様に適用できる。

Claims (8)

  1. ユーザが空中に文字を順に書くジェスチャをする場合に、該ジェスチャに係る文字列を判断するユーザインタフェース装置において、
    複数の変換先文字列のそれぞれに関連づけて、前記変換先文字列の読み仮名に対応する、子音のみを含むアルファベット文字列である1つの変換元文字列とともに、子音のすべて及び母音の一部を含むアルファベット文字列である変換元文字列を少なくとも1つ記憶する辞書記憶手段と、
    前記ジェスチャに基づいて認識されるアルファベット文字列の一部又は全部が、前記辞書記憶手段に記憶されるいずれかの変換元文字列と一致する場合に、該記憶される変換元文字列に関連づけて記憶される変換先文字列を取得する変換先文字列取得手段と、
    取得される変換先文字列に基づいて前記ジェスチャに係る文字列を決定する決定手段と、
    前記ユーザにより入力される文字が子音のみである場合に、前記変換先文字列の読み仮名に対応する子音のすべて及び母音の一部を含むアルファベット文字列である変換元文字列を、前記辞書記憶手段から除去することにより、前記辞書記憶手段の内容を、子音のみを含むアルファベット文字列だけ含むよう、再構成する除去手段と、
    を含むことを特徴とするユーザインタフェース装置。
  2. ユーザが文字を手書きする場合に、該手書きに係る文字列を判断するユーザインタフェース装置において、
    複数の変換先文字列のそれぞれに関連づけて、前記変換先文字列の読み仮名に対応する、子音のみを含むアルファベット文字列である1つの変換元文字列とともに、子音のすべて及び母音の一部を含むアルファベット文字列である変換元文字列を少なくとも1つ記憶する辞書記憶手段と、
    手書きされたアルファベット文字列の一部又は全部が、前記辞書記憶手段に記憶されるいずれかの変換元文字列と一致する場合に、該記憶される変換元文字列に関連づけて記憶される変換先文字列を取得する変換先文字列取得手段と、
    取得される変換先文字列に基づいて前記手書きに係る文字列を決定する決定手段と、
    前記ユーザにより入力される文字が子音のみである場合に、前記変換先文字列の読み仮名に対応する子音のすべて及び母音の一部を含むアルファベット文字列である変換元文字列を、前記辞書記憶手段から除去することにより、前記辞書記憶手段の内容を、子音のみを含むアルファベット文字列だけ含むよう、再構成する除去手段と、
    を含むことを特徴とするユーザインタフェース装置。
  3. 請求項1又は2に記載のユーザインタフェース装置において、
    複数の変換先文字列のそれぞれに関連づけて、その読みを示す片仮名又は平仮名の文字列である仮名文字列を記憶する仮名文字列記憶手段と、
    前記仮名文字列記憶手段に記憶される前記仮名文字列を、子音のみを含む1つのアルファベット文字列、及び子音のすべて及び母音の一部を含む1以上のアルファベット文字列に変換する変換手段と、をさらに含み、
    前記辞書記憶手段は、前記仮名文字列記憶手段に記憶される前記複数の変換先文字列のそれぞれに関連づけて、前記変換手段により生成される前記各アルファベット文字列をそれぞれ変換元文字列として記憶する、
    ことを特徴とするユーザインタフェース装置。
  4. ユーザが空中に文字を順に書くジェスチャをする場合に、該ジェスチャに係る文字列を判断するユーザインタフェース方法において、
    複数の変換先文字列のそれぞれに関連づけて、前記変換先文字列の読み仮名に対応する、子音のみを含むアルファベット文字列である1つの変換元文字列とともに、子音のすべて及び母音の一部を含むアルファベット文字列である変換元文字列を少なくとも1つ記憶する辞書記憶手段を参照し、前記ジェスチャに基づいて認識されるアルファベット文字列の一部又は全部が、前記辞書記憶手段に記憶されるいずれかの変換元文字列と一致する場合に、該記憶される変換元文字列に関連づけて記憶される変換先文字列を取得する変換先文字列取得ステップと、
    取得される変換先文字列に基づいて前記ジェスチャに係る文字列を決定する決定ステップと、
    前記ユーザにより入力される文字が子音のみである場合に、前記変換先文字列の読み仮名に対応する子音のすべて及び母音の一部を含むアルファベット文字列である変換元文字列を、前記辞書記憶手段から除去することにより、前記辞書記憶手段の内容を、子音のみを含むアルファベット文字列だけ含むよう、再構成する除去ステップと、
    を含むことを特徴とするユーザインタフェース方法。
  5. ユーザが文字を手書きする場合に、該手書きに係る文字列を判断するユーザインタフェース方法において、
    複数の変換先文字列のそれぞれに関連づけて、前記変換先文字列の読み仮名に対応する、子音のみを含むアルファベット文字列である1つの変換元文字列とともに、子音のすべて及び母音の一部を含むアルファベット文字列である変換元文字列を少なくとも1つ記憶する辞書記憶手段を参照し、手書きされたアルファベット文字列の一部又は全部が、前記辞書記憶手段に記憶されるいずれかの変換元文字列と一致する場合に、該記憶される変換元文字列に関連づけて記憶される変換先文字列を取得する変換先文字列取得ステップと、
    取得される変換先文字列に基づいて前記手書きに係る文字列を決定する決定ステップと、
    前記ユーザにより入力される文字が子音のみである場合に、前記変換先文字列の読み仮名に対応する子音のすべて及び母音の一部を含むアルファベット文字列である変換元文字列を、前記辞書記憶手段から除去することにより、前記辞書記憶手段の内容を、子音のみを含むアルファベット文字列だけ含むよう、再構成する除去ステップと、
    を含むことを特徴とするユーザインタフェース方法。
  6. ユーザが空中に文字を順に書くジェスチャをする場合に、該ジェスチャに係る文字列を判断するようコンピュータを動作させるプログラムにおいて、
    複数の変換先文字列のそれぞれに関連づけて、前記変換先文字列の読み仮名に対応する、子音のみを含むアルファベット文字列である1つの変換元文字列とともに、子音のすべて及び母音の一部を含むアルファベット文字列である変換元文字列を少なくとも1つ記憶する辞書記憶手段、
    前記ジェスチャに基づいて認識されるアルファベット文字列の一部又は全部が、前記記憶手段に記憶されるいずれかの変換元文字列と一致する場合に、該記憶される変換元文字列に関連づけて記憶される変換先文字列を取得する変換先文字列取得手段、
    取得される変換先文字列に基づいて前記ジェスチャに係る文字列を決定する決定手段、及び
    前記ユーザにより入力される文字が子音のみである場合に、前記変換先文字列の読み仮名に対応する子音のすべて及び母音の一部を含むアルファベット文字列である変換元文字列を、前記辞書記憶手段から除去することにより、前記辞書記憶手段の内容を、子音のみを含むアルファベット文字列だけ含むよう、再構成する除去手段
    として前記コンピュータを機能させるためのプログラム。
  7. ユーザが文字を手書きする場合に、該手書きに係る文字列を判断するようコンピュータを動作させるプログラムにおいて、
    複数の変換先文字列のそれぞれに関連づけて、前記変換先文字列の読み仮名に対応する、子音のみを含むアルファベット文字列である1つの変換元文字列とともに、子音のすべて及び母音の一部を含むアルファベット文字列である変換元文字列を少なくとも1つ記憶する辞書記憶手段、
    手書きされたアルファベット文字列の一部又は全部が、前記記憶手段に記憶されるいずれかの変換元文字列と一致する場合に、該記憶される変換元文字列に関連づけて記憶される変換先文字列を取得する変換先文字列取得手段、
    取得される変換先文字列に基づいて前記手書きに係る文字列を決定する決定手段、及び
    前記ユーザにより入力される文字が子音のみである場合に、前記変換先文字列の読み仮名に対応する子音のすべて及び母音の一部を含むアルファベット文字列である変換元文字列を、前記辞書記憶手段から除去することにより、前記辞書記憶手段の内容を、子音のみを含むアルファベット文字列だけ含むよう、再構成する除去手段
    として前記コンピュータを機能させるためのプログラム。
  8. 請求項又はに記載のプログラムを格納したコンピュータ可読情報記憶媒体。
JP2014539804A 2012-10-03 2013-10-03 ユーザインタフェース装置、ユーザインタフェース方法、プログラム及びコンピュータ可読情報記憶媒体 Active JP5897726B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201261709206P 2012-10-03 2012-10-03
US61/709,206 2012-10-03
PCT/JP2013/076902 WO2014054717A1 (ja) 2012-10-03 2013-10-03 ユーザインタフェース装置、ユーザインタフェース方法、プログラム及びコンピュータ可読情報記憶媒体

Publications (2)

Publication Number Publication Date
JP5897726B2 true JP5897726B2 (ja) 2016-03-30
JPWO2014054717A1 JPWO2014054717A1 (ja) 2016-08-25

Family

ID=50435037

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014539804A Active JP5897726B2 (ja) 2012-10-03 2013-10-03 ユーザインタフェース装置、ユーザインタフェース方法、プログラム及びコンピュータ可読情報記憶媒体

Country Status (3)

Country Link
US (1) US20150261301A1 (ja)
JP (1) JP5897726B2 (ja)
WO (1) WO2014054717A1 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6393868B2 (ja) * 2015-02-27 2018-09-26 エンジェリング研究所合同会社 ローマ字入力における母音の自動入力ソフト。
US11625101B2 (en) * 2018-05-30 2023-04-11 Google Llc Methods and systems for identifying three-dimensional-human-gesture input
US10877568B2 (en) * 2018-12-19 2020-12-29 Arizona Board Of Regents On Behalf Of Arizona State University Three-dimensional in-the-air finger motion based user login framework for gesture interface
US10739864B2 (en) * 2018-12-31 2020-08-11 International Business Machines Corporation Air writing to speech system using gesture and wrist angle orientation for synthesized speech modulation

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS584424A (ja) * 1981-07-01 1983-01-11 Toshiba Corp 日本語入力装置
JPS58193578A (ja) * 1982-05-07 1983-11-11 キヤノン株式会社 漢字学習機
JPH0612456A (ja) * 1992-06-24 1994-01-21 Nippon Joho Center:Kk 漢字読替装置と漢字読替検索方法及び漢字読替検索装置
WO2011024282A1 (ja) * 2009-08-27 2011-03-03 株式会社 東芝 情報検索装置
JP2011258130A (ja) * 2010-06-11 2011-12-22 Namco Bandai Games Inc プログラム、情報記憶媒体及び画像生成システム

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8060841B2 (en) * 2007-03-19 2011-11-15 Navisense Method and device for touchless media searching
JP2011253292A (ja) * 2010-06-01 2011-12-15 Sony Corp 情報処理装置および方法、並びにプログラム
US8311973B1 (en) * 2011-09-24 2012-11-13 Zadeh Lotfi A Methods and systems for applications for Z-numbers

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS584424A (ja) * 1981-07-01 1983-01-11 Toshiba Corp 日本語入力装置
JPS58193578A (ja) * 1982-05-07 1983-11-11 キヤノン株式会社 漢字学習機
JPH0612456A (ja) * 1992-06-24 1994-01-21 Nippon Joho Center:Kk 漢字読替装置と漢字読替検索方法及び漢字読替検索装置
WO2011024282A1 (ja) * 2009-08-27 2011-03-03 株式会社 東芝 情報検索装置
JP2011258130A (ja) * 2010-06-11 2011-12-22 Namco Bandai Games Inc プログラム、情報記憶媒体及び画像生成システム

Also Published As

Publication number Publication date
WO2014054717A1 (ja) 2014-04-10
US20150261301A1 (en) 2015-09-17
JPWO2014054717A1 (ja) 2016-08-25

Similar Documents

Publication Publication Date Title
JP5897725B2 (ja) ユーザインタフェース装置、ユーザインタフェース方法、プログラム及びコンピュータ可読情報記憶媒体
JP5208267B2 (ja) 入力装置
CN108700996B (zh) 用于多输入管理的系统和方法
CN109074224A (zh) 用于在字符串中插入字符的方法以及相应的数字设备
EP2897055A1 (en) Information processing device, information processing method, and program
CN114365075B (zh) 用于选择图形对象的方法和对应装置
US20210350122A1 (en) Stroke based control of handwriting input
CN105549890B (zh) 一维手写文字输入设备和一维手写文字输入方法
JP6355823B2 (ja) 入力表示制御装置、入力表示制御方法及び入力表示システム
JP5897726B2 (ja) ユーザインタフェース装置、ユーザインタフェース方法、プログラム及びコンピュータ可読情報記憶媒体
US11188155B2 (en) Method and apparatus for inputting character based on motion recognition of body
JP6055065B1 (ja) 文字認識プログラム、文字認識装置
JP5774235B2 (ja) ユーザインタフェース装置、ユーザインタフェース方法、プログラム及びコンピュータ可読情報記憶媒体
US8711100B2 (en) Sign language keyboard and sign language searching apparatus using the same
JP2005190199A (ja) 手書き文字入力表示装置及び手書き文字入力表示方法ならびにそのプログラム
US20210264681A1 (en) Input display control device, input display control method, and input display system
Kurosu Human-Computer Interaction. Interaction Technologies: 20th International Conference, HCI International 2018, Las Vegas, NV, USA, July 15–20, 2018, Proceedings, Part III
JPH0677252B2 (ja) 和文データ入力処理装置
KR20030090381A (ko) 문자 인식방법 및 문자 인식장치
JP2020013460A (ja) 情報処理装置、文字認識方法、および文字認識プログラム
JP2018018366A (ja) 情報処理装置、文字入力プログラムおよび文字入力方法
JP2011123788A (ja) オンライン文字認識装置
JPH06208655A (ja) オンライン文字認識装置

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20151224

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160223

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160302

R150 Certificate of patent or registration of utility model

Ref document number: 5897726

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250