JP2005004543A - ユーザインターフェース方法および装置、ならびにコンピュータ・プログラム - Google Patents
ユーザインターフェース方法および装置、ならびにコンピュータ・プログラム Download PDFInfo
- Publication number
- JP2005004543A JP2005004543A JP2003168357A JP2003168357A JP2005004543A JP 2005004543 A JP2005004543 A JP 2005004543A JP 2003168357 A JP2003168357 A JP 2003168357A JP 2003168357 A JP2003168357 A JP 2003168357A JP 2005004543 A JP2005004543 A JP 2005004543A
- Authority
- JP
- Japan
- Prior art keywords
- shape
- user
- symbol
- input
- user interface
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/018—Input/output arrangements for oriental characters
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/53—Querying
- G06F16/532—Query formulation, e.g. graphical querying
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0487—Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser
- G06F3/0488—Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures
- G06F3/04883—Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures for inputting data by handwriting, e.g. gesture or text
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- User Interface Of Digital Computer (AREA)
- Processing Or Creating Images (AREA)
- Position Input By Displaying (AREA)
Abstract
【解決手段】入力ユーザインタフェースは、入力デバイスからユーザ入力処理モジュールにデータを転送するIF機能を備える。ユーザ入力処理モジュールは、シンボル認識モジュールやシルエット認識モジュール或いは他の内部処理モジュールにコマンドやデータを送る。シンボル認識モジュールは、スケッチ入力されたシンボルを認識する。シルエット認識モジュールは、シルエットの形状等を認識する。テンプレート検索モジュールは、テンプレートデータベースから対応するテンプレートを検索する。検索結果は、モデル生成モジュールに送られ、シルエットや入力シンボルに対応する表示オブジェクトのモデルを生成する。表示処理モジュールは、出力ユーザインタフェースに表示可能な形式のデータを作成する。
【選択図】 図1
Description
【発明の属する技術分野】
本発明は、ユーザインターフェース方法および装置、ならびにコンピュータ・プログラムに関する。
【0002】
【従来の技術】
2次元の操作で3次元空間にインタラクションを行えるスケッチインタフェースが数多く存在している。例えば、非特許文献1のTeddyや非特許文献2のFlat3D等を参照。従来のこうしたスケッチインターフェースシステムは、3次元に対する操作を全て2次元の感覚で行うことができるため、操作自体は簡単である。一方で、描画作業の成否はユーザのデザインスキルに大きく依存するため、デザインイメージに近いオブジェクトを簡単に獲得することが困難な場合がある。
【0003】
一方、2次元や3次元空間のオブジェクトのパラメータ(形、位置、大きさ、色など)をスクリプトとして記述することでシーンを構築する手法もある。例えば、非特許文献3のMaya(TM) Mel scriptを参照。このようなスクリプトによるシーン構築手法は、文章を記述する感覚でシーンを構築することができる一方で、ユーザは、エディター上でスクリプトを記述しなければならず、直接的に3次元空間と対話することができない。また、意図したシーンやオブジェクトを獲得するためには、スクリプトを記述するための文法的なルールや関数の操作/振る舞い等を覚えなければならず、多くのユーザにとって簡単に操作することができない。
【0004】
[非特許文献1]
Igarashi,T., Satoshi,M., Hidehiko,T., ”Teddy: A Sketching Interface for 3D Freeform Design”, in Proc. of SIGGRAPH 99, 409−416, 1999.
[非特許文献2]
飛田 博章, 暦本 純一, ”Flat3D:クリエーションとコミュニケーションを可能にする3次元共有仮想空間システム”, 情報処理学会ジャーナルVol.44 No.02, 2003. (Hiroaki Tobita, Jun Rekimoto,”Flat3D: A Shared Virtual 3D World System for Creative Activities and Communication” IPSJ JOURNAL, Vol.44 No.02, 2003.)
[非特許文献3]
Alias|wavefront社ホームページhttp://www.aliaswavefront.com/en/news/home.shtml.
【0005】
【発明の解決しようとする課題】
本発明は、従来技術が有する上記その他の問題点に鑑みて成されたものであり、操作が直感的かつ容易であり、さらにデザインイメージに近いオブジェクトを比較的簡単に獲得可能な、ユーザインターフェース手法を提供することである。本発明の他の目的は、2次元の操作で3次元空間にインタラクションを行う際に、デザインイメージに近いオブジェクトを容易に生成することができる、ユーザインターフェース手法を提供することである。本発明のさらに他の目的は、文字、文字列或いは文章等のテキストベースのシンボルを用いながらも、そのシンボルの意味を通じて直感的な3次元空間との対話を実現することが可能な、ユーザインターフェース手法を提供することである。本発明のさらに他の目的は、図面および以下の説明を通して、順次、明らかにされて行くであろう。
【0006】
【課題を解決するための手段】
上記課題を解決するために、本発明に係るユーザインターフェース方法および装置、ならびにコンピュータ・プログラムでは、以下の構成が採用される。すなわち、ユーザのスケッチ操作により入力されたオブジェクト配置領域の形状が取得され、配置領域の取得形状に基づきオブジェクトの変換パラメータが取得される。さらに、ユーザのスケッチ操作により入力されたシンボルが取得され、登録されているオブジェクト群からシンボルに関連する表示オブジェクトが検索される。さらにまた、変換パラメータに基づき検索された表示オブジェクトの初期データが変換され、変換後の表示オブジェクトがオブジェクト配置領域に表示される。
【0007】
本構成によれば、ユーザは、スケッチ操作という直感的な操作を通じて、オブジェクト配置領域を指定することにより、表示オブジェクトに様々な操作を行うことができる。さらに、本構成によれば、ユーザは、スケッチ操作という直感的な操作を通じて、シンボルを指定することにより、それと関連付けられ登録されている表示オブジェクトを容易に呼び出すことができる。配置領域の指定は、例えば、閉曲線を描く等の簡単な操作に基づき実現可能であるし、スケッチによるシンボル指定も、ユーザに親しみ易い紙に文字を記載するような操作に基づき実現可能である。したがって、本構成によれば、ユーザのデザインスキルに大きく依存しない、簡易かつ直感的なデザインツールを実現することができる。
【0008】
なお、スケッチ操作は、マウス、トラックボール、タブレットデバイス、ジェスチャー入力システム、或いは光ポインティングシステム等の様々なポインティング手段を通して、実現することができる。スケッチ操作においては、点補間やスムージング等の適当な処理により、システム側がユーザを補助することができる。また、登録されたオブジェクト群は、適切な手法により、更新可能である。この更新は、例えば、新たに写真やユーザスケッチ等から適宜オブジェクトを切り出して来てそれに適当なシンボルを割り当てデータベース等の所定のリソースに登録し、或いはシンボルと関連付けられたオブジェクトの初期データ或いは初期データへのポインタ情報等を書き換えることにより、実現可能である。
【0009】
ここで、本発明によれば、初期データに表示オブジェクトの初期形状データを含め、変換に表示オブジェクトの形状変形を含めることが可能である。勿論、表示オブジェクトの初期データの変換には、形状の変形以外にも、輝度の変換、色の変換、色の濃淡の変換或いは模様の変形等の様々な視覚的な変換を含めることができる。さらに、変換パラメータを、同一アプリケーション内の他のモジュールや他のアプリケーション等から参照可能に設定することで、表示オブジェクトに視覚的効果を加える以外にも、さらに様々な応用が可能となる。例えば、オブジェクト配置領域外への視覚的効果(例えば周辺オブジェクトの変換等)、或いは表示オブジェクトに付随する聴覚効果(例えば効果音の発生)等を発生させることが可能となる。
【0010】
さらに、本発明によれば、オブジェクト配置領域に初期形状が設定されており、変換パラメータが初期形状と取得形状との比較に基づき取得される構成を採用することもできる。
【0011】
また、本発明によれば、オブジェクト配置領域の初期形状が3次元形状であり、配置領域の取得形状が2次元形状であり、変換パラメータが初期形状の2次元投影形状と取得形状、または取得形状の3次元拡張形状と初期形状、の比較に基づき所得され、変換パラメータを取得するステップの前に、初期形状の2次元投影または取得形状の3次元拡張を行うステップがさらに含まれる構成を採用することができる。この構成では、2次元操作でオブジェクト配置領域の指定を通して、本発明にかかる構成での3次元空間との直感的なインタラクションをユーザに提供することができることとなる。
【0012】
さらに、本発明によれば、シンボルは、文字、文字列または文章であり、シンボルに関連する表示オブジェクトは、シンボルの意味に関係するイメージオブジェクトである構成を採用することも可能である。このような構成を採用することによって、スクリプト言語等の文法(syntax)や意味(semantics)等に精通しなくても、文字を通して、容易にイメージオブジェクトを獲得することができる。逆の見方をすれば、表示オブジェクトを通じて文字の意味をユーザに提示するということもできる。この場合、ユーザは、例えば、意味の不明な文字、単語、熟語等をシンボルとして入力することにより、ユーザの指定した配置領域形状に対応する態様で、その意味をイメージ的に認識することが可能となる。
【0013】
本発明のさらに他の特徴は、図面および以下の説明を通して、順次、明らかにされて行くであろう。
【0014】
【発明の実施の形態】
(システム概要)
まず、本実施形態にかかるシステム例の概要について簡単に説明する。本システム例は、ユーザが手書き入力でイメージオブジェクトを獲得するためのものである。本例では、基本的に、ユーザが、シルエット(contour/line/outline/silhouette)の描画と、適切な領域に漢字描画することにより、文字の意味に関連するオブジェクトがシルエット内に生成される。
【0015】
本例における基本的な処理フローは、次の通りである。
1. ユーザがシルエット(例えば閉曲線)を描画
2. システムがシルエットを表示
3. ユーザが適切な描画領域(例えば閉曲線内)に漢字を入力
4. システムがシルエットの大きさ・形状データ(テンプレートとの比較に基づく変換パラメータとして使用可能)と文字の認識結果を保持
5. システムが文字の認識結果からデータベースを参照し文字に対応する表示オブジェクトを選択
6. システムがシルエットの形に表示オブジェクトの形を対応させる
7. システムがシルエット内に表示オブジェクトを表示
【0016】
(画面イメージ例)
<図5>〜<図7>を使い、本システムにかかる表示イメージ例を示す。<図5>の例では、ユーザからシステムへの入力側インタラクションは、GUIの選択と、シルエットや漢字の描画操作と、を基本として行われる。したがって、例えば、通常のPC(Personal Computer)とモニターとを組み合わせたハードウェアコンフィグレーション上で、マウスによる操作をベースに実現する。また、タブレットPC、PDAや壁型の実世界指向インタフェースなどのペンや人の指による入力をサポートするシステムと組み合わせることで、ユーザに対し、より自然な操作を提供することができる。
【0017】
<図5>の例では、ユーザは、システムに対し、GUI(Graphical User Interface)部品の選択と、ストローク描画により操作を行う。この例において、表示領域は、GUI部品部分と描画部分に大別される。
GUI部品部分の例は、<図5>下方に示されており、モード選択用のGUI部品等を備えている。モード選択用のGUI部品としては、例えば、シルエット入力GUI部品、シンボル入力GUI部品、チェンジGUI部品、ペンGUI部品、テキストGUI部品、消去GUI部品、或いは選択オブジェクト変更用のGUI部品等を挙げることができる。これらGUI部品は、<図5>のような形式で表示しても良いし、ラジオボタン、チェックボックス、或いはプルダウンメニュー等のように他の選択型GUIオブジェクトとしてシステムに実装することも可能である。なお、現在では、GUI部品とそれに対応する機能とは、ユーザやシステム開発者により容易に対応の変更が可能である。このため、<図5>では、各GUI部品とその関連機能との対応については、特に説明を行わない。必要な機能を適当なGUI部品に関連付けて使用することができるという程度に理解されたい。
描画部分の例は、<図5>の中央部に示されている。
【0018】
<図5>の例においては、例えば、ユーザがシルエットGUI部品を選択することにより、システムがシルエット描画モードに移行する。このモードでは、ユーザは作業空間にシルエットを描画することができる。この描画結果は、3次元位置情報のリストとしてシステムにより保持される。リスト情報は閉曲線が描画された場合のみ格納対象(システムによる保持対象)とすることが良い。さらに、シルエット描画の後で、例えば、ユーザが漢字GUI部品を選択すると、システムは漢字描画モードとなる。このモードにおいて、ユーザは、例えばシルエット内に、漢字を直接または間接的に描画(手書き入力)することができる。漢字描画は、スクリーンの画像データとしてシステムに保持される。
【0019】
さらに、その後、ユーザがセットGUI部品を押すことで位置情報を保持するリストデータと漢字描画情報を保持する画像データの2つのデータに対して処理が行われる。例えば、ストロークリストは、アプリケーションの描画モジュールに閉曲線を描かせることができるようなデータセットであり、このリストをTriangular関数に渡すことで、閉曲線内部は複数の三角形をベースに細分化が行われる。また、画像データはOCR(Optical Character Recognition)ライブラリに渡され文字認識が行われる。文字認識の結果からデータベースが参照されオブジェクトが決定され、このオブジェクトをシルエットに当てはめることで漢字からオブジェクトへの変換が完了する。
【0020】
なお、本システム例では、場合によって、シルエットを介さず、漢字描画のみでオブジェクトへの変換も可能である。漢字の大まかな形をシルエットと同じ様に扱うことで、漢字描画だけでの変換も可能である。さらに、選択GUI部品を設けずに、例えば、描画ストロークのみからオブジェクトを獲得したり、等の他の方法に基づき、システムのモード切替を行えるシステムを構築することも可能である。
【0021】
<図6>に示すように、本システム例では、漢字GUI部品を選択した時にユーザが「木」と描画した場合、シルエット内に木のモデルが現れる。例えば、チェンジGUIの選択操作(押す等)により、他のオブジェクト候補を当てはめ直すことができるようにシステムを構築することで、ユーザはより用途に合ったオブジェクトを獲得し易くなる。また、描画の仕方で、直接的にオブジェクトの形を変換することも可能である。データベースには、同一漢字に対する複数のオブジェクトがあらかじめ登録されているので、ユーザはGUIの操作によりこれらの候補を選択することができる。結果として、ユーザはシルエットと漢字の描画、及び、選択の3工程でオブジェクトの獲得を行うことができる。このため、本システムを用いれば、既にユーザが身に付けていて、日常生活で文章を書くのに使う漢字等をベースにすることで、ユーザが特別な学習をすることなくシステムを使える点に特徴がある。
【0022】
本システム例を用いると、<図7>に示すように、
組み合わせにより、より複雑なオブジェクトを生成することも可能である。シルエットと漢字の描画からえられたオブジェクトの上に、さらに漢字を描画することで複雑なオブジェクトを獲得できる。例えば、シルエット内に”木”と書いて木オブジェクトを獲得した後で、木オブジェクトの上に”赤”と書くことで赤い木オブジェクトを獲得できる。また、オブジェクト間に関連を持たせたインタラクション手法も可能である。木オブジェクトの横に、シルエットと漢字の”時”描画からえられた時計オブジェクトを設定することで、時計を操作することで木の状態を変更することができる。
【0023】
なお、本システムは、様々な素材に対して対応することができる。例えば、モデルだけではなく、音(笑、怒、泣)への変換や、キャラクターアニメーション(飛、走、歩)などの様々なコンテンツに対して適用することも可能である。本システムにおいては、テンプレートのデータベースを更新することにより、容易にオブジェクトの登録を行うことができる。
【0024】
(機能モジュール)
<図1>は、本実施形態にかかるユーザインタフェース装置の機能モジュール群の一実施例を示す概略的なブロックダイアグラムである。 <図1>は、説明の便宜上、非常に単純化されたイメージを示したものに過ぎない。本実施形態の実際の実装に際しては、これら機能モジュールの各機能を、適宜、適切なハードウェアコンポーネントやソフトウェアコンポーネントに割り当てることになる。このため、実際の実装時の概観が<図1>と同一ではなくなる場合も十分にあり得る。また、当然、各機能モジュール自体に、適当な改良、修正、追加、機能拡張等が加えられることもある。
【0025】
<図1>の入力ユーザインタフェース1は、キーボード、マウス或いはタブレット入力装置等のユーザ入力デバイスを含み、ユーザ入力デバイスからユーザ入力処理モジュール3にデータを転送するIF機能を備える。なお、本実施形態において、入力ユーザインタフェース1は、ユーザ入力デバイスとして、少なくとも、ユーザがスケッチ操作を施すことが可能なものを備えていることが好ましい。勿論、複数あるいは複数種類の入力手段を備える構成、例えばマルチモーダル入力型の構成等を採用することにより、多様な入力形態をとることも可能である。
【0026】
ユーザ入力処理モジュール3は、入力ユーザインタフェース1を介して入力されたユーザ操作を解釈し、該操作に対応する処理が行われるように、後段のシンボル認識モジュール5やシルエット認識モジュール7或いは他の内部処理モジュール21にコマンドやデータを送る。本実施形態において、ユーザ入力処理モジュール3は、少なくとも、ユーザによるスケッチ操作からシルエット入力とシンボル入力とを認識することができることが好ましい。このような構成は、GUI部品の選択情報やユーザの入力ストローク情報等をキーにして、条件判断を行うことで、実現可能である。ここで、シンボルには、例えば、仮名文字、カタカナ文字、漢字、ハングル文字、アラビア文字、アルファベット文字等の文字、スペース、カンマ、ピリオド、アットマーク、顔文字等の記号文字、図形やイラスト等、並びに、文字列等のそれらを組み合わせたもの等、様々なものを適用することができる。また、シンボルに文字を適用する場合には、ASCII系やUnicode系等のいずれ文字体系のものを用いても良い。また、シルエットは、シンボルに対応するモデル図形が何かしらの関連を持ちながら表示されるような、モデル表示のベースとなるオブジェクトである。例えば、シンボルに対応するモデル図形を表示する表示領域のようなものとすることができる。なお、本実施形態においては、シンボル、シルエットともに、ユーザに高度なデザインスキルを要求するものよりは、スケッチ操作によりユーザが簡単に入力可能なものを適用することが好適である。
【0027】
シンボル認識モジュール5は、ユーザ入力処理モジュール3からの入力シンボルに関るデータ等に基づき、ユーザによりスケッチ入力されたシンボルが何であるかを認識する。例えばOCRの文字認識機能やPalm OS(米Palm社製)のGraffitiのようなものを利用することにより、実現可能である。また、シルエット認識モジュール7は、ユーザ入力処理モジュール3からの入力シルエットに関るデータ等に基づき、ユーザによりスケッチ入力されたシルエットの形状等を認識する。シンボル認識やシルエット認識は、データの統合、キャリブレーションや補間等の適当な処理を用いることにより、認識精度を確保することが好ましい。
【0028】
テンプレート検索モジュール11は、シンボル認識モジュール5やシルエット認識モジュール7の認識結果を受けて、テンプレートデータベース13から対応するテンプレートを検索する(以下、適宜、データベースを『DB』と省略記載する)。検索結果は、モデル生成モジュール15に送られる。DB更新モジュール9は、例えば、テンプレートデータやシンボル、シルエットとの対応関係等の追加、変更、削除、書換等を行い、テンプレートDB13の登録情報を更新する。DB更新モジュール9によるDB更新には、所定ルールに基づき自動で行う構成、ユーザの所定指示に基づき手動で行う構成、或いはそれらを適度に組み合わせる構成等を採用することができる。<図1>では、シンボル認識モジュール5やシルエット認識モジュール7からのデータに基づき、DB更新モジュール9によるDB更新が行われるように記載されているが、本実施形態の構成はこれに限られない。他の入力処理21からの入力データ等に基づいて、DB更新をするように構成することも当然可能である。
【0029】
テンプレートデータベース13は、表示オブジェクトのテンプレートデータを格納し、テンプレート検索モジュール11を介して、少なくとも認識文字等のシンボルデータを使って対応表示オブジェクトのテンプレートを検索可能な構成を有する。また、場合により、シルエットのテンプレートデータをテンプレートデータベース13に格納する構成とすることも可能である。ここで、テンプレートデータベース13は、シンボルデータと対応テンプレートが同一エントリに含まれるように構成したり、シンボルデータから1又は2以上の識別情報(ID番号、ポインタ、URL等)を経由して対応テンプレートを検索できるように構成したり、することで容易に実現可能である。データベース内のデータは、ネットワークに接続された一の機器のローカルリソースやスタンドアローン機器に非分散的に記録しておいても良いし、複数の機器から構成されるネットワークに分散的に記録しておいても良い。
【0030】
ここで、テンプレートデータベース13に登録されたテンプレートには、3次元データを用いることができる。このような構成を採用すると、ユーザによる2次元的なスケッチ入力から、容易に3次元モデルを生成することができるようになる。つまり、このような構成を採用することで、3次元空間との対話の容易なスケッチインターフェースの提供が可能となる。さらに、本実施形態では、ユーザ入力処理モジュール3、シンボル認識モジュール5やシルエット認識モジュール7等にも、2次元データの3次元拡張機能を持たせることもできる。2次元データの3次元拡張機能については、本件発明者等による特開2002−024860、特開2002−074399、特願2002−000945或いは特願2002−363493等に記載された発明を適用することもできる。ここで、これら先行技術の内容は、参照としてここに組み込まれる。
【0031】
モデル生成モジュール15は、テンプレート検索モジュール11からテンプレートのデータを受け取ると、取得テンプレートに適切な変換を施し、シルエットや入力シンボルに対応する表示オブジェクトのモデルを生成する。なお、本システムでは、少なくとも一のシルエットについて行われた変換結果が、該シルエットと関連して表示される入力シンボルの対応表示オブジェクトに反映させられるように構成される。
【0032】
表示処理モジュール17は、モデル生成モジュール15で生成されたモデル等から、出力ユーザインタフェース19に含まれるディスプレイ等に表示可能な形式のデータを作成する。この表示処理モジュール17では、上記のようにテンプレートに3次元データを使う場合、レンダリング処理等により、3次元データを2次元化することになる。出力ユーザインタフェース19は、ディスプレイ装置、オーディオ出力装置、触感出力装置等の出力デバイスを含む。出力ユーザインタフェース19の構成は、周知であるため、説明を省略する。
【0033】
<図1>において、他の入力処理モジュール21や他の出力処理モジュール25は、上記以外の処理を実行するための機能モジュールである。例えば、他の出力処理モジュール25では、生成モデルに対応する音声出力データを生成したり、他の入力処理モジュール21では、シンボル入力とシルエット入力以外のユーザ入力を処理し、適当な内部処理を実行したり、することも可能である。
【0034】
(処理フローの例)
<図2>〜<図4>には、本実施形態にかかるユーザインタフェース方法の一実施例を説明するための概略的なフローチャートを示す。具体的には、<図2>には、典型的な処理フローに沿ったフローチャートを示し、<図3>には、ユーザ入力イベントを中心としたフローチャートを示す。さらに、<図4>には、<図2>や<図3>の一部のステップについてのより詳細なフローチャートを示す。
【0035】
まず、ステップ<S1>では、ユーザによるシルエット描画があったか否かを検出する。このステップは、例えば、ユーザによって、シルエット描画モードが選択されており、かつ閉曲線を描く等の所定の描画操作が行われたか否かを検出することで、実現することができる。ここで、肯定的な結果の場合、ステップ<S2>に処理が移り、否定的な結果の場合、シルエット描画モードが選択されている限り、ステップ<S1>が繰り返される。
【0036】
ステップ<S2>では、ユーザによって入力されたシルエット領域が特定され、シルエットモデルが取得される。ここで、シルエットモデルには、例えば、円や球等の極めて単純なモデルを適用する場合、シルエットモデル自体をデータベースに登録しておく必要はなく、その都度演算によって求めることもできる。一方、複雑なモデルをシルエット化する場合には、そのテンプレートデータをデータベースに登録しておき、ユーザ入力の認識結果に基づき、データベースからシルエットテンプレートを検索するように構成しても良い。
【0037】
ステップ<S3>では、ストローク情報が所定のリソース上に格納される。ここで、ストローク情報には、ストロークに対応するシルエット自体の描画データとともに、後述のステップで、シンボルに対応する表示オブジェクトの変換に用いるパラメータも含まれる。ステップ<S4>では、シルエットオブジェクトが表示される。
【0038】
次に、ステップ<S5>では、ユーザによる漢字描画が有ったか否かを検出する。このステップは、例えば、ステップ<S3>で格納された適切なストローク情報が存在し、ユーザによって、漢字描画モードが選択されており、かつ適切な入力領域に認識可能な漢字の手書き入力操作が行われたか否かを検出することで、実現することができる。適切な入力領域には、表示されたシルエット内、シンボル認識用に用意された専用領域或いはタブレット等の入力デバイス上の認識可能領域等を用いることができる。ステップ<S5>が肯定的な結果の場合、ステップ<S6>に処理が移り、否定的な結果の場合、例外処理(後述)に処理が移る。
【0039】
ステップ<S6>では、ユーザによって入力された手書き文字がシステムによって認識される。ユーザによる手書き入力データを、例えば、既存のOCRライブラリ等を使いパターンマッチング処理することにより、認識は可能である。
【0040】
ステップ<S7>では、認識された文字の情報を基に、テンプレートデータベースの検索が行われる。適切な表示オブジェクトがデータベースから取得できれば、ステップ<S8>において表示オブジェクトが有りと判断されステップ<S9>で表示オブジェクトが取得される。適切な表示オブジェクトがデータベースから取得できなければ、ステップ<S8>において表示オブジェクトが無しと判断され、例外処理(後述)に処理が移る。
【0041】
ステップ<S13>では、例外処理として、例えばシステムが漢字描画待ち状態か否かが判断される。結果が肯定的な場合、ユーザによる漢字描画を待つように、ステップ<S5>に処理が戻る。結果が否定的な場合には、処理が最初に戻る。
【0042】
ステップ<S10>では、シルエットの形に表示オブジェクトを対応させる。この対応は、想定されるシルエット形状と実際のシルエットストロークとの比較により求まるパラメータ、例えば、縦方向と横方向の縮尺率等、面積の変化率、傾き等に基づき、表示オブジェクトの形状を変形させたり、生物表示オブジェクトの表情を変化させたり、テクスチャー表示オブジェクトに適当な陰影をつけたり、或いは適当な聴覚的効果を発生させたり等、様々な態様で実現することができる。
【0043】
ステップ<S11>では、ステップ<S10>で変換処理された表示オブジェクトの情報がシステムに格納され、ステップ<S12>においてシステム上の適当なタイミングで当該表示オブジェクトがユーザに提示される。また、<図2>では、いくつかのステップからフローを終了できるように記載されているが、これはアプリケーション終了時等が起きた場合のパスである。この構成は、設計変更的な事項と考えられるため、詳細な説明を省略する。
【0044】
<図3>は、<図2>のフローチャートをユーザ入力を中心に書き換えたものであるため、<図2>の対応ステップについて同一の参照符号を付すことにより、説明を省略する。
【0045】
<図4>は、主に<図2>および<図3>の<S9>〜<S11>部分のより詳細なフローチャートである。表示オブジェクトのみならずシルエットデータもテンプレートデータベースに登録したテンプレートに基づき生成する構成においては、<図2>および<図3>の<S2>〜<S3>部分にも同様に<図3>の処理を適用することができる。
【0046】
ステップ<S101>では、データベースからテンプレートデータが取り出される。
【0047】
ステップ<S102>では、テンプレートデータの個数と全体距離を1とした時の割合を格納する。
【0048】
ステップ<S103>では、テンプレートの外接四角形が計算される。
【0049】
ステップ<S104>では、テンプレートデータの割合を元に入力ストロークを正規化する。
【0050】
ステップ<S105>では、ストロークの外接四角形を計算する。
【0051】
ステップ<S106>では、アスペクト比を算出する。
【0052】
ステップ<S107>では、ストロークを円に変形する。
【0053】
ステップ<S108>では、円のデータ及びテンプレートデータをTrianglerに代入しストローク内をpatchで埋める。
【0054】
ステップ<S109>では、Patchデータをオブジェクトとして保持する。
【0055】
(擬似コード)
<表1>〜<表10>には、本実施形態にかかるコンピュータプログラムの一実装例を擬似的なソースコードの形で示す。その内容は、ここに組み込まれる。
【表1】
【表2】
【表3】
【表4】
【表5】
【表6】
【表7】
【表8】
【表9】
【表10】
【0056】
以上、好適な具体例を例示して、本発明の実施形態について説明をしたが、本発明はかかる構成に限定されない。
【0057】
例えば、上記実施形態では、シンボルとシルエット自体をユーザがスケッチ入力する場合を例示したが本発明はかかる構成に限定されない。例えば、シンボルおよび/またはシルエット自体は、バーコードの読み取りやイメージデータからの切り出し等の非スケッチ入力に基づき入力し、その編集(追加、修正等)についてのみスケッチ入力を行う構成を採用しても構わない。この場合、本発明では、シルエットに対する編集結果を表示上のシンボルの振る舞いに反映させるようにすることができる。
【0058】
【発明の効果】
以上説明したように、本発明によれば、操作が直感的かつ容易であり、さらにデザインイメージに近いオブジェクトを比較的簡単に獲得可能な、ユーザインターフェース手法を提供することができる。さらに、本発明によれば、2次元の操作で3次元空間にインタラクションを行う際に、デザインイメージに近いオブジェクトを容易に生成することができる、ユーザインターフェース手法を提供することができる。さらにまた、本発明によれば、文字、文字列或いは文章等のテキストベースのシンボルを用いながらも、そのシンボルの意味を通じて直感的な3次元空間との対話を実現することが可能な、ユーザインターフェース手法を提供することができる。
【0059】
また、本発明によれば、非常に有用な教育ツール、特に文字教育や単語教育のツールを実現できる可能性がある。例えば、漢字の形は、実世界における振る舞いや形から由来しているものが多く、漢字と画像などのオブジェクトを直接結び付けることで意味や形を理解する手助けになると考えられる。従って、子供向けの漢字教育や外国人向けの日本語教育において、漢字とオブジェクトが直接対応付けされている本手法は効果的であると考えられる。また、幼児や非母国語の学習者等に単語を教える際にも、単語とともに対応するイメージを示すことができれば、学習者の興味を惹くことができるとともに、高い学習効果を期待することができる。
【0060】
さらに、本発明による表示オブジェクトの獲得は、単に、変換だけではなく描画のトリガーとしての利用も可能である。変換したオブジェクトをベースにして、その上に色を塗ったりすることでクリエーションのトリガーとしての機能がある。
【0061】
さらにまた、本発明による表示オブジェクトは、簡単なデータ構成に基づき実現可能なので、メール等に添付する新たなコミュニケーションツールとして利用可能である。すなわち、データはビットマップ上の描画とすることができるため、この描画をメールで送ることは可能である。また、PDAなどのペン入力をサポートするコンピュータで手書き文字入力をする際に有効である。さらに、共有仮想空間でのコミュニケーションにおいても、漢字描画でオブジェクトを生成できることに加え、データも軽いので、ネットワークを介したコミュニケーションでは効果的であると考える。
【図面の簡単な説明】
【図1】本発明にかかるユーザインタフェース装置の機能モジュール群の一実施例を示す概略的なブロックダイアグラム
【図2】本発明にかかるユーザインタフェース方法の典型的な処理フローに沿ったフローチャート例
【図3】本発明にかかるユーザインタフェース方法のユーザ入力イベントを中心としたフローチャート例
【図4】表示オブジェクトのオブジェクト配置領域への対応処理に関するフローチャート例
【図5】本発明にかかるシステムの表示イメージ例
【図6】本発明にかかるシステムの基本変換に関する表示イメージ例
【図7】本発明にかかるシステムの応用変換に関する表示イメージ例
【符号の説明】
1:入力ユーザインタフェース、3:ユーザ入力処理モジュール、5:シンボル認識モジュール、7:シルエット認識モジュール、9:データベース更新モジュール、11:テンプレート検索モジュール、13:テンプレートデータベース、15:モデル生成モジュール、17:表示処理モジュール、19:出力ユーザインタフェース
Claims (7)
- ユーザインターフェース方法であって:
ユーザのスケッチ操作により入力されたオブジェクト配置領域の形状を取得する、ステップと;
上記配置領域の上記取得形状に基づき、オブジェクトの変換パラメータを取得する、ステップと;
ユーザのスケッチ操作により入力されたシンボルを取得する、ステップと;
登録されているオブジェクト群から上記シンボルに関連する表示オブジェクトを検索する、ステップと;
上記変換パラメータに基づき、検索された上記表示オブジェクトの初期データを変換する、ステップと;
変換後の上記表示オブジェクトを上記オブジェクト配置領域に表示させる、ステップと;
を含むことを特徴とする、ユーザインターフェース方法。 - 上記初期データは、表示オブジェクトの初期形状データを含み;
上記変換は、表示オブジェクトの形状変形を含む;
ことを特徴とする、請求項1のユーザインターフェース方法。 - 上記オブジェクト配置領域には、初期形状が設定されており;
上記変換パラメータは、上記初期形状と上記取得形状との比較に基づき取得される;
ことを特徴とする、請求項1のユーザインターフェース方法。 - 上記オブジェクト配置領域の初期形状は、3次元形状であり;
上記配置領域の上記取得形状は、2次元形状であり;
上記変換パラメータは、上記初期形状の2次元投影形状と上記取得形状、または上記取得形状の3次元拡張形状と上記初期形状、の比較に基づき所得され;
上記変換パラメータを取得するステップの前に、上記初期形状の2次元投影または上記取得形状の3次元拡張を行うステップをさらに含む;
ことを特徴とする、請求項3のユーザインターフェース方法。 - 上記シンボルは、文字、文字列または文章であり;
上記シンボルに関連する表示オブジェクトは、上記シンボルの意味に関係するイメージオブジェクトである;
ことを特徴とする、請求項1のユーザインターフェース方法。 - ユーザインターフェース装置であって:
ユーザのスケッチ操作により入力されたオブジェクト配置領域の形状を取得する、手段と;
上記配置領域の上記取得形状に基づき、オブジェクトの変換パラメータを取得する、手段と;
ユーザのスケッチ操作により入力されたシンボルを取得する、手段と;
登録されているオブジェクト群から上記シンボルに関連する表示オブジェクトを検索する、手段と;
上記変換パラメータに基づき、検索された上記表示オブジェクトの初期データを変換する、手段と;
変換後の上記表示オブジェクトを上記オブジェクト配置領域に表示させる、手段と;
を含むことを特徴とする、ユーザインターフェース装置。 - コンピュータ・プログラムであって:
コンピュータを、ユーザのスケッチ操作により入力されたオブジェクト配置領域の形状を取得する手段として機能させる、モジュールと;
コンピュータを、上記配置領域の上記取得形状に基づきオブジェクトの変換パラメータを取得する手段として機能させる、モジュールと;
コンピュータを、ユーザのスケッチ操作により入力されたシンボルを取得する手段として機能させる、モジュールと;
コンピュータを、登録されているオブジェクト群から上記シンボルに関連する表示オブジェクトを検索する手段として、機能させるモジュールと;
コンピュータを、上記変換パラメータに基づき、検索された上記表示オブジェクトの初期データを変換する手段として、機能させるモジュールと;
コンピュータを、変換後の上記表示オブジェクトを上記オブジェクト配置領域に表示させる手段として機能させる、モジュールと;
を含むことを特徴とする、コンピュータ・プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003168357A JP2005004543A (ja) | 2003-06-12 | 2003-06-12 | ユーザインターフェース方法および装置、ならびにコンピュータ・プログラム |
US10/863,032 US7580574B2 (en) | 2003-06-12 | 2004-06-08 | User interface method and apparatus, and computer program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003168357A JP2005004543A (ja) | 2003-06-12 | 2003-06-12 | ユーザインターフェース方法および装置、ならびにコンピュータ・プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005004543A true JP2005004543A (ja) | 2005-01-06 |
Family
ID=34093877
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003168357A Pending JP2005004543A (ja) | 2003-06-12 | 2003-06-12 | ユーザインターフェース方法および装置、ならびにコンピュータ・プログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US7580574B2 (ja) |
JP (1) | JP2005004543A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20140100545A (ko) * | 2011-12-30 | 2014-08-14 | 인텔 코포레이션 | 상태 판정을 이용한 대화형 그림 인식 |
WO2015005664A1 (ko) * | 2013-07-09 | 2015-01-15 | Ryu Jungha | 기호 이미지를 이용한 디자인 설계 장치 및 설계 방법과 기호 이미지가 적용된 설계 대상물 분석 장치 및 분석 방법 |
US9430035B2 (en) | 2011-12-30 | 2016-08-30 | Intel Corporation | Interactive drawing recognition |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7158675B2 (en) * | 2002-05-14 | 2007-01-02 | Microsoft Corporation | Interfacing with ink |
JP2007511814A (ja) * | 2003-10-15 | 2007-05-10 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 素描を通じたユーザーインターフェース記述の自動生成 |
US8300062B2 (en) * | 2005-04-18 | 2012-10-30 | Steve Tsang | Method, system and computer program for using a suggestive modeling interface |
KR102473653B1 (ko) * | 2007-09-26 | 2022-12-02 | 에이큐 미디어 인크 | 오디오-비주얼 내비게이션 및 통신 |
US7969435B1 (en) * | 2007-11-09 | 2011-06-28 | Spaceclaim Corporation, Inc. | Method for modifying any modeled surface as a lofted surface |
US8207990B1 (en) | 2008-01-04 | 2012-06-26 | Spaceclaim Corporation, Inc. | Systems and methods for merging and splitting intersecting solids and surfaces |
US7830377B1 (en) * | 2008-01-09 | 2010-11-09 | Spaceclaim Corporation, Inc. | Systems and methods for using a single tool for the creation and modification of solids and surfaces |
US9449026B2 (en) * | 2010-08-31 | 2016-09-20 | Microsoft Technology Licensing, Llc | Sketch-based image search |
US20140214369A1 (en) * | 2012-10-31 | 2014-07-31 | Jim Watson | Method for providing parametric data for cad software |
US9147125B2 (en) | 2013-05-03 | 2015-09-29 | Microsoft Technology Licensing, Llc | Hand-drawn sketch recognition |
CN104572683A (zh) * | 2013-10-17 | 2015-04-29 | 北大方正集团有限公司 | 文字笔画动画处理方法和装置 |
US10957080B2 (en) * | 2019-04-02 | 2021-03-23 | Adobe Inc. | Automatic illustrator guides |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5596656B1 (en) * | 1993-10-06 | 2000-04-25 | Xerox Corp | Unistrokes for computerized interpretation of handwriting |
JP4449183B2 (ja) | 2000-07-11 | 2010-04-14 | ソニー株式会社 | 画像編集システム及び画像編集方法、並びに記憶媒体 |
JP2002074399A (ja) | 2000-08-28 | 2002-03-15 | Sony Corp | 画像編集システム及び画像編集方法、並びに記憶媒体 |
JP3861690B2 (ja) | 2002-01-07 | 2006-12-20 | ソニー株式会社 | 画像編集装置及び画像編集方法、記憶媒体、並びにコンピュータ・プログラム |
JP2004199130A (ja) | 2002-12-16 | 2004-07-15 | Sony Corp | 情報視覚化方法、装置、プログラム |
-
2003
- 2003-06-12 JP JP2003168357A patent/JP2005004543A/ja active Pending
-
2004
- 2004-06-08 US US10/863,032 patent/US7580574B2/en not_active Expired - Fee Related
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20140100545A (ko) * | 2011-12-30 | 2014-08-14 | 인텔 코포레이션 | 상태 판정을 이용한 대화형 그림 인식 |
JP2015503794A (ja) * | 2011-12-30 | 2015-02-02 | インテル・コーポレーション | ステータス決定を利用する対話型の描画認識 |
KR101625419B1 (ko) | 2011-12-30 | 2016-06-13 | 인텔 코포레이션 | 상태 판정을 이용한 대화형 그림 인식 |
US9430035B2 (en) | 2011-12-30 | 2016-08-30 | Intel Corporation | Interactive drawing recognition |
WO2015005664A1 (ko) * | 2013-07-09 | 2015-01-15 | Ryu Jungha | 기호 이미지를 이용한 디자인 설계 장치 및 설계 방법과 기호 이미지가 적용된 설계 대상물 분석 장치 및 분석 방법 |
US10049429B2 (en) | 2013-07-09 | 2018-08-14 | Jung Ha RYU | Device and method for designing using symbolized image, and device and method for analyzing design target to which symbolized image is applied |
Also Published As
Publication number | Publication date |
---|---|
US20050062740A1 (en) | 2005-03-24 |
US7580574B2 (en) | 2009-08-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20230409771A1 (en) | Building information model (bim) element extraction from floor plan drawings using machine learning | |
CN105830011B (zh) | 用于交叠手写文本输入的用户界面 | |
Foley et al. | The art of natural man-machine conversation | |
US5586198A (en) | Method and apparatus for identifying characters in ideographic alphabet | |
Blenkhorn et al. | Using speech and touch to enable blind people to access schematic diagrams | |
Gross et al. | Drawing on the Back of an Envelope: a framework for interacting with application programs by freehand drawing | |
US20040054701A1 (en) | Modeless gesture driven editor for handwritten mathematical expressions | |
US7580574B2 (en) | User interface method and apparatus, and computer program | |
US20070276814A1 (en) | Device And Method Of Conveying Meaning | |
KR20190039767A (ko) | 협업적 잉크 관리를 위한 시스템 및 방법 | |
WO2006105596A1 (en) | Method for transforming language into a visual form | |
CN108700994A (zh) | 用于数字墨水交互性的系统和方法 | |
JP2003162687A (ja) | 手書き文字入力装置、手書き文字認識プログラム | |
Shi et al. | Molder: an accessible design tool for tactile maps | |
Pereira et al. | Towards calligraphic interfaces: sketching 3D scenes with gestures and context icons | |
Smithies et al. | Equation entry and editing via handwriting and gesture recognition | |
Juchmes et al. | A freehand-sketch environment for architectural design supported by a multi-agent system | |
AU2021269326B2 (en) | Device and method for automatically creating cartoon image based on input sentence | |
US11978252B2 (en) | Communication system, display apparatus, and display control method | |
Pan et al. | A human-computer collaborative editing tool for conceptual diagrams | |
CN117290938B (zh) | 基于bim模型和深度学习的ai建筑工程交互系统和方法 | |
CN114519213A (zh) | 使用机器学习从标记中实现计算机辅助绘制图自动化 | |
Khan et al. | Real-Time American Sign Language Realization Using Transfer Learning With VGG Architecture | |
Jorge et al. | GIDes+ | |
CN111078907A (zh) | 汉字树处理方法及其装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060607 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20060607 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080805 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080918 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20090205 |