JP2005512226A - グラフィクス支援された音声制御システムを備えたユーザインタフェース - Google Patents

グラフィクス支援された音声制御システムを備えたユーザインタフェース Download PDF

Info

Publication number
JP2005512226A
JP2005512226A JP2003551660A JP2003551660A JP2005512226A JP 2005512226 A JP2005512226 A JP 2005512226A JP 2003551660 A JP2003551660 A JP 2003551660A JP 2003551660 A JP2003551660 A JP 2003551660A JP 2005512226 A JP2005512226 A JP 2005512226A
Authority
JP
Japan
Prior art keywords
user
option
options
user interface
presented
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2003551660A
Other languages
English (en)
Inventor
エヴジェニィ イー セテイン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Publication of JP2005512226A publication Critical patent/JP2005512226A/ja
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0481Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G5/00Control arrangements or circuits for visual indicators common to cathode-ray tube indicators and other visual indicators
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • General Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Computer Hardware Design (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

電子装置は第1のユーザ選択可能な選択肢を提供するUIを持つ。第2のユーザ選択可能な選択肢は、前記第1の選択肢の特定の1つを選択すると利用可能とされる。提示されたときの前記第1の選択肢の情報分解能は、提示されたときの前記第2の選択肢の情報分解能と異なる。また、前記第1の選択肢からの選択のためのUIとのユーザインタラクションの第1の様式は、前記第2の選択肢からの選択のためのUIとのユーザインタラクションの第2の様式と異なる。

Description

本発明はユーザインタフェース(UI)に関し、より詳細には、ハンドヘルド型の情報機器(パームトップ、電子腕時計、電子手帳(organizer)、携帯電話、ウェブパッド、リモートコントローラ、PDA又はノート型コンピュータ等)のような小さな画面サイズを持つ装置のための多様なUIに関する。
現在の動向は、2002年までに世界中で携帯電話の加入者が10億人になるであろうことを示唆している。2004年までには利用される携帯電話がPCよりも多くなるであろう。
携帯電話は、個人向けの信頼できる装置となってきている。Philips Electronics社により製造される「Genie」のような携帯電話は、典型的にユーザインタフェースの一部としてLCDを持ち、より多くの数の搭載されたソフトウェアサービスを提供する傾向がある。前記電話は音声制御機能をも持つ。
例えば3COM社によって製造されるPalm(登録商標)又はWindows(登録商標) CEベースのiPAQ(登録商標)ハンドヘルド装置といったパーソナル・ディジタル・アシスタント(PDA)のようなハンドヘルド型のコンピュータ装置は、無線モデム、又は2.5G(例えばGPRS)若しくは3G(DoCoMo)サービスを介してネットワークに接続されることができる。結果として、インターネットを介したユビキタス型の情報アクセスが現実となってきている。後者のサービスは、装置が常に接続されたままであること、及びeメール、インスタントメッセージ、IPによる通話、オーディオ/ビデオ及び個人スケジュール又はカレンダのような情報にアクセスすることを可能とする。802.11b及びBluetoothのような無線LAN及びPAN接続規格は、PDA及び携帯電話が、それぞれのネットワークに配置された種々の情報コンテンツにインタラクトすることを可能とする。GPRS及び802.11bの接続の組み合わせは、ワイド・エリア・ネットワーク(WAN)、ローカル・エリア・ネットワーク(LAN)及び個人エリア・ネットワーク(PAN)といった、異なるネットワーク間のシームレスなローミングを提供する。調査は更に、PDA及び携帯電話の機能は集中し始めており、携帯型の情報社会が発展していることを示唆している。専用装置の出現もあるであろう。PDAは今や仕事に関連するものである。近い将来、PDAは常にユーザと共にあるパーソナライズされたコンピュータとなるであろう。PDAは更なる能力とより小さいサイズを獲得し、より多くの及びより汎用性のある機能を収容するであろう。殆どの接続された装置は、タッチスクリーンを利用して若しくは音声によってアイコン、メニューのアイテム(item)若しくはリストのアイテムを選択することにより、音声認識ソフトウェア及びハードウェアを利用してアイテムを選択することにより、又はボタンやスクロールホイール等のような専用のハードウェアインタフェースを利用することにより、UIを介して制御されることができる。
携帯電話であろうと、パームトップであろうと、PDAであろうと、電子腕時計であろうと、利便性及びユーザフレンドリであることは、有用性及び実用性を制限する要因であると考えられている。とりわけ、接続された個人向け装置についてのUI及びサービスのアクセス可能性は、市場で受け入れられるための重大な要因となってきている。とりわけ、eコマース又は電子ショッピングは、ユーザインタフェースのテクノロジがユーザが多様なデジタルコンテンツ及び通信の選択肢を持つインタラクションのための最良の選択肢を利用することを可能とする場合には、個人向け通信装置のユビキタス性から利益を得るであろう。
本発明は、数ある中でも、それぞれが特定の多ステップのタスクに対して最も適切なものである複数のインタフェースの様式をユーザに提供することにより、情報へのユーザアクセス、制御及び通信の選択肢を容易化する方法及び装置を提供することに対処する。本発明の他の態様は、特定の情報アクセス、制御又は通信タスクのための情報分解能(information resolution)に基づいて様式の選択を可能とする方法及び装置に関する。本発明の他の態様は、UI様式の選択のカスタマイズを可能とする。
本明細において利用される「情報分解能」なる語は、特に、しかし限定的にではなく、視覚、聴覚、触覚又は他の感覚による手段を介して知覚されたときに異なるアイテムの間を区別するユーザの能力を決定する、情報アイテムの集合の特性を指す。例えば前記分解能は、表示モニタ上に提示(render)されたとき(空間的な距離)、マイクロフォンによって捕捉されたとき、又はラウドスピーカによって提示されたとき(時間的な距離)に、選択又は作用されたアイテム間の相対距離に関連する。適切な分解能又は分可能間隔は、個々のユーザ、UIの様式、装置の機能、環境の条件及び他の要因に依存し得る。例えば、Sung Choi及びJan van Eeに発行された米国特許6,211,856(整理番号PHA23,387)は(参照によって本明細に組み込まれたものとする)、電子装置の制御可能な機能を表示するためのグラフィカルなユーザインタフェースのタッチスクリーンに関する。前記機能はアイコンとして表示され、前記機能がユーザによって認識可能だが容易に前記機能の特徴にアクセスするには小さすぎるスケールのサイズで表示される。前記アイコンの少なくとも一部の拡大されたバージョンが、アイコンの前記一部をユーザが触れると提示される。上述の例において最初の情報分解能は、ユーザが例えばキーストロークのような所望のタスクに結果における高い度合いの信頼を伴って影響を及ぼすためには低すぎる。前記拡大されたバージョンは、対応する動作を表すそれぞれのアイコンのサイズを増大させることにより、特に制御の面で情報分解能を増大させる。この場合、情報分解能は、許容可能なレベルには元来不十分なサイズを増大させることにより、同一の論理的な大きさ(グラフィカルな表現)において直接増大させられる。
発明者は、ユーザの知覚に対して情報を提示するための特定のUIの様式によって情報分解能が影響され得ることに気付いた。代替のUIの様式が、異なる範囲の情報分解能を提供するために利用されることができる。「様式(modality)」という語は、UIとのユーザのインタラクションに含まれる、1以上の特定の感覚の方法、又は1以上の特定の感覚的な知覚(例えば聴覚、視覚、運動感覚)及び/又は対応する生理学的なプロセス(例えば音声入力/出力、聴覚のフィードバック、グラフィカルな入力/フィードバック、触覚入力/フィードバック)を指す。情報アイテムは、明示的に(例えばグラフィカルに、聴覚に)又は暗黙的に(例えば直感的に明らかな若しくは経験による存在、又は記憶によって示唆される)UIにおいて表現されることができる。
従って本発明は、UIを備えた電子装置に関する。前記UIは第1のユーザ選択可能な選択肢を提供する。第2のユーザ選択可能な選択肢は、前記第1の選択肢の特定の1つが選択されると利用可能となる。提示されるときの前記第1の選択肢の情報分解能は、提示されるときの前記第2の選択肢の情報分解能と異なる。前記第1の選択肢から選択するためのUIとのユーザインタラクションの第1の様式は、前記第2の選択肢から選択するためのUIとのユーザインタラクションの第2の様式と異なる。好ましくは、少なくとも前記第1の様式又は前記第2の様式は、前記UIの設定モードにおいてプログラム可能である。このようにしてユーザは、メニュー中の種々のレベルにおいて、例えば該ユーザの好み又は情報分解能に依存して、前記UIとインタラクトするための方法を設定することができる。例えば、多レイヤメニューにおいては、あるレイヤは多くの第1の選択肢を有し、他のレイヤはより少ない第2の選択肢を有する。例えばタッチスクリーンを利用して前記第1の選択肢から選択し、音声入力を利用して前記第2の選択肢から選択することはより便利であり得る。
好ましくは、UIとのユーザインタラクションの付加的な様式が、少なくとも前記第1及び第2の選択肢からの選択のために利用可能である。本発明の実施例においては、前記装置は例えば電話、インスタントメッセンジャ又はeメールハンドラ等のような通信機能を有する。
更なる実施例においては、前記装置はタッチスクリーン及び音声入力のためのマイクロフォンを持つ。前記第1及び第2の様式の一方はタッチスクリーンに触れることを含み、前記第1及び第2の様式の他方は音声入力を含む。
本発明の他の実施例においては、前記装置は、前記第1の選択肢の少なくとも幾つかを提示するための表示モニタと、ユーザが前記提示された第1の選択肢のそれぞれを複数の所定の属性の1つに関連付けることを可能とする第1の手段と、前記関連付けられた属性を通して前記提示された第1の選択肢の特定の1つを選択するための第2の手段とを有する。
本発明はまた、第1及び第2のレイヤに配置された選択肢を選択することを可能とするためのUIを提供する方法に関する。前記UIにおいて提示されたとき、前記第1のレイヤにおける選択肢は、前記UIにおいて提示されたときの前記第2のレイヤにおける選択肢の情報分解能と異なる情報分解能を持つ。前記方法は、前記第1のレイヤにおける選択肢のうちの第1のものを選択するための第1の様式を提供するステップを有し、前記第1の様式は第2のレイヤにおける選択肢のうちの第2のものを選択するための第2の様式とは異なる。本発明は、ユーザフレンドリな又はカスタマイズされたインタフェースを提供するため例えばウェブサイトを用いて利用されることができる。
本発明は更に、第1のユーザ選択可能な選択肢、及び前記第1の選択肢のうちの特定の1つを選択すると利用可能となる第2のユーザ選択可能な選択肢を提供するUIを生成するための、電子装置上での利用のためのソフトウェアに関する。ここで提示されたときの前記第1の選択肢の情報分解能は、提示されたときの前記第2の選択肢の情報分解能とは異なり、前記第1の選択肢から選択するためのUIとのユーザインタラクションの第1の様式は、前記第2の選択肢から選択するためのUIとのユーザインタラクションの第2の様式と異なる。ラップトップコンピュータ、PDA又は携帯通信機器のような電子装置は、かくしてユーザのニーズ及び好みに合うように向上させられることができる。
本発明は図を参照しながら例として以下に更に詳細に説明される。
図を通して、同一の参照番号は対応する又は同様の特徴を示す。
装置のUIのユーザフレンドリさは、数ある中でも、前記UIとのユーザインタラクションの様式、前記UIにおいて提示されるときのインタラクトするためのアイテムの情報分解能、及び環境の影響に依存する。前記分解能は、ユーザインタラクションの様式、提示される特定のアイテムのセット、環境の影響、及び前記装置が実行することを要求されているタスクといった量のうちの幾つか又は全てに依存するものとして考えられることができる。例えば、電話帳中の名前のセットは、タッチスクリーン上にグラフィカルに提示されることができ、ユーザは特定の名前が提示された場所において画面に触れることにより前記特定の名前を前記セットから選択することができる。前記特定の名前の選択は音声認識を利用して実行されることもできる。しかしながら、名前は典型的にアルファベット順に配列され、提示されるセットは同一のテキストキャラクタ、それ故同一の音素(phoneme)から始まる名前を有し得る。このことは、音声様式についての分解能をかなり低くする。また、周囲のノイズがある場合には、音声又は声認識が妨害され、それ故音声様式についての分解能に悪影響を与え得る。
より詳細には、本発明における装置の以下の例を考える。即ち、電話ベースの電子アドレス帳である。ここでは特定のアドレスのセットは、画面のGUI上の画像に触れることにより、又は代わりに音声認識システムを利用して人物の名前を言うことにより選択されることができる。前記アドレス帳は、人物に電話をするか、eメールを送るか、又はインスタントメッセージを送るかの選択肢を提供する。次いで、選択された人物にeメールを送るため、ユーザは対応するeメールアイコンに触れるか又は前記選択肢の名前(「eメール」)を発声することができる。第1のステップにおいて特定の名前を選択するための音声インタフェースの情報分解能は、例えば列挙された名前の間の音声上の類似性のため、非常に低くなり得る。また、典型的な音声認識システムは、学習させられ個々のユーザに適応させられる必要がある。一方で、コンタクトの前記選択肢の限られた数の、及び予め決められたキャラクタのため、「eメール」と発声することは、第2の機能にアクセスするための高速でより正確な選択肢となるであろう。このことは第2のGUIを開くことすらなく達成され得る。ユーザが全てのステップにおいてより良いUIの選択肢を利用することを可能とするため、前記システムは、最良の様式を決定することができ、推薦される様式の例えばアイコン又は他の表現のような、様式の手掛かりを提供することができる。上述した電話帳の例においては、前記システムは第1のステップにおいて「ペン」アイコンを表示し、第2のステップにおいて「音声」アイコンを表示しても良い。推薦される様式の代替例も、次のUIモジュールにアクセスする前に特定の機能へのアクセスを高速化することを可能とする。例えばスクロールホイールを利用することにより画面上の受信人をハイライトさせた後、アイテムに関連する、しかし明確に提示されていない特定の機能を起動するために、ユーザは例えば「家に電話する」といった音声コマンドを利用することを可能とさせられる。このタイプのインタラクションは、片手操作において特に有用となり得る。これに関連して、例えばWillem Bulthuisらによって1999年12月16日に出願された米国特許シリアル番号09/464,855(整理番号PHA23,875)の「HAND-EAR USER INTERFACE FOR HAND-HELD DEVICE」を参照されたい。本文献は参照によって本明細書に組み込まれたものとする。この特許文献は、ユーザが片手のみを利用して装置を見る必要なくメニューから選択肢を選択することを可能とするハンドヘルド型の装置に関する。前記装置は、前記装置とのユーザインタラクションのためのユーザインタフェースを有する。前記ユーザインタフェースは、ユーザが選択肢のセット中を自由に移動することを可能とするためのナビゲート入力と、ユーザが自由に移動している間前記選択肢のそれぞれの選択可能な1つについてユーザにそれぞれの聴覚フィードバックを提供するフィードバック出力と、ユーザが前記フィードバックに基づき現在の選択肢を選択することを可能とする確認入力とを持つ。好ましくは、携帯電話のような、前記装置のハンドヘルド型のバージョンは、ユーザに選択肢の線形な又は循環的な配列を走査させるサムホイール又は他のステップスルー型の構成要素を持つ。各前記選択肢は、一段上又は下にホイールが回転されたときに再生されるそれぞれのオーディオ出力によって表される。このことは、ユーザが片手で前記装置を観る必要なく選択肢を選択することを可能とする。またこのことは、パーソナライズされた電話帳から電話をするために数字を入力するためのキーパッドが必要とされないため、従来の携帯電話のものよりも小さな形状因子を可能とする。
本発明によれば、選択プロセスを更に容易化するために、より高い分解能の情報の大きさが加えられる。上述したアドレス帳の例においては、属性のカラムが現在のアドレスリストのページに加えられる。前記カラムは、表示されているアドレス帳のレコードと関連する、例えば視覚的に異なる形状を含む。前記形状は、情報分解能及び利用可能な組み合わせの数を更に増大させるため、異なって色付けされても良い。前記形状及び/又は色は、例えば受信人の名前のようなデータベース中の特定のアイテムに関連しないが、例えば行のような、画面上の特定のアイテムの位置に関連する。前記属性のカラム中のアイテムは、ユーザが前記リストを上又は下にスクロールしても略同じままである。ユーザは、表示されたレコードと現在関連している形状及び/又は色の名前を発声することにより個々のレコードにアクセスする。例えば、「青い丸」というフレーズは、前記属性のカラムにおける対応する形状/色の組み合わせによってマークされたレコードを選択する。形状及び色の名前は、誤判別の可能性を減少させるために、音声的にかなり異なるように選択される。このことは、例えば互いに非常に類似して発音する、又は明確に発音されない、人物の名前のようなアイテムを分解するために特に有用となり得る。ユーザは、例えばボタンを押下することにより、該ユーザの自由に上述の例においてグラフィカルに支援された音声インタフェースを呼び出すことを可能とされる。代替として、前記形状及び色は、前記アドレス帳の筐体上の据え付けのボタンとして実装されても良い。ユーザは前記ボタンの特定の組み合わせを押下することによりレコードにアクセスすることを可能とされる。
他の実施例においては、情報分解能アプローチは、例えばWAP(wireless application protocol)技術、Bluetooth、802.11等を利用した、PDA、パームトップ、ウェブパッド、携帯電話のような、インターネットアクセス(ブラウザ)及びディスプレイを備えたハンドヘルド型の情報処理装置のために利用される。かような装置は、インターネットからウェブページを取得し及び自由に移動するためのブラウザを利用することができるが、情報を失うことなくその全体を提示することはできない。しかしながら、前記ページの画像のレイアウト及び全体的な外見は、例えばハイパーリンクを含むように、一部がユーザにとって関心があるものであるか否かを示唆する。前記ページの特定の一部へのアクセスを容易化するため、ページの概観を提示するために「画像」「テキスト」「段落」といった高レベルのHTMLタグが利用されることができる。最上レベルのXMLタグも利用されることができる。前記システムは、例えば「画像」のような前記ページの特定の一部を示す音声コマンドに応答することを可能とされる。前記ページに複数の画像が存在する場合、これら画像は番号、色、特別な記号等により示されることができる。前記システムは、情報アイテムの属性を示すコマンドに応答することを可能とされる。例えばカラー画面上において青のバーは第1の画像を示し一方緑のバーは他のものを示し、そのため「青の画像」というコマンドはユーザが前記第1の画像にズームインすることを可能とする。白黒画面上においては、情報アイテムは、例えば星型、丸、四角等のような、明確に区別される形状を持つ記号によって示されることができる。それ故、前記システムは「星型の画像」「丸のテキスト」及び同様のその他のもののようなコマンドに応答することを可能とされる。
本発明のシステムは好ましくは、多レイヤのメニューにおける種々のレベルについて、例えば音声、ポイント/タッチ、ボタン等といった、代替のアクセス様式の好みのようなカスタマイズの選択肢をユーザに提供する。PCベースの又はインターネットサーバベースのソフトウェアは、設定段において情報の大きさ、様式、例えば形状、色、言語、発音等のような表現の選択肢を選択するようにユーザをガイドしても良い。例えばユーザは、幾何形状、果物、動物、数等のような、形状の代替のカテゴリを選択することを可能とされる。ユーザはまた、例えばネットワークサーバ、PC、PDAのようなコンピュータからグラフィックのセット及び/又はマッピングソフトウェアをダウンロードすることを可能とされる。
図1、2及び3は、電子アドレス帳を備えた通信装置100のUIにおける連続的なレイヤの図である。装置100は、本例においては無線機器であり、例えば携帯電話機能、eメール機能及びSMS機能を有する。前記アドレス帳は、装置100の操作モードにおいてユーザに受信人の名前を選択させるためのメニューと、例えば通話を開始する、インスタントメッセージを送信する、eメールを送信する、SMSメッセージを送信する等の当該受信人に実行されるべき通信動作とを持つ。特定のエントリ、ここでは姓「Shteyn」が、例えばスクロールボタン(図示されていない)又は文字「S」を示すソフトタブキーを介して、又はマイクロフォン106によって受信され音声認識システム108によって処理される「S」を発音することによる音声入力を介して、名前の適切な群を選ぶことにより選択される。次いでユーザは、前記装置のタッチスクリーン104上に提示された前記メニューの第1のレイヤにおける名前のグラフィック表現102(例えば英数字表現、アイコン又は画像等)に触れる。代替としては、前記特定のエントリは、音声認識システム108に結合されたマイクロフォン106に関連する人物の名前を発音することにより選択される。前記第1のステップにおいて特定の名前を選択するための音声インタフェースの情報分解能は、数ある中でも、列挙された名前の間の音声上の類似性のために比較的低い。他の欠点は、音声認識システム108は典型的に、個々のユーザ毎に前記アドレス帳の各個々の名前のエントリについて学習させられる必要があるという点である。それ故音声制御が、ディスプレイ104に現在表示されている名前のそれぞれを、前記音声制御が予めプログラムされた所定の属性の特定の1つに一時的にマッピングさせることは、より便利である。前記属性はここではカラム110に示される。名前を上又は下にスクロールすることは、名前の他のサブセットが表示されることに帰着する。ディスプレイ104に提示される各サブセットはこのとき、操作の利用の間の選択のため同一の所定の属性に関連付けられることができる。即ち、ユーザが名前のリストを上又は下にスクロールしたときも、カラム110は静止したままである。示された例においては、前記属性は幾何学的な形状である。これらの代替は、例えば異なる色、数等である。名前の現在のサブセットを伴う示された例においては、属性「丸」は名前「Shteyn」に関連付けられ、属性「三角」は名前「Steen」に関連付けられ、属性「月型」は名前「Stein」に関連付けられ、属性「四角」は名前「Steyn」に関連付けられ、名前「Stijn」は属性「菱形」に関連付けられる。パネル110における属性は、例えばディスプレイ104の別個のウィンドウに提示され、又は装置100上のハードボタンである等する。推薦される様式の手掛かり112は、音声認識システムが起動されていることを示す。ここで受信人「Shteyn」を選択することは、表示された情報アイテム「Shteyn」をグラフィカルな記号「丸」と視覚的に関連付けることにより、及び「丸」という語を発声することにより音声入力を介して、又はタッチスクリーン104上の丸に触れることにより達成される。従って、選択メカニズムは、名前「Shteyn」の意味内容の、(抽象的な)属性、ここでは「丸」への視覚的なマッピング、及び後者について名前を発音することを利用する。かくして前記選択は、視覚的な態様と音声とのハイブリッドな組み合わせを含む。受信人の名前「Shteyn」を選択すると、前記メニューは図2に示される次の状態に進む。
図2は、ひとたびエントリ、ここでは受信人の姓「Shteyn」が選択されたディスプレイ104を示す。前記アドレス帳のメニューは、当該選択について4つのとり得る選択肢「Eugene」、「Svetlana」、「Vladimir」及び「Alice」があることを示す。ユーザは「Alice Shteyn」に電話をしたいとする。エントリ「Alice」を選択するために、図1の属性マッピングが利用されても良い。しかしながら、このレベルにおいては、情報分解能が音声入力を利用するのに十分に高い限られた数の利用可能な選択肢のため、システム108を介した音声入力がより便利である。ユーザは当該受信人を選択するため語「Alice」を発声する。「Alice」を選択すると前記メニューは、当該受信人の電話番号、eメールアドレス、無線呼び出し機番号といったAliceにコンタクトするための選択肢、又はこれらのコンタクト情報アイテムを表すアイコンを列挙する次のレベルにグラフィカルに進む。図3の図を参照されたい。操作モードにおいては、ユーザは特定の通信モードで装置100を介してコンタクトを開始することにのみ関心があるのであって、そのために利用されるまさにそのコンタクト情報に必ずしも関心はないため、番号又はeメールアドレスが提示される必要はないことに留意されたい。通信のモードは限定されており、前記アドレス帳を通して全ての受信人に対して全く一般的なものであるため、Aliceについて列挙された通信の選択肢の提示は全く省かれさえもして良い。ユーザは本例においては「通話」又は「電話」と発音する。図2のメニューレベルが選択プロセスの最後となるようにユーザが「Alice」と発音した直後に「通話」又は「電話」と発音しても良いため、Aliceについて列挙された通信の選択肢の提示は全く省かれても良いことに留意されたい。次いで前記装置は、Alice Shteynの個人の携帯電話のものとして列挙された番号をダイアルし、通話を開始する。
図4は、本発明による装置又はシステムの実装とのユーザインタラクションの処理を示すフロー図である。該処理は音声入力及び他のユーザインタラクションの様式を可能とする。ステップ402において周囲のノイズレベルが決定され、ステップ404において閾値レベルと比較される。前記周囲のノイズレベルが特定の閾値よりも低くない場合、ステップ406においてタッチスクリーンアクセスモードが起動される。前記装置はまたステップ408において、例えばグラフィカルモードのような選択されたアクセスモードをユーザに通知するために適切なアクセスモードの手掛かりを選択し、ステップ410においてユーザに該手掛かりを提示する。ユーザは次いで前記タッチスクリーンを通して入力を与えることができる。前記周囲のノイズレベルが閾値より低い場合、前記システムの装置はステップ414においてグラフィック支援された音声制御システムを初期化する。ステップ416において、例えば前記システムによって自動的に、又はユーザによる音声入力を介して手動で、グラフィックスのセットが選択される。グラフィックスのセットは、表示モニタ上に提示される、例えば参照番号110によって示されたセットのような、アイコン又は記号の集合を有する。ステップ418において、一方のアイコン又は記号と、例えば図1における名前のようなグラフィカルに表示された情報アイテムとの関連を生成するために、結合メカニズムが確立される。ステップ420において、例えば提示された名前及びアイコンを伴った図1に示されたもののような、結合されたGUIが生成される。ステップ422において、音声制御アクセスモードが起動され、ステップ408以下で上述したようにアクセスモードの手掛かりが選択される。
図5は、タグ付けられたコンテンツ(例えばHTML、XML)表現インタフェースのための、本発明におけるグラフィカルに支援された音声制御システムを示すフロー図である。ステップ502において、ユーザ装置又はその代理として動作するプロキシは、ユーザによって要求されたHTMLファイルをサーバから受信する。前記HTMLファイルはウェブページ、例えばUPnP装置インタフェースのようなユーザインタフェース表現等を表しても良い。ステップ504において、ページの表示サイズが、例えば画素で見積もる。HTMLページサイズの決定は、当分野では良く知られている。例えば、Netscape(登録商標)ウェブブラウザのソースコードは、例えば
Figure 2005512226
からインターネット上で入手可能である。ステップ506において、分解能の閾値が必要とされるものより低いか否かを決定するため、必要とされる表示サイズが、実際の装置のディスプレイサイズ又は表示のために利用可能な領域と比較される。前記閾値は、例えば前記ページの必要とされるサイズと実際の画面の利用可能なサイズとの間の比によって表現されることができる。前記装置の画像スケーリング機能も考慮に入れられても良い。前記表示の要求が前記閾値を超える場合、ステップ508において全タッチスクリーンアクセスモードが起動される。そうでなければ、ステップ516においてグラフィクス支援された音声制御システムが初期化される。前記初期化ステップは、当該処理の次のステップに含まれる処理のプログラム命令及び/又はデータセグメントをメモリにロードすることを含んでも良い。前記セグメントは、前記装置自体にあっても良いし、例えばパーソナルコンピュータ又はインターネットサーバのような他の装置にあっても良い。後者の場合には、前記装置は有線又は無線のネットワークを介して接続される。ステップ518において、表現タグセットが選択される。所定の実装において、前記タグセットは、例えばIMG、FORM、TABLEといったHTMLのタグ名のリストと、任意に当該タグが表現する要素の閾値画素サイズとを有する。前記タグはHTMLドキュメントの標準的な属性及び/又は特定のドキュメントタイプに関連する固有の拡張を表すことができる。ここで説明された実装においてHTMLドキュメントは、インターネットで利用され、一般に「マークアップ言語」と呼ばれるもので記述されるハイパーメディア・コンテンツの例を表す。SGMLは、ドキュメントの構造を記述し、テキスト内の該構造を描写するタグのスキームを記述する、かような言語の1つである。HTML、XML、XHTMLはSGMLのサブセットであり、ドキュメント表現及びドキュメント通信において広く利用されている。ステップ520において、ステップ518において選択されたタグセットにおいて列挙されたタグによって示される情報を抽出するため、前記HTMLファイルがパースされる。元のファイルは将来の参照のために保存されても良いし、破棄されても良い。一方前記抽出された情報は、例えば前記選択されたタグセットに合致しない全てのタグ付けられたデータを取り除くことにより、表示される準備をされる。ステップ522において、前記ディスプレイに識別された、タグ付けされた情報を表示するためにグラフィックスのセットが選択される。前記グラフィックスのセットは、アイコン、幾何学的な形状、タグの名前等のセットを有しても良い。ステップ524において、前記タグ付けされた情報セグメントは、前記グラフィックスのセットにマッピングされ、これら2つのビジュアルな又はオーディオの対応関係を確立する。ステップ526において、元のHTMLファイルのディスプレイ表現を可能とするために結合されたGUIが生成される。前記結合は、タグ付けされた情報セグメントを持つHTMLファイル及びステップ522において選択されたグラフィックスのセットの要素として実装される。本例においては、前記グラフィックスのセットの要素は、システム設定に依存して、IMG、FONTのようなHTMLタグによって示される。ステップ528において、「聴き取り」を可能とするため音声制御アクセスモードが起動され、前記グラフィックスのセットに関連する音声コマンドを抽出する。ステップ510において、好適なアクセスモードをユーザに提示するため、アクセスモードの手掛かりが選択される。ステップ512において前記手掛かりがユーザに提示され、ステップ514において前記システムはユーザ入力待ちに設定される。以上説明された処理は、表示装置自体に、又は分散環境若しくはクライアント−サーバ環境、又はこれらの組み合わせに実装されることができる。例えば、携帯電話のような不十分な計算リソースを持つ装置については、プロキシサーバがステップ504乃至526を実行しても良い。後者の場合においては、所定のインタラクションモードの示唆を伴う結果のHTMLファイル又はその圧縮された画像が前記装置に送信される。他の実装においては、表現タグセット及びグラフィックスのセットは、ユーザの好みデータベースの一部としてサーバに保存される。
メニューにおける連続するレイヤを示すUIを備えた装置の図である。 メニューにおける連続するレイヤを示すUIを備えた装置の図である。 メニューにおける連続するレイヤを示すUIを備えた装置の図である。 電子アドレス帳のためのグラフィカルに支援された音声制御システムのブロック図である。 タグ付けされたコンテンツ(HTML、XML)表現インタフェースのためのグラフィカルに支援された音声制御システムのブロック図である。

Claims (10)

  1. ユーザインタフェースを持つ電子装置であって、
    前記ユーザインタフェースは、第1のユーザ選択可能な選択肢と、前記第1の選択肢の特定の1つを選択すると利用可能となる第2のユーザ選択可能な選択肢とを提供し、
    提示されたときの前記第1の選択肢の情報分解能は、提示されたときの前記第2の選択肢の情報分解能と異なり、
    前記第1の選択肢から選択するための前記ユーザインタフェースとのユーザインタラクションの第1の様式は、前記第2の選択肢から選択するための前記ユーザインタフェースとのユーザインタラクションの第2の様式と異なる装置。
  2. 少なくとも前記第1の様式又は前記第2の様式は、前記ユーザインタフェースの設定モードにおいてプログラム可能である、請求項1に記載の装置。
  3. 少なくとも前記第1又は第2の選択肢から選択するための、前記ユーザインタフェースとのユーザインタラクションの付加的な様式が利用可能である、請求項1に記載の方法。
  4. 通信機能を有する、請求項1に記載の装置。
  5. 前記装置はタッチスクリーンを持ち、
    前記装置は音声入力のためのマイクロフォンを持ち、
    前記第1及び第2の様式の一方は前記タッチスクリーンに触れることを含み、
    前記第1及び第2の様式の他方は前記音声入力を含む、請求項1に記載の装置。
  6. 前記第1の選択肢の少なくとも幾つかを提示するための表示モニタと、
    ユーザが、前記提示された第1の選択肢のそれぞれを、複数の所定の属性のそれぞれに関連付けることを可能とする第1の手段と、
    前記関連付けられた属性を通して、前記提示された第1の選択肢の特定の1つを選択するための第2の手段と、
    を有する、請求項1に記載の装置。
  7. 第1及び第2のレイヤに配置された選択肢を選択することを可能とするユーザインタフェースを提供する方法であって、
    前記ユーザインタフェースにおいて提示されたとき、前記第1のレイヤにおける選択肢は、前記ユーザインタフェースにおいて提示されたときの前記第2のレイヤにおける選択肢の情報分解能とは異なる情報分解能を持ち、
    前記方法は、前記第2のレイヤにおける選択肢のうちの第2のものを選択するための第2の様式とは異なる、前記第1のレイヤにおける選択肢のうちの第1のものを選択するための第1の様式を提供するステップを有する方法。
  8. 前記第1及び第2の様式の一方はタッチスクリーンを含み、前記第1及び第2の様式の他方は音声入力を含む、請求項7に記載の方法。
  9. 第1のユーザ選択可能な選択肢と、前記第1の選択肢の特定の1つを選択すると利用可能となる第2のユーザ選択可能な選択肢とを提供するユーザインタフェースを生成するための、電子装置上での利用のためのソフトウェアであって、提示されたときの前記第1の選択肢の情報分解能は、提示されたときの前記第2の選択肢の情報分解能と異なり、前記第1の選択肢から選択するための前記ユーザインタフェースとのユーザインタラクションの第1の様式は、前記第2の選択肢から選択するための前記ユーザインタフェースとのユーザインタラクションの第2の様式と異なるソフトウェア。
  10. 前記第1及び第2の様式の一方はタッチスクリーンを含み、前記第1及び第2の様式の他方は音声入力を含む、請求項9に記載のソフトウェア。
JP2003551660A 2001-12-13 2002-11-20 グラフィクス支援された音声制御システムを備えたユーザインタフェース Withdrawn JP2005512226A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/017,067 US6791529B2 (en) 2001-12-13 2001-12-13 UI with graphics-assisted voice control system
PCT/IB2002/004904 WO2003050668A2 (en) 2001-12-13 2002-11-20 Gui with voice control system

Publications (1)

Publication Number Publication Date
JP2005512226A true JP2005512226A (ja) 2005-04-28

Family

ID=21780532

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003551660A Withdrawn JP2005512226A (ja) 2001-12-13 2002-11-20 グラフィクス支援された音声制御システムを備えたユーザインタフェース

Country Status (7)

Country Link
US (1) US6791529B2 (ja)
EP (1) EP1459163A2 (ja)
JP (1) JP2005512226A (ja)
KR (1) KR20040063170A (ja)
CN (1) CN1602461A (ja)
AU (1) AU2002351018A1 (ja)
WO (1) WO2003050668A2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007510364A (ja) * 2003-10-31 2007-04-19 ザ・ボーイング・カンパニー ジオキャストシステムおよび方法
JP2012128512A (ja) * 2010-12-13 2012-07-05 Toyota Motor Corp 制御装置
JP2016072665A (ja) * 2014-09-26 2016-05-09 京セラ株式会社 通信端末およびその制御方法
JP2016126381A (ja) * 2014-12-26 2016-07-11 セイコーエプソン株式会社 頭部装着型表示装置、頭部装着型表示装置の制御方法、および、コンピュータープログラム
JP2018091882A (ja) * 2016-11-30 2018-06-14 セイコーエプソン株式会社 頭部装着型表示装置、プログラム、及び頭部装着型表示装置の制御方法

Families Citing this family (187)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8645137B2 (en) 2000-03-16 2014-02-04 Apple Inc. Fast, language-independent method for user authentication by voice
US20030172299A1 (en) * 2002-03-05 2003-09-11 Gunter Carl A. Method and system for maintaining secure access to web server services using permissions
KR100457509B1 (ko) * 2001-07-07 2004-11-17 삼성전자주식회사 터치스크린과 음성인식을 통해 동작 제어되는 정보단말기 및 그의 명령 실행 방법
US7246063B2 (en) * 2002-02-15 2007-07-17 Sap Aktiengesellschaft Adapting a user interface for voice control
DE60214126T2 (de) * 2002-02-19 2006-12-21 Nokia Corp. Verfahren zum Ermöglichen einer Kommunikation mittels eines Mobilfunkgeräts und Mobilfunkgerät zum Ermöglichen einer Kommunikation
US7193609B2 (en) * 2002-03-19 2007-03-20 America Online, Inc. Constraining display motion in display navigation
US7155382B2 (en) * 2002-06-03 2006-12-26 Boys Donald R Audio-visual language instruction system without a computer
US20050003870A1 (en) * 2002-06-28 2005-01-06 Kyocera Corporation Information terminal and program for processing displaying information used for the same
US7251683B1 (en) * 2002-10-25 2007-07-31 Sandeep Shah Information handling system including arrangements for initiating an application in response to usage of cross reference between information and for initiating usage of a workflow flow chart associated with and information work
US20040103153A1 (en) * 2002-11-21 2004-05-27 Chang Tsung-Yen Dean Apparatus and method for providing smart network appliances
US7607100B2 (en) * 2003-05-29 2009-10-20 International Business Machines Corporation Method, system and program product for display management of web page phone/fax numbers by a data processing system
JP3728304B2 (ja) * 2003-07-10 2005-12-21 キヤノン株式会社 情報処理方法、情報処理装置、プログラム、及び記憶媒体
KR100593982B1 (ko) * 2003-11-06 2006-06-30 삼성전자주식회사 가상 그래피티를 제공하는 장치 및 방법과 그에 따른기록매체
US20050192808A1 (en) * 2004-02-26 2005-09-01 Sharp Laboratories Of America, Inc. Use of speech recognition for identification and classification of images in a camera-equipped mobile handset
US20050229112A1 (en) * 2004-04-13 2005-10-13 Clay Timothy M Method and system for conveying an image position
DE102004021454A1 (de) * 2004-04-29 2005-11-24 Volkswagen Ag Verfahren und Vorrichtung für einen akustischen Zugang zu einem Anwendungsrechner
JP4855653B2 (ja) * 2004-05-25 2012-01-18 ソニー株式会社 放送番組提供システム,放送受信端末装置,閲覧端末,操作端末およびコンピュータプログラム
DE112005001540T5 (de) * 2004-06-22 2007-08-02 Voice Signal Technologies Inc., Woburn Erweiterbare Sprachbefehle
US20070130078A1 (en) * 2005-12-02 2007-06-07 Robert Grzesek Digital rights management compliance with portable digital media device
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US20070088549A1 (en) * 2005-10-14 2007-04-19 Microsoft Corporation Natural input of arbitrary text
US20070124507A1 (en) * 2005-11-28 2007-05-31 Sap Ag Systems and methods of processing annotations and multimodal user inputs
US8055707B2 (en) * 2005-11-30 2011-11-08 Alcatel Lucent Calendar interface for digital communications
US8280742B2 (en) * 2005-12-16 2012-10-02 Panasonic Corporation Input device and input method for mobile body
US20070205993A1 (en) * 2006-03-06 2007-09-06 Samsung Electronics Co., Ltd. Mobile device having a keypad with directional controls
US20070205989A1 (en) * 2006-03-06 2007-09-06 Samsung Electronics Co., Ltd. Camera with a touch sensitive keypad
US20070205992A1 (en) * 2006-03-06 2007-09-06 Samsung Electronics Co., Ltd. Touch sensitive scrolling system and method
US20070205991A1 (en) * 2006-03-06 2007-09-06 Samsung Electronics Co., Ltd. System and method for number dialing with touch sensitive keypad
KR101246293B1 (ko) * 2006-04-24 2013-03-21 삼성전자주식회사 홈 네트워크에서 사용자 인터페이스 방법 및 장치와 그전자기기 및 저장 매체
JP5247700B2 (ja) * 2006-08-25 2013-07-24 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ サマリーを生成する方法および装置
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US8620315B1 (en) * 2006-09-29 2013-12-31 Yahoo! Inc. Multi-tiered anti-abuse registration for a mobile device user
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
DE102007024110A1 (de) * 2007-05-22 2008-12-11 Deutsche Telekom Ag Verfahren zur Beeinflussung der Interpretation multimodaler Eingaben
US20080317219A1 (en) * 2007-06-21 2008-12-25 Siemens Communications, Inc. Method and apparatus for context based voice dialing
US20090024664A1 (en) * 2007-06-29 2009-01-22 Alberto Benbunan Garzon Method and system for generating a content-based file, and content-based data structure
DE102007037567A1 (de) * 2007-08-09 2009-02-12 Volkswagen Ag Verfahren zur multimodalen Bedienung mindestens eines Gerätes in einem Kraftfahrzeug
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US8751947B2 (en) 2008-02-29 2014-06-10 Adobe Systems Incorporated Visual and functional transform
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
KR101545137B1 (ko) * 2008-04-17 2015-08-19 삼성전자주식회사 사용자 인터페이스를 생성하는 방법 및 장치
KR20090110202A (ko) 2008-04-17 2009-10-21 삼성전자주식회사 개인화된 사용자 인터페이스를 디스플레이하는 방법 및 장치
KR101560183B1 (ko) * 2008-04-17 2015-10-15 삼성전자주식회사 사용자 인터페이스를 제공/수신하는 방법 및 장치
US10496753B2 (en) 2010-01-18 2019-12-03 Apple Inc. Automatically adapting user interfaces for hands-free interaction
KR101488726B1 (ko) * 2008-05-27 2015-02-06 삼성전자주식회사 위젯 창을 표시하는 디스플레이 장치 및 이를 포함하는디스플레이 시스템과 그 디스플레이 방법
US20100030549A1 (en) 2008-07-31 2010-02-04 Lee Michael M Mobile device having human language translation capability with positional feedback
KR101545582B1 (ko) * 2008-10-29 2015-08-19 엘지전자 주식회사 단말기 및 그 제어 방법
WO2010067118A1 (en) 2008-12-11 2010-06-17 Novauris Technologies Limited Speech recognition involving a mobile device
US20100199228A1 (en) * 2009-01-30 2010-08-05 Microsoft Corporation Gesture Keyboarding
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US9858925B2 (en) 2009-06-05 2018-01-02 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US10706373B2 (en) 2011-06-03 2020-07-07 Apple Inc. Performing actions associated with task items that represent tasks to perform
DE102009024693B4 (de) * 2009-06-12 2019-07-11 Volkswagen Ag Infotainmentsystem für ein Fahrzeug und Verfahren zum Darstellen von Informationen
DE102009025530B4 (de) * 2009-06-19 2019-05-23 Volkswagen Ag Verfahren zur Bedienung eines Fahrzeugs mittels eines automatisierten Sprachdialogs sowie entsprechend ausgestaltetes Sprachdialogsystem und Fahrzeug
US9431006B2 (en) 2009-07-02 2016-08-30 Apple Inc. Methods and apparatuses for automatic speech recognition
US9183834B2 (en) * 2009-07-22 2015-11-10 Cisco Technology, Inc. Speech recognition tuning tool
US9197736B2 (en) 2009-12-31 2015-11-24 Digimarc Corporation Intuitive computing methods and systems
CN102096541B (zh) * 2009-12-10 2013-02-06 腾讯科技(深圳)有限公司 多媒体播放器界面操作控制装置及方法
US20110165917A1 (en) * 2009-12-31 2011-07-07 Mary Elizabeth Taylor Methods and arrangements employing sensor-equipped smart phones
US10705794B2 (en) 2010-01-18 2020-07-07 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US10679605B2 (en) 2010-01-18 2020-06-09 Apple Inc. Hands-free list-reading by intelligent automated assistant
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US10553209B2 (en) 2010-01-18 2020-02-04 Apple Inc. Systems and methods for hands-free notification summaries
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
US20130204406A1 (en) * 2010-04-12 2013-08-08 Electrolux Home Products Corporation N.V. Control interface for household appliances
US9046999B1 (en) * 2010-06-08 2015-06-02 Google Inc. Dynamic input at a touch-based interface based on pressure
US20110307252A1 (en) * 2010-06-15 2011-12-15 Microsoft Corporation Using Utterance Classification in Telephony and Speech Recognition Applications
WO2012043168A1 (ja) * 2010-09-29 2012-04-05 Necカシオモバイルコミュニケーションズ株式会社 音声変換装置、携帯電話端末、音声変換方法および記録媒体
US10762293B2 (en) 2010-12-22 2020-09-01 Apple Inc. Using parts-of-speech tagging and named entity recognition for spelling correction
KR101295711B1 (ko) * 2011-02-15 2013-08-16 주식회사 팬택 음성 인식으로 애플리케이션의 실행 가능한 이동통신 단말 장치 및 방법
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US8994660B2 (en) 2011-08-29 2015-03-31 Apple Inc. Text correction processing
US9002703B1 (en) * 2011-09-28 2015-04-07 Amazon Technologies, Inc. Community audio narration generation
US9082403B2 (en) 2011-12-15 2015-07-14 Microsoft Technology Licensing, Llc Spoken utterance classification training for a speech recognition system
US10134385B2 (en) 2012-03-02 2018-11-20 Apple Inc. Systems and methods for name pronunciation
US9483461B2 (en) 2012-03-06 2016-11-01 Apple Inc. Handling speech synthesis of content for multiple languages
US9280610B2 (en) 2012-05-14 2016-03-08 Apple Inc. Crowd sourcing information to fulfill user requests
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
US9495129B2 (en) 2012-06-29 2016-11-15 Apple Inc. Device, method, and user interface for voice-activated navigation and browsing of a document
US9576574B2 (en) 2012-09-10 2017-02-21 Apple Inc. Context-sensitive handling of interruptions by intelligent digital assistant
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
KR102009423B1 (ko) * 2012-10-08 2019-08-09 삼성전자주식회사 음성 인식을 이용한 미리 설정된 동작 모드의 수행 방법 및 장치
US9691377B2 (en) 2013-07-23 2017-06-27 Google Technology Holdings LLC Method and device for voice recognition training
US8977555B2 (en) * 2012-12-20 2015-03-10 Amazon Technologies, Inc. Identification of utterance subjects
KR102516577B1 (ko) 2013-02-07 2023-04-03 애플 인크. 디지털 어시스턴트를 위한 음성 트리거
US9311640B2 (en) 2014-02-11 2016-04-12 Digimarc Corporation Methods and arrangements for smartphone payments and transactions
US9368114B2 (en) 2013-03-14 2016-06-14 Apple Inc. Context-sensitive handling of interruptions
US10652394B2 (en) 2013-03-14 2020-05-12 Apple Inc. System and method for processing voicemail
WO2014144949A2 (en) 2013-03-15 2014-09-18 Apple Inc. Training an at least partial voice command system
WO2014144579A1 (en) 2013-03-15 2014-09-18 Apple Inc. System and method for updating an adaptive speech recognition model
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
WO2014197336A1 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for detecting errors in interactions with a voice-based digital assistant
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
KR101922663B1 (ko) 2013-06-09 2018-11-28 애플 인크. 디지털 어시스턴트의 둘 이상의 인스턴스들에 걸친 대화 지속성을 가능하게 하기 위한 디바이스, 방법 및 그래픽 사용자 인터페이스
EP3008964B1 (en) 2013-06-13 2019-09-25 Apple Inc. System and method for emergency calls initiated by voice command
US9548047B2 (en) 2013-07-31 2017-01-17 Google Technology Holdings LLC Method and apparatus for evaluating trigger phrase enrollment
WO2015020942A1 (en) 2013-08-06 2015-02-12 Apple Inc. Auto-activating smart responses based on activities from remote devices
CN108469937B (zh) * 2014-03-26 2020-11-20 联想(北京)有限公司 一种信息处理方法及电子设备
WO2015144536A1 (en) * 2014-03-27 2015-10-01 Sony Corporation Electronic device and method for identifying input commands of a user
US9620105B2 (en) 2014-05-15 2017-04-11 Apple Inc. Analyzing audio input for efficient speech and music recognition
US10592095B2 (en) 2014-05-23 2020-03-17 Apple Inc. Instantaneous speaking of content on touch devices
US9502031B2 (en) 2014-05-27 2016-11-22 Apple Inc. Method for supporting dynamic grammars in WFST-based ASR
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
US10289433B2 (en) 2014-05-30 2019-05-14 Apple Inc. Domain specific language for encoding assistant dialog
US9785630B2 (en) 2014-05-30 2017-10-10 Apple Inc. Text prediction using combined word N-gram and unigram language models
US9760559B2 (en) 2014-05-30 2017-09-12 Apple Inc. Predictive text input
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US10078631B2 (en) 2014-05-30 2018-09-18 Apple Inc. Entropy-guided text prediction using combined word and character n-gram language models
WO2015184186A1 (en) 2014-05-30 2015-12-03 Apple Inc. Multi-command single utterance input method
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US9734193B2 (en) 2014-05-30 2017-08-15 Apple Inc. Determining domain salience ranking from ambiguous words in natural speech
US9633004B2 (en) 2014-05-30 2017-04-25 Apple Inc. Better resolution when referencing to concepts
US9842101B2 (en) 2014-05-30 2017-12-12 Apple Inc. Predictive conversion of language input
US10659851B2 (en) 2014-06-30 2020-05-19 Apple Inc. Real-time digital assistant knowledge updates
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
JP6483680B2 (ja) * 2014-06-30 2019-03-13 クラリオン株式会社 情報処理システム、及び、車載装置
US10446141B2 (en) 2014-08-28 2019-10-15 Apple Inc. Automatic speech recognition based on user feedback
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10789041B2 (en) 2014-09-12 2020-09-29 Apple Inc. Dynamic thresholds for always listening speech trigger
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US9886432B2 (en) 2014-09-30 2018-02-06 Apple Inc. Parsimonious handling of word inflection via categorical stem + suffix N-gram language models
US9646609B2 (en) 2014-09-30 2017-05-09 Apple Inc. Caching apparatus for serving phonetic pronunciations
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US9576575B2 (en) * 2014-10-27 2017-02-21 Toyota Motor Engineering & Manufacturing North America, Inc. Providing voice recognition shortcuts based on user verbal input
CN104601651A (zh) * 2014-11-18 2015-05-06 浪潮(北京)电子信息产业有限公司 NaaS的多级插件系统
US10552013B2 (en) 2014-12-02 2020-02-04 Apple Inc. Data detection
US9711141B2 (en) 2014-12-09 2017-07-18 Apple Inc. Disambiguating heteronyms in speech synthesis
US9959129B2 (en) * 2015-01-09 2018-05-01 Microsoft Technology Licensing, Llc Headless task completion within digital personal assistants
CN104635927A (zh) * 2015-01-27 2015-05-20 深圳富泰宏精密工业有限公司 互动显示系统及方法
US9865280B2 (en) 2015-03-06 2018-01-09 Apple Inc. Structured dictation using intelligent automated assistants
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US9899019B2 (en) 2015-03-18 2018-02-20 Apple Inc. Systems and methods for structured stem and suffix language models
US9842105B2 (en) 2015-04-16 2017-12-12 Apple Inc. Parsimonious continuous-space phrase representations for natural language processing
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US10127220B2 (en) 2015-06-04 2018-11-13 Apple Inc. Language identification from short strings
US10101822B2 (en) 2015-06-05 2018-10-16 Apple Inc. Language input correction
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US10255907B2 (en) 2015-06-07 2019-04-09 Apple Inc. Automatic accent detection using acoustic models
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US10186254B2 (en) 2015-06-07 2019-01-22 Apple Inc. Context-based endpoint detection
US10733235B2 (en) 2015-06-09 2020-08-04 Patricia Henery Aid for dyslexic readers
US20160366264A1 (en) * 2015-06-12 2016-12-15 International Business Machines Corporation Transferring information during a call
CN105100460A (zh) * 2015-07-09 2015-11-25 上海斐讯数据通信技术有限公司 一种声音操控智能终端的方法及系统
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US9697820B2 (en) 2015-09-24 2017-07-04 Apple Inc. Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
DK179588B1 (en) 2016-06-09 2019-02-22 Apple Inc. INTELLIGENT AUTOMATED ASSISTANT IN A HOME ENVIRONMENT
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
DK179049B1 (en) 2016-06-11 2017-09-18 Apple Inc Data driven natural language event detection and classification
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
DK201770439A1 (en) 2017-05-11 2018-12-13 Apple Inc. Offline personal assistant
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
DK179560B1 (en) 2017-05-16 2019-02-18 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
EP3583481B1 (en) * 2018-05-07 2021-02-17 Google LLC Methods, systems, and apparatus for providing composite graphical assistant interfaces for controlling connected devices
CN110060679B (zh) * 2019-04-23 2022-02-11 诚迈科技(南京)股份有限公司 一种全程语音控制的交互方法和系统
KR20210015348A (ko) 2019-08-01 2021-02-10 삼성전자주식회사 대화 관리 프레임워크에 기반한 대화 관리 방법 및 그 장치
US20220093098A1 (en) * 2020-09-23 2022-03-24 Samsung Electronics Co., Ltd. Electronic apparatus and control method thereof
US11630644B2 (en) 2021-05-27 2023-04-18 Bank Of America Corporation Service for configuring custom software

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5566272A (en) 1993-10-27 1996-10-15 Lucent Technologies Inc. Automatic speech recognition (ASR) processing using confidence measures
JP3267047B2 (ja) 1994-04-25 2002-03-18 株式会社日立製作所 音声による情報処理装置
FI97508C (fi) * 1995-01-09 1996-12-27 Nokia Mobile Phones Ltd Pikavalinta henkilökohtaisessa matkaviestimessä
US5956035A (en) * 1997-05-15 1999-09-21 Sony Corporation Menu selection with menu stem and submenu size enlargement
US6211856B1 (en) 1998-04-17 2001-04-03 Sung M. Choi Graphical user interface touch screen with an auto zoom feature
US6369803B2 (en) * 1998-06-12 2002-04-09 Nortel Networks Limited Active edge user interface
US6269335B1 (en) * 1998-08-14 2001-07-31 International Business Machines Corporation Apparatus and methods for identifying homophones among words in a speech recognition system
US6259436B1 (en) * 1998-12-22 2001-07-10 Ericsson Inc. Apparatus and method for determining selection of touchable items on a computer touchscreen by an imprecise touch
US6765557B1 (en) 2000-04-10 2004-07-20 Interlink Electronics, Inc. Remote control having touch pad to screen mapping
US7143043B1 (en) * 2000-04-26 2006-11-28 Openwave Systems Inc. Constrained keyboard disambiguation using voice recognition

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007510364A (ja) * 2003-10-31 2007-04-19 ザ・ボーイング・カンパニー ジオキャストシステムおよび方法
JP2012128512A (ja) * 2010-12-13 2012-07-05 Toyota Motor Corp 制御装置
JP2016072665A (ja) * 2014-09-26 2016-05-09 京セラ株式会社 通信端末およびその制御方法
JP2016126381A (ja) * 2014-12-26 2016-07-11 セイコーエプソン株式会社 頭部装着型表示装置、頭部装着型表示装置の制御方法、および、コンピュータープログラム
US10114604B2 (en) 2014-12-26 2018-10-30 Seiko Epson Corporation Head-mounted display device, control method for head-mounted display device, and computer program
JP2018091882A (ja) * 2016-11-30 2018-06-14 セイコーエプソン株式会社 頭部装着型表示装置、プログラム、及び頭部装着型表示装置の制御方法

Also Published As

Publication number Publication date
CN1602461A (zh) 2005-03-30
WO2003050668A2 (en) 2003-06-19
US6791529B2 (en) 2004-09-14
KR20040063170A (ko) 2004-07-12
WO2003050668A3 (en) 2004-02-26
US20030117365A1 (en) 2003-06-26
EP1459163A2 (en) 2004-09-22
AU2002351018A8 (en) 2003-06-23
AU2002351018A1 (en) 2003-06-23

Similar Documents

Publication Publication Date Title
JP2005512226A (ja) グラフィクス支援された音声制御システムを備えたユーザインタフェース
KR102378513B1 (ko) 메시지 서비스를 제공하는 전자기기 및 그 전자기기가 컨텐트 제공하는 방법
JP6530011B2 (ja) インテリジェントタスクディスカバリ
US6012030A (en) Management of speech and audio prompts in multimodal interfaces
KR102447503B1 (ko) 메시지 서비스를 제공하는 전자기기 및 그 전자기기가 컨텐트 제공하는 방법
CN108604449B (zh) 说话者识别
AU2004218693B2 (en) Sequential multimodal input
US20070079383A1 (en) System and Method for Providing Digital Content on Mobile Devices
US7680816B2 (en) Method, system, and computer program product providing for multimodal content management
US7363027B2 (en) Sequential multimodal input
JP5048295B2 (ja) 移動通信端末及び移動通信端末におけるメッセージ表示方法
US20090313582A1 (en) System, Method and Computer Program for User-Friendly Social Interaction
CN109803050B (zh) 一种适用于盲人操作手机的全屏引导点击方法
US9335965B2 (en) System and method for excerpt creation by designating a text segment using speech
KR101882293B1 (ko) 문자 입력 및 컨텐츠 추천을 위한 통합 키보드
WO2012065518A1 (zh) 一种用户操作界面的变换方法及终端
JP2005512231A (ja) テキストメッセージにおける感情表現方法
CN114514497A (zh) 用于自定义图形对象的用户界面
CN109817204A (zh) 语音交互方法及装置、电子设备、可读存储介质
KR20180087608A (ko) 검색 서비스를 제공하는 시스템 및 방법
US20080003984A1 (en) Method and system for improved handling of message templates
CN116486799A (zh) 从用户话语生成emoji
US20090110173A1 (en) One touch connect for calendar appointments
EP2851891A1 (fr) Terminal mobile utilisateur et procédé de commande d'un tel terminal
US20100318696A1 (en) Input for keyboards in devices

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20051118

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20070712