JP2015018365A - 情報処理装置、情報処理方法およびプログラム - Google Patents

情報処理装置、情報処理方法およびプログラム Download PDF

Info

Publication number
JP2015018365A
JP2015018365A JP2013144449A JP2013144449A JP2015018365A JP 2015018365 A JP2015018365 A JP 2015018365A JP 2013144449 A JP2013144449 A JP 2013144449A JP 2013144449 A JP2013144449 A JP 2013144449A JP 2015018365 A JP2015018365 A JP 2015018365A
Authority
JP
Japan
Prior art keywords
display
image
area
name
layer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013144449A
Other languages
English (en)
Other versions
JP2015018365A5 (ja
JP6102588B2 (ja
Inventor
正一 土居
Shoichi Doi
正一 土居
義樹 竹岡
Yoshiki Takeoka
義樹 竹岡
高田 昌幸
Masayuki Takada
昌幸 高田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2013144449A priority Critical patent/JP6102588B2/ja
Priority to US14/273,735 priority patent/US20150019974A1/en
Priority to EP14174730.3A priority patent/EP2824564B1/en
Priority to CN201410315263.1A priority patent/CN104281259B/zh
Publication of JP2015018365A publication Critical patent/JP2015018365A/ja
Publication of JP2015018365A5 publication Critical patent/JP2015018365A5/ja
Application granted granted Critical
Publication of JP6102588B2 publication Critical patent/JP6102588B2/ja
Priority to US16/049,228 priority patent/US10725734B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • G06F3/04847Interaction techniques to control parameter settings, e.g. interaction with sliders or dials

Abstract

【課題】NUIにおいて操作対象のUIコンポーネントを特定するためのシンボルを、ユーザにわかりやすく通知する。
【解決手段】ディスプレイに表示される画像の少なくとも一部の領域に関する呼称を定義する呼称定義機能と、上記画像を上記ディスプレイに表示させるとともに、上記呼称を上記領域に関連付けて一時的に上記ディスプレイに表示させる表示制御機能と、上記画像に対する音声入力を取得する音声入力取得機能と、上記音声入力に上記呼称が含まれる場合に、上記領域に関するコマンドを発行するコマンド発行機能とを実現するプロセッサを備える情報処理装置が提供される
【選択図】図2

Description

本開示は、情報処理装置、情報処理方法およびプログラムに関する。
コンピュータのユーザインターフェースのうち、ユーザにとってより自然、または直感的な動作での操作を実現するナチュラルユーザインターフェース(NUI:Natural User Interface)が、近年広く注目されている。よく知られているのは、ユーザの発話などによる音声や、ジェスチャなどを入力操作として利用するNUIである。これらの入力操作は個別に用いられることが多いが、例えば特許文献1には、音声による入力操作とジェスチャによる入力操作とを組み合わせて利用する技術が記載されている。
特開2012−103840号公報
しかしながら、例えば、NUIによって複数のUIコンポーネントを選択的に操作しようとする場合、操作対象のUIコンポーネントを特定するために、どのようなシンボル(例えば、音声による呼称(address term))が設定されているかが、ユーザにとってわかりにくい場合がある。上述の特許文献1などに記載された技術は、NUIにおけるユーザ体験(User Experience)の向上に貢献するものであるが、上記の点については必ずしも十分に対応しているとはいえない。
そこで、本開示では、NUIにおいて操作対象を特定するためのシンボルを、ユーザにわかりやすく通知することを可能にする、新規かつ改良された情報処理装置、情報処理方法およびプログラムを提案する。
本開示によれば、ディスプレイに表示される画像の少なくとも一部の領域に関する呼称を定義する呼称定義機能と、上記画像を上記ディスプレイに表示させるとともに、上記呼称を上記領域に関連付けて一時的に上記ディスプレイに表示させる表示制御機能と、上記画像に対する音声入力を取得する音声入力取得機能と、上記音声入力に上記呼称が含まれる場合に、上記領域に関するコマンドを発行するコマンド発行機能とを実現するプロセッサを備える情報処理装置が提供される。
また、本開示によれば、プロセッサが、ディスプレイに表示される画像の少なくとも一部の領域に関する呼称を定義することと、上記画像を上記ディスプレイに表示させるとともに、上記呼称を上記領域に関連付けて一時的に上記ディスプレイに表示させることと、上記画像に対する音声入力を取得することと、上記音声入力に上記呼称が含まれる場合に、上記領域に関するコマンドを発行することとを含む情報処理方法が提供される。
また、本開示によれば、ディスプレイに表示される画像の少なくとも一部の領域に関する呼称を定義する呼称定義機能と、上記画像を上記ディスプレイに表示させるとともに、上記呼称を上記領域に関連付けて一時的に上記ディスプレイに表示させる表示制御機能と、上記画像に対する音声入力を取得する音声入力取得機能と、上記音声入力に上記呼称が含まれる場合に、上記領域に関するコマンドを発行するコマンド発行機能とをコンピュータに実現させるためのプログラムが提供される。
以上説明したように本開示によれば、NUIにおいて操作対象を特定するためのシンボルを、ユーザにわかりやすく通知することができる。
本開示の一実施形態に係る表示装置の概略的な構成を示すブロック図である。 本開示の一実施形態に係る表示装置において実現される概略的な機能構成を示す図である。 本開示の第1の実施形態において定義される画像内の領域のレイヤ構造について説明するための図である。 本開示の第1の実施形態において定義される画像内の領域のレイヤ構造について説明するための図である。 本開示の第1の実施形態における呼称の表示例を示す図である。 本開示の第1の実施形態における呼称の表示例を示す図である。 本開示の第2の実施形態において定義される画像内の領域のレイヤ構造について説明するための図である。 本開示の第2の実施形態における呼称の表示例を示す図である。 本開示の第2の実施形態における呼称の表示例を示す図である。 本開示の第2の実施形態の第1の変形例を示す図である。 本開示の第2の実施形態の第2の変形例を示す図である。 本開示の第2の実施形態の第2の変形例を示す図である。 本開示の第3の実施形態における呼称の表示例を示す図である。
以下に添付図面を参照しながら、本開示の好適な実施の形態について詳細に説明する。なお、本明細書および図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。
なお、説明は以下の順序で行うものとする。
1.システム構成
1−1.ハードウェア構成
1−2.機能構成
1−3.領域のレイヤ構造
1−4.呼称の表示例
2.第2の実施形態
2−1.領域のレイヤ構造
2−2.呼称の表示例
2−3.変形例
3.第3の実施形態
4.補足
(1.システム構成)
(1−1.ハードウェア構成)
図1は、本開示の一実施形態に係る表示装置の概略的な構成を示すブロック図である。図1を参照すると、表示装置100は、プロセッサ102、メモリ104、ストレージ106、通信モジュール108、ディスプレイ110、スピーカ112、マイクロフォン114、入力装置116、カメラモジュール118、および接続ポート120を含みうる。
表示装置100は、ユーザの所望に応じてディスプレイ110に画像を表示させる各種の装置でありうる。例えば、表示装置100は、ディスプレイ110を有するテレビやPC(Personal Computer)、タブレット端末、スマートフォン、携帯型メディアプレーヤ、または携帯型ゲーム機などであってもよい。また、例えば、表示装置100は、別体で構成されたディスプレイ110に接続されて、ディスプレイ110を制御する、PC、セットトップボックス、レコーダ、またはゲーム機などであってもよい。以下、かかる表示装置100の構成要素についてさらに説明する。
プロセッサ102は、例えばCPU(Central Processing unit)、DSP(Digital Signal Processor)、またはASIC(Application Specific Integrated Circuit)などによって実現され、メモリ104に格納されたプログラムに従って動作することによって各種の機能を実現する。プロセッサ102は、表示装置100の各部を制御することによって、各種の入力を取得し、また各種の出力を提供する。なお、プロセッサ102によって実現される機能の詳細については後述する。
メモリ104は、例えばRAM(Random Access Memory)またはROM(Read Only Memory)として用いられる半導体メモリによって実現される。メモリ104には、例えばプロセッサ102が動作するためのプログラムが格納される。このプログラムは、例えばストレージ106から読み出されてメモリ104に一時的に展開されてもよく、メモリ104に持続的に格納されていてもよい。あるいは、プログラムは、通信モジュール108によって受信されて、メモリ104に一時的に展開されてもよい。メモリ104は、さらに、プロセッサ102の処理によって生成された各種のデータを、一時的または持続的に格納する。
ストレージ106は、例えばHDD(Hard Disk Drive)などの磁気ディスク、光ディスク、もしくは光磁気ディスクなどを利用した記憶装置、またはフラッシュメモリなどによって実現される。ストレージ106には、例えばプロセッサ102が動作するためのプログラムや、プロセッサ102の処理によって生成された各種のデータが持続的に格納される。ストレージ106は、リムーバブルメディアを含んで構成されてもよいし、表示装置100に内蔵されてもよい。
通信モジュール108は、プロセッサ102の制御に従って有線または無線のネットワーク通信を実行する各種の通信回路によって実現される。無線通信を実行する場合、通信モジュール108はアンテナを含んでもよい。通信モジュール108は、例えばインターネットやLAN(Local Area Network)、またはBluetooth(登録商標)などの通信規格に従ってネットワーク通信を実行する。
表示装置100は、出力部としてディスプレイ110およびスピーカ112を有する。ディスプレイ110は、例えばLCD(Liquid Crystal Display)または有機EL(Electro-Luminescence)ディスプレイなどによって実現される。上述のように、ディスプレイ110は、表示装置100と一体であってもよく、別体であってもよい。ディスプレイ110は、プロセッサ102の制御に従って各種の情報を画像として表示する。なお、ディスプレイ110に表示される画像の例については後述する。スピーカ112は、プロセッサ102の制御に従って各種の情報を音声として出力する。
マイクロフォン114は、例えばユーザによる発話音声など、表示装置100の周辺で発生しているさまざまな種類の音声を取得し、音声データとしてプロセッサ102に提供する。ここで、本実施形態において、マイクロフォン114は、NUIにおける音声入力手段として利用される。つまり、マイクロフォン114によって提供される音声データはプロセッサ102によって解析され、音声データから抽出されたユーザの発話音声などに基づいて各種のコマンドが実行される。
入力装置116は、表示装置100において利用されるその他の入力手段である。入力装置116は、例えばキーボード、ボタン、またはマウスなどを含んでもよい。また、入力装置116は、ディスプレイ110に対応する位置に配設されるタッチセンサを含み、ディスプレイ110とタッチセンサとによってタッチパネルが構成されてもよい。なお、マイクロフォン114を利用した音声入力によって十分に表示装置100の操作が可能であるような場合には、別途の入力装置116が設けられなくてもよい。
カメラモジュール118は、例えばCCD(Charge Coupled Device)またはCMOS(Complementary Metal Oxide Semiconductor)などの撮像素子と、撮像素子への被写体像の結像を制御するためのレンズなどの光学系と、撮像素子および光学系を駆動させる駆動回路とによって実現される。カメラモジュール118は、撮像素子が被写体像を撮像することによって生成された静止画または動画を、画像データとしてプロセッサ102に提供する。カメラモジュール118によって生成された静止画または動画は、例えばスルー画像として、または記録された画像としてディスプレイ110に表示されてもよい。
接続ポート120は、表示装置100に外部装置を直接的に接続するためのポートであり、例えばUSB(Universal Serial Bus)ポート、IEEE1394ポート、またはHDMI(登録商標)(High-Definition Multimedia Interface)ポートなどによって実現される。図示された例では、ストレージ106、ディスプレイ110、スピーカ112、マイクロフォン114、および入力装置116が内部的に(例えばバスなどによって)プロセッサ102に接続されているが、これらの構成要素は表示装置100とは別体であってもよい。このような場合、接続ポート120には、例えば表示装置(外部ディスプレイなど)、入力装置(キーボードやマウスなど)、または記憶装置(外部HDDなど)などが接続されうる。なお、接続ポート120に接続される装置はこれらの例には限られず、上述したような装置以外にも各種の装置が接続されうる。
(1−2.機能構成)
図2は、本開示の一実施形態に係る表示装置において実現される概略的な機能構成を示す図である。図2を参照すると、表示装置100では、画像生成機能151、呼称定義機能153、表示制御機能155、音声入力取得機能157、およびコマンド発行機能159が実現されうる。
これらの機能は、例えば、表示装置100のプロセッサ102がメモリ104に格納されたプログラムに従って動作することによって実現される。また、上記の機能のうちのいくつかは、コマンドDB161を参照する。コマンドDB161は、例えば、表示装置100のストレージ106に格納され、必要に応じてその一部または全部がメモリ104に読み出されてもよい。
(画像生成機能)
画像生成機能151は、表示装置100のディスプレイ110に表示するための画像を生成する。例えば、画像は、写真や映像などのコンテンツ画像や、各種のフォーマットで記述されたドキュメント(例えばhttp(hypertext markup language)で記述されたWebページなどを含む)の画像を含みうる。また、画像は、表示装置100の操作のために利用されるGUI(Graphical User Interface)画像を含んでもよい。これらの画像を表示するためのデータは、例えば、ストレージ106から読み出されてもよく、また通信モジュール108を介してネットワーク上のサーバなどから取得されてもよい。画像生成機能151によって生成された画像は、表示制御機能155によってディスプレイ110に表示される。
例えば、画像生成機能151は、複数のサブ画像を含む画像を生成しうる。サブ画像は、例えばコンテンツ画像やドキュメント画像、GUI画像などでありえ、これらの画像が所定の領域に配置されることによってディスプレイ110に表示される画像が構成されていてもよい。この場合、画像生成機能151は、例えばコマンド発行機能159によって発行されるコマンドに従って、サブ画像のうちのいずれかをディスプレイ110の全体の領域(フルスクリーン)に拡大表示させることが可能でありうる。
また、例えば、画像生成機能151は、被写体領域が定義された画像を生成しうる。この画像は、例えば写真や映像などのコンテンツ画像でありえ、画像認識処理、またはユーザの設定操作に基づいて、画像中の被写体領域が認識されている。この場合、画像生成機能151は、例えばコマンド発行機能159によって発行されるコマンドに従って、被写体領域のうちのいずれかを基準にして画像を拡大表示させることが可能でありうる。このような画像は、例えばディスプレイ110の全体の領域(フルスクリーン)に表示されていてもよく、あるいは上記のサブ画像の1つであってもよい。
(呼称定義機能)
呼称定義機能153は、画像生成機能151によって生成され、表示制御機能155によってディスプレイ110に表示される画像の少なくとも一部の領域に関する呼称(address term)を定義する。上記の通り、本実施形態では、ディスプレイ110に表示される画像が、例えばサブ画像や被写体領域として、画像内に定義される領域を含みうる。呼称定義機能153は、これらの領域についてそれぞれ呼称を定義することによって、後述するように音声入力によってディスプレイ110における画像の表示を操作することを容易にする。呼称定義機能153は、定義された呼称をディスプレイ110への表示のために表示制御機能155に提供するとともに、呼称に関する情報をコマンドDB161に格納する。
例えば、呼称定義機能153は、ディスプレイ110に表示される画像に含まれる複数のサブ画像の表示領域のそれぞれについて呼称を定義する。この場合、呼称定義機能153は、例えばそれぞれのサブ画像を提供するアプリケーション機能の設定情報に基づいて呼称を定義してもよい(例えば、「Webブラウザ」、「メディアプレーヤ」のような呼称が定義されうる)。また、呼称定義機能153は、例えばそれぞれのサブ画像に含まれるタイトルまたはテキストなどに基づいて呼称を定義してもよい(例えば、「ニュース」、「メモ」、「映画」のような呼称が定義されうる)。ここで、例えばこれらの例において、重複する呼称が定義される場合、呼称定義機能153は、例えば連番などを用いて呼称をユニークにしてもよい(例えば、「Webブラウザ1」「Webブラウザ2」のような呼称が定義されうる)。さらに、呼称定義機能153は、例えばそれぞれのサブ画像の画像内での位置に基づいて呼称を定義してもよい(例えば、「左上」、「右下」のような呼称が定義されうる)。
ここで、例えば、呼称定義機能153は、上記のサブ画像であるコンテンツ画像またはドキュメント画像など(以下、アプリケーション画像ともいう)が、例えばコマンド発行機能159によって発行されるコマンドに従ってディスプレイ110の全体の領域に拡大表示された場合、アプリケーション画像に含まれるGUIコンポーネント(例えば、ボタンやタブ、アイコンなどでありうる)の領域について呼称を定義してもよい。この場合、呼称定義機能153は、例えばアプリケーション画像を提供するプログラムにおいて定義されたGUIコンポーネントの情報に基づいて呼称を定義してもよい(例えば、「ヘッダ」、「タブ」、「アドレスバー」などの呼称が定義されうる)。
また、例えば、呼称定義機能153は、ディスプレイ110に表示される画像に含まれる複数の被写体領域のそれぞれについて呼称を定義する。この場合、呼称定義機能153は、例えば新たに実行された画像解析の結果、または画像にメタデータとして付加された情報に基づいて呼称を定義してもよい。ここで、例えば画像解析の結果によって被写体の識別が可能であったり、メタデータとして被写体の名称が記録されているような場合、呼称定義機能153は、被写体の名称に基づいて被写体領域の呼称を定義してもよい(例えば、「両親」、「子供」、「手」、「顔」のような呼称が定義されうる)。そうではない場合、呼称定義機能153は、例えばそれぞれの被写体領域の画像内での位置に基づいて呼称を定義してもよい(例えば、「左上」、「右下」のような呼称が定義されうる)。
また、例えば、呼称定義機能153は、ディスプレイ110に表示される画像に対する操作について呼称を定義する。ここでいう「画像に対する操作」は、画像の中の特定の領域を指定することなく実行される操作という点で、他の例の操作とは区別されうる。ここで定義される呼称は、ディスプレイ110に表示される画像の全部の領域に関する呼称ともいえる。この場合、呼称定義機能153は、例えばコマンドDB161に予め格納された操作コマンドの名称に基づいて呼称を定義してもよい(例えば、「ズームアウト」、「スクロールダウン」などの呼称が定義されうる)。
(表示制御機能)
表示制御機能155は、画像生成機能151によって生成された画像をディスプレイ110に表示させるとともに、呼称定義機能153によって定義された呼称を、呼称に対応する画像内の領域に関連付けて一時的にディスプレイ110に表示させる。例えば、表示制御機能155は、呼称を、対応する領域の中のどこかの位置にテキストとして表示させる。また、表示制御機能155は、呼称に対応する領域を示す枠線などを表示させ、呼称と枠線などを関連付けて表示させてもよい。
上記の通り、表示制御機能155による呼称(および枠線など)の表示は一時的なものである。例えば、表示制御機能155は、画像生成機能151によって新たに生成された画像のディスプレイ110への表示を開始してから所定の時間だけ呼称(および枠線など)をディスプレイ110に表示させてもよい。所定の時間の経過後は、画像生成機能151によって生成された画像だけがディスプレイ110に表示されうる。
このように、呼称定義機能153によって定義された呼称が当該呼称に対応する領域に関連付けて一時的にディスプレイ110に表示されることによって、ユーザは、後述するように音声入力を利用して表示装置100を操作するにあたり、どのような呼称によって操作対象を特定すればよいかを容易に認識することができる。また、呼称(および枠線など)の表示が一時的なものであり、例えば所定の時間の経過後には消滅することによって、ディスプレイ110に表示された画像の視認性を確保することができる。
さらに、表示制御機能155は、例えばコマンド発行機能159によって発行されるコマンドに従って、呼称(および枠線など)の表示を再開させることが可能でありうる。この場合、表示制御機能155は、呼称(および枠線など)の表示を、例えばコマンド発行機能159から別途のコマンドが発行されるまで継続してもよい。
(コマンドDB)
コマンドDB161には、上述のように、呼称定義機能153によって定義された呼称に関する情報が格納される。呼称に関する情報は、例えば、呼称そのものと、呼称によって特定される画像内の領域を特定するための情報を含みうる。例えば、呼称がサブ画像の表示領域に対応して設定される場合には、サブ画像を提供するアプリケーション機能の識別情報(例えば、プロセスIDやウインドウIDなどでありうる)が呼称とともに格納されうる。また、例えば、呼称がアプリケーション画像に含まれるGUIコンポーネントの領域に対応して設定される場合には、GUIコンポーネントの識別情報(例えば、ボタンやタブなどに与えられるIDでありうる)が呼称とともに格納されうる。さらに、例えば、呼称が被写体領域に対応して設定される場合には、被写体領域の識別情報(例えば、画像内での座標情報でありうる)が呼称とともに格納されうる。
また、コマンドDB161には、予め定義された操作コマンドの名称が格納される。操作コマンドの名称は、例えば、上述のように呼称定義機能153がディスプレイ110に表示される画像に対する操作についての呼称を設定するときに参照されるのに加えて、後述するコマンド発行機能159が、ユーザからの音声入力を解析するときにも参照される。操作コマンドには、上述したように画像の中の特定の領域を指定することなく実行されるものに加えて、画像の中の特定の領域を指定して実行されるものも含まれる(例えば、「ズームイン」、「選択する」などの操作コマンドがありうる)。このようなコマンド発行機能159は、コマンドDB161に格納された操作コマンドの名称を参照することによって音声入力によって指示されているコマンドの種類を特定するとともに、コマンドDB161に格納された呼称に関する情報を参照することによって対象の領域を特定する。
(音声入力取得機能)
音声入力取得機能157は、ディスプレイ110に表示された画像に対する音声入力を取得する。より具体的には、音声入力取得機能157は、表示制御機能155によってディスプレイ110に画像が表示されているときに、マイクロフォン114を介して取得されたユーザの音声入力を取得する。上述の通り、マイクロフォン114は表示装置100の周辺で発生しているさまざまな種類の音声を取得するため、音声入力取得機能157は、取得された音声データから、ユーザの発話などの所定の音声を抽出する処理を実行してもよい。あるいは、音声入力取得機能157とは別に、上記の処理を実行する前処理部(図示せず)が存在してもよい。
(コマンド発行機能)
コマンド発行機能159は、音声入力取得機能157が取得した音声入力に、呼称定義機能153によって定義された呼称が含まれる場合に、その呼称に対応する領域に関するコマンドを発行する。より具体的には、コマンド発行機能159は、取得された音声入力から音声認識によって抽出されたテキストに基づいてコマンドDB161を参照し、テキストに含まれる呼称および操作コマンドの名称を検索する。該当する呼称および操作コマンドの名称が発見された場合、コマンド発行機能159は、テキストに含まれる呼称に対応する領域について、テキストに含まれる名称に対応する操作コマンドを発行する。コマンドは、例えば画像生成機能151または表示制御機能155に対して発行されうる。
例えば、コマンド発行機能159は、ディスプレイ110に表示される画像が複数のサブ画像を含む場合に、サブ画像のうちのいずれかをディスプレイ110の全体の領域(フルスクリーン)に拡大表示させるためのコマンドを、画像生成機能151に対して発行する。このとき、どのサブ画像を拡大表示させるかは、音声入力に含まれる呼称に基づいてコマンドDB161を参照することによって決定されうる。
また、例えば、コマンド発行機能159は、ディスプレイ110に表示される画像が複数の被写体領域を含む場合に、被写体領域のうちのいずれかを基準にして画像を拡大表示させるためのコマンドを、画像生成機能151に対して発行する。このとき、どの被写体領域を基準にして画像を拡大表示させるかは、音声入力に含まれる呼称に基づいてコマンドDB161を参照することによって決定されうる。
(1−3.領域のレイヤ構造)
図3および図4は、本開示の第1の実施形態において定義される画像内の領域のレイヤ構造について説明するための図である。本実施形態では、呼称定義機能153による呼称の定義の対象になる画像内の領域が、以下に説明するようなレイヤ構造に従って設定されうる。
図3に示された例では、レイヤ1〜レイヤ4の4つのレイヤが、上位下位の関係を構成している。つまり、レイヤ1の領域はレイヤ2の領域に対する上位レイヤ領域であり、レイヤ2の領域はレイヤ3の領域に対する上位レイヤ領域であり、レイヤ3の領域はレイヤ4の領域に対する上位レイヤ領域である。本実施形態において、下位レイヤ領域は、上位レイヤ領域に包含される。図示された例では、下位レイヤ領域の全部が上位レイヤ領域に包含されているが、他の例では、下位レイヤ領域の少なくとも一部が上位レイヤ領域に包含されていればよい。
本実施形態において、このようなレイヤ構造は、呼称が表示される画像内の領域を選択するために用いられる。図3に示した例の場合、例えばレイヤ1からレイヤ4までのすべての領域について呼称が画像とともにディスプレイ110に表示されると、一時的な表示とはいえ画像の視認性が損なわれる可能性がある。そこで、表示制御機能155は、上位レイヤ領域がディスプレイ110に表示されている場合には、表示された上位レイヤ領域に包含される下位レイヤ領域の呼称をディスプレイ110に表示させうる。
つまり、例えば、表示制御機能155は、レイヤ1の領域(上位レイヤ領域)がディスプレイ110に表示されている場合には、レイヤ1の領域に包含されるレイヤ2の領域(下位レイヤ領域)の呼称をディスプレイ110に表示させる。また、例えば、表示制御機能155は、図示された例では2つあるレイヤ2の領域のうちのいずれか(上位レイヤ領域)がディスプレイ110に表示されている場合には、表示されているレイヤ2の領域に包含されるレイヤ3の領域(下位レイヤ領域)の呼称をディスプレイ110に表示させる。
上記のようなレイヤ構造は、例えば図4に示す例のようなリンク関係または親子関係として定義されてもよい。図示された例では、レイヤ1の領域(1つだけ設定され、例えば画像の全体に対応する)にレイヤ2の2つの領域(レイヤ2−1、レイヤ2−2)が包含され、このうちレイヤ2−1には、レイヤ3の3つの領域(レイヤ3−1、レイヤ3−2、レイヤ3−3)が包含されることなどが示されている。このような関係は、例えば呼称定義機能153が各領域に対して呼称を定義するときに特定され、以後表示制御機能155やコマンド発行機能159によって利用されうる。なお、領域のレイヤ構造の具体的な利用例については後述する。
(1−4.呼称の表示例)
図5および図6は、本開示の第1の実施形態における呼称の表示例を示す図である。本実施形態では、例えば図5の例に示されるように、ディスプレイ110に表示される画像に含まれる複数のサブ画像の表示領域のそれぞれについて呼称が定義される。図示された例では、レイヤ1の領域がディスプレイ110に表示される画像全体に対応して設定され、レイヤ2の領域が画像に含まれるサブ画像の表示領域について定義される。呼称定義機能153は、Webブラウザ(レイヤ2−1)、開発ツール(レイヤ2−2)、テキストエディタ(レイヤ2−3)、およびタスクバー(レイヤ2−4)の各表示領域に対応して呼称を定義しうる。なお、この例において、表示装置100は、例えばPCでありうる。
このとき、表示制御機能155は、画像(レイヤ1の領域)をディスプレイ110に表示させるとともに、各サブ画像に対応する領域について定義された呼称と、呼称に対応する領域を示す枠線とを、一時的にディスプレイ110に表示させる。図では、レイヤ2−1(Webブラウザ)の領域に対応する呼称AT2−1と、レイヤ2−2(開発ツール)の領域に対応する呼称AT2−2と、レイヤ2−3(テキストエディタ)の領域に対応する呼称AT2−3と、レイヤ2−4(タスクバー)の領域に対応する呼称AT2−4とが、それぞれ表示制御機能155によってディスプレイ110に一時的に表示される。
その後、画像(レイヤ1の領域)の表示を開始してから所定の時間が経過すると、表示制御機能155は呼称AT2−1〜AT2−4および枠線の表示を終了し、画像(レイヤ1の領域)だけの表示に戻る。呼称AT2−1〜AT2−4の表示中も、表示後も、ユーザは、呼称AT2−1〜AT2−4を含む音声入力を表示装置100に与えることによって、呼称AT2−1〜AT2−4に対応する領域に対する操作を実行することができる。例えばユーザが「Zoom in “Web browser”」と発話した場合、この音声入力を音声入力取得機能157から提供されたコマンド発行機能159によって、後述するような、レイヤ2−1の領域に対応するWebブラウザの表示領域へのズームイン操作が実行されうる。また、例えばユーザが「Hide Task Bar」と発話した場合、レイヤ2−4の領域に対応するタスクバーの表示が隠されうる。
図6に示された例では、図5に示された第1の例において、ユーザが「Zoom in “Web browser”」と発話した場合の表示の変化が示されている。この場合、コマンド発行機能159は、上記の発話の音声入力から音声認識によって抽出されたテキストに基づいてコマンドDB161を参照し、「Zoom in」という操作コマンドの名称と、「Web browser」という呼称(図5の例で表示された呼称AT2−1に対応する)を発見する。そこで、コマンド発行機能159は、画像生成機能151に対して、Webブラウザのサブ画像(レイヤ2−1の領域に対応する)をディスプレイ110に表示される画像の全体の領域に拡大表示させることを要求するコマンドを発行する。画像生成機能151は、このコマンドに応じて、ディスプレイ110に表示される画像を、レイヤ1の領域を表示する画像から、レイヤ2−1の領域の表示を全体に拡大表示する画像へと変化させる。
このとき、表示制御機能155は、新たな画像(レイヤ2−1の領域)をディスプレイ110に表示させるとともに、画像に含まれるGUIコンポーネントの領域について定義された呼称と、呼称に対応する領域を示す枠線とを、一時的にディスプレイ110に表示させる。図では、レイヤ3−1(タブ)の領域に対応する呼称AT3−1と、レイヤ3−2(アドレスバー)の領域に対応する呼称AT3−2と、レイヤ3−3(ヘッダ)の領域に対応する呼称AT3−3と、レイヤ3−4(ボディ)の領域に対応する呼称AT3−4と、レイヤ3−5(オプション)の領域に対応する呼称AT3−5とが、それぞれ表示制御機能155によってディスプレイ110に一時的に表示される。
なお、図示された例において、新たな画像(レイヤ2−1の領域)がディスプレイ110に表示されたときに一時的に表示される呼称AT3−1〜AT3−5は、例えば呼称定義機能153によって新たに定義されてもよく、また例えばレイヤ2−1の領域がサブ画像としてレイヤ1の領域の画像の中に表示されたときに呼称定義機能153によって定義され、図4に示したレイヤ構造のデータとともにコマンドDB161などに格納されていてもよい。
さらに、表示制御機能155は、ディスプレイ110に表示される画像に対する操作についての呼称C1(ズームアウトの操作に対応する)およびC2(スクロールダウンの操作に対応する)を、上記の呼称AT3−1〜AT3−5とともにディスプレイ110に一時的に表示させる。ディスプレイ110に表示される新たな画像(レイヤ2−1の領域)では、Webブラウザの画像が全体に表示されているために、画像の中の特定の領域を指定することなく、例えばズームアウトやスクロールダウンなどの操作を実行することが可能である。そこで、呼称定義機能153は、コマンドDB161予め格納された操作コマンドの名称の中から、Webブラウザの画像について実行可能な操作コマンドの名称を抽出し、これに対応する呼称を定義する。その結果として、表示制御機能155は、呼称C1,C2をディスプレイ110に一時的に表示させる。呼称C1,C2が表示される位置は、例えば、表示されている画像の視認を妨げないように、ディスプレイ110の端部付近、または角付近でありうる。
その後、画像(レイヤ2−1の領域)の表示を開始してから所定の時間が経過すると、表示制御機能155は呼称AT3−1〜AT3−5および枠線、ならびに呼称C1,C2の表示を終了し、画像(レイヤ2−1の領域)だけの表示に戻る。呼称AT3−1〜AT3−5および呼称C1,C2の表示後も、ユーザは、呼称AT3−1〜AT3−5または呼称C1,C2を含む音声入力を表示装置100に与えることによって、呼称AT3−1〜AT3−5または呼称C1,C2に対応する領域に対する操作を実行することができる。
また、ユーザが所定の音声入力(例えば、「Show Commands」など)を表示装置100に与えた場合、コマンド発行機能159は、表示制御機能155に対して、呼称AT3−1〜AT3−5および枠線、ならびに呼称C1,C2を再びディスプレイ110に表示させることを要求するコマンドを発行する。表示制御機能155は、このコマンドに応じて、上記の呼称および枠線を再びディスプレイ110に表示させる。このときに表示される呼称および枠線は、最初に表示されたときと同様に表示が開始されてから所定の時間で消滅してもよいし、ユーザによって意図的に呼び出されたことを考慮して、自動的には消滅しないように設定されていてもよい。この場合、ユーザが別の所定の音声入力(例えば、「Hide Commands」など)を表示装置100に与えた場合に、表示制御機能155はこれらの呼称および枠線)の表示を終了しうる。
(2.第2の実施形態)
続いて、本開示の第2の実施形態について説明する。なお、この第2の実施形態は、上記の第1の実施形態と比較して、以下で説明する領域の構成例および呼称の表示例を除いてはほぼ同様の構成とすることが可能であるため、これらの点以外についての詳細な説明は省略する。
(2−1.領域のレイヤ構造)
図7は、本開示の第2の実施形態において定義される画像内の領域のレイヤ構造について説明するための図である。本実施形態では、ディスプレイ110に表示される写真の画像の全体がレイヤ1の領域になる。さらに、レイヤ1の領域に包含されるレイヤ2の2つの領域(レイヤ2−1、レイヤ2−2)が定義される。レイヤ2の2つの領域(レイヤ2−1、レイヤ2−2)は、それぞれレイヤ3の2つの領域(レイヤ3−1、レイヤ3−2と、レイヤ3−3、レイヤ3−4)を包含する。レイヤ3の4つの領域(レイヤ3−1〜レイヤ3−4)のうちの2つ(レイヤ3−3、レイヤ3−4)は、それぞれさらにレイヤ4の2つの領域(レイヤ4−1、レイヤ4−2と、レイヤ4−3、レイヤ4−4)を包含する。
レイヤ2以下の各レイヤの領域は、例えば、画像解析の結果に基づいて特定された被写体領域を含みうる。なお、この場合、必ずしもすべての領域が画像解析の結果に基づいて定義されていなくてもよい。例えば、上位のレイヤの領域(例えばレイヤ2の領域)は、画像解析の結果に基づいて特定された被写体領域に対応する下位のレイヤの領域(例えばレイヤ3、レイヤ4の領域)をグルーピングするための領域として事後的に設定された領域であってもよい。あるいは、被写体領域は、画像解析に加えて、またはこれに代えて、ユーザの設定操作に基づいて特定されてもよい。例えば、被写体領域は、画像解析の結果に基づいて提示された候補領域を、ユーザが承認したり修正したりすることによって決定されたものを含んでもよい。また、これらの領域は、例えば写真の画像データに付随するメタデータによって予め定義されていてもよいし、画像の表示時に画像解析を実行した結果に基づいて新たに定義されてもよい。
(2−2.呼称の表示例)
図8および図9は、本開示の第2の実施形態における呼称の表示例を示す図である。本実施形態では、例えば、図7の例に示されるように、ディスプレイ110に表示される画像に含まれる複数の被写体領域のそれぞれについて呼称が定義される。図示された例では、レイヤ1の領域がディスプレイ110に表示される写真の画像全体に対応して設定され(なお、写真の画像は、必ずしもディスプレイ110の全体に表示されなくてもよい。つまり、上記の第1の実施形態におけるサブ画像の1つとして写真の画像が表示されてもよい)、レイヤ2以下の領域が画像に含まれる被写体領域について定義される。
最初に、図8Aに示すように、画像(レイヤ1の領域)をディスプレイ110に表示させる場合、表示制御機能155は、レイヤ2の各領域に対応する領域について定義された呼称と、呼称に対応する領域を示す枠線とを、一時的にディスプレイ110に表示させる。図では、レイヤ2−1の領域に対応する呼称AT2−1と、レイヤ2−2の領域に対応する呼称AT2−2とが、それぞれ表示制御機能155によってディスプレイ110に一時的に表示される。
ここで、呼称定義機能153は、呼称AT2−1,AT2−2として表示される呼称を、例えば画像解析またはユーザからの入力によって特定された被写体の名称に基づいて定義する。例えば、写真の画像データに付随するメタデータに、レイヤ2−1の領域に含まれる被写体が両親であり、レイヤ2−2の領域に含まれる被写体が子供たちであることが記録されていれば、呼称生成機能は、レイヤ2−1の領域について「両親」、レイヤ2−2の領域について「子供たち」という呼称を定義しうる。
その後、画像(レイヤ1の領域)の表示を開始してから所定の時間が経過すると、表示制御機能155は呼称AT2−1,AT2−2および枠線の表示を終了し、シンプルな画像(レイヤ1の領域)の表示に戻る。呼称AT2−1,AT2−2の表示中も、表示後も、ユーザは、呼称AT2−1,AT2−2を含む音声入力を表示装置100に与えることによって、呼称AT2−1,AT2−2に対応する領域に対する操作を実行することができる。図示された例では、呼称および枠線の表示が終了する前に、ユーザが「Select “Children”」という音声入力を表示装置100に与えている。
このとき、コマンド発行機能159は、音声入力から音声認識によって抽出されたテキストに基づいてコマンドDB161を参照し、「Select」という操作コマンドの名称と、「Children」という領域の呼称(図8Aの例で表示された呼称AT2−2に対応する)を発見する。そこで、コマンド発行機能159は、画像生成機能151に対して、レイヤ2−2の領域を選択状態にすることを要求するコマンドを発行する。画像生成機能151は、このコマンドに応じて、図8Bに示すように、ディスプレイ110に表示される画像においてレイヤ2−2の領域を選択状態で表示する画像を生成し、表示制御機能155がこの画像をディスプレイ110に表示させる。なお、レイヤ2−2の領域が選択状態であることは、例えば、レイヤ2−2の領域以外の領域を暗く表示したり、レイヤ2−2の領域に枠線をつけて表示したりすることによって表現されうる(この表現については、図8Bには必ずしも示されていない)。
ここで、表示制御機能155は、図8Bに示すように、新たな画像(レイヤ2−2の領域が選択状態になった画像)をディスプレイ110に表示させるとともに、選択状態になったレイヤ2−2の領域に包含されるさらに下位のレイヤ領域、つまりレイヤ3−3およびレイヤ3−4の領域について定義された呼称および呼称に対応する領域を示す枠線を、レイヤ2の各領域について定義された呼称および枠線とともに、一時的にディスプレイ110に表示させる。図では、呼称AT2−1,AT2−2に加えて、さらに呼称AT3−3,AT3−4が、表示制御機能155によってディスプレイ110に一時的に表示される。
その後、画像(レイヤ2−2の領域が選択状態になった画像)の表示を開始してから所定の時間が経過すると、表示制御機能155は、上記のそれぞれの呼称および枠線の表示を終了し、シンプルな画像(レイヤ2−2の領域が選択状態になった画像)の表示に戻る。呼称および枠線の表示中も、表示後も、ユーザは、呼称を含む音声入力を表示装置100に与えることによって、呼称に対応する領域に対する操作を実行することができる。図示された例では、呼称および枠線の表示が終了する前に、ユーザが「Zoom in “Boy”」という音声入力を表示装置100に与えている。
このとき、コマンド発行機能159は、音声入力から音声認識によって抽出されたテキストに基づいてコマンドDB161を参照し、「Zoom in」という操作コマンドの名称と、「Boy」という領域の呼称とを発見する。そこで、コマンド発行機能159は、画像生成機能151に対して、レイヤ3−3の領域を基準にして画像を拡大表示させることを要求するコマンドを発行する。画像生成機能151は、このコマンドに応じて、図8Cに示すように、レイヤ3−3の領域を基準にして拡大された画像を生成し、表示制御機能155がこの画像をディスプレイ110に表示させる。上記の図8Bの状態において、レイヤ2の領域の呼称(AT2−1,AT2−2)に加えて、レイヤ3の一部の領域の呼称(AT3−3,AT3−4)が一時的にディスプレイ110に表示されたことによって、レイヤ1の領域の画像が表示された状態から、一足飛びに(レイヤ2の領域をスキップして)レイヤ3の領域を基準にした画像の拡大表示を実現することができる。
ここで、表示制御機能155は、図8Cに示すように、新たな画像(レイヤ3−3の領域を基準にして拡大された画像)をディスプレイ110に表示させるとともに、拡大の基準になったレイヤ3−3の領域に包含されるさらに下位のレイヤ領域、つまりレイヤ4−1およびレイヤ4−2の領域について定義された呼称および呼称に対応する領域を示す枠線を、レイヤ3−3の領域について定義された呼称および枠線とともに、一時的にディスプレイ110に表示させる。
なお、図示された例では、レイヤ3−3の領域を基準にして画像が拡大表示されるのであって、必ずしもレイヤ3−3がディスプレイ110の全体に表示されるわけではないため(多くの場合、被写体領域のアスペクト比とディスプレイ110のアスペクト比は一致しない)、画像が拡大表示された後もなお、レイヤ3−3の領域について定義された呼称および領域を表示することが有用でありうる。
また、図8Cに示されているように、新たな画像(レイヤ3−3の領域を基準にして拡大された画像)の表示範囲にレイヤ3(拡大の基準になった画像が属するレイヤ)の他の領域(レイヤ3−4の領域)が含まれる場合、この領域について定義された呼称および領域も、表示制御機能155によって一時的にディスプレイ110に表示されてもよい。
さらに、図8Cに示す段階において、表示制御機能155は、ディスプレイ110に表示される画像に対する操作についての呼称C1(ズームアウトの操作に対応する)を、上記の呼称とともにディスプレイ110に一時的に表示させる。ディスプレイ110に表示される新たな画像(レイヤ3−3の領域を基準にして拡大された画像)では、元の画像が拡大して表示されているために、画像の中の特定の領域を指定することなく、例えばズームアウトの操作を実行することが可能である。そこで、呼称定義機能153は、コマンドDB161に予め格納された操作コマンドの名称の中から、画像について実行可能な操作コマンドの名称を抽出し、これに対応する呼称を定義する。その結果として、表示制御機能155は、呼称C1をディスプレイ110に一時的に表示させる。
その後、画像(レイヤ3−3の領域を基準にして拡大された画像)の表示を開始してから所定の時間が経過すると、表示制御機能155は上記の呼称および枠線の表示を終了し、シンプルな画像(レイヤ3−3の領域を基準にして拡大された画像)の表示に戻る。呼称の表示中も、表示後も、ユーザは、呼称を含む音声入力を表示装置100に与えることによって、呼称に対応する領域に対する操作を実行することができる。図示された例では、図9Aに示されるように、呼称および枠線の表示が終了する前に、ユーザが「”Hand”」という音声入力を表示装置100に与えている。
このとき、コマンド発行機能159は、音声入力から音声認識によって抽出されたテキストに基づいてコマンドDB161を参照し、「Hand」という領域の名称を発見する。さらに、コマンド発行機能159は、コマンドDB161を参照して、操作対象として特定された領域(レイヤ4-1の領域)に対する操作コマンドを推定する。例えば、コマンドDB161に、一般的な領域に対して実行可能な操作コマンドとして、「ズームイン」および「選択」が定義されている場合、コマンド発行機能159は、レイヤ4が最下層であってさらに下位のレイヤ領域が存在しないため、レイヤ4−1の領域を選択しても意味がないことを認識し、これに基づいて、操作コマンドが「ズームイン」であることを推定しうる。そこで、コマンド発行機能159は、画像生成機能151に対して、レイヤ4−1の領域を基準にして画像を拡大表示させることを要求するコマンドを発行する。画像生成機能151は、このコマンドに応じて、図9Bに示すように、レイヤ4−1の領域を基準にして拡大された画像をディスプレイ110に表示させる。
ここで、図9Bに示す段階において、上記の通りレイヤ4は最下層であるため、表示制御機能155は、新たな領域の呼称をディスプレイ110に表示させることはない。一方、図9Aまでで表示されていた画像と同様に、図9Bで表示される画像でもズームアウトの操作が可能であるために、表示制御機能155は、ズームアウトの操作に対応する呼称C2をディスプレイ110に一時的に表示させる。例えば、表示されている画像の被写体領域との関係に応じて、呼称C2の表示位置(画像の右上隅)は、図9Aまでの呼称C1の表示位置(画像の左下隅)とは異なる位置に設定されてもよい。
その後、画像(レイヤ4−1の領域を基準にして拡大された画像)の表示を開始してから所定の時間が経過すると、表示制御機能155は呼称AT4−1および対応する枠線の表示を終了し、シンプルな画像(レイヤ4−1の領域を基準にして拡大された画像)の表示に戻る。呼称の表示中も、表示後も、ユーザは、呼称を含む音声入力を表示装置100に与えることによって、呼称に対応する領域に対する操作を実行することができる。図示された例では、図9Bに示されるように、呼称および枠線の表示が終了する前に、ユーザが「Show “Girl’s Face“」という音声入力を表示装置100に与えている。
このとき、コマンド発行機能159は、音声入力から音声認識によって抽出されたテキストに基づいてコマンドDB161を参照し、「Show」という操作コマンドの名称と、「Girl’s Face」という領域の呼称とを抽出する。しかしながら、図9Bの時点で表示されている画像には、「Girl’s Face」という呼称の領域は存在しない。そこで、コマンド発行機能159は、領域のレイヤ構造に関連付けてコマンドDB161に格納された呼称の情報を検索する。例えば、コマンド発行機能159は、「Girl’s Face」というテキストを分解し、まず「Girl」について、次に「Face」について検索を実行する。これは、より下位レイヤ領域についての呼称、例えば「Face」は、互いに異なる上位レイヤ領域に包含される別々の下位レイヤ領域に、重複して定義されている可能性があるためである。
上記の通り、図示された例において、コマンド発行機能159は、まず呼称「Girl」についてコマンドDB161の検索を実行した結果、レイヤ3−4の領域について定義された呼称「Girl」を発見する。さらに、コマンド発行機能159は、レイヤ3−4の領域に包含される下位レイヤ領域の中で呼称「Face」についてコマンドDB161の検索を実行した結果、レイヤ4−4の領域について定義された呼称「Face」を発見する。以上の検索結果に基づいて、コマンド発行機能159は、画像生成機能151に対して、レイヤ4−4の領域を基準にして画像を拡大表示させることを要求するコマンドを発行する。画像生成機能151は、このコマンドに応じて、図9Cに示すように、レイヤ4−4の領域を基準にして拡大された画像を拡大表示させる。上記の図8A〜図9Bの段階を通じて、以前に定義または表示された領域の呼称がコマンドDB161に格納されていることによって、その時点ではディスプレイ110に表示されていないが、以前に表示されたものをユーザが覚えていた呼称を含む音声入力についても、ユーザの意図をくんだ操作を実現させることができる。
(2−3.変形例)
(第1の変形例)
図10は、本開示の第2の実施形態の第1の変形例を示す図である。図10A〜図10Cには、上記で図8Bおよび図8Cを参照して説明された、ユーザの「Zoom in “Boy”」という発話が音声入力として取得された場合にレイヤ3−3の領域を基準にして画像が拡大表示されるときのディスプレイ110の表示の変化が、遷移中の表示(図10B)とともに示されている。
図10Bでは、画像生成機能151が、ディスプレイ110に表示される画像を、レイヤ1の領域の画像から、レイヤ3−3の領域を基準にして拡大表示された画像へと遷移される途中の段階で、表示装置100(コマンド発行機能159)が認識した、音声入力に含まれる呼称を含むテキストTが表示される。あるいは、テキストTは、表示装置100のコマンド発行機能159によって発行されたコマンドを示すものであってもよい。ディスプレイ110においてこのような表示がされることによって、ユーザは、表示装置100がユーザの意図に従って動作しているかを認識することができる。例えば、表示装置100がユーザの音声入力を正しく認識せず、ユーザが意図していないコマンドが実行されたような場合には、このような表示によって、ユーザは、何が起きたのかを理解することができる。
(第2の変形例)
図11および図12は、本開示の第2の実施形態の第2の変形例を示す図である。本実施形態では、図7を参照して説明したように、ディスプレイ110に表示される写真について、被写体領域を含む領域のレイヤ構造が設定された。図7に示した例では、下位レイヤ領域は上位レイヤ領域にその全部が包含されていたが、本変形例ではそうではない。
例えば、図11に示されているように、下位レイヤ領域の一部分だけが上位レイヤ領域に包含されるケースがあってもよい。図11に示した例では、レイヤ4−1の領域の一部分だけが、上位レイヤ領域であるレイヤ3−3の領域に包含されており、他の部分はレイヤ3−3の領域の外に出ている。同様に、レイヤ4−3の領域の一部分だけが、上位レイヤ領域であるレイヤ3−4の領域に包含されており、他の部分はレイヤ3−4の領域の外に出ている。他のレイヤ3またはレイヤ4の領域のように、その全部が上位レイヤ領域に包含される下位レイヤ領域も存在しうる。
図12は、図11の例のように領域が設定された場合の画像の拡大表示の例を示す。本変形例では、下位レイヤ領域が必ずしも全部上位レイヤ領域に包含されないため、上位レイヤ領域と下位レイヤ領域との間で認識される関連性が比較的緩やかでありうる。従って、例えばレイヤ3−3の領域を基準にして画像を拡大表示させたような場合も、レイヤ3−3に包含される下位レイヤ領域(レイヤ4−1、レイヤ4−2)の呼称(AT4−1,AT4−2)だけではなく、レイヤ3−4に包含される下位レイヤの領域(レイヤ4−3)の呼称(AT4−3)も表示されうる。
なお、ここで、呼称AT4−1と呼称AT4−3とは、元々いずれも「Hand」で重複しているため、呼称定義機能153は、呼称AT4−1を「Hand1」、呼称AT4−3を「Hand2」というように連番を付加して呼称を区別可能にする。なお、呼称AT4−1または呼称AT4−3のうちのいずれか1つしかディスプレイ110に表示されない場合、呼称定義機能153は連番の負荷を省略しうる。
上記のような表示は、下位レイヤ領域の一部だけが上位レイヤ領域に包含されるか、下位レイヤ領域の全部が上位レイヤ領域に包含されるかにかかわらず可能である。つまり、画像内の領域が、図7に示す例のように構成されている場合も、図11に示す例のように構成されている場合も可能である。例えば、レイヤ2−2に領域に対する下位レイヤ領域であるレイヤ3−3の領域を基準にして画像が拡大表示された場合、レイヤ3−3の領域に対する下位レイヤ領域であるレイヤ4−1およびレイヤ4−2の呼称が一時的に表示されるのに加えて、画像の表示範囲に含まれるレイヤ3−4の領域と、レイヤ3−4の領域に対する下位レイヤ領域であるレイヤ4−3およびレイヤ4−4の呼称も一時的に表示されうる。ただし、例えばレイヤ4−1またはレイヤ4−2の領域の呼称と、レイヤ4−3またはレイヤ4−4の領域の呼称とが重複する場合、上記のように連番を付加することによって両者が区別されるか、重複するレイヤ4−3またはレイヤ4−4の領域の呼称が表示されなくなることによって、重複が解消されうる。
(3.第3の実施形態)
続いて、本開示の第3の実施形態について説明する。なお、この第3の実施形態は、上記の第1の実施形態と比較して、以下で説明する呼称の表示例を除いてはほぼ同様の構成とすることが可能であるため、呼称の表示例以外についての詳細な説明は省略する。
図13は、本開示の第3の実施形態における呼称の表示例を示す図である。本実施形態では、例えば図13の例に示されるように、ディスプレイ110に表示される画像に含まれる複数のサブ画像の表示領域のそれぞれについて呼称が定義される。図示された例では、レイヤ1の領域がディスプレイ110に表示される画像全体に定義され、レイヤ2の領域が画像に含まれるサブ画像の表示領域について定義される。ディスプレイ110に表示される画像は、プレゼンテーションの発表者用に表示される画像であり、現在表示されているスライド(ページ)や、以前に表示されたグラフまたはページなどを示すサブ画像を含む。呼称定義機能153は、「現在のスライド」というタイトルの中のメインテキスト(レイヤ2−1)、右側のグラフ(レイヤ2−2)、「現在のスライド」とは別に表示される、直前に表示したグラフ(レイヤ2−3)、直前のページ(レイヤ2−4)、および次のページ(レイヤ2−5)の各表示領域に対応して呼称を定義しうる。
このとき、表示制御機能155は、画像(レイヤ1の領域)をディスプレイ110に表示させるとともに、各サブ画像に対応する領域について定義された呼称と、呼称に対応する領域を示す枠線とを、一時的にディスプレイ110に表示させる。図では、レイヤ2−1(メインテキスト)の領域に対応する呼称AT2−1と、レイヤ2−2(右側のグラフ)の領域に対応する呼称AT2−2と、レイヤ2−3(直前に表示したグラフ)の領域に対応する呼称AT2−3と、レイヤ2−4(直前のページ)の領域に対応する呼称AT2−4と、レイヤ2−5(次のページ)の領域に対応する呼称AT2−5とが、それぞれ表示制御機能155によってディスプレイ110に一時的に表示される。
本実施形態において、表示装置100に与えられるユーザの音声入力は、例えば、「Show “Last graph”」や「Go to “Next page”」とったようなものでありうる。コマンド発行機能159は、このような音声入力に対して、例えば、画像生成機能151に対して、直前に参照したグラフを再び大きく表示させることを要求するコマンドや、スライド(ページ)を次に進めることを要求するコマンドなどを発行する。例えば、画像生成機能151が、スライド(ページ)を次に進めることを要求するコマンドに基づいて、図では「Next page」として表示されているスライド(ページ)を「現在のスライド」の領域に新たに表示させた場合、それまで「現在のスライド」として表示されていたスライド(ページ)が、今度は「Last Page」として表示されることになる。
本実施形態において、呼称定義機能153は、このような領域の表示態様の時系列的な変化に基づいて呼称を定義されてもよい。例えば、呼称定義機能153は、それまで「現在のスライド」として表示されていたスライド(ページ)が、「現在のスライド」とは別の場所で、より小さく表示されるようになったような場合に、このスライド(ページ)に対応する領域について「直前のページ」といったような意味の呼称を定義してもよい。
(4.補足)
本開示の実施形態は、例えば、上記で説明したような情報処理装置(表示装置として説明された)、システム、情報処理装置またはシステムで実行される情報処理方法、情報処理装置を機能させるためのプログラム、およびプログラムが記録された一時的でない有形の媒体を含みうる。
以上、添付図面を参照しながら本開示の好適な実施形態について詳細に説明したが、本開示の技術的範囲はかかる例に限定されない。本開示の技術分野における通常の知識を有する者であれば、特許請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本開示の技術的範囲に属するものと了解される。
なお、以下のような構成も本開示の技術的範囲に属する。
(1)ディスプレイに表示される画像の少なくとも一部の領域に関する呼称を定義する呼称定義機能と、
前記画像を前記ディスプレイに表示させるとともに、前記呼称を前記領域に関連付けて一時的に前記ディスプレイに表示させる表示制御機能と、
前記画像に対する音声入力を取得する音声入力取得機能と、
前記音声入力に前記呼称が含まれる場合に、前記領域に関するコマンドを発行するコマンド発行機能と
を実現するプロセッサを備える情報処理装置。
(2)前記領域は、上位レイヤ領域と下位レイヤ領域とを含み、
前記表示制御機能は、前記上位レイヤ領域が前記ディスプレイに表示されている場合に、前記表示された上位レイヤ領域に少なくとも一部が包含される下位レイヤ領域の呼称を表示させる、前記(1)に記載の情報処理装置。
(3)前記コマンド発行機能は、前記下位レイヤ領域を拡大表示させるコマンドを発行する、前記(2)に記載の情報処理装置。
(4)前記領域は、前記下位レイヤ領域のさらに下位のレイヤ領域を含み、
前記表示制御機能は、前記下位レイヤ領域が拡大表示された場合に、前記下位レイヤ領域に少なくとも一部が包含される、前記下位レイヤ領域のさらに下位のレイヤ領域の呼称を表示させる、前記(3)に記載の情報処理装置。
(5)前記コマンド発行機能は、前記下位レイヤ領域を選択状態にするコマンドを発行する、前記(2)〜(4)のいずれか1項に記載の情報処理装置。
(6)前記領域は、前記下位レイヤ領域のさらに下位のレイヤ領域を含み、
前記表示制御機能は、前記下位レイヤ領域が選択状態になった場合に、前記下位レイヤ領域に少なくとも一部が包含される、前記下位レイヤ領域のさらに下位のレイヤ領域の呼称を表示させる、前記(5)に記載の情報処理装置。
(7)前記コマンド発行機能は、前記下位レイヤ領域のさらに下位のレイヤ領域を拡大表示させるコマンドを発行する、前記(6)に記載の情報処理装置。
(8)前記上位レイヤ領域は、前記画像の全体の領域に対応し、
前記下位レイヤ領域は、前記画像に含まれる複数のサブ画像のそれぞれの表示領域に対応する、前記(2)〜(7)のいずれか1項に記載の情報処理装置。
(9)前記コマンド発行機能は、前記複数のサブ画像のうち前記音声入力に含まれる呼称に対応するサブ画像を前記画像の全体の領域に拡大表示させるコマンドを発行する、前記(8)に記載の情報処理装置。
(10)前記上位レイヤ領域は、前記画像の全体の領域に表示されるアプリケーション画像に対応し、
前記下位レイヤ領域は、前記アプリケーション画像に含まれるGUIコンポーネントの領域に対応する、前記(2)〜(7)のいずれか1項に記載の情報処理装置。
(11)前記上位レイヤ領域は、前記画像の全体の領域に対応し、
前記下位レイヤ領域は、前記画像において認識された複数の被写体領域のそれぞれに対応する、前記(2)に記載の情報処理装置。
(12)前記コマンド発行機能は、前記複数の被写体領域のうち前記音声入力に含まれる呼称に対応する被写体領域を基準にして前記画像を拡大表示させるコマンドを発行する、前記(11)に記載の情報処理装置。
(13)前記下位レイヤ領域は、前記上位レイヤ領域に全部が包含される、前記(2)〜(12)のいずれか1項に記載の情報処理装置。
(14)前記呼称定義機能は、前記領域に関する設定情報に基づいて前記呼称を定義する、前記(1)〜(13)のいずれか1項に記載の情報処理装置。
(15)前記呼称定義機能は、前記領域の前記画像内での位置に基づいて前記呼称を定義する、前記(1)〜(14)のいずれか1項に記載の情報処理装置。
(16)前記呼称定義機能は、前記領域の表示態様の時系列的な変化に基づいて前記呼称を定義する、前記(1)〜(15)のいずれか1項に記載の情報処理装置。
(17)前記表示制御機能は、前記音声入力に含まれる呼称を前記ディスプレイに表示させる、前記(1)〜(16)のいずれか1項に記載の情報処理装置。
(18)前記表示制御機能は、前記発行されたコマンドを前記ディスプレイに表示させる、前記(1)〜(17)のいずれか1項に記載の情報処理装置。
(19)プロセッサが、
ディスプレイに表示される画像の少なくとも一部の領域に関する呼称を定義することと、
前記画像を前記ディスプレイに表示させるとともに、前記呼称を前記領域に関連付けて一時的に前記ディスプレイに表示させることと、
前記画像に対する音声入力を取得することと、
前記音声入力に前記呼称が含まれる場合に、前記領域に関するコマンドを発行することと
を含む情報処理方法。
(20)ディスプレイに表示される画像の少なくとも一部の領域に関する呼称を定義する呼称定義機能と、
前記画像を前記ディスプレイに表示させるとともに、前記呼称を前記領域に関連付けて一時的に前記ディスプレイに表示させる表示制御機能と、
前記画像に対する音声入力を取得する音声入力取得機能と、
前記音声入力に前記呼称が含まれる場合に、前記領域に関するコマンドを発行するコマンド発行機能と
をコンピュータに実現させるためのプログラム。
100 表示装置
102 プロセッサ
104 メモリ
106 ストレージ
108 通信モジュール
110 ディスプレイ
114 マイクロフォン
153 呼称定義機能
155 表示制御機能
157 音声入力取得機能
159 コマンド発行機能

Claims (20)

  1. ディスプレイに表示される画像の少なくとも一部の領域に関する呼称を定義する呼称定義機能と、
    前記画像を前記ディスプレイに表示させるとともに、前記呼称を前記領域に関連付けて一時的に前記ディスプレイに表示させる表示制御機能と、
    前記画像に対する音声入力を取得する音声入力取得機能と、
    前記音声入力に前記呼称が含まれる場合に、前記領域に関するコマンドを発行するコマンド発行機能と
    を実現するプロセッサを備える情報処理装置。
  2. 前記領域は、上位レイヤ領域と下位レイヤ領域とを含み、
    前記表示制御機能は、前記上位レイヤ領域が前記ディスプレイに表示されている場合に、前記表示された上位レイヤ領域に少なくとも一部が包含される下位レイヤ領域の呼称を表示させる、請求項1に記載の情報処理装置。
  3. 前記コマンド発行機能は、前記下位レイヤ領域を拡大表示させるコマンドを発行する、請求項2に記載の情報処理装置。
  4. 前記領域は、前記下位レイヤ領域のさらに下位のレイヤ領域を含み、
    前記表示制御機能は、前記下位レイヤ領域が拡大表示された場合に、前記下位レイヤ領域に少なくとも一部が包含される、前記下位レイヤ領域のさらに下位のレイヤ領域の呼称を表示させる、請求項3に記載の情報処理装置。
  5. 前記コマンド発行機能は、前記下位レイヤ領域を選択状態にするコマンドを発行する、請求項2に記載の情報処理装置。
  6. 前記領域は、前記下位レイヤ領域のさらに下位のレイヤ領域を含み、
    前記表示制御機能は、前記下位レイヤ領域が選択状態になった場合に、前記下位レイヤ領域に少なくとも一部が包含される、前記下位レイヤ領域のさらに下位のレイヤ領域の呼称を表示させる、請求項5に記載の情報処理装置。
  7. 前記コマンド発行機能は、前記下位レイヤ領域のさらに下位のレイヤ領域を拡大表示させるコマンドを発行する、請求項6に記載の情報処理装置。
  8. 前記上位レイヤ領域は、前記画像の全体の領域に対応し、
    前記下位レイヤ領域は、前記画像に含まれる複数のサブ画像のそれぞれの表示領域に対応する、請求項2に記載の情報処理装置。
  9. 前記コマンド発行機能は、前記複数のサブ画像のうち前記音声入力に含まれる呼称に対応するサブ画像を前記画像の全体の領域に拡大表示させるコマンドを発行する、請求項8に記載の情報処理装置。
  10. 前記上位レイヤ領域は、前記画像の全体の領域に表示されるアプリケーション画像に対応し、
    前記下位レイヤ領域は、前記アプリケーション画像に含まれるGUIコンポーネントの領域に対応する、請求項2に記載の情報処理装置。
  11. 前記上位レイヤ領域は、前記画像の全体の領域に対応し、
    前記下位レイヤ領域は、前記画像において認識された複数の被写体領域のそれぞれに対応する、請求項2に記載の情報処理装置。
  12. 前記コマンド発行機能は、前記複数の被写体領域のうち前記音声入力に含まれる呼称に対応する被写体領域を基準にして前記画像を拡大表示させるコマンドを発行する、請求項11に記載の情報処理装置。
  13. 前記下位レイヤ領域は、前記上位レイヤ領域に全部が包含される、請求項2に記載の情報処理装置。
  14. 前記呼称定義機能は、前記領域に関する設定情報に基づいて前記呼称を定義する、請求項1に記載の情報処理装置。
  15. 前記呼称定義機能は、前記領域の前記画像内での位置に基づいて前記呼称を定義する、請求項1に記載の情報処理装置。
  16. 前記呼称定義機能は、前記領域の表示態様の時系列的な変化に基づいて前記呼称を定義する、請求項1に記載の情報処理装置。
  17. 前記表示制御機能は、前記音声入力に含まれる呼称を前記ディスプレイに表示させる、請求項1に記載の情報処理装置。
  18. 前記表示制御機能は、前記発行されたコマンドを前記ディスプレイに表示させる、請求項1に記載の情報処理装置。
  19. プロセッサが、
    ディスプレイに表示される画像の少なくとも一部の領域に関する呼称を定義することと、
    前記画像を前記ディスプレイに表示させるとともに、前記呼称を前記領域に関連付けて一時的に前記ディスプレイに表示させることと、
    前記画像に対する音声入力を取得することと、
    前記音声入力に前記呼称が含まれる場合に、前記領域に関するコマンドを発行することと
    を含む情報処理方法。
  20. ディスプレイに表示される画像の少なくとも一部の領域に関する呼称を定義する呼称定義機能と、
    前記画像を前記ディスプレイに表示させるとともに、前記呼称を前記領域に関連付けて一時的に前記ディスプレイに表示させる表示制御機能と、
    前記画像に対する音声入力を取得する音声入力取得機能と、
    前記音声入力に前記呼称が含まれる場合に、前記領域に関するコマンドを発行するコマンド発行機能と
    をコンピュータに実現させるためのプログラム。
JP2013144449A 2013-07-10 2013-07-10 情報処理装置、情報処理方法およびプログラム Active JP6102588B2 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2013144449A JP6102588B2 (ja) 2013-07-10 2013-07-10 情報処理装置、情報処理方法およびプログラム
US14/273,735 US20150019974A1 (en) 2013-07-10 2014-05-09 Information processing device, information processing method, and program
EP14174730.3A EP2824564B1 (en) 2013-07-10 2014-06-27 Information processing device, information processing method, and program
CN201410315263.1A CN104281259B (zh) 2013-07-10 2014-07-03 信息处理装置、信息处理方法和程序
US16/049,228 US10725734B2 (en) 2013-07-10 2018-07-30 Voice input apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013144449A JP6102588B2 (ja) 2013-07-10 2013-07-10 情報処理装置、情報処理方法およびプログラム

Publications (3)

Publication Number Publication Date
JP2015018365A true JP2015018365A (ja) 2015-01-29
JP2015018365A5 JP2015018365A5 (ja) 2016-02-12
JP6102588B2 JP6102588B2 (ja) 2017-03-29

Family

ID=51033001

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013144449A Active JP6102588B2 (ja) 2013-07-10 2013-07-10 情報処理装置、情報処理方法およびプログラム

Country Status (4)

Country Link
US (2) US20150019974A1 (ja)
EP (1) EP2824564B1 (ja)
JP (1) JP6102588B2 (ja)
CN (1) CN104281259B (ja)

Cited By (77)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016132620A1 (ja) * 2015-02-18 2016-08-25 ソニー株式会社 情報処理装置、情報処理方法、及びプログラム
JP2017102939A (ja) * 2016-12-26 2017-06-08 株式会社プロフィールド オーサリング装置、オーサリング方法、およびプログラム
JP2018173754A (ja) * 2017-03-31 2018-11-08 ブラザー工業株式会社 情報処理プログラム、情報処理装置、および情報処理装置の制御方法
JP2019522250A (ja) * 2016-06-10 2019-08-08 アップル インコーポレイテッドApple Inc. マルチタスキング環境におけるインテリジェントデジタルアシスタント
JP2019185733A (ja) * 2018-04-11 2019-10-24 百度在線網絡技術(北京)有限公司 音声制御方法、端末機器、クラウドサーバ及びシステム
US10714117B2 (en) 2013-02-07 2020-07-14 Apple Inc. Voice trigger for a digital assistant
US10720160B2 (en) 2018-06-01 2020-07-21 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
US10741185B2 (en) 2010-01-18 2020-08-11 Apple Inc. Intelligent automated assistant
US10741181B2 (en) 2017-05-09 2020-08-11 Apple Inc. User interface for correcting recognition errors
US10748546B2 (en) 2017-05-16 2020-08-18 Apple Inc. Digital assistant services based on device capabilities
US10839159B2 (en) 2018-09-28 2020-11-17 Apple Inc. Named entity normalization in a spoken dialog system
US10878809B2 (en) 2014-05-30 2020-12-29 Apple Inc. Multi-command single utterance input method
US10909171B2 (en) 2017-05-16 2021-02-02 Apple Inc. Intelligent automated assistant for media exploration
US10930282B2 (en) 2015-03-08 2021-02-23 Apple Inc. Competing devices responding to voice triggers
US10942703B2 (en) 2015-12-23 2021-03-09 Apple Inc. Proactive assistance based on dialog communication between devices
US11010127B2 (en) 2015-06-29 2021-05-18 Apple Inc. Virtual assistant for media playback
US11010561B2 (en) 2018-09-27 2021-05-18 Apple Inc. Sentiment prediction from textual data
US11009970B2 (en) 2018-06-01 2021-05-18 Apple Inc. Attention aware virtual assistant dismissal
US11070949B2 (en) 2015-05-27 2021-07-20 Apple Inc. Systems and methods for proactively identifying and surfacing relevant content on an electronic device with a touch-sensitive display
US11087759B2 (en) 2015-03-08 2021-08-10 Apple Inc. Virtual assistant activation
US11120372B2 (en) 2011-06-03 2021-09-14 Apple Inc. Performing actions associated with task items that represent tasks to perform
US11126400B2 (en) 2015-09-08 2021-09-21 Apple Inc. Zero latency digital assistant
US11133008B2 (en) 2014-05-30 2021-09-28 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US11140099B2 (en) 2019-05-21 2021-10-05 Apple Inc. Providing message response suggestions
US11152002B2 (en) 2016-06-11 2021-10-19 Apple Inc. Application integration with a digital assistant
WO2021220769A1 (ja) * 2020-04-27 2021-11-04 ソニーグループ株式会社 情報処理装置及び情報処理方法
US11170166B2 (en) 2018-09-28 2021-11-09 Apple Inc. Neural typographical error modeling via generative adversarial networks
US11169616B2 (en) 2018-05-07 2021-11-09 Apple Inc. Raise to speak
US11217251B2 (en) 2019-05-06 2022-01-04 Apple Inc. Spoken notifications
US11227589B2 (en) 2016-06-06 2022-01-18 Apple Inc. Intelligent list reading
US11237797B2 (en) 2019-05-31 2022-02-01 Apple Inc. User activity shortcut suggestions
US11257504B2 (en) 2014-05-30 2022-02-22 Apple Inc. Intelligent assistant for home automation
US11269678B2 (en) 2012-05-15 2022-03-08 Apple Inc. Systems and methods for integrating third party services with a digital assistant
US11289073B2 (en) 2019-05-31 2022-03-29 Apple Inc. Device text to speech
US11307752B2 (en) 2019-05-06 2022-04-19 Apple Inc. User configurable task triggers
US11348582B2 (en) 2008-10-02 2022-05-31 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
US11348573B2 (en) 2019-03-18 2022-05-31 Apple Inc. Multimodality in digital assistant systems
US11360641B2 (en) 2019-06-01 2022-06-14 Apple Inc. Increasing the relevance of new available information
US11380310B2 (en) 2017-05-12 2022-07-05 Apple Inc. Low-latency intelligent automated assistant
US11388291B2 (en) 2013-03-14 2022-07-12 Apple Inc. System and method for processing voicemail
US11405466B2 (en) 2017-05-12 2022-08-02 Apple Inc. Synchronization and task delegation of a digital assistant
US11423886B2 (en) 2010-01-18 2022-08-23 Apple Inc. Task flow identification based on user intent
US11423908B2 (en) 2019-05-06 2022-08-23 Apple Inc. Interpreting spoken requests
US11431642B2 (en) 2018-06-01 2022-08-30 Apple Inc. Variable latency device coordination
US11462215B2 (en) 2018-09-28 2022-10-04 Apple Inc. Multi-modal inputs for voice commands
US11467802B2 (en) 2017-05-11 2022-10-11 Apple Inc. Maintaining privacy of personal information
US11468282B2 (en) 2015-05-15 2022-10-11 Apple Inc. Virtual assistant in a communication session
US11475884B2 (en) 2019-05-06 2022-10-18 Apple Inc. Reducing digital assistant latency when a language is incorrectly determined
US11475898B2 (en) 2018-10-26 2022-10-18 Apple Inc. Low-latency multi-speaker speech recognition
US11488406B2 (en) 2019-09-25 2022-11-01 Apple Inc. Text detection using global geometry estimators
US11496600B2 (en) 2019-05-31 2022-11-08 Apple Inc. Remote execution of machine-learned models
US11500672B2 (en) 2015-09-08 2022-11-15 Apple Inc. Distributed personal assistant
US11516537B2 (en) 2014-06-30 2022-11-29 Apple Inc. Intelligent automated assistant for TV user interactions
US11526368B2 (en) 2015-11-06 2022-12-13 Apple Inc. Intelligent automated assistant in a messaging environment
US11532306B2 (en) 2017-05-16 2022-12-20 Apple Inc. Detecting a trigger of a digital assistant
US11580990B2 (en) 2017-05-12 2023-02-14 Apple Inc. User-specific acoustic models
US11599331B2 (en) 2017-05-11 2023-03-07 Apple Inc. Maintaining privacy of personal information
US11638059B2 (en) 2019-01-04 2023-04-25 Apple Inc. Content playback on multiple devices
US11656884B2 (en) 2017-01-09 2023-05-23 Apple Inc. Application integration with a digital assistant
US11657813B2 (en) 2019-05-31 2023-05-23 Apple Inc. Voice identification in digital assistant systems
US11671920B2 (en) 2007-04-03 2023-06-06 Apple Inc. Method and system for operating a multifunction portable electronic device using voice-activation
US11696060B2 (en) 2020-07-21 2023-07-04 Apple Inc. User identification using headphones
US11710482B2 (en) 2018-03-26 2023-07-25 Apple Inc. Natural assistant interaction
US11727219B2 (en) 2013-06-09 2023-08-15 Apple Inc. System and method for inferring user intent from speech inputs
US11755276B2 (en) 2020-05-12 2023-09-12 Apple Inc. Reducing description length based on confidence
US11765209B2 (en) 2020-05-11 2023-09-19 Apple Inc. Digital assistant hardware abstraction
US11790914B2 (en) 2019-06-01 2023-10-17 Apple Inc. Methods and user interfaces for voice-based control of electronic devices
US11798547B2 (en) 2013-03-15 2023-10-24 Apple Inc. Voice activated device for use with a voice-based digital assistant
US11809483B2 (en) 2015-09-08 2023-11-07 Apple Inc. Intelligent automated assistant for media search and playback
US11809783B2 (en) 2016-06-11 2023-11-07 Apple Inc. Intelligent device arbitration and control
US11838734B2 (en) 2020-07-20 2023-12-05 Apple Inc. Multi-device audio adjustment coordination
US11853536B2 (en) 2015-09-08 2023-12-26 Apple Inc. Intelligent automated assistant in a media environment
US11854539B2 (en) 2018-05-07 2023-12-26 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US11886805B2 (en) 2015-11-09 2024-01-30 Apple Inc. Unconventional virtual assistant interactions
US11914848B2 (en) 2020-05-11 2024-02-27 Apple Inc. Providing relevant data items based on context
US11928604B2 (en) 2005-09-08 2024-03-12 Apple Inc. Method and apparatus for building an intelligent automated assistant
US11979836B2 (en) 2023-04-26 2024-05-07 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
KR102417682B1 (ko) 2015-09-09 2022-07-07 삼성전자주식회사 음성 인식을 이용한 닉네임 관리 장치 및 방법
DE102017219596A1 (de) * 2016-12-22 2018-06-28 Volkswagen Aktiengesellschaft Sprachausgabestimme eines Sprachbediensystems
US11029834B2 (en) * 2017-12-20 2021-06-08 International Business Machines Corporation Utilizing biometric feedback to allow users to scroll content into a viewable display area
USD987666S1 (en) * 2019-09-11 2023-05-30 Ford Global Technologies, Llc Display screen or portion thereof with transitional graphical user interface
CN110989893A (zh) * 2019-12-06 2020-04-10 北京金山安全软件有限公司 一种点击操作的响应方法、装置及电子设备

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004029933A (ja) * 2002-06-21 2004-01-29 Mitsubishi Heavy Ind Ltd 表示制御装置および表示制御方法
JP2008277903A (ja) * 2007-04-25 2008-11-13 Sony Corp 撮像装置及びフォーカス対象決定方法
JP2009109587A (ja) * 2007-10-26 2009-05-21 Panasonic Electric Works Co Ltd 音声認識制御装置
US20100031150A1 (en) * 2005-10-17 2010-02-04 Microsoft Corporation Raising the visibility of a voice-activated user interface
JP2011035771A (ja) * 2009-08-04 2011-02-17 Olympus Corp 撮像装置、編集装置および撮像システム
JP2011114401A (ja) * 2009-11-24 2011-06-09 Sony Computer Entertainment Inc 画像データ作成支援装置および画像データ作成支援方法
WO2012040107A1 (en) * 2010-09-20 2012-03-29 Kopin Corporation Advanced remote control of host application using motion and voice commands
JP2012103840A (ja) * 2010-11-09 2012-05-31 Sony Corp 情報処理装置、プログラムおよびコマンド生成方法
JP2013037688A (ja) * 2011-08-05 2013-02-21 Samsung Electronics Co Ltd 電子装置及びその制御方法

Family Cites Families (48)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4989253A (en) * 1988-04-15 1991-01-29 The Montefiore Hospital Association Of Western Pennsylvania Voice activated microscope
US5970457A (en) * 1995-10-25 1999-10-19 Johns Hopkins University Voice command and control medical care system
US6847336B1 (en) * 1996-10-02 2005-01-25 Jerome H. Lemelson Selectively controllable heads-up display system
US6154723A (en) * 1996-12-06 2000-11-28 The Board Of Trustees Of The University Of Illinois Virtual reality 3D interface system for data creation, viewing and editing
IL119948A (en) * 1996-12-31 2004-09-27 News Datacom Ltd Voice activated communication system and program guide
US6224542B1 (en) * 1999-01-04 2001-05-01 Stryker Corporation Endoscopic camera system with non-mechanical zoom
US6514201B1 (en) * 1999-01-29 2003-02-04 Acuson Corporation Voice-enhanced diagnostic medical ultrasound system and review station
US6545669B1 (en) * 1999-03-26 2003-04-08 Husam Kinawi Object-drag continuity between discontinuous touch-screens
JP3980791B2 (ja) * 1999-05-03 2007-09-26 パイオニア株式会社 音声認識装置を備えたマンマシンシステム
US6718308B1 (en) * 2000-02-22 2004-04-06 Daniel L. Nolting Media presentation system controlled by voice to text commands
US6428449B1 (en) * 2000-05-17 2002-08-06 Stanford Apseloff Interactive video system responsive to motion and voice command
JP2002041023A (ja) * 2000-07-06 2002-02-08 Internatl Business Mach Corp <Ibm> コンピュータシステム、表示制御装置、ディスプレイ装置、表示制御方法、記憶媒体及びプログラム伝送装置
JP2002041276A (ja) * 2000-07-24 2002-02-08 Sony Corp 対話型操作支援システム及び対話型操作支援方法、並びに記憶媒体
US7136814B1 (en) * 2000-11-03 2006-11-14 The Procter & Gamble Company Syntax-driven, operator assisted voice recognition system and methods
US6508706B2 (en) * 2001-06-21 2003-01-21 David Howard Sitrick Electronic interactive gaming apparatus, system and methodology
US20030005461A1 (en) * 2001-07-02 2003-01-02 Sony Corporation System and method for linking closed captioning to web site
US6882974B2 (en) * 2002-02-15 2005-04-19 Sap Aktiengesellschaft Voice-control for a user interface
JP3702867B2 (ja) * 2002-06-25 2005-10-05 株式会社デンソー 音声制御装置
US7213206B2 (en) * 2003-09-09 2007-05-01 Fogg Brian J Relationship user interface
KR100588042B1 (ko) * 2004-01-14 2006-06-09 한국과학기술연구원 인터액티브 프레젠테이션 시스템
FI20040296A (fi) * 2004-02-25 2005-08-26 Saimaan Ipr Oy Menetelmä ja laite palvelun pyytämiseksi verkossa
US20050195221A1 (en) * 2004-03-04 2005-09-08 Adam Berger System and method for facilitating the presentation of content via device displays
US20050210416A1 (en) * 2004-03-16 2005-09-22 Maclaurin Matthew B Interactive preview of group contents via axial controller
JP2007142840A (ja) * 2005-11-18 2007-06-07 Canon Inc 情報処理装置及び情報処理方法
US7792678B2 (en) * 2006-02-13 2010-09-07 Hon Hai Precision Industry Co., Ltd. Method and device for enhancing accuracy of voice control with image characteristic
US8207936B2 (en) * 2006-06-30 2012-06-26 Sony Ericsson Mobile Communications Ab Voice remote control
US8060227B2 (en) * 2007-09-10 2011-11-15 Palo Alto Research Center Incorporated Digital media player and method for facilitating social music discovery through sampling, identification, and logging
US8155479B2 (en) * 2008-03-28 2012-04-10 Intuitive Surgical Operations Inc. Automated panning and digital zooming for robotic surgical systems
JP5151644B2 (ja) * 2008-04-16 2013-02-27 ソニー株式会社 リモートコントロールシステム及びリモートコントロール信号処理方法
US20100275122A1 (en) * 2009-04-27 2010-10-28 Microsoft Corporation Click-through controller for mobile interaction
JP5357068B2 (ja) * 2010-01-20 2013-12-04 インターナショナル・ビジネス・マシーンズ・コーポレーション 情報処理装置、情報処理システム、データ・アーカイブ方法およびデータ削除方法
US8928579B2 (en) * 2010-02-22 2015-01-06 Andrew David Wilson Interacting with an omni-directionally projected display
CN101886833B (zh) * 2010-07-22 2012-06-27 慈溪拓赢电器有限公司 一种采用斜拉杆的小型一体式冷热空调机
US9111255B2 (en) * 2010-08-31 2015-08-18 Nokia Technologies Oy Methods, apparatuses and computer program products for determining shared friends of individuals
CN101950244A (zh) * 2010-09-20 2011-01-19 宇龙计算机通信科技(深圳)有限公司 一种用户界面上的内容信息的提示方法及装置
US9316827B2 (en) * 2010-09-20 2016-04-19 Kopin Corporation LifeBoard—series of home pages for head mounted displays (HMD) that respond to head tracking
KR20120068078A (ko) * 2010-10-26 2012-06-27 삼성전자주식회사 영상 처리 장치 및 그의 영상 데이터와 오디오 데이터의 연결 방법
US20120110456A1 (en) * 2010-11-01 2012-05-03 Microsoft Corporation Integrated voice command modal user interface
US8497942B2 (en) * 2011-04-07 2013-07-30 Sony Corporation User interface for audio video display device such as TV
JP5326066B1 (ja) * 2011-10-25 2013-10-30 オリンパスメディカルシステムズ株式会社 内視鏡手術システム
CA2781298C (en) * 2011-11-08 2017-01-03 Research In Motion Limited Improved block zoom on a mobile electronic device
GB2501471A (en) * 2012-04-18 2013-10-30 Barco Nv Electronic conference arrangement
US9152295B2 (en) * 2012-06-05 2015-10-06 Apple Inc. Triage tool for problem reporting in maps
US9367959B2 (en) * 2012-06-05 2016-06-14 Apple Inc. Mapping application with 3D presentation
IL221863A (en) * 2012-09-10 2014-01-30 Elbit Systems Ltd Digital video photography system when analyzing and displaying
US9020825B1 (en) * 2012-09-25 2015-04-28 Rawles Llc Voice gestures
KR20140089847A (ko) * 2013-01-07 2014-07-16 삼성전자주식회사 전자 장치 및 그 제어 방법
US9495266B2 (en) * 2013-05-16 2016-11-15 Advantest Corporation Voice recognition virtual test engineering assistant

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004029933A (ja) * 2002-06-21 2004-01-29 Mitsubishi Heavy Ind Ltd 表示制御装置および表示制御方法
US20100031150A1 (en) * 2005-10-17 2010-02-04 Microsoft Corporation Raising the visibility of a voice-activated user interface
JP2008277903A (ja) * 2007-04-25 2008-11-13 Sony Corp 撮像装置及びフォーカス対象決定方法
JP2009109587A (ja) * 2007-10-26 2009-05-21 Panasonic Electric Works Co Ltd 音声認識制御装置
JP2011035771A (ja) * 2009-08-04 2011-02-17 Olympus Corp 撮像装置、編集装置および撮像システム
JP2011114401A (ja) * 2009-11-24 2011-06-09 Sony Computer Entertainment Inc 画像データ作成支援装置および画像データ作成支援方法
WO2012040107A1 (en) * 2010-09-20 2012-03-29 Kopin Corporation Advanced remote control of host application using motion and voice commands
JP2012103840A (ja) * 2010-11-09 2012-05-31 Sony Corp 情報処理装置、プログラムおよびコマンド生成方法
JP2013037688A (ja) * 2011-08-05 2013-02-21 Samsung Electronics Co Ltd 電子装置及びその制御方法

Cited By (120)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11928604B2 (en) 2005-09-08 2024-03-12 Apple Inc. Method and apparatus for building an intelligent automated assistant
US11671920B2 (en) 2007-04-03 2023-06-06 Apple Inc. Method and system for operating a multifunction portable electronic device using voice-activation
US11900936B2 (en) 2008-10-02 2024-02-13 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
US11348582B2 (en) 2008-10-02 2022-05-31 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
US10741185B2 (en) 2010-01-18 2020-08-11 Apple Inc. Intelligent automated assistant
US11423886B2 (en) 2010-01-18 2022-08-23 Apple Inc. Task flow identification based on user intent
US11120372B2 (en) 2011-06-03 2021-09-14 Apple Inc. Performing actions associated with task items that represent tasks to perform
US11269678B2 (en) 2012-05-15 2022-03-08 Apple Inc. Systems and methods for integrating third party services with a digital assistant
US11321116B2 (en) 2012-05-15 2022-05-03 Apple Inc. Systems and methods for integrating third party services with a digital assistant
US10714117B2 (en) 2013-02-07 2020-07-14 Apple Inc. Voice trigger for a digital assistant
US10978090B2 (en) 2013-02-07 2021-04-13 Apple Inc. Voice trigger for a digital assistant
US11636869B2 (en) 2013-02-07 2023-04-25 Apple Inc. Voice trigger for a digital assistant
US11862186B2 (en) 2013-02-07 2024-01-02 Apple Inc. Voice trigger for a digital assistant
US11557310B2 (en) 2013-02-07 2023-01-17 Apple Inc. Voice trigger for a digital assistant
US11388291B2 (en) 2013-03-14 2022-07-12 Apple Inc. System and method for processing voicemail
US11798547B2 (en) 2013-03-15 2023-10-24 Apple Inc. Voice activated device for use with a voice-based digital assistant
US11727219B2 (en) 2013-06-09 2023-08-15 Apple Inc. System and method for inferring user intent from speech inputs
US10878809B2 (en) 2014-05-30 2020-12-29 Apple Inc. Multi-command single utterance input method
US11257504B2 (en) 2014-05-30 2022-02-22 Apple Inc. Intelligent assistant for home automation
US11133008B2 (en) 2014-05-30 2021-09-28 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US11670289B2 (en) 2014-05-30 2023-06-06 Apple Inc. Multi-command single utterance input method
US11699448B2 (en) 2014-05-30 2023-07-11 Apple Inc. Intelligent assistant for home automation
US11810562B2 (en) 2014-05-30 2023-11-07 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US11516537B2 (en) 2014-06-30 2022-11-29 Apple Inc. Intelligent automated assistant for TV user interactions
US11838579B2 (en) 2014-06-30 2023-12-05 Apple Inc. Intelligent automated assistant for TV user interactions
WO2016132620A1 (ja) * 2015-02-18 2016-08-25 ソニー株式会社 情報処理装置、情報処理方法、及びプログラム
US10528659B2 (en) 2015-02-18 2020-01-07 Sony Corporation Information processing device and information processing method
US11087759B2 (en) 2015-03-08 2021-08-10 Apple Inc. Virtual assistant activation
US10930282B2 (en) 2015-03-08 2021-02-23 Apple Inc. Competing devices responding to voice triggers
US11842734B2 (en) 2015-03-08 2023-12-12 Apple Inc. Virtual assistant activation
US11468282B2 (en) 2015-05-15 2022-10-11 Apple Inc. Virtual assistant in a communication session
US11070949B2 (en) 2015-05-27 2021-07-20 Apple Inc. Systems and methods for proactively identifying and surfacing relevant content on an electronic device with a touch-sensitive display
US11010127B2 (en) 2015-06-29 2021-05-18 Apple Inc. Virtual assistant for media playback
US11947873B2 (en) 2015-06-29 2024-04-02 Apple Inc. Virtual assistant for media playback
US11500672B2 (en) 2015-09-08 2022-11-15 Apple Inc. Distributed personal assistant
US11809483B2 (en) 2015-09-08 2023-11-07 Apple Inc. Intelligent automated assistant for media search and playback
US11550542B2 (en) 2015-09-08 2023-01-10 Apple Inc. Zero latency digital assistant
US11853536B2 (en) 2015-09-08 2023-12-26 Apple Inc. Intelligent automated assistant in a media environment
US11126400B2 (en) 2015-09-08 2021-09-21 Apple Inc. Zero latency digital assistant
US11954405B2 (en) 2015-09-08 2024-04-09 Apple Inc. Zero latency digital assistant
US11809886B2 (en) 2015-11-06 2023-11-07 Apple Inc. Intelligent automated assistant in a messaging environment
US11526368B2 (en) 2015-11-06 2022-12-13 Apple Inc. Intelligent automated assistant in a messaging environment
US11886805B2 (en) 2015-11-09 2024-01-30 Apple Inc. Unconventional virtual assistant interactions
US10942703B2 (en) 2015-12-23 2021-03-09 Apple Inc. Proactive assistance based on dialog communication between devices
US11227589B2 (en) 2016-06-06 2022-01-18 Apple Inc. Intelligent list reading
US11657820B2 (en) 2016-06-10 2023-05-23 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US11037565B2 (en) 2016-06-10 2021-06-15 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10733993B2 (en) 2016-06-10 2020-08-04 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
JP2019522250A (ja) * 2016-06-10 2019-08-08 アップル インコーポレイテッドApple Inc. マルチタスキング環境におけるインテリジェントデジタルアシスタント
JP2019204517A (ja) * 2016-06-10 2019-11-28 アップル インコーポレイテッドApple Inc. マルチタスキング環境におけるインテリジェントデジタルアシスタント
US11749275B2 (en) 2016-06-11 2023-09-05 Apple Inc. Application integration with a digital assistant
US11809783B2 (en) 2016-06-11 2023-11-07 Apple Inc. Intelligent device arbitration and control
US11152002B2 (en) 2016-06-11 2021-10-19 Apple Inc. Application integration with a digital assistant
JP2017102939A (ja) * 2016-12-26 2017-06-08 株式会社プロフィールド オーサリング装置、オーサリング方法、およびプログラム
US11656884B2 (en) 2017-01-09 2023-05-23 Apple Inc. Application integration with a digital assistant
US11210061B2 (en) 2017-03-31 2021-12-28 Brother Kogyo Kabushiki Kaisha Non-transitory computer-readable recording medium storing computer-readable instructions for causing information processing device to execute communication processing with image processing program and voice-recognition program, information processing device, and method of controlling information processing device
JP2018173754A (ja) * 2017-03-31 2018-11-08 ブラザー工業株式会社 情報処理プログラム、情報処理装置、および情報処理装置の制御方法
US10741181B2 (en) 2017-05-09 2020-08-11 Apple Inc. User interface for correcting recognition errors
US11599331B2 (en) 2017-05-11 2023-03-07 Apple Inc. Maintaining privacy of personal information
US11467802B2 (en) 2017-05-11 2022-10-11 Apple Inc. Maintaining privacy of personal information
US11862151B2 (en) 2017-05-12 2024-01-02 Apple Inc. Low-latency intelligent automated assistant
US11837237B2 (en) 2017-05-12 2023-12-05 Apple Inc. User-specific acoustic models
US11380310B2 (en) 2017-05-12 2022-07-05 Apple Inc. Low-latency intelligent automated assistant
US11405466B2 (en) 2017-05-12 2022-08-02 Apple Inc. Synchronization and task delegation of a digital assistant
US11580990B2 (en) 2017-05-12 2023-02-14 Apple Inc. User-specific acoustic models
US11538469B2 (en) 2017-05-12 2022-12-27 Apple Inc. Low-latency intelligent automated assistant
US10909171B2 (en) 2017-05-16 2021-02-02 Apple Inc. Intelligent automated assistant for media exploration
US11532306B2 (en) 2017-05-16 2022-12-20 Apple Inc. Detecting a trigger of a digital assistant
US11675829B2 (en) 2017-05-16 2023-06-13 Apple Inc. Intelligent automated assistant for media exploration
US10748546B2 (en) 2017-05-16 2020-08-18 Apple Inc. Digital assistant services based on device capabilities
US11710482B2 (en) 2018-03-26 2023-07-25 Apple Inc. Natural assistant interaction
US11127398B2 (en) 2018-04-11 2021-09-21 Baidu Online Network Technology (Beijing) Co., Ltd. Method for voice controlling, terminal device, cloud server and system
JP2021073567A (ja) * 2018-04-11 2021-05-13 百度在線網絡技術(北京)有限公司 音声制御方法、端末機器、クラウドサーバ及びシステム
JP2019185733A (ja) * 2018-04-11 2019-10-24 百度在線網絡技術(北京)有限公司 音声制御方法、端末機器、クラウドサーバ及びシステム
US11487364B2 (en) 2018-05-07 2022-11-01 Apple Inc. Raise to speak
US11854539B2 (en) 2018-05-07 2023-12-26 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US11169616B2 (en) 2018-05-07 2021-11-09 Apple Inc. Raise to speak
US11907436B2 (en) 2018-05-07 2024-02-20 Apple Inc. Raise to speak
US11900923B2 (en) 2018-05-07 2024-02-13 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US11009970B2 (en) 2018-06-01 2021-05-18 Apple Inc. Attention aware virtual assistant dismissal
US11630525B2 (en) 2018-06-01 2023-04-18 Apple Inc. Attention aware virtual assistant dismissal
US11360577B2 (en) 2018-06-01 2022-06-14 Apple Inc. Attention aware virtual assistant dismissal
US10984798B2 (en) 2018-06-01 2021-04-20 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
US10720160B2 (en) 2018-06-01 2020-07-21 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
US11431642B2 (en) 2018-06-01 2022-08-30 Apple Inc. Variable latency device coordination
US11010561B2 (en) 2018-09-27 2021-05-18 Apple Inc. Sentiment prediction from textual data
US11893992B2 (en) 2018-09-28 2024-02-06 Apple Inc. Multi-modal inputs for voice commands
US11170166B2 (en) 2018-09-28 2021-11-09 Apple Inc. Neural typographical error modeling via generative adversarial networks
US11462215B2 (en) 2018-09-28 2022-10-04 Apple Inc. Multi-modal inputs for voice commands
US10839159B2 (en) 2018-09-28 2020-11-17 Apple Inc. Named entity normalization in a spoken dialog system
US11475898B2 (en) 2018-10-26 2022-10-18 Apple Inc. Low-latency multi-speaker speech recognition
US11638059B2 (en) 2019-01-04 2023-04-25 Apple Inc. Content playback on multiple devices
US11783815B2 (en) 2019-03-18 2023-10-10 Apple Inc. Multimodality in digital assistant systems
US11348573B2 (en) 2019-03-18 2022-05-31 Apple Inc. Multimodality in digital assistant systems
US11423908B2 (en) 2019-05-06 2022-08-23 Apple Inc. Interpreting spoken requests
US11475884B2 (en) 2019-05-06 2022-10-18 Apple Inc. Reducing digital assistant latency when a language is incorrectly determined
US11705130B2 (en) 2019-05-06 2023-07-18 Apple Inc. Spoken notifications
US11675491B2 (en) 2019-05-06 2023-06-13 Apple Inc. User configurable task triggers
US11307752B2 (en) 2019-05-06 2022-04-19 Apple Inc. User configurable task triggers
US11217251B2 (en) 2019-05-06 2022-01-04 Apple Inc. Spoken notifications
US11140099B2 (en) 2019-05-21 2021-10-05 Apple Inc. Providing message response suggestions
US11888791B2 (en) 2019-05-21 2024-01-30 Apple Inc. Providing message response suggestions
US11360739B2 (en) 2019-05-31 2022-06-14 Apple Inc. User activity shortcut suggestions
US11496600B2 (en) 2019-05-31 2022-11-08 Apple Inc. Remote execution of machine-learned models
US11237797B2 (en) 2019-05-31 2022-02-01 Apple Inc. User activity shortcut suggestions
US11289073B2 (en) 2019-05-31 2022-03-29 Apple Inc. Device text to speech
US11657813B2 (en) 2019-05-31 2023-05-23 Apple Inc. Voice identification in digital assistant systems
US11360641B2 (en) 2019-06-01 2022-06-14 Apple Inc. Increasing the relevance of new available information
US11790914B2 (en) 2019-06-01 2023-10-17 Apple Inc. Methods and user interfaces for voice-based control of electronic devices
US11488406B2 (en) 2019-09-25 2022-11-01 Apple Inc. Text detection using global geometry estimators
WO2021220769A1 (ja) * 2020-04-27 2021-11-04 ソニーグループ株式会社 情報処理装置及び情報処理方法
US11914848B2 (en) 2020-05-11 2024-02-27 Apple Inc. Providing relevant data items based on context
US11765209B2 (en) 2020-05-11 2023-09-19 Apple Inc. Digital assistant hardware abstraction
US11924254B2 (en) 2020-05-11 2024-03-05 Apple Inc. Digital assistant hardware abstraction
US11755276B2 (en) 2020-05-12 2023-09-12 Apple Inc. Reducing description length based on confidence
US11838734B2 (en) 2020-07-20 2023-12-05 Apple Inc. Multi-device audio adjustment coordination
US11750962B2 (en) 2020-07-21 2023-09-05 Apple Inc. User identification using headphones
US11696060B2 (en) 2020-07-21 2023-07-04 Apple Inc. User identification using headphones
US11979836B2 (en) 2023-04-26 2024-05-07 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation

Also Published As

Publication number Publication date
EP2824564A1 (en) 2015-01-14
US20190012140A1 (en) 2019-01-10
US10725734B2 (en) 2020-07-28
US20150019974A1 (en) 2015-01-15
CN104281259A (zh) 2015-01-14
CN104281259B (zh) 2018-12-25
EP2824564B1 (en) 2020-02-05
JP6102588B2 (ja) 2017-03-29

Similar Documents

Publication Publication Date Title
JP6102588B2 (ja) 情報処理装置、情報処理方法およびプログラム
JP7410893B2 (ja) ユーザインタフェースにおけるナビゲートのためのカラムインタフェース
CN106502638B (zh) 用于提供视听反馈的设备、方法和图形用户界面
US10684754B2 (en) Method of providing visual sound image and electronic device implementing the same
JP6337907B2 (ja) 表示制御装置、表示制御方法およびプログラム
JP2016524423A (ja) ユーザ選択関心領域を超解像するためのシステムおよび方法
JPWO2014162659A1 (ja) 表示制御装置、表示制御方法および表示制御プログラム
JP2008084110A (ja) 情報表示装置、情報表示方法及び情報表示プログラム
JP6149862B2 (ja) 表示制御装置、表示制御システムおよび表示制御方法
US20190012129A1 (en) Display apparatus and method for controlling display apparatus
WO2016152200A1 (ja) 情報処理システムおよび情報処理方法
US9607651B2 (en) Method and apparatus for controlling contents in electronic device
JP5748279B2 (ja) 視聴対象出力装置、および視聴対象出力装置の動作方法
JP2013097535A (ja) 電子機器および表示制御方法
CN110109730A (zh) 用于提供视听反馈的设备、方法和图形用户界面
US20160132478A1 (en) Method of displaying memo and device therefor
WO2021044601A1 (ja) アプリケーション拡張プログラム、情報処理装置、および方法
JP5752759B2 (ja) 電子機器、方法、およびプログラム
US20170092334A1 (en) Electronic device and method for visualizing audio data
US11978252B2 (en) Communication system, display apparatus, and display control method
US20220114367A1 (en) Communication system, display apparatus, and display control method
TWI411952B (zh) 文件檔案內容之縮放顯示系統及其方法
US20140195014A1 (en) Electronic apparatus and method for controlling electronic apparatus
WO2014041851A1 (ja) 情報処理装置
JP2023055000A (ja) 携帯端末、情報処理方法及び情報処理プログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20151217

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20151217

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160914

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160920

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20161115

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170131

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170213

R151 Written notification of patent or utility model registration

Ref document number: 6102588

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250