JPWO2016088410A1 - 情報処理装置、情報処理方法およびプログラム - Google Patents
情報処理装置、情報処理方法およびプログラム Download PDFInfo
- Publication number
- JPWO2016088410A1 JPWO2016088410A1 JP2016562324A JP2016562324A JPWO2016088410A1 JP WO2016088410 A1 JPWO2016088410 A1 JP WO2016088410A1 JP 2016562324 A JP2016562324 A JP 2016562324A JP 2016562324 A JP2016562324 A JP 2016562324A JP WO2016088410 A1 JPWO2016088410 A1 JP WO2016088410A1
- Authority
- JP
- Japan
- Prior art keywords
- display
- volume
- information processing
- voice
- processing apparatus
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 112
- 238000003672 processing method Methods 0.000 title claims description 5
- 238000000034 method Methods 0.000 abstract description 10
- 238000004891 communication Methods 0.000 description 17
- 238000010586 diagram Methods 0.000 description 15
- 230000006870 function Effects 0.000 description 15
- 238000012986 modification Methods 0.000 description 15
- 230000004048 modification Effects 0.000 description 15
- 238000003384 imaging method Methods 0.000 description 7
- 230000000694 effects Effects 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 5
- 238000001514 detection method Methods 0.000 description 3
- 239000011521 glass Substances 0.000 description 3
- 239000004065 semiconductor Substances 0.000 description 3
- 239000000470 constituent Substances 0.000 description 2
- 238000005401 electroluminescence Methods 0.000 description 2
- 230000001151 other effect Effects 0.000 description 2
- 125000002066 L-histidyl group Chemical group [H]N1C([H])=NC(C([H])([H])[C@](C(=O)[*])([H])N([H])[H])=C1[H] 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 229910044991 metal oxide Inorganic materials 0.000 description 1
- 150000004706 metal oxides Chemical class 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/14—Digital output to display device ; Cooperation and interconnection of the display device with other functional units
- G06F3/1423—Digital output to display device ; Cooperation and interconnection of the display device with other functional units controlling a plurality of local displays, e.g. CRT and flat panel display
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/27—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/90—Arrangement of cameras or camera modules, e.g. multiple cameras in TV studios or sports stadiums
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Signal Processing (AREA)
- General Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
Description
1.本開示の実施形態
1.1.システム構成例
1.2.機能構成例
1.3.第1の動きオブジェクトの表示
1.4.認識可能音量の設定
1.5.第2の動きオブジェクトの表示
1.6.動作例
1.7.表示形態の変形例
1.8.ハードウェア構成例
2.むすび
[1.1.システム構成例]
まず、図面を参照しながら本開示の実施形態に係る情報処理システム10の構成例について説明する。図1は、本開示の実施形態に係る情報処理システム10の構成例を示す図である。図1に示したように、本開示の実施形態に係る情報処理システム10は、画像入力部110と、操作入力部115と、音声入力部120と、表示部130とを備える。情報処理システム10は、ユーザU(以下、単に「ユーザ」とも言う。)によって発せられた音声に対して音声認識を行うことが可能である。
続いて、本開示の実施形態に係る情報処理システム10の機能構成例について説明する。図2は、本開示の実施形態に係る情報処理システム10の機能構成例を示すブロック図である。図2に示したように、本開示の実施形態に係る情報処理システム10は、画像入力部110と、操作入力部115と、音声入力部120と、表示部130と、情報処理装置140(以下、「制御部140」とも言う。)と、を備える。
まず、音声認識開始オブジェクト(不図示)を選択する操作が操作検出部143によって検出されると、音声認識部145によって入力音声に対する音声認識が開始される。図3は、表示部130によって表示される画面の例を示す図である。図3を参照すると、表示制御部146は、音声認識キャンセル操作オブジェクトBu1と音声認識終了操作オブジェクトBu2と表示オブジェクトSbとを表示させている。音声認識キャンセル操作オブジェクトBu1は、音声認識を取り消す操作の入力を受け付けるためのオブジェクトである。音声認識終了操作オブジェクトBu2は、音声認識を終了する操作の入力を受け付けるためのオブジェクトである。
続いて、認識可能音量について詳細に説明する。上記した認識可能音量は、常に一定とは限らずにノイズ音量に基づいて変化することが考えられる。図5〜図7は、認識可能音量について説明するための図である。例えば、図5に示すように、ノイズ音量平均値N_aveが所定の下限値(以下、「ノイズ音量下限値」とも言う。)N_minを下回る場合、認識可能音量V_ableは変化しないと考えられる。そこで、判定部144は、ノイズ音量平均値N_aveがノイズ音量下限値N_minを下回る場合、認識可能音量V_ableに規定値V_able_minを設定してよい。なお、ノイズ音量平均値N_aveの代わりにノイズ音量自体が用いられてもよい。
上記のようにして第1の動きオブジェクトMuが表示されれば、音声認識が可能な音量で発話がなされていることをユーザに把握させることが可能となる。一方、音声認識が可能な音量で発話がなされていたとしても、ノイズによって音声認識が妨害される可能性もある。そこで、ノイズの存在をユーザに把握させることが有効である。図8は、表示部130によって表示される画面の他の例を示す図である。図8を参照すると、ノイズ音源Ns1、Ns2が存在している。ここでは、ノイズ音源が2つ存在する場合を説明するが、ノイズ音源の数は限定されない。
続いて、本開示の実施形態に係る情報処理システム10の動作の流れについて説明する。図10Aおよび図10Bは、本開示の実施形態に係る情報処理システム10の動作の流れの例を示すフローチャートである。なお、図10Aおよび図10Bのフローチャートは、本開示の実施形態に係る情報処理システム10の動作の流れの例に過ぎないため、本開示の実施形態に係る情報処理システム10の動作の流れは、図10Aおよび図10Bのフローチャートに示された例に限定されない。
上記においては、表示部130がテーブルTblの天面に画面を投影することが可能なプロジェクタである例について説明した。しかし、表示部130による表示形態は、かかる例に限定されない。以下では、表示部130による表示形態の変形例について説明する。図11は、表示部130による表示形態の変形例1を示す図である。図11に示すように、情報処理システム10が携帯端末である場合に、表示部130は、携帯端末に備わっていてもよい。携帯端末の種類は特に限定されず、タブレット端末であってもよいし、スマートフォンであってもよいし、携帯電話であってもよい。
次に、図16を参照して、本開示の実施形態に係る情報処理システム10のハードウェア構成について説明する。図16は、本開示の実施形態に係る情報処理システム10のハードウェア構成例を示すブロック図である。
Drive)などの磁気記憶部デバイス、半導体記憶デバイス、光記憶デバイス、または光磁気記憶デバイスなどにより構成される。このストレージ装置919は、CPU901が実行するプログラムや各種データ、および外部から取得した各種のデータなどを格納する。
以上説明したように、本開示の実施形態によれば、入力音声に基づいてユーザ発話音量を判定する判定部144と、表示オブジェクトSbが表示部130によって表示されるように表示部130を制御する表示制御部146と、を備え、表示制御部146は、ユーザ発話音量が音声認識可能音量を超えている場合に、表示オブジェクトSbに向かって移動する第1の動きオブジェクトを表示部130に表示させる、情報処理装置140が提供される。
(1)
入力音声に基づいてユーザ発話音量を判定する判定部と、
表示オブジェクトが表示部によって表示されるように前記表示部を制御する表示制御部と、を備え、
前記表示制御部は、前記ユーザ発話音量が音声認識可能音量を超えている場合に、前記表示オブジェクトに向かって移動する第1の動きオブジェクトを前記表示部に表示させる、
情報処理装置。
(2)
前記判定部は、ユーザによる発話音声の音源方向を判定し、
前記表示制御部は、前記ユーザによる発話音声の音源方向に基づいて前記第1の動きオブジェクトを前記表示部に表示させる、
前記(1)に記載の情報処理装置。
(3)
前記情報処理装置は、前記ユーザによる発話音声の音源方向からの入力音声に対して音声認識を行うことにより認識文字列を取得する音声認識部を備える、
前記(2)に記載の情報処理装置。
(4)
前記表示制御部は、前記認識文字列を前記表示部に表示させる、
前記(3)に記載の情報処理装置。
(5)
前記判定部は、前記入力音声に基づいてノイズ音量を判定し、
前記表示制御部は、前記ノイズ音量が前記音声認識可能音量を超えている場合に、前記第1の動きオブジェクトとは異なる第2の動きオブジェクトを前記表示部に表示させる、
前記(1)〜(4)のいずれか一項に記載の情報処理装置。
(6)
前記判定部は、ノイズ音源方向を判定し、
前記表示制御部は、前記ノイズ音源方向に基づいて前記第2の動きオブジェクトを前記表示部に表示させる、
前記(5)に記載の情報処理装置。
(7)
前記第2の動きオブジェクトは、前記表示オブジェクトへの移動がブロックされるように移動する、
前記(6)に記載の情報処理装置。
(8)
前記表示制御部は、前記入力音声に応じた所定の情報に基づいて前記第1の動きオブジェクトに関するパラメータを制御する、
前記(1)〜(7)のいずれか一項に記載の情報処理装置。
(9)
前記第1の動きオブジェクトに関するパラメータは、前記第1の動きオブジェクトのサイズ、形状、色および移動速度のうち、少なくともいずれか一つを含む、
前記(8)に記載の情報処理装置。
(10)
前記入力音声に応じた所定の情報は、前記ユーザ発話音量、前記入力音声の周波数、認識文字列の取得速度、前記入力音声から抽出される特徴量および前記入力音声から識別されるユーザのうち、少なくともいずれか一つを含む、
前記(8)または(9)に記載の情報処理装置。
(11)
前記判定部は、閾値を超える大きさの音量で入力された音声の到来方向に基づいて前記ユーザによる発話音声の音源方向を判定する、
前記(2)に記載の情報処理装置。
(12)
前記判定部は、最も大きな音量で入力された音声の到来方向に基づいて前記ユーザによる発話音声の音源方向を判定する、
前記(2)に記載の情報処理装置。
(13)
前記判定部は、指先から指の根元への方向に基づいて前記ユーザによる発話音声の音源方向を判定する、
前記(2)に記載の情報処理装置。
(14)
前記判定部は、前記ノイズ音量が下限値を下回る場合には、前記音声認識可能音量に規定値を設定する、
前記(6)に記載の情報処理装置。
(15)
前記判定部は、前記ノイズ音量が下限値を上回る場合には、前記音声認識可能音量に前記ノイズ音量の平均値に応じた音量または前記ノイズ音量に応じた音量を設定する、
前記(6)に記載の情報処理装置。
(16)
前記表示制御部は、前記表示オブジェクトに対応する物体を撮像画像から認識した場合に、前記表示オブジェクトを前記表示部に表示させる、
前記(1)〜(15)のいずれか一項に記載の情報処理装置。
(17)
前記表示制御部は、前記ユーザ発話音量が音声認識可能音量を超えている場合に、手前から奥に移動するような表現を伴って前記表示オブジェクトに向かって移動する前記第1の動きオブジェクトを前記表示部に表示させる、
前記(1)〜(16)のいずれか一項に記載の情報処理装置。
(18)
前記表示制御部は、仮想オブジェクトを前記表示部に表示させ、前記仮想オブジェクトに含まれる所定のオブジェクトを前記表示オブジェクトとして前記表示部に表示させる、
前記(1)〜(17)のいずれか一項に記載の情報処理装置。
(19)
入力音声に基づいてユーザ発話音量を判定することと、
表示オブジェクトが表示部によって表示されるように前記表示部を制御することと、を含み、
前記ユーザ発話音量が音声認識可能音量を超えている場合に、前記表示オブジェクトに向かって移動する第1の動きオブジェクトを前記表示部に表示させることを含む、
情報処理方法。
(20)
コンピュータを、
入力音声に基づいてユーザ発話音量を判定する判定部と、
表示オブジェクトが表示部によって表示されるように前記表示部を制御する表示制御部と、を備え、
前記表示制御部は、前記ユーザ発話音量が音声認識可能音量を超えている場合に、前記表示オブジェクトに向かって移動する第1の動きオブジェクトを前記表示部に表示させる、
情報処理装置として機能させるためのプログラム。
110 画像入力部
115 操作入力部
120 音声入力部
130 表示部
140 情報処理装置(制御部)
141 入力画像取得部
142 入力音声取得部
143 操作検出部
144 判定部
145 音声認識部
146 表示制御部
Mu 第1の動きオブジェクト
Mn、Mn1、Mn2 第2の動きオブジェクト
Ns、Ns2、Ns1 ノイズ音源
Du ユーザによる発話音声の音源方向
Dn、Dn1、Dn2 ノイズ音源方向
Sb 表示オブジェクト
Claims (20)
- 入力音声に基づいてユーザ発話音量を判定する判定部と、
表示オブジェクトが表示部によって表示されるように前記表示部を制御する表示制御部と、を備え、
前記表示制御部は、前記ユーザ発話音量が音声認識可能音量を超えている場合に、前記表示オブジェクトに向かって移動する第1の動きオブジェクトを前記表示部に表示させる、
情報処理装置。 - 前記判定部は、ユーザによる発話音声の音源方向を判定し、
前記表示制御部は、前記ユーザによる発話音声の音源方向に基づいて前記第1の動きオブジェクトを前記表示部に表示させる、
請求項1に記載の情報処理装置。 - 前記情報処理装置は、前記ユーザによる発話音声の音源方向からの入力音声に対して音声認識を行うことにより認識文字列を取得する音声認識部を備える、
請求項2に記載の情報処理装置。 - 前記表示制御部は、前記認識文字列を前記表示部に表示させる、
請求項3に記載の情報処理装置。 - 前記判定部は、前記入力音声に基づいてノイズ音量を判定し、
前記表示制御部は、前記ノイズ音量が前記音声認識可能音量を超えている場合に、前記第1の動きオブジェクトとは異なる第2の動きオブジェクトを前記表示部に表示させる、
請求項1に記載の情報処理装置。 - 前記判定部は、ノイズ音源方向を判定し、
前記表示制御部は、前記ノイズ音源方向に基づいて前記第2の動きオブジェクトを前記表示部に表示させる、
請求項5に記載の情報処理装置。 - 前記第2の動きオブジェクトは、前記表示オブジェクトへの移動がブロックされるように移動する、
請求項6に記載の情報処理装置。 - 前記表示制御部は、前記入力音声に応じた所定の情報に基づいて前記第1の動きオブジェクトに関するパラメータを制御する、
請求項1に記載の情報処理装置。 - 前記第1の動きオブジェクトに関するパラメータは、前記第1の動きオブジェクトのサイズ、形状、色および移動速度のうち、少なくともいずれか一つを含む、
請求項8に記載の情報処理装置。 - 前記入力音声に応じた所定の情報は、前記ユーザ発話音量、前記入力音声の周波数、認識文字列の取得速度、前記入力音声から抽出される特徴量および前記入力音声から識別されるユーザのうち、少なくともいずれか一つを含む、
請求項8に記載の情報処理装置。 - 前記判定部は、閾値を超える大きさの音量で入力された音声の到来方向に基づいて前記ユーザによる発話音声の音源方向を判定する、
請求項2に記載の情報処理装置。 - 前記判定部は、最も大きな音量で入力された音声の到来方向に基づいて前記ユーザによる発話音声の音源方向を判定する、
請求項2に記載の情報処理装置。 - 前記判定部は、指先から指の根元への方向に基づいて前記ユーザによる発話音声の音源方向を判定する、
請求項2に記載の情報処理装置。 - 前記判定部は、前記ノイズ音量が下限値を下回る場合には、前記音声認識可能音量に規定値を設定する、
請求項6に記載の情報処理装置。 - 前記判定部は、前記ノイズ音量が下限値を上回る場合には、前記音声認識可能音量に前記ノイズ音量の平均値に応じた音量または前記ノイズ音量に応じた音量を設定する、
請求項6に記載の情報処理装置。 - 前記表示制御部は、前記表示オブジェクトに対応する物体を撮像画像から認識した場合に、前記表示オブジェクトを前記表示部に表示させる、
請求項1に記載の情報処理装置。 - 前記表示制御部は、前記ユーザ発話音量が音声認識可能音量を超えている場合に、手前から奥に移動するような表現を伴って前記表示オブジェクトに向かって移動する前記第1の動きオブジェクトを前記表示部に表示させる、
請求項1に記載の情報処理装置。 - 前記表示制御部は、仮想オブジェクトを前記表示部に表示させ、前記仮想オブジェクトに含まれる所定のオブジェクトを前記表示オブジェクトとして前記表示部に表示させる、
請求項1に記載の情報処理装置。 - 入力音声に基づいてユーザ発話音量を判定することと、
表示オブジェクトが表示部によって表示されるように前記表示部を制御することと、を含み、
前記ユーザ発話音量が音声認識可能音量を超えている場合に、前記表示オブジェクトに向かって移動する第1の動きオブジェクトを前記表示部に表示させることを含む、
情報処理方法。 - コンピュータを、
入力音声に基づいてユーザ発話音量を判定する判定部と、
表示オブジェクトが表示部によって表示されるように前記表示部を制御する表示制御部と、を備え、
前記表示制御部は、前記ユーザ発話音量が音声認識可能音量を超えている場合に、前記表示オブジェクトに向かって移動する第1の動きオブジェクトを前記表示部に表示させる、
情報処理装置として機能させるためのプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014243906 | 2014-12-02 | ||
JP2014243906 | 2014-12-02 | ||
PCT/JP2015/073488 WO2016088410A1 (ja) | 2014-12-02 | 2015-08-21 | 情報処理装置、情報処理方法およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2016088410A1 true JPWO2016088410A1 (ja) | 2017-09-14 |
JP6627775B2 JP6627775B2 (ja) | 2020-01-08 |
Family
ID=56091368
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016562324A Active JP6627775B2 (ja) | 2014-12-02 | 2015-08-21 | 情報処理装置、情報処理方法およびプログラム |
Country Status (5)
Country | Link |
---|---|
US (1) | US10642575B2 (ja) |
EP (1) | EP3229128A4 (ja) |
JP (1) | JP6627775B2 (ja) |
CN (1) | CN107148614B (ja) |
WO (1) | WO2016088410A1 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019146032A1 (ja) * | 2018-01-25 | 2019-08-01 | 三菱電機株式会社 | ジェスチャー操作装置およびジェスチャー操作方法 |
JP7250547B2 (ja) * | 2019-02-05 | 2023-04-03 | 本田技研工業株式会社 | エージェントシステム、情報処理装置、情報処理方法、およびプログラム |
JP7169921B2 (ja) * | 2019-03-27 | 2022-11-11 | 本田技研工業株式会社 | エージェント装置、エージェントシステム、エージェント装置の制御方法、およびプログラム |
CN111265851B (zh) * | 2020-02-05 | 2023-07-04 | 腾讯科技(深圳)有限公司 | 数据处理方法、装置、电子设备及存储介质 |
CN113934289A (zh) * | 2020-06-29 | 2022-01-14 | 北京字节跳动网络技术有限公司 | 数据处理方法、装置、可读介质及电子设备 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11352995A (ja) * | 1998-06-08 | 1999-12-24 | Toshiba Tec Corp | 音声認識装置 |
JP2000000377A (ja) * | 1998-06-12 | 2000-01-07 | Umbrella:Kk | 音声入力式ヒューマンインタフェースに特徴を有するビデオゲーム機およびプログラム記録媒体 |
JP2001079265A (ja) * | 1999-09-14 | 2001-03-27 | Sega Corp | ゲーム装置 |
JP2006227499A (ja) * | 2005-02-21 | 2006-08-31 | Toyota Motor Corp | 音声認識装置 |
JP2007329702A (ja) * | 2006-06-08 | 2007-12-20 | Toyota Motor Corp | 受音装置と音声認識装置とそれらを搭載している可動体 |
JP2011227199A (ja) * | 2010-04-16 | 2011-11-10 | Nec Casio Mobile Communications Ltd | 雑音抑圧装置、雑音抑圧方法及びプログラム |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7096185B2 (en) * | 2000-03-31 | 2006-08-22 | United Video Properties, Inc. | User speech interfaces for interactive media guidance applications |
US7023498B2 (en) * | 2001-11-19 | 2006-04-04 | Matsushita Electric Industrial Co. Ltd. | Remote-controlled apparatus, a remote control system, and a remote-controlled image-processing apparatus |
US7260538B2 (en) * | 2002-01-08 | 2007-08-21 | Promptu Systems Corporation | Method and apparatus for voice control of a television control device |
JP2007142840A (ja) * | 2005-11-18 | 2007-06-07 | Canon Inc | 情報処理装置及び情報処理方法 |
JP4887911B2 (ja) * | 2006-05-31 | 2012-02-29 | 船井電機株式会社 | 電子機器 |
US8175885B2 (en) * | 2007-07-23 | 2012-05-08 | Verizon Patent And Licensing Inc. | Controlling a set-top box via remote speech recognition |
WO2012169679A1 (ko) | 2011-06-10 | 2012-12-13 | 엘지전자 주식회사 | 디스플레이 장치, 디스플레이 장치의 제어 방법 및 디스플레이 장치의 음성인식 시스템 |
US9563265B2 (en) | 2012-01-12 | 2017-02-07 | Qualcomm Incorporated | Augmented reality with sound and geometric analysis |
US8793136B2 (en) * | 2012-02-17 | 2014-07-29 | Lg Electronics Inc. | Method and apparatus for smart voice recognition |
US9020825B1 (en) * | 2012-09-25 | 2015-04-28 | Rawles Llc | Voice gestures |
CN108491182A (zh) | 2013-03-29 | 2018-09-04 | 联想(北京)有限公司 | 一种信息处理方法以及一种电子设备 |
JP2014203207A (ja) | 2013-04-03 | 2014-10-27 | ソニー株式会社 | 情報処理装置、情報処理方法及びコンピュータプログラム |
-
2015
- 2015-08-21 US US15/521,322 patent/US10642575B2/en active Active
- 2015-08-21 JP JP2016562324A patent/JP6627775B2/ja active Active
- 2015-08-21 CN CN201580057995.8A patent/CN107148614B/zh not_active Expired - Fee Related
- 2015-08-21 WO PCT/JP2015/073488 patent/WO2016088410A1/ja active Application Filing
- 2015-08-21 EP EP15866106.6A patent/EP3229128A4/en not_active Withdrawn
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11352995A (ja) * | 1998-06-08 | 1999-12-24 | Toshiba Tec Corp | 音声認識装置 |
JP2000000377A (ja) * | 1998-06-12 | 2000-01-07 | Umbrella:Kk | 音声入力式ヒューマンインタフェースに特徴を有するビデオゲーム機およびプログラム記録媒体 |
JP2001079265A (ja) * | 1999-09-14 | 2001-03-27 | Sega Corp | ゲーム装置 |
JP2006227499A (ja) * | 2005-02-21 | 2006-08-31 | Toyota Motor Corp | 音声認識装置 |
JP2007329702A (ja) * | 2006-06-08 | 2007-12-20 | Toyota Motor Corp | 受音装置と音声認識装置とそれらを搭載している可動体 |
JP2011227199A (ja) * | 2010-04-16 | 2011-11-10 | Nec Casio Mobile Communications Ltd | 雑音抑圧装置、雑音抑圧方法及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
EP3229128A4 (en) | 2018-05-30 |
WO2016088410A1 (ja) | 2016-06-09 |
US20180150279A1 (en) | 2018-05-31 |
US10642575B2 (en) | 2020-05-05 |
CN107148614A (zh) | 2017-09-08 |
CN107148614B (zh) | 2020-09-08 |
JP6627775B2 (ja) | 2020-01-08 |
EP3229128A1 (en) | 2017-10-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10546582B2 (en) | Information processing device, method of information processing, and program | |
JP6729555B2 (ja) | 情報処理システムおよび情報処理方法 | |
JP6627775B2 (ja) | 情報処理装置、情報処理方法およびプログラム | |
US11373650B2 (en) | Information processing device and information processing method | |
US10962738B2 (en) | Information processing apparatus and information processing method to calibrate line-of-sight of a user | |
WO2018139036A1 (ja) | 情報処理装置、情報処理方法およびプログラム | |
JP6575518B2 (ja) | 表示制御装置、表示制御方法およびプログラム | |
US20180063283A1 (en) | Information processing apparatus, information processing method, and program | |
JP2016109726A (ja) | 情報処理装置、情報処理方法およびプログラム | |
WO2019021566A1 (ja) | 情報処理装置、情報処理方法、及びプログラム | |
JP2016156877A (ja) | 情報処理装置、情報処理方法およびプログラム | |
WO2019054037A1 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
JP2016180778A (ja) | 情報処理システムおよび情報処理方法 | |
US20200342229A1 (en) | Information processing device, information processing method, and program | |
WO2019187593A1 (ja) | 情報処理装置、情報処理方法およびプログラム | |
JP2016170584A (ja) | 情報処理装置、情報処理方法およびプログラム | |
JP7078036B2 (ja) | 情報処理装置、情報処理方法およびプログラム | |
US10855639B2 (en) | Information processing apparatus and information processing method for selection of a target user | |
WO2019026392A1 (ja) | 情報処理装置、情報処理方法、およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180625 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20190208 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20190214 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20190222 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190416 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20190425 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20190522 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190614 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20191105 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20191118 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6627775 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |