JP2003223188A - 音声入力システム、音声入力方法及び音声入力プログラム - Google Patents
音声入力システム、音声入力方法及び音声入力プログラムInfo
- Publication number
- JP2003223188A JP2003223188A JP2002019457A JP2002019457A JP2003223188A JP 2003223188 A JP2003223188 A JP 2003223188A JP 2002019457 A JP2002019457 A JP 2002019457A JP 2002019457 A JP2002019457 A JP 2002019457A JP 2003223188 A JP2003223188 A JP 2003223188A
- Authority
- JP
- Japan
- Prior art keywords
- voice input
- voice
- information
- input device
- network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Abstract
る場合にユーザに負担をかけずに発声に対する処理をき
めることができる音声入力システム、音声入力方法及び
そのプログラムを提供する。 【解決手段】複数の音声入力装置がネットワークを通し
て接続されており、これら音声入力装置同士が情報の授
受を行い、音声が入力された場合には決めておいた情報
を他の音声入力装置に送り、各音声入力装置は自装置で
の音声の処理結果と他の音声入力装置の処理結果から、
その音声に対する処理の判断を行うようにすることでユ
ーザに負担をかけずに音声入力への処理を行うことを可
能とする。
Description
関するものであり、特にユーザの発声が複数の音声入力
に入りうる場合の音声入力システム、音声入力方法及び
音声入力プログラムに関する。
場合や、音声をある機器に入力する場合にはユーザと音
声入力機器は1対1で対応していることを主に想定して
いた。しかしながら、例えば一つの部屋に複数の音声入
力装置がある場合などユーザの発声が複数の音声入力装
置に入ってしまうことは十分あり得る。その場合に従来
は、ユーザが特に対象機器を指定したり、音声入力しよ
うと思っている機器以外に対しては音声入力を抑制する
ような操作を行ったりする必要があった。
担をかけずにユーザの発声を入力したい音声入力装置に
入力する音声入力システム、音声入力方法及び音声入力
プログラムを提供することを目的とする。
ムは複数の音声入力装置がネットワークに接続され、前
記ネットワークに接続された各々の音声入力装置におい
て入力される音声情報をそれぞれ検知し、前記ネットワ
ークに接続された各々の音声入力装置で前記検知した前
記音声情報を必要に応じて処理したものである音声に関
する情報を判断情報として前記ネットワークを介して他
の音声入力装置に授受し、前記ネットワークに接続され
た各々の音声入力装置が自音声入力装置と他の音声入力
装置における前記判断情報をもとに前記音声情報に対す
る処理の決定及び実行の判断を行うことを特徴とするも
のである。
クに接続された複数の音声入力装置において入力される
音声情報をそれぞれ検知するステップと、前記ネットワ
ークに接続された各々の音声入力装置で前記検知した前
記音声に関する情報を判断情報として前記ネットワーク
を介して他の音声入力装置に授受するステップと、前記
ネットワークに接続された各々の音声入力装置が自音声
入力装置と他の音声入力装置における前記判断情報をも
とに前記音声情報に対する処理の決定及び実行の判断を
行うステップとを含むことを特徴とするものである。
トワークに接続された複数の音声入力装置において入力
される音声情報をそれぞれ検知し、前記ネットワークに
接続された各々の音声入力装置で前記検知した前記音声
に関する情報を判断情報として前記ネットワークを介し
て他の音声入力装置に授受し、前記ネットワークに接続
された各々の音声入力装置が自音声入力装置と他の音声
入力装置における前記判断情報をもとに前記音声情報に
対する処理の決定及び実行の判断を行う機能を実現する
ことを特徴とするものである。
による音声入力システムについて説明する。はじめに、
本発明の全体の概要を図1を用いて説明する。
ーク104に複数の単体の音声入力装置101や音声入力装置
102を有した機器103、例えばビデオテープレコーダが接
続され、これらの単体の音声入力装置101や機器103に搭
載された音声入力装置102によりユーザの発声する音声
命令や伝言のメッセージあるいは会話等を計測し、入力
された音声信号を信号処理手段によって適当な信号に変
換する。そしてこの変換された信号から音声入力システ
ムは入力された音声に対する処理を単体の音声入力装置
101や機器103に搭載された音声入力装置102で行うこと
ができる。
載された音声入力装置102はネットワーク104を介して情
報の授受が可能となっており、入力された音声に対する
処理として、ネットワーク上の他の単体の音声入力装置
や機器に搭載された音声入力装置と情報の送受信ができ
る。
ついては情報が一つ一つの各音声入力装置に移っていく
ようなリレー方式でも、一つの音声入力装置から同時に
複数の音声入力装置に送るようなブロードキャスト方式
でも構わないが、音声という実時間処理が重要な用途で
あるので以降はブロードキャスト方式を念頭に置いて説
明する。
数の音声入力装置に入力された場合に、各音声入力装置
での処理をどうするかという点が本発明によって解決す
る所である。また、ユーザの発声が単一の音声入力装置
にしか入力されなかった場合でも本発明の処理で包含す
ることができる。
声という人間の発声を主に例に挙げて説明しているが、
本発明は人間の音声に限定されたものではない。目的に
応じて機械の動作音や動物の声でも、音声であれば構わ
ないものとする。
ムを構成する音声入力装置について図2を用いて説明す
る。音声入力装置(20-1〜20-3)はそれぞれネットワー
ク21に接続されており、音声入力装置20-1はビデオデー
プレコーダ(以下ビデオとする)26に搭載され、音声入
力装置20-3はエアーコンディショナー(以下エアコンと
する)27に搭載され、また、音声入力装置20-2は単体で
接続されている。音声入力装置20-1に入力された音声に
よりビデオ26の操作を行い、音声入力装置20-3に入力さ
れた音声によりエアコン27の操作を行う。なお、後述す
るように自分の音声入力装置への音声でなくとも、各機
器は音声入力への処理を行うことができる。
マイクロホン201、信号処理部202、中央処理部203、記
憶部204、ネットワーク接続部205、情報表出部206から
構成される。
201に入力され、このマイクロホン201でユーザの発声を
計測する。これは一般にあるマイクロホンで実用可能で
ある。このマイクロホンは、単一のマイクロホンや複数
のマイクロホン(マイクロホンアレイ)、指向性・無指
向性マイクロホンなど、マイクロホンとして使えるもの
から構成できるものとする。
信号処理部202で後段の処理に必要な形式に処理され
る。この処理は例えば音声信号のMPEGによる圧縮や、音
声認識で用いられるケプストラム特徴に変換する処理な
どが考えられる。なお、この信号処理部202はその他に
も音声入力装置の用途に応じて適当な処理を実行できる
ように構成できるものとする。
る中央処理部203からの命令を受けて情報表出部206に伝
える形式に変換する機能も含まれている。さらに、この
情報表出部206では中央処理部203からのユーザに伝える
メッセージ内容から音声合成を行って合成音の信号に変
換している。
めの表示内容に変換したりする処理や情報表出部206に
おけるデバイスや、音声入力装置の用途に応じて処理を
実行できるように構成することも可能である。
の処理と情報表出部206へ送る情報についての処理は同
一処理機構で行うか否かは問わないものとする。すなわ
ち上記の処理を行う機構を総称して信号処理部202とす
る。
ロホン以外のセンサ・デバイスも考えられる。例えばカ
メラからの動画像や触覚センサ、スイッチ等が挙げられ
る。その他のセンサ・デバイスからの入力も、音声入力
装置の用途に応じて処理できるような信号処理部を構成
できるものとする。これについては後述する。
理を制御する。この中央処理部203が音声入力装置の状
態を管理し、必要に応じて各処理機構に命令を送る。信
号処理部202からの情報やネットワーク接続部205からの
情報、そして記憶部204の情報を元に制御内容を決める
ことができる。また、他の音声入力装置に対して制御情
報を送出する。本発明の音声入力システムとして音声を
どう処理するかについては後述する。
プログラムやその作業領域、信号処理部202からの情報
やネットワーク接続部205からの情報を保持しておく機
構である。なお、この記憶部204は信号処理部202におけ
る情報記憶用やネットワーク接続部からの情報記憶用と
いったように回路的には別のものであっても構わないと
する。
機構を総称して記憶部204と呼ぶことにする。この記憶
部204は半導体メモリや磁気ディスクなどの機構で実現
可能であり、データを保持できる任意の機構で構成可能
なものであるが、この実施の形態では半導体メモリが使
用されている。
ついては中央処理部203の処理の説明と共に後述する。
を通して音声入力装置間の情報の授受を行うための機構
であり、LANでのネットワーク接続やブルートゥースと
いった無線技術といった機器間通信技術によって実現で
きるものとし、ここではLANでのネットワーク接続を用
いている。
それぞれ、もしくは全てが、他の機能を持つシステムの
ものと機構を共有しても構わないとする。例えばビデオ
・システムのようなオーディオ・ヴィジュアル機器に音
声入力装置が含まれている場合に、共通の信号処理回路
を使ってお互いの機能を実現したり、同じ中央処理回路
を用いて音声入力装置やビデオ・システムの機能の制御
を行ったりすることが考えられる。
ステムの機能を実現する例が考えられるが詳細は省略す
る。
やその他のシステムが別々にあるのでなく、共通の回路
でありながら、プログラム的なプロセスとして別のシス
テムとして制御できる場合も上記に含まれているものと
する。
音声信号やネットワーク接続部205からの情報、記憶部2
04で保持されている情報をもとにして音声をどのように
処理するかについて図3を用いて説明する。図3では図2
のビデオ26に搭載された音声入力装置20-1(以下音声入
力装置Aとする)とエアコン27に搭載された音声入力装
置20-3(以下音声入力装置Bとする)に対して音声が入
力される例を示している。さらに、現在ユーザが音声入
力装置Bに対して対話処理を行い、音声入力装置Aは待
機中の状態を示している。
力装置Bに対して発声すると(step301)、各音声入力
装置の信号処理部202ではマイクロホン201で取り込まれ
たユーザからの発声を検知し、信号処理される(step30
2)。
話処理を行っているので、音声入力装置B自身が対話処
理中であって他のシステムの状態が対話状態でないとな
れば、音声入力装置Bがユーザの発声した内容に対する
処理を行う選択をする。(step303) 次に、音声入力装置Bの中央処理部202は音声入力装置
の機能にあわせて取り込まれた音声の処理を行い、音声
の内容にしたがって機器を操作し、対話終了後再び待機
状態になる(step304)。
がユーザとの対話状態であるので、信号処理された後
(step302)、それ以上の処理を行わない(step305)と
し、待機状態になる。
声入力装置で検知されてしまうような場合でも、ユーザ
が現在発声対象としている音声入力装置に対してのみ、
楽にアクセスできるようにすることを可能とする。また
上記ではユーザが複数の音声入力装置に対して発声する
とした例を挙げたが、ユーザは意図的に複数の音声入力
装置に検知されるように音声を発声する必要はなく、こ
のことは以降の実施例でも同様である。
れば処理を行うといった条件付けは、上記以外の条件に
ついてユーザが任意に、もしくは音声入力装置が設定と
して定めることができるものとする。
対一による音声のやり取りに限定したものではなく、人
間からシステムへの一方的な音声発声やシステム側から
視覚的な応答を返す場合、あるいはシステムから任意の
人間に応答する場合を含んでも構わないものとし、以降
の説明で用いられる対話についても同様である。
いた順序関係があり、その順序関係に基づいて取り込ま
れた音声情報に対する処理を決めることもできる。ルー
ルの具体例としては、音声入力装置の処理能力・ユーザ
による設定・使用頻度・音声入力装置の機能に基づく設
定値・マイクロホン以外からのセンサの情報や、これら
の組み合わせ等が挙げられる。
付けの例を図4を用いて説明する。
ェアラブル・コンピューター(以下音声入力装置Cとす
る)と音声入力装置が搭載している機器としてビデオ・
システム(以下音声入力装置Dとする)があり、前者の
方が特定ユーザ向けなので順位が高く、ビデオ・システ
ムは不特定のユーザが使い得るので順位が低いものとす
る。
入力装置Dに対して発声し(step401)、それぞれの音
声入力装置は信号処理部202においてマイクロホン201で
取り込まれたユーザからの発声を検知した場合に、自音
声入力装置の順位を送信しあう(step402)。
順位の高い音声入力装置Cがそのユーザの発声を処理す
る(step403)。
(step404)、待機中のままになる。
送信情報に順位以外の情報があっても構わないし、発声
を検知してからでなく前もって情報のやり取りをしてお
く、あるいはプリセットの順位情報をもとに自音声入力
装置で処理するかの判断を行っても構わないとする。
入力装置を搭載する機器として火災報知器や緊急警報器
のような非常用機器は他のどんな機器よりも順位が高
く、例えば「助けて」という発声に対していかに通常機
器で音声命令として登録していてもまずは非常用機器に
対する音声入力が優先されるということも可能となる。
構を設けて、それによって処理の判断の参考にすること
もできる。図5で例を挙げて説明する。
(以下音声入力装置Eとする)とエアコンに搭載された
音声入力装置(以下音声入力装置Fとする)に対して音
声が入力される例を示しており、音声入力装置Eは音声
入力装置Fよりユーザに近い位置に設置している。
入力装置Fに対して発声し(step501)、それぞれの音
声入力装置は信号処理部202においてマイクロホン201で
取り込まれたユーザからの発声を検知した場合に、自音
声入力装置の発声検知時間を送信しあう(step502)。
らの検知時間と自音声入力装置の検知時間を比較し、自
音声入力装置が最も早かった場合は音声を処理し(step
503)、そうでなければ当該音声を処理しないという判
断をする(step504)ことで、ユーザが指定しなくとも
ユーザに最も近い音声入力装置が音声の処理を行えるよ
うになる。
声入力装置がユーザの発声を最初から最後まで検知でき
たとみなして、その音声入力装置が当該音声の処理を行
うといったように音声検出の早さ以外の時間情報を判断
基準とすることもできる。
から取り込まれた音声から計測し、処理の判断の参考に
することもできる。音量情報を利用した本発明の例とし
て図6を用いて説明する。
力装置Fがある場合に、ユーザは音声入力装置E及び音
声入力装置Fに対して発声し(step601)、それぞれの
音声入力装置は信号処理部202においてマイクロホン201
で取り込まれたユーザからの発声を検知した場合に、音
量情報を送信しあう(step602)。すなわち、ユーザの
発声の音量をマイクロホンから取り込まれた音声から計
測し、ネットワーク上の他の音声入力装置に伝える。
らの音量情報と自音声入力装置の音量情報を比較し、自
音声入力装置が最も大きかった場合は音声を処理し(st
ep603)、そうでなければ当該音声を処理しないという
判断をする(step604)ことで、ユーザが指定しなくと
もユーザに最も近い音声入力装置が音声の処理を行う、
もしくは元の発声を最もよく収録した音声で処理を行え
るようになる。この音量情報としては音圧レベルや音響
パワーレベル、あるいはphonやsoneなどの単位が挙げら
れる。
信号対雑音比をマイクロホンから取り込まれた音声から
計算して、処理の判断の参考にすることもできる。信号
対雑音比を利用した本発明の例として図7を用いて説明
する。
(以下音声入力装置Gとする)とエアコンに搭載された
音声入力装置(以下音声入力装置Hとする)に対して音
声が入力される例を示しており、騒音源があり、音声入
力装置Gは音声入力装置Hより騒音源が遠い位置にある
ものとする。
込んで周囲の雑音の情報を計測しておく(step701)。
力装置Hに対して発声し(step702)、それぞれの音声入
力装置は信号処理部202においてマイクロホン201で取り
込まれたユーザからの発声を検知し、ユーザの発声をマ
イクロホンから取り込んだときに雑音情報をもとに信号
対雑音比を計算し、ネットワーク上の他の音声入力装置
に伝える(step703)。
らの信号対雑音比情報と自音声入力装置の信号対雑音比
情報を比較し、自音声入力装置が最も大きかった場合は
音声を処理し(step704)、そうでなければ当該音声を
処理しないという判断をする(step705)。
ザに最も近い音声入力装置が音声の処理を行う、もしく
は元の発声を最もよく収録した音声で処理を行えるよう
になる。ここでの例では、無発声中でも常時周囲音を取
り込んで雑音を計算する例を挙げたが、他にも例えば発
声を検知してから発声中の無音区間をもとに雑音を推定
してもよい。
歴を保持しておき、それを処理の判断に利用することも
できる。過去の履歴を利用した本発明の例について図8
を用いて説明する。
(以下音声入力装置Iとする)とエアコンに搭載された
音声入力装置(以下音声入力装置Jとする)に対して音
声が入力される例を示しており、音声入力装置Iは音声
入力装置Jより使用頻度が高いもとする。
して発声(step801)し、この発声に対して最近の使用
時間・使用回数等をネットワーク経由で他の音声入力装
置に伝える(step802)。
の使用履歴と比較して、音声入力装置Iが最もよく使わ
れているなら音声の処理を行うよう判断する(step80
3)ことでユーザがわざわざ指定しなくてもよく使われ
ている音声入力装置Iを利用できるようになる。
装置Iの使用履歴と比較して、音声入力装置Jがあまり
使われていないなら音声の処理は行わず(step804)、
待機中のままになる。
結果を利用して取り込まれた音声の処理を判断すること
もできる。信号処理部からの情報は音声認識を行う機構
で処理されその結果が中央処理部に渡される。このとき
行われる音声認識は、演算処理を中央処理部で扱っても
構わない。
布をモデルに使ったHMMやDPマッチングのような一般に
現実化されている手法で構わないとし、このとき使われ
るHMMや言語モデルは記憶部にあっても構わないとす
る。音声認識の語彙は音声入力装置毎に異なっていても
共通化されていても構わないとする。さらにその語彙に
制御命令を対応させることで音声コマンドを可能にする
こともできる。この音声認識を利用した本発明の例につ
いて図9で説明する。
(以下音声入力装置Kとする)とエアコンに搭載された
音声入力装置(以下音声入力装置Lとする)に対して音
声が入力される例を示している。
らの音声入力装置Kに関連する「再生」という発声があ
った(step901)場合に、各音声入力装置はその音声の
検知と音声認識を行う(step902)。
取り、認識結果から自音声入力装置に対する発声か否か
を判断し(step903)、その判断結果と認識結果をネッ
トワーク経由で他の音声入力装置に伝える(step90
4)。
結果をみて、音声入力装置Kでは自音声入力装置への発
声と判断(step905)できたら当該音声に対する処理を
行うことで、ユーザが特に指定しなくても発声対象の音
声入力装置を使うことができるようになる。
への発声と判断しない(step906)ので、待機中のまま
である。
識別結果を利用して音声の処理を判断することもでき
る。音源の種類としては人間、機械、動物など使用目的
に応じて考えられるが、以降では例として人間の発声を
音声とした場合について説明する。信号処理部からのユ
ーザの音声情報に対して話者識別を行い、その結果を中
央処理部に伝える。この話者識別を行う方法は話者毎に
学習または適応されたHMMに対する尤度から判断するも
のや、性別や年齢層毎のモデルで最も近いカテゴリーを
選ぶものなど、個人あるいは話者の特性(例えば性別や
年齢層など)を識別できる手法ならば構わないものとす
る。
10を用いて説明する。
(以下音声入力装置Mとする)とエアコンに搭載された
音声入力装置(以下音声入力装置Nとする)に対して音
声が入力され、あるユーザは片方の音声入力装置Mでの
み音声の処理が可能である場合の例を示している。
らの発声があった(step1001)場合に、ユーザの発声を
検知した音声入力装置は話者識別を行い(step1002)、
自音声入力装置で処理すべき発声か否か判断(step100
3)をして、その判断結果と話者識別結果をネットワー
ク経由で他の音声入力装置に伝える(step1004)。
における判断結果と話者認識結果をみて、自音声入力装
置への発声と判断(step1005)できたら当該音声に対す
る処理を行い、逆に他方の音声入力装置Nは自音声入力
装置への発声ではないと判断(step1006)できたら処理
を行わないとすることで、ある音声入力装置が特定のユ
ーザに利用可能である場合に、ユーザが特に指定しなく
ても発声対象の音声入力装置を使うことができるように
なる。
話者が候補となった場合に、システム側からさらに暗証
番号や定型句あるいは自由発声を促してさらにデータを
得ることによって識別精度を上げてから話者識別以降の
処理をおこなってもよい。
べているが、前記のように故障者や動物の音に応じて識
別とその後の処理を行うことも可能である。
の機器と共通の命令を持ち、お互いに許された範囲で制
御することもできる。こうすることで、他の音声入力装
置の働きを抑制したり、音声入力装置同士の互換性をよ
くしたりすることができる。
全ての音声入力装置1101が「電源ON」「電源OFF」「省
電力」といった共通の電源管理命令を持っているとき
に、ネットワーク1102に繋がっているパーナルコンピュ
ータ1103から一度に複数システムも含めた任意の音声入
力装置1101の電源を操作する命令をネットワーク経由で
送信し、各音声入力装置がその命令を実行することが出
来る。
の機器と共通の音声による制御命令と、入力された音声
とその命令をマッチングする手段を備えることで、より
平易で確実な音声による制御命令の実行を可能とする。
この例について図12のフロー図を用いて説明する。
デオ(音声入力装置O)と音声入力装置を有しているエ
アコン(音声入力装置P)があったときに、ユーザが
「ビデオ」「エアコン」と命令対象の名称を発声した後
で、「電源ON」「電源OFF」といったように共通の動作
について共通化された命令を発声する。
という発声があった場合(step1201)、音声入力装置O
及び音声入力装置Pは前述の音声認識で使われるマッチ
ング手段で機器名称と機器命令を認識(step1202)し、
自身のシステムへの命令か、処理可能かについて判断す
る(step1203)。
装置や制御可能機器にその結果を伝達(step1204)し、
その結果と他の音声入力装置からの結果から自音声入力
装置が処理すべき発声か判断(step1205)してその制御
命令に対応した処理を行うことができる。
装置から得られた結果を使うことが、これまでの音声に
よるリモコンや音声によって命令する機器とは異なる点
である。
能機器が複数ある場合に、記憶部でその制御命令の全て
または一部に関する情報を記憶できるような仕組みと、
入力された音声とそれらの命令をマッチングさせる手段
を備えることで、より平易で確実な音声による制御命令
の実行が可能となる。
る。ネットワーク上に音声入力装置で制御可能なビデオ
(音声入力装置Q)とエアコン(音声入力装置R)があ
るとして、音声命令について音声入力装置Qが「再生」
「停止」、音声入力装置Rが「温度あげて」「温度さげ
て」等であった場合に、ネットワーク上のそれぞれの音
声入力装置では認識単語と対象機器を関連付けて記憶で
きるようになっているとする。
理内容を結びつける概念を表している。この図13のよう
な認識単語と処理内容との結びつけは、単純な表引きや
オブジェクト指向や高次の知識処理によって実現できる
ものとし、ここではその詳細は省略する。
デオ」「再生」と発声した場合(step1401)、音声入力
装置Qと音声入力装置Rは発声の検知と認識を行う(st
ep1402)。
容を判断し(step1403)、その結果をネットワーク上の
他の音声入力装置に伝達し(step1404)、その結果と他
の音声入力装置から送られてきた結果をもとに自音声入
力装置が処理すべき発声だったかを判断して(step140
5)、その制御命令に対応した処理を行う。
ような認識単語と対象機器、処理内容の結びつきによっ
てどちらの音声入力装置も発声がビデオに対して再生の
命令であったと判断できる。さらにネットワーク経由で
送信しあった情報により、発声が一意に解釈でき、音声
入力装置は認識結果に対応する処理内容を行うことが出
来る。
本的に単語認識による例を挙げてきたが、ワードスポッ
ティングや連続音声認識の技術を使っても、各音声入力
装置での音声認識のスペックに差があっても、図13の
ような認識結果と処理内容の対応づけの概念がされれば
構わないとする。
音声入力装置以外のネットワークに接続された制御対象
機器についても処理できるものとする。その例について
図15を用いて説明する。
アコン1501と単体の音声入力装置1502及びビデオ1503が
ネットワーク1504に接続されており、ここでユーザがビ
デオ1503を操作する発声をする。
流れで音声の検知及び認識を行い、図13のような概念で
認識結果と処理内容を結びつける。そして認識結果と処
理内容の判断をしてからネットワーク1504上の他のシス
テムに送信する。
処理内容を受け、発声を実行することができる。よって
ビデオ1503自体に音声入力装置がなくても自分が制御可
能な情報についてネットワークに情報を流し、各音声入
力装置に図13のような認識結果と処理内容の概念をつく
ることで音声による制御が可能となる。
いた本発明の例については、これまでブロードキャスト
方式で音声認識と判断の結果をネットワークの全てのシ
ステムに送信する例を挙げてきたが、認識結果によって
直接その対象機器にのみ認識結果と判断の結果を伝えて
もよいものとする。
ンによる音声入力以外のセンサがある場合に、そのセン
サ情報を利用して検知した音声の処理内容を判断するこ
ともできる。この例について、図16を用いて説明する。
アコン1601と単体の音声入力装置1602がネットワーク16
03に接続されている。また、この単体の音声入力装置に
はカメラを有しておりカメラから周辺の画像情報を取り
入れることができる。なお、このカメラの入力は図2の
信号処理部202に入力され画像処理される。
エアコン1601の音声入力装置に対して発声する。ここ
で、単体の音声入力装置1602に付いているカメラにより
話者がどの方向を向いているかを推定する。なお、この
話者がどの音声入力装置を向いているかについては、画
像から人間を抽出する技術、顔部分を推定してその向き
を推定する技術、口の動きから検知した発声がどの人間
からのものか推定する技術等の組み合わせで実現できる
ものとするが、ここでは詳細は省略する。
ン1601の方を向いていると判断すると、発声の対象機器
をエアコンと判断して、各音声入力装置は結果をネット
ワーク1603で他の音声入力装置に通知し、これまで述べ
てきた例のように処理を判断する。
た例を挙げたが、スイッチ等の直接的なセンサ・デバイ
スや音源定位のためのマイクロホンアレイなどが考えら
れるが、どのような計測技術を使うかは限定しない。
ようにマイクロホン201、情報表出部206、信号処理部20
2、中央処理部203、記憶部204、ネットワーク接続部205
は音声入力装置においてそれぞれその働きをするものの
総称であるので、ネットワークを通した形や直接接続さ
れた形でそれぞれが物理的に複数に分かれていても構わ
ないとする。この例を図17で説明する。
は2つの音声入力装置(1701、1702)に分かれていても
ネットワーク1703で接続されており適切な情報のやり取
りが出来るものとする。このときユーザの発声に対し
て、2つの音声入力装置(1701、1702)で一つの音声入
力装置として働くことが出来る。
に対する判断の基準は、他の音声入力装置の情報やユー
ザの設定によって変えられるものとする。例えば、音声
入力装置は音声を検知したときの検知や認識結果等の情
報以外に、一定時間ごとに他の音声処理システムの処理
状態、処理性能、認識可能語彙やそれに対する処理内容
をやり取りして、自音声入力装置の記憶部に蓄えておけ
るとする。
声入力装置は処理出来ないから自音声入力装置で処理可
能な場合は代わって処理するとか、自音声入力装置より
性能のいい音声入力装置の認識結果を自分の結果より重
視することで認識誤りを補正するとか、ユーザが自分の
好みに合わせて上述のような判断の制御を可能とするこ
とが出来る。
に対する入力の判断の手段は、上述のものを組み合わせ
ても構わないとする。例えば、検知時間が早い音声入力
装置が発声を扱うとするが、ある許容時間内では時間差
がないものとし、同じ時間の場合は音量で判断すると
か、音声認識の尤度と音声入力装置の順位を重み付けし
て最もスコアの高い音声入力装置で音声を扱うなどが考
えられる。
せにより得られた情報を利用して高次のエージェントシ
ステムや知識処理システムで判断する場合も考えられ
る。
における処理の判断の手段は、ネットワーク上の音声入
力装置間で同一であることを必須とはしないものとす
る。例えば音声入力装置が2つあり、一つは音声の検知
時間のみで、他方は音量情報のみで判断する場合には、
音声を検知したあとに相互に授受する情報は必ずしも対
応は取れないが、各々の音声入力装置でその場合におけ
る処理を装置の目的に応じて設定しておけば、音声入力
システムとして処理が破綻せずに各々の音声入力装置で
処理の判断が可能である。また、上述のような音声入力
装置の判断の手段が各々の音声入力装置において異なっ
ている場合に、ネットワークを通して授受した情報をも
とに音声入力装置より高次のエージェントシステムや知
識処理システムで処理を判断する場合も考えられる。
に対する入力の判断において、音声検知時間や音量とい
った発声に関する情報や、音声認識結果や識別結果とい
った情報から、ユーザがどの機器に対してどのような音
声入力を行ったのかが一意には判断できなかった場合
は、音声入力装置の一つがユーザと対話処理を行って決
定したり、マイクロホン以外のセンサ情報といった他の
条件を使って決定したりすることもできる。
において先に説明した図2の情報表出部206とこれまでの
説明の補足となる例を次の図18を用いて説明する。
アコン1801、単体の音声入力装置1802及び音声入力装置
を有したビデオ1803がネットワーク1804に接続されてい
る。また、これらの音声入力装置は図2の情報表出部206
を有している。
に、待機中に各音声入力装置は自音声入力装置の情報、
すなわち認識語彙、処理内容やここでは特に情報表出部
の有無と表現可能なメディアの情報をやり取りして記憶
部に保存してあるものとする。
全てスピーカを備え、中央処理部と信号処理部によって
合成された任意文の音声をユーザに返すことができると
する。そしてその情報表出部への制御命令の一部は音声
入力装置で共通化されているとする。つまりある音声入
力装置が自分の情報表出部からユーザに応答を返す代わ
りに、ネットワーク上の別な音声入力装置の情報表出部
からユーザへの応答を可能とする。
う発声があったときに、エアコンに接続された音声入力
装置と単体の音声入力装置がその音声を検知したとす
る。なお、ユーザの位置は単体の音声入力装置に一番近
いところにあるとする。
声入力装置は音声の検知、認識、自音声入力装置への命
令か判断して、結局「ビデオ」への「再生命令」と判断
し、それぞれネットワーク上の他の音声入力装置へ伝え
る。ビデオに接続された音声入力装置は直接音声を検知
しないが、ネットワーク上の別な音声入力装置からの情
報を受け、自音声入力装置への命令と解釈して、再生命
令がされた場合の処理を実行する。
ユーザに近いため、ネットワーク上に送られた音量や信
号対雑音比の情報で判断したときに、ビデオに接続され
た音声入力装置よりも単体の音声入力装置の方が音声処
理に適していることを各音声入力装置は判断できる。
声入力装置はそれぞれ単体の音声入力装置がユーザとの
音声の授受を行う音声入力装置と判断できる。
は、ビデオに対して再生の制御命令を送る一方、再生を
始めたことをユーザに伝えるために、「再生を開始しま
した」という合成音声を単体の音声入力装置からユーザ
に返すよう命令を生成して、ネットワークを介して単体
の音声入力装置へ伝える。このときビデオの音声入力装
置から送信される制御命令はこれまでのネットワークへ
の情報送信と同様に単体の音声入力装置一つへ直接送信
してもよいし、単体の音声入力装置への命令という情報
を含んだ形で、ブロードキャスト形式で全ての音声入力
装置へ伝えられてもよい。
送られたユーザへの応答命令を解釈して、単体の音声入
力装置は合成音声で「再生を開始しました」というメッ
セージをユーザに伝えることができる。
置とビデオの音声入力装置は、ユーザと対話処理中であ
るというフラグを一定時間立てることで、ユーザの次の
発声を優先的に処理し、エアコンの音声入力装置で処理
しなくてもよいように出来るという例については既に述
べてある。
装置において音声入力装置が何らかの基準でグループ化
されている場合の例について図19を用いて説明する。
グループ「キッチン」1901、グループ「ウェアラブル」
1902、グループ「リビング」1903のグループは全てネッ
トワーク1904で接続されている。また、それぞれのグル
ープ内に音声入力装置があり、これらの各グループ内に
おけるそれぞれの音声入力装置は他グループを同定でき
る情報を持っているものとする。
関して記憶部が持つ情報と、他グループに関してもつ情
報の種類は必ずしも同一でなくてよい。具体的にはここ
では他グループにおける各々の音声入力装置の認識語彙
やそれに対応する対象機器や処理内容の情報までは持た
ないとする。
生」と発声し、それがグループ「キッチン」とグループ
「ウェアラブル」の音声入力装置で検知されたとする。
これまで述べてきた例と同様に、検知した音声入力装置
で認識と自音声入力装置で処理すべきか判断した結果、
自グループへの発声でなくグループ「リビング」への発
声と判断し、その音声情報や判断結果をグループ「リビ
ング」の音声入力装置へ伝える。
み情報を送ることで、多くの音声入力装置がネットワー
クに接続されたときに必要な音声入力装置のみが情報の
やり取りをできるようになることがグループ化すること
の利点である。
入力装置は自グループ宛の音声に関する情報を受け取る
ことで自グループ内の「ビデオ」に対する「再生」の命
令と判断してそれに対応する処理をすることができる。
なお、本発明は音声入力プログラムに適用することも言
うまでもない。
発声に対して他の音声入力装置からの情報を利用するこ
とで、ユーザに負担をかけずに音声に対する処理を決定
することができる。
構成を示す図。
構成する音声入力装置を示す図。
動作を示すフロー図。
他の動作を示すフロー図。
他の動作を示すフロー図。
他の動作を示すフロー図。
他の動作を示すフロー図。
他の動作を示すフロー図。
他の動作を示すフロー図。
の他の動作を示すフロー図。
テムの構成を示す図。
の他の動作を示すフロー図。
に係り、認識単語、対象機器、処理内容を結びつける概
念を示す図。
の他の動作を示すフロー図。
テムの構成を示す図。
テムの構成を示す図。
テムの構成を示す図。
テムの構成を示す図。
テムの構成を示す図。
Claims (18)
- 【請求項1】複数の音声入力装置がネットワークに接続
され、前記ネットワークに接続された各々の音声入力装
置において入力される音声情報をそれぞれ検知し、前記
ネットワークに接続された各々の音声入力装置で前記検
知した前記音声に関する情報を判断情報として前記ネッ
トワークを介して他の音声入力装置に授受し、前記ネッ
トワークに接続された各々の音声入力装置が自音声入力
装置と他の音声入力装置における前記判断情報をもとに
前記音声情報に対する処理の決定及び実行の判断を行う
ことを特徴とする音声入力システム。 - 【請求項2】前記ネットワークに接続された複数の音声
入力装置は所定のルールに基づいて順位関係を構成し、
前記ネットワークに接続された各々の音声入力装置は自
音声入力装置と他の音声入力装置における前記順位情報
を前記判断情報として前記音声情報に対する処理の決定
及び実行の判断を行うことを特徴とする請求項1記載の
音声入力システム。 - 【請求項3】前記ネットワーク上に接続された複数の音
声入力装置は所定のルールに基づいて複数にグループ化
され、前記グループに関する情報を記憶する領域を備
え、前記グループに関する記憶領域は、ネットワークに
接続された音声入力装置に関する記憶領域と関連付けて
作業を行う仕組みを備え、取り込まれた音声情報に対し
て前記グループに関する記憶領域の情報を前記判断情報
として前記音声情報に対する処理の決定及び実行の判断
を行うことを特徴とする請求項1記載の音声入力システ
ム。 - 【請求項4】前記ネットワークに接続された複数の音声
入力装置は共通の時間情報を持ち、前記ネットワークに
接続された各々の音声入力装置で前記音声情報を検知し
たらその検知時間情報を他の音声入力装置に伝え、前記
ネットワークに接続された各々の音声入力装置は自音声
入力装置と他の音声入力装置における前記検知時間情報
を前記判断情報として前記音声情報に対する処理の決定
及び実行の判断を行うことを特徴とする請求項1記載の
音声入力システム。 - 【請求項5】前記ネットワークに接続された複数の音声
入力装置は前記入力される音声情報の音量について共通
の尺度を備え、前記ネットワークに接続された各々の音
声入力装置で前記音声情報を検知したら前記音量情報を
他の音声入力装置に伝え、前記ネットワークに接続され
た各々の音声入力装置は自音声入力装置と他の音声入力
装置における前記音量情報を前記判断情報として前記音
声情報に対する処理の決定及び実行の判断を行うことを
特徴とする請求項1記載の音声入力システム。 - 【請求項6】前記ネットワークに接続された複数の音声
入力装置は入力される音声情報の信号対雑音比を推定す
る手段を備え、前記ネットワークに接続された各々の音
声入力装置で前記音声情報を検知したらその信号対雑音
比情報を他の音声入力システムに伝える手段を備え、前
記ネットワークに接続された各々の音声入力装置は自音
声入力装置と他の音声入力装置における前記信号対雑音
比情報音量情報を前記判断情報として前記音声情報に対
する処理の決定及び実行の判断を行うことを特徴とする
請求項1記載の音声入力システム。 - 【請求項7】前記ネットワークに接続された複数の音声
入力装置は過去の状態履歴を保存しておく記憶領域を備
え、前記ネットワークに接続された各々の音声入力装置
は前記過去の状態履歴を他の音声入力装置に伝え、前記
ネットワークに接続された各々の音声入力装置は自音声
入力装置と他の音声入力装置における前記過去の状態履
歴を前記判断情報として前記音声情報に対する処理の決
定及び実行の判断を行うことを特徴とする請求項1記載
の音声入力システム。 - 【請求項8】前記ネットワークに接続された複数の音声
入力装置は音響的な情報や言語的な情報を保存する手段
及び取り込まれた音声情報と前記音響的な情報や言語的
な言語情報を使ってマッチングを行って音声認識をする
手段を備え、前記ネットワークに接続された各々の音声
入力装置は音声情報を検知したら、この音声情報に基づ
く音声認識情報を他の音声入力装置に伝え、前記ネット
ワークに接続された各々の音声入力装置は自音声入力装
置と他の音声入力装置における前記音声認識情報を前記
判断情報として前記音声情報に対する処理の決定及び実
行の判断を行うことを特徴とする請求項1記載の音声入
力システム。 - 【請求項9】前記ネットワークに接続された複数の音声
入力装置は前記音声情報の音源に関して識別できる手段
とを備え、前記ネットワークに接続された各々の音声入
力装置は音声情報を検知したらその音源に関する情報を
他の音声入力装置に伝え、前記ネットワークに接続され
た各々の音声入力装置は自音声入力装置と他の音声入力
装置における前記音源に関する情報を前記判断情報とし
て前記音声情報に対する処理の決定及び実行の判断を行
うことを特徴とする請求項1記載の音声入力システム。 - 【請求項10】前記ネットワークに接続された複数の音
声入力装置は各々の音声入力装置及び他の音声入力装置
を制御できる共通の制御命令体系を備え、取り込まれた
音声に対してネットワーク上の他の音声入力装置へ前記
制御命令を送信及び他の音声入力装置からの前記制御命
令の受信を行って、その命令内容を実行することを特徴
する請求項1記載の音声入力システム。 - 【請求項11】前記ネットワークに接続された複数の音
声入力装置は各々の音声入力装置と他の音声入力装置以
外のネットワークで接続された制御可能機器の情報を記
憶する領域を備え、取り込まれた音声情報に対して、前
記他の制御可能機器情報も利用することで、入力音声情
報の処理及び制御可能機器との情報の授受を行うことを
特徴する請求項1記載の音声入力システム。 - 【請求項12】前記ネットワークに接続された各々の音
声入力装置には音声入力手段以外のセンサ・デバイス及
びその信号処理手段を備え、取り込まれた音声情報に対
して、前記他のセンサ・デバイス情報を前記判断情報と
して前記音声情報に対する処理の決定及び実行の判断を
行うことを特徴とする請求項1記載の音声入力システ
ム。 - 【請求項13】前記ネットワークに接続された前記複数
の音声入力装置は各々の音声入力装置及び他の音声入力
装置の情報をもとに検知した音声情報の処理を判断する
基準を他の音声入力装置の情報を利用して変更する、あ
るいはユーザの設定によって変更することが可能なこと
を特徴とする請求項1記載の音声入力システム。 - 【請求項14】前記ネットワークに接続された複数の音
声入力装置は各々のシステムの状態を表示する表出部を
備え、取り込まれた音声情報やシステムがユーザに伝え
たい情報についてどのように表出するかを制御する機能
を備え、処理の決定及び実行と情報の表出を行うことを
特徴する請求項1記載の音声入力システム - 【請求項15】前記ネットワークに接続された複数の音
声入力装置はその一部乃至全ての手段が前記音声入力装
置以外の機能における手段と共有化されていることを特
徴とする請求項1記載の音声入力システム。 - 【請求項16】前記ネットワークに接続された複数の音
声入力装置の機能の一部が物理的には分かれていても、
ネットワーク技術による結びつきで一つとして機能する
ことができることを特徴とする請求項1記載の音声入力
システム。 - 【請求項17】ネットワークに接続された複数の音声入
力装置において入力される音声情報をそれぞれ検知する
ステップと、前記ネットワークに接続された各々の音声
入力装置で前記検知した前記音声に関する情報を判断情
報として前記ネットワークを介して他の音声入力装置に
授受するステップと、前記ネットワークに接続された各
々の音声入力装置は自音声入力装置と他の音声入力装置
における前記判断情報をもとに前記音声情報に対する処
理の決定及び実行の判断を行うステップとを含むことを
特徴とする音声入力方法。 - 【請求項18】ネットワークに接続された複数の音声入
力装置において入力される音声情報をそれぞれ検知し、
前記ネットワークに接続された各々の音声入力装置で前
記検知した前記音声に関する情報を判断情報として前記
ネットワークを介して他の音声入力装置に授受し、前記
ネットワークに接続された各々の音声入力装置は自音声
入力装置と他の音声入力装置における前記判断情報をも
とに前記音声情報に対する処理の決定及び実行の判断を
行う機能を実現することを特徴とする音声入力プログラ
ム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002019457A JP4086280B2 (ja) | 2002-01-29 | 2002-01-29 | 音声入力システム、音声入力方法及び音声入力プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002019457A JP4086280B2 (ja) | 2002-01-29 | 2002-01-29 | 音声入力システム、音声入力方法及び音声入力プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2003223188A true JP2003223188A (ja) | 2003-08-08 |
JP4086280B2 JP4086280B2 (ja) | 2008-05-14 |
Family
ID=27743292
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002019457A Expired - Fee Related JP4086280B2 (ja) | 2002-01-29 | 2002-01-29 | 音声入力システム、音声入力方法及び音声入力プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4086280B2 (ja) |
Cited By (90)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005266192A (ja) * | 2004-03-18 | 2005-09-29 | Matsushita Electric Ind Co Ltd | 音声認識装置および音声認識方法 |
JP2008064885A (ja) * | 2006-09-05 | 2008-03-21 | Honda Motor Co Ltd | 音声認識装置、音声認識方法、及び音声認識プログラム |
JP2012063582A (ja) * | 2010-09-16 | 2012-03-29 | Denso Corp | 車載音声認識装置 |
JP2013529794A (ja) * | 2010-06-24 | 2013-07-22 | 本田技研工業株式会社 | 車載音声認識システム及び車両外音声認識システム間の通信システム及び方法 |
KR20130088637A (ko) * | 2012-01-31 | 2013-08-08 | 삼성전자주식회사 | 디스플레이장치 및 그 음성인식방법 |
JP2015141226A (ja) * | 2014-01-27 | 2015-08-03 | パイオニア株式会社 | 情報処理装置 |
JP2016512632A (ja) * | 2013-03-15 | 2016-04-28 | インテル コーポレイション | 音声およびジェスチャー・コマンド領域を割り当てるためのシステムおよび方法 |
US9576591B2 (en) | 2012-09-28 | 2017-02-21 | Samsung Electronics Co., Ltd. | Electronic apparatus and control method of the same |
JP2017107333A (ja) * | 2015-12-08 | 2017-06-15 | キヤノン株式会社 | 通信機器及び通信機器の制御方法 |
KR20180039135A (ko) * | 2015-09-11 | 2018-04-17 | 아마존 테크놀로지스, 인크. | 음성-인에이블 디바이스들 간 중재 |
KR20180042376A (ko) * | 2015-09-21 | 2018-04-25 | 아마존 테크놀로지스, 인크. | 응답을 제공하기 위한 디바이스 선택 |
JP2019028388A (ja) * | 2017-08-03 | 2019-02-21 | シャープ株式会社 | 家電装置システム |
KR20190077059A (ko) * | 2016-11-18 | 2019-07-02 | 구글 엘엘씨 | 컴퓨팅 디바이스 근처의 가상 어시스턴트 식별 |
JP2019146229A (ja) * | 2016-02-22 | 2019-08-29 | ソノズ インコーポレイテッド | オーディオ応答再生 |
JP2020003804A (ja) * | 2015-08-19 | 2020-01-09 | 華為技術有限公司Huawei Technologies Co.,Ltd. | 通信方法、サーバー、およびデバイス |
JP2020502555A (ja) * | 2016-10-19 | 2020-01-23 | ソノズ インコーポレイテッド | アービトレーションに基づく音声認識 |
JP2020030245A (ja) * | 2018-08-20 | 2020-02-27 | Zホールディングス株式会社 | 端末装置、決定方法、決定プログラム及び決定装置 |
JP2020034952A (ja) * | 2014-10-09 | 2020-03-05 | グーグル エルエルシー | 複数のデバイス上でのホットワード検出 |
JP2020038387A (ja) * | 2012-06-18 | 2020-03-12 | エイディシーテクノロジー株式会社 | 音声応答装置 |
US10606555B1 (en) | 2017-09-29 | 2020-03-31 | Sonos, Inc. | Media playback system with concurrent voice assistance |
JP2020086977A (ja) * | 2018-11-27 | 2020-06-04 | プラス株式会社 | 翻訳装置 |
CN111276139A (zh) * | 2020-01-07 | 2020-06-12 | 百度在线网络技术(北京)有限公司 | 语音唤醒方法及装置 |
JP2020095737A (ja) * | 2015-12-08 | 2020-06-18 | キヤノン株式会社 | 通信装置、制御方法、およびプログラム |
US10692518B2 (en) | 2018-09-29 | 2020-06-23 | Sonos, Inc. | Linear filtering for noise-suppressed speech detection via multiple network microphone devices |
US10714115B2 (en) | 2016-06-09 | 2020-07-14 | Sonos, Inc. | Dynamic player selection for audio signal processing |
JP2020126248A (ja) * | 2016-10-03 | 2020-08-20 | グーグル エルエルシー | デバイストポロジーに基づく音声コマンドの処理 |
JP2020129130A (ja) * | 2020-04-27 | 2020-08-27 | パイオニア株式会社 | 情報処理装置 |
US10811015B2 (en) | 2018-09-25 | 2020-10-20 | Sonos, Inc. | Voice detection optimization based on selected voice assistant service |
JP2020181016A (ja) * | 2019-04-23 | 2020-11-05 | コニカミノルタ株式会社 | 情報処理システム、情報処理装置、端末装置、およびプログラム |
US10847164B2 (en) | 2016-08-05 | 2020-11-24 | Sonos, Inc. | Playback device supporting concurrent voice assistants |
US10847178B2 (en) | 2018-05-18 | 2020-11-24 | Sonos, Inc. | Linear filtering for noise-suppressed speech detection |
US10847143B2 (en) | 2016-02-22 | 2020-11-24 | Sonos, Inc. | Voice control of a media playback system |
US10871943B1 (en) | 2019-07-31 | 2020-12-22 | Sonos, Inc. | Noise classification for event detection |
US10873819B2 (en) | 2016-09-30 | 2020-12-22 | Sonos, Inc. | Orientation-based playback device microphone selection |
US10880644B1 (en) | 2017-09-28 | 2020-12-29 | Sonos, Inc. | Three-dimensional beam forming with a microphone array |
US10878811B2 (en) | 2018-09-14 | 2020-12-29 | Sonos, Inc. | Networked devices, systems, and methods for intelligently deactivating wake-word engines |
US10880650B2 (en) | 2017-12-10 | 2020-12-29 | Sonos, Inc. | Network microphone devices with automatic do not disturb actuation capabilities |
JP2021002062A (ja) * | 2020-09-17 | 2021-01-07 | シャープ株式会社 | 応答システム |
US10891932B2 (en) | 2017-09-28 | 2021-01-12 | Sonos, Inc. | Multi-channel acoustic echo cancellation |
JP2021007259A (ja) * | 2015-09-30 | 2021-01-21 | アップル インコーポレイテッドApple Inc. | インテリジェントなデバイス識別 |
US10959029B2 (en) | 2018-05-25 | 2021-03-23 | Sonos, Inc. | Determining and adapting to changes in microphone performance of playback devices |
US10970035B2 (en) | 2016-02-22 | 2021-04-06 | Sonos, Inc. | Audio response playback |
US11017789B2 (en) | 2017-09-27 | 2021-05-25 | Sonos, Inc. | Robust Short-Time Fourier Transform acoustic echo cancellation during audio playback |
JP2021513693A (ja) * | 2017-12-08 | 2021-05-27 | グーグル エルエルシーGoogle LLC | デジタル音声アシスタントコンピューティングデバイスの間の信号処理の調整 |
US11024331B2 (en) | 2018-09-21 | 2021-06-01 | Sonos, Inc. | Voice detection optimization using sound metadata |
US11042355B2 (en) | 2016-02-22 | 2021-06-22 | Sonos, Inc. | Handling of loss of pairing between networked devices |
US11076035B2 (en) | 2018-08-28 | 2021-07-27 | Sonos, Inc. | Do not disturb feature for audio notifications |
US11080005B2 (en) | 2017-09-08 | 2021-08-03 | Sonos, Inc. | Dynamic computation of system response volume |
US11100923B2 (en) | 2018-09-28 | 2021-08-24 | Sonos, Inc. | Systems and methods for selective wake word detection using neural network models |
US11132989B2 (en) | 2018-12-13 | 2021-09-28 | Sonos, Inc. | Networked microphone devices, systems, and methods of localized arbitration |
US11138975B2 (en) | 2019-07-31 | 2021-10-05 | Sonos, Inc. | Locally distributed keyword detection |
US11138969B2 (en) | 2019-07-31 | 2021-10-05 | Sonos, Inc. | Locally distributed keyword detection |
US11159880B2 (en) | 2018-12-20 | 2021-10-26 | Sonos, Inc. | Optimization of network microphone devices using noise classification |
US11175880B2 (en) | 2018-05-10 | 2021-11-16 | Sonos, Inc. | Systems and methods for voice-assisted media content selection |
US11184969B2 (en) | 2016-07-15 | 2021-11-23 | Sonos, Inc. | Contextualization of voice inputs |
US11183181B2 (en) | 2017-03-27 | 2021-11-23 | Sonos, Inc. | Systems and methods of multiple voice services |
US11183183B2 (en) | 2018-12-07 | 2021-11-23 | Sonos, Inc. | Systems and methods of operating media playback systems having multiple voice assistant services |
US11189286B2 (en) | 2019-10-22 | 2021-11-30 | Sonos, Inc. | VAS toggle based on device orientation |
US11197096B2 (en) | 2018-06-28 | 2021-12-07 | Sonos, Inc. | Systems and methods for associating playback devices with voice assistant services |
US11200894B2 (en) | 2019-06-12 | 2021-12-14 | Sonos, Inc. | Network microphone device with command keyword eventing |
US11200889B2 (en) | 2018-11-15 | 2021-12-14 | Sonos, Inc. | Dilated convolutions and gating for efficient keyword spotting |
US11200900B2 (en) | 2019-12-20 | 2021-12-14 | Sonos, Inc. | Offline voice control |
US11302326B2 (en) | 2017-09-28 | 2022-04-12 | Sonos, Inc. | Tone interference cancellation |
US11308962B2 (en) | 2020-05-20 | 2022-04-19 | Sonos, Inc. | Input detection windowing |
US11308958B2 (en) | 2020-02-07 | 2022-04-19 | Sonos, Inc. | Localized wakeword verification |
US11315556B2 (en) | 2019-02-08 | 2022-04-26 | Sonos, Inc. | Devices, systems, and methods for distributed voice processing by transmitting sound data associated with a wake word to an appropriate device for identification |
US11343614B2 (en) | 2018-01-31 | 2022-05-24 | Sonos, Inc. | Device designation of playback and network microphone device arrangements |
US11361756B2 (en) | 2019-06-12 | 2022-06-14 | Sonos, Inc. | Conditional wake word eventing based on environment |
US11380322B2 (en) | 2017-08-07 | 2022-07-05 | Sonos, Inc. | Wake-word detection suppression |
US11405430B2 (en) | 2016-02-22 | 2022-08-02 | Sonos, Inc. | Networked microphone device control |
US11432030B2 (en) | 2018-09-14 | 2022-08-30 | Sonos, Inc. | Networked devices, systems, and methods for associating playback devices based on sound codes |
US11482978B2 (en) | 2018-08-28 | 2022-10-25 | Sonos, Inc. | Audio notifications |
US11482224B2 (en) | 2020-05-20 | 2022-10-25 | Sonos, Inc. | Command keywords with input detection windowing |
US11501773B2 (en) | 2019-06-12 | 2022-11-15 | Sonos, Inc. | Network microphone device with command keyword conditioning |
JP2022188251A (ja) * | 2018-08-23 | 2022-12-20 | グーグル エルエルシー | マルチアシスタント環境の特性によるアシスタント応答性の規制 |
US11551700B2 (en) | 2021-01-25 | 2023-01-10 | Sonos, Inc. | Systems and methods for power-efficient keyword detection |
US11556306B2 (en) | 2016-02-22 | 2023-01-17 | Sonos, Inc. | Voice controlled media playback system |
US11556307B2 (en) | 2020-01-31 | 2023-01-17 | Sonos, Inc. | Local voice data processing |
US11562740B2 (en) | 2020-01-07 | 2023-01-24 | Sonos, Inc. | Voice verification for media playback |
US11641559B2 (en) | 2016-09-27 | 2023-05-02 | Sonos, Inc. | Audio playback settings for voice interaction |
US11646023B2 (en) | 2019-02-08 | 2023-05-09 | Sonos, Inc. | Devices, systems, and methods for distributed voice processing |
US11664023B2 (en) | 2016-07-15 | 2023-05-30 | Sonos, Inc. | Voice detection by multiple devices |
US11676590B2 (en) | 2017-12-11 | 2023-06-13 | Sonos, Inc. | Home graph |
US11698771B2 (en) | 2020-08-25 | 2023-07-11 | Sonos, Inc. | Vocal guidance engines for playback devices |
US11727919B2 (en) | 2020-05-20 | 2023-08-15 | Sonos, Inc. | Memory allocation for keyword spotting engines |
US11798553B2 (en) | 2019-05-03 | 2023-10-24 | Sonos, Inc. | Voice assistant persistence across multiple network microphone devices |
US11875820B1 (en) | 2017-08-15 | 2024-01-16 | Amazon Technologies, Inc. | Context driven device arbitration |
US11899519B2 (en) | 2018-10-23 | 2024-02-13 | Sonos, Inc. | Multiple stage network microphone device with reduced power consumption and processing load |
US11984123B2 (en) | 2020-11-12 | 2024-05-14 | Sonos, Inc. | Network device interaction by range |
US12046241B2 (en) | 2014-10-09 | 2024-07-23 | Google Llc | Device leadership negotiation among voice interface devices |
-
2002
- 2002-01-29 JP JP2002019457A patent/JP4086280B2/ja not_active Expired - Fee Related
Cited By (202)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4581441B2 (ja) * | 2004-03-18 | 2010-11-17 | パナソニック株式会社 | 家電機器システム、家電機器および音声認識方法 |
JP2005266192A (ja) * | 2004-03-18 | 2005-09-29 | Matsushita Electric Ind Co Ltd | 音声認識装置および音声認識方法 |
JP2008064885A (ja) * | 2006-09-05 | 2008-03-21 | Honda Motor Co Ltd | 音声認識装置、音声認識方法、及び音声認識プログラム |
US10818286B2 (en) | 2010-06-24 | 2020-10-27 | Honda Motor Co., Ltd. | Communication system and method between an on-vehicle voice recognition system and an off-vehicle voice recognition system |
JP2013529794A (ja) * | 2010-06-24 | 2013-07-22 | 本田技研工業株式会社 | 車載音声認識システム及び車両外音声認識システム間の通信システム及び方法 |
US9564132B2 (en) | 2010-06-24 | 2017-02-07 | Honda Motor Co., Ltd. | Communication system and method between an on-vehicle voice recognition system and an off-vehicle voice recognition system |
US10269348B2 (en) | 2010-06-24 | 2019-04-23 | Honda Motor Co., Ltd. | Communication system and method between an on-vehicle voice recognition system and an off-vehicle voice recognition system |
US9620121B2 (en) | 2010-06-24 | 2017-04-11 | Honda Motor Co., Ltd. | Communication system and method between an on-vehicle voice recognition system and an off-vehicle voice recognition system |
JP2012063582A (ja) * | 2010-09-16 | 2012-03-29 | Denso Corp | 車載音声認識装置 |
KR20130088637A (ko) * | 2012-01-31 | 2013-08-08 | 삼성전자주식회사 | 디스플레이장치 및 그 음성인식방법 |
JP2020038387A (ja) * | 2012-06-18 | 2020-03-12 | エイディシーテクノロジー株式会社 | 音声応答装置 |
US9576591B2 (en) | 2012-09-28 | 2017-02-21 | Samsung Electronics Co., Ltd. | Electronic apparatus and control method of the same |
JP2016512632A (ja) * | 2013-03-15 | 2016-04-28 | インテル コーポレイション | 音声およびジェスチャー・コマンド領域を割り当てるためのシステムおよび方法 |
JP2015141226A (ja) * | 2014-01-27 | 2015-08-03 | パイオニア株式会社 | 情報処理装置 |
JP2022017569A (ja) * | 2014-10-09 | 2022-01-25 | グーグル エルエルシー | 複数のデバイス上でのホットワード検出 |
US12046241B2 (en) | 2014-10-09 | 2024-07-23 | Google Llc | Device leadership negotiation among voice interface devices |
JP7022733B2 (ja) | 2014-10-09 | 2022-02-18 | グーグル エルエルシー | 複数のデバイス上でのホットワード検出 |
JP7354210B2 (ja) | 2014-10-09 | 2023-10-02 | グーグル エルエルシー | 複数のデバイス上でのホットワード検出 |
US11915706B2 (en) | 2014-10-09 | 2024-02-27 | Google Llc | Hotword detection on multiple devices |
JP2020034952A (ja) * | 2014-10-09 | 2020-03-05 | グーグル エルエルシー | 複数のデバイス上でのホットワード検出 |
JP2022008594A (ja) * | 2015-08-19 | 2022-01-13 | 華為技術有限公司 | 通信方法、サーバー、およびデバイス |
US11049499B2 (en) | 2015-08-19 | 2021-06-29 | Huawei Technologies Co., Ltd. | Communication method, server, and device |
JP2020003804A (ja) * | 2015-08-19 | 2020-01-09 | 華為技術有限公司Huawei Technologies Co.,Ltd. | 通信方法、サーバー、およびデバイス |
US12094462B2 (en) | 2015-08-19 | 2024-09-17 | Huawei Technologies Co., Ltd. | Communication method, server, and device |
KR102089485B1 (ko) * | 2015-09-11 | 2020-03-17 | 아마존 테크놀로지스, 인크. | 음성-인에이블 디바이스들 간 중재 |
JP2018532151A (ja) * | 2015-09-11 | 2018-11-01 | アマゾン テクノロジーズ インコーポレイテッド | 音声対応デバイス間の調停 |
KR20180039135A (ko) * | 2015-09-11 | 2018-04-17 | 아마존 테크놀로지스, 인크. | 음성-인에이블 디바이스들 간 중재 |
KR20180042376A (ko) * | 2015-09-21 | 2018-04-25 | 아마존 테크놀로지스, 인크. | 응답을 제공하기 위한 디바이스 선택 |
JP2020016890A (ja) * | 2015-09-21 | 2020-01-30 | アマゾン テクノロジーズ インコーポレイテッド | 応答を提供するための装置選択 |
JP2018537700A (ja) * | 2015-09-21 | 2018-12-20 | アマゾン テクノロジーズ インコーポレイテッド | 応答を提供するための装置選択 |
KR102098136B1 (ko) * | 2015-09-21 | 2020-04-08 | 아마존 테크놀로지스, 인크. | 응답을 제공하기 위한 디바이스 선택 |
US11922095B2 (en) | 2015-09-21 | 2024-03-05 | Amazon Technologies, Inc. | Device selection for providing a response |
JP7213856B2 (ja) | 2015-09-30 | 2023-01-27 | アップル インコーポレイテッド | インテリジェントなデバイス識別 |
US12051413B2 (en) | 2015-09-30 | 2024-07-30 | Apple Inc. | Intelligent device identification |
US11587559B2 (en) | 2015-09-30 | 2023-02-21 | Apple Inc. | Intelligent device identification |
CN113407148A (zh) * | 2015-09-30 | 2021-09-17 | 苹果公司 | 智能设备识别 |
JP2021007259A (ja) * | 2015-09-30 | 2021-01-21 | アップル インコーポレイテッドApple Inc. | インテリジェントなデバイス識別 |
JP2017107333A (ja) * | 2015-12-08 | 2017-06-15 | キヤノン株式会社 | 通信機器及び通信機器の制御方法 |
JP2020095737A (ja) * | 2015-12-08 | 2020-06-18 | キヤノン株式会社 | 通信装置、制御方法、およびプログラム |
US11513763B2 (en) | 2016-02-22 | 2022-11-29 | Sonos, Inc. | Audio response playback |
US10971139B2 (en) | 2016-02-22 | 2021-04-06 | Sonos, Inc. | Voice control of a media playback system |
US12047752B2 (en) | 2016-02-22 | 2024-07-23 | Sonos, Inc. | Content mixing |
JP7026078B2 (ja) | 2016-02-22 | 2022-02-25 | ソノズ インコーポレイテッド | メディア再生システムの音声制御 |
US11983463B2 (en) | 2016-02-22 | 2024-05-14 | Sonos, Inc. | Metadata exchange involving a networked playback system and a networked microphone system |
JP2022020760A (ja) * | 2016-02-22 | 2022-02-01 | ソノズ インコーポレイテッド | メディア再生システムの音声制御 |
JP2022008837A (ja) * | 2016-02-22 | 2022-01-14 | ソノズ インコーポレイテッド | オーディオ応答再生 |
US11212612B2 (en) | 2016-02-22 | 2021-12-28 | Sonos, Inc. | Voice control of a media playback system |
US11405430B2 (en) | 2016-02-22 | 2022-08-02 | Sonos, Inc. | Networked microphone device control |
US11514898B2 (en) | 2016-02-22 | 2022-11-29 | Sonos, Inc. | Voice control of a media playback system |
US11184704B2 (en) | 2016-02-22 | 2021-11-23 | Sonos, Inc. | Music service selection |
US11863593B2 (en) | 2016-02-22 | 2024-01-02 | Sonos, Inc. | Networked microphone device control |
US11832068B2 (en) | 2016-02-22 | 2023-11-28 | Sonos, Inc. | Music service selection |
US11556306B2 (en) | 2016-02-22 | 2023-01-17 | Sonos, Inc. | Voice controlled media playback system |
JP7346516B2 (ja) | 2016-02-22 | 2023-09-19 | ソノズ インコーポレイテッド | オーディオ応答再生 |
US11137979B2 (en) | 2016-02-22 | 2021-10-05 | Sonos, Inc. | Metadata exchange involving a networked playback system and a networked microphone system |
US11750969B2 (en) | 2016-02-22 | 2023-09-05 | Sonos, Inc. | Default playback device designation |
US10743101B2 (en) | 2016-02-22 | 2020-08-11 | Sonos, Inc. | Content mixing |
US10970035B2 (en) | 2016-02-22 | 2021-04-06 | Sonos, Inc. | Audio response playback |
US11006214B2 (en) | 2016-02-22 | 2021-05-11 | Sonos, Inc. | Default playback device designation |
US11736860B2 (en) | 2016-02-22 | 2023-08-22 | Sonos, Inc. | Voice control of a media playback system |
US11726742B2 (en) | 2016-02-22 | 2023-08-15 | Sonos, Inc. | Handling of loss of pairing between networked devices |
US10764679B2 (en) | 2016-02-22 | 2020-09-01 | Sonos, Inc. | Voice control of a media playback system |
US10847143B2 (en) | 2016-02-22 | 2020-11-24 | Sonos, Inc. | Voice control of a media playback system |
US11042355B2 (en) | 2016-02-22 | 2021-06-22 | Sonos, Inc. | Handling of loss of pairing between networked devices |
JP2019168696A (ja) * | 2016-02-22 | 2019-10-03 | ソノズ インコーポレイテッド | メディア再生システムの音声制御 |
JP2019146229A (ja) * | 2016-02-22 | 2019-08-29 | ソノズ インコーポレイテッド | オーディオ応答再生 |
US11545169B2 (en) | 2016-06-09 | 2023-01-03 | Sonos, Inc. | Dynamic player selection for audio signal processing |
US10714115B2 (en) | 2016-06-09 | 2020-07-14 | Sonos, Inc. | Dynamic player selection for audio signal processing |
US11133018B2 (en) | 2016-06-09 | 2021-09-28 | Sonos, Inc. | Dynamic player selection for audio signal processing |
US11979960B2 (en) | 2016-07-15 | 2024-05-07 | Sonos, Inc. | Contextualization of voice inputs |
US11184969B2 (en) | 2016-07-15 | 2021-11-23 | Sonos, Inc. | Contextualization of voice inputs |
US11664023B2 (en) | 2016-07-15 | 2023-05-30 | Sonos, Inc. | Voice detection by multiple devices |
US11531520B2 (en) | 2016-08-05 | 2022-12-20 | Sonos, Inc. | Playback device supporting concurrent voice assistants |
US10847164B2 (en) | 2016-08-05 | 2020-11-24 | Sonos, Inc. | Playback device supporting concurrent voice assistants |
US11641559B2 (en) | 2016-09-27 | 2023-05-02 | Sonos, Inc. | Audio playback settings for voice interaction |
US11516610B2 (en) | 2016-09-30 | 2022-11-29 | Sonos, Inc. | Orientation-based playback device microphone selection |
US10873819B2 (en) | 2016-09-30 | 2020-12-22 | Sonos, Inc. | Orientation-based playback device microphone selection |
CN113140218A (zh) * | 2016-10-03 | 2021-07-20 | 谷歌有限责任公司 | 基于装置拓扑结构来处理语音命令 |
JP2020126248A (ja) * | 2016-10-03 | 2020-08-20 | グーグル エルエルシー | デバイストポロジーに基づく音声コマンドの処理 |
JP2020502555A (ja) * | 2016-10-19 | 2020-01-23 | ソノズ インコーポレイテッド | アービトレーションに基づく音声認識 |
JP2020098364A (ja) * | 2016-10-19 | 2020-06-25 | ソノズ インコーポレイテッド | アービトレーションに基づく音声認識 |
US11308961B2 (en) | 2016-10-19 | 2022-04-19 | Sonos, Inc. | Arbitration-based voice recognition |
JP2021119414A (ja) * | 2016-10-19 | 2021-08-12 | ソノズ インコーポレイテッド | アービトレーションに基づく音声認識 |
US11727933B2 (en) | 2016-10-19 | 2023-08-15 | Sonos, Inc. | Arbitration-based voice recognition |
US10614807B2 (en) | 2016-10-19 | 2020-04-07 | Sonos, Inc. | Arbitration-based voice recognition |
JP7108084B2 (ja) | 2016-10-19 | 2022-07-27 | ソノズ インコーポレイテッド | アービトレーションに基づく音声認識 |
KR20220098808A (ko) * | 2016-11-18 | 2022-07-12 | 구글 엘엘씨 | 컴퓨팅 디바이스 근처의 가상 어시스턴트 식별 |
KR102552555B1 (ko) | 2016-11-18 | 2023-07-06 | 구글 엘엘씨 | 컴퓨팅 디바이스 근처의 가상 어시스턴트 식별 |
KR102278659B1 (ko) * | 2016-11-18 | 2021-07-16 | 구글 엘엘씨 | 컴퓨팅 디바이스 근처의 가상 어시스턴트 식별 |
US11380331B1 (en) | 2016-11-18 | 2022-07-05 | Google Llc | Virtual assistant identification of nearby computing devices |
US11270705B2 (en) | 2016-11-18 | 2022-03-08 | Google Llc | Virtual assistant identification of nearby computing devices |
KR20210090735A (ko) * | 2016-11-18 | 2021-07-20 | 구글 엘엘씨 | 컴퓨팅 디바이스 근처의 가상 어시스턴트 식별 |
US11087765B2 (en) | 2016-11-18 | 2021-08-10 | Google Llc | Virtual assistant identification of nearby computing devices |
KR102416384B1 (ko) | 2016-11-18 | 2022-07-05 | 구글 엘엘씨 | 컴퓨팅 디바이스 근처의 가상 어시스턴트 식별 |
KR20190077059A (ko) * | 2016-11-18 | 2019-07-02 | 구글 엘엘씨 | 컴퓨팅 디바이스 근처의 가상 어시스턴트 식별 |
US11908479B2 (en) | 2016-11-18 | 2024-02-20 | Google Llc | Virtual assistant identification of nearby computing devices |
US20210201915A1 (en) | 2016-11-18 | 2021-07-01 | Google Llc | Virtual assistant identification of nearby computing devices |
US11227600B2 (en) | 2016-11-18 | 2022-01-18 | Google Llc | Virtual assistant identification of nearby computing devices |
US11183181B2 (en) | 2017-03-27 | 2021-11-23 | Sonos, Inc. | Systems and methods of multiple voice services |
JP2019028388A (ja) * | 2017-08-03 | 2019-02-21 | シャープ株式会社 | 家電装置システム |
JP6997554B2 (ja) | 2017-08-03 | 2022-01-17 | シャープ株式会社 | 家電装置システム |
US11900937B2 (en) | 2017-08-07 | 2024-02-13 | Sonos, Inc. | Wake-word detection suppression |
US11380322B2 (en) | 2017-08-07 | 2022-07-05 | Sonos, Inc. | Wake-word detection suppression |
US11875820B1 (en) | 2017-08-15 | 2024-01-16 | Amazon Technologies, Inc. | Context driven device arbitration |
US11080005B2 (en) | 2017-09-08 | 2021-08-03 | Sonos, Inc. | Dynamic computation of system response volume |
US11500611B2 (en) | 2017-09-08 | 2022-11-15 | Sonos, Inc. | Dynamic computation of system response volume |
US11646045B2 (en) | 2017-09-27 | 2023-05-09 | Sonos, Inc. | Robust short-time fourier transform acoustic echo cancellation during audio playback |
US11017789B2 (en) | 2017-09-27 | 2021-05-25 | Sonos, Inc. | Robust Short-Time Fourier Transform acoustic echo cancellation during audio playback |
US12047753B1 (en) | 2017-09-28 | 2024-07-23 | Sonos, Inc. | Three-dimensional beam forming with a microphone array |
US11538451B2 (en) | 2017-09-28 | 2022-12-27 | Sonos, Inc. | Multi-channel acoustic echo cancellation |
US10880644B1 (en) | 2017-09-28 | 2020-12-29 | Sonos, Inc. | Three-dimensional beam forming with a microphone array |
US11769505B2 (en) | 2017-09-28 | 2023-09-26 | Sonos, Inc. | Echo of tone interferance cancellation using two acoustic echo cancellers |
US11302326B2 (en) | 2017-09-28 | 2022-04-12 | Sonos, Inc. | Tone interference cancellation |
US10891932B2 (en) | 2017-09-28 | 2021-01-12 | Sonos, Inc. | Multi-channel acoustic echo cancellation |
US10606555B1 (en) | 2017-09-29 | 2020-03-31 | Sonos, Inc. | Media playback system with concurrent voice assistance |
US11893308B2 (en) | 2017-09-29 | 2024-02-06 | Sonos, Inc. | Media playback system with concurrent voice assistance |
US11175888B2 (en) | 2017-09-29 | 2021-11-16 | Sonos, Inc. | Media playback system with concurrent voice assistance |
US11288039B2 (en) | 2017-09-29 | 2022-03-29 | Sonos, Inc. | Media playback system with concurrent voice assistance |
JP2021513693A (ja) * | 2017-12-08 | 2021-05-27 | グーグル エルエルシーGoogle LLC | デジタル音声アシスタントコンピューティングデバイスの間の信号処理の調整 |
US10880650B2 (en) | 2017-12-10 | 2020-12-29 | Sonos, Inc. | Network microphone devices with automatic do not disturb actuation capabilities |
US11451908B2 (en) | 2017-12-10 | 2022-09-20 | Sonos, Inc. | Network microphone devices with automatic do not disturb actuation capabilities |
US11676590B2 (en) | 2017-12-11 | 2023-06-13 | Sonos, Inc. | Home graph |
US11689858B2 (en) | 2018-01-31 | 2023-06-27 | Sonos, Inc. | Device designation of playback and network microphone device arrangements |
US11343614B2 (en) | 2018-01-31 | 2022-05-24 | Sonos, Inc. | Device designation of playback and network microphone device arrangements |
US11175880B2 (en) | 2018-05-10 | 2021-11-16 | Sonos, Inc. | Systems and methods for voice-assisted media content selection |
US11797263B2 (en) | 2018-05-10 | 2023-10-24 | Sonos, Inc. | Systems and methods for voice-assisted media content selection |
US10847178B2 (en) | 2018-05-18 | 2020-11-24 | Sonos, Inc. | Linear filtering for noise-suppressed speech detection |
US11715489B2 (en) | 2018-05-18 | 2023-08-01 | Sonos, Inc. | Linear filtering for noise-suppressed speech detection |
US11792590B2 (en) | 2018-05-25 | 2023-10-17 | Sonos, Inc. | Determining and adapting to changes in microphone performance of playback devices |
US10959029B2 (en) | 2018-05-25 | 2021-03-23 | Sonos, Inc. | Determining and adapting to changes in microphone performance of playback devices |
US11197096B2 (en) | 2018-06-28 | 2021-12-07 | Sonos, Inc. | Systems and methods for associating playback devices with voice assistant services |
US11696074B2 (en) | 2018-06-28 | 2023-07-04 | Sonos, Inc. | Systems and methods for associating playback devices with voice assistant services |
JP2020030245A (ja) * | 2018-08-20 | 2020-02-27 | Zホールディングス株式会社 | 端末装置、決定方法、決定プログラム及び決定装置 |
JP7018850B2 (ja) | 2018-08-20 | 2022-02-14 | ヤフー株式会社 | 端末装置、決定方法、決定プログラム及び決定装置 |
JP7499304B2 (ja) | 2018-08-23 | 2024-06-13 | グーグル エルエルシー | マルチアシスタント環境の特性によるアシスタント応答性の規制 |
US12087300B2 (en) | 2018-08-23 | 2024-09-10 | Google Llc | Regulating assistant responsiveness according to characteristics of a multi-assistant environment |
JP2022188251A (ja) * | 2018-08-23 | 2022-12-20 | グーグル エルエルシー | マルチアシスタント環境の特性によるアシスタント応答性の規制 |
US11482978B2 (en) | 2018-08-28 | 2022-10-25 | Sonos, Inc. | Audio notifications |
US11563842B2 (en) | 2018-08-28 | 2023-01-24 | Sonos, Inc. | Do not disturb feature for audio notifications |
US11076035B2 (en) | 2018-08-28 | 2021-07-27 | Sonos, Inc. | Do not disturb feature for audio notifications |
US11551690B2 (en) | 2018-09-14 | 2023-01-10 | Sonos, Inc. | Networked devices, systems, and methods for intelligently deactivating wake-word engines |
US10878811B2 (en) | 2018-09-14 | 2020-12-29 | Sonos, Inc. | Networked devices, systems, and methods for intelligently deactivating wake-word engines |
US11432030B2 (en) | 2018-09-14 | 2022-08-30 | Sonos, Inc. | Networked devices, systems, and methods for associating playback devices based on sound codes |
US11778259B2 (en) | 2018-09-14 | 2023-10-03 | Sonos, Inc. | Networked devices, systems and methods for associating playback devices based on sound codes |
US11024331B2 (en) | 2018-09-21 | 2021-06-01 | Sonos, Inc. | Voice detection optimization using sound metadata |
US11790937B2 (en) | 2018-09-21 | 2023-10-17 | Sonos, Inc. | Voice detection optimization using sound metadata |
US10811015B2 (en) | 2018-09-25 | 2020-10-20 | Sonos, Inc. | Voice detection optimization based on selected voice assistant service |
US11031014B2 (en) | 2018-09-25 | 2021-06-08 | Sonos, Inc. | Voice detection optimization based on selected voice assistant service |
US11727936B2 (en) | 2018-09-25 | 2023-08-15 | Sonos, Inc. | Voice detection optimization based on selected voice assistant service |
US11790911B2 (en) | 2018-09-28 | 2023-10-17 | Sonos, Inc. | Systems and methods for selective wake word detection using neural network models |
US11100923B2 (en) | 2018-09-28 | 2021-08-24 | Sonos, Inc. | Systems and methods for selective wake word detection using neural network models |
US12062383B2 (en) | 2018-09-29 | 2024-08-13 | Sonos, Inc. | Linear filtering for noise-suppressed speech detection via multiple network microphone devices |
US11501795B2 (en) | 2018-09-29 | 2022-11-15 | Sonos, Inc. | Linear filtering for noise-suppressed speech detection via multiple network microphone devices |
US10692518B2 (en) | 2018-09-29 | 2020-06-23 | Sonos, Inc. | Linear filtering for noise-suppressed speech detection via multiple network microphone devices |
US11899519B2 (en) | 2018-10-23 | 2024-02-13 | Sonos, Inc. | Multiple stage network microphone device with reduced power consumption and processing load |
US11741948B2 (en) | 2018-11-15 | 2023-08-29 | Sonos Vox France Sas | Dilated convolutions and gating for efficient keyword spotting |
US11200889B2 (en) | 2018-11-15 | 2021-12-14 | Sonos, Inc. | Dilated convolutions and gating for efficient keyword spotting |
JP2020086977A (ja) * | 2018-11-27 | 2020-06-04 | プラス株式会社 | 翻訳装置 |
US11557294B2 (en) | 2018-12-07 | 2023-01-17 | Sonos, Inc. | Systems and methods of operating media playback systems having multiple voice assistant services |
US11183183B2 (en) | 2018-12-07 | 2021-11-23 | Sonos, Inc. | Systems and methods of operating media playback systems having multiple voice assistant services |
US11538460B2 (en) | 2018-12-13 | 2022-12-27 | Sonos, Inc. | Networked microphone devices, systems, and methods of localized arbitration |
US11132989B2 (en) | 2018-12-13 | 2021-09-28 | Sonos, Inc. | Networked microphone devices, systems, and methods of localized arbitration |
US11159880B2 (en) | 2018-12-20 | 2021-10-26 | Sonos, Inc. | Optimization of network microphone devices using noise classification |
US11540047B2 (en) | 2018-12-20 | 2022-12-27 | Sonos, Inc. | Optimization of network microphone devices using noise classification |
US11315556B2 (en) | 2019-02-08 | 2022-04-26 | Sonos, Inc. | Devices, systems, and methods for distributed voice processing by transmitting sound data associated with a wake word to an appropriate device for identification |
US11646023B2 (en) | 2019-02-08 | 2023-05-09 | Sonos, Inc. | Devices, systems, and methods for distributed voice processing |
JP2020181016A (ja) * | 2019-04-23 | 2020-11-05 | コニカミノルタ株式会社 | 情報処理システム、情報処理装置、端末装置、およびプログラム |
US11798553B2 (en) | 2019-05-03 | 2023-10-24 | Sonos, Inc. | Voice assistant persistence across multiple network microphone devices |
US11854547B2 (en) | 2019-06-12 | 2023-12-26 | Sonos, Inc. | Network microphone device with command keyword eventing |
US11200894B2 (en) | 2019-06-12 | 2021-12-14 | Sonos, Inc. | Network microphone device with command keyword eventing |
US11361756B2 (en) | 2019-06-12 | 2022-06-14 | Sonos, Inc. | Conditional wake word eventing based on environment |
US11501773B2 (en) | 2019-06-12 | 2022-11-15 | Sonos, Inc. | Network microphone device with command keyword conditioning |
US11138975B2 (en) | 2019-07-31 | 2021-10-05 | Sonos, Inc. | Locally distributed keyword detection |
US11710487B2 (en) | 2019-07-31 | 2023-07-25 | Sonos, Inc. | Locally distributed keyword detection |
US11551669B2 (en) | 2019-07-31 | 2023-01-10 | Sonos, Inc. | Locally distributed keyword detection |
US11138969B2 (en) | 2019-07-31 | 2021-10-05 | Sonos, Inc. | Locally distributed keyword detection |
US10871943B1 (en) | 2019-07-31 | 2020-12-22 | Sonos, Inc. | Noise classification for event detection |
US11714600B2 (en) | 2019-07-31 | 2023-08-01 | Sonos, Inc. | Noise classification for event detection |
US11354092B2 (en) | 2019-07-31 | 2022-06-07 | Sonos, Inc. | Noise classification for event detection |
US11862161B2 (en) | 2019-10-22 | 2024-01-02 | Sonos, Inc. | VAS toggle based on device orientation |
US11189286B2 (en) | 2019-10-22 | 2021-11-30 | Sonos, Inc. | VAS toggle based on device orientation |
US11869503B2 (en) | 2019-12-20 | 2024-01-09 | Sonos, Inc. | Offline voice control |
US11200900B2 (en) | 2019-12-20 | 2021-12-14 | Sonos, Inc. | Offline voice control |
US11562740B2 (en) | 2020-01-07 | 2023-01-24 | Sonos, Inc. | Voice verification for media playback |
CN111276139B (zh) * | 2020-01-07 | 2023-09-19 | 百度在线网络技术(北京)有限公司 | 语音唤醒方法及装置 |
CN111276139A (zh) * | 2020-01-07 | 2020-06-12 | 百度在线网络技术(北京)有限公司 | 语音唤醒方法及装置 |
JP2021111359A (ja) * | 2020-01-07 | 2021-08-02 | バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド | 音声ウェイクアップ方法及び装置 |
JP7239544B2 (ja) | 2020-01-07 | 2023-03-14 | バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド | 音声ウェイクアップ方法及び装置 |
US11556307B2 (en) | 2020-01-31 | 2023-01-17 | Sonos, Inc. | Local voice data processing |
US11961519B2 (en) | 2020-02-07 | 2024-04-16 | Sonos, Inc. | Localized wakeword verification |
US11308958B2 (en) | 2020-02-07 | 2022-04-19 | Sonos, Inc. | Localized wakeword verification |
JP2020129130A (ja) * | 2020-04-27 | 2020-08-27 | パイオニア株式会社 | 情報処理装置 |
JP2022071159A (ja) * | 2020-04-27 | 2022-05-13 | パイオニア株式会社 | 情報処理装置 |
US11694689B2 (en) | 2020-05-20 | 2023-07-04 | Sonos, Inc. | Input detection windowing |
US11727919B2 (en) | 2020-05-20 | 2023-08-15 | Sonos, Inc. | Memory allocation for keyword spotting engines |
US11308962B2 (en) | 2020-05-20 | 2022-04-19 | Sonos, Inc. | Input detection windowing |
US11482224B2 (en) | 2020-05-20 | 2022-10-25 | Sonos, Inc. | Command keywords with input detection windowing |
US11698771B2 (en) | 2020-08-25 | 2023-07-11 | Sonos, Inc. | Vocal guidance engines for playback devices |
JP2021002062A (ja) * | 2020-09-17 | 2021-01-07 | シャープ株式会社 | 応答システム |
JP7077375B2 (ja) | 2020-09-17 | 2022-05-30 | シャープ株式会社 | 応答システム |
US11984123B2 (en) | 2020-11-12 | 2024-05-14 | Sonos, Inc. | Network device interaction by range |
US11551700B2 (en) | 2021-01-25 | 2023-01-10 | Sonos, Inc. | Systems and methods for power-efficient keyword detection |
Also Published As
Publication number | Publication date |
---|---|
JP4086280B2 (ja) | 2008-05-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4086280B2 (ja) | 音声入力システム、音声入力方法及び音声入力プログラム | |
KR102098136B1 (ko) | 응답을 제공하기 위한 디바이스 선택 | |
KR102543693B1 (ko) | 전자 장치 및 그의 동작 방법 | |
KR102293063B1 (ko) | 사용자 정의 가능한 웨이크업 음성 명령 | |
US11949818B1 (en) | Selecting user device during communications session | |
JP6819672B2 (ja) | 情報処理装置、情報処理方法、及びプログラム | |
JP6402748B2 (ja) | 音声対話装置および発話制御方法 | |
KR102628211B1 (ko) | 전자 장치 및 그 제어 방법 | |
US11862153B1 (en) | System for recognizing and responding to environmental noises | |
KR20190096308A (ko) | 전자기기 | |
WO2019187521A1 (ja) | 音声情報送信装置、音声情報送信方法、音声情報送信プログラム、音声情報解析システム及び音声情報解析サーバ | |
JP2006243555A (ja) | 対応決定システム、ロボット、イベント出力サーバ、および対応決定方法 | |
JP7456387B2 (ja) | 情報処理装置、及び情報処理方法 | |
US11657821B2 (en) | Information processing apparatus, information processing system, and information processing method to execute voice response corresponding to a situation of a user | |
JP2001188551A (ja) | 情報処理装置および方法、並びに記録媒体 | |
JP3846500B2 (ja) | 音声認識対話装置および音声認識対話処理方法 | |
JP5610283B2 (ja) | 外部機器制御装置、その外部機器制御方法及びプログラム | |
US11935449B2 (en) | Information processing apparatus and information processing method | |
TWI833678B (zh) | 真實多人應答情境下的生成式聊天機器人之系統及其方法 | |
EP3839719B1 (en) | Computing device and method of operating the same | |
US20240079007A1 (en) | System and method for detecting a wakeup command for a voice assistant | |
JP2001188896A (ja) | 情報処理装置および方法、並びに記録媒体 | |
WO2019174604A1 (zh) | 电子设备及电子设备控制方法 | |
JP2020061050A (ja) | コミュニケーションシステム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040225 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20050414 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20050606 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20060331 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060509 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060710 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20070323 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070523 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20070719 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080215 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080218 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110228 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120229 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120229 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130228 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140228 Year of fee payment: 6 |
|
LAPS | Cancellation because of no payment of annual fees |