JP2018181330A - 複数のインテリジェントパーソナルアシスタントサービスに対する管理レイヤ - Google Patents
複数のインテリジェントパーソナルアシスタントサービスに対する管理レイヤ Download PDFInfo
- Publication number
- JP2018181330A JP2018181330A JP2018073256A JP2018073256A JP2018181330A JP 2018181330 A JP2018181330 A JP 2018181330A JP 2018073256 A JP2018073256 A JP 2018073256A JP 2018073256 A JP2018073256 A JP 2018073256A JP 2018181330 A JP2018181330 A JP 2018181330A
- Authority
- JP
- Japan
- Prior art keywords
- ipa
- audio signal
- additional
- processors
- response
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000005236 sound signal Effects 0.000 claims abstract description 104
- 230000004913 activation Effects 0.000 claims abstract description 81
- 230000004044 response Effects 0.000 claims abstract description 78
- 230000008859 change Effects 0.000 claims description 36
- 238000000034 method Methods 0.000 claims description 33
- 230000008569 process Effects 0.000 claims description 7
- 230000005540 biological transmission Effects 0.000 claims description 3
- 230000000977 initiatory effect Effects 0.000 claims 2
- 230000001755 vocal effect Effects 0.000 abstract description 6
- 238000012545 processing Methods 0.000 description 45
- 238000004891 communication Methods 0.000 description 31
- 238000001514 detection method Methods 0.000 description 15
- 238000010586 diagram Methods 0.000 description 12
- 230000006870 function Effects 0.000 description 7
- 230000002123 temporal effect Effects 0.000 description 7
- 238000004590 computer program Methods 0.000 description 6
- 230000011218 segmentation Effects 0.000 description 6
- 241000238558 Eucarida Species 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 230000003993 interaction Effects 0.000 description 3
- 238000007796 conventional method Methods 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000009118 appropriate response Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000010267 cellular communication Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/63—Querying
- G06F16/632—Query formulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/68—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/683—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/685—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using automatically derived transcript of audio data, e.g. lyrics
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/088—Word spotting
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Library & Information Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- User Interface Of Digital Computer (AREA)
- Telephonic Communication Services (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
例えば、本願は、以下の項目を提供する。
(項目1)
1つ以上のプロセッサによる実行時に、
第1の音声信号内の起動フレーズを検出することと、
上記起動フレーズを基に、一群の候補のインテリジェントパーソナルアシスタント(IPA)に含まれるIPAを選択することと、
上記第1の音声信号からクエリコンテンツを抽出することと、
上記クエリコンテンツを基に、第2の音声信号を生成することと、
上記第2の音声信号を上記IPAに送信することと
のステップ群を行う音声認識を行うように上記1つ以上のプロセッサを構成する命令を含む、非一時的なコンピュータ可読記憶媒体。
(項目2)
1つ以上のプロセッサによる実行時に、
上記第1の音声信号の追加の起動フレーズを検出することと、
上記追加の起動フレーズを基に、上記一群の候補のIPAに含まれている追加のIPAを選択することと
のステップ群を行うように上記1つ以上のプロセッサを構成する命令をさらに備える、上記項目に記載の非一時的なコンピュータ可読媒体。
(項目3)
1つ以上のプロセッサによる実行時に、上記第2の音声信号を上記追加のIPAに送信するステップを行うように上記1つ以上のプロセッサを構成する命令をさらに備える、上記項目のいずれか一項に記載の非一時的なコンピュータ可読媒体。
(項目4)
1つ以上のプロセッサによる実行時に、
上記追加の起動フレーズに関連する上記第1の音声信号から追加のクエリコンテンツを抽出することと、
上記追加のクエリコンテンツを基に、第3の音声入力を生成することと、
上記第3の音声入力を上記追加のIPAに送信することと
のステップ群を行うように上記1つ以上のプロセッサを構成する命令をさらに備える、上記項目のいずれか一項に記載の非一時的なコンピュータ可読媒体。
(項目5)
1つ以上のプロセッサによる実行時に、
上記IPAから第1の応答音声信号を受信することと、
上記第1の応答音声信号を再生させることと、
上記第1の応答音声信号の再生中に、上記一群の候補のIPAに含まれる追加のIPAから第2の応答音声信号を受信することと、
上記第1の応答音声信号の再生が完了した後、上記第2の応答音声信号の再生を開始することと
のステップ群を行うように上記1つ以上のプロセッサを構成する命令をさらに備える、上記項目のいずれか一項に記載の非一時的なコンピュータ可読媒体。
(項目6)
上記第1の応答音声信号は、上記第2の音声信号の送信に応じて受信される、上記項目のいずれか一項に記載の非一時的なコンピュータ可読媒体。
(項目7)
1つ以上のプロセッサによる実行時に、
上記IPAから第1の応答音声信号を受信することと、
上記第1の応答音声信号を記憶することと、
上記第1の応答音声信号を記憶した後に、上記一群の候補のIPAに含まれる追加のIPAから第2の応答音声信号を受信することと、
上記第1の応答音声信号の再生を開始させる前に、上記第2の応答音声信号の再生を開始させることと
のステップ群を行うように上記1つ以上のプロセッサを構成する命令をさらに備える、上記項目のいずれか一項に記載の非一時的なコンピュータ可読媒体。
(項目8)
1つ以上のプロセッサによる実行時に、
上記第1の音声信号の変更リスナコマンドを検出することと、
上記変更リスナコマンドを基に、追加のIPAを決定することと、
上記第2の音声信号を上記追加のIPAに送信することと
のステップ群を行うように上記1つ以上のプロセッサを構成する命令をさらに備える、上記項目のいずれか一項に記載の非一時的なコンピュータ可読媒体。
(項目9)
変更リスナコマンドを検出することは、上記起動フレーズを発したユーザが音声コマンドを上記一群の候補のIPAに含まれる第2のIPAに向けていることを示すワードまたはフレーズを検出すること備える、上記項目のいずれか一項に記載の非一時的なコンピュータ可読媒体。
(項目10)
インテリジェントパーソナルアシスタント(IPA)管理アプリケーションを記憶するメモリと、
上記メモリに結合される1つ以上のプロセッサであり、上記IPA管理アプリケーションの実行時に、
第1の音声信号内の起動フレーズを検出し、
上記起動フレーズを基に、一群の候補のインテリジェントパーソナルアシスタント(IPA)に含まれるIPAを選択し、
上記第1の音声信号からクエリコンテンツを抽出し、
上記クエリコンテンツを基に、第2の音声信号を生成し、
上記第2の音声信号を上記IPAに送信するように構成される、上記1つ以上のプロセッサと
を備える、システム。
(項目11)
上記1つ以上のプロセッサはさらに、
上記第1の音声信号の変更リスナコマンドを検出することと、
上記変更リスナコマンドを基に、追加のIPAを決定することと、
上記第1の音声信号から追加のクエリコンテンツを抽出することと、
上記追加のクエリコンテンツを基に、第3の音声信号を生成することと、
上記第3の音声信号を上記第2のIPAに送信することと
のステップ群を行うように構成される、上記項目に記載のシステム。
(項目12)
上記追加のクエリコンテンツは音声コマンドを含む、上記項目のいずれか一項に記載のシステム。
(項目13)
上記変更リスナコマンドを基に、上記追加のIPAを決定することは、前回発行された音声コマンド、前回発行された音声クエリ及びどのプロセスがIPAによって現在制御されているかのうちの少なくとも1つを基に、上記追加のIPAを決定することを備える、上記項目のいずれか一項に記載のシステム。
(項目14)
上記前回発行された音声コマンドを基に上記追加のIPAを決定することは、上記追加のIPAが、第2の音声信号を介して上記前回発行された音声コマンドを受信したIPAであることを決定することを備える、上記項目のいずれか一項に記載のシステム。
(項目15)
どのプロセスが上記IPAサービスによって現在制御されているかを基に上記追加のIPAを決定することは、上記追加のIPAが上記プロセスを制御していると決定することを備える、上記項目のいずれか一項に記載のシステム。
(項目16)
上記1つ以上のプロセッサはさらに、
上記第1の音声信号の追加の起動フレーズを検出することと、
上記追加の起動フレーズを基に、上記一群の候補のIPAに含まれる追加のIPAを選択することと
のステップ群を行うように構成される、上記項目のいずれか一項に記載のシステム。
(項目17)
上記1つ以上のプロセッサはさらに、上記第2の音声信号を上記追加のIPAに送信するステップを行うように構成される、上記項目のいずれか一項に記載のシステム。
(項目18)
上記1つ以上のプロセッサはさらに、
上記追加の起動フレーズに関連する上記第1の音声信号から追加のクエリコンテンツを抽出することと、
上記追加のクエリコンテンツを基に、第3の音声入力を生成することと、
上記第3の音声入力を上記追加のIPAに送信することと
のステップ群を行うように構成される、上記項目のいずれか一項に記載のシステム。
(項目19)
第1の音声信号内の起動フレーズを検出することと、
上記起動フレーズを基に、一群の候補のインテリジェントパーソナルアシスタント(IPA)に含まれるIPAを選択することと、
上記第1の音声信号からクエリコンテンツを抽出することと、
上記クエリコンテンツを基に、第2の音声信号を生成することと、
上記第2の音声信号を上記IPAに送信することと
を備える、音声認識を行う方法。
(項目20)
上記第1の音声信号の追加の起動フレーズを検出することと、
上記追加の起動フレーズを基に、上記一群の候補のIPAに含まれる追加のIPAを選択することと
をさらに備える、上記項目に記載の方法。
(摘要)
音声認識をマルチデバイスシステムで行うことは、口頭発話に応じて第1のマイクにより生成された第1の音声信号、及び口頭発話に応じて第2のマイクにより生成された第2の音声信号を受信し、第1の音声信号を一時的セグメントの第1のシーケンスに分割し、第2の音声信号を一時的セグメントの第2のシーケンスに分割し、第1のシーケンスの第1の一時的セグメントに関連する音エネルギーレベルと、第2のシーケンスの第1の一時的セグメントに関連する音エネルギーレベルとを比較し、比較を基に、音声認識音声信号の第1の一時的セグメントとして、第1のシーケンスの第1の一時的セグメント及び第2のシーケンスの第1の一時的セグメントのうちの1つを選択し、音声認識音声信号に音声認識を行うことを含む。
Claims (15)
- 1つ以上のプロセッサによる実行時に、
第1の音声信号内の起動フレーズを検出することと、
前記起動フレーズを基に、一群の候補のインテリジェントパーソナルアシスタント(IPA)に含まれるIPAを選択することと、
前記第1の音声信号からクエリコンテンツを抽出することと、
前記クエリコンテンツを基に、第2の音声信号を生成することと、
前記第2の音声信号を前記IPAに送信することと
のステップ群を行う音声認識を行うように前記1つ以上のプロセッサを構成する命令を含む、非一時的なコンピュータ可読記憶媒体。 - 1つ以上のプロセッサによる実行時に、
前記第1の音声信号の追加の起動フレーズを検出することと、
前記追加の起動フレーズを基に、前記一群の候補のIPAに含まれている追加のIPAを選択することと
のステップ群を行うように前記1つ以上のプロセッサを構成する命令をさらに備える、請求項1に記載の非一時的なコンピュータ可読媒体。 - 1つ以上のプロセッサによる実行時に、前記第2の音声信号を前記追加のIPAに送信するステップを行うように前記1つ以上のプロセッサを構成する命令をさらに備える、請求項2に記載の非一時的なコンピュータ可読媒体。
- 1つ以上のプロセッサによる実行時に、
前記追加の起動フレーズに関連する前記第1の音声信号から追加のクエリコンテンツを抽出することと、
前記追加のクエリコンテンツを基に、第3の音声入力を生成することと、
前記第3の音声入力を前記追加のIPAに送信することと
のステップ群を行うように前記1つ以上のプロセッサを構成する命令をさらに備える、請求項2に記載の非一時的なコンピュータ可読媒体。 - 1つ以上のプロセッサによる実行時に、
前記IPAから第1の応答音声信号を受信することと、
前記第1の応答音声信号を再生させることと、
前記第1の応答音声信号の再生中に、前記一群の候補のIPAに含まれる追加のIPAから第2の応答音声信号を受信することと、
前記第1の応答音声信号の再生が完了した後、前記第2の応答音声信号の再生を開始することと
のステップ群を行うように前記1つ以上のプロセッサを構成する命令をさらに備える、請求項1に記載の非一時的なコンピュータ可読媒体。 - 前記第1の応答音声信号は、前記第2の音声信号の送信に応じて受信される、請求項5に記載の非一時的なコンピュータ可読媒体。
- 1つ以上のプロセッサによる実行時に、
前記IPAから第1の応答音声信号を受信することと、
前記第1の応答音声信号を記憶することと、
前記第1の応答音声信号を記憶した後に、前記一群の候補のIPAに含まれる追加のIPAから第2の応答音声信号を受信することと、
前記第1の応答音声信号の再生を開始させる前に、前記第2の応答音声信号の再生を開始させることと
のステップ群を行うように前記1つ以上のプロセッサを構成する命令をさらに備える、請求項1に記載の非一時的なコンピュータ可読媒体。 - 1つ以上のプロセッサによる実行時に、
前記第1の音声信号の変更リスナコマンドを検出することと、
前記変更リスナコマンドを基に、追加のIPAを決定することと、
前記第2の音声信号を前記追加のIPAに送信することと
のステップ群を行うように前記1つ以上のプロセッサを構成する命令をさらに備える、請求項1に記載の非一時的なコンピュータ可読媒体。 - 変更リスナコマンドを検出することは、前記起動フレーズを発したユーザが音声コマンドを前記一群の候補のIPAに含まれる第2のIPAに向けていることを示すワードまたはフレーズを検出すること備える、請求項8に記載の非一時的なコンピュータ可読媒体。
- インテリジェントパーソナルアシスタント(IPA)管理アプリケーションを記憶するメモリと、
前記メモリに結合される1つ以上のプロセッサであり、前記IPA管理アプリケーションの実行時に、
第1の音声信号内の起動フレーズを検出し、
前記起動フレーズを基に、一群の候補のインテリジェントパーソナルアシスタント(IPA)に含まれるIPAを選択し、
前記第1の音声信号からクエリコンテンツを抽出し、
前記クエリコンテンツを基に、第2の音声信号を生成し、
前記第2の音声信号を前記IPAに送信するように構成される、前記1つ以上のプロセッサと
を備える、システム。 - 前記1つ以上のプロセッサはさらに、
前記第1の音声信号の変更リスナコマンドを検出することと、
前記変更リスナコマンドを基に、追加のIPAを決定することと、
前記第1の音声信号から追加のクエリコンテンツを抽出することと、
前記追加のクエリコンテンツを基に、第3の音声信号を生成することと、
前記第3の音声信号を前記第2のIPAに送信することと
のステップ群を行うように構成される、請求項10に記載のシステム。 - 前記変更リスナコマンドを基に、前記追加のIPAを決定することは、前回発行された音声コマンド、前回発行された音声クエリ及びどのプロセスがIPAによって現在制御されているかのうちの少なくとも1つを基に、前記追加のIPAを決定することを備える、請求項11に記載のシステム。
- 前記前回発行された音声コマンドを基に前記追加のIPAを決定することは、前記追加のIPAが、第2の音声信号を介して前記前回発行された音声コマンドを受信したIPAであることを決定することを備える、請求項12に記載のシステム。
- どのプロセスが前記IPAサービスによって現在制御されているかを基に前記追加のIPAを決定することは、前記追加のIPAが前記プロセスを制御していると決定することを備える、請求項12に記載のシステム。
- 第1の音声信号内の起動フレーズを検出することと、
前記起動フレーズを基に、一群の候補のインテリジェントパーソナルアシスタント(IPA)に含まれるIPAを選択することと、
前記第1の音声信号からクエリコンテンツを抽出することと、
前記クエリコンテンツを基に、第2の音声信号を生成することと、
前記第2の音声信号を前記IPAに送信することと
を備える、音声認識を行う方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US15/487,347 | 2017-04-13 | ||
US15/487,347 US10748531B2 (en) | 2017-04-13 | 2017-04-13 | Management layer for multiple intelligent personal assistant services |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018181330A true JP2018181330A (ja) | 2018-11-15 |
JP7083270B2 JP7083270B2 (ja) | 2022-06-10 |
Family
ID=62063288
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018073256A Active JP7083270B2 (ja) | 2017-04-13 | 2018-04-05 | 複数のインテリジェントパーソナルアシスタントサービスに対する管理レイヤ |
Country Status (4)
Country | Link |
---|---|
US (1) | US10748531B2 (ja) |
EP (1) | EP3389044B1 (ja) |
JP (1) | JP7083270B2 (ja) |
KR (2) | KR20180115628A (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020144274A (ja) * | 2019-03-07 | 2020-09-10 | 本田技研工業株式会社 | エージェント装置、エージェント装置の制御方法、およびプログラム |
JP2020154082A (ja) * | 2019-03-19 | 2020-09-24 | 本田技研工業株式会社 | エージェント装置、エージェント装置の制御方法、およびプログラム |
JP2021004950A (ja) * | 2019-06-25 | 2021-01-14 | 株式会社デンソーテン | 情報処理装置、情報処理システムおよび情報処理方法 |
JP2021117296A (ja) * | 2020-01-23 | 2021-08-10 | トヨタ自動車株式会社 | エージェントシステム、端末装置およびエージェントプログラム |
JP2021117308A (ja) * | 2020-01-23 | 2021-08-10 | トヨタ自動車株式会社 | 情報処理システム、情報処理装置、及びプログラム |
JP2022534648A (ja) * | 2019-10-24 | 2022-08-03 | 株式会社ユニオンプレイス | 個人化された仮想秘書を提供する装置 |
Families Citing this family (78)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9691378B1 (en) * | 2015-11-05 | 2017-06-27 | Amazon Technologies, Inc. | Methods and devices for selectively ignoring captured audio data |
US10509626B2 (en) | 2016-02-22 | 2019-12-17 | Sonos, Inc | Handling of loss of pairing between networked devices |
US9947316B2 (en) | 2016-02-22 | 2018-04-17 | Sonos, Inc. | Voice control of a media playback system |
US9965247B2 (en) | 2016-02-22 | 2018-05-08 | Sonos, Inc. | Voice controlled media playback system based on user profile |
US9772817B2 (en) | 2016-02-22 | 2017-09-26 | Sonos, Inc. | Room-corrected voice detection |
US10264030B2 (en) | 2016-02-22 | 2019-04-16 | Sonos, Inc. | Networked microphone device control |
US10095470B2 (en) | 2016-02-22 | 2018-10-09 | Sonos, Inc. | Audio response playback |
US9978390B2 (en) | 2016-06-09 | 2018-05-22 | Sonos, Inc. | Dynamic player selection for audio signal processing |
US10134399B2 (en) | 2016-07-15 | 2018-11-20 | Sonos, Inc. | Contextualization of voice inputs |
US10115400B2 (en) | 2016-08-05 | 2018-10-30 | Sonos, Inc. | Multiple voice services |
US9942678B1 (en) | 2016-09-27 | 2018-04-10 | Sonos, Inc. | Audio playback settings for voice interaction |
US10181323B2 (en) | 2016-10-19 | 2019-01-15 | Sonos, Inc. | Arbitration-based voice recognition |
US10565191B2 (en) * | 2017-06-05 | 2020-02-18 | International Business Machines Corporation | Cognitive program suite for a cognitive device and a mobile device |
CN107564532A (zh) * | 2017-07-05 | 2018-01-09 | 百度在线网络技术(北京)有限公司 | 电子设备的唤醒方法、装置、设备及计算机可读存储介质 |
BR112019002636A2 (pt) * | 2017-08-02 | 2019-05-28 | Panasonic Ip Man Co Ltd | aparelho de processamento de informação, sistema de reconhecimento de fala e método de processamento de informação |
US10475449B2 (en) | 2017-08-07 | 2019-11-12 | Sonos, Inc. | Wake-word detection suppression |
KR102384643B1 (ko) * | 2017-08-17 | 2022-04-08 | 엘지전자 주식회사 | 전자 장치 및 그 제어 방법 |
US10048930B1 (en) | 2017-09-08 | 2018-08-14 | Sonos, Inc. | Dynamic computation of system response volume |
US10446165B2 (en) | 2017-09-27 | 2019-10-15 | Sonos, Inc. | Robust short-time fourier transform acoustic echo cancellation during audio playback |
US10051366B1 (en) | 2017-09-28 | 2018-08-14 | Sonos, Inc. | Three-dimensional beam forming with a microphone array |
US10621981B2 (en) | 2017-09-28 | 2020-04-14 | Sonos, Inc. | Tone interference cancellation |
US10482868B2 (en) | 2017-09-28 | 2019-11-19 | Sonos, Inc. | Multi-channel acoustic echo cancellation |
US10466962B2 (en) | 2017-09-29 | 2019-11-05 | Sonos, Inc. | Media playback system with voice assistance |
DE102018200088B3 (de) * | 2018-01-04 | 2019-06-13 | Volkswagen Aktiengesellschaft | Verfahren, Vorrichtung und computerlesbares Speichermedium mit Instruktionen zum Verarbeiten einer Spracheingabe, Kraftfahrzeug und Nutzerendgerät mit einer Sprachverarbeitung |
US11343614B2 (en) | 2018-01-31 | 2022-05-24 | Sonos, Inc. | Device designation of playback and network microphone device arrangements |
JP7119218B2 (ja) * | 2018-05-03 | 2022-08-16 | グーグル エルエルシー | オーディオクエリのオーバーラップ処理の協調 |
US11175880B2 (en) | 2018-05-10 | 2021-11-16 | Sonos, Inc. | Systems and methods for voice-assisted media content selection |
US10959029B2 (en) | 2018-05-25 | 2021-03-23 | Sonos, Inc. | Determining and adapting to changes in microphone performance of playback devices |
US11069358B1 (en) * | 2018-05-31 | 2021-07-20 | Amazon Technologies, Inc. | Remote initiation of commands for user devices |
US11437029B2 (en) | 2018-06-05 | 2022-09-06 | Voicify, LLC | Voice application platform |
US10803865B2 (en) * | 2018-06-05 | 2020-10-13 | Voicify, LLC | Voice application platform |
US10636425B2 (en) | 2018-06-05 | 2020-04-28 | Voicify, LLC | Voice application platform |
US10235999B1 (en) | 2018-06-05 | 2019-03-19 | Voicify, LLC | Voice application platform |
US10681460B2 (en) * | 2018-06-28 | 2020-06-09 | Sonos, Inc. | Systems and methods for associating playback devices with voice assistant services |
US10461710B1 (en) | 2018-08-28 | 2019-10-29 | Sonos, Inc. | Media playback system with maximum volume setting |
US11076035B2 (en) | 2018-08-28 | 2021-07-27 | Sonos, Inc. | Do not disturb feature for audio notifications |
US10587430B1 (en) | 2018-09-14 | 2020-03-10 | Sonos, Inc. | Networked devices, systems, and methods for associating playback devices based on sound codes |
US11024331B2 (en) | 2018-09-21 | 2021-06-01 | Sonos, Inc. | Voice detection optimization using sound metadata |
KR20200034430A (ko) * | 2018-09-21 | 2020-03-31 | 삼성전자주식회사 | 전자 장치, 시스템 및 음성 인식 서비스 이용 방법 |
US11100923B2 (en) | 2018-09-28 | 2021-08-24 | Sonos, Inc. | Systems and methods for selective wake word detection using neural network models |
US10692518B2 (en) | 2018-09-29 | 2020-06-23 | Sonos, Inc. | Linear filtering for noise-suppressed speech detection via multiple network microphone devices |
US11899519B2 (en) * | 2018-10-23 | 2024-02-13 | Sonos, Inc. | Multiple stage network microphone device with reduced power consumption and processing load |
EP3654249A1 (en) | 2018-11-15 | 2020-05-20 | Snips | Dilated convolutions and gating for efficient keyword spotting |
FR3089035A1 (fr) * | 2018-11-27 | 2020-05-29 | Psa Automobiles Sa | Procédé d’activation sélective d’assistants personnels virtuels dans un véhicule automobile |
US11183183B2 (en) | 2018-12-07 | 2021-11-23 | Sonos, Inc. | Systems and methods of operating media playback systems having multiple voice assistant services |
US11132989B2 (en) | 2018-12-13 | 2021-09-28 | Sonos, Inc. | Networked microphone devices, systems, and methods of localized arbitration |
US10602268B1 (en) | 2018-12-20 | 2020-03-24 | Sonos, Inc. | Optimization of network microphone devices using noise classification |
US10602276B1 (en) * | 2019-02-06 | 2020-03-24 | Harman International Industries, Incorporated | Intelligent personal assistant |
US10867604B2 (en) | 2019-02-08 | 2020-12-15 | Sonos, Inc. | Devices, systems, and methods for distributed voice processing |
US11315556B2 (en) | 2019-02-08 | 2022-04-26 | Sonos, Inc. | Devices, systems, and methods for distributed voice processing by transmitting sound data associated with a wake word to an appropriate device for identification |
JP7274901B2 (ja) * | 2019-03-25 | 2023-05-17 | 本田技研工業株式会社 | エージェント装置、エージェント装置の制御方法、およびプログラム |
WO2020213758A1 (ko) * | 2019-04-17 | 2020-10-22 | 엘지전자 주식회사 | 음성으로 상호작용하는 인공 지능 장치 및 그 방법 |
US11120794B2 (en) | 2019-05-03 | 2021-09-14 | Sonos, Inc. | Voice assistant persistence across multiple network microphone devices |
US11189279B2 (en) * | 2019-05-22 | 2021-11-30 | Microsoft Technology Licensing, Llc | Activation management for multiple voice assistants |
US11200894B2 (en) | 2019-06-12 | 2021-12-14 | Sonos, Inc. | Network microphone device with command keyword eventing |
US11361756B2 (en) | 2019-06-12 | 2022-06-14 | Sonos, Inc. | Conditional wake word eventing based on environment |
US10586540B1 (en) | 2019-06-12 | 2020-03-10 | Sonos, Inc. | Network microphone device with command keyword conditioning |
US11138975B2 (en) | 2019-07-31 | 2021-10-05 | Sonos, Inc. | Locally distributed keyword detection |
US10871943B1 (en) | 2019-07-31 | 2020-12-22 | Sonos, Inc. | Noise classification for event detection |
CN110474973B (zh) * | 2019-08-08 | 2022-02-08 | 三星电子(中国)研发中心 | 一种多设备共享智能引擎的方法、系统和设备 |
US11189286B2 (en) | 2019-10-22 | 2021-11-30 | Sonos, Inc. | VAS toggle based on device orientation |
KR20210064594A (ko) | 2019-11-26 | 2021-06-03 | 삼성전자주식회사 | 전자장치 및 그 제어방법 |
EP3836582B1 (en) * | 2019-12-09 | 2024-01-31 | Google LLC | Relay device for voice commands to be processed by a voice assistant, voice assistant and wireless network |
US11200900B2 (en) * | 2019-12-20 | 2021-12-14 | Sonos, Inc. | Offline voice control |
US20210210099A1 (en) * | 2020-01-06 | 2021-07-08 | Soundhound, Inc. | Multi Device Proxy |
US11562740B2 (en) | 2020-01-07 | 2023-01-24 | Sonos, Inc. | Voice verification for media playback |
US11556307B2 (en) | 2020-01-31 | 2023-01-17 | Sonos, Inc. | Local voice data processing |
US11308958B2 (en) | 2020-02-07 | 2022-04-19 | Sonos, Inc. | Localized wakeword verification |
KR20210123633A (ko) * | 2020-04-03 | 2021-10-14 | 삼성전자주식회사 | 음성 명령에 대응하는 태스크를 수행하는 전자 장치 및 그 동작 방법 |
US11482224B2 (en) | 2020-05-20 | 2022-10-25 | Sonos, Inc. | Command keywords with input detection windowing |
US11308962B2 (en) | 2020-05-20 | 2022-04-19 | Sonos, Inc. | Input detection windowing |
KR20210147678A (ko) * | 2020-05-29 | 2021-12-07 | 엘지전자 주식회사 | 인공 지능 장치 |
US11893984B1 (en) * | 2020-06-22 | 2024-02-06 | Amazon Technologies, Inc. | Speech processing system |
US11698771B2 (en) | 2020-08-25 | 2023-07-11 | Sonos, Inc. | Vocal guidance engines for playback devices |
KR20220037846A (ko) * | 2020-09-18 | 2022-03-25 | 삼성전자주식회사 | 음성 인식을 수행하기 위한 전자 장치를 식별하기 위한 전자 장치 및 그 동작 방법 |
US11984123B2 (en) | 2020-11-12 | 2024-05-14 | Sonos, Inc. | Network device interaction by range |
US11790908B2 (en) * | 2021-02-09 | 2023-10-17 | International Business Machines Corporation | Extended reality based voice command device management |
CN114187895B (zh) * | 2021-12-17 | 2024-09-24 | 海尔优家智能科技(北京)有限公司 | 语音识别方法、装置、设备和存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016095383A (ja) * | 2014-11-14 | 2016-05-26 | 株式会社ATR−Trek | 音声認識クライアント装置及びサーバ型音声認識装置 |
JP2016151608A (ja) * | 2015-02-16 | 2016-08-22 | アルパイン株式会社 | 電子装置、情報端末システム、音声認識機能の起動プログラムおよび音声認識機能の起動方法 |
JP2019533182A (ja) * | 2016-08-05 | 2019-11-14 | ソノズ インコーポレイテッド | 複数の音声サービス |
Family Cites Families (103)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7174299B2 (en) * | 1995-08-18 | 2007-02-06 | Canon Kabushiki Kaisha | Speech recognition system, speech recognition apparatus, and speech recognition method |
US6446076B1 (en) * | 1998-11-12 | 2002-09-03 | Accenture Llp. | Voice interactive web-based agent system responsive to a user location for prioritizing and formatting information |
DE19910236A1 (de) * | 1999-03-09 | 2000-09-21 | Philips Corp Intellectual Pty | Verfahren zur Spracherkennung |
US6526380B1 (en) * | 1999-03-26 | 2003-02-25 | Koninklijke Philips Electronics N.V. | Speech recognition system having parallel large vocabulary recognition engines |
US7058573B1 (en) * | 1999-04-20 | 2006-06-06 | Nuance Communications Inc. | Speech recognition system to selectively utilize different speech recognition techniques over multiple speech recognition passes |
US6542868B1 (en) * | 1999-09-23 | 2003-04-01 | International Business Machines Corporation | Audio notification management system |
US7330815B1 (en) * | 1999-10-04 | 2008-02-12 | Globalenglish Corporation | Method and system for network-based speech recognition |
US7016835B2 (en) * | 1999-10-29 | 2006-03-21 | International Business Machines Corporation | Speech and signal digitization by using recognition metrics to select from multiple techniques |
US6397186B1 (en) * | 1999-12-22 | 2002-05-28 | Ambush Interactive, Inc. | Hands-free, voice-operated remote control transmitter |
US20020055844A1 (en) * | 2000-02-25 | 2002-05-09 | L'esperance Lauren | Speech user interface for portable personal devices |
JP2002132803A (ja) * | 2000-10-24 | 2002-05-10 | Sanyo Electric Co Ltd | ユーザ支援システム |
US6996525B2 (en) * | 2001-06-15 | 2006-02-07 | Intel Corporation | Selecting one of multiple speech recognizers in a system based on performance predections resulting from experience |
US7369997B2 (en) * | 2001-08-01 | 2008-05-06 | Microsoft Corporation | Controlling speech recognition functionality in a computing device |
JP2003143256A (ja) * | 2001-10-30 | 2003-05-16 | Nec Corp | 端末装置と通信制御方法 |
US7490039B1 (en) * | 2001-12-13 | 2009-02-10 | Cisco Technology, Inc. | Text to speech system and method having interactive spelling capabilities |
US6996526B2 (en) * | 2002-01-02 | 2006-02-07 | International Business Machines Corporation | Method and apparatus for transcribing speech when a plurality of speakers are participating |
US6834265B2 (en) * | 2002-12-13 | 2004-12-21 | Motorola, Inc. | Method and apparatus for selective speech recognition |
DE10341305A1 (de) * | 2003-09-05 | 2005-03-31 | Daimlerchrysler Ag | Intelligente Nutzeradaption bei Dialogsystemen |
US7917364B2 (en) * | 2003-09-23 | 2011-03-29 | Hewlett-Packard Development Company, L.P. | System and method using multiple automated speech recognition engines |
US20050131685A1 (en) * | 2003-11-14 | 2005-06-16 | Voice Signal Technologies, Inc. | Installing language modules in a mobile communication device |
US7340395B2 (en) * | 2004-04-23 | 2008-03-04 | Sap Aktiengesellschaft | Multiple speech recognition engines |
US7366921B2 (en) * | 2004-04-23 | 2008-04-29 | Hewlett-Packard Development Company, L.P. | Selecting input/output devices to control power consumption of a computer system |
US20070016401A1 (en) * | 2004-08-12 | 2007-01-18 | Farzad Ehsani | Speech-to-speech translation system with user-modifiable paraphrasing grammars |
US7865362B2 (en) * | 2005-02-04 | 2011-01-04 | Vocollect, Inc. | Method and system for considering information about an expected response when performing speech recognition |
US8099289B2 (en) * | 2008-02-13 | 2012-01-17 | Sensory, Inc. | Voice interface and search for electronic devices including bluetooth headsets and remote systems |
US9305548B2 (en) * | 2008-05-27 | 2016-04-05 | Voicebox Technologies Corporation | System and method for an integrated, multi-modal, multi-device natural language voice services environment |
US8589161B2 (en) * | 2008-05-27 | 2013-11-19 | Voicebox Technologies, Inc. | System and method for an integrated, multi-modal, multi-device natural language voice services environment |
US10276170B2 (en) * | 2010-01-18 | 2019-04-30 | Apple Inc. | Intelligent automated assistant |
US8731939B1 (en) | 2010-08-06 | 2014-05-20 | Google Inc. | Routing queries based on carrier phrase registration |
US9332319B2 (en) * | 2010-09-27 | 2016-05-03 | Unisys Corporation | Amalgamating multimedia transcripts for closed captioning from a plurality of text to speech conversions |
JP5259020B2 (ja) * | 2010-10-01 | 2013-08-07 | 三菱電機株式会社 | 音声認識装置 |
US8606581B1 (en) * | 2010-12-14 | 2013-12-10 | Nuance Communications, Inc. | Multi-pass speech recognition |
US8296142B2 (en) * | 2011-01-21 | 2012-10-23 | Google Inc. | Speech recognition using dock context |
JP6317111B2 (ja) * | 2011-02-22 | 2018-04-25 | スピーク・ウィズ・ミー・インコーポレイテッドSpeak With Me,Inc. | ハイブリッド型クライアントサーバ音声認識 |
US20130073293A1 (en) * | 2011-09-20 | 2013-03-21 | Lg Electronics Inc. | Electronic device and method for controlling the same |
US8768707B2 (en) * | 2011-09-27 | 2014-07-01 | Sensory Incorporated | Background speech recognition assistant using speaker verification |
US8452597B2 (en) | 2011-09-30 | 2013-05-28 | Google Inc. | Systems and methods for continual speech recognition and detection in mobile computing devices |
US9729631B2 (en) * | 2011-09-30 | 2017-08-08 | Apple Inc. | Asynchronous data manipulation |
JP6019604B2 (ja) * | 2012-02-14 | 2016-11-02 | 日本電気株式会社 | 音声認識装置、音声認識方法、及びプログラム |
JP5957269B2 (ja) * | 2012-04-09 | 2016-07-27 | クラリオン株式会社 | 音声認識サーバ統合装置および音声認識サーバ統合方法 |
SG11201406477UA (en) * | 2012-04-10 | 2014-11-27 | Tencent Tech Shenzhen Co Ltd | Method for monitoring and manging battery charge level and apparatus for performing the same |
US9117449B2 (en) * | 2012-04-26 | 2015-08-25 | Nuance Communications, Inc. | Embedded system for construction of small footprint speech recognition with user-definable constraints |
US9093076B2 (en) * | 2012-04-30 | 2015-07-28 | 2236008 Ontario Inc. | Multipass ASR controlling multiple applications |
US9997069B2 (en) * | 2012-06-05 | 2018-06-12 | Apple Inc. | Context-aware voice guidance |
US9142215B2 (en) * | 2012-06-15 | 2015-09-22 | Cypress Semiconductor Corporation | Power-efficient voice activation |
JP6155592B2 (ja) * | 2012-10-02 | 2017-07-05 | 株式会社デンソー | 音声認識システム |
WO2014055076A1 (en) * | 2012-10-04 | 2014-04-10 | Nuance Communications, Inc. | Improved hybrid controller for asr |
US9959865B2 (en) * | 2012-11-13 | 2018-05-01 | Beijing Lenovo Software Ltd. | Information processing method with voice recognition |
WO2014142702A1 (en) | 2013-03-15 | 2014-09-18 | Obschestvo S Ogranichennoy Otvetstvennostiyu "Speaktoit" | Selective speech recognition for chat and digital personal assistant systems |
DE102013001219B4 (de) * | 2013-01-25 | 2019-08-29 | Inodyn Newmedia Gmbh | Verfahren und System zur Sprachaktivierung eines Software-Agenten aus einem Standby-Modus |
US11393461B2 (en) * | 2013-03-12 | 2022-07-19 | Cerence Operating Company | Methods and apparatus for detecting a voice command |
US9112984B2 (en) * | 2013-03-12 | 2015-08-18 | Nuance Communications, Inc. | Methods and apparatus for detecting a voice command |
US10572476B2 (en) * | 2013-03-14 | 2020-02-25 | Apple Inc. | Refining a search based on schedule items |
US9875494B2 (en) * | 2013-04-16 | 2018-01-23 | Sri International | Using intents to analyze and personalize a user's dialog experience with a virtual personal assistant |
EP2801974A3 (en) * | 2013-05-09 | 2015-02-18 | DSP Group Ltd. | Low power activation of a voice activated device |
EP3937002A1 (en) * | 2013-06-09 | 2022-01-12 | Apple Inc. | Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant |
EP2821943A1 (en) * | 2013-07-03 | 2015-01-07 | Accenture Global Services Limited | Query response device |
US9305554B2 (en) * | 2013-07-17 | 2016-04-05 | Samsung Electronics Co., Ltd. | Multi-level speech recognition |
EP3040985B1 (en) * | 2013-08-26 | 2023-08-23 | Samsung Electronics Co., Ltd. | Electronic device and method for voice recognition |
US9508345B1 (en) | 2013-09-24 | 2016-11-29 | Knowles Electronics, Llc | Continuous voice sensing |
US9307080B1 (en) * | 2013-09-27 | 2016-04-05 | Angel.Com Incorporated | Dynamic call control |
US9245527B2 (en) * | 2013-10-11 | 2016-01-26 | Apple Inc. | Speech recognition wake-up of a handheld portable electronic device |
US20150112690A1 (en) * | 2013-10-22 | 2015-04-23 | Nvidia Corporation | Low power always-on voice trigger architecture |
US8990079B1 (en) * | 2013-12-15 | 2015-03-24 | Zanavox | Automatic calibration of command-detection thresholds |
US9804820B2 (en) * | 2013-12-16 | 2017-10-31 | Nuance Communications, Inc. | Systems and methods for providing a virtual assistant |
CN105723451B (zh) * | 2013-12-20 | 2020-02-28 | 英特尔公司 | 从低功率始终侦听模式到高功率语音识别模式的转换 |
US9589564B2 (en) * | 2014-02-05 | 2017-03-07 | Google Inc. | Multiple speech locale-specific hotword classifiers for selection of a speech locale |
WO2015126095A1 (ko) * | 2014-02-21 | 2015-08-27 | 삼성전자 주식회사 | 전자 장치 |
WO2015149216A1 (en) * | 2014-03-31 | 2015-10-08 | Intel Corporation | Location aware power management scheme for always-on- always-listen voice recognition system |
TWI566107B (zh) * | 2014-05-30 | 2017-01-11 | 蘋果公司 | 用於處理多部分語音命令之方法、非暫時性電腦可讀儲存媒體及電子裝置 |
US20150364129A1 (en) * | 2014-06-17 | 2015-12-17 | Google Inc. | Language Identification |
KR102223728B1 (ko) * | 2014-06-20 | 2021-03-05 | 엘지전자 주식회사 | 이동단말기 및 그 제어방법 |
KR102208477B1 (ko) * | 2014-06-30 | 2021-01-27 | 삼성전자주식회사 | 마이크 운용 방법 및 이를 지원하는 전자 장치 |
US10235996B2 (en) * | 2014-10-01 | 2019-03-19 | XBrain, Inc. | Voice and connection platform |
US9502032B2 (en) * | 2014-10-08 | 2016-11-22 | Google Inc. | Dynamically biasing language models |
US9318107B1 (en) * | 2014-10-09 | 2016-04-19 | Google Inc. | Hotword detection on multiple devices |
US9741344B2 (en) * | 2014-10-20 | 2017-08-22 | Vocalzoom Systems Ltd. | System and method for operating devices using voice commands |
US9911415B2 (en) * | 2014-12-19 | 2018-03-06 | Lenovo (Singapore) Pte. Ltd. | Executing a voice command during voice input |
KR102387567B1 (ko) * | 2015-01-19 | 2022-04-18 | 삼성전자주식회사 | 음성 인식 방법 및 음성 인식 장치 |
US9653079B2 (en) * | 2015-02-12 | 2017-05-16 | Apple Inc. | Clock switching in always-on component |
US10482184B2 (en) * | 2015-03-08 | 2019-11-19 | Google Llc | Context-based natural language processing |
US9721566B2 (en) * | 2015-03-08 | 2017-08-01 | Apple Inc. | Competing devices responding to voice triggers |
US9886953B2 (en) * | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
US9865265B2 (en) * | 2015-06-06 | 2018-01-09 | Apple Inc. | Multi-microphone speech recognition systems and related techniques |
US10026399B2 (en) * | 2015-09-11 | 2018-07-17 | Amazon Technologies, Inc. | Arbitration between voice-enabled devices |
US9875081B2 (en) * | 2015-09-21 | 2018-01-23 | Amazon Technologies, Inc. | Device selection for providing a response |
US9996316B2 (en) * | 2015-09-28 | 2018-06-12 | Amazon Technologies, Inc. | Mediation of wakeword response for multiple devices |
US11587559B2 (en) * | 2015-09-30 | 2023-02-21 | Apple Inc. | Intelligent device identification |
US9965024B2 (en) * | 2015-12-01 | 2018-05-08 | International Business Machines Corporation | Overriding feature to unblock contacts in a portable device during an energy saving mode of the portable device |
WO2017100167A1 (en) * | 2015-12-06 | 2017-06-15 | Voicebox Technologies Corporation | System and method of conversational adjustment based on user's cognitive state and/or situational state |
DK179415B1 (en) * | 2016-06-11 | 2018-06-14 | Apple Inc | Intelligent device arbitration and control |
US20180025731A1 (en) * | 2016-07-21 | 2018-01-25 | Andrew Lovitt | Cascading Specialized Recognition Engines Based on a Recognition Policy |
US10567579B2 (en) * | 2016-08-24 | 2020-02-18 | Vonage Business Inc. | Systems and methods for providing integrated computerized personal assistant services in telephony communications |
US10685656B2 (en) * | 2016-08-31 | 2020-06-16 | Bose Corporation | Accessing multiple virtual personal assistants (VPA) from a single device |
US11042541B2 (en) * | 2016-10-03 | 2021-06-22 | Samsung Electronics Co., Ltd. | Electronic device and method for controlling the same |
US11663535B2 (en) * | 2016-10-03 | 2023-05-30 | Google Llc | Multi computational agent performance of tasks |
US10217453B2 (en) * | 2016-10-14 | 2019-02-26 | Soundhound, Inc. | Virtual assistant configured by selection of wake-up phrase |
US10950230B2 (en) * | 2016-10-28 | 2021-03-16 | Panasonic Intellectual Property Corporation Of America | Information processing device and information processing method |
US10559309B2 (en) * | 2016-12-22 | 2020-02-11 | Google Llc | Collaborative voice controlled devices |
US10224031B2 (en) * | 2016-12-30 | 2019-03-05 | Google Llc | Generating and transmitting invocation request to appropriate third-party agent |
US10679608B2 (en) * | 2016-12-30 | 2020-06-09 | Google Llc | Conversation-aware proactive notifications for a voice interface device |
US11164570B2 (en) * | 2017-01-17 | 2021-11-02 | Ford Global Technologies, Llc | Voice assistant tracking and activation |
CN114067794A (zh) * | 2017-02-07 | 2022-02-18 | 路创技术有限责任公司 | 基于音频的负载控制系统 |
-
2017
- 2017-04-13 US US15/487,347 patent/US10748531B2/en active Active
-
2018
- 2018-04-05 JP JP2018073256A patent/JP7083270B2/ja active Active
- 2018-04-11 EP EP18166830.2A patent/EP3389044B1/en active Active
- 2018-04-11 KR KR1020180042041A patent/KR20180115628A/ko active Application Filing
-
2023
- 2023-12-04 KR KR1020230173752A patent/KR102660922B1/ko active IP Right Grant
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016095383A (ja) * | 2014-11-14 | 2016-05-26 | 株式会社ATR−Trek | 音声認識クライアント装置及びサーバ型音声認識装置 |
JP2016151608A (ja) * | 2015-02-16 | 2016-08-22 | アルパイン株式会社 | 電子装置、情報端末システム、音声認識機能の起動プログラムおよび音声認識機能の起動方法 |
JP2019533182A (ja) * | 2016-08-05 | 2019-11-14 | ソノズ インコーポレイテッド | 複数の音声サービス |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020144274A (ja) * | 2019-03-07 | 2020-09-10 | 本田技研工業株式会社 | エージェント装置、エージェント装置の制御方法、およびプログラム |
CN111667824A (zh) * | 2019-03-07 | 2020-09-15 | 本田技研工业株式会社 | 智能体装置、智能体装置的控制方法及存储介质 |
JP2020154082A (ja) * | 2019-03-19 | 2020-09-24 | 本田技研工業株式会社 | エージェント装置、エージェント装置の制御方法、およびプログラム |
JP7280074B2 (ja) | 2019-03-19 | 2023-05-23 | 本田技研工業株式会社 | エージェント装置、エージェント装置の制御方法、およびプログラム |
JP2021004950A (ja) * | 2019-06-25 | 2021-01-14 | 株式会社デンソーテン | 情報処理装置、情報処理システムおよび情報処理方法 |
JP2022534648A (ja) * | 2019-10-24 | 2022-08-03 | 株式会社ユニオンプレイス | 個人化された仮想秘書を提供する装置 |
JP7372693B2 (ja) | 2019-10-24 | 2023-11-01 | 株式会社ユニオンプレイス | 個人化された仮想秘書を提供する装置 |
JP2021117296A (ja) * | 2020-01-23 | 2021-08-10 | トヨタ自動車株式会社 | エージェントシステム、端末装置およびエージェントプログラム |
JP2021117308A (ja) * | 2020-01-23 | 2021-08-10 | トヨタ自動車株式会社 | 情報処理システム、情報処理装置、及びプログラム |
JP7264071B2 (ja) | 2020-01-23 | 2023-04-25 | トヨタ自動車株式会社 | 情報処理システム、情報処理装置、及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
KR20180115628A (ko) | 2018-10-23 |
US10748531B2 (en) | 2020-08-18 |
KR20230169052A (ko) | 2023-12-15 |
KR102660922B1 (ko) | 2024-04-25 |
JP7083270B2 (ja) | 2022-06-10 |
EP3389044A1 (en) | 2018-10-17 |
EP3389044B1 (en) | 2019-12-11 |
US20180301147A1 (en) | 2018-10-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7083270B2 (ja) | 複数のインテリジェントパーソナルアシスタントサービスに対する管理レイヤ | |
KR102475904B1 (ko) | 다중-장치 시스템에서의 음성 명령 실행 | |
CN110018735B (zh) | 智能个人助理接口系统 | |
US11822857B2 (en) | Architecture for a hub configured to control a second device while a connection to a remote system is unavailable | |
KR102429436B1 (ko) | 사용자의 입력 입력에 기초하여 타겟 디바이스를 결정하고, 타겟 디바이스를 제어하는 서버 및 그 동작 방법 | |
JP6553736B2 (ja) | 音声対応電子デバイスにおける選択的オフライン対応の音声アクションのためのデータのローカル維持 | |
JP6272901B2 (ja) | 発話対象の識別 | |
JP6549715B2 (ja) | 音声ベースシステムにおけるアプリケーションフォーカス | |
US9983849B2 (en) | Voice command-driven database | |
CN107430855B (zh) | 在支持语音的电子设备中对语音转文本模型的场境敏感动态更新 | |
JP6125088B2 (ja) | 複数のデバイス上でコンテンツを提供すること | |
JP2020079921A (ja) | 音声インタラクション実現方法、装置、コンピュータデバイス及びプログラム | |
US10135950B2 (en) | Creating a cinematic storytelling experience using network-addressable devices | |
US20180012595A1 (en) | Simple affirmative response operating system | |
US10997963B1 (en) | Voice based interaction based on context-based directives | |
CN116888664A (zh) | 在单个话语中组合设备或助理专用热词 | |
CN116802602A (zh) | 热词组 | |
US10693944B1 (en) | Media-player initialization optimization | |
US11275555B1 (en) | Resolving a device prompt | |
US11875786B2 (en) | Natural language recognition assistant which handles information in data sessions | |
EP3704848A1 (en) | Automated playback and redistribution of internet streaming content with automatic retrieval of user credentials | |
US20240205628A1 (en) | Spatial Audio for Device Assistants |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210309 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220201 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220204 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220426 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220523 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220531 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7083270 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |