JP6513749B2 - 音声アシストシステム、サーバ装置、その音声アシスト方法、及びコンピュータが実行するためのプログラム - Google Patents
音声アシストシステム、サーバ装置、その音声アシスト方法、及びコンピュータが実行するためのプログラム Download PDFInfo
- Publication number
- JP6513749B2 JP6513749B2 JP2017154571A JP2017154571A JP6513749B2 JP 6513749 B2 JP6513749 B2 JP 6513749B2 JP 2017154571 A JP2017154571 A JP 2017154571A JP 2017154571 A JP2017154571 A JP 2017154571A JP 6513749 B2 JP6513749 B2 JP 6513749B2
- Authority
- JP
- Japan
- Prior art keywords
- voice
- recording
- user
- devices
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 22
- 238000004891 communication Methods 0.000 claims description 48
- 230000004913 activation Effects 0.000 claims description 7
- 230000006870 function Effects 0.000 description 16
- 238000010586 diagram Methods 0.000 description 13
- 230000008569 process Effects 0.000 description 10
- 230000004044 response Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 238000005401 electroluminescence Methods 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/065—Adaptation
- G10L15/07—Adaptation to the speaker
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/32—Multiple recognisers used in sequence or in parallel; Score combination systems therefor, e.g. voting systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/083—Recognition networks
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/086—Recognition of spelled words
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/225—Feedback of the input speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L2021/02082—Noise filtering the noise being echo, reverberation of the speech
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Quality & Reliability (AREA)
- Telephonic Communication Services (AREA)
Description
図1は、本実施の形態に係る音声アシストシステムの概念図を示す図である。図1に示すように、本実施の形態に係る音声アシストシステム1は、サーバ装置10と複数のデバイス20とがネットワーク30を介してデータ通信可能に構成されている。
図7及び図8を参照して、上記実施の形態に係る音声アシストシステム1のハードウェア構成例を説明する。図7は、図1のサーバ装置10のハードウェア構成例を説明するための図である。図8は、図1のデバイス20のハードウェア構成例を示す図である。
10 サーバ装置
11 通信部
12 音声認識部
13 音声アシスト部
14 記憶部
20 デバイス
21 通信部
22 マイク
23 リクエスト部
24 出力手段
111 CPU
112 ROM
113 メモリ
114 ストレージ
107 LCD
117 音声認識エンジン
120 通信部
132 音声アシスト・サーバ用プログラム
203 モニタ
205 マイク
206 スピーカ
207 ヘッドセットポート
210 制御部
211 メモリ
212 ストレージ
212c 音声アシスト・クライアント用プログラム
215 無線通信部
216 通信部
217 オーディオデバイス
Claims (13)
- 音声アシストを行うサーバ装置と複数のデバイスとが通信可能に接続された音声アシストシステムであって、
前記複数のデバイスは、マイクを介して、同じユーザ発話をそれぞれ録音してその録音データを前記サーバ装置に送信し、
前記サーバ装置は、前記複数のデバイスからそれぞれ送信される録音データを受信し、受信した複数の録音データを、所定の基準に従ってそれぞれ音声認識することにより前記ユーザ発話の内容を解釈して音声アシストを行い、
さらに、
前記複数のデバイスは、前記ユーザ発話を録音した際の録音状態を示す録音状態情報を前記サーバ装置にそれぞれ送信し、
前記サーバ装置は、前記受信した複数の録音データの音声認識結果が異なる部分を含む場合に、当該異なる部分について前記録音状態情報に応じた重み付けを行って、前記ユーザ発話の内容を解釈することを特徴とする音声アシストシステム。 - 前記複数のデバイスは、前記マイクを介してユーザの所定の起動発話コマンドが入力された後に、ユーザ発話の録音を開始することを特徴とする請求項1に記載の音声アシストシステム。
- 前記録音状態情報は、録音レベル、ノイズレベル、及びエコーのうちの少なくとも一つの情報を含むことを特徴とする請求項1又は2に記載の音声アシストシステム。
- 前記録音状態情報は、録音レベル、ノイズレベル、及びエコーの全ての情報を含むことを特徴とする請求項1又は2に記載の音声アシストシステム。
- 前記サーバ装置は、さらに、所定の優先順位に従って、前記複数のデバイスのうち音声アシストを出力するデバイスを選択することを特徴とする請求項1〜4のいずれか1つに記載の音声アシストシステム。
- 前記所定の優先順位は、前記デバイスを使用中であるか否か、前記デバイスで使用している出力手段の種類、前記デバイスとユーザとの距離、及び前記デバイスの出力手段のパフォーマンスのうちの1又は複数により決定されることを特徴とする請求項5に記載の音声アシストシステム。
- 複数のデバイスと通信可能に接続されており、音声アシストを行うサーバ装置であって、
ネットワークを介して、前記複数のデバイスとデータ通信するための通信部と、
前記通信部を介して受信した、前記複数のデバイスからそれぞれ送信される、同じユーザ発話の録音データを、所定の基準に従ってそれぞれ音声認識することにより、前記ユーザ発話の内容を解釈する音声認識部と、
前記音声認識部で解釈された前記ユーザ発話の内容に応じた音声アシスタントを行う音声アシスト部と、
を備え、
前記複数のデバイスからは、前記ユーザ発話を録音した際の録音状態を示す録音状態情報が前記サーバ装置にそれぞれ送信され、
前記音声認識部は、前記受信した複数の録音データの音声認識結果が異なる部分を含む場合に、当該異なる部分について前記録音状態情報に応じた重み付けを行って、前記ユーザ発話の内容を解釈することを特徴とするサーバ装置。 - 前記録音状態情報は、録音レベル、ノイズレベル、及びエコーのうちの少なくとも一つの情報を含むことを特徴とする請求項7に記載のサーバ装置。
- 前記録音状態情報は、録音レベル、ノイズレベル、及びエコーの全ての情報を含むことを特徴とする請求項7に記載のサーバ装置。
- 前記音声アシスト部は、所定の優先順位に従って、前記複数のデバイスのうち音声アシストを出力するデバイスを選択することを特徴とする請求項7〜9のいずれか1つに記載のサーバ装置。
- 前記所定の優先順位は、前記デバイスが使用中であるか否か、前記デバイスで使用している出力手段の種類、前記デバイスとユーザとの距離、及び前記デバイスの出力手段のパフォーマンスのうちの1又は複数により決定されることを特徴とする請求項10に記載のサーバ装置。
- 複数のデバイスと通信可能に接続されたサーバ装置が実行する音声アシスト方法であって、
通信部を介して受信した、前記複数のデバイスからそれぞれ送信される、同じユーザ発話の録音データを、所定の基準に従ってそれぞれ音声認識することにより、前記ユーザ発話の内容を解釈する音声認識工程と、
前記音声認識工程で解釈された前記ユーザ発話の内容に応じた音声アシスタントを行う音声アシスト工程と、
を含み、さらに、
前記複数のデバイスからは、前記ユーザ発話を録音した際の録音状態を示す録音状態情報が前記サーバ装置にそれぞれ送信され、
前記音声認識工程では、前記受信した複数の録音データの音声認識結果が異なる部分を含む場合に、当該異なる部分について前記録音状態情報に応じた重み付けを行って、前記ユーザ発話の内容を解釈することを特徴とする音声アシスト方法。 - 複数のデバイスと通信可能に接続されたサーバ装置に搭載されたプログラムであって、
通信部を介して受信した、前記複数のデバイスからそれぞれ送信される、同じユーザ発話の録音データを、所定の基準に従って音声認識することにより、前記ユーザ発話の内容を解釈する音声認識工程と、
前記音声認識工程で解釈された前記ユーザ発話の内容に応じた音声アシスタントを行う音声アシスト工程と、
をコンピュータに実行させ、さらに、
前記複数のデバイスからは、前記ユーザ発話を録音した際の録音状態を示す録音状態情報が前記サーバ装置にそれぞれ送信され、
前記音声認識工程では、前記受信した複数の録音データの音声認識結果が異なる部分を含む場合に、当該異なる部分について前記録音状態情報に応じた重み付けを行って、前記ユーザ発話の内容を解釈することを特徴とするコンピュータが実行可能なプログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017154571A JP6513749B2 (ja) | 2017-08-09 | 2017-08-09 | 音声アシストシステム、サーバ装置、その音声アシスト方法、及びコンピュータが実行するためのプログラム |
CN201810621047.8A CN109389975A (zh) | 2017-08-09 | 2018-06-15 | 语音辅助系统、服务器装置、设备、其语音辅助方法 |
US16/100,142 US10867596B2 (en) | 2017-08-09 | 2018-08-09 | Voice assistant system, server apparatus, device, voice assistant method therefor, and program to be executed by computer |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017154571A JP6513749B2 (ja) | 2017-08-09 | 2017-08-09 | 音声アシストシステム、サーバ装置、その音声アシスト方法、及びコンピュータが実行するためのプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019032479A JP2019032479A (ja) | 2019-02-28 |
JP6513749B2 true JP6513749B2 (ja) | 2019-05-15 |
Family
ID=65275407
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017154571A Active JP6513749B2 (ja) | 2017-08-09 | 2017-08-09 | 音声アシストシステム、サーバ装置、その音声アシスト方法、及びコンピュータが実行するためのプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US10867596B2 (ja) |
JP (1) | JP6513749B2 (ja) |
CN (1) | CN109389975A (ja) |
Families Citing this family (76)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9965247B2 (en) | 2016-02-22 | 2018-05-08 | Sonos, Inc. | Voice controlled media playback system based on user profile |
US10095470B2 (en) | 2016-02-22 | 2018-10-09 | Sonos, Inc. | Audio response playback |
US9811314B2 (en) | 2016-02-22 | 2017-11-07 | Sonos, Inc. | Metadata exchange involving a networked playback system and a networked microphone system |
US9772817B2 (en) | 2016-02-22 | 2017-09-26 | Sonos, Inc. | Room-corrected voice detection |
US10264030B2 (en) | 2016-02-22 | 2019-04-16 | Sonos, Inc. | Networked microphone device control |
US9947316B2 (en) | 2016-02-22 | 2018-04-17 | Sonos, Inc. | Voice control of a media playback system |
US9978390B2 (en) | 2016-06-09 | 2018-05-22 | Sonos, Inc. | Dynamic player selection for audio signal processing |
US10134399B2 (en) | 2016-07-15 | 2018-11-20 | Sonos, Inc. | Contextualization of voice inputs |
US10115400B2 (en) | 2016-08-05 | 2018-10-30 | Sonos, Inc. | Multiple voice services |
US9942678B1 (en) | 2016-09-27 | 2018-04-10 | Sonos, Inc. | Audio playback settings for voice interaction |
US10181323B2 (en) | 2016-10-19 | 2019-01-15 | Sonos, Inc. | Arbitration-based voice recognition |
US10475449B2 (en) | 2017-08-07 | 2019-11-12 | Sonos, Inc. | Wake-word detection suppression |
US10048930B1 (en) | 2017-09-08 | 2018-08-14 | Sonos, Inc. | Dynamic computation of system response volume |
US10531157B1 (en) * | 2017-09-21 | 2020-01-07 | Amazon Technologies, Inc. | Presentation and management of audio and visual content across devices |
US10446165B2 (en) | 2017-09-27 | 2019-10-15 | Sonos, Inc. | Robust short-time fourier transform acoustic echo cancellation during audio playback |
US10482868B2 (en) | 2017-09-28 | 2019-11-19 | Sonos, Inc. | Multi-channel acoustic echo cancellation |
US10621981B2 (en) | 2017-09-28 | 2020-04-14 | Sonos, Inc. | Tone interference cancellation |
US10466962B2 (en) | 2017-09-29 | 2019-11-05 | Sonos, Inc. | Media playback system with voice assistance |
CN110741338B (zh) * | 2017-12-08 | 2023-06-16 | 谷歌有限责任公司 | 使设备与环境中的多个设备隔离以响应口头助理调用 |
WO2019152722A1 (en) | 2018-01-31 | 2019-08-08 | Sonos, Inc. | Device designation of playback and network microphone device arrangements |
US10665244B1 (en) * | 2018-03-22 | 2020-05-26 | Pindrop Security, Inc. | Leveraging multiple audio channels for authentication |
US10600408B1 (en) * | 2018-03-23 | 2020-03-24 | Amazon Technologies, Inc. | Content output management based on speech quality |
US11676220B2 (en) | 2018-04-20 | 2023-06-13 | Meta Platforms, Inc. | Processing multimodal user input for assistant systems |
US11715042B1 (en) | 2018-04-20 | 2023-08-01 | Meta Platforms Technologies, Llc | Interpretability of deep reinforcement learning models in assistant systems |
US10963273B2 (en) | 2018-04-20 | 2021-03-30 | Facebook, Inc. | Generating personalized content summaries for users |
US11886473B2 (en) | 2018-04-20 | 2024-01-30 | Meta Platforms, Inc. | Intent identification for agent matching by assistant systems |
US11175880B2 (en) | 2018-05-10 | 2021-11-16 | Sonos, Inc. | Systems and methods for voice-assisted media content selection |
US10959029B2 (en) | 2018-05-25 | 2021-03-23 | Sonos, Inc. | Determining and adapting to changes in microphone performance of playback devices |
US10681460B2 (en) | 2018-06-28 | 2020-06-09 | Sonos, Inc. | Systems and methods for associating playback devices with voice assistant services |
US11076035B2 (en) | 2018-08-28 | 2021-07-27 | Sonos, Inc. | Do not disturb feature for audio notifications |
US10461710B1 (en) | 2018-08-28 | 2019-10-29 | Sonos, Inc. | Media playback system with maximum volume setting |
US10587430B1 (en) | 2018-09-14 | 2020-03-10 | Sonos, Inc. | Networked devices, systems, and methods for associating playback devices based on sound codes |
US11315553B2 (en) * | 2018-09-20 | 2022-04-26 | Samsung Electronics Co., Ltd. | Electronic device and method for providing or obtaining data for training thereof |
US11024331B2 (en) | 2018-09-21 | 2021-06-01 | Sonos, Inc. | Voice detection optimization using sound metadata |
US11100923B2 (en) | 2018-09-28 | 2021-08-24 | Sonos, Inc. | Systems and methods for selective wake word detection using neural network models |
US11899519B2 (en) | 2018-10-23 | 2024-02-13 | Sonos, Inc. | Multiple stage network microphone device with reduced power consumption and processing load |
EP3654249A1 (en) | 2018-11-15 | 2020-05-20 | Snips | Dilated convolutions and gating for efficient keyword spotting |
US11183183B2 (en) | 2018-12-07 | 2021-11-23 | Sonos, Inc. | Systems and methods of operating media playback systems having multiple voice assistant services |
US11132989B2 (en) | 2018-12-13 | 2021-09-28 | Sonos, Inc. | Networked microphone devices, systems, and methods of localized arbitration |
US10602268B1 (en) | 2018-12-20 | 2020-03-24 | Sonos, Inc. | Optimization of network microphone devices using noise classification |
US11482218B2 (en) * | 2019-01-22 | 2022-10-25 | Beijing Boe Technology Development Co., Ltd. | Voice control method, voice control device, and computer-executable non-volatile storage medium |
US10867604B2 (en) | 2019-02-08 | 2020-12-15 | Sonos, Inc. | Devices, systems, and methods for distributed voice processing |
US11315556B2 (en) | 2019-02-08 | 2022-04-26 | Sonos, Inc. | Devices, systems, and methods for distributed voice processing by transmitting sound data associated with a wake word to an appropriate device for identification |
EP3709194A1 (en) | 2019-03-15 | 2020-09-16 | Spotify AB | Ensemble-based data comparison |
US11120794B2 (en) | 2019-05-03 | 2021-09-14 | Sonos, Inc. | Voice assistant persistence across multiple network microphone devices |
US11482210B2 (en) | 2019-05-29 | 2022-10-25 | Lg Electronics Inc. | Artificial intelligence device capable of controlling other devices based on device information |
KR102252526B1 (ko) * | 2019-06-07 | 2021-05-14 | 부산대학교 산학협력단 | 경량 IoT 장치를 위한 지능형 음성 서비스 지원 장치 및 방법 |
US11361756B2 (en) | 2019-06-12 | 2022-06-14 | Sonos, Inc. | Conditional wake word eventing based on environment |
US11200894B2 (en) | 2019-06-12 | 2021-12-14 | Sonos, Inc. | Network microphone device with command keyword eventing |
US10586540B1 (en) | 2019-06-12 | 2020-03-10 | Sonos, Inc. | Network microphone device with command keyword conditioning |
KR20190089128A (ko) * | 2019-07-10 | 2019-07-30 | 엘지전자 주식회사 | 음성 인식 방법 및 음성 인식 장치 |
US11138969B2 (en) | 2019-07-31 | 2021-10-05 | Sonos, Inc. | Locally distributed keyword detection |
US10871943B1 (en) | 2019-07-31 | 2020-12-22 | Sonos, Inc. | Noise classification for event detection |
US11138975B2 (en) | 2019-07-31 | 2021-10-05 | Sonos, Inc. | Locally distributed keyword detection |
CN110364161A (zh) | 2019-08-22 | 2019-10-22 | 北京小米智能科技有限公司 | 响应语音信号的方法、电子设备、介质及系统 |
US11094319B2 (en) | 2019-08-30 | 2021-08-17 | Spotify Ab | Systems and methods for generating a cleaned version of ambient sound |
US11189286B2 (en) | 2019-10-22 | 2021-11-30 | Sonos, Inc. | VAS toggle based on device orientation |
KR20210050901A (ko) * | 2019-10-29 | 2021-05-10 | 엘지전자 주식회사 | 음성 인식 방법 및 음성 인식 장치 |
US12001754B2 (en) | 2019-11-21 | 2024-06-04 | Motorola Mobility Llc | Context based media selection based on preferences setting for active consumer(s) |
US11233490B2 (en) * | 2019-11-21 | 2022-01-25 | Motorola Mobility Llc | Context based volume adaptation by voice assistant devices |
EP3836582B1 (en) * | 2019-12-09 | 2024-01-31 | Google LLC | Relay device for voice commands to be processed by a voice assistant, voice assistant and wireless network |
US11200900B2 (en) | 2019-12-20 | 2021-12-14 | Sonos, Inc. | Offline voice control |
US20210210099A1 (en) * | 2020-01-06 | 2021-07-08 | Soundhound, Inc. | Multi Device Proxy |
US11562740B2 (en) | 2020-01-07 | 2023-01-24 | Sonos, Inc. | Voice verification for media playback |
KR20210098250A (ko) * | 2020-01-31 | 2021-08-10 | 삼성전자주식회사 | 전자 장치 및 이의 제어 방법 |
US11308958B2 (en) | 2020-02-07 | 2022-04-19 | Sonos, Inc. | Localized wakeword verification |
US11328722B2 (en) * | 2020-02-11 | 2022-05-10 | Spotify Ab | Systems and methods for generating a singular voice audio stream |
US11308959B2 (en) | 2020-02-11 | 2022-04-19 | Spotify Ab | Dynamic adjustment of wake word acceptance tolerance thresholds in voice-controlled devices |
CN111312250A (zh) * | 2020-02-21 | 2020-06-19 | 珠海荣邦电子科技有限公司 | 基于语音的多设备适配控制方法、装置及系统 |
US11727919B2 (en) | 2020-05-20 | 2023-08-15 | Sonos, Inc. | Memory allocation for keyword spotting engines |
US11308962B2 (en) * | 2020-05-20 | 2022-04-19 | Sonos, Inc. | Input detection windowing |
US11482224B2 (en) | 2020-05-20 | 2022-10-25 | Sonos, Inc. | Command keywords with input detection windowing |
US20220036211A1 (en) * | 2020-07-30 | 2022-02-03 | International Business Machines Corporation | User-hesitancy based validation for virtual assistance operations |
US11698771B2 (en) | 2020-08-25 | 2023-07-11 | Sonos, Inc. | Vocal guidance engines for playback devices |
CN112201244A (zh) * | 2020-09-30 | 2021-01-08 | 北京搜狗科技发展有限公司 | 一种记账方法、装置和耳机 |
US11984123B2 (en) | 2020-11-12 | 2024-05-14 | Sonos, Inc. | Network device interaction by range |
Family Cites Families (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2614552B2 (ja) * | 1991-06-27 | 1997-05-28 | シャープ株式会社 | 音声認識リモコン装置 |
JPH05249989A (ja) * | 1992-03-06 | 1993-09-28 | Nippondenso Co Ltd | 音声認識制御装置 |
JP4155383B2 (ja) * | 2001-03-05 | 2008-09-24 | アルパイン株式会社 | 音声認識機器操作装置 |
US20110054900A1 (en) * | 2007-03-07 | 2011-03-03 | Phillips Michael S | Hybrid command and control between resident and remote speech recognition facilities in a mobile voice-to-speech application |
JP5075664B2 (ja) * | 2008-02-15 | 2012-11-21 | 株式会社東芝 | 音声対話装置及び支援方法 |
JP2010085790A (ja) * | 2008-09-30 | 2010-04-15 | Nec Corp | 会話学習支援システム、会話学習支援方法およびプログラム |
US9305553B2 (en) * | 2010-04-28 | 2016-04-05 | William S. Meisel | Speech recognition accuracy improvement through speaker categories |
JP2014178339A (ja) * | 2011-06-03 | 2014-09-25 | Nec Corp | 音声処理システム、発話者の音声取得方法、音声処理装置およびその制御方法と制御プログラム |
US8762156B2 (en) | 2011-09-28 | 2014-06-24 | Apple Inc. | Speech recognition repair using contextual information |
JP6436400B2 (ja) * | 2014-03-28 | 2018-12-12 | パナソニックIpマネジメント株式会社 | 音声コマンド入力装置および音声コマンド入力方法 |
KR20160023089A (ko) * | 2014-08-21 | 2016-03-03 | 엘지전자 주식회사 | 디지털 디바이스 및 그 제어 방법 |
US9318107B1 (en) * | 2014-10-09 | 2016-04-19 | Google Inc. | Hotword detection on multiple devices |
US9812128B2 (en) * | 2014-10-09 | 2017-11-07 | Google Inc. | Device leadership negotiation among voice interface devices |
JP6520100B2 (ja) * | 2014-12-15 | 2019-05-29 | オンキヨー株式会社 | 電子機器制御システム、端末装置、及び、サーバー |
KR102306798B1 (ko) * | 2015-03-20 | 2021-09-30 | 삼성전자주식회사 | 에코 제거 방법 및 그 전자 장치 |
EP3311628B1 (en) * | 2015-06-22 | 2021-05-05 | Loose Cannon Systems, Inc. | Portable group communication device |
US10152968B1 (en) * | 2015-06-26 | 2018-12-11 | Iconics, Inc. | Systems and methods for speech-based monitoring and/or control of automation devices |
US9875081B2 (en) * | 2015-09-21 | 2018-01-23 | Amazon Technologies, Inc. | Device selection for providing a response |
CN105825855A (zh) * | 2016-04-13 | 2016-08-03 | 联想(北京)有限公司 | 一种信息处理方法及主终端设备 |
KR20170132622A (ko) * | 2016-05-24 | 2017-12-04 | 삼성전자주식회사 | 음성 인식 기능을 갖는 전자 장치 및 전자 장치의 동작 방법 |
US10257363B2 (en) * | 2016-07-22 | 2019-04-09 | Lenovo (Singapore) Pte. Ltd. | Coordinating input on multiple local devices |
US9972320B2 (en) * | 2016-08-24 | 2018-05-15 | Google Llc | Hotword detection on multiple devices |
CN106951209A (zh) * | 2017-03-29 | 2017-07-14 | 联想(北京)有限公司 | 一种控制方法、装置及电子设备 |
-
2017
- 2017-08-09 JP JP2017154571A patent/JP6513749B2/ja active Active
-
2018
- 2018-06-15 CN CN201810621047.8A patent/CN109389975A/zh active Pending
- 2018-08-09 US US16/100,142 patent/US10867596B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US10867596B2 (en) | 2020-12-15 |
JP2019032479A (ja) | 2019-02-28 |
US20190051289A1 (en) | 2019-02-14 |
CN109389975A (zh) | 2019-02-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6513749B2 (ja) | 音声アシストシステム、サーバ装置、その音声アシスト方法、及びコンピュータが実行するためのプログラム | |
US10643621B2 (en) | Speech recognition using electronic device and server | |
US10777193B2 (en) | System and device for selecting speech recognition model | |
CN108829235B (zh) | 语音数据处理方法和支持该方法的电子设备 | |
US11435980B2 (en) | System for processing user utterance and controlling method thereof | |
US10255930B2 (en) | Wireless control of linked devices | |
KR102261552B1 (ko) | 음성 명령어 제공 방법 및 이를 지원하는 전자 장치 | |
CN111095400A (zh) | 选择系统和方法 | |
CN110858481B (zh) | 用于处理用户语音话语的系统和用于操作该系统的方法 | |
CN112970059B (zh) | 用于处理用户话语的电子装置及其控制方法 | |
CN112470217A (zh) | 用于确定要执行语音识别的电子装置的方法及电子装置 | |
KR20140089863A (ko) | 디스플레이 장치, 및 이의 제어 방법, 그리고 음성 인식 시스템의 디스플레이 장치 제어 방법 | |
US11151995B2 (en) | Electronic device for mapping an invoke word to a sequence of inputs for generating a personalized command | |
EP3635533B1 (en) | Electronic apparatus for processing user utterance for controlling an external electronic apparatus and controlling method thereof | |
US20200143807A1 (en) | Electronic device and operation method thereof | |
KR20200099380A (ko) | 음성 인식 서비스를 제공하는 방법 및 그 전자 장치 | |
US10976997B2 (en) | Electronic device outputting hints in an offline state for providing service according to user context | |
KR20210116897A (ko) | 외부 장치의 음성 기반 제어를 위한 방법 및 그 전자 장치 | |
US10848866B2 (en) | Audio interface for multiple microphones and speaker systems to interface with a host | |
US20190104365A1 (en) | Wake signal from a portable transceiver unit | |
JP2015028566A (ja) | 応答制御システム、車載器、およびセンター | |
CN111902863B (zh) | 用于处理用户语音输入的装置 | |
KR20210015234A (ko) | 전자 장치, 및 그의 음성 명령에 따른 기능이 실행되도록 제어하는 방법 | |
WO2017171756A1 (en) | Indicator to indicate a state of a personal assistant application | |
JP2020030245A (ja) | 端末装置、決定方法、決定プログラム及び決定装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20181218 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190218 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190319 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190410 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6513749 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |