JP2019032479A - 音声アシストシステム、サーバ装置、デバイス、その音声アシスト方法、及びコンピュータが実行するためのプログラム - Google Patents
音声アシストシステム、サーバ装置、デバイス、その音声アシスト方法、及びコンピュータが実行するためのプログラム Download PDFInfo
- Publication number
- JP2019032479A JP2019032479A JP2017154571A JP2017154571A JP2019032479A JP 2019032479 A JP2019032479 A JP 2019032479A JP 2017154571 A JP2017154571 A JP 2017154571A JP 2017154571 A JP2017154571 A JP 2017154571A JP 2019032479 A JP2019032479 A JP 2019032479A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- devices
- voice assist
- user utterance
- recording
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 21
- 238000004891 communication Methods 0.000 claims description 51
- 230000004913 activation Effects 0.000 claims description 7
- 230000006870 function Effects 0.000 description 15
- 238000010586 diagram Methods 0.000 description 14
- 230000008569 process Effects 0.000 description 10
- 230000004044 response Effects 0.000 description 4
- 238000011156 evaluation Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 238000002592 echocardiography Methods 0.000 description 1
- 238000005401 electroluminescence Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/065—Adaptation
- G10L15/07—Adaptation to the speaker
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/32—Multiple recognisers used in sequence or in parallel; Score combination systems therefor, e.g. voting systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/083—Recognition networks
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/086—Recognition of spelled words
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/225—Feedback of the input speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L2021/02082—Noise filtering the noise being echo, reverberation of the speech
Abstract
Description
図1は、本実施の形態に係る音声アシストシステムの概念図を示す図である。図1に示すように、本実施の形態に係る音声アシストシステム1は、サーバ装置10と複数のデバイス20とがネットワーク30を介してデータ通信可能に構成されている。
図7及び図8を参照して、上記実施の形態に係る音声アシストシステム1のハードウェア構成例を説明する。図7は、図1のサーバ装置10のハードウェア構成例を説明するための図である。図8は、図1のデバイス20のハードウェア構成例を示す図である。
10 サーバ装置
11 通信部
12 音声認識部
13 音声アシスト部
14 記憶部
20 デバイス
21 通信部
22 マイク
23 リクエスト部
24 出力手段
111 CPU
112 ROM
113 メモリ
114 ストレージ
107 LCD
117 音声認識エンジン
120 通信部
132 音声アシスト・サーバ用プログラム
203 モニタ
205 マイク
206 スピーカ
207 ヘッドセットポート
210 制御部
211 メモリ
212 ストレージ
212c 音声アシスト・クライアント用プログラム
215 無線通信部
216 通信部
217 オーディオデバイス
Claims (16)
- 音声アシストを行うサーバ装置と複数のデバイスとが通信可能に接続された音声アシストシステムであって、
前記複数のデバイスは、マイクを介して、同じユーザ発話をそれぞれ録音してその録音データを前記サーバ装置に送信し、
前記サーバ装置は、前記複数のデバイスからそれぞれ送信される録音データを受信し、受信した複数の録音データを、所定の基準に従って音声認識することにより前記ユーザ発話の内容を解釈して音声アシストを行うことを特徴とする音声アシストシステム。 - 前記複数のデバイスは、前記マイクを介してユーザの所定の起動発話コマンドが入力された後に、ユーザ発話の録音を開始することを特徴とする請求項1に記載の音声アシストシステム。
- 前記複数のデバイスは、さらに、前記ユーザ発話を録音した際の録音状態を示す録音状態情報を前記サーバ装置にそれぞれ送信し、
前記サーバ装置は、前記受信した複数の録音データを音声認識する場合に、前記録音状態情報に応じた重み付けを行って、前記ユーザ発話の内容を解釈することを特徴とする請求項1又は2に記載の音声アシストシステム。 - 前記録音状態情報は、録音レベル、ノイズレベル、及びエコーのうちの少なくとも一つの情報を含むことを特徴とする請求項3に記載の音声アシストシステム。
- 前記録音状態情報は、録音レベル、ノイズレベル、及びエコーの全ての情報を含むことを特徴とする請求項3に記載の音声アシストシステム。
- 前記サーバ装置は、さらに、所定の優先順位に従って、前記複数のデバイスのうち音声アシストを出力するデバイスを選択することを特徴とする請求項1〜5のいずれか1つに記載の音声アシストシステム。
- 前記所定の優先順位は、前記デバイスを使用中であるか否か、前記デバイスで使用している出力手段の種類、前記デバイスとユーザとの距離、及び前記デバイスの出力手段のパフォーマンスのうちの1又は複数により決定されることを特徴とする請求項6に記載の音声アシストシステム。
- 複数のデバイスと通信可能に接続されており、音声アシストを行うサーバ装置であって、
ネットワークを介して、前記複数のデバイスとデータ通信するための通信部と、
前記通信部を介して受信した、前記複数のデバイスからそれぞれ送信される、同じユーザ発話の録音データを、所定の基準に従って音声認識することにより、前記ユーザ発話の内容を解釈する音声認識部と、
前記音声認識部で解釈された前記ユーザ発話の内容に応じた音声アシスタントを行う音声アシスト部と、
を備えたことを特徴とするサーバ装置。 - 前記音声認識部は、前記同じユーザ発話の録音データを音声認識する場合に、前記複数のデバイスから送出される、前記ユーザ発話を録音した際の録音状態を示す録音状態情報に応じた重み付けを行って、前記ユーザ発話の内容を解釈することを特徴とする請求項8に記載のサーバ装置。
- 前記録音状態情報は、録音レベル、ノイズレベル、及びエコーのうちの少なくとも一つの情報を含むことを特徴とする請求項9に記載のサーバ装置。
- 前記録音状態情報は、録音レベル、ノイズレベル、及びエコーの全ての情報を含むことを特徴とする請求項9に記載のサーバ装置。
- 前記音声アシスト部は、所定の優先順位に従って、前記複数のデバイスのうち音声アシストを出力するデバイスを選択することを特徴とする請求項8〜11のいずれか1つに記載のサーバ装置。
- 前記所定の優先順位は、前記デバイスが使用中であるか否か、前記デバイスで使用している出力手段の種類、前記デバイスとユーザとの距離、及び前記デバイスの出力手段のパフォーマンスのうちの1又は複数により決定されることを特徴とする請求項12に記載のサーバ装置。
- 音声アシストを行うサーバ装置とデータ通信可能に接続されたデバイスであって、
ネットワークを介して前記サーバ装置とデータ通信するための通信部と、
音声を入力するためのマイクと、
前記マイクを介して、他のデバイスと同じユーザ発話を録音してその録音データを、前記通信部を介して前記サーバ装置に送信するリクエスト部と、
を備えたことを特徴とするデバイス。 - 複数のデバイスと通信可能に接続されたサーバ装置が実行する音声アシスト方法であって、
通信部を介して受信した、前記複数のデバイスからそれぞれ送信される、同じユーザ発話の録音データを、所定の基準に従って音声認識することにより、前記ユーザ発話の内容を解釈する音声認識工程と、
前記音声認識工程で解釈された前記ユーザ発話の内容に応じた音声アシスタントを行う音声アシスト工程と、
を含むことを特徴とする音声アシスト方法。 - 複数のデバイスと通信可能に接続されたサーバ装置に搭載されたプログラムであって、
通信部を介して受信した、前記複数のデバイスからそれぞれ送信される、同じユーザ発話の録音データを、所定の基準に従って音声認識することにより、前記ユーザ発話の内容を解釈する音声認識工程と、
前記音声認識工程で解釈された前記ユーザ発話の内容に応じた音声アシスタントを行う音声アシスト工程と、
をコンピュータに実行させることを特徴とするコンピュータが実行可能なプログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017154571A JP6513749B2 (ja) | 2017-08-09 | 2017-08-09 | 音声アシストシステム、サーバ装置、その音声アシスト方法、及びコンピュータが実行するためのプログラム |
CN201810621047.8A CN109389975A (zh) | 2017-08-09 | 2018-06-15 | 语音辅助系统、服务器装置、设备、其语音辅助方法 |
US16/100,142 US10867596B2 (en) | 2017-08-09 | 2018-08-09 | Voice assistant system, server apparatus, device, voice assistant method therefor, and program to be executed by computer |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017154571A JP6513749B2 (ja) | 2017-08-09 | 2017-08-09 | 音声アシストシステム、サーバ装置、その音声アシスト方法、及びコンピュータが実行するためのプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019032479A true JP2019032479A (ja) | 2019-02-28 |
JP6513749B2 JP6513749B2 (ja) | 2019-05-15 |
Family
ID=65275407
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017154571A Active JP6513749B2 (ja) | 2017-08-09 | 2017-08-09 | 音声アシストシステム、サーバ装置、その音声アシスト方法、及びコンピュータが実行するためのプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US10867596B2 (ja) |
JP (1) | JP6513749B2 (ja) |
CN (1) | CN109389975A (ja) |
Families Citing this family (73)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10509626B2 (en) | 2016-02-22 | 2019-12-17 | Sonos, Inc | Handling of loss of pairing between networked devices |
US10264030B2 (en) | 2016-02-22 | 2019-04-16 | Sonos, Inc. | Networked microphone device control |
US10095470B2 (en) | 2016-02-22 | 2018-10-09 | Sonos, Inc. | Audio response playback |
US9947316B2 (en) | 2016-02-22 | 2018-04-17 | Sonos, Inc. | Voice control of a media playback system |
US9965247B2 (en) | 2016-02-22 | 2018-05-08 | Sonos, Inc. | Voice controlled media playback system based on user profile |
US10743101B2 (en) | 2016-02-22 | 2020-08-11 | Sonos, Inc. | Content mixing |
US9978390B2 (en) | 2016-06-09 | 2018-05-22 | Sonos, Inc. | Dynamic player selection for audio signal processing |
US10134399B2 (en) | 2016-07-15 | 2018-11-20 | Sonos, Inc. | Contextualization of voice inputs |
US10115400B2 (en) | 2016-08-05 | 2018-10-30 | Sonos, Inc. | Multiple voice services |
US9942678B1 (en) | 2016-09-27 | 2018-04-10 | Sonos, Inc. | Audio playback settings for voice interaction |
US10181323B2 (en) | 2016-10-19 | 2019-01-15 | Sonos, Inc. | Arbitration-based voice recognition |
US10475449B2 (en) | 2017-08-07 | 2019-11-12 | Sonos, Inc. | Wake-word detection suppression |
US10048930B1 (en) | 2017-09-08 | 2018-08-14 | Sonos, Inc. | Dynamic computation of system response volume |
US10531157B1 (en) * | 2017-09-21 | 2020-01-07 | Amazon Technologies, Inc. | Presentation and management of audio and visual content across devices |
US10446165B2 (en) | 2017-09-27 | 2019-10-15 | Sonos, Inc. | Robust short-time fourier transform acoustic echo cancellation during audio playback |
US10621981B2 (en) | 2017-09-28 | 2020-04-14 | Sonos, Inc. | Tone interference cancellation |
US10482868B2 (en) | 2017-09-28 | 2019-11-19 | Sonos, Inc. | Multi-channel acoustic echo cancellation |
US10466962B2 (en) | 2017-09-29 | 2019-11-05 | Sonos, Inc. | Media playback system with voice assistance |
WO2019152722A1 (en) | 2018-01-31 | 2019-08-08 | Sonos, Inc. | Device designation of playback and network microphone device arrangements |
US10665244B1 (en) * | 2018-03-22 | 2020-05-26 | Pindrop Security, Inc. | Leveraging multiple audio channels for authentication |
US10600408B1 (en) * | 2018-03-23 | 2020-03-24 | Amazon Technologies, Inc. | Content output management based on speech quality |
US11676220B2 (en) | 2018-04-20 | 2023-06-13 | Meta Platforms, Inc. | Processing multimodal user input for assistant systems |
US10782986B2 (en) | 2018-04-20 | 2020-09-22 | Facebook, Inc. | Assisting users with personalized and contextual communication content |
US11715042B1 (en) | 2018-04-20 | 2023-08-01 | Meta Platforms Technologies, Llc | Interpretability of deep reinforcement learning models in assistant systems |
US11886473B2 (en) | 2018-04-20 | 2024-01-30 | Meta Platforms, Inc. | Intent identification for agent matching by assistant systems |
US11175880B2 (en) | 2018-05-10 | 2021-11-16 | Sonos, Inc. | Systems and methods for voice-assisted media content selection |
US10959029B2 (en) | 2018-05-25 | 2021-03-23 | Sonos, Inc. | Determining and adapting to changes in microphone performance of playback devices |
US10681460B2 (en) | 2018-06-28 | 2020-06-09 | Sonos, Inc. | Systems and methods for associating playback devices with voice assistant services |
US10461710B1 (en) | 2018-08-28 | 2019-10-29 | Sonos, Inc. | Media playback system with maximum volume setting |
US11076035B2 (en) | 2018-08-28 | 2021-07-27 | Sonos, Inc. | Do not disturb feature for audio notifications |
US10587430B1 (en) | 2018-09-14 | 2020-03-10 | Sonos, Inc. | Networked devices, systems, and methods for associating playback devices based on sound codes |
US11315553B2 (en) * | 2018-09-20 | 2022-04-26 | Samsung Electronics Co., Ltd. | Electronic device and method for providing or obtaining data for training thereof |
US11024331B2 (en) | 2018-09-21 | 2021-06-01 | Sonos, Inc. | Voice detection optimization using sound metadata |
US11100923B2 (en) | 2018-09-28 | 2021-08-24 | Sonos, Inc. | Systems and methods for selective wake word detection using neural network models |
US11899519B2 (en) | 2018-10-23 | 2024-02-13 | Sonos, Inc. | Multiple stage network microphone device with reduced power consumption and processing load |
EP3654249A1 (en) | 2018-11-15 | 2020-05-20 | Snips | Dilated convolutions and gating for efficient keyword spotting |
US11183183B2 (en) | 2018-12-07 | 2021-11-23 | Sonos, Inc. | Systems and methods of operating media playback systems having multiple voice assistant services |
US11132989B2 (en) | 2018-12-13 | 2021-09-28 | Sonos, Inc. | Networked microphone devices, systems, and methods of localized arbitration |
US10602268B1 (en) | 2018-12-20 | 2020-03-24 | Sonos, Inc. | Optimization of network microphone devices using noise classification |
CN111801731B (zh) * | 2019-01-22 | 2024-02-13 | 京东方科技集团股份有限公司 | 语音控制方法、语音控制装置以及计算机可执行非易失性存储介质 |
US11315556B2 (en) | 2019-02-08 | 2022-04-26 | Sonos, Inc. | Devices, systems, and methods for distributed voice processing by transmitting sound data associated with a wake word to an appropriate device for identification |
US10867604B2 (en) | 2019-02-08 | 2020-12-15 | Sonos, Inc. | Devices, systems, and methods for distributed voice processing |
EP3709194A1 (en) | 2019-03-15 | 2020-09-16 | Spotify AB | Ensemble-based data comparison |
US11120794B2 (en) | 2019-05-03 | 2021-09-14 | Sonos, Inc. | Voice assistant persistence across multiple network microphone devices |
US11482210B2 (en) | 2019-05-29 | 2022-10-25 | Lg Electronics Inc. | Artificial intelligence device capable of controlling other devices based on device information |
KR102252526B1 (ko) * | 2019-06-07 | 2021-05-14 | 부산대학교 산학협력단 | 경량 IoT 장치를 위한 지능형 음성 서비스 지원 장치 및 방법 |
US11200894B2 (en) | 2019-06-12 | 2021-12-14 | Sonos, Inc. | Network microphone device with command keyword eventing |
US10586540B1 (en) | 2019-06-12 | 2020-03-10 | Sonos, Inc. | Network microphone device with command keyword conditioning |
US11361756B2 (en) | 2019-06-12 | 2022-06-14 | Sonos, Inc. | Conditional wake word eventing based on environment |
KR20190089128A (ko) * | 2019-07-10 | 2019-07-30 | 엘지전자 주식회사 | 음성 인식 방법 및 음성 인식 장치 |
US11138975B2 (en) | 2019-07-31 | 2021-10-05 | Sonos, Inc. | Locally distributed keyword detection |
US11138969B2 (en) | 2019-07-31 | 2021-10-05 | Sonos, Inc. | Locally distributed keyword detection |
US10871943B1 (en) | 2019-07-31 | 2020-12-22 | Sonos, Inc. | Noise classification for event detection |
CN110364161A (zh) * | 2019-08-22 | 2019-10-22 | 北京小米智能科技有限公司 | 响应语音信号的方法、电子设备、介质及系统 |
US11094319B2 (en) | 2019-08-30 | 2021-08-17 | Spotify Ab | Systems and methods for generating a cleaned version of ambient sound |
US11189286B2 (en) | 2019-10-22 | 2021-11-30 | Sonos, Inc. | VAS toggle based on device orientation |
KR20210050901A (ko) * | 2019-10-29 | 2021-05-10 | 엘지전자 주식회사 | 음성 인식 방법 및 음성 인식 장치 |
US11233490B2 (en) * | 2019-11-21 | 2022-01-25 | Motorola Mobility Llc | Context based volume adaptation by voice assistant devices |
EP3836582B1 (en) * | 2019-12-09 | 2024-01-31 | Google LLC | Relay device for voice commands to be processed by a voice assistant, voice assistant and wireless network |
US11200900B2 (en) | 2019-12-20 | 2021-12-14 | Sonos, Inc. | Offline voice control |
US20210210099A1 (en) * | 2020-01-06 | 2021-07-08 | Soundhound, Inc. | Multi Device Proxy |
US11562740B2 (en) | 2020-01-07 | 2023-01-24 | Sonos, Inc. | Voice verification for media playback |
KR20210098250A (ko) * | 2020-01-31 | 2021-08-10 | 삼성전자주식회사 | 전자 장치 및 이의 제어 방법 |
US11308958B2 (en) | 2020-02-07 | 2022-04-19 | Sonos, Inc. | Localized wakeword verification |
US11328722B2 (en) * | 2020-02-11 | 2022-05-10 | Spotify Ab | Systems and methods for generating a singular voice audio stream |
US11308959B2 (en) | 2020-02-11 | 2022-04-19 | Spotify Ab | Dynamic adjustment of wake word acceptance tolerance thresholds in voice-controlled devices |
CN111312250A (zh) * | 2020-02-21 | 2020-06-19 | 珠海荣邦电子科技有限公司 | 基于语音的多设备适配控制方法、装置及系统 |
US11727919B2 (en) | 2020-05-20 | 2023-08-15 | Sonos, Inc. | Memory allocation for keyword spotting engines |
US11482224B2 (en) | 2020-05-20 | 2022-10-25 | Sonos, Inc. | Command keywords with input detection windowing |
US11308962B2 (en) * | 2020-05-20 | 2022-04-19 | Sonos, Inc. | Input detection windowing |
US20220036211A1 (en) * | 2020-07-30 | 2022-02-03 | International Business Machines Corporation | User-hesitancy based validation for virtual assistance operations |
US11698771B2 (en) | 2020-08-25 | 2023-07-11 | Sonos, Inc. | Vocal guidance engines for playback devices |
CN112201244A (zh) * | 2020-09-30 | 2021-01-08 | 北京搜狗科技发展有限公司 | 一种记账方法、装置和耳机 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH057385A (ja) * | 1991-06-27 | 1993-01-14 | Sharp Corp | 音声認識リモコン装置 |
JPH05249989A (ja) * | 1992-03-06 | 1993-09-28 | Nippondenso Co Ltd | 音声認識制御装置 |
JP2002258892A (ja) * | 2001-03-05 | 2002-09-11 | Alpine Electronics Inc | 音声認識機器操作装置 |
JP2014178339A (ja) * | 2011-06-03 | 2014-09-25 | Nec Corp | 音声処理システム、発話者の音声取得方法、音声処理装置およびその制御方法と制御プログラム |
WO2015146179A1 (ja) * | 2014-03-28 | 2015-10-01 | パナソニックIpマネジメント株式会社 | 音声コマンド入力装置および音声コマンド入力方法 |
JP2016114744A (ja) * | 2014-12-15 | 2016-06-23 | オンキヨー株式会社 | 電子機器制御システム、端末装置、及び、サーバー |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110054900A1 (en) * | 2007-03-07 | 2011-03-03 | Phillips Michael S | Hybrid command and control between resident and remote speech recognition facilities in a mobile voice-to-speech application |
JP5075664B2 (ja) * | 2008-02-15 | 2012-11-21 | 株式会社東芝 | 音声対話装置及び支援方法 |
JP2010085790A (ja) * | 2008-09-30 | 2010-04-15 | Nec Corp | 会話学習支援システム、会話学習支援方法およびプログラム |
US9305553B2 (en) * | 2010-04-28 | 2016-04-05 | William S. Meisel | Speech recognition accuracy improvement through speaker categories |
US8762156B2 (en) | 2011-09-28 | 2014-06-24 | Apple Inc. | Speech recognition repair using contextual information |
KR20160023089A (ko) * | 2014-08-21 | 2016-03-03 | 엘지전자 주식회사 | 디지털 디바이스 및 그 제어 방법 |
US9318107B1 (en) * | 2014-10-09 | 2016-04-19 | Google Inc. | Hotword detection on multiple devices |
US9812128B2 (en) * | 2014-10-09 | 2017-11-07 | Google Inc. | Device leadership negotiation among voice interface devices |
KR102306798B1 (ko) * | 2015-03-20 | 2021-09-30 | 삼성전자주식회사 | 에코 제거 방법 및 그 전자 장치 |
WO2016210012A1 (en) * | 2015-06-22 | 2016-12-29 | Loose Cannon Systems, Inc. | Portable group communication device having audio playback and/or phone call capability |
US10152968B1 (en) * | 2015-06-26 | 2018-12-11 | Iconics, Inc. | Systems and methods for speech-based monitoring and/or control of automation devices |
US9875081B2 (en) * | 2015-09-21 | 2018-01-23 | Amazon Technologies, Inc. | Device selection for providing a response |
CN105825855A (zh) * | 2016-04-13 | 2016-08-03 | 联想(北京)有限公司 | 一种信息处理方法及主终端设备 |
KR20170132622A (ko) * | 2016-05-24 | 2017-12-04 | 삼성전자주식회사 | 음성 인식 기능을 갖는 전자 장치 및 전자 장치의 동작 방법 |
US10257363B2 (en) * | 2016-07-22 | 2019-04-09 | Lenovo (Singapore) Pte. Ltd. | Coordinating input on multiple local devices |
US9972320B2 (en) * | 2016-08-24 | 2018-05-15 | Google Llc | Hotword detection on multiple devices |
CN106951209A (zh) * | 2017-03-29 | 2017-07-14 | 联想(北京)有限公司 | 一种控制方法、装置及电子设备 |
-
2017
- 2017-08-09 JP JP2017154571A patent/JP6513749B2/ja active Active
-
2018
- 2018-06-15 CN CN201810621047.8A patent/CN109389975A/zh active Pending
- 2018-08-09 US US16/100,142 patent/US10867596B2/en active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH057385A (ja) * | 1991-06-27 | 1993-01-14 | Sharp Corp | 音声認識リモコン装置 |
JPH05249989A (ja) * | 1992-03-06 | 1993-09-28 | Nippondenso Co Ltd | 音声認識制御装置 |
JP2002258892A (ja) * | 2001-03-05 | 2002-09-11 | Alpine Electronics Inc | 音声認識機器操作装置 |
JP2014178339A (ja) * | 2011-06-03 | 2014-09-25 | Nec Corp | 音声処理システム、発話者の音声取得方法、音声処理装置およびその制御方法と制御プログラム |
WO2015146179A1 (ja) * | 2014-03-28 | 2015-10-01 | パナソニックIpマネジメント株式会社 | 音声コマンド入力装置および音声コマンド入力方法 |
JP2016114744A (ja) * | 2014-12-15 | 2016-06-23 | オンキヨー株式会社 | 電子機器制御システム、端末装置、及び、サーバー |
Also Published As
Publication number | Publication date |
---|---|
US20190051289A1 (en) | 2019-02-14 |
CN109389975A (zh) | 2019-02-26 |
US10867596B2 (en) | 2020-12-15 |
JP6513749B2 (ja) | 2019-05-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6513749B2 (ja) | 音声アシストシステム、サーバ装置、その音声アシスト方法、及びコンピュータが実行するためのプログラム | |
US11676601B2 (en) | Voice assistant tracking and activation | |
EP3507797B1 (en) | Accessing multiple virtual personal assistants (vpa) from a single device | |
CN107004411B (zh) | 话音应用架构 | |
US10777193B2 (en) | System and device for selecting speech recognition model | |
CN111095400A (zh) | 选择系统和方法 | |
NZ770836A (en) | Headless task completion within digital personal assistants | |
KR102508863B1 (ko) | 전자 장치 및 상기 전자 장치로부터 수신된 데이터를 처리하는 서버 | |
KR20140089863A (ko) | 디스플레이 장치, 및 이의 제어 방법, 그리고 음성 인식 시스템의 디스플레이 장치 제어 방법 | |
KR20200052638A (ko) | 전자 장치 및 전자 장치의 음성 인식 방법 | |
JP6904357B2 (ja) | 情報処理装置、情報処理方法、及びプログラム | |
CN108804070B (zh) | 音乐播放方法、装置、存储介质及电子设备 | |
EP3769303B1 (en) | Modifying spoken commands | |
US20190362709A1 (en) | Offline Voice Enrollment | |
JP2017138536A (ja) | 音声処理装置 | |
KR20220143683A (ko) | 전자 개인 비서 조정 | |
US10848866B2 (en) | Audio interface for multiple microphones and speaker systems to interface with a host | |
US11151995B2 (en) | Electronic device for mapping an invoke word to a sequence of inputs for generating a personalized command | |
KR20210116897A (ko) | 외부 장치의 음성 기반 제어를 위한 방법 및 그 전자 장치 | |
US10976997B2 (en) | Electronic device outputting hints in an offline state for providing service according to user context | |
KR20210044509A (ko) | 음성 인식의 향상을 지원하는 전자 장치 | |
US10580266B2 (en) | Indicator to indicate a state of a personal assistant application | |
EP3608905A1 (en) | Electronic apparatus for processing user utterance and controlling method thereof | |
EP3855305A1 (en) | Agent system, agent server, and agent program | |
US11641592B1 (en) | Device management using stored network metrics |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20181218 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190218 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190319 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190410 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6513749 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |