KR20140054643A - 음성인식장치 및 음성인식방법 - Google Patents
음성인식장치 및 음성인식방법 Download PDFInfo
- Publication number
- KR20140054643A KR20140054643A KR1020120120374A KR20120120374A KR20140054643A KR 20140054643 A KR20140054643 A KR 20140054643A KR 1020120120374 A KR1020120120374 A KR 1020120120374A KR 20120120374 A KR20120120374 A KR 20120120374A KR 20140054643 A KR20140054643 A KR 20140054643A
- Authority
- KR
- South Korea
- Prior art keywords
- speech recognition
- recognition engine
- speech
- voice
- signal
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 50
- 238000004891 communication Methods 0.000 claims abstract description 12
- 230000008569 process Effects 0.000 claims abstract description 11
- 238000012545 processing Methods 0.000 claims description 18
- 230000005540 biological transmission Effects 0.000 abstract 1
- 238000005516 engineering process Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 238000002513 implantation Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/32—Multiple recognisers used in sequence or in parallel; Score combination systems therefor, e.g. voting systems
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Selective Calling Equipment (AREA)
- Telephonic Communication Services (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
본 발명에 따른 음성인식장치는, 사용자의 음성신호를 수신하는 음성수신부; 상기 음성신호를 수신하여 음성인식 처리를 수행하는 제1음성인식엔진; 상기 음성신호를 수신하여 외부의 제2음성인식엔진으로 전송하는 통신부; 및 사용자의 선택에 기초하여, 상기 음성수신부를 통해 수신되는 음성신호를 상기 제1음성인식엔진 또는 상기 통신부 중 적어도 어느 하나로 전송하도록 제어하는 제어부를 포함한다.
Description
본 발명은 음성인식장치 및 음성인식장치를 통한 음성인식방법에 관한 것으로서, 보다 상세하게는 상이한 성능을 갖는 복수의 음성인식엔진을 이용하여 음성인식을 수행할 수 있는 음성인식장치 및 이러한 음성인식장치를 통한 음성인식방법에 관한 것이다.
음성 인식 기술은 사용자 등이 입력하는 음성을 집음하여 획득한 음성신호를 소정 언어에 대응되는 신호로 인식하는 기술로 다양한 분야에 활용될 수 있다. 특히, 음성인식기술은 손가락 등을 통해 특정 버튼을 누르는 등의 종래의 입력방식에 비해 간편하므로, 종래의 입력방식을 대체하는 수단으로 TV, 휴대폰 등의 전자기기에 활용되고 있다. 예를 들어, TV의 채널 조정을 '채널 올려'와 같은 특정 단어를 음성으로 입력하고, TV 내의 음성인식엔진을 통해 사용자의 음성신호를 인식하여 채널 조정을 수행할 수 있다.
음성인식 기술이 발달함에 따라 음성인식엔진을 통해 인식 가능한 음성신호의 범위도 확장되고 있는데, 종래에는 한정된 수의 정해진 단어만을 인식할 수 있는 정도에 불과 하였으나, 최근에는 비교적 긴 문장을 인식할 수 있으며 그 정확도 또한 향상된 음성인식엔진이 상용화되고 있는 추세이다.
한편, 음성인식엔진은 그 사용목적에 따라 여러 가지로 분류할 수 있는데, 크게 단어 인식용 엔진과, 연속어 인식용 엔진으로 구분할 수 있다. 단어 인식용 엔진은 한정된 수의 정해진 단어만을 인식하면 충분하므로 음성인식엔진의 용량이 크지 않아 전자기기 내의 임베디드형 엔진으로 활용 가능하다. 또한, 연속어 인식용 엔진은 대용량이 요구되는 대신 더욱 많은 단어 및 문장을 인식할 수 있으므로, 최근 들어 클라우드 환경이 구축됨에 따라 서버 기반으로 활용될 수 있다.
상술한 단어 인식용 엔진과 연속어 인식용 엔진은 용량면, 데이터 전송면, 속도 면에서 서로 상충되는 장단점을 가지고 있어, 양자를 적절히 활용하여 음성인식 기능을 더욱 효율적으로 사용할 수 있을 것이다. 다만, 하나의 음성신호에 대해 여러가지 형태의 음성인식엔진에서 음성 인식을 수행하는 경우 그 결과가 달라 음성신호에 따른 제어를 수행하는데 문제가 발생할 수 있다.
이에 본 발명은 상이한 성능을 갖는 복수의 음성인식엔진을 이용하여 음성인식을 수행하면서, 각 음성인식엔진의 음성인식의 결과의 충돌을 방지할 수 있는 음성인식장치 및 음성인식장치를 통한 음성인식방법을 제안하고자 한다.
상기 목적은 본 발명에 따라, 음성인식장치에 있어서, 사용자의 음성신호를 수신하는 음성수신부; 상기 음성신호를 수신하여 음성인식 처리를 수행하는 제1음성인식엔진; 상기 음성신호를 수신하여 외부의 제2음성인식엔진으로 전송하는 통신부; 및 사용자의 선택에 기초하여, 상기 음성수신부를 통해 수신되는 음성신호를 상기 제1음성인식엔진 또는 상기 통신부 중 적어도 어느 하나로 전송하도록 제어하는 제어부를 포함하는 것을 특징으로 하는 음성인식장치에 의해 달성될 수 있다.
여기서, 상기 제1음성인식엔진은 기 설정된 어휘만을 인식할 수 있는 임베디드형 엔진으로 구성되고, 상기 제2음성인식엔진은 연속된 다수의 어휘를 인식할 수 있는 서버형 엔진으로 구성될 수 있다.
여기서, 원격제어장치를 통한 사용자의 입력신호를 수신하는 사용자입력부를 더 포함하며; 상기 원격제어장치는 음성인식엔진의 선택을 위한 적어도 하나의 음성인식엔진 선택 버튼 포함할 수 있다.
여기서, 상기 제어부는 상기 음성인식엔진 선택 버튼을 누르는 시간이 소정 이상인 경우, 상기 음성신호를 상기 제1음성인식엔진 또는 상기 제2음성인식엔진 중 어느 하나로 전송하고, 소정 미만인 경우 다른 하나로 전송하도록 제어할 수 있다.
여기서, 상기 원격제어장치의 상기 음성인식엔진 선택 버튼은 상기 제1음성인식엔진 및 상기 제2음성인식엔진 각각에 대응하는 복수의 버튼을 포함하며, 상기 제어부는 상기 복수의 버튼 중 어느 하나에 대응하는 입력신호가 수신되는 경우, 상기 음성신호를 상기 버튼에 대응하는 음성인식엔진으로 전송하도록 제어할 수 있다.
여기서, 상기 제어부는 상기 음성수신부를 통해 상기 음성신호가 수신되면, 상기 수신한 음성신호에 기설정된 어휘가 포함되는지 여부에 기초하여, 음성인식을 수행할 상기 제1음성인식엔진 또는 상기 제2음성인식엔진 중 어느 하나를 결정할 수 있다.
여기서, 상기 수신되는 음성신호는 상기 제1음성인식엔진 및 상기 제2음성인식엔진으로 각각 전송되고, 상기 제어부는 상기 제1음성인식엔진의 음성인식 결과에 기초하여 상기 음성신호에 상기 기설정된 어휘가 포함되는지 여부를 판단할 수 있다.
여기서, 상기 제어부는 상기 음성신호의 전반부에 기설정된 음성이 포함되는지 판단할 수 있다.
여기서, 음성인식장치는 영상을 표시하는 디스플레이부를 포함하는 디스플레이장치로 구현되며, 상기 제어부는 음성신호를 처리하는 음성인식엔진에 관한 정보를 포함하는 UI를 상기 디스플레이부에 표시하도록 제어할 수 있다.
또한, 상기 목적은 본 발명에 따라, 음성인식장치를 통한 음성인식방법에 있어서, 사용자의 음성신호를 수신하는 단계; 사용자의 선택에 기초하여, 상기 수신한 음성신호를 처리할, 상기 음성인식장치에 포함된 제1음성인식엔진 또는 상기 음성인식장치 외부에 위치하는 제2음성인식엔진 중 적어도 하나를 결정하는 단계; 및 상기 결정 결과에 기초하여, 상기 음성신호를 상기 제1음성인식엔진 또는 상기 제2음성인식엔진 중 적어도 하나로 전송하는 단계를 포함하는 것을 특징으로 하는 음성인식방법에 의해서 달성될 수도 있다.
여기서, 상기 제1음성인식엔진은 기 설정된 어휘만을 인식할 수 있는 임베디드형 엔진으로 구성되고, 상기 제2음성인식엔진은 연속된 다수의 어휘를 인식할 수 있는 서버형 엔진으로 구성될 수 있다.
여기서, 원격제어장치를 통한 사용자의 입력신호를 수신하는 단계를 더 포함하며, 상기 원격제어장치는 음성인식엔진의 선택을 위한 적어도 하나의 음성인식엔진 선택 버튼을 포함할 수 있다.
여기서, 상기 결정하는 단계는, 상기 음성인식엔진 선택 버튼을 누르는 시간이 소정 이상인 경우, 상기 음성신호를 처리할 음성인식엔진을 상기 제1음성인식엔진 또는 상기 제2음성인식엔진 중 어느 하나로 결정하고, 소정 미만인 경우 다른 하나로 결정할 수 있다.
여기서, 상기 원격제어장치의 상기 음성인식엔진 선택 버튼은 상기 제1음성인식엔진 및 상기 제2음성인식엔진 각각에 대응하는 복수의 버튼을 포함하고, 상기 결정하는 단계는, 상기 복수의 버튼 중 어느 하나에 대응하는 입력신호가 수신되는 경우, 상기 음성신호를 처리할 음성인식엔진을 상기 버튼에 대응하는 상기 제1음성인식엔진 또는 상기 제2음성인식엔진 중 어느 하나로 결정할 수 있다.
여기서, 상기 수신한 음성신호에 기설정된 어휘가 포함되는지 여부를 판단하는 단계를 더 포함하고, 상기 결정하는 단계는, 상기 판단 결과에 기초하여, 음성인식을 수행할 상기 제1음성인식엔진 또는 상기 제2음성인식엔진 중 어느 하나를 결정할 수 있다.
여기서, 상기 수신되는 음성신호는 상기 제1음성인식엔진 및 상기 제2음성인식엔진으로 각각 전송되고, 상기 판단하는 단계는, 상기 제1음성인식엔진의 음성인식 결과에 기초하여 상기 음성신호에 상기 기설정된 어휘가 포함되는지 여부를 판단할 수 있다.
여기서, 상기 판단하는 단계는, 상기 음성신호의 전반부에 상기 기설정된 음성이 포함되는지 판단할 수 있다.
여기서, 상기 음성인식장치는 영상을 표시하는 디스플레이부를 포함하는 디스플레이장치로 구현되며, 상기 음성신호를 처리하는 음성인식엔진에 관한 정보를 포함하는 UI를 상기 디스플레이부에 표시하는 단계를 더 포함할 수 있다.
이상 설명한 바와 같이, 본 발명에 따르면, 상이한 성능을 갖는 복수의 음성인식엔진을 이용하여 음성인식을 수행하면서, 각 음성인식엔진의 음성인식의 결과의 충돌을 방지할 수 있는 음성인식장치 및 음성인식장치를 통한 음성인식방법을 제공할 수 있다.
도1은 본 발명에 따른 음성인식장치의 제어블록도이다.
도2는 본 발명에 따른 원격제어장치를 간략히 도시한 것이다.
도3은 디스플레이부에 표시된 UI를 간략히 도시한 것이다.
도4는 본 발명의 제1실시예에 따른 음성인식방법의 흐름도이다.
도5는 본 발명의 제2실시예에 따른 음성인식방법의 흐름도이다.
도2는 본 발명에 따른 원격제어장치를 간략히 도시한 것이다.
도3은 디스플레이부에 표시된 UI를 간략히 도시한 것이다.
도4는 본 발명의 제1실시예에 따른 음성인식방법의 흐름도이다.
도5는 본 발명의 제2실시예에 따른 음성인식방법의 흐름도이다.
이하, 첨부한 도면을 참고로 하여 본 발명의 실시예들에 대하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다. 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예들에 한정되지 않는다. 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 동일 또는 유사한 구성요소에 대해서는 동일한 참조부호를 붙이도록 한다.
도1은 본 발명에 따른 음성인식장치(100)의 제어블록도이다.
도시된 바와 같이, 본 발명에 따른 음성인식장치(100)는 음성수신부(110), 제1음성인식엔진(140), 통신부(150), 제어부(150)를 포함하며, 실시 형태에 따라 사용자입력부(120), 디스플레이부(170)를 더 포함할 수 있다.
음성수신부(110)는 사용자의 음성신호(10)를 수신한다. 음성수신부(110)는 음성인식장치(100)에 마련된 마이크를 통해 구현될 수 있으며, 원격제어장치(20)에 마련된 마이크(도2의 22)를 통해 집음된 음성신호를 수신하는 형태로도 구현될 수 있다.
제1음성인식엔진(140)은 음성신호를 수신하여 음성인식 처리를 수행한다. 음성인식 기능은 음성신호를 언어 데이터로 변환하는 일련의 과정으로써 제1음성인식엔진(140)은 공지의 다양한 음성인식 방법에 따라 음성신호를 언어 데이터로 변환하여 출력할 수 있다. 한편, 음성수신부(110)를 통해 수신되는 음성신호(10)는 음성인식을 목표로 한 사용자의 음성 이외에 다양한 노이즈를 포함할 수 있으므로, 주파수 분석 등의 전처리 과정을 통해 사용자의 음성 성분만을 추출하고, 추출된 음성 성분에 대해 음성인식 처리를 수행할 수 있다. 음성인식엔진을 통한 음성 인식 방법은 공지의 다양한 방법이 존재하므로, 이에 대한 설명은 생략하기로 한다.
제1음성인식엔진(140)은 음성인식장치(100) 내부에 마련되는 임베디드형 엔진으로 구현될 수 있으며, 별도의 하드웨어로 구현되거나, 후술할 제어부(150)에 의해 실행되는 소프트웨어로 구현될 수도 있다. 이러한 임베디드형 엔진은 정해진 수의 특정한 어휘 만을 인식 가능할 수 있다. 예를 들어, 음성인식장치(100)가 TV 등의 디스플레이장치로 구현되는 경우, TV를 제어하기 위한 사용자의 입력을 인식하는 용도로 활용될 수 있다. 사용자가 '채널 올려', '전원 오프', '음소거' 등의 음성신호를 입력하는 경우에, 제1음성인식엔진(140)은 음성신호를 인식하여 기 설정된 언어 중 어느 하나로 인식되는 경우, 인식된 언어 데이터를 출력할 수 있다. 이러한 임베디드형 엔진은 작은 용량의 메모리 만으로 구현이 가능하고, 속도 면에 있어서 우월한 장점이 있으나, 인식할 수 있는 어휘에 한계가 존재할 수 밖에 없어 앞서 설명한 바와 같이 TV 제어 등의 간단한 입력만이 가능한 한계가 있다.
음성인식장치(100)는 음성신호를 수신하여 외부의 제2음성인식엔진(210)으로 전송하는 통신부(150)를 더 포함하며, 제2음성인식엔진(210)의 인식 결과에 따른 언어 데이터를 수신할 수 있다. 제2음성인식엔진(210)은 외부의 음성인식서버(200)에 포함될 수 있으며, 통신부(150)는 네트워크를 통해 음성인식서버(200)로 음성신호를 전달하고, 제2음성인식엔진(210)의 음성인식 결과를 수신할 수 있다.
앞서 설명한 바와 같이, 임베디드형 엔진에 해당하는 제1음성인식엔진(140)과 달리, 제2음성인식엔진(210)은 서버를 통해 구현되므로 다양한 어휘 또는 연속어의 인식이 가능할 수 있다. 예를 들어, 검색창에 특정 검색어를 입력하는 것, SNS 등의 어플리케이션을 통해 문장을 입력하는 것 등은 많은 어휘의 인식이 요구되므로, 임베디드형 엔진을 통해서는 실현이 쉽지 않지만, 서버를 통해 구현되는 제2음성인식엔진(210)을 통해서는 실현이 가능하다. 즉, 제2음성인식엔진(210)을 활용하는 경우, 음성인식서버(200)로 음성신호를 전달해야 하는 과정을 거치는 결과 속도가 느린 대신 성능 면에서는 우수하다고 볼 수 있다.
따라서, 본 발명에 따른 음성인식장치(100)는 음성수신부(110)를 통해 입력되는 음성신호를 제1음성인식엔진(140) 및 제2음성인식엔진(210) 모두를 활용하여 인식 결과를 활용할 수 있도록 구성된다. 특정한 음성신호가 입력될 때, 상기 음성인식엔진의 특성에 따른 용도 차이로 인해서 음성인식장치(100)는 입력되는 음성신호를 어느 음성인식엔진으로 전송할 지 결정해야 할 필요가 있다. 제1음성인식엔진(140)과 제2음성인식엔진(210) 모두에서 음성 인식 결과를 출력할 경우, 하나의 입력에 대해 복수의 동작이 수행될 수 있어 사용자가 의도하는 입력이 이루어지지 않을 수 있다. 하지만, 음성인식장치(100) 내에서 음성신호만을 보고 이를 결정하는 것은 쉽지가 않으며, 음성신호 이외의 추가적인 정보를 통해 이를 결정하는 것이 바람직하다.
제어부(150)는 본 발명의 음성인식장치(100)를 전반적으로 제어하는 역할을 수행하는 CPU, MiCOM과 같은 마이크로프로세서로 구현될 수 있다. 특히, 제어부(150)는 음성수신부(110)에서 수신하여 출력된 음성신호를 제1음성인식엔진(140) 또는 통신부(150) 중 적어도 어느 하나로 전송하도록 제어하는 역할을 수행한다. 이를 위해 제어부(150)는 디멀티플렉서와 같이 입력되는 신호를 하나의 경로로 스위칭하는 음성분기부(미도시)를 포함할 수 있다. 한편, 음성신호를 전달할 음성인식엔진을 결정하는 기준은 사용자의 선택에 기초하며, 구체적으로 다음과 같은 실시예를 들 수 있다.
제1실시예로써, 제어부(150)는 사용자의 원격제어장치(20)를 통한 조작에 따라 음성신호를 전달할 음성인식엔진을 결정할 수 있다. 도 3에 도시된 바와 같이, 사용자는 원격제어장치(20)를 통해 음성인식장치(100)를 제어하기 위한 입력신호를 입력할 수 있으며, 원격제어장치(20)는 도2에 도시된 바와 같이, 채널 선택, 볼륨 조정 등 통상적인 버튼 이외에 음성인식엔진의 선택을 위한 별도의 적어도 하나의 버튼(21)을 포함할 수 있다. 원격제어장치(20)는 IR(Infra Red) 또는 블루투스와 같은 근거리 통신 방법을 활용하여 사용자의 입력신호를 음성인식장치(100)로 전송할 수 있으며, 음성인식장치(100)는 원격제어장치(20)로부터 전송된 사용자의 입력신호를 수신하기 위한 사용자입력부(120)를 더 포함할 수 있다. 또한, 앞서 설명한 바와 같이 원격제어장치에 음성신호를 수신하기 위한 마이크(22)를 포함할 수도 있다.
제1실시예의 구체적인 예로, 제어부(150)는 사용자가 음성인식엔진 선택 버튼(21)을 누르는 시간이 소정 시간 이상인 경우, 음성신호를 제1음성인식엔진(140) 또는 제2음성인식엔진(210) 중 어느 하나로 전송하고, 소정 미만인 경우 다른 하나로 전송하도록 제어할 수 있다. 예를 들어, 사용자가 음성인식엔진 선택 버튼(21)을 1초 미만으로 짧게 누른 후 음성신호를 입력하면 제1음성인식엔진(140)으로 음성신호를 전송하고, 1초 이상으로 길게 누른 후 음성신호를 입력하면 제2음성인식엔진(210)으로 전송할 수 있다. 앞서 설명한 바와 같이, 제1음성인식엔진(140)은 임베디드 엔진으로써 저용량으로 구현할 수 있는 대신 간단한 어휘만을 인식할 수 밖에 없으며, 제2음성이식엔진은 다양한 어휘 및 문장을 인식할 수 있는 대신 속도가 느린 단점이 있다. 따라서, 사용자는 의도에 따라 채널 전환 등 간단한 단어로 인식 가능하고 음성인식장치(100)를 제어하는 데 있어 빠른 동작이 요구되는 경우에는 음성인식엔진 선택 버튼(21)을 짧게 누른 후에 음성신호를 입력하고, 인터넷 검색어의 입력과 같이 긴 문장을 입력하고자 하는 경우 음성인식엔진 선택 버튼(21)을 길게 누른 후에 음성신호를 입력할 수 있다.
제1실시예의 다른 형태로써, 원격제어장치(20)의 음성인식엔진 선택 버튼(21)은 제1음성인식엔진(140) 및 제2음성인식엔진(210) 각각에 대응하는 복수의 버튼(21)을 포함할 수 있다. 사용자가 제1음성인식엔진(140)에 대응하는 음성인식엔진 선택 버튼을 누른 후 음성신호를 입력하면, 제어부(150)는 음성신호를 제1음성인식엔진(140)으로 전송하여 제1음성인식엔진(140)에 의해 음성인식을 수행하고, 사용자가 제2음성인식엔진(210)에 대응하는 음성인식엔진 선택 버튼을 누른 후 음성신호를 입력하면, 제어부(150)는 음성신호를 통신부(150)를 통해 제2음성인식엔진(210)으로 전송함으로써 제2음성인식엔진(210)에 의해 음성인식이 수행되도록 제어한다.
앞서 설명한 제1실시예는, 사용자가 원격제어장치(20)의 버튼을 통해 음성인식엔진을 선택하는 방법에 관한 것이며, 이하에서 설명할 제2실시예 음성신호 자체의 인식 결과에 따라 음성인식엔진을 선택하는 방법을 제안한다.
본 발명의 제2실시예에 따라, 제어부(150)는 음성수신부(110)를 통해 음성신호가 수신되면, 수신한 음성신호에 기설정된 어휘가 포함되는지 여부에 기초하여, 음성인식을 수행할 제1음성인식엔진(140) 및 제2음성인식엔진(210) 중 어느 하나를 결정할 수 있다. 구체적으로, 음성신호의 전반부에 기설정된 음성이 포함되는지에 따라 음성인식엔진을 결정할 수 있다.
예를 들어, 음성신호에 '명령'이라는 어휘가 포함된 경우, 제1음성인식엔진(140)에 의해 음성인식이 처리되도록 결정할 수 있다. 이 경우, 사용자가 '명령 채널올려'라는 음성을 입력하면, 제1음성인식엔진(140)에서 음성인식을 수행하고, 음성인식 결과에 따라 제어부(150)는 '채널올려'에 대응하는 동작을 수행한다. 또한 사용자가 '오늘 날씨 알려줘'라는 음성을 입력하면, 제2음성인식엔진(210)으로 음성신호가 전송되어, 제2음성인식엔진(210)에 의해 음성인식 기능이 수행된다.
제2실시예에서 음성신호는 일단 제1음성인식엔진(140) 및 제2음성인식엔진(210)으로 각각 전송되고, 제어부(150)는 제1음성인식엔진(140)의 인식 결과 음성신호에 기설정된 어휘가 포함된 경우, 제1음성인식엔진(140)의 인식 결과에 따른 언어 데이터에 따라 동작 제어를 수행한다. 이 때, 제2음성인식엔진(210) 역시 음성신호를 전달 받아 음성인식 결과를 음성인식장치(100)로 전송할 수 있으나, 제어부(150)는 제2음성인식엔진(210)의 음성인식 결과에 대해서는 동작을 수행할 필요가 없다. 반면, 음성신호에 기설정된 어휘가 포함되지 않은 경우, 제1음성인식엔진(140)의 인식 결과는 무시되고, 제어부(150)는 제2음성인식엔진(210)의 음성인식 결과에 따라 동작 제어를 수행한다.
본 발명에 따른 음성인식장치(100)는 영상을 표시하는 디스플레이부(170)를 포함하는 디스플레이장치로 구현될 수 있다. 이 경우 제어부(150)는 음성신호를 처리하는 음성인식엔진에 관한 정보를 포함하는 UI(300)를 디스플레이부(170)에 표시하도록 제어할 수 있다. 도 3에 도시된 바와 같이, 음성신호가 입력되고 그 결과에 따라 채널 전환 또는 검색어의 입력과 같은 동작이 수행되면, 해당 음성인식 결과가 어떠한 음성인식엔진에 의해 수행된 것인지를 지시하는 UI(300)를 표시하여, 사용자에게 피드백을 제공할 수 있다. 또한, 앞서 설명한 제1실시예에서 소정 시간 이상 사용자가 음성인식엔진 선택 버튼을 누르는 지 여부에 따라 음성인식 처리를 수행할 음성인식엔진이 결정되므로, 누르는 시간에 대한 정보를 UI(300)를 통해 보여주는 것 역시 가능하다.
상술한 본 발명에 따른 음성인식장치(100)는 상이한 성능을 갖는 복수의 음성인식엔진을 이용하여 음성인식을 수행할 수 있으며, 사용자의 입력에 따라 입력되는 음성신호를 처리할 음성인식엔진을 결정할 수 있어, 용도 및 사용자의 의도에 따른 음성인식엔진을 통해 음성인식을 수행할 수 있다.
도 4는 본 발명의 제1실시예에 따른 음성인식장치를 통한 음성인식방법의 흐름도이다.
본 발명에 따른 음성인식장치는 사용자의 음성신호를 제1음성인식엔진 또는 제2음성인식엔진을 통해 음성인식 처리를 수행할 수 있다. 제1음성인식엔진은 음성인식장치 내부에 마련되는 임베디드형 엔진으로 구현되어 작은 용량으로 구현 가능한 대신 정해진 수의 특정한 어휘만을 인식 가능하도록 마련될 수 있으며, 제2음성인식엔진은 이와 달리 서버형 엔진으로 구현되어 음성인식장치 외부의 음성인식서버에 마련되어 다수의 어휘 및 문장을 인식 가능하도록 마련될 수 있다.
음성인식장치는 사용자의 음성신호를 수신한다(S110). 이 때, 음성인식장치에 마련된 마이크를 통해 사용자의 음성을 수신하거나, 원격제어장치에 마련된 마이크를 통해 집음된 음성신호를 수신할 수 있다.
음성인식장치는 사용자의 선택에 기초하여, 수신한 음성신호를 처리할, 상기 음성인식장치에 포함된 제1음성인식엔진 또는 음성인식장치 외부에 위치하는 제2음성인식엔진 중 적어도 하나를 결정한다(S130).
음성인식장치는 상기 결정 결과에 기초하여, 음성신호를 제1음성인식엔진 또는 제2음성인식엔진 중 적어도 하나로 전송하고(S140), 음성신호를 전송받은 음성인식엔진은 음성인식 처리를 수행한다(S150). 음성인식장치는 음성인식 결과에 따라, 채널 전환, 검색어의 입력과 같은 동작 제어를 수행한다.
여기서, 상기 결정 단계는 사용자의 선택에 기초하여 이루어지며, 제1실시예에 따른 음성인식방법은 원격제어장치를 통한 사용자의 입력신호를 수신하는 단계를 더 포함하며, 사용자의 입력신호에 기초하여 제1음성인식엔진 또는 제2음성인식엔진 중 적어도 하나를 결정할 수 있다. 이를 위해, 원격제어장치는 음성인식엔진의 선택을 위한 적어도 하나의 버튼을 포함할 수 있다.
이 때, 음성인식엔진 선택 버튼을 누르는 시간이 소정 이상인 경우, 음성신호를 처리할 음성인식엔진을 제1음성인식엔진 또는 제2음성인식엔진 중 어느 하나로 결정하고, 소정 미만인 경우 다른 하나로 결정할 수 있다. 다른 실시예로써, 원격제어장치의 음성인식엔진 선택 버튼은 제1음성인식엔진 및 제2음성인식엔진 각각에 대응하는 복수의 버튼을 포함하고, 상기 결정하는 단계는, 복수의 버튼 중 어느 하나에 대응하는 입력신호가 수신되는 경우, 음성신호를 처리할 음성인식엔진을 선택된 버튼에 대응하는 제1음성인식엔진 또는 제2음성인식엔진 중 어느 하나로 결정할 수 있다.
음성인식장치는 영상을 표시하는 디스플레이부를 포함하는 디스플레이장치로 구현될 수 있으며, 음성신호를 처리하는 음성인식엔진에 관한 정보를 포함하는 UI를 디스플레이부에 표시하는 단계를 더 포함할 수 있다.
도 5는 본 발명의 제2실시예에 따른 음성인식장치를 통한 음성인식방법의 흐름도이다.
음성인식장치는 사용자의 음성신호를 수신한다(S210).
수신된 음성신호는 제1음성인식엔진 및 제2음성인식엔진으로 각각 전송된다(S220).
제2실시예에서는 수신한 음성신호에 기설정된 어휘가 포함되는지 여부에 기초하여, 음성인식을 수행할 제1음성인식엔진 및 제2음성인식엔진 중 어느 하나를 결정할 수 있다(S230). 이 경우 음성신호의 전반부에 기설정된 음성이 포함되는지 판단할 수 있다.
판단 결과, 기설정된 어휘가 포함된 경우 제1음성인식엔진을 통해 음성인식 처리를 수행하고(S240), 포함되지 않은 경우, 제2음성인식엔진을 통해 음성인식 처리를 수행할 수 있다(S250).
상술한 본 발명에 따른 음성인식장치를 통한 음성인식방법은 상이한 성능을 갖는 복수의 음성인식엔진을 이용하여 음성인식을 수행할 수 있으며, 사용자의 입력에 따라 입력되는 음성신호를 처리할 음성인식엔진을 결정할 수 있어, 용도 및 사용자의 의도에 따른 음성인식엔진을 통해 음성인식을 수행할 수 있다.
이상 첨부된 도면을 참조하여 본 발명의 실시 예들을 설명하였지만, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명의 그 기술적 사상이나 필수적인 특징들이 변경되지 않고서 다른 구체적인 형태로 실시될 수 있다는 것으로 이해할 수 있을 것이다. 그러므로, 이상에서 기술한 실시 예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 균등개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.
10: 음성신호
20: 원격제어장치
100: 음성인식장치
110: 음성수신부
120: 사용자입력부
140: 제1음성인식엔진
150: 통신부
160: 제어부
170: 디스플레이부
200: 음성인식서버
210: 제2음성인식엔진
20: 원격제어장치
100: 음성인식장치
110: 음성수신부
120: 사용자입력부
140: 제1음성인식엔진
150: 통신부
160: 제어부
170: 디스플레이부
200: 음성인식서버
210: 제2음성인식엔진
Claims (18)
- 음성인식장치에 있어서,
사용자의 음성신호를 수신하는 음성수신부;
상기 음성신호를 수신하여 음성인식 처리를 수행하는 제1음성인식엔진;
상기 음성신호를 수신하여 외부의 제2음성인식엔진으로 전송하는 통신부; 및
사용자의 선택에 기초하여, 상기 음성수신부를 통해 수신되는 음성신호를 상기 제1음성인식엔진 또는 상기 통신부 중 적어도 어느 하나로 전송하도록 제어하는 제어부를 포함하는 것을 특징으로 하는 음성인식장치. - 제 1항에 있어서,
상기 제1음성인식엔진은 기 설정된 어휘만을 인식할 수 있는 임베디드형 엔진으로 구성되고, 상기 제2음성인식엔진은 연속된 다수의 어휘를 인식할 수 있는 서버형 엔진으로 구성되는 것을 특징으로 하는 음성인식장치. - 제 2항에 있어서,
원격제어장치를 통한 사용자의 입력신호를 수신하는 사용자입력부를 더 포함하며;
상기 원격제어장치는 음성인식엔진의 선택을 위한 적어도 하나의 음성인식엔진 선택 버튼 포함하는 것을 특징으로 하는 음성인식장치. - 제 3항에 있어서,
상기 제어부는 상기 음성인식엔진 선택 버튼을 누르는 시간이 소정 이상인 경우, 상기 음성신호를 상기 제1음성인식엔진 또는 상기 제2음성인식엔진 중 어느 하나로 전송하고, 소정 미만인 경우 다른 하나로 전송하도록 제어하는 것을 특징으로 하는 음성인식장치. - 제 3항에 있어서,
상기 원격제어장치의 상기 음성인식엔진 선택 버튼은 상기 제1음성인식엔진 및 상기 제2음성인식엔진 각각에 대응하는 복수의 버튼을 포함하며, 상기 제어부는 상기 복수의 버튼 중 어느 하나에 대응하는 입력신호가 수신되는 경우, 상기 음성신호를 상기 버튼에 대응하는 음성인식엔진으로 전송하도록 제어하는 것을 특징으로 하는 음성인식장치. - 제 2항에 있어서,
상기 제어부는 상기 음성수신부를 통해 상기 음성신호가 수신되면, 상기 수신한 음성신호에 기설정된 어휘가 포함되는지 여부에 기초하여, 음성인식을 수행할 상기 제1음성인식엔진 또는 상기 제2음성인식엔진 중 어느 하나를 결정하는 것을 특징으로 하는 음성인식장치. - 제 6항에 있어서,
상기 수신되는 음성신호는 상기 제1음성인식엔진 및 상기 제2음성인식엔진으로 각각 전송되고,
상기 제어부는 상기 제1음성인식엔진의 음성인식 결과에 기초하여 상기 음성신호에 상기 기설정된 어휘가 포함되는지 여부를 판단하는 것을 특징으로 하는 음성인식장치. - 제 7항에 있어서,
상기 제어부는 상기 음성신호의 전반부에 기설정된 음성이 포함되는지 판단하는 것을 특징으로 하는 음성인식장치. - 제 1항에 있어서,
음성인식장치는 영상을 표시하는 디스플레이부를 포함하는 디스플레이장치로 구현되며, 상기 제어부는 음성신호를 처리하는 음성인식엔진에 관한 정보를 포함하는 UI를 상기 디스플레이부에 표시하도록 제어하는 것을 특징으로 하는 음성인식장치. - 음성인식장치를 통한 음성인식방법에 있어서,
사용자의 음성신호를 수신하는 단계;
사용자의 선택에 기초하여, 상기 수신한 음성신호를 처리할, 상기 음성인식장치에 포함된 제1음성인식엔진 또는 상기 음성인식장치 외부에 위치하는 제2음성인식엔진 중 적어도 하나를 결정하는 단계;
상기 결정 결과에 기초하여, 상기 음성신호를 상기 제1음성인식엔진 또는 상기 제2음성인식엔진 중 적어도 하나로 전송하는 단계를 포함하는 것을 특징으로 하는 음성인식방법. - 제 10항에 있어서,
상기 제1음성인식엔진은 기 설정된 어휘만을 인식할 수 있는 임베디드형 엔진으로 구성되고, 상기 제2음성인식엔진은 연속된 다수의 어휘를 인식할 수 있는 서버형 엔진으로 구성되는 것을 특징으로 하는 음성인식방법. - 제 11항에 있어서,
원격제어장치를 통한 사용자의 입력신호를 수신하는 단계를 더 포함하며,
상기 원격제어장치는 음성인식엔진의 선택을 위한 적어도 하나의 음성인식엔진 선택 버튼을 포함하는 것을 특징으로 하는 음성인식방법. - 제 12항에 있어서,
상기 결정하는 단계는, 상기 음성인식엔진 선택 버튼을 누르는 시간이 소정 이상인 경우, 상기 음성신호를 처리할 음성인식엔진을 상기 제1음성인식엔진 또는 상기 제2음성인식엔진 중 어느 하나로 결정하고, 소정 미만인 경우 다른 하나로 결정하는 것을 특징으로 하는 음성인식방법. - 제 12항에 있어서,
상기 원격제어장치의 상기 음성인식엔진 선택 버튼은 상기 제1음성인식엔진 및 상기 제2음성인식엔진 각각에 대응하는 복수의 버튼을 포함하고,
상기 결정하는 단계는, 상기 복수의 버튼 중 어느 하나에 대응하는 입력신호가 수신되는 경우, 상기 음성신호를 처리할 음성인식엔진을 상기 버튼에 대응하는 상기 제1음성인식엔진 또는 상기 제2음성인식엔진 중 어느 하나로 결정하는 것을 특징으로 하는 음성인식방법. - 제 10항에 있어서,
상기 수신한 음성신호에 기설정된 어휘가 포함되는지 여부를 판단하는 단계를 더 포함하고,
상기 결정하는 단계는,
상기 판단 결과에 기초하여, 음성인식을 수행할 상기 제1음성인식엔진 또는 상기 제2음성인식엔진 중 어느 하나를 결정하는 것을 특징으로 하는 음성인식방법. - 제 15항에 있어서,
상기 수신되는 음성신호는 상기 제1음성인식엔진 및 상기 제2음성인식엔진으로 각각 전송되고,
상기 판단하는 단계는, 상기 제1음성인식엔진의 음성인식 결과에 기초하여 상기 음성신호에 상기 기설정된 어휘가 포함되는지 여부를 판단하는 것을 특징으로 하는 음성인식방법. - 제 16항에 있어서,
상기 판단하는 단계는, 상기 음성신호의 전반부에 상기 기설정된 음성이 포함되는지 판단하는 것을 특징으로 하는 음성인식방법. - 제 10항에 있어서,
상기 음성인식장치는 영상을 표시하는 디스플레이부를 포함하는 디스플레이장치로 구현되며,
상기 음성신호를 처리하는 음성인식엔진에 관한 정보를 포함하는 UI를 상기 디스플레이부에 표시하는 단계를 더 포함하는 것을 특징으로 하는 음성인식방법.
Priority Applications (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020120120374A KR20140054643A (ko) | 2012-10-29 | 2012-10-29 | 음성인식장치 및 음성인식방법 |
US13/956,764 US20140122075A1 (en) | 2012-10-29 | 2013-08-01 | Voice recognition apparatus and voice recognition method thereof |
EP13180833.9A EP2725577A3 (en) | 2012-10-29 | 2013-08-19 | Voice recognition apparatus and voice recognition method thereof |
JP2013187036A JP2014089437A (ja) | 2012-10-29 | 2013-09-10 | 音声認識装置及び音声認識方法 |
RU2015120296A RU2015120296A (ru) | 2012-10-29 | 2013-10-02 | Устройство распознавания голоса и его способ распознавания голоса |
PCT/KR2013/008831 WO2014069798A1 (en) | 2012-10-29 | 2013-10-02 | Voice recognition apparatus and voice recognition method thereof |
CN201310520646.8A CN103794212A (zh) | 2012-10-29 | 2013-10-29 | 语音识别设备及其语音识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020120120374A KR20140054643A (ko) | 2012-10-29 | 2012-10-29 | 음성인식장치 및 음성인식방법 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20140054643A true KR20140054643A (ko) | 2014-05-09 |
Family
ID=49003669
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020120120374A KR20140054643A (ko) | 2012-10-29 | 2012-10-29 | 음성인식장치 및 음성인식방법 |
Country Status (7)
Country | Link |
---|---|
US (1) | US20140122075A1 (ko) |
EP (1) | EP2725577A3 (ko) |
JP (1) | JP2014089437A (ko) |
KR (1) | KR20140054643A (ko) |
CN (1) | CN103794212A (ko) |
RU (1) | RU2015120296A (ko) |
WO (1) | WO2014069798A1 (ko) |
Cited By (53)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20180127784A (ko) * | 2017-05-22 | 2018-11-30 | 현대자동차주식회사 | 음성 인식 장치 및 방법 |
KR20180133078A (ko) * | 2017-06-05 | 2018-12-13 | 현대자동차주식회사 | 음성 인식 처리 장치 및 방법, 그리고 차량 시스템 |
WO2019031870A1 (ko) * | 2017-08-09 | 2019-02-14 | 엘지전자 주식회사 | 블루투스 저전력 에너지 기술을 이용하여 음성 인식 서비스를 호출하기 위한 방법 및 장치 |
KR20190066715A (ko) * | 2017-12-06 | 2019-06-14 | 삼성전자주식회사 | 전자 장치 및 그의 제어 방법 |
KR20200055776A (ko) * | 2017-09-29 | 2020-05-21 | 소노스 인코포레이티드 | 음성 지원을 가지는 미디어 재생 시스템 |
WO2021020624A1 (ko) * | 2019-07-30 | 2021-02-04 | 미디어젠 주식회사 | 음성인식 서비스 선별 조정장치 |
WO2021149878A1 (en) * | 2020-01-23 | 2021-07-29 | Samsung Electronics Co., Ltd. | Electronic device and control method thereof |
US11308958B2 (en) | 2020-02-07 | 2022-04-19 | Sonos, Inc. | Localized wakeword verification |
US11315556B2 (en) | 2019-02-08 | 2022-04-26 | Sonos, Inc. | Devices, systems, and methods for distributed voice processing by transmitting sound data associated with a wake word to an appropriate device for identification |
US11343614B2 (en) | 2018-01-31 | 2022-05-24 | Sonos, Inc. | Device designation of playback and network microphone device arrangements |
US11361756B2 (en) | 2019-06-12 | 2022-06-14 | Sonos, Inc. | Conditional wake word eventing based on environment |
US11405430B2 (en) | 2016-02-22 | 2022-08-02 | Sonos, Inc. | Networked microphone device control |
US11432030B2 (en) | 2018-09-14 | 2022-08-30 | Sonos, Inc. | Networked devices, systems, and methods for associating playback devices based on sound codes |
US11482978B2 (en) | 2018-08-28 | 2022-10-25 | Sonos, Inc. | Audio notifications |
US11482224B2 (en) | 2020-05-20 | 2022-10-25 | Sonos, Inc. | Command keywords with input detection windowing |
US11501773B2 (en) | 2019-06-12 | 2022-11-15 | Sonos, Inc. | Network microphone device with command keyword conditioning |
US11500611B2 (en) | 2017-09-08 | 2022-11-15 | Sonos, Inc. | Dynamic computation of system response volume |
US11514898B2 (en) | 2016-02-22 | 2022-11-29 | Sonos, Inc. | Voice control of a media playback system |
US11531520B2 (en) | 2016-08-05 | 2022-12-20 | Sonos, Inc. | Playback device supporting concurrent voice assistants |
US11540047B2 (en) | 2018-12-20 | 2022-12-27 | Sonos, Inc. | Optimization of network microphone devices using noise classification |
US11538451B2 (en) | 2017-09-28 | 2022-12-27 | Sonos, Inc. | Multi-channel acoustic echo cancellation |
US11538460B2 (en) | 2018-12-13 | 2022-12-27 | Sonos, Inc. | Networked microphone devices, systems, and methods of localized arbitration |
US11545169B2 (en) | 2016-06-09 | 2023-01-03 | Sonos, Inc. | Dynamic player selection for audio signal processing |
US11557294B2 (en) | 2018-12-07 | 2023-01-17 | Sonos, Inc. | Systems and methods of operating media playback systems having multiple voice assistant services |
US11556306B2 (en) | 2016-02-22 | 2023-01-17 | Sonos, Inc. | Voice controlled media playback system |
US11563842B2 (en) | 2018-08-28 | 2023-01-24 | Sonos, Inc. | Do not disturb feature for audio notifications |
US11562740B2 (en) | 2020-01-07 | 2023-01-24 | Sonos, Inc. | Voice verification for media playback |
US11641559B2 (en) | 2016-09-27 | 2023-05-02 | Sonos, Inc. | Audio playback settings for voice interaction |
US11646045B2 (en) | 2017-09-27 | 2023-05-09 | Sonos, Inc. | Robust short-time fourier transform acoustic echo cancellation during audio playback |
US11646023B2 (en) | 2019-02-08 | 2023-05-09 | Sonos, Inc. | Devices, systems, and methods for distributed voice processing |
US11694689B2 (en) | 2020-05-20 | 2023-07-04 | Sonos, Inc. | Input detection windowing |
US11696074B2 (en) | 2018-06-28 | 2023-07-04 | Sonos, Inc. | Systems and methods for associating playback devices with voice assistant services |
US11698771B2 (en) | 2020-08-25 | 2023-07-11 | Sonos, Inc. | Vocal guidance engines for playback devices |
US11710487B2 (en) | 2019-07-31 | 2023-07-25 | Sonos, Inc. | Locally distributed keyword detection |
US11714600B2 (en) | 2019-07-31 | 2023-08-01 | Sonos, Inc. | Noise classification for event detection |
US11727933B2 (en) | 2016-10-19 | 2023-08-15 | Sonos, Inc. | Arbitration-based voice recognition |
US11736860B2 (en) | 2016-02-22 | 2023-08-22 | Sonos, Inc. | Voice control of a media playback system |
US11741948B2 (en) | 2018-11-15 | 2023-08-29 | Sonos Vox France Sas | Dilated convolutions and gating for efficient keyword spotting |
US11769505B2 (en) | 2017-09-28 | 2023-09-26 | Sonos, Inc. | Echo of tone interferance cancellation using two acoustic echo cancellers |
US11790911B2 (en) | 2018-09-28 | 2023-10-17 | Sonos, Inc. | Systems and methods for selective wake word detection using neural network models |
US11790937B2 (en) | 2018-09-21 | 2023-10-17 | Sonos, Inc. | Voice detection optimization using sound metadata |
US11792590B2 (en) | 2018-05-25 | 2023-10-17 | Sonos, Inc. | Determining and adapting to changes in microphone performance of playback devices |
US11798553B2 (en) | 2019-05-03 | 2023-10-24 | Sonos, Inc. | Voice assistant persistence across multiple network microphone devices |
US11797263B2 (en) | 2018-05-10 | 2023-10-24 | Sonos, Inc. | Systems and methods for voice-assisted media content selection |
US11854547B2 (en) | 2019-06-12 | 2023-12-26 | Sonos, Inc. | Network microphone device with command keyword eventing |
US11862161B2 (en) | 2019-10-22 | 2024-01-02 | Sonos, Inc. | VAS toggle based on device orientation |
US11869503B2 (en) | 2019-12-20 | 2024-01-09 | Sonos, Inc. | Offline voice control |
US11899519B2 (en) | 2018-10-23 | 2024-02-13 | Sonos, Inc. | Multiple stage network microphone device with reduced power consumption and processing load |
US11900937B2 (en) | 2017-08-07 | 2024-02-13 | Sonos, Inc. | Wake-word detection suppression |
US11947870B2 (en) | 2016-02-22 | 2024-04-02 | Sonos, Inc. | Audio response playback |
US11979960B2 (en) | 2016-07-15 | 2024-05-07 | Sonos, Inc. | Contextualization of voice inputs |
US11984123B2 (en) | 2020-11-12 | 2024-05-14 | Sonos, Inc. | Network device interaction by range |
US11983463B2 (en) | 2016-02-22 | 2024-05-14 | Sonos, Inc. | Metadata exchange involving a networked playback system and a networked microphone system |
Families Citing this family (81)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
US8977255B2 (en) | 2007-04-03 | 2015-03-10 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
US8676904B2 (en) | 2008-10-02 | 2014-03-18 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
US20120309363A1 (en) | 2011-06-03 | 2012-12-06 | Apple Inc. | Triggering notifications associated with tasks items that represent tasks to perform |
US10417037B2 (en) | 2012-05-15 | 2019-09-17 | Apple Inc. | Systems and methods for integrating third party services with a digital assistant |
KR102112742B1 (ko) | 2013-01-22 | 2020-05-19 | 삼성전자주식회사 | 전자장치 및 그 음성 처리 방법 |
EP3809407A1 (en) | 2013-02-07 | 2021-04-21 | Apple Inc. | Voice trigger for a digital assistant |
US10652394B2 (en) | 2013-03-14 | 2020-05-12 | Apple Inc. | System and method for processing voicemail |
US10748529B1 (en) | 2013-03-15 | 2020-08-18 | Apple Inc. | Voice activated device for use with a voice-based digital assistant |
US10176167B2 (en) | 2013-06-09 | 2019-01-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
US11138971B2 (en) | 2013-12-05 | 2021-10-05 | Lenovo (Singapore) Pte. Ltd. | Using context to interpret natural language speech recognition commands |
US10276154B2 (en) * | 2014-04-23 | 2019-04-30 | Lenovo (Singapore) Pte. Ltd. | Processing natural language user inputs using context data |
US10170123B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Intelligent assistant for home automation |
US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US9966065B2 (en) | 2014-05-30 | 2018-05-08 | Apple Inc. | Multi-command single utterance input method |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
JP6418820B2 (ja) * | 2014-07-07 | 2018-11-07 | キヤノン株式会社 | 情報処理装置、表示制御方法、及びコンピュータプログラム |
US9886953B2 (en) | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
US10200824B2 (en) | 2015-05-27 | 2019-02-05 | Apple Inc. | Systems and methods for proactively identifying and surfacing relevant content on a touch-sensitive device |
US20160378747A1 (en) | 2015-06-29 | 2016-12-29 | Apple Inc. | Virtual assistant for media playback |
US10740384B2 (en) | 2015-09-08 | 2020-08-11 | Apple Inc. | Intelligent automated assistant for media search and playback |
US10331312B2 (en) | 2015-09-08 | 2019-06-25 | Apple Inc. | Intelligent automated assistant in a media environment |
US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
US10671428B2 (en) | 2015-09-08 | 2020-06-02 | Apple Inc. | Distributed personal assistant |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10956666B2 (en) | 2015-11-09 | 2021-03-23 | Apple Inc. | Unconventional virtual assistant interactions |
US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
CN106971735B (zh) * | 2016-01-14 | 2019-12-03 | 芋头科技(杭州)有限公司 | 一种定期更新缓存中训练语句的声纹识别的方法及系统 |
US10586535B2 (en) | 2016-06-10 | 2020-03-10 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
DK201670540A1 (en) | 2016-06-11 | 2018-01-08 | Apple Inc | Application integration with a digital assistant |
DK179415B1 (en) | 2016-06-11 | 2018-06-14 | Apple Inc | Intelligent device arbitration and control |
US10152969B2 (en) | 2016-07-15 | 2018-12-11 | Sonos, Inc. | Voice detection by multiple devices |
US9743204B1 (en) | 2016-09-30 | 2017-08-22 | Sonos, Inc. | Multi-orientation playback device microphones |
CN108573696B (zh) * | 2017-03-10 | 2021-03-30 | 北京搜狗科技发展有限公司 | 一种语音识别方法、装置及设备 |
US11183181B2 (en) | 2017-03-27 | 2021-11-23 | Sonos, Inc. | Systems and methods of multiple voice services |
US10726832B2 (en) | 2017-05-11 | 2020-07-28 | Apple Inc. | Maintaining privacy of personal information |
DK180048B1 (en) | 2017-05-11 | 2020-02-04 | Apple Inc. | MAINTAINING THE DATA PROTECTION OF PERSONAL INFORMATION |
DK179496B1 (en) | 2017-05-12 | 2019-01-15 | Apple Inc. | USER-SPECIFIC Acoustic Models |
DK179745B1 (en) | 2017-05-12 | 2019-05-01 | Apple Inc. | SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT |
DK201770429A1 (en) | 2017-05-12 | 2018-12-14 | Apple Inc. | LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT |
US10303715B2 (en) | 2017-05-16 | 2019-05-28 | Apple Inc. | Intelligent automated assistant for media exploration |
US20180336892A1 (en) | 2017-05-16 | 2018-11-22 | Apple Inc. | Detecting a trigger of a digital assistant |
CN107274902A (zh) * | 2017-08-15 | 2017-10-20 | 深圳诺欧博智能科技有限公司 | 用于家电的语音控制装置和方法 |
CN109509465B (zh) * | 2017-09-15 | 2023-07-25 | 阿里巴巴集团控股有限公司 | 语音信号的处理方法、组件、设备及介质 |
US10051366B1 (en) | 2017-09-28 | 2018-08-14 | Sonos, Inc. | Three-dimensional beam forming with a microphone array |
US10880650B2 (en) | 2017-12-10 | 2020-12-29 | Sonos, Inc. | Network microphone devices with automatic do not disturb actuation capabilities |
US10818290B2 (en) | 2017-12-11 | 2020-10-27 | Sonos, Inc. | Home graph |
JP7062958B2 (ja) * | 2018-01-10 | 2022-05-09 | トヨタ自動車株式会社 | 通信システム、及び通信方法 |
US11676062B2 (en) | 2018-03-06 | 2023-06-13 | Samsung Electronics Co., Ltd. | Dynamically evolving hybrid personalized artificial intelligence system |
US10818288B2 (en) | 2018-03-26 | 2020-10-27 | Apple Inc. | Natural assistant interaction |
DE102018108867A1 (de) * | 2018-04-13 | 2019-10-17 | Dewertokin Gmbh | Steuereinrichtung für einen Möbelantrieb und Verfahren zum Steuern eines Möbelantriebs |
US10928918B2 (en) | 2018-05-07 | 2021-02-23 | Apple Inc. | Raise to speak |
US11145294B2 (en) | 2018-05-07 | 2021-10-12 | Apple Inc. | Intelligent automated assistant for delivering content from user experiences |
US10847178B2 (en) | 2018-05-18 | 2020-11-24 | Sonos, Inc. | Linear filtering for noise-suppressed speech detection |
US10147428B1 (en) * | 2018-05-30 | 2018-12-04 | Green Key Technologies Llc | Computer systems exhibiting improved computer speed and transcription accuracy of automatic speech transcription (AST) based on a multiple speech-to-text engines and methods of use thereof |
DK180639B1 (en) | 2018-06-01 | 2021-11-04 | Apple Inc | DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT |
US10892996B2 (en) | 2018-06-01 | 2021-01-12 | Apple Inc. | Variable latency device coordination |
DK179822B1 (da) | 2018-06-01 | 2019-07-12 | Apple Inc. | Voice interaction at a primary device to access call functionality of a companion device |
US10878811B2 (en) | 2018-09-14 | 2020-12-29 | Sonos, Inc. | Networked devices, systems, and methods for intelligently deactivating wake-word engines |
US10811015B2 (en) | 2018-09-25 | 2020-10-20 | Sonos, Inc. | Voice detection optimization based on selected voice assistant service |
US11462215B2 (en) | 2018-09-28 | 2022-10-04 | Apple Inc. | Multi-modal inputs for voice commands |
US10692518B2 (en) | 2018-09-29 | 2020-06-23 | Sonos, Inc. | Linear filtering for noise-suppressed speech detection via multiple network microphone devices |
CN109572873B (zh) * | 2018-10-15 | 2020-10-02 | 南宁学院 | 一种具有防盗功能的电瓶车声控装置及其使用方法 |
US11348573B2 (en) | 2019-03-18 | 2022-05-31 | Apple Inc. | Multimodality in digital assistant systems |
DK201970509A1 (en) | 2019-05-06 | 2021-01-15 | Apple Inc | Spoken notifications |
US11307752B2 (en) | 2019-05-06 | 2022-04-19 | Apple Inc. | User configurable task triggers |
US11140099B2 (en) | 2019-05-21 | 2021-10-05 | Apple Inc. | Providing message response suggestions |
DK201970511A1 (en) | 2019-05-31 | 2021-02-15 | Apple Inc | Voice identification in digital assistant systems |
DK180129B1 (en) | 2019-05-31 | 2020-06-02 | Apple Inc. | USER ACTIVITY SHORTCUT SUGGESTIONS |
US11468890B2 (en) | 2019-06-01 | 2022-10-11 | Apple Inc. | Methods and user interfaces for voice-based control of electronic devices |
US11138969B2 (en) | 2019-07-31 | 2021-10-05 | Sonos, Inc. | Locally distributed keyword detection |
CN111105793B (zh) * | 2019-12-03 | 2022-09-06 | 杭州蓦然认知科技有限公司 | 一种基于交互引擎簇的语音交互方法及装置 |
US11556307B2 (en) | 2020-01-31 | 2023-01-17 | Sonos, Inc. | Local voice data processing |
US11061543B1 (en) | 2020-05-11 | 2021-07-13 | Apple Inc. | Providing relevant data items based on context |
US11038934B1 (en) | 2020-05-11 | 2021-06-15 | Apple Inc. | Digital assistant hardware abstraction |
US11755276B2 (en) | 2020-05-12 | 2023-09-12 | Apple Inc. | Reducing description length based on confidence |
US11727919B2 (en) | 2020-05-20 | 2023-08-15 | Sonos, Inc. | Memory allocation for keyword spotting engines |
US11490204B2 (en) | 2020-07-20 | 2022-11-01 | Apple Inc. | Multi-device audio adjustment coordination |
US11438683B2 (en) | 2020-07-21 | 2022-09-06 | Apple Inc. | User identification using headphones |
CN112165640B (zh) * | 2020-09-21 | 2023-04-14 | Vidaa美国公司 | 一种显示设备 |
US11551700B2 (en) | 2021-01-25 | 2023-01-10 | Sonos, Inc. | Systems and methods for power-efficient keyword detection |
Family Cites Families (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5774859A (en) * | 1995-01-03 | 1998-06-30 | Scientific-Atlanta, Inc. | Information system having a speech interface |
US7174299B2 (en) * | 1995-08-18 | 2007-02-06 | Canon Kabushiki Kaisha | Speech recognition system, speech recognition apparatus, and speech recognition method |
JP2002116797A (ja) * | 2000-10-11 | 2002-04-19 | Canon Inc | 音声処理装置、音声処理方法及び記憶媒体 |
US6456974B1 (en) * | 1997-01-06 | 2002-09-24 | Texas Instruments Incorporated | System and method for adding speech recognition capabilities to java |
JP2000010590A (ja) * | 1998-06-25 | 2000-01-14 | Oki Electric Ind Co Ltd | 音声認識装置およびその制御方法 |
US6185535B1 (en) * | 1998-10-16 | 2001-02-06 | Telefonaktiebolaget Lm Ericsson (Publ) | Voice control of a user interface to service applications |
US6408272B1 (en) * | 1999-04-12 | 2002-06-18 | General Magic, Inc. | Distributed voice user interface |
US7366673B2 (en) * | 2001-06-15 | 2008-04-29 | International Business Machines Corporation | Selective enablement of speech recognition grammars |
WO2004023455A2 (en) * | 2002-09-06 | 2004-03-18 | Voice Signal Technologies, Inc. | Methods, systems, and programming for performing speech recognition |
JP2003122391A (ja) * | 2001-10-10 | 2003-04-25 | Canon Inc | 音声認識装置およびその制御方法ならびにプログラム |
JP4050574B2 (ja) * | 2001-11-19 | 2008-02-20 | 松下電器産業株式会社 | 遠隔制御対象機器、遠隔制御システム、及び画像処理装置 |
US6834265B2 (en) * | 2002-12-13 | 2004-12-21 | Motorola, Inc. | Method and apparatus for selective speech recognition |
US7076428B2 (en) * | 2002-12-30 | 2006-07-11 | Motorola, Inc. | Method and apparatus for selective distributed speech recognition |
US20050177371A1 (en) * | 2004-02-06 | 2005-08-11 | Sherif Yacoub | Automated speech recognition |
JP2005249829A (ja) * | 2004-03-01 | 2005-09-15 | Advanced Media Inc | 音声認識を行うコンピュータネットワークシステム |
US7340395B2 (en) * | 2004-04-23 | 2008-03-04 | Sap Aktiengesellschaft | Multiple speech recognition engines |
US8589156B2 (en) * | 2004-07-12 | 2013-11-19 | Hewlett-Packard Development Company, L.P. | Allocation of speech recognition tasks and combination of results thereof |
JP2006078791A (ja) * | 2004-09-09 | 2006-03-23 | Denso Corp | 音声認識装置 |
JP2008145693A (ja) * | 2006-12-08 | 2008-06-26 | Canon Inc | 情報処理装置及び情報処理方法 |
JP2008275987A (ja) * | 2007-05-01 | 2008-11-13 | Yamaha Corp | 音声認識装置および会議システム |
US11012732B2 (en) * | 2009-06-25 | 2021-05-18 | DISH Technologies L.L.C. | Voice enabled media presentation systems and methods |
JP5271330B2 (ja) * | 2010-09-29 | 2013-08-21 | 株式会社東芝 | 音声対話システム、方法、及びプログラム |
US10032455B2 (en) * | 2011-01-07 | 2018-07-24 | Nuance Communications, Inc. | Configurable speech recognition system using a pronunciation alignment between multiple recognizers |
CN102522085B (zh) * | 2011-11-28 | 2013-06-12 | 常熟南师大发展研究院有限公司 | 同时具有景点与路口播报功能的智能导游服务系统 |
US8793136B2 (en) * | 2012-02-17 | 2014-07-29 | Lg Electronics Inc. | Method and apparatus for smart voice recognition |
US20130238326A1 (en) * | 2012-03-08 | 2013-09-12 | Lg Electronics Inc. | Apparatus and method for multiple device voice control |
-
2012
- 2012-10-29 KR KR1020120120374A patent/KR20140054643A/ko not_active Application Discontinuation
-
2013
- 2013-08-01 US US13/956,764 patent/US20140122075A1/en not_active Abandoned
- 2013-08-19 EP EP13180833.9A patent/EP2725577A3/en not_active Withdrawn
- 2013-09-10 JP JP2013187036A patent/JP2014089437A/ja active Pending
- 2013-10-02 RU RU2015120296A patent/RU2015120296A/ru not_active Application Discontinuation
- 2013-10-02 WO PCT/KR2013/008831 patent/WO2014069798A1/en active Application Filing
- 2013-10-29 CN CN201310520646.8A patent/CN103794212A/zh active Pending
Cited By (64)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11736860B2 (en) | 2016-02-22 | 2023-08-22 | Sonos, Inc. | Voice control of a media playback system |
US11750969B2 (en) | 2016-02-22 | 2023-09-05 | Sonos, Inc. | Default playback device designation |
US11405430B2 (en) | 2016-02-22 | 2022-08-02 | Sonos, Inc. | Networked microphone device control |
US11514898B2 (en) | 2016-02-22 | 2022-11-29 | Sonos, Inc. | Voice control of a media playback system |
US11832068B2 (en) | 2016-02-22 | 2023-11-28 | Sonos, Inc. | Music service selection |
US11983463B2 (en) | 2016-02-22 | 2024-05-14 | Sonos, Inc. | Metadata exchange involving a networked playback system and a networked microphone system |
US11863593B2 (en) | 2016-02-22 | 2024-01-02 | Sonos, Inc. | Networked microphone device control |
US11947870B2 (en) | 2016-02-22 | 2024-04-02 | Sonos, Inc. | Audio response playback |
US11556306B2 (en) | 2016-02-22 | 2023-01-17 | Sonos, Inc. | Voice controlled media playback system |
US11545169B2 (en) | 2016-06-09 | 2023-01-03 | Sonos, Inc. | Dynamic player selection for audio signal processing |
US11979960B2 (en) | 2016-07-15 | 2024-05-07 | Sonos, Inc. | Contextualization of voice inputs |
US11531520B2 (en) | 2016-08-05 | 2022-12-20 | Sonos, Inc. | Playback device supporting concurrent voice assistants |
US11641559B2 (en) | 2016-09-27 | 2023-05-02 | Sonos, Inc. | Audio playback settings for voice interaction |
US11727933B2 (en) | 2016-10-19 | 2023-08-15 | Sonos, Inc. | Arbitration-based voice recognition |
KR20180127784A (ko) * | 2017-05-22 | 2018-11-30 | 현대자동차주식회사 | 음성 인식 장치 및 방법 |
KR20180133078A (ko) * | 2017-06-05 | 2018-12-13 | 현대자동차주식회사 | 음성 인식 처리 장치 및 방법, 그리고 차량 시스템 |
US11900937B2 (en) | 2017-08-07 | 2024-02-13 | Sonos, Inc. | Wake-word detection suppression |
WO2019031870A1 (ko) * | 2017-08-09 | 2019-02-14 | 엘지전자 주식회사 | 블루투스 저전력 에너지 기술을 이용하여 음성 인식 서비스를 호출하기 위한 방법 및 장치 |
US11367449B2 (en) | 2017-08-09 | 2022-06-21 | Lg Electronics Inc. | Method and apparatus for calling voice recognition service by using Bluetooth low energy technology |
US11500611B2 (en) | 2017-09-08 | 2022-11-15 | Sonos, Inc. | Dynamic computation of system response volume |
US11646045B2 (en) | 2017-09-27 | 2023-05-09 | Sonos, Inc. | Robust short-time fourier transform acoustic echo cancellation during audio playback |
US11769505B2 (en) | 2017-09-28 | 2023-09-26 | Sonos, Inc. | Echo of tone interferance cancellation using two acoustic echo cancellers |
US11538451B2 (en) | 2017-09-28 | 2022-12-27 | Sonos, Inc. | Multi-channel acoustic echo cancellation |
US11893308B2 (en) | 2017-09-29 | 2024-02-06 | Sonos, Inc. | Media playback system with concurrent voice assistance |
KR20200055776A (ko) * | 2017-09-29 | 2020-05-21 | 소노스 인코포레이티드 | 음성 지원을 가지는 미디어 재생 시스템 |
KR20220093280A (ko) * | 2017-09-29 | 2022-07-05 | 소노스 인코포레이티드 | 음성 지원을 가지는 미디어 재생 시스템 |
US11341963B2 (en) | 2017-12-06 | 2022-05-24 | Samsung Electronics Co., Ltd. | Electronic apparatus and method for controlling same |
KR20190066715A (ko) * | 2017-12-06 | 2019-06-14 | 삼성전자주식회사 | 전자 장치 및 그의 제어 방법 |
US11689858B2 (en) | 2018-01-31 | 2023-06-27 | Sonos, Inc. | Device designation of playback and network microphone device arrangements |
US11343614B2 (en) | 2018-01-31 | 2022-05-24 | Sonos, Inc. | Device designation of playback and network microphone device arrangements |
US11797263B2 (en) | 2018-05-10 | 2023-10-24 | Sonos, Inc. | Systems and methods for voice-assisted media content selection |
US11792590B2 (en) | 2018-05-25 | 2023-10-17 | Sonos, Inc. | Determining and adapting to changes in microphone performance of playback devices |
US11696074B2 (en) | 2018-06-28 | 2023-07-04 | Sonos, Inc. | Systems and methods for associating playback devices with voice assistant services |
US11482978B2 (en) | 2018-08-28 | 2022-10-25 | Sonos, Inc. | Audio notifications |
US11563842B2 (en) | 2018-08-28 | 2023-01-24 | Sonos, Inc. | Do not disturb feature for audio notifications |
US11432030B2 (en) | 2018-09-14 | 2022-08-30 | Sonos, Inc. | Networked devices, systems, and methods for associating playback devices based on sound codes |
US11778259B2 (en) | 2018-09-14 | 2023-10-03 | Sonos, Inc. | Networked devices, systems and methods for associating playback devices based on sound codes |
US11790937B2 (en) | 2018-09-21 | 2023-10-17 | Sonos, Inc. | Voice detection optimization using sound metadata |
US11790911B2 (en) | 2018-09-28 | 2023-10-17 | Sonos, Inc. | Systems and methods for selective wake word detection using neural network models |
US11899519B2 (en) | 2018-10-23 | 2024-02-13 | Sonos, Inc. | Multiple stage network microphone device with reduced power consumption and processing load |
US11741948B2 (en) | 2018-11-15 | 2023-08-29 | Sonos Vox France Sas | Dilated convolutions and gating for efficient keyword spotting |
US11557294B2 (en) | 2018-12-07 | 2023-01-17 | Sonos, Inc. | Systems and methods of operating media playback systems having multiple voice assistant services |
US11538460B2 (en) | 2018-12-13 | 2022-12-27 | Sonos, Inc. | Networked microphone devices, systems, and methods of localized arbitration |
US11540047B2 (en) | 2018-12-20 | 2022-12-27 | Sonos, Inc. | Optimization of network microphone devices using noise classification |
US11315556B2 (en) | 2019-02-08 | 2022-04-26 | Sonos, Inc. | Devices, systems, and methods for distributed voice processing by transmitting sound data associated with a wake word to an appropriate device for identification |
US11646023B2 (en) | 2019-02-08 | 2023-05-09 | Sonos, Inc. | Devices, systems, and methods for distributed voice processing |
US11798553B2 (en) | 2019-05-03 | 2023-10-24 | Sonos, Inc. | Voice assistant persistence across multiple network microphone devices |
US11501773B2 (en) | 2019-06-12 | 2022-11-15 | Sonos, Inc. | Network microphone device with command keyword conditioning |
US11854547B2 (en) | 2019-06-12 | 2023-12-26 | Sonos, Inc. | Network microphone device with command keyword eventing |
US11361756B2 (en) | 2019-06-12 | 2022-06-14 | Sonos, Inc. | Conditional wake word eventing based on environment |
WO2021020624A1 (ko) * | 2019-07-30 | 2021-02-04 | 미디어젠 주식회사 | 음성인식 서비스 선별 조정장치 |
US11710487B2 (en) | 2019-07-31 | 2023-07-25 | Sonos, Inc. | Locally distributed keyword detection |
US11714600B2 (en) | 2019-07-31 | 2023-08-01 | Sonos, Inc. | Noise classification for event detection |
US11862161B2 (en) | 2019-10-22 | 2024-01-02 | Sonos, Inc. | VAS toggle based on device orientation |
US11869503B2 (en) | 2019-12-20 | 2024-01-09 | Sonos, Inc. | Offline voice control |
US11562740B2 (en) | 2020-01-07 | 2023-01-24 | Sonos, Inc. | Voice verification for media playback |
US11227608B2 (en) | 2020-01-23 | 2022-01-18 | Samsung Electronics Co., Ltd. | Electronic device and control method thereof |
WO2021149878A1 (en) * | 2020-01-23 | 2021-07-29 | Samsung Electronics Co., Ltd. | Electronic device and control method thereof |
US11308958B2 (en) | 2020-02-07 | 2022-04-19 | Sonos, Inc. | Localized wakeword verification |
US11961519B2 (en) | 2020-02-07 | 2024-04-16 | Sonos, Inc. | Localized wakeword verification |
US11694689B2 (en) | 2020-05-20 | 2023-07-04 | Sonos, Inc. | Input detection windowing |
US11482224B2 (en) | 2020-05-20 | 2022-10-25 | Sonos, Inc. | Command keywords with input detection windowing |
US11698771B2 (en) | 2020-08-25 | 2023-07-11 | Sonos, Inc. | Vocal guidance engines for playback devices |
US11984123B2 (en) | 2020-11-12 | 2024-05-14 | Sonos, Inc. | Network device interaction by range |
Also Published As
Publication number | Publication date |
---|---|
WO2014069798A1 (en) | 2014-05-08 |
US20140122075A1 (en) | 2014-05-01 |
EP2725577A2 (en) | 2014-04-30 |
EP2725577A3 (en) | 2014-05-07 |
JP2014089437A (ja) | 2014-05-15 |
RU2015120296A (ru) | 2016-12-20 |
CN103794212A (zh) | 2014-05-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR20140054643A (ko) | 음성인식장치 및 음성인식방법 | |
KR20140058127A (ko) | 음성인식장치 및 음성인식방법 | |
US11854570B2 (en) | Electronic device providing response to voice input, and method and computer readable medium thereof | |
CN107454508B (zh) | 麦克风阵列的电视机及电视系统 | |
US9767795B2 (en) | Speech recognition processing device, speech recognition processing method and display device | |
EP2613313B1 (en) | Image display apparatus and method of controlling the same | |
US20170289582A1 (en) | Device control method and electric device | |
CN109343819B (zh) | 在语音识别系统中控制显示装置的显示装置和方法 | |
US20130041666A1 (en) | Voice recognition apparatus, voice recognition server, voice recognition system and voice recognition method | |
WO2011148594A1 (ja) | 音声認識システム、音声取得端末、音声認識分担方法および音声認識プログラム | |
KR20160025301A (ko) | 음성 인식이 가능한 디스플레이 장치 및 방법 | |
JP2014132342A (ja) | 対話型サーバ、ディスプレイ装置及びその制御方法 | |
KR20150054490A (ko) | 음성인식 시스템, 음성인식 서버 및 디스플레이 장치의 제어방법 | |
CN109302528B (zh) | 一种拍照方法、移动终端及计算机可读存储介质 | |
JP2016014967A (ja) | 情報管理方法 | |
KR102576388B1 (ko) | 디스플레이 장치 및 그의 동작 방법 | |
CN108322770B (zh) | 视频节目识别方法、相关装置、设备和系统 | |
CN111161731A (zh) | 智能家电离线语音控制装置 | |
CN104484151A (zh) | 声控系统、设备及方法 | |
US20060129408A1 (en) | A remote control device and method with speech control | |
CN110839169B (zh) | 一种智能设备遥控装置及基于其的控制方法 | |
KR101660269B1 (ko) | 대화형 서버, 그 제어 방법 및 대화형 시스템 | |
KR20220033325A (ko) | 음성 인식을 위한 전자장치 및 그 제어방법 | |
KR20210130494A (ko) | 다중 디바이스의 음성인식 제어를 위한 다채널 보이스 트리거 시스템 및 그 제어 방법 | |
KR102049833B1 (ko) | 대화형 서버, 디스플레이 장치 및 그 제어 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E601 | Decision to refuse application |