KR101970731B1 - 인공지능 스피커 및 이의 제어 방법 - Google Patents
인공지능 스피커 및 이의 제어 방법 Download PDFInfo
- Publication number
- KR101970731B1 KR101970731B1 KR1020170166649A KR20170166649A KR101970731B1 KR 101970731 B1 KR101970731 B1 KR 101970731B1 KR 1020170166649 A KR1020170166649 A KR 1020170166649A KR 20170166649 A KR20170166649 A KR 20170166649A KR 101970731 B1 KR101970731 B1 KR 101970731B1
- Authority
- KR
- South Korea
- Prior art keywords
- signal
- reference signal
- artificial intelligent
- echo reference
- top box
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 24
- 230000005236 sound signal Effects 0.000 claims description 35
- 238000004891 communication Methods 0.000 claims description 30
- 238000007781 pre-processing Methods 0.000 claims description 22
- 230000008054 signal transmission Effects 0.000 claims description 11
- 238000010586 diagram Methods 0.000 description 12
- 238000005516 engineering process Methods 0.000 description 6
- 238000012545 processing Methods 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 230000007723 transport mechanism Effects 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/02—Circuits for transducers, loudspeakers or microphones for preventing acoustic reaction, i.e. acoustic oscillatory feedback
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2420/00—Details of connection covered by H04R, not provided for in its groups
- H04R2420/07—Applications of wireless loudspeakers or wireless microphones
Landscapes
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Quality & Reliability (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- Otolaryngology (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
일 실시 예에 따른 인공지능 스피커는 마이크로 입력되는 소리 중, 발화자(User Voice)의 음성만 남기고 나머지 노이즈를 제거 또는 필터링하기 위해 AEC(Acoustic Echo Cancellation)를 사용함에 있어, 에코 기준 신호(Echo Reference)를 전송함으로써, TV 노이즈를 보다 효과적으로 제거하여, 인공지능 스피커의 음성인식 성공률을 높일 수 있다.
Description
실시 예들은 인공지능 스피커 및 이의 제어 방법에 관한 것이다.
최근, 음악 감상이나 라디오 청취에 활용되던 스피커가 음성인식 기술과 만나 진화하고 있다. 스마트폰에서 쉽게 만나볼 수 있는 음성인식 기술과 클라우드, 인공지능(AI) 기술을 활용해 단순하게 소리를 전달하는 도구에서 생각하고 관리하는 AI 스피커로 변신중이다. 이미 아마존, 구글, 애플 등 글로벌 IT 기업이 AI 스피커 제품을 출시하였으며, 국내에서도 SK텔레콤, KT, 네이버, 삼성전자 등도 이 시장에 관심을 보이고 있다.
기업들은 음성 기반 플랫폼이 만들어지면 스마트 홈으로 가는 사물인터넷(IoT)시장을 손쉽게 선점할 수 있다. 스마트 홈은 집 안 각종 가전제품, 수도, 전기사용량 등을 통신에 연결해 모니터링하고 제어할 수 있는 집을 말한다. 이 핵심엔 현재 AI 스피커가 자리 잡았다. 음성 기반 플랫폼을 이용하면 손을 이용하지 않고도 편리하게 기기를 관리하거나 제어할 수 있다. AI 스피커가 등장하는 이유다.
AI 스피커는 인공지능 알고리즘을 이용해 사용자와 음성으로 의사소통을 한다. AI 스피커를 이용하면 음성인식을 통해 집안의 기기를 목소리만으로 간편하게 제어하는 식으로 손쉽게 스마트 홈 환경을 구축할 수 있다. 또한, 터치 기반과 달리 음성 기반 조작은 쉽게 배우고 사용할 수 있다.
한편, AI 스피커는 가정용 기기, 예를 들면 텔레비전과 인접하여 배치되는 경우가 많고, 이 경우, 텔레비전의 소리가 AI 스피커로 입력되는 음성에 잡음으로 작용하여 인식률이 크게 떨어지는 문제점이 있다.
실시 예들은 AI 스피커의 마이크로 입력되는 소리 중, 발화자(User Voice)의 음성만 남기고 나머지 노이즈를 제거 또는 필터링하기 위해 AEC(Acoustic Echo Cancellation)를 사용함에 있어, 에코 기준 신호(Echo Reference)를 전송함으로써, TV 노이즈를 보다 효과적으로 제거하여, AI 스피커의 음성인식 성공률을 높일 수 있는 인공지능 스피커 및 이의 제어 방법을 제공하는 것이다.
일 실시 예에 따른 인공지능 스피커의 제어 방법에 있어서, 마이크로부터 입력된, 사용자 음성 신호 및 상기 인공지능 스피커의 주위의 가전기기로부터 출력된 오디오 신호를 포함하는 입력 신호를 입력받는 단계; 외부 장치로부터 상기 가전기기의 오디오 신호에 상응하는 에코 기준 신호를 수신하는 단계; 상기 수신된 에코 기준 신호를 기초로 상기 입력 신호로부터 상기 오디오 신호를 제거한 전처리 신호를 출력하는 단계; 및 상기 출력된 전처리 신호를 인식하여 음성인식 제어신호를 출력하는 단계를 포함한다.
상기 가전기기는 텔레비전이고, 상기 외부장치는 셋톱박스일 수 있다.
상기 인공지능 스피커는 상기 셋톱박스와 USB 케이블을 통해 접속되어, 상기 에코 기준 신호를 수신할 수 있다.
상기 인공지능 스피커는 상기 셋톱박스와 블루투스 및 WIFI를 포함하는 무선통신 인터페이스를 통해 접속되어, 상기 에코 기준 신호를 수신할 수 있다.
상기 외부장치는, 상기 가전기기와 유무선 통신인터페이스를 통해 접속되어, 상기 가전기기로부터 상기 에코 기준신호를 수신하는 에코 기준신호 전송장치이고,
상기 인공지능 스피커는 상기 에코 기준신호 전송장치와 유무선 통신인터페이스를 통해 접속되어, 상기 에코 기준신호 전송장치로부터 상기 에코 기준 신호를 수신할 수 있다.
다른 실시 예에 따른 인공지능 스피커의 제어 방법에 있어서, 마이크로부터 입력된, 사용자 음성 신호 및 상기 인공지능 스피커의 주위의 가전기기로부터 출력된 오디오 신호를 포함하는 입력 신호를 입력받는 단계; 상기 가전기기와 유무선 통신 인터페이스를 통해 접속되어, 상기 가전기기로부터 상기 오디오 신호에 상응하는 에코 기준 신호를 수신하는 단계; 상기 수신된 에코 기준 신호를 기초로 상기 입력 신호로부터 상기 오디오 신호를 제거한 전처리 신호를 출력하는 단계; 및 상기 출력된 전처리 신호를 인식하여 음성인식 제어신호를 출력하는 단계를 포함한다.
또 다른 실시 예에 따른 사용자 음성 신호 및 상기 인공지능 스피커의 주위의 가전기기로부터 출력된 오디오 신호를 포함하는 입력 신호를 입력받는 마이크; 외부 장치로부터 상기 가전기기의 오디오 신호에 상응하는 에코 기준 신호를 수신하는 에코신호 수신부; 상기 수신된 에코 기준 신호를 기초로 상기 입력 신호로부터 상기 오디오 신호를 제거한 전처리 신호를 출력하는 오디오 전처리부; 및 상기 오디오 전처리부로부터 출력된 전처리 신호를 인식하여 음성인식 제어신호를 출력하는 프로세서를 포함한다.
상기 가전기기는 텔레비전이고, 상기 외부장치는 셋톱박스일 수 있고,
상기 인공지능 스피커는, 상기 셋톱박스와 USB 케이블을 통해 접속 가능한 USB 인터페이스를 포함하고, 상기 셋톱박스로부터 상기 USB인터페이스를 통해 상기 에코 기준 신호를 수신할 수 있다.
상기 가전기기는 텔레비전이고, 상기 외부장치는 셋톱박스일 수 있고, 상기 인공지능 스피커는, 상기 셋톱박스와 블루투스 또는 WIFI를 포함하는 무선통신이 가능한 무선통신 인터페이스를 포함하고, 상기 셋톱박스로부터 상기 무선통신 인터페이스를 통해 상기 에코 기준 신호를 수신할 수 있다.
또 다른 실시 예에 따른 상기 제어 방법을 컴퓨터에서 실행시키기 위한 방법을 기록한 기록매체를 포함한다.
실시 예에 따른 인공지능 스피커는 마이크로 입력되는 소리 중, 발화자의 음성만 남기고 나머지 노이즈를 제거 또는 필터링하기 위해 AEC(Acoustic Echo Cancellation)를 사용함에 있어, 에코 기준 신호(Echo Reference)를 전송함으로써, TV 노이즈를 보다 효과적으로 제거하여, 인공지능 스피커의 음성인식 성공률을 높일 수 있다.
도 1은 일 실시 예에 따른 인공지능 스피커의 노이즈 제거를 설명하기 위한 개념 도이다.
도 2는 일 실시 예에 따른 인공지능 스피커의 개략도이다.
도 3은 도 2에 도시된 인공지능 스피커의 노이즈 제거를 설명하기 위한 예시 도이다.
도 4는 다른 실시 예에 따른 인공지능 스피커의 개략도이다.
도 5는 또 다른 실시 예에 따른 인공지능 스피커의 개략도이다.
도 6은 또 다른 실시 예에 따른 인공지능 스피커의 개략도이다.
도 7은 또 다른 실시 예에 따른 인공지능 스피커의 제어 방법을 설명하기 위한 흐름 도이다.
도 8은 또 다른 실시 예에 따른 인공지능 스피커의 제어 방법을 설명하기 위한 흐름 도이다.
도 2는 일 실시 예에 따른 인공지능 스피커의 개략도이다.
도 3은 도 2에 도시된 인공지능 스피커의 노이즈 제거를 설명하기 위한 예시 도이다.
도 4는 다른 실시 예에 따른 인공지능 스피커의 개략도이다.
도 5는 또 다른 실시 예에 따른 인공지능 스피커의 개략도이다.
도 6은 또 다른 실시 예에 따른 인공지능 스피커의 개략도이다.
도 7은 또 다른 실시 예에 따른 인공지능 스피커의 제어 방법을 설명하기 위한 흐름 도이다.
도 8은 또 다른 실시 예에 따른 인공지능 스피커의 제어 방법을 설명하기 위한 흐름 도이다.
본 실시 예들에서 사용되는 용어는 본 실시 예들에서의 기능을 고려하면서 가능한 현재 널리 사용되는 일반적인 용어들을 선택하였으나, 이는 당 기술분야에 종사하는 기술자의 의도 또는 판례, 새로운 기술의 출현 등에 따라 달라질 수 있다. 또한, 특정한 경우는 임의로 선정된 용어도 있으며, 이 경우 해당 실시 예의 설명 부분에서 상세히 그 의미를 기재할 것이다. 따라서, 본 실시 예들에서 사용되는 용어는 단순한 용어의 명칭이 아닌, 그 용어가 가지는 의미와 본 실시 예들의 전반에 걸친 내용을 토대로 정의되어야 한다.
실시 예들에 대한 설명에서, 어떤 부분이 다른 부분과 연결되어 있다고 할 때, 이는 직접적으로 연결되어 있는 경우뿐 아니라, 그 중간에 다른 구성요소를 사이에 두고 전기적으로 연결되어 있는 경우도 포함한다. 또한, 어떤 부분이 어떤 구성요소를 포함한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미한다. 또한, 실시 예들에 기재된 “...부”의 용어는 적어도 하나의 기능이나 동작을 처리하는 단위를 의미하며, 이는 하드웨어 또는 소프트웨어로 구현되거나 하드웨어와 소프트웨어의 결합으로 구현될 수 있다.
본 실시 예들에서 사용되는 “구성된다”또는“포함한다" 등의 용어는 명세서상에 기재된 여러 구성 요소들, 또는 여러 단계들을 반드시 모두 포함하는 것으로 해석되지 않아야 하며, 그 중 일부 구성 요소들 또는 일부 단계들은 포함되지 않을 수도 있고, 또는 추가적인 구성 요소 또는 단계들을 더 포함할 수 있는 것으로 해석되어야 한다.
하기 실시 예들에 대한 설명은 권리범위를 제한하는 것으로 해석되지 말아야 하며, 해당 기술분야의 당업자가 용이하게 유추할 수 있는 것은 실시 예들의 권리범위에 속하는 것으로 해석되어야 할 것이다. 이하 첨부된 도면들을 참조하면서 오로지 예시를 위한 실시 예들을 상세히 설명하기로 한다.
도 1은 일 실시 예에 따른 인공지능 스피커의 노이즈 제거를 설명하기 위한 개념 도이다.
도 1을 참조하면, 인공지능 스피커(110)와 텔레비전(120)이 도시되어 있다. 일 실시 예에서, 인공지능 스피커(110)는 텔레비전(120)의 주위에 배치된 것으로 설명하지만, 이에 한정되지 않고, 다른 가전기기들의 주위에 배치되어, 인공지능 스피커(110)에 발화자의 음성과 함께 입력되는 잡음을 효과적으로 제거할 수 있음은 물론이다.
인공지능 스피커(110)는 음성인식, AI 기술을 이용해 사용자와 의사소통이 가능하다. 음성 명령으로 예를 들면, 음악재생, 날씨, 뉴스, 검색 번역 등 다양한 서비스를 이용할 수 있다. 실시 예에 따른 인공지능 스피커(110)는 음성 입력을 통해 텔레비전(120)을 제어할 수도 있으며, 홈 네트워크를 통해 접속되어 있는 다양한 가전기기들도 제어할 수 있다.
실시 예에 따른 인공지능 스피커(110)는 마이크로 입력되는 소리 중 발화자의 음성만 남기고 나머지 노이즈를 제거하기 위해 AEC(Acoustic Echo Cancellation)를 사용할 수 있다. 인공지능 스피커(110)는 AEC에 사용되는 에코 기준 신호(Echo Reference)를 이용할 수 있다.
도 2는 일 실시 예에 따른 인공지능 스피커(200)의 개략도이고, 도 3은 도 2에 도시된 인공지능 스피커의 노이즈 제거를 설명하기 위 한 예시 도이다.
도 2 및 3을 함께 참조하면, 인공지능 스피커(200)는 마이크(210)로 다양한 신호를 입력받는다. 도 2에 도시된 것처럼 발화자의 음성 신호(A), 기타 주변 잡음 신호(B), TV(290)로부터 입력되는 TV 오디오 신호(C), 인공지능 스피커(200)의 자체 스피커(250)로부터 출력된 오디오 신호(D)를 입력받는다.
도 3에 도시된 것처럼, 오디오 전처리 장치(220)에서, 음성 신호(A)만을 남기고, 나머지 신호들을 제거 또는 필터링한다. 이때 프로세서(230)는 오디오 전처리 장치(220)에 에코 기준 신호를 전송함으로써, 오디오 전처리 장치(220)가 수신된 에코 기준 신호를 이용하여 TV 신호(C)를 제거한다.
오디오 전처리 장치(220)는 다음과 같은 3가지 방식을 이용하여 노이즈를 제거할 수 있다. 노이즈 제거(Noise Reduction, 이하 NR이라 한다), 빔포밍(Beamforming, 이하 BF라 한다), AEC(Acoustic Echo Cancellation, 이하 AEC라 한다)를 이용할 수 있다.
NR은 다수의 마이크를 사용하여 배경 잡음을 감소시키는 것으로, 화자방향 이외의 마이크를 통해 주위 환경 잡음을 감지하고, 감지된 잡음을 실제 화자쪽 마이크의 출력에서 빼내 음성의 명료도를 높이는 것이다.
BF는 마이크 어레이의 출력을 처리해, 특정 방향의 감도를 높이면서 동시에 다른 방향의 사운드를 거부하는 것으로, 빔포밍은 다양한 방향에서 들어오는 사운드의 위상 차이를 이용하여 마이크 감도를 특정한 방향으로 집중시킬 수 있다. 빔포밍은 사운드가 들어오는 방향을 찾아 내는 데 사용될 수 있다,
AEC는 음향 반향 제거방식으로, 특정 노이즈, 예를 들면 TV Audio Sound의 원음을 에코 기준 신호로 입력받아 이를 제거하는 것이다.
NR, BF 처리에 의해 기타 잡음(B) 및 TV Audio Sound(C)를 필터링하는 것이 가능하고, 에코기준신호를 받아 AEC 처리하여 스피커 출력 신호(D)를 작게 필터링 할 수 있다.
하지만, TV가 있는 거실 환경에서는 TV Audio Sound(C) 음량이 크면, 충분히 작게 제거되지 못하게 되고, 그 결과로 인공지능 스피커의 음성인식 성공률이 낮아지는 문제점이 존재한다.
실시 예에 따른 인공지능 스피커(200)는 스피커 자체의 음성 출력 신호에 대한 에코 기준 신호뿐만 아니라, 주위에 배치된 TV(290)의 오디오 출력 신호에 대한 에코 기준신호를 텔레비전(120)을 통해 수신하거나, 텔레비전(120)에 접속되어 있는 셋톱박스(미도시)로부터 수신하거나, 별도의 에코 기준 신호 전송장치(미도시)로부터 수신할 수 있다. 인공지능 스피커(110)는 텔레비전(120)의 주위에 배치되는 텔레비전(120)으로부터 에코 기준 신호를 수신함으로써 텔레비전(120)에서 발생된 소리를 효과적으로 제거할 수 있다.
도 4는 다른 실시 예에 따른 인공지능 스피커의 개략도이다. 도 2와 동일한 부분에 대한 설명은 생략하고, 차이점이 있는 부분에 대해 상세히 설명한다.
도 4를 참조하면, 인공지능 스피커(400)는 TV(490)에 오디오 및 비디오 신호를 제공하는 셋톱박스(480)로부터 TV(490)에서 출력된 TV 오디오 신호에 대응하는 에코 기준 신호를 수신한다. 도 4에 도시된 것처럼, 셋톱박스(480)는 오디오 소스를 HDMI 오디오 단자를 통해 TV(490)로 출력한다. 동시에, 셋톱박스(480)는 출력된 TV 오디오 신호를 추출하여, 인공지능 스피커(400)에 전송한다. 인공지능 스피커(400)의 프로세서(430)는 셋톱박스(480)로부터 에코 기준 신호를 수신하기 위한 에코 기준 신호 수신부(431)를 더 포함할 수 있다. 여기서, 인공지능 스피커(400)와 셋톱박스(480)는 유무선 통신 인터페이스를 통해 에코 기준 신호를 송수신할 수 있다. 예를 들면 USB 또는 Analog Audio cable 또는 S/PDIF 케이블로 통신할 수 있으며, BT(Bluetooth) 또는 WiFi로 통신할 수도 있다.
실시 예에 따른 인공지능 스피커(400)는 TV(490)와 접속된 셋톱박스(480)로부터 TV에서 출력된 TV 오디오 신호에 대응하는 에코 기준 신호를 유무선 통신 인터페이스를 통해 수신함으로서, 효과적으로 TV 오디오 신호(C)를 제거함으로써 인공지능 스피커(400)의 음성인식 성공률을 극대화시킬 수 있다.
도 5는 또 다른 실시 예에 따른 인공지능 스피커의 개략도이다. 도 4와 동일한 부분에 대한 설명은 생략하고, 차이점이 있는 부분에 대해 상세히 설명한다.
도 5를 참조하면, 셋톱박스가 아닌 별도의 에코 신호 전송장치(570)를 통해 TV(590)로부터 TV 오디오 신호에 대응하는 에코 기준 신호를 인공지능 스피커(500)에 전송한다. 에코 신호 전송 장치(570)는 음성 인식 스피커(500)와 유무선통신 인터페이스(571)를 통해 연결 가능하고, TV(590)와도 유무선 통신인터페이스(572)를 통해 연결 가능하다. 여기서, 유수선 통신 인터페이스(571 및 572)는 USB 또는 Analog Audio cable 또는 S/PDIF 케이블일 수 있으며, BT(Bluetooth) 또는 WiFi일 수도 있으나, 이에 한정되는 것은 아니다.
도 6은 또 다른 실시 예에 따른 인공지능 스피커의 개략도이다. 도 4 및 5와 동일한 부분에 대한 설명은 생략하고, 차이점이 있는 부분에 대해 상세히 설명한다.
도 6을 참조하면, 인공지능 스피커(600)와 TV(690)를 직접 연결하는 방식으로, 인공지능 스피커(600)는 유무선 통신 인터페이스(670)를 통해 TV 오디오 신호에 대응하는 에코 기준 신호를 수신할 수 있다. 유무선 통신 인터페이스(670)는 예를 들면 USB 또는 Analog Audio cable 또는 S/PDIF 케이블이거나, BT(Bluetooth) 또는 WiFi일 수 있으나, 이에 한정되지 않는다.
도 7은 또 다른 실시 예에 따른 인공지능 스피커의 제어 방법을 설명하기 위한 흐름 도이다.
단계 700에서, 마이크로부터 입력된, 사용자 음성 신호 및 인공지능 스피커의 주위의 가전기기로부터 출력된 오디오 신호를 포함하는 입력 신호를 입력받는다.
단계 702에서, 외부 장치로부터 가전기기의 오디오 신호에 상응하는 에코 기준 신호를 수신한다. 여기서, 가전기기는 TV이고, 외부 장치는 셋톱박스이거나, TV, 또는 별도의 에코 기준 신호 전송장치일 수 있다.
단계 704에서, 수신된 에코 기준 신호를 기초로 입력 신호로부터 오디오 신호를 제거한 전처리 신호를 출력한다. 인공지능 스피커는 단계 704에서 수신된 에코 기준 신호를 이용하여 AEC를 통해 가전기기의 오디오 신호를 제거할 수 있다.
단계 706에서, 출력된 전처리 신호를 인식하여 음성인식 제어신호를 출력한다.
도 8은 또 다른 실시 예에 따른 인공지능 스피커의 제어 방법을 설명하기 위한 흐름 도이다.
도 8을 참조하면, 단계 800에서, 마이크로부터 입력된, 사용자 음성 신호 및 인공지능 스피커의 주위의 가전기기로부터 출력된 오디오 신호를 포함하는 입력 신호를 입력받는다.
단계 802에서, 가전기기와 유무선 통신 인터페이스를 통해 접속되어, 가전기기로부터 오디오 신호에 상응하는 에코 기준 신호를 수신한다. 여기서, 가전기기는 TV일 수 있다. 유무선 통신 인터페이스는 예를 들면 USB 또는 Analog Audio cable 또는 S/PDIF 케이블이거나, BT(Bluetooth) 또는 WiFi일 수 있으나, 이에 한정되지 않는다.
단계 804에서, 수신된 에코 기준 신호를 기초로 입력 신호로부터 오디오 신호를 제거한 전처리 신호를 출력한다.
단계 806에서, 출력된 전처리 신호를 인식하여 음성인식 제어신호를 출력한다.
실시 예에 따른 인공지능 스피커 및 이의 제어 방법은 마이크로 입력되는 소리 중 발화자의 음성만 남기고 나머지 노이즈를 제거하기 위해 AEC를 사용하고, 이를 위한 에코 기준 신호(Echo Reference)를 TV에 오디오 신호를 제공하는 셋톱박스로부터 유무선 통신 인터페이스를 통해 수신하거나, 별도의 에코 기준 신호 전송장치로부터 유무선 통신 인터페이스를 통해 수신하거나, TV로부터 직접 유무선 통신 인터페이스를 통해 수신함으로써, TV 오디오 신호 또는 노이즈를 보다 효과적으로 제거하여, 인공지능 스피커의 음성인식 성공률을 높일 수 있다.
일 실시 예는 컴퓨터에 의해 실행되는 프로그램 모듈과 같은 컴퓨터에 의해 실행가능한 명령어를 포함하는 기록 매체의 형태로도 구현될 수 있다. 컴퓨터 판독 가능 매체는 컴퓨터에 의해 액세스될 수 있는 임의의 가용 매체일 수 있고, 휘발성 및 비휘발성 매체, 분리형 및 비분리형 매체를 모두 포함한다. 또한, 컴퓨터 판독가능 매체는 컴퓨터 저장 매체 및 통신 매체를 모두 포함할 수 있다. 컴퓨터 저장 매체는 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈 또는 기타 데이터와 같은 정보의 저장을 위한 임의의 방법 또는 기술로 구현된 휘발성 및 비휘발성, 분리형 및 비분리형 매체를 모두 포함한다. 통신 매체는 전형적으로 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈, 또는 반송파와 같은 변조된 데이터 신호의 기타 데이터, 또는 기타 전송 메커니즘을 포함하며, 임의의 정보 전달 매체를 포함한다.
전술한 설명은 예시를 위한 것이며, 본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시 예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 예를 들어, 단일형으로 설명되어 있는 각 구성 요소는 분산되어 실시될 수도 있으며, 마찬가지로 분산된 것으로 설명되어 있는 구성 요소들도 결합된 형태로 실시될 수 있다.
본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.
Claims (10)
- 인공지능 스피커의 제어 방법에 있어서,
마이크로부터 입력된, 사용자 음성 신호 및 상기 인공지능 스피커의 주위의 가전기기로부터 출력된 오디오 신호를 포함하는 입력 신호를 입력받는 단계;
외부 장치로부터 상기 가전기기의 오디오 신호에 상응하는 에코 기준 신호를 수신하는 단계;
상기 수신된 에코 기준 신호를 기초로 상기 입력 신호로부터 상기 오디오 신호를 제거한 전처리 신호를 출력하는 단계; 및
상기 출력된 전처리 신호를 인식하여 음성인식 제어신호를 출력하는 단계를 포함하고,
상기 가전기기는 텔레비전이고, 상기 외부장치는 상기 텔레비전과 HDMI를 통해 접속된 셋톱박스이고,
상기 인공지능 스피커는,
상기 셋톱박스와 유선 또는 무선 통신 인터페이스를 통해 접속되어 상기 셋톱박스로부터 상기 에코기준신호를 수신하는 것을 특징으로 하는 인공지능 스피커의 제어 방법. - 삭제
- 제 1 항에 있어서,
상기 인공지능 스피커는 상기 셋톱박스와 USB 케이블을 통해 접속되어, 상기 에코 기준 신호를 수신하는 것을 특징으로 하는 인공지능 스피커의 제어 방법. - 제 1 항에 있어서,
상기 인공지능 스피커는 상기 셋톱박스와 블루투스 및 WIFI를 포함하는 무선통신 인터페이스를 통해 접속되어, 상기 에코 기준 신호를 수신하는 것을 특징으로 하는 인공지능 스피커의 제어 방법. - 제 1 항에 있어서,
상기 외부장치는,
상기 가전기기와 유무선 통신인터페이스를 통해 접속되어, 상기 가전기기로부터 상기 에코 기준신호를 수신하는 에코 기준신호 전송장치이고,
상기 인공지능 스피커는 상기 에코 기준신호 전송장치와 유무선 통신인터페이스를 통해 접속되어, 상기 에코 기준신호 전송장치로부터 상기 에코 기준 신호를 수신하는 것을 특징으로 하는 인공지능 스피커의 제어 방법. - 삭제
- 제 1 항, 제 3 항 내지 제 5 항 중 어느 한 항에 따른 제어 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 기록매체.
- 사용자 음성 신호 및 인공지능 스피커의 주위의 가전기기로부터 출력된 오디오 신호를 포함하는 입력 신호를 입력받는 마이크;
외부 장치로부터 상기 가전기기의 오디오 신호에 상응하는 에코 기준 신호를 수신하는 에코신호 수신부;
상기 수신된 에코 기준 신호를 기초로 상기 입력 신호로부터 상기 오디오 신호를 제거한 전처리 신호를 출력하는 오디오 전처리부; 및
상기 오디오 전처리부로부터 출력된 전처리 신호를 인식하여 음성인식 제어신호를 출력하는 프로세서를 포함하고,
상기 가전기기는 텔레비전이고, 상기 외부장치는 상기 텔레비전과 HDMI를 통해 접속된 셋톱박스이고,
상기 인공지능 스피커는,
상기 셋톱박스와 유선 또는 무선 통신 인터페이스를 통해 접속되어 상기 셋톱박스로부터 상기 에코기준신호를 수신하는 것을 특징으로 하는 인공지능 스피커. - 제 8 항에 있어서,
상기 인공지능 스피커는,
상기 셋톱박스와 USB 케이블을 통해 접속 가능한 USB 인터페이스를 포함하고,
상기 셋톱박스로부터 상기 USB인터페이스를 통해 상기 에코 기준 신호를 수신하는 것을 특징으로 하는 인공지능 스피커. - 제 8 항에 있어서,
상기 인공지능 스피커는,
상기 셋톱박스와 블루투스 또는 WIFI를 포함하는 무선통신이 가능한 무선통신 인터페이스를 포함하고,
상기 셋톱박스로부터 상기 무선통신 인터페이스를 통해 상기 에코 기준 신호를 수신하는 것을 특징으로 하는 인공지능 스피커.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020170166649A KR101970731B1 (ko) | 2017-12-06 | 2017-12-06 | 인공지능 스피커 및 이의 제어 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020170166649A KR101970731B1 (ko) | 2017-12-06 | 2017-12-06 | 인공지능 스피커 및 이의 제어 방법 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR101970731B1 true KR101970731B1 (ko) | 2019-05-17 |
Family
ID=66678013
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020170166649A KR101970731B1 (ko) | 2017-12-06 | 2017-12-06 | 인공지능 스피커 및 이의 제어 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR101970731B1 (ko) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20190096855A (ko) | 2019-07-30 | 2019-08-20 | 엘지전자 주식회사 | 사운드 처리 방법 및 장치 |
CN110234051A (zh) * | 2019-06-27 | 2019-09-13 | 中科上声(苏州)电子有限公司 | 一种基于深度学习的防啸叫扩声方法及系统 |
KR102134860B1 (ko) | 2019-09-23 | 2020-08-27 | (주)제노임펙트 | 인공지능 스피커 및 이의 비언어적 요소 기반 동작 활성화 방법 |
KR20210033850A (ko) | 2019-09-19 | 2021-03-29 | 주식회사 세미콘네트웍스 | 목소리 및 얼굴 안면 감정값의 산출 방법 및 이를 이용한 인공지능 스피커의 출력 방법 |
KR102351818B1 (ko) * | 2021-03-26 | 2022-01-17 | 주식회사 이노피아테크 | 2개의 마이크로 복수의 방송통신사업자 또는 ai 서비스 업체의 원거리 음성 인식을 동시에 지원하는 방법 및 장치 |
KR102351819B1 (ko) * | 2021-03-26 | 2022-01-17 | 주식회사 이노피아테크 | 2개의 마이크로 복수의 방송통신사업자 또는 ai 서비스 업체의 원거리 음성 인식을 동시에 지원 시 pdm 입력의 샘플링 방법 및 장치 |
US11688396B2 (en) | 2019-12-12 | 2023-06-27 | Samsung Electronics Co., Ltd. | Electronic device and method for controlling electronic device |
KR20230103041A (ko) | 2021-12-31 | 2023-07-07 | 지엘디앤아이에프 주식회사 | 지능형 스피커 시스템 |
KR20230106335A (ko) | 2022-01-06 | 2023-07-13 | 주식회사 케이티 | 음성인식장치 및 이를 이용한 음성인식방법 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20120072243A (ko) * | 2010-12-23 | 2012-07-03 | 한국전자통신연구원 | 음향/음성 인식을 위한 잡음 제거 장치 및 그 방법 |
KR20160112804A (ko) * | 2015-03-20 | 2016-09-28 | 삼성전자주식회사 | 에코 제거 방법 및 그 전자 장치 |
-
2017
- 2017-12-06 KR KR1020170166649A patent/KR101970731B1/ko active IP Right Grant
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20120072243A (ko) * | 2010-12-23 | 2012-07-03 | 한국전자통신연구원 | 음향/음성 인식을 위한 잡음 제거 장치 및 그 방법 |
KR20160112804A (ko) * | 2015-03-20 | 2016-09-28 | 삼성전자주식회사 | 에코 제거 방법 및 그 전자 장치 |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110234051A (zh) * | 2019-06-27 | 2019-09-13 | 中科上声(苏州)电子有限公司 | 一种基于深度学习的防啸叫扩声方法及系统 |
CN110234051B (zh) * | 2019-06-27 | 2021-08-27 | 中科上声(苏州)电子有限公司 | 一种基于深度学习的防啸叫扩声方法及系统 |
KR20190096855A (ko) | 2019-07-30 | 2019-08-20 | 엘지전자 주식회사 | 사운드 처리 방법 및 장치 |
US11488617B2 (en) | 2019-07-30 | 2022-11-01 | Lg Electronics Inc. | Method and apparatus for sound processing |
KR20210033850A (ko) | 2019-09-19 | 2021-03-29 | 주식회사 세미콘네트웍스 | 목소리 및 얼굴 안면 감정값의 산출 방법 및 이를 이용한 인공지능 스피커의 출력 방법 |
KR102134860B1 (ko) | 2019-09-23 | 2020-08-27 | (주)제노임펙트 | 인공지능 스피커 및 이의 비언어적 요소 기반 동작 활성화 방법 |
US11688396B2 (en) | 2019-12-12 | 2023-06-27 | Samsung Electronics Co., Ltd. | Electronic device and method for controlling electronic device |
KR102351818B1 (ko) * | 2021-03-26 | 2022-01-17 | 주식회사 이노피아테크 | 2개의 마이크로 복수의 방송통신사업자 또는 ai 서비스 업체의 원거리 음성 인식을 동시에 지원하는 방법 및 장치 |
KR102351819B1 (ko) * | 2021-03-26 | 2022-01-17 | 주식회사 이노피아테크 | 2개의 마이크로 복수의 방송통신사업자 또는 ai 서비스 업체의 원거리 음성 인식을 동시에 지원 시 pdm 입력의 샘플링 방법 및 장치 |
KR20230103041A (ko) | 2021-12-31 | 2023-07-07 | 지엘디앤아이에프 주식회사 | 지능형 스피커 시스템 |
KR20230106335A (ko) | 2022-01-06 | 2023-07-13 | 주식회사 케이티 | 음성인식장치 및 이를 이용한 음성인식방법 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101970731B1 (ko) | 인공지능 스피커 및 이의 제어 방법 | |
CN107454508B (zh) | 麦克风阵列的电视机及电视系统 | |
US11527243B1 (en) | Signal processing based on audio context | |
US11631403B2 (en) | Apparatus, system and method for directing voice input in a controlling device | |
US9257132B2 (en) | Dominant speech extraction in the presence of diffused and directional noise sources | |
US20230395088A1 (en) | Robust Short-Time Fourier Transform Acoustic Echo Cancellation During Audio Playback | |
KR102478951B1 (ko) | 비선형 특성을 갖는 오디오 필터를 이용하여 오디오 신호를 처리하는 방법 및 장치 | |
US20190355354A1 (en) | Method, apparatus and system for speech interaction | |
WO2019133765A1 (en) | Direction of arrival estimation for multiple audio content streams | |
JP2001117587A (ja) | マイクロホンアレイを有するボイス制御システム | |
CN107966910B (zh) | 语音处理方法、智能音箱及可读存储介质 | |
CN107452395B (zh) | 一种语音信号回声消除装置及电视机 | |
US10325591B1 (en) | Identifying and suppressing interfering audio content | |
CN108198551A (zh) | 回声消除延时的处理方法及装置 | |
US9967668B2 (en) | Binaural recording system and earpiece set | |
KR20220044204A (ko) | 분산형 오디오 디바이스들을 위한 음향 반향 소거 제어 | |
CN111741394A (zh) | 一种数据处理方法、装置及可读介质 | |
CN111447519A (zh) | 智能音箱、基于智能音箱的交互方法及程序产品 | |
CN107452398B (zh) | 回声获取方法、电子设备及计算机可读存储介质 | |
CN114830681A (zh) | 用于减少环境噪声补偿系统中的误差的方法 | |
JP6377557B2 (ja) | 通信システム、通信方法、およびプログラム | |
CN109600703B (zh) | 扩声系统及其扩声方法和计算机可读存储介质 | |
CN111402910B (zh) | 一种消除回声的方法和设备 | |
US20160057271A1 (en) | Two-way mirroring system for sound data | |
US20160057527A1 (en) | Binaural recording system and earpiece set |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
GRNT | Written decision to grant |