KR101970731B1 - 인공지능 스피커 및 이의 제어 방법 - Google Patents

인공지능 스피커 및 이의 제어 방법 Download PDF

Info

Publication number
KR101970731B1
KR101970731B1 KR1020170166649A KR20170166649A KR101970731B1 KR 101970731 B1 KR101970731 B1 KR 101970731B1 KR 1020170166649 A KR1020170166649 A KR 1020170166649A KR 20170166649 A KR20170166649 A KR 20170166649A KR 101970731 B1 KR101970731 B1 KR 101970731B1
Authority
KR
South Korea
Prior art keywords
signal
reference signal
artificial intelligent
echo reference
top box
Prior art date
Application number
KR1020170166649A
Other languages
English (en)
Inventor
이용석
Original Assignee
주식회사 열림기술
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 열림기술 filed Critical 주식회사 열림기술
Priority to KR1020170166649A priority Critical patent/KR101970731B1/ko
Application granted granted Critical
Publication of KR101970731B1 publication Critical patent/KR101970731B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/02Circuits for transducers, loudspeakers or microphones for preventing acoustic reaction, i.e. acoustic oscillatory feedback
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2420/00Details of connection covered by H04R, not provided for in its groups
    • H04R2420/07Applications of wireless loudspeakers or wireless microphones

Landscapes

  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Quality & Reliability (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • General Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

일 실시 예에 따른 인공지능 스피커는 마이크로 입력되는 소리 중, 발화자(User Voice)의 음성만 남기고 나머지 노이즈를 제거 또는 필터링하기 위해 AEC(Acoustic Echo Cancellation)를 사용함에 있어, 에코 기준 신호(Echo Reference)를 전송함으로써, TV 노이즈를 보다 효과적으로 제거하여, 인공지능 스피커의 음성인식 성공률을 높일 수 있다.

Description

인공지능 스피커 및 이의 제어 방법{Artificial intelligent speaker and its control method}
실시 예들은 인공지능 스피커 및 이의 제어 방법에 관한 것이다.
최근, 음악 감상이나 라디오 청취에 활용되던 스피커가 음성인식 기술과 만나 진화하고 있다. 스마트폰에서 쉽게 만나볼 수 있는 음성인식 기술과 클라우드, 인공지능(AI) 기술을 활용해 단순하게 소리를 전달하는 도구에서 생각하고 관리하는 AI 스피커로 변신중이다. 이미 아마존, 구글, 애플 등 글로벌 IT 기업이 AI 스피커 제품을 출시하였으며, 국내에서도 SK텔레콤, KT, 네이버, 삼성전자 등도 이 시장에 관심을 보이고 있다.
기업들은 음성 기반 플랫폼이 만들어지면 스마트 홈으로 가는 사물인터넷(IoT)시장을 손쉽게 선점할 수 있다. 스마트 홈은 집 안 각종 가전제품, 수도, 전기사용량 등을 통신에 연결해 모니터링하고 제어할 수 있는 집을 말한다. 이 핵심엔 현재 AI 스피커가 자리 잡았다. 음성 기반 플랫폼을 이용하면 손을 이용하지 않고도 편리하게 기기를 관리하거나 제어할 수 있다. AI 스피커가 등장하는 이유다.
AI 스피커는 인공지능 알고리즘을 이용해 사용자와 음성으로 의사소통을 한다. AI 스피커를 이용하면 음성인식을 통해 집안의 기기를 목소리만으로 간편하게 제어하는 식으로 손쉽게 스마트 홈 환경을 구축할 수 있다. 또한, 터치 기반과 달리 음성 기반 조작은 쉽게 배우고 사용할 수 있다.
한편, AI 스피커는 가정용 기기, 예를 들면 텔레비전과 인접하여 배치되는 경우가 많고, 이 경우, 텔레비전의 소리가 AI 스피커로 입력되는 음성에 잡음으로 작용하여 인식률이 크게 떨어지는 문제점이 있다.
실시 예들은 AI 스피커의 마이크로 입력되는 소리 중, 발화자(User Voice)의 음성만 남기고 나머지 노이즈를 제거 또는 필터링하기 위해 AEC(Acoustic Echo Cancellation)를 사용함에 있어, 에코 기준 신호(Echo Reference)를 전송함으로써, TV 노이즈를 보다 효과적으로 제거하여, AI 스피커의 음성인식 성공률을 높일 수 있는 인공지능 스피커 및 이의 제어 방법을 제공하는 것이다.
일 실시 예에 따른 인공지능 스피커의 제어 방법에 있어서, 마이크로부터 입력된, 사용자 음성 신호 및 상기 인공지능 스피커의 주위의 가전기기로부터 출력된 오디오 신호를 포함하는 입력 신호를 입력받는 단계; 외부 장치로부터 상기 가전기기의 오디오 신호에 상응하는 에코 기준 신호를 수신하는 단계; 상기 수신된 에코 기준 신호를 기초로 상기 입력 신호로부터 상기 오디오 신호를 제거한 전처리 신호를 출력하는 단계; 및 상기 출력된 전처리 신호를 인식하여 음성인식 제어신호를 출력하는 단계를 포함한다.
상기 가전기기는 텔레비전이고, 상기 외부장치는 셋톱박스일 수 있다.
상기 인공지능 스피커는 상기 셋톱박스와 USB 케이블을 통해 접속되어, 상기 에코 기준 신호를 수신할 수 있다.
상기 인공지능 스피커는 상기 셋톱박스와 블루투스 및 WIFI를 포함하는 무선통신 인터페이스를 통해 접속되어, 상기 에코 기준 신호를 수신할 수 있다.
상기 외부장치는, 상기 가전기기와 유무선 통신인터페이스를 통해 접속되어, 상기 가전기기로부터 상기 에코 기준신호를 수신하는 에코 기준신호 전송장치이고,
상기 인공지능 스피커는 상기 에코 기준신호 전송장치와 유무선 통신인터페이스를 통해 접속되어, 상기 에코 기준신호 전송장치로부터 상기 에코 기준 신호를 수신할 수 있다.
다른 실시 예에 따른 인공지능 스피커의 제어 방법에 있어서, 마이크로부터 입력된, 사용자 음성 신호 및 상기 인공지능 스피커의 주위의 가전기기로부터 출력된 오디오 신호를 포함하는 입력 신호를 입력받는 단계; 상기 가전기기와 유무선 통신 인터페이스를 통해 접속되어, 상기 가전기기로부터 상기 오디오 신호에 상응하는 에코 기준 신호를 수신하는 단계; 상기 수신된 에코 기준 신호를 기초로 상기 입력 신호로부터 상기 오디오 신호를 제거한 전처리 신호를 출력하는 단계; 및 상기 출력된 전처리 신호를 인식하여 음성인식 제어신호를 출력하는 단계를 포함한다.
또 다른 실시 예에 따른 사용자 음성 신호 및 상기 인공지능 스피커의 주위의 가전기기로부터 출력된 오디오 신호를 포함하는 입력 신호를 입력받는 마이크; 외부 장치로부터 상기 가전기기의 오디오 신호에 상응하는 에코 기준 신호를 수신하는 에코신호 수신부; 상기 수신된 에코 기준 신호를 기초로 상기 입력 신호로부터 상기 오디오 신호를 제거한 전처리 신호를 출력하는 오디오 전처리부; 및 상기 오디오 전처리부로부터 출력된 전처리 신호를 인식하여 음성인식 제어신호를 출력하는 프로세서를 포함한다.
상기 가전기기는 텔레비전이고, 상기 외부장치는 셋톱박스일 수 있고,
상기 인공지능 스피커는, 상기 셋톱박스와 USB 케이블을 통해 접속 가능한 USB 인터페이스를 포함하고, 상기 셋톱박스로부터 상기 USB인터페이스를 통해 상기 에코 기준 신호를 수신할 수 있다.
상기 가전기기는 텔레비전이고, 상기 외부장치는 셋톱박스일 수 있고, 상기 인공지능 스피커는, 상기 셋톱박스와 블루투스 또는 WIFI를 포함하는 무선통신이 가능한 무선통신 인터페이스를 포함하고, 상기 셋톱박스로부터 상기 무선통신 인터페이스를 통해 상기 에코 기준 신호를 수신할 수 있다.
또 다른 실시 예에 따른 상기 제어 방법을 컴퓨터에서 실행시키기 위한 방법을 기록한 기록매체를 포함한다.
실시 예에 따른 인공지능 스피커는 마이크로 입력되는 소리 중, 발화자의 음성만 남기고 나머지 노이즈를 제거 또는 필터링하기 위해 AEC(Acoustic Echo Cancellation)를 사용함에 있어, 에코 기준 신호(Echo Reference)를 전송함으로써, TV 노이즈를 보다 효과적으로 제거하여, 인공지능 스피커의 음성인식 성공률을 높일 수 있다.
도 1은 일 실시 예에 따른 인공지능 스피커의 노이즈 제거를 설명하기 위한 개념 도이다.
도 2는 일 실시 예에 따른 인공지능 스피커의 개략도이다.
도 3은 도 2에 도시된 인공지능 스피커의 노이즈 제거를 설명하기 위한 예시 도이다.
도 4는 다른 실시 예에 따른 인공지능 스피커의 개략도이다.
도 5는 또 다른 실시 예에 따른 인공지능 스피커의 개략도이다.
도 6은 또 다른 실시 예에 따른 인공지능 스피커의 개략도이다.
도 7은 또 다른 실시 예에 따른 인공지능 스피커의 제어 방법을 설명하기 위한 흐름 도이다.
도 8은 또 다른 실시 예에 따른 인공지능 스피커의 제어 방법을 설명하기 위한 흐름 도이다.
본 실시 예들에서 사용되는 용어는 본 실시 예들에서의 기능을 고려하면서 가능한 현재 널리 사용되는 일반적인 용어들을 선택하였으나, 이는 당 기술분야에 종사하는 기술자의 의도 또는 판례, 새로운 기술의 출현 등에 따라 달라질 수 있다. 또한, 특정한 경우는 임의로 선정된 용어도 있으며, 이 경우 해당 실시 예의 설명 부분에서 상세히 그 의미를 기재할 것이다. 따라서, 본 실시 예들에서 사용되는 용어는 단순한 용어의 명칭이 아닌, 그 용어가 가지는 의미와 본 실시 예들의 전반에 걸친 내용을 토대로 정의되어야 한다.
실시 예들에 대한 설명에서, 어떤 부분이 다른 부분과 연결되어 있다고 할 때, 이는 직접적으로 연결되어 있는 경우뿐 아니라, 그 중간에 다른 구성요소를 사이에 두고 전기적으로 연결되어 있는 경우도 포함한다. 또한, 어떤 부분이 어떤 구성요소를 포함한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미한다. 또한, 실시 예들에 기재된 “...부”의 용어는 적어도 하나의 기능이나 동작을 처리하는 단위를 의미하며, 이는 하드웨어 또는 소프트웨어로 구현되거나 하드웨어와 소프트웨어의 결합으로 구현될 수 있다.
본 실시 예들에서 사용되는 “구성된다”또는“포함한다" 등의 용어는 명세서상에 기재된 여러 구성 요소들, 또는 여러 단계들을 반드시 모두 포함하는 것으로 해석되지 않아야 하며, 그 중 일부 구성 요소들 또는 일부 단계들은 포함되지 않을 수도 있고, 또는 추가적인 구성 요소 또는 단계들을 더 포함할 수 있는 것으로 해석되어야 한다.
하기 실시 예들에 대한 설명은 권리범위를 제한하는 것으로 해석되지 말아야 하며, 해당 기술분야의 당업자가 용이하게 유추할 수 있는 것은 실시 예들의 권리범위에 속하는 것으로 해석되어야 할 것이다. 이하 첨부된 도면들을 참조하면서 오로지 예시를 위한 실시 예들을 상세히 설명하기로 한다.
도 1은 일 실시 예에 따른 인공지능 스피커의 노이즈 제거를 설명하기 위한 개념 도이다.
도 1을 참조하면, 인공지능 스피커(110)와 텔레비전(120)이 도시되어 있다. 일 실시 예에서, 인공지능 스피커(110)는 텔레비전(120)의 주위에 배치된 것으로 설명하지만, 이에 한정되지 않고, 다른 가전기기들의 주위에 배치되어, 인공지능 스피커(110)에 발화자의 음성과 함께 입력되는 잡음을 효과적으로 제거할 수 있음은 물론이다.
인공지능 스피커(110)는 음성인식, AI 기술을 이용해 사용자와 의사소통이 가능하다. 음성 명령으로 예를 들면, 음악재생, 날씨, 뉴스, 검색 번역 등 다양한 서비스를 이용할 수 있다. 실시 예에 따른 인공지능 스피커(110)는 음성 입력을 통해 텔레비전(120)을 제어할 수도 있으며, 홈 네트워크를 통해 접속되어 있는 다양한 가전기기들도 제어할 수 있다.
실시 예에 따른 인공지능 스피커(110)는 마이크로 입력되는 소리 중 발화자의 음성만 남기고 나머지 노이즈를 제거하기 위해 AEC(Acoustic Echo Cancellation)를 사용할 수 있다. 인공지능 스피커(110)는 AEC에 사용되는 에코 기준 신호(Echo Reference)를 이용할 수 있다.
도 2는 일 실시 예에 따른 인공지능 스피커(200)의 개략도이고, 도 3은 도 2에 도시된 인공지능 스피커의 노이즈 제거를 설명하기 위 한 예시 도이다.
도 2 및 3을 함께 참조하면, 인공지능 스피커(200)는 마이크(210)로 다양한 신호를 입력받는다. 도 2에 도시된 것처럼 발화자의 음성 신호(A), 기타 주변 잡음 신호(B), TV(290)로부터 입력되는 TV 오디오 신호(C), 인공지능 스피커(200)의 자체 스피커(250)로부터 출력된 오디오 신호(D)를 입력받는다.
도 3에 도시된 것처럼, 오디오 전처리 장치(220)에서, 음성 신호(A)만을 남기고, 나머지 신호들을 제거 또는 필터링한다. 이때 프로세서(230)는 오디오 전처리 장치(220)에 에코 기준 신호를 전송함으로써, 오디오 전처리 장치(220)가 수신된 에코 기준 신호를 이용하여 TV 신호(C)를 제거한다.
오디오 전처리 장치(220)는 다음과 같은 3가지 방식을 이용하여 노이즈를 제거할 수 있다. 노이즈 제거(Noise Reduction, 이하 NR이라 한다), 빔포밍(Beamforming, 이하 BF라 한다), AEC(Acoustic Echo Cancellation, 이하 AEC라 한다)를 이용할 수 있다.
NR은 다수의 마이크를 사용하여 배경 잡음을 감소시키는 것으로, 화자방향 이외의 마이크를 통해 주위 환경 잡음을 감지하고, 감지된 잡음을 실제 화자쪽 마이크의 출력에서 빼내 음성의 명료도를 높이는 것이다.
BF는 마이크 어레이의 출력을 처리해, 특정 방향의 감도를 높이면서 동시에 다른 방향의 사운드를 거부하는 것으로, 빔포밍은 다양한 방향에서 들어오는 사운드의 위상 차이를 이용하여 마이크 감도를 특정한 방향으로 집중시킬 수 있다. 빔포밍은 사운드가 들어오는 방향을 찾아 내는 데 사용될 수 있다,
AEC는 음향 반향 제거방식으로, 특정 노이즈, 예를 들면 TV Audio Sound의 원음을 에코 기준 신호로 입력받아 이를 제거하는 것이다.
NR, BF 처리에 의해 기타 잡음(B) 및 TV Audio Sound(C)를 필터링하는 것이 가능하고, 에코기준신호를 받아 AEC 처리하여 스피커 출력 신호(D)를 작게 필터링 할 수 있다.
하지만, TV가 있는 거실 환경에서는 TV Audio Sound(C) 음량이 크면, 충분히 작게 제거되지 못하게 되고, 그 결과로 인공지능 스피커의 음성인식 성공률이 낮아지는 문제점이 존재한다.
실시 예에 따른 인공지능 스피커(200)는 스피커 자체의 음성 출력 신호에 대한 에코 기준 신호뿐만 아니라, 주위에 배치된 TV(290)의 오디오 출력 신호에 대한 에코 기준신호를 텔레비전(120)을 통해 수신하거나, 텔레비전(120)에 접속되어 있는 셋톱박스(미도시)로부터 수신하거나, 별도의 에코 기준 신호 전송장치(미도시)로부터 수신할 수 있다. 인공지능 스피커(110)는 텔레비전(120)의 주위에 배치되는 텔레비전(120)으로부터 에코 기준 신호를 수신함으로써 텔레비전(120)에서 발생된 소리를 효과적으로 제거할 수 있다.
도 4는 다른 실시 예에 따른 인공지능 스피커의 개략도이다. 도 2와 동일한 부분에 대한 설명은 생략하고, 차이점이 있는 부분에 대해 상세히 설명한다.
도 4를 참조하면, 인공지능 스피커(400)는 TV(490)에 오디오 및 비디오 신호를 제공하는 셋톱박스(480)로부터 TV(490)에서 출력된 TV 오디오 신호에 대응하는 에코 기준 신호를 수신한다. 도 4에 도시된 것처럼, 셋톱박스(480)는 오디오 소스를 HDMI 오디오 단자를 통해 TV(490)로 출력한다. 동시에, 셋톱박스(480)는 출력된 TV 오디오 신호를 추출하여, 인공지능 스피커(400)에 전송한다. 인공지능 스피커(400)의 프로세서(430)는 셋톱박스(480)로부터 에코 기준 신호를 수신하기 위한 에코 기준 신호 수신부(431)를 더 포함할 수 있다. 여기서, 인공지능 스피커(400)와 셋톱박스(480)는 유무선 통신 인터페이스를 통해 에코 기준 신호를 송수신할 수 있다. 예를 들면 USB 또는 Analog Audio cable 또는 S/PDIF 케이블로 통신할 수 있으며, BT(Bluetooth) 또는 WiFi로 통신할 수도 있다.
실시 예에 따른 인공지능 스피커(400)는 TV(490)와 접속된 셋톱박스(480)로부터 TV에서 출력된 TV 오디오 신호에 대응하는 에코 기준 신호를 유무선 통신 인터페이스를 통해 수신함으로서, 효과적으로 TV 오디오 신호(C)를 제거함으로써 인공지능 스피커(400)의 음성인식 성공률을 극대화시킬 수 있다.
도 5는 또 다른 실시 예에 따른 인공지능 스피커의 개략도이다. 도 4와 동일한 부분에 대한 설명은 생략하고, 차이점이 있는 부분에 대해 상세히 설명한다.
도 5를 참조하면, 셋톱박스가 아닌 별도의 에코 신호 전송장치(570)를 통해 TV(590)로부터 TV 오디오 신호에 대응하는 에코 기준 신호를 인공지능 스피커(500)에 전송한다. 에코 신호 전송 장치(570)는 음성 인식 스피커(500)와 유무선통신 인터페이스(571)를 통해 연결 가능하고, TV(590)와도 유무선 통신인터페이스(572)를 통해 연결 가능하다. 여기서, 유수선 통신 인터페이스(571 및 572)는 USB 또는 Analog Audio cable 또는 S/PDIF 케이블일 수 있으며, BT(Bluetooth) 또는 WiFi일 수도 있으나, 이에 한정되는 것은 아니다.
도 6은 또 다른 실시 예에 따른 인공지능 스피커의 개략도이다. 도 4 및 5와 동일한 부분에 대한 설명은 생략하고, 차이점이 있는 부분에 대해 상세히 설명한다.
도 6을 참조하면, 인공지능 스피커(600)와 TV(690)를 직접 연결하는 방식으로, 인공지능 스피커(600)는 유무선 통신 인터페이스(670)를 통해 TV 오디오 신호에 대응하는 에코 기준 신호를 수신할 수 있다. 유무선 통신 인터페이스(670)는 예를 들면 USB 또는 Analog Audio cable 또는 S/PDIF 케이블이거나, BT(Bluetooth) 또는 WiFi일 수 있으나, 이에 한정되지 않는다.
도 7은 또 다른 실시 예에 따른 인공지능 스피커의 제어 방법을 설명하기 위한 흐름 도이다.
단계 700에서, 마이크로부터 입력된, 사용자 음성 신호 및 인공지능 스피커의 주위의 가전기기로부터 출력된 오디오 신호를 포함하는 입력 신호를 입력받는다.
단계 702에서, 외부 장치로부터 가전기기의 오디오 신호에 상응하는 에코 기준 신호를 수신한다. 여기서, 가전기기는 TV이고, 외부 장치는 셋톱박스이거나, TV, 또는 별도의 에코 기준 신호 전송장치일 수 있다.
단계 704에서, 수신된 에코 기준 신호를 기초로 입력 신호로부터 오디오 신호를 제거한 전처리 신호를 출력한다. 인공지능 스피커는 단계 704에서 수신된 에코 기준 신호를 이용하여 AEC를 통해 가전기기의 오디오 신호를 제거할 수 있다.
단계 706에서, 출력된 전처리 신호를 인식하여 음성인식 제어신호를 출력한다.
도 8은 또 다른 실시 예에 따른 인공지능 스피커의 제어 방법을 설명하기 위한 흐름 도이다.
도 8을 참조하면, 단계 800에서, 마이크로부터 입력된, 사용자 음성 신호 및 인공지능 스피커의 주위의 가전기기로부터 출력된 오디오 신호를 포함하는 입력 신호를 입력받는다.
단계 802에서, 가전기기와 유무선 통신 인터페이스를 통해 접속되어, 가전기기로부터 오디오 신호에 상응하는 에코 기준 신호를 수신한다. 여기서, 가전기기는 TV일 수 있다. 유무선 통신 인터페이스는 예를 들면 USB 또는 Analog Audio cable 또는 S/PDIF 케이블이거나, BT(Bluetooth) 또는 WiFi일 수 있으나, 이에 한정되지 않는다.
단계 804에서, 수신된 에코 기준 신호를 기초로 입력 신호로부터 오디오 신호를 제거한 전처리 신호를 출력한다.
단계 806에서, 출력된 전처리 신호를 인식하여 음성인식 제어신호를 출력한다.
실시 예에 따른 인공지능 스피커 및 이의 제어 방법은 마이크로 입력되는 소리 중 발화자의 음성만 남기고 나머지 노이즈를 제거하기 위해 AEC를 사용하고, 이를 위한 에코 기준 신호(Echo Reference)를 TV에 오디오 신호를 제공하는 셋톱박스로부터 유무선 통신 인터페이스를 통해 수신하거나, 별도의 에코 기준 신호 전송장치로부터 유무선 통신 인터페이스를 통해 수신하거나, TV로부터 직접 유무선 통신 인터페이스를 통해 수신함으로써, TV 오디오 신호 또는 노이즈를 보다 효과적으로 제거하여, 인공지능 스피커의 음성인식 성공률을 높일 수 있다.
일 실시 예는 컴퓨터에 의해 실행되는 프로그램 모듈과 같은 컴퓨터에 의해 실행가능한 명령어를 포함하는 기록 매체의 형태로도 구현될 수 있다. 컴퓨터 판독 가능 매체는 컴퓨터에 의해 액세스될 수 있는 임의의 가용 매체일 수 있고, 휘발성 및 비휘발성 매체, 분리형 및 비분리형 매체를 모두 포함한다. 또한, 컴퓨터 판독가능 매체는 컴퓨터 저장 매체 및 통신 매체를 모두 포함할 수 있다. 컴퓨터 저장 매체는 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈 또는 기타 데이터와 같은 정보의 저장을 위한 임의의 방법 또는 기술로 구현된 휘발성 및 비휘발성, 분리형 및 비분리형 매체를 모두 포함한다. 통신 매체는 전형적으로 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈, 또는 반송파와 같은 변조된 데이터 신호의 기타 데이터, 또는 기타 전송 메커니즘을 포함하며, 임의의 정보 전달 매체를 포함한다.
전술한 설명은 예시를 위한 것이며, 본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시 예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 예를 들어, 단일형으로 설명되어 있는 각 구성 요소는 분산되어 실시될 수도 있으며, 마찬가지로 분산된 것으로 설명되어 있는 구성 요소들도 결합된 형태로 실시될 수 있다.
본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.

Claims (10)

  1. 인공지능 스피커의 제어 방법에 있어서,
    마이크로부터 입력된, 사용자 음성 신호 및 상기 인공지능 스피커의 주위의 가전기기로부터 출력된 오디오 신호를 포함하는 입력 신호를 입력받는 단계;
    외부 장치로부터 상기 가전기기의 오디오 신호에 상응하는 에코 기준 신호를 수신하는 단계;
    상기 수신된 에코 기준 신호를 기초로 상기 입력 신호로부터 상기 오디오 신호를 제거한 전처리 신호를 출력하는 단계; 및
    상기 출력된 전처리 신호를 인식하여 음성인식 제어신호를 출력하는 단계를 포함하고,
    상기 가전기기는 텔레비전이고, 상기 외부장치는 상기 텔레비전과 HDMI를 통해 접속된 셋톱박스이고,
    상기 인공지능 스피커는,
    상기 셋톱박스와 유선 또는 무선 통신 인터페이스를 통해 접속되어 상기 셋톱박스로부터 상기 에코기준신호를 수신하는 것을 특징으로 하는 인공지능 스피커의 제어 방법.
  2. 삭제
  3. 제 1 항에 있어서,
    상기 인공지능 스피커는 상기 셋톱박스와 USB 케이블을 통해 접속되어, 상기 에코 기준 신호를 수신하는 것을 특징으로 하는 인공지능 스피커의 제어 방법.
  4. 제 1 항에 있어서,
    상기 인공지능 스피커는 상기 셋톱박스와 블루투스 및 WIFI를 포함하는 무선통신 인터페이스를 통해 접속되어, 상기 에코 기준 신호를 수신하는 것을 특징으로 하는 인공지능 스피커의 제어 방법.
  5. 제 1 항에 있어서,
    상기 외부장치는,
    상기 가전기기와 유무선 통신인터페이스를 통해 접속되어, 상기 가전기기로부터 상기 에코 기준신호를 수신하는 에코 기준신호 전송장치이고,
    상기 인공지능 스피커는 상기 에코 기준신호 전송장치와 유무선 통신인터페이스를 통해 접속되어, 상기 에코 기준신호 전송장치로부터 상기 에코 기준 신호를 수신하는 것을 특징으로 하는 인공지능 스피커의 제어 방법.
  6. 삭제
  7. 제 1 항, 제 3 항 내지 제 5 항 중 어느 한 항에 따른 제어 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 기록매체.
  8. 사용자 음성 신호 및 인공지능 스피커의 주위의 가전기기로부터 출력된 오디오 신호를 포함하는 입력 신호를 입력받는 마이크;
    외부 장치로부터 상기 가전기기의 오디오 신호에 상응하는 에코 기준 신호를 수신하는 에코신호 수신부;
    상기 수신된 에코 기준 신호를 기초로 상기 입력 신호로부터 상기 오디오 신호를 제거한 전처리 신호를 출력하는 오디오 전처리부; 및
    상기 오디오 전처리부로부터 출력된 전처리 신호를 인식하여 음성인식 제어신호를 출력하는 프로세서를 포함하고,
    상기 가전기기는 텔레비전이고, 상기 외부장치는 상기 텔레비전과 HDMI를 통해 접속된 셋톱박스이고,
    상기 인공지능 스피커는,
    상기 셋톱박스와 유선 또는 무선 통신 인터페이스를 통해 접속되어 상기 셋톱박스로부터 상기 에코기준신호를 수신하는 것을 특징으로 하는 인공지능 스피커.
  9. 제 8 항에 있어서,
    상기 인공지능 스피커는,
    상기 셋톱박스와 USB 케이블을 통해 접속 가능한 USB 인터페이스를 포함하고,
    상기 셋톱박스로부터 상기 USB인터페이스를 통해 상기 에코 기준 신호를 수신하는 것을 특징으로 하는 인공지능 스피커.
  10. 제 8 항에 있어서,
    상기 인공지능 스피커는,
    상기 셋톱박스와 블루투스 또는 WIFI를 포함하는 무선통신이 가능한 무선통신 인터페이스를 포함하고,
    상기 셋톱박스로부터 상기 무선통신 인터페이스를 통해 상기 에코 기준 신호를 수신하는 것을 특징으로 하는 인공지능 스피커.
KR1020170166649A 2017-12-06 2017-12-06 인공지능 스피커 및 이의 제어 방법 KR101970731B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020170166649A KR101970731B1 (ko) 2017-12-06 2017-12-06 인공지능 스피커 및 이의 제어 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020170166649A KR101970731B1 (ko) 2017-12-06 2017-12-06 인공지능 스피커 및 이의 제어 방법

Publications (1)

Publication Number Publication Date
KR101970731B1 true KR101970731B1 (ko) 2019-05-17

Family

ID=66678013

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020170166649A KR101970731B1 (ko) 2017-12-06 2017-12-06 인공지능 스피커 및 이의 제어 방법

Country Status (1)

Country Link
KR (1) KR101970731B1 (ko)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190096855A (ko) 2019-07-30 2019-08-20 엘지전자 주식회사 사운드 처리 방법 및 장치
CN110234051A (zh) * 2019-06-27 2019-09-13 中科上声(苏州)电子有限公司 一种基于深度学习的防啸叫扩声方法及系统
KR102134860B1 (ko) 2019-09-23 2020-08-27 (주)제노임펙트 인공지능 스피커 및 이의 비언어적 요소 기반 동작 활성화 방법
KR20210033850A (ko) 2019-09-19 2021-03-29 주식회사 세미콘네트웍스 목소리 및 얼굴 안면 감정값의 산출 방법 및 이를 이용한 인공지능 스피커의 출력 방법
KR102351818B1 (ko) * 2021-03-26 2022-01-17 주식회사 이노피아테크 2개의 마이크로 복수의 방송통신사업자 또는 ai 서비스 업체의 원거리 음성 인식을 동시에 지원하는 방법 및 장치
KR102351819B1 (ko) * 2021-03-26 2022-01-17 주식회사 이노피아테크 2개의 마이크로 복수의 방송통신사업자 또는 ai 서비스 업체의 원거리 음성 인식을 동시에 지원 시 pdm 입력의 샘플링 방법 및 장치
US11688396B2 (en) 2019-12-12 2023-06-27 Samsung Electronics Co., Ltd. Electronic device and method for controlling electronic device
KR20230103041A (ko) 2021-12-31 2023-07-07 지엘디앤아이에프 주식회사 지능형 스피커 시스템
KR20230106335A (ko) 2022-01-06 2023-07-13 주식회사 케이티 음성인식장치 및 이를 이용한 음성인식방법

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20120072243A (ko) * 2010-12-23 2012-07-03 한국전자통신연구원 음향/음성 인식을 위한 잡음 제거 장치 및 그 방법
KR20160112804A (ko) * 2015-03-20 2016-09-28 삼성전자주식회사 에코 제거 방법 및 그 전자 장치

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20120072243A (ko) * 2010-12-23 2012-07-03 한국전자통신연구원 음향/음성 인식을 위한 잡음 제거 장치 및 그 방법
KR20160112804A (ko) * 2015-03-20 2016-09-28 삼성전자주식회사 에코 제거 방법 및 그 전자 장치

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110234051A (zh) * 2019-06-27 2019-09-13 中科上声(苏州)电子有限公司 一种基于深度学习的防啸叫扩声方法及系统
CN110234051B (zh) * 2019-06-27 2021-08-27 中科上声(苏州)电子有限公司 一种基于深度学习的防啸叫扩声方法及系统
KR20190096855A (ko) 2019-07-30 2019-08-20 엘지전자 주식회사 사운드 처리 방법 및 장치
US11488617B2 (en) 2019-07-30 2022-11-01 Lg Electronics Inc. Method and apparatus for sound processing
KR20210033850A (ko) 2019-09-19 2021-03-29 주식회사 세미콘네트웍스 목소리 및 얼굴 안면 감정값의 산출 방법 및 이를 이용한 인공지능 스피커의 출력 방법
KR102134860B1 (ko) 2019-09-23 2020-08-27 (주)제노임펙트 인공지능 스피커 및 이의 비언어적 요소 기반 동작 활성화 방법
US11688396B2 (en) 2019-12-12 2023-06-27 Samsung Electronics Co., Ltd. Electronic device and method for controlling electronic device
KR102351818B1 (ko) * 2021-03-26 2022-01-17 주식회사 이노피아테크 2개의 마이크로 복수의 방송통신사업자 또는 ai 서비스 업체의 원거리 음성 인식을 동시에 지원하는 방법 및 장치
KR102351819B1 (ko) * 2021-03-26 2022-01-17 주식회사 이노피아테크 2개의 마이크로 복수의 방송통신사업자 또는 ai 서비스 업체의 원거리 음성 인식을 동시에 지원 시 pdm 입력의 샘플링 방법 및 장치
KR20230103041A (ko) 2021-12-31 2023-07-07 지엘디앤아이에프 주식회사 지능형 스피커 시스템
KR20230106335A (ko) 2022-01-06 2023-07-13 주식회사 케이티 음성인식장치 및 이를 이용한 음성인식방법

Similar Documents

Publication Publication Date Title
KR101970731B1 (ko) 인공지능 스피커 및 이의 제어 방법
CN107454508B (zh) 麦克风阵列的电视机及电视系统
US11527243B1 (en) Signal processing based on audio context
US11631403B2 (en) Apparatus, system and method for directing voice input in a controlling device
US9257132B2 (en) Dominant speech extraction in the presence of diffused and directional noise sources
US20230395088A1 (en) Robust Short-Time Fourier Transform Acoustic Echo Cancellation During Audio Playback
KR102478951B1 (ko) 비선형 특성을 갖는 오디오 필터를 이용하여 오디오 신호를 처리하는 방법 및 장치
US20190355354A1 (en) Method, apparatus and system for speech interaction
WO2019133765A1 (en) Direction of arrival estimation for multiple audio content streams
JP2001117587A (ja) マイクロホンアレイを有するボイス制御システム
CN107966910B (zh) 语音处理方法、智能音箱及可读存储介质
CN107452395B (zh) 一种语音信号回声消除装置及电视机
US10325591B1 (en) Identifying and suppressing interfering audio content
CN108198551A (zh) 回声消除延时的处理方法及装置
US9967668B2 (en) Binaural recording system and earpiece set
KR20220044204A (ko) 분산형 오디오 디바이스들을 위한 음향 반향 소거 제어
CN111741394A (zh) 一种数据处理方法、装置及可读介质
CN111447519A (zh) 智能音箱、基于智能音箱的交互方法及程序产品
CN107452398B (zh) 回声获取方法、电子设备及计算机可读存储介质
CN114830681A (zh) 用于减少环境噪声补偿系统中的误差的方法
JP6377557B2 (ja) 通信システム、通信方法、およびプログラム
CN109600703B (zh) 扩声系统及其扩声方法和计算机可读存储介质
CN111402910B (zh) 一种消除回声的方法和设备
US20160057271A1 (en) Two-way mirroring system for sound data
US20160057527A1 (en) Binaural recording system and earpiece set

Legal Events

Date Code Title Description
GRNT Written decision to grant