KR20220165940A

KR20220165940A - 음성인식 스피커장치 및 이를 포함하는 음성인식 시스템

Info

Publication number: KR20220165940A
Application number: KR1020210074601A
Authority: KR
Inventors: 양진성; 유병안
Original assignee: 주식회사 아모센스
Priority date: 2021-06-09
Filing date: 2021-06-09
Publication date: 2022-12-16

Abstract

음성인식 스피커장치가 제공된다. 본 발명의 일 실시예에 의한 음성인식 스피커장치는 사용자의 음성을 인식하여 작동되는 음성인식 스피커장치에 있어서, 마이크, 스피커 및 상기 마이크로부터 전달된 음향 정보에 기초하여 상기 스피커를 제어하는 제어부를 포함하는 베이스 모듈; 및 상기 베이스 모듈의 기능을 보강하거나 상기 베이스 모듈에 새로운 기능을 부가하도록 상기 베이스 모듈과 탈착 가능하게 결합되며, 상기 제어부에 의해 상기 베이스 모듈과 통합적으로 제어되는 제1 모듈;을 포함하고, 상기 베이스 모듈에 상기 제1 모듈이 결합된 상태 및 분리된 상태에서 모두 작동 가능하도록 형성된다.

Description

음성인식 스피커장치 및 이를 포함하는 음성인식 시스템{VOICE RECOGNITION SPEAKER DEVICE AND VOICE RECOGNITION SYSTEM INCLUDING SAME}

본 발명은 음성인식 스피커장치 및 이를 포함하는 음성인식 시스템에 관한 것이다.

최근 음성인식 기술, 클라우드 기술 및 인공지능 기술 등을 활용하여 사용자의 음성을 인식하고, 이를 기초로 음악 감상, 정보 검색 등의 기능을 수행하는 음성인식 스피커에 대한 관심이 높아지고 있다.

이러한 음성인식 스피커의 경우, 음성 인식을 통해 구동되는 특성상 음성 인식률이 사용 경험과 직결된다. 그러나 대개의 음성인식 스피커의 경우, 음성 명령을 제대로 인식하지 못함에 따라 사용자의 만족도가 떨어지는 문제가 있다.

특히, 음성인식 스피커에 대하여 복수의 화자가 동시에 발화하거나 주변 소음이 큰 경우, 다양한 노이즈가 음향 정보에 포함됨으로써 음성인식 스피커의 음성 인식을 방해할 수 있다.

또한, 음성인식 스피커는 개인 비서 역할을 수행함에 따라 주로 컴팩트한 디자인으로 형성되어 있다. 그 결과, 음성인식 스피커는 스피커 본연의 기능인 음악 재생과 관련된 출력이 부족한 문제가 있다.

한편, 음성인식 스피커는 무선 통신을 통해 외부 서버 등과 연결되어 다양한 정보를 송수신 할 수 있어, 보다 다양한 기능의 확장이 가능할 것으로 예상된다. 그럼에도 불구하고, 대다수의 음성인식 스피커의 기능은 음악 재생 또는 간단한 생활 정보의 재생 등에 그치고 있다.

이러한 상황을 고려하였을 때, 음성 인식률 및 스피커로서의 기능을 보강할 수 있으면서도 다양한 기능 확장이 가능한 음성인식 스피커장치의 개발이 필요한 실정이다.

본 발명은 상기와 같은 점을 감안하여 안출한 것으로, 기능 보강 또는 새로운 기능 부가 등 필요에 따라 다양하게 변경 가능한 음성인식 스피커장치를 제공하는데 그 목적이 있다.

또한, 본 발명은 복수의 화자를 청취 대상으로 하더라도 높은 수준의 음성인식율을 확보할 수 있는 음성인식 스피커장치를 제공하는데 다른 목적이 있다.

또한, 본 발명은 다수의 화자를 포함하는 회의 시 발언 중첩으로 인한 불편을 최소화할 수 있는 음성인식 시스템을 제공하는데 또 다른 목적이 있다.

상술한 목적을 달성하기 위하여 본 발명은 사용자의 음성을 인식하여 작동되는 음성인식 스피커장치에 있어서, 마이크, 스피커 및 상기 마이크로부터 전달된 음향 정보에 기초하여 상기 스피커를 제어하는 제어부를 포함하는 베이스 모듈; 및 상기 베이스 모듈에 탈착 가능하게 결합되며, 상기 제어부에 의해 상기 베이스 모듈과 통합적으로 제어되는 제1 모듈;을 포함하고, 상기 베이스 모듈에 상기 제1 모듈이 결합된 상태 및 분리된 상태에서 모두 작동 가능하도록 형성되는 음성인식 스피커장치를 제공한다.

또한, 상기 베이스 모듈은 제1 부분 및 제2 부분을 포함하는 복수의 부분으로 분리 가능하도록 형성되고, 상기 제1 모듈은 상기 제1 부분과 상기 제2 부분 사이에 개재될 수 있다.

이때, 상기 복수의 부분은 상하 방향으로 적층되어 상기 베이스 모듈을 형성할 수 있다.

또한, 상기 베이스 모듈 및 상기 제1 모듈 중 어느 하나는 단자부재를 포함하는 제1 연결부를 구비하고, 상기 베이스 모듈 및 상기 제1 모듈 중 다른 하나는 상기 단자부재와 접촉되도록 상기 단자부재 측으로 대향 형성되는 돌출부재를 포함하는 제2 연결부를 구비할 수 있다.

이때, 상기 제1 연결부는 상기 베이스 모듈 또는 상기 제1 모듈의 내측으로 오목하게 형성된 수용홈을 더 포함하고, 상기 단자부재는 상기 수용홈의 내부에 배치될 수 있다.

이때, 상기 제2 연결부는 상기 돌출부재를 상기 단자부재 측으로 가압하는 가압부재를 더 포함할 수 있다.

또한, 상기 베이스 모듈 및 상기 제1 모듈 중 어느 하나는 외측 일부에 자성 물질로 형성된 자성부재를 구비하고, 상기 베이스 모듈 및 상기 제1 모듈 중 다른 하나는 상기 자성부재에 대하여 자기력을 인가하도록 상기 자성부재와 대응되는 위치에 배치되는 자석부재를 구비할 수 있다.

또한, 상기 제1 모듈은 환경 정보를 계측하는 센서부를 구비할 수 있다.

이때, 상기 환경 정보는 음원과의 거리, 온도, 습도, 공기오염 정도 및 유해물질 농도 중 적어도 어느 하나일 수 있다.

또한, 상기 제1 모듈은 상기 베이스 모듈에 포함된 스피커의 출력을 보강하도록 추가 스피커를 구비할 수 있다.

또한, 상기 베이스 모듈 및 상기 제1 모듈 중 적어도 어느 하나와 탈착 가능하게 결합되며, 상기 제어부에 의해 상기 베이스 모듈 및 상기 제1 모듈과 통합적으로 제어되는 제2 모듈을 더 포함할 수 있다.

또한, 상기 제어부는 상기 음향 정보를 분석하는 경우, 상기 스피커를 통해 출력된 소리 정보를 노이즈로 처리할 수 있다.

또한, 상기 마이크는 상기 베이스 모듈의 둘레 방향을 따라 이격 배치되는 복수의 마이크를 포함하고, 상기 제어부는 상기 복수의 마이크로부터 각각 수집된 복수의 음향 정보를 통합적으로 분석할 수 있다.

이때, 상기 베이스 모듈은 상기 복수의 마이크를 구성하는 개별 마이크와 각각 대응되도록 상기 개별 마이크 각각과 인접하여 배치되는 복수의 발광부재를 포함하고, 상기 제어부는 상기 복수의 마이크 중 어느 하나의 개별 마이크에 음향 정보가 수집될 경우, 상기 어느 하나의 개별 마이크와 대응되는 발광부재가 발광되도록 제어할 수 있다.

이때, 상기 복수의 마이크는, 제1 사용자로부터 발화되는 제1 음성을 포함한 제1 음향 정보를 수집하는 제1 마이크 및 제2 사용자로부터 발화되는 제2 음성을 포함한 제2 음향 정보를 수집하는 제2 마이크;를 포함하고, 상기 제어부는, 복수의 사용자로부터 동시간대에 발화된 복수의 음성을 각각 구별하여 인식하도록 상기 제1 음향 정보의 분석시 상기 제2 음성에 대응되는 음성 성분을 노이즈로 처리하고, 상기 제2 음향 정보의 분석시 상기 제1 음성에 대응되는 음성 성분을 노이즈로 처리할 수 있다.

한편, 본 발명은 전술한 음성인식 스피커 장치; 및 상기 음성인식 스피커 장치로부터 상기 제1 사용자 및 상기 제2 사용자의 발화 정보를 전달받아 문자 형태로 출력하는 출력 장치;를 포함하는 음성인식 시스템을 제공한다.

본 발명에 의하면, 베이스 모듈의 기능을 보강하거나 새로운 기능을 제공할 수 있는 복수의 모듈을 베이스 모듈에 탈착 가능하게 결합시킬 수 있어, 사용자가 필요에 따라 다양한 형태의 음성인식 스피커장치를 구현할 수 있다.

본 발명은 제어부가 복수의 마이크로부터 수집되는 다양한 음향 정보를 통합적으로 분석함으로써 다수의 화자를 포함하는 사용 환경에서도 개별 화자의 음성을 구분하여 인식할 수 있다.

본 발명은 복수의 화자를 구별하여 인식하는 음성인식 스피커장치부터 발화 정보를 전달받아 문자 형태로 출력이 가능하여, 다수의 발화자를 포함하는 원거리 화상회의 시 발언 중첩으로 인한 청취 불편을 해소할 수 있다.

도 1은 본 발명의 일 실시예에 따른 음성인식 스피커장치를 나타낸 도면,
도 2는 도 1의 음성인식 스피커장치가 베이스 모듈 및 제1 모듈로 분리된 상태를 나타낸 도면,
도 3 및 도 4는 도 1의 분리도,
도 5는 도 1의 단면도,
도 6은 도 1의 음성인식 스피커장치에 제2 모듈을 추가로 결합한 상태를 나타낸 도면,
도 7은 본 발명의 일 실시예에 따른 음성인식 스피커장치의 각 구성 간 정보 전달의 흐름을 개략적으로 나타낸 블록도,
도 8은 본 발명의 일 실시예에 따른 음성인식 스피커장치가 복수의 화자로부터 발화된 음성을 수집하는 과정을 설명하기 위한 설명도,
도 9는 본 발명의 일 실시예에 따른 음성인식 스피커장치가 복수의 음성을 구별하여 인식하는 것을 설명하기 위한 설명도,
도 10은 본 발명의 일 실시예에 따른 음성인식 스피커장치를 통해 수집되는 다양한 음원을 설명하기 위한 설명도,
도 11은 본 발명의 일 실시예에 따른 음성인식 시스템을 개략적으로 나타낸 도면이다.

이하, 첨부한 도면을 참고로 하여 본 발명의 실시예에 대하여 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다. 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 동일 또는 유사한 구성요소에 대해서는 동일한 참조부호를 부가한다. 또한, 도면에 도시된 구성요소의 크기나 형상 등은 설명의 명료성과 편의상 과장되게 도시될 수 있다.

본 발명의 일 실시예에 따른 음성인식 스피커장치(400)는 사용자의 음성을 인식하여 작동되는 음성인식 스피커장치이다.

이때, 본 발명의 일 실시예에 따른 음성인식 스피커장치(400)는 도 1 및 도 2에 도시된 바와 같이 서로 탈착 가능한 복수의 모듈(100,200,300) 구조로 형성됨으로써 필요에 따라 다양한 형태의 스피커장치로 구현될 수 있다.

이를 위해, 본 발명의 일 실시예에 따른 음성인식 스피커장치(400)는 베이스 모듈(100)과 제1 모듈(200)을 포함할 수 있다.

먼저, 베이스 모듈(100)은 본 발명의 일 실시예에 따른 음성인식 스피커장치(400)의 기본 기능을 수행하는 모듈로서, 도 1에 도시된 바와 같이 제1 모듈(200)과 결합된 상태 또는 도 2에 도시된 바와 같이 제1 모듈(200)과 분리된 상태에서 모두 작동 가능할 수 있다. 즉, 베이스 모듈(100)은 제1 모듈(200)의 결합 여부와 상관없이 음성인식 스피커장치(400)로서 기능할 수 있다.

본 발명의 일 실시예에서, 베이스 모듈(100)은 마이크(130), 스피커(140), 발광부(190), 통신부(160) 및 제어부(150)를 포함할 수 있다.

마이크(130)는 음성인식 스피커장치(400)가 설치되는 공간에서 발생되는 다양한 음향 정보를 수집하기 위한 것으로서, 일례로 도 3에 도시된 바와 같이 복수 개(131 내지 138)가 베이스 모듈(100)의 둘레 방향을 따라 서로 이격되어 배치될 수 있다.

이때, 복수 개의 마이크(131 내지 138)는 각각 인접한 영역에서 발생되는 음향 정보(A1, A2)를 독립적으로 수집하여 후술될 제어부(150) 측으로 전달할 수 있다. 이를 통해 본 발명의 일 실시예에 따른 음성인식 스피커장치(400)는 어느 일 방향에 편중됨이 없이 다양한 음향 정보(A1, A2)를 입체적으로 수집할 수 있다.

그 결과, 제어부(150)는 복수의 화자로부터 발화된 복수의 음성을 구별하여 인식할 수 있어 보다 정밀한 음성인식이 가능한데, 이에 대한 설명은 후술하기로 한다.

다음으로, 스피커(140)는 제어부(150)로부터 출력 정보를 전달받은 후, 상기 출력 정보에 기초한 음파 형태의 소리 정보(N1)를 음성인식 스피커장치(400)의 외측으로 전송할 수 있다.

이때, 소리 정보(N1)는 일례로, 음악 또는 날씨, 교통, 뉴스 등을 포함하는 생활 정보 일 수 있다. 특히 소리 정보(N1)는 마이크(130)를 통해 수집된 사용자(M1, M2)의 음성(S1, S2)에 포함된 명령, 예를 들어 음악재생 명령, 생활 정보 검색 명령과 같은 입력에 대응하는 출력 정보일 수 있다.

본 발명의 일 실시예에서, 스피커(140)는 도 10에 도시된 바와 같이 서로 이격되어 배치되는 복수의 스피커(141, 142)를 포함하는 다채널 스피커로 형성될 수 있다.

이때, 비제한적인 일례로서, 제1 스피커(141)는 음악 또는 생활 정보와 같이 사용자에게 전달하기 위한 소리 정보(N1)를 전달할 수 있다.

그리고, 제2 스피커(142)는 실내 공간 내에 존재하는 소음을 상쇄하기 위해(노이즈 캔슬링을 위해) 상기 소음과 반대되는 파형을 가지는 상쇄 정보를 전달할 수 있다. 이를 통해 본 발명의 일 실시예에 따른 음성인식 스피커장치(400)는 소음(노이즈)이 제거된 상태의 청취 환경을 제공할 수 있다.

그러나, 상술한 예와 달리 제1 스피커(140)와 제2 스피커(140)는 동일하게 소리 정보(N1)를 전달하는 스피커로서 기능할 수도 있다.

한편, 본 발명의 일 실시예에서, 마이크(130)와 스피커(140)의 개수는 도시된 예에 한정되는 것은 아니며, 설계에 따라 다양한 개수의 마이크(130)와 스피커(140)를 포함할 수 있음을 밝혀 둔다.

본 발명의 일 실시예에 따른 음성인식 스피커장치(400)는 사용자의 음성 입력에 따라 반응하여 발광되는 발광부(190)를 포함할 수 있다.

이때, 발광부(190)는 일례로 LED 램프로 이루어질 수 있으며, 상술한 마이크(130)에 기준치 이상의 음향 정보(A1, A2)가 입력되는 경우에 선택적으로 점등됨으로써 사용자(M1, M2)에게 음향 정보(A1, A2)가 정상적으로 입력되었음을 알려줄 수 있다.

그 결과, 사용자(M1, M2)는 발광부(190)의 발광 여부를 확인함으로써, 자신의 음성이 정상적으로 음성인식 스피커장치(400)에 입력되었는지 여부를 즉각적으로 확인할 수 있다.

본 발명의 일 실시예에서, 발광부(190)는 마이크(130)와 유사하게 복수 개의 발광부재(191, 192, 193, 194)를 포함하여 이루어질 수 있다. 이때, 도 3을 참조하면, 복수 개의 발광부재(191, 192, 193, 194)는 각각 마이크(130)를 구성하는 개별 마이크(131 내지 138)와 인접하여 배치될 수 있으며, 이에 따라 상기 개별 마이크(131 내지 138)와 서로 한 쌍을 이룰 수 있다.

이때, 개별 마이크(131 내지 138) 중 어느 하나에 음향 정보(A1, A2)가 수집될 경우, 이와 대응되는 발광부재(191, 192, 193, 194)가 발광될 수 있다.

이를 통해, 서로 이격되어 위치하는 복수의 화자가 순차적으로 또는 동시에 발화할 때, 복수의 화자는 복수의 마이크(131 내지 138) 중 어떠한 마이크가 자신의 음성을 포함하는 음향 정보(A1, A2)를 수집하였는지 신속하게 확인할 수 있다. 또한, 각각의 화자는 발광부재(191, 192, 193, 194)의 발광 상태를 확인하면서 음성을 전달하기에 최적의 위치를 용이하게 파악하거나, 발화 타이밍을 선택할 수 있다.

본 발명의 일 실시예에 따른 음성인식 스피커장치(400)는 외부 기기(500)와 정보를 송수신할 수 있는 통신부(160)를 포함할 수 있다.

이때, 통신부(160)는 정보를 송수신하기 위하여, 일례로 휴대전화와 같은 휴대용 단말기, 서버 또는 개인용 컴퓨터와 같은 외부 기기(500)와 무선 통신 또는 유선 통신을 이용하여 연결될 수 있다.

이를 통해 본 발명의 일 실시예에 따른 음성인식 스피커장치(400)는 외부 날씨 또는 뉴스와 같은 생활 정보를 수신 받은 후, 이를 스피커(140)를 통한 소리 정보로 변환하여 사용자에게 제공하거나, 마이크(130)를 통해 입력된 사용자(M1, M2)의 음성 및 후술될 센서부(210)를 통해 수집된 실내환경 정보를 외부 기기(500) 측으로 전송할 수 있다.

본 발명의 일 실시예에 따른 음성인식 스피커장치(400)는 베이스 모듈(100)의 마이크(130), 스피커(140), 발광부(190) 및 통신부(160)의 작동을 통합적으로 제어하는 제어부(150)를 포함할 수 있다.

이때, 제어부(150)는 베이스 모듈(100) 외에도 후술될 제1 모듈(200)을 포함하여 이들(100, 200)이 서로 유기적으로 작동하도록 통합적으로 제어할 수 있다. 이와 관련하여 이해를 돕기 위해 제어부(150)에 대한 전체적인 설명은 제1 모듈(200)에 대한 설명을 완료한 후에 함께 기술하기로 한다.

다시 도 1을 참조하면, 베이스 모듈(100)은 사용자가 음성인식 스피커장치(400)의 작동을 제어할 수 있도록 일측에(예를 들면 도면에 도시된 바와 같이 상부면에) 조작버튼(112)을 구비할 수 있다.

이때, 조작버튼(112)은 물리식 버튼 또는 터치식 버튼일 수 있다. 또한 조작버튼(112)은 비제한적인 일례로서, 전원버튼, 음량 조절 버튼 또는 일시적으로 마이크(130) 또는 스피커(140)를 비활성화시키기 위한 음소거 버튼 등일 수 있다.

그리고, 베이스 모듈(100)은 사용자에게 메시지를 시각적으로 제공하기 위한 디스플레이(111)를 포함할 수도 있다.

예를 들면, 디스플레이(111)는 음성인식 스피커장치(400)의 작동상태를 문자 형태로 제공하거나, 스피커(140)를 통해 전송되는 소리 정보(N1)를 문자 형태로 함께 제공할 수 있다.

그리고, 베이스 모듈(100)은 도 4에 도시된 바와 같이 지면(또는 탁자와 같은 거치대)과 접하는 하부면 상에 스피커(140)의 출력시 발생되는 진동을 감쇄시키도록 진동감쇄부재(121)를 포함할 수 있다.

이때, 진동감쇄부재(121)는 예를 들면 고무와 같이 탄성력을 가지는 소재로 형성될 수 있다. 이를 통해 본 발명의 일 실시예에 따른 음성인식 스피커장치(400)는 스피커(140)의 출력 시 지면 측으로 진동이 전달되는 것을 방지할 수 있으며, 스피커(140)의 진동에 따라 지면이 함께 진동함으로써 스피커(140)의 음질이 저하되는 것을 방지할 수 있다.

한편, 본 발명의 일 실시예에 따른 음성인식 스피커장치(400)의 베이스 모듈(100)은 도 3 및 도 4에 도시된 바와 같이, 제1 부분(110) 및 제2 부분(120)을 포함하는 복수의 부분으로 분리 가능하게 형성될 수 있다.

이를 통해, 베이스 모듈(100)과 제1 모듈(200)을 서로 결합시킬 때, 도면에 개시된 바와 같이 분리된 베이스 모듈(100) 사이에 제1 모듈(200)을 개재시키는 형태로 결합시킬 수 있다.

이처럼 베이스 모듈(100) 사이에 제1 모듈(200)을 개재시킬 경우, 베이스 모듈(100)과 제1 모듈(200)을 단순히 적층시키는 형태와 비교하여, 상면부에 디스플레이(111) 및 조작버튼(112)을 배치시킴과 동시에 하면부에 진동감쇄부재(121)를 배치시킬 수 있어, 제1 모듈(200) 측에 별도의 진동감쇄부재(121)를 형성하는 것을 생략할 수 있다.

또한, 베이스 모듈(100)의 제1 부분(110)과 제2 부분(120)이 각각 제1 모듈(200)의 상부와 하부 측에 분리되어 결합됨으로써, 제1 모듈(200)에 가해지는 하중을 감소시킬 수 있으며, 제1 모듈(200)의 상부와 하부에 모두 베이스 모듈(100)이 결합됨으로써 보다 안정적인 결합 상태를 형성할 수 있다.

이와 관련하여, 베이스 모듈(100)과 제1 모듈(200)은 서로 전기적으로 연결되어야 하고, 분리가 용이하지 않도록 결속력 있는 결합 관계를 형성하여야 한다. 이를 위해 베이스 모듈(100)과 제1 모듈(200)은 각각 일측에 연결부(170,170',270,270')와 결합부(180,180',280,280')를 구비할 수 있다. 이와 관련된 설명은 설명의 편의상 제1 모듈(200)에 대한 설명을 마친 후에, 전체적으로 설명하기로 한다.

본 발명의 일 실시예에 따른 음성인식 스피커장치(400)는 베이스 모듈(100)의 기능을 보강하거나, 베이스 모듈(100)에 새로운 기능을 부가하기 위한 제1 모듈(200)을 포함할 수 있다.

기능 보강과 관련된 비제한적인 일례로서, 제1 모듈(200)은 상기 베이스 모듈(100)에 내장된 스피커(140)의 출력을 보강할 수 있도록 추가 스피커(140)를 포함할 수 있다.

이를 통해 본 발명의 일 실시예에 따른 음성인식 스피커장치(400)는 필요한 경우, 제1 모듈(200)을 결합시켜 보다 큰 출력의 음파를 실내 측으로 전송할 수 있다. 또한, 베이스 모듈(100)에 내장된 스피커(140)와 전송 방향을 서로 달리함으로써 보다 다양한 방향으로 소리 정보(N1)를 전달할 수 있다.

다른 일례로서, 제1 모듈(200)은 베이스 모듈(100)에 내장된 마이크(130) 외 추가적인 마이크(미도시)를 포함할 수 있다. 이러한 제1 모듈(200)을 통해, 예를 들면 화자의 수가 일정 인원을 초과하는 경우와 같이 보다 정밀한 음향 정보(A1, A2)의 수집이 필요한 경우, 이에 대한 적절한 대처가 가능하다.

이와 달리, 새로운 기능 추가와 관련된 예시적인 일례로서, 제1 모듈(200)은 실내환경 정보를 계측하는 센서부(210)를 포함할 수 있다.

이때, 센서부(210)는 일례로 초음파 센서 등으로 형성됨으로써 보다 정밀한 음향 정보(A1, A2)의 분석을 위해 음원과 음성인식 스피커장치(400)와의 거리를 감지할 수 있다.

또한, 센서부(210)는 실내 온도나 습도를 감지하기 위한 온습도 센서, 미세먼지 등으로 인한 공기오염 정도를 감지하기 위한 공기질 센서 또는 라돈, 유해가스 등의 유해물질의 생성을 즉각적으로 감지하기 위한 환경 센서 또는 화재 감지 여부를 감지하기 위한 화재 센서 등으로 형성될 수도 있다.

이와 같이 센서부(210)에 의해 수집된 다양한 정보는 마이크(130)를 통해 사용자(M1, M2)의 요청이 있거나, 정기적인 간격 또는 해당 이벤트의 발생 시에 자동적으로 스피커(140)를 통해 음성 형태로 전달될 수 있다. 또한 상기 실내환경 정보는 통신부(160)를 통해 외부 기기(500) 측으로 전송될 수도 있다.

한편, 전술한 바와 같이 제1 모듈(200)은 베이스 모듈(100)과 탈착 가능하게 결합되어 전기적으로 연결될 수 있다. 이를 위해 제1 모듈(200)과 베이스 모듈(100)은 도 3 및 도 4에 도시된 바와 같이 각각 일측에 제1 연결부(170)와 제2 연결부(270)를 구비할 수 있다.

구체적인 일례로서, 제1 연결부(170)는 전도성 재질로 형성된 단자부재(171)를 포함할 수 있다. 이러한 단자부재(171)는 도 5에 도시된 바와 같이, 베이스 모듈(100)의 내측으로 오목하게 형성된 수용홈(172)의 내부에 배치되거나, 베이스 모듈(100)의 일면 상에 노출된 형태로 배치될 수 있다.

그리고, 제2 연결부(270)는 제1 모듈(200) 중 제1 연결부(170)와 대응되는 위치에 배치되며, 단자부재(171)와 접촉되도록 단자부재(171) 측으로 돌출되어 형성되는 돌출부재(271)를 포함할 수 있다.

이때, 돌출부재(271)는 단자부재(171)와 접촉시 전기를 통전시키도록 단자부재(171)와 동일하게 전도성 재질로 형성될 수 있다.

비제한적인 일례로서, 돌출부재(271)는 도 5에 도시된 바와 같이 제1 연결부(170)의 수용홈(172)에 삽입되는 형태로 단자부재(171)와 접촉될 수 있다.

보다 상세하게, 제2 연결부(270)는 도 5에 도시된 바와 같이 외측에 나사산(275)이 형성되어 제1 모듈(200)의 일측에 나사 결합되는 고정부재(273)를 포함할 수 있다. 그리고, 제2 연결부(270)는 고정부재(273)의 내부에 형성된 수용공간(272)에 스프링과 같이 탄성력을 가지는 가압부재(272)를 포함함으로써, 가압부재(272)의 상측에 배치된 돌출부재(271)를 단자부재(171) 측으로 가압할 수 있다.

즉, 제2 연결부(270)는 전체적으로 포코 핀(Pogo pin) 또는 스프링 플런저(Spring plunger)와 유사한 구조를 가질 수 있다.

이를 통해 제2 연결부(270)는 스피커(140)의 진동에도 불구하고 제1 연결부(170)와 안정적인 접촉 상태를 유지함으로써, 베이스 모듈(100)과 제1 모듈(200) 사이의 안정적인 전기적 연결을 확보할 수 있다.

그러나, 도면에 도시된 제2 연결부(270)의 예시는 본 발명의 일 실시예에 불과하며, 이 외에도 일례로 가압부재(272)와 고정부재(273)가 생략된 구조 등 제1 연결부(170)의 단자부재(171)와 접촉될 수 있는 형태라면 제한 없이 다양한 구조의 제2 연결부(270)가 적용될 수 있다.

다시 도 3 내지 도 5를 참조하면, 본 발명의 일 실시예에서, 베이스 모듈(100)이 제1 부분(110)과 제2 부분(120)으로 분리 가능하게 형성되고, 제1 모듈(200)이 그 사이에 개재되어 결합되는 경우, 베이스 모듈(100)의 제2 부분(120)의 일측에는 상술한 제1 모듈(200)의 제2 연결부(270)와 동일한 구조를 가지는 제3 연결부(170')가 구비될 수 있다. 또한, 제1 모듈(200) 중에서 상기 제3 연결부(170')에 대응되는 부분에는 상술한 베이스 모듈(100)의 제1 연결부(170)와 동일한 구조를 가지는 제4 연결부(270')가 구비될 수 있다.

이를 통해, 베이스 모듈(100)이 도 2에 도시된 바와 같이 제1 모듈(200)과 분리되어 독립적으로 작동되는 경우에는 제1 연결부(170)와 제3 연결부(170')가 서로 전기적으로 연결될 수 있다.

이와 달리 베이스 모듈(100)과 제1 모듈(200)이 서로 결합되어 작동되는 경우에는 제1 연결부(170)와 제2 연결부(270)가 서로 연결되고, 제3 연결부(170')와 제4 연결부(270')가 서로 연결될 수 있다.

그 결과, 베이스 모듈(100)의 제1 부분(110)과 제2 부분(120)은 제1 모듈(200)의 결합 여부와 상관없이 항상 동일한 구조의 전기적 연결을 달성할 수 있다. 다만, 제1 부분(110)과 제2 부분(120) 사이의 전기적 연결이 불필요한 경우에는 상술한 제3 연결부(170')와 제4 연결부(270')는 생략될 수도 있다.

한편, 상술한 설명에서는 베이스 모듈(100) 측에 제1 연결부(170)와 제3 연결부(170')가 구비되고, 제1 모듈(200) 측에 제2 연결부(270)와 제4 연결부(270')가 구비되는 것을 상정하여 기술하였으나, 이와 반대로 베이스 모듈(100) 측에 제2 연결부(270)와 제4 연결부(270')가 구비되고, 제1 모듈(200) 측에 제1 연결부(170)와 제3 연결부(170')가 구비될 수도 있다.

또한, 제1 연결부(170) 내지 제4 연결부(270')는 각각 복수 개가 베이스 모듈(100) 또는 제1 모듈(200)의 일측 또는 타측에 서로 이격되어 배치됨으로써 보다 안정적인 전기적 연결을 확보할 수도 있다.

다시 도 3 내지 도 5를 참조하면, 본 발명의 일 실시예에 따른 음성인식 스피커장치(400)는 베이스 모듈(100)과 제1 모듈(200)을 안정적으로 결합시키기 위하여 제1 결합부(180)와 이에 대응되는 제2 결합부(280)를 포함할 수 있다.

비제한적인 일례로서, 제1 결합부(180)는 베이스 모듈(100) 중 제1 모듈(200)과 마주보는 일측에 형성되며, 자성 물질로 형성된 자성부재(181)를 구비할 수 있다. 이때, 상기 자성부재(181)는 제1 연결부(170)의 단자부재(171)와 유사하게 베이스 모듈(100)의 내측으로 오목하게 형성된 수용홈의 내부에 배치될 수도 있다.

상기 제1 결합부(180)에 대응되는 제2 결합부(280)는 제1 모듈(200) 중 제1 결합부(180)에 대응되는 위치에 형성되며, 상기 자성부재(181)에 대하여 자기력을 인가하도록 자석부재(281)를 구비할 수 있다.

이처럼 제1 결합부(180)와 제2 결합부(280)가 자성부재(181)와 자석부재(281)로 형성될 경우, 베이스 모듈(100)과 제1 모듈(200) 측에 별도의 결합구조, 일례로 홈 및 이에 삽입되는 돌출 구조의 형성을 생략한 상태에서도 안정적인 결합을 형성할 수 있다.

또한 자성부재와 자석부재의 일부가 중첩되어 배치된 상태에서, 베이스 모듈(100)과 제1 모듈(200)이 소정 간격 어긋난 위치에 있더라도 상기 자성부재(181)와 자석부재(281) 사이의 인력에 의하여 용이하게 위치를 정렬할 수 있다.

도면에는 도시되지 않았으나, 제1 결합부(180)와 제2 결합부(280)의 다른 일례로서, 제1 결합부(180)는 상술한 제1 연결부(170)의 수용홈(172)과 유사하게 홈 구조로 형성될 수 있다. 그리고, 제2 결합부(280)는 홈 구조의 제1 결합부(180)에 삽입되어 끼워 맞춤 가능하도록 돌출된 형태로 형성될 수 있다.

그러나, 제1 결합부(180)와 제2 결합부(280)의 구조가 상술한 예시로 제한되는 것은 아니며, 이외에도 공지의 암/수체결부 구조가 채택될 수도 있다.

더불어, 베이스 모듈(100)의 제2 부분(120)에는 제1 결합부(180)와 결합 가능한 제3 결합부(180')가 형성될 수 있으며, 제1 모듈(200)의 다른 일측에는 상기 제3 결합부(180')와 결합가능한 제4 결합부(280')와 형성될 수 있다. 이러한 제1 결합부(180) 내지 제4 결합부(280') 사이의 상호 관계는 상술한 제1 연결부(170) 내지 제4 연결부(270')의 관계와 서로 유사하므로 상술한 설명으로 대체하기로 한다.

그리고, 상술한 설명에서는 베이스 모듈(100) 측에 제1 결합부(180)가 구비되고, 제1 모듈(200) 측에 제2 결합부(280)가 구비되는 것을 가정하여 설명하였으나, 제1 결합부(180)와 제2 결합부(280)가 서로 반대의 위치에 형성될 수도 있다.

또한, 전기적 연결을 위한 제1 연결부(170)와 제2 연결부(270)가 상술한 예시와 같이 각각 수용홈(172) 및 돌출부재(271)를 구비하여 맞춤 결합됨으로써 상기 제1 연결부(170) 및 제2 연결부(270) 만으로도 물리적으로 안정적인 결합력이 확보될 경우, 제1 결합부(180) 및 제2 결합부(280)는 생략이 가능하며 이에 따라 제조 공정을 단순화하고 비용을 절감할 수 있다.

한편, 도 6을 참조하면, 본 발명의 일 실시예에 따른 음성인식 스피커장치(400)는 제1 모듈(200) 외에 제2 모듈(300), ??. 제n 모듈(미도시)를 더 포함할 수도 있다.

이때, 제2 모듈(300), ??. 제n 모듈은 제1 모듈(200)과 동일하게 베이스 모듈(100)의 기능을 보강하거나, 새로운 기능을 부가하기 위해 음성인식 스피커장치(400)를 구성하는 각 모듈 중 일부와 서로 결합될 수 있다.

이하, 도면을 참조하여, 본 발명의 일 실시예에 따른 음성인식 스피커장치(400)의 제어부(150)가 각 모듈(100,200,300)을 통합적으로 제어하는 것에 대하여 상세히 설명하기로 한다.

도 7을 참조하면, 제어부(150)는 마이크(130) 및 센서부(210)로부터 정보를 전달받을 수 있다. 여기서, 마이크(130)로부터 전달되는 정보는, 사용자(M1, M2)의 음성을 포함한 음성인식 스피커장치(400) 주변의 음향 정보(A1, A2)일 수 있으며, 센서부(210)로부터 전달되는 정보는 상술한 실내환경 정보 등일 수 있다.

이때, 앞서 살펴본 바와 같이, 베이스 모듈(100)과 제1 모듈(200)이 서로 전기적으로 연결되므로 제1 모듈(200) 측에 내장되는 센서부(210) 및 추가 마이크로부터 베이스 모듈(100) 측으로 정보가 용이하게 전달될 수 있다.

한편, 제어부(150)를 통해 전달된 정보는 도면에 도시된 바와 같이, 신호 처리를 거쳐 스피커(140)를 통해 소리 정보(N1)의 형태로 재생되거나, 통신부(160)를 통해 외부 기기(500) 측으로 전달될 수 있다.

본 발명의 일 실시예에서, 제어부(150)는 복수의 마이크(131 내지 138)로부터 수집된 복수의 음향 정보(A1, A2)를 통합적으로 분석할 수 있다. 즉, 제어부(150)는 복수의 마이크(131 내지 138)로부터 수집된 음향 정보를 단순히 입력 받아 개별적으로 처리하는 것이 아니라, 복수의 음향 정보(A1, A2)를 종합적으로 고려하여 복수의 음향 정보(A1, A2)에 포함된 사용자의 음성 등을 보다 정확히 인식할 수 있다.

이와 관련된 구체적인 일례로서, 도 8을 참조하면, 복수의 마이크 중 제1 마이크(130)는 이와 인접한 제1 사용자(M1)로부터 발화된 제1 음성(S1)과, 제1 사용자(M1)와 이격되어 위치하는 제2 사용자(M2)로부터 발화된 제2 음성(S2)을 포함하여 복합적인 정보를 가지는 제1 음향 정보(A1)를 수집할 수 있다. 유사한 원리로, 제2 마이크(130)는 인접한 제2 사용자(M2)로부터 발화된 제2 음성(S2)과, 제1 사용자(M1)로부터 전달된 제1 음성(S1)을 포함하는 제2 음향 정보(A2)를 수집할 수 있다.

이와 같이 수집된 제1 음향 정보(A1)와 제2 음향 정보(A2)는 모두 제어부(150) 측으로 전달될 수 있으며, 그 파형을 개략적으로 도시하면 도 9와 같은 형태일 수 있다.

이때, 제어부(150)는 입력된 제1 음향 정보(A1)와 제2 음향 정보(A2)를 종합적으로 연산할 수 있으며, 일례로, 도 9에 도시된 바와 같이, 제1 음향 정보(A1) 중에서 제2 음성(S2)에 대응되는 음향 성분을 노이즈로 처리하거나, 제2 음향 정보(A2) 중에서 제1 음성(S1)에 대응되는 음향 성분을 노이즈로 처리하는 연산을 수행할 수 있다.

이때, 제1 음향 정보(A1) 중에서 제2 음성(S2)에 대응되는 음향 성분을 추출함에 있어서, 제어부(150)는 제1 음향 정보(A1)와 제2 음향 정보(A2)의 파형을 서로 비교하거나, 센서부(210)로부터 전달된 사용자(M1, M2)와 마이크(130) 사이의 거리 정보를 고려할 수 있다.

이러한 과정을 통해 본 발명의 일 실시예에 따른 음성인식 스피커장치(400)는 복수의 화자의 음성 성분이 포함된 음향 정보로부터 단일한 화자의 음성 성분만을 정확하게 인식할 수 있어, 다중 화자가 포함된 사용 환경에서도 높은 음성 인식율을 확보할 수 있다.

통합적인 음향 정보 분석과 관련된 다른 일례로서, 제어부(150)는 음향 정보(A1, A2)를 분석하는 경우, 사용자(M1, M2)의 발화 시점과 동시간대에 스피커(140)를 통해 출력되는 소리 정보(N1) 또는 주변 소음(N2)을 노이즈로 인식하여 처리할 수 있다.

보다 상세하게, 도 10을 참조하면, 제1 마이크(130)에는 사용자(M1, M2)의 음성(S1, S2) 뿐만 아니라, 스피커(140) 통해 재생되는 음악 등의 소리 정보(N1)가 함께 수집될 수 있는데, 제어부(150)는 상기 소리 정보(N1)를 사전에 저장해 두었다가 제1 음향 정보(A1)의 분석시 이를 노이즈 성분으로 인식하여 사용자의 음성(S1, S2)에 대응되는 성분 만을 용이하게 인식할 수 있다.

또한, 제어부(150)는 제1 마이크(130)와 이격되어 위치하는 별도의 마이크(예를 들면, 제4 마이크(134) 내지 제6 마이크(136))를 통해 수집되는 주변 소음(N2)에 관한 성분을 제1 음향 정보(A1)에서 제외함으로써 음성 인식율을 향상시킬 수도 있다.

한편, 본 발명의 일 실시예에 따른 음성인식 스피커장치(400)는 사용자의 음성을 기록 또는 저장하기 위한 음성인식 시스템(600)에 적용될 수 있다.

구체적으로, 도 11을 참조하면, 음성인식 시스템(600)이 화상회의에 이용될 경우, 제어부(150)는 상술한 바와 같이 복수의 화자 중에서 개별 화자가 발화한 음성을 각각 구별하여 인식한 후, 이를 통신부(160)를 통해 외부 출력 장치(500)로 전송할 수 있다.

그 후, 외부 출력 장치(500)는 전달받은 정보를 토대로 각 화자의 발언 시점을 고려하여 발언 내용을 순차적으로 도시할 수 있다.

이를 통해, 회의에 참석 중인 복수의 화자가 자신 및 타인의 발언 내용을 즉각적으로 확인할 수 있으며, 속기록 또는 회의록을 실시간으로 작성할 수 있다.

또한 상기 외부 출력 장치(500)가 원거리에서 화상회의에 참석 중인 참석자에게 제공될 경우, 음성인식 스피커장치(400)를 통해 다중화자의 음성이 동시에 입력되더라도, 상기 화상회의 참석자가 용이하게 개개인의 발언 내용을 확인할 수 있다.

이러한 음성인식 시스템(600)은 상술한 회의 외에도 홈 스쿨링, 진료 기록, 화상회의 또는 세미나 등 사용자의 음성을 기록하거나 공유하는 것이 필요한 다양한 사용환경에 적용될 수 있다.

이상에서 본 발명의 일 실시예에 대하여 설명하였으나, 본 발명의 사상은 본 명세서에 제시되는 실시 예에 제한되지 아니하며, 본 발명의 사상을 이해하는 당업자는 동일한 사상의 범위 내에서, 구성요소의 부가, 변경, 삭제, 추가 등에 의해서 다른 실시 예를 용이하게 제안할 수 있을 것이나, 이 또한 본 발명의 사상범위 내에 든다고 할 것이다.

100: 베이스 모듈 110: 제1 부분
120: 제2 부분 130: 마이크
140: 스피커 150: 제어부
160: 센서부 170: 제1 연결부
180: 제1 결합부 190: 발광부
200: 제1 모듈 210: 센서부
240: 추가 스피커 270: 제2 연결부
280: 제2 결합부 300: 제2 모듈
400: 음성인식 스피커장치 500: 외부 기기
600: 음성인식 시스템
M1, M2: 사용자 S1, S2: 음성
A1, A2: 음향 정보 N1: 소리 정보
N2: 주변 소음

Claims

사용자의 음성을 인식하여 작동되는 음성인식 스피커장치에 있어서,
마이크, 스피커 및 상기 마이크로부터 전달된 음향 정보에 기초하여 상기 스피커를 제어하는 제어부를 포함하는 베이스 모듈; 및
상기 베이스 모듈에 탈착 가능하게 결합되며, 상기 제어부에 의해 상기 베이스 모듈과 통합적으로 제어되는 제1 모듈;을 포함하고,
상기 베이스 모듈에 상기 제1 모듈이 결합된 상태 및 분리된 상태에서 모두 작동 가능하도록 형성되는 음성인식 스피커장치.
제1 항에 있어서,
상기 베이스 모듈은 제1 부분 및 제2 부분을 포함하는 복수의 부분으로 분리 가능하도록 형성되고,
상기 제1 모듈은 상기 제1 부분과 상기 제2 부분 사이에 개재되는 음성인식 스피커장치.
제2 항에 있어서,
상기 복수의 부분은 상하 방향으로 적층되어 상기 베이스 모듈을 형성하는 음성인식 스피커장치.
제1 항에 있어서,
상기 베이스 모듈 및 상기 제1 모듈 중 어느 하나는 단자부재를 포함하는 제1 연결부를 구비하고,
상기 베이스 모듈 및 상기 제1 모듈 중 다른 하나는 상기 단자부재와 접촉되도록 상기 단자부재 측으로 대향 형성되는 돌출부재를 포함하는 제2 연결부를 구비하는 음성인식 스피커장치.
제4 항에 있어서,
상기 제1 연결부는 상기 베이스 모듈 또는 상기 제1 모듈의 내측으로 오목하게 형성된 수용홈을 더 포함하고, 상기 단자부재는 상기 수용홈의 내부에 배치되는 음성인식 스피커장치.
제4 항에 있어서,
상기 제2 연결부는 상기 돌출부재를 상기 단자부재 측으로 가압하는 가압부재를 더 포함하는 음성인식 스피커 장치.
제1 항에 있어서,
상기 베이스 모듈 및 상기 제1 모듈 중 어느 하나는 외측 일부에 자성 물질로 형성된 자성부재를 구비하고,
상기 베이스 모듈 및 상기 제1 모듈 중 다른 하나는 상기 자성부재에 대하여 자기력을 인가하도록 상기 자성부재와 대응되는 위치에 배치되는 자석부재를 구비하는 음성인식 스피커 장치.
제1 항에 있어서,
상기 제1 모듈은 환경 정보를 계측하는 센서부를 구비하는 음성인식 스피커 장치.
제8 항에 있어서,
상기 환경 정보는 음원과의 거리, 온도, 습도, 공기오염 정도 및 유해물질 농도 중 적어도 어느 하나인 음성인식 스피커 장치.
제1 항에 있어서,
상기 제1 모듈은 상기 베이스 모듈에 포함된 스피커의 출력을 보강하도록 추가 스피커를 구비하는 음성인식 스피커 장치.
제1 항에 있어서,
상기 베이스 모듈 및 상기 제1 모듈 중 적어도 어느 하나와 탈착 가능하게 결합되며, 상기 제어부에 의해 상기 베이스 모듈 및 상기 제1 모듈과 통합적으로 제어되는 제2 모듈을 더 포함하는 음성인식 스피커 장치.
제1 항에 있어서,
상기 제어부는 상기 음향 정보를 분석하는 경우, 상기 스피커를 통해 출력된 소리 정보를 노이즈로 처리하는 음성인식 스피커 장치.
제1 항에 있어서,
상기 마이크는 상기 베이스 모듈의 둘레 방향을 따라 이격 배치되는 복수의 마이크를 포함하고,
상기 제어부는 상기 복수의 마이크로부터 각각 수집된 복수의 음향 정보를 통합적으로 분석하는 음성인식 스피커 장치.
제13 항에 있어서,
상기 베이스 모듈은 상기 복수의 마이크를 구성하는 개별 마이크와 각각 대응되도록 상기 개별 마이크 각각과 인접하여 배치되는 복수의 발광부재를 포함하고,
상기 제어부는 상기 복수의 마이크 중 어느 하나의 개별 마이크에 음향 정보가 수집될 경우, 상기 어느 하나의 개별 마이크와 대응되는 발광부재가 발광되도록 제어하는 음성인식 스피커 장치.
제13 항에 있어서,
상기 복수의 마이크는, 제1 사용자로부터 발화되는 제1 음성을 포함한 제1 음향 정보를 수집하는 제1 마이크 및 제2 사용자로부터 발화되는 제2 음성을 포함한 제2 음향 정보를 수집하는 제2 마이크;를 포함하고,
상기 제어부는, 복수의 사용자로부터 동시간대에 발화된 복수의 음성을 각각 구별하여 인식하도록 상기 제1 음향 정보의 분석시 상기 제2 음성에 대응되는 음성 성분을 노이즈로 처리하고, 상기 제2 음향 정보의 분석시 상기 제1 음성에 대응되는 음성 성분을 노이즈로 처리하는 음성인식 스피커 장치.
제15 항에 따른 음성인식 스피커 장치; 및
상기 음성인식 스피커 장치로부터 상기 제1 사용자 및 상기 제2 사용자의 발화 정보를 전달받아 문자 형태로 출력하는 출력 장치;를 포함하는 음성인식 시스템.