KR101832058B1 - 음성 인식 시스템 및 방법 - Google Patents

음성 인식 시스템 및 방법 Download PDF

Info

Publication number
KR101832058B1
KR101832058B1 KR1020160066579A KR20160066579A KR101832058B1 KR 101832058 B1 KR101832058 B1 KR 101832058B1 KR 1020160066579 A KR1020160066579 A KR 1020160066579A KR 20160066579 A KR20160066579 A KR 20160066579A KR 101832058 B1 KR101832058 B1 KR 101832058B1
Authority
KR
South Korea
Prior art keywords
voice
recognition
speech recognition
information
voice information
Prior art date
Application number
KR1020160066579A
Other languages
English (en)
Other versions
KR20170135133A (ko
Inventor
김영민
정창용
Original Assignee
주식회사 엘지유플러스
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 엘지유플러스 filed Critical 주식회사 엘지유플러스
Priority to KR1020160066579A priority Critical patent/KR101832058B1/ko
Publication of KR20170135133A publication Critical patent/KR20170135133A/ko
Application granted granted Critical
Publication of KR101832058B1 publication Critical patent/KR101832058B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/20Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephonic Communication Services (AREA)

Abstract

미리 설정된 하나 이상의 영역에 설치되어, 상기 하나 이상의 영역으로부터 음성 정보를 수집하는 하나 이상의 음성 수집 장치, 상기 음성 정보를 직접 수신하거나 상기 음성 수집 장치로부터 상기 음성 정보를 수신하는 음성 인식 장치, 및 상기 음성 인식 장치로부터 상기 음성 정보를 수신하고, 상기 음성 정보를 기반으로 제어 대상 기기를 제어하는 음성 인식 서버를 포함하는 음성 인식 시스템을 제공한다.

Description

음성 인식 시스템 및 방법{SYSTEM AND METHOD FOR VOICE RECOGNITION}
본 발명의 실시예들은 음성 인식 시스템 및 방법에 관한 것이다.
가정 내의 조명, 에어컨, 커튼, 및 가스등의 기기들을 인터넷이나 기타 통신망을 통하여 원격으로 제어하는 홈 네트워크 시스템이 보급되고 있으며, 특히 음성으로 이들 기기들을 제어하는 음성 인식 시스템도 출시되고 있다.
음성 인식이란, 입력된 음성신호를 컴퓨터가 분석해 이를 텍스트로 인식 또는 이해하는 기술을 말하는데, 일반적인 음성 인식 장치는, 입력된 음성신호의 특징을 추출하여 특징 벡터로 변환시키고, 미리 구축된 음향 모델 데이터베이스, 어휘 모델 데이터베이스, 및 언어 모델 데이터베이스를 참조하여 비터비 알고리즘을 이용하여 상기 추출된 특징 벡터와 가장 유사한 인식 결과인 텍스트를 제공하도록 구현되어 있다.
일반적인 음성 인식 시스템은 복수의 영역에 동일한 복수의 음성 인식 장치를 구분하여 설치하고, 각각의 음성 인식 장치를 이용하여 사용자의 음성을 인식하여 네트워크의 음성 인식 서버로 전달하거나 음성 명령을 수행할 수 있다.
음성 인식 시스템이 영역 별로 음성 인식 장치가 별도로 구성되는 경우 각 음성 인식 장치에서 모드 및 명령에 대한 화자의 모든 음성을 인식하여야 하므로, 각각의 음성 인식 장치를 구성하여 구동시키려면 고성능, 고비용의 장치 사양이 필요하다.
또한, 홈 네트워크 기반의 음성 인식 시스템의 경우 하나의 영역 내의 음성 인식 장치가 관장하는 음성 인식 가능 거리에 한계가 있으므로, 화자의 음성 정보가 원활하게 전달되지 않을 수도 있다.
본 발명의 일실시예는 실내 환경에서 화자가 어느 위치에 있더라도 음성 인식이 가능하도록 하여, 다양한 홈 IoT 기기 제어 등 원할한 음성 인식 기반의 서비스를 제공하는 것을 목적으로 한다.
본 발명의 일실시예는 무선 통신 거리의 제약 상황을 극복하여 화자가 실내 어느 곳에 위치해 있는지 관계없이 어디서나 음성 인식 또는 음성 대화 서비스를 제공한다.
본 발명의 일실시예는 음성 인식 장치로 음성 정보를 수집하여 전달할 수 있는 음성 수집 장치를 설치함으로써, 저사양 및 저비용으로 광범위한 영역에 대한 음성 인식 시스템을 구축하는 것을 목적으로 한다.
본 발명의 일실시예에 따른 음성 인식 시스템은 미리 설정된 하나 이상의 영역에 설치되어, 상기 하나 이상의 영역으로부터 음성 정보를 수집하는 하나 이상의 음성 수집 장치, 상기 음성 정보를 직접 수신하거나 상기 음성 수집 장치로부터 상기 음성 정보를 수신하는 음성 인식 장치, 및 상기 음성 인식 장치로부터 상기 음성 정보를 수신하고, 상기 음성 정보를 기반으로 제어 대상 기기를 제어하는 음성 인식 서버를 포함한다.
본 발명의 일측에 따르면, 상기 하나 이상의 음성 수집 장치는 무선 통신 방식으로 상기 음성 정보를 다른 음성 수집 장치로 릴레이(relay) 하고, 상기 다른 음성 수집 장치는 상기 릴레이된 음성 정보를 상기 음성 인식 장치로 전송할 수 있다.
본 발명의 일실시예에 따른 음성 인식 장치는 하나 이상의 음성 수집 장치로부터 음성 정보를 수신하거나 직접 음성 정보를 수신하는 음성 수신부, 상기 음성 수신부를 통하여 수신된 하나 이상의 호출어를 인식하여, 상기 음성수집 장치로부터 상기 음성 정보를 수신하거나 직접 상기 음성 정보를 수신하도록 제어하는 음성 인식 처리부, 및 상기 음성 정보를 음성 인식 서버로 전송하는 음성 전송부를 포함한다.
본 발명의 일측에 따르면, 상기 음성 인식 처리부는 상기 하나 이상의 호출어를 기반으로 상기 하나 이상의 호출어에 대한 우선 순위를 결정하고, 상기 우선 순위에 따라 상기 호출어에 대응하는 하나 이상의 음성 수집 장치 및 상기 음성 인식 장치 중 어느 하나를 선택하며, 상기 음성 수신부는 상기 선택된 장치로부터 상기 음성 정보를 수신하고, 상기 음성 전송부는 상기 선택된 장치로부터 수신된 상기 음성 정보를 상기 음성 인식 서버로 전송할 수 있다.
본 발명의 일측에 따르면, 상기 음성 인식 처리부는 둘 이상의 호출어가 수신되는 경우, 호출어 수신 시간 또는 음성 인식 품질 중 어느 하나 이상을 기반으로 상기 우선 순위를 결정하고, 상기 우선 순위에 따라 호출어에 대응하는 하나 이상의 음성 수집 장치 및 상기 음성 인식 장치 중 어느 하나를 선택하여 상기 음성 정보를 수신하도록 제어할 수 있다.
본 발명의 일측에 따르면, 상기 음성 인식 처리부는 상기 하나 이상의 호출어에 대한 우선 순위를 결정하고, 상기 우선 순위에 따라 상기 호출어에 대응하는 하나 이상의 음성 수집 장치 및 상기 음성 인식 장치 중 어느 하나를 선택하며, 상기 하나 이상의 음성 수집 장치 및 상기 음성 인식 장치 중 선택되지 않은 장치에 음성 수신 대기 비활성화 요청할 수 있다.
본 발명의 일실시예에 따른 음성 수집 장치는 미리 설정된 하나 이상의 영역에 설치되어 음성 정보를 수집하고, 상기 음성 정보를 수신하는 음성 수신부, 상기 음성 수신부를 통하여 수신된 호출어를 인식하여, 상기 음성 정보를 수신하도록 제어하는 음성 인식 처리부, 및 상기 음성 정보를 상기 음성 인식 장치로 전송하는 음성 전송부를 포함한다.
본 발명의 일측에 따르면, 상기 음성 인식 처리부는 상기 음성 인식 장치에 의하여 결정되는 우선 순위에 따라, 상기 음성 인식 장치로부터 음성 수신 대기 명령 또는 수신 대기 비활성화 명령을 수신하고, 상기 수신 대기 명령 또는 상기 수신 대기 비활성화 명령에 따라 수신 대기 또는 수신 대기 비활성화되도록 제어할 수 있다.
본 발명의 일측에 따르면, 상기 음성 인식 처리부는 다른 음성 수집 장치와 서로 다른 호출어를 인식하여 상기 음성 정보를 수신하도록 제어할 수 있다.
본 발명의 일측에 따르면, 상기 음성 전송부는 무선 통신 방식으로 상기 음성 정보를 다른 음성 수집 장치로 릴레이(relay) 하고, 상기 다른 음성 수집 장치는 상기 릴레이된 음성 정보를 상기 음성 인식 장치로 전송할 수 있다.
본 발명의 일실시예에 따른 음성 인식 장치를 이용한 음성 인식 방법은 음성 정보를 직접 수신하거나 상기 하나 이상의 영역에 설치된 하나 이상의 음성 수집 장치로부터 상기 음성 정보를 수신하는 단계, 및 상기 음성 정보를 음성 인식 서버로 전송하는 단계를 포함하고, 상기 음성 인식 서버는 상기 음성 정보를 기반으로 제어대상기기를 제어할 수 있다.
본 발명의 일측에 따르면, 상기 하나 이상의 음성 수집 장치는 무선 통신 방식으로 상기 음성 정보를 다른 음성 수집 장치로 릴레이(relay) 하고, 상기 다른 음성 수집 장치는 상기 릴레이된 음성 정보를 상기 음성 인식 장치로 전송할 수 있다.
본 발명의 일실시예에 따른 음성 인식 장치의 음성 인식 하는 방법은 하나 이상의 음성 수집 장치로부터 음성 정보를 수신하거나 직접 음성 정보를 수신하는 단계, 수신된 하나 이상의 호출어를 인식하여, 상기 음성 수집 장치로부터 상기 음성 정보를 수신하거나 직접 상기 음성정보를 수신하도록 제어하는 단계, 및 상기 음성 정보를 음성 인식 서버로 전송하는 단계를 포함한다.
본 발명의 일측에 따른 음성 인식 장치의 음성 인식 하는 방법은 상기 하나 이상의 호출어를 기반으로 상기 하나 이상의 호출어에 대한 우선 순위를 결정하는 단계, 및 상기 우선 순위에 따라 상기 하나 이상의 음성 수집 장치 및 상기 음성 인식 장치 중 어느 하나를 선택하는 단계를 더 포함하고, 상기 음성 정보를 수신하는 단계는 상기 선택된 장치로부터 상기 음성 정보를 수신하는 단계를 포함하고, 상기 음성 정보를 전송하는 단계는 상기 선택된 장치로부터 수신된 상기 음성 정보를 상기 음성 인식 서버로 전송하는 단계를 포함할 수 있다.
본 발명의 일실시예에 따른 음성 인식 장치의 음성 인식 하는 방법은 상기 하나 이상의 호출어를 기반으로 상기 하나 이상의 호출어에 대한 우선 순위를 결정하는 단계, 상기 우선 순위에 따라 상기 호출어에 대응하는 상기 하나 이상의 음성 수집 장치 및 상기 음성 인식 장치 중 어느 하나를 선택하는 단계, 및 상기 하나 이상의 음성 수집 장치 및 상기 음성 인식 장치 중 선택되지 않은 장치에 음성 수신 대기 비활성화 요청하는 단계를 더 포함할 수 있다.
본 발명의 일실시예에 따른 미리 설정된 하나 이상의 영역에 설치된 하나 이상의 음성 수집 장치를 이용하여 음성 인식하는 방법은 호출어를 수신하는 단계, 상기 호출어가 인식된 경우, 음성 정보를 수신하는 단계, 및 상기 음성 정보를 상기 음성 인식 장치로 전송하는 단계를 포함한다.
본 발명의 일측에 따른 미리 설정된 하나 이상의 영역에 설치된 하나 이상의 음성 수집 장치를 이용하여 음성 인식하는 방법은 상기 음성 인식 장치에 의하여 결정되는 우선 순위에 따라, 상기 음성 인식 장치로부터 수신 대기 명령 또는 수신 대기 비활성화 명령을 수신하는 단계, 및 상기 수신 대기 명령 또는 상기 수신 대기 비활성화 명령에 따라 수신 대기 또는 수신 대기 비활성화되는 단계를 더 포함할 수 있다.
본 발명의 일측에 따르면, 상기 음성 정보를 수신하는 단계는 다른 음성 수집 장치와 서로 다른 호출어를 인식하여 상기 음성 정보를 수신하도록 제어하는 단계를 포함할 수 있다.
본 발명의 일측에 따른 미리 설정된 하나 이상의 영역에 설치된 하나 이상의 음성 수집 장치를 이용하여 음성 인식하는 방법은 무선 통신 방식으로 상기 음성 정보를 다른 음성 수집 장치로 릴레이(relay) 하는 단계를 더 포함하고, 상기 다른 음성 수집 장치는 상기 릴레이된 음성 정보를 상기 음성 인식 장치로 전송할 수 있다.
본 발명의 일실시예에 따른 음성 인식 서버는 음석 인식 장치로부터 음성 정보를 수신하는 음성 수신부, 및 상기 음성 정보가 하나 이상의 호출어인 경우, 상기 하나 이상의 호출어를 기반으로 상기 하나 이상의 호출어에 대한 우선 순위를 결정하고, 상기 우선 순위에 따라 상기 호출어에 대응하는 하나 이상의 음성 수집 장치 및 상기 음성 인식 장치 중 어느 하나를 선택하며, 상기 선택된 장치가 음성 수신 대기 하도록 제어하는 음성 인식 처리부를 포함한다.
본 발명의 일측에 따르면, 상기 음성 인식 처리부는 상기 호출어 수신 시간 또는 음성 인식 품질 중 어느 하나 이상을 기반으로 상기 우선 순위를 결정할 수 있다.
본 발명의 일측에 따르면, 상기 음성 인식 처리부는 상기 하나 이상의 음성 수집 장치 및 상기 음성 인식 장치 중 선택되지 않은 장치에 음성 수신 대기 비활성화 되도록 제어할 수 있다.
본 발명의 일실시예에 따르면 실내 환경에서 화자가 어느 위치에 있더라도 음성 인식이 가능하도록 하여, 다양한 홈 IoT 기기 제어 등 원할한 음성 인식 기반의 서비스를 제공할 수 있다.
본 발명의 일실시예에 따르면 무선 통신 거리의 제약 상황을 극복하여 화자가 실내 어느 곳에 위치해 있는지 관계없이 어디서나 음성 인식 또는 음성 대화 서비스를 제공할 수 있다.
본 발명의 일실시예에 따르면 음성 인식 장치로 음성 정보를 수집하여 전달할 수 있는 음성 수집 장치를 설치함으로써, 저사양 및 저비용으로 광범위한 영역에 대한 음성 인식 시스템을 구축할 수 있다.
도 1은 본 발명의 일실시예에 따른 음성 인식 시스템의 구성을 도시한 블록도이다.
도 2는 본 발명의 일측에 따른 음성 인식 시스템을 가정 내의 복수의 영역에 구성한 예를 도시한 도면이다.
도 3a 및 도 3b는 본 발명의 일측에 따른 음성 수집 장치의 구성을 도시한 블록도이다.
도 4a 및 도 4b는 본 발명의 일측에 따른 음성 인식 장치의 구성을 도시한 블록도이다.
도 5는 본 발명의 일실시예에 따른 음성 인식 서버의 구성을 도시한 도면이다.
도 6은 본 발명의 일실시예에 따른 음성 인식 방법을 도시한 흐름도이다.
도 7은 본 발명의 다른 실시예에 따른 음성 인식 방법을 도시한 흐름도이다.
도 8은 본 발명의 다른 실시예에 따른 음성 인식 방법을 도시한 흐름도이다.
이하 첨부 도면들 및 첨부 도면들에 기재된 내용들을 참조하여 본 발명의 실시예를 상세하게 설명하지만, 본 명세서에 개시되어 있는 본 발명의 개념에 따른 실시예들에 대해서 특정한 구조적 또는 기능적 설명들은 단지 본 발명의 개념에 따른 실시예들을 설명하기 위한 목적으로 예시된 것으로서, 본 발명의 개념에 따른 실시예들은 다양한 형태로 실시될 수 있으며 본 명세서에 설명된 실시예들에 한정되지 않는다.
본 발명의 개념에 따른 실시예들은 다양한 변경들을 가할 수 있고 여러 가지 형태들을 가질 수 있으므로 실시예들을 도면에 예시하고 본 명세서에 상세하게 설명하고자 한다. 그러나, 이는 본 발명의 개념에 따른 실시예들을 특정한 개시형태들에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 변경, 균등물, 또는 대체물을 포함한다
제1 또는 제2 등의 용어를 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만, 예를 들어 본 발명의 개념에 따른 권리 범위로부터 이탈되지 않은 채, 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소는 제1 구성요소로도 명명될 수 있다.
어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다. 구성요소들 간의 관계를 설명하는 표현들, 예를 들어 "~사이에"와 "바로~사이에" 또는 "~에 직접 이웃하는" 등도 마찬가지로 해석되어야 한다.
본 명세서에서 사용한 용어는 단지 특정한 실시예들을 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 명세서에서, "포함하다" 또는 "가지다" 등의 용어는 설시된 특징, 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것이 존재함으로 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
한편, 본 발명을 설명함에 있어서, 관련된 공지 기능 또는 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는, 그 상세한 설명을 생략할 것이다. 그리고, 본 명세서에서 사용되는 용어(terminology)들은 본 발명의 실시예를 적절히 표현하기 위해 사용된 용어들로서, 이는 사용자, 운용자의 의도 또는 본 발명이 속하는 분야의 관례 등에 따라 달라질 수 있다. 따라서, 본 용어들에 대한 정의는 본 명세서 전반에 걸친 내용을 토대로 내려져야 할 것이다.
다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 실시예가 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥 상 가지는 의미와 일치하는 의미를 가지는 것으로 해석되어야 하며, 본 명세서에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.
또한, 첨부 도면을 참조하여 설명함에 있어, 도면 부호에 관계없이 동일한 구성 요소는 동일한 참조 부호를 부여하고 이에 대한 중복되는 설명은 생략하기로 한다. 실시예를 설명함에 있어서 관련된 공지 기술에 대한 구체적인 설명이 실시예의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다.
본 발명의 일실시예에 따른 음성 인식 시스템은 실내 환경 곳곳에 화자의 음성 정보를 수집하여 전달할 수 있는 음성 수집 장치를 하나 이상 위치시키고, 무선 통신을 통해 네트워크를 구성하여 음성 인식 장치 또는 음성 인식 서버로 전달하도록 구성할 수 있다.
본 발명의 일측에 따른 음성 인식 시스템은 복수의 음성 수집 장치를 구성하는 경우, 화자의 음성 정보를 전달할 수 있는 음성 수집 장치 사이에 무선 릴레이 기능을 부여하여 무선 통신 거리의 제약 상황을 극복할 수 있다.
본 발명의 일측에 따르면, 음성 인식 시스템은 화자가 실내 어느 곳에 위치하더라도 어디서나 음성 인식 또는 음성 대화 서비스를 제공할 수 있다.
도 1은 본 발명의 일실시예에 따른 음성 인식 시스템의 구성을 도시한 블록도이다.
본 발명의 일실시예에 따른 음성 인식 시스템은 하나 이상의 음성 수집 장치(110), 음성 인식 장치(120), 및 음성 인식 서버(130)를 포함한다.
하나 이상의 음성 수집 장치(110)는 미리 설정된 하나 이상의 영역에 설치되어, 하나 이상의 영역으로부터 음성 정보를 수집한다.
음성 인식 장치(120)는 음성 정보를 직접 수신하거나 하나 이상의 음성 수집 장치(110)로부터 음성 정보를 수신한다.
음성 인식 서버(130)는 음성 인식 장치로부터 음성 정보를 수신하고, 음성 정보를 기반으로 제어 대상 기기를 제어한다.
하나 이상의 음성 수집 장치(110)는 무선 통신 방식으로 음성 정보를 다른 음성 수집 장치로 릴레이(relay) 할 수 있으며, 다른 음성 수집 장치는 릴레이된 음성 정보를 음성 인식 장치로 전송할 수 있다.
예를 들어, 음성 수집 장치 #4는 설치된 영역으로부터 화자의 음성 정보를 수집하고, 수집된 음성 정보를 무선 통신 릴레이 방식을 통하여 음성 수집 장치 #3으로 전달할 수 있다.
음성 수집 장치 #3은 음성 수집 장치 #4로부터 수신된 음성 정보를 다시 음성 인식 장치(120)로 전송하고, 음성 인식 장치(120)는 수신된 음성 정보를 인식하여 음성 인식 정보를 생성할 수 있다.
본 발명의 일측에 따르면, 음성 인식 서버(130)는 음성 인식 정보에 따른 음성 명령을 수행한 음성 인식 결과를 음성 인식 장치로 전송할 수 있다.
예를 들어, 음성 인식 서버(130)는 인식된 음성 인식 정보를 기반으로 제어 대상 기기를 제어하고, 음성 명령 수행에 대한 음성 인식 결과를 음성 인식 장치(120)로 전달하여 사용자에게 제어 대상 기기의 제어 여부를 알려줄 수 있다.
음성 인식 장치(120)는 미리 설정된 범위 내에 사용자가 위치하는 경우, 하나 이상의 음성 정보를 직접 수신할 수도 있다.
예를 들어, 음성 인식 장치(120)는 호출어 및 음성 명령이 포함된 사용자의 음성 정보를 사용자의 위치에 따라 하나 이상의 음성 수집 장치(110)로부터 수신 될 수도 있고, 사용자가 음성 인식 장치(120)에 가까이 위치한 경우 음성 인식 장치(120) 자체적으로 음성 정보를 수집 및 인식할 수도 있다.
하나 이상의 음성 수집 장치(110)는 음성 인식 장치(120)에서 인식된 호출어를 기반으로 결정되는 우선 순위에 따라, 음성 인식 장치(120)로부터 대기 명령 또는 비활성화 명령을 수신하고, 대기 명령 또는 비활성화 명령에 따라 대기 또는 비활성화될 수도 있다.
아래에서는 본 발명의 일측에 따른 음성 인식 시스템을 가정 내의 복수의 영역에 구성한 예를 통하여 음성 인식하는 방법에 대하여 설명한다.
도 2는 본 발명의 일측에 따른 음성 인식 시스템을 가정 내의 복수의 영역에 구성한 예를 도시한 도면이다.
도 2를 참조하면, 음성 인식 시스템은 가정 환경에서 음성 정보를 수집하기 위하여 각각의 음성 수집 영역(210~250)에 음성 수집 장치(221~251)를 설치할 수 있으며, 특정 영역(210)의 경우 음성 수집 장치(221~251)로부터 음성 정보를 수신하여 음성 정보를 인식하는 음성 인식 장치(211)를 설치하여 무선 네트워크를 구성할 수 있다.
음성 수집 장치(221~251)는 사용자(화자)가 말하는 음성을 음성 정보로써 수집하고, 음성 인식 장치(211)는 수집된 음성 정보를 인식하여 음성 인식 정보를 생성할 수 있다.
음성 수집 장치(221~251)는 음성 인식 장치(211)로 음성 정보를 전달하기 위한 무선 통신 거리가 멀어서 음성 정보를 전달할 수 없는 경우, 다른 음성 수집 장치를 경유하여 전달할 수도 있다.
예를 들어, 영역(240)에 위치한 음성 수집 장치 #3(241)은 영역(250)에 위치한 음성 수집 장치 #4(251)을 통하여 음성 인식 장치(211)로 음성 정보를 수신할 수도 있다.
음성 인식 장치(211)는 사전에 정해진 호출어 기반으로 음성 인식이 시작되도록 할 수 있으며, 음성 인식이 시작되면 수신된 음성 명령이 포함된 사용자의 음성 정보를 음성 인식 서버로 전달할 수 있다.
예를 들어, 음성 인식 장치(211)는 호출어 및 음성 명령이 포함된 사용자의 음성 정보를 사용자의 위치에 따라 음성 수집 장치(221~251)로부터 수신할 수도 있고, 사용자가 음성 인식 장치(211)가 설치된 영역(210)에 위치한 경우 음성 인식 장치(211)를 통하여 직접 음성 정보를 수집 및 인식할 수도 있다.
아래에서는 본 발명의 일측에 따른 음성 수집 장치의 구성을 설명하도록 한다. 본 발명의 일측에 따른 음성 수집 장치는 미리 설정된 하나 이상의 영역에 설치될 수 있다.
도 3a 및 도 3b는 본 발명의 일측에 따른 음성 수집 장치의 구성을 도시한 블록도이다.
도 3a 및 3b를 참조하면, 음성 수집 장치는 사용자로부터 음성 정보를 수집하여 처리하는 음성 처리부(310), 음성 정보로부터 음성 인식 가능한 음성 데이터로 변환하는 데이터 처리부(320), 및 음성 수집 장치에 전력을 공급하기 위한 전력 처리부(330)를 포함한다.
본 발명의 일측에 따른 음성 처리부(310)는 음성 정보를 수신하는 음성 수신부(311), 음성 정보를 음성 인식 장치로 전송하기 위한 데이터로 변환하는 음성 처리 제어부(312), 음성 수신부(311)를 통하여 수신된 하나 이상의 호출어를 인식하여 음성 정보를 수신하도록 제어하는 음성 인식 처리부(313), 및 음성 정보를 음성 인식 장치로 전송하는 음성 전송부(314)를 포함한다.
예를 들어, 음성 수신부(311)는 사용자의 음성 정보를 수신할 수 있는 마이크로 구성될 수 있으며, 음성 처리 제어부(312)는 마이크로부터 수신되는 음성 정보를 추출하여 음성 인식 장치로 전송을 하기 위한 데이터 압축 등의 데이터 가공 과정을 수행할 수 있다.
음성 인식 처리부(313)는 음성 수집 장치의 구동을 시작하기 위한 호출어 인식 등의 간단한 음성 인식 처리를 수행할 수 있다. 예를 들어, 음성 인식 처리부(313)는 음성 수신부(311)를 통하여 수신된 호출어 중 미리 설정된 호출어에 해당하는 경우, 음성 정보를 수신하도록 음성 수신부(311)를 제어할 수 있다.
또한, 음성 인식 처리부(313)는 다른 음성 수집 장치와 서로 다른 호출어를 인식하여 상기 하나 이상의 음성 정보를 수신하도록 제어할 수 있다.
본 발명의 일측에 따르면, 하나 이상의 음성 수집 장치 및 음성 인식 장치는 상기 하나 이상의 영역 별 또는 상기 각각의 장치 별로 미리 설정된 서로 다른 호출어를 인식하여 상기 하나 이상의 음성 정보를 수신할 수 있다.
예를 들어, 하나 이상의 영역 별 설치된 하나 이상의 음성 수집 장치는 음성 인식 처리부(313)를 통하여 인식할 수 있는 호출어가 서로 다를 수 있으며, 각각의 음성 수집 장치마다 설정된 호출어가 인지된 경우에만 해당 음성 수집 장치가 음성 정보를 수신할 수 있다.
음성 인식 처리부(313)는 음성 인식 장치에 의하여 결정되는 우선 순위에 따라, 음성 인식 장치로부터 대기 명령 또는 비활성화 명령을 수신할 수 있으며, 음성 수집 장치를 대기 명령 또는 비활성화 명령에 따라 대기 또는 비활성화되도록 제어할 수 있다.
음성 전송부(314)는 무선 통신 방식으로 음성 정보를 다른 음성 수집 장치로 릴레이(relay) 하고, 다른 음성 수집 장치는 릴레이된 음성 정보를 음성 인식 장치로 전송할 수 있다.
데이터 처리부(320)는 다른 음성 수집 장치로부터 수신되는 하나 이상의 음성 정보 또는 음성 인식 장치로부터 수신되는 통신 제어 정보를 수신하는 무선 데이터 수신부(321), 하나 이상의 음성 정보를 음성 인식 장치 또는 다른 음성 수집 장치로 전송하는 무선 데이터 전송부(322), 및 무선 데이터 수신부 및 무선 데이터 전송부의 무선 통신을 제어하는 무선 통신 제어부(323)를 포함할 수 있다.
무선 데이터 처리부(321)는 다른 음성 수집 장치로부터 수신되는 음성 정보 또는 음성 인식 장치로부터 수신되는 통신 제어 정보를 수신할 수 있다. 예를 들어, 통신 제어 정보는 음성 인식 장치에서 복수의 음성 수집 장치에 대한 네트워크를 관리하기 위한 제어 신호를 포함할 수 있으며, 각각의 음성 수집 장치는 통신 제어 정보를 수신하여 음성 정보 수집 범위 또는 다른 음성 수집 장치와의 통신 등을 설정 및 제어할 수 있다.
무선 데이터 전송부(322)는 음성 처리 제어부(312)로부터 수신된 음성 정보 또는 다른 음성 수집 장치에서 수신된 음성 정보를 음성 인식 장치 또는 릴레이를 위한 다른 음성 수집 장치로 전달할 수 있다.
무선 통신 제어부(323)는 무선 데이터 전송부(322) 및 네트워크에 대한 통신을 제어할 수 있다.
전력 처리부(330)는 하나 이상의 전력 수집 장치를 이용하여 전력을 수집하는 전력 수집부(331), 수집된 전력을 저장하는 전력 저장 처리부(332), 및 전력을 음성 수집 장치에 공급하도록 제어하는 전력 관리부(333)를 포함할 수 있다.
예를 들어, 전력 관리부(333)는 상시 전원 또는 배터리로 음성 수집 장치를 구동하는 경우 전원 처리가 가능하도록 전력을 공급할 수 있으며, 전력 수집부(331)는 배터리로 구동되는 경우 사용 가능한 태양광, 형광등, 진동, 열 등으로부터 전력을 수집할 수 있고, 전력 저장 처리부(332)는 수집된 전력을 저장하여 배터리 충전 또는 배터리의 수명을 연장할 수 있다.
아래에서는 본 발명의 일측에 따른 음성 인식 장치의 구성을 설명하도록 한다.
도 4a 및 도 4b는 본 발명의 일측에 따른 음성 인식 장치의 구성을 도시한 블록도이다.
도 4a 및 4b를 참조하면, 음성 인식 장치는 음성 수집 장치로부터 음성 정보를 수신하여 처리하는 음성 처리부(410), 음성 정보를 음성 수집 장치 또는 음성 인식 서버로 전달하는 데이터 처리부(420), 및 음성 인식 서버와 연동하여 제어 대상 기기를 제어하는 서버 연동부(430)를 포함한다.
음성 처리부(410)는 미리 설정된 하나 이상의 영역에 설치된 하나 이상의 음성 수집 장치로부터 하나 이상의 음성 정보를 수신하거나 직접 음성 정보를 수신하는 음성 수신부(411), 음성 정보를 분석하는 음성 처리 제어부(412), 음성 수신부(411)를 통하여 수신된 하나 이상의 호출어를 인식하여 상기 음성 수집 장치로부터 음성 정보를 수신하거나 직접 음성 정보를 수신하도록 제어하는 음성 인식 처리부(413), 및 음성 정보를 음성 인식 서버로 전송하는 음성 전송부(414)를 포함한다.
예를 들어, 음성 수신부(411)는 사용자의 음성 정보를 수신하는 마이크로 구성될 수 있으며, 하나 이상의 음성 수집 장치로부터 하나 이상의 음성 정보가 수신되지 않는 경우, 하나 이상의 음성 정보를 자체적으로 수집할 수도 있다.
음성 처리 제어부(412)는 마이크에서 수신되는 음성 정보를 추출하거나 음성 수집 장치로부터 수신된 음성 정보의 압축을 푸는 등의 음성 정보를 분석하여 음성 인식 정보를 생성할 수 있다.
음성 수신부(411)는 하나 이상의 음성 수집 장치 중 선택되지 않은 장치로부터 음성 수신 대기 비활성화 요청을 수신하고, 하나 이상의 음성 수집 장치 중 선택된 장치로부터 하나 이상의 음성 정보를 수신할 수 있다.
음성 인식 처리부(413)는 하나 이상의 호출어를 기반으로 하나 이상의 호출어에 대한 우선 순위를 결정하고, 우선 순위에 따라 호출어에 대응하는 하나 이상의 음성 수집 장치 및 음성 인식 장치 중 어느 하나를 선택할 수 있으며, 음성 수신부(411)는 선택된 장치로부터 음성 정보를 수신할 수 있고, 음성 전송부(414)는 선택된 장치로부터 수신된 음성 정보를 음성 인식 서버로 전송할 수 있다.
음성 인식 처리부(413)는 둘 이상의 호출어가 수신되는 경우, 호출어 수신 시간 또는 음성 인식 품질 중 어느 하나 이상을 기반으로 우선 순위에 결정하고, 우선 순위에 따라 호출어에 대응하는 하나 이상의 음성 수집 장치 및 음성 인식 장치 중 어느 하나를 선택하여 하나 이상의 음성 정보를 수신하도록 제어할 수 있다.
예를 들어, 음성 인식 처리부(413)는 호출어를 인식하여 음성 인식을 시작할 수 있으며, 여러 음성 수집 장치에서 호출어를 인식한 경우 시간 순 또는 음성 인식 품질 기준 등 우선 순위에 따라 음성 수집 장치를 선택하여 음성 인식을 처리할 수도 있다.
다른 예로, 음성 인식 처리부(413)는 둘 이상의 호출어가 인식되는 경우, 호출어 수신 시간 또는 음성 인식 품질 중 어느 하나 이상을 기반으로 우선 순위에 결정하고, 우선 순위에 따라 하나 이상의 음성 수집 장치 중 둘 이상을 선택하여 하나 이상의 음성 정보를 수신하도록 제어할 수도 있다.
음성 인식 처리부(413)는 하나 이상의 호출어에 대한 우선 순위를 결정하고, 우선 순위에 따라 호출어에 대응하는 하나 이상의 음성 수집 장치 및 음성 인식 장치 중 어느 하나를 선택하며, 하나 이상의 음성 수집 장치 및 음성 인식 장치 중 선택되지 않은 장치에 음성 수신 대기 비활성화를 요청할 수도 있다.
또한, 음성 인식 장치는 하나 이상의 영역 별 또는 각각의 장치 별로 미리 설정된 서로 다른 호출어를 인식하여 하나 이상의 음성 정보를 수신 또는 인식할 수 있다.
예를 들어, 음성 인식 장치는 영역 별로 설치된 음성 수집 장치에 설정된 호출어와 다른 호출어로 음성 수집 및 인식할 수 있으며, 음성 인식 장치에 설정된 호출어가 인지된 경우에만 음성 정보를 수신 및 인식할 수 있다.
데이터 처리부(420)는 음성 수집 장치로부터 수신되는 음성 정보를 수신하는 무선 데이터 수신부(421), 음성 수집 장치로 통신 제어 정보 등을 전달하는 무선 데이터 전송부(422), 네트워크 관리에 필요한 무선 데이터 통신을 제어하는 무선 통신 제어부(423)을 포함할 수 있다.
서버 연동부(430)는 하나 이상의 음성 정보를 음성 인식 서버로 전달하고, 하나 이상의 음성 정보를 기반으로 생성된 음성 인식 정보에 대응하는 음성 인식 결과를 수신하는 음성 인식 서버 통신부(431), 음성 정보의 인식 처리 상태를 출력하는 사용자 인터페이스부(432) 및 음성 인식 결과를 출력하는 음성 인식 알림부(433)를 포함할 수 있다.
예를 들어, 음성 인식 서버 통신부(431)는 호출어로 시작된 음성 인식을 통하여 사용자의 음성 명령이 포함된 음성 인식 정보를 음성 인식 서버로 전달하여, 사용자의 음성 명령을 음성 인식 서버가 인식하도록 할 수 있다. 음성 인식 서버 통신부(431)는 음성 인식 정보에 대응하는 음성 인식 결과를 수신할 수 있다.
사용자 인터페이스부(432) 장치 구동 중 또는 음성 인식 처리 상태 등의 사용자 알림 정보를 사용자에게 알려 줄 수 있고, 스피커 또는 LED 표시 등으로 구성될 수 있는 음성 인식 알림부(433)는 음성 인식 서버로부터 수신한 음성 인식 결과 등을 음성 또는 시각 표현으로 알려줄 수도 있다.
아래에서는 본 발명의 일실시예에 따른 음성 인식 서버에 대하여 설명하도록 한다.
도 5는 본 발명의 일실시예에 따른 음성 인식 서버의 구성을 도시한 도면이다.
도 5를 참조하면, 본 발명의 일실시예에 따른 음성 인식 서버는 음성 수신부(510), 및 음성 인식 처리부(520)를 포함한다.
음성 수신부(510)는 음석 인식 장치로부터 음성 정보를 수신한다.
음성 인식 처리부(520)는 음성 정보가 하나 이상의 호출어인 경우, 하나 이상의 호출어를 기반으로 하나 이상의 호출어에 대한 우선 순위를 결정하고, 우선 순위에 따라 호출어에 대응하는 하나 이상의 음성 수집 장치 및 음성 인식 장치 중 어느 하나를 선택하며, 선택된 장치가 음성 수신 대기 하도록 제어한다.
예를 들어, 음성 인식 처리부(520)는 호출어 수신 시간 또는 음성 인식 품질 중 어느 하나 이상을 기반으로 우선 순위를 결정할 수 있다.
음성 인식 처리부(520)는 하나 이상의 음성 수집 장치 및 음성 인식 장치 중 선택되지 않은 장치에 음성 수신 대기 비활성화 되도록 제어할 수도 있다.
아래에서는 본 발명의 일실시예에 따른 음성 인식 방법에 대하여 설명하도록 한다.
본 발명의 일실시예에 따른 음성 인식 방법은 전술한 음성 인식 시스템의 음성 인식 장치에 의하여 수행될 수 있는 바, 음성 인식 장치의 관점에서 설명하도록 한다.
도 6은 본 발명의 일실시예에 따른 음성 인식 방법을 도시한 흐름도이다.
도 6을 참조하면, 음성 인식 장치는 미리 설정된 하나 이상의 영역으로부터 음성 정보를 직접 수신하거나(610), 하나 이상의 영역에 설치된 하나 이상의 음성 수집 장치로부터 음성 정보를 수신하고(520), 음성 정보를 음성 인식 서버로 전송한다(630).
여기서, 음성 인식 서버는 음성 정보를 기반으로 제어 대상 기기를 제어한다.
하나 이상의 음성 수집 장치는 무선 통신 방식으로 음성 정보를 다른 음성 수집 장치로 릴레이(relay) 하고, 다른 음성 수집 장치는 릴레이된 음성 정보를 음성 인식 장치로 전송할 수 있다.
음성 인식 장치는 음성 인식 서버로부터 하나 이상의 음성 정보를 기반으로 제어 대상 기기의 제어 여부에 대응하는 음성 인식 결과를 수신하고, 음성 인식 결과를 출력할 수도 있다.
음성 인식 장치는 미리 설정된 범위 내에 사용자가 위치하는 경우, 하나 이상의 음성 정보를 직접 수신할 수도 있다.
아래에서는 본 발명의 다른 실시예에 따른 음성 인식 방법에 대하여 설명하도록 한다.
본 발명의 다른 실시예에 따른 음성 인식 방법은 전술한 음성 인식 시스템의 음성 인식 장치에 의하여 수행될 수 있는 바, 음성 인식 장치의 관점에서 설명하도록 한다.
도 7은 본 발명의 다른 실시예에 따른 음성 인식 방법을 도시한 흐름도이다.
도 7을 참조하면, 음성 인식 장치는 하나 이상의 음성 수집 장치로부터 음성 정보를 수신하거나 직접 음성 정보를 수신한다(710).
음성 인식 장치는 수신된 하나 이상의 호출어를 인식하여, 음성 수집 장치로부터 음성 정보를 수신하거나 직접 음성 정보를 수신하도록 제어한다(720).
음성 인식 장치는 음성 정보를 음성 인식 서버로 전송한다(730).
음성 인식 장치는 하나 이상의 호출어를 기반으로 하나 이상의 호출어에 대한 우선 순위를 결정할 수 있으며, 우선 순위에 따라 하나 이상의 음성 수집 장치 및 음성 인식 장치 중 어느 하나를 선택할 수도 있다.
음성 인식 장치는 선택된 장치로부터 음성 정보를 수신하고, 선택된 장치로부터 수신된 음성 정보를 음성 인식 서버로 전송할 수 있다.
음성 인식 장치는 하나 이상의 호출어를 기반으로 하나 이상의 호출어에 대한 우선 순위를 결정하고, 우선 순위에 따라 호출어에 대응하는 하나 이상의 음성 수집 장치 및 음성 인식 장치 중 어느 하나를 선택하며, 하나 이상의 음성 수집 장치 및 음성 인식 장치 중 선택되지 않은 장치에 음성 수신 대기 비활성화 요청할 수도 있다.
아래에서는 본 발명의 또 다른 실시예에 따른 음성 인식 방법에 대하여 설명하도록 한다.
본 발명의 또 다른 실시예에 따른 음성 인식 방법은 전술한 음성 인식 시스템의 음성 수집 장치에 의하여 수행될 수 있는 바, 음성 인식 장치의 관점에서 설명하도록 한다.
도 8은 본 발명의 다른 실시예에 따른 음성 인식 방법을 도시한 흐름도이다.
도 8을 참조하면, 음성 수집 장치는 호출어를 수신한다(810).
음성 수집 장치는 호출어가 인식된 경우, 음성 정보를 수신한다(820).
음성 수집 장치는 음성 정보를 음성 인식 장치로 전송한다(830).
음성 수집 장치는 음성 인식 장치에 의하여 결정되는 우선 순위에 따라, 음성 인식 장치로부터 대기 명령 또는 비활성화 명령을 수신하고, 대기 명령 또는 비활성화 명령에 따라 대기 또는 비활성화될 수 있다.
음성 수집 장치는 다른 음성 수집 장치와 서로 다른 호출어를 인식하여 음성 정보를 수신하도록 제어할 수도 있다.
음성 수집 장치는 무선 통신 방식으로 음성 정보를 다른 음성 수집 장치로 릴레이(relay) 할 수 있으며, 다른 음성 수집 장치는 릴레이된 음성 정보를 음성 인식 장치로 전송할 수 있다.
본 발명의 일측에 따르면, 하나 이상의 음성 수집 장치, 음성 인식 장치, 음성 인식 서버로 구성되는 네트워크 기반 실내 음성 인식 시스템을 제공할 수 있다.
본 발명의 일측에 따르면, 음성 수집 장치는 서로 릴레이 기능을 통하여 음성 인식 거리를 확장하여 제공할 수 있다.
본 발명의 일측에 따르면, 음성 수집 장치는 배터리 충전 및 배터리 소모 시간을 늘릴 수 있도록 태양광, 형광등, 진동, 열 등으로부터 전력을 모아 수집하거나 저장할 수 있다.
본 발명의 일측에 따르면, 음성 수집 장치는 음성 인식을 시작할 수 있는 호출어와 같은 간단한 음성 명령으로 음성 인식을 시작할 수도 있다.
음성 수집 장치 및 음성 인식 장치는 장치 별로 서로 다른 호출어로 음성 인식을 시작하도록 설정할 수 있다.
음성 수집 장치 및 음성 인식 장치가 동일한 호출어로 음성 인식을 시작하는 경우 또는 2대 이상의 장치에서 호출어를 인식하는 경우 음성 인식 장치에서 시간 순 또는 음성 상태를 기반으로 우선 순위를 정하여 가장 효율적인 장치를 통해 음성 인식이 시작되도록 할 수도 있다.
이상에서 설명된 장치는 하드웨어 구성요소, 소프트웨어 구성요소, 및/또는 하드웨어 구성요소 및 소프트웨어 구성요소의 조합으로 구현될 수 있다. 예를 들어, 실시예들에서 설명된 장치 및 구성요소는, 예를 들어, 프로세서, 콘트롤러, ALU(arithmetic logic unit), 디지털 신호 프로세서(digital signal processor), 마이크로컴퓨터, FPGA(field programmable gate array), PLU(programmable logic unit), 마이크로프로세서, 또는 명령(instruction)을 실행하고 응답할 수 있는 다른 어떠한 장치와 같이, 하나 이상의 범용 컴퓨터 또는 특수 목적 컴퓨터를 이용하여 구현될 수 있다. 처리 장치는 운영 체제(OS) 및 상기 운영 체제 상에서 수행되는 하나 이상의 소프트웨어 애플리케이션을 수행할 수 있다. 또한, 처리 장치는 소프트웨어의 실행에 응답하여, 데이터를 접근, 저장, 조작, 처리 및 생성할 수도 있다. 이해의 편의를 위하여, 처리 장치는 하나가 사용되는 것으로 설명된 경우도 있지만, 해당 기술분야에서 통상의 지식을 가진 자는, 처리 장치가 복수 개의 처리 요소(processing element) 및/또는 복수 유형의 처리 요소를 포함할 수 있음을 알 수 있다. 예를 들어, 처리 장치는 복수 개의 프로세서 또는 하나의 프로세서 및 하나의 콘트롤러를 포함할 수 있다. 또한, 병렬 프로세서(parallel processor)와 같은, 다른 처리 구성(processing configuration)도 가능하다.
소프트웨어는 컴퓨터 프로그램(computer program), 코드(code), 명령(instruction), 또는 이들 중 하나 이상의 조합을 포함할 수 있으며, 원하는 대로 동작하도록 처리 장치를 구성하거나 독립적으로 또는 결합적으로(collectively) 처리 장치를 명령할 수 있다. 소프트웨어 및/또는 데이터는, 처리 장치에 의하여 해석되거나 처리 장치에 명령 또는 데이터를 제공하기 위하여, 어떤 유형의 기계, 구성요소(component), 물리적 장치, 가상 장치(virtual equipment), 컴퓨터 저장 매체 또는 장치, 또는 전송되는 신호 파(signal wave)에 영구적으로, 또는 일시적으로 구체화(embody)될 수 있다. 소프트웨어는 네트워크로 연결된 컴퓨터 시스템 상에 분산되어서, 분산된 방법으로 저장되거나 실행될 수도 있다. 소프트웨어 및 데이터는 하나 이상의 컴퓨터 판독 가능 기록 매체에 저장될 수 있다.
실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 실시예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 실시예의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
이상과 같이 실시예들이 비록 한정된 실시예와 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기의 기재로부터 다양한 수정 및 변형이 가능하다. 예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다.
그러므로, 다른 구현들, 다른 실시예들 및 특허청구범위와 균등한 것들도 후술하는 특허청구범위의 범위에 속한다.
110: 음성 수집 장치
120: 음성 인식 장치
130: 음성 인식 서버

Claims (23)

  1. 미리 설정된 하나 이상의 영역에 설치되어, 상기 하나 이상의 영역으로부터 음성 정보를 수집하는 하나 이상의 음성 수집 장치;
    하나 이상의 호출어를 인식하여, 상기 음성 정보를 직접 수신하거나 상기 음성 수집 장치로부터 상기 음성 정보를 수신하는 음성 인식 장치; 및
    상기 음성 인식 장치로부터 상기 음성 정보를 수신하고, 상기 음성 정보를 기반으로 제어 대상 기기를 제어하는 음성 인식 서버
    를 포함하고,
    상기 음성 인식 장치는,
    상기 하나 이상의 호출어를 기반으로 상기 하나 이상의 호출어에 대한 우선 순위를 결정하고, 상기 우선 순위에 따라 상기 하나 이상의 호출어에 대응하는 하나 이상의 음성 수집 장치 및 상기 음성 인식 장치 중 어느 하나를 선택하는 음성 인식 시스템.
  2. 제1항에 있어서,
    상기 하나 이상의 음성 수집 장치는,
    무선 통신 방식으로 상기 음성 정보를 다른 음성 수집 장치로 릴레이(relay) 하고,
    상기 다른 음성 수집 장치는 상기 릴레이된 음성 정보를 상기 음성 인식 장치로 전송하는,
    음성 인식 시스템.
  3. 음성 인식 장치에 있어서,
    하나 이상의 음성 수집 장치로부터 음성 정보를 수신하거나 직접 음성 정보를 수신하는 음성 수신부;
    상기 음성 수신부를 통하여 수신된 하나 이상의 호출어를 인식하여, 상기 음성수집 장치로부터 상기 음성 정보를 수신하거나 직접 상기 음성 정보를 수신하도록 제어하는 음성 인식 처리부; 및
    상기 음성 정보를 음성 인식 서버로 전송하는 음성 전송부
    를 포함하고,
    상기 음성 인식 처리부는,
    상기 하나 이상의 호출어를 기반으로 상기 하나 이상의 호출어에 대한 우선 순위를 결정하고, 상기 우선 순위에 따라 상기 하나 이상의 호출어에 대응하는 하나 이상의 음성 수집 장치 및 상기 음성 인식 장치 중 어느 하나를 선택하는 음성 인식 장치.
  4. 제3항에 있어서,
    상기 음성 수신부는,
    상기 선택된 장치로부터 상기 음성 정보를 수신하고,
    상기 음성 전송부는,
    상기 선택된 장치로부터 수신된 상기 음성 정보를 상기 음성 인식 서버로 전송하는,
    음성 인식 장치.
  5. 제4항에 있어서,
    상기 음성 인식 처리부는,
    둘 이상의 호출어가 수신되는 경우, 호출어 수신 시간 또는 음성 인식 품질 중 어느 하나 이상을 기반으로 상기 우선 순위를 결정하고,
    상기 우선 순위에 따라 호출어에 대응하는 하나 이상의 음성 수집 장치 및 상기 음성 인식 장치 중 어느 하나를 선택하여 상기 음성 정보를 수신하도록 제어하는,
    음성 인식 장치.
  6. 제3항에 있어서,
    상기 음성 인식 처리부는,
    상기 하나 이상의 호출어에 대한 우선 순위를 결정하고,
    상기 우선 순위에 따라 상기 호출어에 대응하는 하나 이상의 음성 수집 장치 및 상기 음성 인식 장치 중 어느 하나를 선택하며,
    상기 하나 이상의 음성 수집 장치 및 상기 음성 인식 장치 중 선택되지 않은 장치에 음성 수신 대기 비활성화 요청하는,
    음성 인식 장치.
  7. 미리 설정된 하나 이상의 영역에 설치되어 음성 정보를 수집하는 음성 수집 장치에 있어서,
    상기 음성 정보를 수신하는 음성 수신부;
    상기 음성 수신부를 통하여 수신된 호출어를 인식하여, 상기 음성 정보를 수신하도록 제어하는 음성 인식 처리부; 및
    상기 음성 정보를 음성 인식 장치로 전송하는 음성 전송부
    를 포함하고,
    상기 음성 인식 처리부는,
    상기 음성 인식 장치에 의하여 결정되는 우선 순위에 따라, 상기 음성 인식 장치로부터 음성 수신 대기 명령 또는 수신 대기 비활성화 명령을 수신하고,
    상기 수신 대기 명령 또는 상기 수신 대기 비활성화 명령에 따라 수신 대기 또는 수신 대기 비활성화되도록 제어하는 음성 수집 장치.
  8. 삭제
  9. 제7항에 있어서,
    상기 음성 인식 처리부는,
    다른 음성 수집 장치와 서로 다른 호출어를 인식하여 상기 음성 정보를 수신하도록 제어하는,
    음성 수집 장치.
  10. 제7항에 있어서,
    상기 음성 전송부는,
    무선 통신 방식으로 상기 음성 정보를 다른 음성 수집 장치로 릴레이(relay) 하고,
    상기 다른 음성 수집 장치는 상기 릴레이된 음성 정보를 상기 음성 인식 장치로 전송하는,
    음성 수집 장치.
  11. 음성 인식 장치를 이용한 음성 인식 방법에 있어서,
    하나 이상의 호출어를 인식하여, 음성 정보를 직접 수신하거나 상기 하나 이상의 영역에 설치된 하나 이상의 음성 수집 장치로부터 상기 음성 정보를 수신하는 단계; 및
    상기 음성 정보를 음성 인식 서버로 전송하는 단계;
    를 포함하고,
    상기 음성 인식 장치는 상기 하나 이상의 호출어를 기반으로 상기 하나 이상의 호출어에 대한 우선 순위를 결정하고, 상기 우선 순위에 따라 상기 하나 이상의 호출어에 대응하는 하나 이상의 음성 수집 장치 및 상기 음성 인식 장치 중 어느 하나를 선택하며,
    상기 음성 인식 서버는 상기 음성 정보를 기반으로 제어 대상 기기를 제어하는,
    음성 인식 방법.
  12. 제11항에 있어서,
    상기 하나 이상의 음성 수집 장치는,
    무선 통신 방식으로 상기 음성 정보를 다른 음성 수집 장치로 릴레이(relay) 하고,
    상기 다른 음성 수집 장치는 상기 릴레이된 음성 정보를 상기 음성 인식 장치로 전송하는,
    음성 인식 방법.
  13. 음성 인식 장치의 음성 인식 하는 방법에 있어서,
    하나 이상의 음성 수집 장치로부터 음성 정보를 수신하거나 직접 음성 정보를 수신하는 단계;
    수신된 하나 이상의 호출어를 인식하여, 상기 음성 수집 장치로부터 상기 음성 정보를 수신하거나 직접 상기 음성 정보를 수신하도록 제어하는 단계;
    상기 음성 정보를 음성 인식 서버로 전송하는 단계;
    상기 하나 이상의 호출어를 기반으로 상기 하나 이상의 호출어에 대한 우선 순위를 결정하는 단계; 및
    상기 우선 순위에 따라 상기 하나 이상의 음성 수집 장치 및 상기 음성 인식 장치 중 어느 하나를 선택하는 단계
    를 포함하는 음성 인식 방법.
  14. 제13항에 있어서,
    상기 음성 정보를 수신하는 단계는,
    상기 선택된 장치로부터 상기 음성 정보를 수신하는 단계를 포함하고,
    상기 음성 정보를 전송하는 단계는,
    상기 선택된 장치로부터 수신된 상기 음성 정보를 상기 음성 인식 서버로 전송하는 단계를 포함하는,
    음성 인식 방법.
  15. 제13항에 있어서,
    상기 하나 이상의 호출어를 기반으로 상기 하나 이상의 호출어에 대한 우선 순위를 결정하는 단계;
    상기 우선 순위에 따라 상기 호출어에 대응하는 상기 하나 이상의 음성 수집 장치 및 상기 음성 인식 장치 중 어느 하나를 선택하는 단계; 및
    상기 하나 이상의 음성 수집 장치 및 상기 음성 인식 장치 중 선택되지 않은 장치에 음성 수신 대기 비활성화 요청하는 단계
    를 더 포함하는,
    음성 인식 방법.
  16. 미리 설정된 하나 이상의 영역에 설치된 하나 이상의 음성 수집 장치를 이용하여 음성 인식하는 방법에 있어서,
    호출어를 수신하는 단계;
    상기 호출어가 인식된 경우, 음성 정보를 수신하는 단계;
    상기 음성 정보를 음성 인식 장치로 전송하는 단계;
    상기 음성 인식 장치에 의하여 결정되는 우선 순위에 따라, 상기 음성 인식 장치로부터 수신 대기 명령 또는 수신 대기 비활성화 명령을 수신하는 단계; 및
    상기 수신 대기 명령 또는 상기 수신 대기 비활성화 명령에 따라 수신 대기 또는 수신 대기 비활성화되는 단계
    를 포함하는 음성 인식 방법.
  17. 삭제
  18. 제16항에 있어서,
    상기 음성 정보를 수신하는 단계는,
    다른 음성 수집 장치와 서로 다른 호출어를 인식하여 상기 음성 정보를 수신하도록 제어하는 단계
    를 포함하는,
    음성 인식 방법.
  19. 제16항에 있어서,
    무선 통신 방식으로 상기 음성 정보를 다른 음성 수집 장치로 릴레이(relay) 하는 단계
    를 더 포함하고,
    상기 다른 음성 수집 장치는 상기 릴레이된 음성 정보를 상기 음성 인식 장치로 전송하는,
    음성 인식 방법.
  20. 제11항 내지 제16항 및 제18항 내지 제19항 중 어느 한 항의 방법을 수행하는 프로그램을 기록한 컴퓨터 판독 가능 기록 매체.
  21. 음성 인식 장치로부터 음성 정보를 수신하는 음성 수신부; 및
    상기 음성 정보가 하나 이상의 호출어인 경우, 상기 하나 이상의 호출어를 기반으로 상기 하나 이상의 호출어에 대한 우선 순위를 결정하고, 상기 우선 순위에 따라 상기 호출어에 대응하는 하나 이상의 음성 수집 장치 및 상기 음성 인식 장치 중 어느 하나를 선택하며, 상기 선택된 장치가 음성 수신 대기 하도록 제어하는 음성 인식 처리부
    를 포함하는 음성 인식 서버.
  22. 제21항에 있어서,
    상기 음성 인식 처리부는,
    상기 호출어 수신 시간 또는 음성 인식 품질 중 어느 하나 이상을 기반으로 상기 우선 순위를 결정하는
    음성 인식 서버.
  23. 제21항에 있어서,
    상기 음성 인식 처리부는,
    상기 하나 이상의 음성 수집 장치 및 상기 음성 인식 장치 중 선택되지 않은 장치에 음성 수신 대기 비활성화 되도록 제어하는,
    음성 인식 서버.
KR1020160066579A 2016-05-30 2016-05-30 음성 인식 시스템 및 방법 KR101832058B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020160066579A KR101832058B1 (ko) 2016-05-30 2016-05-30 음성 인식 시스템 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020160066579A KR101832058B1 (ko) 2016-05-30 2016-05-30 음성 인식 시스템 및 방법

Publications (2)

Publication Number Publication Date
KR20170135133A KR20170135133A (ko) 2017-12-08
KR101832058B1 true KR101832058B1 (ko) 2018-04-04

Family

ID=60919621

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020160066579A KR101832058B1 (ko) 2016-05-30 2016-05-30 음성 인식 시스템 및 방법

Country Status (1)

Country Link
KR (1) KR101832058B1 (ko)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200098025A (ko) 2019-02-11 2020-08-20 삼성전자주식회사 전자 장치 및 그 제어 방법
KR20200104773A (ko) * 2019-02-27 2020-09-04 삼성전자주식회사 전자 장치 및 그 제어 방법
US11417323B2 (en) 2019-02-27 2022-08-16 Samsung Electronics Co., Ltd. Electronic apparatus and control method thereof
KR102282574B1 (ko) * 2019-09-24 2021-07-27 주식회사 엘지유플러스 IoT 기기를 이용한 긴급 신고 방법 및 장치
KR102244156B1 (ko) * 2019-10-14 2021-04-27 주식회사 아이포바인 블루투스 메쉬 네트워크를 이용한 음성명령 처리 방법

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100769156B1 (ko) * 2007-04-20 2007-10-22 주식회사 서비전자 홈 네트워크 시스템 및 그것의 제어방법
KR101072709B1 (ko) * 2009-06-15 2011-10-11 브이 앤드 씨 컴퍼니 리미티드 영역 우선 음성인식 홈네트워크 시스템

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100769156B1 (ko) * 2007-04-20 2007-10-22 주식회사 서비전자 홈 네트워크 시스템 및 그것의 제어방법
KR101072709B1 (ko) * 2009-06-15 2011-10-11 브이 앤드 씨 컴퍼니 리미티드 영역 우선 음성인식 홈네트워크 시스템

Also Published As

Publication number Publication date
KR20170135133A (ko) 2017-12-08

Similar Documents

Publication Publication Date Title
KR101832058B1 (ko) 음성 인식 시스템 및 방법
US11521614B2 (en) Device with voice command input capabtility
JP6739907B2 (ja) 機器特定方法、機器特定装置及びプログラム
EP3734596B1 (en) Determining target device based on speech input of user and controlling target device
EP2926502B1 (en) Voice-controlled configuration of an automation system
US9721572B2 (en) Device control method and electric device
US11354089B2 (en) System and method for dialog interaction in distributed automation systems
US10984799B2 (en) Hybrid speech interface device
KR20160089145A (ko) 음성 인식 방법 및 음성 인식 장치
WO2018194695A1 (en) Voice-enabled home setup
JP3838029B2 (ja) 音声認識を用いた機器制御方法および音声認識を用いた機器制御システム
KR20170049817A (ko) 홈 네트워크에서 음성 인식을 위한 음성 인식 디바이스 및 그 동작 방법
KR20170004497A (ko) 리모컨 신호 및 음성 명령의 딥-러닝을 통해 클라우드 데이터베이스를 사용함으로써 다양한 전자 장치를 제어하거나 제어하도록 지원하기 위한 방법
KR20170051994A (ko) 음성인식 디바이스 및 이의 동작 방법
KR20210116671A (ko) 음성인식을 이용하여 장치를 제어하는 방법 및 이를 구현하는 장치
KR102052510B1 (ko) 음성브리지장치 및 음성인식처리장치, 그리고 그 동작 방법
JP6921311B2 (ja) 機器制御システム、機器、機器制御方法及びプログラム
JP7036561B2 (ja) 家電システム
KR20200127823A (ko) 허브 디바이스, 허브 디바이스 및 복수의 디바이스를 포함하는 멀티 디바이스 시스템 및 그 동작 방법
KR102487078B1 (ko) 허브 디바이스, 허브 디바이스 및 복수의 디바이스를 포함하는 멀티 디바이스 시스템 및 그 동작 방법
KR101499618B1 (ko) LSA 알고리즘을 이용한 IoT 서비스 방법 및 시스템
US11477297B2 (en) Headless device installations
KR102355637B1 (ko) 모듈형 음성인식 지원 어댑터 및 그 동작 방법
KR102486912B1 (ko) 음성 처리 장치의 구동 제어 시스템 및 구동 제어 서버

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant