KR20180118462A - 음성 인식 장치, 및 음성 인식 시스템 - Google Patents

음성 인식 장치, 및 음성 인식 시스템 Download PDF

Info

Publication number
KR20180118462A
KR20180118462A KR1020170051836A KR20170051836A KR20180118462A KR 20180118462 A KR20180118462 A KR 20180118462A KR 1020170051836 A KR1020170051836 A KR 1020170051836A KR 20170051836 A KR20170051836 A KR 20170051836A KR 20180118462 A KR20180118462 A KR 20180118462A
Authority
KR
South Korea
Prior art keywords
voice
speech recognition
server
recognition algorithm
user
Prior art date
Application number
KR1020170051836A
Other languages
English (en)
Other versions
KR102068182B1 (ko
Inventor
박중언
노두호
이성신
Original Assignee
엘지전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엘지전자 주식회사 filed Critical 엘지전자 주식회사
Priority to KR1020170051836A priority Critical patent/KR102068182B1/ko
Priority to US15/960,023 priority patent/US10657953B2/en
Publication of KR20180118462A publication Critical patent/KR20180118462A/ko
Application granted granted Critical
Publication of KR102068182B1 publication Critical patent/KR102068182B1/ko
Priority to US16/845,333 priority patent/US11183173B2/en

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/60Software deployment
    • G06F8/65Updates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/70Software maintenance or management
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • G10L2015/0635Training updating or merging of old and new templates; Mean values; Weighting
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Abstract

본 발명은 음성 인식 장치, 및 음성 인식 시스템에 관한 것이다. 본 발명의 실시예에 따른 음성 인식 장치는, 음성 명령을 수신하는 마이크와, 제1 음성 인식 알고리즘을 저장하는 메모리와, 음성 명령을, 서버 시스템으로 전송하고, 제1 음성 인식 알고리즘 관련 업데이트 데이터를, 서버 시스템으로부터 수신하는 통신 모듈과, 제1 음성 인식 알고리즘 관련 업데이트 데이터를 기초로, 메모리에 저장된, 제1 음성 인식 알고리즘을 업데이트하도록 제어하는 제어부를 포함한다. 이에 따라, 음성 인식 알고리즘을 사용자 특성에 맞게 제공할 수 있게 된다.

Description

음성 인식 장치, 및 음성 인식 시스템{Voice recognition apparatus and home appliance system}
본 발명은 음성 인식 장치, 및 음성 인식 시스템에 관한 것으로, 보다 상세하게는, 음성 인식 알고리즘을 사용자 특성에 맞게 제공할 수 있는, 음성 인식 장치, 및 음성 인식 시스템에 관한 것이다.
음성 인식 장치는, 음성 인식 기능을 수행하기 위한 장치이다.
한편, 가정이나 사무실 등의 소정 공간에서 사용되는 공기조화기, 세탁기, 청소기 등 홈 어플라이언스(Home appliance)들은 각각 사용자의 조작에 따라 고유의 기능과 동작을 수행하였다.
한편, 홈 어플라이언스의 동작을 위해서, 사용자는, 홈 어플라이언스 본체에 구비된 버튼 등을 직접 조작하거나, 매번 본체로 이동하여 입력하여야 하는 불편함을 피해 리모콘 등의 원격제어장치를 사용할 수 있다.
하지만, 리모콘을 사용하는 경우에도, 사용자가 기능별로 조작키를 선택하여 입력해야 하므로, 그 사용이 불편하고, 실내가 어두울 경우 리모콘 및 조작키를 식별하기 위한 별도의 조명이 필요하게 되는 문제점이 있었다.
따라서, 음성인식 기술을 이용하여 홈 어플라이언스를 제어하는 방안에 대한 연구가 증가하고 있다.
종래 기술 1(공개특허공보 10-1999-00069703호)은 공기조화기용 리모콘이 음성 입력부 및 신호 처리부를 구비하여 음성 인식에 따른 조작 신호를 생성, 전송한다.
종래 기술 2(공개특허공보 10-2006-0015092호)는 입력되는 음성신호를 디지털 신호 및 텍스트로 변환 후, 데이터베이스 내 일치하는 제어 명령 존재 여부 확인하고, 일치하는 제어명령이 있으면 공기조화기 내 각 장치를 제어하며, 일치하는 제어명령이 없으면 키워드를 추출하여 연계된 제어명령에 따라 공기조화기 내 각 장치를 제어한다.
하지만, 리모콘 및 공기조화기 등 개별 장치가 구비할 수 있는 시스템 자원에는 한계가 있다. 특히 단순한 몇 가지 단어만 인식하는 것이 아니라 자연어를 인식하기 위해서는 높은 연산량이 요구되어 개별 장치에 장착되는 임베디드 모듈로는 구현이 어렵다.
따라서, 종래 기술 1과 종래 기술 2의 음성 인식 기술은, 전 세계 사용자들의 다양한 자연어 음성 명령을 인식하고 처리하는데 한계가 있었다.
그러므로, 개별 장치의 시스템 자원의 제약 없이 자연어를 인식하고 처리할 수 있고, 홈 어플라이언스를 편리하게 제어할 수 있는 방안이 요구된다.
본 발명의 목적은, 음성 인식 알고리즘을 사용자 특성에 맞게 제공할 수 있는 음성 인식 장치, 및 음성 인식 시스템을 제공함에 있다.
한편, 본 발명의 다른 목적은, 서버 시스템과의 통신에 의해 자연어 음성 인식을 수행할 수 있는 음성 인식 장치, 및 음성 인식 시스템을 제공함에 있다.
상기 목적을 달성하기 위한 본 발명의 실시예에 따른 음성 인식 장치는, 음성 명령을 수신하는 마이크와, 제1 음성 인식 알고리즘을 저장하는 메모리와, 음성 명령을, 서버 시스템으로 전송하고, 제1 음성 인식 알고리즘 관련 업데이트 데이터를, 서버 시스템으로부터 수신하는 통신 모듈과, 제1 음성 인식 알고리즘 관련 업데이트 데이터를 기초로, 메모리에 저장된, 제1 음성 인식 알고리즘을 업데이트하도록 제어하는 제어부를 포함한다.
한편, 상기 목적을 달성하기 위한 본 발명의 실시예에 따른 음성 인식 시스템은, 제1 음성 인식 알고리즘을 저장하며, 음성 명령을 전송하는 음성 인식 장치와, 제2 음성 인식 알고리즘을 저장하는 저장부와, 음성 명령을 수신하는 통신 모듈과, 제2 음성 인식 알고리즘을 기초로, 음성 명령을 인식하는 프로세서를 구비하는 서버 시스템을 포함하고, 서버 시스템은, 제1 음성 인식 알고리즘 관련 업데이트 데이터를, 음성 인식 장치로 전송하고, 제2 음성 인식 알고리즘 관련 업데이트 데이터를 기초로, 서버 시스템에 저장된, 제2 음성 인식 알고리즘을 업데이트하며, 음성 인식 장치는, 제1 음성 인식 알고리즘 관련 업데이트 데이터를 기초로, 음성 인식 장치에 저장된, 제1 음성 인식 알고리즘을 업데이트한다.
본 발명의 실시예에 따른 음성 인식 장치는, 음성 명령을 수신하는 마이크와, 제1 음성 인식 알고리즘을 저장하는 메모리와, 음성 명령을, 서버 시스템으로 전송하고, 제1 음성 인식 알고리즘 관련 업데이트 데이터를, 서버 시스템으로부터 수신하는 통신 모듈과, 제1 음성 인식 알고리즘 관련 업데이트 데이터를 기초로, 메모리에 저장된, 제1 음성 인식 알고리즘을 업데이트하도록 제어하는 제어부를 포함함으로써, 음성 인식 알고리즘을 사용자 특성에 맞게 제공할 수 있게 된다.
특히, 음성 인식 장치는, 서버 시스템으로부터, 사용자 음성 인식 알고리즘 관련 업데이트 데이터를 받아 업데이트를 수행하므로, 사용자 특성에 맞게 최적화 된, 음성 인식 알고리즘을 제공할 수 있다.
또한, 음성 인식 장치는, 사용자 특성에 맞는, 음성 인식 알고리즘의 주기적 혹은 비 주기적인 업데이트 데이터를 수신할 수 있다.
또한, 음성 인식 장치는, 서버 시스템를 통해 개선된 음성 인식 알고리즘 관련 업데이트 데이터를 수신하여 업데이트를 진행하므로, 서버 시스템에 저장된 음성 인식 알고리즘의 업데이트에 비해, 모듈에 저장된 음성 인식 알고리즘의 업데이트가 어렵다는 문제점을 해결할 수도 있다.
또한, 음성 인식 장치는, 음성 인식 알고리즘의 업데이트로 인하여, 사용자 음성 인식 성능을 향상 시킬 수 있다.
또한, 음성 인식 장치는, 서버 시스템에 버전 정보를 요청하여, 서버 시스템에 저장된 버전이 최신 버전인 경우, 업데이트 데이터를 수신 받아 업데이트를 진행할 수 있으므로, 음성 인식 장치는, 음성 인식 장치에 저장된 음성 인식 알고리즘을 최신의 버전으로 유지하여, 개선된 음성 인식 기능을 제공할 수 있게 된다.
또한, 본 발명의 실시예들 중 적어도 하나에 의하면, 효율적으로 자연어를 인식, 처리할 수 있다.
또한, 본 발명의 실시예들 중 적어도 하나에 의하면, 음성 인식 과정 및 홈 어플라이언스 제어 과정 중에 발생할 수 있는 다양한 상황들을 고려한 사용자 경험(User Experience, UX)을 제공할 수 있다.
한편, 본 발명의 실시예에 따른 음성 인식 시스템은, 제1 음성 인식 알고리즘을 저장하며, 음성 명령을 전송하는 음성 인식 장치와, 제2 음성 인식 알고리즘을 저장하는 저장부와, 음성 명령을 수신하는 통신 모듈과, 제2 음성 인식 알고리즘을 기초로, 음성 명령을 인식하는 프로세서를 구비하는 서버 시스템을 포함하고, 서버 시스템은, 제1 음성 인식 알고리즘 관련 업데이트 데이터를, 음성 인식 장치로 전송하고, 제2 음성 인식 알고리즘 관련 업데이트 데이터를 기초로, 서버 시스템에 저장된, 제2 음성 인식 알고리즘을 업데이트하며, 음성 인식 장치는, 제1 음성 인식 알고리즘 관련 업데이트 데이터를 기초로, 음성 인식 장치에 저장된, 제1 음성 인식 알고리즘을 업데이트함으로써,음성 인식 알고리즘을 사용자 특성에 맞게 제공할 수 있게 된다.
특히, 음성 인식 시스템은, 서버 시스템을 통해 음성 인식 알고리즘을 업데이트하므로, 통합적인 업데이트 관리가 가능하다는 장점이 있다.
또한, 음성 인식 시스템은, 간단한 음성 인식은 음성 인식 장치가 수행하고, 자연어 처리 등 고차원의 음성 인식을 서버 시스템에서 수행될 수 있어, 자연어 음성 제어가 갖는 장점은 그대로 유지하면서도, 간단한 명령에 대해서는, 서버 시스템와 무관하게 즉각적인 대응이 가능하다.
또한, 음성 인식 시스템은, 지역별 언어 차이에 의한 사용자 지역 음성 인식 알고리즘을 이용하므로, 음성 인식 기술의 경우, 지역별 인식 편차가 존재하여, 하나의 소프트웨어로 모두에게 같은 수준의 성능을 확보하기 어렵다는 문제점을 해결할 수 있다.
도 1은 본 발명의 일 실시예에 따른 홈 네트워크 시스템을 도시한 것이다.
도 2는 본 발명의 다른 실시예에 따른 홈 네트워크 시스템을 도시한 것이다.
도 3은 본 발명의 일 실시예에 따른 음성 인식 장치를 도시한 사시도이다.
도 4는 음성 인식 장치의 정면도(a)와, (a)에 표시된 A1-A1을 따라 취한 단면도(b)이다.
도 5는 도 4의 일부분을 확대하여 도시한 것이다.
도 6a은 음성 인식 장치의 우측면도이다.
도 6b는 도 6a에 표시된 각 부분에서 취한 그릴의 단면도들이다.
도 7은 음성 인식 장치를 구성하는 주요부들 간의 제어관계를 도시한 블록도이다.
도 8은 커버의 분해 사시도이다.
도 9는 윈도우가 제거된 커버를 도시한 것이다.
도 10은 음성입력 PCB가 윈도우 서포트에 결합되기 전 상태의 분해도이다.
도 11은 음성입력 PCB가 윈도우 서포트에 결합된 상태의 단면도이다.
도 12a는 윈도우 서포트의 상면이 보이는 사시도이다.
도 12b는 윈도우 서포트의 저면이 보이는 사시도이다.
도 12c는 윈도우 서포트의 우측면도이다.
도 12d는 윈도우 서포트의 저면도이다.
도 13은 도 9에 도시된 커버를 전면에서 바라본 것이다.
도 14a는 도 13에 표시된 B3-B3을 따라 취한 단면도이다.
도 14b는 도 13에 표시된 A3-A3을 따라 취한 단면도이다.
도 14c는 도 13에 표시된 C3-C3을 따라 취한 단면도이다.
도 14d는 도 13에 표시된 D3-D3을 따라 취한 단면도이다.
도 15은 커버의 우측면도이다.
도 16a는 도 15의 F1-F1을 따라 취한 단면도이다.
도 16b는 도 15의 F2-F2를 따라 취한 단면도이다.
도 17은 도 9에 도시된 조립체에서 윈도우 서포트를 제거한 것을 도시한 것이다.
도 18은 도 17에 도시된 조립체에서 디스플레이를 제거한 것을 도시한 것이다.
도 19는 디스플레이 PCB의 평면도이다.
도 20은 디스플레이 PCB를 저면이 보이도록 도시한 사시도이다.
도 21은 커버와 불륨 버튼의 분해 사시도이다.
도 22는 커버 하우징의 평면도(a)와, 사시도(b)이다.
도 23은 커버 하우징의 배면도이다.
도 24는 본체를 상면이 보이도록 도시한 사시도이다.
도 25는 본체를 저면이 보이도록 도시한 사시도이다.
도 26은 전면 케이스(a)와, 후면 케이스(b)를 도시한 것이다.
도 27은 본체의 후면을 도시한 것이다.
도 28은 와이파이 모듈과 연결된 안테나들의 위치를 보이는 도면이다.
도 29는 블루투스 모듈과 연결된 안테나와, 직비 모듈과 연결된 안테나의 위치를 보이는 도면이다.
도 30은 본체, 방열판, 메인 PCB, 베이스 바디 및 지지 러버의 분해 사시도이다.
도 31은 본 발명의 일 실시예에 따른 음성 인식 서버 시스템 및 음성 인식 장치를 포함하는 스마트 홈 시스템을 간략히 도시한 도면이다.
도 32a는 본 발명의 일 실시예에 따른 음성 인식 서버 시스템의 일예이다.
도 32b는 본 발명의 일 실시예에 따른 음성 인식 서버 시스템의 일예이다.
도 33 내지 도 35는 본 발명의 일 실시예에 따른 음성 인식 서버 시스템의 신호 흐름을 예시한 도면이다.
도 36 내지 도 38은 본 발명의 일 실시예에 따른 음성 인식 서버 시스템의 신호 흐름을 예시한 도면이다.
도 39는 본 발명의 일 실시예에 따른 서버의 내부 블록도의 일예를 도시한 도면이다.
도 40은 본 발명의 일 실시예에 따른 음성 인식 장치의 내부 블록도의 일예를 도시한 도면이다.
도 41은 본 발명의 일 실시예에 따른, 음성 인식 장치, 및 음성 인식 시스템의 동작방법에 대한 순서도이다.
도 42는 본 발명의 다른 실시예에 따른, 음성 인식 장치, 및 음성 인식 시스템의 동작방법에 대한 순서도이다.
도 43 내지 도 48은 도 41 또는 도 42의 동작 방법을 설명하기 위한 참조도면이다.
도 49는 본 발명의 또 다른 실시예에 따른, 음성 인식 장치, 및 음성 인식 시스템의 동작 방법에 대한 순서도이다.
도 50 내지 도 51c는 도 49의 동작 방법 설명에 참조되는 도면이다.
이하에서는 첨부한 도면을 참조하여 본 발명의 실시예를 상세하게 설명한다. 그러나 본 발명이 이러한 실시예에 한정되는 것은 아니며 다양한 형태로 변형될 수 있음은 물론이다.
도면에서는 본 발명을 명확하고 간략하게 설명하기 위하여 설명과 관계없는 부분의 도시를 생략하였으며, 명세서 전체를 통하여 동일 또는 극히 유사한 부분에 대해서는 동일한 도면 참조부호를 사용한다.
한편, 이하의 설명에서 사용되는 구성요소에 대한 접미사 "모듈" 및 "부"는 단순히 본 명세서 작성의 용이함만이 고려되어 부여되는 것으로서, 그 자체로 특별히 중요한 의미 또는 역할을 부여하는 것은 아니다. 따라서, "모듈" 및 "부"는 서로 혼용되어 사용될 수도 있다.
도 1은 본 발명의 일 실시예에 따른 네트워크 시스템을 도시한 것이다.
네트워크 시스템은, 가정이나 사무실 등의 일정한 공간 내에서 상호 통신함으로써 네트워크를 구축하는 기기들의 집합체이다. 이러한 네트워크 시스템의 일 실시예로써, 도 1은 가정 내에 구축된 홈 네트워크 시스템을 도시하고 있다.
이하, 장치(1)는 음향 출력 기능을 갖춘 통신 네트워크용 음성 인식 장치(Hub, 1)를 예로 드나, 반드시 이에 한정되어야 하는 것은 아니다. 관점에 따라서는 장치(1)를 음향출력장치라고 칭할 수도 있음을 명시한다.
도 1을 참조하면, 본 발명의 일 실시예에 따른 네트워크 시스템은 액세서리(accessary, 2, 3a, 3b), 게이트웨이(gateway, 4), 액세스 포인트(Access Point, 7) 및 음성 인식 장치(1) 또는 음향출력장치를 포함할 수 있다.
액세서리(2, 3a, 3b), 게이트웨이(4), 액세스 포인트(7) 및/또는 음성 인식 장치(1)는 정해진 통신규약(protocol)에 따라 상호 통신이 가능하고, 이러한 통신은 와이파이(Wi-Fi), 이더넷(Ethernet), 직비(Zigbee), 지-웨이브(Z-wave), 블루투스(Bluetooth) 등의 기술을 기반으로 이루어질 수 있다.
와이파이(Wi-fi)는 본래 와이파이 얼라이언스(Wi-Fi Alliance)의 상표명이나, 무선통신 기술로써 통용되고 있는 용어로써, 무선 랜(WLAN) 규격(IEEE 802.11)에서 정한 제반 규정에 따라 장치들 간의 무선랜 연결과, 장치 간 연결(와이파이 P2P), 들 간의 무선랜 연결과, PAN/LAN/WAN 구성 등을 지원하는 일련의 기술을 뜻한다. 이하, "와이파이 모듈"은 와이파이 기술을 기반으로 무선 통신을 하는 기기로 정의한다.
이더넷(Ethernet)은, 국제전자공학협회(IEEE)의 802.3 표준에 따른 네트워킹 기술로서, 근거리 통신망(LAN) 하드웨어, 프로토콜, 케이블의 가장 대표적인 표준이다. 이더넷은 데이터 전송을 위해 주로 CSMA/CD(carrier sense multiple access with collision detection) 방식을 사용한다. 이하, "이더넷 모듈"은 이더넷 기술을 기반으로 통신을 하는 기기로 정의한다.
직비(Zigbee)는 소형, 저전력 디지털 라디오를 이용해 개인 통신망을 구성하여 통신하기 위한 무선 네트워크 기술로써, IEEE 802.15에서 정한 규정에 따른 통신 방식이다. 작은 크기로 전력 소모량이 적고 값이 싸 홈 네트워크 등 유비쿼터스 구축 솔루션으로 각광받고 있으며 지능형 홈 네트워크, 빌딩 등의 근거리 통신 시장과 산업용 기기 자동화, 물류, 휴먼 인터페이스, 텔레매틱스, 환경 모니터링, 군사 등에 활용된다.
직비 프로토콜은 물리 계층, 미디어 액세스 제어(MAC) 계층, 네트워크 계층, 그리고 어플리케이션 계층으로 이루어져 있다. 직비의 물리 계층과 MAC 계층은 IEEE 802.15.4 표준에 정의되어 있다.
직비 네트워크 계층은 트리 구조와 메쉬 구조를 위한 라우팅과 어드레싱를 지원하고 있으며, 어플리케이션 프로파일로는 ZigBee Home Automation Public Profile과 ZigBee Smart Energy Profile이 대표적으로 사용된다. 또 새로운 직비 사양인 RF4CE는 가전의 원격 제어를 위한 솔루션과 스타 토폴로지를 위한 간단한 네트워크 스택을 정의하고 있는데, RF4CE는 2.4GHz의 주파수 대역을 사용하고 AES-128을 이용한 보안을 제공한다.
직비는 낮은 수준의 전송 속도로도 충분하면서 긴 베터리 수명과 보안성을 요구하는 분야에서 주로 사용되며, 주기적 또는 간헐적인 데이터 전송이나 센서 및 입력 장치 등의 단순 신호 전달을 위한 데이터 전송에 적합하다. 응용 분야에는 무선 조명 스위치, 가내 전력량계, 교통 관리 시스템, 그 밖에 근거리 저속 통신을 필요로 하는 개인 및 산업용 장치 등이 있다. 직비는 블루투스나 와이파이 같은 다른 WPAN 기술에 비해 상대적으로 더 단순하고 저렴하다는 장점이 있다. 이하, "직비 모듈"은 직비 기술을 기반으로 무선 통신을 실시하는 기기로 정의한다.
지웨이브(Z-wave)는 가정 자동화와 센서 네트워크와 같은 저전력과 저대역폭을 요구하는 장치를 위해 설계된 무선 전송 방식으로써, 무선 네트워크에서 하나 이상의 노드들과 제어 유니트 사이에서 신뢰성 있는 통신을 제공하는 것을 주 목적으로 한다. 지웨이브는 물리 계층, 미디어 액세스 제어(MAC) 계층, 전송 계층, 라우팅 계층, 그리고 어플리케이션 계층으로 구성되어 있으며, 900MHz 대역(유럽: 869MHz, 미국: 908MHz)과 2.4GHz 대역을 사용하면서 9.6kbps, 40kbps, 그리고 200kbps의 속도를 제공한다. 이하, "지웨이브 모듈"은 지웨이브 기술을 기반으로 무선 통신을 실시하는 기기로 정의한다.
액세서리(2)는 사용자가 원하는 임의의 위치에 설치가 가능하며, 온도 센서, 습도 센서, 진동 센서, 근접 센서, 적외선(IR: Infrared) 센서 등의 각종 센서를 구비할 수 있다. 이들 센서들에 의해 획득된 정보는 네트워크를 통해 음성 인식 장치(1)로 전송될 수 있으며, 역으로, 음성 인식 장치(1)로부터 상기 센서들의 제어를 위한 신호가 액세서리(2)로 전송되는 것도 가능하다.
또한, 액세서리(2)는 주변에 위치한 가전기기의 원격제어가 가능하도록 구성될 수 있다. 예를 들어, 액세서리(2)는 네트워크를 통해 전송된 제어 신호에 따라 적외선 신호를 발신하는 발신 장치를 포함할 수 있다.
한편, 적외선 센서는 적외선을 조사하는 발신부와, 상기 발신부로부터 조사된 적외선이 물체에 맞고 반사된 경우에 이를 수신하는 수신부를 포함할 수 있다.
액세스 포인트(Access Point, 7)는 무선장비를 네트워크에 연결할 수 있도록 중계하는 장치로써, 홈 네트워크를 인터넷과 연결한다. 가전기기(5)와, 음성 인식 장치(1), 액세서리(3b) 등은 액세스 포인트(7)와 유선(예를 들어, 이더넷) 또는 무선(예를 들어, 와이파이)으로 연결될 수 있다.
게이트웨이(4)는 프로토콜이 다른 네트워크들이 서로 정보를 주고 받을 수 있도록, 이들 네트워크들을 서로 연결하는 장치이다. 예를 들어, 액세서리(2, 3b)로부터 수신된 직비(또는, 지웨이브) 방식의 신호를 와이파이 방식의 신호로 변환함으로써, 액세서리(2, 3b)와 액세스 포인트(7)를 중계할 수 있다.
한편, 홈 네트워크 시스템은 액세스 포인트(7)를 통해 인터넷과 접속이 가능하며, 이를 통해 인터넷을 통해 서비스를 제공하는 서버(8)와 접속될 수 있다. 서버(또는, 클라우드(cloud), 8)는 액세서리(2, 3a, 3b) 및/또는 음성 인식 장치(1)를 제조하는 제조자, 판매하는 판매자 또는 상기 제조자 또는 판매자와 계약된 서비스 제공자에 의해 관리될 수 있다. 서버(8)는 소프트웨어와 데이터를 저장하며, 상기 데이터는 홈네트워크로부터 받은 것일 수 있다. 음성 인식 장치(1)로부터 요청이 있을 시, 서버(8)는 저장된 소프트웨어나 데이터를 인터넷을 통해 홈 네트워크로 전송할 수 있다.
서버(8)는 인터넷에 접속된 PC(personal computer), 스마트 폰(smart phone) 등의 이동 단말기(mobile terminal)와도 정보를 주고 받을 수 있다. 음성 인식 장치(1)나 액세서리(2, 3a, 3b)로부터 전송된 정보는 서버(8)에 저장될 수 있으며, 이러한 정보들은 서버(8)와 접속된 이동 단말기(6)로 전송될 수 있다. 또한, 이동 단말기(6)로부터 전송된 정보 역시 서버(8)를 경유하여 음성 인식 장치(1)나 액세서리(2, 3a, 3b)로 전송될 수 있으며, 따라서, 이동 단말기(6)를 통해 음성 인식 장치(1)나 악세서리(2, 3a, 3b)를 제어하는 것도 가능하다.
이동 단말기(6)의 일종으로써, 최근에 널리 이용되고 있는 스마트폰(smart phone)은 그래픽 기반의 편리한 UI를 제공하기 때문에, 상기 UI를 통해 액세서리(2, 3a, 3b)를 제어하거나, 액세서리(2, 3a, 3b)로부터 수신한 정보를 가공하여 표시하는 것이 가능하다. 또한, 스마트폰에 탑재된 어플리케이션(application)을 업데이트함으로써, 액세서리(2, 3a, 3b)를 통해 구현 가능한 기능을 확장 또는 변경할 수도 있다. 그러나, 이동 단말기(6)를 활용하지 않고, 음성 인식 장치(1) 만으로도 액세서리(2, 3a, 3b)를 제어하거나, 액세서리(2, 3a, 3b)로부터 수신한 정보를 가공하여 표시하는 것도 가능하다.
게이트웨이(4)와 액세스 포인트(7)를 매개로, 음성 인식 장치(1)와 액세서리(2, 3a, 3b) 상호 간의 통신이 이루어질 수 있으며, 구체적으로, 액세서리(2, 3b)로부터 출력된 신호(또는, 정보)가 게이트웨이(4)와 액세스 포인트(7)를 차례로 경유하여 음성 인식 장치(1)로 전송되며, 반대로, 음성 인식 장치(1)로부터 출력된 정보는 액세스 포인트(7)와 게이트웨이(4)를 차례로 경유하여 액세서리(2, 3b)로 전송될 수 있다. 실시예에 따라, 액세서리(2, 3a, 3b)와 음성 인식 장치(1) 간의 통신은, 네트워크가 인터넷과 단절된 경우에도 가능하다.
이상에서 설명한 액세서리들(2, 3a, 3b) 이외에도, 실시예에 따라 다양한 종류의 액세서리가 제공될 수 있다. 예를 들어, 액세서리는 공기의 질을 감지하는 공기질 센서, 스마트 플러그, CT센서, nest 온도조절기, 수면센서 등을 포함하여 구성될 수 있다.
액세서리는 가전기기(5)에 부착될 수 있다. 예를 들어, 진동센서를 구비한 액세서리를 세탁기에 부착하여, 세탁기 작동 중에 발생하는 진동을 감지할 수 있으며, 감지된 진동에 따라 상기 진동센서로부터 출력된 신호가 네트워크로 전송될 수 있다.
이에 한하지 않고, 액세서리는 가전기기(5) 이외의 장소에 부착될 수도 있다. 예를 들어, 주거 내 도어의 개폐를 감지하고자 하는 경우, 동작 감지 센서(예를 들어, 적외선 센서)를 구비한 액세서리를 벽면에 부착하여, 상기 도어의 개폐 동작을 감지할 수 있다. 장기간 상기 주거 내 도어의 개폐 동작이 감지되지 않은 경우에는, 거주인에게 변고가 발생되었을 가능성이 있는 바, 이러한 사정이 기 설정된 이동 단말기(6)로 통보될 수 있다.
더 나아가, 상기 동작 감지 센서를 구비한 액세서리를 이용하여, 냉장고 도어의 개폐 동작을 감지하고, 장기간 상기 냉장고 도어의 개폐 동작이 감지되지 않은 경우에는, 거주인에게 변고가 발생되었을 가능성이 있는 바, 이러한 사정이 기 설정된 이동 단말기(6)로 통보될 수 있다.
이와 같은 여러 실시예들에서, 액세서리로부터 네트워크를 통해 전송된 신호는 이동 단말기(6)에 의해 수신될 수 있으며, 이동 단말기(6)에 탑재된 어플리케이션이 수신된 신호를 분석하여, 가전기기(5)의 작동 상태(예를 들어, 세탁기의 언밸런스 발생)나 도어의 개폐 정보를 파악할 수 있으며, 이러한 정보 또는 정보를 가공하여 도출된 결과(예를 들어, 세탁기의 비정상 동작을 알리는 경고, 또는, 장기간 도어가 개폐되지 않았는 바, 거주자의 신상을 확인할 것을 요구하는 알림 등)가 이동 단말기(6)의 디스플레이나 스피커를 통해 표시될 수 있다.
한편, 음성 인식 장치(1)는 마이크(미도시)를 포함할 수 있고, 상기 탑재된 음성 인식 프로그램에 따라 상기 마이크를 통해 입력된 음성으로부터 명령을 추출하고, 그에 따른 제어를 수행할 수 있다.
도 2는 본 발명의 다른 실시예에 따른 홈 네트워크 시스템을 도시한 것이다.
본 발명의 다른 실시예 따른 홈 네트워크 시스템은, 전술한 실시예와 비교할 시, 게이트웨이(4)가 구비되지 않으며, 게이트웨이(4)가 수행하던 기능을 음성 인식 장치(1)가 겸한다는 점에 있어서 차이가 있고, 그 이외의 특징들은 전술한 실시예의 경우와 실질적으로 동일하다.
액세서리(2, 3b)는 게이트웨이(4, 도 1 참조.)를 공유하지 않고, 음성 인식 장치(1)와 직접 통신이 가능하다. 바람직하게는, 액세서리(2, 3b)와 음성 인식 장치(1)는 직비 방식을 통해 통신하며, 이 경우, 액세서리(2, 3b)와 음성 인식 장치(1)에는 각각 직비 모듈이 구비될 수 있다.
도 3은 본 발명의 일 실시예에 따른 음성 인식 장치를 도시한 사시도이다. 도 4는 음성 인식 장치의 정면도(a)와, (a)에 표시된 A1-A1을 따라 취한 단면도(b)이다. 도 5는 도 4의 일부분을 확대하여 도시한 것이다. 도 6a은 음성 인식 장치의 우측면도이다. 도 6b는 도 6a에 표시된 각 부분에서 취한 그릴의 단면도들이다. 도 7은 음성 인식 장치를 구성하는 주요부들 간의 제어관계를 도시한 블록도이다. 도 8은 커버의 분해 사시도이다. 도 9는 윈도우가 제거된 커버를 도시한 것이다. 도 10은 음성입력 PCB가 윈도우 서포트에 결합되기 전 상태의 분해도이다. 도 11은 음성입력 PCB가 윈도우 서포트에 결합된 상태의 단면도이다.
도 3 내지 도 11을 참조하면, 본 발명의 일 실시예에 따른 음성 인식 장치(또는, 음성 인식 장치, 1)는 커버(10), 본체(40), 그릴(20) 및 베이스(30)를 포함할 수 있다. 본체(40)는 하측에 위치한 베이스(30)에 의해 지지되고, 본체(40)의 상부에는 커버(10)가 결합될 수 있다.
본체(40)는 그릴(20) 내에 배치된다. 본체(40) 전부가 완전히 그릴(20) 내에 배치되어야 하는 것은 아니며, 실시예에서와 같이, 본체(40)는 일부분이 그릴(20)의 상단을 통해 돌출될 수 있다. 그릴(20)은 다수개의 통공(20h)이 형성되고, 상하로 긴 원통형으로 이루어지며, 본체(40)를 둘러싼다.
통공(20h)을 통해 그릴(20) 내측으로 먼지가 들어가지 않도록, 그릴(20)의 내측면에는 다공성의 필터(미도시)가 부착될 수 있다. 상기 필터는 메쉬 또는 부직포 등의 미세한 소공을 갖는 재질로 이루어질 수 있다. 상기 필터는 양면 테이프 등의 접착 부재에 의해 그릴(20)의 내측면에 부착될 수 있다. 상기 필터는 그릴(20) 내에 배치된 스피커(43, 44), 본체 케이스(41, 42) 등의 구성이 통공(20h)을 통해 외부에서 보여지지 않도록 은폐하는 역할도 겸한다.
한편, 도 3에서는 그릴(20)의 일부분에는 통공(20h)이 형성되고, 다른 부분에는 생략되어 있으나, 이는 어디까지나 도면이 복잡해지는 것을 피하기 위해 생략된 것이며, 통공(20h)은 그릴(20)의 대부분의 영역에 형성되어, 후술하는 스피커(43, 44)로부터 출력된 소리가, 통공(20h)들을 통해 전, 후, 좌, 우, 사방으로 고르게 퍼져 나갈 수 있다.
커버(10)는 윈도우(11), 윈도우 서포트(12), 디스플레이(13), 디스플레이 PCB(Printed Circuit Board, 14) 및 커버 하우징(15)을 포함할 수 있다. 윈도우(11), 윈도우 서포트(12), 디스플레이(13) 및 디스플레이 PCB(14)는 커버 하우징(15) 내에 배치될 수 있다.
도 4 내지 도 5를 참조하면, 커버 하우징(15)은 재질은 합성수지이고, 본체(40)의 상부에 결합되며, 상면에는 개구부(15h)가 형성된다. 커버 하우징(15)은 원통형으로 이루어져, 상단이 개구부(15h)를 한정하는 측벽(151)과, 측벽(151)의 내측면에서 연장되어, 측벽(151) 내부를 상, 하로 구획하는 구획판(152)을 포함할 수 있다. 디스플레이 PCB(14), 디스플레이(13), 윈도우 서포트(12) 및 윈도우(11)는 구획판(152)의 상측에 배치된다. (커버 하우징(15)의 상세한 구성에 대해서는 도 21 내지 도 22를 더 참조.)
측벽(151)의 하단(151a)은, 바람직하게는, 그릴(20)의 상단과 접하나, 공차로 인한 미세한 유격이 양자 사이에 존재할 수 있다. 위에서 내려 다 볼 때, 측벽(151)의 하단(151a)은 그릴(20) 상단과 적어도 일부가 중첩되어 있다. 측벽(151)의 외측면과 그릴(20)의 외측면 사이에는 틈새가 존재하기는 하나, 상기 틈새를 제외하고는, 측벽(151)의 외측면과 그릴(20)의 외측면은 전체적으로 하나의 연속된 외형을 이룬다.
상단 유지부(153)는 측벽(151)의 하단(151a)으로부터 하측으로 연장되어, 그릴(20)과 결합된다. 이와 같은, 상단 유지부(153)와 그릴(20)의 결합은, 볼트 등의 별도의 체결부재를 이용한 것이 아니라, 상단 유지부(153)가 그릴(20)의 상단의 개구부 내로 삽입되는(또는, 끼워지는) 방식이며, 바람직하게는, 그릴(20)이나 상단 유지부(153) 자체가 갖는 탄성/복원력을 이용한 억지 끼움 방식이다.
상단 유지부(153)는 측벽(151)의 하단부보다 더 내측에 위치하며(즉, 커버 하우징(15)의 외측면이 측벽(151)의 하단(151a)에서 함몰되어 상단 유지부(153)의 외측면을 이룸.), 따라서, 측벽(151)의 하단에는, 측벽(151)의 외측면으로부터 상단 유지부(153)로 연장되어, 그릴(20)의 상단을 대향하는 면(157)이 형성된다.
커버 하우징(15)은 측벽(151)의 내측면으로부터 돌기(154)가 돌출될 수 있고, 본체(40)의 전면부에는 돌기(154)와 결합되는 돌기 삽입 홈(418)이 형성될 수 있다. 커버 하우징(15)과 본체(40)를 조립하는 과정에서 돌기(154)가 본체(40)의 외면을 따라 이동하다가, 돌기 삽입 홈(418)에 이르면, 합성수지재로 이루어진 커버 하우징(15) 자체의 탄력성에 의해, 돌기 삽입 홈(418)내로 삽입된다.
상단 유지부(153)의 외측면이 그릴(20)의 내측면과 접함으로써, 그릴(20) 상단의 형태가 유지된다. 특히, 그릴(20)이 금속재로 이루어진 경우, 그릴(20)은 상단 유지부(153)의 형상에 대응하여 변형이 이루어지기 때문에, 그릴(20)의 상단이 상단 유지부(153)와 대응하는 형태로 유지될 수 있다.
한편, 상단 유지부(153)가 측벽(151)의 하단(151a)을 따라 타원형으로 연장되는 경우, 금속 판재를 말아서 단면의 형태가 정원형인 원통형의 그릴(20)을 형성한 후, 그릴(20)의 상단을 상단 유지부(153)에 끼우면, 그릴(20)의 형태 역시 상단 유지부(153)의 형상과 대응하여 타원형으로 변형되고, 이렇게 변형이 이루어진 상태로 유지될 수 있다.
실시예에서와 같이, 반지름이 r인 정원형의 윈도우(11)가 소정의 수평면에 대해 소정의 각도(도 6a에 θ1으로 표시된 것으로, 예각임. 이하, "제1 각도"라고도 명명함.)로 기울어지고, 윈도우(11)의 상면에 대한 법선 벡터(Vs)를 수평면에 정사영하여 얻은 벡터 Vh가 정전방을 향하는 경우에, 윈도우(11)를 수평면에 정사영한 형태는, 전후 방향으로 rcosθ1의 단반경을 갖고, 좌우 방향으로 r의 장반경을 갖는 타원이 된다. 따라서, 음성 인식 장치(1) 외형의 일체감을 위해서는 그릴(20)의 단면 역시 상기 타원과 대응하는 형태(즉, 단반경과 장반경의 비가 cosθ1: 1이 되는 형태)로 이루어지는 것이 바람직하고, 상단 유지부(153)를 상기 타원과 대응하는 형태로 형성함으로써, 그릴(20)의 단면의 형태를 상기 타원과 대응하는 형상으로 유지시킬 수 있는 것이다. 여기서, "대응하는 형태"라 함은 양 도형들의 형태가 서로 완전히 일치하는 경우뿐만 아니라, 양 도형이 서로 닮은 꼴인 경우(예를 들어, 단반경 대 장반경의 비가 양 도형이 같은 경우)도 포함하며, 이하, 같은 의미로 정의한다.
여기서, 수평면에 대해 윈도우(11)가 기울어진 각도 θ1은 일반적인 사용환경에서 사용자의 시선을 고려하여 정해진 것으로써, 음성 인식 장치(1)가 주방의 조리대나 식탁 등의 대략 높이 1m 정도의 거치대에 거치된 경우에, 음성 인식 장치(1)의 전방에 위치한 일반적인 성인의 시선이 윈도우(11)의 상면과 90도 근접한 각도를 이룰 수 있도록 정해지며, 바람직하게는, 대략 20도이나, 반드시 이에 한정되어야 하는 것은 아니다.
한편, 디스플레이 패널(131)은 표시된 화면이 전방의 상측을 향하도록 수평에 대해 소정 각도로 기울어지게 배치될 수 있고, 바람직하게는, 윈도우(11)와 같은 각도(θ1)로 기울어져 있다. 후술하는 윈도우 지지판(121) 역시 디스플레이 패널(131) (또는, 윈도우(11))과 같은 각도로 기울어져 있다.
보다 상세하게, 도 6a 내지 도 6b을 참조하면, 커버 하우징(15)의 측벽(151)의 상단은 외경 L1인 정원형으로 이루어지고, 측벽(151)의 하단(151a)의 외경은, 수평면에 대해 각도 θ2(θ2<θ1. 이하, θ2를 "제2 각도"라고도 명명함.)로 기울어져, 좌우 방향으로는 La의 직경을 갖고, 전후방향으로 Lb의 직경을 갖는 형태이다. 여기서, 측벽(151)의 외측면은 수직선에 소정의 각도(θ3)로 기울어져 있기 때문에, 도 6b의 단면 S1을 수평면에 정사영한 형태와, 단면 S2를 수평면에 정사영한 형태가 정확하게 일치하지는 않으나, θ3이 그 값이 충분이 작다면(바람직하게는, 5도 이하), La는 L1과 근사한 값을 갖는 바, 이하, La=L1라고 가정한다. 더 나아가, θ1과 θ2의 차이가 충분히 작다면(바람직하게는, 5도 이하), Lb 역시 L1과 근사한 값을 갖는 바, 이하, Lb=L1라고 가정한다.
여기서, θ3는 측벽(151)의 외측면이 수직선과 이루는 각도를 표시한 것으로써, 측벽(151)의 외측면 전 구간에서 일정한 값을 가질 수도 있으나, 측벽(151)의 둘레를 따라 그 값이 가변되는 것도 가능하다.
한편, 도 6b의 단면 S3과 S4를 참조하면, 그릴(20)은 외경이 타원형(L1>L2)으로써, 좌우 방향으로 L1의 장직경과, 전후 방향으로 L2의 단직경을 갖는다. 여기서, 위에서 가정한 바와 같이, La=L1, Lb=L1라고 할 때, L2는 L1cosθ1이 된다. 즉, 수평면에 정사영한 그릴(20)의 외형은 전후 방향의 직경(L2)이 좌우방향의 직격(L1)보다 짧은 형태의 타원이 된다. 윈도우(11)가 기울어져 배치되었음에도, 음성 인식 장치(1)를 위에서 내려다 볼 시, 그 외형이 전체적으로 타원형이 되어 일체감을 이룬다.
측벽(151)은 그릴(20)의 상측에 위치하기 때문에, 음성 인식 장치(1)의 외관을 이루나, 상단 유지부(153)는 그릴(20)의 내측으로 완전히 삽입되어, 그릴(20)에 의해 가려짐으로써, 음성 인식 장치(1)의 외관상 보이지 않는다.
측벽(151)의 하단으로부터 위치 설정 돌기(156, 도 23 참조.)가 돌출될 수 있고, 그릴(20)의 상단에는 그릴(20)이 정위치된 상태에서 위치 설정 돌기(156)가 삽입되는 위치 설정 홈이 형성될 수 있다.
윈도우(11)는 커버 하우징(15)의 개구부(15h) 내에 배치될 수 있다. 윈도우(11)는 일정한 두께의 투명판을 가공한 것으로써, 측면(또는, 외주면)이 상면 및 하면과 직교한다.
커버 하우징(15)의 내측면은, 커버 하우징(15)의 상단으로부터 하측으로 연장된 일정 부분(151b)이, 윈도우(11)의 상면이 향하는 방향(즉, 도 6a에서 법선 벡터 Vs이 향하는 방향)과 평행하다. 측벽(151) 의 상단부 내측면(151a)은 개구부(15h)를 한정하는 면인 바, 이하, 측벽(151)의 상단부 내측면(151b)을 개구부 한정면이라고 한다. 개구부 한정면(151b)은 개구부(15h)의 둘레부터 연장된 원통형으로 이루어지고, 개구부 한정면(151b)에 의해 둘러싸인 내측에 윈도우(11)가 배치된다. 바람직하게는, 윈도우(11)의 상면이 커버 하우징(15)의 상단과 같은 평면(또는, 개구부(15h)가 속하는 평면)에 속함으로써, 음성 인식 장치(1)의 상면이 하나의 평면으로 이루어진 것 같은 일체감이 조성된다.
개구부 한정면(151b)은 어느 위치에서나 벡터 Vs와 평행한 면으로 이루어진다. 즉, 벡터 Vs와 평행한 임의의 평면으로 커버 하우징(15)을 절단하더라도, 그 단면 상에서 개구부 한정면(151b)은 벡터 Vs와 평행하다.
개구부 한정면(151b)과 윈도우(11)의 측면이 평행하기 때문에, 윈도우(11)의 중심과 개구부 한정면(151b)의 중심을 벡터 Vs을 따라 정렬시키면, 윈도우(11)의 측면의 전 구간이 개구부 한정면(151b)과 일정한 간격(g)을 유지할 수 있는 효과가 있다. 이는 음성 인식 장치(1)를 위에서 내려다 보았을 시, 윈도우(11)와 커버 하우징(15)의 상단 사이에 일정한 간격(g)이 유지되는 것으로써, 제품의 완성도가 높아 보이는 것이기도 하다. 간격(g)은, 컨택 스위치(181a, 181b, 181c, 181d)를 동작시키기 위해 윈도우(11)가 가압될 시, 윈도우(11)의 측면이 개구부 한정면(151b)과 간섭되지 않도록 하는 조건하에서 최소로 설정되는 것이 바람직하다.
커버 하우징(15)을 임의의 수직한 평면으로 절단한 경우, 그 절단면 상에서, 측벽(151)의 외측면은 법선 벡터(Vs)와 평행하거나, 하측으로 갈수록 법선 벡터(Vs)로부터 점점 멀어지는 형태를 이룰 수 있다. 커버 하우징(15)을 사출 성형할 시, 측벽(151)을 형성하는 제1 금형으로부터 커버 하우징(15)은 연직 하방으로 취출된다. 따라서, 상기 제1 금형으로부터 커버 하우징(15)이 잘 빠질 수 있기 위해서는 측벽(151)의 외측면이 위와 같은 형태가 되어야 하는 것이다.
이에 반해, 커버 하우징(15)의 상면에 개구부(15h)를 형성하기 위해서는 개구부(15h)내로 삽입되는 코어를 갖는 별도의 제2 금형이 필요하다. 상기 제1 금형이 제거된 상태에서, 상기 제2 금형을 이동시킴으로써, 커버 하우징(15)을 상기 제2 금형으로부터 분리할 수 있는데, 이때, 상기 제2 금형의 이동은 법선 벡터(Vs)와 동일한 방향으로 이루어진다.
도 12a는 윈도우 서포트의 상면이 보이는 사시도이다. 도 12b는 윈도우 서포트의 저면이 보이는 사시도이다. 도 12c는 윈도우 서포트의 우측면도이다. 도 12d는 윈도우 서포트의 저면도이다. 도 13은 도 9에 도시된 커버를 전면에서 바라본 것이다. 도 14a는 도 13에 표시된 B3-B3을 따라 취한 단면도이다. 도 14b는 도 13에 표시된 A3-A3을 따라 취한 단면도이다. 도 14c는 도 13에 표시된 C3-C3을 따라 취한 단면도이다. 도 14d는 도 13에 표시된 D3-D3을 따라 취한 단면도이다. 도 15은 커버의 우측면도이다. 도 16a는 도 15의 F1-F1을 따라 취한 단면도이다. 도 16b는 도 15의 F2-F2를 따라 취한 단면도이다. 도 17은 도 9에 도시된 조립체에서 윈도우 서포트를 제거한 것을 도시한 것이다. 도 18은 도 17에 도시된 조립체에서 디스플레이를 제거한 것을 도시한 것이다. 도 19는 디스플레이 PCB의 평면도이다. 도 20은 디스플레이 PCB를 저면이 보이도록 도시한 사시도이다. 도 21은 커버와 불륨 버튼의 분해 사시도이다. 도 22는 커버 하우징의 평면도(a)와, 사시도(b)이다. 도 23은 커버 하우징의 배면도이다. 이하, 도 12a 내지 도 23을 참조한다.
도 8, 도 17 내지 도 20을 참조하면, 디스플레이 PCB(14)는 구획판(152)의 상면에 배치되어, 디스플레이(13)를 하측에서 지지한다. 디스플레이 PCB(14)는 디스플레이(13)와 전기적으로 연결되는 회로를 포함하여 구성되며, 디스플레이(13)는 커넥터(132)를 통해 상기 회로와 연결되어 있다. 디스플레이 PCB(14)의 상면에는, 디스플레이(13)를 기준으로 전, 후, 좌, 우로 4개의 컨택 스위치(181a, 181b, 181c, 181d)가 배치될 수 있다.
디스플레이 PCB(14)는 중심부로부터 전, 후, 좌, 우로 연장된 십자형태로 이루어질 수 있다. 보다 상세하게, 디스플레이 PCB(14)의 회로가 구성된 기판(140)은, 대략 중심부로부터 각각 후방, 전방, 좌측, 우측의 사방으로 연장된 제1 기판 암(145), 제2 기판 암(146), 제3 기판 암(147) 및 제4 기판 암(148)을 포함할 수 있다. 기판(140)은 대략 십자 형태이나, 이러한 형태가 반드시 대칭이어야 할 필요는 없다.
도 17 내지 도 18을 참조하면, 커버 하우징(15)의 구획판(152)의 상면에는, 디스플레이 PCB(14)의 둘레와 접하는 위치에서 돌출되는 리브(152a)가 형성될 수 있다. 리브(152a)는 디스플레이 PCB(14)의 둘레 전체와 대응하는 형태로 반드시 이루어져야 하는 것은 아니며, 디스플레이 PCB(14)의 둘레의 일부만 접하여도 되고, 실시예에서와 같이, 디스플레이 PCB(14)의 둘레를 따라 다수의 지점에 형성될 수도 있다. 특히, 리브(152a)는 기판 암(145, 146, 147, 148)의 측변(즉, 기판(140)의 중심부로부터 외측으로 연장되는 변)과 접하는 위치들에 형성될 수 있다.
기판 암들(145, 146, 147, 148) 각각에는 제1 컨택 스위치(contact switch, 181a), 제2 컨택 스위치(181b), 제3 컨택 스위치(181c) 및 제4 컨택 스위치(181d)가 배치될 수 있다. 컨택 스위치들(181a, 181b, 181c, 181d)은 기판(140)에 형성된 회로와 전기적으로 연결되어 있다.
디스플레이 PCB(14)에는 NFC 모듈(50d, 도 7 참조.)이 배치될 수 있다. NFC 모듈(50d)은 NFC 통신을 가능하게 하는 것으로써, 제2 기판 암(146)에 형성된 NFC 장착부(146a)에 배치될 수 있다. NFC(Near Field Communication)는 무선태그(RFID) 기술 중 하나로 13.56MHz의 주파수 대역을 사용하는 비접촉식 통신 기술이다. 통신거리가 짧기 때문에 상대적으로 보안이 우수하고 가격이 저렴해 주목받는 차세대 근거리 통신 기술이다. 데이터 읽기와 쓰기 기능을 모두 사용할 수 있기 때문에 기존에 RFID 사용을 위해 필요했던 동글(리더)이 필요하지 않다. 블루투스 등 기존의 근거리 통신 기술과 비슷하지만 블루투스처럼 기기 간 설정을 하지 않아도 되는 이점이 있다.
디스플레이(13)는 전기 신호를 입력 받아 화상을 표시하는 장치로써, 디스플레이 PCB(14)의 회로에 접속되어 있으며, 상기 회로를 통해 입력된 제어 신호에 따라 화상을 표시한다. 디스플레이(13)는 디스플레이 패널(131)과, 디스플레이 패널(131)을 디스플레이 PCB(14)의 회로와 연결하는 커넥터(132)를 포함할 수 있다 (도 8 참조.). 디스플레이 패널(131)은 접착부재(예를 들어, 양면 테이프(171, 도 17 참조))에 의해 디스플레이 PCB(14)의 상면에 부착될 수 있다.
디스플레이 PCB(14)는 후술하는 메인 PCB(48)와 소정의 케이블(미도시)을 통해 회로 연결되어 있으며, 따라서, 디스플레이(13)를 제어하기 위한 제어부는 디스플레이 PCB(14)나 메인 PCB(48) 중 어느 곳에 실장되어도 무방하다. 이하, 디스플레이(13)는 메인 PCB(48)에 실장된 제어부(82, 도 7 참조.)에 의해 제어되는 것을 예로 든다. 본체(40)의 측면에는 상기 케이블을 수용하기 위한 홈(429)이 상하 방향으로 길게 형성될 수 있다.
디스플레이 패널(131)의 화면에는 각종 정보들이 표시될 수 있다. 제어부(240)는 메모리(250)에 저장된 프로그램에 따라 디스플레이 패널(131)의 구동뿐만 아니라, 음성 인식 장치(1)를 구성하는 전장품에 대한 작동 전반을 제어할 수 있다. 디스플레이 패널(131)을 통해 사용자 인터페이스(UI: User Interface)가 표시될 수 있으며, 이러한 인터페이스는 상기 프로그램이 실행됨으로써 구현된다.
상기 인터페이스는 스피커(43, 44)의 재생 정보를 표시할 수 있다. 예를 들어, 음악의 재생/정지/선곡 메뉴와, 재생 상태, 곡명, 가수/음반 정보, 가사, 볼륨 등의 각종 정보가 표시될 수 있다.
음성 인식 장치(1)에 통신 모듈(50)이 구비된 경우, 상기 인터페이스는 통신 모듈(50)을 통해 주고 받은 정보를 표시할 수 있다. 예를 들어, 상기 인터페이스는 통신 모듈(50)과 통신하는 액세서리(2, 3a, 3b)들을 제어하기 위한 메뉴를 표시하거나, 액세서리(2, 3a, 3b)들로부터 전송된 정보를 바탕으로 가공된 정보를 표시할 수 있다. 구체적으로, 상기 인터페이스를 통해, 통신 모듈(50)의 네트워크 연결상태, 액세서리(2)에 구비된 센서에 의해 감지된 온도, 습도, 밝기 등의 정보가 표시될 수 있다. 뿐만 아니라, 상기 인터페이스를 통해, 스피커(43, 44)의 출력을 제어하는 메뉴가 표시될 수도 있으며, 예를 들어, 스피커(43, 44)를 통해 출력할 노래나 앨범을 선택하는 메뉴, 상기 앨범이나 노래와 관련된 정보(예를 들어, 노래 제목, 앨범 명, 가수), 출력되고 있는 볼륨의 크기 등이 표시될 수 있다.
상기 인터페이스에 표시된 메뉴들에 대한 조작은, 조작부(181)를 통해 가능한다.
한편, 조작부(181)는, 컨택 스위치(181a, 181b, 181c, 181d)를 구비할 수 있다. 각각의 컨택 스위치(181a, 181b, 181c, 181d)의 출력 신호가 어떻게 처리되는지는 메모리(250)에 기 저장된 프로그램에 의해 정해진다. 예를 들어, 제1, 2 컨택 스위치들(181a, 181b)의 동작 신호에 따라, 상기 인터페이스 상에서 좌우로 표시된 메뉴들이 선택될 수 있으며, 제3, 4 컨택 스위치들(181c, 181d)의 동작 신호에 따라 상기 인터페이스 상에서 상하로 표시된 메뉴들이 선택될 수 있다.
사용자는 스마트폰, 노트북 등의 외부 기기를 이용하여, 블루투스 모듈(50b)과 통신할 수 있으며, 이를 통해 음악, 이미지 등의 각종 데이터가 메모리(250)에 저장될 수 있다. 특히, 제어부(240)는 메모리(250)에 저장된 음악이 출력되도록, 스피커(43, 44)를 제어할 수 있고, 음악의 선곡, 재생, 정지 등의 각종 기능이 컨택 스위치(181a, 181b, 181c, 181d)를 통해 구현될 수 있다.
한편, 디스플레이 PCB(14)의 기판(140)에는, 후술하는 윈도우 서포트(12)에 형성된 지지보스(122b)가 통과하는 관통구(140h)가 형성될 수 있다. 관통구(140h)는 제1 기판 암(145)에 형성될 수 있다.
도 20을 참조하면, 기판(140)의 저면에는 한 쌍의 볼륨조절스위치(185a, 185b)가 구비될 수 있다. 볼륨조절스위치들(185a, 185b)은 본체(40)에 구비된 스피커(43, 44)의 볼륨을 조절하기 위한 것으로, 각각 컨택 스위치로 구성될 수 있으며, 디스플레이 PCB(14)의 회로와 연결되어 있다. 볼륨조절스위치들(185a, 185b)은 눌러질 때마다 스피커(43, 44)의 볼륨이 증가되는 제1 볼륨조절스위치(또는, 볼륨증가스위치(185a))와, 눌러질 때마다 스피커(43, 44)의 볼륨이 감소되는 제2 볼륨조절스위치(또는, 볼륨감소스위치(185b))를 포함할 수 있다.
볼륨조절스위치들(185a, 185b)은 디스플레이 PCB(14)의 제4 기판 암(148)에 배치될 수 있고, 볼륨조절스위치들(185a, 185b)의 가동 단자(스위칭 동작을 위해 눌러지는 부분)는 커버 하우징(15)의 측벽(151)을 향해 돌출될 수 있다.
도 21 내지 도 22를 참조하면, 커버 하우징(15)의 측벽(151)에는 볼륨 버튼(16)이 설치되는 개구부(151h)가 형성될 수 있다. 볼륨 버튼(16)은 돔(161)과 탄성 패드(162)를 포함할 수 있다.
탄성 패드(162)는 탄성을 갖는 재질(바람직하게는, 고무)로 된 하나의 부품으로 형성될 수 있다. 탄성 패드(162)는 측벽(151)의 원주 방향을 따라 길게 연장된 판상의 형태로써, 하우징(15)의 내측에 배치되는 지지부(162a)와, 지지부(162a)의 내측면에서 돌출된 한 쌍의 스위치 가동 돌기(162b, 162c)와, 지지부(162a)의 외측면에서 돌출되어 개구부(151h)를 통해 외부로 노출되는 돔 고정 돌기(162d)를 포함할 수 있다. 지지부(162a)는 크기가 개구부(151h)보다는 커, 외력에 의해 굽혀지지 않는 한, 개구부(151h)를 통해 커버 하우징(15)의 외부로 이탈되지는 않는다.
돔(161)은 재질은 합성수지이며, 일면에 홈이 형성되고, 상기 홈에 돔 고정 돌기(162d)가 삽입된다. 바람직하게는, 돔 고정 돌기(162d)는 상기 홈 내에 억지 끼움되며, 별도의 접착 수단을 적용하지 않더라도, 돔 고정 돌기(162d)의 재질 자체가 갖는 탄성 또는 복원력에 의해, 돔(161)으로부터 쉽게 분리되지 않는다. 그러나, 이에 한하지 않고, 돔(161)과 돔 고정 돌기(162d)는 양면 테이프 등의 접착부재에 의해 상호 결합될 수도 있다.
돔(161)은 상면 및/또는 하면으로부터 이탈방지돌기(161c)가 돌출될 수 있다. 이탈방지돌기(161c)는 커버 하우징(15) 내측에 위치하며, 개구부(151h) 둘레에 걸림으로써, 돔(161)이 커버 하우징(15)으로부터 분리되는 것이 보다 확실하게 방지된다. 실시예에서는, 돔(161)의 상면과 하면에 각각 한 쌍씩의 이탈방지돌기(161c)가 형성되나, 반드시 이에 한정되어야 하는 것은 아니다.
탄성 패드(162)가 개구부(151h)에 정위치 된 상태에서, 한 쌍의 스위치 가동 돌기(162b, 162c)는 각각 제1 볼륨조절스위치(185a)와 제2 볼륨조절스위치(185b)와 대응하는 위치에 배치되며, 돔(161)의 볼륨증가조작부(161a) 또는 볼륨감소조작부(161b)가 가압 되었을 시, 탄성 패드(162)의 스위치 가동 돌기들(162b, 162c)들이 볼륨증가스위치(185a) 또는 볼륨감소스위치(185b)를 동작 시키고, 그에 따라 스피커(43, 44)의 볼륨이 조절된다.
도 8 내지 도 16을 참조하면, 디스플레이(13)의 상측에는 대략 원형의 윈도우 서포트(12)가 배치될 수 있다. 윈도우 서포트(12)는 합성수지재의 사출물로써, 바람직하게는 하나의 부품으로 형성된다. 윈도우 서포트(12)에는 개구부(12h)가 형성되며, 개구부(12h)를 통해 디스플레이(13)의 화면이 노출된다.
개구부(12h)는, 윈도우 서포트(12)의 하측에 배치된 디스플레이 패널(131)과 대응하는 위치에 형성되며, 바람직하게는 디스플레이 패널(131) 보다는 조금 작은 크기로 형성된다. 디스플레이 패널(131)에 표시된 화면이 개구부(12h)를 통해 보여질 수 있다.
디스플레이 패널(131)은 좌우 방향의 가로가 전후 방향의 세로보다 긴 직사각형 형태로 이루어지며, 따라서, 개구부(12h) 역시 이러한 형태에 대응하여 좌우 방향의 길이가 전후 방향의 길이 보다 큰 형태로 이루어지는 것이 바람직하다.
윈도우 서포트(12)는 중심부에 개구부(12h)가 형성되고, 상면에 윈도우(11)가 배치되는 윈도우 지지판(121)과, 윈도우 지지판(121)으로부터 하방으로 돌출된 조작 돌기들(126a, 126b, 126c, 126d)과, 윈도우 지지판(121) 으로부터 하방으로 돌출되는 다수개의 지지보스(122a, 122b, 122c, 122d)를 포함할 수 있다.
지지보스들(122a, 122b, 122c, 122d)은 하측으로 수직하게 연장될 수 있다. 윈도우(11)와 마찬가지로, 윈도우 지지판(121)도 수평면에 대해 제1 각도(θ1)로 기울어지게 배치될 수 있고, 이 경우, 지지보스들(122a, 122b, 122c, 122d)은 윈도우 지지판(121)과 직교하지 않으며, 바람직하게는 윈도우 지지판(121)과 θ1의 여각(90-θ1)을 이룬다.
이하, 윈도우 지지판(121)의 각 부분을, 도 9에 도시된 바와 같이, 개구부(12h)를 중심으로 후방에 위치하는 제1 영역(SE1), 전방에 위치하는 제2 영역(SE2), 좌측에 위치하는 제3 영역(SE3) 및 우측에 위치하는 제4 영역(SE4)으로 구분한다.
지지보스들(122a, 122b, 122c, 122d)은 제1 영역(SE1)과 제2 영역(SE2)에 각각 적어도 하나씩이 형성될 수 있다. 윈도우 지지판(121)이 흔들리지 않고, 안정적으로 지지될 수 있도록, 4개의 지지보스(122a, 122b, 122c, 122d)가 형성될 수 있고, 이들 중, 제1 지지보스(122a)와 제2 지지보스(122b)는 제1 영역(SE1)에 위치하고, 제3 지지보스(122c)와 제4 지지보스(122d)는 제2 영역(SE2)에 형성될 수 있다.
지지보스들(122a, 122b, 122c, 122d)은 커버 하우징(150)과 결합되어, 윈도우 지지판(121)을 지지하며, 이때, 윈도우 지지판(121)은 디스플레이 PCB(14)와 이격될 수 있다. 지지보스들(122a, 122b, 122c, 122d) 중 적어도 하나는 기판 암들(145, 146, 147, 148)에 의해 사분된 영역을 통과하여 구획판(152)과 결합될 수 있고, 적어도 다른 하나는 기판 암(145)에 형성된 관통구(140h)를 통과하여 구획판(152)과 결합될 수 있다.
도 19를 참조하면, 커버 하우징(15) 내부는 십자 형태의 4개의 기판 암들(145, 146, 147, 148)에 의해 4개의 영역(P1, P2, P3, P4)으로 사분된다. 이하, 각 사분 영역에, 사분면에 대한 통상적인 정의에 부합되도록 순서를 부여하여, P1을 제1 사분 영역, P2를 제2 사분 영역, P3을 제3 사분 영역, P4를 제4 사분 영역이라고 정의한다.
제1 지지보스(122a), 제3 지지보스(122c) 및 제4 지지보스(122d)는 각각 제2 사분 영역(P2), 제3 사분 영역(P3) 및 제4 사분 영역(P4)을 통과하여 구획판(152)과 결합되고, 제2 지지보스(122b)는 제1 기판 암(145)에 형성된 관통구(140h)를 통과하여 구획판(152)과 결합된다.
지지보스들(122a, 122b, 122c, 122d)과 커버 하우징(15)의 구획판(152) 간의 결합은, 지지보스들(122a, 122b, 122c, 122d)들이 직접 구획판(152)과 결합되는 것도 가능하나, 실시예에서와 같이, 지지보스들(122a, 122b, 122c, 122d)이 구획판(152)에 형성된 삽입보스들(154a, 154b, 154c, 154d)에 결합됨으로써 이루어질 수 있다.
커버 하우징(15)의 구획판(152)에는, 제1 지지보스(122a), 제2 지지보스(122b), 제3 지지보스(122c) 및 제4 지지보스(122d)와 각각 대응하는 위치에 제1 삽입보스(154a), 제2 삽입보스(154b), 제3 삽입보스(154c) 및 제4 삽입보스(154d)가 형성될 수 있다. 삽입보스들(154a, 154b, 154c, 154d)은 구획판(152)로부터 하측으로 돌출될 수 있으며, 각각은 대응하는 지지보스들(122a, 122b, 122c, 122d)과 평행하게 연장될 수 있다.
제1 지지보스(122a), 제2 지지보스(122b), 제3 지지보스(122c) 및 제4 지지보스(122d)는 각각 제1 삽입보스(154a), 제2 삽입보스(154b), 제3 삽입보스(154c) 및 제4 삽입보스(154d) 내로 삽입된다. 각 삽입보스(154a, 154b, 154c, 154d)의 하단부에는 볼트가 체결되는 체결공이 형성될 수 있고, 볼트(19)가 아래로부터 상기 각각의 체결공을 통과하여 지지보스(122a, 122b, 122c, 122d)와 체결될 수 있다.
도 17 내지 도 19를 참조하면, 커버 하우징(15)은 구획판(152)으로부터 상측으로 돌출된 적어도 하나의 리브들(152a, 152b, 152c, 152d, 152e, 152f)을 포함할 수 있다.
리브들(152a, 152b, 152c, 152d, 152e, 152f) 중 적어도 하나(152b, 152c, 152d, 152e, 152f)는 디스플레이 패널(131)의 둘레와 접촉될 수 있다. 그런데, 구획판(152)의 상면에는 디스플레이 PCB(14)가 배치되기 때문에, 리브들(152b, 152c, 152d, 152e, 152f)이 디스플레이 패널(131)의 둘레와 접촉되기 위해서는 디스플레이 PCB(14)와 간섭되지 않아야 한다. 이를 위해, 본원 발명은 십자 형태의 디스플레이 PCB(14)에 의해 사분된 영역들(P1, P2, P3, P4)을, 리브들(152b, 152c, 152d, 152e, 152f)이 디스플레이 PCB(14)와 간섭되지 않고 통과하는 경로로써 활용하는 것을 제안한다.
리브들(152b, 152c, 152d, 152e, 152f)은, 디스플레이 PCB(14)의 기판 암들(145, 146, 147, 148)에 의해 사분된 영역들(P1, P2, P3, P4) 중 어느 하나를 통과하여, 디스플레이 패널(131)의 가장자리에 접촉될 수 있다. 리브들(152b, 152c, 152d, 152e, 152f)은 디스플레이 패널(131)의 위치를 설정하는 기능을 함과 아울러, 디스플레이 패널(131)이 흔들리지 않고 정위치를 유지하도록 한다.
디스플레이 패널(131)은 직사각형으로 이루어질 수 있으며, 디스플레이 패널(131)의 네 변들 중 적어도 하나가 리브(152b, 152c, 152d, 152e, 152f)와 접촉될 수 있다.
디스플레이 패널(131)의 네 변 중, 서로 평행한 한 쌍의 변이 각각 리브와 접촉될 수 있다. 실시예에서는, 디스플레이 패널(131)의 가로 변들(또는, 좌우 방향으로 연장되는 변들)이 리브들(152b, 152c, 152d)과 접촉되어 있다. 리브들(152b, 152c, 15d)은 디스플레이 패널(131)의 가로 변을 따라 길게 연장될 수 있다.
리브(152b, 152c, 152c)들은 기판 암들(145, 146, 147, 148)에 의해 구획된 네 영역들(P1, P2, P3, P4) 중, 서로 다른 영역들을 각각 통과할 수 있다. 실시예에서, 리브(152b)는 제2 사분 영역(P2)를 통과하고, 리브(152c)는 제3 사분 영역(P3)을 통과하고, 리브(152d)는 제4 사분 영역(P4)을 통과하여, 각각 디스플레이 패널(131)의 후방변(도면에서 위쪽 가로 변), 좌측변 및 전방변(도면에서 아래쪽 가로 변)과 접촉되어 있다.
실시예에 따라, 제1 사분 영역(P1) 및/또는 제4 사분 영역(P4)을 통과하여 디스플레이 패널(131)의 우측변과 접촉되는 리브가 더 형성될 수 있다.
디스플레이 패널(131)의 어느 한 변과 접촉되는 리브(예를 들어, 152b)와 디스플레이 패널(131)의 다른 한 변과 접촉되는 리브(예를 들어, 152c)는 기판 암들(145, 146, 147, 148)에 의해 사분된 영역들(P1, P2, P3, P4) 중 서로 다른 영역들(예를 들어, P2, P3)을 각각 통과할 수 있다.
윈도우 지지판(121)은, 재질 특성상, 일정한 한도 내에서 압력이 작용하였을 시, 각 지지보스들(122a, 122b, 122c, 122d)을 중심으로 휘어질 수 있으며, 이러한 변형은 압력이 제거될 시 그 형태가 원상으로 복구되는 탄성적인 것이다.
윈도우 서포트(12)의 제1 조작 돌기(126a), 제2 조작 돌기(126b), 제3 조작 돌기(126c) 및 제4 조작 돌기(126d)는 각각 디스플레이 PCB(14)에 배치된 제1 컨택 스위치(181a), 제2 컨택 스위치(181b), 제3 컨택 스위치(181c) 및 제4 컨택 스위치(181d)와 대응하는 위치에 배치되고, 따라서, 윈도우(11)를 통해 윈도우 서포트(12)의 제1 영역(SE1), 제2 영역(SE2), 제3 영역(SE3) 및 제4 영역(SE4) 중 어느 하나에 압력이 가해졌을 시, 압력이 가해진 영역(예를 들어, 제1 영역(SE1))에 속하는 조작 돌기(예를 들어, 제1 조작 돌기(126a))가 그 아래에 위치한 컨택 스위치(예를 들어, 제1 컨택 스위치(181a))를 작동시킨다.
윈도우 서포트(12)는 윈도우 지지판(121)으로부터 하측으로 연장된 제1 탭(125a), 제2 탭(125b), 제3 탭(125c) 및 제4 탭(125d)을 더 포함할 수 있다. 탭들(125a, 125b, 125c, 125d)은 윈도우 지지판(121)의 저면으로부터 각각 수직한 방향으로 돌출될 수 있다. 커버 하우징(15)의 구획판(152)의 상면에는 탭들(125a, 125b, 125c, 125d)과 각각 대응하는 위치에 탭 삽입홈(미표기)들이 형성될 수 있다.
한편, 윈도우(11)는 원형의 투명한 판으로써, 디스플레이(13)의 화면을 투과시키며, 재질은 바람직하게는 아크릴이다. 사용자는 윈도우(11)를 통해 디스플레이(13)에 표시된 화면을 볼 수 있다. 윈도우(11)는 전 영역이 투명할 필요는 없다. 음성 인식 장치(1)의 외관상 윈도우 서포트(12)는 보이지 않고, 윈도우 서포트(12)의 개구부(12h)를 통해 노출되는 디스플레이 패널(131)의 화면만이 보일 수 있다. 대략 개구부(12h)와 대응하는 위치의 소정 영역(11b)만 투명하고, 그 이외의 영역(11a)은 은폐되도록 불투명 또는 반투명하게 착색되거나, 필름 등이 부착될 수 있다 (도 3 참조.).
윈도우(11)는 양면 테이프 등을 이용하여 윈도우 서포트(12)의 윈도우 지지판(121)의 상면에 접착될 수 있다. 윈도우(11)는 합성수지 재질의 특성상, 일정한 한도 내에서 압력이 작용하였을 시, 탄력적으로 휘어질 수 있다. 이러한 휘어짐은 컨택 스위치(181a, 181b, 181c, 181d)의 동작이 보다 원활하게 이루어지도록 한다. 그러나, 윈도우(11)의 휘어짐은 탄력적인 것이기 때문에, 누르는 압력이 제거되었을 시에는 원형태로 복원됨은 물론이다.
한편, 윈도우 지지판(121)에 형성된 개구부(12h)가 가로 방향(또는, 좌우 방향)의 길이가 전후 방향(또는, 세로 방향)의 길이보다 길기 때문에, 개구부(12h)의 좌, 우측에 해당하는 제3 영역(SE3)과 제4 영역(SE4)은 지지보스들을 설치하기에 적절하지 않다. 왜냐하면, 윈도우(11)의 형태가 원형인 점을 고려하면, 제3 영역(SE3)과 제4 영역(SE4)은 개구부(12h) 둘레로부터 제3 조작 돌기(126c) 또는 제4 조작 돌기(126d)까지의 거리가, 제1 영역(SE1)과 제2 영역(SE2)에서 개구부(12h) 둘레로부터 제1 조작 돌기(126a) 또는 제2 조작 돌기(126b)까지의 거리에 비해 짧을 수 밖에 없고, 따라서, 만약 제3 영역(SE3)이나 제4 영역(SE4)에 지지보스를 형성한다고 하면, 제3 조작 돌기(126c)나 제4 조작 돌기(126d)는 지지보스와 거리가 너무 가까워지기 때문에, 큰 압력이 윈도우 지지판(121)에 가해져야 상기 조작 돌기가 동작할 수 있기 때문이다.
이러한 이유로, 제1 지지보스(122a)와 제2 지지보스(122b)는 제1 영역(SE1)에 형성되었으며, 제3 지지보스(122c)와 제4 지지보스(122d)는 제2 영역(SE2)에 형성되는 것이 바람직하다.
한편, 위에서 내려다 볼 때, 제1 조작 돌기(126a)는 커버 하우징(15) 내에서 제1 지지보스(122a)와 제2 지지보스(122b) 보다 더 외측에 위치되고, 제2 조작 돌기(126b)는 제3 지지보스(122c)와 제4 지지보스(122d) 보다 더 외측에 위치된다.
제1 영역(SE1)과 제2 영역(SE2) 각각에는, 조작 돌기(126a, 126b)와 지지보스(122a, 122b, 122c, 122d) 사이에 슬릿(121a, 121b)이 형성될 수 있다.
도 12d를 참조하면, 지지보스들(122a, 122b, 122c, 122d)은, 제1 영역(SE1) 또는 제2 영역(SE2)에 위치하기 때문에, 제3 조작 돌기(126c)나 제4 조작 돌기(126d) 보다는 상대적으로, 제1 조작 돌기(126a)나 제2 조작 돌기(126b)와 가깝다. 예를 들어, 윈도우 지지판(121)의 제1 영역(SE1)에 압력이 가해졌을 때, 윈도우 지지판(121)은 제1 지지보스(122a)와 제2 지지보스(122b)를 중심으로 휘어지게 되는데, 이때, 제1 조작 돌기(126a)의 제1 지지보스(122a)에 대한 선회 반경(모멘트 팔)은 r11이고, 제2 지지보스(122b)에 대한 선회 반경은 r12이다. 실시예에서, 제1 조작 돌기(126a)는 제1 지지보스(122a) 보다 제2 지지보스(122b)와 가깝기 때문에 r12가 r11보다 짧다. 또한, 제3 조작 돌기(126c)는 제1 지지보스(122a)까지의 거리가 r31(r31>r11>r12)이고, 제3 지지보스(122c)까지의 거리 r33은 실질적으로 r31과 같다.
각 조작 돌기(126a, 126b, 126c, 126d)의 조작성은 가장 가까이 위치한 지지보스들까지의 거리에 큰 영향을 받는다. 만약, 슬릿(121a, 121b)이 없다면, 위의 예에서와 같이, r31이 r12 보다 큰 경우, 제1 영역(SE1)과 제3 영역(SE3) 상에 같은 압력이 가해지더라도, 제3 영역(SE3)이 제1 영역(SE1) 보다 더 잘 휘어져, 제3 조작 돌기(126c)가 제1 조작 돌기(126a) 비해 더 쉽게 하측으로 이동되고, 제3 컨택 스위치(181c)가 제1 컨택 스위치(181a) 보다 더 원활하게 동작하게 된다. 마찬가지 이유로, 제2 컨택 스위치(181b)의 동작도 제3 컨택 스위치(181c) 또는 제4 컨택 스위치(181d)보다는 원활하게 이루어지지 못하는 문제가 발생될 수 있다.
이러한 문제를 해결하기 위해, 윈도우 지지판(121)의 제1 영역(SE1)과 제2 영역(SE2)에 각각 제1 슬릿(121a)과 제2 슬릿(121b)이 형성되었다. 이들 영역(SE1, SE2)에서 슬릿(121a, 121b)은 그 영역 내의 지지보스들(122a, 122b, 122c, 122d)과 조작 돌기(126a, 126b, 126c, 126d) 사이에 위치한다.
도 12d에 도시된 바와 같이, 윈도우 지지판(121)의 중심(c)을 지나며, 좌우 방향으로 연장되는 지름을 가로 지름(D1)이라고 하고, 전후 방향으로 연장되는 지름을 세로 지름(D2)이라고 정의할 때, 제1 지지보스(122a)와 제2 지지보스(122b)는 제1 영역(SE1) 내에서 가로 지름(D1)과 실질적으로 평행한 방향으로 배열되고, 제3 지지보스(122c)와 제4 지지보스(122d)는 제2 영역(SE2) 내에서 가로 지름(D1)과 실질적으로 평행한 방향으로 배열될 수 있다. 그리고, 제1 슬릿(121a)과 제2 슬릿(121b)은 각각 가로 지름(D1)과 실질적으로 평행한 방향으로 연장될 수 있다.
슬릿들(121a, 121b)이 형성됨으로써, 제1 영역(SE1) 또는 제2 영역(SE2)이 가압되었을 시, 윈도우 지지판(121)의 휘어짐은 슬릿들(121a, 121b)의 양쪽 끝단과 인접한 위치에서 유발되고, 특히, 이러한 휘어짐은 슬릿들(121a, 121b)의 끝단과 윈도우 지지판(121)의 외주 사이의 좁은 영역에서 주로 발생되기 때문에, 슬릿(121a, 121b)이 형성되지 않은 경우에 비해, 윈도우 지지판(121)이 더 원활하게 휘어지는 효과가 있다.
또한, 조작 돌기(126a, 126b)와 휘어짐이 발생되는 부분 간의 거리가 늘어나게 되는 효과도 있는데, 예를 들어, 제1 조작 돌기(126a)의 경우, 제1 슬릿(121a)의 일단까지의 거리(rs)가 제2 지지보스(122b)까지의 거리(r12) 보다 더 길어졌고, 이는 제1 영역(SE1)에서 휘어짐이 발생되는 부분에 대한 제1 영역(SE1)에 가압된 힘의 모멘트 팔의 길이가 증가되는 결과로써, 제1 조작 돌기(126a)가 보다 더 원활하게 하강될 수 있도록 하는데 기여한다.
또한, 실시예에서와 같이, 제1 영역(SE1)과 제2 영역(SE2)의 지지보스들(122a, 122b, 122c, 122d)이 비대칭으로 배치된 경우에도, 지지보스들(122a, 122b, 122c, 122d)들과 조작 돌기들(126a, 126b) 사이에 슬릿(121a, 121b)이 형성됨으로써, 제1 영역(SE1)과 제2 영역(SE2)에서의 윈도우 지지판(121)의 휘어짐은 지지보스들(122a, 122b, 122c, 122d)의 위치에 따른 영향보다는, 실질적으로 슬릿(121a, 122b)의 위치와 형태에 의해 더 크게 영향을 받게 되고, 따라서, 제1 슬릿(121a)과 제2 슬릿(121b)이 실질적으로 서로 대칭적으로 배치되는 경우에는 제1 컨택 스위치(181a)와 제2 컨택 스위치(181b)의 조작성이 균등해지는 효과가 있다.
도 3 내지 도 5를 참조하면, 본체(40)는 하측에 배치된 베이스(30)에 의해 지지되고, 상단부는 커버 하우징(15)과 결합될 수 있다. 본체(40)는 내측으로 캐비티(49)를 형성하는 스피커 케이스(41, 42)와, 캐비티(49) 내에 배치되는 적어도 하나의 스피커(43, 44)를 포함할 수 있다. 실시예에서는 스피커 케이스(41, 42) 내에 2 개의 스피커(43, 44)가 상하로 배치되고, 상측에 배치되는 스피커(43)는 고음 대역을 출력하는 트위터(tweeter)이고, 하측에 배치되는 스피커(44)는 저음 대역을 출력하는 우퍼(woofer)이다.
도 3 내지 도 23을 참조하면, 커버(10)에는 음성입력 PCB(17, 18)가 설치된다. 음성입력 PCB(17, 18)에는 사용자의 음성이 입력된다. 음성입력 PCB(17, 18)는 본체(40)에 배치된 음성인식 PCB(40a)와 회로 연결된다. 음성입력 PCB(17, 18)는 하네스 케이블(17b, 18b)을 통해 음성인식 PCB(40a)와 연결될 수 있다. 음성입력 PCB(17, 18)는 상기 입력된 사용자의 음성을 음성인식 PCB(40a)가 인식할 수 있는 음파신호로 변환하고, 음성인식 PCB(40a)는 음성입력 PCB(17, 18)로부터 입력되는 음파신호를 분석하여 사용자의 음성을 인식할 수 있다.
음성입력 PCB(17, 18)는 윈도우 서포트(12)에 설치된다. 음성입력 PCB(17,18)는 다수개가 구비될 수 있고, 상기 다수개의 음성입력 PCB(17,18)는 윈도우 서포트(12)에 형성된 개구부(12h)에 대해 대칭(symmetry)으로 배치될 수 있다. 본 실시예에서 음성입력 PCB(17, 18)는 2개로 구비되어, 제1 음성입력 PCB(17) 및 제2 음성입력 PCB(18)를 포함한다.
제1 음성입력 PCB(17, 18)는 윈도우 서포트(12)에 형성된 개구부(12h)를 기준으로 전방에 위치하는 제1 음성입력 PCB(17)와, 개구부(12h)를 기준으로 후방에 위치하는 제2 음성입력 PCB(18)를 포함한다. 제1 음성입력 PCB(17)는 윈도우 지지판(121)의 제2 영역(SE2)에 배치되고, 제2 음성입력 PCB(18)는 윈도우 지지판(121)의 제1 영역(SE1)에 배치된다.
제1 음성입력 PCB(17)는 윈도우 지지판(121)의 센터를 기준으로 우측으로 치우쳐서 배치되고, 제2 음성입력 PCB(18)는 윈도우 지지판(121)의 센터를 기준으로 좌측으로 치우쳐서 배치된다.
윈도우 서포트(12)에는 윈도우(11)와 대향하는 상면에 음성입력 PCB(17, 18)가 수용되는 PCB 수용홈(12a, 12b)이 형성된다. 음성입력 PCB(17, 18)는 PCB 수용홈(12a, 12b)에 수용된 상태일 때, PCB 수용홈(12a, 12b)의 외측으로 돌출되지 않는다. 즉, PCB 수용홈(12a, 12b)은 윈도우 서포트(12)의 상면에 음성입력 PCB(17, 18)의 상하두께와 대응하는 깊이로 함입되어 형성된다. 음성입력 PCB(17, 18)가 PCB 수용홈(12a, 12b)에 수용된 상태이면, 음성입력 PCB(17, 18)의 상면은 윈도우 서포트(12)의 상면과 일치한다.
PCB 수용홈(12a, 12b)은 제1 음성입력 PCB(17)가 수용되는 제1 PCB 수용홈(12a)과, 제2 음성입력 PCB(18)가 수용되는 제2 음성음력 PCB 삽입부(12b)를 포함한다. 제1 PCB 수용홈(12a)은 윈도우 서포트(12)에 형성된 개구부(12h)를 기준으로 전방에 배치되고, 제2 PCB 수용홈(12b)은 개구부(12h)를 기준으로 후방에 배치된다. 제1 PCB 수용홈(12a)은 윈도우 지지판(121)의 제2 영역(SE2)에 형성되고, 제2 PCB 수용홈(12b)은 윈도우 지지판(121)의 제1 영역(SE1)에 형성된다.
제1 PCB 수용홈(12a)은 윈도우 지지판(121)의 센터를 기준으로 우측으로 치우쳐서 형성되고, 제2 PCB 수용홈(12b)은 윈도우 지지판(121)의 센터를 기준으로 좌측으로 치우쳐서 형성된다.
윈도우 서포트(12)는 PCB 수용홈(12a, 12b)의 바닥으로부터 돌출된 위치설정 돌기(12c, 12d)를 더 포함한다. 음성입력 PCB(17, 18)에는 위치설정 돌기(12c, 12d)가 삽입되는 위치설정 홀(17a, 18a)이 형성된다. 위치설정 돌기(12c, 12d)는 사각형상의 PCB 수용홈(12a, 12b)의 모서리에 하나가 형성되고, 위치설정 홀(17a, 18a)은 사각형상의 음성입력 PCB(17, 18)의 모서리에 하나가 형성된다. 작업자는 음성입력 PCB(17, 18)를 PCB 수용홈(12a, 12b)에 수용할 시, 위치설정 홀(17a, 18a)을 위치설정 돌기(12c, 12d)에 끼워서, 음성입력 PCB(17, 18)를 PCB 수용홈(12a, 12b)의 정확한 위치에 수용시킬 수 있다.
위치설정 돌기(12c, 12d)는 제1 PCB 수용홈(12a)이 바닥에서 상측으로 돌출 형성되는 제1 위치설정 돌기(12c)와, 제2 PCB 수용홈(12b)이 바닥에서 상측으로 돌출 형성되는 제2 위치설정 돌기(12d)를 포함한다. 그리고, 위치설정 홀(17a, 18a)은 제1 음성입력 PCB(17)에 형성되어 제1 위치설정 돌기(12c)가 삽입되는 제1 위치설정 홀(17a)과, 제2 음성입력 PCB(18)에 형성되어 제2 위치설정 돌기(12d)가 삽입되는 제2 위치설정 홀(18a)을 포함한다.
PCB 수용홈(12a, 12b)의 바닥에는 개구부(12e, 12f)가 형성된다. 개구부(12e, 12f)는 음성입력 PCB(17, 18)를 음성인식 PCB(40a)와 연결할 시, 하네스 케이블(17b, 18b)이 관통하는 홀의 기능을 한다. 개구부(12e, 12f)는 제1 PCB 수용홈(12a)의 바닥에 형성되는 제1 개구부(12e)와, 제2 PCB 수용홈(12b)의 바닥에 형성되는 제2 개구부(12f)을 포함한다.
개구부(12e, 12f)는 제1 영역(SE1) 및 제2 영역(SE2)에 각각 형성된 슬릿(121a, 121b)의 적어도 일부를 구성한다. 제1 PCB 수용홈(12a)는 제2 영역(SE2)에 형성된 제2 슬릿(121b) 중 우측으로 치우친 위치에 배치되어, 제2 영역(SE2)에 형성된 제3 지지보스(122c) 및 제4 지지보스(122d) 사이에서 제4 지지보스(122d)의 바로 옆에 형성된다. 그리고, 제2 PCB 수용홈(12b)는 제1 영역(SE1)에 형성된 제1 슬릿(121a) 중 좌측으로 치우친 위치에 배치되어, 제1 영역(SE1)에 형성된 제1 지지보스(122a) 및 제2 지지보스(122b) 사이에서 제1 지지보스(122a)의 바로 옆에 형성된다. 따라서, 사용자가 윈도우(11)를 가압할 시 윈도우 지지판(121)이 쉽게 탄성 변형되면서 컨택 스위치(181a, 181b, 181c, 181d)를 쉽게 작동시킬 수 있다.
개구부(12e, 12f)는 슬릿(121a, 121b)에 비해 전후방향의 폭이 넓게 형성된다. 음성입력 PCB(17, 18)는 하네스 케이블(17b, 18b)을 통해 음성인식 PCB(40a)와 연결되는 바, 하네스 케이블(17b, 18b)의 하단에는 음성인식 PCB(40a)와 연결되는 커넥터(17c, 18c)가 결합된다. 이 커넥터(17c, 18c)는 개구부(12e, 12f)를 통과하여 윈도우 서포트(12)의 아래로 빠져나가야 하므로, 슬릿(121a, 121b)보다 전후방향의 폭이 넓게 형성되는 것이 바람직하다.
하네스 케이블(17b, 18b)은 제1 음성입력 PCB(17) 및 음성인식 PCB(40a)를 연결하는 제1 하네스 케이블(17b)과, 제2 음성입력 PCB(18) 및 음성인식 PCB(40a)를 연결하는 제2 하네스 케이블(18b)를 포함한다. 그리고, 커넥터(17c, 18c)는 제1 하네스 케이블(17b)의 하단에 결합되어 음성인식 PCB(40a)와 연결되는 제1 커넥터(17c)와, 제2 하네스 케이블(18b)의 하단에 결합되어 음성인식 PCB(40a)와 연결되는 제2 커넥터(18c)를 포함한다.
윈도우(11)에는 윈도우(11)의 상측에서 윈도우(11)의 하측으로 사용자의 음성이 통과하는 음성 통과홀(11c, 11d)이 형성된다. 음성 통과홀(11c, 11d)은 윈도우(11)의 센터를 기준으로 전방 영역에 형성되는 제1 음성 통과홀(11c)과, 윈도우(11)의 센터를 기준으로 후방 영역에 형성되는 제2 음성 통과홀(11d)을 포함한다. 제1 음성 통과홀(11c)은 제1 음성입력 PCB(17)로 음성을 안내하고, 제2 음성 통과홀(11d)은 제2 음성입력 PCB(18)로 음성을 안내한다.
윈도우(11)는 센터부가 투명 영역(11b)으로 형성되고, 투명 영역(11b) 이외의 영역은 불투명 영역(11a)으로 형성된다. 투명 영역(11b)은 윈도우 서포트(12)에 형성된 개구부(12h)와 대응하는 크기 및 형상으로 형성되어, 디스플레이 패널(131)이 출력하는 화면을 투과시킨다.
제1 음성 통과홀(11c)은 윈도우(11)의 투명 영역(11b)을 기준으로 전방의 불투명 영역(11a)에 형성되고, 제2 음성 통과홀(11d)은 윈도우(11)의 투명 영역(11b)을 기준으로 후방의 불투명 영역(11a)에 형성된다.
음성입력 PCB(17, 18)에 사용자의 음성이 쉽게 입력될 수 있도록 하기 위해, 음성 통과홀(11c, 11d)은 음성입력 PCB(17, 18)와 대응되는 위치에 형성되는 것이 바람직하다. 음성입력 PCB(17, 18)에는 음성 통과홀(11c, 11d)과 대응되는 위치에 음성 통과홀(11c, 11d)을 통과한 음성이 입력되는 음성 입력홀(17d, 18d)이 형성된다. 음성입력 PCB(17, 18)에는 음성 입력홀(17d, 18d)이 형성된 하면에 마이크(미도시)가 설치됨이 바람직하다. 상기 마이크는 음성 입력홀(17d, 18d)로 입력된 음성을 증폭하여 음성입력 PCB(17, 18)의 음파변환회로로 입력하는 기능을 한다. 즉, 윈도우(11)의 외부에서 음성 통과홀(11c, 11d)을 통과한 사용자의 음성은 음성입력 PCB(17, 18)에 형성된 음성 입력홀(17d, 18d)로 입력된 후, 상기 마이크에서 증폭되어 음성입력 PCB(17, 18)의 음파변환회로로 입력되어 음성인식 PCB(40a)가 읽을 수 있는 음파신호로 변환된다.
윈도우(11) 및 윈도우 서포트(12) 사이에는 개스킷(17e, 18e)이 설치된다. 개스킷(17e, 18e)은 음성 통과홀(11c, 11d)을 통과한 음성이, 음성입력 PCB(17, 18)의 음성 입력홀(17d, 18d)로 들어가지 않고, 윈도우(11) 및 윈도우 서포트(12) 사이의 틈새로 누설되는 것을 방지한다. 이를 위해, 개스킷(17e, 18e)은 상면이 윈도우(11)의 저면에 밀착되고, 하면은 음성입력 PCB(17, 18)의 상면에 밀착된다. 그리고, 개스킷(17e, 18e)에는 음성 통과홀(11c, 11d) 및 음성 입력홀(17d, 18d)을 연통시키는 연통홀(17f, 18f)이 형성된다. 따라서, 음성 통과홀(11c, 11d)을 통과한 음성은 전부가 연통홀(17f, 18f)을 통해 음성 입력홀(17d, 18d)로 입력되기 때문에, 음성인식을 정확하게 할 수 있게 된다.
개스킷(17e, 18e)은, 상면이 윈도우(11)의 저면에 밀착되고 하면은 제1 음성입력 PCB(17)의 상면에 밀착되는 제1 개스킷(17e)과, 상면이 윈도우(11)의 저면에 밀착되고 하면은 제2 음성입력 PCB(18)의 상면에 밀착되는 제2 개스킷(18e)를 포함한다. 연통홀(17f, 18f)은 제1 개스킷(17e)에 형성되어 제1 음성 통과홀(11c) 및 제1 음성 입력홀(17d)를 연통시키는 제1 연통홀(17f)과, 제2 개스킷(18e)에 형성되어 제2 음성 통과홀(11d) 및 제2 음성 입력홀(18d)을 연통시키는 제2 연통홀(18f)을 포함한다.
개스킷(17e, 18e)은 음성입력 PCB(17, 18)와 대응되는 형상 및 크기로 형성될 수 있다. 개스킷(17e, 18e)은 음성입력 PCB(17, 18)의 상면에 접착되는 양면테이프일 수 있다. 본 실시예에서는 윈도우(11) 및 윈도우 서포트(12)를 양면테이프를 통해 서로 결합되는 바, 윈도우(11) 및 윈도우 서포트(12)를 양면테이프를 통해 서로 결합할 시, 음성입력 PCB(17, 18)를 윈도우(11)의 저면에 쉽게 결합할 수 있도록 하기 위해, 개스킷(17e, 18e)은 양면테이프로 형성되는 것이 바람직하다.
연통홀(17f, 18f)은 음성입력 PCB(17, 18)에 형성되는 음성 입력홀(17d, 18d)보다 크게 형성된다. 만약, 연통홀(17f, 18f)이 음성 입력홀(17d, 18d)보다 작은 크기로 형성된다면, 음성 통과홀(11c, 11d)을 통과한 음성이 음성음성 입력홀(17d, 18)로 쉽게 들어가지 못하게 되어, 음성인식이 정확하게 안되게 되는 우려가 있다. 또한, 연통홀(17f, 18f)이 음성 입력홀(17d, 18d)보다 작은 크기로 형성되거나 음성 입력홀(17d, 18d)과 동일한 크기로 형성된다면, 음성 통과홀(11c, 11d)을 통과한 음성이 연통홀(17f, 18f)을 통과할 때, 개스킷(17e, 18e)이 음성의 진동으로 인해 미세하게 떨리면서 개스킷(17e, 18e)의 밀착력이 저하되어 윈도우(11) 및 개스킷(17e, 18e) 사이의 틈과, 개스킷(17e, 18e) 및 음성입력 PCB(17, 18) 사이의 틈을 통해 누설될 가능성이 있다. 따라서, 음성인식을 정확하게 하기 위해, 연통홀(17f, 18f)은 음성입력 PCB(17, 18)에 형성된 음성 입력홀(17d, 18d)보다 크게 형성되는 것이 바람직하다.
본 실시예에서 음성 입력홀(17d, 18d)은 윈도우(11)에 형성된 음성 통과홀(11c, 11d)과 동일한 크기로 형성된다. 따라서, 연통홀(17f, 18f)은 윈도우(11)에 형성된 음성 통과홀(11c, 11d)보다 크게 형성된다. 만약, 연통홀(17f, 18f)이 음성 통과홀(11c, 11d)보다 작은 크기로 형성되거나 음성 통과홀(11c, 11d)과 동일한 크기로 형성된다면, 음성 통과홀(11c, 11d)을 통과한 음성이 연통홀(17f, 18f)을 통과할 때, 개스킷(17e, 18e)이 음성의 진동으로 인해 미세하게 떨리면서 개스킷(17e, 18e)의 밀착력이 저하되어 윈도우(11) 및 개스킷(17e, 18e) 사이의 틈과, 개스킷(17e, 18e) 및 음성입력 PCB(17, 18) 사이의 틈을 통해 누설될 가능성이 있다. 따라서, 음성인식을 정확하게 하기 위해, 연통홀(17f, 18f)은 윈도우(11)에 형성된 음성 통과홀(11c, 11d)보다 크게 형성되는 것이 바람직하다.
한편, 음성 통과홀(11c, 11d)은 음성입력 PCB(17, 18)와 대응되는 위치에 형성된다. 즉, 제1 음성입력 PCB(17)가 윈도우 지지판(121)의 센터를 기준으로 우측으로 치우쳐서 배치되고, 제2 음성입력 PCB(18)가 윈도우 지지판(121)의 센터를 기준으로 좌측으로 치우쳐서 배치되기 때문에, 윈도우(11)의 센터를 기준으로 전방 영역 중 상기 센터를 기준으로 우측으로 치우쳐서 제1 음성 통과홀(11c)이 하나가 형성되고, 윈도우(11)의 센터를 기준으로 후방 영역 중 상기 센터를 기준으로 좌측으로 치우쳐서 제2 음성 통과홀(11d)이 하나가 형성된다. 따라서, 음성 통과홀(11c,11d)들의 위치가 윈도우(11)의 센터를 기준으로 상하 대칭 및 좌우 대칭이 되지 않아, 음성 인식 장치(1)의 외관 디자인이 저감될 우려가 있다.
그런데, 본 실시예의 윈도우(11)는 윈도우(11)의 센터를 기준으로 전방에서 좌우방향으로 제1 음성 통과홀(11c)의 옆에 2개의 제1 데코 홀(11e)이 형성되고, 윈도우(11)의 센터를 기준으로 후방에서 좌우방향으로 제2 음성 통과홀(11d)의 옆에 2개의 제2 데코 홀(11f)이 형성된다.
상기 2개의 제1 데코 홀(11e)은 윈도우(11)의 투명 영역(11b)의 전방에 위치하는 불투명 영역(11a)에서 제1 음성 통과홀(11c)의 좌측에 형성되고, 상기 2개의 제2 데코 홀(11f)은 투명 영역(11b)의 후방에 위치하는 불투명 영역(11a)에서 제2 음성 통과홀(11d)의 우측에 형성된다.
윈도우(11)의 투명 영역(11b)의 전방에 위치하는 불투명 영역(11a)에 형성된 제1 음성 통과홀(11c) 및 2개의 제1 데코 홀(11e)의 전체적인 배열은, 윈도우(11)의 센터를 기준으로 전방 영역 중 좌우방향으로 중간지점에 위치하고, 윈도우(11)의 센터를 기준으로 후방 영역에 형성된 제2 음성 통과홀(11d) 및 2개의 제2 데코 홀(11f)의 전체적인 배열은, 윈도우(11)의 센터를 기준으로 후방 영역 중 좌우방향으로 중간지점에 위치됨으로써, 윈도우(11)는 그 자신의 센터를 기준으로 상하 대칭 및 좌우 대칭되어, 음성 인식 장치(1)의 외관 디자인이 향상될 수 있다.
한편, 음성입력 PCB(17,18)는 하네스 케이블(17b, 18b)을 통해 음성인식 PCB(40a)와 연결되어야 하므로, 커버 하우징(15)의 구획판(152)에는 하네스 케이블(17b, 18b)이 관통하는 하네스 케이블 관통홀(152g, 152h)이 형성된다. 하네스 케이블 관통홀(152g, 152h)은 PCB 수용홈(12a, 12b)에 형성된 슬릿(121a, 121b)의 폭이 넓은 부분과 대응하는 위치에 형성되어, PCB 수용홈(12a, 12b)로부터 하측에 배치되는 것이 바람직하다.
하네스 케이블(17b, 18b)은 상단이 음성입력 PCB(17, 18)에 연결되고, 하단은 PCB 수용홈(12a, 12b)에 형성된 폭이 넓은 슬릿(121a, 121b)의 일부분을 통해 윈도우 서포트(12)의 아래로 빠져 나온 후, 구획판(152)에 형성된 하네스 케이블 관통홀(152g, 152h)을 통해 구획판(152)의 아래로 빠져나와, 본체(40)의 상측면에 설치된 음성인식 PCB(40a)와 연결된다.
하네스 케이블 관통홀(152g, 152h)은 제1 음성입력 PCB(17)에 연결된 제1 하네스 케이블(17b)이 관통하는 제1 하네스 케이블 관통홀(152g)과, 제2 음성입력 PCB(18)에 연결된 제2 하네스 케이블(18b)이 관통하는 제2 하네스 케이블 관통홀(152h)을 포함한다.
도 24는 본체를 상면이 보이도록 도시한 사시도이다. 도 25는 본체를 저면이 보이도록 도시한 사시도이다. 도 26은 전면 케이스(a)와, 후면 케이스(b)를 도시한 것이다. 도 27은 본체의 후면을 도시한 것이다. 도 28은 와이파이 모듈과 연결된 안테나들의 위치를 보이는 도면이다. 도 29는 블루투스 모듈과 연결된 안테나와, 직비 모듈과 연결된 안테나의 위치를 보이는 도면이다. 도 30은 본체, 방열판, 메인 PCB, 베이스 바디 및 지지 러버의 분해 사시도이다.
도 24 내지 도 27을 참조하면, 본체(40)의 상측면에는 음성인식 PCB(40a)가 배치된다. 음성인식 PCB(40a)는 음성입력 PCB(17, 18)로부터 입력되는 음파신호를 분석하여 사용자의 음성을 인식할 수 있다. 음성인식 PCB(40a)는 메인 PCB(48)와 회로 연결된다. 음성인식 PCB(40a)가 인식한 음성은 메인 PCB(48)의 제어부(240)로 입력되고, 제어부(240)는 음성인식 PCB(40a)로부터 입력되는 인식된 음성 중에서 설정된 음성이 포함될 경우, 주변의 기기(2, 3a, 3b, 5)들 중에서 상기 설정된 음성에 상응하는 기기와 통신 모듈(50)을 통해 통신하여 인식된 음성에 따라 상기 설정된 음성에 상응하는 기기를 제어할 수 있다.
예를 들어, 사용자가 윈도우(11)를 가압하여 컨택 스위치(181a, 181b, 181c, 181d) 중 특정된 어느 하나를 작동시킨 채로, 음성으로 "날씨를 알려줘" 라고 하면, 사용자의 음성은 음성입력 PCB(17, 18)로 입력되어 음성입력 PCB(17, 18)에서 음성인식 PCB(40a)가 인식할 수 있는 음파신호로 변환된 후, 하네스 케이블(152g, 152h)을 통해 음성인식 PCB(40a)로 입력되고, 음성인식 PCB(40a)는 음성입력 PCB(17, 18)로부터 입력된 음파신호를 분석하여 사용자의 음성이 "날씨를 알려줘"라고 인식한다. 이후, 음성인식 PCB(40a)가 인식한 "날씨를 알려줘"라는 음성은 신호처리되어 메인 PCB(48)의 제어부(240)로 입력되고, 제어부(240)는 음성인식 PCB(40a)가 인식한 "날씨를 알려줘" 라는 음성에 설정된 음성인 "날씨" 라는 음성이 포함되면, 주변의 기기(2, 3a, 3b, 5)들 중 날씨정보를 수신할 수 있는 기기와 통신 모듈(50)을 통해 통신하여 날씨정보를 수신할 수 있는 기기를 제어함으로써, 날씨정보를 수신할 수 있는 기기로부터 날씨정보를 수신받아, 상기 날씨정보를 디스플레이(13)에 표시할 수 있고, 상기 날씨정보를 스피커(43,44)를 통해 음향으로 출력할 수 있다.
본체(40)의 상측면은, 전방부가 전방이 높이가 낮고 후방이 높이가 높은 경사면(41S)으로 형성되고, 상기 전방부에서 후방으로 연장되는 후방부는 수평면(42H)으로 형성될 수 있다. 경사면(41S)은 윈도우(11), 윈도우 서포트(12) 및 구획판(152)과 평행하게 배치된다. 즉, 본체(40)의 외관을 이루는 스피커 케이스(41,42)의 상측면은, 전방부가 전방이 높이가 낮고 후방이 높이가 높은 경사면(41S)으로 형성되고, 후방부는 상기 경사면에서 후방으로 연장되는 수평면(42H)으로 형성될 수 있다. 음성인식 PCB(40a)는 본체(40)의 상측면 중 수평면으로 형성된 후방부에 설치될 수 있다.
윈도우(11), 윈도우 서포트(12) 및 구획판(152)은 전방이 높이가 낮고 후방이 높이가 높게 기울어져서 배치되기 때문에, 커버(10)가 본체(40)의 상부에 결합된 상태일 때, 본체(40)의 상측면 중 수평면(42H)으로 형성된 후방부와, 구획판(152) 사이에는 음성인식 PCB(40a)가 설치될 수 있는 공간(S, 도 5 참조.)이 확보된다. 따라서, 음성인식 PCB(40a)는 본체(40)의 상측면 중 수평면(42H)으로 형성된 후방부에 설치되는 것이 바람직하다.
스피커 케이스(41, 42)는 본체(40)의 전방부를 외관을 형성하는 전면 케이스(41)와, 전면 케이스(41)의 후방에 결합되어 본체(40)의 후방부 외관을 형성하는 후면 케이스(42)를 포함할 수 있다. 후면 케이스(42)는 전면 케이스(41)와의 사이에 캐비티(49)를 형성한다. 전면 케이스(41)의 상측면은 전방이 높이가 낮고 후방이 높이가 높은 경사면(41S)으로 형성되고, 후면 케이스(42)의 상측면은 수평면(42H)으로 형성된다. 따라서, 커버(10)가 본체(40)의 상부에 결합된 상태일 때, 구획판(152) 및 후면 케이스(42) 사이에는 음성인식 PCB(40a)가 설치될 수 있는 공간(S)이 확보되므로, 음성인식 PCB(40a)는 후면 케이스(42)의 상측면에 설치되는 것이 바람직하다. 음성인식 PCB(40a)는 양면테이프와 같은 접착부재를 통해 후면 케이스(42)의 상측면에 장착될 수 있다.
전면 케이스(41)에는 상하로 트위터(43)와 우퍼(44)의 진동판(예를 들어, 맴브레인(membrane))들을 각각 노출시키는 한 쌍의 음향 출력구가 전방을 향해 개구 되도록 형성될 수 있다.
전면 케이스(41)의 내측면에는 후방으로 돌출된 케이스 위치설정 돌기(411)가 다수의 지점에 형성될 수 있다. 실시예에서는 일정한 높이에서 좌, 우 양측의 두 군데에 케이스 위치설정 돌기(411)가 형성되되, 같은 방식으로 서로 다른 세곳의 높이에 각각 한 쌍씩, 총 여섯 곳에 케이스 위치설정 돌기(411)가 형성되었으나, 반드시 이에 한정되어야 하는 것은 아니다.
후면 케이스(42)에는 전면 케이스(41)에 형성된 케이스 위치설정 돌기들(411)과 각각 대응하는 위치에는 삽입보스(421)가 형성되고, 볼트가 후면 케이스(42)의 후방으로부터 각각의 삽입보스(421)를 통과하여 케이스 위치설정 돌기(411)와 체결될 수 있다.
커버 하우징(15)의 상단 유지부(153)의 전면부에는 좌, 우 양쪽으로 한 쌍의 체결보스(153c, 153d)가 후방으로 함몰 형성될 수 있고(도 13 내지 도 16 참조.), 후면부의 좌, 우 양쪽에는 한 쌍의 체결보스(153a, 153b)가 전방으로 함몰 형성될 수 있다.
커버 하우징(15)에 형성된 이들 체결보스들(153a, 153b, 153c, 153d)과 대응하여, 본체(40)의 전면 케이스(41)에 제1 보스 삽입 홈(415)과, 제2 보스 삽입 홈(416)이 형성되고, 후면 케이스(42)에 제3 보스 삽입 홈(425)과 제4 보스 삽입 홉(426)이 형성될 수 있다.
도 24를 참조하면, 제1 보스 삽입 홈(415)과 제2 보스 삽입 홈(416)은 각각 전면 케이스(41)의 전면(음성 인식 장치(1)의 전방을 향하는 면)으로부터 후방으로 함몰되되, 상측으로부터 체결보스(153c, 153d)가 각각 삽입될 수 있도록 상단부가 개구되어 있다.
도 27을 참조하면, 제3 보스 삽입 홈(425)과 제4 보스 삽입 홈(426)은 각각 후면 케이스(42)의 후면(음성 인식 장치(1)의 후방을 향하는 면)으로부터 전방으로 함몰되되, 상측으로부터 체결보스(153a, 153b)가 각각 삽입될 수 있도록 상단부가 개구되어 있다.
각각의 보스 삽입 홈(415, 416, 425, 426)에는 볼트가 통과하는 체결공이 형성될 수 있다. 도면에서는 제2 보스 삽입 홈(416) 내에 형성된 체결공(416h)만이 도시되었으나, 제1 보스 삽입 홈(415)에도 마찬가지 방식으로 체결공(이하, 도면에는 도시되지 않았으나, 설명의 혼동을 피하기 위해 지시번호로써 416h를 부여함.)이 형성되고, 다른 보스 삽입 홈들(425, 426)에도 마찬가지로 체결공(425h, 426h, 도 27 참조.)이 형성될 수 있다.
체결보스들(153a, 153b, 153c, 153d)은, 각각의 대응하는 보스 삽입 홈(415, 416, 425, 426) 내에 삽입된 상태에서, 체결공(415h, 416h, 425h, 426h)과 대응하는 위치에 이르고, 볼트가 상기 각 체결공(415h, 416h, 425h, 426h)을 통과하여 체결보스(153a, 153b, 153c, 153d)와 체결될 수 있다.
도 27 내지 도 29를 참조하면, 본체(40)에는 적어도 하나의 통신 모듈(50)이 배치될 수 있다. 통신 모듈(50)은 메인 PCB(48) 및/또는 디스플레이 PCB(14)의 회로와 연결되어, 제어부(240)에 의해 제어될 수 있다. 실시예에서는, 통신 모듈(50)로써, 와이파이 모듈(50a), 블루투스 모듈(50b), 직비 모듈(50c)이 구비되었다. 그러나, 이에 한하지 않고, 지웨이브 모듈이 구비되는 것도 가능하다.
모듈 조립체(510)는 와이파이 모듈(50a)과 블루투스 모듈(50b)의 집합체로써, 본체(40)의 후방에 배치될 수 있다. 모듈 조립체(510)는 후면 케이스(42)에 배치될 수 있다.
모듈 조립체(510)는 일체로써 후면 케이스(42)와 결합되거나, 후면 케이스(42)로부터 분리될 수 있다. 그러나, 이에 한하지 않고, 와이파이 모듈(50a)과 블루투스 모듈(50b)이 서로 별개로 구비되어, 각각이 독립적으로 본체(40)와 결합 또는 본체(40)로부터 분리될 수도 있다.
모듈 조립체(510)는 신호를 송/수신하는 한 쌍의 안테나(511a, 511b)를 포함할 수 있다. 한 쌍의 안테나(511a, 511b)는 모듈 조립체(510) 자체에 기본으로 제공되는 것이나, 이에 한하지 않고, 모듈 조립체(510)와 이격된 위치에 별도의 적어도 하나의 안테나(521, 522)가 더 구비되는 것도 가능하다(도 27 내지 도 29 참조.).
모듈 조립체(510)에는 와이파이 모듈(50a)의 제1 안테나 연결 단자(513) 및 제2 안테나 연결단자(514)와, 블루투스 모듈(50b)의 안테나 연결 단자(515)가 구비될 수 있다. 그리고, 커버 하우징(15)의 측벽(151)의 내측면에는 후방부의 좌, 우 양쪽에 각각 제1 안테나(521)와 제2 안테나(522)가 배치될 수 있고, 제1 안테나(521)는 도선(L1)을 통해 제1 안테나 연결 단자(513)와 연결되며, 제2 안테나(522)는 도선(L2)을 통해 제2 안테나 연결 단자(514)와 연결될 수 있다.
제1 안테나(521)와 제2 안테나(522)는 각각 얇은 형태의 필름에 소정 패턴의 도전체가 결합된 것으로써, 상기 도전체에 도선(L1, L2)이 연결된다. 제1 안테나(521)와 제2 안테나(522)는 양면 테이프에 의해 커버 하우징(15)의 측벽(151)에 부착될 수 있다.
커버 하우징(15)의 측벽(151)은 그릴(20)에 상측에 위치하기 때문에, 그릴(20)에 의해 둘러싸여 있지 않으며, 따라서, 측벽(151)에 제1 안테나(521)와 제2 안테나(522)를 배치함으로써, 금속재인 그릴(20)에 의한 신호 간섭을 줄여, 보다 정확하게 신호의 송수신이 이루어지도록 한 것이다.
또한, 측벽(151)은 전방에서 후방으로 갈수록, 상단의 높이가 점점 더 구획판(152)으로부터 멀어지는 형태로 이루어질 수 있다. 이 경우, 측벽(151)의 후방부는, 전방부에 비해, 구획판(152)에 장착된 디스플레이 PCB(14)와의 사이에 더 큰 간격을 형성할 수 있다. 따라서, 제1 안테나(521)와 제2 안테나(522)를 측벽(151)의 후방부에 배치함으로써, 안테나들(521, 522)을 디스플레이 PCB(14)로부터 보다 멀리 이격시킬 수 있고, 디스플레이 PCB(14)의 회로에 흐르는 전류에 의해 생성된 자기장에 의한 신호 간섭을 줄일 수 있는 효과가 있다.
한편, 본체(40)의 좌, 우측 중 어느 한쪽에는 직비 모듈(50c)이 구비될 수 있다. 커버 하우징(15)의 측벽(151)의 전방부 내측면에는 직비 모듈(50c)의 안테나 연결 단자(531)와 도선(L3)을 통해 연결된 제3 안테나(532)와 블루투스 모듈(50b)의 안테나 연결 단자(515)와 도선(L4)를 통해 연결된 제4 안테나(541)가 구비될 수 있다.
제3 안테나(532)와 제4 안테나(541)는 각각 얇은 형태의 필름에 소정 패턴의 도전체가 결합된 것으로써, 상기 도전체에 도선(L3, L4)이 연결된다. 제3 안테나(532)와 제4 안테나(541)는 양면 테이프에 의해 커버 하우징(15)의 측벽(151)에 부착될 수 있다.
도 30을 참조하면, 메인 PCB(48)는 본체(40)와 베이스(30) 사이에 형성된 공간에 배치될 수 있다. 메인 PCB(48)는 음성 인식 장치(1)의 작동 전반을 제어하는 것으로, 제어부(240), USB 포트(62), 데이터 전송 포트(64), 각종 스위치, 리셉터클 등이 실장되고, 통신 모듈들(50a, 50c), 디스플레이 PCB(14), 트위터(43), 우퍼(44) 등의 각종 전장 장치들과 회로 연결되어 있다.
메인 PCB(48)와 본체(40) 사이에는 방열판(33)이 배치될 수 있다. 방열판(33)은 금속판을 가공한 것으로써, 재질은 바람직하게는 알루미늄이다. 방열판(33)은 메인 PCB(48)로부터 방출된 열을, 상측의 공간(즉, 본체(40)의 저면과 방열판(33) 사이의 공간)으로 소산시킨다.
본체(40)의 저면으로부터 다수개의 체결보스(45a, 45b, 45c, 45d)가 돌출될 수 있다. 제1 체결보스(45a)와 제2 체결보스(45b)가 후면 케이스(42)의 저면에서 돌출될 수 있고, 제3 체결보스(45c)와 제4 체결보스(45d)는 전면 케이스(41)의 저면에서 돌출될 수 있다. 체결보스들(45a, 45b, 45c, 45d)은 베이스(30)와 결합될 수 있다.
본체(40)의 저면을 그 중심을 지나는 가로선과 세로선으로 구획하였을 시, 체결보스들(45a, 45b, 45c, 45d)은 상기 가로선과 세로선에 의해 구획된 4 개의 사분면에 각각 형성될 수 있다.
베이스(30)에는 체결보스들(45a, 45b, 45c, 45d)과 각각 대응하는 위치에 삽입보스가 형성될 수 있다. 체결보스들(45a, 45b, 45c, 45d)은 각각 삽입보스들에 삽입될 수 있고, 이렇게 삽입된 상태에서, 각각의 삽입보스를 하측에서 통과하는 볼트와 체결될 수 있다.
다수개의 방열판 지지보스(46b, 46c, 46d)들이 본체(40)의 저면으로부터 더 돌출될 수 있다. 방열판 지지보스(46b, 46c, 46d)는 체결보스(45a, 45b, 45c, 45d)와 근접한 위치에 배치될 수 있고, 실시예에서는 상기 4 개의 사분면 중 3개에 방열판 지지보스(46b, 46c, 46d)가 형성되었으나, 그 개수가 반드시 이에 한정되어야 하는 것은 아니다.
방열판(33)은 금속판을 가공한 것으로써, 재질은 바람직하게는 알루미늄이나, 스테인리스 스틸이다. 그러나, 기타 다른 금속 재질도 가능하다. 방열판(33)은 수평한 평판부(3331)와, 평판부(3331)의 둘레로부터 연장된 다수의 지지탭(332b, 332c, 332d)을 포함할 수 있다.
평판부(3331)에는 체결보스들(45a, 45b, 45c, 45d)들이 각각 통과되는 관통구들(335a, 335b, 335c, 335d)과 지지보스들(46b, 46c, 46d)이 각각 통과하는 관통구들(334b, 334c, 334d)이 형성될 수 있다.
지지보스들(46b, 46c, 46d)은 각각 메인 PCB(48)의 상측에서 지지탭들(332b, 332c, 332d)과 결합될 수 있다. 지지탭들(332b, 332c, 332d)은 평판부(3331)로부터 하방으로 연장된 수직부와, 수직부로부터 수평하게 절곡된 수평부를 포함할 수 있다. 각 지지탭(332b, 332c, 332d)의 수평부에는 볼트가 통과되는 체결공이 형성되고, 각각의 볼트가 하측으로부터 체결공을 통과한 후, 지지보스(46b, 46c, 46d)와 체결될 수 있다.
지지보스들(46b, 46c, 46d)이 지지탭(332b, 332c, 332d)과 체결된 상태에서, 평판부(3331)는 상측에 위치한 본체(40)의 저면과 이격되고, 또한, 하측에 위치한 메인 PCB(48)와도 이격된다. 평판부(3331)가 본체(40)의 저면으로부터 이격되기 때문에, 본체(40)가 스피커(43, 44)의 출력에 의해 진동하더라도, 본체(40)의 저면과 평판부(3331) 간의 접촉으로 인한 타격 소음은 발생되지 않는다.
메인 PCB(48)에는, 방열판(33)의 관통구들(335a, 335b, 335c, 335d) 각각과 대응하는 위치에 관통구들(481a, 481b, 481c, 481d)이 형성될 수 있다. 체결보스(45a, 45b, 45c, 45d)는 그 길이가 지지보스(46b, 46c, 46d)보다 더 길며, 각각이 방열판(33)의 관통구(335a, 335b, 335c, 335d)와 메인 PCB(48)의 관통구(481a, 481b, 481c, 481d)를 통과한 후, 베이스(30)의 삽입보스들 내로 삽입될 수 있다.
베이스(30)는 상면이 개구되고, 내측으로 소정의 공간이 형성된 베이스 바디(31)와, 베이스 바디(31)의 저면에 고정되는 지지 러버(32)를 포함할 수 있다. 음성 인식 장치(1)는 사용자가 들어 옮길 수 있도록 소형으로 형성되어, 테이블이나 선반 등의 바닥에 거치될 수 있다. 베이스 바디(31)의 하측에 구비된 지지 러버(32)가 상기 바닥과의 마찰을 높여, 음성 인식 장치(1)가 넘어지거나, 낙하하는 것이 방지된다.
베이스(30)에 형성된 삽입보스들은 베이스 바디(31)의 내측면으로부터 상측으로 돌출되고, 베이스 바디(31)의 베이스 바닥부에는 삽입보스들과 각각 연통되는 체결구(351a, 351b, 351c, 351d)가 형성될 수 있다.
본체(40)와 방열판(33)을 조립한 후, 이제 체결보스(45a, 45b, 45c, 45d)를 메인 PCB(48)에 형성된 체결보스 관통구(481a, 481b, 481c, 481d)를 통과시킨다. 그리고, 각 체결보스(45a, 45b, 45c, 45d)를 베이스(30)에 형성된 삽입보스에 삽입한다. 그 후, 볼트(미도시)가 베이스(30)의 하측으로부터 체결구(351a, 351b, 351c, 351d)로 삽입되고, 삽입보스 내의 체결보스(45a, 45b, 45c, 45d)와 체결될 수 있다.
도 31은 본 발명의 일 실시예에 따른 음성 인식 서버 시스템 및 음성 인식 장치를 포함하는 스마트 홈 시스템을 간략히 도시한 도면이다.
도 31을 참조하면, 본 발명의 일 실시예에 따른 스마트 홈 시스템(10)은, 통신 모듈(미도시)을 구비하여 다른 기기와 통신하거나 네트워크에 접속할 수 있는 음성 인식 장치(1)와 음성 인식 및 가전 제어를 위한 복수의 서버를 포함하는 음성 인식 서버 시스템(1100)을 포함하여 구성될 수 있다. 한편, 스마트 홈 시스템(10)은, 음성 인식 시스템이라 명명할 수도 있다.
한편, 음성 인식 장치(1)는, 음성 인식이 가능한 장치이다.
또한, 본 발명의 일 실시예에 따른 스마트 홈 시스템(10)은, 스마트 폰(smart phone), 태블릿(Tablet) PC 등 휴대 단말기(미도시)를 포함할 수 있다.
음성 인식 장치(1)는 내부에 통신 모듈을 구비하여 스마트 홈 시스템(10) 내/외부의 전자기기들과 통신할 수 있다.
본 발명의 일 실시예에 따른 스마트 홈 시스템(10)은 액세스 포인트(access point: AP) 장치(7)를 더 포함할 수 있고, 음성 인식 장치(1)는 액세스 포인트 장치(7)를 통하여 무선 인터넷 네트워크에 접속하여 다른 기기들과 통신할 수 있다.
액세스 포인트 장치(7)는 스마트 홈 시스템(10) 내의 전자 기기들에, 소정 통신 방식에 의한 무선 채널을 할당하고, 해당 채널을 통해, 무선 데이터 통신을 수행할 수 있다.
여기서, 소정 통신 방식은, 와이파이(Wi-Fi) 통신 방식일 수 있다. 이에 대응하여, 음성 인식 장치(1)가 구비하는 통신 모듈은 와이파이 통신 모듈일 수 있으나, 본 발명은 통신 방식에 한정되지 않는다.
또는, 음성 인식 장치(1)는 다른 종류의 통신 모듈을 구비하거나 복수의 통신 모듈을 구비할 수 있다. 예를 들어, 음성 인식 장치(1)는 NFC 모듈, 지그비(zigbee) 통신 모듈, 블루투스(Bluetooth™) 통신 모듈 등을 포함할 수 있다.
음성 인식 장치(1)는 와이파이(wi-fi) 통신 모듈 등을 통해 음성 인식 서버 시스템(1100)에 포함되는 서버 또는 외부의 소정 서버, 사용자의 휴대 단말기 등과 연결 가능하고, 원격 모니터링, 원격 제어 등 스마트 기능을 지원할 수 있다.
사용자는 휴대 단말기를 통하여 스마트 홈 시스템(10) 내의 음성 인식 장치(1)에 관한 정보를 확인하거나 음성 인식 장치(1)를 제어할 수 있다.
한편, 사용자가 가정 내에서 음성 인식 장치(1)를 제어하거나 소정 정보를 확인하고자 하는 경우에도 휴대 단말기를 반드시 이용해야 하는 것은 불편할 수 있다.
예를 들어, 사용자가 휴대 단말기의 현재 위치를 모르거나 다른 장소에 있는 경우에 다른 방식으로 음성 인식 장치(1)를 제어할 수 있는 수단이 있는 것이 더 효율적이다.
본 발명의 일 실시예에 따른 음성 인식 장치(1)는 사용자의 음성 입력을 수신할 수 있고, 음성 인식 서버 시스템(1100)은 사용자의 음성 입력을 인식, 분석하여 음성 인식 장치(1)를 제어할 수 있다.
이에 따라, 사용자는 휴대 단말기, 원격제어장치를 조작하지 않고서도 음성 인식 장치(1)를 제어할 수 있다.
한편, 상기 음성 인식 서버 시스템(1100)에 포함되는 서버들 중 적어도 일부는 음성 인식 장치의 제조 회사, 판매 회사가 운영하는 서버이거나 제조 회사 또는 판매 회사가 서비스를 위탁한 회사가 운영하는 서버일 수 있다.
도 32a는 본 발명의 일 실시예에 따른 음성 인식 서버 시스템의 일예이다.
도 32a를 참조하면, 본 발명의 일 실시예에 따른 음성 인식 서버 시스템은, 음성 인식 장치(1)로부터 음성 데이터를 수신하고, 수신한 음성 데이터를 분석하여 음성 명령을 판별하는 음성 서버(1110)를 포함할 수 있다.
음성 서버(1110)는, 음성 인식 장치(1)로부터 음성 데이터를 수신하고, 상기 수신한 음성 데이터를 텍스트(text) 데이터로 변환하며, 텍스트 데이터를 분석하여 음성 명령을 판별할 수 있다.
또한, 음성 서버(1110)는, 판별한 음성 명령에 대응하는 신호를 소정 서버로 송신할 수 있다.
예를 들어, 본 발명의 일 실시예에 따른 음성 인식 서버 시스템은 상기 음성 서버(1110)로부터 상기 판별한 음성 명령에 대응하는 신호를 수신하고, 상기 판별한 음성 명령에 대응하는 요청 신호를 생성하는 연계 서비스 서버(1120)와 상기 연계 서비스 서버(1120)로부터 수신되는 요청 신호에 기초하는 제어 신호를 상기 음성 인식 장치(1)로 송신하는 가전 제어 서버(1130)를 포함할 수 있다.
상기 음성 인식 장치(1)는 사용자가 발화한 음성 명령 입력을 수신하여 수신한 음성 명령 입력에 기초한 음성 데이터를 상기 음성 서버(1110)로 송신할 수 있다.
상기 음성 서버(1110)는, 음성 인식 장치(1)로부터 음성 데이터를 수신하고, 수신한 음성 데이터를 텍스트(text) 데이터로 변환하는 자동 음성 인식(Automatic Speech Recognition: ASR) 서버(1111), 상기 자동 음성 인식 서버(1111)로부터 상기 텍스트 데이터를 수신하고, 수신한 텍스트 데이터를 분석하여 음성 명령을 판별하며, 상기 판별한 음성 명령에 기초하는 응답 신호를 상기 음성 인식 장치(1)로 송신하는 자연어 처리(Natural Language Processing: NLP) 서버(1112), 및, 상기 음성 인식 장치(1)로부터 상기 응답 신호에 대응하는 텍스트를 포함하는 신호를 수신하고, 수신한 신호에 포함되는 텍스트를 음성 데이터로 변환하여 상기 음성 인식 장치(1)로 송신하는 텍스트 음성 변환(Text to Speech: TTS) 서버(1113)를 포함할 수 있다.
상기 자동 음성 인식 서버(1111)는 음성 인식 장치(1)로부터 수신한 음성 데이터에 대하여 음성 인식을 수행하여 텍스트 데이터를 생성하여 상기 자연어 처리 서버(1112)로 송신할 수 있다.
상기 자연어 처리 서버(1112)는 상기 자동 음성 인식 서버(1111)로부터 수신한 텍스트 데이터를 자연어 처리 알고리즘에 따라 분석하여 음성 명령을 판별할 수 있다.
상기 자연어 처리 서버(1112)는 자연어 처리 알고리즘에 따라 사람이 일상적으로 사용하고 있는 언어인 자연어를 처리할 수 있고, 사용자의 의도(intent)를 분석할 수 있다. 상기 자연어 처리 서버(1112)는 상기 자동 음성 인식 서버(1111)로부터 수신한 텍스트 데이터에 대하여 자연어 처리를 수행하여 사용자의 의도에 부합하는 음성 명령을 판별할 수 있다.
이에 따라, 상기 자연어 처리 서버(1112)는 사용자가 일상적인 사용 언어로 음성 명령을 입력하더라도 사용자의 의도에 부합하는 음성 명령을 판별할 수 있다.
상기 자연어 처리 서버(1112)는 자연어 처리 결과에 대응하는 신호, 즉, 판별한 음성 명령에 대응하는 신호를 상기 연계 서비스 서버(1120)로 송신할 수 있다.
상기 연계 서비스 서버(1120)는, 상기 자연어 처리 서버(1112)로부터 상기 판별한 음성 명령에 대응하는 신호를 수신할 수 있다.
상기 연계 서비스 서버(1120)는 판별한 음성 명령이 음성 인식 장치(1)에 관한 것이면, 상기 가전 제어 서버(1130)와 통신하여 대응하는 동작을 수행할 수 있다.
또는, 상기 연계 서비스 서버(1120)는 판별한 음성 명령이 음성 인식 장치(1)에 관한 것이 아니면, 외부의 외부 서비스(1121)와 통신하여 대응하는 동작을 수행할 수 있다.
예를 들어, 상기 연계 서비스 서버(1120)는 판별한 음성 명령이 날씨, 주식, 뉴스 등의 정보를 요청하는 명령이면, 요청된 정보에 대응하는 서비스를 제공하는 서버로 해당 정보를 요청하고 수신할 수 있다.
또한, 상기 연계 서비스 서버(1120)는 수신한 정보를 음성 서버(1110)로 송신할 수 있고, 상기 자연어 처리 서버(1112)는 수신한 정보를 음성 인식 장치(1)로 전달할 수 있다.
상기 연계 서비스 서버(1120)는 판별한 음성 명령이 음성 인식 장치(1)에 관한 것이면, 상기 판별한 음성 명령에 대응하는 요청 신호를 생성하여 상기 가전 제어 서버(1130)로 송신할 수 있다.
상기 가전 제어 서버(1130)는, 상기 연계 서비스 서버(1120)로부터 수신되는 요청 신호에 기초하는 제어 신호를 상기 음성 인식 장치(1)로 송신할 수 있다.
예를 들어, 음성 인식 장치(1)의 음악 재생 요청이 수신되면, 상기 가전 제어 서버(1130)는 상기 음성 인식 장치(1)로 음악 재생을 위한 제어 신호를 송신할 수 있다.
한편, 음성 인식 장치(1)는 상기 가전 제어 서버(1130)로부터 수신한 제어 신호에 따라 대응하는 동작을 수행할 수 있다.
또한, 음성 인식 장치(1)는 요청받은 동작을 수행한 후 동작을 수행하였음을 알리는 신호를 상기 가전 제어 서버(1130)로 송신할 수 있다.
또한, 상기 가전 제어 서버(1130)는, 상기 음성 인식 장치(1)로부터 상기 제어 신호에 대한 응답 신호를 수신하고, 상기 응답 신호에 대응하는 처리 결과 정보를 상기 연계 서비스 서버(1120)로 송신할 수 있다.
상기 음성 서버(1110)는, 상기 처리 결과 정보를 포함하는 응답 신호를 상기 음성 인식 장치(1)로 송신할 수 있다.
또한, 상기 음성 서버(1110)는, 상기 음성 인식 장치(1)로부터 상기 처리 결과 정보에 대응하는 출력 문구 텍스트를 포함하는 신호를 수신하고, 상기 수신한 출력 문구 텍스트를 음성 데이터로 변환하여 상기 음성 인식 장치(1)로 전송할 수 있다.
이 경우에, 상기 자연어 처리 서버(1112)가 상기 음성 인식 장치(1)로 송신하는 상기 판별한 음성 명령에 기초하는 응답 신호는, 상기 처리 결과 정보를 포함할 수 있다.
한편, 음성 인식 장치(1)는 상기 자연어 처리 서버(1112)로부터 상기 판별한 음성 명령에 기초하는 응답 신호를 수신할 수 있다. 여기서, 응답 신호를 상기 판별한 음성 명령에 대응하는 응답의 텍스트 데이터를 포함할 수 있다.
예를 들어, 사용자가 음악 재생을 요청하는 음성 명령을 입력한 경우에, 상기 응답 신호는 음악을 재생하였음을 나타내는 텍스트 데이터를 포함할 수 있다.
한편, 음성 인식 장치(1)는 수신한 응답 신호에 대응하는 텍스트를 포함하는 신호를 상기 텍스트 음성 변환 서버(1113)로 송신할 수 있다. 여기서, 상기 응답 신호에 대응하는 텍스트를 포함하는 신호는 상기 처리 결과 정보에 대응하는 출력 문구 텍스트를 포함할 수 있다.
한편, 상기 텍스트 음성 변환 서버(1113)는 수신한 신호에 포함되는 텍스트를 음성 데이터로 변환하여 상기 음성 인식 장치(1)로 송신할 수 있다. 여기서 변환된 음성 데이터는 음원 파일을 포함할 수 있다.
상기 음성 인식 장치(1)는 스피커를 통하여 수신한 음성 데이터에 기초한 음성 안내 메시지를 출력할 수 있다.
한편, 상기 연계 서비스 서버(1120)는, 상기 판별한 음성 명령에 대응하는 신호에 기초하여 상기 음성 인식 장치(1)의 상태 정보를 상기 가전 제어 서버(1130)로 요청하고, 상기 가전 제어 서버(1130)는, 상기 음성 인식 장치(1)의 상태 정보를 상기 연계 서비스 서버(1120)로 송신할 수 있다. 상기 가전 제어 서버(1130)는, 상기 음성 인식 장치(1)의 상태 정보가 확보되어 있는 상태가 아닌 경우에는, 상기 음성 인식 장치(1)로 상태 정보를 요청하여 수신할 수 있다.
한편, 상기 연계 서비스 서버(1120)는, 상기 음성 인식 장치(1)의 상태 정보에 기초하여 상기 판별한 음성 명령의 지원이 가능한 경우에, 상기 가전 제어 서버(1130)로 상기 판별한 음성 명령에 대응하는 요청 신호를 송신할 수 있다.
또는, 상기 연계 서비스 서버(1120)는, 상기 음성 인식 장치(1)의 상태 정보에 기초하여 상기 판별한 음성 명령의 지원이 불가능한 경우에, 상기 자연어 처리 서버(1112)로 현재 상태에서 지원되지 않는 기능임을 알리는 신호를 송신할 수 있다.
이 경우에도, 음성 인식 장치(1)는 상기 텍스트 음성 변환 서버(1113)로 음성 데이터를 요청, 수신하여, 현재 상태에서 지원되지 않는 기능임을 알리는 음성 안내 메시지를 출력할 수 있다.
실시예에 따라서는, 상기 음성 서버(1110)가, 상기 판별한 음성 명령의 지원 가능 유무를 판별할 수 있다. 예를 들어, 사용자의 음성 명령의 의도를 분석한 상기 자연어 처리 서버(1112)가, 상기 판별한 음성 명령의 지원 가능 유무를 판별할 수 있다.
이 경우에, 상기 판별한 음성 명령이 지원 불가능한 명령을 포함하고 있는 경우, 상기 자연어 처리 서버(1112)가 송신하는 상기 판별한 음성 명령에 기초하는 응답 신호는 상기 판별한 음성 명령이 상기 음성 인식 장치(1)가 지원하지 않는 기능임을 알리는 신호일 수 있다.
본 발명의 일 실시예에 따른 음성 서버(1110) 및 이를 포함하는 음성 인식 서버 시스템(1100)은, 자연어 음성처리를 위해 여러 역할을 하는 서버를 유기적으로 연결하여 이용할 수 있다.
음성 인식 장치(1)는 음성 명령의 수신 및 전처리, 서버 전송까지의 동작을 수행하고, 음성 서버(1110)는, 음성/텍스트 변환, 의도분석, 명령 식별 등 자연어 처리 과정을 수행할 수 있다.
음성 서버(1110)가 자연어 처리를 수행함으로써, 음성 인식 장치 내부 임베디드 모듈의 CPU, 메모리 등의 부담을 감소시킬 수 있다.
한편, 연계 서비스 서버(1120)는 외부 서비스 및 가전 제어 서버(1130)와 통신하여 사용자의 음성 명령에 기초한 동작을 수행할 수 있다.
한편, 음성 인식 장치(1)는 음성 서버(1110)로부터 음원 파일을 포함하는 음성 데이터를 수신하여, 음성 안내 메시지를 오디오로 출력함으로써, 청각적 피드백으로 사용자의 음성 입력에 화답할 수 있다.
음성 인식 장치(1)는 음성 서버(1110)로부터 음성 파일을 스트리밍으로 전달 받아 사용자에게 음성 안내 메시지를 재생, 출력할 수 있다. 이에 따라 음성 인식 장치(1)는 다양한 음원 파일을 저장하고 있을 필요가 없다.
한편, 연계 서비스 서버(1120)를 통하여 다른 서버와 충돌하지 않으면서도 다양한 외부 서비스들과의 연계가 가능하다. 또한, 외부 서비스 연동 서버를 통해 의도분석 시 외부 정보를 반영하여 의도분석 성공률을 높일 수 있다.
본 발명의 일 실시예에 따른 음성 인식 서버 시스템(1100)은, 복수의 서버를 통해, 호환성 및 연결성을 확보하고, 최종 제어 명령은 가전 제어 서버(1130)를 활용함으로써, 음성 인식 과정과 가전 제어 서버(1130)를 통해 와이파이 통신을 이용한 가전 제어 사이의 충돌 및 휴대 단말기를 통한 가전 제어와 음성 인식 장치(1)를 통한 음성 입력에 의한 가전 제어 간 충돌을 막을 수 있다.
본 발명의 일 실시예에 따른 음성 인식 서버 시스템(1100)은, 서버 간 유기적인 연결을 통해 어느 한 서버에 의존하여 특정서버에 부하가 몰리는 것을 줄일 수 있고, 각각의 서버 별 역할이 달라, 특정 서버에서 문제가 생길 경우 동일한 역할을 하는 타 서버와의 연계를 통해 쉽게 대응이 가능하다.
또한, 복수의 서버들을 독립적으로 수시로 업데이트할 수 있어, 성능 개선에 유리하다.
도 32b는 본 발명의 일 실시예에 따른 음성 인식 서버 시스템의 일예이다.
도 32b에서 예시된 음성 인식 서버 시스템은, 도 32a에서 예시된 음성 인식 서버 시스템이 음성 안내 메시지 출력을 위한 음성 데이터가 음성 인식 장치(1)로 전송되는 과정을 개선하여 음성 제어 응답 시간을 향상한 것이다.
따라서, 도 32a와 도 32b에서 예시된 음성 인식 서버 시스템은 상기 차이점 이외의 동작은 실질적으로 동일하게 수행할 수 있고, 이하에서는 동일한 부분에 대해서는 간략히 기술한다.
도 32b를 참조하면, 본 발명의 일 실시예에 따른 음성 인식 서버 시스템은, 음성 인식 장치(1)로부터 음성 데이터를 수신하고, 수신한 음성 데이터를 분석하여 음성 명령을 판별하는 음성 서버(1110)를 포함할 수 있다.
또한, 본 발명의 일 실시예에 따른 음성 인식 서버 시스템은, 상기 음성 서버(1110)로부터 상기 판별한 음성 명령에 대응하는 신호를 수신하고, 상기 판별한 음성 명령에 대응하는 요청 신호를 생성하는 연계 서비스 서버(1120)와 상기 연계 서비스 서버(1120)로부터 수신되는 요청 신호에 기초하는 제어 신호를 상기 음성 인식 장치(1)로 송신하는 가전 제어 서버(1130)를 더 포함할 수 있다.
도 32b에서 예시된 음성 인식 서버 시스템은, 음성 인식 장치(1)의 요청 없이도, 상기 음성 서버(1110)가 상기 음성 명령에 기초하는 처리 결과 정보를 포함하는 음성 데이터를 상기 음성 인식 장치(1)로 송신할 수 있다.
상기 음성 서버(1110)는, 음성 인식 장치(1)로부터 음성 데이터를 수신하고, 수신한 음성 데이터를 텍스트(text) 데이터로 변환하는 자동 음성 인식 서버(1111), 상기 자동 음성 인식 서버(1111)로부터 상기 텍스트 데이터를 수신하고, 수신한 텍스트 데이터를 분석하여 음성 명령을 판별하는 자연어 처리 서버(1112), 및, 상기 음성 명령에 기초하는 응답 신호를 음성 데이터로 변환하여 상기 음성 인식 장치(1)로 송신하는 텍스트 음성 변환 서버(1113)를 포함할 수 있다.
본 실시예에서도, 상기 가전 제어 서버(1130)는, 상기 음성 인식 장치(1)로부터 상기 제어 신호에 대한 응답 신호를 수신하고, 상기 응답 신호에 대응하는 처리 결과 정보를 상기 연계 서비스 서버(1120)로 송신할 수 있다.
상기 연계 서비스 서버(1120)는 음성 서버(1110), 더욱 상세하게는 자연어 처리 서버(1112)로 상기 처리 결과 정보를 전달할 수 있다.
이 경우에, 상기 텍스트 음성 변환 서버(1113)가 상기 음성 인식 장치(1)로 송신하는 음성 데이터는, 상기 처리 결과 정보를 포함할 수 있다.
또한, 상기 연계 서비스 서버(1120)는, 상기 판별한 음성 명령에 대응하는 신호에 기초하여 상기 음성 인식 장치(1)의 상태 정보를 상기 가전 제어 서버로 요청하고, 상기 가전 제어 서버는, 상기 음성 인식 장치(1)의 상태 정보를 상기 연계 서비스 서버(1120)로 송신할 수 있다.
또한, 상기 연계 서비스 서버(1120)는, 상기 음성 인식 장치(1)의 상태 정보에 기초하여 상기 판별한 음성 명령의 지원이 가능한 경우에, 상기 가전 제어 서버(1130)로 상기 판별한 음성 명령에 대응하는 요청 신호를 송신할 수 있다.
또는, 상기 연계 서비스 서버(1120)는, 상기 음성 인식 장치(1)의 상태 정보에 기초하여 상기 판별한 음성 명령의 지원이 불가능한 경우에, 상기 음성 서버(1110)로 현재 상태에서 지원되지 않는 기능임을 알리는 신호를 송신할 수 있다.
예를 들어, 상기 연계 서비스 서버(1120)는 상기 자연어 처리 서버(1112)로 현재 상태에서 지원되지 않는 기능임을 알리는 신호를 송신할 수 있다.
또한, 상기 자연어 처리 서버(1112)는 상기 텍스트 음성 변환 서버(1113)로 현재 상태에서 지원되지 않는 기능임을 알리는 신호를 전달하고, 상기 텍스트 음성 변환 서버(1113)는 대응하는 음성 데이터를 생성하여 음성 인식 장치(1)로 송신할 수 있다.
음성 인식 장치(1)는 상기 텍스트 음성 변환 서버(1113)로부터 음성 데이터를 수신하여, 현재 상태에서 지원되지 않는 기능임을 알리는 음성 안내 메시지를 출력할 수 있다.
실시예에 따라서는, 상기 음성 서버(1110)가, 상기 판별한 음성 명령의 지원 가능 유무를 판별할 수 있다. 예를 들어, 사용자의 음성 명령의 의도를 분석한 상기 자연어 처리 서버(1112)가, 상기 판별한 음성 명령의 지원 가능 유무를 판별할 수 있다.
이 경우에, 상기 판별한 음성 명령이 지원 불가능한 명령을 포함하고 있는 경우, 상기 자연어 처리 서버(1112)가 송신하는 상기 판별한 음성 명령에 기초하는 응답 신호는 상기 판별한 음성 명령이 상기 음성 인식 장치(1)가 지원하지 않는 기능임을 알리는 신호일 수 있다.
음성 인식 장치(1)가 동작한 후 제일 마지막으로 음성 안내를 위한 텍스트 음성 변환 서버(1113)에 해당 동작에 대한 안내 멘트를 요청할 경우 동작과 안내 멘트 사이에 시간 차가 발생할 수 있다.
하지만, 본 발명의 일 실시예에 따르면, 의도분석이 완료되어 동작 요청이 자연어 처리 서버(1112)에서 송신될 때, 이와 동시에 텍스트 음성 변환 서버(1113)로 정보를 제공해줄 수 있다.
또한, 가전 제어 서버(1130)에서 음성 인식 장치(1)에 제어 명령을 내리는 시점에 준하여 텍스트 음성 변환 서버(1113)에서 음성 인식 장치(1)로 안내멘트를 제공할 수 있다.
이에 따라, 음성 인식 장치(1) 동작과 동시 또는 바로 후 안내멘트가 발화될 수 있다.
본 실시예에 따르면, 자연어 처리 서버(1112)와 텍스트 음성 변환 서버(1113)를 바로 연결함으로써, 가전 제어 서버(1130)를 통한 제어명령과 안내멘트 사이의 시간차를 최소화할 수 있다.
한편, 도 32a와 도 32b에서는 음성 인식 장치(1)로 허브 기능을 수행하는 음성 인식 장치를 예시하여 설명하였지만, 본 발명은 이에 한정되지 않는다. 예를 들어, 음성 인식 장치(1)는, 공기조화기 외에 로봇청소기, 냉장고, 세탁기, 조리기기, TV, 이동 단말기(스마트 폰, 웨어러블 기기), 차량, 조명 장치, 온도 조절 장치 등에 채용될 수 있다.
한편, 본 발명의 일 측에 따르면, 도 32a와 도 32b과 달리, 음성 인식 및 처리를 위한 자동 음성 인식 서버(1111), 자연어 처리 서버(1112), 텍스트 음성 변환 서버(1113)는 하나의 통합 서버로 구성될 수 있다.
또한, 실시예에 따라서는, 연계 서비스 서버(1120)와 가전 제어 서버(1130)는 하나의 통합 서버로 구성될 수 있다.
본 발명에 따르면, 음성 입력에 따라 음성 인식 장치가 동작함으로써, 사용자가 리모콘 등 원격제어장치, 휴대 단말기 등을 조작할 필요가 없어, 사용자 편의성을 증대시킬 수 있다.
또한, 도 32a와 도 32b를 참조하여 설명한 것과 같이, 본 발명은 복수의 서버를 이용하여, 사용자의 자연어 음성 명령을 인식하고, 대응하는 제어 동작을 수행함으로써, 음성 인식 장치, 각 서버의 시스템 자원에 제한되지 않고 효율적으로 자연어를 인식, 처리할 수 있다.
도 33 내지 도 35는 본 발명의 일 실시예에 따른 음성 인식 서버 시스템의 신호 흐름을 예시한 도면으로, 도 32a에 예시된 음성 인식 서버 시스템의 신호 흐름을 예시한 도면이다.
도 33은 사용자의 음성 명령에 따라 음성 인식 장치가 동작하는 통상적인 상황에서의 신호 흐름을 예시한다.
이하에서는 음성 인식 장치(1)로 음성 인식 장치(1)를 예시하여 설명하지만 본 발명은 이에 한정되지 않는다.
도 33을 참조하면, 본 발명의 일 실시예에 따른 음성 인식 장치(1), 예를 들어, 음성 인식 장치(1)는 사용자의 음성 명령을 수신할 수 있고(S410), 수신된 사용자의 음성 명령을 음성 서버(1110)로 송신할 수 있다(S420).
예를 들어, 음성 인식 장치(1)는 사용자가 "댄스 음악 틀어줘"와 같이 음악 재생 명령을 수신하면, 수신한 음성 명령을 웨이브(wave) 파일 등 소정 포맷의 디지털 음성 데이터로 변환하여 자동 음성 인식 서버(1111)로 송신할 수 있다.
한편, 음성 인식 장치(1)는 호출어를 포함하는 웨이크 업 신호를 수신한 후, 명령어 입력을 대기하다가 입력되는 음성 명령을 음성 서버(1110)로 송신할 수 있다.
또는, 음성 인식 장치(1)는 호출어 및 음성 명령을 포함하는 연속적인 음성 입력을 수신할 수 있다. 이 경우에, 음성 인식 장치(1)는 호출어를 인식하고, 음성 명령을 음성 서버(1110)로 송신할 수 있다.
한편, 시스템(10) 내부에서 기기 상호 간에 통신할 때, 송수신하는 신호는, 주고받는 메인 데이터 외에 각 기기의 식별 정보, 수행하는 작업(task)에 대한 세션(session) 값 등을 더 포함할 수 있다.
자동 음성 인식 서버(1111)는 수신한 음성 데이터를 인식하여 텍스트(text) 데이터로 변환할 수 있고(S431), 상기 텍스트 데이터를 자연어 처리 서버(1112)로 송신할 수 있다(S433).
자연어 처리 서버(1112)는 수신한 텍스트 데이터에 대한 자연어 처리를 수행하여 사용자의 음성 명령의 의도를 분석, 판별할 수 있다(S441).
예를 들어, 자연어 처리 서버(1112)는 "댄스 음악 틀어줘"에서 사용자가 음성 인식 장치(1)에서 댄스 음악을 재생하라는 의도의 음성 명령을 판별할 수 있다.
자연어 처리 서버(1112)는 상기 판별한 음성 명령에 대응하는 신호를 연계 서비스 서버(1120)로 송신할 수 있다(S443).
연계 서비스 서버(1120)가 가전 제어 서버(1130)로 음성 인식 장치(1)의 현재 상태 정보를 요청하면(S451), 가전 제어 서버(1130)는 음성 인식 장치(1)의 현재 상태 정보를 조회하여(S453), 연계 서비스 서버(1120)로 음성 인식 장치(1)의 현재 상태 정보를 송신할 수 있다(S455).
만약 가전 제어 서버(1130)가 음성 인식 장치(1)의 현재 상태 정보를 가지고 있지 않다면, 가전 제어 서버(1130)는 음성 인식 장치(1)로 현재 상태 정보를 요청하여 수신할 수 있다.
한편, 상태 정보를 수신한 연계 서비스 서버(1120)는 판별한 음성 명령에 따라 해당 음성 인식 장치(1)에서 댄스 음악을 재생하라는 요청 신호를 가전 제어 서버(1130)로 송신할 수 있다(S461).
가전 제어 서버(1130)는, 상기 요청 신호에 기초하여, 제어 신호를 생성, 음성 인식 장치(1)로 송신함으로써, 음성 인식 장치(1)를 제어할 수 있다(S463).
또한, 가전 제어 서버(1130)는, 음성 인식 장치(1)의 제어 후, 상기 음성 인식 장치(1)로부터 상기 제어 신호에 대한 응답 신호를 수신하고, 요청에 대한 동작이 성공했음을 알리는 처리 결과 정보를 연계 서비스 서버(1120)로 송신할 수 있다(S465).
연계 서비스 서버(1120)는, "댄스 음악 재생합니다" 등 처리 결과 정보에 대응하는 신호를 자연어 처리 서버(1112)로 송신할 수 있고(S470), 자연어 처리 서버(1112)는 판별한 사용자의 음성 명령에 기초하는 응답 신호를 상기 음성 인식 장치(1)로 송신할 수 있다(S481). 여기서, 판별한 사용자의 음성 명령에 기초하는 응답 신호는 상기 처리 결과 정보를 포함할 수 있다.
한편, 음성 인식 장치(1)는 상기 응답 신호에 대응하는 텍스트(출력 문구)를 포함하는 신호를 송신하고(S483), 이를 수신한 텍스트 음성 변환 서버(1113)는 수신한 신호에 포함되는 텍스트를 음성 데이터로 변환하여(S485), 상기 음성 인식 장치(1)로 송신할 수 있다(S487).
음성 인식 장치(1)는 수신한 음성 데이터에 기초하여 "댄스 음악 재생합니다" 등 음성 안내 메시지를 출도 5 수 있다(S490).
도 34는 해당 음성 인식 장치의 미지원 기능을 요청하는 경우에 신도 5흐름을 예시한다.
도 34를 참조하면, 본 발명의 일 실시예에 따른 음성 인식 장치(1)는 "라디오 틀어줘" 등 음성 인식 장치(1)가 지원하지 않는 라디오 출력 기능에 대한 사용자의 음성 명령을 수신할 수 있다(S510).
음성 인식 장치(1)는 수신된 사용자의 음성 명령을 음성 서버(1110)로 송신할 수 있다(S520). 음성 인식 장치(1)는 수신한 음성 명령을 웨이브(wave) 파일 등 소정 포맷의 디지털 음성 데이터로 변환하여 자동 음성 인식 서버(1111)로 송신할 수 있다.
자동 음성 인식 서버(1111)는 수신한 음성 데이터를 인식하여 텍스트(text) 데이터로 변환할 수 있고(S531), 상기 텍스트 데이터를 자연어 처리 서버(1112)로 송신할 수 있다(S533).
자연어 처리 서버(1112)는 수신한 텍스트 데이터에 대한 자연어 처리를 수행하여 사용자의 음성 명령의 의도를 분석, 판별할 수 있다(S541).
또한, 자연어 처리 서버(1112)는 상기 판별한 음성 명의 지원 가능 유무를 판별할 수 있다. 본 실시예에서는, 자연어 처리 서버(1112)는 음성 인식 장치(1)가 지원하지 않는 빨래 기능을 사용자가 요청했음을 판별할 수 있다.
이후, 자연어 처리 서버(1112)는 음성 인식 장치(1)로 상기 판별한 음성 명령이 상기 음성 인식 장치(1)가 지원하지 않는 기능임을 알리는 응답 신호를 송신할 수 있다(S543).
한편, 음성 인식 장치(1)는 상기 응답 신호에 대응하는 텍스트(출력 문구)를 포함하는 신호를 송신하고(S551), 이를 수신한 텍스트 음성 변환 서버(1113)는 수신한 신호에 포함되는 텍스트를 음성 데이터로 변환하여(S553), 상기 음성 인식 장치(1)로 송신할 수 있다(S555).
음성 인식 장치(1)는 수신한 음성 데이터에 기초하여 "지원하지 않는 기능입니다" 등 음성 안내 메시지를 출력할 수 있다(S560).
도 35은 해당 음성 인식 장치의 현재 동작 모드에서 미지원 기능을 요청하는 경우에 신호 흐름을 예시한다.
도 35을 참조하면, 본 발명의 일 실시예에 따른 음성 인식 장치(1)는 "재생 음악 녹음해줘" 등 음성 인식 장치(1)의 특정 모드 운전을 지시하는 사용자의 음성 명령을 수신할 수 있다(S610).
음성 인식 장치(1)는 수신된 사용자의 음성 명령을 음성 서버(1110)로 송신할 수 있다(S620). 음성 인식 장치(1)는 수신한 음성 명령을 웨이브(wave) 파일 등 소정 포맷의 디지털 음성 데이터로 변환하여 자동 음성 인식 서버(1111)로 송신할 수 있다.
자동 음성 인식 서버(1111)는 수신한 음성 데이터를 인식하여 텍스트(text) 데이터로 변환할 수 있고(S631), 상기 텍스트 데이터를 자연어 처리 서버(1112)로 송신할 수 있다(S633).
자연어 처리 서버(1112)는 수신한 텍스트 데이터에 대한 자연어 처리를 수행하여 사용자의 음성 명령의 의도를 분석, 판별할 수 있다(S641).
예를 들어, 자연어 처리 서버(1112)는 "재생 음악 녹음해줘"에서 사용자가 음성 인식 장치(1)에세 재생 음악을 녹음하라는 의도의 음성 명령을 판별할 수 있다.
자연어 처리 서버(1112)는 상기 판별한 음성 명령에 대응하는 신호를 연계 서비스 서버(1120)로 송신할 수 있다(S643).
연계 서비스 서버(1120)가 가전 제어 서버(1130)로 음성 인식 장치(1)의 현재 상태 정보를 요청하면(S651), 가전 제어 서버(1130)는 음성 인식 장치(1)의 현재 상태 정보를 조회하여(S653), 연계 서비스 서버(1120)로 음성 인식 장치(1)의 현재 상태 정보를 송신할 수 있다(S655).
만약 가전 제어 서버(1130)가 음성 인식 장치(1)의 현재 상태 정보를 가지고 있지 않다면, 가전 제어 서버(1130)는 음성 인식 장치(1)로 현재 상태 정보를 요청하여 수신할 수 있다.
한편, 상태 정보를 수신한 연계 서비스 서버(1120)는 음성 인식 장치(1)의 현재 상태 정보를 기준으로 상기 판별한 음성 명령의 지원 가능 유무를 판별할 수 있다(S657). 예를 들어, 현재 음성 인식 장치(1)가 음악 재생 중이고, 녹음 기능은 녹음 모드에서만 지원되는 경우에, 자연어 처리 서버(1112)는 현재 상태에서 지원하지 않는 재생 음악 녹음을 사용자가 요청했음을 판별할 수 있다.
이후, 연계 서비스 서버(1120)는 자연어 처리 서버(1112)로 상기 판별한 음성 명령이 상기 음성 인식 장치(1)가 현재 상태에서 지원하지 않는 기능임을 알리는 응답 신호를 송신할 수 있다(S660).
또한, 자연어 처리 서버(1112)로 상기 판별한 음성 명령이 상기 음성 인식 장치(1)로 현재 상태에서 지원하지 않는 기능임을 알리는 응답 신호를 송신할 수 있다(S671).
한편, 음성 인식 장치(1)는 상기 응답 신호에 대응하는 텍스트(출력 문구)를 포함하는 신호를 송신하고(S673), 이를 수신한 텍스트 음성 변환 서버(1113)는 수신한 신호에 포함되는 텍스트를 음성 데이터로 변환하여(S675), 상기 음성 인식 장치(1)로 송신할 수 있다(S677).
음성 인식 장치(1)는 수신한 음성 데이터에 기초하여 "재생 음악 녹음은 지원하지 않습니다" 등 음성 안내 메시지를 출력할 수 있다(S680).
도 36 내지 도 38은 본 발명의 일 실시예에 따른 음성 인식 서버 시스템의 신호 흐름을 예시한 도면으로, 도 32b에 예시된 음성 인식 서버 시스템의 신호 흐름을 예시한 도면이다.
도 36은 사용자의 음성 명령에 따라 음성 인식 장치가 동작하는 통상적인 상황에서의 신호 흐름을 예시한다.
도 36을 참조하면, 본 발명의 일 실시예에 따른 음성 인식 장치(1), 예를 들어, 음성 인식 장치(1)는 사용자의 음성 명령을 수신할 수 있고(S710), 수신된 사용자의 음성 명령을 음성 서버(1110)로 송신할 수 있다(S720).
자동 음성 인식 서버(1111)는 수신한 음성 데이터를 인식하여 텍스트(text) 데이터로 변환할 수 있고(S731), 상기 텍스트 데이터를 자연어 처리 서버(1112)로 송신할 수 있다(S733).
자연어 처리 서버(1112)는 수신한 텍스트 데이터에 대한 자연어 처리를 수행하여 사용자의 음성 명령의 의도를 분석, 판별할 수 있다(S741).
예를 들어, 자연어 처리 서버(1112)는 "댄스 음악 틀어줘"에서 사용자가 음성 인식 장치(1)에서 댄스 음악을 재생하라는 의도의 음성 명령을 판별할 수 있다.
자연어 처리 서버(1112)는 상기 판별한 음성 명령에 대응하는 신호를 연계 서비스 서버(1120)로 송신할 수 있다(S743).
연계 서비스 서버(1120)가 가전 제어 서버(1130)로 음성 인식 장치(1)의 현재 상태 정보를 요청하면(S751), 가전 제어 서버(1130)는 음성 인식 장치(1)의 현재 상태 정보를 조회하여(S753), 연계 서비스 서버(1120)로 음성 인식 장치(1)의 현재 상태 정보를 송신할 수 있다(S755).
만약 가전 제어 서버(1130)가 음성 인식 장치(1)의 현재 상태 정보를 가지고 있지 않다면, 가전 제어 서버(1130)는 음성 인식 장치(1)로 현재 상태 정보를 요청하여 수신할 수 있다.
한편, 상태 정보를 수신한 연계 서비스 서버(1120)는 판별한 음성 명령에 따라 해당 음성 인식 장치(1)에서 댄스 음악을 재생하라는 요청 신호를 가전 제어 서버(1130)로 송신할 수 있다(S761).
가전 제어 서버(1130)는, 상기 요청 신호에 기초하여, 제어 신호를 생성, 음성 인식 장치(1)로 송신함으로써, 음성 인식 장치(1)를 제어할 수 있다(S763).
또한, 가전 제어 서버(1130)는, 음성 인식 장치(1)의 제어 후, 상기 음성 인식 장치(1)로부터 상기 제어 신호에 대한 응답 신호를 수신하고, 요청에 대한 동작이 성공했음을 알리는 처리 결과 정보를 연계 서비스 서버(1120)로 송신할 수 있다(S765).
연계 서비스 서버(1120)는, "댄스 음악 재생합니다" 등 처리 결과 정보에 대응하는 신호를 자연어 처리 서버(1112)로 송신할 수 있다(S770).
한편, 자연어 처리 서버(1112)는 판별한 사용자의 음성 명령에 기초하는 응답 신호를 텍스트 음성 변환 서버(1113)로 송신할 수 있다(S781). 여기서, 판별한 사용자의 음성 명령에 기초하는 응답 신호는 상기 처리 결과 정보를 포함할 수 있다.
한편, 텍스트 음성 변환 서버(1113)는 상기 음성 명령에 기초하는 응답 신호를 음성 데이터로 변환하여(S783), 상기 음성 인식 장치(1)로 송신할 수 있다(S785).
음성 인식 장치(1)는 수신한 음성 데이터에 기초하여 "댄스 음악 재생합니다 등 음성 안내 메시지를 출력할 수 있다(S790).
도 37은 해당 음성 인식 장치의 미지원 기능을 요청하는 경우에 신호 흐름을 예시한다.
도 37을 참조하면, 본 발명의 일 실시예에 따른 음성 인식 장치(1)는 "라디오 틀어줘" 등 음성 인식 장치(1)가 지원하지 않는 빨래 기능에 대한 사용자의 음성 명령을 수신할 수 있다(S810).
음성 인식 장치(1)는 수신된 사용자의 음성 명령을 음성 서버(1110)로 송신할 수 있다(S820). 음성 인식 장치(1)는 수신한 음성 명령을 웨이브(wave) 파일 등 소정 포맷의 디지털 음성 데이터로 변환하여 자동 음성 인식 서버(1111)로 송신할 수 있다.
자동 음성 인식 서버(1111)는 수신한 음성 데이터를 인식하여 텍스트(text) 데이터로 변환할 수 있고(S831), 상기 텍스트 데이터를 자연어 처리 서버(1112)로 송신할 수 있다(S833).
자연어 처리 서버(1112)는 수신한 텍스트 데이터에 대한 자연어 처리를 수행하여 사용자의 음성 명령의 의도를 분석, 판별할 수 있다(S841).
또한, 자연어 처리 서버(1112)는 상기 판별한 음성 명령의 지원 가능 유무를 판별할 수 있다. 본 실시예에서는, 자연어 처리 서버(1112)는 음성 인식 장치(1)가 지원하지 않는 빨래 기능을 사용자가 요청했음을 판별할 수 있다.
이후, 자연어 처리 서버(1112)는 텍스트 음성 변환 서버(1113)로 상기 판별한 음성 명령이 상기 음성 인식 장치(1)가 지원하지 않는 기능임을 알리는 응답 신호를 송신할 수 있다(S843).
텍스트 음성 변환 서버(1113)는 상기 음성 명령에 기초하는 응답 신호를 음성 데이터로 변환하여(S845), 상기 음성 인식 장치(1)로 송신할 수 있다(S847).
음성 인식 장치(1)는 수신한 음성 데이터에 기초하여 "지원하지 않는 기능입니다" 등 음성 안내 메시지를 출력할 수 있다(S850).
도 38은 해당 음성 인식 장치의 현재 동작 모드에서 미지원 기능을 요청하는 경우에 신호 흐름을 예시한다.
도 38를 참조하면, 본 발명의 일 실시예에 따른 음성 인식 장치(1)는 "재생 음악 녹음해줘" 등 음성 인식 장치(1)의 특정 모드 운전을 지시하는 사용자의 음성 명령을 수신할 수 있다(S910).
음성 인식 장치(1)는 수신된 사용자의 음성 명령을 음성 서버(1110)로 송신할 수 있다(S920). 음성 인식 장치(1)는 수신한 음성 명령을 웨이브(wave) 파일 등 소정 포맷의 디지털 음성 데이터로 변환하여 자동 음성 인식 서버(1111)로 송신할 수 있다.
자동 음성 인식 서버(1111)는 수신한 음성 데이터를 인식하여 텍스트(text) 데이터로 변환할 수 있고(S931), 상기 텍스트 데이터를 자연어 처리 서버(1112)로 송신할 수 있다(S933).
자연어 처리 서버(1112)는 수신한 텍스트 데이터에 대한 자연어 처리를 수행하여 사용자의 음성 명령의 의도를 분석, 판별할 수 있다(S941).
예를 들어, 자연어 처리 서버(1112)는 "재생 음악 녹음해줘"에서 사용자가 음성 인식 장치(1)에서 재생 음악을 녹음하라는 의도의 음성 명령을 판별할 수 있다.
자연어 처리 서버(1112)는 상기 판별한 음성 명령에 대응하는 신호를 연계 서비스 서버(1120)로 송신할 수 있다(S943).
연계 서비스 서버(1120)가 가전 제어 서버(1130)로 음성 인식 장치(1)의 현재 상태 정보를 요청하면(S951), 가전 제어 서버(1130)는 음성 인식 장치(1)의 현재 상태 정보를 조회하여(S953), 연계 서비스 서버(1120)로 음성 인식 장치(1)의 현재 상태 정보를 송신할 수 있다(S955).
만약 가전 제어 서버(1130)가 음성 인식 장치(1)의 현재 상태 정보를 가지고 있지 않다면, 가전 제어 서버(1130)는 음성 인식 장치(1)로 현재 상태 정보를 요청하여 수신할 수 있다.
한편, 상태 정보를 수신한 연계 서비스 서버(1120)는 음성 인식 장치(1)의 현재 상태 정보를 기준으로 상기 판별한 음성 명령의 지원 가능 유무를 판별할 수 있다(S957). 예를 들어, 현재 음성 인식 장치(1)가 음악 재생 중이고, 녹음 기능은 녹음 모드에서만 지원되는 경우에, 자연어 처리 서버(1112)는 현재 상태에서 지원하지 않는 녹음 모드를 사용자가 요청했음을 판별할 수 있다.
이후, 연계 서비스 서버(1120)는 자연어 처리 서버(1112)로 상기 판별한 음성 명령이 상기 음성 인식 장치(1)가 현재 상태에서 지원하지 않는 기능임을 알리는 응답 신호를 송신할 수 있다(S960).
또한, 자연어 처리 서버(1112)로 상기 판별한 음성 명령이 텍스트 음성 변환 서버(1113)로 현재 상태에서 지원하지 않는 기능임을 알리는 응답 신호를 송신할 수 있다(S971).
한편, 텍스트 음성 변환 서버(1113)는, 상기 음성 명령에 기초하는 응답 신호를 음성 데이터로 변환하여(S973), 상기 음성 인식 장치(1)로 송신할 수 있다(S975).
음성 인식 장치(1)는 수신한 음성 데이터에 기초하여 "재생 음악 녹음은 지원하지 않습니다" 등 음성 안내 메시지를 출력할 수 있다(S980).
본 발명에 따르면, 사용자의 명령을 이해 못한 경우, 제공할 수 없는 기능인 경우 등에 대하여 적합한 음성 안내를 제공하는 사용자 경험을 구현할 수 있다.
명령 처리 중 발생하는 각각의 상황과 시점에 맞는 안내 멘트를 제공함으로써, 사용자의 불편함을 최소화할 수 있다.
도 39는 본 발명의 일 실시예에 따른 서버의 내부 블록도의 일예를 도시한 도면으로, 상기 서버(1100)는, 자동 음성 인식 서버(1111), 자연어 처리 서버(1112), 텍스트 음성 변환 서버(1113), 연계 서비스 서버(1120), 가전 제어 서버(1130)일 수 있다.
도 39를 참조하면, 서버는, 통신 모듈(2020), 저장부(2030), 및 프로세서(2010)를 구비할 수 있다.
프로세서(2010)는, 서버의 전반적인 동작을 제어할 수 있다.
통신 모듈(2020)은, 음성 인식 장치(1) 등, 다른 서버 등으로부터 상태 정보, 동작 정보, 조작 정보, 음성 데이터, 문자 데이터 등 각종 데이터를 수신할 수 있다.
그리고 통신 모듈(2020)은 수신되는 각종 정보에 대응하는 데이터를 그대로 또는 소정 처리 후에 음성 인식 장치(1), 다른 서버 등으로 송신할 수 있다.
이를 위해, 통신 모듈(2020)은 인터넷 모듈, 이동 통신 모듈 등 하나 이상의 통신 모듈을 구비할 수 있다.
저장부(2030)는, 수신되는 정보를 저장하고, 이에 대응하는 결과 정보 생성을 위한 데이터를 구비할 수 있다.
저장부(2030)는 해당 서버의 동작을 위한 데이터가 저장될 수 있다. 예를 들어, 저장부(2030)에는, 자동 음성 인식 서버(1111)의 경우 자동 음성 인식 알고리즘 등이 저장되고, 가전 제어 서버(1130)의 경우 음성 인식 장치(1)의 제품 정보, 상태 정보, 음성 인식 장치(1)의 제어를 위한 데이터가 저장될 수 있다.
한편, 서버는, 음성 인식 장치(1)의 제조사가 운영하는 서버 또는 서비스 제공자가 운영하는 서버일 수 있고, 일종의 클라우드(Cloud) 서버일 수 있다.
도 40은 본 발명의 일 실시예에 따른 음성 인식 장치의 내부 블록도의 일예를 도시한 도면이다.
도 40을 참조하면, 본 발명의 일 실시예에 따른 음성 인식 장치(1)는, 사용자의 음성 명령을 수신하는 오디오 입력부(220), 각종 데이터를 저장하는 메모리(250), 다른 전자기기와 무선 통신하는 통신 모듈(50), 소정 정보를 영상으로 표시하거나 오디오로 출력하는 출력부(290), 및, 전반적인 동작을 제어하는 제어부(240)를 포함할 수 있다.
오디오 입력부(220)는, 외부의 오디오 신호, 사용자 음성 명령을 입력받을 수 있다. 이를 위해, 오디오 입력부(220)는, 하나 이상의 마이크(MIC)를 구비할 수 있다. 또한, 사용자의 음성 명령을 더 정확히 수신하기 위하여 오디오 입력부(220)는 복수의 마이크(221, 222)를 구비할 수 있다. 복수의 마이크(221, 222)는, 서로 다른 위치에 이격되어 배치될 수 있고, 외부의 오디오 신호를 획득하여 전기적인 신호로 처리할 수 있다.
도 40 등에서는 오디오 입력부(220)가 제1 마이크(221)와 제2 마이크(222)의 2개의 마이크를 구비하는 예를 도시하였으나, 본 발명은 이에 한정되지 않는다.
오디오 입력부(220)는 아날로그 소리를 디지털 데이터로 변환하는 처리부를 포함하거나 처리부에 연결되어 사용자 입력 음성 명령을 제어부(240) 또는 소정 서버에서 인식할 수 있도록 데이터화할 수 있다.
한편, 오디오 입력부(220)는 사용자의 음성 명령을 입력받는 과정에서 발생하는 잡음(noise)을 제거하기 위한 다양한 잡음 제거 알고리즘이 사용될 수 있다.
또한, 오디오 입력부(220)는 각 마이크(221, 222)에서 수신되는 오디오 신호에서 노이즈를 제거하는 필터, 필터에서 출력되는 신호를 증폭하여 출력하는 증폭기 등 오디오 신호 처리를 위한 구성들을 포함할 수 있다.
메모리(250)는 음성 인식 장치(1)의 동작에 필요한 각종 정보들을 기록하는 것으로, 휘발성 또는 비휘발성 기록 매체를 포함할 수 있다. 기록 매체는 마이크로 프로세서(micro processor)에 의해 읽힐 수 있는 데이터를 저장한 것으로, HDD(Hard Disk Drive), SSD(Solid State Disk), SDD(Silicon Disk Drive), ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광 데이터 저장 장치 등을 포함할 수 있다.
한편, 메모리(250)에는 음성 인식을 위한 데이터가 저장될 수 있고, 제어부(240)는 오디오 입력부(220)를 통하여 수신되는 사용자의 음성 입력 신호를 처리하고 음성 인식 과정을 수행할 수 있다.
한편, 간단한 음성 인식은 음성 인식 장치(1)가 수행하고, 자연어 처리 등 고차원의 음성 인식은 음성 인식 서버 시스템(1100)에서 수행될 수 있다.
예를 들어, 기설정된 호출어를 포함하는 웨이크 업(wake up) 음성 신호가 수신되는 경우에, 음성 인식 장치(1)는 음성 명령어를 수신하기 위한 상태로 전환될 수 있다. 이 경우에, 음성 인식 장치(1)는 호출어 음성 입력 여부까지의 음성 인식 과정만 수행하고, 이후의 사용자 음성 입력에 대한 음성 인식은 음성 인식 서버 시스템(1100)을 통하여 수행할 수 있다.
음성 인식 장치(1)의 시스템 자원에는 한계가 있으므로, 복잡한 자연어 인식 및 처리는 음성 인식 서버 시스템(1100)을 통하여 수행될 수 있다.
상기 메모리(250)에는 제한적인 데이터가 저장될 수 있다. 예를 들어, 상기 메모리(250)에는 기설정된 호출어를 포함하는 웨이크 업(wake up) 음성 신호를 인식하기 위한 데이터가 저장될 수 있다. 이 경우에, 상기 제어부(240)는 상기 오디오 입력부(220)를 통하여 수신되는 사용자의 음성 입력 신호로부터 기설정된 호출어를 포함하는 웨이크 업(wake up) 음성 신호를 인식할 수 있다.
한편, 상기 호출어는 제조사에 의해 설정될 수 있다. 예를 들어, "LG 허브"가 호출어로 설정될 수 있다.
또한, 상기 호출어는 사용자에 의해 설정 변경이 가능하다.
상기 제어부(240)는, 웨이크 업(wake up) 음성 신호의 인식 이후에 입력되는 사용자의 음성 명령을, 통신 모듈(50)을 통하여, 음성 인식 서버 시스템(1100)에 송신하도록 제어할 수 있다.
한편, 이와 달리, 제어부(240)는, 컨택 스위치들(181a, 181b, 181c, 181d) 중 어느 하나의 작동에 따라, 음성 인식 기능을 활성화시키고, 음성 인식 기능이 활성화된 상태에서, 입력되는 사용자의 음성 명령을, 통신 모듈(50)을 통하여, 음성 인식 서버 시스템(1100)에 송신하도록 제어할 수 있다.
통신 모듈(50)은, 하나 이상의 통신 모듈을 구비하여, 다른 전자기기와, 무선 통신을 수행하여, 각종 신호를 주고 받을 수 있다. 예를 들어, 통신 모듈(50)은 마트 홈 시스템(10) 내/외부의 전자기기들과 통신할 수 있다.
또한, 통신 모듈(50)은 액세스 포인트 장치(7)와 통신하고, 액세스 포인트 장치(7)를 통하여 무선 인터넷 네트워크에 접속하여 다른 기기들과 통신할 수 있다.
또한, 제어부(240)는 통신 모듈(50)을 통해 음성 인식 장치(1)의 상태 정보, 사용자의 음성 명령 등을 음성 인식 서버 시스템(1100) 등으로 전송할 수 있다.
한편, 상기 통신 모듈(50)을 통하여 제어 신호가 수신되면, 제어부(240)는 수신되는 제어 신호에 따라 동작하도록 음성 인식 장치(1)를 제어할 수 있다.
출력부(290)는 사용자의 명령 입력에 대응하는 정보, 사용자의 명령 입력에 대응하는 처리 결과, 동작모드, 동작상태, 에러상태 등을 영상으로 표시하는 디스플레이(13)를 포함할 수 있다.
실시예에 따라서는, 상기 디스플레이(13)는 터치패드와 상호 레이어 구조를 이루어 터치스크린으로 구성될 수 있다. 이 경우에, 상기 디스플레이(13)는 출력 장치 이외에 사용자의 터치에 의한 정보의 입력이 가능한 입력 장치로도 사용될 수 있다.
또한, 출력부(290)는 오디오 신호를 출력하는 오디오 출력부(291)를 더 포함할 수 있다. 오디오 출력부(291)는 제어부(240)의 제어에 따라 경고음, 동작모드, 동작상태, 에러상태 등의 알림 메시지, 사용자의 명령 입력에 대응하는 정보, 사용자의 명령 입력에 대응하는 처리 결과 등을 오디오로 출력할 수 있다. 오디오 출력부(291)는, 제어부(240)로부터의 전기 신호를 오디오 신호로 변환하여 출력할 수 있다. 이를 위해, 스피커 등을 구비할 수 있다.
한편, 음성 인식 장치(1)는 사용자 입력을 위한 조작부(181), 음성 인식 장치(1) 주변 소정 범위를 촬영할 수 있는 카메라(210)를 더 포함할 수 있다.
조작부(181)는, 복수의 조작 버튼을 구비하여, 입력되는 버튼에 대응하는 신호를 제어부(240)로 전달할 수 있다.
카메라(210)는 음성 인식 장치(1) 주변, 외부 환경 등을 촬영하는 것으로, 이러한 카메라는 촬영 효율을 위해 각 부위별로 여러 개가 설치될 수도 있다.
예를 들어, 카메라(210)는 적어도 하나의 광학렌즈와, 광학렌즈를 통과한 광에 의해 상이 맺히는 다수개의 광다이오드(photodiode, 예를 들어, pixel)를 포함하여 구성된 이미지센서(예를 들어, CMOS image sensor)와, 광다이오드들로부터 출력된 신호를 바탕으로 영상을 구성하는 디지털 신호 처리기(DSP: Digital Signal Processor)를 포함할 수 있다. 디지털 신호 처리기는 정지영상은 물론이고, 정지영상으로 구성된 프레임들로 이루어진 동영상을 생성하는 것도 가능하다.
한편, 상기 카메라(210)가 촬영하여 획득된 영상은 메모리(250)에 저장될 수 있다.
도 41은 본 발명의 일 실시예에 따른, 음성 인식 장치, 및 음성 인식 시스템의 동작 방법에 대한 순서도이다.
도면을 참조하면, 음성 인식 장치(1)는, 제1 음성 인식 알고리즘을 저장하며, 음성 명령을 서버 시스템(1100)에 전송할 수 있다(S1010).
서버 시스템(1100)은, 통신 모듈(2020)을 통해, 음성 명령을 수신하며, 음성 명령은, 사용자 음성 정보가 되어 저장부(2030)에 저장될 수 있다(S1031)
한편, 사용자 음성 정보는, 사용자의 목소리 톤, 세기, 빠르기, 자주 사용하는 키워드, 사용자의 성별, 나이, 생체정보, 지역별 언어차이 등의 사용자 특성 데이터일 수 있다.
서버 시스템(1100)은, 서버 시스템(1100)에 저장된 사용자 음성 정보에 기초하여 기계 학습을 수행할 수 있으며(S1032), 서버 시스템(1100)은, 기계 학습을 통해 제1 음성 인식 알고리즘 관련 업데이트 데이터를 생성할 수 있다(S1033).
한편, 제1 음성 인식 알고리즘은, 기 설정된 호출어를 포함하는 웨이크업 음성 신호를 인식하기 위한 알고리즘 또는 기 설정된 비교적 간단한 어휘의 키워드를 인식 하기 위한 알고리즘 일 수 있다.
한편, 음성 인식 장치(1)는, 서버 시스템(1100)에 제1 음성 인식 알고리즘 관련 업데이트 데이터를 요청할 수 있다(S1050). 또한, 음성 인식 장치(1)는, 외부 이동 단말기의 애플리케이션을 통해 제1 음성 인식 알고리즘 관련 업데이트 데이터를 요청할 수도 있다.
서버 시스템(1100)은, 음성 인식 장치(1) 또는 이동 단말기의 요청에 대응하여, 제1 음성 인식 알고리즘 관련 업데이트 데이터를, 음성 인식 장치(1)에 전송할 수 있다(S1070). 한편, 음성 인식 장치(1) 또는 이동 단말기의 요청 없이 서버 시스템(1100)가 주기적 혹은 비주기적으로 제1 음성 인식 알고리즘 관련 업데이트 데이터를 전송하는 것도 가능하다.
한편, 음성 인식 장치(1)는, 업데이트 히스토리 정보 전송이 가능하고, 서버 시스템(1100)은, 음성 인식 장치(1)의 히스토리 정보를 분석하여, 기존 업데이트 데이터와 충돌되지 않는, 업데이트 데이터를 음성 인식 장치(1)로 전송할 수 있다.
한편, 음성 인식 시스템(1010) 내에, 복수의 홈 어플라이언스가 존재하는 경우, 복수의 홈 어플라이언스는 통신 모듈(미도시)을 통해 서로 정보 전송을 수행할 수 있다.
이 경우, 적어도 하나의 홈 어플라이언스는, 음성 인식 장치(1)로부터 복수의 홈 어플라이언스의 펌 웨어 업데이트 데이터를 수신할 수 있다.
즉, 음성 인식 장치(1)는, 음성 인식 장치(1) 자체의 업데이트 데이터 외에, 주변의 적어도 하나의 홈 어플라이언스의 업데이트를 위한 업데이트 데이터를, 서버 시스템(1100)으로부터 수신하고, 해당 업데이트 데이터를, 각각의 홈 어플라이언스에 전송할 수 있다.
예를 들어, 음성 인식 시스템(1010) 내에, 공기조화기, 로봇청소기, 냉장고가 존재하는 경우, 음성 인식 장치(1)는, 서버 시스템(1100)으로부터 공기조화기에 대한 제1 업데이트 데이터를 수신할 수 있으며, 이를 공기조화기로 전송할 수 있다. 이에 따라, 공기조화기에서, 펌 웨어 업데이트가 수행될 수 있게 된다.
다른 예로, 음성 인식 시스템(1010) 내에, 공기조화기, 로봇청소기, 냉장고가 존재하는 경우, 음성 인식 장치(1)는, 서버 시스템(1100)으로부터 공기조화기에 대한 제1 업데이트 데이터와, 냉장고에 대한 제2 업데이트 데이터를 수신할 수 있으며, 각각 제1 및 제2 업데이트 데이터를, 공기조화기와, 냉장고로 전송할 수 있다. 이에 따라, 공기조화기와, 냉장고에서, 펌 웨어 업데이트가 수행될 수 있게 된다.
한편, 음성 인식 장치(1)는, 제1 음성 인식 알고리즘 관련 업데이트 데이터를 기초로, 음성 인식 장치(1)에 저장된 제1 음성 인식 알고리즘을 업데이트할 수 있다(S1090).
여기서, 제1 음성 인식 알고리즘은 서버 시스템(1100)에 저장된 사용자 음성 정보를 기초로, 기계 학습에 의해 생성되는, 사용자 음성 인식 알고리즘일 수 있다.
따라서, 사용자는 사용자 특성에 맞는 음성 인식 알고리즘을 사용할 수 있게 되므로, 음성 인식 성능이 향상될 수 있다.
또한, 사용자 특성에 맞는, 음성 인식 알고리즘의 주기적 혹은 비 주기적인 업데이트로 인하여, 사용자 특성에 최적화된 음성 인식 알고리즘의 사용이 가능할 수 있다.
또한, 서버에 저장된 음성 인식 알고리즘의 업데이트에 비해, 모듈에 저장된 음성 인식 알고리즘의 업데이트가 어렵다는 문제를 해결할 수 있다.
또한, 자연어 음성 제어가 갖는 장점은 그대로 유지하면서도, 간단한 명령에 대해서는, 키워드 인식으로 서버 시스템(1100)와 무관하게 즉각적 대응이 가능하다는 장점이 있다.
도 42는 본 발명의 다른 실시예에 따른, 음성 인식 장치, 및 음성 인식 시스템의 동작 방법에 대한 순서도이다.
도면을 참조하면, 음성 인식 장치(1)는, 마이크를 통해 음성 명령을 수신하고, 음성 명령을 서버 시스템(1100)으로 전송할 수 있다.
서버 시스템(1100)은, 복수의 음성 명령을 수집하며(S910), 복수의 음성 명령은, 사용자 음성 정보가 되어 저장부(2030)에 저장될 수 있다(S930).
서버 시스템(1100)은, 사용자 음성 정보를 기초로, 기계 학습의 과정을 수행할 수 있다(S950). 이때, 기계 학습 알고리즘은 신경망(Neural Network), 결정 트리(Decision Tree), 유전 알고리즘(Genetic Algorithm), 유전자 프로그래밍(Genetic Programming), 가우스 과정 회귀, 선형 분별 분석, K 근접 이웃(K-Nearest Neighbor), 퍼셉트론, 방사 기저 함수 네트워크, 서포트 벡터 머신(Support Vector Machine), 딥 러닝(Deep Leanrning) 중 어느 하나일 수 있다.
예를 들어, 초기 사용자 음성 정보들에 대하여, 지도 학습(Supervised Learning)을 수행하고, 이후, 음성 인식 장치(1)에 입력되는 사용자 음성 정보에 대하여 비지도 학습(Unsupervised Learning)을 진행하여, 사용자 음성 정보를 예측할 수 있다.
한편, 서버 시스템(1100)가 음성 인식 시스템(1100)인 경우, 기계 학습하는 서버는, 음성 인식 시스템(1100)에 속하는 복수의 서버 중 적어도 어느 하나 일 수 있다.
서버 시스템(1100)은, 사용자 음성 정보를 기초로, 기계 학습에 의해 생성된, 음성 인식 관련 업데이트 데이터를 생성할 수 있으며(S970), 음성 인식 관련 업데이트 데이터를 기초로, 음성 인식 알고리즘을 업데이트할 수 있다(S990).
이에 따라, 사용자 음성 정보를 학습하여, 사용자 특성에 맞게 업데이트된 음성 인식 관련 업데이트 데이터를 전송하므로, 각 사용자에게 최적화된 음성 인식 장치 및 음성 인식 시스템을 제공할 수 있다.
한편, 음성 인식 알고리즘은, 제1 또는, 제2 음성 인식 알고리즘이 될 수 있는 것은 물론이다.
한편, 서버 시스템(1100)은, 음성 인식 장치(1)를 사용하는, 복수의 사용자에 대하여 기계 학습을 수행할 수 있다.
서버 시스템(1100)은, 복수의 사용자에 대하여, 기계 학습을 수행하고, 기계 학습을 기초로 생성된 음성 인식 알고리즘 관련 업데이트 데이터를 개별 사용자를 위한 업데이트 데이터로 사용할 수 있다.
한편, 음성 인식 장치(1)는, 개별 사용자에 대한, 음성 인식 알고리즘 관련 업데이트 데이터를 기초로, 개별 사용자에 대한, 제1 음성 인식 알고리즘을 각각 업데이트할 수 있다. 이에 따라 복수 사용자 각각에 대하여 사용자 맞춤의 음성 인식 알고리즘이 제공 될 수 있다.
한편, 서버 시스템(1100)은, 사용 빈도가 높은 사용자에 대하여 기계 학습을 수행할 수 있다. 서버 시스템(1100)은, 사용 빈도가 높은 사용자에 대하여, 기계 학습을 수행하고, 기계 학습을 기초로 음성 인식 관련 업데이트 데이터를 생성할 수 있다.
한편, 음성 인식 장치(1)는, 사용 빈도가 높은 사용자에 대한, 음성 인식 관련 업데이트 데이터를 수신받을 수 있다. 음성 인식 장치(1)는, 이를 기초로 제1 음성 인식 알고리즘을 업데이트할 수 있다. 이에 따라, 음성 인식 장치(1)는, 사용 빈도가 높은 사용자에 대한 음성 인식 알고리즘을 제공할 수 있다.
한편, 음성 인식 장치(1)는, 음성 명령을 서버 시스템(1100)으로 전송하고, 서버 시스템(1100)은, 음성 명령을 카운트하여, 사용 빈도가 높은 음성 명령들을 저장할 수 있다.
또한, 서버 시스템(1100)은, 사용 빈도가 높은 음성 명령을 소정 개수 선택하여, 제2 음성 인식 알고리즘 관련 업데이트 데이터를 생성할 수 있고, 이를 기초로, 제2 음성 인식 알고리즘을 업데이트할 수 있다.
또한, 서버 시스템(1100)은, 사용 빈도가 높은 음성 명령을 소정 개수 선택하여, 제1 음성 인식 알고리즘 관련 업데이트 데이터를 생성할 수도 있고, 이를 음성 인식 장치로 전송할 수도 있다.
한편, 음성 인식 장치(1)는, 사용 빈도가 높은 음성 명령에 대한 업데이트 데이터를 수신받을 수 있고, 이를 기초로 제1 음성 인식 알고리즘을 업데이트할 수 있다. 따라서, 자연어 음성 명령이라도 사용자의 음성 명령 패턴은 동일 또는 유사 할 수 있고, 사용 빈도가 높은 음성 명령에 대해서는, 음성 인식 장치(1)에서 직접 처리하게 되어, 동작 제어 속도가 향상될 수 있다.
예를 들어, "절전 기능 켜줘"와 같은, 자연어 음성 명령의 사용 빈도가 높은 경우, 서버 시스템(1100)은, 이를 기초로, 제1 음성 인식 알고리즘 관련 업데이트 데이터를 생성하여, 음성 인식 장치로 전송할 수 있고, 음성 인식 장치(1)는 업데이트 데이터를 수신받아, 제1 음성 인식 알고리즘을 업데이트할 수 있다. 이후, 사용자의 "절전 기능 켜줘"에 대하여, 음성 인식 장치(1)는, 즉각적인 대응이 가능하게 된다.
또한, 음성 인식 장치(1)는, 음성 명령 외에, 사용 빈도가 높은 기능 정보도 서버 시스템(1100)에 전송 가능하다. 한편, 서버 시스템(1100)은, 사용 빈도가 높은 음성 명령과, 사용 빈도가 높은 기능 정보를 분석하여 개선된, 음성 인식 관련 업데이트 데이터를 생성할 수도 있다.
도 43은 도 41의 동작 방법을 설명하기 위한 참조도면이다.
도면을 참조하면, 사용자는, 음성 인식 장치(1)에 음성 명령을 입력할 수 있다(11110).
한편, 음성 명령은, 기 설정된 호출어를 포함하는 웨이크업 음성 또는 기 설정된 비교적 간단한 어휘의 키워드일 수 있다. 또한, 음성 명령은, 자연어 음성 명령일 수 있다.
예를 들어, 음성 명령은, “LG 허브”과 같은 웨이크업 음성 일수 있다. 다른 예로, 음성 명령은, “전원 오프”와 같은 키워드 음성 명령일 수 있다. 또 다른 예로, 음성 명령은, “절전 기능 켜줘”와 같은 자연어 음성 명령일 수 있다.
마이크(221, 222)를 통하여 사용자 음성명령을 수신한 음성 인식 장치(1)는, 음성 명령을 액세스 포인트 장치(7)를 통해, 외부 네트 워크와 연결된 서버 시스템(1100)에 전송할 수 있다(11130).
서버 시스템(1100)은, 음성 명령을 기초로, 기계 학습에 의해 제1 음성 인식 알고리즘 관련 업데이트 데이터를 생성할 수 있다.
또한, 음성 인식 장치(1)는, 서버 시스템(1100)에 제1 음성 인식 알고리즘 관련 업데이트 데이터를 요청할 수 있다(11150).
서버 시스템(1100)은, 음성 인식 장치 업데이트 데이터 요청에 대응하여, 제1 음성 인식 알고리즘 관련 업데이트 데이터를 전송할 수 있다(11170).
도 44는, 본 발명의 또 다른 실시예에 따른, 음성 인식 장치, 및 음성 인식 시스템의 동작 방법에 대한 순서도이다.
도면을 참조하면, 음성 인식 장치(1)는, 음성 명령을 서버 시스템(1100)으로 전송하고(S1210), 서버 시스템(1100)은, 통신 모듈(2020)을 통해, 음성 명령을 수신할 수 있다.
한편, 서버 시스템(1100)은, 저장부(2030)를 구비하고, 저장부(2030)는, 제2 음성 인식 알고리즘을 저장할 수 있다. 또한, 저장부(2030)는, 음성 인식 장치(1)로부터 수신한, 음성 명령을, 사용자 음성 정보로 저장할 수 있다(S1231).
한편, 사용자 음성 정보는, 사용자의 목소리 톤, 세기 빠르기, 자주 사용하는 키워드, 사용자의 성별, 나이, 생체정보, 지역별 언어차이 등의 사용자 특성 데이터일 수 있다.
서버 시스템(1100)은, 저장부(2030)에 저장된, 사용자 음성 정보에 기초하여 기계 학습을 수행할 수 있으며(S1232), 서버 시스템(1100)은, 기계 학습을 통해 제2 음성 인식 알고리즘 관련 업데이트 데이터를 생성할 수 있다(S1233).
한편, 제2 음성 인식 알고리즘은 자연어 음성 명령을 인식하기 위한 음성 인식 알고리즘 일 수 있다.
서버 시스템(1100)은, 제2 음성 인식 알고리즘 관련 업데이트 데이터를 기초로, 서버 시스템(1100)에 저장된 제2 음성 인식 알고리즘을 업데이트할 수 있다(S1234).
한편, 사용자는, “절전 기능 켜줘”와 같은 자연어 음성 명령을 발화할 수 있다. 음성 인식 장치(1)는, 수신된, 자연어 음성 명령을 서버 시스템(1100)으로 전송할 수 있다(S1250).
서버 시스템(1100)은 제2 음성 인식 알고리즘을 기초로 자연어 음성 명령을 인식할 수 있으며(S1270), 인식된 자연어 음성 명령을, 텍스트 형식의 음성 데이터로 변환 할 수 있다(S1235).
서버 시스템(1100)은, 변환된 텍스트 형식의 음성 데이터를 음성 인식 장치(1)로 전송할 수 있다(S1290).
음성 인식 장치(1)는, 텍스트 형식의 음성 데이터를 기초로, 음성 인식 장치(1)의 동작을 제어할 수 있다(S1220). 예를 들어, 사용자의 “절전 기능 켜줘”에 대응하여, 음성 인식 장치의 절전 기능을 동작 시킬 수 있다.
제2 음성 인식 알고리즘은, 서버 시스템(1100)에 저장된 사용자 음성 정보를 기초로, 기계 학습에 의해 생성되는, 사용자 음성 인식 알고리즘일 수 있다.
따라서, 서버 시스템(1100)를 통해 음성 인식 알고리즘을 업데이트 하므로, 통합적인 업데이트 관리가 가능하다는 장점이 있다.
또한, 서버 시스템(1100)를 통해 비교적 용이하게 자연어 음성 인식 알고리즘을 업데이트할 수 있으며, 주기적인 업데이트로 인하여 다양한 자연어 처리가 가능하다는 장점도 있다.
도 45는, 도 44의 동작 방법을 설명하기 위한 참조도면이다.
도면을 참조하면, 사용자는, 음성 인식 장치(1)에 음성 명령을 입력할 수 있다(11310).
한편, 음성 명령은, 기 설정된 호출어를 포함하는 웨이크업 음성 또는 기 설정된 비교적 간단한 어휘의 키워드일 수 있다. 또한, 음성 명령은, 자연어 음성 명령일 수 있다.
예를 들어, 음성 명령은, “LG 허브” 과 같은 웨이크업 음성 일수 있다. 다른 예로, 음성 명령은, “전원 오프”와 같은 키워드 음성 명령일 수 있다. 또 다른 예로, 음성 명령은, “절전 기능 켜줘”와 같은 자연어 음성 명령일 수 있다.
마이크(221, 222)를 통하여 음성 명령을 수신한 음성 인식 장치(1)는, 음성 명령을 액세스 포인트 장치(7)를 통해, 외부 네트 워크와 연결된 서버 시스템(1100)에 전송할 수 있다(11330).
서버 시스템(1100)은, 음성 명령을 기초로, 기계 학습에 의해 제2 음성 인식 알고리즘 관련 업데이트 데이터를 생성할 수 있다.
서버 시스템(1100)은, 제2 음성 인식 알고리즘 관련 업데이트 데이터를 기초로, 서버 시스템(1100)에 저장된 제2 음성 인식 알고리즘을 업데이트할 수 있다.
한편, 사용자는, “음악 재생 해줘”와 같은 자연어 음성 명령을 발화할 수 있다(11311). 자연어 음성 명령은, 음성 인식 장치(1)의 마이크(221, 222)를 통하여 수신될 수 있고, 음성 인식 장치(1)는, 자연어 음성 명령을 액세스 포인트 장치(7)를 통해, 외부 네트 워크와 연결된 서버 시스템(1100)에 전송할 수 있다(11350).
서버 시스템(1100)은 제2 음성 인식 알고리즘을 기초로 자연어 음성 명령을 인식할 수 있으며, 인식된 자연어 음성 명령은 텍스트 형식의 음성 데이터로 변환 될 수 있다.
서버 시스템(1100)은, 변환된 텍스트 형식의 음성 데이터를 음성 인식 장치(1)로 전송할 수 있다(11370).
음성 인식 장치(1)는, 텍스트 형식의 음성 데이터를 기초로, 음성 인식 장치(1)의 동작을 제어할 수 있다. 예를 들어 사용자의 “음악 재생 해줘”의 자연어 음성 명령이 수신된 경우, 음성 인식 장치는, 음악 재생 기능을 동작시킬 수 있다.
한편, 제1 음성 인식 알고리즘 관련 업데이트 데이터의 생성, 제2 음성 인식 알고리즘 관련 업데이트 데이터의 생성은, 동시에 수행될 수도 있다.
한편, 음성 인식 알고리즘 업데이트는, 제1 음성 인식 알고리즘 업데이트 또는 제2 음성 인식 알고리즘 업데이트 중 적어도 어느 하나만 수행될 수도 있다.
도 46는, 본 발명의 또 다른 실시예에 따른, 음성 인식 장치, 및 음성 인식 시스템의 동작 방법에 대한 순서도이다.
도면을 참조하면, 음성 인식 장치(1)는, 마이크를 통해 음성 명령을 수신하고, 음성 명령을 서버 시스템(1100)으로 전송할 수 있다.
서버 시스템(1100)은, 복수의 음성 명령을 수집하며(S1410), 복수의 음성 명령은, 사용자 음성 정보가 되어 저장부(2030)에 저장될 수 있다(S1430).
한편, 사용자 음성에는 지역별 언어 차이에 의한 사용자 특성 데이터가 있을 수 있다. 서버 시스템(1100)은, 사용자 음성 정보 중 지역별 언어 차이에 의한, 사용자 지역 음성 정보를 분류할 수 있다(S1431). 여기서, 지역별 언어 차이는, 사투리(방언), 어조, 억양, 성조, 어휘, 발음 등으로 예시될 수 있다.
예를 들어, 서버 시스템(1100)은, 지역별 언어 차이의 표준 패턴을 미리 저장할 수 있고. 입력된 사용자 음성과 지역별 언어 차이의 표준 패턴을 비교하여, 비슷한 패턴의 사용자 음성을 분류할 수 있다. 분류된 사용자 음성은, 사용자 지역 음성 정보가 될 수 있다.
다른 예로, 서버 시스템(1100)은, 지역별 언어 차이에 대응하는 모델을 저장할 수 있고, 지역별 언어 차이에 대응하는 모델로부터, 입력된 사용자 음성에 대응하는 계열이 관측될 확률, 입력된 사용자 음성이 천이하는 확률, 입력된 사용자 음성이 천이할 때 출력되는 계열이 발생하는 확률 등을 기초로 사용자 음성을 분류할 수 있다.
또 다른 예로, 서버 시스템(1100)은, 지역별 언어 차이에 대응하는 기준 파라미터를 저장할 수 있고, 입력된 사용자 음성으로부터 특징 파라미터를 추출하고, 그 특징 파라미터를 기준 파라미터와 비교하여, 사용자 음성을 분류할 수 있다.
한편, 지역별 언어 차이와 관련된 방언이, 서버 시스템(1100)에 저장되어 있지 않은 경우, 서버 시스템(1100)은, 복수의 음성 인식 장치(1)로부터, 음성 명령을 수신할 때, 해당 음성 인식 장치(1)의 지역 정보를 함께 수신하며, 동일 지역에 속하는 음성 인식 장치(1)에서 수신된 방언을 학습하여, 해당 지역에 관한 방언으로 분류할 수 있다.
서버 시스템(1100)은, 사용자 음성 정보를 기초로, 기계 학습의 과정을 수행할 수 있다(S1450). 예를 들어 서버 시스템(1100)은 사용자의 목소리 톤, 세기, 빠르기, 자주 사용하는 키워드, 사용자의 성별, 나이 정보 등을 기초로, 기계 학습의 과정을 수행할 수 있다.
또한, 서버 시스템(1100)은, 사용자 음성 정보에서 분류된, 사용자 지역 음성 정보를 기초로, 기계 학습의 과정을 수행할 수 있다(S1451). 예를 들어 서버 시스템(1100)은, 사투리(방언), 어조, 억양, 성조, 어휘, 발등 등의 음성 정보를 기초로 기계 학습의 과정을 수행할 수 있다.
이때, 기계 학습 알고리즘은 신경망(Neural Network), 결정 트리(Decision Tree), 유전 알고리즘(Genetic Algorithm), 유전자 프로그래밍(Genetic Programming), 가우스 과정 회귀, 선형 분별 분석, K 근접 이웃(K-Nearest Neighbor), 퍼셉트론, 방사 기저 함수 네트워크, 서포트 벡터 머신(Support Vector Machine), 딥 러닝(Deep Leanrning) 중 어느 하나일 수 있다.
한편, 서버 시스템(1100)은, 음성 인식 장치(1)를 사용하는, 복수의 사용자에 대하여 기계 학습을 수행할 수 있다. 서버 시스템(1100)은, 복수의 사용자에 대하여, 기계 학습을 수행하고, 기계 학습을 기초로 생성된 음성 인식 알고리즘 관련 업데이트 데이터를 개별 사용자별로 분류할 수 있다.
서버 시스템(1100)은, 사용자 음성 정보를 기초로, 기계 학습에 의해 생성된, 사용자 음성 인식 관련 업데이트 데이터를 생성할 수 있으며(S1470), 사용자 음성 인식 관련 업데이트 데이터를 기초로, 사용자 음성 인식 알고리즘을 업데이트할 수 있다(S1490).
서버 시스템(1100)은, 사용자 지역 음성 정보를 기초로, 기계 학습에 의해 생성된, 사용자 지역 음성 인식 관련 업데이트 데이터를 생성할 수 있으며(S1471), 사용자 지역 음성 인식 관련 업데이트 데이터를 기초로, 사용자 지역 음성 인식 알고리즘을 업데이트할 수 있다(S1491).
서버 시스템(1100)은, 사용자 특성 정보를 기초로, 기계 학습에 의해 생성된, 사용자 특정 음성 인식 관련 업데이트 데이터를 생성할 수 있으며, 사용자 특성 음성 인식 관련 업데이트 데이터를 기초로, 사용자 특성 음성 인식 알고리즘을 업데이트할 수도 있다.
이에 따라, 음성 인식 기술의 경우, 지역별 인식 편차가 존재하여, 하나의 소프트웨어로 모두에게 같은 수준의 성능을 확보하기 어렵다는 문제점을 해결할 수 있다.
또한, 사용자 특성 데이터 중, 지역별 언어 차이 인식에 특화된 음성 인식 모듈을 제공할 수 있다.
도 47는, 도 46의 동작 방법을 설명하기 위한 참조도면이다.
도면을 참조하면, 음성 인식 장치(1)는, 제1 음성 인식 알고리즘을 저장하며, 음성 명령을 서버 시스템(1100)에 전송할 수 있다(S1510).
서버 시스템(1100)은, 통신 모듈(2020)을 통해, 음성 명령을 수신하며, 음성 명령은, 사용자 음성 정보가 되어 저장부(2030)에 저장될 수 있다(S1531)
서버 시스템(1100)은, 지역 음성 인식 기능이 활성화 되지 않은 경우, 도 41에서와 같이, 사용자 음성 정보에 기초하여 기계 학습을 수행할 수 있으며, 서버 시스템(1100)은, 기계 학습을 통해 제1 음성 인식 알고리즘 관련 업데이트 데이터를 생성할 수 있다.
서버 시스템(1100)은, 지역 음성 인식 기능이 활성화되어 있는 경우, 사용자 음성 정보 중, 사용자 지역 음성 정보를 분류하여 저장부(2030)에 저장할 수 있다(S1533).
서버 시스템(1100)은, 지역 음성 인식 기능이 활성화되어 있는 경우, 사용자 지역 음성 정보에 기초하여 기계 학습을 수행할 수 있으며(S1534), 서버 시스템(1100)은, 기계 학습을 통해 제1 음성 인식 알고리즘 관련 업데이트 데이터를 생성할 수 있다(S1535).
한편, 제1 음성 인식 알고리즘은, 기 설정된 호출어를 포함하는 웨이크업 음성 신호를 인식하기 위한 알고리즘 또는 기 설정된 비교적 간단한 어휘의 키워드 명령을 인식 하기 위한 알고리즘 일 수 있다.
한편, 음성 인식 장치(1)는, 서버 시스템(1100)에 제1 음성 인식 알고리즘 관련 업데이트 데이터를 요청할 수 있다(S1550). 또한, 음성 인식 장치(1)는, 외부 이동 단말기의 애플리케이션을 통해 제1 음성 인식 알고리즘 관련 업데이트 데이터를 요청할 수도 있다.
한편, 음성 인식 장치(1) 또는 이동 단말기의 요청 없이 서버 시스템(1100)가 주기적 혹은 비주기적으로 제1 음성 인식 알고리즘 관련 업데이트 데이터를 전송 하는 것도 가능하다.
음성 인식 장치(1)의 조작부(181)는, 업데이트 데이터의 입력 신호를 입력 받을 수 있다.
예를 들어, 음성 인식 장치(1)의 조작부(181)는, 사용자 음성 정보에 기초하여 기계 학습에 의해 생성된 제1 음성 인식 알고리즘 관련 업데이트 데이터 또는 사용자 지역 음성 정보에 기초하여 기계 학습에 의해 생성된 제1 음성 인식 알고리즘 관련 업데이트 데이터 중 적어도 어느 하나의 선택 신호를 입력 받을 수 있다.
서버 시스템(1100)은, 음성 인식 장치(1) 또는 이동 단말기의 요청에 대응하여 제1 음성 인식 알고리즘 관련 업데이트 데이터를, 음성 인식 장치(1)에 전송할 수 있다(S1570).
예를 들어, 서버 시스템(1100)은, 사용자가 입력한 업데이트 요청 신호에 대응하여, 사용자 음성 정보에 기초하여 기계 학습에 의해 생성된 제1 음성 인식 알고리즘 관련 업데이트 데이터 또는 사용자 지역 음성 정보에 기초하여 기계 학습에 의해 생성된 제1 음성 인식 알고리즘 관련 업데이트 데이터를 선택적으로 전송할 수 있다.
이 경우, 음성 인식 장치(1)는, 사용자 입력에 따라, 제1 음성 인식 알고리즘 관련 업데이트 데이터를 기초로, 음성 인식 장치(1)에 저장된 제1 음성 인식 알고리즘을 업데이트할 수 있다(S1591).
예를 들어, 사용자가, 사용자 음성 정보에 기초하여 기계 학습에 의해 생성된 제1 음성 인식 알고리즘 관련 업데이트 데이터를, 선택하여 수신받은 경우, 음성 인식 장치(1)는, 이를 기초로 제1 음성 인식 알고리즘을 업데이트할 수 있다.
예를 들어, 사용자가, 사용자 지역 음성 정보에 기초하여 기계 학습에 의해 생성된 제1 음성 인식 알고리즘 관련 업데이트 데이터를, 선택하여 수신받은 경우, 음성 인식 장치(1)는, 이를 기초로 제1 음성 인식 알고리즘을 업데이트할 수 있다.
한편, 서버 시스템(1100)은, 사용자 음성 정보에 기초하여 기계 학습에 의해 생성된 제1 음성 인식 알고리즘 관련 업데이트 데이터 및 사용자 지역 음성 정보에 기초하여 기계 학습에 의해 생성된 제1 음성 인식 알고리즘 관련 업데이트 데이터를 모두 전송할 수도 있다.
이 경우, 음성 인식 장치(1)는, 조작부(181)를 통해, 사용자 음성 인식 알고리즘 또는 사용자 지역 음성 인식 알고리즘 중, 적어도 어느 하나의 사용 명령을 입력 받아(S1592), 이를 사용 할 수 있다.
예를 들어, 사용자가, 사용자 지역 음성 인식 알고리즘을 선택한 경우, 음성 인식 장치는 사용자 지역 음성 인식 알고리즘을 사용하여 사용자 음성을 인식할 수 있다(S1593).
따라서, 제1 음성 인식 알고리즘은, 서버에 저장된 사용자 음성 정보 중 지역별 언어 차이에 의한, 사용자 지역 음성 정보를 기초로, 기계 학습에 의해 생성되는 사용자 지역 음성 인식 알고리즘 일 수 있다.
도 48은, 도 46의 동작 방법을 설명하기 위한 참조도면이다.
도면을 참조하면, 음성 인식 장치(1)는 음성 명령을 서버 시스템(1100)으로 전송하고(S1610) 서버 시스템(1100)은, 통신 모듈(2020)을 통해, 음성 명령을 수신할 수 있다.
한편, 서버 시스템(1100)은, 저장부(2030)를 구비하고, 저장부(2030)는, 제2 음성 인식 알고리즘을 저장할 수 있다. 또한, 저장부(2030)는, 음성 인식 장치(1)로부터 수신한, 음성 명령을, 사용자 음성 정보로 저장할 수 있다(S1631).
서버 시스템(1100)은, 지역 음성 인식 기능이 활성화되지 않은 경우, 도 44에서와 같이, 사용자 음성 정보에 기초하여 기계 학습을 수행할 수 있으며, 서버 시스템(1100)은, 기계 학습을 통해 제2 음성 인식 알고리즘 관련 업데이트 데이터를 생성할 수 있다.
서버 시스템(1100)은, 지역 음성 인식 기능이 활성화되어 있는 경우, 사용자 음성 정보 중, 사용자 지역 음성 정보를 분류하여 저장부(2030)에 저장할 수 있다(S1633).
서버 시스템(1100)은, 지역 음성 인식 기능이 활성화되어 있는 경우, 사용자 지역 음성 정보에 기초하여 기계 학습을 수행할 수 있으며(S1634), 서버 시스템(1100)은, 기계 학습을 통해 제2 음성 인식 알고리즘 관련 업데이트 데이터를 생성할 수 있다(S1635).
한편, 제2 음성 인식 알고리즘은 자연어 음성 명령을 인식하기 위한 음성 인식 알고리즘 일 수 있다.
서버 시스템(1100)은, 제2 음성 인식 알고리즘 관련 업데이트 데이터를 기초로, 서버 시스템(1100)에 저장된 제2 음성 인식 알고리즘을 업데이트할 수 있다(S1636).
음성 인식 장치(1)의 조작부(181)는, 음성 인식 알고리즘의 입력 신호를 입력 받을 수 있다.
예를 들어, 음성 인식 장치(1)의 조작부(181)는, 사용자 음성 정보에 기초하여 기계 학습에 의해 생성된 제2 음성 인식 알고리즘 또는 사용자 지역 음성 정보에 기초하여 기계 학습에 의해 생성된 제2 음성 인식 알고리즘 중 적어도 어느 하나의 입력 신호를 입력 받을 수 있다. 사용자 입력은, 사용자 음성 발화 전이라면 언제라도 가능하다.
음성 인식 장치(1)는, 사용자의 입력 신호를 서버 시스템(1100)으로 전송할 수 있다(S1650). 따라서, 사용자의 입력 신호에 의해, 서버 시스템(1100)의 사용자 음성 인식 알고리즘 또는 사용자 지역 음성 알고리즘을 선택하여 사용할 수 있다.
한편, 사용자는, “절전 기능 켜줘”와 같은 자연어 음성 명령을 발화할 수 있다. 음성 인식 장치(1)는, 수신된, 자연어 음성 명령을 서버 시스템(1100)으로 전송할 수 있다(S1670).
서버 시스템(1100)은, 제2 음성 인식 알고리즘을 기초로 자연어 음성 명령을 인식할 수 있으며(S1620), 인식된 자연어 음성 명령을, 텍스트 형식의 음성 데이터로 변환 할 수 있다(S1640).
예를 들어, 사용자가, 사용자 음성 정보에 기초하여 기계 학습에 의해 생성된 제2 음성 인식 알고리즘을 선택한 경우, 사용자 음성 정보에 기초하여 기계 학습에 의해 생성된 제2 음성 인식 알고리즘을 기초로 자연어 음성 명령을 인식하여 텍스트 형식의 음성 데이터로 변환 할 수 있다.
예를 들어, 사용자가, 사용자 지역 음성 정보에 기초하여 기계 학습에 의해 생성된 제2 음성 인식 알고리즘을 선택한 경우, 사용자 지역 음성 정보에 기초하여 기계 학습에 의해 생성된 제2 음성 인식 알고리즘을 기초로 자연어 음성 명령을 인식하여 텍스트 형식의 음성 데이터로 변환 할 수 있다.
따라서, 제2 음성 인식 알고리즘은, 서버에 저장된 사용자 음성 정보 중 지역별 언어 차이에 의한, 사용자 지역 음성 정보를 기초로, 기계 학습에 의해 생성되는 사용자 지역 음성 인식 알고리즘 일 수 있다.
한편, 서버 시스템(1100)은, 변환된 텍스트 형식의 음성 데이터를 음성 인식 장치(1)로 전송할 수 있다(S1690).
음성 인식 장치(1)는, 텍스트 형식의 음성 데이터를 기초로, 음성 인식 장치(1)의 동작을 제어할 수 있다(S1660). 예를 들어, 사용자의 “절전 기능 켜줘”에 대응하여, 음성 인식 장치의 절전 기능을 동작 시킬 수 있다.
도 49은, 본 발명의 또 다른 실시예에 따른, 음성 인식 장치, 및 음성 인식 시스템의 동작 방법에 대한 순서도이다.
도면을 참조하면, 음성 인식 장치(1)의 메모리(250)는, 현재 설치된, 제1 음성 인식 알고리즘 업데이트의 버전 정보를 저장할 수 있고, 음성 인식 장치(1)는, 서버 시스템(1100)에 버전 정보를 요청할 수 있다(S1710).
또한, 서버 시스템(1100)의 저장부(2030)도, 음성 인식 알고리즘 업데이트 데이터의 버전 정보를 저장할 수 있고, 서버 시스템(1100) 역시, 음성 인식 장치(1)에 업데이트 버전 정보를 요청할 수 있다(S1710).
업데이트 버전 정보 요청 또는 전송은, 비 주기적으로도 가능하고, 시간, 일, 주, 월 및 년의 기간 중 하나 이상의 일정 기간 간격으로도 할 수 있다.
음성 인식 장치(1)는, 서버 시스템(1100)의 업데이트 버전 정보 요청에 대응하여, 서버 시스템(1100)으로 업데이트 버전 정보를 전송할 수 있다(S1730).
또한, 서버 시스템(1100)도, 음성 인식 장치(1)의 업데이트 버전 정보 요청에 대응하여, 음성 인식 장치(1)로 업데이트 버전 정보를 전송할 수 있다(S1730).
음성 인식 장치(1)는, 서버로부터, 서버에 저장된, 제1 음성 인식 알고리즘 업데이트 버전 정보를 수신하고, 메모리(250)에 저장된 버전 정보와, 수신된 버전 정보를 비교할 수 있다(S1750).
음성 인식 장치(1)는, 업데이트 버전 정보를 비교하여, 메모리(250)에 저장된 버전 정보가 최신 버전이 아닌 경우, 서버 시스템(1100)에 제1 음성 인식 알고리즘 관련 업데이트 데이터를 전송해 줄 것을 요청할 수 있다(S1770).
음성 인식 장치(1)는, 업데이트 버전 정보를 비교하여, 메모리(250)에 저장된 버전 정보가 최신 버전인 경우, 업데이트 전송 요청을 하지 않는다.
음성 인식 장치(1)는 제1 음성 인식 알고리즘을 최신의 버전으로 유지할 수 있으므로, 최신의 음성 인식 알고리즘의 사용을 통해, 개선된 음성 인식의 효과를 가질 수 있다.
도 50은, 도 49의 동작 방법을 설명하기 위한 참조도면이다.
도면을 참조하면, 음성 인식 장치(1)의 메모리(250)는, 현재 설치된, 제1 음성 인식 알고리즘 업데이트의 버전 정보를 저장할 수 있다. 예를 들어, 메모리(250)에 저장된 버전 정보는 “4.4.2” 일 수 있다.
한편, 서버 시스템(1100)의 저장부(340)도, 현재 설치된, 제1 음성 인식 알고리즘 업데이트의 버전 정보를 저장할 수 있다. 예를 들어, 저장부(340)에 저장된 버전 정보는, “5.0” 일 수 있다.
음성 인식 장치(1)의 제어부(240)는, 액세스 포인트 장치(7)를 통하여 서버 시스템(1100)에 업데이트 버전 정보를 요청할 수 있다(1810).
서버 시스템(1100)은, 음성 인식 장치(1)의 업데이트 버전 정보 요청에 대응하여, 음성 인식 장치(1)로 업데이트 버전 정보를 전송할 수 있다(1830).
음성 인식 장치(1)의 제어부(240)는, 서버 시스템(1100)으로부터, 서버 시스템(1100)에 저장된, 제1 음성 인식 알고리즘 업데이트의 버전 정보를 수신하고, 메모리(250)에 저장된 버전 정보와 수신된 버전 정보를 비교할 수 있다.
제어부(240)는, 서버 시스템(1100)으로부터 수신된 버전 정보가 최신 버전인 경우, 서버 시스템(1100)으로, 제1 음성 인식 알고리즘 관련 업데이트 데이터를 요청할 수 있다(1850). 예를 들어, 메모리(250)에 저장된 버전 정보가 “4.4.2” 이고 서버 시스템(1100)으로부터 수신된 버전 정보가 “5.0”인 경우, 수신된 버전 정보가 최신 버전이므로, 제어부(240)는, 서버 시스템(1100)으로 제1 음성 인식 알고리즘 관련 업데이트 데이터를 요청할 수 있다.
서버 시스템(1100)은, 서버 시스템(1100)에 저장된 버전 정보가 최신 버전이고, 음성 인식 장치(1)의 업데이트 데이터 전송 요청이 있는 경우, 음성 인식 장치(1)로 제1 음성 인식 알고리즘 관련 업데이트 데이터를 전송할 수 있다(1870).
이에 따라, 음성 인식 장치(1)의 제1 음성 인식 알고리즘을 항상 최신 버전으로 유지할 수 있다.
도 51a 내지 도 51c는 본 발명의 설명에 참조되는 도면이다.
도면을 참조하면, 제1 시점(T=t1)에서, 음성 인식 장치(1)는, 도 51a와 같이, “LG 허브, 재생 음악 녹음 모드"(1910)(제1 음성 명령)”와 같은 키워드 음성 명령을 입력 받을 수 있다. 마이크(221,222)를 통하여 음성 명령을 수신한, 음성 인식 장치(1)의 제어부(240)는, “다시 말씀해 주세요(1911)”와 같은 재명령 메시지를 오디오 출력부(291)를 통해 출력하도록 제어할 수 있다.
음성 인식 장치(1)의 제어부(240)는, 도 51b와 같이, 서버 시스템(1100)에 제1 음성 인식 알고리즘 관련 업데이트 데이터를 요청할 수 있고(1940), 서버 시스템(1100)은 음성 인식 장치(1)의 업데이트 데이터 요청에 대응하여, 제1 음성 인식 알고리즘 관련 업데이트 데이터를 전송할 수 있다(1950).
음성 인식 장치(1)는, 제1 음성 인식 알고리즘 관련 업데이트 데이터를 기초로, 메모리(250)에 저장된, 제1 음성 인식 알고리즘을 업데이트할 수 있다. 예를 들어, 음성 인식 장치(1)는, 제1 음성 인식 알고리즘 업데이트 이후, 성능이 향상된 제1 음성 인식 알고리즘을 구비 할 수 있다.
한편, 제2 시점(T=t3)에서, 음성 인식 장치(1)는, 도 51c와 같이, 제1 시점(T=t1)에서와 같이, “LG 허브, 재생 음악 녹음 모드"(1960)(제1 음성 명령)의 키워드 음성 명령을 입력 받을 수 있다. 마이크(221,222)를 통하여 음성 명령을 수신한, 음성 인식 장치(1)의 제어부(240)는, 제1 음성 인식 알고리즘을 기초로, 음성 명령을 인식할 수 있다.
음성 인식 장치(1)는, 음성 명령을 인식하여, 음성 인식 장치(1)의 동작을 제어할 수 있다. 예를 들어, 제어부(240)는, 제2 시점(T=t3)에서, 사용자의 “LG 허브 재생 음악 녹음 모드"(1960)를 인식하여, 음성 인식 장치(1)를, 재생 음악 녹음생 모드로 동작시킬 수 있다.
그리고, 음성 인식 장치(1)의 오디오 출력부(291)는, 음성 명령에 대응하는 처리 결과를 출력할 수 있다. 예를 들어, 사용자의 “LG 휘센, 재생 음악 녹음 모드”에 대응하여, 도 51c와 같이, “재생 음악을 녹음합니다”와 같은 사운드를 출력할 수 있다.
본 발명의 실시예에 따른 음성 인식 장치, 및 음성 인식 시스템은, 상기한 바와 같이 설명된 실시예들의 구성과 방법이 한정되게 적용될 수 있는 것이 아니라, 실시예들은 다양한 변형이 이루어질 수 있도록 각 실시예들의 전부 또는 일부가 선택적으로 조합되어 구성될 수도 있다.
한편, 본 발명의 음성 인식 장치의 동작방법은, 음성 인식 장치에 구비된 프로세서가 읽을 수 있는 기록매체에 프로세서가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 프로세서가 읽을 수 있는 기록매체는 프로세서에 의해 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다.
또한, 이상에서는 본 발명의 바람직한 실시예에 대하여 도시하고 설명하였지만, 본 발명은 상술한 특정의 실시예에 한정되지 아니하며, 청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 기술분야에서 통상의 지식을 가진자에 의해 다양한 변형실시가 가능한 것은 물론이고, 이러한 변형실시들은 본 발명의 기술적 사상이나 전망으로부터 개별적으로 이해되어져서는 안될 것이다.

Claims (12)

  1. 음성 명령을 수신하는 마이크;
    제1 음성 인식 알고리즘을 저장하는 메모리;
    상기 음성 명령을, 서버 시스템으로 전송하고, 제1 음성 인식 알고리즘 관련 업데이트 데이터를, 상기 서버 시스템으로부터 수신하는 통신 모듈; 및
    상기 제1 음성 인식 알고리즘 관련 업데이트 데이터를 기초로, 상기 메모리에 저장된, 상기 제1 음성 인식 알고리즘을 업데이트하도록 제어하는 제어부;를 포함하는 것을 특징으로 하는 음성 인식 장치.
  2. 제1항에 있어서,
    상기 제어부는,
    상기 서버 시스템에, 상기 제1 음성 인식 알고리즘 관련 업데이트 데이터를 요청하는 것을 특징으로 하는 음성 인식 장치.
  3. 제1항에 있어서,
    상기 메모리는,
    현재 설치된, 제1 음성 인식 알고리즘 업데이트의 버전 정보, 히스토리 정보, 빌드 번호 중 적어도 어느 하나를 저장하는 것을 특징으로 하는 음성 인식 장치.
  4. 제3항에 있어서,
    상기 제어부는,
    상기 서버 시스템로부터, 상기 서버 시스템에 저장된, 제1 음성 인식 알고리즘 업데이트의 버전 정보를 수신하고, 상기 메모리에 저장된 버전 정보와, 수신된 버전 정보를 비교하여, 상기 수신된 버전 정보가 최신 버전인 경우, 상기 서버 시스템로, 상기 제1 음성 인식 알고리즘 관련 업데이트 데이터를 요청하는 것을 특징으로 하는 음성 인식 장치.
  5. 제1항에 있어서,
    상기 메모리는,
    상기 제1 음성 인식 알고리즘 관련 업데이트 데이터를 저장하고,
    상기 제어부는,
    상기 제1 음성 인식 알고리즘 관련 업데이트 데이터가 수신되면, 업데이트 수행 시점을 설정할 수 있는 메뉴를 제공하는 것을 특징으로 하는 음성 인식 장치.
  6. 제5항에 있어서,
    상기 제어부는,
    설정된 시점에, 상기 메모리에 저장된, 상기 제1 음성 인식 알고리즘을 업데이트하도록 제어하는 것을 특징으로 하는 음성 인식 장치.
  7. 제1항에 있어서,
    상기 음성 명령에 대응하는 정보 또는 상기 음성에 대응하는 처리 결과 중 적어도 어느 하나를 출력하는 오디오 출력부;를 더 포함하는 것을 특징으로 하는 음성 인식 장치.
  8. 제7항에 있어서,
    상기 제어부는,
    제1 시점에 입력되는 제1 음성 명령에 대하여, 재명령 메시지를 상기 오디오 출력부를 통해, 출력하도록 제어하고, 상기 제1 음성 인식 알고리즘 업데이트 이후, 제2 시점에 입력되는 상기 제1 음성 명령을 인식하여, 음성 인식 장치의 동작을 제어하는 것을 특징으로 하는 음성 인식 장치.
  9. 제1항에 있어서,
    상기 제어부는,
    상기 제1 음성 인식 알고리즘을 기초로, 상기 음성 명령을 인식하여, 음성 인식 장치의 동작을 제어하는 것을 특징으로 하는 음성 인식 장치.
  10. 제1 음성 인식 알고리즘을 저장하며, 음성 명령을 전송하는 음성 인식 장치; 및
    제2 음성 인식 알고리즘을 저장하는 저장부와, 상기 음성 명령을 수신하는 통신 모듈과, 상기 제2 음성 인식 알고리즘을 기초로, 상기 음성 명령을 인식하는 프로세서를 구비하는 서버 시스템;을 포함하고,
    상기 서버 시스템은,
    제1 음성 인식 알고리즘 관련 업데이트 데이터를, 음성 인식 장치로 전송하고, 제2 음성 인식 알고리즘 관련 업데이트 데이터를 기초로, 상기 서버 시스템에 저장된, 상기 제2 음성 인식 알고리즘을 업데이트하며,
    상기 음성 인식 장치는,
    상기 제1 음성 인식 알고리즘 관련 업데이트 데이터를 기초로, 상기 음성 인식 장치에 저장된, 상기 제1 음성 인식 알고리즘을 업데이트 하는 것을 특징으로 하는 음성 인식 시스템.
  11. 제10항에 있어서,
    상기 제1 또는 제2 음성 인식 알고리즘 중 적어도 어느 하나는,
    상기 서버 시스템에 저장된, 음성 정보를 기초로, 기계 학습에 의해 생성되는, 사용자 음성 인식 알고리즘인 것을 특징으로 하는 음성 인식 시스템.
  12. 제11항에 있어서,
    상기 제1 또는 제2 음성 인식 알고리즘 중 적어도 어느 하나는,
    상기 서버 시스템에 저장된, 상기 음성 정보 중, 지역별 언어 차이에 의한, 사용자 지역 음성 정보를 기초로, 기계 학습에 의해 생성되는, 사용자 지역 음성 인식 알고리즘인 것을 특징으로 하는 음성 인식 시스템.
KR1020170051836A 2017-04-21 2017-04-21 음성 인식 장치, 및 음성 인식 시스템 KR102068182B1 (ko)

Priority Applications (3)

Application Number Priority Date Filing Date Title
KR1020170051836A KR102068182B1 (ko) 2017-04-21 2017-04-21 음성 인식 장치, 및 음성 인식 시스템
US15/960,023 US10657953B2 (en) 2017-04-21 2018-04-23 Artificial intelligence voice recognition apparatus and voice recognition
US16/845,333 US11183173B2 (en) 2017-04-21 2020-04-10 Artificial intelligence voice recognition apparatus and voice recognition system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020170051836A KR102068182B1 (ko) 2017-04-21 2017-04-21 음성 인식 장치, 및 음성 인식 시스템

Publications (2)

Publication Number Publication Date
KR20180118462A true KR20180118462A (ko) 2018-10-31
KR102068182B1 KR102068182B1 (ko) 2020-01-20

Family

ID=63853990

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020170051836A KR102068182B1 (ko) 2017-04-21 2017-04-21 음성 인식 장치, 및 음성 인식 시스템

Country Status (2)

Country Link
US (2) US10657953B2 (ko)
KR (1) KR102068182B1 (ko)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102087314B1 (ko) * 2018-11-05 2020-03-10 인천국제공항공사 관제상황 모니터링 서비스 제공 서버 및 실시간 관제상황 모니터링 서비스 제공 방법
WO2019172734A3 (ko) * 2019-05-30 2020-04-16 엘지전자 주식회사 데이터 마이닝 장치, 이를 이용하는 음성인식 방법 및 시스템
KR102144493B1 (ko) * 2019-02-11 2020-08-13 주식회사 에스원 Ai 스피커를 이용한 도어락 제어 시스템 및 이를 이용한 도어락 제어 방법
WO2020251116A1 (ko) * 2019-06-11 2020-12-17 주식회사 오투오 음성 인식 액세서리를 이용한 서비스 제공 시스템 및 방법
KR20210115671A (ko) * 2020-03-16 2021-09-27 주식회사 한글과컴퓨터 문서 작성 프로그램에서 자주 사용되는 편집 명령에 대한 음성 인식을 가능하게 하는 전자 장치 및 그 동작 방법

Families Citing this family (101)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US8676904B2 (en) 2008-10-02 2014-03-18 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
US10417037B2 (en) 2012-05-15 2019-09-17 Apple Inc. Systems and methods for integrating third party services with a digital assistant
CN104969289B (zh) 2013-02-07 2021-05-28 苹果公司 数字助理的语音触发器
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US11126525B2 (en) * 2015-09-09 2021-09-21 Arris Enterprises Llc In-home legacy device onboarding and privacy enhanced monitoring
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10743101B2 (en) 2016-02-22 2020-08-11 Sonos, Inc. Content mixing
US10264030B2 (en) 2016-02-22 2019-04-16 Sonos, Inc. Networked microphone device control
US9965247B2 (en) 2016-02-22 2018-05-08 Sonos, Inc. Voice controlled media playback system based on user profile
US9947316B2 (en) 2016-02-22 2018-04-17 Sonos, Inc. Voice control of a media playback system
US10509626B2 (en) 2016-02-22 2019-12-17 Sonos, Inc Handling of loss of pairing between networked devices
US10095470B2 (en) 2016-02-22 2018-10-09 Sonos, Inc. Audio response playback
US9978390B2 (en) 2016-06-09 2018-05-22 Sonos, Inc. Dynamic player selection for audio signal processing
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
US10134399B2 (en) 2016-07-15 2018-11-20 Sonos, Inc. Contextualization of voice inputs
US10152969B2 (en) 2016-07-15 2018-12-11 Sonos, Inc. Voice detection by multiple devices
US10115400B2 (en) 2016-08-05 2018-10-30 Sonos, Inc. Multiple voice services
US9942678B1 (en) 2016-09-27 2018-04-10 Sonos, Inc. Audio playback settings for voice interaction
US9743204B1 (en) 2016-09-30 2017-08-22 Sonos, Inc. Multi-orientation playback device microphones
WO2018066942A1 (en) * 2016-10-03 2018-04-12 Samsung Electronics Co., Ltd. Electronic device and method for controlling the same
US10181323B2 (en) 2016-10-19 2019-01-15 Sonos, Inc. Arbitration-based voice recognition
US11183181B2 (en) 2017-03-27 2021-11-23 Sonos, Inc. Systems and methods of multiple voice services
DK180048B1 (en) 2017-05-11 2020-02-04 Apple Inc. MAINTAINING THE DATA PROTECTION OF PERSONAL INFORMATION
DK201770427A1 (en) 2017-05-12 2018-12-20 Apple Inc. LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
US10475449B2 (en) 2017-08-07 2019-11-12 Sonos, Inc. Wake-word detection suppression
US10048930B1 (en) 2017-09-08 2018-08-14 Sonos, Inc. Dynamic computation of system response volume
US10446165B2 (en) 2017-09-27 2019-10-15 Sonos, Inc. Robust short-time fourier transform acoustic echo cancellation during audio playback
US10621981B2 (en) 2017-09-28 2020-04-14 Sonos, Inc. Tone interference cancellation
US10482868B2 (en) 2017-09-28 2019-11-19 Sonos, Inc. Multi-channel acoustic echo cancellation
US10466962B2 (en) 2017-09-29 2019-11-05 Sonos, Inc. Media playback system with voice assistance
US10880650B2 (en) 2017-12-10 2020-12-29 Sonos, Inc. Network microphone devices with automatic do not disturb actuation capabilities
US10818290B2 (en) 2017-12-11 2020-10-27 Sonos, Inc. Home graph
WO2019152722A1 (en) 2018-01-31 2019-08-08 Sonos, Inc. Device designation of playback and network microphone device arrangements
US11145294B2 (en) 2018-05-07 2021-10-12 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US10928918B2 (en) 2018-05-07 2021-02-23 Apple Inc. Raise to speak
US11175880B2 (en) 2018-05-10 2021-11-16 Sonos, Inc. Systems and methods for voice-assisted media content selection
US10847178B2 (en) 2018-05-18 2020-11-24 Sonos, Inc. Linear filtering for noise-suppressed speech detection
US10959029B2 (en) 2018-05-25 2021-03-23 Sonos, Inc. Determining and adapting to changes in microphone performance of playback devices
DK180639B1 (en) 2018-06-01 2021-11-04 Apple Inc DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT
US10681460B2 (en) 2018-06-28 2020-06-09 Sonos, Inc. Systems and methods for associating playback devices with voice assistant services
US11076035B2 (en) 2018-08-28 2021-07-27 Sonos, Inc. Do not disturb feature for audio notifications
US10461710B1 (en) 2018-08-28 2019-10-29 Sonos, Inc. Media playback system with maximum volume setting
US10878811B2 (en) 2018-09-14 2020-12-29 Sonos, Inc. Networked devices, systems, and methods for intelligently deactivating wake-word engines
US10587430B1 (en) 2018-09-14 2020-03-10 Sonos, Inc. Networked devices, systems, and methods for associating playback devices based on sound codes
US11024331B2 (en) 2018-09-21 2021-06-01 Sonos, Inc. Voice detection optimization using sound metadata
US10811015B2 (en) 2018-09-25 2020-10-20 Sonos, Inc. Voice detection optimization based on selected voice assistant service
US11100923B2 (en) 2018-09-28 2021-08-24 Sonos, Inc. Systems and methods for selective wake word detection using neural network models
US11462215B2 (en) 2018-09-28 2022-10-04 Apple Inc. Multi-modal inputs for voice commands
US10692518B2 (en) 2018-09-29 2020-06-23 Sonos, Inc. Linear filtering for noise-suppressed speech detection via multiple network microphone devices
US11899519B2 (en) 2018-10-23 2024-02-13 Sonos, Inc. Multiple stage network microphone device with reduced power consumption and processing load
US10885912B2 (en) * 2018-11-13 2021-01-05 Motorola Solutions, Inc. Methods and systems for providing a corrected voice command
EP3654249A1 (en) 2018-11-15 2020-05-20 Snips Dilated convolutions and gating for efficient keyword spotting
US11183183B2 (en) 2018-12-07 2021-11-23 Sonos, Inc. Systems and methods of operating media playback systems having multiple voice assistant services
US11132989B2 (en) 2018-12-13 2021-09-28 Sonos, Inc. Networked microphone devices, systems, and methods of localized arbitration
US11211071B2 (en) * 2018-12-14 2021-12-28 American International Group, Inc. System, method, and computer program product for home appliance care
US10602268B1 (en) 2018-12-20 2020-03-24 Sonos, Inc. Optimization of network microphone devices using noise classification
US10867604B2 (en) 2019-02-08 2020-12-15 Sonos, Inc. Devices, systems, and methods for distributed voice processing
US11315556B2 (en) 2019-02-08 2022-04-26 Sonos, Inc. Devices, systems, and methods for distributed voice processing by transmitting sound data associated with a wake word to an appropriate device for identification
US11348573B2 (en) 2019-03-18 2022-05-31 Apple Inc. Multimodality in digital assistant systems
CN111722542A (zh) * 2019-03-19 2020-09-29 佛山市顺德区美的电热电器制造有限公司 一种食谱的调节方法、终端、服务器和计算机存储介质
CN111865728A (zh) * 2019-04-25 2020-10-30 阿里巴巴集团控股有限公司 语音控制系统和方法、以及语音套件和语音装置
US11120794B2 (en) 2019-05-03 2021-09-14 Sonos, Inc. Voice assistant persistence across multiple network microphone devices
DK201970509A1 (en) 2019-05-06 2021-01-15 Apple Inc Spoken notifications
US11307752B2 (en) 2019-05-06 2022-04-19 Apple Inc. User configurable task triggers
US11140099B2 (en) 2019-05-21 2021-10-05 Apple Inc. Providing message response suggestions
US11227599B2 (en) 2019-06-01 2022-01-18 Apple Inc. Methods and user interfaces for voice-based control of electronic devices
US11361756B2 (en) 2019-06-12 2022-06-14 Sonos, Inc. Conditional wake word eventing based on environment
US10586540B1 (en) 2019-06-12 2020-03-10 Sonos, Inc. Network microphone device with command keyword conditioning
US11200894B2 (en) 2019-06-12 2021-12-14 Sonos, Inc. Network microphone device with command keyword eventing
US11302320B2 (en) * 2019-06-17 2022-04-12 ATOM, Inc. Systems and methods for disabling voice assistant audio monitoring and data capture for smart speakers and smart systems
US11508375B2 (en) 2019-07-03 2022-11-22 Samsung Electronics Co., Ltd. Electronic apparatus including control command identification tool generated by using a control command identified by voice recognition identifying a control command corresponding to a user voice and control method thereof
US10871943B1 (en) 2019-07-31 2020-12-22 Sonos, Inc. Noise classification for event detection
US11138969B2 (en) 2019-07-31 2021-10-05 Sonos, Inc. Locally distributed keyword detection
US11138975B2 (en) 2019-07-31 2021-10-05 Sonos, Inc. Locally distributed keyword detection
KR102330901B1 (ko) * 2019-09-27 2021-11-26 엘지전자 주식회사 이동로봇
US11189286B2 (en) 2019-10-22 2021-11-30 Sonos, Inc. VAS toggle based on device orientation
US11200900B2 (en) 2019-12-20 2021-12-14 Sonos, Inc. Offline voice control
US11562740B2 (en) 2020-01-07 2023-01-24 Sonos, Inc. Voice verification for media playback
US11556307B2 (en) 2020-01-31 2023-01-17 Sonos, Inc. Local voice data processing
US11308958B2 (en) 2020-02-07 2022-04-19 Sonos, Inc. Localized wakeword verification
CN111368025B (zh) * 2020-02-24 2023-12-22 百度在线网络技术(北京)有限公司 智能语音设备的热词推荐方法、设备及存储介质
US11043220B1 (en) 2020-05-11 2021-06-22 Apple Inc. Digital assistant hardware abstraction
US11061543B1 (en) 2020-05-11 2021-07-13 Apple Inc. Providing relevant data items based on context
US11308962B2 (en) 2020-05-20 2022-04-19 Sonos, Inc. Input detection windowing
US11482224B2 (en) 2020-05-20 2022-10-25 Sonos, Inc. Command keywords with input detection windowing
US11727919B2 (en) 2020-05-20 2023-08-15 Sonos, Inc. Memory allocation for keyword spotting engines
US11302327B2 (en) * 2020-06-22 2022-04-12 Bank Of America Corporation Priori knowledge, canonical data forms, and preliminary entrentropy reduction for IVR
US11490204B2 (en) 2020-07-20 2022-11-01 Apple Inc. Multi-device audio adjustment coordination
US11438683B2 (en) 2020-07-21 2022-09-06 Apple Inc. User identification using headphones
US11698771B2 (en) 2020-08-25 2023-07-11 Sonos, Inc. Vocal guidance engines for playback devices
TWI803782B (zh) * 2020-10-16 2023-06-01 明泰科技股份有限公司 無線電網路閘道器以及無線電系統
TWI756966B (zh) * 2020-12-04 2022-03-01 緯創資通股份有限公司 視訊裝置與其操作方法
US11551700B2 (en) 2021-01-25 2023-01-10 Sonos, Inc. Systems and methods for power-efficient keyword detection
US11915698B1 (en) * 2021-09-29 2024-02-27 Amazon Technologies, Inc. Sound source localization

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003302995A (ja) * 2002-04-12 2003-10-24 Canon Inc 音声認識文法の更新方法、情報処理装置及びコンピュータ・プログラム
JP2010134367A (ja) * 2008-12-08 2010-06-17 Mitsubishi Electric Corp 電気機器
KR20120079246A (ko) * 2011-01-04 2012-07-12 엘지전자 주식회사 공기 조화기의 제어 방법
KR20150038658A (ko) * 2007-06-27 2015-04-08 마이크로소프트 코포레이션 소프트웨어 자동 공급을 위한 기술
JP2016505888A (ja) * 2012-12-11 2016-02-25 アマゾン テクノロジーズ インコーポレイテッド 発話認識電力管理
US20160345086A1 (en) * 2015-05-22 2016-11-24 Amazon Technologies, Inc. Portable speaker system
JP2017058674A (ja) * 2015-09-18 2017-03-23 三星電子株式会社Samsung Electronics Co.,Ltd. 音声認識のための装置及び方法、変換パラメータ学習のための装置及び方法、コンピュータプログラム並びに電子機器

Family Cites Families (103)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6615178B1 (en) * 1999-02-19 2003-09-02 Sony Corporation Speech translator, speech translating method, and recorded medium on which speech translation control program is recorded
JP4399127B2 (ja) * 2001-05-14 2010-01-13 株式会社日立製作所 文書管理方法及び装置並びにその処理プログラム及びそれを格納した記憶媒体
US9374451B2 (en) * 2002-02-04 2016-06-21 Nokia Technologies Oy System and method for multimodal short-cuts to digital services
JP2003295893A (ja) * 2002-04-01 2003-10-15 Omron Corp 音声認識システム、装置、音声認識方法、音声認識プログラム及び音声認識プログラムを記録したコンピュータ読み取り可能な記録媒体
US20030233649A1 (en) * 2002-06-14 2003-12-18 Scott Reimert Maintaining software in computers in a network
US8311835B2 (en) * 2003-08-29 2012-11-13 Microsoft Corporation Assisted multi-modal dialogue
US7386443B1 (en) * 2004-01-09 2008-06-10 At&T Corp. System and method for mobile automatic speech recognition
JP2005293052A (ja) * 2004-03-31 2005-10-20 Honda Motor Co Ltd 顧客応対ロボット
JP4639784B2 (ja) * 2004-12-06 2011-02-23 ソニー株式会社 学習装置および学習方法、並びにプログラム
EP1785933A3 (en) * 2005-04-29 2008-04-09 Angelo Dalli Method and apparatus for displaying processed multimedia and textual content on electronic signage or billboard displays through input from electronic communication networks
US20080268802A1 (en) * 2005-08-04 2008-10-30 International Business Machines Corporation Radio receiver that changes function according to the output of an internal voice-only detector
US20070106510A1 (en) * 2005-09-29 2007-05-10 Ivras Inc. Voice based data capturing system
DE102006004442A1 (de) * 2006-01-31 2007-08-09 Siemens Ag Vorrichtung und Verfahren zum Bereitstellen einer Voice Browserfunktionalität
JP4906379B2 (ja) * 2006-03-22 2012-03-28 富士通株式会社 音声認識装置、音声認識方法、及びコンピュータプログラム
CA2644666A1 (en) * 2006-04-17 2007-10-25 Vovision Llc Methods and systems for correcting transcribed audio files
WO2007147077A2 (en) * 2006-06-14 2007-12-21 Personics Holdings Inc. Earguard monitoring system
US20080154612A1 (en) * 2006-12-26 2008-06-26 Voice Signal Technologies, Inc. Local storage and use of search results for voice-enabled mobile communications devices
US20080154870A1 (en) * 2006-12-26 2008-06-26 Voice Signal Technologies, Inc. Collection and use of side information in voice-mediated mobile search
US20080153465A1 (en) * 2006-12-26 2008-06-26 Voice Signal Technologies, Inc. Voice search-enabled mobile device
US20080154608A1 (en) * 2006-12-26 2008-06-26 Voice Signal Technologies, Inc. On a mobile device tracking use of search results delivered to the mobile device
US8056070B2 (en) * 2007-01-10 2011-11-08 Goller Michael D System and method for modifying and updating a speech recognition program
US8352264B2 (en) * 2008-03-19 2013-01-08 Canyon IP Holdings, LLC Corrective feedback loop for automated speech recognition
KR100898326B1 (ko) * 2007-04-16 2009-05-20 삼성전자주식회사 사용 이력 기반의 drm 컨텐츠 관리 방법 및 이를이용하는 휴대 단말기
US8639214B1 (en) * 2007-10-26 2014-01-28 Iwao Fujisaki Communication device
US20110134204A1 (en) * 2007-12-05 2011-06-09 Florida Gulf Coast University System and methods for facilitating collaboration of a group
US8385588B2 (en) * 2007-12-11 2013-02-26 Eastman Kodak Company Recording audio metadata for stored images
US8255225B2 (en) * 2008-08-07 2012-08-28 Vocollect Healthcare Systems, Inc. Voice assistant system
GB2466242B (en) * 2008-12-15 2013-01-02 Audio Analytic Ltd Sound identification systems
US8548807B2 (en) * 2009-06-09 2013-10-01 At&T Intellectual Property I, L.P. System and method for adapting automatic speech recognition pronunciation by acoustic model restructuring
US9111540B2 (en) * 2009-06-09 2015-08-18 Microsoft Technology Licensing, Llc Local and remote aggregation of feedback data for speech recognition
US8832676B2 (en) * 2009-09-30 2014-09-09 Zynga Inc. Apparatuses, methods and systems for a social networking application updater
KR101960835B1 (ko) * 2009-11-24 2019-03-21 삼성전자주식회사 대화 로봇을 이용한 일정 관리 시스템 및 그 방법
JP2011119953A (ja) * 2009-12-03 2011-06-16 Hitachi Ltd 呼制御および通話録音の機能を用いた通話録音システム
US8687777B1 (en) * 2010-02-03 2014-04-01 Tal Lavian Systems and methods for visual presentation and selection of IVR menu
US8903073B2 (en) * 2011-07-20 2014-12-02 Zvi Or-Bach Systems and methods for visual presentation and selection of IVR menu
CN116312567A (zh) * 2010-02-18 2023-06-23 株式会社尼康 便携式装置以及信息处理系统
US9183560B2 (en) * 2010-05-28 2015-11-10 Daniel H. Abelow Reality alternate
CN101938694A (zh) * 2010-08-26 2011-01-05 惠州Tcl移动通信有限公司 一种移动终端及其设置信息更新方法和装置
US8000454B1 (en) * 2010-09-10 2011-08-16 Zvi Or-Bach Systems and methods for visual presentation and selection of IVR menu
KR101828273B1 (ko) * 2011-01-04 2018-02-14 삼성전자주식회사 결합기반의 음성명령 인식 장치 및 그 방법
US8825478B2 (en) * 2011-01-10 2014-09-02 Nuance Communications, Inc. Real time generation of audio content summaries
US9188456B2 (en) * 2011-04-25 2015-11-17 Honda Motor Co., Ltd. System and method of fixing mistakes by going back in an electronic device
US8589160B2 (en) * 2011-08-19 2013-11-19 Dolbey & Company, Inc. Systems and methods for providing an electronic dictation interface
US8972263B2 (en) * 2011-11-18 2015-03-03 Soundhound, Inc. System and method for performing dual mode speech recognition
US9110891B2 (en) * 2011-12-12 2015-08-18 Google Inc. Auto-translation for multi user audio and video
EP2798534B1 (en) * 2011-12-31 2019-02-06 InterDigital Madison Patent Holdings Method and device for presenting content
US8223931B1 (en) * 2012-03-01 2012-07-17 Tal Lavian Systems and methods for visual presentation and selection of IVR menu
US8867708B1 (en) * 2012-03-02 2014-10-21 Tal Lavian Systems and methods for visual presentation and selection of IVR menu
US20150287406A1 (en) * 2012-03-23 2015-10-08 Google Inc. Estimating Speech in the Presence of Noise
US9176948B2 (en) * 2012-03-27 2015-11-03 Google Inc. Client/server-based statistical phrase distribution display and associated text entry technique
US9406299B2 (en) * 2012-05-08 2016-08-02 Nuance Communications, Inc. Differential acoustic model representation and linear transform-based adaptation for efficient user profile update techniques in automatic speech recognition
GB201208373D0 (en) * 2012-05-14 2012-06-27 Touchtype Ltd Mechanism for synchronising devices,system and method
KR20130135410A (ko) * 2012-05-31 2013-12-11 삼성전자주식회사 음성 인식 기능을 제공하는 방법 및 그 전자 장치
US20140012574A1 (en) * 2012-06-21 2014-01-09 Maluuba Inc. Interactive timeline for presenting and organizing tasks
KR101961139B1 (ko) * 2012-06-28 2019-03-25 엘지전자 주식회사 이동 단말기 및 그것의 음성 인식 방법
US20140019139A1 (en) * 2012-07-12 2014-01-16 Prodigy Diabetes Care, Llc Blood glucose meter with simplified programmable voice function
US9035884B2 (en) * 2012-10-17 2015-05-19 Nuance Communications, Inc. Subscription updates in multiple device language models
US8527276B1 (en) * 2012-10-25 2013-09-03 Google Inc. Speech synthesis using deep neural networks
US10304465B2 (en) * 2012-10-30 2019-05-28 Google Technology Holdings LLC Voice control user interface for low power mode
US9454959B2 (en) * 2012-11-02 2016-09-27 Nuance Communications, Inc. Method and apparatus for passive data acquisition in speech recognition and natural language understanding
US9093069B2 (en) * 2012-11-05 2015-07-28 Nuance Communications, Inc. Privacy-sensitive speech model creation via aggregation of multiple user models
US9190057B2 (en) * 2012-12-12 2015-11-17 Amazon Technologies, Inc. Speech model retrieval in distributed speech recognition systems
US10049658B2 (en) * 2013-03-07 2018-08-14 Nuance Communications, Inc. Method for training an automatic speech recognition system
US10275545B2 (en) * 2013-03-15 2019-04-30 Ventana Systems, Inc. Modeling and simulation
WO2014171144A1 (ja) * 2013-04-19 2014-10-23 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 家電機器の制御方法、家電機器制御システム、及びゲートウェイ
CN103280217B (zh) * 2013-05-02 2016-05-04 锤子科技(北京)有限公司 一种移动终端的语音识别方法及其装置
US9767799B2 (en) * 2013-05-21 2017-09-19 Mitsubishi Electric Corporation Voice recognition system and recognition result display apparatus
US9978065B2 (en) * 2013-06-25 2018-05-22 Visa International Service Association Voice filter system
JP2015011170A (ja) * 2013-06-28 2015-01-19 株式会社ATR−Trek ローカルな音声認識を行なう音声認識クライアント装置
US8880120B1 (en) * 2013-07-11 2014-11-04 Tal Lavian Device and method for providing enhanced telephony
US10956433B2 (en) * 2013-07-15 2021-03-23 Microsoft Technology Licensing, Llc Performing an operation relative to tabular data based upon voice input
TWI508057B (zh) * 2013-07-15 2015-11-11 Chunghwa Picture Tubes Ltd 語音辨識系統以及方法
US9575720B2 (en) * 2013-07-31 2017-02-21 Google Inc. Visual confirmation for a recognized voice-initiated action
US20150066513A1 (en) * 2013-08-29 2015-03-05 Ciinow, Inc. Mechanism for performing speech-based commands in a system for remote content delivery
US20150081294A1 (en) * 2013-09-19 2015-03-19 Maluuba Inc. Speech recognition for user specific language
US9529888B2 (en) * 2013-09-23 2016-12-27 Spotify Ab System and method for efficiently providing media and associated metadata
US20150170053A1 (en) * 2013-12-13 2015-06-18 Microsoft Corporation Personalized machine learning models
US9318112B2 (en) * 2014-02-14 2016-04-19 Google Inc. Recognizing speech in the presence of additional audio
US20150255068A1 (en) * 2014-03-10 2015-09-10 Microsoft Corporation Speaker recognition including proactive voice model retrieval and sharing features
CA2887291A1 (en) * 2014-04-02 2015-10-02 Speakread A/S Systems and methods for supporting hearing impaired users
CN109949815A (zh) * 2014-04-07 2019-06-28 三星电子株式会社 电子装置
US20150309984A1 (en) * 2014-04-25 2015-10-29 Nuance Communications, Inc. Learning language models from scratch based on crowd-sourced user text input
KR20150128406A (ko) * 2014-05-09 2015-11-18 삼성전자주식회사 음성 인식 정보를 표시하는 방법 및 장치
US9355640B2 (en) * 2014-06-04 2016-05-31 Google Inc. Invoking action responsive to co-presence determination
US10206014B2 (en) * 2014-06-20 2019-02-12 Google Llc Clarifying audible verbal information in video content
US20150371628A1 (en) * 2014-06-23 2015-12-24 Harman International Industries, Inc. User-adapted speech recognition
KR102281178B1 (ko) * 2014-07-09 2021-07-23 삼성전자주식회사 멀티-레벨 음성 인식 방법 및 장치
KR20160009344A (ko) * 2014-07-16 2016-01-26 삼성전자주식회사 귓속말 인식 방법 및 장치
KR102339657B1 (ko) * 2014-07-29 2021-12-16 삼성전자주식회사 전자 장치 및 이의 제어 방법
KR102247533B1 (ko) * 2014-07-30 2021-05-03 삼성전자주식회사 음성 인식 장치 및 그 제어 방법
US9959863B2 (en) * 2014-09-08 2018-05-01 Qualcomm Incorporated Keyword detection using speaker-independent keyword models for user-designated keywords
US9443520B2 (en) * 2014-10-02 2016-09-13 International Business Machines Corporation Management of voice commands for devices in a cloud computing environment
CN104320774B (zh) * 2014-10-16 2020-07-10 小米科技有限责任公司 一种升级方法、装置及设备
JP6464411B6 (ja) * 2015-02-25 2019-03-13 Dynabook株式会社 電子機器、方法及びプログラム
KR102325724B1 (ko) * 2015-02-28 2021-11-15 삼성전자주식회사 다수의 기기에서 텍스트 데이터 동기화
US10325590B2 (en) * 2015-06-26 2019-06-18 Intel Corporation Language model modification for local speech recognition systems using remote sources
WO2017014721A1 (en) * 2015-07-17 2017-01-26 Nuance Communications, Inc. Reduced latency speech recognition system using multiple recognizers
US9972313B2 (en) * 2016-03-01 2018-05-15 Intel Corporation Intermediate scoring and rejection loopback for improved key phrase detection
US10026403B2 (en) * 2016-08-12 2018-07-17 Paypal, Inc. Location based voice association system
US10489103B1 (en) * 2016-11-15 2019-11-26 Philip A Gruebele Wearable audio recorder and retrieval software applications
US20200019882A1 (en) * 2016-12-15 2020-01-16 Schlumberger Technology Corporation Systems and Methods for Generating, Deploying, Discovering, and Managing Machine Learning Model Packages
US10732954B2 (en) * 2016-12-30 2020-08-04 Dropbox, Inc. User engagement aware auto-updater
US10464530B2 (en) * 2017-01-17 2019-11-05 Nio Usa, Inc. Voice biometric pre-purchase enrollment for autonomous vehicles

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003302995A (ja) * 2002-04-12 2003-10-24 Canon Inc 音声認識文法の更新方法、情報処理装置及びコンピュータ・プログラム
KR20150038658A (ko) * 2007-06-27 2015-04-08 마이크로소프트 코포레이션 소프트웨어 자동 공급을 위한 기술
JP2010134367A (ja) * 2008-12-08 2010-06-17 Mitsubishi Electric Corp 電気機器
KR20120079246A (ko) * 2011-01-04 2012-07-12 엘지전자 주식회사 공기 조화기의 제어 방법
JP2016505888A (ja) * 2012-12-11 2016-02-25 アマゾン テクノロジーズ インコーポレイテッド 発話認識電力管理
US20160345086A1 (en) * 2015-05-22 2016-11-24 Amazon Technologies, Inc. Portable speaker system
JP2017058674A (ja) * 2015-09-18 2017-03-23 三星電子株式会社Samsung Electronics Co.,Ltd. 音声認識のための装置及び方法、変換パラメータ学習のための装置及び方法、コンピュータプログラム並びに電子機器

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
노자운 기자, "네이버 J 프로젝트의 실체는 오감 AI ‘클로바’-음성인식 스피커·디스플레이·로봇 내놓다", 조선비즈, 테크, ICT/미디어, 2017.03.02.* *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102087314B1 (ko) * 2018-11-05 2020-03-10 인천국제공항공사 관제상황 모니터링 서비스 제공 서버 및 실시간 관제상황 모니터링 서비스 제공 방법
KR102144493B1 (ko) * 2019-02-11 2020-08-13 주식회사 에스원 Ai 스피커를 이용한 도어락 제어 시스템 및 이를 이용한 도어락 제어 방법
WO2019172734A3 (ko) * 2019-05-30 2020-04-16 엘지전자 주식회사 데이터 마이닝 장치, 이를 이용하는 음성인식 방법 및 시스템
US11495234B2 (en) 2019-05-30 2022-11-08 Lg Electronics Inc. Data mining apparatus, method and system for speech recognition using the same
WO2020251116A1 (ko) * 2019-06-11 2020-12-17 주식회사 오투오 음성 인식 액세서리를 이용한 서비스 제공 시스템 및 방법
KR20210115671A (ko) * 2020-03-16 2021-09-27 주식회사 한글과컴퓨터 문서 작성 프로그램에서 자주 사용되는 편집 명령에 대한 음성 인식을 가능하게 하는 전자 장치 및 그 동작 방법

Also Published As

Publication number Publication date
US20200243071A1 (en) 2020-07-30
US11183173B2 (en) 2021-11-23
US10657953B2 (en) 2020-05-19
US20180308470A1 (en) 2018-10-25
KR102068182B1 (ko) 2020-01-20

Similar Documents

Publication Publication Date Title
KR102068182B1 (ko) 음성 인식 장치, 및 음성 인식 시스템
EP3392878B1 (en) Voice recognition apparatus and voice recognition method
EP3392879B1 (en) Voice recognition apparatus and voice recognition method
KR20180118471A (ko) 음성 인식 장치
KR20190026518A (ko) 인공지능 음성 인식 장치의 동작 방법
US10200781B2 (en) Sound output apparatus
CN110235087A (zh) 一种实现语音控制的方法和终端
KR20190043519A (ko) 음성 인식 장치
KR102395013B1 (ko) 인공지능 홈 어플라이언스 및 음성 인식 서버 시스템의 동작 방법
KR20180117099A (ko) 통신 네트워크 용 허브 및 그 제조방법
KR102478281B1 (ko) 음향출력장치
KR102003819B1 (ko) 인공 지능 허브
KR20190050761A (ko) 음성 인식 장치
KR20230029055A (ko) 전자 장치 및 개인화된 사용자 상황 인지 서비스 제공 방법

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E90F Notification of reason for final refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant