KR20190054707A - 음성 서버, 음성 인식 서버 시스템 및 그 동작 방법 - Google Patents
음성 서버, 음성 인식 서버 시스템 및 그 동작 방법 Download PDFInfo
- Publication number
- KR20190054707A KR20190054707A KR1020170151584A KR20170151584A KR20190054707A KR 20190054707 A KR20190054707 A KR 20190054707A KR 1020170151584 A KR1020170151584 A KR 1020170151584A KR 20170151584 A KR20170151584 A KR 20170151584A KR 20190054707 A KR20190054707 A KR 20190054707A
- Authority
- KR
- South Korea
- Prior art keywords
- voice
- server
- home appliance
- voice command
- data
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 69
- 230000004044 response Effects 0.000 claims abstract description 56
- 238000003058 natural language processing Methods 0.000 claims description 74
- 230000006870 function Effects 0.000 claims description 45
- 238000012545 processing Methods 0.000 claims description 40
- 238000004891 communication Methods 0.000 description 45
- 230000008569 process Effects 0.000 description 37
- 238000006243 chemical reaction Methods 0.000 description 23
- 238000010586 diagram Methods 0.000 description 14
- 230000008859 change Effects 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 5
- 239000003507 refrigerant Substances 0.000 description 5
- 238000005406 washing Methods 0.000 description 5
- 238000010411 cooking Methods 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 230000000007 visual effect Effects 0.000 description 3
- 238000001816 cooling Methods 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- XUIMIQQOPSSXEZ-UHFFFAOYSA-N Silicon Chemical compound [Si] XUIMIQQOPSSXEZ-UHFFFAOYSA-N 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000007791 dehumidification Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000001151 other effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 229910052710 silicon Inorganic materials 0.000 description 1
- 239000010703 silicon Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/28—Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
- H04L12/2803—Home automation networks
- H04L12/2816—Controlling appliance services of a home automation network by calling their functionalities
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/225—Feedback of the input speech
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Automation & Control Theory (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Telephonic Communication Services (AREA)
- Selective Calling Equipment (AREA)
Abstract
본 발명의 일 측면에 따른 음성 서버의 동작 방법은, 홈 어플라이언스로부터 음성 데이터를 수신하는 단계, 수신한 음성 데이터를 텍스트(text) 데이터로 변환하는 단계, 텍스트 데이터를 분석하여 음성 명령을 판별하는 단계, 판별한 음성 명령에 기초하여, 판별한 음성 명령에 대응하는 신호를 제1 서버 또는 제2 서버로 송신하는 단계, 제1 서버 또는 제2 서버로부터 판별한 음성 명령에 기초하는 응답 신호를 수신하는 단계, 및, 음성 명령에 기초하는 응답 신호를 음성 데이터로 변환하여 홈 어플라이언스로 송신하는 단계를 포함할 수 있다.
Description
본 발명은 음성 서버, 음성 인식 서버 시스템 및 그 동작 방법에 관한 것으로, 더욱 상세하게는 사용자의 자연어 음성 명령을 인식하고, 홈 어플라이언스를 제어할 수 있는 음성 서버, 음성 인식 서버 시스템 및 그 동작 방법에 관한 것이다.
가정이나 사무실 등의 소정 공간에서 사용되는 공기조화기, 세탁기, 청소기 등 홈 어플라이언스(Home appliance)들은 각각 사용자의 조작에 따라 고유의 기능과 동작을 수행하였다.
예를 들어, 공기조화기는 냉매를 압축하는 압축기와 압축된 냉매를 응축하는 응축기와 응축된 냉매를 팽창하는 팽창밸브와 팽창된 냉매를 실내공기와 열교환시키는 증발기를 포함하여 구성되어 실내공간을 냉난방하는 장치로, 실내 온도를 조정하는 기능을 수행한다.
또한, 냉장고는 음식물을 저장하고, 세탁기는 세탁물을 처리하며, 청소기는 청소 기능, 조리기기는 음식물을 조리하는 기능 등을 수행한다.
이러한 공기조화기 등 홈 어플라이언스의 동작을 위해서, 사용자는, 홈 어플라이언스 본체에 구비된 버튼 등을 직접 조작하거나, 매번 본체로 이동하여 입력하여야 하는 불편함을 피해 리모콘 등의 원격제어장치를 사용할 수 있다.
하지만, 리모콘을 사용하는 경우에도, 사용자가 기능별로 조작키를 선택하여 입력해야 하므로, 그 사용이 불편하고, 실내가 어두울 경우 리모콘 및 조작키를 식별하기 위한 별도의 조명이 필요하게 되는 문제점이 있었다.
따라서, 음성인식 기술을 이용하여 홈 어플라이언스를 제어하는 방안에 대한 연구가 증가하고 있다.
종래 기술 1(공개특허공보 10-1999-00069703호)은 공기조화기용 리모콘이 음성 입력부 및 신호 처리부를 구비하여 음성 인식에 따른 조작 신호를 생성, 전송한다.
종래 기술 2(공개특허공보 10-2006-0015092호)는 입력되는 음성신호를 디지털 신호 및 텍스트로 변환 후, 데이터베이스 내 일치하는 제어 명령 존재 여부 확인하고, 일치하는 제어명령이 있으면 공기조화기 내 각 장치를 제어하며, 일치하는 제어명령이 없으면 키워드를 추출하여 연계된 제어명령에 따라 공기조화기 내 각 장치를 제어한다.
하지만, 리모콘 및 공기조화기 등 개별 장치가 구비할 수 있는 시스템 자원에는 한계가 있다. 특히 단순한 몇 가지 단어만 인식하는 것이 아니라 자연어를 인식하기 위해서는 높은 연산량이 요구되어 개별 장치에 장착되는 임베디드 모듈로는 구현이 어렵다.
따라서, 종래 기술 1과 종래 기술 2의 음성 인식 기술은, 전 세계 사용자들의 다양한 자연어 음성 명령을 인식하고 처리하는데 한계가 있었다.
그러므로, 개별 장치의 시스템 자원의 제약 없이 자연어를 인식하고 처리할 수 있고, 홈 어플라이언스를 편리하게 제어할 수 있는 방안이 요구된다.
또한, 음성 인식 및 음성 인식 결과에 대응하는 제어를 수행함에 있어, 전체 과정의 속도를 향상하고, 서버 시스템 구성을 최적화할 수 있는 방안이 요구된다.
본 발명의 목적은, 효율적으로 자연어를 인식, 처리할 수 있는 음성 인식 방법 및 시스템을 제공함에 있다.
본 발명의 목적은, 사용자의 음성 명령을 인식하여 홈 어플라이언스를 제어할 수 있는 음성 인식 서버 시스템을 제공함에 있다.
본 발명의 목적은, 음성 인식 및 음성 인식 결과에 대응하는 제어를 수행함에 있어, 전체 과정의 속도를 향상하고, 서버 시스템 구성을 최적화함으로써, 사용자 편의성을 증대할 수 있는 음성 인식 방법 및 시스템을 제공함에 있다.
상기 또는 다른 목적을 달성하기 위해 본 발명의 일 측면에 따른 음성 서버의 동작 방법은, 홈 어플라이언스로부터 음성 데이터를 수신하는 단계, 수신한 음성 데이터를 텍스트(text) 데이터로 변환하는 단계, 텍스트 데이터를 분석하여 음성 명령을 판별하는 단계, 판별한 음성 명령에 기초하여, 판별한 음성 명령에 대응하는 신호를 제1 서버 또는 제2 서버로 송신하는 단계, 제1 서버 또는 제2 서버로부터 판별한 음성 명령에 기초하는 응답 신호를 수신하는 단계, 및, 음성 명령에 기초하는 응답 신호를 음성 데이터로 변환하여 홈 어플라이언스로 송신하는 단계를 포함할 수 있다.
상기 또는 다른 목적을 달성하기 위해 본 발명의 일 측면에 따른 음성 서버는, 홈 어플라이언스로부터 음성 데이터를 수신하고, 수신한 음성 데이터를 텍스트(text) 데이터로 변환하는 자동 음성 인식(Automatic Speech Recognition) 서버, 자동 음성 인식 서버로부터 텍스트 데이터를 수신하고, 수신한 텍스트 데이터를 분석하여 음성 명령을 판별하며, 판별한 음성 명령에 대응하는 신호를 제1 서버 또는 제2 서버로 송신하고, 제1 서버 또는 제2 서버로부터 상기 판별한 음성 명령에 기초하는 응답 신호를 수신하는 자연어 처리(Natural Language Processing) 서버, 및, 음성 명령에 기초하는 응답 신호를 음성 데이터로 변환하여 홈 어플라이언스로 송신하는 텍스트 음성 변환(Text to Speech) 서버를 포함할 수 있다.
상기 또는 다른 목적을 달성하기 위해 본 발명의 일 측면에 따른 음성 인식 서버 시스템의 동작 방법은, 음성 서버가 홈 어플라이언스로부터 수신한 음성 데이터를 분석하여 음성 명령을 판별하는 단계, 판별한 음성 명령이 홈 어플라이언스와 관련된 경우에, 음성 서버가, 판별한 음성 명령에 대응하는 신호를 가전 제어 서버로 송신하는 단계, 및, 가전 제어 서버가 판별한 음성 명령에 대응하는 제어 신호를 홈 어플라이언스로 송신하는 단계를 포함할 수 있다.
상기 또는 다른 목적을 달성하기 위해 본 발명의 일 측면에 따른 음성 인식 서버 시스템은, 홈 어플라이언스로부터 음성 데이터를 수신하고, 수신한 음성 데이터를 분석하여 음성 명령을 판별하며, 판별한 음성 명령이 홈 어플라이언스와 관련된 경우에, 판별한 음성 명령에 대응하는 신호를 가전 제어 서버로 송신하는 음성 서버, 및, 판별한 음성 명령에 기초하는 제어 신호를 홈 어플라이언스로 송신하는 가전 제어 서버를 포함하고, 음성 서버는 음성 명령에 기초하는 처리 결과 정보를 포함하는 음성 데이터를 홈 어플라이언스로 송신할 수 있다.
본 발명의 실시예들 중 적어도 하나에 의하면, 음성 입력에 따라 홈 어플라이언스가 동작함으로써, 사용자가 리모콘을 조작할 필요가 없어, 사용자 편의성을 증대시킬 수 있다.
또한, 본 발명의 실시예들 중 적어도 하나에 의하면, 효율적으로 자연어를 인식, 처리할 수 있다.
또한, 본 발명의 실시예들 중 적어도 하나에 의하면, 음성 인식 및 음성 인식 결과에 대응하는 제어를 수행함에 있어, 전체 과정의 속도를 향상하고, 서버 시스템 구성을 최적화함으로써, 사용자 편의성을 증대할 수 있다.
한편, 그 외의 다양한 효과는 후술될 본 발명의 실시예에 따른 상세한 설명에서 직접적 또는 암시적으로 개시될 것이다.
도 1은 본 발명의 일 실시예에 따른 음성 인식 서버 시스템 및 홈 어플라이언스를 포함하는 스마트 홈 시스템을 간략히 도시한 도면이다.
도 2는 홈 어플라이언스의 다양한 예를 설명하는 도면이다.
도 3은 음성 인식 서버 시스템의 일예이다.
도 4는 음성 인식 서버 시스템의 신호 흐름을 예시한 도면이다.
도 5는 본 발명의 일 실시예에 따른 음성 인식 서버 시스템의 일예이다.
도 6 내지 도 9는 본 발명의 일 실시예에 따른 음성 인식 서버 시스템의 신호 흐름을 예시한 도면이다.
도 10은 본 발명의 일 실시예에 따른 서버의 내부 블록도의 일예를 도시한 도면이다.
도 11은 본 발명의 일 실시예에 따른 홈 어플라이언스의 내부 블록도의 일예를 도시한 도면이다.
도 12는 본 발명의 일 실시예에 따른 홈 어플라이언스의 내부 블록도의 다른 예를 도시한 도면이다.
도 13은 본 발명의 일 실시예에 따른 홈 어플라이언스의 동작 방법을 도시한 순서도이다.
도 14와 도 15는 본 발명의 일 실시예에 따른 음성 인식 서버 시스템 및 홈 어플라이언스의 다양한 동작에 관한 설명에 참조되는 도면이다.
도 2는 홈 어플라이언스의 다양한 예를 설명하는 도면이다.
도 3은 음성 인식 서버 시스템의 일예이다.
도 4는 음성 인식 서버 시스템의 신호 흐름을 예시한 도면이다.
도 5는 본 발명의 일 실시예에 따른 음성 인식 서버 시스템의 일예이다.
도 6 내지 도 9는 본 발명의 일 실시예에 따른 음성 인식 서버 시스템의 신호 흐름을 예시한 도면이다.
도 10은 본 발명의 일 실시예에 따른 서버의 내부 블록도의 일예를 도시한 도면이다.
도 11은 본 발명의 일 실시예에 따른 홈 어플라이언스의 내부 블록도의 일예를 도시한 도면이다.
도 12는 본 발명의 일 실시예에 따른 홈 어플라이언스의 내부 블록도의 다른 예를 도시한 도면이다.
도 13은 본 발명의 일 실시예에 따른 홈 어플라이언스의 동작 방법을 도시한 순서도이다.
도 14와 도 15는 본 발명의 일 실시예에 따른 음성 인식 서버 시스템 및 홈 어플라이언스의 다양한 동작에 관한 설명에 참조되는 도면이다.
이하에서는 첨부한 도면을 참조하여 본 발명의 실시예를 상세하게 설명한다. 그러나 본 발명이 이러한 실시예에 한정되는 것은 아니며 다양한 형태로 변형될 수 있음은 물론이다.
도면에서는 본 발명을 명확하고 간략하게 설명하기 위하여 설명과 관계없는 부분의 도시를 생략하였으며, 명세서 전체를 통하여 동일 또는 극히 유사한 부분에 대해서는 동일한 도면 참조부호를 사용한다.
한편, 이하의 설명에서 사용되는 구성요소에 대한 접미사 "모듈" 및 "부"는 단순히 본 명세서 작성의 용이함만이 고려되어 부여되는 것으로서, 그 자체로 특별히 중요한 의미 또는 역할을 부여하는 것은 아니다. 따라서, 상기 "모듈" 및 "부"는 서로 혼용되어 사용될 수도 있다.
도 1은 본 발명의 일 실시예에 따른 음성 인식 서버 시스템 및 홈 어플라이언스를 포함하는 스마트 홈 시스템을 간략히 도시한 도면이고 도 2는 홈 어플라이언스의 다양한 예를 설명하는 도면이다.
도 1을 참조하면, 본 발명의 일 실시예에 따른 스마트 홈 시스템(10)은, 통신 모듈(미도시)을 구비하여 다른 기기와 통신하거나 네트워크에 접속할 수 있는 홈 어플라이언스(home appliance, 200)와 음성 인식 및 가전 제어를 위한 복수의 서버를 포함하는 음성 인식 서버 시스템(100)을 포함하여 구성될 수 있다.
도 2를 참조하면, 홈 어플라이언스(200)에는 통신 모듈을 구비한 공기조화기(200a), 로봇청소기(200b), 냉장고(200c), 세탁기(200d), 조리기기(200e) 등이 해당될 수 있다.
또한, 본 발명의 일 실시예에 따른 스마트 홈 시스템(10)은, 스마트 폰(smart phone), 태블릿(Tablet) PC 등 휴대 단말기(미도시)를 포함할 수 있다.
홈 어플라이언스(200)는 내부에 통신 모듈을 구비하여 스마트 홈 시스템(10) 내/외부의 전자기기들과 통신할 수 있다.
본 명세서에서, 설명의 편의상 홈 어플라이언스(200)들 중 공기조화기(200a), 로봇청소기(200b), 냉장고(200c), 세탁기(200d), 조리기기(200e) 등 특정 홈 어플라이언스를 예로 들어 설명하더라도, 본 발명은, 이에 한정되지 않고, 동일한 방식으로 다른 홈 어플라이언스에도 적용될 수 있다.
본 발명의 일 실시예에 따른 스마트 홈 시스템(10)은 액세스 포인트(access point: AP) 장치(300)를 더 포함할 수 있고, 홈 어플라이언스(200)는 액세스 포인트 장치(300)를 통하여 무선 인터넷 네트워크에 접속하여 다른 기기들과 통신할 수 있다.
액세스 포인트 장치(300)는 스마트 홈 시스템(10) 내의 전자 기기들에, 소정 통신 방식에 의한 무선 채널을 할당하고, 해당 채널을 통해, 무선 데이터 통신을 수행할 수 있다.
여기서, 소정 통신 방식은, 와이파이(Wi-Fi) 통신 방식일 수 있다. 이에 대응하여, 홈 어플라이언스(200)가 구비하는 통신 모듈은 와이파이 통신 모듈일 수 있으나, 본 발명은 통신 방식에 한정되지 않는다.
또는, 홈 어플라이언스(200)는 다른 종류의 통신 모듈을 구비하거나 복수의 통신 모듈을 구비할 수 있다. 예를 들어, 홈 어플라이언스(200)는 NFC 모듈, 지그비(zigbee) 통신 모듈, 블루투스(Bluetooth™) 통신 모듈 등을 포함할 수 있다.
홈 어플라이언스(200)는 와이파이(wi-fi) 통신 모듈 등을 통해 음성 인식 서버 시스템(100)에 포함되는 서버 또는 외부의 소정 서버, 사용자의 휴대 단말기 등과 연결 가능하고, 원격 모니터링, 원격 제어 등 스마트 기능을 지원할 수 있다.
사용자는 휴대 단말기를 통하여 스마트 홈 시스템(10) 내의 홈 어플라이언스(200)에 관한 정보를 확인하거나 홈 어플라이언스(200)를 제어할 수 있다.
한편, 사용자가 가정 내에서 홈 어플라이언스(200)를 제어하거나 소정 정보를 확인하고자 하는 경우에도 휴대 단말기를 반드시 이용해야 하는 것은 불편할 수 있다.
예를 들어, 사용자가 휴대 단말기의 현재 위치를 모르거나 다른 장소에 있는 경우에 다른 방식으로 홈 어플라이언스(200)를 제어할 수 있는 수단이 있는 것이 더 효율적이다.
본 발명의 일 실시예에 따른 홈 어플라이언스(200)는 사용자의 음성 입력을 수신할 수 있고, 음성 인식 서버 시스템(100)은 사용자의 음성 입력을 인식, 분석하여 홈 어플라이언스(200)를 제어할 수 있다.
이에 따라, 사용자는 휴대 단말기, 원격제어장치를 조작하지 않고서도 홈 어플라이언스(200)를 제어할 수 있다.
한편, 상기 음성 인식 서버 시스템(100)에 포함되는 서버들 중 적어도 일부는 홈 어플라이언스의 제조 회사, 판매 회사가 운영하는 서버이거나 제조 회사 또는 판매 회사가 서비스를 위탁한 회사가 운영하는 서버일 수 있다.
도 3은 음성 인식 서버 시스템의 일예이고, 도 4는 도 3에 예시된 음성 인식 서버 시스템의 신호 흐름을 예시한 도면이다.
도 4는 사용자의 음성 명령에 따라 홈 어플라이언스가 동작하는 통상적인 상황에서의 신호 흐름을 예시한다.
도 3을 참조하면, 음성 인식 서버 시스템은, 홈 어플라이언스(200a)로부터 음성 데이터를 수신하고, 수신한 음성 데이터를 분석하여 음성 명령을 판별하는 음성 서버(110)를 포함할 수 있다.
또한, 음성 인식 서버 시스템은, 상기 음성 서버(110)로부터 상기 판별한 음성 명령에 대응하는 신호를 수신하고, 상기 판별한 음성 명령에 대응하는 요청 신호를 생성하는 연계 서비스 서버(120)와 상기 연계 서비스 서버(120)로부터 수신되는 요청 신호에 기초하는 제어 신호를 상기 홈 어플라이언스(200a)로 송신하는 가전 제어 서버(130)를 더 포함할 수 있다.
도 3에서 예시된 음성 인식 서버 시스템은, 홈 어플라이언스(200a)의 요청 없이도, 상기 음성 서버(110)가 상기 음성 명령에 기초하는 처리 결과 정보를 포함하는 음성 데이터를 상기 홈 어플라이언스(200a)로 송신할 수 있다.
상기 음성 서버(110)는, 홈 어플라이언스(200a)로부터 음성 데이터를 수신하고, 수신한 음성 데이터를 텍스트(text) 데이터로 변환하는 자동 음성 인식 서버(111), 상기 자동 음성 인식 서버(111)로부터 상기 텍스트 데이터를 수신하고, 수신한 텍스트 데이터를 분석하여 음성 명령을 판별하는 자연어 처리 서버(112), 및, 상기 음성 명령에 기초하는 응답 신호를 음성 데이터로 변환하여 상기 홈 어플라이언스(200a)로 송신하는 텍스트 음성 변환 서버(113)를 포함할 수 있다.
상기 연계 서비스 서버(120)는, 상기 자연어 처리 서버(112)로부터 상기 판별한 음성 명령에 대응하는 신호를 수신할 수 있다.
상기 연계 서비스 서버(120)는 판별한 음성 명령이 홈 어플라이언스(200a)에 관한 것이면, 상기 가전 제어 서버(130)와 통신하여 대응하는 동작을 수행할 수 있다.
또는, 상기 연계 서비스 서버(120)는 판별한 음성 명령이 홈 어플라이언스(200a)에 관한 것이 아니면, 외부의 외부 서비스(121)와 통신하여 대응하는 동작을 수행할 수 있다.
예를 들어, 상기 연계 서비스 서버(120)는 판별한 음성 명령이 날씨, 주식, 뉴스 등의 정보를 요청하는 명령이면, 요청된 정보에 대응하는 서비스를 제공하는 서버로 해당 정보를 요청하고 수신할 수 있다.
또한, 상기 연계 서비스 서버(120)는 수신한 정보를 음성 서버(110)로 송신할 수 있고, 상기 자연어 처리 서버(112)는 수신한 정보를 홈 어플라이언스(200a)로 전달할 수 있다.
상기 연계 서비스 서버(120)는 판별한 음성 명령이 홈 어플라이언스(200a)에 관한 것이면, 상기 판별한 음성 명령에 대응하는 요청 신호를 생성하여 상기 가전 제어 서버(130)로 송신할 수 있다.
상기 가전 제어 서버(130)는, 상기 연계 서비스 서버(120)로부터 수신되는 요청 신호에 기초하는 제어 신호를 상기 홈 어플라이언스(200a)로 송신할 수 있다.
예를 들어, 공기조화기(200a)의 설정 온도를 변경하는 요청이 수신되면, 상기 가전 제어 서버(130)는 상기 공기조화기(200a)로 설정 온도를 변경하는 제어 신호를 송신할 수 있다.
한편, 홈 어플라이언스(200a)는 상기 가전 제어 서버(130)로부터 수신한 제어 신호에 따라 대응하는 동작을 수행할 수 있다.
또한, 홈 어플라이언스(200a)는 요청받은 동작을 수행한 후 동작을 수행하였음을 알리는 신호를 상기 가전 제어 서버(130)로 송신할 수 있다.
상기 가전 제어 서버(130)는, 상기 홈 어플라이언스(200a)로부터 상기 제어 신호에 대한 응답 신호를 수신하고, 상기 응답 신호에 대응하는 처리 결과 정보를 상기 연계 서비스 서버(120)로 송신할 수 있다.
상기 연계 서비스 서버(120)는 음성 서버(110), 더욱 상세하게는 자연어 처리 서버(112)로 상기 처리 결과 정보를 전달할 수 있다.
이 경우에, 상기 텍스트 음성 변환 서버(113)가 상기 홈 어플라이언스(200a)로 송신하는 음성 데이터는, 상기 처리 결과 정보를 포함할 수 있다.
또한, 상기 연계 서비스 서버(120)는, 상기 판별한 음성 명령에 대응하는 신호에 기초하여 상기 홈 어플라이언스(200a)의 상태 정보를 상기 가전 제어 서버로 요청하고, 상기 가전 제어 서버는, 상기 홈 어플라이언스(200a)의 상태 정보를 상기 연계 서비스 서버(120)로 송신할 수 있다.
또한, 상기 연계 서비스 서버(120)는, 상기 홈 어플라이언스(200a)의 상태 정보에 기초하여 상기 판별한 음성 명령의 지원이 가능한 경우에, 상기 가전 제어 서버(130)로 상기 판별한 음성 명령에 대응하는 요청 신호를 송신할 수 있다.
또는, 상기 연계 서비스 서버(120)는, 상기 홈 어플라이언스(200a)의 상태 정보에 기초하여 상기 판별한 음성 명령의 지원이 불가능한 경우에, 상기 음성 서버(110)로 현재 상태에서 지원되지 않는 기능임을 알리는 신호를 송신할 수 있다.
예를 들어, 상기 연계 서비스 서버(120)는 상기 자연어 처리 서버(112)로 현재 상태에서 지원되지 않는 기능임을 알리는 신호를 송신할 수 있다.
또한, 상기 자연어 처리 서버(112)는 상기 텍스트 음성 변환 서버(113)로 현재 상태에서 지원되지 않는 기능임을 알리는 신호를 전달하고, 상기 텍스트 음성 변환 서버(113)는 대응하는 음성 데이터를 생성하여 홈 어플라이언스(200a)로 송신할 수 있다.
홈 어플라이언스(200a)는 상기 텍스트 음성 변환 서버(113)로부터 음성 데이터를 수신하여, 현재 상태에서 지원되지 않는 기능임을 알리는 음성 안내 메시지를 출력할 수 있다.
도 4를 참조하면, 홈 어플라이언스(200), 예를 들어, 공기조화기(200a)는 사용자의 음성 명령을 수신할 수 있고(S410), 수신된 사용자의 음성 명령을 음성 서버(110)로 송신할 수 있다(S420).
자동 음성 인식 서버(111)는 수신한 음성 데이터를 인식하여 텍스트(text) 데이터로 변환할 수 있고(S431), 상기 텍스트 데이터를 자연어 처리 서버(112)로 송신할 수 있다(S433).
자연어 처리 서버(112)는 수신한 텍스트 데이터에 대한 자연어 처리를 수행하여 사용자의 음성 명령의 의도를 분석, 판별할 수 있다(S441).
예를 들어, 자연어 처리 서버(112)는 "LG 휘센, 온도 18도로 해"에서 사용자가 공기조화기(200a)의 설정 온도를 18도로 변경하라는 의도의 음성 명령을 판별할 수 있다.
자연어 처리 서버(112)는 상기 판별한 음성 명령에 대응하는 신호를 연계 서비스 서버(120)로 송신할 수 있다(S443).
연계 서비스 서버(120)가 가전 제어 서버(130)로 공기조화기(200a)의 현재 상태 정보를 요청하면(S451), 가전 제어 서버(130)는 공기조화기(200a)의 현재 상태 정보를 조회하여(S453), 연계 서비스 서버(120)로 공기조화기(200a)의 현재 상태 정보를 송신할 수 있다(S455).
만약 가전 제어 서버(130)가 공기조화기(200a)의 현재 상태 정보를 가지고 있지 않다면, 가전 제어 서버(130)는 공기조화기(200a)로 현재 상태 정보를 요청하여 수신할 수 있다.
한편, 상태 정보를 수신한 연계 서비스 서버(120)는 판별한 음성 명령에 따라 해당 공기조화기(200a)의 설정 온도를 18도로 변경하라는 요청 신호를 가전 제어 서버(130)로 송신할 수 있다(S461).
가전 제어 서버(130)는, 상기 요청 신호에 기초하여, 제어 신호를 생성, 공기조화기(200a)로 송신함으로써, 공기조화기(200a)를 제어할 수 있다(S463).
또한, 가전 제어 서버(130)는, 공기조화기(200a)의 제어 후 상기 홈 어플라이언스로부터 상기 제어 신호에 대한 응답 신호를 수신하고, 요청에 대한 동작이 성공했음을 알리는 처리 결과 정보를 연계 서비스 서버(120)로 송신할 수 있다(S465).
연계 서비스 서버(120)는, "에어컨 온도를 18도로 설정합니다" 등 처리 결과 정보에 대응하는 신호를 자연어 처리 서버(112)로 송신할 수 있다(S470).
한편, 자연어 처리 서버(112)는 판별한 사용자의 음성 명령에 기초하는 응답 신호를 텍스트 음성 변환 서버(113)로 송신할 수 있다(S481). 여기서, 판별한 사용자의 음성 명령에 기초하는 응답 신호는 상기 처리 결과 정보를 포함할 수 있다.
한편, 텍스트 음성 변환 서버(113)는 상기 음성 명령에 기초하는 응답 신호를 음성 데이터로 변환하여(S483), 상기 홈 어플라이언스(200a)로 송신할 수 있다(S485).
홈 어플라이언스(200a)는 수신한 음성 데이터에 기초하여 "에어컨 온도를 18도로 설정합니다" 등 음성 안내 메시지를 출력할 수 있다(S490).
한편, 도 3과 도 4를 참조하여 설명한 음성 인식 서버 시스템의 음성 인식 시작부터 홈 어플라이언스의 동작까지의 서버간 소요 시간을 분석하면, 자연어 처리 서버(112)-연계 서비스 서버(120)-가전 제어 서버(130) 구간이 전체 소요 시간의 70% 시간을 점유한다.
따라서, 본 발명은 음성 인식 및 동작 과정에서, 연계 서비스 서버(120)의 기능을 분산하고 연계 서비스 서버(120)를 경유하는 구간을 제거하여, 속도를 개선하는 방안을 제안한다.
도 5는 본 발명의 일 실시예에 따른 음성 인식 서버 시스템의 일예이다.
도 5에서 예시된 음성 인식 서버 시스템은, 도 3에서 예시된 음성 인식 서버 시스템에서 가장 많은 시간이 소요되는 연계 서비스 서버(120) 구간을 삭제함으로 응답 속도를 개선한 것이다.
도 5를 참조하면, 본 발명의 일 실시예에 따른 음성 인식 서버 시스템은, 홈 어플라이언스(200a)로부터 음성 데이터를 수신하고, 수신한 음성 데이터를 분석하여 음성 명령을 판별하는 음성 서버(110)를 포함할 수 있다.
또한, 본 발명의 일 실시예에 따른 음성 인식 서버 시스템은, 상기 판별한 음성 명령에 기초하는 제어 신호를 상기 홈 어플라이언스(200a)로 송신하는 가전 제어 서버(130)를 포함할 수 있다.
홈 어플라이언스(200a)는 사용자가 발화한 음성 명령 입력을 수신하여 수신한 음성 명령 입력에 기초한 음성 데이터를 상기 음성 서버(110)로 송신할 수 있다.
음성 서버(110)는, 홈 어플라이언스(200a)로부터 음성 데이터를 수신하고, 상기 수신한 음성 데이터를 텍스트(text) 데이터로 변환하며, 텍스트 데이터를 분석하여 음성 명령을 판별할 수 있다.
또한, 음성 서버(110)는, 판별한 음성 명령에 대응하는 신호를 소정 서버로 송신할 수 있다.
음성 서버(110)는, 판별한 음성 명령의 종류에 기초하여, 상기 판별한 음성 명령에 대응하는 신호를 제1 서버 또는 제2 서버로 송신할 수 있다.
예를 들어, 판별한 음성 명령이 홈 어플라이언스와 관련된 경우에, 음성 서버(110)는, 상기 판별한 음성 명령에 대응하는 신호를 가전 제어 서버(130)로 송신할 수 있다.
한편, 홈 어플라이언스와 관련된 음성 명령은, 사용자의 음성 입력이 수신된 홈 어플라이언스에 관한 음성 명령뿐만 아니라, 스마트 홈 시스템(10)에 포함되는 다른 홈 어플라이언스에 관한 음성 명령을 포함할 수 있다.
또한, 판별한 음성 명령이 외부 서비스와 관련된 경우에, 음성 서버(110)는, 상기 판별한 음성 명령에 대응하는 신호를 가전 외부 서비스 서버(121)로 송신할 수 있다.
상기 음성 서버(110)는, 홈 어플라이언스(200a)로부터 음성 데이터를 수신하고, 수신한 음성 데이터를 텍스트(text) 데이터로 변환하는 자동 음성 인식(Automatic Speech Recognition: ASR) 서버(111), 상기 자동 음성 인식 서버(111)로부터 상기 텍스트 데이터를 수신하고, 수신한 텍스트 데이터를 분석하여 음성 명령을 판별하며, 상기 판별한 음성 명령에 대응하는 신호를 제1 서버 또는 제2 서버로 송신하고, 상기 제1 서버 또는 상기 제2 서버로부터 상기 판별한 음성 명령에 기초하는 응답 신호를 수신하는 자연어 처리(Natural Language Processing: NLP) 서버(112), 및, 상기 자연어 처리 서버(112)로부터 상기 응답 신호에 대응하는 텍스트를 포함하는 신호를 수신하고, 이러한 음성 명령에 기초하는 응답 신호를 음성 데이터로 변환하여 상기 홈 어플라이언스(200a)로 송신하는 텍스트 음성 변환(Text to Speech: TTS) 서버(113)를 포함할 수 있다.
상기 자동 음성 인식 서버(111)는 홈 어플라이언스(200a)로부터 수신한 음성 데이터에 대하여 음성 인식을 수행하여 텍스트 데이터를 생성하여 상기 자연어 처리 서버(112)로 송신할 수 있다.
상기 자연어 처리 서버(112)는 상기 자동 음성 인식 서버(111)로부터 수신한 텍스트 데이터를 자연어 처리 알고리즘에 따라 분석하여 음성 명령을 판별할 수 있다.
상기 자연어 처리 서버(112)는 자연어 처리 알고리즘에 따라 사람이 일상적으로 사용하고 있는 언어인 자연어를 처리할 수 있고, 사용자의 의도(intent)를 분석할 수 있다. 상기 자연어 처리 서버(112)는 상기 자동 음성 인식 서버(111)로부터 수신한 텍스트 데이터에 대하여 자연어 처리를 수행하여 사용자의 의도에 부합하는 음성 명령을 판별할 수 있다.
이에 따라, 상기 자연어 처리 서버(112)는 사용자가 일상적인 사용 언어로 음성 명령을 입력하더라도 사용자의 의도에 부합하는 음성 명령을 판별할 수 있다.
상기 자연어 처리 서버(112)는 자연어 처리 결과에 대응하는 신호, 즉, 판별한 음성 명령에 대응하는 신호를 소정 서버로 송신할 수 있다. 상기 자연어 처리 서버(112)는, 판별한 음성 명령의 종류에 기초하여, 상기 판별한 음성 명령에 대응하는 신호를 제1 서버 또는 제2 서버로 송신할 수 있다.
예를 들어, 상기 자연어 처리 서버(112)는 판별한 음성 명령이 홈 어플라이언스(200a) 또는 홈 어플라이언스(200a)가 포함되는 스마트 홈 시스템(10)에 관한 것이면, 상기 가전 제어 서버(130)와 통신하여 대응하는 동작을 수행할 수 있다.
또는, 상기 자연어 처리 서버(112)는 판별한 음성 명령이 홈 어플라이언스(200a)에 관한 것이 아니면, 외부의 외부 서비스 서버(121)와 통신하여 대응하는 동작을 수행할 수 있다.
예를 들어, 상기 자연어 처리 서버(112)는 판별한 음성 명령이 날씨, 주식, 뉴스 등의 정보를 요청하는 명령이면, 요청된 정보에 대응하는 서비스를 제공하는 서버로 해당 정보를 요청하고 수신할 수 있다.
또한, 상기 자연어 처리 서버(112)는 수신한 정보를 음성 서버(110)로 송신할 수 있고, 상기 자연어 처리 서버(112)는 수신한 정보를 홈 어플라이언스(200a)로 전달할 수 있다.
한편, 상기 가전 제어 서버(130)는, 상기 자연어 처리 서버(112)로부터 수신되는 요청 신호에 기초하는 제어 신호를 상기 홈 어플라이언스(200a)로 송신할 수 있다.
예를 들어, 공기조화기(200a)의 설정 온도를 변경하는 요청이 수신되면, 상기 가전 제어 서버(130)는 상기 공기조화기(200a)로 설정 온도를 변경하는 제어 신호를 송신할 수 있다.
한편, 홈 어플라이언스(200a)는 상기 가전 제어 서버(130)로부터 수신한 제어 신호에 따라 대응하는 동작을 수행할 수 있다.
또한, 홈 어플라이언스(200a)는 요청받은 동작을 수행한 후 동작을 수행하였음을 알리는 신호를 상기 가전 제어 서버(130)로 송신할 수 있다.
또한, 상기 가전 제어 서버(130)는, 상기 홈 어플라이언스(200a)로부터 상기 제어 신호에 대한 응답 신호를 수신하고, 상기 응답 신호에 대응하는 처리 결과 정보를 상기 음성 서버(110)로 송신할 수 있다.
상기 음성 서버(110)는, 상기 처리 결과 정보를 포함하는 응답 신호를 상기 홈 어플라이언스(200a)로 송신할 수 있다. 상기 음성 서버(110)는 상기 음성 명령에 기초하는 처리 결과 정보를 포함하는 음성 데이터를 상기 홈 어플라이언스(200a)로 송신할 수 있다.
또한, 상기 음성 서버(110)는, 상기 홈 어플라이언스(200a)로부터 상기 처리 결과 정보에 대응하는 출력 문구 텍스트를 포함하는 신호를 수신하고, 상기 수신한 출력 문구 텍스트를 음성 데이터로 변환하여 상기 홈 어플라이언스(200a)로 전송할 수 있다.
상기 텍스트 음성 변환 서버(113)가 상기 홈 어플라이언스(200a)로 송신하는 상기 판별한 음성 명령에 기초하는 응답 신호는, 상기 처리 결과 정보를 포함할 수 있다.
한편, 홈 어플라이언스(200a)는 상기 텍스트 음성 변환 서버(113)로부터 상기 판별한 음성 명령에 기초하는 응답 신호를 수신할 수 있다. 여기서, 응답 신호는 상기 판별한 음성 명령에 대응하는 응답의 음성데이터를 포함할 수 있다.
예를 들어, 사용자가 공기조화기의 설정 온도를 변경하는 음성 명령을 입력한 경우에, 상기 응답 신호는 설정 온도를 변경하였음을 나타내는 음성 데이터를 포함할 수 있다.
한편, 상기 자연어 처리 서버(112)는 수신한 응답 신호에 대응하는 텍스트를 포함하는 신호를 상기 텍스트 음성 변환 서버(113)로 송신할 수 있다. 여기서, 상기 응답 신호에 대응하는 텍스트를 포함하는 신호는 상기 처리 결과 정보에 대응하는 출력 문구 텍스트를 포함할 수 있다.
한편, 상기 텍스트 음성 변환 서버(113)는 수신한 신호에 포함되는 텍스트를 음성 데이터로 변환하여 상기 홈 어플라이언스(200a)로 송신할 수 있다. 여기서 변환된 음성 데이터는 음원 파일을 포함할 수 있다.
상기 홈 어플라이언스(200a)는 스피커를 통하여 수신한 음성 데이터에 기초한 음성 안내 메시지를 출력할 수 있다.
한편, 상기 가전 제어 서버(130)로 요청하고, 상기 가전 제어 서버(130)는, 상기 판별한 음성 명령에 대응하는 신호에 기초하여 상기 홈 어플라이언스(200a)의 상태 정보를 상기 음성 서버(110)로 송신할 수 있다. 상기 가전 제어 서버(130)는, 상기 홈 어플라이언스(200a)의 상태 정보가 확보되어 있는 상태가 아닌 경우에는, 상기 홈 어플라이언스(200a)로 상태 정보를 요청하여 수신할 수 있다.
한편, 홈 어플라이언스(200a)의 제어부(도 11의 240 참조) 또는 음성 모듈(도 12의 205 참조)은, 상기 홈 어플라이언스(200a)의 상태 정보에 기초하여 상기 판별한 음성 명령의 지원이 가능한 경우에, 상기 가전 제어 서버(130)로 상기 판별한 음성 명령에 대응하는 요청 신호를 송신할 수 있다.
또는, 홈 어플라이언스(200a)의 제어부(240) 또는 음성 모듈(205)은, 상기 홈 어플라이언스(200a)의 상태 정보에 기초하여 상기 판별한 음성 명령의 지원이 불가능한 경우에, 상기 자연어 처리 서버(112)로 현재 상태에서 지원되지 않는 기능임을 알리는 신호를 송신할 수 있다.
이 경우에도, 홈 어플라이언스(200a)는 상기 텍스트 음성 변환 서버(113)로부터 음성 데이터를 수신하여, 현재 상태에서 지원되지 않는 기능임을 알리는 음성 안내 메시지를 출력할 수 있다.
실시예에 따라서는, 상기 음성 서버(110)가, 상기 판별한 음성 명령의 지원 가능 유무를 판별할 수 있다. 예를 들어, 사용자의 음성 명령의 의도를 분석한 상기 자연어 처리 서버(112)가, 상기 판별한 음성 명령의 지원 가능 유무를 판별할 수 있다.
이 경우에, 상기 판별한 음성 명령이 지원 불가능한 명령을 포함하고 있는 경우, 상기 자연어 처리 서버(112)가 송신하는 상기 판별한 음성 명령에 기초하는 응답 신호는 상기 판별한 음성 명령이 상기 홈 어플라이언스(200a)가 지원하지 않는 기능임을 알리는 신호일 수 있다.
본 발명의 일 실시예에 따른 음성 서버(110) 및 이를 포함하는 음성 인식 서버 시스템(100)은, 자연어 음성처리를 위해 여러 역할을 하는 서버를 유기적으로 연결하여 이용할 수 있다.
홈 어플라이언스(200)는 음성 명령의 수신 및 전처리, 서버 전송까지의 동작을 수행하고, 음성 서버(110)는, 음성/텍스트 변환, 의도분석, 명령 식별 등 자연어 처리 과정을 수행할 수 있다.
음성 서버(110)가 자연어 처리를 수행함으로써, 홈 어플라이언스 내부 임베디드 모듈의 CPU, 메모리 등의 부담을 감소시킬 수 있다.
한편, 홈 어플라이언스(200)는 음성 서버(110)로부터 음원 파일을 포함하는 음성 데이터를 수신하여, 음성 안내 메시지를 오디오로 출력함으로써, 청각적 피드백으로 사용자의 음성 입력에 화답할 수 있다.
홈 어플라이언스(200)는 음성 서버(110)로부터 음성 파일을 스트리밍으로 전달받아 사용자에게 음성 안내 메시지를 재생, 출력할 수 있다. 이에 따라 홈 어플라이언스(200)는 다양한 음원 파일을 저장하고 있을 필요가 없다.
본 발명의 일 실시예에 따른 음성 인식 서버 시스템(100)은, 복수의 서버를 통해, 호환성 및 연결성을 확보하고, 최종 제어 명령은 가전 제어 서버(130)를 활용함으로써, 음성 인식 과정과 가전 제어 서버(130)를 통해 와이파이 통신을 이용한 가전 제어 사이의 충돌 및 휴대 단말기를 통한 가전 제어와 홈 어플라이언스(200)를 통한 음성 입력에 의한 가전 제어 간 충돌을 막을 수 있다.
본 발명의 일 실시예에 따른 음성 인식 서버 시스템(100)은, 서버 간 유기적인 연결을 통해 어느 한 서버에 의존하여 특정서버에 부하가 몰리는 것을 줄일 수 있고, 각각의 서버 별 역할이 달라, 특정 서버에서 문제가 생길 경우 동일한 역할을 하는 타 서버와의 연계를 통해 쉽게 대응이 가능하다.
또한, 복수의 서버들을 독립적으로 수시로 업데이트할 수 있어, 성능 개선에 유리하다.
또한, 본 발명의 일 실시예에 따른 음성 인식 서버 시스템은 도 3과 도 4를 참조하여 설명한 음성 인식 서버 시스템에서, 연계 서비스 서버(120)의 역할을 홈 어플라이언스 및 음성 서버로 분산하여, 기존 음성 인식 과정에서 연계 서비스 서버(120)를 제거함으로써, 음성 제어 응답 속도를 향상한 것이다.
예를 들어, 홈 어플라이언스(200) 제품의 상태 판단과 관련하여, 홈 어플라이언스(200)의 제어부(240) 및/또는 음성 모듈(205)이 홈 어플라이언스(200) 내 각 모듈로부터 받은 정보를 이용하여 판단할 수 있다. 홈 어플라이언스(200) 제품의 상태 판단은, 제품 연동 및/또는 제어 시 기능, 설정 동기화를 통한 상태 전달, 소정 기능 및 서비스의 지원 가능 여부 판별 등에 필요할 수 있다.
또한, 외부 서비스 연동은 음성 서버(110)의 자연어 처리 서버(112)에서 외부 서버로 요청 날씨 등의 정보를 받아와서 처리할 수 있다. 예를 들어, 사용자의 날씨 요청은 자동 음성 인식 서버(111)와 자연어 처리 서버(112)에서 처리되고, 자연어 처리 서버(112)가 외부 서버와 통신하여 날씨 정보를 수신한 후에, 텍스트 음성 변환 서버(113)를 통하여 음성 데이터를 홈 어플라이언스(200)로 전달할 수 있다. 홈 어플라이언스(200)는 스피커로 날씨 정보를 출력하여 사용자의 날씨 정보 요청에 응답할 수 있다.
이와 같이, 연계 서비스 서버(120)의 역할을 분배함으로써 응답 속도를 개선할 수 있다.
또한, 도 3에서 예시한 음성 인식 서버 시스템은 홈 어플라이언스 제품이 추가될 때마다, 연계 서비스 서버(120)에 제품 기능 리스트를 업데이트(update)해야 한다.
하지만, 도 5에서 예시한 음성 인식 서버 시스템은, 제품 및 기능을 별도의 관리 없이 자동으로 추가할 수 있도록 하는 기능 동기화(Function sync.) 기능을 통해 제품 상태 판단을 제어부(240) 또는 음성 모듈(205)에서 자동으로 처리할 수 있는 장점이 있어, 확장성이 높다.
도 6 내지 도 9는 본 발명의 일 실시예에 따른 음성 인식 서버 시스템의 신호 흐름을 예시한 도면이다.
도 6은 본 발명의 일 실시예에 따른 음성 인식 서버 시스템의 신호 흐름을 예시한 도면으로, 도 5에 예시된 음성 인식 서버 시스템의 신호 흐름을 예시한 도면이다.
도 6은 사용자의 음성 명령에 따라 홈 어플라이언스가 동작하는 통상적인 상황에서의 신호 흐름을 예시한다.
도 6을 참조하면, 본 발명의 일 실시예에 따른 홈 어플라이언스(200), 예를 들어, 공기조화기(200a)는 사용자의 음성 명령을 수신할 수 있고(S610), 수신된 사용자의 음성 명령을 음성 서버(110)로 송신할 수 있다(S620).
자동 음성 인식 서버(111)는, 수신한 음성 데이터를 인식하여 텍스트(text) 데이터로 변환할 수 있고(S631), 상기 텍스트 데이터를 자연어 처리 서버(112)로 송신할 수 있다(S633).
자연어 처리 서버(112)는 수신한 텍스트 데이터에 대한 자연어 처리를 수행하여 사용자의 음성 명령의 의도를 분석, 판별할 수 있다(S641).
예를 들어, 자연어 처리 서버(112)는 "LG 휘센, 온도 18도로 해"에서 사용자가 공기조화기(200a)의 설정 온도를 18도로 변경하라는 의도의 음성 명령을 판별할 수 있다.
자연어 처리 서버(112)는 상기 판별한 음성 명령에 대응하는 신호를 가전 제어 서버(130)로 송신할 수 있다(S643).
판별된 음성 명령에 따라서, 가전 제어 서버(130)는 공기조화기(200a)의 현재 상태 정보를 조회할 수 있다. 만약 가전 제어 서버(130)가 공기조화기(200a)의 현재 상태 정보를 가지고 있지 않다면, 가전 제어 서버(130)는 공기조화기(200a)로 현재 상태 정보를 요청하여 수신할 수 있다.
가전 제어 서버(130)는, 상기 판별한 음성 명령에 기초하여, 제어 신호를 생성, 공기조화기(200a)로 송신함으로써, 공기조화기(200a)를 제어할 수 있다(S651).
한편, 공기조화기(200a)의 제어부(240) 또는 음성 모듈(205)은, 수신한 제어 신호에 기초하여, 제품 상태 정보를 판단할 수 있고(S661), 대응하는 동작을 수행할 수 있다(S663).
또한, 공기조화기(200a)는 처리 결과 정보를 가전 제어 서버(130)로 응답할 수 있다(S665).
예를 들어, 제어 신호가 소정 운전 모드로 운전을 시작하거나 운전중인 모드의 설정을 변경하는 것이면, 공기조화기(200a)는 수신한 제어 신호에 따른 운전을 수행하고, 처리 결과를 응답할 수 있다.
또한, 제어 신호가 공간의 현재 공기질 상태 등을 문의하는 것이면, 공기조화기(200a)는 센서부(215)에서 감지되는 공기질 데이터에 따른 공기질 정보를 응답할 수 있다.
또한, 제어 신호가 공기조화기(200a)의 상태 정보를 문의하는 것이면, 공기조화기(200a)는 상태 정보를 응답할 수 있다.
실시예에 따라서, 공기조화기(200a)는 세분화된 리턴 코드(Return code)로 처리 결과 정보를 간략히 전송할 수 있다.
예를 들어, 리턴 코드 0000은 정상 수행, 리턴 코드 0012은 실행 불가 명령, 리턴 코드 0017은, 이미 운전 중인 중복 명령, 리턴 코드 0106은 지원하지 않는 기능을 의미할 수 있다.
가전 제어 서버(130)는, 공기조화기(200a)의 제어 후 상기 홈 어플라이언스로부터 상기 제어 신호에 대한 응답 신호를 수신할 수 있다(S665).
또한, 가전 제어 서버(130)는, 요청에 대한 동작이 성공했음을 알리는 처리 결과 정보를 자연어 처리 서버(112)로 송신할 수 있다(S665).
가전 제어 서버(130)는, "에어컨 온도를 18도로 설정합니다" 등 처리 결과 정보에 대응하는 신호를 자연어 처리 서버(112)로 송신할 수 있다(S670).
또는, 가전 제어 서버(130)는, 공기조화기(200a)로부터 수신한 리턴 코드를 자연어 처리 서버(112)로 전달할 수도 있다(S670).
한편, 자연어 처리 서버(112)는 판별한 사용자의 음성 명령에 기초하는 응답 신호를 텍스트 음성 변환 서버(113)로 송신할 수 있다(S681). 여기서, 판별한 사용자의 음성 명령에 기초하는 응답 신호는 상기 처리 결과 정보를 포함할 수 있다.
한편, 텍스트 음성 변환 서버(113)는 상기 음성 명령에 기초하는 응답 신호를 음성 데이터로 변환하여(S683), 상기 홈 어플라이언스(200a)로 송신할 수 있다(S685).
홈 어플라이언스(200a)는 수신한 음성 데이터에 기초하여 "에어컨 온도를 18도로 설정합니다" 등 음성 안내 메시지를 출력할 수 있다(S690).
도 7은 사용자의 음성 명령에 따라 홈 어플라이언스가 동작하는 통상적인 상황에서의 신호 흐름을 예시한다.
도 7을 참조하면, 홈 어플라이언스(200)의 음성 모듈(205)은, 사용자의 음성수신된 사용자의 음성 명령을 음성 서버(110)로 송신할 수 있다(S710).
음성 서버(110)는, 수신한 음성 데이터를 인식하고, 자연어 처리를 수행하여, 사용자의 음성 명령의 의도를 분석, 판별할 수 있다(S720).
음성 서버(110)는, 판별된 음성 명령에 대응하는 신호를 가전 제어 서버(130)로 송신할 수 있다(S730).
가전 제어 서버(130)는, 상기 판별한 음성 명령에 기초하여, 제어 신호를 생성, 상기 음성 모듈(205)로 송신함으로써, 홈 어플라이언스(200)를 제어할 수 있다(S740).
한편, 음성 모듈(205)은, 수신한 제어 신호에 기초하여, 대응하는 동작을 수행할 수 있다(S750).
음성 모듈(205)은, 제품 상태 정보를 판단할 수 있고, 지원 가능한 기능인 경우에 제어부(240)로 제어 신호를 전달할 수 있다. 또한, 음성 모듈(205)은, 처리 결과 정보를 상기 가전 제어 서버(130)로 응답할 수 있다(S760).
또한, 음성 모듈(205)은, 제품 상태 정보를 판단할 수 있고, 제품 상태 정보를 상기 가전 제어 서버(130)로 응답할 수 있다(S760).
가전 제어 서버(130)는, 처리 결과 정보에 대응하는 신호를 음성 서버(110)로 송신할 수 있고(S770), 음성 서버(110)는 음성 명령에 기초하는 응답 신호를 음성 데이터로 변환하여, 상기 음성 모듈(205)로 송신할 수 있다(S780).
본 발명의 일 실시예에 따르면, 사용자가 음성 발화를 하게 되면, 음성 모듈(205)이 음성 서버(110)로 음성 파일을 전송하고, 음성 파일은 음성 서버(110)의 자동 음성 인식 서버(111)와 자연어 처리 서버(112)를 거쳐 사용자 의도가 판별될 수 있다. 이렇게 판별된 사용자 음성 명령에 기초하여, 가전 제어 서버(130)는 홈 어플라이언스(200)로 명령을 내리고, 음성 모듈(205)은 명령에 대한 상태를 판단하여, 홈 어플라이언스(200)의 동작 혹은 실행 불가등을 판단할 수 있다.
음성 모듈(205)의 상태 판단 결과에 따라 홈 어플라이언스(200)는 동작하고, 동작에 대한 음성 안내는 다시 자연어 처리 서버(112), 텍스트 음성 변환 서버(113)를 통해 음성 안내될 수 있다.
도 8은 해당 홈 어플라이언스의 미지원 기능을 요청하는 경우에 신호 흐름을 예시한다.
도 8을 참조하면, 본 발명의 일 실시예에 따른 공기조화기(200a)는 "LG 휘센, 빨래 시작" 등 공기조화기(200a)가 지원하지 않는 빨래 기능에 대한 사용자의 음성 명령을 수신할 수 있다(S810).
공기조화기(200a)는 수신된 사용자의 음성 명령을 음성 서버(110)로 송신할 수 있다(S820). 공기조화기(200a)는 수신한 음성 명령을 웨이브(wave) 파일 등 소정 포맷의 디지털 음성 데이터로 변환하여 자동 음성 인식 서버(111)로 송신할 수 있다.
자동 음성 인식 서버(111)는 수신한 음성 데이터를 인식하여 텍스트(text) 데이터로 변환할 수 있고(S831), 상기 텍스트 데이터를 자연어 처리 서버(112)로 송신할 수 있다(S833).
자연어 처리 서버(112)는 수신한 텍스트 데이터에 대한 자연어 처리를 수행하여 사용자의 음성 명령의 의도를 분석, 판별할 수 있다(S841).
또한, 자연어 처리 서버(112)는 상기 판별한 음성 명령의 지원 가능 유무를 판별할 수 있다. 본 실시예에서는, 자연어 처리 서버(112)는 공기조화기(200a)가 지원하지 않는 빨래 기능을 사용자가 요청했음을 판별할 수 있다.
이후, 자연어 처리 서버(112)는 텍스트 음성 변환 서버(113)로 상기 판별한 음성 명령이 상기 홈 어플라이언스가 지원하지 않는 기능임을 알리는 응답 신호를 송신할 수 있다(S843).
텍스트 음성 변환 서버(113)는 상기 음성 명령에 기초하는 응답 신호를 음성 데이터로 변환하여(S845), 상기 홈 어플라이언스(200a)로 송신할 수 있다(S847).
홈 어플라이언스(200a)는 수신한 음성 데이터에 기초하여 "지원하지 않는 기능입니다" 등 음성 안내 메시지를 출력할 수 있다(S850).
도 9는 해당 홈 어플라이언스의 현재 동작 모드에서 미지원 기능을 요청하는 경우에 신호 흐름을 예시한다.
도 9를 참조하면, 본 발명의 일 실시예에 따른 공기조화기(200a)는 "LG 휘센, 쿨파워 시작해" 등 공기조화기(200a)의 특정 모드 운전을 지시하는 사용자의 음성 명령을 수신할 수 있다(S910).
공기조화기(200a)는 수신된 사용자의 음성 명령을 음성 서버(110)로 송신할 수 있다(S920). 공기조화기(200a)는 수신한 음성 명령을 웨이브(wave) 파일 등 소정 포맷의 디지털 음성 데이터로 변환하여 자동 음성 인식 서버(111)로 송신할 수 있다.
자동 음성 인식 서버(111)는 수신한 음성 데이터를 인식하여 텍스트(text) 데이터로 변환할 수 있고(S931), 상기 텍스트 데이터를 자연어 처리 서버(112)로 송신할 수 있다(S933).
자연어 처리 서버(112)는 수신한 텍스트 데이터에 대한 자연어 처리를 수행하여 사용자의 음성 명령의 의도를 분석, 판별할 수 있다(S941).
예를 들어, 자연어 처리 서버(112)는 "LG 휘센, 쿨파워 시작해"에서 사용자가 공기조화기(200a)를 쿨파워 모드로 운전하라는 의도의 음성 명령을 판별할 수 있다.
자연어 처리 서버(112)는 상기 판별한 음성 명령에 대응하는 신호를 가전 제어 서버(130)로 송신할 수 있다(S943).
가전 제어 서버(130)는, 상기 판별한 음성 명령에 기초하여, 제어 신호를 생성, 공기조화기(200a)로 송신함으로써, 공기조화기(200a)를 제어할 수 있다(S951).
한편, 공기조화기(200a)의 제어부(240) 또는 음성 모듈(205)은, 수신한 제어 신호에 기초하여, 제품 상태 정보를 판단할 수 있고(S953), 대응하는 동작을 수행할 수 있다.
공기조화기(200a)의 제어부(240) 또는 음성 모듈(205)은, 공기조화기(200a)의 현재 상태 정보를 기준으로 상기 판별한 음성 명령의 지원 가능 유무를 판별할 수 있다(S953). 예를 들어, 현재 공기조화기(200a)가 제습 모드로 운전 중이고, 쿨파워 모드는 냉방 모드에서만 지원되는 경우에, 자연어 처리 서버(112)는 현재 상태에서 지원하지 않는 쿨파워 모드를 사용자가 요청했음을 판별할 수 있다.
공기조화기(200a)의 제어부(240) 또는 음성 모듈(205)은, 가전 제어 서버(130)로 현재 상태에서 지원하지 않는 기능임을 알리는 리턴 코드를 포함하는 처리 결과 정보를 송신하도록 제어할 수 있다(S955)
이후, 가전 제어 서버(130)는 자연어 처리 서버(112)로 상기 판별한 음성 명령이 상기 홈 어플라이언스(200a)가 현재 상태에서 지원하지 않는 기능임을 알리는 응답 신호를 송신할 수 있다(S960).
또한, 자연어 처리 서버(112)는 상기 판별한 음성 명령이 텍스트 음성 변환 서버(113)로 현재 상태에서 지원하지 않는 기능임을 알리는 응답 신호를 송신할 수 있다(S971).
한편, 텍스트 음성 변환 서버(113)는, 상기 음성 명령에 기초하는 응답 신호를 음성 데이터로 변환하여(S973), 상기 홈 어플라이언스(200a)로 송신할 수 있다(S975).
홈 어플라이언스(200a)는 수신한 음성 데이터에 기초하여 "쿨파워는 냉방모드에서만 지원됩니다" 등 음성 안내 메시지를 출력할 수 있다(S980).
본 발명에 따르면, 사용자의 명령을 이해 못한 경우,제공할 수 없는 기능인 경우 등에 대하여 적합한 음성 안내를 제공하는 사용자 경험을 구현할 수 있다.
명령 처리 중 발생하는 각각의 상황과 시점에 맞는 안내 멘트를 제공함으로써, 사용자의 불편함을 최소화할 수 있다.
도 10은 본 발명의 일 실시예에 따른 서버의 내부 블록도의 일예를 도시한 도면으로, 상기 서버는, 자동 음성 인식 서버(111), 자연어 처리 서버(112), 텍스트 음성 변환 서버(113), 가전 제어 서버(130)일 수 있다.
도 10을 참조하면, 서버는, 통신 모듈(1020), 저장부(1030), 및 프로세서(1010)를 구비할 수 있다.
프로세서(1010)는, 서버의 전반적인 동작을 제어할 수 있다.
통신 모듈(1020)은, 휴대 단말기, 공기조화기 등 홈 어플라이언스, 다른 서버 등으로부터 상태 정보, 동작 정보, 조작 정보, 음성 데이터, 문자 데이터 등 각종 데이터를 수신할 수 있다.
그리고 통신 모듈(1020)은 수신되는 각종 정보에 대응하는 데이터를 그대로 또는 소정 처리 후에 휴대 단말기, 공기조화기 등 홈 어플라이언스, 다른 서버 등으로 송신할 수 있다.
이를 위해, 통신 모듈(1020)은 인터넷 모듈, 이동 통신 모듈 등 하나 이상의 통신 모듈을 구비할 수 있다.
저장부(1030)는, 수신되는 정보를 저장하고, 이에 대응하는 결과 정보 생성을 위한 데이터를 구비할 수 있다.
저장부(1030)는 해당 서버의 동작을 위한 데이터가 저장될 수 있다. 예를 들어, 저장부(1030)에는, 자동 음성 인식 서버(111)의 경우 자동 음성 인식 알고리즘 등이 저장되고, 가전 제어 서버(130)의 경우 홈 어플라이언스의 제품 정보, 상태 정보, 홈 어플라이언스의 제어를 위한 데이터가 저장될 수 있다.
한편, 서버는, 공기조화기 등 홈 어플라이언스 제조사가 운영하는 서버 또는 서비스 제공자가 운영하는 서버일 수 있고, 일종의 클라우드(Cloud) 서버일 수 있다.
도 11은 본 발명의 일 실시예에 따른 홈 어플라이언스의 내부 블록도의 일예를 도시한 도면이다.
도 11을 참조하면, 본 발명의 일 실시예에 따른 홈 어플라이언스(200)는, 카메라(210), 사용자의 음성 명령을 수신하는 오디오 입력부(220), 조작부(230), 각종 데이터를 저장하는 메모리(250), 다른 전자기기와 무선 통신하는 통신부(270), 각 홈 어플라이언스에 구현된 동작을 수행하는 구동부(280), 소정 정보를 영상으로 표시하는 디스플레이(292), 소정 정보를 오디오로 출력하는 오디오 출력부(291), 및, 전반적인 동작을 제어하는 제어부(240)를 포함할 수 있다.
오디오 입력부(220)는, 외부의 오디오 신호, 사용자 음성 명령을 입력받을 수 있다. 이를 위해, 오디오 입력부(220)는, 하나 이상의 마이크(MIC)를 구비할 수 있다. 또한, 사용자의 음성 명령을 더 정확히 수신하기 위하여 오디오 입력부(220)는 복수의 마이크(221, 222)를 구비할 수 있다. 복수의 마이크(221, 222)는, 서로 다른 위치에 이격되어 배치될 수 있고, 외부의 오디오 신호를 획득하여 전기적인 신호로 처리할 수 있다.
도 11 등에서는 오디오 입력부(220)가 제1 마이크(221)와 제2 마이크(222)의 2개의 마이크를 구비하는 예를 도시하였으나, 본 발명은 이에 한정되지 않는다.
오디오 입력부(220)는 아날로그 소리를 디지털 데이터로 변환하는 처리부를 포함하거나 처리부에 연결되어 사용자 입력 음성 명령을 제어부(240) 또는 소정 서버에서 인식할 수 있도록 데이터화할 수 있다.
한편, 오디오 입력부(220)는 사용자의 음성 명령을 입력받는 과정에서 발생하는 잡음(noise)을 제거하기 위한 다양한 잡음 제거 알고리즘이 사용될 수 있다.
또한, 오디오 입력부(220)는 각 마이크(221, 222)에서 수신되는 오디오 신호에서 노이즈를 제거하는 필터, 필터에서 출력되는 신호를 증폭하여 출력하는 증폭기 등 오디오 신호 처리를 위한 구성들을 포함할 수 있다.
메모리(250)는 홈 어플라이언스의 동작에 필요한 각종 정보들을 기록하는 것으로, 휘발성 또는 비휘발성 기록 매체를 포함할 수 있다. 기록 매체는 마이크로 프로세서(micro processor)에 의해 읽힐 수 있는 데이터를 저장한 것으로, HDD(Hard Disk Drive), SSD(Solid State Disk), SDD(Silicon Disk Drive), ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광 데이터 저장 장치 등을 포함할 수 있다.
실시예에 따라서는, 메모리(250)에는 사용자가 입력한 음성 명령의 음원 파일이 저장될 수 있고, 저장된 음원 파일은 통신부(270)을 통하여 음성 인식 서버 시스템(100)으로 전송될 수 있다. 또한, 상기 저장된 음원 파일은 기설정된 시간 경과 또는 기설정된 동작 수행 후에 삭제될 수 있다.
한편, 메모리(250)에는 음성 인식을 위한 데이터가 저장될 수 있고, 제어부(240)는 오디오 입력부(220)를 통하여 수신되는 사용자의 음성 입력 신호를 처리하고 음성 인식 과정을 수행할 수 있다.
또는, 실시예에 따라서는, 홈 어플라이언스(200)는 음성 모듈(도 12의 205 참조)을 더 포함하고, 음성 모듈이 호출어 인식 등 간단한 음성 인식을 수행할 수 있다. 음성 모듈을 포함하는 실시예에 대해서는 도 12를 참조하여 상세히 후술한다.
또한, 음성 신호의 호출어 포함 여부를 판별하기 위한 호출어 판단 알고리즘이 메모리(250)에 저장될 수 있다. ,
상기 제어부(240) 및 음성 모듈은 상기 호출어 판단 알고리즘에 기초하여 상기 음성 신호의 상기 호출어 포함 여부를 판별할 수 있다.
한편, 간단한 음성 인식은 홈 어플라이언스(200)가 수행하고, 자연어 처리 등 고차원의 음성 인식은 음성 인식 서버 시스템(100)에서 수행될 수 있다.
예를 들어, 기설정된 호출어를 포함하는 웨이크 업(wake up) 음성 신호가 수신되는 경우에, 홈 어플라이언스(200)는 음성 명령어를 수신하기 위한 상태로 전환될 수 있다. 이 경우에, 홈 어플라이언스(200)는 호출어 음성 입력 여부까지의 음성 인식 과정만 수행하고, 이후의 사용자 음성 입력에 대한 음성 인식은 음성 인식 서버 시스템(100)을 통하여 수행할 수 있다.
홈 어플라이언스이 시스템 자원에는 한계가 있으므로, 복잡한 자연어 인식 및 처리는 음성 인식 서버 시스템(100)을 통하여 수행될 수 있다.
또는, 호출어 음성 입력 여부의 판단은 홈 어플라이언스(200)와 음성 인식 서버 시스템(100)에서 이중으로 수행될 수 있다. 이에 따라, 호출어 음성 입력 판단의 오인식을 줄이고, 인식률을 높일 수 있다.
메모리(250)에는 제한적인 데이터가 저장될 수 있다. 예를 들어, 메모리(250)에는 기설정된 호출어를 포함하는 웨이크 업(wake up) 음성 신호를 인식하기 위한 데이터가 저장될 수 있다. 이 경우에, 제어부(240)는 오디오 입력부(220)를 통하여 수신되는 사용자의 음성 입력 신호로부터 기설정된 호출어를 포함하는 웨이크 업(wake up) 음성 신호를 인식할 수 있다.
한편, 호출어는 제조사에 의해 설정될 수 있고, 홈 어플라이언스 별로 다른 호출어가 설정될 수 있다. 예를 들어, 공기조화기의 경우에는 "LG 휘센", 냉장고의 경우에는 "LG 디오스"가 호출어로 설정될 수 있다.
또한, 호출어는 사용자에 의해 설정 변경이 가능하다.
제어부(240)는, 웨이크 업(wake up) 음성 신호의 인식 이후에 입력되는 사용자의 음성 명령을, 통신부(270)를 통하여, 음성 인식 서버 시스템(100)에 송신하도록 제어할 수 있다.
통신부(270)는, 하나 이상의 통신 모듈을 구비하여, 다른 전자기기와, 무선 통신을 수행하여, 각종 신호를 주고 받을 수 있다. 예를 들어, 통신부(270)는 마트 홈 시스템(10) 내/외부의 전자기기들과 통신할 수 있다.
또한, 통신부(270)는 억세스 포인트 장치(300)와 통신하고, 억세스 포인트 장치(300)를 통하여 무선 인터넷 네트워크에 접속하여 다른 기기들과 통신할 수 있다.
또한, 제어부(240)는 통신부(270)를 통해 홈 어플라이언스(200)의 상태 정보, 사용자의 음성 명령 등을 음성 인식 서버 시스템(100) 등으로 전송할 수 있다.
한편, 통신부(270)를 통하여 제어 신호가 수신되면, 제어부(240)는 수신되는 제어 신호에 따라 동작하도록 홈 어플라이언스(200)를 제어할 수 있다.
디스플레이(292)는 사용자의 명령 입력에 대응하는 정보, 사용자의 명령 입력에 대응하는 처리 결과, 동작모드, 동작상태, 에러상태 등을 영상으로 표시할 수 있다.
실시예에 따라서는, 디스플레이(292)는, 터치패드와 상호 레이어 구조를 이루어 터치스크린으로 구성될 수 있다. 이 경우에, 디스플레이(292)는 출력 장치 이외에 사용자의 터치에 의한 정보의 입력이 가능한 입력 장치로도 사용될 수 있다.
또한, 오디오 출력부(291)는, 제어부(240)의 제어에 따라 경고음, 동작모드, 동작상태, 에러상태 등의 알림 메시지, 사용자의 명령 입력에 대응하는 정보, 사용자의 명령 입력에 대응하는 처리 결과 등을 오디오로 출력할 수 있다.
한편, 오디오 출력부(291)는, 제어부(240)로부터의 전기 신호를 오디오 신호로 변환하여 출력할 수 있다. 이를 위해, 스피커 등을 구비할 수 있다.
또한, 본 발명의 일 실시예에 따른 홈 어플라이언스(200)는, 음성 인식 과정 및 홈 어플라이언스 제어 과정 중에 발생할 수 있는 다양한 상황들을 고려한 사용자 경험(User Experience, UX)을 제공할 수 있다.
제어부(240)는 음성 인식 과정 및 홈 어플라이언스 제어 과정의 각 단계에 대응하여 소정 정보를 시각적/청각적 수단으로 사용자에게 제공하도록 오디오 출력부(291) 및 디스플레이(292)를 제어할 수 있다.
제어부(240)는 디스플레이(292)를 제어하여 음성 인식 과정 및 홈 어플라이언스 제어 과정의 각 단계에 대응하여 시각적 정보를 제공할 수 있다.
또한, 제어부(240)는 오디오 출력부(291)를 제어하여 음성 인식 과정 및 홈 어플라이언스 제어 과정의 각 단계에 대응하여 청각적 정보를 제공할 수 있다.
구동부(280)는 홈 어플라이언스에 구현된 동작을 수행하는 것으로, 각 홈 어플라이언스별로 다르게 구성될 수 있다.
예를 들어, 홈 어플라이언스가 냉장고인 경우, 구동부(280)는, 냉장실에 냉각된 공기를 공급하기 위한 냉장실 팬을 동작시키는 냉장실 구동부, 냉동실에 냉각된 공기를 공급하기 위한 냉동실 팬을 동작시키는 냉동실 구동부, 냉매를 압축하기 위한 압축기를 동작시키는 압축기 구동부 등을 포함할 수 있다.
다른 예로, 홈 어플라이언스가 세탁기인 경우, 구동부(280)는, 드럼 또는 터브를 구동하는 구동부 등을 포함할 수 있다.
또, 다른 예로, 홈 어플라이언스가 공기조화기인 경우, 구동부(280)는, 실외기 내의 압축기를 구동하기 위한 압축기 구동부, 열교환을 위한 실외기 팬을 동작시키는 실외기 팬 구동부, 열교환을 위한 실내기팬을 동작시키는 실내기 팬 구동부 등을 포함할 수 있다.
또, 다른 예로, 홈 어플라이언스가 조리기기인 경우, 구동부(280)는, 캐비티 내로 마이크로웨이브를 출력하는 마이크로웨이브 구동부 등을 포함할 수 있다.
또, 다른 예로, 홈 어플라이언스가 청소기인 경우, 구동부(280)는, 공기 흡입을 위한 팬 모터 구동부 등을 포함할 수 있다.
한편, 구동부(280)는, 모터 구동부를 포함할 수 있고, 모터를 구동하기 위해, 인버터 등을 포함할 수 있다.
한편, 홈 어플라이언스(200)는 사용자 입력을 위한 조작부(230), 홈 어플라이언스(200) 주변 소정 범위를 촬영할 수 있는 카메라(210)를 더 포함할 수 있다.
조작부(230)는, 복수의 조작 버튼을 구비하여, 입력되는 버튼에 대응하는 신호를 제어부(240)로 전달할 수 있다.
카메라(210)는 홈 어플라이언스(200) 주변, 외부 환경 등을 촬영하는 것으로, 이러한 카메라는 촬영 효율을 위해 각 부위별로 여러 개가 설치될 수도 있다.
예를 들어, 카메라(210)는 적어도 하나의 광학렌즈와, 광학렌즈를 통과한 광에 의해 상이 맺히는 다수개의 광 다이오드(photodiode, 예를 들어, pixel)를 포함하여 구성된 이미지 센서(예를 들어, CMOS image sensor)와, 광 다이오드들로부터 출력된 신호를 바탕으로 영상을 구성하는 디지털 신호 처리기(DSP: Digital Signal Processor)를 포함할 수 있다. 디지털 신호 처리기는 정지영상은 물론이고, 정지영상으로 구성된 프레임들로 이루어진 동영상을 생성하는 것도 가능하다.
한편, 카메라(210)가 촬영하여 획득된 영상은 메모리(250)에 저장될 수 있다.
도 12는 본 발명의 일 실시예에 따른 홈 어플라이언스의 내부 블록도의 다른 예를 도시한 도면이다.
도 12를 참조하면, 홈 어플라이언스(200)는, 카메라(210), 사용자의 음성 명령을 수신하는 오디오 입력부(220), 조작부(230), 각종 데이터를 저장하는 메모리(250), 다른 전자기기와 무선 통신하는 통신부(270), 각 홈 어플라이언스에 구현된 동작을 수행하는 구동부(280), 소정 정보를 영상으로 표시하는 디스플레이(292), 소정 정보를 오디오로 출력하는 오디오 출력부(291), 및, 전반적인 동작을 제어하는 제어부(240), 프로세서(260)를 포함할 수 있다.
도 12의 홈 어플라이언스(200)의 내부 블록도는, 도 11과 유사하나, 프로세서(260)가 더 구비되며, 오디오 입력부(220), 오디오 출력부(291), 통신부(270), 카메라(210), 및 프로세서(260)가 하나의 단일 모듈인 음성 모듈(205) 내에 구비되는 것에 그 차이가 있다.
한편, 프로세서(260)는, 오디오 입력부(220), 오디오 출력부(291), 통신부(270), 카메라(210) 등을 제어할 수 있다.
이하에서는, 도 11과의 차이를 중심으로 기술한다.
프로세서(260)는 오디오 입력부(220)를 통하여 수신되는 사용자의 음성 입력 신호를 처리하고 음성 인식 과정을 수행할 수 있다.
예를 들어, 기설정된 호출어를 포함하는 웨이크 업(wake up) 음성 신호가 수신되는 경우에, 프로세서(260)는 음성 명령어를 수신하기 위한 상태로 전환될 수 있다. 이 경우에, 프로세서(260)는 호출어 음성 입력 여부까지의 음성 인식 과정만 수행하고, 이후의 사용자 음성 입력에 대한 음성 인식은 음성 인식 서버 시스템(100)을 통하여 수행할 수 있다.
프로세서(260)는, 웨이크 업(wake up) 음성 신호의 인식 이후에 입력되는 사용자의 음성 명령을, 통신부(270)를 통하여, 음성 인식 서버 시스템(100)에 송신하도록 제어할 수 있다.
또한, 프로세서(260)는 통신부(270)를 통해 홈 어플라이언스(200)의 상태 정보, 사용자의 음성 명령 등을 음성 인식 서버 시스템(100) 등으로 전송할 수 있다.
한편, 통신부(270)를 통하여 제어 신호가 수신되면, 프로세서(260)는 제어 신호를 제어부(240)로 전송하고, 제어부(240)는 수신되는 제어 신호에 따라 동작하도록 홈 어플라이언스(200)를 제어할 수 있다.
결국, 음성 모듈(205)을 통해, 음성 데이터 획득, 서버 시스템(100)과의 통신, 및 대응하는 사운드 출력을 수행할 수 있게 된다.
한편, 음성 모듈(205)은, 도 2에서 도시한 홈 어플라이언스 외에, 다양한 전자 기기에 부착될 수 있다. 또는 다른 전자 기기에 부착되는 것 없이, 별도의 장치로서, 사용될 수도 있다.
도 13은 본 발명의 일 실시예에 따른 홈 어플라이언스의 동작 방법을 도시한 순서도이다.
도 13을 참조하면, 홈 어플라이언스(200)는, 사용자 입력에 의해, 음성 인식 기능을 활성화할 수 있다(S1310). 사용자 입력에 따라 홈 어플라이언스(200)의 제어부(240)는, 마이크(221, 222)를 활성화할 수 있다.
또는, 홈 어플라이언스(200)는 음성 인식 기능 활성화에 대한 설정에 따라서 자동으로 음성 인식 기능을 활성화할 수 있다.
예를 들어, 전원이 켜지면, 홈 어플라이언스(200)는 자동으로 마이크(221, 222)를 활성화하고, 음성 인식 기능을 활성화할 수 있다.
본 발명의 일 실시예에 따른 홈 어플라이언스(200)는, 음성 인식 과정 및 홈 어플라이언스 제어 과정 중에 발생할 수 있는 다양한 상황들을 고려한 사용자 경험(User Experience, UX)을 제공할 수 있다.
제어부(240)는 디스플레이(292)를 제어하여 음성 인식 과정 및 홈 어플라이언스 제어 과정의 각 단계에 대응하여 시각적 정보를 제공할 수 있다.
또한, 제어부(240)는 오디오 출력부(291)를 제어하여 음성 인식 과정 및 홈 어플라이언스 제어 과정의 각 단계에 대응하여 청각적 정보를 제공할 수 있다.
음성 인식 기능이 활성화되면, 상기 디스플레이(292)는, 상기 마이크 아이콘(1721)을 점등하여 표시하고, 제어부(240)는 기설정된 호출어를 포함하는 웨이크 업(wake up) 음성 신호의 입력을 위한 웨이크업 신호 대기 모드로 진입하도록 제어할 수 있다(S1315).
오디오 출력부(291)는 호출어를 포함하는 발화를 안내하는 음성 안내 메시지를 출력할 수 있다. 예를 들어, 호출어가 "LG 휘센"으로 설정되어 있다면, 오디오 출력부(291)는 "LG 휘센이라고 말하면 음성 인식 기능을 사용할 수 있습니다"와 같은 음성 안내 메시지를 음성 출력할 수 있다.
한편, 홈 어플라이언스의 마이크(221, 222)가 활성화된 상태에서, 사용자로부터 음성 입력이 수신되는 경우, 마이크(221, 222)는, 입력 음성을 수신하고, 이를 제어부(240)로 전달할 수 있다.
한편, 마이크(221, 222)를 통해 기설정된 호출어를 포함하는 웨이크 업(wake up) 음성 신호가 수신되는 경우에(S1320), 홈 어플라이언스(200)는 음성 명령어를 수신하기 위한 명령어 대기 모드로 전환될 수 있다(S1325). 마이크(221, 222)를 통해 기설정된 호출어를 포함하는 웨이크 업(wake up) 음성 신호가 수신되는 경우에(S1320), 제어부(240)는 명령어 대기 모드로 진입하도록 제어할 수 있다(S1325).
홈 어플라이언스(200)가 항상 자연어 명령어를 대기하게 되면, 음성인식 기능에서 소비하는 전력과 CPU 점유율 및 음성 인식 서버 시스템의 서버 부하에 부담이 된다.
따라서, 홈 어플라이언스(200)는 명령어 대기 상태에서 들어오는 음성 신호에 대해서만 서버로 전송할 수 있다.
또한, 홈 어플라이언스(200)는 명령어를 대기하는 시간에 조건을 주고 시간 내 명령 입력시 명령어 완료 시점까지는 소리를 받아서 서버로 전달할 수 있다.
본 발명의 일측에 따르면, 홈 어플라이언스(200)는 호출어 음성 입력 여부까지의 음성 인식 과정만 수행하고, 이후의 사용자 음성 입력에 대한 음성 인식은 음성 인식 서버 시스템(100)을 통하여 수행할 수 있다.
또는, 호출어 음성 입력 여부의 판단은 홈 어플라이언스(200)와 음성 인식 서버 시스템(100)에서 이중으로 수행될 수 있다. 이에 따라, 호출어 음성 입력 판단의 오인식을 줄이고, 인식률을 높일 수 있다.
한편, 상기 호출어는 제조사에 의해 설정될 수 있고, 홈 어플라이언스 별로 다른 호출어가 설정될 수 있다. 예를 들어, 공기조화기의 경우에는 "LG 휘센", 냉장고의 경우에는 "LG 디오스"가 호출어로 설정될 수 있다. 또한, 상기 호출어는 사용자에 의해 설정 변경이 가능하다.
한편, 상기 제어부(240)는, 웨이크 업(wake up) 음성 신호의 인식 이후에 입력되는 사용자의 음성 명령을, 통신부(270)를 통하여, 음성 인식 서버 시스템(100)에 송신하도록 제어할 수 있다(S1330).
한편, 사용자의 음성 명령을 무기한으로 기다리는 것은 시스템 자원이 낭비되고, 명령어를 입력하지 않는 사용자의 의도에도 부합하지 않으므로 명령어 대기 모드에서는 소정 경과 시간 동안에 입력되는 음성 명령만 처리하도록 설정될 수 있다(S1327).
이 경우에, 상기 제어부(240)는, 상기 기설정된 경과 시간 이내에 수신된 음성 명령을 포함하는 음성 데이터를 음성 서버(110)로 전송하도록 제어할 수 있다(S1330).
한편, 상기 기설정된 경과 시간 이내에 상기 음성 명령이 수신되지 않으면(S1327), 상기 제어부(240)는, 다시 상기 웨이크업 신호 대기 모드로 전환하도록 제어할 수 있다.
본 발명의 일 실시예에 따른 홈 어플라이언스(200)는 기설정된 경과 시간 이내에 음성 명령이 수신되면, 명령어를 수신하였음을 사용자에게 알리기 위하여, 구동부(280)가 명령어 수신에 대응하는 피드백 동작을 수행할 수 있다.
실시예에 따라서는, 상기 기설정된 경과 시간 이내에 상기 음성 명령이 수신되면(S1327), 홈 어플라이언스(200)가 명령어를 수신하였음을 사용자에게 알리기 위하여, 제어부(240)는 명령어 수신에 대응하는 피드백 동작을 수행하도록 제어할 수 있다.
이 경우에, 상기 제어부(240)의 제어에 따라, 구동부(280)는 기설정된 동작을 수행할 수 있다.
한편, 음성 서버(110) 및 이를 포함하는 음성 인식 서버 시스템(100)은 도 1 내지 도 9를 참조하여 설명한 것과 같이 홈 어플라이언스(200)로부터 수신되는 음성 명령을 포함하는 음성 데이터를 인식하고 처리할 수 있다.
이에 따라, 통신부(270)가 가전 제어 서버(130)로부터 상기 음성 명령에 기초한 제어 신호를 수신하면(S1340), 제어부(240)는 수신한 제어 신호에 대응하여 동작하도록 홈 어플라이언스(200)를 제어할 수 있다(S1345).
또한, 통신부(270)가 상기 음성 서버(110)로부터 상기 음성 명령에 기초한 응답 신호를 수신하면(S1350), 제어부(240)는 수신한 응답 신호에 대응하는 음성 안내 메시지를 출력하도록 오디오 출력부(291)를 제어할 수 있다(S1360).
실시예에 따라서는, 상기 통신부(270)를 통하여 상기 음성 서버(110)로부터 음성 인식 실패에 대응하는 신호를 수신할 수 있다. 이 경우에, 제어부(240)는 음성 명령의 재입력을 요청하는 음성 안내 메시지를 출력하도록 오디오 출력부(291)를 제어하고, 다시 상기 명령어 대기 모드로 전환하도록 제어할 수 있다.
또한, 판별된 음성 명령의 지원 가능 여부 판별에 따라서, 상기 통신부(270)를 통하여 상기 음성 서버(110)로부터 상기 음성 명령이 지원되지 않는 기능에 관한 것임을 알리는 신호를 수신할 수 있다(S1335). 이 경우에, 제어부(240)는 상기 음성 명령이 지원되지 않는 기능에 관한 것임을 알리는 음성 안내 메시지를 출력하도록 오디오 출력부(291)를 제어할 수 있다(S1337).
이 경우에, 제어부(240)는 웨이크업 신호 대기 모드로 전환하도록 제어할 수 있다. 또는, 제어부(240)는 다시 상기 명령어 대기 모드로 전환하도록 제어할 수 있다.
도 14와 도 15는 본 발명의 일 실시예에 따른 음성 인식 서버 시스템 및 홈 어플라이언스의 다양한 동작에 관한 설명에 참조되는 도면이다.
도 14를 참조하면, 사용자는 "절전 기능 켜줘"와 같은 자연어로 음성 명령(1410)을 입력할 수 있다. 마이크(221, 222)를 통하여 사용자의 음성 명령(1410)을 수신한 공기조화기(200a)는 음성 명령(1410)을 음성 인식 서버 시스템(100)의 음성 서버(110)에 전달할 수 있다.
음성 인식 서버 시스템(100)의 음성 서버(110)는 수신된 음성 명령(1410)을 분석하여 절전 기능을 원하는 사용자의 의도를 판별할 수 있다. 이에 따라, 음성 인식 서버 시스템(100)은 공기조화기(200a)로 절전 기능을 구동하라는 제어 신호와 해당 동작에 대응하는 응답 신호를 송신할 수 있다. 음성 서버(110)는 판별된 음성 명령을 가전 제어 서버(130)로 전달하고, 가전 제어 서버(130)는 판별된 음성 명령에 대응하는 신호를 공기조화기(200a)로 송신할 수 있다.
공기조화기(200a)는 절전 기능을 구동하고, 가전 제어 서버(130)로 처리 결과 정보를 응답할 수 있다.
가전 제어 서버(130)는 음성 서버(110)로 처리 결과 정보를 전달하고, 음성 서버(110)는, 처리 결과 정보에 대응하는 음원 파일을 공기조화기(200a)로 송신할 수 있다.
공기조화기(200a)는 수신한 음원 파일을 재생하여 "절전 기능을 시작합니다"와 같은 음성 안내 메시지(2420)를 출력할 수 있다.
도 15를 참조하면, 사용자는 "오늘 날씨 어때"와 같은 자연어로 음성 명령(1510)을 입력할 수 있다. 마이크(221, 222)를 통하여 사용자의 음성 명령(1510)을 수신한 공기조화기(200a)는 음성 명령(1510)을 음성 인식 서버 시스템(100)에 전달할 수 있다.
음성 인식 서버 시스템(100)의 음성 서버(110)는 수신된 음성 명령(1510)을 분석하여 날씨 정보를 원하는 사용자의 의도를 판별할 수 있다. 또한, 본 발명의 일 실시예에 따른 음성 인식 서버 시스템(100)은, 판별한 음성 명령이 홈 어플라이언스(200a)에 관한 것이 아니면, 외부 서비스 서버(121)와 통신하여 대응하는 동작을 수행할 수 있다.
음성 서버(110), 특히 자연어 처리 서버(112)는, 날씨 정보를 제공하는 외부 서비스 또는 인터넷 네트워크에 접속하여 날씨 정보를 요청, 수신할 수 있다.
또한, 음성 서버(110)는 외부 서비스 서버(121)로부터 수신한 날씨 정보에 기초한 데이터를 홈 어플라이언스(200a)로 송신할 수 있다.
공기조화기(200a)는 수신한 데이터에 기초하여 "서울은 오후부터 비가 내려요" 등 날씨 정보를 포함하는 음성 안내 메시지(1520)를 출력할 수 있다.
본 발명의 실시예들 중 적어도 하나에 의하면, 음성 입력에 따라 홈 어플라이언스가 동작함으로써, 사용자가 리모콘을 조작할 필요가 없어, 사용자 편의성을 증대시킬 수 있다.
또한, 본 발명의 실시예들 중 적어도 하나에 의하면, 효율적으로 자연어를 인식, 처리할 수 있다.
또한, 본 발명의 실시예들 중 적어도 하나에 의하면, 음성 인식 및 음성 인식 결과에 대응하는 제어를 수행함에 있어, 전체 과정의 속도를 향상하고, 서버 시스템 구성을 최적화함으로써, 사용자 편의성을 증대할 수 있다.
본 발명에 따른 음성 서버, 음성 인식 서버 시스템 및 홈 어플라이언스는 상기한 바와 같이 설명된 실시예들의 구성과 방법이 한정되게 적용될 수 있는 것이 아니라, 상기 실시예들은 다양한 변형이 이루어질 수 있도록 각 실시예들의 전부 또는 일부가 선택적으로 조합되어 구성될 수도 있다.
한편, 본 발명의 실시예에 따른 음성 서버, 음성 인식 서버 시스템 및 홈 어플라이언스의 동작 방법은, 프로세서가 읽을 수 있는 기록매체에 프로세서가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 프로세서가 읽을 수 있는 기록매체는 프로세서에 의해 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 프로세서가 읽을 수 있는 기록매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피디스크, 광 데이터 저장장치 등이 있으며, 또한, 인터넷을 통한 전송 등과 같은 캐리어 웨이브의 형태로 구현되는 것도 포함한다. 또한, 프로세서가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 프로세서가 읽을 수 있는 코드가 저장되고 실행될 수 있다.
또한, 이상에서는 본 발명의 바람직한 실시예에 대하여 도시하고 설명하였지만, 본 발명은 상술한 특정의 실시예에 한정되지 아니하며, 청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 기술분야에서 통상의 지식을 가진자에 의해 다양한 변형실시가 가능한 것은 물론이고, 이러한 변형실시들은 본 발명의 기술적 사상이나 전망으로부터 개별적으로 이해되어서는 안될 것이다.
음성 인식 서버 시스템: 100
음성 서버: 110
ASR 서버: 111
NLP 서버: 112
TTS 서버: 113
가전 제어 서버: 130
홈 어플라이언스: 200
음성 서버: 110
ASR 서버: 111
NLP 서버: 112
TTS 서버: 113
가전 제어 서버: 130
홈 어플라이언스: 200
Claims (15)
- 홈 어플라이언스로부터 음성 데이터를 수신하는 단계;
상기 수신한 음성 데이터를 텍스트(text) 데이터로 변환하는 단계;
상기 텍스트 데이터를 분석하여 음성 명령을 판별하는 단계;
상기 판별한 음성 명령에 기초하여, 상기 판별한 음성 명령에 대응하는 신호를 제1 서버 또는 제2 서버로 송신하는 단계;
상기 제1 서버 또는 상기 제2 서버로부터 상기 판별한 음성 명령에 기초하는 응답 신호를 수신하는 단계; 및,
상기 음성 명령에 기초하는 응답 신호를 음성 데이터로 변환하여 상기 홈 어플라이언스로 송신하는 단계;를 포함하는 음성 서버의 동작 방법. - 제1항에 있어서,
상기 응답 신호는 상기 판별한 음성 명령에 대응하는 처리 결과 정보를 포함하는 것을 특징으로 하는 음성 서버의 동작 방법. - 제1항에 있어서,
상기 판별한 음성 명령의 지원 가능 유무를 판별하는 단계;를 더 포함하는 음성 서버의 동작 방법. - 제3항에 있어서,
상기 판별한 음성 명령이 지원 불가능한 명령을 포함하고 있는 경우, 상기 홈 어플라이언스로 송신하는 음성 데이터는, 상기 판별한 음성 명령이 상기 홈 어플라이언스가 지원하지 않는 기능임을 알리는 신호인 것을 특징으로 하는 음성 서버의 동작 방법. - 홈 어플라이언스로부터 음성 데이터를 수신하고, 수신한 음성 데이터를 텍스트(text) 데이터로 변환하는 자동 음성 인식(Automatic Speech Recognition) 서버;
상기 자동 음성 인식 서버로부터 상기 텍스트 데이터를 수신하고, 수신한 텍스트 데이터를 분석하여 음성 명령을 판별하며, 상기 판별한 음성 명령에 대응하는 신호를 제1 서버 또는 제2 서버로 송신하고, 상기 제1 서버 또는 상기 제2 서버로부터 상기 판별한 음성 명령에 기초하는 응답 신호를 수신하는 자연어 처리(Natural Language Processing) 서버; 및,
상기 음성 명령에 기초하는 응답 신호를 음성 데이터로 변환하여 상기 홈 어플라이언스로 송신하는 텍스트 음성 변환(Text to Speech) 서버;를 포함하는 음성 서버. - 제5항에 있어서,
상기 응답 신호는 상기 판별한 음성 명령에 대응하는 처리 결과 정보를 포함하는 것을 특징으로 하는 음성 서버. - 음성 서버가 홈 어플라이언스로부터 수신한 음성 데이터를 분석하여 음성 명령을 판별하는 단계;
상기 판별한 음성 명령이 상기 홈 어플라이언스와 관련된 경우에, 상기 음성 서버가, 상기 판별한 음성 명령에 대응하는 신호를 가전 제어 서버로 송신하는 단계; 및,
상기 가전 제어 서버가 상기 판별한 음성 명령에 대응하는 제어 신호를 상기 홈 어플라이언스로 송신하는 단계;를 포함하는 음성 인식 서버 시스템의 동작 방법. - 제7항에 있어서,
상기 가전 제어 서버가, 상기 홈 어플라이언스로부터 상기 제어 신호에 대한 응답 신호를 수신하는 단계;
상기 음성 서버가 상기 음성 명령에 기초하는 처리 결과 정보를 포함하는 음성 데이터를 상기 홈 어플라이언스로 송신하는 단계;를 더 포함하는 음성 인식 서버 시스템의 동작 방법. - 제7항에 있어서,
상기 판별한 음성 명령이 외부 서비스와 관련된 경우에, 상기 음성 서버가, 상기 판별한 음성 명령에 대응하는 신호를 외부 서비스 서버로 송신하는 단계;
상기 음성 서버가, 상기 외부 서비스 서버로부터 상기 판별한 음성 명령에 대응하는 신호에 대한 응답 신호를 수신하는 단계;
상기 음성 서버가, 상기 응답 신호에 대응하는 처리 결과 정보를 상기 홈 어플라이언스로 송신하는 단계;를 더 포함하는 음성 인식 서버 시스템의 동작 방법. - 홈 어플라이언스로부터 음성 데이터를 수신하고, 수신한 음성 데이터를 분석하여 음성 명령을 판별하며, 상기 판별한 음성 명령이 상기 홈 어플라이언스와 관련된 경우에, 상기 판별한 음성 명령에 대응하는 신호를 가전 제어 서버로 송신하는 음성 서버; 및,
상기 판별한 음성 명령에 기초하는 제어 신호를 상기 홈 어플라이언스로 송신하는 가전 제어 서버;를 포함하고,
상기 음성 서버는 상기 음성 명령에 기초하는 처리 결과 정보를 포함하는 음성 데이터를 상기 홈 어플라이언스로 송신하는 것을 특징으로 하는 음성 인식 서버 시스템. - 제10항에 있어서,
상기 가전 제어 서버는, 상기 홈 어플라이언스로부터 상기 제어 신호에 대한 응답 신호를 수신하고, 상기 응답 신호에 대응하는 처리 결과 정보를 상기 음성 서버로 송신하는 것을 특징으로 하는 음성 인식 서버 시스템. - 제10항에 있어서,
상기 음성 서버는,
상기 홈 어플라이언스로부터 음성 데이터를 수신하고, 수신한 음성 데이터를 텍스트(text) 데이터로 변환하는 자동 음성 인식 서버;
상기 자동 음성 인식 서버로부터 상기 텍스트 데이터를 수신하고, 수신한 텍스트 데이터를 분석하여 음성 명령을 판별하며, 상기 판별한 음성 명령에 대응하는 신호를 상기 가전 제어 서버로 송신하고, 상기 가전 제어 서버로부터 상기 판별한 음성 명령에 기초하는 응답 신호를 수신하는 자연어 처리 서버, 및,
상기 음성 명령에 기초하는 응답 신호를 음성 데이터로 변환하여 상기 홈 어플라이언스로 송신하는 텍스트 음성 변환 서버를 포함하는 것을 특징으로 하는 음성 인식 서버 시스템. - 제10항에 있어서,
상기 음성 서버는, 상기 판별한 음성 명령에 대응하는 신호에 기초하여 상기 홈 어플라이언스의 상태 정보를 상기 가전 제어 서버로 요청하고,
상기 가전 제어 서버는, 상기 홈 어플라이언스의 상태 정보를 상기 홈 어플라이언스로부터 응답받아, 상기 음성 서버로 송신하는 것을 특징으로 하는 음성 인식 서버 시스템. - 제10항에 있어서,
상기 음성 서버는, 상기 판별한 음성 명령의 지원 가능 유무를 판별하는 것을 특징으로 하는 음성 인식 서버 시스템. - 제14항에 있어서,
상기 음성 서버는, 상기 판별한 음성 명령이 지원 불가능한 명령을 포함하고 있는 경우, 상기 판별한 음성 명령이 상기 홈 어플라이언스가 지원하지 않는 기능임을 알리는 음성 데이터를 상기 홈 어플라이언스로 송신하는 것을 특징으로 하는 음성 인식 서버 시스템.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020170151584A KR20190054707A (ko) | 2017-11-14 | 2017-11-14 | 음성 서버, 음성 인식 서버 시스템 및 그 동작 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020170151584A KR20190054707A (ko) | 2017-11-14 | 2017-11-14 | 음성 서버, 음성 인식 서버 시스템 및 그 동작 방법 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20190054707A true KR20190054707A (ko) | 2019-05-22 |
Family
ID=66680736
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020170151584A KR20190054707A (ko) | 2017-11-14 | 2017-11-14 | 음성 서버, 음성 인식 서버 시스템 및 그 동작 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR20190054707A (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021025350A1 (en) * | 2019-08-05 | 2021-02-11 | Samsung Electronics Co., Ltd. | Electronic device managing plurality of intelligent agents and operation method thereof |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR19990069703A (ko) | 1998-02-12 | 1999-09-06 | 윤종용 | 음성인식 기능을 갖는 공기조화기용 리모콘 |
KR20060015092A (ko) | 2004-08-13 | 2006-02-16 | 삼성전자주식회사 | 음성인식기능을 구비한 전기기기 및 그 제어방법 |
-
2017
- 2017-11-14 KR KR1020170151584A patent/KR20190054707A/ko active Search and Examination
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR19990069703A (ko) | 1998-02-12 | 1999-09-06 | 윤종용 | 음성인식 기능을 갖는 공기조화기용 리모콘 |
KR20060015092A (ko) | 2004-08-13 | 2006-02-16 | 삼성전자주식회사 | 음성인식기능을 구비한 전기기기 및 그 제어방법 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021025350A1 (en) * | 2019-08-05 | 2021-02-11 | Samsung Electronics Co., Ltd. | Electronic device managing plurality of intelligent agents and operation method thereof |
US11393474B2 (en) | 2019-08-05 | 2022-07-19 | Samsung Electronics Co., Ltd. | Electronic device managing plurality of intelligent agents and operation method thereof |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10692499B2 (en) | Artificial intelligence voice recognition apparatus and voice recognition method | |
KR101924963B1 (ko) | 홈 어플라이언스의 동작 방법 | |
KR101635068B1 (ko) | 로봇을 이용한 홈 네트워크 시스템 및 그 제어방법 | |
US9640174B2 (en) | Home appliance and operation method thereof | |
KR20180110979A (ko) | 음성 서버, 음성 인식 서버 시스템 및 그 동작 방법 | |
US20170126420A1 (en) | Method for controlling electronic device | |
US11429192B2 (en) | Confidence-based application-specific user interactions | |
KR101936639B1 (ko) | 홈 어플라이언스 및 홈 어플라이언스 시스템 | |
US10803863B2 (en) | Artificial intelligence voice recognition apparatus | |
KR102395013B1 (ko) | 인공지능 홈 어플라이언스 및 음성 인식 서버 시스템의 동작 방법 | |
GB2580518A (en) | Smart internet of things menus with cameras | |
KR20180110974A (ko) | 음성 서버, 음성 인식 서버 시스템 및 그 동작 방법 | |
CN111417004A (zh) | 图像显示设备及其操作方法 | |
KR20140089795A (ko) | 홈 어플라이언스 및 그 동작방법 | |
US12001614B2 (en) | Confidence-based application-specific user interactions | |
EP3721268B1 (en) | Confidence-based application-specific user interactions | |
KR20190026519A (ko) | 인공지능 공기조화기의 동작 방법 | |
KR101965880B1 (ko) | 음성 인식 방법 | |
KR101951328B1 (ko) | 공기조화기, 및 홈 어플라이언스 | |
KR101949363B1 (ko) | 홈 어플라이언스 및 그 동작 방법 | |
KR20190054707A (ko) | 음성 서버, 음성 인식 서버 시스템 및 그 동작 방법 | |
KR20190069380A (ko) | 음성 서버, 음성 인식 서버 시스템 및 그 동작 방법 | |
KR20190070906A (ko) | 음성 서버, 음성 인식 서버 시스템 및 그 동작 방법 | |
KR20180110973A (ko) | 홈 어플라이언스 및 그 동작 방법 | |
CN113039812A (zh) | 信息处理设备和信息处理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
AMND | Amendment | ||
E601 | Decision to refuse application | ||
AMND | Amendment |