KR102395013B1 - Method for operating artificial intelligence home appliance and voice recognition server system - Google Patents
Method for operating artificial intelligence home appliance and voice recognition server system Download PDFInfo
- Publication number
- KR102395013B1 KR102395013B1 KR1020170113550A KR20170113550A KR102395013B1 KR 102395013 B1 KR102395013 B1 KR 102395013B1 KR 1020170113550 A KR1020170113550 A KR 1020170113550A KR 20170113550 A KR20170113550 A KR 20170113550A KR 102395013 B1 KR102395013 B1 KR 102395013B1
- Authority
- KR
- South Korea
- Prior art keywords
- voice
- home appliance
- server
- signal
- voice recognition
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 68
- 238000013473 artificial intelligence Methods 0.000 title abstract 2
- 230000007958 sleep Effects 0.000 claims description 9
- 238000004891 communication Methods 0.000 description 55
- 230000008569 process Effects 0.000 description 42
- 238000003058 natural language processing Methods 0.000 description 41
- 230000004044 response Effects 0.000 description 38
- 230000006870 function Effects 0.000 description 25
- 238000012545 processing Methods 0.000 description 22
- 238000010586 diagram Methods 0.000 description 18
- 238000013528 artificial neural network Methods 0.000 description 16
- 238000005406 washing Methods 0.000 description 12
- 238000010411 cooking Methods 0.000 description 9
- 238000013135 deep learning Methods 0.000 description 9
- 238000013527 convolutional neural network Methods 0.000 description 8
- 239000000284 extract Substances 0.000 description 8
- 238000006243 chemical reaction Methods 0.000 description 7
- 238000010801 machine learning Methods 0.000 description 7
- 230000005236 sound signal Effects 0.000 description 6
- 230000007257 malfunction Effects 0.000 description 5
- 238000011017 operating method Methods 0.000 description 5
- 239000003507 refrigerant Substances 0.000 description 5
- 238000003860 storage Methods 0.000 description 5
- 230000000007 visual effect Effects 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 4
- 230000000306 recurrent effect Effects 0.000 description 4
- 230000008014 freezing Effects 0.000 description 3
- 238000007710 freezing Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000003915 air pollution Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 241000282412 Homo Species 0.000 description 1
- XUIMIQQOPSSXEZ-UHFFFAOYSA-N Silicon Chemical compound [Si] XUIMIQQOPSSXEZ-UHFFFAOYSA-N 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 239000002386 air freshener Substances 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 230000003925 brain function Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000001151 other effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 229910052710 silicon Inorganic materials 0.000 description 1
- 239000010703 silicon Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/26—Power supply means, e.g. regulation thereof
- G06F1/32—Means for saving power
- G06F1/3203—Power management, i.e. event-based initiation of a power-saving mode
- G06F1/3206—Monitoring of events, devices or parameters that trigger a change in power modality
- G06F1/3228—Monitoring task completion, e.g. by use of idle timers, stop commands or wait commands
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/04—Segmentation; Word boundary detection
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/28—Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
- H04L12/2803—Home automation networks
- H04L12/2816—Controlling appliance services of a home automation network by calling their functionalities
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Automation & Control Theory (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Health & Medical Sciences (AREA)
- Telephonic Communication Services (AREA)
- Selective Calling Equipment (AREA)
Abstract
본 발명의 일 측면에 따른 인공지능 홈 어플라이언스의 동작 방법은, 복수의 마이크(MIC)를 통하여 기설정된 호출어를 포함하는 음성 신호를 수신하는 단계, 복수의 마이크를 통하여 수신된 음성 신호 중 적어도 2 이상의 마이크를 통하여 수신된 음성 신호를 음성 인식 서버 시스템으로 전송하는 단계, 및, 음성 인식 서버 시스템으로부터 발화자의 음성 명령 입력 대기를 위한 웨이크 업 통보 신호를 수신하면, 기설정된 경과 시간 동안 발화자의 음성 명령 입력을 위한 명령어 대기 모드로 진입하는 단계를 포함함으로써, 사용자의 의도에 부합하지 않는 호출어 인식을 방지하고 음성 인식 성능을 향상할 수 있다.The method of operating an artificial intelligence home appliance according to an aspect of the present invention includes receiving a voice signal including a preset call word through a plurality of microphones (MIC), and at least two of the voice signals received through the plurality of microphones. Transmitting the voice signal received through the above microphone to the voice recognition server system, and receiving a wake-up notification signal for waiting for the speaker's voice command input from the voice recognition server system, the speaker's voice command for a preset elapsed time By including the step of entering the command standby mode for input, it is possible to prevent the recognition of a calling word that does not match the user's intention and improve the voice recognition performance.
Description
본 발명은 홈 어플라이언스, 음성 인식 서버 시스템 및 그 동작 방법에 관한 것으로, 더욱 상세하게는 사용자의 자연어 음성 명령을 인식하고, 동작할 수 있는 홈 어플라이언스, 음성 인식 서버 시스템 및 그 동작 방법에 관한 것이다.The present invention relates to a home appliance, a voice recognition server system, and an operating method thereof, and more particularly, to a home appliance capable of recognizing and operating a user's natural language voice command, a voice recognition server system, and an operating method thereof.
가정이나 사무실 등의 소정 공간에서 사용되는 공기조화기, 세탁기, 청소기 등 홈 어플라이언스(Home appliance)들은 각각 사용자의 조작에 따라 고유의 기능과 동작을 수행하였다.BACKGROUND ART Home appliances such as air conditioners, washing machines, and vacuum cleaners used in predetermined spaces such as homes or offices perform unique functions and operations according to user manipulation.
예를 들어, 공기조화기는 냉매를 압축하는 압축기와 압축된 냉매를 응축하는 응축기와 응축된 냉매를 팽창하는 팽창밸브와 팽창된 냉매를 실내공기와 열교환시키는 증발기를 포함하여 구성되어 실내공간을 냉난방하는 장치로, 실내 온도를 조정하는 기능을 수행한다.For example, the air conditioner is configured to include a compressor for compressing a refrigerant, a condenser for condensing the compressed refrigerant, an expansion valve for expanding the condensed refrigerant, and an evaporator for heat-exchanging the expanded refrigerant with indoor air. A device that performs the function of adjusting the room temperature.
또한, 냉장고는 음식물을 저장하고, 세탁기는 세탁물을 처리하며, 청소기는 청소 기능, 조리기기는 음식물을 조리하는 기능 등을 수행한다.In addition, the refrigerator stores food, the washing machine processes laundry, the vacuum cleaner performs a cleaning function, and the cooking appliance performs a function of cooking food.
이러한 홈 어플라이언스의 동작을 위해서, 사용자는, 홈 어플라이언스 본체에 구비된 버튼 등을 직접 조작하거나, 매번 본체로 이동하여 입력하여야 하는 불편함을 피해 리모콘 등의 원격제어장치를 사용할 수 있다.For the operation of the home appliance, a user may directly manipulate a button provided on the main body of the home appliance, or use a remote control device such as a remote control to avoid the inconvenience of having to move to the main body and input each time.
하지만, 리모콘을 사용하는 경우에도, 사용자가 기능별로 조작키를 선택하여 입력해야 하므로, 그 사용이 불편하고, 실내가 어두울 경우 리모콘 및 조작키를 식별하기 위한 별도의 조명이 필요하게 되는 문제점이 있었다.However, even in the case of using the remote control, since the user has to select and input operation keys for each function, the use is inconvenient, and when the room is dark, there is a problem in that a separate light is required to identify the remote control and operation keys. .
따라서, 음성인식 기술을 이용하여 홈 어플라이언스를 제어하는 방안에 대한 연구가 증가하고 있다.Accordingly, research on a method of controlling a home appliance using a voice recognition technology is increasing.
한편, 음성인식 기술을 이용한 홈 어플라이언스 제어에 있어서, 정확한 음성 인식을 위해, 사용자가 기설정된 호출어를 발화한 후에, 입력하는 음성에 대해서 음성 인식 후 인식 결과에 따라 동작하는 경우가 많았다.On the other hand, in home appliance control using voice recognition technology, for accurate voice recognition, after the user utters a preset call word, the input voice is often operated according to the recognition result after voice recognition.
하지만, 음성으로 제어 가능한 기기가 증가함에 따라, 복수의 기기가 동일한 호출어가 설정될 수 있다.However, as the number of voice-controllable devices increases, a plurality of devices may set the same call word.
이 경우에, 사용자의 호출어 발화로 복수의 기기가 자연어 음성 명령을 받을 준비가 되도록 웨이크 업(wake-up)된다. In this case, the plurality of devices are woken up to be ready to receive the natural language voice command by the user's utterance of the calling word.
이에 따라, 사용자의 음성 명령 발화 후, 복수의 기기가 음성 인식을 시도하고, 동일한 명령을 수행하게 되므로, 시스템 과부하나 중복 제어로 인한 오동작 발생의 위험이 커질 수 있고, 음성 오인식의 위험도 커질 수 있다.Accordingly, after the user's voice command is uttered, since a plurality of devices attempt voice recognition and perform the same command, the risk of malfunction due to system overload or redundant control may increase, and the risk of voice misrecognition may increase. .
따라서, 동일한 호출어를 사용하는 기기들을 효과적으로 제어할 수 있는 방안이 요구된다.Accordingly, there is a need for a method for effectively controlling devices using the same call word.
본 발명의 목적은, 동일한 호출어를 사용하는 홈 어플라이언스들을 효과적으로 제어할 수 있는 홈 어플라이언스, 음성 인식 서버 시스템 및 그 동작 방법을 제공함에 있다.SUMMARY OF THE INVENTION It is an object of the present invention to provide a home appliance, a voice recognition server system, and an operating method thereof that can effectively control home appliances using the same call word.
본 발명의 목적은, 효율적으로 자연어를 인식, 처리할 수 있는 홈 어플라이언스, 음성 인식 서버 시스템 및 그 동작 방법을 제공함에 있다.SUMMARY OF THE INVENTION It is an object of the present invention to provide a home appliance, a voice recognition server system, and an operating method thereof that can efficiently recognize and process natural language.
본 발명의 목적은, 사용자의 음성 명령을 인식하여 제어 가능한 홈 어플라이언스 및 음성 인식 서버 시스템을 제공함에 있다.An object of the present invention is to provide a home appliance and a voice recognition server system that can be controlled by recognizing a user's voice command.
본 발명의 목적은, 음성 인식 과정에서 발생할 수 있는 오인식, 오동작을 방지할 수 있는 홈 어플라이언스, 음성 인식 서버 시스템 및 그 동작 방법을 제공함에 있다.SUMMARY OF THE INVENTION It is an object of the present invention to provide a home appliance, a voice recognition server system, and an operating method thereof that can prevent erroneous recognition and malfunction that may occur in a voice recognition process.
상기 또는 다른 목적을 달성하기 위해 본 발명의 일 측면에 따른 홈 어플라이언스의 동작 방법은, 복수의 마이크(MIC)를 통하여 기설정된 호출어를 포함하는 음성 신호를 수신하는 단계, 복수의 마이크를 통하여 수신된 음성 신호 중 적어도 2이상의 마이크를 통하여 수신된 음성 신호를 음성 인식 서버 시스템으로 전송하는 단계, 및, 음성 인식 서버 시스템으로부터 발화자의 음성 명령 입력 대기를 위한 웨이크 업 통보 신호를 수신하면, 기설정된 경과 시간 동안 발화자의 음성 명령 입력을 위한 명령어 대기 모드로 진입하는 단계를 포함함으로써, 사용자의 의도에 부합하지 않는 호출어 인식을 방지하고 음성 인식 성능을 향상할 수 있다.In order to achieve the above or other object, a method of operating a home appliance according to an aspect of the present invention includes receiving a voice signal including a preset call word through a plurality of microphones (MIC), receiving through a plurality of microphones Transmitting a voice signal received through at least two or more microphones among the voice signals to the voice recognition server system, and receiving a wake-up notification signal for waiting for the speaker's voice command input from the voice recognition server system By including the step of entering a command standby mode for inputting a voice command of the speaker for a period of time, it is possible to prevent recognition of a calling word inconsistent with the user's intention and improve voice recognition performance.
상기 또는 다른 목적을 달성하기 위해 본 발명의 일 측면에 따른 음성 인식 서버 시스템의 동작 방법은, 복수의 홈 어플라이언스가 각각 구비하는 복수의 마이크(MIC)를 통하여 입력된 호출어를 포함하는 음성 신호를 복수의 홈 어플라이언스로부터 수신하는 단계, 복수의 마이크를 통하여 입력된 음성 신호의 시간차에 기초하여, 복수의 홈 어플라이언스에 대한 발화자의 방향성 정보를 판별하는 단계, 방향성 정보에 기초하여, 복수의 홈 어플라이언스 중 하나의 홈 어플라이언스를 선택하는 단계, 및, 선택된 홈 어플라이언스로 발화자의 음성 명령 입력 대기를 위한 웨이크 업 통보 신호를 전송하는 단계를 포함함으로써, 사용자의 의도에 부합하지 않는 호출어 인식을 방지하고 음성 인식 성능을 향상할 수 있다.In order to achieve the above or other object, a method of operating a voice recognition server system according to an aspect of the present invention receives a voice signal including a call word input through a plurality of microphones (MICs) provided in a plurality of home appliances, respectively. Receiving from a plurality of home appliances, based on the time difference of voice signals input through the plurality of microphones, determining the direction information of the talker for the plurality of home appliances, based on the direction information, among the plurality of home appliances Selecting one home appliance, and transmitting a wake-up notification signal for waiting for input of a voice command of a speaker to the selected home appliance, thereby preventing call word recognition inconsistent with the user's intention and voice recognition performance can be improved.
본 발명의 실시예들 중 적어도 하나에 의하면, 동일한 호출어를 사용하는 홈 어플라이언스들을 효과적으로 제어할 수 있다.According to at least one of the embodiments of the present invention, it is possible to effectively control home appliances using the same call word.
또한, 본 발명의 실시예들 중 적어도 하나에 의하면, 음성 입력에 따라 홈 어플라이언스가 동작함으로써, 사용자가 리모콘을 조작할 필요가 없어, 사용자 편의성을 증대시킬 수 있다.In addition, according to at least one of the embodiments of the present invention, since the home appliance operates according to a voice input, the user does not need to operate the remote control, thereby increasing user convenience.
또한, 본 발명의 실시예들 중 적어도 하나에 의하면, 효율적으로 자연어를 인식, 처리할 수 있다.In addition, according to at least one of the embodiments of the present invention, it is possible to efficiently recognize and process natural language.
또한, 본 발명의 실시예들 중 적어도 하나에 의하면, 음성 인식 과정에서 발생할 수 있는 오인식, 오동작을 방지할 수 있다.Also, according to at least one of the embodiments of the present invention, it is possible to prevent erroneous recognition and malfunction that may occur during the speech recognition process.
한편, 그 외의 다양한 효과는 후술될 본 발명의 실시예에 따른 상세한 설명에서 직접적 또는 암시적으로 개시될 것이다.On the other hand, various other effects will be disclosed directly or implicitly in the detailed description according to the embodiment of the present invention to be described later.
도 1은 본 발명의 일 실시예에 따른 음성 인식 서버 시스템 및 홈 어플라이언스를 포함하는 스마트 홈 시스템을 간략히 도시한 도면이다.
도 2는 홈 어플라이언스의 다양한 예를 설명하는 도면이다.
도 3a는 본 발명의 일 실시예에 따른 음성 인식 서버 시스템의 일예이다.
도 3b는 본 발명의 일 실시예에 따른 음성 인식 서버 시스템의 일예이다.
도 4는 본 발명의 일 실시예에 따른 서버의 내부 블록도의 일예를 도시한 도면이다.
도 5는 본 발명의 일 실시예에 따른 홈 어플라이언스의 내부 블록도의 일예를 도시한 도면이다.
도 6은 본 발명의 일 실시예에 따른 홈 어플라이언스의 내부 블록도의 일예를 도시한 도면이다.
도 7은 본 발명의 일 실시예에 따른 홈 어플라이언스의 동작 방법을 도시한 순서도이다.
도 8은 본 발명의 일 실시예에 따른 홈 어플라이언스 및 음성 인식 서버 시스템의 개념도이다.
도 9는 본 발명의 일 실시예에 따른 홈 어플라이언스의 동작 방법을 도시한 순서도이다.
도 10은 본 발명의 일 실시예에 따른 음성 인식 서버 시스템의 동작 방법을 도시한 순서도이다.
도 11은 본 발명의 일 실시예에 따른 홈 어플라이언스와 음성 인식 서버 시스템의 동작 방법을 도시한 순서도이다.
도 12는 본 발명의 일 실시예에 따른 음성 인식 서버 시스템의 동작예이다.1 is a diagram schematically illustrating a smart home system including a voice recognition server system and a home appliance according to an embodiment of the present invention.
2 is a view for explaining various examples of a home appliance.
3A is an example of a voice recognition server system according to an embodiment of the present invention.
3B is an example of a voice recognition server system according to an embodiment of the present invention.
4 is a diagram illustrating an example of an internal block diagram of a server according to an embodiment of the present invention.
5 is a diagram illustrating an example of an internal block diagram of a home appliance according to an embodiment of the present invention.
6 is a diagram illustrating an example of an internal block diagram of a home appliance according to an embodiment of the present invention.
7 is a flowchart illustrating a method of operating a home appliance according to an embodiment of the present invention.
8 is a conceptual diagram of a home appliance and a voice recognition server system according to an embodiment of the present invention.
9 is a flowchart illustrating a method of operating a home appliance according to an embodiment of the present invention.
10 is a flowchart illustrating a method of operating a voice recognition server system according to an embodiment of the present invention.
11 is a flowchart illustrating a method of operating a home appliance and a voice recognition server system according to an embodiment of the present invention.
12 is an operation example of a voice recognition server system according to an embodiment of the present invention.
이하에서는 첨부한 도면을 참조하여 본 발명의 실시예를 상세하게 설명한다. 그러나 본 발명이 이러한 실시예에 한정되는 것은 아니며 다양한 형태로 변형될 수 있음은 물론이다. Hereinafter, embodiments of the present invention will be described in detail with reference to the accompanying drawings. However, it goes without saying that the present invention is not limited to these embodiments and may be modified in various forms.
도면에서는 본 발명을 명확하고 간략하게 설명하기 위하여 설명과 관계없는 부분의 도시를 생략하였으며, 명세서 전체를 통하여 동일 또는 극히 유사한 부분에 대해서는 동일한 도면 참조부호를 사용한다. In the drawings, in order to clearly and briefly describe the present invention, the illustration of parts irrelevant to the description is omitted, and the same reference numerals are used for the same or extremely similar parts throughout the specification.
한편, 이하의 설명에서 사용되는 구성요소에 대한 접미사 "모듈" 및 "부"는 단순히 본 명세서 작성의 용이함만이 고려되어 부여되는 것으로서, 그 자체로 특별히 중요한 의미 또는 역할을 부여하는 것은 아니다. 따라서, 상기 "모듈" 및 "부"는 서로 혼용되어 사용될 수도 있다.On the other hand, the suffixes "module" and "part" for the components used in the following description are given simply in consideration of the ease of writing the present specification, and do not give a particularly important meaning or role by themselves. Accordingly, the terms “module” and “unit” may be used interchangeably.
도 1은 본 발명의 일 실시예에 따른 음성 인식 서버 시스템 및 홈 어플라이언스를 포함하는 스마트 홈 시스템을 간략히 도시한 도면이고 도 2는 홈 어플라이언스의 다양한 예를 설명하는 도면이다. 1 is a diagram schematically illustrating a smart home system including a voice recognition server system and a home appliance according to an embodiment of the present invention, and FIG. 2 is a diagram illustrating various examples of the home appliance.
도 1을 참조하면, 본 발명의 일 실시예에 따른 스마트 홈 시스템(10)은, 통신 모듈(미도시)을 구비하여 다른 기기와 통신하거나 네트워크에 접속할 수 있는 홈 어플라이언스(home appliance, 200)와 음성 인식 및 가전 제어를 위한 복수의 서버를 포함하는 음성 인식 서버 시스템(100)을 포함하여 구성될 수 있다.Referring to FIG. 1 , a
도 2를 참조하면, 홈 어플라이언스(200)에는 통신 모듈을 구비한 공기조화기(200a), 로봇청소기(200b), 냉장고(200c), 세탁기(200d), 조리기기(200e) 등이 해당될 수 있다.Referring to FIG. 2 , the
또한, 본 발명의 일 실시예에 따른 스마트 홈 시스템(10)은, 스마트 폰(smart phone), 태블릿(Tablet) PC 등 휴대 단말기(미도시)를 포함할 수 있다.In addition, the
홈 어플라이언스(200)는 내부에 통신 모듈을 구비하여 스마트 홈 시스템(10) 내/외부의 전자기기들과 통신할 수 있다. The
본 발명의 일 실시예에 따른 스마트 홈 시스템(10)은 액세스 포인트(access point: AP) 장치(300)를 더 포함할 수 있고, 홈 어플라이언스(200)는 액세스 포인트 장치(300)를 통하여 무선 인터넷 네트워크에 접속하여 다른 기기들과 통신할 수 있다.The
액세스 포인트 장치(300)는 스마트 홈 시스템(10) 내의 전자 기기들에, 소정 통신 방식에 의한 무선 채널을 할당하고, 해당 채널을 통해, 무선 데이터 통신을 수행할 수 있다. The
여기서, 소정 통신 방식은, 와이파이(Wi-Fi) 통신 방식일 수 있다. 이에 대응하여, 홈 어플라이언스(200)가 구비하는 통신 모듈은 와이파이 통신 모듈일 수 있으나, 본 발명은 통신 방식에 한정되지 않는다.Here, the predetermined communication method may be a Wi-Fi communication method. Correspondingly, the communication module provided in the
또는, 홈 어플라이언스(200)는 다른 종류의 통신 모듈을 구비하거나 복수의 통신 모듈을 구비할 수 있다. 예를 들어, 홈 어플라이언스(200)는 NFC 모듈, 지그비(zigbee) 통신 모듈, 블루투스(Bluetooth™) 통신 모듈 등을 포함할 수 있다.Alternatively, the
홈 어플라이언스(200)는 와이파이(wi-fi) 통신 모듈 등을 통해 음성 인식 서버 시스템(100)에 포함되는 서버 또는 외부의 소정 서버, 사용자의 휴대 단말기 등과 연결 가능하고, 원격 모니터링, 원격 제어 등 스마트 기능을 지원할 수 있다.The
사용자는 휴대 단말기를 통하여 스마트 홈 시스템(10) 내의 홈 어플라이언스(200)에 관한 정보를 확인하거나 홈 어플라이언스(200)를 제어할 수 있다.The user may check information on the
한편, 사용자가 가정 내에서 홈 어플라이언스(200)를 제어하거나 소정 정보를 확인하고자 하는 경우에도 휴대 단말기를 반드시 이용해야 하는 것은 불편할 수 있다.Meanwhile, even when a user wants to control the
예를 들어, 사용자가 휴대 단말기의 현재 위치를 모르거나 다른 장소에 있는 경우에 다른 방식으로 홈 어플라이언스(200)를 제어할 수 있는 수단이 있는 것이 더 효율적이다.For example, if the user does not know the current location of the mobile terminal or is in another location, it is more efficient to have a means for controlling the
본 발명의 일 실시예에 따른 홈 어플라이언스(200)는 사용자의 음성 입력을 수신할 수 있고, 음성 인식 서버 시스템(100)은 사용자의 음성 입력을 인식, 분석하여 홈 어플라이언스(200)를 제어할 수 있다.The
이에 따라, 사용자는 휴대 단말기, 원격제어장치를 조작하지 않고서도 홈 어플라이언스(200)를 제어할 수 있다.Accordingly, the user can control the
한편, 상기 음성 인식 서버 시스템(100)에 포함되는 서버들 중 적어도 일부는 홈 어플라이언스의 제조 회사, 판매 회사가 운영하는 서버이거나 제조 회사 또는 판매 회사가 서비스를 위탁한 회사가 운영하는 서버일 수 있다. On the other hand, at least some of the servers included in the voice
도 3a는 본 발명의 일 실시예에 따른 음성 인식 서버 시스템의 일예이다.3A is an example of a voice recognition server system according to an embodiment of the present invention.
도 3a를 참조하면, 본 발명의 일 실시예에 따른 음성 인식 서버 시스템은, 홈 어플라이언스(200a)로부터 음성 데이터를 수신하고, 수신한 음성 데이터를 분석하여 음성 명령을 판별하는 음성 서버(110)를 포함할 수 있다. Referring to FIG. 3A , the voice recognition server system according to an embodiment of the present invention includes a
음성 서버(110)는, 홈 어플라이언스(200a)로부터 음성 데이터를 수신하고, 상기 수신한 음성 데이터를 텍스트(text) 데이터로 변환하며, 텍스트 데이터를 분석하여 음성 명령을 판별할 수 있다.The
또한, 음성 서버(110)는, 판별한 음성 명령에 대응하는 신호를 소정 서버로 송신할 수 있다.Also, the
예를 들어, 본 발명의 일 실시예에 따른 음성 인식 서버 시스템은 상기 음성 서버(110)로부터 상기 판별한 음성 명령에 대응하는 신호를 수신하고, 상기 판별한 음성 명령에 대응하는 요청 신호를 생성하는 연계 서비스 서버(120)와 상기 연계 서비스 서버(120)로부터 수신되는 요청 신호에 기초하는 제어 신호를 상기 홈 어플라이언스(200a)로 송신하는 가전 제어 서버(130)를 포함할 수 있다.For example, the voice recognition server system according to an embodiment of the present invention receives a signal corresponding to the determined voice command from the
상기 홈 어플라이언스(200a)는 사용자가 발화한 음성 명령 입력을 수신하여 수신한 음성 명령 입력에 기초한 음성 데이터를 상기 음성 서버(110)로 송신할 수 있다.The
상기 음성 서버(110)는, 홈 어플라이언스(200a)로부터 음성 데이터를 수신하고, 수신한 음성 데이터를 텍스트(text) 데이터로 변환하는 자동 음성 인식(Automatic Speech Recognition: ASR) 서버(111), 상기 자동 음성 인식 서버(111)로부터 상기 텍스트 데이터를 수신하고, 수신한 텍스트 데이터를 분석하여 음성 명령을 판별하며, 상기 판별한 음성 명령에 기초하는 응답 신호를 상기 홈 어플라이언스(200a)로 송신하는 자연어 처리(Natural Language Processing: NLP) 서버(112), 및, 상기 홈 어플라이언스(200a)로부터 상기 응답 신호에 대응하는 텍스트를 포함하는 신호를 수신하고, 수신한 신호에 포함되는 텍스트를 음성 데이터로 변환하여 상기 홈 어플라이언스(200a)로 송신하는 텍스트 음성 변환(Text to Speech: TTS) 서버(113)를 포함할 수 있다.The
상기 자동 음성 인식 서버(111)는 홈 어플라이언스(200a)로부터 수신한 음성 데이터에 대하여 음성 인식을 수행하여 텍스트 데이터를 생성하여 상기 자연어 처리 서버(112)로 송신할 수 있다.The automatic
상기 자연어 처리 서버(112)는 상기 자동 음성 인식 서버(111)로부터 수신한 텍스트 데이터를 자연어 처리 알고리즘에 따라 분석하여 음성 명령을 판별할 수 있다. The natural
상기 자연어 처리 서버(112)는 자연어 처리 알고리즘에 따라 사람이 일상적으로 사용하고 있는 언어인 자연어를 처리할 수 있고, 사용자의 의도(intent)를 분석할 수 있다. 상기 자연어 처리 서버(112)는 상기 자동 음성 인식 서버(111)로부터 수신한 텍스트 데이터에 대하여 자연어 처리를 수행하여 사용자의 의도에 부합하는 음성 명령을 판별할 수 있다.The natural
이에 따라, 상기 자연어 처리 서버(112)는 사용자가 일상적인 사용 언어로 음성 명령을 입력하더라도 사용자의 의도에 부합하는 음성 명령을 판별할 수 있다. Accordingly, the natural
상기 자연어 처리 서버(112)는 자연어 처리 결과에 대응하는 신호, 즉, 판별한 음성 명령에 대응하는 신호를 상기 연계 서비스 서버(120)로 송신할 수 있다.The natural
상기 연계 서비스 서버(120)는, 상기 자연어 처리 서버(112)로부터 상기 판별한 음성 명령에 대응하는 신호를 수신할 수 있다.The linked
상기 연계 서비스 서버(120)는 판별한 음성 명령이 홈 어플라이언스(200a)에 관한 것이면, 상기 가전 제어 서버(130)와 통신하여 대응하는 동작을 수행할 수 있다.If the determined voice command relates to the
또는, 상기 연계 서비스 서버(120)는 판별한 음성 명령이 홈 어플라이언스(200a)에 관한 것이 아니면, 외부의 외부 서비스(121)와 통신하여 대응하는 동작을 수행할 수 있다.Alternatively, if the determined voice command is not related to the
예를 들어, 상기 연계 서비스 서버(120)는 판별한 음성 명령이 날씨, 주식, 뉴스 등의 정보를 요청하는 명령이면, 요청된 정보에 대응하는 서비스를 제공하는 서버로 해당 정보를 요청하고 수신할 수 있다.For example, if the determined voice command is a command for requesting information such as weather, stock, news, etc., the linked
또한, 상기 연계 서비스 서버(120)는 수신한 정보를 음성 서버(110)로 송신할 수 있고, 상기 자연어 처리 서버(112)는 수신한 정보를 홈 어플라이언스(200a)로 전달할 수 있다.In addition, the linked
상기 연계 서비스 서버(120)는 판별한 음성 명령이 홈 어플라이언스(200a)에 관한 것이면, 상기 판별한 음성 명령에 대응하는 요청 신호를 생성하여 상기 가전 제어 서버(130)로 송신할 수 있다.If the determined voice command relates to the
상기 가전 제어 서버(130)는, 상기 연계 서비스 서버(120)로부터 수신되는 요청 신호에 기초하는 제어 신호를 상기 홈 어플라이언스(200a)로 송신할 수 있다.The home
예를 들어, 공기조화기(200a)의 설정 온도를 변경하는 요청이 수신되면, 상기 가전 제어 서버(130)는 상기 공기조화기(200a)로 설정 온도를 변경하는 제어 신호를 송신할 수 있다.For example, when a request to change the set temperature of the
한편, 홈 어플라이언스(200a)는 상기 가전 제어 서버(130)로부터 수신한 제어 신호에 따라 대응하는 동작을 수행할 수 있다. On the other hand, the home appliance (200a) may perform a corresponding operation according to the control signal received from the home appliance control server (130).
또한, 홈 어플라이언스(200a)는 요청받은 동작을 수행한 후 동작을 수행하였음을 알리는 신호를 상기 가전 제어 서버(130)로 송신할 수 있다.In addition, the
또한, 상기 가전 제어 서버(130)는, 상기 홈 어플라이언스(200a)로부터 상기 제어 신호에 대한 응답 신호를 수신하고, 상기 응답 신호에 대응하는 처리 결과 정보를 상기 연계 서비스 서버(120)로 송신할 수 있다.In addition, the home
상기 음성 서버(110)는, 상기 처리 결과 정보를 포함하는 응답 신호를 상기 홈 어플라이언스(200a)로 송신할 수 있다.The
또한, 상기 음성 서버(110)는, 상기 홈 어플라이언스(200a)로부터 상기 처리 결과 정보에 대응하는 출력 문구 텍스트를 포함하는 신호를 수신하고, 상기 수신한 출력 문구 텍스트를 음성 데이터로 변환하여 상기 홈 어플라이언스(200a)로 전송할 수 있다.In addition, the
이 경우에, 상기 자연어 처리 서버(112)가 상기 홈 어플라이언스(200a)로 송신하는 상기 판별한 음성 명령에 기초하는 응답 신호는, 상기 처리 결과 정보를 포함할 수 있다.In this case, the response signal based on the determined voice command transmitted from the natural
한편, 홈 어플라이언스(200a)는 상기 자연어 처리 서버(112)로부터 상기 판별한 음성 명령에 기초하는 응답 신호를 수신할 수 있다. 여기서, 응답 신호를 상기 판별한 음성 명령에 대응하는 응답의 텍스트 데이터를 포함할 수 있다.Meanwhile, the
예를 들어, 사용자가 공기조화기의 설정 온도를 변경하는 음성 명령을 입력한 경우에, 상기 응답 신호는 설정 온도를 변경하였음을 나타내는 텍스트 데이터를 포함할 수 있다.For example, when the user inputs a voice command for changing the set temperature of the air conditioner, the response signal may include text data indicating that the set temperature has been changed.
한편, 홈 어플라이언스(200a)는 수신한 응답 신호에 대응하는 텍스트를 포함하는 신호를 상기 텍스트 음성 변환 서버(113)로 송신할 수 있다. 여기서, 상기 응답 신호에 대응하는 텍스트를 포함하는 신호는 상기 처리 결과 정보에 대응하는 출력 문구 텍스트를 포함할 수 있다.Meanwhile, the
한편, 상기 텍스트 음성 변환 서버(113)는 수신한 신호에 포함되는 텍스트를 음성 데이터로 변환하여 상기 홈 어플라이언스(200a)로 송신할 수 있다. 여기서 변환된 음성 데이터는 음원 파일을 포함할 수 있다. Meanwhile, the text-to-
상기 홈 어플라이언스(200a)는 스피커를 통하여 수신한 음성 데이터에 기초한 음성 안내 메시지를 출력할 수 있다.The
한편, 상기 연계 서비스 서버(120)는, 상기 판별한 음성 명령에 대응하는 신호에 기초하여 상기 홈 어플라이언스(200a)의 상태 정보를 상기 가전 제어 서버(130)로 요청하고, 상기 가전 제어 서버(130)는, 상기 홈 어플라이언스(200a)의 상태 정보를 상기 연계 서비스 서버(120)로 송신할 수 있다. 상기 가전 제어 서버(130)는, 상기 홈 어플라이언스(200a)의 상태 정보가 확보되어 있는 상태가 아닌 경우에는, 상기 홈 어플라이언스(200a)로 상태 정보를 요청하여 수신할 수 있다.Meanwhile, the linked
한편, 상기 연계 서비스 서버(120)는, 상기 홈 어플라이언스(200a)의 상태 정보에 기초하여 상기 판별한 음성 명령의 지원이 가능한 경우에, 상기 가전 제어 서버(130)로 상기 판별한 음성 명령에 대응하는 요청 신호를 송신할 수 있다.On the other hand, the linked
또는, 상기 연계 서비스 서버(120)는, 상기 홈 어플라이언스(200a)의 상태 정보에 기초하여 상기 판별한 음성 명령의 지원이 불가능한 경우에, 상기 자연어 처리 서버(112)로 현재 상태에서 지원되지 않는 기능임을 알리는 신호를 송신할 수 있다.Alternatively, when the linked
이 경우에도, 홈 어플라이언스(200a)는 상기 텍스트 음성 변환 서버(113)로 음성 데이터를 요청, 수신하여, 현재 상태에서 지원되지 않는 기능임을 알리는 음성 안내 메시지를 출력할 수 있다.Even in this case, the
실시예에 따라서는, 상기 음성 서버(110)가, 상기 판별한 음성 명령의 지원 가능 유무를 판별할 수 있다. 예를 들어, 사용자의 음성 명령의 의도를 분석한 상기 자연어 처리 서버(112)가, 상기 판별한 음성 명령의 지원 가능 유무를 판별할 수 있다. According to an embodiment, the
이 경우에, 상기 판별한 음성 명령이 지원 불가능한 명령을 포함하고 있는 경우, 상기 자연어 처리 서버(112)가 송신하는 상기 판별한 음성 명령에 기초하는 응답 신호는 상기 판별한 음성 명령이 상기 홈 어플라이언스(200a)가 지원하지 않는 기능임을 알리는 신호일 수 있다.In this case, when the determined voice command includes a command that cannot be supported, a response signal based on the determined voice command transmitted by the natural
본 발명의 일 실시예에 따른 음성 서버(110) 및 이를 포함하는 음성 인식 서버 시스템(100)은, 자연어 음성처리를 위해 여러 역할을 하는 서버를 유기적으로 연결하여 이용할 수 있다.The
홈 어플라이언스(200)는 음성 명령의 수신 및 전처리, 서버 전송까지의 동작을 수행하고, 음성 서버(110)는, 음성/텍스트 변환, 의도분석, 명령 식별 등 자연어 처리 과정을 수행할 수 있다.The
음성 서버(110)가 자연어 처리를 수행함으로써, 홈 어플라이언스 내부 임베디드 모듈의 CPU, 메모리 등의 부담을 감소시킬 수 있다.Since the
한편, 연계 서비스 서버(120)는 외부 서비스 및 가전 제어 서버(130)와 통신하여 사용자의 음성 명령에 기초한 동작을 수행할 수 있다.Meanwhile, the linked
한편, 홈 어플라이언스(200)는 음성 서버(110)로부터 음원 파일을 포함하는 음성 데이터를 수신하여, 음성 안내 메시지를 오디오로 출력함으로써, 청각적 피드백으로 사용자의 음성 입력에 화답할 수 있다.Meanwhile, the
홈 어플라이언스(200)는 음성 서버(110)로부터 음성 파일을 스트리밍으로 전달 받아 사용자에게 음성 안내 메시지를 재생, 출력할 수 있다. 이에 따라 홈 어플라이언스(200)는 다양한 음원 파일을 저장하고 있을 필요가 없다. The
한편, 연계 서비스 서버(120)를 통하여 다른 서버와 충돌하지 않으면서도 다양한 외부 서비스들과의 연계가 가능하다. 또한, 외부 서비스 연동 서버를 통해 의도분석 시 외부 정보를 반영하여 의도분석 성공률을 높일 수 있다.Meanwhile, through the linked
본 발명의 일 실시예에 따른 음성 인식 서버 시스템(100)은, 복수의 서버를 통해, 호환성 및 연결성을 확보하고, 최종 제어 명령은 가전 제어 서버(130)를 활용함으로써, 음성 인식 과정과 가전 제어 서버(130)를 통해 와이파이 통신을 이용한 가전 제어 사이의 충돌 및 휴대 단말기를 통한 가전 제어와 홈 어플라이언스(200)를 통한 음성 입력에 의한 가전 제어 간 충돌을 막을 수 있다.The voice
본 발명의 일 실시예에 따른 음성 인식 서버 시스템(100)은, 서버 간 유기적인 연결을 통해 어느 한 서버에 의존하여 특정서버에 부하가 몰리는 것을 줄일 수 있고, 각각의 서버 별 역할이 달라, 특정 서버에서 문제가 생길 경우 동일한 역할을 하는 타 서버와의 연계를 통해 쉽게 대응이 가능하다. The voice
또한, 복수의 서버들을 독립적으로 수시로 업데이트할 수 있어, 성능 개선에 유리하다.In addition, a plurality of servers can be independently updated frequently, which is advantageous for performance improvement.
도 3b는 본 발명의 일 실시예에 따른 음성 인식 서버 시스템의 일예이다.3B is an example of a voice recognition server system according to an embodiment of the present invention.
도 3b에서 예시된 음성 인식 서버 시스템은, 도 3a에서 예시된 음성 인식 서버 시스템이 음성 안내 메시지 출력을 위한 음성 데이터가 홈 어플라이언스(200a)로 전송되는 과정을 개선하여 음성 제어 응답 시간을 향상한 것이다.The voice recognition server system illustrated in FIG. 3B improves the voice control response time by improving the process in which the voice recognition server system illustrated in FIG. 3A transmits voice data for outputting a voice guidance message to the
따라서, 도 3a와 도 3b에서 예시된 음성 인식 서버 시스템은 상기 차이점 이외의 동작은 실질적으로 동일하게 수행할 수 있고, 이하에서는 동일한 부분에 대해서는 간략히 기술한다.Accordingly, the voice recognition server system illustrated in FIGS. 3A and 3B may perform substantially the same operations except for the above differences, and the same parts will be briefly described below.
도 3b를 참조하면, 본 발명의 일 실시예에 따른 음성 인식 서버 시스템은, 홈 어플라이언스(200a)로부터 음성 데이터를 수신하고, 수신한 음성 데이터를 분석하여 음성 명령을 판별하는 음성 서버(110)를 포함할 수 있다.Referring to FIG. 3B , the voice recognition server system according to an embodiment of the present invention includes a
또한, 본 발명의 일 실시예에 따른 음성 인식 서버 시스템은, 상기 음성 서버(110)로부터 상기 판별한 음성 명령에 대응하는 신호를 수신하고, 상기 판별한 음성 명령에 대응하는 요청 신호를 생성하는 연계 서비스 서버(120)와 상기 연계 서비스 서버(120)로부터 수신되는 요청 신호에 기초하는 제어 신호를 상기 홈 어플라이언스(200a)로 송신하는 가전 제어 서버(130)를 더 포함할 수 있다.In addition, the voice recognition server system according to an embodiment of the present invention receives a signal corresponding to the determined voice command from the
도 3b에서 예시된 음성 인식 서버 시스템은, 홈 어플라이언스(200a)의 요청 없이도, 상기 음성 서버(110)가 상기 음성 명령에 기초하는 처리 결과 정보를 포함하는 음성 데이터를 상기 홈 어플라이언스(200a)로 송신할 수 있다.In the voice recognition server system illustrated in FIG. 3B , the
상기 음성 서버(110)는, 홈 어플라이언스(200a)로부터 음성 데이터를 수신하고, 수신한 음성 데이터를 텍스트(text) 데이터로 변환하는 자동 음성 인식 서버(111), 상기 자동 음성 인식 서버(111)로부터 상기 텍스트 데이터를 수신하고, 수신한 텍스트 데이터를 분석하여 음성 명령을 판별하는 자연어 처리 서버(112), 및, 상기 음성 명령에 기초하는 응답 신호를 음성 데이터로 변환하여 상기 홈 어플라이언스(200a)로 송신하는 텍스트 음성 변환 서버(113)를 포함할 수 있다.The
본 실시예에서도, 상기 가전 제어 서버(130)는, 상기 홈 어플라이언스(200a)로부터 상기 제어 신호에 대한 응답 신호를 수신하고, 상기 응답 신호에 대응하는 처리 결과 정보를 상기 연계 서비스 서버(120)로 송신할 수 있다.Also in this embodiment, the home
상기 연계 서비스 서버(120)는 음성 서버(110), 더욱 상세하게는 자연어 처리 서버(112)로 상기 처리 결과 정보를 전달할 수 있다.The linked
이 경우에, 상기 텍스트 음성 변환 서버(113)가 상기 홈 어플라이언스(200a)로 송신하는 음성 데이터는, 상기 처리 결과 정보를 포함할 수 있다.In this case, the voice data transmitted by the text-to-
또한, 상기 연계 서비스 서버(120)는, 상기 판별한 음성 명령에 대응하는 신호에 기초하여 상기 홈 어플라이언스(200a)의 상태 정보를 상기 가전 제어 서버로 요청하고, 상기 가전 제어 서버는, 상기 홈 어플라이언스(200a)의 상태 정보를 상기 연계 서비스 서버(120)로 송신할 수 있다.In addition, the linked
또한, 상기 연계 서비스 서버(120)는, 상기 홈 어플라이언스(200a)의 상태 정보에 기초하여 상기 판별한 음성 명령의 지원이 가능한 경우에, 상기 가전 제어 서버(130)로 상기 판별한 음성 명령에 대응하는 요청 신호를 송신할 수 있다.In addition, the linked
또는, 상기 연계 서비스 서버(120)는, 상기 홈 어플라이언스(200a)의 상태 정보에 기초하여 상기 판별한 음성 명령의 지원이 불가능한 경우에, 상기 음성 서버(110)로 현재 상태에서 지원되지 않는 기능임을 알리는 신호를 송신할 수 있다.Alternatively, the linked
예를 들어, 상기 연계 서비스 서버(120)는 상기 자연어 처리 서버(112)로 현재 상태에서 지원되지 않는 기능임을 알리는 신호를 송신할 수 있다. For example, the linked
또한, 상기 자연어 처리 서버(112)는 상기 텍스트 음성 변환 서버(113)로 현재 상태에서 지원되지 않는 기능임을 알리는 신호를 전달하고, 상기 텍스트 음성 변환 서버(113)는 대응하는 음성 데이터를 생성하여 홈 어플라이언스(200a)로 송신할 수 있다.In addition, the natural
홈 어플라이언스(200a)는 상기 텍스트 음성 변환 서버(113)로부터 음성 데이터를 수신하여, 현재 상태에서 지원되지 않는 기능임을 알리는 음성 안내 메시지를 출력할 수 있다.The
실시예에 따라서는, 상기 음성 서버(110)가, 상기 판별한 음성 명령의 지원 가능 유무를 판별할 수 있다. 예를 들어, 사용자의 음성 명령의 의도를 분석한 상기 자연어 처리 서버(112)가, 상기 판별한 음성 명령의 지원 가능 유무를 판별할 수 있다. According to an embodiment, the
이 경우에, 상기 판별한 음성 명령이 지원 불가능한 명령을 포함하고 있는 경우, 상기 자연어 처리 서버(112)가 송신하는 상기 판별한 음성 명령에 기초하는 응답 신호는 상기 판별한 음성 명령이 상기 홈 어플라이언스(200a)가 지원하지 않는 기능임을 알리는 신호일 수 있다.In this case, when the determined voice command includes a command that cannot be supported, a response signal based on the determined voice command transmitted by the natural
홈 어플라이언스(200a)가 동작한 후 제일 마지막으로 음성 안내를 위한 텍스트 음성 변환 서버(113)에 해당 동작에 대한 안내 멘트를 요청할 경우 동작과 안내 멘트 사이에 시간 차가 발생할 수 있다. After the
하지만, 본 발명의 일 실시예에 따르면, 의도분석이 완료되어 동작 요청이 자연어 처리 서버(112)에서 송신될 때, 이와 동시에 텍스트 음성 변환 서버(113)로 정보를 제공해줄 수 있다.However, according to an embodiment of the present invention, when the intention analysis is completed and the operation request is transmitted from the natural
또한, 가전 제어 서버(130)에서 홈 어플라이언스(200a)에 제어 명령을 내리는 시점에 준하여 텍스트 음성 변환 서버(113)에서 홈 어플라이언스(200a)로 안내멘트를 제공할 수 있다.In addition, it is possible to provide a guide from the text-to-
이에 따라, 홈 어플라이언스(200a) 동작과 동시 또는 바로 후 안내멘트가 발화될 수 있다.Accordingly, a guide message may be ignited simultaneously with or immediately after the operation of the
본 실시예에 따르면, 자연어 처리 서버(112)와 텍스트 음성 변환 서버(113)를 바로 연결함으로써, 가전 제어 서버(130)를 통한 제어명령과 안내멘트 사이의 시간 차를 최소화할 수 있다.According to this embodiment, by directly connecting the natural
한편, 도 3a와 도 3b에서는 홈 어플라이언스(200)로 공기조화기(200a)를 예시하여 설명하였지만, 본 발명은 이에 한정되지 않는다. 예를 들어, 홈 어플라이언스(200)에는 공기조화기(200a) 외에 로봇청소기(200b), 냉장고(200c), 세탁기(200d), 조리기기(200e) 등이 해당될 수 있다.Meanwhile, although the
한편, 본 발명의 일 측에 따르면, 도 3a와 도 3b과 달리, 음성 인식 및 처리를 위한 자동 음성 인식 서버(111), 자연어 처리 서버(112), 텍스트 음성 변환 서버(113)는 하나의 통합 서버로 구성될 수 있다.On the other hand, according to one side of the present invention, unlike FIGS. 3A and 3B , the automatic
또한, 실시예에 따라서는, 연계 서비스 서버(120)와 가전 제어 서버(130)는 하나의 통합 서버로 구성될 수 있다.In addition, depending on the embodiment, the linked
본 발명에 따르면, 음성 입력에 따라 홈 어플라이언스가 동작함으로써, 사용자가 리모콘 등 원격제어장치, 휴대 단말기 등을 조작할 필요가 없어, 사용자 편의성을 증대시킬 수 있다.According to the present invention, since the home appliance operates according to a voice input, the user does not need to operate a remote control device such as a remote control, a mobile terminal, etc., and thus user convenience can be increased.
또한, 도 3a와 도 3b를 참조하여 설명한 것과 같이, 본 발명은 복수의 서버를 이용하여, 사용자의 자연어 음성 명령을 인식하고, 대응하는 제어 동작을 수행함으로써, 홈 어플라이언스, 각 서버의 시스템 자원에 제한되지 않고 효율적으로 자연어를 인식, 처리할 수 있다.In addition, as described with reference to FIGS. 3A and 3B , the present invention uses a plurality of servers to recognize a user's natural language voice command and perform a corresponding control operation, thereby providing the home appliance and system resources of each server. It can recognize and process natural language efficiently without limitation.
도 4는 본 발명의 일 실시예에 따른 서버의 내부 블록도의 일예를 도시한 도면으로, 상기 서버는, 자동 음성 인식 서버(111), 자연어 처리 서버(112), 텍스트 음성 변환 서버(113), 연계 서비스 서버(120), 가전 제어 서버(130)일 수 있다.4 is a diagram illustrating an example of an internal block diagram of a server according to an embodiment of the present invention, wherein the server includes an automatic
도 4를 참조하면, 서버는, 통신 모듈(420), 저장부(430), 및 프로세서(410)를 구비할 수 있다.Referring to FIG. 4 , the server may include a
프로세서(410)는, 서버의 전반적인 동작을 제어할 수 있다.The
통신 모듈(420)은, 휴대 단말기, 공기조화기 등 홈 어플라이언스, 다른 서버 등으로부터 상태 정보, 동작 정보, 조작 정보, 음성 데이터, 문자 데이터 등 각종 데이터를 수신할 수 있다. The
그리고 통신 모듈(420)은 수신되는 각종 정보에 대응하는 데이터를 그대로 또는 소정 처리 후에 휴대 단말기, 공기조화기 등 홈 어플라이언스, 다른 서버 등으로 송신할 수 있다.In addition, the
이를 위해, 통신 모듈(420)은 인터넷 모듈, 이동 통신 모듈 등 하나 이상의 통신 모듈을 구비할 수 있다.To this end, the
저장부(430)는, 수신되는 정보를 저장하고, 이에 대응하는 결과 정보 생성을 위한 데이터를 구비할 수 있다.The
저장부(430)는 해당 서버의 동작을 위한 데이터가 저장될 수 있다. 예를 들어, 저장부(430)에는, 자동 음성 인식 서버(111)의 경우 자동 음성 인식 알고리즘 등이 저장되고, 가전 제어 서버(130)의 경우 홈 어플라이언스의 제품 정보, 상태 정보, 홈 어플라이언스의 제어를 위한 데이터가 저장될 수 있다.The
한편, 서버는, 공기조화기 등 홈 어플라이언스 제조사가 운영하는 서버 또는 서비스 제공자가 운영하는 서버일 수 있고, 일종의 클라우드(Cloud) 서버일 수 있다.Meanwhile, the server may be a server operated by a home appliance manufacturer such as an air conditioner or a server operated by a service provider, or may be a kind of cloud server.
서버는 수신하는 음성 데이터에 대하여 딥러닝(Deep Learning) 등 머신 러닝(machine learning)을 수행할 수 있고, 저장부(430)는, 머신 러닝에 사용되는 데이터, 결과 데이터 등을 저장할 수 있다.The server may perform machine learning, such as deep learning, on the received voice data, and the
머신 러닝(Machine Learning)의 일종인 딥러닝(Deep Learning) 기술은 데이터를 기반으로 다단계로 깊은 수준까지 내려가 학습하는 것이다.Deep Learning, a type of machine learning, learns from data in multiple stages down to a deep level.
딥러닝(Deep learning)은 단계를 높여갈수록 복수의 데이터들로부터 핵심적인 데이터를 추출하는 머신 러닝(Machine Learning) 알고리즘의 집합을 나타낼 수 있다. Deep learning may represent a set of machine learning algorithms that extract core data from a plurality of data as the level increases.
딥러닝 구조는 인공신경망(ANN)를 포함할 수 있으며, 예를 들어 딥러닝 구조는 CNN(Convolutional Neural Network), RNN(Recurrent Neural Network), DBN(Deep Belief Network) 등 심층신경망(DNN)으로 구성될 수 있다.The deep learning structure may include an artificial neural network (ANN), for example, the deep learning structure is composed of a deep neural network (DNN) such as CNN (Convolutional Neural Network), RNN (Recurrent Neural Network), DBN (Deep Belief Network), etc. can be
본 발명에 따른 딥러닝 구조는 공지된 다양한 구조를 이용할 수 있다. 예를 들어, 본 발명에 따른 딥러닝 구조는 CNN(Convolutional Neural Network), RNN(Recurrent Neural Network), DBN(Deep Belief Network) 등일 수 있다.The deep learning structure according to the present invention may use various well-known structures. For example, the deep learning structure according to the present invention may be a Convolutional Neural Network (CNN), a Recurrent Neural Network (RNN), a Deep Belief Network (DBN), or the like.
RNN(Recurrent Neural Network)은, 자연어 처리 등에 많이 이용되고 있으며, 시간의 흐름에 따라 변하는 시계열 데이터(Time-series data) 처리에 효과적인 구조로 매 순간마다 레이어를 쌓아올려 인공신경망 구조를 구성할 수 있다.RNN (Recurrent Neural Network) is widely used in natural language processing, etc., and is an effective structure for processing time-series data that changes with time. .
DBN(Deep Belief Network)은 딥러닝 기법인 RBM(Restricted Boltzman Machine)을 다층으로 쌓아 구성되는 딥러닝 구조이다. RBM(Restricted Boltzman Machine) 학습을 반복하여, 일정 수의 레이어가 되면 해당 개수의 레이어를 가지는 DBN(Deep Belief Network)를 구성할 수 있다. DBN (Deep Belief Network) is a deep learning structure composed of multi-layered Restricted Boltzman Machine (RBM), a deep learning technique. By repeating Restricted Boltzman Machine (RBM) learning, when a certain number of layers is reached, a Deep Belief Network (DBN) having the corresponding number of layers can be configured.
CNN(Convolutional Neural Network)은 사람이 물체를 인식할 때 물체의 기본적인 특징들을 추출한 다음 뇌 속에서 복잡한 계산을 거쳐 그 결과를 기반으로 물체를 인식한다는 가정을 기반으로 만들어진 사람의 뇌 기능을 모사한 모델이다. CNN (Convolutional Neural Network) is a model that simulates human brain function based on the assumption that when a person recognizes an object, it extracts the basic features of the object, then performs complex calculations in the brain and recognizes the object based on the result. am.
한편, 인공신경망의 학습은 주어진 입력에 대하여 원하는 출력이 나오도록 노드간 연결선의 웨이트(weight)를 조정(필요한 경우 바이어스(bias) 값도 조정)함으로써 이루어질 수 있다. 또한, 인공신경망은 학습에 의해 웨이트(weight) 값을 지속적으로 업데이트시킬 수 있다. 또한, 인공신경망의 학습에는 역전파(Back Propagation) 등의 방법이 사용될 수 있다.On the other hand, learning of the artificial neural network can be accomplished by adjusting the weight of the connection line between nodes (and adjusting the bias value if necessary) so that a desired output is obtained for a given input. In addition, the artificial neural network may continuously update a weight value by learning. In addition, a method such as back propagation may be used for learning the artificial neural network.
한편, 서버에는 머신 러닝)으로 기학습된 인공신경망(Artificial Neural Network)이 탑재될 수 있다.On the other hand, the server may be equipped with an artificial neural network previously learned by machine learning.
본 발명의 일 실시 예에 따른 서버는, 수신되는 음성 데이터를 입력 데이터로 하는 머신 러닝(machine learning) 기반의 음성 인식을 수행할 수 있다. The server according to an embodiment of the present invention may perform machine learning-based voice recognition using received voice data as input data.
프로세서(410)는 인공신경망, 예를 들어, CNN(Convolutional Neural Network), RNN(Recurrent Neural Network), DBN(Deep Belief Network) 등 심층신경망(Deep Neural Network: DNN)을 포함될 수 있고, 심층신경망을 학습할 수 있다.The
상기 인공신경망의 머신 러닝 방법으로는 자율학습(unsupervised learning)과 지도학습(supervised learning)이 모두 사용될 수 있다.As the machine learning method of the artificial neural network, both unsupervised learning and supervised learning may be used.
한편, 상기 프로세서(410)는 설정에 따라 학습 후 음성 인식 인공신경망 구조로 업데이트시키도록 제어할 수 있다.Meanwhile, the
도 5는 본 발명의 일 실시예에 따른 홈 어플라이언스의 내부 블록도의 일예를 도시한 도면이다. 5 is a diagram illustrating an example of an internal block diagram of a home appliance according to an embodiment of the present invention.
도 5를 참조하면, 본 발명의 일 실시예에 따른 홈 어플라이언스(200)는, 카메라(210), 사용자의 음성 명령을 수신하는 오디오 입력부(220), 조작부(230), 각종 데이터를 저장하는 메모리(250), 다른 전자기기와 무선 통신하는 통신부(270), 각 홈 어플라이언스에 구현된 동작을 수행하는 구동부(280), 소정 정보를 영상으로 표시하는 디스플레이(292), 소정 정보를 오디오로 출력하는 오디오 출력부(291), 각종 데이터를 센싱하는 센서부(215), 및, 전반적인 동작을 제어하는 제어부(240)를 포함할 수 있다.Referring to FIG. 5 , a
오디오 입력부(220)는, 외부의 오디오 신호, 사용자 음성 명령을 입력받을 수 있다. 이를 위해, 오디오 입력부(220)는, 하나 이상의 마이크(MIC)를 구비할 수 있다. 또한, 사용자의 음성 명령을 더 정확히 수신하기 위하여 오디오 입력부(220)는 복수의 마이크(221, 222)를 구비할 수 있다. 복수의 마이크(221, 222)는, 서로 다른 위치에 이격되어 배치될 수 있고, 외부의 오디오 신호를 획득하여 전기적인 신호로 처리할 수 있다. The
도 5 등에서는 오디오 입력부(220)가 제1 마이크(221)와 제2 마이크(222)의 2개의 마이크를 구비하는 예를 도시하였으나, 본 발명은 이에 한정되지 않는다.5 illustrates an example in which the
오디오 입력부(220)는 아날로그 소리를 디지털 데이터로 변환하는 처리부를 포함하거나 처리부에 연결되어 사용자 입력 음성 명령을 제어부(240) 또는 소정 서버에서 인식할 수 있도록 데이터화할 수 있다. The
한편, 오디오 입력부(220)는 사용자의 음성 명령을 입력받는 과정에서 발생하는 잡음(noise)을 제거하기 위한 다양한 잡음 제거 알고리즘이 사용될 수 있다.Meanwhile, the
또한, 오디오 입력부(220)는 각 마이크(221, 222)에서 수신되는 오디오 신호에서 노이즈를 제거하는 필터, 필터에서 출력되는 신호를 증폭하여 출력하는 증폭기 등 오디오 신호 처리를 위한 구성들을 포함할 수 있다.In addition, the
메모리(250)는 홈 어플라이언스의 동작에 필요한 각종 정보들을 기록하는 것으로, 휘발성 또는 비휘발성 기록 매체를 포함할 수 있다. 기록 매체는 마이크로 프로세서(micro processor)에 의해 읽힐 수 있는 데이터를 저장한 것으로, HDD(Hard Disk Drive), SSD(Solid State Disk), SDD(Silicon Disk Drive), ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광 데이터 저장 장치 등을 포함할 수 있다.The
메모리(250)에는 홈 어플라이언스의 동작제어를 위한 데이터, 동작 중 센서부(215)를 통해 감지 또는 측정되는 데이터와, 통신부(270)를 통해 수신되는 데이터 등이 저장될 수 있다. The
실시예에 따라서는, 메모리(250)에는 사용자가 입력한 음성 명령의 음원 파일이 저장될 수 있고, 저장된 음원 파일은 통신부(270)을 통하여 음성 인식 서버 시스템(100)으로 전송될 수 있다. 또한, 상기 저장된 음원 파일은 기설정된 시간 경과 또는 기설정된 동작 수행 후에 삭제될 수 있다.According to an embodiment, a sound source file of a voice command input by a user may be stored in the
한편, 메모리(250)에는 음성 인식을 위한 데이터가 저장될 수 있고, 제어부(240)는 오디오 입력부(220)를 통하여 수신되는 사용자의 음성 입력 신호를 처리하고 음성 인식 과정을 수행할 수 있다. Meanwhile, data for voice recognition may be stored in the
또는, 실시예에 따라서는, 홈 어플라이언스(200)는 음성 인식 모듈(미도시)을 포함하고, 음성 인식 모듈이 호출어 인식 등 간단한 음성 인식을 수행할 수 있다. 음성 인식 모듈을 포함하는 실시예에 대해서는 도 6을 참조하여 상세히 후술한다.Alternatively, according to an embodiment, the
또한, 음성 신호의 호출어 포함 여부를 판별하기 위한 호출어 판단 알고리즘이 메모리(250)에 저장될 수 있다. ,Also, a calling word determination algorithm for determining whether the voice signal includes a calling word may be stored in the
상기 제어부(240) 및 음성 인식 모듈은 상기 호출어 판단 알고리즘에 기초하여 상기 음성 신호의 상기 호출어 포함 여부를 판별할 수 있다.The
한편, 간단한 음성 인식은 홈 어플라이언스(200)가 수행하고, 자연어 처리 등 고차원의 음성 인식은 음성 인식 서버 시스템(100)에서 수행될 수 있다.Meanwhile, simple voice recognition may be performed by the
예를 들어, 기설정된 호출어를 포함하는 웨이크 업(wake up) 음성 신호가 수신되는 경우에, 홈 어플라이언스(200)는 음성 명령어를 수신하기 위한 상태로 전환될 수 있다. 이 경우에, 홈 어플라이언스(200)는 호출어 음성 입력 여부까지의 음성 인식 과정만 수행하고, 이후의 사용자 음성 입력에 대한 음성 인식은 음성 인식 서버 시스템(100)을 통하여 수행할 수 있다. For example, when a wake up voice signal including a preset call word is received, the
홈 어플라이언스이 시스템 자원에는 한계가 있으므로, 복잡한 자연어 인식 및 처리는 음성 인식 서버 시스템(100)을 통하여 수행될 수 있다.Since the home appliance has a limited system resource, complex natural language recognition and processing may be performed through the voice
또는, 호출어 음성 입력 여부의 판단은 홈 어플라이언스(200)와 음성 인식 서버 시스템(100)에서 이중으로 수행될 수 있다. 이에 따라, 호출어 음성 입력 판단의 오인식을 줄이고, 인식률을 높일 수 있다. Alternatively, the determination of whether to input the call word may be performed in the
메모리(250)에는 제한적인 데이터가 저장될 수 있다. 예를 들어, 메모리(250)에는 기설정된 호출어를 포함하는 웨이크 업(wake up) 음성 신호를 인식하기 위한 데이터가 저장될 수 있다. 이 경우에, 제어부(240)는 오디오 입력부(220)를 통하여 수신되는 사용자의 음성 입력 신호로부터 기설정된 호출어를 포함하는 웨이크 업(wake up) 음성 신호를 인식할 수 있다. Limited data may be stored in the
한편, 호출어는 제조사에 의해 설정될 수 있고, 홈 어플라이언스 별로 다른 호출어가 설정될 수 있다. 예를 들어, 공기조화기의 경우에는 "LG 휘센", 냉장고의 경우에는 "LG 디오스"가 호출어로 설정될 수 있다.Meanwhile, the call word may be set by the manufacturer, and a different call word may be set for each home appliance. For example, in the case of an air conditioner, "LG Whisen" and in the case of a refrigerator, "LG Dios" may be set as the calling word.
또한, 호출어는 사용자에 의해 설정 변경이 가능하다. In addition, the setting of the call word can be changed by the user.
제어부(240)는, 웨이크 업(wake up) 음성 신호의 인식 이후에 입력되는 사용자의 음성 명령을, 통신부(270)를 통하여, 음성 인식 서버 시스템(100)에 송신하도록 제어할 수 있다. The
통신부(270)는, 하나 이상의 통신 모듈을 구비하여, 다른 전자기기와, 무선 통신을 수행하여, 각종 신호를 주고 받을 수 있다. 예를 들어, 통신부(270)는 스마트 홈 시스템(10) 내/외부의 전자기기들과 통신할 수 있다. The
또한, 통신부(270)는 억세스 포인트 장치(300)와 통신하고, 억세스 포인트 장치(300)를 통하여 무선 인터넷 네트워크에 접속하여 다른 기기들과 통신할 수 있다.Also, the
또한, 제어부(240)는 통신부(270)를 통해 홈 어플라이언스(200)의 상태 정보, 사용자의 음성 명령 등을 음성 인식 서버 시스템(100) 등으로 전송할 수 있다. Also, the
한편, 통신부(270)를 통하여 제어 신호가 수신되면, 제어부(240)는 수신되는 제어 신호에 따라 동작하도록 홈 어플라이언스(200)를 제어할 수 있다.Meanwhile, when a control signal is received through the
디스플레이(292)는 사용자의 명령 입력에 대응하는 정보, 사용자의 명령 입력에 대응하는 처리 결과, 동작모드, 동작상태, 에러상태 등을 영상으로 표시할 수 있다.The
실시예에 따라서는, 디스플레이(292)는, 터치패드와 상호 레이어 구조를 이루어 터치스크린으로 구성될 수 있다. 이 경우에, 디스플레이(292)는 출력 장치 이외에 사용자의 터치에 의한 정보의 입력이 가능한 입력 장치로도 사용될 수 있다. According to an embodiment, the
또한, 오디오 출력부(291)는, 제어부(240)의 제어에 따라 경고음, 동작모드, 동작상태, 에러상태 등의 알림 메시지, 사용자의 명령 입력에 대응하는 정보, 사용자의 명령 입력에 대응하는 처리 결과 등을 오디오로 출력할 수 있다. In addition, the
한편, 오디오 출력부(291)는, 제어부(240)로부터의 전기 신호를 오디오 신호로 변환하여 출력할 수 있다. 이를 위해, 스피커 등을 구비할 수 있다.Meanwhile, the
또한, 본 발명의 일 실시예에 따른 홈 어플라이언스(200)는, 음성 인식 과정 및 홈 어플라이언스 제어 과정 중에 발생할 수 있는 다양한 상황들을 고려한 사용자 경험(User Experience, UX)을 제공할 수 있다.In addition, the
제어부(240)는 음성 인식 과정 및 홈 어플라이언스 제어 과정의 각 단계에 대응하여 소정 정보를 시각적/청각적 수단으로 사용자에게 제공하도록 오디오 출력부(291) 및 디스플레이(292)를 제어할 수 있다.The
제어부(240)는 디스플레이(292)를 제어하여 음성 인식 과정 및 홈 어플라이언스 제어 과정의 각 단계에 대응하여 시각적 정보를 제공할 수 있다.The
또한, 제어부(240)는 오디오 출력부(291)를 제어하여 음성 인식 과정 및 홈 어플라이언스 제어 과정의 각 단계에 대응하여 청각적 정보를 제공할 수 있다.Also, the
구동부(280)는 홈 어플라이언스에 구현된 동작을 수행하는 것으로, 각 홈 어플라이언스별로 다르게 구성될 수 있다.The driving
예를 들어, 홈 어플라이언스가 냉장고인 경우, 구동부(280)는, 냉장실에 냉각된 공기를 공급하기 위한 냉장실 팬을 동작시키는 냉장실 구동부, 냉동실에 냉각된 공기를 공급하기 위한 냉동실 팬을 동작시키는 냉동실 구동부, 냉매를 압축하기 위한 압축기를 동작시키는 압축기 구동부 등을 포함할 수 있다. For example, when the home appliance is a refrigerator, the driving
다른 예로, 홈 어플라이언스가 세탁기인 경우, 구동부(280)는, 드럼 또는 터브를 구동하는 구동부 등을 포함할 수 있다. As another example, when the home appliance is a washing machine, the driving
또, 다른 예로, 홈 어플라이언스가 공기조화기인 경우, 구동부(280)는, 실외기 내의 압축기를 구동하기 위한 압축기 구동부, 열교환을 위한 실외기 팬을 동작시키는 실외기 팬 구동부, 열교환을 위한 실내기팬을 동작시키는 실내기 팬 구동부 등을 포함할 수 있다.As another example, when the home appliance is an air conditioner, the driving
또, 다른 예로, 홈 어플라이언스가 조리기기인 경우, 구동부(280)는, 캐비티 내로 마이크로웨이브를 출력하는 마이크로웨이브 구동부 등을 포함할 수 있다. Also, as another example, when the home appliance is a cooking appliance, the driving
또, 다른 예로, 홈 어플라이언스가 청소기인 경우, 구동부(280)는, 공기 흡입을 위한 팬 모터 구동부 등을 포함할 수 있다. Also, as another example, when the home appliance is a cleaner, the driving
한편, 홈 어플라이언스(200)는 사용자 입력을 위한 조작부(230), 홈 어플라이언스(200) 주변 소정 범위를 촬영할 수 있는 카메라(210)를 더 포함할 수 있다. Meanwhile, the
조작부(230)는, 복수의 조작 버튼을 구비하여, 입력되는 버튼에 대응하는 신호를 제어부(240)로 전달할 수 있다.The
카메라(210)는 홈 어플라이언스(200) 주변, 외부 환경 등을 촬영하는 것으로, 이러한 카메라는 촬영 효율을 위해 각 부위별로 여러 개가 설치될 수도 있다. The
예를 들어, 카메라(210)는 적어도 하나의 광학렌즈와, 광학렌즈를 통과한 광에 의해 상이 맺히는 다수개의 광 다이오드(photodiode, 예를 들어, pixel)를 포함하여 구성된 이미지 센서(예를 들어, CMOS image sensor)와, 광 다이오드들로부터 출력된 신호를 바탕으로 영상을 구성하는 디지털 신호 처리기(DSP: Digital Signal Processor)를 포함할 수 있다. 디지털 신호 처리기는 정지영상은 물론이고, 정지영상으로 구성된 프레임들로 이루어진 동영상을 생성하는 것도 가능하다.For example, the
한편, 카메라(210)가 촬영하여 획득된 영상은 메모리(250)에 저장될 수 있다.Meanwhile, an image obtained by photographing by the
본 발명의 일 실시예에 따르면, 제어부(240)는, 상기 카메라(210)가 획득하는 영상에 기초하여, 사용자의 존재 여부 및, 홈 어플라이언스와의 거리 정보를 판별할 수 있다.According to an embodiment of the present invention, the
센서부(215)는 하나 이상의 센서를 포함하여, 온도, 습도, 공기의 오염도를 측정하거나 홈 어플라이언스의 동작 상태를 센싱할 수 있다.The
이를 위해, 센서부(215)는, 온도를 센싱하는 온도 센서, 습도를 센싱하는 복수의 습도 센서, 공기 상태를 감지하는 각종 공기 오염 감지 센서 중 적어도 하나를 포함할 수 있다.To this end, the
제어부(240)는 홈 어플라이언스로 입력되거나 출력되는 데이터의 흐름을 제어하고, 센서부(215)로부터 입력된 데이터에 기초하여 제어명령을 생성하여 인가할 수 있다.The
본 발명의 일 실시예에 따르면, 센서부(215)는 사용자의 존재 여부, 사용자와 홈 어플라이언스와의 거리를 감지하기 위하여 PIR 센서 등 인체 감지 센서를 더 구비할 수 있다.According to an embodiment of the present invention, the
이 경우에, 제어부(240)는, 상기 센서부(215)가 획득하는 데이터에 기초하여, 사용자의 존재 여부 및 홈 어플라이언스와의 거리 정보를 판별할 수 있고, 이에 따라 홈 어플라이언스를 제어할 수 있다.In this case, the
도 6은 본 발명의 일 실시예에 따른 홈 어플라이언스의 내부 블록도의 다른 예를 도시한 도면이다. 6 is a diagram illustrating another example of an internal block diagram of a home appliance according to an embodiment of the present invention.
도 6을 참조하면, 홈 어플라이언스(200)는, 카메라(210), 사용자의 음성 명령을 수신하는 오디오 입력부(220), 조작부(230), 각종 데이터를 저장하는 메모리(250), 다른 전자기기와 무선 통신하는 통신부(270), 각 홈 어플라이언스에 구현된 동작을 수행하는 구동부(280), 소정 정보를 영상으로 표시하는 디스플레이(292), 소정 정보를 오디오로 출력하는 오디오 출력부(291), 각종 데이터를 센싱하는 센서부(215), 및, 전반적인 동작을 제어하는 제어부(240), 프로세서(260)를 포함할 수 있다.Referring to FIG. 6 , the
도 6의 홈 어플라이언스(200)의 내부 블록도는, 도 5와 유사하나, 프로세서(260)가 더 구비되며, 오디오 입력부(220), 오디오 출력부(291), 통신부(270), 카메라(210), 및 프로세서(260)가 하나의 단일 모듈인 음성 인식 모듈(205) 내에 구비되는 것에 그 차이가 있다.An internal block diagram of the
한편, 프로세서(260)는, 오디오 입력부(220), 오디오 출력부(291), 통신부(270), 카메라(210) 등을 제어할 수 있다.Meanwhile, the
이하에서는, 도 5와의 차이를 중심으로 기술한다.Hereinafter, the difference from FIG. 5 will be mainly described.
프로세서(260)는 오디오 입력부(220)를 통하여 수신되는 사용자의 음성 입력 신호를 처리하고 음성 인식 과정을 수행할 수 있다. The
예를 들어, 기설정된 호출어를 포함하는 웨이크 업(wake up) 음성 신호가 수신되는 경우에, 프로세서(260)는 음성 명령어를 수신하기 위한 상태로 전환될 수 있다. 이 경우에, 프로세서(260)는 호출어 음성 입력 여부까지의 음성 인식 과정만 수행하고, 이후의 사용자 음성 입력에 대한 음성 인식은 음성 인식 서버 시스템(100)을 통하여 수행할 수 있다.For example, when a wake up voice signal including a preset call word is received, the
프로세서(260)는, 웨이크 업(wake up) 음성 신호의 인식 이후에 입력되는 사용자의 음성 명령을, 통신부(270)를 통하여, 음성 인식 서버 시스템(100)에 송신하도록 제어할 수 있다. The
또한, 프로세서(260)는 통신부(270)를 통해 홈 어플라이언스(200)의 상태 정보, 사용자의 음성 명령 등을 음성 인식 서버 시스템(100) 등으로 전송할 수 있다. Also, the
한편, 통신부(270)를 통하여 제어 신호가 수신되면, 프로세서(260)는 제어 신호를 제어부(240)로 전송하고, 제어부(240)는 수신되는 제어 신호에 따라 동작하도록 홈 어플라이언스(200)를 제어할 수 있다.Meanwhile, when a control signal is received through the
결국, 음성 인식 모듈(205)을 통해, 음성 데이터 획득, 서버 시스템(100)과의 통신, 및 대응하는 사운드 출력을 수행할 수 있게 된다.As a result, through the
한편, 음성 인식 모듈(205)은, 도 2에서 도시한 홈 어플라이언스 외에, 다양한 전자 기기에 부착될 수 있다. 또는 다른 전자 기기에 부착되는 것 없이, 별도의 장치로서, 사용될 수도 있다.Meanwhile, the
도 7은 본 발명의 일 실시예에 따른 홈 어플라이언스의 동작 방법을 도시한 순서도이다.7 is a flowchart illustrating a method of operating a home appliance according to an embodiment of the present invention.
도 7을 참조하면, 홈 어플라이언스(200)는, 사용자 입력에 의해, 음성 인식 기능을 활성화할 수 있다(S710). 사용자 입력에 따라 홈 어플라이언스(200)의 제어부(240)는, 마이크(221, 222)를 활성화할 수 있다. Referring to FIG. 7 , the
또는, 홈 어플라이언스(200)는 음성 인식 기능 활성화에 대한 설정에 따라서 자동으로 음성 인식 기능을 활성화할 수 있다. Alternatively, the
예를 들어, 전원이 켜지면, 홈 어플라이언스(200)는 자동으로 마이크(221, 222)를 활성화하고, 음성 인식 기능을 활성화할 수 있다.For example, when power is turned on, the
본 발명의 일 실시예에 따른 홈 어플라이언스(200)는, 음성 인식 과정 및 홈 어플라이언스 제어 과정 중에 발생할 수 있는 다양한 상황들을 고려한 사용자 경험(User Experience, UX)을 제공할 수 있다.The
제어부(240)는 디스플레이(292)를 제어하여 음성 인식 과정 및 홈 어플라이언스 제어 과정의 각 단계에 대응하여 시각적 정보를 제공할 수 있다.The
또한, 제어부(240)는 오디오 출력부(291)를 제어하여 음성 인식 과정 및 홈 어플라이언스 제어 과정의 각 단계에 대응하여 청각적 정보를 제공할 수 있다.Also, the
디스플레이(292)는 공기조화기(200a)의 운전 모드, 현재 상태, 설정 항목들을 여러 가지 시각적 이미지로 표시할 수 있다. 디스플레이(292)는 공기조화기(200a)의 운전 모드, 현재 상태, 설정 항목들을 문자, 숫자, 기호로 표시할 수 있고, 아이콘과 같은 그래픽 이미지로 표시할 수 있다. The
또한, 디스플레이(292)는 음성 입력의 처리 과정 별로 대응하는 정보를 표시할 수 있다.Also, the
도 7을 참조하면, 음성 인식 기능이 활성화되면, 상기 디스플레이(292)는, 마이크 아이콘을 점등하여 표시하고, 제어부(240)는 기설정된 호출어를 포함하는 웨이크 업(wake up) 음성 신호의 입력을 위한 웨이크업 신호 대기 모드로 진입하도록 제어할 수 있다(S715).Referring to FIG. 7 , when the voice recognition function is activated, the
한편, 음성 인식 기능이 비활성화되면 상기 마이크 아이콘의 표시가 종료될 수 있다.Meanwhile, when the voice recognition function is deactivated, the display of the microphone icon may be terminated.
또한, 오디오 출력부(291)는 호출어를 포함하는 발화를 안내하는 음성 안내 메시지를 출력할 수 있다. 예를 들어, 호출어가 "Hi LG"로 설정되어 있다면, 오디오 출력부(291)는 "Hi LG라고 말하면 음성 인식 기능을 사용할 수 있습니다"와 같은 음성 안내 메시지를 음성 출력할 수 있다.Also, the
한편, 홈 어플라이언스의 마이크(221, 222)가 활성화된 상태에서, 사용자로부터 음성 입력이 수신되는 경우, 마이크(221, 222)는, 입력 음성을 수신하고, 이를 제어부(240)로 전달할 수 있다.Meanwhile, when a voice input is received from a user while the
한편, 마이크(221, 222)를 통해 기설정된 호출어를 포함하는 웨이크 업(wake up) 음성 신호가 수신되는 경우에(S720), 홈 어플라이언스(200)는 음성 명령어를 수신하기 위한 명령어 대기 모드로 전환될 수 있다(S725). 마이크(221, 222)를 통해 기설정된 호출어를 포함하는 웨이크 업(wake up) 음성 신호가 수신되는 경우에(S720), 제어부(240)는 명령어 대기 모드로 진입하도록 제어할 수 있다(S725). On the other hand, when a wake up voice signal including a preset call word is received through the
홈 어플라이언스(200)가 항상 자연어 명령어를 대기하게 되면, 음성인식 기능에서 소비하는 전력과 CPU 점유율 및 음성 인식 서버 시스템의 서버 부하에 부담이 된다.When the
따라서, 홈 어플라이언스(200)는 명령어 대기 상태에서 들어오는 음성 신호에 대해서만 서버로 전송할 수 있다.Accordingly, the
또한, 홈 어플라이언스(200)는 명령어를 대기하는 시간에 조건을 주고 시간 내 명령 입력시 명령어 완료 시점까지는 소리를 받아서 서버로 전달할 수 있다.In addition, the
본 발명의 일측에 따르면, 홈 어플라이언스(200)는 호출어 음성 입력 여부까지의 음성 인식 과정만 수행하고, 이후의 사용자 음성 입력에 대한 음성 인식은 음성 인식 서버 시스템(100)을 통하여 수행할 수 있다. According to one aspect of the present invention, the
또는, 호출어 음성 입력 여부의 판단은 홈 어플라이언스(200)와 음성 인식 서버 시스템(100)에서 이중으로 수행될 수 있다. Alternatively, the determination of whether to input the call word may be performed in the
한편, 상기 호출어는 제조사에 의해 설정될 수 있고, 홈 어플라이언스 별로 다른 호출어가 설정될 수 있다. 예를 들어, 공기조화기의 경우에는 "LG 휘센", 냉장고의 경우에는 "LG 디오스"가 호출어로 설정될 수 있다. 또한, 상기 호출어는 사용자에 의해 설정 변경이 가능하다. Meanwhile, the call word may be set by the manufacturer, and a different call word may be set for each home appliance. For example, in the case of an air conditioner, "LG Whisen" and in the case of a refrigerator, "LG Dios" may be set as the calling word. Also, the setting of the call word can be changed by the user.
한편, 복수의 홈 어플라이언스에 대해 동일한 호출어가 설정될 수도 있다. 예를 들어, "Hi LG"가 공통의 호출어로 설정될 수 있다. 이 경우에, 어느 홈 어플라이언스가 사용자의 음성을 처리하고 응답할 지가 매우 중요해진다. Meanwhile, the same call word may be set for a plurality of home appliances. For example, "Hi LG" may be set as a common call word. In this case, it becomes very important which home appliance will process and respond to the user's voice.
복수의 기기가 동일한 호출어를 사용하는 경우에 대해서는 도 9 내지 도 12를 참조하여 상세히 후술한다.A case in which a plurality of devices use the same call word will be described later in detail with reference to FIGS. 9 to 12 .
한편, 상기 제어부(240)는, 웨이크 업(wake up) 음성 신호의 인식 이후에 입력되는 사용자의 음성 명령을, 통신부(270)를 통하여, 음성 인식 서버 시스템(100)에 송신하도록 제어할 수 있다(S730). Meanwhile, the
한편, 사용자의 음성 명령을 무기한으로 기다리는 것은 시스템 자원이 낭비되고, 명령어를 입력하지 않는 사용자의 의도에도 부합하지 않으므로 명령어 대기 모드에서는 소정 경과 시간 동안에 입력되는 음성 명령만 처리하도록 설정될 수 있다(S727).On the other hand, indefinitely waiting for a user's voice command wastes system resources and does not match the intention of the user who does not input the command. Therefore, in the command standby mode, it may be set to process only the voice command input for a predetermined elapsed time (S727). ).
이 경우에, 상기 제어부(240)는, 상기 기설정된 경과 시간 이내에 수신된 음성 명령을 포함하는 음성 데이터를 음성 서버(110)로 전송하도록 제어할 수 있다(S730). In this case, the
한편, 상기 기설정된 경과 시간 이내에 상기 음성 명령이 수신되지 않으면(S727), 상기 제어부(240)는, 다시 상기 웨이크업 신호 대기 모드로 전환하도록 제어할 수 있다.On the other hand, if the voice command is not received within the preset elapsed time (S727), the
실시예에 따라서는, 제1 시간 이내에 상기 통신부(270)가 상기 음성 서버(110)로부터 상기 음성 명령에 기초한 응답 신호를 수신하지 못하면, 상기 오디오 출력부(291)는 기다려달라는 음성 안내 메시지를 출력할 수 있다. 이 경우에, 상기 제1 시간 이후 제2 시간 이내에도 상기 통신부(270)가 상기 음성 명령에 기초한 응답 신호를 수신하지 못하면, 상기 오디오 출력부(291)는 음성 명령의 재입력을 요청하는 음성 안내 메시지를 출력할 수 있다.According to an embodiment, if the
상기 제어부(240)는, 상기 제2 시간 이내에도 상기 통신부(270)가 상기 음성 명령에 기초한 응답 신호를 수신하지 못하면, 상기 명령어 대기 모드로 전환하도록 제어할 수 있다.If the
본 발명의 일 실시예에 따른 홈 어플라이언스(200)는, 다른 방식으로도 사용자에게 소정 정보를 제공할 수 있다.The
예를 들어, 본 발명의 일 실시예에 따른 홈 어플라이언스(200)는 기설정된 경과 시간 이내에 음성 명령이 수신되면, 명령어를 수신하였음을 사용자에게 알리기 위하여, 구동부(280)가 명령어 수신에 대응하는 피드백 동작을 수행할 수 있다.For example, in the
실시예에 따라서는, 상기 기설정된 경과 시간 이내에 상기 음성 명령이 수신되면(S727), 홈 어플라이언스(200)가 명령어를 수신하였음을 사용자에게 알리기 위하여, 제어부(240)는 명령어 수신에 대응하는 피드백 동작을 수행하도록 제어할 수 있다.According to an embodiment, when the voice command is received within the preset elapsed time (S727), in order to notify the user that the
이 경우에, 상기 제어부(240)의 제어에 따라, 구동부(280)는 기설정된 동작을 수행할 수 있다.In this case, under the control of the
한편, 음성 서버(110) 및 이를 포함하는 음성 인식 서버 시스템(100)은 상술한 것과 같이 홈 어플라이언스(200)로부터 수신되는 음성 명령을 포함하는 음성 데이터를 인식하고 처리할 수 있다.Meanwhile, the
이에 따라, 통신부(270)가 가전 제어 서버(130)로부터 상기 음성 명령에 기초한 제어 신호를 수신하면(S740), 제어부(240)는 수신한 제어 신호에 대응하여 동작하도록 홈 어플라이언스(200)를 제어할 수 있다(S745).Accordingly, when the
또한, 통신부(270)가 상기 음성 서버(110)로부터 상기 음성 명령에 기초한 응답 신호를 수신하면(S750), 제어부(240)는 수신한 응답 신호에 대응하는 음성 안내 메시지를 출력하도록 오디오 출력부(291)를 제어할 수 있다(S770).In addition, when the
실시예에 따라서는, 상기 응답 신호가 음성 데이터를 포함하지 않는 경우(S760), 제어부(240)는 상기 음성 서버(110)로 음성 데이터를 요청하여(S765), 상기 음성 서버(110)로부터 요청한 음성 데이터를 수신하도록 제어할 수 있다.According to an embodiment, when the response signal does not include voice data (S760), the
한편, 음성 인식 결과에 따라서, 상기 통신부(270)를 통하여 상기 음성 서버(110)로부터 음성 인식 실패에 대응하는 신호를 수신할 수 있다. 이 경우에, 제어부(240)는 음성 명령의 재입력을 요청하는 음성 안내 메시지를 출력하도록 오디오 출력부(291)를 제어하고, 다시 상기 명령어 대기 모드로 전환하도록 제어할 수 있다.Meanwhile, according to the voice recognition result, a signal corresponding to voice recognition failure may be received from the
또한, 판별된 음성 명령의 지원 가능 여부 판별에 따라서, 상기 통신부(270)를 통하여 상기 음성 서버(110)로부터 상기 음성 명령이 지원되지 않는 기능에 관한 것임을 알리는 신호를 수신할 수 있다(S735). 이 경우에, 제어부(240)는 상기 음성 명령이 지원되지 않는 기능에 관한 것임을 알리는 음성 안내 메시지를 출력하도록 오디오 출력부(291)를 제어할 수 있다(S737).In addition, according to the determined whether the voice command can be supported, a signal notifying that the voice command is related to a function not supported may be received from the
이 경우에, 제어부(240)는 웨이크업 신호 대기 모드로 전환하도록 제어할 수 있다.In this case, the
또는, 제어부(240)는 다시 상기 명령어 대기 모드로 전환하도록 제어할 수 있다.Alternatively, the
본 발명에 따르면 각 상황에 맞는 시각적 정보 및/또는 음성 안내 메시지를 제공함으로써, 음성 제어 명령 시 어느 단계에서 어떤 문제로 정상제어 되지 않는지 정확하게 파악할 수 있다는 장점이 있다. 또한, 제품을 제어할 수 있는 명령어의 자유도가 높아 사용성이 개선된다.According to the present invention, by providing visual information and/or voice guidance messages suitable for each situation, there is an advantage in that it is possible to accurately identify at which stage and which problem the normal control is not performed during the voice control command. In addition, the degree of freedom of commands to control the product is high, which improves usability.
도 8은 본 발명의 일 실시예에 따른 홈 어플라이언스 및 음성 인식 서버 시스템의 개념도이다.8 is a conceptual diagram of a home appliance and a voice recognition server system according to an embodiment of the present invention.
도 8을 참조하면, 스마트 홈 시스템은 자연어 음성 처리를 위한 음성 인식 서버 시스템(100)을 포함할 수 있다.Referring to FIG. 8 , the smart home system may include a voice
또한, 음성 인식 기능을 지원하는 홈 어플라이언스들이 증가함에 따라, 스마트 홈 시스템은 동일한 호출어가 설정된 복수의 홈 어플라이언스들(200a 내지 200f)을 포함할 수 있다.Also, as home appliances supporting a voice recognition function increase, the smart home system may include a plurality of
도 8을 참조하면, 공기조화기(200a), 로봇청소기(200b), 냉장고(200c), 세탁기(200d), 조리기기(200e), 공기청정기(200f)가 동일한 호출어를 사용할 수 있다. 예를 들어, 복수의 홈 어플라이언스들(200a 내지 200f)의 동일한 호출어로 “Hi LG”가 설정될 수 있다.Referring to FIG. 8 , the
복수의 홈 어플라이언스들(200a 내지 200f)에 설정된 호출어가 동일할 때, 사용자가 “Hi LG” 등 호출어를 발화하면, 호출어를 수신한 모든 홈 어플라이언스가 자연어 음성 명령을 받을 준비가 되도록 깨어나 명령어 대기 모드로 진입할 수 있다.When the call word set in the plurality of
예를 들어, 사용자의 호출어 발화 위치 및 홈 어플라이언스들(200a 내지 200f)의 배치 위치에 따라, 복수의 홈 어플라이언스들(200a 내지 200f) 중 공기조화기(200a), 로봇청소기(200b), 냉장고(200c), 조리기기(200e)가 사용자가 발화한 호출어를 수신할 수 있다.For example, the
이 경우에, 호출어를 수신한 공기조화기(200a), 로봇청소기(200b), 냉장고(200c), 조리기기(200e)가 모두 이후의 사용자 음성 입력에 반응할 수 있다.In this case, the
이에 따라, 사용자의 음성 명령 발화 후, 복수의 기기가 음성 인식을 시도하고, 동일한 명령을 수행하게 되므로, 시스템 과부하나 중복 제어로 인한 오동작 발생의 위험이 커질 수 있고, 음성 오인식의 위험도 커질 수 있다.Accordingly, after the user's voice command is uttered, since a plurality of devices attempt voice recognition and perform the same command, the risk of malfunction due to system overload or redundant control may increase, and the risk of voice misrecognition may increase. .
따라서, 동일한 호출어를 사용하는 기기들을 효과적으로 제어할 수 있는 방안이 요구된다.Accordingly, there is a need for a method for effectively controlling devices using the same call word.
한편, 사용자가 특정 기기를 음성으로 제어하고자 할 때, 사용자는 제어하고자 하는 기기를 바라보고 발화하거나 제어하고자 하는 기기 근처에서 발화할 확률이 매우 높다.On the other hand, when the user wants to control a specific device by voice, the user has a very high probability of looking at the device to be controlled and uttering or uttering near the device to be controlled.
따라서, 사용자가 특정 호출어를 부를 때, 제어 대상 기기가 가장 근처에 있거나 사용자 정면에 있다고 가정할 수 있다. Accordingly, when the user calls a specific call word, it may be assumed that the controlling device is closest to or in front of the user.
본 발명은, 스마트 홈 시스템에 동일한 호출어가 설정된 기기가 여러 대 있을 경우, 사용자와 가장 근접해 있거나 정면에 있는 홈 어플라이언스(200a)만 웨이크 업(wake-up)되어 명령어 대기 모드로 진입하도록 제어할 수 있다.In the present invention, when there are several devices with the same call word set in the smart home system, only the
또한, 사용자와 가장 근접해 있거나 정면에 있는 홈 어플라이언스(200a)만이 사용자의 음성 명령을 인식하고 수행하도록 제어할 수 있다.In addition, only the
도 8을 참조하면, 공기조화기(200a), 로봇청소기(200b), 냉장고(200c), 조리기기(200e)가 구비하는 마이크로 사용자가 발화한 호출어가 수신될 수 있다.Referring to FIG. 8 , a call word uttered by a micro user provided in the
각 홈 어플라이언스(200a, 200b, 200c, 200e)는 복수의 마이크를 포함할 수 있다. 각 홈 어플라이언스(200a, 200b, 200c, 200e)는 최소한 2개의 마이크를 구비할 수 있다.Each
각 홈 어플라이언스(200a, 200b, 200c, 200e)는 복수의 마이크를 통하여 수신된 음성 신호에서 잡음 처리 등 전처리 과정을 수행한 후에, 호출어를 포함하는 음성 데이터를 음성 인식 서버 시스템(100)으로 전송할 수 있다.Each
이 경우에, 각 홈 어플라이언스(200a, 200b, 200c, 200e)는 적어도 2이상의 마이크를 통해 수신된 음성 신호에 기초한 음성 데이터를 음성 인식 서버 시스템(100)으로 전송할 수 있다. In this case, each
예를 들어, 각 홈 어플라이언스(200a, 200b, 200c, 200e)가 좌/우측 마이크를 구비하는 경우, 좌측 마이크를 통해 수신한 호출어 음성 데이터와 우측 마이크를 통해 수신한 호출어 음성 데이터를 음성 인식 서버 시스템(100)으로 전송할 수 있다. For example, when each
또한, 각 홈 어플라이언스(200a, 200b, 200c, 200e)는 음성 신호를 수신한 시간 정보 등 소정 정보를 음성 인식 서버 시스템(100)으로 전송할 수 있다. Also, each
예를 들어, 각 홈 어플라이언스(200a, 200b, 200c, 200e)는 음성 인식 서버 시스템(100)으로 등록된 제품 ID정보, 인식된 시간 정보, 호출어 발화 음성 데이터를 전송할 수 있다.For example, each of the
한편, 음성 인식 서버 시스템(100)의 음성 서버(110)는, 수신되는 음성 데이터를 인식할 수 있다. 또한, 음성 서버(110)는, 수신되는 음성 데이터 신호의 크기, 사용자의 방향성 정보, 인식 정확도를 판별할 수 있다.Meanwhile, the
음성 서버(110)는, 판별 결과를 가전 제어 서버(130)로 전송할 수 있다. 이를 수신한 가전 제어 서버(130)는 음성 인식 및 방향성 정보로부터 사용자가 어떤 홈 어플라이언스(200a)를 호출한 것인지를 판단하여 원격 제어할 수 있다.The
예를 들어, 가전 제어 서버(130)는, 사용자가 가장 정면에 위치하는 공기조화기(200a)를 사용자가 호출한 것으로 판별할 수 있다.For example, the home
또한, 가전 제어 서버(130)는, 동일 시간대에 전송된 호출어가 다수라면, 음성 신호의 크기가 크고, 인식 정확도가 높은 값을 가지는 공기조화기(200a)에게만 응대하도록 제어할 수 있다.In addition, the home
도 8에서는 공기조화기(200a)가 선택되어 제어된 상태를 사용자에게 표시하고 효과음 또는 음성 피드백을 제어할 수 있다.In FIG. 8 , a selected and controlled state of the
도 9는 본 발명의 일 실시예에 따른 홈 어플라이언스의 동작 방법을 도시한 순서도이다.9 is a flowchart illustrating a method of operating a home appliance according to an embodiment of the present invention.
도 9를 참조하면, 본 발명의 일 실시예에 따른 홈 어플라이언스는, 복수의 마이크(221, 222)를 통하여 기설정된 호출어를 포함하는 음성 신호를 수신할 수 있다(S910).Referring to FIG. 9 , the home appliance according to an embodiment of the present invention may receive a voice signal including a preset call word through a plurality of
본 발명의 일 실시예에 따른 홈 어플라이언스는, 적어도 2이상의 마이크(221, 222)를 포함할 수 있고, 2이상의 마이크(221, 222)가 각각 사용자의 음성 신호를 수신할 수 있다.The home appliance according to an embodiment of the present invention may include at least two or
통신부(270)는, 제어부(240)의 제어에 따라, 상기 복수의 마이크(221, 222)를 통하여 수신된 음성 신호 중 적어도 2이상의 마이크(221, 222)를 통하여 수신된 음성 신호를 음성 인식 서버 시스템(100)으로 전송할 수 있다(S920).The
예를 들어, 오디오 입력부(220)가 제1 마이크(221)와 제2 마이크(222)를 구비하고 있다면, 통신부(270)는, 제1 마이크(221)와 제2 마이크(222)에서 수신된 음성 신호를 전부 음성 인식 서버 시스템(100)으로 전송할 수 있다.For example, if the
또한, 제1 마이크(221)와 제2 마이크(222)가 좌측, 우측 등 어느 위치에 배치되었는 지 등 배치 정보도 함께 음성 인식 서버 시스템(100)으로 전송할 수 있다.In addition, arrangement information such as where the
음성 인식 서버 시스템(100)는 수신한 데이터에 기초하여, 소정 홈 어플라이언스를 선택하여, 선택된 홈 어플라이언스에게는 발화자의 음성 명령 입력 대기를 위한 웨이크 업 통보 신호를 전송할 수 있다.The voice
통신부(270)가 상기 음성 인식 서버 시스템으로부터 발화자의 음성 명령 입력 대기를 위한 웨이크 업 통보 신호를 수신하면(S930), 제어부(240)는 기설정된 경과 시간 동안 상기 발화자의 음성 명령 입력을 위한 명령어 대기 모드로 진입하도록 제어할 수 있다(S960).When the
한편, 통신부(270)가 상기 음성 인식 서버 시스템(100)으로부터 상기 발화자의 음성 명령에 응답하지 않도록 제어하는 슬립(sleep) 신호를 수신하면(S940), 제어부(240)는, 이후에 입력되는 음성 명령을 처리하지 않는 슬립(sleep) 모드로 진입하도록 제어할 수 있다(S970).On the other hand, when the
실시예에 따라서는, 음성 인식 서버 시스템(100)는 선택되지 않은 홈 어플라이언스에게는 어떠한 신호도 전송하지 않을 수도 있다.According to an embodiment, the voice
따라서, 통신부(270)가 어떠한 신호도 수신하지 못한 체 설정시간이 경과하면(S950), 제어부(240)는, 이후에 입력되는 음성 명령을 처리하지 않는 슬립(sleep) 모드로 진입하도록 제어할 수 있다(S970).Therefore, when the
한편, 제어부(240)는, 상기 웨이크 업 통보 신호의 수신(S930)에 대응하는 피드백 동작을 수행하도록 제어할 수 있다.Meanwhile, the
예를 들어, 제어부(240)는, 오디오 출력부(291)가 효과음, 음성 안내 등 소정 오디오 신호를 출력하도록 제어할 수 있다.For example, the
또한, 제어부(240)는, 디스플레이(292)가 소정 영상을 표시하도록 제어할 수 있다.Also, the
명령어 대기 모드(S960)로 진입한 홈 어플라이언스는, 상기 마이크(221, 222)를 통하여 사용자가 발화한 음성 명령을 수신할 수 있고, 상기 음성 명령을 포함하는 음성 데이터를 상기 음성 인식 서버 시스템(100)으로 전송할 수 있다.The home appliance that has entered the command standby mode (S960) may receive a voice command uttered by a user through the
이후, 상기 통신부(270)가 상기 음성 인식 서버 시스템(100)으로부터 상기 음성 명령에 기초한 제어 신호를 수신하면, 상기 제어부(240)는, 수신한 제어 신호에 대응하여 동작하도록 제어할 수 있다.Thereafter, when the
또한, 상기 통신부(270)가 상기 음성 인식 서버 시스템(100)으로부터 상기 음성 명령에 기초한 응답 신호를 수신하면, 상기 제어부(240)는, 수신한 응답 신호에 대응하는 음성 안내 메시지를 출력하도록 오디오 출력부(291)를 제어할 수 있다.In addition, when the
만약, 상기 응답 신호가 음성 데이터를 포함하지 않는 경우, 제어부(240)는, 상기 음성 인식 서버 시스템(100)으로 음성 데이터를 요청할 수 있다.If the response signal does not include voice data, the
상기 통신부(270)가 상기 음성 인식 서버 시스템(100)으로부터 요청한 음성 데이터를 수신하면, 상기 제어부(240)는, 수신한 음성 데이터에 기초하는 음성 안내 메시지를 출력하도록 오디오 출력부(291)를 제어할 수 있다.When the
도 10은 본 발명의 일 실시예에 따른 음성 인식 서버 시스템의 동작 방법을 도시한 순서도이다.10 is a flowchart illustrating a method of operating a voice recognition server system according to an embodiment of the present invention.
도 10을 참조하면, 본 발명의 일 실시예에 따른 음성 인식 서버 시스템(100)은, 복수의 홈 어플라이언스가 각각 구비하는 복수의 마이크(MIC)를 통하여 입력된 호출어를 포함하는 음성 신호를 상기 복수의 홈 어플라이언스로부터 수신할 수 있다(S1010).Referring to FIG. 10 , the voice
상기 복수의 홈 어플라이언스는 동일한 호출어가 설정될 수 있고, 호출어를 수신한 홈 어플라이언스는 호출어를 포함하는 음성 데이터를 음성 신호를 수신한 마이크 정보, 마이크 배치 정보 등과 함께 음성 인식 서버 시스템(100)으로 전송할 수 있다.The plurality of home appliances may have the same call word set, and the home appliance that has received the call word transmits voice data including the call word together with the microphone information and microphone arrangement information that has received the voice signal in the voice
또한, 음성 인식 서버 시스템(100)은 상기 복수의 홈 어플라이언스의 식별 정보(제품 ID 등), 상기 음성 신호의 입력(수신) 시간 정보 등을 더 수신할 수 있다.In addition, the voice
음성 인식 서버 시스템(100)은, 수신함 음성 데이터에 기초하여 음성 인식 과정을 수행할 수 있다(S1020). 예를 들어, 음성 서버(110)는, 수신된 음성 데이터에 포함되는 사용자 음성을 인식하고 처리할 수 있다.The voice
또한, 음성 인식 서버 시스템(100)은, 상기 복수의 마이크를 통하여 입력된 음성 신호의 시간차에 기초하여, 상기 복수의 홈 어플라이언스에 대한 발화자의 방향성 정보를 판별할 수 있다(S1030).In addition, the voice
예를 들어, 음성 서버(110) 또는 가전 제어 서버(130)는, 좌측 마이크와 우측 마이크에 음성 신호가 수신된 시간이 차이가 없을수록 해당 홈 어플라이언스가 발화자 정면에 있다고 판별할 수 있다.For example, the
한편, 음성 인식 서버 시스템(100)은, 상기 방향성 정보에 기초하여, 상기 복수의 홈 어플라이언스 중 하나의 홈 어플라이언스를 선택할 수 있다(S1040).Meanwhile, the voice
예를 들어, 가전 제어 서버(130)는 자체적으로 판별한 결과 또는 음성 서버(110)로부터 수신한 판별 결과에 따라, 복수의 홈 어플라이언스 중 하나의 홈 어플라이언스를 선택할 수 있다.For example, the home
상기 가전 제어 서버(130)는, 상기 입력 시간 정보가 소정 시간 구간 범위에 포함되는 음성 신호들을 추출하고, 추출된 음성 신호에 기초하여, 하나의 홈 어플라이언스를 선택할 수 있다. The home
소정 시간 구간 범위 내에 수신되는 음성 신호는 동일한 사용자 발화에 의한 음성 신호로 판별할 수 있다. 따라서, 상기 가전 제어 서버(130)는, 복수의 홈 어플라이언스로부터 수신되는 음성 신호 중 동일한 사용자 발화에 의한 음성 신호들을 추출하고, 추출된 음성 신호에 기초하여, 하나의 홈 어플라이언스를 선택할 수 있다. A voice signal received within a predetermined time interval may be determined as a voice signal generated by the same user utterance. Accordingly, the home
상기 가전 제어 서버(130)는, 상기 복수의 홈 어플라이언스에 대한 발화자의 방향성 정보에 기초하여, 상기 발화자에 가장 정면에 위치하는 홈 어플라이언스를 선택할 수 있다.The home
한편, 발화자를 기준으로 정면에 위치하는 홈 어플라이언스도 복수개 존재할 수 있다. 또한, 발화자를 기준으로 정면에 위치하는 홈 어플라이언스라도 사용자로부터 너무 멀리 떨어져 음성 신호가 작게 수신된다면 해당 홈 어플라이언스를 제어한다고 판단하기 어렵다. 따라서, 방향성 정보뿐만 아니라, 음성 신호의 신호 크기를 더 고려할 수 있다.Meanwhile, a plurality of home appliances positioned in front of the talker may also exist. In addition, even if the home appliance is located in front of the talker, it is difficult to determine that the home appliance is controlled if the voice signal is received too far away from the user. Accordingly, it is possible to further consider the signal magnitude of the voice signal as well as the directionality information.
즉, 상기 가전 제어 서버(130)는, 상기 음성 신호의 신호 크기가 소정 기준치 이상인 음성 신호에 대응하는 홈 어플라이언스 중 상기 발화자에 가장 정면에 위치하는 홈 어플라이언스를 선택할 수 있다.That is, the home
한편, 상기 가전 제어 서버(130)는, 상기 복수의 홈 어플라이언스에 대한 발화자의 방향성 정보에 기초하여, 상기 발화자를 기준으로 소정 각도 이내에 위치하는 홈 어플라이언스 중 가장 신호 크기가 큰 음성 신호에 대응하는 홈 어플라이언스를 선택할 수 있다.On the other hand, the home
본 실시예는 발화자를 기준으로 소정 각도 이내에 위치하는 홈 어플라이언스를 1차 판별하고, 1차 판별된 홈 어플라이언스 중 신호 크기를 비교하여, 최종적으로 특정 홈 어플라이언스를 선택할 수 있다.In this embodiment, home appliances located within a predetermined angle with respect to the talker may be primarily determined, and signal magnitudes of the firstly determined home appliances may be compared, and a specific home appliance may be finally selected.
한편, 음성 인식 서버 시스템(100)은, 상기 선택된 홈 어플라이언스로 상기 발화자의 음성 명령 입력 대기를 위한 웨이크 업 통보 신호를 전송할 수 있다(S1050).Meanwhile, the voice
실시예에 따라서는, 음성 인식 서버 시스템(100)은, 상기 복수의 홈 어플라이언스 중 상기 선택된 홈 어플라이언스를 제외한 하나 이상의 홈 어플라이언스로 상기 발화자의 음성 명령에 응답하지 않도록 제어하는 슬립(sleep) 신호를 전송할 수 있다(S1060).According to an embodiment, the voice
동일 호출어를 사용하는 음성 인식 홈 어플라이언스가 가정 내에 여러대 있을 경우, 사용자는 특정 홈 어플라이언스에게 명령어를 내리고 싶지만, 호출어가 동일하여 인접해 있는 다른 음성 인식 홈 어플라이언스도 모두 웨이크 업(wake-up)될 수 있다.If there are multiple voice recognition home appliances using the same call word in the home, the user wants to give a command to a specific home appliance, but all other voice recognition home appliances in the vicinity with the same call word also wake up. can be
이를 방지하기 위해, 본 발명은, 음성의 방향 정보와 세기 정보를 이용하여 하나의 홈 어플라이언스만 응답시킬 수 있다.To prevent this, according to the present invention, only one home appliance can respond using direction information and strength information of a voice.
본 발명에 따르면, 사용자가 호출어를 발화하고, 여러 홈 어플라이언스들에서 호출어가 인식이 되었을 때, 각 홈 어플라이언스들은 등록된 제품 ID 정보 등 식별 정보, 호출어가 인식된 시간 정보, 약 1초 가량의 음성 데이터(호출어 발화 음성 데이터) 등을 음성 인식 서버 시스템(100)으로 전송할 수 있다.According to the present invention, when a user utters a call word and the call word is recognized by several home appliances, each home appliance receives identification information such as registered product ID information, time information at which the call word is recognized, and about 1 second. Voice data (voice data uttered by a calling word) may be transmitted to the voice
음성 인식 서버 시스템(100)은 수신한 음성 데이터에 기초하여 호출어를 재인식을 해서, 정확도를 재추출하고 전송된 음성의 세기도 측정할 수 있다.The voice
또한 각 홈 어플라이언스들은 2개 이상의 마이크 입력 신호 정보를 모두 보내고, 음성 인식 서버 시스템(100)에서, 화자의 발화 방향 정보를 판별할 수 있다.In addition, each home appliance may transmit information on two or more microphone input signals, and the voice
음성 인식 서버 시스템(100)의 소정 서버는, 화자의 발화 방향 정보에 기초하여 소정 홈 어플라이언스를 선택할 수 있다.A predetermined server of the voice
예를 들어, 가전 제어 서버(130)는 각 홈 어플라이언스들로부터 동일한 시간대에 받은 데이터 중에 가장 정면에 위치하는 홈 어플라이언스에게 웨이크 업(wake-up) 통보 신호를 전송하고 나머지 홈 어플라이언스에는 슬립(sleep) 신호를 보내 응대를 하지 않게 한다.For example, the home
또한, 가전 제어 서버(130)는 각 홈 어플라이언스들로부터 동일한 시간대에 받은 데이터 중에 가장 큰 음성 세기를 가지고, 정확도가 높은 홈 어플라이언스에게 웨이크 업(wake-up) 통보 신호를 전송하고 나머지 홈 어플라이언스에는 슬립(sleep) 신호를 보내 응대를 하지 않게 한다. In addition, the home
본 실시예에서도, 음성 크기와 정확도가 비슷할 경우, 가전 제어 서버(130)는 방향 정보가 정면쪽에서(90도 주변) 발화된 홈 어플라이언스에게 우선권을 부여할 수 있다.Also in this embodiment, when the voice volume and accuracy are similar, the home
한편, 웨이크 업(wake-up) 통보 신호를 받은 가전만 사용자로부터 자연어 음성 명령을 받고, 동작을 수행할 수 있다.On the other hand, only the home appliance that has received a wake-up notification signal may receive a natural language voice command from the user and perform an operation.
이에 따라, 호출어가 동일하더라도, 사용자를 중심으로 가장 가까이 있는 홈 어플라이언스만 먼저 응대하기 때문에, 음성 인식 거리가 짧아져, 인식 성공률도 높아질 수 있다.Accordingly, even if the call word is the same, since only the home appliance closest to the user is answered first, the voice recognition distance is shortened and the recognition success rate can be increased.
또한, 본 발명에 따르면, 동시에 여러 대의 홈 어플라이언스가 동작하지 않기 때문에, 이로 인한 서버 제어의 과부하를 방지할 수 있다.In addition, according to the present invention, since a plurality of home appliances do not operate at the same time, it is possible to prevent overload of server control due to this.
도 11은 본 발명의 일 실시예에 따른 홈 어플라이언스와 음성 인식 서버 시스템의 동작 방법을 도시한 순서도이다.11 is a flowchart illustrating a method of operating a home appliance and a voice recognition server system according to an embodiment of the present invention.
도 11을 참조하면, N개의 홈 어플라이언스에서 호출어 인식이 됐을 때(S1110), N개의 홈 어플라이언스는 필요한 정보를 음성 서버(110)로 전송할 수 있다(S1120).Referring to FIG. 11 , when a call word is recognized by the N home appliances ( S1110 ), the N home appliances may transmit necessary information to the voice server 110 ( S1120 ).
예를 들어, N개의 홈 어플라이언스는, 호출어가 포함된 음성 데이터, 입력 시간 정보, 제품 식별 정보 등을 전송할 수 있다.For example, the N home appliances may transmit voice data including a call word, input time information, product identification information, and the like.
한편, 음성 서버(110)는 수신한 음성 데이터에 기초하여 호출어를 재인식을 해서, 정확도를 재추출하고, 전송된 음성의 세기도 측정할 수 있다(S1130).Meanwhile, the
또한, 음성 서버(110)는 각 홈 어플라이언스의 2개 이상의 마이크 입력 신호 정보에서, 화자의 발화 방향 정보를 판별할 수 있다. 예를 들어, 음성 서버(110)는 각 홈 어플라이언스가 구비하는 복수의 마이크에 호출어가 입력된 시간 차이를 비교하여 화자의 발화 방향 정보를 판별할 수 있다(S1130).Also, the
가전 제어 서버(130)는, 음성 인식 정확도, 음성 신호 크기, 방향성 정보 중 하나 이상에 기초하여, 사용자 근접 홈 어플라이언스를 선택할 수 있다(S1140). The home
또한, 가전 제어 서버(130)는, 선택된 홈 어플라이언스 등으로 제어 신호를 전송할 수 있다(S1140).In addition, the home
예를 들어, 가전 제어 서버(130)는, 상기 선택된 홈 어플라이언스로 상기 발화자의 음성 명령 입력 대기를 위한 웨이크 업 통보 신호를 전송할 수 있다.For example, the home
실시예에 따라서는, 가전 제어 서버(130)는, 상기 복수의 홈 어플라이언스 중 상기 선택된 홈 어플라이언스를 제외한 하나 이상의 홈 어플라이언스로 상기 발화자의 음성 명령에 응답하지 않도록 제어하는 슬립(sleep) 신호를 전송할 수 있다.According to an embodiment, the home
한편, 상기 선택된 홈 어플라이언스는 명령어 대기 모드로 진입하고, 명령어 대기 모드에서 입력되는 사용자의 음성 명령에 따라 제어될 수 있다(S1150).Meanwhile, the selected home appliance enters a command standby mode and may be controlled according to a user's voice command input in the command standby mode (S1150).
또한, 상기 선택된 홈 어플라이언스는 사용자의 음성 명령에 따라 동작하면서, 이에 대한 음성 안내 메시지를 출력할 수 있다(S1160).In addition, the selected home appliance may output a voice guidance message therefor while operating according to a user's voice command (S1160).
도 12는 본 발명의 일 실시예에 따른 음성 인식 서버 시스템의 동작예이다.12 is an operation example of a voice recognition server system according to an embodiment of the present invention.
도 12를 참조하면, 공기초화기(200a)와 세탁기(200d)가 사용자가 발화한 호출어를 수신할 수 있다.Referring to FIG. 12 , the
공기초화기(200a)와 세탁기(200d)는 복수의 마이크를 구비하고, 각각 복수의 마이크로 입력된 호출어 음성 데이터, 호출어가 입력된 시간 정보, 호출어가 입력된 마이크 식별 정보, 제품 식별 정보 등을 음성 서버(110)로 전송할 수 있다.The
상기 음성 서버(110)는, 홈 어플라이언스(200)로부터 음성 데이터를 수신하고, 수신한 음성 데이터를 텍스트(text) 데이터로 변환하는 자동 음성 인식 서버(111), 상기 자동 음성 인식 서버(111)로부터 상기 텍스트 데이터를 수신하고, 수신한 텍스트 데이터를 분석하여 음성 명령을 판별하며, 상기 판별한 음성 명령에 기초하는 응답 신호를 홈 어플라이언스(200)로 송신하는 자연어 처리 서버(112), 및, 상기 홈 어플라이언스(200)로부터 상기 응답 신호에 대응하는 텍스트를 포함하는 신호를 수신하고, 수신한 신호에 포함되는 텍스트를 음성 데이터로 변환하여 상기 홈 어플라이언스(200)로 송신하는 텍스트 음성 변환 서버(113)를 포함할 수 있다.The
상기 자동 음성 인식 서버(111)는 공기초화기(200a)와 세탁기(200d)로부터 수신한 음성 데이터에 대하여 음성 인식을 수행하여 텍스트 데이터를 생성하여 상기 자연어 처리 서버(112)로 송신할 수 있다.The automatic
상기 자연어 처리 서버(112)는 상기 자동 음성 인식 서버(111)로부터 수신한 텍스트 데이터를 자연어 처리 알고리즘에 따라 분석하여 호출어 및 음성 명령을 판별할 수 있다. The natural
한편, 상기 자연어 처리 서버(112)는 호출어를 재인식해서, 정확도를 재추출하고 전송된 음성의 세기도 측정하며, 화자의 발화 방향 정보를 추출할 수 있다. Meanwhile, the natural
상기 자연어 처리 서버(112)는 음성 인식 정확도, 음성 세기 정보, 화자의 발화 방향 정보 등을 가전 제어 서버(130)로 전송할 수 있다.The natural
가전 제어 서버(130)는 상기 방향 정보에 기초하여, 공기초화기(200a)와 세탁기(200d) 중 발화자 정명에 있을 것으로 판별되는 공기초화기(200a)로 발화자의 음성 명령 입력 대기를 위한 웨이크 업 통보 신호를 전송할 수 있다.Based on the direction information, the home
또한, 가전 제어 서버(130)는, 세탁기(200d)로 발화자의 음성 명령에 응답하지 않도록 제어하는 슬립(sleep) 신호를 전송할 수 있다.In addition, the home
이후, 공기초화기(200a)는 입력되는 사용자의 음성 명령을 음성 서버(110)로보내고, 도 3a 등을 참조하여 설명한 것과 같이, 음성 서버(I110)의 응답 신호, 가전 제어 서버(130)의 제어 신호에 따라 동작할 수 있다.Thereafter, the
세탁기(200d)는 입력되는 사용자의 음성 명령을 소정 시간 무시할 수 있다.The
본 발명의 실시예들 중 적어도 하나에 의하면, 동일한 호출어를 사용하는 홈 어플라이언스들을 효과적으로 제어할 수 있다.According to at least one of the embodiments of the present invention, it is possible to effectively control home appliances using the same call word.
또한, 본 발명의 실시예들 중 적어도 하나에 의하면, 음성 입력에 따라 홈 어플라이언스가 동작함으로써, 사용자가 리모콘을 조작할 필요가 없어, 사용자 편의성을 증대시킬 수 있다.In addition, according to at least one of the embodiments of the present invention, since the home appliance operates according to a voice input, the user does not need to operate the remote control, thereby increasing user convenience.
또한, 본 발명의 실시예들 중 적어도 하나에 의하면, 효율적으로 자연어를 인식, 처리할 수 있다.In addition, according to at least one of the embodiments of the present invention, it is possible to efficiently recognize and process natural language.
또한, 본 발명의 실시예들 중 적어도 하나에 의하면, 음성 인식 과정에서 발생할 수 있는 오인식, 오동작을 방지할 수 있다.In addition, according to at least one of the embodiments of the present invention, it is possible to prevent erroneous recognition and malfunction that may occur during the speech recognition process.
본 발명에 따른 음성 서버, 음성 인식 서버 시스템 및 홈 어플라이언스는 상기한 바와 같이 설명된 실시예들의 구성과 방법이 한정되게 적용될 수 있는 것이 아니라, 상기 실시예들은 다양한 변형이 이루어질 수 있도록 각 실시예들의 전부 또는 일부가 선택적으로 조합되어 구성될 수도 있다.In the voice server, voice recognition server system, and home appliance according to the present invention, the configuration and method of the embodiments described above cannot be limitedly applied, but the embodiments are the examples of each embodiment so that various modifications can be made. All or a part may be selectively combined and configured.
한편, 본 발명의 실시예에 따른 음성 서버, 음성 인식 서버 시스템 및 홈 어플라이언스의 동작 방법은, 프로세서가 읽을 수 있는 기록매체에 프로세서가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 프로세서가 읽을 수 있는 기록매체는 프로세서에 의해 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 프로세서가 읽을 수 있는 기록매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피디스크, 광 데이터 저장장치 등이 있으며, 또한, 인터넷을 통한 전송 등과 같은 캐리어 웨이브의 형태로 구현되는 것도 포함한다. 또한, 프로세서가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 프로세서가 읽을 수 있는 코드가 저장되고 실행될 수 있다.Meanwhile, the method of operating a voice server, a voice recognition server system, and a home appliance according to an embodiment of the present invention can be implemented as processor-readable codes on a processor-readable recording medium. The processor-readable recording medium includes all types of recording devices in which data readable by the processor is stored. Examples of the processor-readable recording medium include ROM, RAM, CD-ROM, magnetic tape, floppy disk, optical data storage device, etc., and also includes those implemented in the form of carrier waves such as transmission over the Internet. . In addition, the processor-readable recording medium is distributed in a computer system connected to a network, so that the processor-readable code can be stored and executed in a distributed manner.
또한, 이상에서는 본 발명의 바람직한 실시예에 대하여 도시하고 설명하였지만, 본 발명은 상술한 특정의 실시예에 한정되지 아니하며, 청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 기술분야에서 통상의 지식을 가진자에 의해 다양한 변형실시가 가능한 것은 물론이고, 이러한 변형실시들은 본 발명의 기술적 사상이나 전망으로부터 개별적으로 이해되어서는 안될 것이다.In addition, although preferred embodiments of the present invention have been illustrated and described above, the present invention is not limited to the specific embodiments described above, and the technical field to which the present invention belongs without departing from the gist of the present invention as claimed in the claims In addition, various modifications are possible by those of ordinary skill in the art, and these modifications should not be individually understood from the technical spirit or perspective of the present invention.
음성 인식 서버 시스템: 100
음성 서버: 110
ASR 서버: 111
NLP 서버: 112
TTS 서버: 113
연계 서비스 서버: 120
가전 제어 서버: 130
홈 어플라이언스: 200Speech Recognition Server System: 100
Voice Server: 110
ASR Server: 111
NLP Server: 112
TTS Server: 113
Linked service server: 120
Appliance Control Server: 130
Home Appliance: 200
Claims (15)
상기 복수의 마이크를 통하여 입력된 음성 신호에 기초하여, 상기 복수의 홈 어플라이언스 각각에 대한 발화자의 방향을 결정하는 단계;
상기 발화자의 방향에 기초하여, 상기 복수의 홈 어플라이언스 중 어느 하나를 선택하는 단계;
상기 선택된 홈 어플라이언스로 상기 발화자의 음성 명령 입력 대기를 위한 웨이크 업 통보 신호를 전송하는 단계; 및,
상기 복수의 홈 어플라이언스 중 상기 선택된 홈 어플라이언스를 제외한 나머지 홈 어플라이언스로, 상기 발화자의 음성 명령에 응답하지 않도록 제어하는 슬립(sleep) 신호를 전송하는 단계;를 포함하는 음성 인식 서버 시스템의 동작 방법.Receiving a voice signal including a call word input through the plurality of microphones (MIC) from a plurality of home appliances each having a plurality of microphones (MIC);
determining a direction of a speaker with respect to each of the plurality of home appliances based on the voice signals input through the plurality of microphones;
selecting one of the plurality of home appliances based on the direction of the talker;
transmitting a wake-up notification signal for waiting for the speaker to input a voice command to the selected home appliance; and,
and transmitting a sleep signal for controlling not to respond to the speaker's voice command to other home appliances except for the selected home appliance among the plurality of home appliances.
상기 복수의 홈 어플라이언스 중 어느 하나를 선택하는 단계는, 상기 복수의 홈 어플라이언스 중, 상기 음성 신호가 상기 복수의 마이크에 수신된 시간차가 가장 작아, 상기 발화자에 대하여 가장 정면에 위치하는 것으로 판단된 홈 어플라이언스를 선택하는 것을 특징으로 하는 음성 인식 서버 시스템의 동작 방법.According to claim 1,
The step of selecting any one of the plurality of home appliances includes a home determined to be located most in front of the talker because the time difference at which the voice signal is received by the plurality of microphones is the smallest among the plurality of home appliances. Method of operation of a voice recognition server system, characterized in that selecting the appliance.
상기 홈 어플라이언스를 선택하는 단계는, 상기 음성 신호의 신호 크기가 소정 기준치 이상인 음성 신호에 대응하는 홈 어플라이언스 중, 상기 음성 신호가 상기 복수의 마이크에 수신된 시간차가 가장 작아, 상기 발화자에 대하여 가장 정면에 위치하는 것으로 판단된 홈 어플라이언스를 선택하는 것을 특징으로 하는 음성 인식 서버 시스템의 동작 방법.According to claim 1,
The selecting of the home appliance may include, among home appliances corresponding to a voice signal having a signal magnitude of the voice signal equal to or greater than a predetermined reference value, the time difference at which the voice signal is received by the plurality of microphones is the smallest, and is the most front to the talker. A method of operating a voice recognition server system, characterized in that selecting a home appliance determined to be located in the
상기 홈 어플라이언스를 선택하는 단계는, 상기 발화자의 방향에 기초하여, 상기 발화자를 기준으로 소정 각도 이내에 위치하는 홈 어플라이언스 중 가장 신호 크기가 큰 음성 신호에 대응하는 홈 어플라이언스를 선택하는 것을 특징으로 하는 음성 인식 서버 시스템의 동작 방법.
According to claim 1,
The selecting of the home appliance comprises selecting a home appliance corresponding to a voice signal having the largest signal magnitude among home appliances located within a predetermined angle with respect to the talker based on the direction of the talker. How the recognition server system works.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020170113550A KR102395013B1 (en) | 2017-09-05 | 2017-09-05 | Method for operating artificial intelligence home appliance and voice recognition server system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020170113550A KR102395013B1 (en) | 2017-09-05 | 2017-09-05 | Method for operating artificial intelligence home appliance and voice recognition server system |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20190026521A KR20190026521A (en) | 2019-03-13 |
KR102395013B1 true KR102395013B1 (en) | 2022-05-04 |
Family
ID=65762049
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020170113550A KR102395013B1 (en) | 2017-09-05 | 2017-09-05 | Method for operating artificial intelligence home appliance and voice recognition server system |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102395013B1 (en) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020196955A1 (en) * | 2019-03-27 | 2020-10-01 | 엘지전자 주식회사 | Artificial intelligence device and method for operation of artificial intelligence device |
US11657800B2 (en) | 2019-04-26 | 2023-05-23 | Lg Electronics Inc. | Electronic device with wakeup word determined multi-mode operation |
US20220343909A1 (en) * | 2019-09-06 | 2022-10-27 | Lg Electronics Inc. | Display apparatus |
KR20230013473A (en) * | 2021-07-19 | 2023-01-26 | 주식회사 아모센스 | Device and method for processing voice of speakers |
CN113793608B (en) * | 2021-09-06 | 2024-03-22 | 广州联动万物科技有限公司 | Method and device for controlling intelligent household appliances through voice |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102444061B1 (en) * | 2015-11-02 | 2022-09-16 | 삼성전자주식회사 | Electronic device and method for recognizing voice of speech |
-
2017
- 2017-09-05 KR KR1020170113550A patent/KR102395013B1/en active IP Right Grant
Also Published As
Publication number | Publication date |
---|---|
KR20190026521A (en) | 2019-03-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102395013B1 (en) | Method for operating artificial intelligence home appliance and voice recognition server system | |
US11551683B2 (en) | Electronic device and operation method therefor | |
US11183173B2 (en) | Artificial intelligence voice recognition apparatus and voice recognition system | |
US10692499B2 (en) | Artificial intelligence voice recognition apparatus and voice recognition method | |
EP3599605B1 (en) | Home appliance and speech recognition server system and method for controlling thereof | |
US20200342869A1 (en) | Electronic device and method for controlling voice signal | |
US11223497B2 (en) | Method and apparatus for providing notification by interworking plurality of electronic devices | |
KR102551715B1 (en) | Generating iot-based notification(s) and provisioning of command(s) to cause automatic rendering of the iot-based notification(s) by automated assistant client(s) of client device(s) | |
US11429192B2 (en) | Confidence-based application-specific user interactions | |
CN105206275A (en) | Device control method, apparatus and terminal | |
KR102088322B1 (en) | Appliance controlling apparatus based on artificial intelligence and appliance controlling system including the same | |
US10803863B2 (en) | Artificial intelligence voice recognition apparatus | |
KR102421824B1 (en) | Electronic device for providing voice based service using external device and operating method thereof, the external device and operating method thereof | |
KR102373652B1 (en) | Method for operating artificial intelligenc air conditioner | |
CN111630413B (en) | Confidence-based application-specific user interaction | |
KR102629796B1 (en) | An electronic device supporting improved speech recognition | |
KR20180111310A (en) | Home appliance, voice recognition module and home appliance system | |
US12001614B2 (en) | Confidence-based application-specific user interactions | |
JP2017144521A (en) | Information processing device, information processing method and program | |
KR101936639B1 (en) | Home appliance and home appliance system | |
KR102044526B1 (en) | Method of increasing speech recognition based on artificial intelligence and device of implementing thereof | |
CN114175145A (en) | Multimodal intelligent audio device system attention expression | |
KR20190054707A (en) | Voice server, voice recognition server system, and method for operating the same | |
KR20240061773A (en) | Electronic device and method for controlling the electronic device | |
JP2014048748A (en) | Control device, and control method and control program of control device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |