KR20210142783A - 전자장치, 그 동작방법, 및 복수의 인공지능장치를 포함한 시스템 - Google Patents

전자장치, 그 동작방법, 및 복수의 인공지능장치를 포함한 시스템 Download PDF

Info

Publication number
KR20210142783A
KR20210142783A KR1020197020770A KR20197020770A KR20210142783A KR 20210142783 A KR20210142783 A KR 20210142783A KR 1020197020770 A KR1020197020770 A KR 1020197020770A KR 20197020770 A KR20197020770 A KR 20197020770A KR 20210142783 A KR20210142783 A KR 20210142783A
Authority
KR
South Korea
Prior art keywords
artificial intelligence
execution command
voice
electronic device
profile information
Prior art date
Application number
KR1020197020770A
Other languages
English (en)
Inventor
맹지찬
Original Assignee
엘지전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엘지전자 주식회사 filed Critical 엘지전자 주식회사
Publication of KR20210142783A publication Critical patent/KR20210142783A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
    • H04L12/2803Home automation networks
    • H04L12/2816Controlling appliance services of a home automation network by calling their functionalities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/12Protocols specially adapted for proprietary or special-purpose networking environments, e.g. medical networks, sensor networks, networks in vehicles or remote metering networks
    • H04L67/125Protocols specially adapted for proprietary or special-purpose networking environments, e.g. medical networks, sensor networks, networks in vehicles or remote metering networks involving control of end-device applications over a network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/2866Architectures; Arrangements
    • H04L67/30Profiles
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/2866Architectures; Arrangements
    • H04L67/30Profiles
    • H04L67/303Terminal profiles
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L2015/088Word spotting
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/226Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
    • G10L2015/228Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of application context

Abstract

전자장치, 그 동작방법, 및 복수의 인공 지능 장치를 포함하는 시스템이 개시된다. 본 발명에 따른 전자장치는, 음성을 수신하도록 형성된 음성 수신부, 기 설정된 시동어에 의하여 활성화되도록 설정된 인공 지능 서버와 통신하는 통신부, 인공 지능 서버와 통신하는 하나 이상의 인공 지능 장치와 통신하여 프로파일 정보를 획득하고, 획득된 프로파일 정보와 그에 매칭되는 실행가능명령의 리스트를 저장하여 하나 이상의 인공 지능 장치를 등록하는 제어부를 포함한다. 또, 제어부는, 등록된 인공 지능 장치에 기 설정된 시동어를 포함하는 음성이 수신되고 그 음성에 대응되는 실행명령이 전달된 것에 응답하여, 저장된 프로파일 정보와 리스트에 기초하여 실행명령을 수행할 인공 지능 장치를 탐색하고, 탐색된 인공 지능 장치로 실행명령을 전송한다.

Description

전자장치, 그 동작방법, 및 복수의 인공지능장치를 포함한 시스템
본 발명은 사용자의 음성을 수신하여 인공 지능 기술에 기반한 처리가 가능한 복수의 인공 지능 장치와 통신하는 전자장치, 그 동작방법, 및 복수의 인공 지능 장치를 포함한 시스템에 관한 것이다.
최근 하드웨어의 발전과 함께, 인간의 사고 과정, 즉 인지, 추론, 학습 등을 컴퓨팅 기술로 구현하는 인공 지능 기술이 비약적으로 발전하고 있다.
인공 지능 기술은 그 자체로 연구 대상이 될 뿐만 아니라, 컴퓨터 과학의 다른 분야와 직간접으로 결합되어, 다양한 기능들을 제공할 수 있다. 특히, 정보기술의 여러 분야에서 인공지능적 요소를 도입하여, 그 분야의 문제 풀이에 활용하려는 시도가 매우 활발하게 이루어지고 있다.
인공 지능 기술은 강한 인공지능과 약한 인공지능으로 구분된다. 강한 인공지능은 인간과 유사한 사고 및 의사 결정을 내릴 수 있는 기술 방식으로, 스스로 학습하여, 스스로 판단을 내리는 수준의 기술이다. 약한 인공지능은 계산 모델을 통하여, 지각, 추론 등의 인지 과정을 수행하여, 최적의 솔루션을 제공하는 수준의 기술이다.
이러한 개술 개발의 일환으로 사용자에게 가장 친숙한 전자장치에 인공 지능 기술이 적용되어, 다양한 기능을 제공하고자 하는 시도들이 늘어나고 있다.
특히, 전자 장치가 다른 디바이스와 연결되어 인공 지능 기술의 적용을 더욱 확대시키는 것과 관련된 연구가 활발하게 수행되고 있다. 예로써, 전자장치에 수신되는 사용자의 음성을 기초로 다른 디바이스를 연결할 수 있고, 연결된 디바이스에 대한 제어명령의 입력이 전자장치를 통해 수행되도록 할 수 있다.
예를 들어, 이러한 전자 장치는 인공 지능 기술이 적용된 다른 디바이스, 예를 들어 인공 지능 기술이 적용된 다양한 가전기기(이하, '인공 지능 장치'라 함)와 연결되어, 전자 장치를 통해 인공 지능 장치에 대한 제어명령을 입력할 수 있다.
그러나, 현재까지는 사용자 음성을 전자장치에 대하여 발화하거나 또는 제어를 원하는 인공 지능 장치에 발화해야만 했다. 그에 따라, 사용자는 전자장치가 있는 위치 또는 제어할 인공 지능 장치가 있는 위치로 이동하거나 또는 단말기 등의 다른 수단을 이용한 추가 조작을 수행해야만 하는 불편이 있었다.
앞서 설명한 문제점을 해결하기 위하여, 본 발명의 일 목적은 사용자가 전자장치나 제어할 가전기기의 종류 및 위치를 고려할 필요 없이 특정 인공 지능 장치에 대한 제어를 수행할 수 있는 전자장치, 그 동작방법, 및 복수의 인공 지능 장치를 포함하는 시스템을 제공하는데 그 목적이 있다.
또, 본 발명의 또 다른 목적은, 다수의 인공 지능 장치들이 사용되는 공간에서 사용자가 현재 위치에서 이동할 필요 없이 음성을 통해 특정 인공 지능 장치에 대한 제어를 수행하고 제어 결과를 확인하는 것이 가능한 전자장치, 그 동작방법, 및 복수의 인공 지능 장치를 포함하는 시스템을 제공하는데 그 목적이 있다.
또, 본 발명의 또 다른 목적은, 다수의 인공 지능 장치들이 사용되는 공간에서 사용자가 제어할 기기를 명확하게 지정하지 않더라도, 적절한 인공 지능 장치를 탐색할 수 있는 전자장치, 그 동작방법, 및 복수의 인공 지능 장치를 포함하는 시스템을 제공하는데 그 목적이 있다.
이상의 과제를 해결하기 위한 본 발명에 따른 전자장치는, 기 설정된 시동어에 의하여 활성화되도록 설정된 인공 지능 서버와 통신하는 통신부; 및 상기 인공 지능 서버와 통신하는 하나 이상의 인공 지능 장치와 통신하여 프로파일 정보를 획득하고, 획득된 프로파일 정보와 그에 매칭되는 실행가능명령의 리스트를 저장하여 상기 하나 이상의 인공 지능 장치를 등록하는 제어부를 포함한다. 또, 상기 제어부는, 등록된 인공 지능 장치에 상기 기 설정된 시동어를 포함하는 음성이 수신되고 상기 등록된 인공 지능 장치로부터 상기 음성에 대응되는 실행명령이 전달된 것에 응답하여, 상기 프로파일 정보와 리스트에 기초하여 상기 실행명령을 수행할 인공 지능 장치를 탐색하고, 탐색된 인공 지능 장치로 상기 실행명령을 전송하는 것을 특징으로 한다.
또한, 일 실시 예에서, 상기 제어부는, 일정 영역 내에 존재하는 하나 이상의 인공 지능 장치에 대한 프로파일 정보를 수신하고, 기 설정된 기준에 따라 본체가 마스터 기기로 선택된 것에 응답하여, 상기 프로파일 정보와 그에 매칭되는 실행가능명령의 리스트를 저장하는 것을 특징으로 한다.
또한, 일 실시 예에서, 상기 등록된 인공 지능 장치에 상기 기 설정된 시동어를 포함하는 음성이 수신되고 상기 음성에 대응되는 실행명령이 해당 인공 지능 장치에서 수행할 수 있는 것으로 확인되면, 해당 실행명령의 전달이 수행되지 않는 것을 특징으로 한다.
또한, 일 실시 예에서, 상기 제어부는, 상기 실행명령을 수행할 인공 지능 장치가 복수 개 탐색된 경우, 사용자의 현재 위치에 근접한 인공 지능 장치가 실행명령을 수행하도록, 해당 실행명령을 전송하는 것을 특징으로 한다.
또한, 일 실시 예에서, 상기 제어부는, 탐색된 인공 지능 장치로 상기 실행명령이 전송된 후, 해당 인공 지능 장치에서 상기 실행명령에 대응되는 동작의 결과 정보를 수신하는 것을 특징으로 한다.
또한, 일 실시 예에서, 상기 제어부는, 상기 결과 정보를 상기 음성에 대응되는 실행명령을 전달한 인공 지능 장치로 전송해주는 것을 특징으로 한다.
또한, 일 실시 예에서, 상기 제어부는, 상기 탐색된 인공 지능 장치로 상기 실행명령의 전송시, 실행명령이 포함된 제1패킷에 상기 음성에 대응되는 실행명령을 전달한 제1인공 지능 장치의 프로파일 정보를 첨부하고, 상기 제1패킷을 수신한 제2인공 지능 장치가, 상기 실행명령의 대응되는 동작의 결과 정보가 포함된 제2패킷에 자신의 프로파일 정보를 첨부하여 상기 제1인공 지능 장치로 전송하도록 제어하는 것을 특징으로 한다.
또한, 일 실시 예에서, 상기 기 설정된 시동어를 포함하는 음성이 복수의 인공 지능 장치에 수신된 경우, 음성 수신 상태의 비교 결과에 근거하여 어느 하나의 인공 지능 장치가 선택되고, 선택된 인공 지능 장치로부터 상기 음성에 대응되는 실행명령이 수신되는 것을 특징으로 한다.
또한, 일 실시 예에서, 상기 기 설정된 시동어를 포함하는 복수의 서로 다른 음성이 수신된 경우, 복수의 서로 다른 음성을 발화한 각 사용자로부터 근접한 복수의 인공 지능 장치로부터, 각 음성에 대응되는 복수의 실행명령이 전달되고, 상기 제어부는, 탐색된 인공 지능 장치에 상기 복수의 실행명령의 전송시, 상기 복수의 실행명령 각각에 매칭되는 복수의 인공 지능 장치에 대한 ID를 첨부하는 것을 특징으로 한다.
또, 본 발명의 실시 예에 따른 복수의 인공 지능 장치를 포함하는 시스템은, 기 설정된 시동어에 의하여 활성화되도록 설정된 인공 지능 서버; 상기 기 설정된 시동어를 포함하는 음성을 수신하도록 설정된 복수의 인공 지능 장치; 및 상기 복수의 인공 지능 장치와 통신하여, 상기 복수의 인공 지능 장치에 대한 프로파일 정보를 획득하고, 획득된 프로파일 정보와 그에 매칭되는 실행가능명령의 리스트를 저장하여 상기 복수의 인공 지능 장치를 등록하는 마스터 전자장치; 를 포함하고, 상기 마스터 전자장치는, 등록된 복수의 인공 지능 장치 중 하나에 상기 기 설정된 시동을 포함하는 음성이 수신되고, 해당 인공 지능 장치로부터 상기 음성에 대응되는 실행명령이 전달된 것에 응답하여, 상기 저장된 프로파일 정보와 리스트에 기초하여 상기 실행명령을 수행할 적어도 하나의 인공 지능 장치를 탐색하고, 탐색된 인공 지능 장치로 상기 실행명령을 전송하는 것을 특징으로 한다.
또한, 일 실시 예에서, 상기 시스템은, 상기 복수의 인공 지능 장치와 통신하여, 상기 복수의 인공 지능 장치에 대한 프로파일 정보를 획득하는 슬레이브 전자장치를 더 포함하고, 상기 슬레이브 전자장치에 상기 음성에 대응되는 실행명령이 전달된 경우, 상기 마스터 전자장치로부터 상기 저장된 프로파일 정보와 리스트를 전달받아 상기 실행명령을 수행할 적어도 하나의 인공 지능 장치를 탐색하고, 상기 슬레이브 전자장치는 상기 실행명령에 대응되는 동작의 결과 정보를 탐색된 인공 지능 장치로부터 수신하여 상기 마스터 전자장치로 전달한다.
또한, 일 실시 예에서, 상기 마스터 전자장치가 상기 저장된 프로파일 정보와 리스트에 기초하여 상기 실행명령을 수행할 적어도 하나의 인공 지능 장치를 탐색할 수 없으면, 다른 네트워크 영역의 마스터 전자장치로 상기 실행명령을 전송하는 것을 특징으로 한다.
또, 본 발명의 실시 예에 따른 전자장치의 동작 방법은, 하나 이상의 인공 지능 장치와 통신하여 프로파일 정보를 획득하는 단계; 획득된 프로파일 정보와 그에 매칭되는 실행가능명령의 리스트를 저장하여 상기 하나 이상의 인공 지능 장치를 등록하는 단계; 상기 인공 지능 장치에 기 설정된 시동어를 포함하는 음성이 수신되면, 상기 음성에 대응되는 실행명령을 해당 인공 지능 장치로부터 전달받는 단계; 상기 프로파일 정보와 리스트에 기초하여 상기 실행명령을 수행할 인공 지능 장치를 탐색하는 단계; 및 탐색된 인공 지능 장치로 상기 실행명령을 전송하는 단계를 포함하여 이루어지는 것을 특징으로 한다.
이상의 본 발명의 실시 예에 따른 전자장치, 그 동작방법, 및 복수의 인공 지능 장치를 포함하는 시스템에 의하면, 다수의 인공 지능 장치들이 공존하는 환경에서, 사용자가 전자장치나 제어할 가전기기의 종류 및 위치를 고려할 필요 없이, 나아가 제어할 기기를 명확하게 지정하지 않고도, 심리스(seamless)한 음성명령을 통해 특정 인공 지능 장치에 대한 제어를 쉽고 빠르게 수행할 수 있다. 또, 사용자는 음성명령을 특정 인공 지능 장치에 직접 입력하거나 마스터 장치에 입력하기 위해 이동할 필요가 없고, 현재 위치에서 가까운 인공 지능 장치를 통해 제어 결과를 확인할 수 있다. 그에 따라, 사용자의 편의와 다수의 인공 지능 장치들의 사용성이 더욱 향상된다.
도 1은 본 발명과 관련된 전자 장치가 다수의 인공 지능 장치와 통신하는 모습을 보여주는 개념도이다.
도 2a는 본 발명과 관련된 전자 장치의 세부 구성을 설명하기 위한 블록도이고, 도 2b는 도 2a의 전자 장치의 예시 개념도이다.
도 3은 음성 인식 기능을 실행하는 전자 장치의 동작 상태를 나타낸 개념도이다.
도 4는 본 발명과 관련된 전자 장치가 마스터기기로 동작하여, 제1 인공 지능 장치로부터 전달받은 실행명령을 제2 인공 지능 장치로 전달하는 것을 설명하기 위한 개념도이다.
도 5는 본 발명과 관련된 전자 장치의 동작 방법을 설명하기 위한 대표 흐름도이고, 도 6a 및 도 6b는 도 5의 과정을 설명하기 위한 개념도들이다.
도 7a 및 도 7b는 본 발명과 관련된 전자 장치에서, 응답을 요하는 실행명령을 전달받은 경우, 복수의 인공 지능 장치의 동작을 설명하기 위한 서로 다른 예시들이다.
도 8a는 본 발명에 있어서, 사용자 음성을 복수의 인공 지능 장치에서 수신한 경우의 처리 동작을 설명하기 위한 개념도이고, 도 8b는 복수의 사용자 음성이 수신된 경우의 처리 동작을 설명하기 위한 개념도이다.
도 9a는 제1 인공 지능 장치로부터 전달받은 실행명령이 슬레이브 기기로 수신된 경우, 실행명령에 대한 처리 동작을 설명하기 위한 개념도이고, 도 9b는 동일 네트워크 영역 내에 실행명령을 수행할 인공 지능 장치가 탐색되지 않는 경우의 처리 동작을 설명하기 위한 개념도이다.
이하, 첨부된 도면을 참조하여 본 명세서에 개시된 실시 예를 상세히 설명하되, 도면 부호에 관계없이 동일하거나 유사한 구성요소는 동일한 참조 번호를 부여하고 이에 대한 중복되는 설명은 생략하기로 한다. 이하의 설명에서 사용되는 구성요소에 대한 접미사 "모듈" 및 "부"는 명세서 작성의 용이함만이 고려되어 부여되거나 혼용되는 것으로서, 그 자체로 서로 구별되는 의미 또는 역할을 갖는 것은 아니다. 또한, 본 명세서에 개시된 실시 예를 설명함에 있어서 관련된 공지 기술에 대한 구체적인 설명이 본 명세서에 개시된 실시 예의 요지를 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다. 또한, 첨부된 도면은 본 명세서에 개시된 실시 예를 쉽게 이해할 수 있도록 하기 위한 것일 뿐, 첨부된 도면에 의해 본 명세서에 개시된 기술적 사상이 제한되지 않으며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다.
제1, 제2 등과 같이 서수를 포함하는 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되지는 않는다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다.
어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다.
단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다.
본 출원에서, "포함한다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
본 명세서에서 설명되는 전자 장치로, 인공 지능(AI) 스피커, 휴대폰, 스마트 폰(smart phone), 노트북 컴퓨터(laptop computer), 디지털방송용 단말기, PDA(personal digital assistants), PMP(portable multimedia player), 네비게이션, 슬레이트 PC(slate PC), 태블릿 PC(tablet PC), 울트라북(ultrabook), 웨어러블 디바이스(wearable device, 예를 들어, 워치형 단말기 (smartwatch), 글래스형 단말기 (smart glass), HMD(head mounted display)) 등이 포함될 수 있다.
그러나, 본 명세서에 기재된 실시 예에 따른 구성은 전자 장치에만 적용 가능한 경우를 제외하면, 디지털 TV, 데스크탑 컴퓨터, 디지털 사이니지 등과 같은 전자장치에도 적용될 수도 있음을 본 기술분야의 당업자라면 쉽게 알 수 있을 것이다.
한편, 상기 '전자 장치'는 본 명세서에 개시된 '인공 지능 장치'와 동일 또는 유사한 의미로 사용될 수 있다.
또, 본 명세서에 개시된 '인공 지능 장치'는 인공 지능(artificial intelligence) 기술이 적용된 전자기기, 전자장치, 기구, 시스템을 모두 포함할 수 있다.
또, 본 명세서에 개시된 '마스터 기기', '마스터 장치', 또는 '마스터 전자장치'는 다수의 기기들에 대한 식별 정보를 가지고, 자신 외에 다른 기기들을 제어하는 기능을 수행하는 기기, 장치를 의미한다.
또, 본 명세서에 개시된 '슬레이브 기기', '슬레이브 장치', 또는 '슬레이브 전자장치'는 자신을 제어하는 기능을 수행하고, 다른 기기들과 통신시 정보를 주고받는 기능은 수행하는 기기, 장치를 의미한다.
도 1은 본 발명과 관련된 전자 장치가 다수의 인공 지능 장치와 통신하는 모습을 보여주는 개념도이다.
도 1에 도시된 바와 같이 본 발명에 따른 전자 장치(100)는 스피커 형태로 구현될 수 있다.
또한, 본 발명에 따른 전자 장치(100)는, 음성을 인식할 수 있으며, 인식된 음성에 기반하여, 전자 장치(100)의 동작을 제어하는 음성 인식 기능을 실행할 수 있다.
여기에서, 상기 음성 인식 기능은 음성을 통하여 전자 장치를 제어할 수 있는 기능으로, 자연적 언어를 분석하는 자연어 처리 기능, 질문에 대한 답변을 제시하는 질의 응답 기능, 디지털 음성 신호를 컴퓨터에서 처리 가능한 언어로 변환하는 음성 처리 기능, 다국어로 음성을 변환하는 자동통번역 기능 등이 포함될 수 있다.
또한, 본 발명에 따른 전자 장치(100)는 다수의 인공 지능 장치들(200a, 200b, 200c, 200d), 예를 들어 인공지능 TV, 인공지능 냉장고, 인공지능 세탁기, 및 인공지능 스피커와 무선 연결될 수 있다.
이와 같이 전자 장치(100)와 다수의 인공 지능 장치들(200a, 200b, 200c, 200d)가 연결되면, 전자 장치(100)에서 인식된 음성을 기초로 다수의 인공 지능 장치들(200a, 200b, 200c, 200d)의 동작을 제어할 수 있다.
또, 상기 전자 장치(100)에서 인식된 음성을 기초로, 특정 인공기능 장치(200a)와 또 다른 인공 지능 장치(200c), 예를 들어 인공지능 TV와 인공지능 세탁기가 연결되도록 제어할 수 있다. 이러한 경우, 특정 인공기능 장치(200a)와 연결된 전자 장치(100)에 입력된 음성명령을 기초로 또 다른 인공 지능 장치(200c)의 동작을 제어할 수 있다.
나아가, 본 발명에서는 음성명령이 전자 장치(100)에 입력되지 않고, 특정 인공기능 장치(200a)에 입력된 경우에도, 전자 장치(100)를 통해, 또 다른 인공 지능 장치(200c)의 동작을 제어할 수 있다. 이에 관하여는, 이하에서 보다 구체적으로 설명하기로 한다.
이하, 도 2a는 본 발명과 관련된 전자 장치를 설명하기 위한 블록도이고, 도 2b 본 발명과 관련된 전자 장치의 일 예, 즉 스피커 형태의 전자장치의 예시를 보여주는 개념도이다.
상기 전자 장치(100)는 통신부(110), 입력부(120), 러닝 데이터부(130), 센싱부(140), 출력부(150), 인터페이스부(160), 메모리(170), 제어부(180) 및 전원 공급부(190) 등을 포함할 수 있다. 도 2a에 도시된 구성요소들은 전자 장치를 구현하는데 있어서 필수적인 것은 아니어서, 본 명세서 상에서 설명되는 전자 장치는 위에서 열거된 구성요소들 보다 많거나, 또는 적은 구성요소들을 가질 수 있다.
보다 구체적으로, 상기 구성요소들 중 통신부(110)는, 전자 장치(100)와 무선 통신 시스템 사이, 전자 장치(100)와 다른 전자 장치(100) 사이, 또는 전자 장치(100)와 외부서버, 또는 전자 장치(100)와 다수의 인공 지능 장치(200) 사이의 무선 통신을 가능하게 하는 하나 이상의 모듈을 포함할 수 있다. 또한, 상기 통신부(110)는, 전자 장치(100)를 하나 이상의 네트워크에 연결하는 하나 이상의 모듈을 포함할 수 있다.
입력부(120)는, 영상 신호 입력을 위한 카메라(121) 또는 영상 입력부, 오디오 신호 입력을 위한 마이크로폰(microphone, 122), 또는 오디오 입력부, 사용자로부터 정보를 입력받기 위한 사용자 입력부(123, 예를 들어, 터치키(touch key), 푸시키(mechanical key) 등)를 포함할 수 있다. 입력부(120)에서 수집한 음성 데이터나 이미지 데이터는 분석되어 사용자의 제어명령으로 처리될 수 있다.
센싱부(140)는 전자 장치 내 정보, 전자 장치를 둘러싼 주변 환경 정보 및 사용자 정보 중 적어도 하나를 센싱하기 위한 하나 이상의 센서를 포함할 수 있다. 예를 들어, 센싱부(140)는 근접센서(141, proximity sensor), 조도 센서(142, illumination sensor), 터치 센서(touch sensor), 가속도 센서(acceleration sensor), 자기 센서(magnetic sensor), 중력 센서(G-sensor), 자이로스코프 센서(gyroscope sensor), 모션 센서(motion sensor), RGB 센서, 적외선 센서(IR 센서: infrared sensor), 지문인식 센서(finger scan sensor), 초음파 센서(ultrasonic sensor), 광 센서(optical sensor, 예를 들어, 카메라(121 참조)), 마이크로폰(microphone, 122 참조), 배터리 게이지(battery gauge), 환경 센서(예를 들어, 기압계, 습도계, 온도계, 방사능 감지 센서, 열 감지 센서, 가스 감지 센서 등), 화학 센서(예를 들어, 전자 코, 헬스케어 센서, 생체 인식 센서 등) 중 적어도 하나를 포함할 수 있다. 한편, 본 명세서에 개시된 전자 장치는, 이러한 센서들 중 적어도 둘 이상의 센서에서 센싱되는 정보들을 조합하여 활용할 수 있다.
출력부(150)는 시각, 청각 또는 촉각 등과 관련된 출력을 발생시키기 위한 것으로, 디스플레이부(151), 음향 출력부(152), 광 출력부(154) 중 적어도 하나를 포함할 수 있다.
디스플레이부(151)는 터치 센서와 상호 레이어 구조를 이루거나 일체형으로 형성됨으로써, 터치 스크린을 구현할 수 있다. 이러한 터치 스크린은, 전자 장치(100)와 사용자 사이의 입력 인터페이스를 제공하는 사용자 입력부(123)로써 기능함과 동시에, 전자 장치(100)와 사용자 사이의 출력 인터페이스를 제공할 수 있다.
인터페이스부(160)는 전자 장치(100)에 연결되는 다양한 종류의 외부 기기와의 통로 역할을 수행한다. 이러한 인터페이스부(160)는, 유/무선 헤드셋 포트(port), 외부 충전기 포트(port), 유/무선 데이터 포트(port), 메모리 카드(memory card) 포트, 식별 모듈이 구비된 장치를 연결하는 포트(port), 오디오 I/O(Input/Output) 포트(port), 비디오 I/O(Input/Output) 포트(port), 이어폰 포트(port) 중 적어도 하나를 포함할 수 있다. 전자 장치(100)에서는, 상기 인터페이스부(160)에 외부 기기가 연결되는 것에 대응하여, 연결된 외부 기기와 관련된 적절할 제어를 수행할 수 있다.
또한, 메모리(170)는 전자 장치(100)의 다양한 기능을 지원하는 데이터를 저장한다. 메모리(170)는 전자 장치(100)에서 구동되는 다수의 응용 프로그램(application program 또는 애플리케이션(application)), 전자 장치(100)의 동작을 위한 데이터들, 명령어들을 저장할 수 있다. 이러한 응용 프로그램 중 적어도 일부는, 무선 통신을 통해 외부 서버로부터 다운로드 될 수 있다.
제어부(180)는 상기 응용 프로그램과 관련된 동작 외에도, 통상적으로 전자 장치(100)의 전반적인 동작을 제어한다. 제어부(180)는 위에서 살펴본 구성요소들을 통해 입력 또는 출력되는 신호, 데이터, 정보 등을 처리하거나 메모리(170)에 저장된 응용 프로그램을 구동함으로써, 사용자에게 적절한 정보 또는 기능을 제공 또는 처리할 수 있다.
또한, 제어부(180)는 메모리(170)에 저장된 응용 프로그램을 구동하기 위하여, 도 2a와 함께 살펴본 구성요소들 중 적어도 일부를 제어할 수 있다. 나아가, 제어부(180)는 상기 응용 프로그램의 구동을 위하여, 전자 장치(100)에 포함된 구성요소들 중 적어도 둘 이상을 서로 조합하여 동작시킬 수 있다.
러닝 데이터부(130)는, 데이터 마이닝(data mining), 데이터 분석, 지능형 의사결정 및 머신 러닝 알고리즘 및 기술을 위해 이용될 정보를 수신, 분류, 저장 및 출력하도록 구성될 수 있다. 러닝 데이터부(130)는 단말기를 통해 수신, 검출, 감지, 생성, 사전 정의된 정보 또는 상기 단말기를 통해 다른 방식으로 출력된 정보를 저장하거나, 다른 구성, 장치 및 단말기에 의하여 수신, 검출, 감지, 생성, 사전 정의 또는 출력된 데이터를 저장하도록 구성된 하나 이상의 메모리 유닛을 포함할 수 있다.
러닝 데이터부(130)는 전자 장치에 통합되거나, 구비된 메모리를 포함 할 수 있다. 일 실시 예에 있어서, 러닝 데이터부(130)는 메모리(170)를 통해 구현될 수 있다. 다만 이에 한정되지 않고, 러닝 데이터부(130)는 전자 장치(100) 와 관련된 메모리(예를 들어, 전자 장치(100)에 연결된(유선으로(또는 전기적으로) 연결된 외부 메모리)에 구현되거나, 전자 장치(100)와 통신 가능한 서버에 포함된 메모리를 통해 구현될 수 있다. 다른 일 실시 예에 있어서, 러닝 데이터부(130)는 클라우드 컴퓨팅 환경에서 유지되는 메모리, 또는 네트워크와 같은 통신 방식을 통해 단말기에 의해 액세스 가능한 다른 원격 메모리를 통해 구현될 수 있다.
러닝 데이터부(130)는 일반적으로 감독 또는 감독되지 않은 학습, 데이터 마이닝, 예측 분석 또는 다른 머신 러닝 기술에서 사용하기 위한 데이터를 식별, 색인화, 분류, 조작, 저장, 검색 및 출력하기 위해, 상기 데이터를 하나 이상의 데이터베이스에 저장하도록 이루어진다. 러닝 데이터부(130)에 저장된 정보는 서로 다른 유형의 데이터 분석, 기계 학습 알고리즘 및 기계 학습 기술 중 적어도 하나를 사용하는 제어부(180) 또는 전자 장치에 포함된 복수의 제어부들에 의하여 이용 될 수 있다. 이러한 알고리즘 및 기법의 예로는 K 최근접 이웃 시스템(k-Nearest neighbor system), 퍼지 논리(fuzzy logic)(예를 들어, 가능성 이론(possibility theory)), 신경 회로망(neural networks), 볼츠만 머신(Boltzmann machines), 벡터 양자화, 펄스 신경망(pulsed neural nets), 서포트 벡터 머신(support vector machines), 최대-마진 분류기(maximum margin classifiers), 힐 클라이밍(hill-climbing), 유도 논리 시스템(inductive logic systems), 베이지안 네트워크(baysian networks), 페트리 네트(petri nets) (예를 들어, 유한 상태 기계(finite state machines), 밀리 머신(mealy machines), 무어 유한 상태 머신(moore finite state machines)), 분류 트리(classifier trees)(예를 들어, 퍼셉트론 트리(perceptron trees), 서포트 벡터 트리(support vector trees), 마코브 트리(markov trees), 트리-숲 결정(decision tree forests), 랜덤 숲(random forests)), 목마전 모형 및 시스템(pandemonium models and systems), 클러스터링(clustering), 인공 지능 플래닝(artificially intelligent planning), 인공 지능 예측(artificially intelligent forecasting), 데이터 퓨전(data fusion), 센서 퓨전(sensor fusion), 이미지 퓨전(image fusion), 강화 학습(reinforcement learning), 증강 현실(augmented reality), 패턴 인식(pattern recognition), 자동 플래닝(automated planning) 등이 있다.
제어부(180)는 데이터 분석, 머신 러닝 알고리즘 및 머신 러닝 기술을 사용하여 결정 또는 생성된 정보에 기초하여 전자 장치의 적어도 하나의 실행 가능한 동작을 결정 또는 예측할 수 있다. 이를 위해, 제어부(180)는 러닝 데이터부(130)의 데이터를 요청, 검색, 수신 또는 활용할 수 있다. 제어부 (180)는 지식 기반 시스템, 추론 시스템 및 지식 획득 시스템 등을 구현하는 다양한 기능을 수행할 수 있으며, 불확실한 추론을 위한 시스템(예를 들어, 퍼지 논리 시스템), 적응 시스템, 기계 학습 시스템, 인공 신경망 등을 포함하는 다양한 기능을 수행할 수 있다.
제어부(180)는 I/O 처리 모듈, 환경 조건 모듈, 음성-텍스트(STT) 처리 모듈, 자연 언어 처리 모듈, 작업 흐름 처리 모듈 및 서비스 처리 모듈 등과 같은 음성 및 자연 언어 처리를 가능하게 하는 서브 모듈들을 포함 할 수 있다. 서브 모듈들 각각은 전자 장치에서의 하나 이상의 시스템 또는 데이터 및 모델, 또는 이들의 서브셋 또는 수퍼셋에 대한 접근권한을 가질 수 있다. 여기서, 서브 모듈들 각각이 접근권한을 가지는 대상은 스케줄링, 어휘 인덱스, 사용자 데이터, 태스크 플로우 모델, 서비스 모델 및 자동 음성 인식(ASR) 시스템을 포함할 수 있다. 다른 일 실시 예에 있어서, 제어부(180) 또는 전자 장치는 상기 서브 모듈, 시스템, 또는 데이터 및 모델로 구현 될 수 있다.
일부 실시 예에서, 러닝 데이터부(130)에서의 데이터에 기초하여, 제어부(180)는 사용자 입력 또는 자연 언어 입력으로 표현된 문맥 조건 또는 사용자의 의도에 기초하여 사용자가 요구하는 것을 검출하고 감지하도록 구성 될 수 있다. 또한, 제어부(180)는 문맥 조건이나 사용자의 의도에 따라 사용자가 요구하는 것을 완전히 결정하는 데 필요한 정보를 적극적으로 이끌어 내거나, 이를 획득할 수 있다. 예를 들어, 제어부(180)는 과거 입력 및 출력, 패턴 매칭, 모호하지 않은 단어, 입력 의도 등을 포함하는 과거 데이터를 분석함으로써, 사용자가 요구하는 것을 검출하고 감지할 수 있다. 또한, 제어부(180)는 문맥 조건이나 사용자의 의도에 따라 사용자가 요구하는 기능을 실행하기 위한 작업 흐름을 결정할 수 있다. 또한, 제어부(180)는 문맥 조건 또는 사용자의 의도에 기초하여 사용자가 요구하는 것을 충족시키기 위한 작업 흐름을 실행할 수 있다.
일부 실시 예에 있어서, 제어부(180)는 memistor, memristors, 상호 컨덕턴스 증폭기, 펄스 형 신경 회로, 인공지능형 나노 기술 시스템(예를 들어, 자율 나노머신) 또는 인공지능형 양자 기계 시스템(예를 들어, 양자 신경 네트워크) 등을 포함하는 러닝 데이터 프로세스를 위한 전용 하드웨어 요소를 구현할 수 있다. 일부 실시 예에 있어서, 제어부(180)는 머신 비전 시스템, 음향 인식 시스템, 필기 인식 시스템, 데이터 융합 시스템, 센서 융합 시스템 및 소프트 센서와 같은 패턴 인식 시스템을 포함 할 수 있다. 머신 비전 시스템은 컨텐츠 기반 이미지 검색, 광학 문자 인식, 증강 현실, 자체 운동(egomotion), 트래킹 및 광학 흐름(optical flow) 등을 포함 할 수 있다.
제어부(180)는 센싱부(140)를 통하여, 전자 장치 내 정보, 전자 장치를 둘러싼 주변 환경 정보 또는 다른 정보를 감지 또는 수신할 수 있다. 또한, 제어부(180)는 무선 통신부(110)를 통하여, 방송 신호 및/또는 방송 관련된 정보, 무선 신호, 무선 데이터 등을 수신할 수 있다. 또한, 제어부(180)는 입력부로부터 영상 정보(또는 해당 신호), 오디오 정보(또는 해당 신호), 데이터 또는 사용자로부터 입력되는 정보를 입력받을 수 있다.
이러한 제어부(180)는 정보들을 수집하고, 이를 처리 또는 분류(예를 들어, 지식 그래프, 명령어 정책, 개인화 데이터베이스, 대화 엔진 등)하고, 상기 처리 또는 분류된 정보를 메모리(170) 또는 러닝 데이터 부(130)에 저장할 수 있다.
그리고, 러닝 데이터부(130)는 데이터 분석, 머신 러닝 알고리즘 및 머신 러닝기술을 바탕으로, 전자 장치의 동작이 결정되면, 제어부(180)는 이러한 결정된 동작을 실행하기 위하여, 전자 장치의 구성 요소들을 제어할 수 있다. 제어부(180)는 제어 명령에 근거하여, 전자 장치를 제어함으로써, 결정된 동작을 실행할 수 있다.
일 실시 예에 있어서, 제어부(180)는 특정 동작이 수행되면, 데이터 분석, 머신 러닝 알고리즘 및 머신 러닝기술을 통하여, 특정 동작의 수행을 나타내는 이력 정보를 분석하고, 이러한 분석 정보를 바탕으로 기존의 학습된 정보에 대한 업데이트를 수행할 수 있다. 이에, 제어부(180)는 러닝 데이터 부(130)와 함께, 업데이트 된 정보에 기반한 데이터 분석, 머신 러닝 알고리즘 및 머신 러닝 기술의 미래 성능의 정확도를 향상시킬 수 있다.
전원공급부(190)는 제어부(180)의 제어 하에서, 외부의 전원, 내부의 전원을 인가 받아 전자 장치(100)에 포함된 각 구성요소들에 전원을 공급한다. 이러한 전원공급부(190)는 배터리를 포함하며, 상기 배터리는 내장형 배터리 또는 교체가능한 형태의 배터리가 될 수 있다.
상기 각 구성요소들 중 적어도 일부는, 이하에서 설명되는 다양한 실시 예들에 따른 전자 장치의 동작, 제어, 또는 제어방법을 구현하기 위하여 서로 협력하여 동작할 수 있다. 또한, 상기 전자 장치의 동작, 제어, 또는 제어방법은 상기 메모리(170)에 저장된 적어도 하나의 응용 프로그램의 구동에 의하여 전자 장치 상에서 구현될 수 있다.
계속해서 도 2b를 참조하면, 전자 장치(100)의 일 예로, 스피커 형태의 전자장치를 보여준다. 그리고, 도 3은, 음성 인식 기능을 실행하는 전자 장치(100)의 동작 상태를 보여준다.
먼저, 도 2b에 도시된 바와 같이, 스피커 형태의 전자장치(100)는 마이크(122), 스피커(152), 디스플레이부(151)를 포함할 수 있다. 전자장치(100)의 프레임(101)에는 라이팅 기능이 내장되어, 정해진 입력에 따라 프레임에 라이트 기능을 활성화하도록 구현될 수 있다. 또한, 전자장치(100)의 외측에는 카메라(121)가 마련되어 주변의 영상을 획득할 수 있다.
도 3을 참조하면, 전자 장치(100)는 대기 상태(310)와 음성 인식 상태(320) 중 어느 하나로 동작할 수 있다.
대기 상태(310)에서는 음성 인식 기능의 실행 전, 전자 장치 주변에 음성 인식 기능의 실행과 관련된 음성이 존재하는지 여부를 감지한다. 이를 위해, 전자장치(100)의 제어부(180)는, 마이크(122)를 통해 지속적으로 특정 음량(loudness) 이상의 소리가 감지되는지 여부를 감시(또는 모니터링)할 수 있다.
또한, 대기 상태(310)에서는 음성 분석을 수행할 필요가 없으므로, 저전력, 예를 들어, 4.4mA 정도의 전류만으로 동작할 수 있다. 이러한 대기 모드는 "리스닝 상태(listening phase)"로도 명명될 수 있다.
한편, 대기 상태(310)에서, 마이크(122)를 통해 특정 음량 이상의 소리가 감지되면, 전자 장치(100)의 대기 상태(310)가 음성 인식 상태(320)로 전환될 수 있다. 또는, 마이크(122)를 통해 특정 음량 이상의 정해진 시동어가 감지된 경우에 전자 장치(100)의 대기 상태(310)가 음성 인식 상태(320)로 전환될 수도 있다.
여기서, 시동어는 대기 모드의 전자장치(100)를 웨이크 업(wake up)하기 위한 정해진 음성명령, 예를 들어 "Hello", "Wake up", "Google" 등의 음성명령을 포함할 수 있다.
음성 인식 상태(320)는, 전자장치(100)의 제어부(180)가 마이크(122)를 통하여 입력된 음성을 분석하는 상태를 의미한다. 음성 인식 모드에서는 음성 분석을 수행하기 때문에, 대기 상태(210)에서보다 더 많은 전류를 소모하게 된다.
즉, 본 발명에 따른 전자 장치는 시동어가 수신되기 이전에는, 음성 분석을 수행하지 않는 대기 상태(210)로 존재하여, 소모 전류를 감소시킬 수 있다.
한편, 전자장치(100)의 제어부(180)는 음성 분석 전에, 상기 음성 인식 상태(320)에서 음성 인식을 시작하는 시동어가 수신되었는지 여부를 판단할 수 있다. 다시 말해, 제어부(180)는 시동어 이후에 발화된 음성에 대하여, 음성 분석을 시작할 수 있다.
음성 인식 상태(320)에서, 상기 전자장치(100)는 마이크(122)를 통해 입력된 음성을 음성 분석하여 전자 장치(100)의 동작를 제어할 수 있다. 이러한 음성 분석은 전자 장치에 설치된 별도의 서드 파티 애플리케이션(3rd party application)을 이용하여 수행될 수도 있다.
또한, 전자장치(100)의 제어부(180)는 인공 지능 알고리즘을 통하여 음성 정보의 음성 분석을 처리하기 위하여, 기 설정된 인공 지능 서버에 전송하거나 또는 전자장치(100)의 러닝 데이터부(130)에 저장된 데이터를 사용할 수 있다.
여기에서, 상기 기 설정된 인공 지능 서버는, 인공 지능 알고리즘을 이용하여 방대한 량의 정보를 학습하고, 학습된 정보를 바탕으로 최적의 결과 정보를 도출하는 기능을 제공하는 서버이다. 또는, 전자장치(100)의 제어부(180)는 러닝 데이터부(130)에 저장된 데이터들을 바탕으로, 입력된 음성 정보에 응답한 결과 정보를 생성할 수도 있다.
전술한 음성 인식 모드에서 기 설정된 시간 동안 사용자의 음성 또는 정해진 시동어가 수신되지 않으면, 음성 인식 상태(320) 다시 대기 상태(310)로 전환될 수 있다.
계속해서, 스피커(152)는 입력된 음성 정보의 응답 결과를 출력할 수 있다. 이러한 응답 결과는, 입력된 음성 정보에 대한 답변뿐만 아니라, 모호한 음성 정보나 검색 범위를 확인하기 위한 질의 또는 안내 정보를 포함할 수 있다.
또한, 스피커(152)는 전술한 음성 인식 상태(320)가 대기 상태(310)로 전환되거나 또는 대기 상태(310)에서 음성 인식 상태(320)로 전환되는 경우 기 설정된 알림음을 출력할 수도 있다.
디스플레이부(151)는 스피커(152)를 통해 출력되는 응답 결과에 대응되는 그래픽객체나 이미지를 출력할 수 있다. 또는, 전자장치(100)의 설정에 따라, 스피커(152)가 무음으로 설정된 경우, 입력된 음성 정보의 응답 결과가 디스플레이부(151)를 통해서만 출력될 수도 있다. 한편, 디스플레이부(151)가 전술한 터치 스크린으로 이루어진 경우이면, 다양한 방식의 터치입력을 기초로 그래픽객체나 이미지를 제어함으로써, 사용자와 전자장치(100)가 인터랙션을 수행할 수 있다.
카메라(121)는 전자 장치(100)의 일 측에 탈착가능하게 장착될 수 있다. 카메라(121)를 통해 획득된 영상은 스피커(152)를 통해 입력된 음성 정보에 대응되는 사용자를 파악하는데 사용될 수 있다. 또는, 사용자 요청에 따라 상기 획득된 영상을 다른 디바이스에 전송해줄 수 있다.
한편, 이하의 설명에서는, 전자 장치(100)가 자체적으로 러닝 데이터부(130)를 구비하여 입력된 음성 정보의 분석 결과를 출력하도록 설정되어 있음을 바탕으로 설명한다. 그러나, 이에 한정되는 것은 아니며, 전자장치(100)가 인공 지능 서버와 통신하여 음성 정보의 분석에 대응되는 응답을 수신하고, 수신된 응답을 기초로 전자장치(100)가 동작하는 형태로 구현될 수도 있다.
또한, 이하의 도면과 설명에서는, 전자 장치(100)가 음성을 출력하는 스피커의 형태로 구현된 것을 예시로 설명하였으나 본 발명은 이에 한정되지 아니하며, 다양한 형태의 전자 기기, 예를 들어 인공지능 가전기기 등의 인공 지능 장치 구현될 수 있다.
계속해서 도 4를 참조하면, 도 4는 본 발명과 관련된 전자 장치가 마스터기기로 동작하여, 제1 인공 지능 장치로부터 전달받은 실행명령을 제2 인공 지능 장치로 전달하는 것을 설명하기 위한 개념도이다.
도 4를 참조하면, 복수의 인공 지능 장치(200a, 200b)는 마스터 전자장치(100)와 통신을 수행할 수 있다. 또, 복수의 인공 지능 장치(200a, 200b)는 수신된 사용자 음성의 의미를 분석하기 위하여, 음성 인식 서버(300)와 통신할 수 있다.
다수의 인공 지능 장치가 존재하는 환경(이하, '동일 네트워크 영역')에서, 제1 인공 지능 장치(200a)에 사용자 음성(401)이 입력된다.
이때, 제1 인공 지능 장치(200a)는 사용자의 현재 위치에서 가까운 인공 지능 장치일 수 있다. 또, 상기 사용자 음성(401)에는 기 설정된 시동어가 포함된다. 제1 인공 지능 장치(200a)는 수신된 음성을 음성 인식 서버(300)로 전송하여, 음성 인식 서버(300)로부터 음성의 의미 분석에 따른 실행명령을 전달받을 수 있다.
전달받은 실행명령이 제1 인공 지능 장치(200a)에 대한 것이면, 제1 인공 지능 장치(200a)에서 해당 실행명령을 수행한다.
전달받은 실행명령이 제1 인공 지능 장치(200a)에서 수행할 수 없는 것이면, 제1 인공 지능 장치(200a)는 해당 실행명령을 마스터 전자장치(100)로 전달한다. 여기에서, 마스터 전자장치(100)는 복수의 전자장치 중에서 어느 하나로 선택될 수 있다. 마스터 전자장치의 선택(election)에 관한 설명은 이하에서 보다 구체적으로 설명하겠다.
실행명령을 전달받은 마스터 전자장치(100)는 해당 실행명령을 수행할 수 있는 제2 인공 지능 장치(200b)로 실행명령을 전송한다. 이를 위해, 마스터 전자장치(100)의 메모리에는, 동일 네트워크 영역 내의 모든 인공 지능 장치에 대한 실행가능명령의 리스트가 저장될 수 있다.
마스터 전자장치(100)는 상기 실행가능명령의 리스트에 기초하여, 제1 인공 지능 장치(200a)로부터 전달받은 실행명령을 수행할 수 있는 제2 인공 지능 장치(200b)를 탐색한다.
제2 인공 지능 장치(200b)는 마스터 전자장치(100)로부터 전달받은 실행명령을 실행한다. 그리고, 실행의 결과 정보를 마스터 전자장치(100)로 전송할 수 있다.
이하, 도 5는 본 발명과 관련된 전자 장치의 동작 방법을 설명하기 위한 대표 흐름도이고, 도 6a 및 도 6b는 도 5의 과정을 설명하기 위한 개념도들이다.
먼저 도 5를 참조하면, 본 발명에 따른 전자장치가 다수의 인공 지능 장치에 대한 프로파일 정보를 획득하는 과정을 수행한다(S10).
여기에서, 상기 프로파일 정보는, 각 인공 지능 장치의 하드웨어(H/W) 성능, 입출력(I/O) 장치, 및 수행가능한 명령의 리스트를 포함한다. 또, 상기 프로파일 정보는, 인공 지능 장치의 설치위치와 식별 정보(ID)가 더 포함될 수 있다.
동일 네트워크 영역 내에 상기 전자장치가 복수 개 존재하면, 복수의 전자장치가 상기 다수의 인공 지능 장치에 대한 프로파일 정보를 공유할 수 있다. 이를 위해, 동일 네트워크 영역 내에 존재하는 모든 전자장치(100)는, 새로 추가된 인공 지능 장치를 포함한 모든 인공 지능 장치에 대한 프로파일 정보를 브로드캐스트로 수신한다.
이와 같이 동일 네트워크 영역 내에 상기 전자장치가 복수 개 존재하는 경우, 복수의 전자장치 중 어느 하나가 마스터 장치로 선출(election)된다.
이를 위하여, 일 실시 예에서, 전자장치(100)의 제어부(180)는 동일 네트워크 영역 내에 존재하는 하나 이상의 인공 지능 장치에 대한 프로파일 정보를 수신하고, 기 설정된 기준에 따라 전자장치(100) 본체가 마스터 기기로 선택된 것에 응답하여, 후술하는 프로파일 정보에 매칭되는 실행가능명령의 리스트를 생성 및 저장한다.
여기에서, 상기 기 설정된 기준은 네트워크 상태 또는 하드웨어 성능과 연관될 수 있다. 예를 들어, 다수의 전자장치 중에서 네트워크 상태가 좋거나 및/또는 다운타임이 낮은 경우와 같이 성능이 높은 전자장치가 마스터 기기로 선정(election)될 수 있다.
다음, (마스터 기기로 선정된) 전자장치는 상기 획득된 프로파일 정보와 그에 매칭되는 실행가능명령의 리스트를 저장하여, 동일 네트워크 영역 내에 존재하는 다수의 인공 지능 장치를 등록하는 과정을 수행한다(S20).
이와 같이, 전자장치가 동일 영역 내에 존재하는 다수의 인공 지능 장치에 대한 등록 과정을 수행한 경우, 해당 전자장치는 '마스터 장치'가 되는 것이다.
동일 영역 내에 존재하는 전자장치가 하나인 경우라면, 그 전자장치가 바로 마스터 장치가 된다. 그러나, 동일 영역 내에 존재하는 전자장치가 복수인 경우에는, 전술한 바와 같이 '마스터 장치'를 선출(election)하는 과정이 수행된다.
이 후, 마스터 장치에 등록된 인공 지능 장치 중 어느 하나(이하, '제1 인공 지능 장치')에 기 설정된 시동어(예, 'Hello', 'Hi, LG', ' Hi, Clova'등)를 포함한 음성이 입력되는지를 확인한다(S30). 이를 위해, 사용자는 자신의 현재 위치에서 가까운 임의 인공 지능 장치에 대해 발화할 수 있다.
구체적으로, 사용자가 기 설정된 시동어를 포함한 음성을 발화하면, 이를 수신한 복수의 인공 지능 장치들이 시동어를 인식한 후, 발화된 음성의 음성 정보(수신된 음성의 성량, 신호잡음비(signal to noise ratio, SNR))을 공유하여 음성 정보의 상태가 좋은 인공 지능 장치가 해당 음성의 의미를 분석하도록 결정한다.
제1인공 지능 장치에 상기 음성이 수신되면, 전자장치(100)는 제1인공 지능 장치로부터 상기 수신된 음성에 대응되는 실행명령을 수신한다(S40).
한편, 제1인공 지능 장치가 아닌 전자장치 본체에 음성이 수신되거나, 또는 수신된 음성에 대응되는 실행명령이 제1인공 지능 장치에서 수행될 수 있는 것이면, 'A' 과정이 수행된다.
여기서, 'A' 과정은, 다음의 두 가지 중 하나일 수 있다.
전자장치 본체에 음성이 수신된 경우이면, 전자장치가 해당 음성의 의미 분석을 위해 음성 인식 서버로 음성 데이터를 전송하고, 음성 인식 서버로부터 수신된 의미 분석에 대응되는 실행명령을 자신이 수행하거나 적합한 다른 인공 지능 장치로 전달한다.
수신된 음성에 대응되는 실행명령이 제1인공 지능 장치에서 수행될 수 있는 것이면, 제1인공 지능 장치가 해당 음성의 의미 분석을 위해 음성 인식 서버로 음성 데이터를 전송하고, 음성 인식 서버로부터 수신된 의미 분석에 대응되는 실행명령을 자신이 실행한다.
한편, 전자장치(마스터 장치)가 제1 인공 지능 장치로부터 수신된 음성에 대응되는 실행명령을 수신한 경우, 제어부(180)는 저장된 프로파일 정보와 실행가능명령의 리스트에 기초하여, 마스터 장치에 등록된 모든 인공 지능 장치 중에서 상기 실행명령을 수행할 수 있는 인공 지능 장치(이하, '제2 인공 지능 장치')를 탐색한다(S50).
그리고, 제어부(180)는 탐색된 제2 인공 지능 장치로 상기 실행명령을 전송한다(S60).
도 6a 및 도 6b를 참조하면, 동일 네트워크 영역 내에는, 기 설정된 시동어에 의해 활성화되는 인공 지능 서버(미도시)(이는, 러닝 데이터부(130)로 대체될 수 있음)와, 기 설정된 시동어를 포함하는 사용자 음성(601)을 수신하도록 설정된 복수의 인공 지능 장치들(200a~200c)과, 상기 복수의 인공 지능 장치들(200a~200c)과 통신하는 복수의 전자장치(100a, 100b)가 배치될 수 있다.
사용자는 현재 자신의 위치에서 가까운 제1 인공 지능 장치(200a)를 향해 기 설정된 시동어(예, '하이엘지')와 특정 인공 지능 장치에 대한 음성명령(예, '세탁기 좀 돌려줘')을 발화할 수 있다.
제1 인공 지능 장치(200a)는 음성명령의 의미를 분석하기 위해, 해당 음성명령을 포함한 음성 데이터를 음성 인식 서버(300)로 전달한다(①). 음성 인식 서버(300)는 음성명령의 의미를 분석하여 대응되는 실행명령('세탁기 구동명령')을 제1 인공 지능 장치(200a)에 제공한다(②).
한편, 복수의 전자장치(100a, 100b)는 복수의 인공 지능 장치들(200a~200c)에 대한 프로파일 정보와 그에 매칭되는 실행가능명령의 리스트를 저장한 마스터 장치(100a)와, 복수의 인공 지능 장치들(200a~200c)에 대한 프로파일 정보만 갖는 슬레이브 장치(100b)로 구성될 수 있다.
마스터 장치(100a)는 제1 인공 지능 장치(200a)로부터 사용자 음성(601)에 대응되는 실행명령('세탁기 구동명령')을 전달받고(③), 저장된 프로파일 정보와 리스트에 기초하여 상기 실행명령을 수행할 적어도 하나의 인공 지능 장치, 즉 인공 지능 세탁기(200c)를 탐색한다. 이 후, 탐색된 인공 지능 세탁기(200c)로 해당 실행명령('세탁기 구동명령')을 전송하면(④), 인공 지능 세탁기(200c)가 구동을 개시한다(⑤).
한편, 일 예에서, 제1 인공 지능 장치에, 상기 기 설정된 시동어를 포함하는 음성이 수신되고 상기 음성에 대응되는 실행명령이 제1 인공 지능 장치(200a)에서 바로 수행할 수 있는 것으로 확인되면, 해당 실행명령이 마스터 장치(100a)로 전달되지 않는다.
즉, 현재 인공 지능 장치에서 실행명령을 처리할 수 있으면, 해당 인공 지능 장치에서 실행명령에 대응되는 동작을 수행한다. 또, 일 예에서는, 이러한 제1 인공 지능 장치(200a)의 동작의 결과 정보가 마스터 장치(100a) 선택된 본체에 수신될 수는 있다.
한편, 일 예에서, 실행명령을 수행할 인공 지능 장치가 복수 개 탐색된 경우이면, 사용자의 현재 위치에 근접한 인공 지능 장치가 실행명령을 수행하도록, 해당 실행명령을 전송할 수 있다.
이때, 사용자의 현재 위치에 근접한 인공 지능 장치는, 탐색된 인공 지능 장치에 제1인공 지능 장치가 포함된 경우에는 제1인공 지능 장치가 된다. 왜냐하면, 제1인공 지능 장치가 사용자 음성을 수신하였으므로, 사용자의 현재 위치에서 가까운 것으로 추정할 수 있기 때문이다.
탐색된 인공 지능 장치에 제1인공 지능 장치가 포함되지 않은 경우이면, 사용자의 현재 위치에 근접한 인공 지능 장치는, 제1인공 지능 장치로부터 가까운 인공 지능 장치 중에서 탐색된 인공 지능 장치에 해당하는 것이 선택된다.
또한, 일 예에서는, 상기 실행명령에 명령을 수행할 인공 지능 장치가 명시적으로 포함되지 않은 경우(예, '틀어줘')에도 사용자의 현재 위치와 가까운 인공 지능 장치로 선택될 수 있을 것이다.
일 예에서는, 이와 같이 제2 인공 지능 장치로 실행명령이 전송된 후에, 해당 인공 지능 장치에서 상기 실행명령에 대응되는 동작이 수행되면, 제어부(180)는 그 결과 정보를 수신할 수 있다.
이때, 수신된 결과 정보가 전자장치에 표시될 수 있다. 표시방식은, 음성출력, 화면출력, LED 출력 중 어느 하나일 수 있다.
이와 같이 본 발명에서는 다수의 인공 지능 장치들이 공존하는 환경에서, 사용자가 전자장치나 제어할 가전기기의 종류 및 위치를 고려할 필요 없이, 나아가 제어할 기기를 명확하게 지정하지 않고도, 심리스(seamless)한 음성명령을 통해 특정 인공 지능 장치에 대한 제어를 쉽고 빠르게 수행할 수 있다.
이하, 도 7a 및 도 7b는 본 발명과 관련된 전자 장치에서, 응답을 요하는 실행명령을 전달받은 경우, 복수의 인공 지능 장치의 동작을 설명하기 위한 서로 다른 예시들이다.
구체적으로, 도 7a는 실행명령에 따른 응답이 마스터 장치(100a)를 경유하여 제1 인공 지능 장치로 전달되는 예시이고, 도 7b는 실행명령에 따른 응답이 마스터 장치(100a)를 거치지 않고 직접 제2 인공 지능 장치에서 제1 인공 지능 장치로 전달되는 예시이다.
먼저, 도 7a를 참조하면, 제1 인공 지능 장치(200a)가 실행명령을 마스터 장치(100a)로 전달한다(①). 마스터 장치(100)는 해당 실행명령을 수행할 수 있는 인공 지능 장치를 탐색하여, 제2 인공 지능 장치(200c)로 실행명령을 전달한다(②). 제2 인공 지능 장치(200c)가 실행명령에 따라 동작을 수행하면(③), 그 실행 결과를 마스터 장치(100a)로 전달한다(④). 마스터 장치(100a)는 다시 처음 실행명령을 전달한 제1 인공 지능 장치(200a)로 실행 결과를 전달한다(⑤). 제1 인공 지능 장치(200a)는 전달 받은 실행 결과를 화면에 표시한다(⑥).
다음, 도 7b를 참조하면, 제1 인공 지능 장치(200a)가 실행명령을 마스터 장치(100a)로 전달한다(①). 마스터 장치(100)는 해당 실행명령을 수행할 수 있는 인공 지능 장치를 탐색하여, 제2 인공 지능 장치(200c)로 실행명령과 함께 제1 인공 지능 장치(200a)에 대한 정보를 전달한다(②+200a정보).
이를 위해, 제어부(180)는 탐색된 제2 인공 지능 장치(200c)로 상기 실행명령의 전송시, 실행명령이 포함된 제1패킷에 상기 음성에 대응되는 실행명령을 전달한 제1 인공 지능 장치(200a)의 프로파일 정보를 첨부한다.
제2 인공 지능 장치(200c)가 실행명령에 따라 동작을 수행하면(③), 제1패킷에 포함된 프로파일 정보에 기초하여, 동작의 수행 결과를 제1 인공 지능 장치(200a)로 전송한다. 이때, 동작의 수행 결과와 함께 자신에 대한 정보를 함께 전달한다(④+200c).
이를 위해, 상기 제어부(180)는 상기 제1패킷을 수신한 제2 인공 지능 장치(200c)가, 상기 실행명령의 대응되는 동작의 결과 정보가 포함된 제2패킷에 자신의 프로파일 정보를 첨부하여 상기 제1 인공 지능 장치(200a)로 전송하도록 제어할 수 있다. 또, 이를 위해, 상기 제1패킷에는, 제2 인공 지능 장치(200c)가 상기 제2패킷을 생성하여 제1인공 지능 장치로 전달하라는 명령이 포함될 수 있다.
이와 같이 본 발명에서는 사용자가 음성명령을 특정 인공 지능 장치에 직접 입력하거나 마스터 장치에 입력하기 위해 이동할 필요가 없고, 현재 위치에서 가까운 인공 지능 장치를 통해서 제어 결과를 확인할 수 있다
이하, 도 8a는 본 발명에 있어서, 사용자 음성을 복수의 인공 지능 장치에서 수신한 경우의 처리 동작을 설명하기 위한 개념도이고, 도 8b는 복수의 사용자 음성이 수신된 경우의 처리 동작을 설명하기 위한 개념도이다.
먼저, 도 8a를 참조하면, 한(single) 사용자(10)가 발화한 기 설정된 시동어를 포함한 음성을 복수의 인공 지능 장치들(200a, 200b)에서 수신할 수 있다.
이러한 경우, 음성 수신 상태의 비교 결과에 근거하여 어느 하나의 인공 지능 장치가 선택되고, 선택된 인공 지능 장치로부터 상기 음성에 대응되는 실행명령이 수신될 수 있다. 이때, 비록 사용자의 현재 위치가 인공 지능 TV(200a) 보다 인공 지능 냉장고(200b)에 가깝더라도, 인공 지능 TV(200a)의 음성 수신 상태가 더 양호하다면 인공 지능 TV(200a)이 해당 음성을 처리하기 위한 제1 인공 지능 장치가 된다.
다음, 도 8b를 참조하면, 복수의 사용자들(10a, 10b)이 기 설정된 시동어를 포함한 서로 다른 음성명령을 발화한 경우이다. 이러한 경우, 복수의 서로 다른 음성을 발화한 각 사용자로부터 근접한 복수의 인공 지능 장치로부터, 각 음성에 대응되는 복수의 실행명령이 마스터 장치로 각각 전달될 수 있다.
이와 같이 복수의 실행명령이 마스터 장치로 전달된 경우, 상기 제어부(180)는, 탐색된 인공 지능 장치로 복수의 실행명령의 전송시, 상기 복수의 실행명령 각각에 매칭되는 복수의 인공 지능 장치에 대한 ID를 첨부할 수 있다.
예를 들어, 도 8b에서, 인공 지능 냉장고(200b)로부터 수신된 실행명령은 냉장고 ID가 첨부되어 제2 인공 지능 장치로 전달된다. 그리고, 인공 지능 TV(200a)로부터 수신된 실행명령은 TV ID가 첨부되어 제2 인공 지능 장치로 전달된다. 따라서 복수의 실행명령에 대한 목적지가 동일하더라도 오류나 혼란이 발생하지 않는다.
이하, 도 9a는 제1 인공 지능 장치로부터 전달받은 실행명령이 슬레이브 기기로 수신된 경우, 실행명령에 대한 처리 동작을 설명하기 위한 개념도이고, 도 9b는 동일 네트워크 영역 내에 실행명령을 수행할 인공 지능 장치가 탐색되지 않는 경우의 처리 동작을 설명하기 위한 개념도이다.
도 9a를 참조하면, 슬레이브 장치(100b)도 복수의 인공 지능 장치(200a, 200c)에 대한 프로파일을 가지고 있으므로, 제1 인공 지능 장치(200a)에 의해 생성된 실행명령(①,②)을 수신할 수 있다(③).
이러한 경우, 슬레이브 장치(100b)는 실행가능명령이 리스트와 그에 매칭되는 인공 지능 장치에 대한 프로파일은 없으므로, 마스터 장치(100a)에 질의 정보를 전송한다. 그리고, 마스터 장치(100a)로부터 프로파일 정보와 리스트를 전달받거나(이때, 암호화될 수 있음), 상기 질의 정보에 실행명령과 제1 인공 지능 장치(200a)에 대한 프로파일을 포함시켜서 전송할 수 있다.
전자의 경우, 슬레이브 장치(100b)가 마치 마스터 장치로 동작할 수 있다.
후자의 경우, 마스터 장치(100a)로부터 탐색된 목적지(예, 세탁기)를 포함한 실행명령을 전달받는다. 어느 경우에나 슬레이브 장치(100b)와 마스터 장치(100a)가 상호 인터랙션을 수행한다(④).
이 후, 슬레이브 장치(100b)로부터 제2 인공 지능 장치(200c)로 실행명령이 전달된다(⑤). 이때, 슬레이브 장치(100b)는 제2 인공 지능 장치(200c)의 동작 결과 정보를 마스터 장치(100a)로 전달해줄 수 있다.
도 9b를 참조하면, 왼쪽은 제1네트워크 영역(910)이고, 오른쪽은 제2네트워크 영역(920)을 도시한 것이다.
도 9b를 참조하면, 제1 네트워크 영역 내에서 실행명령을 수행할 제2 인공 지능 장치를 탐색할 수 없는 경우이다. 이러한 경우, 제1 네트워크 영역 내에 존재하는 마스터 장치(100a)는 제1 인공 지능 장치(200a)로부터 전달받은 실행명령을 기 설정된 기준에 따라 선택된 제2 네트워크 영역 내의 마스터 장치(100c)로 보낸다.
이때, 상기 기 설정된 기준은 예를 들어 제1 네트워크 영역으로부터 가깝고 통신이 가능한 영역으로 결정될 수 있다.
제2 네트워크 영역 내의 마스터 장치(100c)는 제2 네트워크 영역 내에 존재하는 인공 지능 장치들(200d, 200e)에 대한 프로파일 정보와 그에 매칭되는 실행가능명령의 리스트에 기초하여, 전달받은 실행명령을 수행할 제2 인공 지능 장치(200e)를 탐색한다. 그리고, 탐색된 제2 인공 지능 장치(200e)로 실행명령을 전달한다. 제2 인공 지능 장치(200e)의 동작 결과 정보는, 상기 마스터 장치(100c)를 경유하여, 제1 네트워크 영역의 마스터 장치(100a)로 전달된다.
이상에서 설명한 바와 같이, 본 발명의 실시 예들에 따르면, 다수의 인공 지능 장치들이 공존하는 환경에서, 사용자가 전자장치나 제어할 가전기기의 종류 및 위치를 고려할 필요 없이, 나아가 제어할 기기를 명확하게 지정하지 않고도, 심리스(seamless)한 음성명령을 통해 특정 인공 지능 장치에 대한 제어를 쉽고 빠르게 수행할 수 있다. 또, 사용자는 음성명령을 특정 인공 지능 장치에 직접 입력하거나 마스터 장치에 입력하기 위해 이동할 필요가 없고, 현재 위치에서 가까운 인공 지능 장치를 통해 제어 결과를 확인할 수 있다. 그에 따라, 사용자의 편의와 다수의 인공 지능 장치들의 사용성이 더욱 향상된다.
전술한 본 발명은, 프로그램이 기록된 매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 매체는, 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 컴퓨터가 읽을 수 있는 매체의 예로는, HDD(Hard Disk Drive), SSD(Solid State Disk), SDD(Silicon Disk Drive), ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광 데이터 저장 장치 등이 있으며, 또한 캐리어 웨이브(예를 들어, 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다. 또한, 상기 컴퓨터는 단말기의 제어부(180)를 포함할 수도 있다. 따라서, 상기의 상세한 설명은 모든 면에서 제한적으로 해석되어서는 아니되고 예시적인 것으로 고려되어야 한다. 본 발명의 범위는 첨부된 청구항의 합리적 해석에 의해 결정되어야 하고, 본 발명의 등가적 범위 내에서의 모든 변경은 본 발명의 범위에 포함된다.

Claims (13)

  1. 음성을 수신하도록 형성된 음성 수신부;
    기 설정된 시동어에 의하여 활성화되도록 설정된 인공 지능 서버와 통신하는 통신부; 및
    상기 인공 지능 서버와 통신하는 하나 이상의 인공 지능 장치와 통신하여 프로파일 정보를 획득하고, 획득된 프로파일 정보와 그에 매칭되는 실행가능명령의 리스트를 저장하여 상기 하나 이상의 인공 지능 장치를 등록하는 제어부를 포함하고,
    상기 제어부는,
    등록된 인공 지능 장치에 상기 기 설정된 시동어를 포함하는 음성이 수신되고 상기 등록된 인공 지능 장치로부터 상기 음성에 대응되는 실행명령이 전달된 것에 응답하여, 상기 프로파일 정보와 리스트에 기초하여 상기 실행명령을 수행할 인공 지능 장치를 탐색하고, 탐색된 인공 지능 장치로 상기 실행명령을 전송하는 것을 특징으로 하는 전자장치.
  2. 제1항에 있어서,
    상기 제어부는,
    일정 영역 내에 존재하는 하나 이상의 인공 지능 장치에 대한 프로파일 정보를 수신하고, 기 설정된 기준에 따라 본체가 마스터 기기로 선택된 것에 응답하여, 상기 프로파일 정보와 그에 매칭되는 실행가능명령의 리스트를 저장하는 것을 특징으로 하는 전자장치.
  3. 제1항에 있어서,
    상기 등록된 인공 지능 장치에 상기 기 설정된 시동어를 포함하는 음성이 수신되고 상기 음성에 대응되는 실행명령이 해당 인공 지능 장치에서 수행할 수 있는 것으로 확인되면, 해당 실행명령의 전달이 수행되지 않는 것을 특징으로 하는 전자장치.
  4. 제1항에 있어서,
    상기 제어부는,
    상기 실행명령을 수행할 인공 지능 장치가 복수 개 탐색된 경우, 사용자의 현재 위치에 근접한 인공 지능 장치가 실행명령을 수행하도록, 해당 실행명령을 전송하는 것을 특징으로 하는 전자장치.
  5. 제1항에 있어서,
    상기 제어부는,
    탐색된 인공 지능 장치로 상기 실행명령이 전송된 후, 해당 인공 지능 장치에서 상기 실행명령에 대응되는 동작의 결과 정보를 수신하는 것을 특징으로 하는 전자장치.
  6. 제5항에 있어서,
    상기 제어부는,
    상기 결과 정보를 상기 음성에 대응되는 실행명령을 전달한 인공 지능 장치로 전송해주는 것을 특징으로 하는 전자장치.
  7. 제1항에 있어서,
    상기 제어부는,
    상기 탐색된 인공 지능 장치로 상기 실행명령의 전송시, 실행명령이 포함된 제1패킷에 상기 음성에 대응되는 실행명령을 전달한 제1인공 지능 장치의 프로파일 정보를 첨부시키고,
    상기 제1패킷을 수신한 제2인공 지능 장치가, 상기 실행명령의 대응되는 동작의 결과 정보가 포함된 제2패킷에 자신의 프로파일 정보를 첨부하여 상기 제1인공 지능 장치로 전송하도록 제어하는 것을 특징으로 하는 전자장치.
  8. 제1항에 있어서,
    상기 기 설정된 시동어를 포함하는 음성이 복수의 인공 지능 장치에 수신된 경우, 음성 수신 상태의 비교 결과에 근거하여 어느 하나의 인공 지능 장치가 선택되고, 선택된 인공 지능 장치로부터 상기 음성에 대응되는 실행명령이 수신되는 것을 특징으로 하는 전자장치.
  9. 제1항에 있어서,
    상기 기 설정된 시동어를 포함하는 복수의 서로 다른 음성이 수신된 경우, 복수의 서로 다른 음성을 발화한 각 사용자로부터 근접한 복수의 인공 지능 장치로부터, 각 음성에 대응되는 복수의 실행명령이 전달되고,
    상기 제어부는,
    탐색된 인공 지능 장치에 상기 복수의 실행명령의 전송시, 상기 복수의 실행명령 각각에 매칭되는 복수의 인공 지능 장치에 대한 ID를 첨부하는 것을 특징으로 하는 전자장치.
  10. 기 설정된 시동어에 의하여 활성화되도록 설정된 인공 지능 서버;
    상기 기 설정된 시동어를 포함하는 음성을 수신하도록 설정된 복수의 인공 지능 장치; 및
    상기 복수의 인공 지능 장치와 통신하여, 상기 복수의 인공 지능 장치에 대한 프로파일 정보를 획득하고, 획득된 프로파일 정보와 그에 매칭되는 실행가능명령의 리스트를 저장하여 상기 복수의 인공 지능 장치를 등록하는 마스터 전자장치; 를 포함하고,
    상기 마스터 전자장치는,
    등록된 복수의 인공 지능 장치 중 하나에 상기 기 설정된 시동을 포함하는 음성이 수신되고, 해당 인공 지능 장치로부터 상기 음성에 대응되는 실행명령이 전달된 것에 응답하여, 상기 저장된 프로파일 정보와 리스트에 기초하여 상기 실행명령을 수행할 적어도 하나의 인공 지능 장치를 탐색하고, 탐색된 인공 지능 장치로 상기 실행명령을 전송하는 것을 특징으로 하는 복수의 인공 지능 장치를 포함하는 시스템.
  11. 제10항에 있어서,
    상기 복수의 인공 지능 장치와 통신하여, 상기 복수의 인공 지능 장치에 대한 프로파일 정보를 획득하는 슬레이브 전자장치를 더 포함하고,
    상기 슬레이브 전자장치에 상기 음성에 대응되는 실행명령이 전달된 경우, 상기 마스터 전자장치로부터 상기 저장된 프로파일 정보와 리스트를 전달받아 상기 실행명령을 수행할 적어도 하나의 인공 지능 장치를 탐색하고,
    상기 슬레이브 전자장치는 상기 실행명령에 대응되는 동작의 결과 정보를 탐색된 인공 지능 장치로부터 수신하여 상기 마스터 전자장치로 전달하는 것을 특징으로 하는 복수의 인공 지능 장치를 포함한 시스템.
  12. 제10항에 있어서,
    상기 마스터 전자장치가 상기 저장된 프로파일 정보와 리스트에 기초하여 상기 실행명령을 수행할 적어도 하나의 인공 지능 장치를 탐색할 수 없으면, 다른 네트워크 영역의 마스터 전자장치로 상기 실행명령을 전송하는 것을 특징으로 하는 복수의 인공 지능 장치를 포함한 시스템.
  13. 하나 이상의 인공 지능 장치와 통신하여 프로파일 정보를 획득하는 단계;
    획득된 프로파일 정보와 그에 매칭되는 실행가능명령의 리스트를 저장하여 상기 하나 이상의 인공 지능 장치를 등록하는 단계;
    상기 인공 지능 장치에 기 설정된 시동어를 포함하는 음성이 수신되면, 상기 음성에 대응되는 실행명령을 해당 인공 지능 장치로부터 전달받는 단계;
    상기 프로파일 정보와 리스트에 기초하여 상기 실행명령을 수행할 인공 지능 장치를 탐색하는 단계; 및
    탐색된 인공 지능 장치로 상기 실행명령을 전송하는 단계를 포함하여 이루어지는 것을 특징으로 하는 전자장치의 동작 방법.
KR1020197020770A 2019-04-18 2019-04-18 전자장치, 그 동작방법, 및 복수의 인공지능장치를 포함한 시스템 KR20210142783A (ko)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/KR2019/004673 WO2020213762A1 (ko) 2019-04-18 2019-04-18 전자장치, 그 동작방법, 및 복수의 인공지능장치를 포함한 시스템

Publications (1)

Publication Number Publication Date
KR20210142783A true KR20210142783A (ko) 2021-11-26

Family

ID=72838269

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020197020770A KR20210142783A (ko) 2019-04-18 2019-04-18 전자장치, 그 동작방법, 및 복수의 인공지능장치를 포함한 시스템

Country Status (3)

Country Link
US (1) US11328717B2 (ko)
KR (1) KR20210142783A (ko)
WO (1) WO2020213762A1 (ko)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016508007A (ja) 2013-02-07 2016-03-10 アップル インコーポレイテッド デジタルアシスタントのためのボイストリガ
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
DK201770429A1 (en) 2017-05-12 2018-12-14 Apple Inc. LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
US10928918B2 (en) 2018-05-07 2021-02-23 Apple Inc. Raise to speak
DK180639B1 (en) 2018-06-01 2021-11-04 Apple Inc DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT
US11462215B2 (en) 2018-09-28 2022-10-04 Apple Inc. Multi-modal inputs for voice commands
US11475884B2 (en) * 2019-05-06 2022-10-18 Apple Inc. Reducing digital assistant latency when a language is incorrectly determined
US11468890B2 (en) 2019-06-01 2022-10-11 Apple Inc. Methods and user interfaces for voice-based control of electronic devices
US11295741B2 (en) * 2019-12-05 2022-04-05 Soundhound, Inc. Dynamic wakewords for speech-enabled devices
KR20230010624A (ko) 2020-03-10 2023-01-19 밋카이, 인크. 다중 언어, 다중 턴, 다중 도메인 가상 어시스턴트를 강화하기 위한 병렬 가설적 추론
CN115699036A (zh) * 2020-03-17 2023-02-03 梅特凯股份有限公司 支持跨平台、边缘-云混合人工智能服务的智能层
US11061543B1 (en) 2020-05-11 2021-07-13 Apple Inc. Providing relevant data items based on context
US11490204B2 (en) 2020-07-20 2022-11-01 Apple Inc. Multi-device audio adjustment coordination
US11438683B2 (en) 2020-07-21 2022-09-06 Apple Inc. User identification using headphones
WO2022076471A1 (en) 2020-10-05 2022-04-14 MeetKai, Inc. System and method for automatically generating question and query pairs
US11763809B1 (en) * 2020-12-07 2023-09-19 Amazon Technologies, Inc. Access to multiple virtual assistants
WO2023097524A1 (zh) * 2021-11-30 2023-06-08 华为技术有限公司 设备的控制方法及装置

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101072709B1 (ko) 2009-06-15 2011-10-11 브이 앤드 씨 컴퍼니 리미티드 영역 우선 음성인식 홈네트워크 시스템
US20140156281A1 (en) * 2012-12-03 2014-06-05 Qualcomm Incorporated Voice-controlled configuration of an automation system
US9431014B2 (en) 2013-07-25 2016-08-30 Haier Us Appliance Solutions, Inc. Intelligent placement of appliance response to voice command
US10304463B2 (en) * 2016-10-03 2019-05-28 Google Llc Multi-user personalization at a voice interface device
US10636428B2 (en) * 2017-06-29 2020-04-28 Microsoft Technology Licensing, Llc Determining a target device for voice command interaction
KR20190016260A (ko) 2017-08-08 2019-02-18 엘지전자 주식회사 가전기기 제어 시스템 및 그 제어방법
KR102384643B1 (ko) * 2017-08-17 2022-04-08 엘지전자 주식회사 전자 장치 및 그 제어 방법
US10902851B2 (en) * 2018-11-14 2021-01-26 International Business Machines Corporation Relaying voice commands between artificial intelligence (AI) voice response systems

Also Published As

Publication number Publication date
WO2020213762A1 (ko) 2020-10-22
US11328717B2 (en) 2022-05-10
US20210366473A1 (en) 2021-11-25

Similar Documents

Publication Publication Date Title
US11328717B2 (en) Electronic device, operating method thereof, system having plural artificial intelligence devices
KR102389041B1 (ko) 이동단말기 및 머신 러닝을 이용한 이동 단말기의 제어방법
KR102384643B1 (ko) 전자 장치 및 그 제어 방법
US10964319B2 (en) Electronic device and method of controlling the same
KR102411766B1 (ko) 음성 인식 서비스를 활성화하는 방법 및 이를 구현한 전자 장치
KR102445382B1 (ko) 음성 처리 방법 및 이를 지원하는 시스템
KR102389625B1 (ko) 사용자 발화를 처리하는 전자 장치 및 이 전자 장치의 제어 방법
KR102309031B1 (ko) 지능형 에이전트 관리 방법 및 장치
EP3373525A2 (en) Electronic device and method using machine learning for identifying characteristics of users located within a specific space
KR102321855B1 (ko) 음성으로 상호작용하는 인공 지능 장치 및 그 방법
US11605379B2 (en) Artificial intelligence server
US10685650B2 (en) Mobile terminal and method of controlling the same
KR20190008663A (ko) 음성 데이터 처리 방법 및 이를 지원하는 시스템
KR102472010B1 (ko) 전자 장치 및 전자 장치의 기능 실행 방법
US11483172B2 (en) Integrated control method and system for home appliance using artificial intelligence
US20210110815A1 (en) Method and apparatus for determining semantic meaning of pronoun
KR20210138181A (ko) 안내 로봇 및 안내 로봇의 동작 방법
KR20200085143A (ko) 외부 장치를 등록하는 대화형 제어 시스템 및 방법
US11380311B2 (en) Artificial intelligence apparatus for recognizing speech including multiple languages, and method for the same
KR102390685B1 (ko) 전자 장치 및 그 제어 방법
KR102369309B1 (ko) 파셜 랜딩 후 사용자 입력에 따른 동작을 수행하는 전자 장치
KR102511517B1 (ko) 음성 입력 처리 방법 및 이를 지원하는 전자 장치
US20190163436A1 (en) Electronic device and method for controlling the same
US20210125627A1 (en) Method and apparatus for speech analysis
KR20190031829A (ko) 전자 장치 및 그 제어 방법

Legal Events

Date Code Title Description
G15R Request for early publication
A201 Request for examination
E902 Notification of reason for refusal