KR102392113B1 - 전자 장치 및 전자 장치의 음성 명령 처리 방법 - Google Patents

전자 장치 및 전자 장치의 음성 명령 처리 방법 Download PDF

Info

Publication number
KR102392113B1
KR102392113B1 KR1020160006908A KR20160006908A KR102392113B1 KR 102392113 B1 KR102392113 B1 KR 102392113B1 KR 1020160006908 A KR1020160006908 A KR 1020160006908A KR 20160006908 A KR20160006908 A KR 20160006908A KR 102392113 B1 KR102392113 B1 KR 102392113B1
Authority
KR
South Korea
Prior art keywords
command
processor
electronic device
signal
wake
Prior art date
Application number
KR1020160006908A
Other languages
English (en)
Other versions
KR20170087207A (ko
Inventor
이요한
양진길
주재석
조치현
허창룡
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020160006908A priority Critical patent/KR102392113B1/ko
Priority to US15/411,140 priority patent/US10229681B2/en
Publication of KR20170087207A publication Critical patent/KR20170087207A/ko
Application granted granted Critical
Publication of KR102392113B1 publication Critical patent/KR102392113B1/ko

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J13/00Controls for manipulators
    • B25J13/003Controls for manipulators by means of an audio-responsive input
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J11/00Manipulators not otherwise provided for
    • B25J11/0005Manipulators having means for high-level communication with users, e.g. speech generator, face recognition means
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J19/00Accessories fitted to manipulators, e.g. for monitoring, for viewing; Safety devices combined with or specially adapted for use in connection with manipulators
    • B25J19/02Sensing devices
    • B25J19/026Acoustical sensing devices
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1656Programme controls characterised by programming, planning systems for manipulators
    • B25J9/1664Programme controls characterised by programming, planning systems for manipulators characterised by motion, path, trajectory planning
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1679Programme controls characterised by the tasks executed
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
    • H04R1/40Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
    • H04R1/406Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L2015/088Word spotting
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/02Casings; Cabinets ; Supports therefor; Mountings therein
    • H04R1/028Casings; Cabinets ; Supports therefor; Mountings therein associated with devices performing functions other than acoustics, e.g. electric candles
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2201/00Details of transducers, loudspeakers or microphones covered by H04R1/00 but not provided for in any of its subgroups
    • H04R2201/40Details of arrangements for obtaining desired directional characteristic by combining a number of identical transducers covered by H04R1/40 but not provided for in any of its subgroups
    • H04R2201/4012D or 3D arrays of transducers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/20Processing of the output signals of the acoustic transducers of an array for obtaining a desired directivity characteristic

Abstract

전자 장치가 개시된다. 일 실시 예에 따른 전자 장치는, 바디(body), 바디와 물리적으로 연결되며 회전 가능한 헤드(head), 바디 또는 헤드에 배치되는 복수의 마이크, 복수의 마이크와 전기적으로 연결되고 헤드의 회전을 제어하는 프로세서 및 프로세서와 전기적으로 연결된 메모리를 포함하고, 프로세서는, 제1 방향에서 수신되는 제1 웨이크 업(wake up) 신호에 반응하여 헤드를 제1 방향으로 향하게 하고, 제1 방향에서 수신되는 제1 명령을 처리하는 동안 제2 방향에서 제2 웨이크 업 신호가 수신되면 제2 방향에 대한 정보를 메모리에 저장하고, 제1 명령의 처리가 완료되면 헤드를 제2 방향으로 향하게 하고 제2 방향에서 수신되는 제2 명령을 처리하도록 설정될 수 있다. 이 외에도 명세서를 통해 파악되는 다양한 실시 예가 가능하다.

Description

전자 장치 및 전자 장치의 음성 명령 처리 방법{ELECTRONIC DEVICE AND METHOD FOR PROCESSING VOICE COMMAND THEREOF}
본 문서에서 개시되는 실시 예들은, 복수의 사용자에 의한 음성 명령을 처리하기 위한 기술과 관련된다.
전자 기술의 발달에 힘입어 다양한 유형의 전자 제품들이 개발 및 보급되고 있다. 특히, 최근에는 사용자의 명령에 따라 이동할 수 있고 다양한 기능을 수행할 수 있는 전자 로봇 장치에 대한 관심이 높아지고 있다. 전자 로봇 장치는 사용자에 의해 발생된 음성을 감지하고, 감지된 음성에 대응하는 기능을 실행할 수 있다.
전자 로봇 장치는 복수의 마이크를 포함하나, 한번에 한 명의 사용자의 명령에만 반응할 수 있다. 이에 따라, 복수의 사용자 중 한 명의 사용자가 전자 로봇 장치에 명령을 내리는 동안 다른 사용자들은 전자 로봇 장치를 이용하기 위해 대기해야 하는 불편함이 발생될 수 있다.
본 발명의 다양한 실시 예들은, 동시에 발생될 수 있는 복수의 사용자의 음성 신호를 효율적으로 처리할 수 있는 전자 로봇 장치 및 방법을 제공할 수 있다.
본 문서에 개시되는 일 실시 예에 따른 전자 로봇 장치(electronic robot device)는, 바디(body), 바디와 물리적으로 연결되며 회전 가능한 헤드(head), 바디 또는 헤드에 배치되는 복수의 마이크, 복수의 마이크와 전기적으로 연결되고 헤드의 회전을 제어하는 프로세서 및 프로세서와 전기적으로 연결된 메모리를 포함하고, 프로세서는, 제1 방향에서 수신되는 제1 웨이크 업(wake up) 신호에 반응하여 헤드를 제1 방향으로 향하게 하고, 제1 방향에서 수신되는 제1 명령을 처리하는 동안 제2 방향에서 제2 웨이크 업 신호가 수신되면 제2 방향에 대한 정보를 메모리에 저장하고, 제1 명령의 처리가 완료되면 헤드를 제2 방향으로 향하게 하고 제2 방향에서 수신되는 제2 명령을 처리하도록 설정될 수 있다.
또한, 본 문서에 개시되는 일 실시 예에 따른 전자 장치는, 하우징, 하우징의 적어도 일부를 통해 노출된 마이크 어레이(array of microphones)로서, 마이크 어레이는 상이한 방향들로부터 소리를 수신하도록 배열되거나 구성된, 마이크 어레이, 하우징을 통해 노출된 스피커, 휘발성 메모리, 하우징 내부에 위치되고, 마이크 어레이, 스피커 및 휘발성 메모리와 전기적으로 연결된 프로세서 및 프로세서와 전기적으로 연결된 비휘발성 메모리를 포함하고, 비휘발성 메모리는 실행될 때 프로세서로 하여금: 마이크 어레이의 적어도 일부를 이용하여, 제1 음성 인식을 트리거링(triggering)하는 제1 음성 명령을 수신하고, 제1 음성 인식의 적어도 일부를 수행하고, 휘발성 메모리 내에 제1 음성 인식의 결과를 적어도 일시적으로 저장하고, 제1 음성 인식의 적어도 일부를 수행하는 동안 마이크 어레이의 적어도 일부를 이용하여, 제2 음성 인식을 트리거링하는 제2 음성 명령을 수신하고, 제2 음성 명령이 전달된 방향을 결정하고 및 결정된 방향을 이용하여, 제2 음성 인식의 적어도 일부를 수행하도록 하는 인스트럭션들을 저장할 수 있다.
또한, 본 문서에 개시되는 일 실시 예에 따른 방법은, 마이크 어레이의 적어도 일부를 이용하여, 제1 음성 인식을 트리거링(triggering)하는 제1 음성 명령을 수신하는 동작, 제1 음성 인식의 적어도 일부를 수행하는 동작, 제1 음성 인식의 결과를 적어도 일시적으로 저장하는 동작, 제1 음성 인식의 적어도 일부를 수행하는 동안 마이크 어레이의 적어도 일부를 이용하여, 제2 음성 인식을 트리거링하는 제2 음성 명령을 수신하는 동작, 제2 음성 명령이 전달된 방향을 결정하는 동작, 및 결정된 방향을 이용하여, 제2 음성 인식의 적어도 일부를 수행하는 동작을 포함할 수 있다.
본 발명의 다양한 실시 예들에 따르면, 본 발명은 사용자를 응대하는 동안 수신된 다른 사용자들의 명령을 순차적으로 처리함으로써, 복수의 사용자에 대한 응대를 효과적으로 수행할 수 있다.
또한, 본 발명은 복수의 사용자들의 음성이 수신된 방향에 대한 정보를 순차적으로 저장함으로써, 음성이 수신된 순서대로 음성이 수신된 방향에 대한 응대를 제공할 수 있다.
또한, 본 발명은 표시부를 이용하여 사용자로부터 음성이 수신된 방향으로 음성의 처리 상태를 출력함으로써, 사용자가 음성의 처리 여부를 확인할 수 있는 표지를 제공할 수 있다.
이 외에, 본 문서를 통해 직접적 또는 간접적으로 파악되는 다양한 효과들이 제공될 수 있다.
도 1은 일 실시 예에 따른 전자 장치가 동작하는 환경을 나타낸다.
도 2는 일 실시 예에 따른 전자 장치가 동작하는 환경을 나타낸다.
도 3은 일 실시 예에 따른 전자 장치의 구성을 나타내는 블록도이다.
도 4는 일 실시 예에 따른 전자 장치의 구성을 나타내는 블록도이다.
도 5는 일 실시 예에 따른 전자 장치에 표시부가 구비된 예시적인 실시 예를 나타낸다.
도 6은 일 실시 예에 따른 전자 장치 내에 저장된 프로그램 모듈의 블록도이다.
도 7은 본 발명의 일 실시 예에 따른 전자 장치의 음성 명령 처리 방법을 설명하기 위한 순서도이다.
도 8은 본 발명의 일 실시 예에 따른 전자 장치의 음성 명령 처리 방법을 설명하기 위한 순서도이다.
도 9는 본 발명의 일 실시 예에 따른 전자 장치의 음성 명령 처리 방법을 설명하기 위한 순서도이다.
도 10은 다양한 실시 예에 따른 네트워크 환경 내의 전자 장치를 나타낸다.
도 11은 다양한 실시 예에 따른 전자 장치의 블록도를 나타낸다.
도 12는 다양한 실시 예에 따른 프로그램 모듈의 블록도를 나타낸다.
이하, 본 발명의 다양한 실시 예가 첨부된 도면을 참조하여 기재된다. 그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 실시 예의 다양한 변경(modification), 균등물(equivalent), 및/또는 대체물(alternative)을 포함하는 것으로 이해되어야 한다. 도면의 설명과 관련하여, 유사한 구성요소에 대해서는 유사한 참조 부호가 사용될 수 있다.
본 문서에서, "가진다", "가질 수 있다", "포함한다", 또는 "포함할 수 있다" 등의 표현은 해당 특징(예: 수치, 기능, 동작, 또는 부품 등의 구성요소)의 존재를 가리키며, 추가적인 특징의 존재를 배제하지 않는다.
본 문서에서, "A 또는 B", "A 또는/및 B 중 적어도 하나", 또는 "A 또는/및 B 중 하나 또는 그 이상" 등의 표현은 함께 나열된 항목들의 모든 가능한 조합을 포함할 수 있다. 예를 들면, "A 또는 B", "A 및 B 중 적어도 하나", 또는 "A 또는 B 중 적어도 하나"는, (1) 적어도 하나의 A를 포함, (2) 적어도 하나의 B를 포함, 또는 (3) 적어도 하나의 A 및 적어도 하나의 B 모두를 포함하는 경우를 모두 지칭할 수 있다.
본 문서에서 사용된 "제1", "제2", "첫째", 또는 "둘째" 등의 표현들은 다양한 구성요소들을, 순서 및/또는 중요도에 상관없이 수식할 수 있고, 한 구성요소를 다른 구성요소와 구분하기 위해 사용될 뿐 해당 구성요소들을 한정하지 않는다. 예를 들면, 제1 사용자 기기와 제2 사용자 기기는, 순서 또는 중요도와 무관하게, 서로 다른 사용자 기기를 나타낼 수 있다. 예를 들면, 본 문서에 기재된 권리 범위를 벗어나지 않으면서 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 바꾸어 명명될 수 있다.
어떤 구성요소(예: 제1 구성요소)가 다른 구성요소(예: 제2 구성요소)에 "(기능적으로 또는 통신적으로) 연결되어((operatively or communicatively) coupled with/to)" 있다거나 "접속되어(connected to)" 있다고 언급된 때에는, 상기 어떤 구성요소가 상기 다른 구성요소에 직접적으로 연결되거나, 다른 구성요소(예: 제3 구성요소)를 통하여 연결될 수 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소(예: 제1 구성요소)가 다른 구성요소(예: 제2 구성요소)에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 상기 어떤 구성요소와 상기 다른 구성요소 사이에 다른 구성요소(예: 제3 구성요소)가 존재하지 않는 것으로 이해될 수 있다.
본 문서에서 사용된 표현 "~하도록 구성된(또는 설정된)(configured to)"은 상황에 따라, 예를 들면, "~에 적합한(suitable for)", "~하는 능력을 가지는(having the capacity to)", "~하도록 설계된(designed to)", "~하도록 변경된(adapted to)", "~하도록 만들어진(made to)", 또는 "~를 할 수 있는(capable of)"과 바꾸어 사용될 수 있다. 용어 "~하도록 구성(또는 설정)된"은 하드웨어적으로 "특별히 설계된(specifically designed to)"것만을 반드시 의미하지 않을 수 있다. 대신, 어떤 상황에서는, "~하도록 구성된 장치"라는 표현은, 그 장치가 다른 장치 또는 부품들과 함께 "~할 수 있는" 것을 의미할 수 있다. 예를 들면, 문구 "A, B, 및 C를 수행하도록 구성(또는 설정)된 프로세서"는 해당 동작을 수행하기 위한 전용 프로세서(예: 임베디드 프로세서), 또는 메모리 장치에 저장된 하나 이상의 소프트웨어 프로그램들을 실행함으로써, 해당 동작들을 수행할 수 있는 범용 프로세서(generic-purpose processor)(예: CPU 또는 application processor)를 의미할 수 있다.
본 문서에서 사용된 용어들은 단지 특정한 실시 예를 설명하기 위해 사용된 것으로, 다른 실시 예의 범위를 한정하려는 의도가 아닐 수 있다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함할 수 있다. 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 용어들은 본 문서에 기재된 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가질 수 있다. 본 문서에 사용된 용어들 중 일반적인 사전에 정의된 용어들은 관련 기술의 문맥 상 가지는 의미와 동일 또는 유사한 의미로 해석될 수 있으며, 본 문서에서 명백하게 정의되지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다. 경우에 따라서, 본 문서에서 정의된 용어일지라도 본 문서의 실시 예들을 배제하도록 해석될 수 없다.
본 문서의 다양한 실시 예들에 따른 전자 장치는, 예를 들면, 스마트폰(smartphone), 태블릿 PC(tablet personal computer), 이동 전화기(mobile phone), 영상 전화기, 전자책 리더기(e-book reader), 데스크탑 PC (desktop PC), 랩탑 PC(laptop PC), 넷북 컴퓨터(netbook computer), 워크스테이션(workstation), 서버, PDA(personal digital assistant), PMP(portable multimedia player), MP3 플레이어, 모바일 의료기기, 카메라, 또는 웨어러블 장치(wearable device) 중 적어도 하나를 포함할 수 있다. 다양한 실시 예에 따르면 웨어러블 장치는 엑세서리 형(예: 시계, 반지, 팔찌, 발찌, 목걸이, 안경, 콘택트 렌즈, 또는 머리 착용형 장치(head-mounted-device(HMD)), 직물 또는 의류 일체 형(예: 전자 의복), 신체 부착 형(예: 스킨 패드(skin pad) 또는 문신), 또는 생체 이식 형(예: implantable circuit) 중 적어도 하나를 포함할 수 있다.
어떤 실시 예들에서, 전자 장치는 가전 제품(home appliance)일 수 있다. 가전 제품은, 예를 들면, 텔레비전, DVD 플레이어(Digital Video Disk player), 오디오, 냉장고, 에어컨, 청소기, 오븐, 전자레인지, 세탁기, 공기 청정기, 셋톱 박스(set-top box), 홈 오토매이션 컨트롤 패널(home automation control panel), 보안 컨트롤 패널(security control panel), TV 박스(예: 삼성 HomeSync™, 애플TV™, 또는 구글 TV™), 게임 콘솔(예: Xbox™, PlayStation™), 전자 사전, 전자 키, 캠코더, 또는 전자 액자 중 적어도 하나를 포함할 수 있다.
다른 실시 예에서, 전자 장치는, 각종 의료기기(예: 각종 휴대용 의료측정기기(혈당 측정기, 심박 측정기, 혈압 측정기, 또는 체온 측정기 등), MRA(magnetic resonance angiography), MRI(magnetic resonance imaging), CT(computed tomography), 촬영기, 또는 초음파기 등), 네비게이션(navigation) 장치, 위성 항법 시스템(GNSS(Global Navigation Satellite System)), EDR(event data recorder), FDR(flight data recorder), 자동차 인포테인먼트(infotainment) 장치, 선박용 전자 장비(예: 선박용 항법 장치, 자이로 콤파스 등), 항공 전자기기(avionics), 보안 기기, 차량용 헤드 유닛(head unit), 산업용 또는 가정용 로봇, 금융 기관의 ATM(automatic teller's machine), 상점의 POS(point of sales), 또는 사물 인터넷 장치(internet of things)(예: 전구, 각종 센서, 전기 또는 가스 미터기, 스프링클러 장치, 화재경보기, 온도조절기(thermostat), 가로등, 토스터(toaster), 운동기구, 온수탱크, 히터, 보일러 등) 중 적어도 하나를 포함할 수 있다.
어떤 실시 예에 따르면, 전자 장치는 가구(furniture) 또는 건물/구조물의 일부, 전자 보드(electronic board), 전자 사인 수신 장치(electronic signature receiving device), 프로젝터(projector), 또는 각종 계측 기기(예: 수도, 전기, 가스, 또는 전파 계측 기기 등) 중 적어도 하나를 포함할 수 있다. 다양한 실시 예에서, 전자 장치는 전술한 다양한 장치들 중 하나 또는 그 이상의 조합일 수 있다. 어떤 실시 예에 따른 전자 장치는 플렉서블 전자 장치일 수 있다. 또한, 본 문서의 실시 예에 따른 전자 장치는 전술한 기기들에 한정되지 않으며, 기술 발전에 따른 새로운 전자 장치를 포함할 수 있다.
이하, 첨부 도면을 참조하여, 다양한 실시 예에 따른 전자 장치가 설명된다. 본 문서에서, 사용자라는 용어는 전자 장치를 사용하는 사람 또는 전자 장치를 사용하는 장치 (예: 인공지능 전자 장치)를 지칭할 수 있다.
도 1은 일 실시 예에 따른 전자 장치가 동작하는 환경을 나타낸다.
도 1을 참조하면, 전자 장치(100)는 홈 로봇(home robot) 등과 같은 전자 로봇 장치(electronic robot device)일 수 있다. 전자 장치(100)는 하우징을 포함할 수 있고, 바디(body)(110), 헤드(head)(120), 제1 마이크 어레이(130) 및 제2 마이크 어레이(140)를 포함할 수 있다.
바디(110)는 전자 장치(100)가 지면에 놓일 수 있는 형태로 이루어질 수 있다. 예를 들어, 바디(110)는 원통형 또는 원뿔형으로 이루어질 수 있다. 바디(110)는 방사상으로 배열된 마이크 어레이를 포함할 수 있다. 헤드(120)는 바디(110)와 물리적으로 연결될 수 있다. 헤드(120)는 전자 장치(100)에 의해 회전이 제어될 수 있는 로터(rotor)에 의해 바디(110)와 연결될 수 있다. 헤드(120)는 회전 가능하도록 구성될 수 있다. 예를 들어, 헤드(120)는 바디(110)와 연결된 방향을 축으로 하여 회전할 수 있다. 헤드(120)는 전면(예: 명령 수신 시 사용자와 대향하는 면)에 마이크 어레이 및 디스플레이를 포함할 수도 있다. 프로세서 및 메모리 등과 같은 전자 장치(100)의 회로는 바디(110) 또는 헤드(120) 내에 포함될 수 있다.
전자 장치(100)는 하우징의 적어도 일부를 통해 노출된 제1 마이크 어레이(130) 및 제2 마이크 어레이(140)를 포함할 수 있다. 제1 마이크 어레이(130) 및 제2 마이크 어레이(140)는 바디(110) 또는 헤드(120)에 배치될 수 있다. 예를 들어, 제1 마이크 어레이(130)는 바디(110)의 측벽에 배열될 수 있다. 제1 마이크 어레이(130)는 상이한 방향들로부터 소리를 수신하도록 배열되거나 구성될 수 있다. 제1 마이크 어레이(130)에 포함된 마이크는 무지향성 마이크일 수 있다. 제2 마이크 어레이(140)는 헤드(120)의 전면에 배열될 수 있다. 제2 마이크 어레이(140)는 헤드(120)가 향한 방향에서 수신되는 소리를 수신하도록 배열되거나 구성될 수 있다. 제2 마이크 어레이(140)에 포함된 마이크는 지향성 마이크일 수 있다.
전자 장치(100)는 제1 사용자(10)로부터 전자 장치(100)의 음성 인식을 트리거링(triggering)하는 웨이크 업 신호(wake up signal)를 수신할 수 있다(①). 전자 장치(100)는 바디(110)에 배열된 제1 마이크 어레이(130)를 이용하여 제1 사용자(10)로부터 웨이크 업 신호를 수신할 수 있다. 전자 장치(100)는 제1 사용자(10)로부터 웨이크 업 신호가 수신된 방향을 판단할 수 있다. 전자 장치(100)는 웨이크 업 신호가 수신된 방향으로 헤드(120)를 회전시킬 수 있다(②). 전자 장치(100)는 헤드(120)가 회전된 후 제1 사용자(10)에 대한 응대를 수행할 수 있다. 전자 장치(100)는 제1 사용자(10)로부터 명령을 수신할 수 있다(③). 전자 장치(100)는 제1 사용자(10)에 대향하는 마이크를 이용하여 명령을 수신할 수 있다. 예를 들어, 전자 장치(100)는 제1 사용자(10)와 대향하는 헤드(120)에 배열된 제2 마이크 어레이(140)를 이용하여 명령을 수신할 수 있다. 전자 장치(100)는 제1 사용자(10)로부터 수신된 명령에 대응하는 기능을 실행할 수 있다(④).
제1 사용자(10)로부터 명령을 수신하거나 수신된 명령에 대응하는 기능을 실행하는 동안, 전자 장치(100)는 제1 마이크 어레이(130)를 이용하여 제2 사용자(20)로부터 웨이크 업 신호를 수신할 수 있다(⑤). 전자 장치(100)는 제2 사용자(20)로부터 웨이크 업 신호가 수신된 방향에 대한 정보를 저장할 수 있다. 전자 장치(100)는 제1 사용자(10)와의 대화가 종료되면(⑥), 저장된 정보에 기초하여 제2 사용자(20)로부터 웨이크 업 신호가 수신된 방향으로 헤드(120)를 회전시킬 수 있다(⑦). 전자 장치(100)는 헤드(120)가 회전된 후 제2 사용자(20)에 대한 응대를 수행할 수 있다. 전자 장치(100)는 제2 사용자(20)로부터 명령을 수신할 수 있다(⑧). 전자 장치(100)는 제2 사용자(20)와 대향하는 헤드(120)에 배열된 제2 마이크 어레이(140)를 이용하여 명령을 수신할 수 있다. 전자 장치(100)는 제2 사용자(20)로부터 수신된 명령에 대응하는 기능을 실행할 수 있다(⑨).
본 발명의 일 실시 예에 따른 전자 장치(100)는 제1 사용자(10)의 명령을 수신하고 명령에 대응하는 기능을 실행하는 동안 수신된 제2 사용자(20)에 의해 발생된 웨이크 업 신호의 수신 방향을 저장함으로써, 복수의 사용자에 의해 동시 다발적으로 발생되는 명령을 처리할 수 있다.
도 2는 일 실시 예에 따른 전자 장치가 동작하는 환경을 나타낸다.
도 2를 참조하면, 전자 장치(200)는 하우징을 포함할 수 있고, 바디(210), 헤드(220) 및 마이크 어레이(230)를 포함할 수 있다.
전자 장치(200)는 하우징의 적어도 일부를 통해 노출된 마이크 어레이(230)를 포함할 수 있다. 마이크 어레이(230)는 바디(210)의 측벽에 배열될 수 있다. 마이크 어레이(230)는 상이한 방향들로부터 소리를 수신하도록 배열되거나 구성될 수 있다. 마이크 어레이(230)에 포함된 마이크는 무지향성 마이크일 수 있다.
전자 장치(200)는 제1 사용자(10)로부터 전자 장치(200)의 음성 인식을 트리거링하는 웨이크 업 신호를 수신할 수 있다(①). 전자 장치(200)는 마이크 어레이(230)를 이용하여 제1 사용자(10)로부터 웨이크 업 신호를 수신할 수 있다. 전자 장치(200)는 제1 사용자(10)로부터 웨이크 업 신호가 수신된 방향을 판단할 수 있다. 전자 장치(200)는 웨이크 업 신호가 수신된 방향으로 헤드(220)를 회전시킬 수 있다(②). 전자 장치(200)는 제1 사용자(10)로부터 명령을 수신할 수 있다(③). 전자 장치(200)는 마이크 어레이(230)에 포함된 복수의 마이크 중 제1 사용자(10)에 대향하는 마이크(231)를 이용하여 명령을 수신할 수 있다. 전자 장치(200)는 제1 사용자(10)로부터 웨이크 업 신호가 수신된 방향에 기초하여 마이크(231)를 선택할 수 있다. 전자 장치(200)는 제1 사용자(10)로부터 수신된 명령에 대응하는 기능을 실행할 수 있다(④).
제1 사용자(10)로부터 명령을 수신하거나 수신된 명령에 대응하는 기능을 실행하는 동안, 전자 장치(200)는 마이크 어레이(230)를 이용하여 제2 사용자(20)로부터 웨이크 업 신호를 수신할 수 있다(⑤). 전자 장치(200)는 제2 사용자(20)로부터 웨이크 업 신호가 수신된 방향에 대한 정보를 저장할 수 있다. 전자 장치(200)는 제1 사용자(10)와의 대화가 종료되면(⑥), 저장된 정보에 기초하여 제2 사용자(20)로부터 웨이크 업 신호가 수신된 방향으로 헤드(220)를 회전시킬 수 있다(⑦). 전자 장치(200)는 제2 사용자(20)로부터 명령을 수신할 수 있다(⑧). 전자 장치(200)는 마이크 어레이(230)에 포함된 복수의 마이크 중 제2 사용자(20)에 대향하는 마이크(232)를 이용하여 명령을 수신할 수 있다. 전자 장치(200)는 저장된 정보에 기초하여 마이크(232)를 선택할 수 있다. 전자 장치(200)는 제2 사용자(20)로부터 수신된 명령에 대응하는 기능을 실행할 수 있다(⑨).
본 발명의 일 실시 예에 따른 전자 장치(200)는 웨이크 업 신호의 수신 방향을 저장하고 수신 방향에 배열된 마이크를 이용하여 사용자로부터 명령을 수신함으로써, 복수의 사용자에 의해 동시 다발적으로 발생되는 명령을 하나의 마이크 어레이(230)를 이용하여 처리할 수 있다.
도 3은 일 실시 예에 따른 전자 장치의 구성을 나타내는 블록도이다.
도 3을 참조하면, 전자 장치는 마이크 어레이(310), 휘발성 메모리(320) 및 프로세서(360)를 포함할 수 있다. 전자 장치는 도 2에 도시된 전자 장치(200)일 수 있다.
마이크 어레이(310)(예: 도 2의 (130))는 복수의 마이크(311, 312, 313 및 314)를 포함할 수 있다. 복수의 마이크(311, 312, 313 및 314)는 전자 장치의 헤드가 향할 수 있는 방향을 따라 배열될 수 있다. 복수의 마이크(311, 312, 313 및 314)는 임의의 위치에서 전자 장치에 명령을 입력하는 사용자와 대향할 수 있도록 배열될 수 있다. 복수의 마이크(311, 312, 313 및 314)는, 예를 들어, 전자 장치의 측벽을 둘러싸도록 배열될 수 있다. 복수의 마이크(311, 312, 313 및 314)는 무지향성 마이크일 수 있다.
휘발성 메모리(320)는 사용자로부터 웨이크 업 신호가 수신된 방향에 대한 정보를 저장할 수 있다. 휘발성 메모리(320)는 정보를 선입선출 방식으로 저장할 수 있다. 예를 들어, 휘발성 메모리(320)에 제1 정보(321), 제2 정보(322), 제3 정보(323) 및 제n 정보(324)가 순차적으로 저장된 경우, 프로세서(360)는 제1 정보(321), 제2 정보(322), 제3 정보(323) 및 제n 정보(324)와 관련된 처리를 순차적으로 수행할 수 있다. 다른 예를 들면, 휘발성 메모리(320)는 복수의 사용자로부터 웨이크 업 신호가 수신되면 웨이크 업 신호가 수신된 순서대로 방향에 대한 정보를 저장할 수 있다.
프로세서(360)는 마이크 어레이(310) 및 휘발성 메모리(320)와 전기적으로 연결될 수 있다. 프로세서(360)는 마이크 어레이(310) 및 휘발성 메모리(320)를 제어할 수 있다. 프로세서(360)는 전자 장치의 헤드(예: 도 1의 (120) 또는 도 2의 (220))의 회전을 제어할 수도 있다.
일 실시 예에 따르면, 프로세서(360)는 제1 방향에서 수신되는 제1 웨이크 업(wake up) 신호(또는 제1 음성 명령)에 반응하여 헤드를 제1 방향으로 향하게 할 수 있다.
구체적으로, 프로세서(360)는 복수의 마이크(311, 312, 313 및 314)를 이용하여 주변으로부터 음파(예: 제1 사용자에 의해 발생된 음성)를 지속적으로 감지할 수 있다.
프로세서(360)는 감지된 음파가 웨이크 업 신호인지 여부를 판단할 수 있다. 웨이크 업 신호는, 예를 들어, 지정된 단어를 포함하는 음성 신호, 지정된 단어를 포함하는 단어의 조합을 포함하는 음성 신호, 지정된 타입(예: 지정된 문장형(의문형))의 음성 신호, 지정된 도메인과 관련된 음성 신호 또는 지정된 사용자의 음성 신호 등과 같은 다양한 음성 신호를 포함할 수 있다. 예를 들어, 프로세서(360)는 감지된 음파가 지정된 파형과 유사한 경우 웨이크 업 신호가 수신된 것으로 판단할 수 있다. 다른 예를 들면, 프로세서(360)는 감지된 음파에 대한 음성 인식을 수행하고, 음성 인식의 결과에 지정된 단어가 포함된 경우 웨이크 업 신호가 수신된 것으로 판단할 수 있다.
프로세서(360)는 음파가 웨이크 업 신호이면, 웨이크 업 신호의 감지 시간 또는 파형 중 적어도 하나에 기초하여 웨이크 업 신호의 방향(제1 방향)에 대한 정보를 획득할 수 있다. 예를 들어, 프로세서(360)는 복수의 마이크(311, 312, 313 및 314) 각각에서 음파가 감지된 시간 차에 기초하여 웨이크 업 신호의 발생 방향(또는 웨이크 업 신호가 발생된 지점)을 획득할 수 있다. 다른 예를 들면, 프로세서(360)는 복수의 마이크(311, 312, 313 및 314) 각각에서 감지된 음파의 진폭 또는 위상에 기초하여 웨이크 업 신호의 발생 방향을 획득할 수 있다.
프로세서(360)는 방향에 대한 정보에 기초하여 헤드가 웨이크 업 신호의 발생 방향을 향하도록 헤드를 회전시킬 수 있다.
일 실시 예에 따르면, 프로세서(360)는 헤드가 제1 방향으로 회전되면 복수의 마이크 중 제1 방향에 대한 정보에 기초하여 선택된 마이크를 이용하여 제1 사용자에 의해 발생되는 제1 명령을 수신할 수 있다. 프로세서(360)는 복수의 마이크(311, 312, 313 및 314) 중 제1 방향에 배치된 마이크를 이용하여 제1 명령을 수신할 수 있다. 예를 들어, 프로세서(360)는 제1 마이크(311) 및 제2 마이크(312)가 제1 방향에 배치된 경우, 제1 마이크(311) 및 제2 마이크(312)를 이용하여 제1 명령을 수신할 수 있다. 프로세서(360)는 제1 명령에 대응하는 지정된 기능을 실행할 수 있다.
일 실시 예에 따르면, 프로세서(360)는 복수의 마이크 중 2 이상의 마이크를 이용하여 제1 방향으로부터 수신되는 신호를 증폭할 수 있다. 예를 들어, 프로세서(360)는 복수의 마이크(311, 312, 313 및 314) 중 제1 방향에 배치된 제1 마이크(311) 및 제2 마이크(312)를 이용하여 제1 방향으로부터 수신되는 신호를 증폭할 수 있다. 제1 마이크(311) 및 제2 마이크(312)를 이용하여 신호를 감지하는 경우, 제1 방향으로부터 수신되는 신호는 제1 마이크(311) 및 제2 마이크(312)에 동시에 도달할 수 있고, 다른 방향으로부터 수신되는 신호는 상이한 시점에 도달할 수 있다. 이 경우, 프로세서(360)는 수신된 신호를 믹싱(mixing)함으로써 제1 방향으로부터 수신된 신호를 증폭할 수 있다. 프로세서(360)는, 예를 들어, MVDR(minimum variance distortionless response) 또는 LCMV(linearly constrained minimum varince) 등과 같은 기법에 의한 빔포밍 알고리즘(beamforming algorithm)을 이용하여 지정된 방향으로부터 수신되는 신호를 증폭할 수 있다.
일 실시 예에 따르면, 프로세서(360)는 제1 방향에서 수신되는 제1 명령을 처리하는 동안 제2 방향에서 제2 웨이크 업 신호(또는 제2 음성 명령)이 수신되면 제2 방향에 대한 정보를 휘발성 메모리(320)에 저장할 수 있다. 프로세서(360)는 제1 방향에 위치된 제1 사용자가 전자 장치를 사용하는 동안 제2 방향에 위치된 제2 사용자가 전자 장치를 사용하고자 하는 경우, 우선 제2 방향에 대한 정보를 저장한 후 추후에 제2 사용자로부터 수신된 명령을 처리할 수 있다.
일 실시 예에 따르면, 프로세서(360)는 휘발성 메모리(320)에 선입 선출 방식으로 방향에 대한 정보를 저장할 수 있다. 예를 들어, 프로세서(360)는 제2 방향에 대한 정보가 휘발성 메모리(320)에 저장된 후 제1 명령을 처리하는 동안 제3 방향에서 제3 웨이크 업 신호가 수신되면 제3 방향에 대한 정보를 휘발성 메모리(320)에 저장할 수 있다. 이후, 프로세서(360)는 제2 방향으로부터 제2 명령을 수신한 후, 제3 방향으로부터 제3 명령을 수신할 수 있다.
일 실시 예에 따르면, 프로세서(360)는 제1 명령의 처리가 완료되면 헤드를 제2 방향으로 향하게 하고 제2 방향에서 수신되는 제2 명령을 처리할 수 있다.
예를 들어, 프로세서(360)는 제1 방향으로부터 중단 명령이 수신되거나, 제1 방향으로부터 지정된 시간 동안 명령이 수신되지 않으면, 제1 명령의 처리가 완료된 것으로 판단할 수 있다. 다른 예를 들면, 프로세서(360)는 카메라를 이용하여 제1 방향에 위치된 제1 사용자의 움직임을 감지하고, 제1 사용자가 지정된 영역 밖으로 이동하면 제1 명령의 처리가 완료된 것으로 판단할 수 있다.
프로세서(360)는 제1 명령의 처리가 완료되면 휘발성 메모리(320)에 저장된 제2 방향에 대한 정보를 확인할 수 있다. 프로세서(360)는 제2 방향에 대한 정보가 저장된 경우 헤드가 제2 방향을 향하도록 헤드를 회전시킬 수 있다. 헤드가 제2 방향으로 회전되면, 프로세서(360)는 제2 방향에서 수신되는 제2 명령을 처리할 수 있다. 프로세서(360)는 제2 명령에 대응하는 지정된 기능을 실행할 수 있다.
일 실시 예에 따르면, 프로세서(360)는 제2 명령을 처리하는 동안, 복수의 마이크 중 제2 방향에 대한 정보에 기초하여 선택된 마이크를 이용하여 제2 명령을 수신할 수 있다. 프로세서(360)는 복수의 마이크(311, 312, 313 및 314) 중 제2 방향에 배치된 마이크를 이용하여 제2 명령을 수신할 수 있다. 예를 들어, 프로세서(360)는 제3 마이크(313)가 제2 방향에 배치된 경우, 제3 마이크(313)를 이용하여 제2 명령을 수신할 수 있다.
일 실시 예에 따르면, 프로세서(360)는 제2 명령을 처리하는 동안, 복수의 마이크 중 2 이상의 마이크를 이용하여 제2 방향으로부터 수신되는 신호를 증폭할 수 있다. 프로세서(360)는 제2 방향에 배치된 2 이상의 마이크를 이용하여 제2 방향으로부터 수신되는 신호를 증폭할 수 있다. 프로세서(360)는, 예를 들어, MVDR 또는 LCMV 등과 같은 기법에 의한 빔포밍 알고리즘을 이용하여 지정된 방향으로부터 수신되는 신호를 증폭할 수 있다.
일 실시 예에 따르면, 프로세서(360)는 휘발성 메모리(320)에 복수의 방향에 대한 정보가 저장된 경우 정보가 저장된 순서에 따라 헤드를 제어할 수 있다. 프로세서(360)는 제1 명령의 처리 중에 휘발성 메모리(320)에 제2 방향에 대한 정보 및 제3 방향에 대한 정보가 저장된 경우 제2 방향 및 제3 방향에 대한 응대를 순차적으로 수행할 수 있다. 예를 들어, 프로세서(360)는 제1 명령의 처리가 완료되면 헤드를 제2 방향으로 향하게 하고 제2 방향에서 수신되는 제2 명령을 처리하고, 제2 명령의 처리가 완료되면 헤드를 제3 방향으로 향하게 하고 제3 방향에서 수신되는 제3 명령을 처리할 수 있다.
일 실시 예에 따르면, 프로세서(360)는 제1 방향에서 수신되는 명령을 처리하는 동안 명령의 화자를 인지하고, 제2 방향에서 동일한 화자의 명령이 수신되면 헤드를 제2 방향으로 향하게 할 수 있다. 예를 들어, 프로세서(360)는 제1 방향에 위치된 제1 화자로부터 명령을 수신하고 처리할 수 있다. 프로세서(360)는 제1 화자를 인지하고, 제1 화자에 대한 정보를 휘발성 메모리(320)에 저장할 수 있다. 제1 화자는 전자 장치를 향해 명령을 발화하는 중에 이동할 수 있다. 이 경우, 프로세서(360)는 제1 화자로부터 수신된 명령의 처리가 완료되기 전에 제2 방향에서 제1 화자의 명령을 수신할 수 있다. 프로세서(360)는 제2 방향에서 수신된 명령의 화자를 판단할 수 있다. 프로세서(360)는 제2 방향에서 수신된 명령의 화자가 제1 화자이면, 헤드를 즉시 제2 방향으로 회전시킬 수 있다. 프로세서(360)는 제2 방향에서 수신되는 제1 화자의 명령을 처리할 수 있다.
도 4는 일 실시 예에 따른 전자 장치의 구성을 나타내는 블록도이다.
도 4를 참조하면, 전자 장치는 제1 마이크 어레이(411), 제2 마이크 어레이(412), 휘발성 메모리(420), 표시부(430), 스피커(440) 및 비휘발성 메모리(450)를 포함할 수 있다.
제1 마이크 어레이(411)(예: 도 1의 (130))는 복수의 마이크를 포함할 수 있다. 제1 마이크 어레이(411)는 전자 장치의 측벽을 둘러싸도록 배열될 수 있다. 예를 들어, 제1 마이크 어레이(411)는 전자 장치의 바디(예: 도 1의 (110))의 측벽에 배열될 수 있다. 제1 마이크 어레이(411)에 포함된 복수의 마이크는 무지향성 마이크일 수 있다.
제2 마이크 어레이(412)(예: 도 1의 (140))는 하나 이상의 마이크를 포함할 수 있다. 제2 마이크 어레이(412)는 전자 장치의 헤드(예: 도 1의 (120))의 전면이 향하는 방향을 향하도록 배열될 수 있다. 예를 들어, 제2 마이크 어레이(412)는 전자 장치의 헤드의 전면에 배열될 수 있다. 제2 마이크 어레이(412)에 포함된 복수의 마이크는 지향성 마이크일 수도 있다.
휘발성 메모리(420)는 사용자로부터 웨이크 업 신호가 수신된 방향에 대한 정보를 저장할 수 있다. 휘발성 메모리(420)는 도 3에 도시된 휘발성 메모리(320)와 동일한 구성일 수 있다.
표시부(430)는 전자 장치의 바디(예: 도 1의 (110))의 측벽을 둘러싸도록 배치될 수 있다. 예를 들어, 표시부(430)는 전자 장치의 측벽을 따라 배열된 복수의 LED(light emitting diode)를 포함할 수 있다. 다른 예를 들면, 표시부(430)는 전자 장치의 측벽을 둘러싸도록 배치된 디스플레이 패널을 포함할 수 있다. 표시부(430)는 음성 명령(또는 웨이크업 신호) 및 음성 인식(또는 명령)의 처리 상태를 나타내는 표지를 출력할 수 있다.
스피커(440)는 전자 장치의 하우징을 통해 노출될 수 있다. 스피커(440)는, 예를 들어, 음성 명령 또는 음성 인식에 반응하여 소리를 출력할 수 있다.
비휘발성 메모리(450)는 실행될 때 프로세서(460)로 하여금 이하에서 설명될 동작들을 수행하도록 하는 인스트럭션들을 저장할 수 있다.
프로세서(460)는 제1 마이크 어레이(411), 제2 마이크 어레이(412), 휘발성 메모리(420), 표시부(430), 스피커(440) 및 비휘발성 메모리(450)와 전기적으로 연결될 수 있다. 프로세서(460)는 제1 마이크 어레이(411), 제2 마이크 어레이(412), 휘발성 메모리(420), 표시부(430), 스피커(440) 및 비휘발성 메모리(450)를 제어할 수 있다. 프로세서(460)는 도 3에 도시된 프로세서(460)와 동일한 기능을 수행할 수도 있다.
일 실시 예에 따르면, 프로세서(460)는 제1 음성 인식을 트리거링(triggering)하는 제1 음성 명령(또는 제1 웨이크 업 신호)을 수신할 수 있다. 프로세서(460)는 바디에 배치된 제1 마이크 어레이(411)를 이용하여 제1 음성 명령을 수신 또는 감지할 수 있다. 제1 음성 명령은, 예를 들어, “wake up” 등과 같은 지정된 메시지를 포함하는 음성일 수 있다.
일 실시 예에 따르면, 제1 음성 명령이 수신되면, 프로세서(460)는 제1 음성 인식을 수행할 수 있다. 프로세서(460)는 헤드에 배치된 제2 마이크 어레이(412)를 이용하여 제1 음성 인식을 수행할 수 있다. 예를 들어, 프로세서(460)는 제2 마이크 어레이(412)가 제1 음성 명령이 수신된 방향을 향하도록 헤드의 회전을 제어할 수 있다. 프로세서(460)는 제2 마이크 어레이(412)에 의해 감지된 음파에 대한 음성 인식을 수행할 수 있다.
일 실시 예에 따르면, 프로세서(460)는 휘발성 메모리(420) 내에 제1 음성 인식의 결과를 적어도 일시적으로 저장할 수 있다. 프로세서(460)는 제1 음성 인식의 결과에 대응하는 기능을 실행할 수 있다.
일 실시 예에 따르면, 제1 음성 인식을 수행하는 동안, 프로세서(460)는 마이크 어레이의 적어도 일부를 이용하여, 제2 음성 인식을 트리거링하는 제2 음성 명령(또는 제2 웨이크 업 신호)을 수신할 수 있다. 프로세서(460)는 바디에 배치된 제1 마이크 어레이(411)를 이용하여 제2 음성 명령을 수신 또는 감지할 수 있다. 제2 음성 명령은, 예를 들어, 제1 음성 명령과 동일한 메시지를 포함하는 음성일 수도 있고, 제1 음성 명령과 상이한 메시지를 포함하는 음성일 수도 있다.
일 실시 예에 따르면, 프로세서(460)는 제2 음성 명령이 전달된 방향을 결정할 수 있다. 프로세서(460)는, 예를 들어, 제1 마이크 어레이(411)에 포함된 복수의 마이크 각각에서 제2 음성 명령이 감지된 시간차에 기초하여 제2 음성 명령이 전달된 방향을 결정할 수 있다. 다른 예를 들면, 프로세서(460)는 제1 마이크 어레이(411)에 포함된 복수의 마이크 각각에서 감지된 제2 음성 명령의 진폭 또는 위상에 기초하여 제2 음성 명령이 전달된 방향을 결정할 수 있다.
일 실시 예에 따르면, 프로세서(460)는 결정된 방향을 이용하여 제2 음성 인식을 수행할 수 있다. 프로세서(460)는 결정된 방향에 대한 정보를 휘발성 메모리(420)에 저장할 수 있다. 프로세서(460)는 제1 음성 인식이 완료되면 휘발성 메모리(420)에 저장된 방향에 대한 정보를 확인할 수 있다. 휘발성 메모리(420)에 방향에 대한 정보가 저장된 경우, 프로세서(460)는 저장된 정보에 기초하여 제2 마이크 어레이(412)가 결정된 방향을 향하도록 헤드의 회전을 제어할 수 있다. 프로세서(460)는 복수의 마이크 중 결정된 방향에 배열된 일부를 이용하여 제2 음성 인식을 수행할 수 있다. 예를 들어, 프로세서(460)는 결정된 방향을 향한 제2 마이크 어레이(412)를 이용하여 제2 음성 인식을 수행할 수 있다. 프로세서(460)는 제2 음성 인식의 결과에 대응하는 기능을 실행할 수 있다.
일 실시 예에 따르면, 프로세서(460)는 제1 음성 인식의 적어도 일부를 수행하는 동안 제2 음성 명령이 수신되면, 표시부(430)를 이용하여 제2 음성 명령의 처리 상태를 나타내는 표지를 결정된 방향으로 출력할 수 있다. 표시부(430)를 이용하는 실시 예에 대해서는 이하에서 도 5를 참조하여 상세히 설명한다.
도 5는 일 실시 예에 따른 전자 장치에 표시부가 구비된 예시적인 실시 예를 나타낸다.
도 5의 (a)를 참조하면, 전자 장치(501)는 표시부(531)를 포함할 수 있다. 표시부(531)는 복수의 LED를 포함할 수 있다. 복수의 LED는 전자 장치(501)의 측벽을 따라 전자 장치(501)를 둘러싸도록 배열될 수 있다. 도 5의 (a)에 도시된 바와 같이, 복수의 LED는 마이크 어레이에 포함된 복수의 마이크에 대응하는 위치에 배열될 수도 있다.
전자 장치(501)는 사용자로부터 웨이크 업 신호(또는 음성 명령) 또는 명령이 수신되면 사용자가 웨이크 업 신호 또는 명령을 발화한 방향을 판단할 수 있다. 전자 장치(501)는 복수의 LED 중 웨이크 업 신호 또는 명령의 방향에 위치된 LED를 이용하여 웨이크 업 신호 또는 명령의 처리 상태를 나타낼 수 있다. 예를 들어, 전자 장치(501)는 웨이크 업 신호 또는 명령의 수신이 성공된 경우 청색 LED를 켜고, 웨이크 업 신호 또는 명령의 수신이 실패한 경우 적색 LED를 켜고, 다른 사용자가 전자 장치(501)를 이용하고 있는 경우 황색 LED를 켤 수 있다.
도 5의 (b)를 참조하면, 전자 장치(502)는 표시부(532)를 포함할 수 있다. 표시부(532)는 디스플레이 패널을 포함할 수 있다. 디스플레이 패널은 전자 장치(502)를 둘러싸도록 배치될 수 있다.
전자 장치(502)는 사용자로부터 웨이크 업 신호 또는 명령이 수신되면 사용자가 웨이크 업 신호 또는 명령을 발화한 방향을 판단할 수 있다. 전자 장치(502)는 표시부(532)를 이용하여 발화한 방향으로 웨이크 업 신호 또는 명령의 처리 상태를 나타내는 표지를 출력할 수 있다. 예를 들어, 전자 장치(502)는 웨이크 업 신호 또는 명령의 수신이 성공된 경우 사용자가 발화한 방향으로 텍스트 “OK”를 출력하고, 웨이크 업 신호 또는 명령의 수신이 실패한 경우 텍스트 “Can`t”를 출력하고, 다른 사용자가 전자 장치(502)를 이용하고 있는 경우 텍스트 “Wait”를 출력할 수 있다.
본 발명의 일 실시 예에 따른 전자 장치는 처리 상태를 나타내는 표지를 출력함으로써, 제1 사용자가 전자 장치를 사용하는 동안 수신된 제2 사용자의 웨이크 업 신호 또는 명령의 인식 여부를 표시할 수 있다. 또한, 전자 장치는 사용자가 발화한 방향으로 표지를 출력함으로써, 다양한 방향에서 발화하는 복수의 사용자에게 표지를 제공할 수 있다.
도 6은 일 실시 예에 따른 전자 장치 내에 저장된 프로그램 모듈의 블록도이다.
도 6을 참조하면, 프로그램 모듈(600)은 제1 마이크 시스템(610), 방향 제어 시스템(620) 및 제2 마이크 시스템(630)을 포함할 수 있다.
제1 마이크 시스템(610)은, 음파 수집부(611), 웨이크 업 신호 검출부(612), 방향 검출부(613), 사용자 인식부(614) 및 서브 음성 신호 처리부(615)를 포함할 수 있다. 제1 마이크 시스템(610)은 웨이크 업 신호를 수신하고 웨이크 업 신호의 수신 방향을 판단할 수 있다. 제1 마이크 시스템(610)은 특정 사용자로부터 웨이크 업 신호를 수신한 후에도 지속적으로 다른 사용자로부터 발생될 수 있는 웨이크 업 신호를 수신할 수 있다.
음파 수집부(611)는 복수의 마이크를 이용하여 전자 장치의 주변으로부터 음파를 수집할 수 있다. 음파 수집부(611)는 전자 장치에 포함된 복수의 마이크 중 지정된 마이크(예: 도 4의 제1 마이크 어레이(411))를 이용하여 음파를 수집할 수도 있고, 복수의 마이크 중 임의의 마이크(예: 도 3의 마이크 어레이(310))를 이용하여 음파를 수집할 수도 있다.
웨이크 업 신호 검출부(612)는 수집된 음파를 분석하여 웨이크 업 신호를 검출할 수 있다. 웨이크 업 신호 검출부(612)는, 예를 들어, 음파에 대한 음성 인식을 수행하고, 음파에 지정된 메시지가 포함된 경우 웨이크 업 신호가 검출된 것으로 판단할 수 있다.
방향 검출부(613)는 웨이크 업 신호가 검출된 경우 웨이크 업 신호의 감지 시간 및 파형에 기초하여 웨이크 업 신호의 발생 방향을 검출할 수 있다.
일 실시 예에 따르면, 사용자 인식부(614)는 웨이크 업 신호의 발화자를 인식할 수 있다. 사용자 인식부(614)는 웨이크 업 신호의 파형과 미리 저장된 파형을 비교하여 발화자를 인식할 수 있다. 사용자 인식부(614)는 웨이크 업 신호가 수신되면 웨이크 업 신호의 발생 방향에 대한 정보와 함께 웨이크 업 신호의 발화자에 대한 정보를 저장할 수도 있다.
일 실시 예에 따르면, 서브 음성 신호 처리부(615)는 제1 사용자에 대한 응대 중에 제2 사용자로부터 즉시 처리 가능한 지정된 명령이 수신되면, 제1 사용자에 의한 명령의 처리가 완료되기 전에 제2 사용자에 의한 명령을 처리할 수 있다. 예를 들어, 서브 음성 신호 처리부(615)는 전자 장치가 제1 사용자로부터 명령을 수신하거나 수신된 명령을 처리하는 중에 제2 사용자로부터 소등 명령을 수신한 경우, 즉시 전자 장치가 제어할 수 있는 전등을 소등할 수 있다. 지정된 명령은 전자 장치가 홈 로봇인 경우, 예를 들어, 소등, 점등, 냉방 가동, 난방 가동 또는 창문 개폐 등과 같이 전자 장치가 간단하게 처리할 수 있는 명령을 포함할 수 있다. 전자 장치는 서브 음성 신호 처리부(615)에 의해 처리된 명령에 대해 방향 검출 및 저장 등의 동작을 수행하지 않을 수 있다.
방향 제어 시스템(620)은 방향 정보 저장부(621) 및 방향 제어부(622)를 포함할 수 있다. 방향 제어 시스템(620)은 웨이크 업 신호의 발생 방향에 대한 정보를 저장하고 발생 방향에 대한 정보에 따라 전자 장치의 헤드를 제어할 수 있다.
방향 정보 저장부(621)는 검출된 발생 방향에 대한 정보를 저장할 수 있다. 방향 정보 저장부(621)는 웨이크 업 신호가 수신된 순서대로 발생 방향에 대한 정보를 저장할 수 있다. 발생 방향에 대한 정보가 지시하는 방향은 발생 방향과 상이할 수도 있다. 예를 들어, 전자 장치의 헤드가 10°단위로 제어 가능하고 발생 방향이 기준 축으로부터 44° 방향인 경우, 발생 방향에 대한 정보가 지시하는 방향은 기준 축으로부터 40° 방향일 수 있다. 일 실시 예에 따르면, 방향 정보 저장부(621)는 웨이크 업 신호의 발화자에 따라 발생 방향에 대한 정보의 저장 순서를 변경할 수도 있다.
방향 제어부(622)는 발생 방향에 대한 정보에 기초하여 발생 방향에 대한 정보에 기초하여 전자 장치의 헤드를 제어할 수 있다. 방향 제어부(622)는 발생 방향으로 헤드의 전면이 향하도록 헤드를 회전시킬 수 있다. 방향 제어부(622)는 방향 정보 저장부(621)에 의해 방향 정보가 저장된 순서에 따라 헤드를 회전시킬 수 있다. 예를 들어, 제1 방향에 대한 정보 및 제2 방향에 대한 정보가 순차적으로 저장된 경우, 방향 제어부(622)는 제1 방향으로 헤드를 회전시킨 후, 제2 방향으로 헤드를 회전시킬 수 있다.
일 실시 예에 따르면, 방향 제어부(622)는 웨이크 업 신호의 발화자에 따라 순서를 변경하여 헤드를 회전시킬 수 있다. 예를 들어, 방향 제어부(622)는 제1 웨이크 업 신호(또는 제1 명령)가 제2 웨이크 업 신호(또는 제2 명령)보다 먼저 발생되었으나 제2 웨이크 업 신호(또는 제2 명령)의 발화자의 우선 순위가 제1 웨이크 업 신호(또는 제1 명령)의 발화자의 우선 순위보다 높은 경우, 헤드를 제2 방향으로 향하게 하고 제2 방향에서 수신되는 제2 명령을 처리하고, 제2 명령의 처리가 완료되면 헤드를 제1 방향으로 향하게 하고 제1 방향에서 수신되는 제1 명령을 처리할 수 있다.
제2 마이크 시스템(630)은 음파 수집부(631), 빔 포밍 처리부 및 음성 신호 처리부(633)를 포함할 수 있다. 제2 마이크 시스템(630)은 전자 장치의 헤드가 제어된 후 사용자로부터 음성을 수신하고, 수신된 음성을 증폭하고, 음성 인식을 수행할 수 있다. 제2 마이크 시스템(630)은 헤드가 향한 방향으로부터 수신된 음성을 선별하여 처리할 수 있다.
음파 수집부(631)는 복수의 마이크를 이용하여 음파를 수집할 수 있다. 음파 수집부(631)는 전자 장치에 포함된 복수의 마이크 중 지정된 마이크(예: 도 4의 제2 마이크 어레이(412))를 이용하여 음파를 수집할 수도 있고, 복수의 마이크 중 발생 방향에 배치된 마이크(예: 도 3의 마이크 어레이(310))를 선택하여 음파를 수집할 수도 있다.
빔포밍 처리부(632)는 수집된 음파를 증폭할 수 있다. 예를 들어, 빔포밍 처리부(632)는 웨이크 업 신호의 발생 방향 또는 전자 장치의 헤드가 향한 방향으로부터 수집된 음파를 선별적으로 증폭할 수 있다.
음성 신호 처리부(633)는 증폭된 음파에 기초하여 음성 인식을 수행할 수 있다. 음성 신호 처리부(633)는 음성 인식을 수행한 후, 음성 인식의 결과에 대응하는 기능을 실행할 수 있다.
도 7은 본 발명의 일 실시 예에 따른 전자 장치의 음성 명령 처리 방법을 설명하기 위한 순서도이다.
도 7에 도시된 순서도는 도 1 내지 도 4에 도시된 전자 장치(100, 200, 300 또는 400)에서 처리되는 동작들로 구성될 수 있다. 따라서, 이하에서 생략된 내용이라 하더라도 도 1 내지 도 4를 참조하여 전자 장치(100, 200, 300 또는 400)에 관하여 기술된 내용은 도 7에 도시된 순서도에도 적용될 수 있다.
도 7을 참조하면, 동작 710에서, 전자 장치(예: 프로세서(360) 또는 프로세서(460))는 제1 방향에서 수신되는 제1 웨이크 업 신호에 반응하여 헤드를 제1 방향으로 회전시킬 수 있다. 예를 들어, 전자 장치는 제1 방향에 위치된 제1 사용자가 발화한 음성 신호를 감지할 수 있다. 전자 장치는 제1 사용자가 발화한 음성 신호를 문자 정보로 변환할 수 있다. 전자 장치는 문자 정보가 지정된 문자에 해당하는 경우 음성 신호를 웨이크 업 신호로 판단할 수 있다. 전자 장치는 웨이크 업 신호의 발생 방향(제1 방향)을 판단하고, 헤드의 전면이 제1 방향으로 향하도록 헤드를 제어할 수 있다. 예를 들어, 전자 장치는 제1 사용자가 45°방향에서 “Wake up”이라고 발화하면 “Wake up”이 웨이크 업 신호에 해당하는지 여부를 판단할 수 있다. “Wake up”이 웨이크 업 신호에 해당하면 전자 장치는 45°방향으로 헤드를 회전시킬 수 있다.
동작 720에서, 전자 장치(예: 프로세서(360) 또는 프로세서(460))는 제2 방향에서 제2 웨이크 업 신호가 수신되면 제2 방향에 대한 정보를 저장할 수 있다. 전자 장치는 헤드가 제1 방향으로 회전되고 제1 사용자로부터 제1 명령이 수신되는 동안 제2 방향에서 제2 웨이크 업 신호가 수신되면 제2 웨이크 업 신호가 발생된 제2 방향을 판단하고, 제2 방향에 대한 정보를 저장할 수 있다. 이 경우, 제1 명령을 수신하는 마이크와 제2 웨이크 업 신호를 수신하는 마이크는 서로 상이한 마이크일 수 있다. 예를 들어, 전자 장치가 제1 사용자와의 대화를 수행하는 중에 제2 사용자가 90°방향에서 “Hello”라고 발화하면 전자 장치는 “Hello”가 웨이크 업 신호에 해당하는지 여부를 판단할 수 있다. “Hello”가 웨이크 업 신호에 해당하면 전자 장치는 90°방향에 대한 정보를 저장할 수 있다.
동작 730에서, 전자 장치(예: 프로세서(360) 또는 프로세서(460))는 제1 방향으로부터 수신되는 제1 명령의 처리 완료 여부를 판단할 수 있다. 예를 들어, 전자 장치는 제1 방향으로부터 중단 명령이 수신되거나, 제1 방향으로부터 지정된 시간 동안 명령이 수신되지 않으면 제1 명령의 처리가 완료된 것으로 판단할 수 있다. 전자 장치는 제1 명령의 처리가 완료될 때까지 대기한 후 동작 740을 수행할 수 있다.
제1 명령이 처리 완료되면, 동작 740에서, 전자 장치(예: 프로세서(360) 또는 프로세서(460))는 헤드를 제2 방향으로 회전시킬 수 있다. 전자 장치는 저장된 제2 방향에 대한 정보에 기초하여 헤드를 제어할 수 있다. 예를 들어, 전자 장치는 90°방향에 대한 정보에 기초하여 헤드를 90°으로 회전시킬 수 있다.
동작 750에서, 전자 장치(예: 프로세서(360) 또는 프로세서(460))는 제2 방향에서 수신되는 제2 명령을 처리할 수 있다. 전자 장치는 헤드가 제2 방향으로 회전된 후 제2 방향으로부터 음성 신호를 수신할 수 있다. 전자 장치는 수신된 음성 신호에 대한 음성 인식을 수행하여 제2 명령을 인식할 수 있다. 전자 장치는 제2 명령에 따라 기능을 실행할 수 있다. 예를 들어, 전자 장치는 제2 방향에 있는 제2 사용자로부터 “알람 오전 8시”라는 음성 신호를 수신한 경우, 오전 8시에 동작하는 알람을 설정할 수 있다.
도 8은 본 발명의 일 실시 예에 따른 전자 장치의 음성 명령 처리 방법을 설명하기 위한 순서도이다.
도 8에 도시된 순서도는 도 1 내지 도 4에 도시된 전자 장치(100, 200, 300 또는 400)에서 처리되는 동작들로 구성될 수 있다. 따라서, 이하에서 생략된 내용이라 하더라도 도 1 내지 도 4를 참조하여 전자 장치(100, 200, 300 또는 400)에 관하여 기술된 내용은 도 8에 도시된 순서도에도 적용될 수 있다.
도 8을 참조하면, 동작 810에서, 전자 장치(예: 프로세서(360) 또는 프로세서(460))는 마이크 어레이의 적어도 일부를 이용하여 제1 음성 인식을 트리거링하는 제1 음성 명령(또는 제1 웨이크 업 신호)을 수신할 수 있다.
동작 820에서, 전자 장치(예: 프로세서(360) 또는 프로세서(460))는 제1 음성 인식을 수행할 수 있다. 전자 장치는 제1 음성 명령에 반응하여 제1 음성 명령이 수신된 방향에서 발생되는 음성 신호를 수신할 수 있다. 전자 장치는 수신된 음성 신호에 대한 음성 인식을 수행할 수 있다.
동작 830에서, 전자 장치(예: 프로세서(360) 또는 프로세서(460))는 제1 음성 인식의 결과를 일시적으로 저장할 수 있다. 예를 들어, 전자 장치는 음성 신호를 문자 정보로 변환한 후 제1 음성 인식의 결과로서 문자 정보를 저장할 수 있다. 전자 장치는 제1 음성 인식의 결과를 저장한 후 제1 음성 인식에 결과에 대응하는 기능을 실행할 수도 있다.
동작 840에서, 전자 장치(예: 프로세서(360) 또는 프로세서(460))는 제1 음성 인식을 수행하는 동안 마이크 어레이의 적어도 일부를 이용하여 제2 음성 인식을 트리거링하는 제2 음성 명령을 수신할 수 있다.
동작 850에서, 전자 장치(예: 프로세서(360) 또는 프로세서(460))는 제2 음성 명령이 전달된 방향을 결정할 수 있다. 2 이상의 마이크를 이용하여 제2 음성 명령을 수신한 경우, 전자 장치는 2 이상의 마이크 각각으로 제2 음성 명령이 수신된 시간 또는 2 이상의 마이크 각각에서 수신된 제2 음성 명령의 파형에 기초하여 제2 음성 명령이 전달된 방향을 결정할 수 있다.
동작 860에서, 전자 장치(예: 프로세서(360) 또는 프로세서(460))는 결정된 방향을 이용하여 제2 음성 인식을 수행할 수 있다. 전자 장치는 제1 음성 인식이 종료된 후 결정된 방향에서 발생되는 음성 신호를 수신할 수 있다. 전자 장치는 결정된 방향에서 발생되는 음성 신호를 증폭할 수도 있다. 전자 장치는 수신된 음성 신호에 대한 음성 인식을 수행할 수 있다. 전자 장치는 제2 음성 인식의 결과에 대응하는 기능을 실행할 수도 있다.
도 9는 본 발명의 일 실시 예에 따른 전자 장치의 음성 명령 처리 방법을 설명하기 위한 순서도이다. 설명의 편의를 위해 도 7 및 도 8을 참조하여 설명된 동작에 대한 중복 설명은 생략한다.
도 9에 도시된 순서도는 도 1 내지 도 4에 도시된 전자 장치(100, 200, 300 또는 400)에서 처리되는 동작들로 구성될 수 있다. 따라서, 이하에서 생략된 내용이라 하더라도 도 1 내지 도 4를 참조하여 전자 장치(100, 200, 300 또는 400)에 관하여 기술된 내용은 도 9에 도시된 순서도에도 적용될 수 있다.
도 9를 참조하면, 동작 910에서, 전자 장치(예: 프로세서(360) 또는 프로세서(460))는 제1 마이크 시스템을 이용하여 음파를 감지할 수 있다. 제1 마이크 시스템은, 예를 들어, 전자 장치의 바디에 배열된 복수의 마이크를 포함하는 마이크 시스템일 수도 있다. 제1 마이크 시스템은 전자 장치에 포함된 복수의 마이크 중 제2 마이크 시스템에 포함된 마이크를 제외한 나머지 마이크를 포함하는 마이크 시스템일 수 있다. 제1 마이크 시스템에 포함된 마이크는 음파를 감지하는 시점에 따라 변경될 수 있다.
동작 920에서, 전자 장치(예: 프로세서(360) 또는 프로세서(460))는 감지된 음파가 웨이크 업 신호인지 여부를 판단할 수 있다.
동작 930에서, 전자 장치(예: 프로세서(360) 또는 프로세서(460))는 웨이크 업 신호의 발생 방향을 인식할 수 있다.
동작 940에서, 전자 장치(예: 프로세서(360) 또는 프로세서(460))는 음성 인식의 수행 여부를 판단할 수 있다. 예를 들어, 전자 장치는 다른 사용자로부터 수신된 음성 신호에 대한 음성 인식을 수행 중인지 여부를 판단할 수 있다. 전자 장치는 다른 사용자로부터 수신된 명령을 처리 중인지 여부를 판단할 수도 있다. 전자 장치는 다른 사용자의 명령을 수신하기 위해 대기 중인지 여부를 판단할 수도 있다. 전자 장치는 전자 장치가 음성 인식 또는 명령 처리를 수행하거나 다른 사용자에 대한 대기 상태에 있는 경우 동작 950 및 동작 960을 수행할 수 있다. 전자 장치는 전자 장치가 다른 사용자에 대한 동작을 수행하지 않는 경우 동작 950 및 동작 960을 수행하지 않고 동작 970을 수행할 수 있다.
동작 950에서, 전자 장치(예: 프로세서(360) 또는 프로세서(460))는 발생 방향에 대한 정보를 메모리에 순차적으로 저장할 수 있다.
동작 960에서, 전자 장치(예: 프로세서(360) 또는 프로세서(460))는 제2 마이크 시스템이 동작 중인지 여부를 판단할 수 있다. 전자 장치는 제2 마이크 시스템을 이용하여 명령을 수신할 수 있다. 복수의 사용자가 전자 장치를 이용하는 경우, 전자 장치는 제1 사용자가 전자 장치를 이용하는 동안 제2 사용자로부터 웨이크 업 신호를 수신할 수 있다. 이 경우, 전자 장치는 제2 마이크 시스템을 이용하여 제1 사용자로부터 명령을 수신하고, 제1 마이크 시스템을 이용하여 제2 사용자로부터 웨이크 업 신호를 수신할 수 있다. 전자 장치는 제2 마이크 시스템의 동작 상황을 확인함으로써 다른 사용자로부터 명령을 수신하고 있는지 여부를 판단할 수 있다. 전자 장치는 제2 마이크 시스템의 동작이 종료될 때까지 대기할 수 있다. 전자 장치는 제2 마이크 시스템의 동작이 종료되면 동작 960을 수행할 수 있다.
동작 970에서, 전자 장치(예: 프로세서(360) 또는 프로세서(460))는 발생 방향에 대한 정보에 기초하여 헤드를 회전시킬 수 있다.
동작 980에서, 전자 장치(예: 프로세서(360) 또는 프로세서(460))는 제2 마이크 시스템을 이용하여 명령을 수신할 수 있다. 제2 마이크 시스템은, 예를 들어, 전자 장치의 헤드의 전면에 배열된 복수의 마이크를 포함할 수도 있다. 다른 예를 들면, 제2 마이크 시스템은 전자 장치에 포함된 복수의 마이크 중 발생 방향에 배열된 마이크를 포함할 수도 있다. 제2 마이크 시스템에 포함된 마이크는 명령을 수신하는 방향에 따라 변경될 수 있다.
동작 990에서, 전자 장치(예: 프로세서(360) 또는 프로세서(460))는 명령에 대응하는 기능을 실행할 수 있다.
일 실시 예에 따른 전자 로봇 장치는 바디(body), 바디와 물리적으로 연결되며 회전 가능한 헤드(head), 바디 또는 헤드에 배치되는 복수의 마이크, 복수의 마이크와 전기적으로 연결되고 헤드의 회전을 제어하는 프로세서 및 프로세서와 전기적으로 연결된 메모리를 포함하고, 프로세서는, 제1 방향에서 수신되는 제1 웨이크 업(wake up) 신호에 반응하여 헤드를 제1 방향으로 향하게 하고, 제1 방향에서 수신되는 제1 명령을 처리하는 동안 제2 방향에서 제2 웨이크 업 신호가 수신되면 제2 방향에 대한 정보를 메모리에 저장하고, 제1 명령의 처리가 완료되면 헤드를 제2 방향으로 향하게 하고 제2 방향에서 수신되는 제2 명령을 처리하도록 설정될 수 있다.
본 발명의 다른 특징에 따르면, 프로세서는, 복수의 마이크 중 적어도 일부를 이용하여 음파를 지속적으로 감지하고, 음파가 웨이크 업 신호인지 여부를 판단하고, 음파가 웨이크 업 신호이면, 웨이크 업 신호의 감지 시간 또는 파형 중 적어도 하나에 기초하여 웨이크 업 신호의 방향에 대한 정보를 획득하도록 설정될 수 있다.
본 발명의 또 다른 특징에 따르면, 프로세서는, 제1 명령을 처리하는 동안, 복수의 마이크 중 제1 방향에 대한 정보에 기초하여 선택된 마이크를 이용하여 제1 명령을 수신하도록 설정될 수 있다.
본 발명의 또 다른 특징에 따르면, 프로세서는, 제2 명령을 처리하는 동안, 복수의 마이크 중 제2 방향에 대한 정보에 기초하여 선택된 마이크를 이용하여 제2 명령을 수신하도록 설정될 수 있다.
본 발명의 또 다른 특징에 따르면, 프로세서는, 제1 명령을 처리하는 동안, 복수의 마이크 중 2 이상의 마이크를 이용하여 제1 방향으로부터 수신되는 신호를 증폭하도록 설정될 수 있다.
본 발명의 또 다른 특징에 따르면, 프로세서는, 제2 명령을 처리하는 동안, 복수의 마이크 중 2 이상의 마이크를 이용하여 제2 방향으로부터 수신되는 신호를 증폭하도록 설정될 수 있다.
본 발명의 또 다른 특징에 따르면, 복수의 마이크의 일부는 바디에 배치되고, 복수의 마이크의 나머지 일부는 헤드에 배치되고, 프로세서는, 바디에 배치된 마이크를 이용하여 웨이크 업 신호를 감지하고, 제1 명령을 처리하는 동안, 헤드에 배치된 마이크가 제1 방향을 향하도록 헤드의 회전을 제어하고, 제2 명령을 처리하는 동안, 헤드에 배치된 마이크가 제2 방향을 향하도록 헤드의 회전을 제어하도록 설정될 수 있다.
본 발명의 또 다른 특징에 따르면, 헤드에 배치된 마이크는 지향성 마이크일 수 있다.
본 발명의 또 다른 특징에 따르면, 프로세서는, 제1 방향으로부터 중단 명령이 수신되거나, 제1 방향으로부터 지정된 시간 동안 명령이 수신되지 않으면, 헤드를 제2 방향으로 향하게 하고 제2 방향에서 수신되는 제2 명령을 처리하도록 설정될 수 있다.
본 발명의 또 다른 특징에 따르면, 프로세서는, 메모리에 선입 선출 방식으로 제2 방향에 대한 정보를 저장하도록 설정될 수 있다.
본 발명의 또 다른 특징에 따르면, 프로세서는, 제2 방향에 대한 정보가 메모리에 저장된 후 제1 명령을 처리하는 동안 제3 방향에서 제3 웨이크 업 신호가 수신되면 제3 방향에 대한 정보를 메모리에 저장하고, 제1 명령의 처리가 완료되면 헤드를 제2 방향으로 향하게 하고 제2 방향에서 수신되는 제2 명령을 처리하고, 제2 명령의 처리가 완료되면 헤드를 제3 방향으로 향하게 하고 제3 방향에서 수신되는 제3 명령을 처리하도록 설정될 수 있다.
본 발명의 또 다른 특징에 따르면, 프로세서는, 제2 방향에 대한 정보와 함께 제2 웨이크 업 신호의 발화자에 대한 정보를 메모리에 저장하고, 제2 방향에 대한 정보가 메모리에 저장된 후 제1 명령을 처리하는 동안 제3 방향에서 제3 웨이크 업 신호가 수신되면 제3 방향에 대한 정보와 함께 제3 웨이크 업 신호의 발화자에 대한 정보를 메모리에 저장하고, 제3 웨이크 업 신호의 발화자의 우선 순위가 제2 웨이크 업 신호의 발화자의 우선 순위보다 높은 경우, 제1 명령의 처리가 완료되면 헤드를 제3 방향으로 향하게 하고 제3 방향에서 수신되는 제3 명령을 처리하고, 제3 명령의 처리가 완료되면 헤드를 제2 방향으로 향하게 하고 제2 방향에서 수신되는 제2 명령을 처리하도록 설정될 수 있다.
본 발명의 또 다른 특징에 따르면, 프로세서는, 제1 명령을 처리하는 동안 제2 명령이 수신되고 제2 명령이 즉시 처리 가능한 지정된 명령이면, 제1 명령의 처리가 완료되기 전에 제2 명령을 처리하도록 설정될 수 있다.
본 발명의 또 다른 특징에 따르면, 바디의 측벽을 둘러싸도록 배치된 표시부를 더 포함하고, 프로세서는, 제1 명령을 처리하는 동안 제2 웨이크 업 신호 또는 제2 명령이 수신되면, 표시부를 이용하여 제2 웨이크 업 신호 또는 제2 명령의 처리 상태를 나타내는 표지를 제2 방향으로 출력하도록 설정될 수 있다.
본 발명의 일 실시예에 따른 전자 장치는 하우징, 하우징의 적어도 일부를 통해 노출된 마이크 어레이(array of microphones)로서, 마이크 어레이는 상이한 방향들로부터 소리를 수신하도록 배열되거나 구성된, 마이크 어레이, 하우징을 통해 노출된 스피커, 휘발성 메모리, 하우징 내부에 위치되고, 마이크 어레이, 스피커 및 휘발성 메모리와 전기적으로 연결된 프로세서 및 프로세서와 전기적으로 연결된 비휘발성 메모리를 포함하고, 비휘발성 메모리는 실행될 때 프로세서로 하여금: 마이크 어레이의 적어도 일부를 이용하여, 제1 음성 인식을 트리거링(triggering)하는 제1 음성 명령을 수신하고, 제1 음성 인식의 적어도 일부를 수행하고, 휘발성 메모리 내에 제1 음성 인식의 결과를 적어도 일시적으로 저장하고, 제1 음성 인식의 적어도 일부를 수행하는 동안 마이크 어레이의 적어도 일부를 이용하여, 제2 음성 인식을 트리거링하는 제2 음성 명령을 수신하고, 제2 음성 명령이 전달된 방향을 결정하고 및 결정된 방향을 이용하여, 제2 음성 인식의 적어도 일부를 수행하도록 하는 인스트럭션들을 저장할 수 있다.
본 발명의 다른 특징에 따르면, 제2 음성 명령이 전달된 방향을 결정하도록 하는 인스트럭션들은, 프로세서로 하여금 제2 음성 명령의 감지 시간 또는 파형 중 적어도 하나에 기초하여 제2 음성 명령이 전달된 방향을 결정하도록 할 수 있다.
본 발명의 또 다른 특징에 따르면, 제2 음성 인식의 적어도 일부를 수행하도록 하는 인스트럭션들은, 프로세서로 하여금 마이크 어레이 중 결정된 방향에 배열된 일부를 이용하여 제2 음성 인식의 적어도 일부를 수행하도록 할 수 있다.
본 발명의 또 다른 특징에 따르면, 제2 음성 인식의 적어도 일부를 수행하도록 하는 인스트럭션들은, 프로세서로 하여금 제1 음성 인식의 수행이 완료되면 제2 음성 인식의 적어도 일부를 수행하도록 할 수 있다.
본 발명의 또 다른 특징에 따르면, 하우징의 측벽을 둘러싸도록 배치된 표시부를 더 포함하고, 비휘발성 메모리는 실행될 때 프로세서로 하여금: 제1 음성 인식의 적어도 일부를 수행하는 동안 제2 음성 명령이 수신되면, 표시부를 이용하여 제2 음성 명령의 처리 상태를 나타내는 표지를 결정된 방향으로 출력하도록 하는 인스트럭션들을 더 포함할 수 있다.
본 발명의 일 실시예에 따른 전자 장치의 음성 명령 처리 방법은 마이크 어레이의 적어도 일부를 이용하여, 제1 음성 인식을 트리거링(triggering)하는 제1 음성 명령을 수신하는 동작, 제1 음성 인식의 적어도 일부를 수행하는 동작, 제1 음성 인식의 결과를 적어도 일시적으로 저장하는 동작, 제1 음성 인식의 적어도 일부를 수행하는 동안 마이크 어레이의 적어도 일부를 이용하여, 제2 음성 인식을 트리거링하는 제2 음성 명령을 수신하는 동작, 제2 음성 명령이 전달된 방향을 결정하는 동작 및 결정된 방향을 이용하여, 제2 음성 인식의 적어도 일부를 수행하는 동작을 포함할 수 있다.
도 10은 다양한 실시 예에 따른 네트워크 환경 내의 전자 장치를 나타낸다.
도 10을 참조하면, 다양한 실시 예에서의 전자 장치(1001, 1002, 1004) 또는 서버(1006)가 네트워크(1062) 또는 근거리 통신(1064)을 통하여 서로 연결될 수 있다. 전자 장치(1001)는 버스(1010), 프로세서(1020), 메모리(1030), 입출력 인터페이스(1050), 디스플레이(1060), 및 통신 인터페이스(1070)를 포함할 수 있다. 어떤 실시 예에서는, 전자 장치(1001)는, 구성요소들 중 적어도 하나를 생략하거나 다른 구성 요소를 추가적으로 구비할 수 있다.
버스(1010)는, 예를 들면, 구성요소들(1010-1070)을 서로 연결하고, 구성요소들 간의 통신(예: 제어 메시지 및/또는 데이터)을 전달하는 회로를 포함할 수 있다.
프로세서(1020)는, 중앙처리장치(Central Processing Unit (CPU)), 어플리케이션 프로세서(Application Processor (AP)), 또는 커뮤니케이션 프로세서(Communication Processor (CP)) 중 하나 또는 그 이상을 포함할 수 있다. 프로세서(1020)는, 예를 들면, 전자 장치(1001)의 적어도 하나의 다른 구성요소들의 제어 및/또는 통신에 관한 연산이나 데이터 처리를 실행할 수 있다.
메모리(1030)는, 휘발성 및/또는 비휘발성 메모리를 포함할 수 있다. 메모리(1030)는, 예를 들면, 전자 장치(1001)의 적어도 하나의 다른 구성요소에 관계된 명령 또는 데이터를 저장할 수 있다. 한 실시 예에 따르면, 메모리(1030)는 소프트웨어 및/또는 프로그램(1040)을 저장할 수 있다. 프로그램(1040)은, 예를 들면, 커널(1041), 미들웨어(1043), 어플리케이션 프로그래밍 인터페이스(Application Programming Interface (API))(1045), 및/또는 어플리케이션 프로그램(또는 "어플리케이션")(1047) 등을 포함할 수 있다. 커널(1041), 미들웨어(1043), 또는 API(1045)의 적어도 일부는, 운영 시스템(Operating System (OS))으로 지칭될 수 있다.
커널(1041)은, 예를 들면, 다른 프로그램들(예: 미들웨어(1043), API(1045), 또는 어플리케이션 프로그램(1047))에 구현된 동작 또는 기능을 실행하는 데 사용되는 시스템 리소스들(예: 버스(1010), 프로세서(1020), 또는 메모리(1030) 등)을 제어 또는 관리할 수 있다. 또한, 커널(1041)은 미들웨어(1043), API(1045), 또는 어플리케이션 프로그램(1047)에서 전자 장치(1001)의 개별 구성요소에 접근함으로써, 시스템 리소스들을 제어 또는 관리할 수 있는 인터페이스를 제공할 수 있다.
미들웨어(1043)는, 예를 들면, API(1045) 또는 어플리케이션 프로그램(1047)이 커널(1041)과 통신하여 데이터를 주고받을 수 있도록 중개 역할을 수행할 수 있다.
또한, 미들웨어(1043)는 어플리케이션 프로그램(1047)으로부터 수신된 하나 이상의 작업 요청들을 우선 순위에 따라 처리할 수 있다. 예를 들면, 미들웨어(1043)는 어플리케이션 프로그램(1047) 중 적어도 하나에 전자 장치(1001)의 시스템 리소스(예: 버스(1010), 프로세서(1020), 또는 메모리(1030) 등)를 사용할 수 있는 우선 순위를 부여할 수 있다. 예컨대, 미들웨어(1043)는 상기 적어도 하나에 부여된 우선 순위에 따라 상기 하나 이상의 작업 요청들을 처리함으로써, 상기 하나 이상의 작업 요청들에 대한 스케쥴링 또는 로드 밸런싱 등을 수행할 수 있다.
API(1045)는, 예를 들면, 어플리케이션(1047)이 커널(1041) 또는 미들웨어(1043)에서 제공되는 기능을 제어하기 위한 인터페이스로, 예를 들면, 파일 제어, 창 제어, 영상 처리, 또는 문자 제어 등을 위한 적어도 하나의 인터페이스 또는 함수(예: 명령어)를 포함할 수 있다.
입출력 인터페이스(1050)는, 예를 들면, 사용자 또는 다른 외부 기기로부터 입력된 명령 또는 데이터를 전자 장치(1001)의 다른 구성요소(들)에 전달할 수 있는 인터페이스의 역할을 할 수 있다. 또한, 입출력 인터페이스(1050)는 전자 장치(1001)의 다른 구성요소(들)로부터 수신된 명령 또는 데이터를 사용자 또는 다른 외부 기기로 출력할 수 있다.
디스플레이(1060)는, 예를 들면, 액정 디스플레이(Liquid Crystal Display (LCD)), 발광 다이오드(Light-Emitting Diode (LED)) 디스플레이, 유기 발광 다이오드(Organic LED (OLED)) 디스플레이, 또는 마이크로 전자기계 시스템(microelectromechanical systems, MEMS) 디스플레이, 또는 전자 종이(electronic paper) 디스플레이를 포함할 수 있다. 디스플레이(1060)는, 예를 들면, 사용자에게 각종 컨텐츠(예: 텍스트, 이미지, 비디오, 아이콘, 또는 심볼 등)을 표시할 수 있다. 디스플레이(1060)는, 터치 스크린을 포함할 수 있으며, 예를 들면, 전자 펜 또는 사용자의 신체의 일부를 이용한 터치, 제스처, 근접, 또는 호버링(hovering) 입력을 수신할 수 있다.
통신 인터페이스(1070)는, 예를 들면, 전자 장치(1001)와 외부 장치(예: 제1 외부 전자 장치(1002), 제2 외부 전자 장치(1004), 또는 서버(1006)) 간의 통신을 설정할 수 있다. 예를 들면, 통신 인터페이스(1070)는 무선 통신 또는 유선 통신을 통해서 네트워크(1062)에 연결되어 상기 외부 장치 (예: 제2 외부 전자 장치(1004) 또는 서버(1006))와 통신할 수 있다.
무선 통신은, 예를 들면 셀룰러 통신 프로토콜로서, 예를 들면 LTE(Long-Term Evolution), LTE-A(LTE-Advanced), CDMA(Code Division Multiple Access), WCDMA(Wideband CDMA), UMTS(Universal Mobile Telecommunications System), WiBro(Wireless Broadband), 또는 GSM(Global System for Mobile Communications) 중 적어도 하나를 사용할 수 있다. 또한 무선 통신은, 예를 들면, 근거리 통신(1064)을 포함할 수 있다. 근거리 통신(1064)은, 예를 들면, Wi-Fi(Wireless Fidelity), Bluetooth, NFC(Near Field Communication), MST(magnetic stripe transmission), 또는 GNSS 중 적어도 하나를 포함할 수 있다.
MST는 전자기 신호를 이용하여 전송 데이터에 따라 펄스를 생성하고, 상기 펄스는 자기장 신호를 발생시킬 수 있다. 전자 장치(1001)는 상기 자기장 신호를 POS(point of sales)에 전송하고, POS는 MST 리더(MST reader)를 이용하여 상기 자기장 신호는 검출하고, 검출된 자기장 신호를 전기 신호로 변환함으로써 상기 데이터를 복원할 수 있다.
GNSS는 사용 지역 또는 대역폭 등에 따라, 예를 들면, GPS(Global Positioning System), Glonass(Global Navigation Satellite System), Beidou Navigation Satellite System(이하 "Beidou") 또는 Galileo(the European global satellite-based navigation system) 중 적어도 하나를 포함할 수 있다. 이하, 본 문서에서는, "GPS"는 "GNSS"와 혼용되어 사용(interchangeably used)될 수 있다. 유선 통신은, 예를 들면, USB(universal serial bus), HDMI(high definition multimedia interface), RS-232(recommended standard-232), 또는 POTS(plain old telephone service) 등 중 적어도 하나를 포함할 수 있다. 네트워크(1062)는 통신 네트워크(telecommunications network), 예를 들면, 컴퓨터 네트워크(computer network)(예: LAN 또는 WAN), 인터넷, 또는 전화 망(telephone network) 중 적어도 하나를 포함할 수 있다.
제1 및 제2 외부 전자 장치(1002, 1004) 각각은 전자 장치(1001)와 동일한 또는 다른 종류의 장치일 수 있다. 한 실시 예에 따르면, 서버(1006)는 하나 또는 그 이상의 서버들의 그룹을 포함할 수 있다. 다양한 실시 예에 따르면, 전자 장치(1001)에서 실행되는 동작들의 전부 또는 일부는 다른 하나 또는 복수의 전자 장치(예: 전자 장치(1002, 1004), 또는 서버(1006))에서 실행될 수 있다. 한 실시 예에 따르면, 전자 장치(1001)가 어떤 기능이나 서비스를 자동으로 또는 요청에 의하여 수행해야 할 경우에, 전자 장치(1001)는 기능 또는 서비스를 자체적으로 실행시키는 대신에 또는 추가적으로, 그와 연관된 적어도 일부 기능을 다른 장치(예: 전자 장치(1002, 1004), 또는 서버(1006))에게 요청할 수 있다. 다른 전자 장치(예: 전자 장치(1002, 1004), 또는 서버(1006))는 요청된 기능 또는 추가 기능을 실행하고, 그 결과를 전자 장치(1001)로 전달할 수 있다. 전자 장치(1001)는 수신된 결과를 그대로 또는 추가적으로 처리하여 요청된 기능이나 서비스를 제공할 수 있다. 이를 위하여, 예를 들면, 클라우드 컴퓨팅, 분산 컴퓨팅, 또는 클라이언트-서버 컴퓨팅 기술이 이용될 수 있다.
도 11는 다양한 실시 예에 따른 전자 장치의 블록도를 나타낸다.
도 11를 참조하면, 전자 장치(1101)는, 예를 들면, 도 10에 도시된 전자 장치(1001)의 전체 또는 일부를 포함할 수 있다. 전자 장치(1101)는 하나 이상의 프로세서(예: AP)(1110), 통신 모듈(1120), 가입자 식별 모듈(1124), 메모리(1130), 센서 모듈(1140), 입력 장치(1150), 디스플레이(1160), 인터페이스(1170), 오디오 모듈(1180), 카메라 모듈(1191), 전력 관리 모듈(1195), 배터리(1196), 인디케이터(1197), 및 모터(1198)를 포함할 수 있다.
프로세서(1110)는, 예를 들면, 운영 체제 또는 응용 프로그램을 구동하여 프로세서(1110)에 연결된 다수의 하드웨어 또는 소프트웨어 구성요소들을 제어할 수 있고, 각종 데이터 처리 및 연산을 수행할 수 있다. 프로세서(1110)는, 예를 들면, SoC(system on chip)로 구현될 수 있다. 한 실시 예에 따르면, 프로세서(1110)는 GPU(graphic processing unit) 및/또는 이미지 신호 프로세서(image signal processor)를 더 포함할 수 있다. 프로세서(1110)는 도 11에 도시된 구성요소들 중 적어도 일부(예: 셀룰러 모듈(1121))를 포함할 수도 있다. 프로세서(1110)는 다른 구성요소들(예: 비휘발성 메모리) 중 적어도 하나로부터 수신된 명령 또는 데이터를 휘발성 메모리에 로드(load)하여 처리하고, 다양한 데이터를 비휘발성 메모리에 저장(store)할 수 있다.
통신 모듈(1120)은, 도 10의 통신 인터페이스(1070)와 동일 또는 유사한 구성을 가질 수 있다. 통신 모듈(1120)은, 예를 들면, 셀룰러 모듈(1121), Wi-Fi 모듈(1122), 블루투스 모듈(1123), GNSS 모듈(1124) (예: GPS 모듈, Glonass 모듈, Beidou 모듈, 또는 Galileo 모듈), NFC 모듈(1125), MST 모듈(1126) 및 RF(radio frequency) 모듈(1127)을 포함할 수 있다.
셀룰러 모듈(1121)은, 예를 들면, 통신망을 통해서 음성 통화, 영상 통화, 문자 서비스, 또는 인터넷 서비스 등을 제공할 수 있다. 한 실시 예에 따르면, 셀룰러 모듈(1121)은 가입자 식별 모듈(예: SIM 카드)(1129)을 이용하여 통신 네트워크 내에서 전자 장치(1101)의 구별 및 인증을 수행할 수 있다. 한 실시 예에 따르면, 셀룰러 모듈(1121)은 프로세서(1110)가 제공할 수 있는 기능 중 적어도 일부 기능을 수행할 수 있다. 한 실시 예에 따르면, 셀룰러 모듈(1121)은 커뮤니케이션 프로세서(CP)를 포함할 수 있다.
Wi-Fi 모듈(1122), 블루투스 모듈(1123), GNSS 모듈(1124), NFC 모듈(1125), 또는 MST 모듈(1126) 각각은, 예를 들면, 해당하는 모듈을 통해서 송수신되는 데이터를 처리하기 위한 프로세서를 포함할 수 있다. 어떤 실시 예에 따르면, 셀룰러 모듈(1121), Wi-Fi 모듈(1122), 블루투스 모듈(1123), GNSS 모듈(1124), NFC 모듈(1125), MST 모듈(1126) 중 적어도 일부(예: 두 개 이상)는 하나의 IC(integrated chip) 또는 IC 패키지 내에 포함될 수 있다.
RF 모듈(1127)은, 예를 들면, 통신 신호(예: RF 신호)를 송수신할 수 있다. RF 모듈(1127)은, 예를 들면, 트랜시버(transceiver), PAM(power amp module), 주파수 필터(frequency filter), LNA(low noise amplifier), 또는 안테나 등을 포함할 수 있다. 다른 실시 예에 따르면, 셀룰러 모듈(1121), Wi-Fi 모듈(1122), 블루투스 모듈(1123), GNSS 모듈(1124), NFC 모듈(1125), MST 모듈(1126) 중 적어도 하나는 별개의 RF 모듈을 통하여 RF 신호를 송수신할 수 있다.
가입자 식별 모듈(1129)은, 예를 들면, 가입자 식별 모듈을 포함하는 카드 및/또는 내장 SIM(embedded SIM)을 포함할 수 있으며, 고유한 식별 정보(예: ICCID (integrated circuit card identifier)) 또는 가입자 정보(예: IMSI (international mobile subscriber identity))를 포함할 수 있다.
메모리(1130) (예: 메모리(1030))는, 예를 들면, 내장 메모리(1132) 또는 외장 메모리(1134)를 포함할 수 있다. 내장 메모리(1132)는, 예를 들면, 휘발성 메모리(예: DRAM(dynamic RAM), SRAM(static RAM), 또는 SDRAM(synchronous dynamic RAM) 등), 비-휘발성(non-volatile) 메모리 (예: OTPROM(one time programmable ROM), PROM(programmable ROM), EPROM(erasable and programmable ROM), EEPROM(electrically erasable and programmable ROM), 마스크(mask) ROM, 플래시(flash) ROM, 플래시 메모리(예: 낸드플래시(NAND flash) 또는 노아플래시(NOR flash) 등), 하드 드라이브, 또는 SSD(solid state drive) 중 적어도 하나를 포함할 수 있다.
외장 메모리(1134)는 플래시 드라이브(flash drive), 예를 들면, CF(compact flash), SD(secure digital), Micro-SD, Mini-SD, xD(extreme digital), MMC(MultiMediaCard), 또는 메모리 스틱(memory stick) 등을 더 포함할 수 있다. 외장 메모리(1134)는 다양한 인터페이스를 통하여 전자 장치(1101)와 기능적으로 및/또는 물리적으로 연결될 수 있다.
보안 모듈(1136)은 메모리(1130)보다 상대적으로 보안 레벨이 높은 저장 공간을 포함하는 모듈로서, 안전한 데이터 저장 및 보호된 실행 환경을 보장해주는 회로일 수 있다. 보안 모듈(1136)은 별도의 회로로 구현될 수 있으며, 별도의 프로세서를 포함할 수 있다. 보안 모듈(1136)은, 예를 들면, 탈착 가능한 스마트 칩, SD(secure digital) 카드 내에 존재하거나, 또는 전자 장치(1101)의 고정 칩 내에 내장된 내장형 보안 요소(embedded secure element(eSE))를 포함할 수 있다. 또한, 보안 모듈 (1136)은 전자 장치(1101)의 운영 체제(OS)와 다른 운영 체제로 구동될 수 있다. 예를 들면, 보안 모듈(1136)은 JCOP(java card open platform) 운영 체제를 기반으로 동작할 수 있다.
센서 모듈(1140)은, 예를 들면, 물리량을 계측하거나 전자 장치(1101)의 작동 상태를 감지하여, 계측 또는 감지된 정보를 전기 신호로 변환할 수 있다. 센서 모듈(1140)은, 예를 들면, 제스처 센서(1140A), 자이로 센서(1140B), 기압 센서(1140C), 마그네틱 센서(1140D), 가속도 센서(1140E), 그립 센서(1140F), 근접 센서(1140G), 컬러 센서(1140H)(예: RGB 센서), 생체 센서(1140I), 온/습도 센서(1140J), 조도 센서(1140K), 또는 UV(ultra violet) 센서(1140M) 중의 적어도 하나를 포함할 수 있다. 추가적으로 또는 대체적으로, 센서 모듈(1140)은, 예를 들면, 후각 센서(E-nose sensor), EMG(electromyography) 센서, EEG(electroencephalogram) 센서, ECG(electrocardiogram) 센서, IR(infrared) 센서, 홍채 센서 및/또는 지문 센서를 포함할 수 있다. 센서 모듈(1140)은 그 안에 속한 적어도 하나 이상의 센서들을 제어하기 위한 제어 회로를 더 포함할 수 있다. 어떤 실시 예에서는, 전자 장치(1101)는 프로세서(1110)의 일부로서 또는 별도로, 센서 모듈(1140)을 제어하도록 구성된 프로세서를 더 포함하여, 프로세서(1110)가 슬립(sleep) 상태에 있는 동안, 센서 모듈(1140)을 제어할 수 있다.
입력 장치(1150)는, 예를 들면, 터치 패널(touch panel)(1152), (디지털) 펜 센서(pen sensor)(1154), 키(key)(1156), 또는 초음파(ultrasonic) 입력 장치(1158)를 포함할 수 있다. 터치 패널(1152)은, 예를 들면, 정전식, 감압식, 적외선 방식, 또는 초음파 방식 중 적어도 하나의 방식을 사용할 수 있다. 또한, 터치 패널(1152)은 제어 회로를 더 포함할 수도 있다. 터치 패널(1152)은 택타일 레이어(tactile layer)를 더 포함하여, 사용자에게 촉각 반응을 제공할 수 있다.
(디지털) 펜 센서(1154)는, 예를 들면, 터치 패널의 일부이거나, 별도의 인식용 시트(sheet)를 포함할 수 있다. 키(1156)는, 예를 들면, 물리적인 버튼, 광학식 키, 또는 키패드를 포함할 수 있다. 초음파 입력 장치(1158)는 마이크(예: 마이크(1188))를 통해, 입력 도구에서 발생된 초음파를 감지하여, 상기 감지된 초음파에 대응하는 데이터를 확인할 수 있다.
디스플레이(1160)(예: 디스플레이(1060))는 패널(1162), 홀로그램 장치(1164), 또는 프로젝터(1166)를 포함할 수 있다. 패널(1162)은, 도 10의 디스플레이(1060)와 동일 또는 유사한 구성을 포함할 수 있다. 패널(1162)은, 예를 들면, 유연하게(flexible), 투명하게(transparent), 또는 착용할 수 있게(wearable) 구현될 수 있다. 패널(1162)은 터치 패널(1152)과 하나의 모듈로 구성될 수도 있다. 홀로그램 장치(1164)는 빛의 간섭을 이용하여 입체 영상을 허공에 보여줄 수 있다. 프로젝터(1166)는 스크린에 빛을 투사하여 영상을 표시할 수 있다. 스크린은, 예를 들면, 전자 장치(1101)의 내부 또는 외부에 위치할 수 있다. 한 실시 예에 따르면, 디스플레이(1160)는 상기 패널(1162), 상기 홀로그램 장치(1164), 또는 프로젝터(1166)를 제어하기 위한 제어 회로를 더 포함할 수 있다.
인터페이스(1170)는, 예를 들면, HDMI(1172), USB(1174), 광 인터페이스(optical interface)(1176), 또는 D-sub(D-subminiature)(1178)를 포함할 수 있다. 인터페이스(1170)는, 예를 들면, 도 10에 도시된 통신 인터페이스(1070)에 포함될 수 있다. 추가적으로 또는 대체적으로, 인터페이스(1170)는, 예를 들면, MHL(mobile high-definition link) 인터페이스, SD 카드/MMC 인터페이스, 또는 IrDA(infrared data association) 규격 인터페이스를 포함할 수 있다.
오디오 모듈(1180)은, 예를 들면, 소리(sound)와 전기 신호를 쌍방향으로 변환시킬 수 있다. 오디오 모듈(1180)의 적어도 일부 구성요소는, 예를 들면, 도 10에 도시된 입출력 인터페이스(1050)에 포함될 수 있다. 오디오 모듈(1180)은, 예를 들면, 스피커(1182), 리시버(1184), 이어폰(1186), 또는 마이크(1188) 등을 통해 입력 또는 출력되는 소리 정보를 처리할 수 있다.
카메라 모듈(1191)은, 예를 들면, 정지 영상 및 동영상을 촬영할 수 있는 장치로서, 한 실시 예에 따르면, 하나 이상의 이미지 센서(예: 전면 센서 또는 후면 센서), 렌즈, ISP(image signal processor), 또는 플래시(flash)(예: LED 또는 제논 램프(xenon lamp))를 포함할 수 있다.
전력 관리 모듈(1195)은, 예를 들면, 전자 장치(1101)의 전력을 관리할 수 있다. 한 실시 예에 따르면, 전력 관리 모듈(1195)은 PMIC(power management integrated circuit), 충전 IC(charger integrated circuit), 또는 배터리 또는 연료 게이지(battery or fuel gauge)를 포함할 수 있다. PMIC는, 유선 및/또는 무선 충전 방식을 가질 수 있다. 무선 충전 방식은, 예를 들면, 자기공명 방식, 자기유도 방식 또는 전자기파 방식 등을 포함하며, 무선 충전을 위한 부가적인 회로, 예를 들면, 코일 루프, 공진 회로, 또는 정류기 등을 더 포함할 수 있다. 배터리 게이지는, 예를 들면, 배터리(1196)의 잔량, 충전 중 전압, 전류, 또는 온도를 측정할 수 있다. 배터리(1196)는, 예를 들면, 충전식 전지(rechargeable battery) 및/또는 태양 전지(solar battery)를 포함할 수 있다.
인디케이터(1197)는 전자 장치(1101) 혹은 그 일부(예: 프로세서(1110))의 특정 상태, 예를 들면, 부팅 상태, 메시지 상태 또는 충전 상태 등을 표시할 수 있다. 모터(1198)는 전기적 신호를 기계적 진동으로 변환할 수 있고, 진동(vibration), 또는 햅틱(haptic) 효과 등을 발생시킬 수 있다. 도시되지는 않았으나, 전자 장치(1101)은 모바일 TV 지원을 위한 처리 장치(예: GPU)를 포함할 수 있다. 모바일 TV 지원을 위한 처리 장치는, 예를 들면, DMB(Digital Multimedia Broadcasting), DVB(Digital Video Broadcasting), 또는 미디어플로(MediaFLOTM) 등의 규격에 따른 미디어 데이터를 처리할 수 있다.
본 문서에서 기술된 구성요소들 각각은 하나 또는 그 이상의 부품(component)으로 구성될 수 있으며, 해당 구성 요소의 명칭은 전자 장치의 종류에 따라서 달라질 수 있다. 다양한 실시 예에서, 전자 장치는 본 문서에서 기술된 구성요소 중 적어도 하나를 포함하여 구성될 수 있으며, 일부 구성요소가 생략되거나 또는 추가적인 다른 구성요소를 더 포함할 수 있다. 또한, 다양한 실시 예에 따른 전자 장치의 구성 요소들 중 일부가 결합되어 하나의 개체(entity)로 구성됨으로써, 결합되기 이전의 해당 구성 요소들의 기능을 동일하게 수행할 수 있다.
도 12은 다양한 실시 예에 따른 프로그램 모듈의 블록도를 나타낸다.
한 실시 예에 따르면, 프로그램 모듈(1210)(예: 프로그램(1040))은 전자 장치(예: 전자 장치(1001))에 관련된 자원을 제어하는 운영 체제(OS) 및/또는 운영 체제 상에서 구동되는 다양한 어플리케이션(예: 어플리케이션 프로그램(1047))을 포함할 수 있다. 운영 체제는, 예를 들면, 안드로이드(android), iOS, 윈도우즈(windows), 심비안(symbian), 타이젠(tizen), 또는 바다(bada) 등이 될 수 있다.
프로그램 모듈(1210)은 커널(1220), 미들웨어(1230), API(1260), 및/또는 어플리케이션(1270)을 포함할 수 있다. 프로그램 모듈(1210)의 적어도 일부는 전자 장치 상에 프리로드(preload) 되거나, 외부 전자 장치(예: 전자 장치(1002, 1004), 서버(1006) 등)로부터 다운로드 가능하다.
커널(1220)(예: 커널(1041))은, 예를 들면, 시스템 리소스 매니저(1221) 또는 디바이스 드라이버(1223)를 포함할 수 있다. 시스템 리소스 매니저(1221)는 시스템 리소스의 제어, 할당, 또는 회수 등을 수행할 수 있다. 한 실시 예에 따르면, 시스템 리소스 매니저(1221)는 프로세스 관리부, 메모리 관리부, 또는 파일 시스템 관리부 등을 포함할 수 있다. 디바이스 드라이버(1223)는, 예를 들면, 디스플레이 드라이버, 카메라 드라이버, 블루투스 드라이버, 공유 메모리 드라이버, USB 드라이버, 키패드 드라이버, Wi-Fi 드라이버, 오디오 드라이버, 또는 IPC(inter-process communication) 드라이버를 포함할 수 있다.
미들웨어(1230)는, 예를 들면, 어플리케이션(1270)이 공통적으로 필요로 하는 기능을 제공하거나, 어플리케이션(1270)이 전자 장치 내부의 제한된 시스템 자원을 효율적으로 사용할 수 있도록 API(1260)를 통해 다양한 기능들을 어플리케이션(1270)으로 제공할 수 있다. 한 실시 예에 따르면, 미들웨어(1230)(예: 미들웨어(1043))는 런타임 라이브러리(1235), 어플리케이션 매니저(application manager)(1241), 윈도우 매니저(window manager)(1242), 멀티미디어 매니저(multimedia manager)(1243), 리소스 매니저(resource manager)(1244), 파워 매니저(power manager)(1245), 데이터베이스 매니저(database manager)(1246), 패키지 매니저(package manager)(1247), 연결 매니저(connectivity manager)(1248), 통지 매니저(notification manager)(1249), 위치 매니저(location manager)(1250), 그래픽 매니저(graphic manager)(1251), 보안 매니저(security manager)(1252), 또는 결제 매니저(1254) 중 적어도 하나를 포함할 수 있다.
런타임 라이브러리(1235)는, 예를 들면, 어플리케이션(1270)이 실행되는 동안에 프로그래밍 언어를 통해 새로운 기능을 추가하기 위해 컴파일러가 사용하는 라이브러리 모듈을 포함할 수 있다. 런타임 라이브러리(1235)는 입출력 관리, 메모리 관리, 또는 산술 함수에 대한 기능 등을 수행할 수 있다.
어플리케이션 매니저(1241)는, 예를 들면, 어플리케이션(1270) 중 적어도 하나의 어플리케이션의 생명 주기(life cycle)를 관리할 수 있다. 윈도우 매니저(1242)는 화면에서 사용하는 GUI 자원을 관리할 수 있다. 멀티미디어 매니저(1243)는 다양한 미디어 파일들의 재생에 필요한 포맷을 파악하고, 해당 포맷에 맞는 코덱(codec)을 이용하여 미디어 파일의 인코딩(encoding) 또는 디코딩(decoding)을 수행할 수 있다. 리소스 매니저(1244)는 어플리케이션(1270) 중 적어도 어느 하나의 어플리케이션의 소스 코드, 메모리 또는 저장 공간 등의 자원을 관리할 수 있다.
파워 매니저(1245)는, 예를 들면, 바이오스(BIOS: basic input/output system) 등과 함께 동작하여 배터리 또는 전원을 관리하고, 전자 장치의 동작에 필요한 전력 정보 등을 제공할 수 있다. 데이터베이스 매니저(1246)는 어플리케이션(1270) 중 적어도 하나의 어플리케이션에서 사용할 데이터베이스를 생성, 검색, 또는 변경할 수 있다. 패키지 매니저(1247)는 패키지 파일의 형태로 배포되는 어플리케이션의 설치 또는 업데이트를 관리할 수 있다.
연결 매니저(1248)는, 예를 들면, Wi-Fi 또는 블루투스 등의 무선 연결을 관리할 수 있다. 통지 매니저(1249)는 도착 메시지, 약속, 근접성 알림 등의 사건(event)을 사용자에게 방해되지 않는 방식으로 표시 또는 통지할 수 있다. 위치 매니저(1250)는 전자 장치의 위치 정보를 관리할 수 있다. 그래픽 매니저(1251)는 사용자에게 제공될 그래픽 효과 또는 이와 관련된 사용자 인터페이스를 관리할 수 있다. 보안 매니저(1252)는 시스템 보안 또는 사용자 인증 등에 필요한 제반 보안 기능을 제공할 수 있다. 한 실시 예에 따르면, 전자 장치(예: 전자 장치(1001))가 전화 기능을 포함한 경우, 미들웨어(1230)는 전자 장치의 음성 또는 영상 통화 기능을 관리하기 위한 통화 매니저(telephony manager)를 더 포함할 수 있다.
미들웨어(1230)는 전술한 구성요소들의 다양한 기능의 조합을 형성하는 미들웨어 모듈을 포함할 수 있다. 미들웨어(1230)는 차별화된 기능을 제공하기 위해 운영 체제의 종류 별로 특화된 모듈을 제공할 수 있다. 또한, 미들웨어(1230)는 동적으로 기존의 구성요소를 일부 삭제하거나 새로운 구성요소들을 추가할 수 있다.
API(1260)(예: API(1045))는, 예를 들면, API 프로그래밍 함수들의 집합으로, 운영 체제에 따라 다른 구성으로 제공될 수 있다. 예를 들면, 안드로이드 또는 iOS의 경우, 플랫폼 별로 하나의 API 셋을 제공할 수 있으며, 타이젠(tizen)의 경우, 플랫폼 별로 두 개 이상의 API 셋을 제공할 수 있다.
어플리케이션(1270)(예: 어플리케이션 프로그램(1047))은, 예를 들면, 홈(1271), 다이얼러(1272), SMS/MMS(1273), IM(instant message)(1274), 브라우저(1275), 카메라(1276), 알람(1277), 컨택트(1278), 음성 다이얼(1279), 이메일(1280), 달력(1281), 미디어 플레이어(1282), 앨범(1283), 또는 시계(1284), 건강 관리(health care)(예: 운동량 또는 혈당 등을 측정), 또는 환경 정보 제공(예: 기압, 습도, 또는 온도 정보 등을 제공) 등의 기능을 수행할 수 있는 하나 이상의 어플리케이션을 포함할 수 있다.
한 실시 예에 따르면, 어플리케이션(1270)은 전자 장치(예: 전자 장치(1001))와 외부 전자 장치(예: 전자 장치(1002, 1004)) 사이의 정보 교환을 지원하는 어플리케이션(이하, 설명의 편의상, "정보 교환 어플리케이션")을 포함할 수 있다. 정보 교환 어플리케이션은, 예를 들면, 외부 전자 장치에 특정 정보를 전달하기 위한 알림 전달(notification relay) 어플리케이션, 또는 외부 전자 장치를 관리하기 위한 장치 관리(device management) 어플리케이션을 포함할 수 있다.
예를 들면, 알림 전달 어플리케이션은 전자 장치의 다른 어플리케이션(예: SMS/MMS 어플리케이션, 이메일 어플리케이션, 건강 관리 어플리케이션, 또는 환경 정보 어플리케이션 등)에서 발생된 알림 정보를 외부 전자 장치(예: 전자 장치(1002, 1004))로 전달하는 기능을 포함할 수 있다. 또한, 알림 전달 어플리케이션은, 예를 들면, 외부 전자 장치로부터 알림 정보를 수신하여 사용자에게 제공할 수 있다.
장치 관리 어플리케이션은, 예를 들면, 전자 장치와 통신하는 외부 전자 장치(예: 전자 장치(1002, 1004))의 적어도 하나의 기능(예: 외부 전자 장치 자체(또는 일부 구성 부품)의 턴-온/턴-오프 또는 디스플레이의 밝기(또는 해상도) 조절), 외부 전자 장치에서 동작하는 어플리케이션 또는 외부 전자 장치에서 제공되는 서비스(예: 통화 서비스 또는 메시지 서비스 등)를 관리(예: 설치, 삭제, 또는 업데이트)할 수 있다.
한 실시 예에 따르면, 어플리케이션(1270)은 외부 전자 장치(예: 전자 장치(1002, 1004))의 속성에 따라 지정된 어플리케이션(예: 모바일 의료 기기의 건강 관리 어플리케이션)을 포함할 수 있다. 한 실시 예에 따르면, 어플리케이션(1270)은 외부 전자 장치(예: 서버(1006) 또는 전자 장치(1002, 1004))로부터 수신된 어플리케이션을 포함할 수 있다. 한 실시 예에 따르면, 어플리케이션(1270)은 프리로드 어플리케이션(preloaded application) 또는 서버로부터 다운로드 가능한 제3자 어플리케이션(third party application)을 포함할 수 있다. 도시된 실시 예에 따른 프로그램 모듈(1210)의 구성요소들의 명칭은 운영 체제의 종류에 따라서 달라질 수 있다.
다양한 실시 예에 따르면, 프로그램 모듈(1210)의 적어도 일부는 소프트웨어, 펌웨어, 하드웨어, 또는 이들 중 적어도 둘 이상의 조합으로 구현될 수 있다. 프로그램 모듈(1210)의 적어도 일부는, 예를 들면, 프로세서(예: 프로세서(1110))에 의해 구현(implement)(예: 실행)될 수 있다. 프로그램 모듈(1210)의 적어도 일부는 하나 이상의 기능을 수행하기 위한, 예를 들면, 모듈, 프로그램, 루틴, 명령어 세트(sets of instructions) 또는 프로세스 등을 포함할 수 있다.
본 문서에서 사용된 용어 "모듈"은, 예를 들면, 하드웨어, 소프트웨어 또는 펌웨어(firmware) 중 하나 또는 둘 이상의 조합을 포함하는 단위(unit)를 의미할 수 있다. "모듈"은, 예를 들면, 유닛(unit), 로직(logic), 논리 블록(logical block), 부품(component), 또는 회로(circuit) 등의 용어와 바꾸어 사용(interchangeably use)될 수 있다. "모듈"은, 일체로 구성된 부품의 최소 단위 또는 그 일부가 될 수 있다. "모듈"은 하나 또는 그 이상의 기능을 수행하는 최소 단위 또는 그 일부가 될 수도 있다. "모듈"은 기계적으로 또는 전자적으로 구현될 수 있다. 예를 들면, "모듈"은, 알려졌거나 앞으로 개발될, 어떤 동작들을 수행하는 ASIC(application-specific integrated circuit) 칩, FPGAs(field-programmable gate arrays) 또는 프로그램 가능 논리 장치(programmable-logic device) 중 적어도 하나를 포함할 수 있다.
다양한 실시 예에 따른 장치(예: 모듈들 또는 그 기능들) 또는 방법(예: 동작들)의 적어도 일부는, 예컨대, 프로그램 모듈의 형태로 컴퓨터로 읽을 수 있는 저장매체(computer-readable storage media)에 저장된 명령어로 구현될 수 있다. 상기 명령어가 프로세서(예: 프로세서(1020))에 의해 실행될 경우, 상기 하나 이상의 프로세서가 상기 명령어에 해당하는 기능을 수행할 수 있다. 컴퓨터로 읽을 수 있는 저장매체는, 예를 들면, 메모리(1030)가 될 수 있다.
컴퓨터로 판독 가능한 기록 매체는, 하드디스크, 플로피디스크, 마그네틱 매체(magnetic media)(예: 자기테이프), 광기록 매체(optical media)(예: CD-ROM, DVD(Digital Versatile Disc), 자기-광 매체(magneto-optical media)(예: 플롭티컬 디스크(floptical disk)), 하드웨어 장치(예: ROM, RAM, 또는 플래시 메모리 등) 등을 포함할 수 있다. 또한, 프로그램 명령에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함할 수 있다. 상술한 하드웨어 장치는 다양한 실시 예의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지다.
다양한 실시 예에 따른 모듈 또는 프로그램 모듈은 전술한 구성요소들 중 적어도 하나 이상을 포함하거나, 일부가 생략되거나, 또는 추가적인 다른 구성요소를 더 포함할 수 있다. 다양한 실시 예에 따른 모듈, 프로그램 모듈 또는 다른 구성요소에 의해 수행되는 동작들은 순차적, 병렬적, 반복적 또는 휴리스틱(heuristic)한 방법으로 실행될 수 있다. 또한, 일부 동작은 다른 순서로 실행되거나, 생략되거나, 또는 다른 동작이 추가될 수 있다.
그리고 본 문서에 개시된 실시 예는 개시된, 기술 내용의 설명 및 이해를 위해 제시된 것이며, 본 발명의 범위를 한정하는 것은 아니다. 따라서, 본 문서의 범위는, 본 발명의 기술적 사상에 근거한 모든 변경 또는 다양한 다른 실시 예를 포함하는 것으로 해석되어야 한다.

Claims (20)

  1. 전자 로봇 장치(electronic robot device)에 있어서,
    바디(body);
    상기 바디와 물리적으로 연결되며 회전 가능한 헤드(head);
    상기 바디 또는 상기 헤드에 배치되는 복수의 마이크;
    상기 복수의 마이크와 전기적으로 연결되고 상기 헤드의 회전을 제어하는 프로세서; 및
    상기 프로세서와 전기적으로 연결된 메모리를 포함하고;
    상기 프로세서는,
    제1 방향에서 수신되는 제1 웨이크 업(wake up) 신호에 반응하여 상기 헤드를 상기 제1 방향으로 향하게 하고,
    상기 제1 방향에서 수신되는 제1 명령을 처리하는 동안 제2 방향에서 제2 웨이크 업 신호가 수신되면 상기 제2 방향에 대한 정보를 상기 메모리에 저장하고, 상기 제1 명령의 처리가 완료되면 상기 헤드를 상기 제2 방향으로 향하게 하고 상기 제2 방향에서 수신되는 제2 명령을 처리하도록 설정되는 전자 로봇 장치.
  2. 제 1 항에 있어서,
    상기 프로세서는,
    상기 복수의 마이크 중 적어도 일부를 이용하여 음파를 지속적으로 감지하고,
    상기 음파가 웨이크 업 신호인지 여부를 판단하고,
    상기 음파가 상기 웨이크 업 신호이면, 상기 웨이크 업 신호의 감지 시간 또는 파형 중 적어도 하나에 기초하여 상기 웨이크 업 신호의 방향에 대한 정보를 획득하도록 설정되는 전자 로봇 장치.
  3. 제 1 항에 있어서,
    상기 프로세서는,
    상기 제1 명령을 처리하는 동안, 상기 복수의 마이크 중 상기 제1 방향에 대한 정보에 기초하여 선택된 마이크를 이용하여 상기 제1 명령을 수신하도록 설정되는 전자 로봇 장치.
  4. 제 1 항에 있어서,
    상기 프로세서는,
    상기 제2 명령을 처리하는 동안, 상기 복수의 마이크 중 상기 제2 방향에 대한 정보에 기초하여 선택된 마이크를 이용하여 상기 제2 명령을 수신하도록 설정되는 전자 로봇 장치.
  5. ◈청구항 5은(는) 설정등록료 납부시 포기되었습니다.◈
    제 3 항에 있어서,
    상기 프로세서는,
    상기 제1 명령을 처리하는 동안, 상기 복수의 마이크 중 2 이상의 마이크를 이용하여 상기 제1 방향으로부터 수신되는 신호를 증폭하도록 설정되는 전자 로봇 장치.
  6. ◈청구항 6은(는) 설정등록료 납부시 포기되었습니다.◈
    제 4 항에 있어서,
    상기 프로세서는,
    상기 제2 명령을 처리하는 동안, 상기 복수의 마이크 중 2 이상의 마이크를 이용하여 상기 제2 방향으로부터 수신되는 신호를 증폭하도록 설정되는 전자 로봇 장치.
  7. 제 1 항에 있어서,
    상기 복수의 마이크의 일부는 상기 바디에 배치되고,
    상기 복수의 마이크의 나머지 일부는 상기 헤드에 배치되고,
    상기 프로세서는,
    상기 바디에 배치된 상기 마이크를 이용하여 웨이크 업 신호를 감지하고,
    상기 제1 명령을 처리하는 동안, 상기 헤드에 배치된 마이크가 상기 제1 방향을 향하도록 상기 헤드의 회전을 제어하고,
    상기 제2 명령을 처리하는 동안, 상기 헤드에 배치된 마이크가 상기 제2 방향을 향하도록 상기 헤드의 회전을 제어하도록 설정되는 전자 로봇 장치.
  8. ◈청구항 8은(는) 설정등록료 납부시 포기되었습니다.◈
    제 7 항에 있어서,
    상기 헤드에 배치된 마이크는 지향성 마이크인 전자 로봇 장치.
  9. 제 1 항에 있어서,
    상기 프로세서는,
    상기 제1 방향으로부터 중단 명령이 수신되거나, 상기 제1 방향으로부터 지정된 시간 동안 명령이 수신되지 않으면, 상기 헤드를 상기 제2 방향으로 향하게 하고 상기 제2 방향에서 수신되는 상기 제2 명령을 처리하도록 설정되는 전자 로봇 장치.
  10. ◈청구항 10은(는) 설정등록료 납부시 포기되었습니다.◈
    제 1 항에 있어서,
    상기 프로세서는,
    상기 메모리에 선입 선출 방식으로 상기 제2 방향에 대한 정보를 저장하도록 설정된 전자 로봇 장치.
  11. ◈청구항 11은(는) 설정등록료 납부시 포기되었습니다.◈
    제 1 항에 있어서,
    상기 프로세서는,
    상기 제2 방향에 대한 정보가 상기 메모리에 저장된 후 상기 제1 명령을 처리하는 동안 제3 방향에서 제3 웨이크 업 신호가 수신되면 상기 제3 방향에 대한 정보를 상기 메모리에 저장하고,
    상기 제1 명령의 처리가 완료되면 상기 헤드를 상기 제2 방향으로 향하게 하고 상기 제2 방향에서 수신되는 상기 제2 명령을 처리하고,
    상기 제2 명령의 처리가 완료되면 상기 헤드를 상기 제3 방향으로 향하게 하고 상기 제3 방향에서 수신되는 제3 명령을 처리하도록 설정되는 전자 로봇 장치.
  12. ◈청구항 12은(는) 설정등록료 납부시 포기되었습니다.◈
    제 1 항에 있어서,
    상기 프로세서는,
    상기 제2 방향에 대한 정보와 함께 상기 제2 웨이크 업 신호의 발화자에 대한 정보를 상기 메모리에 저장하고,
    상기 제2 방향에 대한 정보가 상기 메모리에 저장된 후 상기 제1 명령을 처리하는 동안 제3 방향에서 제3 웨이크 업 신호가 수신되면 상기 제3 방향에 대한 정보와 함께 상기 제3 웨이크 업 신호의 발화자에 대한 정보를 상기 메모리에 저장하고,
    상기 제3 웨이크 업 신호의 발화자의 우선 순위가 상기 제2 웨이크 업 신호의 발화자의 우선 순위보다 높은 경우, 상기 제1 명령의 처리가 완료되면 상기 헤드를 상기 제3 방향으로 향하게 하고 상기 제3 방향에서 수신되는 제3 명령을 처리하고,
    상기 제3 명령의 처리가 완료되면 상기 헤드를 상기 제2 방향으로 향하게 하고 상기 제2 방향에서 수신되는 상기 제2 명령을 처리하도록 설정되는 전자 로봇 장치.
  13. ◈청구항 13은(는) 설정등록료 납부시 포기되었습니다.◈
    제 1 항에 있어서,
    상기 프로세서는,
    상기 제1 명령을 처리하는 동안 상기 제2 명령이 수신되고 상기 제2 명령이 즉시 처리 가능한 지정된 명령이면, 상기 제1 명령의 처리가 완료되기 전에 상기 제2 명령을 처리하도록 설정되는 전자 로봇 장치.
  14. ◈청구항 14은(는) 설정등록료 납부시 포기되었습니다.◈
    제 1 항에 있어서,
    상기 바디의 측벽을 둘러싸도록 배치된 표시부를 더 포함하고,
    상기 프로세서는,
    상기 제1 명령을 처리하는 동안 상기 제2 웨이크 업 신호 또는 상기 제2 명령이 수신되면, 상기 표시부를 이용하여 상기 제2 웨이크 업 신호 또는 상기 제2 명령의 처리 상태를 나타내는 표지를 상기 제2 방향으로 출력하도록 설정된 전자 로봇 장치.
  15. 전자 장치에 있어서,
    하우징;
    상기 하우징의 적어도 일부를 통해 노출된 마이크 어레이(array of microphones)로서, 상기 마이크 어레이는 상이한 방향들로부터 소리를 수신하도록 배열되거나 구성된, 상기 마이크 어레이;
    상기 하우징을 통해 노출된 스피커;
    휘발성 메모리;
    상기 하우징 내부에 위치되고, 상기 마이크 어레이, 상기 스피커 및 상기 휘발성 메모리와 전기적으로 연결된 프로세서; 및
    상기 프로세서와 전기적으로 연결된 비휘발성 메모리를 포함하고,
    상기 비휘발성 메모리는 실행될 때 상기 프로세서로 하여금:
    상기 마이크 어레이의 적어도 일부를 이용하여, 제1 음성 인식을 트리거링(triggering)하는 제1 음성 명령을 수신하고;
    상기 제1 음성 인식의 적어도 일부를 수행하고;
    상기 휘발성 메모리 내에 상기 제1 음성 인식의 결과를 적어도 일시적으로 저장하고;
    상기 제1 음성 인식의 적어도 일부를 수행하는 동안 상기 마이크 어레이의 적어도 일부를 이용하여, 제2 음성 인식을 트리거링하는 제2 음성 명령을 수신하고;
    상기 제2 음성 명령이 전달된 방향을 결정하고; 및
    상기 결정된 방향을 이용하여, 상기 제2 음성 인식의 적어도 일부를 수행하도록 하는 인스트럭션들을 저장하는, 전자 장치.
  16. 제 15 항에 있어서,
    상기 제2 음성 명령이 전달된 방향을 결정하도록 하는 인스트럭션들은,
    상기 프로세서로 하여금 상기 제2 음성 명령의 감지 시간 또는 파형 중 적어도 하나에 기초하여 상기 제2 음성 명령이 전달된 방향을 결정하도록 하는, 전자 장치.
  17. 제 15 항에 있어서,
    상기 제2 음성 인식의 적어도 일부를 수행하도록 하는 인스트럭션들은,
    상기 프로세서로 하여금 상기 마이크 어레이 중 상기 결정된 방향에 배열된 일부를 이용하여 상기 제2 음성 인식의 적어도 일부를 수행하도록 하는, 전자 장치.
  18. 제 15 항에 있어서,
    상기 제2 음성 인식의 적어도 일부를 수행하도록 하는 인스트럭션들은,
    상기 프로세서로 하여금 상기 제1 음성 인식의 수행이 완료되면 상기 제2 음성 인식의 적어도 일부를 수행하도록 하는, 전자 장치.
  19. ◈청구항 19은(는) 설정등록료 납부시 포기되었습니다.◈
    제 15 항에 있어서,
    상기 하우징의 측벽을 둘러싸도록 배치된 표시부를 더 포함하고,
    상기 비휘발성 메모리는 실행될 때 상기 프로세서로 하여금:
    상기 제1 음성 인식의 적어도 일부를 수행하는 동안 상기 제2 음성 명령이 수신되면, 상기 표시부를 이용하여 상기 제2 음성 명령의 처리 상태를 나타내는 표지를 상기 결정된 방향으로 출력하도록 하는 인스트럭션들을 더 포함하는, 전자 장치.
  20. ◈청구항 20은(는) 설정등록료 납부시 포기되었습니다.◈
    전자 장치의 음성 명령 처리 방법으로서,
    마이크 어레이의 적어도 일부를 이용하여, 제1 음성 인식을 트리거링(triggering)하는 제1 음성 명령을 수신하는 동작;
    상기 제1 음성 인식의 적어도 일부를 수행하는 동작;
    상기 제1 음성 인식의 결과를 적어도 일시적으로 저장하는 동작;
    상기 제1 음성 인식의 적어도 일부를 수행하는 동안 상기 마이크 어레이의 적어도 일부를 이용하여, 제2 음성 인식을 트리거링하는 제2 음성 명령을 수신하는 동작;
    상기 제2 음성 명령이 전달된 방향을 결정하는 동작; 및
    상기 결정된 방향을 이용하여, 상기 제2 음성 인식의 적어도 일부를 수행하는 동작을 포함하는, 방법.
KR1020160006908A 2016-01-20 2016-01-20 전자 장치 및 전자 장치의 음성 명령 처리 방법 KR102392113B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020160006908A KR102392113B1 (ko) 2016-01-20 2016-01-20 전자 장치 및 전자 장치의 음성 명령 처리 방법
US15/411,140 US10229681B2 (en) 2016-01-20 2017-01-20 Voice command processing of wakeup signals from first and second directions

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020160006908A KR102392113B1 (ko) 2016-01-20 2016-01-20 전자 장치 및 전자 장치의 음성 명령 처리 방법

Publications (2)

Publication Number Publication Date
KR20170087207A KR20170087207A (ko) 2017-07-28
KR102392113B1 true KR102392113B1 (ko) 2022-04-29

Family

ID=59314679

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020160006908A KR102392113B1 (ko) 2016-01-20 2016-01-20 전자 장치 및 전자 장치의 음성 명령 처리 방법

Country Status (2)

Country Link
US (1) US10229681B2 (ko)
KR (1) KR102392113B1 (ko)

Families Citing this family (116)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013130644A1 (en) 2012-02-28 2013-09-06 Centurylink Intellectual Property Llc Apical conduit and methods of using same
US9786997B2 (en) 2013-08-01 2017-10-10 Centurylink Intellectual Property Llc Wireless access point in pedestal or hand hole
US10276921B2 (en) 2013-09-06 2019-04-30 Centurylink Intellectual Property Llc Radiating closures
US9780433B2 (en) 2013-09-06 2017-10-03 Centurylink Intellectual Property Llc Wireless distribution using cabinets, pedestals, and hand holes
US10154325B2 (en) 2014-02-12 2018-12-11 Centurylink Intellectual Property Llc Point-to-point fiber insertion
US10375172B2 (en) 2015-07-23 2019-08-06 Centurylink Intellectual Property Llc Customer based internet of things (IOT)—transparent privacy functionality
US10623162B2 (en) 2015-07-23 2020-04-14 Centurylink Intellectual Property Llc Customer based internet of things (IoT)
US10412064B2 (en) 2016-01-11 2019-09-10 Centurylink Intellectual Property Llc System and method for implementing secure communications for internet of things (IOT) devices
US10509626B2 (en) 2016-02-22 2019-12-17 Sonos, Inc Handling of loss of pairing between networked devices
US9947316B2 (en) 2016-02-22 2018-04-17 Sonos, Inc. Voice control of a media playback system
US9965247B2 (en) 2016-02-22 2018-05-08 Sonos, Inc. Voice controlled media playback system based on user profile
US10095470B2 (en) 2016-02-22 2018-10-09 Sonos, Inc. Audio response playback
US10264030B2 (en) 2016-02-22 2019-04-16 Sonos, Inc. Networked microphone device control
US10097919B2 (en) 2016-02-22 2018-10-09 Sonos, Inc. Music service selection
JP6436427B2 (ja) * 2016-03-25 2018-12-12 パナソニックIpマネジメント株式会社 収音装置
US10832665B2 (en) * 2016-05-27 2020-11-10 Centurylink Intellectual Property Llc Internet of things (IoT) human interface apparatus, system, and method
US9978390B2 (en) 2016-06-09 2018-05-22 Sonos, Inc. Dynamic player selection for audio signal processing
US10152969B2 (en) 2016-07-15 2018-12-11 Sonos, Inc. Voice detection by multiple devices
US10134399B2 (en) 2016-07-15 2018-11-20 Sonos, Inc. Contextualization of voice inputs
US10249103B2 (en) 2016-08-02 2019-04-02 Centurylink Intellectual Property Llc System and method for implementing added services for OBD2 smart vehicle connection
US10115400B2 (en) 2016-08-05 2018-10-30 Sonos, Inc. Multiple voice services
US10110272B2 (en) 2016-08-24 2018-10-23 Centurylink Intellectual Property Llc Wearable gesture control device and method
US10687377B2 (en) 2016-09-20 2020-06-16 Centurylink Intellectual Property Llc Universal wireless station for multiple simultaneous wireless services
US10896439B1 (en) 2016-09-22 2021-01-19 Amazon Technologies, Inc. Generating content delivery campaigns with dynamic functionality for single-action execution
US9942678B1 (en) 2016-09-27 2018-04-10 Sonos, Inc. Audio playback settings for voice interaction
US9743204B1 (en) 2016-09-30 2017-08-22 Sonos, Inc. Multi-orientation playback device microphones
US10181323B2 (en) 2016-10-19 2019-01-15 Sonos, Inc. Arbitration-based voice recognition
US9867112B1 (en) 2016-11-23 2018-01-09 Centurylink Intellectual Property Llc System and method for implementing combined broadband and wireless self-organizing network (SON)
US10426358B2 (en) 2016-12-20 2019-10-01 Centurylink Intellectual Property Llc Internet of things (IoT) personal tracking apparatus, system, and method
US10193981B2 (en) 2016-12-23 2019-01-29 Centurylink Intellectual Property Llc Internet of things (IoT) self-organizing network
US10735220B2 (en) 2016-12-23 2020-08-04 Centurylink Intellectual Property Llc Shared devices with private and public instances
US10222773B2 (en) 2016-12-23 2019-03-05 Centurylink Intellectual Property Llc System, apparatus, and method for implementing one or more internet of things (IoT) capable devices embedded within a roadway structure for performing various tasks
US10150471B2 (en) 2016-12-23 2018-12-11 Centurylink Intellectual Property Llc Smart vehicle apparatus, system, and method
US10637683B2 (en) 2016-12-23 2020-04-28 Centurylink Intellectual Property Llc Smart city apparatus, system, and method
US10146024B2 (en) 2017-01-10 2018-12-04 Centurylink Intellectual Property Llc Apical conduit method and system
US11010601B2 (en) 2017-02-14 2021-05-18 Microsoft Technology Licensing, Llc Intelligent assistant device communicating non-verbal cues
US10467510B2 (en) 2017-02-14 2019-11-05 Microsoft Technology Licensing, Llc Intelligent assistant
US11100384B2 (en) 2017-02-14 2021-08-24 Microsoft Technology Licensing, Llc Intelligent device user interactions
KR20180098079A (ko) * 2017-02-24 2018-09-03 삼성전자주식회사 비전 기반의 사물 인식 장치 및 그 제어 방법
US11183181B2 (en) 2017-03-27 2021-11-23 Sonos, Inc. Systems and methods of multiple voice services
US11220008B2 (en) * 2017-07-18 2022-01-11 Panasonic Intellectual Property Management Co., Ltd. Apparatus, method, non-transitory computer-readable recording medium storing program, and robot
US10474417B2 (en) 2017-07-20 2019-11-12 Apple Inc. Electronic device with sensors and display devices
US10475449B2 (en) 2017-08-07 2019-11-12 Sonos, Inc. Wake-word detection suppression
US10951967B2 (en) * 2017-08-23 2021-03-16 Amazon Technologies, Inc. Voice-controlled multimedia device and universal remote
KR102418952B1 (ko) * 2017-08-31 2022-07-08 삼성전자주식회사 음성인식 기능을 갖는 가전제품
KR102371752B1 (ko) * 2017-08-31 2022-03-07 삼성전자주식회사 가전 기기 및 그의 제어방법
US10048930B1 (en) 2017-09-08 2018-08-14 Sonos, Inc. Dynamic computation of system response volume
US10475454B2 (en) * 2017-09-18 2019-11-12 Motorola Mobility Llc Directional display and audio broadcast
US10446165B2 (en) 2017-09-27 2019-10-15 Sonos, Inc. Robust short-time fourier transform acoustic echo cancellation during audio playback
US10051366B1 (en) 2017-09-28 2018-08-14 Sonos, Inc. Three-dimensional beam forming with a microphone array
US10482868B2 (en) 2017-09-28 2019-11-19 Sonos, Inc. Multi-channel acoustic echo cancellation
US10621981B2 (en) 2017-09-28 2020-04-14 Sonos, Inc. Tone interference cancellation
US10466962B2 (en) 2017-09-29 2019-11-05 Sonos, Inc. Media playback system with voice assistance
EP3696811A4 (en) 2017-10-11 2020-11-25 Sony Corporation VOICE ENTRY DEVICE, ASSOCIATED PROCESS AND PROGRAM
US10880650B2 (en) 2017-12-10 2020-12-29 Sonos, Inc. Network microphone devices with automatic do not disturb actuation capabilities
US10818290B2 (en) 2017-12-11 2020-10-27 Sonos, Inc. Home graph
KR102453689B1 (ko) 2017-12-13 2022-10-11 삼성전자주식회사 주기적 프로세스 처리 시스템 및 시스템 온 칩
US10627794B2 (en) 2017-12-19 2020-04-21 Centurylink Intellectual Property Llc Controlling IOT devices via public safety answering point
CN109968351A (zh) * 2017-12-28 2019-07-05 深圳市优必选科技有限公司 机器人及其控制方法、具有存储功能的装置
WO2019144393A1 (zh) * 2018-01-29 2019-08-01 深圳市共进电子股份有限公司 基于语音交互的家用机器人工作系统的控制方法
US11343614B2 (en) 2018-01-31 2022-05-24 Sonos, Inc. Device designation of playback and network microphone device arrangements
US10586538B2 (en) * 2018-04-25 2020-03-10 Comcast Cable Comminications, LLC Microphone array beamforming control
US11175880B2 (en) 2018-05-10 2021-11-16 Sonos, Inc. Systems and methods for voice-assisted media content selection
US10847178B2 (en) 2018-05-18 2020-11-24 Sonos, Inc. Linear filtering for noise-suppressed speech detection
US10959029B2 (en) 2018-05-25 2021-03-23 Sonos, Inc. Determining and adapting to changes in microphone performance of playback devices
US10681460B2 (en) 2018-06-28 2020-06-09 Sonos, Inc. Systems and methods for associating playback devices with voice assistant services
CN109202897A (zh) * 2018-08-07 2019-01-15 北京云迹科技有限公司 信息传输方法及系统
CN110853619B (zh) * 2018-08-21 2022-11-25 上海博泰悦臻网络技术服务有限公司 人机交互方法、控制装置、被控装置及存储介质
US10461710B1 (en) 2018-08-28 2019-10-29 Sonos, Inc. Media playback system with maximum volume setting
US11076035B2 (en) 2018-08-28 2021-07-27 Sonos, Inc. Do not disturb feature for audio notifications
WO2020052316A1 (zh) * 2018-09-11 2020-03-19 中新智擎科技有限公司 一种多功能服务机器人
US10587430B1 (en) 2018-09-14 2020-03-10 Sonos, Inc. Networked devices, systems, and methods for associating playback devices based on sound codes
US10878811B2 (en) 2018-09-14 2020-12-29 Sonos, Inc. Networked devices, systems, and methods for intelligently deactivating wake-word engines
US11024331B2 (en) 2018-09-21 2021-06-01 Sonos, Inc. Voice detection optimization using sound metadata
US10811015B2 (en) * 2018-09-25 2020-10-20 Sonos, Inc. Voice detection optimization based on selected voice assistant service
US11100923B2 (en) 2018-09-28 2021-08-24 Sonos, Inc. Systems and methods for selective wake word detection using neural network models
TWI725340B (zh) * 2018-09-28 2021-04-21 威鋒電子股份有限公司 可攜式通訊裝置的座體及其操作方法
US10692518B2 (en) 2018-09-29 2020-06-23 Sonos, Inc. Linear filtering for noise-suppressed speech detection via multiple network microphone devices
CN109286875B (zh) * 2018-09-29 2021-01-01 百度在线网络技术(北京)有限公司 用于定向拾音的方法、装置、电子设备和存储介质
KR20200043642A (ko) 2018-10-18 2020-04-28 삼성전자주식회사 동작 상태에 기반하여 선택한 마이크를 이용하여 음성 인식을 수행하는 전자 장치 및 그의 동작 방법
US11899519B2 (en) 2018-10-23 2024-02-13 Sonos, Inc. Multiple stage network microphone device with reduced power consumption and processing load
EP3654249A1 (en) 2018-11-15 2020-05-20 Snips Dilated convolutions and gating for efficient keyword spotting
KR20200059054A (ko) * 2018-11-20 2020-05-28 삼성전자주식회사 사용자 발화를 처리하는 전자 장치, 및 그 전자 장치의 제어 방법
US11183183B2 (en) 2018-12-07 2021-11-23 Sonos, Inc. Systems and methods of operating media playback systems having multiple voice assistant services
US11132989B2 (en) 2018-12-13 2021-09-28 Sonos, Inc. Networked microphone devices, systems, and methods of localized arbitration
US10602268B1 (en) 2018-12-20 2020-03-24 Sonos, Inc. Optimization of network microphone devices using noise classification
KR20200093094A (ko) 2019-01-10 2020-08-05 삼성전자주식회사 전자 장치 및 그 제어 방법
US10867604B2 (en) 2019-02-08 2020-12-15 Sonos, Inc. Devices, systems, and methods for distributed voice processing
US11315556B2 (en) 2019-02-08 2022-04-26 Sonos, Inc. Devices, systems, and methods for distributed voice processing by transmitting sound data associated with a wake word to an appropriate device for identification
US11120794B2 (en) 2019-05-03 2021-09-14 Sonos, Inc. Voice assistant persistence across multiple network microphone devices
US10586540B1 (en) 2019-06-12 2020-03-10 Sonos, Inc. Network microphone device with command keyword conditioning
US11361756B2 (en) 2019-06-12 2022-06-14 Sonos, Inc. Conditional wake word eventing based on environment
US11200894B2 (en) 2019-06-12 2021-12-14 Sonos, Inc. Network microphone device with command keyword eventing
CN110171002B (zh) * 2019-06-13 2021-04-06 北京猎户星空科技有限公司 机器人及其控制方法、装置和存储介质
CN110164443B (zh) * 2019-06-28 2021-09-14 联想(北京)有限公司 用于电子设备的语音处理方法、装置以及电子设备
WO2021015308A1 (ko) 2019-07-19 2021-01-28 엘지전자 주식회사 로봇 및 그의 기동어 인식 방법
US10871943B1 (en) 2019-07-31 2020-12-22 Sonos, Inc. Noise classification for event detection
US11138975B2 (en) 2019-07-31 2021-10-05 Sonos, Inc. Locally distributed keyword detection
US11138969B2 (en) 2019-07-31 2021-10-05 Sonos, Inc. Locally distributed keyword detection
WO2021033889A1 (en) 2019-08-20 2021-02-25 Samsung Electronics Co., Ltd. Electronic device and method for controlling the electronic device
WO2021060680A1 (en) * 2019-09-24 2021-04-01 Samsung Electronics Co., Ltd. Methods and systems for recording mixed audio signal and reproducing directional audio
KR20210042520A (ko) * 2019-10-10 2021-04-20 삼성전자주식회사 전자 장치 및 이의 제어 방법
US11189286B2 (en) 2019-10-22 2021-11-30 Sonos, Inc. VAS toggle based on device orientation
JP7426619B2 (ja) * 2019-11-05 2024-02-02 パナソニックIpマネジメント株式会社 制御システム、及び、制御方法
US11417328B1 (en) * 2019-12-09 2022-08-16 Amazon Technologies, Inc. Autonomously motile device with speech commands
US11200900B2 (en) 2019-12-20 2021-12-14 Sonos, Inc. Offline voice control
US11562740B2 (en) 2020-01-07 2023-01-24 Sonos, Inc. Voice verification for media playback
US11556307B2 (en) 2020-01-31 2023-01-17 Sonos, Inc. Local voice data processing
US11308958B2 (en) 2020-02-07 2022-04-19 Sonos, Inc. Localized wakeword verification
US11308962B2 (en) 2020-05-20 2022-04-19 Sonos, Inc. Input detection windowing
US11727919B2 (en) 2020-05-20 2023-08-15 Sonos, Inc. Memory allocation for keyword spotting engines
US11482224B2 (en) 2020-05-20 2022-10-25 Sonos, Inc. Command keywords with input detection windowing
CN111696333A (zh) * 2020-06-28 2020-09-22 上海明略人工智能(集团)有限公司 一种数据传输的方法、系统及装置
US11698771B2 (en) 2020-08-25 2023-07-11 Sonos, Inc. Vocal guidance engines for playback devices
US11551700B2 (en) 2021-01-25 2023-01-10 Sonos, Inc. Systems and methods for power-efficient keyword detection
WO2024076114A1 (ko) * 2022-10-08 2024-04-11 삼성전자주식회사 보이스 커맨드의 실행을 제어하기 위한 전자 장치 및 그 방법

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006297531A (ja) 2005-04-20 2006-11-02 Fujitsu Ltd サービスロボット
JP2013508177A (ja) 2009-10-21 2013-03-07 セコルポラ, エセ. エレ. ソーシャルロボット

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6505097B1 (en) * 1999-01-13 2003-01-07 Sony Corporation Arithmetic processing device, inter-object communication method, and robot
US7215786B2 (en) * 2000-06-09 2007-05-08 Japan Science And Technology Agency Robot acoustic device and robot acoustic system
US7388879B2 (en) * 2000-08-28 2008-06-17 Sony Corporation Communication device and communication method network system and robot apparatus
JP3771812B2 (ja) * 2001-05-28 2006-04-26 インターナショナル・ビジネス・マシーンズ・コーポレーション ロボットおよびその制御方法
JP3824920B2 (ja) * 2001-12-07 2006-09-20 ヤマハ発動機株式会社 マイクロホンユニット及び音源方向同定システム
JP3714268B2 (ja) * 2002-03-18 2005-11-09 ソニー株式会社 ロボット装置
JP4611675B2 (ja) * 2004-06-30 2011-01-12 本田技研工業株式会社 顧客応対ロボット
JP4373903B2 (ja) * 2004-12-14 2009-11-25 本田技研工業株式会社 自律移動ロボット
US8935006B2 (en) * 2005-09-30 2015-01-13 Irobot Corporation Companion robot for personal interaction
EP1953735B1 (en) * 2007-02-02 2010-01-06 Harman Becker Automotive Systems GmbH Voice control system and method for voice control
DE102009051508B4 (de) * 2009-10-30 2020-12-03 Continental Automotive Gmbh Vorrichtung, System und Verfahren zur Sprachdialogaktivierung und -führung
KR101021267B1 (ko) * 2010-09-20 2011-03-11 주식회사 모뉴엘 청소로봇 시스템 및 그 제어 방법
KR20140047273A (ko) 2012-10-12 2014-04-22 피프가부시끼가이샤 로봇
US9460715B2 (en) * 2013-03-04 2016-10-04 Amazon Technologies, Inc. Identification using audio signatures and additional characteristics
US9747899B2 (en) * 2013-06-27 2017-08-29 Amazon Technologies, Inc. Detecting self-generated wake expressions
WO2015005927A1 (en) * 2013-07-11 2015-01-15 Intel Corporation Device wake and speaker verification using the same audio input
FR3011377B1 (fr) * 2013-10-01 2015-11-06 Aldebaran Robotics Procede de localisation d'une source sonore et robot humanoide utilisant un tel procede
KR102208477B1 (ko) * 2014-06-30 2021-01-27 삼성전자주식회사 마이크 운용 방법 및 이를 지원하는 전자 장치
CN104965426A (zh) * 2015-06-24 2015-10-07 百度在线网络技术(北京)有限公司 基于人工智能的智能机器人控制系统、方法和装置
US9734845B1 (en) * 2015-06-26 2017-08-15 Amazon Technologies, Inc. Mitigating effects of electronic audio sources in expression detection
KR20170038378A (ko) * 2015-09-30 2017-04-07 삼성전자주식회사 이미지를 처리하는 전자 장치 및 그 제어 방법
US9621984B1 (en) * 2015-10-14 2017-04-11 Amazon Technologies, Inc. Methods to process direction data of an audio input device using azimuth values
KR102423588B1 (ko) * 2015-12-28 2022-07-22 삼성전자주식회사 정보 제공 방법 및 장치
KR102561572B1 (ko) * 2016-01-20 2023-07-31 삼성전자주식회사 센서 활용 방법 및 이를 구현한 전자 장치
CN106203259A (zh) * 2016-06-27 2016-12-07 旗瀚科技股份有限公司 机器人的交互方向调整方法及装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006297531A (ja) 2005-04-20 2006-11-02 Fujitsu Ltd サービスロボット
JP2013508177A (ja) 2009-10-21 2013-03-07 セコルポラ, エセ. エレ. ソーシャルロボット

Also Published As

Publication number Publication date
KR20170087207A (ko) 2017-07-28
US20170206900A1 (en) 2017-07-20
US10229681B2 (en) 2019-03-12

Similar Documents

Publication Publication Date Title
KR102392113B1 (ko) 전자 장치 및 전자 장치의 음성 명령 처리 방법
KR102495523B1 (ko) 음성 명령을 처리하는 방법 및 이를 제공하는 전자 장치
KR102405793B1 (ko) 음성 신호 인식 방법 및 이를 제공하는 전자 장치
KR102383790B1 (ko) 주변 환경 인식 방법 및 그 전자 장치
KR102432620B1 (ko) 외부 객체의 근접에 따른 동작을 수행하는 전자 장치 및 그 방법
US10636430B2 (en) Voice inputting method, and electronic device and system for supporting the same
KR102412315B1 (ko) 무선 충전 상태에 대한 알림을 제공하는 장치 및 그 방법
KR102493491B1 (ko) 생체 정보를 측정하는 전자 장치와 이의 동작 방법
KR20180083587A (ko) 전자 장치 및 그의 동작 방법
KR20180085931A (ko) 음성 입력 처리 방법 및 이를 지원하는 전자 장치
KR20170046958A (ko) 전자 장치 및 그의 음성 인식을 이용한 기능 실행 방법
KR20170086814A (ko) 음성 인식 기능을 제공하는 전자 장치 및 그 동작 방법
KR102458532B1 (ko) 위치 판단 방법 및 장치
KR102386309B1 (ko) 전자 장치 및 전자 장치에서의 입출력 제어 방법
US11074910B2 (en) Electronic device for recognizing speech
US9967658B2 (en) Method for processing sound by electronic device and electronic device thereof
KR20180109624A (ko) 음성 인식 서비스 운용 방법 및 이를 지원하는 전자 장치
US10345924B2 (en) Method for utilizing sensor and electronic device implementing same
KR20180047801A (ko) 전자 장치 및 전자 장치 제어 방법
KR102413108B1 (ko) 터치 인식 방법 및 이를 수행하는 전자 장치
KR102626304B1 (ko) 콘텐츠 출력 방법 및 이를 지원하는 전자 장치
KR20170109408A (ko) 전자 장치 및 전자 장치 제어 방법
KR102549465B1 (ko) 마이크 파라미터를 조절하는 전자 장치
KR102644876B1 (ko) 정보 처리 시스템 및 이에 포함되는 전자 장치
US10136286B2 (en) Method for controlling external electronic device and electronic device for processing same

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant