KR20180083587A - 전자 장치 및 그의 동작 방법 - Google Patents

전자 장치 및 그의 동작 방법 Download PDF

Info

Publication number
KR20180083587A
KR20180083587A KR1020170006047A KR20170006047A KR20180083587A KR 20180083587 A KR20180083587 A KR 20180083587A KR 1020170006047 A KR1020170006047 A KR 1020170006047A KR 20170006047 A KR20170006047 A KR 20170006047A KR 20180083587 A KR20180083587 A KR 20180083587A
Authority
KR
South Korea
Prior art keywords
electronic device
command
score
response
processor
Prior art date
Application number
KR1020170006047A
Other languages
English (en)
Inventor
김준희
차클라달 서브호지트
이태진
이상훈
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020170006047A priority Critical patent/KR20180083587A/ko
Priority to PCT/KR2017/011504 priority patent/WO2018131775A1/ko
Priority to US16/476,364 priority patent/US11636861B2/en
Publication of KR20180083587A publication Critical patent/KR20180083587A/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/06Decision making techniques; Pattern matching strategies
    • G10L17/12Score normalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3206Monitoring of events, devices or parameters that trigger a change in power modality
    • G06F1/3209Monitoring remote activity, e.g. over telephone lines or network connections
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3206Monitoring of events, devices or parameters that trigger a change in power modality
    • G06F1/3215Monitoring of peripheral devices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3206Monitoring of events, devices or parameters that trigger a change in power modality
    • G06F1/3228Monitoring task completion, e.g. by use of idle timers, stop commands or wait commands
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/22Interactive procedures; Man-machine interfaces
    • G10L17/24Interactive procedures; Man-machine interfaces the user being prompted to utter a password or a predefined phrase
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Game Theory and Decision Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Business, Economics & Management (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Telephone Function (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

본 발명의 다양한 실시 예들은 전자 장치에서 음성 명령을 처리하는 방법 및 장치에 관하여 개시한다. 본 발명의 다양한 실시 예들에 따르면, 마이크, 메모리, 및 상기 마이크 및 상기 메모리와 기능적으로 연결된 프로세서를 포함하고, 상기 프로세서는, 음성 호출 명령어의 감지에 기반하여 웨이크-업(wake-up) 하고, 상기 음성 호출 명령어의 인식에 관련된 스코어를 산출하고, 상기 스코어를 외부 장치와 공유하고, 상기 스코어에 기반하여 음성 명령의 수행 여부를 판단하고, 및 상기 판단하는 결과에 기반하여 음성 명령을 처리하도록 구성할 수 있다. 다양한 실시 예들이 가능하다.

Description

전자 장치 및 그의 동작 방법{ELECTRONIC DEVICE AND OPERATING METHOD THEREOF}
본 발명의 다양한 실시 예들은 전자 장치에서 음성 명령을 처리하는 방법 및 장치에 관한 것이다.
최근 디지털 기술의 발달과 함께 이동통신 단말기, 스마트폰(smart phone), 태블릿(tablet) PC(personal computer), 노트북(notebook), PDA(personal digital assistant), 웨어러블 장치(wearable device), 디지털 카메라(digital camera) 또는 개인용 컴퓨터(personal computer) 등과 같은 다양한 유형의 전자 장치가 널리 사용되고 있다.
최근에는, 전자 장치에서 음성 인식 기술을 바탕으로 한 다양한 음성 서비스(예: 음성 인식 기능)가 개발 및 제공되고 있다. 한 실시 예에 따르면, 전자 장치는 사용자의 음성 명령을 바탕으로 모바일 검색, 일정 관리, 전화 걸기, 메모, 또는 음악 재생 등 다양한 생활 편의 서비스를 제공하고 있다.
하지만, 사용자는 복수의 전자 장치들을 사용할 수 있고, 복수의 전자 장치들에서 동일한 음성 호출 명령어가 등록되어 있을 수 있다. 이러한 경우, 복수의 전자 장치들에서 음성 호출 명령어가 동시에 인식되어, 사용자에 의도된 전자 장치뿐만 아니라, 복수의 다른 전자 장치들까지 구동될 수 있다. 이는 사용자가 원하지 않는 전자 장치들까지 사용자 발화에 대한 음성 명령을 처리하게 되어, 사용자의 불편함을 초래할 수 있다. 예를 들면, 복수의 전자 장치들에 “하이 ABC”로 음성 호출 명령어가 동일하게 등록되고, 사용자가 음식 레시피를 검색하는 경우를 가정할 수 있다. 한 실시 예에 따라, 사용자는 “하이 ABC, 여름에 좋은 음식 레시피를 추천해줘”라고 발화할 수 있다. 이러한 경우, “하이 ABC”라는 음성 호출 명령어에 의해, 복수의 전자 장치들(예: 스마트폰, 냉장고, TV 등)이 모두 웨이크-업 하여, 음식 레시피 검색을 중복적으로 수행할 수 있고, 중복된 결과를 사용자에게 제공할 수 있다.
다양한 실시 예들에서는, 복수의 전자 장치들 중 사용자에 의해 의도된 전자 장치에 기반하여 음성 명령을 처리할 수 있는 방법 및 장치에 관하여 개시한다.
본 발명의 다양한 실시 예들에 따른 전자 장치는, 마이크, 메모리, 및 상기 마이크 및 상기 메모리와 기능적으로 연결된 프로세서를 포함하고, 상기 프로세서는, 음성 호출 명령어의 감지에 기반하여 웨이크-업(wake-up) 하고, 상기 음성 호출 명령어의 인식에 관련된 스코어를 산출하고, 상기 스코어를 외부 장치와 공유하고, 상기 스코어에 기반하여 음성 명령의 수행 여부를 판단하고, 및 상기 판단하는 결과에 기반하여 음성 명령을 처리하도록 구성할 수 있다.
본 발명의 다양한 실시 예들에 따른 전자 장치의 동작 방법은, 음성 호출 명령어의 감지에 기반하여 웨이크-업(wake-up) 하는 동작, 상기 음성 호출 명령어의 인식에 관련된 스코어를 산출하는 동작, 상기 스코어를 외부 장치와 공유하는 동작, 상기 스코어에 기반하여 음성 명령의 수행 여부를 판단하는 동작, 및 상기 판단하는 결과에 기반하여 음성 명령을 처리하는 동작을 포함할 수 있다.
상기와 같은 과제를 해결하기 위하여 본 발명의 다양한 실시 예들에서는, 상기 방법을 프로세서에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 판독 가능한 기록 매체를 포함할 수 있다.
다양한 실시 예들에 따른 전자 장치 및 그의 동작 방법에 따르면, 사용자는 전자 장치를 이용하여 음성 명령에 의한 기능(예: 음성 인식 기능)을 실행(사용)할 때, 복수의 전자 장치들이 하나의 음성 호출 명령어가 설정된 경우에도, 불편함 없이 의도된 전자 장치에 기반하여 음성 명령을 처리하도록 할 수 있다. 본 발명의 다양한 실시 예들에 따르면, 사용자가 원하는 전자 장치에서 음성 명령을 인식하여 관련 동작을 수행하도록, 음성을 이용하여 간편하게 제어할 수 있다.
도 1은 본 발명의 다양한 실시 예들에 따른 전자 장치를 포함하는 네트워크 환경을 도시하는 도면이다.
도 2는 본 발명의 다양한 실시 예들에 따른 전자 장치의 블록도이다.
도 3은 본 발명의 다양한 실시 예들에 따른 프로그램 모듈의 블록도이다.
도 4는 본 발명의 다양한 실시 예들에 따른 전자 장치의 구성을 개략적으로 도시하는 도면이다.
도 5a, 도 5b 및 도 5c는 본 발명의 다양한 실시 예들에 따른 전자 장치에서 음성 명령을 처리하기 위한 구성요소가 구현되는 예시를 도시하는 도면들이다.
도 6은 본 발명의 다양한 실시 예들에 따른 전자 장치의 예시를 도시하는 도면이다.
도 7 및 도 8은 본 발명의 다양한 실시 예들에 따른 시스템에서 음성 명령이 처리되는 동작 예시를 설명하기 위해 도시하는 도면들이다.
도 9는 다양한 실시 예들에 따른 전자 장치에서 스코어 산출에 고려되는 정보의 예를 도시하는 도면이다.
도 10은 본 발명의 다양한 실시 예들에 따른 시스템에서 음성 명령을 처리하는 동작을 도시하는 도면이다.
도 11은 본 발명의 다양한 실시 예들에 따른 전자 장치에서 음성 명령을 처리하는 동작을 도시하는 흐름도이다.
도 12는 본 발명의 다양한 실시 예들에 따른 서버에서 음성 명령을 처리하는 동작을 도시하는 흐름도이다.
도 13은 본 발명의 다양한 실시 예들에 따른 서버에서 음성 명령을 처리하는 동작을 도시하는 흐름도이다.
도 14는 본 발명의 다양한 실시 예들에 따른 서버에서 음성 명령을 수행할 대상 장치를 결정하는 예를 도시하는 흐름도이다.
도 15는 본 발명의 다양한 실시 예들에 따른 전자 장치에서 음성 명령을 처리하는 동작을 도시하는 흐름도이다.
도 16은 본 발명의 다양한 실시 예들에 따른 시스템에서 음성 명령을 처리하는 동작을 도시하는 도면이다.
도 17은 본 발명의 다양한 실시 예들에 따른 전자 장치에서 음성 명령을 처리하는 동작을 도시하는 흐름도이다.
도 18은 본 발명의 다양한 실시 예들에 따른 전자 장치에서 음성 명령을 수행할 대상 장치를 결정하는 예를 도시하는 흐름도이다.
도 19는 본 발명의 다양한 실시 예들에 따른 전자 장치에서 음성 명령을 수행할 대상 장치를 결정하는 예를 도시하는 흐름도이다.
이하, 본 문서의 다양한 실시 예들이 첨부된 도면을 참조하여 기재된다. 실시 예 및 이에 사용된 용어들은 본 문서에 기재된 기술을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 해당 실시 예의 다양한 변경, 균등물, 및/또는 대체물을 포함하는 것으로 이해되어야 한다. 도면의 설명과 관련하여, 유사한 구성요소에 대해서는 유사한 참조 부호가 사용될 수 있다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함할 수 있다. 본 문서에서, "A 또는 B" 또는 "A 및/또는 B 중 적어도 하나" 등의 표현은 함께 나열된 항목들의 모든 가능한 조합을 포함할 수 있다. "제 1", "제 2", "첫째", 또는 "둘째" 등의 표현들은 해당 구성요소들을, 순서 또는 중요도에 상관없이 수식할 수 있고, 한 구성요소를 다른 구성요소와 구분하기 위해 사용될 뿐 해당 구성요소들을 한정하지 않는다. 어떤(예: 제 1) 구성요소가 다른(예: 제 2) 구성요소에 "(기능적으로 또는 통신적으로) 연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 상기 어떤 구성요소가 상기 다른 구성요소에 직접적으로 연결되거나, 다른 구성요소(예: 제 3 구성요소)를 통하여 연결될 수 있다.
본 문서에서, "~하도록 구성된(또는 설정된)(configured to)"은 상황에 따라, 예를 들면, 하드웨어(hardware)적 또는 소프트웨어(software)적으로 "~에 적합한", "~하는 능력을 가지는", "~하도록 변경된", "~하도록 만들어진", "~를 할 수 있는", 또는 "~하도록 설계된"과 상호 호환적으로(interchangeably) 사용될 수 있다. 어떤 상황에서는, "~하도록 구성된 장치"라는 표현은, 그 장치가 다른 장치 또는 부품들과 함께 "~할 수 있는" 것을 의미할 수 있다. 예를 들면, 문구 "A, B, 및 C를 수행하도록 구성된(또는 설정된) 프로세서"는 해당 동작을 수행하기 위한 전용 프로세서(예: 임베디드 프로세서), 또는 메모리 장치에 저장된 하나 이상의 소프트웨어 프로그램들을 실행함으로써, 해당 동작들을 수행할 수 있는 범용 프로세서(generic-purpose processor)(예: CPU(central processing unit) 또는 AP(application processor))를 의미할 수 있다.
본 문서의 다양한 실시 예들에 따른 전자 장치는, 예를 들면, 스마트폰, 태블릿 PC, 이동 전화기, 영상 전화기, 전자책 리더기, 데스크탑 PC, 랩탑 PC, 넷북 컴퓨터, 워크스테이션, 서버, PDA(personal digital assistant), PMP(portable multimedia player), MP3 플레이어, 의료기기, 카메라, 또는 웨어러블 장치(wearable device) 중 적어도 하나를 포함할 수 있다. 웨어러블 장치는 액세서리형(예: 시계, 반지, 팔찌, 발찌, 목걸이, 안경, 콘택트 렌즈, 또는 머리 착용형 장치(HMD(head-mounted-device)), 직물 또는 의류 일체형(예: 전자 의복), 신체 부착형(예: 스킨 패드(skin pad) 또는 문신), 또는 생체 이식형 회로(implantable circuit) 중 적어도 하나를 포함할 수 있다. 어떤 실시 예들에서, 전자 장치는, 예를 들면, 텔레비전, DVD(digital video disk) 플레이어, 오디오, 냉장고, 에어컨, 청소기, 오븐, 전자레인지, 세탁기, 공기 청정기, 셋톱 박스, 홈 오토매이션 컨트롤 패널, 보안 컨트롤 패널, 미디어 박스(예: 삼성 HomeSyncTM, 애플TVTM, 또는 구글 TVTM), 게임 콘솔(예: XboxTM, PlayStationTM), 전자 사전, 전자 키, 캠코더, 또는 전자 액자 중 적어도 하나를 포함할 수 있다.
다른 실시 예에서, 전자 장치는, 각종 의료기기(예: 각종 휴대용 의료측정기기(예: 혈당 측정기, 심박 측정기, 혈압 측정기, 또는 체온 측정기 등), MRA(magnetic resonance angiography), MRI(magnetic resonance imaging), CT(computed tomography), 촬영기, 또는 초음파기 등), 네비게이션 장치, 위성 항법 시스템(GNSS, global navigation satellite system), EDR(event data recorder), FDR(flight data recorder), 자동차 인포테인먼트 장치, 선박용 전자 장비(예: 선박용 항법 장치, 자이로 콤파스 등), 항공 전자기기(avionics), 보안 기기, 차량용 헤드 유닛(head unit), 산업용 또는 가정용 로봇, 드론(drone), 금융 기관의 ATM(automated teller machine), 상점의 POS(point of sales), 또는 사물 인터넷(IoT, internet of things) 장치(예: 전구, 각종 센서, 스프링클러 장치, 화재 경보기, 온도조절기, 가로등, 토스터, 운동기구, 온수탱크, 히터, 보일러 등) 중 적어도 하나를 포함할 수 있다. 어떤 실시 예에 따르면, 전자 장치는 가구, 건물/구조물 또는 자동차의 일부, 전자 보드(electronic board), 전자 사인 수신 장치(electronic signature receiving device), 프로젝터, 또는 각종 계측 기기(예: 수도, 전기, 가스, 또는 전파 계측 기기 등) 중 적어도 하나를 포함할 수 있다. 다양한 실시 예들에서, 전자 장치는 플렉서블(flexible)하거나, 또는 전술한 다양한 장치들 중 둘 이상의 조합일 수 있다. 본 문서의 실시 예에 따른 전자 장치는 전술한 기기들에 한정되지 않는다. 본 문서에서, 사용자라는 용어는 전자 장치를 사용하는 사람 또는 전자 장치를 사용하는 장치(예: 인공지능 전자 장치)를 지칭할 수 있다.
도 1은 다양한 실시 예들에 따른 전자 장치를 포함하는 네트워크 환경을 도시하는 도면이다.
도 1을 참조하여, 다양한 실시 예들에서의, 네트워크 환경(100) 내의 전자 장치(101)가 기재된다. 전자 장치(101)는 버스(110), 프로세서(120), 메모리(130), 입출력 인터페이스(150), 디스플레이(160), 및 통신 인터페이스(170)를 포함할 수 있다. 어떤 실시 예에서, 전자 장치(101)는, 구성요소들 중 적어도 하나를 생략하거나 다른 구성요소를 추가적으로 구비할 수 있다.
버스(110)는 구성요소들(110-170)을 서로 연결하고, 구성요소들 간의 통신(예: 제어 메시지 또는 데이터)을 전달하는 회로를 포함할 수 있다.
프로세서(120)는, 중앙처리장치(CPU), 어플리케이션 프로세서(AP), 또는 커뮤니케이션 프로세서(CP, communication processor) 중 하나 또는 그 이상을 포함할 수 있다. 프로세서(120)는, 예를 들면, 전자 장치(101)의 적어도 하나의 다른 구성요소들의 제어 및/또는 통신에 관한 연산이나 데이터 처리를 실행할 수 있다. 다양한 실시 예들에 따른 프로세서(120)의 처리(또는 제어) 동작은 후술하는 도면들을 참조하여 구체적으로 설명된다.
메모리(130)는, 휘발성 메모리(volatile memory) 및/또는 비휘발성 메모리(non-volatile memory)를 포함할 수 있다. 메모리(130)는, 예를 들면, 전자 장치(101)의 적어도 하나의 다른 구성요소에 관계된 명령 또는 데이터를 저장할 수 있다. 한 실시 예에 따르면, 메모리(130)는 소프트웨어 및/또는 프로그램(140)을 저장할 수 있다. 프로그램(140)은, 예를 들면, 커널(kernel)(141), 미들웨어(middleware)(143), 어플리케이션 프로그래밍 인터페이스(API(application programming interface))(145), 및/또는 어플리케이션 프로그램(application program)(또는 "어플리케이션")(147) 등을 포함할 수 있다. 커널(141), 미들웨어(143), 또는 API(145)의 적어도 일부는, 운영 시스템(OS, operating system)으로 지칭될 수 있다.
커널(141)은, 예를 들면, 다른 프로그램들(예: 미들웨어(143), API(145), 또는 어플리케이션 프로그램(147))에 구현된 동작 또는 기능을 실행하는 데 사용되는 시스템 리소스들(예: 버스(110), 프로세서(120), 또는 메모리(130) 등)을 제어 또는 관리할 수 있다. 또한, 커널(141)은 미들웨어(143), API(145), 또는 어플리케이션 프로그램(147)에서 전자 장치(101)의 개별 구성요소에 접근함으로써, 시스템 리소스들을 제어 또는 관리할 수 있는 인터페이스를 제공할 수 있다.
미들웨어(143)는, 예를 들면, API(145) 또는 어플리케이션 프로그램(147)이 커널(141)과 통신하여 데이터를 주고받을 수 있도록 중개 역할을 수행할 수 있다. 또한, 미들웨어(143)는 어플리케이션 프로그램(147)으로부터 수신된 하나 이상의 작업 요청들을 우선 순위에 따라 처리할 수 있다. 예를 들면, 미들웨어(143)는 어플리케이션 프로그램(147) 중 적어도 하나에 전자 장치(101)의 시스템 리소스(예: 버스(110), 프로세서(120), 또는 메모리(130) 등)를 사용할 수 있는 우선 순위를 부여하고, 상기 하나 이상의 작업 요청들을 처리할 수 있다. API(145)는 어플리케이션(147)이 커널(141) 또는 미들웨어(143)에서 제공되는 기능을 제어하기 위한 인터페이스로, 예를 들면, 파일(file) 제어, 윈도우(window) 제어, 영상 처리, 또는 문자 제어 등을 위한 적어도 하나의 인터페이스 또는 함수(function)(예: 명령어)를 포함할 수 있다.
입출력 인터페이스(150)는, 예를 들면, 사용자 또는 외부 기기로부터 입력된 명령 또는 데이터를 전자 장치(101)의 다른 구성요소(들)에 전달하거나, 또는 전자 장치(101)의 다른 구성요소(들)로부터 수신된 명령 또는 데이터를 사용자 또는 외부 기기로 출력할 수 있다.
디스플레이(160)는, 예를 들면, 액정 디스플레이(LCD, liquid crystal display), 발광 다이오드(LED, light emitting diode) 디스플레이, 유기 발광 다이오드(OLED, organic LED) 디스플레이, 능동형 OLED(AMOLED, active matrix OLED), 마이크로 전자기계 시스템(MEMS, micro-electromechanical systems) 디스플레이, 또는 전자종이(electronic paper) 디스플레이 등을 포함할 수 있다. 디스플레이(160)는, 예를 들면, 사용자에게 각종 콘텐츠(예: 텍스트, 이미지, 비디오, 아이콘, 및/또는 심볼 등)를 표시할 수 있다. 디스플레이(160)는, 터치 스크린(touchscreen)을 포함할 수 있으며, 예를 들면, 전자 펜 또는 사용자의 신체의 일부를 이용한 터치, 제스처, 근접, 또는 호버링 입력을 수신할 수 있다.
통신 인터페이스(170)는, 예를 들면, 전자 장치(101)와 외부 장치(예: 제 1 외부 전자 장치(102), 제 2 외부 전자 장치(104), 또는 서버(106)) 간의 통신을 설정할 수 있다. 예를 들면, 통신 인터페이스(170)는 무선 통신 또는 유선 통신을 통해서 네트워크(162)에 연결되어 외부 장치(예: 제 2 외부 전자 장치(104) 또는 서버(106))와 통신할 수 있다.
무선 통신은, 예를 들면, LTE(long term evolution), LTE-A(LTE Advance), CDMA(code division multiple access), WCDMA(wideband CDMA), UMTS(universal mobile telecommunications system), WiBro(wireless broadband), 또는 GSM(global system for mobile communications) 등 중 적어도 하나를 사용하는 셀룰러 통신을 포함할 수 있다. 한 실시 예에 따르면, 무선 통신은, 예를 들면, WiFi(wireless fidelity), WiGig(wireless gigabit alliance), 블루투스(Bluetooth), 블루투스 저전력(BLE, Bluetooth low energy), 지그비(Zigbee), NFC(near field communication), 자력 시큐어 트랜스미션(magnetic secure transmission), 라디오 프리퀀시(RF, radio frequency), 또는 보디 에어리어 네트워크(BAN, body area network) 중 적어도 하나를 포함할 수 있다. 한 실시 예에 따르면, 무선 통신은 GNSS를 포함할 수 있다. GNSS는, 예를 들면, GPS(global positioning system), Glonass(global navigation satellite system), Beidou Navigation Satellite System(이하 “Beidou”) 또는 Galileo, the European global satellite-based navigation system일 수 있다. 이하, 본 문서에서는, “GPS”는 “GNSS”와 상호 호환적으로 사용될 수 있다.
유선 통신은, 예를 들면, USB(universal serial bus), HDMI(high definition multimedia interface), RS-232(recommended standard 232), 전력선 통신(power line communication), 또는 POTS(plain old telephone service) 등 중 적어도 하나를 포함할 수 있다.
네트워크(162)는 텔레커뮤니케이션 네트워크(telecommunications network), 예를 들면, 컴퓨터 네트워크(예: LAN(local area network) 또는 WAN(wide area network)), 인터넷, 또는 텔레폰 네트워크(telephone network) 중 적어도 하나를 포함할 수 있다.
제1 외부 전자 장치(102) 및 제2 외부 전자 장치(104) 각각은 전자 장치(101)와 동일한 또는 다른 종류의 장치일 수 있다. 다양한 실시 예들에 따르면, 전자 장치(101)에서 실행되는 동작들의 전부 또는 일부는 다른 하나 또는 복수의 전자 장치(예: 전자 장치(102, 104), 또는 서버(106))에서 실행될 수 있다. 한 실시 예에 따르면, 전자 장치(101)가 어떤 기능이나 서비스를 자동으로 또는 요청에 의하여 수행해야 할 경우에, 전자 장치(101)는 기능 또는 서비스를 자체적으로 실행시키는 대신에 또는 추가적으로, 그와 연관된 적어도 일부 기능을 다른 장치(예: 전자 장치(102, 104), 또는 서버(106))에게 요청할 수 있다. 다른 전자 장치(예: 전자 장치(102, 104), 또는 서버(106))는 요청된 기능 또는 추가 기능을 실행하고, 그 결과를 전자 장치(101)로 전달할 수 있다. 전자 장치(101)는 수신된 결과를 그대로 또는 추가적으로 처리하여 요청된 기능이나 서비스를 제공할 수 있다. 이를 위하여, 예를 들면, 클라우드 컴퓨팅(cloud computing), 분산 컴퓨팅(distributed computing), 또는 클라이언트-서버 컴퓨팅(client-server computing) 기술이 이용될 수 있다.
서버(106)는, 예를 들면, 음성 인식 서버, 음성 서비스 제공 서버, 데이터 서버, 검색 서버, 결제 서버, 카드사 서버, 은행 서버, 인증 서버, 어플리케이션 서버, 관리 서버, 통합 서버(integration server), 프로바이더 서버(provider server)(또는 통신 사업자 서버), 컨텐츠 서버(content server), 인터넷 서버(internet server), 또는 클라우드 서버(cloud server) 등) 중 적어도 하나를 포함할 수 있다.
도 2는 다양한 실시 예들에 따른 전자 장치의 블록도이다.
전자 장치(201)는, 예를 들면, 도 1에 도시된 전자 장치(101)의 전체 또는 일부를 포함할 수 있다. 전자 장치(201)는 하나 이상의 프로세서(예: AP)(210), 통신 모듈(220), 가입자 식별 모듈(224), 메모리(230), 센서 모듈(240), 입력 장치(250), 디스플레이(260), 인터페이스(270), 오디오 모듈(280), 카메라 모듈(291), 전력 관리 모듈(295), 배터리(296), 인디케이터(297), 및 모터(298) 등을 포함할 수 있다. 다양한 실시 예들에서, 전자 장치(201)는 도 2에 도시된 구성들이 필수적인 것은 아니어서, 도 2에 도시된 구성들보다 많은 구성들을 가지거나, 또는 그보다 적은 구성들을 가지는 것으로 구현될 수 있다. 예를 들어, 다양한 실시 예들에 따른 전자 장치(201)는 그 종류에 따라, 어느 일부 구성요소를 포함하지 않을 수 있다. 다양한 실시 예들에 따라, 전술한 전자 장치(201)의 구성들은 전자 장치(201)의 하우징(또는 베젤, 본체)에 안착되거나, 또는 그 외부에 형성될 수 있다.
프로세서(210)는, 예를 들면, 운영 체제 또는 어플리케이션 프로그램을 구동하여 프로세서(210)에 연결된 다수의 하드웨어 또는 소프트웨어 구성요소들을 제어할 수 있고, 각종 데이터 처리 및 연산을 수행할 수 있다. 프로세서(210)는, 예를 들면, SoC(system on chip)로 구현될 수 있다. 한 실시 예에 따르면, 프로세서(210)는 GPU(graphic processing unit) 및/또는 이미지 시그널 프로세서(ISP, image signal processor)를 더 포함할 수 있다. 프로세서(210)는 도 2에 도시된 구성요소들 중 적어도 일부(예: 셀룰러 모듈(221))를 포함할 수도 있다. 프로세서(210)는 다른 구성요소들(예: 비휘발성 메모리) 중 적어도 하나로부터 수신된 명령 또는 데이터를 휘발성 메모리에 로드(load)하여 처리하고, 결과 데이터를 비휘발성 메모리에 저장할 수 있다.
통신 모듈(220)은, 예를 들면, 도 1에 도시된 통신 인터페이스(170)와 동일 또는 유사한 구성을 가질 수 있다. 통신 모듈(220)은, 예를 들면, 셀룰러 모듈(221), WiFi 모듈(223), 블루투스 모듈(225), GNSS 모듈(227), NFC 모듈(228) 및 RF 모듈(229)을 포함할 수 있다. 도시하지는 않았으나, 통신 모듈(220)은, 예를 들면, WiGig 모듈(미도시)을 더 포함할 수도 있다. 한 실시 예에 따라, WiFi 모듈(223)과 WiGig 모듈(미도시)은 하나의 칩 형태로 통합 구현될 수도 있다.
셀룰러 모듈(221)은, 예를 들면, 통신 네트워크를 통해서 음성 통화, 영상 통화, 문자 서비스, 또는 인터넷 서비스 등을 제공할 수 있다. 한 실시 예에 따르면, 셀룰러 모듈(221)은 가입자 식별 모듈(예: SIM(subscriber identification module) 카드)(224)을 이용하여 통신 네트워크 내에서 전자 장치(201)의 구별 및 인증을 수행할 수 있다. 한 실시 예에 따르면, 셀룰러 모듈(221)은 프로세서(210)가 제공할 수 있는 기능 중 적어도 일부 기능을 수행할 수 있다. 한 실시 예에 따르면, 셀룰러 모듈(221)은 커뮤니케이션 프로세서(CP)를 포함할 수 있다. 어떤 실시 예에 따르면, 셀룰러 모듈(221), WiFi 모듈(223), 블루투스 모듈(225), GNSS 모듈(227) 또는 NFC 모듈(228) 중 적어도 일부(예: 두 개 이상)는 하나의 IC(integrated chip) 또는 IC 패키지 내에 포함될 수 있다.
RF 모듈(229)은, 예를 들면, 통신 신호(예: RF 신호)를 송수신할 수 있다. RF 모듈(229)은, 예를 들면, 트랜시버(transceiver), PAM(power amp module), 주파수 필터, LNA(low noise amplifier), 또는 안테나(antenna) 등을 포함할 수 있다. 다른 실시 예에 따르면, 셀룰러 모듈(221), WiFi 모듈(223), 블루투스 모듈(225), GNSS 모듈(227) 또는 NFC 모듈(228) 중 적어도 하나는 별개의 RF 모듈을 통하여 RF 신호를 송수신할 수 있다.
가입자 식별 모듈(224)은, 예를 들면, 가입자 식별 모듈을 포함하는 카드 또는 임베디드 SIM을 포함할 수 있다. 가입자 식별 모듈(224)은, 고유한 식별 정보(예: ICCID(integrated circuit card identifier)) 또는 가입자 정보(예: IMSI(international mobile subscriber identity))를 포함할 수 있다.
메모리(230)(예: 메모리(130))는, 예를 들면, 내장 메모리(232) 또는 외장 메모리(234)를 포함할 수 있다. 내장 메모리(232)는, 예를 들면, 휘발성 메모리(예: DRAM(dynamic RAM(random access memory)), SRAM(synchronous RAM), 또는 SDRAM(synchronous dynamic RAM) 등), 비휘발성 메모리(예: OTPROM(one time programmable ROM(read only memory)), PROM(programmable ROM), EPROM(erasable and programmable ROM), EEPROM(electrically EPROM), mask ROM, flash ROM, 플래시 메모리, 하드 드라이브, 또는 솔리드 스테이트 드라이브(SSD(solid state drive)) 중 적어도 하나를 포함할 수 있다. 외장 메모리(234)는 플래시 드라이브(flash drive), 예를 들면, CF(compact flash), SD(secure digital), Micro-SD, Mini-SD, xD(extreme digital), MMC(multi-media card) 또는 메모리 스틱 등을 포함할 수 있다. 외장 메모리(234)는 다양한 인터페이스를 통하여 전자 장치(201)와 기능적으로 또는 물리적으로 연결될 수 있다.
센서 모듈(240)은, 예를 들면, 물리량을 계측하거나 전자 장치(201)의 작동 상태를 감지하여, 계측 또는 감지된 정보를 전기 신호로 변환할 수 있다. 센서 모듈(240)은, 예를 들면, 제스처 센서(gesture sensor)(240A), 자이로 센서(gyro sensor)(240B), 기압 센서(barometer sensor)(240C), 마그네틱 센서(magnetic sensor)(240D), 가속도 센서(acceleration sensor)(240E), 그립 센서(grip sensor)(240F), 근접 센서(proximity sensor)(240G), 컬러 센서(color sensor)(240H)(예: RGB(red, green, blue) 센서), 생체 센서(medical sensor)(240I), 온/습도 센서(temperature-humidity sensor)(240J), 조도 센서(illuminance sensor)(240K), 또는 UV(ultra violet) 센서(240M) 중의 적어도 하나를 포함할 수 있다. 추가적으로 또는 대체적으로(additionally or alternatively), 센서 모듈(240)은, 예를 들면, 후각(e-nose) 센서, 일렉트로마이오그라피(EMG, electromyography) 센서, 일렉트로엔씨팔로그램(EEG, electroencephalogram) 센서, 일렉트로카디오그램(ECG, electrocardiogram) 센서, IR(infrared) 센서, 홍채 센서(iris scan sensor) 및/또는 지문 센서(finger scan sensor)를 포함할 수 있다. 센서 모듈(240)은 그 안에 속한 적어도 하나 이상의 센서들을 제어하기 위한 제어 회로를 더 포함할 수 있다. 어떤 실시 예에서는, 전자 장치(201)는 프로세서(210)의 일부로서 또는 별도로, 센서 모듈(240)을 제어하도록 구성된 프로세서를 더 포함하여, 프로세서(210)가 슬립(sleep) 상태에 있는 동안, 센서 모듈(240)을 제어할 수 있다.
입력 장치(250)는, 예를 들면, 터치 패널(252), (디지털) 펜 센서(254), 키(256), 또는 초음파 입력 장치(258)를 포함할 수 있다. 터치 패널(252)은, 예를 들면, 정전식, 감압식, 적외선 방식, 또는 초음파 방식 중 적어도 하나의 방식을 사용할 수 있다. 또한, 터치 패널(252)은 제어 회로를 더 포함할 수도 있다. 터치 패널(252)은 택타일 레이어(tactile layer)를 더 포함하여, 사용자에게 촉각 반응을 제공할 수 있다. (디지털) 펜 센서(254)는, 예를 들면, 터치 패널의 일부이거나, 별도의 인식용 쉬트를 포함할 수 있다. 키(256)는, 예를 들면, 물리적인 버튼, 광학식 키, 또는 키패드를 포함할 수 있다. 초음파 입력 장치(258)는 마이크(288)를 통해, 입력 도구에서 발생된 초음파를 감지하여, 상기 감지된 초음파에 대응하는 데이터를 확인할 수 있다. 다양한 실시 예들에 따라, 입력 장치(250)는 전자 펜을 포함할 수 있다. 다양한 실시 예들에 따라, 입력 장치(250)는 포스 터치(force touch)를 입력 받을 수 있도록 구현될 수 있다.
디스플레이(260)(예: 디스플레이(160))는 패널(262), 홀로그램 장치(264), 프로젝터(266), 및/또는 이들을 제어하기 위한 제어 회로를 포함할 수 있다.
패널(262)은, 예를 들면, 유연하게, 투명하게, 또는 착용할 수 있게 구현될 수 있다. 패널(262)은 터치 패널(252)과 하나 이상의 모듈로 구성될 수 있다. 한 실시 예에 따르면, 패널(262)은 사용자의 터치에 대한 압력의 세기를 측정할 수 있는 압력 센서(또는 포스 센서(force sensor))를 포함할 수 있다. 압력 센서는 터치 패널(252)과 일체형으로 구현되거나, 또는 터치 패널(252)과는 별도의 하나 이상의 센서로 구현될 수 있다.
홀로그램 장치(264)는 빛의 간섭을 이용하여 입체 영상을 허공에 보여줄 수 있다. 프로젝터(266)는 스크린에 빛을 투사하여 영상을 표시할 수 있다. 스크린은, 예를 들면, 전자 장치(201)의 내부 또는 외부에 위치할 수 있다.
인터페이스(270)는, 예를 들면, HDMI(272), USB(274), 광 인터페이스(optical interface)(276), 또는 D-sub(D-subminiature)(278)를 포함할 수 있다. 인터페이스(270)는, 예를 들면, 도 1에 도시된 통신 인터페이스(170)에 포함될 수 있다. 추가적으로 또는 대체적으로, 인터페이스(270)는, 예를 들면, MHL(mobile high-definition link) 인터페이스, SD카드/MMC(multi-media card) 인터페이스, 또는 IrDA(infrared data association) 규격 인터페이스를 포함할 수 있다.
오디오 모듈(280)은, 예를 들면, 소리와 전기 신호를 쌍방향으로 변환시킬 수 있다. 오디오 모듈(280)의 적어도 일부 구성요소는, 예를 들면, 도 1 에 도시된 입출력 인터페이스(145)에 포함될 수 있다. 오디오 모듈(280)은, 예를 들면, 스피커(282), 리시버(284), 이어폰(286), 또는 마이크(288) 등을 통해 입력 또는 출력되는 소리 정보를 처리할 수 있다.
카메라 모듈(291)은, 예를 들면, 정지 영상 및 동영상을 촬영할 수 있는 장치로서, 한 실시 예에 따르면, 하나 이상의 이미지 센서(예: 전면 센서 또는 후면 센서), 렌즈, 이미지 시그널 프로세서(ISP), 또는 플래시(예: LED 또는 xenon lamp 등)를 포함할 수 있다.
전력 관리 모듈(295)은, 예를 들면, 전자 장치(201)의 전력을 관리할 수 있다. 한 실시 예에 따르면, 전력 관리 모듈(295)은 PMIC(power management integrated circuit), 충전 IC, 배터리 또는 연료 게이지(fuel gauge)를 포함할 수 있다. PMIC는, 유선 및/또는 무선 충전 방식을 가질 수 있다. 무선 충전 방식은, 예를 들면, 자기공명 방식, 자기유도 방식 또는 전자기파 방식 등을 포함하며, 무선 충전을 위한 부가적인 회로, 예를 들면, 코일 루프, 공진 회로, 또는 정류기 등을 더 포함할 수 있다. 배터리 게이지는, 예를 들면, 배터리(296)의 잔량, 충전 중 전압, 전류, 또는 온도를 측정할 수 있다. 배터리(296)는, 예를 들면, 충전식 전지(rechargeable battery) 및/또는 태양 전지(solar battery)를 포함할 수 있다.
인디케이터(297)는 전자 장치(201) 또는 그 일부(예: 프로세서(210))의 특정 상태, 예를 들면, 부팅 상태, 메시지 상태 또는 충전 상태 등을 표시할 수 있다. 모터(298)는 전기적 신호를 기계적 진동으로 변환할 수 있고, 진동, 또는 햅틱(haptic) 효과 등을 발생시킬 수 있다. 전자 장치(201)는, 예를 들면, DMB(digital multimedia broadcasting), DVB(digital video broadcasting), 또는 미디어플로(mediaFloTM) 등의 규격에 따른 미디어 데이터를 처리할 수 있는 모바일 TV 지원 장치(예: GPU)를 포함할 수 있다.
본 문서에서 기술된 구성요소들 각각은 하나 또는 그 이상의 부품(component)으로 구성될 수 있으며, 해당 구성요소의 명칭은 전자 장치의 종류에 따라서 달라질 수 있다. 다양한 실시 예들에서, 전자 장치(예: 전자 장치(101, 201))는 일부 구성요소가 생략되거나, 추가적인 구성요소를 더 포함하거나, 또는, 구성요소들 중 일부가 결합되어 하나의 개체로 구성되되, 결합 이전의 해당 구성요소들의 기능을 동일하게 수행할 수 있다.
도 3은 다양한 실시 예들에 따른 프로그램 모듈의 블록도이다.
한 실시 예에 따르면, 프로그램 모듈(310)(예: 프로그램(140))은 전자 장치(예: 전자 장치(101, 201))에 관련된 자원을 제어하는 운영 체제 및/또는 운영 체제 상에서 구동되는 다양한 어플리케이션(예: 어플리케이션 프로그램(147))을 포함할 수 있다. 운영 체제는, 예를 들면, AndroidTM, iOSTM, WindowsTM, SymbianTM, TizenTM, 또는 BadaTM를 포함할 수 있다.
도 3을 참조하면, 프로그램 모듈(310)은 커널(320)(예: 커널(141)), 미들웨어(330)(예: 미들웨어(143)), API(360)(예: API(145)), 및/또는 어플리케이션(370)(예: 어플리케이션 프로그램(147))을 포함할 수 있다. 프로그램 모듈(310)의 적어도 일부는 전자 장치 상에 프리로드(preload) 되거나, 외부 전자 장치(예: 전자 장치(102, 104), 서버(106) 등)로부터 다운로드(download) 가능하다.
커널(320)은, 예를 들면, 시스템 리소스 매니저(321) 및/또는 디바이스 드라이버(323)를 포함할 수 있다. 시스템 리소스 매니저(321)는 시스템 리소스의 제어, 할당, 또는 회수를 수행할 수 있다. 한 실시 예에 따르면, 시스템 리소스 매니저(321)는 프로세스 관리부, 메모리 관리부, 또는 파일 시스템 관리부를 포함할 수 있다. 디바이스 드라이버(323)는, 예를 들면, 디스플레이 드라이버, 카메라 드라이버, 블루투스 드라이버, 공유 메모리 드라이버, USB 드라이버, 키패드 드라이버, WiFi 드라이버, 오디오 드라이버, 또는 IPC(inter-process communication) 드라이버를 포함할 수 있다. 미들웨어(330)는, 예를 들면, 어플리케이션(370)이 공통적으로 필요로 하는 기능을 제공하거나, 어플리케이션(370)이 전자 장치 내부의 제한된 시스템 자원을 사용할 수 있도록 API(360)를 통해 다양한 기능들을 어플리케이션(370)으로 제공할 수 있다.
한 실시 예에 따르면, 미들웨어(330)는 런타임 라이브러리(runtime library)(335), 어플리케이션 매니저(application manager)(341), 윈도우 매니저(window manager)(342), 멀티미디어 매니저(multimedia manager)(343), 리소스 매니저(resource manager)(344), 파워 매니저(power manager)(345), 데이터베이스 매니저(database manager)(346), 패키지 매니저(package manager)(347), 커넥티비티 매니저(connectivity manager)(348), 노티피케이션 매니저(notification manager)(349), 로케이션 매니저(location manager)(350), 그래픽 매니저(graphic manager)(351), 또는 시큐리티 매니저(security manager)(352) 중 적어도 하나를 포함할 수 있다.
런타임 라이브러리(335)는, 예를 들면, 어플리케이션(370)이 실행되는 동안에 프로그래밍 언어(programming language)를 통해 새로운 기능을 추가하기 위해 컴파일러(compiler)가 사용하는 라이브러리 모듈을 포함할 수 있다. 런타임 라이브러리(335)는 입출력 관리, 메모리 관리, 또는 산술 함수 처리를 수행할 수 있다.
어플리케이션 매니저(341)는, 예를 들면, 어플리케이션(370)의 생명 주기(life cycle)를 관리할 수 있다. 윈도우 매니저(342)는 화면에서 사용되는 GUI(graphical user interface) 자원을 관리할 수 있다. 멀티미디어 매니저(343)는 미디어 파일들의 재생에 필요한 포맷을 파악하고, 해당 포맷에 맞는 코덱을 이용하여 미디어 파일의 인코딩 또는 디코딩을 수행할 수 있다. 리소스 매니저(344)는 어플리케이션(370)의 소스 코드 또는 메모리의 공간을 관리할 수 있다. 파워 매니저(345)는, 예를 들면, 배터리의 용량 또는 전원을 관리하고, 전자 장치의 동작에 필요한 전력 정보를 제공할 수 있다. 한 실시 예에 따르면, 파워 매니저(345)는 바이오스(BIOS(basic input/output system))와 연동할 수 있다. 데이터베이스 매니저(346)는, 예를 들면, 어플리케이션(370)에서 사용될 데이터베이스를 생성, 검색, 또는 변경할 수 있다. 패키지 매니저(347)는 패키지 파일의 형태로 배포되는 어플리케이션의 설치 또는 갱신을 관리할 수 있다.
커넥티비티 매니저(348)는, 예를 들면, 무선 연결을 관리할 수 있다. 노티피케이션 매니저(349)는, 예를 들면, 도착 메시지, 약속, 근접성 알림 등의 이벤트를 사용자에게 제공할 수 있다. 로케이션 매니저(350)는, 예를 들면, 전자 장치의 위치 정보를 관리할 수 있다. 그래픽 매니저(351)는, 예를 들면, 사용자에게 제공될 그래픽 효과 또는 이와 관련된 유저 인터페이스를 관리할 수 있다. 시큐리티 매니저(352)는, 예를 들면, 시스템 보안 또는 사용자 인증을 제공할 수 있다.
한 실시 예에 따르면, 미들웨어(330)는 전자 장치의 음성 또는 영상 통화 기능을 관리하기 위한 통화(telephony) 매니저 또는 전술된 구성요소들의 기능들의 조합을 형성할 수 있는 미들웨어 모듈을 포함할 수 있다. 한 실시 예에 따르면, 미들웨어(330)는 운영 체제의 종류 별로 특화된 모듈을 제공할 수 있다. 미들웨어(330)는 동적으로 기존의 구성요소를 일부 삭제하거나 새로운 구성요소들을 추가할 수 있다.
API(360)는, 예를 들면, API 프로그래밍 함수들의 집합으로, 운영 체제에 따라 다른 구성으로 제공될 수 있다. 예를 들면, 안드로이드 또는 iOS의 경우, 플랫폼 별로 하나의 API 셋을 제공할 수 있으며, 타이젠의 경우, 플랫폼 별로 두 개 이상의 API 셋을 제공할 수 있다.
어플리케이션(370)은, 예를 들면, 홈(371), 다이얼러(372), SMS/MMS(373), IM(instant message)(374), 브라우저(375), 카메라(376), 알람(377), 컨택트(378), 음성 다이얼(379), 이메일(380), 달력(381), 미디어 플레이어(382), 앨범(383), 와치(384) 등의 어플리케이션을 포함할 수 있다. 다양한 실시 예들에 따르면, 어플리케이션(370)은, 헬스 케어(예: 운동량 또는 혈당 등을 측정), 또는 환경 정보(예: 기압, 습도, 또는 온도 정보) 제공 어플리케이션 등을 포함할 수 있다.
한 실시 예에 따르면, 어플리케이션(370)은 전자 장치와 외부 전자 장치 사이의 정보 교환을 지원할 수 있는 정보 교환 어플리케이션을 포함할 수 있다. 정보 교환 어플리케이션은, 예를 들면, 외부 전자 장치에 특정 정보를 전달하기 위한 노티피케이션 릴레이(notification relay) 어플리케이션, 또는 외부 전자 장치를 관리하기 위한 장치 관리(device management) 어플리케이션을 포함할 수 있다. 예를 들면, 노티피케이션 릴레이 어플리케이션은 전자 장치의 다른 어플리케이션에서 발생된 알림 정보를 외부 전자 장치로 전달하거나, 또는 외부 전자 장치로부터 알림 정보를 수신하여 사용자에게 제공할 수 있다. 장치 관리 어플리케이션은, 예를 들면, 전자 장치와 통신하는 외부 전자 장치의 기능(예: 외부 전자 장치 자체(또는, 일부 구성 부품)의 턴-온(turn-on)/턴-오프(turn-off) 또는 디스플레이의 밝기(또는, 해상도) 조절), 또는 외부 전자 장치에서 동작하는 어플리케이션을 설치, 삭제, 또는 갱신할 수 있다. 한 실시 예에 따르면, 어플리케이션(370)은 외부 전자 장치의 속성에 따라 지정된 어플리케이션(예: 모바일 의료 기기의 건강 관리 어플리케이션)을 포함할 수 있다.
한 실시 예에 따르면, 어플리케이션(370)은 외부 전자 장치로부터 수신된 어플리케이션을 포함할 수 있다. 프로그램 모듈(310)의 적어도 일부는 소프트웨어, 펌웨어, 하드웨어(예: 프로세서(210)), 또는 이들 중 적어도 둘 이상의 조합으로 구현(예: 실행)될 수 있으며, 하나 이상의 기능을 수행하기 위한 모듈, 프로그램, 루틴, 명령어 세트 또는 프로세스를 포함할 수 있다.
본 문서에서 사용된 용어 "모듈"은 하드웨어, 소프트웨어 또는 펌웨어로 구성된 유닛(unit)을 포함하며, 예를 들면, 로직(logic), 논리 블록(logic block), 부품(component), 또는 회로(circuit) 등의 용어와 상호 호환적으로 사용될 수 있다. "모듈"은, 일체로 구성된 부품 또는 하나 또는 그 이상의 기능을 수행하는 최소 단위 또는 그 일부가 될 수 있다. "모듈"은 기계적으로 또는 전자적으로 구현될 수 있으며, 예를 들면, 어떤 동작들을 수행하는, 알려졌거나 앞으로 개발될, ASIC(application-specific integrated circuit) 칩, FPGAs(field-programmable gate arrays), 또는 프로그램 가능 논리 장치를 포함할 수 있다. 다양한 실시 예들에 따른 장치(예: 모듈들 또는 그 기능들) 또는 방법(예: 동작들)의 적어도 일부는 프로그램 모듈의 형태로 컴퓨터로 판독 가능한 저장 매체(예: 메모리(130))에 저장된 명령어로 구현될 수 있다. 상기 명령어가 프로세서(예: 도 1의 프로세서(120) 또는 도 2의 프로세서(210))에 의해 실행될 경우, 프로세서가 상기 명령어에 해당하는 기능을 수행할 수 있다.
컴퓨터로 판독 가능한 기록 매체는, 하드디스크, 플로피디스크, 마그네틱 매체(magnetic media)(예: 자기테이프), 광기록 매체(optical recording media)(예: CD-ROM(compact disc read only memory), DVD(digital versatile disc), 자기-광 매체(magneto-optical media)(예: 플롭티컬 디스크(floptical disk)), 내장 메모리 등을 포함할 수 있다. 명령어는 컴파일러에 의해 만들어지는 코드 또는 인터프리터에 의해 실행될 수 있는 코드를 포함할 수 있다. 다양한 실시 예들에 따르면, 기록 매체는, 후술되는 다양한 방법을 프로세서(120, 210)에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 판독 가능한 기록 매체를 포함할 수 있다.
다양한 실시 예들에 따른 모듈 또는 프로그램 모듈은 전술한 구성요소들 중 적어도 하나 이상을 포함하거나, 일부가 생략되거나, 또는 다른 구성요소를 더 포함할 수 있다. 다양한 실시 예들에 따른, 모듈, 프로그램 모듈 또는 다른 구성요소에 의해 수행되는 동작들은 순차적, 병렬적, 반복적 또는 휴리스틱(heuristic)하게 실행되거나, 적어도 일부 동작이 다른 순서로 실행되거나, 생략되거나, 또는 다른 동작이 추가될 수 있다.
제안하는 본 발명의 다양한 실시 예들에서는, 전자 장치에서 음성 명령(또는 음성 인식 기능, 음성 서비스)을 처리하는 방법 및 장치에 관하여 개시한다. 다양한 실시 예들에 따르면, 전자 장치가 음성 인식 기능의 시작을 인지할 수 있는 음성 호출 명령어(예: 웨이크-업 워드(wake-up word) 또는 웨이크-업 커맨드(wake-up command))가, 복수의 전자 장치들에 동일하게 등록된 경우에 있어서 음성 명령을 처리하는 방법 및 장치에 관하여 개시한다. 다양한 실시 예들에 따르면, 동일한 음성 호출 명령어를 인식할 수 있는 멀티 디바이스(multi device) 환경에서, 복수의 전자 장치들이 동일한 음성 호출 명령어에 따라 웨이크-업 한 이후, 음성 명령 인식 및/또는 피드백을 수행할 마스터 장치(master device)를 자동으로 결정할 수 있다. 다양한 실시 예들에 따르면, 마스터 장치에 기반하여 음성 명령에 따른 액션(action)(또는 동작, 기능)을 수행하거나, 또는 액션을 수행할 전자 장치를 선택 및 제어할 수 있다.
다양한 실시 예들에서, 전자 장치는, AP, CP, GPU, 및 CPU 등의 다양한 프로세서 중 하나 또는 그 이상을 사용하는 모든 장치를 포함할 수 있다. 예를 들면, 다양한 실시 예들에 따른 전자 장치는, 정보통신기기, 멀티미디어기기, 웨어러블 장치(wearable device), IoT 장치, 또는 이들 장치에 대응하는 다양한 다른 기기를 포함할 수 있다.
이하에서, 첨부 도면들을 참조하여 본 발명의 다양한 실시 예들에 따른 동작 방법 및 장치에 대하여 살펴보기로 한다. 하지만, 본 발명의 다양한 실시 예들이 하기에서 기술하는 내용에 의해 제한되거나 한정되는 것은 아니므로, 하기의 실시 예에 의거하여 다양한 실시 예들에 적용할 수 있음에 유의하여야 한다. 이하에서 설명되는 본 발명의 다양한 실시 예들에서는 하드웨어적인 접근 방법을 예시로서 설명한다. 하지만, 본 발명의 다양한 실시 예들에서는 하드웨어와 소프트웨어를 모두 사용하는 기술을 포함하고 있으므로, 본 발명의 다양한 실시 예들이 소프트웨어 기반의 접근 방법을 제외하는 것은 아니다.
도 4는 본 발명의 다양한 실시 예들에 따른 전자 장치의 구성을 개략적으로 도시하는 도면이다.
도 4를 참조하면, 다양한 실시 예들에 따른 전자 장치(400)는, 예를 들면, 무선 통신부(410), 사용자 입력부(420), 터치스크린(430), 오디오 처리부(440), 메모리(450), 인터페이스부(460), 카메라 모듈(470), 프로세서(480)(예: 도 1의 프로세서(120), 도 2의 프로세서(210)), 그리고 전원 공급부(490)를 포함할 수 있다. 다양한 실시 예들에서, 전자 장치(400)는 도 4에 도시된 구성들이 필수적인 것은 아니어서, 도 4에 도시된 구성들보다 많은 구성들을 가지거나, 또는 그보다 적은 구성들을 가지는 것으로 구현될 수 있다.
무선 통신부(410)는, 예를 들면, 도 2의 통신 모듈(220)과 동일 또는 유사한 구성을 가질 수 있다. 무선 통신부(410)는 전자 장치(400)와 외부 장치(예: 다른 전자 장치(102, 104), 서버(106)) 사이의 무선 통신을 가능하게 하는 하나 또는 그 이상의 모듈들을 포함할 수 있다. 예를 들어, 무선 통신부(410)는 이동통신 모듈(411), 무선 랜(WLAN, wireless local area network) 모듈(413), 근거리 통신 모듈(415), 그리고 위치 산출 모듈(417) 등을 포함하여 구성될 수 있다. 다양한 실시 예들에서 무선 통신부(410)는 주변의 외부 장치와 통신을 수행하기 위한 모듈(예: 근거리 통신 모듈, 원거리 통신 모듈 등)을 포함할 수 있다.
이동통신 모듈(411)은, 예를 들면, 도 2의 셀룰러 모듈(221)과 동일 또는 유사한 구성을 가질 수 있다. 이동통신 모듈(411)은 이동통신 네트워크 상에서 기지국, 외부 장치(예: 다른 전자 장치(104)), 그리고 다양한 서버들 중 적어도 하나와 무선 신호를 송수신할 수 있다. 무선 신호는 음성 신호, 데이터 신호 또는 다양한 형태의 제어 신호를 포함할 수 있다. 이동통신 모듈(411)은 전자 장치(400)의 동작에 필요한 다양한 데이터들을 사용자 요청에 응답하여 외부 장치(예: 서버(106) 또는 다른 전자 장치(104) 등)로 전송할 수 있다.
무선 랜 모듈(413)은, 예를 들면, 도 2의 WiFi 모듈(223)과 동일 또는 유사한 구성을 가질 수 있다. 무선 랜 모듈(413)은 무선 인터넷 접속 및 외부 장치(예: 다른 전자 장치(102) 또는 서버(106) 등)와 무선 랜 링크(link)를 형성하기 위한 모듈을 나타낼 수 있다. 무선 랜 모듈(413)은 전자 장치(400)에 내장되거나 외장될 수 있다. 무선 인터넷 기술로는, 예를 들면, WiFi, Wibro, WiMax(world interoperability for microwave access), HSDPA(high speed downlink packet access), 또는 mmWave(millimeter Wave) 등이 이용될 수 있다. 무선 랜 모듈(413)은 전자 장치(400)와 직접(direct) 연결되거나, 또는 네트워크(예: 무선 인터넷 네트워크)(예: 도 1의 네트워크(162))를 통해 연결되어 있는 외부 장치(예: 다른 전자 장치(104) 등)와 연동하여, 전자 장치(400)의 다양한 데이터들을 외부로 전송하거나, 또는 외부로부터 수신할 수 있다. 무선 랜 모듈(413)은 상시 온(on) 상태를 유지하거나, 전자 장치(400)의 설정 또는 사용자 입력에 따라 턴-온(turn-on)/턴-오프(turn-off) 될 수 있다.
근거리 통신 모듈(415)은 근거리 통신(short range communication)을 수행하기 위한 하나 또는 그 이상의 모듈들(예: 블루투스 모듈(225), NFC 모듈(228) 등)을 나타낼 수 있다. 근거리 통신 기술로는, 예를 들면, 블루투스, 저전력 블루투스(BLE), RFID(radio frequency identification), 적외선 통신(IrDA), UWB(ultra wideband), 지그비(Zigbee), 또는 NFC 등이 이용될 수 있다. 근거리 통신 모듈(415)은 전자 장치(400)와 네트워크(예: 근거리 통신 네트워크)를 통해 연결되어 있는 외부 장치(예: 다른 전자 장치(102) 등)와 연동하여, 전자 장치(400)의 다양한 데이터들을 외부 장치로 전송하거나 수신 받을 수 있다. 근거리 통신 모듈(415)은 상시 온 상태를 유지하거나, 전자 장치(400)의 설정 또는 사용자 입력에 따라 턴-온/턴-오프 될 수 있다.
위치 산출 모듈(417)은, 예를 들면, 도 2의 GNSS 모듈(227)과 동일 또는 유사한 구성을 가질 수 있다. 위치 산출 모듈(417)은 전자 장치(400)의 위치를 획득하기 위한 모듈로서, 대표적인 예로는 GPS(global position system) 모듈을 포함할 수 있다. 위치 산출 모듈(417)은 삼각 측량의 원리로 전자 장치(400)의 위치를 측정할 수 있다.
사용자 입력부(420)는 전자 장치(400)의 동작 제어를 위한 입력 데이터를 사용자 입력에 응답하여 발생할 수 있다. 사용자 입력부(420)는 사용자의 다양한 입력을 검출하기 위한 적어도 하나의 입력 장치(input device)를 포함할 수 있다. 예를 들어, 사용자 입력부(420)는 키패드(key pad), 돔 스위치(dome switch), 물리 버튼, 터치패드(정압/정전), 조그셔틀(jog & shuttle), 그리고 센서(예: 도 2의 센서 모듈(240)) 등을 포함할 수 있다.
사용자 입력부(420)는 일부가 전자 장치(400)의 외부에 버튼 형태로 구현될 수 있으며, 일부 또는 전체가 터치 패널(touch panel)로 구현될 수도 있다. 사용자 입력부(420)는 전자 장치(400)의 다양한 동작(예: 음성 인식 기능), 어플리케이션 실행 기능, 촬영 기능, 데이터 생성 기능, 데이터 재생 기능 등)을 개시(initiation)하기 위한 사용자 입력을 수신할 수 있고, 사용자 입력에 따른 입력 신호를 발생할 수 있다.
터치스크린(430)은 입력 기능과 표시 기능을 동시에 수행할 수 있는 입출력 장치를 나타낼 수 있다. 다양한 실시 예들에 따라, 터치스크린(430)은 디스플레이(431)(예: 도 1 또는 도 2의 디스플레이(160, 260))와 터치감지부(433)를 포함할 수 있다. 터치스크린(430)은 전자 장치(400)와 사용자 사이에 입출력 인터페이스를 제공할 수 있다. 예를 들면, 터치스크린(430)은 사용자의 터치 입력을 전자 장치(400)에게 전달할 수 있고, 또한 전자 장치(400)로부터의 출력을 사용자에게 보여주는 매개체 역할을 포함할 수 있다. 터치스크린(430)은 사용자에게 시각적인 출력(visual output)을 보여줄 수 있다. 시각적인 출력은 텍스트(text), 그래픽(graphic), 비디오(video)와 이들의 조합의 형태로 나타날 수 있다.
디스플레이(431)는 전자 장치(400)에서 처리되는 다양한 정보를 표시(출력)할 수 있다. 예를 들어, 디스플레이(431)는 전자 장치(400)의 사용과 관련된 다양한 유저 인터페이스(UI, user interface) 또는 그래픽 유저 인터페이스(GUI, graphical UI)를 표시 할 수 있다. 다양한 실시 예들에 따라, 디스플레이(431)는 음성 명령을 처리할 수 있는 음성 인식 구간(또는 기간) 동안 활성화(또는 타임아웃) 상태 여부를 사용자에게 피드백(feedback) 하기 위한 다양한 화면 구성을 제공할 수 있다. 디스플레이(431)는 다양한 디스플레이(예: 도 1의 디스플레이(160))가 사용될 수 있다. 다양한 실시 예들에서 디스플레이(431)는 커브드 디스플레이가 사용될 수 있다.
터치감지부(433)는 디스플레이(431)에 안착될 수 있으며, 터치스크린(430) 표면에 접촉 또는 근접하는 사용자 입력을 감지할 수 있다. 사용자 입력은 싱글터치(single-touch), 멀티터치(multi-touch), 호버링(hovering), 또는 에어 제스처 중 적어도 하나에 기반하여 입력되는 터치 입력 또는 근접 입력을 포함할 수 있다. 터치감지부(433)는 다양한 실시 예들에서 전자 장치(400)의 사용과 관련된 다양한 동작을 개시하기 위한 사용자 입력을 수신할 수 있고, 사용자 입력에 따른 입력 신호를 발생할 수 있다. 터치감지부(433)는 디스플레이(431)의 특정 부위에 가해진 압력 또는 디스플레이(431)의 특정 부위에 발생하는 정전 용량 등의 변화를 전기적인 입력 신호로 변환하도록 구성될 수 있다. 터치감지부(433)는 입력 도구(예: 사용자 손가락, 전자 펜 등)가 디스플레이(431)의 표면 상에 터치 또는 근접되는 위치 및 면적을 검출할 수 있다. 또한 터치감지부(433)는 적용한 터치 방식에 따라 터치 시의 압력(예: 포스 터치)까지도 검출할 수 있도록 구현될 수 있다
오디오 처리부(440)는, 예를 들면, 도 2의 오디오 모듈(280)과 동일 또는 유사한 구성을 가질 수 있다. 오디오 처리부(440)는 프로세서(480)로부터 입력 받은 오디오 신호를 스피커(SPK, speaker)(441)로 전송하고, 마이크(MIC, microphone)(443)로부터 입력 받은 음성 등의 오디오 신호를 프로세서(480)에 전달하는 기능을 수행할 수 있다. 오디오 처리부(440)는 음성/음향 데이터를 프로세서(480)의 제어에 따라 스피커(441)를 통해 가청음으로 변환하여 출력하고, 마이크(443)로부터 수신되는 음성 등의 오디오 신호를 디지털 신호로 변환하여 프로세서(480)에게 전달할 수 있다.
스피커(441)는 무선 통신부(410)로부터 수신되거나, 또는 메모리(450)에 저장된 오디오 데이터를 출력할 수 있다. 스피커(441)는 전자 장치(400)에서 수행되는 다양한 동작(기능)과 관련된 음향 신호를 출력할 수도 있다.
마이크(443)는 외부의 음향 신호를 입력 받아 전기적인 음성 데이터로 처리할 수 있다. 마이크(443)에는 외부의 음향 신호를 입력 받는 과정에서 발생되는 잡음(noise)을 제거하기 위한 다양한 잡음 제거 알고리즘(noise reduction algorithm)이 구현될 수 있다. 마이크(443)는 음성 명령(예: 음성 인식 기능 등의 활성화/비활성화를 제어하기 위한 음성 명령 등) 등과 같은 오디오 스트리밍(audio streaming)의 입력을 담당할 수 있다.
메모리(450)(예: 도 1 또는 도 2의 메모리(130, 230))는 프로세서(480)에 의해 실행되는 하나 또는 그 이상의 프로그램들(one or more programs)을 저장할 수 있고, 입/출력되는 데이터들의 임시 저장(예: 버퍼링(buffering))을 위한 기능을 수행할 수도 있다. 입/출력되는 데이터들은, 예를 들면, 동영상, 이미지, 사진, 또는 오디오 등을 포함할 수 있다. 메모리(450)는 획득된 데이터를 저장하는 역할을 담당하며, 실시간으로 획득된 데이터는 일시적인 저장 장치(예: 버퍼)에 저장할 수 있고, 저장하기로 확정된 데이터는 오래 보관 가능한 저장 장치에 저장할 수 있다.
메모리(450)는 음성 호출 명령어에 따라 웨이크-업 하여 음성 명령을 처리하는 음성 인식 기능 등을 실행하는 것과 관련되는 하나 또는 그 이상의 프로그램들과 데이터를 저장할 수 있다. 다양한 실시 예들에 따라, 메모리(450)는 프로세서(480)가, 음성 호출 명령어의 감지에 기반하여 웨이크-업(wake-up) 하고, 음성 호출 명령어의 인식에 관련된 스코어를 산출하고, 스코어를 외부 장치와 공유하고, 외부 장치와 연동에 의해, 스코어에 대응하여 음성 명령의 처리 여부를 판단하고, 판단하는 결과에 기반하여 음성 명령을 처리하도록 하는 것과 관련되는 하나 또는 그 이상의 프로그램들, 데이터 또는 인스트럭션들(instructions)을 저장할 수 있다. 다양한 실시 예들에 따라, 메모리(450)는 프로세서(480)가, 사용자와의 거리, 전자 장치(400)의 환경(예: 소음 등), 전자 장치(400)의 위치(예: 공간적 또는 지리적 위치), 전자 장치(400)의 도메인, 또는 음성 인식률에 적어도 일부 기반하여 스코어를 산출하도록 하는 것과 관련되는 하나 또는 그 이상의 프로그램들, 데이터 또는 인스트럭션들을 저장할 수 있다.
메모리(450)는 확장 메모리(예: 도 2의 외장 메모리(234)) 또는 내부 메모리(예: 도 2의 내장 메모리(232))를 포함할 수 있다. 전자 장치(400)는 인터넷 상에서 메모리(450)의 저장 기능을 수행하는 웹 스토리지(web storage)와 관련되어 동작할 수도 있다.
메모리(450)는 하나 또는 그 이상의 소프트웨어(또는 소프트웨어 모듈)를 저장할 수 있다. 예를 들어, 소프트웨어 구성요소는 운영 체제(operating system) 소프트웨어 모듈, 통신 소프트웨어 모듈, 그래픽 소프트웨어 모듈, 유저 인터페이스 소프트웨어 모듈, MPEG(moving picture experts group) 모듈, 카메라 소프트웨어 모듈, 또는 하나 이상의 어플리케이션 소프트웨어 모듈 등을 포함할 수 있다. 또한 소프트웨어 구성요소인 모듈은 명령어들의 집합으로 표현할 수 있으므로, 모듈을 명령어 세트(instruction set)라고 표현하기도 한다. 모듈은 또한 프로그램으로 표현하기도 한다. 다양한 실시 예들에서, 메모리(430)는 앞서 기술한 모듈 이외에 추가적인 모듈(명령어들)을 포함할 수 있다. 또는 필요에 따라, 일부의 모듈(명령어들)을 사용하지 않을 수도 있다.
운영 체제 소프트웨어 모듈은 일반적인 시스템 동작(system operation)을 제어하는 여러 가지의 소프트웨어 구성요소를 포함할 수 있다. 일반적인 시스템 작동의 제어는, 예를 들면, 메모리 관리 및 제어, 저장 하드웨어(장치) 제어 및 관리, 또는 전력 제어 및 관리 등을 의미할 수 있다. 또한 운영 체제 소프트웨어 모듈은 여러 가지의 하드웨어(장치)와 소프트웨어 구성요소(모듈) 사이의 통신을 원활하게 하는 기능도 수행할 수 있다.
통신 소프트웨어 모듈은 통신 모듈(예: 무선 통신부(410), 통신 모듈(220)) 또는 인터페이스(예: 인터페이스부(460), 인터페이스(270))를 통해 웨어러블 장치, 스마트폰, 컴퓨터, 서버, 텔레비전, 모니터, 사물 인터넷(IoT, internet of things) 장치 또는 휴대용 단말기 등 다른 전자 장치와 통신을 가능하게 할 수 있다. 그리고, 통신 소프트웨어 모듈은 해당 통신 방식에 해당하는 프로토콜 구조로 구성될 수 있다.
그래픽 소프트웨어 모듈은 디스플레이(예: 디스플레이(431), 디스플레이(260)) 상에 그래픽(graphics)을 제공하고 표시하기 위한 여러 가지 소프트웨어 구성요소를 포함할 수 있다. 다양한 실시 예들에서, 그래픽이란 용어는 텍스트(text), 웹 페이지(web page), 아이콘(icon), 디지털 이미지(digital image), 비디오(video), 애니메이션(animation) 등을 포함하는 의미로 사용될 수 있다.
유저 인터페이스 소프트웨어 모듈은 유저 인터페이스(UI)에 관련한 여러 가지 소프트웨어 구성요소를 포함할 수 있다. 예를 들어, 유저 인터페이스의 상태가 어떻게 변경되는지 또는 유저 인터페이스 상태의 변경이 어떤 조건에서 이루어지는지 등에 대한 내용을 포함할 수 있다.
MPEG 모듈은 디지털 콘텐츠(예: 비디오, 오디오) 관련 프로세스 및 기능들(예: 콘텐츠의 생성, 재생, 배포 및 전송 등)을 가능하게 하는 소프트웨어 구성요소를 포함할 수 있다.
카메라 소프트웨어 모듈은 카메라 관련 프로세스 및 기능들을 가능하게 하는 카메라 관련 소프트웨어 구성요소를 포함할 수 있다.
어플리케이션 모듈은 렌더링 엔진(rendering engine)을 포함하는 웹브라우저(web browser), 이메일(email), 즉석 메시지(instant message), 워드 프로세싱(word processing), 키보드 에뮬레이션(keyboard emulation), 어드레스 북(address book), 터치 리스트(touch list), 위젯(widget), 디지털 저작권 관리(DRM, digital right management), 홍채 인식(iris scan), 상황 인지(context cognition), 음성 인식(voice recognition), 위치 결정 기능(position determining function), 위치기반 서비스(location based service) 등을 포함할 수 있다.
메모리(450)는, 다양한 실시 예들에 따른 방법을 프로세서(480)에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 판독 가능한 기록 매체를 포함할 수 있다.
다양한 실시 예들에 따라, 컴퓨터로 판독 가능한 기록 매체는, 예를 들면, 음성 호출 명령어의 감지에 기반하여 웨이크-업(wake-up) 하고, 음성 호출 명령어의 인식에 관련된 스코어를 산출하고, 스코어를 외부 장치와 공유하고, 외부 장치와 연동에 의해, 스코어에 대응하는 음성 명령의 수행 여부를 판단하고, 판단하는 결과에 기반하여 음성 명령에 대응하는 기능을 처리하는 동작을 실행시키기 위한 프로그램을 기록한 컴퓨터로 판독 가능한 기록 매체를 포함할 수 있다.
인터페이스부(460)는, 예를 들면, 도 2의 인터페이스(270)와 동일 또는 유사한 구성을 가질 수 있다. 인터페이스부(460)는 다른 전자 장치로부터 데이터를 전송 받거나, 전원을 공급받아 전자 장치(400) 내부의 각 구성들에 전달할 수 있다. 인터페이스부(460)는 전자 장치(400) 내부의 데이터가 다른 전자 장치로 전송되도록 할 수 있다. 예를 들어, 유/무선 헤드폰 포트(port), 외부 충전기 포트, 유/무선 데이터 포트, 메모리 카드(memory card) 포트, 오디오 입/출력(input/output) 포트, 비디오 입/출력 포트, 이어폰 포트 등이 인터페이스부(460)에 포함될 수 있다.
카메라 모듈(470)(예: 도 2의 카메라 모듈(291))은 전자 장치(400)의 촬영 기능을 지원하는 구성을 나타낸다. 카메라 모듈(470)은 프로세서(480)의 제어에 따라 임의의 피사체를 촬영하고, 촬영된 데이터(예: 이미지)를 디스플레이(431) 및 프로세서(480)에 전달할 수 있다.
다양한 실시 예들에 따라, 카메라 모듈(470)은, 예를 들면, 칼라 정보를 획득하기 위한 제1 카메라(예: 칼라(RGB) 카메라)와 깊이 정보(depth information)(예: 피사체의 위치 정보, 거리 정보)를 획득하기 위한 제2 카메라(예: 적외선(IR, infrared) 카메라)를 포함할 수 있다. 카메라 모듈(470)은 이미지 센서를 포함할 수 있다. 이미지 센서는 CCD(charged coupled device) 또는 CMOS(complementary metal-oxide semiconductor)로 구현될 수 있다. 한 실시 예에 따라, 제1 카메라는 전자 장치(400)의 전면에 구비되는 전면 카메라일 수 있다. 다양한 실시 예들에 따라, 전면 카메라는 제2 카메라에 의해 대체될 수 있고, 전자 장치(400)의 전면에서 구비되지 않을 수 있다. 다양한 실시 예들에 따라, 제1 카메라는 제2 카메라와 함께 전자 장치(400)의 전면에 함께 배치될 수 있다. 한 실시 예에 따라, 제1 카메라는 전자 장치(400)의 후면에 구비되는 후면 카메라일 수 있다. 한 실시 예에 따라, 제1 카메라는 전자 장치(400)의 전면과 후면에 각각 구비되는 전면 카메라 및 후면 카메라를 모두 포함하는 형태일 수 있다.
프로세서(480)(예: 제어 회로)는 전자 장치(400)의 전반적인 동작을 제어할 수 있다. 다양한 실시 예들에서 프로세서(480)는, 예를 들면, 도 1의 프로세서(120) 또는 도 2의 프로세서(210)와 동일 또는 유사한 구성을 가질 수 있다.
다양한 실시 예들에 따라, 프로세서(480)는 음성 호출 명령어의 감지에 기반하여 웨이크-업(wake-up) 하는 동작, 음성 호출 명령어의 인식에 관련된 스코어를 산출하는 동작, 스코어를 외부 장치와 공유하는 동작, 외부 장치와 연동에 의해, 스코어에 대응하는 음성 명령의 수행 여부를 판단하는 동작, 판단하는 결과에 기반하여 음성 명령에 대응하는 기능을 수행하는 동작을 처리할 수 있다. 다양한 실시 예들에 따르면, 프로세서(480)는 사용자와의 거리, 전자 장치(400)의 환경, 전자 장치(400)의 위치, 전자 장치(400)의 도메인, 또는 음성 인식률에 적어도 일부 기반하여 스코어를 산출하는 동작, 산출된 스코어를 외부 장치(예: 다른 전자 장치, 서버)에 전송하는 동작, 외부 장치로부터 스코어 기반하여 결정된 응답을 수신하는 동작, 수신된 응답에 기반하여 음성 명령의 수행 여부를 결정하는 동작을 처리할 수 있다.
다양한 실시 예들에 따라, 프로세서(480)는 전자 장치(400)의 동작을 제어하기 위한 하나 또는 그 이상의 프로세서들을 포함할 수 있다. 예를 들면, 프로세서(480)는 커뮤니케이션 프로세서(CP), 어플리케이션 프로세서(AP), 인터페이스(예: GPIO, general purpose input/output), 또는 내부 메모리 등을 별개의 구성요소로 포함하거나, 또는 하나 이상의 집적화된 회로에 집적화될 수 있다. 한 실시 예에 따라, 어플리케이션 프로세서는 여러 가지의 소프트웨어 프로그램(software program)을 실행하여 전자 장치(400)를 위한 여러 기능을 수행할 수 있고, 커뮤니케이션 프로세서는 음성 통신 및 데이터 통신을 위한 처리 및 제어를 수행할 수 있다. 프로세서(480)는 메모리(450)에 저장되어 있는 특정한 소프트웨어 모듈(예: 명령어 세트(instruction set))을 실행하여 그 모듈에 대응하는 특정한 여러 가지의 기능을 수행하는 역할을 담당할 수 있다.
다양한 실시 예들에서 프로세서(480)는 오디오 처리부(440), 인터페이스부(460), 디스플레이(431), 카메라 모듈(470) 등의 하드웨어적 모듈의 동작을 제어할 수 있다. 본 발명의 다양한 실시 예들에 따른 프로세서(480)의 제어(또는 처리) 동작은 후술하는 도면들을 참조하여 구체적으로 설명된다.
다양한 실시 예들에 따르면, 프로세서(480)는 메모리(450)에 저장되는 하나 또는 그 이상의 프로그램들을 실행하여 전자 장치(400)의 동작을 제어하는 하나 또는 그 이상의 프로세서들(one or more processors)로 구현될 수 있다. 다양한 실시 예들에 따라, 프로세서(480)는 전자 장치(400)의 디스플레이(431) 및 메모리(450)와 전기적으로 또는 기능적으로 연결될 수 있다.
전원 공급부(490)는 프로세서(480)의 제어에 의해 외부의 전원, 내부의 전원을 인가 받아 각 구성 요소들의 동작에 필요한 전원을 공급할 수 있다. 다양한 실시 예들에서 전원 공급부(490)는 프로세서(480)의 제어에 의해 무선 통신부(410), 디스플레이(431), 카메라 모듈(470) 등에 전원을 공급 또는 차단(on/off)할 수 있다. 다양한 실시 예들에 따라, 전원 공급부(490)는, 예를 들면, 배터리 제어 회로를 포함할 수 있다. 예를 들면, 전원 공급부(490)는 배터리(예: 충전식 전지(rechargeable battery) 및/또는 태양 전지(solar battery)), 배터리 잔량 측정 회로(예: fuel gauge), 전력관리 집적회로(예: PMIC, power management integrated circuit), 충전 회로, 승압 회로(예: booster circuit) 등을 포함하여 구성할 수 있다.
도 5a, 도 5b 및 도 5c는 본 발명의 다양한 실시 예들에 따른 전자 장치에서 음성 명령을 처리하기 위한 구성요소가 구현되는 예시를 도시하는 도면들이다.
도 5a, 도 5b 및 도 5c를 참조하면, 도 5a, 도 5b 및 도 5c는 다양한 실시 예들에 따른 전자 장치(400)에서 음성 명령 처리와 관련된 동작을 처리하기 위한 프로세서가 구현되는 예를 나타낼 수 있다. 예를 들면, 다양한 실시 예들에서, 프로세서(480)는 음성 호출 명령어를 인식하는 것과 관련된 제1 프로세서(510)와 웨이크-업 후 음성(예: 후속 명령어) 인식 및 해당 음성 명령에 관련된 전반적인 동작을 처리하는 것과 관련된 제2 프로세서(540)를 포함하여 구성할 수 있다.
도 5a에 도시한 바와 같이, 다양한 실시 예들에 따르면, 제1 프로세서(510)는 전자 장치(400)가 슬립 상태 또는 동작 상태에서, 음성 호출 명령어를 인식하기 위한 모듈을 포함할 수 있다. 한 실시 예에 따르면, 제1 프로세서(510)는 웨이크-업 처리부(530)(예: 웨이크-업 엔진(wake-up engine))를 포함할 수 있다.
다양한 실시 예들에 따르면, 제2 프로세서(520)는 제1 프로세서(510)의 음성 호출 명령어에 의한 웨이크-업 감지에 응답하여, 웨이크-업 될 수 있다. 제2 프로세서(520)는 제1 프로세서(510)에 의해 웨이크-업 된 이후, 음성 인식을 수행하기 위한 모듈을 포함할 수 있다. 한 실시 예에 따르면, 제2 프로세서(520)는 후속 명령어 인식부(540)(예: 음성 인식 엔진, ASR(Automatic Speech Recognition))를 포함할 수 있다.
다양한 실시 예들에 따라, 제1 프로세서(510)는 음성 호출 명령어를 인식할 수 있도록 활성화 상태로 설정될 수 있고, 제2 프로세서(510)는 제1 프로세서(510)의 음성 호출 명령어 감지에 기반하여, 제1 프로세서(510)에 의해 웨이크-업 될 수 있다.
도 5b에 도시한 바와 같이, 다양한 실시 예들에 따르면, 제1 프로세서(510)는 웨이크-업 처리부(530)에 기반하여 음성 호출 명령어를 인식할 수 있다. 제2 프로세서(520)는 음성 명령에 관련된 동작을 처리하고, 전자 장치(400)는 후속 명령어를 인식하기 위한 칩(예: 후속 명령어 인식부(540))을 별도로 포함할 수 있다.
다양한 실시 예들에 따라, 후속 명령어 인식부(540)는 제1 프로세서(510)(예: 웨이크-업 처리부(530))의 음성 호출 명령어 인식에 기반하여 웨이크-업 되어, 후속 명령어를 인식하도록 동작할 수 있다. 제2 프로세서(520)는 제1 프로세서(510) 또는 후속 명령어 인식부(540)에 의해 웨이크-업 되어, 음성 명령과 관련된 동작을 처리할 수 있다. 한 실시 예에 따르면, 제2 프로세서(520)는 후속 명령어 인식부(540)의 웨이크-업에 순차적으로 또는 병렬적으로 웨이크-업 할 수 있다. 제2 프로세서(520)는 도 2의 프로세서(210) 또는 도 4의 프로세서(480)와 동일 또는 유사한 구성을 가질 수 있다. 한 실시 예에 따르면, 제2 프로세서(520)는 어플리케이션 프로세서(AP)로 구현할 수 있다.
예를 들면, 프로세서(480)는, 음성 호출 명령어를 인식하기 위한 제1 프로세서(510)(예: 웨이크-업 처리부(530)), 후속 명령어를 인식하기 위한 제3 프로세서(예: 후속 명령어 인식부(540)), 후속 명령어와 관련된 전반적인 처리를 위한 제2 프로세서(520)로 구현할 수 있다. 한 실시 예에 따르면, 제1 프로세서(510)와 후속 명령어 인식부(540)는 음성 인식(예: 음성 호출 명령어, 후속 명령어)과 관련된 동작을 처리할 수 있는 별도의 칩(예: wake-up engine, ASR engine)으로 구현될 수 있고, 제2 프로세서(520)는 음성 명령의 인식에 기반하여 음성 명령에 대응하는 기능을 수행하는 것과 관련된 동작을 처리할 수 있다.
도시하지는 않았지만, 다양한 실시 예들에 따르면, 제2 프로세서(520)는, 음성 호출 명령어에 대한 인식 스코어를 산출하기 위한 스코어 처리부(미도시), 스코어를 외부 장치(예: 다른 전자 장치, 서버)에 공유하기 위한 공유 처리부(미도시), 수집된 정보(예: 스코어, 음성 인식 결과 등)에 기반하여 음성 명령의 수행 여부를 결정(또는 판단)하기 위한 명령 판단부(미도시) 등을 포함할 수 있다.
도 5c에 도시한 바와 같이, 다양한 실시 예들에 따르면, 음성 호출 명령어를 인식하기 위한 제1 프로세서(510)와 후속 명령어를 인식하기 위한 제2 프로세서(520)의 기능은 하나의 프로세서에 의해 구현될 수도 있다. 예를 들면, 제1 프로세서(510)에 웨이크-업 처리부(530)와 후속 명령어 인식부(540)를 포함할 수 있다. 제2 프로세서(520)는 제1 프로세서(510)에 기반하여 웨이크-업 후, 음성 명령과 관련된 동작을 처리할 수 있다.
도시하지는 않았지만, 다양한 실시 예들에 따르면, 후속 명령어를 인식하기 위한 후속 명령어 인식부(540)를 별도로 구현(또는 추가)하지 않고, 하나의 음성 인식 엔진(예: 제1 프로세서(510) 또는 웨이크-업 처리부(530))에 의해 음성 호출 명령어와 후속 명령어를 인식할 수 있도록 구현할 수도 있다.
다양한 실시 예들에 따르면, 음성 호출 명령어를 인식하는 제1 프로세서(510)와, 제1 프로세서(510)의 음성 호출 명령어 인식에 기반하여 웨이크-업된 후 후속 명령어를 인식하기 위한 제2 프로세서(520)의 전술한 바와 같은 다양한 구현은, 전자 장치(400)의 장치 타입(또는 특성)에 따라 구분되거나 통합될 수 있다. 예를 들면, 소비 전력(power consumption)에 의한 장치 타입에 따라, 제1 프로세서(510)와 제2 프로세서(520)를 독립적으로 구현하거나, 하나의 칩 형태로 구현할 수 있다.
한 실시 예에 따르면, 전자 장치(400)가, 예를 들면, 냉장고, 에어컨, 텔레비전 등과 같이 항시 전원이 연결되는 장치인 경우, 후속 명령어 처리를 위한 별도의 칩(chip)(예: 제2 프로세서(520))의 추가 없이, 하나의 프로세서에 의해 구현할 수 있다.
한 실시 예에 따르면, 전자 장치(400)가, 예를 들면, 자동차 인포테인먼트 장치 등과 같이 고용량 배터리를 사용하는 장치인 경우, 후속 명령어 처리를 위한 별도의 칩의 추가 없이, 하나의 프로세서에 의해 구현할 수 있다.
한 실시 예에 따르면, 전자 장치(400)가, 예를 들면, 스마트폰, 와치, 블루투스 스피커 등과 같이 저전력 배터리를 사용하는 장치인 경우, 제1 프로세서(510) 외에 명령어 인식이 가능한 저전력 칩(예: 제2 프로세서(520))을 추가할 수 있다. 또는, 다양한 실시 예들에 따라, 전자 장치(400)가 하나의 저전력 칩(예: 제1 프로세서(510) 또는 제2 프로세서(520))을 사용하되, 음성 호출 명령어와 명령어를 모두 인식이 가능하도록 설계할 수도 있다.
도 6은 본 발명의 다양한 실시 예들에 따른 전자 장치의 예시를 도시하는 도면이다.
도 6을 참조하면, 다양한 실시 예들에서, 전자 장치(400)는, 음성 인식과 관련된 구성 및 마이크를 포함하는 다양한 장치를 포함할 수 있다. 다양한 실시 예들에서, 전자 장치(400)는, 마이크를 통해 사용자 발화에 따른 음성을 입력 받아 음성 명령과 관련된 기능을 실행할 수 있는 다양한 형태의 장치를 포함할 수 있다. 예를 들면, 전자 장치(400)는, 스마트폰(610), 컴퓨터(620)(예: 개인용 컴퓨터, 노트북 등), 블루투스 스피커(630), 사물 인터넷 장치(640), 텔레비전(650), 또는 냉장고(660) 등을 포함할 수 있다. 도시하지는 않았으나, 다양한 실시 예들에 따른 전자 장치(400)는, 전술한 구성 외에도, 태블릿 PC, 자동차 인포테인먼트 장치, 세탁기, 에어컨 등 다양한 장치에 의해 구현될 수 있다.
다양한 실시 예들에 따라, 복수의 전자 장치들(610, 620, 630, 640, 650, 660)은, 동일하거나, 또는 다른 음성 호출 명령어가 등록(또는 설정)될 수 있다. 다양한 실시 예들에서는, 복수의 전자 장치들(610, 620, 630, 640, 650, 660)이 동일한 음성 호출 명령어가 설정된 경우를 예로 설명한다. 한 실시 예에 따르면, 복수의 전자 장치들(610, 620, 630, 640, 650, 660)에, “하이(hi)”, “헬로(hello),“하이 ABC” 등과 같이 특정 웨이크-업 워드가 동일하게 설정될 수 있다. 다양한 실시 예들에서, “ABC”는, 예를 들면, 전자 장치(또는 전자 장치의 에이전트(agent)(또는 인공 지능(AI, artificial intelligence))의 이름(name)을 나타낼 수 있다. 예를 들면, 갤럭시(galaxy) 등과 같이 부여되는 이름을 나타낼 수 있다.
다양한 실시 예들에 따라, 전자 장치들(610, 620, 630, 640, 650, 660)은 사용자의 음성 호출 명령어를 인식할 수 있는 상태로 설정되어 있을 수 있다. 예를 들면, 전자 장치들(610, 620, 630, 640, 650, 660)은 사용자의 음성 호출 명령어에 기반하여 대체적으로 동시에 웨이크-업 하여, 음성 명령의 수신을 대기하는 상태로 활성화될 수 있다. 한 실시 예에 따라, 전자 장치들(610, 620, 630, 640, 650, 660)은 마이크를 통해 오디오 입력을 수신하는 상태일 수 있고, 오디오 입력에서, 웨이크-업 엔진(예: 제1 프로세서(510))에 의해 음성 호출 명령어를 검출할 수 있고, 웨이크-업 엔진에 의해 음성 인식 엔진(예: 제2 프로세서(520))이 웨이크-업 될 수 있다. 음성 인식 엔진은 웨이크-업에 따라 사용자(600)의 발화에 대한 음성 신호(음성 명령)를 입력 받고, 음성 인식을 수행할 수 있다.
다양한 실시 예들에 따라, 전자 장치들(610, 620, 630, 640, 650, 660)은 사용자(600)의 계정(account)에 기반하여 하나의 그룹으로 설정될 수 있다. 예를 들면, 아래 <표 1>의 예시와 같이, 전자 장치들(610, 620, 630, 640, 650, 660)은 동일한 계정(예: samsung@samsung.com)으로 그룹화 될 수 있다. 전자 장치들(610, 620, 630, 640, 650, 660)의 계정과 그룹화에 관련된 정보는, 각 전자 장치들(610, 620, 630, 640, 650, 660) 및/또는 서버(예: 삼성 서버, 클라우드 서버 등)에 음성 명령 처리와 관련된 정보로서 미리 등록 될 수 있다. 예를 들면, 관련 정보(이하, 서비스 정보)는, 계정, 장치 정보(카테고리), 스코어, 도메인 등을 포함하여 등록될 수 있다.
계정 카테고리 이름
(닉네임, 장치 식별자)
스코어 도메인 (command)
제1 계정 Phone 갤럭시 XXX 전화
메시지
음악
...
TV 보르도 XXX 채널
볼륨
음악
...
냉장고 지펠 XXX 레시피
온도조절
날씨
...
... ... ... ...
제2 계정 ... ... ... ...
다양한 실시 예들에 따르면, 전자 장치들(610, 620, 630, 640, 650, 660)은 동일 계정(예: 제1 계정, 제2 계정)으로 그룹화 될 수 있고, 해당 계정에 기반하여 서버와 연결되어, 서버로부터 응답을 받을 수 있는 대기 상태로 설정될 수 있다. 다양한 실시 예들에 따르면, 전자 장치들(610, 620, 630, 640, 650, 660)은 동일한 계정으로 그룹화 되어, 서로 간에 연결되어, 다른 전자 장치로부터 응답을 받을 수 있는 대기 상태로 설정될 수 있다.
다양한 실시 예들에 따르면, 전자 장치들(610, 620, 630, 640, 650, 660)은 동일 계정 내에서 각 장치의 고유한 이름(예: 닉네임, 장치 식별자)에 기반하여 식별될 수 있다.
다양한 실시 예들에 따르면, 전자 장치들(610, 620, 630, 640, 650, 660)은 각각, 자신들이 수행 가능한 도메인 리스트(domain list)를 포함할 수 있다. 예를 들면, 전자 장치들(610, 620, 630, 640, 650, 660)은 수행 가능한 기능들에 기반하여 도메인 리스트가 설정될 수 있다. 다양한 실시 예들에서, 도메인(domain)은 전자 장치들(610, 620, 630, 640, 650, 660)이 음성 명령에 의해 수행 가능한 기능 또는 태스크(task)를 나타낼 수 있다. 한 실시 예에 따르면, Phone의 경우 전화, 메시지, 음악 등의 도메인이 설정될 수 있다. 한 실시 예에 따르면, TV의 경우 채널, 볼륨, 음악 등의 도메인이 설정될 수 있다. 한 실시 예에 따르면, 냉장고의 경우 레시피, 온도조절, 날씨 등의 도메인이 설정될 수 있다.
다양한 실시 예들에 따르면, 전자 장치들(610, 620, 630, 640, 650, 660)은 음성 호출 명령어를 인식하는 시점에서, 순차적으로 또는 병렬적으로, 음성 호출 명령어에 대한 인식 스코어(recognition score)를 산출할 수 있다. 한 실시 예에 따르면, 전자 장치들(610, 620, 630, 640, 650, 660)은 서버와 연계하여 음성 명령을 처리하는 방식에서는, 인식된 스코어를 서버에 전달할 수 있다. 한 실시 예에 따르면, 전자 장치들(610, 620, 630, 640, 650, 660)은 서버와 연계하지 않고 전자 장치에 기반하여 음성 명령을 처리하는 방식에서는, 인식된 스코어를 동일 계정 내의 다른 전자 장치에 전달하여 서로 공유할 수 있다.
다양한 실시 예들에서, 스코어(score)는, 전자 장치들(610, 620, 630, 640, 650, 660)이 사용자(600)의 음성 호출 명령어에 대해 인식하는 인식률을 나타내며, 다양한 상황을 고려하여 산출될 수 있다. 예를 들면, 스코어는 아래 <수학식 1>의 예시와 같이 산출되는 것으로 가정할 수 있다.
Figure pat00001
<수학식 1>을 참조하면, “O”는 관측 특징 시퀀스(observation feature sequence)를 나타내고, “λ”는 인식 모델(recognition model, 또는 recognition word model)을 나타내고, “Th”는 임계값(threshold)을 나타내며, “p(O│λ)”는 인식 스코어를 나타낼 수 있다. 한 실시 예에 따르면, 인식 모델을 나타내는 “λ”는 HMM(hidden Markov model), ANN(artificial neural network) 등이 이용될 수 있다.
다양한 실시 예들에 따르면, 스코어는 사용자(600)와 전자 장치들(610, 620, 630, 640, 650, 660) 간의 다양한 정보(예: 거리 정보, 주변 환경 정보(예: 소음 정보) 등)에 기반하여 산출될 수 있다. 이에 대해, 후술하는 도면을 참조하여 설명된다.
다양한 실시 예들에 따르면, 전자 장치들(610, 620, 630, 640, 650, 660)은 사용자의 각 계정 별로 그룹화 될 수 있다. 예를 들면, <표 1>의 예시와 같이 제1 계정에 의해 Phone, TV, 냉장고 등이 하나의 그룹으로 설정될 수 있고, 제2 계정에 의해 다른 전자 장치들이 다른 하나의 그룹으로 설정될 수 있다. 다양한 실시 예들에 따르면, 사용자는 계정 별로 다른 음성 호출 명령어를 설정하여, 그룹 별 전자 장치들을 제어할 수 있다.
다양한 실시 예들에 따르면, 전자 장치들(610, 620, 630, 640, 650, 660) 각각, 또는 서버는 동일 계정으로 연결된 전자 장치들의 세션(session) 중, 각 계정 별로 그룹화된 계정 내의 장치 이름(닉네임), 수행 가능한 도메인 리스트, 음성 호출 명령어 인식에 대한 스코어 정보 등을 관리 및 사용할 수 있다. 이에 대해, 후술하는 도면들을 참조하여 상세히 설명된다.
다양한 실시 예들에서, 각각의 전자 장치들(610, 620, 630, 640, 650, 660)은 서로 연결될 수 있다. 예를 들면, 다양한 실시 예들에서, 전자 장치들(610, 620, 630, 640, 650, 660)은 무선 통신(예: 블루투스, 저전력 블루투스(BLE), WiFi 등)에 기반하여 다른 전자 장치와 연결될 수 있다. 다양한 실시 예들에서, 전자 장치들(610, 620, 630, 640, 650, 660)은 다른 전자 장치와 무선 통신을 연결하고, 다른 전자 장치들과 음성 명령 처리와 관련된 다양한 정보(예: 스코어 정보)를 교환할 수 있다. 한 실시 예에 따르면, 전자 장치(400)는 자신이 산출한 스코어를 다른 전자 장치에 전송하고, 다른 전자 장치로부터 다른 전자 장치에 의해 산출된 스코어를 수신할 수 있다. 다양한 실시 예들에 따라, 전자 장치(400)가 스코어 교환에 기반하여 음성 명령을 처리하는 것과 관련된 다양한 예시들에 대하여 후술하는 도면들을 참조하여 상세히 설명된다.
다양한 실시 예들에 따르면, 전자 장치들(610, 620, 630, 640, 650, 660)은 무선 통신으로 직접 연결될 수 있다. 다양한 실시 예들에 따라, 전자 장치들(610, 620, 630, 640, 650, 660)은 공통으로 접속되는 액세스 포인트(AP, access point)를 통해 연결될 수도 있다.
이상에서 살펴본 바와 같이, 본 발명의 다양한 실시 예들에 따른 전자 장치는, 마이크, 메모리, 및 상기 마이크 및 상기 메모리와 기능적으로 연결된 프로세서를 포함하고, 상기 프로세서는, 음성 호출 명령어의 감지에 기반하여 웨이크-업(wake-up) 하고, 상기 음성 호출 명령어의 인식에 관련된 스코어를 산출하고, 상기 스코어를 외부 장치와 공유하고, 상기 스코어에 기반하여 음성 명령의 수행 여부를 판단하고, 및 상기 판단하는 결과에 기반하여 음성 명령을 처리하도록 구성할 수 있다.
다양한 실시 예들에 따라, 상기 프로세서는, 음성 호출 명령어를 인식하기 위한 제1 프로세서, 및 상기 제1 프로세서의 음성 호출 명령어 감지에 기반하여 웨이크-업 하고, 음성 인식 및 음성 명령에 관련된 동작을 처리하기 위한 제2 프로세서를 포함하도록 구성할 수 있다.
다양한 실시 예들에 따라, 상기 프로세서는, 사용자와의 거리, 전자 장치의 환경, 전자 장치의 위치, 전자 장치의 도메인, 또는 음성 인식률에 적어도 일부 기반하여 상기 스코어를 산출하도록 구성할 수 있다.
다양한 실시 예들에 따라, 상기 프로세서는, 상기 산출된 스코어를 상기 외부 장치에 전송하고, 상기 외부 장치로부터 상기 스코어 기반하여 결정된 응답을 수신하고, 및 상기 수신된 응답에 기반하여 상기 음성 명령의 처리 여부를 결정하도록 구성할 수 있다.
다양한 실시 예들에 따라, 상기 프로세서는, 상기 외부 장치로부터의 응답이, 음성 명령을 처리하도록 지시하는 제1 응답이면, 상기 음성 명령을 처리하고, 및 상기 외부 장치로부터의 응답이, 대기 상태로 전환하도록 지시하는 제2 응답이면, 대기 상태로 전환하도록 구성할 수 있다.
다양한 실시 예들에 따라, 상기 프로세서는, 상기 외부 장치로부터의 응답이, 사용자에게 장치 선택을 요청하는 피드백 응답이면, 관련 피드백을 출력하고, 및 상기 피드백에 대한 사용자의 장치 지정 명령어를 획득하도록 구성할 수 있다.
다양한 실시 예들에 따라, 상기 프로세서는, 상기 전자 장치의 스코어와 상기 외부 장치에 의해 획득되는 스코어를 판단하고, 및 상기 전자 장치의 스코어가 높으면, 상기 음성 명령을 처리하는 대상 장치로 결정하도록 구성할 수 있다.
다양한 실시 예들에 따라, 상기 프로세서는, 장치 지정 명령어 또는 도메인 명령어에 기반하여 상기 음성 명령의 처리 여부를 결정하도록 구성할 수 있다.
다양한 실시 예들에 따라, 상기 프로세서는, 상기 도메인 명령어에 기반하여, 동일 계정으로 그룹화된 장치들 중 복수의 전자 장치들이 관련 도메인을 포함하면, 스코어에 기반하여 피드백 대상 장치를 결정하고, 결정된 피드백 대상 장치에 기반하여 사용자에 의한 장치 선택을 획득하고, 및 사용자에 의한 장치 선택에 대응하는 전자 장치를 음성 명령을 수행할 대상 장치로 결정하도록 구성할 수 있다.
다양한 실시 예들에 따라, 상기 프로세서는, 상기 피드백 대상 장치의 결정 및 상기 대상 장치의 결정을 상기 외부 장치로부터 획득하도록 구성할 수 있다.
다양한 실시 예들에 따라, 상기 외부 장치는, 동일 계정으로 그룹화된 전자 장치들의 스코어, 장치 지정 명령어 또는 도메인 명령어에 적어도 일부 기반하여 상기 음성 명령을 수행할 대상 장치를 결정하고, 상기 결정된 대상 장치에게 음성 명령을 처리하도록 지시하는 제1 응답을 전송하고, 및 상기 전자 장치들 중 상기 대상 장치 외의 다른 전자 장치에게 대기 상태로 전환하도록 지시하는 제2 응답을 전송하도록 설정되고, 상기 프로세서는, 상기 외부 장치로부터의 상기 제1 응답 수신에 기반하여 음성 명령을 처리하거나, 또는 상기 제2 응답 수신에 기반하여 대기 상태로 전환하도록 구성할 수 있다.
다양한 실시 예들에 따라, 상기 음성 호출 명령어에 따라 웨이크-업 되는 동일 계정으로 그룹화된 복수의 전자 장치들 중 어느 하나에 의해, 상기 음성 명령을 처리하도록 결정하는 것을 포함할 수 있다.
도 7, 도 8 및 도 9는 본 발명의 다양한 실시 예들에 따른 시스템에서 음성 명령이 처리되는 동작 예시를 설명하기 위해 도시하는 도면들이다.
도 7 및 도 8에 도시한 바와 같이, 제1 전자 장치(710)(예: Phone), 제2 전자 장치(720)(예: TV), 제3 전자 장치(730)(예: 냉장고)는 특정 계정(예: samsung@samsung.com)에 기반하여 그룹화 되고, 동일한 음성 호출 명령어(예: 하이 갤럭시)가 등록될 수 있다. 한 실시 예에 따라, 제1 전자 장치(710)는 전화, 메시지, 음악 등의 도메인 리스트를 포함하고, 제2 전자 장치(720)는 채널, 볼륨, 음악 등의 도메인 리스트를 포함하고, 제3 전자 장치(730)는 레시피, 온도 조절, 날씨 등의 도메인 리스트를 포함하는 것을 가정할 수 있다. 다양한 실시 예들에 따라, 제1 전자 장치(710), 제2 전자 장치(720), 제3 전자 장치(730)는, 각각의 마이크(715, 725, 735)를 포함할 수 있고, 각각의 마이크(715, 725, 735)를 통해 사용자(700)의 발화에 따른 오디오 입력을 수신할 수 있다.
도 7을 참조하면, 제1 전자 장치(710), 제2 전자 장치(720), 제3 전자 장치(730)는 동일 계정(예: samsung@samsung.com)에 기반하여 서버(750)와 연결될 수 있고, 서버(750)로부터 응답을 받을 수 있는 대기 상태로 존재할 수 있다. 다양한 실시 예들에 따라, 서버(750)는 다양한 실시 예들에 따른 음성 명령 처리와 관련된 동작을 처리하기 위한 하나 또는 그 이상의 제어 회로들을 포함할 수 있다. 한 실시 예에 따르면, 서버(750)는 전자 장치(400)의 프로세서(480)에 대응하는 프로세서를 포함할 수 있고, 음성 인식 및 관련된 명령을 전자 장치에서 처리하도록 하는 음성 인식 처리부를 포함할 수 있다. 한 실시 예에 따르면, 서버(750)는 전자 장치들을 관리하기 위한 다양한 정보(예: 계정 정보, 장치 정보, 도메인 리스트 등)를 저장하는 데이터베이스를 포함할 수 있다.
도 7과 같은 상태에서, 사용자(700)는 특정 전자 장치에서 음성 명령을 처리하기 위하여 특정 명령어를 발화할 수 있다. 한 실시 예에 따르면, 사용자(700)는 전자 장치를 웨이크-업 하기 위한 설정된 음성 호출 명령어를 발화할 수 있다. 한 실시 예에 따르면, 사용자(700)는 음성 호출 명령어와 후속 명령어(예: 기능 실행과 관련된 명령어)를 발화할 수도 있다. 예를 들면, 도 8의 예시에서는, 사용자가 음성 호출 명령어와 후속 명령어를 함께 발화하는 경우의 예를 나타낼 수 있다.
도 8을 참조하면, 동작 801에서, 사용자(700)는 특정 전자 장치(예: Phone)에 의한 음성 명령에 따른 기능(예: 음악 재생)을 개시하기 위하여, 해당 전자 장치에 웨이크-업과 기능 실행을 위한 명령어(예: 음성 호출 명령어 + 후속 명령어)를 발화할 수 있다. 한 실시 예에 따르면, 사용자는 “하이 갤럭시, 노래 들려줘”와 같이 발화할 수 있다. 여기서, “하이 갤럭시”가 음성 호출 명령어에 해당할 수 있고, “노래 들려줘”가 후속 명령어에 해당할 수 있다.
다양한 실시 예들에 따르면, 복수의 전자 장치들(미도시)은 마이크(예: 715, 725, 735)를 통해 사용자(700)의 발화에 따른 오디오를 입력 받을 수 있다. 다양한 실시 예들에 따라, 복수의 전자 장치들 중, “하이 갤럭시”가 음성 호출 명령어로 등록된 제1 전자 장치(710), 제2 전자 장치(720), 제3 전자 장치(730)가, 사용자(700)의 음성 호출 명령어(예: 하이 갤럭시)에 응답하여 웨이크-업 할 수 있다.
동작 803, 동작 805, 동작 807에서, 제1 전자 장치(710), 제2 전자 장치(720), 제3 전자 장치(730)는 웨이크-업에 기반하여 사용자(700)의 음성 호출 명령어에 대한 인식 스코어를 산출할 수 있다. 도 8의 예시에서는, 제1 전자 장치(710)가 스코어 “400”을 산출하고, 제2 전자 장치(720)가 스코어 “700”을 산출하고, 제3 전자 장치(730)가 스코어 “200”을 산출하는 경우를 나타낼 수 있다. 다양한 실시 예들에 따라, 스코어 산출은 전술한 <수학식 1>을 참조하여 설명 부분에서 설명한 바에 따라 산출될 수 있다. 또한 스코어 산출은 후술하는 도 9의 예시와 같이 다양한 정보를 고려하여 산출될 수 있다.
도 9는 다양한 실시 예들에 따른 전자 장치에서 스코어 산출에 고려되는 정보의 예를 나타낼 수 있다.
도 9를 참조하면, 전자 장치(400)는 사용자(700)와의 거리(910), 전자 장치(400)의 환경(920)(예: 소음 등), 전자 장치(400)의 위치(930)(예: 공간적 또는 지리적 위치), 전자 장치(400)의 도메인(940), 음성 인식률(950) 등을 고려하여 스코어를 산출할 수 있다.
다양한 실시 예들에 따르면, 제1 전자 장치(710), 제2 전자 장치(720), 제3 전자 장치(730)는, 스코어 산출에 기반하여, 전술한 <표 1>에 예시된 음성 명령 처리와 관련된 정보(이하, 서비스 정보)를 아래 <표 2>의 예시와 같이 업데이트할 수 있다. 예를 들면, 제1 전자 장치(710), 제2 전자 장치(720), 제3 전자 장치(730)는, 스코어 항목에 산출된 스코어 정보를 등록할 수 있다.
계정 카테고리 이름
(닉네임, 장치 식별자)
스코어 도메인 (command)
제1 계정 Phone 갤럭시 400 전화
메시지
음악
...
TV 보르도 700 채널
볼륨
음악
...
냉장고 지펠 200 레시피
온도조절
날씨
...
... ... ... ...
제2 계정 ... ... ... ...
동작 809, 동작 811, 동작 813에서, 제1 전자 장치(710), 제2 전자 장치(720), 제3 전자 장치(730)는 산출된 스코어에 대한 스코어 정보를 서버(750)에 전송할 수 있다. 다양한 실시 예들에 따라, 제1 전자 장치(710), 제2 전자 장치(720), 제3 전자 장치(730)는, <표 2>의 예시와 같이, 스코어가 입력된 서비스 정보를 서버(750)에 전송할 수 있다. 제1 전자 장치(710), 제2 전자 장치(720), 제3 전자 장치(730) 각각은 <표 2>의 예시에서, 아래 <표 3>의 예시와 같이 자신에 대응하는 것만 전송할 수 있고, <표 2>와 같은 형태는 서버(750)에 의해 수집 및 관리될 수 있다.
계정 카테고리 이름
(닉네임, 장치 식별자)
스코어 도메인 (command)
제1 계정 Phone 갤럭시 400 전화
메시지
음악
...
다양한 실시 예들에 따라, 제1 전자 장치(710), 제2 전자 장치(720), 제3 전자 장치(730)는, 장치 식별을 위한 이름과, 산출된 스코어만을 포함하여 서버(750)에 전송할 수도 있다.
서버(750)는 제1 전자 장치(710), 제2 전자 장치(720), 제3 전자 장치(730)로부터 서비스 정보를 수신하면, 제1 전자 장치(710), 제2 전자 장치(720), 제3 전자 장치(730)의 스코어에 기반하여 음성 명령을 수행할 대상 장치를 판단할 수 있다. 예를 들면, 서버(750)는 스코어가 가장 높은 전자 장치(예: 제2 전자 장치(720))를 판단(또는 결정)하고, 해당 전자 장치를 음성 명령의 수행 대상 장치로 결정할 수 있다. 서버(750)는 판단된 전자 장치(예: 제2 전자 장치(720)) 외의 다른 전자 장치(예: 제1 전자 장치(710), 제3 전자 장치(730))는 대기하도록 결정할 수 있다.
다양한 실시 예들에 따라, 서버(750)는 <표 2>의 예시와 같은 장치 별 서비스 정보에 기반하여, 동일 계정으로 그룹화된 장치들을 식별할 수 있다. 한 실시 예에 따르면, 서버(750)는 <표 1>의 예시와 같은 서비스 정보를 미리 등록 및 관리할 수 있고, 스코어 정보 수신에 응답하여, <표 2>와 같이 서비스 정보를 변경할 수 있다. 한 실시 예에 따르면, 서버(750)는 수행 대상 장치가 결정되면, 서비스 정보에서 스코어 정보를 초기화 할 수도 있다.
동작 815, 동작 817, 동작 819에서, 서버(750)는 판단하는 결과에 기반하여 제1 전자 장치(710), 제2 전자 장치(720), 제3 전자 장치(730)에게 응답(예: 제1 응답, 제2 응답)을 각각 전송할 수 있다. 한 실시 예에 따르면, 서버(750)는 수행 대상 장치로 결정된 전자 장치(예: 제2 전자 장치(720))에는 음성 명령을 수행할 것을 명령하는 제1 응답을 전송할 수 있다. 한 실시 예에 따르면, 서버(750)는 수행 대상 장치 외의 다른 전자 장치(예: 제1 전자 장치(710), 제3 전자 장치(730))에는 대기 상태로 전환할 것을 명령하는 제2 응답을 전송할 수 있다.
다양한 실시 예들에 따라, 제1 전자 장치(710), 제2 전자 장치(720), 제3 전자 장치(730)는 서버(750)로부터 응답을 수신할 수 있고, 수신된 응답에 기반하여 대응하는 동작을 수행할 수 있다. 한 실시 예에 따르면, 제1 전자 장치(710)와 제3 전자 장치(730)는 제2 응답 수신에 대응하여, 대기 상태로 전환할 수 있다. 한 실시 예에 따르면, 제2 전자 장치(720)는 제1 응답 수신에 대응하여, 사용자 발화에 따른 음성 명령에 관련된 동작을 수행할 수 있다.
한편, 다양한 실시 예들에 따라, 제1 전자 장치(710), 제2 전자 장치(720), 제3 전자 장치(730)는, 도 8의 예시와 같이 후속 명령어가 포함된 경우, 서비스 정보와 후속 명령어를 포함하여 서버(750)에 전송할 수 있다.
서버(750)는 제1 전자 장치(710), 제2 전자 장치(720), 제3 전자 장치(730)로부터 서비스 정보와 후속 명령어를 수신하면, 후속 명령어에 대응하는 명령을 수행할 수 있는 장치를 판단할 수 있다. 한 실시 예에 따르면, 서버(750)는 후속 명령어가 포함된 경우, 동일 계정의 제1 전자 장치(710), 제2 전자 장치(720), 제3 전자 장치(730) 중에서, 장치 정보(예: 장치 이름 또는 닉네임, 도메인 리스트)를 참조하여 동작을 수행할 장치를 결정할 수 있다.
다양한 실시 예들에 따라, 서버(750)는 제1 전자 장치(710), 제2 전자 장치(720), 제3 전자 장치(730)의 스코어 보다 후속 명령어에 따른 명령의 수행 가능 여부를 우선순위로 하여 수행 대상 장치를 결정할 수 있다. 예를 들면, 서버(750)는 스코어에 기반하여 특정 전자 장치가 결정되더라도, 명령의 수행 가능한 다른 전자 장치를 수행 대상 장치로 결정할 수 있다. 다른 예를 들면, 서버(750)는 후속 명령어가 포함된 경우 후속 명령어에 따른 명령 수행 가능 여부를 우선적으로 판별하여 수행 대상 장치를 결정할 수 있다.
다양한 실시 예들에 따르면, 서버(750)는 후속 명령어가 장치 지정 명령어를 포함하는 경우, 동일 계정으로 그룹화된 제1 전자 장치(710), 제2 전자 장치(720), 제3 전자 장치(730) 중 장치 지정 명령어에 따른 장치를 판별할 수 있다. 예를 들면, 서버(750)는 동일 계정으로 그룹화된 장치들의 장치 정보(예: 장치 이름(또는 닉네임), 장치 식별자 등)에 기반하여, 해당 장치 정보를 가지는 전자 장치를 판별하고, 판별된 전자 장치를, 음성 명령을 수행할 대상 장치로 결정할 수 있다.
다양한 실시 예들에 따르면, 서버(750)는 도메인 리스트를 판별하여, 동일 계정으로 그룹화된 제1 전자 장치(710), 제2 전자 장치(720), 제3 전자 장치(730) 중 명령을 수행 가능한 하나 또는 그 이상의 장치들을 판별할 수 있다.
한 실시 예에 따르면, 서버(750)는 명령을 수행할 수 있는 장치가 하나인 것으로 판단하면, 동일 계정으로 그룹화된 제1 전자 장치(710), 제2 전자 장치(720), 제3 전자 장치(730) 중, 명령이 수행 가능한 해당 전자 장치에게 음성 명령을 수행하도록 하는 제1 응답을 전송할 수 있다. 서버(750)는 명령이 수행 가능하지 않은 다른 전자 장치에게 대기 상태로 전환하도록 하는 제2 응답을 전송할 수 있다.
한 실시 예에 따르면, 서버(750)는 명령을 수행할 수 있는 장치가 복수(예: 2개 이상)인 경우, 해당 전자 장치들의 스코어에 기반하여 피드백 대상 장치를 결정할 수 있다. 한 실시 예에 따르면, 서버(750)는 명령이 수행 가능한 복수의 전자 장치들 중 스코어가 높은 전자 장치를 사용자(700)의 피드백을 위한 장치로 결정할 수 있다. 예를 들면, 서버(750)는 TTS(text to speech) 또는 그 외의 방법 등으로, 사용자(700)에게 음성 명령을 수행할 수행 대상 장치를 결정(또는 선택)하도록 피드백을 제공할 수 있다. 다양한 실시 예들에 따라, 서버(750)는 피드백 대상 장치(예: 제2 전자 장치(720))에게는 피드백을 요청하는 제3 응답(예: 피드백 응답)을 전송할 수 있고, 다른 전자 장치(예: 제1 전자 장치(710), 제3 전자 장치(730))에는 응답을 대기하도록 하는 다른 응답을 전송할 수 있다. 한 실시 예에 따르면, 서버(750)는 다른 전자 장치에게 대기 상태로 전환하도록 하는 제2 응답을 전송할 수도 있다.
예를 들어, 도 8을 참조하여 살펴보면, 후속 명령어인 “노래 들려줘”의 명령에 연관된 도메인이 “음악”인 경우를 가정할 수 있다. 도 8에 도시한 바와 같이, 제1 전자 장치(710)와 제2 전 전자 장치(720)에서 도메인 “음악”을 도메인 리스트에 포함하는 것을 가정할 수 있다. 이러한 경우, 서버(750)는 제1 전자 장치(710)와 제2 전자 장치(720) 중 스코어가 높은 제2 전자 장치(720)를 피드백 대상 장치로 결정할 수 있다. 서버(750)는, 피드백 대상 장치를 결정하면, 동작 821에 도시한 바와 같이, 피드백 대상 장치로 결정된 제2 전자 장치(720)에게 명령을 수행할 대상 장치를 지정(선택)할 것을 요청하는 명령(예: 피드백 명령)을 전송할 수 있다. 다양한 실시 예들에 따르면, 서버(750)는 피드백 명령을 제공할 때, 피드백 명령에 따라 선택될 수 있는(또는 선택 가능한) 장치에 대한 정보(예: 제1 전자 장치(710), 제2 전자 장치(720))를 제공할 수 있다.
제2 전자 장치(720)는, 서버(750)로부터 피드백 명령을 수신하면, 피드백 명령에 대응하여 사용자에게 장치를 지정할 것을 요청하는 피드백을 제공할 수 있다. 한 실시 예에 따르면, 동작 823에 도시한 바와 같이, 제2 전자 장치(720)는 “어떤 기기에서 음악을 재생할까요? Phone과 TV에서 음악 재생이 가능합니다.”와 같이 사용자에게 음악 재생 명령을 수행할 장치를 선택하도록 요청할 수 있다. 다양한 실시 예들에 따르면, 제2 전자 장치(720)는 서버(750)로부터 수신된 장치에 대한 정보에 기반하여 선택 가능한 장치들에 대한 정보를 안내할 수 있다.
사용자(700)는, 제2 전자 장치(720)의 장치 선택 피드백에 대응하여 특정 장치를 지정(선택)하는 음성을 발화할 수 있다. 한 실시 예에 따르면, 동작 825에 도시한 바와 같이, 사용자(700)는 “Phone” 또는 “Phone에서 음악 재생해줘” 등과 같이 제1 전자 장치(710)를 지정(선택)하는 음성을 발화할 수 있다. 제2 전자 장치(720)는 사용자(700)의 발화에 따른 음성 입력이 감지하면, 동작 827에서, 입력된 음성 정보를 서버(750)에 전송할 수 있다.
서버(750)는 제2 전자 장치(720)로부터, 피드백 명령에 대응하는 응답(예: 음성 정보)을 수신하면, 수신된 응답에 기반하여 수행 대상 장치를 판단할 수 있다. 한 실시 예에 따르면, 서버(750)는, 수신된 응답을 분석하여, 음성 명령에 따른 기능(예: 음악 재생)을 수행 가능한 제1 전자 장치(710)와 제2 전자 장치(720) 중, 수신된 응답에 기반하여 제1 전자 장치(710)를 최종 수행 대상 장치로 결정할 수 있다.
서버(750)는 수행 대상 장치를 결정하면, 결정된 수행 대상 장치에게 음성 명령(예: 음악 재생)을 수행할 것을 명령하는 제1 응답을 전송할 수 있다. 한 실시 예에 따르면, 서버(750)는, 동작 829에 도시한 바와 같이, 제1 전자 장치(710)에게 제1 응답을 전송할 수 있다. 다양한 실시 예들에 따르면, 서버(750)는 수행 대상 장치 외의 다른 전자 장치(예: 제2 전자 장치(720), 제3 전자 장치(730))에는 대기 상태로 전환할 것을 명령하는 제2 응답을 전송할 수 있다. 다양한 실시 예들에 따르면, 제3 전자 장치(730)는 이전에 제2 응답이 전송되어 대기 상태에 존재할 수 있으므로, 서버(750)는 제2 전자 장치(720)에게 제2 응답을 전송하고, 제3 전자 장치(730)에는 응답 전송을 수행하지 않을 수 있다.
제1 전자 장치(710)와 제2 전자 장치(720)는 서버(750)로부터 응답을 수신할 수 있고, 수신된 응답에 기반하여 대응하는 동작을 수행할 수 있다. 한 실시 예에 따르면, 제1 전자 장치(710)는 제1 응답 수신에 대응하여, 동작 831에 도시한 바와 같이, 음성 명령에 대응하는 기능(예: 음악 재생)을 실행할 수 있다. 한 실시 예에 따르면, 제2 전자 장치(720)는 제2 응답 수신에 대응하여 대기 상태로 전환할 수 있다.
도 10은 본 발명의 다양한 실시 예들에 따른 시스템에서 음성 명령을 처리하는 동작을 도시하는 도면이다.
도 10에 도시한 바와 같이, 도 10은 제1 전자 장치(1010), 제2 전자 장치(1020), 제3 전자 장치(1030)는 특정 계정에 기반하여 그룹화 되고, 동일한 음성 호출 명령어가 등록된 경우일 수 있다. 또한, 도 10에서는 서버(1040)와 연동하여 음성 명령을 처리하는 예를 나타낼 수 있다.
도 10을 참조하면, 동작 1001에서, 사용자는 특정 전자 장치에서 음성 명령을 수행하도록 하기 위하여, 음성 호출 명령어를 발화할 수 있다. 다양한 실시 예들에 따르면, 사용자는 음성 호출 명령어와 후속 명령어를 함께 발화할 수 있고, 음성 호출 명령어에 기반하여 전자 장치를 웨이크-업 한 후 후속 명령어를 별도로 발화할 수도 있다.
동작 1003에서, 제1 전자 장치(1010), 제2 전자 장치(1020), 제3 전자 장치(1030)는 음성 호출 명령어에 기반하여 웨이크-업 할 수 있다. 다양한 실시 예들에 따라, 제1 전자 장치(1010), 제2 전자 장치(1020), 제3 전자 장치(1030)는 음성 호출 명령어를 인식하는 시점에서, 순차적으로 또는 병렬적으로 일정 시간 범위 내에서 동시에 웨이크-업 될 수 있다. 다양한 실시 예들에 따라, 제1 전자 장치(1010), 제2 전자 장치(1020), 제3 전자 장치(1030)는 마이크를 통해 사용자의 음성 호출 명령어를 수신하여 인식할 수 있다.
동작 1005에서, 제1 전자 장치(1010), 제2 전자 장치(1020), 제3 전자 장치(1030)는 음성 호출 명령어의 인식 스코어를 산출할 수 있다. 다양한 실시 예들에서, 제1 전자 장치(1010), 제2 전자 장치(1020), 제3 전자 장치(1030)는 음성 호출 명령어에 의한 웨이크-업에 기반하여 사용자의 음성 호출 명령어에 대한 인식 스코어를 산출할 수 있다.
동작 1007, 동작 1009, 동작 1011에서, 제1 전자 장치(1010), 제2 전자 장치(1020), 제3 전자 장치(1030)는 산출된 스코어를 서버(1040)에 전송할 수 있다. 다양한 실시 예들에 따라, 제1 전자 장치(1010), 제2 전자 장치(1020), 제3 전자 장치(1030)는 장치 식별을 위한 장치 정보를 포함하여 서버(1040)에 제공할 수 있다. 한 실시 예에 따르면, 제1 전자 장치(1010), 제2 전자 장치(1020), 제3 전자 장치(1030)는 스코어와 장치 정보를 포함하는 서비스 정보를 서버(1040)에 전송할 수 있다. 다양한 실시 예들에 따라, 제1 전자 장치(1010), 제2 전자 장치(1020), 제3 전자 장치(1030)는 음성 인식에 다른 음성 명령어(예: 후속 명령어가 포함된 경우, 음성 명령어를 서비스 정보에 포함하여 서버(1040)에 전송할 수 있다.
동작 1013에서, 서버(1040)는 제1 전자 장치(1010), 제2 전자 장치(1020), 제3 전자 장치(1030)로부터 서비스 정보를 수신하면, 제1 전자 장치(1010), 제2 전자 장치(1020), 제3 전자 장치(1030)의 스코어에 기반하여 음성 명령을 수행할 대상 장치를 결정할 수 있다. 예를 들면, 서버(1040)는 스코어가 가장 높은 전자 장치를 판단(또는 결정)하고, 해당 전자 장치를 음성 명령의 수행 대상 장치로 결정할 수 있다. 다양한 실시 예들에 따라, 서버(1040)는 대상 장치로 결정된 전자 장치 외의 다른 전자 장치는 대기하도록 결정할 수 있다. 한 실시 예에 따르면, 도 10에서는 제1 전자 장치(1010)의 스코어가 가장 높을 수 있고, 서버(1040)가 제1 전자 장치(1010)를 대상 장치로 결정한 경우를 나타낼 수 있다. 다양한 실시 예들에 따르면, 서버(1040)는 제1 전자 장치(1010), 제2 전자 장치(1020), 제3 전자 장치(1030)에 관련된 다양한 정보들을 미리 저장할 수 있고, 저장된 다양한 정보들에 기반하여 대상 장치를 결정할 수도 있다. 이에 대해, 후술하는 도면들을 참조하여 상세히 설명된다.
동작 1015, 동작 1017, 동작 1019에서, 서버(1040)는 판단하는 결과에 기반하여 제1 전자 장치(1010), 제2 전자 장치(1020), 제3 전자 장치(1030)에게 응답(예: 제1 응답, 제2 응답)을 각각 전송할 수 있다. 한 실시 예에 따르면, 서버(1040)는, 동작 1015에서, 제1 전자 장치(1010), 제2 전자 장치(1020), 제3 전자 장치(1030) 중에서, 대상 장치로 결정된 제1 전자 장치(1010)에게 음성 명령을 수행하도록 명령하는 제1 응답을 전송할 수 있다. 한 실시 예에 따르면, 서버(1040)는, 동작 1017과 동작 1019에서, 대상 장치로 선택되지 않은 제2 전자 장치(1020)와 제2 전자 장치(1030)에게 대기 상태로 전환할 것을 명령하는 제2 응답을 전송할 수 있다.
동작 1021, 동작 1023, 동작 1025에서, 제1 전자 장치(1010), 제2 전자 장치(1020), 제3 전자 장치(1030)는 서버(1040)로부터 응답을 각각 수신할 수 있고, 수신된 응답에 기반하여 대응하는 동작을 수행할 수 있다. 한 실시 예에 따르면, 제1 전자 장치(1010)는, 동작 1021에서, 제1 응답 수신에 대응하여, 음성 명령을 처리하도록 동작할 수 있다. 예를 들면, 제1 전자 장치(1010)는 음성 인식에 의한 관련 서비스를 수행(예: 음성 명령을 처리하고, 음성 명령에 관련된 기능을 수행)하도록 동작할 수 있다. 한 실시 예에 따르면, 제2 전자 장치(1020)와 제3 전자 장치(1030)는, 동작 1023 및 동작 1025에서, 제2 응답 수신에 대응하여, 대기 상태로 전환하도록 동작할 수 있다.
도 11은 본 발명의 다양한 실시 예들에 따른 전자 장치에서 음성 명령을 처리하는 동작을 도시하는 흐름도이다.
도 11을 참조하면, 동작 1101에서, 전자 장치(400)의 프로세서(480)는 음성 호출 명령어를 감지할 수 있다. 한 실시 예에 따르면, 전자 장치(400)는 음성 호출 명령어를 인식하기 위한 제1 프로세서(예: 웨이크-업 처리부, 웨이크-업 엔진)에 기반하여, 마이크를 통해 음성 호출 명령어를 인식할 수 있다.
동작 1103에서, 프로세서(480)는 음성 호출 명령어 감지에 대응하여 웨이크-업 할 수 있다. 한 실시 예에 따르면, 전자 장치(400)는 제1 프로세서의 음성 호출 명령어 감지에 기반하여, 제2 프로세서(예: 후속 명령어 인식부, 음성 인식 엔진, 서비스 제어 회로)를 웨이크-업 할 수 있다.
동작 1105에서, 프로세서(480)는 음성 호출 명령어의 인식 스코어를 산출할 수 있다. 한 실시 예에 따르면, 프로세서(480)는 전술한 <수학식 1>과 도 9를 참조한 설명 부분에서 설명한 바와 같이, 다양한 상황을 고려하여 스코어를 산출할 수 있다.
동작 1107에서, 프로세서(480)는 음성 명령의 수행 여부를 확인 요청하는 메시지를 서버에 전송할 수 있다. 한 실시 예에 따르면, 프로세서(480)는, 스코어를 산출하면, 설정된 통신 인터페이스(예: 무선 통신부(410))를 이용하여, 산출된 스코어 정보, 장치 정보 또는 후속 명령어 등의 적어도 일부를 포함하는 서비스 정보를 서버에 전송할 수 있다. 다양한 실시 예들에 따르면, 서비스 정보는 음성 명령의 수행 여부에 대해 서버에게 확인을 요청하는 정보를 포함할 수 있다.
동작 1109에서, 프로세서(480)는, 서버로부터, 동작 여부의 확인 요청에 대응하는 응답을 수신할 수 있다.
동작 1111에서, 프로세서(480)는 수신된 응답이 음성 명령을 개시하도록 지시하는 제1 응답에 대응하는지, 또는 대기 상태로 전환하도록 지시하는 제2 응답에 대응하는지 여부를 판단할 수 있다.
동작 1111에서, 프로세서(480)는 수신된 응답이 제1 응답인 것으로 판단하면(동작 1111의 예), 동작 1113에서, 음성 명령을 처리할 수 있다. 예를 들면, 프로세서(480)는 사용자 발화에 대한 음성 인식 동작을 수행하고, 관련된 기능을 실행하는 것에 관련된 동작을 처리할 수 있다.
동작 1111에서, 프로세서(480)는 수신된 응답이 제2 응답인 것으로 판단하면(동작 1111의 아니오), 동작 1115에서, 음성 호출 명령어를 대기하는 대기 상태로 전환할 수 있다. 한 실시 예에 따르면, 프로세서(480)는 전자 장치(400)를 슬립 상태로 전환할 수 있다. 예를 들면, 전자 장치(400)는 제2 프로세서를 슬립 상태로 전환할 수 있다. 전자 장치(400)는 슬립 상태에서, 제1 프로세서에 기반하여 음성 호출 명령어를 대기할 수 있고, 제2 프로세서에 의한 사용자 발화에 대한 음성 인식 동작은 수행하지 않을 수 있다.
도 12는 본 발명의 다양한 실시 예들에 따른 서버에서 음성 명령을 처리하는 동작을 도시하는 흐름도이다.
도 12를 참조하면, 동작 1201에서, 서버(750)(또는 서버(750)의 제어 회로)는 적어도 하나의 전자 장치로부터 음성 명령의 수행 여부를 확인 요청하는 메시지(예: 서비스 정보)를 수신할 수 있다. 다양한 실시 예들에 따라, 서비스 정보는 스코어 정보, 장치 정보 또는 후속 명령어 등을 포함할 수 있다.
동작 1203에서, 서버(750)는 장치 별 스코어를 판단할 수 있다. 한 실시 예에 따르면, 제1 전자 장치, 제2 전자 장치, 제3 전자 장치로부터 서비스 정보가 수신된 경우, 서버(750)는 제1 전자 장치의 제1 스코어, 제2 전자 장치의 제2 스코어, 제3 전자 장치의 제3 스코어를 비교 판단할 수 있다. 다양한 실시 예들에 따라, 제1 전자 장치, 제2 전자 장치, 제3 전자 장치는 동일 계정으로 그룹화된 장치들일 수 있다.
동작 1205에서, 서버(750)는 스코어에 기반하여 음성 명령을 수행할 대상 장치를 결정할 수 있다. 한 실시 예에 따르면, 서버(750)는 스코어가 가장 높은 전자 장치를 판단하고, 해당 전자 장치를 음성 명령의 수행 대상 장치로 결정할 수 있다. 서버(750)는 결정된 전자 장치 외의 다른 전자 장치는 대기하도록 결정할 수 있다.
동작 1207에서, 서버(750)는 음성 명령을 수행하도록 결정된 대상 장치에게 제1 응답을 전송할 수 있다. 다양한 실시 예들에 따라, 제1 응답은, 대상 장치가 음성 명령을 수행하도록 명령하는 응답을 포함할 수 있다.
동작 1209에서, 서버(750)는 음성 명령을 수행하지 않도록 결정된 다른 장치, 예를 들면, 대기 상태로 전환하도록 결정된 다른 장치에게 제2 응답을 전송할 수 있다. 다양한 실시 예들에 따라, 제2 응답은, 다른 장치가 음성 호출 명령어를 대기하는 대기 상태(또는 슬립 상태)로 전환하도록 명령하는 응답을 포함할 수 있다.
다양한 실시 예들에서, 동작 1207과 동작 1209의 선후는 설명의 편의를 위해 나타낸 것으로, 도 12의 순서에 한정되지 않는다. 예를 들면, 동작 1207과 동작 1209는 순차적으로, 병렬적으로 또는 역순차적으로 수행될 수 있다.
도 13은 본 발명의 다양한 실시 예들에 따른 서버에서 음성 명령을 처리하는 동작을 도시하는 흐름도이다.
도 13을 참조하면, 동작 1301에서, 서버(750)(또는 서버(750)의 제어 회로)는 외부 장치로부터 음성 명령에 관련된 요청을 수신할 수 있다. 다양한 실시 예들에 따라, 외부 장치는 복수의 전자 장치들을 포함할 수 있다.
동작 1303에서, 서버(750)는 외부 장치로부터의 요청이, 음성 명령의 수행 여부를 확인 요청하는 제1 요청인지, 또는 음성 인식에 대한 결과(또는 명령)를 요청하는 제2 요청인지 여부를 판단할 수 있다. 한 실시 예에 따르면, 서버(750)는 외부 장치로부터 수신되는 요청의 타입(또는 포맷)(예: 서비스 정보), 요청 메시지의 헤더 정보, 요청 메시지에 포함된 웨이크-업 관련 정보 등의 파싱(parsing)에 기반하여 요청 종류를 판별할 수 있다.
동작 1303에서, 서버(750)는 제2 요청인 것으로 판단하면(동작 1303의 아니오), 동작 1305에서, 음성 명령을 인식하고 그에 대한 응답을 해당 외부 장치에 전송할 수 있다.
동작 1305에서, 서버(750)는 제1 요청인 것으로 판단하면(동작 1303의 예), 동작 1307에서, 제1 요청(예: 서비스 정보)에 대상 장치를 결정하는 데 고려될 결정 조건이 포함되는지 여부를 판단할 수 있다. 다양한 실시 예들에 따라, 결정 조건은, 예를 들면, 요청을 전송한 장치의 수, 장치 지정 명령어(예: “Phone” 등), 또는 도메인 명령어(예: “음악 재생” 등) 등의 적어도 하나를 포함할 수 있다. 예를 들면, 서버(750)는 제1 요청에 장치 지정 명령어 및/또는 도메인 명령어 등의 적어도 하나의 후속 명령어가 포함된 경우, 결정 조건이 포함된 것으로 판단할 수 있다.
동작 1307에서, 서버(750)는 제1 요청이 결정 조건을 포함하는 것으로 판단하면(동작 1307의 예), 동작 1309에서, 음성 명령을 수행할 대상 장치를 결정하기 위한 적어도 하나의 조건에 기반하여 대상 장치를 결정할 수 있다. 이에 대한 구체적인 예시는 후술하는 도 14를 참조하여 상세히 설명된다.
동작 1307에서, 서버(750)는 제1 요청이 결정 조건을 포함하지 않는 것으로 판단하면(동작 1307의 아니오), 동작 1311에서, 동일 계정으로 그룹화된 장치들에 기반하여 각 장치 별 스코어를 판단할 수 있다.
동작 1313에서, 서버(750)는 스코어에 기반하여 음성 명령을 수행할 대상 장치를 결정할 수 있다. 예를 들면, 서버(750)는 전술한 바와 같이, 동일 계정의 전자 장치들 중에서 스코어가 가장 높은 전자 장치를 대상 장치로 결정할 수 있다.
동작 1315에서, 서버(750)는 대상 장치와 다른 장치에 각각 다른 응답을 전송할 수 있다. 한 실시 예에 따르면, 서버(750)는 대상 장치에게 음성 명령을 처리할 것을 명령하는 제1 응답을 전송할 수 있고, 대상 장치 외의 다른 장치에게 대기 상태로 전환할 것을 명령하는 제2 응답을 전송할 수 있다.
도 14는 본 발명의 다양한 실시 예들에 따른 서버에서 음성 명령을 수행할 대상 장치를 결정하는 예를 도시하는 흐름도이다.
도 14를 참조하면, 동작 1401에서, 서버(750)(또는 서버(750)의 제어 회로)는 외부 장치로부터 수신된 요청을 분석할 수 있다. 한 실시 예에 따르면, 서버(750)는, 외부 장치로부터 음성 명령의 처리 여부를 확인하는 요청(예: 서비스 정보)이 수신되면, 해당 요청이 하나의 외부 장치로부터 수신되는지, 장치 지정 명령어(예: “Phone” 등)를 포함하는지, 또는 도메인 명령어(예: “음악 재생” 등)를 포함하는지 등과 같이 대상 장치를 결정하는 데 고려될 결정 조건을 판단할 수 있다. 다양한 실시 예들에 따라 요청은 하나 또는 그 이상의 결정 조건들을 포함할 수 있다.
동작 1411에서, 서버(750)는 하나의 외부 장치로부터 요청이 수신되었는지 여부를 판단할 수 있다. 예를 들면, 서버(750)는 해당 외부 장치의 계정과 동일 계정에 속한 다른 장치로부터의 요청이 있는지 여부를 판단할 수 있다.
동작 1411에서, 서버(750)는 하나의 외부 장치로부터 요청이 수신된 것으로 판단하면(동작 1411의 예), 동작 1413에서, 해당 외부 장치를 음성 명령을 수행할 대상 장치로 결정할 수 있다.
동작 1411에서, 서버(750)는 동일 계정의 복수의 외부 장치들로부터 요청이 수신된 것으로 판단하면(동작 1411의 아니오), 동작 1421에서, 장치 지정 명령어가 포함되는지 여부를 판단할 수 있다.
동작 1421에서, 서버(750)는 요청이 장치 지정 명령어를 포함하는 것을 판단하면(동작 1421의 예), 동작 1423에서, 동일 계정으로 그룹화된 장치들 중 지정된 장치를 판별할 수 있다. 예를 들면, 서버(750)는 동일 계정으로 그룹화된 장치들 중 장치 지정 명령어에 따른 장치를 판별할 수 있다. 한 실시 예에 따르면, 서버(750)는 동일 계정으로 그룹화된 장치들의 장치 정보(예: 장치 이름(또는 닉네임), 장치 식별자 등)에 기반하여, 해당 장치 정보를 가지는 장치를 판별할 수 있다.
동작 1425에서, 서버(750)는 판별된 장치(예: 사용자에 의해 지정된 장치)를 음성 명령을 수행할 대상 장치로 결정할 수 있다.
동작 1421에서, 서버(750)는 장치 지정 명령어를 포함하지 않는 것을 판단하면(동작 1421의 아니오), 동작 1431에서, 요청이 도메인 명령어를 포함하는지 여부를 판단할 수 있다.
동작 1431에서, 서버(750)는 요청이 도메인 명령어를 포함하지 않는 것을 판단하면(동작 1431의 아니오), 동작 1451에서, 동일 계정으로 그룹화된 장치들의 스코어에 기반하여 음성 명령을 수행할 대상 장치를 결정할 수 있다. 예를 들면, 스코어에 기반하여 가장 높은 스코어의 외부 장치를 대상 장치로 결정할 수 있다.
동작 1431에서, 서버(750)는 요청이 도메인 명령어를 포함하는 것을 판단하면(동작 1431의 예), 동작 1433에서, 도메인 리스트를 분석할 수 있다.
동작 1435에서, 서버(750)는 도메인 리스트의 분석하는 결과에 기반하여, 동일 계정으로 그룹화된 장치들 중 도메인 명령어에 따른 명령(기능)을 수행 가능한 하나 또는 그 이상의 장치들을 판별할 수 있다.
동작 1437에서, 서버(750)는 명령을 수행 가능한 장치가 복수의 장치들인지 여부를 판단할 수 있다. 예를 들면, 동일 계정으로 그룹화된 장치들 중 동일한 도메인을 가지는 장치들이 있는지 판단할 수 있다.
동작 1437에서, 서버(750)는 명령을 수행 가능한 장치가 하나인 것을 판단하면(동작 1437의 아니오), 동작 1439에서, 동일 계정으로 그룹화된 장치들 중 명령이 수행 가능한 해당 장치를 음성 명령을 수행할 대상 장치로 결정할 수 있다.
동작 1437에서, 서버(750)는 명령을 수행 가능한 장치가 복수인 것을 판단하면(동작 1437의 예), 동작 1441에서, 해당 장치들의 스코어에 기반하여 피드백 대상 장치를 결정할 수 있다. 한 실시 예에 따르면, 서버(750)는 명령이 수행 가능한 복수의 장치들 중 스코어가 높은 장치를 사용자의 피드백을 위한 장치로 결정할 수 있다. 예를 들면, 서버(750)는 TTS(text to speech) 또는 그 외의 방법 등으로, 사용자에게 음성 명령을 수행할 대상 장치를 결정(또는 선택)하도록 피드백을 제공할 수 있다. 다양한 실시 예들에 따르면, 서버(750)는 피드백 명령을 제공할 때, 피드백 명령에 따라 선택될 수 있는 장치에 대한 정보(예: 장치 이름(또는 닉네임))를 제공할 수 있다.
동작 1443에서, 서버(750)는 피드백 대상 장치에게 피드백 응답(예: 제3 응답)을 전송할 수 있다. 한 실시 예에 따르면, 서버(750)는 피드백 대상 장치 외의 나머지 다른 장치에는 응답을 대기하도록 다른 응답을 전송할 수도 있다.
동작 1445에서, 서버(750)는 피드백 대상 장치로부터 피드백에 대응하는 장치 지정 명령어를 수신할 수 있다.
동작 1447에서, 서버(750)는 수신된 장치 지정 명령어에 기반하여 동일 계정으로 그룹화된 장치들 중 지정된 장치를 음성 명령을 수행할 대상 장치로 결정할 수 있다.
도 15는 본 발명의 다양한 실시 예들에 따른 전자 장치에서 음성 명령을 처리하는 동작을 도시하는 흐름도이다.
도 15를 참조하면, 동작 1501에서, 전자 장치(400)의 프로세서(480)는 음성 명령의 수행 여부를 확인 요청하는 메시지를 서버에 전송할 수 있다. 한 실시 예에 따르면, 프로세서(480)는, 스코어를 산출하면, 설정된 통신 인터페이스(예: 무선 통신부(410))를 이용하여, 산출된 스코어 정보, 장치 정보 또는 후속 명령어 등의 적어도 일부를 포함하는 서비스 정보를 서버에 전송할 수 있다. 다양한 실시 예들에 따르면, 서비스 정보는 음성 명령의 수행 여부에 대해 서버에게 확인을 요청하는 정보를 포함할 수 있다.
동작 1503에서, 프로세서(480)는, 서버로부터, 동작 여부의 확인 요청에 대응하는 응답을 수신할 수 있다.
동작 1505에서, 프로세서(480)는, 서버로부터 수신된 응답이 피드백 응답에 대응하는지 여부를 판단할 수 있다. 다양한 실시 예들에 따르면, 프로세서(480)는 서로부터의 응답이, 피드백 응답인지, 음성 명령의 수행을 위한 제1 응답인지, 또는 대기 상태로 전환을 위한 제2 응답인지 여부를, 순차적으로 또는 병렬적으로 판단할 수 있다.
동작 1505에서, 프로세서(480)는 수신된 응답이 피드백 응답이 아닌 것을 판단하면(동작 1505의 아니오), 동작 1515로 진행하여, 동작 1515 이하의 동작 수행을 처리할 수 있다.
동작 1505에서, 프로세서(480)는 수신된 응답이 피드백 응답인 것을 판단하면(동작 1505의 예), 동작 1507에서, 피드백 응답에 기반하여 사용자에게 음성 명령을 수행할 대상 장치를 지정할 것을 요청하는 피드백을 출력할 수 있다. 다양한 실시 예들에 따르면, 프로세서(480)는 피드백 응답에 포함된 장치에 대한 장치 정보에 기반하여 선택 가능한 장치들에 대한 정보를 안내할 수 있다. 다양한 실시 예들에 따라, 피드백 출력은, 시각적 또는 청각적 중 적어도 하나에 기반하여 제공될 수 있다. 한 실시 예에 따르면, 디스플레이를 통하여 관련 텍스트를 출력하거나, 스피커를 통하여 관련 오디오를 출력하거나, 또는 디스플레이와 스피커를 통해 함께 출력하도록 동작할 수도 있다.
동작 1509에서, 프로세서(480)는 사용자 발화에 따른 명령어를 수신할 수 있다. 한 실시 예에 따르면, 사용자는, 장치 선택 피드백에 대응하여 특정 장치를 지정(선택)하는 음성을 발화할 수 있다.
동작 1511에서, 프로세서(480)는 명령어가 수신되면, 입력된 명령어를 서버에 전송할 수 있다.
동작 1513에서, 프로세서(480)는, 서버로부터, 장치 지정을 위한 명령어 전송에 대응하는 응답을 수신할 수 있다.
동작 1515에서, 프로세서(480)는 수신된 응답이 음성 명령을 처리하도록 지시하는 제1 응답에 대응하는지, 또는 대기 상태로 전환하도록 지시하는 제2 응답에 대응하는지 여부를 판단할 수 있다.
동작 1515에서, 프로세서(480)는 수신된 응답이 제1 응답인 것을 판단하면(동작 1515의 예), 동작 1517에서, 음성 명령을 처리할 수 있다. 예를 들면, 프로세서(480)는 사용자 발화에 대한 음성 인식 동작을 수행하고, 관련된 기능을 실행하는 것에 관련된 동작을 처리할 수 있다.
동작 1515에서, 프로세서(480)는 수신된 응답이 제2 응답인 것을 판단하면(동작 1515의 아니오), 동작 1519에서, 음성 호출 명령어를 대기하는 대기 상태로 전환할 수 있다. 한 실시 예에 따르면, 전자 장치(400)는 슬립 상태로 전환될 수 있다.
이상에서는, 다양한 실시 예들에 따라 전자 장치와 서버의 연동에 기반하여 음성 명령을 처리하는 예를 살펴보았다. 이하에서는, 다양한 실시 예들에 따라 서버의 개입 없이 전자 장치에 기반하여 음성 명령을 처리하는 예를 살펴보기로 한다.
도 16은 본 발명의 다양한 실시 예들에 따른 시스템에서 음성 명령을 처리하는 동작을 도시하는 도면이다.
도 16에 도시한 바와 같이, 도 16은 제1 전자 장치(1610), 제2 전자 장치(1620), 제3 전자 장치(1630)는 특정 계정에 기반하여 그룹화 되고, 동일한 음성 호출 명령어가 등록된 경우일 수 있다. 또한, 도 16에서는 전자 장치들 간에 연동에 의해 음성 명령을 처리하는 예를 나타낼 수 있다.
도 16을 참조하면, 동작 1601에서, 사용자는 특정 전자 장치에서 음성 명령을 처리하기 위하여, 음성 호출 명령어를 발화할 수 있다. 다양한 실시 예들에 따르면, 사용자는 음성 호출 명령어와 후속 명령어를 함께 발화할 수 있고, 음성 호출 명령어에 기반하여 전자 장치를 웨이크-업 한 후 후속 명령어를 별도로 발화할 수도 있다.
동작 1603에서, 제1 전자 장치(1610), 제2 전자 장치(1620), 제3 전자 장치(1630)는 음성 호출 명령어에 기반하여 웨이크-업 할 수 있다. 다양한 실시 예들에 따라, 제1 전자 장치(1610), 제2 전자 장치(1620), 제3 전자 장치(1630)는 음성 호출 명령어를 인식하는 시점에서, 순차적으로 또는 병렬적으로 일정 시간 범위 내에서 동시에 웨이크-업 될 수 있다. 다양한 실시 예들에 따라, 제1 전자 장치(1610), 제2 전자 장치(1620), 제3 전자 장치(1630)는 마이크를 통해 사용자의 음성 호출 명령어를 수신하여 인식할 수 있다.
동작 1605에서, 제1 전자 장치(1610), 제2 전자 장치(1620), 제3 전자 장치(1630)는 음성 호출 명령어의 인식 스코어를 산출할 수 있다. 다양한 실시 예들에서, 제1 전자 장치(1610), 제2 전자 장치(1620), 제3 전자 장치(1630)는 음성 호출 명령어에 의한 웨이크-업에 기반하여 사용자의 음성 호출 명령어에 대한 인식 스코어를 산출할 수 있다.
동작 1607에서, 제1 전자 장치(1610), 제2 전자 장치(1620), 제3 전자 장치(1630)는 산출된 스코어를 다른 전자 장치들과 교환할 수 있다. 한 실시 예에 따르면, 제1 전자 장치(1610)는 자신의 제1 스코어를 제2 전자 장치(1620)와 제2 전자 장치(1630)에 전송할 수 있다. 제1 전자 장치(1620)는 제2 전자 장치(1620)와 제3 전자 장치(1630)로부터, 제2 전자 장치(1620)의 제2 스코어와, 제3 전자 장치(1630)의 제3 스코어를 각각 수신할 수 있다. 예를 들면, 전자 장치(400)는 자신의 스코어를 다른 전자 장치로 전송하고, 동일 계정의 다른 전자 장치들로부터 그들의 스코어를 각각 획득할 수 있다.
동작 1609에서, 제1 전자 장치(1610), 제2 전자 장치(1620), 제3 전자 장치(1630)는 스코어에 기반하여 음성 명령을 수행할 대상 장치 여부를 결정할 수 있다. 한 실시 예에 따르면, 제1 전자 장치(1610), 제2 전자 장치(1620), 제3 전자 장치(1630)는 자신의 스코어와 다른 전자 장치로부터 획득된 스코어를 비교하여, 자신이 가장 높은 스코어를 가지는지 여부를 판단할 수 있다. 한 실시 예에 따르면, 도 16에서는 제1 전자 장치(1610)의 스코어가 가장 높을 수 있고, 제1 전자 장치(1610)가 대상 장치로 결정되는 경우를 나타낼 수 있다.
동작 1611, 동작 1621, 동작 1631에서, 제1 전자 장치(1610), 제2 전자 장치(1620), 제3 전자 장치(1630)는 판단하는 결과에 기반하여 대상 장치 또는 대기 상태 전환을 결정할 수 있다. 한 실시 예에 따르면, 제1 전자 장치(1610)는, 동작 1611에서, 자신의 스코어가 가장 높다고 판단하여, 제1 전자 장치(1610) 자신을 음성 명령을 수행할 대상 장치로 결정할 수 있다. 한 실시 예에 따르면, 제2 전자 장치(1620)와 제3 전자 장치(1630)는, 동작 1621 및 동작 1631에서, 자신들의 스코어가 제1 전자 장치(1610)의 스코어 보다 낮다고 판단하여, 다음 음성 호출 명령어를 대기하도록 결정할 수 있다.
동작 1613, 동작 1623, 동작 1633에서, 제1 전자 장치(1610), 제2 전자 장치(1620), 제3 전자 장치(1630)는 결정된 결과에 기반하여 대응하는 동작을 수행할 수 있다. 한 실시 예에 따르면, 제1 전자 장치(1610)는, 동작 1613에서, 음성 명령을 수행하도록 동작할 수 있다. 예를 들면, 제1 전자 장치(1610)는 음성 인식에 의한 관련 서비스를 수행(예: 음성 명령을 처리하고, 음성 명령에 관련된 기능을 수행)하도록 동작할 수 있다. 한 실시 예에 따르면, 제2 전자 장치(1620)와 제3 전자 장치(1630)는, 동작 1623 및 동작 1625에서, 대기 상태로 전환하도록 동작할 수 있다.
도 17은 본 발명의 다양한 실시 예들에 따른 전자 장치에서 음성 명령을 처리하는 동작을 도시하는 흐름도이다.
도 17을 참조하면, 동작 1701에서, 전자 장치(400)의 프로세서(480)는 음성 호출 명령어를 감지할 수 있다. 한 실시 예에 따르면, 전자 장치(400)는 음성 호출 명령어를 인식하기 위한 제1 프로세서(예: 웨이크-업 처리부, 웨이크-업 엔진)에 기반하여, 마이크를 통해 음성 호출 명령어를 인식할 수 있다.
동작 1703에서, 프로세서(480)는 음성 호출 명령어 감지에 대응하여 웨이크-업 할 수 있다. 한 실시 예에 따르면, 전자 장치(400)는 제1 프로세서의 음성 호출 명령어 감지에 기반하여, 제2 프로세서(예: 후속 명령어 인식부, 음성 인식 엔진, 서비스 제어 회로)을 웨이크-업 할 수 있다.
동작 1705에서, 프로세서(480)는 웨이크-업에 기반하여, 동일 계정의 그룹에 포함된 다른 전자 장치를 판별할 수 있다. 한 실시 예에 따르면, 프로세서(480)는 미리 설정된 정보(예: 도메인 리스트)를 참조하여 자신이 속한 계정과 동일 계정으로 그룹으로 속하는 전자 장치가 있는지 체크할 수 있다.
동작 1707에서, 프로세서(480)는 판별하는 결과에 기반하여 동일 계정으로 그룹화된 다른 전자 장치가 존재하는지 여부를 판단할 수 있다.
동작 1707에서, 프로세서(480)는 다른 전자 장치가 없는 것으로 판단하면(동작 1707의 아니오), 동작 1721로 진행하여, 동작 1721 이하의 동작 수행을 처리할 수 있다.
동작 1707에서, 프로세서(480)는 다른 전자 장치가 있는 것으로 판단하면(동작 1707의 예), 동작 1709에서, 음성 호출 명령어의 인식 스코어를 산출할 수 있다. 한 실시 예에 따르면, 프로세서(480)는 전술한 <수학식 1>과 도 9를 참조한 설명 부분에서 설명한 바와 같이, 다양한 상황을 고려하여 스코어를 산출할 수 있다.
동작 1711에서, 프로세서(480)는 산출된 스코어를 동일 계정의 다른 전자 장치들과 교환할 수 있다. 예를 들면, 전자 장치(400)는, 설정된 통신 인터페이스(예: 무선 통신부(410)를 이용하여, 자신의 스코어를 동일 계정의 다른 전자 장치로 전송하고, 동일 계정의 다른 전자 장치들로부터 그들의 스코어를 각각 수신할 수 있다. 한 실시 예에 따르면, 프로세서(480)는, 스코어를 산출하면, 설정된 통신 인터페이스(예: 무선 통신부(410))를 이용하여, 산출된 스코어 정보와 장치 정보를 다른 전자 장치와 교환하도록 동작을 수행할 수도 있다.
동작 1713에서, 프로세서(480)는 자신의 스코어와 다른 전자 장치로부터 수신된 스코어를 비교할 수 있다.
동작 1715에서, 프로세서(480)는 비교하는 결과에 기반하여, 자신의 스코어가 최상위 스코어에 해당하는지 여부를 판단할 수 있다.
동작 1715에서, 프로세서(480)는 자신의 스코어가 최상위 스코어가 아닌 것으로 판단하면(동작 1715의 아니오), 동작 1727로 진행하여, 동작 1727 이하의 동작 수행을 처리할 수 있다.
동작 1715에서, 프로세서(480)는 자신의 스코어가 최상위 스코어인 것으로 판단하면(동작 1715의 예), 동작 1717에서, 동일한 스코어의 다른 전자 장치가 있는지 여부를 판단할 수 있다. 한 실시 예에 따르면, 프로세서(480)는 동일 계정으로 그룹화된 다른 전자 장치들의 스코어들 중에서, 자신의 스코어와 동일한 스코어가 있는지 여부를 판단할 수 있다.
동작 1717에서, 프로세서(480)는 동일 스코어의 다른 전자 장치가 없는 것을 판단하면(동작 1717의 아니오), 동작 1723으로 진행하여, 동작 1723 이하의 동작 수행을 처리할 수 있다.
동작 1717에서, 프로세서(480)는 동일 스코어의 다른 전자 장치가 있는 것을 판단하면(동작 1717의 예), 동작 1719에서, 우선순위를 판단할 수 있다. 한 실시 예에 따르면, 동일 스코어를 가지는 다른 전자 장치는 하나 또는 그 이상일 수 있다. 프로세서(480)는, 미리 설정된 우선순위에 따라 우선순위 여부를 판단할 수 있다. 다양한 실시 예들에 따르면, 도메인 리스트에 장치 별 우선순위 정보가 설정될 수도 있다. 다양한 실시 예들에 따르면, 우선순위 여부 판단은, 후술하는 도면들과 같이 다른 결정 조건(예: 후속 명령어(예: 장치 지정 명령어, 도메인 명령어))에 기반하여 결정할 수 있다.
동작 1721에서, 프로세서(480)는 판단하는 결과에 기반하여 다른 전자 장치에 비해 우선순위가 높은지, 또는 다른 전자 장치에 비해 우선순위가 낮은지 여부를 판단할 수 있다.
동작 1721에서, 프로세서(480)는 우선순위가 높은 것을 판단하면(동작 1721의 예), 동작 1723에서, 음성 명령을 수행할 대상 장치인 것을 결정할 수 있다.
동작 1725에서, 프로세서(480)는 대상 장치 결정에 대응하여, 음성 명령을 처리할 수 있다. 예를 들면, 프로세서(480)는 사용자 발화에 대한 음성 인식 동작을 수행하고, 관련된 기능을 실행하는 것에 관련된 동작을 처리할 수 있다.
동작 1721에서, 프로세서(480)는 우선순위가 낮은 것을 판단하면(동작 1721의 아니오), 동작 1727에서, 음성 호출 명령어의 대기를 결정할 수 있다.
동작 1729에서, 프로세서(480)는 대기 결정에 대응하여, 대기 상태로 전환할 수 있다. 한 실시 예에 따르면, 프로세서(480)는 전자 장치(400)를 음성 호출 명령어를 대기하는 슬립 상태로 전환하고, 사용자 발화에 대한 음성 인식 동작은 수행하지 않을 수 있다.
도 18은 본 발명의 다양한 실시 예들에 따른 전자 장치에서 음성 명령을 수행할 대상 장치를 결정하는 예를 도시하는 흐름도이다.
도 18을 참조하면, 동작 1801에서, 전자 장치(400)의 프로세서(480)는 음성 호출 명령어를 감지할 수 있다. 한 실시 예에 따르면, 전자 장치(400)는 음성 호출 명령어를 인식하기 위한 제1 프로세서(예: 웨이크-업 처리부, 웨이크-업 엔진)에 기반하여, 마이크를 통해 음성 호출 명령어를 인식할 수 있다.
동작 1803에서, 프로세서(480)는 음성 호출 명령어 감지에 대응하여 웨이크-업 할 수 있다. 한 실시 예에 따르면, 전자 장치(400)는 제1 프로세서의 음성 호출 명령어 감지에 기반하여, 제2 프로세서(예: 후속 명령어 인식부, 음성 인식 엔진, 서비스 제어 회로)을 웨이크-업 할 수 있다.
동작 1805에서, 프로세서(480)는 웨이크-업에 기반하여, 음성 호출 명령어를 분석할 수 있다. 한 실시 예에 따르면, 프로세서(480)는 음성 호출 명령어와 함께 장치 지정 명령어(예: “Phone” 등)가 포함되는지, 또는 도메인 명령어(예: “음악 재생” 등)가 포함되는지 등과 같이 대상 장치를 결정하는 데 고려될 결정 조건을 판단할 수 있다. 다양한 실시 예들에 따라 결정 조건은 장치 지정 명령어와 도메인 명령어 중 하나 또는 그 이상이 포함될 수 있다.
동작 1807에서, 프로세서(480)는 분석하는 결과에 기반하여 장치 지정 명령어가 포함되는지 여부를 판단할 수 있다.
동작 1807에서, 프로세서(480)는 장치 지정 명령어를 포함하는 것을 판단하면(동작 1807의 예), 동작 1809에서, 지정된 장치를 판단할 수 있다. 예를 들면, 프로세서(480)는 장치 지정 명령어에 따라 지정된 장치가 자신의 전자 장치(400)인지 여부를 판단할 수 있다.
동작 1811에서, 프로세서(480)는 판단하는 결과에 기반하여 음성 명령을 수행할 대상 장치인지 여부를 판단할 수 있다. 한 실시 예에 따르면, 프로세서(480)는 장치 지정 명령어에서 전자 장치(400)를 지시하는 장치 정보(예: 장치 이름)인지 여부를 판단할 수 있다.
동작 1811에서, 프로세서(480)는 장치 지정 명령어가 전자 장치(400)를 지시하는 것을 판단하면(동작 1811의 예), 동작 1813에서, 전자 장치(400)를 음성 명령을 수행할 대상 장치로 결정할 수 있다. 한 실시 예에 따르면, 프로세서(480)는 장치 지정 명령어에서 지정된 장치가 자신의 전자 장치(400)이면, 음성 명령을 수행할 대상 장치로 결정할 수 있다.
동작 1815에서, 프로세서(480)는 대상 장치 결정에 대응하여, 음성 명령을 처리할 수 있다. 예를 들면, 프로세서(480)는 사용자 발화에 대한 음성 인식 동작을 수행하고, 관련된 기능을 실행하는 것에 관련된 동작을 처리할 수 있다.
동작 1811에서, 프로세서(480)는 장치 지정 명령어가 다른 전자 장치를 지시하는 것을 판단하면(동작 1811의 아니오), 동작 1817에서, 음성 호출 명령어의 대기를 결정할 수 있다.
동작 1819에서, 프로세서(480)는 대기 결정에 대응하여, 대기 상태로 전환할 수 있다. 한 실시 예에 따르면, 프로세서(480)는 전자 장치(400)를 음성 호출 명령어를 대기하는 슬립 상태로 전환하고, 사용자 발화에 대한 음성 인식 동작은 수행하지 않을 수 있다.
동작 1807에서, 프로세서(480)는 장치 지정 명령어를 포함하지 않는 것을 판단하면(동작 1807의 아니오), 동작 1821에서, 도메인 명령어를 포함하는지 여부를 판단할 수 있다.
동작 1821에서, 프로세서(480)는 도메인 명령어를 포함하는 것을 판단하면(동작 1821의 예), 동작 1823에서, 도메인 명령어에 기반하여 관련 동작을 처리할 수 있다. 이에 대한 구체적인 예시는 후술하는 도 19를 참조하여 상세히 설명된다.
동작 1821에서, 프로세서(480)는 도메인 명령어를 포함하지 않는 것을 판단하면(동작 1821의 아니오), 동작 1825에서, 동일 계정으로 그룹화된 장치들의 스코어에 기반하여 음성 명령을 수행할 대상 장치를 결정하는 등의 관련 동작을 처리할 수 있다.
도 19는 본 발명의 다양한 실시 예들에 따른 전자 장치에서 음성 명령을 수행할 대상 장치를 결정하는 예를 도시하는 흐름도이다.
도 19를 참조하면, 동작 1901에서, 전자 장치(400)의 프로세서(480)는 도메인 명령어를 포함하는 것을 판단하면, 도메인 리스트를 분석할 수 있다.
동작 1903에서, 프로세서(480)는 도메인 리스트의 분석하는 결과에 기반하여, 동일 계정으로 그룹화된 장치들 중 도메인 명령어에 따른 명령(기능)을 수행 가능한 하나 또는 그 이상의 장치들을 판별할 수 있다. 다양한 실시 예들에 따라, 프로세서(480)는 도메인 명령어에 따른 명령을 전자 장치(400)에서 수행할 수 없는 것을 판단할 시 후술하는 동작은 생략하고, 대기 상태로 자동으로 전환하도록 제어할 수 있다. 도 19의 예시에서는 전자 장치(400)가 도메인 명령어에 따른 명령(기능)을 수행 가능한 장치인 것을 예로 할 수 있다.
동작 1905에서, 프로세서(480)는 판별하는 결과에 기반하여 명령을 수행 가능한 장치가 복수의 장치들인지 여부를 판단할 수 있다. 예를 들면, 동일 계정으로 그룹화된 장치들 중 동일한 도메인을 가지는 다른 전자 장치들이 있는지 판단할 수 있다.
동작 1905에서, 프로세서(480)는 명령을 수행 가능한 장치가 하나인 것을 판단하면(동작 1905의 아니오), 동작 1921로 진행하여, 동작 1921 이하의 동작 수행을 처리할 수 있다. 예를 들면, 프로세서(480)는 전자 장치(400)를 음성 명령을 수행할 대상 장치로 결정할 수 있다.
동작 1905에서, 프로세서(480)는 명령을 수행 가능한 장치가 복수인 것을 판단하면(동작 1905의 예), 동작 1907에서, 해당 전자 장치들의 스코어에 기반하여 피드백 대상 장치를 결정할 수 있다. 한 실시 예에 따르면, 프로세서(480)는 명령이 수행 가능한 복수의 장치들 중 스코어가 높은 장치를 사용자의 피드백을 위한 장치로 결정할 수 있다. 예를 들면, 프로세서(480)는 TTS 또는 그 외의 방법 등으로, 사용자에게 음성 명령을 수행할 대상 장치를 결정(또는 선택)하도록 피드백을 제공할 수 있다.
동작 1909에서, 프로세서(480)는 전자 장치(400)가 피드백 대상 장치인지 여부를 판단할 수 있다. 한 실시 예에 따르면, 프로세서(480)는 전자 장치(400)의 스코어가 가장 높은 경우, 전자 장치(400)가 피드백 대상 장치인 것으로 판단할 수 있고, 전자 장치(400)의 스코어가 가장 높지 않은 경우, 전자 장치(400)가 피드백 대상 장치가 아닌 것으로 판단할 수 있다.
동작 1909에서, 프로세서(480)는 전자 장치(400)가 피드백 대상 장치인 것을 판단하면(동작 1909의 예), 동작 1911에서, 피드백을 출력할 수 있다. 다양한 실시 예들에 따르면, 프로세서(480)는 명령을 수행할 선택 가능한 장치들 중 어느 하나의 선택을 요청하는 정보를 안내할 수 있다. 다양한 실시 예들에 따라, 피드백 출력은, 시각적 또는 청각적 중 적어도 하나에 기반하여 제공될 수 있다. 한 실시 예에 따르면, 디스플레이를 통하여 관련 텍스트를 출력하거나, 스피커를 통하여 관련 오디오를 출력하거나, 또는 디스플레이와 스피커를 통해 함께 출력하도록 동작할 수도 있다.
동작 1913에서, 프로세서(480)는 사용자 발화에 따른 응답을 수신할 수 있다. 한 실시 예에 따르면, 사용자는, 장치 선택 피드백에 대응하여 특정 장치를 지정(선택)하는 음성을 발화할 수 있다
동작 1915에서, 프로세서(480)는 피드백 출력에 대응하는 응답이 수신되면, 수신된 응답에 기반하여, 전자 장치(400)가 음성 명령을 수행할 대상 장치인지 여부를 판단할 수 있다. 한 실시 예에 따르면, 프로세서(480)는 응답이 전자 장치(400)를 지정하는지, 또는 다른 전자 장치를 지정하는지 여부를 판단할 수 있다.
동작 1915에서, 프로세서(480)는 사용자의 응답이 다른 전자 장치를 지시하는 것을 판단하면(동작 1915의 아니오), 동작 1917에서, 지정된 다른 전자 장치에게 음성 명령을 수행할 것을 전달할 수 있다. 한 실시 예에 따르면, 프로세서(480)는 해당 대상 장치에게 음성 명령을 수행하도록 지시하는 제1 응답을 전송할 수 있다.
동작 1919에서, 프로세서(480)는 대기 상태로 전환할 수 있다. 한 실시 예에 따르면, 프로세서(480)는 전자 장치(400)를 음성 호출 명령어를 대기하는 슬립 상태로 전환하고, 사용자 발화에 대한 음성 인식 동작은 수행하지 않을 수 있다.
동작 1915에서, 프로세서(480)는 사용자의 응답이 전자 장치(400)를 지시하는 것을 판단하면(동작 1915의 예), 동작 1921에서, 전자 장치(400)를 음성 명령을 수행할 대상 장치로 결정할 수 있다.
동작 1923에서, 프로세서(480)는 대상 장치 결정에 대응하여, 다른 전자 장치에게 대기 상태로 전환할 것을 전달할 수 있다. 한 실시 예에 따르면, 프로세서(480)는 다른 전자 장치에게 음성 호출 명령어를 대기하는 대기 상태로 전환하도록 지시하는 제2 응답을 전송할 수 있다.
동작 1925에서, 프로세서(480)는 대상 장치 결정에 대응하여, 음성 명령을 처리할 수 있다. 예를 들면, 프로세서(480)는 사용자 발화에 대한 음성 인식 동작을 수행하고, 관련된 기능을 실행하는 것에 관련된 동작을 처리할 수 있다.
동작 1909에서, 프로세서(480)는 전자 장치(400)가 피드백 대상 장치가 아닌 것을 판단하면(동작 1909의 아니오), 동작 1927에서, 다른 전자 장치로부터의 응답 수신을 대기할 수 있다. 한 실시 예에 따르면, 프로세서(480)는 미리 설정된 일정 시간 동안 응답 수신을 위한 대기 상태((예: 슬립 상태의 대기가 아닌 시간 기반의 임시적(temporary) 대기 상태)에 존재할 수 있다. 다른 한 실시 예에 따라, 프로세서(480)는 임시 대기에 설정된 일정 시간이 경과할 시 자동으로 대기 상태(예: 슬립 상태)로 전환하도록 처리할 수도 있다.
동작 1929에서, 프로세서(480)는 다른 전자 장치로부터 응답을 수신할 수 있다.
동작 1931에서, 프로세서(480)는 수신된 응답이 음성 명령을 처리하도록 지시하는 제1 응답에 대응하는지, 또는 대기 상태로 전환하도록 지시하는 제2 응답에 대응하는지 여부를 판단할 수 있다.
동작 1931에서, 프로세서(480)는 수신된 응답이 제1 응답인 것을 판단하면(동작 1931의 예), 동작 1933에서, 전자 장치(400)를 음성 명령을 수행할 대상 장치로 결정할 수 있다.
동작 1935에서, 프로세서(480)는 대상 장치 결정에 대응하여, 음성 명령을 처리할 수 있다. 예를 들면, 프로세서(480)는 사용자 발화에 대한 음성 인식 동작을 수행하고, 관련된 기능을 실행하는 것에 관련된 동작을 처리할 수 있다.
동작 1931에서, 프로세서(480)는 수신된 응답이 제2 응답인 것을 판단하면(동작 1931의 아니오), 동작 1937에서, 음성 호출 명령어의 대기를 결정할 수 있다.
동작 1939에서, 프로세서(480)는 대기 결정에 대응하여, 대기 상태로 전환할 수 있다. 한 실시 예에 따르면, 프로세서(480)는 전자 장치(400)를 음성 호출 명령어를 대기하는 슬립 상태로 전환하고, 사용자 발화에 대한 음성 인식 동작은 수행하지 않을 수 있다.
이상에서 살펴본 바와 같이, 다양한 실시 예들에 따른 전자 장치의 동작 방법은, 음성 호출 명령어의 감지에 기반하여 웨이크-업(wake-up) 하는 동작, 상기 음성 호출 명령어의 인식에 관련된 스코어를 산출하는 동작, 상기 스코어를 외부 장치와 공유하는 동작, 상기 스코어에 기반하여 음성 명령의 수행 여부를 판단하는 동작, 및 상기 판단하는 결과에 기반하여 음성 명령을 처리하는 동작을 포함할 수 있다.
다양한 실시 예들에 따라, 상기 스코어를 산출하는 동작은, 사용자와의 거리, 전자 장치의 환경, 전자 장치의 위치, 전자 장치의 도메인, 또는 음성 인식률에 적어도 일부 기반하여 상기 스코어를 산출하는 동작을 포함할 수 있다.
다양한 실시 예들에 따라, 상기 음성 명령의 수행 여부를 판단하는 동작은, 상기 산출된 스코어를 상기 외부 장치에 전송하는 동작, 상기 외부 장치로부터 상기 스코어 기반하여 결정된 응답을 수신하는 동작, 및 상기 수신된 응답에 기반하여 상기 음성 명령의 처리 여부를 결정하는 동작을 포함할 수 있다.
다양한 실시 예들에 따라, 상기 음성 명령을 처리하는 동작은, 상기 외부 장치로부터의 응답이, 음성 명령을 처리하도록 지시하는 제1 응답이면, 상기 음성 명령을 처리하는 동작, 및 상기 외부 장치로부터의 응답이, 대기 상태로 전환하도록 지시하는 제2 응답이면, 대기 상태로 전환하는 동작을 포함할 수 있다.
다양한 실시 예들에 따라, 상기 음성 명령을 처리하는 동작은, 상기 외부 장치로부터의 응답이, 사용자에게 장치 선택을 요청하는 피드백 응답이면, 관련 피드백을 출력하는 동작, 및 상기 피드백에 대한 사용자의 장치 지정 명령어를 획득하는 동작을 포함할 수 있다.
다양한 실시 예들에 따라, 상기 음성 명령의 수행 여부를 판단하는 동작은, 상기 전자 장치의 스코어와 상기 외부 장치에 의해 획득되는 스코어를 판단하는 동작, 및 상기 전자 장치의 스코어가 높으면, 상기 음성 명령을 처리하는 대상 장치로 결정하는 동작을 포함할 수 있다.
다양한 실시 예들에 따라, 상기 음성 명령의 수행 여부를 판단하는 동작은, 장치 지정 명령어 또는 도메인 명령어에 기반하여 상기 음성 명령의 처리 여부를 결정하는 동작을 포함할 수 있다.
다양한 실시 예들에 따라, 상기 음성 명령의 수행 여부를 판단하는 동작은, 상기 도메인 명령어에 기반하여, 동일 계정으로 그룹화된 장치들 중 복수의 전자 장치들이 관련 도메인을 포함하면, 스코어에 기반하여 피드백 대상 장치를 결정하는 동작, 결정된 피드백 대상 장치에 기반하여 사용자에 의한 장치 선택을 획득하는 동작, 및 사용자에 의한 장치 선택에 대응하는 전자 장치를 음성 명령을 수행할 대상 장치로 결정하는 동작을 포함할 수 있다.
다양한 실시 예들에 따라, 상기 피드백 대상 장치의 결정 및 상기 대상 장치의 결정을 상기 외부 장치로부터 획득하는 동작을 포함할 수 있다.
다양한 실시 예들에 따라, 상기 외부 장치는, 동일 계정으로 그룹화된 전자 장치들의 스코어, 장치 지정 명령어 또는 도메인 명령어에 적어도 일부 기반하여 상기 음성 명령을 수행할 대상 장치를 결정하는 동작, 상기 결정된 대상 장치에게 음성 명령을 처리하도록 지시하는 제1 응답을 전송하는 동작, 및 상기 전자 장치들 중 상기 대상 장치 외의 다른 전자 장치에게 대기 상태로 전환하도록 지시하는 제2 응답을 전송하는 동작을 포함하고, 상기 전자 장치는, 상기 외부 장치로부터의 상기 제1 응답 수신에 기반하여 음성 명령을 처리하거나, 또는 상기 제2 응답 수신에 기반하여 대기 상태로 전환하는 동작을 포함할 수 있다.
다양한 실시 예들에 따라, 상기 음성 호출 명령어에 따라 웨이크-업 되는 동일 계정으로 그룹화된 복수의 전자 장치들 중 어느 하나에 의해, 상기 음성 명령을 처리하도록 결정하는 동작을 포함할 수 있다.
본 명세서와 도면에 개시된 본 발명의 다양한 실시 예들은 본 발명의 기술 내용을 쉽게 설명하고 본 발명의 이해를 돕기 위해 특정 예를 제시한 것일 뿐이며, 본 발명의 범위를 한정하고자 하는 것은 아니다. 따라서 본 발명의 범위는 여기에 개시된 실시 예들 이외에도 본 발명의 기술적 사상을 바탕으로 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.
400: 전자 장치
443: 마이크
480: 프로세서
510: 제1 프로세서
520: 제2 프로세서
530: 웨이크-업 처리부
540: 후속 명령어 인식부

Claims (23)

  1. 전자 장치에 있어서,
    마이크;
    메모리; 및
    상기 마이크 및 상기 메모리와 기능적으로 연결된 프로세서를 포함하고, 상기 프로세서는,
    음성 호출 명령어의 감지에 기반하여 웨이크-업(wake-up) 하고,
    상기 음성 호출 명령어의 인식에 관련된 스코어를 산출하고,
    상기 스코어를 외부 장치와 공유하고,
    상기 스코어에 기반하여 음성 명령의 수행 여부를 판단하고, 및
    상기 판단하는 결과에 기반하여 음성 명령을 처리하도록 설정된 전자 장치.
  2. 제1항에 있어서, 상기 프로세서는,
    음성 호출 명령어를 인식하기 위한 제1 프로세서; 및
    상기 제1 프로세서의 음성 호출 명령어 감지에 기반하여 웨이크-업 하고, 음성 인식 및 음성 명령에 관련된 동작을 처리하기 위한 제2 프로세서를 포함하도록 설정된 전자 장치.
  3. 제1항에 있어서, 상기 프로세서는,
    사용자와의 거리, 전자 장치의 환경, 전자 장치의 위치, 전자 장치의 도메인, 또는 음성 인식률에 적어도 일부 기반하여 상기 스코어를 산출하도록 설정된 전자 장치.
  4. 제1항에 있어서, 상기 프로세서는,
    상기 산출된 스코어를 상기 외부 장치에 전송하고,
    상기 외부 장치로부터 상기 스코어 기반하여 결정된 응답을 수신하고, 및
    상기 수신된 응답에 기반하여 상기 음성 명령의 처리 여부를 결정하도록 설정된 전자 장치.
  5. 제4항에 있어서, 상기 프로세서는,
    상기 외부 장치로부터의 응답이, 음성 명령을 처리하도록 지시하는 제1 응답이면, 상기 음성 명령을 처리하고, 및
    상기 외부 장치로부터의 응답이, 대기 상태로 전환하도록 지시하는 제2 응답이면, 대기 상태로 전환하도록 설정된 전자 장치.
  6. 제4항에 있어서, 상기 프로세서는,
    상기 외부 장치로부터의 응답이, 사용자에게 장치 선택을 요청하는 피드백 응답이면, 관련 피드백을 출력하고, 및
    상기 피드백에 대한 사용자의 장치 지정 명령어를 획득하도록 설정된 전자 장치.
  7. 제1항에 있어서, 상기 프로세서는,
    상기 전자 장치의 스코어와 상기 외부 장치에 의해 획득되는 스코어를 판단하고, 및
    상기 전자 장치의 스코어가 높으면, 상기 음성 명령을 처리하는 대상 장치로 결정하도록 설정된 전자 장치.
  8. 제7항에 있어서, 상기 프로세서는,
    장치 지정 명령어 또는 도메인 명령어에 기반하여 상기 음성 명령의 처리 여부를 결정하도록 설정된 전자 장치.
  9. 제8항에 있어서, 상기 프로세서는,
    상기 도메인 명령어에 기반하여, 동일 계정으로 그룹화된 장치들 중 복수의 전자 장치들이 관련 도메인을 포함하면, 스코어에 기반하여 피드백 대상 장치를 결정하고,
    결정된 피드백 대상 장치에 기반하여 사용자에 의한 장치 선택을 획득하고, 및
    사용자에 의한 장치 선택에 대응하는 전자 장치를 음성 명령을 수행할 대상 장치로 결정하도록 설정된 전자 장치.
  10. 제9항에 있어서, 상기 프로세서는,
    상기 피드백 대상 장치의 결정 및 상기 대상 장치의 결정을 상기 외부 장치로부터 획득하도록 설정된 전자 장치.
  11. 제1항에 있어서, 상기 외부 장치는,
    동일 계정으로 그룹화된 전자 장치들의 스코어, 장치 지정 명령어 또는 도메인 명령어에 적어도 일부 기반하여 상기 음성 명령을 수행할 대상 장치를 결정하고,
    상기 결정된 대상 장치에게 음성 명령을 처리하도록 지시하는 제1 응답을 전송하고, 및
    상기 전자 장치들 중 상기 대상 장치 외의 다른 전자 장치에게 대기 상태로 전환하도록 지시하는 제2 응답을 전송하도록 설정되고,
    상기 프로세서는,
    상기 외부 장치로부터의 상기 제1 응답 수신에 기반하여 음성 명령을 처리하거나, 또는 상기 제2 응답 수신에 기반하여 대기 상태로 전환하도록 설정된 전자 장치.
  12. 제1항에 있어서,
    상기 음성 호출 명령어에 따라 웨이크-업 되는 동일 계정으로 그룹화된 복수의 전자 장치들 중 어느 하나에 의해, 상기 음성 명령을 처리하도록 결정되는 것을 포함하는 전자 장치.
  13. 전자 장치에서 음성 서비스를 제공하는 방법에 있어서,
    음성 호출 명령어의 감지에 기반하여 웨이크-업(wake-up) 하는 동작,
    상기 음성 호출 명령어의 인식에 관련된 스코어를 산출하는 동작,
    상기 스코어를 외부 장치와 공유하는 동작,
    상기 스코어에 기반하여 음성 명령의 수행 여부를 판단하는 동작, 및
    상기 판단하는 결과에 기반하여 음성 명령을 처리하는 동작을 포함하는 방법.
  14. 제13항에 있어서, 상기 스코어를 산출하는 동작은,
    사용자와의 거리, 전자 장치의 환경, 전자 장치의 위치, 전자 장치의 도메인, 또는 음성 인식률에 적어도 일부 기반하여 상기 스코어를 산출하는 동작을 포함하는 방법.
  15. 제13항에 있어서, 상기 음성 명령의 수행 여부를 판단하는 동작은,
    상기 산출된 스코어를 상기 외부 장치에 전송하는 동작,
    상기 외부 장치로부터 상기 스코어 기반하여 결정된 응답을 수신하는 동작, 및
    상기 수신된 응답에 기반하여 상기 음성 명령의 처리 여부를 결정하는 동작을 포함하는 방법.
  16. 제15항에 있어서, 상기 음성 명령을 처리하는 동작은,
    상기 외부 장치로부터의 응답이, 음성 명령을 처리하도록 지시하는 제1 응답이면, 상기 음성 명령을 처리하는 동작, 및
    상기 외부 장치로부터의 응답이, 대기 상태로 전환하도록 지시하는 제2 응답이면, 대기 상태로 전환하는 동작을 포함하는 방법.
  17. 제15항에 있어서, 상기 음성 명령을 처리하는 동작은,
    상기 외부 장치로부터의 응답이, 사용자에게 장치 선택을 요청하는 피드백 응답이면, 관련 피드백을 출력하는 동작, 및
    상기 피드백에 대한 사용자의 장치 지정 명령어를 획득하는 동작을 포함하는 방법.
  18. 제13항에 있어서, 상기 음성 명령의 수행 여부를 판단하는 동작은,
    상기 전자 장치의 스코어와 상기 외부 장치에 의해 획득되는 스코어를 판단하는 동작, 및
    상기 전자 장치의 스코어가 높으면, 상기 음성 명령을 처리하는 대상 장치로 결정하는 동작을 포함하는 방법.
  19. 제18항에 있어서, 상기 음성 명령의 수행 여부를 판단하는 동작은,
    장치 지정 명령어 또는 도메인 명령어에 기반하여 상기 음성 명령의 처리 여부를 결정하는 동작을 포함하는 방법.
  20. 제19항에 있어서, 상기 음성 명령의 수행 여부를 판단하는 동작은,
    상기 도메인 명령어에 기반하여, 동일 계정으로 그룹화된 장치들 중 복수의 전자 장치들이 관련 도메인을 포함하면, 스코어에 기반하여 피드백 대상 장치를 결정하는 동작,
    결정된 피드백 대상 장치에 기반하여 사용자에 의한 장치 선택을 획득하는 동작, 및
    사용자에 의한 장치 선택에 대응하는 전자 장치를 음성 명령을 수행할 대상 장치로 결정하는 동작을 포함하는 방법.
  21. 제20항에 있어서,
    상기 피드백 대상 장치의 결정 및 상기 대상 장치의 결정을 상기 외부 장치로부터 획득하는 동작을 포함하는 방법.
  22. 제13항에 있어서, 상기 외부 장치는,
    동일 계정으로 그룹화된 전자 장치들의 스코어, 장치 지정 명령어 또는 도메인 명령어에 적어도 일부 기반하여 상기 음성 명령을 수행할 대상 장치를 결정하는 동작,
    상기 결정된 대상 장치에게 음성 명령을 처리하도록 지시하는 제1 응답을 전송하는 동작, 및
    상기 전자 장치들 중 상기 대상 장치 외의 다른 전자 장치에게 대기 상태로 전환하도록 지시하는 제2 응답을 전송하는 동작을 포함하고,
    상기 전자 장치는,
    상기 외부 장치로부터의 상기 제1 응답에 기반하여 음성 명령을 처리하거나, 또는 상기 제2 응답 수신에 기반하여 대기 상태로 전환하는 동작을 포함하는 방법.
  23. 제13항에 있어서,
    상기 음성 호출 명령어에 따라 웨이크-업 되는 동일 계정으로 그룹화된 복수의 전자 장치들 중 어느 하나에 의해, 상기 음성 명령을 처리하도록 결정하는 동작을 더 포함하는 방법.
KR1020170006047A 2017-01-13 2017-01-13 전자 장치 및 그의 동작 방법 KR20180083587A (ko)

Priority Applications (3)

Application Number Priority Date Filing Date Title
KR1020170006047A KR20180083587A (ko) 2017-01-13 2017-01-13 전자 장치 및 그의 동작 방법
PCT/KR2017/011504 WO2018131775A1 (ko) 2017-01-13 2017-10-18 전자 장치 및 그의 동작 방법
US16/476,364 US11636861B2 (en) 2017-01-13 2017-10-18 Electronic device and method of operation thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020170006047A KR20180083587A (ko) 2017-01-13 2017-01-13 전자 장치 및 그의 동작 방법

Publications (1)

Publication Number Publication Date
KR20180083587A true KR20180083587A (ko) 2018-07-23

Family

ID=62840444

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020170006047A KR20180083587A (ko) 2017-01-13 2017-01-13 전자 장치 및 그의 동작 방법

Country Status (3)

Country Link
US (1) US11636861B2 (ko)
KR (1) KR20180083587A (ko)
WO (1) WO2018131775A1 (ko)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109360559A (zh) * 2018-10-23 2019-02-19 三星电子(中国)研发中心 多智能设备同时存在时处理语音指令的方法和系统
KR20200017249A (ko) * 2018-08-08 2020-02-18 삼성전자주식회사 전자 장치에서 사용자 의도 확인을 위한 피드백 제공 방법 및 장치
CN110890092A (zh) * 2019-11-07 2020-03-17 北京小米移动软件有限公司 唤醒控制方法及装置、计算机存储介质
WO2020130549A1 (en) * 2018-12-17 2020-06-25 Samsung Electronics Co., Ltd. Electronic device and method for controlling electronic device
CN111369993A (zh) * 2020-03-03 2020-07-03 珠海格力电器股份有限公司 控制方法、装置、电子设备及存储介质
KR20200097839A (ko) * 2019-02-08 2020-08-20 한양대학교 에리카산학협력단 하이브리드 홈 음성인식 시스템 및 그 제공 방법
WO2020213767A1 (ko) * 2019-04-19 2020-10-22 엘지전자 주식회사 다중 디바이스 제어 시스템과 방법 및 이를 실행하기 위한 컴포넌트가 저장된 비 일시적 컴퓨터 판독 가능 매체
WO2021060573A1 (ko) * 2019-09-24 2021-04-01 엘지전자 주식회사 영상표시장치 및 이의 음성 인식 방법
KR20210039354A (ko) * 2020-05-18 2021-04-09 베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디. 음성 인터렉션 방법, 음성 인터렉션 기기 및 전자 기기
KR20210043902A (ko) * 2019-10-14 2021-04-22 주식회사 아이포바인 블루투스 메쉬 네트워크를 이용한 음성명령 처리 방법
WO2022065628A1 (en) * 2020-09-28 2022-03-31 Samsung Electronics Co., Ltd. Methods and systems for execution of voice commands
WO2023048358A1 (ko) * 2021-09-24 2023-03-30 삼성전자주식회사 전자 장치 및 그 제어 방법
WO2023058848A1 (ko) * 2021-10-07 2023-04-13 삼성전자주식회사 전자 장치 및 그 제어 방법

Families Citing this family (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11393461B2 (en) 2013-03-12 2022-07-19 Cerence Operating Company Methods and apparatus for detecting a voice command
EP3414759B1 (en) 2016-02-10 2020-07-01 Cerence Operating Company Techniques for spatially selective wake-up word recognition and related systems and methods
US11600269B2 (en) * 2016-06-15 2023-03-07 Cerence Operating Company Techniques for wake-up word recognition and related systems and methods
US11545146B2 (en) 2016-11-10 2023-01-03 Cerence Operating Company Techniques for language independent wake-up word detection
KR102542766B1 (ko) * 2016-11-17 2023-06-14 엘지전자 주식회사 디스플레이 장치 및 그의 동작 방법
US11489691B2 (en) * 2017-07-12 2022-11-01 Universal Electronics Inc. Apparatus, system and method for directing voice input in a controlling device
US10930276B2 (en) 2017-07-12 2021-02-23 Universal Electronics Inc. Apparatus, system and method for directing voice input in a controlling device
US11205421B2 (en) * 2017-07-28 2021-12-21 Cerence Operating Company Selection system and method
CN111742091B (zh) * 2018-02-23 2023-07-18 三星电子株式会社 洗衣机及其控制方法
CN108600911B (zh) * 2018-03-30 2021-05-18 联想(北京)有限公司 一种输出方法及电子设备
KR20200015267A (ko) * 2018-08-03 2020-02-12 삼성전자주식회사 음성 인식을 수행할 전자 장치를 결정하는 전자 장치 및 전자 장치의 동작 방법
US11100926B2 (en) * 2018-09-27 2021-08-24 Coretronic Corporation Intelligent voice system and method for controlling projector by using the intelligent voice system
US11087754B2 (en) 2018-09-27 2021-08-10 Coretronic Corporation Intelligent voice system and method for controlling projector by using the intelligent voice system
CN109545206B (zh) * 2018-10-29 2024-01-30 百度在线网络技术(北京)有限公司 智能设备的语音交互处理方法、装置和智能设备
CN109754788B (zh) * 2019-01-31 2020-08-28 百度在线网络技术(北京)有限公司 一种语音控制方法、装置、设备及存储介质
EP3709194A1 (en) 2019-03-15 2020-09-16 Spotify AB Ensemble-based data comparison
KR102245953B1 (ko) * 2019-06-05 2021-04-28 엘지전자 주식회사 복수의 전자기기의 제어방법
CN110381489B (zh) * 2019-07-22 2021-03-23 海信视像科技股份有限公司 蓝牙连接方法、显示终端及电视机
CN110457078B (zh) * 2019-08-09 2020-11-24 百度在线网络技术(北京)有限公司 智能服务方法、装置及设备
US11094319B2 (en) 2019-08-30 2021-08-17 Spotify Ab Systems and methods for generating a cleaned version of ambient sound
US10827028B1 (en) * 2019-09-05 2020-11-03 Spotify Ab Systems and methods for playing media content on a target device
KR20210033167A (ko) * 2019-09-18 2021-03-26 삼성전자주식회사 전자장치 및 그 음성인식 제어방법
US11348589B2 (en) * 2020-01-09 2022-05-31 International Business Machines Corporation Automatic contextual selection of a smart device
WO2021146661A2 (en) * 2020-01-17 2021-07-22 Syntiant Systems and methods for generating wake signals from known users
US11308959B2 (en) 2020-02-11 2022-04-19 Spotify Ab Dynamic adjustment of wake word acceptance tolerance thresholds in voice-controlled devices
US11328722B2 (en) 2020-02-11 2022-05-10 Spotify Ab Systems and methods for generating a singular voice audio stream
US11749284B2 (en) * 2020-11-13 2023-09-05 Google Llc Dynamically adapting on-device models, of grouped assistant devices, for cooperative processing of assistant requests
CN113689857B (zh) 2021-08-20 2024-04-26 北京小米移动软件有限公司 语音协同唤醒方法、装置、电子设备及存储介质
WO2023059041A1 (en) * 2021-10-06 2023-04-13 Samsung Electronics Co., Ltd. Methods and systems for providing an enhanced response to a query in an iot environment
WO2023080341A1 (en) * 2021-11-02 2023-05-11 Samsung Electronics Co., Ltd. Dynamic positioning of ai speaker in an iot ecosystem

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8635073B2 (en) * 2005-09-14 2014-01-21 At&T Intellectual Property I, L.P. Wireless multimodal voice browser for wireline-based IPTV services
US20090234983A1 (en) * 2008-03-17 2009-09-17 Golden Signals, Inc. Methods and apparatus for sharing a computer display screen
US20120096499A1 (en) * 2010-10-19 2012-04-19 Charles Dasher Apparatus and method for facilitating video-on-demand catalog search and content distribution
US8340975B1 (en) 2011-10-04 2012-12-25 Theodore Alfred Rosenberger Interactive speech recognition device and system for hands-free building control
US20130197914A1 (en) * 2012-01-26 2013-08-01 Microtechnologies Llc D/B/A Microtech Voice activated audio control system and associated method of use
US20140195233A1 (en) * 2013-01-08 2014-07-10 Spansion Llc Distributed Speech Recognition System
US9431014B2 (en) 2013-07-25 2016-08-30 Haier Us Appliance Solutions, Inc. Intelligent placement of appliance response to voice command
US9319993B1 (en) * 2014-05-30 2016-04-19 Amazon Technologies, Inc. Injecting active periods into scheduled inactive periods
US9226101B1 (en) * 2014-06-04 2015-12-29 Surround IO Federated bluetooth device network with roaming capability
KR102281178B1 (ko) 2014-07-09 2021-07-23 삼성전자주식회사 멀티-레벨 음성 인식 방법 및 장치
US9812128B2 (en) * 2014-10-09 2017-11-07 Google Inc. Device leadership negotiation among voice interface devices
US9424841B2 (en) * 2014-10-09 2016-08-23 Google Inc. Hotword detection on multiple devices
US9318107B1 (en) 2014-10-09 2016-04-19 Google Inc. Hotword detection on multiple devices
KR102299330B1 (ko) 2014-11-26 2021-09-08 삼성전자주식회사 음성 인식 방법 및 그 전자 장치
US9812126B2 (en) * 2014-11-28 2017-11-07 Microsoft Technology Licensing, Llc Device arbitration for listening devices
US9775113B2 (en) 2014-12-11 2017-09-26 Mediatek Inc. Voice wakeup detecting device with digital microphone and associated method
KR102577901B1 (ko) * 2015-11-18 2023-09-14 가우디오랩 주식회사 오디오 신호 처리 장치 및 방법

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200017249A (ko) * 2018-08-08 2020-02-18 삼성전자주식회사 전자 장치에서 사용자 의도 확인을 위한 피드백 제공 방법 및 장치
WO2020085798A1 (en) * 2018-10-23 2020-04-30 Samsung Electronics Co., Ltd. Method, device, and computer program product for processing voice instruction
CN109360559A (zh) * 2018-10-23 2019-02-19 三星电子(中国)研发中心 多智能设备同时存在时处理语音指令的方法和系统
US11367443B2 (en) 2018-12-17 2022-06-21 Samsung Electronics Co., Ltd. Electronic device and method for controlling electronic device
WO2020130549A1 (en) * 2018-12-17 2020-06-25 Samsung Electronics Co., Ltd. Electronic device and method for controlling electronic device
KR20200097839A (ko) * 2019-02-08 2020-08-20 한양대학교 에리카산학협력단 하이브리드 홈 음성인식 시스템 및 그 제공 방법
US11361765B2 (en) 2019-04-19 2022-06-14 Lg Electronics Inc. Multi-device control system and method and non-transitory computer-readable medium storing component for executing the same
WO2020213767A1 (ko) * 2019-04-19 2020-10-22 엘지전자 주식회사 다중 디바이스 제어 시스템과 방법 및 이를 실행하기 위한 컴포넌트가 저장된 비 일시적 컴퓨터 판독 가능 매체
WO2021060573A1 (ko) * 2019-09-24 2021-04-01 엘지전자 주식회사 영상표시장치 및 이의 음성 인식 방법
KR20210043902A (ko) * 2019-10-14 2021-04-22 주식회사 아이포바인 블루투스 메쉬 네트워크를 이용한 음성명령 처리 방법
CN110890092A (zh) * 2019-11-07 2020-03-17 北京小米移动软件有限公司 唤醒控制方法及装置、计算机存储介质
CN110890092B (zh) * 2019-11-07 2022-08-05 北京小米移动软件有限公司 唤醒控制方法及装置、计算机存储介质
CN111369993A (zh) * 2020-03-03 2020-07-03 珠海格力电器股份有限公司 控制方法、装置、电子设备及存储介质
CN111369993B (zh) * 2020-03-03 2023-06-20 珠海格力电器股份有限公司 控制方法、装置、电子设备及存储介质
KR20210039354A (ko) * 2020-05-18 2021-04-09 베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디. 음성 인터렉션 방법, 음성 인터렉션 기기 및 전자 기기
WO2022065628A1 (en) * 2020-09-28 2022-03-31 Samsung Electronics Co., Ltd. Methods and systems for execution of voice commands
WO2023048358A1 (ko) * 2021-09-24 2023-03-30 삼성전자주식회사 전자 장치 및 그 제어 방법
WO2023058848A1 (ko) * 2021-10-07 2023-04-13 삼성전자주식회사 전자 장치 및 그 제어 방법

Also Published As

Publication number Publication date
US11636861B2 (en) 2023-04-25
US20190355365A1 (en) 2019-11-21
WO2018131775A1 (ko) 2018-07-19

Similar Documents

Publication Publication Date Title
US11636861B2 (en) Electronic device and method of operation thereof
EP3567584B1 (en) Electronic apparatus and method for operating same
CN110199350B (zh) 用于感测语音结束的方法和实现该方法的电子设备
KR102414122B1 (ko) 사용자 발화를 처리하는 전자 장치 및 그 동작 방법
US11871188B2 (en) Electronic device including a microphone array
US10062381B2 (en) Method and electronic device for providing content
US10706847B2 (en) Method for operating speech recognition service and electronic device supporting the same
CN108023934B (zh) 电子装置及其控制方法
KR102356969B1 (ko) 통신 수행 방법 및 이를 지원하는 전자장치
KR20180085931A (ko) 음성 입력 처리 방법 및 이를 지원하는 전자 장치
KR102324074B1 (ko) 사운드 출력 제어 방법 및 전자 장치
KR20170046958A (ko) 전자 장치 및 그의 음성 인식을 이용한 기능 실행 방법
KR102561572B1 (ko) 센서 활용 방법 및 이를 구현한 전자 장치
KR102391487B1 (ko) 충전 및 데이터 통신 경로 제어 방법 및 이를 구현한 전자 장치
US10652680B2 (en) Electronic device and method for controlling input and output by electronic device
KR102324964B1 (ko) 외부 입력 장치의 입력을 처리하는 전자 장치 및 방법
KR20160129607A (ko) 전자 장치의 근거리 무선 통신 방법 및 이를 사용하는 전자 장치
KR102519902B1 (ko) 오디오 데이터를 처리하는 방법 및 이를 제공하는 전자 장치
KR20170027589A (ko) 기능 제어 방법 및 그 방법을 처리하는 전자 장치
KR20170022727A (ko) 전자 장치의 음향 처리 방법 및 그 전자 장치
KR20180014569A (ko) 근거리 무선 통신 네트워크에서 스캔 방법 및 이를 구현하는 전자 장치
KR20180101926A (ko) 전자 장치 및 전자 장치의 어플리케이션 제어 방법
KR102323797B1 (ko) 전자 장치 및 그의 정보 공유 방법
US10298733B2 (en) Method for executing function of electronic device using bio-signal and electronic device therefor
KR20180082043A (ko) 전자 장치 및 그의 음성을 이용한 통신 연결 방법