KR102503936B1 - 사용자 발화를 처리하는 디스플레이 장치 및 그 디스플레이 장치의 제어 방법 - Google Patents

사용자 발화를 처리하는 디스플레이 장치 및 그 디스플레이 장치의 제어 방법 Download PDF

Info

Publication number
KR102503936B1
KR102503936B1 KR1020170184791A KR20170184791A KR102503936B1 KR 102503936 B1 KR102503936 B1 KR 102503936B1 KR 1020170184791 A KR1020170184791 A KR 1020170184791A KR 20170184791 A KR20170184791 A KR 20170184791A KR 102503936 B1 KR102503936 B1 KR 102503936B1
Authority
KR
South Korea
Prior art keywords
displayed
user
layer
voice input
display
Prior art date
Application number
KR1020170184791A
Other languages
English (en)
Other versions
KR20190081926A (ko
Inventor
문지범
권진아
이계림
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020170184791A priority Critical patent/KR102503936B1/ko
Priority to US16/756,674 priority patent/US11460979B2/en
Priority to PCT/KR2018/016900 priority patent/WO2019132609A1/ko
Publication of KR20190081926A publication Critical patent/KR20190081926A/ko
Application granted granted Critical
Publication of KR102503936B1 publication Critical patent/KR102503936B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • G06F3/04845Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range for image manipulation, e.g. dragging, rotation, expansion or change of colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • G06F3/04842Selection of displayed objects or displayed text elements
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/04Segmentation; Word boundary detection
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2203/00Indexing scheme relating to G06F3/00 - G06F3/048
    • G06F2203/048Indexing scheme relating to G06F3/048
    • G06F2203/04804Transparency, e.g. transparent or translucent windows
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/225Feedback of the input speech

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • General Health & Medical Sciences (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

마이크; 복수의 레이어를 포함하는 화면을 표시하는 디스플레이; 복수의 어플리케이션 프로그램을 저장하는 메모리; 및 상기 복수의 레이어 중 제1 레이어에 사용자와 인터랙션(interaction)하기 위한 제1 UI(user interface)를 표시하고, 상기 복수의 레이어 중 제2 레이어에 상기 인터랙션을 수행하여 획득한 정보를 표시하기 위한 제2 UI를 표시하고, 상기 복수의 레이어 중 제3 레이어에 상기 제1 UI, 및 상기 제2 UI와 적어도 일부가 중첩되는 이미지를 표시하기 위한 적어도 하나의 프로세서;를 포함하고, 상기 적어도 하나의 프로세서는, 상기 마이크를 통해 상기 인터랙션을 수행하는 과정, 및 상기 인터랙션을 수행한 결과를 상기 제2 UI 및, 상기 제3 레이어 중 적어도 하나에 표시하는 과정에서, 상기 제1 UI를 상기 디스플레이에 표시하도록 설정되는 전자 장치가 개시된다. 이 외에도 명세서를 통해 파악되는 다양한 실시 예가 가능하다.

Description

사용자 발화를 처리하는 디스플레이 장치 및 그 디스플레이 장치의 제어 방법{DISPLAY APPARATUS FOR PROCESSING USER UTTERANCE AND CONTROL METHOD THEREOF}
본 문서에서 개시되는 실시 예들은, 사용자 발화를 처리하는 기술과 관련된다.
최근의 전자 장치들은 키보드나 마우스를 이용한 전통적인 입력 방식에 부가하여, 음성 입력과 같은 다양한 입력 방식을 지원할 수 있다. 예를 들어, 스마트폰(smart phone)이나 태블릿(tablet)과 같은 전자 장치들은 사용자 음성을 입력 받고, 입력된 사용자 음성에 대응되는 동작을 실행하는 서비스를 제공하고 있다. 이러한 음성 인식 서비스는 자연어를 처리하는 기술을 기반으로 발전하고 있다.
또한, 전자 장치는 사용자 발화에 대응되는 피드백을 제공하고 그에 대한 사용자 입력을 수신함으로써 사용자가 원하는 서비스를 제공할 수 있다.
디스플레이 장치는 수신된 사용자 발화에 대응되는 기능을 처리한 결과를 제공할 때, 사용자 발화를 수신하기 위한 UI와 사용자 발화를 처리한 결과를 표시하는 화면이 디스플레이에 서로 중복되게 표시되어 결과와 관련된 정보를 전달하는데 방해가 되는 것을 방지하기 위해, UI 및 결과를 표시한 화면을 디스플레이에 각각 표시할 수 있다. 이에 따라, 디스플레이 장치는 먼저 입력된 사용자 발화와 관련된 사용자 발화를 단속적으로 처리할 수 있을 뿐이고, 수신된 사용자 입력에 대한 피드백(feedback)도 제공하기 어려울 수 있다. 다시 말해, 디스플레이 장치는 서로 관련성 있는 복수의 사용자 입력을 유기적으로 처리하기 어려울 수 있다.
본 발명의 다양한 실시 예에 따른 디스플레이 장치는 사용자와의 인터랙션(interaction)을 통해 서로 관련성이 있는 사용자 발화를 유기적으로 처리할 수 있다.
본 문서에 개시되는 일 실시 예에 따른 디스플레이 장치는, 마이크; 복수의 레이어를 포함하는 화면을 표시하는 디스플레이; 복수의 어플리케이션 프로그램을 저장하는 메모리; 및 상기 복수의 레이어 중 제1 레이어에 사용자와 인터랙션(interaction)하기 위한 제1 UI(user interface)를 표시하고, 상기 복수의 레이어 중 제2 레이어에 상기 인터랙션을 수행하여 획득한 정보를 표시하기 위한 제2 UI를 표시하고, 상기 복수의 레이어 중 제3 레이어에 상기 제1 UI, 및 상기 제2 UI와 적어도 일부가 중첩되는 이미지를 표시하기 위한 적어도 하나의 프로세서;를 포함하고, 상기 적어도 하나의 프로세서는, 상기 마이크를 통해 상기 인터랙션을 수행하는 과정, 및 상기 인터랙션을 수행한 결과를 상기 제2 UI 및, 상기 제3 레이어 중 적어도 하나에 표시하는 과정에서, 상기 제1 UI를 상기 디스플레이에 표시하도록 설정될 수 있다.
또한, 본 문서에 개시되는 일 실시 예에 따른 방법은, 디스플레이에 표시된 화면에 포함된 복수의 레이어 중 제1 레이어에 사용자와 인터랙션하기 위한 제1 UI(user interface)를 표시하는 동작; 마이크를 통해 제1 사용자 입력을 수신하는 동작; 및 상기 제1 사용자 입력에 대응되는 결과를 상기 복수의 레이어 중 제2 레이어에 상기 인터랙션을 수행하여 획득한 정보를 표시하기 위한 제2 UI, 또는 상기 제1 UI, 및 상기 제2 UI와 적어도 일부가 중첩되는 이미지가 표시되는 제3 레이어에 표시하는 동작;을 포함할 수 있다.
또한, 본 문서에 개시되는 일 실시 예에 따른 저장 매체는, 디스플레이에 표시된 화면에 포함된 복수의 레이어 중 제1 레이어에 사용자와 인터랙션하기 위한 제1 UI(user interface)를 표시하는 동작; 마이크를 통해 제1 사용자 입력을 수신하는 동작; 및 상기 제1 사용자 입력에 대응되는 결과를 상기 복수의 레이어 중 제2 레이어에 상기 인터랙션을 수행하여 획득한 정보를 표시하기 위한 제2 UI, 또는 상기 제1 UI, 및 상기 제2 UI와 적어도 일부가 중첩되는 이미지가 표시되는 제3 레이어에 표시하는 동작;을 포함하는 방법을 수행하는 프로그램이 기록될 수 있다.
본 문서에 개시되는 실시 예들에 따르면, 디스플레이 장치는 사용자 발화에 따라 지정된 기능을 수행하는 과정에서 사용자와 인터렉션을 수행하기 위한 UI, 및 상기 지정된 동작을 수행한 결과를 표시하기 위한 UI를 복수의 레이어(layer)에 표시함으로써, 컨텐트의 이미지의 가림을 최소화 하면서 서로 관련성이 있는 복수의 사용자 발화를 유기적으로 처리할 수 있고, 사용자에게 디스플레이 장치와 대화하는 것과 같은 사용자 경험(user experience)을 제공할 수 있다.
이 외에, 본 문서를 통해 직접적 또는 간접적으로 파악되는 다양한 효과들이 제공될 수 있다.
도 1은 다양한 실시 예에 따른 사용자 발화 처리 시스템을 나타낸 도면이다.
도 2는 본 발명의 다양한 실시 예에 따른 디스플레이 장치의 구성을 나타낸 블록도이다.
도 3은 본 발명의 다양한 실시 예에 따른 디스플레이에 표시된 화면의 복수의 레이어를 나타낸 도면이다.
도 4는 다양한 실시 예에 따른 디스플레이 장치가 복수의 레어어를 포함하는 화면을 디스플레이에 표시하는 방법을 나타낸 도면이다.
도 5는 일 실시 예에 따른 디스플레이 장치는 사용자 발화에 따라 채널(channel)을 변경하는 화면이다.
도 6은 일 실시 예에 따른 디스플레이 장치는 사용자 발화에 따라 VOD(video on demand)를 제공하는 화면이다.
도 7은 일 실시 예에 따른 디스플레이 장치는 사용자 발화에 따라 앱을 실행시키는 화면이다.
도 8은 일 실시 예에 따른 디스플레이 장치의 사용자 발화에 따른 볼륨(volume)을 변경시키는 화면을 나타낸 것이다.
도 9는 일 실시 예에 따른 디스플레이 장치의 사용자 발화에 따라 옵션 메뉴를 디스플레이에 표시하는 화면이다.
도 10은 일 실시 예에 따른 디스플레이 장치가 사용자 발화에 따라 시청 예약을 하는 화면이다.
도 11은 일 실시 예에 따른 디스플레이 장치가 사용자 발화에 따라 항공권을 예약하는 화면이다.
도 12는 일 실시 예에 따른 디스플레이 장치가 사용자 발화에 따라 음식를 주문하는 화면이다.
도 13은 일 실시 예에 따른 디스플레이 장치가 사용자 발화에 따라 날씨 정보를 표시하는 화면이다.
도 14는 일 실시 예에 따른 디스플레이 장치가 사용자 발화에 따라 지정된 정보를 제공하고 시청 예약을 하는 화면이다.
도면의 설명과 관련하여, 동일 또는 유사한 구성요소에 대해서는 동일 또는 유사한 참조 부호가 사용될 수 있다.
이하, 본 발명의 다양한 실시 예가 첨부된 도면을 참조하여 기재된다. 그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 실시 예의 다양한 변경(modification), 균등물(equivalent), 및/또는 대체물(alternative)을 포함하는 것으로 이해되어야 한다. 도면의 설명과 관련하여, 유사한 구성요소에 대해서는 유사한 참조 부호가 사용될 수 있다.
도 1은 다양한 실시 예에 따른 사용자 발화 처리 시스템을 나타낸 도면이다.
도 1을 참조하면, 사용자 발화 처리 시스템(10)은 디스플레이 장치(100), 및 사용자 발화 처리 서버(200)를 포함할 수 있다. 디스플레이 장치(100)와 사용자 발화 처리 서버(200) 통신망을 통해 연결될 수 있다.
일 실시 예에 따르면, 디스플레이 장치(100)는 컨텐트를 사용자에게 제공할 수 있다. 예를 들어, 디스플레이 장치(100)는 컨텐트에 포함된 이미지, 및 사운드를 디스플레이, 및 스피커를 통해 각각 출력함으로써, 사용자에게 컨텐트를 제공할 수 있다. 일 실시 예에 따르면, 사용자 발화 처리 시스템(10)은 메모리에 저장된 컨텐트를 출력하거나, 외부 장치로부터 수신된 컨텐트를 출력할 수 있다.
일 실시 예에 따르면, 디스플레이 장치(100)는 정보를 제공하기 위한 UI(user interface)를 디스플레이에 표시할 수 있다. 예를 들어, 디스플레이 장치(100)는 사용자 발화를 수신하기 위한 UI를 디스플레이에 표시할 수 있다. 다른 예를 들어, 디스플레이 장치(100)는 지정된 동작을 실행한 결과를 UI에 표시할 수 있다. 상기 UI는, 예를 들어, 디스플레이에 표시된 컨텐트의 이미지 상에 표시될 수 있다. 다시 말해, 상기 UI의 적어도 일부는 상기 컨텐트의 이미와 중복되어 표시될 수 있다.
일 실시 예에 따르면, 디스플레이 장치(100)는 사용자에게 지정된 서비스를 제공할 수 있다. 예를 들어, 디스플레이 장치(100)는 설치된 어플리케이션 프로그램(application program)(또는, 앱(app))을 통해 사용자에게 지정된 서비스를 제공할 수 있다. 다시 말해, 디스플레이 장치(100)는 앱을 실행시키고, 실행된 앱을 통해 사용자 입력에 대응되는 서비스를 제공할 수 있다.
일 실시 예에 따르면, 디스플레이 장치(100)는 지정된 기능을 수행하기 위한 사용자 발화를 수신할 수 있다. 일 실시 예에 따르면, 디스플레이 장치(100)는 상기 수신된 사용자 발화를 처리하여 지정된 서비스를 사용자에게 제공할 수 있다. 일 실시 예에 따르면, 디스플레이 장치(100)는 수신된 사용자 발화를 사용자 발화 처리 서버(200)를 통해 처리할 수 있다. 예를 들어, 디스플레이 장치(100)는 수신된 사용자 발화를 사용자 발화 처리 서버(200)로 송신하고, 사용자 발화 처리 서버(200)로부터 지정된 기능을 수행하기 위한 정보(예: 패스 룰)을 수신할 수 있다.
일 실시 예에 따르면, 사용자 발화 처리 장치(200)는 사용자 발화를 처리할 수 있다. 예를 들어, 사용자 발화 처리 장치(200)는 디스플레이 장치(100)로부터 사용자 발화를 수신하고, 상기 수신된 발화를 처리하여 디스플레이 장치(100)로 송신할 수 있다.
일 실시 예에 따르면, 사용자 발화 처리 장치(200)는 수신된 사용자 발화를 처리할 수 있다. 일 실시 예에 따르면, 사용자 발화 처리 장치(200)는 사용자 발화를 텍스트로 변경하기 위한 자동 음성 인식 모듈(auto speech recognition module)(또는, ASR 모듈), 및 사용자 발화의 의도를 파악하기 위한 자연어 이해 모듈(natural language understanding module)(또는, NLU 모듈)을 포함할 수 있다.
일 실시 예에 따르면, ASR 모듈은 수신된 사용자 발화에 대응되는 텍스트를 생성할 수 있다. 일 실시 예에 따르면, NLU 모듈은 상기 생성된 텍스트를 분석하여 사용자 발화에 대응되는 기능을 결정할 수 있다. 예를 들어, NLU 모듈은 텍스트를 분석하여 사용자의 의도를 파악하고, 상기 의도에 따라 수행할 기능을 결정할 수 있다. 또한, NLU 모듈은 텍스트로부터 상기 결정된 기능을 수행하는데 필요한 파라미터를 추출할 수 있다. 이에 따라, 사용자 발화 처리 장치(200)는 상기 결정된 기능, 및 상기 추출된 파라미터를 포함하는 정보(예: 패스 룰)을 생성(또는, 선택할 수 있다.
디스플레이 장치(100)는 단속적으로 수신된 사용자 발화를 처리할 수 있다. 예를 들어, 디스플레이 장치(100)는 사용자 입력을 수신하고, 상기 수신된 사용자 입력에 대응되는 기능을 수행한 결과를 제공할 수 있다. 다시 말해, 디스플레이 장치(100)는 사용자 발화를 수신 위한 UI, 및 사용자 발화를 처리한 결과를 디스플레이에 각각 표시할 수 있다. 이에 따라, 디스플레이 장치(100)는 수신된 사용자 발화에 대응되는 기능을 수행할 때, 수신된 사용자 발화에 대한 피드백(feedback)을 유기적으로 제공하기 어려울 수 있다. 또한, 사용자는 먼저 입력된 사용자 발화와 관련된 추가 기능을 실행하기 위해, 상기 먼저 입력된 사용자 발화에 포함된 정보를 다시 입력해야 하는 불편함이 있을 수 있다. 본 발명의 다양한 실시 예에 따른 디스플레이 장치(100)는 사용자와 유기적인 인터랙션(interaction)을 통해 대화 형식으로 지정된 기능을 수행할 수 있다.
도 2는 본 발명의 다양한 실시 예에 따른 디스플레이 장치의 구성을 나타낸 블록도이다.
도 2를 참조하면, 디스플레이 장치(100)는 통신 인터페이스(110), 마이크(120), 디스플레이(130), 스피커(140), 메모리(150), 및 프로세서(160)를 포함할 수 있다.
일 실시 예에 따르면, 통신 인터페이스(110)는 외부 장치와 통신을 위해 연결될 수 있다. 예를 들어, 통신 인터페이스(110)는 사용자 발화 처리 서버(200)에 연결되어, 사용자 발화 처리 서버(200)로 사용자 발화를 송신할 수 있다. 일 일 실시 예에 따르면, 통신 인터페이스(110)는 유선 통신 인터페이스, 및 무선 인터페이스를 포함할 수 있다. 유선 통신 인터페이스(예: HDMI(High-Definition Multimedia Interface), DVI(digital visual interface) 인터페이스, VGA(video graphics array) 인터페이스 등)는, 예를 들어, 셋톱 박스(set-top box), DVD(digital versatile disc) 플레이어 등의 외부 장치와 유선을 통해 연결되어 컨텐트를 수신할 수 있다. 무선 통신 인터페이스는 AP(access point)를 통해 사용자 발화 처리 서버(200)로 연결되어 사용자 발화를 처리할 수 있다.
일 실시 예에 따르면, 마이크(120)는 사용자로부터 사용자 발화를 수신할 수 있다. 다시 말해, 마이크(120)는 사용자 발화를 음성 신호로 수신할 수 있다. 예를 들어, 마이크(120)는 발화 입력 시스템(speech input system)을 통해 사용자 발화를 음성 신호로 수신할 수 있다.
일 실시 예에 따르면, 디스플레이(130)는 이미지(또는, 비디오 이미지)를 표시할 수 있다. 예를 들어, 디스플레이(130)는 컨텐트(content)의 이미지를 표시할 수 있다. 다른 예를 들어, 디스플레이(130)는 실행된 앱의 UI(user interface)를 표시할 수 있다. 상기 UI는, 예를 들어, 그래픽 사용자 인터페이스(graphic user interface(GUI)일 수 있다.
일 실시 예에 따르면, 스피커(140)는 사운드를 출력할 수 있다. 예를 들어, 스피커(140)는 컨텐트의 사운드를 출력할 수 있다. 다른 예를 들어, 스피커(140)는 음성 사운드를 출력할 수 있다. 상기 음성 사운드는, 예를 들어 사용자 입력에 대응되는 피드백(feedback) 음성일 수 있다.
일 실시 예에 따르면, 메모리(150)는 복수의 앱(151, 153, 155)를 포함할 수 있다. 복수의 앱(151, 153, 155)은, 예를 들어, 사용자 입력에 대응되는 기능을 수행하기 위한 프로그램(program)일 수 있다. (휘발성, 비휘발성 메모리 포함)
일 실시 예에 따르면, 제1 앱(151)은 지정된 컨텐트를 제공하기 위한 앱일 수 있다. 예를 들어, 제1 앱(151)은 사용자 입력에 대응되는 VOD(video on demand)를 제공할 수 있다. 일 실시 예에 따르면, 제2 앱(153)은 지정된 정보를 획득하기 위한 앱일 수 있다. 예를 들어, 제2 앱(153)은 스포츠 경기 결과에 대한 정보, 지역 날씨 정보 등을 획득할 수 있다. 일 실시 예에 따르면, 제3 앱(155)은 상품 등을 구입하기 위한 앱일 수 있다. 예를 들어, 제3 앱(155)은 여행 상품을 예약, 음식을 주문 등을 제공할 수 있다.
일 실시 예에 따르면, 프로세서(160)는 통신 인터페이스(110), 마이크(120), 디스플레이(130), 스피커(140), 메모리(150)와 동작 가능하도록 연결되어, 디스플레이 장치(100)의 전반적인 동작을 제어할 수 있다.
일 실시 예에 따르면, 프로세서(160)는 컨텐트를 출력할 수 있다. 예를 들어, 프로세서(160)는 통신 인터페이스(110)를 통해 외부 장치로부터 수신된 컨텐트에 포함된 이미지, 및 사운드를 각각 디스플레이(130) 및 스피커(140)를 통해 출력할 수 있다. 일 실시 예에 따르면, 프로세서(160)는 사용자 입력에 대응되는 컨텐트를 출력할 수 있다.
일 실시 예에 따르면, 프로세서(160)는 정보를 제공하는 UI를 디스플레이(130)에 표시할 수 있다. 예를 들어, 프로세서(160)는 사용자와 인터랙션하기 위한 UI를 표시할 수 있다. 또한, 프로세서(160)는 사용자 발화에 대응되는 피드백, 또는 결과(또는, 정보)를 제공할 수 있다.
일 실시 예에 따르면, 프로세서(160)는 복수의 레이어를 포함하는 화면을 디스플레이(130)에 표시할 수 있다. 예를 들어, 프로세서(160)는 사용자와 인터랙션하기 위한 UI, 상기 인터랙션을 수행하여 획득한 정보를 표시하기 위한 UI, 사용자 입력에 대한 피드백을 표시하기 위한 UI, 및 컨텐트의 이미지를 복수의 레이어에 각각 표시할 수 있다.
일 실시 예에 따르면, 프로세서(160)는 복수의 레이어 각각에 표시된 사용자와 인터랙션하기 위한 UI, 상기 인터랙션을 수행하여 획득한 정보를 표시하기 위한 UI, 사용자 입력에 대한 피드백을 표시하기 위한 UI, 및 컨텐트의 이미지를 합성하여 디스플레이(130)에 표시할 수 있다. 이에 따라, 상기 복수의 레이어 각각에 표시된 사용자와 인터랙션하기 위한 UI, 상기 인터랙션을 수행하여 획득한 정보를 표시하기 위한 UI, 및 사용자 입력에 대한 피드백을 표시하기 위한 UI는, 예를 들어, 컨텐트의 이미지가 표시된 화면의 지정된 영역에 각각 표시될 수 있다.
일 실시 예에 따르면, 프로세서(160)는 사용자 발화 처리 모듈(161), 및 실행 매니저 모듈(163)을 포함할 수 있다.
일 실시 예에 따르면, 사용자 발화 처리 모듈(161)은 마이크(120)를 통해 수신된 사용자 발화(또는, 제1 사용자 발화)를 처리할 수 있다. 예를 들어, 사용자 발화 처리 모듈(161)은 상기 수신된 사용자 발화를 사용자 발화 처리 서버(200)로 송신하고, 사용자 발화 처리 서버(200)로부터 상기 사용자 발화에 대응되는 기능을 수행하기 위한 정보를 수신할 수 있다. 다시 말해, 사용자 발화 처리 모듈(161)은 사용자 발화 처리 서버(200)를 통해 상기 사용자 발화를 처리할 수 있다.
일 실시 예에 따르면, 사용자 발화 처리 모듈(161)은 상기 수신된 사용자 발화에 대한 피드백을 제공할 수 있다. 예를 들어, 사용자 발화 처리 모듈(161)은 상기 사용자 발화가 지정된 기능을 실행하기에 부족한 정보를 포함하고 있는 경우, 상기 사용자 발화에 대한 피드백을 제공할 수 있다. 상기 피드백은, 예를 들어, 상기 부족한 정보의 입력 요청이 포함될 수 있다. 일 실시 예에 따르면, 사용자 발화 처리 모듈(161)은 상기 피드백에 대응되는 사용자 발화(또는, 제2 사용자 발화)를 수신할 수 있다. 사용자 발화 처리 모듈(161)은 상기 수신된 사용자 발화를 처리할 수 있다.
일 실시 예에 따르면, 프로세서(160)는 디스플레이(130)에 표시된 화면에 포함된 복수의 레이어 중 하나의 레이어(또는, 제1 레이어)에 사용자와 인터랙션하기 위한 UI(또는, 제1 UI)를 표시할 수 있다. 상기 인터랙션은, 예를 들어, 사용자 발화, 및 피드백을 포함할 수 있다. 일 실시 예에 따르면, 프로세서(160)는 사용자 발화 처리 모듈(161)의 상태를 나타내기 위한 인디케이터(indicator)를 상기 UI에 표시할 수 있다. 예를 들어, 프로세서(160)는 사용자 발화 처리 모듈(161)이 사용자 발화를 수신하고 있는 경우, 인디케이터를 제1 상태(예: 파란색)로 표시할 수 있다. 프로세서(160)는 사용자 발화 처리 모듈(161)이 피드백을 제공하는 경우, 인디케이터를 제2 상태(예: 흰색)로 표시할 수 있다. 이에 따라, 사용자는 상기 인디케이터를 통해 인터랙션의 과정을 인식할 수 있다.
일 실시 예에 따르면, 프로세서(160)는 디스플레이(130)에 표시된 화면에 포함된 복수의 레이어 중 하나의 레이어(또는, 제2 레이어)에 피드백을 출력하기 위한 UI(또는, 제2 UI)를 표시할 수 있다. 일 실시 예에 따르면, 프로세서(160)는 상기 UI 스피커(130)를 통해 상기 피드백을 출력할 수 있다. 다시 말해, 프로세서(160)는 상기 UI를 통해 출력된 피드백과 동일한 내용을 출력할 수 있다.
일 실시 예에 따르면, 프로세서(160)는 사용자 발화 처리 모듈(161)을 통해 처리된 사용자 발화에 대응되는 기능을 실행할 수 있다. 예를 들어, 프로세서(160)는 디스플레이(130)에 표시된 화면에 포함된 복수의 레이어 중 하나의 레이어(또는, 제3 레이어)에 상기 처리된 사용자 발화에 대응되는 컨텐트의 이미지를 표시할 수 있다. 상기 사용자 발화는, 예를 들어, 채널을 변경하기 위한 입력일 수 있다. 상기 사용자 발화는, 다른 예를 들어, 지정된 컨텐트를 출력하기 위한 입력일 수 있다. 다른 예를 들어, 프로세서(160)는 사용자 발화 처리 모듈(161) 통해 처리된 사용자 발화에 대한 정보를 실행 매니저 모듈(163)으로 전달할 수 있다.
일 실시 예에 따르면, 실행 매니저 모듈(163)은 사용자 발화 처리 모듈(161)로부터 전달 받은 정보를 이용하여 지정된 기능을 수행할 수 있다. 일 실시 예에 따르면, 실행 매니저 모듈(163)은 상기 정보에 기초하여 메모리(150)에 저장된 복수의 앱 중 적어도 하나를 선택하고, 상기 선택된 앱을 실행하여 지정된 기능을 수행할 수 있다. 상기 지정된 기능은, 예를 들어, 사용자 입력에 대응되는 기능일 수 있다.
일 실시 예에 따르면, 프로세서(160)는 디스플레이(130)에 표시된 화면에 포함된 복수의 레이어 중 하나의 레이어(또는, 제4 레이어)에 실행 매니저 모듈(163)에 의해 수행된 기능의 결과를 표시하기 위한 UI(또는, 제3 UI)를 표시할 수 있다. 예를 들어, 프로세서(160)는 사용자 발화에 대응되는 기능을 수행하여 정보를 획득하고, 상기 획득된 정보를 실행 매니저 모듈(163)에 의해 수행된 기능의 결과를 표시하기 위한 UI에 표시할 수 있다. 일 실시 예에 따르면, 프로세서(160)는 디스플레이(130)에 표시된 화면에 포함된 복수의 레이어 중 하나의 레이어(또는, 제3 레이어)에 사용자 입력에 대응되는 기능을 수행하기 위해 실행된 어플리케이션의 UI(또는, 제4 UI)를 표시할 수 있다. 예를 들어, 프로세서(160)는 컨텐트의 이미지가 표시된 레이어에 컨텐트의 이미지를 대신하여, 사용자 입력에 대응되는 기능을 수행하기 위해 실행된 어플리케이션의 UI를 표시할 수 있다.
일 실시 예에 따르면, 프로세서(160)는 마이크(120)를 통해 제1 사용자 발화를 수신할 수 있다. 프로세서(160)는 상기 수신된 제1 사용자 발화를 처리할 수 있다. 예를 들어, 프로세서(160)는 통신 인터페이스(110)를 통해 사용자 발화를 사용자 발화 처리 서버(200)로 송신하고, 상기 사용자 발화에 대응되는 기능을 실행하기 위한 정보를 수신할 수 있다. 일 실시 예에 따르면, 프로세서(160)는 상기 수신된 정보를 이용하여 제1 사용자 발화에 대응되는 결과를 디스플레이(130)에 표시할 수 있다. 예를 들어, 프로세서(160)는 상기 결과를 복수의 레이어 중 하나의 레이어(예: 제2 레이어에 표시된 제2 UI, 또는 제3 레이어)에 표시될 수 있다.
일 실시 예에 따르면, 프로세서(160)는 마이크(120)를 통해 인터랙션을 수행하는 과정, 및 상기 인터랙션을 수행한 결과를 복수의 레이어 중 하나의 레이어에 표시하는 과정에서, 상기 인터랙션을 수행하기 위한 UI를 디스플레이(130)에 표시할 수 있다. 다시 말해, 프로세서(160)는 사용자 발화를 처리하는 과정에서, 사용자와의 인터랙션을 수행하기 위한 UI를 표시할 수 있다. 이에 따라, 사용자는 디스플레이 장치(100)가 동작하는데 필요한 사용자 입력을 지속적으로 입력할 수 있다.
일 실시 예에 따르면, 디스플레이 장치(100)는 수신된 사용자 발화에 대한 피드백, 및 상기 피드백에 대응되는 사용자 입력을 수신함으로써, 대화 형식의 사용자 경험(user experience)(UX)을 사용자에게 제공할 수 있다.
도 3은 본 발명의 다양한 실시 예에 따른 디스플레이에 표시된 화면의 복수의 레이어를 나타낸 도면이다.
도 3을 참조하면, 디스플레이 장치(100)는 복수의 레이어를 포함하는 화면을 디스플레이에 표시할 수 있다. 상기 복수의 레이어는, 예를 들어, 제1 레이어(310), 제2 레이어(320), 제3 레이어(330), 및 제4 레이어(340)을 포함할 수 있다.
일 실시 예에 따르면, 디스플레이 장치(100)는 복수의 레이어 중 제1 레이어(310)에 사용자와 인터랙션하기 위한 제1 UI(310a)(예: 도 2의 제1 UI)를 표시할 수 있다. 제1 UI(310a)는, 예를 들어, 제1 레이어(310)의 일부 영역에 표시될 수 있다. 일 실시 예에 따르면, 디스플레이 장치(100)는 제1 UI(310a)에 디스플레이 장치(100)의 상태를 나타내는 인디케이터를 표시할 수 있다. 또한, 디스플레이 장치(100)는 제1 UI(310a)에 수신된 사용자 발화, 및 사용자 발화에 대한 대답(reply)를 표시할 수 있다.
일 실시 예에 따르면, 디스플레이 장치(100)는 복수의 레이어 중 제2 레이어(320)(예: 도 2의 제2 레이어)에 사용자 입력에 대한 피드백을 표시하기 위한 제2 UI(320a)(예: 도 2의 제2 UI)를 표시할 수 있다. 제2 UI(320a)는, 예를 들어, 제2 레이어(320)의 일부 영역에 표시될 수 있다. 상기 피드백은, 예를 들어, 사용자 입력에 따라 선택할 수 있는 적어도 하나의 오브젝트를 포함할 수 있다. 일 실시 예에 따르면, 디스플레이 장치(100)는 마이크를 통해 상기 피드백에 대한 사용자 입력을 수신할 수 있다. 상기 사용자 입력은, 예를 들어, 선택할 수 있는 적어도 하나의 오브젝트 중 하나를 선택하는 입력일 수 있다.
일 실시 예에 따르면, 디스플레이 장치(100)는 복수의 레이어 중 제3 레이어(330)(예: 도 2의 제4 레이어)에 사용자와 인터랙션을 수행하여 획득한 정보를 표시하기 위한 제3 UI(330a)(예: 도 2의 제3 UI)를 표시할 수 있다. 제3 UI(330a)는, 예를 들어, 제3 레이어(330)의 일부 영역에 표시될 수 있다. 예를 들어, 디스플레이 장치(100)는 사용자 입력에 대응되는 기능을 수행하기 위한 어플리케이션을 통해 정보를 획득하고, 상기 획득된 정보를 제3 UI(330a)에 표시할 수 있다. 일 실시 예에 따르면, 디스플레이 장치(100)는 제1 사용자 입력을 수신하고,
일 실시 예에 따르면, 디스플레이 장치(100)는 복수의 레이어 중 제4 레이어(340)(예: 도 2의 제3 레이어)에 이미지(340a)를 표시할 수 있다. 이미지(340a)는, 예를 들어, 컨텐트의 이미지, 또는 실행된 어플리케이션의 제4 UI(예: 도 3의 제4 UI)를 포함할 수 있다.
일 실시 예에 따르면, 디스플레이 장치(100)는 순차적으로 적층된 제1 레이어(310) 내지 제4 레이어(340)를 디스플레이에 표시할 수 있다. 다시 말해, 디스플레이 장치(100)는 적층된 순서에 기초하여 제1 레이어(310) 내지 제4 레이어(340)를 디스플레이에 표시할 수 있다. 예를 들어, 디스플레이 장치(100)는 제1 레이어(310) 내지 제3 레이어(330) 각각에 표시된 제1 UI(310a), 제2 UI(320a), 및 제3 UI(330a)는 제4 레이어(340)에 표시된 컨텐트 이미지(340a)가 표시된 화면의 지정된 영역에 컨텐트 이미지(340a)에 중첩되어 표시될 수 있다. 상기 화면에 중첩되어 표시된 제1 UI(310a), 제2 UI(320a), 및 제3 UI(330a)는 컨텐트 이미지(340a)가 전체적으로 표시된 화면에 지정된 투명도로 표시될 수 있다. 일 실시 예에 따르면, 디스플레이 장치(100)는 제2 레이어(320), 및 제4 레이어(330)를 선택적으로 디스플레이에 표시할 수 있다.
도 4는 다양한 실시 예에 따른 디스플레이 장치가 복수의 레어어를 포함하는 화면을 디스플레이에 표시하는 방법을 나타낸 도면이다.
도 4를 참조하면, 디스플레이 장치(100)는 사용자와 인터랙션을 수행하고, 상기 인터랙션을 수행한 결과를 디스플레이에 표시할 수 있다.
일 실시 예에 따르면, 410 화면에서, 디스플레이 장치(100)는 이미지(401)를 디스플레이에 표시할 수 있다. 이미지(401)는, 예를 들어, 컨텐트의 이미지, 또는 실행된 앱의 UI를 포함할 수 있다.
일 실시 예에 따르면, 420 화면에서, 디스플레이 장치(100)는 이미지(401), 및 사용자와 인터렉션을 수행하기 위한 제1 UI(403)를 디스플레이에 표시할 수 있다. 예를 들어, 디스플레이 장치(100)는 410 화면에서 제1 사용자 입력을 수신하면, 제1 UI(403)를 디스플레이에 표시할 수 있다. 상기 제1 사용자 입력은, 예를 들어, 지정된 기능을 수행하기 위한 입력일 수 있다. 상기 제1 사용자 입력은 마이크를 통해 수신될 수 있다.
일 실시 예에 따르면, 430 화면에서, 디스플레이 장치(100)는 이미지(401), 제1 UI(403), 제1 사용자 입력에 대한 피드백을 표시하기 위한 제2 UI(405)를 디스플레이에 표시할 수 있다. 예를 들어, 디스플레이 장치(100)는 420 화면에서 지정된 기능을 수행하기에 부족한 정보를 포함하는 제1 사용자 입력을 수신하면, 제1 사용자 입력에 대한 피드백을 제2 UI(405)에 표시할 수 있다. 상기 피드백은, 예를 들어, 제1 사용자 입력에 대응되는 결과를 획득하기 위한 것일 수 있다. 일 실시 예에 따르면, 디스플레이 장치(100)는 상기 피드백과 관련된 제2 사용자 입력을 수신할 수 있다.
일 실시 예에 따르면, 디스플레이 장치(100)는 사용자 입력(예: 제2 사용자 입력)이 지정된 기능을 수행하기에 부족하면, 디스플레이를 통해 수신된 사용자 입력에 대한 복수의 피드백을 사용자에게 제공할 수 있다. 다시 말해, 디스플레이 장치(100)는 지정된 기능을 수행하기 위해 복수의 피드백을 사용자에게 제공할 수 있다(1). 일 실시 예에 따르면, 디스플레이 장치(100)는 피드백을 통해서도 지정된 기능을 수행하기 어려운 경우, 410 화면과 동일하게 이미지를 디스플레이에 표시할 수 있다(2).
일 실시 예에 따르면, 440 화면에서, 디스플레이 장치(100)는 이미지(401), 제1 UI(403), 사용자 입력에 대응되는 기능을 수행한 결과를 표시하기 위한 제3 UI(407)를 디스플레이에 표시할 수 있다. 예를 들어, 디스플레이 장치(100)는 420 화면에서 제1 사용자 입력에 대응되는 기능을 수행한 결과를 제3 UI(407)에 표시할 수 있다(3). 다른 예를 들어, 디스플레이 장치(100)는 430 화면에서 제2 사용자 입력에 대응되는 기능을 수행한 결과를 제3 UI(407)에 표시할 수 있다(4). 일 실시 예에 따르면, 디스플레이 장치(100)는 상기 결과 제공을 완료하면, 410 화면과 동일하게 이미지를 디스플레이에 표시할 수 있다(5). 일 실시 예에 따르면, 디스플레이 장치(100)는 사용자 입력에 대응되는 기능을 수행하기 위한 앱을 통해 획득된 정보를 제3 UI(407)에 표시할 수 있다.
일 실시 예에 다르면, 450 화면에서, 디스플레이 장치(100)는 사용자 입력에 대응되는 이미지(409)를 디스플레이에 표시할 수 있다. 예를 들어, 디스플레이 장치(100)는 420 화면에서 제1 사용자 입력에 대응되는 이미지(409)를 디스플레이에 표시할 수 있다(6). 다른 예를 들어, 디스플레이 장치(100)는 430 화면에서 제2 사용자 입력에 대응되는 이미지(409)를 디스플레이에 표시할 수 있다(7). 일 실시 예에 따르면, 디스플레이 장치(100)는 사용자 입력에 대응되는 컨텐트의 이미지나, 사용자 입력에 대응되는 기능을 수행할 수 있는 앱의 UI를 디스플레이에 표시할 수 있다.
도 5는 일 실시 예에 따른 디스플레이 장치는 사용자 발화에 따라 채널(channel)을 변경하는 화면이다.
도 5를 참조하면, 디스플레이 장치(100)는 사용자 발화에 따라 채널을 변경하여, 디스플레이(예: 도 2의 디스플레이(130))에 표시된 컨텐트의 이미지를 변경할 수 있다.
일 실시 예에 따르면, 510 화면에서, 디스플레이 장치(100)는 “스포츠 채널”이라는 채널을 변경하기 위한 제1 사용자 입력을 수신할 수 있다. 상기 제1 사용자 입력은, 예를 들어, 채널을 특정하기에 부족한 정보를 포함할 수 있다. 일 실시 예에 따르면, 디스플레이 장치(100)는 컨텐트의 이미지(501)(예: 도 3의 이미지(340a))가 표시된 화면에 사용자와 인터렉션을 수행하기 위한 제1 UI(503)(예: 도 3의 제1 UI(310a))를 표시할 수 있다. 컨텐트의 이미지(501)는, 예를 들어, 제4 레이어(예: 도 3의 제4 레이어(340))에 표시될 수 있다. 제1 UI(503)는 제1 레이어(예: 도 3의 제1 레이어(310))에 표시될 수 있다. 일 실시 예에 따르면, 디스플레이 장치(100)는 제1 UI(503)에 상기 제1 사용자 입력을 수신하는 상태를 나타내기 위한 인디케이터(503a), 및 상기 제1 사용자 입력(예: 사용자 발화)에 대응되는 텍스트(503b)를 표시할 수 있다. 인디케이터(503a)는, 예를 들어, 제1 상태(예: 파란색)로 표시될 수 있다.
일 실시 예에 따르면, 520 화면에서, 디스플레이 장치(100)는 컨텐트의 이미지(501)가 표시된 화면에 상기 제1 사용자 입력에 대한 피드백을 표시하기 위한 제2 UI(505)(예: 도 3의 제2 UI(320a))를 표시할 수 있다. 일 실시 예에 따르면, 디스플레이 장치(100)는 제2 UI(505)에 상기 제1 사용자 입력에 기초하여 선택될 수 있는 채널을 포함하는 피드백(505a)을 표시할 수 있다. 제2 UI(505)는 제2 레이어(예: 도 3의 제2 레이어(320))에 표시될 수 있다. 일 실시 예에 따르면, 디스플레이 장치(100)는 제1 UI(503)에 상기 제1 사용자 입력에 대한 “어떤 채널인가요”라는 답변에 대한 텍스트(503c)를 표시하고, 스피커를 통해 상기 답변을 출력할 수 있다. 일 실시 예에 따르면, 디스플레이 장치(100)는 제1 UI(503)에 상기 답변을 출력하는 상태를 나타내기 위한 인디케이터(503a)를 표시할 수 있다. 인디케이터(503a)는, 예를 들어, 제2 상태(예: 하얀색)로 표시될 수 있다.
일 실시 예에 따르면, 530 화면에서, 디스플레이 장치(100)는 피드백(505a)과 관련된 “NBC 스포츠”라는 제2 사용자 입력을 수신할 수 있다. 일 실시 예에 따르면, 디스플레이 장치(100)는 제1 UI(503)에 상기 제2 사용자 입력을 수신하는 상태를 나타내기 위한 인디케이터(503a), 및 상기 제2 사용자 입력(예: 사용자 발화)에 대응되는 텍스트(503d)를 표시할 수 있다.
일 실시 예에 따르면, 540 화면에서, 디스플레이 장치(100)는 상기 제2 사용자 입력에 대응되는 NBC 스포츠 채널의 컨텐트의 이미지(507)를 출력할 수 있다.
도 6은 일 실시 예에 따른 디스플레이 장치는 사용자 발화에 따라 VOD(video on demand)를 제공하는 화면이다.
도 6을 참조하면, 디스플레이 장치(100)는 사용자 발화에 따라 VOD를 출력하여, 디스플레이(예: 도 2의 디스플레이(130))에 표시된 컨텐트의 이미지를 변경할 수 있다.
일 실시 예에 따르면, 610 화면에서, 디스플레이 장치(100)는 “COOK에서 스타워즈 보여줘!”라는 VOD를 재생하기 위한 제1 사용자 입력을 수신할 수 있다. 상기 제1 상용자 입력은, 예를 들어, 재생하기 위한 에피소드(episode)를 특정하기에 부족한 정보를 포함할 수 있다. 일 실시 예에 따르면, 디스플레이 장치(100)는 컨텐트의 이미지(601)(예: 도 3의 이미지(340a))가 표시된 화면에 사용자와 인터렉션을 수행하기 위한 제1 UI(603)(예: 도 3의 제1 UI(310a))를 표시할 수 있다. 일 실시 예에 따르면, 디스플레이 장치(100)는 제1 UI(603)에 상기 제1 사용자 입력을 수신하는 상태를 나타내기 위한 인디케이터(603a), 및 상기 제1 사용자 입력(예: 사용자 발화)에 대응되는 텍스트(603b)를 표시할 수 있다.
일 실시 예에 따르면, 620 화면에서, 디스플레이 장치(100)는 컨텐트의 이미지(601)가 표시된 화면에 상기 제1 사용자 입력에 대한 피드백을 표시하기 위한 제2 UI(605)(예: 도 3의 제2 UI(320a))를 표시할 수 있다. 일 실시 예에 따르면, 디스플레이 장치(100)는 제2 UI(605)에 상기 제1 사용자 입력에 기초하여 선택될 수 있는 에피소드를 포함하는 피드백(605a)을 표시할 수 있다. 일 실시 예에 따르면, 디스플레이 장치(100)는 제1 UI(603)에 제1 사용자 입력에 대한 “어떤 에피소드 인가요”라는 답변에 대응되는 텍스트(603c)를 표시하고, 스피커를 통해 상기 답변을 출력할 수 있다. 일 실시 예에 따르면, 디스플레이 장치(100)는 제1 UI(603)에 상기 답변을 출력하는 상태를 나타내기 위한 인디케이터(603a)를 표시할 수 있다.
일 실시 예에 따르면, 630 화면에서, 디스플레이 장치(100)는 피드백(605a)과 관련된 “에피소드 2”라는 제2 사용자 입력을 수신할 수 있다. 일 실시 예에 따르면, 디스플레이 장치(100)는 제1 UI(603)에 상기 제2 사용자 입력을 수신하는 상태를 나타내기 위한 인디케이터(603a), 및 상기 제2 사용자 입력(예: 사용자 발화)에 대응되는 텍스트(603d)를 표시할 수 있다.
일 실시 예에 따르면, 640 화면에서, 디스플레이 장치(100)는 상기 제2 사용자 입력에 대응되는 스타워즈 에피소드 2의 컨텐트의 이미지(607)를 출력할 수 있다.
도 7은 일 실시 예에 따른 디스플레이 장치는 사용자 발화에 따라 앱을 실행시키는 화면이다.
도 7을 참조하면, 디스플레이 장치(100)는 사용자 발화에 따라 앱을 실행시켜, 디스플레이(예: 도 2의 디스플레이(130))에 표시된 컨텐트의 이미지를 변경할 수 있다.
일 실시 예에 따르면, 710 화면에서, 디스플레이 장치(100)는 “CNN 앱 실행해줘!”라는 앱을 실행하기 위한 제1 사용자 입력을 수신할 수 있다. 상기 제1 사용자 입력은, 예를 들어, 실행시킬 앱을 특정하기에 부족한 정보를 포함할 수 있다. 일 실시 예에 따르면, 디스플레이 장치(100)는 컨텐트의 이미지(701)(예: 도 3의 이미지(340a))가 표시된 화면에 사용자와 인터렉션을 수행하기 위한 제1 UI(703)(예: 도 3의 제1 UI(310a))를 표시할 수 있다. 일 실시 예에 따르면, 디스플레이 장치(100)는 제1 UI(703)에 상기 제1 사용자 입력을 수신하는 상태를 나타내기 위한 인디케이터(703a), 및 상기 제1 사용자 입력(예: 사용자 발화)에 대응되는 텍스트(703b)를 표시할 수 있다.
일 실시 예에 따르면, 720 화면에서, 디스플레이 장치(100)는 컨텐트의 이미지(701)가 표시된 화면에 상기 제1 사용자 입력에 대한 피드백을 표시하기 위한 제2 UI(705)(예: 도 3의 제2 UI(320a))를 표시할 수 있다. 일 실시 예에 따르면, 디스플레이 장치(100)는 제2 UI(705)에 상기 제1 사용자 입력에 기초하여 선택될 수 있는 앱을 포함하는 피드백(705a)을 표시할 수 있다. 일 실시 예에 따르면, 디스플레이 장치(100)는 제1 UI(703)에 제1 사용자 입력에 대한 “어느 앱인가요”라는 답변에 대응되는 텍스트(703c)을 표시하고, 스피커를 통해 상기 답변을 출력할 수 있다. 일 실시 예에 따르면, 디스플레이 장치(100)는 제1 UI(703)에 상기 답변을 출력하는 상태를 나타내기 위한 인디케이터(703a)를 표시할 수 있다.
일 실시 예에 따르면, 730 화면에서, 디스플레이 장치(100)는 상기 피드백과 관련된 “CNN 뉴스”라는 제2 사용자 입력을 수신할 수 있다. 일 실시 예에 따르면, 디스플레이 장치(100)는 제1 UI(703)에 상기 제2 사용자 입력을 수신하는 상태를 나타내기 위한 인디케이터(703a), 및 상기 제2 사용자 입력(예: 사용자 발화)에 대응되는 텍스트(703d)를 표시할 수 있다.
일 실시 예에 따르면, 740 화면에서, 디스플레이 장치(100)는 상기 제2 사용자 입력에 대응되는 CNN 뉴스의 컨텐트의 이미지(707)를 출력할 수 있다. 이에 따라, 디스플레이 장치(100)는 사용자가 원하는 앱(예: CNN 뉴스 앱)을 실행시킬 수 있다.
도 8은 일 실시 예에 따른 디스플레이 장치의 사용자 발화에 따른 볼륨(volume)을 변경시키는 화면을 나타낸 것이다.
도 8을 참조하면, 디스플레이 장치(100)는 볼륨을 변경하는 사용자 발화에 따라 지정된 크기 이상으로 볼륨이 변경되는 것을 방지할 수 있다.
일 실시 예에 따르면, 810 화면에서, 디스플레이 장치(100)는 “볼륨 100”이라는 볼륨을 변경하기 위한 제1 사용자 입력을 수신할 수 있다. 상기 제1 사용자 입력은, 예를 들어, 볼륨을 변경하는 동작을 실행하기 충분한 정보를 포함하지만, 디스플레이 장치(100)의 볼륨을 지정된 크기(예: 50) 이상으로 변경하는 요청을 포함할 수 있다. 일 실시 예에 따르면, 디스플레이 장치(100)는 컨텐트의 이미지(801)(예: 도 3의 이미지(340a))가 표시된 화면에 사용자와 인터렉션을 수행하기 위한 제1 UI(803)(예: 도 3의 제1 UI(310a))를 표시할 수 있다. 일 실시 예에 따르면, 디스플레이 장치(100)는 제1 UI(803)에 상기 제1 사용자 입력을 수신하는 상태를 나타내기 위한 인디케이터(803a), 및 상기 제1 사용자 입력(예: 사용자 발화)에 대응되는 텍스트(803b)를 표시할 수 있다.
일 실시 예에 따르면, 820 화면에서, 디스플레이 장치(100)는 컨텐트의 이미지(801)가 표시된 화면에 상기 제1 사용자 입력에 대한 피드백을 표시하기 위한 제2 UI(805)(예: 도 3의 제2 UI(320a))를 표시할 수 있다. 일 실시 예에 따르면, 디스플레이 장치(100)는 제2 UI(805)에 상기 제1 사용자 입력에 기초하여 볼륨의 변경을 확인하는 피드백(805a)을 표시할 수 있다. 일 실시 예에 따르면, 디스플레이 장치(100)는 제1 UI(803)에 제1 사용자 입력에 대한 “시끄러울 것이에요. 정말인가요”라는 답변에 대응되는 텍스트(803c)를 표시하고, 스피커를 통해 상기 답변을 출력할 수 있다. 일 실시 예에 따르면, 디스플레이 장치(100)는 제1 UI(803)에 상기 답변을 출력하는 상태를 나타내기 위한 인디케이터(803a)를 표시할 수 있다.
일 실시 예에 따르면, 830 화면에서, 디스플레이 장치(100)는 피드백(805a)과 관련된 “아니”라는 제2 사용자 입력을 수신할 수 있다. 일 실시 예에 따르면, 디스플레이 장치(100)는 제2 사용자 입력을 수신하는 상태를 나타내기 위한 인디케이터(803a), 및 상기 제2 사용자 발화(예: 사용자 발화)에 대응되는 텍스트(803d)를 표시할 수 있다.
일 실시 예에 따르면, 840 화면에서, 디스플레이 장치(100)는 상기 제2 사용자 입력에 따라 소리를 변경하지 않을 수 있다.
도 9는 일 실시 예에 따른 디스플레이 장치의 사용자 발화에 따라 옵션 메뉴를 디스플레이에 표시하는 화면이다.
도 9를 참조하면, 디스플레이 장치(100)는 사용자 발화에 따라 옵션 메뉴를 디스플레이에 표시하여, 지정된 옵션을 변경할 수 있다.
일 실시 예에 따르면, 910 화면에서, 디스플레이 장치(100)는 “전문가 설정”이라는 옵션 메뉴를 표시하기 위한 제1 사용자 입력을 수신할 수 있다. 상기 제1 사용자 입력은, 예를 들어, 옵션 메뉴를 특정하기 충분하지 않은 정보를 포함할 수 있다. 일 실시 예에 따르면, 디스플레이 장치(100)는 컨텐트의 이미지(901)(예: 도 3의 이미지(340a))가 표시된 화면에 사용자와 인터렉션을 수행하기 위한 제1 UI(903)(예: 도 3의 제1 UI(310a))를 표시할 수 있다. 일 실시 예에 따르면, 디스플레이 장치(100)는 제1 UI(903)에 상기 제1 사용자 입력을 수신하는 상태를 나타내기 위한 인디케이터(903a), 및 상기 제1 사용자 입력(예: 사용자 발화)에 대응되는 텍스트(903b)를 표시할 수 있다.
일 실시 예에 따르면, 920 화면에서, 디스플레이 장치(100)는 컨텐트의 이미지(901)가 표시된 화면에 상기 제1 사용자 입력에 대한 피드백을 표시하기 위한 제2 UI(905)(예: 도 3의 제2 UI(320a))를 표시할 수 있다. 일 실시 예에 따르면, 디스플레이 장치(100)는 제2 UI(905)에 상기 제1 사용자 입력에 기초하여 선택될 수 있는 옵션을 포함하는 피드백(905a)을 표시할 수 있다. 일 실시 예에 따르면, 디스플레이 장치(100)는 제1 UI(903)에 제1 사용자 입력에 대한 “어떤 설정인가요”라는 답변에 대응되는 텍스트(903c)을 표시하고, 스피커를 통해 상기 답변을 출력할 수 있다. 일 실시 예에 따르면, 디스플레이 장치(100)는 제1 UI(903)에 상기 답변을 출력하는 상태를 나타내기 위한 인디케이터(903a)를 표시할 수 있다.
일 실시 예에 따르면, 930 화면에서, 디스플레이 장치(100)는 피드백(905c)과 관련된 “화면 설정”이라는 제2 사용자 입력을 수신할 수 있다. 일 실시 예에 따르면, 디스플레이 장치(100)는 상기 제2 사용자 입력을 수신하는 상태를 나타내기 위한 인디케이터(903a), 및 상기 제2 사용자 발화(예: 사용자 발화)에 대응되는 텍스트를 표시할 수 있다.
일 실시 예에 따르면, 940 화면에서, 디스플레이 장치(100)는 컨텐트의 이미지(901)가 표시된 화면에 상기 제2 사용자 입력에 대응되는 화면 설정 메뉴(907)를 표시할 수 있다.
도 10은 일 실시 예에 따른 디스플레이 장치가 사용자 발화에 따라 시청 예약을 하는 화면이다.
도 10을 참조하면, 디스플레이 장치(100)는사용자 발화에 따라 시청 예약을 위한 동작을 수행할 수 있다.
일 실시 예에 따르면, 1010 화면에서, 디스플레이 장치(100)는 “무한도전 시청 예약해줘.”라는 시청 예약을 하기 위한 제1 사용자 입력을 수신할 수 있다. 상기 제1 사용자 입력은, 예를 들어, 시청 예약하기 부족한 정보를 포함할 수 있다. 일 실시 예에 따르면, 디스플레이 장치(100)는 컨텐트의 이미지(1001)(예: 도 3의 이미지(340a))가 표시된 화면에 사용자와 인터렉션을 수행하기 위한 제1 UI(1003)(예: 도 3의 제1 UI(310a))를 표시할 수 있다. 일 실시 예에 따르면, 디스플레이 장치(100)는 제1 UI(1003)에 상기 제1 사용자 입력을 수신하는 상태를 나타내기 위한 인디케이터(1003a), 및 상기 제1 사용자 입력(예: 사용자 발화)에 대응되는 텍스트(1003b)를 표시할 수 있다.
일 실시 예에 따르면, 1020 화면에서, 디스플레이 장치(100)는 컨텐트의 이미지(1001)가 표시된 화면에 상기 제1 사용자 입력에 대한 피드백을 표시하기 위한 제2 UI(1005)(예: 도 3의 제2 UI(320a))를 표시할 수 있다. 일 실시 예에 따르면, 디스플레이 장치(100)는 제2 UI(1005)에 상기 제1 사용자 입력에 기초하여 시청 예약할 수 있는 채널 정보를 포함하는 피드백(1005a)을 출력할 수 있다. 일 실시 예에 따르면, 디스플레이 장치(100)는 제1 UI(1003)에 상기 제1 사용자 입력에 대한 “어떤 채널 인가요”라는 답변에 대응되는 텍스트(1003c)을 표시하고, 스피커를 통해 상기 답변을 출력할 수 있다. 일 실시 예에 따르면, 디스플레이 장치(100)는 제1 UI(1003)에 상기 답변을 출력하는 상태를 나타내기 위한 인디케이터(1003a)를 표시할 수 있다.
일 실시 예에 따르면, 1030 화면에서, 디스플레이 장치(100)는 피드백(1005a)과 관련된 “다음주 토요일 NBC”라는 제2 사용자 입력을 수신할 수 있다. 일 실시 예에 따르면, 디스플레이 장치(100)는 제1 UI(1003)에 상기 제2 사용자 입력을 수신하는 상태를 나타내기 위한 인디케이터(1003a), 및 상기 제2 사용자 입력(예: 사용자 발화)에 대응되는 텍스트(1003d)를 표시할 수 있다.
일 실시 예에 따르면, 1040 화면에서, 디스플레이 장치(100)는 상기 제2 사용자 입력에 대응되는 시청 예약을 완료하면, 제2 UI(1005)에 “시청 예약 되었습니다.”라는 메시지를 표시하고, 스피커를 통해 상기 메시지를 출력할 수 있다.
도 11은 일 실시 예에 따른 디스플레이 장치가 사용자 발화에 따라 항공권을 예약하는 화면이다.
도 11를 참조하면, 디스플레이 장치(100)는 사용자 발화에 따라 항공권을 예약하는 동작을 수행할 수 있다.
일 실시 예에 따르면, 1110 화면에서, 디스플레이 장치(100)는 “제주도 항공권 예약”이라는 시청 예약을 하기 위한 제1 사용자 입력을 수신할 수 있다. 상기 제1 사용자 입력은, 예를 들어, 예약하기 부족한 정보를 포함할 수 있다. 일 실시 예에 따르면, 디스플레이 장치(100)는 컨텐트의 이미지(1101)(예: 도 3의 이미지(340a))가 표시된 화면에 사용자와 인터렉션을 수행하기 위한 제1 UI(1103)(예: 도 3의 제1 UI(310a))를 표시할 수 있다. 일 실시 예에 따르면, 디스플레이 장치(100)는 제1 UI(1103)에 상기 제1 사용자 입력을 수신하는 상태를 나타내기 위한 인디케이터(1103a), 및 상기 제1 사용자 입력(예: 사용자 발화)에 대응되는 텍스트(1103b)를 표시할 수 있다.
일 실시 예에 따르면, 1120 화면에서, 디스플레이 장치(100)는 컨텐트의 이미지(1101)가 표시된 화면에 상기 제1 사용자 입력에 대한 피드백을 표시하기 위한 제2 UI(1105)(예: 도 3의 제2 UI(320a))를 표시할 수 있다. 일 실시 예에 따르면, 디스플레이 장치(100)는 제2 UI(1105)에 상기 제1 사용자 입력에 기초하여 여행 일정 입력을 요청하는 제1 피드백(1105a)을 출력할 수 있다. 일 실시 예에 따르면, 디스플레이 장치(100)는 제1 UI(1103)에 제1 사용자 입력에 대한 “일정이 어떻게 되나요”에 대응되는 텍스트(1103c)를 표시하고, 스피커를 통해 상기 답변을 출력할 수 있다. 일 실시 예에 따르면, 디스플레이 장치(100)는 제1 UI(1103)에 상기 답변을 출력하는 상태를 나타내기 위한 인디케이터(1103a)를 표시할 수 있다. 일 실시 예에 따르면, 디스플레이 장치(100)는 여행 일정에 대한 정보를 포함하는 제2 사용자 입력을 수신할 수 있다.
일 실시 예에 따르면, 1130 화면에서, 디스플레이 장치(100)는 제2 UI(1105)에 상기 제2 사용자 입력에 기초하여 선택될 수 있는 항공권을 포함하는 제2 피드백(1105b)을 출력할 수 있다. 일 실시 예에 따르면, 디스플레이 장치(100)는 제1 UI(1103)에 상기 제2 사용자 입력에 대한 “어떤 항공편을 이용하시나요”라는 답변에 대응되는 텍스트(1103d)를 표시하고, 스피커를 통해 상기 답변을 출력할 수 있다. 일 실시 예에 따르면, 디스플레이 장치(100)는 항공권 선택하는 제3 사용자 입력을 수신할 수 있다.
일 실시 예에 따르면, 1140 화면에서, 디스플레이 장치(100)는 상기 제3 사용자 입력에 기초하여 결제를 확인하는 요청을 포함하는 제3 피드백(1105e)을 출력할 수 있다. 일 실시 예에 따르면, 디스플레이 장치(100)는 제1 UI(1103)에 상기 제3 사용자 입력에 대한 “결제 할까요”라는 답변에 대응되는 텍스트(1103e)를 표시하고, 스피커를 통해 상기 답변을 출력할 수 있다. 일 실시 예에 따르면, 디스플레이 장치(100)는 결제를 확인하는 제4 사용자 입력을 수신할 수 있다.
일 실시 예에 따르면, 1150 화면에서, 디스플레이 장치(100)는 상기 제4 사용자 입력에 대응되는 항공권 예약을 완료하면, 제2 UI(1105)에 “항공권 예약 되었습니다.”라는 메시지에 대응되는 텍스트(1103f)를 표시하고, 스피커를 통해 상기 메시지를 출력할 수 있다.
도 12는 일 실시 예에 따른 디스플레이 장치가 사용자 발화에 따라 음식를 주문하는 화면이다.
도 12를 참조하면, 디스플레이 장치(100)는 사용자 발화에 따라 음식을 주문하는 동작을 수행할 수 있다.
일 실시 예에 따르면, 1210 화면에서, 디스플레이 장치(100)는 “피자 주문해줘!”라는 음식 주문을 하기 위한 제1 사용자 입력을 수신할 수 있다. 상기 제1 사용자 입력은, 예를 들어, 음식을 주문하기 부족한 정보를 포함할 수 있다. 일 실시 예에 따르면, 디스플레이 장치(100)는 컨텐트의 이미지(1201)(예: 도 3의 이미지(340a))가 표시된 화면에 사용자와 인터렉션을 수행하기 위한 제1 UI(1203)(예: 도 3의 제1 UI(310a))를 표시할 수 있다. 일 실시 예에 따르면, 디스플레이 장치(100)는 제1 UI(1203)에 상기 제1 사용자 입력을 수신하는 상태를 나타내기 위한 인디케이터(1203a), 및 상기 제1 사용자 입력(예: 사용자 발화)에 대응되는 텍스트(1203b)를 표시할 수 있다.
일 실시 예에 따르면, 1220 화면에서, 디스플레이 장치(100)는 컨텐트의 이미지(1201)가 표시된 화면에 상기 제1 사용자 입력에 대한 피드백을 표시하기 위한 제2 UI(1205)(예: 도 3의 제2 UI(320a))를 표시할 수 있다. 일 실시 예에 따르면, 디스플레이 장치(100)는 제2 UI(1105)에 상기 제1 사용자 입력에 기초하여 음식 메뉴를 포함하는 제1 피드백(1205a)을 출력할 수 있다. 일 실시 예에 따르면, 디스플레이 장치(100)는 제1 UI(1103)에 상기 제1 사용자 입력에 대한 “어떤 메뉴를 드시겠어요”라는 답변에 대응되는 텍스트(1203c)를 표시하고, 스피커를 통해 상기 답변을 출력할 수 있다. 일 실시 예에 따르면, 디스플레이 장치(100)는 제1 UI(1203)에 상기 답변을 출력하는 상태를 나타내기 위한 인디케이터(1203a)를 표시할 수 있다. 일 실시 예에 따르면, 디스플레이 장치(100)는 메뉴를 선택하는 제2 사용자 입력을 수신할 수 있다.
일 실시 예에 따르면, 1230 화면에서, 디스플레이 장치(100)는 제2 UI(1105)에 상기 제2 사용자 입력에 기초하여 배송지를 확인하는 제2 피드백(1205b)을 출력할 수 있다. 일 실시 예에 따르면, 디스플레이 장치(100)는 제1 UI(1203)에 상기 제2 사용자 입력에 대한 “배송지가 맞나요”라는 답변에 대응되는 텍스트(1203d)를 표시하고, 스피커를 통해 상기 답변을 출력할 수 있다. 일 실시 예에 따르면, 디스플레이 장치(100)는 배송지 확인하는 제3 사용자 입력을 수신할 수 있다.
일 실시 예에 따르면, 1240 화면에서, 디스플레이 장치(100)는 상기 제3 사용자 입력에 기초하여 결제를 확인하는 요청을 포함하는 제3 피드백(1205c)을 출력할 수 있다. 일 실시 예에 따르면, 디스플레이 장치(100)는 제1 UI(1203)에 상기 제3 사용자 입력에 대한 “결제 할까요”라는 답변에 대응되는 텍스트(1203e)를 표시하고, 스피커를 통해 상기 답변을 출력할 수 있다. 일 실시 예에 따르면, 디스플레이 장치(100)는 결제를 확인하는 제4 사용자 입력을 수신할 수 있다.
일 실시 예에 따르면, 1250 화면에서, 디스플레이 장치(100)는 상기 제4 사용자 입력에 대응되는 음식 주문을 주문을 완료하면, 제2 UI(1205)에 “30분 내로 배달 됩니다.”라는 메시지를 표시하고, 스피커를 통해 상기 메시지를 출력할 수 있다. 이에 따라, 디스플레이 장치(100)는 사용자가 원하는 음식을 주문하는 동작을 수행할 수 있다.
도 13은 일 실시 예에 따른 디스플레이 장치가 사용자 발화에 따라 날씨 정보를 표시하는 화면이다.
도 13을 참조하면, 디스플레이 장치(100)는 사용자 발화에 따라 디스플레이에 표시된 컨텐츠 이미지와 관련된 정보를 사용자에게 제공할 수 있다.
일 실시 예에 따르면, 1310 화면에서, 디스플레이 장치(100)는 “부산 주말 날씨”라는 날씨 정보를 제공받기 위한 제1 사용자 입력을 수신할 수 있다. 상기 제1 사용자 입력은, 예를 들어, 디스플레이에 표시된 컨텐츠의 이미지(1301)와 관련된 정보의 요청을 포함할 수 있다. 일 실시 예에 따르면, 디스플레이 장치(100)는 컨텐트의 이미지(1301)(예: 도 3의 이미지(340a))가 표시된 화면에 사용자와 인터렉션을 수행하기 위한 제1 UI(1303)(예: 도 3의 제1 UI(310a))를 표시할 수 있다. 일 실시 예에 따르면, 디스플레이 장치(100)는 제1 UI(1303)에 상기 제1 사용자 입력을 수신하는 상태를 나타내기 위한 인디케이터(1303a), 및 상기 제1 사용자 입력(예: 사용자 발화)에 대응되는 텍스트(1303b)를 표시할 수 있다.
일 실시 예에 따르면, 1320 화면에서, 디스플레이 장치(100)는 컨텐트의 이미지(1301)가 표시된 화면에 상기 제1 사용자 입력에 대한 결과를 표시하기 위한 제3 UI(1305)(예: 도 3의 제3 UI(330a))를 표시할 수 있다. 제2 UI(1305)는, 예를 들어, 제3 레이어(예: 도 3의 제3 레이어(330))에 표시될 수 있다. 일 실시 예에 따르면, 디스플레이 장치(100)는 제3 UI(1305)에 상기 제1 사용자 입력에 기초하여 부산 날씨에 대한 정보(1305a)를 표시할 수 있다. 일 실시 예에 따르면, 디스플레이 장치(100)는 제1 UI(1303)에 상기 제1 사용자 입력에 대한 “이번주 부산은 맑아요!”라는 답변에 대한 텍스트(1303c)을 표시하고, 스피커를 통해 상기 답변을 출력할 수 있다. 일 실시 예에 따르면, 디스플레이 장치(100)는 제1 UI(1303)에 상기 답변을 출력하는 상태를 나타내기 위한 인디케이터(1303a)를 표시할 수 있다.
일 실시 예에 따르면, 1330 화면에서, 디스플레이 장치(100)는 상기 제1 사용자 입력에 대응되는 정보 제공을 완료하면, 컨텐트의 이미지(1301)만을 디스플레이에 표시할 수 있다.
도 14는 일 실시 예에 따른 디스플레이 장치가 사용자 발화에 따라 지정된 정보를 제공하고 시청 예약을 하는 화면이다.
도 14를 참조하면, 디스플레이 장치(100)는 경기 결과 정보를 제공하는 동작, 및 시청 예약을 하는 동작을 수행할 수 있다.
일 실시 예에 따르면, 1410 화면에서, 디스플레이 장치(100)는 “다저스 야구 경기 결과”라는 경기 정보를 제공 받기 위한 제1 사용자 입력을 수신할 수 있다. 일 실시 예에 따르면, 디스플레이 장치(100)는 컨텐트의 이미지(1401)(예: 도 3의 이미지(340a))가 표시된 화면에 사용자와 인터렉션을 수행하기 위한 제1 UI(1403)(예: 도 3의 제1 UI(310a))를 표시할 수 있다. 일 실시 예에 따르면, 디스플레이 장치(100)는 제1 UI(1403)에 제1 사용자 입력을 수신하는 상태를 나타내기 위한 인디케이터(1403a), 및 상기 제1 사용자 입력(예: 사용자 발화)에 대응되는 텍스트(1403b)를 표시할 수 있다.
일 실시 예에 따르면, 1420 화면에서, 디스플레이 장치(100)는 컨텐트의 이미지(1401)가 표시된 화면에 상기 제1 사용자 입력에 대한 결과를 표시하기 위한 제3 UI(1405)(예: 도 3의 제3 UI(330a))를 표시할 수 있다. 일 실시 예에 따르면, 디스플레이 장치(100)는 제3 UI(1305)에 상기 제1 사용자 입력에 기초하여 경기 정보를 제공하는 결과(1305a)를 출력할 수 있다. 일 실시 예에 따르면, 제1 UI(1403)에 제1 사용자 입력에 대한 “다저시가 6 대 1로 이겼네요.”라는 답변에 대한 텍스트(1403c)을 표시하고, 스피커를 통해 상기 답변을 출력할 수 있다. 일 실시 예에 따르면, 디스플레이 장치(100)는 제1 UI(1403)에 상기 답변을 출력하는 상태를 나타내기 위한 인디케이터(1403a)를 표시할 수 있다.
일 실시 예에 따르면, 1430 화면에서, 디스플레이 장치(100)는 “다음 경기 시청 예약해줘.”라는 시청 예약을 위한 제2 사용자 입력을 수신할 수 있다. 상기 제2 사용자 입력은, 예를 들어, 시청 예약의 동작을 수행하기 부족한 정보를 포함할 수 있다. 일 실시 예에 따르면, 디스플레이 장치(100)는 제1 UI(1403)에 제2 사용자 입력(예: 사용자 발화)에 대응되는 텍스트(1403d)를 표시할 수 있다.
일 실시 예에 따르면, 1440 화면에서, 디스플레이 장치(100)는 컨텐트의 이미지(1401)가 표시된 화면에 상기 제1 사용자 입력에 대한 피드백을 표시하기 위한 제2 UI(1407)(예: 도 3의 제2 UI(320a))를 표시할 수 있다. 일 실시 예에 따르면, 디스플레이 장치(100)는 제2 UI(1407)에 상기 제1 사용자 입력에 기초하여 경기 정보를 포함하는 피드백(1407a)을 표시할 수 있다. 일 실시 예에 따르면, 디스플레이 장치(100)는 제1 UI(1403)에 상기 제2 사용자 입력에 대한 “어느 채널로 예약할까요”라는 답변을 표시하고, 스피커를 통해 상기 답변을 출력할 수 있다. 일 실시 예에 다르면, 디스플레이 장치(100)는 경기 선택과 관련된 제3 사용자 입력을 수신할 수 있다.
일 실시 예에 따르면, 1450 화면에서, 디스플레이 장치(100)는 상기 제3 사용자 입력에 대응되는 경기 시청 예약을 완료하면, 제2 UI(1205)에 “예약이 완료되었습니다.”라는 메시지를 표시하고, 스피커를 통해 상기 메시지를 출력할 수 있다.
도 1 내지 도 14를 참조하여 설명한 본 발명의 디스플레이 장치(100)는 사용자 발화에 따라 지정된 기능을 수행하는 과정에서 사용자와 인터렉션을 수행하기 위한 UI를 디스플레이에 표시하고, 상기 지정된 동작을 수행한 결과를 표시하기 위한 UI를 컨텐트의 이미지의 일부와 중첩시켜 표시함으로써, 컨텐트의 이미지의 가림을 최소화 하면서 대화하는 형식으로 상기 지정된 기능을 수행하게 하는 사용자 경험(user experience)(UE)을 제공할 수 있다.
다양한 실시 예에 따른 장치(예: 모듈들 또는 그 기능들) 또는 방법(예: 동작들)의 적어도 일부는 프로그램 모듈의 형태로 컴퓨터로 판독 가능한 저장 매체에 저장된 명령어로 구현될 수 있다. 상기 명령어가 프로세서에 의해 실행될 경우, 프로세서가 상기 명령어에 해당하는 기능을 수행할 수 있다. 컴퓨터로 판독 가능한 기록 매체는, 하드디스크, 플로피디스크, 마그네틱 매체(예: 자기테이프), 광기록 매체(예: CD-ROM, DVD, 자기-광 매체 (예: 플롭티컬 디스크), 내장 메모리 등을 포함할 수 있다. 명령어는 컴파일러에 의해 만들어지는 코드 또는 인터프리터에 의해 실행될 수 있는 코드를 포함할 수 있다.
본 문서에 개시된 실시 예는 개시된, 기술 내용의 설명 및 이해를 위해 제시된 것이며, 본 발명의 범위를 한정하는 것은 아니다. 따라서, 본 문서의 범위는, 본 발명의 기술적 사상에 근거한 모든 변경 또는 다양한 다른 실시 예를 포함하는 것으로 해석되어야 한다.

Claims (20)

  1. 디스플레이 장치에 있어서,
    마이크;
    복수의 레이어를 포함하는 화면을 표시하는 디스플레이;
    복수의 어플리케이션 프로그램을 저장하는 메모리; 및
    상기 복수의 레이어 중 제1 레이어에 이미지를 표시하고,
    상기 이미지가 표시되는 동안 상기 마이크를 통한 제1 음성 입력의 수신에 기초하여, 상기 복수의 레이어 중 제2 레이어에 사용자와 인터랙션(interaction)하기 위한 제1 UI(user interface)를 표시하고,
    상기 복수의 레이어 중 제3 레이어에 상기 제1 음성 입력의 처리에 의해 획득된 복수의 아이템을 포함하는 제2 UI를 표시하고,
    상기 제1 음성 입력의 처리에 의해 획득된 복수의 아이템 중 하나의 선택을 요청하는 제3 UI를 상기 제2 레이어에 표시하고,
    상기 요청과 관련된 제2 음성 입력에 기초하여, 상기 복수의 아이템 중 상기 제2 음성 입력에 대응하는 하나의 아이템과 관련된 적어도 하나의 어플리케이션을 실행하도록 설정된 프로세서를 포함하며,
    상기 제2 레이어와 상기 제3 레이어 각각은 상기 제1 레이어와 중첩된 상태로 표시되며,
    상기 제2 레이어 및 상기 제3 레이어 각각은 지정된 투명도를 가지며, 상기 제1 레이어에 표시된 이미지의 일부는 중첩된 상기 제2 레이어 및 상기 제3 레이어를 통해 노출되며,
    상기 제2 레이어와 상기 제3 레이어는 서로 중첩되지 않은 상태로 표시되며,
    상기 제3 UI는 상기 제2 UI가 표시되는 동안에 표시되는, 디스플레이 장치.
  2. 청구항 1에 있어서,
    상기 프로세서는,
    상기 제1 음성 입력의 수신 상태를 나타내는 제1 인디케이터 또는 상기 제1 음성 입력에 대응하는 제1 텍스트 중 적어도 하나를 상기 제1 UI를 통해 표시하도록 설정되며,
    상기 제1 인디케이터는 상기 제1 음성 입력이 수신되는 동안 제1 상태로 표시되고, 상기 제1 음성 입력의 수신이 완료된 이후에는 제2 상태로 표시되는 , 디스플레이 장치.
  3. 청구항 1에 있어서,
    상기 프로세서는,
    상기 제2 음성 입력이 수신되는 동안, 상기 제2 음성 입력의 수신 상태를 나타내는 제2 인디케이터 또는 상기 제2 음성 입력에 대응하는 제2 텍스트 중 적어도 하나를 상기 제1 UI를 통해 표시하도록 설정되며,
    상기 제2 인디케이터는 상기 제2 음성 입력이 수신되는 동안 제1 상태로 표시되고, 상기 제2 음성 입력의 수신이 완료된 이후에는 제2 상태로 표시되는, 디스플레이 장치.
  4. 청구항 1에 있어서,
    상기 프로세서는,
    상기 제1 음성 입력에 대한 처리 결과로 하나의 아이템이 획득되는 경우, 상기 획득된 하나의 아이템과 관련된 적어도 하나의 어플리케이션을 실행하도록 설정된, 디스플레이 장치.
  5. 청구항 1에 있어서,
    상기 프로세서는, 상기 적어도 하나의 어플리케이션의 실행과 관련된 제4 UI를 제1 레이어를 통해 표시하도록 설정된, 디스플레이 장치.
  6. 청구항 1에 있어서,
    스피커를 더 포함하고,
    상기 프로세서는, 상기 복수의 아이템 중 하나를 선택하도록 요청을 상기 스피커를 통해 출력하도록 설정된, 디스플레이 장치.
  7. 삭제
  8. 삭제
  9. 청구항 1에 있어서,
    상기 프로세서는, 상기 제1 음성 입력 및 상기 제2 음성 입력 중 적어도 하나를 외부 서버를 통해 처리하도록 설정된, 디스플레이 장치.
  10. 디스플레이 장치의 제어 방법에 있어서,
    디스플레이에 표시된 화면에 포함된 복수의 레이어 중 제1 레이어에 이미지를 표시하는 동작;
    상기 이미지가 표시되는 동안 상기 디스플레이 장치의 마이크를 통한 제1 음성 입력의 수신에 기초하여, 상기 복수의 레이어 중 제2 레이어에 사용자와 인터랙션하기 위한 제1 UI(user interface)를 표시하는 동작;
    상기 복수의 레이어 중 제3 레이어에 상기 제1 음성 입력의 처리에 의해 획득된 복수의 아이템을 포함하는 제2 UI를 표시하는 동작;
    상기 제1 음성 입력의 처리에 의해 획득된 복수의 아이템 중 하나의 선택을 요청하는 제3 UI를 상기 제2 레이어에 표시하는 동작;
    상기 요청과 관련된 제2 음성 입력에 기초하여, 상기 복수의 아이템 중 상기 제2 음성 입력에 대응하는 하나의 아이템과 관련된 적어도 하나의 어플리케이션을 실행하는 동작을 포함하며,
    상기 제2 레이어와 상기 제3 레이어 각각은 상기 제1 레이어와 중첩된 상태로 표시되며,
    상기 제2 레이어 및 상기 제3 레이어 각각은 지정된 투명도를 가지며, 상기 제1 레이어에 표시된 이미지의 일부는 중첩된 상기 제2 레이어 및 상기 제3 레이어를 통해 노출되며,
    상기 제2 레이어와 상기 제3 레이어는 서로 중첩되지 않은 상태로 표시되며,
    상기 제3 UI는 상기 제2 UI가 표시되는 동안에 표시되는, 방법.
  11. 청구항 10에 있어서,
    상기 제1 음성 입력의 수신 상태를 나타내는 제1 인디케이터 또는 상기 제1 음성 입력에 대응하는 제1 텍스트 중 적어도 하나를 상기 제1 UI를 통해 표시하는 동작을 포함하며,
    상기 제1 인디케이터는 상기 제1 음성 입력이 수신되는 동안 제1 상태로 표시되고, 상기 제1 음성 입력의 수신이 완료된 이후에는 제2 상태로 표시되는, 방법.
  12. 청구항 10에 있어서,
    상기 제2 음성 입력이 수신되는 동안, 상기 제2 음성 입력의 수신 상태를 나타내는 제2 인디케이터 또는 상기 제2 음성 입력에 대응하는 제2 텍스트 중 적어도 하나를 상기 제1 UI를 통해 표시하는 동작을 포함하며,
    상기 제2 인디케이터는 상기 제2 음성 입력이 수신되는 동안 제1 상태로 표시되고, 상기 제2 음성 입력의 수신이 완료된 이후에는 제2 상태로 표시되는, 방법.
  13. ◈청구항 13은(는) 설정등록료 납부시 포기되었습니다.◈
    청구항 10에 있어서,
    상기 제1 음성 입력에 대한 처리 결과로 하나의 아이템이 획득되는 경우, 상기 획득된 하나의 아이템과 관련된 적어도 하나의 어플리케이션을 실행하는 동작을 포함하는 방법.
  14. ◈청구항 14은(는) 설정등록료 납부시 포기되었습니다.◈
    청구항 10에 있어서,
    상기 적어도 하나의 어플리케이션의 실행과 관련된 제4 UI를 제1 레이어를 통해 표시하는 동작을 포함하는 방법.
  15. ◈청구항 15은(는) 설정등록료 납부시 포기되었습니다.◈
    청구항 10에 있어서,
    상기 디스플레이 장치의 스피커를 통해 상기 복수의 아이템 중 하나의 선택을 요청하는 동작을 포함하는 방법.
  16. ◈청구항 16은(는) 설정등록료 납부시 포기되었습니다.◈
    청구항 10에 있어서,
    상기 제1 음성 입력 및 상기 제2 음성 입력 중 적어도 하나를 외부 서버를 통해 처리하는 동작을 포함하는 방법.
  17. 삭제
  18. 삭제
  19. 삭제
  20. 삭제
KR1020170184791A 2017-12-29 2017-12-29 사용자 발화를 처리하는 디스플레이 장치 및 그 디스플레이 장치의 제어 방법 KR102503936B1 (ko)

Priority Applications (3)

Application Number Priority Date Filing Date Title
KR1020170184791A KR102503936B1 (ko) 2017-12-29 2017-12-29 사용자 발화를 처리하는 디스플레이 장치 및 그 디스플레이 장치의 제어 방법
US16/756,674 US11460979B2 (en) 2017-12-29 2018-12-28 Display device for processing user utterance and control method of display device
PCT/KR2018/016900 WO2019132609A1 (ko) 2017-12-29 2018-12-28 사용자 발화를 처리하는 디스플레이 장치 및 그 디스플레이 장치의 제어 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020170184791A KR102503936B1 (ko) 2017-12-29 2017-12-29 사용자 발화를 처리하는 디스플레이 장치 및 그 디스플레이 장치의 제어 방법

Publications (2)

Publication Number Publication Date
KR20190081926A KR20190081926A (ko) 2019-07-09
KR102503936B1 true KR102503936B1 (ko) 2023-02-28

Family

ID=67064031

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020170184791A KR102503936B1 (ko) 2017-12-29 2017-12-29 사용자 발화를 처리하는 디스플레이 장치 및 그 디스플레이 장치의 제어 방법

Country Status (3)

Country Link
US (1) US11460979B2 (ko)
KR (1) KR102503936B1 (ko)
WO (1) WO2019132609A1 (ko)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20210015428A (ko) 2019-08-02 2021-02-10 삼성전자주식회사 사용자 인터페이스를 제공하는 전자 장치 및 방법
KR102287963B1 (ko) * 2019-10-25 2021-08-10 주식회사 오비고 복수의 인공지능을 사용한 정보 제공 방법 및 이를 사용한 앱 프레임워크 서버
CN111666056B (zh) * 2020-05-28 2024-01-05 阿波罗智联(北京)科技有限公司 屏幕切换显示方法、装置、智能后视镜和可读存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160212488A1 (en) * 2014-06-30 2016-07-21 Apple Inc. Intelligent automated assistant for tv user interactions

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009017125A1 (ja) * 2007-07-30 2009-02-05 Kyocera Corporation 入力装置
US8958848B2 (en) * 2008-04-08 2015-02-17 Lg Electronics Inc. Mobile terminal and menu control method thereof
KR102084739B1 (ko) * 2013-03-11 2020-04-14 삼성전자주식회사 대화형 서버, 디스플레이 장치 및 제어 방법
KR20140137263A (ko) * 2013-05-22 2014-12-02 삼성전자주식회사 대화형 서버, 디스플레이 장치 및 제어 방법
KR102266869B1 (ko) * 2014-04-03 2021-06-21 삼성전자주식회사 전자 장치 및 전자 장치의 디스플레이 방법
KR20150136312A (ko) * 2014-05-27 2015-12-07 삼성전자주식회사 디스플레이 장치 및 이의 정보 제공 방법
KR102247673B1 (ko) 2015-02-27 2021-05-03 삼성전자주식회사 전자 장치 및 그의 화면 표시 방법
KR20170019808A (ko) 2015-08-12 2017-02-22 삼성전자주식회사 전자 장치에서 사용자 입력을 처리하는 방법 및 그 전자 장치
US10740384B2 (en) * 2015-09-08 2020-08-11 Apple Inc. Intelligent automated assistant for media search and playback

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160212488A1 (en) * 2014-06-30 2016-07-21 Apple Inc. Intelligent automated assistant for tv user interactions

Also Published As

Publication number Publication date
WO2019132609A1 (ko) 2019-07-04
US11460979B2 (en) 2022-10-04
KR20190081926A (ko) 2019-07-09
US20200285363A1 (en) 2020-09-10

Similar Documents

Publication Publication Date Title
US9854324B1 (en) Systems and methods for automatically enabling subtitles based on detecting an accent
KR102503936B1 (ko) 사용자 발화를 처리하는 디스플레이 장치 및 그 디스플레이 장치의 제어 방법
KR102428911B1 (ko) 자동 음성 인식을 사용하여 생성되는 입력을 음성에 기초하여 정정하기 위한 방법 및 시스템
US9542060B1 (en) User interface for access of content
US20180146238A1 (en) Systems and methods for producing processed media content
US20170169598A1 (en) System and method for delivering augmented reality using scalable frames to pre-existing media
US10812856B2 (en) Dynamic advertisement insertion
US20200252696A1 (en) Information sharing method and device, storage medium and electronic device
US20110020774A1 (en) Systems and methods for facilitating foreign language instruction
US20150248918A1 (en) Systems and methods for displaying a user selected object as marked based on its context in a program
CN107155138A (zh) 视频播放跳转方法、设备及计算机可读存储介质
EP3579570A1 (en) Method and apparatus for generating caption
CN106471571A (zh) 用于在有异形词存在的情况下执行asr的系统和方法
CN112399264B (zh) 一种放映厅业务管理方法及应用
CN111800661A (zh) 直播间显示控制方法、电子设备及存储介质
US10936878B2 (en) Method and device for determining inter-cut time range in media item
US20170171628A1 (en) Method and electronic device for quickly playing video
KR102279164B1 (ko) 인공지능 모델을 이용한 이미지 편집 방법 및 장치
EP3848880A1 (en) Electronic device and method of operating the same
US10771846B2 (en) Electronic apparatus for playing substitutional advertisement and method for controlling method thereof
US9872000B2 (en) Second screen device and system
US11889147B2 (en) Display of signing video through an adjustable user interface (UI) element
KR102476115B1 (ko) 세컨드 스크린을 이용한 인터랙티브 콘텐트 제공 시스템 및 그 방법
EP3588968A1 (en) Method and device for launching an action related to an upcoming audio visual program
KR101882252B1 (ko) 셋톱 박스를 활용한 공지 메시지의 전달이 가능한 유료 방송 서비스 장치 및 그 동작 방법

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
AMND Amendment
X701 Decision to grant (after re-examination)
GRNT Written decision to grant