KR102468214B1 - 사용자의 발화를 기반으로 컨텐츠를 제공하는 장치 및 시스템 - Google Patents

사용자의 발화를 기반으로 컨텐츠를 제공하는 장치 및 시스템 Download PDF

Info

Publication number
KR102468214B1
KR102468214B1 KR1020180019405A KR20180019405A KR102468214B1 KR 102468214 B1 KR102468214 B1 KR 102468214B1 KR 1020180019405 A KR1020180019405 A KR 1020180019405A KR 20180019405 A KR20180019405 A KR 20180019405A KR 102468214 B1 KR102468214 B1 KR 102468214B1
Authority
KR
South Korea
Prior art keywords
content
display
voice input
user
application
Prior art date
Application number
KR1020180019405A
Other languages
English (en)
Other versions
KR20190099676A (ko
Inventor
문지범
설경찬
이계림
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020180019405A priority Critical patent/KR102468214B1/ko
Priority to PCT/KR2019/001936 priority patent/WO2019160388A1/ko
Priority to US16/963,694 priority patent/US11432045B2/en
Publication of KR20190099676A publication Critical patent/KR20190099676A/ko
Priority to US17/871,521 priority patent/US11706495B2/en
Priority to KR1020220151481A priority patent/KR20220156786A/ko
Application granted granted Critical
Publication of KR102468214B1 publication Critical patent/KR102468214B1/ko
Priority to US18/211,129 priority patent/US20230336824A1/en

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/422Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
    • H04N21/42203Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS] sound input device, e.g. microphone
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/233Processing of audio elementary streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/472End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/472End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
    • H04N21/47202End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for requesting content on demand, e.g. video on demand
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/482End-user interface for program selection
    • H04N21/4828End-user interface for program selection for searching program descriptors
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L2015/088Word spotting
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S715/00Data processing: presentation processing of document, operator interface processing, and screen saver display processing
    • Y10S715/978Audio interaction as part of an operator interface

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • User Interface Of Digital Computer (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

디스플레이 장치가 개시된다. 일 실시 예에 따른 디스플레이 장치는 음성신호 수신부, 디스플레이, 컨텐츠 제공 서비스를 지원하는 어플리케이션을 저장하고, 명령어들을 저장하는 적어도 하나의 메모리를 포함하고, 상기 컨텐츠 제공 서비스는 제1 타입의 컨텐츠 파일들 및 제2 타입의 컨텐츠 파일들을 제공하고, 상기 컨텐츠 제공 서비스를 지원하는 적어도 하나의 외부 서버와 통신하기 위한 통신 회로 및 적어도 하나의 프로세서를 포함하고, 상기 명령어들이 실행될 때 상기 적어도 하나의 프로세서로 하여금, 사용자 입력에 응답하여 상기 어플리케이션을 실행하고, 상기 음성신호 수신부를 통하여 상기 컨텐츠 제공 서비스에 적어도 하나의 컨텐츠를 요청하는 발화를 획득하고, 상기 획득된 발화를 상기 통신 회로를 통하여 상기 적어도 하나의 외부 서버로 송신하고, 상기 발화가 상기 제1 타입과 연관된 제1 키워드 및 상기 제2 타입과 연관된 제2 키워드를 포함하면, 상기 제1 타입의 적어도 하나의 컨텐츠 파일과 연관된 화면을 상기 디스플레이를 통하여 표시하도록 할 수 있다. 이 외에도 명세서를 통해 파악되는 다양한 실시 예가 가능하다.

Description

사용자의 발화를 기반으로 컨텐츠를 제공하는 장치 및 시스템{THE SYSTEM AND AN APPRATUS FOR PROVIDIG CONTENTS BASED ON A USER UTTERANCE}
본 문서에서 개시되는 실시 예들은, 사용자의 발화로부터 사용자의 의도를 파악하고, 파악된 의도에 기초하여 컨텐츠를 제공하는 기술과 관련된다.
전자 장치들은 음성 인식 기반의 다양한 서비스를 제공할 수 있다. 예를 들어, 스마트폰이나 태블릿과 같은 휴대용 전자 장치 또는 스마트 TV와 같은 가전 제품 장치들은 음성 인식 서비스가 실행된 상태에서 사용자의 발화를 인식하고, 상기 발화에 대응되는 동작을 실행함으로써 다양한 서비스를 제공할 수 있다.
컨텐츠 제공자(contents provider)는 디스플레이를 포함하는 휴대용 전자 장치 또는 가전 제품들을 통하여 다양한 컨텐츠를 제공할 수 있다. 컨텐츠 제공자는 사용자의 발화(예: 음성 명령)를 수신하고, 사용자의 발화에 포함된 의도에 부합하는 컨텐츠를 제공할 수 있다.
컨텐츠 제공자는 사용자 발화의 의도가 불분명한 경우, 사용자의 의도로 추측되는 여러 가지 컨텐츠를 동시에 제공할 수 있다. 예를 들어, 컨텐츠 제공자는 사용자의 발화에 포함된 컨텐츠의 명칭 또는 컨텐츠의 유형(type)을 기준으로 사용자가 제공받기를 원하는 컨텐츠를 선택할 수 있다. 컨텐츠 제공자는 동일한 이름 또는 동일한 유형을 가지는 복수의 컨텐츠들이 존재하는 경우, 그 복수의 컨텐츠들을 모두 제공하거나 사용자로부터 복수의 컨텐츠들 중에서 하나의 컨텐츠를 선택하도록하는 발화 명령을 다시 입력 받을 수 있다.
그러나 복수의 컨텐츠들이 한번에 제공되면, 사용자는 제공된 많은 컨텐츠들 중에서 의도한 컨텐츠를 선택해야 하고, 직관적으로 원하는 컨텐츠를 선택하기 어렵다. 또한 사용자는 다시 발화해야 하는 불편을 가지게 되고, 원하는 컨텐츠를 제공받기까지의 시간이 지연될 수 있다.
본 발명에서는 상술한 문제점을 해결하기 위하여 사용자의 발화에 기반하여 사용자의 의도에 부합하는 컨텐츠를 선택적으로 제공하는 시스템 및 장치를 제공하고자 한다.
본 문서에 개시되는 일 실시 예에 따른 디스플레이 장치는 음성신호 수신부, 디스플레이, 컨텐츠 제공 서비스를 지원하는 어플리케이션을 저장하고, 명령어들을 저장하는 적어도 하나의 메모리를 포함하고, 상기 컨텐츠 제공 서비스는 제1 타입의 컨텐츠 파일들 및 제2 타입의 컨텐츠 파일들을 제공하고, 상기 컨텐츠 제공 서비스를 지원하는 적어도 하나의 외부 서버와 통신하기 위한 통신 회로 및 적어도 하나의 프로세서를 포함하고, 상기 명령어들이 실행될 때 상기 적어도 하나의 프로세서로 하여금, 사용자 입력에 응답하여 상기 어플리케이션을 실행하고, 상기 음성신호 수신부를 통하여 상기 컨텐츠 제공 서비스에 적어도 하나의 컨텐츠를 요청하는 발화를 획득하고, 상기 획득된 발화를 상기 통신 회로를 통하여 상기 적어도 하나의 외부 서버로 송신하고, 상기 발화가 상기 제1 타입과 연관된 제1 키워드 및 상기 제2 타입과 연관된 제2 키워드를 포함하면, 상기 제1 타입의 적어도 하나의 컨텐츠 파일과 연관된 화면을 상기 디스플레이를 통하여 표시하도록 할 수 있다. 이 외에도 명세서를 통해 파악되는 다양한 실시 예가 가능하다.
또한, 본 문서에 개시되는 일 실시 예에 따른 시스템은, 음성신호 수신부 및 디스플레이를 포함하는 전자 장치, 음성 인식 서비스를 제공하는 적어도 하나의 제1 프로세서를 포함하는 제1 서버와, 컨텐츠 제공 서비스를 지원하는 적어도 하나의 제2 프로세서 및 제1 타입 및 제2 타입 중 어느 하나의 타입에 해당하는 복수의 컨텐츠 파일들을 저장하는 컨텐츠 데이터베이스를 저장하는 저장소를 포함하는 제2 서버를 포함하고, 상기 적어도 하나의 제1 프로세서는, 상기 전자 장치로부터 발화를 수신하고, 상기 발화로부터 상기 복수의 컨텐츠들과 연관된 키워드를 추출하고, 상기 키워드에 대응되는 상기 제1 타입의 적어도 하나의 컨텐츠 파일 및 상기 제2 타입의 적어도 하나의 컨텐츠 파일이 상기 컨텐츠 데이터베이스에 포함된 경우, 상기 제1 타입의 적어도 하나의 컨텐츠 파일을 요청하는 커맨드를 상기 전자 장치로 송신하고, 상기 적어도 하나의 제2 프로세서는, 상기 전자 장치로부터 상기 커맨드를 수신하고, 상기 커맨드의 수신에 응답하여 상기 제1 타입의 상기 적어도 하나의 컨텐츠 파일을 상기 전자 장치로 송신하도록 설정될 수 있다.
또한, 본 문서에 개시되는 일 실시 예에 따른 시스템은, 컨텐츠 제공 서비스를 지원하는 시스템에 있어서, 음성신호 수신부 및 디스플레이를 포함하는 전자 장치, 컨텐츠 제공 서비스를 지원하는 적어도 하나의 프로세서; 및 제1 타입 및 제2 타입 중 어느 하나의 타입에 해당하는 복수의 컨텐츠 파일들을 저장하는 컨텐츠 데이터베이스를 저장하는 저장소를 포함하는 서버를 포함하고, 상기 적어도 하나의 프로세서는, 상기 전자 장치로부터 발화를 수신하고, 상기 발화로부터 상기 복수의 컨텐츠들과 연관된 키워드를 추출하고, 상기 키워드에 대응되는 상기 제1 타입의 적어도 하나의 컨텐츠 파일 및 상기 제2 타입의 적어도 하나의 컨텐츠 파일이 상기 컨텐츠 데이터베이스에 포함된 경우, 상기 제1 타입의 상기 적어도 하나의 컨텐츠 파일을 상기 전자 장치로 송신하도록 설정될 수 있다.
본 문서에 개시되는 실시 예들에 따르면, 사용자의 의도에 맞도록 선택된 컨텐츠가 곧바로 사용자에게 제공될 수 있다.
이 외에, 본 문서를 통해 직접적 또는 간접적으로 파악되는 다양한 효과들이 제공될 수 있다.
도 1은 일 실시 예에 따른 컨텐츠 제공 시스템의 동작 환경을 설명하기 위한 도면이다.
도 2는 일 실시 예에 따른 컨텐츠 제공 시스템에 포함되는 서버 및 전자 장치의 블록도를 나타낸다.
도 3은 일 실시 예에 따른 발화 기반의 컨텐츠 제공 방법의 순서도이다.
도 4는 다양한 실시 예에 따른 방송 컨텐츠를 제공하는 방법의 일 시나리오를 설명하기 위한 도면이다.
도 5는 다양한 실시 예에 따른 방송 컨텐츠를 제공하는 방법을 설명하기 위한 도면이다.
도 6은 다양한 실시 예에 따른 발화 기반의 컨텐츠 제공 방법의 순서도이다.
도 7은 다양한 실시 예에 따른 방송 컨텐츠를 제공하는 방법의 일 시나리오를 설명하기 위한 도면이다.
도 8은 다양한 실시 예에 따른 컨텐츠 제공 시스템의 동작 시퀀스이다.
도면의 설명과 관련하여, 동일 또는 유사한 구성요소에 대해서는 동일 또는 유사한 참조 부호가 사용될 수 있다.
이하, 본 발명의 다양한 실시 예가 첨부된 도면을 참조하여 기재된다. 그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 실시 예의 다양한 변경(modification), 균등물(equivalent), 및/또는 대체물(alternative)을 포함하는 것으로 이해되어야 한다. 도면의 설명과 관련하여, 유사한 구성요소에 대해서는 유사한 참조 부호가 사용될 수 있다.
도 1은 일 실시 예에 따른 컨텐츠 제공 시스템의 동작 환경을 설명하기 위한 도면이다.
일 실시 예에 따른 컨텐츠 제공 시스템(10)은 발화 기반의 컨텐츠 제공 서비스를 지원할 수 있다. 컨텐츠 제공 시스템(10)은 전자 장치(100) 및 서버(300)를 포함할 수 있다.
일 실시 예에서, 서버(300)는 전자 장치(100)로부터 사용자의 발화를 수신할 수 있다. 서버(300)는 사용자의 발화로부터 사용자가 제공받기를 의도하는 컨텐츠(200)를 파악할 수 있다. 서버(300)는 발화의 수신에 응답하여, 사용자가 의도하는 컨텐츠(100)를 전자 장치(100)로 송신할 수 있다.
컨텐츠 제공 서비스는 예를 들어, TV 프로그램, 영화 등의 영상 파일, 사진 등의 이미지 파일들을 컨텐츠(200)를 제공할 수 있다. 서버(300)는 컨텐츠 제공 서비스를 통하여 사용자가 요구하는 컨텐츠를 전자 장치(100)로 제공할 수 있다. 전자 장치(100)는 수신된 컨텐츠(200)를 디스플레이에 표시할 수 있다. 전자 장치(100)는 예를 들어, 스마트 폰과 같은 휴대용 전자 기기, TV와 같은 가전 제품, PC 등 디스플레이를 포함하는 전자 기기로 참조될 수 있다.
다양한 실시 예에서, 컨텐츠 제공 시스템(10)은 서로 다른 컨텐츠(200)를 제공하는 복수의 서버들(300)을 포함할 수 있다. 도 1에서 1개의 서버가 도시되었으나 이에 한정되지 않는다. 예를 들어, 컨텐츠 제공 시스템(10)은 제공하고자 하는 서비스의 종류에 따라서 실시간 방송 컨텐츠를 제공하는 서버, 비디오 컨텐츠를 제공하는 서버, 사용자로부터 업로드 된 오디오 파일, 이미지 파일, 비디오 파일 등을 제공하는 서버 등을 포함할 수 있다.
도 2는 일 실시 예에 따른 컨텐츠 제공 시스템에 포함되는 서버 및 전자 장치의 블록도를 나타낸다.
일 실시 예에 따른 전자 장치(100)는 프로세서(110), 제1 통신 회로(120), 디스플레이(130), 및 음성신호 수신부(140)를 포함할 수 있다. 전자 장치(100)의 프로세서(110)는 발화 기반의 컨텐츠 제공 서비스를 지원하도록 설정될 수 있다. 전자 장치(100)의 프로세서(110)는 컨텐츠 제공 서비스를 지원하기 위하여 필요한 동작들을 수행하도록 설정될 수 있다. 일 실시 예에 따른 서버(300)는 프로세서(310), 네트워크 인터페이스(320), 및 저장소(330)를 포함할 수 있다.
일 실시 예에서, 전자 장치(100)의 음성신호 수신부(140)는 마이크(142) 및/또는 제2 통신회로(144)를 포함할 수 있다. 전자 장치(100)는 음성신호 수신부(140)를 통하여 사용자의 발화에 대응되는 음성 신호를 수신할 수 있다. 음성신호 수신부(140)는 마이크(142) 및/또는 제2 통신회로(144)를 포함하는 음성신호 수신회로로 참조될 수 있다.
일 실시 예에서, 전자 장치(100)는 마이크(142)를 통하여 사용자 발화를 수신할 수 있다. 예를 들어, 사용자는 전자 장치(100)의 일부에 구비된 마이크(142)를 향하여 발화를 할 수 있다.
일 실시 예에서, 전자 장치(100)는 외부 장치(예: 리모컨, 스마트폰)에 의하여 획득된 사용자 발화를 제2 통신 회로(144)를 통하여 수신할 수 있다. 예를 들어, 전자 장치(100)는 제2 통신 회로(144)를 통하여 외부 장치와 데이터를 송수신할 수 있다. 다양한 실시 예에서, 제2 통신 회로(144)는 제1 통신 회로(120)와 통합되어 구현될 수 있다.
예를 들어, 전자 장치(100)는 전자 장치(100)를 제어하기 위한 리모컨과 제2 통신 회로(144)를 통하여 데이터를 송수신할 수 있다. 전자 장치(100)는 리모컨으로부터 사용자 발화를 수신할 수 있다. 상기 리모컨은 마이크를 포함할 수 있고, 상기 마이크를 통하여 사용자의 발화를 획득할 수 있다.
다른 예를 들어, 전자 장치(100)는 마이크를 포함하는 외부 장치(예: 스마트 폰 등)으로부터 제2 통신 회로(144)를 통하여 사용자 발화를 수신할 수 있다. 외부 장치는 외부 장치에 포함된 마이크를 통하여 음성신호를 수신하고, 수신한 음성신호를 전자 장치(100)로 송신할 수 있다.
예를 들어, 사용자 발화는 컨텐츠를 제공받기 위한 음성 명령으로 참조될 수 있다. 전자 장치(100)는 발화를 컨텐츠 제공 서비스를 통하여 서버(300)로 송신할 수 있다. 예를 들어, 전자 장치(100)는 사용자의 발화를 제1 통신 회로(120)를 통하여 서버(300)로 송신할 수 있다. 서버(300)는 네트워크 인터페이스(320)를 통하여 전자 장치(100)로부터 사용자의 발화를 수신할 수 있다.
일 실시 예에서, 서버(300)는 수신한 발화로부터 사용자의 의도를 파악하고, 사용자의 의도에 부합하는 컨텐츠를 전자 장치(100)로 송신할 수 있다.
일 실시 예에서, 서버(300)의 프로세서(310)는 사용자의 발화(음성 명령) 기반의 컨텐츠 제공 서비스를 지원하도록 설정될 수 있다. 프로세서(310)은 자동 음성 인식(automatic speech recognition, ASR) 모듈(312), 키워드 분석 모듈(314)을 포함할 수 있다.
일 실시 예에서, 프로세서(310)는 메모리(예: 저장소(330))에 저장된 명령어들을 실행하여 ASR 모듈(312), 키워드 분석 모듈(314)을 구동시킬 수 있다. 상기 모듈들은 하드웨어로 구현될 수도 있고, 소프트웨어로 구현될 수도 있다. 본 발명의 다양한 실시 예에서 ASR 모듈(312) 및 키워드 분석 모듈(314)에 의해 수행되는 동작은 프로세서(310)에 의해 수행되는 동작으로 이해될 수 있다.
일 실시 예에 따르면, 자동 음성 인식 모듈(312)은 전자 장치(100)로부터 수신된 사용자 발화를 텍스트 데이터로 변환할 수 있다. 예를 들어, 자동 음성 인식 모듈(210)은 발화 인식 모듈을 포함할 수 있다. 상기 발화 인식 모듈은 음향(acoustic) 모델 및 언어(language) 모델을 포함할 수 있다. 예를 들어, 상기 음향 모델은 발성에 관련된 정보를 포함할 수 있고, 상기 언어 모델은 단위 음소 정보 및 단위 음소 정보의 조합에 대한 정보를 포함할 수 있다. 상기 발화 인식 모듈은 발성에 관련된 정보 및 단위 음소 정보에 대한 정보를 이용하여 사용자 발화를 텍스트 데이터로 변환할 수 있다.
일 실시 예에 따르면, 키워드 분석 모듈(314)은 변환된 텍스트 데이터로부터 컨텐츠와 연관되는 키워드를 추출할 수 있다. 예를 들어, 키워드는 컨텐츠 파일의 종류, 파일명, 메타 데이터 등 컨텐츠와 연관된 단어로 참조될 수 있다. 서버(300)는 제공하는 컨텐츠 및 그 컨텐츠에 대한 키워드를 미리 지정하여 컨텐츠 데이터베이스(332)에 저장할 수 있다. 서버(300)는 키워드 분석 모듈(314)에 의하여 키워드가 추출되면 저장소(330)의 컨텐츠 데이터베이스(332)에서 상기 키워드에 대응되는 컨텐츠를 검색할 수 있다.
일 실시 예에 따르면, 키워드 분석 모듈(314)은 문법적 분석(syntactic analyze) 또는 의미적 분석(semantic analyze)을 수행하여 키워드를 추출하고, 사용자 의도를 파악할 수 있다. 상기 문법적 분석은 사용자 입력을 문법적 단위(예: 단어, 구, 형태소 등)로 나누고, 상기 나누어진 단위가 어떤 문법적인 요소를 갖는지 파악할 수 있다. 상기 의미적 분석은 의미(semantic) 매칭, 룰(rule) 매칭, 포뮬러(formula) 매칭 등을 이용하여 수행할 수 있다. 이에 따라, 키워드 분석 모듈(314)은 사용자의 의도(intent)를 얻을 수 있다.
일 실시 예에 따르면, 키워드 분석 모듈(314)은 형태소, 구 등의 언어적 특징(예: 문법적 요소)을 이용하여 사용자 입력으로부터 추출된 단어의 의미를 파악하고, 상기 파악된 단어의 의미를 의도에 매칭시켜 사용자의 의도를 결정할 수 있다. 또한 상기 추출된 단어들 중 미리 저장된 키워드와 매칭되는 단어를 상기 발화의 키워드로 결정할 수 있다.
예를 들어, 키워드 분석 모듈(314)은 사용자 입력의 의도 및 키워드에 기초하여 패스 룰을 생성할 수 있다. 예를 들어, 키워드 분석 모듈(314)은 사용자 입력의 의도에 기초하여 제공할 컨텐츠를 선택할 수 있다. 키워드 분석 모듈(314)은 전자 장치(100)로 하여금 상기 선택된 컨텐츠를 재생, 실행하도록 하는 패스 룰을 생성할 수 있다. 일 실시 예에 따르면, 키워드 분석 모듈(314)에 의해 생성된 패스 룰은 재생 또는 실행될 컨텐츠, 상기 컨텐츠를 재생 또는 실행하기 위하여 필요한 정보를 포함할 수 있다. 예를 들어, 키워드 분석 모듈(314)은 사용자 발화에 응답하여 생성된 패스 룰과 사용자의 의도에 부합하는 컨텐츠를 사용자 단말(100)로 송신할 수 있다.
일 실시 예에서, 키워드에 대응되는 컨텐츠가 복수 개 존재하는 경우 서버(300)는 검색된 복수 개의 컨텐츠들 중에서 사용자의 의도에 가장 부합하는 컨텐츠를 선택하고, 선택된 컨텐츠를 전자 장치(100)로 송신할 수 있다. 이하, 도 2의 구성 요소와 동일 또는 유사한 구성 요소에 도 2의 참조 번호가 인용될 수 있다.
다양한 실시 예에서, 컨텐츠 제공 시스템(300)에 의하여 제공 가능한 컨텐츠는 실시간으로 변동될 수 있다. 또는 컨텐츠 제공 시스템(300)이 제공되는 컨텐츠의 종류 및 내용은 컨텐츠를 재생 또는 실행할 전자 장치(100)의 환경에 따라 달라질 수 있다. 제공 가능한 컨텐츠의 목록은 컨텐츠 데이터베이스(332)에 저장될 수 있고, 미리 정해진 주기마다 업데이트될 수 있다.
다양한 실시 예에서, 컨텐츠 제공 시스템(10)은 방송 컨텐츠를 제공할 수 있다. 예를 들어, 방송 컨텐츠를 제공하는 서비스는 실시간 방송 컨텐츠, vod(video on demend) 컨텐츠, 관련 어플리케이션 컨텐츠를 제공할 수 있다. 사용자는 컨텐츠 제공 서비스를 통하여 실시간 방송 또는 vod 컨텐츠를 시청할 수 있고, 관련 어플리케이션을 통하여 수신되는 컨텐츠를 시청할 수 있다. 이하 다양한 실시 예 중 방송 컨텐츠를 제공하는 컨텐츠 제공 시스템(10)을 예시로서 설명한다.
컨텐츠 데이터베이스(332)는 이용가능한 컨텐츠의 목록 정보를 저장할 수 있다. 예를 들어, 방송 컨텐츠는 방송사의 방송 스케쥴에 따라 실시간으로 변동될 수 있다. vod 컨텐츠는 미리 정해진 주기마다 갱신될 수 있다. 제공될 수 있는 어플리케이션 관련 컨텐츠는 전자 장치(100)에 설치된 어플리케이션의 목록에 따라 달라질 수 있다. 상기 이용가능한 컨텐츠 목록은 미리 정해진 주기로 갱신될 수 있다.
다양한 실시 예에서, 서버(300)는 복수 개의 서버를 포함할 수 있다. 예를 들어, 복수 개의 서버가 협력하여 서버(300)의 기능을 수행할 수 있다. 서버(300)에 포함되는 프로세서(310)의 동작들은 복수 개의 서버에 의하여 수행될 수 있다. 이와 관련된 일 예시는 도 8을 참조하여 후술된다.
도 3은 일 실시 예에 따른 발화 기반의 컨텐츠 제공 방법의 순서도이다. 도 4는 다양한 실시 예에 따른 방송 컨텐츠를 제공하는 방법의 일 시나리오를 설명하기 위한 도면이다.
도 3을 참조하면, 일 실시 예에 따른 발화 기반의 컨텐츠 제공 방법은 동작 3010 내지 3040을 포함할 수 있다. 상기 동작 3010 내지 3040은 예를 들어, 도 1에 도시된 컨텐츠 제공 시스템(10) 또는 도 2에 도시된 하나 이상의 서버(300)에 의해 수행될 수 있다. 상기 동작 3010 내지 3040의 각 동작은, 예를 들어, 상기 하나 이상의 서버(300)의 프로세서(310)에 의해 수행(혹은, 실행)될 수 있는 인스트럭션(명령어)들로 구현될 수 있다. 상기 인스트럭션들은, 예를 들어, 컴퓨터 기록 매체 또는 적어도 하나의 서버(300)의 메모리(예: 도 2의 저장소(330))에 저장될 수 있다. 이하에서는 동작 3010 내지 3040 설명에 도 2의 설명과 중복된 설명은 생략될 수 있다.
다양한 실시 예에 따른 컨텐츠 제공 시스템(10)은 음성신호 수신회로(예: 도 2의 음성신호 수신부(140)) 및 디스플레이(예: 도 2의 디스플레이(130))를 포함하는 전자 장치(예: 도 2의 전자 장치(100))를 포함할 수 있다. 컨텐츠 제공 시스템(10)은 상기 전자 장치의 일부이거나 상기 전자 장치와 원격으로 통신하는 적어도 하나의 프로세서(예: 도 2의 프로세서(110), 프로세서(310))를 포함할 수 있다. 컨텐츠 제공 시스템(10)은 상기 적어도 하나의 프로세서와 동작 가능하도록 연결되는 동안, 상기 전자 장치 상에 또는 상기 전자 장치의 외부에 상주하는 적어도 하나의 메모리(예: 도 2의 메모리(150), 저장소(330))를 포함할 수 있다.
이하, 도 3 및 도 4를 참조하여 일 실시 예에 따른 컨텐츠 제공 방법이 설명된다. 방송 컨텐츠를 제공하는 방법이 일 예시로서 설명된다.
동작 3010에서, 컨텐츠 제공 시스템(10)은 음성신호 수신부(140)를 통하여 발화를 획득할 수 있다. 상기 발화는 특정 컨텐츠를 요청하는 음성 명령으로 참조될 수 있다.
동작 3020에서, 컨텐츠 제공 시스템(10)은 획득된 발화로부터 컨텐츠 제공 시스템(10)의 컨텐츠 데이터베이스(332)에 저장된 복수의 컨텐츠 파일들과 연관된 키워드를 추출할 수 있다.
도 4를 참조하면, 사용자(50)는 '왕좌의 게임을 보고 싶어.'라고 발화할 수 있다. 상기 발화(401)는 왕좌의 게임과 연관된 컨텐츠에 대한 재생 또는 실행을 요청하는 음성 명령으로 참조될 수 있다. 컨텐츠 제공 시스템(10)은 상기 발화(401)에서 '왕좌의 게임'을 키워드로 추출할 수 있다.
일 실시 예에서, 컨텐츠 제공 시스템(10)은 메모리(150, 330)에 컨텐츠와 연관된 키워드들을 미리 저장할 수 있다. 예를 들어, 컨텐츠 명칭, 컨텐츠 종류 등 컨텐츠의 메타 데이터에 포함된 정보를 키워드로서 미리 저장할 수 있다. 컨텐츠 제공 시스템(10)은 획득된 발화를 텍스트로 변환하고, 변환된 텍스트에 미리 저장된 키워드들이 포함되어 있는지 판단할 수 있다. 미리 저장된 키워드들과 매칭되는 단어를 키워드로서 추출할 수 있다.
일 실시 예에서, 적어도 하나의 메모리(150, 330)는 복수의 타입에 해당하는 컨텐츠들을 저장할 수 있다. 예를 들어, 적어도 하나의 메모리(150, 330)는 제1 타입 및 제2 타입 중 어느 하나의 타입에 해당하는 복수의 컨텐츠 파일들을 저장하는 컨텐츠 데이터베이스(예: 컨텐츠 데이터베이스(332))를 저장할 수 있다.
동작 3030에서, 컨텐츠 제공 시스템(10)은 상기 키워드에 대응되는 컨텐츠 파일을 검색할 수 있다. 예를 들어, 컨텐츠 제공 시스템(10)은 추출된 키워드에 대응되는 제1 타입의 제1 컨텐츠 파일 및 제2 타입의 제2 컨텐츠 파일을 검색할 수 있다. 동작 3040에서, 컨텐츠 제공 시스템(10)은 제1 타입의 적어도 하나의 컨텐츠 파일의 재생 또는 실행에 따른 화면을 상기 디스플레이(130)를 통하여 표시할 수 있다. 예를 들어, 제1 타입의 우선 순위는 제2 타입의 우선 순위보다 높은 것으로 설정될 수 있다. 컨텐츠 제공 시스템(10)은 검색된 컨텐츠 파일들 중 우선 순위가 높은 컨텐츠 파일만을 재생 또는 실행할 수 있고, 그에 따른 화면을 출력할 수 있다.
예를 들어, 컨텐츠 제공 시스템(10)은 '왕좌의 게임'의 키워드에 대응되는 방송 타입의 컨텐츠 파일과 vod용 컨텐츠 파일을 검색할 수 있다. 방송 타입의 컨텐츠 파일은 vod용 컨텐츠 파일보다 높은 우선 순위를 가지도록 설정될 수 있다. 컨텐츠 제공 시스템(10)은 방송 타입의 컨텐츠 파일을 디스플레이(130)를 통하여 표시할 수 있다. 예를 들어, 특정 채널을 통하여 방송되는 컨텐츠 파일이 재생될 수 있다.
다양한 실시 예에서, 컨텐츠 제공 시스템(10)은 추출된 키워드에 대응되는 동일한 타입의 복수개의 컨텐츠 파일들을 검색할 수 있다. 다양한 실시 예에서, 추출된 키워드에 대응되는 동일한 타입의 복수 개의 컨텐츠 파일들이 검색된 경우, 컨텐츠 제공 시스템(10)은 상기 복수 개의 컨텐츠 파일들 중 어느 하나의 컨텐츠 파일에 대한 선택 입력을 획득하기 위한 선택 인터페이스(410, 420)를 제공할 수 있다.
도 4의 채널 선택 인터페이스(410)를 참조하면, 예를 들어, '왕좌의 게임'의 키워드에 대응되는 방송 타입의 컨텐츠들은 채널 A에서 방송되는 컨텐츠, 채널 B에서 방송되는 컨텐츠, 및 채널 C에서 방송되는 컨텐츠를 포함할 수 있다. 이 경우 복수 개의 검색된 컨텐츠 파일에 대하여 선택 가능한 인터페이스(410)가 제공될 수 있다.
전자 장치(100)는 채널 선택 인터페이스(410)를 통하여 동일한 키워드를 가지는 방송 타입의 컨텐츠 파일들 중 어느 하나의 컨텐츠 파일에 대한 선택 입력을 획득할 수 있다. 사용자(50)의 발화에 포함된 키워드인 '왕좌의 게임'에 대한 방송 타입의 컨텐츠 파일들이 복수 개 검색될 수 있다. 예를 들어 사용자(50)의 발화가 획득된 시점에 채널 A, 채널 B, 및 채널 C에서 왕좌의 게임을 방송 중일 수 있다. 컨텐츠 제공 시스템(10)은 채널 선택 인터페이스(410)를 통하여 채널 A, 채널 B, 및 채널 C에서 방영하는 왕좌의 게임과 관련된 컨텐츠 파일들 중 어느 하나에 대한 선택 입력을 수신할 수 있다. 컨텐츠 제공 시스템(10)은 선택 입력 수신에 응답하여, 선택된 채널의 방송 타입의 컨텐츠를 제공할 수 있다.
VOD 선택 인터페이스(430)는 동일한 키워드를 가지는 vod 컨텐츠 파일들 중 어느 하나의 컨텐츠 파일에 대한 선택 입력을 획득할 수 있다. 사용자(50)의 발화에 포함된 키워드인 '왕좌의 게임'에 대한 vod 컨텐츠 파일들이 복수 개 검색될 수 있다. 예를 들어, 사용자(50)의 발화가 획득된 시점에 '왕좌의 게임'과 관련된 컨텐츠를 실시간 방송하고 있는 채널이 없는 경우에 vod 컨텐츠 파일들에 대한 검색 결과가 vod 선택 인터페이스(430)를 통하여 표시될 수 있다. 컨텐츠 제공 시스템(10)은 vod 선택 인터페이스(430)를 통하여 왕좌의 게임 시즌 1 내지 왕좌의 게임 시즌 5의 vod 컨텐츠 파일들 중 어느 하나에 대한 선택 입력을 수신할 수 있다. 컨텐츠 제공 시스템(10)은 선택 입력 수신에 응답하여, 선택된 vod 컨텐츠 제공할 수 있다.
다양한 실시 예에서, 선택 인터페이스(410, 430)는 발화에 포함된 키워드에 따라 검색되고, 표시되지 않은 컨텐츠 및 그 컨텐츠에 대한 정보를 표시하도록 하는 버튼(예: 더 보기 버튼, more result 버튼)을 포함할 수 있다. 사용자(50)는 현재 화면에 표시되지 않은 낮은 우선 순위를 가지는 컨텐츠를 확인하기 위하여 상기 버튼을 선택할 수 있다. 이에 따라 컨텐츠 제공 시스템(10)은 검색된 다양한 컨텐츠를 디스플레이(130)에 표시할 수 있다.
도 5는 다양한 실시 예에 따른 방송 컨텐츠를 제공하는 방법을 설명하기 위한 도면이다.
다양한 실시 예에 따라 방송 컨텐츠를 제공하는 컨텐츠 제공 시스템(10)은 방송 채널 명칭, 실시간으로 방송되고 있는 채널의 메타 데이터에 포함된 정보, vod 컨텐츠 명칭, 어플리케이션의 명칭을 키워드로서 컨텐츠 데이터베이스(332)에 저장할 수 있다. 서버(300)의 키워드 분석 모듈(314)은 발화에서 미리 저장된 키워드를 추출하고, 추출된 키워드에 대응되는 컨텐츠 파일을 컨텐츠 데이터베이스(332)에서 검색할 수 있다. 예를 들어 컨텐츠 파일들은 각각의 컨텐츠와 연관된 키워드와 맵핑 되어 컨텐츠 데이터베이스(332)에 저장될 수 있다.
다양한 실시 예에서, 전자 장치(100)는 메모리(150)에 방송 컨텐츠 제공 서비스와 연관된 어플리케이션을 저장할 수 있다. 전자 장치(100)는 어플리케이션을 실행하고, 상기 어플리케이션을 통하여 제공되는 컨텐츠를 재생 또는 실행할 수 있다. 예를 들어, 컨텐츠 제공 시스템(10)은 사용자의 발화가 어플리케이션과 연관된 키워드를 포함하는 경우, 전자 장치(100)로 상기 어플리케이션을 실행하도록 하는 제어 신호를 송신할 수 있다. 전자 장치(100)는 상기 제어 신호의 수신에 응답하여 어플리케이션을 실행하고, 상기 어플리케이션의 실행 화면을 디스플레이(130)를 통하여 표시할 수 있다.
다양한 실시 예에서, 실시간 방송 컨텐츠, vod 컨텐츠, 및 어플리케이션 컨텐츠는 서로 다른 우선 순위를 가질 수 있다. 컨텐츠 제공 시스템(10)은 실시간 방송 컨텐츠가 제1 우선 순위를 가지고, vod 컨텐츠가 제2 우선 순위를 가지고, 어플리케이션 컨텐츠가 제3 우선 순위를 가지도록 설정할 수 있다. 예를 들어, 각 컨텐츠 파일의 메타 데이터에 컨텐츠 파일의 종류와 그에 대한 우선 순위에 대한 정보가 포함될 수 있다. 또는 도 5를 참조하면, 컨텐츠 제공 시스템(10)은 도 5의 표(500)과 같이 컨텐츠의 종류에 따른 우선 순위를 지정할 수 있다. 예를 들어 표(500)은 테이블의 형태로 컨텐츠 데이터베이스(221)에 저장될 수 있다.
예를 들어, 방송 채널 명칭이 키워드로서 추출되고 상기 키워드에 의하여 컨텐츠 파일이 검색된 경우, 컨텐츠 제공 시스템(10)은 곧바로 상기 방송 채널의 방송 컨텐츠 파일을 전자 장치(100)로 스트리밍 데이터의 형태로 제공할 수 있고, 전자 장치(100)는 제공된 스트리밍 데이터를 재생할 수 있다.
예를 들어, 사용자는 재생하고자 하는 채널의 명칭을 발화할 수 있지만, 현재 방송되고 있는 채널과 연관된 정보를 발화할 수 있다. 채널과 연관된 정보는 채널의 메타 데이터에 포함될 수 있다. 방송 채널 명칭 및 채널의 메타 데이터에 포함된 정보가 키워드로서 추출되고 상기 키워드에 의하여 컨텐츠 파일이 검색된 경우, 컨텐츠 제공 시스템(10)은 채널 선택 인터페이스(예: 도 4의 채널 선택 인터페이스(410))를 전자 장치(100)로 제공할 수 있고, 전자 장치(100)는 제공된 채널 선택 인터페이스를 디스플레이(130)를 통하여 표시할 수 있다. 전자 장치(100)로부터 특정 채널에 대한 선택 입력이 수신되면, 상기 특정 채널의 실시간 방송 컨텐츠 파일을 전자 장치(100)로 스트리밍 데이터의 형태로 제공할 수 있다.
예를 들어 방송 채널 이름 및 vod 컨텐츠 명칭이 키워드로서 추출되고 상기 키워드에 의하여 컨텐츠 파일이 검색된 경우, 컨텐츠 제공 시스템(10)은 미리 지정된 우선 순위에 따라 사용자가 의도하는 컨텐츠를 상기 방송 채널의 컨텐츠로 결정할 수 있다. 컨텐츠 제공 시스템(10)은 상기 방송 채널의 실시간 방송 컨텐츠 파일을 스트리밍 데이터의 형태로 전자 장치(100)에 제공할 수 있다. 실시간 방송 컨텐츠의 우선 순위가 vod 컨텐츠의 우선 순위보다 넓게 설정됨에 따라 컨텐츠 제공 시스템(10)은 실시간 방송 컨텐츠 만을 전자 장치(100)로 제공할 수 있다.
예를 들어 vod 컨텐츠 명칭 및 어플리케이션 명칭이 키워드로서 추출되고 상기 키워드에 의하여 컨텐츠 파일이 검색된 경우, 컨텐츠 제공 시스템(10)은 미리 지정된 우선 순위에 따라 사용자가 의도하는 컨텐츠를 상기 vod 컨텐츠로 결정할 수 있다. 컨텐츠 제공 시스템(10)은 상기 vod 컨텐츠를 전자 장치(10)에 제공할 수 있다. 다양한 실시 예에서, 키워드에 대응되는 vod 컨텐츠가 복수 개 검색된 경우, 컨텐츠 제공 시스템(10)은 vod 선택 인터페이스(예: vod 선택 인터페이스(430))를 표시하도록 전자 장치(100)에 제어 신호를 송신할 수 있다. 전자 장치(100)는 제어 신호의 수신에 응답하여 vod 선택 인터페이스를 디스플레이(130)를 통하여 표시할 수 있다.
도 6은 다양한 실시 예에 따른 발화 기반의 컨텐츠 제공 방법의 순서도이다. 도 7은 다양한 실시 예에 따른 방송 컨텐츠를 제공하는 방법의 일 시나리오를 설명하기 위한 도면이다.
도 6을 참조하면, 다양한 실시 예에 따른 발화 기반의 컨텐츠 제공 방법은 동작 6010 내지 6050을 포함할 수 있다. 상기 동작 6010 내지 6050은 예를 들어, 도 1에 도시된 컨텐츠 제공 시스템(10) 또는 도 2에 도시된 하나 이상의 서버(300)에 의해 수행될 수 있다. 동작 6010 및 동작 6020은 도 3의 동작 3010 및 동작 3020에 대응될 수 있고, 동작 6050은 도 3의 동작 3030 및 동작 3040에 대응될 수 있다. 이하에서는 도 6에 대한 설명에 도 3의 설명과 중복된 설명은 생략될 수 있다. 이하, 도 6 및 도 7을 참조하여 다양한 실시 예에 따라 방송 컨텐츠를 제공하는 방법이 일 예시로서 설명된다.
동작 6010에서, 컨텐츠 제공 시스템(10)은 음성신호 수신부(140)를 통하여 발화를 획득할 수 있다. 동작 6020에서, 컨텐츠 제공 시스템(10)은 획득된 발화로부터 컨텐츠 제공 시스템(10)의 컨텐츠 데이터베이스(332)에 저장된 복수의 컨텐츠 파일들과 연관된 키워드를 추출할 수 있다.
다양한 실시 예에서, 사용자(50)의 발화는 컨텐츠의 종류와 연관된 키워드를 포함할 수 있다. 컨텐츠 제공 시스템(10)은 컨텐츠 제공 서비스를 통하여 제공하는 컨텐츠의 종류에 대한 키워드를 컨텐츠 데이터베이스(332)에 저장할 수 있다. 예를 들어, 방송 컨텐츠를 제공하는 컨텐츠 제공 시스템(10)은 '채널', '비디오', '어플리케이션'을 키워드로 저장할 수 있다.
동작 6030에서, 컨텐츠 제공 시스템(10)은 발화에 컨텐츠의 타입 명칭이 포함되는지 여부를 판단할 수 있다. 예를 들어, 컨텐츠 제공 시스템(10)은 발화에 '채널', '비디오', '어플리케이션'의 키워드가 포함되었는지 여부를 판단할 수 있다.
동작 6040에서, 컨텐츠 제공 시스템(10)은 발화에 포함된 컨텐츠 타입 명칭에 대응되는 타입의 컨텐츠파일을 검색하고, 검색된 컨텐츠 파일을 제공할 수 있다.
예를 들어 도 7을 참조하면, 사용자(50)의 발화(711)는 '채널'의 키워드를 포함하므로 컨텐츠 제공 시스템(10)은 '왕좌의 게임'을 방영하는 실시간 방송 컨텐츠를 제공할 수 있다. 전자 장치(100)는 디스플레이(130)를 통하여 방송 화면(705)을 표시할 수 있다.
예를 들어, 사용자(50)의 발화(721)는 '비디오'의 키워드를 포함하므로 컨텐츠 제공 시스템(10)은 '왕좌의 게임'과 연관된 vod 컨텐츠를 전자 장치(100)에 제공할 수 있다. 특히 '왕좌의 게임'과 연관된 vod 컨텐츠 파일들이 복수 개인 경우, 전자 장치(100)는 vod 선택 인터페이스를 포함하는 화면(735)을 디스플레이(130)를 통하여 표시할 수 있다.
예를 들어 사용자(50)의 발화(731)는 '어플리케이션'의 키워드를 포함하므로 컨텐츠 제공 시스템(10)은 'HCO'와 연관된 어플리케이션이 실행되도록 전자 장치(100)에 제어 신호를 송신할 수 있다. 전자 장치(100)는 HCO 어플리케이션을 실행할 수 있다. 예를 들어 사용자(50)는 실행된 HCO 어플리케이션을 통하여 원하는 컨텐츠를 제공 받을 수 있다.
다양한 실시 예에서, 컨텐츠 제공 시스템(10)은 전자 장치(100)에 설치된 어플리케이션들에 대한 목록 정보를 획득할 수 있다. 컨텐츠 제공 시스템(10)은 상기 목록 정보로부터 전자 장치(100)에 의하여 실행될 수 있는 어플리케이션을 검색할 수 있다. 검색된 어플리케이션이 복수 개인 경우, 컨텐츠 제공 시스템(10)은 전자 장치(100)가 복수 개의 어플리케이션에 대하여 선택 가능한 앱 선택 인터페이스를 포함하는 화면(725)을 표시하도록 제어 신호를 송신할 수 있다. 다른 예에서, 사용자의 발화에 대응되는 어플리케이션이 상기 목록 정보에 포함되지 않은 경우, 컨텐츠 제공 시스템(10)은 전자 장치(100)로 해당 어플리케이션을 설치할 수 있는 링크를 제공할 수 있다. 또는 컨텐츠 제공 시스템(10)은 전자 장치(100)가 해당 어플리케이션이 설치되지 않았음을 알리는 안내 메시지를 표시하도록 상기 전자 장치(100)로 제어 신호를 송신할 수 있다.
발화에 컨텐츠 타입 명칭이 포함되지 않은 경우, 동작 6050에서 컨텐츠 제공 시스템(10)은 추출된 키워드에 대응되는 제1 타입의 제1 컨텐츠 파일 및 제2 타입의 제2 컨텐츠 파일을 검색할 수 있다. 컨텐츠 제공 시스템(10)은 우선 순위가 높은 제1 타입의 적어도 하나의 컨텐츠 파일의 재생 또는 실행에 따른 화면을 상기 디스플레이(130)를 통하여 표시할 수 있다. 예를 들어, 발화(701)에는 컨텐츠 타입 명칭이 포함되지 않으므로 컨텐츠 제공 시스템(10)은 키워드에 따라 검색된 컨텐츠에 대응하여 화면(705), 화면(715), 화면(725) 및 화면(735) 중 어느 하나의 화면을 사용자(50)에게 제공할 수 있다.
도 8은 다양한 실시 예에 따른 컨텐츠 제공 시스템의 동작 시퀀스이다.
도 8을 참조하면, 다양한 실시 예에 따른 컨텐츠 제공 시스템(예: 도 1의 컨텐츠 제공 시스템(10))은 전자 장치(100)(예: 도 2의 전자 장치(100)), 제1 서버(300a), 제2 서버(300b)를 포함할 수 있다. 예를 들어, 제1 서버(300a) 및 제2 서버(300b)는 도 2의 서버(300)의 적어도 일부 동작을 수행하는 서버 장치로 참조될 수 있다. 제1 서버(300a) 및 제2 서버(300b)는 도 2의 서버(300)의 적어도 일부 구성을 포함하도록 구성될 수 있다.
일 실시 예에서, 제1 서버(300a)는 음성 인식 기능을 수행하는 서버로 참조될 수 있다. 제1 서버(300a)는 음성 인식 서비스를 제공하는 적어도 하나의 제1 프로세서(예: 도 2의 프로세서(310))를 포함할 수 있다.
일 실시 예에서, 제2 서버(300b)는 컨텐츠를 제공하는 기능을 수행하는 서버로 참조될 수 있다. 제2 서버(300b)는 컨텐츠 제공 서비스를 지원하는 적어도 하나의 제2 프로세서(예: 도 2의 프로세서(310)), 및 제1 타입 및 제2 타입 중 어느 하나의 타입에 해당하는 복수의 컨텐츠 파일들을 저장하는 컨텐츠 데이터베이스(예: 도 2의 컨텐츠 데이터 베이스(332))를 저장하는 저장소(예: 도 2의 저장소(330))를 포함할 수 있다. 제1 서버(300a)와 제2 서버(300b)는 협력하여 컨텐츠 제공 서비스를 지원할 수 있다.
일 실시 예에서, 전자 장치(100)는 음성신호 수신부(140)를 통하여 발화를 수신할 수 있다(801). 전자 장치(100)는 제1 서버(300a)로 수신한 발화를 송신할 수 있다(803).
일 실시 예에서, 제1 서버(300a)는 발화로부터 컨텐츠 파일과 연관된 키워드를 추출할 수 있다(805). 제1 서버(300a)는 추출된 키워드를 기초로 제1 커맨드를 생성할 수 있다(807). 예를 들어, 제1 서버(300a)는 추출된 키워드에 대응되는 제1 타입의 적어도 하나의 컨텐츠 파일 및 상기 제2 타입의 적어도 하나의 컨텐츠 파일이 컨텐츠 데이터베이스에 포함된 경우, 상기 제1 타입의 적어도 하나의 컨텐츠 파일을 요청하는 제1 커맨드를 생성할 수 있다.
일 실시 예에서, 제1 서버(300a)는 생성한 제1 커맨드를 전자 장치(100)로 송신할 수 있다(809). 전자 장치(100)는 수신한 제1 커맨드를 제2 서버(300b)로 송신할 수 있다(811). 다른 실시 예에서, 제1 서버(300a)는 생성한 제1 커맨드를 제2 서버(300b)로 송신할 수 있다(815). 동작 809 및 동작 811과 동작 815는 택일적으로 수행될 수 있다.
일 실시 예에서, 제2 서버(300b)는 전자 장치(100)로부터 제1 커맨드를 수신하면, 전자 장치(100)로 제1 커맨드에 해당하는 컨텐츠 파일을 송신할 수 있다(815). 예를 들어, 제2 서버(300b)는 커맨드의 수신에 응답하여 제1 타입의 상기 적어도 하나의 컨텐츠 파일을 전자 장치(100)로 송신할 수 있다.
다양한 실시 예에 따른 장치(예: 모듈들 또는 그 기능들) 또는 방법(예: 동작들)의 적어도 일부는 프로그램 모듈의 형태로 컴퓨터로 판독 가능한 저장 매체에 저장된 명령어로 구현될 수 있다. 상기 명령어가 프로세서에 의해 실행될 경우, 프로세서가 상기 명령어에 해당하는 기능을 수행할 수 있다. 컴퓨터로 판독 가능한 기록 매체는, 하드디스크, 플로피디스크, 마그네틱 매체(예: 자기테이프), 광기록 매체(예: CD-ROM, DVD, 자기-광 매체 (예: 플롭티컬 디스크), 내장 메모리 등을 포함할 수 있다. 명령어는 컴파일러에 의해 만들어지는 코드 또는 인터프리터에 의해 실행될 수 있는 코드를 포함할 수 있다.
본 문서에 개시된 실시 예는 개시된, 기술 내용의 설명 및 이해를 위해 제시된 것이며, 본 발명의 범위를 한정하는 것은 아니다. 따라서, 본 문서의 범위는, 본 발명의 기술적 사상에 근거한 모든 변경 또는 다양한 다른 실시 예를 포함하는 것으로 해석되어야 한다.

Claims (29)

  1. 디스플레이 장치에 있어서,
    신호 수신부;
    음성 입력 수신부;
    디스플레이;
    통신부; 및
    상기 신호 수신부, 상기 음성 입력 수신부, 상기 디스플레이, 및 상기 통신부와 연결된 프로세서를 포함하고,
    상기 프로세서는:
    상기 신호 수신부를 통해 수신된 신호에 대응한 화면이 상기 디스플레이에 표시되는 동안 상기 음성 입력 수신부를 통해 컨텐츠에 대응하는 제1 사용자 음성 입력을 수신하고,
    상기 제1 사용자 음성 입력에 기반한 컨텐츠가 방송 컨텐츠에 대응하면, 상기 통신부를 통해 외부 서버로부터 수신한 상기 컨텐츠가 방송되고 있는 복수 개의 채널들을 포함하는 제1 UI를 상기 디스플레이를 통해 상기 신호에 대응하는 화면과 함께 출력하도록 제어하고,
    상기 제1 UI가 상기 디스플레이에 출력되는 동안 상기 복수 개의 채널들 중 하나를 선택하는 제2 사용자 음성 입력을 상기 음성 입력 수신부를 통해 수신하고,
    상기 제2 사용자 음성 입력에 의해 선택된 채널에 대응하는 화면이 상기 디스플레이를 통해 출력하도록 제어하고, 및
    상기 제1 사용자 음성 입력에 기반한 상기 컨텐츠가 주문형 비디오(video on demand, VOD) 컨텐츠에 대응하면, 상기 통신부를 통해 상기 외부 서버로부터 수신된 상기 VOD 컨텐츠에 대응하는 복수 개의 정보를 포함하는 제2 UI를 상기 디스플레이를 통해 상기 신호에 대응하는 화면과 함께 출력하도록 제어하고,
    상기 제2 UI가 상기 디스플레이에 출력되는 동안 상기 복수 개의 정보 중 하나를 선택하는 제3 사용자 음성 입력을 상기 음성 입력 수신부를 통해 수신하고,
    상기 제3 사용자 음성 입력에 의해 선택된 정보에 대응하는 화면이 상기 디스플레이를 통해출력하도록 제어하고,
    상기 방송 컨텐츠의 우선 순위는 상기 VOD 컨텐츠의 우선 순위보다 높은, 디스플레이 장치.
  2. 삭제
  3. 청구항 1에 있어서,
    상기 프로세서는:
    상기 방송 컨텐츠에 대응하는 정보 또는 상기 VOD 컨텐츠에 대응하는 정보 중 하나에 대한 선택 입력을 획득하기 위한 인터페이스를 포함하는 상기 화면을 상기 디스플레이를 통하여 표시하는, 디스플레이 장치.
  4. 청구항 3에 있어서, 상기 프로세서는,
    상기 인터페이스를 통해 획득한 상기 선택 입력에 기반하여, 상기 방송 컨텐츠에 대응하는 정보 또는 상기 VOD 컨텐츠에 대응하는 정보 중 선택된 정보에 대응하는 컨텐츠 파일을 실행하는, 디스플레이 장치.
  5. 청구항 1에 있어서, 상기 프로세서는,
    상기 제1 사용자 음성 입력이 상기 방송 컨텐츠와 연관된 키워드를 포함하고, 상기 VOD 컨텐츠와 연관된 키워드를 포함하지 않는 경우, 상기 디스플레이를 통해 상기 방송 컨텐츠에 대응하는 컨텐츠 파일을 실행하는, 디스플레이 장치.
  6. 청구항 1에 있어서,
    상기 제2 사용자 음성 입력은 상기 복수 개의 채널들 중 상기 사용자가 선택하는 상기 채널의 명칭을 포함하는, 디스플레이 장치.
  7. 청구항 1에 있어서, 상기 프로세서는,
    상기 방송 컨텐츠 및 상기 VOD 컨텐츠를 포함하는 인터페이스를 상기 디스플레이를 통해 출력하고,
    상기 방송 컨텐츠 또는 상기 VOD 컨텐츠 중 어느 하나의 컨텐츠를 선택하는 입력을 수신하고, 및
    상기 선택된 컨텐츠를 상기 디스플레이를 통해 출력하는, 디스플레이 장치.
  8. 삭제
  9. 삭제
  10. 청구항 1에 있어서,
    상기 프로세서는,
    상기 제1 사용자 음성 입력이 상기 방송 컨텐츠와 연관된 제1 키워드 및 상기 VOD 컨텐츠와 제2 키워드를 포함하면, 상기 방송 컨텐츠와 연관된 화면을 상기 디스플레이를 통하여 표시하는, 디스플레이 장치.
  11. 청구항 1에 있어서,
    메모리;를 더 포함하고,
    상기 방송 컨텐츠 및 상기 VOD 컨텐츠를 제공하는 적어도 하나의 어플리케이션은 상기 메모리에 저장되고,
    상기 프로세서는,
    상기 제1 사용자 음성 입력이 상기 적어도 하나의 어플리케이션과 연관된 키워드를 포함하면, 상기 적어도 하나의 어플리케이션을 실행하는, 디스플레이 장치.
  12. 삭제
  13. 청구항 11에 있어서,
    상기 적어도 하나의 어플리케이션은 제1 어플리케이션 및 제2 어플리케이션을 포함하고,
    상기 프로세서는,
    상기 제1 사용자 음성 입력이 상기 적어도 하나의 어플리케이션과 연관된 키워드를 포함하면, 상기 제1 어플리케이션 및 상기 제2 어플리케이션 중 어느 하나의 어플리케이션에 대한 선택 입력을 획득하기 위한 인터페이스를 상기 디스플레이를 통하여 표시하는, 디스플레이장치.
  14. 삭제
  15. 삭제
  16. 삭제
  17. 삭제
  18. 삭제
  19. 삭제
  20. 삭제
  21. 디스플레이 장치를 제어하는 방법에 있어서,
    신호 수신부를 통해 수신된 신호에 대응한 화면이 디스플레이에 표시되는 동안 음성 입력 수신부를 통해 컨텐츠에 대응하는 제1 사용자 음성 입력을 수신하는 동작;
    상기 제1 사용자 음성 입력에 기반한 컨텐츠가 방송 컨텐츠에 대응하면, 통신부를 통해 외부 서버로부터 수신한 상기 컨텐츠가 방송되고 있는 복수 개의 채널들을 포함하는 제1 UI를 상기 디스플레이를 통해 상기 신호에 대응하는 화면과 함께 출력하도록 제어하는 동작;
    상기 제1 UI가 상기 디스플레이에 출력되는 동안 상기 복수 개의 채널들 중 하나를 선택하는 제2 사용자 음성 입력을 상기 음성 입력 수신부를 통해 수신하는 동작;
    상기 제2 사용자 음성 입력에 의해 선택된 채널에 대응하는 화면이 상기 디스플레이를 통해 출력하도록 제어하는 동작; 및
    상기 제1 사용자 음성 입력에 기반한 상기 컨텐츠가 주문형 비디오(video on demand, VOD) 컨텐츠에 대응하면, 상기 통신부를 통해 상기 외부 서버로부터 수신된 상기 VOD 컨텐츠에 대응하는 복수 개의 정보를 포함하는 제2 UI를 상기 디스플레이를 통해 상기 신호에 대응하는 화면과 함께 출력하도록 제어하는 동작;
    상기 제2 UI가 상기 디스플레이에 출력되는 동안 상기 복수 개의 정보 중 하나를 선택하는 제3 사용자 음성 입력을 상기 음성 입력 수신부를 통해 수신하는 동작;
    상기 제3 사용자 음성 입력에 의해 선택된 정보에 대응하는 화면이 상기 디스플레이를 통해출력하도록 제어하는 동작;을 포함하고,
    상기 방송 컨텐츠의 우선 순위는 상기 VOD 컨텐츠의 우선 순위보다 높은, 방법.
  22. 청구항 21에 있어서,
    상기 방송 컨텐츠에 대응하는 정보 또는 상기 VOD 컨텐츠에 대응하는 정보 중 하나에 대한 선택 입력을 획득하기 위한 인터페이스를 포함하는 화면을 상기 디스플레이를 통하여 표시하는 동작; 을 더 포함하는 방법.
  23. 청구항 22에 있어서,
    상기 인터페이스를 통해 획득한 상기 선택 입력에 기반하여, 상기 방송 컨텐츠에 대응하는 정보 또는 상기 VOD 컨텐츠에 대응하는 정보 중 선택된 정보에 대응하는 컨텐츠 파일을 실행하는 동작; 을 더 포함하는 방법.
  24. 청구항 21에 있어서,
    상기 제1 사용자 음성 입력이 상기 방송 컨텐츠와 연관된 키워드를 포함하고, 상기 VOD 컨텐츠와 연관된 키워드를 포함하지 않는 경우, 상기 디스플레이를 통해 상기 방송 컨텐츠에 대응하는 컨텐츠 파일을 실행하는 동작; 을 더 포함하는 방법.
  25. 청구항 21에 있어서,
    상기 제2 사용자 음성 입력은 상기 복수 개의 채널들 중 상기 사용자가 선택하는 상기 채널의 명칭을 포함하는, 방법.
  26. 청구항 21에 있어서,
    상기 방송 컨텐츠 및 상기 VOD 컨텐츠를 포함하는 인터페이스를 상기 디스플레이를 통해 출력하는 동작;
    상기 방송 컨텐츠 또는 상기 VOD 컨텐츠 중 어느 하나의 컨텐츠를 선택하는 입력을 수신하는 동작; 및
    상기 선택된 컨텐츠를 상기 디스플레이를 통해 출력하는 동작; 을 더 포함하는 방법.
  27. 청구항 21에 있어서,
    상기 제1 사용자 음성 입력이 상기 방송 컨텐츠와 연관된 제1 키워드 및 상기 VOD 컨텐츠와 제2 키워드를 포함하면, 상기 방송 컨텐츠와 연관된 화면을 상기 디스플레이를 통하여 표시하는 동작; 을 더 포함하는 방법.
  28. 청구항 21에 있어서,
    상기 제1 사용자 음성 입력이 적어도 하나의 어플리케이션과 연관된 키워드를 포함하면, 상기 적어도 하나의 어플리케이션을 실행하는 동작;을 더 포함하는 방법.
  29. 청구항 28에 있어서,
    상기 적어도 하나의 어플리케이션은 제1 어플리케이션 및 제2 어플리케이션을 포함하고,
    상기 제1 사용자 음성 입력이 상기 적어도 하나의 어플리케이션과 연관된 키워드를 포함하면, 상기 제1 어플리케이션 및 상기 제2 어플리케이션 중 어느 하나의 어플리케이션에 대한 선택 입력을 획득하기 위한 인터페이스를 상기 디스플레이를 통하여 표시하는 동작;을 더 포함하는 방법.

KR1020180019405A 2018-02-19 2018-02-19 사용자의 발화를 기반으로 컨텐츠를 제공하는 장치 및 시스템 KR102468214B1 (ko)

Priority Applications (6)

Application Number Priority Date Filing Date Title
KR1020180019405A KR102468214B1 (ko) 2018-02-19 2018-02-19 사용자의 발화를 기반으로 컨텐츠를 제공하는 장치 및 시스템
PCT/KR2019/001936 WO2019160388A1 (ko) 2018-02-19 2019-02-19 사용자의 발화를 기반으로 컨텐츠를 제공하는 장치 및 시스템
US16/963,694 US11432045B2 (en) 2018-02-19 2019-02-19 Apparatus and system for providing content based on user utterance
US17/871,521 US11706495B2 (en) 2018-02-19 2022-07-22 Apparatus and system for providing content based on user utterance
KR1020220151481A KR20220156786A (ko) 2018-02-19 2022-11-14 사용자의 발화를 기반으로 컨텐츠를 제공하는 장치 및 시스템
US18/211,129 US20230336824A1 (en) 2018-02-19 2023-06-16 Apparatus and system for providing content based on user utterance

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180019405A KR102468214B1 (ko) 2018-02-19 2018-02-19 사용자의 발화를 기반으로 컨텐츠를 제공하는 장치 및 시스템

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020220151481A Division KR20220156786A (ko) 2018-02-19 2022-11-14 사용자의 발화를 기반으로 컨텐츠를 제공하는 장치 및 시스템

Publications (2)

Publication Number Publication Date
KR20190099676A KR20190099676A (ko) 2019-08-28
KR102468214B1 true KR102468214B1 (ko) 2022-11-17

Family

ID=67619928

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020180019405A KR102468214B1 (ko) 2018-02-19 2018-02-19 사용자의 발화를 기반으로 컨텐츠를 제공하는 장치 및 시스템
KR1020220151481A KR20220156786A (ko) 2018-02-19 2022-11-14 사용자의 발화를 기반으로 컨텐츠를 제공하는 장치 및 시스템

Family Applications After (1)

Application Number Title Priority Date Filing Date
KR1020220151481A KR20220156786A (ko) 2018-02-19 2022-11-14 사용자의 발화를 기반으로 컨텐츠를 제공하는 장치 및 시스템

Country Status (3)

Country Link
US (3) US11432045B2 (ko)
KR (2) KR102468214B1 (ko)
WO (1) WO2019160388A1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102468214B1 (ko) * 2018-02-19 2022-11-17 삼성전자주식회사 사용자의 발화를 기반으로 컨텐츠를 제공하는 장치 및 시스템

Family Cites Families (50)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6243676B1 (en) * 1998-12-23 2001-06-05 Openwave Systems Inc. Searching and retrieving multimedia information
US6473778B1 (en) * 1998-12-24 2002-10-29 At&T Corporation Generating hypermedia documents from transcriptions of television programs using parallel text alignment
CA2366057C (en) * 1999-03-05 2009-03-24 Canon Kabushiki Kaisha Database annotation and retrieval
US6442518B1 (en) * 1999-07-14 2002-08-27 Compaq Information Technologies Group, L.P. Method for refining time alignments of closed captions
US7047191B2 (en) * 2000-03-06 2006-05-16 Rochester Institute Of Technology Method and system for providing automated captioning for AV signals
US6925455B2 (en) * 2000-12-12 2005-08-02 Nec Corporation Creating audio-centric, image-centric, and integrated audio-visual summaries
US7065524B1 (en) * 2001-03-30 2006-06-20 Pharsight Corporation Identification and correction of confounders in a statistical analysis
US7110664B2 (en) * 2001-04-20 2006-09-19 Front Porch Digital, Inc. Methods and apparatus for indexing and archiving encoded audio-video data
US7035468B2 (en) * 2001-04-20 2006-04-25 Front Porch Digital Inc. Methods and apparatus for archiving, indexing and accessing audio and video data
US7908628B2 (en) * 2001-08-03 2011-03-15 Comcast Ip Holdings I, Llc Video and digital multimedia aggregator content coding and formatting
US20030061028A1 (en) * 2001-09-21 2003-03-27 Knumi Inc. Tool for automatically mapping multimedia annotations to ontologies
US7092888B1 (en) * 2001-10-26 2006-08-15 Verizon Corporate Services Group Inc. Unsupervised training in natural language call routing
WO2003061285A2 (en) * 2001-12-24 2003-07-24 Scientific Generics Limited Captioning system
US8522267B2 (en) * 2002-03-08 2013-08-27 Caption Colorado Llc Method and apparatus for control of closed captioning
US7440895B1 (en) * 2003-12-01 2008-10-21 Lumenvox, Llc. System and method for tuning and testing in a speech recognition system
US20070124788A1 (en) * 2004-11-25 2007-05-31 Erland Wittkoter Appliance and method for client-sided synchronization of audio/video content and external data
US7873654B2 (en) * 2005-01-24 2011-01-18 The Intellection Group, Inc. Multimodal natural language query system for processing and analyzing voice and proximity-based queries
US7739253B1 (en) * 2005-04-21 2010-06-15 Sonicwall, Inc. Link-based content ratings of pages
US7382933B2 (en) * 2005-08-24 2008-06-03 International Business Machines Corporation System and method for semantic video segmentation based on joint audiovisual and text analysis
US7801910B2 (en) * 2005-11-09 2010-09-21 Ramp Holdings, Inc. Method and apparatus for timed tagging of media content
US20070124147A1 (en) * 2005-11-30 2007-05-31 International Business Machines Corporation Methods and apparatus for use in speech recognition systems for identifying unknown words and for adding previously unknown words to vocabularies and grammars of speech recognition systems
US20070126926A1 (en) * 2005-12-04 2007-06-07 Kohtaroh Miyamoto Hybrid-captioning system
US8209724B2 (en) * 2007-04-25 2012-06-26 Samsung Electronics Co., Ltd. Method and system for providing access to information of potential interest to a user
US7593927B2 (en) * 2006-03-10 2009-09-22 Microsoft Corporation Unstructured data in a mining model language
JP4158937B2 (ja) * 2006-03-24 2008-10-01 インターナショナル・ビジネス・マシーンズ・コーポレーション 字幕修正装置
US9318108B2 (en) * 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US8045054B2 (en) * 2006-09-13 2011-10-25 Nortel Networks Limited Closed captioning language translation
US7925505B2 (en) * 2007-04-10 2011-04-12 Microsoft Corporation Adaptation of language models and context free grammar in speech recognition
US8000972B2 (en) * 2007-10-26 2011-08-16 Sony Corporation Remote controller with speech recognition
US8583416B2 (en) * 2007-12-27 2013-11-12 Fluential, Llc Robust information extraction from utterances
US7509385B1 (en) * 2008-05-29 2009-03-24 International Business Machines Corporation Method of system for creating an electronic message
US8131545B1 (en) * 2008-09-25 2012-03-06 Google Inc. Aligning a transcript to audio data
US20100091187A1 (en) * 2008-10-15 2010-04-15 Echostar Technologies L.L.C. Method and audio/video device for processing caption information
US8442498B2 (en) * 2008-12-19 2013-05-14 Verizon Patent And Licensing Inc. Methods, systems and computer program products for remote DVR interface provisioning
CA2690174C (en) * 2009-01-13 2014-10-14 Crim (Centre De Recherche Informatique De Montreal) Identifying keyword occurrences in audio data
US9183834B2 (en) * 2009-07-22 2015-11-10 Cisco Technology, Inc. Speech recognition tuning tool
US8843368B2 (en) * 2009-08-17 2014-09-23 At&T Intellectual Property I, L.P. Systems, computer-implemented methods, and tangible computer-readable storage media for transcription alignment
US8572488B2 (en) * 2010-03-29 2013-10-29 Avid Technology, Inc. Spot dialog editor
US8571857B2 (en) * 2010-10-20 2013-10-29 At&T Intellectual Property I, L.P. System and method for generating models for use in automatic speech recognition
US9679561B2 (en) * 2011-03-28 2017-06-13 Nuance Communications, Inc. System and method for rapid customization of speech recognition models
KR101878488B1 (ko) 2011-12-20 2018-08-20 한국전자통신연구원 대화 연관 컨텐츠 제공 방법 및 장치
KR101483191B1 (ko) * 2012-11-22 2015-01-15 주식회사 케이티 대화형 서비스를 제공하는 장치 및 방법 그리고, 서버
KR102030114B1 (ko) * 2013-01-07 2019-10-08 삼성전자주식회사 서버 및 그의 제어 방법
KR102227599B1 (ko) * 2013-11-12 2021-03-16 삼성전자 주식회사 음성인식 시스템, 음성인식 서버 및 디스플레이 장치의 제어방법
KR20150084520A (ko) 2014-01-14 2015-07-22 삼성전자주식회사 디스플레이 장치, 대화형 서버 및 응답 정보 제공 방법
KR102297519B1 (ko) * 2014-02-25 2021-09-03 삼성전자주식회사 서버 및 이의 가이드 문장 생성 방법
KR20160039830A (ko) * 2014-10-02 2016-04-12 엘지전자 주식회사 멀티미디어 장치 및 그의 음성 가이드 제공방법
KR102254894B1 (ko) * 2015-01-05 2021-05-24 엘지전자 주식회사 음성 인식 검색 결과를 이용하여 카테고리를 배열하는 디스플레이 디바이스 및 그 제어 방법
KR102499124B1 (ko) 2016-01-21 2023-02-15 삼성전자주식회사 디스플레이 장치 및 디스플레이 장치의 제어 방법
KR102468214B1 (ko) * 2018-02-19 2022-11-17 삼성전자주식회사 사용자의 발화를 기반으로 컨텐츠를 제공하는 장치 및 시스템

Also Published As

Publication number Publication date
US20230336824A1 (en) 2023-10-19
US20220360856A1 (en) 2022-11-10
KR20190099676A (ko) 2019-08-28
US11706495B2 (en) 2023-07-18
US20210084378A1 (en) 2021-03-18
WO2019160388A1 (ko) 2019-08-22
KR20220156786A (ko) 2022-11-28
US11432045B2 (en) 2022-08-30

Similar Documents

Publication Publication Date Title
US20210152870A1 (en) Display apparatus, server apparatus, display system including them, and method for providing content thereof
KR102304052B1 (ko) 디스플레이 장치 및 그의 동작 방법
CN108063969B (zh) 显示设备、控制显示设备的方法、服务器以及控制服务器的方法
JP6375521B2 (ja) 音声検索装置、音声検索方法、および表示装置
CN109474843B (zh) 语音操控终端的方法、客户端、服务器
US20140195230A1 (en) Display apparatus and method for controlling the same
KR101992475B1 (ko) 현재 플레이 중인 텔레비전 프로그램과 연관된 메타데이터를 식별하기 위해 오디오 스트림 사용
KR20130018464A (ko) 전자 장치 및 그의 제어 방법
US9230559B2 (en) Server and method of controlling the same
TW201435856A (zh) 電子裝置以及控制電子裝置的方法
JP2014532933A (ja) 電子装置及びその制御方法
US20140123185A1 (en) Broadcast receiving apparatus, server and control methods thereof
JPWO2015098079A1 (ja) 音声認識処理装置、音声認識処理方法、および表示装置
CN103546788A (zh) 控制外部输入和广播接收装置的方法
CN103546763A (zh) 用于提供内容信息的方法和广播接收设备
JP2023104954A (ja) 情報処理装置、情報処理方法、プログラム
US20230336824A1 (en) Apparatus and system for providing content based on user utterance
KR102145370B1 (ko) 화면을 제어하는 미디어 재생 장치, 방법 및 화면을 분석하는 서버
TW201337860A (zh) 提供口述影像可用性通知的方法與設備
CN104717536A (zh) 一种语音控制的方法和系统
KR102307330B1 (ko) 수신 장치 및 수신 방법
KR102544612B1 (ko) 영상 콘텐츠 연동형 서비스 제공 방법 및 장치
JP2021092612A (ja) コマンド制御装置、制御方法および制御プログラム
KR20110007384A (ko) 동영상 추출 방식을 이용한 외국어 학습 시스템 및 그 방법
KR20200069936A (ko) 미디어에 포함된 정보를 제공하는 장치 및 그 방법

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
A107 Divisional application of patent
GRNT Written decision to grant