KR20150084520A - 디스플레이 장치, 대화형 서버 및 응답 정보 제공 방법 - Google Patents

디스플레이 장치, 대화형 서버 및 응답 정보 제공 방법 Download PDF

Info

Publication number
KR20150084520A
KR20150084520A KR1020140004623A KR20140004623A KR20150084520A KR 20150084520 A KR20150084520 A KR 20150084520A KR 1020140004623 A KR1020140004623 A KR 1020140004623A KR 20140004623 A KR20140004623 A KR 20140004623A KR 20150084520 A KR20150084520 A KR 20150084520A
Authority
KR
South Korea
Prior art keywords
information
display device
filtering
voice
unit
Prior art date
Application number
KR1020140004623A
Other languages
English (en)
Inventor
손지혜
김도완
박성윤
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020140004623A priority Critical patent/KR20150084520A/ko
Priority to PCT/KR2014/005693 priority patent/WO2015108255A1/en
Priority to US14/337,673 priority patent/US20150201246A1/en
Priority to EP14181056.4A priority patent/EP2894632A1/en
Priority to CN201410495834.4A priority patent/CN104780452A/zh
Publication of KR20150084520A publication Critical patent/KR20150084520A/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/482End-user interface for program selection
    • H04N21/4828End-user interface for program selection for searching program descriptors
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification
    • G10L17/22Interactive procedures; Man-machine interfaces
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/235Processing of additional data, e.g. scrambling of additional data or processing content descriptors
    • H04N21/2355Processing of additional data, e.g. scrambling of additional data or processing content descriptors involving reformatting operations of additional data, e.g. HTML pages
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/239Interfacing the upstream path of the transmission network, e.g. prioritizing client content requests
    • H04N21/2393Interfacing the upstream path of the transmission network, e.g. prioritizing client content requests involving handling client requests
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/254Management at additional data server, e.g. shopping server, rights management server
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/258Client or end-user data management, e.g. managing client capabilities, user preferences or demographics, processing of multiple end-users preferences to derive collaborative data
    • H04N21/25808Management of client data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/258Client or end-user data management, e.g. managing client capabilities, user preferences or demographics, processing of multiple end-users preferences to derive collaborative data
    • H04N21/25866Management of end-user data
    • H04N21/25891Management of end-user data being end-user preferences
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/266Channel or content management, e.g. generation and management of keys and entitlement messages in a conditional access system, merging a VOD unicast channel into a multicast channel
    • H04N21/2668Creating a channel for a dedicated end-user group, e.g. insertion of targeted commercials based on end-user profiles
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/422Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
    • H04N21/42203Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS] sound input device, e.g. microphone
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/462Content or additional data management, e.g. creating a master electronic program guide from data received from the Internet and a Head-end, controlling the complexity of a video stream by scaling the resolution or bit-rate based on the client capabilities
    • H04N21/4622Retrieving content or additional data from different sources, e.g. from a broadcast channel and the Internet
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/475End-user interface for inputting end-user data, e.g. personal identification number [PIN], preference data
    • H04N21/4755End-user interface for inputting end-user data, e.g. personal identification number [PIN], preference data for defining user preferences, e.g. favourite actors or genre
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/482End-user interface for program selection
    • H04N21/4826End-user interface for program selection using recommendation lists, e.g. of programs or channels sorted out according to their score
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/65Transmission of management data between client and server
    • H04N21/658Transmission by the client directed to the server
    • H04N21/6582Data stored in the client, e.g. viewing habits, hardware capabilities, credit card number
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/84Generation or processing of descriptive data, e.g. content descriptors
    • H04N21/8405Generation or processing of descriptive data, e.g. content descriptors represented by keywords
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/226Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
    • G10L2015/228Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of application context

Abstract

디스플레이 장치가 개시된다. 본 디스플레이 장치는, 컨텐츠를 표시하는 디스플레이부, 사용자 발화 음성을 수집하는 음성 수집부, 수집된 발화 음성과 디스플레이 장치의 필터링 정보를 대화형 서버에 제공하는 통신 인터페이스부, 및 발화 음성 및 필터링 정보에 대응되는 응답 정보가 대화형 서버로부터 수신되면, 응답 정보가 표시되도록 디스플레이부를 제어하는 제어부를 포함한다.

Description

디스플레이 장치, 대화형 서버 및 응답 정보 제공 방법{DISPLAY APPARATUS, INTERATIVE SERVER AND METHOD FOR PROVIDING RESPONSE INFORMATION}
본 발명은 디스플레이 장치, 대화형 서버 및 응답 정보 제공 방법에 관한 것으로, 보다 상세하게는 사용자의 발화 음성에 대응하는 채널 정보를 대화형 서버 측에서 필터링하여 제공할 수 있는 디스플레이 장치, 대화형 서버 및 응답 정보 제공 방법에 관한 것이다.
음성 인식이란, 사람이 발성한 음성의 의미 내용을 컴퓨터를 사용하여 자동적으로 인식하는 기술이다. 최근에는 다양한 장치에서 음성 인식 기술을 이용하고 있는데 그 대표적인 장치가 디스플레이 장치이다.
최근에는 음성 인식 기술을 이용하여 TV 채널을 검색하는데 이용하고 있다. 구체적으로, 최근에 TV 제품이 발전하고 방송 컨텐츠들이 다양해 지면서 공중파뿐만 아닌 케이블 채널 등 수많은 방송이 늘어나고 있다. 각국의 여러 사업자별로 EPG Meta Data를 가지고 있는데, 이러한 Meta Data와 실제 TV를 통해 방송되는 프로그램들이 같지 않은 경우가 종종 있다.
이러한 문제를 해결하기 위해 채널 필터링을 이용하는데, 종래에는 매핑된 결과를 서버에서 클라이언트로 보낸 후 디스플레이 장치 측에서 채널 필터링을 수행하였다. 그러나 이와 같은 방식의 경우, 클라이언트와 서버 간의 주도 받는 데이터 양이 많아 속도가 낮을 뿐만 아니라, 기존 클라이언트에서 필터링 할 때는 보내는 데이터의 한계가 있었기 때문에, 만약 검색 결과가 1000개가 나왔다면 서버에서 그 중 일부만 클라이언트로 전송한 후, 클라이언트 단에서 다시 필터링을 했기 때문에 결과적으로 사용자에게 보여지는 채널의 수가 적다는 문제점이 있었다.
따라서, 본 발명은 상술한 문제점을 해결하기 위하여, 사용자의 발화 음성에 대응하는 채널 정보를 대화형 서버 측에서 필터링하여 제공할 수 있는 디스플레이 장치, 대화형 서버 및 응답 정보 제공 방법을 제공하는 데 있다.
이상과 같은 목적을 달성하기 위한 본 발명의 일 실시 예에 따른 디스플레이 장치는, 컨텐츠를 표시하는 디스플레이부, 사용자 발화 음성을 수집하는 음성 수집부, 상기 수집된 발화 음성과 상기 디스플레이 장치의 필터링 정보를 상기 대화형 서버에 제공하는 통신 인터페이스부, 및, 상기 발화 음성 및 필터링 정보에 대응되는 응답 정보가 상기 대화형 서버로부터 수신되면, 상기 응답 정보가 표시되도록 상기 디스플레이부를 제어하는 제어부를 포함한다.
이 경우, 상기 음성 수집부는, 상기 수집된 발화 음성 신호를 텍스트 정보로 변환할 수 있다.
한편, 상기 필터링 정보는, 상기 디스플레이 장치의 국가 코드, 언어 코드, 장치 모델명, 펌웨어 버전, 디바이스의 현재 시각, 해드엔드(headend) 아이디, 장치 종류, 대화 아이디, 제공하는 채널 정보 중 적어도 하나를 포함할 수 있다.
한편, 상기 통신 인터페이스부는, 상기 발화 음성과 상기 필터링 정보를 암호화하여 상기 대화형 서버에 제공할 수 있다.
한편, 상기 응답 정보는, 상기 디스플레이 장치에 제공 가능한 채널에 대한 정보만을 포함할 수 있다.
한편, 상기 디스플레이부는, 상기 응답 정보에 대응되는 채널 정보를 리스트 형태로 표시할 수 있다.
이 경우, 상기 제어부는, 상기 표시된 채널 정보 중 하나가 선택되면, 상기 선택된 채널 정보에 대응되는 채널이 표시되도록 상기 디스플레이부를 제어할 수 있다.
한편, 본 발명의 일 실시 예에 따른 대화형 서버는, 디스플레이 장치로부터 사용자 발화 음성에 대응되는 정보 및 필터링 정보를 수신하는 통신 인터페이스부, 상기 수신된 사용자 발화 음성에 대응되는 정보에서 검색 키워드를 추출하는 추출부, 기저장된 매핑 정보 및 상기 추출된 키워드를 기초로 채널을 검색하는 검색부, 상기 검색된 채널을 상기 수신된 필터링 정보에 기초하여 필터링하는 필터링부, 및, 상기 필터링된 결과가 상기 디스플레이 장치에 전송되도록 상기 통신 인터페이스부를 제어하는 제어부를 포함한다.
이 경우, 상기 사용자 발화 음성에 대응되는 정보는 텍스트 정보이며, 상기 추출부는, 상기 텍스트 정보에서 개체 정보를 키워드로 추출할 수 있다.
한편, 상기 필터링부는, 상기 수신된 필터링 정보를 이용하여, 상기 검색된 채널 중 상기 디스플레이 장치에서 시청 불가능한 채널을 필터링할 수 있다.
한편, 본 발명의 일 실시 예에 따른 대화형 서버와 연결된 디스플레이 장치의 응답 정보 제공 방법은, 사용자 발화 음성을 수집하는 단계, 상기 수집된 발화 음성과 상기 디스플레이 장치의 필터링 정보를 상기 대화형 서버에 제공하는 단계, 상기 발화 음성 및 필터링 정보에 대응되는 응답 정보를 수신하는 단계, 및, 상기 수신된 응답 정보를 표시하는 단계를 포함한다.
이 경우, 상기 수집하는 단계는, 상기 수집된 발화 음성 신호를 텍스트 정보로 변환할 수 있다.
한편, 상기 필터링 정보는, 상기 디스플레이 장치의 국가 코드, 언어 코드, 장치 모델명, 펌웨어 버전, 디바이스의 현재 시각, 해드엔드(headend) 아이디, 장치 종류, 대화 아이디, 제공하는 채널 정보 중 적어도 하나를 포함할 수 있다.
한편, 상기 제공하는 단계는, 상기 발화 음성과 상기 필터링 정보를 암호화하여 상기 대화형 서버에 제공할 수 있다.
한편, 상기 응답 정보는, 상기 디스플레이 장치에 제공 가능한 채널에 대한 정보만을 포함할 수 있다.
한편, 상기 표시하는 단계는, 상기 응답 정보에 대응되는 채널 정보를 리스트 형태로 표시할 수 있다.
이 경우, 본 응답 정보 제공 방법은, 상기 표시된 채널 정보 중 하나가 선택되는 단계, 및, 상기 선택된 채널 정보에 대응되는 채널을 표시하는 단계를 더 포함할 수 있다.
한편, 본 발명의 일 실시 예에 따른 디스플레이 장치와 연결된 대화형 서버의 응답 정보 제공 방법은, 디스플레이 장치로부터 사용자 발화 음성에 대응되는 정보 및 필터링 정보를 수신하는 단계, 상기 수신된 사용자 발화 음성에 대응되는 정보에서 검색 키워드를 추출하는 단계, 기저장된 매핑 정보 및 상기 추출된 키워드를 기초로 채널을 검색하는 단계, 상기 검색된 채널을 상기 수신된 필터링 정보에 기초하여 필터링하는 단계, 및, 상기 필터링된 결과가 상기 디스플레이 장치에 전송하는 단계를 포함한다.
이 경우, 상기 사용자 발화 음성에 대응되는 정보는 텍스트 정보이며, 상기 추출하는 단계는, 상기 텍스트 정보에서 개체 정보를 키워드로 추출할 수 있다.
한편, 상기 필터링하는 단계는, 상기 수신된 필터링 정보를 이용하여, 상기 검색된 채널 중 상기 디스플레이 장치에서 시청 불가능한 채널을 필터링할 수 있다.
도 1은 본 발명의 일 실시 예에 따른 대화형 시스템의 구성을 도시한 블록도,
도 2는 본 발명의 일 실시 예에 따른 사용자 발화 음성에 적합한 응답 정보를 제공하는 동작을 설명하기 위한 도면,
도 3은 도 1의 디스플레이 장치의 구체적인 구성을 도시한 도면,
도 4는 도 1의 대화형 서버의 구체적인 구성을 도시한 도면,
도 5는 전송 패킷의 예를 도시한 도면,
도 6은 기저장된 채널 맵의 간략한 포맷 예를 도시한 도면,
도 7은 채널 맵의 예를 도시한 도면,
도 8 내지 도 10은 도 1의 디스플레이 장치에서 표시할 수 있는 사용자 인터페이스 창의 예를 도시한 도면,
도 11은 응답 패킷의 예를 도시한 도면,
도 12는 본 발명의 일 실시 예에 따른 디스플레이 장치에서의 응답 정보 제공 방법을 설명하기 위한 흐름도, 그리고,
도 13은 본 발명의 일 실시 예에 따른 대화형 서버에서의 응답 정보 제공 방법을 설명하기 위한 흐름도이다.
이하 첨부된 도면들을 참조하여 본 발명에 대하여 보다 상세하게 설명한다.
도 1은 본 발명의 일 실시 예에 따른 대화형 시스템의 구성을 도시한 블록도이다.
도 1을 참조하면, 대화형 시스템(1000)은 디스플레이 장치(100) 및 대화형 서버(200)로 구성된다.
디스플레이 장치(100)는 사용자의 발화 음성이 입력되면, 입력된 사용자의 발화 음성에 대응되는 동작을 수행한다. 구체적으로, 디스플레이 장치(100)는 사용자로부터 발화 음성이 입력되면, 입력된 발화 음성 및 필터링 정보를 대화형 서버(200)로 전송한다. 이후에 디스플레이 장치(100)는 제공된 정보에 대응되는 응답 정보를 수신하고, 수신된 응답 정보를 표시할 수 있다. 이와 같은 디스플레이 장치(100)의 구체적인 구성 및 동작에 대해서는 도 3을 참조하여 후술한다.
대화형 서버(200)는 디스플레이 장치(100)로부터 사용자 발화 음성에 대응되는 정보 및 필터링 정보를 수신하고, 수신된 정보에 기초하여 응답 정보를 생성하여 디스플레이 장치(100)로 전송한다. 구체적으로, 대화형 서버(200)는 디스플레이 장치에서 제공되는 음성 정보를 기초로 검색 키워드를 추출하고, 추출된 검색 키워드와 기저장된 매핑 정보를 기초로 채널을 검색하고, 검색된 채널을 디스플레이 장치에서 시청 가능한 채널들만으로 필터링하고, 필터링 결과를 응답 정보로서 디스플레이 장치(100)로 전송할 수 있다. 이와 같은 대화형 서버(200)의 구체적인 구성 및 동작에 대해서는 도 4를 참조하여 후술한다.
한편, 도 1을 설명함에 있어서, 디스플레이 장치가 하나의 대화형 서버에 연결되는 것으로 설명하였지만, 구현시에 대화형 서버는 복수의 서버로 구성될 수 있다. 또한, 도시된 예에서는 대화형 서버가 하나의 디스플레이 장치와 연결되는 것으로 설명하였지만, 구현시에 대화형 서버는 복수의 디스플레이 장치와 연결될 수도 있다.
또한, 도 1을 설명함에 있어서, 사용자 발화 음성에 대응하여, 발화 음성에 대한 정보를 대화형 서버에서 처리하고, 그 처리 결과를 디스플레이 장치(100)에서 수신하여 사용자 발화 음성에 대응되는 서비스를 수행하는 것으로 설명하였지만, 간단한 발화 음성에 대해서는 디스플레이 장치(100) 자체적으로 동작할 수 있다. 예를 들어, 사용자의 발화 음성이 "볼륨 올려"와 같은 볼륨 조정 명령이면, 디스플레이 장치(100)는 "볼륨 올려"라는 발화 음성에 대응되는 제어 정보가 기저장되어 있는지 여부를 판단한다. 판단 결과, 수신된 발화 음성에 대응되는 제어 정보가 기저장되어 있으면, 디스플레이 장치(100)는 기저장된 제어 정보에 기초하여 볼륨을 조정할 수 있다.
도 2는 본 발명의 일 실시 예에 따른 사용자 발화 음성에 적합한 응답 정보를 제공하는 동작을 설명하기 위한 도면이다.
도 2를 참조하면, 디스플레이 장치(100)는 마이크(미도시)를 통해 입력된 사용자의 발화 음성을 수집하며, 수집된 사용자의 발화 음성에 대한 신호 처리를 수행한다(a). 구체적으로, 디스플레이 장치(100)는 아날로그 형태의 사용자 음성이 입력되면, 입력된 발화 음성을 샘플링하여 디지털 신호로 변환한다. 이때, 디스플레이 장치(100)는 디지털 신호로 변환된 발화 음성에 노이즈가 있는지 여부를 판단하여, 노이즈가 있는 경우, 변환된 디지털 신호로부터 노이즈를 제거하는 것이 바람직하다.
그리고 사용자의 발화 음성이 디지털 신호로 신호 처리되면, 디스플레이 자치(100)는 디지털 신호로 신호 처리된 사용자의 발화 음성 및 필터링 정보를 대화형 서버(200)로 전송한다. 여기서 필터링 정보란 디스플레이 장치(100)에서 제공할 수 있는 채널 정보를 대화형 서버에 알 수 있도록 하는 정보로, 디스플레이 장치(100)에서 제공할 수 있는 채널들의 리스트 자체 일 수 있으며, 상기 리스트를 알 수 있도록 하는 디스플레이 장치의 국가 코드, 언어 코드, 장치 모델명, 펌웨어 버전, 디바이스의 현재 시각, 해드엔드(headend) 아이디, 장치 종류, 대화 아이디 등을 포함하는 정보일 수 있다.
여기서, 해드엔드는, 마스터 안테나(master antenna)로 수신한 전파나 CATV 자체에서 제작한 자주프로그램 등의 신호를 간선 케이블로 송출하는 장치를 등을 의미한다.
이때, 디스플레이 장치(100)는 발화 음성과 필터링 정보를 HTTPS를 사용하여 암호화하여 전송할 수 있다. 예를 들어, 'https://XXX.XXX.XXX.XXX/서버제어 명령어&국가정보&사업자정보&디바이스고유정보&사용자발화&TV채널정보' 일 수 있다.
한편, 본 실시 예에서는 디스플레이 장치(100)가 음성 신호 자체를 대화형 서버(200)에 전송하는 것으로 설명하였지만, 구현시에 디스플레이 장치(100)는 사용자 발화 음성을 텍스트 정보로 변환하고, 변환된 텍스트 정보를 발화 음성에 대한 정보로 대화형 서버에 제공할 수도 있다.
대화형 서버(200)는 수신된 사용자 발화 음성에 대응되는 정보에서 검색 키워드를 추출한다(b). 구체적으로, 대화형 서버(200)는 제공된 정보가 발화 음성 자체이며, 텍스트 정보로 변환하고, 제공된 정보가 텍스트 정보에서 개체 정보를 키워드로 추출할 수 있다.
여기서, 발화 요소는 사용자의 발화 음성을 형태소 단위로 분류된 것으로서, 화행(speech act)에 대한 발화 요소, 주행(main action)에 대한 발화 요소 및 구성 요소(component slot)(이하 개체 정보라 함)를 나타내는 발화 요소를 포함할 수 있다. 여기서, 화행은 문장의 형태와 관련된 분류 기준으로, 해당 문장이 서술문(Statement), 요청문(Request) 또는 의문문(Qiestion)인지를 나타낸다.
그리고 주행은 해당 발화가 특정 도메인에서 대화를 통해 원하는 행위는 나타내는 의미적 정보이다. 예를 들어, 방송 서비스 도메인에서 주행은 프로그램 찾기, 프로그램 시간 찾기, 프로그램 예약 등이 될 수 있다. 그리고 개체 정보는 사용자의 발화에 나타나는 특정 도메인에서 의도하는 행동의 의미를 구체화하기 위한 정보이다. 즉, 개체 정보는 실행 대상을 나타내는 발화 요소로써, 예를 들어, 방송 서비스 도메인에서 개체 정보는 장르, 프로그램명, 방송 시간, 채널 명, 배우, 영화 장르 등을 포함할 수 있다.
그리고 대화형 서버(200)는 기저장된 매핑 정보 및 추출된 키워드를 기초로 채널을 검색한다(c). 구체적으로, 통신시 전달된 TV 채널 정보(채널 맵)를 이용하여 비교분석할 수 있다. 이때, 한국/미국 ATSC 방식은 채널 맵 정보의 major, minor, PTC 항목을 이용하고, 유럽의 DVB 방식은 ONID, TSID, SID 항목을 이용한다. 기저장된 채널 맵의 간략한 포맷은 도 6과 같다.
그리고 대화형 서버(200)는 검색된 채널을 수신된 필터링 정보에 기초하여 필터링한다(d). 구체적으로, 대화형 서버(200)는 제공된 필터링 정보에 기초하여 검색된 채널 중 디스플레이 장치(100)에서 시청 불가능한 채널을 필터링할 수 있다.
그리고 대화형 서버(200)는 필터링된 채널을 응답 정보로 디스플레이 장치(100)에 전송한다. 구체적으로, 대화형 서버(200)는 발화 음성에 대한 정보를 수신받는 것과 동일하게 응답 정보를 Https를 사용하여 암호화를 진행하며, 도 11에 도시된 바와 같은 포맷으로 응답 정보를 전송할 수 있다.
이러한 응답 정보를 수신한 디스플레이 장치(100)는 수신한 응답 정보를 표시한다(e). 구체적으로, 디스플레이 장치(100)는 도 10과 같은 응답 정보를 포함하는 사용자 인터페이스 창을 표시할 수 있다.
이상과 같이 본 실시 예에 따른 대화형 시스템은 채널에 대한 필터링을 디스플레이 장치가 아닌 대화형 서버에서 수행할 수 있는바, 발화 음성에 부합하는 결과가 응답 정보의 크기 제한에 의하여 축소되는 것을 방지할 수 있다. 그에 따라, 대화형 서버에서 디스플레이 장치로 전달되는 데이터 정보의 크기를 줄일 수 있다.
도 3은 도 1의 디스플레이 장치의 구체적인 구성을 도시한 도면이다.
도 3에 도시된 바와 같이, 디스플레이 장치(100)는 통신 인터페이스부(110), 디스플레이부(120), 저장부(130), 음성 수집부(140) 및 제어부(150)로 구성될 수 있다. 이와 같은 디스플레이 장치(100)는 인터넷이 가능한 장치로써, 스마트 TV, 스마트폰과 같은 휴대폰, 데스크탑 PC, 노트북, 네비게이션, 셋탑박스 등과 같은 다양한 전자 장치로 구현될 수 있다.
통신 인터페이스부(110)는 디스플레이 장치(100)를 외부 장치(미도시)에 연결하기 위해 형성되고, 근거리 통신망(LAN: Local Area Network) 및 인터넷망을 통해 외부 장치에 접속되는 형태뿐만 아니라, 무선 통신(예를 들어, 블루투스, GSM, UMTS, LTE, WiBRO 등의 무선 통신) 방식에 의해서 접속될 수 있다.
그리고 통신 인터페이스부(110)는 영상 신호를 입력받는다. 구체적으로, 통신 인터페이스부(110)는 외부 영상 제공 장치(예를 들어, 셋탑박스 등) 또는 안테나로부터 영상 신호를 입력받을 수 있다. 여기서 영상 신호는 방송국 또는 위성으로부터 유선 또는 무선으로 전달되는 방송 신호일 수 있으며, DVD 플레이어, 블루 레이 플레이어 등으로부터 HDMI 케이블, AV 단자 등을 통하여 전달되는 영상 컨텐츠일 수 있으며, 휴대폰, 컴퓨터 등으로부터 USB 단자 등을 통하여 전달되는 영상 컨텐츠일 수도 있다.
통신 인터페이스부(110)는 사용자의 발화 음성에 적합한 응답 정보를 제공하는 대화형 서버(200)와 통신을 수행한다. 구체적으로, 통신 인터페이스부(110)는 다양한 통신 방식에 따라 대화형 서버(200)와 통신을 수행하여, 사용자의 발화 음성에 대응되는 정보 및 필터링 정보를 대화형 서버(200)로 전송할 수 있다. 구현시에 통신 인터페이스부(110)는 디지털 음성 처리된 음성 자체를 대화형 서버에 전송할 수 있으며, 텍스트로 변환된 음성 정보를 전송할 수 있다. 그리고 통신 인터페이스부(110)는 상술한 정보를 전송할 때, 암호화하여 전송할 수 있다. 예를 들어, 도 5에 도시된 바와 같이 Json 형태로 발화 음성에 대한 정보 및 필터링 정보를 전송할 수 있다. 여기서 Json(JavaScript Object Notation)은 인터넷에서 자료를 주고받을 때 그 자료를 표현하는 방법이다.
그리고 통신 인터페이스부(110)는 응답 정보를 수신한다. 구체적으로, 통신 인터페이스부(110)는 상술한 정보의 제공에 대응한 응답 정보를 대화형 서버(200)로부터 수신할 수 있다. 이때 수신되는 정보 역시 암호화된 정보일 수 있으며, 도 11에 도시된 바와 같은 포맷을 가질 수 있다.
디스플레이부(120)는 디스플레이 장치(100)에서 제공되는 정보를 표시할 수 있다. 디스플레이부(120)는 터치스크린 등과 같이 입력과 출력이 동시에 구현되는 장치로 구현될 수도 있고, LCD, PDP, CRT 등과 같은 영상 표시장치일 수 있다. 여기서, 디스플레이부(120)는 터치패드와 함께 상호 레이어 구조를 이루는 터치 스크린 형태로 구현될 수 있으며, 터치 스크린은 터치 입력 위치, 면적, 터치 입력의 압력까지도 검출하도록 구성될 수 있다.
그리고 디스플레이부(120)는 사용자의 발화 음성에 대응되는 응답 메시지가 텍스트 또는 이미지 형태로 디스플레이할 수 있다. 구체적으로, 디스플레이부(120)는 대화형 서버(200)에서 제공된 응답 정보를 도 10과 같은 응답 정보를 포함하는 사용자 인터페이스 창으로 표시할 수 있다.
그리고 디스플레이부(120)는 사용자 채널 선택에 대응되는 채널을 표시할 수 있다.
저장부(130)는 디스플레이 장치(100)에서 지원하는 각종 서비스에 대응되는 콘텐츠를 저장할 수 있다. 그리고 저장부(130)는 후술할 음성 수집부(140)에서 수집된 음성 컨텐츠를 저장할 수 있으며, 음성 콘텐츠에서 생성된 텍스트 정보를 저장할 수도 있다. 이러한 정보는 대화형 서버(200)에 바로 제공될 것인바, 메모리와 같은 장치에 임시 저장될 수 있다.
그리고 저장부(130)는 디스플레이 장치(100)의 구동을 위한 프로그램을 저장한다. 구체적으로, 저장부(130)는 디스플레이 장치(100)의 구동시 필요한 각종 명령어의 집합인 프로그램을 저장할 수 있다. 여기서 프로그램은 특정의 서비스를 제공하기 위한 어플리케이션뿐만 아니라 어플리케이션을 구동시키기 위한 운영프로그램을 포함한다.
이와 같은 저장부(130)는 디스플레이 장치(100) 내의 저장매체 및 외부 저장매체, 예를 들어, USB 메모리를 포함한 Removable Disk, 별도의 호스트(Host)에 연결된 저장매체, 네트워크를 통한 웹 서버(Web server) 등으로 구현될 수 있다.
음성 수집부(140)는 마이크(미도시)를 통해 입력된 사용자의 발화 음성을 수집하며, 수집된 사용자의 발화 음성에 대한 신호 처리를 수행한다. 구체적으로, 음성 수집부(140)는 아날로그 형태의 사용자 음성이 입력되면, 입력된 발화 음성을 샘플링하여 디지털 신호로 변환한다. 이때, 음성 수집부(140)는 디지털 신호로 변환된 발화 음성에 노이즈가 있는지 여부를 판단하여, 노이즈가 있는 경우, 변환된 디지털 신호로부터 노이즈를 제거하는 것이 바람직하다.
그리고 음성 수집부(140)는 수집된 발화 음성 신호를 텍스트 정보로 변환할 수 있다. 구체적으로, 음성 수집부(140)는 STT(Speech to Text) 알고리즘을 이용하여 수집된 사용자의 발화 음성을 텍스트 정보로 변환할 수 있다.
제어부(150)는 디스플레이 장치(100) 내의 각 구성을 제어한다. 구체적으로, 음성 수집부(140)를 통하여 사용자 발화가 수집되면, 수집된 발화에 대응되는 응답 정보가 수신되도록 사용자 발화에 대응되는 정보 및 필터링 정보가 대화형 서버(200)에 전송되도록 통신 인터페이스부(110)를 제어할 수 있다. 그리고 상술한 정보의 전송에 대응하여 응답 정보가 수신되면, 제어부(150)는 수신된 응답 정보가 추가적인 필터링 동작 없이 바로 표시되도록 디스플레이부(120)를 제어할 수 있다.
이상과 같이 본 실시 예에 따른 디스플레이 장치(100)는 디스플레이 장치(100)에서 별도의 필터링 동작 없이 수신된 응답 정보를 표시하는바, 신속하게 사용자 발화 음성에 대응되는 결과를 표시할 수 있게 된다. 그리고 디스플레이 장치(100)는 발화 음성에 부합하는 결과가 응답 정보의 크기 제한에 의하여 축소되지 않고 표시할 수 있다.
도 4는 도 1의 대화형 서버의 구체적인 구성을 도시한 도면이다.
도 4를 참조하면, 본 실시 예에 따른 대화형 서버(200)는 통신 인터페이스부(210), 사용자 인터페이스부(220), 저장부(230), 추출부(240), 검색부(250), 필터링부(260) 및 제어부(270)로 구성된다.
통신 인터페이스부(210)는 대화형 서버(200)를 외부 장치(미도시)에 연결하기 위해 형성되고, 근거리 통신망(LAN: Local Area Network) 및 인터넷망을 통해 외부 장치에 접속되는 형태뿐만 아니라, 무선 통신(예를 들어, 블루투스, GSM, UMTS, LTE, WiBRO 등의 무선 통신) 방식에 의해서 접속될 수 있다.
통신 인터페이스부(210)는 다양한 통신 방식에 따라 디스플레이 장치(100)와 통신을 수행하여, 디스플레이 장치(100)로부터 사용자의 발화 음성에 대응되는 정보 및 필터링 정보를 수신할 수 있다. 이때, 수신된 발화 음성에 대응되는 정보는 음성 컨텐츠 자체일 수 있으며, 디지털 신호 처리된 음성 컨텐츠일 수 있으며, 텍스트로 변환된 정보일 수도 있다.
그리고 통신 인터페이스부(210)는 후술할 필터링부(260)의 필터링 결과에 따른 응답 정보를 전송한다. 구체적으로, 통신 인터페이스부(210)는 상술한 정보의 제공에 대응한 응답 정보를 도 11에 도시된 바와 같은 포맷으로 디스플레이 장치(100)에 송신할 수 있다. 이때, 통신 인터페이스부(210)는 전송하는 응답 정보를 암호화하여 전송할 수 있다.
사용자 인터페이스부(220)는 대화형 서버(200)에서 지원하는 각종 기능을 사용자가 설정 또는 선택할 수 있는 다수의 기능키를 구비하며, 대화형 서버(200)에서 제공하는 각종 정보를 표시할 수 있다. 사용자 인터페이스부(220)는 터치 스크린과 같이 입력과 출력이 동시에 구현되는 장치로 구현될 수 있으며, 입력이 수행되는 키보드와 같은 입력장치와 출력이 수행된 디스플레이 장치의 결합으로 구현될 수도 있다.
저장부(230)는 통신 인터페이스부(110)를 통하여 전달되는 정보를 저장할 수 있으며, 매핑 정보를 저장할 수 있다. 그리고 저장부(230)는 후술할 검색부(250) 및 필터링부(260)의 검색결과 및 필터링 결과를 저장할 수 있다.
여기서 매핑 정보는 방송 정보에 대응되는 키워드 또는 키워드에 대응되는 방송 정보이다.
이와 같은 저장부(230)는 대화형 서버(200) 내의 저장매체 및 외부 저장매체, 예를 들어, USB 메모리를 포함한 Removable Disk, 별도의 호스트(Host)에 연결된 저장매체, 네트워크를 통한 웹 서버(Web server) 등으로 구현될 수 있다.
추출부(240)는 수신된 사용자 발화 음성에 대응되는 정보에서 검색 키워드를 추출한다(b). 구체적으로, 추출부(240)는 제공된 정보가 발화 음성 자체이며, 텍스트 정보로 변환하고, 제공된 정보가 텍스트 정보에서 개체 정보를 키워드로 추출할 수 있다.
여기서, 발화 요소는 사용자의 발화 음성을 형태소 단위로 분류된 것으로서, 화행(dialogue ation)에 대한 발화 요소, 주행(main action)에 대한 발화 요소 및 구성 요소(component slot)(이하 개체 정보라 함)를 나타내는 발화 요소를 포함할 수 있다. 여기서, 화행은 문장의 형태와 관련된 분류 기준으로, 해당 문장이 서술문(Statement), 요청문(Request) 또는 의문문(Qiestion)인지를 나타낸다. 그리고 주행은 해당 발화가 특정 도메인에서 대화를 통해 원하는 행위는 나타내는 의미적 정보이다. 예를 들어, 방송 서비스 도메인에서 주행은 프로그램 찾기, 프로그램 시간 찾기, 프로그램 예약 등이 될 수 있다. 그리고 개체 정보는 사용자의 발화에 나타나는 특정 도메인에서 의도하는 행동의 의미를 구체화하기 위한 정보이다. 즉, 개체 정보는 실행 대상을 나타내는 발화 요소로써, 예를 들어, 방송 서비스 도메인에서 개체 정보는 장르, 프로그램명, 방송 시간, 채널 명, 배우, 영화 장르 등을 포함할 수 있다.
예를 들어, "○○○(프로그램명) 보여줘!"라는 특정 프로그램에 대한 시청을 요청하는 발화 음성(또는 텍스트)이 제공된 경우, 추출부(240)는 "○○○(프로그램명)"을 키워드로 추출할 수 있다.
그리고 검색부(250)는 기저장된 매핑 정보 및 추출된 키워드를 기초로 채널을 검색한다. 구체적으로, 통신시 전달된 TV 채널 정보(채널 맵)를 이용하여 비교분석할 수 있다. 이때, 한국/미국 ATSC 방식은 채널 맵 정보의 major, minor, PTC 항목을 이용하고, 유럽의 DVB 방식은 ONID, TSID, SID 항목을 이용한다. 기저장된 채널 맵의 간략한 포맷은 도 6과 같다.
예를 들어, "○○○(프로그램명) 보여줘!"라는 특정 프로그램에 대한 시청을 요청하는 발화 음성(또는 텍스트)이 제공된 경우, 검색부(250)는 EPG 메타 데이터에서 "○○○"을 갖는 채널을 검색할 수 있다.
그리고 필터링부(260)는 검색된 채널을 수신된 필터링 정보에 기초하여 필터링한다. 구체적으로, 필터링부(260)는 제공된 필터링 정보에 기초하여 검색된 채널 중 디스플레이 장치(100)에서 시청 불가능한 채널을 필터링할 수 있다.
제어부(270)는 대화형 서버(200)의 각 구성을 제어한다. 구체적으로, 통신 인터페이스부(210)를 통하여 발화 음성에 대한 정보 및 필터링 정보가 수신되면, 수신된 발화 음성에 대한 정보에 대응되는 채널들이 추출되도록 추출부(240) 및 검색부(250)를 제어하고, 검색 결과에 대한 필터링이 수행되도록 필터링부(260)를 제어할 수 있다. 그리고 제어부(270)는 필터링된 결과가 응답 정보로 디스플레이 장치(100)에 제공되도록 통신 인터페이스부(210)를 제어할 수 있다.
이상과 같이 본 실시 예에 따른 대화형 서버(200)는 제공된 필터링 정보에 기초하여 대화형 서버(200)가 검색된 채널에 대한 필터링을 수행하는바, 불필요한 정보(예를 들어, 검색어에 대응되는 채널이지만, 디스플레이 장치(100)에서 볼 수 없는 채널)를 디스플레이 장치(100)에 제공하지 않게 된다. 이에 따라 디스플레이 장치(100)에 제공되는 응답 정보의 크기를 줄일 수 있게 된다.
도 8 내지 도 10은 도 1의 디스플레이 장치에서 표시할 수 있는 사용자 인터페이스 창의 예를 도시한 도면이다. 구체적으로, 도 8은 채널 필터링이 수행되지 않은 경우에 표시될 수 있는 응답 정보의 예이고, 도 9는 채널 필터링이 디스플레이 장치에서 수행되는 경우에 표시될 수 있는 응답 정보의 예이고, 도 10은 채널 필터링이 대화형 서버에서 수행되는 경우에 표시될 수 있는 응답 정보의 예이다. 3가지 경우 모두 7개의 채널(6, 7, 8, 9, 10, 11, 12)이 검색되고, 그 중 하나의 채널(6)은 디스플레이 장치에서 표시할 수 없는 채널이고, 대화형 서버가 디스플레이 장치에 제공할 수 있는 채널 정보는 6개임을 가정한다.
도 8을 참조하면, 채널 필터링이 수행되지 않기 때문에, 대화형 서버는 검색된 7개의 채널(6, 7, 8, 9, 10, 11, 12) 중 임의의 순서로 6개의 채널(6, 7, 8, 9, 10, 11)을 응답 정보로 제공하고, 디스플레이 장치는 제공된 6개의 채널을 사용자에게 표시한다. 디스플레이 장치에서 제공하지 않은 채널을 포함하여 표시하고, 사용자가 해당 채널(6)을 선택한다면, 해당 채널(6)은 표시할 수 없는 채널인바, 디스플레이 장치에서는 에러가 발생하게 된다.
도 9를 참조하면, 디스플레이 장치에서 채널 필터링이 수행되기 때문에, 대화형 서버의 동작은 앞선 도 8과 동일하다. 따라서, 대화형 서버는 검색된 7개(6, 7, 8, 9, 10, 11, 12) 의 채널 중 임의의 순서로 6개(6, 7, 8, 9, 10, 11)의 채널을 응답 정보로 제공한다. 그리고 디스플레이 장치는 제공된 6개의 채널(6, 7, 8, 9, 10, 11) 중 디스플레이 장치가 제공할 수 없는 채널(6)을 필터링하고, 그 결과인 5개의 채널(7, 8, 9, 10, 11)을 사용자에게 표시한다.
도 10을 참조하면, 먼저, 대화형 서버는 검색된 7개(6, 7, 8, 9, 10, 11, 12 의 채널 중 디스플레이 장치가 제공할 수 없는 채널(6)을 필터링하고, 남은 채널(7, 8, 9, 10, 11, 12)을 응답 정보로 디스플레이 장치에 제공한다. 그리고 디스플레이 장치는 제공된 응답 정보에 따른 채널을 표시한다. 이와 같이 채널 필터링이 대화형 서버에 수행되면, 사용자에게 제공할 수 있는 채널 정보가 증가한다.
12는 본 발명의 일 실시 예에 따른 디스플레이 장치에서의 응답 정보 제공 방법을 설명하기 위한 흐름도이다.
도 12를 참조하면, 먼저, 사용자 발화 음성을 수집한다(S1210). 구체적으로, 마이크(미도시)를 통해 입력된 사용자의 발화 음성을 수집하며, 수집된 사용자의 발화 음성에 대한 신호 처리를 수행한다. 이때, 신호 처리는 음성 신호를 텍스트 신호로 변환하는 것을 포함할 수 있다.
그리고 수집된 발화 음성과 디스플레이 장치의 필터링 정보를 대화형 서버에 제공한다(S1220). 구체적으로, 수집된 발화 음성과 필터링 정보를 암호화하여 대화형 서버에 제공할 수 있다.
그리고 발화 음성 및 필터링 정보에 대응되는 응답 정보를 수신한다(S1230). 이때, 수신되는 응답 정보는 디스플레이 장치에서 제공 가능한 채널에 대한 정보만을 포함한다.
수신된 응답 정보를 표시한다(S1240). 구체적으로, 수신된 응답 정보에 대응되는 채널 정보를 리스트 형태로 표시할 수 있다. 표시된 채널 중 하나를 선택받으면, 선택된 채널에 대응되는 영상을 표시할 수 있다.
이상과 같은 본 실시 예에 따른 디스플레이 장치의 응답 정보 제공 방법은, 디스플레이 장치(100)에서 별도의 필터링 동작 없이 수신된 응답 정보를 표시하는바, 신속하게 사용자 발화 음성에 대응되는 결과를 표시할 수 있게 된다. 그리고 디스플레이 장치(100)는 발화 음성에 부합하는 결과가 응답 정보의 크기 제한에 의하여 축소되지 않고 표시할 수 있다. 도 12와 같은 응답 정보 제공 방법은, 도 3의 구성을 가지는 디스플레이 장치상에서 실행될 수 있으며, 그 밖의 구성을 가지는 디스플레이 장치상에서도 실행될 수도 있다.
또한, 상술한 바와 같은 응답 정보 제공 방법은 컴퓨터에서 실행될 수 있는 실행가능한 알고리즘을 포함하는 프로그램으로 구현될 수 있고, 상기 프로그램은 비일시적 판독 가능 매체(non-transitory computer readable medium)에 저장되어 제공될 수 있다.
비일시적 판독 가능 매체란 레지스터, 캐쉬, 메모리 등과 같이 짧은 순간 동안 데이터를 저장하는 매체가 아니라 반영구적으로 데이터를 저장하며, 기기에 의해 판독(reading)이 가능한 매체를 의미한다. 구체적으로는, 상술한 다양한 어플리케이션 또는 프로그램들은 CD, DVD, 하드 디스크, 블루레이 디스크, USB, 메모리카드, ROM 등과 같은 비일시적 판독 가능 매체에 저장되어 제공될 수 있다.
도 13은 본 발명의 일 실시 예에 따른 대화형 서버에서의 응답 정보 제공 방법을 설명하기 위한 흐름도이다.
도 13을 참조하면, 먼저, 디스플레이 장치로부터 사용자 발화 음성에 대응되는 정보 및 필터링 정보를 수신한다(S1310). 구체적으로, 암호화된 발화 음성에 대응되는 정보 및 필터링 정보를 수신할 수 있다.
그리고 수신된 사용자 발화 음성에 대응되는 정보에서 검색 키워드를 추출한다(S1320). 구체적으로, 제공된 정보가 발화 음성 자체이면, 우선적으로 수신된 ㅇ음성을 텍스트 정보로 변환하고 변환된 텍스트 정보에서 개체정보를 키워드로 추출할 수 있다. 한편, 제공된 정보가 텍스트 정보인바, 바로 수신된 텍스트 정보에서 개체 정보를 키워드로 추출할 수 있다.
그리고 기저장된 매핑 정보 및 추출된 키워드를 기초로 채널을 검색한다(S1330). 구체적으로, 추출된 키워드로 채널을 검색하는 것을 일반적인 기술인바, 구체적인 설명은 생략한다.
그리고 검색된 채널을 수신된 필터링 정보에 기초하여 필터링한다(S1340). 구체적으로, 수신된 필터링 정보에 기초하여 검색된 채널 중 디스플레이 장치(100)에서 시청 불가능한 채널을 필터링할 수 있다.
그리고 필터링된 결과가 디스플레이 장치에 전송한다(S1350). 구체적으로, 필터링 결과를 도 11과 같은 포맷을 갖는 응답 정보로 생성하고, 생성된 응답 정보를 디스플레이 장치에 송신할 수 있다. 이때, 응답 정보를 암호화하여 디스플레이 장치에 전송할 수 있다.
이상과 같은 본 실시 예에 따른 대화형 서버의 응답 정보 제공 방법은, 제공된 필터링 정보에 기초하여 대화형 서버(200)가 검색된 채널에 대한 필터링을 수행하는바, 불필요한 정보(예를 들어, 검색어에 대응되는 채널이지만, 디스플레이 장치(100)에서 볼 수 없는 채널)를 디스플레이 장치(100)에 제공하지 않게 된다. 도 13과 같은 응답 정보 제공 방법은 도 4의 구성을 가지는 대화형 서버상에서 실행될 수 있으며, 그 밖의 구성을 가지는 대화형 서버상에서도 실행될 수도 있다.
또한, 상술한 바와 같은 응답 정보 제공 방법은 컴퓨터에서 실행될 수 있는 실행가능한 알고리즘을 포함하는 프로그램으로 구현될 수 있고, 상기 프로그램은 비일시적 판독 가능 매체(non-transitory computer readable medium)에 저장되어 제공될 수 있다.
이상에서는 본 발명의 바람직한 실시 예에 대하여 도시하고 설명하였지만, 본 발명은 상술한 특정의 실시 예에 한정되지 아니하며, 청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 기술분야에서 통상의 지식을 가진자에 의해 다양한 변형실시가 가능한 것은 물론이고, 이러한 변형 실시 예들은 본 발명의 기술적 사상이나 전망으로부터 개별적으로 이해되어서는 안 될 것이다.
1000: 대화형 시스템 100: 디스플레이 장치
110: 통신 인터페이스부 120: 디스플레이부
130: 저장부 140: 음성 수집부
150: 제어부 200: 대화형 서버
210: 통신 인터페이스부 220: 사용자 인터페이스부
230: 저장부 240: 추출부
250: 검색부 260: 필터링부
270: 제어부

Claims (20)

  1. 대화형 서버와 연결된 디스플레이 장치에 있어서,
    컨텐츠를 표시하는 디스플레이부;
    사용자 발화 음성을 수집하는 음성 수집부;
    상기 수집된 발화 음성과 상기 디스플레이 장치의 필터링 정보를 상기 대화형 서버에 제공하는 통신 인터페이스부; 및
    상기 발화 음성 및 필터링 정보에 대응되는 응답 정보가 상기 대화형 서버로부터 수신되면, 상기 응답 정보가 표시되도록 상기 디스플레이부를 제어하는 제어부;를 포함하는 디스플레이 장치.
  2. 제1항에 있어서,
    상기 음성 수집부는,
    상기 수집된 발화 음성 신호를 텍스트 정보로 변환하는 것을 특징으로 하는 디스플레이 장치.
  3. 제1항에 있어서,
    상기 필터링 정보는,
    상기 디스플레이 장치의 국가 코드, 언어 코드, 장치 모델명, 펌웨어 버전, 디바이스의 현재 시각, 해드엔드(headend) 아이디, 장치 종류, 대화 아이디, 제공하는 채널 정보 중 적어도 하나를 포함하는 것을 특징으로 하는 디스플레이 장치.
  4. 제1항에 있어서,
    상기 통신 인터페이스부는,
    상기 발화 음성과 상기 필터링 정보를 암호화하여 상기 대화형 서버에 제공하는 것을 특징으로 하는 디스플레이 장치.
  5. 제1항에 있어서,
    상기 응답 정보는,
    상기 디스플레이 장치에 제공 가능한 채널에 대한 정보만을 포함하는 것을 특징으로 하는 디스플레이 장치.
  6. 제1항에 있어서,
    상기 디스플레이부는,
    상기 응답 정보에 대응되는 채널 정보를 리스트 형태로 표시하는 것을 특징으로 하는 디스플레이 장치.
  7. 제6항에 있어서,
    상기 제어부는,
    상기 표시된 채널 정보 중 하나가 선택되면, 상기 선택된 채널 정보에 대응되는 채널이 표시되도록 상기 디스플레이부를 제어하는 것을 특징으로 하는 디스플레이 장치.
  8. 디스플레이 장치와 연결된 대화형 서버에 있어서,
    디스플레이 장치로부터 사용자 발화 음성에 대응되는 정보 및 필터링 정보를 수신하는 통신 인터페이스부;
    상기 수신된 사용자 발화 음성에 대응되는 정보에서 검색 키워드를 추출하는 추출부;
    기저장된 매핑 정보 및 상기 추출된 키워드를 기초로 채널을 검색하는 검색부;
    상기 검색된 채널을 상기 수신된 필터링 정보에 기초하여 필터링하는 필터링부; 및
    상기 필터링된 결과가 상기 디스플레이 장치에 전송되도록 상기 통신 인터페이스부를 제어하는 제어부;를 포함하는 대화형 서버.
  9. 제8항에 있어서,
    상기 사용자 발화 음성에 대응되는 정보는 텍스트 정보이며,
    상기 추출부는,
    상기 텍스트 정보에서 개체 정보를 키워드로 추출하는 것을 특징으로 하는 대화형 서버.
  10. 제8항에 있어서,
    상기 필터링부는,
    상기 수신된 필터링 정보를 이용하여, 상기 검색된 채널 중 상기 디스플레이 장치에서 시청 불가능한 채널을 필터링하는 것을 특징으로 하는 대화형 서버.
  11. 대화형 서버와 연결된 디스플레이 장치의 응답 정보 제공 방법에 있어서,
    사용자 발화 음성을 수집하는 단계;
    상기 수집된 발화 음성과 상기 디스플레이 장치의 필터링 정보를 상기 대화형 서버에 제공하는 단계;
    상기 발화 음성 및 필터링 정보에 대응되는 응답 정보를 수신하는 단계; 및
    상기 수신된 응답 정보를 표시하는 단계;를 포함하는 응답 정보 제공 방법.
  12. 제11항에 있어서,
    상기 수집하는 단계는,
    상기 수집된 발화 음성 신호를 텍스트 정보로 변환하는 것을 특징으로 하는 응답 정보 제공 방법.
  13. 제11항에 있어서,
    상기 필터링 정보는,
    상기 디스플레이 장치의 국가 코드, 언어 코드, 장치 모델명, 펌웨어 버전, 디바이스의 현재 시각, 해드엔드(headend) 아이디, 장치 종류, 대화 아이디, 제공하는 채널 정보 중 적어도 하나를 포함하는 것을 특징으로 하는 응답 정보 제공 방법.
  14. 제11항에 있어서,
    상기 제공하는 단계는,
    상기 발화 음성과 상기 필터링 정보를 암호화하여 상기 대화형 서버에 제공하는 것을 특징으로 하는 응답 정보 제공 방법.
  15. 제11항에 있어서,
    상기 응답 정보는,
    상기 디스플레이 장치에 제공 가능한 채널에 대한 정보만을 포함하는 것을 특징으로 하는 응답 정보 제공 방법.
  16. 제11항에 있어서,
    상기 표시하는 단계는,
    상기 응답 정보에 대응되는 채널 정보를 리스트 형태로 표시하는 것을 특징으로 하는 응답 정보 제공 방법.
  17. 제16항에 있어서,
    상기 표시된 채널 정보 중 하나가 선택되는 단계; 및
    상기 선택된 채널 정보에 대응되는 채널을 표시하는 단계;를 더 포함하는 것을 특징으로 하는 응답 정보 제공 방법.
  18. 디스플레이 장치와 연결된 대화형 서버의 응답 정보 제공 방법에 있어서,
    디스플레이 장치로부터 사용자 발화 음성에 대응되는 정보 및 필터링 정보를 수신하는 단계;
    상기 수신된 사용자 발화 음성에 대응되는 정보에서 검색 키워드를 추출하는 단계;
    기저장된 매핑 정보 및 상기 추출된 키워드를 기초로 채널을 검색하는 단계;
    상기 검색된 채널을 상기 수신된 필터링 정보에 기초하여 필터링하는 단계; 및
    상기 필터링된 결과가 상기 디스플레이 장치에 전송하는 단계;를 포함하는 응답 정보 제공 방법.
  19. 제18항에 있어서,
    상기 사용자 발화 음성에 대응되는 정보는 텍스트 정보이며,
    상기 추출하는 단계는,
    상기 텍스트 정보에서 개체 정보를 키워드로 추출하는 것을 특징으로 하는 응답 정보 제공 방법.
  20. 제18항에 있어서,
    상기 필터링하는 단계는,
    상기 수신된 필터링 정보를 이용하여, 상기 검색된 채널 중 상기 디스플레이 장치에서 시청 불가능한 채널을 필터링하는 것을 특징으로 하는 응답 정보 제공 방법.
KR1020140004623A 2014-01-14 2014-01-14 디스플레이 장치, 대화형 서버 및 응답 정보 제공 방법 KR20150084520A (ko)

Priority Applications (5)

Application Number Priority Date Filing Date Title
KR1020140004623A KR20150084520A (ko) 2014-01-14 2014-01-14 디스플레이 장치, 대화형 서버 및 응답 정보 제공 방법
PCT/KR2014/005693 WO2015108255A1 (en) 2014-01-14 2014-06-26 Display apparatus, interactive server and method for providing response information
US14/337,673 US20150201246A1 (en) 2014-01-14 2014-07-22 Display apparatus, interactive server and method for providing response information
EP14181056.4A EP2894632A1 (en) 2014-01-14 2014-08-14 Display apparatus, interactive server and method for providing response information
CN201410495834.4A CN104780452A (zh) 2014-01-14 2014-09-24 显示设备、交互式服务器和提供响应信息的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020140004623A KR20150084520A (ko) 2014-01-14 2014-01-14 디스플레이 장치, 대화형 서버 및 응답 정보 제공 방법

Publications (1)

Publication Number Publication Date
KR20150084520A true KR20150084520A (ko) 2015-07-22

Family

ID=51429022

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020140004623A KR20150084520A (ko) 2014-01-14 2014-01-14 디스플레이 장치, 대화형 서버 및 응답 정보 제공 방법

Country Status (5)

Country Link
US (1) US20150201246A1 (ko)
EP (1) EP2894632A1 (ko)
KR (1) KR20150084520A (ko)
CN (1) CN104780452A (ko)
WO (1) WO2015108255A1 (ko)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20170087712A (ko) * 2016-01-21 2017-07-31 삼성전자주식회사 디스플레이 장치 및 디스플레이 장치의 제어 방법
WO2021177495A1 (ko) * 2020-03-06 2021-09-10 엘지전자 주식회사 자연어 처리 장치
US11432045B2 (en) 2018-02-19 2022-08-30 Samsung Electronics Co., Ltd. Apparatus and system for providing content based on user utterance

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11043287B2 (en) * 2014-02-19 2021-06-22 Teijin Limited Information processing apparatus and information processing method
CN105208424A (zh) * 2015-09-23 2015-12-30 百度在线网络技术(北京)有限公司 一种基于语音的遥控方法及装置
US10229671B2 (en) * 2015-12-02 2019-03-12 GM Global Technology Operations LLC Prioritized content loading for vehicle automatic speech recognition systems
CN106899859A (zh) * 2015-12-18 2017-06-27 北京奇虎科技有限公司 一种多媒体数据的播放方法和装置
JP6671020B2 (ja) * 2016-06-23 2020-03-25 パナソニックIpマネジメント株式会社 対話行為推定方法、対話行為推定装置及びプログラム
KR102594022B1 (ko) * 2016-11-24 2023-10-26 삼성전자주식회사 전자 장치 및 그의 채널맵 업데이트 방법
KR102614697B1 (ko) * 2016-12-08 2023-12-18 삼성전자주식회사 디스플레이 장치 및 디스플레이 장치의 채널 정보 획득 방법
CN108632262A (zh) * 2018-04-24 2018-10-09 合肥合优智景科技有限公司 基于声音标记的机器人定位系统及方法

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1160962C (zh) * 1999-07-16 2004-08-04 联合视频制品公司 可选择语言的交互式电视节目导视器
US6901366B1 (en) * 1999-08-26 2005-05-31 Matsushita Electric Industrial Co., Ltd. System and method for assessing TV-related information over the internet
US20060075429A1 (en) * 2004-04-30 2006-04-06 Vulcan Inc. Voice control of television-related information
US9318108B2 (en) * 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
KR101502343B1 (ko) * 2007-12-07 2015-03-16 삼성전자주식회사 검색어와 관련된 컨텐츠를 제공하기 위한 멀티미디어제공방법 및 이를 적용한 멀티미디어 기기
CN101540645A (zh) * 2008-03-21 2009-09-23 华为技术有限公司 动态内容分发方法和装置
WO2011094734A2 (en) * 2010-02-01 2011-08-04 Jumptap, Inc. Integrated advertising system
KR20110114997A (ko) * 2010-04-14 2011-10-20 한국전자통신연구원 자동 키워드 검출을 통한 방송서비스 제공장치 및 그 방법
US8407753B2 (en) * 2010-06-10 2013-03-26 Sony Corporation Content list tailoring for capability of IPTV device
US20120030712A1 (en) * 2010-08-02 2012-02-02 At&T Intellectual Property I, L.P. Network-integrated remote control with voice activation
US20120240177A1 (en) * 2011-03-17 2012-09-20 Anthony Rose Content provision
AU2011202182B1 (en) * 2011-05-11 2011-10-13 Frequency Ip Holdings, Llc Creation and presentation of selective digital content feeds
US8607276B2 (en) * 2011-12-02 2013-12-10 At&T Intellectual Property, I, L.P. Systems and methods to select a keyword of a voice search request of an electronic program guide
US8984276B2 (en) * 2012-01-10 2015-03-17 Jpmorgan Chase Bank, N.A. System and method for device registration and authentication
US20130325466A1 (en) * 2012-05-10 2013-12-05 Clickberry, Inc. System and method for controlling interactive video using voice
KR20130140423A (ko) * 2012-06-14 2013-12-24 삼성전자주식회사 디스플레이 장치, 대화형 서버 및 응답 정보 제공 방법
US20150066513A1 (en) * 2013-08-29 2015-03-05 Ciinow, Inc. Mechanism for performing speech-based commands in a system for remote content delivery

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20170087712A (ko) * 2016-01-21 2017-07-31 삼성전자주식회사 디스플레이 장치 및 디스플레이 장치의 제어 방법
US11432045B2 (en) 2018-02-19 2022-08-30 Samsung Electronics Co., Ltd. Apparatus and system for providing content based on user utterance
US11706495B2 (en) 2018-02-19 2023-07-18 Samsung Electronics Co., Ltd. Apparatus and system for providing content based on user utterance
WO2021177495A1 (ko) * 2020-03-06 2021-09-10 엘지전자 주식회사 자연어 처리 장치

Also Published As

Publication number Publication date
CN104780452A (zh) 2015-07-15
EP2894632A1 (en) 2015-07-15
US20150201246A1 (en) 2015-07-16
WO2015108255A1 (en) 2015-07-23

Similar Documents

Publication Publication Date Title
KR20150084520A (ko) 디스플레이 장치, 대화형 서버 및 응답 정보 제공 방법
KR101945920B1 (ko) 비디오 방송에 적용되는 인터랙션 방법 및 장치
US9412368B2 (en) Display apparatus, interactive system, and response information providing method
KR102304052B1 (ko) 디스플레이 장치 및 그의 동작 방법
EP2752763A2 (en) Display apparatus and method of controlling display apparatus
KR102166423B1 (ko) 디스플레이 장치, 서버 장치 및 디스플레이 장치의 이벤트 정보 제공 방법
US9219949B2 (en) Display apparatus, interactive server, and method for providing response information
US10891968B2 (en) Interactive server, control method thereof, and interactive system
EP2752846A1 (en) Dialogue-type interface apparatus and method for controlling the same
EP2919472A1 (en) Display apparatus, method for controlling display apparatus, and interactive system
US8949123B2 (en) Display apparatus and voice conversion method thereof
KR101914708B1 (ko) 서버 및 서버의 제어 방법
KR102499124B1 (ko) 디스플레이 장치 및 디스플레이 장치의 제어 방법
KR102277749B1 (ko) 디스플레이 장치 및 그 제어 방법
US11721321B2 (en) Systems and methods for identifying content corresponding to a language spoken in a household
KR20150107464A (ko) 컨텐츠 처리 장치 및 그 이벤트 제공 방법
EP2685449A1 (en) Method for providing contents information and broadcasting receiving apparatus thereof
US10582271B2 (en) On-demand captioning and translation
KR20120083104A (ko) 멀티미디어 장치의 음성인식을 통한 텍스트 입력 방법 및 그에 따른 멀티미디어 장치
US8863193B2 (en) Information processing apparatus, broadcast receiving apparatus and information processing method
EP4116968A1 (en) Natural language processing device
TWI475876B (zh) 電子裝置、電子系統以及共享資料之方法
KR20120115928A (ko) 디스플레이 장치 및 이의 보이스 변환 방법

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application