KR20140055502A - 방송 수신 장치, 서버 및 그 제어 방법 - Google Patents

방송 수신 장치, 서버 및 그 제어 방법 Download PDF

Info

Publication number
KR20140055502A
KR20140055502A KR1020120122500A KR20120122500A KR20140055502A KR 20140055502 A KR20140055502 A KR 20140055502A KR 1020120122500 A KR1020120122500 A KR 1020120122500A KR 20120122500 A KR20120122500 A KR 20120122500A KR 20140055502 A KR20140055502 A KR 20140055502A
Authority
KR
South Korea
Prior art keywords
channel
information
user
broadcast
name
Prior art date
Application number
KR1020120122500A
Other languages
English (en)
Inventor
남대현
최용호
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020120122500A priority Critical patent/KR20140055502A/ko
Priority to PCT/KR2013/009291 priority patent/WO2014069820A1/en
Priority to US14/059,540 priority patent/US20140123185A1/en
Priority to EP13189835.5A priority patent/EP2728890A3/en
Priority to MX2013012670A priority patent/MX2013012670A/es
Priority to JP2013225009A priority patent/JP2014093778A/ja
Priority to BR102013028161-1A priority patent/BR102013028161A2/pt
Priority to CN201310533180.5A priority patent/CN103796044A/zh
Publication of KR20140055502A publication Critical patent/KR20140055502A/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/65Transmission of management data between client and server
    • H04N21/658Transmission by the client directed to the server
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/482End-user interface for program selection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • H04N21/234336Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by media transcoding, e.g. video is transformed into a slideshow of still pictures or audio is converted into text
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/422Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
    • H04N21/42203Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS] sound input device, e.g. microphone
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/422Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
    • H04N21/42204User interfaces specially adapted for controlling a client device through a remote control device; Remote control devices therefor
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • H04N21/4394Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/65Transmission of management data between client and server
    • H04N21/658Transmission by the client directed to the server
    • H04N21/6582Data stored in the client, e.g. viewing habits, hardware capabilities, credit card number

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Circuits Of Receivers In General (AREA)

Abstract

방송 수신 장치가 개시된다. 방송 수신 장치는, 방송 채널 정보와 사용자 발화 채널 명이 매핑된 정보를 저장하는 저장부, 채널 명을 포함하는 사용자의 발화 음성을 수신하는 음성 수신부, 수신된 사용자의 발화 음성을 제1 서버로 전송하는 제1 통신부 및, 제1 서버로부터 사용자의 발화 음성에 대응되는 텍스트 정보가 수신되면 저장부로부터 텍스트 정보에 대응되는 사용자 발화 채널 명을 검색하고, 검색된 발화 채널 명과 매핑되는 방송 채널 정보에 대응되는 채널로 전환하도록 제어하는 제어부를 포함한다.

Description

방송 수신 장치, 서버 및 그 제어 방법 { BROADCAST RECEIVING APPARATUS, SERVER AND CONTROL METHOD THEREOF }
본 발명은 방송 수신 장치, 서버 및 그 제어 방법에 관한 것으로 더욱 상세하게는 사용자의 음성에 따라 제어되는 방송 수신 장치, 서버 및 그 제어 방법에 관한 것이다.
전자 기술의 발달에 힘입어 다양한 종류의 디스플레이 장치가 개발되어 보급되고 사용자의 요구에 따라 점차 다양한 기능을 구비하게 되었다. 특히, TV의 경우, 최근에는 인터넷과 연결되어 인터넷 서비스까지 지원하고, 사용자는 TV를 통해 많은 수의 디지털 방송 채널까지 시청할 수 있게 되었다.
한편, 최근에는 디스플레이 장치를 조금 더 편리하고 직관적으로 제어하기 위하여 음성 인식을 이용한 기술이 개발되고 있다. 특히, TV의 경우, 사용자의 음성을 인식하고, 볼륨 조절 또는 채널 변경과 같이 사용자의 음성에 대응되는 기능을 수행할 수 있게 되었다.
그러나, 종래 사용자의 음성을 인식하는 디스플레이 장치들은 사용자 편의성 측면에서 한계가 존재하였다. 특히 채널 전환 기능에 있어 방송 신호로 전달되는 채널 정보와 사용자가 일반적으로 인식하고 있는 범용 채널 명이 상이함으로 인해 음성 인식 기반의 채널 전환 기능에 많은 문제점이 야기된다.
본 발명은 상술한 필요성에 따른 것으로, 본 발명의 목적은 사용자 발화 채널 명에 기 매핑된 채널 정보를 이용하여 채널 전환을 수행하는 방송 수신 장치, 서버 및 그 제어 방법에 관한 것이다.
이상과 같은 목적을 달성하기 위한 본 발명의 일 실시 예에 따른 방송 수신 장치는, 방송 채널 정보와 사용자 발화 채널 명이 매핑된 정보를 저장하는 저장부, 채널 명을 포함하는 사용자의 발화 음성을 수신하는 음성 수신부, 상기 수신된 사용자의 발화 음성을 제1 서버로 전송하는 제1 통신부 및, 상기 제1 서버로부터 상기 사용자의 발화 음성에 대응되는 텍스트 정보가 수신되면 상기 저장부로부터 상기 텍스트 정보에 대응되는 사용자 발화 채널 명을 검색하고, 상기 검색된 발화 채널 명과 매핑되는 방송 채널 정보에 대응되는 채널로 전환하도록 제어하는 제어부를 포함한다.
또한, 방송 채널 정보와 사용자 발화 채널 명이 매핑된 정보를 저장하는 제2 서버와 통신을 수행하는 제2 통신부를 더 포함하며, 상기 제어부는, 상기 텍스트 정보에 대응되는 정보를 상기 저장부로부터 검색할 수 없는 경우 상기 텍스트 정보를 상기 제2 서버로 전송하고, 상기 제2 서버로부터 상기 텍스트 정보에 대응되는 채널로 전환하기 위한 제어 신호를 수신할 수 있다.
또한, 상기 제어부는, 상기 텍스트 정보에 대한 문형 분석을 통해 사용자 발화 의도를 판단하고, 사용자 발화 의도가 채널 전환인 것으로 판단되면 상기 검색된 발화 채널 명과 매핑되는 방송 채널 정보에 대응되는 채널로 전환하도록 제어할 수 있다.
또한, 상기 제어부는, 상기 텍스트 정보에 대한 문형 분석을 통해 사용자 발화 의도를 판단할 수 없는 경우 상기 텍스트 정보를 제2 서버로 전송하고, 상기 제2 서버에서 상기 사용자 발화 의도가 채널 전환인 것으로 판단되면 상기 제2 서버로부터 상기 텍스트 정보에 대응되는 채널로 전환하기 위한 제어 신호를 수신할 수 있다.
또한, 상기 제어부는, 기설정된 이벤트에 따라 외부로부터 수신된 방송 채널 정보에 기초하여 상기 방송 채널 정보가 변경되면, 변경된 방송 채널 정보로 상기 저장된 방송 채널 정보를 업데이트할 수 있다.
여기서, 상기 사용자 발화 채널 명은 사용자가 일반적으로 해당 방송 채널 정보에 대응되는 채널의 명칭으로 발화하는 후보 채널 명을 포함하며, 상기 방송 채널 정보는 방송 채널 명칭 및 방송 채널 번호 중 적어도 하나를 포함할 수 있다.
또한, 본 발명의 일 실시 예에 따른 방송 수신 장치와 통신을 수행하는 서버는, 방송 수신 장치와 통신을 수행하는 통신부, 방송 채널 정보와 사용자 발화 채널 명이 매핑된 정보를 저장하는 저장부 및, 상기 방송 수신 장치로부터 채널 명을 포함하는 사용자 발화 음성에 대응되는 텍스트 정보가 수신되면 상기 저장부로부터 상기 텍스트 정보에 대응되는 사용자 발화 채널 명을 검색하고, 상기 검색된 발화 채널 명과 매핑되는 방송 채널 정보에 대응되는 채널로 전환하기 위한 제어 신호를 상기 방송 수신 장치로 전송하도록 제어하는 제어부를 포함한다.
또한, 상기 제어부는, 상기 텍스트 정보에 대한 문형 분석을 통해 사용자 발화 의도를 판단하고, 사용자 발화 의도가 채널 전환인 것으로 판단되면 상기 텍스트 정보에 대응되는 채널로 전환하기 위한 제어 신호를 상기 방송 수신 장치로 전송하도록 제어할 수 있다.
또한, 상기 제어부는, 기설정된 이벤트에 따라 외부로부터 수신된 방송 채널 정보에 기초하여 상기 방송 채널 정보가 변경되면, 변경된 방송 채널 정보로 상기 저장된 방송 채널 명을 업데이트할 수 있다.
여기서, 상기 사용자 발화 채널 명은 사용자가 일반적으로 해당 방송 채널 정보에 대응되는 채널의 명칭으로 발화하는 후보 채널 명을 포함하며, 상기 방송 채널 정보는 방송 채널 명칭 및 방송 채널 번호 중 적어도 하나를 포함할 수 있다.
한편, 본 발명의 일 실시 예에 따른 방송 수신 장치의 제어 방법은, 채널 명을 포함하는 사용자의 발화 음성을 수신하는 단계, 상기 수신된 사용자의 발화 음성을 제1 서버로 전송하는 단계, 상기 제1 서버로부터 상기 사용자의 발화 음성에 대응되는 텍스트 정보가 수신되면, 기 저장된 방송 채널 정보와 사용자 발화 채널 명이 매핑된 정보에 기초하여 상기 텍스트 정보에 대응되는 사용자 발화 채널 명을 판단하는 단계 및, 상기 판단된 발화 채널 명과 매핑되는 방송 채널 정보에 대응되는 채널로 전환하는 단계를 포함한다.
또한, 상기 텍스트 정보에 대응되는 정보를 상기 저장된 정보에 기초하여 판단할 수 없는 경우, 상기 텍스트 정보를 방송 채널 정보와 사용자 발화 채널 명이 매핑된 정보를 저장하는 제2 서버로 전송하는 단계 및, 상기 제2 서버로부터 상기 텍스트 정보에 대응되는 채널로 전환하기 위한 제어 신호를 수신하는 단계를 더 포함할 수 있다.
또한, 상기 텍스트 정보에 대한 문형 분석을 통해 사용자 발화 의도를 판단하는 단계를 더 포함하며, 상기 전환하는 단계는, 사용자 발화 의도가 채널 전환인 것으로 판단되면 상기 판단된 발화 채널 명과 매핑되는 방송 채널 정보에 대응되는 채널로 전환할 수 있다.
또한, 상기 텍스트 정보에 대한 문형 분석을 통해 사용자 발화 의도를 판단할 수 없는 경우 상기 텍스트 정보를 제2 서버로 전송하는 단계 및, 상기 제2 서버에서 상기 사용자 발화 의도가 채널 전환인 것으로 판단되면 상기 제2 서버로부터 상기 텍스트 정보에 대응되는 채널로 전환하기 위한 제어 신호를 수신하는 단계를 더 포함할 수 있다.
또한, 기설정된 이벤트에 따라 외부로부터 수신된 방송 채널 정보에 기초하여 상기 방송 채널 정보가 변경되면, 변경된 방송 채널 정보로 상기 저장된 방송 채널 정보를 업데이트하는 단계를 더 포함할 수 있다.
여기서, 상기 사용자 발화 채널 명은 사용자가 일반적으로 해당 방송 채널 정보에 대응되는 채널의 명칭으로 발화하는 후보 채널 명을 포함하며, 상기 방송 채널 정보는 방송 채널 명칭 및 방송 채널 번호 중 적어도 하나를 포함할 수 있다.
또한, 본 발명의 일 실시 예에 따른 방송 수신 장치와 통신을 수행하는 서버의 제어 방법은, 방송 수신 장치로부터 채널 명을 포함하는 사용자 발화 음성에 대응되는 텍스트 정보를 수신하는 단계, 기저장된 방송 채널 정보와 사용자 발화 채널 명이 매핑된 정보에 기초하여 상기 텍스트 정보에 대응되는 사용자 발화 채널 명을 판단하는 단계 및, 상기 판단된 발화 채널 명과 매핑되는 방송 채널 정보에 대응되는 채널로 전환하기 위한 제어 신호를 상기 방송 수신 장치로 전송하는 단계를 포함한다.
또한, 상기 텍스트 정보에 대한 문형 분석을 통해 사용자 발화 의도를 판단하는 단계를 더 포함하며, 상기 전송하는 단계는, 사용자 발화 의도가 채널 전환인 것으로 판단되면 상기 판단된 발화 채널 명과 매핑되는 방송 채널 정보에 대응되는 채널로 전환하기 위한 제어 신호를 전송할 수 있다.
또한, 기설정된 이벤트에 따라 외부로부터 수신된 방송 채널 정보에 기초하여 상기 방송 채널 정보가 변경되면, 변경된 방송 채널 정보로 상기 저장된 방송 채널 명을 업데이트하는 단계를 더 포함할 수 있다.
여기서, 상기 사용자 발화 채널 명은 사용자가 일반적으로 해당 방송 채널 정보에 대응되는 채널의 명칭으로 발화하는 후보 채널 명을 포함하며, 상기 방송 채널 정보는 방송 채널 명칭 및 방송 채널 번호 중 적어도 하나를 포함할 수 있다.
이상과 같은 본 발명의 다양한 실시 예에 따르면, 정확한 채널 전환 기능을 제공할 수 있으므로 사용자의 편의성이 향상될 수 있다.
도 1은 본 발명의 일 실시 예에 따른 대화형 시스템을 설명하기 위한 도면이다.
도 2는 도 1에 도시된 대화형 시스템의 일반적인 동작을 설명하기 위한 타이밍도이다.
도 3은 도 1에 도시된 방송 수신 장치의 구성을 설명하기 위한 블록도이다.
도 4는 본 발명의 일 실시 예에 따른 방송 수신 장치의 세부 구성을 설명하기 위한 도면이다.
도 5는 도 1에 도시된 제1 서버 및 제2 서버의 구성을 설명하기 위한 블록도이다.
도 6은 본 발명의 일 실시 예에 따른 채널 매핑 테이블을 나타내는 도면이다.
도 7은 본 발명의 일 실시 예에 따른 음성 인식에 따른 채널 전환을 위한 알고리즘 형태를 설명하기 위한 도면이다.
도 8은 본 발명의 일 실시 예에 따른 대화형 시스템의 동작을 설명하기 위한 도면이다.
도 9는 본 발명의 일 실시 예에 따른 방송 수신 장치의 제어 방법을 설명하기 위한 흐름도이다.
도 10은 본 발명의 일 실시 예에 따른 서버의 제어 방법을 설명하기 위한 흐름도이다.
이하에서는 첨부된 도면을 참조하여 본 발명을 보다 상세하게 설명한다.
도 1은 본 발명의 일 실시 예에 따른 대화형 시스템을 설명하기 위한 도면이다. 도 1에 도시된 바와 같이, 대화형 시스템은 방송 수신 장치(100), 제1 서버(200) 및 제2 서버(300)를 포함한다. 여기서, 방송 수신 장치(100)는 스마트 TV와 같은 장치일 수 있으나, 이는 일 실시 예에 불과할 뿐, 모니터, 셋탑박스 등과 같은 장치로 구현될 수 있다.
사용자 음성이 입력되면, 방송 수신 장치(100)는 입력된 사용자의 음성을 디지털 신호로 변환하여 제1 서버(200)로 전송한다. 방송 수신 장치(100)로부터 디지털 신호가 수신되면, 제1 서버(200)는 언어 모델, 음향 모델 및 발음 사전을 이용하여 수신된 사용자의 음성에 대응되는 디지털 신호를 텍스트 정보로 변환하고, 텍스트 정보를 방송 수신 장치(100)로 전송한다.
그리고, 방송 수신 장치(100)는 제1 서버(200)로부터 수신된 텍스트 정보를 제2 서버(300)로 전송한다. 방송 수신 장치(100)로부터 텍스트 정보가 수신되면, 제2 서버(300)는 수신된 텍스트 정보에 대응되는 응답 정보를 생성하여 방송 수신 장치(100)로 전송한다. 이때, 응답 정보에는 사용자 음성에 대응되는 응답 메시지, 제어 신호, 및 컨텐츠 검색 결과 중 적어도 하나를 포함할 수 있다. 응답 메시지는 사용자와 대화하는 것과 같이, 사용자 음성에 응답하는 텍스트 정보이다, 예를 들어, 사용자 음성이 "000를 검색해 줄래"인 경우, 응답 메시지는 "검색해 줄께"와 같은 사용자 음성에 응답하는 텍스트 정보일 수 있다. 제어 신호는 사용자 음성에 대응되는 방송 수신 장치(100)를 제어하기 위한 신호이다. 예를 들어, 사용자 음성이 "채널을 000(채널명)로 바꿔줘"인 경우, 제어 신호는 방송 수신 장치(100)의 튜너가 사용자 음성에 대응되는 채널을 선국하도록 제어하는 신호일 수 있다. 컨텐츠 검색 결과는 사용자의 컨텐츠 검색 요청에 응답하는 정보이다. 예를 들어, 사용자 음성이 "OOO(영화명)의 주인공은 누구야"인 경우, 컨텐츠 검색 결과는 사용자 음성에 대응되는 영화의 주인공 검색 결과 정보이다.
특히, 제2 서버(300)는 방송 채널 정보와 사용자 발화 채널 명이 매핑된 정보를 저장할 수 있다. 여기서, 사용자 발화 채널 명이란 특정 채널에 대하여 사용자가 통상적으로 발화하여 호출할 수 있는 채널 명칭을 의미한다. 이에 따라 제2 서버(300)는 텍스트 정보에 채널 명이 포함되어 있는 경우, 해당 텍스트 정보에 대응되는 사용자 발화 채널 명을 검색하고, 검색된 발화 채널 명과 매핑되는 방송 채널 정보에 대응되는 채널로 전환하기 위한 제어 신호를 생성하여 방송 수신 장치(100)로 전송할 수 있다.
또한, 경우에 따라서는 방송 채널 정보와 사용자 발화 채널 명이 매핑된 정보는 방송 수신 장치(100)에 저장되어 있을 수 있다. 이 경우, 방송 수신 장치(100)는 제1 서버(200)로부터 수신된 텍스트 정보에 대응되는 사용자 발화 채널 명을 검색하고, 검색된 발화 채널 명과 매핑되는 방송 채널 정보에 대응되는 채널로 전환할 수 있다.
일 예로, 제공 가능한 전체 방송 채널 정보 중 일부 방송 채널 정보와 사용자 발화 채널 명이 매핑되는 제1 정보가 방송 수신 장치(100)에 저장되고, 나머지 방송 채널 정보와 사용자 발화 채널 명이 매핑되는 제2 정보가 제2 서버(200)에 저장되어 있을 수 있다. 이에 따라 방송 쉰 장치(100)에서 1차적으로 상술한 텍스트 정보에 대응되는 사용자 발화 채널 명을 검색하고, 검색이 불가능한 경우, 즉, 해당 텍스트 정보에 대응되는 사용자 발화 채널 명이 방송 수신 장치(100)에 저장되어 있지 않은 경우, 해당 텍스트 정보를 제2 서버(200)로 전송할 수 있다. 경우에 따라서는 제공 가능한 전체 방송 채널 정보 중 일부 방송 채널 정보와 사용자 발화 채널 명이 매핑되는 제1 정보가 방송 수신 장치(100)에 저장되고, 전체 방송 채널 정보와 사용자 발화 채널 명이 매핑되는 제3 정보가 제2 서버(200)에 저장되는 것도 가능하다.
한편, 도면에는 도시하지 않았지만 경우에 따라서 대화형 시스템는 컨텐츠 제공 서버(미도시)를 더 포함될 수 있으며, 컨텐츠 제공 서버는 다양한 컨텐츠, 컨텐츠 정보를 저장하는 DB를 구비하도록 구현될 수 있다.
도 2는 도 1에 도시된 대화형 시스템의 일반적인 동작을 설명하기 위한 타이밍도이다.
도 2에 따르면, 방송 수신 장치(100)는 사용자 음성을 수집하여(S10), 제1 서버(200)로 전송한다(S20). 구체적으로, 사용자 음성을 수집하기 위한 모드가 개시되면, 방송 수신 장치(100)는 기설정된 거리 이내에서 사용자가 발화한 음성을 수집하여 제1 서버(200)로 전송할 수 있다.
이를 위해, 방송 수신 장치(100)는 사용자가 발화한 음성을 입력받기 위한 마이크 등을 구비할 수 있다. 이 경우, 마이크는 방송 수신 장치(100)에 내장되어 일체형을 이루거나, 방송 수신 장치(100)와 분리된 형태로 구현될 수 있다. 분리된 형태로 구현되는 경우, 마이크는 사용자가 손으로 쥐는 형태, 또는 식탁이나 테이블에 놓일 수 있는 형태로 구현될 수 있으며, 방송 수신 장치(100)와 유선 또는 무선 네트워크를 통하여 연결될 수 있다.
제1 서버(200)는 방송 수신 장치(100)로부터 수신된 사용자 음성을 텍스트 정보로 변환한다(S30). 구체적으로, 제1 서버(200)는 ASR(Automatic Speech Recognition) 서버로 구현될 수 있으며, STT(Speech to Text)를 위한 알고리즘을 이용하여, 방송 수신 장치(100)로부터 수신된 음성 신호를 텍스트 정보로 변환할 수 있다. 그리고, 제1 서버(200)는 텍스트 정보를 방송 수신 장치(100)로 전송한다(S40).
방송 수신 장치(100)는 제1 서버(200)로부터 수신된 텍스트 정보를 제2 서버(300)로 전송한다(S50).
제2 서버(300)는 방송 수신 장치(100)로부터 텍스트 정보가 수신되면, 텍스트 정보에 대응되는 응답 정보를 생성한다. 구체적으로, 제2 서버(300)는 텍스트 정보에 채널 명이 포함되어 있는 경우, 해당 텍스트 정보에 대응되는 방송 채널 정보를 검색하고, 검색된 방송 채널 정보에 대응되는 채널로 전환하기 위한 제어 신호를 생성할 수 있다. 이를 위해 제2 서버(300)는 방송 채널 정보와 사용자 발화 채널 명이 매핑된 정보를 기 저장하고, 기 저장된 정보에 기초하여 해당 텍스트 정보에 대응되는 방송 채널 정보를 검색하고, 검색된 방송 채널 정보에 대응되는 채널로 전환하기 위한 제어 신호를 생성할 수 있다.
도 3은 도 1에 도시된 방송 수신 장치의 구성을 설명하기 위한 블록도이다. 도 3에 따르면, 방송 수신 장치(100)는 저장부(110), 음성 수신부(120), 제1 통신부(130), 제2 통신부(140) 및 제어부(150)를 포함한다.
저장부(110)는 방송 채널 정보와 사용자 발화 채널 명이 매핑된 정보를 저장한다. 즉, 저장부(110)는 방송국 채널 명칭 및 방송 채널 번호 중 적어도 하나를, 사용자가 일반적으로 해당 방송국 채널 명칭 및 방송 채널 번호을 호출하는 사용자 발화 채널 명에 매핑시킨 형태의 테이블을 저장하고 있을 수 있다. 예를 들어, "HD SBS"의 방송 채널 정보와 "SBS", "서울 방송" 등의 사용자 발화 채널 명이 매핑되고, "HD UBC 울산 방송"의 방송 채널 정보와 "UBC", "SBS", "울산 방송" 등의 사용자 발화 채널 명이 매핑되고, "HD GI 강원 민방" 등의 방송 채널 정보와 "SBS", "G1", "강원 민방" 등의 사용자 발화 채널 명이 매핑된 형태의 테이블을 저장할 수 있다. 이러한 매핑 정보는, 외부 서버(미도시)로부터 다운로드하여 저장할 수 있다. 여기서, 외부 서버( 미도시 )는 도 1에 도시된 제2 서버(300) 또는 그 밖에 방송 채널 정보를 제공하는 서비스 서버(예를 들어, 장치 제조사에서 운영하는 통합 서버), 방송사 관련 서버 등이 될 수 있다.
다만, 본 발명의 다른 실시 예에 따르면, 방송 채널 정보와 사용자 발화 채널 명이 매핑된 정보는 방송 수신 장치(100)에서 별도의 동작을 통해 업데이트되거 나, 생성되는 것도 가능하다. 예를 들어, 다운로드된 매핑 정보에 포함된 사용자 발화 채널 명을 방송 수신 장치(100)의 사용자가 직접 음성 인식을 통해 입력한 발화 채널 명으로 업데이트하여 매핑 정보를 재구성하는 것이 가능할 수 있다. 또는, 기 다운로드된 방송 채널 정보에 방송 수신 장치(100)의 사용자가 직접 음성 인식을 통해 입력한 발화 채널 명을 매핑하여 저장함으로써 해당 매핑 정보를 생성하는 것도 가능할 수 있다.
음성 수신부(120)는 사용자의 음성을 수신한다. 예를 들어, 음성 수신부(120)는 사용자의 음성을 수신하기 위한 마이크로 구현되어, 방송 수신 장치(100)에 내장되어 일체형을 이루거나, 방송 수신 장치(100)와 분리된 형태로 구현될 수 있다. 분리된 형태로 구현되는 경우, 음성 수신부(120)는 사용자가 손으로 쥐는 형태, 또는 식탁이나 테이블에 놓일 수 있는 형태로 구현될 수 있으며, 방송 수신 장치(100)와 유선 또는 무선 네트워크를 통하여 연결되어 수집된 사용자의 음성을 방송 수신 장치(100)로 전송할 수 있다.
한편, 음성 수신부(120)는 수신된 사용자의 음성을 처리하여, 음성 신호를 생성한다. 즉, 음성 수신부(120)는 수집된 사용자의 음성에서 노이즈(예를 들어, 에어컨 소리, 청소기 소리, 음악 소리 등)를 제거하여, 음성 신호를 생성할 수 있다.
구체적으로, 음성 수신부(120)는 아날로그 형태의 사용자 음성이 입력되면, 이를 샘플링하여 디지털 신호로 변환한다. 그리고, 음성 수신부(120)는 변환된 디지털 신호의 에너지를 계산하여, 디지털 신호의 에너지가 기설정된 값 이상인지 여부를 판단한다.
디지털 신호의 에너지가 기설정된 값 이상인 경우, 음성 수신부(120)는 디지털 신호에서 노이즈 성분을 제거하여 제1 통신부(130)로 전달한다. 이때, 노이즈 성분은 가정 환경에서 발생할 수 있는 돌발성 잡음으로써, 에어컨 소리, 청소기 소리, 음악 소리 등이 포함될 수 있다. 한편, 디지털 신호의 에너지가 기설정된 값 미만인 경우, 음성 수신부(120)는 디지털 신호에 별다른 처리 과정을 수행하지 않고, 다른 입력을 기다린다. 이에 의해, 사용자 발화 음성이 아닌 다른 소리에 의해 전체 오디오 처리 과정이 활성화되지 않아, 불필요한 전력 소모를 방지할 수 있다.
제1 통신부(130)는 제1 서버(도 1의 200)와 통신을 수행한다. 구체적으로, 제1 통신부(130)는 사용자 음성을 제1 서버(200)로 전송하고, 사용자 음성에 대응되는 텍스트 정보를 제1 서버(200)로부터 수신할 수 있다.
제2 통신부(140)는 제2 서버(도 1의 300)와 통신을 수행한다. 구체적으로, 제2 통신부(140)는 수신된 텍스트 정보를 제2 서버(300)로 전송하고, 텍스트 정보에 대응되는 응답 정보를 제2 서버(300)로부터 수신할 수 있다.
이를 위해, 제1 통신부(130) 및 제2 통신부(140)는 근거리 무선 통신 모듈(미도시), 무선 통신 모듈(미도시) 등과 같은 다양한 통신 모듈을 포함할 수 있다. 여기에서, 근거리 무선 통신 모듈이란 블루투스, 지그비 방식 등과 같은 근거리 무선 통신 방식에 따라, 근거리에 위치한 외부 기기와 통신을 수행하기 위한 모듈이다. 또한, 무선 통신 모듈이란 WiFi, IEEE 등과 같은 무선 통신 프로토콜에 따라 외부 네트워크에 연결되어 통신을 수행하는 모듈이다. 이 밖에 무선 통신 모듈은 3G(3rd Generation), 3GPP(3rd Generation Partnership Project), LTE(Long Term Evoloution) 등과 같은 다양한 이동 통신 규격에 따라 이동 통신 망에 접속하여 통신을 수행하는 이동 통신 모듈을 더 포함할 수도 있다.
한편, 상술한 실시 예에서는, 방송 수신 장치(100)가 제1 서버(200) 및 제2 서버(300)와 통신을 수행하기 위해, 별도의 통신부(130, 140)를 구비하는 것으로 설명하였으나 이는 일 예에 불과하다. 즉, 방송 수신 장치(100)는 하나의 통신 모듈을 통해 제1 서버(200) 및 제2 서버(300)와 통신을 할 수 있음은 물론이다.
제어부(150)는 방송 수신 장치(100)의 전반적인 동작을 제어한다.
특히, 제어부(150)는 제1 서버(200)로부터 사용자의 발화 음성에 대응되는 텍스트 정보가 수신되면, 수신된 텍스트 정보에 대한 개체 분석 및 문형 분석을 수행할 수 있다. 여기서, 개체 분석이란 수신된 텍스트 정보에 포함된 사용자 발화 채널 명을 판단하는 것을 의미하며, 문형 분석이란 수신된 텍스트 정보에 대한 사용자의 발화 의도 즉, 채널 전환 의도를 판단하는 것을 의미한다.
구체적으로, 제어부(150)는 제1 서버(200)로부터 사용자의 발화 음성에 대응되는 텍스트 정보가 수신되면 저장부(110)에 저장된 방송 채널 정보와 사용자 발화 채널 명이 매핑된 정보에 기초하여, 수신된 텍스트 정보에 대응되는 사용자 발화 채널 명을 검색하고, 검색된 발화 채널 명과 매핑되는 방송 채널 정보에 대응되는 채널로 전환하도록 제어할 수 있다. 경우에 따라 제어부(150)는 제1 서버(200)로부터 수신된 텍스트 정보를 포함하는 UI 를 디스플레이하여 사용자가 음성 인식이 제대로 수행되었는지 확인 가능하도록 할 수 있다.
또한, 제어부(150)는 텍스트 정보에 대응되는 정보를 저장부(110)에 저장된 정보에 기초하여 검색할 수 없는 경우, 텍스트 정보를 제2 통신부(140)를 통해 제2 서버(300)로 전송하고 제2 서버(300)로부터 텍스트 정보에 대응되는 채널로 전환하기 위한 제어 신호를 수신할 수 있다. 이 경우, 제2 서버(300)는 방송 채널 정보와 사용자 발화 채널 명이 매핑된 정보에 기초하여 수신된 텍스트 정보에 대응되는 발화 채널 명을 판단하고, 판단된 발화 채널 명에 매핑되는 방송 채널 정보에 대응되는 채널로 전환하기 위한 제어 신호를 생성하여 방송 수신 장치(100)로 전송할 수 있다. 한편, 제어부(150)는 제2 서버(300)로부터 수신된 제어 신호에 따라 채널 전환을 수행할 수 있다.
또한, 제어부(150)는 제1 서버(200)로부터 수신된 텍스트 정보에 대한 문형 분석을 통해 사용자 발화 의도를 판단하고, 사용자 발화 의도가 채널 전환인 것으로 판단되면 저장부(110)에 저장된 정보에 기초하여 검색된 발화 채널 명과 매핑되는 방송 채널 정보에 대응되는 채널로 전환하도록 제어할 수 있다.
이를 위해 저장부(110)는 제1 서버(200)로부터 수신된 텍스트 정보에 대한 문형 분석을 통해 사용자 발화 의도를 판단하기 위한 정보를 저장하고 있을 수 있다. 구체적으로, 저장부(110)는 특정 서비스 도메인마다 기정의된 화행 및 주행 중 적어도 하나를 저장하고 있을 수 있다. 예를 들어, 방송 도메인인 경우, 화행은 서술문(Statement), 요청문(Request), Why 의문문(WH-Question), Yes-No 의문문(YN-Question) 등을 포함하고, 주행은 TV 온/오프, 채널 전환, 프로그램 찾기, 프로그램 시간 찾기, 프로그램 예약 등을 포함할 수 있다. 또한, 저장부(110)는 사용자 발화 의도 별로 매칭되는 제어 신호를 저장하고 있을 수 있다. 즉, 사용자의 발화 의도가 채널 전환인 경우, 채널 전환을 위한 제어 신호를 매칭시켜 저장할 수 있다. 다만 이는 일 실시 예에 불과하며, 기정의된 화행 및 주행은 서비스 도메인 별로 구분되지 않고 저장되는 것도 가능함은 물론이다.
이에 따라 제어부(150)는 저장부(110)에 상술한 정보에 기초하여 사용자 발화 의도가 채널 전환인 것으로 판단되면, 대응되는 채널로 전환하도록 제어할 수 있다. 예를 들어, "○○○(사용자 발화 채널 명)", "○○○를 틀어줘", "○○○를 보여줘"에 대한 사용자 발화 의도가 채널 전환인 것으로 판단하고, ○○○로 채널 전환을 수행할 수 있다.
또한, 제어부(150)는 제1 서버(200)로부터 수신된 텍스트 정보에 대한 문형 분석을 통해 사용자 발화 의도를 판단할 수 없는 경우 텍스트 정보를 제2 서버(300)로 전송하고, 제2 서버(300)에서 사용자 발화 의도가 채널 전환인 것으로 판단되면 제2 서버로(300)부터 텍스트 정보에 대응되는 채널로 전환하기 위한 제어 신호를 수신할 수 있다. 제2 서버(300)의 동작에 대해서는 도 5(b)를 참고하여 후술하도록 한다.
또한, 제어부(150)는 외부로부터 수신된 방송 채널 정보에 기초하여 방송 채널 정보가 변경된 것으로 판단되면, 저장부(110)에 저장된 방송 채널 정보를 수신된 방송 채널 정보로 업데이트하여 저장할 수 있다. 이 경우, 방송 채널 정보를 주기적으로 또는 사용자 명령에 의해 외부 방송국 서버 또는 방송 정보 제공 서버로부터 수신될 수 있다. 예를 들어, 중앙 방송국, 지역 방송국 등에 의해 방송 채널 정보가 변경되는 경우 변경된 내용이 기 저장된 매핑 테이블에 반영되도록 할 수 있다.
한편, 제어부(150)는 다양한 실시 예에 따라 텍스트 정보를 제2 서버(300)로 전송할 수 있다.
일 실시 예에 따라, 제어부(150)는 텍스트 정보에 대응되는 사용자 발화 채널 명을 저장부(110)에 저장된 정보에 기초하여 검색할 수 없는 경우, 텍스트 정보에 대한 문형 분석을 수행하지 않고 텍스트 정보를 제2 서버(300)로 전송할 수 있다. 이 경우, 제2 서버(300)는 수신된 텍스트 정보에 대응되는 사용자 발화 채널 명을 판단할 뿐 아니라, 텍스트 정보에 대한 사용자 발화 의도를 분석하여 그에 대응되는 제어 신호를 방송 수신 장치(100)로 전송할 수 있다.
또는, 제어부(150)는 텍스트 정보에 대응되는 사용자 발화 채널 명을 저장부(110)에 저장된 정보에 기초하여 검색할 수 없는 경우에도 텍스트 정보에 대한 문형 분석을 수행하여 사용자 발화 의도가 채널 전환인 것으로 판단되면, 텍스트 정보의 일부(예를 들어, 발화 채널 명에 해당하는 부분)를 제2 서버(200)로 전송할 수 있다. 이 경우, 제2 서버(200)는 수신된 일부 텍스트 정보에 매핑되는 방송 채널 정보를 검색하여 방송 수신 장치(100)로 전송할 수 있으며, 제어부(150)는 판단된 사용자 발화 의도 및 제2 서버(300)로부터 수신된 방송 채널 정보에 기초하여 채널 전환 동작을 수행할 수 있다.
다른 실시 예에 따라, 제어부(150)는 텍스트 정보에 대응되는 사용자 발화 채널 명 및 그에 매핑되는 방송 채널 정보를 저장부(110)에 저장된 정보에 기초하여 판단하였으나, 사용자의 발화 의도를 판단할 수 없는 경우 전체 텍스트 정보 또는 일부 텍스트 정보(예를 들어, 전체 텍스트 정보 중 발화 채널 명 부분을 제외한 텍스트 정보)를 제2 서버(300)로 전송할 수 있다. 이 경우, 제2 서버(300)는 전체 텍스트 정보가 수신되는 경우, 수신된 텍스트 정보에 대응되는 사용자 발화 채널 명 및 사용자 발화 의도(채널 전환 의도)를 분석하여 그에 대응되는 채널 전환 제어 신호를 방송 수신 장치(100)로 전송할 수 있다. 또는, 제2 서버(300)는 일부 텍스트 정보가 수신되는 경우에는 사용자의 발화 의도를 판단하여 방송 수신 장치(100)로 전송할 수 있다. 이 경우, 방송 수신 장치(100)는 사용자 발화 채널 명에 기초하여 검색된 방송 채널 정보와 제2 서버(300)로부터 수신된 사용자 발화 의도 정보에 기초하여 채널 전환 동작을 수행할 수 있다.
도 4는 본 발명의 일 실시 예에 따른 방송 수신 장치의 세부 구성을 설명하기 위한 도면이다.
도 4에 따르면, 방송 수신 장치(100)는 저장부(110), 음성 수신부(120), 제1 통신부(130), 제2 통신부(140), 제어부(150), 수신부(160), 신호 처리부(170), 디스플레이부(180), 오디오 출력부(185), 사용자 인터페이스부(190)를 포함한다. 도 4에 도시된 구성요소들 중 도 3에 도시된 구성요소와 중복되는 부분에 대해서는 자세한 설명을 생략하도록 한다.
수신부(160)는 다양한 컨텐츠를 수신한다. 구체적으로, 수신부(160)는 방송 네트워크를 이용하여 방송 프로그램 컨텐츠를 전송하는 방송국 또는 인터넷을 이용하여 컨텐츠 파일을 전송하는 웹 서버로부터 컨텐츠를 수신한다. 또한, 방송 수신 장치(100) 내에 마련되거나 방송 수신 장치(100)에 연결된 각종 기록 매체 재생 장치로부터 컨텐츠를 수신할 수도 있다. 기록 매체 재생 장치란 CD, DVD, 하드디스크, 블루레이 디스크, 메모리 카드, USB 메모리 등과 같은 다양한 유형의 기록 매체에 저장된 컨텐츠를 재생하는 장치를 의미한다.
방송국으로부터 컨텐츠를 수신하는 실시 예의 경우에는, 수신부(160)는 튜너(미도시), 복조기(미도시), 등화기(미도시) 등과 같은 구성을 포함하는 형태로 구현될 수 있다. 반면, 웹 서버와 같은 소스로부터 컨텐츠를 수신하는 실시 예의 경우에는, 수신부(160)는 네트워크 인터페이스 카드(미도시)로 구현될 수 있다. 또는, 상술한 각종 기록 매체 재생 장치로부터 컨텐츠를 수신하는 실시 예의 경우에는, 수신부(160)는 기록 매체 재생 장치와 연결된 인터페이스부(미도시)로 구현될 수 있다. 이와 같이, 수신부(160)는 실시 예에 따라 다양한 형태로 구현될 수 있다.
신호 처리부(170)는 수신부(160)를 통해 수신된 컨텐츠가 출력부(110)를 통해 출력될 수 있도록 컨텐츠에 대한 신호처리를 수행한다.
구체적으로, 신호 처리부(170)는 컨텐츠에 포함된 비디오 신호에 대해 디코딩, 스케일링, 노이즈 필터링, 프레임 레이트 변환, 해상도 변환 등과 같은 다양한 이미지 처리를 수행하여 디스플레이부(180)에서 출력 가능한 형태로 비디오 신호를 변환할 수 있다. 또한, 신호 처리부(170)는 컨텐츠에 포함된 오디오 신호에 대해 디코딩이나 증폭, 노이즈 필터링 등의 다양한 신호 처리를 수행하여 오디오 출력부(185)에서 출력 가능한 형태로 오디오 신호를 변환할 수 있다.
디스플레이부(180)는 신호 처리부(170)에서 처리된 각종 비디오 신호를 출력하는 구성요소이다. 디스플레이부(180)는 액정 표시 장치(Liquid Crystal Display, LCD), 유기 전기 발광 다이오드(Organic Light Emitting Display, OLED) 또는 플라즈마 표시 패널(Plasma Display Panel, PDP) 등으로 구현되어, 방송 표시 장치(100)를 통해 제공 가능한 다양한 디스플레이 화면을 제공할 수 있다.
오디오 출력부(185)는 신호 처리부(170)에서 처리된 각종 오디오 신호 뿐만 아니라 각종 알림 음이나 음성 메시지 등을 출력하는 구성요소이다.
사용자 인터페이스부(190)는 다양한 사용자 조작을 수신하여 제어부(150)로 전달한다.
사용자 인터페이스부(190)는 방송 수신 장치(100)를 제어하기 위한 리모컨에서 전송되는 리모컨 신호를 수신하기 위한 IR 수신부(미도시)로 구현될 수 있다. 경우에 따라서는 방송 수신 장치(100)에 구비된 입력 패널로 구현될 수 있다. 여기에서, 입력 패널은 터치패드(Touch Pad) 혹은 각종 기능키, 숫자키, 특수키, 문자키 등을 구비한 키패드(Key Pad) 또는 터치 스크린(Touch Screen) 방식으로 이루어질 수 있다.
사용자 인터페이스부(190)는 방송 수신 장치(100)의 기능을 제어하기 위한 각종 사용자 조작을 입력받을 수 있다. 예를 들어, 방송 수신 장치(100)가 스마트 TV로 구현되는 경우, 전원 온/오프, 채널 전환, 볼륨 변경 등 스마트 TV의 기능을 제어하기 위한 사용자 조작을 입력받을 수 있다. 이 경우, 제어부(150)는 사용자 인터페이스부(190)를 통해 입력된 사용자 조작에 대응되는 각종 기능을 실행하도록 다른 구성요소를 제어할 수 있다.
특히, 사용자 인터페이스부(190)는 사용자의 음성을 수집하기 위한 음성 인식 모드를 개시하기 위한 사용자 조작을 입력받는다. 예를 들어, 사용자 인터페이스부(190)는 디스플레이부(180)와 함께 터치 스크린 형태로 구현되어, 음성 인식 모드를 입력받기 위한 오브젝트(가령, 아이콘)를 디스플레이할 수 있다. 다른 한편, 사용자 인터페이스부(190)는 음성 인식 모드를 입력받기 위한 별도의 버튼을 구비할 수도 있다. 음성 인식 모드를 개시하기 위한 사용자 조작이 사용자 인터VP페이스부(190)를 통해 입력되면, 제어부(150)는 음성 수신부(120)를 활성화하여 기설정된 거리 내에서 발화되는 채널 전환을 위한 사용자의 음성을 수신할 수 있다. 그리고, 제어부(150)는 제1 서버(200) 및 제2 서버(300)와 통신을 통해 수신된 사용자 음성에 대응되는 채널 전환을 위한 제어 신호를 수신하여, 채널 전환 기능이 수행되도록 제어할 수 있다.
한편, 제어부(150)는 저장부(110)에 저장된 각종 프로그램을 이용하여 방송 수신 장치(100)의 동작을 전반적으로 제어한다.
구체적으로, 제어부(150)는 RAM(151), ROM(152), 메인 CPU(153), 그래픽 처리부(154), 제1 내지 n 인터페이스(155-1 ~ 155-n), 버스(156)를 포함한다.
RAM(151), ROM(152), 메인 CPU(153), 그래픽 처리부(154), 제1 내지 n 인터페이스(155-1 ~ 155-n) 등은 버스(156)를 통해 서로 연결될 수 있다.
제1 내지 n 인터페이스(155-1 내지 155-n)는 상술한 각종 구성요소들과 연결된다. 인터페이스들 중 하나는 네트워크를 통해 외부 장치와 연결되는 네트워크 인터페이스가 될 수도 있다.
메인 CPU(153)는 저장부(110)에 액세스하여, 저장부(110)에 저장된 O/S를 이용하여 부팅을 수행한다. 그리고, 저장부(110)에 저장된 각종 프로그램, 컨텐츠, 데이터 등을 이용하여 다양한 동작을 수행한다.
ROM(152)에는 시스템 부팅을 위한 명령어 세트 등이 저장된다. 턴온 명령이 입력되어 전원이 공급되면, 메인 CPU(153)는 ROM(152)에 저장된 명령어에 따라 저장부(110)에 저장된 O/S를 RAM(151)에 복사하고, O/S를 실행시켜 시스템을 부팅시킨다. 부팅이 완료되면, 메인 CPU(153)는 저장부(110)에 저장된 각종 어플리케이션 프로그램을 RAM(151)에 복사하고, RAM(151)에 복사된 어플리케이션 프로그램을 실행시켜 각종 동작을 수행한다.
그래픽 처리부(154)는 연산부(미도시) 및 렌더링부(미도시)를 이용하여 아이콘, 이미지, 텍스트 등과 같은 다양한 객체를 포함하는 화면을 생성한다. 연산부는 그래픽 처리부(154)으로부터 수신된 제어 명령을 이용하여 화면의 레이아웃에 따라 각 객체들이 표시될 좌표값, 형태, 크기, 컬러 등과 같은 속성값을 연산한다. 렌더링부는 연산부에서 연산한 속성값에 기초하여 객체를 포함하는 다양한 레이아웃의 화면을 생성한다. 렌더링부에서 생성된 화면은 디스플레이부(180)의 디스플레이 영역 내에 표시된다.
한편, 도 4는 방송 수신 장치(100)에 포함된 세부 구성의 일 예를 든 것으로, 실시 예에 따라서는, 도 4에 도시된 구성 요소 중 일부는 생략 또는 변경될 수도 있고, 다른 구성요소가 더 추가될 수도 있다. 예를 들어, 방송 수신 장치(100)가 스마트폰과 같은 사용자 단말 장치로 구현되는 경우, 방송 수신 장치(100)의 현재 위치를 산출하기 위한 GPS 수신부(미도시) 등을 더 포함할 수 있다.
도 5는 도 1에 도시된 제1 서버 및 제2 서버의 구성을 설명하기 위한 블록도이다.
도 5(a)에 도시된 바와 같이 제1 서버(200)는 통신부(210) 및 제어부(220)를 포함한다.
통신부(210)는 방송 수신 장치(100)와 통신을 수행하여 사용자 음성을 수신하고, 사용자 음성에 대응되는 텍스트 정보를 방송 수신 장치(100)로 전송한다.
제어부(220)는 STT(Speech to Text) 엔진을 이용하여, 사용자의 음성을 텍스트 정보로 변환할 수 있다. 여기서, STT 엔진은 음성 신호를 텍스트로 변환하기 위한 모듈로서, 종래 개시되어 있는 다양한 STT 알고리즘을 이용하여 음성 신호를 텍스트로 변환할 수 있다.
예를 들어, 제어부(220)는 수신된 음성 신호 내에서 사용자가 발화한 음성의 시작과 끝을 검출하여 음성 구간을 판단한다. 구체적으로, 제어부(220)는 수신된 음성 신호의 에너지를 계산하고, 계산된 에너지에 따라 음성 신호의 에너지 레벨을 분류하여, 동적 프로그래밍을 통해 음성 구간을 검출할 수 있다. 그리고, 제어부(220)은 검출된 음성 구간 내에서 음향 모델(Acoustic Model)을 기초로 음성의 최소 단위인 음소를 검출하여 음소 데이터를 생성하고, 생성된 음소 데이터에 HMM(Hidden Markov Model) 확률 모델을 적용하여 텍스트 정보를 생성할 수 있다.
도 5(b)에 도시된 바와 같이, 제2 서버(300)는 저장부(310), 통신부(320) 및 제어부(330)를 포함한다.
저장부(310)는 방송 채널 정보와 사용자 발화 채널 명이 매핑된 정보를 저장한다. 여기서, 매핑 정보는 예를 들어, 메타 데이터 DB 내에 저장될 수 있다.
그 밖에 저장부(310)는 방송 수신 장치(100)로부터 수신된 텍스트 정보에 대응되는 응답 정보를 생성하기 위한 다양한 정보를 저장한다.
구체적으로, 저장부(310)는 특정 서비스 도메인마다 기정의된 화행, 주행 및 핵심 요소를 저장하고 있을 수 있다. 예를 들어, 방송 도메인인 경우, 화행은 서술문(Statement), 요청문(Request), Why 의문문(WH-Question), Yes-No 의문문(YN-Question) 등을 포함하고, 주행은 TV 온/오프, 채널 전환, 프로그램 찾기, 프로그램 시간 찾기, 프로그램 예약 등을 포함하고, 핵심 요소는 장르, 프로그램명, 시작시간, 채널명, 배우 이름 등을 포함할 수 있다. 다만, 이는 일 실시 예에 불과하며, 다른 실시 예에 의하면 핵심 요소는 서비스 도메인 별로 저장되어 있을 수 있으나 기정의된 화행 및 주행은 서비스 도메인을 구분하지 않고 저장되어 있는 것도 가능하다.
또한, 저장부(310)는 각 도메인별로 사용자의 발화 의도에 대응되는 답변을 저장하는 말뭉치(corpus) 데이터베이스를 포함할 수 있다. 예를 들어, 방송 서비스 도메인에서 특정 프로그램의 장르를 문의하는 사용자의 발화 의도에 대응되는 답변으로 ".... 프로그램의 장르는 .... 입니다"를 저장할 수 있으며, 프로그램 시작시간을 문의하는 사용자의 발화 의도에 대응되는 답변으로 ".... 프로그램의 시작시간을 .... 입니다"를 저장할 수 있다.
또한, 저장부(310)는 사용자의 발화 의도 별로 매칭되는 제어 명령을 저장하고 있을 수 있다. 예를 들어, 사용자의 발화 의도가 채널 전환인 경우 방송 수신 장치(100)의 채널을 변경하기 위한 제어 신호를 매칭시켜 저장하고, 사용자의 발화 의도가 예약 녹화인 경우 방송 수신 장치(100)에서 특정 프로그램에 대한 예약 녹화 기능을 실행시키기 위한 제어 신호를 매칭시켜 저장하고 있을 수 있다.
통신부(320)는 방송 수신 장치(100)와 통신을 수행하여 제1 서버(200)를 통해 사용자 음성이 변환된 텍스트 정보를 수신하고, 텍스트 정보에 대응되는 응답 정보를 방송 수신 장치(100)로 전송한다. 이를 위해, 통신부(310)는 근거리 무선 통신 모듈(미도시), 무선 통신 모듈(미도시) 등과 같은 다양한 통신 모듈을 포함할 수 있다.
제어부(330)는 제2 서버(300)의 전반적인 동작을 제어한다.
특히, 제어부(330)는 방송 수신 장치(100)로부터 사용자 음성에 대응되는 텍스트 정보가 수신되면, 수신된 텍스트 정보에 대한 개체 분석 및 문형 분석을 수행할 수 있다. 여기서, 개체 분석이란 수신된 텍스트 정보에 포함된 사용자 발화 채널 명을 판단하는 것을 의미하며, 문형 분석이란 수신된 텍스트 정보에 대한 사용자의 발화 의도 즉, 채널 전환 의도를 판단하는 것을 의미한다.
구체적으로, 제어부(330)는 방송 수신 장치(100)로부터 채널 명을 포함하는 사용자 음성에 대응되는 텍스트 정보가 수신되면, 저장부(310)로부터 텍스트 정보에 대응되는 사용자 발화 채널 명을 검색한다.
이어서, 제어부(330)는 검색된 발화 채널 명에 대응되는 방송 채널 정보에 대응되는 채널로 전환하기 위한 제어 신호를 생성하여 방송 수신 장치(100)로 전송하도록 제어할 수 있다.
또한, 제어부(330)는 저장부(320)에 화행, 주행 및 핵심 요소를 이용하여 방송 수신 장치(100)로부터 수신된 텍스트 정보에 대한 문형을 분석하고, 텍스트 정보에 대응되는 사용자의 발화 의도를 파악하고, 사용자의 발화 의도에 대응되는 제어 신호 및/또는 답변을 응답 정보로서 생성할 수 있다.
예를 들어, "○○○(방송 채널 명)를 틀어줘"라는 텍스트가 방송 수신 장치(100)로부터 수신된 경우를 가정한다. 이 경우, 제어부(330)는 화행을 통해 수신된 텍스트가 "요청"과 관련된 문장 형태인 것으로 판단하고, 주행 및 핵심 요소를 통해 "○○○"로의 "채널 전환"을 원하는 것으로 판단한다. 결과적으로, 제어부(330)는 수신된 텍스트 정보에 대응되는 사용자의 발화 의도는 "○○○"로의 "채널 전환"을 "요청"하는 것으로 판단할 수 있다.
이에 따라, 제어부(330)는 "○○○"로의 "채널 전환"을 "요청"하는 사용자의 발화 의도에 대해 방송 수신 장치(100)에서 "○○○"로의 채널 전환을 수행하기 위한 제어 신호를 생성할 수 있다.
이 경우, ○○○에 대응되는 방송 채널 정보는 저장부(310)에 기 저장된 정보 즉, 방송 채널 정보와 사용자 발화 채널 명이 매핑된 정보에 기초하여 판단될 수 있다. 예를 들어, 도 6을 참고하면, 울산 지역에서 "SBS"라는 사용자 발화 채널 명에 대응되는 방송 채널 정보는 "6-1"이므로 제어부(330)는 "6-1"로의 채널 전환을 수행하기 위한 제어 명령을 생성할 수 있다.
또한, 제어부(330)는 발화 의도가 채널 전환을 요청하는 것으로 판단되면, "○○○"에 정확히 일치하는 검색 결과에 기초하여 채널 전환을 수행할 수 있다. 예를 들어, ○○○가 "SBS" 이고 저장부(310)에 SBS, SBS 모닝 와이드, SBS 뉴스 등의 MBC를 포함하는 콘텐츠 정보가 저장되어 있는 경우, "SBS"를 포함하는 모든 값을 검색 결과로 처리하는 대신 "SBS" 에 정확히 대응되는 값 만을 검색 결과로 처리하게 되므로 "SBS 모닝 와이드, SBS 뉴스" 등의 정보는 채널 전환을 위한 검색 결과에서 배제시킬 수 있다. 이에 따라 사용자 의도에 부합하는 정확하고, 신속한 채널 전환이 가능하게 된다. 이를 위해 제어부(330)는 ○○○가 "SBS" 즉, 사용자가 일반적으로 방송 채널을 호출하는 사용자 발화 채널 명으로 판단된 경우, 저장부(310)에 저장된 방송 채널 정보와 사용자 발화 채널 명이 매핑된 테이블에 기초하여 채널 전환이 이루어지도록 할 수 있다.
도 6은 본 발명의 일 실시 예에 따른 채널 매핑 테이블을 나타내는 도면이다.
도 6에 도시된 바와 같이 채널 매핑 테이블은 국가 단위 각 지역에서 방송되는 모든 채널에 대한 정보를 가지고 있다. 여기서, "사용자 호출 방법" 필드(610)는 각 채널 명에 대한 고유의 방송 식별자와 사용자가 통상적으로 발화할 수 있는 사용자 발화 채널 명에 대한 복수의 후보 리스트를 나열한 것이다.
본 발명의 일 실시 예에 따르면, 발화 채널 명 검색 대상 DB에 사용되어 종래에 방송 정보 기반으로 구출된 채널 DB 중 발화 채널 명을 포함하는 모든 값을 결과로 처리하는 방식 대신, "사용자 호출 방법" 필드 만을 검색하므로 사용자 발화 채널 명과 정확히 일치하는 값을 추출할 수 있다.
한편, "embedded" 필드(620)는 채널 매핑이 임베디드 구성에서 지원되는 것인지, 대화형 서버에서 지원되는 것인지를 나타낼 수 있다.
예를 들어, "embedded" 값이 "1"인 채널은 방송 수신 장치(100)의 임베디드 구성에서 지원하는 주요 채널들을 나타내고, "0"인 채널은 임베디드 구성 외 대화형 서버에서 지원하는 채널들을 나타낼 수 있다.
다만, 상술한 실시 예는 일 예에 불과하며 "embedded" 값의 설정 여부, 설정 값 등은 구현 예에 따라 변경 가능하며, 테이블의 형태 등도 구현 예에 따라 다양하게 변경 가능하다. 예를 들어, "O'LIVE TV"의 방송 정보에 대응되는 사용자 호출 방법 필드에서 "올리브"라는 발화 채널 명이 추가적으로 포함될 수 있다.
도 7은 본 발명의 일 실시 예에 따른 음성 인식에 따른 채널 전환을 위한 알고리즘 형태를 설명하기 위한 도면이다.
도 7(a)는 종래 기술에 따른 알고리즘으로 SBS의 경우, 서울 이외의 지역에서 방송 정보 내 채널 명이 변경되어 음성 인식 기능을 제공하는데 어려움이 있음을 확인할 수 있다. 즉, 중앙 방송이 지역 방송국에 의해 재송출되는 경우 방송 정보 내 채널 명이 변경되는 경우 음성 인식 기능에 의한 채널 전환 기능이 제대로 동작하지 않거나, 재전송 과정에서 고유의 채널 번호가 변경되는 경우 다른 채널로 변경되는 문제점이 야기될 수 있다.
도 7(b)는 본원 발명의 일 실시 예에 따른 알고리즘으로 울산, 강원 지역에서 SBS 방송에 대한 사용자 호출 입력시 매핑 방법에 대한 알고리즘을 나타낸다. 또한, 울산 지역에서 아날로그 채널 "CH-T"에 대한 사용자 호출 입력시 매핑 방법에 대한 알고리즘을 나타낸다.
즉, 본 발명의 일 실시 예에 따른 도 6에 도시된 채널 매핑 테이블에서 "사용자 호출 방법" 필드에 의해 종래의 중앙 방송이 지역 방송국에 의해 재송출되어 방송 정보 내 채널 명이 변경되는 경우로 인한 채널 전환 문제점을 해결할 수 있게 된다.
도 8은 본 발명의 일 실시 예에 따른 대화형 시스템의 동작을 설명하기 위한 도면이다.
도 8에 도시된 실시 예에서는 방송 수신 장치(100)가 대화형 TV(100')로, 제1 서버(200)가 ASR 서버(200')로, 제2 서버(300)가 대화형 서버(300')로 구현되며, 컨텐츠 서버(400)가 별도로 구현되는 경우에 대해 설명하도록 한다.
우선, 대화형 TV(100')는 사용자 음성이 수신되면(S810), 수신된 사용자 음성을 ASR 서버(200')로 전송한다(S820). 여기서, 사용자 음성은 방송 채널 명을 포함하는 음성이 될 수 있다.
대화형 TV(100')는 ASR 서버(200')로부터 사용자 음성에 대응되는 텍스트 정보가 수신되면(S830), 수신된 텍스트 정보를 대화형 서버(300')로 전송한다(S840).
이 경우, 대화형 서버(300')는 수신된 텍스트 정보에 포함된 의도를 판단하고, 판단된 의도에 기초하여 컨텐츠 서버(400)를 검색할 수 있다(S850). 여기서, 컨텐츠 서버(400)는 컨텐츠를 보유하는 데이터 서버로 채널 정보를 저장하는 채널 DB(410) 및 컨텐츠 정보 즉, 프로그램 정보를 저장하는 컨텐츠 DB(420)를 포함할 수 있다. 이 경우, 컨텐츠 서버(400)는 채널 DB(410) 및 컨텐츠 DB(420)를 통해 정확히 "MBC"와 일치하는 결과 만을 추출하게 된다. 즉, 채널 DB(410)에 저장된 도 6에 도시된 바와 같은 채널 매핑 테이블을 통해 정확히 "MBC"와 일치하는 결과 만을 추출하게 된다. 이에 따라 컨텐츠 DB(420) 내에 포함된 "MBC 아침마당", "MBC 뉴스", "MBC 스포츠" 등의 "MBC" 문자열을 포함하는 컨텐츠는 결과로 검색되지 않으므로 정확한 채널 검색 결과를 얻을 수 있게 된다.
또한, 컨텐츠 서버(400)는 다양한 정보를 저장하는 웹 서버 형태로 구현될 수 있다. 예를 들어, 수신된 텍스트 정보에 기초하여 웹 검색을 수행하고 검색 결과를 대화형 서버(300')로 전송할 수 있다.
한편, 대화형 서버(300')가 수신된 텍스트 정보에 기초하여 사용자 의도를 판단하는 구체적인 방법에 대해서는 도 3(b)에서 설명하였으므로 자세한 설명을 생략하도록 한다.
이어서, 컨텐츠 서버(400)를 통해 텍스트 정보에 대응되는 컨텐츠가 검색되면(S860), 검색 결과에 기초한 제어 신호를 대화형 TV(100')로 전송한다(S870).
한편, 상술한 실시 예에서는, 컨텐츠를 관리 및 저장하는 컨텐츠 서버(400)가 별도로 구현된 경우를 상정하여 설명하였지만, 도 1에서 설명한 바와 같이 컨텐츠 서버(400)가 별도로 구현되지 않고, 대화형 서버(300')가 컨텐츠를 관리 및 저장하도록 구현하는 것도 가능하다.
도 9는 본 발명의 일 실시 예에 따른 방송 수신 장치의 제어 방법을 설명하기 위한 흐름도이다.
도 9에 도시된 방송 수신 장치의 제어 방법에 따르면, 우선 채널 명을 포함하는 사용자의 발화 음성을 수신하면(S910), 수신된 사용자의 발화 음성을 제1 서버로 전송한다(S920).
이어서, 제1 서버로부터 사용자의 발화 음성에 대응되는 텍스트 정보가 수신되면(S930), 방송 수신 장치에 기 저장된 방송 채널 정보와 사용자 발화 채널 명이 매핑된 정보에 기초하여 텍스트 정보에 대응되는 사용자 발화 채널 명을 판단한다(S940).
이후, 검색된 발화 채널 명과 매핑되는 방송 채널 정보에 대응되는 채널로 전환한다(S950).
S940 단계에서 텍스트 정보에 대응되는 정보를 저장된 정보에 기초하여 판단할 수 없는 경우, 텍스트 정보를 제2 서버로 전송하고, 제2 서버로부터 텍스트 정보에 대응되는 채널로 전환하기 위한 제어 신호를 수신할 수 있다. 여기서, 제2 서버는 방송 채널 정보와 사용자 발화 채널 명이 매핑된 정보를 저장하는 DB를 구비할 수 있으며, DB에서 수신된 텍스트 정보에 대응되는 사용자 발화 채널 명을 검색할 수 있다.
또한, 텍스트 정보에 대한 문형 분석을 통해 사용자 발화 의도를 판단하는 단계를 더 포함할 수 있으며, S950 단계에서는 사용자 발화 의도가 채널 전환인 것으로 판단되면, 판단된 발화 채널 명과 매핑되는 방송 채널 정보에 대응되는 채널로 전환할 수 있다.
또한, 텍스트 정보에 대한 문형 분석을 통해 사용자 발화 의도를 판단할 수 없는 경우 텍스트 정보를 제2 서버로 전송하고, 제2 서버에서 사용자 발화 의도가 채널 전환인 것으로 판단되면 제2 서버로부터 텍스트 정보에 대응되는 채널로 전환하기 위한 제어 신호를 수신할 수 있다.
또한, 기설정된 이벤트에 따라 외부로부터 수신된 방송 채널 정보에 기초하여 방송 채널 정보가 변경되면, 변경된 방송 채널 정보로 저장된 방송 채널 정보를 업데이트할 수 있다.
여기서, 사용자 발화 채널 명은 사용자가 일반적으로 해당 방송 채널 정보에 대응되는 채널의 명칭으로 발화하는 후보 채널 명을 포함하며, 방송 채널 정보는 방송 채널 명칭 및 방송 채널 번호 중 적어도 하나를 포함할 수 있다.
도 10은 본 발명의 일 실시 예에 따른 서버의 제어 방법을 설명하기 위한 흐름도이다.
도 10에 도시된 서버의 제어 방법에 따르면, 방송 수신 장치로부터 채널 명을 포함하는 사용자 발화 음성에 대응되는 텍스트 정보를 수신하면(S1010), 서버에 기 저장된 방송 채널 정보와 사용자 발화 채널 명이 매핑된 정보에 기초하여 텍스트 정보에 대응되는 사용자 발화 채널 명을 판단한다(S1020).
이어서, 판단된 발화 채널 명에 매핑되는 방송 채널 정보에 대응되는 채널로 전환하기 위한 제어 명령을 방송 수신 장치로 전송한다(S1030).
또한, 텍스트 정보에 대한 문형 분석을 통해 사용자 발화 의도를 판단하는 단계를 더 포함하며, S1030 단계에서는, 사용자 발화 의도가 채널 전환인 것으로 판단되면 판단된 발화 채널 명과 매핑되는 방송 채널 정보에 대응되는 채널로 전환하기 위한 제어 신호를 전송할 수 있다.
또한, 기설정된 이벤트에 따라 외부로부터 수신된 방송 채널 정보에 기초하여 방송 채널 정보가 변경되면, 변경된 방송 채널 정보로 저장된 방송 채널 명을 업데이트할 수 있다.
이 경우, 텍스트 정보는, 사용자의 발화 음성이 ARS 서버를 통해 텍스트로 변환된 정보가 될 수 있다.
또한, 사용자 발화 채널 명은 사용자가 일반적으로 해당 방송 채널 정보에 대응되는 채널의 명칭으로 발화하는 후보 채널 명을 포함하며, 방송 채널 정보는 방송 채널 명칭 및 방송 채널 번호 중 적어도 하나를 포함할 수 있다.
이에 따라 빠르고 정확한 채널 전환이 가능하게 된다.
한편, 상술한 다양한 실시 예에 따른 제어 방법은 프로그램으로 구현되어 방송 수신 장치에 제공될 수 있다.
일 예로, 채널 명을 포함하는 사용자의 발화 음성을 수신하는 단계, 수신된 사용자의 발화 음성을 제1 서버로 전송하는 단계, 제1 서버로부터 사용자의 발화 음성에 대응되는 텍스트 정보가 수신되면, 기 저장된 방송 채널 정보와 사용자 발화 채널 명이 매핑된 정보에 기초하여 텍스트 정보에 대응되는 사용자 발화 채널 명을 판단하는 단계 및, 판단된 발화 채널 명과 매핑되는 방송 채널 정보에 대응되는 채널로 전환하는 단계를 수행하는 프로그램이 저장된 비일시적 판독 가능 매체(non-transitory computer readable medium)가 제공될 수 있다.
비일시적 판독 가능 매체란 레지스터, 캐쉬, 메모리 등과 같이 짧은 순간 동안 데이터를 저장하는 매체가 아니라 반영구적으로 데이터를 저장하며, 기기에 의해 판독(reading)이 가능한 매체를 의미한다. 구체적으로는, 상술한 다양한 어플리케이션 또는 프로그램들은 CD, DVD, 하드 디스크, 블루레이 디스크, USB, 메모리카드, ROM 등과 같은 비일시적 판독 가능 매체에 저장되어 제공될 수 있다.
또한, 이상에서는 본 발명의 바람직한 실시예에 대하여 도시하고 설명하였지만, 본 발명은 상술한 특정의 실시예에 한정되지 아니하며, 청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 기술분야에서 통상의 지식을 가진자에 의해 다양한 변형실시가 가능한 것은 물론이고, 이러한 변형실시들은 본 발명의 기술적 사상이나 전망으로부터 개별적으로 이해되어져서는 안될 것이다.
100 : 방송 수신 장치 110 : 저장부
120 : 음성 수신부 130 : 제1 통신부
140 : 제2 통신부 150 : 제어부

Claims (20)

  1. 방송 수신 장치에 있어서,
    방송 채널 정보와 사용자 발화 채널 명이 매핑된 정보를 저장하는 저장부;
    채널 명을 포함하는 사용자의 발화 음성을 수신하는 음성 수신부;
    상기 수신된 사용자의 발화 음성을 제1 서버로 전송하는 제1 통신부; 및
    상기 제1 서버로부터 상기 사용자의 발화 음성에 대응되는 텍스트 정보가 수신되면 상기 저장부로부터 상기 텍스트 정보에 대응되는 사용자 발화 채널 명을 검색하고, 상기 검색된 발화 채널 명과 매핑되는 방송 채널 정보에 대응되는 채널로 전환하도록 제어하는 제어부;를 포함하는 방송 수신 장치.
  2. 제1항에 있어서,
    방송 채널 정보와 사용자 발화 채널 명이 매핑된 정보를 저장하는 제2 서버와 통신을 수행하는 제2 통신부;를 더 포함하며,
    상기 제어부는,
    상기 텍스트 정보에 대응되는 정보를 상기 저장부로부터 검색할 수 없는 경우 상기 텍스트 정보를 상기 제2 서버로 전송하고, 상기 제2 서버로부터 상기 텍스트 정보에 대응되는 채널로 전환하기 위한 제어 신호를 수신하는 것을 특징으로 하는 방송 수신 장치.
  3. 제1항에 있어서,
    상기 제어부는,
    상기 텍스트 정보에 대한 문형 분석을 통해 사용자 발화 의도를 판단하고, 사용자 발화 의도가 채널 전환인 것으로 판단되면 상기 검색된 발화 채널 명과 매핑되는 방송 채널 정보에 대응되는 채널로 전환하도록 제어하는 것을 특징으로 하는 방송 수신 장치.
  4. 제1항에 있어서,
    상기 제어부는,
    상기 텍스트 정보에 대한 문형 분석을 통해 사용자 발화 의도를 판단할 수 없는 경우 상기 텍스트 정보를 제2 서버로 전송하고, 상기 제2 서버에서 상기 사용자 발화 의도가 채널 전환인 것으로 판단되면 상기 제2 서버로부터 상기 텍스트 정보에 대응되는 채널로 전환하기 위한 제어 신호를 수신하는 것을 특징으로 하는 방송 수신 장치.
  5. 제1항에 있어서,
    상기 제어부는,
    기설정된 이벤트에 따라 외부로부터 수신된 방송 채널 정보에 기초하여 상기 방송 채널 정보가 변경되면, 변경된 방송 채널 정보로 상기 저장된 방송 채널 정보를 업데이트하는 것을 특징으로 하는 방송 수신 장치.
  6. 제1항에 있어서,
    상기 사용자 발화 채널 명은 사용자가 일반적으로 해당 방송 채널 정보에 대응되는 채널의 명칭으로 발화하는 후보 채널 명을 포함하며, 상기 방송 채널 정보는 방송 채널 명칭 및 방송 채널 번호 중 적어도 하나를 포함하는 것을 특징으로 하는 방송 수신 장치.
  7. 방송 수신 장치와 통신을 수행하는 서버에 있어서,
    방송 수신 장치와 통신을 수행하는 통신부;
    방송 채널 정보와 사용자 발화 채널 명이 매핑된 정보를 저장하는 저장부; 및
    상기 방송 수신 장치로부터 채널 명을 포함하는 사용자 발화 음성에 대응되는 텍스트 정보가 수신되면 상기 저장부로부터 상기 텍스트 정보에 대응되는 사용자 발화 채널 명을 검색하고, 상기 검색된 발화 채널 명과 매핑되는 방송 채널 정보에 대응되는 채널로 전환하기 위한 제어 신호를 상기 방송 수신 장치로 전송하도록 제어하는 제어부;를 포함하는 서버.
  8. 제7항에 있어서,
    상기 제어부는,
    상기 텍스트 정보에 대한 문형 분석을 통해 사용자 발화 의도를 판단하고, 사용자 발화 의도가 채널 전환인 것으로 판단되면 상기 텍스트 정보에 대응되는 채널로 전환하기 위한 제어 신호를 상기 방송 수신 장치로 전송하도록 제어하는 것을 특징으로 하는 방송 수신 장치.
  9. 제7항에 있어서,
    상기 제어부는,
    기설정된 이벤트에 따라 외부로부터 수신된 방송 채널 정보에 기초하여 상기 방송 채널 정보가 변경되면, 변경된 방송 채널 정보로 상기 저장된 방송 채널 명을 업데이트하는 것을 특징으로 하는 서버.
  10. 제7항에 있어서,
    상기 사용자 발화 채널 명은 사용자가 일반적으로 해당 방송 채널 정보에 대응되는 채널의 명칭으로 발화하는 후보 채널 명을 포함하며, 상기 방송 채널 정보는 방송 채널 명칭 및 방송 채널 번호 중 적어도 하나를 포함하는 것을 특징으로 하는 서버.
  11. 방송 수신 장치의 제어 방법에 있어서,
    채널 명을 포함하는 사용자의 발화 음성을 수신하는 단계;
    상기 수신된 사용자의 발화 음성을 제1 서버로 전송하는 단계;
    상기 제1 서버로부터 상기 사용자의 발화 음성에 대응되는 텍스트 정보가 수신되면, 기 저장된 방송 채널 정보와 사용자 발화 채널 명이 매핑된 정보에 기초하여 상기 텍스트 정보에 대응되는 사용자 발화 채널 명을 판단하는 단계; 및
    상기 판단된 발화 채널 명과 매핑되는 방송 채널 정보에 대응되는 채널로 전환하는 단계;를 포함하는 제어 방법.
  12. 제11항에 있어서,
    상기 텍스트 정보에 대응되는 정보를 상기 저장된 정보에 기초하여 판단할 수 없는 경우, 상기 텍스트 정보를 방송 채널 정보와 사용자 발화 채널 명이 매핑된 정보를 저장하는 제2 서버로 전송하는 단계; 및
    상기 제2 서버로부터 상기 텍스트 정보에 대응되는 채널로 전환하기 위한 제어 신호를 수신하는 단계;를 더 포함하는 것을 특징으로 하는 제어 방법.
  13. 제11항에 있어서,
    상기 텍스트 정보에 대한 문형 분석을 통해 사용자 발화 의도를 판단하는 단계;를 더 포함하며,
    상기 전환하는 단계는,
    사용자 발화 의도가 채널 전환인 것으로 판단되면 상기 판단된 발화 채널 명과 매핑되는 방송 채널 정보에 대응되는 채널로 전환하는 것을 특징으로 하는 제어 방법.
  14. 제11항에 있어서,
    상기 텍스트 정보에 대한 문형 분석을 통해 사용자 발화 의도를 판단할 수 없는 경우 상기 텍스트 정보를 제2 서버로 전송하는 단계; 및,
    상기 제2 서버에서 상기 사용자 발화 의도가 채널 전환인 것으로 판단되면 상기 제2 서버로부터 상기 텍스트 정보에 대응되는 채널로 전환하기 위한 제어 신호를 수신하는 단계;를 더 포함하는 것을 특징으로 하는 제어 방법.
  15. 제11항에 있어서,
    기설정된 이벤트에 따라 외부로부터 수신된 방송 채널 정보에 기초하여 상기 방송 채널 정보가 변경되면, 변경된 방송 채널 정보로 상기 저장된 방송 채널 정보를 업데이트하는 단계;를 더 포함하는 것을 특징으로 하는 제어 방법.
  16. 제11항에 있어서,
    상기 사용자 발화 채널 명은 사용자가 일반적으로 해당 방송 채널 정보에 대응되는 채널의 명칭으로 발화하는 후보 채널 명을 포함하며, 상기 방송 채널 정보는 방송 채널 명칭 및 방송 채널 번호 중 적어도 하나를 포함하는 것을 특징으로 하는 제어 방법.
  17. 방송 수신 장치와 통신을 수행하는 서버의 제어 방법에 있어서,
    방송 수신 장치로부터 채널 명을 포함하는 사용자 발화 음성에 대응되는 텍스트 정보를 수신하는 단계;
    기저장된 방송 채널 정보와 사용자 발화 채널 명이 매핑된 정보에 기초하여 상기 텍스트 정보에 대응되는 사용자 발화 채널 명을 판단하는 단계; 및
    상기 판단된 발화 채널 명과 매핑되는 방송 채널 정보에 대응되는 채널로 전환하기 위한 제어 신호를 상기 방송 수신 장치로 전송하는 단계;를 포함하는 제어 방법.
  18. 제17항에 있어서,
    상기 텍스트 정보에 대한 문형 분석을 통해 사용자 발화 의도를 판단하는 단계;를 더 포함하며,
    상기 전송하는 단계는,
    사용자 발화 의도가 채널 전환인 것으로 판단되면 상기 판단된 발화 채널 명과 매핑되는 방송 채널 정보에 대응되는 채널로 전환하기 위한 제어 신호를 전송하는 것을 특징으로 하는 제어 방법.
  19. 제17항에 있어서,
    기설정된 이벤트에 따라 외부로부터 수신된 방송 채널 정보에 기초하여 상기 방송 채널 정보가 변경되면, 변경된 방송 채널 정보로 상기 저장된 방송 채널 명을 업데이트하는 단계;를 더 포함하는 것을 특징으로 하는 제어 방법.
  20. 제17항에 있어서,
    상기 사용자 발화 채널 명은 사용자가 일반적으로 해당 방송 채널 정보에 대응되는 채널의 명칭으로 발화하는 후보 채널 명을 포함하며, 상기 방송 채널 정보는 방송 채널 명칭 및 방송 채널 번호 중 적어도 하나를 포함하는 것을 특징으로 하는 제어 방법.
KR1020120122500A 2012-10-31 2012-10-31 방송 수신 장치, 서버 및 그 제어 방법 KR20140055502A (ko)

Priority Applications (8)

Application Number Priority Date Filing Date Title
KR1020120122500A KR20140055502A (ko) 2012-10-31 2012-10-31 방송 수신 장치, 서버 및 그 제어 방법
PCT/KR2013/009291 WO2014069820A1 (en) 2012-10-31 2013-10-17 Broadcast receiving apparatus, server and control methods thereof
US14/059,540 US20140123185A1 (en) 2012-10-31 2013-10-22 Broadcast receiving apparatus, server and control methods thereof
EP13189835.5A EP2728890A3 (en) 2012-10-31 2013-10-23 Broadcast receiving apparatus, server and control methods thereof
MX2013012670A MX2013012670A (es) 2012-10-31 2013-10-30 Aparato receptor de emision, servidor y metodos de control de los mismos.
JP2013225009A JP2014093778A (ja) 2012-10-31 2013-10-30 放送受信装置、サーバおよびその制御方法
BR102013028161-1A BR102013028161A2 (pt) 2012-10-31 2013-10-31 Diffusion reception apparatus, server and control methods thereof
CN201310533180.5A CN103796044A (zh) 2012-10-31 2013-10-31 广播接收设备、服务器及其控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020120122500A KR20140055502A (ko) 2012-10-31 2012-10-31 방송 수신 장치, 서버 및 그 제어 방법

Publications (1)

Publication Number Publication Date
KR20140055502A true KR20140055502A (ko) 2014-05-09

Family

ID=49518662

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020120122500A KR20140055502A (ko) 2012-10-31 2012-10-31 방송 수신 장치, 서버 및 그 제어 방법

Country Status (8)

Country Link
US (1) US20140123185A1 (ko)
EP (1) EP2728890A3 (ko)
JP (1) JP2014093778A (ko)
KR (1) KR20140055502A (ko)
CN (1) CN103796044A (ko)
BR (1) BR102013028161A2 (ko)
MX (1) MX2013012670A (ko)
WO (1) WO2014069820A1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10334321B2 (en) 2016-12-08 2019-06-25 Samsung Electronics Co., Ltd. Display apparatus and method for acquiring channel information of a display apparatus
US10832669B2 (en) 2016-11-24 2020-11-10 Samsung Electronics Co., Ltd. Electronic device and method for updating channel map thereof

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102057975B1 (ko) * 2013-06-03 2019-12-20 삼성전자주식회사 디스플레이 장치의 기능 확장 키트 및 제어 방법
KR20160060243A (ko) * 2014-11-19 2016-05-30 한국전자통신연구원 고객 응대 서비스 장치 및 방법
CN104468010A (zh) * 2014-12-16 2015-03-25 上海斐讯数据通信技术有限公司 智能终端及其电台搜索方法
JP6865542B2 (ja) * 2016-07-15 2021-04-28 シャープ株式会社 受信装置、受信方法及びプログラム
KR102371313B1 (ko) 2017-05-29 2022-03-08 삼성전자주식회사 사용자 발화를 처리하는 전자 장치 및 그 전자 장치의 제어 방법
KR102453833B1 (ko) * 2018-05-10 2022-10-14 삼성전자주식회사 전자 장치 및 그 제어 방법
CN111312253A (zh) * 2018-12-11 2020-06-19 青岛海尔洗衣机有限公司 语音控制方法、云端服务器及终端设备
CN111312234A (zh) * 2018-12-11 2020-06-19 青岛海尔洗衣机有限公司 语音控制方法、云端处理器及终端设备
CN110278473B (zh) * 2019-06-28 2022-04-12 高斯贝尔数码科技股份有限公司 一种基于语音识别的数字电视遥控换台方法及系统
US11019402B2 (en) 2019-09-26 2021-05-25 Dish Network L.L.C. Method and system for implementing an elastic cloud-based voice search utilized by set-top box (STB) clients
WO2022061293A1 (en) * 2020-09-21 2022-03-24 VIDAA USA, Inc. Display apparatus and signal transmission method for display apparatus

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6415257B1 (en) * 1999-08-26 2002-07-02 Matsushita Electric Industrial Co., Ltd. System for identifying and adapting a TV-user profile by means of speech technology
US6978475B1 (en) * 1999-11-24 2005-12-20 Ecable, Llc Method and apparatus for internet TV
US7096185B2 (en) * 2000-03-31 2006-08-22 United Video Properties, Inc. User speech interfaces for interactive media guidance applications
JP2003087667A (ja) * 2001-09-06 2003-03-20 Fujitsu Ten Ltd デジタル放送受信機
MY141150A (en) * 2001-11-02 2010-03-15 Panasonic Corp Channel selecting apparatus utilizing speech recognition, and controling method thereof
KR100513293B1 (ko) * 2002-12-28 2005-09-09 삼성전자주식회사 음성 입력 리모컨을 이용한 방송 컨텐츠 검색 시스템 및방법
WO2005029289A2 (en) * 2003-09-18 2005-03-31 Agile Tv Corporation Dual compression voice recordation non-repudiation system
US8635073B2 (en) * 2005-09-14 2014-01-21 At&T Intellectual Property I, L.P. Wireless multimodal voice browser for wireline-based IPTV services
JP4887911B2 (ja) * 2006-05-31 2012-02-29 船井電機株式会社 電子機器
US8175885B2 (en) * 2007-07-23 2012-05-08 Verizon Patent And Licensing Inc. Controlling a set-top box via remote speech recognition
CN101516005A (zh) * 2008-02-23 2009-08-26 华为技术有限公司 一种语音识别频道选择系统、方法及频道转换装置
WO2011125066A1 (en) * 2010-04-09 2011-10-13 Balajee Rajaram A cost effective communication device
KR20110114997A (ko) * 2010-04-14 2011-10-20 한국전자통신연구원 자동 키워드 검출을 통한 방송서비스 제공장치 및 그 방법
US8522283B2 (en) * 2010-05-20 2013-08-27 Google Inc. Television remote control data transfer
KR20120010818A (ko) * 2010-07-27 2012-02-06 주식회사 파인디지털 정보 단말기 및 이를 위한 채널 전환 방법
KR20120082583A (ko) * 2011-01-14 2012-07-24 삼성전자주식회사 터치 스크린을 구비한 단말기 및 그 단말기에서 터치 이벤트에 따른 디지털 방송 제어 방법
KR20120090524A (ko) * 2011-02-08 2012-08-17 엘지전자 주식회사 방송 수신기 및 방송 서비스 제공 방법
US9031848B2 (en) * 2012-08-16 2015-05-12 Nuance Communications, Inc. User interface for searching a bundled service content data source

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10832669B2 (en) 2016-11-24 2020-11-10 Samsung Electronics Co., Ltd. Electronic device and method for updating channel map thereof
US10334321B2 (en) 2016-12-08 2019-06-25 Samsung Electronics Co., Ltd. Display apparatus and method for acquiring channel information of a display apparatus

Also Published As

Publication number Publication date
EP2728890A2 (en) 2014-05-07
US20140123185A1 (en) 2014-05-01
WO2014069820A1 (en) 2014-05-08
JP2014093778A (ja) 2014-05-19
BR102013028161A2 (pt) 2017-07-11
MX2013012670A (es) 2014-05-09
EP2728890A3 (en) 2014-11-12
CN103796044A (zh) 2014-05-14

Similar Documents

Publication Publication Date Title
KR20140055502A (ko) 방송 수신 장치, 서버 및 그 제어 방법
EP2674941B1 (en) Terminal apparatus and control method thereof
US20190333515A1 (en) Display apparatus, method for controlling the display apparatus, server and method for controlling the server
EP2919472A1 (en) Display apparatus, method for controlling display apparatus, and interactive system
KR101914708B1 (ko) 서버 및 서버의 제어 방법
US20140196092A1 (en) Dialog-type interface apparatus and method for controlling the same
KR20140089862A (ko) 디스플레이 장치 및 그의 제어 방법
KR20140093303A (ko) 디스플레이 장치 및 그의 제어 방법
EP3833036A1 (en) Display apparatus, electronic device, interactive system, and controlling methods thereof
CN103546763A (zh) 用于提供内容信息的方法和广播接收设备
KR20180014137A (ko) 디스플레이 장치 및 그의 제어 방법
KR102160756B1 (ko) 디스플레이 장치 및 디스플레이 장치의 제어 방법
KR20140026220A (ko) 단말 장치 및 단말 장치의 제어 방법
KR102182689B1 (ko) 서버 및 그의 제어 방법
KR20190099676A (ko) 사용자의 발화를 기반으로 컨텐츠를 제공하는 장치 및 시스템
KR102091006B1 (ko) 디스플레이 장치 및 그의 제어 방법
KR20200133697A (ko) 서버 및 그의 제어 방법
CN118116378A (zh) 一种服务器、终端设备及语音交互方法
KR20140137263A (ko) 대화형 서버, 디스플레이 장치 및 제어 방법
KR20170038772A (ko) 디스플레이 장치 및 그의 제어 방법

Legal Events

Date Code Title Description
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid