WO2020106056A1 - 디스플레이 장치 및 그 동작 방법 - Google Patents

디스플레이 장치 및 그 동작 방법

Info

Publication number
WO2020106056A1
WO2020106056A1 PCT/KR2019/015928 KR2019015928W WO2020106056A1 WO 2020106056 A1 WO2020106056 A1 WO 2020106056A1 KR 2019015928 W KR2019015928 W KR 2019015928W WO 2020106056 A1 WO2020106056 A1 WO 2020106056A1
Authority
WO
WIPO (PCT)
Prior art keywords
fingerprint
video
server
audio
extracted
Prior art date
Application number
PCT/KR2019/015928
Other languages
English (en)
French (fr)
Inventor
조종명
정태웅
Original Assignee
삼성전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자 주식회사 filed Critical 삼성전자 주식회사
Priority to US17/290,551 priority Critical patent/US11722708B2/en
Publication of WO2020106056A1 publication Critical patent/WO2020106056A1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs
    • H04N21/23418Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/8126Monomedia components thereof involving additional data, e.g. news, sports, stocks, weather forecasts
    • H04N21/8133Monomedia components thereof involving additional data, e.g. news, sports, stocks, weather forecasts specifically related to the content, e.g. biography of the actors in a movie, detailed information about an article seen in a video program
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/233Processing of audio elementary streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/27Server based end-user applications
    • H04N21/278Content descriptor database or directory service for end-user access
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/4302Content synchronisation processes, e.g. decoder synchronisation
    • H04N21/4307Synchronising the rendering of multiple content streams or additional data on devices, e.g. synchronisation of audio on a mobile phone with the video output on the TV screen
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • H04N21/4394Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs
    • H04N21/44008Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/462Content or additional data management, e.g. creating a master electronic program guide from data received from the Internet and a Head-end, controlling the complexity of a video stream by scaling the resolution or bit-rate based on the client capabilities
    • H04N21/4622Retrieving content or additional data from different sources, e.g. from a broadcast channel and the Internet
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/472End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
    • H04N21/4722End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for requesting additional data associated with the content
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/65Transmission of management data between client and server
    • H04N21/654Transmission by server directed to the client
    • H04N21/6547Transmission by server directed to the client comprising parameters, e.g. for client setup
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/65Transmission of management data between client and server
    • H04N21/658Transmission by the client directed to the server
    • H04N21/6581Reference data, e.g. a movie identifier for ordering a movie or a product identifier in a home shopping application
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/85Assembly of content; Generation of multimedia applications
    • H04N21/854Content authoring
    • H04N21/8547Content authoring involving timestamps for synchronizing content

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Computer Security & Cryptography (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Controls And Circuits For Display Device (AREA)

Abstract

디스플레이; 통신부; 하나 이상의 인스트럭션을 포함하는 메모리; 및 상기 메모리에 저장된 하나 이상의 인스트럭션을 실행하는 프로세서를 포함하고, 상기 프로세서는 상기 하나 이상의 인스트럭션을 실행함으로써, 상기 디스플레이에서 표시되는 컨텐츠의 비디오 핑거프린트를 추출하고, 상기 추출된 비디오 핑거프린트를 서버에 송신하고, 상기 서버로부터 상기 서버에 저장된 비디오 핑거프린트들과 상기 추출된 비디오 핑거프린트의 매칭 결과를 포함하는 제1 응답을 수신하고, 상기 제1 응답에 따라, 상기 추출된 비디오 핑거프린트가 상기 서버에 저장된 복수의 비디오 핑거프린트들과 매칭된 경우, 상기 디스플레이에서 표시되는 컨텐츠의 오디오 핑거프린트를 추출하고, 상기 추출된 오디오 핑거프린트를 상기 서버에 송신하고, 상기 서버로부터 상기 서버에 저장된 오디오 핑거프린트들과 상기 추출된 오디오 핑거프린트의 매칭 결과를 포함하는 제2 응답을 수신하도록 제어하는, 디스플레이 장치가 개시된다.

Description

디스플레이 장치 및 그 동작 방법
본 개시의 다양한 실시예들은 디스플레이 장치 및 그 동작 방법에 관한 것으로, 보다 구체적으로는 컨텐츠의 비디오 핑거프린트 및 오디오 핑거프린트를 이용하여 컨텐츠에 대한 정보를 획득하기 위한 디스플레이 장치 및 그 동작 방법에 관한 것이다.
디스플레이 장치는 사용자가 시청할 수 있는 영상을 표시하는 기능을 갖춘 장치이다. 사용자는 디스플레이 장치를 통하여 방송을 시청할 수 있다. 디스플레이 장치는 방송국에서 송출되는 방송신호 중 사용자가 선택한 방송을 디스플레이에 표시한다. 또한 디스플레이 장치는 인터넷 등의 네트워크 통신을 통하여 다양한 멀티미디어 컨텐츠를 수신해 디스플레이에 표시한다.
디스플레이 장치는 핑거프린팅 방식을 이용하여 디스플레이에 표시되는 컨텐츠의 식별 정보 및 컨텐츠와 관련된 정보를 획득할 수 있다. 컨텐츠는 컨텐츠로부터 비디오 핑거프린트 또는 오디오 핑거프린트를 추출하고, 서버에 기 저장된 핑거프린트와 매칭함으로써 식별될 수 있다.
한편, 복수의 컨텐츠가 서로 영상이 동일하고 오디오가 상이한 경우 비디오 핑거프린트 매칭만으로 컨텐츠 식별이 어려울 수 있으나, 영상이 서로 상이한 경우 비디오 핑거프린트의 매칭만으로 컨텐츠가 식별될 수 있다.
본 개시의 다양한 실시예들은 컨텐츠의 비디오 핑거프린트가 멀티 매칭되었는지 여부에 기초하여 컨텐츠의 오디오 핑거프린트를 추출함으로써, 컨텐츠에 대한 정보를 획득하는 데에 사용되는 리소스를 저감할 수 있는 디스플레이 장치 및 그 동작 방법을 제공하는 것을 목적으로 한다.
도 1은 일부 실시예에 따른 디스플레이 장치가 디스플레이 장치의 디스플레이에 표시된 컨텐츠에 대한 정보를 획득하는 방법을 설명하기 위한 도면이다.
도 2는 일부 실시예에 따른 디스플레이 장치의 구성을 나타내는 블록도이다.
도 3은 일부 실시예에 따른 서버의 구성을 나타내는 블록도이다.
도 4는 일부 실시예에 따른 디스플레이 장치의 세부적인 구성을 나타내는 블록도이다.
도 5는 일부 실시예에 따른 디스플레이 장치가 컨텐츠의 비디오 핑거프린트가 멀티 매칭되었는지 여부에 기초하여 오디오 핑거프린트를 추출하는 방법을 설명하기 위한 흐름도이다.
도 6은 일부 실시예에 따른 디스플레이 장치가 서버로부터 컨텐츠의 비디오 핑거프린트 또는 오디오 핑거프린트 매칭 결과를 수신하는 방법을 설명하기 위한 흐름도이다.
도 7은 일부 실시예에 따른 디스플레이 장치가 컨텐츠의 비디오 핑거프린트가 멀티 매칭되었는지 여부에 기초하여 오디오 핑거프린트의 추출을 중지하는 방법을 설명하기 위한 흐름도이다.
일부 실시예에 따른 디스플레이 장치는, 디스플레이; 통신부; 하나 이상의 인스트럭션을 포함하는 메모리; 및 상기 메모리에 저장된 하나 이상의 인스트럭션을 실행하는 프로세서를 포함하고, 상기 프로세서는 상기 하나 이상의 인스트럭션을 실행함으로써, 상기 디스플레이에서 표시되는 컨텐츠의 비디오 핑거프린트를 추출하고, 상기 추출된 비디오 핑거프린트를 서버에 송신하고, 상기 서버로부터 상기 서버에 저장된 비디오 핑거프린트들과 상기 추출된 비디오 핑거프린트의 매칭 결과를 포함하는 제1 응답을 수신하고, 상기 제1 응답에 따라, 상기 추출된 비디오 핑거프린트가 상기 서버에 저장된 복수의 비디오 핑거프린트들과 매칭된 경우, 상기 디스플레이에서 표시되는 컨텐츠의 오디오 핑거프린트를 추출하고, 상기 추출된 오디오 핑거프린트를 상기 서버에 송신하고, 상기 서버로부터 상기 서버에 저장된 오디오 핑거프린트들과 상기 추출된 오디오 핑거프린트의 매칭 결과를 포함하는 제2 응답을 수신하도록 제어한다.
일부 실시예에 따르면, 상기 제2 응답은, 상기 서버에 저장된 오디오 핑거프린트들 중, 상기 추출된 비디오 핑거프린트에 매칭된 상기 복수의 비디오 핑거프린트들에 대응하는 복수의 컨텐츠에 대응하는 각각의 오디오 핑거프린트와, 상기 추출된 오디오 핑거프린트의 매칭 결과를 포함할 수 있다.
일부 실시예에 따르면, 상기 제1 응답은, 상기 추출된 비디오 핑거프린트에 매칭된 적어도 하나의 비디오 핑거프린트에 대응하는 컨텐츠에 대한 정보를 포함하고, 상기 제2 응답은, 상기 추출된 비디오 핑거프린트에 매칭된 상기 복수의 비디오 핑거프린트들 및 상기 추출된 오디오 핑거프린트에 매칭된 오디오 핑거프린트의 조합에 대응하는 컨텐츠에 대한 정보를 포함할 수 있다.
일부 실시예에 따른 디스플레이 장치는, 상기 디스플레이에서 표시되는 컨텐츠의 비디오 핑거프린트 및 오디오 핑거프린트를 소정의 시간 간격에 따라 추출하고, 상기 제1 응답에 따라, 상기 추출된 비디오 핑거프린트가 상기 서버에 저장된 복수의 비디오 핑거프린트들과 매칭된 경우, 상기 디스플레이에서 표시되는 컨텐츠의 오디오 핑거프린트를 소정의 시간 간격에 따라 추출하고, 상기 제1 응답에 따라, 상기 추출된 비디오 핑거프린트가 상기 서버에 저장된 하나의 비디오 핑거프린트와 매칭된 경우, 상기 오디오 핑거프린트의 추출을 중지할 수 있다.
일부 실시예에 따르면, 상기 제1 응답은, 상기 추출된 비디오 핑거프린트의 시간 구간 중, 상기 추출된 비디오 핑거프린트가 상기 서버에 저장된 복수의 비디오 핑거프린트들과 매칭된 시간 구간에 대한 정보를 포함하고, 상기 프로세서는, 상기 하나 이상의 인스트럭션을 실행함으로써, 상기 제1 응답에 기초하여, 상기 추출된 비디오 핑거프린트가 상기 복수의 비디오 핑거프린트들과 매칭된 시간 구간에 대해 상기 디스플레이에서 표시되는 컨텐츠의 오디오 핑거프린트를 추출할 수 있다.
일부 실시예에 따른 디스플레이 장치의 동작 방법은, 상기 디스플레이 장치의 디스플레이에서 표시되는 컨텐츠의 비디오 핑거프린트를 추출하는 동작; 상기 추출된 비디오 핑거프린트를 서버에 송신하는 동작; 상기 서버로부터 상기 서버에 저장된 비디오 핑거프린트들과 상기 추출된 비디오 핑거프린트의 매칭 결과를 포함하는 제1 응답을 수신하는 동작; 및 상기 제1 응답에 따라, 상기 추출된 비디오 핑거프린트가 상기 서버에 저장된 복수의 비디오 핑거프린트들과 매칭된 경우, 상기 디스플레이에서 표시되는 컨텐츠의 오디오 핑거프린트를 추출하고, 상기 추출된 오디오 핑거프린트를 상기 서버에 송신하고, 상기 서버로부터 상기 서버에 저장된 오디오 핑거프린트들과 상기 추출된 오디오 핑거프린트의 매칭 결과를 포함하는 제2 응답을 수신하는 동작을 포함한다.
일부 실시예에 따른 컴퓨터 프로그램 제품은, 디스플레이 장치의 디스플레이에서 표시되는 컨텐츠의 비디오 핑거프린트를 추출하는 동작; 상기 추출된 비디오 핑거프린트를 서버에 송신하는 동작; 상기 서버로부터 상기 서버에 저장된 비디오 핑거프린트들과 상기 추출된 비디오 핑거프린트의 매칭 결과를 포함하는 제1 응답을 수신하는 동작; 및 상기 제1 응답에 따라, 상기 추출된 비디오 핑거프린트가 상기 서버에 저장된 복수의 비디오 핑거프린트들과 매칭된 경우, 상기 디스플레이에서 표시되는 컨텐츠의 오디오 핑거프린트를 추출하고, 상기 추출된 오디오 핑거프린트를 상기 서버에 송신하고, 상기 서버로부터 상기 서버에 저장된 오디오 핑거프린트들과 상기 추출된 오디오 핑거프린트의 매칭 결과를 포함하는 제2 응답을 수신하는 동작을 수행하도록 하는 프로그램이 저장된 기록매체를 포함한다.
본 개시에서 사용되는 용어는 본 개시에서의 기능을 고려하면서 가능한 현재 널리 사용되는 일반적인 용어들을 선택하였으나, 이는 당 분야에 종사하는 기술자의 의도 또는 판례, 새로운 기술의 출현 등에 따라 달라질 수 있다. 또한, 특정한 경우는 출원인이 임의로 선정한 용어도 있으며, 이 경우 해당되는 발명의 설명 부분에서 상세히 그 의미를 기재할 것이다. 따라서 본 개시에서 사용되는 용어는 단순한 용어의 명칭이 아닌, 그 용어가 가지는 의미와 본 개시의 전반에 걸친 내용을 토대로 정의되어야 한다.
명세서 전체에서 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있음을 의미한다. 또한, 명세서에 기재된 "...부", "모듈" 등의 용어는 적어도 하나의 기능이나 동작을 처리하는 단위를 의미하며, 이는 하드웨어 또는 소프트웨어로 구현되거나 하드웨어와 소프트웨어의 결합으로 구현될 수 있다.
아래에서는 첨부한 도면을 참고하여 실시예들에 대하여 본 개시가 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다. 그러나 본 개시는 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본 개시를 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.
본 개시에서 "사용자"라는 용어는 제어 장치를 이용하여 영상 표시 장치의 기능 또는 동작을 제어하는 사람을 의미하며, 시청자, 관리자 또는 설치 기사를 포함할 수 있다.
본 개시에서 컨텐츠는 방송 컨텐츠, 광고 컨텐츠, 영화 컨텐츠, VOD(Video On Demand) 컨텐츠 등 다양한 종류의 멀티미디어 컨텐츠를 의미할 수 있다. 컨텐츠는 영상 신호 및/또는 오디오 신호를 포함할 수 있다. 컨텐츠를 구성하는 오디오 신호는 프레임이라고 불리는 일정한 시간 단위로 분할되어 처리될 수 있고, 컨텐츠를 구성하는 비디오 신호도 프레임이라고 불리는 일정한 단위 픽쳐로 분할되어 처리될 수 있다. 따라서 하나의 프레임에는 특정 컨텐츠 파트에 대한 오디오 신호 및/또는 비디오 신호가 포함될 수 있다.
이하에서는 도 1을 참조하여 디스플레이 장치의 동작 방법의 개념을 설명한다.
도 1은 일부 실시예에 따른 디스플레이 장치가 디스플레이 장치의 디스플레이에 표시된 컨텐츠에 대한 정보를 획득하는 방법을 설명하기 위한 도면이다.
일부 실시예에 따른 디스플레이 장치(200)는 디스플레이 장치(200)의 디스플레이에 표시된 컨텐츠의 비디오 핑거프린트(video fingerprint, VFP) 및 오디오 핑거프린트(audio fingerprint, AFP) 중 적어도 하나를 이용하여, 컨텐츠에 대한 정보를 서버(300)로부터 획득할 수 있다. 디스플레이 장치(200)는 현재 방영 또는 재생 중인 컨텐츠에 대한 정보를 획득함으로써 컨텐츠를 식별하고 컨텐츠와 관련된 정보를 사용자에게 제공할 수 있다.
컨텐츠에 대한 정보는 컨텐츠와 관련된 다양한 정보를 포함할 수 있다. 예를 들어, 컨텐츠에 대한 정보는 컨텐츠 식별 정보, 컨텐츠 타이틀, 컨텐츠 재생 시간, 컨텐츠 종류, 컨텐츠 제공자, 컨텐츠 내용, 컨텐츠의 주요 인물 중 적어도 하나를 포함할 수 있다. 물론 이에 제한되지 않는다.
도 1을 참조하면, 도 1의 110은 디스플레이 장치(200)가 방영 또는 재생하는 컨텐츠의 일 예를 도시하고 있다. 예를 들어 제1야구 경기 영상(11) 및 제1 야구 경기 오디오(12)를 포함하는 제1 야구 경기 컨텐츠(10)가 디스플레이 장치(200)에서 방영 또는 재생될 수 있다. 현재 제1 야구 경기 영상(11)이 디스플레이 장치(200)의 디스플레이에서 표시되고 있다.
디스플레이 장치(200)는 컨텐츠에 대한 정보를 획득하기 위해 컨텐츠의 비디오 핑거프린트 및 오디오 핑거프린트 중 적어도 하나를 추출할 수 있다. 핑거프린트란 하나의 프레임을 다른 프레임과 구별할 수 있는 고유 데이터를 의미한다. 핑거프린트에 대해서는 도 2에서 자세히 설명한다.
도 1를 참조하면, 디스플레이 장치(200)는 제1 야구 경기 컨텐츠(10)의 제1 야구 경기 영상(11)에 대한 제1 비디오 핑거프린트(VFP 1, 11-1) 및 제1 야구 경기 오디오(12)에 대한 제1 오디오 핑거프린트(AFP 1, 12-1) 중 적어도 하나를 추출할 수 있다.
디스플레이 장치(200)는 추출된 비디오 핑거프린트 및 오디오 핑거프린트 중 적어도 하나를 서버(300)에 송신한다. 디스플레이 장치(200)가 추출된 핑거프린트를 서버(300)에 송신하는 것을 컨텐츠 식별 요청이라고 지칭할 수 있다. 서버(300)는 복수의 컨텐츠에 대한 비디오 핑거프린트 및 오디오 핑거프린트를 추출하여 저장하고 있으며, 또한 각 컨텐츠에 대한 정보를 저장하고 있다. 서버(300)에 저장된, 복수의 컨텐츠에 대한 비디오 핑거프린트 및 오디오 핑거프린트 데이터베이스의 일 예가 도 1의 120에 도시되어 있다.
서버(300)는 디스플레이 장치(200)로부터 수신한 비디오 핑거프린트 및 오디오 핑거프린트 중 적어도 하나를 서버(300)가 저장하고 있는 비디오 핑거프린트 및 오디오 핑거프린트와 매칭할 수 있다. 서버(300)가 디스플레이 장치(200)로부터 수신한 핑거프린트와 서버에 저장된 핑거프린트들을 매칭한다는 것은, 서버(300)에 저장된 핑거프린트들 중 디스플레이 장치(200)로부터 수신한 핑거프린트와 동일 또는 유사한 핑거프린트를 검색하여 디스플레이 장치(200)로부터 수신한 핑거프린트와 일치하는 것을 찾는 것을 의미할 수 있다.
서버(300)는 디스플레이 장치(200)에 매칭 결과를 포함하는 응답을 송신한다. 매칭 결과는 디스플레이 장치(200)가 송신한 핑거프린트에 매칭된 적어도 하나의 핑거프린트를 포함할 수 있다. 또한 매칭 결과는 디스플레이 장치(200)가 송신한 핑거프린트에 매칭된 핑거프린트의 개수를 포함할 수 있다. 또한 매칭 결과는 디스플레이 장치(200)가 송신한 핑거프린트가 멀티 매칭되었는지 여부에 대한 정보를 포함할 수 있다. 응답은 디스플레이 장치(200)가 송신한 비디오 핑거프린트에 매칭됨 적어도 하나의 핑거프린트 각각에 대응하는 컨텐츠에 대한 정보를 포함할 수 있다.
디스플레이 장치(200)는 서버(300)로부터 매칭 결과를 포함하는 응답을 수신함으로써, 현재 방영 또는 재생 중인 컨텐츠에 대한 정보를 획득할 수 있다.
한편, 디스플레이 장치(200)가 송신한 핑거프린트는 서버(300)에 저장된 핑거프린트 중 복수의 핑거프린트와 매칭될 수 있다. 즉, 핑거프린트는 멀티 매칭될 수 있다. 반대로 디스플레이 장치(200)가 송신한 핑거프린트가 서버(300)에 저장된 핑거프린트 중 하나의 핑거프린트와 매칭될 수도 있다. 즉, 핑거프린트는 싱글 매칭될 수 있다.
예를 들어, 운동 경기 중계 컨텐츠의 경우 서로 다른 방송 채널 별로 서로 다른 방송 채널별로 중계되는 영상은 동일 또는 유사하나 해설자가 달라 송출되는 오디오는 상이할 수 있다. 이러한 경우 컨텐츠의 비디오 핑거프린트는 동일 또는 유사하여 멀티 매칭될 수 있고, 따라서 비디오 핑거프린트 매칭 만으로는 컨텐츠가 어떤 채널에서 방영 또는 재생되는 영상인지를 식별하기 어려울 수 있다.
비디오 핑거프린트가 멀티 매칭된 경우, 디스플레이 장치(200)에 표시된 컨텐츠를 서버(300)에 저장된 컨텐츠와 매칭하기 위해 오디오 핑거프린트가 필요할 수 있다. 즉, 서버(300)는 두 핑거프린트, 즉 디스플레이 장치(200)로부터 수신한 비디오 핑거프린트에 매칭되는 비디오 핑거프린트 및, 디스플레이 장치(200)로부터 수신한 오디오 핑거프린트에 매칭되는 오디오 핑거프린트 모두에 대응하는 컨텐츠를 검색할 수 있다. 즉, 서버(300)는 매칭된 비디오 핑거프린트 및 매칭된 오디오 핑거프린트의 조합에 대응하는 컨텐츠를 검색할 수 있고, 매칭된 컨텐츠에 대한 정보를 디스플레이 장치(200)로 송신할 수 있다.
도 1을 참조하면, 서버(300)는 디스플레이 장치(200)로부터 제1 야구 경기 영상(11)에 대한 제1 비디오 핑거프린트(VFP 1, 11-1) 및 제1 야구 경기 오디오(12)에 대한 제1 오디오 핑거프린트(AFP 1, 12-1) 중 적어도 하나를 수신할 수 있다. 서버(300)는 서버(300)에 저장된 복수의 컨텐츠에 대한 비디오 핑거프린트 및 오디오 핑거프린트 데이터베이스(120)에서 디스플레이 장치(200)로부터 수신한 핑거프린트에 매칭되는 핑거프린트를 검색할 수 있다.
서버(300)가 디스플레이 장치(200)로부터 수신한 제1 비디오 핑거프린트(VFP 1, 11-1)가, 서버에 저장된 복수의 비디오 핑거프린트 중 VFP 2(21-1) 및 VFP 3(31-1)과 멀티 매칭된 경우, 서버(300)는 수신한 제1 오디오 핑거프린트(AFP 1, 12-1)를 서버에 저장된 오디오 핑거프린트 중 AFP 3(32-1)에 매칭할 수 있다. 따라서 서버(300)는 디스플레이 장치(200)로부터 수신한 VFP 1(11-1) 및 AFP 1(12-1)의 조합에 대응되는 컨텐츠로, 서버에 저장된 VFP 3(31-1) 및 AFP 3(32-1)에 대응되는 컨텐츠인 제3 야구 경기 컨텐츠 (30)를 매칭할 수 있다.
한편, 종래의 디스플레이 장치는 비디오 핑거프린트가 멀티 매칭되었는지 여부에 관계 없이 컨텐츠의 비디오 핑거프린트 및 오디오 핑거프린트 모두를 추출하고 서버로 송신하였다. 그런데 비디오 핑거프린트가 싱글 매칭된 경우에는 컨텐츠도 싱글 매칭되므로, 서버가 오디오 핑거프린트를 매칭하는 동작이 불필요하다. 따라서 비디오 핑거프린트가 싱글 매칭된 경우에는 디스플레이 장치가 오디오 핑거프린트를 추출하는 동작, 서버로 송신하는 동작, 및 서버가 오디오 핑거프린트를 수신하는 동작 등에 리소스가 낭비되었다.
본 개시의 디스플레이 장치(200)는 컨텐츠에 대한 정보를 획득하기 위해 컨텐츠의 핑거프린트를 매칭하는 방법에 있어서, 비디오 핑거프린트가 멀티 매칭된 것에 대응해서 오디오 핑거프린트를 추출하고 서버에 송신함으로써, 디스플레이 장치(200) 및 서버(300)가 사용하는 리소스를 저감할 수 있다.
도 1의 130은 디스플레이 장치(200)의 동작을 개괄적으로 나타낸다.
동작 201에서, 디스플레이 장치(200)는 디스플레이 장치(200)가 디스플레이에 표시되는 컨텐츠의 영상 신호로부터 추출한 비디오 핑거프린트가 서버(300)에서 멀티 매칭되었는지 여부를 판단할 수 있다. 디스플레이 장치(200)는 서버(300)로부터 디스플레이 장치(200)가 송신한 핑거프린트에 매칭된 복수의 핑거프린트를 수신하거나, 매칭된 개수가 복수개라는 정보를 수신하거나, 멀티 매칭되었다는 정보를 수신함으로써 추출한 비디오 핑거프린트가 서버(300)에서 멀티 매칭되었는지 여부를 판단할 수 있다.
동작 202에서, 비디오 핑거프린트가 멀티 매칭된 경우, 디스플레이 장치(200)는 디스플레이에 표시되는 컨텐츠의 오디오 신호로부터 오디오 핑거프린트를 추출할 수 있다. 디스플레이 장치(200)는 추출한 오디오 핑거프린트를 서버(300)로 송신하고, 서버(300)로부터 서버(300)에 저장된 오디오 핑거프린트들과의 매칭 결과를 포함하는 응답을 수신할 수 있다. 응답은 디스플레이 장치(200)가 추출한 비디오 핑거프린트 및 오디오 핑거프린트의 조합에 대응하는 컨텐츠에 대한 정보를 포함할 수 있다.
본 개시의 디스플레이 장치(200)는 컨텐츠에 대한 정보를 획득하기 위해 컨텐츠의 핑거프린트를 매칭하는 방법에 있어서, 비디오 핑거프린트가 싱글 매칭된 경우에는 오디오 핑거프린트를 추출하지 않음으로써, 디스플레이 장치(200)가 오디오 핑거프린트를 추출하는 동작, 서버로 송신하는 동작, 및 서버가 오디오 핑거프린트를 수신하는 동작 등에 불필요하게 사용되는 리소스를 저감할 수 있다.
도 2는 일부 실시예에 따른 디스플레이 장치(200)의 구성을 나타내는 블록도이다.
도 2에 도시된 바와 같이, 디스플레이 장치(200)는 프로세서(210), 통신부(220), 메모리(230), 및 디스플레이(240)를 포함할 수 있다.
디스플레이 장치(200) 는 텔레비전, 데스크탑 PC, 핸드헬드 PA, 개인 정보 단말기 등 다양한 전자 장치로 구현될 수 있다.
프로세서(210)는 메모리(230)에 저장되는 하나 이상의 프로그램들을 실행할 수 있으며 디스플레이 장치(200)의 구성 요소들을 전반적으로 제어할 수 있다. 프로세서(210)는 싱글 코어, 듀얼 코어, 트리플 코어, 쿼드 코어 및 그 배수의 코어를 포함할 수 있다. 또한, 프로세서(210)는 복수의 프로세서를 포함할 수 있다. 예를 들어, 프로세서(210)는 메인 프로세서(main processor, 도시되지 아니함) 및 절전 모드에서 동작하는 서브 프로세서(sub processor, 도시되지 아니함)로 구현될 수 있다.
통신부(220)는 프로세서(210)의 제어에 의해 외부 장치와 데이터 또는 신호를 송수신할 수 있다.
통신부(220)는 디스플레이 장치(200)의 성능 및 구조에 대응하여 근거리 통신망(LAN, Local Area Network), 무선랜(WLAN)(예를 들어, 와이파이(Wi-Fi)), 유선 이더넷(Ethernet), BLE, LTE, 5G 등 다양한 유무선 통신 방식을 이용하여 외부 장치와 데이터 또는 신호를 송수신할 수 있다.
통신부(220)는 유선 또는 무선으로 다양한 컨텐츠를 수신할 수 있다. 예를 들어 통신부(220)는 방송 서비스 신호 또는 VOD(video on demand) 서비스 신호를 수신할 수 있다.
프로세서(210)는 통신부(220)를 통해 서버로 비디오 핑거프린트 또는 오디오 핑거프린트를 송/수신, 서버로부터 핑거프린트 매칭 결과 및 컨텐츠에 대한 정보를 수신할 수 있다.
메모리(230)는 디스플레이 장치(200)를 구동하고 제어하기 위한 다양한 데이터, 프로그램 또는 어플리케이션을 저장할 수 있다.
또한, 메모리(230)에 저장되는 프로그램은 하나 이상의 인스트럭션들을 포함할 수 있다. 메모리(230)에 저장된 프로그램(하나 이상의 인스트럭션들) 또는 어플리케이션은 프로세서(210)에 의해 실행될 수 있다.
디스플레이(240)는 프로세서(210)에서 처리된 영상 신호, 데이터 신호, OSD 신호, 제어 신호 등을 변환하여 구동 신호를 생성한다. 디스플레이(240)는 PDP, LCD, OLED, 플렉시블 디스플레이(flexible display)등으로 구현될 수 있으며, 또한, 3차원 디스플레이(3D display)로 구현될 수 있다. 또한, 디스플레이(240)는, 터치 스크린으로 구성되어 출력 장치 이외에 입력 장치로 사용되는 것도 가능하다.
프로세서(210)는 디스플레이(240)에서 표시되는 컨텐트의 비디오 핑거프린트 및/또는 오디오 핑거프린트를 추출할 수 있다.
핑거프린트란, 하나의 프레임을 다른 프레임과 구별할 수 있는 고유 데이터를 의미한다. 핑거프린트는 프레임에 포함된 비디오, 이미지 또는 오디오 신호로부터 추출된 특징 데이터로서, 신호 자체 고유의 특성을 반영한다. 예를 들어 오디오 신호인 경우, 핑거프린트는 오디오 신호의 주파수, 진폭 등의 특징을 표현하는 데이터이고, 이미지나 비디오 신호인 경우, 핑거프린트는 모션 벡터, 색상 등의 특징을 표현하는 데이터이다.
핑거프린트는 종래에 알려진 다양한 알고리즘에 의해 추출될 수 있다. 예를 들어, 오디오 신호를 일정 시간 간격으로 분할하고, 각 시간 간격에 포함되는 주파수들의 신호의 크기를 계산한다. 그리고 인접한 주파수 구간의 신호들 간의 크기 차를 구하여 주파수 기울기를 계산하고, 기울기가 양수인 경우 1로, 음수인 경우 0으로 양자화함으로써 핑거프린트 데이터가 생성될 수 있다.
본 개시에서 비디오 핑거프린트 추출 및 오디오 핑거프린트 추출은 각각 비디오 핑거프린트 생성 및 오디오 핑거프린트 생성을 의미할 수 있다.
일부 실시예에 따른 프로세서(210)는, 디스플레이에서 표시되는 컨텐츠의 비디오 핑거프린트를 추출하고, 추출된 비디오 핑거프린트를 서버에 송신하고, 서버로부터 서버에 저장된 비디오 핑거프린트들과 추출된 비디오 핑거프린트의 매칭 결과를 포함하는 제1 응답을 수신하고, 제1 응답에 따라, 추출된 비디오 핑거프린트가 서버에 저장된 복수의 비디오 핑거프린트들과 매칭된 경우, 디스플레이에서 표시되는 컨텐츠의 오디오 핑거프린트를 추출하고, 추출된 오디오 핑거프린트를 서버에 송신하고, 서버로부터 서버에 저장된 오디오 핑거프린트들과 추출된 오디오 핑거프린트의 매칭 결과를 포함하는 제2 응답을 수신하도록 제어할 수 있다.
이와 같은 구성에 의해 본 개시에 따른 디스플레이 장치(200)는 비디오 핑거프린트가 멀티 매칭된 것에 대응해서 오디오 핑거프린트를 추출함으로써, 컨텐츠를 매칭하는 방법에 있어서 디스플레이 장치(200)가 오디오 핑거프린트를 추출하는 동작, 서버(300)로 송신하는 동작, 및 서버(300)가 오디오 핑거프린트를 수신하는 동작 등에 사용되는 리소스를 저감하는 효과를 제공할 수 있다.
일부 실시예에 따르면, 제2 응답은, 서버에 저장된 오디오 핑거프린트들 중, 추출된 비디오 핑거프린트에 매칭된 복수의 비디오 핑거프린트들에 대응하는 복수의 컨텐츠에 대응하는 각각의 오디오 핑거프린트와, 추출된 오디오 핑거프린트의 매칭 결과를 포함할 수 있다.
일부 실시예에 따르면, 제1 응답은, 추출된 비디오 핑거프린트에 매칭된 적어도 하나의 비디오 핑거프린트에 대응하는 컨텐츠에 대한 정보를 포함하고, 제2 응답은, 추출된 비디오 핑거프린트에 매칭된 복수의 비디오 핑거프린트들 및 추출된 오디오 핑거프린트에 매칭된 오디오 핑거프린트의 조합에 대응하는 컨텐츠에 대한 정보를 포함할 수 있다.
일부 실시예에 따른 프로세서(210)는, 디스플레이에서 표시되는 컨텐츠의 비디오 핑거프린트 및 오디오 핑거프린트를 소정의 시간 간격에 따라 추출하고, 제1 응답에 따라, 추출된 비디오 핑거프린트가 서버에 저장된 복수의 비디오 핑거프린트들과 매칭된 경우, 디스플레이에서 표시되는 컨텐츠의 오디오 핑거프린트를 소정의 시간 간격에 따라 추출하고, 제1 응답에 따라, 추출된 비디오 핑거프린트가 서버에 저장된 하나의 비디오 핑거프린트와 매칭된 경우, 오디오 핑거프린트의 추출을 중지할 수 있다.
이와 같은 구성에 의해 본 개시에 따른 디스플레이 장치(200)는 비디오 핑거프린트가 멀티 매칭된 것에 대응해서 오디오 핑거프린트를 주기적으로 추출하고, 비디오 핑거프린트가 싱글 매칭된 경우 오디오 핑거프린트의 추출을 중지함으로써, 컨텐츠를 매칭하는 방법에 있어서 서버(300)로 송신하는 동작, 및 서버(300)가 오디오 핑거프린트를 수신하는 동작 등에 사용되는 리소스를 저감하는 효과를 제공할 수 있다.
일부 실시예에 따르면, 제1 응답은, 추출된 비디오 핑거프린트의 시간 구간 중, 추출된 비디오 핑거프린트가 서버에 저장된 복수의 비디오 핑거프린트들과 매칭된 시간 구간에 대한 정보를 포함하고, 프로세서(210)는, 제1 응답에 기초하여, 추출된 비디오 핑거프린트가 복수의 비디오 핑거프린트들과 매칭된 시간 구간에 대해 디스플레이에서 표시되는 컨텐츠의 오디오 핑거프린트를 추출할 수 있다.
이와 같은 구성에 의해 본 개시에 따른 디스플레이 장치(200)는 비디오 핑거프린트가 멀티 매칭된 구간에 대해서만 오디오 핑거프린트를 추출함으로써, 컨텐츠를 매칭하는 데에 사용되는 리소스를 저감하는 효과를 제공할 수 있다.
도 3은 일부 실시예에 따른 서버(300)의 구성을 나타내는 블록도이다.
도 3에 도시된 바와 같이, 서버(300)는 프로세서(310), 통신부(320), 및 메모리(330)를 포함할 수 있다.
프로세서(310)는 하나 이상의 프로세서를 포함하며 서버(300)의 구성 요소들을 전반적으로 제어할 수 있다.
통신부(320)는 프로세서(210)의 제어에 의해 외부 장치와 데이터 또는 신호를 송수신할 수 있다.
통신부(320)는 서버(300)의 성능 및 구조에 대응하여 무선랜(WLAN)(예를 들어, 와이파이(Wi-Fi)), 유선 이더넷(Ethernet), 또는 다양한 유무선 통신 방식을 이용하여 데이터 또는 신호를 디스플레이 장치(200)와 송수신할 수 있다.
통신부(320)는 유선 또는 무선으로 다양한 컨텐츠를 수신할 수 있다. 예를 들어 통신부(320)는 방송 서비스 신호 또는 VOD(video on demand) 서비스 신호를 수신할 수 있다. 또한 통신부(320)는 컨텐츠와 함께 컨텐츠에 대한 정보를 수신할 수 있다. 컨텐츠에 대한 정보는 컨텐츠 식별 정보, 컨텐츠 타이틀, 컨텐츠 재생 시간, 컨텐츠 종류, 컨텐츠 제공자, 컨텐츠 내용, 컨텐츠의 주요 인물 등 컨텐츠와 관련된 다양한 정보를 포함할 수 있으며, 물론 이에 제한되지 않는다.
통신부(320)는 프로세서(310)의 제어에 의해 디스플레이 장치(200)와 데이터 또는 신호를 송수신할 수 있다. 프로세서(310)는 통신부(320)를 통해 디스플레이 장치(200)로부터 컨텐츠 인식 요청에 따른 비디오 핑거프린트 또는 오디오 핑거프린트를 송/수신, 디스플레이 장치(200)로 핑거프린트 매칭 결과 및 컨텐츠에 대한 정보를 송신할 수 있다.
메모리(330)는 서버(300)를 구동하고 제어하기 위한 다양한 데이터, 프로그램 또는 어플리케이션을 저장할 수 있다. 또한, 메모리(330)에 저장되는 프로그램은 하나 이상의 인스트럭션들을 포함할 수 있다. 메모리(330)에 저장된 프로그램(하나 이상의 인스트럭션들) 또는 어플리케이션은 프로세서(310)에 의해 실행될 수 있다. 또한 메모리(330)는 수신한 컨텐츠 및/또는 컨텐츠에 대한 정보를 저장할 수 있다.
프로세서(310)는 수신된 컨텐츠에 대해 비디오 핑거프린트 및 오디오 핑거프린트를 추출할 수 있다. 프로세서(310)는 추출된 비디오 핑거프린트 및 오디오 핑거프린트를 데이터베이스화 하여 메모리(330)에 저장할 수 있다.
프로세서(310)는 저장된 핑거프린트 데이터베이스에 기초하여, 디스플레이 장치(200)로부터의 컨텐츠 인식 요청에 따른 비디오 핑거프린트 및 오디오 핑거프린트 각각을 매칭할 수 있다. 또한 프로세서(310)는 매칭된 비디오 핑거프린트 및 오디오 각각, 또는 그 조합에 대응되는 컨텐츠를 검색할 수 있다.
도 4는 일부 실시예에 따른 디스플레이 장치의 세부적인 구성을 나타내는 블록도이다.
도 4에 도시된 바와 같이, 디스플레이 장치(400)는 제어부(410), 전원부(420), 디스플레이부(430), 비디오 처리부(435), 휘발성 메모리(441) 및 비휘발성 메모리(442)를 포함하는 메모리(440), 컨텐츠 식별 모듈(450), 오디오 처리/출력부(460), 튜너부(470), 통신부(480), 감지부(485), 및 입/출력부(490)를 포함할 수 있다.
도 2에서 설명한 내용과 동일한 내용은 도 4에서 생략하기로 한다.
일 실시예에 따른 디스플레이 장치(400)는 TV일 수 있으나, 이는 일 실시예에 불과하며, 디스플레이를 포함하는 전자 장치로 구현될 수 있다. 예를 들어, 디스플레이 장치(400)는 휴대폰, 태블릿 PC, 디지털 카메라, 캠코더, 노트북 컴퓨터(laptop computer), 태블릿 PC, 데스크탑, 전자책 단말기, 디지털 방송용 단말기, PDA(Personal Digital Assistants), PMP(Portable Multimedia Player), 네비게이션, MP3 플레이어, 착용형 기기(wearable device) 등과 같은 다양한 전자 장치로 구현될 수 있다.
전원부(420)는 디스플레이 장치(400)의 각 기능 블록에 전원을 공급한다.
디스플레이부(430)는 제어부(410)의 제어에 의해 튜너부(470)를 통해 수신된 방송 신호에 포함된 비디오를 화면에 표시한다. 또한, 디스플레이부(430)는 통신부(480) 또는 입/출력부(490)를 통해 입력되는 컨텐츠(예를 들어, 동영상)를 표시할 수 있다. 디스플레이부(430)는 제어부(410)의 제어에 의해 메모리에 저장된 영상을 출력할 수 있다.
디스플레이부(430)는, 제어부(410)에서 처리된 영상 신호, 데이터 신호, OSD 신호, 제어 신호 등을 변환하여 구동 신호를 생성한다. 디스플레이부(430)는 PDP, LCD, OLED, 플렉시블 디스플레이(flexible display)등으로 구현될 수 있으며, 또한, 3차원 디스플레이(3D display)로 구현될 수 있다. 또한, 디스플레이부(430)는, 터치 스크린으로 구성되어 출력 장치 이외에 입력 장치로 사용되는 것도 가능하다.
비디오 처리부(435)는, 디스플레이 장치(400)가 수신한 비디오 데이터에 대한 처리를 수행한다. 비디오 처리부(435)에서는 비디오 데이터에 대한 디코딩, 스케일링, 노이즈 필터링, 프레임 레이트 변환, 해상도 변환 등과 같은 다양한 이미지 처리를 수행할 수 있다.
오디오 처리/출력부(460)는 오디오 데이터에 대한 처리를 수행한다. 오디오 처리/출력부(460)에서는 오디오 데이터에 대한 디코딩이나 증폭, 노이즈 필터링 등과 같은 다양한 처리가 수행될 수 있다. 또한, 오디오 처리/출력부(460)는 처리된 오디오를 출력하기 위한 스피커, 헤드폰 출력 단자 또는 S/PDIF(Sony/Philips Digital Interface 출력 단자 중 적어도 하나를 포함할 수 있다.
튜너부(470)는 유선 또는 무선으로 수신되는 방송 신호를 증폭(amplification), 혼합(mixing), 공진(resonance)등을 통하여 많은 전파 성분 중에서 디스플레이 장치(400)에서 수신하고자 하는 채널의 주파수만을 튜닝(tuning)시켜 선택할 수 있다. 방송 신호는 오디오(audio), 비디오(video) 및 부가 정보(예를 들어, EPG(Electronic Program Guide))를 포함한다.
통신부(480)는 제어부(410)의 제어에 의해 디스플레이 장치(400)를 외부 장치(예를 들어, 오디오 장치 등)와 연결할 수 있다. 제어부(410)는 통신부(480)를 통해 연결된 외부 장치로 컨텐츠를 송/수신, 외부 장치에서부터 어플리케이션(application)을 다운로드 하거나 또는 웹 브라우징을 할 수 있다. 통신부(480)는 디스플레이 장치(400)의 성능 및 구조에 대응하여 무선 랜 인터페이스, 블루투스 인터페이스, BLE 인터페이스, NFC 인터페이스, 유선 이더넷(Ethernet) 인터페이스 등을 포함할 수 있다. 또한 통신부(480)는 제어부(410)의 제어에 의해 원격 제어 장치의 제어 신호를 수신할 수 있다. 제어 신호는 블루투스 타입, RF 신호 타입 또는 와이파이 타입으로 구현될 수 있다. 통신부(480)는 블루투스 타입, RF 신호 타입 또는 와이파이 타입으로 구현된 원격 제어 장치의 제어 신호를 수신할 수 있다.
감지부(485)는 사용자의 음성, 사용자의 영상 또는 사용자의 인터랙션을 감지하며, 마이크, 카메라 및 광 수신부 등을 포함할 수 있다. 광 수신부는 외부의 원격 제어 장치로부터 수신되는 광 신호(제어 신호를 포함)를 수신한다. 예를 들어 광 수신부는 외부의 원격 제어 장치로부터 디스플레이 장치(400)의 파워 온 입력 또는 파워 오프 입력 등을 수신할 수 있다.
입/출력부(490)는 제어부(410)의 제어에 의해 디스플레이 장치(400)의 외부에서부터 비디오(예를 들어, 동영상 등), 오디오(예를 들어, 음성`, 음악 등) 및 부가 정보(예를 들어, EPG 등) 등을 수신한다. 입/출력부(490)는 HDMI 포트 (High-Definition Multimedia Interface port), 컴포넌트 잭 (component jack), PC 포트, 및 USB 포트 중 하나 또는 조합을 포함할 수 있다.
메모리(440)는 제어부(410)의 제어에 의해 디스플레이 장치(400)를 구동하고 제어하기 위한 다양한 데이터, 프로그램 또는 어플리케이션을 저장할 수 있다. 메모리(440)는 디스플레이 장치(400)의 각 구성요소의 구동에 대응되는 입력/출력되는 신호 또는 데이터를 저장할 수 있다.
메모리(440)는 디스플레이 장치(400) 및 제어부의 제어를 위한 오퍼레이팅 시스템, 제조사에서 최초 제공되거나 외부에서부터 다운로드 받은 어플리케이션, 어플리케이션과 관련된 GUI(graphical user interface), GUI를 제공하기 위한 오브젝트(예를 들어, 이미지 텍스트, 아이콘, 버튼 등), 사용자 정보, 문서, 데이터베이스들 또는 관련 데이터들을 저장할 수 있다.
메모리(440)는 휘발성 메모리(441)와 비휘발성 메모리(442)를 포함한다. 휘발성 메모리(441)는 전원공급이 유지된 상태에서 저장된 정보를 유지하는 메모리를 말하고 비휘발성 메모리(442)는 전원공급이 중단된 경우에도 저장된 정보를 유지하는 메모리를 말한다. 휘발성 메모리(441)는 DRAM, SRAM 등을 포함할 수 있고, 비휘발성 메모리(442)는 롬, 플래시 메모리, 메모리 카드(예를 들어, micro SD 카드, USB 메모리), 하드 디스크 드라이브(HDD) 또는 솔리드 스테이트 드라이브(SSD)를 포함할 수 있다. 휘발성 메모리(441)는 시스템 부팅시 로딩되는 오퍼레이팅 시스템, 실행중인 하나 이상의 어플리케이션 프로그램 및 어플리케이션 실행에 관련된 입출력 데이터를 저장할 수 있다.
특히 휘발성 메모리(441)는 디스플레이 장치(400)가 서스펜드 투 램 기능을 이용하여 절전 모드로 진입하는 경우에는 최소한의 전력 공급이 유지되어 휘발성 메모리(441)에 저장된 내용이 유지될 수 있고, 디스플레이 장치(400)가 콜드 파워 오프되는 경우 휘발성 메모리(441)에 저장된 내용은 제거될 수 있다.
컨텐츠 식별 모듈(450)은 디스플레이 장치(400)에서 표시되는 컨텐츠를 식별하고 컨텐츠에 대한 정보를 획득하기 위해 동작될 수 있는 적절한 로직, 회로, 인터페이스, 및/또는 코드를 포함할 수 있다.
비디오 핑거프린트 추출 모듈(451)은, 디스플레이 장치(400)에서 표시되는 컨텐츠의 비디오 핑거프린트를 추출하도록 동작될 수 있는 적절한 로직, 회로, 인터페이스, 및/또는 코드를 포함할 수 있다. 예를 들어, 비디오 핑거 프린트 추출 모듈(451)은 컨텐츠가 출력되는 동안에 기 설정된 간격마다 프레임을 캡쳐하여 비디오 핑거프린트를 추출한다. 또한 비디오 핑거 프린트 추출 모듈(451)은 추출한 비디오 핑거프린트를 비디오 핑거프린트 스택에 저장할 수 있다.
오디오 핑거프린트 추출 모듈(452) 은, 디스플레이 장치(400)에서 표시되는 컨텐츠의 오디오 핑거프린트를 추출하도록 동작될 수 있는 적절한 로직, 회로, 인터페이스, 및/또는 코드를 포함할 수 있다. 예를 들어, 오디오 핑거 프린트 추출 모듈(452)은 컨텐츠가 출력되는 동안에 기 설정된 간격마다 프레임을 캡쳐하여 오디오 핑거프린트를 추출할 수 있다. 또한 오디오 핑거 프린트 추출 모듈(452)은 추출한 오디오 핑거프린트를 오디오 핑거프린트 스택에 저장할 수 있다.
예를 들어, 오디오 핑거프린트 추출 모듈(452)은 제어부(410)의 제어에 의해 오디오 신호의 PCM(Pulse-Code Modulation) 데이터를 전달받고, PCM 데이터를 처리하여 오디오 핑거프린트를 추출할 수 있다.
일부 실시예에 따르면, 오디오 핑거프린트 추출 모듈(452)은 쿼리 모듈(453)로부터 오디오 핑거프린트 추출 중지 신호를 수신하는 것에 대응하여 오디오 핑거프린트의 추출을 중지하고, 오디오 핑거프린트 추출 신호를 수신하는 것에 대응하여 오디오 핑거프린트를 추출할 수 있다.
쿼리 모듈(453)은, 디스플레이 장치(400)에서 표시되는 컨텐츠의 비디오 핑거프린트가 멀티 매칭되었는지 여부를 판단하고, 오디오 핑거프린트 추출 모듈(452)의 동작을 제어하고, 매칭 모듈(454)에 서버(300)로 컨텐츠 식별 요청을 송신하도록 하는 신호를 전달하는 동작을 수행하기 위해 동작될 수 있는 적절한 로직, 회로, 인터페이스, 및/또는 코드를 포함할 수 있다.
일부 실시예에 따르면, 쿼리 모듈(453)은, 디스플레이 장치(400)에서 표시되는 컨텐츠의 비디오 핑거프린트가 멀티 매칭된 경우, 오디오 핑거프린트 추출 모듈(452)에 오디오 핑거프린트 추출을 중지하도록 하는 신호를 전달할 수 있다. 예를 들어, 쿼리 모듈(453)은 제어부(410)의 제어에 의해 오디오 핑거프린트 추출 모듈(452)이 오디오 신호의 PCM데이터를 전달받는 것을 중지하도록 하는 신호를 전달함으로써 오디오 핑거프린트의 추출을 중지할 수 있다.
매칭 모듈(454)은, 서버(300)로부터 매칭 결과를 포함하는 응답을 수신하고, 서버(300)에 컨텐츠 인식 요청을 송신하고, 비디오/오디오 핑거프린트 스택을 초기화하도록 동작될 수 있는 적절한 로직, 회로, 인터페이스, 및/또는 코드를 포함할 수 있다.
예를 들어, 매칭 모듈(454)은 서버(300)로부터 수신한 매칭 결과를 포함하는 응답을 쿼리 모듈(453)로 전달할 수 있다. 또한 매칭 모듈(454)은 쿼리 모듈(453)으로부터 신호를 전달받는 것에 대응하여 서버(300)로 오디오/비디오 핑거프린트 스택에 저장된 오디오/비디오 핑거프린트를 송신할 수 있다. 매칭 모듈(454)은 서버(300)로 오디오/비디오 핑거프린트를 송신한 후 오디오/비디오 핑거프린트 스택을 초기화할 수 있다.
한편, 도시된 디스플레이 장치(200, 400) 의 블록도는 일 실시예를 위한 블록도이다. 블록도의 각 구성요소는 실제 구현되는 디스플레이 장치(200, 400) 의 사양에 따라 통합, 추가, 또는 생략될 수 있다. 즉, 필요에 따라 2 이상의 구성요소가 하나의 구성요소로 합쳐지거나, 혹은 하나의 구성요소가 2 이상의 구성요소로 세분되어 구성될 수 있다. 또한, 각 블록에서 수행하는 기능은 실시예들을 설명하기 위한 것이며, 그 구체적인 동작이나 장치는 본 개시의 권리범위를 제한하지 아니한다.
이하에서는 도 5 내지 도 7을 참조하여 디스플레이 장치의 동작 방법의 구체적인 예를 설명한다.
도 5는 일부 실시예에 따른 디스플레이 장치가 컨텐츠의 비디오 핑거프린트가 멀티 매칭되었는지 여부에 기초하여 오디오 핑거프린트를 추출하는 방법을 설명하기 위한 흐름도이다.
도 1에서 설명한 내용과 동일한 내용은 도 5에서 생략하기로 한다.
동작 510에서, 디스플레이 장치(200)는 디스플레이 장치(200)의 디스플레이에서 표시되는 컨텐츠의 비디오 핑거프린트를 추출할 수 있다.
동작 520에서, 디스플레이 장치(200)는 추출된 비디오 핑거프린트를 서버(300)에 송신할 수 있다. 도 1에서 설명한 바와 같이, 디스플레이 장치(200)가 추출된 핑거프린트를 서버(300)에 송신하는 것을 컨텐츠 식별 요청이라고 지칭할 수 있다.
동작 530에서, 디스플레이 장치(200)는 서버(300)로부터 서버(300)에 저장된 비디오 핑거프린트들과 추출된 비디오 핑거프린트의 매칭 결과를 포함하는 제1 응답을 수신할 수 있다.
서버(300)는 데이터베이스에 복수의 컨텐츠, 복수의 컨텐츠에 대한 정보, 복수의 컨텐츠 각각에 대한 비디오 핑거프린트 및 오디오 핑거프린트를 저장할 수 있다.
서버(300)는 디스플레이 장치(200)로부터 수신한 비디오 핑거프린트를 서버(300)가 저장하고 있는 적어도 하나의 비디오 핑거프린트와 매칭할 수 있다. 즉, 서버(300)는 서버(300)에 저장된 비디오 핑거프린트들 중 디스플레이 장치(200)로부터 수신한 비디오 핑거프린트와 동일 또는 유사한 비디오 핑거프린트를 검색하여 디스플레이 장치(200)로부터 수신한 비디오 핑거프린트에 매칭할 수 있다.
서버(300)는 디스플레이 장치(200)에 매칭 결과를 포함하는 제1 응답을 송신한다. 제1 응답에 포함된 매칭 결과는 디스플레이 장치(200)가 송신한 비디오 핑거프린트에 매칭된 적어도 하나의 비디오 핑거프린트를 포함할 수 있다. 또한 매칭 결과는 디스플레이 장치(200)가 송신한 비디오 핑거프린트에 매칭된 비디오 핑거프린트의 개수를 포함할 수 있다. 또한 매칭 결과는 디스플레이 장치(200)가 송신한 비디오 핑거프린트가 멀티 매칭되었는지 여부에 대한 정보를 포함할 수 있다. 제1 응답은 디스플레이 장치(200)가 송신한 비디오 핑거프린트에 매칭된 적어도 하나의 비디오 핑거프린트 각각에 대응하는 컨텐츠에 대한 정보를 포함할 수 있다.
동작 540에서, 디스플레이 장치(200)는 제1 응답에 따라, 추출된 비디오 핑거프린트가 서버에 저장된 복수의 비디오 핑거프린트들과 매칭된 경우, 디스플레이에서 표시되는 컨텐츠의 오디오 핑거프린트를 추출하고, 추출된 오디오 핑거프린트를 서버에 송신하고, 서버로부터 서버에 저장된 오디오 핑거프린트들과 추출된 오디오 핑거프린트의 매칭 결과를 포함하는 제2 응답을 수신할 수 있다.
즉, 디스플레이 장치(200)는 추출된 비디오 핑거프린트가 멀티 매칭된 경우, 컨텐츠의 오디오 핑거프린트를 추출할 수 있다. 본 개시의 디스플레이 장치(200)는 컨텐츠에 대한 정보를 획득하기 위해 컨텐츠의 핑거프린트를 매칭하는 방법에 있어서, 비디오 핑거프린트가 싱글 매칭된 경우에는 오디오 핑거프린트를 추출하지 않음으로써, 디스플레이 장치(200)가 오디오 핑거프린트를 추출하는 동작, 서버로 송신하는 동작, 및 서버가 오디오 핑거프린트를 수신하는 동작 등에 불필요하게 사용되는 리소스를 저감할 수 있다.
일부 실시예에 따른 디스플레이 장치(200)는 추출된 비디오 핑거프린트가 멀티 매칭되었는지 여부를 서버(300)로부터 수신한 제1 응답을 통해 판단할 수 있다. 예를 들어, 제1 응답이 디스플레이 장치(200)가 송신한 비디오 핑거프린트에 매칭된 복수의 비디오 핑거프린트를 포함하거나, 매칭된 개수가 복수개라는 정보를 포함하거나, 멀티 매칭되었다는 정보를 포함하는 경우, 추출한 비디오 핑거프린트가 서버(300)에서 멀티 매칭되었다고 판단할 수 있다.
일부 실시예에 따르면, 제1 응답은, 디스플레이 장치(200)가 추출한 비디오 핑거프린트의 시간 구간 중, 추출된 비디오 핑거프린트가 서버에 저장된 복수의 비디오 핑거프린트들과 매칭(멀티 매칭)된 시간 구간에 대한 정보를 포함할 수 있다. 핑거프린트의 시간 구간은 핑거프린트에 대응하는 멀티미디어 컨텐츠의 시간 구간에 대응된다. 디스플레이 장치(200)는 제1 응답에 기초하여, 추출된 비디오 핑거프린트가 복수의 비디오 핑거프린트들과 매칭(멀티 매칭)된 시간 구간에 대해 디스플레이에서 표시되는 컨텐츠의 오디오 핑거프린트를 추출할 수 있다.
일부 실시예에 따른 서버(300)가 디스플레이 장치(200)로부터 수신한 오디오 핑거프린트를 매칭하는 방법은 비디오 핑거프린트를 매칭하는 방법에 대응된다.
또한 서버(300)는 서버(300)에 저장된 핑거프린트 중 두 핑거프린트, 즉 디스플레이 장치(200)로부터 수신한 비디오 핑거프린트에 매칭되는 비디오 핑거프린트 및, 디스플레이 장치(200)로부터 수신한 오디오 핑거프린트에 매칭되는 오디오 핑거프린트 모두에 대응하는 컨텐츠를 검색할 수 있다. 예를 들어, 서버(300)는 매칭된 복수의 비디오 핑거프린트들 각각에 대응되는 각 컨텐츠에 대한 오디오 핑거프린트 중, 디스플레이 장치(200)가 송신한 오디오 핑거프린트에 매칭되는 오디오 핑거프린트를 검색할 수 있다. 서버(300)는 매칭된 비디오 핑거프린트 및 매칭된 오디오 핑거프린트의 조합에 대응하는 컨텐츠를 검색할 수 있고, 대응하는 컨텐츠에 대한 정보를 제2 응답에 포함시켜 디스플레이 장치(200)로 송신할 수 있다.
서버(300)는 디스플레이 장치(200)에 매칭 결과를 포함하는 제2 응답을 송신한다. 예를 들어, 제2 응답은 서버(300)에 저장된 오디오 핑거프린트들 중, 디스플레이 장치(200)가 송신한 비디오 핑거프린트에 매칭된 복수의 비디오 핑거프린트들에 대응하는 복수의 컨텐츠에 대한 각각의 오디오 핑거프린트와 디스플레이 장치(200)가 송신한 오디오 핑거프린트의 매칭 결과를 포함할 수 있다.
제2 응답에 포함된 매칭 결과는 디스플레이 장치(200)가 송신한 오디오 핑거프린트에 매칭된 적어도 하나의 오디오 핑거프린트를 포함할 수 있다. 또한 제2 응답에 포함된 매칭 결과는 디스플레이 장치(200)가 송신한 비디오 핑거프린트 및 오디오 핑거프린트의 조합에 매칭된 비디오 핑거프린트 및 오디오 핑거프린트의 조합을 포함할 수 있다. 제2 응답은 매칭된 비디오 핑거프린트 및 오디오 핑거프린트의 조합에 대응하는 컨텐츠에 대한 정보를 포함할 수 있다.
한편, 디스플레이 장치(200)가 방영 또는 재생하는 컨텐츠가 서버(300)에서 둘 이상의 컨텐츠에 매칭 또는 대응될 수 있다. 즉, 서버(300)가 디스플레이 장치(200)로부터 수신한 비디오 핑거프린트 및 오디오 핑거프린트의 조합에 매칭되는 비디오 핑거프린트 및 오디오 핑거프린트의 조합이 둘 이상일 수 있다.
따라서, 제2 응답에 포함된 매칭 결과는 디스플레이 장치(200)가 송신한 오디오 핑거프린트에 매칭된 오디오 핑거프린트의 개수를 포함할 수 있다. 또한 매칭 결과는 디스플레이 장치(200)가 송신한 비디오 핑거프린트 및 오디오 핑거프린트의 조합이 멀티 매칭되었는지 여부에 대한 정보를 포함할 수 있다. 제2 응답은 디스플레이 장치(200)가 송신한 비디오 핑거프린트 및 오디오 핑거프린트의 조합에 매칭된 비디오 핑거프린트 및 오디오 핑거프린트의 조합 각각에 대응하는 컨텐츠에 대한 정보를 포함할 수 있다. 즉, 비디오 핑거프린트 및 오디오 핑거프린트의 조합이 멀티 매칭된 경우, 서버(300)는 제2 응답을 통해 멀티 매칭된 컨텐츠 모두에 대한 정보를 송신할 수 있다.
도 6은 일부 실시예에 따른 디스플레이 장치가 서버로부터 컨텐츠의 비디오 핑거프린트 또는 오디오 핑거프린트 매칭 결과를 수신하는 방법을 설명하기 위한 흐름도이다.
도 1 및 도 5에서 설명한 내용과 동일한 내용은 도 6에서 생략하기로 한다.
동작 610에서, 디스플레이 장치(200)는 디스플레이에서 표시되는 컨텐츠의 비디오 핑거프린트를 추출할 수 있다. 동작 620에서, 디스플레이 장치(200)는 추출된 비디오 핑거프린트를 서버(300)에 송신할 수 있다.
동작 630에서, 서버(300)는 데이터베이스에 저장된 비디오 핑거프린트들과 디스플레이 장치로부터 수신한 비디오 핑거프린트를 매칭할 수 있다.
동작 640 에서, 서버(300)는 매칭 결과를 디스플레이 장치(200)에 송신할 수 있다. 서버(300)는 매칭 결과를 포함하는 제1 응답을 디스플레이 장치(200)에 송신할 수 있다. 동작 630 및 동작 640의 자세한 내용은 도 5의 동작 530에서 설명한 내용과 대응된다.
동작 650 에서, 디스플레이 장치(200)는 추출된 비디오 핑거프린트가 멀티 매칭되었는지 여부를 판단할 수 있다.
동작 660 에서, 추출된 비디오 핑거프린트가 멀티 매칭된 경우, 디스플레이 장치(200)는 디스플레이에서 표시되는 컨텐츠의 오디오 핑거프린트를 추출할 수 있다.
동작 670 에서, 디스플레이 장치(200)는 추출된 오디오 핑거프린트를 서버(300)로 송신할 수 있다.
동작 680 에서, 서버(300)는 데이터베이스에 저장된 오디오 핑거프린트들과 디스플레이 장치로부터 수신한 오디오 핑거프린트를 매칭할 수 있다.
동작 690에서, 서버(300)는 매칭 결과를 디스플레이 장치(200)에 송신할 수 있다. 서버(300)는 매칭 결과를 포함하는 제2 응답을 디스플레이 장치(200)에 송신할 수 있다. 동작 650 내지 동작 690의 자세한 내용은 동작 540에서 설명한 내용과 대응된다.
동작 695에서, 디스플레이 장치(200)는 컨텐츠에 대한 정보를 획득할 수 있다. 컨텐츠로부터 추출한 비디오 핑거프린트가 싱글 매칭된 경우, 디스플레이 장치(200)는 동작 640에서 서버(300)로부터 수신한 제1 응답에 기초하여 컨텐츠에 대한 정보를 획득할 수 있다. 컨텐츠로부터 추출한 비디오 핑거프린트가 멀티 매칭된 경우, 디스플레이 장치(200)는 동작 690에서 서버(300)로부터 수신한 제2 응답에 기초하여 컨텐츠에 대한 정보를 획득할 수 있다.
도 7은 일부 실시예에 따른 디스플레이 장치가 컨텐츠의 비디오 핑거프린트가 멀티 매칭되었는지 여부에 기초하여 오디오 핑거프린트의 추출을 중지하는 방법을 설명하기 위한 흐름도이다.
도 1, 도 5 및 도 6에서 설명한 내용과 동일한 내용은 도 7에서 생략하기로 한다.
동작 710에서, 디스플레이 장치(200)는 디스플레이에서 표시되는 컨텐츠의 비디오 핑거프린트를 소정의 시간 간격에 따라 추출할 수 있다.
디스플레이 장치(200)에서 방영 또는 재생되는 컨텐츠는 시간에 따라 변경될 수 있다. 예를 들어 사용자로부터 채널을 변경하는 입력을 수신하는 것에 대응하여, 또는 디스플레이 장치(200)가 수신하는 방송 컨텐츠의 변동에 대응하여 방영 또는 재생되는 컨텐츠가 변경될 수 있다. 디스플레이 장치(200)는 현재 방영 또는 재생되는 컨텐츠를 식별하고 컨텐츠에 대한 정보를 획득하기 위해 소정의 시간 간격에 따라 컨텐츠의 비디오 핑거프린트를 추출할 수 있다. 전술한 소정의 시간 간격은 예를 들어 500ms일 수 있고, 물론 이에 한정되지 않으며 다양하게 정해질 수 있다. 또한 예를 들어, 디스플레이 장치(200)는 사용자가 채널을 변경하는 것에 대응하여 비디오 핑거프린트를 추출할 수도 있다.
동작 720 에서, 디스플레이 장치(200)는 추출된 비디오 핑거프린트를 서버에 송신할 수 있다. 도 1에서 설명한 바와 같이, 디스플레이 장치(200)가 추출된 핑거프린트를 서버(300)에 송신하는 것을 컨텐츠 식별 요청이라고 지칭할 수 있다.
동작 730 에서, 디스플레이 장치(200)는 서버(300)로부터 서버(300)에 저장된 비디오 핑거프린트들과 추출된 비디오 핑거프린트의 매칭 결과를 수신할 수 있다. 디스플레이 장치(200)는 서버(300)로부터 전술한 매칭 결과를 포함하는 제1 응답을 수신할 수 있다. 동작 730의 자세한 내용은 도 5의 동작 530에서 설명한 내용과 대응될 수 있다.
동작 740 에서, 디스플레이 장치(200)는 비디오 핑거프린트가 멀티 매칭 되었는지 여부를 판단할 수 있다. 동작 740의 자세한 내용은 도 5의 동작 540에서 설명한 내용과 대응될 수 있다.
동작 750 에서, 추출된 비디오 핑거프린트가 멀티 매칭된 경우, 디스플레이 장치(200)는 디스플레이에서 표시되는 컨텐츠의 오디오 핑거프린트를 소정의 시간 간격에 따라 추출할 수 있다.
종래의 디스플레이 장치는 디스플레이에서 표시되는 컨텐츠의 비디오 핑거프린트 및 오디오 핑거프린트 각각을 주기적으로 추출하였다. 따라서 비디오 핑거프린트가 싱글 매칭되어 비디오 핑거프린트 만으로 컨텐츠를 싱글 매칭할 수 있는 경우에도 디스플레이 장치가 주기적으로 컨텐츠의 오디오 핑거프린트를 추출하는 데에 리소스를 사용하였다.
본 개시의 디스플레이 장치(200)는 비디오 핑거프린트가 멀티 매칭된 것에 대응해서 오디오 핑거프린트를 주기적으로 추출함으로써, 컨텐츠를 매칭하는 데에 사용되는 리소스를 저감할 수 있다.
디스플레이 장치(200)가 컨텐츠의 오디오 핑거프린트를 추출하는 소정의 시간 간격은 예를 들어 500ms일 수 있고, 물론 이에 한정되지 않으며 다양하게 정해질 수 있다.
동작 760 에서, 디스플레이 장치(200)는 추출된 오디오 핑거프린트를 서버에 송신할 수 있다.
동작 770 에서, 디스플레이 장치(200)는 서버로부터 서버에 저장된 오디오 핑거프린트들 중, 추출된 비디오 핑거프린트에 매칭된 복수의 비디오 핑거프린트들에 대응하는 복수의 컨텐츠에 대응하는 각각의 오디오 핑거프린트와, 추출된 오디오 핑거프린트의 매칭 결과를 수신할 수 있다.
디스플레이 장치(200)는 전술한 매칭 결과를 포함하는 제2 응답을 수신할 수 있다. 동작 770의 자세한 내용은 도 5의 동작 540에서 설명한 내용과 대응될 수 있다.
전술한 매칭 결과에 따를 때, 디스플레이 장치(200)가 추출한 비디오 핑거프린트 및 오디오 핑거프린트의 조합이, 서버에 저장된 비디오 핑거프린트 및 오디오 핑거프린트의 조합과 싱글 매칭된 경우, 디스플레이 장치(200)에서 표시되는 컨텐츠가 서버에 저장된 컨텐츠와 싱글 매칭된다. 컨텐츠가 싱글 매칭된 경우, 디스플레이 장치(200)는 오디오 핑거프린트의 추출을 중지할 수 있다.
반면, 전술한 매칭 결과에 따를 때, 디스플레이 장치(200)가 추출한 비디오 핑거프린트 및 오디오 핑거프린트의 조합이, 서버에 저장된 비디오 핑거프린트 및 오디오 핑거프린트의 복수의 조합과 멀티 매칭된 경우, 디스플레이 장치(200)에서 표시되는 컨텐츠가 서버에 저장된 복수의 컨텐츠와 멀티 매칭된다. 컨텐츠가 멀티 매칭된 경우, 디스플레이 장치(200)는 오디오 핑거프린트의 추출을 중지하지 않고 소정의 시간 간격에 따라 계속 추출할 수 있다.
동작 780에서, 추출된 비디오 핑거프린트가 멀티 매칭되지 않은 경우, 즉 추출된 비디오 핑거프린트가 싱글 매칭된 경우, 디스플레이 장치(200)는 오디오 핑거프린트의 추출 동작이 진행중인지 여부를 판단할 수 있다.
도 7에 도시된 디스플레이 장치(200)의 동작 710 내지 동작 790의 제 동작 과정은 반복될 수 있다. 동작 710이 시작되기 이전의 동작 과정에서 비디오 핑거프린트가 멀티 매칭된 경우, 동작 750 및 동작 770에서 설명한 바와 같이 현재 디스플레이 장치(200)는 컨텐츠의 오디오 핑거프린트를 소정의 시간 간격에 따라 추출하고 있을 수 있다. 디스플레이 장치(200)는 현재 디스플레이 장치(200)가 컨텐츠의 오디오 핑거프린트를 소정의 시간 간격에 따라 추출하고 있는 중인지 여부를 판단할 수 있다.
동작 790에서, 오디오 핑거프린트의 추출 동작이 진행중인 경우, 디스플레이 장치(200)는 오디오 핑거프린트의 추출을 중지할 수 있다. 예를 들어, 디스플레이 장치(400)는 오디오 핑거프린트 추출 모듈(452)에 오디오 신호의 PCM(Pulse-Code Modulation) 데이터를 전달하는 것을 중지함으로써 오디오 핑거프린트의 추출을 중지할 수 있다.
본 개시의 디스플레이 장치(200)는 비디오 핑거프린트가 싱글 매칭된 경우 오디오 핑거프린트의 추출을 중지함으로써, 컨텐츠를 매칭하는 과정에서 디스플레이 장치(200)가 오디오 핑거프린트를 추출하는 동작, 서버(300)로 송신하는 동작, 및 서버(300)가 오디오 핑거프린트를 수신하는 동작 등에 사용되는 리소스를 저감할 수 있다.
일부 실시예에 따른 디스플레이 장치의 동작방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 전술한 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 전술한 매체에 기록되는 프로그램 명령은 본 개시를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 전술한 컴퓨터 판독 가능 매체는 컴퓨터 프로그램 제품에 포함될 수 있다.
컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다.
이상에서 실시예들에 대하여 상세하게 설명하였지만 본 개시의 권리범위는 이에 한정되는 것은 아니고 다음의 청구범위에서 정의하고 있는 본 개시의 기본 개념을 이용한 당업자의 여러 변형 및 개량 형태 또한 본 개시의 권리범위에 속한다.

Claims (11)

  1. 디스플레이 장치에 있어서,
    디스플레이;
    통신부;
    하나 이상의 인스트럭션을 포함하는 메모리; 및
    상기 메모리에 저장된 하나 이상의 인스트럭션을 실행하는 프로세서를 포함하고,
    상기 프로세서는 상기 하나 이상의 인스트럭션을 실행함으로써,
    상기 디스플레이에서 표시되는 컨텐츠의 비디오 핑거프린트를 추출하고,
    상기 추출된 비디오 핑거프린트를 서버에 송신하고,
    상기 서버로부터 상기 서버에 저장된 비디오 핑거프린트들과 상기 추출된 비디오 핑거프린트의 매칭 결과를 포함하는 제1 응답을 수신하고,
    상기 제1 응답에 따라, 상기 추출된 비디오 핑거프린트가 상기 서버에 저장된 복수의 비디오 핑거프린트들과 매칭된 경우, 상기 디스플레이에서 표시되는 컨텐츠의 오디오 핑거프린트를 추출하고,
    상기 추출된 오디오 핑거프린트를 상기 서버에 송신하고,
    상기 서버로부터 상기 서버에 저장된 오디오 핑거프린트들과 상기 추출된 오디오 핑거프린트의 매칭 결과를 포함하는 제2 응답을 수신하도록 제어하는, 디스플레이 장치.
  2. 제1항에 있어서,
    상기 제2 응답은, 상기 서버에 저장된 오디오 핑거프린트들 중, 상기 추출된 비디오 핑거프린트에 매칭된 상기 복수의 비디오 핑거프린트들에 대응하는 복수의 컨텐츠에 대응하는 각각의 오디오 핑거프린트와, 상기 추출된 오디오 핑거프린트의 매칭 결과를 포함하는, 디스플레이 장치.
  3. 제1항에 있어서,
    상기 제1 응답은, 상기 추출된 비디오 핑거프린트에 매칭된 적어도 하나의 비디오 핑거프린트에 대응하는 컨텐츠에 대한 정보를 포함하고,
    상기 제2 응답은, 상기 추출된 비디오 핑거프린트에 매칭된 상기 복수의 비디오 핑거프린트들 및 상기 추출된 오디오 핑거프린트에 매칭된 오디오 핑거프린트의 조합에 대응하는 컨텐츠에 대한 정보를 포함하는, 디스플레이 장치.
  4. 제1항에 있어서,
    상기 프로세서는, 상기 하나 이상의 인스트럭션을 실행함으로써,
    상기 디스플레이에서 표시되는 컨텐츠의 비디오 핑거프린트 및 오디오 핑거프린트를 소정의 시간 간격에 따라 추출하고,
    상기 제1 응답에 따라, 상기 추출된 비디오 핑거프린트가 상기 서버에 저장된 복수의 비디오 핑거프린트들과 매칭된 경우, 상기 디스플레이에서 표시되는 컨텐츠의 오디오 핑거프린트를 소정의 시간 간격에 따라 추출하고,
    상기 제1 응답에 따라, 상기 추출된 비디오 핑거프린트가 상기 서버에 저장된 하나의 비디오 핑거프린트와 매칭된 경우, 상기 오디오 핑거프린트의 추출을 중지하는, 디스플레이 장치.
  5. 제1항에 있어서,
    상기 제1 응답은, 상기 추출된 비디오 핑거프린트의 시간 구간 중, 상기 추출된 비디오 핑거프린트가 상기 서버에 저장된 복수의 비디오 핑거프린트들과 매칭된 시간 구간에 대한 정보를 포함하고,
    상기 프로세서는, 상기 하나 이상의 인스트럭션을 실행함으로써,
    상기 제1 응답에 기초하여, 상기 추출된 비디오 핑거프린트가 상기 복수의 비디오 핑거프린트들과 매칭된 시간 구간에 대해 상기 디스플레이에서 표시되는 컨텐츠의 오디오 핑거프린트를 추출하는, 디스플레이 장치.
  6. 디스플레이 장치의 동작 방법에 있어서,
    상기 디스플레이 장치의 디스플레이에서 표시되는 컨텐츠의 비디오 핑거프린트를 추출하는 동작;
    상기 추출된 비디오 핑거프린트를 서버에 송신하는 동작;
    상기 서버로부터 상기 서버에 저장된 비디오 핑거프린트들과 상기 추출된 비디오 핑거프린트의 매칭 결과를 포함하는 제1 응답을 수신하는 동작; 및
    상기 제1 응답에 따라, 상기 추출된 비디오 핑거프린트가 상기 서버에 저장된 복수의 비디오 핑거프린트들과 매칭된 경우, 상기 디스플레이에서 표시되는 컨텐츠의 오디오 핑거프린트를 추출하고,
    상기 추출된 오디오 핑거프린트를 상기 서버에 송신하고,
    상기 서버로부터 상기 서버에 저장된 오디오 핑거프린트들과 상기 추출된 오디오 핑거프린트의 매칭 결과를 포함하는 제2 응답을 수신하는 동작을 포함하는, 동작 방법.
  7. 제6항에 있어서,
    상기 제2 응답은,
    상기 서버에 저장된 오디오 핑거프린트들 중, 상기 추출된 비디오 핑거프린트에 매칭된 상기 복수의 비디오 핑거프린트들에 대응하는 복수의 컨텐츠에 대응하는 각각의 오디오 핑거프린트와, 상기 추출된 오디오 핑거프린트의 매칭 결과를 포함하는, 동작 방법.
  8. 제6항에 있어서,
    상기 제1 응답은,
    상기 추출된 비디오 핑거프린트에 매칭된 적어도 하나의 비디오 핑거프린트에 대응하는 컨텐츠에 대한 정보를 포함하고,
    상기 제2 응답은,
    상기 추출된 비디오 핑거프린트에 매칭된 상기 복수의 비디오 핑거프린트들 및 상기 추출된 오디오 핑거프린트에 매칭된 오디오 핑거프린트의 조합에 대응하는 컨텐츠에 대한 정보를 포함하는, 동작 방법.
  9. 제6항에 있어서,
    상기 디스플레이에서 표시되는 컨텐츠의 비디오 핑거프린트 및 오디오 핑거프린트를 소정의 시간 간격에 따라 추출하는 동작;
    상기 제1 응답에 따라, 상기 추출된 비디오 핑거프린트가 상기 서버에 저장된 복수의 비디오 핑거프린트들과 매칭된 경우, 상기 디스플레이에서 표시되는 컨텐츠의 오디오 핑거프린트를 소정의 시간 간격에 따라 추출하는 동작; 및
    상기 제1 응답에 따라, 상기 추출된 비디오 핑거프린트가 상기 서버에 저장된 하나의 비디오 핑거프린트와 매칭된 경우, 상기 오디오 핑거프린트의 추출을 중지하는 동작을 포함하는, 동작 방법.
  10. 제6항에 있어서,
    상기 제1 응답은, 상기 추출된 비디오 핑거프린트의 시간 구간 중, 상기 추출된 비디오 핑거프린트가 상기 서버에 저장된 복수의 비디오 핑거프린트들과 매칭된 시간 구간에 대한 정보를 포함하고,
    상기 디스플레이에서 표시되는 컨텐츠의 오디오 핑거프린트를 추출하는 동작은,
    상기 제1 응답에 기초하여, 상기 추출된 비디오 핑거프린트가 상기 복수의 비디오 핑거프린트들과 매칭된 시간 구간에 대해 상기 디스플레이에서 표시되는 컨텐츠의 오디오 핑거프린트를 추출하는 것인, 동작 방법.
  11. 디스플레이 장치의 디스플레이에서 표시되는 컨텐츠의 비디오 핑거프린트를 추출하는 동작;
    상기 추출된 비디오 핑거프린트를 서버에 송신하는 동작;
    상기 서버로부터 상기 서버에 저장된 비디오 핑거프린트들과 상기 추출된 비디오 핑거프린트의 매칭 결과를 포함하는 제1 응답을 수신하는 동작; 및
    상기 제1 응답에 따라, 상기 추출된 비디오 핑거프린트가 상기 서버에 저장된 복수의 비디오 핑거프린트들과 매칭된 경우, 상기 디스플레이에서 표시되는 컨텐츠의 오디오 핑거프린트를 추출하고,
    상기 추출된 오디오 핑거프린트를 상기 서버에 송신하고,
    상기 서버로부터 상기 서버에 저장된 오디오 핑거프린트들과 상기 추출된 오디오 핑거프린트의 매칭 결과를 포함하는 제2 응답을 수신하는 동작을 수행하도록 하는 프로그램이 저장된 기록매체를 포함하는 컴퓨터 프로그램 제품.
PCT/KR2019/015928 2018-11-20 2019-11-20 디스플레이 장치 및 그 동작 방법 WO2020106056A1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
US17/290,551 US11722708B2 (en) 2018-11-20 2019-11-20 Display device and operating method therefor

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020180143901A KR20200059060A (ko) 2018-11-20 2018-11-20 디스플레이 장치 및 그 동작 방법
KR10-2018-0143901 2018-11-20

Publications (1)

Publication Number Publication Date
WO2020106056A1 true WO2020106056A1 (ko) 2020-05-28

Family

ID=70773157

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2019/015928 WO2020106056A1 (ko) 2018-11-20 2019-11-20 디스플레이 장치 및 그 동작 방법

Country Status (3)

Country Link
US (1) US11722708B2 (ko)
KR (1) KR20200059060A (ko)
WO (1) WO2020106056A1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20230111006A (ko) * 2022-01-17 2023-07-25 삼성전자주식회사 디스플레이 장치의 동작 방법 및 이를 위한 장치

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013047948A1 (ko) * 2011-09-26 2013-04-04 (주)엔써즈 방송 콘텐츠와 연관된 콘텐츠 연관 정보를 제공하는 시스템 및 방법
KR20150104422A (ko) * 2014-03-05 2015-09-15 삼성전자주식회사 디스플레이 장치, 서버 장치 및 디스플레이 장치의 이벤트 정보 제공 방법
KR20170069057A (ko) * 2015-12-10 2017-06-20 삼성전자주식회사 컨텐츠 처리장치, 그의 컨텐츠 처리방법, 서버, 서버의 정보 제공방법 및 정보제공 시스템
WO2017116052A1 (ko) * 2015-12-28 2017-07-06 삼성전자 주식회사 컨텐트 인식 장치 및 그 동작 방법
KR20180105751A (ko) * 2016-02-29 2018-09-28 그레이스노트, 인코포레이티드 레퍼런스 스트림 비교에 기반한 멀티 매칭 검출을 통한 미디어 채널 식별 및 동작

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9430474B2 (en) * 2014-01-15 2016-08-30 Microsoft Technology Licensing, Llc Automated multimedia content recognition
US9930406B2 (en) * 2016-02-29 2018-03-27 Gracenote, Inc. Media channel identification with video multi-match detection and disambiguation based on audio fingerprint

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013047948A1 (ko) * 2011-09-26 2013-04-04 (주)엔써즈 방송 콘텐츠와 연관된 콘텐츠 연관 정보를 제공하는 시스템 및 방법
KR20150104422A (ko) * 2014-03-05 2015-09-15 삼성전자주식회사 디스플레이 장치, 서버 장치 및 디스플레이 장치의 이벤트 정보 제공 방법
KR20170069057A (ko) * 2015-12-10 2017-06-20 삼성전자주식회사 컨텐츠 처리장치, 그의 컨텐츠 처리방법, 서버, 서버의 정보 제공방법 및 정보제공 시스템
WO2017116052A1 (ko) * 2015-12-28 2017-07-06 삼성전자 주식회사 컨텐트 인식 장치 및 그 동작 방법
KR20180105751A (ko) * 2016-02-29 2018-09-28 그레이스노트, 인코포레이티드 레퍼런스 스트림 비교에 기반한 멀티 매칭 검출을 통한 미디어 채널 식별 및 동작

Also Published As

Publication number Publication date
KR20200059060A (ko) 2020-05-28
US11722708B2 (en) 2023-08-08
US20220014803A1 (en) 2022-01-13

Similar Documents

Publication Publication Date Title
WO2014007502A1 (en) Display apparatus, interactive system, and response information providing method
WO2015099276A1 (en) Display apparatus, server apparatus, display system including them, and method for providing content thereof
WO2013012107A1 (ko) 전자 기기 및 그 제어 방법
WO2018186592A1 (en) Electronic device and operating method thereof
WO2018131806A1 (en) Electronic apparatus and method of operating the same
WO2013187715A1 (en) Server and method of controlling the same
WO2017018733A1 (en) Display apparatus and method for controlling a screen of display apparatus
WO2015002384A1 (en) Server, control method thereof, image processing apparatus, and control method thereof
WO2015133789A1 (en) Display apparatus and control method thereof
WO2016137134A1 (en) Broadcast receiving apparatus and method for controlling the same
WO2016129840A1 (en) Display apparatus and information providing method thereof
WO2021145597A1 (en) Electronic device and operating method thereof
WO2017052072A1 (ko) 영상 표시 장치 및 그 동작 방법
WO2018164547A1 (en) Image display apparatus and operation method thereof
WO2017135776A1 (en) Display apparatus, user terminal apparatus, system, and controlling method thereof
WO2018088784A1 (en) Electronic apparatus and operating method thereof
WO2020071870A1 (en) Image display device and method of providing broadcast program information
WO2017146518A1 (en) Server, image display apparatus, and method of operating the image display apparatus
WO2020106056A1 (ko) 디스플레이 장치 및 그 동작 방법
WO2017119735A1 (en) Display device and operation method thereof
WO2018034535A1 (en) Display apparatus and content display method thereof
EP3622722A1 (en) Display apparatus and method for providing content thereof
WO2018016760A1 (ko) 전자 장치 및 그의 제어 방법
WO2020159102A1 (en) Electronic apparatus and control method thereof
WO2020184856A1 (ko) 방송 수신 장치 및 그 동작방법

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 19887877

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 19887877

Country of ref document: EP

Kind code of ref document: A1