KR20150078930A

KR20150078930A - 컨텐츠를 제공하는 방법 및 장치

Info

Publication number: KR20150078930A
Application number: KR1020130168792A
Authority: KR
Inventors: 이주용; 김종안; 김진한
Original assignee: 주식회사 케이티
Priority date: 2013-12-31
Filing date: 2013-12-31
Publication date: 2015-07-08

Abstract

컨텐츠 제공 장치는 컨텐츠 재생 장치에게 비디오 컨텐츠를 전송하는 컨텐츠 전송부, 사용자 단말로부터 음성 정보를 수신하는 음성 정보 수신부, 음성 정보에 기설정된 제 1 키워드 또는 제 2 키워드가 포함되어있는지 판단하는 음성 정보 분석부 및 제 1 키워드 또는 제 2 키워드의 포함여부에 기초하여, 음성 정보가 수신된 시점에 대응하는 비디오 컨텐츠의 재생 시점에 개인 태그 또는 공용 태그를 등록하는 태그 등록부를 포함할 수 있다.

Description

컨텐츠를 제공하는 방법 및 장치{METHOD OF PROVIDING CONTENT AND APPARATUS THEREFOR}

본 발명은 컨텐츠를 제공하는 방법 및 장치에 관한 것이다.

IPTV(Internet Protocol Television)란 초고속 인터넷 망을 이용하여 영화와 방송프로그램과 같은 동영상 컨텐츠와 인터넷 검색 등 다양한 멀티미디어 컨텐츠를 텔레비전 수상기로 제공하는 양방향 방송 및 통신 장치이다.

시청자는 리모컨을 이용하여 간단하게 인터넷 검색은 물론 영화 감상, 홈쇼핑, 홈뱅킹, 온라인 게임, MP3 등 인터넷이 제공하는 다양한 컨텐츠 및 부가 서비스를 IPTV로부터 제공받을 수 있다.

사용자 단말로부터 수신된 음성 정보를 이용하여 비디오 컨텐츠에 태그를 등록하고자 한다. 다만, 본 실시예가 이루고자 하는 기술적 과제는 상기된 바와 같은 기술적 과제들로 한정되지 않으며, 또 다른 기술적 과제들이 존재할 수 있다.

상술한 기술적 과제를 달성하기 위한 기술적 수단으로서, 본 발명의 제 1 측면에 따른 컨텐츠 제공 장치는 컨텐츠 재생 장치에게 비디오 컨텐츠를 전송하는 컨텐츠 전송부, 사용자 단말로부터 음성 정보를 수신하는 음성 정보 수신부, 상기 음성 정보에 기설정된 제 1 키워드 또는 제 2 키워드가 포함되어있는지 판단하는 음성 정보 분석부 및 상기 제 1 키워드 또는 상기 제 2 키워드의 포함여부에 기초하여, 상기 음성 정보가 수신된 시점에 대응하는 상기 비디오 컨텐츠의 재생 시점에 개인 태그 또는 공용 태그를 등록하는 태그 등록부를 포함하는 것을 특징으로 할 수 있다.

한편, 본 발명의 제 2 측면에 따른 컨텐츠 제공 방법은 컨텐츠 재생 장치에게 비디오 컨텐츠를 전송하는 단계, 사용자 단말로부터 음성 정보를 수신하는 단계, 상기 음성 정보에 기설정된 제 1 키워드 또는 제 2 키워드가 포함되어있는지 판단하는 단계 및 상기 제 1 키워드 또는 상기 제 2 키워드의 포함여부에 기초하여, 상기 음성 정보가 수신된 시점에 대응하는 상기 비디오 컨텐츠의 재생 시점에 개인 태그 또는 공용 태그를 등록하는 단계를 포함하는 것을 특징으로 할 수 있다.

상술한 과제 해결 수단은 단지 예시적인 것으로서, 본 발명을 제한하려는 의도로 해석되지 않아야 한다. 상술한 예시적인 실시예 외에도, 도면 및 발명의 상세한 설명에 기재된 추가적인 실시예가 존재할 수 있다.

전술한 본 발명의 과제 해결 수단 중 어느 하나에 의하면, 컨텐츠 제공 장치는 사용자 단말로부터 수신된 음성 정보를 이용하여 비디오 컨텐츠에 태그를 등록할 수 있다.

도 1은 본 발명의 일 실시예에 따른, 컨텐츠 제공 시스템의 구성도이다.
도 2는 본 발명의 일 실시예에 따른, 도 1에 도시된 컨텐츠 제공 장치의 구성도이다.
도 3a 및 3b는 본 발명의 일 실시예에 따른, 비디오 컨텐츠에 태그를 등록하는 방법을 나타낸 도면이다.
도 4는 본 발명의 일 실시예에 따른, 등록된 태그를 표시하는 방법을 나타낸 도면이다.
도 5는 본 발명의 일 실시예에 따른, 등록된 태그를 검색하는 방법을 나타낸 도면이다.
도 6은 본 발명의 일 실시예에 따른, 컨텐츠를 제공하는 방법을 나타낸 동작 흐름도이다.

아래에서는 첨부한 도면을 참조하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 본 발명의 실시예를 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.

명세서 전체에서, 어떤 부분이 다른 부분과 "연결"되어 있다고 할 때, 이는 "직접적으로 연결"되어 있는 경우뿐 아니라, 그 중간에 다른 소자를 사이에 두고 "전기적으로 연결"되어 있는 경우도 포함한다. 또한 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미한다.

본 명세서에 있어서 '부(部)'란, 하드웨어에 의해 실현되는 유닛(unit), 소프트웨어에 의해 실현되는 유닛, 양방을 이용하여 실현되는 유닛을 포함한다. 또한, 1 개의 유닛이 2 개 이상의 하드웨어를 이용하여 실현되어도 되고, 2 개 이상의 유닛이 1 개의 하드웨어에 의해 실현되어도 된다.

본 명세서에 있어서 단말 또는 디바이스가 수행하는 것으로 기술된 동작이나 기능 중 일부는 해당 단말 또는 디바이스와 연결된 서버에서 대신 수행될 수도 있다. 이와 마찬가지로, 서버가 수행하는 것으로 기술된 동작이나 기능 중 일부도 해당 서버와 연결된 단말 또는 디바이스에서 수행될 수도 있다.

이하, 첨부된 구성도 또는 처리 흐름도를 참고하여, 본 발명의 실시를 위한 구체적인 내용을 설명하도록 한다.

도 1은 본 발명의 일 실시예에 따른, 컨텐츠 제공 시스템의 구성도이다.

도 1을 참조하면, 컨텐츠 제공 시스템은 컨텐츠 제공 장치(100), 컨텐츠 재생 장치(200), 사용자 단말(300), 복수의 사용자 단말(350), 및 음악 DB(400)를 포함할 수 있다. 다만, 이러한 도 1의 컨텐츠 제공 시스템은 본 발명의 일 실시예에 불과하므로 도 1을 통해 본 발명이 한정 해석되는 것은 아니며, 본 발명의 다양한 실시예들에 따라 도 1과 다르게 구성될 수도 있다.

컨텐츠 제공 장치(100)는 컨텐츠 재생 장치(200)에게 비디오 컨텐츠를 전송할 수 있다. 여기서, 비디오 컨텐츠는 드라마, 영화, 스포츠, 연예오락, 종교, 교육, 음악, 게임, 애니메이션 및 다큐와 같이 다양한 장르를 포함하는 VOD 컨텐츠일 수 있다.

컨텐츠 제공 장치(100)는 사용자 단말(300)로부터 음성 정보를 수신할 수 있다. 이 때, 컨텐츠 재생 장치(200)는 수신된 음성 정보가 기설정된 제 1 키워드 또는 제 2 키워드를 포함하는지 판단할 수 있다.

컨텐츠 제공 장치(100)는 수신된 음성 정보에 기설정된 제 1 키워드 또는 제 2 키워드가 포함하고 있는지 여부에 기초하여, 해당 음성 정보가 수신된 시점에 대응하는 비디오 컨텐츠의 재생 시점에 개인 태그 또는 공용 태그를 등록할 수 있다. 예를 들어, 컨텐츠 제공 장치(100)가 제 1 키워드를 '태그'로 설정하고, 제 2 키워드를 '문의'로 설정할 경우, 컨텐츠 제공 장치(100)는 사용자 단말(300)로부터 수신한 음성 정보에 '태그'가 포함되어 있는지 '문의'가 포함되어 있는지 판단하고, '태그'가 포함된 음성 정보를 개인 태그로 등록할 수 있고, '문의'가 포함된 음성 정보에 대한 답변을 공용 태그로 등록할 수 있다.

이와 같은 컨텐츠 제공 장치(100)의 동작에 대해서는 아래 도 2에서 자세히 설명된다.

컨텐츠 재생 장치(200)는 컨텐츠 제공 장치(100)로부터 비디오 컨텐츠를 전송받을 수 있다. 나아가, 컨텐츠 재생 장치(200)는 수신된 비디오 컨텐츠에 포함된 음악 데이터에 대응하는 음악 정보를 컨텐츠 제공 장치(100)로부터 수신하고, 수신된 정보를 디스플레이에 표시할 수 있다. 이러한, 컨텐츠 재생 장치(200)의 일 예에는 IPTV(Internet Protocol Television), 스마트 TV(Smart TV), 커넥티드 TV(Connected TV), 셋탑박스(STB, Set Top Box), 인터넷 TV(Internet Television), 웹 TV(Web Television), 컴퓨터 모니터 중 어느 하나일 수 있다.

또한, 컨텐츠 재생 장치(200)는 사용자 단말(300)에 의해 등록 요청한 복수의 개인 태그를 포함하는 개인 태그 리스트를 컨텐츠 제공 장치(100)로부터 수신하고, 수신된 내용을 디스플레이에 표시할 수 있다. 이 때, 개인 태그 리스트에는, 개인 태그로 등록한 태그 내용, 등록된 태그에 대응하는 비디오 컨텐츠의 재생 시점 정보, 시리즈 컨텐츠에 포함된 비디오 컨텐츠의 회차 정보 등이 포함될 수 있다. 또한, 컨텐츠 재생 장치(200)는 복수의 사용자 단말(350)에 의해 등록 요청된 복수의 공용 태그를 포함하는 공용 태그 리스트를 컨텐츠 제공 장치(100)로부터 수신할 수도 있다.

컨텐츠 재생 장치(200)는 컨텐츠 제공 장치(100)에 의해 생성된 개인 태그에 대한 개인 인터페이스 또는 공용 태그에 대한 공용 인터페이스를 디스플레이에 표시할 수 있다. 구체적으로, 컨텐츠 재생 장치(200)는 카테고리 별로, 복수의 공용 태그가 나열된 공용 인터페이스를 디스플레이에 표시할 수 있다. 여기서, 카테고리의 종류는 OST 카테고리, 대사 카테고리, 배경 및 명장면 카테고리를 포함할 수 있다. 다만, 앞서 언급한 카테고리 종류는 본 발명의 일 예로서, 카테고리의 종류는 4개로 한정되는 것은 아니다.

또한, 컨텐츠 재생 장치(200)는 공용 인터페이스에 포함된 카테고리 각각에 대한 카테고리 인터페이스를 디스플레이에 표시할 수 있다.

컨텐츠 재생 장치(200)는 비디오 컨텐츠에 포함된 음악 데이터가 출력될 경우, 해당 음악 데이터에 대한 음악명을 디스플레이의 일부 영역에 표시할 수 있다. 이 때, 음악 데이터에 대한 음악명은 컨텐츠 재생 장치(200)로부터 수신된 것일 수 있다.

컨텐츠 재생 장치(200)는 사용자 단말(300)이 디스플레이에 표시된 음악명에 대응하는 음악 정보를 컨텐츠 제공 장치(100)에게 요청할 경우, 컨텐츠 제공 장치(100)로부터 해당 음악 정보를 전송받고, 전송받은 음악 정보를 디스플레이에 표시할 수 있다. 이 때, 사용자 단말(300)은 컨텐츠 제공 장치(100)로부터 해당 음악 정보를 수신할 수도 있다.

사용자 단말(300)은 사용자 단말(300)의 사용자로부터 수신한 음성 정보를 컨텐츠 제공 장치(100)에게 전송할 수 있다. 구체적으로, 사용자 단말(300)은 개인 태그를 등록하기 위한 음성 정보를 컨텐츠 제공 장치(100)에게 전송할 수 있다. 또한, 사용자 단말(300)은 비디오 컨텐츠에 포함된 음악 데이터에 대한 정보(예를 들어, 비디오 컨텐츠에 포함된 음악 제목 등)를 요청하는 음성 정보를 컨텐츠 제공 장치(100)에게 전송할 수 있다.

사용자 단말(300)은 디스플레이에 표시된 음악명에 대응하는 음악 정보를 컨텐츠 제공 장치(100)에게 요청할 수 있고, 해당 음악 정보를 컨텐츠 제공 장치(100)로부터 수신할 수 있다.

복수의 사용자 단말(350)은 복수의 사용자 단말(300) 각각에 대응하는 복수의 사용자로부터 수신한 음성 정보를 컨텐츠 제공 장치(100)에게 전송할 수 있다.

사용자 단말(300) 및 복수의 사용자 단말(350)은 마이크가 장착된 리모컨이거나, 네트워크(500)를 통해 원격지의 서버에 접속할 수 있는 휴대용 단말일 수 있다. 휴대용 단말의 일 예에는 휴대성과 이동성이 보장되는 무선 통신 장치로서, PCS(Personal Communication System), GSM(Global System for Mobile communications), PDC(Personal Digital Cellular), PHS(Personal Handyphone System), PDA(Personal Digital Assistant), IMT(International Mobile Telecommunication)-2000, CDMA(Code Division Multiple Access)-2000, W-CDMA(W-Code Division Multiple Access), Wibro(Wireless Broadband Internet) 단말, 스마트폰(smartphone), HUD(Head-Up Display), 태블릿 PC 등과 같은 모든 종류의 핸드헬드(Handheld) 기반, HMD(Head-Mount Display)의 무선 통신 장치가 포함될 수 있다.

음악 DB(400)는 복수의 비디오 컨텐츠에 포함된 음악 데이터에 대응하는 음악 정보를 저장할 수 있다. 여기서 음악 정보에는 음악의 제목, 가사 및 아티스트 명을 포함할 수 있다.

일반적으로, 도 1의 컨텐츠 제공 시스템의 각 구성요소들은 네트워크(500)를 통해 연결될 수 있다. 네트워크(500)는 단말들 및 서버들과 같은 각각의 노드 상호 간에 정보 교환이 가능한 연결 구조를 의미하는 것으로, 이러한 네트워크(network)의 일례에는 3GPP(3rd Generation Partnership Project) 네트워크, LTE(Long Term Evolution) 네트워크, WIMAX(World Interoperability for Microwave Access) 네트워크, 인터넷(Internet), LAN(Local Area Network), Wireless LAN(Wireless Local Area Network), WAN(Wide Area Network), PAN(Personal Area Network), 블루투스(Bluetooth) 네트워크, 위성 방송 네트워크, 아날로그 방송 네트워크, DMB(Digital Multimedia Broadcasting) 네트워크 등이 포함되나 이에 한정되지는 않는다.

이하에서는 도 1의 컨텐츠 제공 시스템의 각 구성요소의 동작에 대해 보다 구체적으로 설명한다.

도 2는 본 발명의 일 실시예에 따른, 도 1에 도시된 컨텐츠 제공 장치(100)의 구성도이다.

도 2를 참조하면, 컨텐츠 제공 장치(100)는 컨텐츠 전송부(210), 음성 정보 수신부(220), 음성 정보 분석부(230), 태그 등록부(240), 음원 분리부(250), 텍스트 변환부(260), 프레임 분석부(270) 및 인터페이스 생성부(280)를 포함할 수 있다. 다만, 도 2에 도시된 컨텐츠 제공 장치(100)는 본 발명의 하나의 구현 예에 불과하며, 도 2에 도시된 구성요소들을 기초로 하여 여러 가지 변형이 가능하다. 예를 들어, 컨텐츠 제공 장치(100)는 이용자로부터 어떤 명령 내지 정보를 입력 받기 위한 유저 인터페이스가 더 포함될 수 있다. 이 경우, 유저 인터페이스는 일반적으로 키보드, 마우스 등과 같은 입력 장치가 될 수도 있으나, 영상 표시 장치에 표현되는 그래픽 유저 인터페이스(GUI, Graphical User interface)가 될 수도 있다.

컨텐츠 전송부(210)는 컨텐츠 재생 장치(200)에게 비디오 컨텐츠를 전송할 수 있다. 여기서, 비디오 컨텐츠는 VOD 컨텐츠를 포함할 수 있다.

음성 정보 수신부(220)는 비디오 컨텐츠에 태그 등록을 요청하는 음성 정보를 사용자 단말(300)로부터 수신할 수 있다. 여기서, 태그 등록을 요청하는 음성 정보는 컨텐츠 제공 장치(100)에 의해 기설정된 제 1 키워드 또는 제 2 키워드를 포함할 수 있다. 이 때, 제 1 키워드 또는 제 2 키워드는 비디오 컨텐츠에 태그 등록을 위한 키워드일 수 있다. 구체적으로, 제 1 키워드가 '태그' 또는 '등록'으로, 제 2 키워드가 '알려주세요' 또는 '문의'로 기설정되어 있을 경우, 비디오 컨텐츠의 태그 등록은 사용자 단말(300)의 음성 정보에 해당 제 1 키워드 또는 제 2 키워드가 포함되어 있어야만 가능할 수 있다.

구체적으로, 음성 정보 수신부(220)는 비디오 컨텐츠의 재생 시점에 대응하는 음성 정보를 사용자 단말(300)로부터 수신할 수 있다. 이 때, 음성 정보는 제 1 키워드 또는 제 2 키워드 및 태그로 등록할 내용을 포함할 수 있다. 예를 들어, 사용자 단말(300)로부터 '태그, 이게 최선입니까?'를 포함하는 음성 정보를 수신할 경우, 비디오 컨텐츠의 재생 시점에 '이게 최선입니까?' 키워드가 개인 태그로서 등록될 수 있다.

또한, 음성 정보 수신부(220)는 사용자 단말(300)을 포함하는 복수의 사용자 단말(350)로부터 비디오 컨텐츠의 재생 시점에 대응하는 복수의 음성 정보를 수신할 수 있다. 이 때, 복수의 음성 정보 각각은 제 1 키워드 또는 제 2 키워드 및 태그로 등록할 내용을 포함할 수 있다.

음성 정보 분석부(230)는 사용자 단말(300)로부터 수신한 음성 정보가 컨텐츠 제공 장치(100)에 의해 기설정된 제 1 키워드 또는 제 2 키워드와 일치하는지를 판단할 수 있다. 여기서, 제 1 키워드는 비디오 컨텐츠에 태그 등록을 하기 위한 키워드일 수 있고, 제 2 키워드는 사용자 단말(300)의 질의에 대한 응답과 관련한 키워드일 수 있다. 예를 들어, 제 1 키워드가 '태그'이고, 제 2 키워드가 '문의'라고 기설정될 경우, 음성 정보 분석부(230)는 사용자 단말(300)로부터 수신한 음성 정보에 '태그'가 포함되어 있는지 '문의'가 포함되어 있는지 판단할 수 있다.

태그 등록부(240)는 수신한 음성 정보가 제 1 키워드 또는 제 2 키워드를 포함하고 있는지 여부에 기초하여, 해당 음성 정보가 수신된 시점에 대응하는 비디오 컨텐츠의 재생 시점에 개인 태그 또는 공용 태그를 등록할 수 있다. 이 때, 등록된 개인 태그 또는 공용 태그는 음성 정보가 수신된 시간 정보 및 태그로 등록할 키워드를 포함할 수 있다. 예를 들어, 사용자 단말(300)로부터 '태그, 이게 최선입니까?'를 포함하는 음성 정보를 5분 20초(비디오 컨텐츠의 재생 시점 기준)에 수신할 경우, 태그 등록부(240)는 '이게 최선입니까?' 키워드 및 해당 음성 정보가 수신된 시점에 대응하는 비디오 컨텐츠의 재생 시점 정보를 DB에 저장하고, '이게 최선입니까?'를 개인 태그로 등록할 수 있다.

구체적으로, 태그 등록부(240)는 제 1 키워드가 포함된 음성 정보를 개인 태그로서 등록하고, 제 2 키워드가 포함된 음성 정보에 대응하는 응답을 공용 태그로서 등록할 수 있다. 또한, 태그 등록부(240)는 복수의 사용자 단말(350)로부터 수신된 복수의 음성 정보(이 때, 음성 정보에는 제 1 키워드가 포함된 것일 수 있음)를 취합하여 수정된 정보를 공용 태그로서 등록할 수 있다. 이 때, 태그 등록부(240)는 공용 태그에 대한 카테고리를 결정하고, 공용 태그를 결정된 카테고리에 매칭시킬 수 있다. 여기서, 카테고리는 OST, 대사, 배경 및 명장면을 포함할 수 있다. 예를 들어, 복수의 사용자 단말(350)로부터 '태그, 그 남자'를 포함하는 음성 정보를 수신할 경우, 태그 등록부(240)는 음성 정보에 포함된 '그 남자'를 공용 태그로 등록하고, 해당 등록된 공용 태그를 OST 카테고리에 매칭시킬 수 있다.

태그 등록부(240)는 텍스트로 변환된 음성 정보 및 텍스트로 변환된 음성 데이터(비디오 컨텐츠에 포함된 대사)를 이용하여 해당 음성 정보에 대응하는 공용 태그를 대사 카테고리로 결정할 수 있다. 예를 들어, 비디오 컨텐츠에 '이게 최선입니까'를 포함하는 음성 데이터와 사용자 단말(300)로부터 수신한 음성 정보(예를 들어, '이게 최선입니까')에 포함된 태그가 일치할 경우, 태그 등록부(240)는 해당 음성 정보에 포함된 태그를 대사 카테고리에 포함시킬 수 있다.

태그 등록부(240)는 음성 정보에 포함된 태그에 대응하는 음악 데이터(비디오 컨텐츠에 포함된 음악 데이터)가 존재할 경우, 해당 음성 정보에 포함된 태그를 OST 카테고리로 결정할 수 있다. 구체적으로, 태그 등록부(240)는 비디오 컨텐츠에 포함된 음악 데이터에 대응하는 음악의 제목, 가사, 및 아티스트명을 포함하는 음악 정보를 음악 DB(400)로부터 획득하고, 획득된 음악 정보를 이용하여 음성 정보에 대응하는 개인 태그 또는 공용 태그를 OST 카테고리로 결정할 수 있다. 이 때, 획득된 음악 정보는 컨텐츠 재생 장치(200)의 디스플레이의 기설정된 영역에 표시될 수도 있다.

태그 등록부(240)는 비디오 컨텐츠로부터 추출된 장면 전환 시점을 이용하여 음성 정보에 대응하는 개인 태그 또는 공용 태그를 배경 카테고리 및/또는 명장면 카테고리로 결정할 수 있다. 또한, 태그 등록부(240)는 추출된 장면 전환 시점에 대응하는 시간 정보를 해당 개인 태그 또는 공용 태그와 함께 해당 카테고리에 매칭시킬 수 있다. 예를 들어, 비디오 컨텐츠에 '안면도'를 배경으로 하는 장면이 재생되고 있는 시점에서, 사용자 단말(350)로부터 '안면도'를 포함하는 음성 정보가 수신될 경우, 태그 등록부(240)는 '안면도'를 개인 태그로 등록하고, 등록된 개인 태그를 배경 카테고리 및/또는 명장면 카테고리로 결정할 수 있다.

태그 등록부(240)는 복수의 사용자 단말(350)로부터 수신한 음성 정보에 포함된 태그를 하나의 공용 태그로 등록하기 위하여, 비디오 컨텐츠를 기설정된 시간 단위로 나누고, 나뉜 하나의 시간 단위에 포함된 복수의 음성 정보를 하나의 공용 태그로서 등록할 수 있다. 여기서, 복수의 음성 정보는 복수의 사용자 단말(350)로부터 수신된 전체의 복수의 음성 정보 중 해당 시간 단위에 포함된 음성 정보일 수 있다. 이 때, 태그 등록부(240)는 복수의 음성 정보에 포함된 태그 중, 태그 간에 유사도가 높은 복수의 태그를 하나의 공용 태그로서 등록할 수 있다.

태그 등록부(240)는 하나의 시간 단위(기설정된 시간 단위)에 포함된 복수의 음성 정보를 하나의 공용 태그로서 등록하되, 등록되지 않은 음성 정보에 포함된 태그를 카운팅할 수 있다. 또한, 태그 등록부(240)는 공용 태그로 등록된 태그도 카운팅할 수 있다. 이 때, 카운팅 수는 태그의 크기를 결정하는데 이용될 수 있다.

이하에서는 비디오 컨텐츠에 태그를 등록하는 방법에 대해 보다 구체적으로 설명한다.

도 3a 및 3b는 본 발명의 일 실시예에 따른, 비디오 컨텐츠에 태그를 등록하는 방법을 나타낸 도면이다.

도 3a는 비디오 컨텐츠에 개인 태그를 등록하는 방법을 나타낸 도면이다.

컨텐츠 제공 장치(100)는 사용자 단말(300)로부터 수신한 음성 정보가 제 1 키워드 또는 제 2 키워드를 포함하고 있는지를 판단하고, 해당 음성 정보가 제 1 키워드 또는 제 2 키워드를 포함하고 있을 경우, 해당 음성 정보에 포함된 태그를 태그로 등록할 수 있다.

예를 들어, 제 1 키워드가 '태그'로 기설정되었다고 가정하겠다. 컨텐츠 제공 장치(100)가 사용자 단말(300)로부터 '태그, 이게 최선입니까'를 포함하는 음성 정보를 수신할 경우, 컨텐츠 제공 장치(100)는 수신된 음성 정보에 제 1 키워드가 포함되었음을 확인하고, 해당 음성 정보에 포함된 '이게 최선입니까'를 개인 태그로 등록할 수 있다. 또한, 컨텐츠 제공 장치(100)는 해당 음성 정보가 수신된 시점에 대응하는 비디오 컨텐츠의 재생 시점 정보를 저장할 수 있다.

다른 예로, 제 2 키워드가 '문의'로 기설정되었다고 가정하겠다. 컨텐츠 제공 장치(100)가 사용자 단말(300)로부터 '문의! 이 부분의 음악 이름이 뭐예요?'를 포함하는 음성 정보를 수신할 경우, 컨텐츠 제공 장치(100)는 수신된 음성 정보에 제 2 키워드가 포함되었음을 확인하고, 해당 음성 정보가 수신된 시점에 대응하는 비디오 컨텐츠에 포함된 음악 데이터를 검색하고, 검색된 음악 데이터(예를 들어, 그남자)를 개인 태그 또는 공용 태그로 등록할 수 있다.

컨텐츠 제공 장치(100)는 등록된 복수의 개인 태그 중, 사용자 단말(300)로부터 선택된 개인 태그에 대응하는 비디오 컨텐츠를 재생할 수 있다. 구체적으로, 컨텐츠 제공 장치(100)는 선택된 개인 태그에 대응하는 비디오 컨텐츠의 재생 시점 정보에 기초하여, 비디오 컨텐츠를 해당 재생 시점부터 재생할 수 있다.

앞서 설명된 예시들은 공용 태그에도 적용될 수 있다.

도 3b는 비디오 컨텐츠에 공용 태그를 등록하는 방법을 나타낸 도면이다.

컨텐츠 제공 장치(100)는 복수의 사용자 단말(350)로부터 수신한 음성 정보에 포함된 태그를 하나의 공용 태그로 등록할 수 있다.

구체적으로, 컨텐츠 제공 장치(100)는 비디오 컨텐츠를 기설정된 시간 단위로 나누고, 하나의 시간 단위에 포함된 복수의 음성 정보 각각을 형태소로 분리하고, 분리된 형태소의 분석을 통해 복수의 음성 정보가 유사한지를 판단할 수 있다. 만일, 유사하다고 판단되는 음성 정보는 하나의 공용 태그로서 등록될 수 있다.

예를 들어, 비디오 컨텐츠가 재생되고 있는 상태에서, 10초의 시간 단위 동안, 복수의 음성 정보가 1초, 2초, 4초, 6초에 수신되었다고 가정하고, 이 때, 1초에 수신된 음성 정보는 '이게 최선입니까'이고, 2초에 수신된 음성 정보는 '최선입니까'이고, 4초에 수신된 음성 정보는 '현빈 유행어'이고, 6초에 수신된 음성 정보는 '현빈 최선'이라고 가정하겠다.

컨텐츠 제공 장치(100)는 10초 간격 동안 수신된 4개의 음성 정보(32) 각각을 형태소로 분리(33)한 후, 음성 정보에 '최선'을 포함하고 있는 1초에 수신된 음성 정보(35), 2초에 수신된 음성 정보(36) 및 6초에 수신된 음성 정보(38)를 유사도가 높은 음성 정보로 판단할 수 있다. 또한, 컨텐츠 제공 장치(100)는 유사도가 높은 복수의 음성정보(35, 36, 38)를 동일 태그로 인식하고, 해당 복수의 음성 정보(35, 36, 38) 중 1초에 수신된 음성 정보(35)를 공용 태그로 결정할 수 있다. 만일, 앞서 공용 태그로 결정한 10초 이후, 10초 간격 동안, 이전에 결정된 공용 태그와 유사도가 높은 음성 정보가 수신될 경우, 컨텐츠 제공 장치(100)는 해당 음성 정보를 이전에 결정된 공용 태그로 등록할 수 있다. 이와 반대로, 10초 이후 이전에 결정된 공용 태그와 유사도가 낮은 음성 정보가 수신될 경우, 해당 음성 정보는 별도의 공용태그로 등록할 수 있다.

다시 도 2를 참조하면, 음원 분리부(250)는 비디오 컨텐츠에 포함된 음성 데이터와 음악 데이터를 분리할 수 있다. 구체적으로, 음원 분리부(250)는 비디오 컨텐츠에 포함된 음원의 파형이 기설정된 시간동안 유지되는지에 기초하여 음원을 음성 데이터 또는 음악 데이터로서 분리할 수 있다. 예를 들어, 기설정된 시간이 5초라 가정할 경우, 비디오 컨텐츠에 포함된 음원의 파형이 5초 이상 유지되면, 음원 분리부(250)는 해당 음원을 음악 데이터로 인식할 수 있다. 이 때, 음원이 음성 데이터일 경우, 해당 음성 데이터는 텍스트 변환부(260)에서 텍스트로 변환될 수 있다. 만일 음원이 음악 데이터일 경우, 해당 음악 데이터는 태그 등록부(240)에서 해당 음악 데이터에 대응하는 음악 정보(음악의 제목, 가사, 및 아티스트명 등)를 검색하는데 이용될 수 있다. 또한, 음원 분리부(250)는 분리된 음성 데이터와 음악 데이터가 송출되는 시점에 대응하는 시간 정보를 DB에 저장할 수 있다. 구체적으로, 음원 분리부(250)는 분리된 음성 데이터가 송출되는 시점에 대응하는 시간 정보와 텍스트로 변환된 음성 데이터를 DB에 저장할 수 있다. 또한, 음원 분리부(250)는 분리된 음악 데이터가 송출되는 시점에 대응하는 시간 정보와 해당 음악 데이터에 대응하는 음악 정보를 DB에 저장할 수 있다.

텍스트 변환부(260)는 사용자 단말(300)로부터 수신된 음성 정보 및 음원 분리부(250)로부터 분리된 음성 데이터를 텍스트로 변환할 수 있다.

프레임 분석부(270)는 비디오 컨텐츠에 포함된 복수의 프레임을 분석하여 복수의 장면 전환 시점을 추출할 수 있다. 이 때, 추출된 장면 전환 시점은 사용자 단말(300)로부터 수신된 음성 정보에 대응하는 태그(개인 태그 또는 공용 태그)가 배경 카테고리 및/또는 명장면 카테고리에 대응되는지를 판단하는데 이용될 수 있다. 구체적으로, 수신된 음성 정보에 대응하는 태그가 추출된 장면 전환 시점의 장면을 나타내는 키워드일 경우, 해당 태그는 배경 카테고리 및/또는 명장면 카테고리에 포함될 수 있다.

인터페이스 생성부(280)는 개인 태그에 대한 개인 인터페이스 또는 공용 태그에 대한 공용 인터페이스를 생성할 수 있다. 여기서, 공용 인터페이스는 복수의 카테고리(OST 카테고리, 대사 카테고리, 배경 및 명장면 카테고리) 각각에 대응하는 복수의 공용 태그가 나열된 것일 수 있다. 또한, 공용 인터페이스는 복수의 공용 태그 각각에 대응하는 비디오 컨텐츠의 재생 시점의 썸네일을 복수의 공용 태그 각각에 매칭시켜 나타낸 것일 수 있다. 여기서, 공용 인터페이스에 포함된 복수의 공용 태그 각각의 크기는 공용 태그 각각의 개수에 대응하여 서로 다르게 결정될 수 있다. 이 때, 공용 태그의 개수는 태그의 선호도에 대응되는 것일 수 있다.

이하에는 공용 태그 각각의 크기를 결정하는 방법을 구체적으로 설명하겠다.

공용 태그 각각의 크기는 기설정된 공용 태그의 최소 크기(예를 들어, 가로x세로=300x150 pixel) 및 최대 크기(예를 들어, 가로x세로=600x3000 pixel)에 기초하여, 결정될 수 있다. 이 때, 공용 태그의 최소 크기 및 최대 크기는 컨텐츠 제공 장치(100)에 의해 기설정될 수 있다.

컨텐츠 제공 장치(100)는 공용 태그의 개수를 전체 공용 태그의 개수로 나누고, 나눈 값을 해당 공용 태그의 비율로 결정할 수 있다. 이 때, 컨텐츠 제공 장치(100)는 결정된 해당 공용 태그의 비율에 1을 더한 후, 기설정된 최소 공용 태그의 크기 즉, 가로길이 및 세로길이 각각에, 1이 더해진 해당 공용 태그의 비율을 곱하여 해당 공용 태그의 크기를 계산할 수 있다. 만일, 해당 공용 크기가 기설정된 최대 공용 태그의 크기를 초과할 경우, 해당 공용 크기는 기설정된 최대 공용 태그의 크기로 결정될 수 있다.

예를 들어, 복수의 사용자 단말(350)로부터 수신한 음성 정보에 대응하는 공용 태그 중 어느 하나의 공용 태그가 '똑바로'이고, '똑바로'를 태그로 등록 요청한 개수가 30개이고, 복수의 사용자 단말(350)에 의해 등록된 전체 공용 태그의 개수가, 2000개이고, 기설정된 공용 태그의 최소 크기가 300x150 pixel라고 가정하자. 해당 공용 태그('똑바로')의 비율은 0.015(=30/2000)이고, 결정된 해당 공용 태그의 비율에 1을 더한 값은 1.015이 될 수 있다. 1.015를 기설정된 공용 태그의 최소 크기 300(가로 길이)와 150(세로 길이) 각각에 곱하면, 해당 공용 태그('똑바로')의 크기가 결정되는데, 이 때 결정되는 해당 공용 태그('똑바로')의 가로 길이는 304.5 pixel(=300x1.015)이고, 세로 길이는 152.25 pixel(=150x1.015)이 될 수 있다.

다시 도 2를 참조하면, 인터페이스 생성부(280)는 공용 인터페이스에 포함된 카테고리(OST 카테고리, 대사 카테고리, 배경 및 명장면 카테고리) 각각에 대한 카테고리 인터페이스(OST 인터페이스, 대사 인터페이스, 배경 및 명장면 인터페이스)를 더 생성할 수 있다. 여기서, 카테고리 인터페이스는 공용 인터페이스에 포함된 카테고리 각각을 상세하게 보여주는 인터페이스일 수 있다. 이 때, 카테고리 인터페이스에 포함된 공용 태그의 수는 공용 인터페이스에 포함된 해당 카테고리에 대하여 나열된 공용 태그의 수보다 많고, 카테고리 인터페이스에 포함된 공용 태그는 카테고리 인터페이스의 테두리를 따라 나열된 것일 수 있다. 공용 인터페이스 및 카테고리 인터페이스에 나타난 공용 태그는 비디오 컨텐츠의 재생 시간 순서로 나열된 것일 수 있다.

이하에서는 등록된 태그를 표시하는 방법에 대해 보다 구체적으로 설명한다.

도 4는 본 발명의 일 실시예에 따른, 등록된 태그를 표시하는 방법을 나타낸 도면이다.

도면 부호 41은 공용 태그에 대한 공용 인터페이스를 나타낸 도면이다.

컨텐츠 제공 장치(100)는 복수의 카테고리 별로 나열된 공용 태그 각각의 크기를 다르게 결정할 수 있다. 이 때, 공용 태그의 크기는 등록된 공용 태그에 대응하는 태그 등록 요청 횟수와 비례할 수 있다. 즉, 공용 태그의 크기는 등록된 공용 태그의 개수에 비례할 수 있다. 예를 들어, 30명의 복수의 사용자 단말(350)로부터 '그 남자'가 공용 태그로 등록되고, 20명의 복수의 사용자 단말(350)로부터 '한 여자'가 공용 태그로 등록될 경우, 컨텐츠 제공 장치(100)는 '그 남자'가 등록된 공용 태그의 크기를 '한 여자'가 등록된 공용 태그의 크기보다 상대적으로 크게 결정할 수 있다.

컨텐츠 제공 장치(100)는 복수의 카테고리(OST 카테고리, 대사 카테고리, 배경 및 명장면 카테고리) 별로, 각각의 카테고리에 대응하는 복수의 공용 태그를 나열할 수 있다. 이 때, 카테고리 별로 나열된 복수의 공용 태그는 비디오 컨텐츠의 재생 시간 순서대로 나열된 것일 수 있다. 또한, 컨텐츠 제공 장치(100)는 비디오 컨텐츠의 재생 시간 순서대로 나열된 복수의 공용 태그를 순번을 함께 표시할 수 있다.

예를 들어, 도면부호 41에서 OST 카테고리에 포함된 공용 태그 중, '그 남자'를 포함하는 공용 태그가 다른 공용 태그들보다 앞서 배치된 이유는 '그 남자'에 대응하는 비디오 컨텐츠의 재생 시간이 다른 공용 태그에 대응하는 비디오 컨텐츠의 재생 시간보다 빠른 이유일 수 있다.

컨텐츠 제공 장치(100)는 카테고리 별로 나열된 복수의 공용 태그 중 어느 하나를 사용자 단말(300)로부터 선택 받을 경우, 선택된 공용 태그에 대응하는 비디오 컨텐츠의 섬네일을 사용자 단말(300)에게 제공하거나, 해당 공용 태그에 대응하는 비디오 컨텐츠의 재생 시점으로 점핑하여 해당 시점부터 해당 비디오 컨텐츠를 재생할 수 있다. 예를 들어, 사용자 단말(300)로부터 'OST 카테고리에서 4번'을 포함하는 음성 정보를 수신할 경우, 컨텐츠 제공 장치(100)는 해당 음성 정보에 대응하는 공용 태그가 '한 여자'임을 확인하고, 공용 태그 '한 여자'가 등록된 비디오 컨텐츠의 재생 시점부터 해당 비디오 컨텐츠를 재생할 수 있다.

앞서 설명한 내용은 개인 태그에 대한 개인 인터페이스에도 적용될 수 있다.

도면 부호 42는 카테고리 인터페이스를 나타낸 도면이다.

컨텐츠 제공 장치(100)는 공용 인터페이스에 포함된 복수의 카테고리(OST 카테고리, 대사 카테고리, 배경 및 명장면 카테고리) 중, 복수의 카테고리 각각을 상세하게 보여주는 카테고리 인터페이스를 생성할 수 있다. 카테고리 인터페이스는 복수의 카테고리의 개수에 대응하는 것으로서, OST 인터페이스, 대사 인터페이스, 배경 및 명장면 인터페이스를 포함할 수 있다. 이 때, 카테고리 인터페이스에 포함된 공용 태그의 수는 공용 인터페이스에 포함된 해당 카테고리에 대하여 나열된 공용 태그의 수보다 많을 수 있다.

컨텐츠 제공 장치(100)는 카테고리 인터페이스에 포함된 공용 태그를 카테고리 인터페이스의 테두리를 따라 나열시킬 수 있다. 이 때, 카테고리 인터페이스에 나타난 공용 태그는 비디오 컨텐츠의 재생 시간 순서로 나열된 것일 수 있다. 예를 들어, 컨텐츠 제공 장치(100)는 OST 인터페이스에 포함된 공용 태그를 비디오 컨텐츠의 재생 시간 순서 및 U 모양으로 차례로 나열시킬 수 있다.

또한, 컨텐츠 제공 장치(100)는 공용 태그에 대응하는 비디오 컨텐츠의 재생 시점의 썸네일을 해당 공용 태그 각각에 매칭시켜 표시할 수 있다.

다시 도 2를 참조하면, 인터페이스 생성부(280)는 비디오 컨텐츠가 시리즈 컨텐츠인 경우, 시리즈 컨텐츠에 포함된 복수의 비디오 컨텐츠에 대한 시리즈 인터페이스를 더 생성할 수 있다. 구체적으로, 인터페이스 생성부(280)는 수신된 음성 정보에 대응하는 등록된 공용 태그가 시리즈 컨텐츠에 포함된 복수의 비디오 컨텐츠에 복수개 등록되어 있을 경우, 해당 음성 정보에 대응하는 공용 태그가 등록된 비디오 컨텐츠의 회차 정보 및 해당 비디오 컨텐츠의 재생 시점의 시간 정보를 포함하는 시리즈 인터페이스를 생성할 수 있다. 이 때, 인터페이스 생성부(280)는 컨텐츠 재생 장치(200)의 디스프레이 상에 표시된 복수의 등록된 공용 태그(음성 정보에 대응하는 공용 태그임) 중, 사용자 단말(300)에 의해 선택된 공용 태그에 대해서, 해당 선택된 공용 태그에 대응하는 비디오 컨텐츠의 재생 시점으로 점핑하는 시리즈 인터페이스를 생성할 수 있다.

예를 들어, 사용자 단말(300)로부터 '이게 최선입니까'를 포함하는 음성 정보를 수신할 경우, 인터페이스 생성부(280)는 해당 음성 정보에 대응하는 공용 태그가 등록된 비디오 컨텐츠의 회차 정보 및 해당 비디오 컨텐츠의 재생 시점의 시간 정보(예를 들어, 1회 비디오 컨텐츠, 1회 비디오 컨텐츠 중 23분에 등록된 공용 태그)를 포함하는 공용 태그 리스트를 컨텐츠 재생 장치(200)의 디스프레이 상에 표시할 수 있다. 또한, 디스프레이 상에 표시된 공용 태그 리스트 중, 어느 하나를 사용자 단말(300)로부터 선택받을 경우, 인터페이스 생성부(280)는 선택된 공용 태그에 대응하는 비디오 컨텐츠의 재생 시점(공용 태그가 등록된 시점과 대응됨)으로 점핑할 수 있다.

이하에서는 등록된 태그를 검색하는 방법에 대해 보다 구체적으로 설명한다.

도 5는 본 발명의 일 실시예에 따른, 등록된 태그를 검색하는 방법을 나타낸 도면이다.

도 5를 참조하면, 컨텐츠 제공 장치(100)는 사용자 단말(300)에 의해 등록 요청된 태그를 해당 태그의 등록 요청 시점에 대응하는 비디오 컨텐츠의 회차 정보 및 태그 등록 요청 시간 정보(비디오 컨텐츠의 재생 시점에 대응됨)와 함께 DB에 저장할 수 있다.

예를 들어, 컨텐츠 제공 장치(100)는 비디오 컨텐츠 1회, 23분(비디오 컨텐츠의 재생 시점에 대응하는 시간 정보)에 사용자 단말(300)로부터 수신한 음성 정보에 포함된 ' 태그, 이게 최선입니까' 중 '이게 최선입니까'를 개인 태그로 등록하고, 해당 태그와 함께 비디오 컨텐츠의 회차 정보 및 비디오 컨텐츠의 재생 시점에 대응하는 시간 정보를 DB에 저장할 수 있다. 또한, 컨텐츠 제공 장치(100)는 비디오 컨텐츠 2회, 3분 및 30분에 사용자 단말(300)로부터 수신한 음성 정보에 포함된 ' 태그, 이게 최선입니까' 중 '이게 최선입니까'를 개인 태그로 등록할 수 있다.

컨텐츠 제공 장치(100)는 사용자 단말(300)로부터 등록된 복수의 태그(개인 태그 또는 공용 태그) 중 어느 하나에 대한 검색을 요청 받을 경우, 요청 받은 태그가 등록된 복수의 비디오 컨텐츠의 회차 정보 및 비디오 컨텐츠의 재생 시점에 대한 시간 정보를 포함하는 태그 리스트(50)를 컨텐츠 재생 장치(200)의 디스프레이 상에 표시할 수 있다. 이 때, 태그 리스트(50)는 복수의 등록된 태그들이 비디오 컨텐츠의 재생 시간 순으로 정렬되어 있을 수 있다.

예를 들어, 사용자 단말(300)로부터 '이게 최선입니까'에 대응하는 태그 검색을 요청 받을 경우, 컨텐츠 제공 장치(100)는 '이게 최선입니까'를 형태소로 분리하고, 분리된 내용과 유사한 태그(등록된 개인 태그 또는 공용 태그)를 DB에서 검색하고, 검색된 태그를 비디오 컨텐츠의 재생 시간 순으로 컨텐츠 재생 장치(200)의 디스프레이 상에 표시할 수 있다. 또한, 컨텐츠 제공 장치(100)는 디스플레이에 표시된 복수의 태그 중, 사용자 단말(300)에 의해 선택된 태그에 대하여, 해당 태그에 대응하는 비디오 컨텐츠의 섬네일을 화면에 표시하거나, 해당 태그에 대응하는 비디오 컨텐츠의 재생 시점(해당 태그가 등록 요청된 시점과 대응됨)부터 해당 비디오 컨텐츠를 재생할 수 있다.

다시 도 2를 참조하면, DB(미도시)는 데이터를 저장할 수 있다. 이 때, DB(미도시)는 컨텐츠 제공 장치(100) 내부의 각 구성요소들 간에 입력 및 출력되는 데이터, 컨텐츠 제공 장치(100)와 컨텐츠 제공 장치(100) 외부의 구성요소들간에 입력 및 출력되는 데이터를 저장할 수 있다. 이러한 DB(미도시)의 일 예에는 컨텐츠 제공 장치(100) 내부 또는 외부에 존재하는 하드디스크드라이브, ROM(Read Only Memory), RAM(Random Access Memory), 플래쉬메모리 및 메모리카드 등이 포함된다.

당업자라면, 컨텐츠 전송부(210), 음성 정보 수신부(220), 음성 정보 분석부(230), 태그 등록부(240), 음원 분리부(250), 텍스트 변환부(260), 프레임 분석부(270), 인터페이스 생성부(280) 및 DB(미도시) 각각이 분리되어 구현되거나, 이 중 하나 이상이 통합되어 구현될 수 있음을 충분히 이해할 것이다.

도 6은 본 발명의 일 실시예에 따른, 컨텐츠를 제공하는 방법을 나타낸 동작 흐름도이다. 도 6에 도시된 실시예에 따른 컨텐츠를 제공하는 방법은 도 1 내지 도 5에 도시된 실시예에 따른 컨텐츠 제공 장치(100), 컨텐츠 재생 장치(200), 사용자 단말(300), 복수의 사용자 단말(350) 및 음악 DB(400)에서 시계열적으로 처리되는 단계들을 포함한다. 따라서, 이하 생략된 내용이라고 하더라도 도 1 내지 도 5의 컨텐츠 제공 장치(100), 컨텐츠 재생 장치(200), 사용자 단말(300), 복수의 사용자 단말(350) 및 음악 DB(400)에 관하여 기술된 내용은 도 6에 도시된 실시예에 따른 컨텐츠를 제공하는 방법에도 적용될 수 있다.

도 6을 참조하면, 단계 S601에서 컨텐츠 제공 장치(100)는 컨텐츠 재생 장치(200)에게 비디오 컨텐츠를 전송할 수 있다.

단계 S603에서 컨텐츠 제공 장치(100)는 사용자 단말(300)로부터 음성 정보를 수신할 수 있다.

단계 S605에서 컨텐츠 제공 장치(100)는 단계 S603에서 사용자 단말(300)로부터 수신된 음성 정보에 기설정된 제 1 키워드 또는 제 2 키워드가 포함되어있는지 판단할 수 있다.

단계 S607에서 컨텐츠 제공 장치(100)는 단계 S605에서 해당 음성 정보에 제 1 키워드 또는 제 2 키워드가 포함되었는지의 판단여부에 기초하여, 해당 음성 정보가 수신된 시점에 대응하는 비디오 컨텐츠의 재생 시점에 개인 태그 또는 공용 태그를 등록할 수 있다.

상술한 설명에서, 단계 S601 내지 S607은 본 발명의 구현예에 따라서, 추가적인 단계들로 더 분할되거나, 더 적은 단계들로 조합될 수 있다. 또한, 일부 단계는 필요에 따라 생략될 수도 있고, 단계 간의 순서가 변경될 수도 있다.

본 발명의 일 실시예는 컴퓨터에 의해 실행되는 프로그램 모듈과 같은 컴퓨터에 의해 실행 가능한 명령어를 포함하는 기록 매체의 형태로도 구현될 수 있다. 컴퓨터 판독 가능 매체는 컴퓨터에 의해 액세스될 수 있는 임의의 가용 매체일 수 있고, 휘발성 및 비휘발성 매체, 분리형 및 비분리형 매체를 모두 포함한다. 또한, 컴퓨터 판독가능 매체는 컴퓨터 저장 매체 및 통신 매체를 모두 포함할 수 있다. 컴퓨터 저장 매체는 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈 또는 기타 데이터와 같은 정보의 저장을 위한 임의의 방법 또는 기술로 구현된 휘발성 및 비휘발성, 분리형 및 비분리형 매체를 모두 포함한다. 통신 매체는 전형적으로 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈, 또는 반송파와 같은 변조된 데이터 신호의 기타 데이터, 또는 기타 전송 메커니즘을 포함하며, 임의의 정보 전달 매체를 포함한다.

전술한 본 발명의 설명은 예시를 위한 것이며, 본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 예를 들어, 단일형으로 설명되어 있는 각 구성 요소는 분산되어 실시될 수도 있으며, 마찬가지로 분산된 것으로 설명되어 있는 구성 요소들도 결합된 형태로 실시될 수 있다.

본 발명의 범위는 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.

100: 컨텐츠 제공 장치
200: 컨텐츠 재생 장치
300: 사용자 단말
350: 복수의 사용자 단말
400: 음악 DB

Claims

컨텐츠 제공 장치에 있어서,
컨텐츠 재생 장치에게 비디오 컨텐츠를 전송하는 컨텐츠 전송부;
사용자 단말로부터 음성 정보를 수신하는 음성 정보 수신부;
상기 음성 정보에 기설정된 제 1 키워드 또는 제 2 키워드가 포함되어있는지 판단하는 음성 정보 분석부; 및
상기 제 1 키워드 또는 상기 제 2 키워드의 포함여부에 기초하여, 상기 음성 정보가 수신된 시점에 대응하는 상기 비디오 컨텐츠의 재생 시점에 개인 태그 또는 공용 태그를 등록하는 태그 등록부를 포함하는 컨텐츠 제공 장치.
제 1 항에 있어서,
상기 태그 등록부는 상기 제 1 키워드가 포함된 상기 음성 정보를 개인 태그로서 등록하고, 상기 제 2 키워드가 포함된 상기 음성 정보에 대응하는 응답을 공용 태그로서 등록하는 것인, 컨텐츠 제공 장치.
제 1 항에 있어서,
상기 음성 정보 수신부는 상기 사용자 단말을 포함하는 복수의 사용자 단말로부터 상기 비디오 컨텐츠의 재생 시점에 대응하는 복수의 음성 정보를 수신하고,
상기 태그 등록부는 상기 수신된 복수의 음성 정보를 취합하여 수정된 정보를 공용 태그로서 등록하는 것인, 컨텐츠 제공 장치.
제 1 항에 있어서,
상기 태그 등록부는 상기 공용 태그에 대한 카테고리를 결정하여 상기 공용 태그에 매칭시키는 것인, 컨텐츠 제공 장치.
제 4 항에 있어서,
상기 카테고리는 OST, 대사, 배경 및 명장면을 포함하는 것인, 컨텐츠 제공 장치.
제 5 항에 있어서,
상기 비디오 컨텐츠에 포함된 음성 데이터와 음악 데이터를 분리하는 음원 분리부를 더 포함하고,
상기 카테고리는 상기 분리된 결과를 이용하여 결정되는 것인, 컨텐츠 제공 장치.
제 6 항에 있어서,
상기 음원 분리부는 상기 비디오 컨텐츠에 포함된 음원의 파형이 기설정된 시간동안 유지되는지에 기초하여 상기 음원을 음성 데이터 또는 음악 데이터로서 분리하는 것인, 컨텐츠 제공 장치.
제 6 항에 있어서,
상기 수신된 음성 정보 및 상기 분리된 음성 데이터를 텍스트로 변환하는 텍스트 변환부를 더 포함하고,
상기 태그 등록부는 상기 텍스트로 변환된 음성 정보 및 상기 텍스트로 변환된 음성 데이터를 이용하여 상기 음성 정보에 대응하는 상기 공용 태그를 대사 카테고리로 결정하는 것인, 컨텐츠 제공 장치.
제 6 항에 있어서,
상기 태그 등록부는 상기 분리된 음악 데이터에 대응하는 음악의 제목, 가사, 및 아티스트명을 포함하는 음악 정보를 획득하고, 상기 획득된 음악 정보를 이용하여 상기 음성 정보에 대응하는 상기 공용 태그를 OST 카테고리로 결정하는 것인, 컨텐츠 제공 장치.
제 4 항에 있어서,
상기 비디오 컨텐츠에 포함된 복수의 프레임을 분석하여 복수의 장면 전환 시점을 추출하는 프레임 분석부를 더 포함하고,
상기 태그 등록부는 추출된 장면 전환 시점을 이용하여 상기 음성 정보에 대응하는 상기 공용 태그를 배경 카테고리 및/또는 명장면 카테고리로 결정하는 것인, 컨텐츠 제공 장치.
제 4 항에 있어서,
상기 개인 태그에 대한 개인 인터페이스 또는 상기 공용 태그에 대한 공용 인터페이스를 생성하는 인터페이스 생성부를 더 포함하는 컨텐츠 제공 장치.
제 11 항에 있어서,
상기 공용 인터페이스는 상기 결정된 카테고리 별로, 복수의 공용 태그가 나열된 것인, 컨텐츠 제공 장치.
제 12 항에 있어서,
상기 공용 인터페이스는 상기 복수의 공용 태그 각각에 대응하는 비디오 컨텐츠의 재생 시점의 썸네일을 상기 복수의 공용 태그 각각에 매칭시켜 나타내는 것인, 컨텐츠 제공 장치.
제 12 항에 있어서,
상기 공용 인터페이스에 포함된 복수의 공용 태그 각각의 크기는 서로 다르게 결정되는 것인, 컨텐츠 제공 장치.
제 14 항에 있어서,
상기 공용 태그 각각의 크기는 상기 공용 태그 각각의 개수에 대응하여 서로 다르게 결정되는 것인, 컨텐츠 제공 장치.
제 12 항에 있어서,
상기 인터페이스 생성부는 상기 공용 인터페이스에 포함된 카테고리 각각에 대한 카테고리 인터페이스를 더 생성하는 것인, 컨텐츠 제공 장치.
제 16 항에 있어서,
상기 카테고리 인터페이스에 포함된 공용 태그의 수는 상기 공용 인터페이스에 포함된 해당 카테고리에 대하여 나열된 공용 태그의 수보다 많고,
상기 카테고리 인터페이스에 포함된 공용 태그는 상기 카테고리 인터페이스의 테두리를 따라 나열된 것인, 컨텐츠 제공 장치.
제 16 항에 있어서,
상기 공용 인터페이스에 나타난 공용 태그 및 상기 카테고리 인터페이스에 나타난 공용 태그는 비디오 컨텐츠의 재생 시간 순서로 나열된 것인, 컨텐츠 제공 장치.
제 11 항에 있어서,
상기 인터페이스 생성부는 상기 비디오 컨텐츠가 시리즈 컨텐츠인 경우, 상기 시리즈 컨텐츠에 포함된 복수의 비디오 컨텐츠에 대한 시리즈 인터페이스를 더 생성하는 것인, 컨텐츠 제공 장치.
제 3 항에 있어서,
상기 태그 등록부는 상기 비디오 컨텐츠를 기설정된 시간 단위로 나누고, 상기 수신된 복수의 음성 정보 중 상기 나뉜 하나의 단위에 포함된 복수의 음성 정보를 하나의 공용 태그로서 등록하는 것인, 컨텐츠 제공 장치.
제 20 항에 있어서,
상기 태그 등록부는 상기 나뉜 하나의 단위에 포함된 복수의 음성 정보를 하나의 공용 태그로서 등록하되, 등록되지 않은 음성 정보에 대해서 카운팅하는 것인, 컨텐츠 제공 장치.
컨텐츠 제공 방법에 있어서,
컨텐츠 재생 장치에게 비디오 컨텐츠를 전송하는 단계;
사용자 단말로부터 음성 정보를 수신하는 단계;
상기 음성 정보에 기설정된 제 1 키워드 또는 제 2 키워드가 포함되어있는지 판단하는 단계; 및
상기 제 1 키워드 또는 상기 제 2 키워드의 포함여부에 기초하여, 상기 음성 정보가 수신된 시점에 대응하는 상기 비디오 컨텐츠의 재생 시점에 개인 태그 또는 공용 태그를 등록하는 단계를 포함하는 컨텐츠 제공 방법.