KR20140056618A - 콘텐츠 장면별 키워드 추출 서버 및 방법 - Google Patents

콘텐츠 장면별 키워드 추출 서버 및 방법 Download PDF

Info

Publication number
KR20140056618A
KR20140056618A KR1020120121132A KR20120121132A KR20140056618A KR 20140056618 A KR20140056618 A KR 20140056618A KR 1020120121132 A KR1020120121132 A KR 1020120121132A KR 20120121132 A KR20120121132 A KR 20120121132A KR 20140056618 A KR20140056618 A KR 20140056618A
Authority
KR
South Korea
Prior art keywords
content
scene
chat log
unit
keyword
Prior art date
Application number
KR1020120121132A
Other languages
English (en)
Inventor
박성찬
김희경
류창선
박성원
박종세
안동훈
한영호
Original Assignee
주식회사 케이티
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 케이티 filed Critical 주식회사 케이티
Priority to KR1020120121132A priority Critical patent/KR20140056618A/ko
Publication of KR20140056618A publication Critical patent/KR20140056618A/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/23418Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/04Real-time or near real-time messaging, e.g. instant messaging [IM]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/07User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail characterised by the inclusion of specific contents
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/21Monitoring or handling of messages
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/52User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail for supporting social networking services
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/235Processing of additional data, e.g. scrambling of additional data or processing content descriptors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/242Synchronization processes, e.g. processing of PCR [Program Clock References]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/812Monomedia components thereof involving advertisement data

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

콘텐츠 장면별 키워드 추출 서버 및 방법이 제공되며, 콘텐츠와 연관된 채팅 로그를 디바이스로부터 수집하는 수집부, 콘텐츠를 복수의 장면 구간으로 분할하는 분할부, 분할된 복수의 장면 구간 중 어느 하나의 장면과 채팅 로그의 일부 텍스트를 동기화시키는 동기화부, 및 어느 하나의 장면에 대응하는 키워드를 동기화된 채팅 로그의 일부 텍스트로부터 자동으로 추출하는 추출부를 포함한다.

Description

콘텐츠 장면별 키워드 추출 서버 및 방법{SERVER AND METHOD FOR EXTRACTING KEYWORD OF EACH SCENE FOR CONTENTS}
본 발명은 콘텐츠 장면별 키워드 추출 서버 및 방법에 관한 것이다.
최근 스마트 단말의 보급이 확산됨에 따라, 앱 기반 소셜 네트워크 서비스가 활발하게 이용되고 있는 추세이며, 그 일환으로 실시간 방송을 본 시청자들을 위하여, 실시간 방송을 보면서 해당 방송에 관련된 이야기를 나눌 수 있는 애플리케이션도 등장하고 있다.
이때, 웹과 앱(App) 기반 소셜 네트워크 서비스와 각종 블로그 등에 등록되는 채팅 로그들은 광고와 연계되는 것이 유일한 용도였다. 채팅 로그를 광고와 연계하는 방법과 관련하여, 선행기술인 한국등록특허 제10-0445812호에는 방송과 연계된 광고를 하는 방법이 개시되어 있으며, 회원들간의 대화 중 일정 횟수 이상 나타나는 단어에 대하여 상품을 연계하여 광고하는 방법이 개시되어 있다.
다만, 채팅 로그를 이용하여 광고를 하는 방법을 제공함에 있어서, 채팅 로그는 광고와 연계되는 것으로만 이용되고 있으며, 채팅 로그를 분석하는 것도 상품에 관련된 단어를 검색하고, 카운트하는 정도로 단순하고 그 정확도도 높지 않다.
본 발명의 일 실시예는, 채팅 로그를 콘텐츠에 연계시켜 콘텐츠 마이닝 문제를 텍스트 마이닝 문제로 치환할 수 있고, 채팅 로그의 분포도, 집중도 및 키워드를 추출함으로써, 콘텐츠의 시청률 집계와 메타데이터 태깅을 자동으로 할 수 있는 콘텐츠 장면별 키워드 추출 서버 및 방법을 제공할 수 있다. 다만, 본 실시예가 이루고자 하는 기술적 과제는 상기된 바와 같은 기술적 과제로 한정되지 않으며, 또 다른 기술적 과제들이 존재할 수 있다.
상술한 기술적 과제를 달성하기 위한 기술적 수단으로서, 본 발명의 일 실시예는 콘텐츠와 연관된 채팅 로그를 디바이스로부터 수집하는 수집부, 콘텐츠를 복수의 장면 구간으로 분할하는 분할부, 분할된 복수의 장면 구간 중 어느 하나의 장면과 채팅 로그의 일부 텍스트를 동기화시키는 동기화부, 및 어느 하나의 장면에 대응하는 키워드를 동기화된 채팅 로그의 일부 텍스트로부터 자동으로 추출하는 추출부를 포함하는 서버를 제공할 수 있다.
또한, 본 발명의 다른 실시예는, 콘텐츠와 연관된 채팅 로그를 디바이스로부터 수집하는 단계, 콘텐츠를 복수의 장면 구간으로 분할하는 단계, 분할된 복수의 장면 구간 중 어느 하나의 장면과 채팅 로그의 일부 텍스트를 동기화시키는 단계 및 어느 하나의 장면에 대응하는 키워드를 동기화된 채팅 로그의 일부 텍스트로부터 자동으로 추출하는 단계를 포함하는 방법을 제공할 수 있다.
전술한 본 발명의 과제 해결 수단 중 어느 하나에 의하면, 채팅 로그를 콘텐츠에 연계시켜 콘텐츠 마이닝 문제를 텍스트 마이닝 문제로 치환할 수 있고, 채팅 로그의 분포도, 집중도 및 키워드를 추출함으로써, 콘텐츠의 시청률 집계와 메타데이터 태깅을 자동으로 할 수 있다.
도 1은 본 발명의 일 실시예에 따른 콘텐츠 장면별 키워드 추출 시스템을 설명하기 위한 구성도이다.
도 2는 도 1에 도시된 콘텐츠 장면별 키워드 추출 서버를 설명하기 위한 구성도이다.
도 3은 도 1에 도시된 콘텐츠 장면별 키워드 추출 서버를 설명하기 위한 도면이다.
도 4는 본 발명의 일 실시예에 따른 도 1의 콘텐츠 장면별 키워드 추출 시스템에 포함된 각 구성들 상호간에 데이터가 송수신되는 과정을 나타낸 도면이다.
도 5는 본 발명의 일 실시예에 따른 콘텐츠 장면별 키워드 추출 시스템을 설명하기 위한 동작 흐름도이다.
아래에서는 첨부한 도면을 참조하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 본 발명의 실시예를 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.
명세서 전체에서, 어떤 부분이 다른 부분과 "연결"되어 있다고 할 때, 이는 "직접적으로 연결"되어 있는 경우뿐 아니라, 그 중간에 다른 소자를 사이에 두고 "전기적으로 연결"되어 있는 경우도 포함한다. 또한 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미하며, 하나 또는 그 이상의 다른 특징이나 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
이하 첨부된 도면을 참고하여 본 발명을 상세히 설명하기로 한다.
도 1은 본 발명의 일 실시예에 따른 콘텐츠 장면별 키워드 추출 시스템을 설명하기 위한 구성도이다. 도 1을 참조하면, 콘텐츠 장면별 키워드 추출 시스템(1)은 디바이스(100), 콘텐츠 장면별 키워드 추출 서버(300), 콘텐츠 제공 서버(400)를 포함할 수 있다.
이때, 도 1의 각 구성요소들은 일반적으로 네트워크(network, 200)를 통해 연결된다. 예를 들어, 도 1에 도시된 바와 같이, 디바이스(100)는 네트워크(200)를 통하여 콘텐츠 장면별 키워드 추출 서버(300)에 연결된다. 또한, 콘텐츠 장면별 키워드 추출 서버(300)는 네트워크(200)를 통하여 콘텐츠 제공 서버(400)와 연결될 수도 있다. 네트워크(200)는 단말들 및 서버들과 같은 각각의 노드 상호 간에 정보 교환이 가능한 연결 구조를 의미하는 것으로, 이러한 네트워크(200)의 일 예는, 인터넷(Internet), LAN(Local Area Network), Wireless LAN(Wireless Local Area Network), WAN(Wide Area Network), PAN(Personal Area Network), 3G, 4G, LTE 등이 포함되나 이에 한정되지는 않는다. 또한, 도 1에 개시된 디바이스(100), 콘텐츠 장면별 키워드 추출 서버(300) 및 콘텐츠 제공 서버(400)는 도 1에 도시된 것들로 한정 해석되는 것은 아니다.
도 1을 참조하면, 디바이스(100)는 네트워크(200)를 통하여 원격지의 서버에 접속할 수 있는 컴퓨터로 구현될 수 있다. 여기서, 컴퓨터는 예를 들어, 웹 브라우저(WEB Browser)가 탑재된 노트북, 데스크톱(Desktop), 랩톱(Laptop) 등을 포함할 수 있다. 또한, 디바이스(100)는 네트워크(200)를 통해 원격지의 서버에 접속할 수 있는 단말로 구현될 수 있다. 디바이스(100)는 예를 들어, 휴대성과 이동성이 보장되는 무선 통신 장치로서, PCS(Personal Communication System), GSM(Global System for Mobile communications), PDC(Personal Digital Cellular), PHS(Personal Handyphone System), PDA(Personal Digital Assistant), IMT(International Mobile Telecommunication)-2000, CDMA(Code Division Multiple Access)-2000, W-CDMA(W-Code Division Multiple Access), Wibro(Wireless Broadband Internet) 단말, 스마트폰(smartphone), 스마트 패드(smartpad), 타블렛 PC(Tablet PC) 등과 같은 모든 종류의 핸드헬드(Handheld) 기반의 무선 통신 장치를 포함할 수 있다.
본 발명의 일 실시예에 따른 디바이스(100)는 채팅 로그를 발생시킨다. 이때, 채팅 로그는 예를 들어, IPTV 등에서 송출하는 방송 콘텐츠를 본 시청자가 콘텐츠의 복수의 장면 중 적어도 하나의 장면에 대한 텍스트를 웹(WEB)에 등록하여 생성된 로그일 수 있다.
이때, 채팅 로그라고 명명했지만, 본 발명에서는 사용자들이 방송 콘텐츠를 시청하고 웹에 등록하는 개념과, 두 명 이상이 서로 대화하는 채팅의 개념을 모두 포함하는 단어로 정의한다.
여기서, 웹은 예를 들어, 페이스북, 트위터, 카카오톡, TV 채팅 애플리케이션, 웹 페이지, 블로그, 미니홈피 등일 수 있고, 채팅 로그의 텍스트는 해당 웹에 사용자가 업로드한 텍스트일 수 있다. 또한, 채팅 로그는 복수의 텍스트를 포함할 수 있으며, 텍스트를 웹에 등록한 시간 정보, 채팅 로그를 남긴 디바이스(100)의 종류 등이 함께 더 포함될 수 있다.
콘텐츠 장면별 키워드 추출 서버(300)는 콘텐츠의 장면별 키워드를 추출하기 위한 서버이다. 이때, 콘텐츠 장면별 키워드 추출 서버(300)는 공중파 등의 실시간 방송 프로그램을 하는 시간대에 웹에 등록된 채팅 로그를 수집할 수 있다.
예를 들어, 무한도전이라는 방송 프로그램이 2012년 10월 13일 오후 6시30분부터 오후 7시30분까지 방송이 되었다면, 디바이스(100)의 사용자는 무한도전이라는 방송 프로그램 자체에 대한 채팅 로그, 무한도전에 등장하는 등장 인물이나 소품 등에 대한 채팅 로그, 무한도전의 등장 인물이 한 이야기에 대한 채팅 로그 등을 웹에 등록할 수 있다. 이때, 채팅 로그는 방송의 시작점인 6시30분부터 방송의 종료점인 7시 30분까지 등록될 수 있고, 종료점 이후에도 어느 정도의 시간 동안은 채팅 로그가 등록될 수 있다.
따라서, 콘텐츠 장면별 키워드 추출 서버(300)는 실시간 방송이 한 시간대의 채팅 로그를 수집하고, 채팅 로그로부터 장면별로 키워드를 추출해내며, 이렇게 추출된 키워드를 해당 장면과 시간적으로 동기화를 시킨 후, 장면별 키워드를 추출해낸다.
이렇게 추출된 장면별 키워드는 예를 들어, VOD를 제작할 때 VOD의 각 장면에 관련된 메타데이터로 이용할 수 있기 때문에, VOD의 메타데이터를 수동으로, 장면별로 태깅해야 함으로써 발생하는 인력 자원 낭비를 막을 수 있다.
또한, 수집된 채팅 로그는 정량적으로 처리 및 카운트되어 해당 방송 프로그램의 시청률 분포를 파악하는데 사용될 수도 있다. 예를 들어, 6시 30분부터 7시 30분까지의 채팅 로그를 장면별로 동기화하여 시간대별로 나열하게 되면, 카운트된 채팅 로그의 수를 이용하여 채팅 로그의 분포를 시간대별로 알 수 있고, 이에 따라 각 분 단위, 각 초 단위, 각 장면 단위 등으로 시청률을 파악할 수 있다.
즉, 일반적으로 시청률을 조사하는 것은 표본 조사 집단을 선정하고, 표본 조사 집단의 실시간 채널 변경을 추출하고, 각 프로그램별로 시간대별 시청률을 통계에 따라 추정하는 방법으로 이루어진다.
따라서, 이와 같은 방법으로 유사하게, 본원 발명의 일 실시예에 따른 콘텐츠 장면별 키워드 추출 서버(300)는 채팅 로그의 수나 채팅 로그를 남긴 디바이스(100)의 수를 이용하여 시청률을 추정할 수 있다. 예를 들어, 채팅 로그는 채팅 로그를 남긴 디바이스(100)의 MAC ID 등을 포함할 수 있으므로, 채팅 로그를 남긴 디바이스(100)의 수를 이용하여 시청률을 추정할 수 있다. 또는, 채팅 로그 자체의 수를 집계하여 시청률을 추정할 수도 있고, 다양한 통계 방법을 이용하여 시청률을 얻을 수도 있다.
또한, 수집된 채팅 로그를 정량적으로 처리 및 카운트한 채팅 로그의 분포는 부가 서비스나 광고를 매핑하는데 사용될 수도 있다. 예를 들어, 어떤 방송 프로그램에서 이승엽이 홈런을 쳤다고 가정하면, 해당 홈런을 친 장면에서의 채팅 로그는 폭발적으로 발생할 수 있다. 이렇게 폭발적으로 발생한 채팅 로그는, 해당 방송 프로그램이 VOD로 서비스된다고 가정하면, 해당 VOD를 시청하는 시청자도 해당 홈런을 친 장면을 집중하여 본다고 예상할 수 있는 근거가 될 수 있다.
따라서, 채팅 로그가 폭발적으로 발생하는 장면, 즉, 사용자의 집중도가 큰 곳에 부가 서비스나 광고를 매핑하게 되면, 해당 부가 서비스나 광고는 보다 많은 사용자에게 인지될 수 있다. 이러한 방법은, 시청률이 높은 드라마에 광고를 삽입하는 방법보다 더 큰 광고 효과를 거둘 수 있다.
콘텐츠 제공 서버(400)는 콘텐츠를 단말로 제공하는 서버일 수 있다. 이때, 콘텐츠 제공 서버(400)는 콘텐츠 장면별 키워드 추출 서버(300)로부터 채팅 로그의 분포도, 집중도 및 메타데이터를 수신하고, 이를 이용하여 VOD 등을 제작할 때 장면별, 시간별 메타데이터를 자동으로 태깅할 수 있고, 사용자의 집중도가 높은 장면에 부가 서비스를 매핑하거나 광고를 삽입할 수도 있다.
이와 같이, 본 발명의 일 실시예에 따르면, 채팅 로그를 수집하고 분석하며, 장면별로 동기화시키는 것만으로도 해당 방송 프로그램의 시청률을 파악할 수 있으며, 채팅 로그의 분포도 및 집중도를 파악하는 것만으로도, 해당 채팅 로그가 집중되는 부분인 관심이 집중되는 장면에 광고를 삽입하거나 부가 서비스를 제공하여 그 효과를 높일 수 있으며, 채팅 로그로부터 키워드를 추출하는 것만으로도, 수동으로 태깅했던 메타데이터를 자동으로 태깅할 수 있으므로, 낭비되었던 인력 자원, 시간 자원, 전력 자원 등을 모두 절약할 수 있다.
도 2는 도 1에 도시된 콘텐츠 장면별 키워드 추출 서버를 설명하기 위한 구성도이다. 도 1 및 도 2를 참조하면, 콘텐츠 장면별 키워드 추출 서버(300)는 수집부(310), 분할부(330), 동기화부(340), 추출부(350)를 포함한다. 이때, 콘텐츠 장면별 키워드 추출 서버(300)는 전처리부(320), 메타데이터 결정부(360), 광고 결정부(370), 콘텐츠 전송부(380), 시청률 결정부(391) 및 부가 서비스 결정부(393)를 더 포함할 수 있다.
수집부(310)는 콘텐츠와 연관된 채팅 로그를 디바이스(100)로부터 수집한다. 이때, 콘텐츠는 예를 들어, 실시간으로 방송되는 방송 프로그램일 수 있다. 또한, 수집부(310)는 예를 들어, 앤트(ants), 자동 인덱서(automatic indexers), 봇(bots), 웜(worms), 웹 스파이더(web spider), 웹 로봇(web robot) 등과 같은 웹 크롤러(Web Crawler)를 이용하여 채팅 로그를 수집할 수 있다.
전처리부(320)는 채팅 로그에 포함된 복수의 텍스트를 콘텐츠의 정보 데이터에 기초하여 오류를 교정하고 정규화할 수 있다. 이때, 콘텐츠의 정보 데이터는 콘텐츠의 식별 정보, 제목, 장르, 출연자, 협찬, 장소 중 적어도 하나일 수 있고, 이는 EPG(Electronic Program Guide) 정보일 수도 있다.
전처리부(320)는 채팅 로그에 불필요한 기호가 삽입되어 있을 수도 있으므로, 채팅 로그로부터 불필요한 기호를 제거하고, 코드 전환 등을 실시하도록 구성될 수 있다. 또한, 전처리부(320)는 명사와 조사, 용언 등을 구분하고, 핵심어인 키워드를 용이하게 추출할 수 있도록 형태소 분석을 실시한다.
이때, 전처리부(320)는 예를 들어, 방송 EPG 정보로부터 기본적인 프로그램 정보를 수신하여 전처리 기준을 설정할 수 있다. 이때, 프로그램의 정보는 제목, 장르, 회차, 등장 인물, 협찬, 요약, 장소 중 적어도 하나일 수 있다.
이렇게 전처리 기준을 설정하는 이유는, 사용자들의 입력인 채팅 로그가 정규화 또는 정형화되어 있지 않은 경우가 있기 때문이며, 전처리 기준은 입력된 텍스트의 오류를 교정하고, 정규화하는 역할을 할 수 있다.
분할부(330)는 콘텐츠를 복수의 장면 구간으로 분할한다. 이때, 분할부(330)는 콘텐츠를 장면 전환, 움직임, 채팅 로그의 텍스트 중 적어도 하나에 기초하여 복수의 장면 구간으로 분할할 수 있다.
이때, 장면 구간으로 분할하는 기준은 예를 들어, 각 프레임 간의 픽셀 변화량, 각 프레임 간의 유사도, 각 프레임의 오디오 신호 에너지 변화량 또는 오디오 신호의 스펙트럼 변화량 중 적어도 하나에 기초할 수 있다.
또한, 분할부(330)에서 콘텐츠를 영상 프레임 단위로 분할하지 않고, 각 장면 단위로 분할하는 이유는, 사용자들의 채팅 로그는 각 장면에 기초할 확률이 높기 때문이며, 프레임 단위로 분할하여 키워드를 추출할 경우, 키워드의 정확성이 떨어질 확률이 높기 때문이다. 따라서, 콘텐츠를 영상 프레임 단위로 분할하지 않고 장면 단위로 분할하였으나, 프레임 단위로 분할하여야 할 필요성이 발생하는 경우, 프레임 단위로 분할하여 채팅 로그를 동기시키고, 채팅 로그로부터 키워드를 추출하도록 구성할 수도 있다.
동기화부(340)는 분할된 복수의 장면 구간 중 어느 하나의 장면과 채팅 로그의 일부 텍스트를 동기화시킨다. 이때, 동기화부(340)는 분할된 복수의 장면 중 어느 하나의 장면과 채팅 로그의 일부 텍스트를 디바이스(100)의 사용자 인터페이스를 통하여 입력되는 지연을 고려할 수 있다. 즉, 실시간 방송 프로그램을 시청한 시청자가 디바이스(100)를 이용하여 채팅 텍스트를 입력하고, 웹에 해당 채팅 텍스트를 등록하는데 어느 정도의 지연이 있음을 감안하여 동기화할 수 있다.
또한, 동기화부(340)는 분할된 복수의 장면 각각의 시간 구간에 기초하여, 복수의 장면 각각과 복수의 텍스트 각각을 동기시킬 수 있다. 즉, 동기화부(340)는 콘텐츠의 분할된 복수의 장면 중 어느 하나만을 동기시키는 것이 아니라, 해당 콘텐츠가 방송되는 시간 구간에서 연속적으로 발생하는 복수의 텍스트를 복수의 장면에 모두 동기시킬 수 있다.
예를 들어, 분할부(330)에서 콘텐츠를 n 개의 장면으로 시계열적으로 분할한 경우, n 개의 시계열로 분할된 장면에 따라 채팅 텍스트를 시계열적으로 정렬하여 n 개의 채팅 로그를 얻을 수 있다. 이에 따라, n 개의 도큐먼트를 생성할 수 있다.
추출부(350)는 어느 하나의 장면에 대응하는 키워드를 동기화된 채팅 로그의 일부 텍스트로부터 자동으로 추출한다. 이때, 추출부(350)는 어느 하나의 장면의 객체에 대응하는 키워드를 동기화된 채팅 로그의 일부 텍스트로부터 자동으로 추출할 수 있다. 이에 따라, 콘텐츠의 동영상 마이닝 문제는 텍스트 마이닝 문제로 치환될 수 있는 것이다.
추출부(350)는 어느 하나의 장면에 대응하는 키워드를 LDA(Latent Dirichlet Allocation) 알고리즘을 이용하여 추출할 수 있다. 이때, LDA 알고리즘은 도큐먼트의 단어들 간의 빈도를 확률화하여 숨겨진 토픽을 추출할 수 있다. 이때, 숨겨진 토픽은 도큐먼트의 주체 또는 관심어로 간주될 수 있으며, 특정 장면에서 시청자들의 관심 분야를 추출할 수 있는 근거가 될 수 있다.
또한, 토픽 관련 어휘들은 콘텐츠의 장르에 따라 등장 인물, 행위, 긍정이나 부정의 감성 어휘, 장소, 소품 등으로 추정할 수 있다. 각 도큐먼트들을 나열하게 되면, 토픽의 변화에 따른 시청자의 관심 변화도 추정할 수 있고, 수집, 동기화, 추출의 모든 과정을 자동으로 구현할 수 있다.
따라서, 추출부(350)로부터 추출된 단어는 도큐먼트별로 관련성이 높은 셋(SET)일 수 있으며, 결과적으로 어느 하나의 장면과 관련성이 높은 단어들일 수 있고, 이렇게 추출된 키워드는 어떠한 프로그램의 첫 방송이 종료된 후, VOD 제작시에 활용될 수 있다.
예를 들어, 광고주에게 시청자들이 특정 구간에 어떠한 관심을 표시하는지 알릴 수 있고, 적절한 시점에 푸시(push) 형태로 광고를 내보내거나 동영상을 검색하는데에도 활용될 수 있다. 또한, 인기가 많거나 관심을 많이 받는 방송 콘텐츠일수록 채팅 로그가 풍부하게 쌓이므로, 통계 결과의 신뢰도 또한 높아질 수 있다. 따라서, 커뮤니티 등과 같은 웹상의 채팅 로그를 활용하여 자동으로 관심 또는 주제어인 키워드를 추출할 수 있고, 추출된 키워드를 동영상 분석에 유용한 도구로 제공할 수 있다.
메타데이터 결정부(360)는 추출된 키워드를 콘텐츠, 콘텐츠의 어느 하나의 장면 또는 객체 중 어느 하나의 메타데이터로 결정할 수 있다. 예를 들어, 어떠한 방송 프로그램의 어느 한 장면에서 "동방신기, 퍼포먼스, 용춤, 헐크춤"이라는 키워드가 추출되었다고 가정하면, 해당 장면에 해당 키워드를 매핑하여 메타데이터로 사용하도록 할 수도 있다. 해당 키워드는 어느 한 장면에 기초한 것일 수도 있고, 해당 콘텐츠 자체에 관련된 것일 수도 있으며, 어느 한 장면에 등장하는 등장 인물인 객체일 수도 있다.
광고 결정부(370)는 채팅 로그에 포함된 복수의 텍스트의 집중도에 기초하여 콘텐츠와 연관된 광고 노출 시점을 결정할 수 있다. 예를 들어, 1 시간의 재생 시간을 가지는 방송 프로그램이 있다고 가정하면, 시간별로 쌓이는 채팅 로그의 수는 서로 다를 수 있고, 시계열적으로 동기된 채팅 로그는 분 단위, 초 단위, 장면 단위 등으로 채팅 로그 분포를 형성할 수 있다.
이렇게 형성된 채팅 로그 분포는 채팅 로그가 어느 장면에 집중되는지를 파악할 수 있는 자료가 될 수 있고, 광고 결정부(370)는 집중도가 상대적으로 높은 적어도 하나의 장면에 광고를 노출하도록 결정할 수 있다.
또한, 광고 결정부(370)는 광고 노출 시점에 동기된 복수의 텍스트를 분석하여 콘텐츠와 연관된 광고 키워드를 결정할 수 있다. 이때, 광고 키워드는 콘텐츠, 광고 노출 시점의 장면 또는 광고 노출 시점의 장면의 객체 중 어느 하나일 수 있다.
예를 들어, 음악중심은 오후 4시부터 5시까지 방송하고, 집중도가 가장 높은 곳이 4시 55분이고, 동방신기가 출연하였다고 가정하여 설명한다. 이때, 높은 집중도는 광고를 노출하는데 필요 조건이 될 수 있고, 높은 집중도를 가지는 장면과 관련된 광고를 노출할 것인지는 충분 조건이 될 수 있다. 따라서, 필요 조건을 만족시키기 위해서는 4시 55분의 장면에 광고를 삽입하는 것이 바람직하다. 또한, 충분 조건을 만족시키기 위해서는, 음악 중심 자체인 음악 관련 광고를 노출하도록 광고 키워드를 음악으로 설정할 수도 있고, 광고 노출 시점의 장면의 또는 광고 노출 시점의 장면의 객체인 동방신기에 관련된 광고를 노출하도록 광고 키워드를 동방신기로 설정할 수도 있다.
콘텐츠 전송부(380)는 콘텐츠를 TV 디바이스로 전송한다. 이때, 수집부(310)는 TV 디바이스와 연관된 모바일 디바이스로부터 채팅 로그를 수집할 수 있다. 즉, TV 디바이스와 모바일 다바이스가 연동되어 있다면, 실제로 TV를 시청하는 사용자, 즉 모바일 디바이스의 사용자로부터 채팅 로그를 수집을 받는 것이 채팅 로그의 정확도를 높일 수 있다. 따라서, 수집부(310)는 TV 디바이스와 연관된 모바일 디바이스로부터 채팅 로그를 수집할 수 있도록 구성할 수도 있다.
시청률 결정부(391)는 채팅 로그에 포함된 복수의 텍스트의 분포도에 기초하여, 복수의 장면 구간 중 적어도 어느 하나의 장면에 대응하는 시청률을 결정할 수 있다.
부가 서비스 결정부(393)는 채팅 로그에 포함된 텍스트의 집중도에 기초하여 콘텐츠와 연관된 부가 서비스의 노출 시점을 결정할 수 있다. 이때, 콘텐츠와 연관된 부가 서비스는 부가 서비스의 노출 시점에 대응하는 키워드와 매핑된 것일 수 있다.
도 3은 도 1에 도시된 콘텐츠 장면별 키워드 추출 서버를 설명하기 위한 도면이다. 도 3a를 참조하면, (a)에서는 시간에 따라 콘텐츠의 어느 하나의 장면이 존재하는 것을 도시하고, (b)에서는 어느 하나의 장면의 객체를 설명하거나 지칭하는 핵심 단어가 채팅 로그로 등장하는 것을 나타낸다.
이를 자세히 살펴보면, (b)의 첫 번째 채팅 로그는, 숙종, 임금, 한효주, 여자에게 약한 임금 등이 채팅 로그로 등록된 것을 나타내며, 두 번째 채팅 로그는, 한효주, 연기, 중전, 폐위 등이 채팅 로그로 등록된 것을 나타낸다.
이러한 채팅 로그를 살펴보면, 영상의 대상을 설명하거나 지칭하는 핵심 단어가 많이 등장하는 것을 알 수 있다. 이에 따라, 핵심 단어인 키워드를 자동으로 획득할 수 있다면, VOD 콘텐츠를 제작하여 재생할 때, 시청자에게 손쉽게 다양한 편의를 제공할 수 있다.
따라서, 본 발명의 일 실시예에 따른 콘텐츠 장면별 키워드 추출 서버는, 콘텐츠와 연관된 채팅 로그를 디바이스로부터 수집하고, 콘텐츠를 복수의 장면 구간으로 분할하며, 분할된 복수의 장면 구간 중 어느 하나의 장면과 채팅 로그의 일부 텍스트를 동기화시킨다.
도 3b를 참조하면, 도 3b는 시간축에 따라 분포하고 있는 텍스트의 수를 나타낸다. 이렇게 분포된 텍스트의 수인 분포도를 이용하여 해당 콘텐츠의 시청률을 집계할 수 있다.
도 3c를 참조하면, 도 3c는 시간축에 따라 분포하고 있는 텍스트의 수를 나타낸다. 장면별로 키워드를 추출할 수 있고, 키워드를 콘텐츠 자체, 콘텐츠의 어느 하나의 장면, 장면에 등장하는 객체 중 어느 하나에 메타데이터로 태깅할 수도 있다.
도 3d를 참조하면, 도 3d는 시간축에 따라 분포하고 있는 텍스트의 수를 나타낸다. 이러한 텍스트의 분포도에 기초하여 집중이 가장 많이 이루어지고 있는 장면인 텍스트 집중 장면을 선택할 수 있고, 텍스트 집중 장면에 광고를 삽입할 수도 있다.
도 3e를 참조하면, 도 3e는 시간축에 따라 분포하고 있는 텍스트의 수를 나타낸다. 이때, 텍스트 집중 화면은 적어도 하나일 수 있다. 따라서, 적어도 하나의 텍스트 집중 화면 중 어느 하나인 제 1 텍스트 집중 장면으로부터 제 1 광고 키워드를 추출하고, 제 1 광고 키워드와 연관된 광고를 삽입할 수 있고, 마찬가지로, 제 2 텍스트 집중 장면으로부터 제 2 광고 키워드를 추출하고, 제 2 광고 키워드와 연관된 광고를 삽입할 수도 있다.
도 3f를 참조하면, 이때 광고 키워드는 어느 하나의 장면 자체에 관련된 광고 키워드일 수도 있고, 어느 하나의 장면에 등장하는 객체에 관련된 광고 키워드일 수도 있다.
도 4는 본 발명의 일 실시예에 따른 도 1의 콘텐츠 장면별 키워드 추출 시스템에 포함된 각 구성들 상호간에 데이터가 송수신되는 과정을 나타낸 도면이다. 이하, 도 4를 통해 본원의 일 실시예에 따라 신호가 송수신되는 과정의 일 예를 설명할 것이나, 이와 같은 실시예로 본원이 한정 해석되는 것은 아니며, 앞서 설명한 다양한 실시예들에 따라 도 4에 도시된 데이터가 송수신되는 과정이 변경될 수 있음은 본원의 기술분야에 속하는 당업자에게 자명하다.
도 4을 참조하면, 디바이스(100)에서 채팅 로그가 발생한 경우(S4100), 콘텐츠 장면별 키워드 추출 서버(300)는 채팅 로그를 수집할 수 있다(S4120).
이때, 콘텐츠 장면별 키워드 추출 서버(300)는 콘텐츠를 복수의 장면으로 분할하고(S4200), 채팅 로그를 전처리하여(S4300), 복수의 장면 중 어느 하나의 장면과 채팅 로그의 일부 텍스트를 동기화할 수 있다(S4300).
또한, 콘텐츠 장면별 키워드 추출 서버(300)는 채팅 로그의 분포도 및 집중도를 산출하고(S4500), 산출된 분포도 및 분포도에 기초한 시청률은 콘텐츠 제공 서버(400)로 전송할 수 있다(S4510). 이때, 자체적으로 시청률을 출력하여 관리자에게 전달할 수도 있고, VOD를 제작하는 콘텐츠 제공 서버(400)로 전달할 수도 있다.
콘텐츠 장면별 키워드 추출 서버(300)로부터 분포도 및 분포도에 기초한 시청률을 수신한 콘텐츠 제공 서버(400)는 시간대별 시청률을 집계할 수 있다.
콘텐츠 장면별 키워드 추출 서버(300)는 집중도에 기초하여 광고 또는 부가 서비스 노출 시점을 결정할 수 있다(S4600). 이렇게 결정된 노출 시점은 콘텐츠 장면별 키워드 추출 서버(300)로부터 콘텐츠 제공 서버(400)로 전송될 수 있고(S4610), 콘텐츠 제공 서버(400)는 노출 시점 정보를 이용하여 광고 또는 부가 서비스를 매핑할 수 있다(S4630).
콘텐츠 장면별 키워드 추출 서버(300)는 어느 장면에 대응하는 키워드를 채팅 로그의 일부 텍스트로부터 추출하고(S4700), 추출된 키워드를 콘텐츠, 콘텐츠의 어느 하나의 장면, 또는 객체 중 어느 하나의 메타데이터로 결정할 수 있다(S4800).
콘텐츠 장면별 키워드 추출 서버(300)는 콘텐츠 제공 서버(400)로 메타데이터를 전송할 수 있고(S4810), 콘텐츠 제공 서버(400)는 콘텐츠에 메타데이터를 태깅할 수 있다(S4900). 즉, 콘텐츠 제공 서버(400)는 자동으로 콘텐츠의 각 장면, 각 장면의 객체 등에 메타데이터를 태깅할 수 있다.
상술한 단계들(S4100~S4900)간의 순서는 예시일 뿐, 이에 한정되지 않는다. 즉, 상술한 단계들(S4100~S4900)간의 순서는 상호 변동될 수 있으며, 이중 일부 단계들은 동시에 실행될 수도 있다.
도 5는 본 발명의 일 실시예에 따른 콘텐츠 장면별 키워드 추출 시스템을 설명하기 위한 동작 흐름도이다.
우선, 콘텐츠와 연관된 채팅 로그를 디바이스로부터 수집하고(S5100), 콘텐츠를 복수의 장면 구간으로 분할한다(S5200).
분할된 복수의 장면 구간 중 어느 하나의 장면과 채팅 로그의 일부 텍스트를 동기화시킨다(S5300).
어느 하나의 장면에 대응하는 키워드를 동기화된 채팅 로그의 일부 텍스트로부터 자동으로 추출한다(S5400).
이와 같은 도 5의 콘텐츠 장면별 키워드 추출 시스템에 대해서 설명되지 아니한 사항은 앞서 도 1 내지 4을 통해 콘텐츠 장면별 키워드 추출 시스템에 대하여 설명된 내용과 동일하거나 설명된 내용으로부터 용이하게 유추 가능하므로 이하 설명을 생략하도록 한다.
도 5를 통해 설명된 일 실시예에 따른 콘텐츠 장면별 키워드 추출 방법은, 컴퓨터에 의해 실행되는 프로그램 모듈과 같은 컴퓨터에 의해 실행가능한 명령어를 포함하는 기록 매체의 형태로도 구현될 수 있다. 컴퓨터 판독 가능 매체는 컴퓨터에 의해 액세스될 수 있는 임의의 가용 매체일 수 있고, 휘발성 및 비휘발성 매체, 분리형 및 비분리형 매체를 모두 포함한다. 또한, 컴퓨터 판독가능 매체는 컴퓨터 저장 매체 및 통신 매체를 모두 포함할 수 있다. 컴퓨터 저장 매체는 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈 또는 기타 데이터와 같은 정보의 저장을 위한 임의의 방법 또는 기술로 구현된 휘발성 및 비휘발성, 분리형 및 비분리형 매체를 모두 포함한다. 통신 매체는 전형적으로 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈, 또는 반송파와 같은 변조된 데이터 신호의 기타 데이터, 또는 기타 전송 메커니즘을 포함하며, 임의의 정보 전달 매체를 포함한다.
전술한 본 발명의 설명은 예시를 위한 것이며, 본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 예를 들어, 단일형으로 설명되어 있는 각 구성 요소는 분산되어 실시될 수도 있으며, 마찬가지로 분산된 것으로 설명되어 있는 구성 요소들도 결합된 형태로 실시될 수 있다.
본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.

Claims (17)

  1. 콘텐츠의 장면별 키워드를 추출하는 서버에 있어서,
    상기 콘텐츠와 연관된 채팅 로그를 디바이스로부터 수집하는 수집부;
    상기 콘텐츠를 복수의 장면 구간으로 분할하는 분할부;
    상기 분할된 복수의 장면 구간 중 어느 하나의 장면과 상기 채팅 로그의 일부 텍스트를 동기화시키는 동기화부; 및
    상기 어느 하나의 장면에 대응하는 키워드를 상기 동기화된 채팅 로그의 일부 텍스트로부터 자동으로 추출하는 추출부
    를 포함하는 서버.
  2. 제 1 항에 있어서,
    상기 채팅 로그는 시간 정보를 가지는 복수의 텍스트를 포함하고,
    상기 동기화부는 상기 분할된 복수의 장면 구간 각각의 시간 구간에 기초하여, 상기 복수의 장면 각각과 상기 복수의 텍스트 각각을 동기시키는 것인, 서버.
  3. 제 1 항에 있어서,
    상기 추출부는 상기 어느 하나의 장면의 객체에 대응하는 키워드를 상기 동기화된 채팅 로그의 일부 텍스트로부터 자동으로 추출하는 것인, 서버.
  4. 제 3 항에 있어서,
    상기 추출된 키워드를 상기 콘텐츠, 상기 콘텐츠의 어느 하나의 장면 또는 상기 객체 중 어느 하나의 메타데이터로 결정하는 메타데이터 결정부
    를 더 포함하는, 서버.
  5. 제 1 항에 있어서,
    상기 채팅 로그에 포함된 복수의 텍스트의 집중도에 기초하여 상기 콘텐츠와 연관된 광고 노출 시점을 결정하는 광고 결정부
    를 더 포함하는, 서버.
  6. 제 5 항에 있어서,
    상기 광고 결정부는 상기 광고 노출 시점에 동기된 상기 복수의 텍스트를 분석하여, 상기 콘텐츠와 연관된 광고 키워드를 결정하는 것인, 서버.
  7. 제 6 항에 있어서,
    상기 광고 키워드는 상기 콘텐츠, 상기 광고 노출 시점의 장면 또는 상기 광고 노출 시점의 장면의 객체 중 어느 하나와 연관된 것인, 서버.
  8. 제 1 항에 있어서,
    상기 콘텐츠를 TV 디바이스로 전송하는 콘텐츠 전송부를 더 포함하고,
    상기 수집부는 상기 TV 디바이스와 연관된 모바일 디바이스로부터 상기 채팅 로그를 수집하는 것인, 서버.
  9. 제 1 항에 있어서,
    상기 추출부는 상기 어느 하나의 장면에 대응하는 키워드를 LDA(Latent Dirichlet Allocation) 알고리즘을 이용하여 추출하는 것인, 서버.
  10. 제 1 항에 있어서,
    상기 채팅 로그에 포함된 복수의 텍스트의 분포도에 기초하여, 상기 복수의 장면 구간 중 적어도 어느 하나의 장면에 대응하는 시청률을 결정하는 시청률 결정부;
    를 더 포함하는 것인, 서버.
  11. 제 1 항에 있어서,
    상기 채팅 로그에 포함된 복수의 텍스트를 상기 콘텐츠의 정보 데이터에 기초하여 오류를 교정하고 정규화하는 전처리부;
    를 더 포함하는 것인, 서버.
  12. 제 11 항에 있어서,
    상기 콘텐츠의 정보 데이터는 상기 콘텐츠의 식별 정보, 제목, 장르, 출연자, 협찬, 장소 중 적어도 하나인 것인, 서버.
  13. 제 1 항에 있어서,
    상기 동기화부는 상기 분할된 복수의 장면 구간 중 어느 하나의 장면과 상기 채팅 로그의 일부 텍스트를 상기 디바이스의 사용자 인터페이스를 통하여 입력되는 지연을 고려하여 동기화시키는 것인, 서버.
  14. 제 1 항에 있어서,
    상기 채팅 로그에 포함된 복수의 텍스트의 집중도에 기초하여 상기 콘텐츠와 연관된 부가 서비스의 노출 시점을 결정하는 부가 서비스 결정부;
    를 더 포함하는, 서버.
  15. 제 14 항에 있어서,
    상기 콘텐츠와 연관된 부가 서비스는 상기 부가 서비스의 노출 시점에 대응하는 키워드와 매핑된 것인, 서버.
  16. 제 1 항에 있어서,
    상기 분할부는 상기 콘텐츠를 장면 전환, 움직임, 상기 채팅 로그의 텍스트중 적어도 하나에 기초하여 상기 복수의 장면 구간으로 분할하는 것인, 서버.
  17. 콘텐츠의 장면별 키워드를 추출하는 방법에 있어서,
    상기 콘텐츠와 연관된 채팅 로그를 디바이스로부터 수집하는 단계;
    상기 콘텐츠를 복수의 장면 구간으로 분할하는 단계;
    상기 분할된 복수의 장면 구간 중 어느 하나의 장면과 상기 채팅 로그의 일부 텍스트를 동기화시키는 단계; 및
    상기 어느 하나의 장면에 대응하는 키워드를 상기 동기화된 채팅 로그의 일부 텍스트로부터 자동으로 추출하는 단계
    를 포함하는 방법.
KR1020120121132A 2012-10-30 2012-10-30 콘텐츠 장면별 키워드 추출 서버 및 방법 KR20140056618A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020120121132A KR20140056618A (ko) 2012-10-30 2012-10-30 콘텐츠 장면별 키워드 추출 서버 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020120121132A KR20140056618A (ko) 2012-10-30 2012-10-30 콘텐츠 장면별 키워드 추출 서버 및 방법

Publications (1)

Publication Number Publication Date
KR20140056618A true KR20140056618A (ko) 2014-05-12

Family

ID=50887719

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020120121132A KR20140056618A (ko) 2012-10-30 2012-10-30 콘텐츠 장면별 키워드 추출 서버 및 방법

Country Status (1)

Country Link
KR (1) KR20140056618A (ko)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101671740B1 (ko) * 2015-07-07 2016-11-16 숭실대학교산학협력단 토픽 추출 장치 및 방법
KR101867082B1 (ko) 2017-08-23 2018-06-12 서울과학기술대학교 산학협력단 하이라이트 영상 생성 장치 및 방법
KR20180131226A (ko) * 2017-05-31 2018-12-10 삼성에스디에스 주식회사 광고 편성 장치 및 방법
KR20200080417A (ko) 2018-12-19 2020-07-07 서울과학기술대학교 산학협력단 채팅 데이터와 오디오 데이터를 이용한 하이라이트 영상 생성 장치
KR20200092502A (ko) 2019-01-11 2020-08-04 서울과학기술대학교 산학협력단 채팅 데이터와 오디오 데이터를 이용한 하이라이트 영상 생성 장치 및 방법
KR20210122496A (ko) * 2020-04-01 2021-10-12 한국전자통신연구원 벡터를 이용한 장면 묘사 기반의 메타데이터 생성 방법 및 이를 위한 장치
KR20220031488A (ko) * 2020-09-04 2022-03-11 김요셉 광고 매칭 서버 및 방법
KR102585107B1 (ko) * 2023-03-21 2023-10-06 주식회사 중고나라 연관 검색어 관리 방법

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101671740B1 (ko) * 2015-07-07 2016-11-16 숭실대학교산학협력단 토픽 추출 장치 및 방법
WO2017007084A1 (ko) * 2015-07-07 2017-01-12 숭실대학교산학협력단 토픽 추출 장치 및 방법
KR20180131226A (ko) * 2017-05-31 2018-12-10 삼성에스디에스 주식회사 광고 편성 장치 및 방법
KR101867082B1 (ko) 2017-08-23 2018-06-12 서울과학기술대학교 산학협력단 하이라이트 영상 생성 장치 및 방법
KR20200080417A (ko) 2018-12-19 2020-07-07 서울과학기술대학교 산학협력단 채팅 데이터와 오디오 데이터를 이용한 하이라이트 영상 생성 장치
KR20200092502A (ko) 2019-01-11 2020-08-04 서울과학기술대학교 산학협력단 채팅 데이터와 오디오 데이터를 이용한 하이라이트 영상 생성 장치 및 방법
KR20210122496A (ko) * 2020-04-01 2021-10-12 한국전자통신연구원 벡터를 이용한 장면 묘사 기반의 메타데이터 생성 방법 및 이를 위한 장치
KR20220031488A (ko) * 2020-09-04 2022-03-11 김요셉 광고 매칭 서버 및 방법
KR102585107B1 (ko) * 2023-03-21 2023-10-06 주식회사 중고나라 연관 검색어 관리 방법

Similar Documents

Publication Publication Date Title
KR20140056618A (ko) 콘텐츠 장면별 키워드 추출 서버 및 방법
US11412300B2 (en) System and methods for analyzing content engagement in conjunction with social media
US9202523B2 (en) Method and apparatus for providing information related to broadcast programs
US9008489B2 (en) Keyword-tagging of scenes of interest within video content
US20220020058A1 (en) Synchronizing advertisements
US9342584B2 (en) Server apparatus, information terminal, and program
JP5269899B2 (ja) マルチメディアコンテンツの推薦キーワード生成システム及びその方法
CN104798346B (zh) 用于补充与广播媒体相关的电子消息的方法和计算系统
US11019382B2 (en) Systems and methods that match search queries to television subtitles
JP5466119B2 (ja) 同一の共有コンテンツに興味を持つ視聴者の属性の観点を推定する最適観点推定プログラム、装置及び方法
US20160337695A1 (en) Television audience measurement method and apparatus
US10116982B2 (en) Systems and methods for automated extraction of closed captions in real time or near real-time and tagging of streaming data for advertisements
CN102763105A (zh) 用于分段和概括媒体内容的方法和装置
US11991405B2 (en) Systems and methods for automated extraction of closed captions in real time or near real-time and tagging of streaming data for advertisements
KR101550886B1 (ko) 동영상 콘텐츠에 대한 부가 정보 생성 장치 및 방법
CN105550277A (zh) 基于标签热度的智能电影排名和评价系统
CN102098549A (zh) 一种提供社会性网络服务的epg系统
US8983942B2 (en) Method and apparatus for providing time machine service based on social network service
CN102695086A (zh) 交互式网络协议电视的内容推送方法和装置
EP3358475A1 (en) Information processing device, information processing method and program
KR101186419B1 (ko) 실시간으로 방송 연관 정보를 제공하는 방법 및 장치
KR20100111907A (ko) 시청자 참여정보를 반영한 광고 제공장치 및 방법

Legal Events

Date Code Title Description
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid