KR101186419B1 - 실시간으로 방송 연관 정보를 제공하는 방법 및 장치 - Google Patents

실시간으로 방송 연관 정보를 제공하는 방법 및 장치 Download PDF

Info

Publication number
KR101186419B1
KR101186419B1 KR1020110002742A KR20110002742A KR101186419B1 KR 101186419 B1 KR101186419 B1 KR 101186419B1 KR 1020110002742 A KR1020110002742 A KR 1020110002742A KR 20110002742 A KR20110002742 A KR 20110002742A KR 101186419 B1 KR101186419 B1 KR 101186419B1
Authority
KR
South Korea
Prior art keywords
broadcast
information
keyword
candidate
list
Prior art date
Application number
KR1020110002742A
Other languages
English (en)
Other versions
KR20120081412A (ko
Inventor
김재호
김하영
배종규
Original Assignee
에스케이커뮤니케이션즈 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 에스케이커뮤니케이션즈 주식회사 filed Critical 에스케이커뮤니케이션즈 주식회사
Priority to KR1020110002742A priority Critical patent/KR101186419B1/ko
Publication of KR20120081412A publication Critical patent/KR20120081412A/ko
Application granted granted Critical
Publication of KR101186419B1 publication Critical patent/KR101186419B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/472End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
    • H04N21/4722End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for requesting additional data associated with the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying
    • G06F16/732Query formulation
    • G06F16/7343Query language or query format
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/488Data services, e.g. news ticker
    • H04N21/4886Data services, e.g. news ticker for displaying a ticker, e.g. scrolling banner for news, stock exchange, weather data

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

본 발명은 실시간으로 방송 연관 정보를 제공하는 방법 및 장치를 개시하고 있다.
본 발명의 일 실시 예에 따른 실시간으로 방송 연관 정보를 제공하는 방법은 유선 또는 무선으로 제공되는 방송 신호를 수신하는 단계, 상기 수신한 방송 신호에서 방송 정보를 추출하는 단계, 상기 방송 정보에서 방송 연관 정보를 제공하는데 필요한 키워드를 추출하는 단계, 및 상기 키워드와 상기 키워드에 해당하는 방송 연관 정보를 저장하는 단계를 포함한다.

Description

실시간으로 방송 연관 정보를 제공하는 방법 및 장치{METHOD AND APPARATUS OF SERVICING INFORMATION WHICH RELATED TO BROADCASTING IN REAL-TIME}
본 발명은 실시간으로 방송 연관 정보를 제공하는 방법 및 장치를 개시하고 있다. 보다 상세하게는 실시간으로 방송 신호에서 추출한 정보를 이용하여 방송 연관 정보를 생성하여 클라이언트에 제공하는 방법과 장치를 개시하고 있다.
방송 및 통신 기술의 발달로, 일방향으로 제공되는 방송은 다수의 참여 혹은 쌍방향 통신을 기반으로 하여 제공되고 있다. 그 결과, 인터넷 분야에서의 소셜 네트워크 서비스, 소셜 미디어, 소셜 게임 등이 방송에도 결합되고 있는 실정이다. 이 과정에서 단방향의 매체였던 TV 역시 쌍방향 혹은 이용자들 간의 협력적인 정보 교환에 기반하여 단방향으로 즐기는 고립된 매체인 TV를 이용하는 이용자들도 점차 다중적 미디어 소비와 타인과의 소통을 위한 소셜 네트워킹 욕구가 증가하고 있는 추세가 되고 있다. 이에 TV 및 방송에서도 방송뿐만 아니라 방송과 관련된 다양한 정보를 제공하는 것이 필요하게 되었다.
본 발명은 실시간으로 수신되는 방송에서 방송 정보를 추출하여 방송 시청 중 키워드 형식으로 정보를 제공하고, 클라이언트의 선택에 따라 보다 상세한 연관 정보를 제공하여 방송과 소셜 네트워크, 포털에 포함된 정보를 유기적으로 제공하고자 한다.
본 발명은 방송 정보에 포함된 자막 파일을 분석하여 키워드를 분석하고, 소셜 네트워크, 포털 등에서 제공하는 정보와 결합하여 시청자가 원하는 정보를 실시간으로 제공할 수 있도록 한다.
본 발명은 방송 정보에 포함된 방송 관련 메타 데이터를 분석하여 기구축된 정보 중에서 시청자가 원하는 정보를 보다 효율적으로 제공할 수 있도록 한다.
전술한 과제를 달성하기 위해, 본 발명의 일 실시 예에 따른 실시간으로 방송 연관 정보를 제공하는 방법은 유선 또는 무선으로 제공되는 방송 신호를 수신하는 단계, 상기 수신한 방송 신호에서 방송 정보를 추출하는 단계, 상기 방송 정보에서 방송 연관 정보를 제공하는데 필요한 키워드를 추출하는 단계, 및 상기 키워드와 상기 키워드에 해당하는 방송 연관 정보를 저장하는 단계를 포함한다.
본 발명의 다른 실시 예에 따른 실시간으로 방송 연관 정보를 제공하는 방법은 클라이언트가 현재 방송 중인 방송 프로그램에 대한 식별 정보를 서버에 송신하는 단계, 상기 방송 프로그램에 대해 실시간으로 생성된 하나 이상의 키워드를 수신하는 단계, 상기 수신한 키워드 중 어느 하나 이상에 대한 방송 연관 정보를 요청하는 메시지를 상기 서버에 송신하는 단계, 및 상기 서버로부터 상기 요청된 방송 연관 정보를 수신하여 디스플레이하는 단계를 포함한다.
본 발명의 또다른 실시예에 따른 실시간으로 방송 연관 정보를 제공하는 서버는 유선 또는 무선으로 제공되는 방송 신호를 수신하는 방송신호 수신부, 상기 수신한 방송 신호에서 방송 정보를 추출하는 방송 정보 추출부, 상기 방송 정보에서 방송 연관 정보를 제공하는데 필요한 키워드를 추출하여 상기 키워드와 상기 키워드에 해당하는 방송 연관 정보를 저장하는 방송 연관 정보 생성부, 및 클라이언트에 키워드를 송신하고, 상기 키워드에 대한 방송 연관 정보를 요청하는 메시지를 수신하며, 상기 클라이언트에 상기 방송 연관 정보를 송신하는 방송 연관 정보 제공부를 포함한다.
도 1은 본 명세서의 일 실시예에 의한 방송 콘텐츠 및 방송 정보를 수신하여 이를 기준으로 방송 연관 정보를 생성하는 서버와 외부에서 상기 생성된 방송 연관 정보를 요청하여 그 연관 정보를 수신하는 단말의 구성을 보여주는 도면이다.
도 2는 본 명세서의 일 실시예에 의한 방송 정보가 자막 정보인 경우 이에 대한 방송 연관 정보를 제공하는 과정을 보여주는 도면이다.
도 3은 본 명세서의 일 실시예에 의한 자막 정보에서 방송 연관 정보를 제공하는 과정을 보여주기 위해 서버 및 클라이언트에서 정보가 프로세싱되는 과정을 보여주는 도면이다.
도 4는 본 명세서의 일 실시예에 의한 스마트 TV 화면의 구성을 보여주는 도면이다.
도 5는 본 명세서의 일 실시예에 의한 후보 키워드 추출 과정을 보여주는 도면이다.
도 6은 본 명세서의 일 실시예에 의한 개체명 사전을 이용하여 검색어를 추출하는 과정을 보여주는 도면이다.
도 7은 본 명세서의 일 실시예에 의한 사전 기반으로 검색어를 추출하는 과정을 보여주는 도면이다.
도 8은 본 명세서의 다른 실시예에 의한 서버 및 검색 서버에서 방송 정보를 이용하여 방송 연관 정보를 제공하는 구성을 보여주는 도면이다.
도 9는 본 명세서의 일 실시예에 의한 서버에서의 구현 과정을 보여주는 도면이다.
도 10은 본 명세서의 일 실시예에 의한 클라이언트에서 방송과 관련된 키워드 및 방송 연관 정보를 수신하는 과정을 보여주는 도면이다.
도 11은 본 명세서의 일 실시예에 의한 방송 신호에 포함된 화상 데이터를 이용하여 방송 정보 및 방송 연관 정보를 생성하는 과정을 보여주는 도면이다.
이하, 본 발명의 일부 실시 예들을 예시적인 도면을 통해 상세하게 설명한다. 각 도면의 구성요소들에 참조부호를 부가함에 있어서, 동일한 구성요소들에 대해서는 비록 다른 도면상에 표시되더라도 가능한 한 동일한 부호를 가지도록 하고 있음에 유의해야 한다. 또한, 본 발명을 설명함에 있어, 관련된 공지 구성 또는 기능에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명은 생략한다.
또한, 본 발명의 구성 요소를 설명하는 데 있어서, 제 1, 제 2, A, B, (a), (b) 등의 용어를 사용할 수 있다. 이러한 용어는 그 구성 요소를 다른 구성 요소와 구별하기 위한 것일 뿐, 그 용어에 의해 해당 구성 요소의 본질이나 차례 또는 순서 등이 한정되지 않는다. 어떤 구성 요소가 다른 구성요소에 "연결", "결합" 또는 "접속"된다고 기재된 경우, 그 구성 요소는 그 다른 구성요소에 직접적으로 연결되거나 접속될 수 있지만, 각 구성 요소 사이에 또 다른 구성 요소가 "연결", "결합" 또는 "접속"될 수도 있다고 이해되어야 할 것이다.
본 명세서에서 방송 정보로 제시되는 것은 방송 신호에 포함된 자막 정보, 방송 화면에 포함된 이미지화된 문자, 스마트 TV와 같이 방송과 관련된 메타 데이터가 포함된 방송에서의 방송 헤더 정보(또는 메타 데이터) 등을 포함한다.
도 1은 본 명세서의 일 실시예에 의한 방송 콘텐츠 및 방송 정보를 수신하여 이를 기준으로 방송 연관 정보를 생성하는 서버와 외부에서 상기 생성된 방송 연관 정보를 요청하여 그 연관 정보를 수신하는 단말의 구성을 보여주는 도면이다. 도 1에서의 방송 정보는 방송 신호에 포함된 정보, 예를 들어 자막 파일, 방송 프로그램 명 또는 시간, 출연진 등의 정보가 포함된 메타 정보, 해당 방송 프로그램과 관련된 웹사이트 또는 식별 정보 등이 될 수 있다.
방송 신호는 방송 콘텐츠와 방송 정보로 구성되며, 하나의 신호 내에 결합되어 존재할 수도 있고 분리되어 존재할 수도 있다.
도 1은 방송국(190) 방송 신호를 수신하는 서버(180) 및 클라이언트(100)가 있다. 클라이언트(100)는 방송 신호를 수신하여 방송 컨텐츠를 제공하는 다양한 디지털 기기가 될 수 있는데, 도시된 바와 같이 스마트 TV(101), 컴퓨터, 노트북(102), PDA, 스마트폰(103), 휴대폰(104) 등이 될 수 있다. 이하, 클라이언트는 방송 신호를 수신하여 방송 컨텐츠를 제공하는 기기가 될 수 있으나, 반드시 방송 컨텐츠를 전부 보여주는 것을 요건으로 하지는 않는다. 또한, 클라이언트는 프로그램이 될 수 있다. 즉, 방송 신호를 수신하는 기기에 설치되어 방송 연관 정보를 서버에 요청하여 수신하는 기능을 제공하는 프로그램은 본 명세의 일 실시예에 의한 클라이언트에 해당한다. 또한, 이러한 프로그램이 설치된 기기 역시 클라이언트가 될 수 있다. 이하 본 명세서에서 클라이언트는 현재 방송 중인 프로그램과 관련된 연관 정보를 제공하는 기능을 제공하는 기기 또는 프로그램을 포함한다.
서버(180)는 방송국(190)이 송신하는 방송 신호를 수신한다. 방송신호 수신부(110)에서는 방송 신호를 수신하는 기능을 제공하며, 일 실시예로 방송 수신 카드가 될 수 있다. 방송 정보 추출부(120)에서 수신한 방송 신호 내에 포함된 방송 정보를 추출한다. 앞서 살펴본 바와 같이, 방송 콘텐츠와 결합되거나 혹은 분리되어 송신되는 방송 정보의 일 실시예로 자막 파일, 방송 프로그램 명 또는 시간, 출연진 등의 정보가 포함된 메타 정보, 해당 방송 프로그램과 관련된 웹사이트 또는 식별 정보 등이 될 수 있다. 추출한 방송 정보는 방송 정보 DB(150)에 포함된 정보를 선택적으로 이용하거나 방송 정보 DB(150)에 추출된 방송 정보를 저장할 수 있다. 그리고 방송 연관 정보 생성부(130)는 추출된 방송 정보에 해당하는 방송 연관 정보를 생성한다. 생성할 수 있는 방송 연관 정보는 다양한데, 방송과 관련된 검색 키워드, 방송 프로그램 설명 정보 등이 될 수 있다.
생성된 방송 연관 정보는 방송 연관 정보 제공부(140)에서 제공된다. 이는 앞서 살펴본 클라이언트(100)에 속하는 다양한 디지털 기기들이 인터넷, 무선 통신, 이동 통신 등을 이용하여 서버(180)에 접속하면, 방송 연관 정보를 제공하게 된다. 이때, 클라이언트(100)는 현재 수신중인 방송이 무엇인지에 대한 식별 정보를 제공할 수 있으며, 방송 연관 정보 제공부(140)는 요청하는 방송에 해당하는 방송 연관 정보를 제공할 수 있다. 방송 정보 및 방송 연관 정보는 구현 과정에서 다양할 수 있으므로, 각각의 실시예에 대하여 살펴보고자 한다.
도 2는 본 명세서의 일 실시예에 의한 방송 정보가 자막 정보인 경우 이에 대한 방송 연관 정보를 제공하는 과정을 보여주는 도면이다.
서버(280)는 방송국(290)이 송신하는 방송 신호를 수신한다. 방송신호 수신부(210)에서는 수신한 방송 신호에는 자막 파일이 포함되어 있다. 따라서, 자막 추출부(215)에서는 방송 신호 수신부(210)에서 수신한 자막 정보를 추출한다. 자막 정보의 일 실시예는 방송 신호의 자막 방송과 관련하여 제공되는 자막 파일이 될 수 있다. 한편, 자막 정보의 또다른 실시예로 방송 대본과 관련한 스크립트 파일이 될 수 있는데, 이는 방송 신호에 포함될 수도 있고 방송 신호에 포함되지 않을 수도 있다. 즉, 방송 신호는 방송의 식별 정보만 제공하므로, 이러한 방송 신호에 포함된 방송 정보의 일 실시예인 식별 정보를 이용하여 자막 추출부(215)가 스크립트 파일을 수집하여 제공할 수도 있다.
자막 추출부(215)는 현재 방송 중인 프로그램에 대한 실시간 또는 일정 시간 간격을 두고 제공되는 자막 정보를 추출하게 되는데, 이러한 자막 정보에서 키워드를 추출하는 것이 필요하다. 실시간으로 추출되는 자막 정보는 1문장 또는 1 단어가 될 수 있다. 물론 이보다 더 길게 구성될 수도 있다. 키워드 추출부(220)는 수신된 자막 정보를 소정의 문장 또는 문단 단위를 구성하여 최대로 구성할 수 있는 조합을 생성하여 후보 키워드를 생성할 수 있다. 물론, 이 과정에서 키워드 DB(250)에 저장된 정보를 참조할 수 있다. 후보 키워드를 생성하여 키워드를 추출하는 과정에 대해서는 후술하고자 한다. 검색어 생성부(230)는 추출한 키워드를 이용하여 검색어를 생성하게 된다. 추출한 키워드가 검색에 적합하도록 검색어를 생성하게 되는데, 이는 클라이언트가 방송과 연관된 검색어 또는 검색 결과를 요청하는 경우에 검색어 또는 검색 결과를 방송 연관 정보로 제공하도록 하기 위해서이다. 또한, 본 명세서의 일 실시예로 검색어 DB(260)를 이용할 수 있는데, 예를 들어 기존의 검색어로 입력된 정보들, 사전 DB, 실시간 검색어 DB 등이 될 수도 있다.
검색어가 생성되면 검색어 및 검색결과 제공부(240)를 통해 클라이언트(200)에 제공될 수 있다. 클라이언트(200)는 방송 신호를 수신하여 방송 컨텐츠를 보는 도중, 혹은 방송 신호에서 추출되는 방송 프로그램을 확인하며, 어플리케이션이 실시간 또는 소정 시간 간격을 두고 서버에 접속하여 방송 프로그램과 관련된 검색어가 무엇인지 요청하여 그 결과인 검색어를 제공받는다. 그리고 사용자가 해당 검색어에 대한 검색 결과를 요청할 경우 클라이언트(200)는 검색 결과 요청을 서버(280)의 검색어 및 검색결과 제공부(240)에 제공하고, 서버(280)로부터 검색 결과를 수신하여 그 결과를 제공한다.
도 3은 본 명세서의 일 실시예에 의한 자막 정보에서 방송 연관 정보를 제공하는 과정을 보여주기 위해 서버 및 클라이언트에서 정보가 프로세싱되는 과정을 보여주는 도면이다.
도 3에서 방송국(390)은 서버(380) 및 클라이언트(300)와 같은 방송 수신 기능이 있는 디지털 장치가 방송을 수신할 수 있도록 방송 신호를 송신한다(S305). 방송 신호는 무선을 통해 전달될 수 있고, 유선을 통해 전달될 수 있다. 송신되는 방송 신호는 해당 방송 컨텐츠와 관련된 자막 정보를 포함하는데 이는 실시간 혹은 소정 시간 간격을 두고 변하게 된다. S305 과정에서 송신되는 방송 자막 정보의 내용은 "오늘은 영화 A에 출연 중인 배우 B씨가 오셨습니다." 이다. 이러한 방송 자막 정보가 포함된 방송 신호는 서버(380)에서 수신하여(S310) 자막 추출을 진행한다(S320). 자막 추출은 방송 신호에 포함된 자막 정보를 추출할 수 있는데, 방송 신호에 포함된 자막 파일을 추출할 수 있고, 해당 방송 신호에서 방송의 식별 정보를 추출하여, 방송 대본이 실시간으로 제공중인 사이트에 접속하여 자막을 추출할 수도 있다. 본 명세서의 다른 실시예에 의하면, 미리 저장된 자막 데이터가 있는 경우에 해당 자막을 이용하게 된다. 자막을 추출하고 추출된 자막에서 키워드를 추출하게 된다(S325). 본 명세서의 일 실시예로 개체명 사전과 패턴을 이용하여 TV 프로그램명, 인물명, 지역명, 영화명, 도서명 등을 키워드로 추출할 수 있다. 도 3의 경우 추출되는 키워드는 영화 A, 배우 B가 될 수 있다. 추출된 키워드를 이용하여 검색어를 생성한다(S330). 검색 쿼리로 제공할 수 있는 검색어를 생성할 수 있다. 예를 들어, 동명 이인의 B가 있는 경우, 영화 A에 출연 중인 B가 검색되도록 할 수 있다. 마찬가지로, A가 영화 제목이며 또한 도서명이기도 한 경우, 영화 A가 검색어가 될 수 있도록 검색어를 생성한다. 한편, 자막에는 등장하지 않은, 즉 자막 정보에 포함되지 않았으나 관련성이 높은 키워드를 검색어로 제공할 수 있다. 예를 들어, 영화 A에 출연중인 다른 배우 C를 검색어로 추가할 수 있다.
이렇게 생성된 검색어 A, B, C를 방송 연관 정보로 생성하여 클라이언트(300)가 요청할 경우 방송 연관 정보로 제공할 수 있도록 한다(S335). 한편, S315에서 방송 신호를 수신한 클라이언트(300)는 방송 식별 정보를 서버(380)에 제공하고 검색어를 요청한다(S340). 방송 식별 정보는 프로그램명, 방송 채널 정보 등이 될 수 있다. 방송 채널 정보만 제공하여도 현재 방송중인 프로그램이 무엇인지 서버에서 확인할 수 있다. 서버(380)는 생성된 검색어 리스트(A, B, C)를 제공한다(S345). 클라이언트는 수신한 검색어 리스트 A, B, C를 화면에 표시한다(S350). 그리고 사용자가 리모콘, 터치스크린 등을 이용하여 A를 선택하게 되면(S355), 선택한 A의 검색 결과를 요청한다(S360). 서버(380)는 클라이언트(300)의 검색 결과 요청에 따라 A에 대한 검색결과를 방송 연관 정보로 생성하여(S365), A에 대한 검색 결과를 클라이언트(300)에게 제공한다(S370). 물론, 서버(380)는 앞서 검색어를 생성하며 미리 검색 결과를 생성해둘 수도 있다. 검색 결과를 수신한 클라이언트(300)는 상기 검색 결과를 표시한다(S375). 검색 결과는 다양하게 제공될 수 있다. 도 3과 같이 영화 A에 대한 정보를 요청한 경우, 영화 A의 감독, 배우, 줄거리 및 상영 정보가 될 수 있다. 배우 B, C에 대한 정보를 요청한 경우, 배우의 최근 출연작, 최근 근황, 뉴스에서 언급된 내용 등을 제공할 수 있다. 물론, 검색 결과로는 이러한 정형적인 정보 이외에도 트위터, 블로그와 같이 개인들이 생성한 정보 중의 주요 정보를 제공할 수도 있다.
도 4는 본 명세서의 일 실시예에 의한 스마트 TV 화면의 구성을 보여주는 도면이다. 도 4의 스마트 TV(400)의 화면 내에 방송이 표시되면서 실시간으로 서버로부터 방송 연관 정보인 검색어를 수신하여 410과 같이 표시된다. 그리고 사용자가 영화 A를 선택한 경우, 420과 같이 영화 A와 관련된 방송 연관 정보를 제공할 수 있다. 도 4의 420에서 보여지는 방송 연관 정보는 서버에서 해당 키워드에 대한 검색 결과가 될 수도 있고, 해당 키워드에 대해 미리 생성된 정보가 될 수도 있다.
도 5는 본 명세서의 일 실시예에 의한 후보 키워드 추출 과정을 보여주는 도면이다. 도 5에서는 입력된 하나의 문장에서 후보 키워드를 생성하는 예를 보여준다. 도 2의 구성에서 적용가능한 예를 보여주고 있다. 도 2의 자막 추출부(215)에서 방송 신호에 포함된 자막을 추출한다. 도 5의 자막(510)에서 후보 키워드가 산출된다. 입력받은 특정 단위(510)에서 검색어를 추출하기 위하여 후보 키워드는 520과 같이 가능한 모든 후보 키워드를 생성한다. 도 5에서는 어절 단위로 최대 4어절까지의 연속된 모든 조합을 생성하며, 마지막 어절은 형태소 단위로 조합하여 여러 개로 만들 수 있다. 물론, 4 어절에 본 발명이 한정되는 것은 아니며, 자막 추출의 설정에 따라 다양하게 변화할 수 있다. 또한, 입력되는 자막의 특정 단위 역시 1문장 또는 1 어절 등으로 다양하게 구성할 수 있다. 이때, 자막에서 검색어를 추출하여 실시간에 가깝게 클라이언트에 제공하기 위하여 입력되는 자막의 특정 단위를 1어절로 하여 1문장까지 받기 위해 기다리는 딜레이 시간을 줄일 수 있다. 1어절씩만 받게되면 해당 어절의 앞 어절들을 참고할 수 없으므로, 1어절씩 누적하여 받도록 한다. 1문장이 끝나면 누적된 문장은 NULL로 초기화한다.
520의 후보 키워드에서 각각에 대해 검색어가 될 수 있는지 여부를 판단한다. 검색어가 되는 것은 방송 자막에 표시될 경우 방송 연관 정보를 제공하는 키워드가 되는 것의 일 실시예이다.
자막에서 검색어를 실시간으로 추출하기 위하여 1문장씩 누적하여 받아 후보 키워드를 생성할 경우, 문장의 앞부분이 불필요하게 후보로 생성될 수 있다. 후보가 많아질 경우, 검색어 추출 시간이 길어지기 때문에 최대한 후보를 줄이는 것이 필요하다. 따라서, 현재 입력받은 마지막 어절, 또 그 앞 어절의 단어로 끝나지 않는 후보 키워드는 이전에 이미 검사를 수행해서 결과를 얻었다고 판단하여, 이번 턴에서는 검사를 하지 않는다. 앞 어절의 단어로 끝나는 후보 키워드까지 확인할 경우, 마지막 어절이 클루가 되어 앞 어절까지 끝나는 키워드 후보가 검색어가 될 수도 있기 때문이다.
검색어를 추출하기 위해서 다양한 정보를 이용할 수 있다. 이용할 수 있는 정보는 방송의 종류에 따라 다양해 질 수 있다. 예를 들어, 본 명세서의 일 실시예에 의하면, 방송과 관련된 개체명 사전과 패턴을 이용하여 TV 프로그램명, 인물명, 지역명을 추출할 수 있다. 이 경우, 방송과의 밀접한 관계를 기준으로 보다 명확한 키워드를 추출할 수 있다. 한편, 후보 키워드에 대한 사전 DB를 적용하여 사전 기반 단어 추출 방식을 사용할 수 있다. 이 외에도 사전과 통계 정보를 이용하여 어려운 단어 또는 신조어를 추출할 수 있다. 각각에 대해 살펴보면 다음과 같다.
도 6은 본 명세서의 일 실시예에 의한 개체명 사전을 이용하여 검색어를 추출하는 과정을 보여주는 도면이다. 도 5에서 추출된 후보 키워드 610은 앞서 살펴본 도 5의 520와 같은 후보 키워드들로써, 이들 후보 키워드들이 개체명 DB(620)에서 존재하는지 여부를 확인하여 검색어로 사용할 수 있는 키워드인지 여부를 확인할 수 있다.
개체명 DB(620)에는 TV프로그램명, 인물명, 지역명, 영화명, 도서명 등이 저장되어 있어, 후보 키워드가 미리 구축된 개체명에 존재하는지를 확인하고, 또한 630, 640, 650의 리스트를 적용하여 검색어를 선정할 수 있다. 630, 640, 650은 후보 키워드에 결합된 조사, 단어 들을 통하여 검색어 여부를 보다 명확하게 판단하는 리스트를 포함한다.
먼저 630의 개체별 조사리스트를 적용하는 예를 살펴보면, 아래의 조사 리스트(표 1) 중의 하나가 후보 키워드 뒤에 결합된 경우, 해당 후보 키워드를 검색어로 할 수 있다.
조사 리스트의 일 실시예
개체명 카테고리 조사 리스트
인물명 {에} {야} {은} {는} {이} {가} {씨} {군} {양} {님} {형} {아} {도} {입니다}
지역명 {에서} {까지} {이요} {에} {의}
다음으로 640과 같이 클루(clue) 리스트를 적용하는 예를 살펴보면, 아래와 같은 클루 리스트(표 2) 중 하나가 후보 키워드의 앞 또는 뒤에 결합된 경우, 해당 후보 키워드를 검색어로 할 수 있다.
클루 리스트의 일 실시예
개체명 카테고리 클루 리스트
TV프로그램명 {스튜디오} {버라이어티} {드라마} {프로그램} {녹화} {촬영} {촬영지} {감독} {출연} {PD} {pd} {FD} {fd} {스텝} {staff} {작가} {게스트} {특집}
인물명 {코미디언} {게스트} {배우} {가수} {개그맨} {연기자} {출연} {선생} {선생님} {누구} {감독} {감독님} {표정} {멤버} {카메오} {이상형} {오빠} {누나} {언니}
지역명 {베이스캠프} {도착} {몇개국} {몇 개국} {마을} {해수욕장} {저수지} {폭포} {코스}
다음으로 650과 같이 객체별 동사 리스트를 적용하는 예를 살펴보면, 아래와 같은 동사 리스트(표 3) 중 하나가 후보 키워드의 뒤에 위치할 경우 해당 후보 키워드를 검색어로 할 수 있다.
동사 리스트의 일 실시예
개체명 카테고리 동사 리스트
TV프로그램명 {보다} {듣다} {부르다}
인물명 {웃다} {만나다}
지역명 {걷다} {가다} {오다}
개체명 DB 및 표 1, 2, 3의 조건을 만족시킬 경우, 660과 같이 해당 후보 키워드를 검색어로 추출할 수 있다. 물론, 상기 표 1, 2, 3 중 어느 하나의 조건만 만족시키는 개체명을 검색어로 선택할 수 있고, 상기 표 1, 2, 3 중 두개 이상 혹은 전부를 만족시켜야 해당 개체명을 검색어로 선택할 수 있다. 표 1, 2, 3 및 이에 대한 리스트들은 일 실시예이며, 방송의 특성, 키워드 추출 방식 등에 따라 다양하게 변형하여 적용가능하다.
도 6의 과정은 방송과 관련된 사전 정보를 미리 확보한 경우에 적용 가능하다. 드라마, 영화 관련 방송 프로그램, 엔터테인먼트와 같은 방송 프로그램에 적용할 경우, 유효한 검색어를 추출할 수 있다.
도 7은 본 명세서의 일 실시예에 의한 사전 기반으로 검색어를 추출하는 과정을 보여주는 도면이다. 후보 키워드(710)가 각 사전별로 만들어 놓은 조건을 만족하면 어려운 단어 또는 신조어로 추출한다. 도 7의 방식은 뉴스, 다큐멘터리 등 프로그램 마다 특색있는 인명, 지명, 혹은 용어가 포함되거나, 시사성을 가지는 방송 프로그램인 경우 보다 효과적인 검색어를 추출할 수 있다.
적용 가능한 데이터베이스(Database, DB)로는 토픽 DB(730), 백과사전 DB(720), 용어사전 DB(740) 등이 있다. 먼저 토픽 DB(730)에 대해 살펴보면, 인터넷 검색 서비스를 제공하면서 실시간 검색어, 혹은 주요 검색어, 최다 검색어 등과 같이 시사성을 가지는 토픽 검색어와 자막에 포함된 키워드를 비교하여 검색어 추출을 수행할 수 있다. 일 실시예로 네이트(www.nate.com)에서 제공하는 검색 서비스에서 누적된 단어들을 DB화 하여 사용할 수 있다.
한편 백과사전 DB(720)의 경우에는 백과사전의 엔트리(entry)로 존재하는 단어인지를 확인하여 검색어로 추출할 수 있다. 백과사전에는 카테고리별로 나뉘어질 수 있으므로, 해당하는 카테고리가 K개 이하(예를 들어 3개 이하)이며 그 중에서 해당 방송과 관련있는 카테고리 리스트를 만족시킬 경우 해당 키워드를 검색어로 할 수 있다. 이 경우, 후보 키워드의 길이에 대해 제한을 가할 수도 있으며, 후보 키워드에 대하여 도 6의 과정을 통해 산출된 검색어를 다시 백과사전 DB에 존재하는지 확인할 수도 있다.
또다른 실시예로 용어사전 DB(740)를 사용할 수 있다. 용어사전 엔트리에 존재하며 백과사전 엔트리의 카테고리 종류 중 하나가 대상 카테고리 리스트를 만족하는 경우(예를 들어 대상 카테고리가 의학, 연극영화, 법률 등)에 해당 카테고리 리스트와 후보 키워드 간의 연관성을 검토하여 검색어로 추출할 수 있다. 도 7은 추출된 후보 키워드(710)가 미리 설정된 DB(720, 730, 740)에 해당하는지 여부를 통해 검색어로 추출하는 것을 의미한다. 도 7은 보다 범용적인 단어들에 대한 DB인 반면, 도 6은 방송 프로그램에 보다 특화된 DB가 될 수 있다.
한편 도 6, 7의 DB를 사용하는 방식과 결합하여 통계 정보를 이용하여 신조어를 추출하거나 혹은 새로운 검색어로 결정하여 등록하고, 이를 검색어로 제공하는 방식도 있다.
예를 들어, 검색 사이트에서 누적하여 생성하는 검색빈도 누적 통계 DB를 이용하여 일정 기간(예를 들어 지난 1년) 동안의 최대값, 평균값, 또는 월별로 12 구간으로 나눈 구간별 평균치, 구간별 최대값을 이용하여, 소정 길이(한글의 경우 6byte 또는 영어로만 되어 있는 3byte) 이상의 후보 키워드 중 전체 평균값이 소정 횟수(예를 들어 1,000)를 넘지 않는 키워드를 대상으로 한다. 이는 흔한 단어가 아니어서 다양하게 사용되지 않는 단어라는 것을 의미한다.
따라서, 다음의 세 가지 조건을 선택적으로 만족하는 후보 키워드는 어려운 단어/신조어 후보로 판단할 수 있다. i) 구간별 평균값이 임계치를 넘어가는 경우가 없을 경우, 어려운 단어 후보로 설정할 수 있으며, ii) 구간별 최대값이 전체 '평균값'의 3배수보다 큰 경우가 3 구간 이하이면 신조어 후보로 설정할 수 있다. 또한, iii) 최근 3개 구간의 구간별 최대값이 전체 최대값의 1/2보다 크거나 최근 3개 구간 외의 9개 구간별 최대값이 전체 최대값의 1/2보다 작은 경우 신조어 후보로 설정할 수 있다. 어려운 단어 후보가 도 7의 백과사전/토픽/용어사전 사전 엔트리에 존재하면 어려운 단어로 추출하고, 신조어 후보가 국어사전에 존재하지 않으면 신조어로 추출한다. 이렇게 추출된 검색어는 클라이언트에게 검색어로 제공하며, 또한 도 2의 키워드 DB(250)에 새로이 산출된 신조어를 키워드로 저장할 수 있다.
상기의 과정에서 산출되는 검색어는 자막에 포함된 검색어 혹은 자막에 포함된 단어를 변형시킨 검색어, 또는 자막에 포함된 단어와 관련있는 검색어 등이 될 수 있다. 검색어에 대한 검색 결과는 포털 사이트에서의 검색결과, 트위터, 블로그, 페이스북과 같은 소셜 네트워크에서의 검색결과, 또는 방송국에서 제공하는 정보 등을 포함하며, 어떤 정보를 제공할 것인지는 서버에서 선택하여 제공할 수 있다.
도 8은 본 명세서의 다른 실시예에 의한 서버 및 검색 서버에서 방송 정보를 이용하여 방송 연관 정보를 제공하는 구성을 보여주는 도면이다. 앞서 살펴본 바와 같이 방송 정보 추출기(810)는 방송 신호에서 방송 정보를 추출한다. TV 수신카드를 이용하여 실시간으로 입력받는 방송시그널에서 자막영역 추출하고, 추출한 자막영역을 디코딩하여 텍스트로 변환할 수 있다. 자막, 대본, 방송 신호가 제공하는 방송 프로그램의 식별정보(ID) 등이 820과 같이 추출되면 키워드 추출기(840)에서 후보 키워드를 추출한다. 한편, 자막, 방송 프로그램명, 대본 등과 같은 방송 정보는 단어별 출현 빈도 DB(830)에 저장될 수 있다. 즉, 실시간으로 들어오는 자막 텍스트와 같은 방송 정보와 소셜 네트워크 등에서 생성되는 실시간 글(831), 방송사 등이 제공하는 방송 관련 DB(832), 인터넷 뉴스(833) 등으로부터 단어를 추출하여 단어별 출현빈도가 누적하여 저장되도록 하여, 특정 시간대별 단어별 출현빈도의 추이를 적용하여 빠른 검색이 가능하도록 구현할 수 있다. 또한, 키워드 추출기(840)에서 자막 테스트로부터 검색어 후보 키워드 추출하게 되면, 출현빈도 DB와 TV 검색어 추출기(860), 실시간 이슈어 추출기(850)를 이용하여 후보키워드 중 특정조건에 맞는 키워드를 TV 검색어와 실시간 이슈어로 추출하여 별도의 검색 서버(890)를 통하여 제공할 수 있다.
TV 검색어 추출기(860)는 현재 언급된 후보 키워드에 대한 디테일한 설명이 필요한지 여부를 판단한다. 개체명, 신조어 또는 어려운 단어가 될 수 있으며, 이를 위하여, 이전에 구축된 검색어 기술 패턴을 이용하거나, 단어별 출현빈도 DB(830)를 이용하여 현재 다른 매체 또는 사이트에서 갑자기 많이 언급된 단어를 클라이언트에 검색어 또는 키워드로 제공할 수 있도록 할 수 있다.
실시간 이슈어 추출기(850)는 현재 언급된 키워드가 이슈가 되는지 여부를 인식하는데 주로 "이승기 열애" 와 같이 개체명 + 일반 단어의 형태로 구성된다. 이전에 구축된 이슈어 구성 패턴을 이용하거나, 단어별 출현빈도 DB(830)를 이용하여 현재 다른 매체 또는 사이트에서 갑자기 많이 언급된 개체명이나 이슈어로 많이 사용되는 일반단어를 인식하여 이슈어를 추출할 수 있다. 인터넷 뉴스에 미리 뜬 기사를 이용하여 이슈어를 미리 생성해 둘 수도 있다. 이슈어를 제공함에 있어서는 이슈어들에 랭킹을 부과하여 특정 이슈어를 선택하고, 이를 가공하여 노출시점과 기간을 결정하에 검색 서버(890)에 제공할 수 있다. 또한, 서버(800)에 클라이언트가 요청하는 특정 키워드에 대한 방송 연관 정보도 함께 제공할 수 있다. 서버(800)는 검색 서버(890)를 포함하여 검색 결과를 제공할 수 있다.
도 9는 본 명세서의 일 실시예에 의한 서버에서의 구현 과정을 보여주는 도면이다. 서버는 앞서 살펴본 검색 서버를 포함할 수 있다. 물론, 별도의 시스템에서 개별로 동작하며 네트워크를 통해 데이터를 송수신할 수도 있다.
서버는 유선 또는 무선으로 제공되는 방송 신호를 수신한다(S910). 그리고 상기 수신한 방송 신호에서 방송 정보를 추출하게 된다(S920). 방송 정보는 다양할 수 있는데, 예를 들어, 상기 방송 신호와 관련된 자막 파일, 상기 방송 신호의 프로그램을 식별하는 정보, 상기 프로그램의 출연진 정보, 또는 상기 프로그램과 관련된 웹사이트들이 될 수 있다. 방송 정보의 따라 키워드를 추출하거나 방송 연관 정보를 생성, 저장하는 방식이 상이할 수 있다. S930에서 방송 정보에 따라 처리 방식이 분기된다. 방송 정보가 방송을 식별하는 정보, 예를 들어, 방송 신호의 채널 정보, 프로그램 명칭 등이 될 수 있다. 이러한 정보를 이용하여 방송 신호에서 제공하는 프로그램을 식별할 수 있으며, 식별된 방송 프로그램에 대한 다양한 정보(웹사이트, 홈페이지, 소셜 네트워크, 대본 정보 등)를 이용하여 키워드 및 방송 연관 정보를 생성할 수 있다(S940). 예를 들어, 우주 탐사와 관련된 다큐멘터리라는 것이 확인된 경우, 우주 탐사와 관련한 키워드/방송 연관 정보를 생성할 수 있다. 또한 상기 프로그램에서 사용하는 대본 정보가 미리 정해진 경우, 대본 및 방송 시간을 비교하여 해당 방송 시점에 시청자가 검색을 필요로 할 수 있는 키워드를 선정하고 이에 대한 방송 연관 정보를 제공할 수 있다.
한편, 방송 정보가 자막 파일인 경우, 자막 파일에서 후보 키워드를 추출하고(S950), 추출한 후보 키워드에서 검색어가 되는 키워드를 선택 또는 생성하게 된다(S952). 이 때, 상기 키워드를 선택 또는 생성하는 단계는 상기 후보 키워드가 데이터베이스에 저장된 단어인지 확인하는 과정을 부가적으로 행할 수 있다. 키워드가 선택되면 이에 해당하는 방송 연관 정보를 저장한다(S954). 방송 연관 정보를 그대로 저장할 수도 있고, 해당 키워드에 대한 방송 연관 정보의 요청이 있으면 관련된 방송 연관 정보를 추출할 수 있는 정보만을 저장할 수도 있다.
그 외 방송 정보가 기타 방송과 관련된 정보를 추출할 수 있는 방송 정보인 경우, 예를 들어, 출연진의 이름이 포함되었거나, 프로그램의 장르 정보를 이용하여 키워드 및 방송 연관 정보를 추출할 수 있다(S960).
키워드를 추출하는 과정에서 실시간 검색어 데이터베이스, 검색어 데이터 베이스, 백과사전 데이터베이스, 토픽 데이터베이스, 또는 용어 사전 데이터베이스 중 어느 하나 이상을 사용하여 키워드를 선택할 수 있다.
추출된 키워드 및 방송 연관 정보의 생성이 완료하면 클라이언트에 키워드를 송신한다(S956). 그리고 상기 클라이언트로부터 상기 키워드와 관련된 방송 연관 정보를 요청하는 메시지를 수신하여 상기 클라이언트에 요청된 방송 연관 정보를 송신한다(S958).
도 9의 S910~S956은 방송 신호에 포함된 정보를 실시간으로 파악하여 제공하는 것이므로, 방송 신호에 포함된 정보가 바뀔 경우, 클라이언트에 송신되는 키워드 또는 방송 연관 정보가 실시간으로 변화하게 된다. 특히, 자막 정보를 기반으로 할 경우, 자막 파일이 실시간으로 계속 변화하기 때문에 추출되는 키워드 역시 실시간으로 클라이언트에게 송신하되, 계속 업데이트된 키워드를 제공하게 된다.
도면에 미도시 되었으나, 도 8에서 살펴본 바와 같이 상기 추출된 키워드를 검색 사이트의 실시간 키워드로 제공하는 과정을 추가적으로 수행할 수 있다. 상기 서버에서 화면이 바뀌거나 자막이 바뀌는 것을 체크하기 위하여 수신한 화면과 이전에 저장된 화면의 차이를 비교하거나, 자막을 특정 범위(어절별)로 비교하여 유사한 정보가 전혀 없는지를 확인하여 변화가 발생한 경우, 새로운 정보를 클라이언트에 제공할 수 있다. 클라이언트에 새로운 정보를 제공하는 것은 클라이언트의 요청에 의하거나, 혹은 서버에서 클라이언트에 정보를 송신하는 푸쉬 방식으로 구현할 수 있다.
또한, 예상치 못한 에러로 자막 수신 등에 지연(delay)가 발생한 경우, 또는 서버에서 생성되어 누적된 키워드가 많은 경우, 실시간성을 보장하기 위하여 누적된 키워드는 버리고 최근 키워드만 수신할 수도 있다. 불필요한 키워드를 선별하여 제거하기 위하여 해당 키워드가 선정된 시간을 기준으로 판단하거나, 해당 키워드와 방송과의 관련성을 기준으로 판단할 수 있다. 선정된 시간을 기준으로 하는 것은 해당 키워드가 오랫동안 제공된 경우, 더 이상 사용자의 검색 니즈를 충족시키지 않을 수 있으므로, 시간을 기준으로 제거할 키워드를 선별하는 것이다. 한편, 방송과의 관련성은 방송의 내용을 참조하거나, 지금까지 수신된 자막 정보를 이용하여 비교할 수 있다. 영화와 관련된 방송이라면 중간에 특정 인물에 대한 키워드가 추출될 경우, 해당 인물의 중요도에 따라 계속 키워드로 선택하여 제공할 수 있다.
도 10은 본 명세서의 일 실시예에 의한 클라이언트에서 방송과 관련된 키워드 및 방송 연관 정보를 수신하는 과정을 보여주는 도면이다.
도 10의 클라이언트는 방송 신호를 수신하여 해당 방송을 출력하는 TV, 스마트폰, 노트북, DMB 등에 결합하여 출력중인 방송의 식별 정보를 서버에 송신하여 해당 방송과 관련된 키워드를 수신할 수 있다. 물론, 방송을 출력하지 않는 경우에도, 해당 방송 프로그램에 대한 식별 정보를 서버에 제공하여 해당 방송과 관련된 키워드를 수신할 수도 있다. 예를 들어, 방송 채널에 대한 식별 정보를 송신할 경우, 서버는 해당 방송 채널에서 현재 방송 중인 방송 신호에서 생성된 키워드를 클라이언트에 제공할 수 있다. 보다 상세히 살펴보면 다음과 같다.
클라이언트는 현재 방송 중인 방송 프로그램에 대한 식별 정보를 서버에 송신한다(S1010). 그리고, 상기 방송 프로그램에 대해 실시간으로 생성된 하나 이상의 키워드를 수신하게 된다(S1020). 물론, 상기 키워드는 앞서 살펴본 과정에서 방송 신호를 수신하여 서버에서 생성된 키워드이다. 또한, 예상치 못한 에러로 자막 수신 등에 지연(delay)가 발생한 경우, 또는 서버에서 생성되어 누적된 키워드가 많은 경우, 실시간성을 보장하기 위하여 누적된 키워드는 버리고 최근 키워드만 수신할 수도 있다.
클라이언트는 상기 수신한 키워드 중 어느 하나 이상에 대한 방송 연관 정보를 요청하는 메시지를 상기 서버에 송신하게 된다(S1030). 이 경우, 서버에 송신하게 되는 키워드가 다수가 될 수도 있다. 이후, 송신한 키워드에 대하여 상기 서버로부터 상기 요청된 방송 연관 정보를 수신하여 디스플레이하게 된다. 디스플레이 방식은 클라이언트가 결합한 장치에 따라 다양하게 변형될 수 있는데 예를 들어 방송 중인 컨텐츠의 화면의 외곽 또는 별도의 정보 제공을 위한 디스플레이부에 상기 키워드 또는 상기 방송 연관 정보를 디스플레이 할 수 있다.
클라이언트가 서버로부터 키워드를 수신하는 방식으로 소정 시간 간격(예를 들어 1초, 5초 등)을 두고 서버에 지속적으로 정보를 요구하는 메시지(Request Message)를 송신할 수도 있으나, 클라이언트와 서버가 통신 상으로 연결되어 서버가 정보가 생성되는 즉시, 해당 정보를 클라이언트에 푸쉬(push)하는 방식으로도 구현할 수 있다. 물론, 반드시 클라이언트와 서버가 통신상에 연결되어 있지 않고, 서버가 클라이언트의 주소(IP) 등을 이용하여 서버에 정보가 변경되는 경우 변경된 정보를 푸쉬할 수 있다. 즉, 자막의 내용에 차이가 발생하거나, 새로운 정보를 제공해야 하거나 화면의 전환에 따라 제공되는 정보가 변화하는 것을 실시간으로 반영하기 위하여, 클라이언트가 적극적으로 일정 기간을 두고 정보를 요청하거나, 혹은 서버에서 해당 정보를 클라이언트에 제공하도록 구현할 수 있다.
앞서 살펴본 예들은 방송 신호에 포함된 식별 정보 또는 방송 자막 정보 등을 이용하여 키워드를 추출하는 예를 보여주고 있다. 그러나 본 발명은 이에 한정되지 않고, 다양한 방식으로 방송 신호에 포함된 정보를 추출할 수 있다. 자막의 경우에도 다양한 자막을 사용할 수 있다. 예를 들어, 영상 자막은 영상에 입혀져 따로 텍스트로 출력이 불가능한 오픈자막(Open Caption)과 추출이 가능한 폐쇄자막 (Closed Caption)이 있는데, 앞서 살펴본 자막 파일이 폐쇄 자막의 일 실시예가 될 수 있다. 그러나 문자 인식을 통하여 오픈 자막 역시 추출이 가능하다.
도 11은 본 명세서의 일 실시예에 의한 방송 신호에 포함된 화상 데이터를 이용하여 방송 정보 및 방송 연관 정보를 생성하는 과정을 보여주는 도면이다. 도 11에서 등장 인물의 얼굴 부분과 문자 부분을 인식하여(S1110), 기존에 저장된 인물 DB와 방송 정보 DB를 검색한다(S1120). 인물 DB에서 유사한 인물이 검색된 경우, 해당 방송 프로그램과 관련된 방송 정보 DB를 검색하여 인식한 인물 정보가 정확한지 판단한다. 물론, 문자 인식 과정에서 추출한 문자 역시 방송과 관련된 정보를 제공할 수 있다. 추출한 정보와 데이터베이스 간의 매칭 여부에 따라 키워드를 생성한다(S1120).
본 명세서에서의 데이터베이스는 키워드의 특징 정보, 예를 들어, 패턴, 출현 빈도, 키워드의 분류 등 키워드에 대한 정보를 추출하거나, 키워드의 특성을 파악하는데 필요한 정보가 함께 결합하여 저장된 매체를 포함한다. 키워드의 특징은 앞서 살펴본 백과사전 DB, 토픽 DB, 용어사전 DB 등에도 포함될 수 있으며, 앞서 살펴본 조사 리스트, 클루 리스트, 동사 리스트 등과 같은 리스트들도 데이터베이스로 구현가능하다. 즉, 본 명세서에서의 데이터베이스는 정보를 저장하는 넓은 의미를 지시하며, 반드시 특수한 형태의 상업용 데이터베이스에 한정되는 것이 아니며, 소정의 요건에 따라 정보를 요청하면, 요청된 사항에 해당하는 정보를 제공하는 모든 실시예를 포함한다.
이상에서, 본 발명의 실시예를 구성하는 모든 구성 요소들이 하나로 결합되거나 결합되어 동작하는 것으로 설명되었다고 해서, 본 발명이 반드시 이러한 실시예에 한정되는 것은 아니다. 즉, 본 발명의 목적 범위 안에서라면, 그 모든 구성 요소들이 하나 이상으로 선택적으로 결합하여 동작할 수도 있다. 또한, 그 모든 구성 요소들이 각각 하나의 독립적인 하드웨어로 구현될 수 있지만, 각 구성 요소들의 그 일부 또는 전부가 선택적으로 조합되어 하나 또는 복수 개의 하드웨어에서 조합된 일부 또는 전부의 기능을 수행하는 프로그램 모듈을 갖는 컴퓨터 프로그램으로서 구현될 수도 있다. 그 컴퓨터 프로그램을 구성하는 코드들 및 코드 세그먼트들은 본 발명의 기술 분야의 당업자에 의해 용이하게 추론될 수 있을 것이다. 이러한 컴퓨터 프로그램은 컴퓨터가 읽을 수 있는 저장매체(Computer Readable Media)에 저장되어 컴퓨터에 의하여 읽혀지고 실행됨으로써, 본 발명의 실시예를 구현할 수 있다. 컴퓨터 프로그램의 저장매체로서는 자기 기록매체, 광 기록매체, 캐리어 웨이브 매체 등이 포함될 수 있다.
또한, 이상에서 기재된 "포함하다", "구성하다" 또는 "가지다" 등의 용어는, 특별히 반대되는 기재가 없는 한, 해당 구성 요소가 내재될 수 있음을 의미하는 것이므로, 다른 구성 요소를 제외하는 것이 아니라 다른 구성 요소를 더 포함할 수 있는 것으로 해석되어야 한다. 기술적이거나 과학적인 용어를 포함한 모든 용어들은, 다르게 정의되지 않는 한, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가진다. 사전에 정의된 용어와 같이 일반적으로 사용되는 용어들은 관련 기술의 문맥 상의 의미와 일치하는 것으로 해석되어야 하며, 본 발명에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.
이상의 설명은 본 발명의 기술 사상을 예시적으로 설명한 것에 불과한 것으로서, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자라면 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 다양한 수정 및 변형이 가능할 것이다. 따라서, 본 발명에 개시된 실시 예들은 본 발명의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시 예에 의하여 본 발명의 기술 사상의 범위가 한정되는 것은 아니다. 본 발명의 보호 범위는 아래의 청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 발명의 권리범위에 포함되는 것으로 해석되어야 할 것이다.

Claims (20)

  1. 유선 또는 무선으로 제공되는 방송 신호를 수신하는 단계;
    상기 수신한 방송 신호에서 방송 정보를 추출하는 단계;
    상기 방송 정보에서 방송 연관 정보를 제공하는데 필요한 키워드를 추출하는 단계; 및
    상기 키워드와 상기 키워드에 해당하는 방송 연관 정보를 저장하는 단계를 포함하며,
    상기 키워드를 추출하는 단계는
    상기 방송 정보에서 후보 키워드를 추출하여 상기 추출된 후보 키워드에 개체별 조사 리스트, 클루 리스트, 또는 동사 리스트 중 어느 하나 이상을 적용하여 키워드를 추출하는 것을 특징으로 하며,
    상기 개체별 조사 리스트의 적용은 조사 리스트 중의 하나가 후보 키워드 뒤에 결합한 경우 해당 후보 키워드를 검색어로 하며,
    상기 클루 리스트의 적용은 클루 리스트 중 하나가 후보 키워드의 앞 또는 뒤에 결합된 경우 해당 후보 키워드를 검색어로 하며,
    상기 동사 리스트의 적용은 동사 리스트 중 하나가 후보 키워드의 뒤에 위치할 경우 해당 후보 키워드를 검색어로 하는 것을 특징으로 하는, 실시간으로 방송 연관 정보를 제공하는 방법.
  2. 제 1항에 있어서,
    상기 방송 정보는 상기 방송 신호와 관련된 자막 파일, 상기 방송 신호의 프로그램을 식별하는 정보, 상기 프로그램의 출연진 정보, 또는 상기 프로그램과 관련된 웹사이트 중 어느 하나 이상을 포함하는 것을 특징으로 하는, 실시간으로 방송 연관 정보를 제공하는 방법.
  3. 제 1항에 있어서,
    상기 방송 정보가 자막 파일인 경우,
    상기 키워드를 추출하는 단계는 상기 자막 파일에서 문장 또는 4 어절 이하로 누적하여 후보 키워드를 추출하는 단계; 및
    상기 추출한 후보 키워드에서 검색어가 되는 키워드를 선택 또는 생성하는 단계를 포함하는, 실시간으로 방송 연관 정보를 제공하는 방법.
  4. 제 3항에 있어서,
    상기 키워드를 선택 또는 생성하는 단계는 상기 후보 키워드가 데이터베이스에 저장된 단어인지 확인하는 단계를 더 포함하는, 실시간으로 방송 연관 정보를 제공하는 방법.
  5. 제 4항에 있어서,
    상기 데이터베이스는 키워드의 패턴 또는 등장 빈도가 저장된 것을 특징으로 하는, 실시간으로 방송 연관 정보를 제공하는 방법.
  6. 제 4항에 있어서,
    상기 데이터베이스는 실시간 검색어 데이터베이스, 검색어 데이터 베이스, 백과사전 데이터베이스, 토픽 데이터베이스, 또는 용어 사전 데이터베이스 중 어느 하나 이상인 것을 특징으로 하는, 실시간으로 방송 연관 정보를 제공하는 방법.
  7. 제 1항에 있어서,
    상기 방송 정보가 상기 방송 신호의 프로그램을 식별하는 정보인 경우, 상기 키워드 및 방송 연관 정보는 상기 식별 정보를 이용하여 생성된 것을 특징으로 하며, 상기 키워드 및 방송 연관 정보는 상기 프로그램과 관련된 웹사이트 정보, 소셜 네트워크에서 작성된 정보, 상기 프로그램의 대본 정보 중 어느 하나 이상에서 추출된 정보인 것을 특징으로 하며,
    상기 키워드는 검색 사이트에서 누적하여 생성하는 검색 빈도 누적 통계 DB를 이용하여 추출된 것을 특징으로 하는, 실시간으로 방송 연관 정보를 제공하는 방법.
  8. 제 1항에 있어서,
    클라이언트에 상기 키워드를 송신하는 단계;
    상기 클라이언트로부터 상기 키워드와 관련된 방송 연관 정보를 요청하는 메시지를 수신하는 단계; 및
    상기 클라이언트에 요청된 방송 연관 정보를 송신하는 단계를 더 포함하는, 실시간으로 방송 연관 정보를 제공하는 방법.
  9. 제 1항에 있어서,
    상기 추출된 키워드를 검색 사이트의 실시간 키워드로 제공하는 단계를 더 포함하는, 실시간으로 방송 연관 정보를 제공하는 방법.
  10. 클라이언트가 현재 방송 중인 방송 프로그램에 대한 식별 정보를 서버에 송신하는 단계;
    상기 방송 프로그램에 대해 실시간으로 생성된 하나 이상의 키워드를 수신하는 단계;
    상기 수신한 키워드 중 어느 하나 이상에 대한 방송 연관 정보를 요청하는 메시지를 상기 서버에 송신하는 단계; 및
    상기 서버로부터 상기 요청된 방송 연관 정보를 수신하여 디스플레이하는 단계를 포함하며,
    상기 키워드는 상기 서버가 상기 방송 정보에서 후보 키워드를 추출하여 상기 추출된 후보 키워드에 개체별 조사 리스트, 클루 리스트, 또는 동사 리스트 중 어느 하나 이상을 적용하여 키워드를 추출한 것을 특징으로 하며,
    상기 개체별 조사 리스트의 적용은 조사 리스트 중의 하나가 후보 키워드 뒤에 결합한 경우 해당 후보 키워드를 검색어로 하며,
    상기 클루 리스트의 적용은 클루 리스트 중 하나가 후보 키워드의 앞 또는 뒤에 결합된 경우 해당 후보 키워드를 검색어로 하며,
    상기 동사 리스트의 적용은 동사 리스트 중 하나가 후보 키워드의 뒤에 위치할 경우 해당 후보 키워드를 검색어로 하는 것을 특징으로 하는, 실시간으로 방송 연관 정보를 제공하는 방법.
  11. 제 10항에 있어서,
    상기 디스플레이하는 단계는 상기 키워드 또는 상기 방송 연관 정보를 상기 방송 중인 방송 컨텐츠의 화면 중 일부영역에 표시하는 단계를 더 포함하는, 실시간으로 방송 연관 정보를 제공하는 방법.
  12. 제 10항에 있어서,
    상기 식별 정보는 방송 채널에 대한 식별 정보인 것을 특징으로 하는, 실시간으로 방송 연관 정보를 제공하는 방법.
  13. 제 10항에 있어서,
    상기 디스플레이하는 단계는 상기 방송 제목 및 상기 방송 채널 정보와 상기 방송 연관 정보를 디스플레이하는 단계를 포함하는, 실시간으로 방송 연관 정보를 제공하는 방법.
  14. 유선 또는 무선으로 제공되는 방송 신호를 수신하는 방송신호 수신부;
    상기 수신한 방송 신호에서 방송 정보를 추출하는 방송 정보 추출부;
    상기 방송 정보에서 방송 연관 정보를 제공하는데 필요한 키워드를 추출하여 상기 키워드와 상기 키워드에 해당하는 방송 연관 정보를 저장하는 방송 연관 정보 생성부; 및
    클라이언트에 키워드를 송신하고, 상기 키워드에 대한 방송 연관 정보를 요청하는 메시지를 수신하며, 상기 클라이언트에 상기 방송 연관 정보를 송신하는 방송 연관 정보 제공부를 포함하며,
    상기 방송 연관 정보 생성부는 상기 방송 정보에서 후보 키워드를 추출하여 상기 추출된 후보 키워드에 개체별 조사 리스트, 클루 리스트, 또는 동사 리스트 중 어느 하나 이상을 적용하여 키워드를 추출하는 것을 특징으로 하며,
    상기 개체별 조사 리스트의 적용은 조사 리스트 중의 하나가 후보 키워드 뒤에 결합한 경우 해당 후보 키워드를 검색어로 하며,
    상기 클루 리스트의 적용은 클루 리스트 중 하나가 후보 키워드의 앞 또는 뒤에 결합된 경우 해당 후보 키워드를 검색어로 하며,
    상기 동사 리스트의 적용은 동사 리스트 중 하나가 후보 키워드의 뒤에 위치할 경우 해당 후보 키워드를 검색어로 하는 것을 특징으로 하는, 실시간으로 방송 연관 정보를 제공하는 서버.
  15. 제 14항에 있어서,
    상기 방송 정보는 상기 방송 신호와 관련된 자막 파일, 상기 방송 신호의 프로그램을 식별하는 정보, 상기 프로그램의 출연진 정보, 또는 상기 프로그램과 관련된 웹사이트 중 어느 하나 이상을 포함하는 것을 특징으로 하는, 실시간으로 방송 연관 정보를 제공하는 서버.
  16. 제 14항에 있어서,
    상기 방송 정보가 자막 파일인 경우,
    상기 방송 연관 정보 생성부는 상기 자막 파일에서 문장 또는 4 어절 이하로 누적하여 후보 키워드를 추출하여 상기 추출한 후보 키워드에서 검색어가 되는 키워드를 선택 또는 생성하는 것을 특징으로 하는, 실시간으로 방송 연관 정보를 제공하는 서버.
  17. 제 16항에 있어서,
    상기 방송 연관 정보 생성부는 상기 후보 키워드가 데이터베이스에 저장된 단어인지 확인하는, 실시간으로 방송 연관 정보를 제공하는 서버.
  18. 제 17항에 있어서,
    상기 데이터베이스는 실시간 검색어 데이터베이스, 검색어 데이터 베이스, 백과사전 데이터베이스, 토픽 데이터베이스, 또는 용어 사전 데이터베이스 중 어느 하나 이상인 것을 특징으로 하는, 실시간으로 방송 연관 정보를 제공하는 서버.
  19. 제 14항에 있어서,
    상기 방송 정보가 상기 방송 신호의 프로그램을 식별하는 정보인 경우,
    상기 방송 연관 정보 생성부는 상기 식별 정보를 이용하여 상기 키워드 및 방송 연관 정보를 생성하며, 상기 키워드 및 방송 연관 정보는 상기 프로그램과 관련된 웹사이트 정보, 소셜 네트워크에서 작성된 정보, 상기 프로그램의 대본 정보 중 어느 하나 이상에서 추출된 정보인 것을 특징으로 하며, 상기 키워드는 검색 사이트에서 누적하여 생성하는 검색 빈도 누적 통계 DB를 이용하여 추출된 것을 특징으로 하는, 실시간으로 방송 연관 정보를 제공하는 서버.
  20. 제 14항에 있어서,
    상기 추출된 키워드를 검색 사이트의 실시간 키워드로 제공하는 실시간 이슈어 추출기를 더 포함하는, 실시간으로 방송 연관 정보를 제공하는 서버.
KR1020110002742A 2011-01-11 2011-01-11 실시간으로 방송 연관 정보를 제공하는 방법 및 장치 KR101186419B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020110002742A KR101186419B1 (ko) 2011-01-11 2011-01-11 실시간으로 방송 연관 정보를 제공하는 방법 및 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020110002742A KR101186419B1 (ko) 2011-01-11 2011-01-11 실시간으로 방송 연관 정보를 제공하는 방법 및 장치

Publications (2)

Publication Number Publication Date
KR20120081412A KR20120081412A (ko) 2012-07-19
KR101186419B1 true KR101186419B1 (ko) 2012-09-27

Family

ID=46713565

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020110002742A KR101186419B1 (ko) 2011-01-11 2011-01-11 실시간으로 방송 연관 정보를 제공하는 방법 및 장치

Country Status (1)

Country Link
KR (1) KR101186419B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101383498B1 (ko) * 2012-10-19 2014-04-08 주식회사 엘지유플러스 Sns 기능을 가진 iptv 방송을 위한 서버, 방법, 및 기록 매체

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102051541B1 (ko) * 2012-12-07 2019-12-03 삼성전자주식회사 디스플레이장치 및 그 제어방법
KR102055887B1 (ko) * 2012-12-26 2019-12-13 주식회사 케이티 사용자의 감성에 기반한 맞춤형 콘텐츠를 제공하는 서버 및 방법
US9438967B2 (en) 2013-11-25 2016-09-06 Samsung Electronics Co., Ltd. Display apparatus and control method thereof
WO2016137225A2 (ko) * 2015-02-24 2016-09-01 박봉래 방송 연관 검색어를 제공하는 서버 및 이를 사용하는 단말 장치

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101383498B1 (ko) * 2012-10-19 2014-04-08 주식회사 엘지유플러스 Sns 기능을 가진 iptv 방송을 위한 서버, 방법, 및 기록 매체

Also Published As

Publication number Publication date
KR20120081412A (ko) 2012-07-19

Similar Documents

Publication Publication Date Title
US11997340B2 (en) Topical content searching
US9100679B2 (en) System and method for real-time processing, storage, indexing, and delivery of segmented video
US10333767B2 (en) Methods, systems, and media for media transmission and management
KR100893129B1 (ko) 멀티 미디어 컨텐츠의 추천 키워드 추출 시스템 및 그 방법
US9342584B2 (en) Server apparatus, information terminal, and program
US20130291019A1 (en) Self-learning methods, entity relations, remote control, and other features for real-time processing, storage, indexing, and delivery of segmented video
US11962838B2 (en) Systems and methods for customizing a display of information associated with a media asset
US20100162164A1 (en) Method and apparatus for providing search service during program broadcasting
US10057636B1 (en) Automatic video service actions based on matching a video content item to a content identifier
US20150189343A1 (en) Dynamic media segment pricing
KR20130083829A (ko) 디스플레이된 텔레비전 컨텐츠에 대한 자동 이미지 디스커버리 및 추천
KR101186419B1 (ko) 실시간으로 방송 연관 정보를 제공하는 방법 및 장치
US20150128190A1 (en) Video Program Recommendation Method and Server Thereof
US20220253601A1 (en) Language-based content recommendations using closed captions
KR101293301B1 (ko) 동영상 자막을 키워드로 이용한 영상 검색 시스템 및 방법
US20080196064A1 (en) Apparatus and method of providing a recommended broadcast program
CN102098549A (zh) 一种提供社会性网络服务的epg系统
US20120323900A1 (en) Method for processing auxilary information for topic generation
CN104639957A (zh) 移动多媒体终端、视频节目推荐方法及其服务器
KR101472014B1 (ko) 비디오 컨텐츠의 재생 화면에 포함된 텍스트를 이용하여 검색을 수행하는 장치 및 방법
US12022145B2 (en) Methods and systems for accessing media content from multiple sources
CN111656794A (zh) 基于标记的内容聚合相关媒体内容的系统和方法
US20140173663A1 (en) Multi-dimensional channel directories
KR101449848B1 (ko) 프로그램 추천 방법
EP2768168A1 (en) Method to recommend social network threads

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20150908

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20160909

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20170914

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20180914

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20190828

Year of fee payment: 8