KR20130083829A - 디스플레이된 텔레비전 컨텐츠에 대한 자동 이미지 디스커버리 및 추천 - Google Patents

디스플레이된 텔레비전 컨텐츠에 대한 자동 이미지 디스커버리 및 추천 Download PDF

Info

Publication number
KR20130083829A
KR20130083829A KR1020127027873A KR20127027873A KR20130083829A KR 20130083829 A KR20130083829 A KR 20130083829A KR 1020127027873 A KR1020127027873 A KR 1020127027873A KR 20127027873 A KR20127027873 A KR 20127027873A KR 20130083829 A KR20130083829 A KR 20130083829A
Authority
KR
South Korea
Prior art keywords
displayed content
automatic image
performing automatic
images
content
Prior art date
Application number
KR1020127027873A
Other languages
English (en)
Inventor
데카이 리
애쉰 카샵
종욱 김
아지트 코다카데리 푸드히야비틸
Original Assignee
톰슨 라이센싱
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 톰슨 라이센싱 filed Critical 톰슨 라이센싱
Publication of KR20130083829A publication Critical patent/KR20130083829A/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/466Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • H04N21/4668Learning process for intelligent management, e.g. learning user preferences for recommending movies for recommending content, e.g. movies
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44008Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/442Monitoring of processes or resources, e.g. detecting the failure of a recording device, monitoring the downstream bandwidth, the number of times a movie has been viewed, the storage space available from the internal hard disk
    • H04N21/44213Monitoring of end-user related data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/44Receiver circuitry for the reception of television signals according to analogue transmission standards
    • H04N5/445Receiver circuitry for the reception of television signals according to analogue transmission standards for displaying additional information

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Library & Information Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Social Psychology (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

연관된 이미지들을 자동으로 디스커버링할 수 있고 이들을 추천할 수 있는 방법 및 시스템이 제공된다. 이것은 이미지 디스커버리를 위해 동일한 페이지에서 발생하는 또는 동일한 포토그래퍼에 의해 촬영되는 이미지들을 사용한다. 본 시스템은 또한 이미지들을 필터링하기 위해 의미 연관성을 사용할 수 있다. 감성 분석은 또한 이미지 랭킹 및 포토그래퍼 랭킹을 위해 사용될 수 있다.

Description

디스플레이된 텔레비전 컨텐츠에 대한 자동 이미지 디스커버리 및 추천{AUTOMATIC IMAGE DISCOVERY AND RECOMMENDATION FOR DISPLAYED TELEVISION CONTENT}
본 출원은 2010년 4월 30일에 출원된 미국 가특허 출원 일련 번호 No.61/343,547의 이득을 청구하는 바이며, 본 명세서에서 그 전체가 참조로서 병합된다.
본 발명은 추천 시스템들에 관한 것이며, 보다 구체적으로는 현재 시청된 컨텐츠의 폐쇄 자막(closed caption)을 기반으로 하여 이미지들을 디스커버링 및 추천하는 것에 관한 것이다.
텔레비전은 대중 매체(mass media)이다. 동일한 채널에 대하여, 모든 시청자들은 동일한 시퀀스의 프로그램들을 수신한다. 사용자들이 현재의 프로그램과 연관된 상이한 정보를 선택할 옵션들은 거의 없거나 전혀 없다. 한 채널을 선택한 후에, 사용자들은 수동적이게 된다. 사용자 상호 작용(user interaction)은 채널을 변경하는 것과, 전자 프로그램 가이드(EPG)를 디스플레이하는 것 등으로 제한된다. 일부 프로그램들에 대하여, 사용자들은 관련된 정보를 검색(retrieve)하는 것을 원한다. 예를 들어 여행 채널을 시청하면서, 많은 사람들은 연관된 이미지들을 보기를 원한다.
본 발명의 목적은 현재의 프로그램과 연관된 상이한 정보를 선택할 옵션을 사용자에게 제공함으로써, 종래의 기술의 제한적인 사항을 개선하는 데에 있다.
본 발명은 연관된 이미지들을 자동으로 디스커버링하고 추천할 수 있는 시스템을 개시한다. 이것은 이미지 디스커버리를 위해 동일한 페이지에서 발생하거나, 동일한 포토그래퍼에 의해 촬영되는 이미지들을 사용할 수 있다. 본 시스템은 또한 이미지들을 필터링하기 위해 의미 연관성(semantic relatedness)을 사용한다. 감성 분석(sentiment analysis)이 또한 이미지 랭킹 및 포토그래퍼 랭킹을 위해 사용될 수 있다.
한 실시예에 따라, 디스플레이된 컨텐츠에 대한 자동 이미지 디스커버리를 수행하기 위한 방법이 제공된다. 본 방법은 디스플레이되는 컨텐츠의 주제(topic)를 검출하여 검출된 주제를 기반으로 하여 질문 항목들(query terms)을 추출하는 단계, 질문 항목들을 기반으로 하여 이미지들을 디스커버링하는 단계, 및 하나 이상의 디스커버링된 이미지들을 디스플레이하는 단계를 포함한다.
다른 실시예에 따라, 디스플레이된 컨텐츠에 대한 자동 이미지 디스커버리를 수행하기 위한 시스템이 제공된다. 본 시스템은 주제 검출 모듈, 키워드 추출 모듈, 이미지 디스커버리 모듈, 및 제어기를 포함한다. 주제 검출 모듈은 디스플레이되는 컨텐츠의 주제를 검출하도록 구성된다. 키워드 추출 모듈은 디스플레이되는 컨텐츠의 주제로부터 질문 항목들을 추출하도록 구성된다. 이미지 디스커버리 모듈은 질문 항목들을 기반으로 하여 이미지들을 디스커버링하도록 구성되고, 제어기는 주제 검출 모듈, 키워드 추출 모듈, 및 이미지 디스커버리 모듈을 제어하도록 구성된다.
본 발명의 원리들의 이러한 및 다른 양상들, 특징들, 및 장점들은 예시적인 실시예들에 대한 다음의 상세한 설명으로부터 명백해질 것이며, 이는 첨부 도면과 연계되어 읽혀질 것이다.
본 발명의 원리들은 다음의 예시적인 도면들에 따라 더 잘 이해될 수 있다.
연관된 이미지들을 자동으로 디스커버링할 수 있고 이들을 추천할 수 있는 방법 및 시스템이 제공되어, 기존 사용자들에게 주어졌던 수동적 기능이 개선될 수 있다.
도 1은 컨텐츠를 가정 또는 최종 사용자에게 전달하기 위한 시스템의 한 실시예에 대한 블록도를 도시하는 도면.
도 2는 매체 서버들, 온라인 소셜 네트워크들, 및 매체를 소비하기 위한 소비 디바이스들의 배치를 나타내는 시스템에 대한 블록도를 도시하는 도면.
도 3은 셋톱 박스/디지털 비디오 기록기의 한 실시예에 대한 블록도를 도시하는 도면.
도 4는 주제들이 비디오 자산(video asset)을 위해 변경되었는지를 결정하기 위한 흐름도에 대한 방법 차트를 도시하는 도면.
도 5는 도 4의 기능을 수행하기 위한 구성의 블록도를 도시하는 도면.
도 6은 비디오 브로드캐스트를 통해 반환된 이미지들의 디스플레이에 대한 실시예를 도시하는 도면.
본 발명의 원리들은 추천 시스템들에 관한 것이며, 보다 구체적으로는 현재 시청된 컨텐츠의 폐쇄 자막을 기반으로 하여 이미지들을 디스커버링 및 추천하는 것에 관한 것이다.
따라서 당업자라면, 본 명세서에 명시적으로 설명되거나 도시되지 않았을지라도, 본 발명을 구현하고, 본 발명의 사상과 범주에 포함되는 다양한 장치들(arrangements)을 안출할 수 있음이 이해될 것이다.
본 명세서에 상술된 모든 예시들 및 조건부 언어는, 발명가에 의해 종래의 기술을 진전시키는데 기여되는 본 발명 및 개념들을 독자가 이해하는 것에 도움을 줄 교육적인 목적을 위해 의도되었으며, 이러한 구체적으로 상술된 예시들 및 조건들에 대해 제한하지 않는 것으로 해석될 것이다.
또한, 본 발명의 원리들, 양상들, 및 실시예들 뿐만 아니라 이들의 특정 예시들을 상술하는 본 명세서의 모든 문장들은 이들의 구조적 및 기능적 등가물을 모두 포함하는 것으로 의도된다. 추가적으로, 이러한 등가물들은 현재 알려진 등가물들 뿐만 아니라 미래에 개발될 등가물들, 즉 구조에 상관없이 동일한 기능을 수행하는 임의의 개발될 요소들도 포함하는 것이 의도된다.
따라서, 예를 들어 본 명세서에 제공된 블록도들은 본 발명을 구현하는 예시적인 회로의 개념도를 나타내는 것이 당업자에 의해 이해될 것이다. 유사하게, 임의의 흐름도, 순서도, 상태 변이도, 및 의사 부호(pseudocode) 등은 컴퓨터 판독 가능 매체에서 실제적으로 나타내어질 수 있으며, 이에 따라 컴퓨터 또는 프로세서가 명시적으로 도시되었는지의 여부에 상관없이, 이러한 컴퓨터 또는 프로세서에 의해 실행될 수 있는 다양한 프로세스들을 나타내는 것이 이해될 것이다.
도면들에서 도시되는 다양한 요소들의 기능은 전용의 하드웨어, 뿐만 아니라 적절한 소프트웨어와 결합하여 소프트웨어를 실행시킬 수 있는 하드웨어의 사용을 통하여 제공될 수 있다. 프로세서에 의해 제공될 때, 기능들은 단일 전용 프로세서에 의해, 단일 공유 프로세서에 의해, 또는 일부가 공유될 수 있는 복수의 개별 프로세서에 의해 제공될 수 있다. 또한, 용어 "프로세서" 또는 "제어기"의 명시적 사용은 소프트웨어를 실행시킬 수 있는 하드웨어를 배타적으로 언급하는 것으로 해석되어서는 안 되며, 디지털 신호 프로세서("DSP") 하드웨어, 소프트웨어를 저장하기 위한 판독-전용 메모리("ROM"), 랜덤 액세스 메모리("RAM"), 및 비 휘발성 저장 장치를 제한 없이 암시적으로 포함할 수 있다.
종래의 및/또는 맞춤형의 다른 하드웨어가 또한 포함될 수 있다. 유사하게, 도면들에서 도시되는 임의의 스위치들은 오로지 개념적이다. 이들의 기능은 프로그램 로직의 연산(operation)을 통하여, 전용 로직을 통하여, 프로그램 제어 및 전용 로직의 상호 작용을 통하여, 또는 심지어 수동적으로 수행될 수 있으며, 특정 기술이 문맥으로부터 보다 구체적으로 이해 되어지는 바와 같이 구현자(implementer)에 의해 선택될 수 있다.
본 명세서의 청구항에서, 특정한 기능을 수행하기 위한 수단으로서 표현되는 임의의 요소는, 예를 들어 a) 기능을 수행하는 회로 요소들의 결합; 또는 b) 이에 따라 기능을 수행하는 소프트웨어를 실행하기 위한 적절한 회로와 결합된 펌웨어, 또는 마이크로코드 등을 포함하는 임의의 형태의 소프트웨어;를 포함하는 기능을 수행하는 임의의 방법을 포함하도록 의도된다. 이러한 청구항들에 의해 정의되는 본 발명은, 다양한 열거된 수단들에 의해 제공되는 기능들이 청구항들이 요구하는 방식으로 결합되고 조합된다는 사실에 속한다. 따라서 이러한 기능들을 제공할 수 있는 임의의 수단은 본 명세서에서 도시되는 것들과 등가적이라고 간주된다.
본 발명의 "한 실시예" 또는 "하나의 실시예", 뿐만 아니라 이들의 다른 변형에 대한 본 명세서에서의 언급은, 실시예와 연관되어 설명된 특정한 기능, 구조, 특성, 및 기타 사항이 본 발명의 적어도 하나의 실시예에 포함된다는 것을 의미한다. 그러므로 "한 실시예에서" 또는 "하나의 실시예에서"라는 관용구(phrase), 뿐만 아니라 본 명세서 전반의 다양한 곳에서 등장하는 임의의 다른 변형들의 출현(appearances)은 동일한 실시예를 반드시 모두 언급하는 것은 아니다.
도 1을 참조하면, 컨텐츠를 가정 또는 최종 사용자에 전달하기 위한 시스템(100)에 대한 한 실시예의 블록도가 도시된다. 컨텐츠는 영화 스튜디오 또는 프로덕션 하우스와 같은 컨텐츠 소스(102)로부터 비롯한다. 컨텐츠는 두 개의 형태 중 적어도 하나로 공급될 수 있다. 한 형태는 컨텐츠의 브로드캐스트 형태일 수 있다. 브로드캐스트 컨텐츠는, 아메리칸 브로드캐스팅 컴퍼니(ABC), 내셔널 브로드캐스팅 컴퍼니(NBC), 콜롬비아 브로드캐스팅 시스템(CBS) 등과 같은 전형적인 국영 브로드캐스트 서비스인 브로드캐스트 제휴 매니저(broadcast affiliate manager : 104)에 제공된다. 브로드캐스트 제휴 매니저는 컨텐츠를 수집하고 저장할 수 있고, 전달 네트워크 1(106)로서 도시되는 전달 네트워크를 통해 컨텐츠의 전달을 스케쥴링할 수 있다. 전달 네트워크 1(106)은 국영 센터로부터 하나 이상의 지역 또는 지방 센터들로의 위성 링크 전송을 포함할 수 있다. 전달 네트워크 1(106)은 또한 오버 디 에어 브로드캐스트(over the air broadcast), 위성 브로드캐스트, 케이블 브로드캐스트, 또는 IP를 통한 외부 네트워크로부터와 같은 지역 전달 시스템들을 사용한 지역 컨텐츠 전달을 포함할 수 있다. 지역적으로 전달된 컨텐츠는 사용자의 가정 내의 사용자의 셋톱 박스/디지털 비디오 기록기(DVR : 108)에 제공되는데, 여기서 컨텐츠는 사용자에 의해 검색될 수 있는 이용 가능한 컨텐츠의 집단(body)에 차후적으로 포함될 것이다.
컨텐츠의 제2의 형태는 스페셜 컨텐츠로서 상술된다. 스페셜 컨텐츠는 프리미엄 뷰잉(premium viewing), 페이-퍼-뷰(pay-per-view), 또는 그렇지 않으면 브로드캐스트 제휴 매니저에 제공되지 않는 다른 컨텐츠로서 전달되는 컨텐츠를 포함할 수 있다. 많은 경우들에서, 스페셜 컨텐츠는 사용자에 의해 요청된 컨텐츠일 수 있다. 스페셜 컨텐츠는 컨텐츠 매니저(110)에 전달될 수 있다. 컨텐츠 매니저(110)는, 예를 들어 컨텐츠 공급자, 브로드캐스트 서비스, 또는 전달 네트워크 서비스와 제휴된 인터넷 웹사이트와 같은 서비스 공급자일 수 있다. 컨텐츠 매니저(110)는 또한 인터넷 컨텐츠를 전달 시스템으로, 또는 사용자의 셋톱 박스/디지털 비디오 기록기(108)에 아직 전달되지 않은 컨텐츠가 오직 검색될 수 있도록 명백히 검색으로 통합시킬 수 있다. 컨텐츠 매니저(110)는 전달 네트워크 2(112)인 분리된 전달 네트워크를 통해 컨텐츠를 사용자의 셋톱 박스/디지털 비디오 기록기(108)에 전달 할 수 있다. 전달 네트워크 2(112)는 고속 광대역 인터넷 유형 통신 시스템들(high-speed broadband internet type communications systems)을 포함할 수 있다. 브로드캐스트 제휴 매니저(104)로부터의 컨텐츠가 또한 전달 네트워크 2(112)의 모두 또는 부분들을 사용하여 전달될 수 있고, 컨텐츠 매니저(110)로부터의 컨텐츠가 전달 네트워크 1(106)의 모두 또는 부분들을 사용하여 전달될 수 있다는 것을 주시하는 것은 중요하다. 추가로, 사용자는 또한 컨텐츠 매니저(110)에 의해 관리되는 컨텐츠를 반드시 가지지 않고도 전달 네트워크 2(112)를 통해 인터넷으로부터 직접 컨텐츠를 획득할 수 있다. 추가적으로, 검색의 범위는 추후에 브로드캐스팅거나 이용 가능하게 될 수 있는 이용 가능한 컨텐츠를 넘어선다.
셋톱 박스/디지털 비디오 기록기(108)는 전달 네트워크 1 및 전달 네트워크 2 중 하나 또는 이들 모두와는 상이한 유형의 컨텐츠를 수신할 수 있다. 셋톱 박스/디지털 비디오 기록기(108)는 컨텐츠를 프로세싱하고, 사용자 선호도(user preferences) 및 명령들을 기반으로 하여 컨텐츠의 분리(separation)를 제공한다. 셋톱 박스/디지털 비디오 기록기는 또한 오디오 및 비디오 컨텐츠를 기록하고 재생하기 위해 하드 드라이브 또는 광학 디스크 드라이브와 같은 저장 디바이스를 포함할 수 있다. 셋톱 박스/디지털 비디오 기록기(108)의 작동 및 재생 중인 저장된 컨텐츠와 관련된 특징들의 추가적인 세부 사항들이 도 3과 관련하여 아래에서 설명될 것이다. 프로세싱된 컨텐츠는 디스플레이 디바이스(114)에 제공된다. 디스플레이 디바이스(114)는 종래의 2-D 유형 디스플레이일 수 있거나, 또는 대안적으로 진보된 3-D 디스플레이일 수도 있다. 무선 전화기들, PDA들, 컴퓨터들, 게임 플랫폼들(gaming platforms), 원격 제어기들(remote controls), 또는 멀티미디어 플레이어들 등과 같은 디스플레이 기능들을 갖는 다른 디바이스들은 본 개시 사항의 가르침들을 사용할 수 있으며, 본 개시 사항의 범주 내로 간주된다는 것이 이해되어야 할 것이다.
전달 네트워크 2는 소셜 네트워킹 기능을 제공하는 웹사이트 또는 서버를 나타내는 온라인 소셜 네트워크(116)에 결합된다. 예를 들어 셋톱 박스(108)를 작동시키는 사용자는 다른 사용자들로부터의 전자 메시지들에 액세스하고, 컨텐츠 선택을 위해 다른 사용자들에 의해 제안된 추천들(recommendations)을 검토하고, 다른 사용자들에 의해 게재된 사진들을 보며, "인터넷 컨텐츠" 경로를 통해 이용 가능한 다른 웹사이트들을 참조하기 위해 온라인 소셜 네트워크(116)에 액세스할 수 있다.
온라인 소셜 네트워크 서버(116)는 또한 정보가 요소들 모두 사이에서 교환될 수 있는 컨텐츠 매니저(110)에 연결될 수 있다. 컨텐츠 매니저(110)를 통해 셋톱 박스(108)에서 시청을 위해 선택된 매체는 이러한 연결로부터 온라인 소셜 네트워킹(116)을 위해 전자 메시지 내에서 참조될 수 있다. 이러한 메시지는 셋톱 박스(108) 상의 매체를 시청하는 소비하는 사용자의 상태 정보에 게재될 수 있다. 즉 셋톱 박스(108)를 사용하는 사용자는, 특정 미디어 자산의 <<ASSETID>>, <<ASSETTYPE>>, 및 <<LOCATION>>와 같은 정보를 나타내는 명령이 컨텐츠 매니저(110)로부터 발행되도록 지시할 수 있는데, 이는 사용자를 식별하도록 사용된 특정 필드 <<USERNAME>>에 의해 식별된 특정 사용자에 대한 <<SERVICE ID>>에 열거된 온라인 소셜 네트워킹 서버(116)로 향하는 메시지 내에 존재할 수 있다. 식별자는 이메일 어드레스, 해쉬(hash), 영숫자(alphanumeric)의 시퀀스 등일 수 있다.
컨텐츠 매니저(110)는 이러한 정보를 <<SERVICE ID>>에 열거된 지시된 소셜 네트워킹 서버(116)에 전송하는데, 여기서 &USERNAME에 대한 전자 메시지는 사용자의 상태 정보에 게재된 미디어 자산의 <<ASSETID>>, <<ASSETTYPE>>, 및 <<LOCATION>>에 상응하는 정보를 가진다. 소셜 네트워킹 서버(116)에 액세스할 수 있는 다른 사용자들은 소비하는 사용자가 어떤 매체를 시청했는지를 보기 위해 소비하는 사용자의 상태 정보를 판독할 수 있다.
이러한 필드들에 대한 정보의 예시들이 아래에 설명된다.
<<SERVICE ID>> 이 필드는 특정 소셜 네트워킹 서비스 또는 사용될 수 있는 다른 메시징 매체를 나타낸다.
&FACEBOOK 페이스북
&TWITTER 트위터
&LINKEDIN 링크드-인
&FLICKER 플리커 포토 셰어링(Flicker Photo Sharing)
&QZONE 큐-존
&MYSPACE 마이스페이스
&BEBO 베보
&SMS 텍스트 메시징 서비스
&USERNAME 소셜 네트워킹 서비스를 사용하는 개인의 사용자 이름
<<ASSETID>> 이 필드는 특정 자산을 식별하기 위해 사용된 미디어 자산의 "이름"을 나타낸다.
&UUID 미디어 자산을 위해 사용된 범용의 유일한 식별자(universal unique identifier). 이것은 유일한 MD5, SHA1, 다른 유형의 해쉬, 또는 다른 유형의 식별자일 수 있다.
&NAME 미디어 자산에 대한 텍스트 이름.
&TIME 매체 자신이 액세스되는 시간. 이 정보는 초(seconds), 시간(hours), 일(days), 주(day of the week), 날짜, 및 정보와 연관된 다른 시간일 수 있다.
&ASSETCOMPLETE 자산의 소비(consumption)에 있어서의 달성(completion)의 퍼센테이지(%).
미디어 자산 항목(표 3으로 아래에서 설명됨)은 비디오 기반의 매체, 오디오 기반의 매체, 텔레비전 쇼, 영화, 상호적인 서비스(interactive service), 비디오 게임, HTML 기반의 웹페이지, 비디오 온 디맨드(Vedio On Demand), 오디오/비디오 브로드캐스트, 라디오 프로그램, 광고, 및 팟캐스트(podcast) 등일 수 있다.
<<ASSETTYPE>> 이 필드는 소셜 네트워킹 웹사이트의 사용자와 소통되는 자산의 유형을 나타낸다.
&VIDEO 비디오 기반의 자산
&AUDIO 오디오 기반의 자산
&PHOTO 사진 기반의 자산
&TELEVISION 오디오, 비디오, 또는 이들의 결합일 수 있는 텔레비전 쇼 자산
&MOVIE 오디오, 비디오, 또는 이들의 결합일 수 있는 영화 자산
&HTML HTML 기반의 웹페이지
&PREVIEW 오디오, 비디오, 또는 이들의 결합일 수 있는 예고편(trailer)
&ADMOVE 비디오 및/또는 오디오 기반의 플래쉬 애니메이션, H.264 비디오, SVC 비디오 등과 같은 것이라고 예상되는 광고 자산
&ADSTAT JPG, PNG, 및 배너 광고로서 사용될 수 있는 유사한 것과 같은 정적 이미지일 것이라고 예상되는 광고 자산
&TEXT 텍스트 메시지
&RADIO 지상(terrestrial) 및/또는 위성 라디오로부터 기인하는 오디오 자산
&GAME 게임 자산
&INTERACTIVE 대화식(interactive) 기반의 미디어 자산
&PODCAST 오디오, 비디오, 또는 이들의 결합인 팟캐스트
&APPLICATION 사용자가 특정 유형의 어플리케이션 또는 액세스된 특정 서비스를 이용했다는 것을 나타냄.
<<LOCATION>> 이 필드는 특정 미디어 자산의 위치를 나타낸다.
&URL 표준 자원 위치 표시자(uniform resource locator) 및/또는 IP 어드레스로서 표현되는 미디어 자산의 위치
&PATH\PATH... 다수의 서브디렉토리들을 가질 수 있는 특정한 근거리 또는 먼 경로로서 표현되는 미디어 자산의 위치
&REMOTE 먼 속성(remote attribute) 이후에 텍스트에 의해 명시될 먼 위치에 있어서의 미디어 자산의 위치
&LOCAL 먼 속성 이후에 텍스트에 의해 명시될 근거리 위치에 있어서의 미디어 자산의 위치
&BROADCAST 위성, 브로드캐스트 텔레비전 채널, 케이블 채널, 및 무선국(radio station) 등과 같은 브로드캐스트 소스인 위치
&BROADCASTID 미디어 자산 등을 전송하기 위해 사용되는 브로드캐스트 채널의 식별자
&SERVICE 미디어 자산이 (컨텐츠 소스 또는 컨텐츠 제공자로서) 개시할 수 있는 서비스의 식별. 상이한 서비스들의 예시는 HULU, NETFLIX, 및 VUDU 등을 포함한다.
도 2는 매체 서버들, 온라인 소셜 네트워크들, 및 매체를 소비하기 위한 소비 디바이스들의 배치를 나타내는 시스템(200)의 블록도를 도시한다. 매체 서버들(210, 215, 225, 및 230)은 매체가 저장되는 매체 서버들을 나타낸다. 이러한 매체 서버들은 하드 드라이브, 복수의 하드 드라이브들, 서버 팜(server farm), 디스크 기반의 저장 디바이스, 및 광대역 네트워크를 통하여 매체의 전달을 위해 사용되는 다른 유형의 대용량 저장 디바이스일 수 있다.
매체 서버들(210 및 215)은 컨텐츠 매니저(205)에 의해 제어된다. 마찬가지로, 매체 서버(225 및 230)는 컨텐츠 매니저(235)에 의해 제어된다. 매체 서버상의 컨텐츠에 액세스하기 위해, STB(108), 개인용 컴퓨터(260), 테이블(270), 및 전화기(280)와 같은 소비 디바이스를 작동시키는 사용자는 이러한 컨텐츠에 대한 유료 가입(paid subscription)을 할 수 있다. 가입은 컨텐츠 매니저(235)를 갖는 장치를 통해 관리될 수 있다. 예를 들어 컨텐츠 매니저(235)는 서비스 제공자일 수 있고, STB(108)를 작동시키는 사용자는 영화 채널로부터의 프로그래밍에 가입하고, 음악이 광대역 네트워크(250)를 통해 사용자에게 전송될 수 있는 음악 신청 서비스(music subscription service)에 가입한다. 컨텐츠 매니저(235)는 STB(108)에 전달되는 컨텐츠의 저장과 전달을 관리한다. 마찬가지로, 개인용 컴퓨터(260), 태블릿(270), 및 전화기(280) 등과 같은 다른 디바이스들에 대한 다른 가입들이 존재할 수 있다. 컨텐츠 매니저(205 및 235)를 통해 이용 가능한 가입들(subscriptions)이, 예를 들어 DISNEY와 같은 특정 영화 스튜디오에 상응하는 컨텐츠가 양 컨텐츠 매니저들을 통해 이용 가능할 수 있는 경우에 중복될 수 있다는 것이 주목된다. 마찬가지로, 양 컨텐츠 매니저들(205 및 235)은 이용 가능한 컨텐츠에 있어서 또한 차이를 가질 수 있으며, 예를 들어 컨텐츠 매니저(205)는 ESPN으로부터 스포츠 프로그램을 취급할 수 있지만, 컨텐츠 매니저(235)는 FOXSPORTS로부터 기인하는 컨텐츠를 이용 가능하게 한다. 컨텐츠 매니저들(205 및 235)은 또한 사용자가 컨텐츠 제공자에 가입한 미디어 자산들을 제공하는 NETFLIX 및 HULU등과 같은 컨텐츠 제공자들일 수 있다. 이러한 유형의 컨텐츠 제공자들에 대한 대안적인 명칭은 "온 탑 오브(on top of)"인 또 다른 서비스에 전달될 수 있는 용어인 오버 더 탑 서비스 제공자(OTT)이다. 예를 들어 도 1을 참조해보면, 컨텐츠 매니저(110)는 셋톱 박스(108)를 작동시키는 사용자에게 인터넷 액세스를 제공한다. 컨텐츠 매니저(205/235)로부터의 오버 더 탑 서비스(도 2에서 도시되는 바와 같이)는 컨텐츠 소스(102) 등으로부터의 "인터넷 컨텐츠" 연결을 통해 전달될 수 있다.
가입(subscription)은, 컨텐츠가 컨텐츠 매니저(205 및 235)에 의해 권한을 부여받을 수 있는 유일한 방법은 아니다. 일부 컨텐츠는 컨텐츠 매니저가 액세스될 컨텐츠에 대해 어떤 금액도 청구하지 않는 컨텐츠 매니저(205 및 235)를 통하여 무료로 액세스될 수 있다. 컨텐츠 매니저(205 및 235)는 또한 시청의 고정된 시간(여러 시간)동안 1회 요금(single fee)에 대한 주문형 비디오(video on demand)로서 전달되는 다른 컨텐츠에 청구할 수 있다. 컨텐츠는 구입되어, 컨텐츠가 컨텐츠 매니저들(205 및 235)로부터 수신되는 STB(108), 개인용 컴퓨터(260), 및 태블릿(270) 등과 같은 사용자의 디바이스에 저장될 수 있다. 컨텐츠 매니저들(205 및 235)에 대한 다른 구입, 렌탈, 및 가입 옵션들이 또한 이용될 수 있다.
온라인 소셜 서버들(240 및 245)은 광대역 네트워크(250)를 통하여 소통하는 온라인 소셜 네트워크들을 작동시키는 서버들을 나타낸다. STB(108), 개인용 컴퓨터(260), 태블릿(270), 및 전화기(280)와 같은 소비 디바이스를 작동시키는 사용자들은 디바이스를 통해 온라인 소셜 서버들(240 및 245)과, 그리고 다른 사용자들과 상호 작용할 수 있다. 구현될 수 있는 소셜 네트워크에 대한 한 가지 특징은 상이한 유형의 디바이스들(PC들, 전화기들, 태블릿들, STB들)을 사용하는 사용자들이 소셜 네트워크를 통해 서로 소통할 수 있다는 것이다. 예를 들어 비록 제1의 사용자가 전화기(280)를 사용하고 제2의 사용자가 개인용 컴퓨터(260)를 사용할지라도, 제1의 사용자는 동일한 소셜 네트워크를 사용하는 두 사용자들에 대하여 제2의 사용자의 계정에 메시지들을 게재할 수 있다. 광대역 네트워크(250), 개인용 컴퓨터(260), 태블릿(270), 및 전화기(280)는 당업에서 알려진 용어들이다. 예를 들어 전화기(280)는 인터넷 기능(internet capability) 및 음성 통신에 참여할 수 있는 능력을 갖는 모바일 디바이스일 수 있다.
이제 도 3을 참조해보면, 셋톱 박스/디지털 비디오 기록기(300)의 핵심에 대한 실시예의 블록도(300)가 소비 디바이스의 예시로서 도시된다. 도시된 디바이스(300)는 또한 디스플레이 디바이스(114)를 포함하는 다른 시스템들에 통합될 수 있다. 이러한 경우에, 본 시스템의 완전한 작동을 위해 필요한 몇몇의 구성 요소들은 당업자들에게 잘 알려져 있기 때문에, 간결한 진술을 위해 도시되지 않는다.
도 3에 도시된 디바이스(300)에서, 컨텐츠는 입력 신호 수신기(302)에서 수신된다. 입력 신호 수신기(302)는, 오버 디 에어(OTA), 케이블, 위성, 이더넷, 피버(fiber) 및 전화선 네트워크들을 포함하는 몇몇의 가능한 네트워크들 중 하나를 통해 제공되는 신호들을 수신, 복조, 및 디코딩하기 위해 사용된 여러 가지의 알려진 수신기 회로들 중 하나일 수 있다. 희망하는 입력 신호는 제어 인터페이스(도시되지 않음)를 통해 제공되는 사용자 입력을 기반으로 하여 입력 신호 수신기(302)에서 선택 및 검색될 수 있다. 디코딩된 출력 신호는 입력 스트림 프로세서(304)에 제공된다. 입력 스트림 프로세서(304)는 최종 신호 선택 및 프로세싱을 수행하고, 컨텐츠 스트림에 대하여 오디오 컨텐츠로부터의 비디오 컨텐츠의 분리(separation)를 포함한다. 오디오 컨텐츠는, 압축된 디지털 신호와 같은 수신된 포맷으로부터 아날로그 파형의 신호로의 변환을 위해 오디오 프로세서(306)에 제공된다. 아날로그 파형의 신호는 오디오 인터페이스(308) 및 추가적으로 디스플레이 디바이스(114) 또는 오디오 증폭기(도시되지 않음)에 제공된다. 대안적으로, 오디오 인터페이스(308)는 고-선명도 멀티미디어 인터페이스(HDMI) 케이블 또는 소니/필립스 디지털 인터커넥트 포맷(SPDIF)을 통한 것과 같은 대체의 오디오 인터페이스를 사용하여 디지털 신호를 오디오 출력 디바이스 또는 디스플레이 디바이스에 제공할 수 있다. 오디오 프로세서(306)는 또한 오디오 신호들의 저장을 위해 임의의 필요한 변환을 수행한다.
입력 스트림 프로세서(304)로부터 출력된 비디오는 비디오 프로세서(310)에 제공된다. 비디오 신호는 여러 포맷들 중 하나일 수 있다. 비디오 프로세서(310)는 입력 신호 포맷을 기반으로 하여 비디오 컨텐츠의 변환을 필요에 따라 제공한다. 비디오 프로세서(310)는 또한 비디오 신호들의 저장을 위해 임의의 필요한 변환을 수행한다.
저장 디바이스(312)는 입력에서 수신된 오디오 및 비디오 컨텐츠를 저장한다. 저장 디바이스(312)는, 제어기(314)의 제어 하에, 그리고 또한 명령들, 예컨데 사용자 인터페이스(316)로부터 수신된 패스트-포워드(FF) 및 리와인드(Rew)와 같은 네비게이션 명령들을 기반으로 하여, 컨텐츠의 추후의 검색 및 재생을 허용한다. 저장 디바이스(312)는 하드 디스크 드라이브, 또는 정적 랜덤 액세스 메모리 또는 동적 랜덤 액세스 메모리와 같은 하나 이상의 대용량의 집적 전자 메모리들일 수 있거나, 또는 콤팩트 디스크 드라이브 또는 디지털 비디오 디스크 드라이브와 같은 상호 교환 가능한 광학 디스크 저장 시스템일 수 있다. 한 실시예에서, 저장 디바이스(312)는 외장형일 수 있고, 본 시스템에 제공되지 않을 수도 있다.
입력으로부터 또는 저장 디바이스(312)로부터 개시하는 비디오 프로세서(310)로부터의 변환된 비디오 신호는 디스플레이 인터페이스(318)에 제공된다. 디스플레이 인터페이스(318)는 상기 설명된 유형의 디스플레이 디바이스에 디스플레이 신호를 더 제공한다. 디스플레이 인터페이스(318)는 적-녹-청(RGB)과 같은 아날로그 신호 인터페이스일 수 있거나, 또는 고 선명도 멀티미디어 인터페이스(HDMI)와 같은 디지털 인터페이스일 수 있다. 디스플레이 인터페이스(318)는 아래에 보다 상세하게 설명되는 바와 같이 3차원 어레이에서의 검색 결과들을 제공하기 위한 다양한 스크린들을 생성할 것이라는 것이 이해될 것이다.
제어기(314)는, 입력 스트림 프로세서(302), 오디오 프로세서(306), 비디오 프로세서(310), 저장 디바이스(312), 및 사용자 인터페이스(316)를 포함하는 디바이스(300)의 여러 구성 요소들에 버스를 통해 상호 연결된다. 제어기(314)는 입력 스트림 신호를 저장 디바이스 상에 저장하기 위해, 또는 디스플레이를 위한 신호로 변환하기 위한 변환 프로세스를 관리한다. 제어기(314)는 또한 저장된 컨텐츠의 검색 및 재생을 관리한다. 게다가 아래에 설명되는 바와 같이, 제어기(314)는 저장되거나 또는 상기 설명된 전달 네트워크들을 통해 전달될 컨텐츠의 검색을 수행한다. 제어기(314)는 제어기(214)를 위해 정보 및 명령어 코드를 저장하기 위한 제어 메모리(320)(예컨데, 랜덤 액세스 메모리, 정적 램(RAM), 동적 램, 판독 전용 메모리, 프로그램 가능한 롬, 플래쉬 메모리, EPROM, EEPROM 등을 포함한 휘발성 또는 비휘발성 메모리)에 더 연결된다. 더욱이 메모리의 구현은 단일 메모리 디바이스, 또는 대안적으로 공유 또는 공통 메모리를 형성하기 위해 함께 연결된 한 개 보다 많은 메모리 회로와 같은 여러 가능한 실시예들을 포함할 수 있다. 추가적으로, 메모리는 보다 큰 회로로 된 버스 통신 회로의 부분들과 같은 다른 회로에 포함될 수 있다.
효과적으로 작동시키기 위해, 본 개시 사항의 사용자 인터페이스(316)는 디스플레이 주위의 커서를 이동시키는 입력 디바이스를 사용하는데, 그 결과, 커서가 컨텐츠를 통과할 때, 컨텐츠를 확대시킬 수 있다. 한 실시예에서, 입력 디바이스는 사용자가 스크린 또는 디스플레이에 대하여 커서를 자유롭게 이동시키는 것을 허용하는, 자이로스코프(gyroscope) 또는 가속도계(accelerometer)와 같은 움직임 검출의 형태를 갖는 원격 제어기이다. 다른 실시예에서, 입력 디바이스는 스크린상에서 패드(pad) 위에서의 사용자의 이동을 추적할 터치 패드 또는 터치에 민감한 디바이스의 형태인 제어기들이다. 또 다른 실시예에서, 입력 디바이스는 방향 버튼들을 갖는 종래의 원격 제어일 수 있다.
도 4는 미디어 자산과 관련된 주제들을 획득하기 위한 방법(400)을 설명한다. 본 방법은 단계(405)에서 시작한다. 본 방법은 미디어 자산과 관련된 보조 정보로부터 키워드들을 추출함으로써 시작한다(단계 410). 하지만 다른 키워드 추출 기술과는 다르게도, 이것은 본 방법을 위한 최종 프로세싱이 아니다. 한 가지 접근법은, 비디오 미디어 자산으로 전송되는 EIA-608/EIA-708로 포맷된 폐쇄 자막 정보를 프로세싱하거나 또는 판독하는 폐쇄 자막 프로세서{셋톱 박스(108)에서의, 또는 컨텐츠 매니저(205/235) 등에서의}를 사용할 수 있다. 폐쇄 자막 프로세서는 ASCII 텍스트 스트림으로서 캡쳐된 폐쇄 자막 데이터를 출력하는 데이터 슬라이서(data slicer)를 가질 수 있다.
상이한 브로드캐스트 소스들은 상이하게 배치될 수 있는데, 여기서 폐쇄 자막 및 다른 유형의 보조 데이터는 데이터 스트림이 구성되는 방법에 의존하여 관심의 데이터를 추출하도록 구성될 수 있다는 것이 주목된다. 예를 들어 ATSC 포맷을 사용하여 미국에서의 브로드캐스트를 위해 포맷된 MPEG-2 운송 스트림은 유럽에서의 DVB-T 전송을 위해 사용된 디지털 스트림과 상이하며, 일본에서 사용되는 ARIB 기반의 전송과도 상이하다.
단계(415)에서, 본 단계는 주제들로 매핑된(mapped) 키워드들의 시리즈를 생성하는 단계에서 프로세싱되는 출력된 스트림으로 시작한다. 즉 출력된 텍스트 스트림은 문장들(sentences)의 시리즈로 포맷된다.
키워드 추출
한 실시예에서, 두 가지 유형의 키워드들은 명명된 엔티티(named entities), 및 의미 있는 단일의 단어 또는 다수의 단어 어구들에 초점이 맞춰진다. 각 문장에 있어서, 명명된 엔티티 인식(recognition)은 우선적으로 모든 명명된 엔티티들, 예컨데 사람들의 이름 및 위치 이름 등을 식별하기 위해 사용된다. 하지만 폐쇄 자막에서, 예컨데 "그", "그녀", "그들"과 같은 대명사들이 또한 존재한다. 따라서 이름 분석(name resolution)은 대명사들을 분석하기 위해 이들이 언급하는 명명된 엔티티들의 완전한 이름에 적용된다. 폐쇄 자막 문장의 (명명된 엔티티들을 제외한 다른)모든 n-그램들에 대하여, Wikipedia와 같은 데이터베이스들은 의미 있는 어구들을 찾기 위한 사전으로서 사용될 수 있다. 하나 보다 긴 길이의 각 후보 어구에 대하여, 이것이 스톱워드(stopword)로 시작하거나 또는 끝날 경우, 이것은 제거된다. Wikipedia의 사용은 특정의 의미 없는 어구들, 예컨데 "이다(is a)", "이것은 이다(this is)"을 제거할 수 있다.
표면 형태들을 분석( Resolving surface forms )
많은 어구들은 상이한 형태들을 갖는다. 예를 들어 "가위 개미(leaf cutter ant)", "가위 개미들(leaf cutter ants)", "가위-개미(leaf-cutter ant)", "가위-개미들(leaf-cutter ants)"는 모두 동일한 것을 언급한다. 임의의 이들 어구들이 후보일 경우, 정확한 형태가 발견되어야 한다. Wikipedia와 같은 데이터베이스들 내의 리다이렉트 페이지(redirect page)는 이러한 문제들을 해결하기 위해 사용될 수 있다. Wikipedia에서, "가위 개미", "가위 개미들", "가위-개미", "가위-개미들"은 모두 "가위개미(leafcutter ant)"라고 제목이 달린 단일 페이지로 리다이렉팅한다. 어구가 주어지면, 모든 리다이렉트 페이지 제목 및 타깃 페이지가 후보 어구들로서 사용될 수 있다.
추가적인 스톱워드 목록들
아카데믹 스톱워드들(academic stopwords) 목록 및 일반적인 서비스 목록으로서 알려진 스톱워드들의 두 가지 목록들이 또한 사용될 수 있다. 이들 항목들은 너무 일반적인 어구들을 제거하기 위해 기존의 스톱워드들 목록과 결합될 수 있으며, 이에 따라 연관된 이미지들의 위치를 배정하도록 사용될 수 없다.
데이터베이스 속성들에 따른 키워드들 선택
몇몇의 속성들이 각 데이터베이스 엔트리와 결합될 수 있다. 예를 들어 각 Wikipedia 아티클(article)은 이것, 즉 페이지로 유입하는 링크들의 수, 나가는 링크들의 수, 일반성, 애매함들의 수, Wikipedia 커퍼스(corpus)에서 아티클 제목이 등장한 전체 횟수, 이것이 링크로서 발생한 횟수 등과 결합된 이들 속성들을 가질 수 있다.
대부분의 특정 항목들에 대하여, 대부분의 속성들의 값이 너무 일반적인 것으로 간주된 이들 항목들의 값과 비교했을 때 훨씬 작다는 것이 관찰되었다. 따라서 특정 또는 중요한 항목들의 집합이 사용되고, 이들의 속성 값들은 임계값을 설정하기 위해 선택된다. 이후 특징 값들이 임계값에 속하지 않은 이들 항목들은 잡음 항목들로서 간주되어 무시된다. 필터링된 n-그램 사전은 특징 값들이 임계값 아래에 있는 항목들로부터 생성된다. 필터링된 n-그램은 폐쇄 자막들을 프로세싱하기 위해 사용되고, 폐쇄 자막이 나오는 문장으로 된 중요한 항목들을 찾기 위해 사용된다.
카테고리에 따른 키워드들 선택
후보 어구들이 특정 카테고리, 예컨데 "동물"에 속할 때, 추가적인 필터링이 수행될 수 있다. 철저한 조사가 워드넷 패키지(wordnet package)에서 수행될 수 있다. 단어, 예를 들어 "python"이 이러한 패키지에 주어질 경우, 이것은 영어인 단어 "python"에 대한 모든 가능한 의미들(senses)을 반환할 것이다. 따라서 python에 대하여 가능한 의미들은 "파충류의 동물(reptile), 파충류(reptilian), 프로그래밍 언어"이다. 이후 이들 의미들은 매칭을 위해(for a match) 문맥 항목들과 비교될 수 있다.
한 실시예에서, Wikipedia 접근법은 이러한 워드넷 접근법과 결합된다. 따라서 폐쇄 자막이 나오는 문장이 한번 획득되면, 라인이 프로세싱되고, n-그램들이 발견되어지며, n-그램들이 Wikipedia 커퍼스에 속하는지의 여부 및 이들이 워드넷 커퍼스에 속하는지의 여부를 결정하기 위해 점검된다. 이러한 접근법을 테스팅함에 있어서, 폐쇄 자막에서 대부분의 중요한 항목들을 획득함에 있어 상당한 성공이 달성될 수 있다. 이러한 방법의 한 가지 문제는 워드넷이 키 어구들(keyphrases)이 아닌 단어들에 대한 의미들만을 제공한다는 것이다. 그러므로, 예를 들어 "흰 긴 수염 고래(blue whale)"는 이것이 키 어구이기 때문에 임의의 의미들을 획득하지 못할 것이다. 이러한 문제에 대한 솔루션은 키 어구에 있어서 최신 항목(the last term) 만을 취하고 워드넷에서 이들의 의미를 점검함으로써 얻어진다. 따라서 워드넷에서 "고래"의 의미들에 대한 검색이 수행될 경우, 이것은 현재의 문맥에 속하며, 이에 따라 "흰 긴 수염 고래"가 비껴가지 않을 것이라는 것이 식별될 수 있다.
문장 구조에 따른 키워드들 선택
폐쇄 자막에서의 많은 문장들에 대하여, 주제 어구들이 매우 중요하다. 이 자체만으로도, 의존 구조 분석기(dependency parser)가 문장의 헤드를 찾기 위해 사용될 수 있고, 문장의 헤드가 또한 후보 어구일 경우, 문장의 헤드는 높은 우선권이 주어질 수 있다.
의미 연관성( semantic relatedness )을 기반으로 하여 키워드들 선택
명명된 엔티티들, 항목 어구들은 현재의 TV 프로그램에 직접 연관되지 않은 상이한 주제들을 나타낼 수 있다. 따라서 어떤 항목 어구들이 보다 연관성이 있는지를 결정하는 것은 필수적이다. 몇몇의 문장들을 프로세싱한 후에, 모든 항목들을 함께 클러스터링하기 위해 의미 연관성이 사용된다. 가장 높은 밀도(density)를 갖는 클러스터가 이후에 결정된다. 이러한 클러스터 내의 항목들은 연관된 이미지 질문(image query)을 위해 사용될 수 있다.
특정 키워드들을 특정 주제와 관련시키는 미리 결정된 시소러스(thesaurus) 데이터베이스를 사용하여 추출된 키워드들을 주제들의 시리즈로(질문 항목들로서) 매핑함으로써, 키워드들은 단계(420)에서 더 프로세싱된다. 이 데이터베이스는 구축될 수 있는데, 여기서 주제들의 제한된 선택이 (특정 사람들 및 주제들 등과 같은 것들로) 한정되고, 다양한 키워드들이 특정 주제에 대하여 키워드를 매핑하도록 시도하는 비교기를 사용함으로써 이러한 주제들과 관련된다. 예를 들어 돈, 주식, 시장과 같은 키워드들이 주제 "재무(finance)"와 관련되는 경우에, (워드넷 및 야후 오픈디렉토리 프로젝트와 같은) 시소러스 데이터베이스가 구축될 수 있다. 마찬가지로, 미국의 대통령, 44대 대통령, 대통령 오바마, 버락 오바마와 같은 키워드들은 주제 "버락 오바마(Barack Obama)"와 관련된다. 이것 또는 주제 결정을 위한 유사한 접근법들을 사용하여 키워드들로부터 다른 주제들이 결정될 수 있다. 이것을 수행하기 위한 또 다른 방법은 Wikipedia 또는 컨텐츠가 주제들을 기반으로 하여 카테고리화되는 유사한 지식 기반을 사용할 수 있다. Wikipedia에서 관련된 주제를 갖는 키워드가 주어지면, 주제들로의 키워드 매핑은, 상기 설명된 바와 같이 시소러스 데이터베이스로서 생성하는 것의 목적을 위해 획득될 수 있다.
일단 이러한 주제들이 각 문장을 위해 결정되는 경우, 이러한 문장들은 <topic_1:weight_1;topic_2;weight_2,...,topic_n,weightN,ne_1,ne_2,...,ne_m>의 형태로 나타내어질 수 있다.
Topic_i는 문장에서 키워드들을 기반으로 하여 식별되는 주제이고, weight_i는 해당 연관성이며, Ne_i는 문장에서 인식된 명명된 엔티티이다. 명명된 엔티티들은 문법 분석을 사용하여 인식될 수 있는 문장 내의 사람들, 장소들, 및 다른 적절한 명사들을 언급한다.
일부 엔티티가 빈번히 언급되지만 "그", "그녀", "그들"과 같은 대명사들의 사용을 통하여 간접적으로 참조되는 것이 가능하다. 각 문장이 개별적으로 분석되는 경우, 이러한 대명사들은, 이러한 단어들이 스톱 워드 목록에 존재하기 때문에, 카운팅되지 않을 것이다. "너(you)" 라는 단어는 빈번히 사용된 특별한 경우이다. 이름 분석(name resolution)의 사용은 항목 "너"를 이전/현재의 문장에서 참조된 특정 키워드/주제에 할당하는 것에 도움을 줄 것이다. 그렇지 않을 경우, 이것이 특정 항목으로 참조될 수 없다면, "너"는 무시될 것이다. 이러한 이슈를 분석하기 위해, 이름 분석이 스톱 워드 제거 이전에 수행될 수 있다.
몇몇의 문장들이 주제들의 동일 집합을 논의하고, 명명된 엔티티들의 동일 집합을 언급할 경우, 문장들의 시리즈의 "현재의 주제"는 현재 참조되고 있다는 가정(assumption)이 이루어진다. 새로운 주제가 문장들의 새로운 집합을 통해 참조되는 경우, 새로운 주제는 어드레싱되고 있다는 것이 가정된다. 주제들은 비디오 프로그램의 코스를 통해 빈번히 변경될 것이라는 것이 예상된다.
이들 동일한 원리들은 또한 사용자의 디바이스에 의해 수신된 매우 간단한 배급 피드{Really Simple Syndication(RSS) feed}의 수신에 적용될 수 있는데, 이는 일반적으로 사용자에 의해 "연합된(joined)"다. 이들 피드들은 일반적으로 텍스트 및 연관된 태그들을 나타내는데, 여기서 키워드 추출 프로세스는 피드로부터 연관된 주제들을 찾기 위해 사용될 수 있다. RSS 피드는 아래에 설명된 접근법들을 사용함으로써 연관된 검색 결과들을 반환하기 위해 분석될 수 있다. 중요하게도, 브로드캐스트 및 RSS 피드들 모두의 사용은 본 명세서 내에 열거된 접근법들을 사용함으로써 동시에 수행될 수 있다.
주제 변경 검출
현재의 TV 주제가 종료되고 새로운 주제가 시작할 때, 이러한 변경은, 연관된 이미지들이 새로운 주제를 기반으로 하여 검색될 수 있도록 검출될 필요가 있다. 이러한 변경을 검출하는 것에 대한 실패는 오래된 질문 결과들 및 새로운 주제 사이의 비-매칭을 초래할 수 있는데, 이는 시청자들을 혼동하게 한다. 시기 상조의 검출은 불필요한 프로세싱을 초래할 수 있다.
현재의 주제가 종료되고(405) 새로운 주제가 시작할 때, 이러한 변경은 일정 시간 동안 키워드들의 벡터를 사용함으로써 검출된다. 예를 들어 뉴스 브로드캐스트에 있어서, 스포츠, 정치, 날씨 등과 같은 많은 주제들이 논의된다. 이전에 언급된 바와 같이, 각 문장은 (벡터로서 언급된) 주제 웨이트(topic weights)의 목록으로서 나타내어진다. 차후의 문장들의 (또는 대안적으로 고정된 수의 단어들을 포함하는 두 개의 윈도우들 사이의) 유사성을 비교하는 것이 가능하다. 코사인 유사성 또는 자카르드 인덱스(Jaccard index)를 사용하는 것과 같은 벡터들을 비교하기 위한 많은 알려진 유사성 미터법들이 존재한다. 이러한 벡터들의 생성으로부터, 항목들이 비교될 수 있고, 유사성이 수행되는데, 이는 이러한 벡터들 사이의 차이들에 주목한다. 이들 비교들은 일정 시간 동안 수행된다. 이러한 비교는 얼마나 많은 변경이 주제 단위로(from topic to topic) 발생하는 지를 결정하는 것에 도움을 주어서, 사용된 기술에 의존하여 "차이(difference)" 미터법이 임계값을 초과하는 경우, 주제가 변경되었을 것 같은 때에 미리 지정된 임계값이 결정될 수 있다.
이러한 접근법의 한 예시로서, 현재의 문장이 의존 구조 분석기(dependency parser)를 사용함으로써 현재의 주제에 대하여 점검된다. 의존 구조 분석기들은 주어진 문장을 프로세싱하고 문장의 문법 구조를 결정한다. 이들은 주어진 문장을 정확하게 태깅하고 프로세싱하기 위해 기계 학습 기술들을 활용하는 매우 복잡한 알고리즘들이다. 이것은 언어에 있어서의 고유한 많은 애매함들로 인해 영어에 대하여 특히 까다롭다. 우선적으로, 문장에서 대명사들이 존재하는지를 확인하기 위한 점검이 수행된다. 이럴 경우, 어떤 엔티티들이 현재의 문장에서 언급되었는 지를 결정하기 위해 엔티티 분석 단계가 수행된다. 어떤 대명사들도 사용되지 않을 경우, 그리고 어떤 새로운 주제들도 발견되지 않을 경우, 현재의 문장은 이전 문장들과 동일한 주제를 언급하는 것이 가정된다. 예를 들어 "그/그녀/그들/그의/그녀의"가 현재의 문장에 있을 경우, 이러한 항목들은 이전 문장으로부터의 엔티티를 언급할 가능성이 있다. 이러한 대명사들의 사용은 현재의 문장이 이전 문장과 동일한 주제를 언급하게 할 것이라는 것이 가정될 수 있다. 마찬가지로, 다음의 문장에 대하여, 문장에서 대명사의 사용은 이전 문장과 동일한 주제를 언급하는 것이 가정될 수 있다.
현재의 주제에 대하여, 가장 가능성 있는 주제 및 가장 빈번히 언급된 엔티티는 유지된다. 이후 주제 및 엔티티의 동시 발생(co-occurrence)은 주제의 변경을 검출하기 위해 사용될 수 있다. 구체적으로, 이것에 대해 인식된 적어도 하나의 주제 및 하나의 엔티티가 존재할 경우, 한 문장이 사용된다. 주제는, <topic_1,topic_2,...,topic_n,ne_1,ne_2,...,ne_m>이 현재의 주제 및 엔티티를 커버하지 않는 특정 개수의 연속된 문장들이 존재할 경우, 변경된다. 큰 수를 선택하는 것은 주제 변경에 대한 보다 정확한 검출을 제공할 수 있지만, 증가된 지연을 감수해야 한다. 숫자 3은 테스팅을 위해 선택되었다.
연속된 문장들의 벡터들 사이의 변경이 존재할 때, 주제들 사이의 변경{단계(405)}이 주목되는데, 여기서 두 벡터들 사이의 차이는 중대한 차이만큼 다양하다. 이러한 차이는 다양한 실시예들로 변경될 수 있지만, (차이에 있어서) 큰 수가 주제 변경을 검출하는데에 있어서 더 정확할 수는 있으나, 큰 수를 사용하는 것은 주제들의 검출이 보다 지연된다는 것을 주목한다. 새로운 질문이 단계(425)에서 이러한 새로운 주제로 제출될 수 있다.
이미지 디스커버리( Image Discovery )
의미 있는 항목들을 추출한 후에, 이미지 저장소 사이트들, 예컨데 플리커에 질문하여, 이들 항목들로 태깅된 이미지들을 검색{단계(430)}하기 위해, 의미 있는 항목들이 사용될 수 있다. 하지만 질문 결과들은 종종 현재의 프로그램에 연관되지 않은 일부 이미지들을 포함한다. 현재의 문맥에 연관되지 않은 이들 이미지들을 제거하는 것에 대한 한 가지 솔루션은 결과 이미지의 태그들이 현재의 문맥에 속하는지의 여부를 점검하는 것이다. 각 프로그램에 대하여, 이것과 연관된 가장 일반적인 항목들인, 문맥 항목들의 목록이 생성된다. 예를 들어 항목 리스트는 자연, 야생, 경치, 및 동물 왕국과 같은 문맥들을 위해 생성될 수 있다. 따라서 일단 키 어구로 태깅된 이미지들이 획득될 경우, 이미지에 대한 임의의 태그들이 현재의 문맥 또는 문맥 항목들의 목록에 매칭하는지의 여부가 점검될 수 있다. 매칭이 발견된 이들 이미지들만이 연관된 이미지들의 목록에 추가된다.
질문 접근법만이 매칭 항목들로 명백히 태깅된 이미지들을 제공한다. 다른 항목들과 연관된 이미지들은 검색될 수 없다. 동시 발생 접근법은 이미지 디스커버리를 위해 사용될 수 있다. 직관(intuition)은, 몇몇의 이미지들이 동일한 주제를 논의하는 동일 페이지에서 함께 발생하거나, 또는 이들이 매우 유사한 주제에 대하여 동일한 포토그래퍼에 의해 촬영되는 경우, 이들이 연관된다는 것이다. 사용자가 이들 중 하나를 좋아할 경우, 사용자는, 비록 다른 이미지들이 상이한 항목들을 사용하여 태깅될지라도, 다른 이미지들을 좋아할 것 같다. 이미지 디스커버리 단계는 아마도 현재의 TV 프로그램에 연관된 모든 이미지 후보들을 찾는다.
각 웹 다큐먼트는 벡터로서 나타내어진다: (웹페이지에 대하여, 잡음 데이터, 예컨데 광고 텍스트를 제거하는 것은 보통 필요하다.)
D=<IMG1, TXT1, IMG2, TXT2,..., IMGn, TXTn>
이러한 다큐먼트의 순수 텍스트 표현은:
Dtxt=<TXT1, TXT2,..., TXTn>
여기서 IMGi는 페이지에 삽입된 이미지이고, TXTi는 이러한 이미지의 해당하는 텍스트 설명이다. 이미지의 설명은 그것 주위의 텍스트, 예컨데 동일한 HTML 요소(div)에서의 텍스트일 수 있다. 이것은 또한 이러한 이미지들에 할당된 태그들일 수도 있다. 이미지가 더 큰 버전의 이러한 이미지를 도시하는 개별 페이지로 링크될 경우, 새로운 페이지의 제목 및 텍스트는 또한 이미지 설명으로서 다루어진다.
유사하게도, 각 포토그래퍼들의 포토 컬렉션은:
Pu=<IMG1, TXT1, IMG2, TXT2,..., IMGn, TXTn>으로서 나타내어진다.
여기서 IMGi는 포토그래퍼 u에 의해 촬영된 이미지이고, TXTi(1<=i<=n)는 이러한 이미지에 대한 해당 텍스트 설명이다.
이러한 포토그래퍼의 순수 텍스트 표현은:
Pu , txt=<TXT1, TXT2,..., TXTn>이다.
항목 추출 단계가 항목 벡터 <T1 T2 ... Tk>를 추출하는 것을 가정해본다. 이들 추출된 항목들은 웹페이지들 및 포토그래퍼 컬렉션들의 텍스트 표현을 질문하기 위해 사용될 수 있다. 웹페이지들에 포함된, 또는 동일한 포토그래퍼에 의해 촬영된 결과 이미지들은 후보들로서 선택될 것이다.
이미지 추천
이미지 디스커버리 단계는 동일한 페이지에서 동시 발생하거나, 또는 동일한 포토그래퍼에 의해 촬영된 모든 이미지들을 디스커버링할 것이다. 하지만 일부 동시 발생한 또는 동시에 촬영된 이미지들은 현재의 TV 프로그램과 대략적으로 매우 상이한 주제들일 수 있다. 이들 이미지들이 추천될 경우, 사용자들은 혼동할 수 있다. 따라서 연관되지 않은 이들 이미지들은 제거된다.
각 후보 이미지에 대하여, 텍스트 설명은 현재의 문맥과 비교된다. 의미 연관성은 현재의 TV 폐쇄 자막 및 이미지 설명 사이의 연관성(relevancy)을 측정하기 위해 사용될 수 있다. 이후 모든 이미지들은 단계(440)에서 현재의 문맥과의 의미 거리(semantic distance)에 따라 랭킹된다. 의미적으로 연관된 이미지들은 보다 높게 랭킹될 것이다.
정상(top) 랭킹 이미지들은 의미적으로 현재의 TV 문맥에 연관된다. 하지만 이미지들은 이들의 이미지 품질, 시각적 효과들, 및 해상도(resolution) 등으로 인해 사용자들에게 상이한 흥미거리일 수 있다. 따라서 모든 의미적으로 연관된 이미지들이 사용자들에게 흥미있는 것은 아니다. 이에 따라 단계(440)는 이들 의미적으로 연관된 이미지들의 랭킹을 더 포함한다.
제1의 랭킹 접근법은 각각의 의미적으로 연관된 이미지에 대하여 보통 사용자들에 의해 달린 코멘트들(comments)을 사용하는 것이다. 이미지에 대한 코멘트들의 수는 보통 해당 이미지가 얼마나 인기가 있는지를 보여준다. 이미지가 보다 많은 코멘트들을 가질수록, 이것은 보다 흥미있는 것일 수 있다. 대부분의 코멘트들이 긍정적일 경우, 이것은 특히 사실이다. 가장 간단한 접근법은 이미지들을 랭킹하는 코멘트들의 수를 사용하는 것이다. 하지만 대부분의 코멘트들이 부정적일 경우, 만족스러운 랭킹이 성취될 수 없다. 각 코멘트의 양극성(polarity)이 고려될 필요가 있다. 각 코멘트들에 대하여, 사용자가 이것에 대하여 긍정적인지 또는 부정적인지를 알기 위해, 감성 분석(sentiment analysis)이 사용될 수 있다. 인기 있는 이미지가 수백 개의 코멘트들을 획득할 수 있지만, 인기없는 이미지는 몇 개도 안되는 코멘트들을 가질 수 있을 것 같다. 구성 가능한 수, 예를 들면 100은 등급(rating)을 스케일링하기 위한 임계값으로서 명시될 수 있다. 긍정적인 등급들만이 카운팅되고, 스코어는 0과 1 사이의 범위로 제한된다. 이것은 다음과 같이 정의된다:
Figure pct00001
또 다른 랭킹 접근법은 포토그래퍼의 평균 등급을 사용하는 것이다. 포토그래퍼가 보다 높은 등급이 매겨져 있을 경우, 보다 많은 사용자들이 그의/그녀의 다른 이미지들을 좋아할 가능성이 있다. 포토그래퍼의 등급은 포토그래퍼에 의해 촬영된 모든 이미지들을 평균함으로써 계산될 수 있다.
웹 사이트가 사용자 코멘트들을 허용하지 않거나, 또는 이들은 단지 업로딩되어 많은 사용자들에 의해 시청되지 않기 때문에, 일부 이미지들은 알려진 포토그래퍼를 가지지 않고, 코멘트들을 갖지 않을 가능성이 있다. 제3의 랭킹 접근법은, 인간의 눈이 컬러들의 변화에 보다 민감하기 때문에, 이미지 컬러 히스토그램 분산을 사용하는 것이다. 우선적으로, 인기있는 이미지들의 그룹이 선출되고, 이들 컬러 히스토그램 정보가 추출된다. 이후 대부분의 이들 이미지들의 공통적인 특성들이 발견된다. 새로 디스커버링된 이미지에 대하여, 공통적인 특성으로부터의 거리가 계산된다. 이후 가장 간단한 이미지들이 추천을 위해 선택된다.
다양성( Diversification )
현재의 문맥과 매칭하는 정상-N 이미지들이 서로 간에 매우 유사할 가능성이 존재한다. 대부분의 사용자들은 단일 유형 대신에 다양한 이미지들을 좋아한다. 결과들을 다양화하기 위해, 이미지들은 서로 간의 유사성에 따라 클러스터링되고, 각 클러스터로부터 가장 높은 랭킹은 단계(450)에서 추천된다. 이미지 클러스터링은 설명 텍스트를 사용하여 수행될 수 있는데, 이로 인해 매우 유사한 설명을 가진 이미지들은 동일한 클러스터에 넣어질 것이다.
성능 고려( Performance Consideration )
랭킹 이미지들은 전체의 데이터 집합에 대한 광범위한 작동을 요구한다. 하지만 일부 특징들은 빈번히 변경되지 않는다. 예를 들어 전문적인 포토그래퍼가 이미 높게 등급이 매겨져 있을 경우, 그의/그녀의 등급은 매번 다시 계산할 필요없이 캐싱될 수 있다(cached). 포토가 이미 많은 코멘트들, 예컨데 100개 보다 많은 긍정적인 코멘트들로 높게 등급이 매겨져 있을 경우, 등급이 또한 캐싱될 수 있다. 게다가 새로 업로딩된 사진들 또는 새로운 포토그래퍼들에 대하여, 이들 등급이 주기적으로 업데이팅될 수 있으며, 결과들이 캐싱될 수 있다.
선택된 대표 이미지는 이후 단계(460)에서 사용자에게 제공된다. 이때 도 4의 설명된 방법은 종료된다{단계(470)}.
도 5는 상기 열거된 방법론을 수행하기 위해 사용될 수 있는 구성 요소들의 간소화된 구성의 블록도(500)를 도시한다. 구성 요소들은 제어기(510) 및 메모리(515), 디스플레이 인터페이스(520), 통신 인터페이스(530), 키워드 추출 모듈(540), 주제 변경 검출 모듈(550), 및 이미지 디스커버리 모듈(560) 및 이미지 추천 모듈(570)을 포함한다. 이들 각각은 아래에서 보다 상세하게 논의될 것이다.
제어기(510)는 모든 다른 구성 요소들과 통신하며, 다른 구성 요소들을 제어하는 역할을 한다. 제어기(510)는 도 3에 있어서 설명된 것과 동일한 제어기(314), 제어기(314)의 부분 집합, 또는 별도의 제어기 전체일 수 있다.
메모리(515)는 제어기(510)에 의해 사용되는 데이터, 뿐만 아니라 다른 구성 요소들을 제어하기 위해 제어기(510)에 의해 실행된 코드를 저장하도록 구성된다. 메모리(510)는 도 3에 있어서 설명된 것과 동일한 메모리(320), 메모리(320)의 부분 집합, 또는 별도의 메모리 전체일 수 있다.
디스플레이 인터페이스(520)는 사용자에 대한 이미지 추천의 출력을 취급한다. 이 자체만으로, 이는 도 4의 단계(460)를 수행하는 것에 수반된다. 디스플레이 인터페이스(520)는 도 3에 있어서 설명된 것과 동일한 디스플레이 인터페이스(316), 디스플레이 인터페이스(316)의 부분 집합, 또는 별도의 디스플레이 인터페이스 전체일 수 있다.
통신 인터페이스(530)는 인터넷 및 사용자를 통하여 제어기의 통신을 취급한다. 통신 인터페이스(530)는 도 3에 있어서 설명된 입력 신호 수신기(302), 또는 사용자 인터페이스(316), 이들의 결합, 이들의 부분 집합, 또는 별도의 통신 인터페이스 전체일 수 있다.
키워드 추출 모듈(540)은 도 4에서의 단계(420 및 425)와 관련하여 설명된 기능을 수행한다. 키워드 추출 모듈(540)은 소프트웨어, 하드웨어, 또는 이들의 결합으로 구현될 수 있다.
주제 변경 검출 모듈(550)은 도 4에서의 단계(410 및 415)에 관련하여 설명된 기능을 수행한다. 주제 변경 검출 모듈(550)은 소프트웨어, 하드웨어, 또는 이들의 결합으로 구현될 수 있다.
이미지 디스커버리 모듈(560)은 도 4에서의 단계(430)에 관련하여 설명된 기능을 수행한다. 이미지 디스커버리 모듈(560)은 소프트웨어, 하드웨어, 또는 이들의 결합으로 구현될 수 있다.
이미지 추천 모듈(570)은 도 4에서의 단계(440 및 450)에 관련하여 설명된 기능을 수행한다. 이미지 추천 모듈(570)은 소프트웨어, 하드웨어, 또는 이들의 결합으로 구현될 수 있다.
도 6은 디스플레이되는 프로그램(620)의 주제에 연관된 디스커버링된 이미지들(610)을 디스플레이하는 예시적인 스크린 캡쳐(600)를 도시한다. 이러한 실시예에서, 이미지들(610)은 다수의 발견되고 연관된 이미지들에 대한 이미지 클러스터들의 대표 이미지들이다. 스크린 캡쳐(600)에서 확인될 수 있는 바와 같이, 디스플레이되는 프로그램(620)은 골프선수 타이거 우즈에 관한 CNN 리포트이다. 이 자체만으로도, 추천된 발견된 이미지들(610)은 골프와 연관된다.
본 발명의 원리들의 이들의 및 다른 특징들, 및 장점들은 본 명세서에서의 가르침들을 기반으로 하여 당업자에 의해 쉽게 확인될 수 있다. 본 발명의 원리들의 가르침들이 하드웨어, 소프트웨어, 펌웨어, 특수용 프로세서들, 또는 이들의 결합의 다양한 형태로 구현될 수 있다는 것이 이해될 것이다.
가장 바람직하게도, 본 발명의 원리들의 가르침들은 하드웨어 및 소프트웨어의 결합으로서 구현된다. 또한 소프트웨어는 프로그램 저장 유닛에서 실체적으로 구현된 응용 프로그램으로서 구현될 수 있다. 응용 프로그램은 임의의 적절한 구조를 포함하는 장비로 업로딩되어, 이것에 의해 실행될 수 있다. 바람직하게도, 하나 이상의 중앙 처리 장치들("CPU"), 랜덤 액세스 메모리("RAM"), 및 입력/출력("I/O") 인터페이스들과 같은 하드웨어를 갖는 장비는 컴퓨터 플랫폼상에서 구현된다. 컴퓨터 플랫폼은 또한 운영 체제 및 마이크로명령어 코드를 포함할 수 있다. 본 명세서에서 설명된 다양한 프로세스들 및 기능들은 마이크로명령어 코드의 부분 또는 응용 프로그램의 부분, 또는 이들의 임의의 결합일 수 있으며, 이들은 CPU에 의해 실행될 수 있다. 추가적으로, 추가적인 데이터 저장 장치 및 프린팅 장치와 같은 다양한 다른 주변 장치들이 컴퓨터 플랫폼에 연결될 수 있다.
첨부 도면들에서 설명되는 일부의 구성 시스템 구성 요소들 및 방법이 소프트웨어로 바람직하게 구현되기 때문에, 시스템 구성 요소들 또는 프로세스 기능 블록들 사이의 실제적인 연결들은 본 발명의 원리들이 프로그래밍된 방식에 따라 상이할 수 있다. 본 명세서에서의 가르침들이 주어졌으므로, 당업자는 이들 및 유사한 구현들 또는 본 발명의 원리들의 구성들을 심사 숙고할 수 있을 것이다.
예시적인 실시예들이 첨부 도면을 참조하여 본 명세서에서 설명되었을 지라도, 본 발명의 원리들은 이들의 정확한 실시예들로 제한되지 않으며, 다양한 변형들 및 수정들이 본 발명의 원리들의 범주 또는 사상으로부터 벗어나지 않고 당업자에 의해 성취될 수 있다는 것이 이해될 것이다. 이러한 모든 변형 및 수정들은 첨부된 청구항들에 열거된 바와 같이 본 발명의 원리들의 범주 내에 포함되도록 의도된다.
100, 200 : 시스템 102 : 컨텐츠 소스
104 : 브로드캐스트 제휴 매니저 106, 112 : 전달 네트워크
108 : 셋톱 박스/디지털 비디오 기록기
110, 205, 235 : 컨텐츠 매니저 114 : 디스플레이 디바이스
118 : 온라인 소셜 네트워크 서버 240, 245 : 온라인 소셜 서버
210, 215, 225, 230 : 매체 서버 250 : 광대역 네트워크
260 : 개인용 컴퓨터 270 : 태블릿
280 : 전화기 300 : 디바이스
302 : 입력 신호 수신기 304 : 입력 스트림 프로세서
306 : 오디오 프로세서 308 : 오디오 인터페이스
310 : 비디오 프로세서 312 : 저장 디바이스
314, 510 : 제어기 316 : 사용자 인터페이스
318 : 디스플레이 인터페이스 320 : 제어 메모리
500 : 구성도의 블록도 510 : 메모리
520 : 디스플레이 인터페이스 530 : 통신 인터페이스
540 : 키워드 추출 모듈 550 : 주제 변경 검출 모듈
560 : 이미지 디스커버리 모듈 570 : 이미지 추천 모듈
600 : 스크린 캡쳐 610 : 추천된 이미지들

Claims (14)

  1. 디스플레이된 컨텐츠에 대한 자동 이미지 디스커버리를 수행하기 위한 방법으로서,
    디스플레이된 컨텐츠의 주제를 검출하는 단계;
    검출된 주제를 기반으로 하여 질문 항목들을 추출하는 단계;
    질문 항목들을 기반으로 하여 이미지들을 디스커버링하는 단계; 및
    하나 이상의 디스커버링된 이미지들을 디스플레이하는 단계;를 포함하는,
    디스플레이된 컨텐츠에 대한 자동 이미지 디스커버리를 수행하기 위한 방법.
  2. 제1항에 있어서, 주제가 변경되었는지를 검출하는 단계; 및
    질문 항목들을 업데이트하는 단계;를 더 포함하는,
    디스플레이된 컨텐츠에 대한 자동 이미지 디스커버리를 수행하기 위한 방법.
  3. 제1항에 있어서, 디스플레이되는 컨텐츠의 주제를 검출하는 단계는 디스플레이되는 컨텐츠가 제공된 폐쇄 자막(closed captioning)을 프로세싱하는 단계를 포함하는,
    디스플레이된 컨텐츠에 대한 자동 이미지 디스커버리를 수행하기 위한 방법.
  4. 제1항에 있어서, 검출된 주제를 기반으로 하여 질문 항목들을 추출하는 단계는 명명된 엔티티(entities) 및 의미 있는 어구들을 기반으로 하여 키워드들을 추출하는 단계를 포함하는,
    디스플레이된 컨텐츠에 대한 자동 이미지 디스커버리를 수행하기 위한 방법.
  5. 제4항에 있어서, 키워드 추출은,
    카테고리를 기반으로 하여 키워드들을 선택하는 단계;
    문장 구조를 기반으로 하여 키워드들을 선택하는 단계; 및
    의미 연관성(semantic relatedness)을 기반으로 하여 키워드들을 선택하는 단계; 중 하나 이상을 포함하는,
    디스플레이된 컨텐츠에 대한 자동 이미지 디스커버리를 수행하기 위한 방법.
  6. 제4항에 있어서, 키워드 추출은 의미 있는 어구들을 결정하기 위해 데이터베이스를 참고하는(consulting) 단계를 포함하는,
    디스플레이된 컨텐츠에 대한 자동 이미지 디스커버리를 수행하기 위한 방법.
  7. 제1항에 있어서, 검출된 주제를 기반으로 하여 질문 항목들을 추출하는 단계는 후보 어구에 대한 표면 형태(surface forms)를 분석하는 단계를 더 포함하는,
    디스플레이된 컨텐츠에 대한 자동 이미지 디스커버리를 수행하기 위한 방법.
  8. 제1항에 있어서, 주제에 대한 연관성에 따라 디스커버링된 이미지들을 랭킹(ranking)하는 단계를 더 포함하는,
    디스플레이된 컨텐츠에 대한 자동 이미지 디스커버리를 수행하기 위한 방법.
  9. 제1항에 있어서, 질문 항목들을 기반으로 하여 이미지들을 디스커버링하는 단계는 온라인 이미지 데이터베이스들을 검색하는 단계를 포함하는,
    디스플레이된 컨텐츠에 대한 자동 이미지 디스커버리를 수행하기 위한 방법.
  10. 제1항에 있어서,
    연관된 이미지들을 클러스터링하는 단계; 및
    각 클러스터에 대한 대표 이미지를 선택하는 단계;를 더 포함하는,
    디스플레이된 컨텐츠에 대한 자동 이미지 디스커버리를 수행하기 위한 방법.
  11. 디스플레이된 컨텐츠에 대한 자동 이미지 디스커버리를 수행하기 위한 시스템으로서,
    디스플레이된 컨텐츠의 주제를 검출하도록 구성된 주제 검출 모듈;
    검출된 주제로부터 질문 항목들을 추출하도록 구성된 키워드 추출 모듈;
    질문 항목들을 기반으로 하여 이미지들을 디스커버링하도록 구성된 이미지 디스커버리 모듈; 및
    주제 검출 모듈, 키워드 추출 모듈, 및 이미지 디스커버리 모듈을 제어하도록 구성된 제어기;를 포함하는,
    디스플레이된 컨텐츠에 대한 자동 이미지 디스커버리를 수행하기 위한 시스템.
  12. 제11항에 있어서, 하나 이상의 디스커버링된 이미지들을 디스플레이하도록 구성된 디스플레이 인터페이스를 더 포함하는,
    디스플레이된 컨텐츠에 대한 자동 이미지 디스커버리를 수행하기 위한 시스템.
  13. 제11항에 있어서,
    제어기를 위해 데이터 및 명령을 저장하도록 구성된 메모리; 및
    제어기를 인터넷 및 사용자와 인터페이싱하도록 구성된 통신 인터페이스;를 더 포함하는,
    디스플레이된 컨텐츠에 대한 자동 이미지 디스커버리를 수행하기 위한 시스템.
  14. 컴퓨터 판독 가능한 프로그램을 갖는 컴퓨터 이용 가능한 매체를 포함하는 컴퓨터 프로그램 제품으로서,
    컴퓨터에서 실행될 때, 컴퓨터 판독 가능한 프로그램은, 컴퓨터가, 디스플레이된 컨텐츠에 대한 자동 이미지 디스커버리를 수행하는 방법의 단계들을 수행하도록 하고,
    상기 방법은,
    디스플레이되는 컨텐츠의 주제를 검출하는 단계;
    검출된 주제를 기반으로 하여 질문 항목들을 추출하는 단계;
    질문 항목들을 기반으로 하여 이미지들을 디스커버링하는 단계; 및
    하나 이상의 디스커버링된 이미지들을 디스플레이하는 단계;를 포함하는,
    컴퓨터 판독 가능한 프로그램을 갖는 컴퓨터 이용 가능한 매체를 포함하는 컴퓨터 프로그램 제품.

KR1020127027873A 2010-04-30 2011-04-29 디스플레이된 텔레비전 컨텐츠에 대한 자동 이미지 디스커버리 및 추천 KR20130083829A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US34354710P 2010-04-30 2010-04-30
US61/343,547 2010-04-30
PCT/US2011/000762 WO2011136855A1 (en) 2010-04-30 2011-04-29 Automatic image discovery and recommendation for displayed television content

Publications (1)

Publication Number Publication Date
KR20130083829A true KR20130083829A (ko) 2013-07-23

Family

ID=44343797

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020127027873A KR20130083829A (ko) 2010-04-30 2011-04-29 디스플레이된 텔레비전 컨텐츠에 대한 자동 이미지 디스커버리 및 추천

Country Status (7)

Country Link
US (1) US20130007057A1 (ko)
EP (1) EP2564331A1 (ko)
JP (1) JP2013529331A (ko)
KR (1) KR20130083829A (ko)
CN (1) CN102884524A (ko)
BR (1) BR112012026750A2 (ko)
WO (1) WO2011136855A1 (ko)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9443518B1 (en) * 2011-08-31 2016-09-13 Google Inc. Text transcript generation from a communication session
US9319372B2 (en) * 2012-04-13 2016-04-19 RTReporter BV Social feed trend visualization
US8612211B1 (en) 2012-09-10 2013-12-17 Google Inc. Speech recognition and summarization
KR101491628B1 (ko) 2013-07-30 2015-02-12 성균관대학교산학협력단 블로그에서 대중의 감성 변화에 영향을 미치는 키워드 추출 방법, 장치 및 시스템
US9268861B2 (en) * 2013-08-19 2016-02-23 Yahoo! Inc. Method and system for recommending relevant web content to second screen application users
CN104639993A (zh) * 2013-11-06 2015-05-20 株式会社Ntt都科摩 视频节目推荐方法及其服务器
US9749701B2 (en) 2014-04-17 2017-08-29 Microsoft Technology Licensing, Llc Intelligent routing of notifications to grouped devices
WO2016153510A1 (en) 2015-03-26 2016-09-29 Hewlett-Packard Development Company, L.P. Image selection based on text topic and image explanatory value
US10785180B2 (en) * 2015-06-11 2020-09-22 Oath Inc. Content summation
US10191899B2 (en) * 2016-06-06 2019-01-29 Comigo Ltd. System and method for understanding text using a translation of the text
US20180039854A1 (en) * 2016-08-02 2018-02-08 Google Inc. Personalized image collections
US10789298B2 (en) 2016-11-16 2020-09-29 International Business Machines Corporation Specialist keywords recommendations in semantic space
US10795952B2 (en) 2017-01-05 2020-10-06 Microsoft Technology Licensing, Llc Identification of documents based on location, usage patterns and content
KR101871828B1 (ko) * 2017-07-03 2018-06-28 (주)망고플레이트 온라인 콘텐츠의 대표 이미지 선정 장치 및 방법

Family Cites Families (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5809471A (en) * 1996-03-07 1998-09-15 Ibm Corporation Retrieval of additional information not found in interactive TV or telephony signal by application using dynamically extracted vocabulary
US6363380B1 (en) * 1998-01-13 2002-03-26 U.S. Philips Corporation Multimedia computer system with story segmentation capability and operating program therefor including finite automation video parser
US6240424B1 (en) * 1998-04-22 2001-05-29 Nbc Usa, Inc. Method and system for similarity-based image classification
US20010003214A1 (en) * 1999-07-15 2001-06-07 Vijnan Shastri Method and apparatus for utilizing closed captioned (CC) text keywords or phrases for the purpose of automated searching of network-based resources for interactive links to universal resource locators (URL's)
US7490092B2 (en) * 2000-07-06 2009-02-10 Streamsage, Inc. Method and system for indexing and searching timed media information based upon relevance intervals
JP4129132B2 (ja) * 2001-03-30 2008-08-06 株式会社ジャストシステム 検索結果提示装置、検索結果提示方法、及び検索結果提示プログラム
US20030208755A1 (en) * 2002-05-01 2003-11-06 Koninklijke Philips Electronics N.V. Conversational content recommender
WO2005027092A1 (ja) * 2003-09-08 2005-03-24 Nec Corporation 文書作成閲覧方法、文書作成閲覧装置、文書作成閲覧ロボットおよび文書作成閲覧プログラム
US7386542B2 (en) * 2004-08-30 2008-06-10 The Mitre Corporation Personalized broadcast news navigator
WO2007017887A1 (en) * 2005-08-10 2007-02-15 Hewlett-Packard Development Company, L.P. Delivering specific contents to specific recipients using broadcast networks
US7933338B1 (en) * 2004-11-10 2011-04-26 Google Inc. Ranking video articles
US7657126B2 (en) * 2005-05-09 2010-02-02 Like.Com System and method for search portions of objects in images and features thereof
US8392415B2 (en) * 2005-12-12 2013-03-05 Canon Information Systems Research Australia Pty. Ltd. Clustering of content items
US7421455B2 (en) * 2006-02-27 2008-09-02 Microsoft Corporation Video search and services
US20080235209A1 (en) * 2007-03-20 2008-09-25 Samsung Electronics Co., Ltd. Method and apparatus for search result snippet analysis for query expansion and result filtering
US20070265999A1 (en) * 2006-05-15 2007-11-15 Einat Amitay Search Performance and User Interaction Monitoring of Search Engines
JP2008061120A (ja) * 2006-09-01 2008-03-13 Sony Corp 再生装置、検索方法、およびプログラム
US8589973B2 (en) * 2006-09-14 2013-11-19 At&T Intellectual Property I, L.P. Peer to peer media distribution system and method
EP3493074A1 (en) * 2006-10-05 2019-06-05 Splunk Inc. Time series search engine
US20080098433A1 (en) * 2006-10-23 2008-04-24 Hardacker Robert L User managed internet links from TV
US20080177708A1 (en) * 2006-11-01 2008-07-24 Koollage, Inc. System and method for providing persistent, dynamic, navigable and collaborative multi-media information packages
US9076148B2 (en) * 2006-12-22 2015-07-07 Yahoo! Inc. Dynamic pricing models for digital content
US20080276266A1 (en) * 2007-04-18 2008-11-06 Google Inc. Characterizing content for identification of advertising
US20080313146A1 (en) * 2007-06-15 2008-12-18 Microsoft Corporation Content search service, finding content, and prefetching for thin client
US20090064247A1 (en) * 2007-08-31 2009-03-05 Jacked, Inc. User generated content
JP2009146013A (ja) * 2007-12-12 2009-07-02 Fujifilm Corp コンテンツ検索方法及び装置並びにプログラム
KR101348598B1 (ko) * 2007-12-21 2014-01-07 삼성전자주식회사 디지털 티비 방송 제공 시스템과 디지털 티비 및 그 제어방법
JP2009157460A (ja) * 2007-12-25 2009-07-16 Hitachi Ltd 情報提示装置及び方法
KR101392273B1 (ko) * 2008-01-07 2014-05-08 삼성전자주식회사 키워드 제공 방법 및 이를 적용한 영상기기
JP5238418B2 (ja) * 2008-09-09 2013-07-17 株式会社東芝 情報推薦装置および情報推薦方法
JP5371083B2 (ja) * 2008-09-16 2013-12-18 Kddi株式会社 顔識別特徴量登録装置、顔識別特徴量登録方法、顔識別特徴量登録プログラム及び記録媒体
US9049477B2 (en) * 2008-11-13 2015-06-02 At&T Intellectual Property I, Lp Apparatus and method for managing media content
US8713016B2 (en) * 2008-12-24 2014-04-29 Comcast Interactive Media, Llc Method and apparatus for organizing segments of media assets and determining relevance of segments to a query
US8539359B2 (en) * 2009-02-11 2013-09-17 Jeffrey A. Rapaport Social network driven indexing system for instantly clustering people with concurrent focus on same topic into on-topic chat rooms and/or for generating on-topic search results tailored to user preferences regarding topic
US20100306235A1 (en) * 2009-05-28 2010-12-02 Yahoo! Inc. Real-Time Detection of Emerging Web Search Queries
US20110082880A1 (en) * 2009-10-07 2011-04-07 Verizon Patent And Licensing, Inc. System for and method of searching content
US8489600B2 (en) * 2010-02-23 2013-07-16 Nokia Corporation Method and apparatus for segmenting and summarizing media content
US10692093B2 (en) * 2010-04-16 2020-06-23 Microsoft Technology Licensing, Llc Social home page

Also Published As

Publication number Publication date
WO2011136855A1 (en) 2011-11-03
CN102884524A (zh) 2013-01-16
US20130007057A1 (en) 2013-01-03
JP2013529331A (ja) 2013-07-18
EP2564331A1 (en) 2013-03-06
BR112012026750A2 (pt) 2016-07-12

Similar Documents

Publication Publication Date Title
US20240267578A1 (en) Topical Content Searching
US20130007057A1 (en) Automatic image discovery and recommendation for displayed television content
CN106331778B (zh) 视频推荐方法和装置
US9100679B2 (en) System and method for real-time processing, storage, indexing, and delivery of segmented video
US20130291019A1 (en) Self-learning methods, entity relations, remote control, and other features for real-time processing, storage, indexing, and delivery of segmented video
CN110072152B (zh) 识别和呈现因特网可访问内容的方法和设备
US20150189343A1 (en) Dynamic media segment pricing
US9100701B2 (en) Enhanced video systems and methods
US20160014482A1 (en) Systems and Methods for Generating Video Summary Sequences From One or More Video Segments
US8478759B2 (en) Information presentation apparatus and mobile terminal
US20130144891A1 (en) Server apparatus, information terminal, and program
US20120323900A1 (en) Method for processing auxilary information for topic generation
KR20030007727A (ko) 자동 비디오 리트리버 제니
US9542395B2 (en) Systems and methods for determining alternative names
EP2691845A2 (en) Semantic enrichment by exploiting top-k processing
JP5335500B2 (ja) コンテンツ検索装置及びコンピュータプログラム
Sumiyoshi et al. CurioView: TV recommendations related to content being viewed
JP5757886B2 (ja) テレビ放送録画予約方法、装置およびシステム
JP2008027258A (ja) データ表示装置

Legal Events

Date Code Title Description
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid