JP2004516752A - 映像番組のマルチメディア要約にアクセスするシステム及び方法 - Google Patents

映像番組のマルチメディア要約にアクセスするシステム及び方法 Download PDF

Info

Publication number
JP2004516752A
JP2004516752A JP2002552309A JP2002552309A JP2004516752A JP 2004516752 A JP2004516752 A JP 2004516752A JP 2002552309 A JP2002552309 A JP 2002552309A JP 2002552309 A JP2002552309 A JP 2002552309A JP 2004516752 A JP2004516752 A JP 2004516752A
Authority
JP
Japan
Prior art keywords
video program
video
topic
viewer
display
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2002552309A
Other languages
English (en)
Inventor
アグニホトリ,ラリタ
ディミトロワ,ネヴェンカ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Publication of JP2004516752A publication Critical patent/JP2004516752A/ja
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/475End-user interface for inputting end-user data, e.g. personal identification number [PIN], preference data
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/102Programmed access in sequence to addressed parts of tracks of operating record carriers
    • G11B27/105Programmed access in sequence to addressed parts of tracks of operating record carriers of operating discs
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/102Programmed access in sequence to addressed parts of tracks of operating record carriers
    • G11B27/107Programmed access in sequence to addressed parts of tracks of operating record carriers of operating tapes
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/11Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information not detectable on the record carrier
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/34Indicating arrangements 
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/414Specialised client platforms, e.g. receiver in car or embedded in a mobile appliance
    • H04N21/4147PVR [Personal Video Recorder]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/426Internal components of the client ; Characteristics thereof
    • H04N21/42661Internal components of the client ; Characteristics thereof for reading from or writing on a magnetic storage medium, e.g. hard disk drive
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/431Generation of visual interfaces for content selection or interaction; Content or additional data rendering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/462Content or additional data management, e.g. creating a master electronic program guide from data received from the Internet and a Head-end, controlling the complexity of a video stream by scaling the resolution or bit-rate based on the client capabilities
    • H04N21/4622Retrieving content or additional data from different sources, e.g. from a broadcast channel and the Internet
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/482End-user interface for program selection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/488Data services, e.g. news ticker
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/488Data services, e.g. news ticker
    • H04N21/4882Data services, e.g. news ticker for displaying messages, e.g. warnings, reminders
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/488Data services, e.g. news ticker
    • H04N21/4884Data services, e.g. news ticker for displaying subtitles
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/812Monomedia components thereof involving advertisement data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/84Generation or processing of descriptive data, e.g. content descriptors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments
    • H04N21/8456Structuring of content, e.g. decomposing content into time segments by decomposing the content in the time domain, e.g. in time segments
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/85Assembly of content; Generation of multimedia applications
    • H04N21/854Content authoring
    • H04N21/8549Creating video summaries, e.g. movie trailer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B2220/00Record carriers by type
    • G11B2220/20Disc-shaped record carriers
    • G11B2220/21Disc-shaped record carriers characterised in that the disc is of read-only, rewritable, or recordable type
    • G11B2220/215Recordable discs
    • G11B2220/216Rewritable discs
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B2220/00Record carriers by type
    • G11B2220/20Disc-shaped record carriers
    • G11B2220/25Disc-shaped record carriers characterised in that the disc is based on a specific recording technology
    • G11B2220/2508Magnetic discs
    • G11B2220/2516Hard disks
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B2220/00Record carriers by type
    • G11B2220/20Disc-shaped record carriers
    • G11B2220/25Disc-shaped record carriers characterised in that the disc is based on a specific recording technology
    • G11B2220/2537Optical discs
    • G11B2220/2545CDs
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B2220/00Record carriers by type
    • G11B2220/20Disc-shaped record carriers
    • G11B2220/25Disc-shaped record carriers characterised in that the disc is based on a specific recording technology
    • G11B2220/2537Optical discs
    • G11B2220/2562DVDs [digital versatile discs]; Digital video discs; MMCDs; HDCDs
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B2220/00Record carriers by type
    • G11B2220/40Combinations of multiple record carriers
    • G11B2220/45Hierarchical combination of record carriers, e.g. HDD for fast access, optical discs for long term storage or tapes for backup
    • G11B2220/455Hierarchical combination of record carriers, e.g. HDD for fast access, optical discs for long term storage or tapes for backup said record carriers being in one device and being used as primary and secondary/backup media, e.g. HDD-DVD combo device, or as source and target media, e.g. PC and portable player
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B2220/00Record carriers by type
    • G11B2220/90Tape-like record carriers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/433Content storage operation, e.g. storage operation in response to a pause request, caching operations
    • H04N21/4332Content storage operation, e.g. storage operation in response to a pause request, caching operations by placing content in organized collections, e.g. local EPG data repository
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • H04N21/4394Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44008Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/4402Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
    • H04N21/440236Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display by media transcoding, e.g. video is transformed into a slideshow of still pictures, audio is converted into text
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/765Interface circuits between an apparatus for recording and another apparatus
    • H04N5/775Interface circuits between an apparatus for recording and another apparatus between a recording apparatus and a television receiver
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/78Television signal recording using magnetic recording
    • H04N5/781Television signal recording using magnetic recording on disks or drums
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/84Television signal recording using optical recording
    • H04N5/85Television signal recording using optical recording on discs or drums
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/907Television signal recording using static stores, e.g. storage tubes or semiconductor memories
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/804Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components
    • H04N9/8042Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components involving data reduction

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Human Computer Interaction (AREA)
  • Computer Security & Cryptography (AREA)
  • Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Television Signal Processing For Recording (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Management Or Editing Of Information On Record Carriers (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

映像番組を表示する能力を備えた映像表示システムにおいて使用され、映像番組のマルチメディア要約にアクセスシステム及び方法を開示する。このシステムは、映像番組のトピック及びサブトピックを識別と、各トピック及びサブトピックのエントリー・ポイントとを識別する情報を表示ページに表示することができる。視聴者によるエントリー・ポイントの選択に応答して、このシステムは、映像番組の対応した部分を表示する。また、このシステムは、映像番組中の各話者を識別する情報と、各話者が映像番組中で話をしている時点を表す複数の時間セグメントとを話者視覚化表示ページに表示することができる話者視覚化表示ユニットを含む。視聴者による時間セグメントの選択に応答して、このシステムは、映像番組の対応した部分を表示する。このシステムは、視聴者が関心を持っている付加情報を見つけ、付加情報が見つかったときに視聴者へ通知する。

Description

【0001】
〔関連出願へのクロスリファレンス〕
本発明は、発明の名称が”METHOD AND APPARATUS FOR THE SUMMARIZATION AND INDEXING OF VIDEO PROGRAMS USING TRANSCRIPT INFORMATION”である米国特許出願明細書(書類番号PHA701137)に記載された発明、1999年7月9日に出願された、発明の名称が”METHOD AND APPARATUS FOR LINKING A VIDEO SEGMENT TO ANOTHER SEGMENT OR INFORMATION SOURCE”である米国特許出願第09/351,089号明細書に記載された発明、発明の名称が”SYSTEM AND METHOD FOR ORDERING ONLINE UTILIZING A DIGITAL TELEVISION RECEIVER”である米国特許出願明細書(書類番号PHA701071)に記載された発明、並びに、発明の名称が”SYSTEM AND METHOD FOR PROVIDING A MULTIMEDIA SUMMARY OF A VIDEO PROGRAM”である米国特許出願明細書(書類番号PHA701182)に記載された発明に関連している。これらの特許出願は、本願の譲受人に譲渡されている。関連出願の開示内容は、参考のためその全体をそのまま引用する。
【0002】
〔発明の技術分野〕
本発明は、映像番組のマルチメディア要約にアクセスするシステム及び方法に関する。
【0003】
〔発明の背景〕
当初のテレビでは、視聴するため利用できるテレビ放送チャネルの数は少なかった。テレビ技術が進歩して極超短波(UHF)チャネル、超短波(VHF)チャネル、ケーブルテレビ、衛星テレビ受信、及び、インターネットに基づく技術が取り入れられるようになると、利用可能なテレビチャネルの数は著しく増加した。
【0004】
視聴できるテレビ番組の数も著しく増加した。高品位テレビのコンテンツに関しては、その情報量は、1日に1チャネル当たりで200ギガバイト(GB)に達する。視聴者が視聴することに関心を持っている番組若しくは番組セグメントを見つけることができるように、視聴者が映像番組の内容説明を素早く閲覧できることは、徐々に重要になり始めている。その際の主要な問題は、多くの映像番組の内容説明は、容易に入手できないという点である。
【0005】
録画された映像番組を視聴したいと思う視聴者に与えられている現在の選択肢には、次の(1)〜(3)が含まれる。
(1)映像番組全部を見る。
(2)関心を持っている番組の部分を見つけるため映像番組全体の記録物を早送りする。
(3)一般的な番組説明だけを提供する電子番組案内(EPG)のデータを使用する。
【0006】
現在、視聴者が映像番組の内容を簡単に識別できるシステム或いは方法を入手することはできない。特に、視聴者が映像番組の内容の十分に詳細な要約を取得できるようなシステム或いは方法は入手できない。従来技術のこの欠点を解決するため、本発明の発明者は、映像番組のマルチメディア要約を提供するシステム及び方法を発明した。この発明は、発明の名称が”SYSTEM AND METHOD FOR PROVIDING A MULTIMEDIA SUMMARY OF A VIDEO PROGRAM”である米国特許出願明細書(書類番号PHA701182)に記載され、権利主張されている。この米国特許出願は参考のためその全体をそのまま引用する。
【0007】
従来技術では、映像番組のマルチメディア要約に含まれる情報を入手する改良型のシステム及び方法が求められている。また、従来技術では、映像番組の話題(トピック)又は副題(サブトピック)の開始時に映像番組のマルチメディア要約を入手する改良型のシステム及び方法が求められている。さらに、従来技術では、映像番組の一部を選択し表示するため、映像番組中に話をしている人物を表す映像番組のマルチメディア要約を入手する改良型のシステム及び方法が求められている。
【0008】
〔発明の概要〕
上記の従来技術の問題点を解決するため、本発明の主要な目的は、映像番組を表示する能力を備えた映像表示システムで利用される、映像番組のマルチメディア要約にアクセスするシステム及び方法を提供することである。
【0009】
本発明は、映像番組のトピック及びサブトピックと、トピック及びサブトピック毎のエントリー・ポイントとを識別する情報を表示ページに表示する能力を備えたシステム及び方法である。視聴者によるトピック又はサブトピックのエントリー・ポイントの選択に応答して、本発明のシステムは、映像番組の対応した部分を表示する。
【0010】
本発明は、更に、映像番組中の各話者、及び、映像番組中の各話者が話をしているときを表す複数の時間セグメントを識別する情報を話者視覚化表示ページに表示する能力を備えた話者視覚化表示ユニットを含む。視聴者による話者の時間セグメントの選択に応答して、このシステムは、話者を表す映像番組の対応した部分を表示する。
【0011】
本発明は、視聴者が関心を持っている付加情報を見つけるシステム及び方法にも関する。このシステムは、視聴者によって選択されたトピック及びサブトピックに基づいて視聴者が関心を持っている情報を識別する。本発明のシステム及び方法は、付加情報が見つけられたときに視聴者へ通知する。
【0012】
本発明の有利な一実施例によれば、システムは、映像番組のトピック及びサブトピックと対応したエントリー・ポイントとを識別するマルチメディア要約からの情報を表示ページに表示する能力を備えている。
【0013】
本発明の有利な一実施例によれば、システムは、視聴者によるエントリー・ポイントの選択に応答して選択されたエントリー・ポイントに対応した映像番組のトピック又はサブトピックに関連した映像番組の一部分を表示する能力を備えている。
【0014】
本発明の別の有利な一実施例によれば、システムは、映像番組中に話をしている人物と、その人物が話をしている間の映像番組の時間セグメントと、を識別するマルチメディア要約からの情報を話者視覚化ページに表示する能力を備えている。
【0015】
本発明の別の一実施例によれば、システムは、視聴者による話者選択に対応した時間セグメントの選択に応答して、映像番組中に話をしている一人の話者を表す映像番組の一部分を表示する能力を備えている。
【0016】
本発明の別の有利な一実施例によれば、システムは、視聴者が関心を持つトピック及びサブトピックに関する情報を獲得するため、マルチメディア要約にアクセスする能力を備えている。システムは、(1)トピック及びサブトピックに関連した付加情報を見つける能力、及び、(2)視聴者に付加情報を通知する能力、を備えている。
【0017】
本発明の特徴及び技術的効果を包括的に説明したので、当業者は、以下の本発明の詳細な説明をよりよく理解できるであろう。請求項に係わる発明の主題を形成する本発明の更なる特徴及び効果は、後述される。当業者は、開示された概念及び具体的な実施例に基づいて、容易に、本発明と同じ目的を実現する構成を変更し、或いは、他の構成を設計するであろう。当業者は、このような等価的な構成は、本発明の精神及び範囲の外延に含まれることを認めるであろう。
【0018】
本発明の詳細な説明を始める前に、本明細書で使用されるある種の単語若しくは句(語句)を定義しておく方が都合がよい。用語「含む」、「有する」、「構成される」のような単語、及び、これらの単語の派生語は、制限の無い包含を表し、用語「又は」は包含的であり、「及び/又は」を意味し、句「関連している」並びにそのから派生した句は、包括される、相互接続する、包含される、接続する、結合する、通信できる、協働する、交互配置する、並列する、近接する、境界を接する、保有する、性質がある、などの意味を含む。用語「コントローラ」は、少なくとも一つの動作を制御する装置、システム、或いは、システムの一部であり、これらの装置は、ハードウェア、ファームウェア、ソフトウェア、又は、これらのうちの少なくとも二つの組み合わせを意味する。特定のコントローラに関連した機能は、集中的でも分散的でも、局部的でも遠隔的でも構わないことに注意する必要がある。特に、コントローラは、1台以上のデータプロセッサと、関連した入出力装置及びメモリと、を具備し、データプロセッサは、一つ以上のアプリケーションプログラム、及び/又は、オペレーティングシステムプログラムを実行する。ある種の語句の定義は明細書中で与えられ、当業者は、このような定義が、このように定義された語句の過去及び未来の用法に、殆どではなくても多くの場合に適用されることを認めるであろう。
【0019】
本発明及び本発明の効果を完全に理解するために、以下の説明を添付図面と共に提示する。添付図面中、同じ番号は同じものを指定する。
【0020】
図1乃至6と、本明細書において本発明の原理を記述するため使用される多数の実施例は、説明のためだけに用いられるものであって、決して本発明の範囲を制限するために構成されるべきではない。以下の典型的な実施例の記述において、本発明は、テレビ受像機に統合されるか、或いは、テレビ受像機と共に使用される。しかし、この実施例は、一例に過ぎないので、本発明の範囲をテレビ受像機に限定するために構成されるべきではない。実際上、当業者は、本発明の典型的な実施例があらゆるタイプの映像表示システムで利用するため簡単に変更できることがわかるであろう。
【0021】
図1は、本発明の一実施例による典型的なビデオレコーダ150及びテレビ受像機105を示す図である。ビデオレコーダ150は、外部源、例えば、ケーブルテレビジョン・サービス・プロバイダ(ケーブル社)、ローカルのアンテナ、衛星、インターネット、又はディジタル多用途ディスク(DVD)又はビデオ・ホーム・システム(VHS)テーププレーヤ等からの入力テレビジョン信号を受信する。ビデオレコーダ150は、選択されたチャンネルからのテレビジョン信号をテレビ受像機105へ送信する。チャンネルは、視聴者によって手動で選択されるか、又は、予め視聴者によってプログラムされた記録装置によって自動的に選択される。或いは、チャンネルと映像番組は、視聴者の個人的な視聴履歴中の番組プロファイルからの情報に基づいて記録装置によって自動的に選択され得る。
【0022】
記録モードでは、ビデオレコーダ150は、入来無線周波数(RF)テレビジョン信号を復調し、ビデオレコーダ150内の記憶媒体若しくはビデオレコーダ150に接続された記憶媒体上に記録され蓄積されるベースバンドビデオ信号を生成する。再生モードでは、ビデオレコーダ150は、記憶媒体から視聴者によって選択された記憶されたベースバンドビデオ信号(即ち、番組)を読み出し、これをテレビ受像機105へ送信する。ビデオレコーダ150は、ディジタル信号を受信し、記録し、作用し、再生することができるタイプのビデオレコーダを含む。
【0023】
ビデオレコーダ150には、記録用テープを使用するタイプ、ハードディスクを使用するタイプ、半導体メモリを使用するタイプ、又は、その他の任意のタイプの記録装置を使用するタイプのビデオレコーダが含まれる。ビデオレコーダ150がビデオカセットレコーダ(VCR)である場合、ビデオレコーダ150は、磁気カセットテープへ入来テレビジョン信号を格納し、磁気カセットテープから入来テレビジョン信号を取り出す。ビデオレコーダ150がReplayTV(登録商標)レコーダ及びTiVO(登録商標)レコーダのようなディスクドライブに基づく装置であるとき、ビデオレコーダ150は、磁気カセットテープではなく、コンピュータ磁気ハードディスクとの間で、入来テレビジョン信号の格納及び取り出しを行う。更なる他の実施例では、ビデオレコーダ150は、ローカル読み書き(R/W)ディジタル多目的ディスク(DVD)又は読み書き(R/W)コンパクトディスク(CD−RW)との間で格納と取り出しを行う。ローカル記憶媒体は固定式(例えばハードディスクドライブ)でも、着脱可能式(例えばDVD、CD−RW)でもよい。
【0024】
ビデオレコーダ150は、視聴者によって操作される遠隔制御装置125からのコマンド(例えば、チャンネル・アップ、チャンネル・ダウン、音量アップ、音量ダウン、記録、再生、早送り(FF)、巻戻し等)を受信する赤外線(IR)センサ160を含む。テレビ受像機105は、画面110、赤外線(IR)センサ115、及び、1つ以上の手動制御部120(点線で示す)を含む従来通りのテレビ受像機である。IRセンサ115は、視聴者によって操作される遠隔制御装置125からのコマンド(例えば、音量アップ、音量ダウン、電源オン、電源オフ等)も受信する。
【0025】
尚、ビデオレコーダ150は、特定の種類の源からの特定の種類の入来テレビジョン信号を受信するとは限らない。上述のように、外部源は、ケーブルサービスプロバイダ、従来のRF放送アンテナ、衛星アンテナ、インターネット接続、又は、例えば、DVDプレーヤ又はVHSテーププレーヤのような他のローカル記憶装置でもよい。入来信号は、ディジタル信号、アナログ信号、インターネットプロトコル(IP)パケット、又は、その他の信号でもよい。
【0026】
本発明の原理を説明するための簡単さと明瞭性のため、以下の説明は、ビデオレコーダ150が(ケーブルサービスプロバイダから)クロースドキャプション・テキスト情報を含むアナログテレビジョン信号を受信する実施例に概ね関連する。それにもかかわらず、当業者は、本発明の原理がディジタルテレビジョン信号、ワイヤレス放送テレビジョン信号、ローカル記憶システム、MPEGデータを含むIPパケットの入来ストリーム等と共に使用するため容易に適応されうることを理解するであろう。
【0027】
更に、当業者は、本発明の原理が、音声からテキストへのコンバータからのテキスト、第三者源からのテキスト、抽出された映像テキストからのテキスト、埋め込み画面テキストからのテキスト等を含み、これらには限られない他のテキスト源と共に使用するため容易に適応されうることを理解するであろう。従って、「トランスクリプト」という用語は、例示的にクロースドキャプション・テキスト、音声からテキストへのコンバータからのテキスト、第三者源からのテキスト、抽出されたビデオテキストからのテキスト、埋め込み画面テキストからのテキスト等を含み、これらに限られない任意のテキスト源から発生するテキストファイルを意味するように定義される。
【0028】
図2は、本発明の一実施例による典型的なビデオレコーダ150をより詳細に示す図である。ビデオレコーダ150は、IRセンサ160、ビデオプロセッサ210、MPEG2符号化器220、ハードディスクドライブ230、MPEG2符号化器/復号化器240、及び、コントローラ250を含む。ビデオレコーダ150は、更に、映像ユニット260、テキスト要約作成器270、及びメモリ280を含む。コントローラ250は、ビューモード、記録モード、再生モード、早送り(FF)モード、巻戻しモード、及び、その他の類似機能を含むビデオレコーダ150の全体的な動作を指示する。コントローラ250は、更に、本発明の原理に従って、マルチメディア要約の作成、表示及び相互作用を指示する。
【0029】
ビューモードでは、コントローラ250は、ケーブルサービスプロバイダからの入来テレビジョン信号を、ビデオプロセッサ210によって復調及び処理させ、ビデオ信号をハードディスクドライブ230に格納して、若しくは、格納せずに、(又はハードディスクドライブ230からビデオ信号を取り出して、若しくは、取り出さずに)テレビ受像機105へ送信させる。ビデオプロセッサ210は、
MPEG2符号化器/復号化器240からの従来の信号、及び、メモリ280からの映像フレームを受信し、ベースバンドテレビジョン信号(たとえば、スーパー映像信号)をテレビ受像機105へ送信することが可能である。
【0030】
記録モードでは、コントローラ250は、入来テレビジョン信号をハードディスクドライブ230に格納させる。コントローラ250の制御下で、MPEG2符号化器220は、ケーブルサービスプロバイダから入来テレビジョン信号を受信し、ハードディスクドライブ230に格納するため受信したRF信号をMPEGフォーマットへ変換する。尚、ディジタルテレビジョン信号の場合、信号は、MPEG2符号化器220において符号化することなく、ハードディスクドライブ230上に直接格納される。
【0031】
再生モードでは、コントローラ250は、ハードディスクドライブ230に対して、格納されたテレビジョン信号(即ち、番組)を、MPEG2復号化器/NTSC符号化器240へ流し込む(ストリーミングする)よう命令する。MPEG2符号化器/復号化器240は、ハードディスクドライブ230からのMPEG2データを、例えば、ビデオプロセッサ210がテレビ受像機105へ送信するスーパー映像信号(S−Video)に変換する。
【0032】
尚、MPEG2符号化器220及びMPEG2符号化器/復号化器240のためのMPEG2標準は、例示のためだけに選択されている。本発明の他の実施例では、MPEG2符号化器及びMPEG2復号化器は、MPEG−1、MPEG−2、及び、MPEG−4標準のうちの少なくとも一つの規格、又は、一つ以上の他の種類の規格に準拠しうる。
【0033】
この適用例及び請求の範囲に記載された事項のため、ハードディスクドライブ230は、読み出し可能及び書き込み可能な任意の大容量記憶装置を含むように定義される。この読み書き可能な大容量記憶装置は、限定的ではなく、例示的に、読み書きディジタル多用途ディスク(DVD−RW)、書換可能CD−ROM、VCRテープ等のための従来の磁気ディスクドライブ及び光ディスクドライブを含む。実際、ハードディスクドライブ230は、ビデオレコーダ150に恒久的に埋め込まれるという従来の意味で、固定式である必要はない。そうではなく、ハードディスクドライブ230には、記録された映像番組を蓄積するためのビデオレコーダ150に専用の大容量記憶装置が含まれる。従って、ハードディスクドライブ230は、例えば、幾つかの読み書きDVD又は書換可能なCD−ROMを保持するジュークボックス装置(図示せず)のような付属周辺機器ドライブ又は取り外し可能な着脱式ディスクドライブ(内蔵型若しくは付属型)を含みうる。図2に概略的に示すように、この種の着脱式ディスクドライブは、書換可能なCD−ROMディスク235を収容し読み出すことが可能である。
【0034】
更に、本発明の有利な実施例によれば、ハードディスクドライブ230は、例えば、視聴者の家庭のパーソナルコンピュータ(PC)中のディスクドライブ、又は、視聴者のインターネットサービスプロバイダ(ISP)のサーバ上のディスクドライブを含む外部大容量記憶装置でもよく、ビデオレコーダ150は、ネットワーク接続(例えば、インターネットプロトコル(IP)接続)を介して、この外部大容量記憶装置にアクセスし制御し得る。
【0035】
コントローラ250は、ビデオプロセッサ210によって受信された映像信号に関連するビデオプロセッサ210からの情報を取得する。コントローラ250が、ビデオレコーダ150は映像番組を受信中であると判定すると、コントローラ250は、その映像番組が記録されるべきものであるとして既に選択されているものであるか否かを判定する。映像番組が記録されるべきものである場合、コントローラ250は、上述の方法で映像番組をハードディスクドライブ230上に記録させる。映像番組を記録する必要がない場合、コントローラ250は、上述の方法で、ビデオ番組をビデオプロセッサ210によって処理させテレビ受像機105へ送信させる。
【0036】
メモリ280は、ランダムアクセスメモリ(RAM)、又は、ランダムアクセスメモリ(RAM)と読み出し専用メモリ(ROM)の組み合わせにより構成できる。メモリ280は、フラッシュメモリのような不揮発性ランダムアクセスメモリ(RAM)でもよい。ビデオレコーダ150の他の有利な実施例では、メモリ280は、ハードディスクドライブ(図示せず)といった大容量記憶データ装置でもよい。メモリ280は、読み書きDVD又は書換可能なCD−ROMを読み出す付属型周辺機器ドライブ又は着脱式ディスクドライブ(内蔵型でも付属型でもよい)を含みうる。図2に概略的に示すように、この種の着脱式ディスクドライブは、追記型(書換可能な)CD−ROMディスク285を収容し読み出すことが可能である。
【0037】
映像番組がハードディスクドライブ230に記録されているとき(或いは、代替的に、映像番組がハードディスクドライブ230に記録された後)、コントローラ250は、テキスト要約作成器270を使用して記録映像番組のテキスト要約を取得する。テキスト要約作成器270は、発明の名称が”METHOD AND APPARATUS FOR THE SUMMARIZATION AND INDEXING OF VIDEO PROGRAMS USING TRANSCRIPT INFORMATION”である米国特許出願明細書(書類番号PHA701137)に記載されているような上述の映像番組要約方法及び装置を使用する。テキスト要約作成器270は、映像番組を、映像信号/音声信号/データ信号として受信する。テキスト要約作成器270は、映像信号/音声信号/データ信号から、番組要約、内容のテーブル、及び、映像番組の番組索引を作成する。テキスト要約作成器270は、テキストに対応する映像の選択されたキーフレームを識別するため、テキストの各ラインに関連したタイムスタンプを使用する。
【0038】
マルチメディア要約は、映像/音声/テキストの要約である。コントローラ250は、映像番組の内容を要約する情報を表示するマルチメディア要約を作成する。コントローラ250は、テキスト要約作成器270によって作成された番組要約を使用し、適当なビデオ画像を追加することによって映像番組のマルチメディア要約を作成する。マルチメディア要約は、(1)テキスト、(2)単一の映像フレームを含む静止ビデオ画像、(3)映像フレームの系列により構成され(映像クリップ若しくは映像セグメントと呼ばれる)動画像、(4)音声、並びに、(5)これらの任意の組合せ、を表示可能である。
【0039】
コントローラ250は、映像ユニット260を用いて、要約されるべき映像番からビデオ画像を獲得する。映像ユニット260は、1999年7月9日に出願された、発明の名称が”METHOD AND APPARATUS FOR LINKING A VIDEO SEGMENT TO ANOTHER SEGMENT OR INFORMATION SOURCE”である米国特許出願第09/351,086号明細書に記載された、上述の映像セグメントを連結する方法及び装置を使用する。
【0040】
コントローラ250は、マルチメディア要約を作成するため使用される適当なビデオ画像を識別しなければならない。本発明の有利な一実施例は、マルチメディア要約を作成するため使用されるべき適当なビデオ画像を識別することができるコンピュータソフトウェア300を含む。図3は、本発明のコンピュータソフトウェア300を収容するメモリ280の選択された一部分の説明図である。メモリ280は、オペレーティングシステム・インタフェース・プログラム310と、ドメイン識別アプリケーション320と、トピック・キュー識別アプリケーション330と、サブトピック・キュー識別アプリケーション340と、音声・映像テンプレート識別アプリケーション350と、マルチメディア要約記憶場所360と、話者視覚化アプリケーション370と、を含む。
【0041】
コントローラ250及びコンピュータソフトウェア300は、一体として、本発明を実行することができるマルチメディア要約作成器を構成する。メモリ280に格納されたコンピュータソフトウェア300中の命令の指示に従って、コントローラ250は、映像番組のマルチメディア要約を作成し、マルチメディア要約をマルチメディア要約記憶場所360に格納し、視聴者からの要求時に格納されたマルチメディア要約を再生する。オペレーティングシステム310は、コンピュータソフトウェア300の動作と、コントローラ250のオペレーティングシステムを協調させる。
【0042】
マルチメディア要約を作成するため、コントローラ250は、最初に、記録映像番組のテキスト要約を獲得するため、テキスト要約作成器270へアクセスする。コントローラ250は、次に、マルチメディア要約を作成するためにテキスト要約に組み込むため選択されるべき適当なビデオ画像を識別する。これを行うため、コントローラ250は、はじめに、映像番組のタイプ(ドメイン、カテゴリー、或いは、ジャンルと称される)を識別する。たとえば、ドメイン(又は、カテゴリー若しくはジャンル)は、トークショー、ニュース番組などである。以下の説明中、用語ドメインを使用する。
【0043】
ソフトウェア300内のドメイン識別アプリケーション320は、ドメインのタイプのデータベース(ドメインデータベース)を含む。ドメインデータベースは、ドメインデータベースに保持されるドメインのタイプ毎の識別用特徴を格納する。コントローラ250は、要約される映像番組のタイプを識別するため、ドメイン識別アプリケーション320にアクセスする。ドメイン識別アプリケーション320は、ドメインの各タイプの識別用特徴を、要約中の映像番組の特徴と比較する。この比較の結果を用いることにより、ドメイン識別アプリケーション320は、映像番組の領域を識別する。
【0044】
コントローラ250は、次に、映像番組のトピックと関連した(トピック・キューと称される)語若しくは句(語句)を識別する。たとえば、トークショー映像番組の場合のトピック・キューは、語「最初のゲスト」若しくは語「次のゲスト」である。同様に、ニュース番組映像番組用のトピック・キューは、語「から中継」、或いは、語「次の話題は」である。トピック・キューとして選択された特別の語若しくは句は、映像番組中の変化ポイント(すなわち、トピックスの変化)を指定するため選ばれる。これにより、映像番組を、種々のトピックスを扱う部分に分割できるようになる。
【0045】
ソフトウェア300のトピック・キュー識別アプリケーション300は、トピック・キューのデータベース(トピック・キュー・データベース)を含む。トピック・キュー・データベースは、ドメインデータベースに格納されたドメインのタイプ毎にトピック・キューを収容する。コントローラ250は、要約されている映像番組内のトピック・キューを識別するためトピック・キュー識別アプリケーション330にアクセする。トピック・キュー識別アプリケーション320は、トピック・キュー・データベース内の各トピック・キューを要約されている映像番組のテキスト要約と比較する。
【0046】
トピック・キューが見つかった場合、コントローラ250は、トピック・キューと関連した音声・映像セグメント(音声・映像テンプレート、又は、視聴覚テンプレート)を識別するため音声・映像テンプレート識別アプリケーション350にアクセスする。トークショー映像番組内の「最初のゲスト」に対する適当な音声・映像テンプレートは、ゲストが登場する音声・映像セグメントである。「最初のゲスト」の同一性は、テキスト内で示されたゲストの名前から獲得される。たとえば、トークショーのホスト役が、「最初のゲストは、かけがえのない、Dolly Partonです。」と言うとき、トピック・キュー識別アプリケーション330は、単語「最初のゲスト」をトピック・キューとして識別する。最初のゲストのDolly Partonの同一性は、テキスト要約から獲得される。
【0047】
映像音声テンプレート識別アプリケーション350は、マルチメディア要約へ追加するため選択されるべき音声・映像テンプレートとして、Dolly Partonの音声・映像セグメントを識別し獲得しなければならない。紹介後の数秒のうちに、Dolly Partonは、ステージに登場する。彼女の顔が現れ、ビデオ画像の一部を占領する。以下で詳述するように、音声・映像テンプレート識別アプリケーション350は、Dolly Partonの顔の画像を識別し、Dolly Partonの顔の画像を含む音声・映像テンプレートを抽出し、この音声・映像テンプレートをマルチメディア要約に追加する。
【0048】
音声・映像テンプレート識別アプリケーション350は、次のようにDolly Partonの顔の画像を識別する。Dolly Partonの紹介直後に現れたビデオ画像から、音声・映像テンプレート識別アプリケーション350は、トークショーのホスト役(或いは、ミュージシャンなどのトークショーのレギュラー出演者)の顔画像以外の人物の顔画像を選択する。音声・映像テンプレート識別アプリケーション350は、その人物の画像がDolly Partonの画像であると仮定する。
【0049】
この仮定は、音声・映像テンプレート識別アプリケーション350がDolly Partonの紹介直後に映像に表れた観客の画像を獲得した場合、間違っている。したがって、数分経過後に、最初に選択された画像内の人物の同一性を検査することによって、この仮定を確認することが必要である。これは、顔画像、声、ゲストのネームプレートのような識別用特徴、或いは、その他の同様の識別用特徴を検査することによって行われる。
【0050】
Dolly Partonは、トークショーの10乃至12分の間中登場するので、初期選択画像が実際にDolly Partonの画像であるかどうかを確かめるため、ゲストの画像を解析する時間がある。後で行われた検査によって、最初の仮定は誤りであり、、初期選択画像はDolly Partonの画像ではないということが判明した場合、画像をDolly Partonの画像で置き換えることによって訂正がなされる。
【0051】
本発明の他の有利な一実施例によれば、著名人の顔画像のデータベース(図示せず)が音声・映像テンプレート識別アプリケーション350と共に使用される。映像からの人物(たとえば、トークショーのゲスト)の顔画像は、データベース内の各著名人の顔画像と比較される。顔マッチングは、主成分分析(PCA)技術、若しくは、その他の同等の技術を使用して実現され得る。一致していることが判明した場合、その人物は、誰であるかが確認される。一致する顔画像が見つからない場合、その人物の顔画像は著名人データベースに存在しない。その場合、Dolly Partonを識別するため使用された上述の手続が、この人物を識別するため使用される。
【0052】
著名人データベースに存在しない有名人が識別された後、この有名人はデータベースに追加される。著名人データベースの内容は、人物をデータベースに追加することによって、或いは、データベースから人物を削除することによって、絶えず変更される。このようにして、著名人データベース内の著名人のリストは、常に最新の状態に保たれる。
【0053】
映像セグメント内の顔を検出し識別するその他の方法は、〔文献〕V. Vilaplana, F. Marques, P. Salembier and . Garrid, ”Region−Based Segmentation and Tracking of Human Faces”, The 9th European Signal Processing Conference EUSIPCO−98, Rhodes (1998)、及び、〔文献〕S.Satoh, Y. Nakamura & T. Kanade, ”Name−It: Naming and Detecting Faces in News Videos”, IEEE Multimedia, Volume6(1), pp.22−35(1999)に記載されている。
【0054】
他のアプリケーション例では、スポーツ番組用の音声・映像テンプレートは、(1)ある時間間隔に亘る事前に指定された全体的な動き、又は、(2)動きのタイプの系列により構成され得る。たとえば、「サッカー試合」映像番組におけるトピック・キューは、単語「ゴール」或いは「1点目のゴール」である。トピック・キューが識別された後、音声・映像テンプレート識別アプリケーション350は、マルチメディア要約に追加するため選択されるべき音声・映像テンプレートとして、1点目のゴールのシーンの音声・映像クリップを識別し獲得する必要がある。
【0055】
ゴールが得点されたときを識別するため、音声・映像テンプレート識別アプリケーション350は、最初に、高速モーションでゴールを検出し、次に、スローモーションでゴールを検出する。ゴールの時間的位置が見つけられたとき、ゴールが得点された時間間隔をカバーする音声・映像クリップが抽出される。たとえば、音声・映像クリップは、ゴールが得点される5秒前のポイントから、ゴールが得点された5秒後のポイントまで達する。このようにして、スポーツ番組のマルチメディア要約は、ゴールが得点された番組セグメントの再生の系列により構成される。
【0056】
他の例において、「ニュースショー」映像番組内のトピック・キューは、「中継」である。ニュースショー映像番組内の中継トピック・キューに対する適当な音声・映像テンプレートは、中継リポートが行われている場所の音声・映像セグメントである。或いは、音声・映像テンプレートは、中継リポートを行っているリポーターの音声・映像セグメントである。
【0057】
ニュース番組のアンカーマンが「ラスベガスからの中継です。」というとき、トピック・キュー識別アプリケーション350は、単語「中継」をトピック・キューとして識別し、音声・映像テンプレート識別アプリケーション350は、マルチメディア要約に追加するため選択されるべき音声・映像テンプレートとして、ラスベガスの音声・映像セグメントを識別する。
【0058】
音声・映像テンプレート識別アプリケーション350は、音声・映像テンプレートの組を、特定のドメインタイプに対するトピック・キュー・データベース内に含まれるトピック・キューの組毎に関連付ける。コントローラ250及び音声・映像テンプレート識別アプリケーション350は、当該トピック用のマルチメディア要約に組み入れられるべき適当な音声・映像テンプレートを獲得するため映像ユニット260にアクセスする。
【0059】
音声・映像テンプレートは、映像信号と音声信号の両方を含む。しかし、一部のアプリケーションでは、音声・映像テンプレートは、一方の信号(すなわち、音声信号と映像信号の両方ではなく、いずれか一方の信号)だけを含む場合がある。1種類の信号しか含まない音声・映像テンプレート用の動作原理は、映像信号と音声信号の両方の信号を含む音声・映像テンプレートに対する動作原理と同じである。
【0060】
コントローラ250及び音声・映像テンプレート識別アプリケーション350が、適当な音声・映像テンプレートを識別し獲得した後、コントローラ250は、トピック、及び、対応した音声・映像テンプレートをマルチメディア要約へ追加する。マルチメディア要約中のトピック・キューの場所は、マルチメディア要約内のエントリー・ポイントとなるように定義される。エントリー・ポイントは、マルチメディア要約内で、マルチメディア要約を閲覧する視聴者が直接アクセスすることができる場所である。視聴者は、マルチメディア要約内の全てのエントリー・ポイントのリストへアクセスするためのユーザ・インタフェースが提供される。視聴者がマルチメディア要約の特定のトピックに関心をもつとき、視聴者は、マルチメディア要約内のトピックを、トピックのエントリー・ポイントにアクセスすることによって、表示させることができる。
【0061】
コントローラ250がトピックを識別した後、コントローラ250は、トピック中のサブトピックと関連した(サブトピック・キューと称される)単語若しくは句(語句)を識別する。たとえば、トークショー映像番組内の「最初のゲスト」というトピック・キューに対するサブトピック・キューは、語「新作映画」或いは語「新著」である。サブトピックは、仕事の計画や「最初のゲスト」の人生における興味深いエピソードなどを指す。サブトピック・キューとして選択された特定の語句は、トピック内での変化ポイント(すなわち、サブトピックの変化)を指定するため選定される。これにより、トピックを異なるサブトピックを取り扱う部分に分割できるようになる。
【0062】
ソフトウェア300内のサブトピック・キュー識別アプリケーション340は、サブトピック・キューのデータベース(サブトピック・キュー・データベース)を含む。サブトピック・キュー・データベースは、トピック・キュー・データベースに蓄積されたトピック・キューのタイプ毎にサブトピック・キューを収容する。コントローラ250は、要約しているトピック内のサブトピックを識別するため、サブトピック・キュー識別アプリケーション340にアクセスする。サブトピック・キュー識別アプリケーションは、サブトピック・キュー・データベース内の各サブトピック・キューを要約されているトピックのテキスト要約と比較する。
【0063】
サブトピック・キューが見つかったとき、コントローラ250は、サブトピック・キューと関連した音声・映像テンプレートを識別するため、音声・映像テンプレート識別アプリケーション350にアクセスする。たとえば、トークショー映像番組における「新作映画」サブトピック・キュー用の音声・映像テンプレートは、新作映画の題名を表示する静止ビデオ画像である。あるいは、トークショー映像番組における「新作映画」サブトピック・キュー用の音声・映像テンプレートは、新作映画の音声・映像セグメント(すなわち、クリップ)でもよい。
【0064】
トークショーのホスト役が、「次に、Tom Hankの新作映画からのクリップ(1場面)をお見せします。」と言うとき、サブトピック・キュー識別アプリケーション340は、単語「新作映画」をサブトピック・キューとして識別し、音声・映像テンプレート識別アプリケーション350は、マルチメディア要約に追加するため選択されるべき音声・映像テンプレートとして、新作映画の音声・映像セグメントを識別する。
【0065】
音声・映像テンプレート識別アプリケーション350は、音声・映像テンプレートの組を、特定のトピックのタイプのためのサブトピック・キュー・データベースに収容されているサブトピック・キューの組毎に関連付ける。コントローラ250及び音声・映像テンプレート識別アプリケーション350は、サブトピック用のマルチメディア要約に組み入れられるべき適当な音声・映像セグメントを獲得するため、像ユニット260にアクセスする。
【0066】
コントローラ250及び音声・映像テンプレート識別アプリケーション350が適当な音声・映像テンプレートを識別し取得した後、コントローラ250は、サブトピック・キュー及び対応した音声・映像テンプレートをマルチメディア要約に追加する。トピック・キューの場合と同様に、マルチメディア要約内のサブトピック・キューの場所は、マルチメディア要約内のエントリー・ポイントになるように定義される。視聴者がマルチメディア要約内の特定のサブトピックに関心を持つ場合、視聴者は、サブトピックのエントリー・ポイントにアクセスすることによって、マルチメディア要約内のサブトピックを表示させ得る。
【0067】
コントローラ250は、映像番組のドメインと関連したトピック・キュー及びサブトピック・キューを識別するため上述の処理を継続する。この処理が継続するとき、コントローラ250は、映像番組のマルチメディア要約を作成する。コントローラ250は、マルチメディア要約を、メモリ280のマルチメディア要約記憶場所360に格納する。コントローラ250は、一つ以上のマルチメディア要約を、長期記憶のためハードディスクドライブ230へ転送する。
【0068】
マルチメディア要約を作成する処理は、図4を参照することによって、さらに明瞭に理解できる。図4は、本発明の有利な一実施例の方法の動作を説明するフローチャート400を表わす。フローチャート400に記載された処理ステップは、コントローラ250で実行される。コントローラ250は、テキスト要約作成器270に、上述の方法で映像番組のテキストを要約させる(処理ステップ405)。コントローラ250は、次に、映像番組のドメインを識別する(処理ステップ410)。続いて、コントローラ250は、映像番組の識別されたドメインと関連したトピック・キューを見つけるため、映像番組のテキストをトピック・キューのデータベースと比較する(処理ステップ415)。
【0069】
トピック・キューが見つかった場合、コントローラ250は、トピック・キューに対して関連した音声・映像テンプレートを取得し、音声・映像テンプレートをこのトピック・キューに連結する。コントローラ250は、トピック・キュー及び関連した音声・映像テンプレートを、マルチメディア要約に保存する(処理ステップ420)。
【0070】
コントローラ250は、映像番組の識別されたトピック・キューと関連したサブトピック・キューを見つけるため、映像番組のテキストを、サブトピック・キューのデータベースと比較する(処理ステップ425)。サブトピックが見つけられたとき、コントローラ250は、サブトピック・キューに対する関連した音声・映像テンプレートを獲得し、音声・映像テンプレートをサブトピック・キューに関連付ける。コントローラ250は、サブトピック・キュー及び関連した音声・映像テンプレートを、マルチメディア要約に保存する(処理ステップ430)。
【0071】
コントローラ250は、次のサブトピック・キュー又は次のトピック・キューを探索し続ける(判定ステップ435)。コントローラ250が、これ以上のサブトピック・キュー若しくはトピック・キューは存在しない、と判定した場合、又は、映像番組の終わりに到達した場合、この要約処理が終了する。
【0072】
コントローラ250が次のキューを見つけたとき、コントローラ250は、次のキューがサブトピック・キューであるかどうかを判定する(判定ステップ440)。次のキューがサブトピック・キューである場合、制御は処理ステップ430へ進み、サブトピック・キュー及びその関連した音声・映像テンプレートがマルチメディア要約へ追加される。次のキューがサブトピック・キューではない場合、次のキューはトピック・キューである。制御は処理ステップ420へ進み、トピック・キュー及びその関連した音声・映像テンプレートがマルチメディア要約へ追加される。このようにして、マルチメディア要約がトピック及びサブトピックによって組み立てられる。
【0073】
図5は、本発明の視聴者対話型マルチメディア要約の有利な一実施例の典型的な表示ページの説明図である。図5は、マルチメディア要約全体のエントリー・ポイントが1ページに表示される様子を示している。たとえば、図5に示されたページがトークショー映像番組のマルチメディア要約を表わしているとする。A画像520は、最初のゲストの顔を表し、B画像540は、2人目のゲストの顔を表わし、C画像560は、3人目のゲストの顔を表わす。テキストセクション510は、最初のゲスト520が話題にしたサブトピックのリストを含む。図5に示された例の場合に、これらのサブトピックは、映画、新CD、及び、新居である。同様に、テキストセクション530は、2人目のゲスト540が話題にしたサブトピックのリストを収容し、テキストセクション550は、3人目のゲスト560が話題にしたサブトピックのリストを収容する。
【0074】
視聴者は、マルチメディア要約による表示のため、三つのテキストリスト510、530、550のいずれかのうちのいずれかのサブトピックを選択し得る。各サブトピックがメニュー項目として順番に強調表示されるとき、視聴者は、一つのサブトピックを選択するための信号を送信するため、遠隔制御部125を用いて、表示したいと思うサブトピックを指定することができる。或いは、視聴者は、映像表示システム内に設けられたコンピュータマウス(図示せず)のようなポインティングデバイスを用いて、望ましいサブトピックを指定することが可能である。
【0075】
視聴者が特定のサブトピックを選択するとき、そのサブトピックに対する要約は、アクセス対象の(有効な)要約580として区別された画面の一部分に表示される。サブトピックに関連した音声・映像クリップは、映像再生590として区別された画面の一部分に同時に再生される。たとえば、サブトピックが「映画」である場合、音声・映像クリップは、映画からの1場面であるかもしれない。サブトピックが「サッカー試合」である場合、音声・映像クリップは、ゲーム中にゴールが得点された場面であるかもしれない。アクセス対象の要約580は、視聴者によって選択されたトピックと、このトピックに関連したサブトピックの要約を表示する。視聴者が新しいトピック又は新しいサブトピックを選択した場合、アクセス対象の要約580に表示される要約は、新たに選択されたトピック又はサブトピックに関連したトピック又はサブトピックの要約を反映する。
【0076】
テキストセクション570は、映像番組の全トピックのリストを収容する。たとえば、トークショー映像番組の場合、テキストセクション570は、トークショー映像番組の全トピックのリストを収容する。本例の場合、テキストセクション570内のリスト中の3項目は、3人のゲストの名前である。テキストセクション570に列挙された他の項目は、トークショー映像番組の他のトピック(たとえば、ショーの冒頭のホスト役の独白)に関連する。視聴者は、テキストセクション570に一覧された任意のトピックを表示のために選択することができる。トピックが選択されたとき、トピックに関連した音声・映像クリップは、映像再生590として示された画面の一部分で再生される。
【0077】
このマルチメディア要約の表示モードは、マルチメディア要約の表示用の個々の部分を選択するため視聴者による相互作用を必要とする。マルチメディア要約の別の表示モードは、通し再生モードである。この通し再生モードの場合、マルチメディア要約は、映像番組の先頭から始まり、視聴者による相互作用を伴うことなく、再生され続ける。視聴者は、表示用のトピック若しくはサブトピックを選択することによって、この通し再生モードを停止させるため、何時でも介入することができる。
【0078】
図6は、本発明の有利な一実施例による話者視覚化ページ600の説明図である。話者視覚化ページ600は、話をしている各人物と、話者が話をしている時間とを識別するマルチメディア要約に含まれる情報を使用する。図6に示されるように、この情報は、棒グラフ(バーチャート)の形式でグラフィック表示される。有利な一実施例において、各話者は別々の行に表示される。各話者(コマーシャルのカテゴリーを含む)の同一性は、ページ600の左側の列に示される。
【0079】
たとえば、図6に示された話者視覚化ページ600は、トークショー番組の説明図である。トークショーのホストは、カテゴリー610に特定され、トークショーのミュージシャンはカテゴリー620に特定されている。トークショーの1人目のゲスト(第1ゲスト)はカテゴリー630に特定される。コマーシャルメッセージのカテゴリーはカテゴリー640である。トークショーの2人目のゲスト(第2ゲスト)はカテゴリー650に特定され、3人目のゲスト(第3ゲスト)はカテゴリー660に特定されている。
【0080】
特定の話者が話をしている時間間隔は、話者カテゴリーの右側の水平方向の領域に置かれた矩形ボックスで表現されている。たとえば、トークショーのホストカテゴリー610の右側にある矩形ボックスは、トークショーのホストがショーの中で話をしている個々の時間セグメントを表現する。同様に、特定のカテゴリーの右側にある矩形ボックスは、その特定のカテゴリーの人物が話をしているときを表わす。コマーシャルカテゴリー610の右側の矩形ボックスは、コマーシャルメッセージが表示されているときの時間セグメントを表現する。
【0081】
図6に示された例の場合に、トークショーのホスト610は、最初に話をして、トークショーを紹介する。後の時点で、トークショーのミュージシャン620は、ホスト610が黙っているときに話をする。次に、トークショーのホスト610は、ミュージシャン620が沈黙している間に話をしている。本例の場合、ミュージシャン620は3回話をしている。
【0082】
トークショーのホスト610が最初のゲスト630を紹介した後、最初のゲスト630は、トークショーのホスト610と交互に発話する。話者視覚化ページ600は、最初のコマーシャル640が表示される時間セグメントを表示する。
【0083】
1回目のコマーシャル640が表示された後、トークショーのホスト610は、2人目のゲスト650を紹介する。トークショーのホスト610及び2人目のゲスト650は、2回目のコマーシャルが始まるまで、交互に発話する。同様に、トークショーのホスト610は、その後、3人目のゲスト660を紹介し、3人目のゲスト660と話をする。
【0084】
話者視覚化ページ600は、このようにして、ショーの全体を通じて、発話中の人物と、その人物が発話しているときを、表示する能力を備えている。視聴者は、話者視覚化ページ600に表示された時間セグメントの中から、マルチメディア要約によって表示させる時間セグメントを選択することができる。視聴者は、各時間セグメントがメニュー項目として順番に強調表示される間に、一つの時間セグメントを選択する信号を送信するため遠隔制御器125を用いて、表示されるべき望ましい時間セグメントを指定することができる。あるいは、視聴者は、映像表示システムに装備されたコンピュータマウス(図示しない)のようなポインティングデバイスを使用して、望ましい時間セグメントを指定することが可能である。
【0085】
視聴者が望ましい時間セグメントを指定するとき、マルチメディア要約は、ショーの中でその望ましい時間セグメントに関係した部分を再生する。たとえば、視聴者は、3人目のゲスト660が話をした内容を見たいときに限り、映像番組のその部分だけを視聴するため、3人目のゲスト600に関連した時間セグメントだけを選択するであろう。
【0086】
話者視覚化ページ600は、ホスト610、ミュージシャン620、1人目のゲスト630、2人目のゲスト640、及び、3人目のゲスト650の名前を表示する能力を備えている。現在の話者の同一性はトランスクリプトから見つけることができる。新しい話者セクションは、トランスクリプト中に2重矢印が現れたときに開始する。話者の名前は、2重矢印の直後に現れ、その後にコロン記号が続く。
【0087】
名前が存在しない場合、現在のゲストが話者であると仮定される。ゲストが紹介された場合、ゲストの名前は話者として返される。ゲストの紹介がなければ、ゲストに対する総称用語(すなわち、単語「ゲスト」)が話者として返される。
【0088】
話者視覚化ページ600は、映像番組のマルチメディア要約にアクセスするための強力なツールである。話者視覚化ページ600は、視聴者が、特定の話者に関連した映像番組の時間セグメントを選択することによって、映像番組の望んでいる部分に、素早くジャンプし、閲覧できるようにする。
【0089】
コントローラ250及び話者視覚化アプリケーション370は、一体として、本発明を実現する能力を備えた話者視覚化表示ユニットを構成する。メモリ280に格納された話者視覚化アプリケーション370内の命令の指示に基づいて、コントローラ250は、選択された映像番組の選択されたマルチメディア要約にアクセスし、視聴者による話者視覚化ページ600内の関連した時間セグメントの選択に応じて映像番組の選択された部分を再生する。
【0090】
上記例において、話者視覚化ページ600は、各話者が話をしているときを識別した。これは、話者視覚化ページ600の一つのモードである。話者視覚化ページ600は、付加的な動作モードを実現することができる。ある付加的な動作モードにおいて、話者視覚化ページ600は、各人物の顔が画面に登場するときを識別する。別の付加的な動作モードでは、話者視覚化ページ600は、各トピック又はサブトピックが話題にされているときを識別する。更に別の付加的な動作モードでは、話者視覚化ページ600は、番組のトランスクリプトの要素を識別する。その他のタイプのカテゴリーも表示のため選択され得る。
【0091】
図6に示された話者視覚化ページ600は、情報が2次元形式でアクセスされ表示される様子を示している。第1の次元は、話をする人物(又は、人物の画像、話し合われているトピックなど)によって表わされ、第2の次元は時間である。尚、本発明の原理は、情報を3次元形式で表示するためにも使用可能である。3次元表現(図示せず)は、3種類の情報(たとえば、話者、トピック及び時間)を、3次元棒グラフ形式で同時に表示するため使用される。また、二つ以上の話者視覚化ページ600を使用して4種類上の情報を同時に表示してもよい。
【0092】
本発明のマルチメディア要約は、映像番組の中で話題にされた製品及びサービスを注文するための方法及び装置と組み合わせて使用することができる。たとえば、視聴者は、トークショー映像番組で話題になった書籍を購入したい場合がある。製品及びサービスは、発明の名称が”SYSTEM AND METHOD FOR ORDERING ONLINE UTILIZING A DIGITAL TELEVISION RECEIVER”である米国特許出願明細書(書類番号PHA701071)に記載された、上記の方法及び装置を用いて直接注文してもよい。
【0093】
また、本発明のマルチメディア要約は、視聴者の興味に関する付加情報を取得する方法及び装置と組み合わせて使用することも可能である。たとえば、視聴者が、まもなく公開予定の新作映画を解説するサブトピックを選択した場合、この視聴者の問い合わせは、将来の参考のため記録される。マルチメディア要約は、映画が公開されたときに視聴者へ通知し、近隣の映画館の上映時間及びチケット価格を提供する。この通知は、関連した番組の要約に添付してもよい。或いは、この通知は、電子メール、若しくは、類似した通信リンクを用いて視聴者へ送信してもよい。この通知は、パーソナルコンピュータ、携帯情報端末(PDA)、或いは、その他の同様の通信機器に可聴性アラーム(たとえば、ビープ音)を発生させてもよい。
【0094】
イベント照合エンジンが、近隣地域内で行われるイベントを見つけるために使用され得る。たとえば、トークショー番組中に、俳優Kevin Spaceyが、現在、”American Beauty”という名前の映画に出演中である、と言ったとする。視聴者がサブトピック”American Beauty”を選択すると、マルチメディア要約は、ある期間(たとえば、数ヶ月間)に亘って、他の番組(たとえば、新番組)、又は、地元のウェブサイト上で、映画”American Beauty”に関する情報を検索するため、ユーザの興味の指標を使用することが可能である。
【0095】
映画”American Beauty”の上映時間及び料金に関する付加情報が見つけられたとき、マルチメディア要約は、電話番号1−800−FILM−777をオーバーレイすることができ、映画が有料視聴テレビで放送予定である旨を視聴者に通知することができ、近隣の劇場における映画の上映時間及び料金に関する情報を自動的に電子メール送信し、若しくは、表示することが可能である。鑑賞チケットは、上述の方法を用いて直接注文することもできる。
【0096】
本発明のマルチメディア要約は、視聴者が長期間に亘って関心のある付加情報を見つけるため、マルチメディア要約からトピック及びサブトピックを使用できるようにする。マルチメディア要約は、視聴者が関心をもつ情報に関して、積極的に動作し検索する状態を維持する。第1の番組のマルチメディア要約に基づいて見つけ出された新たな付加情報は、第2の番組が第1の番組に類似したトピック、サブトピック、又は、キーワードを持つ場合、第2の番組のマルチメディア要約に添付させてもよい。
【0097】
本発明を詳細に説明したが、当業者は、最広義による本発明の精神及び範囲を逸脱することなく、種々の変更、置換及び代替をなし得ることがわかる筈である。
【図面の簡単な説明】
【図1】
映像表示システムの一例の説明図である。
【図2】
図1に示された映像表示システムの一例に組み込まれる映像番組の視聴者対話型マルチメディア要約を作成するシステムの有利な一実施例の説明図である。
【図3】
視聴者対話型マルチメディア要約の有利な一実施例と共に使用されるコンピュータソフトウェアの説明図である。
【図4】
映像表示システムの一例における視聴者対話型マルチメディア要約の有利な一実施例の動作を説明するフローチャートである。
【図5】
映像番組の視聴者対話型マルチメディア要約にアクセスする本発明の有利な一実施例の表示ページの一例の説明図である。
【図6】
映像番組の視聴者対話型マルチメディア要約にアクセスする本発明の有利な一実施例の典型的な話者視覚化ページの説明図である。

Claims (19)

  1. 映像番組を表示する能力を備えた映像表示システムにおいて利用され、該映像番組の少なくとも一部分を表示するため該映像番組のマルチメディア要約にアクセスするシステムであって、
    該映像番組の少なくとも一つのトピック、及び、該映像番組の該少なくとも一つのトピックに対応した少なくとも一つのエントリー・ポイントを識別する該マルチメディア要約からの情報を表示ページに表示する能力を備えているマルチメディア要約作成器を具備し、
    該マルチメディア要約作成器は、視聴者による該映像番組の該少なくとも一つのトピックに対応した該エントリー・ポイントの選択に応答して、該映像番組の該少なくとも一つのトピックに対応した該映像番組の一部分を表示する能力を備えている、
    システム。
  2. 該映像番組の該少なくとも一つのトピックの該少なくとも一つのサブトピック、及び、該映像番組の該少なくとも一つのトピックの該少なくとも一つのサブトピックに対応した少なくとも一つのエントリー・ポイントを識別する該マルチメディア要約からの情報を表示ページに表示する能力を備え、
    該マルチメディア要約作成器は、視聴者による該映像番組の該少なくとも一つのトピックの該サブトピックに対応した該エントリー・ポイントの選択に応答して、該映像番組の該少なくとも一つのトピックの該サブトピックに対応した該映像番組の一部分を表示する能力を備えている、
    請求項1記載のシステム。
  3. 該映像番組中の音声・映像セグメントの少なくとも一つのカテゴリー、及び、音声・映像セグメントの該少なくとも一つのカテゴリーが該映像番組中で出現する時間を識別する該マルチメディア要約からの情報を話者視覚化ページに表示する能力を備えた話者視覚化表示ユニットを更に有し、
    該話者視覚化表示ユニットは、視聴者による音声・映像セグメントの該少なくとも一つのカテゴリーが該映像番組中で出現する時間の選択に応答して、該映像番組の該少なくとも一部分を表示する能力を備えている、
    請求項1又は2記載のシステム。
  4. 音声・映像セグメントの該少なくとも一つのカテゴリーは、発話中の人物、コマーシャルメッセージ、顔が表示されている人物、トピック、サブトピック、及び、該映像番組のトランスクリプトの要素のうちの一つにより構成される、請求項3記載のシステム。
  5. 該話者視覚化表示ユニットは、
    メモリに接続され該メモリに保持されたコンピュータソフトウェア命令を実行する能力を備え、該話者視覚化ページを表示する能力を備え、視聴者から音声・映像セグメントの該少なくとも一つのカテゴリーが該映像番組中に出現する時間の選択を受ける能力を備え、視聴者による該選択に応答して、音声・映像セグメントの該少なくとも一つのカテゴリーを表わす該映像番組の該少なくとも一部分を表示する能力を備えているコントローラを、
    有する、
    請求項3記載のシステム。
  6. 該話者視覚化表示ユニットは、該映像番組中の各話者、及び、該映像番組中の各話者が発話しているときを表わす複数の時間セグメントを識別する該マルチメディア要約からの情報を話者視覚化ページに表示する能力を備え、
    該話者視覚化表示ユニットは、視聴者による時間セグメントの選択を受ける能力を備え、視聴者から受けた該選択に応答して、該選択された時間セグメント中に発話している話者を表わす該映像番組の一部分を表示する能力を備えている、請求項3記載のシステム。
  7. 該マルチメディア要約作成器は、視聴者によって選択された少なくとも一つのトピックを記録する能力を備え、該少なくとも一つのトピックに関係した付加情報を見つける能力を備え、該視聴者に該付加情報を通知する能力を備えている、請求項1記載のシステム。
  8. 映像番組の少なくとも一部分を表示するため該映像番組のマルチメディア要約にアクセスする請求項1乃至7のうちいずれか一項記載のシステムを含む、映像番組を表示する能力を備えた映像表示システム。
  9. 映像番組を表示する能力を備えた映像表示システムにおいて利用され、該映像番組の少なくとも一部分を表示するため該映像番組のマルチメディア要約にアクセスする方法であって、
    該映像番組の少なくとも一つのトピックを識別する該マルチメディア要約からの情報を表示ページに表示する手順と、
    該映像番組の該少なくとも一つのトピックに対応した少なくとも一つのエントリー・ポイントを該表示ページに表示する手順と、
    視聴者による該映像番組の該少なくとも一つのトピックに対応した該エントリー・ポイントの選択を受ける手順と、
    該映像番組の該少なくとも一つのトピックに対応した該映像番組の一部分を表示する手順と、
    を有する方法。
  10. 該映像番組の該少なくとも一つのトピックの少なくとも一つのサブトピックを識別する該マルチメディア要約からの情報を表示ページに表示する手順と、
    該映像番組の該少なくとも一つのトピックの該少なくとも一つのサブトピックに対応した少なくとも一つのエントリー・ポイントを該表示ページに表示する手順と、
    視聴者による該映像番組の該少なくとも一つのトピックの該少なくとも一つのサブトピックに対応した該エントリー・ポイントの選択を受ける手順と、
    該映像番組の該少なくとも一つのトピックの該少なくとも一つのサブトピックに対応した該映像番組の一部分を表示する手順と、
    を更に有する請求項9記載の方法。
  11. 該映像番組中の音声・映像セグメントの少なくとも一つのカテゴリー、及び、音声・映像セグメントの該少なくとも一つのカテゴリーが該映像番組中に出現する時間を識別する該マルチメディア要約からの情報を話者視覚化ページに表示する手順と、
    視聴者による音声・映像セグメントの該少なくとも一つのカテゴリーが該映像番組中に出現するときの選択を受ける手順と、
    該視聴者によって選択された該映像番組中の音声・映像セグメントの該少なくとも一つのカテゴリーを表わす該映像番組の一部分を表示する手順と、
    を更に有する請求項9又は10記載の方法。
  12. 音声・映像セグメントの該少なくとも一つのカテゴリーは、発話中の人物、コマーシャルメッセージ、顔が表示されている人物、トピック、サブトピック、及び、該映像番組のトランスクリプトの要素のうちの一つにより構成される、請求項11記載の方法。
  13. メモリに接続されたコントローラに該メモリに保持されたコンピュータソフトウェアからの命令を読み出す手順と、
    該話者視覚化ページを表示するため該コントローラにおいて該命令を実行する手順と、
    音声・映像セグメントの少なくとも一つのカテゴリーが該映像番組中に出現する時間を識別する選択情報を視聴者から受けるため、該コントローラにおいて該命令を実行する手順と、
    音声・映像セグメントの該少なくとも一つのカテゴリーを表わす該映像番組の該少なくとも一部分を表示するため、該視聴者からの選択情報に応答して該コントローラにおいて該命令を実行する手順と、
    を更に有する請求項11記載の方法。
  14. 該映像番組中の各話者、及び、各話者が該映像番組中で発話しているときを表わす複数の時間セグメントを識別する該マルチメディア要約からの情報を話者視覚化ページに表示する手順と、
    視聴者による時間セグメントの選択情報を取得する手順と、
    取得した該視聴者による選択情報に応答して、選択された時間セグメント中に発話している話者を表わす該映像番組の一部分を表示する手順と、
    を更に有する請求項11記載の方法。
  15. 該視聴者によって選択された少なくとも一つのトピックを記録する手順と、
    該少なくとも一つのトピックに関係した付加情報を見つける手順と、
    視聴者に該付加情報を通知する手順と、
    を更に有する請求項9記載の方法。
  16. プログラマブル装置に請求項1乃至7のうちいずれか一項記載のシステムとしての機能を実現させるためのコンピュータプログラム。
  17. 少なくとも2種類の情報を2次元形式で表示する話者視覚化ページに該マルチメディア要約からの情報を表示させる手順を更に有する請求項11記載の方法。
  18. 少なくとも3種類の情報を3次元形式で表示する話者視覚化ページに該マルチメディア要約からの情報を表示させる手順を更に有する請求項11記載の方法。
  19. 少なくとも4種類の情報を表示する少なくとも2ページの話者視覚化ページに該マルチメディア要約からの情報を表示させる手順を更に有する請求項11記載の方法。
JP2002552309A 2000-12-21 2001-12-06 映像番組のマルチメディア要約にアクセスするシステム及び方法 Withdrawn JP2004516752A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US09/747,108 US20020083473A1 (en) 2000-12-21 2000-12-21 System and method for accessing a multimedia summary of a video program
PCT/IB2001/002372 WO2002051138A2 (en) 2000-12-21 2001-12-06 System and method for accessing a multimedia summary of a video program

Publications (1)

Publication Number Publication Date
JP2004516752A true JP2004516752A (ja) 2004-06-03

Family

ID=25003680

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002552309A Withdrawn JP2004516752A (ja) 2000-12-21 2001-12-06 映像番組のマルチメディア要約にアクセスするシステム及び方法

Country Status (6)

Country Link
US (1) US20020083473A1 (ja)
EP (1) EP1348298A2 (ja)
JP (1) JP2004516752A (ja)
KR (1) KR20020076324A (ja)
CN (1) CN1425249A (ja)
WO (1) WO2002051138A2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017517995A (ja) * 2014-04-11 2017-06-29 サムスン エレクトロニクス カンパニー リミテッド 要約コンテンツサービスのための放送受信装置及び方法

Families Citing this family (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020120925A1 (en) * 2000-03-28 2002-08-29 Logan James D. Audio and video program recording, editing and playback systems using metadata
US6714909B1 (en) 1998-08-13 2004-03-30 At&T Corp. System and method for automated multimedia content indexing and retrieval
US8028314B1 (en) 2000-05-26 2011-09-27 Sharp Laboratories Of America, Inc. Audiovisual information management system
US8020183B2 (en) 2000-09-14 2011-09-13 Sharp Laboratories Of America, Inc. Audiovisual management system
US20030038796A1 (en) * 2001-02-15 2003-02-27 Van Beek Petrus J.L. Segmentation metadata for audio-visual content
US7904814B2 (en) 2001-04-19 2011-03-08 Sharp Laboratories Of America, Inc. System for presenting audio-video content
US7499077B2 (en) * 2001-06-04 2009-03-03 Sharp Laboratories Of America, Inc. Summarization of football video content
US7203620B2 (en) * 2001-07-03 2007-04-10 Sharp Laboratories Of America, Inc. Summarization of video content
US7474698B2 (en) 2001-10-19 2009-01-06 Sharp Laboratories Of America, Inc. Identification of replay segments
US7120873B2 (en) * 2002-01-28 2006-10-10 Sharp Laboratories Of America, Inc. Summarization of sumo video content
US8214741B2 (en) 2002-03-19 2012-07-03 Sharp Laboratories Of America, Inc. Synchronization of video and data
US20040210947A1 (en) * 2003-04-15 2004-10-21 Shusman Chad W. Method and apparatus for interactive video on demand
US7657836B2 (en) 2002-07-25 2010-02-02 Sharp Laboratories Of America, Inc. Summarization of soccer video content
US7657907B2 (en) 2002-09-30 2010-02-02 Sharp Laboratories Of America, Inc. Automatic user profiling
SE524936C2 (sv) * 2002-10-23 2004-10-26 Softhouse Nordic Ab Mobil likhetsbedömning av objekt
WO2004095456A1 (en) * 2003-04-24 2004-11-04 Koninklijke Philips Electronics N.V. Menu generator device and menu generating method for complementing video/audio signals with menu information
US20050021425A1 (en) * 2003-05-16 2005-01-27 Liam Casey Method and system for supply chain management employing a visualization interface
EP1538536A1 (en) * 2003-12-05 2005-06-08 Sony International (Europe) GmbH Visualization and control techniques for multimedia digital content
US8356317B2 (en) 2004-03-04 2013-01-15 Sharp Laboratories Of America, Inc. Presence based technology
US8949899B2 (en) 2005-03-04 2015-02-03 Sharp Laboratories Of America, Inc. Collaborative recommendation system
US7594245B2 (en) 2004-03-04 2009-09-22 Sharp Laboratories Of America, Inc. Networked video devices
WO2005107258A1 (ja) * 2004-04-28 2005-11-10 Matsushita Electric Industrial Co., Ltd. 番組選択システム
KR100602435B1 (ko) * 2004-10-11 2006-07-19 (주)토필드 예약녹화장치 및 그 방법
US7835158B2 (en) * 2005-12-30 2010-11-16 Micron Technology, Inc. Connection verification technique
JP2007228220A (ja) * 2006-02-23 2007-09-06 Funai Electric Co Ltd ハードディスクドライブ内蔵型テレビジョン受像機、及びテレビジョン受像機
US8689253B2 (en) 2006-03-03 2014-04-01 Sharp Laboratories Of America, Inc. Method and system for configuring media-playing sets
US8589973B2 (en) * 2006-09-14 2013-11-19 At&T Intellectual Property I, L.P. Peer to peer media distribution system and method
JP4909854B2 (ja) * 2007-09-27 2012-04-04 株式会社東芝 電子機器および表示処理方法
US8037095B2 (en) * 2008-02-05 2011-10-11 International Business Machines Corporation Dynamic webcast content viewer method and system
CN102723089B (zh) * 2011-05-11 2015-11-18 新奥特(北京)视频技术有限公司 一种现场输出数据并播出的实现方法及系统
JP2013025748A (ja) * 2011-07-26 2013-02-04 Sony Corp 情報処理装置、動画要約方法、及びプログラム
KR101956373B1 (ko) * 2012-11-12 2019-03-08 한국전자통신연구원 요약 정보 생성 방법, 장치 및 서버
CN103399865B (zh) * 2013-07-05 2018-04-10 华为技术有限公司 一种生成多媒体文件的方法和装置
US9906820B2 (en) * 2015-07-06 2018-02-27 Korea Advanced Institute Of Science And Technology Method and system for providing video content based on image
US10290320B2 (en) * 2015-12-09 2019-05-14 Verizon Patent And Licensing Inc. Automatic media summary creation systems and methods
US10638029B2 (en) * 2016-03-18 2020-04-28 C360 Technologies, Inc. Shared experiences in panoramic video
US20180160200A1 (en) * 2016-12-03 2018-06-07 Streamingo Solutions Private Limited Methods and systems for identifying, incorporating, streamlining viewer intent when consuming media
US10839221B2 (en) * 2016-12-21 2020-11-17 Facebook, Inc. Systems and methods for compiled video generation
CN106649713B (zh) * 2016-12-21 2020-05-12 中山大学 一种基于内容的电影可视化处理方法及其系统
US10123058B1 (en) 2017-05-08 2018-11-06 DISH Technologies L.L.C. Systems and methods for facilitating seamless flow content splicing
US10192584B1 (en) 2017-07-23 2019-01-29 International Business Machines Corporation Cognitive dynamic video summarization using cognitive analysis enriched feature set
US11115717B2 (en) * 2017-10-13 2021-09-07 Dish Network L.L.C. Content receiver control based on intra-content metrics and viewing pattern detection
CN110198467A (zh) * 2018-02-27 2019-09-03 优酷网络技术(北京)有限公司 视频播放方法及装置
CN108650558B (zh) * 2018-05-30 2021-01-15 互影科技(北京)有限公司 基于交互视频的视频前情提要的生成方法及装置
CN109905764B (zh) * 2019-03-21 2021-08-24 广州国音智能科技有限公司 一种视频中目标人物语音截取方法及装置
US11361759B2 (en) * 2019-11-18 2022-06-14 Streamingo Solutions Private Limited Methods and systems for automatic generation and convergence of keywords and/or keyphrases from a media

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5485221A (en) * 1993-06-07 1996-01-16 Scientific-Atlanta, Inc. Subscription television system and terminal for enabling simultaneous display of multiple services
US5654748A (en) * 1995-05-05 1997-08-05 Microsoft Corporation Interactive program identification system
US5907323A (en) * 1995-05-05 1999-05-25 Microsoft Corporation Interactive program summary panel
JPH0993548A (ja) * 1995-09-27 1997-04-04 Toshiba Corp 文字情報表示機能付きテレビ受信機
JP3407840B2 (ja) * 1996-02-13 2003-05-19 日本電信電話株式会社 映像要約方法
JP3377677B2 (ja) * 1996-05-30 2003-02-17 日本電信電話株式会社 映像編集装置
JP3426876B2 (ja) * 1996-09-27 2003-07-14 三洋電機株式会社 映像関連情報生成装置
US6263507B1 (en) * 1996-12-05 2001-07-17 Interval Research Corporation Browser for use in navigating a body of information, with particular application to browsing information represented by audiovisual data
JP3250509B2 (ja) * 1998-01-08 2002-01-28 日本電気株式会社 放送番組の視聴方法および視聴装置
US6366296B1 (en) * 1998-09-11 2002-04-02 Xerox Corporation Media browser using multimodal analysis
JP2000253337A (ja) * 1999-02-24 2000-09-14 Sony Corp 画面の制御方法および画面の制御装置および映像再生方法および映像再生装置および映像情報の記録方法および映像情報の記録装置およびコンピュータが読み取り可能な記録媒体
US6580437B1 (en) * 2000-06-26 2003-06-17 Siemens Corporate Research, Inc. System for organizing videos based on closed-caption information

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017517995A (ja) * 2014-04-11 2017-06-29 サムスン エレクトロニクス カンパニー リミテッド 要約コンテンツサービスのための放送受信装置及び方法

Also Published As

Publication number Publication date
WO2002051138A3 (en) 2002-08-22
KR20020076324A (ko) 2002-10-09
EP1348298A2 (en) 2003-10-01
WO2002051138A2 (en) 2002-06-27
US20020083473A1 (en) 2002-06-27
CN1425249A (zh) 2003-06-18

Similar Documents

Publication Publication Date Title
JP2004516752A (ja) 映像番組のマルチメディア要約にアクセスするシステム及び方法
JP2009065680A (ja) 映像番組のマルチメディア要約を提供するシステム及び方法
US10482168B2 (en) Method and apparatus for annotating video content with metadata generated using speech recognition technology
US7356244B2 (en) Method and system for replaying video images
US7046911B2 (en) System and method for reduced playback of recorded video based on video segment priority
US9147433B2 (en) Identifying a locale depicted within a video
JP4317127B2 (ja) 音楽ビデオを索引化して要約するシステム及び方法
US20130330056A1 (en) Identifying A Cinematic Technique Within A Video
US20020174445A1 (en) Video playback device with real-time on-line viewer feedback capability and method of operation
KR20060102639A (ko) 동영상 재생 시스템 및 방법
JP2004531920A (ja) デジャヴュ・ビデオシステム用のユーザ・インタフェースを提供するシステム及び方法
US20060064723A1 (en) Method for an instant pop-up interface for a set-top box
Okuda et al. Storage technology for television home server
JP2001134998A (ja) 番組及び特定シーンの自動録画装置
Ugajin et al. Hitachi’s Broadcast/Network Hybrid Digital Recorder
JP2001257973A (ja) 記録/再生装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20041203

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20060804