JP2007519321A - 視聴覚データストリームのマルチメディア要約を作成する方法及び回路 - Google Patents

視聴覚データストリームのマルチメディア要約を作成する方法及び回路 Download PDF

Info

Publication number
JP2007519321A
JP2007519321A JP2006544640A JP2006544640A JP2007519321A JP 2007519321 A JP2007519321 A JP 2007519321A JP 2006544640 A JP2006544640 A JP 2006544640A JP 2006544640 A JP2006544640 A JP 2006544640A JP 2007519321 A JP2007519321 A JP 2007519321A
Authority
JP
Japan
Prior art keywords
audiovisual data
data stream
information
extracted
text summary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006544640A
Other languages
English (en)
Other versions
JP2007519321A5 (ja
Inventor
マウロ バルビエリ
ヘルハルドゥス イー メケンカムプ
ベノワ ピー ジー フエト
ベルナルド メリアルド
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips NV
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips NV, Koninklijke Philips Electronics NV filed Critical Koninklijke Philips NV
Publication of JP2007519321A publication Critical patent/JP2007519321A/ja
Publication of JP2007519321A5 publication Critical patent/JP2007519321A5/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/85Assembly of content; Generation of multimedia applications
    • H04N21/854Content authoring
    • H04N21/8549Creating video summaries, e.g. movie trailer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/438Interfacing the downstream path of the transmission network originating from a server, e.g. retrieving encoded video stream packets from an IP network
    • H04N21/4385Multiplex stream processing, e.g. multiplex stream decrypting
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • G11B27/031Electronic editing of digitised analogue information signals, e.g. audio or video signals
    • G11B27/034Electronic editing of digitised analogue information signals, e.g. audio or video signals on discs
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/102Programmed access in sequence to addressed parts of tracks of operating record carriers
    • G11B27/105Programmed access in sequence to addressed parts of tracks of operating record carriers of operating discs
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/238Interfacing the downstream path of the transmission network, e.g. adapting the transmission rate of a video stream to network bandwidth; Processing of multiplex streams
    • H04N21/2389Multiplex stream processing, e.g. multiplex stream encrypting
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44008Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/4402Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/84Generation or processing of descriptive data, e.g. content descriptors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments
    • H04N21/8456Structuring of content, e.g. decomposing content into time segments by decomposing the content in the time domain, e.g. in time segments
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B2220/00Record carriers by type
    • G11B2220/20Disc-shaped record carriers
    • G11B2220/21Disc-shaped record carriers characterised in that the disc is of read-only, rewritable, or recordable type
    • G11B2220/215Recordable discs
    • G11B2220/216Rewritable discs
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B2220/00Record carriers by type
    • G11B2220/20Disc-shaped record carriers
    • G11B2220/25Disc-shaped record carriers characterised in that the disc is based on a specific recording technology
    • G11B2220/2537Optical discs
    • G11B2220/2541Blu-ray discs; Blue laser DVR discs
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B2220/00Record carriers by type
    • G11B2220/20Disc-shaped record carriers
    • G11B2220/25Disc-shaped record carriers characterised in that the disc is based on a specific recording technology
    • G11B2220/2537Optical discs
    • G11B2220/2562DVDs [digital versatile discs]; Digital video discs; MMCDs; HDCDs

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Computer Security & Cryptography (AREA)
  • Television Signal Processing For Recording (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

消費者によって受信され得る視聴覚データ量が急速に増加するにしたがい、映画などの視聴覚データの適切な要約化に関する必要が増加している。したがって、本発明は、映画などの視聴覚データのストリームのマルチメディア要約を作成する方法を提供する。始めに、テキスト要約が取得される(204)。次に、視聴覚データストリームがセグメント化され(208)、情報が、視聴覚データストリームから(210)及びテキスト要約(206)から抽出される。最終的に、テキスト要約によって担持される情報と一致する情報を担持するセグメントが選択される(212)。映画及び連続ものの要約は、豊富にインターネット上で入手可能であり、熱心な者によって又は熱心な者のために作成され、マルチメディア要約を作成するのに信頼度の高い種を提供する。

Description

本発明は、視聴覚データストリームのマルチメディア要約を作成する方法に関する。
本発明は、視聴覚データストリームのマルチメディア要約を作成する回路にも関する。
本発明は、更に、斯様な回路を備える視聴覚データを処理する機器に関する。
本発明は、更に、処理ユニットをプログラムするコードを有する計算機プログラムに関する。
本発明は、更に、斯様な計算機プログラムを担持するデータ担体に関する。
消費者に利用者可能な記憶容量及び消費者によって使用される記憶容量が増加していることは長年にわたって伝えられている。また、消費者に提示され及び利用可能なコンテンツの量も伸びている。消費者によって記憶されている又は消費者のための全てのコンテンツの適切な概略を提供するために、特に映画などの視聴覚データストリームに関して適切な要約が不可欠である。
消費者が自身に対して利用可能な全ての映画を個人的に要約することは実行不可能である。したがって、映画を要約するこの処理を自動化することが高く所望とされる。
米国特許出願公開第2002/0083471 号は、ビデオ番組のマルチメディア要約を提供するシステム及び方法を開示する。マルチメディア要約の作成の処理は、国際特許出願公開第02/041634号に開示される方法に従ってテキスト要約を自動的に作成するステップから開始する。テキスト要約を自動的に作成するステップは、ユーザ対話を必要としないものの、多量の処理能力を必要とし、したがって、高価な回路を必要とする。更に、ビデオ番組の間違った部分の選択により失敗をしがちである。この理由は、テキスト要約を自動的に作成する回路が、全てのビデオ番組に適用可能ではないかもしれない数個の規則に従い動作するからである。
本発明の目的は、少ない処理能力を必要とするマルチメディア要約を作成する方法及び回路を提供することである。
この目的を達成するために、本発明は、視聴覚データストリームのマルチメディア要約を作成する方法であって、外部情報源から前記視聴覚データストリームの既製のテキスト要約を取得するステップと、情報を抽出するべき前記テキスト要約を分析するステップと、情報を抽出するべき前記視聴覚データストリームをセグメント化及び分析をするステップと、前記テキスト要約から抽出された前記情報と一致する情報を有するセグメントを前記視聴覚データストリームから選択するステップと、前記選択されたセグメントを結合し、マルチメディア要約を形成するステップと、を有する方法を提供する。
本発明は、映画及び連続番組などのビデオ番組の既製のテキスト要約を有する多数のデータベースが利用可能であるという認識に基に構築されている。例えばインターネットなどを介してこれらのテキスト要約を取得する回路は、非常に低価格で豊富に入手可能であり、最小限の処理能力を必要とする。更に、テキスト要約は、通常、無料で取得され得る。
更に、これらの要約は、多くの場合、映画及びジャンルを知っており、映画又は連続番組のエピソードのハイライトが何かを知っている映画批評家、映画の熱心な者又は連続番組の熱心な者によって作成される。斯様にして、献身的な精神規則が、テキスト要約を設定するのに用いられる。斯様にして、人間の脳によって使用される規則に比べて最も原始的である回路適用規則よりも更に正確なテキスト要約が提供される。
本発明に従う方法の実施例において、前記視聴覚データストリームが、前記視聴覚データストリームに対応する字幕を担持するサブストリームを含み、前記視聴覚データストリームから抽出された前記情報が、字幕を分析することによって前記視聴覚データストリームから抽出される。
この実施例の有利な点は、字幕が、例えば要約されるべき映画などの他のビデオデータから抽出される必要がないので、容易に抽出されることである。
本発明による方法の別の実施例において、前記テキスト要約から抽出される前記情報は、キーワードである。
この実施例の有利な点は、(前記サブストリームで入手可能な)語句が、アルファベットと数字を組み合わせたデータに変換され得、斯様にして処理され得るので、容易に処理することが可能である。
本発明に従う方法の更なる実施例において、前記テキスト要約から抽出される前記情報が、前記テキスト要約から抽出される前記情報に関連する情報を用いて拡張される。
この実施例の有利な点は、短いテキスト要約が、斯様にして、更なる情報又は更に詳細な情報を提供し得ることである。特に、テレテキストによって提供される要約は、通常1ページに収められる必要があるので、かなり小さい。この要約から抽出される情報を拡張することによって、要約するべき視聴覚データストリームの一致するセグメントを検索するための追加的な情報が利用可能になる。
本発明による方法の更に別の実施例において、前記セグメントが、前記マルチメディア要約が再生される瞬間に組み合わせられる。
この実施例の有利な点は、セグメントが元の視聴覚データストリームから再生され得るので、完全なマルチメディア要約を記録するために大量の追加的な記憶スペースが必要とされないことである。マルチメディア要約の設定は、マルチメディア要約の再生の前に、オフラインで行われ得る。この結果は、要約するべき元の視聴覚データストリームに参照されるプレイリストであり得る。
本発明による視聴覚データストリームのマルチメディア要約を作成する回路は、外部情報源から前記視聴覚データストリームの既製のテキスト要約を取得する通信ユニットと、情報を抽出するべき前記テキスト要約を分析し、情報を抽出するべき前記視聴覚データストリームをセグメント化及び分析をし、前記テキスト要約から抽出された前記情報と一致する情報を有するセグメントを前記視聴覚データストリームから選択し、前記選択されたセグメントを結合し、マルチメディア要約を形成する処理ユニットと、を備える。
本発明による視聴覚データを処理する機器は、斯様な回路を備える。
本発明による計算機プログラムは、本発明による方法を実行するように処理ユニットをプログラムするコードを含む。
本発明による計算機プログラムを担持するデータ担体は、斯様な計算機プログラムを担持する。
本発明の実施例は、添付の図面を参照にして以下に更に詳細に説明される。
図1は、本発明による機器の実施例としてのビデオレコーダ110と、テレビ150と、制御装置160とを備える家電システム100を示す。ビデオレコーダ110は、信号170によって担持される視聴覚データのストリーム及びこれら視聴覚データのストリームに関連付けられる対話型アプリケーションを受信及び記録するように構成される。
これを実現するために、ビデオレコーダ110は、信号170を受信する受信器120、デマルチプレクサ122、ビデオ処理器124、ビデオレコーダ110によって含まれるコンポーネントを制御するマイクロプロセッサなどの中央処理ユニット126、記憶装置としてのハードディスク駆動装置128、プログラムコードメモリ130、制御装置160から信号を受信するユーザコマンド受信器132、及びビデオレコーダ110によって含まれるコンポーネントを接続する中央バス134を備える。
ビデオレコーダは、更に、インターネット又はLANなどのネットワークに接続するためのネットワークインターフェイスユニット140を備える。ネットワークインターフェイスユニット140は、アナログモデム、ISDN、DSL若しくはケーブルモデム、又はUTP/イーサネット/TCP-IPネットワークインターフェイスとして実施され得る。
受信器120は、放送(音声又はビデオ)チャネルに同調し、信号170から前記放送チャネルのデータを抽出するように構成される。信号170は、ケーブル、地上波、衛星、ブロードバンドネットワーク接続又は他のいかなる視聴覚データ配信方法などの何れの既知の方法によっても受信され得る。信号170は、別の家電機器の出力から抽出もされ得る。受信器120は、少なくとも1つの視聴覚データストリームを担持するベースバンド信号を出力する。
デマルチプレクサ122は、受信器120によって出力されるベースバンド信号に含まれ得る視聴覚データを他のデータから逆多重化するように構成され得る。ビデオ処理器124は、テレビ150によってレンダリングされ得る方法でデマルチプレクサ122によって出力される視聴覚データをレンダリングするように構成される。出力は、SECAM及びPALなどの様々なアナログ形式又はデジタル形式で提供され得る。
プログラムコードメモリ130に記憶されるデータは、マイクロプロセッサ126に本発明に従う方法を実行させる。プログラムコードメモリ130は、フラッシュEEEPROM、ROM、光ディスク又は他の如何なる種類のデータ担持媒体として実施され得る。
記憶装置は、DVD又はBlu−Ray駆動装置などの光学ディスク駆動装置としても実施され得、テレビ150での後々の再生のために又はネットワークインターフェイスユニット140を介した更なる伝達のために、受信器120又はネットワークインターフェイスユニット140の何れかによって受信されるコンテンツを記憶する。コンテンツは、記憶の前に処理され得る。
マイクロプロセッサ126は、ビデオレコーダ110のユーザにハードディスク駆動装置128に記憶される全てのデータの良好な概略を提供するために、映画、テレビ番組、又はハードディスク駆動装置128に記憶されるか受信器140によって受信される他のもの等の視聴覚データストリームの要約を作成する。このことは、自動的に行われるか、ユーザによって開始される必要がある。
図2は、視聴覚データのストリームの要約を作成する本発明による方法の実施例を示すフローチャート200を示す。様々なブロックにおける処理ステップは、以下の表1に提供される。処理は、図1と組み合わせて説明され得る。
Figure 2007519321
処理ステップ202において、(マイクロプロセッサ126によって実行されるエージェントによって)自動的に、又は制御装置160を操作するなどのユーザ動作によって、処理が開始される。
その後、処理ステップ204において、要約するべきストリームの既製のテキスト要約が取得される。映画の要約は、例えばインターネット上のhttp://www.cinema.nlなどの多数の場所において入手可能である。しかし、テレテキスト及び電子番組ガイド(EPG)も、映画及びシリーズものなどの他の番組のテキスト要約を提供する。要約は、特にメロドラマに関して、エピソードが放送された後に完全なプロットを提供する。
有利な実施例において、要約は、インターネットサーバからネットワークインターフェイスユニット140によって取得される。本発明の別の実施例において、要約は、放送信号に多重化され、デマルチプレクサ122で前記放送信号から導出されるテキストデータから取得される。アナログテレビ信号に関して、テキストデータは、垂直帰線区間に多重化される。デジタルテレビの場合、テキストデータは、視聴覚データストリームとは別のストリームで提供され得る。テレテキストデータは、例えばhttp://teletekst.nos.nl/でインターネットを介しても利用可能であり得、ネットワークインターフェイスユニット140によって取得され得る。
テレテキストデータ及びEPGデータは、多くの場合視聴覚データストリームを用いて取得され、したがって、事実上、ビデオレコーダ110で入手可能であるが、それにもかかわらず、この応用例の文脈において、これらの手段によって取得されるテキスト要約が視聴覚データストリームの作成(すなわち、例えばフィルムの撮影)から個別に生成させるので、外部情報源から取得されると考慮される。
本発明のより更なる実施例において、要約は、電子番組ガイドから得られる。この番組ガイドは、テレテキストデータが取得されるのと同じ方法で、放送信号から又はインターネットから取得され得る。
斯様にして要約を取得する主な有利な点は、要約が、要約すべき視聴覚データストリームから作成される必要がなく、既に入手可能であることである。
要約を取得すると、要約は、ステップ206で情報を抽出するために分析される。好ましい実施例において、キーワードは要約から抽出される。これらのキーワードは、1回以上登場するか例えば映画の題名に登場する動詞、名詞又は形容詞であり得る。
更なる実施例のにおいて、情報抽出処理は、テキスト要約から抽出されたキーワードに関連する語句を求めて検索する。前記関連する語句は、同義語であってもよいが、「ファックス」が「電話」に関連し、「車」が「運転」に関連するような方法などの他の関連性も想像され得る。抽出された情報に関連する情報は、1つの実施例において、ネットワークインターフェイスユニット140を用いて外部データベースから取得される。別の実施例において、追加的な関連情報を検索するためのデータベースは、ハードディスク駆動装置128に記憶される。
データベースは、キーワードとして見なされるべきでない語句も含み得る。この例の1つは、「である(to be)」の全ての活用形又は他の非常に頻繁に用いられる動詞である。
その後、視聴覚データのストリームは、同一出願者の国際特許出願公開第02/093929号で開示される既知の方法を用いて、処理ステップ208でセグメント化される。
マルチメディアデータオブジェクトをセグメント化した後で、前記セグメントは、処理ステップ210で情報を抽出するために分析される。セグメントから情報を抽出するために、本発明の様々な実施例が提案されている。マルチメディアデータオブジェクトが映画であり、前記映画がその映画に字幕を提供されている場合、字幕は、他のビデオデータから抽出され得、字幕はOCRアルゴリズムを用いて読み取られ得る。
字幕がテレテキスト又はクローズドキャプションなどの追加的なデータとしてアルファベットと数字を組み合わせた形式で提供される場合、情報は、簡単な方法で自動的に抽出され得る。
前段落で議論された2つの選択肢の中間の選択肢も可能である。DVDにおいて、字幕は、グラフィカル形式で個別のストリームでコンテンツ提供者によって提供され得る。字幕は、字幕が用いられることを意図される視聴覚データストリームでビデオデータから抽出される必要がないので、情報を抽出するのに、容易にアルファベットと数字を組み合わせた文字に変換され得る。
本発明の別の実施例において、映画の文字の発話が、発話認識アルゴリズムを用いて抽出される。この種の処理は多大な処理能力を必要とするが、マイクロプロセッサの処理能力は、数年後には更に増加することが予想される。このことは、安価な普及品マイクロプロセッサを用いてオンザフライの発話認識を可能にし得る。
処理ステップ206において要約からデータを抽出するステップ同様に、名詞、動詞、及び/又は形容詞が、字幕又は変換された発話テキストから抽出される。
テキストの他に、爆発、アクションシーン、対話及び(顔認識を用いて)主要人物の顔などの他の情報も視聴覚データストリームから抽出され得る。
視聴覚データストリームがセグメント化され、情報がテキスト要約及び前記視聴覚データストリームから抽出されている場合、マルチメディア要約に関するセグメントは、処理ステップ212で選択される。このことは、テキスト要約から抽出された情報を分析することによって、及び一致情報を含むセグメントを検索することによって実行される。本発明の実施例の一つにおいて、セグメントは、テキスト要約から抽出された情報によって含まれる少なくとも1つのキーワードを含む場合に、マルチメディア要約に関して選択される。
本発明の更なる実施例において、セグメントが「警察」及び「逮捕」又は「オランダ」及び「木製靴」などの関連キーワードの組合せを含む場合、セグメントがマルチメディア要約に関して選択される。斯様な組合せは、視聴覚データストリームから抽出された情報及びテキスト要約から抽出される情報によって含まれる語句の間の一致としてもみなされる。
また、視聴覚データストリームによって表される話のプロットを理解するために重要であり得る、(話される)テキスト以外の情報を担持するセグメントも、要約に含まれ得る。これに関する例は、アクションシーン及び爆発を含むセグメントである。
本発明の実施例において、セグメントによって担持される情報以外に、マルチメディア要約における選択に関して、他の要件もシーンによって満たされる必要がある。斯様な要件は、大抵の場合セグメントが視聴覚データストリームの長さの全体から要約に関して選択され、選択されるシーンの90%がストリームの最初の10%からであるような場合を有さないことが所望であるので、シーンの長さ及び様々なシーンの位置である。
視聴覚データストリームの適切なセグメントが選択された後に、該セグメントは、新たな視聴覚データストリームに組み合わせられ、これにより、要約が作成される必要があった元の視聴覚データストリームのマルチメディア要約を形成する。このことは、処理ステップ214で行われる。好ましくは、該セグメントは、元の視聴覚データストリームで出てくる順序で組み合わされる。
しかし、本発明の別の実施例において、セグメントは、セグメントに含まれる情報がテキスト要約で現れる順序で組み合わせられる。本発明のより更なる実施例において、セグメントは、マルチメディア要約において時間的な順序で順序付けられる。このことは、元の視聴覚データストリームが、例えば映画の登場人物のフラッシュバックなどを含む場合、フラッシュバックがマルチメディア要約に最初に挿入され、他のセグメントが後に続くことを意味する。
本発明の更に別の実施例において、当該方法は、ポインタを有するプレイリストを元の視聴覚データストリームにおけるシーンに戻す。この実施例の有利な点は、個別のストリームがマルチメディア要約に関して記憶される必要がないということである。
マルチメディア要約は、最後に、処理ステップ216に戻される。マルチメディア要約は、ハードディスク駆動装置128に記憶され得る。
当業者は、フローチャート200によって示される処理の様々な処理ステップが必ずしも示される順序で実行される必要はないことを理解し得る。例えば、要約は、視聴覚データストリームがセグメント化され情報がそこから抽出された後でも取得され得る。また、同時に様々なステップが実行され得る。
様々な修正態様が上述の実施例に適用され得ることは当業者にとって明らかである。前記様々な実施例の特徴は、本発明の範囲から逸脱することなく、順序を変更され得る。
例えば、テキスト要約から抽出される情報を拡張する代わりに、視聴覚データストリームから抽出される情報も拡張され得、又は両方の情報から抽出される情報が拡張される。
更に、本発明に従う方法の実施例は、単一の処理ユニットのマイクロプロセッサ126(図1)によって及び少ない程度に受信器120(図1)によって及びネットワークインターフェイス140(図1)によって主に実行されるとして示されている(3つの全てが本発明による回路の実施例として回路180を形成する)が、1つ又は複数の個別のステップがASICなどの専用回路のような個別のコンポーネントによって実行される、本発明の他の実施例も可能である。
本発明は、図3に示されるパソコン300などの汎用目的計算機に本発明による方法を実行させる計算機プログラム製品として実施され得る。
また図3は、パソコン300に本発明による方法を実行するようにプログラムするデータを含むデータ担体310を示す。
これを実現するために、データ担体310は、パソコン300に備えられるディスク駆動装置302に挿入される。ディスク駆動装置302は、データ担体310からデータを取得し、マイクロプロセッサ304をプログラムするためにこのデータをマイクロプロセッサ304に転送する。その後、プログラムされたマイクロプロセッサ304は、本発明に従う方法を実行する。
パソコン300は、要約するべき視聴覚データストリームのテキスト要約を得るための通信ユニット306を有する。通信ユニット306は、アナログ、ケーブル若しくはDSLモデムとして、ネットワークインターフェイス(UTP,イーサネット、TCP−IP)として、又は当業者に既知の他のいかなる種類の通信ユニットとしても実施され得る。
要約すると、本発明は、以下のことに関する。
消費者によって受信され得る視聴覚データ量が急速に増加しているので、映画などの視聴覚データの適切な要約化に関する必要が増加している。したがって、本発明は、映画などの視聴覚データのストリームのマルチメディア要約を作成する方法を提供する。始めに、テキスト要約が取得される(204)。次に、視聴覚データストリームがセグメント化され(208)、情報が、視聴覚データストリームから(210)及びテキスト要約から(206)抽出される。最終的に、テキスト要約によって担持される情報と一致する情報を担持するセグメントが選択される(212)。映画及び連続ものの要約は、豊富にインターネット上で入手可能であり、熱心な者によって又は熱心な者のために作成され、マルチメディア要約を作成するのに信頼度の高い種を提供する。
図1は、本発明による機器の実施例を示す。 図2は、本発明による方法の実施例を示すフローチャートを示す。 図3は、本発明によるデータ担体の実施例を示す。

Claims (16)

  1. 視聴覚データストリームのマルチメディア要約を作成する方法であって、
    a)外部情報源から前記視聴覚データストリームの既製のテキスト要約を取得するステップと、
    b)情報を抽出するべき前記テキスト要約を分析するステップと、
    c)情報を抽出するべき前記視聴覚データストリームをセグメント化及び分析をするステップと、
    d)前記テキスト要約から抽出された前記情報と一致する情報を有するセグメントを前記視聴覚データストリームから選択するステップと、
    e)前記選択されたセグメントを結合し、マルチメディア要約を形成するステップと、
    を有する方法。
  2. 前記外部情報源が、
    a)テレテキストと、
    b)電子番組ガイドと、
    c)インターネットサーバと、
    のうちの少なくとも1つである、請求項1に記載の方法。
  3. a)前記視聴覚データストリームが、前記視聴覚データストリームに対応する字幕を担持するサブストリームを含み、
    b)前記視聴覚データストリームから抽出された前記情報が、字幕を分析することによって前記視聴覚データストリームから抽出される、
    請求項1に記載の方法。
  4. 前記サブストリームが、
    a)クローズドキャプション、
    b)テレテキスト字幕データ、及び/又は
    c)グラフィック形式の字幕、
    を担持する、請求項3に記載の方法。
  5. 前記テキスト要約から抽出される前記情報がキーワードである、請求項1に記載の方法。
  6. 前記キーワードが、前記テキスト要約によって含まれる名詞、形容詞及び/又は動詞である、請求項5に記載の方法。
  7. 前記テキスト要約から抽出される前記情報が、前記テキスト要約から抽出される前記情報に関連する情報を用いて拡張される、請求項1に記載の方法。
  8. 前記テキスト要約から抽出される前記情報が、名詞、形容詞及び/又は動詞であり、前記抽出される情報が前記テキスト要約から抽出される前記名詞に関連する更なる名詞、形容詞及び/又は動詞を用いて拡張される、請求項6に記載の方法。
  9. 前記更なる名詞、形容詞及び/又は動詞が、前記テキスト要約から抽出される前記名詞、形容詞及び/又は動詞の類義語である、請求項7に記載の方法。
  10. a)前記視聴覚データストリームが、字幕を担持するサブストリームを含み、
    b)前記情報が、字幕を分析することによって前記視聴覚データストリームから抽出され、
    c)前記テキスト要約から抽出された前記情報と一致する情報を有するセグメントを前記視聴覚データストリームから選択するステップが、前記字幕が少なくとも1つのキーワードを含む少なくとも1つのセグメントを選択するステップを含む、
    請求項5に記載の方法。
  11. 前記視聴覚データストリーム及び前記テキスト要約から抽出される前記情報が語句を含み、前記視聴覚データストリームのセグメントが、前記視聴覚データストリームから抽出される少なくとも1つの第1語句と前記テキスト要約から抽出される少なくとも1つの第2語句とが一致する場合に選択される、請求項1に記載の方法。
  12. 前記セグメントが、前記マルチメディア要約が再生される瞬間に組み合わせられる、請求項1に記載の方法。
  13. 視聴覚データストリームのマルチメディア要約を作成する回路であって、
    a)外部情報源から前記視聴覚データストリームの既製のテキスト要約を取得する通信ユニットと、
    b)1)情報を抽出するべき前記テキスト要約を分析し、
    2)情報を抽出するべき前記視聴覚データストリームをセグメント化及び分析し、
    3)前記テキスト要約から抽出された前記情報と一致する情報を有するセグメントを前記視聴覚データストリームから選択し、
    4)前記選択されたセグメントを結合し、マルチメディア要約を形成する、
    処理ユニットと、
    を備える回路。
  14. 請求項10に記載の回路を備える、視聴覚データを処理する機器。
  15. 請求項1に記載の方法を実行するように処理ユニットをプログラムするコードを含む計算機プログラム。
  16. 請求項13に記載の計算機プログラムを担持するデータ担体。
JP2006544640A 2003-12-18 2004-12-07 視聴覚データストリームのマルチメディア要約を作成する方法及び回路 Pending JP2007519321A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP03104799 2003-12-18
PCT/IB2004/052695 WO2005062610A1 (en) 2003-12-18 2004-12-07 Method and circuit for creating a multimedia summary of a stream of audiovisual data

Publications (2)

Publication Number Publication Date
JP2007519321A true JP2007519321A (ja) 2007-07-12
JP2007519321A5 JP2007519321A5 (ja) 2008-01-31

Family

ID=34707262

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006544640A Pending JP2007519321A (ja) 2003-12-18 2004-12-07 視聴覚データストリームのマルチメディア要約を作成する方法及び回路

Country Status (6)

Country Link
US (1) US20070109443A1 (ja)
EP (1) EP1698174A1 (ja)
JP (1) JP2007519321A (ja)
KR (1) KR20060126508A (ja)
CN (1) CN1894964A (ja)
WO (1) WO2005062610A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011039915A (ja) * 2009-08-17 2011-02-24 Nippon Hoso Kyokai <Nhk> シーン検索装置及びプログラム

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080049104A1 (en) * 2006-08-25 2008-02-28 Samsung Electronics Co., Ltd. Repeater apparatus linking video acquirement apparatus and video recording apparatus using unshielded twisted pair cable
EP2089820B1 (en) * 2006-11-14 2013-08-21 Koninklijke Philips Electronics N.V. Method and apparatus for generating a summary of a video data stream
FR2910769B1 (fr) * 2006-12-21 2009-03-06 Thomson Licensing Sas Procede de creation d'un resume d'un document audiovisuel comportant un sommaire et des reportages, et recepteur mettant en oeuvre le procede
US8477994B1 (en) 2009-02-26 2013-07-02 Google Inc. Creating a narrative description of media content and applications thereof
CN104396262A (zh) * 2012-06-25 2015-03-04 汤姆森许可贸易公司 同步电影概要
US10091552B2 (en) * 2012-09-19 2018-10-02 Rovi Guides, Inc. Methods and systems for selecting optimized viewing portions
CN106548120B (zh) * 2015-09-23 2020-11-06 北京丰源星际传媒科技有限公司 影院观影气氛采集统计方法及系统
CN113055741B (zh) * 2020-12-31 2023-05-30 科大讯飞股份有限公司 视频摘要的生成方法、电子设备及计算机可读存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002051139A2 (en) * 2000-12-21 2002-06-27 Koninklijke Philips Electronics N.V. System and method for providing a multimedia summary of a video program

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6236395B1 (en) * 1999-02-01 2001-05-22 Sharp Laboratories Of America, Inc. Audiovisual information management system
US20020051077A1 (en) * 2000-07-19 2002-05-02 Shih-Ping Liou Videoabstracts: a system for generating video summaries
US20020087987A1 (en) * 2000-11-16 2002-07-04 Dudkiewicz Gil Gavriel System and method for creating and editing a viewer profile used in determining the desirability of video programming events
US20020175917A1 (en) * 2001-04-10 2002-11-28 Dipto Chakravarty Method and system for streaming media manager
US20030093814A1 (en) * 2001-11-09 2003-05-15 Birmingham Blair B.A. System and method for generating user-specific television content based on closed captioning content

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002051139A2 (en) * 2000-12-21 2002-06-27 Koninklijke Philips Electronics N.V. System and method for providing a multimedia summary of a video program

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011039915A (ja) * 2009-08-17 2011-02-24 Nippon Hoso Kyokai <Nhk> シーン検索装置及びプログラム

Also Published As

Publication number Publication date
CN1894964A (zh) 2007-01-10
EP1698174A1 (en) 2006-09-06
KR20060126508A (ko) 2006-12-07
WO2005062610A1 (en) 2005-07-07
US20070109443A1 (en) 2007-05-17

Similar Documents

Publication Publication Date Title
US10482168B2 (en) Method and apparatus for annotating video content with metadata generated using speech recognition technology
US6430357B1 (en) Text data extraction system for interleaved video data streams
US8949878B2 (en) System for parental control in video programs based on multimedia content information
TWI332358B (en) Media player apparatus and method thereof
JP4198786B2 (ja) 情報フィルタリングシステム、情報フィルタリング装置、映像機器および情報フィルタリング方法
JP2007150724A (ja) 映像視聴支援システムおよび方法
US20070154171A1 (en) Navigating recorded video using closed captioning
JP4635891B2 (ja) 情報処理装置および方法、並びにプログラム
US20090073314A1 (en) Summary Content Generation Device and Computer Program
JP2007519321A (ja) 視聴覚データストリームのマルチメディア要約を作成する方法及び回路
JP2006115052A (ja) コンテンツ検索装置とその入力装置、コンテンツ検索システム、コンテンツ検索方法、プログラム及び記録媒体
JP2006343941A (ja) コンテンツ検索・再生方法、装置、プログラム、及び記録媒体
US8693843B2 (en) Information processing apparatus, method, and program
EP1463059A2 (en) Recording and reproduction apparatus
KR20080112975A (ko) 스크립트 정보 기반 동영상 검색을 위한 데이터베이스 구축방법, 데이터베이스 구축 시스템, 데이터베이스 구축용컴퓨터 프로그램이 기록된 기록매체 및 이를 이용한 동영상검색 방법
JP2008022292A (ja) 出演者情報検索システム、出演者情報取得装置、出演者情報検索装置、および、その方法ならびにプログラム
JP5033653B2 (ja) 映像記録再生装置及び映像再生装置
KR20020074199A (ko) 프로그램들의 요약 및/또는 인덱싱
JP3838775B2 (ja) マルチメディア処理装置、記録媒体
JP2006332765A (ja) コンテンツ検索・再生方法、コンテンツ検索・再生装置、並びにプログラムおよび記録媒体
JP2005167456A (ja) Avコンテンツ興趣特徴抽出方法及びavコンテンツ興趣特徴抽出装置
KR20050090398A (ko) 음성 왜곡 없이 선택가능한 속도로 재생하기 위한 방법 및장치
JP2005341138A (ja) 映像要約方法及びプログラム及びそのプログラムを格納した記憶媒体
JP3985656B2 (ja) 映像索引付加方法及びプログラム及びコンピュータ読み取り可能な記録媒体

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071206

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20071206

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101214

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110628