JP2007511854A - 視聴覚番組コンテンツの視聴覚要約を生成するシステム及び方法 - Google Patents

視聴覚番組コンテンツの視聴覚要約を生成するシステム及び方法 Download PDF

Info

Publication number
JP2007511854A
JP2007511854A JP2006530866A JP2006530866A JP2007511854A JP 2007511854 A JP2007511854 A JP 2007511854A JP 2006530866 A JP2006530866 A JP 2006530866A JP 2006530866 A JP2006530866 A JP 2006530866A JP 2007511854 A JP2007511854 A JP 2007511854A
Authority
JP
Japan
Prior art keywords
audiovisual
text
video
program content
summaries
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006530866A
Other languages
English (en)
Other versions
JP4965257B2 (ja
Inventor
バルビエリ,マウロ
エンフベルテュス メーケンカンプ,ヘルハルデュス
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips NV
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips NV, Koninklijke Philips Electronics NV filed Critical Koninklijke Philips NV
Publication of JP2007511854A publication Critical patent/JP2007511854A/ja
Application granted granted Critical
Publication of JP4965257B2 publication Critical patent/JP4965257B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/4402Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
    • H04N21/440236Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display by media transcoding, e.g. video is transformed into a slideshow of still pictures, audio is converted into text
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • G11B27/031Electronic editing of digitised analogue information signals, e.g. audio or video signals
    • G11B27/034Electronic editing of digitised analogue information signals, e.g. audio or video signals on discs
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/11Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information not detectable on the record carrier
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/4508Management of client data or end-user data
    • H04N21/4532Management of client data or end-user data involving end-user characteristics, e.g. viewer profile, preferences
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/458Scheduling content for creating a personalised stream, e.g. by combining a locally stored advertisement with an incoming stream; Updating operations, e.g. for OS modules ; time-related management operations
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/482End-user interface for program selection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/65Transmission of management data between client and server
    • H04N21/658Transmission by the client directed to the server
    • H04N21/6581Reference data, e.g. a movie identifier for ordering a movie or a product identifier in a home shopping application
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/8126Monomedia components thereof involving additional data, e.g. news, sports, stocks, weather forecasts
    • H04N21/8133Monomedia components thereof involving additional data, e.g. news, sports, stocks, weather forecasts specifically related to the content, e.g. biography of the actors in a movie, detailed information about an article seen in a video program
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/84Generation or processing of descriptive data, e.g. content descriptors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/16Analogue secrecy systems; Analogue subscription systems
    • H04N7/162Authorising the user terminal, e.g. by paying; Registering the use of a subscription channel, e.g. billing
    • H04N7/163Authorising the user terminal, e.g. by paying; Registering the use of a subscription channel, e.g. billing by receiver means only
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B2220/00Record carriers by type
    • G11B2220/20Disc-shaped record carriers
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B2220/00Record carriers by type
    • G11B2220/40Combinations of multiple record carriers
    • G11B2220/41Flat as opposed to hierarchical combination, e.g. library of tapes or discs, CD changer, or groups of record carriers that together store one title

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Computer Security & Cryptography (AREA)
  • Human Computer Interaction (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Television Signal Processing For Recording (AREA)
  • Management Or Editing Of Information On Record Carriers (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Indexing, Searching, Synchronizing, And The Amount Of Synchronization Travel Of Record Carriers (AREA)

Abstract

本発明は、視聴覚番組コンテンツに対する視聴覚要約を生成するシステムを記載している。システムは、番組コンテンツと関連付けられる予め生成されるテキスト要約を位置特定するサーチ装置と、テキスト要約を音声に変換する音声合成器と、視聴覚番組コンテンツのビデオ要約を生成するビデオ要約生成器と、合成音声をビデオ要約とミキシングするオーディオ/ビデオ・ミキサとを備える。更に、本発明は、視聴覚番組コンテンツに対する視聴覚要約を生成するうえで適切な方法を記載している。

Description

本発明は一般に視聴覚コンテンツの視聴覚要約を生成するシステム及び方法に関し、特に視聴覚要約を視聴覚装置において生成するシステム及び方法に関する。
ビデオオンデマンド、ペイTV及びオンライン・マルチメディアのコンテンツなどの新興サービスによって、利用可能な多くの番組が視聴者に提示される一方、DVD技術やハードディスク記録システムにおける新たな進展によって視聴者に、TV番組を容易に記録し、自らの映画コレクションを収集する手段を提供する。ディジタルTVの出現と利用可能なチャネルの増加によって、視聴者は、視聴する対象の番組の選択肢の更なる増加に直面することになる。よって、ビデオ上やDVD上に番組を記録して後の段階で視ることが、特に、番組が視聴者にとって適切でない時間に放送される場合又はいくつかの番組が別々のチャンネル上で同時に放送される場合にもっと望ましいものになる。
記録された番組のコレクションが増えると、特定の番組を見つけて視聴することがますます難しくなる。極めて多くの場合、記録の名称だけでは視聴者にその性質や内容を伝えることは十分でなくなり、各記録のセグメントを視て、それが所望のものであるかを確かめるのは一般的に実行可能なものでない。所望の記録を見つけることは、各記録について十分な情報を提供して、情報を与えられたうえでの選択をユーザが行うことを可能にする要約集によってもっと容易になる。
例えば、テレビ放送や、DVDプレイヤやVCRなどの視聴覚装置からのものであり得る、視聴覚ストリームのオーディオ・コンテンツ及びビデオ・コンテンツを用いて要約を生成する手法が利用可能なものとして存在している。視聴覚信号のオーディオ・コンテンツは、音楽、音響効果や他のオーディオ・コンテンツを音声コンテンツとともに備え得る。例えば米国特許出願公開第2002/0051077号明細書では、字幕テキストを解析してビデオ・コンテンツにおけるストーリについての要約文を見つけることが記載されており、これによって、相当するオーディオ・クリップ及びビデオ・クリップを見つけるのに用い得る。番組コンテンツの要約を示すようクリップを配列し得る。要約に用いる対象のビデオ・クリップを選ぶことは比較的容易であるが、付随するオーディオ・コンテンツを用いることは望ましくない場合が多い。それは、背景音楽及び/又は音響効果が結果として遮断されることによって耳障りな感じとなり、結果として聴くといらいらするものであり得る。音声の対話を文の途中で中断することは極めて受け入れがたい。それは、対話が理解しがたいものになってしまうからである。更に、ビデオ・クリップに付随する対話は、映画が実際に何についてのことかを視聴者に分からせるのに十分でない場合があり、映画に登場する俳優、プロデューサ、製作年、映画のジャンル、レーティング、予算、興行的成功、オスカー受賞数、特定の年齢層に対する適性などについての情報は何ら提供しない場合がある。しかし、これは、視る対象の記録を選択する場合に視聴者に興味があるまさにその情報であり得る。視聴覚入力のオーディオ・コンテンツもビデオ・コンテンツも用いて要約を生成するのに現在利用可能な手法はしたがって、概して不十分であるが、それは、映画に適切なものであり、かつ、情報が与えられたうえでの選択をオーディオ・コンテンツ及びビデオ・コンテンツから視聴者が行ううえで非常に重要な情報を集めることが可能でないからである。
したがって、本発明の目的は、視聴覚番組に対する、簡潔でかつ有益な要約を容易に生成するのに用い得るシステム及び方法を備えるというものである。
この目的で、本発明は、視聴覚番組コンテンツの視聴覚要約を生成するシステムを備える。このシステムは、番組コンテンツと関連付けられる予め生成されるテキスト要約を位置特定するサーチ装置と、テキスト要約を音声に変換する音声合成器と、視聴覚番組コンテンツのビデオ要約を生成する音声合成器と、合成音声をビデオ要約とミキシングするオーディオ/ビデオ・ミクサとを備える。
視聴覚番組コンテンツに対する視聴覚要約を生成するうえで適切な方法は、番組コンテンツと関連付けられる予め生成されるテキスト要約を見つける工程と、テキスト要約を音声に合成する工程と、視聴覚番組コンテンツのビデオ要約を生成する工程と、合成される音声をビデオ要約とミキシングする工程とを備える。
システムはよって、知的な視聴選択を短時間に行ううえで必要な情報全てが提示される視聴者によって用い得る、視聴覚番組に対する有益な要約を生成する容易な方法を備える。
テキスト要約を位置特定するモジュールと、音声合成を行うモジュールと、ビデオ要約を生成するモジュールは、当業者によって市販の構成部分を用いることによって実現することが可能である。これらのモジュールは、利用可能なソフトウェア構成部分及び/又はハードウェア構成部分を用いて実現してもよいので、本発明は高い費用対効果のもとで実現することが可能である。
番組コンテンツに関するテキスト要約をサーチする情報源は、例えば、情報データベース、インターネット、イントラネットや、ディジタル放送信号であり得る。
従属請求項と、明細書の下記記載は、本発明の特に効果的な実施例及び特徴を開示している。
一般的に、特定の映画に対する2つ以上のテキスト要約がサーチ装置によって、サーチ装置が別の、例えば、第1に位置特定される要約を選ぶに過ぎないように構成し得る、方法で構成されない限り、位置特定されることになる。複数の位置特定テキスト要約のうちの最も適切なものを選ぶことを可能にするよう、システムは好ましくは、各要約を検査し、予め定義される基準を最もよく満たすものを選ぶセレクタを備える。
適切な要約を選ぶ基準は、要約テキスト中に備えられている情報量と、要約を合成される音声として提示するのに必要な時間長とであり得る。例えば、映画の題名と、主演俳優の名前と、映画の簡単な説明と、映画レーティングとを挙げることで十分であり得る。この要約テキストは、オーディオ・コンテンツから抽出されるビデオ・クリップ並びに背景音楽及び/又は音響効果とともにトレーラとして短時間に合成し、提示することが可能であり、このことは、最小量の情報に基づいてすばやい選択を行おうとする視聴者に好都合であり得る。一方、視聴者はより詳細に知りたい場合があるので、映画のコンテンツについての更なる情報も、映画の背景、主演俳優全員、プロデューサ、監督、映画賞の受賞などについての情報とともに要約テキストに存在すべきである。この情報は、オーディオ・コンテンツから抽出される音響効果及び音楽が場合によっては付随する、更に広範なビデオ・セレクションとともに合成し、提示して、記録に対する非常に有益なトレーラを供給し得る。
合成される要約テキストの品質は、音声合成において用いる音声プロファイルを規定し得るユーザによっても制御し得る。視聴者は、例えば、自分自身の音声プロファイルを合成に加えさせたい場合があり、音声プロファイルが記録における主演俳優のものと一致することをどちらかといえば好む場合もある。
したがって、本発明の特に効果的な実施例によって、いくつかの要約のうちの1つを選択する基準、例えば、要約の所望の長さ、情報コンテンツの品質、などの選好と、要約テキストを音声に合成するうえでの選好とをユーザが規定することができる。この目的で、システムは好ましくは、そのような選好を入力するのに適切なユーザ・インタフェースを備える。
既存の要約の種類及び品質は、要約の存在するサイトによってある程度は変わってくる。一部は専門的にかつ高水準で編集されることになる一方、他のレビューは、かなり低水準のものであり、よって、ユーザが受け入れがたいものである場合がある。したがって、本発明の別の効果的な実施例によって、テキスト要約のサーチから除外する対象又はこのサーチに備える対象のインターネット・サイトを規定することによってサーチ手順の結果をユーザが制御することができる。好ましくは、ユーザはそのようなサーチ選好をユーザ・インタフェースによって入力することができる。
本発明の更なる実施例は、ユーザ・プロファイルにおいて必要なテキスト要約の種類及び長さと、ユーザ・プロファイルにおける要約の品質とに関してユーザによって規定される情報を記憶する手段を備える。効果的には、システムは、2つ以上のユーザ・プロファイルを記憶することができるようにしているので、2つ以上の視聴者が、ユーザ・プロファイル情報を毎回入力する必要なくシステムを利用することができる。
本発明の特に効果的な実施例では、システムは、サーチ装置と、場合によってはセレクタとを用いて、予め生成されるテキスト要約を収集し、これを局所で要約ライブラリに記憶して将来利用するようにしている。サーチ装置は、ユーザによる入力を必要とすることなくこの作業をバックグラウンドで行い得る。要約はテキスト形式のものであるので、そのような要約集を記憶しても大容量のメモリは必要としない。ユーザは、テキスト要約集を後の時点で、テレビ上やコンピュータ画面上などの画面上か、プリントアウトの形式でそれを視ることによって閲覧し、要約に備える情報に基づいて、特定の映画を記録する価値があるか否かを決定する。映画を記録することをユーザが決定する場合には、適切なテキストに既に目印が付けられており、局所ライブラリにおいて非常に容易に見つけ、更にこのライブラリから抽出し、記録に対するトレーラを生成するのに用いることができる。
本発明の特に効果的な実施例では、システムは、コンピュータ・ネットワーク・インタフェースを利用して特定の映画に適切な、予め生成されたテキスト要約についてコンピュータ・ネットワークをサーチする。インタフェースは、例えば、モデム、ISDN接続又はDSL接続や、何れかの所要ハードウェア及び所要ソフトウェアによって実現することが可能である。インタフェースの更なる実施例は、無線接続を用いてコンピュータ・ネットワークと接続し得る。システムが接続するコンピュータ・ネットワークは、局所のイントラネット又はワールドワイドウェブ(インターネット)であり得る。例えば、インターネット上には、あらゆる映画についての一般的な情報を備え、レビュー及び要約も備える、映画に特化したサイトが多く存在している。サーチ・エンジンは、好ましくは所望の言語でのこの既存の要約を見つけ、それをシステムにダウンロードして更に処理することができる。システムのサーチ・エンジンは、場合によってはより強力なサーチ・エンジン(例えば、メタクローラ)のサービスを利用して並列サーチを行い、それによって所望の結果を得るのに要する時間量を最小にする場合もある。本発明の好ましい実施例によって、システムが所望の情報への容易でかつ効率的なアクセスを有するように、テキスト記述を直接供給するウェブ・ベースのサービス・プロバイダとサーチ装置が接続することができる。
番組コンテンツの要約はオリジナル・サウンドトラックの一部を備えている場合に、より面白くかつ有益なものになるので、本発明は好ましくは、視聴覚信号上の音楽及び音響効果を識別するオーディオ・プロセッサを備えるが、それは、元のオーディオ・コンテンツの抜粋を聴くことによって視る対象の記録を視聴者が選ぶのに有用であり得るからである。元のオーディオ・コンテンツをそのように備えることは、例えば、情報が与えられたうえでの選択を目玉の音楽の種類に基づいて視聴者が行うことができるような、音楽又はコンサートの記録の要約の場合に特に効果的であり得る。スリラー映画やミステリー映画の場合、オリジナル・サウンドトラックから複製される音響効果を備えることによって、記録の雰囲気を出すことに寄与することになる。所望の場合、元の音声コンテンツも要約中に所々に、場合によっては合成される要約のものよりも低い音量でミキシングし得る。
本発明の好ましい特徴は、予め生成される要約を見つけ、ユーザ選好によって適切な要約を選択し、テキストを音声に合成し、ビデオ要約を生成し、ビデオ成分及びオーディオ成分をミキシングして完成された要約を供給するうえで関係する工程全てを行うコンピュータ・プログラムを備える、すなわち、サーチ装置、セレクタ、合成器、ビデオ要約生成器などの、システムの構成部分の大半又は全部を、ソフトウェア・モジュールの形態で実現し、適切なハードウェア構成部分上で実施することが可能である。所要ソフトウェアは、TV、VCR、マルチメディアPCなどの何れかのメディア装置のプロセッサ上にコード化してもよく、本発明の特徴の恩恵を受けるよう既存のメディア装置を形成し得るように別個のプロセッサ上にコード化してもよい。
本発明の他の目的及び特徴は、以下の詳細の説明を添付図面とともに検討することによって明らかとなる。
本発明の、考えられる他の実現形態を排除するものでない以下の図の記載において、視聴覚装置24、例えば、家庭用娯楽システム、TV、マルチメディア装置など、に接続されているシステムを示す。明瞭にするために、ユーザ25とシステム1との間のインタフェース12は、図では概略のみを備えている。しかし、システム1は、ユーザ・インタフェースの通常の方法でユーザ25によって送出されるコマンドを解釈する手段を備え、視聴覚信号を出力する手段、例えば、TVのスピーカ、TV画面など、も備え得る。
図1は、自動要約生成システム1を示し、このシステムでは、サーチ装置4が、外部コンピュータ・ネットワーク18、例えばインターネット、における番組コンテンツ3に関連付けられる、予め生成されるテキスト要約51,52,…,5i,5nを位置特定する。
番組コンテンツ3は、例えばビデオ上やDVD上の記録14からのものでもよく、テレビジョン放送26として受信されるものでもよい。スイッチ22によって、番組コンテンツ3のソースの選択ができる。ユーザ25によってユーザ・インタフェース12を介して入力されるか、番組コンテンツ3が付随する字幕情報から抽出される、番組コンテンツ3に関する情報がサーチ装置4に転送される。
サーチ装置4はこの情報を用いて、適切な要約が局所テキスト要約ライブラリ15に既に記憶されているかを確かめる。あるいは、サーチ装置4の一部であるインターネット・サーチ・エンジン17は、適切な、予め生成される要約51,52,…,5i,…,5nをインターネット18において位置特定し、コンピュータ・ネットワーク・インタフェース16を介してそれらをダウンロードし得る。2つ以上の適切なテキスト要約51,52,…,5i,…,5nがインターネット18上で位置特定される場合、サーチ装置4のセレクタ11は、ユーザ25によってユーザ・インタフェース12を介して入力され、局所でメモリ27に他のユーザ選好13とともに記憶される、予め規定される基準を最もよく満たすものを決定する。この基準に基づいて、要約5iが選択され、合成モジュール6に転送され、合成モジュールはディジタル形式のテキスト要約5iを音声7に変換する。合成は、合成音声7に加える対象の音声プロファイルなどの、他の種類のユーザ選好13によって制御され得る。
一方、ビデオ要約生成器8は適切なビデオ・シーケンスを、番組コンテンツ3において識別し、ビデオ要約9に集約する一方、オーディオ・プロセッサ19は適切なオーディオ・コンテンツ、例えば、音響効果又は音楽、を識別し、これをオーディオ要約20に集約する。ビデオ要約生成器8及びオーディオ・プロセッサ19は、1つの装置を備えるものでもよく、別個の構成部分として実現されるものでもよい。
オーディオ・ビデオ・ミキサ10は、ビデオ及びオーディオの要約9,20を合成オーディオ音声7と組み合わせて番組コンテンツ3に対する完成要約2を供給する。要約2は、TV上、コンピュータ画面上、マルチメディア装置上などの視聴覚装置24上で視ること及び/又は、記憶媒体23上、例えば、ビデオテープ上、DVD上、ハードディスク上、(取り外し可能な)ソリッドステート・メモリ上などに記憶して将来用いること、ができる。
この例で説明したシステム1は、例えば、視聴覚装置24に接続された一種のセットトップボックスであり得る、単一の装置21として示す。しかし、説明した追加構成部分(サーチ装置4、音声合成器6、ビデオ要約生成器8、オーディオ/ビデオ・ミキサ10)の全てを統合して、単一の装置を視聴覚装置24とともに提示してもよく、視聴覚装置24に接続されるパソコン・システムの一部として実現してもよい。
本発明は好ましい実施例とそれに対する変形との形態で開示したが、数多くの更なる修正及び変形をそれらに対して本発明の範囲から逸脱することなく行い得るということが分かる。例えば、メモリに記憶されているテキスト要約は、最新の要約をインターネットからダウンロードすることによって適宜、更新又は置換することができる。利用可能な最も最新のビデオ・データを自動要約生成システムが利用することができるように、記録する対象の映画に関連付けられる第3者プロバイダの高品質の既製ビデオ・クリップからダウンロードすることが可能になり得る。本発明の更なる応用は、情報を与えられたうえでの選択を顧客が行うことができるように、ビデオ及びDVDのレンタルを行う顧客に、例えば、レンタル施設にある視聴覚装置上で、ブラウジングするよう短く簡潔なトレーラのライブラリを提示するか、そのライブラリをビデオ又はDVDのカタログの形式で提示するというものであり得る。別の応用は、何千もの映画が記憶されているフィルム・アーカイブを目録に載せるのに用い得る。
明瞭にするために、本出願を通じて「a」又は「an」を使用していることは複数形を排除するものでなく、「comprising」は他の工程又は構成要素を排除するものでないこととする。
本発明の実施例による、自動要約生成システムを示す略構成図である。

Claims (11)

  1. 視聴覚番組コンテンツに対する視聴覚要約を自動的に生成するシステムであって、
    前記番組コンテンツと関連付けられる、予め生成されるテキスト要約を位置特定するサーチ装置と、
    選択されるテキスト要約を音声に変換する音声合成器と、
    前記視聴覚番組コンテンツのビデオ要約を生成するビデオ要約生成器と、
    前記合成音声を前記ビデオ要約とミキシングするオーディオ/ビデオ・ミキサとを備えることを特徴とするシステム。
  2. 請求項1記載のシステムであって、
    前記サーチ装置が、予め規定される基準によって1つのテキスト要約を前記位置特定されるテキスト要約から、2つ以上の要約が位置特定された場合に選択するセレクタを備えることを特徴とするシステム。
  3. 請求項1又は2記載のシステムであって、
    ユーザ選好を入力するユーザ・インタフェースを備えることを特徴とするシステム。
  4. 請求項1乃至3の何れかに記載のシステムであって、
    予め生成されるテキスト要約を記憶して将来用いるライブラリを備えることを特徴とするシステム。
  5. 請求項1乃至4の何れかに記載のシステムであって、
    コンピュータ・ネットワーク・インタフェースと、予め生成されるテキスト要約をコンピュータ・ネットワークにおいて位置特定するサーチ・エンジンとを備えることを特徴とするシステム。
  6. 請求項1乃至5の何れかに記載のシステムであって、
    前記要約に備えるのに適切な、視聴覚信号のオーディオ・コンテンツを識別するオーディオ・プロセッサを備えることを特徴とするシステム。
  7. メディア装置であって、
    請求項1乃至6の何れかに記載のシステムを備えることを特徴とするメディア装置。
  8. 視聴覚番組コンテンツに対する視聴覚要約を自動的に生成する方法であって、
    前記番組コンテンツと関連付けられる、予め生成されるテキスト要約を位置特定する工程と、
    選択されるテキスト要約を音声に合成する工程と、
    前記視聴覚番組コンテンツのビデオ要約を生成する工程と、
    前記合成音声を前記ビデオ要約とミキシングする工程とを備えることを特徴とする方法。
  9. 請求項8記載の方法であって、
    テキスト要約が、予め規定される基準によって前記位置特定されるテキスト要約から、2つ以上の要約が位置特定された場合に選択されることを特徴とする方法。
  10. 請求項8又は9記載の方法であって、
    予め生成されるテキスト要約の位置特定及び/又は選択を行う工程が、ユーザ選好によって行われることを特徴とする方法。
  11. コンピュータ・プログラムであって、
    請求項8乃至10の何れかに記載の方法の工程全てを行うというものであって、
    メディア装置の一部として実施されることを特徴とするコンピュータ・プログラム。
JP2006530866A 2003-05-26 2004-05-17 視聴覚番組コンテンツの視聴覚要約を生成するシステム及び方法 Expired - Fee Related JP4965257B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP03101522.5 2003-05-26
EP03101522 2003-05-26
PCT/IB2004/050714 WO2004105035A1 (en) 2003-05-26 2004-05-17 System and method for generating audio-visual summaries for audio-visual program content

Publications (2)

Publication Number Publication Date
JP2007511854A true JP2007511854A (ja) 2007-05-10
JP4965257B2 JP4965257B2 (ja) 2012-07-04

Family

ID=33462216

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006530866A Expired - Fee Related JP4965257B2 (ja) 2003-05-26 2004-05-17 視聴覚番組コンテンツの視聴覚要約を生成するシステム及び方法

Country Status (6)

Country Link
US (1) US7890331B2 (ja)
EP (1) EP1631962A1 (ja)
JP (1) JP4965257B2 (ja)
KR (1) KR20060014426A (ja)
CN (1) CN1795506B (ja)
WO (1) WO2004105035A1 (ja)

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2567505A1 (en) * 2006-11-09 2008-05-09 Ibm Canada Limited - Ibm Canada Limitee System and method for inserting a description of images into audio recordings
US20100002137A1 (en) * 2006-11-14 2010-01-07 Koninklijke Philips Electronics N.V. Method and apparatus for generating a summary of a video data stream
US8494343B2 (en) * 2007-12-31 2013-07-23 Echostar Technologies L.L.C. Methods and apparatus for presenting text data during trick play mode of video content
DE102008044635A1 (de) 2008-07-22 2010-02-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Bereitstellen einer Fernsehsequenz
US8437617B2 (en) 2009-06-17 2013-05-07 Echostar Technologies L.L.C. Method and apparatus for modifying the presentation of content
US8352506B2 (en) * 2009-08-31 2013-01-08 Pod Poster LLC Automatic submission of audiovisual content to desired destinations
US9223870B2 (en) 2012-11-30 2015-12-29 Microsoft Technology Licensing, Llc Decoration of search results by third-party content providers
TWI482486B (zh) * 2013-01-30 2015-04-21 Wistron Corp 影音串流的預覽及播放方法及其系統
US10691737B2 (en) * 2013-02-05 2020-06-23 Intel Corporation Content summarization and/or recommendation apparatus and method
KR102070924B1 (ko) * 2014-01-20 2020-01-29 한화테크윈 주식회사 영상 기록 시스템
US11051075B2 (en) 2014-10-03 2021-06-29 Dish Network L.L.C. Systems and methods for providing bookmarking data
KR101994291B1 (ko) 2014-10-14 2019-06-28 한화테크윈 주식회사 통합써머리를 제공하는 영상재생장치 및 방법
US10140259B2 (en) 2016-04-28 2018-11-27 Wipro Limited Method and system for dynamically generating multimedia content file
CN110753269B (zh) * 2018-07-24 2022-05-03 Tcl科技集团股份有限公司 视频摘要生成方法、智能终端及存储介质
CN110166851B (zh) * 2018-08-21 2022-01-04 腾讯科技(深圳)有限公司 一种视频摘要生成方法、装置和存储介质
CN109600625B (zh) * 2018-12-20 2021-06-01 深圳创维-Rgb电子有限公司 一种节目搜索方法、装置、设备及介质
CN109740015A (zh) * 2019-01-09 2019-05-10 安徽睿极智能科技有限公司 基于音频浓缩摘要的海量音频检索方法
US10970040B2 (en) 2019-03-01 2021-04-06 Bose Corporation Systems and methods for augmented reality content harvesting and information extraction
CN111859973A (zh) * 2019-04-08 2020-10-30 百度时代网络技术(北京)有限公司 用于生成解说词的方法和装置
WO2020248124A1 (en) 2019-06-11 2020-12-17 WeMovie Technologies Production-as-service systems for making movies, tv shows and multimedia contents
WO2021022499A1 (en) 2019-08-07 2021-02-11 WeMovie Technologies Adaptive marketing in cloud-based content production
WO2021068105A1 (en) 2019-10-08 2021-04-15 WeMovie Technologies Pre-production systems for making movies, tv shows and multimedia contents
WO2021225608A1 (en) 2020-05-08 2021-11-11 WeMovie Technologies Fully automated post-production editing for movies, tv shows and multimedia contents
US11070888B1 (en) 2020-08-27 2021-07-20 WeMovie Technologies Content structure aware multimedia streaming service for movies, TV shows and multimedia contents
US11166086B1 (en) 2020-10-28 2021-11-02 WeMovie Technologies Automated post-production editing for user-generated multimedia contents
US11812121B2 (en) 2020-10-28 2023-11-07 WeMovie Technologies Automated post-production editing for user-generated multimedia contents
US11330154B1 (en) 2021-07-23 2022-05-10 WeMovie Technologies Automated coordination in multimedia content production
US11321639B1 (en) 2021-12-13 2022-05-03 WeMovie Technologies Automated evaluation of acting performance using cloud services

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05313686A (ja) * 1992-04-02 1993-11-26 Sony Corp 表示制御装置
JPH1023362A (ja) * 1996-07-01 1998-01-23 Matsushita Electric Ind Co Ltd ビデオ・サーバ装置
JP2000231475A (ja) * 1999-02-10 2000-08-22 Nippon Telegr & Teleph Corp <Ntt> マルチメディア情報閲覧システムにおける音声読み上げ方法
JP2000261754A (ja) * 1999-03-05 2000-09-22 Jisedai Joho Hoso System Kenkyusho:Kk ダイジェスト作成装置,ダイジェスト作成方法およびその方法の各工程をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2001343990A (ja) * 2000-03-30 2001-12-14 Fujitsu Ltd テキスト情報読み上げ装置と、これを組み込んだ音楽音声再生装置、媒体、およびプログラム
JP2002149672A (ja) * 2000-11-08 2002-05-24 Nec Corp Avコンテンツ自動要約システム及びavコンテンツ自動要約方式
JP2002189728A (ja) * 2000-12-21 2002-07-05 Ricoh Co Ltd マルチメディア情報編集装置、その方法および記録媒体並びにマルチメディア情報配信システム
JP2002245069A (ja) * 2001-02-15 2002-08-30 Nippon Telegr & Teleph Corp <Ntt> 放送内容要約装置及び方法、放送内容要約プログラム並びにそのプログラムを記録した記録媒体

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5805733A (en) * 1994-12-12 1998-09-08 Apple Computer, Inc. Method and system for detecting scenes and summarizing video sequences
EP0938053B1 (en) * 1998-02-20 2003-08-20 Hewlett-Packard Company, A Delaware Corporation Methods of refining descriptors
JP2000020744A (ja) * 1998-07-06 2000-01-21 Nippon Telegr & Teleph Corp <Ntt> 動画像と合成音声によるコンテンツ制作方法およびプログラム記録媒体
US6714909B1 (en) * 1998-08-13 2004-03-30 At&T Corp. System and method for automated multimedia content indexing and retrieval
US6751776B1 (en) * 1999-08-06 2004-06-15 Nec Corporation Method and apparatus for personalized multimedia summarization based upon user specified theme
US7181757B1 (en) * 1999-10-11 2007-02-20 Electronics And Telecommunications Research Institute Video summary description scheme and method and system of video summary description data generation for efficient overview and browsing
US20020051077A1 (en) * 2000-07-19 2002-05-02 Shih-Ping Liou Videoabstracts: a system for generating video summaries
US6998527B2 (en) * 2002-06-20 2006-02-14 Koninklijke Philips Electronics N.V. System and method for indexing and summarizing music videos

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05313686A (ja) * 1992-04-02 1993-11-26 Sony Corp 表示制御装置
JPH1023362A (ja) * 1996-07-01 1998-01-23 Matsushita Electric Ind Co Ltd ビデオ・サーバ装置
JP2000231475A (ja) * 1999-02-10 2000-08-22 Nippon Telegr & Teleph Corp <Ntt> マルチメディア情報閲覧システムにおける音声読み上げ方法
JP2000261754A (ja) * 1999-03-05 2000-09-22 Jisedai Joho Hoso System Kenkyusho:Kk ダイジェスト作成装置,ダイジェスト作成方法およびその方法の各工程をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2001343990A (ja) * 2000-03-30 2001-12-14 Fujitsu Ltd テキスト情報読み上げ装置と、これを組み込んだ音楽音声再生装置、媒体、およびプログラム
JP2002149672A (ja) * 2000-11-08 2002-05-24 Nec Corp Avコンテンツ自動要約システム及びavコンテンツ自動要約方式
JP2002189728A (ja) * 2000-12-21 2002-07-05 Ricoh Co Ltd マルチメディア情報編集装置、その方法および記録媒体並びにマルチメディア情報配信システム
JP2002245069A (ja) * 2001-02-15 2002-08-30 Nippon Telegr & Teleph Corp <Ntt> 放送内容要約装置及び方法、放送内容要約プログラム並びにそのプログラムを記録した記録媒体

Also Published As

Publication number Publication date
KR20060014426A (ko) 2006-02-15
US7890331B2 (en) 2011-02-15
CN1795506B (zh) 2011-04-20
JP4965257B2 (ja) 2012-07-04
EP1631962A1 (en) 2006-03-08
CN1795506A (zh) 2006-06-28
US20070171303A1 (en) 2007-07-26
WO2004105035A1 (en) 2004-12-02

Similar Documents

Publication Publication Date Title
JP4965257B2 (ja) 視聴覚番組コンテンツの視聴覚要約を生成するシステム及び方法
KR101009629B1 (ko) 디지털 방송 프로그램 서비스를 제공하기 위한 확장메타데이터의 데이터 구조와 이를 이용한 적응적 프로그램서비스 제공 시스템 및 그 방법
KR101683323B1 (ko) 미디어 콘텐츠 검색 시스템 및 개인용 가상 채널
KR102017437B1 (ko) 속성을 공유하는 상이한 유형의 미디어 콘텐츠를 연관시키고 제공하는 시스템 및 방법
US9591051B2 (en) Systems and methods for providing customized media channels
US8750686B2 (en) Home media server control
JP2012008789A (ja) 動画推薦システム及び動画推薦方法
JPH07236099A (ja) 情報再生装置を内蔵したテレビジョン装置
JP2006524956A (ja) メタデータを用いてスレートを自動生成するシステムおよび方法
JP2005525608A (ja) 高音質のサウンドを用いたビデオ・インデキシング方法
CN1976430B (zh) 一种实现在终端对移动多媒体节目进行预览的方法
US7823067B2 (en) Process of navigation for the selection of documents associated with identifiers, and apparatus implementing the process
JP5062656B2 (ja) コンテンツ再生方法及びその装置並びに総覧情報生成方法及びその装置
JP2006500674A (ja) 異なるタイプのメディアコンテンツを関連付けるシステム及び方法
KR20090093105A (ko) 컨텐츠 재생 장치 및 방법
JP4796466B2 (ja) コンテンツ管理サーバ、コンテンツ提示装置、コンテンツ管理プログラム、及びコンテンツ提示プログラム
JP2004521525A (ja) 番組よりも下位レベルでのテレビショー番組の視覚化及び再生
JP5452400B2 (ja) コンテンツ再生装置および組み合わせ方法記述データ提供装置
JP2012004687A (ja) コンテンツ再生装置、コンテンツ出力装置、およびコンテンツ再生システム
JP2001359060A (ja) データ放送サービス送出装置、データ放送サービス受信装置、データ放送サービス送出方法、データ放送サービス受信方法、データ放送サービス制作支援システム、インデックス情報生成装置、デジタル放送送受信システム
JP2003298962A (ja) 放送チャンネル選択装置、放送チャンネル選択方法および放送チャンネル選択プログラム並びに放送番組情報提供装置及び放送番組情報提供プログラム
JP2006215903A (ja) 画像表示装置、コンテンツ検索方法およびコンテンツ検索プログラム
KR100700783B1 (ko) 오디오 파일 재생 방법 및 장치
JP2003037811A (ja) 番組情報記録システム及び記録媒体
JP2005210368A (ja) 再生装置および方法、記録媒体、並びにプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070514

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090611

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090714

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20091001

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20091008

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100108

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100921

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120329

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150406

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees