JP2002533841A - 個人用ビデオ分類及び検索システム - Google Patents

個人用ビデオ分類及び検索システム

Info

Publication number
JP2002533841A
JP2002533841A JP2000591534A JP2000591534A JP2002533841A JP 2002533841 A JP2002533841 A JP 2002533841A JP 2000591534 A JP2000591534 A JP 2000591534A JP 2000591534 A JP2000591534 A JP 2000591534A JP 2002533841 A JP2002533841 A JP 2002533841A
Authority
JP
Japan
Prior art keywords
story
segment
segments
user
video
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000591534A
Other languages
English (en)
Inventor
ハー エレンバース,ヤン
ディミトロワ,ネヴェンカ
マギー,トマス
シンプソン,マーク
エイ マルティーノ,ジャックリン
モハメッド アブデル−モタレブ、
ギャレット,マージョリー
ラムジー,キャロリン
デサイー,ランジット
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Philips Electronics NV filed Critical Philips Electronics NV
Publication of JP2002533841A publication Critical patent/JP2002533841A/ja
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/812Monomedia components thereof involving advertisement data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying
    • G06F16/735Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying
    • G06F16/738Presentation of query results
    • G06F16/739Presentation of query results in form of a video summary, e.g. the video summary being a video sequence, a composite still image or having synthesized frames
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7834Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using audio features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7844Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using original textual content or text extracted from visual content or transcript of audio data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/4508Management of client data or end-user data
    • H04N21/4532Management of client data or end-user data involving end-user characteristics, e.g. viewer profile, preferences
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/454Content or additional data filtering, e.g. blocking advertisements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/458Scheduling content for creating a personalised stream, e.g. by combining a locally stored advertisement with an incoming stream; Updating operations, e.g. for OS modules ; time-related management operations
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/16Analogue secrecy systems; Analogue subscription systems
    • H04N7/162Authorising the user terminal, e.g. by paying; Registering the use of a subscription channel, e.g. billing
    • H04N7/163Authorising the user terminal, e.g. by paying; Registering the use of a subscription channel, e.g. billing by receiver means only

Abstract

(57)【要約】 ユーザがビデオストリームから関心となるストーリーを迅速且つ容易に選択及び受信することを可能とするビデオ検索システムが提供される。ビデオ検索システムはストーリーを分類し、各ユーザの現在の好みに一致する選択されたストーリーのサンプルを発生させる。ユーザの好みは、特定の放送ネットワーク、人物、ストーリートピック、キーワード等を含む。各選択されたストーリーのキーフレームは順次に表示される。ユーザが関心のあるフレームを見るとき、ユーザはより詳細に見るためにキーフレームに関連付けられたストーリーを選択する。本発明は目標をしぼったニュース検索に特に適している。望ましい実施例では、ニュースストーリーが記憶され、関連付けられたキーフレームに基づいて詳細に見るためにニュースストーリーを選択することにより選択されたニュースストーリーが再生される。本発明の原理はユーザが他のタイプの放送についても指示された検索を行なうことを可能とする。例えば、ユーザは指示されたチャンネルサーフ動作と類似した、ユーザの現在の好みに従った放送のサンプルを表現する自動化されたスキャンを開始しうる。

Description

【発明の詳細な説明】
【0001】 発明の背景 1.発明の属する技術分野 本発明は通信及び情報処理の分野に関連し、更に特定的にはビデオ分類及び検
索の分野に関する。
【0002】 2.関連技術の説明 消費者に提供される情報供給及び娯楽オプションは益々増加している。消費者
は、放送、ケーブル、及び衛星通信システムを介して数百のテレビジョンチャン
ネルを利用可能である。情報の供給が増加しているため、特定の又は特殊な関心
の情報を提供する情報ソースを効率的に選択することは消費者にとって更に困難
となっている。例えば、数十のテレビジョンチャンネルからその消費者にとって
関心のあるトピックをランダムに探索する(「チャンネルサーフする」)消費者
について考える。そのユーザにとって特に関心となるトピックが人気のあるトピ
ックでない場合、1つ又は2つの放送局のみがこのトピックを扱うストーリーを
短い時間に亘ってのみ放送しているであろう。消費者に対して前もって通知しな
いかぎり、関心となるストーリーが放送されているときに関心を持った消費者が
特定の放送局に同調している可能性は低い。逆に、関心となるトピックが非常に
人気があれば、多くの放送局がそのトピックを扱うストーリーを放送し、チャン
ネルサーフする消費者に対して膨大な量の冗長な情報が与えられる。
【0003】 自動化されたスキャン動作は、一般的にラジオ放送に利用可能であり、テレビ
ジョン放送ではあまり一般的に利用可能ではない。従来、これらのスキャン動作
は、各放送チャンネルの短い持続時間のサンプルを与えるものである。ユーザが
チャンネルを選択すれば、チューナはそのチャンネルに同調したままとなり、そ
うでなければスキャン装置は次に見つかったチャンネルへ進む。しかしながら、
このスキャン動作は、指示されたものでなく、選択的なものでもない。ユーザが
特にラジオ上のニュース局、又はテレビジョン上のスポーツ番組をスキャンする
ために何らの支援も提供されていない。見つけられた各チャンネルは、ユーザの
現在の関心とは無関係にサンプリングされユーザに対して提供される。
【0004】 コンピュータとテレビジョンの融合が進むことにより、消費者に対して特定の
関心となる情報が提供される機会が与えられる。例えば、多くのウェブサイトは
、現在のニュースストーリーに対応するオーディオ・ビジュアル及びマルチメデ
ィアセグメントへのリンクを伴うニュース概説を提供する。これらのニュース概
説をソートすること及び示すことは、各消費者に対してカスタマイズされる。例
えば、或る消費者はまず天気予報を、次に世界のニュースを、その次に地方のニ
ュースを見ることを望む一方で、他の消費者はスポーツストーリー及び投資報告
のみを見ることを望む。このシステムの利点は、ユーザに提供されるニュースが
カスタマイズされることであり、欠点は誰かが概説を準備せねばならない必要が
あり、更に消費者が概説を読んでそのストーリーを視聴する価値があるかどうか
を決める必要があることである。
【0005】 自動化されたストーリーのセグメント化及び識別の分野は継続的に進歩してお
り、これは、MITRE社(Andrew Merlino, Daryl Morey, Mark Maybury, MITRE Co
rporation, Bedford MA, Broadcast News Navigation using Story Segmentatio
n, ACM Multimedia Conference Proceedings, 1997, pp.381-389)のBNE(Br
oadcast News Editor)及びBNN(Broadcast News Navigator)より明らかで
ある。BNEを用いて、ニュース放送は個々のストーリーセグメントへ自動的に
分割され、セグメントに関連付けられた耳の不自由な人のための字幕(クロース
ド・キャプション)のテキストの最初の行が各ストーリーの概説として用いられ
る。各ストーリーセグメントに対して字幕テキスト又はオーディオからのキーワ
ードが決定される。BNNは消費者が検索ワードを入力することを可能とし、そ
れによりBNNは、各ストーリーセグメント内の検索ワードと一致するキーワー
ドの数によってストーリーセグメントをソートする。一致するキーワードの出現
の頻度に基づき、ユーザは関心のあるストーリーを選択する。同様のサーチ及び
検索技術は、この技術分野において一般的となってきている。例えば、従来のテ
キストサーチ技術はコンピュータベースのテレビ番組案内に適用されえ、それに
よりユーザは、特定の番組のタイトル、特定の演技者、特定のタイプの番組等に
ついてサーチしうる。
【0006】 従来のサーチ及び検索技術の不利な点は、明示的なサーチタスクが必要とされ
、これに対応して明示的なサーチに基づいて選択肢からの選択が必要とされるこ
とである。しかしながら、ユーザは明示的なサーチトピックについて考えていな
い。一般的なチャンネルサーフシナリオでは、ユーザは明示的なサーチトピック
を有さない。チャンネルサーフしているユーザは、特定のトピックについて特定
的にサーチするよりもむしろ、関心となりうる多数のトピックのいずれかについ
て様々なチャンネルをランダムにサンプリングする。即ち、例えば、ユーザは特
定のトピックを考えずにランダムサンプリングを開始し、サンプリング時にチャ
ンネル上に示されているトピックに基づいてサンプリングされた多数のチャンネ
ルのうちの1つを選択する。他のチャンネルサーフシナリオでは、ユーザは例え
ば読書又は調理といった他の仕事を行なっている間に、「バックグランド」モー
ドでテレビジョンを監視しうる。関心となるトピックが現れると、ユーザは関心
対象を再びテレビジョンに戻し、あまり関心のないトピックが示されたときに他
の仕事に注意を戻す。
【0007】 発明の概要 本発明は、ユーザが関心となるストーリーを迅速且つ容易に選択し受信するこ
とを可能とするニュース検索システムを提供することを目的とする。本発明は、
潜在的にユーザの関心となる放送を識別し、続く選択のためにユーザに対してこ
れらの放送のランダムな又は系統的なサンプリング方法を提供することを目的と
する。
【0008】 上述及び他の目的は、ニュースストーリーを特徴付け、ユーザの現在の好みに
一致する選択されたニュースストーリーのサンプルを与えるシステムを提供する
ことによって達成される。ユーザの好みは、特定の放送ネットワーク、司会者、
ストーリートピック、キーワード等を含みうる。続いて各選択されたニュースス
トーリーのキーフレームが表示され、ユーザが関心となるフレームを見ていると
き、ユーザは詳細に見るためにキーフレームに関連付けられたニュースストーリ
ーを選択しうる。望ましい実施例では、ニュースストーリーは記憶され、詳細に
見るためにニュースストーリーを選択することにより選択されたストーリーが再
生される。
【0009】 本発明は、目標をしぼったニュース検索に特によく適しているが、本発明の原
理はユーザが放送に対して他のタイプの指示されたサーチを行なうことを可能と
する。例えば、ユーザはユーザの現在の好みに合う放送のサンプルを示す自動化
されたスキャンを始動させることができ、これは指示されたチャンネルサーフに
似ている。
【0010】 発明の詳細な説明 図1は、本発明による個人向けビデオサーチシステムを示す例示的なブロック
図である。ビデオ検索システムは、ビデオストリームの各セグメントを分類する
分類システム100と、1つ以上のユーザの好みに一致するセグメントを選択し
表示する検索システム150とを含む。ビデオ検索システムは、例えばテレビジ
ョンチューナ又は衛星受信器である放送チャンネル選択器105からビデオスト
リーム101を受信する。ビデオストリームは、ディジタル又はアナログ形式で
ありえ、放送はポイント・ツー・ポイント通信を含むビデオストリームを通信す
るために使用される任意の形式又は媒体でありうる。明瞭性のため及び理解を容
易とするため、本願に示されるビデオサーチシステムは、1組のユーザの好みに
従うニュースストーリーのためのサーチシステムについて示されるが、本願に記
載される原理は他のビデオサーチ適用にも拡張されうることが当業者によって明
らかとなろう。
【0011】 図1の例示的な分類システム100は、ストーリーセグメント識別部110、
分類部120、及び視覚特徴付け部130を含む。ストーリーセグメント識別部
110は、ビデオストリーム101を処理し、ビデオストリーム101の別個の
セグメント111を識別する。例えば、ビデオストリーム101はニュース放送
に対応し、散在する広告又はコマーシャルを伴う多数のニュースストーリーを含
む。ストーリーセグメント識別部110は、ビデオストリーム101から各別個
のストーリーセグメント111を複製すること、又はビデオストリーム101の
複製上で各別個のストーリーセグメント111の開始及び終端を識別する一組の
位置パラメータを形成することによって、ビデオストリーム101をニュースス
トーリーセグメント111へ分割する。破線106によって図示されるように、
望ましい実施例では、ビデオストリーム101は記憶装置115上に記憶され、
ビデオテープレコーダ、レーザディスク、DVD、DVR、CD−R/W、コン
ピュータファイルシステム等といった媒体上のセグメント111の位置に基づい
てセグメント111の再生が可能となる。理解を容易とするため、本発明は記憶
装置115上に記憶されたストーリーセグメント111を有するものとして示さ
れる。当業者によって明らかであるように、これはビデオストリーム101全体
を記録し、各ストーリーセグメント111をビデオストリーム101に対してイ
ンデックス付けすることと同等である。
【0012】 ストーリーセグメント111は、様々な技術を用いて識別される。一般的なニ
ュース放送は、ストーリーセグメント化に非常によく適した共通フォーマットに
従う。図2Aは、ニュース放送の例示的なビデオストリーム200を示す図であ
る。導入201の後、ニュースキャスター又は司会者が現れ211、最初のニュ
ースストーリーセグメント221を紹介する。最初のニュースストーリーセグメ
ント221が完了した後、再び司会者212が現れ、次のストーリーセグメント
222を紹介する。ストーリーセグメント222が完了した後、中断218があ
り、その後コマーシャル228となる。コマーシャル228の後、再び司会者2
12が現れ、次のストーリーセグメント223を紹介する。この司会者・ストー
リーのシーケンス、及びその間に散在するコマーシャルは、ニュース放送の終了
まで繰り返される。
【0013】 一般的には同じ舞台上の場所に、司会者が繰り返し現れる211乃至214こ
とにより、各ニュースセグメントの開始及び先行するニュースセグメント又はコ
マーシャルの終端が明確に識別される。ビデオストリーム中のコマーシャルを識
別するための技術は一般的に入手可能であり、例えばコマーシャルが現れたとき
に音声をミュートする装置において使用されている。コマーシャル228はまた
、ストーリーセグメント222の中で生じうる。コマーシャル228に対する中
断218は、司会者が繰り返し現れることも含みうるが、コマーシャル228の
発生は、新しいストーリーセグメントの紹介よりもむしろ、中断218として出
現を識別するために使用される。司会者はストーリーセグメント221乃至22
4の放送の中に出現しうるが、殆どの放送局はストーリーの紹介のために1つの
舞台上の場所を使用し、異なる段階の出現をダイアログショット又はコマーシャ
ルの後の繰り返しの出現のために使用する。例えば、司会者はストーリーの紹介
のためにニュースデスクのところに座っていることが示され、ニュースキャスタ
ーの続く画像はニュースデスクが画像中にないクローズアップでありうる。又は
、司会者はストーリーを紹介するために画面全体に表わされ、次に現地記者と話
すときは分割画面上に表わされる。或いは、司会者のショットはストーリーを紹
介するためには顔全体を示し、ストーリーの中では横顔とされる。一旦特徴的な
ストーリー紹介画像が識別されると、従来技術で周知の画像マッチング技術を用
いてストーリーセグメント化処理を自動化することができる。自動化されたスト
ーリーセグメント化を行なわせる中断を有さない場合、手動又は半自動化技術も
また使用されうる。また、カスタマイズ可能なビデオ構成及びスプライシングの
ためにMPEGといった標準が開発されているため、ビデオストリームがストリ
ームの中の個々のセグメントの開始及び終端を識別する明示的なマークを含むこ
とが期待される。
【0014】 ビデオストリームにはまた、オーディオストリーム230が関連づけられ、多
くの場合、オーディオストリーム230に対応する字幕テキストストリーム24
0が関連付けられる。図2Aの各ストーリーセグメント221乃至224は関連
付けられたオーディオセグメント231乃至234を有し、字幕テキスト241
乃至244を有することもある。オーディオセグメント231乃至234はビデ
オセグメントと同期し、各ストーリーセグメント221乃至224の中に含まれ
うる。オーディオ及びテキストの異なる伝送時間により、字幕テキストセグメン
ト241乃至244は、必ずしもオーディオセグメント231乃至234と同じ
タイムスパンを消費しなくともよい。ストーリーセグメント識別部110はまた
、各オーディオセグメント231乃至234に対応するテキストセグメント24
1乃至244を形成する音声認識装置を含みうる。
【0015】 オーディオセグメントを書き換えたものに加え、テキストセグメント241乃
至244は他のソースからのテキストも含む。例えば、ニュースではない放送で
は、各ストーリーのあらすじ、登場人物の一覧、論評家のレーティング等を与え
るテレビ案内が利用可能である。ニュース放送では、ヘッドラインの一覧、ニュ
ースキャスターの一覧、放送に関連する会社又は人の一覧等を与えるオンライン
案内が利用可能でありうる。各放送及び各ストーリーセグメントには、放送チャ
ンネル選択器105によって監視される放送チャンネルを示すテキスト形式の注
釈、例えば「ABC」、「NBC」、「CNN」等、及び、各ストーリーを紹介
する各司会者の名前が関連付けられうる。司会者の名前は、画像認識技術に基づ
いて自動的に決定されてもよく、又は手動で決定されてもよい。他の注釈は、放
送の時間、各ストーリーの場所等を含みうる。本発明の望ましい実施例では、こ
れらのテキスト形式の各情報セグメントは対応するストーリーセグメントと関連
付けられる。テレテキスト形式のデータもまたテキストセグメント241乃至2
44に含まれうる。
【0016】 図2Aのストーリーセグメント241乃至244、オーディオセグメント23
1乃至234、及びテキストセグメント241乃至244は、図1のストーリー
セグメント識別部110からのストーリーセグメント111、オーディオセグメ
ント112、及びテキストセグメント113に対応し、ビデオセグメント228
、オーディオセグメント238、及びテキストセグメント248はコマーシャル
に対応する。
【0017】 図2Bは、本発明の1つの面によるビデオストリームのストーリーセグメント
からのキーフレームの抽出を示す図である。ストーリーセグメント221は、多
数のシーン251乃至253を含む。例えば、ストーリーセグメント221の最
初のシーン251はストーリーセグメント221を紹介する司会者の画像211
に対応する。次のシーン252は、ストーリーを扱う遠隔カメラからの画像であ
りえ、続くシーンは他の画像に対応しうる。各シーンはフレームからなる。各シ
ーン251、252、253の最初のフレーム261、271、281は、スト
ーリーセグメント221と関連付けられた一組のキーフレーム291、292、
293を形成し、キーフレームはストーリーセグメント221の絵的な概要を形
成する。図2Bのキーフレーム291、292、293は、図1のストーリーセ
グメント識別部110からのキーフレーム114に対応する。
【0018】 各シーンの最初のフレームは、フレーム間の差分に基づいて識別されうる。ス
トーリーの紹介中に司会者が動くにつれ、例えば、フレームとフレームの間では
僅かな差分のみが示される。画像のうちのニュースデスク又はニュース室の背景
に対応する領域はフレームとフレームの間では実質的に変化しない。例えば遠隔
カメラに切り換えることによりシーン変化が生ずると、画像全体が実質的に変化
する。多数の画像圧縮又は変換スキームにより、一連の画像を一連の差分画像と
して記憶又は伝送することが可能となる。差分がかなりのものであれば、新しい
フレームは一般的に参照フレームとして直接符号化され、続くフレームはこれら
の参照フレームからの差分として符号化される。
【0019】 図2Bはかかるスキームを各シーン251乃至253の中の各フレームFの相
対的なサイズによって示す図である。各シーン251、252、253の最初の
フレーム261、271、281は、かなりの量の情報を含む参照フレームとし
て符号化されるか、又はそれらの先行フレームからのかなりの数の差分を含む差
分画像として符号化される。シーンの変化の後、後続フレームはより小さく、フ
レームの中の対象の動きによって生ずる小さな変化又はカメラの角度又は倍率の
変化を有する同一の全体のシーンを反映する。各フレームに含まれる情報の量は
1つのフレームから次のフレームへの変化に直接関係する。MPEG圧縮スキー
ムでは、例えば、画像は離散コサイン変換(DCT)を用いて変換され、1つの
フレームから次のフレームへのランダムな変化の量に強く相関したサイズを有す
る符号化された各フレームを生成する。即ち、例えば、フレーム262、263
及び264は、シーン変化に対応するフレームであるフレーム261よりも少な
い情報を含むため、フレーム261よりもかなり小さく示される。
【0020】 従って、本発明の望ましい実施例では、キーフレーム291、292、293
はストーリーセグメント221の中の殆どの情報261、271、281を含む
フレームに対応する。当業者によれば、キーフレームを選択する他の技術が明ら
かとなろう。例えば、各シーンの中心からフレームを選択するか、例えば最小2
乗決定等を用いて、シーンの中の全ての他のフレームから最小の差分を有するフ
レーム選択することができる。ストーリーセグメント化の場合のように、キーフ
レームを選択するために手動又は半自動化技術もまた使用されえ、複合したもの
は各ストーリーセグメントの絵的な概要を形成する。またストーリーセグメント
化の場合のように、未来の符号化標準は各ストーリーセグメントの中のかかるキ
ーフレームの直接的な印を含みうる。
【0021】 分類部120は、図1の各ストーリーセグメント111を特徴付ける。望まし
い実施例では、分類部120は自動的に特徴付けを行なうが、手動又は半自動化
技術もまた使用されうる。望ましい実施例における主な特徴付け手段は、ストー
リーセグメント識別部110からのテキストセグメント113に基づく。テキス
トセグメント113が放送チャンネル及び司会者の名前といった注釈を含む場合
、これらの注釈は対応する「放送局」及び「司会者」カテゴリの中でストーリー
セグメントを識別するために使用される。テキストセグメント113がストーリ
ーセグメントの書換え又は概要である場合、「犯罪」というトピックの下にある
ニュースストーリーを特徴付けるために、「被害者」、「警察」、「犯罪」、「
被告人」等といったキーワードが使用される。「政治」というトピックの下にあ
るニュースストーリーを特徴付けるために、「民主党」、「共和党」、「下院」
、「上院」、「首相」等といったキーワードが使用される。下位分類もまた定義
でき、「ホームラン」は「スポーツ」カテゴリの下位にある「野球」サブカテゴ
リを特徴付け、一方、「タッチダウン」は「スポーツ」カテゴリの下位にある「
フットボール」サブカテゴリを特徴付ける。同様に、「クリントン」、「ビル・
ゲイツ」、「ジョン・ウェイン」といった名前が夫々「政治」、「コンピュータ
」、「娯楽」といったストーリーを分類するために使用される。ストーリーセグ
メントは多数の分類を有することができ、例えば、「ビル・ゲイツ」は「コンピ
ュータ」及び「金融」の両方のストーリーを分類するために使用されうる。同様
に、同一のストーリーの中に「被告人」及び「民主党」が存在すれば、ストーリ
ーは「犯罪」及び「政治」の両方として分類される。同様に、オーディオセグメ
ント112は分類のために使用されうる。間接的に、オーディオセグメント11
2はテキストに変換されえ、分類はテキストに適用されてもよい。直接的に、オ
ーディオセグメント112は、「喜劇」、「暴力」、及び「祝典」といった適当
な特徴付けを決定するために、笑い、爆発音、銃声、歓声等の音声を分析しうる
【0022】 任意に、視覚特徴付け部130は、視覚内容に基づいてストーリーセグメント
111を特徴付ける。視覚特徴付け部130は、視覚認識技術を用いてストーリ
ーセグメント中に現れる人物を識別するため、又は画像背景情報の分析に基づい
てトピックを識別するために使用されうる。例えば、視覚特徴付け部130は、
注目すべき人物の画像のライブラリを含みうる。視覚特徴付け部130は、単一
の又は支配的な形状を含む画像を識別し、これらの画像はライブラリ中の画像と
比較される。視覚特徴付け部130はまた、コンテキストシーン及び関連付けら
れたトピックカテゴリのライブラリを含む。例えば、等圧線を有する地図の横に
人物を含む画像は、トピックを「天気予報」として特徴的に識別する。同様に、
「屋内」又は「屋外」画像、「都市」、「田舎」、又は「海」等の場所として画
像を特徴付けるために画像処理技術が使用されうる。これらの可視特徴付け13
1は、各ストーリーセグメント111に関連付けられるテキスト113及びオー
ディオ12から形成される分類を追加し、変更し、又は補充するための分類部1
20に与えられる。例えば、ストーリーセグメント111の中に煙が現れれば、
オーディオセグメント112の中のサイレンの音の特徴付けを「警察」ではなく
「火事」へと更に正確にするために使用されうる。
【0023】 視覚特徴付け部130は、キーフレームに優先度を与えるためにも使用されう
る。ニュース放送は、各新しいシーンの選択に基づいて数十又は数百のキーフレ
ームを有しうる。望ましい実施例では、他の画像よりも多くの情報を含むであろ
う画像を選択することによってキーフレームの数が減少される。或る画像内容は
、かなりの内容を有する画像を示す。例えば、ニュース放送中に人物が最初に紹
介されるとき、しばしばその人物の画像の下に人物の名前が表示される。この人
物とテキストの複合画像は、一般的にストーリーセグメント111に関してかな
りの情報を伝える。同様に、人物のクローズアップ又は少人数のグループは、一
般的に遠いシーン又は大人数のグループのシーンよりも多くの情報を与える。画
像中の図形、肌の色、テキスト、及び他の顕著な特徴を認識するために、多数の
画像解析技術が一般的に利用可能である。望ましい実施例では、キーフレームは
かかる画像内容解析、及びシーンの時間的な順序といった他の合図によって優先
度が付けられる。一般的に、最も重要なシーンは、あまり重要でないシーンより
も早くストーリーセグメント111の中に表示される。キーフレームの優先度付
けは、優先度の順序で所与の番号のフレームを選択することにより、ストーリー
セグメント111についての内容の視覚テーブル、並びに、ビデオストリーム1
01についての内容の視覚テーブルを形成するためにも使用されうる。
【0024】 分類システム100は、分類部120からの各ストーリーセグメント111の
特徴付け又は分類121の組、及び、ストーリーセグメント識別部110からの
各ストーリーセグメント111のキーフレーム114の組を、検索システム15
0へ供給する。分類121は、様々な形式で供給されうる。望ましい実施例では
、「放送局」、「司会者」、「時間」、「場所」、及び「トピック」といった所
定のカテゴリが与えられ、例えば「場所」及び「トピック」といった幾つかのカ
テゴリは多数のエントリを許す。所定のカテゴリと共に使用される他の分類方法
は、選択キーワードのヒストグラム、又はストーリーセグメント111の中で話
に出た人物又は組織のリストである。分類システム100において使用される分
類121は、検索システム150のフィルタ160において使用されるフィルタ
リングシステムと一貫性があるか又は互換性があるべきであるが、必ずしも同一
でなくともよい。当業者によって明らかであるように、分類121又は分類12
1の一部をフィルタ160の中で使用されるフィルタリングシステムと互換性の
ある形式に変換するために、分類システム100と検索システム150との間に
分類翻訳部が追加されうる。この翻訳は、自動、手動、又は半自動化されうる。
理解を容易とするため、本願では、分類システム100による各ストーリーセグ
メント111の分類121は、検索システム150のフィルタ160と互換性が
あると想定される。
【0025】 検索システム150のフィルタ160は、各ストーリーセグメント111の分
類121に基づいて一組のユーザの好み191に従うストーリーセグメント11
1を識別する。本発明の望ましい実施例では、ユーザに対して、一組のユーザ入
力をフィルタ160のフィルタリングシステムと互換性があり分類121と互換
性のある好み191へ符号化するプロファイラ190が与えられる。例えば、分
類121が放送チャンネル又は司会者の識別子を含む場合、プロファイラ190
はユーザに対して、フィルタ160によって含めるため又は排除するために特定
のチャンネル又は司会者を指定するオプションを与える。
【0026】 望ましい実施例では、プロファイラ190は「不変の」好み及び「一時的な」
好みの両方を含み、一組の全体としての好みを維持しつつ、ユーザの現在の考え
の状態に依存する好みをユーザが容易に変更することを可能とする。一時的な組
では、例えば、「スポーツ」及び「天気予報」といったトピックの選択である。
不変の組では、例えば、司会者が現在の関心となるトピックを述べているかどう
かに関わらず排除すべき司会者のリストでありうる。同様に、不変の組は、一時
的な選択に関わらず含まれるべき「野球」又は「株式市場」といったトピックを
含みうる。サーチのために使用される一般的な技術と一貫して、プロファイラ1
90は結合、分離等を用いた規準の組み合わせを可能とする。例えば、ユーザは
、会社名の特定のリストに一致する1つ以上の単語を含む全ての「株式市場」ス
トーリーに不変の関心を指定しうる。
【0027】 フィルタ160は、ユーザの好み191に一致する分類121を有する各スト
ーリーセグメント111を識別する。一致の度合い、即ちフィルタのタイトネス
は、ユーザによって制御可能である。1つの極端な場合は、ユーザはユーザの好
み191のうちの任意の1つに一致する全てのストーリーセグメント111を要
求してもよく、他の極端な場合では、ユーザはユーザの好み191の全ての一致
する全てのストーリーセグメント111を要求してもよい。ユーザは、3つのト
ピック領域のうちの少なくとも2つに一致し、また一組のキーワードのうちの少
なくとも1つを含む全てのストーリーセグメント111を要求してもよい。ユー
ザはまた、ユーザが望まないトピック又はキーワード、例えば「スポーツ」は望
むが「ホッケー」は望まない、といった負の好み191を有しうる。フィルタ1
60は、ユーザの好み191を満足させる各ストーリーセグメント111をフィ
ルタリングされたセグメント161として識別する。
【0028】 望ましい実施例では、フィルタ160は、例えばストーリーセグメント111
の各分類121の中の各トピックのキーワードの数の計数を用いて、分類121
とユーザの好み191の間の一致の度合いに依存して各ストーリーをランク付け
するソータを含む。理解を容易とするため、本願ではランク付による順位は一次
元のスカラ量として表わされるが、多次元順位即ちベクトル順位が従来技術は周
知である。同じストーリーが多数の放送チャンネル上で報告されている場合、順
位162は、ユーザの好みの司会者、又は好みの放送チャンネルによって大きく
重み付けされ、この順位162は、最近のストーリーが好まれるため、各ニュー
ス放送の時間によって重み付けされうる。
【0029】 望ましい実施例では、ユーザは重み係数を調整するオプションを有する。例え
ば、ユーザは負の選択を絶対的にしうる。即ち、セグメントが否定されたトピッ
ク又はキーワードを含む場合、他の整合する好みとは無関係に、最低のレーティ
ングに割り当てられる。かかる優先度付けを行なうために、知識ベースのシステ
ム、ファジー論理システム、エキスパートシステム、学習システム等といった人
工知能技術の使用を含む多数の周知の技術が使用されうる。フィルタ160は、
順位162に基づいてストーリーセグメント111を選択し、これらの選択され
た、又はフィルタリングされたセグメント161の夫々の順位162を検索シス
テム150の表現部170に与える。
【0030】 本発明の他の実施例では、フィルタ160はまた、一般的には「トップストー
リー」と称される人気のあるストーリーを識別するために、多数のストーリーセ
グメントの中の同様のストーリーの発生を識別する。この識別は、ユーザの好み
191とは無関係に、ストーリーセグメント111間の分類121の類似性によ
って決定される。類似性の度合いは、異なるストーリーセグメント11に適用さ
れる同じトピック分類、及びキーワードのヒストグラム間の相関の度合い等に基
づきうる。類似したストーリーの発生の数に基づいて、フィルタ160は、ユー
ザの好み191とは無関係に、ストーリーセグメント111間の最も人気のある
現在のストーリーを識別する。或いは、フィルタ160は、好み191と少なく
とも幾らかの共通性を有する最も人気のある現在のストーリーを識別する。これ
らの最も人気のある現在のストーリーから、フィルタは、放送チャンネル、司会
者等についてのユーザの好み191に基づいて、表現部180による表現のため
に1つ以上のストーリーセグメント111を選択する。
【0031】 本発明によれば、表現部170は、ディスプレイ175上にフィルタリングさ
れたストーリーセグメント161のキーフレーム114を表現する。上述のよう
に、各ストーリーセグメント111に関連付けられた一組のキーフレームは、各
ストーリーセグメント111の絵的な概要を表わす。従って、本発明によれば、
表現部170は、ユーザの好み191に対応するストーリーセグメント161の
絵的な概要171を表わす。望ましい実施例では、各ストーリーセグメント16
1のために表示されるキーフレームの数は、画像内容、時間的順序、関連付けら
れたテキスト等に基づく上述の優先度付けスキームによって決定される。任意に
、絵的な概要の表現は、ストーリーセグメント111に関連付けられるオーディ
オセグメントの部分の演奏を伴ってもよい。例えば、オーディオセグメントの部
分は、司会者によるストーリーセグメントの紹介に対応する各ストーリーセグメ
ントの最初のオーディオセグメントでありうる。同様に、テキストセグメントの
概要もまた絵的な概要171の表示と同時に表示されうる。特定のフィルタリン
グされたストーリーセグメントの絵的な概要171がユーザの関心となる場合、
ユーザは検索システム150の中の再生部180による完全な再生のためにフィ
ルタリングされたストーリーセグメントを選択する。従来技術で周知であるよう
に、ユーザは、例えばマウスを使用して関心となるストーリーの表示されたキー
フレームを指すことによって、又は音声命令、ジェスチャー、キーボード入力等
によって選択を行なう。ユーザ選択176を受信すると、再生部180はディス
プレイ175上に選択されたストーリーセグメント181を表示する。
【0032】 図3は、検索システム150用の例示的なユーザインタフェースを示す図であ
る。ディスプレイ175は、フィルタリングされたストーリーセグメントのキー
フレーム171を表示するための区画310を含む。図3に示されるように、デ
ィスプレイ175は4つの区画310a、310b、310c及び310dを含
むが、表現部制御350を介してより少ない又はより多い区画が選択されうる。
表現部は、各キーフレーム171を区画310の中に順次に表現する。
【0033】 望ましい実施例では、1つのストーリーセグメント161に対応する各キーフ
レーム171は、区画310a、310b、310c及び310dのうちの1つ
の中に順次に表現される。即ち、図3中、4つのストーリーセグメント161の
キーフレーム171が同時に表示され、各区画は各ストーリーセグメント161
のための絵的な概要を与える。ユーザは各キーフレーム171の持続時間、また
ストーリーセグメント161からのキーフレーム171が、その区画の中に他の
ストーリーセグメント161からの一組のキーフレーム171が表現される前に
、所与の持続時間に亘って繰り返されるかどうかを決定するオプションを有する
。全てのフィルタリングされたストーリーセグメント161の全てのキーフレー
ム114が表現された後、サイクルは繰り返され、それによりユーザの好みに従
うストーリーセグメントのキーフレームの連続的なスライド表示を与える。
【0034】 他の表示方法が使用されうる。例えば、ストーリーセグメント161からの4
つのセグメントは、同時に全ての4つの区画310a、310b、310c及び
310dの中に表示されうる。同様に、1つの区画は、ストーリーセグメント1
61の最も優先度の高いシーンを含むよう構成される主区画として定義されても
よく、他の区画は続いてより低い優先度のシーンを表示する。ビデオ表現のため
の上述及び他の技術は、当業者によって明らかとなろう。望ましい実施例では、
キーフレーム171の表現及び選択のカスタマイズを容易とするため表現部制御
350が設けられる。
【0035】 フィルタ160が各フィルタリングされたストーリーセグメント161に関連
付けられた順位162を与える場合、表現部170は、キーフレーム171の各
表現された組の頻度又は持続時間を決定するために順位162を使用しうる。即
ち、例えば、表現部170は、フィルタリングされたストーリーセグメント16
1とユーザの好み191との間の一致の度合いに比例する反復レートでフィルタ
リングされたセグメント161のキーフレーム114を表現しうる。同様に、フ
ィルタ160によって多数のフィルタリングされたセグメント161が与えられ
れば、表現部170は、ユーザの好み191に対する一致の度合いが高いセグメ
ント161のキーフレーム114を1サイクル毎に表現しうるが、ユーザの好み
191に対する一致の度合いが低いセグメントのキーフレーム114は1サイク
ル毎よりも低い頻度で表現しうる。
【0036】 表現部制御350はまた、ユーザが表現部170と再生部180の間の相互関
係を制御することを可能とする。望ましい実施例では、ユーザは、選択されたス
トーリーセグメント181を1つの区画310の中に、一方で、他のストーリー
セグメントからのキーフレーム171は他の区画の中に表示され続けるようにし
て見ることができる。或いは、選択されたストーリーセグメント181は、ディ
スプレイ175の領域全体に表示されうる。視覚表示についての上述及び他のオ
プションは当業者によって周知である。ユーザはまた、音量制御、繰り返し、早
送り、巻き戻し等の従来の再生機能のための再生制御機能を表現部制御350の
中に与えられている。ストーリーセグメント111はストーリーセグメント識別
部の中でシーンへ分割されるため、再生機能350は、次のシーン、以前のシー
ン等といったオプションを含みうる。
【0037】 プロファイラ190へのユーザインタフェースもまた、ディスプレイ175を
介して与えられる。図3の例示的なインタフェースでは、ユーザがカテゴリの選
択において好み191を設定することを可能とするようボタン320が設けられ
る。「メディア」ボタン320aは、放送チャネル、司会者等に関するユーザオ
プションを可能とするために設けられる。「時間」ボタン320bは、フィルタ
160がどれだけ前まで戻ってストーリーセグメントを考慮せねばならないか、
といった時間設定に関するユーザオプションを与える。「トピック」ボタン32
0cは、ユーザがスポーツ、芸術、金融、犯罪等といったトピックからの選択を
可能とする。「場所」ボタン320dは、ユーザが関心のある地理的領域を指定
することを可能とする。「トップストーリー」ボタン320eは、ユーザが上述
の人気のあるストーリーセグメントの識別に対して適用されるべきフィルタパラ
メータを指定することを可能とする。「キーワード」ボタン320fは、ユーザ
が関心のある特定のキーワードを指定することを可能とする。当業者によって明
らかであるように、他のカテゴリ及びオプションもまた与えられうる。
【0038】 図3のユーザインタフェースは、表現330及び再生部340モードの選択を
可能とする。表現部170は、ユーザの好みの設定又は「トップ」ストーリーセ
グメントのキーフレームによって選択されるストーリーセグメントのキーフレー
ムを表現するよう設定されうる。再生部180は、上述の動作に対応し、ユーザ
がキーフレームをブラウズし関心のあるストーリーセグメントを選択するブラウ
ズモード、又は、再生部180がフィルタリングされたストーリーセグメント1
61の夫々を順次に表現する全再生モード、又は、再生部180がフィルタリン
グされたストーリーセグメント161の夫々の最初のシーンを順次に表現するス
キャンモードで動作するよう設定されうる。
【0039】 キーフレーム及び関連付けられた素材を表現する他の手段が設けられうる。表
現は多次元でもよく、例えば、ユーザの好み191に対するセグメント111の
相関の度合いが深さを示してもよく、キーフレームは、ユーザからどれだけ離れ
てキーフレームが現れるかを決定するためにこの深さを用いて多次元の斜視図で
表現されうる。同様に、ユーザの好みの異なったカテゴリ320が異なった平面
に関連付けられてもよく、各カテゴリにおいてユーザの好みに対して対良い相関
を有する各セグメントのキーフレームは各対応する平面に表示される。上述及び
他の表現技術は、本発明に関しては、当業者によって明らかである。
【0040】 本発明は主にニュース検索システムについて説明されるが、本願に記載される
原理は当業者によれば他の検索タスクにも適用可能であることが認識されよう。
例えば、本願に記載される原理は指示されたチャンネルサーフ動作にも使用され
うる。従来、チャンネルサーフするユーザは、1つの放送番組がユーザの関心と
なるまで、多数の放送チャンネルをランダムに又は系統的にサンプリングするこ
とによって関心となる番組について探索していた。分類システム100及び検索
システム150をオンラインモードで使用することにより、幾らかの処理遅延は
あるものの、関心となる番組の効率的なサーチが行われうる。オンラインモード
では、ストーリーセグメント識別部110は、放送チャンネルの現在市販されて
いない部分に対応するテキストセグメント113、オーディオセグメント、11
2、及びキーフレーム114を与える。分類部120は、上述の技術を用いてこ
れらの部分を分類する。フィルタ160は、ユーザの好み191に従う部分を識
別し、表現部170は各フィルタリングされた部分161から一組のキーフレー
ム171を表現する。ユーザがキーフレーム171の特定の組を選択すると、放
送チャンネル選択部105は選択されたキーフレーム171に対応するチャンネ
ルに同調され、ストーリーセグメント識別部110、記憶装置115、及び再生
部180は、選択されたチャンネルのビデオストリーム101をディスプレイ1
75に表現するためにバイパスモードとされる。
【0041】 当業者によって明らかであるように、本願に記載される原理及び技術は、様々
な実施例を含みうる。図4は、本発明による例示的な消費者製品400を示す図
である。製品400は、家庭用コンピュータ又はテレビジョンであってもよく、
VCR、CD−R/W、DVR装置といったビデオ記録装置等であってもよい。
例示的な製品400は、ユーザによる表現及び選択のための潜在的に関心となる
ストーリーセグメント111を記録する。図1を参照して上述されたように、ス
トーリーセグメント111は分類システム100によってビデオストリーム10
1から抽出又はインデックス付けされる。ビデオストリーム101は、選択部4
20及びチューナ410を介して、ケーブル又はアンテナ入力といったマルチチ
ャネル入力401から選択される。
【0042】 図4の実施例では、選択部420は、従来のVCR装置に設けられるような、
プログラム可能なマルチイベントチャンネル選択器である。ユーザは、指定され
る持続時間に亘って各特定のイベント時間において関心となる特定のチャンネル
にチューナ410が同調するよう選択器420をプログラムする。例えばユーザ
は、1つのチャンネル上の朝のニュースの時間及び持続時間と、他のチャンネル
上の夕方のニュースと、更なるチャンネル上の深夜のニュースとをプログラムし
うる。各チャンネルは続いて選択部420によって選択されるため、ストーリー
111はセグメント化され、分類システム100を介して記録部430に記憶さ
れ、この分類システム100はまた上述のように、各セグメント111を分類し
、入出力装置440上での表示のために当該のキーフレーム171を抽出する。
望ましい実施例では、記録部430は、記録媒体が許すできるだけ多くの最近の
セグメント111を連続的に供給するよう、各最新のセグメント111を記録す
るとともに最も古いセグメント111を自動的に消去する連続ループレコーダ、
又は連続環状バッファレコーダである。ユーザは、入出力装置440を介してシ
ステムにアクセスし、ユーザの好みに一致する最近のセグメント111のキーフ
レームが表現され、その後、ユーザは表現されたキーフレーム171に基づいた
表示のためにセグメント181を選択する。
【0043】 図4には、多数の任意の可能性も図示されている。利用可能な記録媒体の使用
を最適化するため、検索システム150は、上述の最も古いものを消去するスキ
ームよりもむしろ、451を介して、選択的な消去を行なうよう構成されうる。
新しいセグメント111が記録媒体の割当てを必要とする場合、検索システム1
50はユーザの好みとの相関が最も少ない記録媒体上のセグメント111を識別
する。最も古いセグメントを最新のセグメントで置き換える代わりに、ユーザに
とって最も潜在的な関心が低いセグメントが新しいセグメントで置き換えられる
。検索システム150はまた、分類システム00による最新のセグメントの分類
に基づいて、最新のセグメントがユーザの好みに基づいてユーザにとって関心の
ないものであることを決定したときに、最新のセグメントの記録を終了する。
【0044】 また破線191及び402によって図示されるように、製品400は前フィル
タ425を介して選択部420によってチャンネルの選択を任意に行なう。前フ
ィルタ425は、選択部420及びチューナ410を介して、チャンネル401
の選択を制御することによってセグメント111のフィルタリングを行なう。上
述のように、番組がマルチチャネル入力401の各チャンネル上に表現されるべ
き番組について記述する補助テキスト情報が一般的に入手可能である。破線によ
って図示されるように、この補助情報又は番組案内は、マルチチャネル入力40
1の一部であってもよく、又は別個の番組案内コネクション402を介したもの
であってもよい。上述のフィルタ160と同様の技術を用いて、前フィルタ42
5は、番組案内402の中でユーザの好み191と強い相関を有する番組を識別
し、上述のように、選択部420を記録、分類、及び検索のために選択するよう
プログラムする。
【0045】 当業者によって明らかとなるように、本発明の可能性及びパラメータは、各特
定の実施例の能力に依存して調整されうる。例えば、製品400は、生のニュー
ス放送を視聴するには殆ど時間のない通勤者用の携帯型パームトップ視聴装置で
ありうる。通勤者は、製品400を一晩に亘ってマルチチャネル入力401のソ
ースに接続し、潜在的な関心となるストーリー111を記録し、次に(乗客とし
て)通勤している間、これらの記録されたストーリー111から関心となるスト
ーリー181を検索するために製品400を使用する。この実施例では、リソー
スは制限されており、各構成要素のパラメータはそれに従って調整される。例え
ば、各セグメント111に関連付けられるキーフレーム114の数はかなり減少
されえ、前フィルタ425又はフィルタ160は実質的により選択的でありうる
。同様に、図1の分類システム100及び検索システム150は、それらが取り
付けられる構成要素に基づいてそれらのパラメータを動的に調整するスタンドア
ロン装置として提供されうる。例えば、分類システム100は、様々なユーザの
ためにストーリーセグメントを分類するために使用される非常に大きな多用途シ
ステムであってもよく、ユーザが選択されたストーリーセグメントを検索するた
めに夫々が異なるレベルの複雑性及び費用を有する異なった型の検索システム1
50が提供されうる。
【0046】 上述のことは本発明の原理を説明するだけである。従って当業者によれば、本
願には明示的には記載又は図示されていないが、本発明の原理を実施し従って本
発明の精神及び範囲内にある様々な配置が可能であることが認識されよう。例え
ば、キーフレーム114は、本願では個別の画像として説明されたが、キーフレ
ームは明らかに短いビデオクリップといった一連の画像であってもよく、キーフ
レームの表現はこれらのビデオクリップの夫々の表現となる。分類システム10
0及び検索システム150の構成要素は、ハードウエア、ソフトウエア、又は両
方の組み合わせとして実施されうる。構成要素は、分類及び検索の従来技術で周
知の、エキスパートシステム、知識ベースのシステム等を含むツール及び技術で
ありうる。ファジー論理システム、ニューラルネット、多変量回帰分析、非単調
推論、意味論処理、及び従来技術で周知の他のツール及び技術が、本願に記載さ
れる機能及び構成要素を実施するために使用されうる。
【0047】 表現部170及びフィルタ160は、ユーザの好み191との一致の度合いが
高いセグメント161のキーフレーム114の表現を、好み191との一致の度
合いとは関係なくランダムに選択されたセグメントのキーフレーム114で増大
させるランダム化計数を含みうる。ビデオストリーム101のソースはディジタ
ル又はアナログでありえ、ストーリーセグメント111はビデオストリーム10
1のソースとは無関係に、ディジタル又はアナログ形式で記憶されうる。本発明
はテレビジョン放送に関連して説明されたが、本願に記載される技術は、インタ
ーネット及びワールドワイドウェブを含む公衆網及び専用網といったソースから
のビデオ情報の分類、検索、及び表現のためにも使用されうる。例えば、一組の
キーフレーム114とストーリーセグメント111との間の関連づけは、ウェブ
サイトアドレスを含む埋込みHTMLコマンドを介してもよく、選択されたスト
ーリーセグメント181の検索は対応するウェブサイトの選択を介したものでも
よい。
【0048】 当業者によって明らかであるように、本発明に記載される機能の分割は例のた
めにのみ示されるものである。例えば、チャンネル選択部105は、ストーリー
セグメント識別部110の一体部であってもよく、又は、分類及び検索システム
が単一のソースビデオストリーム又は以前に記録されたビデオストリーム101
からストーリーセグメントを検索するために使用される場合は排除されてもよい
。同様に、ストーリーセグメント識別部110は、並列プロセッサを用いて多数
の放送チャンネルを同時に処理しうる。フィルタ160及びプロファイラ190
は、単一の選択部装置として一体化されうる。キーフレーム114は、記録部1
15上に記憶されるか、又は記録部115からインデックス付けされてもよく、
表現部170の機能は再生部180によって与えられる。同様に、ストーリーセ
グメント111からのキーフレーム114の抽出は、ストーリーセグメント識別
部110又は表現部170のいずれかの中で行われうる。上述及び他の分割及び
最適化技術は、当業者によって明らかとなり、本発明の精神及び範囲内である。
【図面の簡単な説明】
【図1】 本発明による個人向けビデオサーチシステムを示す例示的なブロック図である
【図2A】 ニュース放送の例としてのビデオストリーム200を示す図である。
【図2B】 本発明によるビデオストリームのストーリーセグメントからのキーフレームの
抽出を示す図である。
【図3】 本発明によるビデオ検索システムのための例としてのユーザインタフェースを
示す図である。
【図4】 本発明による消費者製品400を示す例示的なブロック図である。
───────────────────────────────────────────────────── フロントページの続き (71)出願人 Groenewoudseweg 1, 5621 BA Eindhoven, Th e Netherlands (72)発明者 マギー,トマス オランダ国,5656 アーアー アインドー フェン, プロフ・ホルストラーン 6 (72)発明者 シンプソン,マーク オランダ国,5656 アーアー アインドー フェン, プロフ・ホルストラーン 6 (72)発明者 マルティーノ,ジャックリン エイ オランダ国,5656 アーアー アインドー フェン, プロフ・ホルストラーン 6 (72)発明者 アブデル−モタレブ、 モハメッド オランダ国,5656 アーアー アインドー フェン, プロフ・ホルストラーン 6 (72)発明者 ギャレット,マージョリー オランダ国,5656 アーアー アインドー フェン, プロフ・ホルストラーン 6 (72)発明者 ラムジー,キャロリン オランダ国,5656 アーアー アインドー フェン, プロフ・ホルストラーン 6 (72)発明者 デサイー,ランジット オランダ国,5656 アーアー アインドー フェン, プロフ・ホルストラーン 6 Fターム(参考) 5B075 ND12 NK02 NR12 PP02 PP22 PQ02 PQ46 PR04

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 ビデオストリームを処理し、上記ビデオストリームを複数の
    ストーリーセグメントへ分割し、上記複数のストーリーセグメントの各ストーリ
    ーセグメントに関連付けられた1つ以上のキーフレームを生成するストーリーセ
    グメント識別部と、 上記ストーリーセグメント識別部に動作上結合され、上記複数のストーリーセ
    グメントの各ストーリーセグメントに対して1つ以上の分類を関連付け、上記1
    つ以上の分類に基づいて上記複数のストーリーセグメントからの選択を容易とす
    る分類部とを含む、ビデオ分類システム。
  2. 【請求項2】 上記ビデオストリームは関連付けられたテキストストリーム
    を含み、 上記ストーリーセグメント識別部は上記テキストストリームを上記複数のスト
    ーリーセグメントの少なくとも1つの各ストーリーセグメントに対応する少なく
    とも1つのテキストセグメントへ分割し、 上記分類部は上記1つ以上の分類を少なくとも1つのテキストセグメントに基
    づいて上記少なくとも1つの各ストーリーセグメントに関連付ける、請求項1記
    載のビデオ分類システム。
  3. 【請求項3】 上記ビデオストリームは関連付けられたオーディオストリー
    ムを含み、 上記ストーリーセグメント識別部は上記オーディオストリームを上記複数のス
    トーリーセグメントの少なくとも1つの各ストーリーセグメントに対応する少な
    くとも1つのオーディオセグメントへ分割し、 上記分類部は上記1つ以上の分類を少なくとも1つのオーディオセグメントに
    基づいて上記少なくとも1つの各ストーリーセグメントに関連付ける、請求項1
    記載のビデオ分類システム。
  4. 【請求項4】 上記分類部は、上記少なくとも1つのオーディオセグメント
    を少なくとも1つのテキストセグメントへ変換する変換部を含み、上記少なくと
    も1つのテキストセグメントに基づいて上記1つ以上の分類を上記少なくとも1
    つの各ストーリーセグメントに関連付ける、請求項3記載のビデオ分類システム
  5. 【請求項5】 上記ストーリーセグメント識別部は、上記ビデオストリーム
    を、認識された形状、認識されたシーン、ビデオ中断、及び検出されたコマーシ
    ャルのうちの少なくとも1つに基づいて分割する、請求項1記載のビデオ分類シ
    ステム。
  6. 【請求項6】 上記1つ以上のキーフレームは、上記複数のストーリーセグ
    メントの符号化された上記各ストーリーセグメントの変換に基づいて決定される
    、請求項1記載のビデオ分類システム。
  7. 【請求項7】 上記複数のストーリーセグメントを記憶する記憶装置を更に
    含む、請求項1記載のビデオ分類システム。
  8. 【請求項8】 複数のストーリーセグメントのストーリーセグメントを、上
    記複数のストーリーセグメントの各ストーリーセグメントに関連付けられる1つ
    以上の分類に基づいて検索する検索システムであって、 各ストーリーセグメントに関連付けられる上記1つ以上の分類に基づいて上記
    複数のストーリーセグメントの1つ以上のフィルタリングされたストーリーセグ
    メントを識別するフィルタと、 上記フィルタに動作上結合され、上記1つ以上のフィルタリングされたストー
    リーセグメントに関連付けられる1つ以上のキーフレームをディスプレイ上に順
    次に表現する表現部とを含む検索システム。
  9. 【請求項9】 ビデオストリームの複数のセグメントを、上記複数のセグメ
    ントの各セグメントに関連付けられるテキスト情報、オーディオ情報、又は可視
    情報のうちの少なくとも1つに基づいて分類を生成することによって分類する分
    類装置と、 上記複数のセグメントの上記少なくとも1つの各セグメントの分類を少なくと
    も1つのユーザの好みと一致させ、上記複数のセグメントの上記少なくとも1つ
    の各セグメントの少なくとも1つのキーフレームをディスプレイ上に表現するこ
    とによって、上記複数のセグメントの少なくとも1つの選択を容易とする検索装
    置とを含む、ビデオ装置。
  10. 【請求項10】 ビデオストリームの複数のセグメントの選択されたセグメ
    ントを検索するためのユーザインタフェースであって、 上記複数のセグメントの少なくとも1つのセグメントに関連付けられる1つ以
    上のキーフレームを表現する手段と、 上記1つ以上のキーフレームの表現に基づいて上記選択されたセグメントを選
    択する手段とを含むユーザインタフェース。
JP2000591534A 1998-12-23 1999-12-15 個人用ビデオ分類及び検索システム Pending JP2002533841A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US22027798A 1998-12-23 1998-12-23
US09/220,277 1998-12-23
PCT/EP1999/010221 WO2000039707A1 (en) 1998-12-23 1999-12-15 Personalized video classification and retrieval system

Publications (1)

Publication Number Publication Date
JP2002533841A true JP2002533841A (ja) 2002-10-08

Family

ID=22822888

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000591534A Pending JP2002533841A (ja) 1998-12-23 1999-12-15 個人用ビデオ分類及び検索システム

Country Status (5)

Country Link
EP (1) EP1057129A1 (ja)
JP (1) JP2002533841A (ja)
KR (1) KR100711948B1 (ja)
CN (1) CN1116649C (ja)
WO (1) WO2000039707A1 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006279429A (ja) * 2005-03-29 2006-10-12 Kddi Corp 映像コンテンツの推薦システム
JP2008537627A (ja) * 2005-03-31 2008-09-18 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 複合ニュース・ストーリーの合成
JP2014505295A (ja) * 2011-01-04 2014-02-27 トムソン ライセンシング ライブメディアコンテンツを送信する装置及び方法
KR20210040855A (ko) * 2020-05-21 2021-04-14 베이징 바이두 넷컴 사이언스 테크놀로지 컴퍼니 리미티드 내용 추천 방법, 장치와 기기

Families Citing this family (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
USRE47908E1 (en) 1991-12-23 2020-03-17 Blanding Hovenweep, Llc Ergonomic man-machine interface incorporating adaptive pattern recognition based control system
USRE48056E1 (en) 1991-12-23 2020-06-16 Blanding Hovenweep, Llc Ergonomic man-machine interface incorporating adaptive pattern recognition based control system
US6920281B1 (en) 2000-06-30 2005-07-19 Koninklijke Philips Electronics N.V. Video memory manager for use in a video recorder and method of operation
EP1191460A1 (de) * 2000-09-21 2002-03-27 Swisscom AG Verfahren und System für die Klassifizierung von digitalen Audio- und Videodateien
JP2002169819A (ja) * 2000-12-01 2002-06-14 Kanebo Ltd 動画情報配信方法およびそれに用いる動画情報配信システム
US7210157B2 (en) 2000-12-18 2007-04-24 Koninklijke Philips Electronics N.V. Apparatus and method of program classification using observed cues in the transcript information
US20030023972A1 (en) * 2001-07-26 2003-01-30 Koninklijke Philips Electronics N.V. Method for charging advertisers based on adaptive commercial switching between TV channels
US7096179B2 (en) * 2001-08-15 2006-08-22 Siemens Corporate Research, Inc. Text-based automatic content classification and grouping
AU2002327612B2 (en) * 2001-09-07 2008-01-17 Intergraph Software Technologies Company Method, device and computer program product for demultiplexing of video images
US20030101104A1 (en) * 2001-11-28 2003-05-29 Koninklijke Philips Electronics N.V. System and method for retrieving information related to targeted subjects
US20030107592A1 (en) * 2001-12-11 2003-06-12 Koninklijke Philips Electronics N.V. System and method for retrieving information related to persons in video programs
ES2277260T3 (es) * 2003-06-30 2007-07-01 Koninklijke Philips Electronics N.V. Sistema y metodo para generar un resumen multimedia de flujos multimedia.
EP1538536A1 (en) 2003-12-05 2005-06-08 Sony International (Europe) GmbH Visualization and control techniques for multimedia digital content
KR100452085B1 (ko) * 2004-01-14 2004-10-12 엔에이치엔(주) 카테고리 별 키워드의 입력 순위를 제공하기 위한 검색서비스 시스템 및 그 방법
JP4586446B2 (ja) * 2004-07-21 2010-11-24 ソニー株式会社 コンテンツ記録再生装置、コンテンツ記録再生方法及びそのプログラム
KR100683501B1 (ko) * 2005-02-23 2007-02-15 인천대학교 산학협력단 신경망 기법을 이용한 뉴스 비디오의 앵커 화면 추출 장치및 그 방법
WO2008007279A2 (en) * 2006-07-04 2008-01-17 Koninklijke Philips Electronics N.V. Method of content substitution
JP2009543411A (ja) * 2006-07-04 2009-12-03 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ コンテンツ置換の方法
US8671337B2 (en) 2007-03-27 2014-03-11 Sharp Laboratories Of America, Inc. Methods, systems and devices for multimedia-content presentation
JP4919879B2 (ja) * 2007-06-07 2012-04-18 ソニー株式会社 情報処理装置および方法、並びにプログラム
US8588583B2 (en) * 2007-08-22 2013-11-19 Adobe Systems Incorporated Systems and methods for interactive video frame selection
US7836093B2 (en) * 2007-12-11 2010-11-16 Eastman Kodak Company Image record trend identification for user profiles
EP2345251A4 (en) * 2008-10-31 2012-04-11 Hewlett Packard Development Co VIDEO DATA ORGANIZATION
JP5709359B2 (ja) * 2009-04-07 2015-04-30 ソニー株式会社 通信装置、通信方法、及び通信システム
CN101887445B (zh) * 2009-05-12 2012-10-10 大相科技股份有限公司 处理动态图像的方法、系统与加值处理的方法
KR101043630B1 (ko) 2009-07-31 2011-06-22 고려대학교 산학협력단 뉴스 제공 방법 및 시스템
WO2011039773A2 (en) * 2009-09-14 2011-04-07 Tata Consultancy Services Ltd. Tv news analysis system for multilingual broadcast channels
CN101894129B (zh) * 2010-05-31 2012-05-02 中国科学技术大学 基于在线视频分享网站结构及视频描述文本信息的视频主题发现的方法
CN102184235A (zh) * 2011-05-13 2011-09-14 广州星海传媒有限公司 一种基于机顶盒的数字电视节目推荐方法及系统
CN106202421B (zh) * 2012-02-02 2020-01-31 联想(北京)有限公司 一种获得视频的方法、装置及播放视频的方法、装置
CN103258555A (zh) * 2012-02-16 2013-08-21 岳振华 一种视频编辑方法及一种视频编辑装置
CN102799637A (zh) * 2012-06-27 2012-11-28 北京邮电大学 一种电视节目内部自动生成主要人物摘要的方法
CN103200463A (zh) * 2013-03-27 2013-07-10 天脉聚源(北京)传媒科技有限公司 一种视频摘要生成方法和装置
KR101475479B1 (ko) * 2013-06-27 2014-12-23 삼성중공업 주식회사 선박용 영상 데이터 처리 장치 및 방법
CN106550254B (zh) * 2015-09-23 2020-02-18 北京丰源星际传媒科技有限公司 影院放映电影贴片广告的监播方法及系统
CN108959323B (zh) * 2017-05-25 2021-12-07 腾讯科技(深圳)有限公司 视频分类方法和装置
CN108241729A (zh) * 2017-09-28 2018-07-03 新华智云科技有限公司 筛选视频的方法及设备
CN109241303B (zh) * 2018-06-29 2022-10-21 Oppo广东移动通信有限公司 视频创建方法及相关产品
US20200159759A1 (en) * 2018-11-20 2020-05-21 Comcast Cable Communication, Llc Systems and methods for indexing a content asset
CN113360709B (zh) * 2021-05-28 2023-02-17 维沃移动通信(杭州)有限公司 短视频侵权风险的检测方法、装置和电子设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05342263A (ja) * 1992-06-08 1993-12-24 Nippon Telegr & Teleph Corp <Ntt> ビデオデータ検索支援方法
JPH10111872A (ja) * 1996-10-08 1998-04-28 Nippon Telegr & Teleph Corp <Ntt> 動画配信装置及び方法
WO1998021688A1 (en) * 1996-11-15 1998-05-22 Sarnoff Corporation Method and apparatus for efficiently representing, storing and accessing video information
JPH11308567A (ja) * 1998-04-23 1999-11-05 Nippon Telegr & Teleph Corp <Ntt> ページ表示機能付きレイアウト映像編集方法及び装置及びそのプログラムを記録した記録媒体

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05342263A (ja) * 1992-06-08 1993-12-24 Nippon Telegr & Teleph Corp <Ntt> ビデオデータ検索支援方法
JPH10111872A (ja) * 1996-10-08 1998-04-28 Nippon Telegr & Teleph Corp <Ntt> 動画配信装置及び方法
WO1998021688A1 (en) * 1996-11-15 1998-05-22 Sarnoff Corporation Method and apparatus for efficiently representing, storing and accessing video information
JPH11308567A (ja) * 1998-04-23 1999-11-05 Nippon Telegr & Teleph Corp <Ntt> ページ表示機能付きレイアウト映像編集方法及び装置及びそのプログラムを記録した記録媒体

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
山本 浩司、浅野 正一郎: "ニュース映像データベースの索引づけ手法の一提案", 第51回(平成7年後期)全国大会講演論文集(2), JPN6009041568, 20 September 1997 (1997-09-20), JP, pages 2 - 251, ISSN: 0001396027 *
山田 伸 他2名: "ビデオインデックス作成・編集技術", MATSUSHITA TECHNICAL JOURNAL, vol. 第44巻 第5号, JPN6009041567, 18 October 1998 (1998-10-18), JP, pages 125 - 132, ISSN: 0001396026 *
有木 康雄 他4名: "ニュース映像中の記事に対する音声・文字・映像を用いた索引付けと分類", 電子情報通信学会技術研究報告, vol. 第96巻 第385号, JPN6009041565, 22 November 1996 (1996-11-22), JP, pages 31 - 38, ISSN: 0001396025 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006279429A (ja) * 2005-03-29 2006-10-12 Kddi Corp 映像コンテンツの推薦システム
JP2008537627A (ja) * 2005-03-31 2008-09-18 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 複合ニュース・ストーリーの合成
JP2014505295A (ja) * 2011-01-04 2014-02-27 トムソン ライセンシング ライブメディアコンテンツを送信する装置及び方法
US10069887B2 (en) 2011-01-04 2018-09-04 Thomson Licensing Dtv Apparatus and method for transmitting live media content
KR20210040855A (ko) * 2020-05-21 2021-04-14 베이징 바이두 넷컴 사이언스 테크놀로지 컴퍼니 리미티드 내용 추천 방법, 장치와 기기
KR102558867B1 (ko) * 2020-05-21 2023-07-21 아폴로 인텔리전트 커넥티비티 (베이징) 테크놀로지 씨오., 엘티디. 내용 추천 방법, 장치와 기기

Also Published As

Publication number Publication date
EP1057129A1 (en) 2000-12-06
CN1116649C (zh) 2003-07-30
CN1298522A (zh) 2001-06-06
KR20010041194A (ko) 2001-05-15
KR100711948B1 (ko) 2007-05-02
WO2000039707A1 (en) 2000-07-06

Similar Documents

Publication Publication Date Title
JP2002533841A (ja) 個人用ビデオ分類及び検索システム
US20050028194A1 (en) Personalized news retrieval system
KR100915847B1 (ko) 스트리밍 비디오 북마크들
US7209942B1 (en) Information providing method and apparatus, and information reception apparatus
KR100794152B1 (ko) 오디오/데이터/시각 정보 선택을 위한 방법 및 장치
US7434247B2 (en) System and method for determining the desirability of video programming events using keyword matching
JP4905103B2 (ja) 動画再生装置
US5664227A (en) System and method for skimming digital audio/video data
KR100411437B1 (ko) 지능형 뉴스 비디오 브라우징 시스템
US20030093580A1 (en) Method and system for information alerts
US20030093794A1 (en) Method and system for personal information retrieval, update and presentation
KR20050008810A (ko) 퍼스널 프로파일에 기초한 콘텐츠의 증가
KR20020014857A (ko) 샷 세그멘테이션 정보를 이용한 비디오 스키밍 시스템
Dimitrova et al. PNRS: personalized news retrieval system
Jun-qing et al. Content-based hierarchical analysis of news video using audio and visual information

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20061212

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090818

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20091117

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20091125

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100209

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100406

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100701

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20100816

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20100910