本発明の実施形態は、マルチメディア情報を検索・表示する手法を提供する。本発明の一実施形態によれば、マルチメディア文書に格納され得るマルチメディア情報を表示するグラフィカル・ユーザ・インターフェース(GUI)が提供される。本発明の手法によれば、このGUIにより、ユーザは、マルチメディア文書に格納されたマルチメディア情報を検索することができる。このGUIは、マルチメディア文書のコンテンツの一部に着目した表示及び全体の文脈を見せる表示の両方を提供する。このように、このGUIによって、ユーザは、マルチメディア文書を「水平に」読む又はザッと目を通すことが可能となる。
上述のように、「マルチメディア情報」という単語は、複数の異なる種類の情報を含む情報を指すものとする。このマルチメディア情報に含まれる異なる種類の情報とは、例えば、テキスト情報、グラフィック情報、アニメーション情報、音(オーディオ)情報、ビデオ情報、スライド情報、ホワイトボード画像情報、及び、他の種類の情報、の組み合わせなどである。例えば、テレビ放送のビデオ録画は、ビデオ情報及びオーディオ情報を含み得る。特定の瞬間には、ビデオ録画は、ビデオ情報に関連したマテリアル(多くの場合、そのビデオ録画のオーディオ部分に含まれるスピーチをそのまま表したクローズド・キャプション(CC)テキスト情報)も含み得る。マルチメディア情報は、異なる種類の情報を含んだ1以上のオブジェクトを含む情報を指すのにも用いられる。例えば、マルチメディア情報に含まれるマルチメディア・オブジェクトは、テキスト情報、グラフィック情報、アニメーション情報、音(オーディオ)情報、ビデオ情報、スライド情報、ホワイトボード画像情報、及び、他の種類の情報、などを含む。
本願において用いられる「マルチメディア文書」という単語は、マルチメディア情報を格納するあらゆる電子的ストレージ・ユニット(例えば、ファイル、ディレクトリ、など)を指すものとする。マルチメディア情報を格納するのには様々な異なる形式が用いられ得る。これら形式は、様々なMPEGフォーマット(例えば、MPEG−1、MPEG−2、MPEG−4、MPEG−7、など)、MP3フォーマット、SMILフォーマット、HTML+TIMEフォーマット、WMF(ウィンドウズ(登録商標)・メディア・フォーマット)、RM(Real Media)フォーマット、Quicktimeフォーマット、Shockwaveフォーマット、様々なストリーミング・メディア・フォーマット、エンジニアリング・コミュニティによって開発されたフォーマット、メーカ独自の慣習上のフォーマット、などである。マルチメディア文書の例は、例えば、録画ビデオ、MPEGファイル、ニュース放送録画、プレゼンテーション記録、会議録画、授業の録画、テレビ放送番組、などである。
ズ1は、本発明の一実施形態を組み込み得る分散型ネットワーク100の簡略化されたブロック図である。図1に示すように、分散型ネットワーク100は、1以上のクライアント・システム102と、サーバ・システム104と、複数の通信リンク110を通じて通信ネットワーク108に接続されたマルチメディア情報源(MIS)106と、を含む複数のコンピュータ・システムを有する。図1に示す分散型ネットワーク100は、本発明を組み込んだ一実施形態の単なる例示であり、請求項記載の本発明の範囲を制限するものではない。当業者は、他の変形例、修正例、及び、代替例を認識し得る。例えば、本発明は、スタンドアロン・システムにおいても具現化し得る。スタンドアロン環境では、図1に示した様々なコンピュータ・システムによって実行される機能が1台のコンピュータ・システムによって実行される。
通信ネットワーク108は、図1に示す様々なコンピュータ・システムが情報を通信し、互いに交換することを可能にするメカニズムを提供する。通信ネットワーク108は、それ自体が多くの相互接続されたコンピュータ・システム及び通信リンクから構成されてもよい。一実施形態において、通信ネットワーク108はインターネットであるが、他の実施形態では、通信ネットワーク108は、ローカル・エリア・ネットワーク(LAN)、ワイド・エリア・ネットワーク(WAN)、無線ネットワーク、イントラネット、プライベート・ネットワーク、公衆網、交換網、などのあらゆる適切な通信ネットワークでよい。
図1に示す様々なシステムを接続するのに用いられる通信リンク110は、有線リンク、光リンク、衛星又は他の無線通信リンク、波動リンク、或いは、情報通信用のあらゆる他のメカニズム、などの様々な種類のものでよい。通信リンクを通じた情報伝達を容易にするために様々な通信プロトコルが用いられ得る。これら通信プロトコルは、例えば、TCP/IP、HTTPプロトコル、エクステンシブル・マークアップ・ランゲージ(XML)、ワイヤレス・アプリケーション・プロトコル(WAP)、業界標準化機関によって開発中のプロトコル、ベンダ固有のプロトコル、カスタマイズされたプロトコル、などである。
通信ネットワーク108に接続されたコンピュータ・システムは、情報及び/又はサービスをリクエストするか又は情報及び/又はサービスを提供するかという点でいずれの役割を演じるかに応じて「クライアント」と「サーバ」に分類できる。ユーザによって情報又はサービスをリクエストするのに用いられるコンピュータ・システムは「クライアント」コンピュータ(又は、「クライアント」)に分類される。情報を格納し、該情報をクライアント・コンピュータ又はユーザがリクエストしたサービスを提供するための処理を実行するコンピュータ・システムから受信したユーザ・リクエストに応じて提供するコンピュータ・システムは、「サーバ」コンピュータ(又は、「サーバ」)と呼ばれる。ただし、特定のコンピュータ・システムがクライアント及びサーバの双方として機能し得ることは明らかである。
したがって、本発明の一実施形態によれば、サーバ・システム104は、本発明の教えに従ってマルチメディア情報を表示するGUIの生成を容易にするための処理を実行するように構成される。サーバ・システム104によって生成されたGUIは、サーバ・システム104に接続された出力装置又はクライアント・システム102を通じてユーザ(例えば、マルチメディア文書の読み手)に対して出力され得る。サーバ104によって生成されたGUIにより、ユーザは、マルチメディア文書に格納され得るマルチメディア情報を検索・閲覧することができる。このGUIは、マルチメディア文書のコンテンツの一部に着目した表示及び全体の文脈を見せる表示の両方を提供するため、このGUIによって、ユーザは、マルチメディア文書をザッと目を通す又は「水平に」読むことが可能となる。
GUIを生成し、本発明の教えに係る様々な特徴を提供するためにサーバ・システム104によって実行される処理は、サーバ・システム104上で実行されるソフトウェア・モジュールによって実施されてもよく、サーバ・システム104に接続されたハードウェア・モジュールによって実施されてもよく、或いは、それらの組み合わせによって実施されてもよい。本発明の代替的実施形態として、この処理も、図1に示す様々なコンピュータ・システム間に分散されてもよい。
このGUIに表示されるマルチメディア情報は、サーバ・システム104がアクセス可能なマルチメディア文書に格納され得る。例えば、このマルチメディア文書は、サーバ・システム104のストレージ・サブシステムに格納され得る。また、このマルチメディア文書は、サーバ104がアクセス可能なMIS106などの他のシステムによっても格納され得る。別の方法として、このマルチメディア文書は、サーバ・システム104がアクセス可能なメモリ・ロケーションに格納されてもよい。
代替的実施形態として、マルチメディア文書にアクセスする代わりに、サーバ・システム104がマルチメディア文書のストリーム(例えば、ストリーミング・メディア信号、ケーブル信号、など)をMIS106などのマルチメディア情報源から受信してもよい。本発明の一実施形態によれば、サーバ・システム104はマルチメディア情報信号をマルチメディア文書に格納し、このマルチメディア情報を表示するGUIを生成する。MIS106の例は、テレビ放送受信機、ケーブル受信機、ディジタル・ビデオ録画機(例えば、TIVO box)、などである。例えば、マルチメディア情報源106は、マルチメディア放送信号を受信し、該信号をサーバ・システム104へ送信するように構成されたテレビとして実現され得る。代替的実施形態として、サーバ104は、MIS106によって受信されたマルチメディア情報信号をインターセプトするように構成されてもよい。サーバ・システム104は、このマルチメディア情報をMIS106から直接受信してもよく、或いは、別の方法として、通信ネットワーク108などの通信ネットワークを通じて該情報を受信してもよい。
上述のように、図1に示すMIS106は、マルチメディア情報の発信源を表す。本発明の一実施形態によれば、MIS106は、サーバ・システム104によってアクセスされるマルチメディア文書を格納し得る。例えば、MIS106は、サーバ・システム104がアクセス可能なマルチメディア文書を格納するストレージ装置又はサーバである。代替的実施形態として、MIS106は、マルチメディア情報ストリームをサーバ・システム104に提供してもよい。例えば、MIS106は、サーバ・システム104にライブ・テレビ供給情報を提供するテレビ受信機/アンテナでもよい。MIS106は、例えば、記録されたビデオ及び/又はオーディオ・ストリームをサーバ・システム104へ提供するビデオ録画機/プレイヤ、DVDプレイヤ、CDプレイヤ、などの装置である。代替的実施形態として、MIS106は、取り込まれたプレゼンテーション又は会議情報のストリームをサーバ・システム104へ提供し得るプレゼンテーション又は会議記録装置でもよい。また、MIS106は、外部ソースからマルチメディア情報を取り込む又は(例えば、無線リンクを通じて)受信し、その取り込まれたマルチメディア情報を更なる処理のためにサーバ・システム104へ提供するように構成された受信機(例えば、衛星受信アンテナ、又は、ケーブル受信機)でもよい。
ユーザは、クライアント・システム102を用いて、サーバ・システム104によって生成されたGUIを見ることができる。また、ユーザは、クライアント・システム102を用いて、特性のマルチメディア文書を選択し、その特定のマルチメディア文書によって格納されているマルチメディア情報を表示するGUIを生成するようにサーバ・システム104にリクエストすることもできる。また、ユーザは、クライアント・システム102に接続された入力装置を用いて、サーバ・システム104によって生成されたGUIとやりとりすることもできる。代替的実施形態として、クライアント・システム102は、本発明の教えに従ってGUIの生成を容易にするための処理も実行してもよい。クライアント・システム102は、パーソナル・コンピュータ、ポータブル・コンピュータ、ワークステーション、コンピュータ端末、ネットワーク・コンピュータ、メインフレーム、キオスク(kiosk)、パーソナル・ディジタル・アシスタント(PDA)、携帯電話などの通信装置、又は、他のデータ処理システム、などの様々な種類のものでよい。
本発明の一実施形態によれば、1台のコンピュータ・システムがサーバ・システム104及びクライアント・システム102の双方として機能してもよい。サーバ・システム104、クライアント・システム102、及び、MIS106の他の様々な構成が考えられる。
図2は、本発明の一実施形態に係るコンピュータ・システム200の簡略化されたブロック図である。コンピュータ・システム200は、図1に示すコンピュータ・システムのいずれとしても用いることができる。図2に示するように、コンピュータ・システム200は、少なくとも1つのプロセッサ202を有する。プロセッサ202は、バス・サブシステム204を通じて、複数の周辺装置と通信する。これら周辺装置は、例えば、メモリ・サブシステム208及びファイル・ストレージ・サブシステム210を含むストレージ・サブシステム206、ユーザ・インターフェース入力装置212、ユーザ・インターフェース出力装置214、及び、ネットワーク・インターフェース・サブシステム216、などである。これら入出力装置により、ユーザは、コンピュータ・システム200とのやりとりが可能となる。ユーザとは、人間のユーザ、装置、プロセス、別のコンピュータ、などである。ネットワーク・インターフェース・サブシステム216は、他のコンピュータ・システム及び通信ネットワークへのインターフェースを提供する。
バス・サブシステム204は、コンピュータ・システム200の様々な構成要素及びサブシステムに目的通りに互いに通信させるメカニズムを提供する。これらコンピュータ・システム200の様々なサブシステム及び構成要素は、物理的に同じ場所にある必要はなく、ネットワーク100の様々な場所に分散していてもよい。バス・サブシステム204は1本のバスとして概略的に図示されているが、このバス・サブシステムの代替的実施形態として、複数のバスが用いられてもよい。
ユーザ・インターフェース入力装置212は、キーボード、ポインティング装置、マウス、トラックボール、タッチパッド、グラフィック・タブレット、スキャナ、バーコード・スキャナ、ディスプレイに内蔵されたタッチスクリーン、音声認識システムなどの音声入力装置、マイク、及び、他の種類の入力装置、などである。一般的に、「入力装置」という単語が用いられると、コンピュータ・システム200を用いて情報を入力する考え得るすべての種類の装置及び方法を含むことが意図されている。
ユーザ・インターフェース出力装置214は、ディスプレイ・サブシステム、プリンタ、ファックス機、又は、音声出力装置などの視覚的でないディスプレイ、などである。このディスプレイ・サブシステムは、陰極線管(CRT)、液晶ディスプレイ(LCD)などのフラット・パネル装置、プロジェクション装置、などである。また、このディスプレイ・サブシステムは、音声出力装置などを通じた非視覚的ディスプレイも提供する。一般的に、「出力装置」という単語が用いられると、コンピュータ・システム200から情報を出力する考え得るすべての種類の装置及び方法を含むことが意図されている。本発明の一実施形態によれば、本発明の教えに従って生成されたGUIは、出力装置214を通じて、ユーザに提示され得る。
ストレージ・サブシステム206は、コンピュータ・システム及び本発明の機能性を提供する基本プログラム及びデータ構造を格納するように構成され得る。例えば、本発明の一実施形態によれば、本発明の機能性を実行するソフトウェア・モジュールは、サーバ・システム104のストレージ・サブシステム206に格納することができる。これらソフトウェア・モジュールは、サーバ・システム104の1以上のプロセッサ202によって実行することができる。分散型の環境において、これらソフトウェア・モジュールは、複数のコンピュータ・システム上に格納され、それら複数のコンピュータ・システムのプロセッサによって実行され得る。また、ストレージ・サブシステム206は、本発明によって用いられ得る様々なデータベースを格納する貯蔵室も提供する。ストレージ・サブシステム206は、メモリ・サブシステム208及びファイル・ストレージ・サブシステム210を有し得る。
メモリ・サブシステム208は、プログラム実行中に命令及びデータを保存する主ランダム・アクセス・メモリ(RAM)218、固定命令が格納されたリード・オンリ・メモリ(ROM)220などの複数のメモリを含み得る。ファイル・ストレージ・サブシステム210は、プログラム及びデータ・ファイル用の永久(不揮発性)ストレージを提供し、例えば、ハードディスク・ドライブ、関連する着脱可能媒体を伴うフロッピー(登録商標)・ディスク・ドライブ、コンパクト・ディスク・リード・オンリ・メモリ(CD−ROM)・ドライブ、光ドライブ、着脱可能媒体カートリッジ、及び、他の類似のストレージ媒体、などである。これらドライブの1以上が他の接続されたコンピュータ上の遠隔地に配置されてもよい。
コンピュータ・システム200は、パーソナル・コンピュータ、ポータブル・コンピュータ、ワークステーション、コンピュータ端末、ネットワーク・コンピュータ、メインフレーム、キオスク(kiosk)、パーソナル・ディジタル・アシスタント(PDA)、携帯電話などの通信装置、又は、他のデータ処理システム、などの様々な種類のものでよい。サーバ・コンピュータは、一般的に、クライアント・システムよりもより多くのストレージ及び処理能力を有する。コンピュータ及びネットワークは絶え間なく変わる性質を持つため、図2に示したコンピュータ・システム200の説明は、コンピュータ・システムの好ましい実施形態を説明することを目的とした単なる一具体例であることが意図されている。図2に示したコンピュータ・システムより多くの又は少ない構成要素を有する他の多くのコンピュータ・システムの構成が考えられる。
図3は、本発明の一実施形態に従って生成された、マルチメディア情報を見るための簡略化されたユーザ・インターフェース300を示す。図3に示すGUI300は、本発明を組み込んだ一実施形態の単なる例示であり、請求項記載の本発明の範囲を制限するものではないことは明らかである。当業者は、他の変形例、修正例、及び、代替例を認識し得る。
GUI300は、マルチメディア文書に格納されたマルチメディア情報を表示する。このマルチメディア文書によって格納され、GUI300によって表示されるマルチメディア情報は、複数の異なる種類の情報を含み得る。図3に示すように、GUI300は、ビデオ情報、オーディオ情報、及び、場合によってクローズド・キャプション(CC)・テキスト情報を含むテレビ放送に対応したマルチメディア情報を表示する。テレビ放送は、サーバ・システム104がアクセス可能なメモリ・ロケーションにテレビ放送録画として格納され得る。しかし、本発明は、テレビ録画を表示することだけに限定されないことは明らかである。他の種類の情報から成るマルチメディア情報も本発明の教えに従って表示することができる。
テレビ放送は、様々な異なる手法を用いて格納され得る。一手法によれば、テレビ放送は、サーバ・システム104のPC−TVビデオカードに接続された衛星受信機を用いて、記録・格納される。次いで、サーバ・システム104上で実行されるアプリケーションが、この記録されたテレビ放送を処理し、GUI300の生成を容易にする。例えば、テレビ放送に含まれるビデオ情報は、その放送用の時間的情報及び用意されていればクローズド・オプションを含む別のメタファイル(例えば、XML形式の)を作成するMPEGキャプチャ・アプリケーションを用いて、取り込まれ得る。次いで、このメタファイルに格納された情報を用いて、図3に示すGUI300が生成される。
図3に示すように、GUI300は、第一の表示エリア302、第二の表示エリア304、第三の表示エリア306、第四の表示エリア308、及び、第五の表示エリア310などの複数の表示エリアを有する。代替的実施形態として、本発明は、図3に示した例より多くの又は少ない表示エリアを有し得ることは明らかである。さらに、本発明の代替的実施形態では、1以上の表示エリアが1つの表示エリアに合成されていてもよく、或いは、特性の表示エリアが複数の表示エリアに分かれていてもよい。したがって、図3に示し、以下に説明する表示エリアは、請求項に記載された本発明の範囲を制限するものではない。
本発明の一実施形態によれば、第一の表示エリア302は、GUI300を見ているユーザが選択できる1以上のコマンドを表示する。メニュ・バー、ドロップ・ダウン・メニュ、カスケード・メニュ、ボタン、選択バー、ボタンなどの様々なユーザ・インターフェース機能がこのユーザ選択可能コマンドを表示するのに用いられ得る。本発明の一実施形態によれば、第一の表示エリア302において提供されるコマンドは、ユーザがGUIに表示されるマルチメディア情報を有するマルチメディア文書を選ぶことができるようにするコマンドを含む。また、このコマンドは、ユーザが選択したマルチメディア文書に格納されたマルチメディア情報がGUI300に表示される方法をユーザが設定及び/又はカスタマイズできるようにする1以上のコマンドも含み得る。また、様々な他のコマンドも第一の表示エリア302において提供され得る。
本発明の一実施形態によれば、第二の表示エリア304は、マルチメディア文書によって格納されたマルチメディア情報の縮小表現を表示する。ユーザは、第二の表示エリア304において情報を表示するのに用いられる倍率を選択し得る。本発明の特定の実施形態によれば、マルチメディア文書全体(すなわち、そのマルチメディア文書に関連する開始時刻から終了時刻までのマルチメディア情報)の表現は、第二の表示エリア304に表示される。この実施形態において、第二の表示エリア304の一端はそのマルチメディア文書の開始時刻を表し、第二の表示エリア304の他端はそのマルチメディア文書の終了時刻を表す。
図3に示すように、本発明の一実施形態によれば、第二の表示エリア304は、1以上のサムネール画像312を有する。各サムネール画像は、マルチメディア文書によって格納されたマルチメディア情報に含まれる特定の種類の情報の表現を表示する。例えば、図3に示されたGUI300の第二の表示エリア304には、2つのサムネール画像312−1及び312−2が表示されている。サムネール画像312−1は、GUI300によって表示されているマルチメディア文書によって格納されたマルチメディア情報に含まれる情報に対応したテキスト情報を表示する。サムネール画像312−1に表示されるテキストは、例えば、GUI300によって表示されるマルチメディア情報に含まれるCCテキストの表示可能な表現を表す。あるいは、サムネール画像312−1に表示されるテキストは、GUI300によってコンテンツが表示されたマルチメディア文書によって格納されたマルチメディア情報に含まれるオーディオ情報の録音(transcript)の表示可能な描写を表してもよい。オーディオ情報用の録音を生成するのには様々なオーディオ/テキスト録音手法が用いることができる。また、サムネール画像に表示されるテキストは、マルチメディア情報に含まれる他の種類の情報の表現であってもよい。例えば、テキスト情報は、マルチメディア情報がマルチメディア情報に付け加えられた注釈などが記録又は表示されたものであるとき作られたコメントの表現でもよい。
サムネール312−2は、GUI300によって表示されるマルチメディア情報に含まれるビデオ情報の表現を表示する。図3に示す実施形態において、ビデオ情報は、マルチメディア文書によって格納されたマルチメディア情報に含まれるビデオ情報から抽出されたビデオ・キーフレームを用いて、表示される。このビデオ・キーフレームは、指定されたサンプリング・レートを用いて、様々な時点において、マルチメディア文書のビデオ情報から抽出することができる。ユーザ設定可能であってもよい特殊なレイアウト・スタイルが、フレームの読み易さを向上させるためにサムネール312−2に抽出されたキーフレームを表示するのに用いられる。
表示されているマルチメディア情報に含まれる情報の種類に応じて、1以上のサムネール画像が第二の表示エリア304に表示されてもよい。第二の表示エリア304に表示される各サムネール画像312は、マルチメディア文書によって格納されたマルチメディア情報に含まれる特定の種類の情報の表現を表示する。本発明の一実施形態によれば、第二の表示エリア304に表示さえるサムネール数及び各サムネールによって表示される情報種類は、ユーザ設定可能である。
本発明の一実施形態によれば、第二の表示エリア304に表示される様々なサムネール画像は、時間的に同期されるか、あるいは、時系列に沿って互いに揃えられる。これは、マルチメディア情報に含まれ、略同時に生じた様々な種類の情報が次々に表示されることを意味する。例えば、サムネール画像312−1及び312−2は、サムネール画像31201に表示されたテキスト情報(CCテキスト情報、オーディオ情報の録音、又は、マルチメディア情報に含まれる他のいくつかの種類の情報のテキスト表現、を表し得る)、及び、特定の時点でマルチメディア情報に生じたサムネール312−2に表示されるビデオ・キーフレームは、互いに接近して(例えば、同じ水平軸に沿って)表示される。したがって、特定のタイムスタンプを持つ情報は、略同じタイムスタンプを持つ情報に隣接して表示される。これにより、ユーザは、単に第二の表示エリア304を水平方向にスキャンすることによって、GUI300によって表示されているマルチメディア情報に略同時に生じた様々な情報種類を判断することができる。
本発明の教えるところによれば、表示レンズ又は窓314(以下、「サムネール表示エリア・レンズ314」と称す)が第二の表示エリア304に表示される。サムネール表示エリア・レンズ314は、第二の表示エリア304の一部を覆う又は強調する。本発明の教えるところによれば、第二の表示エリア304のうちサムネール表示エリア・レンズ314によって覆われたエリアに対応するマルチメディア情報は、第三の表示エリア306に表示される。
図3に示す実施形態において、サムネール表示エリア・レンズ314は、第二の表示エリア304の上部の位置し、マルチメディア文書の上部(スタート部分)を強調している。ユーザは、レンズ314を第二の表示エリア304に沿ってスライド又は移動させることによって、サムネール表示エリア・レンズ314の位置を変えることができる。例えば、図3において、サムネール表示エリア・レンズ314は、第二の表示エリア304に沿って縦に動かすことができる。
サムネール表示エリア・レンズ314の位置を第二の表示エリア304に沿って第二の表示エリア304の第一の位置から第二の位置へ変更すると、第三の表示エリア306に表示されたマルチメディア情報は、第三の表示エリア306に表示されたマルチメディア情報が第二の表示エリア304のうちのサムネール表示エリア・レンズ314によって強調されているエリアと対応し続けるように、自動的に更新される。したがって、ユーザは、サムネール表示エリア・レンズ314を用いて、GUI300によって表示されたマルチメディア文書のコンテンツをナビゲート及びスクロールすることができる。このように、サムネール表示エリア・レンズ314は、コンテキストを提供すると共に、第三の表示エリア306に表示されているマルチメディア情報のマルチメディア文書全体の中での位置を示す。
図4は、本発明の一実施形態に係るサムネール表示エリア・レンズ314の簡略化された拡大図である。図4に示すように、サムネール表示エリア・レンズ314は、第一の辺318と第二の辺320によって区切られている。サムネール表示エリア・レンズ314は、第二の表示エリア304のうち辺318と辺320の間のエリアを強調する。サムネール表示エリア・レンズ314の第二の表示エリア304上での位置に基づいて、辺318はマルチメディア文書における特定の時刻t1に対応し、辺320はマルチメディア文書における特定の時刻t2(t2>t1)に対応する。例えば、サムネール表示エリア・レンズ314が(図3に示すように)第二の表示エリア304の先頭に位置するとき、t1は表示されているマルチメディア文書の開始時刻に対応し、サムネール表示エリア・レンズ314が第二の表示エリア304の終端に位置するとき、t2はそのマルチメディア文書の終了時刻に対応する。したがって、サムネール表示エリア・レンズ314は、第二の表示エリア304のうち時刻t1と時刻t2の間の部分を強調する。本発明の一実施形態によれば、(サムネール表示エリア・レンズ314によって強調された又は覆われた)時間区間t2〜t1に対応するマルチメディア情報は、第三の表示エリア306に表示される。したがって、サムネール表示エリア・レンズ314の位置がユーザ入力に応じて第二の表示エリア304に沿って変更されると、第三の表示エリア306に表示された情報は、第三の表示エリア306に表示されるマルチメディア情報が第二の表示エリア304のうちサムネール表示エリア・レンズ314によって強調されるエリアに対応し続けるように、更新される。
図3及び4に示すように、サムネール表示エリア・レンズ314は、第二の表示エリア304のうちサムネール表示エリア・レンズ314によって強調される部分の一部を更に強調するサブレンズ316を有する。本発明の一実施形態によれば、第二の表示エリア304のうちサブレンズ316によって強調される又は覆われる部分は、第三の表示エリア306のうちレンズ322によって強調される又は覆われる部分に対応する。サブレンズ316は、サムネール表示エリア・レンズ314の辺318と辺320の間で、第二の表示エリア304に沿って、動かすことができる。サブレンズ316がサムネール表示エリア・レンズ314の範囲内の第一の位置から第二の位置へ動かされると、第三の表示エリア306におけるレンズ322の位置も、サブレンズ316の位置変更に対応して、自動的に変更される。さらに、レンズ322の位置が第三の表示エリア306上で第一の位置から第二の位置へ変更されると、サブレンズ316の位置も、レンズ322の位置変更に対応して、自動的に変更される。レンズ322に関する更なる詳細を以下に説明する。
上述のように、第二の表示エリア304のうちサムネール表示エリア・レンズ314によって強調された部分に対応したマルチメディア情報は、第三の表示エリア306に表示される。したがって、時刻t1と時刻t2の間に生じた(マルチメディア文書のうちサムネール表示エリア・レンズ314によって強調された時間区間に対応する)マルチメディア情報の表現が、第三の表示エリア306に表示される。このように、第三の表示エリア306は、マルチメディア文書のうちサムネール表示エリア・レンズ314によって強調された部分に対応するマルチメディア文書によって格納されたマルチメディア情報の拡大表現を表示する。
図3に示すように、第三の表示エリア306は、1以上のパネル324を有する。各パネルは、サムネール表示エリア・レンズ314によって強調された時間区間中に生じたマルチメディア情報に含まれる特定の種類の情報の表現を表示する。例えば、図3に示したGUI300においては、第三の表示エリア306に2つのパネル324−1及び324−2が表示されている。本発明の一実施形態によれば、第三の表示エリア306の各パネル324は、第二の表示エリア304に表示されたサムネール画像312に対応し、そのサムネール画像のうちサムネール表示エリア・レンズ314によって覆われた部分に対応する情報を表示する。
サムネール画像312と同様に、パネル324も互いに時間的に揃えられる又は同期される。したがって、マルチメディア情報に含まれ、略同時に生じた様々な種類の情報が第三の表示エリア306に次々に表示される。例えば、図3に示したパネル324−1及び324−2は、パネル324−1に表示されたテキスト情報(CCテキスト情報、オーディオ情報の録音、又は、マルチメディア情報に含まれる他のいくつかの種類の情報のテキスト表現、を表し得る)、及び、略同じ時点でマルチメディア情報に生じたパネル324−2に表示されるビデオ・キーフレームは、互いに接近して(例えば、同じ水平軸に沿って)表示される。したがって、特定のタイムスタンプを持つ情報は、略同じタイムスタンプを持つ他の種類の情報に隣接して表示される。これにより、ユーザは、単に第三の表示エリア306を水平方向にスキャンすることによって、マルチメディア情報に略同時に生じた様々な情報種類を判断することができる。
GUI300に示されたパネル324−1は、サムネール画像312−1に対応し、サムネール画像312−1のうちサムネール表示エリア・レンズ314によって強調された又は覆われたエリアに対応するテキスト情報を表示する。パネル324−1によって表示されるテキスト情報は、マルチメディア情報に含まれるCC情報から抽出されたテキストに対応してもよく、或いは、マルチメディア情報に含まれるオーディオ情報の録音又はマルチメディア情報に含まれる他のいくつかの種類の情報のテキスト表現を表してもよい。本発明の一実施形態によれば、本発明は、ストーリ自動セグメント化及びニュース放送からクローズド・キャプション(CC)テキストとしてしばしば提供される他の特徴を利用する。放送の一部としてCCテキストを提供するニュース局のほとんどは、CCテキストに特殊な構文を用いる(例えば、「>>>」デリミタは、話の筋又はテーマの変化を示し、「>>」デリミタは話し手の変更を示す、など)。この種の情報がマルチメディア情報に含まれるCCテキスト情報に存在するものとすると、本発明は、パネル324−1に表示されたテキストにこれら特徴を組み込む。例えば、「>>>」デリミタが話の筋又はテーマの変化を示すために表示されてもよく、「>>」デリミタが話し手の変更を示すために表示されてもよく、異なる話を明確に区別するために、異なる話の筋に関連するテキスト部分間に追加的スペースが表示されてもよい。これにより、パネル324−1に表示されたテキスト情報の読み易さが向上する。
GUI300に表示されたパネル324−2は、サムネール画像312−2に対応し、サムネール画像312−2のうちサムネール表示エリア・レンズ314によって強調された又は覆われたエリアに対応するビデオ情報の表現を表示する。したがって、パネル324−2は、マルチメディア文書によって格納されたマルチメディア情報に含まれ、サムネール表示エリア・レンズ314に関する時刻t1と時刻t2の間に生じたビデオ情報の表現を表示する。図3に示す実施形態では、マルチメディア情報に含まれたビデオ情報から抽出されたビデオ・キーフレームがパネル324−2に表示される。フレームの読み易さを向上させるために、抽出されたキーフレームを表示するのにユーザ設定可能な特殊なレイアウト・スタイルが用いられる。
ビデオ・キーフレームをパネル324−2に表示するのには様々な異なる手法を用いることができる。本発明の一実施形態によれば、時刻t1と時刻t2の間の時間区間が所定期間のサブ区間に分割される。各サブ区間は、そのサブ区間に関する開始時刻及び終了時刻によって特徴付けられる。本発明の一実施形態によれば、最初のサブ区間の開始時刻は時刻t1に対応し、最後のサブ区間の終了時刻は時刻t2に対応する。次いで、サーバ104は、各サブ区間について、そのサブ区間に関連した開始時刻と終了時刻の間に生じたマルチメディア文書によって格納されたビデオ情報から1以上のビデオ・キーフレームを抽出する。例えば、本発明の一実施形態によれば、各サブ区間について、サーバ104は、そのサブ区間に関連した開始時刻と終了時刻の間に1秒間隔でビデオ・キーフレームを抽出する。
次いで、サーバ104は、各サブ区間に対して、そのサブ区間について抽出されたビデオ・キーフレームからパネル324−2に表示される1以上のキーフレームを選択する。各サブ区間についてパネル324−2に表示されるものとして選択されるキーフレーム数は、ユーザが設定可能である。各サブ区間について、抽出されたビデオ・キーフレームから表示されるビデオ・キーフレームを選択する手法には様々な異なる方法が用いることができる。例えば、一サブ区間について抽出されたビデオ・キーフレーム数が24で、(図3に示すように)各サブ区間について6つのビデオ・キーフレームが表示されるものとした場合、サーバ104は、サブ区間について抽出されたビデオ・キーフレームから最初の2つのビデオ・キーフレームと、真ん中の2つのビデオ・キーフレームと、最後の2つのビデオ・キーフレームとを選択する。
別の実施形態において、一サブ区間について表示されるビデオ・キーフレームは、サブ区間について抽出されたキーフレーム群におけるそれらキーフレームの位置順序に基づいて選択される。例えば、あるサブ区間について抽出されたビデオ・キーフレーム数が24で、各サブ区間について6つのビデオ・キーフレームが表示されるものとした場合に、1番目、5番目、9番目、13番目、17番目、及び、21番目、のキーフレームが選択されてもよい。この実施形態では、固定数のキーフレームがスキップされる。
更に別の実施形態において、一サブ区間について表示されるビデオ・キーフレームは、サブ区間について抽出されたキーフレーム群においてそれらキーフレームに関連する時刻値に基づいて選択される。例えば、一サブ区間について抽出されたビデオ・キーフレーム群が1秒のサンプリング・レートで抽出された24のキーフレームを有し、各サブ区間について6つのビデオ・キーフレームが表示されるものとした場合、最初のキーフレームが選択され、次に、前に選択されたキーフレームから4秒後に生じたキーフレームが選択される。
本発明の代替的実施形態として、サーバ104は、キーフレームのコンテンツの差に基づいて、キーフレーム群からキーフレームを選択してもよい。各サブ区間について、サーバ104は、そのサブ区間について抽出されたキーフレームのコンテンツにおける差を判断するために特殊な画像処理手法を用いることができる。各サブ区間について6つのビデオ・キーフレームが表示されるものとした場合、サーバ104は、この画像処理手法の結果に基づいて、抽出されたキーフレーム群から6つのキーフレームを選択する。例えば、6つの最も異なるキーフレームがパネル324−2に表示されるものとして選択されてもよい。当業者には既知の様々な他の手法もビデオ・キーフレームの選択を実行するのに用いることができるのは明らかである。
選択されたキーフレームは、次いで、パネル324−2に表示される。選択されたキーフレームをパネル324−2に表示させるのに様々な異なる形式を用いることができる。例えば、図3に示すように、各サブ区間について、選択されたキーフレームは、左から右へ、上から下へ、置かれる。
本発明の代替的実施形態では、マルチメディア文書全体が所定期間のサブ区間に分割される。各サブ区間は、そのサブ区間に関する開始時刻及び終了時刻によって特徴付けられる。本発明の一実施形態によれば、最初のサブ区間の開始時刻はそのマルチメディア文書の開始時刻に対応し、最後のサブ区間の終了時刻はそのマルチメディア文書の終了時刻に対応する。上述のように、サーバ104は、各サブ区間について、そのサブ区間に関連した開始時刻及び終了時刻に基づいて、マルチメディア文書によって格納されたビデオ情報から1以上のビデオ・キーフレームを抽出する。サーバ104は、次いで、各サブ区間について表示する1以上のキーフレームを選択する。次いで、サムネール表示エリア・レンズ314の位置に応じて、表示するものとして選択され、サムネール表示エリア・レンズ314に関連する時刻t1と時刻t2の間に生じたキーフレームがパネル324−2に表示される。
本発明の代替的実施形態として、パネル324−2にビデオ情報を表示するのに様々な他の手法も用いることができることは明らかである。本発明の一実施形態によれば、ユーザは、第三の表示エリア306にビデオ情報を表示するのに用いられる手法を設定することができる。
図3に示されたGUI300において、各サブ区間は8秒長であり、複数のサブ区間に対応するビデオ・キーフレームがパネル324−2に表示される。各サブ区間から6つのビデオ・キーフレームが表示される。各サブ区間について、表示されるキーフレームは、左から右、上から下、へ置かれる。
本発明の代替的実施形態として、第三の表示エリア306に表示されるパネル数は、第二の表示エリア304に表示されるサムネール画像数より多くても少なくてもよいことは明らかである。本発明の一実施形態によれば、第三の表示エリア306に表示されるパネル数は、ユーザが設定可能である。
本発明の教えるところによれば、概要領域306の一部を覆う又は強調する表示レンズ又は窓322(以下、「パネル表示エリア・レンズ322」と呼ぶ)が表示される。本発明の教えるところによれば、第三の表示エリア306のうちパネル表示エリア・レンズ322によって強調されるエリアに対応するマルチメディア情報は、第四の表示エリア308に表示される。ユーザは、レンズ322を第三の表示エリア306に沿ってスライド又は移動させることによって、パネル表示エリア・レンズ322の位置を変えることができる。パネル表示エリア・レンズ322の位置を第三の表示エリア306の第一の位置から第二の位置へ変更すると、第四の表示エリア308に表示されたマルチメディア情報は、第四の表示エリア308に表示されたマルチメディア情報が第三の表示エリア306のうちのパネル表示エリア・レンズ322によって強調されているエリアと対応し続けるように、自動的に更新される。したがって、ユーザは、パネル表示エリア・レンズ322を用いて、第四の表示エリア308に表示されるマルチメディア情報を変えることができる。
上述のように、パネル表示エリア・レンズ322の位置が変更されると、第二の表示エリア304のうちサブレンズ316によって強調されたエリアが、第三の表示エリア306のうちパネル表示エリア・レンズ322によって強調されたエリアに対応し続けるように、サブレンズ316の位置も変更される。同様に、上述のように、サブレンズ316の位置が変更されると、第三の表示エリア306のうちパネル表示エリア・レンズ322によって強調されたエリアが、サブレンズ316の変更後の位置に対応し続けるように、第三の表示エリア306上でのパネル表示エリア・レンズ322の位置も変更される。
図5Aは、本発明の一実施形態に係るパネル表示エリア・レンズ322の簡略化された拡大図である。図5Aに示すように、パネル表示エリア・レンズ322は、第一の辺326と第二の辺328によって区切られている。パネル表示エリア・レンズ322は、第三の表示エリア306のうち辺326と辺328の間のエリアを強調する。パネル表示エリア・レンズ322の第三の表示エリア306上での位置に基づいて、辺326はマルチメディア文書における特定の時刻t3に対応し、辺328はマルチメディア文書における特定の時刻t4(t1≦t3<t4≦t2)に対応する。例えば、パネル表示エリア・レンズ322が第三の表示エリア306の先頭に位置するとき、t3はt1と等しく、パネル表示エリア・レンズ322が第三の表示エリア306の終端に位置するとき、t2はt4と等しい。したがって、パネル表示エリア・レンズ322は、第三の表示エリア306のうち時刻t3と時刻t4の間の部分を強調する。本発明の一実施形態によれば、(パネル表示エリア・レンズ322によって強調された又は覆われた)時間区間t3〜t4に対応するマルチメディア情報は、第四の表示エリア308に表示される。パネル表示エリア・レンズ322の位置がユーザ入力に応じて第三の表示エリア306に沿って変更されると、第四の表示エリア308に表示された情報は、第四の表示エリア308に表示されるマルチメディア情報が第三の表示エリア306のうちパネル表示エリア・レンズ322によって強調されるエリアに対応し続けるように、更新される。このように、パネル表示エリア・レンズ322は、コンテキストを提供すると共に、第四の表示エリア308に表示されているマルチメディア情報のマルチメディア文書全体の中での位置を示す。
本発明の一実施形態によれば、パネル表示エリア・レンズ322によって強調されたテキストの特定の行(又はテキスト最終行の中の1以上の単語)がレンズ322の一部に表示される。例えば、図5A及び3に示すように、パネル324−1においてパネル表示エリア・レンズ322によって強調されたテキスト最終行330:「Environment is a national」は、パネル表示エリア・レンズ322上に太字で表示される。
本発明の一実施形態によれば、パネル表示エリア・レンズ322には、マルチメディア文書のブラウジング及びナビゲーションを容易にするために、特殊な特徴を取り付けることができる。図5Aに示すように、本発明の一実施形態によれば、「再生/一時停止ボタン」332及び「ロック/解除ボタン」334がパネル表示エリア・レンズ322上に設けられる。再生/一時停止ボタンにより、ユーザは、パネル表示エリア・レンズ322からのビデオ情報の再生を制御することができる。ロック/解除ボタン334により、ユーザは、ビデオ再生の位置を第四の表示エリア308のエリア340−1からパネル表示エリア・レンズ322上部の縮小ウィンドウに切り替えることができる。
図5Bは、ロック/解除ボタン334が起動された又は「ロックされた」(すなわち、ビデオ再生がパネル表示エリア・レンズ322上にロックされた)本発明の一実施形態に係るパネル表示エリア・レンズ322の簡略化された一例である。図5Bに示すように、ロック・モードでは、ビデオ情報がレンズ322上のウィンドウ336で再生される。図5bに示す実施形態において、パネル表示エリア・レンズ322のうちパネル342−2と重なる部分のサイズは、ウィンドウ336を収容するために時刻t3〜t4を越えて拡大される。本発明の一実施形態によれば、ウィンドウ336に表示されるビデオ・コンテンツは、第四の表示エリア308のエリア340−1に表示されるコンテンツに対応する。
本発明の一実施形態によれば、ウィンドウ336は、第三の表示エリア306のうちその下にある部分が見えるように、透明な境界線を有する。これは、ユーザが第三の表示エリア306を見ている間焦点位置を維持するのに役立つ。ユーザは、再生/一時停止ボタン332を用いて、ウィンドウ336に表示されたビデオを開始及び停止できる。ユーザは、ビデオをウィンドウ336で再生させたまま、パネル表示エリア・レンズ322の位置を変えることができる。パネル表示エリア・レンズ322の位置が変わると、パネル表示エリア・レンズ322の新しい位置に応じてウィンドウ336でのビデオ再生も変化する。ウィンドウ336におけるビデオ再生は、パネル表示エリア・レンズ322に関する新しい時刻の値t3及びt4に対応する。
図5Cは、代表ビデオ・キーフレームがパネル表示エリア・レンズ322上に表示された、本発明の一実施形態に係るパネル表示エリア・レンズ322の簡略化された一例である。この実施形態において、サーバ104は、パネル表示エリア・レンズ322によって強調された又は覆われたパネル324−2のビデオ・キーフレームを分析し、パネル表示エリア・レンズ322によって強調されたキーフレームを最も代表する特定のキーフレーム338を決定する。この特定のキーフレームは、次いで、パネル表示エリア・レンズ322のうちパネル324−2を覆う部分に表示される。図5Cに示した実施形態において、パネル表示エリア・レンズ322のうちパネル324−2を覆う部分のサイズは、キーフレーム338の表現を収容するために時刻t3及びt4を越えて拡大されている。
上述のように、第三の表示エリア306のうちパネル表示エリア・レンズ322によって覆われた部分に対応するマルチメディア情報(すなわち、時間区間t3〜t4に生じたマルチメディア情報)が第四の表示エリア308に表示される。図3に示すように、第四の表示エリア308は、例えば、1以上のサブ表示エリア340(例えば、340−1、340−2、及び、340−3)を有する。本発明の一実施形態によれば、サブ領域340の1以上が、第三の表示エリア306のうちパネル表示エリア・レンズ322によって強調された部分に対応するマルチメディア情報に含まれる特定種類の情報を表示する。
例えば、図3に示すように、第三の表示エリア306においてパネル表示エリア・レンズ322によって強調されたビデオ情報に対応する(又は該ビデオ情報から始まる)ビデオ情報は、サブ表示エリア340−1に表示される。本発明の一実施形態によれば、時刻t3(パネル表示エリア・レンズ322の上端に対応する時刻)から始まるビデオ情報は、サブ表示エリア340−1において再生される。代替的実施形態として、エリア340−1で再生されるビデオ情報は、時刻t4から始まってもよく、或いは、t3とt4の間のユーザが設定可能な他の時刻から始まってもよい。サブ表示エリア340−1におけるビデオの再生は、コントロール・バー342を用いて、制御することができる。コントロール・バー342は、サブ表示エリア340−1において再生されているビデオを再生させる制御、一時停止させる制御、停止させる制御、巻き戻しさせる制御、早送りさせる制御、などの複数の制御を提供する。エリア340−1には現在時刻及び再生残り時間344も表示される。ビデオの名前を識別する情報346、ビデオが録画された日付348、及び、ビデオの種類350も表示される。
本発明の代替的実施形態では、ビデオ情報を再生する代わりに、パネル324−2においてパネル表示エリア・レンズ322によって強調されたビデオ・キーフレームからのビデオ・キーフレームがサブ表示エリア340−1に表示される。本発明の一実施形態によれば、エリア340−1に表示されるキーフレームは、パネル表示エリア・レンズ322によって強調されたキーフレームを最も代表するキーフレームを表す。
本発明の一実施形態によれば、第三の表示エリア306においてパネル表示エリア・レンズ322によって強調されたテキスト情報(例えば、CCテキスト、オーディオ情報の録音、マルチメディア情報に含まれる他の種類の情報のテキスト表現、など)がサブ表示エリア340−2に表示される。本発明の一実施形態によれば、サブ表示エリア340−2は、パネル324−1に表示され、パネル表示エリア・レンズ322によって強調されるテキスト情報を表示する。上述のように、サブ表示エリア340−3には様々な種類の情報を表示させることができる。
マルチメディア文書によって格納されたマルチメディア情報に関する追加的情報は、GUI300の第五の表示エリア310に表示することができる。例えば、図3に示すように、GUI300によって表示されたマルチメディア情報に含まれるテキスト情報に現れた単語が、第五の表示エリア310のエリア352に表示される。マルチメディア文書における各単語の頻度も各単語の横に表示される。例えば、「質問」という単語は、マルチメディア情報CCテキストにおいて7回登場する。マルチメディア情報に関する様々な他の種類の情報も第五の表示エリア310に表示することができる。
本発明の一実施形態によれば、GUI300は、ユーザがマルチメディア情報から抽出したテキスト情報(例えば、CCテキスト、オーディオ情報の録音、マルチメディア情報に含まれる他の種類の情報のテキスト表現、など)に登場する1以上の単語を検索することができるようにする機能を提供する。例えば、ユーザは、入力フィールド354に1以上の検索単語(query word)を入力することができ、「検索」ボタン356を選択すると、サーバ104はマルチメディア文書によって格納されたマルチメディア情報から抽出されたテキスト情報を分析し、フィールド354に入力された1以上の検索単語のすべての存在を特定する。このマルチメディア文書における1以上の単語の存在は、次いで、第二の表示エリア304、第三の表示エリア306、及び、第四の表示エリア308に表示されるときに、強調される。例えば、本発明の一実施形態によれば、検索単語のすべての存在が、サムネール画像312−1、パネル324−1、及び、サブ表示エリア340−2において、強調される。本発明の代替的実施形態として、1以上の検索単語の存在は、第二の表示エリア304、第三の表示エリア306に表示されたパネル、及び、第四の表示エリア308に表示されたサブ表示エリア、においても強調されてもよい。
また、ユーザは、GUI300に表示されたマルチメディア情報において強調される1以上の単語を指定することもできる。例えば、ユーザは、エリア352から1以上の強調する単語を選択することができる。すると、エリア352においてユーザによって選択されたキーフレームのすべての存在は、第二の表示エリア304、第三の表示エリア306、および、第四の表示エリア308において、強調される。例えば、図6に示すように、ユーザがエリア352において「National」という単語を選択したものとすると、それに応じて、本発明の一実施形態によれば、第二の表示エリア304、第三の表示エリア306、及び、第四の表示エリア308において、「National」という単語のすべての存在が強調される。
本発明の一実施形態によれば、ユーザが選択した1以上の単語(又はフィールド354に入力された検索単語)を含むテキスト行360が第四の表示エリア308のサブ表示エリア340−3に表示される。各テキスト行について、その行がマルチメディア文書に生じた時刻362(又は、そのテキスト行に関連するタイムスタンプ)も表示される。テキスト行に関連するタイムスタンプは、一般的に、その行の最初の単語に関連するタイムスタンプに対応する。
各テキスト行について、選択された単語又は検索単語を囲む1以上の単語が表示される。本発明の一実施形態によれば、エリア340−3に表示された選択された単語を囲む単語の数はユーザが選択可能である。例えば、図6に示したGUI300において、ユーザは、コントロール364を用いて、エリア340−3に表示される周辺単語数を指定することができる。ユーザによって指定された数は、選択された単語の前に登場した単語数及び表示された選択単語の後に登場した単語数を示す。図6に示す実施形態において、コントロール364は、最小値「3」と最大値「10」の間で調節可能なスライダ・バーである。ユーザは、スライダ・バー364を調節することによって、表示される周辺単語数を指定することができる。例えば、スライダ・バーが「3」にセットされると、選択された単語の前に登場した3つの単語と、選択された単語の後に登場した3つの単語がエリア340−3に表示される。これら最小値及び最大値は、ユーザが設定可能である。
さらに、図6に示すGUI300は、検索単語又はユーザによって指定された他の単語の登場場所を示すサムネール画像312−1と312−2の間に挟まれたエリア358を有する。例えば、エリア358は、サムネール画像312−1に「National」という単語の場所を示すマーカを有する。すると、ユーザは、サムネール表示エリア・レンズ314又はパネル表示エリア・レンズ322を用いて、マルチメディア文書内で所望の場所へスクロールすることができる。図7は、本発明の一実施形態に係るエリア358を示す第二の表示エリア304の簡略化された拡大図を示す。図7に示すように、エリア358(又は、チャネル358)は、サムネール画像312−1において「National」という単語の存在を有する場所を示すマーカ360を有する。本発明の代替的実施形態として、チャネル358におけるマーカは、第二の表示エリア304に表示される他のサムネール画像におけるユーザ指定単語又はフレーズの場所も指定してもよい。代替的実施形態として、検索単語又はユーザによって指定された他の単語の存在場所は、(図20Aに示すように)サムネール画像312上に表示されてもよい。
図6に示すように、サムネール表示エリア・レンズ314の位置は図3に関して変えられている。サムネール表示エリア・レンズ314の位置が変えられると、第三の表示エリア306に表示されるマルチメディア情報は、第二の表示エリア304のうちのサムネール表示エリア・レンズ314によって強調された部分に対応するように、変化する。第四の表示エリア308に表示されるマルチメディア情報も、パネル表示エリア・レンズ322の新しい位置に応じて変化する。
本発明の一実施形態によれば、GUI300に表示されたユーザ指定の関心ある話題(topics of interest)に関連するマルチメディア情報は強調されるか注釈が付けられる。注釈又は強調は、ユーザに関連する又はユーザが関心ある情報を視覚的に示す。このように、GUI300は、ユーザがマルチメディア文書のうち該ユーザに関連する部分を容易に見つけることを可能にする便利なツールを提供する。
本発明の一実施形態によれば、ユーザが関心ある又はユーザに関連する話題を指定する情報がユーザ・プロファイルに格納される。1以上の単語又はフレーズを関心ある各話題に関連付けることができる。特定のユーザ指定の関心ある話題に関連付けられた1以上の単語又はフレーズの存在は、該特定の話題に関する情報が存在することを示す。例えば、ユーザは、2つの関心ある話題:「George W.Bush(ジョージ・W・ブッシュ)」及び「Energy Crisis(エネルギ危機)」を指定することができる。話題「George Bush」に関連付けられる単語又はフレーズは、例えば、「President Bush(ブッシュ大統領)」、「the President(大統領)」、「Mr.Bush(ブッシュ氏)」などの単語及びフレーズを含む。話題「Energy Crisis」に関連付けられる単語又はフレーズは、例えば、「industrial pollution(産業公害)」、「natural pollution(自然汚染)」、「clean up the sources(水源浄化)」、「amount of pollution(汚染量)」、「air pollution(大気汚染)」、「electricity(電気)」、「power−generating plant(発電所)」、などを含む。単語又はフレーズの存在から考えられた関心ある話題の尤度を示す確率値が単語又はフレーズの各々に関連付けられてもよい。ユーザが関心ある話題を設定できるようにするツール、話題に関連付けられるキーワード及びフレーズを指定するツール、及び、キーワード又はフレーズに関連付けられる確率値を指定するツールなど様々なツールを設けることができる。
ユーザにとって関心ある話題をモデル化するのに当業者には既知の様々な他の手法も用いることができることは明らかである。これら手法とは、例えば、Bayesian networksやrelevance graphsなどを用いることである。ユーザ指定の話題に関連する部分を決定する手法、関心ある話題を定義する手法、及び、キーワード及び/又はキーフレーズと確率値を関連付ける手法は、ここにその全体が参考文献としてここに組み込まれる、米国特許出願第08/995,616号(出願日:1997年12月22日)に記載されている。
本発明の一実施形態によれば、マルチメディア文書においてユーザ指定の関心ある話題に関連する場所を特定するために、サーバ104は、マルチメディア文書を検索し、そのマルチメディア文書内でその関心ある話題に関連付けられた単語又はフレーズに関する場所を特定する。上述のように、特定のユーザ指定の関心ある話題に関連付けられた単語又はフレーズがマルチメディア文書に存在することは、そのユーザに関連する特定の話題が存在することを示す。マルチメディア文書に登場し、ユーザ指定の関心ある話題に関連付けられた単語及びフレーズは、GUI300によって表示されるとき、注釈が付けられる又は強調される。
図8は、ユーザが関心ある1以上の話題に関連するマルチメディア情報がGUI300に表示されるときに強調された(又は、注釈が付けられた)、本発明の一実施形態に係る簡略化されたGUI800の一例を示す。図8に示されたGUI800は、本発明の一実施形態の単なる例示であり、請求項記載の本発明の範囲を限定するものではない。当業者には、他の変形例、修正例、及び、代替例も明らかであろう。
図8に示す実施形態において、ユーザは、関心ある話題802を4つ指定している。ラベル803は各話題を識別する。GUI800で指定された話題は、「Energy Crisis(エネルギ危機)」、「Assistive Tech(補助技術)」、「George W.Bush(ジョージ・W・ブッシュ)」、及び、「Nepal(ネパール)」を含む。本発明の教えるところによれば、指定された話題に関連するキーワード及びキーフレーズは、第二の表示エリア304、第三の表示エリア306、及び、第四の表示エリア308において、強調される。関心ある話題に関連するキーワード及び/又はキーフレーズを強調させる又はそれらに注釈を付けるのには様々な異なる手法を用いることができる。本発明の一実施形態によれば、ユーザ指定の話題に関する単語及びフレーズを強調させるのに異なる色及びスタイル(例えば、太字、下線、異なるフォントサイズ、など)を用いることができる。例えば、各話題に特定の色を割り当て、特定の話題に関連するコンテンツはその特定の話題に割り当てられた特定の色を用いて強調されてもよい。例えば、図8に示すように、関心ある話題:「Energy Crisis」に関連する単語及びフレーズを強調させるのに第一の色が用いられ、関心ある話題:「Assistive Tech」に関連する単語及びフレーズを強調させるのに第二の色が用いられ、関心ある話題:「George W.Bush」に関連する単語及びフレーズを強調させるのに第三の色が用いられ、関心ある話題:「Nepal」に関連する単語及びフレーズを強調させるのに第四の色が用いられる。
本発明の一実施形態によれば、サーバ104はマルチメディア情報から抽出されたテキスト情報(例えば、CCテキスト情報、オーディオ情報の録音、又は、マルチメディア情報に含まれる他のいくつかの種類の情報のテキスト表現、など)を検索し、ユーザ話題に関連する単語又はフレーズの場所を探す。サーバ104が関心ある話題に関連付けられた単語又はフレーズをテキスト情報内に見つけると、その単語又はフレーズは、GUI800に表示されるとき、注釈が付けられる又は強調される。上述のように、この単語又はフレーズに注釈を付ける又は強調するのには複数の異なる手法を用いることができる。例えば、この単語又はフレーズは、例えば、強調されてもよく、太字にされてもよく、下線が引かれてもよく、サイドバー又はバルーンを用いて境界線が引かれてもよく、フォントが変えられてもよい。
GUIによって表示され、ユーザ指定の関心ある話題に関連するキーフレーム(マルチメディア文書のビデオ情報を代表する)も強調されてもよい。本発明の一実施形態によれば、サーバ・システム104は、OCR技術を用いて、マルチメディア情報に含まれるビデオ情報から抽出されたキーフレームからテキストを抽出する。OCR技術によるテキスト出力は、次いで、1以上のユーザ指定の関心ある話題に関連付けられた単語又はフレーズと比較される。一致するものがあれば、一致した単語又はフレーズを含むキーフレーム(すなわち、OCR技術によって一致した単語又はフレームが抽出されたキーフレーム)は、そのキーフレームがGUI800においてGUI800の第二の表示エリア304、第三の表示エリア306、又は、第四の表示エリア308に表示されるとき、注釈が付けられる又は強調される。このキーフレームに注釈を付ける又は強調させるのには複数の異なる手法を用いることができる。例えば、特定の関心ある話題に関連するキーフレームの周囲に特殊な枠線が引かれてもよい。この枠線の色がその特定の関心ある話題に関連付けられた色に対応してもよい。また、キーフレームにおける合致テキストは、強調されてもよく、下線が引かれてもよく、あるいは、反転映像で表示されてもよい。上述のように、第二の表示エリア304に表示された注釈が付けられた又は強調されたキーフレーム(例えば、図3にサムネール画像312−2として表示されたキーフレーム)は、チャネル・エリア358に表示されるマーカによって識別できる。代替的実施形態として、このキーフレームは、サムネール画像312−2において、注釈が付けられてもよく、又は強調されてもよい。
本発明の一実施形態によれば、図8に示すように、各ユーザ話題について、関連度インジケータ804も表示される。特定の話題について、その話題に関する関連度インジケータは、そのマルチメディア文書の該特定の話題に対する関連性の度合(又は、関連性のスコア)を示す。例えば、図8に示すように、特定の話題に関連付けられた関連性インジケータに表示されたバーの数は、そのマルチメディア文書の該特定の話題に対する関連性の度合を示す。したがって、GUI800に表示されたマルチメディア文書は、ユーザ話題「Energy Crisis」に対して最も関連性を有し(4つのバーで示されている)、ユーザ話題「Nepal」に対して最も関連性を有しない(1つのバーで示されている)。各話題のマルチメディア文書に対する関連性の度合を示す様々な他の手法(例えば、関連性スコア、棒グラフ、異なる色、など)も用いることができる。
本発明の一実施形態によれば、特定の話題についての関連性スコアは、その特定の話題に関連付けられた単語及びフレーズがマルチメディア情報に登場する頻度に基づいて計算される。また、その特定の話題についての関連性スコアを計算するのにその特定の話題に関連付けられた単語又はフレーズに関する確率値を用いることもできる。また、ある話題に関連付けられた単語及びフレーズがマルチメディア文書に登場する頻度及びその単語又はフレーズに関連付けられた確率値に基づいてユーザ指定の関心ある話題に関する関連性スコアを決定するのには当業者には既知の様々な手法も用いることができる。また、マルチメディア文書のその関心ある話題に対する関連性の度合を計算するのには当業者には既知の様々な他の手法も用いることができる。
既述のように、関連性インジケータは、そのユーザに対する関連性の度合又は関連性スコアを表示するのに用いられる。関連性インジケータに表示された情報に基づいて、ユーザは、マルチメディア文書によって格納されたマルチメディア情報の該ユーザが指定し得る話題に対する関連性を容易に判断することができる。
図9は、本発明の一実施形態に関する関心ある話題を定義する簡略化されたユーザ・インターフェース900を示す。ユーザ・インターフェース900は、第一の表示エリア302から適切なコマンドを選択することによって呼び出すことができる。図9に示すGUI900は、本発明の一実施形態の単なる一例であり、請求項記載の本発明の範囲を制限するものではない。当業者には他の変形例、修正例、及び、代替例も明らかであろう。
ユーザは、フィールド902において関心ある話題を指定できる。この関心ある話題を識別するラベルをフィールド910において指定することができる。フィールド910において指定されたラベルは、その関心ある話題を識別するために、本発明の教えるところに従って生成されたGUIに表示される。フィールド902において指定された話題に関連付けられた単語及び/又はフレーズのリストがエリア908に表示される。ユーザは、このリストに新しいキーワードを追加したり、リスト中の1以上のキーワードを修正したり、この関心ある話題に関連付けられたキーワード・リストから1以上のキーワードを削除したり、することができる。ユーザは、フィールド904において、関心ある話題に関連付けられる新しいキーワード又はフレーズを指定することができる。「追加」ボタン906を選択すると、フィールド904において指定されたキーワード又はフレーズが前にある話題に関連付けられたキーワード・リストに追加される。ユーザは、エリア912において色を選択することによって、関心ある話題に関連する情報に注釈を付ける又は強調するのに用いられる色を指定することができる。例えば,図9に示す実施形態において、マルチメディア文書において「Assistive Technology」に関連する位置は、青色で注釈が付けられる又は強調される。
本発明の教えるところによれば、サーバ104によって生成されたGUIは、マルチメディア情報に含まれる様々な異なる種類の情報を表示できる。図10は、本発明の一実施形態に係る会議録画によって格納されたマルチメディア情報を表示する簡略化されたユーザ・インターフェース1000を示す。図10に示すGUI1000は本発明を組み込んだ一実施形態の単なる例示であり、請求項記載の本発明の範囲を制限するものではないことは明らかである。当業者には、他の変形例、修正例、及び代替例が明らかであろう。
会議録画によって格納されたマルチメディア情報は、ビデオ情報及びオーディオ情報を有すると共に、おそらく、CCテキスト情報、スライド情報、及び、他の種類の情報も有する。スライド情報は、会議中に提示されたスライド(例えば、PowerPointプレゼンテーション・スライド)に関連する情報を含み得る。例えば、スライド情報は、会議において提示されたスライド画像を含む。図10に示すように、第二の表示エリア304は、3つのサムネール画像312−1、312−2、及び、312−3を有する。会議録画マルチメディア情報から抽出されたテキスト情報(例えば、CCテキスト情報、会議録画に含まれるオーディオ情報の録音、又は、会議録画に含まれる他の種類の情報のテキスト表現)がサムネール画像312−1に表示される。会議録画マルチメディア情報に含まれるビデオ情報から抽出されたビデオ・キーフレームは、サムネール画像312−2に表示される。マルチメディア情報に含まれるスライド情報から抽出されたスライドは、サムネール画像312−3に表示される。このサムネール画像は、互いに時系列に並べられる。サムネール画像312−4に表示される情報は、ユーザが会議録画中の様々な時点で提示されたプレゼンテーション・スライドを見ることができるという点で、ビデオ及びテキスト情報に対する追加的コンテキストを提供する。
第三の表示エリア306は、3つのパネル324−1、324−2、及び324−3を有する。パネル324−1は、サムネール画像312−1のうちサムネール表示エリア・レンズ314によって強調された又は覆われた部分に対応するテキスト情報を表示する。パネル324−2は、サムネール画像312−2のうちサムネール表示エリア・レンズ314によって強調された又は覆われた部分に対応するビデオ・キーフレームを表示する。パネル324−3は、サムネール画像312−3のうちサムネール表示エリア・レンズ314によって強調された又は覆われた部分に対応する1以上のスライドを表示する。これらパネルは、互いに時系列に並べられる。
第四の表示エリア308は、3つのサブ表示エリア340−1、340−2、及び340−3を有する。サブ表示エリア340−1は、パネル324−2のうちパネル表示エリア・レンズ322によって覆われた部分に対応するビデオ情報を表示する。上述のように、サブ表示エリア340−1は、パネル324−2の強調された部分に対応するキーフレームを表示し得る。別の方法として、パネル表示エリア・レンズ322の部分に基づくビデオがエリア340−1において再生されてもよい。本発明の一実施形態によれば、レンズ322に関連する時刻t3は、第四の表示エリア308のエリア340−1においてそのビデオの再生を開始する時間として用いられる。例えば360度カメラを用いて記録された会議室のパノラマ・ショットも第四の表示エリア308のエリア340−1に表示される。パネル324−1においてパネル表示エリア・レンズ322によって強調されたテキスト情報は、第四の表示エリア308のエリア340−2に表示される。パネル324−3においてパネル表示エリア・レンズ322によって強調された1以上のスライドが第四の表示エリア308のエリア340−3に表示される。本発明の一実施形態によれば、ユーザは、特定のスライドをクリックすることによって、パネル324−3からそのスライドを選択することもできる。選択されたスライドは、次いで、第四の表示エリア308のエリア340−3に表示される。
本発明の一実施形態によれば、ユーザは、マルチメディア文書に含まれる情報のうちGUIに表示される情報の種類を指定することができる。例えば、ユーザは、「スライド」ボタン1004を選択状態にする又は非選択状態にすることによって、GUIに表示されるスライド関連情報(すなわち、サムネール画像312−3、パネル324−3、及び、第四の表示エリア308のエリア340―3に表示される情報)をオン/オフすることができる。ユーザがスライド情報を非選択状態とした場合、GUI1000はサムネール312−3及びパネル324−3を表示しない。ユーザがボタン1004を選択状態とした場合、GUI1000はサムネール312−3及びパネル324−3を表示する。このように、ボタン1004は、スライド情報の表示/非表示を切り替えるスイッチとして機能する。同様に、ユーザは、本発明の教えに従って生成されるGUIによって表示される他の種類の情報も制御することができる。例えば、GUI1000が表示するビデオ情報、テキスト情報、及び、他の種類の情報をオン/オフする機能を設けることができる。
図11は、本発明の一実施形態に係り、マルチメディア文書によって格納されたマルチメディア情報を表示する簡略化されたユーザ・インターフェース1100を示す。図11に示すGUI1100は、本発明を組み込む一実施形態の単なる例示であり、請求項記載の本発明の範囲を制限するものではないことは明らかである。当業者には、他の変形例、修正例、及び代替例が明らかであろう。
含まれるコンテンツがGUI1100に表示されたマルチメディア文書は、ビデオ情報、オーディオ情報、又は、CCテキスト情報、スライド情報、及び、ホワイトボード情報を有する。ホワイトボード情報は、ホワイトボード上に書かれたテキスト及び図の画像を含み得る。図11に示すように、第二の表示エリア304は、4つのサムネール画像312−1、312−2、312−3、及び312−4を有する。マルチメディア文書から抽出されたテキスト情報(例えば、CCテキスト情報、又は、会議録画に含まれたオーディオ情報の録音、又は、マルチメディア情報に含まれる他の種類のテキスト表現)がサムネール画像312−1に表示される。マルチメディア文書に含まれるビデオ情報から抽出されたビデオ・キーフレームはサムネール画像312−2に表示される。マルチメディア情報に含まれるスライド情報から抽出されたスライドはサムネール画像312−3に表示される。マルチメディア文書に含まれるホワイトボード情報から抽出されたホワイトボード画像はサムネール画像312−4に表示される。これらサムネール画像は、互いに時系列に並べられる。
第三の表示エリア306は、4つのパネル324−1、324−2、324−3、及び324−4を有する。パネル324−1は、サムネール画像312−1のうちサムネール表示エリア・レンズ314によって強調された又は覆われた部分に対応するテキスト情報を表示する。パネル324−2は、サムネール画像312−2のうちサムネール表示エリア・レンズ314によって強調された又は覆われた部分に対応するビデオ・キーフレームを表示する。パネル324−3は、サムネール画像312−3のうちサムネール表示エリア・レンズ314によって強調された又は覆われた部分に対応する1以上のスライドを表示する。パネル324−4は、サムネール画像312−4のうちサムネール表示エリア・レンズ314によって強調された又は覆われた部分に対応する1以上のホワイトボード画像を表示する。これらパネルは互いに時系列に並べられる。
第四の表示エリア308は、3つのサブ表示エリア340−1、340−2、及び340−3を有する。エリア340−1は、パネル324−2のうちパネル表示エリア・レンズ322によって覆われた部分に対応するビデオ情報を表示する。上述のように、サブ表示エリア340−1は、パネル324−2の強調された部分に対応するキーフレームを表示してもよく、対応するビデオを再生してもよい。本発明の一実施形態によれば、レンズ322に関連する(上述の)時刻t3は、第四の表示エリア308のエリア340−1におけるそのビデオの再生の開始時刻として用いられる。マルチメディア文書が記録された場所の(例えば、360度カメラを用いて記録された)パノラマ・ショット1102も第四の表示エリア308のエリア340−1に表示される。パネル324−1においてパネル表示エリア・レンズ322によって強調されたテキスト情報は、第四の表示エリア308のエリア340−2に表示される。パネル324−3においてパネル表示エリア・レンズ322によって強調されたスライド、又は、パネル324−4においてパネル表示エリア・レンズ322によって強調されたホワイトボード画像が第四の表示エリア308のエリア340−3に表示されてもよい。図11に示す実施形態において、パネル324−4のうちパネル表示エリア・レンズ322によって覆われた部分に対応するホワイトボード画像は、エリア340−3に表示される。本発明の一実施形態によれば、ユーザは、パネル324−3の特定のスライド又はパネル324−4の特定のホワイトボード画像をクリックすることによって、そのスライド又はホワイトボード画像を選択することができる。選択されたスライド又はホワイトボード画像は、次いで、第四の表示エリア308のエリア340−3に表示される。
上述のように、本発明の一実施形態によれば、ユーザは、マルチメディア文書からの情報のうちGUIに表示される情報の種類を指定することができる。例えば、ユーザは、GUIによって表示される特定の種類の情報をオン/オフさせることができる。ユーザは、「WB」ボタン1104を用いて、GUI1000によって表示されるホワイトボード関連情報(すなわち、サムネール画像312−4、パネル324−4、及び、第四の表示エリア308のエリア340−3)をオン/オフさせることができる。
図12は、本発明の一実施形態に係るマルチメディア文書のコンテンツを表示する簡略化されたユーザ・インターフェース1200を示す。図12に示すGUI1200は、本発明を組み込んだ一実施形態の単なる例示であり、請求項記載の本発明の範囲を制限するものではないことは明らかである。当業者には、他の変形例、修正例、及び代替例が明らかであろう。
図12に示すように、第三の表示エリア306の上部及び下部にはプレビュー・エリア1202及び1204が設けられる。本実施形態において、パネル表示エリア・レンズ322は、第三の表示エリア306に沿って、プレビュー・エリア1202の端1206とプレビュー・エリア1204の端1208との間で動かすことができる。プレビュー・エリア1202及び1204により、ユーザは、パネル表示エリア・レンズ322を用いてマルチメディア文書をスクロールさせているとき、第三の表示エリア306に表示されたコンテンツをプレビューすることができる。例えば、ユーザがパネル表示エリア・レンズ322を用いてマルチメディア文書をスクロール・ダウンさせているとき、ユーザはプレビュー1204において次に来るコンテンツを見ることができ、第三の表示エリア306を去っていくコンテンツをプレビュー1202において見ることができる。ユーザがパネル表示エリア・レンズ322を用いてマルチメディア文書をスクロール・アップさせているとき、ユーザはプレビュー1202において次に来るコンテンツを見ることができ、第三の表示エリア306を去っていくコンテンツをプレビュー1204において見ることができる。本発明の一実施形態によれば、ユーザは、各プレビュー領域のサイズ(又は長さ)を変更及びカスタマイズすることができる。例えば、図12に示すGUI1200において、ユーザがプレビュー領域1204のサイズを変更するのに用いるハンドル1210が設けられる。本発明の一実施形態によれば、プレビュー・エリアもまた第二の表示エリア304に設けられてもよい。
図13は、本発明の一実施形態に係り、マルチメディア文書のコンテンツを表示する簡略化されたユーザ・インターフェース1300を示す。図13に示すGUI1300は、本発明を組み込んだ一実施形態の単なる例示であり、請求項記載の本発明の範囲を制限するものではないことは明らかである。当業者には、他の変形例、修正例、及び代替例が明らかであろう。
図13に示すように、第三の表示エリア306のパネル324−1に、テキスト情報が圧縮された形式で、すなわち行間の余白が削除されて、表示される。これにより、テキスト情報の読み易さが向上する。パネル324−1に表示されたテキスト行は、次いで、パネル324−2に表示されるビデオ・フレームを決定するのに用いられる。本発明の一実施形態によれば、パネル324−1に表示されるテキストの各行にタイムスタンプが関連付けられる。一テキスト行に関連付けられるタイムスタンプは、そのテキストがGUI1300によって表示されているマルチメディア文書に登場した時刻を表す。一実施形態において、一テキスト行に関連付けられたタイムスタンプは、そのテキスト行の最初の単語に関連付けられたタイムスタンプと一致する。次いで、パネル324−1に表示されたテキスト行は、各グループが所定の行数を有するように、グループ分けされる。
次いで、行グループの各々について、そのグループの行に関連付けられたタイムスタンプに応じて、マルチメディア文書によって格納されたビデオ情報からビデオ・キーフレームが抽出される。本発明の一実施形態によれば、サーバ104は、行グループの各々に関連付けられる開始時刻及び終了時刻を決定する。あるグループについての開始時刻は、そのグループの最初の(最も古い)行に関連付けられた時刻と一致し、あるグループについての終了時刻は、そのグループの最後の(最も新しい)行に関連付けられた時刻と一致する。特定のテキスト行グループに対応するパネル324−2に表示されるキーフレームを決定するために、サーバ104は、ビデオ情報のうちその特定のグループに関連付けられた開始時刻と終了時刻との間に登場した部分から1以上のビデオ・キーフレームを抽出する。次いで、抽出されたビデオ・キーフレームからその特定のグループについてパネル324−2に表示される1以上のキーフレームが選択される。この1以上の選択されたキーフレームは、次いで、そのキーフレームが抽出されたパネル324−1に表示された行グループに隣接して、パネル324−1に表示される。
例えば、図13において、パネル324−1に表示される行は、各グループが4テキスト行を有するように、グループに分割される。各グループについて、そのグループの1番目の行に関連付けられたタイムスタンプがそのグループについての開始時刻と一致し、そのグループの4番目の行に関連付けられたタイムスタンプがその行グループについての終了時刻と一致する。図13に示す実施形態では、パネル324−1に表示される4テキスト行から成る各グループの各々について、3つのビデオ・キーフレームがパネル324−2に表示される。本発明の一実施形態によれば、特定の行グループに対応するこれら3つのビデオ・キーフレームは、その特定のグループの開始時刻と終了時刻の間のビデオ情報から抽出されたキーフレーム群のうちの最初、真ん中、及び最後のキーフレームに対応する。上述のように、パネル324−2に表示されるビデオ・キーフレームを選択するのには様々な他の手法も用いることができる。パネル324−1に表示される行グループの各々について、その行グループに対応するキーフレームは、それらキーフレームが時間的に行グループと揃うように、表示される。図13に示す実施形態において、ある行グループについてのキーフレームの高さは、その行グループの垂直高さとほぼ等しい。
一グループに含まれるテキスト行の行数は、ユーザが設定可能である。同様に、特定の行グループについて抽出されるビデオ・キーフレーム数もユーザが設定可能である。さらに、各行グループについてパネル324−2に表示されるビデオ・キーフレームも本発明のユーザが設定することができる。
抽出されたキーフレームがパネル324−2にどのように表示されるかもユーザが設定可能である。特定の行グループとその特定の行グループについて表示されるビデオ・キーフレームとの間の関係を示すのに様々な手法を用いることができる。例えば、本発明の一実施形態によれば、パネル324−1に表示される特定の行グループ及びパネル324−2に表示される対応するビデオ・キーフレームは、その関係を示すために、同じ色で色分け又は表示されてもよい。この関係を示すのには当業者には既知の様々な他の手法も用いることができる。
(本発明の一実施形態に係るGUI生成手法)
以下、本発明の一実施形態に係るGUI(例えば、図3に示したGUI300)生成手法について説明する。便宜上、GUIに表示されるマルチメディア情報は、ビデオ情報、オーディオ情報、及び、CCテキスト情報を有するものとする。GUI300を生成するタスクを分解すると、(a)マルチメディア情報から抽出されたテキスト情報を表示するサムネール312−1を第二の表示エリア304に表示するタスク、(b)マルチメディア情報に含まれるビデオ情報から抽出されたビデオ・キーフレームを表示するサムネール312−2を表示するタスク、(c)第二の表示エリア304の一部を強調し、この第二の表示エリア304の強調された部分に対応する情報を第三の表示エリア306に表示するサムネール表示エリア・レンズ314、及び、第三の表示エリア306の一部を強調し、この第三の表示エリア306の強調された部分に対応する情報を第四の表示エリア308に表示するパネル表示エリア・レンズ322、を表示するタスク、及び、(d)第五の表示エリア310に情報を表示するタスク、に分けることができる。
図14は、本発明の一実施形態に係るサムネール312−1を第二の表示エリア304に表示する方法を示す簡略化された高レベル・フローチャート1400である。図14に示す方法は、サーバ104によって実行されてもよく、クライアント102によって実行されてもよく、或いは、サーバ104及びクライアント102によって共同して実行されてもよい。例えば、本方法は、サーバ104又はクライアント102上で実行するソフトウェア・モジュールによって実行されてもよく、サーバ104又はクライアント102に接続されたハードウェア・モジュールによって実行されてもよく、或いは、これらの組み合わせでもよい。以下に説明する実施形態では、本方法はサーバ104によって実行される。図14に示す方法は、本発明を組み込んだ一実施形態の単なる例示であり、請求項記載の本発明の範囲を制限するものではない。当業者には、他の変形例、修正例、及び代替例が明らかであろう。
図14に示すように、本方法は、サーバ104がGUIに表示されたマルチメディア情報にアクセスしたときに開始される(ステップ1402)。既述のように、マルチメディア情報は、サーバ104がアクセス可能なマルチメディア文書に格納され得る。ステップ1402の一部として、サーバ104はマルチメディア文書を識別する情報(例えば、そのマルチメディア文書のファイル名)及びそのマルチメディア文書の場所(例えば、ディレクトリ・パス)を受信してもよい。本発明のユーザがマルチメディア文書識別情報を提供してもよい。その場合、サーバ104は、提供された情報に基づいてマルチメディア文書にアクセスすることができる。別の方法として、サーバ104は、GUIに表示されるマルチメディア情報をマルチメディア情報源からストリーミング媒体信号、ケーブル信号、などの形で受信してもよい。その場合、サーバ・システム104は、マルチメディア情報信号をマルチメディア文書として格納し、その後、格納された文書を用いて本発明の教えるところに従ったGUIを生成する。
次いで、サーバ104は、ステップ1402でアクセスしたマルチメディア情報からテキスト情報を抽出する(ステップ1404)。ステップ1402でアクセスしたマルチメディア情報がCCテキスト情報を含む場合、このテキスト情報は、マルチメディア情報から抽出されたCCテキスト情報に対応する。ステップ1402でアクセスしたマルチメディア情報がCCテキスト情報を含まない場合、ステップ1404において、ステップ1402にアクセスされたマルチメディア情報に含まれるオーディオ情報が録音され、そのオーディオ情報のテキスト録音が生成される。このテキスト録音は、ステップ1404で抽出されたテキスト情報を表す。また、ステップ1404で抽出されたテキスト情報は、マルチメディア情報に含まれる他の種類の情報のテキスト表現であってもよい。
ステップ1404で決定されたテキスト情報は、各行が1以上の単語を有する行の集合を含む。各単語には、その単語がマルチメディア情報に登場した時刻を示すタイムスタンプが関連付けられる。各単語についてのタイムスタンプ情報は、CCテキスト情報に含まれる。別の方法として、そのテキストがオーディオ情報の録音を表す場合、この各単語についてのタイムスタンプ情報は、オーディオ録音処理中に決定されてもよい。別の方法として、そのテキスト情報がマルチメディア情報に含まれる他の種類の情報のテキスト表現を表す場合、その他の種類の情報に関連付けられるタイムスタンプが決定されてもよい。
ステップ1404の一部として、各行に、その行に含まれる単語に基づいて、開始時刻及び終了時刻が割り当てられる。ある行の開始時刻は、その行に登場する最初の単語に関連付けられたタイムスタンプに一致し、ある行の終了時刻は、その行に登場する最後の単語に関連付けられたタイムスタンプに一致する。
タイミング情報などのステップ1404で決定されたテキスト情報は、次いで、サーバ104がアクセスできるメモリ・ロケーションに格納される(ステップ1406)。一実施形態において、テキスト情報を格納するのに行オブジェクトの連結リストを含むデータ構造(又は、メモリ構造)が用いられる。各行オブジェクトは、その行に含まれる単語の連結リストを有する。また、単語及び行に関連付けられたテキスト情報も、このデータ構造に格納される。このデータ構造に格納された情報は、次いで、GUI300を生成するのに用いられる。
次いで、サーバ104は、そのテキスト情報を描画するパネル(以下、「テキスト・キャンバス」と呼ぶ)の長さ又は高さをピクセル単位で決定する(ステップ1408)。テキスト・キャンバスの長さを決定するために、マルチメディア情報の(又は、マルチメディア文書を格納するマルチメディア文書の)持続時間(「duration」)が秒単位で決定される。また、1秒あたりのピクセル(「pps」)値も定義される。この「pps」は、テキスト・キャンバスに描画されるテキストの行間の距離を決定する。このように、ppsの値は、ユーザがテキスト行が表示されるとき互いにどのくらい接近していて欲しいかとそのテキストを表示するのに用いられるフォントのサイズとに依存する。本発明の一実施形態によれば、6ポイントのフォントを用いると、pps値=5が指定される。テキスト・キャンバスのピクセル単位での全高(「textCanvasHeight」)は以下のように決定される。
textCanvasHeight=duration*pps
例えば、マルチメディア情報の持続時間(duration)が1時間(すなわち、3,600秒)で、pps値が5の場合、テキスト・キャンバス(textCanvasHeight)の高さは18,000ピクセル(=3,600*5)となる。
次いで、テキスト・キャンバスにおけるピクセル位置を秒に変換し、秒をテキスト・キャンバスのピクセル位置に変換する乗数が計算される(ステップ1410)。所定の時間値(秒単位)をテキスト・キャンバスの特定のピクセル位置に変換する乗数「pix_m」が計算される。乗数pix_mは、特定の時間値に対応するテキスト・キャンバスのピクセル位置を決定するのに用いることができる。pix_mの値は、以下のように決定される。
pix_m=textCanvasHeight/duration
例えば、duration=3,600秒、且つ、textCanvasHeight=18,000ピクセルの場合、pix_m=18,000/3,600=5となる。
テキスト・キャンバスの特定のピクセル位置を対応する時間値に変換する乗数sec_mが計算される。乗数sec_mは、テキスト・キャンバスのピクセル位置に対応する時間値を決定するのに用いることができる。sec_mの値は、以下のように決定される。
sec_m=duration/textCanvasHeight
例えば、duration=3,600秒、且つ、textCanvasHeight=18,000ピクセルの場合、sec_m=3,600/18,000=0.2となる。
ステップ1410において計算された乗数は、次いで、ピクセルを秒に、秒をピクセルに、変換するのに用いることができる。例えば、マルチメディア情報において時刻t=1,256秒に発生したあるイベントのテキスト・キャンバスにおけるピクセル位置は、テキスト・キャンバスの上から1,256*pix_m=1,256*5=6,280ピクセルのところである。テキスト・キャンバスにおいてピクセル位置p=231に対応する秒数は、231*sec_m=231*0.2=46.2秒である。
ステップ1408において決定されたテキスト・キャンバスの高さと、ステップ1410において生成された乗数とに基づいて、ステップ1404で抽出されたテキスト情報の単語について位置座標(水平座標X及び垂直座標Y)が計算される(ステップ1412)。既述のように、単語及び行に関連する情報、及び、それらに関連付けられたタイムスタンプは、サーバ104がアクセス可能なデータ構造に格納され得る。各単語について計算された位置座標値もこのデータ構造に格納されてもよい。
ある単語についてのY(垂直)座標(Wy)は、その単語に関連付けられた秒単位のタイムスタンプ(Wt)にステップ1410で決定された乗数pix_mを掛けることによって計算される。したがって、
Wy(ピクセル単位)=Wt*pix_m
となる。例えば、特定の単語がWt=539秒を有する(すなわち、その単語はマルチメディア情報に入って539秒後に登場した)場合、テキスト・キャンバスの上からWy=539*5=2,695ピクセルである。
ある単語についてのX(水平)座標(Wx)は、その単語の行内位置及びその行での前の単語の幅に基づいて計算される。例えば、ある特定の行(L)が4つの単語を有する場合、すなわち、L:W1W2W3W4の場合、
W1のWx=0
W2のWx=(W1のWx)+(W1の幅)+(単語の間隔)
W3のWx=(W2のWx)+(W2の幅)+(単語の間隔)
W4のWx=(W3のWx)+(W3の幅)+(単語の間隔)
次いで、テキスト情報の単語がステップ1412で単語について計算されたX及びY座標によって決定されたテキスト・キャンバス上の位置に描画される(ステップ1414)。
次いで、サーバ104は、GUI300の第二の表示エリア304にテキスト情報を表示するサムネール312−1の高さを決定する(ステップ1416)。サムネール312−1の高さ(ThmbnailHeight)は、マルチメディア情報を表示するのに用いられるGUIウィンドウの高さと、このGUIウィンドウ内の第二の表示エリア304の高さとに依存する。ThumbnailHeightの値は、サムネール312−1が第二の表示エリア304のGUIにフィットするように、セットされる。
次いで、サムネール312−1の高さがThumbnailHeightに等しくなり、サムネールが第二の表示エリア304のサイズ制約内に完全にフィットするように、テキスト・キャンバスを縮小することによって、サムネール312−1が生成される(ステップ1418)。次いで、テキスト・キャンバスの縮小版を表すサムネール312−1は、GUI300の第二の表示エリア304に表示される(ステップ1420)。
次いで、サムネール312−1におけるピクセル位置を秒に変換し、秒をサムネール312−1におけるピクセル位置に変換する乗数が計算される(ステップ1422)。所定の時間値(秒単位)をサムネール312−1における特定のピクセル位置に変換する乗数「tpix_m」が計算される。乗数tpix_mは、特定の時間値に対応するサムネールにおけるピクセル位置を決定するのに用いることができる。tpix_mの値は、以下のように決定される。
tpix_m=ThumbnailHeight/duration
例えば、duration=3,600秒、且つ、ThumbnailHeight=900の場合、tpix_m=900/3,600=0.25となる。
サムネール312−1における特定のピクセル位置を対応する時間値に変換する乗数「tsec_m」が計算される。乗数tsec_mは、サムネール312−1における特定のピクセル位置についての時間値を決定するのに用いることができる。tsec_mの値は、以下のように決定される。
tsec_m=duration/ThumbnailHeight
例えば、duration=3,600秒、且つ、ThumbnailHeight=900の場合、tsec_m=3,600/900=4となる。
乗数tpix_m及びtsec_mは、次いで、ピクセルを秒に、秒をサムネール312−1におけるピクセルに、変換するのに用いることができる。例えば、マルチメディア情報において時刻t=1,256秒に発生した単語のサムネール312−1におけるピクセル位置は、サムネール312−1の上から1,256*tpix_m=1,256*0.25=314ピクセルのところである。サムネール312−1においてピクセル位置p=231によって表される秒数は、231*tsec_m=231*4=924秒である。
図15は、本発明の一実施形態に係るGUI300の第二の表示エリア304に、ビデオ情報から抽出されたビデオ・キーフレームを示すサムネール312−2を表示する方法を示す簡略化された高レベル・フローチャート1500である。図15に示す方法は、サーバ104によって実行されてもよく、クライアント102によって実行されてもよく、或いは、サーバ104及びクライアント102によって共同して実行されてもよい。例えば、本方法は、サーバ104又はクライアント102上で実行するソフトウェア・モジュールによって実行されてもよく、サーバ104又はクライアント102に接続されたハードウェア・モジュールによって実行されてもよく、或いは、これらの組み合わせでもよい。以下に説明する実施形態では、本方法はサーバ104によって実行される。図15に示す方法は、本発明を組み込んだ一実施形態の単なる例示であり、請求項記載の本発明の範囲を制限するものではない。当業者には、他の変形例、修正例、及び代替例が明らかであろう。
便宜上、テキスト情報を表示するサムネール312−1は図14に示したフローチャートに従って既に表示されているものとする。図15に示すように、サーバ104は、マルチメディア情報に含まれるビデオ情報からキーフレーム群を抽出する(ステップ1502)。これらビデオ・キーフレームは、特定のサンプリング・レートでビデオ情報をサンプリングすることによって、ビデオ情報から抽出することができる。本発明の一実施形態によれば、キーフレームは、毎秒1フレームのサンプリング・レートで、ビデオ情報から抽出される。したがって、マルチメディア情報の持続時間が1時間(3,600秒)の場合、ステップ1502において、ビデオ情報から3,600のビデオ・キーフレームが抽出される。ステップ1502で抽出された各キーフレームには、マルチメディア情報においてそのキーフレームが登場する時刻を示すタイムスタンプが関連付けられる。
ステップ1502で抽出されたビデオ・キーフレーム及びそれらに関連付けられたタイムスタンプ情報は、サーバ104がアクセス可能なデータ構造(又は、メモリ構造)に格納される(ステップ1504)。このデータ構造に格納された情報は、次いで、サムネール312−2を生成するのに用いられる。
次いで、ステップ1504で抽出されたビデオ・キーフレームは、グループ分けされる(ステップ1506)。キーフレームをグループ分けするのにはユーザが設定可能な時間期間(「groupTime」)が用いられる。本発明の一実施形態によれば、groupTimeは8秒にセットされる。この実施形態において、各グループは、8秒間の時間期間窓内で抽出されたビデオ・キーフレームを有する。例えば、マルチメディア情報の持続時間が1時間(3,600秒)であり、毎秒1フレームのサンプリング・レートを用いてビデオ情報から3,600のビデオ・キーフレームが抽出される場合、groupTimeが8秒にセットされていれば、3,600のキーフレームが450グループに分割され、各グループが8つのビデオ・キーフレームを有することになる。
各フレーム・グループについて、開始時刻及び終了時刻が計算される(ステップ1508)。ある特定のフレーム・グループについて、その特定のグループの開始時刻はそのグループの最初のビデオ・キーフレーム(すなわち、そのグループの中で最も古いタイムスタンプを持つキーフレーム)に関連付けられたタイムスタンプであり、その特定のグループの終了時刻はそのグループの最後のビデオ・キーフレーム(すなわち、そのグループの中で最も新しいタイムスタンプを持つキーフレーム)に関連付けられたタイムスタンプである。
キーフレーム・グループの各々について、サーバ104は、そのキーフレーム・グループのうちの1以上のキーフレームを描画するキーフレーム・キャンバス上のピクセル・セグメントを決定する(ステップ1510)。テキスト・キャンバスと同様に、キーフレーム・キャンバスは、ビデオ情報から抽出されたキーフレームが描画されるパネルである。キーフレーム・キャンバスの高さ(「keyframeCanvasHeight」)は、上述のテキスト・キャンバスの高さ(「textCanvasHeight」)と同じである(すなわち、keyframeCanvasHeight=textCanvasHeight)。結果として、(上述の)乗数pix_m及びsec_mを用いて、時間値をキーフレーム・キャンバスにおけるピクセル位置に変換し、キーフレーム・キャンバスにおける特定のピクセル位置を時間値に変換することができる。
キーフレーム・キャンバス上においてある特定のグループからのキーフレームを描画するピクセル・セグメントは、その特定のグループに関連付けられた開始時刻及び終了時刻に基づいて計算される。キーフレーム・キャンバスにおけるある特定のキーフレーム・グループ用のピクセル・セグメントの開始垂直(Y)ピクセル座標(「segmentStart」)及び終了垂直(Y)座標(「segmentEnd」)は、以下のように計算される。
segmentStart=(グループの開始時刻)*pix_m
segmentEnd=(グループの終了時刻)*pix_m
したがって、テキスト・キャンバスの各セグメントのピクセル単位での高さ(「segmentHeight」)は、
segmentHeight=segmentEnd−segmentStart
となる。
次いで、テキスト・キャンバス上の各ピクセル・セグメントに描画される各フレーム・グループからのキーフレーム数が決定される(ステップ1512)。ある特定のグループについてキーフレーム・キャンバス上に描画されるキーフレーム数は、その特定のグループに対応するセグメントの高さ(「segmentHeight」)に依存する。segmentHeightの値が小さい場合、GUIに表示されたときに描画されたキーフレームがユーザにとって理解しやすいように、少数のキーフレームのみをそのセグメントに描画してもよい。segmentHeightの値は、ppsの値に依存する。ppsが小さい場合、segmentHeightも小さくなる。したがって、セグメントあたりに描画されるキーフレームが多くなるほど、大きなppsの値が選択される。
本発明の一実施形態によれば、segmentHeightが40ピクセルに等しく、各キーフレーム・グループが8つのキーフレームを含む場合、それら8つのキーフレームのうちの6つがテキスト・キャンバス上の各セグメントに描画される。一セグメントに描画されるキーフレーム数は、一般的に、すべてのキーフレーム・グループについて同じである。例えば、図3に示す実施形態では、テキスト・キャンバス上の各セグメントに6つのキーフレームが描画される。
テキスト・キャンバスの各セグメントに描画されるキーフレーム数が決定されると、各キーフレーム・グループについて、サーバ104は、キーフレーム・グループのキーフレームからキーフレーム・キャンバス上に描画される1以上のキーフレームを特定する(ステップ1514)。ある特定のフレーム・グループについて一セグメントに表示されるビデオ・キーフレームを選択するのには様々な異なる手法を用いることができる。一手法によれば、各ビデオ・キーフレーム・グループが8つのキーフレームを有し、キーフレーム・キャンバス上の各セグメントに6つのビデオ・キーフレームが表示される場合、サーバ104は、各ビデオ・キーフレーム・グループから最初の2つのビデオ・キーフレーム、真ん中の2つのビデオ・キーフレーム、及び、最後の2つのビデオ・キーフレームをキーフレーム・キャンバス上に描画されるものとして選択する。上述のように、キーフレーム・グループから表示される1以上のキーフレームを選択するのに様々な他の手法も用いることができる。例えば、キーフレームは、キーフレーム・グループにおけるキーフレームのシーケンシャル位置に基づいて選択されてもよく、キーフレームに関連付けられた時間値に基づいて選択されてもよく、或いは、他の基準に基づいて選択されてもよい。
別の手法によれば、サーバ104は、特殊な画像処理技術を用いて、各キーフレーム・グループにおけるキーフレーム間の類似性又は非類似性を判断してもよい。各グループから6つのビデオ・キーフレームが表示される場合、サーバ104は、画像処理技術の結果に基づいて、各キーフレーム・グループから6つのキーフレームを選択する。本発明の一実施形態によれば、各グループの最も類似していない6つのキーフレームがキーフレーム・キャンバス上に描画されるものとして選択される。ビデオ・キーフレームの選択を実行するのには当業者には既知の様々な他の手法も用いることができることは明らかである。
ステップ1514においてキーフレーム・グループから特定されたキーフレームは、キーフレーム・キャンバス上でそれらの対応するセグメントに描画される(ステップ1516)。ある特定のセグメントに選択されたキーフレームを描画するのに様々な異なる形式を用いることができる。例えば、図3に示すように、各セグメントについて、選択されたキーフレームは、3フレームを一行として、左から右、上から下へ、並べられる。キーフレーム・キャンバス上にキーフレームを描画する当業者には既知の様々な他の手法も用いることができる。キーフレーム・キャンバス上に描画される各個々のキーフレームのサイズは、そのキーフレームが描画されるセグメントの高さ(segmentHeight)及びそのセグメントに描画されるキーフレーム数に依存する。既述のように、一セグメントの高さは、ppsの値に依存する。したがって、キーフレーム・キャンバス上に描画される各個々のキーフレームのサイズもppsの値に依存する。
サーバ104は、次いで、GUI300にビデオ・キーフレームを表示するサムネール312−2の高さ(又は長さ)を決定する(ステップ1518)。本発明の教えるところによれば、サムネール312−2の高さは、テキスト情報を表示するサムネール312−1の高さと同じにセットされる(すなわち、サムネール312−2の高さは、ThumbnailHeightにセットされる)。
次いで、サムネール312−2の高さがThumbnailHeightに等しくなり、サムネール312−2が第二の表示エリア304のサイズ制約内に完全にフィットするように、キーフレーム・キャンバスを縮小することによって、サムネール312−2が生成される(ステップ1520)。キーフレーム・キャンバスの縮小版を表すサムネール312−2は、次いで、GUI300の第二の表示エリア304に表示される(ステップ1522)。サムネール312−2は、GUI300において、サムネール画像312−1の隣りに表示され、時系列に並べられるか、又は、(図3に示すように)サムネール312−1と同期される。したがって、サムネール312−2の上端は、サムネール312−1の上端と揃えられる。
サムネール312−2におけるピクセル位置を秒に変換し、秒をサムネール312−2におけるピクセル位置に変換するサムネール312−2用の乗数が計算される(ステップ1524)。サムネール312−2は、サムネール312−1と同じ長さであり、サムネール312−1と揃えられているため、サムネール312−1について計算された乗数「tpix_m」及び「tsec_m」は、サムネール312−2にも用いることができる。すると、これら乗数を用いて、ピクセルを秒に、秒をサムネール312−2におけるピクセルに、変換することができる。
図15に表示された方法によれば、サムネール312−2に表示される各個々のビデオ・キーフレームのサイズは、他の基準に加えて、サムネール312−2の長さ及びビデオ情報の長さにも依存する。サムネール312−2の長さが固定されているものとすると、サムネール312−2に表示される各個々のビデオ・キーフレームの高さは、ビデオ情報の長さに逆比例する。したがって、ビデオ情報の長さを増えるほど、サムネール312−2に表示される各キーフレームのサイズは減少する。結果として、マルチメディア文書が長くなるほど、各キーフレームのサイズは、サムネール312−2に表示されるビデオ・キーフレームがもはやユーザにとって認識できないほど小さいなり得る。これを回避するために、サムネール312−2をユーザにとってより読み易く、認識できるように、サムネール312−2にビデオ・キーフレームを表示する様々な手法を用いることができる。
図16は、本発明の一実施形態に係り、サムネール312−2を表示する別の方法を示す簡略化された高レベル・フローチャート1600である。図16に示す方法は、キーフレーム・キャンバスに描画され、サムネール312−2に表示されるビデオ・キーフレームの数を減らすことによって、サムネール312−2に表示される情報の理解しやすさ及び使いやすさを維持する。図16に示す方法は、サーバ104によって実行されてもよく、クライアント102によって実行されてもよく、或いは、サーバ104及びクライアント102によって共同して実行されてもよい。例えば、本方法は、サーバ104又はクライアント102上で実行するソフトウェア・モジュールによって実行されてもよく、サーバ104又はクライアント102に接続されたハードウェア・モジュールによって実行されてもよく、或いは、これらの組み合わせでもよい。以下に説明する実施形態では、本方法はサーバ104によって実行される。図16に示す方法は、本発明を組み込んだ一実施形態の単なる例示であり、請求項記載の本発明の範囲を制限するものではない。当業者には、他の変形例、修正例、及び代替例が明らかであろう。
図16に示すように、ステップ1602、1604、1606、及び1608は、図15に示した上述のステップ1502、1504、1506、及び1508と同じである。ステップ1608の後、キーフレーム・キャンバスにそのビデオ・キーフレームが描画される1以上のグループがステップ1606で決定されたグループから選択される(ステップ1609)。ステップ1609においてグループを選択するのには様々な異なる手法を用いることができる。一手法によれば、ステップ1606で決定されたグループは、ユーザが設定可能な「SkipCount」値に基づいて、選択される。例えば、SkipCountが4にセットされた場合、ステップ1609において4グループおきに選択される(すなわち、4グループがスキップされる)。SkipCountの値は、マルチメディア情報の長さに基づいて調節可能である。本発明の一実施形態によれば、SkipCountの値はマルチメディア情報の長さに直接比例する。すなわち、SkipCountはマルチメディア文書が長いほど高い値にセットされる。
ステップ1609において選択された各グループについて、サーバ104は、そのグループからキーフレーム・キャンバス上に描画される1以上のキーフレームを特定する(ステップ1610)。上述のように、キーフレーム・キャンバス上に描画されるキーフレームを選択するのには様々な手法を用いることができる。
次いで、キーフレーム・キャンバスは、複数の等しいサイズの行部分に分割される。行部分の数は、ステップ1609で選択されたグループ数に等しい(ステップ1612)。本発明の一実施形態によれば、各行部分の高さは、ステップ1609で選択されたグループ数で除算されたキーフレーム・キャンバスの高さ(「keyframeCanvasHeight」)に略等しい。
次いで、ステップ1609で選択された各グループについて、そのグループからの1以上のビデオ・キーフレームを描画するキーフレーム・キャンバスの行部分が特定される(ステップ1614)。本発明の一実施形態によれば、行部分は、年代順に、グループに関連付けられる。例えば、最初の行は、最も古い開始時刻を持つグループに関連付けられ、2番目の行は、2番目に古い開始時刻を持つグループに関連付けられる、等々。
次いで、ステップ1609で選択された各グループについて、そのグループからの1以上のキーフレーム(ステップ1610で特定された)が、ステップ1614でそのグループ用の決定されたキーフレーム・キャンバス上の行部分に描画される(ステップ1616)。各グループについて選択されたキーフレームのサイズは、キーフレーム・キャンバスの行部分にフィットするように縮小される。本発明の一実施形態によれば、各行部分の高さは選択されたキーフレームの高さより大きく、選択されたキーフレームの高さは行部分にフィットするように増加される。これにより、選択されたキーフレームのサイズが増加し、それらはキーフレーム・キャンバス上に描画されたときにより見易くなる。このように、ステップ1609で選択されたグループからのキーフレームはキーフレーム・キャンバス上に描画される。
次いで、キーフレーム・キャンバスは、ステップ1618、1620、及び1622に従って縮小され、第二の表示エリア304に表示されるサムネール312−2を形成する。キーフレーム・キャンバス上に描画されるキーフレームの高さは本発明の一実施形態によれば増加されるため、上述のように、キーフレームもサムネール312−2に表示されたときにより認識しやすくなる。次いで、ステップ1624に従って、乗数が計算される。ステップ1618、1620、1622、及び1624は、図15に示した上述のステップ1518、1520、1522、及び1524に類似している。上述のように、グループの一部を選択することによって、キーフレーム・キャンバス上に描画され、サムネール312−2に表示されるキーフレームの数が減らされる。これにより、サムネール312−2に表示される各個々のビデオ・キーフレームの高さが増加するため、それらが表示されたときにより認識しやすくなる。
図17は、本発明の一実施形態に従って、サムネール表示エリア・レンズ314を表示し、サムネール表示エリア・レンズ314によって強調された情報を第三の表示エリア306に表示し、パネル表示エリア・レンズ322を表示し、パネル表示エリア・レンズ322によって強調された情報を第四の表示エリア308に表示し、情報を第五の表示エリア310に表示する方法を示す簡略化された高レベル・フローチャート1700である。図17に示す方法は、サーバ104によって実行されてもよく、クライアント102によって実行されてもよく、或いは、サーバ104及びクライアント102によって共同して実行されてもよい。例えば、本方法は、サーバ104又はクライアント102上で実行するソフトウェア・モジュールによって実行されてもよく、サーバ104又はクライアント102に接続されたハードウェア・モジュールによって実行されてもよく、或いは、これらの組み合わせでもよい。以下に説明する実施形態では、本方法はサーバ104によって実行される。図17に示す方法は、本発明を組み込んだ一実施形態の単なる例示であり、請求項記載の本発明の範囲を制限するものではない。当業者には、他の変形例、修正例、及び代替例が明らかであろう。
図17に示すように、サーバ104は、まず、GUI300の第三の表示エリア306に表示される各パネルのピクセル単位での高さ(「PanelHeight」)を決定する(ステップ1702)。PanelHeightの値は、第三の表示エリア306の高さ(又は長さ)に依存する。パネルは互いに揃えられるため、各パネルの高さはPanelHeightにセットされる。本発明の一実施形態によれば、PanelHeightはThumbnailHeightと同じ値にセットされる。しかし、本発明の代替的実施形態として、PanelHeightの値はThumbnailHeightの値と異なってもよい。
次いで、(図14に示すフローチャートで生成された)テキスト・キャンバスのうちPanelHeightと等しい一セクションが特定される(ステップ1704)。このステップ1704で特定されたテキスト・キャンバスのセクションは、そのセクションの開始ピクセル位置をマーキングする垂直ピクセル座標(Pstart)と、そのセクションの終了ピクセル位置をマーキングする垂直ピクセル座標(Pend)とによって特徴付けられる。
次いで、ステップ1704で特定されたテキスト・キャンバスのセクションの(ピクセル位置Pstart及びPendによってマーキングされた)境界線に対応する時間値が決定される(ステップ1706)。この対応する時間値を計算するのに乗数sec_mが用いられる。ピクセル位置Pstartに対応する時刻t1(秒)は以下のように計算される。
t1=Pstart*sec_m
ピクセル位置Pendに対応する時刻t2(秒)は以下のように計算される。
t2=Pend*sec_m
次いで、キーフレーム・キャンバスのうち、テキスト・キャンバスのうち上記選択されたセクションに対応する一セクションが特定される(ステップ1708)。キーフレーム・キャンバスの高さはキーフレーム・キャンバスの高さと同じであるため、キーフレーム・キャンバスの選択されたセクションも、時刻t1及び時刻t2に対応するキーフレーム・キャンバスにおけるピクセル位置PstartとPendの間に位置する。
テキスト・キャンバスのうちステップ1704で特定された部分が、第三の表示エリア306のパネル324−1に表示される(ステップ1710)。キーフレーム・キャンバスのうちステップ1708で特定された部分は、第三の表示エリア306のパネル324−2に表示される(ステップ1712)。
第三の表示エリア306の一部を覆うパネル表示エリア・レンズ322が表示される(ステップ1714)。パネル表示エリア・レンズ322は、時刻t3とt4(t1≦t3<t4≦t2)の間に第三の表示エリア306に表示されたパネル324−1及び324−2の一部を強調するように又は覆うように、表示される。パネル表示エリア・レンズ322の上端は時刻t3に対応し、パネル表示エリア・レンズ322の下端は時刻t4に対応する。パネル表示エリア・レンズ322の(ピクセルで表された)高さは、(テキスト・キャンバスにおいてt4に対応する垂直ピクセル位置)−(テキスト・キャンバスにおいてt3に対応する垂直ピクセル位置)、に等しい。パネル表示エリア・レンズ322の幅は、(図3に示すように)第三の表示エリア306の幅に略等しい。
次いで、サムネール312−1のうちパネル324−1に表示されたテキスト・キャンバスの一部に対応する部分と、サムネール312−2のうちパネル324−2に表示されたキーフレーム・キャンバスの一部に対応する部分とが決定される(ステップ1716)。サムネール312−1のうちパネル324−1に表示されたテキスト・キャンバスの一部に対応する部分は、そのサムネールの一部の開始ピクセル位置をマーキングする垂直ピクセル座標(TNstart)と、そのサムネールの一部の終了ピクセル位置をマーキングする垂直ピクセル位置(TNend)とによって特徴付けられる。ピクセル位置TNstart及びTNendを決定するのには乗数tpix_mが用いられる。
TNstart=t1*tpix_m
TNend=t2*tpix_m
サムネール312−1及び312−2は、同じ長さで、互いに時系列に並べられているため、サムネール312−2のうちパネル324−2に表示されるキーフレーム・キャンバスの一部に対応する部分もサムネール312−2上のピクセル位置TNstartとTNendの間に位置する。
次いで、サムネール312−1及び312−2のうち、パネル324−1に表示されるテキスト・キャンバスの一部に対応する部分、及び、パネル324−2に表示されるキーフレーム・キャンバスの一部に対応する部分、を覆うサムネール表示エリア・レンズ314が表示される(ステップ1718)。サムネール312−1及び312−2のうちこれらサムネールのピクセル位置TNstartとTNendの間の部分を覆うサムネール表示エリア・レンズ314が表示される。サムネール表示エリア・レンズ314のピクセル単位での高さは、(TNend−TNstart)に等しい。サムネール表示エリア・レンズ314の幅は、(図3に示すように)第二の表示エリア306の幅に略等しい。
次いで、第二の表示エリア304のうちパネル表示エリア・レンズ322によって強調された第三の表示エリア306の一部に対応する部分が決定される(ステップ1720)。ステップ1720において、サーバ104は、t3とt4の間の時間期間に対応するサムネール31201の一部及びサムネール312−2の一部を決定する。サムネール312−1のうちt3とt4の間の時間窓に対応する部分は、時刻t3に対応し、そのサムネールの一部の開始垂直ピクセル位置をマーキングする垂直ピクセル座標(TNSubstart)と、時刻t4に対応し、そのサムネールの一部の終了ピクセル位置をマーキングする垂直ピクセル位置(TNSubend)とによって特徴付けられる。ピクセル位置TNSubstart及びTNSubendを決定するのには乗数tpix_mが用いられる。
TNSubstart=t3*tpix_m
TNSubend=t4*tpix_m
サムネール312−1及び312−2は、同じ長さで、互いに時系列に並べられているため、サムネール312−2のうちt3とt4の間の時間期間に対応する部分もサムネール312−2上のピクセル位置TNSubstartとTNSubendの間に位置する。
次いで、サムネール312−1及び312−2のうちt3とt4の間の時間窓に対応する(すなわち、第三の表示エリア306のうちパネル表示エリア・レンズ322によって強調された部分に対応する)部分を覆うサブレンズ316が表示される(ステップ1722)。サブレンズ316は、サムネール312−1及び312−2のうちピクセル位置TNSubstartとTNSubendの間の部分を覆うように表示される。サブレンズ316のピクセル単位での高さは、(TNSubend−TNSubstart)に等しい。サブレンズ316の幅は、(図3に示すように)第二の表示エリア304の幅と略等しい。
第三の表示エリア306のうちパネル表示エリア・レンズ322によって強調された部分に対応するマルチメディア情報が、第四の表示エリア308に表示される(ステップ1724)。例えば、時刻t3に始まるビデオ情報がGUI300の第四の表示エリア308のエリア340−1において再生される。代替的実施形態として、このビデオ再生の開始時刻は、t3とt4を含むt3とt4の間の任意の時刻にセットされてもよい。t3とt4の間の時間窓に対応するテキスト銃砲が第四の表示エリア308のエリア340−2に表示される。
次いで、このマルチメディア情報が分析され、この分析の結果が第五の表示エリア310に表示される(ステップ1726)。例えば、マルチメディア情報から抽出されたテキスト情報が分析され、そのテキスト情報に往生する単語と個々の単語の頻度を識別する。これら単語及びそれらの頻度は、第五の表示エリア310にプリントされてもよい(例えば、図3に示すように、第五の表示エリア310のエリア352にプリントされた情報)。上述のように、マルチメディア情報から抽出された情報は、サーバ104がアクセス可能なデータ構造に格納することができる。例えば、マルチメディア情報から抽出されたテキスト情報及びビデオ・キーフレーム情報がサーバ104がアクセス可能なデータ構造に1以上のデータ構造に格納されてもよい。サーバ104はこれらデータ構造に格納された情報を用いて、マルチメディア情報を分析することができる。
(マルチメディア情報ナビゲーション)
上述のように、本発明のユーザは、マルチメディア文書によって格納され、サムネール表示エリア・レンズ314及びパネル表示エリア・レンズ322を用いてGUI300に表示されたマルチメディア情報をナビゲート及びスクロールすることができる。例えば、ユーザは、サムネール表示エリア・レンズ314を第二の表示エリア304の長さに沿って動かすことによって、サムネール表示エリア・レンズ314の位置を変えることができる。サムネール表示エリア・レンズ314の位置を第二の表示エリア304に沿って第二の表示エリア304の第一の位置から第二の位置へ変更すると、第三の表示エリア306に表示されたマルチメディア情報は、第三の表示エリア306に表示されたマルチメディア情報が第二の表示エリア304のうちの第二の位置におけるサムネール表示エリア・レンズ314によって強調されているエリアと対応し続けるように、自動的に更新される。同様に、ユーザは、パネル表示エリア・レンズ322を第三の表示エリア306の長さに沿って動かすことによって、パネル表示エリア・レンズ322の位置を変えることができる。パネル表示エリア・レンズ322の位置を変更すると、サブレンズ316の位置とおそらくはサムネール表示エリア・レンズ314の位置も、パネル表示エリア・レンズ322の新しい位置に対応し続けるように、更新される。第四の表示エリア308に表示される情報も、パネル表示エリア・レンズ322の新しい位置に対応するように、更新される。
図18は、本発明の一実施形態に従って、サムネール表示エリア・レンズ314の位置の変更に応じて、第三の表示エリア306に表示される情報を自動的に更新する方法を示す簡略化された高レベル・フローチャート1800である。図18に示す方法は、サーバ104によって実行されてもよく、クライアント102によって実行されてもよく、或いは、サーバ104及びクライアント102によって共同して実行されてもよい。例えば、本方法は、サーバ104又はクライアント102上で実行するソフトウェア・モジュールによって実行されてもよく、サーバ104又はクライアント102に接続されたハードウェア・モジュールによって実行されてもよく、或いは、これらの組み合わせでもよい。以下に説明する実施形態では、本方法はサーバ104によって実行される。図18に示す方法は、本発明を組み込んだ一実施形態の単なる例示であり、請求項記載の本発明の範囲を制限するものではない。当業者には、他の変形例、修正例、及び代替例が明らかであろう。
図18に示すように、本方法は、サーバ104が、サムネール表示エリア・レンズ314の第二の表示エリア304上での第一の位置から第二の位置への位置の変更を検知したとき、開始される(ステップ1802)。次いで、サーバ104は、第二の表示エリア304のうち第二の位置におけるサムネール表示エリア・レンズ314によって強調された部分を決定する(ステップ1804)。ステップ1804の一部として、サーバ104は、サムネール312−1において、第二の位置におけるサムネール表示エリア・レンズ314の端に対応するピクセル位置(TNstart及びTNend)を決定する。TNstartは、サムネール312−1における開始垂直ピクセル位置をマーキングし、TNendは、サムネール312−1における終了垂直ピクセル位置をマーキングする。サムネール312−1及び312−2は、同じ長さで、互いに時系列に並べられているため、サムネール312−2のうちサムネール表示エリア・レンズ314の第二の位置に対応する部分もピクセル位置TNstartとTNendの間に位置する。
次いで、サーバ104は、サムネール表示エリア・レンズ314の第二の位置に対応する時間値を決定する(ステップ1806)。ピクセル位置TNstartに対応する時間値t1が決定され、ピクセル位置TNendに対応する時間値t2が決定される。これら時間値を決定するのには乗数tsec_mが用いられる。
t1=TNstart*tsec_m
t2=TNend*tsec_m
次いで、サーバ104は、テキスト・キャンバス及びキーフレーム・キャンバスにおけるステップ1806で決定された時間値に対応するピクセル位置を決定する(ステップ1808)。テキスト・キャンバスにおけるピクセル位置Pstartは時刻t1に基づいて決定され、キーフレーム・キャンバスにおけるピクセル位置TNendは時刻t2に基づいて決定される。これらピクセル位置を決定するのには乗数pix_mが用いられる。
Pstart=t1*tpix_m
Pend=t2*tpix_m
テキスト・キャンバス及びキーフレーム・キャンバスは同じ長さであるため、時刻値t1及びt2はキーフレームにおけるピクセル位置Pstart及びPendに対応する。
テキスト・キャンバスのうちピクセル位置PstartとPendの間のセクションがパネル324−1に表示される(ステップ1810)。このテキスト・キャンバスのうちパネル324−1に表示されたセクションは、サムネール312−1のうち第二の位置におけるサムネール表示エリア・レンズ314によって強調された部分に対応する。
キーフレーム・キャンバスのうちピクセル位置PstartとPendの間のセクションがパネル324−2に表示される(ステップ1812)。このキーフレーム・キャンバスのうちパネル324−2に表示されたセクションは、サムネール312−2のうち第二の位置におけるサムネール表示エリア・レンズ314によって強調された部分に対応する。
サムネール表示エリア・レンズ314が第一の位置から第二の位置へ動かされると、サブレンズ316もサムネール表示エリア・レンズ314に沿って動く。その際、サーバ104は、第二の表示エリア304のうち第二の位置におけるサブレンズ316によって強調された部分を決定する(ステップ1814)。ステップ1814の一部として、サーバ104は、サムネール312−1のうち、第二の位置におけるサブレンズ316の端に対応するピクセル位置(TNSubstart及びTNSubend)を決定する。TNSubstartはサムネール312−1における開始垂直ピクセル位置をマーキングし、TNSubendはサムネール312−1における終了垂直ピクセル位置をマーキングする。サムネール312−1及び312−2は、同じ長さであり、互いに時系列に並べられるため、サムネール312−1のうちサブレンズ316の第二の位置に対応する部分もピクセル位置TNSubstartとTNSubendの間に位置する。
次いで、サーバ104は、サブレンズ316の第二の位置に対応する時間値を決定する(ステップ1816)。ピクセル位置TNSubstartに対応する時間値t3が決定され、ピクセル位置TNSubendに対応する時間値t4が決定される。これら時間値を決定するのには乗数tsec_mが用いられる。
t3=TNSubstart*tsec_m
t4=TNSubend*tsec_m
次いで、サーバ104は、テキスト・キャンバス及びキーフレーム・キャンバスにおいてステップ1816で決定された時間値にそれぞれ対応するピクセル位置を決定する(ステップ1818)。テキスト・キャンバスにおけるピクセル位置PSubstartは、時刻t3に基づいて計算され、キーフレーム・キャンバスにおけるピクセル位置PSubendは、時刻t4に基づいて計算される。これらの位置を決定するのには乗数pix_mが以下のように用いられる。
PSubstart=t3*tpix_m
PSubend=t4*tpix_m
テキスト・キャンバス及びキーフレーム・キャンバスは同じ長さであるため、時刻値t1及びt2はキーフレーム・キャンバスにおけるピクセル位置PSubstart及びPSubendに対応する。
第三の表示エリア306のうちピクセル位置PSubstartとPSubendの間の部分を覆うパネル表示エリア・レンズ322が第三の表示エリア306上に描画される(ステップ1820)。次いで、第四の表示エリア308に表示されたマルチメディア情報は、パネル表示エリア・レンズ322の新しい位置に対応するように、更新される(ステップ1822)。
図19は、本発明の一実施形態に従って、パネル表示エリア・レンズ322の位置の変更に応じて、第四の表示エリア308に表示される情報及びサムネール表示エリア・レンズ314及びサブレンズ316の位置を自動的に更新する方法を示す簡略化された高レベル・フローチャート1900である。図19に示す方法は、サーバ104によって実行されてもよく、クライアント102によって実行されてもよく、或いは、サーバ104及びクライアント102によって共同して実行されてもよい。例えば、本方法は、サーバ104又はクライアント102上で実行するソフトウェア・モジュールによって実行されてもよく、サーバ104又はクライアント102に接続されたハードウェア・モジュールによって実行されてもよく、或いは、これらの組み合わせでもよい。以下に説明する実施形態では、本方法はサーバ104によって実行される。図19に示す方法は、本発明を組み込んだ一実施形態の単なる例示であり、請求項記載の本発明の範囲を制限するものではない。当業者には、他の変形例、修正例、及び代替例が明らかであろう。
図19に示すように、本方法は、サーバ104が、パネル表示エリア・レンズ322の第三の表示エリア306上での第一の位置から第二の位置への位置の変更を検知したとき、開始される(ステップ1902)。次いで、サーバ104は、第二の位置におけるパネル表示エリア・レンズ322に対応する時間値を決定する(ステップ1904)。ステップ1904において、サーバ104は、第二の位置におけるパネル表示エリア・レンズ322の上端及び下端のピクセル位置を決定する。次いで、乗数sec_mを用いて、これらピクセル位置を時間値に変換する。第二の位置におけるパネル表示エリア・レンズ322の上端に対応する時間値t3が決定され、パネル表示エリア・レンズ322の下端に対応する時間値t4が決定される。
t3=(パネル表示エリア・レンズ322の上端のピクセル位置)*sec_m
t4=(パネル表示エリア・レンズ322の下端のピクセル位置)*sec_m
次いで、サーバ104は、第二の表示エリア304において、ステップ1904で決定された時間値に対応するピクセル位置を決定する(ステップ1906)。第二の表示エリア304のサムネール(312−1又は312−2のいずれか;なぜならそれらは同じ長さで揃えられているため)のピクセル位置TNSubstartは時刻t3に基づいて決定され、サムネールのピクセル位置TNSubendは時刻t4に基づいて決定される。乗数tpix_mを用いて、これらピクセル位置は以下のように決定される。
TNSubstart=t3*tpix_m
TNSubend=t4*tpix_m
次いで、サブレンズ316が、第二の表示エリア304のサムネール312のうちステップ1906で決定されたピクセル位置の間の部分を強調するように、更新される(ステップ1908)。ステップ1908の一部として、ピクセル位置TNSubstart及びTNSubendがパネル表示エリア・レンズ322が第一の位置にあったときのサムネール表示エリア・レンズ314の境界の外に位置する場合、サムネール表示エリア・レンズ314の位置も更新されてもよい。例えば、ユーザがパネル表示エリア・レンズ322を用いて第三の表示エリア306をPanelHeightを越えてスクロールした場合、それに応じてサムネール表示エリア・レンズ314の位置が更新される。パネル表示エリア・レンズ322の第二の位置がPanelHeight内に位置する場合、サブレンズ316のみがパネル表示エリア・レンズ322の第二の位置に対応するように動かされ、サムネール表示エリア・レンズ314は動かされない。
上述のように、パネル表示エリア・レンズ322を用いて、第三の表示エリア306に表示された情報をスクロールすることができる。例えば、ユーザは、パネル表示エリア・レンズ322を第三の表示エリア306の下端まで動かし、第三の表示エリア306のコンテンツが自動的に上方にスクロールされるようにすることができる。同様に、ユーザは、パネル表示エリア・レンズ322を第三の表示エリア306の上端まで動かし、第三の表示エリア306のコンテンツが自動的に下方にスクロールされるようにすることができる。サムネール表示エリア・レンズ314及びサブレンズ316の位置は、スクロールの発生に応じて、更新される。
次いで、パネル表示エリア・レンズ322の第二の位置に対応するマルチメディア情報が第四の表示エリア308に表示される(ステップ1910)。例えば、パネル表示エリア・レンズ322の第二の位置に対応するビデオ情報が第四の表示エリア308のエリア340−1に表示され、パネル表示エリア・レンズ322の第二の位置に対応するテキスト情報が第三の表示エリア306のエリア340−2に表示される。
本発明の一実施形態によれば、ステップ1910において、サーバ104は、t3又はt4と等しい値或いはt3とt4の間の値を持つ時刻「t」を選択する。時刻「t」は、「ロケーション・タイム」と呼ぶことができる。このロケーション・タイムは、ユーザが設定可能としてもよい。本発明の一実施形態によれば、ロケーション・タイムはt4にセットされる。次いで、このロケーション・タイムは、第四の表示エリア308のエリア340−1におけるビデオ情報再生の開始時刻として用いられる。
本発明の一実施形態によれば、GUI300は、2つのモード:「完全更新」モード及び「部分更新」モードで作動できる。GUIのユーザは、GUIの作動モードを選択することができる。
GUI300が「完全更新」モードで作動しているとき、サムネール表示エリア・レンズ314及びパネル表示エリア・レンズ322の位置は、第四の表示エリア308のエリア340−1におけるビデオ再生の位置を反映するように、自動的に更新される。したがって、「完全更新」モードにおいて、サムネール表示エリア・レンズ314及びパネル表示エリア・レンズ322は、第四の表示エリア308で再生されたビデオの位置を保持又は反映する。このビデオは、第四の表示エリア308のエリア342に示されたコントロールを用いて、再生又は逆再生することができ、サムネール表示エリア・レンズ314及びパネル表示エリア・レンズ322の位置もそれに応じて変化する。また、第三の表示エリア306のパネル324に表示されたマルチメディア情報も、サムネール表示エリア・レンズ314の位置に対応し、ビデオの現在位置を反映するように、自動的に更新される(上方へシフトされる)。
GUI300が「部分更新」モードで作動しているとき、サムネール表示エリア・レンズ314及びパネル表示エリア・レンズ322の位置は、第四の表示エリア308のエリア340−1におけるビデオ再生の位置を反映するように更新されない。このモードでは、サムネール表示エリア・レンズ314及びパネル表示エリア・レンズ322の位置は、第四の表示エリア308のエリア340−1でビデオが再生されているとき、静止したままである。サムネール表示エリア・レンズ314の位置が変化しないため、第三の表示エリア306に表示されたマルチメディア情報も更新されない。このモードでは、第四の表示エリア308のエリア340−1でのビデオ再生の現在位置を反映するための「ロケーション・ポインタ」が第二の表示エリア304及び第三の表示エリア306に表示されてもよい。ロケーション・ポインタの位置は、ビデオの位置を反映するように、継続的に更新される。
(レンジ)
本発明の一実施形態によれば、本発明は、マルチメディア情報のうちGUIに表示される部分を選択又は指定する手法を提供する。各部分を「レンジ(range)」と呼ぶ。レンジは、本発明のユーザによって手動で指定されてもよく、或いは、代替的に、本発明のユーザによって提供されたレンジ基準に基づいて本発明によって自動的に選択されてもよい。
レンジは、マルチメディア情報のうち開始時刻(RS)と終了時刻(RE)の間の部分を指す。したがって、各レンジは、そのレンジの時間的境界を定義するRS及びREによって特徴付けられる。レンジは、マルチメディア情報のうち、そのレンジに関連付けられた時刻RS及びREの間に発生した部分を含む又は識別する。
図20Aは、本発明の一実施形態に係るレンジを表示する簡略化されたユーザ・インターフェース2000を示す。図20Aに示すGUI2000は、本発明を組み込んだ一実施形態の単なる例示であり、請求項記載の本発明の範囲を制限するものではない、ことは明らかである。当業者には、他の変形例、修正例、及び代替例が明らかであろう。
図20Aに示すように、GUI2000は、ユーザが1以上のレンジを手動で指定するか又はGUI2000が自動的にレンジを生成するように設定するかを可能にする様々な機能(ボタン、タブ、など)を提供する。図20Aに示す実施形態において、ユーザは、「New」ボタン2002を選択することによって、レンジを手動で指定することができる。ボタン2002を選択した後、ユーザは、サムネールのうち第二の表示エリア2004に表示された部分を選択することによって、レンジを指定することができる。サムネールの様々な部分を選択することによって、1以上のレンジを指定することができる。例えば、図20Aには、6つのレンジ2006−1、2006−2、2006−3、2006−4、2006−5、及び、2006−6が表示されている。ユーザは、サムネール2008−2の一部分を選択又はマーキングすることによって、これらレンジの1以上を手動で指定することができる。
代替的実施形態として、サムネールの一部分を選択する代わりに、ユーザは、サムネール内のある位置をクリックすることによって、レンジを指定することもできる。次いで、現在クリックされた位置の前後に所定のバッファ時間を加えることによって、レンジが自動的に生成される。このように、レンジは、1回のクリックで指定することができる。この手法を用いて、複数のレンジを指定することができる。
図20Aにおいて、各指定されたレンジは、サムネール2008−2上に表示されたバーによって示される。また、レンジをユニークに識別する識別子又はラベルが各レンジに関連付けられてもよい。図20Aにおいて、各レンジは、レンジの左上に表示されたレンジに関連付けられた番号によって識別される。これら番号は、レンジに対するラベルとして機能する。したがって、あるレンジについて格納された情報は、そのレンジの開始時刻(RS)と、そのレンジの終了時刻(RE)と、そのレンジを識別するラベル又は識別子とを含み得る。また、レンジに対応する情報を格納したマルチメディア文書を識別する情報もレンジについて格納されてもよい。
サムネール2008−2の一部分を選択して指定された各レンジは、上端(Rtop)及び下端(Rbottom)を境界とする。あるレンジについてのRS及びRE時刻は、Rtop及びRbottomのピクセル位置から以下のように決定されてもよい。
RS=Rtop*tsec_m
RE=Rbottom*tsec_m
レンジを指定するのに他の手法も用いることができることは明らかである。例えば、本発明の代替的実施形態として、ユーザは、レンジの開始時刻(RS)及び終了時刻(RE)を提供することによって、レンジを指定してもよい。
図20Aに示すGUI2000において、GUIに表示されたレンジに関連する情報は、エリア2010に表示される。エリア2010において各レンジについて表示された情報は、そのレンジを識別するラベル又は識別子2012、そのレンジの開始時刻(RS)、そのレンジの終了時刻(RE)、そのレンジのタイム・スパン2018、及び、マルチメディア情報のうちそのレンジに関連付けられた部分から抽出されたビデオ・キーフレーム群2019、を含む。あるレンジについてのタイム・スパンは、そのレンジに関連付けられた終了時刻REと開始時刻RSの差を求めることによって計算される(すなわち、あるレンジについてのタイム・スパン=RE−RSである)。図20Aに示す実施形態において、各レンジに対応するマルチメディア情報から抽出された最初、最後、及び真ん中のキーフレームが表示される。あるレンジについて表示されるキーフレームを選択するのには様々な他の手法も用いることができる。図20Aに示した情報は、本発明の範囲を制限することを意図したものではない。本発明の代替的実施形態として、レンジについて様々な他の種類の情報も表示することができる。
本発明の教えるところによれば、GUI2000に表示されたレンジについて、様々なオペレーションを実行することができる。ユーザは、レンジに関連付けられたRS及びRE時刻を変更することによって、レンジを編集することができる。レンジの編集は、そのレンジのタイム・スパン(すなわち、(RE−RS)の値)を変更し得る。図20Aに示すGUI2000において、ユーザは、「Edit(編集)」ボタン2020を選択することによって、表示されたレンジを修正又は編集することができる。「Edit」ボタン2020を選択した後、ユーザは、特定のレンジを表すバーの上端及び/又は下端をドラッグすることによって、そのレンジを編集することができる。上端位置を変更すると、そのレンジの開始時刻(RS)が修正され、下端位置が変更されると、そのレンジの終了時刻(RE)が修正される。
また、ユーザは、エリア2010においてレンジを選択し、それから「Edit」ボタン2020を選択することによって、そのレンジを編集することもできる。このシナリオの場合、「Edit」ボタン2020を選択することによって、ユーザにダイアログ・ボックス(例えば、図20Bに示すダイアログ・ボックス2050)が表示される。次いで、ユーザは、選択されたレンジに関連付けられたRS及びRE値をフィールド2052及び2054にそれぞれ値を入力することによって変更することができる。選択されたレンジのタイム・スパンは、ダイアログ・ボックスのエリア2056に表示される。
また、ユーザは、表示されたレンジの位置をサムネール2008−2に沿って変えることによって、その表示されたレンジの位置を動かすことができる。レンジの移動により、そのレンジに関連付けられたRS及びREは変更されるが、そのレンジのタイム・スパンは維持される。GUI2000において、ユーザは、まず「Move(移動)」ボタン2022を選択し、それからレンジを選択・移動することによって、レンジを動かすことができる。上述のように、レンジについてのタイム・スパンは、「Edit」ボタンを選択し、それからそのレンジを表すバーの端をドラッグすることによって、編集することができる。
ユーザは、以前指定したレンジを削除又は消去することができる。図20Aに示すGUI2000において、ユーザは、「Remove(削除)」ボタン2024を選択し、それから消去すべきレンジを選択することによって、表示されたレンジを消去することができる。「Clear(クリア)」ボタン2026を選択すると、GUI2000に表示されたマルチメディア情報について指定されているすべてのレンジが消去される。
上述のように、各レンジは、マルチメディア情報のうち、そのレンジに関連付けられた時刻RSとREの間に発生した部分を指す。あるレンジに対応するマルチメディア情報は、「Play(再生)」ボタン2028を選択することによって、ユーザに出力される。「Play」ボタン2028を選択した後、ユーザは、GUI2000に表示され、該ユーザに対して出力されるべきマルチメディア情報を持つ特定のレンジを選択する。すると、マルチメディア情報のうち選択されたレンジに対応する部分がユーザに出力される。マルチメディア情報をユーザに出力するのには当業者には既知の様々な異なる手法を用いることができる。本発明の一実施形態によれば、選択されたレンジに関連付けられたマルチメディア情報に対応するビデオ情報がエリア2030においてユーザに対して再生される。選択されたレンジに対応するテキスト情報が、エリア2032に表示されてもよい。サムネール表示エリア・レンズ314及びパネル表示エリア・レンズ322の位置及び第三の表示エリア306に表示された情報は、エリア2030でユーザに対して出力された情報を持つ選択されたレンジに対応するように、自動的に更新される。
また、ユーザは、エリア2010においてレンジを選択し、それから「Paly」ボタン2020を選択することによって、選択されたレンジに対応した情報を再生させることができる。すると、選択されたレンジに対応するマルチメディア情報がエリア2030に表示される。
また、ユーザは、「Preview(プレビュー)」ボタン2034を選択することによって、GUI2000によって表示されているマルチメディア情報について指定されているすべてのレンジに関連付けられた情報を順に出力するようにGUI2000に命令することもできる。「Preview」ボタン2034を選択すると、表示されているレンジに対応したマルチメディア情報が、順に、ユーザに対して出力される。例えば、図20Aに示すように6つのレンジが表示されている場合、ラベル「1」で識別されたレンジに対応したマルチメディア情報が最初に出力され、次に、ラベル「2」で識別されたレンジに対応したマルチメディア情報が続き、これが、6つのレンジすべてに対応するマルチメディア情報がユーザに出力されるまで、続く。レンジがユーザに出力される順序は、ユーザが設定可能としてもよい。
また、あるレンジに関連付けられたマルチメディア情報は、メモリに保存することもできる。例えば、図20Aに示した実施形態において、ユーザは、「Save(保存)」ボタン2036を選択し、それから保存すべき1以上のレンジを選択することができる。すると、ユーザによって保存するものとして選択されたレンジに対応するマルチメディア情報は、メモリ(例えば、ハードディスク、ストレージ・ユニット、フロッピー(登録商標)ディスク、など)に保存される。
また、レンジについて様々な他のオペレーションも実行することができる。例えば、本発明の一実施形態によれば、1以上のレンジに対応するマルチメディア情報を紙媒体上に印刷することができる。マルチメディア情報を紙媒体上に印刷する手法を記載した詳細は、2001年11月19日に出願され、そのコンテンツ全体がここに参考文献として組み込まれる米国特許出願第10/001,895号(弁護士整理番号:15358−006500US)に記載されている。
また、あるレンジに関連付けられたマルチメディア情報をユーザ指定の受取人に伝達することもできる。例えば、ユーザは、特定のレンジを選択し、そのレンジに対応するマルチメディア情報をユーザ指定の受取人へ伝達することを要求することができる。すると、そのレンジに対応するマルチメディア情報は、その受取人に伝達される。このレンジ情報を受取人へ伝達するのには当業者には既知の様々な通信技術(例えば、ファクシミリ、電子メール、無線通信、などの通信技術)を用いることができる。
また、あるレンジに対応するマルチメディア情報は、検索プログラム、ブラウザ、グラフィック・アプリケーション、MIDIアプリケーション、などの別のアプリケーション・プログラムへの入力として提供されてもよい。ユーザは、特定のレンジを選択し、それから情報の提供先となるアプリケーションを特定することができる。ユーザの選択に応答して、次いで、そのレンジに対応するマルチメディア情報がそのアプリケーションへの入力として提供される。
上述のように、レンジは、ユーザによって手動で指定されてもよく、本発明によって自動的に選択されてもよい。このレンジの自動選択は、サーバ104上で実行するソフトウェア・モジュールによって実行されてもよく、サーバ104に接続されたハードウェア・モジュールによって実行されてもよく、或いは、これらの組み合わせでもよい。図21は、本発明の一実施形態に従って、レンジを自動的に作成する方法を示す簡略化された高レベル・フローチャート2100である。図21に示す方法は、サーバ104によって実行されてもよく、クライアント102によって実行されてもよく、或いは、サーバ104及びクライアント102によって共同して実行されてもよい。例えば、本方法は、サーバ104又はクライアント102上で実行するソフトウェア・モジュールによって実行されてもよく、サーバ104又はクライアント102に接続されたハードウェア・モジュールによって実行されてもよく、或いは、これらの組み合わせでもよい。以下に説明する実施形態では、本方法はサーバ104によって実行される。図21に示す方法は、本発明を組み込んだ一実施形態の単なる例示であり、請求項記載の本発明の範囲を制限するものではない。当業者には、他の変形例、修正例、及び代替例が明らかであろう。
図21に示すように、本方法は、サーバ104がレンジを作成するための基準を受信したときに開始される(ステップ2102)。本発明のユーザは、GUI2000を通じて、基準を指定することができる。例えば、図20Aに示すGUI2000において、エリア2040は、レンジ自動作成用の基準を指定するのに選択することができる様々なオプションを表示する。図20Aに示すGUI2000において、ユーザは、レンジ基準として、「話題」又は「単語」を選択することができる。ユーザが「話題」を選択した場合、ユーザが関心ある話題に関連する情報(エリア2042に表示される)は、レンジ作成基準として識別される。ユーザが「単語」を選択した場合、GUI2000のエリア2044においてユーザによって選択された1以上の単語が自動的にレンジを作成するための基準として用いられる。代替的実施形態として、レンジを自動的に作成するための基準は、サーバ104がアクセス可能なメモリ・ロケーションに格納されてもよい。例えば、基準情報は、サーバ104がアクセス可能なファイルに格納されてもよい。また、本発明の教えるところに従った様々な他の種類の基準も指定することができる
次いで、マルチメディア文書に格納されたマルチメディア情報が分析され、マルチメディア情報内でステップ2102で受信された基準を満たす位置(「ヒット」と呼ぶ)を特定する(ステップ2104)。例えば、ユーザがエリア2044においてユーザによって選択された1以上の単語がレンジ作成基準として用いられるように指定した場合、選択された単語の位置がマルチメディア情報において特定される。同様に、ユーザが関心ある話題をレンジ作成基準として指定した場合、サーバ104は、マルチメディア情報を分析し、マルチメディア情報においてユーザによって指定された関心ある話題に関連する位置を特定する。上述のように、サーバ104は、マルチメディア情報を分析し、ユーザによって指定された関心ある話題に関連付けられた単語又はフレーズの位置を特定することができる。関心ある話題に関連する情報は、サーバ104がアクセス可能なユーザ・プロファイル・ファイルに格納することができる。マルチメディア情報においてステップ2102で受信されたレンジ基準を満たす位置を特定するのには当業者には既知の様々な他の手法も用いることができる。
次いで、ステップ2104で特定されたヒット位置に基づいて、1以上のレンジが作成される(ステップ2106)。ヒット位置に基づいてレンジを形成するのには様々な異なる手法も用いることができる。一手法によれば、ヒットに関連付けられた時刻に基づいて1以上のレンジが作成される。ヒットは、お互いの近接さに基づいて、レンジにグループ分けすることができる。ヒット位置に基づいて作成された1以上のレンジは、より大きなレンジを形成するために合成することができる。
次いで、ステップ2106で作成されたレンジは、GUI2000を用いて、ユーザに対して表示される(ステップ2108)。レンジをユーザに対して表示するのには様々なKとなる手法を用いることができる。図20Aにおいて、各レンジは、サムネール2008−2上に表示されたバーによって示されている。
図22は、本発明の一実施形態に従って、マルチメディア情報におけるヒット位置に基づいてレンジを自動的に作成する方法を示す簡略化された高レベル・フローチャート2200である。図22に示す処理は、図21に示したステップ2106において実行される。図22に示す方法は、サーバ104によって実行されてもよく、クライアント102によって実行されてもよく、或いは、サーバ104及びクライアント102によって共同して実行されてもよい。例えば、本方法は、サーバ104又はクライアント102上で実行するソフトウェア・モジュールによって実行されてもよく、サーバ104又はクライアント102に接続されたハードウェア・モジュールによって実行されてもよく、或いは、これらの組み合わせでもよい。以下に説明する実施形態では、本方法はサーバ104によって実行される。図22に示す方法は、本発明を組み込んだ一実施形態の単なる例示であり、請求項記載の本発明の範囲を制限するものではない。当業者には、他の変形例、修正例、及び代替例が明らかであろう。
図22に示すように、本方法は、マルチメディア情報における最初のヒットに関連付けられた時刻を決定することによって開始される(ステップ2202)。このマルチメディア情報における最初のヒットは、関連付けられた時刻が最も古いヒット(すなわち、マルチメディア情報において他のヒットの前に発生したヒット)に対応する。次いで、新しいレンジについてのRSが最初のヒットの発生時刻にセットされ、新しいレンジについてのREが最初のヒットの発生時刻後のある時刻値にセットされるように、最初のヒットを含んだ新しいレンジが作成される(ステップ2204)。本発明の一実施形態によれば、REは、最初のヒットの発生時刻の5秒後にセットされる。
次いで、サーバ104は、マルチメディア情報に更なるヒットは存在しないか判断する(ステップ2206)。マルチメディア情報に更なるヒットが存在しない場合、処理は終了する。その場合、そのマルチメディア情報について作成されたレンジが図21に示したステップ2108に従ってユーザに表示される。ステップ2206においてそのマルチメディア情報に更なるヒットが存在すると判断された場合、次のヒットに関連付けられた時刻が決定される(ステップ2208)。
次いで、サーバ104は、前のヒットを含むレンジの終了時刻とステップ2208で決定された時刻との時間差が閾値を超えているか否かを判断する(ステップ2210)。したがって、ステップ2210において、サーバ104は、
(ステップ2208で決定された時刻)−(前のヒットを含むレンジのRE)>GapBetweenHits
が成り立つか否かを判断する。ここで、GapBetweenHitsは、上記閾時間値を表す。この閾値は、ユーザが設定可能である。本発明の一実施形態によれば、GapBetweenHitsは60秒である。
ステップ2210において前のヒットを含むレンジの終了時刻とステップ2208で決定された時刻との時間差が閾値を超えていると判断された場合、新しいレンジについてのRSがステップ2208で決定された時刻にセットされ、新しいレンジについてのREがステップ2208で決定された時刻後のある時刻値にセットされるように、次のヒットを含んだ新しいレンジが作成される(ステップ2212)。本発明の一実施形態によれば、REは、ヒット発生時刻の5秒後にセットされる。その後、処理はステップ2206へ進む。
ステップ2210において前のヒットを含むレンジの終了時刻とステップ2208で決定された時刻との時間差が閾値を超えていないと判断された場合、前のヒットを含むレンジの終了時刻REをステップ2208で決定された時刻に変えることによって、該レンジが延長される(ステップ2214)。その後、処理はステップ2206へ進む。
図22に示した方法によれば、前のレンジから閾値(「GapBetweenHits」)内に発生したマルチメディア情報内のヒットについて1つのレンジが作成される。図22に示す方法の終わりにおいて、レンジ基準に基づいて、1以上のレンジが自動的に作成される。
本発明の一実施形態によれば、ヒットに関連付けられた時刻に基づいて(例えば、図22に示すフローチャート2200に従って)1以上のレンジを形成した後、ヒット位置に基づいて作成された1以上のレンジが、より大きいレンジを形成するために、他のレンジと合成される。本発明の一実施形態によれば、小さいレンジが識別され、その小さいレンジと隣接するレンジとの時間差がユーザが設定可能な時間期間閾値内であれば、その小さいレンジはその隣接するレンジと合成される。時間期間閾値内に2つの隣接する時間レンジが存在する場合、小さいレンジに最も近い隣接レンジが小さいレンジと合成される。隣接レンジは、小さいレンジである必要はない。より小さいレンジを合成してより大きいレンジを形成することは、複数の小さいレンジよりもより大きいレンジの方がユーザにとってより有用である、という前提に基づいている。
図23は、本発明の一実施形態に従って、1以上のレンジを、それらレンジのサイズと、それらレンジの隣接するレンジへの近接さとに基づいて、合成する方法を示す簡略化された高レベル・フローチャート2300である。図23に示す処理は、図21に示したステップ2106において、図22に示したフローチャート2200に従った処理の後に実行される。図23に示す方法は、サーバ104によって実行されてもよく、クライアント102によって実行されてもよく、或いは、サーバ104及びクライアント102によって共同して実行されてもよい。例えば、本方法は、サーバ104又はクライアント102上で実行するソフトウェア・モジュールによって実行されてもよく、サーバ104又はクライアント102に接続されたハードウェア・モジュールによって実行されてもよく、或いは、これらの組み合わせでもよい。以下に説明する実施形態では、本方法はサーバ104によって実行される。図23に示す方法は、本発明を組み込んだ一実施形態の単なる例示であり、請求項記載の本発明の範囲を制限するものではない。当業者には、他の変形例、修正例、及び代替例が明らかであろう。
図23で実行される処理を説明するために、GUIによって表示されているマルチメディア情報についてN個のレンジ(N≧1)が作成されたものとする。これらレンジは、例えば、図22のフローチャート2200に示された処理に従って作成される。「N」個のレンジにおける各レンジRi(1≦i≦N)は、それに関連付けられた開始時刻RS及び終了時刻REを有する。レンジRiについて、そのレンジの隣接レンジをレンジR(i−1)及びレンジR(i+1)とする。レンジR(i−1)のREはレンジRiのRSより前に発生し、レンジRiのREはレンジR(i+1)のRSより前に発生する。レンジR(i−1)をレンジRi前に発生するレンジと呼ぶ。レンジR(i+1)をレンジRi後に発生するレンジと呼ぶ。
図23に示すように、本方法は、変数「i」を1に初期化することによって開始される(ステップ2303)。次いで、レンジRiが選択される(ステップ2304)。最初にフローチャート2300を通るとき、「N」個のレンジの中の最初のレンジが選択される。後続の処理では、後続のレンジが選択される。
次いで、サーバ104は、ステップ2304で選択されたレンジRiが小さいレンジとしてふさわしいか否かを判断する。本発明の一実施形態によれば、閾値「SmallRangeSize」が定義され、レンジのタイム・スパンが閾値SmallRangeSize以下の場合に、そのレンジは小さいレンジと考えられる。したがって、レンジRiが小さいレンジとしてふさわしいか否かを判断するために、ステップ2304で選択されたレンジRiのタイム・スパンが時間閾値「SmallRangeSize」と比較される(ステップ2306)。SmallRangeSizeの値は、ユーザが設定可能とすることができる。本発明の一実施形態によれば、SmallRangeSizeは8秒にセットされる。
ステップ2304において、ステップ2304で選択されたレンジRiが小さいレンジにふさわしくない(すなわち、レンジRiのタイム・スパン(RE−RS)が閾値SmallRangeSizeより大きい)と判断された場合、そのレンジは、別のレンジと合成されるレンジの候補とはならない。次いで、変数「i」の値が1つインクリメントされ、「N」個のレンジの中から次のレンジを選択するのに容易にする。したがって、図23に示す本発明の教えるところによれば、小さいレンジにふさわしいレンジのみが他の隣接するレンジとの合成される資格を持つ。
ステップ2308の後、サーバ104は、「N」個のレンジのすべてが処理されたか否かを判断する。これは、「i」の値が「N」の値より大きいか否かを判断することによって行われる(ステップ2310)。「i」の値が「N」より大きい場合、それは、そのマルチメディア情報についてのすべてのレンジが処理され、フローチャート2300の処理が終了することを示している。ステップ2310において「i」が「N」以下と判断された場合、それは、「N」個のレンジの中にフローチャート2300に従って処理されていないレンジが少なくとも1つ存在することを示している。その場合、処理はステップ2304へ進み、次のレンジRiが選択される。
ステップ2306において、ステップ2304で選択されたレンジRiが小さいレンジにふさわしい(すなわち、レンジRiのタイム・スパン(RE−RS)が閾値SmallRangeSizeより以下である)と判断された場合、本発明は、レンジRiを合成することが可能なレンジRiに隣接するレンジ(すなわち、ステップ2304で選択されたレンジRiの直前又は直後に発生するレンジ)を識別する処理を実行する。このようなレンジを識別するために、サーバ104は変数を初期化し、ステップ2304で選択されたレンジRiに隣接するレンジの選択を容易にする(ステップ2312)。変数「j」は値(i+1)にセットされ、変数「k」は値(i−1)にセットされる。変数「j」は、レンジRiに隣接し、レンジRiの後に発生するレンジを指すのに用いられ、変数「k」は、レンジRiに隣接し、レンジRiの前に発生するレンジを指すのに用いられる。図24は、レンジRi、Rj、及びRkの間の関係を示す簡略図を示す。図24に示すように、レンジRiは、レンジRkの後に発生し(すなわち、RiのRSはRkのREより前に発生し)、レンジRjの前に発生する(すなわち、RiのREはRjのRSの前に発生する)。
次いで、サーバ104は、そのマルチメディア情報について作成された「N」個のレンジにステップ2304で選択されたレンジRiの隣接レンジであってレンジRiより前に発生するレンジ及びレンジRiの隣接レンジであってレンジRiより後に発生するレンジを含まれるか否かについて判断する。これは、変数「j」及び「k」の値を判断することによって行われる。「j」の値が「N」より大きい場合、それは、ステップ2304で選択されたレンジRiがそのマルチメディア情報について作成された「N」個のレンジの中で最後のレンジであり、レンジRiの後に発生するレンジは存在しない、ことを示している。「k」の値が0の場合、それは、ステップ2304で選択されたレンジRiがそのマルチメディア情報について作成された「N」個のレンジの中の最初のレンジであり、レンジRiの前に発生したレンジは存在しない、ことを示している。
したがって、サーバ104は、レンジRiがRiの前に発生した隣接レンジ及びRiの後に発生した隣接レンジを有するか否かを判断する。これは、「j」の値が「N」未満で且つ「k」の値が0でないか否かを判断することによって行われる(ステップ2314)。ステップ2314における条件が満たされた場合、それは、「N」個のレンジの中にステップ2304で選択されたレンジRiに隣接し、レンジRiより前に発生するレンジと、レンジRiに隣接し、レンジRiより後に発生するレンジとが存在することを示している。この場合、処理はステップ2316へ進む。ステップ2314における条件が満たされない場合、それは、ステップ2304で選択されたレンジRiが「N」個のレンジの中の最初のレンジであり、レンジRiの前に発生したレンジは存在しないこと、及び/又は、ステップ2304で選択されたレンジRiが「N」個のレンジの中で最後のレンジであり、レンジRiの後に発生するレンジは存在しないこと、のいずれかを示している。この場合、処理はステップ2330へ進む。
ステップ2314における条件が真であると判断された場合、サーバ104は、レンジRiとRkの間及びレンジRiとRjの間の時間差を決定する(ステップ2316)。
レンジRiとRkの間の時間差(Gikで示す)は、レンジRiのRSとRkのREの間の時間を決定することによって計算される(図24参照)。すなわち、
Gik=(RiのRS)−(RkのRE)
である。レンジRiとRjの間の時間差(Gijで示す)は、レンジRiのREとRjのRSの間の時間を決定することによって計算される(図24参照)。すなわち、
Gij=(RjのRS)−(RiのRE)
である。
本発明の教えるところによれば、小さいレンジと隣接レンジの間の差が差閾値以下の場合のみ、小さいレンジは隣接レンジと合成される。この差閾値は、ユーザが設定可能である。したがって、サーバ104は、次いで、レンジRiをその隣接レンジの一と合成できるか否かを判断するための時間差のサイズを決定する。
サーバ104は、次いで、時間差Gikと時間差Gijの値を比較することによって、いずれの時間差がより大きいかを判断する(ステップ2318)。ステップ2318において、GikがGijより大きいと判断された場合、それは、ステップ2304で選択されたレンジRiはレンジRkへよりもレンジRjの方に近いことを示しており、処理はステップ2322へ進む。他方、ステップ2318において、GikがGijより大きくないと判断された場合、それは、ステップ2304で選択されたレンジRiとレンジRkの間の時間差がレンジRiとレンジRjの間の時間差以下であることを示しており、処理はステップ2320へ進む。
ステップ2318において、GikがGijより大きくないと判断された場合、サーバ104は、レンジRiとレンジRkの間の時間差(Gik)が差閾値「GapThreshold」以下であるか否かを判断する(ステップ2320)。GapThresholdの値は、ユーザが設定可能である。本発明の一実施形態によれば、GapThresholdは90秒にセットされる。GapThresholdには様々な他の値も用いることができることは明らかである。
ステップ2320において、レンジRiとレンジRkの間の時間差(Gik)が差閾値GapThreshold以下である(すなわち、Gik≦GapThreshold)と判断された場合、レンジRiとRkは合成され、1つのレンジが形成される(ステップ2324)。レンジRiとRkの合成処理は、レンジRkの終了時刻をレンジRiの終了時刻に変更し(すなわち、RkのREをRiのREにセットし)、レンジRiを消去することを含む。その後、処理はステップ2308に進み、変数「i」の値が1つインクリメントされる。
ステップ2320において、時間差GikがGapThresholdより大きい(すなわち、Gik>GapThreshold)と判断された場合、それは、レンジRj及びRkの双方が差閾値の外にあることを示しており、結果として、レンジRiはレンジRj及びRkのいずれとも合成できない。このシナリオの場合、処理はステップ2308に進み、変数「i」の値が1つインクリメントされる。
ステップ2318に戻り、GikがGijより大きいと判断された場合、サーバ104は、レンジRiとレンジRjの間の時間差(Gij)が差閾値「GapThreshold」以下であるか否かを判断する(ステップ2322)。上述のように、GapThresholdの値は、ユーザが設定可能である。本発明の一実施形態によれば、GapThresholdは90秒にセットされる。GapThresholdには様々な他の値も用いることができることは明らかである。
ステップ2322において、レンジRiとRjの間の時間差(Gij)が差閾値GapThreshold以下である(すなわち、Gij≦GapThreshold)と判断された場合、レンジRiとRjは合成され、1つのレンジが形成される(ステップ2326)。レンジRiとRjの合成処理は、レンジRjの開始時刻をレンジRiの開始時刻に変更し(すなわち、RjのRSをRiのRSにセットし)、レンジRiを消去することを含む。その後、処理はステップ2308に進み、変数「i」の値が1つインクリメントされる。
ステップ2322において、差GijがGapThresholdより大きい(すなわち、Gij>GapThreshold)と判断された場合、それは、レンジRj及びRkの双方が差閾値の外にあることを示しており、結果として、レンジRiはレンジRj及びRkのいずれとも合成できない。このシナリオの場合、処理はステップ2308に進み、変数「i」の値が1つインクリメントされる。
サーバ104が、ステップ2314における条件が満たされないと判断した場合、サーバ104は、「k」の値が0であるか否かを判断する(ステップ2330)。「k」の値が0であれば、それは、ステップ2304で選択されたレンジRiがそのマルチメディア情報について作成された「N」個のレンジの中の最初のレンジであり、レンジRiの前に発生したレンジは存在しない、ことを示している。このシナリオにおいて、サーバ104は、変数「j」の値が「N」より大きいか否かを判断する(ステップ2332)。「j」の値も「N」より大きい場合、それは、ステップ2304で選択されたレンジRiがそのマルチメディア情報について作成された「N」個のレンジの中の最初のレンジであるだけでなく最後のレンジでもあり、レンジRiの後に発生するレンジは存在しない、ことを示している。ステップ2330において「k」が0であると判断され、ステップ2332において「j」>Nと判断された場合、それは、そのマルチメディア情報についてのレンジ群は1つのレンジしか含まない(すなわち、N=1)、ことを示している。次いで、フローチャート2300に示した処理は、合成できるレンジがないため、終了する。
ステップ2330において「k」は0に等しいと判断され、ステップ2332において「j」は「N」より大きくないと判断された場合、それは、ステップ2304で選択されたレンジRiがそのマルチメディア情報について作成された「N」個のレンジにおける最初のレンジを表し、それらレンジ群はレンジRiに隣接し、レンジRiより後に発生するレンジRjを少なくとも1つ含む、ことを示している。この場合、レンジRiとレンジRjの間の時間差Gijが決定される(ステップ2334)。上述のように、Gijは、レンジRiのREとRjのRSの間の時間を決定することによって計算される。すなわち、
Gij=(RjのRS)−(RiのRE)
である。次いで、処理は上述のステップ2322へ進む。
ステップ2330において「k」は0に等しくないと判断された場合、それは、ステップ2304で選択されたレンジRiがそのマルチメディア情報について作成された「N」個のレンジにおける最後のレンジを表し、それらレンジ群はレンジRiに隣接し、レンジRiより前に発生するレンジRkを少なくとも1つ含む、ことを示している。この場合、レンジRiとレンジRkの間の時間差Gikが決定される(ステップ2336)。上述のように、Gikは、レンジRiのRSとRkのREの間の時間を決定することによって計算される。すなわち、
Gik=(RiのRS)−(RkのRE)
である。次いで、処理は上述のステップ2320へ進む。
図25Aは、本発明の一実施形態に従って、図24に示したレンジRi及びRkを合成することによって作成された一レンジを示す簡略図を示す。図25Bは、本発明の一実施形態に従って、図24に示したレンジRi及びRjを合成することによって作成された一レンジを示す簡略図を示す。
上述のように、図23に示す処理は、図22に示すフローチャート2200に従って、ヒットに関連付けられた時刻に基づいて1以上のレンジが作成された後に実行することができる。本発明の一実施形態によれば、図23に示すフローチャート2300に従ってレンジが合成された後、それらレンジは、図21のステップ2108に従ってGUI2000においてユーザに対して表示される。
本発明の代替的実施形態によれば、図23に示すフローチャートに従ってレンジを合成した後、各レンジの開始時刻及び終了時刻にバッファ時間が加えられる。ユーザは、各レンジの開始時刻に加えられる時間量(BufferStart)及び各レンジの終了時刻に加えられる時間量(BufferEnd)を設定することができる。バッファ時間は、レンジがそのレンジの最初のヒットからすぐに始まらないように、及び、そのレンジの最後のヒットですぐに終わらないように、レンジに対して加えられる。バッファ時間は、レンジに含まれている情報に対してリードイン(lead−in)及びトレーリングオフ(trailing−off)を提供するため、そのレンジに対してより良いコンテキストを提供する。
バッファは、レンジのRS時刻を以下のように変えることによって、レンジの開始時に提供される。
レンジのRS=(バッファを加える前のレンジのRS)―BufferStart
バッファは、レンジのRE時刻を以下のように変えることによって、レンジの終了時に提供される。
レンジのRE=(バッファを加える前のレンジのRE)―BufferEnd
図26は、本発明の一実施形態に従って自動的に作成されたレンジを示すGUI2000の拡大版を示す。ユーザによって提供された基準を満たす複数のヒット2602がテキスト情報を表示するサムネール2008−1においてマーキングされている。本発明の一実施形態によれば、これらヒットは、ユーザが指定した関心ある話題に関連する単語及び/又はフレーズを表す。図26に示すように、これらヒットの位置に基づいて、2つのレンジ2006−2及び2006−3が自動的に作成されている。レンジ2006−2は、本発明の教えるところ(例えば、図23に示したフローチャート2300)に従って、複数の小さいレンジを合併させることによって作成されている。
(複数のマルチメディア文書からのマルチメディア情報の表示)
本発明の上記実施形態は、記録された(又は取り込まれた)情報の表現を共通のタイムラインに沿って表示する。これら記録された情報には、オーディオ情報、ビデオ情報、クローズド・キャプション(CC)テキスト情報、スライド情報、ホワイトボード情報、などの様々な種類の情報が含まれ得る。これら様々な種類の情報は、1以上の取込装置によって取り込まれたものであってもよい。
上述のように、マルチメディア文書は、記録された又は取り込まれた情報を格納する所蔵所を備えることができる。マルチメディア文書は、複数の種類の情報を含む記録された情報を格納したファイルであってもよい。マルチメディア文書は、記録された情報を格納した1以上の他のファイルへの参照を含んだファイルであってもよい。これら参照されたファイルは、1以上の種類の情報を格納していてもよい。また、マルチメディア文書は、1種類以上の記録された情報が格納されたロケーションであってもよい。例えば、マルチメディア文書は、共通のタイムライン中に取り込まれた又は記録された情報を含むファイルを格納したディレクトリであってもよい。本発明の一実施形態によれば、ディレクトリの各ファイルは、特定の種類の情報を格納する。すなわち、各ファイルは、特定の情報ストリームを格納する。したがって、複数種類(例えば、第一の種類、第二の種類、など)の情報を含む記録された情報について、様々な種類の情報が1つのファイルに格納されてもよく、各種類の情報が別々のファイルに格納されてもよい。
様々な種類の情報が共通のタイムラインに沿って取り込まれているため、情報の表現はGUIによって表示された時にその表示が互いに時間的に揃っているように表示することができる。例えば、図3に示したインターフェース300は、テレビ放送記録マルチメディア文書によって格納されたマルチメディア情報を表示する。放送記録に格納された様々な種類の情報は、例えば、ビデオ情報、オーディオ情報、及び、場合によってはクローズド・キャプション(CC)テキスト情報などである。ビデオ情報、オーディオ情報、及び、CCテキスト情報は、すべて、おそらく異なる取込装置によって、同じ(又は、共通の)タイムラインに沿って、取り込まれる。例えば、オーディオ情報は、オーディオ情報取込装置(例えば、マイク)を用いて取り込まれ、ビデオ情報は、ビデオ情報取込装置(例えば、ビデオカメラ)を用いて取り込まれる。また、オーディオ情報及びビデオ情報は、1つの情報取込装置によって取り込まれてもよい。
上述のように、インターフェース300は、放送記録に含まれるオーディオ情報又はCCテキスト情報の表現(又は、マルチメディア情報に含まれた他の種類の情報のテキスト表現)であるテキスト情報を表示する。また、インターフェース200は、放送記録に含まれるビデオ情報から抽出されたビデオ・キーフレームを表示する。表示されたビデオ・キーフレームは、マルチメディア文書に格納されたビデオ情報の表現である。オーディオ情報及びビデオ情報は同じタイムラインに沿って取り込まれるため、それら情報の表現をそれらが時間的に揃えられるように又は互いに同期するように表示することができる。例えば、上述のように、サムネール画像312−1及び312−2は、サムネール画像312−1におけるテキスト情報(例えば、オーディオ情報又はCCテキスト情報の録音、又は、マルチメディア情報に含まれる他の種類の情報のテキスト表現を表す)と、サムネール31202に表示された特定の時点で発生したビデオ・キーフレームとは、同じ水平軸に沿って互いに略近接して表示される。これにより、ユーザは、単にサムネール画像を水平軸に走査することによって略同時に発生したテレビ放送記録における様々な種類の情報を判断することができる。同様に、パネル324−1及び324−2は、テレビ放送記録において略同時に発生した様々な種類の情報の表現が互いに略近接して表示されるように、時間的に揃えられる又は互いに同期される。
また、本発明の実施形態は、複数のマルチメディア文書に格納された記録済マルチメディア情報を表示することもできる。複数のマルチメディア文書にあるマルチメディア情報は、異なるタイムラインに沿って取り込まれたものであってもよい。例えば、本発明の実施形態は、第一のタイムライン中に取り込まれた又は記録されたテレビ・ニュース放送(例えば、朝のニュース放送)からのマルチメディア情報の表現と、第一のタイムラインとは異なる第二のタイムライン中に取り込まれた別のテレビ・ニュース放送(例えば、夕方のニュース放送)からのマルチメディア情報の表現とを表示することができる。したがって、本発明の実施形態は、異なるタイムラインに沿って取り込まれたマルチメディア情報を格納し得る1以上のマルチメディア文書に格納されたマルチメディア情報を表示することができる。各マルチメディア文書は、オーディオ情報、ビデオ情報、CCテキスト情報、ホワイトボード情報、スライド情報、などの様々な種類の情報を含み得る。
また、表示されている情報を持つ複数のマルチメディア文書は、同じタイムラインに沿って取り込まれた情報を格納した文書を含み得る。例えば、複数のマルチメディア文書は、第一のタイムライン中に取り込まれた第一のチャンネルからの第一のテレビ番組録画と、第一のテレビ番組録画と同じタイムライン(すなわち、第一のタイムライン)中に取り込まれた第二のチャンネルからの第二のテレビ番組記録とを含むことができる。したがって、本発明の実施形態は、同じ又は異なるタイムラインに沿って取り込まれた情報を格納する複数のマルチメディア文書からの情報の表現を表示することができる。
図27は、本発明の一実施形態に従って1以上のマルチメディア文書に格納され得る情報を表示することができる簡略化されたスタートアップ・ユーザ・インターフェース2700を示す。インターフェース2700は、本発明の実施形態の単なる例示であり、本発明の範囲を制限するものではない。当業者には、他の変形例、修正例、及び代替例が明らかであろう。
図27に示すように、インターフェース2700は、ユーザが選択可能な複数のボタンを含むツールバー2702を有する。これらボタンは、例えば、マルチメディア文書を表示するためにロードするためのボタン2704、前にロードされた1以上のマルチメディア文書を削除するためのボタン2706、ロードされた1以上のマルチメディア文書からのマルチメディア情報を紙媒体上に印刷するためのボタン2708、ユーザ・プリファレンスを設定するためのボタン2710、ユーザがアクションを実行したり、1以上のマルチメディア文書からの情報の表示方法を設定、カスタマイズ、又は、制御したりすることを可能にする他のボタン、などを含む。インターフェース2700の追加的機能は、以下により詳細に説明する。
表示する1以上のマルチメディア文書をロードするために、ユーザはロード・ボタン2704を選択する。図28は、本発明の一実施形態において、ユーザがロード・ボタン2704を選択したときに表示される簡略化されたウィンドウ2800を示す。ウィンドウ2800は、本発明の教えるところに従ってロードされ表示される1以上のマルチメディア文書の選択を容易にする。図28に示すように、ロード可能な1以上のマルチメディア文書を識別する情報がウィンドウ2800のボックス2802に表示される。各マルチメディア文書は、識別子(例えば、ファイル名、ディレクトリ名などのロケーション識別子、など)によって識別することができる。図28に示す実施形態では、各マルチメディア文書は、5桁のコード識別子によって識別される。ユーザは、ボックス2802においてマルチメディア文書に対応する識別子を強調し、それから「Add(追加)」ボタン2804を選択することによって、ロードされる1以上のマルチメディア文書を選択することができる。次いで、そのマルチメディア文書について強調された識別子がボックス2802から移動し、ロードするものとして選択されたマルチメディア文書を表示するボックス2806に表示される。ボックス2806においてマルチメディア文書に対する識別子を強調し、それから「Remove(削除)」ボタン2808を選択することによって、以前に選択されたマルチメディア文書を選択解除することができる。
(ボックス2802又は2806で)強調された識別子に対応するマルチメディア文書に関連する情報は、情報エリア2810に表示される。図28に示す実施形態では、表示される情報には、マルチメディア文書の持続時間を示す情報2812、マルチメディア文書の情報が取り込まれた又は記録された日付を示す情報2814、記録された時刻を示す情報2816、情報が記録されたテレビ・チャンネルを識別する情報2818、及び、記録の種類を示す情報2820、が含まれる。マルチメディア文書について入手可能な他の記述的情報(例えば、テレビ番組名)が説明エリア2821に表示されてもよい。
ユーザは、「Load(ロード)」ボタン2822を選択して、ボックス2806に表示された識別子によって識別されたマルチメディア文書のコンテンツをロードし、表示させることができる。図28に示すように、3つのマルチメディア文書が選択されており、これら3つのマルチメディア文書は、「Load」ボタン2822が選択されると、ロードされる。これら選択されたマルチメディア文書は、同じタイムラインに沿って取り込まれたマルチメディア情報を格納してもよく、異なるタイムラインに沿って取り込まれたマルチメディア情報を格納してもよい。選択されたマルチメディア文書の各々は、1以上の種類の情報(例えば、オーディオ情報、ビデオ情報、CCテキスト情報、ホワイトボード情報、スライド情報、など)を有し得る。1つのマルチメディア文書によって格納される情報種類は、別の選択されたマルチメディア文書によって格納された情報種類と異なってもよい。ユーザは、「Cancel(キャンセル)」ボタン2824を選択することによって、ロード・オペレーションをキャンセルすることができる。
マルチメディア文書を選択しロードするのには他の手法も用いることができる。例えば、一手法によれば、ユーザは、特定の識別子(例えば、バーコード)を走査することができる。走査されたバーコードに対応するマルチメディア文書(又は、マルチメディア文書によって格納された情報の一部)が、選択され、ロードされる。
図29Aは、本発明の一実施形態において、1以上のマルチメディア文書がロードされ、表示された後のユーザ・インターフェース2900を示す。インターフェース2900は、本発明の実施形態の単なる例示であり、本発明の範囲を制限するものではない。当業者には、他の変形例、修正例、及び代替例が明らかであろう。
図29Aに示すように、3つのマルチメディア文書のコンテンツがロードされ、表示されている。各マルチメディア文書について、そのマルチメディア文書によって格納された様々な種類の情報の表現がそのマルチメディア文書に対応するサムバー(thumbar)に表示される。また、各マルチメディア文書について、ビデオ・ウィンドウも表示される。各マルチメディア文書についてのサムバーは、そのマルチメディア文書に含まれる様々な種類の情報の表現を表示する1以上のサムネール画像を含む。
例えば、図29Aにおいて、サムバー2902は、第一のマルチメディア文書によって格納された情報の表現を表示し、サムバー2906は、第二のマルチメディア文書によって格納された情報の表現を表示し、サムバー2910は、第三のマルチメディア文書によって格納された情報の表現を表示する。ビデオ・ウィンドウ2904は、第一のマルチメディア文書用に表示され、ビデオ・ウィンドウ2908は、第二のマルチメディア文書用に表示され、ビデオ・ウィンドウ2912は、第三のマルチメディア文書用に表示される。図29Aに示す実施形態において、第一、第二、及び第三のマルチメディア文書は、テレビ番組の録画であり、それぞれがオーディオ情報、ビデオ情報、及び、場合によってはCCテキスト情報を含む。しかし、これは本発明の範囲を制限することを意図するものではない。本発明の教えるところに従って表示されたマルチメディア文書は、様々な種類の情報を含むことができる。
図29Aに表示された各サムバーは、1以上のサムネール画像を含む。各サムネール画像は、そのマルチメディア文書に格納された一情報種類の表現を表示する。インターフェース2900にロードされた3つのマルチメディア文書は、オーディオ情報、ビデオ情報、及び、場合によってはCCテキスト情報を有し、サムバー2902、2906、及び2910は、それぞれ、対応するマルチメディア文書からのオーディオ情報又はCCテキスト情報の表現であるテキスト情報(又は、マルチメディア文書に含まれる他の種類の情報のテキスト表現)を表示するサムネール画像と、対応するマルチメディア文書においてビデオ情報を表すビデオ・キーフレームを表示するサムネール画像とを含む。例えば、サムバー2902は、第一のマルチメディア文書からのオーディオ情報(又は、CCテキスト情報)を表すテキスト情報を表示するサムネール画像2914と、第一のマルチメディア文書のビデオ情報から抽出されたビデオ・キーフレームを表示するサムネール画像2916とを含む。サムバー2906は、第二のマルチメディア文書からのオーディオ情報(又は、CCテキスト情報)を表すテキスト情報(又は、マルチメディア情報に含まれる他の種類の情報のテキスト表現)を表示するサムネール画像2918と、第二のマルチメディア文書のビデオ情報から抽出されたビデオ・キーフレームを表示するサムネール画像2920とを含む。サムバー2910は、第三のマルチメディア文書からのオーディオ情報(又は、CCテキスト情報)を表すテキスト情報(又は、マルチメディア情報に含まれる他の種類の情報のテキスト表現)を表示するサムネール画像2922と、第三のマルチメディア文書のビデオ情報から抽出されたビデオ・キーフレームを表示するサムネール画像2924とを含む。サムネール画像を生成・表示する手法については既に説明した。各サムバーは、図3に示した第二の表示エリアと似ている。
サムバーにおけるサムネール画像は、マルチメディア文書において時間的に同時に発生した情報の表現が同じ水平軸に沿って互いに略近接して表示されるように、揃えられる。各サムバーは、共通のタイムラインに従って取り込まれた情報を表す。しかし、1つのサムバーに対応するタイムラインは、別のサムバーに対応するタイムラインと異なってもよい。
各サムバーについて、そのサムバーの一部分を覆う又は強調するレンズ(「サムネール表示エリア・レンズ」)が表示される。図29Aに示すように、サムネール表示エリア・レンズ2926は、サムバー2902の一部エリアを覆い、サムネール表示エリア・レンズ2928は、サムバー2906の一部エリアを覆い、サムネール表示エリア・レンズ2930は、サムバー2910の一部エリアを覆う。サムネール表示エリア・レンズは、当初、図29Aに示すように、サムバーの上端(すなわち、マルチメディア文書の先頭)に位置する。図3に関して既に説明したように、各サムネール表示レンズは、対応するサムバーに沿って動かすことができ、サムバーに表示されたマルチメディア文書のコンテンツをナビゲート及びスクロールするのに用いることができる。サムネール表示エリア・レンズを表示する手法、及び、サムネール表示エリア・レンズを用いて各マルチメディア文書のコンテンツをナビゲート及びスクロールする手法、については既に説明した。各サムネール表示エリア・レンズは、図3に示すサブレンズ316などのサブレンズを有してもよく、有さなくてもよい。
また、各マルチメディア文書に関連する記述的情報も、そのマルチメディア文書に対応するサムバーに表示することができる。この情報は、マルチメディア文書の持続時間を示す情報、マルチメディア文書の情報が取り込まれた又は記録された日付を示す情報、記録された時刻を示す情報、情報が記録されたテレビ・チャンネル又はテレビ番組を識別する情報、記録の種類を示す情報、などの情報が含まれ得る。図29Aに示すように、各マルチメディア文書についての記述的情報2932は、対応するサムバーの一側面に沿って表示される。
各マルチメディア文書について、そのマルチメディア文書に対応するビデオ・ウィンドウでビデオ情報が再生されてもよい。また、そのビデオ情報を付随するオーディオ情報もオーディオ出力装置を通じて出力されてもよい。例えば、第一のマルチメディア文書からのビデオ情報はビデオ・ウィンドウ2904で再生され、第二のマルチメディア文書からのビデオ情報はビデオ・ウィンドウ2908で再生され、第三のマルチメディア文書からのビデオ情報はビデオ・ウィンドウ2912で再生される。各ビデオ・ウィンドウには、そのビデオ・ウィンドウにおけるビデオ情報の再生を制御するコントロール・バーが設けられる。例えば、ビデオ・ウィンドウ2904におけるビデオ情報の再生は、コントロール・バー2934によって提供される制御によって制御され、ビデオ・ウィンドウ2908におけるビデオ情報の再生は、コントロール・バー2936によって提供される制御によって制御され、ビデオ・ウィンドウ2912におけるビデオ情報の再生は、コントロール・バー2938によって提供される制御によって制御される。
また、あるマルチメディア文書についてビデオ・ウィンドウに表示されるビデオ情報のコンテンツは、そのマルチメディア文書に対応するサムバー上でのサムネール表示エリア・レンズの位置に依存する。例えば、ビデオ・ウィンドウ2904に表示されるビデオ情報のコンテンツは、サムバー2902上でのサムネール表示エリア・レンズの位置に依存する。上述のように、各サムネール表示エリア・レンズは、時刻t1に対応する上端と、時刻t2に対応する下端とによって特徴付けられる。ビデオ・ウィンドウにおけるビデオ情報の再生は、時刻t1又はt2或いは時刻t1とt2の間の任意の時刻、に開始される。サムネール表示エリア・レンズのサムバー上での位置が変更されると、対応するビデオ・ウィンドウにおけるビデオ再生も、サムネール表示エリア・レンズのサムバー上での現在位置に対応した時刻t1又はt2或いは時刻t1とt2の間の任意の時刻から再生を開始するように、変更され得る。異なるサムバーの一部分を覆う各サムネール表示エリア・レンズは、互いに独立して、サムバーに沿って再配置できることに注意。
また、各ビデオ・ウィンドウは、そのビデオ・ウィンドウにビデオ情報コンテンツが表示されているマルチメディア文書に関連する情報も表示できる。この情報は、例えば、その録画についてテレビ番組を識別する情報、現在再生されているコンテンツに対応したマルチメディア文書における時刻を識別する情報、などである。
本発明の一実施形態によれば、すべてのロードされたマルチメディア文書で発見される単語(すなわち共通な単語)リスト2940もインターフェース2900の一エリアに表示される。この単語リスト2940は、ロードされたマルチメディア文書によって含まれる1以上の種類の情報において発見される単語を含む。例えば、図29Aに表示された単語リストは、第一のマルチメディア文書、第二のマルチメディア文書、及び、第三のマルチメディア文書において発見された単語を含む。本発明の一実施形態によれば、ロードされたマルチメディア文書によって含まれた情報のテキスト表現は、共通な単語を見つけるために検索される。このテキスト情報は、CCテキスト情報、オーディオ情報の録音、又は、マルチメディア文書に格納された他の種類の情報のテキスト表現、を表すことができる。本発明の別の実施形態によれば、単語リストは、マルチメディア文書によって含まれたビデオ情報から判断された単語を含む。例えば、ビデオ情報から抽出されたビデオ・キーフレームが共通な単語を見つけるために検索される。キーフレームは、それら単語について検索される。また、マルチメディア文書において単語が登場した回数が示される。
図29Bは、サムネール表示エリア・レンズの位置が本発明の一実施形態に従ってそれらの初期位置から変更されたときのインターフェース2900を示す。図示するように、サムネール表示エリア・レンズ2926、2928、及び2930は、図29Aに示したそれらの位置から変更されている。サムネール表示エリア・レンズの位置は対応するビデオ・ウィンドウで再生されるビデオ情報に影響を与えるため、ビデオ・ウィンドウ2904、2908、及び2912におけるコンテンツも変化している。ユーザがサムバー上でサムネール表示エリア・レンズを動かすと、ウィンドウ2942などのウィンドウがレンズ上に表示される。サムネール表示エリア・レンズの時刻t1とt2の間のマルチメディア文書のビデオ情報から抽出された複数のビデオ・キーフレームから選択された一ビデオ・キーフレームが、図29Bに示すように、ウィンドウ2942に表示される。ウィンドウ2942は、ユーザがサムネール表示エリア・レンズをリリースすると、消える。
本発明の一実施形態によれば、ユーザは、基準を指定することができ、ユーザ・インターフェースにロード・表示されたマルチメディア文書のコンテンツは、ユーザが指定した基準を満たすロケーションをマルチメディア文書内で見つけるために検索される。ユーザ指定基準を満たすマルチメディア文書内のセクション又はロケーションは強調されてインターフェース2900に表示される。本発明の一実施形態によれば、ユーザ指定基準とは、例えば、ユーザが指定した単語又はフレーズ、1以上の単語を含む検索クエリー(search query)、関心ある話題、などである。
図29Cに示したインターフェース2900において、ユーザは、入力エリア2944に単語又はフレーズを入力し、「Find(検索)」ボタン2946を選択することによって、ユーザが指定した単語又はフレーズについてマルチメディア文書のコンテンツを検索することをリクエストすることができる。また、検索される単語又はフレーズは、共通単語リスト2940から選択されてもよい。図29Cにおいて、ユーザは、「Stewart」という単語を指定している。
次いで、マルチメディア文書のコンテンツが検索され、ユーザが指定した単語又はフレーズのロケーション及び存在を特定する。本発明の一実施形態によれば、マルチメディア文書によって格納された情報のテキスト表現は、ユーザが指定した単語又はフレーズのロケーションを見つけるために、検索される。また、ビデオ・キーフレームもその単語又はフレーズについて検索されてもよい。様々なサムバー(すなわち、サムバーにおけるサムネール画像)におけるユーザが指定した単語又はフレーズのすべての存在(「ヒット」)2950が、図29Cに示すように、強調される。マルチメディア文書においてヒットを強調するのには様々な異なる手法を用いることができる。例えば、個々のヒットが強調されてもよい。また、(上述の)ヒットに基づいてレンジを決定し、このレンジが強調されてもよい。また、ヒットのおよその位置をマーキングするのにマーク(下記図29D参照)などの他の手法を用いることもできる。本発明の一実施形態によれば、図29Cに示すように、検索単語又はフレーズを含む行を強調するために、サムネール画像において、その行の周囲に色の付いた長方形が描画される。また、検索単語又はフレーズを含むサムバーに表示されたビデオ・キーフレームも、そのビデオ・キーフレームの周囲に色の付いたボックスを描画することによって強調される。また、様々な他の種類の手法も用いることができる。例えば、マルチメディア文書がスライド情報を含む場合、検索単語又はフレーズを含むサムバーに表示されたスライドが強調される。また、様々なマルチメディア文書における単語又はフレーズの存在総数2952も表示される。例えば、図29Cにおいて、「Stewart」という単語は、3つのマルチメディア文書において、31回登場する。
また、ユーザは、複数の単語(例えば、複数の単語及び/又はフレーズ)を含む検索クエリーを形成することもできる。図29Dに示すように、検索クエリーに含まれる単語又はフレーズがエリア2954に表示される。ユーザは、入力エリア2944に単語又はフレーズをタイピングし(又は、共通単語リスト2940から単語を選択し)、「Add(追加)」ボタン2956を選択することによって、検索クエリーに単語又はフレーズを加えることができる。すると、その単語又はフレーズが検索クエリーに追加され、エリア2954に表示される。図29Dにおいては、「Stewart」という単語が検索クエリーに追加された。ユーザは、エリア2954において単語又はフレーズを選択し、「Del(消去)」ボタン2960を選択することによって、検索クエリーから単語又はフレーズを消去又は削除することができる。ユーザは、「Reset(リセット)」ボタン2962を用いて、検索クエリーをリセット又はクリアすることができる。
また、ユーザは、検索クエリーにおいて単語と単語を接続するブール(Boolean)・コネクタを指定することもできる。例えば、図29Dに示す実施形態において、検索クエリーの単語又はフレーズは、ラジオ・ボタン2958の選択に基づいて、AND接続されてもよく、OR接続されてもよい。単語がOR接続された場合、検索クエリーの単語又はフレーズの様々なマルチメディア文書におけるすべての位置が検索され、強調される。単語がAND接続された場合、マルチメディア文書のうち、検索クエリーのすべての単語又はフレーズを近接した範囲内に含む部分のみが関連性を有するものとして強調される。この近接度の単位は、ユーザが設定可能とすることができる。本発明の一実施形態によれば、この近接度の単位は、単語数に一致する。例えば、マルチメディア文書における検索クエリー単語又はフレーズの位置は、それらが互いに所定の単語数内で発生した場合に、強調される。また、近接度は、時間に基づくこともできる。この実施形態においては、マルチメディア文書における検索クエリー単語又はフレーズの位置は、それらが所定の時間長内で発生した場合に、強調される。
図29Dにおいて、ヒット位置は、サムバーに表示されたマーク2964によって示される。各マーク2964は、検索クエリー単語を含むサムネールに印刷されたテキスト情報において、一行を識別する。
図29Dに示す実施形態においては、ヒット位置に基づいて、レンジが形成される。ヒット位置に基づいてレンジを形成する手法については既に述べた(図20A、20B、21、22、23、24、25A、25B、及び、26、並びに、関連する記載、参照)。レンジの位置は、色の付いた長方形2966を用いて、表示される。各長方形は、一レンジを識別する。このように、レンジを表す長方形のボックスは、マルチメディア文書のうち、該マルチメディア文書を検索するのに用いられるユーザが指定した基準(例えば、単語、フレーズ、関心ある話題、など)を満たす又は関連する部分を識別する。
1つのマルチメディア文書のコンテンツのみが表示される場合(例えば図3)である本発明の実施形態において、レンジは、上述のように、そのレンジの境界を定義する開始時刻(RS)及び終了時刻(RE)によって識別される。複数のマルチメディア文書からの情報が表示される場合である本発明の実施形態において、レンジは、開始時刻(RS)と、終了時刻(RE)と、そのレンジが存在するマルチメディア文書を識別する識別子とによって定義される。さらに、上述のように、各レンジを識別するのに識別子(例えば、テキスト・コード、番号、など)を用いることができる。あるレンジについてのレンジ識別子は、そのレンジに対応する長方形ボックスに表示されてもよく、ユーザ・インターフェース上の他の位置に表示されてもよい。
また、図29Dにおける各サムバーは、そのサムバーにコンテンツが表示されているマルチメディア文書のユーザが指定した検索基準(例えば、ユーザが指定した単語又はフレーズ、検索クエリー、関心ある話題、など)に対する関連性の度合を示す関連性インジケータ2968も含む。この関連性スコア又は関連性の度合を決定する手法については既に述べた。本発明の一実施形態によれば、あるサムバーについての関連性の度合は、そのサムバーにコンテンツが表示されたマルチメディア文書におけるヒット頻度に基づく。図20Dに示した関連性インジケータにおいて、あるマルチメディア文書のユーザが指定した基準に対する関連性の度合は、関連性インジケータに表示されたバーの数によって示される。したがって、サムバー2902及び2910にコンテンツが表示された第一及び第三のマルチメディア文書(それぞれの関連性インジケータに4つのバーが示されている)は、サムバー2906に表示された第二のマルチメディア文書(関連性インジケータに1つのバーしか示されていない)よりも、ユーザが指定した現在の基準(すなわち、「Stewart」という単語などの検索クエリー)に対してより関連性を有する。また、マルチメディア文書の関連性の度合を示すのには様々な他の手法(例えば、関連性スコア、棒グラフ、異なる色、など)も用いることができる。
既述のように、レンジについては様々なオペレーションを実行することができる。レンジについて実行されるオペレーションは、例えば、レンジのコンテンツの表現を紙文書上に印刷すること、レンジのコンテンツを保存すること、レンジのコンテンツを伝達すること、などである。また、レンジは、注釈を付けたり、強調したり、レンジ群にグループ分けしたりすることもできる。また、レンジ群内のレンジは、ユーザが設定可能とし得る何らかの基準に従って、ランク付けしたり、並び替えたりすることができる。例えば、レンジは、各レンジのユーザが指定した検索基準に対する関連性に基づいて、ランク付けすることができる。本発明の一実施形態によれば、高いヒット数を持つレンジほど高くランク付けされ、少ないヒット数を持つほど低くランク付けされる。また、レンジをランク付けする及び/又は並び替えるのに他の手法も用いることができる。
また、ユーザは、ユーザ・インターフェースによって表示された1以上のレンジを選択し、その選択されたレンジについてオペレーションを実行することもできる。本発明の一実施形態によれば、ユーザは、マウスなどの入力装置を用いて、レンジを表す長方形をクリックすることによって、レンジを選択することができる。図29Eにおいて、レンジ2970がユーザによって選択されている。レンジ2970を表す長方形は、それが選択されたことを示すために強調される(例えば、他のレンジを表す長方形とは異なる色で)。図29Eに示す実施形態においては、ユーザが選択したレンジについてウェブ・ページ2971が生成され、ユーザ・インターフェース2900のウィンドウ2969に表示される。ウェブ・ページ2971は、選択されたレンジについてのオーディオ情報又はCCテキスト情報(又は、マルチメディア情報に含まれる他の種類の情報のテキスト表現)を表すテキスト情報(すなわち、選択されたレンジの時刻RSとREの間で発生したオーディオ情報、CCテキスト情報、又は、他の情報を表すテキスト情報)2972と、選択されたレンジに対応するビデオ情報から抽出された1以上のビデオ・キーフレーム又は画像(すなわち、選択されたレンジの時刻RSとREの間で発生したビデオ情報から抽出されたビデオ・キーフレーム)2973とを含む。本発明の一実施形態によれば、ウェブ・ページ2971の各画像2973はハイパーテキスト・リンクであり、選択されると、その画像に関連付けられた時刻からビデオ情報の再生を開始する。
図29Eに示すように、各画像にバーコード2977が印刷されてもよい。このバーコードは、画像に関連付けられた時刻を表し、バーコード・リーダ又はスキャナを用いてこのバーコードを走査すると、その画像に関連付けられ、バーコードによって表された時刻からビデオ情報が再生される。この再生は、選択されたレンジに対応するマルチメディア文書のビデオ・ウィンドウに表示することができる。また、レンジが選択されたマルチメディア文書を識別する情報2974もウェブ・ページ2971上に表示することができる。また、各バーコード2977は、レンジに関する開始時刻及び終了時刻も識別することができる。このようなバーコードをバーコード・リーダ又はスキャナを用いて走査することによって、そのレンジに対応した情報を再生させることができる。また、バーコード2977は、レンジを識別するラベル又は識別子も表すことができる。このようなパーコードを走査すると、走査されたバーコードによって表されたレンジ識別子を用いて、そのレンジの開始時刻及び終了時刻を決定することができ、そして、そのレンジに対応する情報を再生することができる。
ユーザがマルチメディア文書を検索するためのユーザ指定基準(例えば、単語又はフレーズ、関心ある話題、検索クエリー、など)を識別すると、ウェブ・ページ2971におけるユーザ指定基準の存在が強調される。例えば、図29Eにおいては、ユーザが、「Stewart」という単語を含む検索クエリーを指定したために、ウェブ・ページ2971における「Stewart」という単語の存在2975が強調されている(例えば、太字にされている)。
また、「Complete Set(一式)」と名付けられたハイパーテキスト・リンク2976もウェブ・ページ2971に含まれる。「Complete Set」リンク2971を選択すると、インターフェース2900に表示されるすべてのマルチメディア文書にわたるサムバー上に示された様々なレンジのコンテンツに基づいたウェブ・ページが生成・表示される。
代替的実施形態として、レンジに対してウェブ・ページ以外の種類の文書が生成・表示されてもよい。本発明の一実施形態によれば、選択された1以上のレンジの印刷可能表現(printable representation)が生成され、表示される。このようなマルチメディア情報の印刷可能表現の生成・表示に関連する更なる詳細は、2001年11月19日に出願され、その全内容がここに参考文献として組み込まれる、米国特許出願第10/001,895号に記載されている。
図29Fは、検索クエリーがORブール演算子で接続された複数の単語(すなわち、「Stewart」、「Imclone」、及び「Waksal」)を含むインターフェース2900を示す。検索クエリーの単語のすべての存在2980がウェブ・ページ2971で強調される(例えば、太字にされる)。また、サムバーにおける単語のすべての存在又はヒットもマーカ2964を用いてマーキングされる。ヒット位置に基づいて、レンジが形成され、表示されている。
既述のように、マルチメディア文書を検索するためのユーザ指定基準は、関心ある話題も含み得る。したがって、本発明の一実施形態によれば、1以上のマルチメディア文書のコンテンツが検索され、そのマルチメディア文書のうちユーザによって指定され得る関心ある話題に関連する部分を識別する。
図29Gは、マルチメディア文書のうちユーザが指定した関心ある話題に関連する部分が強調された簡略化されたユーザ・インターフェース2900を示す。図29Gに示すように、3つの関心ある話題2981、すなわち、「Airlines(航空会社)」、「mstewart」、及び、「baseball(野球)」、が定義されている。マルチメディア文書のうち、これら関心ある話題に関連し、それらマルチメディア文書に対応するサムバーに表示されたセクションが、マーカ2983を用いて強調されている。ヒット位置に基づいて、レンジが形成され、表示されている。したがって、レンジは、これらマルチメディア文書のうち、それら関心ある話題に関連すると判断された部分を識別する。ウェブ・ページ2971のうち、これら関心ある話題に関連する部分も強調される。関心ある話題を指定する手法及びマルチメディア文書のうち1以上の関心ある話題に関連する部分を決定する手法は、2001年11月19日に出願された米国特許出願第10/001,895号及び1997年12月22日に出願された米国特許出願第08/995,616号にも記載されている。これら特許文献の全内容はここに参考文献として組み込まれる。様々なマルチメディア文書の関心ある話題への関連性を示す関連性インジケータ2982も各関心ある話題について表示される。
本発明の一実施形態によれば、各関心ある話題に特定のスタイル又は色を関連付けることができる。例えば、関心ある話題「Airlines」に第一の色を関連付け、関心ある話題「mstewart」に第二の色を関連付け、関心ある話題「baseball」に第三の色を関連付けることができる。マルチメディア文書のうち特定の関心ある話題に関連すると判断された部分は、その特定の関心ある話題に関連付けられたスタイル又は色を用いて強調することができる。これにより、ユーザは、マルチメディア文書のうち特定の関心ある話題に関連する部分を容易に判断することができる。
図29Hは、本発明の一実施形態に従ってサムバーのうちユーザ指定基準(例えば、単語、フレーズ、検索クエリー、関心ある話題、など)に関連する又は満たす又は一致する部分を表示する別の方法を示す。図29Hに示すように、マルチメディア文書のうち関心ある話題2981に関連する部分を識別するために、サムバーのサムネール画像上に長方形のボックスが描画される。サムバーの一部分を覆う各長方形ボックスについて、そのサムバーの一部分を選ばせた単語又はフレーズ又は画像が長方形ボックス上に表示される。これにより、ユーザは、マルチメディア文書のうちいずれの部分が関心ある話題(又は、他の任意のユーザ指定基準)に関連するのかが容易に分かるだけでなく、その部分の選択をもたらした単語又はフレーズ又は画像を容易に判断することができる。
図29Iにおいては、特定のマルチメディア文書についてのビデオ情報の再生がそのマルチメディア文書に対応するビデオ・ウィンドウからより大きなビデオ・ウィンドウへ移動されている。図29Iに示すように、第三のマルチメディア文書のビデオ再生がビデオ・ウィンドウ2912からより大きいビデオ・ウィンドウ2984へ移動されている。より大きなビデオ・ウィンドウ2984を表示するモードは、「Video(ビデオ)」タブ2986を選択することによって、起動する。ビデオ・ウィンドウ2912からウィンドウ2984への表示の切り替えは、コントロール・バー2938によって提供されるコントロール2938aを選択することによって実行することができる。また、ウィンドウ2984におけるビデオ情報の再生を制御するコントロールを含むコントロール・バー2984もより大きなビデオ・ウィンドウ2984の下に表示される。ビデオ情報の再生を小ビデオ・ウィンドウ2912(又は2904又は2908)から大ビデオ・ウィンドウ2984へ移動させると、ユーザがそのビデオ情報再生を見易くなる。このビデオ再生は、コントロール・バー2938からコントロール2938aを選択することによって、又は、コントロール・バー2985からコントロール2985aを選択することによって、ウィンドウ2984から小さいウィンドウ2912へ戻すことができる。
また、ビデオ再生に対応するテキスト情報2987(例えば、CCテキスト情報、オーディオ情報の録音、又は、マルチメディア情報に含まれる他の種類の情報のテキスト表現)も大ビデオ・ウィンドウ2984の下に表示される。テキスト情報2987は、ビデオ再生と共にスクロールする。テキスト情報2987における各単語は、ユーザがある単語をクリックすると、選択された単語がそのマルチメディア文書のコンテンツにおいて登場する回数及びその単語が登場する位置が分かるように、検索可能である。小ビデオ・ウィンドウにおけるビデオ再生の場合と同様に、大ビデオ・ウィンドウ2984におけるビデオ再生のコンテンツは、大ビデオ・ウィンドウ2984にビデオ情報が再生されたマルチメディア文書のコンテンツの表現を表示するサムバーのサムネール表示エリア・レンズの位置によって影響を受ける。
既述のように、ユーザは、1以上のマルチメディア文書について手動でレンジを定義することができる。マルチメディア文書についてレンジを手動で定義する手法については既に説明した。図29Iに示した実施形態において、選択されるとユーザが手動でレンジを定義できるオペレーション・モードを開始するボタン2988が設けられる。本発明の一実施形態によれば、ボタン2988を選択すると、図20Bに示したウィンドウ2050のようなウィンドウが呼び出される。図20Bに示した情報に加えて、このウィンドウは、ユーザ・インターフェースによってロードされた複数のマルチメディア文書からレンジが定義されるマルチメディア文書を識別する情報をユーザが入力できる入力フィールドも含む。また、ユーザは、レンジの開始時刻及び終了時刻を指定することもできる。代替的実施形態として、ボタン2988を選択すると、ユーザがマウスなどの入力装置を用いてインターフェース2900に示されたサムバーの1つの一部分をクリックすることによってレンジを手動で指定できるモードを開始する。サムバーの一部分をクリックすると、レンジを表す長方形ボックスが表示される。ユーザは、長方形ボックスの上端及び下端を操作して、レンジの開始時刻(RS)及び終了時刻(RE)を設定することができる。長方形ボックス自体もサムバーに沿って動かすことができる。
本発明の一実施形態によれば、自動的に生成されたレンジ(例えば、ユーザ指定基準についてのヒットに基づいて生成されたレンジ)を表す長方形ボックス及びユーザによって指定された手動レンジを表す長方形ボックスは、インターフェース2900によって同時に表示することができる。手動で生成されたレンジと自動的に生成されたレンジとを区別するために、自動レンジを表す長方形ボックスと手動レンジを表す長方形ボックスを表示するのに異なる色又はスタイルを用いることができる。
図29Kは、本発明の一実施形態に従ってマルチメディア文書のうちユーザが見た又は再生した部分が強調されたユーザ・インターフェース2900を示す。代替的実施形態として、マルチメディア文書のうちユーザが見ていない又は再生していない部分が強調されてもよい。図29Kに示すように、ユーザ・インターフェース2900に表示されたマルチメディア文書のうちユーザが見た又は再生した部分を識別するサムバーの一部分上に長方形ボックス2990が描画される。この部分は、小ビデオ・ウィンドウ2904、2908、又は2912で再生された又は視聴されたものでもよく、或いは、大ビデオ・ウィンドウ2984で再生された又は視聴されたものでもよく、或いは、何らかの出力装置を用いて再生された又は視聴されたものでもよい。この実施形態において、格納されたマルチメディア情報のうちユーザに対して出力済みの部分を識別する情報(或いは、格納されたマルチメディア情報のうちユーザに対して出力していない部分を識別する情報)が格納される。本発明のこの機能により、ユーザは、マルチメディア文書のうち、いずれのセクションを既に見たか、及び、ユーザがまだ見ていないのはいずれの部分か、が容易に分かる。既に見た部分を表すボックスは、レンジを表すボックスなどインターフェース2900に表示される他のボックスからそれらを区別するために、特定の色で表示される。
図30Aは、本発明の一実施形態に係る1以上のマルチメディア文書のコンテンツを表示する別の簡略化されたユーザ・インターフェース3000を示す。図30Aに示すように、3つのマルチメディア文書のコンテンツが表示され、3つのサムバー3002、3004、及び3006、及び、3つの小さいビデオ・ウィンドウ3008、3010、及び3012が表示される。これらマルチメディア文書のコンテンツは、単語「Stewart」、「Imclone」、及び「Faksal」を含む検索クエリーについて検索された。サムバーのうち検索クエリーに関連するコンテンツを含む部分がマーカ3014によって識別される。これらヒットに基づいてレンジが形成されており、これらレンジを表す長方形ボックス3016が表示されている。これらの機能については既に説明した。
加えて、ユーザ・インターフェース3000は、サムバー上に表示された様々なレンジについて長方形ボックスによって生成された複数のウェブ・ページ3020−1、3020−2、3020−3、などを含む。本発明の一実施形態によれば、サムバーに表示された各レンジについて、一ウェブ・ページが生成される。図30Aに示すウェブ・ページ(以下、「パレット」ビューと呼ぶ)は、「Palette(パレット)」ボタン3022を選択することによって生成・表示される。したがって、ウェブ・ページのパレットは、様々なレンジについて生成されたウェブ・ページを含む。ウェブ・ページのパレットは、図30Aに示すようなスクロール可能なリストとして表示することができる。ユーザは、パレットに注釈を加えたり、パレットのウェブ・ページへ情報を加えたり、マルチメディア文書の一部に捕捉情報を加えたり、することができる。また、レンジ自体にも注釈を加えることができる。例えば、レンジについての情報を表示するウェブ・ページにコメントを加えることによって、レンジに注釈を加えることができる。
図30Aに示した実施形態において、特定のレンジについての各ウェブ・ページ3020は、オーディオ情報、CCテキスト情報、又は、その特定のレンジについて含まれる他の情報種類のテキスト表現を表すテキスト情報(すなわち、その特定のレンジの時刻RSとREの間に登場した録音されたオーディオ情報又はCCテキスト情報を表すテキスト情報)を有する。また、このウェブ・ページは、その特定のレンジに対応するビデオ情報から抽出された1以上のビデオ・キーフレーム又は画像も含む。これら画像及びテキスト情報は、時間的に同期される又は揃えられる。このウェブ・ページの画像をハイパーテキスト・リンクとし、選択されると、選択された画像に関連付けられた時刻からビデオ情報の再生を開始するようにすることができる。
バーコードは、印刷可能で、ウェブ・ページに印刷された各画像に関連付けることができる。バーコードは、その画像に関連付けられた時刻を表し、バーコード・リーダ又はスキャナを用いてバーコードを走査すると、その画像に関連付けられ、そのバーコードによって表された時刻からビデオ情報が再生される。
各レンジについて、そのレンジを識別する情報及びそのレンジが選択されたマルチメディア情報を識別する情報もそのレンジに対応するウェブ・ページ上に表示することができる。例えば、図30Aに示した実施形態において、各レンジの開始時刻及び終了時刻3018がウェブ・ページ上に表示される。また、レンジを識別する識別子3021も表示される。図30Aのマルチメディア文書がテレビ映像録画に対応するため、一レンジに対応する各ウェブ・ページもそのレンジについての情報をブロードキャストするTVネットワークに関連付けられたアイコン3023を表示する。
各ウェブ・ページにおいて、ユーザ指定基準の存在が強調される。例えば、図30Aに示す実施形態においては、検索クエリーが、単語「Stewart」、「Imclone」、及び「Faksal」を含み、ウェブ・ページでのこれら単語の存在が強調される。太字にする、色を用いる、スタイルを変える、バルーンを用いる、囲む、などの単語を強調する様々な異なる手法も用いることができる。既述のように、検索クエリー単語もサムバーに表示された表現において強調されてもよい。
ウェブ・ページのうち現在選択されているレンジに対応したエリアを強調する又は覆うレンズ3024が表示される。例えば、図30Aに示す実施形態において、サムバー3006においてレンジが選択されたために、ウェブ・ページ3020−4のうちこの選択されたレンジに対応する部分を覆うレンズ3024が表示されている。ウェブ・ページ3020−4のうちレンズ3024によって覆われた部分は、大ウィンドウ3026に表示される。ユーザは、レンズ3024の位置をウェブ・ページ3020−4の長さに沿って変更することができる。ウェブ・ページのうちウィンドウ3026に表示された部分は、それがウェブ・ページ3020−4のうちレンズ3024によって覆われた部分に対応し続けるように、変更される。このように、ユーザは、レンズ3024を用いて、選択されたウェブ・ページのコンテンツをナビゲートすることができる。また、ユーザは、ウィンドウ3026によって提供されたスクロールバーを用いて、ウィンドウ3026に表示されたウェブ・ページをスクロールすることができる。レンズ3024のウェブ・ページ3020−4上での位置は、それがウェブ・ページのうちウィンドウ3026に表示された部分に対応し続けるように、変更される。
ユーザは、マウスなどの入力装置を用いてサムバーにおいて別のレンジをクリックすることによって(すなわち、そのレンジを表す長方形をクリックすることによって)、そのレンジを選ぶことができる。応答として、レンズ3024の位置が変更され、レンズ3024は新たに選択されたレンジに対応するパレット・ビューにおいてウェブ・ページ上に表示される。次いで、パレット・ビューにおいてウェブ・ページのうちレンズ3024によって覆われた部分が、ウィンドウ3026に表示される。例えば、図30Bに示すように、別のレンジ3030がユーザによって選択されている。ユーザは、サムバー3002においてこのレンジに対応する長方形ボックスをクリックすることによってこのレンジを選択することができる。応答として、ウェブ・ページ3020−1のうちレンジ3030に対応する部分を覆うレンズ3024が描画される。ウェブ・ページ3020−1のうちレンズ3024によって覆われた又は強調された部分は、ウィンドウ3016に表示される。
本発明の一実施形態によれば、ユーザは、ウェブ・ページのパレットからあるレンジに対応するウェブ・ページを選択することによって、そのレンジを選択することもできる。ユーザは、マウスなどの入力装置を用いて、そのウェブ・ページをクリックすることによって、ウェブ・ページを選択することができる。応答として、レンズ3024が選択されたウェブ・ページ上に表示される。このパレット・ビューにおけるウェブ・ページのうちレンズ3024によって覆われた部分がウィンドウ3026に表示される。また、この新たに選択されたウェブ・ページに対応するレンジを表す長方形ボックスも、そのレンジが選択されたことを示すために、強調される。
上述のように、本発明の実施形態は、同じタイムライン中に記録された1以上のマルチメディア文書によって格納された情報の表現も、異なるタイムライン中に記録された1以上のマルチメディア文書によって格納された情報の表現も、表示することができる。ユーザは、単語、フレーズ、複数の単語を含む検索クエリー、関心ある話題、などの基準を指定することができ、マルチメディア文書のうちこのユーザ指定基準に関連する又は含む部分がマーカ、レンジを表すボックス、などを用いて強調される。したがって、本発明の実施形態を用いて、複数のマルチメディア文書のコンテンツを比較することができる。
例えば、「Closing Bell」、「60 Minute II」、及び、「Business Center」などの3つの異なるテレビ番組の録画を図29Aに示すように表示し、ユーザ指定基準(例えば、単語、フレーズ、複数の単語を含む検索クエリー、関心ある話題、など)について検索することができる。これら3つの番組の中でユーザ指定基準に関連する又は一致する部分が強調される。このような複数のマルチメディア文書にわたって検索する能力は従来のツールでは提供されていない。さらに、インターフェースによって表示された検索結果に基づいて、ユーザはテレビ番組のユーザ基準に対する関連性を容易に判断することができる。このように、本発明の実施形態を用いて、複数のマルチメディア文書のコンテンツを互いに分析することができる。これら検索結果の視覚化は、これら複数のマルチメディア文書のコンテンツに対する理解を得るために、しばしば有用である。
別の例として、ユーザが「Imclone/Martha Stewart scandal」に関心を持っている場合、ユーザは、「Stewart」、「Imclone」、及び、「Waksal」という単語(又は、このスキャンダルに関する他の単語)を含む検索クエリーを形成することができ、マルチメディア文書の表現の中でユーザ・インターフェースによって表示され、検索クエリー単語を含む部分がマーカ、色などを用いて強調される。また、レンジも、検索ヒットに基づいて形成され、関連するセクションを強調するために、色の付いたボックスを用いてインターフェース上に示される。マルチメディア文書のうちインターフェースにおいて強調された部分を見ることによって、ユーザは、そのスキャンダルに関する情報がそのマルチメディア文書にどのくらい含まれているか及びその関連情報のマルチメディア文書における位置を容易に判断することができる。また、ユーザは、その関連情報のマルチメディア文書における分散も判断することができる。また、複数のマルチメディア文書を検索クエリーについて互いに比較することができる。このように、本発明の実施形態は、複数のマルチメディア文書を分析したいと欲するユーザにとって価値のあるツールを提供する。
インターフェースに表示された(自動的に生成された又は手動で指定された)レンジに対応するウェブ・ページを生成・表示することによって、複数のマルチメディア文書の分析及びレビューは更に容易になる。これらレンジについて生成されたウェブ・ページにより、ユーザは、複数のマルチメディア文書中の関連する部分を抽出し、編成し、凝縮させることができる。
また、本発明の実施形態により、ユーザは、マルチメディア文書の集合を同時に見ることができる。例えば、ユーザは、複数のビデオ録画又はビデオ・クリップのコンテンツを見ることができる。マルチメディア情報の再生を制御するための様々なコントロールが設けられる。マルチメディア文書のうちユーザによって再生された部分を強調することができる。したがって、ユーザは、マルチメディア文書の中で該ユーザが既に見た部分とまだ見ていない部分とを容易に判断することができる。
上述のように、レンジを用いて、複数のオペレーションを実行することができる。これらオペレーションは、例えば、レンジのコンテンツの表現を紙文書上に印刷すること、レンジのコンテンツを保存すること、レンジのコンテンツを伝達すること、レンジに注釈を付けること、などである。また、レンジを(例えばレンジ群に)グループ分けし、それらグループについてオペレーションを実行することもできる。例えば、あるレンジ群のレンジについて、ユーザが設定可能としてもよい何らかの基準に基づいて、ランク付け又は並び替えすることができる。例えば、各レンジのユーザ指定検索基準への関連性に基づいて、レンジがランク付けされてもよい。本発明の一実施形態によれば、ヒット数が多いレンジほど高くランク付けされ、ヒット数が少ないレンジほど低くランク付けされる。レンジをランク付けする及び/又は並び替える他の手法も用いることができる。
(マルチメディア情報の印刷)
上述のように、上記ユーザ・インターフェースによって表示された1以上のマルチメディア文書からのマルチメディア情報を紙媒体上に印刷し、マルチメディア紙文書を作ることができる。したがって、1以上のマルチメディア文書について、マルチメディア紙文書を生成することができる。「紙」又は「紙媒体」という単語は、情報を印刷、筆記、描画、押印、型押などできるあらゆる有形媒体を指すことができる。
本発明の一実施形態によれば、各マルチメディア文書について、そのマルチメディア文書によって格納された記録済情報についての印刷可能表現が生成される。この記録済情報は、オーディオ情報、ビデオ情報、クローズド・キャプション(CC)テキスト情報、スライド情報、ホワイトボード情報、などの様々な種類の情報を格納することができるため、本発明の一実施形態によれば、記録済情報の印刷可能表現は、1以上の情報種類の印刷可能表現を含み得る。記録済情報を構成する1以上の情報種類についての印刷可能表現を含み得る記録済情報について印刷可能表現を紙媒体上に印刷して、マルチメディア紙文書を生成することができる。マルチメディア情報について印刷可能表現を生成するのには様々な異なる手法を用いることができる。印刷可能表現を生成し、この印刷可能表現を紙媒体上に印刷してマルチメディア紙文書を作る例は、2001年11月19日に出願され、その全内容がここに参考文献として組み込まれる、米国特許出願第10/001,895号に記載されている。
次いで、印刷可能表現は、紙媒体上に印刷することができる。「印刷」という単語は、印刷、筆記、描画、押印、型押、などを含む。本発明の一実施形態によれば、印刷可能表現は、印刷可能バージョンを紙媒体上に印刷して紙文書を生成するように設定された紙文書出力装置(プリンタ、コピー機、など)に伝達される。印刷可能表現を紙媒体上に印刷するのには様々な異なる手法を用いることができる。本発明の一実施形態によれば、2001年11月19日に出願され、その全内容がここに参考文献として組み込まれる、米国特許出願第10/001,895号に記載された教えに従って、印刷が実行される。
本発明の他の実施形態においては、マルチメディア文書のコンテンツ全体についてマルチメディア紙文書を生成する代わりに、グラフィカル・ユーザ・インターフェースに表示されたレンジについてのみマルチメディア紙文書が生成される。この実施形態において、レンジに対応したマルチメディア情報について印刷可能表現が生成され、次いで、その印刷可能表現が紙媒体上に印刷される。レンジに対応するマルチメディア情報は1以上の種類の情報を含み得るため、レンジに対応するマルチメディア情報の印刷可能表現は、1以上の種類の印刷可能表現を含み得る。レンジに対応したマルチメディア情報について印刷可能表現を生成するのには様々な異なる手法を用いることができる。例えば、2001年11月19日に出願された米国特許出願第10/001,895号に記載されたものを用いることができる。
図31は、本発明の一実施形態に従って1以上のマルチメディア文書のコンテンツ又はレンジに対応するコンテンツを印刷するのに用いることが可能な簡略化されたユーザ・インターフェース3100を示す。図31に示すインターフェース3100は、本発明の一実施形態の単なる例示であり、本発明の範囲を制限するものではない。当業者には、他の変形例、修正例、及び代替例が明らかであろう。グラフィカル・ユーザ・インターフェース3100は、上記インターフェースによって提供されるコマンド又はボタンを選択することによって呼び出すことができる。
図31に示すように、ユーザは、チェックボックス3101を洗濯することによって、レンジに対応する情報のみが印刷されるように指定することができる。チェックボックス3101が選択されない場合、それは、ロードされている1以上のマルチメディア文書のすべてのコンテンツが印刷されることを意味する。ユーザは、チェックボックス3102を選択することによって、表示されているレンジすべてに対応する情報が印刷されるべきであることを指示することができる。あるいは、ユーザは、入力ボックス3104にレンジ識別子を入力することによって、印刷されるべきレンジを具体的に特定することができる。例えば、レンジに割り当てられた番号によってレンジが識別される場合、ユーザは印刷されるべきレンジに対応する番号をボックス3104に入力すればよい。レンジ識別子が連続番号であれば、レンジ・リストを指定することができる。
「Print(印刷)」ボタン3106を選択すると、レンジのコンテンツ又はロードされたマルチメディア文書のコンテンツの印刷が開始される。ユーザ・インターフェース3100は、「Cancel(キャンセル)」ボタン3108を選択することによってキャンセルすることができる。
レンジに対応する情報又はロードされたマルチメディア文書からの情報の印刷方法を制御する複数のオプションが設けられる。例えば、情報を紙媒体上に印刷する際のフォーマット・スタイルを選択することができる。図31に示す実施形態において、ユーザは、スタイルに対応するチェックボックスを選択することによって、3つの異なるスタイル3110の中の1つを選択することができる。図32A、32B、及び32Cは、本発明の一実施形態に係る図31に示されたインターフェース31から選択可能な3つのスタイルに従って印刷されたページを示す。図32Aは、「Style 1(スタイル1)」に従って印刷されたページを示す。図32Bは、「Style 2(スタイル2)」に従って印刷されたページを示す。図32Cは、「Style 3(スタイル3)」に従って印刷されたページを示す。本発明の代替的実施形態として、様々な他のスタイルも用いることができる。
また、ユーザは、ビデオ情報から抽出されたキーフレームを印刷するのに異なるスタイル3112を選択することができる。例えば、図31に示す実施形態において、ユーザは、各バーコードにつき1つのキーフレームが印刷される(或いは、各印刷されたキーフレームにつき1つのバーコードが印刷される)スタイルか、又は、各バーコードにつき複数の(例えば4つの)キーフレームが印刷されるスタイルかを選択することができる。図33A及び33Bは、図31に示すインターフェース31から選択可能な2つのキーフレーム・スタイルに従って印刷されたページを示す。図33Aは、バーコードごとに1つのキーフレームが印刷されたページを示す。図33Bは、バーコードごとに4つのキーフレームが印刷されたページを示す。本発明の他の実施形態として、他のスタイルも用いることができる。
プリンタ(又は、コピー機やファクシミリ機などのマルチメディア情報の印刷表現を生成可能なあらゆる他の紙文書出力装置)のリスト3116が表示される。ユーザは、リスト3116から1以上のプリンタを選択することによって、マルチメディア情報を紙媒体上に印刷することができる。ユーザは、「Send to Copier(コピー機へ送信)」チェックボックス3113を選択し、使用されるコピー機をボックス3114で特定することによって、印刷(又はコピー)を実行する具体的なコピー機を選択することができる。
本発明の一実施形態によれば、選択されたレンジ又はマルチメディア文書に対応するマルチメディア情報の印刷可能表現は、メモリに格納することができる。例えば、印刷可能表現は、PDFファイルとして、格納することができる。入力ボックス3118でファイル名を指定することができる。
図31に示した本発明の一実施形態によれば、ユーザは、印刷可能表現が紙媒体上に印刷される際、印刷可能表現のうちユーザ指定基準を満たす又は一致する単語又はフレーズを含むセクションを強調させるか否かを指示するオプションを有する。ユーザは、チェックボックス3120を選択することによって、このオプションを起動させることができる。このオプションが選択されると、マルチメディア文書又は関心ある話題に関連する又はユーザによって指定された単語又はフレーズ或いは検索クエリー単語に一致する選択されたレンジに対応するマルチメディア情報の単語又はフレーズが、紙に印刷される際、強調される。紙上で単語又はフレーズを強調するのには様々な異なる手法を用いることができる。
チェックボックス3122を選択することによって、バーコードを印刷されたテキスト情報に関連付けるテキスト・マーカを印刷することができる。
上述のように、ユーザは、チェックボックス3101を選択することによって、レンジに対応する情報のみが印刷されるべきであることを指定できる。所望であれば、各レンジについて、ユーザは、入力ボックス3126において、そのレンジの先頭及び終端に加えられるバッファ時間期間を指定することができる。例えば、バッファ時間期間が5秒に指定された場合、各レンジについて、レンジの先頭の前に5秒に対応する情報が、レンジの終端の後に5秒に対応する情報が、レンジに対応した情報と共に印刷される。
また、本発明の実施形態は、(レンジに対応する情報についての、又は、マルチメディア文書コンテンツに対応する情報についての)印刷された情報に対するカバーシートを印刷することもできる。ユーザは、チェックボックス3128を選択することによって、レンジ又はマルチメディア文書のコンテンツを印刷することに加えて、カバーシートが診察されるべきであることを指定することができる。このカバーシートは、マルチメディア文書又はレンジの印刷されたコンテンツの概要又は要約を提供することができる。
カバーシートを印刷するのには様々な異なる手法を用いることができる。カバーシート用には様々なスタイル3130を選択することができる。図34A、34B、及び34Cは、本発明の一実施形態に従って印刷することができるカバーシートの例を示す。カバーシートを生成・印刷する手法の例は、2001年11月19日に出願され、その全内容がここに参考文献として組み込まれる、米国特許出願第10/001,895号に記載されている。また、様々なカバーシートの例も、2001年11月19日に出願された米国特許出願第10/001,895号に記載されている。
カバーシートは複数の異なる目的のために用いることができる。既述のように、カバーシートは、マルチメディア文書又はレンジの印刷されたコンテンツの概要又は要約を提供する。また、カバーシートは、ストレージ装置上に格納された情報の要約も提供することができる。例えば、CD上に格納されたマルチメディア情報について、そのCDのコンテンツに基づいて、そのCDのコンテンツがどんなものであるかを要約したカバーシートを生成することができる。例えば、図34Cに示すように、カバーシートは、CDを格納し得る宝石箱用のカバーとして生成・使用される。図34Cに示す実施形態において、CD上に印刷されたバーコードを用いて、そのCDに格納されたマルチメディア情報へアクセスしたり、インデックスを付けたりすることができる。カバーシート上に印刷されたバーコードを用いてマルチメディア情報へアクセスする手法は、2001年11月19日に出願された米国特許出願第10/001,895号に記載されている。また、カバーシートの様々な他の使用法も本発明の範囲内である。
また、ユーザは、図31のチェックボックス3132を選択することによって、レンジ又はマルチメディア文書のコンテンツを印刷せず、カバーシートのみを印刷することを選択することができる。これは、例えば、カバーシートが、ストレージ装置上に格納された情報へのインデックスを提供するために生成されたときに、有用である。
図34A、34B、及び34Cに示したカバーシートは、それぞれ、カバーシートが生成されたマルチメディア情報からサンプリングされた(例えば、N秒ごとに均一にサンプリングされた)限定された数のキーフレームを表示する。サンプリング間隔はユーザが指定することができる。例えば、図31に示す実施形態において、ユーザは、入力ボックス3134にサンプリング間隔を入力することができる。
また、ユーザは、印刷画質を制御することもできる。図31に示した実施形態において、ユーザは、3つのオプション3136の中から1つを選択することができる。
図35A、35B、35C、35D、及び35Eは、本発明の一実施形態に係るレンジについて印刷された紙文書を示す。上述のように、レンジは、自動的に生成されたものであってもよく、或いは、ユーザによって手動で指定されたものであってもよい。レンジに対応する情報は、1以上のマルチメディア文書に格納することができる。図25A、35B、35C、35D、及び35Eに示したページは、本発明の一実施形態の単なる例示であり、本発明の範囲を制限するものではない。当業者には、他の変形例、修正例、及び代替例が明らかであろう。
図35A、35B、35C、35D、及び35Eに示す文書は、3つのマルチメディア文書から選択されたレンジについて印刷される。これら3つのマルチメディア文書は、テレビ番組の録画であり、すなわち、CNN/fnチャンネル(チャンネル358)から取り込まれた番組「Money and Markets」、CNBCチャンネル(チャンネル355)から取り込まれた番組「Closing Bell」、及び、CNN/fnチャンネル(チャンネル358)から取り込まれた番組「Street Sweep」、である。
図35A〜Eに示すように、3つの録画された番組のそのレンジに関するコンテンツは、連続して印刷される。「Money and Markets」番組録画マルチメディア文書からのレンジのコンテンツは、図35A及び35Bに示すページ上に印刷され、「Closing Bell」番組録画マルチメディア文書からのレンジのコンテンツは、図35C及び35Dに示すページ上に印刷され、「Street Sweep」番組録画マルチメディア文書からのレンジのコンテンツは、図35Eに示すページ上に印刷される。
レンジが選択されたマルチメディア文書を識別する情報3500は、図35A、35C、及び35Eに示すように、印刷される。図35A〜Eに示す実施形態において、各マルチメディア文書を識別する情報は、テレビ番組の名前、その番組が録画されたチャンネルを識別する情報、録画の長さ、及び、録画日時、などを含む。また、マルチメディア文書に関連する他の種類の情報も印刷されてもよい。
各レンジの先頭は、バー3502によって示される。したがって、2つのレンジのコンテンツが「Money and Markets」マルチメディア文書から印刷されており、「Closing Bell」マルチメディア文書から4つのレンジのコンテンツが印刷されており、「Street Sweep」マルチメディア文書から3つのレンジのコンテンツが印刷されている。また、各バー3502には、レンジに関連した情報3504も印刷される。図35A〜Eに示す実施形態において、レンジに関連する情報は、そのレンジについての識別子、そのレンジについての開始時刻(RS)及び終了時刻(RE)、及び、そのレンジのスパン、などを含む。各レンジに関連付けられた他の種類の情報も印刷されてもよい。
各レンジについて印刷される情報には、テキスト情報3506と、1以上の画像3508とが含まれる。テキスト情報は、レンジに対応するオーディオ情報(或いは、CCテキスト、又は、そのマルチメディア情報に含まれる他の種類の情報のテキスト表現)の印刷可能表現である。印刷されたテキスト情報に登場し、関心ある話題に関連する単語又はフレーズ、或いは、ユーザが指定した単語又はフレーズ又は検索クエリーに一致する単語又はフレーズ、の存在が強調される。例えば、図35A〜Eに示す実施形態について、ユーザは、「Stewart」、「Imclone」、及び、「Waksal」という単語を含む検索クエリーを定義している。したがって、これら検索クエリー単語のすべての存在が、様々なレンジについての印刷されたテキスト・セクションにおいて、(下線を用いて)強調される。テキストを太字にする、フォント又はサイズを変更する、テキストをイタリックにする、などの単語を強調するための様々な異なる手法も用いることができる。
各レンジについて印刷された画像3508は、そのレンジについてビデオ情報から抽出された画像を表す。レンジのビデオ情報からビデオ・キーフレームを抽出し、印刷するキーフレームを識別するのには複数の様々な手法を用いることができる。これら手法の例は、既に述べたと共に、2001年11月19日に出願された米国特許出願第10/001,895号にも記載されている。情報を印刷するのには様々な異なるスタイルを用いることができる。例えば、ユーザは、図31に示すスタイル3110及び3112から選ぶことができる。
また、バーコード3510も各レンジについて印刷される。図35A〜Eに示した実施形態において、バーコード3510が各画像3508について印刷され、画像の下に置かれる。バーコードを印刷するのには様々な異なるスタイルを用いることができる。例えば、図31に示す実施形態では、バーコードを印刷するのに2つの異なるスタイル3112が用意され、第一のスタイルは、(図35A〜Eに示すように)キーフレームごとに1つのバーコードが印刷されるものであり、第二のスタイルは、4キーフレームごとに1つのバーコードが印刷されるものである。
図35A〜Eに示す本発明の一実施形態によれば、画像の下に印刷される各バーコードは、その画像に関連付けられた時刻を表す。バーコード3510は、その紙文書の読者に、その紙文書を用いてマルチメディア情報へアクセスするメカニズムを提供する。本発明の一実施形態によれば、スキャナ、バーコード・リーダなどの装置を用いたバーコードの走査により、そのバーコードに対応するマルチメディア文書からのマルチメディア情報の再生がそのバーコードによって表された時刻から開始される。この再生は、任意の出力装置上で行うことができる。例えば、情報は、コンピュータ画面上に表示された上述のGUIの一ウィンドウで再生されてもよい。
また、各バーコード3510は、レンジについての開始時刻及び終了時刻を識別することもできる。バーコード・リーダ又はスキャナを用いてこのようなバーコードを走査することによって、そのレンジに対応する情報が再生される。また、各バーコード3510は、レンジを識別するラベル又は識別子も表すことができる。この実施形態において、このようなバーコードを走査すると、走査されたバーコードによって表されたレンジ識別子を用いて、そのレンジの開始時刻及び終了時刻を決定することができ、次いで、そのレンジに対応する情報を再生することができる。
このように、図35A〜Eに示した文書は、格納されたマルチメディア情報にアクセスする紙インターフェースを提供する。マルチメディア情報にアクセスするのに紙インターフェースを用いることに関連する更なる情報は、2001年11月19日に出願された米国特許出願第10/001,895号に記載されている。また、本発明の代替的実施形態として、透かし、象形文字(glyph)、テキスト識別子、などの他のユーザが選択可能な識別子もパーコードの代わりに用いることができる。ユーザが選択可能な識別子は、紙文書の全体的な読み易さを低減させないように又は影響を与えないように印刷されるかもしれない。
また、図35A〜Eに示す紙文書の各紙ページの下端にバーコード群3512が印刷される。バーコード群3512により、ユーザは、紙文書を用いて、マルチメディア情報の再生を開始・制御することができる。本発明の一実施形態によれば、各バーコードはマルチメディア情報の再生を制御するコマンドに対応している。図35A〜Eに図示した実施形態においては、5つのコントロール・バーコード3512が印刷される。コントロール・バーコード3512−1により、ユーザは、再生させたり、再生を一時停止したりすることができる。例えば、ユーザは、バーコード3510を走査し、それからバーコード3512−1を走査することによって、操作されたバーコード3510によって表される時刻から情報の再生を開始させることができる。ユーザは、バーコード3512−1を再走査することによって、再生を一時停止させることができる。ユーザは、ボーコード3512−3を選択することによって、巻き戻し操作を実行することができる。バーコード3512−4を選択することによって、再生をエンハンスト・モードで実行することができる。エンハンスト・モードは、追加的視聴コントロール及び情報(例えば、専門のタイムラインが表示される、PDA上のオンスクリーン・ボタンを用いて再生中の情報をナビゲートできるようにコントロールが提供される、など)を提供する代替的GUIである。エンハンスト・モード表示に関する更なる詳細は、2002年6月17日に出願され、その全内容がここに参考文献として組み込まれる、米国特許出願第10/174,522号に記載されている。バーコード3512−5を選択することによって、具体的なオペレーション・モードを入力することができる。本発明の代替的実施形態として、様々な他のオペレーション用のバーコードも設けることができる。情報の再生を制御するバーコードに関する情報は、2001年11月19日に出願された米国特許出願第10/001,895号に記載されている。
本発明の具体的な実施形態について説明したが、様々な修正例、代替例、代替的構成、及び、等価物も本発明の範囲内に含まれる。説明してきた本発明は、特定の具体的なデータ処理環境内での作動に限定されるものではなく、複数のデータ処理環境内で自由に作動できる。加えて、本発明は特定の一連のやりとり及び工程を用いて説明したが、当業者には明らかなように、本発明の範囲は記載した一連のやりとり及び工程に限定されない。例えば、本発明の教えるところに従ってGUIを生成する処理は、サーバ104によって実行されてもよく、クライアント102によって実行されてもよく、別のコンピュータによって実行されてもよく、或いは、接続された様々なコンピュータ・システムによって実行されてもよい。
さらに、本発明はハードウェアとソフトウェアの特定の組み合わせを用いて説明したが、ハードウェアとソフトウェアの他の組み合わせも本発明の範囲内であることは明らかである。本発明は、ハードウェアのみで実施されてもよく、ソフトウェアのみで実施されてもよく、或いは、それらの組み合わせを用いて実施されてもよい。
したがって、本明細書及び図面は、限定的な意味ではなく、例示と考えられるべきである。しかし、請求項記載の本発明のより広義な意図及び範囲を逸脱することなく、追加、置換、削除、及び、他の修理及び変更を行うことが可能であることは明らかである。