JP2006244002A

JP2006244002A - コンテンツ再生装置およびコンテンツ再生方法

Info

Publication number: JP2006244002A
Application number: JP2005057010A
Authority: JP
Inventors: Yasushi Miyajima; 靖宮島; Masamichi Asukai; 正道飛鳥井; Mitsuru Takehara; 充竹原; Takatoshi Nakamura; 隆俊中村; Yoichiro Sako; 曜一郎佐古; Toshiro Terauchi; 俊郎寺内; Makoto Inoue; 真井上; Katsuaki Yamashita; 功誠山下; Toru Sasaki; 徹佐々木; Masashi Matsuda; 將史松田
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 2005-03-02
Filing date: 2005-03-02
Publication date: 2006-09-14
Also published as: EP1855473A1; US20120155832A1; EP1855473A4; CN100589540C; WO2006106596A1; EP1855473B1; KR20070106537A; DE602006019829D1; US8868585B2; CN101133638A

Abstract

【課題】利用可能とされた、大量の音楽や話音声などの音声データと静止画像や動画像の画像データとを効率よくかつ有効に活用できるようにする。
【解決手段】素材データベース２１に蓄積されている音声データを再生する場合、制御部１０は、当該再生対象の音声データに付加されているメタデータを素材データベースから取得し、このメタデータをもとに、画像データのメタデータを参照して、当該音声データに関連性の高い画像データを検索し、制御部１０の機能によって、音声デコーダ３２などの音声の再生系と、画像デコーダ３１などの画像の再生系とを制御し、再生対象の音声データと、検索した画像データとを関連付けて再生する。
【選択図】図１

Description

この発明は、例えば、音声データや静止画像や動画像の画像データを再生する装置および方法に関する。

種々の記録媒体を通じて、あるいは、インターネットなどのネットワークを通じて音楽（楽曲）データなどの様々な音声データが提供され、個人のパーソナルコンピュータなどの情報処理装置に蓄積されて利用されるようになってきている。また、記録媒体やネットワークを通じて提供される他、デジタルスチルカメラやデジタルビデオカメラなどを通じて撮影した静止画像や動画像の画像データも個人のパーソナルコンピュータなどの情報処理装置に蓄積されて利用されるようになってきている。

このように、個人のパーソナルコンピュータなどの情報処理装置に蓄積される音声データや画像データは近年飛躍的に増加している。また、インターネット上にもさまざまな音や画像のコンテンツが数多く利用可能にされている。しかしながら、同じ情報処理装置からアクセス可能なデータであるにもかかわらず、別々の経路で、あるいは、別々のタイミングで取得された音声データや画像データは、そのそれぞれが完全に独立したデータとして扱われるのが一般的である。

すなわち、テレビ放送番組や映画コンテンツなど、音声データと動画像データとが、同期を取って再生されるいわゆるＡＶ（Audio/Digital）データを除けば、目的とする音声データを再生する場合には、その目的とする音声データしか再生できないし、目的とする画像データを再生する場合には、その目的とする画像データしか再生できないのが一般的である。

近年においては、例えば後に記す特許文献１に開示されているように、サムネイル表示される複数の画像の中の任意の画像を任意の順序で再生するようにするいわゆるスライドショー表示（スライドショー再生）を行うことが可能な装置が提案されている。また、いわゆるスライドショー再生時において、ユーザーが指示することにより明示的に再生する音声データを指定してＢＧＭを付けるようにすることも考えられている。
特開２００３−２８８０６８号公報

ところで、いわゆるスライドショー再生を行うシステムにおいては、予め決められたファイルに記録された複数の静止画像データやユーザーによって指定された複数の静止画像データを再生対象とし、また、予め決められたファイルに記録された音声データやユーザーによって指定された音声データを再生対象とするのが一般的である。

しかし、上述もしたように、パーソナルコンピュータなどの情報処理装置には、大量の音声データや画像データが蓄積するようにされており、また、インターネットなどのネットワークを通じて大量の音声データや画像データの利用も可能にされている。このように利用可能な大量の音声データや画像データを効率よく、かつ、効果的に利用できるようにしたいとする要求がある。

具体的には、再生する音楽にあった静止画像を選択して表示したり、順次に表示する静止画像に最適なＢＧＭ（Back Grand Music）を付けるようにしたりするなどのことが、簡単かつ確実に行うことができれば、蓄積されている音楽データや画像データを有効に、かつ、効果的に活用することができる。

以上のことにかんがみ、この発明は、利用可能とされた音楽や話音声などの音声データと静止画像や動画像の画像データとを効率よく、有効かつ効果的に活用できるようにする装置、方法を提供することを目的とする。

上記課題を解決するため、請求項１に記載の発明のコンテンツ再生装置は、
再生する音声データに付加されたメタデータを取得する取得手段と、
前記取得手段により取得されたメタデータをもとに、静止画像あるいは動画像の画像データに対して付加されているメタデータを参照し、前記音声データと関連性の高い画像データを検索する検索手段と、
前記音声データを再生する音声再生手段と、
前記検索手段により検索された前記画像データを再生する画像再生手段と、
再生される音声と画像とを関連付けて再生するように前記音声再生手段と前記画像再生手段とを制御する制御手段と
を備えることを特徴とする。

この請求項１に記載のコンテンツ再生装置によれば、再生対象の音声データに付加されているメタデータが、取得手段によって取得され、このメタデータをもとに、画像データに付加されているメタデータが参照されて、当該音声データに対して関連性の高い画像データが検索手段によって検索される。そして、制御手段によって、音声再生手段と画像再生手段とが制御され、再生対象の音声データと、検索手段によって検索された画像データとが、関連付けられて再生される。

これにより、再生する音声データに関連する画像データをユーザーがいちいち探して選択するなどの手間や時間をかけることなく、再生対象の音声データに関連する画像データを自動的に検索して、これを目的とする音声データの再生に対応させて再生することができるようにされる。したがって、利用可能とされた大量の音楽や話音声などの音声データと、静止画像や動画像の画像データとを効率よくかつ有効に活用することができるようにされる。

また、請求項２に記載の発明のコンテンツ再生装置は、
再生する静止画像あるいは動画像の画像データに付加されたメタデータを取得する取得手段と、
前記取得手段により取得されたメタデータをもとに、音声データに対して付加されているメタデータを参照し、再生する前記画像データと関連性の高い音声データを検索する検索手段と、
前記画像データを再生する画像再生手段と、
前記検索手段により検索された前記音声データを再生する音声再生手段と、
再生される画像と音声とを関連付けて再生するように前記画像再生手段と前記音声再生手段とを制御する制御手段と
を備えることを特徴とする。

この請求項２に記載のコンテンツ再生装置によれば、再生対象の画像データに付加されているメタデータが、取得手段によって取得され、このメタデータをもとに、音声データに付加されているメタデータが参照されて、当該画像データに対して関連性の高い音声データが検索手段によって検索される。そして、制御手段によって、画像再生手段と音声再生手段とが制御され、再生対象の画像データと、検索手段によって検索された音声データとが、関連付けられて再生される。

これにより、再生する画像データに関連する音声データをユーザーがいちいち探して選択するなどの手間や時間を掛けることなく、再生対象の画像データに関連する音声データを自動的に検索して、これを目的とする画像データの再生に対応させて再生することができるようにされる。したがって、利用可能とされた静止画像や動画像の画像データと、大量の音楽や話音声などの音声データとを効率よくかつ有効に活用することができるようにされる。

この発明によれば、ユーザーが手間や時間を掛けることなく、利用可能とされた、大量の音楽や話音声などの音声データと静止画像や動画像の画像データとを効率よくかつ有効に活用できる。

以下、図を参照しながら、この発明による装置、方法の一実施の形態について説明する。以下に説明する実施の形態においては、この発明による装置、方法を、例えば、パーソナルコンピュータ、ノート型パーソナルコンピュータ、携帯電話端末、携帯型情報端末等の装置であって、音声データと画像データの再生機能を備えた装置（以下、コンテンツ再生装置という。）に適用した場合を例にして説明する。

そして、以下に説明するこの実施の形態のコンテンツ再生装置は、音声データ、写真データ（静止画像データ）、動画像データに、そのデータの作成された年月日、地域、自分との関連度、内容詳細などに関するメタデータを付加しておき、これらのメタデータを利用することによって、ユーザーの手を煩わせることなく、音楽データの再生時に自動的にその音楽の流行したときの自分が撮影した写真、自分の写っている写真、時事写真などを表示することができるものである。

また、これとは逆に、静止画像データをいわゆるスライドショーのように表示するなど、静止画像データを再生する場合、あるいは、動画像データを再生する場合に、ユーザーの手を煩わせることなく、再生対象の画像データに合った音楽の音楽データを自動的に選択して再生し、これをＢＧＭとして用いるようにすることができるものである。

なお、音声データや画像データに付加されるメタデータは、これが付加された音声データや画像データなどの主データの属性や意味内容を示すデータであって、本来、その主データを管理するために付加されるものである。

［コンテンツ再生装置について］
図１は、この発明による装置、方法の一実施の形態が適用されたこの実施の形態のコンテンツ再生装置を説明するためのブロック図である。図１に示すように、この実施の形態のコンテンツ再生装置は、制御部１０、素材データベース２１、類義語辞書２２、ネットワークインターフェース（以下、ネットワークＩ／Ｆと略称する。）２３、外部インターフェース（以下、外部Ｉ／Ｆと略称する。）２４、外部入出力端子２５、画像デコーダ３１、音声デコーダ３２、映像Ｄ／Ａ変換器４１、ディスプレイ４２、音声Ｄ／Ａ（Digital/Analog）変換器５１、音声アンプ５２、スピーカ５３、カレンダー時計回路（以下、時計回路という。）６１、キー操作部６２を備えたものである。

制御部１０は、この実施の形態のコンテンツ再生装置の各部を制御するものであり、図１に示すように、ＣＰＵ（Central Processing Unit）１１と、ＲＯＭ（Read Only Memory）１２と、ＲＡＭ（Random Access Memory）１３とが、ＣＰＵバス１４を通じて接続されて形成されたマイクロコンピュータである。

ここで、ＣＰＵ１１は、制御の主体となるものであり、プログラムを実行して種々の演算を行うことにより、各部に供給する制御信号を形成し、これを目的とする部分に供給するものである。ＲＯＭ１２は、ＣＰＵ１１において実行するプログラムや処理に必要になる種々のデータを記憶保持するものである。ＲＡＭ１３は、処理の途中結果を一時記憶するなど、主に作業領域（ワークエリア）として用いられるものである。

素材データベース２１は、比較的に大容量の記録媒体を備え、このコンテンツ再生装置において再生する音楽や話音声などの音声データ（音声素材）やこれに付随するメタデータ、静止画像や動画像などの画像データ（画像素材）やこれに付随するメタデータなどを記憶保持するものである。

素材データベース２１において用いられる記録媒体としては、例えば、ＣＤやＤＶＤなどの光ディスク、ＭＤ（Mini Disc（登録商標））などの光磁気ディスク、半導体メモリー、ハードディスクなどの磁気ディスクなど種々のものがあるが、この実施の形態において素材データベース２１は、ハードディスクが用いられたものとして説明する。すなわち、素材データベース２１は、ハードディスクを備え、これに上述したような種々のデータを記録し、また、記録したデータを読み出すことが可能なハードディスクドライブに相当する。

類義語辞書２２は、素材データベース２１と同様に、比較的に大容量の記録媒体を備え、類義語辞書データを記憶保持するものである。類義語辞書２２において用いられる記録媒体としては、素材データベース２１の場合と同様に、光ディスク、光磁気ディスク、半導体メモリー、半導体メモリー、ハードディスクなどの種々のものが利用可能であるが、この実施の形態においては、類義語辞書２２もまたハードディスクが用いられ、ハードディスクドライブとしての機能を有するものである。

なお、この実施の形態においては、説明を簡単にするため、図１に示したように、素材データベース２１と類義語辞書２２とは、異なるハードディスク上に記録されるものとして表したが、それらを記憶領域を変えて同一のハードディスク上に形成するようにすることももちろん可能である。また、素材データベース２１はハードディスクドライブに形成し、類義語辞書は、半導体メモリーやＣＤ−ＲＯＭなどの他の記録媒体に形成したものを用いるようにすることが可能である。この場合、類義語辞書２２は、半導体メモリードライブやＣＤドライブに相当することになる。

ネットワークＩ／Ｆ２３は、この実施の形態においてはインターネット１００に接続して、インターネット上のサーバ装置等との間でデータの送受を実現するようにするものである。したがって、この実施の形態のコンテンツ再生装置は、ネットワークＩ／Ｆ２３、インターネット１００を通じて、インターネット１００上に接続された素材サーバ１０１などにアクセスし、種々の音声データや画像データの提供を受けて再生したり、また提供を受けた音声データや画像データを素材データベース２１に登録したりすることができるようにしている。

すなわち、この実施の形態のコンテンツ再生装置は、ローカルの素材データベース２１だけでなく、インターネットなどのネットワークを経由して第三者が用意した写真などの静止画像データ、動画像データや音楽データなどの素材についても取得して再生の対象とすることができる。

外部Ｉ／Ｆ２４は、例えば、外部に設けられたパーソナルコンピュータやコンテンツ再生装置との間に通信路を形成し、通信を行うためのものであり、外部入出力端子２５は、外部に設けられた機器との接続を可能にするためのものである。これにより、外部入出力端子２５に接続された外部の機器に対してデータを提供したり、あるいは、必要なデータの提供を受けて利用したりするこことができるようにしている。

また、画像デコーダ３１は、再生しようとする画像データの圧縮解凍処理を行って、データ圧縮前の元の画像データを復元するなどして、再生用の画像データを形成するものである。画像デコーダ３１においてデコード処理された画像データは、Ｄ／Ａ変換器４１に供給され、ここでアナログ画像信号に変換された後、ディスプレイ４２に供給され、再生対象の画像データに応じた画像がディスプレイ４２の表示画面に表示される。

なお、ディスプレイ４２は、例えば、ＬＣＤ（Liquid Crystal Display）、ＰＤＰ（Plasma Display Panel）、有機ＥＬ（Electro Luminescence）ディスプレイ、ＣＲＴ（Cathode-Ray Tube）等の表示素子を備えた画像表示装置部であり、この実施の形態のコンテンツ再生装置においては、例えばＬＣＤが用いられたものである。

音声デコーダ３２は、再生しようとする音声データの圧縮解凍処理行って、データ圧縮前の元の音声データを復元するなどして、再生用の音声データを形成するものである。音声デコーダ３２においてデコード処理された音声データは、Ｄ／Ａ変換器５１に供給され、ここでアナログ音声信号に変換された後、音声アンプ５２を通じてスピーカ５３に供給され、再生対象の音声データに応じた音声がスピーカ５３から放音される。

なお、上述した画像デコーダ３１や音声デコーダ３２の機能は、制御部１０において実行するソフトウェアによって実現するように構成することも可能である。

時計回路６１は、現在年月日、現在曜日、現在時刻を提供するものであり、詳しくは後述もするが、現在の日時と音声データや画像データなどのコンテンツデータに付加されているメタデータが有する日時に関する情報との差分日数を算出するなどのために用いることができるようにされている。

また、キー操作６２は、例えば、数字キーや各種の機能キーなどの多数の操作キーを備え、ユーザーからの指示入力を受け付けて、これに応じた電気信号を制御部１０に供給することができるものである。これにより制御部１０は、ユーザーからの指示入力に応じて各部を制御することができるようにされる。

なお、ディスプレイ４２の表示画面にタッチパネルを設けると共に、タッチパネル上のユーザーの指などの接触位置をデータに変換する座標変換回路を設けることによって、キー操作部６２と同様の機能を実現するようにしたり、例えばマウスなどと呼ばれるポインティングデバイスを用いて、キー操作部６２と同様の機能を実現するようにしたりすることも可能である。

そして、図１を用いて上述した構成を有するこの実施の形態のコンテンツ再生装置は、インターネット１００、ネットワークＩ／Ｆ２３を通じて素材サーバ１０１から取得した音声データ、静止画像データ、動画像データなどのコンテンツデータや、入出力端子２５、外部Ｉ／Ｆ２４を通じて外部機器から取得した音声データ、静止画像データ、動画像データなどのコンテンツデータを素材データベース２１に蓄積する。

そして、キー操作部６２を通じて受け付けるユーザーから指示入力に応じたコンテンツデータを素材データベース２１から読み出し、当該コンテンツデータが静止画像データや動画像データである場合には、画像デコーダ３１、Ｄ／Ａ変換器４１、ディスプレイ４２を通じて再生し、当該コンテンツが音声データである場合には、音声デコーダ３２、Ａ／Ｄ変換器５１、音声アンプ５２、スピーカ５３を通じて再生する。

また、詳しくは後述もするように、利用可能な音声データ、静止画像データ、動画像データなどのコンテンツデータには、種々のメタデータが付加されている。このため、この実施の形態のコンテンツ再生装置は、再生可能なコンテンツデータに付加されているメタデータを利用することにより、音声データを再生する場合にその音声データに関連のある画像データを検索して抽出し、これを音声データの再生に並行して再生するようにしたり、画像データを再生する場合にその画像データに関連のある音声データを検索して抽出し、これを画像データの再生に並行して再生するようにしたりすることができるようにしている。

例えば、音声データの再生時には、その再生される音声に関連のある静止画像データや動画像データを素材データベース２１やインターネット１００上の素材サーバ１０１や外部Ｉ／Ｆ２４を通じて接続される外部機器の記録媒体から自動的に検索して表示することができるようにしている。また、静止画像データや動画像データの再生時において、その再生される画像データに関連のある音声データを素材データベース２１やインターネット１００上の素材サーバ１０１や外部Ｉ／Ｆ２４を通じて接続される外部機器の記録媒体から自動的に検索して再生することもできるようにしている。

ここで行なわれるコンテンツの検索は、各コンテンツデータに付加されているメタデータに基づいて行なわれるが、既に付加されているメタデータだけでなく、類義語辞書２２を用いることによって、メタデータに応じた類義語をも用いて、画像データや音声データの検索を行うことができるようにしている。

なお、各コンテンツデータに付加されているメタデータは、予め付加されている場合には、コンテンツデータと共に取得することが可能であるし、また、付加されていない場合には、このコンテンツ再生装置等を通じてユーザーがメタデータを入力することによって付加することもできるようにしている。

また、コンテンツデータとは別個に、目的とするコンテンツデータに対して付加すべきメタデータを外部装置やインターネット１００上のメタデータサーバなどから取得して、この実施の形態のコンテンツ再生装置において、当該目的とするコンテンツデータに対して付加することもできるようにしている。

［メタデータの詳細について］
［画像データのメタデータについて］
まず、静止画像データや動画像データである画像データに付加されるメタデータについて説明する。画像データに付加するメタデータは、その画像データが形成する画像を音声データに付加されているメタデータに応じて検索するためのデータ群となる。予め決められたフィールドだけでなく、自由文を入れられるようにフリーワードを登録するためのキーワードのフィールドがある。

図２は、画像データ（静止画像データ）とこれに付加されるメタデータの一例を説明するための図である。図２Ａ、Ｂ、Ｃのそれぞれは、異なる静止画像データよる静止画像と、当該静止画像データに付加されたメタデータの一例を示している。図２Ａ、Ｂ、Ｃのそれぞれにおいて、画像ＧＡ、ＧＢ、ＧＣのそれぞれは、そのそれぞれの静止画像データによる画像を示している。

図２Ａの画像ＧＡは旅行時に撮影したものであり、図２Ｂの画像ＧＢはサッカーの試合の観戦時に撮影したものであり、図２Ｃは結婚披露パーティーの出席時に撮影したものである。そして、各画像データには、図２に示したように、撮影日時、第２日時（被写体が意味する年代）、場所、状況（撮影時のシチュエーション）、撮影時の天候、撮影者、同行者、自分との関連度、カテゴリ、写真の内容、検索用のキーワードなどの項目からなるメタデータが付加される。以下に、画像データに付加されるメタデータのそれぞれの項目について説明する。

「撮影日時」は、当該画像データが撮影された年月日および時間を示す情報である。「撮影日時」は、各静止画像データに対してユーザーが入力することも可能であるし、当該静止画像を撮影したカメラの時計回路が提供する撮影時の日時情報を利用することも可能である。

「第２日時」は、被写体などが意味する年代を示す情報である。すなわち、被写体が撮影日時とは無関係に重要な時間情報を持っている場合にその時間情報が入力されることになる。例えば被写体が大阪国際万国博覧会のシンボルとして公開された太陽の塔のように、著名なイベントで用いられたオブジェやモニュメントなどである場合には、撮影日時とは別にそのイベントの開催日時を「第２日時」として静止画像データに付加するようにする。この「第２日時」についても、ユーザーが入力することができるようにされる。

「場所」は、被写体を撮影した場所を示す情報である。ＧＰＳ（Global Positioning System）を搭載したカメラで撮影した画像データの場合、撮影時において当該ＧＰＳから取得した現在位置を示す緯度、経度情報を用いることが可能である。また、緯度・経度情報から国や地域を特定し、これを示す情報を「場所」を示す情報として用いるようにすることも可能である。また、「場所」を示す情報として、屋内、屋外の別を示す情報も同時に記録しておく。なお、この「場所」についてもユーザーが入力することが可能である。

「状況」は、撮影したときの状況（シチュエーション）を示す情報である。例えば、散歩中、イベント参加、スポーツや演劇の観戦、観覧、デート中、旅行中などの情報である。これらの情報は検索の正確さを重視し、予め複数の「シチュエーション」を示す情報の候補（選択肢）を用意しておき、この候補の中からユーザーが選択することができるようにしておくことが望ましい。より詳細な情報は、後述する「キーワード」または「内容」のフィールドに入力することもできるようにされる。

「天候」を示す情報は、例えば、晴れ／曇り／雨／雪／嵐／吹雪／雷／雹などの撮影時の天候を示すものである。検索の正確さを考慮し、上述した「シチュエーション」の場合と同様に、予め複数の「天候」を示す情報の候補（選択肢）を用意しておき、この候補の中からユーザーが選択することができるようにしておくことが望ましい。

「撮影者」は、撮影者の名前あるいは団体名（会社名）を示す情報である。「同行者」は、撮影者と同行した人物の名前あるいは団体名（会社名）を示す情報である。これらの情報は、ユーザーが入力することになる。なお、「同行者」については、複数の情報を入力することができる。「自分との関連度」は、その画像データが形成する画像と自分との関連度合いを示す数値情報が入る。

自分との関連度合いを示す数値情報としては、例えば、
０：自分とまったく関係のない画像
１：自分が知っている場所や物が写っているがそれほど関連がない画像
２：自分が撮った写真あるいは、自分が行ったことのある場所の画像
３：被写体として自分自身が写っている画像や自分の恋人や家族が写っている画像
とし、ユーザーの主観的な評価によって、対応すると判断した数値を選択し、当該画像データに対する自分との関連度を示す情報とすることが可能となる。

「カテゴリ」は、静止画像データによって形成される静止画像を分類するための予め決められた範囲を示すものである。この「カテゴリ」は、大カテゴリとその下の小カテゴリ、あるいは、中カテゴリと小カテゴリ程度の分類にしておく。これらのカテゴリについては、基本的の自由に設定することが可能であるが、検索の正確さと効率を考慮し、予め用意されるカテゴリの候補（選択肢）の中から選択できるようにしておくことが望ましい。

例えば、次のような分類を用意する。
（大カテゴリ）風景 > （小カテゴリ）海、山、都会、田舎、遺跡、神社、…
（大カテゴリ）芸術 > （小カテゴリ）オブジェ、絵画、演劇、音楽、写真、…
などのように、多数の大カテゴリと、それに続く複数の小カテゴリからなる分類を用意しておき、ユーザーによって選択し、付加することができるようにしておけばよい。この場合、大カテゴリの中の目的とする小カテゴリの情報を選択することにより、大カテゴリと小カテゴリの情報が設定するようにされる。

また、「内容」は、その静止画像データによって形成される静止画像の内容を示すものであり、「キーワード」は、その静止画像データによって形成される静止画像についての検索用の種々のキーワードである。これら「内容」や「キーワード」については複数の情報を付すことが可能であり、ユーザーが自由に入力できるいわゆるフリーワードの入力項目である。

なお、上述したメタデータの各項目の内、「内容」、「キーワード」、「同行者」といった項目以外の項目についても、複数の情報を設定あるいは入力することも可能である。このように画像データに付加されるメタデータは、複数の項目から構成され、各項目は１つ以上の情報を有するようにすることができるようにされる。

そして、図２Ａに示した例の場合、画像ＧＡは、上述もしたように、旅行時に撮影されたものであり、メタデータとして「撮影日時」を示す情報（２００３年８月９日１３時２０分）が付加されると共に、被写体が大阪万国博覧会の会場で公開された□□の塔であるために、「第２日時」として、大阪万国博覧会の開催期間を示す情報（１９７０年４月〜１０月）が付加されている。

さらに、図２Ａに示した例の場合、静止画像データには、図２Ａに示したように、「場所」（大阪・屋外）、「状況」（旅行）、「天候」（晴れ）、「撮影者」（○○○○）、「同行者」（△△△△）がメタデータとして付加されると共に、「自分との関連度」を示す情報として、上述した例に従い数値「１」が付加され、さらに、「カテゴリ」、「内容」、「キーワード」の各情報が付加するようにされている。

また、図２Ｂに示した例の場合、画像ＧＢは、上述もしたように、サッカーの試合の観戦時に撮影されたものであり、メタデータとして「撮影日時」を示す情報（２００２年６月３０日２０時４５分）が付加されている。また、この図２Ｂに示した静止画像の場合、「第２日時」を示す情報は特にないため付加されていない。図２において、Ｎ／Ａ（Not Applicable）は、該当データなしを意味している。このように、該当しない項目については、無理に情報を入れる必要はないようにされている。

さらに、図２Ｂに示した例の場合、静止画像データには、図２Ｂに示したように、「場所」（横浜・屋外）、「状況」（観覧）、「天候」（くもり）、「撮影者」（○○○男）、「同行者」（○○○子、○○○江）がメタデータとして付加されると共に、「自分との関連度」を示す情報として、上述した例に従い数値「２」が付加され、さらに、「カテゴリ」、「内容」、「キーワード」の各情報が付加するようにされている。

また、図２Ｃに示した例の場合、画像ＧＣは、上述もしたように、結婚披露パーティーの出席時に撮影されたものであり、メタデータとして「撮影日時」を示す情報（２００４年４月２４日１９時００分）が付加される。また、この図２Ｂに示した静止画像の場合、「第２日時」を示す情報は特にないため付加されない。

さらに、図２Ｃに示した例の場合、静止画像データには、図２Ｃに示したように、「場所」（東京・屋内）、「状況」（イベント出席）が付加され、「天候」、「撮影者」については特に付すべき情報はないので何らの情報も付加されない。また、「同行者」（△△△△、□□□□、××××）がメタデータとして付加されると共に、「自分との関連度」を示す情報として、上述した例に従い数値「３」が付加され、さらに、「カテゴリ」、「内容」、「キーワード」の各情報が付加するようにされている。

このように、撮影して得た静止画像データのそれぞれに対して、図２に示すような各メタデータを付加しておくことにより、目的とする静止画像データの検索や、他のコンテンツデータ、例えば、音声データとの関連付けを的確に行うことができるようにしている。

なお、図２に示した例は、画像データが静止画像データの場合を例にして説明したが、これに限るものではない。例えば、ユーザーがデジタルビデオカメラを用いて撮影した動画像データについても、各動画像データの撮影単位（ファイル単位）に、上述した静止画像データの場合と同様のメタデータを付加し、これを利用することができるようにされる。

また、自己の撮影した画像データの他にも、他人の製作に係る静止画像データや動画像データであっても、個人的な利用が認められたものについては、図２を用いて上述した例の場合と同様にして、メタデータを付加し、これを利用することができるようにされる。

なお、他人の製作に係る静止画像データや動画像データなどの場合、これらに付加されるメタデータが製作者側によって予め用意されている場合には、これらの静止画像データや動画像データを、外部Ｉ／Ｆ２４、入出力端子２５を通じて、あるいは、ネットワークＩ／Ｆ２３を介して接続されるインターネット１００を通じて提供を受ける場合に、当該提供を受ける画像データに付加されたメタデータについても提供を受けることができるようにされる。

また、他人の製作に係る静止画像データや動画像データなどと、これに付加される予め用意されたメタデータとは、所定の識別情報（識別ＩＤ）によって１対１に対応付けられており、既に素材データベース２１に蓄積されている画像データであって、メタデータが付加されていないものについては、識別情報を用いることによって、外部Ｉ／Ｆ２４、入出力端子２５を通じて、あるいは、ネットワークＩ／Ｆ２３を介して接続されるインターネット１００を通じて、目的とする画像データのメタデータのみの提供を受け、素材データベース２１に蓄積されている画像データに付加することもできるようにされる。

なお、他人の製作に係る静止画像データや動画像データなどの例としては、職業カメラマンによって撮影された静止画像データ、映画、ドラマ、アニメーションなどといった動画像データなどが考えられる。

［音声データのメタデータについて］
次に、音楽や話音声などの音声データに付加されるメタデータについて説明する。音声データに付加するメタデータは、その音声データに応じた音声を画像データに付加されているメタデータに応じて検索するためのデータ群となる。画像データに付加されるメタデータの場合と同様に、予め決められたフィールドだけでなく、自由文を入れられるようにフリーワードを登録するためのキーワードのフィールドがある。

図３は、音声データとこれに付加されるメタデータの一例を説明するための図である。図３Ａ、Ｂのそれぞれは、それぞれ異なるアーティストの楽曲（音楽）の音声データ（コンテンツデータ）と、当該音声データに付加されたメタデータの一例を示している。図３Ａ、Ｂのそれぞれにおいて、画像ＧＡＡ、ＧＢＢのそれぞれは、そのそれぞれの音声データに対応する静止画像データによる画像であり、当該音声データが収録されたアルバムのジャケットの静止画像である。

そして、音楽などを形成する音声データには、図３にも示すように、当該音声データの公表日（リリース日）、公表国（リリース国）、アーティスト名、アルバム名、タイトル、ジャンル、言語、シチュエーション、検索用キーワードなどの項目からなるメタデータが付加される。以下に、音声データに付加されるメタデータそれぞれの項目について説明する。

「公表日（リリース日）」は、当該音声データにより提供される楽曲などの音声が販売されるなどして一般に公開された日付を示す情報である。「公開国（リリース国）」は、その音声データによる楽曲などの音声が公開された国、または、その音声データによる楽曲等のアーティストの国籍を示す情報である。

「アーティスト名」は、当該音声データにより提供される楽曲などを演奏しているアーティストの名前や楽団名を示す情報である。「アルバム名」は、当該音声データによる楽曲などが収録されているアルバムのアルバム名を示す情報である。「タイトル」は、当該音声データにより提供される楽曲などのタイトル（曲名など）を示す情報である。

「ジャンル」は、当該音声データにより提供される楽曲などが属するジャンル、例えば、ジャズ、ロック、クラシック、…などを示し情報である。検索の正確さと効率を考慮して、予め用意されたジャンルを示す情報からユーザーが簡単に選択し付加することができるようにしておくことが望ましい。「言語」は、当該音声データにより提供される楽曲などが歌詞、台詞などの言語情報が含まれる場合に、その言語の種類を示す情報である。

「シチュエーション」は、当該音声データにより提供される楽曲などにあったシチュエーションを示す情報である。シチュエーションを示す情報は１つではなく、複数個設けることが可能である。この「シチュエーション」についても、検索の正確さと効率を考慮して、シチュエーションを示す複数個の情報を予め用意しておき、この中からユーザーが選択して付加することができるようにしておくことが望ましい。

「内容」は、当該音声データにより提供される楽曲などの内容を説明するための情報である。「キーワード」は、検索用のキーワードを示す情報であり、自由文（例えば単語レベル）で入力することができるようにされる。もちろん、比較的に長い文章をキーワードして入力することも可能であるが、検索用のキーワードであるので、上述のように単語レベルのものが好ましい。これら、「内容」、「キーワード」についても、複数の情報を付加する（設ける）ことができるようにされる。

そして、図３Ａに示した例の場合、当該音声データには、「リリース日〔公表日〕」（１９８１年８月４日）、「リリース国〔公表国〕」（ＵＳＡ（アメリカ合衆国））、「アーティスト」（ＸＸＸＸＸＸＸ）、「アルバム名」（ＹＹＹＹＹ）、「タイトル〔曲名〕」（ＺＺＺＺＺＺＺ）、「ジャンル」（Ｊａｚｚ〔ジャズ〕）、「言語」（なし）の各情報が付加するようにされている。さらに、図３Ａに示した例の場合、「シチュエーション」、「内容」、「キーワード」の各情報が付加され、「シチュエーション」、「キーワード」については、複数の情報が付加されている。

また、図３Ｂに示した例の場合、当該音声データには、「リリース日〔公表日〕」（２００３年１１月２０日）、「リリース国〔公表国〕」（日本）、「アーティスト」（ＬＬＬＬＬＬ）、「アルバム名」（ＭＭＭＭ）、「タイトル〔曲名〕」（ＮＮＮ）、「ジャンル」（Ｒｏｃｋ〔ロック〕）、「言語」（日本語）の各情報が付加するようにされている。さらに、図３Ｂに示した例の場合、「シチュエーション」、「内容」、「キーワード」の各情報が付加され、「シチュエーション」、「キーワード」については、複数の情報が付加されている。

なお、音声データは、上述したように楽曲データ（音楽データ）である場合が多く、楽曲データに付加されるメタデータは、音楽製作会社などの楽曲データの提供側によって作成されて提供される場合も多い。そこで、外部Ｉ／Ｆ２４、入出力端子２５を通じて、あるいは、ネットワークＩ／Ｆ２３を介して接続されるインターネット１００を通じて、楽曲データの提供を受ける場合に、その楽曲データと共に、これに付加されたメタデータの提供も受けることができるようにされる。

また、楽曲データと、これに付加されるメタデータとは、例えば、ＩＳＲＣ（International Standard Recording Code）などの所定の識別情報（識別ＩＤ）によって１対１に対応付けられ、既に素材データベース２１に蓄積されている楽曲データであって、メタデータが付加されていないものについては、識別情報を用いることによって、外部Ｉ／Ｆ２４、入出力端子２５を通じて、あるいは、ネットワークＩ／Ｆ２３を介して接続されるインターネット１００を通じて、目的とする楽曲データのメタデータのみの提供を受け、素材データベース２１に蓄積されている楽曲データに付加することもできるようにされる。

また、メタデータが存在しない楽曲データについては、パーソナルコンピュータなどの外部機器を通じて、あるいは、この実施の形態のコンテンツ再生装置のキー操作部６２を通じてユーザーがメタデータを入力し、目的とする楽曲データに対して付加することもできるようにされる。この場合の楽曲データは、いわゆる市販の楽曲データだけではなく、ユーザーが演奏し録音するようにしたものなどが含まれる。

また、音声データには、上述のような楽曲データだけではなく、落語、朗読、講演といった話音声のコンテンツや、話音声と音楽とからなるコンテンツ、あるいは、波の音、雨音、木々が風にふかれている音、自動車のエンジン音などの種々の音のコンテンツの場合もある。楽曲データ以外の上述のような種々の音声データについても、図３を用いて説明した楽曲データの場合と同様にメタデータが付加され利用することができるようにされる。

このように、静止画像データや動画像データなどの画像データ、楽曲データなどの音声データに対しては、上述したように、メタデータが付加されており、これを利用することによって、音声データと画像データとの関連付けを自動的に行うことができるようにしている。

［音声データと画像データの関連付けの具体例］
次に、音声データと画像データとを自動的に関連付けて再生する場合の具体例について説明する。図４は、音声データと画像データとを関連付けて再生する場合の具体例を説明するための図であり、矢印の示す方向が時間ｔの経過方向を示している。

例えば、懐かしい音楽を聴いていて、その音楽のリリース当時の出来事を振り返れる写真をスライドショーのようにして表示したい場合がある。このような場合、この実施の形態のコンテンツ再生装置のユーザーは、このコンテンツ再生装置に対して、キー操作部６２を通じて、再生する音声データに関連付けられる静止画像データを年代重視で検索するように指示する設定を行い、目的とする楽曲の音声データを再生するようにする。

この場合、この実施の形態のコンテンツ再生装置の制御部１０は、再生された音声データに付加されているメタデータをもとに、インターネット１００上の種々の素材サーバに蓄積されている多数の静止画像データの中から、それらの静止画像データに付加されているメタデータを検索し、再生対象とされた音声データのリリース当時の様々な出来事に関する静止画像データを抽出し、さらにユーザー自身が当時撮影した旅行の写真やスナップなども素材データサーバ２１から検索して抽出する。

ここでは、インターネット１００上のサーバと、素材データベース２１とで異なる種類の画像データを検索するものとして説明したが、これに限るものではない。インターネット１００上の素材サーバと素材データベース２１とで同様の条件で画像データを検索するようにしてももちろんよいし、また、インターネット１００上の素材サーバと素材データベース２１とのいずれか一方だけを検索の対象とするようにすることも可能である。

このようにして抽出した複数の静止画像データによる複数の静止画像を再生対象の音声データの再生に対応して再生することにより、再生対象の音声データに対して関連のある静止画像を再生して表示することができるようにされる。

例えば、図４Ａに示す１９８５年にリリースされた楽曲の音声データを再生するようにした場合には、当該音声データは、上述もしたように、音声デコーダ３２、Ｄ／Ａ変換器５１、音声アンプ５２、スピーカ５３を通じて再生される。これと同時に、制御部１０の制御により、１９８５年当時に発生した様々な出来事についての静止画像データがインターネット１００上の素材サーバやコンテンツ再生装置の素材データベース２１から抽出され、これらが画像デコーダ３１、Ｄ／Ａ変換器４１、ディスプレイ４２を通じて、図４Ａにおいて静止画像ａ１、ａ２、a３、ａ４、ａ５、…に示すように所定時間ずつ（例えば数秒ずつ）表示するようにされる。

なお、図４Ａに示した静止画像ａ１、ａ２、ａ３、ａ４、ａ５のそれぞれは１９８５年当時の出来事に関連するものであり、静止画像ａ１は当時一部開通した高速鉄道を、静止画像ａ２は重大事件の当事者を、静止画像ａ３は当時噴火した海外の火山を、静止画像ａ４は当時の流行の服装を、静止画像ａ５は当時話題を集めた自動車を、それぞれ被写体とする静止画像である。

また、同じ年代の楽曲を続けて再生する場合、毎回同じ静止画像が同じ順番で表示されたのでは新鮮味に欠ける。このため、例えば、乱数的な要素を入れたり、シチュエーションやキーワードなどのパラメータを併用したりするなどして、抽出する画像データにバリエーションを付けたりすることにより、再生する楽曲によりあった静止画像を抽出できるようにすることも可能である。

また、他の例として、例えば、クリスマスパーティーでクリスマスソングを聴きながら、クリスマスに関連する写真をスライドショーのように表示してさらにパーティーを盛り上げるようにしたい場合がある。このような場合、この実施の形態のコンテンツ再生装置のユーザーは、このコンテンツ再生装置に対して、キー操作部６２を通じて、再生する音声データに関連付けられる静止画像データをシチュエーション重視で検索するように指示する設定を行い、目的とするクリスマスソングの音声データを再生するようにする。

この場合、この実施の形態のコンテンツ再生装置の制御部１０は、再生されたクリスマスソングの音声データに付加されているメタデータの“クリスマス”という「シチュエーション」や、“パーティー”という「キーワード」をもとに、インターネット１００上の種々の素材サーバに蓄積されている多数の静止画像データの中から、それらの静止画像データに付加されているメタデータを検索し、再生対象とされた音声データの「シチュエーション」や「キーワード」に合致する静止画像データを抽出し、さらにユーザー自身が当時撮影した旅行の写真やスナップなども素材データサーバ２１から検索して抽出する。

例えば、図４Ｂに示すように、クリスマスソングを再生するようにした場合には、当該音声データは、上述もしたように、音声デコーダ３２、Ｄ／Ａ変換器５１、音声アンプ５２、スピーカ５３を通じて再生される。これと同時に、制御部１０の制御により、シチュエーションがクリスマスに関連する静止画像データがインターネット１００上の素材サーバやコンテンツ再生装置の素材データベース２１から抽出され、これらが画像デコーダ３１、Ｄ／Ａ変換器４１、ディスプレイ４２を通じて、図４Ｂにおいて静止画像ｂ１、ｂ２、ｂ３、ｂ４、…に示すように所定時間ずつ（例えば数秒ずつ）表示するようにされる。

なお、図４Ｂに示した静止画像ｂ１、ｂ２、ｂ３、ｂ４のそれぞれは、シチュエーションがクリスマスに関連するものであり、静止画像ｂ１はクリスマスツリーを、静止画像ｂ２はクリスマスケーキを、静止画像ｂ３はクリスマスパーティーの様子を、静止画像ｂ４はクリスマスリースを、それぞれ被写体とする静止画像である。

また、この場合においても、種々のクリスマスソングを続けて再生する場合、毎回同じ静止画像が同じ順番で表示されたのでは新鮮味に欠ける。このため、例えば、乱数的な要素を入れたり、シチュエーションやキーワードなどのパラメータを用いて抽出する画像データにバリエーションを付けたりすることにより、再生する楽曲によりあった静止画像を抽出できるようにすればよい。

また、ここでは、楽曲の音声データを再生する場合に、これに関連のある静止画像データを検索して抽出する場合を例にして説明した。しかし、これに限るものではない。これとは逆に、例えば、複数の静止画像データをユーザーが指定して、これを順次に再生する場合に、その複数の静止画像データのメタデータを用いて、当該複数の静止画像データに合った楽曲の音声データを自動的に検索して抽出し、これを静止画像データの再生に合わせて再生するようにしたりすることも可能である。この場合にも、年代重視、シチュエーション重視など、重視するメタデータについて指示することもできるようにされる。

また、ユーザーがデジタルビデオカメラを用いて過去に撮影した動画像データを再生する場合に、その撮影当時において流行していた楽曲を検索して抽出し、これを動画像データの再生に合わせて再生するようにしたり、あるいは、その動画像データのシチュエーションに合致した楽曲を検索して抽出し、これを動画像データの再生に合わせて再生するようにしたりすることもできるようにされている。

［コンテンツ再生時の具体的処理について］
［再生する音声データに応じた画像データを検索する処理について］
次に、図４を用いて説明したように、再生する音声データに応じた画像データを再生して表示するために、当該音声データに応じた画像データを検索する場合の処理について詳細に説明する。ここでは、再生対象の音声データは素材データベース２１に蓄積された楽曲データであり、表示する画像データは写真などの静止画像データである場合を例にして説明する。また、再生対象の音声データに付加されたメタデータも素材データベース２１に格納されているものとして説明する。

図５、図６は、音声データの再生時において、当該音声データに関連のある静止画像や動画像を検索して抽出する場合の処理を説明するためのフローチャートである。この図５、図６に示す処理は、例えば、ユーザーによる音声データの再生指示入力を、キー操作部６２を通じて受け付けて、指示された音声データを再生するようにした場合に、制御部１０において実行される処理である。

まず、制御部１０は、再生対象の音声データに付加するようにされているメタデータを素材データベース２１から読み出して取得すると共に（ステップＳ１０１）、時計回路６１から現在年月日を取得する（ステップＳ１０２）。そして、制御部１０は、時計回路６１から取得した現在年月日から再生対象の音声データに付加されているメタデータの「リリース日」を引き算してｄＤａｙｓを算出する（ステップＳ１０３）。このように、現在年月日と音声データの「リリース日」との日数差であるｄＤａｙｓを求めるのは、詳しくは後述もするが、「リリース日」についての最適な検索範囲を特定するためである。

そして、日数差ｄＤａｙｓをもとに、素材データベース２１内の静止画像データのすべてのメタデータの撮影日や第２日付などの日付に関する情報を検索し、まずはその「リリース日」に関連の深い静止画像データを検索して候補を抽出し、これを保持するようにする（ステップＳ１０４）。このとき、候補として保持するようにした静止画像データのそれぞれのスコアＳｎ(ｎは検索にヒットした静止画像データ（写真）の枚数によって動的に変化する)に定数α１を加算する（ステップＳ１０５）。このように、ステップＳ１０２〜ステップＳ１０５までの処理が、全ての静止画像データを対象とする「リリース日」を用いた検索処理である。

ここで、スコアＳｎは、上述もしたように、検索することにより候補として抽出した静止画像データのそれぞれごとに異なるいわゆるレジスタである。すなわち、最初に候補とされた静止画像データのスコアは“Ｓ１”であり、次に候補とされた静止画像データのスコアは“Ｓ２”であるというように、各静止画像データ毎に異なるものである。

また、定数α１や、以下に登場するα２、α３、…等の定数は、メタデータの各項目毎にその重要度に応じて決まる重み付けのためのものである。したがって、重要度の高い項目について用いる定数αｍ（ｍは、メタデータの各項目に応じて決まる１以上の整数である。）は大きな値となり、重要度の低いメタデータについて用いる定数αｍは小さな値となる。具体的には、「リリース日」に対する重み付け定数は“α１”、「シチュエーション」に対する重み付け定数は“α２”というように、メタデータを構成する各項目毎に決められるものである。

もちろん、各重み付け定数α１、α２、…のそれぞれが異なる値となる場合もあれば、各重み付け定数α１、α２、…の内のいくつかが同じ値となる場合もある。また、各重み付け定数α１、α２、…の各値は、ユーザーからの指示入力に応じて、どの項目の重要度を大きくするかなどの情報に基づいて決められるようにされている。

なお、図５の一連の検索処理を行う前に、すべての静止画像データに対するスコアＳ１、Ｓ２、Ｓ３、…、Ｓｎのそれぞれは「０（ゼロ）」で初期化しておく。実際の処理としては、初めて検索にひっかかった静止画像データは、そのときスコアＳｎを「０」で初期化すればよい。その後の検索においても同様で、はじめて検索にひっかかった静止画像データのスコアＳｎを「０」で初期化してから、当該スコアＳｎに対して重み付け定数αｍを加算する。すでに前段の検索でひっかかっている静止画像データについてのスコアＳｎに対しては初期化をせずにそのまま重み付け定数αｍを加算する。

次に、制御部１０は、再生対象の音声データのメタデータとして保持している「シチュエーション」項目の情報を用いて、素材データベース２１内の静止画像データのすべてのメタデータの各項目を検索して候補を抽出し、これを保持するようにする（ステップＳ１０６）、そして、候補として保持するようにした静止画像データのそれぞれのスコアＳｎに定数α２を加算する（ステップＳ１０７）。

さらに、「シチュエーション」の当該情報について、類義語辞書２２を用い、類義語候補を列挙し、それぞれの類義語に対しても、同様の検索を行って候補を抽出し、これを保持するようにする（ステップＳ１０８）。そして、抽出して保持した静止画像データに対するスコアＳｎに定数α３を加算する（ステップＳ１０９）。

なお、通常、定数α３は定数α２よりも小さな値にしておく。このようにするのは、上述もしたように、αｍは重み付けを行うための値であり、検索時に何を重要とするかにあわせて値を変えるものであるため、オリジナル単語の一致を類義語の一致よりも重視することが自然だからである。

そして、再生対象の音声データに付加されている「シチュエーション」の情報が複数の情報を有する場合もあるため、「シチュエーション」項目の情報として他に情報があるか否かを判断する（ステップＳ１１０）。ステップＳ１１０の判断処理において、「シチュエーション」項目の情報として他に情報がまだあると判断した場合には、ステップＳ１０６からの処理を繰り返し、「シチュエーション」項目の他の情報についてもステップＳ１０６からステップＳ１１０の処理を繰り返すようにする。このように、ステップＳ１０６〜ステップＳ１１０までの処理が、全ての静止画像データを対象とする「シチュエーション」項目の情報を用いた検索処理である。

ステップＳ１１０の判断処理において、「シチュエーション」項目に他の情報は存在しないと判断した場合には、制御部１０は、図６に示す処理に進み、再生対象の音声データのメタデータとして保持している「キーワード」項目を用いて、素材データベース２１内の静止画像データのすべてのメタデータの各項目を検索して候補を抽出し、これを保持するようにする（ステップＳ１１１）、そして、候補として保持するようにした静止画像データのそれぞれのスコアＳｎに定数α４を加算する（ステップＳ１１２）。

さらに、「キーワード」項目について、類義語辞書２２を用い、類義語候補を列挙し、それぞれの類義語に対しても、同様の検索を行って候補を抽出し、これを保持するようにする（ステップＳ１１３）。そして、抽出して保持した静止画像データに対するスコアＳｎに定数α５を加算する（ステップＳ１１４）。ここでも、上述した定数α３と定数α２との関係と同様に、定数α５は定数α４よりも小さな値となる。

そして、再生対象の音声データに付加されている「キーワード」項目が複数の情報を有する場合もあるため、「キーワード」項目の情報として他に情報があるか否かを判断する（ステップＳ１１５）。ステップＳ１１５の判断処理において、「キーワード」項目に他の情報がまだあると判断した場合には、ステップＳ１１１からの処理を繰り返し、「キーワード」項目の他の情報についてもステップＳ１１１からステップＳ１１５の処理を繰り返すようにする。このように、ステップＳ１１１〜ステップＳ１１５までの処理が、全ての静止画像データを対象とする「キーワード」情報を用いた検索処理である。

このようにして、すべての候補としての静止画像データが出揃ったところで候補としての各静止画像データの「自分との関連度」の値に重み付け係数α６を乗算して、これを各静止画像データのスコアＳｎに加算する（ステップＳ１１６）。そして最後に、各静止画像データ毎のスコアＳｎの高い順にソートを実行し（ステップＳ１１７）、スコアＳｎの高い静止画像データから順に再生して表示する静止画像データとして用いるように決定して、この図５、図６に示す処理を終了する。

そして、再生対象の音声データの再生に応じて、ソート順に静止画像データをスライドショーの態様で表示することで、再生対象の音声データによる楽曲となんらかの関係性を持った静止画像を自動的に選択して表示することができる。また、ソート順ではなく、あるスコアよりも高い写真だけを使用して、楽曲の再生時間の長さに合わせてスライドショーの間隔を調整して表示するなどさまざまな提示方法が可能である。

なお、画像データの検索はインターネット上の素材サーバを検索してもよいし、静止画像データに限ることなく、動画像データを検索の対象とし、スコアＳｎの最も高い動画像データを再生対象の音声データの再生に合わせて再生することも可能である。

図７は、図５に示したステップＳ１０４において行われる現在年月日と再生対象の音声データの「リリース日」との日数差ｄＤａｙｓから静止画像データの日付検索範囲Ｒを決定する処理を説明するためのフローチャートである。この図７に示す処理は、人間の記憶は、時間が経てば経つほど曖昧度が増すことに着目し、日数差ｄＤａｙｓが小さくなるほど検索範囲を狭くし、逆に、日数差ｄＤａｙｓが大きくなるほど検索範囲を大きくするようにしている。

すなわち、１ヶ月前にリリースされた楽曲に関連する静止画像として、半年前に撮影した静止画像を用いると、当該楽曲と当該静止画像とでは明らかに時期が違うことに気づき違和感を生じる可能性が高い。しかし、１０年前の楽曲に前後１年間程度撮影日の異なる静止画像を関連付けたとしても、「あの頃の画像（写真）」という感じがして、違和感を生じさせる可能性が低くなる。そのため、日数差ｄＤａｙｓの大きさにあわせて、日付による検索範囲を可変させるようにしている。

具体的には、図７に示すように、まず、制御部１０は、日数差ｄＤａｙｓが１ヶ月以内か否かを判断し（ステップＳ２０１）、１ヶ月以内であると判断したときには、日付に関する情報の検索範囲Ｒを２週間に設定し（ステップＳ２０２）、音声データのリリース日からＲ／２の範囲、すなわち、リリース日の前後１週間の範囲で静止画像データを検索し、この図７に示す処理を終了する。

ステップＳ２０１の判断処理において、日数差ｄＤａｙｓが１ヶ月以内ではないと判断したときには、制御部１０は、日数差ｄＤａｙｓが半年以内か否かを判断し（ステップＳ２０３）、半年以内であると判断したときには、日付に関する情報の検索範囲Ｒを１ヶ月に設定し（ステップＳ２０４）、音声データのリリース日からＲ／２の範囲、すなわち、リリース日の前後１５日の範囲で静止画像データを検索し、この図７に示す処理を終了する。

ステップＳ２０３の判断処理において、日数差ｄＤａｙｓが半年以内ではないと判断したときには、制御部１０は、日数差ｄＤａｙｓが１年以内か否かを判断し（ステップＳ２０５）、１年以内であると判断したときには、日付に関する情報の検索範囲Ｒを３ヶ月に設定し（ステップＳ２０６）、音声データのリリース日からＲ／２の範囲、すなわち、リリース日の前後４５日の範囲で静止画像データを検索し、この図７に示す処理を終了する。

ステップＳ２０５の判断処理において、日数差ｄＤａｙｓが１年以内ではないと判断したときには、制御部１０は、日数差ｄＤａｙｓが３年以内か否かを判断し（ステップＳ２０７）、３年以内であると判断したときには、日付に関する情報の検索範囲Ｒを半年に設定し（ステップＳ２０８）、音声データのリリース日からＲ／２の範囲、すなわち、リリース日の前後３ヶ月の範囲で静止画像データを検索し、この図７に示す処理を終了する。

ステップＳ２０７の判断処理において、日数差ｄＤａｙｓが３年以内ではないと判断したときには、制御部１０は、日数差ｄＤａｙｓが１０年以内か否かを判断し（ステップＳ２０９）、１０年以内であると判断したときには、日付に関する情報の検索範囲Ｒを１年に設定し（ステップＳ２１０）、音声データのリリース日からＲ／２の範囲、すなわち、リリース日の前後６ヶ月の範囲で静止画像データを検索し、この図７に示す処理を終了する。

ステップＳ２０９の判断処理において、日数差ｄＤａｙｓが１０年以内ではないと判断したときには、制御部１０は、日数差ｄＤａｙｓが２０年以内か否かを判断し（ステップＳ２１１）、２０年以内であると判断したときには、日付に関する情報の検索範囲Ｒを３年に設定し（ステップＳ２１２）、音声データのリリース日からＲ／２の範囲、すなわち、リリース日の前後１年６ヶ月の範囲で静止画像データを検索し、この図７に示す処理を終了する。

ステップＳ２１１の判断処理において、日数差ｄＤａｙｓが２０年以内ではないと判断したときには、日付に関する情報の検索範囲Ｒを５年に設定し（ステップＳ２１３）、音声データのリリース日からＲ／２の範囲、すなわち、リリース日の前後２年６ヶ月の範囲で静止画像データを検索し、この図７に示す処理を終了する。

このように、人間の記憶が時間の経過に伴ってあいまいになっていくことを利用し、再生対象の音声データのリリース日が、現在よりもかなり以前である場合には、画像データのメタデータに含まれる撮影日などの日付に関する情報の検索範囲を広げることにより、幅を持たせた検索を行うことができるので、人間の記憶の特性に合致した状態で画像データの検索を行い、その結果の画像を提供することができる。

なお、日数差ｄＤａｙａや検索範囲Ｒの刻み幅は、この図７を用いて説明したものに限るものではなく、種々の値に変更することも可能である。また、図７に示した例の場合には、条件分岐によって７段階にしているが、日数差ｄＤａｙｓの２乗に比例させて検索範囲Ｒ＝（ｄＤａｙｓ＊ｄＤａｙｓ）／Ｃ（Ｃは所定の定数）などの計算式を用いることによって、数学的に算出するようにしてもよい。

［再生する画像データに応じた音声データを検索する処理について］
次に、図５〜図７を用いて説明した場合とは逆に、再生する画像データに関連する音声データを再生するために、当該画像データに関連する音声データを検索する場合の処理について詳細に説明する。ここでは、再生対象の画像データは素材データベース２１に蓄積された画像データであり、また、検索する音声データも素材データベース２１に蓄積されているものとして説明する。

なお、以下に説明するように、再生する画像データに関連のある楽曲などの音声データを検索する場合においても、検索に使用するメタデータの項目の種類と数とは異なるものの、その基本的な処理は、図５〜図７を用いて説明した再生する音声データに関連のある画像データを検索する場合の処理と同様の処理となる。

図８、図９は、画像データの再生時において、当該画像データに関連のある楽曲などの音声データを検索して抽出する場合の処理を説明するためのフローチャートである。この図８、図９に示す処理は、例えば、ユーザーによる画像データの再生指示入力を、キー操作部６２を通じて受け付けて、指示された画像データを再生するようにした場合に、制御部１０において実行される処理である。ここで、画像データは静止画像データの場合もあれば、動画像データの場合もあり、また、静止画像データの場合には、複数の静止画像の画像データである場合がある。

そして、制御部１０は、再生対象の画像データに付加されているメタデータを素材データベース２１から読み出して取得すると共に（ステップＳ３０１）、時計回路６１から現在年月日を取得する（ステップＳ２０２）。そして、制御部１０は、時計回路６１から取得した現在年月日から再生対象の画像データに付加されているメタデータの「撮影日」を引き算してｄＤａｙｓを算出する（ステップＳ３０３）。このように、現在年月日と画像データの「撮影日」との日数差であるｄＤａｙｓを求めるのは、「撮影日」についての最適な検索範囲を特定するためである。

そして、日数差ｄＤａｙｓをもとに、素材データベース２１内の音声データのすべてのメタデータの「リリース日」などの日付に関する情報（メタデータ）を検索し、まずはその「撮影日」に関連の深い音声データを検索して候補を抽出し、これを保持するようにする（ステップＳ３０４）。このとき、候補として保持するようにした音声データのそれぞれのスコアＳｎ(ｎは検索にヒットした音声データの数（楽曲数）によって動的に変化する)に定数α１を加算する（ステップＳ３０５）。

この場合、スコアＳｎは、上述もしたように、検索することにより候補として抽出した音声データのそれぞれごとに異なるいわゆるレジスタである。すなわち、最初に候補とされた音声データのスコアは“Ｓ１”であり、次に候補とされた音声データのスコアは“Ｓ２”であるというように、各音声データ毎に異なるものである。

また、定数α１や、以下に登場するα２、α３、…等の定数は、そのメタデータの各項目毎にその重要度に応じて決まる重み付けのためのものである。したがって、重要度の高い項目について用いる定数αｍ（ｍは、メタデータの各項目に応じて決まる１以上の整数である。）は大きな値となり、重要度の低い項目について用いる定数αｍは小さな値となる。このように、ステップＳ３０２〜ステップＳ３０５までの処理が、全ての音声データを対象とする「撮影日」を用いた検索処理である。

次に、制御部１０は、ステップＳ３０２において時計回路６１から取得した現在年月日から再生対象の画像データに付加されているメタデータの「第２日付」を引き算してｄＤａｙｓを算出する（ステップＳ３０６）。このように、現在年月日と画像データの「第２日付」との日数差であるｄＤａｙｓを求めるのは、「撮影日」の場合と同様に、「第２日付」についての最適な検索範囲を特定するためである。

そして、日数差ｄＤａｙｓをもとに、素材データベース２１内の音声データのすべてのメタデータのリリース日などの日付に関する情報（メタデータ）を検索し、まずはその「第２日付」に関連の深い音声データを検索して候補を抽出し、これを保持するようにする（ステップＳ３０７）。そして、候補として保持するようにした音声データのそれぞれのスコアＳｎに定数α２を加算する（ステップＳ３０８）。このように、ステップＳ３０６〜ステップＳ３０８までの処理が、全ての音声データを対象とする「第２日付」を用いた検索処理である。

そして、制御部１０は、再生対象の画像データ付加されているメタデータの各項目についても、上述した「撮影日」や「第２日付」の場合と同様に、利用可能な音声データに付加されているメタデータを対象として検索及び重み付け処理を行う。すなわち、制御部１０は、再生対象の画像データに付加されているメタデータの内の「場所」の情報をもとに、素材データベース２１内の音声データのすべてのメタデータの場所に関する情報を検索し、その「場所」に関連の深い音声データを抽出し、その抽出した音声データのそれぞれについて、重み付けを行う（ステップＳ３０９）。

また、制御部１０は、再生対象の画像データに付加されているメタデータの内の「状況（シチュエーション）」の情報をもとに、素材データベース２１内の音声データのすべてのメタデータの状況（シチュエーション）に関する情報を検索し、その「状況」に関連の深い音声データを抽出し、その抽出した音声データのそれぞれについて、重み付けを行う（ステップＳ３１０）。

また、制御部１０は、再生対象の画像データに付加されているメタデータの内の「天候」の情報をもとに、素材データベース２１内の音声データのすべてのメタデータの天候に関する情報を検索し、その「天候」に関連の深い音声データを抽出し、その抽出した音声データのそれぞれについて、重み付けを行う（ステップＳ３１１）。

また、制御部１０は、再生対象の画像データに付加されているメタデータの内の「カテゴリ」の情報をもとに、素材データベース２１内の音声データのすべてのメタデータの各項目を検索し、その「カテゴリ」に関連の深い音声データを抽出し、その抽出した音声データのそれぞれについて、重み付けを行う（ステップＳ３１２）。

また、制御部１０は、再生対象の画像データに付加されているメタデータの内の「内容」の情報をもとに、素材データベース２１内の音声データのすべてのメタデータの各項目を検索し、その「内容」に関連の深い音声データを抽出し、その抽出した音声データのそれぞれについて、重み付けを行う（ステップＳ３１３）。

また、制御部１０は、再生対象の画像データに付加されているメタデータの内の「キーワード」の情報をもとに、素材データベース２１内の音声データのすべてのメタデータの各項目を検索し、その「キーワード」に関連の深い音声データを抽出し、その抽出した音声データのそれぞれについて、重み付けを行う（ステップＳ３１４）。

このようにして、再生対象の画像データと関連深い音声データとして抽出されたすべての音声データについて、そのそれぞれのスコアＳｎの高い順にソート（並べ替え）を行い（ステップＳ３１５）、この図８に示す処理を終了する。そして、制御部１０は、スコアＳｎの高い音楽データを再生対象の画像データの再生に合わせて再生するようにされる。

次に、図８に示したステップＳ３０９〜ステップＳ３１４の各ステップにおいて行われる各項目の検索及び重み付け処理の具体例について図９のフローチャートを参照しながら説明する。図９は、図８に示したステップＳ３０９〜ステップＳ３１４の各ステップにおいて実行される処理の具体例を説明するためのフローチャートである。

図９において、指定項目は、画像データに付加されたメタデータを構成する項目である「場所」、「状況（シチュエーション）」、「天候」、「カテゴリ」、「内容」、「キーワード」の内の該当項目（メタデータ内の処理対象として指定（指示）された項目）を意味するものであり、図８に示した処理（メイン処理）のステップＳ３０９〜ステップＳ３１４のそれぞれにおいて指定するようにされたメタデータの項目を意味している。

そして、ステップＳ３０９〜ステップＳ３１４の各ステップにおいては、まず、メイン処理のステップにおいての指定項目の情報をもとに、素材データベース２１に蓄積されている音声データのすべてのメタデータの各項目を検索して、その指定項目の情報に関連の深い音声データを抽出し（ステップＳ４０１）、その抽出したそれぞれの音声データのスコアＳｎについて、重み付け定数αｍを用いて重み付けを行う（ステップＳ４０２）。

次に、制御部１０は、メイン処理のステップにおいての指定項目の情報について、類義語辞書２２を用い、類義語候補を列挙し、それぞれの類義語をもとに、素材データベース２１に蓄積されている音声データのすべてのメタデータの各項目を検索して、その指定項目の情報についての類義語に関連の深い音声データを抽出し（ステップＳ４０３）、その抽出したそれぞれの音声データのスコアについて重み付けを行う（ステップＳ４０４）。

そして、制御部１０は、当該指定項目について、複数の情報が付加されている場合もあるため、当該指定項目に他の情報がまだあるか否かを判断する（ステップＳ４０５）。ステップＳ４０５の判断処理において、当該指定項目に他の情報があると判断した場合には、当該他の情報についても、ステップＳ４０１からの処理を行うようにする。

また、ステップＳ４０５の判断処理において、当該指定項目に他の情報はないと判断したときには、この図９に示す処理を終了し、図８に示した処理の読み出されたステップに戻り、メイン処理の次のステップの処理が実行するようにされる。

このように、画像データに付加されたメタデータの内、「撮影日」や「第２日付」以外の各項目の情報については、その情報と、その情報の類義語について、音声データに付加されたメタデータが検索され、再生対象の画像データに関連する音楽データを抽出して、これを画像データの再生に合わせて再生することができるようにしている。

なお、再生対象の画像データが、いわゆるスライドショー再生するための複数の静止画像データである場合には、例えば、その複数の静止画像データのそれぞれに付加されているメタデータをもとにいわゆるマクロメタデータを形成し、このマクロメタデータを用いて図８、図９を用いて説明した検索及び重み付け処理を行って、スコアの高い音声データを用いるようにすることができる。つまり、複数の静止画像データの全体を一連の画像データであるとみなし、その複数の静止画像データに対して、１つのあるいは複数の音声データを対応付けるようにすることができる。

また、その複数の静止画像データの１つ１つに対応して、１つの音声データを検索し対応付けるようにすることももちろん可能である。また、再生対象の画像データが動画像データである場合には、その動画像データに付加されているメタデータを用いて、関連する１つの音声データを抽出して、これを再生するようにしたり、関連する２つ以上の音声データを抽出して、これらを順次に再生するようにすることも可能である。

このように、従来は、例えば、デジタルスチルカメラで撮影した静止画やデジタルビデオカメラで撮影した動画などと、インターネットなどの通信ネットワークやＭＤ、ＣＤなどの記録媒体を通じて取得した音声データとを自動的に結びつけることはできなかった。このため、上述のように別々の経路で取得した画像データと音声データとを関連付けて再生使用とすれば、ユーザー自身が、再生する画像データや音声データを、その再生タイミングや再生順を詳細に指示することにより行うしかなかった。

しかし、上述した実施の形態のコンテンツ再生装置の場合には、音声再生時にその音声から想起されるさまざまな想い出を、年代・場所・内容にあわせて写真などの静止画像や動画像として自動的に提示することができる。したがって、ユーザーが明示的に写真の検索を行ったり、ＢＧＭ付きスライドショーを作成しておく必要がなく、また、写真などの静止画像データが増えても自動的にその写真などの静止画像データなどが処理の対象として追加される。

また、上述した実施の形態のコンテンツ再生装置は、音声データと画像データとの間を、それらに付加されている詳細なメタデータを用いることにより、自動的かつ適切に関連付を行って再生することができる。したがって、素材データベース２１やインターネット１００上の素材サーバ１０１などに眠っている個人のコンテンツを掘り起こし、これらを再生することによって、ユーザーの記憶も掘り起こすことができ、より深い感動と懐かしさを演出することができる。すなわち、上述した実施の形態のコンテンツ再生装置は、いわば、想い出想起プレイヤーとでも言うべきものである。

なお、上述した実施の形態においては、年代重視の場合にはメタデータの「撮影日」、「第２日付」、「リリース日」といった日付に関する情報を用い、シチュエーション重視の場合にはメタデータの「状況（シチュエーション）」を用いるものとして説明したがこれに限るものではない。メタデータのその他の項目、例えば、画像データについての「場所」、「天候」、「撮影者」、「同行者」、などを用いるようにしたり、音声データについての「アーティスト」、「アルバム名」、「タイトル」、「歌詞」などを用いるようにしたりすることももちろん可能である。

また、メタデータを構成する複数の項目を組み合わせて、種々の態様の検索を行うようにすることが可能である。この場合、上述した「年代重視」、「シチュエーション重視」と同様に、例えば、「場所重視」や「天候重視」、あるいは、「アーティスト重視」のようにいくつかの選択項目を設けておき、各選択項目毎に用いるメタデータの項目を設定おくようにすればよい。また、ユーザー自身は、検索に用いるメタデータの項目と重要度とを指定するようにすることも可能である。

また、上述した実施の形態のコンテンツ再生装置は、上述もしたように、パーソナルコンピュータ、ノート型パーソナルコンピュータ、携帯電話端末、携帯型情報端末に適用できる他、専用のコンテンツ再生装置として構成することも可能である。

この発明の装置、方法の一実施の形態が適用されたコンテンツ再生装置を説明するためのブロック図である。図１に示したコンテンツ再生装置において利用可能な画像データとこれに付加されるメタデータの一例を説明するための図である。図１に示したコンテンツ再生装置において利用可能な音声データとこれに付加されるメタデータの一例を説明するための図である。図１に示したコンテンツ再生装置のコンテンツの再生態様の一例を説明するための図である。再生対象の音声データに関連のある静止画像や動画像を検索して抽出する場合の処理を説明するためのフローチャートである。図５に続くフローチャートである。図５に示したステップＳ１０４において行われる日付範囲の設定情報を説明するためのフローチャートである。再生対象の画像データに関連のある音声データを検索して抽出する場合の処理を説明するためのフローチャートである。図８に示したステップＳ３０９〜ステップＳ３１４の各ステップにおいて行われる処理を説明するための図である。

符号の説明

１０…制御部、１１…ＣＰＵ、１２…ＲＯＭ、１３…ＲＡＭ、１４…ＣＰＵバス、２１…素材データベース、２２…類義語辞書、２３…ネットワークインターフェース、２４…外部インターフェース、２５…外部入出力端子、３１…画像デコーダ、３２…音声デコーダ、４１…映像Ｄ／Ａ変換器、４２…ディスプレイ、５１…音声Ｄ／Ａ（Digital/Analog）変換器、５２…音声アンプ、５３…スピーカ、６１…カレンダー時計回路、６２…キー操作部

Claims

再生する音声データに付加されたメタデータを取得する取得手段と、
前記取得手段により取得されたメタデータをもとに、静止画像あるいは動画像の画像データに対して付加されているメタデータを参照し、前記音声データと関連性の高い画像データを検索する検索手段と、
前記音声データを再生する音声再生手段と、
前記検索手段により検索された前記画像データを再生する画像再生手段と、
再生される音声と画像とを関連付けて再生するように前記音声再生手段と前記画像再生手段とを制御する制御手段と
を備えることを特徴とするコンテンツ再生装置。
再生する静止画像あるいは動画像の画像データに付加されたメタデータを取得する取得手段と、
前記取得手段により取得されたメタデータをもとに、音声データに対して付加されているメタデータを参照し、再生する前記画像データと関連性の高い音声データを検索する検索手段と、
前記画像データを再生する画像再生手段と、
前記検索手段により検索された前記音声データを再生する音声再生手段と、
再生される画像と音声とを関連付けて再生するように前記画像再生手段と前記音声再生手段とを制御する制御手段と
を備えることを特徴とするコンテンツ再生装置。
請求項１または請求項２の記載のコンテンツ再生装置であって、
前記音声データに付加されたメタデータは、当該音声データの公表日、公表国、アーティスト名、アルバム名、タイトル、ジャンル、言語、シチュエーション、検索用キーワードの１つ以上を含むことを特徴とするコンテンツ再生装置。
請求項１または請求項２に記載のコンテンツ再生装置であって、
前記画像データに付加されたメタデータは、撮影日時、被写体が意味する年代、場所、撮影時のシチュエーション、撮影時の天候、撮影時の同行者、自分との関連度、カテゴリ、検索用キーワード、写真の詳細内容のうち少なくとも一つから構成されることを特徴とする再生コンテンツ装置。
請求項１、請求項２、請求項３または請求項４に記載のコンテンツ再生装置であって、
前記取得手段によって取得されたメタデータの類義語を取得する類義語取得手段を備え、
前記検索手段は、前記類義語取得手段により取得された類義語を用いた検索をも行うことを特徴とするコンテンツ再生装置。
請求項１、請求項２、請求項３、請求項４または請求項５に記載のコンテンツ再生装置であって、
前記検索手段は検索結果に対して重み付けを行い、重み付けの大きなものを優先的に利用できるようにすることを特徴とするコンテンツ再生装置。
請求項４に記載のコンテンツ再生装置であって、
前記画像データに付加されたメタデータは、自分との関連度を示す情報を有しており、
前記検索手段は、前記画像データと自分との関連度を考慮して、検索を行うことを特徴とするコンテンツ再生装置。
請求項１、請求項２、請求項３、請求項４、請求項５、請求項６または請求項７に記載のコンテンツ再生装置であって、
前記検索手段は、再生対象のコンテンツが記録された日時と現在の日時を比較し、時間の経過量にあわせて年月日検索の曖昧度、検索範囲を変化させることを特徴とするコンテンツ再生装置。
再生する音声データに付加されたメタデータを取得する取得ステップと、
前記取得ステップにおいて取得したメタデータをもとに、静止画像あるいは動画像の画像データに対して付加されているメタデータを参照し、再生する前記音声データと関連性の高い画像データを検索する検索ステップと、
前記音声データと前記検索手段により検索された前記画像データとを関連付けて再生する再生ステップと
を有することを特徴とするコンテンツ再生方法。
再生する静止画像あるいは動画像の画像データに付加されたメタデータを取得する取得ステップと、
前記取得ステップにおいて取得したメタデータをもとに、音声データに対して付加されているメタデータを参照し、再生する前記画像データと関連性の高い音声データを検索する検索ステップと、
前記画像データと前記検索手段により検索された前記音声データとを関連付けて再生する再生ステップと
を有することを特徴とするコンテンツ再生方法。
請求項９または請求項１０の記載のコンテンツ再生方法であって、
前記音声データに付加されたメタデータは、当該音声データの公表日、公表国、アーティスト名、アルバム名、タイトル、ジャンル、言語、シチュエーション、検索用キーワードの１つ以上を含むことを特徴とするコンテンツ再生方法。
請求項９または請求項１０に記載のコンテンツ再生方法であって、
前記画像データに付加されたメタデータは、撮影日時、被写体が意味する年代、場所、撮影時のシチュエーション、撮影時の天候、撮影時の同行者、自分との関連度、カテゴリ、検索用キーワード、写真の詳細内容のうち少なくとも一つから構成されることを特徴とする再生コンテンツ方法。
請求項９、請求項１０、請求項１１または請求項１２に記載のコンテンツ再生方法であって、
前記取得ステップにおいて取得したメタデータの類義語を取得する類義語取得ステップを有し、
前記検索ステップにおいては、前記類義語取得ステップにおいて取得した類義語を用いた検索をも行うことを特徴とするコンテンツ再生方法。
請求項９、請求項１０、請求項１１、請求項１２または請求項１３に記載のコンテンツ再生方法であって、
前記検索ステップにおいては、検索結果に対して重み付けを行い、重み付けの大きなものを優先的に利用できるようにすることを特徴とするコンテンツ再生方法。
請求項１２に記載のコンテンツ再生方法であって、
前記画像データに付加されたメタデータは、自分との関連度を示す情報を有しており、
前記検索ステップにおいては、前記画像データと自分との関連度を考慮して、検索を行うことを特徴とするコンテンツ再生方法。
請求項９、請求項１０、請求項１１、請求項１２、請求項１３、請求項１４または請求項１５に記載のコンテンツ再生方法であって、
前記検索ステップにおいては、再生対象のコンテンツが記録された日時と現在の日時を比較し、時間の経過量にあわせて年月日検索の曖昧度、検索範囲を変化させることを特徴とするコンテンツ再生方法。