JP2008522311A

JP2008522311A - コンテンツアイテムの関連付けに基づく自動的なコンテンツ整理

Info

Publication number: JP2008522311A
Application number: JP2007543979A
Authority: JP
Inventors: エムアーディーデリクス，エルモ; デスライス，バルテルエムファン
Original assignee: Koninklijke Philips NV; Koninklijke Philips Electronics NV
Current assignee: Koninklijke Philips NV
Priority date: 2004-12-01
Filing date: 2005-11-30
Publication date: 2008-06-26
Also published as: KR20070086828A; US20080306930A1; WO2006059297A2; WO2006059297A3; EP1839197A2; CN101438282A

Abstract

論理データベースのコンテンツアイテムを整理する関連付けエンジンが提供される。論理データベースの第１の特定されたコンテンツアイテムの特徴データを含む第１記述データが抽出される（Ｓ１）。この処理は、さらなる利用可能な特定されたコンテンツアイテムに対して繰り返されてもよい（Ｓ３）。候補となる記述データが抽出される（Ｓ５）。その後、各候補となるコンテンツアイテムのベクトル値セットが生成され（Ｓ１１）、各ベクトル値は、第１記述データのメタデータ、使用履歴、ジャンル、コンテンツタイプなどの特徴の特徴データと、候補となる記述データの対応する特徴データとの間の類似度を表す。候補となるコンテンツアイテムからの類似する候補となるコンテンツアイテムが、生成されたベクトル値セットにより表される類似度に基づき選択され（Ｓ１５）、論理データベースの整理において第１コンテンツアイテムによりグループ化されてもよい。

Description

本発明は、データベースコンテンツ整理及び管理と、コンテンツアイテムの関連付け及びグループ化の分野に関する。

パーソナルコンピュータ上のハードドライブ及び他のタイプの記憶媒体を含む記憶装置及びデータベースの記憶容量は、近年急速に増大していてきている。記憶容量は１２ヶ月毎にほぼ２倍となり、ネットワーク帯域幅も大変急速に増大していたということが評価されてきた。この結果、記憶装置は、それらへのユーザアクセスを円滑にする必要がある大量のコンテンツを格納している。コンテンツがユーザの便利なアクセスを提供するよう何れかの方法により管理又は整理されない場合、ユーザは、記憶装置やデータベース上に格納されているコンテンツにより過大な負担を被る可能性がある。他方、ユーザに透過な方法によりグループ化されていないコンテンツは、ユーザのニーズに関する限り“欠落”したものとなるかもしれない。

記憶装置の整理のための各種スキームが存在する。Ｌａｗｌｅｒの米国特許第５，９０５，９８１号は、各メディアオブジェクトに対するキーワードを有するインデックスを含むメディアオブジェクトアーカイブのコンテンツと現在のニュース記事との関連付けについて開示している。Ｏｂｒａｄｏｒの国際公報ＷＯ２００４／０１２１０５は、インデックス付けされ、一時的に順序付けされたデータ構造から選択される１以上のデータ構造との関連性に基づくメディアオブジェクト群からのメディアオブジェクトの選択について開示している。しかしながら、これらのシステムはそれぞれ、ある種のインデックス処理、既存の順序付け及び／又はキーワードを必要とする。

もちろん、コンテンツアイテムの良好なグループ化が実現可能となるように、ユーザが記憶装置又はデータベースを手動により整理することもまた可能である。しかしながら、これは時間がかかり、面倒な作業となりうる。さらに、コンテンツアイテムが記憶装置又はデータベースに蓄積し続けると、ユーザの部分に対する継続的な介入が、データベースのアイテムの便利かつ論理的なグループ化を維持するため必要とされることとなる。

論理データベースにおいてコンテンツアイテムを整理するための関連付けエンジンの機能を実現又は実行する方法、システム、デバイス、エンジン、装置及びコンピュータ可読媒体が提供される。

これは、以下のように実現されるかもしれない。論理データベースの第１の特定されたコンテンツアイテムの特徴データを含む第１記述データが抽出されてもよい。この処理は、さらなる利用可能な特定されたコンテンツアイテムに対して繰り返されてもよい。論理データベースの候補となるコンテンツアイテムの対応する特徴データを含む候補となる記述データが、さらに抽出されてもよい。その後、各候補となるコンテンツアイテムのベクトル値セットが生成され、各ベクトル値は、第１記述データの特徴の特徴データと候補となる記述データの対応する特徴データとの間の類似度を表す。候補となるコンテンツアイテムからの類似する候補となるコンテンツアイテムが、生成されたベクトル値セットにより表される類似度に基づき選択されてもよい。従って、類似する候補となるコンテンツアイテムが、論理データベースの整理において第１コンテンツアイテムによりグループ化することが可能である。

さらに、特徴データの特徴は、アイテムのコンテンツタイプ、コンテンツスタイル若しくはジャンル、アイテムメタデータ、アイテムの使用履歴、アイテムにおいて演奏する演奏者、アイテムに係る監督若しくは制作者、又はアイテムのレンダリング要件を表すかもしれない。メタデータは、アイテムの生成時間、生成場所、取得時間及び／又は取得場所を表すことが可能であるということが、理解されるであろう。

類似する候補となるコンテンツアイテムは、ベクトル値セットによって表される合計の類似度が最小の閾値を超過する場合に限って選択されるようにしてもよい。このような閾値は、ユーザによって決定されてもよく、又は予め設定されてもよいし、又は検出された結果に応じて関連付けエンジンによって提供されてもよい。また、ユーザにより設定されるとき、ユーザはデフォルト閾値により促されるようにしてもよい。

さらに、ベクトル値セットにより表されるような最も高い合計の類似度を有する候補となるコンテンツアイテムが、選択されるようにしてもよい。

さらなる特定されたコンテンツアイテムが利用可能である場合、第１の特定されたコンテンツアイテムによりグループ化される第２の特定されたコンテンツアイテムの特徴データを含む記述データが抽出されてもよい。その後、第２の特定されたコンテンツアイテムの特徴データと類似する候補となるコンテンツアイテムの特徴データとの間の類似度を表す第２ベクトル値セットにもまた基づき、類似する候補となるコンテンツアイテムが選択されてもよい。このようなケースでは、第１ベクトル値セットと第２ベクトル値セットが平均、加重平均又は加算されるように、類似する候補となるコンテンツアイテムが選択されてもよい。

また、第１の特定されたコンテンツアイテムの特徴データが第２の特定されたコンテンツアイテムに最も近い特徴を表すベクトルである共通性ベクトルが選択され、類似する候補となるコンテンツアイテムの選択において、残りのベクトル値より大きな共通性ベクトルの値を重み付けするようにしてもよい。

また、バーチャルアイテム生成に基づくグループ化が開示される。論理データベースの第１の特定されたコンテンツアイテムの特徴データを含む第１特徴データが抽出される。また、その後に論理データベースの第２の特定されたコンテンツアイテムの特徴データを含む第２記述データが抽出される。各ベクトル値が第１記述データの特徴データの特徴と第２記述データの特徴データの対応する特徴との間の類似度を表すベクトル値のバーチャルアイテムセットを平均、加重平均又は単に和をとることによって、バーチャルアイテムは生成されるかもしれない。各候補となるコンテンツアイテムのベクトル値セットが生成され、各ベクトル値は、バーチャルコンテンツアイテムの特徴の特徴データと候補となるコンテンツアイテムの対応する特徴データの対応する特徴との間の類似度を表す。その後、候補となるコンテンツアイテムの各ベクトル値セットの平均、加重平均及び／又は和をテスト値として計算し、閾値を超過するテスト値を有する候補となるコンテンツアイテムを類似する候補となるコンテンツアイテムとして決定することによって、類似する候補となるコンテンツアイテムが、候補となるコンテンツアイテムから選択される。類似する候補となるコンテンツアイテムは、論理データベースの整理において第１コンテンツアイテムによりグループ化される。

以下の説明及び上記図面は、発明者によって現在最も良く理解されるような出願人の発明の実施例を記載するが、本発明の多くの改良が可能であり、本発明が、本発明の趣旨から逸脱することなく他の形式により実現され、また他の方法により実現されてもよいということが理解されるであろう。さらに、記載される実施例のいくつかの特徴は、本発明の趣旨から逸脱することなく、省略され、選択的に若しくは全体的に他の実施例と組み合わされ、又は他の実施例若しくはその一部の特徴を置換するのに利用されてもよい。従って、図面及び詳細な説明は、本発明のいくつかの側面の例示的な説明として解釈されるべきものであり、本発明の範囲を限定するものと解釈されるべきでない。

図１に示されるように、関連付けエンジン１−１は、後述されるいくつかのモジュールを有する。関連付けエンジン１−１のモジュール、それの一部及び／又は関連付けエンジンの全体は、ハードウェア、ソフトウェア、ファームウェア又は上記の組み合わせから構成可能であるが、いくつかのモジュールはハードウェアなどから構成され、他のモジュールはソフトウェア、ファームウェア又はそれらの組み合わせから構成されるようにしてもよい。

関連付けエンジンのすべてのモジュールが同一の装置に配置又は統合されている必要はないということが理解されるであろう。分散化されたアーキテクチャはまた、既存の装置によって提供される適切なモジュールから“ピギーバック（ｐｉｇｇｙ−ｂａｃｋ）”する関連付けエンジンについて考えられる。

以下の説明は、有線又は無線接続を介し論理データベース１−２に物理的に一体化又は接続される関連付けエンジン１−１について言及する。論理データベース１−２は、パーソナルコンピュータ、パーソナルビデオレコーダ、エンターテイメントシステム、エレクトロニックオーガナイザ、パーソナル携帯装置、Ｊａｚドライブのハードドライブなどの記憶装置により実現されてもよく、又はディスクドライブなどの商用の記憶装置として実現されてもよい。論理データベース１−２は、このような装置の２以上におけるコンテンツアイテムの整理又はグループ化が可能となるように、接続されるいくつかの記憶装置を含むかもしれないということは理解されるであろう。さらに、論理データベースは、論理データベース１−２にロード及びそれにより抽出可能なＣＤ、ＤＶＤ、ｚｉｐディスク、フロッピー（登録商標）ディスク、データカートリッジなどを含むディスクなどの１以上の記憶媒体を含むものであると理解されるかもしれないということは理解されるであろう。さらに、論理データベースは、ネットワークやインターネットなどを介しリモートアクセスされてもよい。

図１に示されるように、関連付けエンジン１−１は、コンテンツアイテムから特定のタイプのデータを収集するモジュールである記述データ抽出装置１−１１を含む。コンテンツアイテムは、ビデオ、ビデオクリップ、ムービー、フォト、テキストファイル、音楽データ、オーディオファイル、又はＪＰＥＧファイルやＸＭＬデータなどの他のタイプのマルチメディアデータであってもよい。例えば、ビデオは、デジタルビデオレコーダ上のホームビデオショットであってもよく、ムービーは、ＭＰＥＧ（ＭＰＥＧ−２、ＭＰＥＧ−３などを含む）として符号化されたフィルムなどの市販のフィルムデータであってもよく、フォトは、デジタル写真データ、写真又は写真アルバム群であってもよい。テキストファイルは、ワープロにより生成されたファイル、スプレッドシート、又はコンピュータコードファイルであってもよい。音楽データは、ＭＰ３ファイルなどであってもよい。

記述データ抽出装置１−１１により抽出された記述データは、コンテンツアイテムに関する情報を含む。このような記述データは、コンテンツアイテムの特徴を記述している。このような特徴は、以下を含むかもしれない。
・ビデオ、オーディオ、フォト、テキストファイルなど媒体を含むコンテンツタイプ
・休日の映画、個人用の風景写真、ジャズ音楽などのコンテンツスタイル又はジャンル
・アイテムの作成時間及び／又は場所、アイテムの取得時間及び／又は場所などのアイテムのメタデータ
・最後の／最初の／最後から２番目などの、再生若しくは／及び編集の時間、場所及び／若しくはコンテクスト、最も良く使用される時間（例えば、午前６〜９時が、コンテンツアイテムが最も良く使用された時間であったなど）、最近使用した場所、最も良く使用された場所（例えば、自宅やリビングが、コンテンツアイテムが最も良く使用された場所であったなど）などのアイテムの使用履歴（ときには、この使用履歴はまた、アイテムのメタデータとして知られる）
・コンテンツアイテムに関する俳優、監督、制作者、アーチスト、演奏者、撮影者など
アイテムに関するこのような記述データは、アイテムから、インデックス又はデータベース管理ファイルから、インターネットとの有線又は無線接続を介し関連付けエンジン１−１に接続されるワールドワイドウェブなどの外部ソースからを含む各種方法により配置及び抽出されてもよいということが理解されるであろう。

特定されたコンテンツアイテムは、いくつかの方法の１つにより特定されてもよい。ユーザは、それによりコレクションの他のアイテムがグループ化されるべきアンカーアイテムとしてアイテムを指定してもよい。これにより、ユーザは、論理データベース１−２の１−１及び関連付けによって検出される他の同様のアイテムをグループ化するためのアンカーとしてアイテムを選択してもよい。あるいは、新たに追加又は生成されたコンテンツアイテムは、それに基づき論理データベースの他のアイテムがグループ化される特定されたコンテンツアイテムとして自動的に指定されてもよい。さらに、システムは、特定されたコンテンツアイテムとして孤立した又はグループ化されていないコンテンツアイテムを特定されたアイテムとして特定し、それとのグループ化のためコンテンツアイテムを選択しようとしてもよい。

記述データ抽出装置１−１１により抽出された記述データの上記編集された特徴に基づき、同様のアイテム選択装置１−１２が、その記述データの特徴に関して第１の特定されたコンテンツアイテムと類似した候補となるコンテンツアイテムを論理データベースにおいて特定する。その後、ベクトル生成装置１−１３が、各ベクトルがある特徴に対応し、このベクトルの値が候補となるコンテンツアイテムと第１の特定されたコンテンツアイテムの特徴のマッチング又は類似度を反映するように、ベクトル値を各ベクトルに割り当てることによって第１のベクトル値のセットを生成する。

例えば、スタイル又はジャンルと称されるコンテンツアイテムの特徴に対応するベクトルは、特定されたコンテンツアイテムと候補となるコンテンツアイテムの双方が、“スペインの休日”などの同一のジャンルのものである場合には、高い値を有することとなる。１又は０のベクトル値は、第１の特定されたコンテンツアイテムと候補となるコンテンツアイテムとの間の特定の特徴に対する相関又は一致がほとんど又は全くないことを示すかもしれず、９又は１０のベクトル値は、類似度又は一致度が高いことを示すかもしれない。例えば、双方のコンテンツアイテムが“スペインの休日”のジャンルを有するとき、当該ジャンル特徴に対応するベクトルに対して、９又は１０の値が割り当てられるであろう。あるいは、１〜１０のスケールを使用する代わりに、ベクトル値は単に、当該特徴の“強い”、“通常の”又は“弱い”一致を表すかもしれない。このようなベクトル値の他の多くのスキームが、本発明の趣旨から逸脱することなく利用可能であるということは理解されるであろう。コンテンツアイテムのペアのこのようなベクトル値のセットの平均値又は和は、その後、これら２つのコンテンツアイテムの間の全体的な類似度として計算されるであろう。

第２の特定されたコンテンツアイテムが利用可能である場合、第２のベクトル値セットが、この第２の特定されたコンテンツアイテムと候補となるコンテンツアイテムとの対応する特徴の間の類似度を表すように、第２コンテンツアイテムについて記述データ抽出装置１−１１により抽出された記述データに基づき、ベクトル生成装置１−１３によって同様にして構成されるかもしれない。さらに利用可能な特定されるコンテンツアイテムが存在するかもしれない。従って、上記記述データ抽出及びベクトル値セットの生成は、任意数の利用可能な特定されたコンテンツアイテム１〜Ｎ（Ｎは、１より大きな正の整数である）について繰り返されるようにしてもよい。その後、このように生成されたすべてのベクトル値又はそれらの平均値に基づき、候補となるコンテンツアイテムの選択が行われる。

複数の特定されたコンテンツアイテムが利用可能である場合、共通性ベクトル生成／閾値設定装置１−１４が、第１セット及び第２セットのベクトル値が一貫して高いものとなる１以上のベクトルを選択するようにしてもよい。このようなベクトル値は、２つのアイテムの間の全体的な類似度を表すベクトル値セットの平均値又は和におけるその他のベクトルの値より大きく重み付けされてもよい。このように、第１及び第２の特定されたコンテンツアイテムを表し、又は第１の特定されたコンテンツアイテムと第２の特定されたコンテンツアイテムとの間の類似性を取得し、これにより、形成されるグループの特徴となる（グループにすでにあるコンテンツアイテムに基づき）特徴は、他のベクトル値より大きな重み付けがされる。単一のモジュール１−１４の一部として示されているが、個別のモジュール、共通性ベクトル生成モジュール及び閾値設定モジュールは、関連付けエンジン１−１の一部として構成されてもよく、又はこのようなモジュールは他のモジュールに搭載されてもよい。

本発明の実施例の処理の説明に関して、バーチャルアイテム生成装置１−１５が以下に説明される。

コントローラ１−１６は、他の装置とのインタフェース、ユーザ（図示せず）とのインタフェースを含む外部との通信など、関連付けエンジンの処理について必要な他のタスクを処理する。コントローラ１−１６はまた、関連付けエンジン１−１のモジュールの全体制御及び調整を処理する。

グループ整理装置１−１７は、関連付けエンジン１−１により取得されたベクトル値に基づき、グループ化信号を論理データベース１−２に提供する。ユーザインタフェース１−３は、独立した装置であってもよく、又はパーソナルコンピュータ、パーソナルビデオレコーダ、又は上述した他の装置及びストレージの１以上などの他の装置又はシステムと統合されてもよい。

本発明の実施例の処理が、図１〜３を参照して説明される。図１に示されるユーザインタフェース１−３を介しユーザによって、又は自動的にシステムによって、例えば、論理データベース１−２における新たに追加されたコンテンツアイテム又は孤立したコンテンツアイテムを検出することによって、上述したように第１コンテンツアイテムが特定される。

関連付けエンジン１−１の記述データ抽出装置１−１１は、図２ＡのＳ１において示されるように、特定された第１コンテンツアイテムの第１記述データを抽出する。図３は、特定されたコンテンツアイテム１を参照する６−１１によりラベル付けされたボックスを示す。Ｓ２において、第１の特定されたコンテンツアイテムの各特徴についての特徴データが編集される。グループ化又は整理されるコンテンツアイテムのタイプとデータベース又は記憶装置に応じて、上述した特徴の一部又はすべてがより関連性が高いものであり、他のものが完全に関連がなく、本発明による関連付けエンジンによって使用されないことが理解される。また、ここに明示的には記載されていない他の特徴が、特に関連があり、関連付けエンジン１−１により使用されるようにしてもよい。

図３において６−１２として示されるさらなる第２の特定されたコンテンツアイテムが利用可能であるか、又は特定されている場合、ステップＳ３及びＳ４が実行され、Ｓ３では、特定されたコンテンツアイテムの記述データが抽出され、Ｓ４において、第２の特定されたコンテンツアイテムの各特徴の特徴データが編集される。図３に示されるように、いくつかのコンテンツアイテムが、それについて他のコンテンツアイテムのグループ化が所望されるアンカーコンテンツアイテムとして特定されるようにしてもよい。図３は、第１の特定されたコンテンツアイテム６−１１、第２の特定されたコンテンツアイテム６−１２及び特定されたコンテンツアイテムＮの６−１４によるテーブル６−１を示す。従って、当該処理は、第１〜Ｎの特定された各コンテンツアイテムについて繰り返されてもよい。

図１の同様のコンテンツアイテム選択装置１−１２は、論理データベース１−２の候補となるコンテンツアイテムを特定し、記述データ抽出装置１−１１は、Ｓ５（図２Ａ）において候補となる各コンテンツアイテムについて記述データを抽出し、Ｓ６において各コンテンツアイテムの特徴データを編集する。ステップＳ７において、検出される場合、第２の候補となるコンテンツアイテム（ボックス６−２２により示される）の対応する記述データを抽出する処理が実行され、その後Ｓ８において、第２の候補となるコンテンツアイテムの特徴データの編集が実行される。

本発明の一特徴によると、ステップＳ９において、システム設定又はユーザの設定若しくは現在のコマンドに応じて、バーチャルアイテムが候補となるコンテンツアイテムの類似性を決定するための基礎として生成されることが決定されてもよく、その場合、処理が図２Ｃに示されるように実行される。そうでない場合には、処理は図２Ｂに示されるように実行される。

候補となる各コンテンツアイテムの対応する特徴による特定された各コンテンツアイテムの各特徴の類似性及び一致に基づき、図２ＢのＳ１１に示されるように、ベクトル生成装置１−１３によりベクトル値が生成される。図３は、第１の候補となるコンテンツアイテム６−２１と第１の特定されたコンテンツアイテム６−１１の対応する特徴の類似度を反映する値のベクトルセット６−３を示す。同様に、ベクトル値セット６−４は、第２の候補となるコンテンツアイテム６−２２と第１の特定されたコンテンツアイテム６−１１の特徴の類似性を反映する。第２の特定されたコンテンツアイテム６−１２に関して、ベクトル値セット６−５は、第１の候補となるコンテンツアイテム６−２１との対応する特徴の類似度を反映し、ベクトル値セット６−６は、候補となるコンテンツアイテム６−２２との第２の特定されたコンテンツアイテム６−１２の特徴の間の類似度を反映する。

各ベクトル値セットはまた、コンテンツアイテムのペアの平均類似性を反映する、当該セットのベクトル値の平均値の計算に基づきＳ１２において決定される平均ベクトル値を含むものであってもよい。ここで示される平均という用語は、算術平均、モード、メディアン、和又は他の同様の統計的機能の１以上を含むものであってもよい。従って、例えば、図３のベクトル値６−３は、第１ベクトル値、第２ベクトル値、第ｈベクトル値及び当該セットの平均値を含むものであってもよい。

さらなる特定されたコンテンツアイテムもまた利用可能であるかもしれず、特徴データを抽出し、候補となるコンテンツアイテムの対応する特徴による類似性に基づきベクトル値を検出する処理が続けられる。図３のボックス１−１４は、特定されたコンテンツアイテムＭを示す。

また、さらなる候補となるコンテンツアイテムが検出されてもよく、それぞれについて、ベクトル値セットが、特定された各コンテンツアイテムについて計算可能である。ボックス６−２３は、このような候補となるコンテンツアイテムＭを参照する。

本発明の実施例によると、Ｓ１３において、共通性ベクトル値セットが、特定されたコンテンツアイテムの間の特徴の類似性に基づき決定される。従って、最も類似する特徴が特定され、代表するベクトルは、その他のベクトルより大きな重み付けをすることが可能であり、又は排他的に利用することが可能である。このように、第１及び第２の（及びさらなる）特定されたコンテンツアイテムを表し、このため、特定されたコンテンツアイテムの間の類似性を有する傾向があり、このため、生成されるグループについて特徴となる特徴は、他のベクトル値より大きな重み付けがされるか、又は類似する候補となるコンテンツアイテムを決定するためだけに使用されることとなる。

Ｓ１４において、候補となるコンテンツアイテム６−２１の対応するベクトル値を平均化又は加算することによって、候補となる各コンテンツアイテムの各特徴についての全体的な類似性を反映するさらなるベクトル値セット６−８が計算されてもよい。従って、例えば、当該候補となるコンテンツアイテムについて各ベクトル値セットの対応するベクトル値を加算又は平均化することによって、当該特徴について特定されたコンテンツアイテムとの全体的な類似度が、第１の候補となるコンテンツアイテムについて取得される。さらに、セット６−８のすべてのベクトル値が、当該候補となるコンテンツアイテムの合計の類似性を取得するため、加算又は平均化されてもよい。

ここで使用される平均とは、算術平均、モード、メディアン又は選択された値の合成的な視点を適切に提供するのに選択される他の統計的機能を含むものであってもよいということが理解されるであろう。さらに、これらの値の単純和が、このような統計的な機能と共に利用されてもよい。コンテンツアイテムのタイプと、ユーザのニーズ及びデータベースに応じて、コンテンツアイテムの特定の特徴のすべてが他のものより重要であり、このため、他のものより特定の特徴に対応するベクトルを大きく重み付けすることが有用であるかもしれない。このようなファクタが重み付けされる程度は、ユーザのニーズとアプリケーションに依存する。全体的な類似性セット６−８のベクトル値が生成されると、図２ＢのＳ１５に示されるように、最小の類似性閾値が非類似の候補となるコンテンツアイテムを排除するのに利用可能である。

さらに、アプリケーション及びユーザのニーズに応じて、各閾値が各種ベクトルに利用可能であることが考えられる。このため、ベクトル値が閾値を充足又は超過する候補となるコンテンツアイテムは、グループ整理装置１−１７により特定されたコンテンツアイテムによりグループ化され、他の候補となるコンテンツアイテムは拒絶される。あるいは、最も類似する候補となるコンテンツアイテム又は所定数の最も類似する候補となるコンテンツアイテムが、特定されたコンテンツアイテムによるグループ化のため選択され、残りの候補となるコンテンツアイテムは拒絶されてもよい。

この（又はこれらの）選択された候補となるコンテンツアイテムが、Ｓ１６において特定されたコンテンツアイテムによりグループ化される。グループ化信号は、特定されたコンテンツアイテムによる選択された同様の候補となるコンテンツアイテムのグループ化又は再グループ化を実行するため、データベース１−２に直接提供されるか、又はユーザ（図示せず）に推奨されるグループ化又は再グループ化を通知するためユーザインタフェース１−３に提供されるようにしてもよい。類似するコンテンツアイテムの特定、類似するコンテンツアイテムの記述、類似するコンテンツアイテムへのＵＲＬ又はリンク、若しくは類似するコンテンツアイテムの全体若しくはその一部の表示若しくは再生、又は上記の組み合わせから整理されるユーザへの通知がまた提供されてもよい。Ｓ１７において、処理は終了する。

図２Ｃは、本発明の一特徴によるバーチャルコンテンツアイテムを利用する処理を示す。Ｓ２１において、バーチャルアイテム生成装置１−１５が、それに基づきグループ化が行われる特定されたコンテンツアイテムの特徴を解析する。Ｓ２２において、バーチャルコンテンツアイテム６−１５と呼ばれる特定されたコンテンツアイテムのすべてについての代表的なコンテンツアイテムが、特定されたコンテンツアイテムの平均又は加重平均特徴に基づき構成される。例えば、特定されたコンテンツアイテムのすべてが“スペインの休日”というジャンルである場合、バーチャルコンテンツアイテムはまた、それのジャンルとして“スペインの休日”を有することとなる。その後Ｓ２３において、候補となるコンテンツアイテムと当該バーチャルコンテンツアイテムの特徴の類似性に基づき、ベクトル値セット６−７が生成される。Ｓ２４において、類似する候補となるコンテンツアイテムを選択するのに適用される閾値が選択され、又は最も高いスコアの候補となるコンテンツアイテムが選択される。

同様に閾値を用いて選択される候補となるコンテンツアイテムに基づき、又は選択される最も類似する候補となる所定数のコンテンツアイテムに基づき、Ｓ２５において、グループ化信号が、図１に示される関連付けエンジン１−１の１−１７によって、有線又は無線により送信される。上述されるように、この信号は、特定されたコンテンツアイテムにより選択された類似する候補となるコンテンツアイテムのグループ化又は再グループ化を実行させるため、データベース１２に直接提供されてもよく、又はユーザ（図示せず）に推奨されたグループ化又は再グループ化を通知するため、ユーザインタフェース１−３に提供されてもよい。Ｓ２６において、処理は終了する。

例えば、ユーザが論理データベースの最近のスペインの休日の写真を表すデジタルデータを編集しており、データベースにおいて、他の接続された記憶媒体において、又はインターネットを介し利用可能なスペインのテーマの他のコンテンツアイテムを検出することを所望していると仮定する。ユーザは、これら３つの写真を特定されたコンテンツアイテム１、特定されたコンテンツアイテム２及び特定されたコンテンツアイテム３としてそれぞれユーザインタフェース１−３を介し選択するようにしてもよい。その後、関連付けエンジンが、特定されたコンテンツアイテム１−３により類似した候補となるコンテンツアイテムとして検出されたスペイン音楽を表すデータファイルをグループ化する。ユーザは、スペイン音楽の存在を覚えておらず、それを検索すべき場所を覚えていない。実際、このデータファイルは、論理データベース１−２へのアクセスにより他のユーザによって追加されたか、又は他の記憶装置から関連付けエンジン１−１により抽出されたものであるかもしれない。何れのイベントでも、ユーザには類似したコンテンツアイテムが通知されるか、及び／又は類似したコンテンツアイテムが、特定されたコンテンツアイテムによってグループ化される。その後、ユーザは、スペインの休日の写真の閲覧をスペイン音楽と共にすることが可能となる。

上記説明により提供された本発明の実施例は、単なる例示的な実施例として意図されている。しかしながら、本発明の範囲は請求項に与えられるということは理解されるであろう。

図１は、本発明の実施例による関連付けエンジンの概略図である。図２Ａは、本発明によるシステムの処理のフローチャートである。図２Ｂは、本発明によるシステムの処理のフローチャートである。図２Ｃは、本発明によるシステムの処理のフローチャートである。図３は、本発明の実施例によるベクトル値配置のデータ図を示す。

Claims

論理データベースのコンテンツアイテムを整理する方法であって、
前記論理データベースの第１の特定されたコンテンツアイテムの特徴データを含む第１記述データを抽出するステップと、
前記論理データベースの候補となるコンテンツアイテムの対応する特徴データを含む候補となる記述データを抽出するステップと、
各候補となるコンテンツアイテムに対して、各ベクトル値が前記第１記述データの特徴に対する前記特徴データと前記候補となる記述データの前記対応する特徴データとの間の類似度を表す第１ベクトル値セットを生成するステップと、
前記生成された第１ベクトル値セットによって表される前記類似度に基づき、前記候補となるコンテンツアイテムから類似する候補となるコンテンツアイテムを選択するステップと、
前記論理データベースの整理において前記コンテンツアイテムにより前記類似する候補となるコンテンツアイテムをグループ化するステップと、
を有する方法。
前記特徴データの特徴は、前記アイテムのコンテンツタイプ、前記アイテムのコンテンツスタイル、前記アイテムのジャンル、前記アイテムの使用履歴、前記アイテムにおいて演奏している演奏者、前記アイテムに係る監督、前記アイテムに係る制作者、前記アイテムのレンダリング要件、及び前記アイテムの何れかのメタデータの１つを表す、請求項１記載の方法。
前記メタデータは、前記アイテムの生成時間、前記アイテムの生成場所、前記アイテムの取得時間、前記アイテムの取得場所、直近の使用時間、最も頻繁に使用される時間、直近の使用場所、及び最も頻繁に使用される場所の１つを表す、請求項２記載の方法。
前記類似した候補となるコンテンツアイテムは、前記第１ベクトル値セットによって表される合計の類似度が最小の閾値を超過する場合に限って、前記類似した候補となるコンテンツアイテムが選択される、請求項１記載の方法。
前記第１ベクトル値セットにより表されるような前記最も高い合計の類似度を有する前記候補となるコンテンツアイテムが、選択される、請求項１記載の方法。
前記第１の特定されたコンテンツアイテムによりグループ化されるＮ番目（Ｎは、１より大きな任意の正の整数）のコンテンツアイテムの前記特徴データを含む記述データを抽出するステップと、
前記Ｎ番目の特定されたコンテンツアイテムの特徴データと前記類似する候補となるコンテンツアイテムの特徴データとの間の類似度を表す第Ｎベクトル値セットにもまた基づき、前記類似する候補となるコンテンツアイテムを自動的に選択するステップと、
をさらに有する、請求項１記載の方法。
前記類似する候補となるコンテンツアイテムは、前記第１ベクトル値セットと前記第Ｎベクトル値セットが平均、加重平均又は加算されるように選択される、請求項６記載の方法。
前記第１の特定されたコンテンツアイテムの特徴データが前記Ｎ番目の特定されたコンテンツアイテムに最も近い特徴を表すベクトルを共通ベクトルとして選択し、前記類似する候補となるコンテンツアイテムの選択において、前記第Ｎベクトル値セット及び前記第１ベクトル値セットの残りのベクトル値より大きな共通性ベクトルの値を重み付けするステップを有する、請求項６記載の方法。
論理データベースのコンテンツアイテムを整理する方法であって、
前記論理データベースの第１の特定されたコンテンツアイテムの特徴データを含む第１記述データを抽出するステップと、
前記論理データベースのＮ番目（Ｎは、１より大きな任意の正の整数）の特定されたコンテンツアイテムの特徴データを含む第Ｎ記述データを抽出するステップと、
前記論理データベースの候補となるコンテンツアイテムの対応する特徴データを含む候補となる記述データを抽出するステップと、
前記第１記述データの特徴データの特徴と前記第Ｎ記述データの特徴データの対応する特徴との間の類似度を表す各ベクトル値を有するベクトル値のバーチャルアイテムセットを平均又は加重平均することによって、バーチャルアイテムを生成するステップと、
各候補となるコンテンツアイテムに対して、前記バーチャルコンテンツアイテムの特徴の特徴データと前記候補となるコンテンツアイテムの対応する特徴データとの間の類似度を表す各ベクトル値を有するベクトル値セットを生成するステップと、
前記候補となるコンテンツアイテムの各ベクトル値セットの平均、加重平均及び和の１つをテスト値として計算することによって、前記候補となるコンテンツアイテムから類似する候補となるコンテンツアイテムを選択するステップと、
前記論理データベースの整理において前記第１コンテンツアイテムにより前記類似する候補となるコンテンツアイテムをグループ化するステップと、
を有する方法。
論理データベースのコンテンツアイテムを整理するシステムであって、
前記論理データベースの第１の特定されたコンテンツアイテムの特徴データを含む第１記述データを抽出し、さらに前記論理データベースの候補となるコンテンツアイテムの対応する特徴データを含む候補となる記述データを抽出するよう構成される記述データ抽出装置と、
各候補となるコンテンツアイテムに対して、前記第１記述データの特徴の前記特徴データと前記候補となる記述データの対応する特徴データとの間の類似度を表す各ベクトル値を有する第１ベクトル値セットを生成するよう構成されるベクトル生成装置と、
前記生成された第１ベクトル値セットによって表される類似度に基づき、前記候補となるコンテンツアイテムから類似する候補となるコンテンツアイテムを選択するよう構成される共通性ベクトル生成装置／閾値設定装置と、
前記論理データベースにおいて前記第１のコンテンツアイテムにより前記類似する候補となるコンテンツアイテムをグループ化するよう構成されるグループ整理装置と、
を有するシステム。
前記特徴データの特徴は、前記アイテムのコンテンツタイプ、前記アイテムのコンテンツスタイル、前記アイテムのジャンル、前記アイテムの使用履歴、前記アイテムにおいて演奏している演奏者、前記アイテムに係る監督、前記アイテムに係る制作者、前記アイテムのレンダリング要件、及び前記アイテムの何れかのメタデータの１つを表す、請求項１０記載のシステム。
前記メタデータは、前記アイテムの生成時間、前記アイテムの生成場所、前記アイテムの取得時間、前記アイテムの取得場所、直近の使用時間、最も頻繁に使用される時間、直近の使用場所、及び最も頻繁に使用される場所の１つを表す、請求項１１記載のシステム。
前記共通性ベクトル生成装置／閾値設定装置は、前記第１ベクトル値セットにより表される合計の類似度が最小の閾値を超過する場合に限って、前記類似する候補となるコンテンツアイテムを選択するよう構成される、請求項１０記載のシステム。
前記共通性ベクトル生成装置／閾値設定装置はさらに、前記第１ベクトル値セットにより表されるような最も高い合計の類似度を有する前記候補となるコンテンツアイテムを前記類似する候補となるコンテンツアイテムを選択するよう構成される、請求項１０記載のシステム。
前記記述データ抽出装置はさらに、前記第１の特定されたコンテンツアイテムによりグループ化されたＮ番目（Ｎは、１より大きな任意の正の整数）の特定されたコンテンツアイテムの特徴データを含む特徴データを抽出するよう構成され、
前記共通性ベクトル生成装置／閾値設定装置は、前記Ｎ番目の特定されたコンテンツアイテムの特徴データと前記類似する候補となるコンテンツアイテムの特徴データとの間の類似度を表す第Ｎベクトル値セットにもまた基づき、前記類似する候補となるコンテンツアイテムを自動的に選択するよう構成される、請求項１０記載のシステム。
前記共通性ベクトル生成装置／閾値設定装置は、前記第１ベクトル値セットと前記第Ｎベクトル値セットが平均、加重平均又は加算されるように、前記類似する候補となるコンテンツアイテムを選択するよう構成される、請求項１５記載のシステム。
前記共通性ベクトル生成装置／閾値設定装置は、前記第１の特定されたコンテンツアイテムの特徴データが前記Ｎ番目の特定されたコンテンツアイテムに最も近い特徴を表すベクトルを共通ベクトルとして選択し、前記類似する候補となるコンテンツアイテムの選択において、前記第Ｎベクトル値セット及び前記第１ベクトル値セットの残りのベクトル値より大きな共通性ベクトルの値を重み付けする、請求項１５記載のシステム。