JP2008522311A - コンテンツアイテムの関連付けに基づく自動的なコンテンツ整理 - Google Patents
コンテンツアイテムの関連付けに基づく自動的なコンテンツ整理 Download PDFInfo
- Publication number
- JP2008522311A JP2008522311A JP2007543979A JP2007543979A JP2008522311A JP 2008522311 A JP2008522311 A JP 2008522311A JP 2007543979 A JP2007543979 A JP 2007543979A JP 2007543979 A JP2007543979 A JP 2007543979A JP 2008522311 A JP2008522311 A JP 2008522311A
- Authority
- JP
- Japan
- Prior art keywords
- item
- content item
- candidate
- vector
- feature data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/907—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/908—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/907—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/40—Data acquisition and logging
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Library & Information Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Computer Hardware Design (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
論理データベースのコンテンツアイテムを整理する関連付けエンジンが提供される。論理データベースの第1の特定されたコンテンツアイテムの特徴データを含む第1記述データが抽出される(S1)。この処理は、さらなる利用可能な特定されたコンテンツアイテムに対して繰り返されてもよい(S3)。候補となる記述データが抽出される(S5)。その後、各候補となるコンテンツアイテムのベクトル値セットが生成され(S11)、各ベクトル値は、第1記述データのメタデータ、使用履歴、ジャンル、コンテンツタイプなどの特徴の特徴データと、候補となる記述データの対応する特徴データとの間の類似度を表す。候補となるコンテンツアイテムからの類似する候補となるコンテンツアイテムが、生成されたベクトル値セットにより表される類似度に基づき選択され(S15)、論理データベースの整理において第1コンテンツアイテムによりグループ化されてもよい。
Description
本発明は、データベースコンテンツ整理及び管理と、コンテンツアイテムの関連付け及びグループ化の分野に関する。
パーソナルコンピュータ上のハードドライブ及び他のタイプの記憶媒体を含む記憶装置及びデータベースの記憶容量は、近年急速に増大していてきている。記憶容量は12ヶ月毎にほぼ2倍となり、ネットワーク帯域幅も大変急速に増大していたということが評価されてきた。この結果、記憶装置は、それらへのユーザアクセスを円滑にする必要がある大量のコンテンツを格納している。コンテンツがユーザの便利なアクセスを提供するよう何れかの方法により管理又は整理されない場合、ユーザは、記憶装置やデータベース上に格納されているコンテンツにより過大な負担を被る可能性がある。他方、ユーザに透過な方法によりグループ化されていないコンテンツは、ユーザのニーズに関する限り“欠落”したものとなるかもしれない。
記憶装置の整理のための各種スキームが存在する。Lawlerの米国特許第5,905,981号は、各メディアオブジェクトに対するキーワードを有するインデックスを含むメディアオブジェクトアーカイブのコンテンツと現在のニュース記事との関連付けについて開示している。Obradorの国際公報WO2004/012105は、インデックス付けされ、一時的に順序付けされたデータ構造から選択される1以上のデータ構造との関連性に基づくメディアオブジェクト群からのメディアオブジェクトの選択について開示している。しかしながら、これらのシステムはそれぞれ、ある種のインデックス処理、既存の順序付け及び/又はキーワードを必要とする。
もちろん、コンテンツアイテムの良好なグループ化が実現可能となるように、ユーザが記憶装置又はデータベースを手動により整理することもまた可能である。しかしながら、これは時間がかかり、面倒な作業となりうる。さらに、コンテンツアイテムが記憶装置又はデータベースに蓄積し続けると、ユーザの部分に対する継続的な介入が、データベースのアイテムの便利かつ論理的なグループ化を維持するため必要とされることとなる。
論理データベースにおいてコンテンツアイテムを整理するための関連付けエンジンの機能を実現又は実行する方法、システム、デバイス、エンジン、装置及びコンピュータ可読媒体が提供される。
これは、以下のように実現されるかもしれない。論理データベースの第1の特定されたコンテンツアイテムの特徴データを含む第1記述データが抽出されてもよい。この処理は、さらなる利用可能な特定されたコンテンツアイテムに対して繰り返されてもよい。論理データベースの候補となるコンテンツアイテムの対応する特徴データを含む候補となる記述データが、さらに抽出されてもよい。その後、各候補となるコンテンツアイテムのベクトル値セットが生成され、各ベクトル値は、第1記述データの特徴の特徴データと候補となる記述データの対応する特徴データとの間の類似度を表す。候補となるコンテンツアイテムからの類似する候補となるコンテンツアイテムが、生成されたベクトル値セットにより表される類似度に基づき選択されてもよい。従って、類似する候補となるコンテンツアイテムが、論理データベースの整理において第1コンテンツアイテムによりグループ化することが可能である。
さらに、特徴データの特徴は、アイテムのコンテンツタイプ、コンテンツスタイル若しくはジャンル、アイテムメタデータ、アイテムの使用履歴、アイテムにおいて演奏する演奏者、アイテムに係る監督若しくは制作者、又はアイテムのレンダリング要件を表すかもしれない。メタデータは、アイテムの生成時間、生成場所、取得時間及び/又は取得場所を表すことが可能であるということが、理解されるであろう。
類似する候補となるコンテンツアイテムは、ベクトル値セットによって表される合計の類似度が最小の閾値を超過する場合に限って選択されるようにしてもよい。このような閾値は、ユーザによって決定されてもよく、又は予め設定されてもよいし、又は検出された結果に応じて関連付けエンジンによって提供されてもよい。また、ユーザにより設定されるとき、ユーザはデフォルト閾値により促されるようにしてもよい。
さらに、ベクトル値セットにより表されるような最も高い合計の類似度を有する候補となるコンテンツアイテムが、選択されるようにしてもよい。
さらなる特定されたコンテンツアイテムが利用可能である場合、第1の特定されたコンテンツアイテムによりグループ化される第2の特定されたコンテンツアイテムの特徴データを含む記述データが抽出されてもよい。その後、第2の特定されたコンテンツアイテムの特徴データと類似する候補となるコンテンツアイテムの特徴データとの間の類似度を表す第2ベクトル値セットにもまた基づき、類似する候補となるコンテンツアイテムが選択されてもよい。このようなケースでは、第1ベクトル値セットと第2ベクトル値セットが平均、加重平均又は加算されるように、類似する候補となるコンテンツアイテムが選択されてもよい。
また、第1の特定されたコンテンツアイテムの特徴データが第2の特定されたコンテンツアイテムに最も近い特徴を表すベクトルである共通性ベクトルが選択され、類似する候補となるコンテンツアイテムの選択において、残りのベクトル値より大きな共通性ベクトルの値を重み付けするようにしてもよい。
また、バーチャルアイテム生成に基づくグループ化が開示される。論理データベースの第1の特定されたコンテンツアイテムの特徴データを含む第1特徴データが抽出される。また、その後に論理データベースの第2の特定されたコンテンツアイテムの特徴データを含む第2記述データが抽出される。各ベクトル値が第1記述データの特徴データの特徴と第2記述データの特徴データの対応する特徴との間の類似度を表すベクトル値のバーチャルアイテムセットを平均、加重平均又は単に和をとることによって、バーチャルアイテムは生成されるかもしれない。各候補となるコンテンツアイテムのベクトル値セットが生成され、各ベクトル値は、バーチャルコンテンツアイテムの特徴の特徴データと候補となるコンテンツアイテムの対応する特徴データの対応する特徴との間の類似度を表す。その後、候補となるコンテンツアイテムの各ベクトル値セットの平均、加重平均及び/又は和をテスト値として計算し、閾値を超過するテスト値を有する候補となるコンテンツアイテムを類似する候補となるコンテンツアイテムとして決定することによって、類似する候補となるコンテンツアイテムが、候補となるコンテンツアイテムから選択される。類似する候補となるコンテンツアイテムは、論理データベースの整理において第1コンテンツアイテムによりグループ化される。
以下の説明及び上記図面は、発明者によって現在最も良く理解されるような出願人の発明の実施例を記載するが、本発明の多くの改良が可能であり、本発明が、本発明の趣旨から逸脱することなく他の形式により実現され、また他の方法により実現されてもよいということが理解されるであろう。さらに、記載される実施例のいくつかの特徴は、本発明の趣旨から逸脱することなく、省略され、選択的に若しくは全体的に他の実施例と組み合わされ、又は他の実施例若しくはその一部の特徴を置換するのに利用されてもよい。従って、図面及び詳細な説明は、本発明のいくつかの側面の例示的な説明として解釈されるべきものであり、本発明の範囲を限定するものと解釈されるべきでない。
図1に示されるように、関連付けエンジン1−1は、後述されるいくつかのモジュールを有する。関連付けエンジン1−1のモジュール、それの一部及び/又は関連付けエンジンの全体は、ハードウェア、ソフトウェア、ファームウェア又は上記の組み合わせから構成可能であるが、いくつかのモジュールはハードウェアなどから構成され、他のモジュールはソフトウェア、ファームウェア又はそれらの組み合わせから構成されるようにしてもよい。
関連付けエンジンのすべてのモジュールが同一の装置に配置又は統合されている必要はないということが理解されるであろう。分散化されたアーキテクチャはまた、既存の装置によって提供される適切なモジュールから“ピギーバック(piggy−back)”する関連付けエンジンについて考えられる。
以下の説明は、有線又は無線接続を介し論理データベース1−2に物理的に一体化又は接続される関連付けエンジン1−1について言及する。論理データベース1−2は、パーソナルコンピュータ、パーソナルビデオレコーダ、エンターテイメントシステム、エレクトロニックオーガナイザ、パーソナル携帯装置、Jazドライブのハードドライブなどの記憶装置により実現されてもよく、又はディスクドライブなどの商用の記憶装置として実現されてもよい。論理データベース1−2は、このような装置の2以上におけるコンテンツアイテムの整理又はグループ化が可能となるように、接続されるいくつかの記憶装置を含むかもしれないということは理解されるであろう。さらに、論理データベースは、論理データベース1−2にロード及びそれにより抽出可能なCD、DVD、zipディスク、フロッピー(登録商標)ディスク、データカートリッジなどを含むディスクなどの1以上の記憶媒体を含むものであると理解されるかもしれないということは理解されるであろう。さらに、論理データベースは、ネットワークやインターネットなどを介しリモートアクセスされてもよい。
図1に示されるように、関連付けエンジン1−1は、コンテンツアイテムから特定のタイプのデータを収集するモジュールである記述データ抽出装置1−11を含む。コンテンツアイテムは、ビデオ、ビデオクリップ、ムービー、フォト、テキストファイル、音楽データ、オーディオファイル、又はJPEGファイルやXMLデータなどの他のタイプのマルチメディアデータであってもよい。例えば、ビデオは、デジタルビデオレコーダ上のホームビデオショットであってもよく、ムービーは、MPEG(MPEG−2、MPEG−3などを含む)として符号化されたフィルムなどの市販のフィルムデータであってもよく、フォトは、デジタル写真データ、写真又は写真アルバム群であってもよい。テキストファイルは、ワープロにより生成されたファイル、スプレッドシート、又はコンピュータコードファイルであってもよい。音楽データは、MP3ファイルなどであってもよい。
記述データ抽出装置1−11により抽出された記述データは、コンテンツアイテムに関する情報を含む。このような記述データは、コンテンツアイテムの特徴を記述している。このような特徴は、以下を含むかもしれない。
・ビデオ、オーディオ、フォト、テキストファイルなど媒体を含むコンテンツタイプ
・休日の映画、個人用の風景写真、ジャズ音楽などのコンテンツスタイル又はジャンル
・アイテムの作成時間及び/又は場所、アイテムの取得時間及び/又は場所などのアイテムのメタデータ
・最後の/最初の/最後から2番目などの、再生若しくは/及び編集の時間、場所及び/若しくはコンテクスト、最も良く使用される時間(例えば、午前6〜9時が、コンテンツアイテムが最も良く使用された時間であったなど)、最近使用した場所、最も良く使用された場所(例えば、自宅やリビングが、コンテンツアイテムが最も良く使用された場所であったなど)などのアイテムの使用履歴(ときには、この使用履歴はまた、アイテムのメタデータとして知られる)
・コンテンツアイテムに関する俳優、監督、制作者、アーチスト、演奏者、撮影者など
アイテムに関するこのような記述データは、アイテムから、インデックス又はデータベース管理ファイルから、インターネットとの有線又は無線接続を介し関連付けエンジン1−1に接続されるワールドワイドウェブなどの外部ソースからを含む各種方法により配置及び抽出されてもよいということが理解されるであろう。
・ビデオ、オーディオ、フォト、テキストファイルなど媒体を含むコンテンツタイプ
・休日の映画、個人用の風景写真、ジャズ音楽などのコンテンツスタイル又はジャンル
・アイテムの作成時間及び/又は場所、アイテムの取得時間及び/又は場所などのアイテムのメタデータ
・最後の/最初の/最後から2番目などの、再生若しくは/及び編集の時間、場所及び/若しくはコンテクスト、最も良く使用される時間(例えば、午前6〜9時が、コンテンツアイテムが最も良く使用された時間であったなど)、最近使用した場所、最も良く使用された場所(例えば、自宅やリビングが、コンテンツアイテムが最も良く使用された場所であったなど)などのアイテムの使用履歴(ときには、この使用履歴はまた、アイテムのメタデータとして知られる)
・コンテンツアイテムに関する俳優、監督、制作者、アーチスト、演奏者、撮影者など
アイテムに関するこのような記述データは、アイテムから、インデックス又はデータベース管理ファイルから、インターネットとの有線又は無線接続を介し関連付けエンジン1−1に接続されるワールドワイドウェブなどの外部ソースからを含む各種方法により配置及び抽出されてもよいということが理解されるであろう。
特定されたコンテンツアイテムは、いくつかの方法の1つにより特定されてもよい。ユーザは、それによりコレクションの他のアイテムがグループ化されるべきアンカーアイテムとしてアイテムを指定してもよい。これにより、ユーザは、論理データベース1−2の1−1及び関連付けによって検出される他の同様のアイテムをグループ化するためのアンカーとしてアイテムを選択してもよい。あるいは、新たに追加又は生成されたコンテンツアイテムは、それに基づき論理データベースの他のアイテムがグループ化される特定されたコンテンツアイテムとして自動的に指定されてもよい。さらに、システムは、特定されたコンテンツアイテムとして孤立した又はグループ化されていないコンテンツアイテムを特定されたアイテムとして特定し、それとのグループ化のためコンテンツアイテムを選択しようとしてもよい。
記述データ抽出装置1−11により抽出された記述データの上記編集された特徴に基づき、同様のアイテム選択装置1−12が、その記述データの特徴に関して第1の特定されたコンテンツアイテムと類似した候補となるコンテンツアイテムを論理データベースにおいて特定する。その後、ベクトル生成装置1−13が、各ベクトルがある特徴に対応し、このベクトルの値が候補となるコンテンツアイテムと第1の特定されたコンテンツアイテムの特徴のマッチング又は類似度を反映するように、ベクトル値を各ベクトルに割り当てることによって第1のベクトル値のセットを生成する。
例えば、スタイル又はジャンルと称されるコンテンツアイテムの特徴に対応するベクトルは、特定されたコンテンツアイテムと候補となるコンテンツアイテムの双方が、“スペインの休日”などの同一のジャンルのものである場合には、高い値を有することとなる。1又は0のベクトル値は、第1の特定されたコンテンツアイテムと候補となるコンテンツアイテムとの間の特定の特徴に対する相関又は一致がほとんど又は全くないことを示すかもしれず、9又は10のベクトル値は、類似度又は一致度が高いことを示すかもしれない。例えば、双方のコンテンツアイテムが“スペインの休日”のジャンルを有するとき、当該ジャンル特徴に対応するベクトルに対して、9又は10の値が割り当てられるであろう。あるいは、1〜10のスケールを使用する代わりに、ベクトル値は単に、当該特徴の“強い”、“通常の”又は“弱い”一致を表すかもしれない。このようなベクトル値の他の多くのスキームが、本発明の趣旨から逸脱することなく利用可能であるということは理解されるであろう。コンテンツアイテムのペアのこのようなベクトル値のセットの平均値又は和は、その後、これら2つのコンテンツアイテムの間の全体的な類似度として計算されるであろう。
第2の特定されたコンテンツアイテムが利用可能である場合、第2のベクトル値セットが、この第2の特定されたコンテンツアイテムと候補となるコンテンツアイテムとの対応する特徴の間の類似度を表すように、第2コンテンツアイテムについて記述データ抽出装置1−11により抽出された記述データに基づき、ベクトル生成装置1−13によって同様にして構成されるかもしれない。さらに利用可能な特定されるコンテンツアイテムが存在するかもしれない。従って、上記記述データ抽出及びベクトル値セットの生成は、任意数の利用可能な特定されたコンテンツアイテム1〜N(Nは、1より大きな正の整数である)について繰り返されるようにしてもよい。その後、このように生成されたすべてのベクトル値又はそれらの平均値に基づき、候補となるコンテンツアイテムの選択が行われる。
複数の特定されたコンテンツアイテムが利用可能である場合、共通性ベクトル生成/閾値設定装置1−14が、第1セット及び第2セットのベクトル値が一貫して高いものとなる1以上のベクトルを選択するようにしてもよい。このようなベクトル値は、2つのアイテムの間の全体的な類似度を表すベクトル値セットの平均値又は和におけるその他のベクトルの値より大きく重み付けされてもよい。このように、第1及び第2の特定されたコンテンツアイテムを表し、又は第1の特定されたコンテンツアイテムと第2の特定されたコンテンツアイテムとの間の類似性を取得し、これにより、形成されるグループの特徴となる(グループにすでにあるコンテンツアイテムに基づき)特徴は、他のベクトル値より大きな重み付けがされる。単一のモジュール1−14の一部として示されているが、個別のモジュール、共通性ベクトル生成モジュール及び閾値設定モジュールは、関連付けエンジン1−1の一部として構成されてもよく、又はこのようなモジュールは他のモジュールに搭載されてもよい。
本発明の実施例の処理の説明に関して、バーチャルアイテム生成装置1−15が以下に説明される。
コントローラ1−16は、他の装置とのインタフェース、ユーザ(図示せず)とのインタフェースを含む外部との通信など、関連付けエンジンの処理について必要な他のタスクを処理する。コントローラ1−16はまた、関連付けエンジン1−1のモジュールの全体制御及び調整を処理する。
グループ整理装置1−17は、関連付けエンジン1−1により取得されたベクトル値に基づき、グループ化信号を論理データベース1−2に提供する。ユーザインタフェース1−3は、独立した装置であってもよく、又はパーソナルコンピュータ、パーソナルビデオレコーダ、又は上述した他の装置及びストレージの1以上などの他の装置又はシステムと統合されてもよい。
本発明の実施例の処理が、図1〜3を参照して説明される。図1に示されるユーザインタフェース1−3を介しユーザによって、又は自動的にシステムによって、例えば、論理データベース1−2における新たに追加されたコンテンツアイテム又は孤立したコンテンツアイテムを検出することによって、上述したように第1コンテンツアイテムが特定される。
関連付けエンジン1−1の記述データ抽出装置1−11は、図2AのS1において示されるように、特定された第1コンテンツアイテムの第1記述データを抽出する。図3は、特定されたコンテンツアイテム1を参照する6−11によりラベル付けされたボックスを示す。S2において、第1の特定されたコンテンツアイテムの各特徴についての特徴データが編集される。グループ化又は整理されるコンテンツアイテムのタイプとデータベース又は記憶装置に応じて、上述した特徴の一部又はすべてがより関連性が高いものであり、他のものが完全に関連がなく、本発明による関連付けエンジンによって使用されないことが理解される。また、ここに明示的には記載されていない他の特徴が、特に関連があり、関連付けエンジン1−1により使用されるようにしてもよい。
図3において6−12として示されるさらなる第2の特定されたコンテンツアイテムが利用可能であるか、又は特定されている場合、ステップS3及びS4が実行され、S3では、特定されたコンテンツアイテムの記述データが抽出され、S4において、第2の特定されたコンテンツアイテムの各特徴の特徴データが編集される。図3に示されるように、いくつかのコンテンツアイテムが、それについて他のコンテンツアイテムのグループ化が所望されるアンカーコンテンツアイテムとして特定されるようにしてもよい。図3は、第1の特定されたコンテンツアイテム6−11、第2の特定されたコンテンツアイテム6−12及び特定されたコンテンツアイテムNの6−14によるテーブル6−1を示す。従って、当該処理は、第1〜Nの特定された各コンテンツアイテムについて繰り返されてもよい。
図1の同様のコンテンツアイテム選択装置1−12は、論理データベース1−2の候補となるコンテンツアイテムを特定し、記述データ抽出装置1−11は、S5(図2A)において候補となる各コンテンツアイテムについて記述データを抽出し、S6において各コンテンツアイテムの特徴データを編集する。ステップS7において、検出される場合、第2の候補となるコンテンツアイテム(ボックス6−22により示される)の対応する記述データを抽出する処理が実行され、その後S8において、第2の候補となるコンテンツアイテムの特徴データの編集が実行される。
本発明の一特徴によると、ステップS9において、システム設定又はユーザの設定若しくは現在のコマンドに応じて、バーチャルアイテムが候補となるコンテンツアイテムの類似性を決定するための基礎として生成されることが決定されてもよく、その場合、処理が図2Cに示されるように実行される。そうでない場合には、処理は図2Bに示されるように実行される。
候補となる各コンテンツアイテムの対応する特徴による特定された各コンテンツアイテムの各特徴の類似性及び一致に基づき、図2BのS11に示されるように、ベクトル生成装置1−13によりベクトル値が生成される。図3は、第1の候補となるコンテンツアイテム6−21と第1の特定されたコンテンツアイテム6−11の対応する特徴の類似度を反映する値のベクトルセット6−3を示す。同様に、ベクトル値セット6−4は、第2の候補となるコンテンツアイテム6−22と第1の特定されたコンテンツアイテム6−11の特徴の類似性を反映する。第2の特定されたコンテンツアイテム6−12に関して、ベクトル値セット6−5は、第1の候補となるコンテンツアイテム6−21との対応する特徴の類似度を反映し、ベクトル値セット6−6は、候補となるコンテンツアイテム6−22との第2の特定されたコンテンツアイテム6−12の特徴の間の類似度を反映する。
各ベクトル値セットはまた、コンテンツアイテムのペアの平均類似性を反映する、当該セットのベクトル値の平均値の計算に基づきS12において決定される平均ベクトル値を含むものであってもよい。ここで示される平均という用語は、算術平均、モード、メディアン、和又は他の同様の統計的機能の1以上を含むものであってもよい。従って、例えば、図3のベクトル値6−3は、第1ベクトル値、第2ベクトル値、第hベクトル値及び当該セットの平均値を含むものであってもよい。
さらなる特定されたコンテンツアイテムもまた利用可能であるかもしれず、特徴データを抽出し、候補となるコンテンツアイテムの対応する特徴による類似性に基づきベクトル値を検出する処理が続けられる。図3のボックス1−14は、特定されたコンテンツアイテムMを示す。
また、さらなる候補となるコンテンツアイテムが検出されてもよく、それぞれについて、ベクトル値セットが、特定された各コンテンツアイテムについて計算可能である。ボックス6−23は、このような候補となるコンテンツアイテムMを参照する。
本発明の実施例によると、S13において、共通性ベクトル値セットが、特定されたコンテンツアイテムの間の特徴の類似性に基づき決定される。従って、最も類似する特徴が特定され、代表するベクトルは、その他のベクトルより大きな重み付けをすることが可能であり、又は排他的に利用することが可能である。このように、第1及び第2の(及びさらなる)特定されたコンテンツアイテムを表し、このため、特定されたコンテンツアイテムの間の類似性を有する傾向があり、このため、生成されるグループについて特徴となる特徴は、他のベクトル値より大きな重み付けがされるか、又は類似する候補となるコンテンツアイテムを決定するためだけに使用されることとなる。
S14において、候補となるコンテンツアイテム6−21の対応するベクトル値を平均化又は加算することによって、候補となる各コンテンツアイテムの各特徴についての全体的な類似性を反映するさらなるベクトル値セット6−8が計算されてもよい。従って、例えば、当該候補となるコンテンツアイテムについて各ベクトル値セットの対応するベクトル値を加算又は平均化することによって、当該特徴について特定されたコンテンツアイテムとの全体的な類似度が、第1の候補となるコンテンツアイテムについて取得される。さらに、セット6−8のすべてのベクトル値が、当該候補となるコンテンツアイテムの合計の類似性を取得するため、加算又は平均化されてもよい。
ここで使用される平均とは、算術平均、モード、メディアン又は選択された値の合成的な視点を適切に提供するのに選択される他の統計的機能を含むものであってもよいということが理解されるであろう。さらに、これらの値の単純和が、このような統計的な機能と共に利用されてもよい。コンテンツアイテムのタイプと、ユーザのニーズ及びデータベースに応じて、コンテンツアイテムの特定の特徴のすべてが他のものより重要であり、このため、他のものより特定の特徴に対応するベクトルを大きく重み付けすることが有用であるかもしれない。このようなファクタが重み付けされる程度は、ユーザのニーズとアプリケーションに依存する。全体的な類似性セット6−8のベクトル値が生成されると、図2BのS15に示されるように、最小の類似性閾値が非類似の候補となるコンテンツアイテムを排除するのに利用可能である。
さらに、アプリケーション及びユーザのニーズに応じて、各閾値が各種ベクトルに利用可能であることが考えられる。このため、ベクトル値が閾値を充足又は超過する候補となるコンテンツアイテムは、グループ整理装置1−17により特定されたコンテンツアイテムによりグループ化され、他の候補となるコンテンツアイテムは拒絶される。あるいは、最も類似する候補となるコンテンツアイテム又は所定数の最も類似する候補となるコンテンツアイテムが、特定されたコンテンツアイテムによるグループ化のため選択され、残りの候補となるコンテンツアイテムは拒絶されてもよい。
この(又はこれらの)選択された候補となるコンテンツアイテムが、S16において特定されたコンテンツアイテムによりグループ化される。グループ化信号は、特定されたコンテンツアイテムによる選択された同様の候補となるコンテンツアイテムのグループ化又は再グループ化を実行するため、データベース1−2に直接提供されるか、又はユーザ(図示せず)に推奨されるグループ化又は再グループ化を通知するためユーザインタフェース1−3に提供されるようにしてもよい。類似するコンテンツアイテムの特定、類似するコンテンツアイテムの記述、類似するコンテンツアイテムへのURL又はリンク、若しくは類似するコンテンツアイテムの全体若しくはその一部の表示若しくは再生、又は上記の組み合わせから整理されるユーザへの通知がまた提供されてもよい。S17において、処理は終了する。
図2Cは、本発明の一特徴によるバーチャルコンテンツアイテムを利用する処理を示す。S21において、バーチャルアイテム生成装置1−15が、それに基づきグループ化が行われる特定されたコンテンツアイテムの特徴を解析する。S22において、バーチャルコンテンツアイテム6−15と呼ばれる特定されたコンテンツアイテムのすべてについての代表的なコンテンツアイテムが、特定されたコンテンツアイテムの平均又は加重平均特徴に基づき構成される。例えば、特定されたコンテンツアイテムのすべてが“スペインの休日”というジャンルである場合、バーチャルコンテンツアイテムはまた、それのジャンルとして“スペインの休日”を有することとなる。その後S23において、候補となるコンテンツアイテムと当該バーチャルコンテンツアイテムの特徴の類似性に基づき、ベクトル値セット6−7が生成される。S24において、類似する候補となるコンテンツアイテムを選択するのに適用される閾値が選択され、又は最も高いスコアの候補となるコンテンツアイテムが選択される。
同様に閾値を用いて選択される候補となるコンテンツアイテムに基づき、又は選択される最も類似する候補となる所定数のコンテンツアイテムに基づき、S25において、グループ化信号が、図1に示される関連付けエンジン1−1の1−17によって、有線又は無線により送信される。上述されるように、この信号は、特定されたコンテンツアイテムにより選択された類似する候補となるコンテンツアイテムのグループ化又は再グループ化を実行させるため、データベース12に直接提供されてもよく、又はユーザ(図示せず)に推奨されたグループ化又は再グループ化を通知するため、ユーザインタフェース1−3に提供されてもよい。S26において、処理は終了する。
例えば、ユーザが論理データベースの最近のスペインの休日の写真を表すデジタルデータを編集しており、データベースにおいて、他の接続された記憶媒体において、又はインターネットを介し利用可能なスペインのテーマの他のコンテンツアイテムを検出することを所望していると仮定する。ユーザは、これら3つの写真を特定されたコンテンツアイテム1、特定されたコンテンツアイテム2及び特定されたコンテンツアイテム3としてそれぞれユーザインタフェース1−3を介し選択するようにしてもよい。その後、関連付けエンジンが、特定されたコンテンツアイテム1−3により類似した候補となるコンテンツアイテムとして検出されたスペイン音楽を表すデータファイルをグループ化する。ユーザは、スペイン音楽の存在を覚えておらず、それを検索すべき場所を覚えていない。実際、このデータファイルは、論理データベース1−2へのアクセスにより他のユーザによって追加されたか、又は他の記憶装置から関連付けエンジン1−1により抽出されたものであるかもしれない。何れのイベントでも、ユーザには類似したコンテンツアイテムが通知されるか、及び/又は類似したコンテンツアイテムが、特定されたコンテンツアイテムによってグループ化される。その後、ユーザは、スペインの休日の写真の閲覧をスペイン音楽と共にすることが可能となる。
上記説明により提供された本発明の実施例は、単なる例示的な実施例として意図されている。しかしながら、本発明の範囲は請求項に与えられるということは理解されるであろう。
Claims (17)
- 論理データベースのコンテンツアイテムを整理する方法であって、
前記論理データベースの第1の特定されたコンテンツアイテムの特徴データを含む第1記述データを抽出するステップと、
前記論理データベースの候補となるコンテンツアイテムの対応する特徴データを含む候補となる記述データを抽出するステップと、
各候補となるコンテンツアイテムに対して、各ベクトル値が前記第1記述データの特徴に対する前記特徴データと前記候補となる記述データの前記対応する特徴データとの間の類似度を表す第1ベクトル値セットを生成するステップと、
前記生成された第1ベクトル値セットによって表される前記類似度に基づき、前記候補となるコンテンツアイテムから類似する候補となるコンテンツアイテムを選択するステップと、
前記論理データベースの整理において前記コンテンツアイテムにより前記類似する候補となるコンテンツアイテムをグループ化するステップと、
を有する方法。 - 前記特徴データの特徴は、前記アイテムのコンテンツタイプ、前記アイテムのコンテンツスタイル、前記アイテムのジャンル、前記アイテムの使用履歴、前記アイテムにおいて演奏している演奏者、前記アイテムに係る監督、前記アイテムに係る制作者、前記アイテムのレンダリング要件、及び前記アイテムの何れかのメタデータの1つを表す、請求項1記載の方法。
- 前記メタデータは、前記アイテムの生成時間、前記アイテムの生成場所、前記アイテムの取得時間、前記アイテムの取得場所、直近の使用時間、最も頻繁に使用される時間、直近の使用場所、及び最も頻繁に使用される場所の1つを表す、請求項2記載の方法。
- 前記類似した候補となるコンテンツアイテムは、前記第1ベクトル値セットによって表される合計の類似度が最小の閾値を超過する場合に限って、前記類似した候補となるコンテンツアイテムが選択される、請求項1記載の方法。
- 前記第1ベクトル値セットにより表されるような前記最も高い合計の類似度を有する前記候補となるコンテンツアイテムが、選択される、請求項1記載の方法。
- 前記第1の特定されたコンテンツアイテムによりグループ化されるN番目(Nは、1より大きな任意の正の整数)のコンテンツアイテムの前記特徴データを含む記述データを抽出するステップと、
前記N番目の特定されたコンテンツアイテムの特徴データと前記類似する候補となるコンテンツアイテムの特徴データとの間の類似度を表す第Nベクトル値セットにもまた基づき、前記類似する候補となるコンテンツアイテムを自動的に選択するステップと、
をさらに有する、請求項1記載の方法。 - 前記類似する候補となるコンテンツアイテムは、前記第1ベクトル値セットと前記第Nベクトル値セットが平均、加重平均又は加算されるように選択される、請求項6記載の方法。
- 前記第1の特定されたコンテンツアイテムの特徴データが前記N番目の特定されたコンテンツアイテムに最も近い特徴を表すベクトルを共通ベクトルとして選択し、前記類似する候補となるコンテンツアイテムの選択において、前記第Nベクトル値セット及び前記第1ベクトル値セットの残りのベクトル値より大きな共通性ベクトルの値を重み付けするステップを有する、請求項6記載の方法。
- 論理データベースのコンテンツアイテムを整理する方法であって、
前記論理データベースの第1の特定されたコンテンツアイテムの特徴データを含む第1記述データを抽出するステップと、
前記論理データベースのN番目(Nは、1より大きな任意の正の整数)の特定されたコンテンツアイテムの特徴データを含む第N記述データを抽出するステップと、
前記論理データベースの候補となるコンテンツアイテムの対応する特徴データを含む候補となる記述データを抽出するステップと、
前記第1記述データの特徴データの特徴と前記第N記述データの特徴データの対応する特徴との間の類似度を表す各ベクトル値を有するベクトル値のバーチャルアイテムセットを平均又は加重平均することによって、バーチャルアイテムを生成するステップと、
各候補となるコンテンツアイテムに対して、前記バーチャルコンテンツアイテムの特徴の特徴データと前記候補となるコンテンツアイテムの対応する特徴データとの間の類似度を表す各ベクトル値を有するベクトル値セットを生成するステップと、
前記候補となるコンテンツアイテムの各ベクトル値セットの平均、加重平均及び和の1つをテスト値として計算することによって、前記候補となるコンテンツアイテムから類似する候補となるコンテンツアイテムを選択するステップと、
前記論理データベースの整理において前記第1コンテンツアイテムにより前記類似する候補となるコンテンツアイテムをグループ化するステップと、
を有する方法。 - 論理データベースのコンテンツアイテムを整理するシステムであって、
前記論理データベースの第1の特定されたコンテンツアイテムの特徴データを含む第1記述データを抽出し、さらに前記論理データベースの候補となるコンテンツアイテムの対応する特徴データを含む候補となる記述データを抽出するよう構成される記述データ抽出装置と、
各候補となるコンテンツアイテムに対して、前記第1記述データの特徴の前記特徴データと前記候補となる記述データの対応する特徴データとの間の類似度を表す各ベクトル値を有する第1ベクトル値セットを生成するよう構成されるベクトル生成装置と、
前記生成された第1ベクトル値セットによって表される類似度に基づき、前記候補となるコンテンツアイテムから類似する候補となるコンテンツアイテムを選択するよう構成される共通性ベクトル生成装置/閾値設定装置と、
前記論理データベースにおいて前記第1のコンテンツアイテムにより前記類似する候補となるコンテンツアイテムをグループ化するよう構成されるグループ整理装置と、
を有するシステム。 - 前記特徴データの特徴は、前記アイテムのコンテンツタイプ、前記アイテムのコンテンツスタイル、前記アイテムのジャンル、前記アイテムの使用履歴、前記アイテムにおいて演奏している演奏者、前記アイテムに係る監督、前記アイテムに係る制作者、前記アイテムのレンダリング要件、及び前記アイテムの何れかのメタデータの1つを表す、請求項10記載のシステム。
- 前記メタデータは、前記アイテムの生成時間、前記アイテムの生成場所、前記アイテムの取得時間、前記アイテムの取得場所、直近の使用時間、最も頻繁に使用される時間、直近の使用場所、及び最も頻繁に使用される場所の1つを表す、請求項11記載のシステム。
- 前記共通性ベクトル生成装置/閾値設定装置は、前記第1ベクトル値セットにより表される合計の類似度が最小の閾値を超過する場合に限って、前記類似する候補となるコンテンツアイテムを選択するよう構成される、請求項10記載のシステム。
- 前記共通性ベクトル生成装置/閾値設定装置はさらに、前記第1ベクトル値セットにより表されるような最も高い合計の類似度を有する前記候補となるコンテンツアイテムを前記類似する候補となるコンテンツアイテムを選択するよう構成される、請求項10記載のシステム。
- 前記記述データ抽出装置はさらに、前記第1の特定されたコンテンツアイテムによりグループ化されたN番目(Nは、1より大きな任意の正の整数)の特定されたコンテンツアイテムの特徴データを含む特徴データを抽出するよう構成され、
前記共通性ベクトル生成装置/閾値設定装置は、前記N番目の特定されたコンテンツアイテムの特徴データと前記類似する候補となるコンテンツアイテムの特徴データとの間の類似度を表す第Nベクトル値セットにもまた基づき、前記類似する候補となるコンテンツアイテムを自動的に選択するよう構成される、請求項10記載のシステム。 - 前記共通性ベクトル生成装置/閾値設定装置は、前記第1ベクトル値セットと前記第Nベクトル値セットが平均、加重平均又は加算されるように、前記類似する候補となるコンテンツアイテムを選択するよう構成される、請求項15記載のシステム。
- 前記共通性ベクトル生成装置/閾値設定装置は、前記第1の特定されたコンテンツアイテムの特徴データが前記N番目の特定されたコンテンツアイテムに最も近い特徴を表すベクトルを共通ベクトルとして選択し、前記類似する候補となるコンテンツアイテムの選択において、前記第Nベクトル値セット及び前記第1ベクトル値セットの残りのベクトル値より大きな共通性ベクトルの値を重み付けする、請求項15記載のシステム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US63213404P | 2004-12-01 | 2004-12-01 | |
PCT/IB2005/053988 WO2006059297A2 (en) | 2004-12-01 | 2005-11-30 | Automatic content organization based on content item association |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2008522311A true JP2008522311A (ja) | 2008-06-26 |
Family
ID=36565423
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007543979A Pending JP2008522311A (ja) | 2004-12-01 | 2005-11-30 | コンテンツアイテムの関連付けに基づく自動的なコンテンツ整理 |
Country Status (6)
Country | Link |
---|---|
US (1) | US20080306930A1 (ja) |
EP (1) | EP1839197A2 (ja) |
JP (1) | JP2008522311A (ja) |
KR (1) | KR20070086828A (ja) |
CN (1) | CN101438282A (ja) |
WO (1) | WO2006059297A2 (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4645676B2 (ja) | 2008-04-28 | 2011-03-09 | ソニー株式会社 | 情報処理装置、関連アイテムの提供方法、及びプログラム |
US8364722B2 (en) * | 2010-01-19 | 2013-01-29 | Microsoft Corporation | Hosting multiple logical databases contained in physical database |
JP5501178B2 (ja) * | 2010-09-21 | 2014-05-21 | インターナショナル・ビジネス・マシーンズ・コーポレーション | Gui管理の業務管理システム及びその警告表示方法 |
US20120136918A1 (en) * | 2010-11-29 | 2012-05-31 | Christopher Hughes | Methods and Apparatus for Aggregating and Distributing Information |
US8732147B2 (en) | 2011-03-18 | 2014-05-20 | Microsoft Corporation | Data collections on a mobile device |
US20150032609A1 (en) * | 2013-07-29 | 2015-01-29 | International Business Machines Corporation | Correlation of data sets using determined data types |
EP3629173A1 (en) | 2018-09-27 | 2020-04-01 | Koninklijke Philips N.V. | Event log processing |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5619709A (en) * | 1993-09-20 | 1997-04-08 | Hnc, Inc. | System and method of context vector generation and retrieval |
JP3598742B2 (ja) * | 1996-11-25 | 2004-12-08 | 富士ゼロックス株式会社 | 文書検索装置及び文書検索方法 |
US5905981A (en) | 1996-12-09 | 1999-05-18 | Microsoft Corporation | Automatically associating archived multimedia content with current textual content |
US6324129B1 (en) * | 1998-01-08 | 2001-11-27 | Seagate Technology Llc | Near field magneto-optical head having read and write pinhole apertures |
US6326988B1 (en) * | 1999-06-08 | 2001-12-04 | Monkey Media, Inc. | Method, apparatus and article of manufacture for displaying content in a multi-dimensional topic space |
US6728728B2 (en) * | 2000-07-24 | 2004-04-27 | Israel Spiegler | Unified binary model and methodology for knowledge representation and for data and information mining |
US20040012105A1 (en) * | 2000-09-21 | 2004-01-22 | Holger Deppe | Polystyrene microspheres and a method for their production |
US6987221B2 (en) * | 2002-05-30 | 2006-01-17 | Microsoft Corporation | Auto playlist generation with multiple seed songs |
US7149755B2 (en) | 2002-07-29 | 2006-12-12 | Hewlett-Packard Development Company, Lp. | Presenting a collection of media objects |
GB2395806A (en) * | 2002-11-27 | 2004-06-02 | Sony Uk Ltd | Information retrieval |
-
2005
- 2005-11-30 EP EP05821591A patent/EP1839197A2/en not_active Withdrawn
- 2005-11-30 WO PCT/IB2005/053988 patent/WO2006059297A2/en active Application Filing
- 2005-11-30 JP JP2007543979A patent/JP2008522311A/ja active Pending
- 2005-11-30 KR KR1020077014990A patent/KR20070086828A/ko not_active Application Discontinuation
- 2005-11-30 US US11/719,993 patent/US20080306930A1/en not_active Abandoned
- 2005-11-30 CN CNA2005800413501A patent/CN101438282A/zh active Pending
Also Published As
Publication number | Publication date |
---|---|
KR20070086828A (ko) | 2007-08-27 |
US20080306930A1 (en) | 2008-12-11 |
WO2006059297A2 (en) | 2006-06-08 |
WO2006059297A3 (en) | 2009-05-28 |
EP1839197A2 (en) | 2007-10-03 |
CN101438282A (zh) | 2009-05-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101194705B1 (ko) | 연관된 컨텐츠의 검색에 의한 위치 유사성 문턱값의 적응화 | |
US10275499B2 (en) | Tag selection, clustering, and recommendation for content hosting services | |
US7953735B2 (en) | Information processing apparatus, method and program | |
KR101329266B1 (ko) | 관련된 오디오 반주를 찾도록 디지털 영상들의 컨텐트특징들과 메타데이터를 사용하는 시스템 및 방법 | |
JP5340517B2 (ja) | マルチメディア情報に対するメタ・ディスクリプタ | |
JP5302319B2 (ja) | コンテンツ品目のコレクションと関連のメタデータ生成 | |
US8934717B2 (en) | Automatic story creation using semantic classifiers for digital assets and associated metadata | |
US20100217755A1 (en) | Classifying a set of content items | |
KR20080045659A (ko) | 정보 처리 장치, 방법, 및 프로그램 | |
JP2009134862A (ja) | ディスプレイを使用することなしにオーディオコンテンツのメニューを作成及びアクセスするための方法 | |
JP2009507312A (ja) | 関連付けされたメタデータに基づきメディアを整理するシステム及び方法 | |
JP2005510775A (ja) | コンテンツをカテゴリ化するためのカメラメタデータ | |
JP2008522311A (ja) | コンテンツアイテムの関連付けに基づく自動的なコンテンツ整理 | |
KR20070110098A (ko) | 범용 컨텐트 id에 기초하여 플레이리스트에 대한 컨텐트아이템들을 검색하는 방법 | |
KR20090118752A (ko) | 컨텐트 재생 목록 제공 방법 및 그 장치 | |
JP2010505176A (ja) | サマリ生成方法 | |
JP2008522310A (ja) | 関連コンテンツの抽出 | |
US20060031212A1 (en) | Method and system for sorting, storing, accessing and searching a plurality of audiovisual recordings | |
JP6212635B2 (ja) | メディアコンテンツ順序付けシステムおよびメディアコンテンツを順序付けするための方法 | |
KR20070086805A (ko) | 관련 콘텐트 검색에서의 시간 유사성 임계치의 적응 | |
TW202046140A (zh) | 動態處理並播放多媒體內容的方法及多媒體播放裝置 |