JP2010511243A - ファイルのコンテンツ識別子を比較するシステム - Google Patents

ファイルのコンテンツ識別子を比較するシステム Download PDF

Info

Publication number
JP2010511243A
JP2010511243A JP2009538822A JP2009538822A JP2010511243A JP 2010511243 A JP2010511243 A JP 2010511243A JP 2009538822 A JP2009538822 A JP 2009538822A JP 2009538822 A JP2009538822 A JP 2009538822A JP 2010511243 A JP2010511243 A JP 2010511243A
Authority
JP
Japan
Prior art keywords
parameter
file
content
content identifier
content identifiers
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009538822A
Other languages
English (en)
Other versions
JP5209635B2 (ja
Inventor
エフ イェー フォンテイン,ウィルヘルミュス
チアン,ユエチェン
シニーツィン,アレクサンデル
ハッセル,ヨーゼフ ペー ファン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips NV
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips NV, Koninklijke Philips Electronics NV filed Critical Koninklijke Philips NV
Publication of JP2010511243A publication Critical patent/JP2010511243A/ja
Application granted granted Critical
Publication of JP5209635B2 publication Critical patent/JP5209635B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/683Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/48Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content

Abstract

システム(1)は、コンテンツ識別子を互いに比較する比較器(11)を有し、比較器は、オーディオ/ビデオ/データフィルのようなファイルの、オーディオ/ビデオフィンガープリント、ユニーク識別子、ハッシュアルゴリズム、巡回冗長検査、タイトル、名称、持続時間、サイズ、アルバム名及びアーティスト名を比較し、システム(1)はセレクタ(12)を備え、セレクタは、コンテンツ識別子のグループの中から、コンテンツ識別子のパラメータ値に依存して、コンテンツ識別子のサブグループを選択し、柔軟性を向上させる。計算器(13)はパラメータの関数値を計算し、別の比較器(14)はその関数値を閾値と比較する。コンテンツ識別子は、コスト及び精度のパラメータにより規定されてもよい。そして、計算器(13)は、コストパラメータの第1関数値を計算し、精度パラメータの第2関数値を計算し、別の比較器(14)は、第1関数値と第1閾値を比較し、第2関数値と第2閾値を比較する。

Description

本発明は、あるファイルのコンテンツ識別子と別のファイルのコンテンツ識別子とを比較するシステム、そのようなシステムを有する装置、方法、コンピュータプログラム製品及び記憶媒体に関連する。
そのようなファイルの具体例は、オーディオファイル、ビデオファイル、オーディオ/ビデオファイル、及びデータファイル等である。コンテンツ識別子の具体例は、オーディオフィンガープリント、ビデオフィンガープリント、オーディオ/ビデオフィンガープリント、グローバルユニーク識別子、ハッシュアルゴリズム、巡回冗長検査、固有の識別子、タイトル、ファイル名、ファイル持続時間、ファイルサイズ、アルバム名及びアーティスト名等である。上記の装置の具体例は、消費者製品及び非消費者製品を含む。
特許文献1(US2004/0249859A1)は、フィンガープリントを用いたメディア認識システムを開示している。メディア分析要素が、セグメントの番号及び長さ、セグメントのフィンガープリントを提供し、この情報と共にメディア認識要素はメディアを識別している。一致が検出されなかった場合、更なるフィンガープリント及び関連するメタデータが必要になる。これらは総て比較的柔軟性に乏しい。
既存のシステムはこの比較的柔軟性に乏しいことに起因する欠点を有する。
米国特許出願公開第2004/0249859号明細書
本発明の課題は、特に、比較的柔軟性のあるシステムを提供することである。
本発明の第1形態は、出願時の請求項1に記載のシステムをもたらす。
比較器が、ファイルのコンテンツ識別子と別のファイルのコンテンツ識別子とを比較する。コンテンツ識別子を決める少なくとも1つのパラメータを導入することで、及びファイルの2以上のコンテンツ識別子のグループから選択を行うセレクタを導入することで、これらのコンテンツ識別子のパラメータの値、ファイルの1つ以上のコンテンツ識別子のサブグループに依存して、上記の比較は、コンテンツ識別子のサブグループについて実行可能になる。その結果、本システムは比較的柔軟になる。予め記憶されている方法に従って、或いはユーザ、ネットワークオペレータ又は装置からの信号に応答して、第1の状況の場合、第1のサブグループが選択され、第2の状況の場合、第2のサブグループが選択され、その装置は、上記のシステムを有する、又は上記のシステムに結合された別の装置を有する。
本システムは、特許文献1に記載のシステムと比較して、より多くの選択肢を提供する点でさらに有利である。
出願時の請求項2に記載の例によれば、計算器は、コンテンツ識別子グループのパラメータの1つ以上の関数値を計算し、別の比較部は1つ以上の閾値とその関数値を比較する。1つ以上の比較結果に応答して、セレクタは制御される。こうして、選択は、最適な方法で完全に自動的に実行可能である。
出願時の請求項3に記載の例によれば、コンテンツ識別子は第1及び第2パラメータにより規定される。こうすることで、柔軟性がさらに増える。2以上の異なるパラメータは、コンテンツ識別子の異なる特徴を規定し、選択肢数をさらに増やす。
出願時の請求項4に記載の例によれば、計算器は、コンテンツ識別子グループの第1パラメータの1つ以上の第1関数値を計算し、コンテンツ識別子グループの第2パラメータの1つ以上の第2関数値を計算し、別の比較器は、1つ以上の第1閾値と第1関数値を比較し、1つ以上の第2閾値と第2関数値を比較する。1つ以上の比較結果に応答して、セレクタは制御される。こうして、選択は、さらに最適な方法で完全に自動的に実行可能である。
コンテンツ識別子のパラメータ値は、システムに予め保存されていてもよいし、或いはユーザ、ネットワークオペレータ、プロバイダ又は装置によりシステムに与えられてもよく、その装置は、本システムを含んでもよいし又は本システムに結合された別の装置でもよい。それらの値は一定値でもよいし、適応的に変わる可変値でもよい。その可変値は、ユーザ、ネットワークオペレータ、プロバイダ、装置又は別の装置により適合させられる。
閾値は、システムに予め保存されていてもよいし、或いはユーザ、ネットワークオペレータ、プロバイダ又は装置によりシステムに与えられてもよく、その装置は、本システムを含んでもよいし又は本システムに結合された別の装置でもよい。それらの値は一定の閾値でもよいし、適応的に変わる可変閾値でもよい。その可変閾値は、ユーザ、ネットワークオペレータ、プロバイダ、装置又は別の装置により適合させられる。第1(第2)の閾値は従って一致してもよく、或いは第2(第1)関数の計算値に依存してもよい。
比較、計算及び更なる比較は、ファイル毎に又は2つ以上のファイル群について実行されてもよい。コンテンツ識別子のパラメータ値及び/又は閾値は、重み付け因子によって重み付けされてもよい。そのような重み付け因子は、システムに予め保存されていてもよいし、或いはユーザ、ネットワークオペレータ、プロバイダ又は装置によりシステムに与えられてもよく、その装置は、本システムを含んでもよいし又は本システムに結合された別の装置でもよい。それらの重み付け因子は一定の重み付け因子でもよいし、適応的に変わる可変重み付け因子でもよい。その可変重み付け因子は、ユーザ、ネットワークオペレータ、プロバイダ、装置又は別の装置により適合させられる。
出願時の請求項5に記載の例によれば、一群のコンテンツ識別子(コンテンツ識別子グループ)は、ビデオ及び/又はオーディオ及び/又はビデオ/オーディオのフィンガープリント、グローバルユニーク識別子、ハッシュアルゴリズム、巡回冗長検査符号、固有の識別子、タイトル、ファイル名、ファイル持続時間、ファイルサイズ、アルバム名及びアーティスト名等の内の少なくとも2つを有する。
出願時の請求項6に記載の例によれば、第1及び第2のパラメータの内の一方は精度パラメータであり、他方はコストパラメータであり、正確さ及びコストの間の現実的なバランスをとることができるようにする。
本発明の第2形態は、出願時の請求項7に記載の装置をもたらす。そのような装置は、本システムを有する装置でもよいし、或いは本システムに結合された別の装置でもよい。本発明の第3形態は、出願時の請求項8に記載の方法をもたらす。本発明の第4形態は、出願時の請求項9に記載のプログラム(製品)をもたらす。本発明の第5形態は、出願時の請求項10に記載の媒体をもたらす。
本発明によるシステム(発明システム)を含む本発明による装置(発明装置)と別の装置とを有するシステムの概略ブロック図を示す。 ある装置と発明システムを含む別の発明装置とを有するシステムの概略ブロック図を示す。
装置、方法、コンピュータプログラム製品及び媒体の実施例は、システムの実施例に関連する。
ファイルのコンテンツ識別子を決めるパラメータは、様々なコンテンツ識別子を区別するために導入されていることが、理解されるべきである。基本的な概念は次のとおりである:ファイルの2以上のコンテンツ識別子のグループから、ファイルの1つ以上のコンテンツ識別子のサブグループを選択することは、これらのコンテンツ識別子のパラメータ値に依存して実行される。
比較的柔軟なシステムを提供するという課題は達成される。本システムの別の恩恵は、より多くの選択肢を提供することである。
本発明に関するこれら及び他の形態は、以下の実施例の説明を参照することで解明され明確になるであろう。
図1において、装置2はシステム1を有し、システム1は、例えば、コントローラ10、比較器11、セレクタ12、計算器13、別の比較器14及びランダムアクセスメモリ15を有し、それらは総てバス16(又はスイッチ16)に結合され、バス16は3つのバスインターフェース17,18,19(又は3つのスイッチインターフェース17,18,19)にさらに結合されている。装置2は、バスインターフェース17に結合されたハードディスク21、バスインターフェース18に結合されたネットワークインターフェース22、及びバスインターフェース19に結合されたユーザインターフェース23をさらに有する。ネットワークインターフェース22は、データベース31を有する別の装置3にネットワーク4を介してさらに結合されている。
図2において、装置2は、例えばバス56(又はスイッチ56)を有するシステム5を有し、バスは3つのバスインターフェース57,58,59(又は3つのスイッチインターフェース57,58,59)にさらに結合される。装置2は、バスインターフェース57に結合されたハードディスク21、バスインターフェース58に結合されたネットワークインターフェース22、及びバスインターフェース59に結合されたユーザインターフェース23をさらに有する。総てが図示されてはいないが、システム5はバス56に結合されたコントローラ及びランダムアクセスメモリをさらに有する。
別の装置3はシステム1を有し、システム1は、例えば、コントローラ10、比較器11、セレクタ12、計算器13、別の比較器14及びランダムアクセスメモリ15を有し、それらは総てバス16(又はスイッチ16)に結合され、バス16は3つのバスインターフェース17,18,19(又は3つのスイッチインターフェース17,18,19)にさらに結合されている。装置3は、バスインターフェース17に結合されたデータベース31、バスインターフェース18に結合されたネットワークインターフェース32、及びバスインターフェース19に結合されたユーザインターフェース33をさらに有する。ネットワークインターフェース32は、ネットワークインターフェース22にネットワーク4を介してさらに結合されている。
第1の状況の場合(図1)、装置2は、スタンドアローンとして使用され、オーディオファイル、ビデオファイル、オーディオ/ビデオファイル及びデータファイル(フリーウエア及び/又は非フリーウエア)等のようなハードディスク21に保存された多くのファイルを有する。これらのファイルはコンテンツ識別子により規定され、コンテンツ識別子は、オーディオフィンガープリント、ビデオフィンガープリント、オーディオ/ビデオフィンガープリント、グローバルユニーク識別子、ハッシュアルゴリズム、巡回冗長検査符号、固有の識別子、タイトル、ファイル名、ファイル持続時間、ファイルサイズ、アルバム名及び/又はアーティスト名等である。同じオーディオフィンガープリントを有する2つのオーディオファイルの場合、同じオーディオファイルである相対的確率が高い。同じタイトルを有する2つのビデオファイルの場合、同じビデオファイルである相対的確率は中程度である。なぜなら、2つ以上の異なるビデオファイルが同じタイトルを持つかもしれないことは稀ではないからである。同じファイル持続時間を有する2つのデータファイルの場合、同じデータファイルである相対的確率は低い。なぜなら、2つ以上の異なるデータファイルが同じファイル持続時間等を有することは稀ではないからである。
ハードディスクに2以上の同じ(同様な、対応する)ファイルを蓄積することは、非効率的である。二重のファイルを除去できるようにするため、そのような重複したファイルが発見(検出)される必要がある。そのため、比較器11が互いのファイルの識別子を比較する。当然に、同じ種類のコンテンツ識別子のみが互いに比較可能である。したがって、例えば、重複したオーディオファイルが発見されるべき場合、それらのオーディオフィンガープリントが互いに比較され、それらのタイトルが互いに比較され、それらのファイル持続時間が互いに比較され、それらのアルバム名が互いに比較され、それらのアーティスト名が難いに比較される、等々である。例えば、1種類の、いくつかの種類の又は全種類のコンテンツ識別子の全部又は一部をバス16を介してランダムアクセスメモリ15に一時的に格納することで、そしてバス16を介して特定の種類毎に比較器11が互いにコンテンツ識別子を比較することで、コンテンツ識別子の比較がなされてもよい(これらの動作は総てコントローラ10により制御される。)。
システム1をさらに柔軟にするため、及び/又はより多くの選択肢を導入するため、特定の種類のコンテンツ識別子について少なくとも1つのパラメータが導入され、そのコンテンツ識別子を規定する。システム1にはセレクタ12が備えられており、セレクタは、ファイルの少なくとも2つのコンテンツ識別子のグループの中から、コンテンツ識別子のグループのパラメータ値に依存して、ファイルの少なくとも1つのコンテンツ識別子のサブグループを比較に備えて選択する。例えば重複するオーディオファイルを高い成功確率で発見すべき場合、それらのオーディオフィンガープリントが互いに比較され、それらのタイトルが互いに比較されてもよい。例えば、重複するオーディオファイルを比較的低い成功確率で発見すべき場合、それらのファイル持続時間が互いに比較され、それらのアルバム名が互いに比較され、それらのアーティスト名が互いに比較されてもよい。例えば予め保存されていた情報に応じて、又はユーザインターフェース23を介してユーザにより入力された情報に応じて、例えばセレクタはコントローラ10により制御される。
限定ではないが、好ましくは、システム1は、コンテンツ識別子グループのパラメータの1つ以上の関数値を計算する計算器13と、その関数値を少なくとも1つの閾値と比較する別の比較器14とを備え、少なくとも1つの比較結果に応じてセレクタ12を制御する。そして例えば重複したファイルを所定の成功確率で発見する必要がある場合、使用すべきコンテンツ識別子が算出される。例えば、より高い確率の場合には第1のコンテンツ識別子が使用され、より低い確率の場合には第2及び第3のコンテンツ識別子が使用される。例えば予め保存されていた情報に応じて、又はユーザインターフェース23を介してユーザにより入力された情報に応じて、セレクタ12、計算器13及び別の比較器14は例えばコントローラ10により制御される。
限定ではないが、さらに好ましくは、コンテンツ識別子は、コストパラメータ(処理容量、時間、電力、帯域幅)及び精度パラメータ(チャンス(chance))のような2以上のパラメータにより規定される。システム1は、コンテンツ識別子グループのコストパラメータの1つ以上の第1の関数値を計算し且つコンテンツ識別子グループの精度パラメータの1つ以上の第2関数値を計算する計算器13と、第1の関数値を少なくとも1つの第1の閾値と比較し且つ第2の関数値を少なくとも1つの第2の閾値と比較する別の比較器14とを備え、少なくとも1つの比較結果に応じてセレクタ12を制御する。そして例えば重複したファイルを所定の最大コスト及び所定の最小精度で発見する必要がある場合、使用すべきコンテンツ識別子が算出される。これは例えば第2、第3及び第4のコンテンツ識別子を使用することになり、その場合、第1、第5及び第6のコンテンツ識別子は無視される。例えば予め保存されていた情報に応じて、又はユーザインターフェース23を介してユーザにより入力された情報に応じて、セレクタ12、計算器13及び別の比較器14は例えばコントローラ10により制御される。
コンテンツ識別子及びそのパラメータの任意的な具体例を以下に示す:
Figure 2010511243
第2の状況の場合(図1)、装置2は、スタンドアローンとしては使用されず、別の装置3と通信するように使用され、別の装置は保存されたファイルを有するデータベース31を含む。この場合、例えば、ハードディスク21に保存されている1つ以上のファイルの1つ以上のコンテンツ識別子が、データベース31に保存されている1つ以上のファイルの1つ以上のコンテンツ識別子と比較され、データベース31に保存されているファイルを装置2にダウンロードする関心が依然として有るか否かを確認する。すなわち、例えば、データベース31に保存されている1つ以上のファイルの1つ以上のコンテンツ識別子が互いに比較され、データベース31内の重複するファイルを離れた場所(リモートロケーション)から発見し、例えばそのような重複的なファイルを除去する。
第3の状況の場合(図2)、装置3がシステム1を有し、例えば、ハードディスク21に保存されている1つ以上のファイルの1つ以上のコンテンツ識別子を、データベース31に保存されている1つ以上のファイルの1つ以上のコンテンツ識別子と比較し、データベース31に保存されているファイルを装置2にダウンロードする関心が依然として有るか否かを確認する。すなわち、例えば、ハードディスク21に保存されている1つ以上のファイルの1つ以上のコンテンツ識別子が互いに比較され、ハードディスク21内の重複するファイルを離れた場所から発見し、例えばそのような重複的なファイルを除去する。例えば予め保存されていた情報に応じて、又はユーザインターフェース33を介してネットワークオペレータやプロバイダにより入力された情報に応じて、比較器11、セレクタ12、計算器13及び別の比較器14は例えばコントローラ10により制御される。
システム1は例えばプロセッサ及びメモリの組み合わせでもよく、その場合のプロセッサであるコントローラ10は、例えば、比較器11,14、セレクタ12、計算器13をハードウエア及び/又はソフトウエアの形式でそれぞれを含み、ランダムアクセスメモリ15は組み合わせにおけるメモリである。或いは、コントローラ10、比較器11,14、セレクタ12及び計算器13の各々は、個々のハードウエア及び/又はソフトウエアであってもよい。ネットワーク4は、有線及び/又は無線のネットワークでもよく、サブネットワークを含んでいてもよい。図1及び2に示されているどの2つのブロックも、より大きなブロックに統合されてもよく、図1及び2に示されている各ブロックは不図示のサブブロックを含んでもよい。通常、少なくとも2つのコンテンツ識別子のグループは、多数のコンテンツ識別子を含み、少なくとも1つのコンテンツ識別子のサブグループは、従って、より少ない数のコンテンツ識別子を含む。
したがって、一致するものを発見するコストと一致の精度とのバランスをとる方法が導入されてもよい。可能性のあるコンテンツ識別子のリストが作成され、a)精度の計量尺度及び/又はb)使用されるリソースの観点からのコストの計量尺度(時間、電力、帯域幅等)が、それらのコンテンツ識別子に割り当てられてもよい。これらの値は、例えば、装置の製造者によって初期に設定されてもよい。ユーザはその値の因子を例えば重み付け因子により変更してもよい。
さらに、希望リストと共に、ユーザは合致する正確さの度合いを設定してもよく、その正確さの度合いは、希望リスト上の取得項目に対して望まれるものである。合致する正確さが希望リストで指定されていなかった場合、デフォルト値が比較装置で使用される。装置がデータベースの中から希望リスト上のコンテンツを検出しようとする前に、バジェット(予算、割当量等)を確認してもよい−その特定の比較処理についてどの程度多くの労力が費やされるか?これは、厳しいリソース利用性(低電力)や、策略(あなたは私の最良の友人なので、全力で行う)等に依存するかもしれない。バジェットは、全体的な労力又は項目毎の労力の観点から決められてもよい。
希望リストを処理する装置におけるプロセスは、所望の精度と、項目毎のバジェットにより費やしてもかまわない労力との均衡をとり、装置は、最低のコストで所望の精度を累積的にもたらす1つ以上の特定方法を含むソリューションを発見しようとし、最低コストが閾値を超えた場合、その項目は除外され、要求している装置にその旨が報告され、ある方法は安価で正確であるが、メタデータが不足していることにより又は全体的なバジェットに起因して適用できず、装置は、所与の利用可能な方法及び利用可能なメタデータに基づいて、最も安価なソリューションを発見し、そのソリューションを実行し、バジェットが尽きるまで、リスト上の次の項目についてそのような処理が行われる。
電源(eHubb、PC)に接続されたリソースに富む装置の場合、バジェットは通常非常に大きいので、高精度な処理を行う傾向がある。校庭のP2P通信の場合、閾値を低く設定するかもしれない。AFPのような方法の場合、様々なタイプのコストが存在する。歌に関するAFPが分かっていた場合、その労力はデータベース内で一致するものを発見することである。AFPが既知でなかった場合、かなりの追加的な労力がAFPの生成に費やされることになる。拡張例として、様々な形式のコスト(電力、帯域幅)を差別化することをユーザが望むかもしれないし、或いはコストの計算を動的にすることを望むかもしれない。他の同様な形式に同様なソリューションが適用可能である。
要するに、システム1は、コンテンツ識別子を互いに比較する比較器11を有し、比較器は、オーディオ/ビデオ/データフィルのようなファイルの、オーディオ/ビデオフィンガープリント、ユニーク識別子、ハッシュアルゴリズム、巡回冗長検査符号、タイトル、名称、持続時間、サイズ、アルバム名及びアーティスト名を比較し、システム1はセレクタ12を備え、セレクタは、コンテンツ識別子のグループの中から、コンテンツ識別子のパラメータ値に依存して、コンテンツ識別子のサブグループを選択し、柔軟性を向上させる。計算器13はパラメータの関数値を計算し、別の比較器14はその関数値を閾値と比較する。コンテンツ識別子は、コスト及び精度のパラメータにより規定されてもよい。そして、計算器13は、コストパラメータの第1関数値を計算し、精度パラメータの第2関数値を計算し、別の比較器14は、第1関数値と第1閾値を比較し、第2関数値と第2閾値を比較する。
以上、本発明は図面及び上記の記述により詳細に図示及び説明されてきたが、そのような図示及び説明は例示的なものであって限定的なものではなく、本発明は説明された実施例に限定されない。説明された実施例に対する他の変形例は、明細書、特許請求の範囲及び図面を理解することで、本発明を使用する当業者にとって理解可能である。特許請求の範囲において、「有する」という用語は、他の要素やステップを排除するものではなく、「ある」又は「或る」は複数個であることを排除しない。1つのプロセッサ又は他の装置が、特許請求の範囲で言及されているいくつかの項目の機能を実行してもよい。ある手段(複数)がそれぞれ異なる従属請求項で言及されている、というそれだけのことによって、そのような手段の組み合わせが有利に使用可能でないわけではない。コンピュータプログラムは、適切な媒体に保存/分散されてもよく、その媒体は、他のハードウエアと共に又は他のハードウエアの一部として用意される光ストレージ媒体又は半導体媒体等であるが、コンピュータプログラムは、インターネット、他の有線又は無線の電気通信システムを介するような他の形態で分散されてもよい。特許請求の範囲中の如何なる参照符号も(仮に存在した場合)、本発明の範囲を限定するように解釈されるべきではない。

Claims (10)

  1. ファイルのコンテンツ識別子を別のファイルのコンテンツ識別子と比較する比較器を有するシステムであって、コンテンツ識別子は少なくとも1つのパラメータにより規定され、当該システムはセレクタをさらに有し、該セレクタは、前記ファイルの少なくとも2つのコンテンツ識別子のグループの中から、コンテンツ識別子の前記グループの前記パラメータの値に依存して、前記ファイルの少なくとも1つのコンテンツ識別子のサブグループを比較に備えて選択する、システム。
  2. コンテンツ識別子の前記グループの前記パラメータの1つ以上の関数値を計算する計算器と、前記関数値を少なくとも1つの閾値と比較する別の比較器とをさらに有し、少なくとも1つの比較結果に応じて、前記セレクタを制御する、請求項1記載のシステム。
  3. 前記少なくとも1つのパラメータは第1のパラメータであり、前記コンテンツ識別子は第2のパラメータによりさらに規定される、請求項1記載のシステム。
  4. コンテンツ識別子の前記グループの前記第1のパラメータの1つ以上の第1の関数値を計算し、コンテンツ識別子の前記グループの前記第2のパラメータの1つ以上の第2の関数値を計算する計算器と、前記第1の関数値を少なくとも1つの第1の閾値と比較し、前記第2の関数値を少なくとも1つの第2の閾値と比較する別の比較器とをさらに有し、少なくとも1つの比較結果に応じて、前記セレクタを制御する、請求項3記載のシステム。
  5. コンテンツ識別子の前記グループが、ビデオフィンガープリント、オーディオフィンガープリント、オーディオ/ビデオフィンガープリント、グローバルユニーク識別子、ハッシュアルゴリズム、巡回冗長検査、固有の識別子、タイトル、ファイル名、ファイル持続時間、ファイルサイズ、アルバム名及びアーティスト名の内の少なくとも2つを含む、請求項1記載のシステム。
  6. 前記第1及び第2のパラメータの一方が精度パラメータであり、他方がコストパラメータである、請求項3記載のシステム。
  7. 請求項1記載のシステムを有する装置。
  8. ファイルのコンテンツ識別子を別のファイルのコンテンツ識別子と比較するステップを有する方法であって、コンテンツ識別子は少なくとも1つのパラメータにより規定され、当該方法は選択ステップをさらに有し、該選択ステップは、前記ファイルの少なくとも2つのコンテンツ識別子のグループの中から、コンテンツ識別子の前記グループの前記パラメータの値に依存して、前記ファイルの少なくとも1つのコンテンツ識別子のサブグループを比較に備えて選択する、方法。
  9. 請求項8記載の方法をコンピュータに実行させるコンピュータプログラム。
  10. 請求項9に記載のコンピュータプログラムを記憶する媒体。
JP2009538822A 2006-11-30 2007-11-27 ファイルのコンテンツ識別子を比較するシステム Expired - Fee Related JP5209635B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP06125103 2006-11-30
EP06125103.9 2006-11-30
PCT/IB2007/054798 WO2008065604A1 (en) 2006-11-30 2007-11-27 Arrangement for comparing content identifiers of files

Publications (2)

Publication Number Publication Date
JP2010511243A true JP2010511243A (ja) 2010-04-08
JP5209635B2 JP5209635B2 (ja) 2013-06-12

Family

ID=39246549

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009538822A Expired - Fee Related JP5209635B2 (ja) 2006-11-30 2007-11-27 ファイルのコンテンツ識別子を比較するシステム

Country Status (5)

Country Link
US (1) US8825684B2 (ja)
EP (1) EP2100239A1 (ja)
JP (1) JP5209635B2 (ja)
CN (1) CN101542484A (ja)
WO (1) WO2008065604A1 (ja)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8219592B2 (en) * 2008-02-29 2012-07-10 International Business Machines Corporation Method and system for using overlay manifests to encode differences between virtual machine images
US7856439B2 (en) * 2008-02-29 2010-12-21 International Business Machines Corporation Method and system for using semantic information to improve virtual machine image management
US7856440B2 (en) * 2008-02-29 2010-12-21 International Business Machines Corporation Method and system for separating content identifiers from content reconstitution information in virtual machine images
US7996414B2 (en) 2008-02-29 2011-08-09 International Business Machines Corporation Method and system for separating file system metadata from other metadata in virtual machine image format
KR101652436B1 (ko) * 2010-08-17 2016-08-30 에스케이텔레콤 주식회사 분산파일 시스템에서의 중복 제거 장치 및 방법
CN102446526B (zh) * 2010-10-14 2015-07-01 腾讯科技(深圳)有限公司 音轨共享方法及系统
US9438940B2 (en) * 2014-04-07 2016-09-06 The Nielsen Company (Us), Llc Methods and apparatus to identify media using hash keys
US10587594B1 (en) * 2014-09-23 2020-03-10 Amazon Technologies, Inc. Media based authentication
US20160239508A1 (en) * 2015-02-12 2016-08-18 Harman International Industries, Incorporated Media content playback system and method
US9794618B2 (en) 2015-02-12 2017-10-17 Harman International Industries, Incorporated Media content playback system and method
US9521496B2 (en) 2015-02-12 2016-12-13 Harman International Industries, Inc. Media content playback system and method
CN112579534A (zh) * 2019-09-27 2021-03-30 北京国双科技有限公司 文件筛选方法及装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10232877A (ja) * 1997-02-18 1998-09-02 Dainippon Printing Co Ltd 文字列の照合装置およびデータベースシステム
JP2002108930A (ja) * 2000-07-19 2002-04-12 Citation Japan:Kk 因子データベースを用いたマッチング・システム、マッチング装置、およびそのシステムのための因子データベース作成方法
JP2003085946A (ja) * 2001-09-14 2003-03-20 Columbia Music Entertainment Inc データ記録装置およびデータ記録再生装置
JP2005202357A (ja) * 2003-10-24 2005-07-28 Microsoft Corp オーディオ重複検出器
JP2005267053A (ja) * 2004-03-17 2005-09-29 Nec Corp 音声検索装置、音声検索サーバ、音声検索方法及び音声検索プログラム
JP2006215639A (ja) * 2005-02-01 2006-08-17 Matsushita Electric Ind Co Ltd データ制御方法及び情報処理装置

Family Cites Families (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5479654A (en) * 1990-04-26 1995-12-26 Squibb Data Systems, Inc. Apparatus and method for reconstructing a file from a difference signature and an original file
US5440738A (en) 1991-05-16 1995-08-08 Tally Systems Corporation Method and apparatus for digital data processor file configuration detection
DE69430866D1 (de) * 1993-03-30 2002-08-01 Squibb Data Systems Inc Vorrichtung und verfahren zur rekonstruktion einer datei aus einer differenzsignatur und einer originaldatei
US5665952A (en) * 1993-09-07 1997-09-09 Ziarno; Witold A. Method of streamlining the acknowledgement of a multiplicity of contribution or gift commitments made at a plurality of remote locations to distinct fund-raising organizations and gift recipients and system therefor
US5892900A (en) * 1996-08-30 1999-04-06 Intertrust Technologies Corp. Systems and methods for secure transaction management and electronic rights protection
US5915250A (en) * 1996-03-29 1999-06-22 Virage, Inc. Threshold-based comparison
US6061822A (en) * 1997-06-23 2000-05-09 Micron Electronics, Inc. System and method for providing a fast and efficient comparison of cyclic redundancy check (CRC/checks sum) values of two mirrored disks
CA2398838A1 (en) 2000-03-01 2001-09-07 Computer Associates Think, Inc. Method and system for updating an archive of a computer file
US7844504B1 (en) * 2000-04-27 2010-11-30 Avaya Inc. Routing based on the contents of a shopping cart
US6963975B1 (en) * 2000-08-11 2005-11-08 Microsoft Corporation System and method for audio fingerprinting
US6611814B1 (en) * 2000-07-17 2003-08-26 International Business Machines Corporation System and method for using virtual wish lists for assisting shopping over computer networks
US6779021B1 (en) * 2000-07-28 2004-08-17 International Business Machines Corporation Method and system for predicting and managing undesirable electronic mail
US20020082881A1 (en) * 2000-10-20 2002-06-27 Price Marc Steven System providing event pricing for on-line exchanges
US20050182690A1 (en) * 2000-10-27 2005-08-18 Microsoft Corporation Wish list
US6983289B2 (en) * 2000-12-05 2006-01-03 Digital Networks North America, Inc. Automatic identification of DVD title using internet technologies and fuzzy matching techniques
US7283954B2 (en) * 2001-04-13 2007-10-16 Dolby Laboratories Licensing Corporation Comparing audio using characterizations based on auditory events
US7356490B1 (en) * 2001-08-20 2008-04-08 Amazon.Com, Inc. Services for increasing the utility of electronic wish lists
US20030167318A1 (en) * 2001-10-22 2003-09-04 Apple Computer, Inc. Intelligent synchronization of media player with host computer
US20040249859A1 (en) 2003-03-14 2004-12-09 Relatable, Llc System and method for fingerprint based media recognition
US20060229878A1 (en) * 2003-05-27 2006-10-12 Eric Scheirer Waveform recognition method and apparatus
US7325165B2 (en) * 2003-05-30 2008-01-29 Broadcom Corporation Instruction sequence verification to protect secured data
US7454393B2 (en) 2003-08-06 2008-11-18 Microsoft Corporation Cost-benefit approach to automatically composing answers to questions by extracting information from large unstructured corpora
US20050108144A1 (en) * 2003-11-19 2005-05-19 Robert Longman Wish list auctions
US20050114196A1 (en) * 2003-11-20 2005-05-26 Tor Schoenmeyr Product assortment optimization systems, products and methods
US9152785B2 (en) * 2004-01-30 2015-10-06 Hewlett-Packard Development Company, L.P. Providing a flexible protection model in a computer system by decoupling protection from computer privilege level
US20050197724A1 (en) * 2004-03-08 2005-09-08 Raja Neogi System and method to generate audio fingerprints for classification and storage of audio clips
US8489720B1 (en) * 2004-03-31 2013-07-16 Blue Coat Systems, Inc. Cost-aware, bandwidth management systems adaptive to network conditions
US20060095470A1 (en) 2004-11-04 2006-05-04 Cochran Robert A Managing a file in a network environment
US7600125B1 (en) * 2004-12-23 2009-10-06 Symantec Corporation Hash-based data block processing with intermittently-connected systems
US7607582B2 (en) * 2005-04-22 2009-10-27 Microsoft Corporation Aggregation and synchronization of nearby media
US8214264B2 (en) * 2005-05-02 2012-07-03 Cbs Interactive, Inc. System and method for an electronic product advisor
US20060271947A1 (en) * 2005-05-23 2006-11-30 Lienhart Rainer W Creating fingerprints
US7805470B2 (en) * 2005-06-23 2010-09-28 Emc Corporation Methods and apparatus for managing the storage of content in a file system

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10232877A (ja) * 1997-02-18 1998-09-02 Dainippon Printing Co Ltd 文字列の照合装置およびデータベースシステム
JP2002108930A (ja) * 2000-07-19 2002-04-12 Citation Japan:Kk 因子データベースを用いたマッチング・システム、マッチング装置、およびそのシステムのための因子データベース作成方法
JP2003085946A (ja) * 2001-09-14 2003-03-20 Columbia Music Entertainment Inc データ記録装置およびデータ記録再生装置
JP2005202357A (ja) * 2003-10-24 2005-07-28 Microsoft Corp オーディオ重複検出器
JP2005267053A (ja) * 2004-03-17 2005-09-29 Nec Corp 音声検索装置、音声検索サーバ、音声検索方法及び音声検索プログラム
JP2006215639A (ja) * 2005-02-01 2006-08-17 Matsushita Electric Ind Co Ltd データ制御方法及び情報処理装置

Also Published As

Publication number Publication date
JP5209635B2 (ja) 2013-06-12
CN101542484A (zh) 2009-09-23
EP2100239A1 (en) 2009-09-16
US8825684B2 (en) 2014-09-02
US20100057795A1 (en) 2010-03-04
WO2008065604A1 (en) 2008-06-05

Similar Documents

Publication Publication Date Title
JP5209635B2 (ja) ファイルのコンテンツ識別子を比較するシステム
CN106933854B (zh) 短链接处理方法、装置及服务器
US9356914B2 (en) Content-based association of device to user
CN107404541B (zh) 一种对等网络传输邻居节点选择的方法及系统
CN107015985B (zh) 一种数据存储与获取方法及装置
CN110737658A (zh) 数据分片存储方法、装置、终端及可读存储介质
EP3215961A1 (en) A system and method of classifying, comparing and ordering songs in a playlist to smooth the overall playback and listening experience
CN102483731A (zh) 具有根据搜索负荷被均衡的指纹数据库的媒体识别系统
CN106708822B (zh) 一种文件存储方法和装置
CN108322495B (zh) 资源访问请求的处理方法、装置和系统
CN106933907B (zh) 数据表扩展指标的处理方法及装置
CN111159131A (zh) 性能优化方法、装置、设备及计算机可读存储介质
CN107342857B (zh) 分组方法及装置
CN110769055B (zh) 用于实现服务发现的方法、装置、介质以及电子设备
US20230188595A1 (en) Computer-Implemented Systems and Methods for a User-Controllable Parameter
CN104852986B (zh) 一种新增功能的提供方法和设备
CN106777230B (zh) 一种分区系统、分区方法及装置
CN101437028B (zh) 一种多地址生成方法、系统和装置
CN108984780B (zh) 基于支持重复键值树数据结构管理磁盘数据的方法和装置
CN112910988A (zh) 一种资源获取方法及资源调度装置
CN109582680B (zh) 基于新产品开发的业务处理方法、电子装置及可读存储介质
CN104468763A (zh) 一种将文件上传至网站根目录的方法和装置
KR20200036173A (ko) 사용자 그루핑 및 그룹별 선호 기계학습 분석 알고리즘을 추천하는 방법 및 장치
CN114329360B (zh) 一种用于模糊化pkg的方法、电子设备及介质
CN112711480B (zh) 数据链路解析方法及系统

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20101125

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120809

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120821

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121107

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130129

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130221

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160301

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees