JP4945877B2 - 高い雑音、歪み環境下でサウンド・楽音信号を認識するシステムおよび方法 - Google Patents

高い雑音、歪み環境下でサウンド・楽音信号を認識するシステムおよび方法 Download PDF

Info

Publication number
JP4945877B2
JP4945877B2 JP2002516764A JP2002516764A JP4945877B2 JP 4945877 B2 JP4945877 B2 JP 4945877B2 JP 2002516764 A JP2002516764 A JP 2002516764A JP 2002516764 A JP2002516764 A JP 2002516764A JP 4945877 B2 JP4945877 B2 JP 4945877B2
Authority
JP
Japan
Prior art keywords
landmark
fingerprint
file
sample
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2002516764A
Other languages
English (en)
Other versions
JP2004505328A (ja
JP2004505328A5 (ja
Inventor
エイヴリ, リ−チュン ワング,
ジュリウス, オー. サード スミス,
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shazam Investments Ltd
Original Assignee
Shazam Investments Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shazam Investments Ltd filed Critical Shazam Investments Ltd
Publication of JP2004505328A publication Critical patent/JP2004505328A/ja
Publication of JP2004505328A5 publication Critical patent/JP2004505328A5/ja
Application granted granted Critical
Publication of JP4945877B2 publication Critical patent/JP4945877B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/018Audio watermarking, i.e. embedding inaudible data in the audio signal
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/63Querying
    • G06F16/632Query formulation
    • G06F16/634Query by example, e.g. query by humming
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/683Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/26Recognition of special voice characteristics, e.g. for use in lie detectors; Recognition of animal voices
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/54Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for retrieval
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Signal Processing (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management Or Editing Of Information On Record Carriers (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Description

【0001】
(発明の分野)
本発明は、コンテンツに基づく情報検索に関し、具体的には、大きく歪んでいたり高いレベルのノイズが混入したサウンドもしくは楽音を含む音響信号の認識に関する。
【0002】
(背景技術)
さまざまな音源から生成された音楽もしくはその他のオーディオ信号の自動認識のニーズが高まっている。例えば、著作物のある作品の所有者や広告主は、彼らの作品の放送頻度のデータを得ることに興味がある。音楽追跡サービスは大きな市場の主要ラジオ局のプレイリストを提供する。消費者は、新曲や興味のある曲あるいはその他の製品やサービスを購入できるように、ラジオでオンエアされる曲や宣伝を特定することを希望している。連続的な音響認識あるいはオンデマンド型の音響認識のいずれのタイプのものでも、人手によって行われる場合には非効率であり大きな労働力を要する。よって、音楽・音響の自動認識は、消費者、アーティスト、およびさまざまな業界に非常に大きなメリットをもたらすであろう。音楽販売の形態が店舗購入からインターネットを介したダウンロードに移行すれば、インターネット購入またはその他のインターネット型サービスによりコンピュータで実行される音楽認識に直接リンクすることがまさに現実のものとなる。
従来、ラジオでオンエアされた曲の認識は、ラジオ局もしくはサードパーティの情報源のいずれかから提供されたプレイリストで、曲が演奏されたラジオ局と時刻を照合していた。この方法は本質的に、情報を受け取ることのできるラジオ局だけに限られる。その他、放送信号への耳に聞き取れないコードの埋め込みに頼る方法もある。埋め込まれた信号は受信機でデコードされて放送信号についての識別情報が抽出される。この方法の欠点は、信号を識別するための専用のデコード装置が必要になることと、コードが埋め込まれた曲しか識別できないことである。
【0003】
大規模オーディオ認識は、識別されていない放送信号を既知の信号のデータベースと比較して同一もしくは近似のデータベース信号を識別する、ある種のコンテンツベースのオーディオ検索を必要とする。コンテンツベースのオーディオ検索は、オーディオファイルを囲みもしくは付属するメタデータテキストだけが検索される、既存のウェブサーチエンジンによるオーディオ検索とは違うことに注意されたい。音声認識は、音声信号を、 周知の手法でインデックスを付与し検索可能なテキストに変換するのに有用であり、音楽・音響を含んだオーディオ信号の多くは適用することができないことにも注意されたい。
【0004】
ある意味では、オーディオ情報検索は、サーチエンジンにより提供されるテキストベースの情報検索と類似している。しかし、オーディオ信号は検索やインデクシングのための識別子を提供する単語のような識別容易な存在に欠ける点で、オーディオ認識は類似しない。このことから、現在のオーディオ検索手法は、信号の諸種の品質や特性を示す知覚可能な特徴量を計算することでオーディオ信号をインデクシングする。
【0005】
コンテンツベースのオーディオ検索は一般に、クエリー信号を分析して多数の代表特徴量を得て、その得られた特徴量を類似度測定に与えて、そのクエリー信号に最も類似するデータベースファイルを位置させることで行われる。受信したオブジェクトの類似度は選択された知覚特徴量の反映に必要である。多くのコンテンツベースの検索方法が従来より提案されている。例えば、Kenyonによる米国特許第5,210,820号は、各サンプリングポイントで信号値を得るように受信信号が処理されサンプリングされる信号認識方法を開示している。そして、 ストアされた信号の識別子と比較可能な特徴ベクトルを生成して類似信号を得るために、サンプル値の統計モーメントが計算される。Kenyon等による米国特許4,450,531号および4,843,562号は、識別されていない信号とストアされたリファレンス信号との相互相関を計算する同様の放送情報の分類方法を開示している。
【0006】
音響類似度によるオーディオ・ドキュメントを検索するシステムが、J. T. Footeによる "Content-Based Retrieval of Music and Audio," (C. -C. J. Kuo et al., editor, Multimedia Storage and Archiving Systems II, Proc. of SPIE, volume 3229, pages 138-147, 1997)に開示されている。各オーディオファイルをメル尺度ケプストラム係数にパラメータ化することで特徴ベクトルが計算され、パラメータ化データから量子化木が成長する。クエリーを実行するために、未知の信号がパラメータ化されて上記量子化木のリーフノードにソーティングされる特徴ベクトルを得るべくパラメータ化される。各リーフノードごとにヒストグラムが得られ、その結果、未知の信号を表すN次元ベクトルが生成される。これら2つのベクトル間の距離は、2つのサウンドファイル間の類似度を示す。この方法において、 管理下の量子化スキームは、人手によってトレーニングデータが割り当てられるクラスに基づき、 重要でない変動を無視しつつ音響特徴量の分類を学習する。この分類システムに依存して、異なる音響特徴量が重要なものとして選択される。したがって、この方法は、音楽の認識よりも、曲同士の類似度の計算や音楽のクラス分類に好適である。
【0007】
オーディオ情報のコンテンツベースの分析、ストレージ、検索、セグメンテーションの方法が、Blum等による米国特許第5,918,223号に開示されている。この方法では、ラウドネス、バス、ピッチ、ブライトネス、帯域幅、メル周波数ケプストラム係数などの各ファイルの多数の音響特徴量が周期的に測定される。これらの特徴量の統計的測定値が得られると、結合されて特徴ベクトルが形成される。データベース中のオーディオデータファイルは、それらの特徴ベクトルと未確認ファイルの特徴ベクトルとの類似度に基づいて検索される。
【0008】
上記した従来のオーディオ認識方法すべてにいえる重大な問題は、 認識しようとする信号が、背景雑音、伝送誤りおよび欠損、干渉、帯域制限フィルタリング、量子化、タイムワーピング、音声品質ディジタル圧縮などによって生じる線形または非線形の歪みを受けた場合には、失敗する傾向にあることである。従来の方法においては、歪みを受けた音響サンプルが音響特徴量を得るべく処理されると、オリジナル記録について抽出される特徴量はわずかな部分にすぎない。したがって、得られる特徴ベクトルはオリジナル記録の特徴ベクトルとは大して類似しておらず、認識が正確に行なわれる見込みなし、ということになる。よって、高レベルの雑音および歪みが加わる状況下でも良好に動作する音響認識システムに対するニーズは依然としてある。
【0009】
従来の方法における別の問題は、演算量が大きく、うまくそれを縮小できないことである。したがって、大規模データベースによる従来の方法ではリアルタイム認識は不可能である。このようなシステムにおいては、数百、数千を超える録音のデータベースを持たせることは現実的ではない。従来の方法における検索時間はデータベースのサイズに対し直線的に延びる傾向にあり、数千の録音を数百万に拡大させるのは経済的に実行不可能である。Kenyonの方法も大規模な専用ディジタル信号処理ハードウェアが必要である。
【0010】
現在の商用化されている方法はたいてい、認識ができるように、入力サンプルに厳格な必要条件を求める。例えば、曲全体や、少なくとも曲の30秒間がサンプルされていることが求められたり、曲の始まりからサンプルされていることが求められたりする。また、1つのストリームに複数の曲が混在しているものを認識することも困難である。これらの欠点はすべて、従来の方法の実用化を阻んでいる。
【0011】
(発明の目的と効果)
したがって、本発明の主な目的は、高レベルの雑音や歪みを受けたオーディオ信号を認識する方法を提供することである。
【0012】
本発明の別の目的は、信号が識別されるまでに数秒で済むようなリアルタイムで実行可能な認識方法を提供することである。
【0013】
本発明の別の目的は、音響の始まりからではなく任意の位置のサンプルに基づいて音響を認識することができる認識方法を提供することである。
【0014】
本発明はさらに、音響サンプルを符号化したり特定のラジオ局やプレイリストに関連づけることを必要としない認識方法を提供することを目的とする。
【0015】
さらに、本発明は、1つのストリームに複数のサウンド記録が混在したものの各々を認識することのできる認識方法を提供することを目的とする。
【0016】
さらに、本発明は、ほとんどすべての公知の方法によるあらゆる環境から未知音響がシステムに提供されうる音響認識システムを提供することも目的とする。
【0017】
(概要)
これらの目的は、オーディオ・サンプルなどのメディア・サンプルを、大量の既知のメディア・ファイルのデータベース・インデックスから認識する方法によって達成される。データベース・インデックスは、インデックスされたメディア・ファイルの特定の位置での特徴を表す。データベース内のメディア・ファイルのフィンガープリントの相対的な位置と、未知のメディア・サンプルのフィンガープリントの相対的な位置とが最も忠実にマッチする場合に、そのメディア・サンプルはそのメディア・ファイル(ベストなメディア・ファイル)と認識される。オーディオ・ファイルの場合、ベストなファイルのフィンガープリントの時間進行が、サンプルのフィンガープリントの時間進行とマッチする。
【0018】
この方法は、好ましくは分散コンピュータシステムによって実現され、以下のステップを有する。すなわち、サンプルにおける特定の位置のサンプル・フィンガープリントのセットを計算するステップと、
【0019】
前記メディア・ファイルにおける少なくとも1のファイル位置を特徴づけるファイル・フィンガープリントのセットを取得する取得ステップと、データベース・インデックスからマッチするフィンガープリントを特定するステップと、サンプルの前記特定の位置とファイルの前記ファイル位置との間で、対応する位置が同等のフィンガープリントを有する対応関係を生成するステップと、前記対応関係の多くがリニアな関係にあるときに、前記メディア・ファイルを識別するステップとを有する。前記対応関係の多くがリニアな関係にあると、それがベストなメディア・ファイルとみなす。多くの対応関係からファイルを識別する一方法は、対応関係のペアから生成される散布図における斜線を確認することである。一実施形態においては、リニアな対応関係検査からのメディア・ファイルの識別は、メディア・ファイルの第1のサブセットだけから実行する。第1のサブセットにおけるファイルは、その第1のサブセットに含まれないファイルに比べ識別される確率が高い。識別の確率は、事前の識別頻度を反映させるだけでなく、過去の識別における経験的な頻度または時期の新しさに基づくものであることが好ましい。メディア・ファイルが第1のサブセットから識別されなかったときには、残りのファイルを収めた第2のサブセットが検索される。かわりに、ファイルは確率によってランクづけされて、そのランク順に検索されるようにしてもよい。ファイルが特定されると検索は終了する。
【0020】
好ましくは、サンプルの特定の位置は、そのサンプルに依存して再現可能に計算される。このような再現可能に計算される位置は「ランドマーク」とよばれる。フィンガープリントは数値であることが好ましい。一実施形態においては、各フィンガープリントは、各位置またはその位置から少しオフセットした位置でのメディア・サンプルの多くの特徴を表す。
【0021】
本方法はとりわけ、オーディオ・サンプルの認識に有用であり、この場合、特定の位置はオーディオ・サンプルの時点となる。これらの時点は、たとえば、オーディオ・サンプルのスペクトルLpノルムが極大となる点である。フィンガープリントは各種オーディオ・サンプルの分析によって計算することができ、好ましくは、フィンガープリントはそのサンプルの時間伸縮に対し不変である。フィンガープリントの例は、スペクトル・スライス・フィンガープリント、マルチスライス・フィンガープリント、LPC係数、ケプストラム係数、スペクトルピークの周波数成分を含む。
【0022】
本発明はまた、特定の位置を計算するランドマーク分析オブジェクト、フィンガープリントを計算するフィンガープリント分析オブジェクト、メディア・ファイルのファイル位置およびフィンガープリントを含むデータベース・インデックス、および解析オブジェクトを含み、上記方法を実現するシステムを提供する。解析オブジェクトは、データベース・インデックスにおけるマッチング・フィンガープリントを特定し、対応関係を生成し、その対応関係を分析してベストなメディア・ファイルを選択する。
【0023】
また、上記方法の各ステップを実行するためのコンピュータによって実行可能な命令のプログラムを有形的に具現化する、当該コンピュータによりアクセス可能なプログラム記憶デバイスも提供される。
【0024】
くわえて、本発明は、データベース内の大量のオーディオ・ファイルのインデックスを生成するために、以下のステップを含む方法も提供する。すなわち、各ファイルの特定の位置でのフィンガープリントのセットを計算するステップと、ファイルのフィンガープリントと位置とIDをメモリに格納するステップとを有する。対応するフィンガープリント、位置、IDは、3つ組の形式で関連付けられる。好ましくは、オーディオ・ファイルの時点であるその位置は、そのファイルに基づき計算され、再現可能である。たとえば、その時点では、そのオーディオ・ファイルのスペクトルLpノルムが極大となる。あるケースにおいては、各フィンガープリントは、好ましくは数値であり、特定の位置付近のファイルの多数の特徴を表す。フィンガープリントは、オーディオ・ファイルのあらゆる分析やディジタル信号処理から計算できる。フィンガープリントの例は、スペクトル・スライス・フィンガープリント、マルチスライス・フィンガープリント、LPC係数、ケプストラム係数、スペクトルピークの周波数成分、連結されたスペクトルピークを含む。
【0025】
また、本発明は、時間伸縮に対し不変のフィンガープリントおよび、さまざまな階層検索を組み込んだ、オーディオ・サンプルを識別する方法を提供する。
【0026】
(詳細な説明)
本発明は、大量の既知メディア・ファイルを含むデータベースに与えられる外来のメディア・サンプルを認識する方法を提供する。また、本発明の認識方法を用いた効率的な検索を可能にするデータベース・インデックスを生成する方法も提供する。以下の説明は主にオーディオデータに言及するものであるが、本発明の方法は、テキスト、オーディオ、ビデオ、画像、別個のメディアタイプを組み合わせた種々のマルチメディアなどを含む、あるゆるタイプのメディア・サンプル、メディア・ファイルにも適用可能であることが理解されよう。オーディオの場合、本発明は、例えば、背景雑音、伝送誤りおよび欠落、干渉、帯域制限フィルタリング、量子化、タイムワーピング、音声品質ディジタル圧縮などによって生じた高レベルの線形歪みもしくは非線形歪みを含んだサンプルの認識に特に有用である。以下の説明から明らかなように、本発明は、たとえ計算される特徴量のわずかな部分だけしか歪みに耐えられなかったとしても、歪みを受けた信号を正確に認識できるため、かかる状況の下で動作する。音響(sound)、音声(voice)、音楽(music)、またはそれらの組み合わせ、を含むあらゆるタイプのオーディオ(audio)が、本発明によって認識されうる。オーディオサンプルの例は、記録された音楽、ラジオ放送プログラム、広告を含む。
【0027】
外来のメディア・サンプルは、本明細書では、後述するような種々の音源から得られるあらゆるサイズのメディアデータのセグメントをいう。認識が行われるためには、サンプルは、本発明によって使用されるデータベースにおけるインデックス・メディア・ファイルの一部の再現(rendition)でなければならない。インデックス・メディア・ファイルはオリジナル記録であり、サンプルはそのオリジナル記録が歪みを受けおよび/もしくは短縮化された変形もしくは再現であると考えることができる。一般に、サンプルは、インデックス・ファイルの小部分のみに対応する。例えば、データベースにインデックスが付与された5分間の曲のうちの10秒間で認識が行われうる。「ファイル」の用語はインデックスが付与される構成単位に用いられるが、その構成単位は、必要な値(後述)が得られるかぎり、いかなるフォーマットでもよい。さらに、その値が得られた後にファイルを記憶したりアクセスする必要もない。
【0028】
図1は、本発明の方法10の全体ステップを概念的に示す図である。以下、各ステップを詳しく説明する。この方法は、固有フィンガープリントの相対位置が外来サンプルの同様のフィンガープリントの相対位置に最も近似するメディア・ファイルを、ベストなメディア・ファイルとして識別するものである。ステップ12で外来サンプルがキャプチャー(記録)された後、ステップ14で、ランドマーク(landmark)およびフィンガープリント(fingerprint)が計算される。ランドマークは、サンプルにおける特定の位置(例えば時点)で生じる。ランドマークのサンプルにおける位置は、サンプル自身によって(すなわち、同じ品質に依存して)決定され、再現可能であることが好ましい。これは、同じ信号に処理を繰り返しても各時刻において同じランドマークが計算されるということである。各ランドマークに対して、そのランドマークまたはその付近でのサンプルの1または2以上の特性を特徴付けるフィンガープリントが得られる。ランドマークへの特性の近似度は、使用されるフィンガープリント法によって定義される。あるケースにおいて、ある特性が明らかにランドマークに一致し、前のランドマークおよび後続のランドマークには一致しない場合には、その特性はそのランドマークに近いと考えれる。別のケースでは、特性は近接する複数のランドマークに相当する。例えば、テキストのフィンガープリントは単語列、オーディオのフィンガープリントはスペクトル成分、画像のフィンガープリントは画素RGB値、とすることができる。以下では、ステップ14の2つの一般的な実施態様を説明する。1つは、ランドマークおよびフィンガープリントがシーケンシャルに計算されるもの、もう1つはランドマークおよびフィンガープリントが同時に計算されるものである。
【0029】
ステップ16では、サンプルのフィンガープリントが、マッチング・フィンガープリントのセットをデータベース・インデックス18から検索するのに用いられる。ここで、マッチング・フィンガープリントはメディア・ファイルのセットのランドマークおよび識別子に関連付けられている。検索されたファイルの識別子およびランドマーク値のセットは、同じフィンガープリントが計算された位置におけるサンプルのランドマーク(ステップ14で計算された)と検索されたファイルのランドマークとを含む対応ペアの生成(ステップ20)に用いられる。得られた対応ペアは楽曲IDでソートされ、各適用ファイルのサンプル・ランドマークとファイル・ランドマークとの対応関係のセットを生成する。各セットは、ファイル・ランドマークとサンプル・ランドマークとの位置合わせのために検査される。これは、ランドマーク同士にリニアな対応関係が確認され、そのセットはリニアな対応関係にあるペアの数に従いスコアリングされることになる。多数のサンプル位置とファイル位置との対応関係が許容誤差の範囲内でほぼ等しい一次方程式を記述できる場合に、リニアな対応関係が生じる。例えば、対応ペアのセットを記述する多くの方程式の勾配が+−5%の範囲の変動で収まっている場合には、対応関係のすべてのセットはリニアな関係を有していると考えられる。もちろん、別の好適な許容誤差を選択してもよい。最高スコアの(すなわち、リニアな対応関係の数が最大の)セットのIDが、ステップ22で、ベストなファイルIDとして特定され返される。
【0030】
さらに後述するように、データベースのエントリ数の対数に比例する時間成分で認識が行われうる。大規模なデータベースであっても、基本的にはリアルタイムで認識が行われうる。すなわち、サンプルが得られてから小さな時間遅れで認識されうる。この方法は、5〜10秒間、あるいはもっと短い1〜3秒間のセグメントに基づいて音響を識別できる。好適な実施形態においては、ステップ14のランドマーク分析およびフィンガープリント分析は、ステップ12でサンプルがキャプチャされるのと同時に実行される。データベース検索(ステップ16)は、サンプル・フィンガープリントが利用可能となりしだい実行され、対応関係の結果が計算されリニアな対応関係を求めて周期的に検査される。しがたって、この方法の全ステップは、図1に示したとおりの順次実行ではなく、同時進行させることができる。この方法は、部分的にはテキスト検索エンジンに類似していることに留意されたい。ユーザは検索サンプルを提示し、音響データベースにインデックス付与されたファイルのうちマッチするものが返される。
【0031】
本方法は、典型的にはコンピュータシステムで操作するソフトウェアとして実現され、個々のステップは独立したソフトウェアモジュールとして最も効率的に実現される。したがって、本発明を実現するシステムは、ランドマークおよびフィンガープリント分析オブジェクト、インデックス付けされたデータベース、データベース・インデックスを検索し、対応関係を計算し、ベストなファイルを識別するための解析オブジェクト、で構成されうる。ランドマーク分析およびフィンガープリント分析を順次行う場合には、ランドマーク分析オブジェクトとフィンガープリント分析オブジェクトとは別個のオブジェクトとしてもよい。上記個別のオブジェクトに対するコンピュータ命令コードは、1または2以上のコンピュータのメモリに格納され、1または2以上のコンピュータ・プロセッサにより実行される。一実施形態においては、コード・オブジェクトは、インテルベースのパーソナルコンピュータやその他のワークステーションなどの単一のコンピュータシステムにまとめて収容される。好適な実施形態においては、本方法は、ネットワークにより分散した中央処理装置(CPU)によって実現され、演算負荷を分散させるために、別個のソフトウェア・オブジェクトはそれぞれ別個のプロセッサによって実行される。あるいは、それぞれ同様に構成された要素の同形ネットワークとすることを考慮して、各CPUがすべてのソフトウェア・オブジェクトのコピーを保持するようにしてもよい。この後者の構成においては、各CPUがデータベース・インデックスのサブセットを有し、自身のメディア・ファイルのサブセットの検索に応答することが可能である。
【0032】
図2は、分散コンピュータシステム30の好適な実施形態の一例を示す図である。ただし、本発明は特定のハードウェアシステムに限定されるものではない。システム30は、マルチプロセッシング・バスアーキテクチャ34もしくは、ベオウルフ・クラスタ演算プロトコル(the Beowulf cluster computing protocol)などのネットワーク・プロトコル、あるいはそれら2つの組み合わせによって接続されたLinuxベースのプロセッサ32a〜32fを含む。かかる構成において、フィンガープリント分析の高速な立ち上がりが確保されるよう、データベース・インデックスは、クラスタ内の少なくとも1のノード32aのランダム・アクセス・メモリ(RAM)に記憶されることが好ましい。ランドマーキング・ノード32cおよび32f、フィンガープリンティング・ノード32bおよび32eや、位置合わせ検査ノード32dなど、その他のオブジェクトに対応する演算ノードは、データベース・インデックスを保持するノード32aほどに大容量のRAMは必要ではない。各オブジェクトに割り当てられる演算ノードの数は、1つのオブジェクトがボトルネックとならなよう要求に従い増減することができる。したがって、演算ネットワークは高度に並列処理化することができ、くわえて、利用可能な演算リソース間に分配された複数の信号認識探索を同時進行で処理できる。これは、多数のユーザが認識を要求してきても短時間で結果を返すアプリケーションを可能にするということである。
【0033】
別の実施形態においては、いくつかの機能オブジェクトがより強固に結合し、一方で他のオブジェクトとはそれほど強固には結合させないでおく。例えば、ランドマーク分析オブジェクトおよびフィンガープリント分析オブジェクトは残りのオブジェクトからは物理的に離れた位置に配置することができる。この一例は、ランドマーク分析オブジェクトおよびフィンガープリント分析オブジェクトと、信号キャプチャ処理との強固な連係が挙げられる。この配置構成において、ランドマーク分析オブジェクトおよびフィンガープリント分析オブジェクトは、例えば移動電話、無線アプリケーションプロトコル(WAP)ブラウザ、個人情報端末(PDA)、オーディオ検索エンジンのクライアント端末のようなその他のリモート端末などに埋め込まれる、追加的なハードウェアまたはソフトウェアとして組み込まれうる。コンテンツ表示サービスなどのインターネット・ベースのオーディオ検索サービスにおいて、ランドマーク分析オブジェクトおよびフィンガープリント分析オブジェクトは、マイクロソフト(登録商標)ダイナミック・リンク・ライブラリ(DLL)のような、リンクされたソフトウェア命令セットまたはソフトウェア・プラグイン・モジュールとして、クライアントのブラウザ・アプリケーションに組み込まれうる。これらの実施形態において、信号キャプチャ、ランドマーキング、フィンガープリンティングのすべてを含めたオブジェクトは、サービスのクライアント端末を構成する。クライアント端末は、ランドマークおよびフィンガープリントのペアを含む特徴量が抽出されたキャプチャ信号サンプルのサマリを、認識を実行するサーバ端末に送信する。生のキャプチャ信号のかわりに、この特徴量が抽出されたサマリをサーバへ送信することは、データ量を大幅に、たいてい500分の1またはそれ以下に、減らせる点で有利である。このような情報であれば、例えばサーバに送信されるオーディオストリームと一緒にもしくは一緒にではなく、狭い帯域幅の片側チャネルでリアルタイムに送信されうる。これは、各ユーザに狭小な帯域幅しか与えられていない公衆通信網上で本発明を実現することが可能になる。
【0034】
以下、オーディオ・サンプルと、音響データベースにインデックスが付与されたオーディオ・ファイルを参照して、本方法を詳細に説明する。本方法は音響データベース・インデックスの構築と、サンプル認識の2つに大別される。
【0035】
(データベース・インデックスの構築)
音響認識を行う前提として、探索可能な音響データベース・インデックスを構築する必要がある。本明細書において、データベースとは、インデックスが付与されたデータの集合体をいうが、商業ベースにのるデータベースに限られない。データベース・インデックスにおいて、つながりのあるデータの要素は互いに関連づけられ、個々の要素は関連するデータの検索に用いられうる。音響データベース・インデックスは、音声、音楽、広告、ソナー信号、またはその他の音響を含む、選択された集合もしくはライブラリにおける各ファイルまたは記録(recording)のインデックスセットを含む。また、各記録は固有の識別子sound_IDも有する。音響データベースそのものは各記録に対するオーディオファイルを記憶する必要はないが、sound_IDは、別の場所からオーディオファイルの検索に使用されうる。音響データベース・インデックスは、数百万、場合によっては何十億のファイルのインデックスを含むため、非常に大きなサイズであると予想される。新たな記録は徐々にデータベース・インデックスに追加されることが望ましい。
【0036】
図3は、第1の実施形態により探索可能な音響データベース・インデックスを構築する好適な方法40を示す図である。本実施形態においては、まずランドマークが計算され、その後、そのランドマーク位置もしくはその付近のフィンガープリントが計算される。データベース・インデックスを構築する他の方法が考えられるのは当業者には明らかであろう。とりわけ、以下に示すステップの多くは選択的なものであるが、より効率的に検索がなされるデータベース・インデックスを生成する役を果たす。大規模データベースからのリアルタイム音響認識のためには探索効率が重要であるが、小規模データベースであればたとえ最適にソートされていなくても比較的高速に探索されうる。
【0037】
音響データベースにインデックスを付与するために、集合における各記録はランドマーク分析およびフィンガープリント分析され、各オーディオファイルのインデックスセットが生成される。図4は、ランドマーク(LM)およびフィンガープリント(FP)が計算されるサウンド記録のセグメントを模式的に示す図である。ランドマークは音響の特定の時点で生じ、ファイルの始まりからの時間単位オフセットの値を有しており、フィンガープリントは特定のランドマーク位置またはその付近の音響を特徴付ける。したがって、本実施形態においては、特定のファイルに対する各ランドマークは固有のものである一方、フィンガープリントは1つのファイルまたは複数のファイルで何回も同じものが生じうる。
【0038】
ステップ42において、サウンド記録における特徴的で再現性のある位置をみつける方法を用いて、各サウンド記録がランドマーク分析される。好適なランドマーク分析アルゴリズムは、雑音やその他の線形、非線形の歪みが存在していても、サウンド記録内の同じ時点をマークすることができる。いくつかのランドマーク分析方法は、後述するフィンガープリント工程とは概念的に独立のものであるが、その工程の性能を最適化すべく選択することができる。ランドマーク分析によって、サウンド記録における時点 {landmarkk} のリストが得られ、各時点で順次フィンガープリントが計算される。良好なランドマーク分析スキームによれば、サウンド記録の1秒間あたりにおよそ5〜10個のマークがなされる。もちろん、ランドマークの密度はサウンド記録における活性度に依存する。
【0039】
ランドマークの計算にはさまざまな手法をとることができるが、いずれも本発明の範疇のものである。本発明のランドマーク分析スキームを実現するのに用いられる特定の手法は公知のものであるのでその詳細な説明は省略する。パワーノルムとよばれる単純なランドマーク分析手法は、サウンド記録の各時点における瞬時パワーを計算し、極大点を選択するものである。これを行う一方法は、波形を直接、調整およびフィルタリングすることで包絡線を計算することである。別の方法は、信号のヒルベルト変換(直交変換)を計算し、ヒルベルト変換および原信号の2乗振幅を用いることである。
【0040】
ランドマーク分析のパワーノルム法は音響信号における遷移をみつけるのに好適である。パワーノルムは、一般的なスペクトルLpノルムのまさに特殊なケース(p=2)である。一般スペクトルLpノルムは、例えばハニング窓の高速フーリエ変換(FFT)による短時間スペクトルを計算することにより音響信号の各時点で計算される。好適な実施形態は、8000Hzのサンプリング・レート、1024サンプルのFFTフレームサイズ、各時間スライスのための64サンプルのシフト幅、を用いる。スペクトル成分の絶対値のp乗の和として各時間スライスのLpノルムが計算され、選択的に次にp乗根も計算される。前述したように、ランドマークは各時刻で得られる値の極大値として選択される。スペクトルLpノルム法の一例を、図5に示す。図5は、ある音響信号の時間関数としてのL4ノルムのグラフである。極大値における破線はランドマークが選択される位置を示している。
【0041】
P=∞であるとき、L∞ノルムは事実上最大ノルムとなる。つまり、ノルムの値はスペクトル面における最大のスペクトル成分の絶対値である。このノルムはロバストなランドマークと良好な認識性能が得られ、また、音色の楽曲(tonal music)にも好適なものとなる。
【0042】
あるいは、単一の時間スライスではなく、固定もしくは可変のオフセットでの複数の時間スライスにわたってスペクトル成分の絶対値のp乗の和をとることで、「マルチスライス」スペクトル・ランドマークが計算されうる。この拡張された和の極大値を見つけることによって、後述するマルチスライス・フィンガープリントの配置を最適化することが可能になる。
【0043】
ランドマークが計算されると、ステップ44で、各ランドマーク時間位置でフィンガープリントが計算される。フィンガープリントは一般に、サウンド記録における各ランドマーク時間位置もしくはその付近における特徴量のセットを集約した値もしくは値のセットである。この好適な実施形態においては、各フィンガープリントは複数の特徴量のハッシュ関数である単一の数値である。フィンガープリントがとりうるタイプは、スペクトル・スライス・フィンガープリント、マルチスライス・フィンガープリント、LPC係数、ケプストラム係数を含む。もちろん、信号またはランドマーク付近の信号の特性を特徴付ける、フィンガープリントのあるゆるタイプは、本発明の範疇のものである。フィンガープリントは、あらゆるタイプのディジタル信号処理または信号の周波数分析によって計算されうる。
【0044】
スペクトルスライス・フィンガープリントを生成するために、各ランドマーク時間位置の近くで周波数分析が行われ、いくつかのスペクトルピークの頂点が抽出される。単純なフィンガープリント値は、最大のスペクトルピークの周波数値にすぎない。このような単純なピークを用いると、雑音が存在しても非常に良好な認識性能が得られる。しかし、単一の周波数スペクトルスライス・フィンガープリントは、これらが固有でないために、他のフィンガープリント分析スキームよりもフェールス・ポジティブ(false positives)生成する傾向にある。2または3の最大スペクトルピークの関数からなるフィンガープリントを使用することにより、フェールス・ポジティブの数を減らすことが可能である。しかし、これらは、2番目に大きなスペクトルピークが、存在する雑音に対し十分に識別可能なほどに大きくないと、雑音に非常に弱い場合がある。つまり、計算されたフィンガープリント値は、信頼性のある再現につき十分ロバストでない場合がある。にもかかわらず、このケースの性能も良好である。
【0045】
多くの音響の時間進行を利用するために、時間オフセットのセットをランドマーク時点に加えることによってタイムスライスのセットが計算される。得られた各タイムスライスで、スペクトルスライス・フィンガープリントが計算される。その後、得られたフィンガープリント情報のセットが結合されて、1スライスまたはマルチスライスのフィンガープリントが形成される。各マルチスライス・フィンガープリントは、時間進行をたどっていくので、単一のスペクトル・フィンガープリントに比べ、さらに特有のものとなり、後述するデータベース・インデックス探索においてマッチングの失敗が減ることになる。実験によれば、固有度合いを増したため、2つの時間スライスのそれぞれにおける単一の最大スペクトルピークから計算されたマルチスライス・フィンガープリントによって、後続のデータベース・インデックス探索の演算が速くなった(約100倍の速度)ものの、大きな雑音が存在する状況では認識率の低下がみられた。
【0046】
また、マルチスライス・フィンガープリントを計算するのに、与えられた時間スライスからの固定オフセットを用いるのではなく、可変のオフセットを用いることもできる。選択されたスライスへの可変オフセットは、フィンガープリントに対する、次のランドマークへのオフセット、または、“アンカー”ランドマークからのあるオフセット範囲におけるランドマークへのオフセットである。この場合において、ランドマーク間の時間差もマルチ周波数情報と共にフィンガープリントにエンコードされる。フィンガープリントにより次元を加えることにより、さらに固有度合が強まり、マッチングに失敗する機会も減る。
【0047】
スペクトル成分に加え、他のスペクトル特性を抽出しフィンガープリントとして使用してもよい。線形予測符号化(LPC)分析は、信号の予測可能な線形な特性、例えば、スペクトル形状の他にスペクトルピーク、を抽出するものである。LPCはディジタル信号処理の分野では周知である。本発明に対し、ランドマーク位置で固定された波形スライスのLPC係数が、量子化されたLPC係数をインデックス値にハッシングすることによって、フィンガープリントとして用いられうる。
【0048】
周期性を測定するものとしてはケプストラム係数が有用であり、音声や多くの楽器のような調波構造の信号を特徴付けるのに使用することができる。ケプストラム分析はディジタル信号処理の分野で周知のものである。本発明に対しては、多数のケプストラム係数がインデックスにハッシングされてフィンガープリントとして使用される。
【0049】
図6は、ランドマークおよびフィンガープリントが同時に計算される別の実施形態50を示す図である。図3のステップ42および44がステップ52、54、56で置き換えられている。後述するように、ステップ52で、サウンド記録から多次元関数が計算され、その関数からランドマーク(54)およびフィンガープリント(56)が抽出される。
【0050】
図6の実施形態において、ランドマークおよびフィンガープリントは、音声記録のスペクトログラムから計算される。スペクトログラムは音声記録の時間−周波数分析で、一般には高速フーリエ変換(FFT)を用いて、音響サンプルの窓かけおよびオーバラップしたフレームがスペクトル分析されたものである。先述したように、好適な実施形態は、8000Hzのサンプリング・レート、1024サンプルのFFTフレームサイズ、各時間スライスのための64サンプルのシフト幅、を用いる。スペクトログラムの一例を、図7Aに示す。横軸が時間で、縦軸が周波数である。連続する各FFTフレームは、時間軸に沿って等間隔に、縦に配置される。このスペクトログラムは、各時間−周波数ポイントでのエネルギー密度を示している。グラフ上の黒い部分は高いエネルギー密度を示す。スペクトログラムはオーディオ信号処理の分野では周知のものである。本発明に対し、ランドマークおよびフィンガープリントは、図7Bのスペクトログラムにおいて丸印で示したスペクトルの極大値のような点による凸角点から得られる。例えば、各ピークの時間−周波数座標が得られ、その時間はランドマークとしてとられ、周波数は対応するフィンガープリントの計算に使用される。スペクトルピーク・ランドマークはL∞ノルムに近似し、ここでノルムの最大絶対値がランドマーク位置を決定する。しかし、スペクトログラムにおいて、極大値の探索は、時間スライス全体にわたるよりもむしろ、時間−周波数平面のパッチに支配される。
【0051】
以下では、サウンド記録の凸角点抽出分析から得られる凸角点のセットを、コンステレーション(constellation)という。極大値を有するコンステレーションに対し、好適な分析は、選択された各点の近隣にわたる時間−周波数平面でエネルギーが最大となる点を選択することである。例えば、(t0-T,f0-F), (t0-T, f0+F), (t0+T,f0-F), (t0+T, f0+F) を頂点とする四角形、すなわち、コンステレーションの適当な数が得られるように選ばれたTおよびFにより、2Tおよび2Fを辺の長さとする四角形、において、座標 (t0, f0) の点が最大エネルギーの点であるとき、その点が選択される。四角形の範囲は、周波数値に応じてそのサイズを変更することもできる。もちろん、領域の形状はあらゆるものを用いてもよい。時間−周波数平面における距離に応じて競合の時間−周波数エネルギーのピークが逆に重み付けされるように、すなわち、遠いポイントは低い重み付けとなるように、最大エネルギー基準を重み付けすることもできる。例えば、エネルギーは次式で重みづけされる。
【0052】
S(t, f) / (1+Ct(t-t0)2+Cf(f-f0)2)

【0053】
ただし、S(t,f) は点(t,f)における二乗振幅値、CtおよびCfは正の値である(定数である必要はない。)。その他の距離重み付け関数を用いてもよい。極大点選択の制約にはその他の(最大値ではない)凸角点特徴抽出手法を適用してもよく、これらも本発明の範疇のものである。
【0054】
この方法は、上述した多くの同一の性質を有する単一の周波数スペクトルフィンガープリントに非常に近似した値の組が得られる。スペクトログラム時間−周波数法は、単一周波数法よりも多くのランドマーク/フィンガープリントのペアを生成するが、後述するマッチングステージにおけるマッチングの失敗も多く生じうる。しかし、これは、単一周波数スペクトルフィンガープリントよりもロバストなランドマーク分析およびフィンガープリント分析を提供する。なぜならば、音響サンプルに含まれる主要な雑音は各スライスにおけるスペクトルのあらゆる部分に広がっているわけではないからである。すなわち、スペクトルの部分における多くのランドマークとフィンガープリントとのペアは主要な雑音の影響をほとんど受けない。
【0055】
このスペクトログラム・ランドマーク分析およびフィンガープリント分析法は、次元の1つを時間とする音響信号の多次元関数を計算し、その関数の値における凸角点を位置決めする分析方法の特殊なケースである。凸角点は極大値、極小値、零交差点などの特徴値とすることができる。ランドマークは凸角点の時間座標として取得され、対応するフィンガープリントが残りの座標の少なくともいずれかから計算されうる。例えば、多次元関数フィンガープリントを形成するために、多次元凸角点の非時間座標が共にハッシングされうる。
【0056】
上記したマルチスライス・スペクトルフィンガープリントに対する可変オフセット法は、スペクトログラムまたはその他の多次元関数フィンガープリントに適用することができる。この場合において、図7Cのスペクトログラムに示されるように、コンステレーションの点が共に結ばれてリンク点が形成される。コンステレーションの各点は、ランドマーク時刻を定義するアンカーポイントとしての役を果たし、その他の点の残りの座標値が連結されてリンクされたフィンガープリントが形成される。例えば後ほど定義するような互いに近い点同士が共に連結されて、より識別および検索が容易となるより複合的な総合特徴フィンガープリントが形成される。マルチスライス・スペクトルフィンガープリントのように、複数リンク凸角点からの情報を単一のフィンガープリントに結合することの目的は、フィンガープリント値がより多くの値をとりうるようにし、それによりマッチングの失敗の可能性を減少させること、すなわち、同じフィンガープリントが2つの異なる音楽サンプルを指し示してしまう可能性を減少させることである。
【0057】
原理的には、N個の凸角点の各々は、およそN/2通りのリンクを生成する2点連結法により互いの点に連結される。同様に、K点連結のために、コンステレーションから得られる可能な組み合わせの数はNのオーダである。このような組み合わせの膨張を回避するために、互いに連結される近隣のポイントを制限することが望ましい。そのような制限を実現する一方法は、各アンカーポイントに対し「ターゲットゾーン」を定義することである。アンカーポイントはその後そのターゲットゾーン内のポイントと連結される。ターゲットゾーン内のポイントのサブセットを選択してすべてのポイントに連結されないようにすることが可能である。たとえば、ターゲットゾーン内の最大ピークに係るポイントだけに連結されるようにすることが可能である。ターゲットゾーンは固定された形状でもよいし、アンカーポイントの特徴に応じて変化する形状でもよい。スペクトルピークのコンステレーションに対するアンカーポイント (t0,f0) のターゲットゾーンの簡単な例は、tが範囲 [t0+L, t0+L+W] 内(ただし、Lはリード時間長、Wはターゲットゾーンの幅)にあるといったようなスペクトル面の点 (t,f) のセットである。この方法において、ターゲットゾーン内ですべての周波数がとりうる。たとえば、レート制御メカニズムが生成される連結組み合わせ数を変調するのに使用される場合には、LまたはWは可変とすることができる。かわりに、たとえば、周波数fが範囲 [f0-F,f0+F] 内(ただし、Fは境界パラメータとする。)にあるといったようなターゲットゾーンの制約によって、周波数制限を実現することができる。周波数制限の利点は次のとおりである。心理音響学において、音符の並びが互いに近い周波数を有するとき、メロディーがよく干渉する傾向があることが知られている。このような制約は、心理音響学のモデリングは本発明の目標に必要でないにもかかわらず、より「心理音響学的に実際的な」認識性能を示すことを可能にする。fを [f0-F,f0+F] の範囲外に選択するような、逆のルールを考えることも可能である。これは、コンステレーション抽出結果が、時間的に近くなおかつ同じ周波数を有する時間−周波数ポイントの吃音列を発するケースを回避することを可能にするように、周波数が相違するポイントを連結させる。その他の局所性のパラメータのように、Fは定数である必要はなく、例えばf0の関数としてもよい。
【0058】
時間座標にフィンガープリント値のアンカー凸角点が含まれないときは、フィンガープリントが時不変とするために相対時間値を用いる必要がある。たとえばフィンガープリントは、(i) 非時間座標値、および/または、(ii) 凸角点の対応する時間座標値の差、の関数とすることができる。時間差はたとえば、アンカーポイントに関して取得でき、あるいは、連結されたセットにおける一連の凸角点間の逐次の差分として取得できる。座標および差分値は連続ビットフィールドにパックされてハッシングされたフィンガープリントを形成することができる。座標値のセットをフィンガープリント値にマッピングする方法は数多くあり、それらは本発明の範疇に含まれることは当業者には明らかであろう。
【0059】
この方法の具体例は、座標 (tk, fk)(ただし、k=1, . . . , N)においてN>1 個の連結されたスペクトルピークを用いる。そして、(i) 第1ピークの時刻t1がランドマーク時刻として取得され、(ii) 周波数fk(ただし、k=1, . . . , N)での、連結ピークの時間差Δtk=tk-t1(ただし、k=2, . . . , N)が共にハッシングされてフィンガープリント値が形成される。フィンガープリントはΔtk-fk座標のとりうるすべての点またはサブセットから演算することができる。たとえば、望まれる場合には、時間差分のすべて一部または全部を除外することができる。
【0060】
複数ポイントを用いてフィンガープリントを形成することの他の利点は、たとえばサウンド記録が元の録音スピードと異なるスピードで再生されたときの時間伸縮に対しても、フィンガープリント符号化を不変とすることができる点にある。この利点は、スペクトル法および時間スライス法の両方に当てはまる。伸長された時間信号においては、時間差と周波数は相反する関係を有する(たとえば、2点間の時間差が1/2に縮められると周波数は2倍になる)ことに留意されたい。この方法は、フィンガープリントから時間伸縮を除外する方法で時間差と周波数との結合によるデータを利用する。
【0061】
たとえば、座標値 (tk,fk)(ただし、k=1, . . . , N)に対するNポイントスペクトルピークの場合において、フィンガープリントにハッシュするためのとりうる中間値は、Δtk=tk-t1(ただし、k=2, . . . , N, また、fk, k=1, . . . , N)である。いずれかの周波数を基準周波数f1として、(i)他の周波数との商、および(ii)時間差との積、を計算することにより、中間値を、時間伸縮に対して不変値とすることができる。たとえば、中間値をgk=fk/f1(ただし、k=2, . . . , N)、sk=Δtk/f1(ただし、k=2, . . . , N)とすることができる。サンプルをα倍に速めると、周波数fkはαfk、時間差tkはΔtk/αとなり、そのため、gk=αfk/αf1、sk=(Δtk/α)(αf1)=Δtkf1となる。そして、これらの新たな中間値は、時間伸縮に左右されないハッシュされたフィンガープリント値を形成するための関数を用いて結合される。たとえば、gkおよびskの値は連結されたビットフィールドにパッキングすることでハッシュされうる。
【0062】
あるいは、基準周波数ではなく、基準時間差(たとえばΔt2)を用いてもよい。この場合には、(i)他の時間差との商Δtk/Δt2、(ii)周波数との積Δt2fk、として新たな中間値が計算される。この場合は基準周波数を用いるのと等価である。結果の値は上記のgkおよびskの積および商から生成されうるからである。周波数比の相対性を全く等しく用いることもできる。つまり、元の中間値の対数値の和および差をそれぞれ、積と商に替えて用いることもできる。このような数学的操作の交換(commutations, substitutions, permutations)によって得られた時間伸縮に左右されないフィンガープリント値はすべて、本発明の範疇のものである。また、時間差を相対化する複数の基準周波数もしくは基準時間差を用いてもよい。複数の基準周波数もしくは基準時間差の使用は単一の基準値を用いるのと等価である。gkおよびskの演算操作によって同じ結果を得ることができるからである。
【0063】
図3および図6に説明を戻す。上述した方法のいずれかによるランドマーク分析およびフィンガープリント分析により、図8Aに示すようなSound_IDのインデックスセットが得られる。与えられたサウンド記録のインデックスセットは、ペアの値(fingerprint, landmark)のリストである。インデックス付けされた各サウンド記録は典型的には、そのインデックスセットに1,000のオーダの(fingerprint, landmark)のペアを有する。上記した第1の実施例では、ランドマーク分析とフィンガープリント分析の手法は基本的には独立であり、両者は別々のもので、かつ交換可能なモジュールとして取り扱うことができる。システム、信号品質、認識される音響のタイプに依存して、多くの異なるランドマーク分析やフィンガープリント分析のモジュールのいずれかを使用することができる。実際に、インデックスセットは値のペアの単純な複合化であるから、複数のランドマーク分析およびフィンガープリント分析の手法を同時に使用することが可能であり、またその方が好ましいことが多い。たとえば、ユニークな調音パターンを検出には、あるランドマーク分析およびフィンガープリント分析手法がよいが、パーカッションの識別には不十分である場合もあり、かかる場合には、対立する属性を有する異なるアルゴリズムがよい、というものである。複数のランドマーク/フィンガープリント分析を用いる手法により、よりロバストで十分なレンジの認識性能が得られる。数種類のフィンガープリント分析のためにいくらかのレンジを確保しておくことによって異なるフィンガープリント分析手法を一緒に用いてもよい。たとえば、32bitのフィンガープリント値において、初めの3bitが8つのフィンガープリント分析手法を記述するのに使用し、残りの29bitが符号化に使用するようにしてもよい。
【0064】
音響データベースのインデックスが付与される各サウンド記録に対してインデックスセットが生成される。ここで、検索可能なデータベースインデックスは高速(すなわち対数時間)検索を可能にするような方法で構築される。これは、step46で、各インデックスセットにおける各2つ組に対応するsound_IDを追加して得られる3つ組(fingerprint, landmark, sound_ID)のリストを構築することにより実現される。全てのサウンド記録に対しこのような3つ組が大規模なインデックス・リストとして収集される。図8Bにこの一例を示す。後続の検索処理を最適化するために、3つ組のリストはフィンガープリントによってソーティングされる。高速なソーティング・アルゴリズムは周知であり、D. E. Knuth、“The Art of Computer Programming, Volume 3: Sorting and Searching, Reading, Mass”(Addison-Wesley, 1998)に詳しく論じられている。これは、この引用により本明細書に含められる。高性能ソーティング・アルゴリズムは、リストのエントリ数をNとすると、NlogN回でリストをソートすることができる。
【0065】
インデックス・リストがソーティングされると、step48で、リスト内の固有のフィンガープリントの各々が新たなマスター・インデックス・リストに集められるように区分される。図8Cにこの一例を示す。マスター・インデックス・リストの各エントリは、フィンガープリント値と(landmark, sound_ID)のリストへのポインタとを含む。インデックスされるサウンド記録の数および特徴に依存して、収集結果全体に特定のフィンガープリントが数百回以上現れることが考えられる。インデックス・リストをマスター・インデックス・リストに再構成することは任意であるが、各フィンガープリント値が1回しか現れないので、メモリの節約になる。現行のリストのエントリ数が固有の値のリストに大幅に減少するので、後続のデータベース検索の高速化にもなる。あるいは、バランス木(B-tree)に各3つ組を挿入することでマスター・インデックス・リストが構成されるようにしてもよい。周知のように、マスター・インデックス・リストを構築する方法は他にもある。マスター・インデックス・リストは、信号認識処理中の高速アクセスのためにDRAMのようなシステムメモリに保持されることが好ましい。マスター・インデックス・リストは、図2に示すようなシステム内の単一ノードのメモリに保持するようにしてもよい。あるいは、マスター・インデックス・リストは複数のリストに分割され複数の演算ノード間に分配されるようにしてもよい。上記した音響データベース・インデックスは図8Cに示したマスター・インデックス・リストであることが好ましい。
【0066】
音響データベース・インデックスはオフラインで構築され、認識システムに新たな音響が入力されたときに追加的に更新することが好ましい。リストを更新するために、新たなフィンガープリントがマスター・インデックス・リストのしかるべき位置に挿入されうる。新たなサウンド記録が既に存在するフィンガープリントを含んでいる場合には、対応するペア(landmark, sound_ID)が、それらのフィンガープリントに対して既に存在するリストに追加される。
【0067】
(認識システム)
上記のように生成されたマスター・インデックス・リストを用いて、入力される音響サンプルに対して音響認識が行われる。音響サンプルは典型的にはそのサンプルの識別に関心を持っているユーザによって供給される。たとえば、ユーザがラジオで新曲を聴いてその曲のアーティストとタイトルを知りたくなるであろう。サンプルはあらゆる環境から作り出すことができる。たとえば、ラジオ放送、ディスコ、パブ、サブマリーン(submarine)、サウンドファイル、ストリーミング・オーディオのセグメント、ステレオシステムなど。そして、これらは背景雑音、音飛び(dropouts)、あるいは話し声を含んでいてもよい。ユーザは、オーディオサンプルを認識システムに供給する前にそのオーディオサンプルを、応答装置、コンピュータファイル、テープレコーダ、電話もしくは移動電話、ボイスメールシステムといった記憶デバイスに記憶させることができる。システム設定およびユーザ設定に基づいて、あるゆるアナログもしくはディジタルの音源(ステレオシステム、テレビ、コンパクトディスクプレーヤー、ラジオ放送、応答装置、電話、移動電話、インターネットストリーミング放送、FTP、電子メールの添付ファイルとしてのコンピュータファイル、これらの記録物を送信に適したその他の装置)から、オーディオサンプルが本発明の認識システムに供給される。サンプルは、その音源に依存して、音響波、無線波、ディジタルオーディオPCMストリーム、圧縮ディジタルオーディオストリーム(ドルビーデジタル、MP3など)、インターネットストリーミング放送、などの形式であったりする。ユーザは、電話、移動電話、WEBブラウザ、電子メールなどの標準的なインタフェースを介して認識システムと対話する。サンプルはシステムによってキャプチャされ、リアルタイムに処理されるか、あるいは、過去にキャプチャされたサウンド(たとえばサウンドファイル)から処理するために再生されることになる。キャプチャ中、オーディオサンプルはマイクロホンのようなサンプリングデバイスによってディジタルで抽出されてシステムに送られる。サンプルは、キャプチャ方法に依存して、チャネルやサウンドキャプチャ装置の制限によって更に劣化するであろう。
【0068】
サウンド信号がディジタル形式に変換されると、認識のための処理が行われる。データベースファイルのインデックスセットの構築として、そのサンプルに対し、サウンド記録データベースを処理するのに使用したのと同じアルゴリズムでランドマークおよびフィンガープリントが計算される。オリジナルのサウンドファイルが大きく歪んだものの処理しても、オリジナル記録に対して得られたランドマークとフィンガープリントのペアのセットと同一もしくは近似のものが得られるのであれば、方法は最適に動作する。サウンドサンプルに対し得られたインデックスセットは、図9Aに示す分析値のペアセット(fingerprint, landmark)となる。
【0069】
サウンドサンプルについての分析値ペアが与えられると、データベース・インデックスが検索されて、マッチしそうなファイルを特定する。検索は次のように実行される。未知サンプルのインデックスセットにおける各(fingerprintk, landmarkk)ペアは、マスター・インデックス・リストにおけるfingerprintkを検索することで処理される。順序付きリストに対する高速検索アルゴリズムは周知であり、D. E. Knuth、“The Art of Computer Programming, Volume 3: Sorting and Searching, Reading, Mass”(Addison-Wesley, 1998)に詳しく論じられている。マスター・インデックス・リストのfingerprintkが見つかると、マッチする(landmark*j, sound_IDj)ペアの対応するリストがコピーされ、landmarkkを加えて、(landmarkk, landmark*j, sound_IDj)の形式の3つ組のセットを形成する。ここで、アスタリスク(*)はデータベース内のインデックスファイルのいずれかのランドマークを示しており、アスタリスクのないランドマークはサンプルのものを示している。場合によっては、両者のフィンガープリントが同一のときに限りマッチするとする必要はなく、フィンガープリントが互いに近似している(たとえば、差が予め定められたしきい値に収まる)場合にはマッチしていると判定することが好ましい。両者同一によりマッチするフィンガープリント同士も、近似によりマッチするフィンガープリント同士も、ここでは「同等(equivalent)」という。3つ組におけるsound_IDjは、アスタリスクの付いたlandmarkを有するファイルに対応する。したがって、各3つ組は、同等のフィンガープリントが計算されたときの、2つの別個のランドマークを含む。1つはデータベース・インデックスのもので、もう1つはサンプルのものである。この処理は、入力サンプルのインデックスセットの範囲にわたるすべてのkについて繰り返される。得られたすべての3つ組は、図9Bに示すような大規模な候補リストに収集される。候補リストは、フィンガープリントのマッチングによるサウンドファイルのsound_IDを含んでおり、これらのsound_IDが入力されたサウンドサンプルに対する識別の候補であるので、そのように呼ばれる。
【0070】
候補リストが集められた後は、sound_IDによるセグメンテーションが行われる。この簡便な方法は、sound_IDによって候補リストをソーティングするか、候補リストをバランス木(B-tree)に挿入することである。多くのソーティング・アルゴリズムが適用可能であることは先述したとおりである。この処理の結果が、候補sound_IDのリストとなり、それぞれが、図9Cに示すように、オプションとしてそのsound_IDが除去された、サンプルのランドマーク時刻とデータベースファイルのランドマーク時刻とのペア(landmarkk, landmark*j)の散布リストを有する。したがって各散布リストは、互いが同等のフィンガープリントによって特徴付けられるランドマークのセットを含むことになる。
【0071】
そして、sound_IDがサンプルにマッチするかどうかを判断するために、各候補sound_IDに対する散布リストが分析される。極めて小さい散布リストしかない候補を除外するために、オプションとして、しきい値処理ステップを用いてもよい。明らかに、散布リストにエントリが1つしかない候補、すなわち、サンプルと同様のフィンガープリントが1つしかない候補は、そのサンプルとはマッチしない。1以上のあらゆる適切なしきい値を用いてもよい。
【0072】
最終的な候補数が決定されると、ベストな候補が特定される。以下のアルゴリズムでベストな候補が特定できなければ、認識失敗のメッセージが返される。このマッチング処理のキーポイントは、両者の時間軸が固定されていると想定して、サウンドのマッチングにおける時間の進行が、リニアな対応関係に従っているはずである点である。これは、いずれかのサウンドが作為的に非線形に歪んでいたり、速度が小刻みに揺れる異常があるテープデッキの如く再生装置に欠陥があるようなことがないかぎり、そのとおりになる。したがって、与えられたsound_IDの散布リストにおける正常なランドマークペア(landmarkn, landmark*n)は次式のリニアな対応関係を有するはずである。
【0073】
landmark*n=m*landmarkn+offset
【0074】
ただし、mは傾きで1に近い値である。landmarknは入力されたサンプルにおける時点、landmark*nはsound_IDによってインデックスされたサウンド記録における対応する時点、offsetは入力されたサウンドサンプルの始点に対応するサウンド記録への時間オフセットである。特定の値mおよびoffsetによって上式に適合するランドマークペアは「リニアな関係」にあるという。明らかに、リニアな関係にあることの概念は、対応するランドマークペアが2以上あれば有効である。このリニアな関係は、重要でない範囲外のランドマークペアを除外すると、正常なサウンドファイルを高い確率で識別する注意されたい。2の別個の信号が多数の同一のフィンガープリントを含むことが可能であるとはいえ、これらのフィンガープリントが同じ相対的な時間進行を有することはまずない。リニアな対応関係の要求は本発明のキーとなる特徴であり、単純に普通の特徴量のトータル数をカウントしたり特徴量の類似度を測定するといった技術よりも大きく認識性能を上げることができる。実際、本発明のこの側面により、たとえオリジナル記録のフィンガープリントが入力されたサウンドサンプルに現れるのが1%に満たないとしても、すなわち、サウンドサンプルが非常に短かったり大きく歪んでいる場合であったとしても、サウンドを認識することができる。
【0075】
そのため、入力されたサンプルに対してマッチするかどうかの判断の問題が、与えられた散布リストのランドマークポイントの散布図のうちで傾き1程度の斜線をみつけることに相当するものへと絞り込まれる。図10Aおよび図10Bに散布図の2つの例を示す。横軸がサウンドファイルのランドマークで、縦軸が入力されたサウンドサンプルのランドマークである。図10Aにおいて、ほぼ1の傾きの斜線が認識される。これは曲が確かにサンプルにマッチした、すなわち、そのサウンドファイルがベストなファイルであることを示している。横軸での切片は、サンプルの始めにおけるオーディオファイル内のオフセットを示している。図10Bの散布図には統計上の有意な斜線がみられない。これは入力されたサンプルに対しそのサウンドファイルはマッチしないことを示している。
【0076】
散布図における斜線をみつける方法は多くあり、これらはすべて本発明の範疇のものである。「斜線の特定(locating a diagonal line)」の用語は、明示的に斜線を生成せずに斜線を特定することに相当するすべての方法をいう。好適な方法は、上式の両辺からm*landmarknを引いて次式を得ることにより開始する。
【0077】
(landmark*n-m*landmarkn)=offset
【0078】
mはほぼ1と想定する(すなわち、時間伸縮がないと想定する)と、次式が得られる。
【0079】
(landmark*n-landmarkn)=offset
【0080】
斜線を特定するときの問題は、ほぼ同じオフセット値で分割される所定のsound_IDに対する複数のランドマークペアをみつけることに絞られる。これは、1のランドマークと他のランドマークとを引き算して得られたオフセット値のヒストグラムを収集することにより、容易に実現できる。高速ソーティング・アルゴリズムを用いて、あるいは、カウンタでビンのエントリを生成しバランス木(B-tree)に挿入することにより、このヒストグラムを加工してもよい。ヒストグラムのベストなオフセット・ビンは最大のポイント数を含む。以下では、このビンをヒストグラムのピークという。入力されたサウンド信号が正常なライブラリ・サウンドファイルに十分に含まれていればオフセットは正のはずであるから、負のオフセットとなるランドマークペアは除外される。同様に、ファイルの終端を超えるオフセットも除外される。ヒストグラムのベストなオフセット・ビンにおけるポイント数が各予選sound_IDに対し示される。この数は各サウンド記録のスコアとなる。最高スコアの候補リストにおけるサウンド記録がベストとして選ばれる。識別の成功を通知すべくベストなsound_IDが下記のようにユーザにレポートされる。識別の失敗を防ぐために、最小しきい値スコアを用いて識別処理の成功をゲート制御するようにしてもよい。ライブラリ・サウンドがしきい値を超えるスコアでなければ、認識はされず、その旨ユーザに通知される。
【0081】
入力されたサウンド信号が複数のサウンドを含む場合、それぞれのサウンドを認識することができる。この場合、位置合わせ検査において複数の当たり(winner)が特定される。サウンド信号が複数の当たりを含んでいることを知っている必要はない。位置合わせ検査で、残りのスコアよりもかなり高いスコアのsound_IDが2つ以上特定されるであろうからである。よく使われるフィンガープリント分析方法は良好な線形な重ね合わせを示し、そのため個々のフィンガープリントが抽出される。たとえば、スペクトログラム・フィンガープリント分析方法は線形な重ね合わせを示す。
【0082】
サウンドサンプルが時間伸縮を受けると、傾き(slope)は等しく1とはならない。時間伸縮を受けたサンプルの傾きを1と仮定する(フィンガープリントが時間伸縮に対し不変であると仮定する)と、計算されるオフセット(offset)値は均一でなくなる。これに対処してほどほどの時間伸縮に適応する一方法は、オフセット・ビンのサイズを増加させること、すなわち、オフセットが均一になる範囲を考慮することである。一般に、各点が直線上に位置しなければ、計算されるオフセット値が大きく異なり、オフセット・ビンのサイズがわずかに増加しても、フェールス・ポジティブを大量に生じることはない。
【0083】
直線をみつける手法は他にもある。たとえば、マシン・ビジョンやグラフィックの研究の分野で周知な、T. Risse, "Hough Transform for Line Recognition," (Computer Vision and Image Processing, 46, 327-345, 1989)に記述されているRadon変換またはHough変換を用いてもよい。Hough変換では、散布図の各点は(slope, offset)空間における直線に射影する。したがって、散布図の点の集合がHough変換における2空間の直線上に投影される。Hough変換におけるピークはパラメータ直線の交点に対応する。このような所定の散布図の変換のグローバルピークは、Hough変換における交差する直線の最大数、つまり共直線性の点の最大数、を示している。5%のスピードの変動を許容すべく、たとえば、Hough変換の構成を傾きパラメータが0.95から1.05の間で変動する領域に制限して、それにより演算量を節約するようにしてもよい。
【0084】
(階層検索)
非常に小さな散布リストで候補をふるい落とすしきい値処理ステップに加えて、さらに効果的な改良策を施すこともできる。改良策の1つは、発生確率に応じてデータベース・インデックスを少なくとも2つの区分にセグメント化しておき、サンプルのマッチングをとる確率の高いほうのサウンドファイルのみをまず検索するというものである。分割は処理のさまざまな段階で行うことができる。たとえば、いずれか1のセグメントでstep16またはstep20が実行されるときに、マスター・インデックス・リスト(図8C)を2以上の区分にセグメント化することが可能である。すなわち、データベース・インデックスの一部分だけからマッチング・フィンガープリントに対応するファイルが検索され、その一部分から散布リストが生成される。ベストなサウンドファイルが特定されなければ、別のデータベース・インデックスについて処理が繰り返される。別の実現例では、データベース・インデックスからすべてのファイルが検索されるが、斜線検査は異なるセグメントで別々に行われる。
【0085】
この手法を用いて、演算量が集中している斜線検査は、まず、データベース・インデックスにおけるサウンドファイルの小さなサブセットで行われる。斜線検査は検査されるサウンドファイルの数に対してほぼリニアな時間成分を有しているので、階層検索を行うことは大変有効である。たとえば、サウンド・データベース・インデックスが1,000,000のサウンドファイルを表すフィンガープリントを含んでいるが、高い頻度で検索照会されるサンプルにマッチするのは1000ファイル程度しかない場合、たとえば、検索照会の95%が1000ファイルに対するもので、検索照会の5%だけが残りの999,000のファイルに対するものである場合、を想定する。演算コストがファイル数の一次従属であると仮定すると、その演算コストは、1000ファイルの95%時間に比例し、999,000ファイルの5%時間に比例する。そうすると、平均演算コストはおよそ50,900に比例する。したがって、階層検索は演算負荷を1/20近くに抑えることができる。もちろん、データベース・インデックスは、2レベル以上の階層(たとえば、ニュー・リリースの曲のグループ、最近リリースされた曲のグループ、古くて流行らない曲のグループ)にセグメント化することができる。
【0086】
上述したように、検索は、サウンドファイルの高確率のファイルの集合である第1のサブセットについてまず行われ、この第1の検索が失敗したときにのみ、残りのファイルを含む第2のサブセットについて行われる。各オフセット・ビンにおけるポイント数が予め定められたしきい値に届かないときは、斜線検査の失敗となる。かわりに、2つの検索を並列的(同時)に実行させてもよい。第1のサブセットの検索で正しいサウンドファイルが特定されると、第2のサブセットの検索を終了させるための信号が送られる。第1のサブセットの検索で正しいサウンドファイルが特定されなければ、ベストなファイルが特定されるまで第2のサブセットの検索が継続される。これら2つの異なる実現例は演算量と時間のトレードオフの関係にある。第1の実現例は演算量が軽いが第1の検索が失敗に終わると若干の遅延を招く。これに対して、第2の実現例は、ベストなファイルが第1のサブセットにある場合には演算量が多いが、そうでなければ遅延は最小化される。
【0087】
リストのセグメント化の目的は、サウンドファイルが検索照会のターゲットである確率を見積もって、検索を、照会サンプルにもっともマッチしそうなファイルに限定することにある。データベースのサウンドに確率を割当ててソーティングする方法はいくつも考えられるが、それらはすべて本発明の範疇のものである。確率は、ベストなサウンドファイルとして識別される時期の新しさ(recency)や頻度(frequency)に基づいて割り当てられるのが好ましい。時期の新しさは、とりわけポピュラーソングに対しては有用な測定値である。新曲がリリースされるので、音楽の関心が時間の流れにつれて非常に急速に変化するからである。確率スコアが計算されると、ファイルにランキングが割り当てられ、そのランキングでそのリスト自身をソートする。ソートされたリストは検索のために2以上のサブセットにセグメント化される。小さなサブセットは所定数のファイルを含む。たとえば、ランキングがたとえば上位1000ファイルにおけるファイルを特定すると、そのファイルは速い検索のための小さなサブセットに置かれる。かわりに、2つのサブセットに対するカットオフポイントを動的に調整するようにしてもよい。たとえば、所定のしきい値を超えるスコアのファイルすべてを第1のサブセットに置いて、それにより各サブセット内のファイル数が頻繁に変わるようにしてもよい。
【0088】
確率を計算する特別な一方法は、照会サンプルがマッチしたと識別された各時刻でサウンドファイルのスコアを1ずつ増加させることである。時期の新しさを考慮するために、新しい照会が古い照会よりもランキングで強い結果となるように、スコアのすべてが周期的に下方修正される。たとえば、照会があるごとにすべてのスコアを一定倍率でもって段階的に減らすようにすることができる。その結果、スコアは更新されなければ指数関数的に減少していく。データベースにおけるファイル数(難なく100万くらいになりうる)に依存して、この方法は照会がある度に大量のスコアの更新を要することになり、場合によっては望ましくない状況となる。代案として、相対的に少ない頻度の間隔(たとえば1日に1回)でスコアを下方修正するようにしてもよい。少ない頻度での修正による結果は、照会の度に修正する場合の結果とだいたい似たようなものであるが、まったく同じではない。しかし、ランキングを更新するための計算負荷は非常に小さくなる。
【0089】
この時期の新しさによる調整の変形例としては、指数関数的に増加するスコア更新at(ただし、tは最後の一括更新からの経過時間)を照会の都度ベストなサウンドファイルに付加することが考えられる。一括更新の都度、aT(ただし、Tは最後の一括更新からの総合経過時間)で割り算することで全スコアが下方修正される。この変形例において、aは近時率(recency factor)で、1より大の値である。
【0090】
上述したランキング処理に加えて、リスティングの強弱をつけるのに役立つように事前の知識を導入することもできる。たとえば、ニューリリースは古い曲よりも問い合わせが多く来るであろう。そこで、ニューリリースは、照会サンプルにマッチする確率の高い曲を集めた第1のサブセットに自動的に置くようにしてもよい。これは上記した自己ランキングアルゴリズムとは独立に行われうる。自己ランキングの特徴をも用いると、ニューリリースは第1のサブセット内のいずれかの位置する初期ランキングに割り当てられる。ニューリリースは、リストの最上位、高い確率の曲のリストの末尾、もしくはリスト中の中間のどこか、にシードされうる。検索の目的のため、ランキングは時間経過につれて収束して関心の真のレベルを反映するようになるので、初期位置は問題にならない。
【0091】
代替の実施例においては、時期の新しさのランキングの順序で検索を行い、sound_IDスコアが所定のしきい値を超えた時点で終了する。これは、各セグメントがsound_IDを1つだけを含む上記の方法と等価である。
【0092】
ベストなサウンドのスコアは他のすべてのサウンドファイルのスコアよりもかなり高いことが実験で分かり、そのため、わずかな実験で好適なしきい値を選択することができる。この実施例を実現する一方法は、データベース・インデックスのすべてのsound_IDを、時期の新しさに応じて、スコアが同一の場合に任意の決定で、ランクづけすることである。時期の新しさの各ランキングはユニークであるから、時期の新しさのスコアとsound_IDとの間は1対1でマッピングされる。そして、候補sound_IDのリストとそれに付随する散布リスト(図9C)を作成するためにsound_IDをソーティングするときに、ランキングがsound_IDのかわりに用いられる。3つ組(fingerprint, landmark, sound_ID)のインデックス・リストが生成され、そのインデックス・リストがマスター・インデックス・リストにソートされる前に、ランキング番号をインデックスと結合してもよい。そして、sound_IDについてランキングが実行される。かわりに、検索および更新機能を用いてランキング付きsound_IDを更新することもできる。ランキングが更新されると、新たなランキングが古いランキングのところに割り当てられ、マッピングの整合性が維持される。
【0093】
代替案として、ランキングを後の処理において結合するようにしてもよい。いったん散布リストが生成されると、ランキングを各sound_IDに対応付けることができる。そして、そのセットがランキングによってソートされる。この実現例においては、散布リストへのポインタだけを修正する必要がある。散布リストへのグルーピングを繰り返す必要はない。後の処理において結合することの利点は、ランキングが更新される度にデータベース・インデックス全部を再生成する必要がない点である。
【0094】
流行によるランキングはそれ自身、経済的価値の対象となりうることにも注目すべきである。すなわち、ランキングは、知らないサウンドサンプルを確認しようとする消費者の好みを反映するものである。多くの場合、曲の記録物の購入への欲求によって照会が指示される。実際に、ユーザについての人口情報が分かっていれば、要求された人口グループの各々に対して別のランキング手法を実現することもできる。ユーザの人口グループは、そのユーザが認識サービスに登録したときに受けたプロフィール情報から得ることができる。標準協調フィルタリング技術により動的に判断することも可能である。
【0095】
リアルタイムシステムでは、サウンドが認識システムに時間経過につれて追加的に供給され、パイプライン認識が可能である。この場合、セグメント内で入力データを処理してサンプルのインデックスセットを追加的に更新することが可能である。各更新周期の後、上述の検索および検査ステップによりサウンド記録の候補リストを検索するために、新たな拡張インデックスセットが用いられる。新たに得られたサンプル・フィンガープリントにマッチするフィンガープリントに対しデータベース・インデックスが検索され、新しい3つ組(landmarkk, landmark*j, sound_IDj)が生成される。新たなペアが散布リストに付加されて、ヒストグラムが追加される。このアプローチの利点は、サウンド記録を正確に識別するのに十分なデータが収集されると、たとえば、あるサウンドファイルのオフセット・ビンにおけるポイント数が高いしきい値を超える場合、もしくは2番目に高いサウンドファイルのスコアを超える場合には、データ収集を中断してその結果を通知することができることである。
【0096】
いったん正しいサウンドが識別されると、適当な方法でその結果がユーザもしくはシステムに通知される。 その結果はたとえば、コンピュータ印刷、電子メール、web検索結果ページ、移動電話へのSMS(short messaging service)テキストメッセージ、コンピュータ生成された電話による音声メッセージ、ユーザが後でアクセスできるwebサイトもしくはインターネット・アカウントへの結果のポスティングなどによって通知されうる。通知された結果には、曲の名称やアーティスト、クラシック曲の作曲者やレコーディング属性(たとえば演奏者、指揮者、会場)、広告の会社やプロダクト、その他各種の好適な識別子などの、サウンドの識別情報を含めてもよい。くわえて、経歴情報、周辺のコンサート情報、その他ファンが関心のある情報を提供してもよいし、そのような情報へのハイパーリンクを提供してもよい。通知される結果には、サウンドファイルの絶対スコアもしくは次にスコアの高かったサウンドファイルとの比較におけるスコアを含めてもよい。
【0097】
認識方法の有用な成果の一つは、同じサウンドの異なる2つの演奏を混同しない点である。たとえば、クラシックの同じ曲でも演奏が異なれば、たとえ人が両者の違いを検知できなくても、それらを同一とみなさない。ランドマーク/フィンガープリントのペアとそれらの時間進行が2つの演奏ではマッチする可能性が非常に低いからである。本実施例では、リニアな対応関係が特定されるためには、ランドマーク/フィンガープリントのペアが互いに約10msの中になければならない。この結果、本発明の自動認識によって、あらゆるケースにおいて、適切な演奏/サウンドトラックやアーティスト/ラベルが得られる。
【0098】
(実現例)
以下、本発明の好適な実現例である連続スライディング・ウィンドウ・オーディオ認識について説明する。マイクロホンまたはその他の音源が連続的にバッファにサンプリングされ、過去N秒のサウンドの記録が得られる。 サウンド・コンテンツのIDを突き止めるべく、サウンド・バッファの内容が周期的に分析される。サウンド・バッファは固定サイズとしてもよいし、サウンドがサンプリングされるときのサイズに応じて増大するようにしてもよい。後者は、オーディオ・サンプルの順次増大セグメントとよばれる。サウンド記録が識別されたことを示すための通知がなされる。たとえば、ログファイルが収集され、もしくは、タイトル、アーティスト、アルバムカバーアート、歌詞といった 曲の情報や購入情報を示す装置にディスプレイ表示される。重複を避けるため、認識されるサウンドのIDが変わったとき、たとえば、ジュークボックスのプログラムが変わったとき、にだけ通知がなされる。かかる装置は、あらゆるサウンド・ストリーム(ラジオ、インターネット・ストリーミング・ラジオ、隠しマイク、電話呼び出しなど)から再生された音楽のリストを生成するのに使用されうる。曲IDに加え、認識時刻のような情報のログをとることができる。特定情報が(例えばGPSから)取得可能であれば、これらの情報のログをとることができる。
【0099】
識別を達成するため、各バッファを初めから識別してもよい。かわりに、サウンドパラメータをたとえばフィンガープリントまたは他の中間特徴量抽出形式に抽出し、第2バッファに記憶してもよい。 第2バッファの前に、新たなフィンガープリントを、バッファの最後から廃棄される古いフィンガープリントとともに加算してもよい。このようなローリング・バッファ法の利点は、サウンドサンプルのオーバーラップしているセグメントで同じ分析を重複して行う必要がなく、そのため演算量を節約できることである。ローリング・フィンガープリント・バッファの内容に対し識別プロセスが周期的に実行される。小型の携帯型装置の場合、フィンガープリント・ストリームはデータ量が非常に大きいので、フィンガープリント分析をその装置で行い、その結果を、比較的低い帯域のデータチャネルを用いて認識サーバに送信するようにしてもよい。ローリング・フィンガープリント・バッファは、これを携帯型装置に置き、各回ごとに認識サーバに送信してもよいし、認識サーバにローリング・フィンガープリント・バッファを備え、サーバで認識セッションが連続的に行われるようにしてもよい。
【0100】
このようなローリング・バッファ認識システムでは、認識するのに十分な情報が得られしだい新たなサウンド記録が認識されうる。十分な情報はバッファ長より少なくてもよい。たとえば、特徴的な曲は1秒間の演奏で一義的に認識されうるし、バッファが15〜30秒の長さを有しているとしても、システムは1秒で周期的に認識し、曲が直ちに認識されうる。逆に、特徴的でない曲が認識にさらに数秒間のサンプルを必要とする場合には、システムは曲のIDを宣言する前に長時間待たなければならない。このスライディング・ウィンドウ認識法においては、サウンドが識別されうるようになりしだい認識される。
【0101】
次の点に注意することが重要である。本発明は全機能を備えたシステムおよび方法を前提に説明されたが、本発明の構成はさまざまな形式による命令を格納したコンピュータ読み取り可能な媒体のかたちで流通させることが可能であり、また、本発明はその流通に実際に用いるメディアに記録する信号の形式にかかわらず適用されることは当業者には理解されよう。このようなコンピュータによってアクセス可能なデバイスは、コンピュータメモリ(RAM,ROM)、フロッピディスク、CD−ROMをはじめ、ディジタルまたはアナログの通信リンクのような伝送系メディアを含む。
【0102】
上述した実施の形態は、本発明の技術的範囲から逸脱することなく多くの方法で変更可能であることは明らかであろう。よって、本発明の技術的範囲は請求の範囲およびその均等の範囲によって画定される。
【図面の簡単な説明】
【図1】 音響サンプルを認識する本発明の方法を示すフローチャートである。
【図2】 図1の方法を実現する分散型コンピュータシステムの一例を示すブロック図である。
【図3】 音響ファイルのデータベース・インデックスを構築する方法を示すフローチャートである。
【図4】 音響サンプルに対して計算されるランドマークおよびフィンガープリントを模式的に示す図である。
【図5】 ランドマークの選択を示す、音響サンプルのL4ノルムのグラフである。
【図6】 図1の方法で用いられる音響ファイルのデータベース・インデックスを構築する別の実施態様を示すフローチャートである。
【図7A】、
【図7B】、
【図7C】 凸角点および連結した凸角点を示すスペクトログラムである。
【図8A】、
【図8B】、
【図8C】 図3の方法におけるインデックス・セット、インデックス・リスト、マスター・インデックス・リストを示す図である。
【図9A】、
【図9B】、
【図9C】 図1の方法におけるインデックス・リスト、候補リスト、散布リストを示す図である。
【図10A】、
【図10B】 未知音響サンプルに対する識別の成功および識別の失敗をそれぞれ示す散布図である。

Claims (28)

  1. オーディオ・サンプルを識別する方法であって、
    前記オーディオ・サンプルの内容に基づき計算される当該オーディオ・サンプルにおける時間上の特定の位置で生じるランドマークと、当該オーディオ・サンプルの前記特定の位置またはその付近における1または2以上の特徴量を含むフィンガープリントとで形成される、サンプル・ランドマーク/フィンガープリント・ペアを生成するステップと、
    1または2以上のオーディオ・ファイルの各々に対し、当該オーディオ・ファイルの内容に基づき計算される当該オーディオ・ファイルにおける時間上の特定の位置で生じるランドマークと、当該オーディオ・ファイルの前記特定の位置またはその付近における1または2以上の特徴量を含むフィンガープリントとで形成される、ファイル・ランドマーク/フィンガープリント・ペアを生成するファイル・フィンガープリント生成ステップと、
    各サンプル・ランドマーク/フィンガープリント・ペアと過去に生成されたファイル・ランドマーク/フィンガープリント・ペアとのほぼリニアな対応関係を特定する特定ステップと、
    前記ほぼリニアな対応関係が多数あるときにベストなファイルを識別する識別ステップと、
    を有することを特徴とする方法。
  2. 各フィンガープリントは、各ランドマーク位置またはその位置からわずかにオフセットした位置における当該オーディオの多数の特徴量を表現することを特徴とする請求項1に記載の方法。
  3. 各フィンガープリントは、前記サンプルの時間伸縮に対し不変であることを特徴とする請求項1又は2に記載の方法。
  4. 各フィンガープリントは、スペクトル・スライス・フィンガープリント、マルチスライス・フィンガープリント、LPC係数、ケプストラム係数、およびスペクトルピークの周波数成分のうちのいずれかとして計算されることを特徴とする請求項1乃至3のいずれか1項に記載の方法。
  5. 前記スペクトル・スライス・フィンガープリントは、ランドマーク時点に対する時間オフセットのセットにおいて計算されることを特徴とする請求項に記載の方法。
  6. 各ランドマークの位置は、サウンド記録における特徴的かつ再現可能な位置をみつけるランドマーク分析方法を用いて識別されることを特徴とする請求項1乃至5のいずれか1項に記載の方法。
  7. 前記ランドマーク分析方法は、スペクトルLpノルムを用いて前記サウンド記録においてとりうるすべての時点で瞬時パワーを計算し、ランドマークとしての極大点を選択することを特徴とする請求項に記載の方法。
  8. 1または2以上のランドマークは、固定もしくは可変のオフセットでの複数の時間スライスにわたるスペクトル成分から得られるマルチスライス・ランドマークであることを特徴とする請求項またはに記載の方法。
  9. 前記ファイル・ランドマーク/フィンガープリント・ペアはデータベースに格納され、そのデータベース内の各ファイルはそのファイルのフィンガープリントによってインデックスされることを特徴とする請求項1乃至8のいずれか1項に記載の方法。
  10. 前記インデックスはフィンガープリントに基づきソートされることを特徴とする請求項に記載の方法。
  11. 固有のフィンガープリントとそれに対応するランドマークのリストへのポインタと含むエントリを有するマスター・インデックス・リストが構成されることを特徴とする請求項1に記載の方法。
  12. 各ファイルはSOUND_IDによって識別され、前記データベースは、フィンガープリントと、ランドマークと、SOUND_IDとの3つ組を複数記憶することを特徴とする請求項9乃至11のいずれか1項に記載の方法。
  13. 統計的に最もリニアな対応関係にあるファイル・ランドマーク/フィンガープリント・ペアを有するファイルが前記ベストなファイルとして選択されることを特徴とする請求項1乃至12のいずれか1項に記載の方法。
  14. サンプル・ランドマーク/フィンガープリント・ペアが許容範囲内でファイル・ランドマーク/フィンガープリント・ペアにマッチするときに、サンプル・ランドマークとファイル・ランドマークのペア(landmarkn, landmark*n)においてリニアな対応関係が生じることを特徴とする請求項1乃至13のいずれか1項に記載の方法。
  15. 個々のフィンガープリント同士がマッチし、なおかつ、個々のランドマーク同士がリニアな関係にあるときに、サンプル・ランドマーク/フィンガープリント・ペアとファイル・ランドマーク/フィンガープリント・ペアとの間にリニアな対応関係が生じることを特徴とする請求項1乃至14のいずれか1項に記載の方法。
  16. フィンガープリント同士が同一または所定の許容範囲内の差にあるときに、両者のフィンガープリントがマッチしたとすることを特徴とする請求項1に記載の方法。
  17. リスト内のサンプル・ランドマークとファイル・ランドマークのペア(landmarkn, landmark*n)が
    landmark*n=m*landmarkn+offset、
    の関係にあるときに、リニアな対応関係が生じることを特徴とする請求項1または1に記載の方法。
  18. 前記サンプルは、音響波、無線波、ディジタルオーディオPCMストリーム、圧縮ディジタルオーディオストリーム、インターネットストリーミング放送のいずれかの形式であることを特徴とする請求項1乃至17のいずれか1項に記載の方法。
  19. 前記サンプル・フィンガープリントはローリング・バッファに格納されることを特徴とする請求項1乃至18のいずれか1項に記載の方法。
  20. 前記特定ステップおよび識別ステップは、前記ローリング・バッファの内容に対して周期的に実行されることを特徴とする請求項19に記載の方法。
  21. 前記特定ステップおよび識別ステップは、認識するのに十分な情報が前記ローリング・バッファから得られしだい実行されることを特徴とする請求項19または2に記載の方法。
  22. 前記特定ステップおよび識別ステップは、まずファイルの第1のサブセットに対して実行され、その第1のサブセットでベストなファイルが識別されなかったときに、残りのファイルを収めた第2のサブセットが検索されることを特徴とする請求項1乃至21のいずれか1項に記載の方法。
  23. 前記第1のサブセットは、当該第1のサブセットに含まれないファイルよりも識別される経験的に確率が高いファイルを含むことを特徴とする請求項2に記載の方法。
  24. 前記特定ステップは、前記対応する位置間の差分をとり、その差分のヒストグラムのピークを計算することにより、前記対応する位置の散布図における斜線を特定することを特徴とする請求項1に記載の方法。
  25. 前記識別ステップは、多数の対応関係を生じる前記ベストなファイルにおける位置に対するオフセットの指標を提供するステップを更に有することを特徴とする請求項1に記載の方法。
  26. オーディオ・サンプルを識別する方法であって、
    クライアントからの要求に応じて、前記オーディオ・サンプルの少なくとも一部を、請求項1に記載の各ステップを実行するサーバに取り次ぐステップと、
    前記サーバがベストなファイルを識別したことに応じて、前記クライアントに応答を返すステップと
    を有することを特徴とする方法。
  27. 請求項1乃至26のいずれか1項に記載の方法をコンピュータに実行させるためのプログラムを格納したコンピュータ読み取り可能な記憶媒体。
  28. 請求項1乃至25のいずれか1項に記載の方法を実行するコンピュータシステムであって、
    キャプチャされた信号サンプルのランドマーク/フィンガープリント・ペアを含む特徴抽出サマリを、認識処理を実行するサーバ端末に送信するクライアント端末を含むことを特徴とするコンピュータシステム。
JP2002516764A 2000-07-31 2001-07-26 高い雑音、歪み環境下でサウンド・楽音信号を認識するシステムおよび方法 Expired - Lifetime JP4945877B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US22202300P 2000-07-31 2000-07-31
US60/222,023 2000-07-31
US09/839,476 2001-04-20
US09/839,476 US6990453B2 (en) 2000-07-31 2001-04-20 System and methods for recognizing sound and music signals in high noise and distortion
PCT/EP2001/008709 WO2002011123A2 (en) 2000-07-31 2001-07-26 Method for search in an audio database

Publications (3)

Publication Number Publication Date
JP2004505328A JP2004505328A (ja) 2004-02-19
JP2004505328A5 JP2004505328A5 (ja) 2005-03-17
JP4945877B2 true JP4945877B2 (ja) 2012-06-06

Family

ID=26916372

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002516764A Expired - Lifetime JP4945877B2 (ja) 2000-07-31 2001-07-26 高い雑音、歪み環境下でサウンド・楽音信号を認識するシステムおよび方法

Country Status (14)

Country Link
US (9) US6990453B2 (ja)
EP (1) EP1307833B1 (ja)
JP (1) JP4945877B2 (ja)
KR (1) KR100776495B1 (ja)
CN (1) CN1592906B (ja)
AT (1) ATE329319T1 (ja)
AU (1) AU2001289766A1 (ja)
BR (1) BRPI0112901B1 (ja)
DE (1) DE60120417T2 (ja)
DK (1) DK1307833T3 (ja)
ES (1) ES2266254T3 (ja)
HK (1) HK1051248A1 (ja)
PT (1) PT1307833E (ja)
WO (1) WO2002011123A2 (ja)

Families Citing this family (766)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6449377B1 (en) * 1995-05-08 2002-09-10 Digimarc Corporation Methods and systems for watermark processing of line art images
US6560349B1 (en) * 1994-10-21 2003-05-06 Digimarc Corporation Audio monitoring using steganographic information
US7362775B1 (en) * 1996-07-02 2008-04-22 Wistaria Trading, Inc. Exchange mechanisms for digital information packages with bandwidth securitization, multichannel digital watermarks, and key management
US7224819B2 (en) 1995-05-08 2007-05-29 Digimarc Corporation Integrating digital watermarks in multimedia content
US6760463B2 (en) * 1995-05-08 2004-07-06 Digimarc Corporation Watermarking methods and media
US7805500B2 (en) * 1995-05-08 2010-09-28 Digimarc Corporation Network linking methods and apparatus
US5613004A (en) * 1995-06-07 1997-03-18 The Dice Company Steganographic method and device
US6505160B1 (en) 1995-07-27 2003-01-07 Digimarc Corporation Connected audio and other media objects
US6965682B1 (en) 1999-05-19 2005-11-15 Digimarc Corp Data transmission by watermark proxy
US7711564B2 (en) * 1995-07-27 2010-05-04 Digimarc Corporation Connected audio and other media objects
US7562392B1 (en) * 1999-05-19 2009-07-14 Digimarc Corporation Methods of interacting with audio and ambient music
US6411725B1 (en) * 1995-07-27 2002-06-25 Digimarc Corporation Watermark enabled video objects
US6829368B2 (en) * 2000-01-26 2004-12-07 Digimarc Corporation Establishing and interacting with on-line media collections using identifiers in media signals
US7664263B2 (en) 1998-03-24 2010-02-16 Moskowitz Scott A Method for combining transfer functions with predetermined key creation
US6205249B1 (en) 1998-04-02 2001-03-20 Scott A. Moskowitz Multiple transform utilization and applications for secure digital watermarking
US7457962B2 (en) * 1996-07-02 2008-11-25 Wistaria Trading, Inc Optimization methods for the insertion, protection, and detection of digital watermarks in digitized data
US7177429B2 (en) * 2000-12-07 2007-02-13 Blue Spike, Inc. System and methods for permitting open access to data objects and for securing data within the data objects
US7346472B1 (en) 2000-09-07 2008-03-18 Blue Spike, Inc. Method and device for monitoring and analyzing signals
US5889868A (en) 1996-07-02 1999-03-30 The Dice Company Optimization methods for the insertion, protection, and detection of digital watermarks in digitized data
US7095874B2 (en) * 1996-07-02 2006-08-22 Wistaria Trading, Inc. Optimization methods for the insertion, protection, and detection of digital watermarks in digitized data
US7159116B2 (en) 1999-12-07 2007-01-02 Blue Spike, Inc. Systems, methods and devices for trusted transactions
US7730317B2 (en) * 1996-12-20 2010-06-01 Wistaria Trading, Inc. Linear predictive coding implementation of digital watermarks
US7689532B1 (en) 2000-07-20 2010-03-30 Digimarc Corporation Using embedded data with file sharing
US7664264B2 (en) * 1999-03-24 2010-02-16 Blue Spike, Inc. Utilizing data reduction in steganographic and cryptographic systems
GB9909362D0 (en) * 1999-04-23 1999-06-16 Pace Micro Tech Plc Memory database system for encrypted progarmme material
US8874244B2 (en) * 1999-05-19 2014-10-28 Digimarc Corporation Methods and systems employing digital content
US7302574B2 (en) * 1999-05-19 2007-11-27 Digimarc Corporation Content identifiers triggering corresponding responses through collaborative processing
US7185201B2 (en) 1999-05-19 2007-02-27 Digimarc Corporation Content identifiers triggering corresponding responses
US7013301B2 (en) * 2003-09-23 2006-03-14 Predixis Corporation Audio fingerprinting system and method
US20050038819A1 (en) * 2000-04-21 2005-02-17 Hicken Wendell T. Music Recommendation system and method
US7475246B1 (en) 1999-08-04 2009-01-06 Blue Spike, Inc. Secure personal content server
US8326584B1 (en) 1999-09-14 2012-12-04 Gracenote, Inc. Music searching methods based on human perception
US7194752B1 (en) 1999-10-19 2007-03-20 Iceberg Industries, Llc Method and apparatus for automatically recognizing input audio and/or video streams
US7174293B2 (en) * 1999-09-21 2007-02-06 Iceberg Industries Llc Audio identification system and method
US6671407B1 (en) 1999-10-19 2003-12-30 Microsoft Corporation System and method for hashing digital images
US6834308B1 (en) * 2000-02-17 2004-12-21 Audible Magic Corporation Method and apparatus for identifying media content presented on a media playing device
US20060217828A1 (en) * 2002-10-23 2006-09-28 Hicken Wendell T Music searching system and method
US8121843B2 (en) * 2000-05-02 2012-02-21 Digimarc Corporation Fingerprint methods and systems for media signals
US6990453B2 (en) * 2000-07-31 2006-01-24 Landmark Digital Services Llc System and methods for recognizing sound and music signals in high noise and distortion
US7853664B1 (en) 2000-07-31 2010-12-14 Landmark Digital Services Llc Method and system for purchasing pre-recorded music
ATE445190T1 (de) 2000-08-23 2009-10-15 Gracenote Inc Verfahren zur verbesserten wiedergabe von informationen, client-system und server-system
US8010988B2 (en) * 2000-09-14 2011-08-30 Cox Ingemar J Using features extracted from an audio and/or video work to obtain information about the work
US8205237B2 (en) 2000-09-14 2012-06-19 Cox Ingemar J Identifying works, using a sub-linear time search, such as an approximate nearest neighbor search, for initiating a work-based action, such as an action on the internet
US7127615B2 (en) * 2000-09-20 2006-10-24 Blue Spike, Inc. Security based on subliminal and supraliminal channels for data objects
JP2002108350A (ja) * 2000-09-28 2002-04-10 Internatl Business Mach Corp <Ibm> 音楽配信のための方法及びシステム
BR0114879A (pt) 2000-10-24 2003-08-12 Thomson Licensing Sa Método de dimensionar uma página de executor de meios embutido
US8122236B2 (en) 2001-10-24 2012-02-21 Aol Inc. Method of disseminating advertisements using an embedded media player page
WO2002056139A2 (en) 2000-10-26 2002-07-18 Digimarc Corporation Method and system for internet access
FR2816157A1 (fr) * 2000-10-31 2002-05-03 Thomson Multimedia Sa Procede de traitement de donnees video distinees a etre visualisees sur ecran et dispositif mettant en oeuvre le procede
US7925967B2 (en) * 2000-11-21 2011-04-12 Aol Inc. Metadata quality improvement
US20020072982A1 (en) 2000-12-12 2002-06-13 Shazam Entertainment Ltd. Method and system for interacting with a user in an experiential environment
AU2002232817A1 (en) 2000-12-21 2002-07-01 Digimarc Corporation Methods, apparatus and programs for generating and utilizing content signatures
US20020091761A1 (en) * 2001-01-10 2002-07-11 Lambert James P. Technique of generating a composite media stream
WO2002065782A1 (en) * 2001-02-12 2002-08-22 Koninklijke Philips Electronics N.V. Generating and matching hashes of multimedia content
WO2003005242A1 (en) * 2001-03-23 2003-01-16 Kent Ridge Digital Labs Method and system of representing musical information in a digital representation for use in content-based multimedia information retrieval
US7363278B2 (en) 2001-04-05 2008-04-22 Audible Magic Corporation Copyright detection and protection system and method
US7248715B2 (en) * 2001-04-06 2007-07-24 Digimarc Corporation Digitally watermarking physical media
DE10117871C1 (de) * 2001-04-10 2002-07-04 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Extrahieren einer Signalkennung, Verfahren und Vorrichtung zum Erzeugen einer Datenbank aus Signalkennungen und Verfahren und Vorrichtung zum Referenzieren eines Such-Zeitsignals
US7421376B1 (en) 2001-04-24 2008-09-02 Auditude, Inc. Comparison of data signals using characteristic electronic thumbprints
US6996273B2 (en) * 2001-04-24 2006-02-07 Microsoft Corporation Robust recognizer of perceptually similar content
US7356188B2 (en) * 2001-04-24 2008-04-08 Microsoft Corporation Recognizer of text-based work
US7020775B2 (en) * 2001-04-24 2006-03-28 Microsoft Corporation Derivation and quantization of robust non-local characteristics for blind watermarking
US6973574B2 (en) * 2001-04-24 2005-12-06 Microsoft Corp. Recognizer of audio-content in digital signals
US6975743B2 (en) * 2001-04-24 2005-12-13 Microsoft Corporation Robust and stealthy video watermarking into regions of successive frames
US7046819B2 (en) * 2001-04-25 2006-05-16 Digimarc Corporation Encoded reference signal for digital watermarks
US7962482B2 (en) * 2001-05-16 2011-06-14 Pandora Media, Inc. Methods and systems for utilizing contextual feedback to generate and modify playlists
DE60236161D1 (de) * 2001-07-20 2010-06-10 Gracenote Inc Automatische identifizierung von klangaufzeichnungen
US8972481B2 (en) 2001-07-20 2015-03-03 Audible Magic, Inc. Playlist generation method and apparatus
US20030028796A1 (en) * 2001-07-31 2003-02-06 Gracenote, Inc. Multiple step identification of recordings
US6724914B2 (en) * 2001-10-16 2004-04-20 Digimarc Corporation Progressive watermark decoding on a distributed computing platform
US7035867B2 (en) * 2001-11-28 2006-04-25 Aerocast.Com, Inc. Determining redundancies in content object directories
US20050010604A1 (en) 2001-12-05 2005-01-13 Digital Networks North America, Inc. Automatic identification of DVD title using internet technologies and fuzzy matching techniques
US7020304B2 (en) 2002-01-22 2006-03-28 Digimarc Corporation Digital watermarking and fingerprinting including synchronization, layering, version control, and compressed embedding
EP1474761A2 (en) 2002-02-05 2004-11-10 Koninklijke Philips Electronics N.V. Efficient storage of fingerprints
AU2003222132A1 (en) * 2002-03-28 2003-10-13 Martin Dunsmuir Closed-loop command and response system for automatic communications between interacting computer systems over an audio communications channel
US7287275B2 (en) 2002-04-17 2007-10-23 Moskowitz Scott A Methods, systems and devices for packet watermarking and efficient provisioning of bandwidth
EP1497991B1 (en) 2002-04-22 2021-04-14 Nielsen Media Research, Inc. Methods and apparatus to collect audience information associated with a media presentation
DK1504445T3 (da) * 2002-04-25 2008-12-01 Landmark Digital Services Llc Robust og invariant lydmönster-matching
US7824029B2 (en) * 2002-05-10 2010-11-02 L-1 Secure Credentialing, Inc. Identification card printer-assembler for over the counter card issuing
JP2005525600A (ja) * 2002-05-10 2005-08-25 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 透かしの埋め込み及び取り出し
US7899915B2 (en) 2002-05-10 2011-03-01 Richard Reisman Method and apparatus for browsing using multiple coordinated device sets
US7421096B2 (en) * 2004-02-23 2008-09-02 Delefevre Patrick Y Input mechanism for fingerprint-based internet search
US7461392B2 (en) * 2002-07-01 2008-12-02 Microsoft Corporation System and method for identifying and segmenting repeating media objects embedded in a stream
US7095873B2 (en) 2002-06-28 2006-08-22 Microsoft Corporation Watermarking via quantization of statistics of overlapping regions
US7006703B2 (en) * 2002-06-28 2006-02-28 Microsoft Corporation Content recognizer via probabilistic mirror distribution
WO2004004351A1 (en) * 2002-07-01 2004-01-08 Microsoft Corporation A system and method for providing user control over repeating objects embedded in a stream
US7949689B2 (en) * 2002-07-18 2011-05-24 Accenture Global Services Limited Media indexing beacon and capture device
DE10232916B4 (de) * 2002-07-19 2008-08-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Charakterisieren eines Informationssignals
US7239981B2 (en) 2002-07-26 2007-07-03 Arbitron Inc. Systems and methods for gathering audience measurement data
US20030191764A1 (en) * 2002-08-06 2003-10-09 Isaac Richards System and method for acoustic fingerpringting
KR100872191B1 (ko) * 2002-09-27 2008-12-09 인터내셔널 비지네스 머신즈 코포레이션 발표 하이퍼링크 타임 테이블 생성 방법, 발표 처리 방법, 컴퓨팅 시스템 및 컴퓨터 판독가능한 기록 매체
US9711153B2 (en) 2002-09-27 2017-07-18 The Nielsen Company (Us), Llc Activating functions in processing devices using encoded audio and detecting audio signatures
US8959016B2 (en) 2002-09-27 2015-02-17 The Nielsen Company (Us), Llc Activating functions in processing devices using start codes embedded in audio
CN1685703A (zh) * 2002-09-30 2005-10-19 皇家飞利浦电子股份有限公司 “指纹”的提取
US7171561B2 (en) * 2002-10-17 2007-01-30 The United States Of America As Represented By The Secretary Of The Air Force Method and apparatus for detecting and extracting fileprints
SE524936C2 (sv) * 2002-10-23 2004-10-26 Softhouse Nordic Ab Mobil likhetsbedömning av objekt
KR20050061594A (ko) * 2002-11-01 2005-06-22 코닌클리케 필립스 일렉트로닉스 엔.브이. 개선된 오디오 데이터 지문 검색
KR20050086470A (ko) * 2002-11-12 2005-08-30 코닌클리케 필립스 일렉트로닉스 엔.브이. 멀티미디어 컨텐츠를 핑거프린트하는 방법
JP4172259B2 (ja) * 2002-11-26 2008-10-29 ソニー株式会社 情報処理装置および方法、並びにコンピュータ・プログラム
US6958103B2 (en) * 2002-12-23 2005-10-25 Kimberly-Clark Worldwide, Inc. Entangled fabrics containing staple fibers
AU2003234420A1 (en) 2002-12-27 2004-07-29 Nielsen Media Research, Inc. Methods and apparatus for transcoding metadata
US8201194B2 (en) * 2003-01-06 2012-06-12 Wijnands Rudi J M Real-time recording agent for streaming data from an internet
US7593915B2 (en) * 2003-01-07 2009-09-22 Accenture Global Services Gmbh Customized multi-media services
EP1593217A4 (en) 2003-02-10 2009-04-01 Nielsen Media Res Inc METHOD AND DEVICE FOR ADAPTIVELY COLLECTING INVESTIGATOR INFORMATION DATA
US7606790B2 (en) 2003-03-03 2009-10-20 Digimarc Corporation Integrating and enhancing searching of media content and biometric databases
WO2004084181A2 (en) * 2003-03-15 2004-09-30 Mindspeed Technologies, Inc. Simple noise suppression model
US20060235864A1 (en) * 2005-04-14 2006-10-19 Apple Computer, Inc. Audio sampling and acquisition system
US20040243852A1 (en) * 2003-05-28 2004-12-02 Rosenstein Adam H. Method, system and software for state signing of internet resources
WO2005113099A2 (en) 2003-05-30 2005-12-01 America Online, Inc. Personalizing content
US20040237759A1 (en) * 2003-05-30 2004-12-02 Bill David S. Personalizing content
JP2007528144A (ja) * 2003-07-11 2007-10-04 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ マルチメディア信号おいてトリガーマーカとして機能するフィンガープリントを生成及び検出する方法及び装置
US7505964B2 (en) * 2003-09-12 2009-03-17 Google Inc. Methods and systems for improving a search ranking using related queries
US7454417B2 (en) * 2003-09-12 2008-11-18 Google Inc. Methods and systems for improving a search ranking using population information
EP1668903A4 (en) 2003-09-12 2011-01-05 Nielsen Media Res Inc DEVICES AND METHOD FOR DIGITAL VIDEO SIGNATURES FOR USE WITH VIDEO PROGRAM IDENTIFICATION SYSTEMS
US7715934B2 (en) * 2003-09-19 2010-05-11 Macrovision Corporation Identification of input files using reference files associated with nodes of a sparse binary tree
JP4328169B2 (ja) * 2003-10-02 2009-09-09 オリンパス株式会社 データ処理装置
US7383174B2 (en) * 2003-10-03 2008-06-03 Paulin Matthew A Method for generating and assigning identifying tags to sound files
WO2005041109A2 (en) * 2003-10-17 2005-05-06 Nielsen Media Research, Inc. Methods and apparatus for identifiying audio/video content using temporal signal characteristics
US7379875B2 (en) * 2003-10-24 2008-05-27 Microsoft Corporation Systems and methods for generating audio thumbnails
US8554681B1 (en) * 2003-11-03 2013-10-08 James W. Wieder Providing “identified” compositions and digital-works
US9098681B2 (en) 2003-11-03 2015-08-04 James W. Wieder Adaptive personalized playback or presentation using cumulative time
US7884274B1 (en) 2003-11-03 2011-02-08 Wieder James W Adaptive personalized music and entertainment
US9053181B2 (en) 2003-11-03 2015-06-09 James W. Wieder Adaptive personalized playback or presentation using count
US8001612B1 (en) 2003-11-03 2011-08-16 Wieder James W Distributing digital-works and usage-rights to user-devices
US20150128039A1 (en) 2003-11-03 2015-05-07 James W. Wieder Newness Control of a Personalized Music and/or Entertainment Sequence
US9053299B2 (en) 2003-11-03 2015-06-09 James W. Wieder Adaptive personalized playback or presentation using rating
US11165999B1 (en) 2003-11-03 2021-11-02 Synergyze Technologies Llc Identifying and providing compositions and digital-works
US8396800B1 (en) 2003-11-03 2013-03-12 James W. Wieder Adaptive personalized music and entertainment
US8521725B1 (en) 2003-12-03 2013-08-27 Google Inc. Systems and methods for improved searching
US7831832B2 (en) * 2004-01-06 2010-11-09 Microsoft Corporation Digital goods representation based upon matrix invariances
CN1998168B (zh) 2004-02-19 2011-04-06 兰德马克数字服务有限责任公司 用于广播源辨识的方法与装置
ATE543140T1 (de) 2004-02-26 2012-02-15 Mediaguide Inc Verfahren und vorrichtung zur automatischen erkennung und identifikation der sendung von audio- oder videoprogrammsignalen
US7877810B2 (en) * 2004-03-02 2011-01-25 Rovi Solutions Corporation System, method and client user interface for a copy protection service
US7925657B1 (en) 2004-03-17 2011-04-12 Google Inc. Methods and systems for adjusting a scoring measure based on query breadth
US20050215239A1 (en) * 2004-03-26 2005-09-29 Nokia Corporation Feature extraction in a networked portable device
KR100967125B1 (ko) * 2004-03-26 2010-07-05 노키아 코포레이션 네트워크 휴대용 장치에서의 특징 추출
US20050216512A1 (en) * 2004-03-26 2005-09-29 Rahav Dor Method of accessing a work of art, a product, or other tangible or intangible objects without knowing the title or name thereof using fractional sampling of the work of art or object
US7221902B2 (en) * 2004-04-07 2007-05-22 Nokia Corporation Mobile station and interface adapted for feature extraction from an input media sample
WO2005101243A1 (en) * 2004-04-13 2005-10-27 Matsushita Electric Industrial Co. Ltd. Method and apparatus for identifying audio such as music
WO2005101998A2 (en) 2004-04-19 2005-11-03 Landmark Digital Services Llc Content sampling and identification
CN1998044B (zh) * 2004-04-29 2011-08-03 皇家飞利浦电子股份有限公司 音频信号分类方法和系统
US7770014B2 (en) 2004-04-30 2010-08-03 Microsoft Corporation Randomized signal transforms and their applications
US7565213B2 (en) * 2004-05-07 2009-07-21 Gracenote, Inc. Device and method for analyzing an information signal
DE102004022659B3 (de) * 2004-05-07 2005-10-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung zum Charakterisieren eines Tonsignals
US7273978B2 (en) 2004-05-07 2007-09-25 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Device and method for characterizing a tone signal
DE102004023436B4 (de) * 2004-05-10 2006-06-14 M2Any Gmbh Vorrichtung und Verfahren zum Analysieren eines Informationssignals
US20050251455A1 (en) * 2004-05-10 2005-11-10 Boesen Peter V Method and system for purchasing access to a recording
US20150051967A1 (en) * 2004-05-27 2015-02-19 Anonymous Media Research, Llc Media usage monitoring and measurment system and method
US20050267750A1 (en) * 2004-05-27 2005-12-01 Anonymous Media, Llc Media usage monitoring and measurement system and method
WO2006012241A2 (en) * 2004-06-24 2006-02-02 Landmark Digital Services Llc Method of characterizing the overlap of two media segments
JP4327202B2 (ja) 2004-07-01 2009-09-09 日本電信電話株式会社 特定音響信号含有区間検出システム及びその方法並びにプログラム
US20090138108A1 (en) * 2004-07-06 2009-05-28 Kok Keong Teo Method and System for Identification of Audio Input
EP2312475B1 (en) 2004-07-09 2012-05-09 Nippon Telegraph and Telephone Corporation Sound signal detection and image signal detection
CN101032106B (zh) 2004-08-06 2014-07-23 数字标记公司 便携计算装置中的快速信号检测和分布式计算
US20060212149A1 (en) * 2004-08-13 2006-09-21 Hicken Wendell T Distributed system and method for intelligent data analysis
US7623823B2 (en) * 2004-08-31 2009-11-24 Integrated Media Measurement, Inc. Detecting and measuring exposure to media content items
DE102004046746B4 (de) 2004-09-27 2007-03-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Verfahren zum Synchronisieren von Zusatzdaten und Basisdaten
US7574451B2 (en) * 2004-11-02 2009-08-11 Microsoft Corporation System and method for speeding up database lookups for multiple synchronized data streams
US7826708B2 (en) * 2004-11-02 2010-11-02 Microsoft Corporation System and method for automatically customizing a buffered media stream
EP1667106B1 (en) * 2004-12-06 2009-11-25 Sony Deutschland GmbH Method for generating an audio signature
US20060135098A1 (en) * 2004-12-17 2006-06-22 Yarosz Matthew J Method and apparatus for processing digital broadcast audio in the AM/FM bands
US7567899B2 (en) * 2004-12-30 2009-07-28 All Media Guide, Llc Methods and apparatus for audio recognition
US7921369B2 (en) * 2004-12-30 2011-04-05 Aol Inc. Mood-based organization and display of instant messenger buddy lists
US7451078B2 (en) * 2004-12-30 2008-11-11 All Media Guide, Llc Methods and apparatus for identifying media objects
US7634405B2 (en) * 2005-01-24 2009-12-15 Microsoft Corporation Palette-based classifying and synthesizing of auditory information
JP5150266B2 (ja) * 2005-02-08 2013-02-20 ランドマーク、ディジタル、サーヴィセズ、エルエルシー オーディオ信号において繰り返されるマテリアルの自動識別
US20060224798A1 (en) * 2005-02-22 2006-10-05 Klein Mark D Personal music preference determination based on listening behavior
US7818350B2 (en) 2005-02-28 2010-10-19 Yahoo! Inc. System and method for creating a collaborative playlist
KR20070116853A (ko) * 2005-03-04 2007-12-11 뮤직아이피 코포레이션 플레이리스트를 작성하기 위한 스캔 셔플
DE102005014477A1 (de) * 2005-03-30 2006-10-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines Datenstroms und zum Erzeugen einer Multikanal-Darstellung
WO2006112843A1 (en) * 2005-04-19 2006-10-26 Sean Ward Distributed acoustic fingerprint based recognition
US8065332B2 (en) * 2005-05-19 2011-11-22 Ntt Docomo, Inc. Method and apparatus for communication efficient private information retrieval and oblivious transfer
US20070016918A1 (en) * 2005-05-20 2007-01-18 Alcorn Allan E Detecting and tracking advertisements
US7613736B2 (en) * 2005-05-23 2009-11-03 Resonance Media Services, Inc. Sharing music essence in a recommendation system
KR20060133410A (ko) * 2005-06-20 2006-12-26 엘지전자 주식회사 복합 미디어 장치에서 파일 검색 및 파일 데이터베이스관리 방법
US20070028262A1 (en) * 2005-07-29 2007-02-01 Zermatt Systems, Inc. Virtual discovery of content available to a device
US20070033229A1 (en) * 2005-08-03 2007-02-08 Ethan Fassett System and method for indexing structured and unstructured audio content
US20070106405A1 (en) * 2005-08-19 2007-05-10 Gracenote, Inc. Method and system to provide reference data for identification of digital content
US7516074B2 (en) * 2005-09-01 2009-04-07 Auditude, Inc. Extraction and matching of characteristic fingerprints from audio signals
CN100367279C (zh) * 2005-09-08 2008-02-06 上海交通大学 数字音乐旋律的跨越式高速匹配装置
US7809943B2 (en) * 2005-09-27 2010-10-05 Rovi Solutions Corporation Method and system for establishing trust in a peer-to-peer network
US20070078708A1 (en) * 2005-09-30 2007-04-05 Hua Yu Using speech recognition to determine advertisements relevant to audio content and/or audio content relevant to advertisements
US20070076869A1 (en) * 2005-10-03 2007-04-05 Microsoft Corporation Digital goods representation based upon matrix invariants using non-negative matrix factorizations
EP1938269A1 (en) * 2005-10-13 2008-07-02 Koninklijke Philips Electronics N.V. Remote informed watermark detection system
US9697231B2 (en) * 2005-11-09 2017-07-04 Cxense Asa Methods and apparatus for providing virtual media channels based on media search
US20070118873A1 (en) * 2005-11-09 2007-05-24 Bbnt Solutions Llc Methods and apparatus for merging media content
US9697230B2 (en) * 2005-11-09 2017-07-04 Cxense Asa Methods and apparatus for dynamic presentation of advertising, factual, and informational content using enhanced metadata in search-driven media applications
US7801910B2 (en) 2005-11-09 2010-09-21 Ramp Holdings, Inc. Method and apparatus for timed tagging of media content
KR100803206B1 (ko) 2005-11-11 2008-02-14 삼성전자주식회사 오디오 지문 생성과 오디오 데이터 검색 장치 및 방법
US7844774B2 (en) * 2005-11-16 2010-11-30 Sun Microsystems, Inc. Extensible fingerprinting functions and content addressed storage system using the same
KR101488317B1 (ko) 2005-12-20 2015-02-04 아비트론 인코포레이티드 리서치 작업을 수행하는 방법 및 시스템
EP1963958B1 (en) 2005-12-21 2019-04-24 Digimarc Corporation Rules driven pan id metadata routing system and network
US8086722B2 (en) 2005-12-21 2011-12-27 Rovi Solutions Corporation Techniques for measuring peer-to-peer (P2P) networks
US20070162761A1 (en) * 2005-12-23 2007-07-12 Davis Bruce L Methods and Systems to Help Detect Identity Fraud
US8254308B1 (en) * 2006-01-05 2012-08-28 Sprint Spectrum L.P. Method and system for acoustically triggering electronic coupon retrieval
WO2007080764A1 (ja) * 2006-01-12 2007-07-19 Matsushita Electric Industrial Co., Ltd. 対象音分析装置、対象音分析方法および対象音分析プログラム
US8108452B2 (en) * 2006-01-12 2012-01-31 Yahoo! Inc. Keyword based audio comparison
FR2897217A1 (fr) * 2006-02-03 2007-08-10 France Telecom Determination d'identificateur de signal
US8209180B2 (en) * 2006-02-08 2012-06-26 Nec Corporation Speech synthesizing device, speech synthesizing method, and program
KR100774585B1 (ko) * 2006-02-10 2007-11-09 삼성전자주식회사 변조 스펙트럼을 이용한 음악 정보 검색 방법 및 그 장치
US7653342B2 (en) * 2006-02-16 2010-01-26 Dell Products L.P. Providing content to a device when lost a connection to the broadcasting station
US20070196802A1 (en) * 2006-02-21 2007-08-23 Nokia Corporation Visually Enhanced Personal Music Broadcast
KR100788682B1 (ko) * 2006-03-03 2007-12-26 삼성전자주식회사 음원 컨텐츠 전송 서비스 제공 방법 및 장치
US8626707B2 (en) * 2006-03-15 2014-01-07 Beats Music, Llc Automatic meta-data sharing of existing media to create streamable collections
US8285595B2 (en) 2006-03-29 2012-10-09 Napo Enterprises, Llc System and method for refining media recommendations
US7765192B2 (en) * 2006-03-29 2010-07-27 Abo Enterprises, Llc System and method for archiving a media collection
WO2007120518A2 (en) 2006-03-31 2007-10-25 Nielsen Media Research, Inc. Methods, systems, and apparatus for multi-purpose metering
MX2007015979A (es) 2006-03-31 2009-04-07 Nielsen Media Res Inc Metodos, sistemas y aparato para medicion de multiples fines.
US7772478B2 (en) * 2006-04-12 2010-08-10 Massachusetts Institute Of Technology Understanding music
US20070244985A1 (en) * 2006-04-13 2007-10-18 Concert Technology Corporation User system providing previews of a user's media collection to an associated portable media player
US20070245377A1 (en) * 2006-04-13 2007-10-18 Concert Technology Corporation Central system providing previews to a portable media player
US7603434B2 (en) * 2006-04-13 2009-10-13 Domingo Enterprises, Llc Central system providing previews of a user's media collection to a portable media player
US20070245378A1 (en) * 2006-04-13 2007-10-18 Concert Technology Corporation User system providing previews to an associated portable media player
US8316081B2 (en) * 2006-04-13 2012-11-20 Domingo Enterprises, Llc Portable media player enabled to obtain previews of a user's media collection
US7444388B1 (en) 2006-04-13 2008-10-28 Concert Technology Corporation System and method for obtaining media content for a portable media player
US7774385B1 (en) 2007-07-02 2010-08-10 Datascout, Inc. Techniques for providing a surrogate heuristic identification interface
US7840540B2 (en) * 2006-04-20 2010-11-23 Datascout, Inc. Surrogate hashing
US7801868B1 (en) 2006-04-20 2010-09-21 Datascout, Inc. Surrogate hashing
US8549022B1 (en) 2007-07-02 2013-10-01 Datascout, Inc. Fingerprint generation of multimedia content based on a trigger point with the multimedia content
US7814070B1 (en) 2006-04-20 2010-10-12 Datascout, Inc. Surrogate hashing
US8463000B1 (en) 2007-07-02 2013-06-11 Pinehill Technology, Llc Content identification based on a search of a fingerprint database
US8156132B1 (en) 2007-07-02 2012-04-10 Pinehill Technology, Llc Systems for comparing image fingerprints
US9020964B1 (en) * 2006-04-20 2015-04-28 Pinehill Technology, Llc Generation of fingerprints for multimedia content based on vectors and histograms
US7991206B1 (en) 2007-07-02 2011-08-02 Datascout, Inc. Surrogate heuristic identification
KR100684457B1 (ko) * 2006-05-04 2007-02-22 주식회사 모빌리언스 이동통신단말의 외부 음원 인식을 이용하여 사용자에게고유정보를 제공하는 고유정보 제공 시스템, 고유정보 제공방법 및 그 이동통신단말
US8903843B2 (en) 2006-06-21 2014-12-02 Napo Enterprises, Llc Historical media recommendation service
KR101071043B1 (ko) * 2006-07-03 2011-10-06 인텔 코오퍼레이션 고속 오디오 검색을 위한 방법 및 장치
US8805831B2 (en) 2006-07-11 2014-08-12 Napo Enterprises, Llc Scoring and replaying media items
US8059646B2 (en) * 2006-07-11 2011-11-15 Napo Enterprises, Llc System and method for identifying music content in a P2P real time recommendation network
US7680959B2 (en) 2006-07-11 2010-03-16 Napo Enterprises, Llc P2P network for providing real time media recommendations
US7970922B2 (en) 2006-07-11 2011-06-28 Napo Enterprises, Llc P2P real time media recommendations
US9003056B2 (en) 2006-07-11 2015-04-07 Napo Enterprises, Llc Maintaining a minimum level of real time media recommendations in the absence of online friends
US8327266B2 (en) 2006-07-11 2012-12-04 Napo Enterprises, Llc Graphical user interface system for allowing management of a media item playlist based on a preference scoring system
US9633356B2 (en) * 2006-07-20 2017-04-25 Aol Inc. Targeted advertising for playlists based upon search queries
US8620699B2 (en) * 2006-08-08 2013-12-31 Napo Enterprises, Llc Heavy influencer media recommendations
US8090606B2 (en) 2006-08-08 2012-01-03 Napo Enterprises, Llc Embedded media recommendations
JP4961300B2 (ja) * 2006-08-14 2012-06-27 三洋電機株式会社 楽曲一致判定装置、楽曲記録装置、楽曲一致判定方法、楽曲記録方法、楽曲一致判定プログラム、及び楽曲記録プログラム
US8239190B2 (en) * 2006-08-22 2012-08-07 Qualcomm Incorporated Time-warping frames of wideband vocoder
US20080051029A1 (en) * 2006-08-25 2008-02-28 Bradley James Witteman Phone-based broadcast audio identification
US9654447B2 (en) 2006-08-29 2017-05-16 Digimarc Corporation Customized handling of copied content based on owner-specified similarity thresholds
US8738749B2 (en) 2006-08-29 2014-05-27 Digimarc Corporation Content monitoring and host compliance evaluation
US8707459B2 (en) 2007-01-19 2014-04-22 Digimarc Corporation Determination of originality of content
US8726195B2 (en) 2006-09-05 2014-05-13 Aol Inc. Enabling an IM user to navigate a virtual world
WO2008042953A1 (en) 2006-10-03 2008-04-10 Shazam Entertainment, Ltd. Method for high throughput of identification of distributed broadcast content
US9135951B2 (en) * 2006-10-10 2015-09-15 Qualcomm Incorporated System and method for dynamic audio buffer management
US8661029B1 (en) 2006-11-02 2014-02-25 Google Inc. Modifying search result ranking based on implicit user feedback
US8874655B2 (en) * 2006-12-13 2014-10-28 Napo Enterprises, Llc Matching participants in a P2P recommendation network loosely coupled to a subscription service
US9179200B2 (en) 2007-03-14 2015-11-03 Digimarc Corporation Method and system for determining content treatment
US10242415B2 (en) 2006-12-20 2019-03-26 Digimarc Corporation Method and system for determining content treatment
EP2117143A3 (en) * 2006-12-22 2012-03-14 Apple Inc. Communicating and storing information associated with media broadcasts
US20090070185A1 (en) * 2007-01-17 2009-03-12 Concert Technology Corporation System and method for recommending a digital media subscription service
CA2676106A1 (en) 2007-02-02 2008-08-14 Websense, Inc. System and method for adding context to prevent data leakage over a computer network
US8307092B2 (en) * 2007-02-21 2012-11-06 Napo Enterprises, Llc Method and system for collecting information about a user's media collections from multiple login points
US8453170B2 (en) 2007-02-27 2013-05-28 Landmark Digital Services Llc System and method for monitoring and recognizing broadcast data
US7453379B2 (en) * 2007-03-12 2008-11-18 Citrix Systems, Inc. Systems and methods for identifying long matches of data in a compression history
EP2126727A4 (en) * 2007-03-12 2010-04-14 Webhitcontest Inc METHOD AND SYSTEM FOR AUTOMATICALLY EVALUATING DIGITAL FILES
US7827237B2 (en) * 2007-03-12 2010-11-02 Citrix Systems, Inc. Systems and methods for identifying long matches of data in a compression history
US7460038B2 (en) * 2007-03-12 2008-12-02 Citrix Systems, Inc. Systems and methods of clustered sharing of compression histories
US7865585B2 (en) 2007-03-12 2011-01-04 Citrix Systems, Inc. Systems and methods for providing dynamic ad hoc proxy-cache hierarchies
US7532134B2 (en) 2007-03-12 2009-05-12 Citrix Systems, Inc. Systems and methods for sharing compression histories between multiple devices
US7619545B2 (en) * 2007-03-12 2009-11-17 Citrix Systems, Inc. Systems and methods of using application and protocol specific parsing for compression
US8938463B1 (en) 2007-03-12 2015-01-20 Google Inc. Modifying search result ranking based on implicit user feedback and a model of presentation bias
US8255570B2 (en) * 2007-03-12 2012-08-28 Citrix Systems, Inc. Systems and methods of compression history expiration and synchronization
US7873634B2 (en) * 2007-03-12 2011-01-18 Hitlab Ulc. Method and a system for automatic evaluation of digital files
GB0704856D0 (en) * 2007-03-13 2007-04-18 Wesby Philip B System and method for data acquisition and processing
US8694374B1 (en) 2007-03-14 2014-04-08 Google Inc. Detecting click spam
US9224427B2 (en) 2007-04-02 2015-12-29 Napo Enterprises LLC Rating media item recommendations using recommendation paths and/or media item usage
US8112720B2 (en) 2007-04-05 2012-02-07 Napo Enterprises, Llc System and method for automatically and graphically associating programmatically-generated media item recommendations related to a user's socially recommended media items
US10489795B2 (en) * 2007-04-23 2019-11-26 The Nielsen Company (Us), Llc Determining relative effectiveness of media content items
US9092510B1 (en) 2007-04-30 2015-07-28 Google Inc. Modifying search result ranking based on a temporal element of user feedback
US20080274687A1 (en) * 2007-05-02 2008-11-06 Roberts Dale T Dynamic mixed media package
US7840177B2 (en) * 2007-05-23 2010-11-23 Landmark Digital Services, Llc Device for monitoring multiple broadcast signals
US8849432B2 (en) * 2007-05-31 2014-09-30 Adobe Systems Incorporated Acoustic pattern identification using spectral characteristics to synchronize audio and/or video
US9164993B2 (en) 2007-06-01 2015-10-20 Napo Enterprises, Llc System and method for propagating a media item recommendation message comprising recommender presence information
US20080301187A1 (en) * 2007-06-01 2008-12-04 Concert Technology Corporation Enhanced media item playlist comprising presence information
US8285776B2 (en) 2007-06-01 2012-10-09 Napo Enterprises, Llc System and method for processing a received media item recommendation message comprising recommender presence information
US8839141B2 (en) 2007-06-01 2014-09-16 Napo Enterprises, Llc Method and system for visually indicating a replay status of media items on a media device
US9037632B2 (en) 2007-06-01 2015-05-19 Napo Enterprises, Llc System and method of generating a media item recommendation message with recommender presence information
US20090049045A1 (en) 2007-06-01 2009-02-19 Concert Technology Corporation Method and system for sorting media items in a playlist on a media device
CN101681381B (zh) * 2007-06-06 2012-11-07 杜比实验室特许公司 使用多搜索组合改善音频/视频指纹搜索精确度
US8171030B2 (en) * 2007-06-18 2012-05-01 Zeitera, Llc Method and apparatus for multi-dimensional content search and video identification
US8140331B2 (en) * 2007-07-06 2012-03-20 Xia Lou Feature extraction for identification and classification of audio signals
US8006314B2 (en) 2007-07-27 2011-08-23 Audible Magic Corporation System for identifying content of digital data
US8694511B1 (en) 2007-08-20 2014-04-08 Google Inc. Modifying search result ranking based on populations
US8238669B2 (en) * 2007-08-22 2012-08-07 Google Inc. Detection and classification of matches between time-based media
US7712150B2 (en) * 2007-10-01 2010-05-11 Pardillo Joseph M Protective pad assembly magnetically attachable to garment
US8909655B1 (en) 2007-10-11 2014-12-09 Google Inc. Time based ranking
KR100921867B1 (ko) * 2007-10-17 2009-10-13 광주과학기술원 광대역 오디오 신호 부호화 복호화 장치 및 그 방법
US8468014B2 (en) * 2007-11-02 2013-06-18 Soundhound, Inc. Voicing detection modules in a system for automatic transcription of sung or hummed melodies
US7865522B2 (en) 2007-11-07 2011-01-04 Napo Enterprises, Llc System and method for hyping media recommendations in a media recommendation system
US9060034B2 (en) 2007-11-09 2015-06-16 Napo Enterprises, Llc System and method of filtering recommenders in a media item recommendation system
KR100939215B1 (ko) * 2007-12-17 2010-01-28 한국전자통신연구원 인덱스 데이터베이스 생성 장치 및 검색 장치
US9224150B2 (en) 2007-12-18 2015-12-29 Napo Enterprises, Llc Identifying highly valued recommendations of users in a media recommendation network
US9734507B2 (en) 2007-12-20 2017-08-15 Napo Enterprise, Llc Method and system for simulating recommendations in a social network for an offline user
US9130686B2 (en) * 2007-12-20 2015-09-08 Apple Inc. Tagging of broadcast content using a portable media device controlled by an accessory
US8396951B2 (en) 2007-12-20 2013-03-12 Napo Enterprises, Llc Method and system for populating a content repository for an internet radio service based on a recommendation network
US8316015B2 (en) 2007-12-21 2012-11-20 Lemi Technology, Llc Tunersphere
US8060525B2 (en) * 2007-12-21 2011-11-15 Napo Enterprises, Llc Method and system for generating media recommendations in a distributed environment based on tagging play history information with location information
US8117193B2 (en) 2007-12-21 2012-02-14 Lemi Technology, Llc Tunersphere
EP2253121B1 (en) * 2008-01-11 2012-07-04 Telefonaktiebolaget L M Ericsson (publ) Message handling in an ip multimedia subsystem
WO2009089621A1 (en) * 2008-01-14 2009-07-23 Algo Communication Products Ltd. Methods and systems for searching audio records
WO2009107049A2 (en) * 2008-02-26 2009-09-03 Koninklijke Philips Electronics N.V. Content identification method
US10216761B2 (en) * 2008-03-04 2019-02-26 Oath Inc. Generating congruous metadata for multimedia
US9130986B2 (en) * 2008-03-19 2015-09-08 Websense, Inc. Method and system for protection against information stealing software
US9015842B2 (en) * 2008-03-19 2015-04-21 Websense, Inc. Method and system for protection against information stealing software
US8407784B2 (en) 2008-03-19 2013-03-26 Websense, Inc. Method and system for protection against information stealing software
US8370948B2 (en) * 2008-03-19 2013-02-05 Websense, Inc. System and method for analysis of electronic information dissemination events
US8312022B2 (en) 2008-03-21 2012-11-13 Ramp Holdings, Inc. Search engine optimization
US8725740B2 (en) * 2008-03-24 2014-05-13 Napo Enterprises, Llc Active playlist having dynamic media item groups
US8484311B2 (en) 2008-04-17 2013-07-09 Eloy Technology, Llc Pruning an aggregate media collection
US9106801B2 (en) 2008-04-25 2015-08-11 Sony Corporation Terminals, servers, and methods that find a media server to replace a sensed broadcast program/movie
DE102008022125A1 (de) 2008-05-05 2009-11-19 Siemens Aktiengesellschaft Verfahren und Vorrichtung zur Klassifikation von schallerzeugenden Prozessen
US9128945B1 (en) 2008-05-16 2015-09-08 Google Inc. Query augmentation
US8275177B2 (en) * 2008-05-23 2012-09-25 Oracle America, Inc. System and method for media fingerprint indexing
GB2460306B (en) 2008-05-29 2013-02-13 Intrasonics Sarl Data embedding system
JP4327886B1 (ja) * 2008-05-30 2009-09-09 株式会社東芝 音質補正装置、音質補正方法及び音質補正用プログラム
JP4327888B1 (ja) * 2008-05-30 2009-09-09 株式会社東芝 音声音楽判定装置、音声音楽判定方法及び音声音楽判定用プログラム
US20090305665A1 (en) * 2008-06-04 2009-12-10 Irwin Oliver Kennedy Method of identifying a transmitting device
US20090307061A1 (en) * 2008-06-10 2009-12-10 Integrated Media Measurement, Inc. Measuring Exposure To Media
US20090307084A1 (en) * 2008-06-10 2009-12-10 Integrated Media Measurement, Inc. Measuring Exposure To Media Across Multiple Media Delivery Mechanisms
US8364698B2 (en) 2008-07-11 2013-01-29 Videosurf, Inc. Apparatus and software system for and method of performing a visual-relevance-rank subsequent search
US20100023328A1 (en) * 2008-07-28 2010-01-28 Griffin Jr Paul P Audio Recognition System
US20100057545A1 (en) * 2008-08-28 2010-03-04 Daniel Jean System and method for sending sponsored message data in a communications network
CN101673262B (zh) * 2008-09-12 2012-10-10 未序网络科技(上海)有限公司 音频内容的搜索方法
US20100070537A1 (en) * 2008-09-17 2010-03-18 Eloy Technology, Llc System and method for managing a personalized universal catalog of media items
US20100082180A1 (en) * 2008-10-01 2010-04-01 Honeywell International Inc. Errant vehicle countermeasures
US8983677B2 (en) * 2008-10-01 2015-03-17 Honeywell International Inc. Acoustic fingerprinting of mechanical devices
US20170034586A1 (en) * 2008-10-08 2017-02-02 Wakingapp Ltd. System for content matching and triggering for reality-virtuality continuum-based environment and methods thereof
US8484227B2 (en) 2008-10-15 2013-07-09 Eloy Technology, Llc Caching and synching process for a media sharing system
US8880599B2 (en) * 2008-10-15 2014-11-04 Eloy Technology, Llc Collection digest for a media sharing system
US9667365B2 (en) 2008-10-24 2017-05-30 The Nielsen Company (Us), Llc Methods and apparatus to perform audio watermarking and watermark detection and extraction
US8121830B2 (en) 2008-10-24 2012-02-21 The Nielsen Company (Us), Llc Methods and apparatus to extract data encoded in media content
US8359205B2 (en) 2008-10-24 2013-01-22 The Nielsen Company (Us), Llc Methods and apparatus to perform audio watermarking and watermark detection and extraction
GB2465141B (en) 2008-10-31 2014-01-22 Media Instr Sa Simulcast resolution in content matching systems
US20100205628A1 (en) 2009-02-12 2010-08-12 Davis Bruce L Media processing methods and arrangements
US9986279B2 (en) 2008-11-26 2018-05-29 Free Stream Media Corp. Discovery, access control, and communication with networked services
US10880340B2 (en) 2008-11-26 2020-12-29 Free Stream Media Corp. Relevancy improvement through targeting of information based on data gathered from a networked device associated with a security sandbox of a client device
US9519772B2 (en) 2008-11-26 2016-12-13 Free Stream Media Corp. Relevancy improvement through targeting of information based on data gathered from a networked device associated with a security sandbox of a client device
US10334324B2 (en) 2008-11-26 2019-06-25 Free Stream Media Corp. Relevant advertisement generation based on a user operating a client device communicatively coupled with a networked media device
US10977693B2 (en) 2008-11-26 2021-04-13 Free Stream Media Corp. Association of content identifier of audio-visual data with additional data through capture infrastructure
US9154942B2 (en) 2008-11-26 2015-10-06 Free Stream Media Corp. Zero configuration communication between a browser and a networked media device
US10567823B2 (en) 2008-11-26 2020-02-18 Free Stream Media Corp. Relevant advertisement generation based on a user operating a client device communicatively coupled with a networked media device
US10631068B2 (en) 2008-11-26 2020-04-21 Free Stream Media Corp. Content exposure attribution based on renderings of related content across multiple devices
US8508357B2 (en) 2008-11-26 2013-08-13 The Nielsen Company (Us), Llc Methods and apparatus to encode and decode audio for shopper location and advertisement presentation tracking
US10419541B2 (en) 2008-11-26 2019-09-17 Free Stream Media Corp. Remotely control devices over a network without authentication or registration
US8180891B1 (en) 2008-11-26 2012-05-15 Free Stream Media Corp. Discovery, access control, and communication with networked services from within a security sandbox
US9961388B2 (en) 2008-11-26 2018-05-01 David Harrison Exposure of public internet protocol addresses in an advertising exchange server to improve relevancy of advertisements
US9390167B2 (en) 2010-07-29 2016-07-12 Soundhound, Inc. System and methods for continuous audio matching
US20100132122A1 (en) * 2008-12-02 2010-06-03 Dan Hollingshead Bed-Mounted Computer Terminal
US8433431B1 (en) 2008-12-02 2013-04-30 Soundhound, Inc. Displaying text to end users in coordination with audio playback
US8396865B1 (en) 2008-12-10 2013-03-12 Google Inc. Sharing search engine relevance data between corpora
US8200602B2 (en) 2009-02-02 2012-06-12 Napo Enterprises, Llc System and method for creating thematic listening experiences in a networked peer media recommendation environment
KR20110116201A (ko) * 2009-02-05 2011-10-25 디지맥 코포레이션 휴대 전화용 tv 위젯의 텔레비전 기반 광고 및 배포
US8312061B2 (en) * 2009-02-10 2012-11-13 Harman International Industries, Incorporated System for broadcast information database
US9009146B1 (en) 2009-04-08 2015-04-14 Google Inc. Ranking search results based on similar queries
US9633117B2 (en) 2009-04-27 2017-04-25 Hewlett Packard Enterprise Development Lp System and method for making a recommendation based on user data
US8666528B2 (en) 2009-05-01 2014-03-04 The Nielsen Company (Us), Llc Methods, apparatus and articles of manufacture to provide secondary content in association with primary broadcast media content
CN102461066B (zh) * 2009-05-21 2015-09-09 数字标记公司 鉴别内容信号的方法
US8687839B2 (en) * 2009-05-21 2014-04-01 Digimarc Corporation Robust signatures derived from local nonlinear filters
AU2010254269A1 (en) 2009-05-26 2011-12-22 Websense, Inc. Systems and methods for efficient detection of fingerprinted data and information
US8718805B2 (en) * 2009-05-27 2014-05-06 Spot411 Technologies, Inc. Audio-based synchronization to media
US8489774B2 (en) 2009-05-27 2013-07-16 Spot411 Technologies, Inc. Synchronized delivery of interactive content
US10116972B2 (en) 2009-05-29 2018-10-30 Inscape Data, Inc. Methods for identifying video segments and displaying option to view from an alternative source and/or on an alternative device
US10375451B2 (en) 2009-05-29 2019-08-06 Inscape Data, Inc. Detection of common media segments
US8769584B2 (en) 2009-05-29 2014-07-01 TVI Interactive Systems, Inc. Methods for displaying contextually targeted content on a connected television
US9449090B2 (en) 2009-05-29 2016-09-20 Vizio Inscape Technologies, Llc Systems and methods for addressing a media database using distance associative hashing
US10949458B2 (en) 2009-05-29 2021-03-16 Inscape Data, Inc. System and method for improving work load management in ACR television monitoring system
US9055309B2 (en) 2009-05-29 2015-06-09 Cognitive Networks, Inc. Systems and methods for identifying video segments for displaying contextually relevant content
CN102460470B (zh) * 2009-06-11 2014-12-03 杜比实验室特许公司 基于指纹的内容识别趋势分析
US8620967B2 (en) 2009-06-11 2013-12-31 Rovi Technologies Corporation Managing metadata for occurrences of a recording
US8713068B2 (en) * 2009-06-11 2014-04-29 Yahoo! Inc. Media identification system with fingerprint database balanced according to search loads
US20100319043A1 (en) * 2009-06-11 2010-12-16 Microsoft Corporation Interactive television architecture
US8381290B2 (en) * 2009-07-17 2013-02-19 Exelis Inc. Intrusion detection systems and methods
US8447760B1 (en) 2009-07-20 2013-05-21 Google Inc. Generating a related set of documents for an initial set of documents
US8498974B1 (en) 2009-08-31 2013-07-30 Google Inc. Refining search results
JP5440051B2 (ja) * 2009-09-11 2014-03-12 株式会社Jvcケンウッド コンテンツ同定方法、コンテンツ同定システム、コンテンツ検索装置及びコンテンツ利用装置
US20110069937A1 (en) * 2009-09-18 2011-03-24 Laura Toerner Apparatus, system and method for identifying advertisements from a broadcast source and providing functionality relating to the same
US8677400B2 (en) 2009-09-30 2014-03-18 United Video Properties, Inc. Systems and methods for identifying audio content using an interactive media guidance application
ES2475965T5 (es) * 2009-09-30 2021-02-25 Rovi Guides Inc Sistemas y métodos para identificar contenido de audio utilizando una aplicación interactiva de guía de medios
US8161071B2 (en) 2009-09-30 2012-04-17 United Video Properties, Inc. Systems and methods for audio asset storage and management
US8972391B1 (en) 2009-10-02 2015-03-03 Google Inc. Recent interest based relevance scoring
US8706276B2 (en) 2009-10-09 2014-04-22 The Trustees Of Columbia University In The City Of New York Systems, methods, and media for identifying matching audio
US8521779B2 (en) 2009-10-09 2013-08-27 Adelphoi Limited Metadata record generation
US9197736B2 (en) * 2009-12-31 2015-11-24 Digimarc Corporation Intuitive computing methods and systems
US8121618B2 (en) 2009-10-28 2012-02-21 Digimarc Corporation Intuitive computing methods and systems
US9218530B2 (en) 2010-11-04 2015-12-22 Digimarc Corporation Smartphone-based methods and systems
US8175617B2 (en) 2009-10-28 2012-05-08 Digimarc Corporation Sensor-based mobile search, related methods and systems
US8594392B2 (en) * 2009-11-18 2013-11-26 Yahoo! Inc. Media identification system for efficient matching of media items having common content
US8874555B1 (en) 2009-11-20 2014-10-28 Google Inc. Modifying scoring data based on historical changes
EP2541963B1 (en) 2009-12-29 2021-03-17 Inscape Data, Inc. Method for identifying video segments and displaying contextually targeted content on a connected television
US8886531B2 (en) * 2010-01-13 2014-11-11 Rovi Technologies Corporation Apparatus and method for generating an audio fingerprint and using a two-stage query
US20110173185A1 (en) * 2010-01-13 2011-07-14 Rovi Technologies Corporation Multi-stage lookup for rolling audio recognition
US8615514B1 (en) 2010-02-03 2013-12-24 Google Inc. Evaluating website properties by partitioning user feedback
US8731943B2 (en) * 2010-02-05 2014-05-20 Little Wing World LLC Systems, methods and automated technologies for translating words into music and creating music pieces
US8924379B1 (en) 2010-03-05 2014-12-30 Google Inc. Temporal-based score adjustments
US8959093B1 (en) 2010-03-15 2015-02-17 Google Inc. Ranking search results based on anchors
US20110238679A1 (en) * 2010-03-24 2011-09-29 Rovi Technologies Corporation Representing text and other types of content by using a frequency domain
US8725766B2 (en) * 2010-03-25 2014-05-13 Rovi Technologies Corporation Searching text and other types of content by using a frequency domain
US8560583B2 (en) 2010-04-01 2013-10-15 Sony Computer Entertainment Inc. Media fingerprinting for social networking
US9264785B2 (en) * 2010-04-01 2016-02-16 Sony Computer Entertainment Inc. Media fingerprinting for content determination and retrieval
CN103069823A (zh) * 2010-04-14 2013-04-24 斯文·里思米勒 与媒体广播的平台无关的交互性
US9159338B2 (en) 2010-05-04 2015-10-13 Shazam Entertainment Ltd. Systems and methods of rendering a textual animation
KR101490576B1 (ko) 2010-05-04 2015-02-11 샤잠 엔터테인먼트 리미티드 미디어의 동기화 방법 및 시스템
US20120191231A1 (en) * 2010-05-04 2012-07-26 Shazam Entertainment Ltd. Methods and Systems for Identifying Content in Data Stream by a Client Device
US9026034B2 (en) 2010-05-04 2015-05-05 Project Oda, Inc. Automatic detection of broadcast programming
EP2567332A1 (en) 2010-05-04 2013-03-13 Shazam Entertainment Ltd. Methods and systems for processing a sample of a media stream
US9413477B2 (en) 2010-05-10 2016-08-09 Microsoft Technology Licensing, Llc Screen detector
US9508011B2 (en) * 2010-05-10 2016-11-29 Videosurf, Inc. Video visual and audio query
US9311708B2 (en) 2014-04-23 2016-04-12 Microsoft Technology Licensing, Llc Collaborative alignment of images
US9838753B2 (en) 2013-12-23 2017-12-05 Inscape Data, Inc. Monitoring individual viewing of television events using tracking pixels and cookies
US10192138B2 (en) 2010-05-27 2019-01-29 Inscape Data, Inc. Systems and methods for reducing data density in large datasets
EP2580750B1 (en) 2010-06-09 2014-05-14 Adelphoi Limited System and method for audio media recognition
US20110307786A1 (en) * 2010-06-11 2011-12-15 Brian Shuster Method and apparatus for bookmarking and retrieval of video content
US9623119B1 (en) 2010-06-29 2017-04-18 Google Inc. Accentuating search results
US20110320944A1 (en) * 2010-06-29 2011-12-29 Nokia Corporation Systems, methods, and apparatuses for generating an integrated user interface
US9814977B2 (en) 2010-07-13 2017-11-14 Sony Interactive Entertainment Inc. Supplemental video content on a mobile device
US8730354B2 (en) 2010-07-13 2014-05-20 Sony Computer Entertainment Inc Overlay video content on a mobile device
US9159165B2 (en) 2010-07-13 2015-10-13 Sony Computer Entertainment Inc. Position-dependent gaming, 3-D controller, and handheld as a remote
US9143699B2 (en) 2010-07-13 2015-09-22 Sony Computer Entertainment Inc. Overlay non-video content on a mobile device
US9832441B2 (en) 2010-07-13 2017-11-28 Sony Interactive Entertainment Inc. Supplemental content on a mobile device
US8832083B1 (en) 2010-07-23 2014-09-09 Google Inc. Combining user feedback
US9047371B2 (en) 2010-07-29 2015-06-02 Soundhound, Inc. System and method for matching a query against a broadcast stream
US9876905B2 (en) 2010-09-29 2018-01-23 Genesys Telecommunications Laboratories, Inc. System for initiating interactive communication in response to audio codes
KR20120034378A (ko) * 2010-10-01 2012-04-12 엔에이치엔(주) 사운드 인식을 통한 광고 정보 제공 시스템 및 방법
JP5728888B2 (ja) * 2010-10-29 2015-06-03 ソニー株式会社 信号処理装置および方法、並びにプログラム
US8716584B1 (en) * 2010-11-01 2014-05-06 James W. Wieder Using recognition-segments to find and play a composition containing sound
US8863165B2 (en) * 2010-11-01 2014-10-14 Gracenote, Inc. Method and system for presenting additional content at a media system
US9484046B2 (en) 2010-11-04 2016-11-01 Digimarc Corporation Smartphone-based methods and systems
US8762852B2 (en) * 2010-11-04 2014-06-24 Digimarc Corporation Smartphone-based methods and systems
US8346792B1 (en) 2010-11-09 2013-01-01 Google Inc. Query generation using structural similarity between documents
US8584198B2 (en) * 2010-11-12 2013-11-12 Google Inc. Syndication including melody recognition and opt out
TWI716169B (zh) * 2010-12-03 2021-01-11 美商杜比實驗室特許公司 音頻解碼裝置、音頻解碼方法及音頻編碼方法
JP5750167B2 (ja) 2010-12-07 2015-07-15 エンパイア テクノロジー ディベロップメント エルエルシー 端末間の体感品質を測定するためのオーディオフィンガープリントの差分
US20120158769A1 (en) * 2010-12-15 2012-06-21 Dish Network L.L.C. Music distribution and identification systems and methods
US9002867B1 (en) 2010-12-30 2015-04-07 Google Inc. Modifying ranking data based on document changes
EP2659480B1 (en) 2010-12-30 2016-07-27 Dolby Laboratories Licensing Corporation Repetition detection in media data
WO2012120531A2 (en) 2011-02-02 2012-09-13 Makarand Prabhakar Karanjkar A method for fast and accurate audio content match detection
US9093120B2 (en) 2011-02-10 2015-07-28 Yahoo! Inc. Audio fingerprint extraction by scaling in time and resampling
KR20140038374A (ko) * 2011-02-18 2014-03-28 샤잠 엔터테인먼트 리미티드 클라이언트 장치에 의해 데이터 스트림 내 콘텐트를 식별하는 방법 및 시스템
US20120224711A1 (en) * 2011-03-04 2012-09-06 Qualcomm Incorporated Method and apparatus for grouping client devices based on context similarity
US8589171B2 (en) 2011-03-17 2013-11-19 Remote Media, Llc System and method for custom marking a media file for file matching
US8688631B2 (en) 2011-03-17 2014-04-01 Alexander Savenok System and method for media file synchronization
US8478719B2 (en) 2011-03-17 2013-07-02 Remote Media LLC System and method for media file synchronization
US9380356B2 (en) 2011-04-12 2016-06-28 The Nielsen Company (Us), Llc Methods and apparatus to generate a tag for media content
US8937537B2 (en) * 2011-04-29 2015-01-20 Panasonic Automotive Systems Company Of America, Division Of Panasonic Corporation Of North America Method and system for utilizing spread spectrum techniques for in car applications
US8612390B2 (en) * 2011-05-02 2013-12-17 Microsoft Corporation Lightweight caching of transaction log for sequential access
US9035163B1 (en) 2011-05-10 2015-05-19 Soundbound, Inc. System and method for targeting content based on identified audio and multimedia
US8996557B2 (en) * 2011-05-18 2015-03-31 Microsoft Technology Licensing, Llc Query and matching for content recognition
WO2012089288A1 (en) 2011-06-06 2012-07-05 Bridge Mediatech, S.L. Method and system for robust audio hashing
KR20150113991A (ko) 2011-06-08 2015-10-08 샤잠 엔터테인먼트 리미티드 수신된 데이터의 비교를 수행하고 비교에 기초하여 후속 서비스를 제공하는 방법 및 시스템
EP2718849A1 (en) 2011-06-10 2014-04-16 Shazam Entertainment Ltd. Methods and systems for identifying content in a data stream
US9210208B2 (en) 2011-06-21 2015-12-08 The Nielsen Company (Us), Llc Monitoring streaming media content
US9209978B2 (en) 2012-05-15 2015-12-08 The Nielsen Company (Us), Llc Methods and apparatus to measure exposure to streaming media
US9953039B2 (en) * 2011-07-19 2018-04-24 Disney Enterprises, Inc. Method and system for providing a compact graphical user interface for flexible filtering of data
US8564684B2 (en) * 2011-08-17 2013-10-22 Digimarc Corporation Emotional illumination, and related arrangements
US9374183B2 (en) 2011-08-30 2016-06-21 Iheartmedia Management Services, Inc. Broadcast source identification based on matching via bit count
US9461759B2 (en) 2011-08-30 2016-10-04 Iheartmedia Management Services, Inc. Identification of changed broadcast media items
US8639178B2 (en) 2011-08-30 2014-01-28 Clear Channel Management Sevices, Inc. Broadcast source identification based on matching broadcast signal fingerprints
US9049496B2 (en) * 2011-09-01 2015-06-02 Gracenote, Inc. Media source identification
US8498627B2 (en) 2011-09-15 2013-07-30 Digimarc Corporation Intuitive computing methods and systems
US20130111514A1 (en) * 2011-09-16 2013-05-02 Umami Co. Second screen interactive platform
US9113202B1 (en) * 2011-09-21 2015-08-18 Google Inc. Inverted client-side fingerprinting and matching
US9460465B2 (en) 2011-09-21 2016-10-04 Genesys Telecommunications Laboratories, Inc. Graphical menu builder for encoding applications in an image
WO2013043393A1 (en) 2011-09-23 2013-03-28 Digimarc Corporation Context-based smartphone sensor logic
CA2849974C (en) * 2011-09-26 2021-04-13 Sirius Xm Radio Inc. System and method for increasing transmission bandwidth efficiency ("ebt2")
US8433577B2 (en) * 2011-09-27 2013-04-30 Google Inc. Detection of creative works on broadcast media
US9384272B2 (en) 2011-10-05 2016-07-05 The Trustees Of Columbia University In The City Of New York Methods, systems, and media for identifying similar songs using jumpcodes
US9223893B2 (en) 2011-10-14 2015-12-29 Digimarc Corporation Updating social graph data using physical objects identified from images captured by smartphone
US9402099B2 (en) * 2011-10-14 2016-07-26 Digimarc Corporation Arrangements employing content identification and/or distribution identification data
US9098576B1 (en) * 2011-10-17 2015-08-04 Google Inc. Ensemble interest point detection for audio matching
US9015109B2 (en) 2011-11-01 2015-04-21 Lemi Technology, Llc Systems, methods, and computer readable media for maintaining recommendations in a media recommendation system
US8886543B1 (en) * 2011-11-15 2014-11-11 Google Inc. Frequency ratio fingerprint characterization for audio matching
CN102508916B (zh) * 2011-11-21 2013-08-14 电子科技大学 一种海量数据的文件指纹分析方法
US9286942B1 (en) * 2011-11-28 2016-03-15 Codentity, Llc Automatic calculation of digital media content durations optimized for overlapping or adjoined transitions
US9696336B2 (en) 2011-11-30 2017-07-04 The Nielsen Company (Us), Llc Multiple meter detection and processing using motion data
US8492633B2 (en) 2011-12-02 2013-07-23 The Echo Nest Corporation Musical fingerprinting
US8586847B2 (en) * 2011-12-02 2013-11-19 The Echo Nest Corporation Musical fingerprinting based on onset intervals
EP2600545A1 (en) * 2011-12-02 2013-06-05 Waterford Institute Of Technology Research data measurement system and method
JP2013117688A (ja) * 2011-12-05 2013-06-13 Sony Corp 音響処理装置、音響処理方法、プログラム、記録媒体、サーバ装置、音響再生装置および音響処理システム
DE102011087843B4 (de) * 2011-12-06 2013-07-11 Continental Automotive Gmbh Verfahren und System zur Auswahl mindestens eines Datensatzes aus einer relationalen Datenbank
US9116928B1 (en) * 2011-12-09 2015-08-25 Google Inc. Identifying features for media file comparison
CN103999150B (zh) * 2011-12-12 2016-10-19 杜比实验室特许公司 媒体数据中的低复杂度重复检测
US8977194B2 (en) 2011-12-16 2015-03-10 The Nielsen Company (Us), Llc Media exposure and verification utilizing inductive coupling
US8538333B2 (en) 2011-12-16 2013-09-17 Arbitron Inc. Media exposure linking utilizing bluetooth signal characteristics
US8892572B2 (en) * 2011-12-30 2014-11-18 Cellco Partnership Video search system and method of use
US10078690B2 (en) * 2011-12-31 2018-09-18 Thomson Licensing Dtv Method and device for presenting content
US20130178966A1 (en) * 2012-01-09 2013-07-11 Function(x), Inc. Method and System for Identifying a Media Program From an Audio Signal Associated With the Media Program
US9027049B2 (en) 2012-02-07 2015-05-05 Turner Braodcasting System, Inc. Method and system for coupons based on automatic content recognition
US9384734B1 (en) * 2012-02-24 2016-07-05 Google Inc. Real-time audio recognition using multiple recognizers
US9519909B2 (en) 2012-03-01 2016-12-13 The Nielsen Company (Us), Llc Methods and apparatus to identify users of handheld computing devices
US9684715B1 (en) * 2012-03-08 2017-06-20 Google Inc. Audio identification using ordinal transformation
US9292894B2 (en) 2012-03-14 2016-03-22 Digimarc Corporation Content recognition and synchronization using local caching
US8965766B1 (en) * 2012-03-15 2015-02-24 Google Inc. Systems and methods for identifying music in a noisy environment
US8768003B2 (en) 2012-03-26 2014-07-01 The Nielsen Company (Us), Llc Media monitoring using multiple types of signatures
US8681950B2 (en) 2012-03-28 2014-03-25 Interactive Intelligence, Inc. System and method for fingerprinting datasets
US9202472B1 (en) * 2012-03-29 2015-12-01 Google Inc. Magnitude ratio descriptors for pitch-resistant audio matching
CN102663090B (zh) * 2012-04-10 2013-11-06 华为技术有限公司 元数据查询方法和装置
US8473975B1 (en) 2012-04-16 2013-06-25 The Nielsen Company (Us), Llc Methods and apparatus to detect user attentiveness to handheld computing devices
US8953811B1 (en) * 2012-04-18 2015-02-10 Google Inc. Full digest of an audio file for identifying duplicates
US9052986B1 (en) * 2012-04-18 2015-06-09 Google Inc. Pitch shift resistant audio matching
WO2014020449A2 (en) * 2012-05-10 2014-02-06 Magiktunes Limited Identifying audio stream content
US9418669B2 (en) * 2012-05-13 2016-08-16 Harry E. Emerson, III Discovery of music artist and title for syndicated content played by radio stations
KR101315970B1 (ko) * 2012-05-23 2013-10-08 (주)엔써즈 오디오 신호를 이용한 콘텐츠 인식 장치 및 방법
US8886635B2 (en) 2012-05-23 2014-11-11 Enswers Co., Ltd. Apparatus and method for recognizing content using audio signal
US9235867B2 (en) * 2012-06-04 2016-01-12 Microsoft Technology Licensing, Llc Concurrent media delivery
US9213703B1 (en) * 2012-06-26 2015-12-15 Google Inc. Pitch shift and time stretch resistant audio matching
US9628829B2 (en) 2012-06-26 2017-04-18 Google Technology Holdings LLC Identifying media on a mobile device
US9118951B2 (en) 2012-06-26 2015-08-25 Arris Technology, Inc. Time-synchronizing a parallel feed of secondary content with primary media content
KR102040199B1 (ko) 2012-07-11 2019-11-05 한국전자통신연구원 오디오 품질 측정 장치 및 그 방법
US10957310B1 (en) 2012-07-23 2021-03-23 Soundhound, Inc. Integrated programming framework for speech and text understanding with meaning parsing
US20140041054A1 (en) * 2012-08-01 2014-02-06 Microsoft Corporation Attestation of possession of media content items using fingerprints
US9282366B2 (en) 2012-08-13 2016-03-08 The Nielsen Company (Us), Llc Methods and apparatus to communicate audience measurement information
CN103593356A (zh) * 2012-08-16 2014-02-19 丁瑞彭 基于多媒体信息指纹技术的信息搜索方法、系统和应用
GB201214842D0 (en) * 2012-08-21 2012-10-03 Omnifone Ltd Content tracker
US20140074466A1 (en) 2012-09-10 2014-03-13 Google Inc. Answering questions using environmental context
US9081778B2 (en) 2012-09-25 2015-07-14 Audible Magic Corporation Using digital fingerprints to associate data with a work
US9549253B2 (en) 2012-09-26 2017-01-17 Foundation for Research and Technology—Hellas (FORTH) Institute of Computer Science (ICS) Sound source localization and isolation apparatuses, methods and systems
US10149048B1 (en) 2012-09-26 2018-12-04 Foundation for Research and Technology—Hellas (F.O.R.T.H.) Institute of Computer Science (I.C.S.) Direction of arrival estimation and sound source enhancement in the presence of a reflective surface apparatuses, methods, and systems
US10136239B1 (en) 2012-09-26 2018-11-20 Foundation For Research And Technology—Hellas (F.O.R.T.H.) Capturing and reproducing spatial sound apparatuses, methods, and systems
US9554203B1 (en) * 2012-09-26 2017-01-24 Foundation for Research and Technolgy—Hellas (FORTH) Institute of Computer Science (ICS) Sound source characterization apparatuses, methods and systems
US9955277B1 (en) 2012-09-26 2018-04-24 Foundation For Research And Technology-Hellas (F.O.R.T.H.) Institute Of Computer Science (I.C.S.) Spatial sound characterization apparatuses, methods and systems
US10175335B1 (en) 2012-09-26 2019-01-08 Foundation For Research And Technology-Hellas (Forth) Direction of arrival (DOA) estimation apparatuses, methods, and systems
JP2014067292A (ja) * 2012-09-26 2014-04-17 Toshiba Corp 情報処理装置及び情報処理方法
US20160210957A1 (en) 2015-01-16 2016-07-21 Foundation For Research And Technology - Hellas (Forth) Foreground Signal Suppression Apparatuses, Methods, and Systems
US20140095161A1 (en) * 2012-09-28 2014-04-03 At&T Intellectual Property I, L.P. System and method for channel equalization using characteristics of an unknown signal
US9460204B2 (en) * 2012-10-19 2016-10-04 Sony Corporation Apparatus and method for scene change detection-based trigger for audio fingerprinting analysis
US9992729B2 (en) 2012-10-22 2018-06-05 The Nielsen Company (Us), Llc Systems and methods for wirelessly modifying detection characteristics of portable devices
US9064318B2 (en) 2012-10-25 2015-06-23 Adobe Systems Incorporated Image matting and alpha value techniques
US8735708B1 (en) 2012-10-28 2014-05-27 Google Inc. System and method for synchronizing tag history
US9355649B2 (en) * 2012-11-13 2016-05-31 Adobe Systems Incorporated Sound alignment using timing information
EP2731030A1 (en) * 2012-11-13 2014-05-14 Samsung Electronics Co., Ltd Music information searching method and apparatus thereof
US10638221B2 (en) 2012-11-13 2020-04-28 Adobe Inc. Time interval sound alignment
US9201580B2 (en) 2012-11-13 2015-12-01 Adobe Systems Incorporated Sound alignment user interface
US9027048B2 (en) * 2012-11-14 2015-05-05 Bank Of America Corporation Automatic deal or promotion offering based on audio cues
US9076205B2 (en) 2012-11-19 2015-07-07 Adobe Systems Incorporated Edge direction and curve based image de-blurring
US10249321B2 (en) 2012-11-20 2019-04-02 Adobe Inc. Sound rate modification
US10366419B2 (en) 2012-11-27 2019-07-30 Roland Storti Enhanced digital media platform with user control of application data thereon
US10339936B2 (en) 2012-11-27 2019-07-02 Roland Storti Method, device and system of encoding a digital interactive response action in an analog broadcasting message
US9106953B2 (en) 2012-11-28 2015-08-11 The Nielsen Company (Us), Llc Media monitoring based on predictive signature caching
US9451304B2 (en) 2012-11-29 2016-09-20 Adobe Systems Incorporated Sound feature priority alignment
US9135710B2 (en) 2012-11-30 2015-09-15 Adobe Systems Incorporated Depth map stereo correspondence techniques
US9241259B2 (en) 2012-11-30 2016-01-19 Websense, Inc. Method and apparatus for managing the transfer of sensitive information to mobile devices
CA2875354C (en) 2012-11-30 2018-04-10 The Nielsen Company (Us), Llc Multiple meter detection and processing using motion data
US10455219B2 (en) 2012-11-30 2019-10-22 Adobe Inc. Stereo correspondence and depth sensors
US9912713B1 (en) 2012-12-17 2018-03-06 MiMedia LLC Systems and methods for providing dynamically updated image sets for applications
US9208547B2 (en) 2012-12-19 2015-12-08 Adobe Systems Incorporated Stereo correspondence smoothness tool
US10249052B2 (en) 2012-12-19 2019-04-02 Adobe Systems Incorporated Stereo correspondence model fitting
US9214026B2 (en) 2012-12-20 2015-12-15 Adobe Systems Incorporated Belief propagation and affinity measures
US9159327B1 (en) * 2012-12-20 2015-10-13 Google Inc. System and method for adding pitch shift resistance to an audio fingerprint
US9158760B2 (en) 2012-12-21 2015-10-13 The Nielsen Company (Us), Llc Audio decoding with supplemental semantic audio recognition and report generation
US9195649B2 (en) 2012-12-21 2015-11-24 The Nielsen Company (Us), Llc Audio processing techniques for semantic audio recognition and report generation
US9183849B2 (en) 2012-12-21 2015-11-10 The Nielsen Company (Us), Llc Audio matching with semantic audio recognition and report generation
US9167276B2 (en) 2012-12-28 2015-10-20 Turner Broadcasting System, Inc. Method and system for providing and handling product and service discounts, and location based services (LBS) in an automatic content recognition based system
US9529907B2 (en) * 2012-12-31 2016-12-27 Google Inc. Hold back and real time ranking of results in a streaming matching system
CN103971689B (zh) * 2013-02-04 2016-01-27 腾讯科技(深圳)有限公司 一种音频识别方法及装置
CN103970793B (zh) * 2013-02-04 2020-03-03 腾讯科技(深圳)有限公司 信息查询方法、客户端及服务器
US9706252B2 (en) 2013-02-04 2017-07-11 Universal Electronics Inc. System and method for user monitoring and intent determination
US9099080B2 (en) 2013-02-06 2015-08-04 Muzak Llc System for targeting location-based communications
US9313544B2 (en) 2013-02-14 2016-04-12 The Nielsen Company (Us), Llc Methods and apparatus to measure exposure to streaming media
US9008490B1 (en) 2013-02-25 2015-04-14 Google Inc. Melody recognition systems
US9223297B2 (en) 2013-02-28 2015-12-29 The Nielsen Company (Us), Llc Systems and methods for identifying a user of an electronic device
US9344759B2 (en) 2013-03-05 2016-05-17 Google Inc. Associating audio tracks of an album with video content
US9275625B2 (en) * 2013-03-06 2016-03-01 Qualcomm Incorporated Content based noise suppression
US9307337B2 (en) 2013-03-11 2016-04-05 Arris Enterprises, Inc. Systems and methods for interactive broadcast content
US9301070B2 (en) 2013-03-11 2016-03-29 Arris Enterprises, Inc. Signature matching of corrupted audio signal
US9451048B2 (en) 2013-03-12 2016-09-20 Shazam Investments Ltd. Methods and systems for identifying information of a broadcast station and information of broadcasted content
US9298758B1 (en) 2013-03-13 2016-03-29 MiMedia, Inc. Systems and methods providing media-to-media connection
US9465521B1 (en) 2013-03-13 2016-10-11 MiMedia, Inc. Event based media interface
US9153239B1 (en) * 2013-03-14 2015-10-06 Google Inc. Differentiating between near identical versions of a song
US9384273B1 (en) * 2013-03-14 2016-07-05 Google Inc. Compressed patch features for audio fingerprinting
US10257301B1 (en) 2013-03-15 2019-04-09 MiMedia, Inc. Systems and methods providing a drive interface for content delivery
US9183232B1 (en) 2013-03-15 2015-11-10 MiMedia, Inc. Systems and methods for organizing content using content organization rules and robust content information
US20140278845A1 (en) 2013-03-15 2014-09-18 Shazam Investments Limited Methods and Systems for Identifying Target Media Content and Determining Supplemental Information about the Target Media Content
US9390170B2 (en) 2013-03-15 2016-07-12 Shazam Investments Ltd. Methods and systems for arranging and searching a database of media content recordings
US8990638B1 (en) * 2013-03-15 2015-03-24 Digimarc Corporation Self-stabilizing network nodes in mobile discovery system
US9773058B2 (en) 2013-03-15 2017-09-26 Shazam Investments Ltd. Methods and systems for arranging and searching a database of media content recordings
WO2014145929A1 (en) * 2013-03-15 2014-09-18 Zeev Neumeier Systems and methods for addressing a media database using distance associative hashing
US9223458B1 (en) 2013-03-21 2015-12-29 Amazon Technologies, Inc. Techniques for transitioning between playback of media files
US9269022B2 (en) 2013-04-11 2016-02-23 Digimarc Corporation Methods for object recognition and related arrangements
US9183499B1 (en) 2013-04-19 2015-11-10 Google Inc. Evaluating quality based on neighbor features
US9305038B2 (en) * 2013-04-19 2016-04-05 International Business Machines Corporation Indexing of significant media granulars
CN104125509B (zh) * 2013-04-28 2015-09-30 腾讯科技(深圳)有限公司 节目识别方法、装置及服务器
US9123330B1 (en) * 2013-05-01 2015-09-01 Google Inc. Large-scale speaker identification
US10157618B2 (en) 2013-05-02 2018-12-18 Xappmedia, Inc. Device, system, method, and computer-readable medium for providing interactive advertising
US9460201B2 (en) 2013-05-06 2016-10-04 Iheartmedia Management Services, Inc. Unordered matching of audio fingerprints
US20140336797A1 (en) * 2013-05-12 2014-11-13 Harry E. Emerson, III Audio content monitoring and identification of broadcast radio stations
US20140336799A1 (en) * 2013-05-13 2014-11-13 Harry E. Emerson, III Discovery of music artist and title via companionship between a cellular phone and a broadcast radio receiver
CN105493422A (zh) 2013-06-20 2016-04-13 汤姆逊许可公司 用于辅助内容的分布式播放的同步的系统和方法
US20150312369A1 (en) * 2013-06-26 2015-10-29 Intel Corporation Checkpoints for media buffering
US20150039321A1 (en) 2013-07-31 2015-02-05 Arbitron Inc. Apparatus, System and Method for Reading Codes From Digital Audio on a Processing Device
US9711152B2 (en) 2013-07-31 2017-07-18 The Nielsen Company (Us), Llc Systems apparatus and methods for encoding/decoding persistent universal media codes to encoded audio
US9542488B2 (en) 2013-08-02 2017-01-10 Google Inc. Associating audio tracks with video content
US9373320B1 (en) * 2013-08-21 2016-06-21 Google Inc. Systems and methods facilitating selective removal of content from a mixed audio recording
CN103440330A (zh) * 2013-09-03 2013-12-11 网易(杭州)网络有限公司 一种音乐节目信息获取方法和设备
US9275427B1 (en) * 2013-09-05 2016-03-01 Google Inc. Multi-channel audio video fingerprinting
US10014006B1 (en) 2013-09-10 2018-07-03 Ampersand, Inc. Method of determining whether a phone call is answered by a human or by an automated device
CN103442083A (zh) * 2013-09-10 2013-12-11 百度在线网络技术(北京)有限公司 音频文件传输关联内容的方法、系统、客户端和服务器
US9053711B1 (en) * 2013-09-10 2015-06-09 Ampersand, Inc. Method of matching a digitized stream of audio signals to a known audio recording
TW201513095A (zh) * 2013-09-23 2015-04-01 Hon Hai Prec Ind Co Ltd 語音處理系統、裝置及方法
US9507849B2 (en) 2013-11-28 2016-11-29 Soundhound, Inc. Method for combining a query and a communication command in a natural language computer system
US9275136B1 (en) 2013-12-03 2016-03-01 Google Inc. Method for siren detection based on audio samples
US9354778B2 (en) 2013-12-06 2016-05-31 Digimarc Corporation Smartphone-based methods and systems
US9286902B2 (en) 2013-12-16 2016-03-15 Gracenote, Inc. Audio fingerprinting
US9466310B2 (en) 2013-12-20 2016-10-11 Lenovo Enterprise Solutions (Singapore) Pte. Ltd. Compensating for identifiable background content in a speech recognition device
US9955192B2 (en) 2013-12-23 2018-04-24 Inscape Data, Inc. Monitoring individual viewing of television events using tracking pixels and cookies
US9426525B2 (en) 2013-12-31 2016-08-23 The Nielsen Company (Us), Llc. Methods and apparatus to count people in an audience
US9292488B2 (en) 2014-02-01 2016-03-22 Soundhound, Inc. Method for embedding voice mail in a spoken utterance using a natural language processing computer system
US9311639B2 (en) 2014-02-11 2016-04-12 Digimarc Corporation Methods, apparatus and arrangements for device to device communication
DK3111672T3 (en) 2014-02-24 2018-01-02 Widex As HEARING WITH SUPPORTED NOISE PRESSURE
US11295730B1 (en) 2014-02-27 2022-04-05 Soundhound, Inc. Using phonetic variants in a local context to improve natural language understanding
CN103853836B (zh) * 2014-03-14 2017-01-25 广州酷狗计算机科技有限公司 一种基于音乐指纹特征的音乐检索方法及系统
US10430985B2 (en) 2014-03-14 2019-10-01 Magic Leap, Inc. Augmented reality systems and methods utilizing reflections
US9438940B2 (en) 2014-04-07 2016-09-06 The Nielsen Company (Us), Llc Methods and apparatus to identify media using hash keys
CN104978968A (zh) * 2014-04-11 2015-10-14 鸿富锦精密工业(深圳)有限公司 水印加载装置及水印加载的方法
US20150302458A1 (en) * 2014-04-16 2015-10-22 Ebay Inc. Identifying advertisements based on audio data and performing associated tasks
US9699499B2 (en) 2014-04-30 2017-07-04 The Nielsen Company (Us), Llc Methods and apparatus to measure exposure to streaming media
US9564123B1 (en) 2014-05-12 2017-02-07 Soundhound, Inc. Method and system for building an integrated user profile
US9590755B2 (en) 2014-05-16 2017-03-07 Alphonso Inc. Efficient apparatus and method for audio signature generation using audio threshold
CN104023247B (zh) 2014-05-29 2015-07-29 腾讯科技(深圳)有限公司 获取、推送信息的方法和装置以及信息交互系统
US9905233B1 (en) 2014-08-07 2018-02-27 Digimarc Corporation Methods and apparatus for facilitating ambient content recognition using digital watermarks, and related arrangements
US9558272B2 (en) 2014-08-14 2017-01-31 Yandex Europe Ag Method of and a system for matching audio tracks using chromaprints with a fast candidate selection routine
US9881083B2 (en) 2014-08-14 2018-01-30 Yandex Europe Ag Method of and a system for indexing audio tracks using chromaprints
US10204622B2 (en) 2015-09-10 2019-02-12 Crestron Electronics, Inc. Acoustic sensory network
US10748539B2 (en) 2014-09-10 2020-08-18 Crestron Electronics, Inc. Acoustic sensory network
CN104361889B (zh) * 2014-10-28 2018-03-16 北京音之邦文化科技有限公司 一种对音频文件进行处理的方法及装置
US20160132600A1 (en) * 2014-11-07 2016-05-12 Shazam Investments Limited Methods and Systems for Performing Content Recognition for a Surge of Incoming Recognition Queries
EP3023884A1 (en) * 2014-11-21 2016-05-25 Thomson Licensing Method and apparatus for generating fingerprint of an audio signal
US9837101B2 (en) * 2014-11-25 2017-12-05 Facebook, Inc. Indexing based on time-variant transforms of an audio signal's spectrogram
WO2016085414A1 (en) * 2014-11-27 2016-06-02 JOHN SMITH s.r.o. Method to lower decline in watching channels during commercial breaks and a connection
EP3228084A4 (en) 2014-12-01 2018-04-25 Inscape Data, Inc. System and method for continuous media segment identification
US9363562B1 (en) 2014-12-01 2016-06-07 Stingray Digital Group Inc. Method and system for authorizing a user device
WO2016086905A1 (es) * 2014-12-05 2016-06-09 Monitoreo Tecnológico, S.A Método de medición de audiencias
JP2018505442A (ja) 2014-12-31 2018-02-22 ピーシーエムエス ホールディングス インコーポレイテッド 聴取ログおよび音楽ライブラリの生成のためのシステムおよび方法
US10333696B2 (en) 2015-01-12 2019-06-25 X-Prime, Inc. Systems and methods for implementing an efficient, scalable homomorphic transformation of encrypted data with minimal data expansion and improved processing efficiency
BR112017016123A2 (pt) 2015-01-30 2018-04-17 Inscape Data Inc servidor de correspondência para identificação de conteúdo de vídeo que é exibido por um sistema de televisão, método executado por computador, e produto de programa informático concretamente incorporado a um meio de armazenamento de leitura por máquina permanente de um dispositivo de informática
US10929464B1 (en) * 2015-02-04 2021-02-23 Google Inc. Employing entropy information to facilitate determining similarity between content items
US10360583B2 (en) 2015-02-05 2019-07-23 Direct Path, Llc System and method for direct response advertising
US10269392B2 (en) 2015-02-11 2019-04-23 Immersion Corporation Automated haptic effect accompaniment
US10142471B2 (en) * 2015-03-02 2018-11-27 Genesys Telecommunications Laboratories, Inc. System and method for call progress detection
US9955274B2 (en) 2015-04-08 2018-04-24 The Boeing Company Vibration monitoring systems
CA2982797C (en) 2015-04-17 2023-03-14 Inscape Data, Inc. Systems and methods for reducing data density in large datasets
CN107533850B (zh) 2015-04-27 2022-05-24 三星电子株式会社 音频内容识别方法和装置
CN106294331B (zh) * 2015-05-11 2020-01-21 阿里巴巴集团控股有限公司 音频信息检索方法及装置
GB201508963D0 (en) 2015-05-26 2015-07-01 Geo Track Identifier Gmbh Audio identification method
US9762965B2 (en) 2015-05-29 2017-09-12 The Nielsen Company (Us), Llc Methods and apparatus to measure exposure to streaming media
US10323612B2 (en) 2015-06-12 2019-06-18 Ford Global Technologies, Llc Methods and systems for dual fuel injection
US10094320B2 (en) 2015-06-23 2018-10-09 Ford Global Technologies, Llc Methods and systems for dual fuel injection
EP3317878B1 (de) 2015-06-30 2020-03-25 Fraunhofer Gesellschaft zur Förderung der Angewand Verfahren und vorrichtung zum erzeugen einer datenbank
US10080062B2 (en) 2015-07-16 2018-09-18 Inscape Data, Inc. Optimizing media fingerprint retention to improve system resource utilization
JP6891170B2 (ja) 2015-07-16 2021-06-18 インスケイプ データ インコーポレイテッド ステムリソース利用を最適化するための映像セグメントの将来の視聴予測
CA2992319C (en) 2015-07-16 2023-11-21 Inscape Data, Inc. Detection of common media segments
EP3323244B1 (en) * 2015-07-16 2021-12-29 Inscape Data, Inc. System and method for improving work load management in acr television monitoring system
JP6763019B2 (ja) 2015-07-16 2020-09-30 インスケイプ データ インコーポレイテッド メディアセグメント識別効率向上のために探索索引を区分するためのシステムおよび方法
US9900636B2 (en) 2015-08-14 2018-02-20 The Nielsen Company (Us), Llc Reducing signature matching uncertainty in media monitoring systems
US9654891B2 (en) 2015-09-15 2017-05-16 D&M Holdings, Inc. System and method for determining proximity of a controller to a media rendering device
CN106558318B (zh) * 2015-09-24 2020-04-28 阿里巴巴集团控股有限公司 音频识别方法和系统
US9769607B2 (en) 2015-09-24 2017-09-19 Cisco Technology, Inc. Determining proximity of computing devices using ultrasonic audio signatures
US9978366B2 (en) 2015-10-09 2018-05-22 Xappmedia, Inc. Event-based speech interactive media player
TWI579716B (zh) * 2015-12-01 2017-04-21 Chunghwa Telecom Co Ltd Two - level phrase search system and method
US10594689B1 (en) 2015-12-04 2020-03-17 Digimarc Corporation Robust encoding of machine readable information in host objects and biometrics, and associated decoding and authentication
US9516373B1 (en) 2015-12-21 2016-12-06 Max Abecassis Presets of synchronized second screen functions
US10089987B2 (en) * 2015-12-21 2018-10-02 Invensense, Inc. Music detection and identification
US9596502B1 (en) 2015-12-21 2017-03-14 Max Abecassis Integration of multiple synchronization methodologies
CN105589970A (zh) * 2015-12-25 2016-05-18 小米科技有限责任公司 音乐搜索方法和装置
EP3405830A4 (en) 2016-01-19 2020-01-22 Magic Leap, Inc. SYSTEMS AND METHODS WITH EXTENDED REALITY USING REFLECTIONS
US9848235B1 (en) * 2016-02-22 2017-12-19 Sorenson Media, Inc Video fingerprinting based on fourier transform of histogram
US9924222B2 (en) * 2016-02-29 2018-03-20 Gracenote, Inc. Media channel identification with multi-match detection and disambiguation based on location
KR20170101500A (ko) * 2016-02-29 2017-09-06 한국전자통신연구원 노이즈 제거를 통한 오디오 신호 식별 방법 및 장치
US10063918B2 (en) 2016-02-29 2018-08-28 Gracenote, Inc. Media channel identification with multi-match detection and disambiguation based on single-match
US9930406B2 (en) 2016-02-29 2018-03-27 Gracenote, Inc. Media channel identification with video multi-match detection and disambiguation based on audio fingerprint
US10433026B2 (en) * 2016-02-29 2019-10-01 MyTeamsCalls LLC Systems and methods for customized live-streaming commentary
US9959885B2 (en) 2016-03-08 2018-05-01 Samsung Eletrônica Da Amazônia Ltda Method for user context recognition using sound signatures
US9786298B1 (en) 2016-04-08 2017-10-10 Source Digital, Inc. Audio fingerprinting based on audio energy characteristics
CA3021964A1 (en) 2016-04-26 2017-11-02 Magic Leap, Inc. Electromagnetic tracking with augmented reality systems
NL2016742B1 (en) 2016-05-09 2017-11-16 Audiocoup B V System for determining user exposure to audio fragments.
US10015612B2 (en) * 2016-05-25 2018-07-03 Dolby Laboratories Licensing Corporation Measurement, verification and correction of time alignment of multiple audio channels and associated metadata
US10936651B2 (en) 2016-06-22 2021-03-02 Gracenote, Inc. Matching audio fingerprints
US9959448B2 (en) 2016-08-19 2018-05-01 Google Llc Multi-step sequence alignment
GB201617409D0 (en) 2016-10-13 2016-11-30 Asio Ltd A method and system for acoustic communication of data
GB201617408D0 (en) 2016-10-13 2016-11-30 Asio Ltd A method and system for acoustic communication of data
JP6805765B2 (ja) 2016-10-21 2020-12-23 富士通株式会社 ソフトウェアサービスの実行のためのシステム、方法、及びプログラム
US10776170B2 (en) 2016-10-21 2020-09-15 Fujitsu Limited Software service execution apparatus, system, and method
JP7100422B2 (ja) 2016-10-21 2022-07-13 富士通株式会社 データプロパティ認識のための装置、プログラム、及び方法
EP3312722A1 (en) 2016-10-21 2018-04-25 Fujitsu Limited Data processing apparatus, method, and program
EP3312724B1 (en) 2016-10-21 2019-10-30 Fujitsu Limited Microservice-based data processing apparatus, method, and program
US10701438B2 (en) 2016-12-31 2020-06-30 Turner Broadcasting System, Inc. Automatic content recognition and verification in a broadcast chain
US10785329B2 (en) 2017-01-05 2020-09-22 The Nielsen Company (Us), Llc Methods and apparatus to facilitate meter to meter matching for media identification
US10922720B2 (en) 2017-01-11 2021-02-16 Adobe Inc. Managing content delivery via audio cues
GB201704636D0 (en) 2017-03-23 2017-05-10 Asio Ltd A method and system for authenticating a device
EP3379814A1 (en) 2017-03-23 2018-09-26 Christian Rymarenko Converting media using mobile devices
US10983984B2 (en) 2017-04-06 2021-04-20 Inscape Data, Inc. Systems and methods for improving accuracy of device maps using media viewing data
RU172737U1 (ru) * 2017-04-18 2017-07-21 Общество с ограниченной ответственностью "ДЖЕНТ КЛАБ" Устройство для идентификации музыкальных произведений
US10166472B2 (en) 2017-05-04 2019-01-01 Shazam Investments Ltd. Methods and systems for determining a reaction time for a response and synchronizing user interface(s) with content being rendered
RU2662939C1 (ru) * 2017-05-12 2018-07-31 Общество с ограниченной ответственностью "ИСКОНА ХОЛДИНГ" Способ идентификации музыкальных произведений
GB2565751B (en) 2017-06-15 2022-05-04 Sonos Experience Ltd A method and system for triggering events
GB2562515A (en) * 2017-05-17 2018-11-21 Snell Advanced Media Ltd Generation of audio or video hash
US10867185B2 (en) 2017-12-22 2020-12-15 Samuel Chenillo System and method for media segment identification
US10271095B1 (en) 2017-12-21 2019-04-23 Samuel Chenillo System and method for media segment indentification
WO2018218034A1 (en) 2017-05-25 2018-11-29 J. W. Pepper & Son, Inc. Sheet music search and discovery system
EP3425522A1 (en) * 2017-07-06 2019-01-09 Bmat Licensing, S.L.U. Identifying background audio in broadcast signals using multiple sources
US20190028766A1 (en) * 2017-07-18 2019-01-24 Audible Magic Corporation Media classification for media identification and licensing
CN107367676A (zh) * 2017-09-04 2017-11-21 厦门斯玛特思智能电气股份有限公司 基于音频智能识别的局放指示器
US10264297B1 (en) * 2017-09-13 2019-04-16 Perfect Sense, Inc. Time-based content synchronization
US20190104335A1 (en) * 2017-09-29 2019-04-04 Theater Ears, LLC Theater ears audio recognition & synchronization algorithm
US10599702B2 (en) * 2017-10-05 2020-03-24 Audible Magic Corporation Temporal fraction with use of content identification
US10158907B1 (en) 2017-10-10 2018-12-18 Shazam Investments Ltd. Systems and methods for performing playout of multiple media recordings based on a matching segment among the recordings
US10129575B1 (en) 2017-10-25 2018-11-13 Shazam Entertainment Limited Methods and systems for determining a latency between a source and an alternative feed of the source
US10249319B1 (en) 2017-10-26 2019-04-02 The Nielsen Company (Us), Llc Methods and apparatus to reduce noise from harmonic noise sources
EP3477643B1 (en) * 2017-10-31 2019-10-16 Spotify AB Audio fingerprint extraction and audio recognition using said fingerprints
EP3477505B1 (en) 2017-10-31 2021-10-20 Spotify AB Fingerprint clustering for content-based audio recogntion
CN108012173B (zh) * 2017-11-16 2021-01-22 百度在线网络技术(北京)有限公司 一种内容识别方法、装置、设备和计算机存储介质
US10276175B1 (en) 2017-11-28 2019-04-30 Google Llc Key phrase detection with audio watermarking
US10140966B1 (en) * 2017-12-12 2018-11-27 Ryan Laurence Edwards Location-aware musical instrument
CN107967922A (zh) * 2017-12-19 2018-04-27 成都嗨翻屋文化传播有限公司 一种基于特征的音乐版权识别方法
GB2570634A (en) 2017-12-20 2019-08-07 Asio Ltd A method and system for improved acoustic transmission of data
US11048946B2 (en) 2017-12-21 2021-06-29 Samuel Chenillo System and method for identifying cognate image sequences
SE542269C2 (en) * 2017-12-21 2020-03-31 Telia Co Ab Methods and apparatuses for determining meta data related to media content
EP3729817A1 (de) 2017-12-22 2020-10-28 NativeWaves GmbH Verfahren zum synchronisieren von einem zusatzsignal zu einem hauptsignal
DE102017131266A1 (de) 2017-12-22 2019-06-27 Nativewaves Gmbh Verfahren zum Einspielen von Zusatzinformationen zu einer Liveübertragung
US10089994B1 (en) 2018-01-15 2018-10-02 Alex Radzishevsky Acoustic fingerprint extraction and matching
ES2779985B2 (es) 2019-02-20 2021-03-04 Moehs Iberica Sl Sal de dietilamina del ácido 3alfa-tetrahidropiraniloxi-6alfa-etil-7alfa-hidroxi-5ß-colánico
CN110322886A (zh) * 2018-03-29 2019-10-11 北京字节跳动网络技术有限公司 一种音频指纹提取方法及装置
CN110322897B (zh) * 2018-03-29 2021-09-03 北京字节跳动网络技术有限公司 一种音频检索识别方法及装置
GB201810202D0 (en) * 2018-06-21 2018-08-08 Magus Communications Ltd Answer machine detection method & apparatus
US10904587B2 (en) 2018-07-19 2021-01-26 Gracenote, Inc. Establishment and use of time mapping based on interpolation using low-rate fingerprinting, to help facilitate frame-accurate content revision
US11483785B2 (en) 2018-07-25 2022-10-25 Trulli Engineering, Llc Bluetooth speaker configured to produce sound as well as simultaneously act as both sink and source
US10915292B2 (en) 2018-07-25 2021-02-09 Eagle Acoustics Manufacturing, Llc Bluetooth speaker configured to produce sound as well as simultaneously act as both sink and source
US10860647B2 (en) 2018-09-06 2020-12-08 Gracenote, Inc. Systems, methods, and apparatus to improve media identification
US10771828B2 (en) * 2018-09-18 2020-09-08 Free Stream Media Corp. Content consensus management
US10868620B2 (en) * 2018-12-26 2020-12-15 The Nielsen Company (Us), Llc Methods and apparatus for optimizing station reference fingerprint loading using reference watermarks
TR201902782A2 (tr) * 2019-02-25 2019-03-21 Aksoy Ahmet Kamusal alanlar için müzik analiz sistemi ve yöntemi.
US11683236B1 (en) 2019-03-30 2023-06-20 Snap Inc. Benchmarking to infer configuration of similar devices
US11853192B1 (en) 2019-04-16 2023-12-26 Snap Inc. Network device performance metrics determination
US11240104B1 (en) * 2019-05-21 2022-02-01 Snap Inc. Device configuration parameter determination
US11212560B2 (en) 2019-06-24 2021-12-28 The Nielsen Company (Us), Llc Use of steganographically-encoded time information as basis to establish a time offset, to facilitate taking content-related action
US11234049B2 (en) * 2019-06-24 2022-01-25 The Nielsen Company (Us), Llc Use of steganographically-encoded time information as basis to control implementation of dynamic content modification
CN110635824B (zh) * 2019-10-19 2021-07-09 广东石油化工学院 一种利用分类回归树的plc信道脉冲噪声检测方法和系统
US20220414808A1 (en) * 2019-11-19 2022-12-29 Google Llc Methods, systems, and media for rights management of embedded sound recordings using composition clustering
CN110910899B (zh) * 2019-11-27 2022-04-08 杭州联汇科技股份有限公司 一种实时音频信号一致性对比检测方法
CN112995759A (zh) * 2019-12-13 2021-06-18 腾讯科技(北京)有限公司 互动业务处理方法、系统、装置、设备及存储介质
CN111008301B (zh) * 2019-12-19 2023-08-15 新华智云科技有限公司 一种以图搜视频的方法
US11922532B2 (en) 2020-01-15 2024-03-05 Digimarc Corporation System for mitigating the problem of deepfake media content using watermarking
US11284144B2 (en) * 2020-01-30 2022-03-22 Snap Inc. Video generation system to render frames on demand using a fleet of GPUs
US11356720B2 (en) 2020-01-30 2022-06-07 Snap Inc. Video generation system to render frames on demand
US11036781B1 (en) 2020-01-30 2021-06-15 Snap Inc. Video generation system to render frames on demand using a fleet of servers
EP4096798A1 (en) 2020-01-30 2022-12-07 Snap Inc. System for generating media content items on demand
US11991419B2 (en) 2020-01-30 2024-05-21 Snap Inc. Selecting avatars to be included in the video being generated on demand
US11616797B2 (en) 2020-04-30 2023-03-28 Mcafee, Llc Large scale malware sample identification
GB2597334A (en) * 2020-07-17 2022-01-26 Playrcart Ltd A media player
US11670322B2 (en) 2020-07-29 2023-06-06 Distributed Creation Inc. Method and system for learning and using latent-space representations of audio signals for audio content-based retrieval
US11988784B2 (en) 2020-08-31 2024-05-21 Sonos, Inc. Detecting an audio signal with a microphone to determine presence of a playback device
US11283586B1 (en) 2020-09-05 2022-03-22 Francis Tiong Method to estimate and compensate for clock rate difference in acoustic sensors
US11284139B1 (en) * 2020-09-10 2022-03-22 Hulu, LLC Stateless re-discovery of identity using watermarking of a video stream
KR102447554B1 (ko) * 2020-11-18 2022-09-27 주식회사 샵캐스트 오디오 핑거프린트 매칭을 기반으로하는 음원 인식 방법 및 장치
US11405684B1 (en) * 2021-01-08 2022-08-02 Christie Digital Systems Usa, Inc. Distributed media player for digital cinema
US20220222294A1 (en) * 2021-01-14 2022-07-14 Smule, Inc. Densification in Music Search and Recommendation
WO2022198065A1 (en) 2021-03-19 2022-09-22 Evalve, Inc. Systems for tissue grasping and assessment
US11589100B1 (en) * 2021-03-31 2023-02-21 Amazon Technologies, Inc. On-demand issuance private keys for encrypted video transmission
US11665377B2 (en) * 2021-04-23 2023-05-30 At&T Intellectual Property I, L.P. System and method for identifying encrypted, pre-recorded media content in packet data networks
US11996087B2 (en) 2021-04-30 2024-05-28 Comcast Cable Communications, Llc Method and apparatus for intelligent voice recognition
CN117280340A (zh) * 2021-04-30 2023-12-22 华为技术有限公司 一种用于在数据存储系统中索引数据项的系统和方法
US20220392435A1 (en) * 2021-06-08 2022-12-08 Comcast Cable Communications, Llc Processing Voice Commands
US11496776B1 (en) * 2021-07-19 2022-11-08 Intrado Corporation Database layer caching for video communications
WO2023068101A1 (ja) 2021-10-20 2023-04-27 ソニーグループ株式会社 情報処理装置、情報処理方法及びプログラム
TWI806210B (zh) * 2021-10-29 2023-06-21 宏碁股份有限公司 聲音浮水印的處理方法及聲音浮水印處理裝置
EP4336381A1 (en) 2022-09-09 2024-03-13 Sparwk AS System and method for music entity matching

Family Cites Families (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4415767A (en) * 1981-10-19 1983-11-15 Votan Method and apparatus for speech recognition and reproduction
US4450531A (en) * 1982-09-10 1984-05-22 Ensco, Inc. Broadcast signal recognition system and method
US4582181A (en) * 1983-08-12 1986-04-15 Advanced Cardiovascular Systems, Inc. Steerable dilatation catheter
JPS6273298A (ja) * 1985-09-26 1987-04-03 沖電気工業株式会社 音声認識方式
US4852181A (en) * 1985-09-26 1989-07-25 Oki Electric Industry Co., Ltd. Speech recognition for recognizing the catagory of an input speech pattern
JPS62159195A (ja) * 1986-01-06 1987-07-15 沖電気工業株式会社 音声パタン作成方法
US4843562A (en) * 1987-06-24 1989-06-27 Broadcast Data Systems Limited Partnership Broadcast information classification system and method
JPH03291752A (ja) * 1990-04-10 1991-12-20 Matsushita Electric Ind Co Ltd データ検索装置
US5210820A (en) * 1990-05-02 1993-05-11 Broadcast Data Systems Limited Partnership Signal recognition system and method
JPH05509409A (ja) * 1990-06-21 1993-12-22 レイノルズ ソフトウエア,インコーポレイティド 波動分析・事象認識方法およびその装置
US5627915A (en) * 1995-01-31 1997-05-06 Princeton Video Image, Inc. Pattern recognition system employing unlike templates to detect objects having distinctive features in a video field
JPH09138691A (ja) * 1995-11-15 1997-05-27 Brother Ind Ltd 楽曲検索装置
US7346472B1 (en) 2000-09-07 2008-03-18 Blue Spike, Inc. Method and device for monitoring and analyzing signals
US5918223A (en) * 1996-07-22 1999-06-29 Muscle Fish Method and article of manufacture for content-based analysis, storage, retrieval, and segmentation of audio information
US6434520B1 (en) * 1999-04-16 2002-08-13 International Business Machines Corporation System and method for indexing and querying audio archives
JP2001042866A (ja) * 1999-05-21 2001-02-16 Yamaha Corp ネットワークを介したコンテンツ提供方法及びシステム
GR1003625B (el) 1999-07-08 2001-08-31 Μεθοδος χημικης αποθεσης συνθετων επικαλυψεων αγωγιμων πολυμερων σε επιφανειες κραματων αλουμινιου
JP2001075992A (ja) * 1999-09-07 2001-03-23 Hitachi Ltd 音響検索方法及び装置、並びに、コンピュータ読みとり可能な記録媒体
JP3969908B2 (ja) * 1999-09-14 2007-09-05 キヤノン株式会社 音声入力端末器、音声認識装置、音声通信システム及び音声通信方法
US7174293B2 (en) * 1999-09-21 2007-02-06 Iceberg Industries Llc Audio identification system and method
US7194752B1 (en) * 1999-10-19 2007-03-20 Iceberg Industries, Llc Method and apparatus for automatically recognizing input audio and/or video streams
US6834308B1 (en) * 2000-02-17 2004-12-21 Audible Magic Corporation Method and apparatus for identifying media content presented on a media playing device
US6453252B1 (en) 2000-05-15 2002-09-17 Creative Technology Ltd. Process for identifying audio content
AU2001267028A1 (en) 2000-06-23 2002-01-08 Mmr Technologies Inc Flexible counter-flow heat exchangers
US6990453B2 (en) 2000-07-31 2006-01-24 Landmark Digital Services Llc System and methods for recognizing sound and music signals in high noise and distortion
US6748360B2 (en) * 2000-11-03 2004-06-08 International Business Machines Corporation System for selling a product utilizing audio content identification
US7359889B2 (en) * 2001-03-02 2008-04-15 Landmark Digital Services Llc Method and apparatus for automatically creating database for use in automated media recognition system
US7117159B1 (en) * 2001-09-26 2006-10-03 Sprint Spectrum L.P. Method and system for dynamic control over modes of operation of voice-processing in a voice command platform
DK1504445T3 (da) * 2002-04-25 2008-12-01 Landmark Digital Services Llc Robust og invariant lydmönster-matching
CN1998168B (zh) * 2004-02-19 2011-04-06 兰德马克数字服务有限责任公司 用于广播源辨识的方法与装置
JP5150266B2 (ja) * 2005-02-08 2013-02-20 ランドマーク、ディジタル、サーヴィセズ、エルエルシー オーディオ信号において繰り返されるマテリアルの自動識別
US20100132122A1 (en) 2008-12-02 2010-06-03 Dan Hollingshead Bed-Mounted Computer Terminal
US8428955B2 (en) * 2009-10-13 2013-04-23 Rovi Technologies Corporation Adjusting recorder timing
US20130036455A1 (en) 2010-01-25 2013-02-07 Nokia Siemens Networks Oy Method for controlling acess to resources
US9390170B2 (en) * 2013-03-15 2016-07-12 Shazam Investments Ltd. Methods and systems for arranging and searching a database of media content recordings

Also Published As

Publication number Publication date
US8386258B2 (en) 2013-02-26
CN1592906B (zh) 2010-09-08
PT1307833E (pt) 2006-10-31
DK1307833T3 (da) 2006-10-02
US20140316787A1 (en) 2014-10-23
US10497378B2 (en) 2019-12-03
DE60120417T2 (de) 2007-01-11
US20120221131A1 (en) 2012-08-30
US8190435B2 (en) 2012-05-29
JP2004505328A (ja) 2004-02-19
KR20030059085A (ko) 2003-07-07
US8700407B2 (en) 2014-04-15
WO2002011123A3 (en) 2002-05-30
US20160328473A1 (en) 2016-11-10
US20020083060A1 (en) 2002-06-27
US6990453B2 (en) 2006-01-24
ATE329319T1 (de) 2006-06-15
ES2266254T3 (es) 2007-03-01
BRPI0112901B1 (pt) 2015-12-22
US7865368B2 (en) 2011-01-04
US20180374491A1 (en) 2018-12-27
EP1307833B1 (en) 2006-06-07
AU2001289766A1 (en) 2002-02-13
HK1051248A1 (en) 2003-07-25
US20130138442A1 (en) 2013-05-30
CN1592906A (zh) 2005-03-09
US20060122839A1 (en) 2006-06-08
DE60120417D1 (de) 2006-07-20
US9899030B2 (en) 2018-02-20
WO2002011123A2 (en) 2002-02-07
US20110071838A1 (en) 2011-03-24
US7346512B2 (en) 2008-03-18
US20080208891A1 (en) 2008-08-28
BR0112901A (pt) 2003-06-10
US9401154B2 (en) 2016-07-26
KR100776495B1 (ko) 2007-11-16
EP1307833A2 (en) 2003-05-07

Similar Documents

Publication Publication Date Title
JP4945877B2 (ja) 高い雑音、歪み環境下でサウンド・楽音信号を認識するシステムおよび方法
KR101578279B1 (ko) 데이터 스트림 내 콘텐트를 식별하는 방법 및 시스템
US7240207B2 (en) Fingerprinting media entities employing fingerprint algorithms and bit-to-bit comparisons
JP5150266B2 (ja) オーディオ信号において繰り返されるマテリアルの自動識別
CN100437572C (zh) 音频指纹识别系统和方法
JP5362178B2 (ja) オーディオ信号からの特徴的な指紋の抽出とマッチング
CN1636240A (zh) 利用音频内容标识来销售产品的系统
CN100538701C (zh) 用于从媒体样本辨认媒体实体的方法
CN109271501B (zh) 一种音频数据库的管理方法及系统
KR101002732B1 (ko) 온라인을 통한 디지털 컨텐츠 관리 시스템
CN117807564A (zh) 音频数据的侵权识别方法、装置、设备及介质

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20060525

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20060525

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080428

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110415

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110422

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110719

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110726

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111020

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120120

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20120216

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120220

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20120216

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150316

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4945877

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: R3D02

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term