JP5726317B2 - メロディ識別を使用するメディアの権利管理 - Google Patents

メロディ識別を使用するメディアの権利管理 Download PDF

Info

Publication number
JP5726317B2
JP5726317B2 JP2013538884A JP2013538884A JP5726317B2 JP 5726317 B2 JP5726317 B2 JP 5726317B2 JP 2013538884 A JP2013538884 A JP 2013538884A JP 2013538884 A JP2013538884 A JP 2013538884A JP 5726317 B2 JP5726317 B2 JP 5726317B2
Authority
JP
Japan
Prior art keywords
fingerprint
audio
work
melody
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013538884A
Other languages
English (en)
Other versions
JP2014503871A5 (ja
JP2014503871A (ja
Inventor
キング,デビッド,ジー.
サレム,ジョージ
ワン,イーリン,スー
ワイズマン,マシュー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Google LLC
Original Assignee
Google LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Google LLC filed Critical Google LLC
Publication of JP2014503871A publication Critical patent/JP2014503871A/ja
Publication of JP2014503871A5 publication Critical patent/JP2014503871A5/ja
Application granted granted Critical
Publication of JP5726317B2 publication Critical patent/JP5726317B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/18Legal services
    • G06Q50/184Intellectual property management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • AHUMAN NECESSITIES
    • A63SPORTS; GAMES; AMUSEMENTS
    • A63HTOYS, e.g. TOPS, DOLLS, HOOPS OR BUILDING BLOCKS
    • A63H5/00Musical or noise- producing devices for additional toy effects other than acoustical
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/10Protecting distributed programs or content, e.g. vending or licensing of copyrighted material ; Digital rights management [DRM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0273Determination of fees for advertising
    • G06Q30/0274Split fees
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H1/00Details of electrophonic musical instruments
    • G10H1/0008Associated control or indicating means
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/20Network architectures or network communication protocols for network security for managing network security; network security policies in general
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/462Content or additional data management, e.g. creating a master electronic program guide from data received from the Internet and a Head-end, controlling the complexity of a video stream by scaling the resolution or bit-rate based on the client capabilities
    • H04N21/4627Rights management associated to the content
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/835Generation of protective data, e.g. certificates
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2210/00Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
    • G10H2210/031Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal
    • G10H2210/066Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal for pitch analysis as part of wider processing for musical purposes, e.g. transcription, musical performance evaluation; Pitch recognition, e.g. in polyphonic sounds; Estimation or use of missing fundamental
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2240/00Data organisation or data communication aspects, specifically adapted for electrophonic musical tools or instruments
    • G10H2240/121Musical libraries, i.e. musical databases indexed by musical parameters, wavetables, indexing schemes using musical parameters, musical rule bases or knowledge bases, e.g. for automatic composing methods
    • G10H2240/131Library retrieval, i.e. searching a database or selecting a specific musical piece, segment, pattern, rule or parameter set
    • G10H2240/141Library retrieval matching, i.e. any of the steps of matching an inputted segment or phrase with musical database contents, e.g. query by humming, singing or playing; the steps may include, e.g. musical analysis of the input, musical feature extraction, query formulation, or details of the retrieval process
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2240/00Data organisation or data communication aspects, specifically adapted for electrophonic musical tools or instruments
    • G10H2240/171Transmission of musical instrument data, control or status information; Transmission, remote access or control of music data for electrophonic musical instruments
    • G10H2240/181Billing, i.e. purchasing of data contents for use with electrophonic musical instruments; Protocols therefor; Management of transmission or connection time therefor

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Technology Law (AREA)
  • Development Economics (AREA)
  • Multimedia (AREA)
  • Computer Security & Cryptography (AREA)
  • Tourism & Hospitality (AREA)
  • Software Systems (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Acoustics & Sound (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Primary Health Care (AREA)
  • Operations Research (AREA)
  • Game Theory and Decision Science (AREA)
  • Databases & Information Systems (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computing Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Storage Device Security (AREA)

Description

本発明は、一般的にはメディアの共有に関し、特に、メディアコンテンツの所有権の行使に関する。
一般的に、「サウンド記録」(若しくは録音物:sound recording)とは、光ディスク(例えば、CD、DVD)、磁気ディスクもしくは磁気テープ、固体メモリ(例えば、メモリカード)などの有形記憶媒体、または他の永続的な有形記憶媒体に記憶される、特定の音楽演奏のことを言う。音楽業界では、レコード会社、即ち、録音するアーティストをスカウト、育成および管理し、サウンド記録のマーケティング、販売促進、製作、生産および流通を調整する企業が、通常、サウンド記録の製作および流通を行う。通常、これらのレコード会社は、自身が製作するサウンド記録に関して著作権法に基づく様々な権利を保有するが、他の事業体(entities: エンティティ)もこれらの権利を保有し得る。サウンド記録の所有権(著作権)は国ごとに異なるので、場合によっては、2つ以上のレコード会社または他の事業体が、1つのサウンド記録の所有権を保有する場合がある。
サウンド記録(録音物)に対して、「作品」(composition)とは通常、オリジナルの楽曲(即ち、ソング)のことを言い、これは該曲の演奏を記憶した特定のサウンド記録に限定されない。例えば、ある作曲者による所与の作品(楽曲)に関して、該作曲者によるスタジオ録音、生演奏の録音、および別のアーティストによるカバー演奏の録音が存在し得るが、これらの各々が別個のサウンド記録になる。作品(楽曲)の所有権は、通常、ロイヤリティを徴収して作曲者にこれを分配する音楽出版社が保有するが、他の事業体もこれらの権利を保有する場合もある。(場合によっては、音楽出版社がレコード会社を兼ねる。)
多くのレコード会社は、サウンド記録の使用に係るロイヤリティを直接徴収する。一方、作曲者および音楽出版社は、通常、ASCAP、BMI、SESACなどの著作権料徴収団体(つまり「興行権管理組織」)の機関を通じて、作品(楽曲)の使用に係るロイヤリティを徴収する。海外での演奏に関しては、通常、海外の著作権料徴収団体が、権利保有者の代理としてロイヤリティの支払いを徴収する責任を負う。場合によっては、2つ以上の出版社または他の事業体が、1つの作品の所有権を保有する。さらに、作品の所有権は、国ごとに異なり得る。
近年、大衆による視聴を目的として、ユーザがマルチメディアコンテンツ(例えば、音楽コンテンツおよび動画コンテンツ)をアップロード可能なメディアホストサービス(media hosting service: メディアをホストする(提供する)サービス)の人気に拍車がかかっている。ホストされる(提供される)メディアコンテンツ(以下、ホストメディアコンテンツという)の数が増え続ける中で、ホストサービスにとっては、ホストメディアコンテンツに関係がある権利の管理がますます難しい課題となっている。例えば、オーディオファイルまたは動画ファイルに埋め込まれた音楽コンテンツについて、作曲者、出版社およびレコード会社は、メディアコンテンツに係る権利を保有し得る様々な事業体の幾つかに過ぎない。著作権者に対して適正な支払いを行うためには、メディアコンテンツが正確に識別されなければならない。しかし、通常は放送前にコンテンツが識別されるテレビやラジオの環境とは異なり、メディアホストサービスは、ユーザが提供したメディアコンテンツを扱うことが多く、これらは当初、識別されていない場合がある。メディアホストサイトが、日々何千または何百万もの新規のメディアアップロードを受信する際に、これらのメディアコンテンツを手動で識別するのは困難であり、また従来の自動メカニズムは、今日のメディアホストサービスに必要とされるロバスト性および拡張性に欠ける。メディアアップロードが、メディアホストサービスにとって既知のサウンド記録と一致しない生演奏またはカバー演奏を含み、かつアップロードされた関連メタデータではコンテンツが識別されない場合、識別に関する問題は、より一層複雑になる。従って、著作権者に対する適正なロイヤリティの支払いを支援するために、既知の作品の新たなサウンド記録を識別する方法が必要である。
コンテンツ認識システムは、メディアホストサービスにアップロードされたメディアファイルに関連する所有権を判定する。該コンテンツ認識システムは、既知のサウンド記録を識別することに加えて、該既存のサウンド記録と正確にはマッチしない生演奏の録音物またはカバー演奏の録音物で具現化(表現)された作品(例えば、ソング)をも有益に識別する。コンテンツ認識システムは、作品/またはサウンド記録を識別すると、それらの作品および/またはサウンド記録に関する所有権情報を判定することができる。
指紋モジュールは、或る作品に関する所有権情報を識別するために、或るオーディオクリップのメロディ指紋を作成する。該メロディ指紋は、音階調、器楽編成、芸術的解釈もしくは演奏、または録音方法もしくはアーチファクトの違いに対して不変の特徴を抽出することによって、該オーディオクリップにおいて具現化された作品のメロディを表す。従って、音楽演奏、録音および処理の違いが、実質的に該メロディ指紋に影響を及ぼすことはない。
コンテンツ認識システムは、次いで、入力したメロディ指紋を参照メロディ指紋と照合するために、参照データベースに問い合わせる。参照データベースは、一群の複数の参照サウンド記録において表現された複数の作品群の参照メロディ指紋をそれぞれ格納する。参照データベースの各参照メロディ指紋は、作品の所有権情報と関連付けられ、作品の所有権情報は、参照メロディ指紋の作成に使用した参照サウンド記録で具現化された作品の所有権を有する少なくとも1つの事業体(エンティティ)を示す。入力したメロディ指紋とマッチする参照メロディ指紋が参照データベースから見つかると、コンテンツ認識システムは、マッチした参照メロディ指紋に関連する作品の所有権情報を決定する。
或るサウンド記録に係る所有権を識別するために、コンテンツ認識システムは、前記オーディオクリップのオーディオ指紋を作成する。上述のメロディ指紋とは異なり、該オーディオ指紋は、一般的に、特定の録音物に対して特有のもの(ユニーク)であり、典型的には、演奏、録音および処理の違いによって変化するので、同一作品の複数の異なる録音物を区別するのに使用できる。コンテンツ認識システムは、次いで、該オーディオ指紋を参照オーディオ指紋と照合する(マッチングする)ために、参照データベースに問い合わせる。該オーディオ指紋とマッチする参照オーディオ指紋が参照データベースから見つかると、コンテンツ認識システムは、該マッチする参照オーディオ指紋の作成元となったサウンド記録に関連する所有権情報を決定する。
(或る作品に対応する)或るメロディ指紋又は(或るサウンド記録に対応する)或るオーディオ指紋にマッチするものが見つかったとき、コンテンツ認識システムは、所有権および使用のポリシーの情報をホストサーピスに提供し、該ホストサーピスが該所有権を管理できるようにする。例えば、所有権ポリシーは、メディアホストサービスが該オーディオクリップを含むメディアファイルを遮断(ブロック)すべきことを示してもよい。代替として、該所有権ポリシーは、メディアホストサービスが該オーディオクリップを含むメディアファイルを収益化すべきことを示してもよい。このオプションに基づいて、メディアホストサービスは、収益化の対象である該メディアファイルと共に広告を配置することができ、該広告から発生した収益をコンテンツオーナーと分かち合う。他の例では、該所有権ポリシーは、ホストサービスがオーディオクリップを含むメディアファイルの利用状況を統計的に追跡すべきことを示してもよい。
メロディ指紋の参照データベースを生成するために、コンテンツ認識システムは、或る作品を具現化している参照サウンド記録と、該作品に対する所有権を持1以上の事業体(エンティティ)を示す作品所有権メタデータとを受信する。指紋モジュールは、該参照サウンド記録からメロディ指紋を生成する。次いで、コンテンツ認識システムは、該メロディ指紋およびそれに関連する作品所有権メタデータを参照データベース内に格納する。
同様に、オーディオ指紋の参照データベースを生成するために、コンテンツ認識システムは、前記参照サウンド記録からオーディオ指紋を生成し、該オーディオ指紋およびそれに関連する作品所有権メタデータを参照データベース内に格納する。
本明細書に記載する特徴および利点は、全てを包括するものではなく、詳細には、図面、明細書および特許請求の範囲を参照することによって、多くの追加的な特徴および利点が当業者にとって自明となる。さらに、本明細書で使用する言い回しは、主に読み易さおよび例示の目的で選択されており、本発明の主題を記述または制限する目的では選択されていないことに留意されたい。
メディアホストサービスと協働して動作するコンテンツ認識システムの一実施形態を示す図。
オーディオ指紋参照データベースおよびメロディ指紋参照データベースを作成するための処理の一実施形態を示すフローチャート。
既知の作品に関連する様々なメタデータを表示する、グラフィックインターフェースの一実施形態を示す図。
既知のサウンド記録に関連する様々なメタデータを表示する、グラフィックインターフェースの一実施形態を示す図。
メディアコンテンツに関連する所有権情報を識別し、オーナーの代わりに要求を作成するための処理の一実施形態を示すフローチャート。
ホストメディアコンテンツに関連する所有権ポリシーを実行するための処理の一実施形態を示すフローチャート。
コンテンツオーナーの代わりに作成した要求に関連する様々なメタデータを表示する、グラフィックインターフェースの一実施形態である。
これらの図面は、説明のみを目的として本発明の様々な実施形態を図示する。当業者であれば、以下の記述から、本明細書に記載した本発明の原理から逸脱することなく、本明細書で説明する構造および方法の代替の実施形態を採用可能であることは容易に理解できよう。
概 要
コンテンツ認識システムは、メディアホストサービスにアップロードされたユーザ提供コンテンツ(例えば、動画ファイルおよび/またはオーディオファイル)に埋め込まれたサウンド記録および作品を自動的に識別する。本明細書にて使用するように、「サウンド記録」および「作品」は、それぞれ著作権法に基づいて「サウンド記録」および「作品」と認識される仕事の成果である。コンテンツ認識システムは、サウンド記録と作品の両方を自動的に識別することによって、レコード会社が発売した或る作品のオリジナル録音(例えば、スタジオ録音)の使用と、カバー演奏、新たに発売されたバージョン、別バージョン(例えば、アコースティック・バージョン)または生演奏の映像など、作品の他の録音の使用、の両方を検出することができる。メディアコンテンツが識別されると、メディアホストサービスは、コンテンツオーナーの代理として、所有権を管理し、収益化することができる。従って、メディアホストサービスは、例えば、オーナーの代理としてメディアコンテンツを自動的に検出し遮断することができ、またはシンジケーションシステムは、的を絞った広告を該メディアコンテンツに付加して提供すると共に、コンテンツオーナーにロイヤリティを分配することによって、該メディアコンテンツを収益化することができる。
アップロードされたメディアコンテンツを全て手動で確認することは、よく言っても実用的ではないので、大規模なメディア権利のホスト・管理ソリューションにとって、メディアコンテンツの自動検出は、必要とは言わないまでも有益ではある。さらに、メディアホストサービスへのアップロードの可能性がある全ての作品またはサウンド記録に関連する所有権を人間が記憶するのは、困難または不可能である。メディアホストサービスは、効率的かつ拡張可能な方法でサウンド記録および作品を自動検出することによって、権利保有者が求める手動による介入の件数を最小限に抑えることができる。この自動検出は、日々何千または何百万もの新規のユーザ提供メディアアップロードを受信するような高トラフィックのメディアホストサービスにとって、特に有益である。これによって、著作権保護作品の利用全体および著作権保護作品に係るロイヤリティの支払いの効率性が向上し、当該録音および作品の著作権者にとって有益となる。
システム・アーキテクチャ
図1は、ユーザが提供したメディアコンテンツに関連する所有権を自動的に識別するめための計算機環境100の一実施形態を示す。この計算機環境は、メディアホストサービスシステム110、コンテンツ認識システム130、ユーザ・クライアント装置150およびコンテンツオーナークライアント装置170を備える。代替の構成にあっては、該計算機環境100は、別の又は追加のコンポーネントを具備していてよい。クライアント装置は、通信ネットワーク(図示せず)を介してメディアホストサービスシステム110と通信する。なお、本実施形態の関連態様の不明瞭化を回避するために、従来のコンポーネントを必ずしも図示していない。
メディアホストサービスシステム110は、ユーザが動画(ビデオ: video)ファイルおよびオーディオファイルなどのメディアコンテンツをアップロード、共有、および視聴できるように構成される。一実施形態において、ユーザは、ユーザ・クライアント装置150が実行するウェブブラウザからアクセス可能なメディアホストウェブサイトを介して、メディアホストサービスシステム110と交信する。ユーザは、ユーザ・クライアント装置150を使用することによって、ユーザ提供メディア151をメディアホストサービスシステム110にアップロードでき、および/またはメディアホストサービスシステム110が(例えば、ネットワーク上で支援されるオンライン・インターフェースを介して)ホストする(提供する)ユーザ要求メディア153を視聴することができる。メディアホストサービスシステム110は、コンテンツ認識システム130を使用して、メディアホストサービスシステム110がホストするメディアコンテンツに関連する所有権およびポリシーを識別する。図示するように、コンテンツ認識システム130は、メディアホストサービスシステム110からオーディオクリップ141を受信して、対応する所有権情報143を返送する。
一実施形態において、メディアホストサービスシステム110は、インジェストサーバ112と、メディアサーバ114と、権利管理エンジン116と、広告管理モジュール118と、コンテンツデータベース120と、広告データベース122とを備える。代替の構成において、メディアホストサービスシステム110は、別のモジュールまたは追加モジュールを備えてもよい。
インジェストサーバ112は、ユーザ・クライアント装置150からユーザ提供メディア151(例えば、オーディオファイルまたは動画ファイル)を受信する。インジェストサーバ112は、ユーザ提供メディア151のオーディオ処理および/または動画処理を任意で行い、例えば、ユーザ提供メディア151を標準フォーマットにエンコードする。ユーザ提供メディアコンテンツ151は、アップロードされると、コンテンツデータベース120に格納される。ユーザは、ユーザ・クライアント装置150を使用して、コンテンツデータベース120に予め格納されているホストメディアコンテンツの視聴を要求できる。メディアサーバ114は要求に応じて、ユーザの視聴用に、コンテンツデータベース120からユーザ・クライアント装置150へユーザ要求メディア153を流す。
広告データベース122は、ユーザ要求メディア153と共に提示されるべき広告コンテンツを格納している。該広告コンテンツは、広告コンテンツは、画像(イメージ: image)形式、動画(ビデオ: video)形式、音声(オーディオ: audio)形式、テキスト形式、またはハイパーリンク形式であってもよく、またはこれらのフォーマットの組み合わせであってもよい。広告管理モジュール118は、広告データベース122に格納される広告コンテンツへのアクセスを管理し、特定のユーザ要求メディア153に該広告コンテンツを関連付けるよう決定する。一実施形態において、広告管理モジュール118は、ユーザ要求メディア153において具現化されているサウンド記録および/もしくは演奏されている作品の識別情報、ならびに/または当該コンテンツに関連する所有権情報、に基づいて広告を選択する。例えば、広告管理モジュール118は、ユーザ要求メディア153で具現化されたサウンド記録の所有権を有するレコード会社のウェブサイトへのハイパーリンクを含んだ広告を選択してもよい。他の実施形態において、広告コンテンツは、ユーザに固有な情報およびユーザの好みなど、他の要因に基づいて選択される。
権利管理エンジン116は、コンテンツデータベース120内に格納されたメディアコンテンツに関連する所有権ポリシーを管理し、かつ行使する。例えば、一実施形態において、コンテンツオーナーは、メディアアイテムに関する所有権ポリシーを設定して、当該メディアアイテムを「追跡」、「収益化」または「遮断」(ブロック)することができる。コンテンツオーナーがコンテンツの遮断を選択する場合、権利管理エンジン116は、コンテンツデータベース120から該当コンテンツを削除し、または、そうしない場合は、ユーザ・クライアント装置150が該当コンテンツにアクセスすることを禁止する。コンテンツオーナーが該当コンテンツの収益化を選択する場合、広告管理モジュール118は、ユーザ要求メディア153と共に広告を提供し、かつ、権利管理エンジン116は、典型的にはメディアホストサービスとコンテンツオーナーとのライセンス契約に基づいて、広告によって生じるロイヤリティをコンテンツオーナーに提供するための手順を行う。コンテンツオーナーが該当コンテンツの追跡を選択する場合、該コンテンツに関する統計的情報(例えば、閲覧数)を追跡し、権利管理エンジン116は該追跡した統計的情報をコンテンツオーナーに提供する。
メディアホストサービスシステム110は、コンテンツ認識システム130を使用して、該メディアホストサービスシステム110がホストするメディアコンテンツに関連する所有権を識別する。図示するように、コンテンツ認識システム130は、メディアホストサービスシステム110からオーディオクリップ141を受信して、それに対応する所有権情報143を返送する。また、コンテンツ認識システム130は、コンテンツオーナー(例えば、レコード会社および/または出版社)が、コンテンツオーナークライアント装置170を介して、所有権メタデータ161および参照記録物163を提供できるようにする。参照記録物163および所有権メタデータ161は、コンテンツオーナーが所有権の行使を求めるメディアコンテンツ(例えば、サウンド記録または作品)に対応する。コンテンツ認識システム130は、オーディオクリップ141と1つ以上の参照サウンド記録163との照合を行い、マッチが見つかった場合に、対応する所有権情報143を返送する。
一実施形態において、コンテンツ認識システム130は、インジェストサーバ132と、メロディ指紋モジュール134と、オーディオ指紋モジュール136と、索引付けモジュール138と、照合モジュール140と、メロディID参照データベース142と、オーディオID参照データベース144と、所有権データベース146とを備える。代替の構成において、コンテンツ認識システムは、異なるモジュールまたは追加モジュールを備えてもよい。
インジェストサーバ132は、コンテンツオーナークライアント装置170から参照記録物163および所有権メタデータ161を受信する。参照記録物とは、レコード会社または他の事業体が所有権を有する「サウンド記録」をいう。通常、出版社または他の事業体も、該「サウンド記録」で具現化された「作品」の所有権を有する。参照記録物163は、何れの種類のオーディオ用コーデック(例えば、AAC、HE-AAC、MP3、FLAC、ALAC、OGG、WMAなど)でエンコードされたオーディオファイルを備えてもよく、オーディオファイル全体(例えば、演奏全体の録音)またはオーディオファイルの一部分であってもよい。インジェストサーバ132は、参照記録物163のオーディオ処理を任意で行い、例えば、参照記録物163を標準フォーマットにエンコードする。所有権メタデータ161は、通常、参照記録物163およびコンテンツオーナーに関する識別情報を格納する、テキストベースのファイルを備える。所有権メタデータ161は、例えば、アーティスト、曲名、ジャンル、レコード会社、出版社などの様々な分類またはフィールドで構成されてもよい。
また、インジェストサーバ132は、メディアホストサービスシステム110からオーディオクリップ141を受信するように構成される。オーディオクリップ141は、参照記録物163と同様に、何れの種類のオーディオ用コーデックでエンコードされたオーディオファイルを備えてもよく、オーディオファイル全体またはオーディオファイルの一部分であってもよい。代替として、オーディオクリップ141は、動画ファイル(または動画ファイルの一部分)のオーディオ部分を備えてもよい。インジェストサーバ132は、オーディオクリップ141のオーディオ処理を任意で行い、例えば、オーディオクリップ141を標準フォーマットにエンコードするか、または動画ファイルのオーディオ部分を抽出する。
オーディオ指紋モジュール136は、コンテンツオーナーが提供する参照サウンド記録163の参照オーディオ指紋(または「オーディオIDファイル」という)を作成する。オーディオ指紋モジュール136は、レコード会社または他の事業体(エンティティ)が所有する特定のサウンド記録を一意に(ユニークに)表すオーディオ指紋を作成するように構成されている。1つのオーディオ指紋は、1つの参照サウンド記録163のオーディオ特徴を、他のオーディオ指紋と効率的に比較および照合(マッチング)できるようなフォーマットで簡潔に表している。オーディオ指紋モジュール136は、メディアホストサービスシステム110から受信したオーディオクリップ141のオーディオ指紋を同様に生成し、該生成したオーディオ指紋と前記参照オーディオ指紋とを比較することができるようにする。
メロディ指紋モジュール134は、コンテンツオーナーが提供する参照サウンド記録の参照メロディ指紋(または「メロディIDファイル」という)を作成する。メロディ指紋は、或る作品のメロディに基づいて、該作品(これは、様々なスタジオ録音、生演奏の録音、またはカバー演奏の録音として具現化され得る)を一意に(ユニークに)表すように設計される。メロディ指紋は、参照サウンド記録のメロディの特徴を、他のメロディ指紋と効率的に比較および照合(マッチング)できるようなフォーマットで簡潔に表している。特定の演奏記録を一意に表す前記オーディオ指紋とは対照的に、該メロディ指紋は、演奏で具現化される作品のメロディをその代わりに表し、音階調、器楽編成、エンコーディングフォーマットの違い、ならびにその他の演奏手法、録音処方および信号処理手法の違いが、該メロディ指紋の特徴に実質的に影響を与えないようなやり方で、該メロディを表している。従って、特定の作品の生演奏のメロディ指紋が、その作品のスタジオ録音のメロディ指紋とマッチする一方で、生演奏のオーディオ指紋はスタジオ録音のオーディオ指紋とはマッチしない。メロディ指紋モジュール134は、同様に、メディアホストサービスシステム110から受信したオーディオクリップ141のメロディ指紋を作成する。
一実施形態において、メロディ指紋モジュール134は、オーディオクリップ141の異なる時点の間に生じる一連のピッチ音程を検出し、これを簡潔に表す。ピッチ音程表現を用いたメロディ指紋については、Richard Lyon等による米国特許出願第12/826,623号、表題「Intervalgram Representation of audio for Melody Recognition」にさらに記載されており、その内容を参照して本明細書に組み込む。当該実施形態では、先ず、オーディオクリップ141を処理して、安定化聴覚イメージ(SAI)を作成する。SAIは、ヒトの聴覚系がどのように音を処理および表現するかをシミュレートするために設計された聴覚モデルを使用して、オーディオクリップ141を表す。SAIを使用することによって、ヒトの耳が認識するオーディオ特徴の特性である、オーディオクリップ141の表現の特徴を抽出することができる。例えば、入力オーディオクリップ141で認識される主要な楽音は、当該入力オーディオクリップ141全体に亘って一定時間ごとに抽出可能である。抽出したこれらの楽音は、該入力オーディオクリップの製作に使用した器楽編成、録音パラメータ、エンコード手法または信号処理手法に対して概ね不変である。抽出した楽音のそれぞれは、例えば、12音階の1音と対応可能である。代替として、さらに細かい音階を使用してもよい(例えば、12音階の代わりに1オクターブあたり可能な36音階)。従って、入力オーディオクリップ141は、該オーディオクリップ141において生じる一連の認識可能な楽音を備える1つの表現に縮小される。該表現を調性に対して不変な表現に変換するために、抽出した一連の楽音をさらに処理して、時間的に連続する楽音間のピッチ音程(例えば、全音および/または半音の度数)を決定する。この一連のピッチ音程が、調性に対して不変なメロディ指紋を形成する。さらに、該メロディ指紋は、器楽編成、テンポ変化、ならびに他の演奏、録音および処理の違いに対して実質的に不変である。コンテンツ認識システムは、該メロディ指紋の表現によって、現行の著作権法で同一作品の具現化と認識される程度に類似している作品の参照記録物を検索できる。従って、該メロディ指紋を使用することによって、例えば、或る作品の生演奏および/またはカバー演奏と、当該作品の異なる参照記録物とを正確に照合(マッチング)することができる。
索引付けモジュール138は、オーディオIDデータベース144およびメロディIDデータベース142のそれぞれに格納された参照オーディオ指紋および参照メロディ指紋の索引(インデックス)を作成する。様々な索引スキームを使用できるが、一般的に、索引スキームは、オーディオクリップ141の入力指紋と参照データベース142、144の参照指紋とを比較および照合(マッチング)する際の効率性を向上するように設計される。一実施形態において、索引付けモジュール138は、局所性鋭敏型ハッシュ(LSH)帯域の索引スキームを適用する。LSH帯域の索引時において、参照データベース142、144の参照指紋は、一意な固定長バイト列のセット(即ち、「索引キー」)で索引されるが、これは一実施形態において4バイト長である。各索引キー(即ち、一意の4バイト列)に関し、LSHの索引は、その特定のバイト列を含む、参照データベース142、144内の全ての参照指紋に対するポインタを格納する。従って、例えば、各参照指紋A、DおよびXが4バイト列{A5 B1 43 67}を含む場合、LSHの索引は、索引キー{A5 B1 43 67}に関連して、参照データベース142、144内の参照指紋A、DおよびXの位置に対するポインタを格納する。入力した録音の指紋から得られる索引キーによってLSHの索引を問い合わせることができ、LSHの索引は、特定の索引キーを含む参照データベース142、144に格納された各参照オーディオクリップの指紋に対するポインタを返送することができる。LSH帯域の索引付けは、参照データベース142、144の参照指紋を索引付けするための索引スキームの一例に過ぎない。代替の実施形態において、索引付けモジュール138は、異なる索引スキームに従って参照指紋を索引付けできる。
照合(マッチング)モジュール140は、オーディオクリップ141を表すオーディオ指紋およびメロディ指紋(IDファイル)と、参照データベース142、144の参照オーディオ指紋および参照メロディ指紋とを比較して、オーディオクリップ141と最もマッチする参照サウンド記録および/または参照作品を決定する。照合(マッチング)の結果に基づいて、様々な動作が行われる。
先ず、オーディオIDのマッチとは、オーディオクリップ141が参照サウンド記録の1つとマッチすることを意味する。また、オーディオIDのマッチとは、オーディオクリップ141で具現化された作品が、参照サウンド記録で具現化された作品とマッチすることを意味する。従って、オーディオIDのマッチについて、照合モジュール140は、通常、サウンド記録の所有権と作品の所有権の両方を識別する。
次に、オーディオIDがマッチしない状況でのメロディIDのマッチとは、例えサウンド記録とマッチしない場合であっても、当該オーディオクリップ141において具現化された作品が、参照サウンド記録の少なくとも1つにおいて具現化された該作品とマッチすることを意味する。メロディIDのマッチは、例えば、オーディオクリップ141が該作品のカバー演奏または生演奏を具現化する一方で、参照データベースが当該作品の別の録音(例えば、スタジオ録音)を含む場合に起こり得る。従って、オーディオIDがマッチしない状況でのメロディIDのマッチについて、照合モジュールは、通常、作品の所有権のみを識別(特定)し、サウンド記録の所有権を識別(特定)することはない。
照合モジュール140は、前述の結果に基づいて、前記オーディオクリップ141の所有権を有すると識別(特定)された事業体(エンティティ)を指し示す所有権情報143を出力する。図5を参照して、この処理を以下に詳述する。
上述したように、照合モジュール140は、オーディオクリップ141の入力指紋と、参照データベース142、144内の1つ以上の参照指紋とのマッチを判定する。検索効率を向上するために、照合モジュール140は、通常、索引付けモジュール138と共に動作し、先ず、オーディオクリップ141の指紋と最もマッチする可能性が高い参照指紋の候補を挙げる。例えば、LSH帯域の索引付けを使用する一実施形態において、索引付けモジュール138は、オーディオクリップ141の入力指紋を、索引キーのセットとなる複数の帯域(例えば、4バイト長の帯域)に分割する。索引付けモジュール138は、これらの索引キーを使用してLSH帯域の索引を問い合わせ、LSH帯域の索引は、参照データベース142、144内の少なくとも1つの索引キーを含む参照指紋候補のポインタセットを返送する。参照指紋候補のセットが識別されると、照合モジュール140は、入力指紋と各参照指紋候補とのマッチメトリック(マッチ計量値)を計算する。マッチメトリックは、マッチの質(例えば、スコア、距離、確率、または他の測定参照)に関する評価指数を示す。例えば、一実施形態において、マッチメトリックは、オーディオクリップ141の指紋と、参照データベース142、144内の1つ以上の参照指紋候補との間のユークリッド距離またはマハラノビス距離である。算出した参照指紋候補とオーディオクリップ141の指紋との間のユークリッド距離またはマハラノビス距離が閾値未満の場合に、参照指紋候補は、入力オーディオクリップ141の指紋とマッチするとみなされる。
代替の実施形態において、索引付けモジュール138または照合モジュール140は、指紋モジュール134、136のうちの1つではなく、コンテンツ認識システム130の外部にある指紋ソースから、オーディオクリップ141の指紋表現を受信することができる。これらの実施形態では、指紋モジュール134、136が除かれて、インジェストサーバ132は、オーディオクリップ141自体を受信する代わりに、オーディオクリップ141を表す指紋を受信するように構成される。
メロディID参照データベース142は、複数の参照記録物の参照メロディ指紋を格納し、各参照メロディ指紋は、それぞれ特定の作品を表す。同様に、オーディオID参照データベース144は、複数の参照記録物の参照オーディオ指紋を格納し、各参照オーディオ指紋は、それぞれ特定のサウンド記録を表す。
所有権データベース146は、参照記録物163として具現化された参照サウンド記録および/または作品に関連する所有権を識別(特定)する所有権メタデータを格納する。所有権データベース146に格納される所有権メタデータの例を、図3乃至4を参照して以下でさらに詳細に説明する。また、所有権メタデータは、コンテンツのオーナーが、仮にも、サウンド記録および/または作品に関連する権利の行使(例えば、遮断、追跡または収益化)をどのように希望するかを示す所有権ポリシーを含む。様々な所有権ポリシーを扱う処理を、図6を参照して以下でさらに詳細に説明する。
別の実施形態において、作成したオーディオクリップ141のオーディオ指紋および/またはメロディ指紋は、追加の参照指紋としてメロディID参照データベース142およびオーディオID参照データベース144に格納される。このように、コンテンツオーナーは、特定の作品の追加記録物または特定のサウンド記録の追加インスタンスを提供することによって、参照データベース142、144を補完できる。
例えば、インジェストサーバ112、メディアサーバ114、権利管理エンジン116、広告管理システム118、インジェストサーバ132、メロディ指紋モジュール134、オーディオ指紋モジュール136、索引付けモジュール138および照合モジュール140を含む、メディアホストサービスシステム110およびコンテンツ認識システム130の様々な構成要素(代替的にはモジュール)のそれぞれは、CPU、メモリ、ネットワーク・インターフェース、周辺機器インターフェースおよび他の周知のコンポーネントを備えた1つ以上のコンピュータを含む、サーバクラスのコンピュータシステムの一部として実装される。コンピュータ自体は、オペレーティングシステム(例えば、LINUX(登録商標))を実行することが好ましく、かつ超高性能CPUと、1G以上のメモリと、100G以上のディスク容量とを有することが好ましい。もちろん、データベースの容量が巨大化しない場合は、パーソナル・コンピュータおよび携帯用コンピュータを含む他種類のコンピュータを使用することができ、また、今後さらなる高性能コンピュータの開発が見込まれる場合は、本明細書の教示に従ってそれらを構成可能になることが予想される。モジュールは、コンピュータ読み取り可能な記憶媒体(例えば、ハードディスク)に格納されたコンピュータ実行可能プログラムの命令を備える。コンピュータ実行可能プログラムの命令は、実行中にメモリにロードされ、システムの一部として含まれる1つ以上のプロセッサによって実行される。本明細書に記載した様々な動作を実行するように汎用コンピュータを構成すると、当該コンピュータが格納する特定の機能やデータは、その根底を成すオペレーティングシステムやハードウェア論理が提供し得る固有の能力とは異なる方式で当該コンピュータを構成する。従って、当業者には自明であるが、当該汎用コンピュータは専用コンピュータとなる。メディアホストサービスシステム110の一例として、例えば、YOUTUBE(登録商標)のウェブサイトが挙げられるが、他のメディアホストシステムも周知であり、これらのシステムは、本明細書に開示した教示内容に従って動作するように適合可能である。本明細書に記載し、名称を付けたメディアホストサービスシステム110およびコンテンツ認識システム130の構成要素は、本明細書の一実施形態を示し、他の実施形態は、異なる名称の構成要素を含み得ることは言うまでもない。また、他の実施形態では本明細書に記載の構成要素が欠けていてもよく、および/または記載した機能を異なる方法でモジュール間に割り振ってもよい。さらに、1つ以上の構成要素に帰属する機能を1つの構成要素に組み込むこともできる。
説明を分り易くするために、メディアホストサービスシステム110を1つだけ示すが、任意の数の異なるメディアホストサービスシステム110によってコンテンツ認識システム130が使用されてもよい。他の代替の実施形態において、コンテンツ認識システム130は、メディアホストサービスシステム110の構成要素として組み込まれてもよい。さらに、メディアホストサービスシステム110は、多数のユーザ・クライアント装置150と交信してもよい。同様に、コンテンツ認識システム130は、任意の数のコンテンツオーナークライアント装置170と交信してもよい。さらに、1つのクライアント装置を、ユーザ・クライアント装置150およびコンテンツオーナークライアント装置170として使用できる。
一実施形態において、メディアホストサービスシステム110は、メディアホストサービスシステム110によるアップロード・フローの一部として、オーディオクリップ141をコンテンツ認識システム130に提供する。従って、本実施形態において、ユーザ提供メディアコンテンツ151は、コンテンツデータベース120に格納される前、格納されると同時、または格納された直後に識別されて、所有権データベース146内の所有権メタデータが許可する場合に、他のユーザによるダウンロードまたは閲覧用にアクセス可能とされる。別の実施形態において、コンテンツ認識システム130は、コンテンツデータベース120に予め格納されている旧式コンテンツのスキャンを実行するように構成される。本実施形態によって、コンテンツ認識システム130は、例えば、コンテンツ認識システム130の初回使用以前に(例えば、メディアホストサービスシステム110がコンテンツ認識システム130へのアクセスを取得する以前に)存在していたホストコンテンツに係る所有権を識別することができる。さらに、旧式コンテンツのスキャンは、コンテンツデータベース120に関連する所有権情報および使用ポリシーの更新に有用であり、これによってコンテンツ認識システム130は、新たな参照サウンド記録163、および随時変更される所有権メタデータ161を利用できるようになる。
動作および使用
図2は、コンテンツ認識システム130が参照データベース142、144、146を作成する際に実行するための処理の一実施形態を示す。コンテンツ認識システム130は、コンテンツオーナークライアント装置170を介して、サウンド記録(所望の所有権ポリシーを含む)に対応する参照サウンド記録163および/または所有権メタデータ161をコンテンツオーナーから受信する(202)。場合によっては、参照サウンド記録163および/または所有権メタデータ161の一部分のみが、単一のコンテンツオーナーから提供される。例えば、出版社は、参照サウンド記録を提供せずに、作品に関連する所有権メタデータのみを提供してもよい。他の場合において、レコード会社は、サウンド記録の根底にある作品の所有権を有する単数または複数の出版社を特定せずに、該サウンド記録に関する所有権情報を提供してもよい。さらに別の場合において、コンテンツオーナーは、作品の所有権の一部のみ(例えば、50%の所有権)を有することを示してもよく、残りの所有権を有する他の事業体(エンティティ)を必ずしも特定しなくてもよい。断片的な情報を整理するために、コンテンツ認識システム130は、受信した情報を関連付け、これらの情報を一群のエントリにまとめ、各エントリを1つのサウンド記録または作品に対応させる(204)。さらに、当該作品を具現化する1つ以上のサウンド記録のエントリと作品のエントリとをリンク付けしてもよい。通常、断片的に提出された情報に共通する様々なメタデータ・フィールド(例えば、曲名、アーティスト名、識別番号など)を照合することによって、関連付けが行われる。
オーディオ指紋モジュール136は、参照サウンド記録の参照オーディオ指紋を作成し(206)、サウンド記録の所有権メタデータと関連付けて参照オーディオ指紋を格納する(208)。メロディ指紋モジュール134は、該参照サウンド記録において具現化された作品を表す参照メロディ指紋を作成し(210)、該作品の所有権メタデータと関連付けて参照メロディ指紋を格納する(212)。従って、コンテンツ認識システム130は、提供された各参照記録物の参照オーディオ指紋および参照メロディ指紋の両方を作成する。
図3は、或る作品に関連する所有権メタデータエントリの一例を示すグラフィックインターフェースである。例えば、コンテンツ認識システム130およびメディアホストサービスシステム110の管理者、ならびに/またはコンテンツのオーナーが、当該グラフィックインターフェースを使用してもよい。代替として、図3に示すメタデータの全てまたは一部の使用を内部に限定してもよく、この場合はグラフィックインターフェースにメタデータを表示しなくてもよい。
所有権メタデータは、異なる識別フィールドを備える幾つかのカテゴリに分類される。例えば、本実施形態において、所有権メタデータは、メタデータ302、所有権情報304、権利306、関連アセット308および参照コンテンツ310のカテゴリに分類される。メタデータカテゴリ302は、当該作品を識別する様々なフィールドを提供し、これには、例えば、識別子フィールド(例えば、CMSアセットID)、種類(例えば、作品またはサウンド記録)、提供者(例えば、参照データを提出した事業体)、ソース、カスタムID、追加日時(例えば、提出日/時間)、国際標準音楽作品コード(ISWC)、曲名、カテゴリおよび作曲者が含まれる。図示するように、幾つかのフィールドは、空欄であってもよく、この場合は現時点において情報が不明または未確認であることを示す。
所有権情報カテゴリ304は、当該作品の所有権を有する事業体と、所有権を適用する国(所有権は国ごとに異なり得るため)と、該当する場合に所有権のパーセンテージまたは割合(国によっては所有権が2つ以上の事業体に分割されるため)を識別する。図示した例において、所有権情報は、「出版社A」が米国で当該作品の66.66%の所有権を有し、「出版社B」が米国で当該作品の33.34%の所有権を有することを示す。
権利カテゴリ306は、コンテンツオーナーが選択した所有権ポリシー(「オーナーポリシー」)と、既知の場合は、ホストサービスが実際に適用するポリシー(「適用ポリシー」)とを示す。上記で説明したように、ポリシーには、例えば、収益化、追跡または遮断を含めることができる。権利カテゴリ306は、ドロップダウンボックス307を含み、閲覧者が(図で選択されているように)「マッチ請求」または「埋め込み請求」(図示せず)を選択できる。「マッチ請求」を(図示のように)選択すると、表示される所有権ポリシーは、マッチする作品が検出された場合に選択および/または適用される所有権ポリシーとなる。図示の例において、オーナーは「閲覧者の位置情報が米国である場合に収益化(および追跡)」を選択しており、ホストサービスシステムは同一のポリシーを適用する。代替として、ドロップダウンボックス307から「埋め込み請求」を選択すると、作品を埋め込むサウンド記録の所有権ポリシーが表示される。これによって、例えば、サウンド記録を所有するレコード会社が追跡または収益化を選択する場合であっても、出版社は当該サウンド記録の使用を遮断することができる。
関連アセットカテゴリ308は、作品を埋め込む他のアセット(例えば、サウンド記録)を識別する。図示の例において、関連アセットカテゴリは、作品を具現化しているサウンド記録(「作品イ長調」)を識別する。
参照コンテンツカテゴリ310は、当該作品のコンテンツオーナーが参照記録物を提供する場合に、該参照記録物を識別する。ここでは、何れの出版社も当該作品を表す参照記録物を提供していない。但し、関連アセット(例えば、曲名「作品イ長調」に関連するサウンド記録)の参照記録物の場所が判明している場合は、作品のマッチを判定する目的で、該作品を参照記録物とリンクさせるようにしてよい。図3に示すエントリは、作品のメタデータエントリの一例に過ぎない。他の実施形態において、エントリは、異なるカテゴリ、フィールド、データおよび組織図を含み得る。
図4は、参照サウンド記録に関連する所有権メタデータエントリの一例を示すグラフィックインターフェースである。サウンド記録の所有権メタデータは、図3に示した作品の所有権メタデータと同様に、内部使用に限定されてもよく、従って、グラフィックインターフェースにメタデータを表示しなくてもよい。サウンド記録の所有権メタデータは、異なる識別フィールドを備える幾つかのカテゴリに分類される。例えば、本実施形態において、所有権メタデータは、メタデータ402と、所有権情報404と、関連アセット408と、参照コンテンツ410のカテゴリに分類される。
メタデータカテゴリ402は、参照サウンド記録を識別する様々な情報を提供し、上述した作品メタデータと同一のフィールドを多数含む。さらに、メタデータカテゴリ402は、例えば、ジャンル、レコード会社、オーディオの国際標準レコーディングコード(ISRC)、商品コード(UPC)および音楽データ識別コード(GRid)など、サウンド記録に特有のフィールドを含んでもよい。
所有権情報カテゴリ404は、サウンド記録の所有権を有する1つ以上の事業体(エンティティ)を指し示す。この場合、「レコード会社A」が全世界で該サウンド記録の所有権を有する。関連アセットカテゴリ408は、該サウンド記録が具現化しているその他のアセット(例えば、作品)を識別する。図示の例において、サウンド記録は、図3を参照して前述した作品「作品イ長調」を具現化している。
参照コンテンツカテゴリ410は、サウンド記録に関連する1つ以上の参照記録物を識別する。図示の例において、オーナー(レコード会社A)は、コンテンツ認識システム130によるサウンド記録の識別に使われる2種類の参照記録物を提供している。各参照記録物には様々な識別フィールドが設けられ、これには、例えば、参照ID、日時(例えば、提出日/時間)、種類(オーディオまたは動画)、提供者(例えば、提出した事業体)およびステータス(アクティブまたは非アクティブ)が含まれる。図4に示すエントリは、サウンド記録のメタデータエントリの一例に過ぎない。他の実施形態において、エントリは、異なるカテゴリ、フィールド、データおよび組織図を含み得る。
図5は、コンテンツ認識システム130がオーディオクリップ141に関連する所有権情報143を決定する際に実行するための処理を示すフローチャートである。コンテンツ認識システム130は、502:オーディオクリップ141を受信して、504:オーディオクリップ141を表すオーディオ指紋(例えば、オーディオIDファイル)を作成する。次いで、コンテンツ認識システム130は、506:オーディオクリップ141のオーディオ指紋が、オーディオIDデータベース144内の参照オーディオ指紋とマッチするか否かを判定する。オーディオ指紋のマッチが見つかった場合は、508:サウンド記録のコンテンツオーナーの代わりに、請求(クレーム)が作成される。オーディオ指紋の照合に関して、通常、サウンド記録のオーナー(通常はレコード会社)と作品のオーナー(通常は出版社)双方の代わりに請求が作成される。上記で説明したように、クリップ141のオーディオ指紋が参照オーディオ指紋とマッチすると、このマッチによって、該サウンド記録の所有権および該サウンド記録で具現化された作品の所有権が判明する。
オーディオ指紋のマッチが見つからない場合、コンテンツ認識システム130は、510:オーディオクリップ141の根底を成すメロディを表すメロディ指紋を作成する。次いで、コンテンツ認識システム130は、512:入力オーディオクリップ141のメロディ指紋が、メロディIDデータベース142内の参照メロディ指紋とマッチするか否かを判定する。指紋がマッチした場合は、514:オーディオクリップ141で具現化された作品のコンテンツオーナーの代わりに、請求が作成される。但し、オーディオIDのマッチは見つからなかったので、オーディオクリップ141で具現化されたサウンド記録のオーナーの代わりに、請求を作成することはできない。
オーディオIDおよびメロディIDとのマッチが見つからない場合は、516:オーディオクリップ141とマッチするものがコンテンツ認識システム130には存在しないので、請求は作成されない。
効率化のため、ステップ506においてオーディオIDのマッチが見つかる場合には、通常、ステップ510‐514におけるメロディ指紋の作成および比較が不要となる。その代わり、サウンド記録のマッチが検出されると、通常、サウンド記録で具現化された作品を識別する関連アセットメタデータ408などのサウンド記録のメタデータから、根底を成す作品が判明する。他の実施形態では、マッチが見つかる場合であっても、オーディオ指紋と共にメロディ指紋を作成することができる。
代替の実施形態では、オーディオクリップ141が入力される毎に、オーディオ指紋およびメロディ指紋の照合(マッチング)が行われる。本実施形態では、最もマッチするオーディオ指紋およびメロディ指紋のマッチの程度が、オーディオ指紋および/またはメロディ指紋のマッチを判定する際に考慮される。例えば、参照サウンド記録に対するメロディ指紋のマッチの程度が高い場合に(高信頼度)、同一の参照サウンド記録に対して本来は低いオーディオ指紋の信頼度(低信頼度)を高めてもよい。オーディオ指紋のみの比較ではマッチの程度が不明瞭な場合は、このような方法でオーディオ指紋のマッチを検出してもよい。通常、最もマッチするオーディオ指紋およびメロディ指紋の指標への重み付けが可能であり、これらの加重した指標を組み合わせる様々な方法を採用することによって、最もマッチするオーディオ指紋および/またはメロディ指紋が、マッチするオーディオ指紋および/またはメロディ指紋と見なされるか否かを決定することができる。
コンテンツオーナーの代わりに作成される請求(クレーム)は、識別されたメディアコンテンツに関連する所有権ポリシーを呼び出す。図6は、作成した請求に基づいて、(例えば、権利管理エンジン116によって実行される)所有権ポリシーを実施する方法の一例を示す。権利管理エンジン116は、602:所有権データベース146の所有権情報にアクセスすることによって、コンテンツ認識システム130が識別したメディアコンテンツの所有権ポリシーを識別する。権利管理エンジン116が、604:オーナーの100%がコンテンツの収益化を要求していると判断する場合、権利管理エンジン116は、606:コンテンツの収益化、および比率に基づいて収益をコンテンツオーナーに分配するための措置を講じる。収益の分配を含む収益化ポリシーの詳細は、通常、メディアホストサービスシステムと1人以上のコンテンツオーナーとの間のライセンス契約によって決定される。通常、コンテンツの収益化には、的を絞った広告をユーザ要求コンテンツと共に流すことと、広告主から得た収益の少なくとも一部をコンテンツオーナーに分配することを含む。一方、権利管理エンジン116が、604:100%未満のオーナーがコンテンツの収益化を要求していると判断する場合、権利管理エンジン116は、次に、608:少なくとも1人のオーナーがコンテンツの遮断を要求しているかどうかを判断する。少なくとも1人のオーナーがコンテンツの遮断を要求する場合、610:当該コンテンツは遮断される。遮断には、コンテンツデータベース120からコンテンツを削除すること、またはユーザ・クライアント装置150による当該コンテンツへのアクセスを防止することを含んでもよい。何れのオーナーもコンテンツの遮断を要求しておらず、また少なくとも1人のオーナーがコンテンツの収益化を要求しない場合には、権利管理エンジン116は、612:コンテンツの利用数を追跡し、追跡データをオーナーに提供する。通常、追跡には、コンテンツに対するユーザの要求に関する統計情報を収集することと、これらの統計情報をコンテンツオーナーに提供することが含まれる。
図7は、アップロードされたメディアコンテンツの識別に応えて権利管理エンジン116が作成する、請求メタデータの例を示すグラフィックインターフェースである。メタデータは、ユーザがアップロードしたメディアコンテンツに「作品イ長調」の生演奏の映像が含まれることを示している。ユーザ提供コンテンツと完全にマッチするサウンド記録は無かったが(即ち、オーディオIDのマッチは見つからなかったが)、コンテンツ認識システムは、ユーザ提供コンテンツのメロディが既知の作品「作品イ長調」のメロディ指紋とマッチすると判断した。作成した請求に関するメタデータには、ユーザ提供コンテンツおよびマッチした作品の他にも、所有権情報および関連する請求ポリシーに関する様々な情報が含まれる。図7に示すメタデータは、作成した請求に関するメタデータエントリの一例に過ぎない。他の実施形態では、異なるメタデータまたは追加のメタデータを含んでもよい。
従って、コンテンツ認識システム130は、メディアホストサービスシステム110と協働して有益に動作して、ホストしたメディアコンテンツの識別を行い、所有権を決定し、所有権を行使するために請求ポリシーを適用する。さらに、システムは、コンテンツオーナーのメディアコンテンツを収益化するプラットフォームを提供することによって、コンテンツオーナーに利益をもたらす。また、システムは、閲覧許可されているメディアコンテンツの膨大なコレクションへのアクセスを可能にすることによって、メディアホストサービスのユーザに対しても恩恵をもたらす。
コンテンツ認識システムは、従来のシステムと異なり、ホストされたメディアコンテンツにおいて具現化されている作品を効率的に識別するために、メロディ認識を効果的に使用する。従って、コンテンツ認識システムは、例えば、カバー演奏および生演奏など、これまで知られていなかった演奏または目録未作成の演奏において具現化されている既知の作品を検出することができる。その結果、コンテンツ認識システムは、ホストメディアコンテンツに対する所有権行使の問題について、効率的かつ拡張可能なソリューションを提供する。
本発明のごく少数の実施形態について詳述してきたが、本発明をさらに他の実施形態において実施できることは、当業者にとっては言うまでもない。先ず、コンポーネントの特定名称、用語の大文字表記、属性、データ構造、またはその他のプログラムの特徴もしくは構造的な特徴は、必須でもなければ重要でもなく、本発明またはその特徴を実施する機構は、異なる名称、フォーマットまたはプロトコルであってもよい。さらに、記載とは異なるハードウェアおよびソフトウェアの組み合わせで、システムを実施してもよい。また、本明細書では、様々なシステムコンポーネントに機能を分担させたが、これは例示に過ぎず、必須ではない。1つのシステムコンポーネントが実行する機能を複数のコンポーネントが実行してもよく、複数のコンポーネントが実行する機能を1つのコンポーネントが実行してもよい。
以上の詳述な説明の一部は、情報に関する動作のアルゴリズムおよび記号列表現の観点から本発明の特徴を提示した。これらのアルゴリズム記述および表示は、他の当業者に対して自身の研究の内容を最も効果的に伝えるために、データ処理分野の当業者が使用する手段である。これらの動作について機能的または論理的に記載したが、メモリに格納されて1つ以上のプロセッサが実行するコンピュータプログラムがこれらの動作を実行することは、言うまでもない。さらに、一般性を喪失することなく、これらの動作の配置構成をモジュールまたは符号化デバイスと呼ぶことに時として利便性があることも証明されている。
説明から明らかになるように、特に断りの無い限り、本明細書の記載全体を通して、例えば「処理」、「演算」、「計算」、「決定」または「表示」などの用語を用いる説明が、コンピュータシステムまたは同様な電子計算装置の作用およびプロセスを指し、当該コンピュータシステムまたは同様な電子計算装置は、コンピュータシステムのメモリ、レジストリおよびメモリ内で物理(電子)量として表現されたデータを操作し、そしてこれをコンピュータシステムのメモリ、レジストリ、または他の情報ストレージ装置、転送装置もしくは表示装置内で同様に物理(電子)量として表現される、他のデータに変換することを理解されたい。
本発明の態様は、本明細書に記載の処理のステップおよび指示をアルゴリズムの形式で含む。なお、本発明の処理のステップおよび指示を、ソフトウェア、ファームウェアまたはハードウェアで実現することができ、またソフトウェアで実現する場合は、リアルタイムのネットワーク・オペレーティングシステムにダウンロードして、リアルタイムのネットワーク・オペレーティングシステムが使用する他のプラットフォーム上で実行することができる。
また、本発明は、本明細書に記載の動作を実行する装置に関する。この装置は、要求される目的を果たすために特別に構成されてもよく、または格納するコンピュータプログラムによって選択的に起動または再構成される汎用コンピュータを備えてもよい。このようなコンピュータプログラムを読み取り可能な記憶媒体に格納してもよく、読み取り可能な記憶媒体には、フロッピー(登録商標)ディスク、光ディスク、CD-ROM、光磁気ディスク、読み取り専用メモリ(ROM)、ランダムアクセスメモリ(RAM)、EPROM、EEPROM、磁気カードもしくは光カード、特定用途向け集積回路(ASIC)または電子的な指示の格納に適した如何なる種類の媒体などであって、コンピュータ・システムバスに接続される何れの種類のディスクが挙げられるが、これらに限定されない。さらに、本明細書で呼ぶコンピュータは、シングルプロセッサを含んでもよく、または計算能力を高めるためにマルチプロセッサの設計を採用する構成であってもよい。
本明細書で提示するアルゴリズムおよび表示は、本質的に、何らかの特定のコンピュータまたはその他の装置と関連するものではない。様々な汎用システムが、本明細書の教示に従うプログラムと共に使用され得るか、または要求される方法ステップを実行するために、さらに専用化された装置を構成することが便利であることが判明し得る。様々なこれらのシステムに対して要求される構造は、上記から明らかになる。
最後に、本明細書で使用する言い回しは、主に読み易さおよび例示の目的で選択されており、本発明の主題を記述または制限する目的では選択されていないことに留意されたい。従って、本発明の開示は、一例に過ぎず、本発明の範囲を制限するものではない。

Claims (20)

  1. ンピュータによって実行される方法であって、
    前記コンピュータによりオーディオクリップでなる入力メディアファイルを受信することと
    前記コンピュータにより前記オーディオクリップの入力メロディ指紋を生成することと、ここで、前記入力メロディ指紋は、前記オーディオクリップに含まれる複数の主要な楽音間のピッチ音程からなる一連のピッチ音程であり、
    前記コンピュータにより、前記入力メロディ指紋とマッチする参照メロディ指紋をメロディ指紋参照データベースに基づいて決定することと、ここで、該マッチする参照メロディ指紋は、或る参照サウンド記録に関連し且つ前記オーディオクリップにおいて具現化されている作品のメロディを表しており、
    前記コンピュータにより、前記入力メロディ指紋とそれにマッチする前記参照メロディ指紋との間のマッチの程度を示すメロディマッチ度を決定することと、
    前記コンピュータにより、前記オーディオクリップの入力オーディオ指紋を生成することと、ここで、前記入力オーディオ指紋は、前記オーディオクリップにおいて具現化されたサウンド記録の特徴を表しており、
    前記コンピュータにより、前記入力オーディオ指紋をオーディオ指紋参照データベース内の複数の参照オーディオ指紋と比較することと、ここで、前記参照オーディオ指紋は、それぞれ参照サウンド記録に関連付けられており、
    前記コンピュータにより、前記比較及び前記メロディマッチ度に応じて前記入力オーディオ指紋とマッチする1つの参照オーディオ指紋を特定することと、
    記コンピュータにより、前記マッチすると決定された前記参照メロディ指紋及び前記マッチすると特定された前記参照オーディオ指紋に関連する1つの参照サウンド記録のサウンド記録オーナー及び作品オーナーを決定することと、
    前記コンピュータにより、前記サウンド記録オーナー及び前記作品オーナーの代わりに、前記入力メディアファイルに関する請求を生成すること
    を備える方法。
  2. 前記メロディ指紋は、前記作品の演奏を行うまたは記録するのに使用された要因に対して不変であり、該作品の演奏を行うまたは記録するのに使用された前記要因は、該作品が演奏された音階調、該作品を演奏するのに使用した楽器、若しくは、該オーディオクリップを作成するのに使用した器楽編成を含む、請求項1に記載の方法。
  3. 前記マッチするメロディ指紋に関連付けられた所有権ポリシーを決定することと、
    前記所有権ポリシーに基づいて前記請求を生成することと
    を更に備える請求項1又は2に記載の方法。
  4. 前記入力メディアファイルを提供するメディアホストサービスに対して前記所有権ポリシーを提供すること、を更に備える請求項3に記載の方法。
  5. 前記作品の所有権益を持つ少なくとも1つのエンティティが該作品へのアクセスを遮断することを望むということを前記所有権ポリシーが示しているとき、前記入力メディアファイルへのアクセスを遮断すること、を更に備える請求項3又は4に記載の方法。
  6. 前記作品の所有権益を持つ全てのエンティティが該作品の収益化を望むということを前記所有権ポリシーが示しているとき、前記入力メディアファイルを収益化すること、を更に備える請求項3乃至5のいずれかに記載の方法。
  7. 前記入力メディアファイルを収益化することは、
    前記入力メディアファイルを提供するメディアホストサービスのユーザから前記入力メディアファイルのリクエストを受信することと、
    前記入力メディアファイルと共に配置するための広告を選択することと、
    前記リクエストしたユーザに対して前記選択された広告と共に前記入力メディアファイルを提供することと、
    前記広告から生じた収益を前記作品のコンテンツオーナーと分配すること、
    を備える請求項6に記載の方法。
  8. 前記作品の所有権益を持つどのエンティティも該作品へのアクセスを遮断することを望まず、かつ、前記作品の所有権益を持つ少なくとも1つのエンティティが該作品の収益化を望まないということを前記所有権ポリシーが示しているとき、前記入力メディアファイルの追跡を行うこと、を更に備える請求項3乃至7のいずれかに記載の方法。
  9. 前記入力メディアファイルはビデオクリップからなり、前記オーディオクリップは該ビデオクリップのオーディオトラックからなる、請求項1乃至8のいずれかに記載の方法。
  10. 前記オーディオクリップに含まれる複数の主要な楽音を抽出するために該オーディオクリップを処理することを更に備え、この処理は、人間の聴覚系がどのように音を処理および表現するかをシミュレートする聴覚モデルを使用して、人間の耳が認識する該主要な楽音の特性として前記オーディオクリップの表現の特徴を抽出することを含み、前記入力メロディ指紋が該抽出された複数の主要な楽音を使用して生成される、請求項1乃至9のいずれかに記載の方法。
  11. 前記マッチする1つの参照オーディオ指紋を特定することは、
    前記入力オーディオ指紋と前記複数の参照オーディオ指紋中の或る候補の参照オーディオ指紋との間のマッチの信頼度を判定することと、
    前記候補の参照オーディオ指紋が、前記マッチすると特定された前記参照オーディオ指紋と同一の参照サウンド記録に関連しているかどうかを判定することと、
    前記候補の参照オーディオ指紋が前記マッチすると特定された前記参照オーディオ指紋と同一の参照サウンド記録に関連しているとの判定に応じて、前記入力オーディオ指紋と前記候補の参照オーディオ指紋との間のマッチの信頼度を高めること
    を含む、請求項1乃至10のいずれかに記載の方法。
  12. ロセッサと、
    前記プロセッサと結合した非一時的なコンピュータ読取可能記憶媒体であって、
    ーディオクリップでなる入力メディアファイルを受信することと、
    記オーディオクリップの入力メロディ指紋を生成することと、ここで、前記入力メロディ指紋は、前記オーディオクリップに含まれる複数の主要な楽音間のピッチ音程からなる一連のピッチ音程であり、
    前記入力メロディ指紋とマッチする参照メロディ指紋をメロディ指紋参照データベースに基づいて決定することと、ここで、該マッチする参照メロディ指紋は、或る参照サウンド記録に関連し且つ前記オーディオクリップにおいて具現化されている作品のメロディを表しており、
    前記入力メロディ指紋とそれにマッチする前記参照メロディ指紋との間のマッチの程度を示すメロディマッチ度を決定することと、
    前記オーディオクリップの入力オーディオ指紋を生成することと、ここで、前記入力オーディオ指紋は、前記オーディオクリップにおいて具現化されたサウンド記録の特徴を表しており、
    前記入力オーディオ指紋をオーディオ指紋参照データベース内の複数の参照オーディオ指紋と比較することと、ここで、前記参照オーディオ指紋は、それぞれ参照サウンド記録に関連付けられており、
    前記比較及び前記メロディマッチ度に応じて前記入力オーディオ指紋とマッチする1つの参照オーディオ指紋を特定することと、
    前記マッチすると決定された前記参照メロディ指紋及び前記マッチすると特定された前記参照オーディオ指紋に関連する1つの参照サウンド記録のサウンド記録オーナー及び作品オーナーを決定すること、
    前記サウンド記録オーナー及び前記作品オーナーの代わりに、前記入力メディアファイルに関する請求を生成すること
    を前記プロセッサに実行させるための命令を格納する前記非一時的なコンピュータ読取可能記憶媒体と、
    を備えるシステム。
  13. 前記メロディ指紋は、前記作品の演奏を行うまたは記録するのに使用された要因に対して不変であり、該作品の演奏を行うまたは記録するのに使用された前記要因は、該作品が演奏された音階調、該作品を演奏するのに使用した楽器、若しくは、該オーディオクリップを作成するのに使用した器楽編成を含む、請求項12に記載のシステム。
  14. 前記非一時的なコンピュータ読取可能記憶媒体は、前記マッチするメロディ指紋に関連付けられた所有権ポリシーを決定することと、
    前記所有権ポリシーに基づいて前記請求を生成することを前記プロセッサに実行させるための命令をさらに格納する、
    請求項12又は13に記載のシステム。
  15. 前記非一時的なコンピュータ読取可能記憶媒体は、前記入力メディアファイルを提供するメディアホストサービスに対して前記所有権ポリシーを提供することを前記プロセッサに実行させるための命令をさらに格納する、
    請求項14に記載のシステム。
  16. 前記非一時的なコンピュータ読取可能記憶媒体は、前記作品の所有権益を持つ少なくとも1つのエンティティが該作品へのアクセスを遮断することを望むということを前記所有権ポリシーが示しているとき、前記入力メディアファイルへのアクセスを遮断することを前記プロセッサに実行させるための命令をさらに格納する、
    請求項14又は15に記載のシステム。
  17. 前記非一時的なコンピュータ読取可能記憶媒体は、前記作品の所有権益を持つ全てのエンティティが該作品の収益化を望むということを前記所有権ポリシーが示しているとき、前記入力メディアファイルを収益化することを前記プロセッサに実行させるための命令をさらに格納する、
    請求項14乃至16のいずれかに記載のシステム。
  18. 前記入力メディアファイルを収益化することを前記プロセッサに実行させるための前記命令は、
    前記入力メディアファイルを提供するメディアホストサービスのユーザから前記入力メディアファイルのリクエストを受信することと、
    前記入力メディアファイルと共に配置するための広告を選択することと、
    前記リクエストしたユーザに対して前記選択された広告と共に前記入力メディアファイルを提供することと、
    前記広告から生じた収益を前記作品のコンテンツオーナーと分配すること、
    を前記プロセッサに実行させるための前記非一時的なコンピュータ読取可能記憶媒体に格納された命令を備える、請求項17に記載のシステム。
  19. 前記非一時的なコンピュータ読取可能記憶媒体は、前記作品の所有権益を持つどのエンティティも該作品へのアクセスを遮断することを望まず、かつ、前記作品の所有権益を持つ少なくとも1つのエンティティが該作品の収益化を望まないということを前記所有権ポリシーが示しているとき、前記入力メディアファイルの追跡を行うことを、前記プロセッサに実行させるための命令をさらに格納する、
    請求項14乃至18のいずれかに記載のシステム。
  20. 前記入力メディアファイルはビデオクリップからなり、前記オーディオクリップは該ビデオクリップのオーディオトラックからなる、請求項12乃至19のいずれかに記載のシステム。
JP2013538884A 2010-11-12 2011-11-10 メロディ識別を使用するメディアの権利管理 Active JP5726317B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US12/945,216 2010-11-12
US12/945,216 US8584197B2 (en) 2010-11-12 2010-11-12 Media rights management using melody identification
PCT/US2011/060169 WO2012064945A2 (en) 2010-11-12 2011-11-10 Media rights management using melody identification

Publications (3)

Publication Number Publication Date
JP2014503871A JP2014503871A (ja) 2014-02-13
JP2014503871A5 JP2014503871A5 (ja) 2014-11-13
JP5726317B2 true JP5726317B2 (ja) 2015-05-27

Family

ID=46048630

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013538884A Active JP5726317B2 (ja) 2010-11-12 2011-11-10 メロディ識別を使用するメディアの権利管理

Country Status (7)

Country Link
US (2) US8584197B2 (ja)
EP (1) EP2638520A4 (ja)
JP (1) JP5726317B2 (ja)
KR (1) KR101489107B1 (ja)
CN (1) CN103314389B (ja)
CA (1) CA2817340A1 (ja)
WO (1) WO2012064945A2 (ja)

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2261896B1 (en) 2008-07-29 2017-12-06 Yamaha Corporation Performance-related information output device, system provided with performance-related information output device, and electronic musical instrument
JP5782677B2 (ja) * 2010-03-31 2015-09-24 ヤマハ株式会社 コンテンツ再生装置および音声処理システム
US10409850B2 (en) * 2011-03-02 2019-09-10 T-Mobile Usa, Inc. Preconfigured media file uploading and sharing
EP2573761B1 (en) 2011-09-25 2018-02-14 Yamaha Corporation Displaying content in relation to music reproduction by means of information processing apparatus independent of music reproduction apparatus
US9715581B1 (en) * 2011-11-04 2017-07-25 Christopher Estes Digital media reproduction and licensing
JP5494677B2 (ja) 2012-01-06 2014-05-21 ヤマハ株式会社 演奏装置及び演奏プログラム
US9684715B1 (en) * 2012-03-08 2017-06-20 Google Inc. Audio identification using ordinal transformation
US8735708B1 (en) 2012-10-28 2014-05-27 Google Inc. System and method for synchronizing tag history
US9336360B1 (en) 2013-03-14 2016-05-10 Kobalt Music Group Limited Analysis and display of a precis of global licensing activities
US10319040B1 (en) 2013-03-14 2019-06-11 Ktech Services Limited Control of the generation and display of royalty administration and rights management data based on the user's rights of access
USD773492S1 (en) 2013-03-15 2016-12-06 Kobalt Music Group Limited Display screen with a graphical user interface
USD773491S1 (en) 2013-03-15 2016-12-06 Kobalt Music Group Limited Display screen with a graphical user interface
US10397626B2 (en) 2013-03-15 2019-08-27 Ipar, Llc Systems and methods for providing access to rights holder defined video clips
USD773490S1 (en) 2013-03-15 2016-12-06 Kobalt Music Group Limited Display screen with a graphical user interface
KR102255152B1 (ko) * 2014-11-18 2021-05-24 삼성전자주식회사 가변적인 크기의 세그먼트를 전송하는 컨텐츠 처리 장치와 그 방법 및 그 방법을 실행하기 위한 컴퓨터 프로그램
US9704488B2 (en) * 2015-03-20 2017-07-11 Microsoft Technology Licensing, Llc Communicating metadata that identifies a current speaker
US11107173B2 (en) * 2016-02-10 2021-08-31 SoundExchange, Inc. Usage data management system and method
US10003847B2 (en) * 2016-04-22 2018-06-19 Google Llc Watch-time clustering for improving video searches, selection and provision
GB2556023B (en) * 2016-08-15 2022-02-09 Intrasonics Sarl Audio matching
US10713296B2 (en) 2016-09-09 2020-07-14 Gracenote, Inc. Audio identification based on data structure
US10803119B2 (en) 2017-01-02 2020-10-13 Gracenote, Inc. Automated cover song identification
US20180322901A1 (en) * 2017-05-03 2018-11-08 Hey Platforms DMCC Copyright checking for uploaded media
US10713335B2 (en) * 2017-08-28 2020-07-14 Visa International Service Association System, method, and apparatus for detecting unlicensed performances of copyrighted creative works
WO2019087282A1 (ja) * 2017-10-31 2019-05-09 Line株式会社 情報処理方法、情報処理装置及びプログラム
CN110322886A (zh) * 2018-03-29 2019-10-11 北京字节跳动网络技术有限公司 一种音频指纹提取方法及装置
US11550878B2 (en) * 2018-04-13 2023-01-10 Dubset Media Holdings, Inc. Media content processing techniques for rights and clearance management
US11025354B2 (en) * 2019-07-19 2021-06-01 Ibiquity Digital Corporation Targeted fingerprinting of radio broadcast audio
CN116259292B (zh) * 2023-03-23 2023-10-20 广州资云科技有限公司 基调和音阶的识别方法、装置、计算机设备和存储介质

Family Cites Families (75)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4506580A (en) * 1982-02-02 1985-03-26 Nippon Gakki Seizo Kabushiki Kaisha Tone pattern identifying system
US4999773A (en) * 1983-11-15 1991-03-12 Manfred Clynes Technique for contouring amplitude of musical notes based on their relationship to the succeeding note
JP2638816B2 (ja) 1987-07-30 1997-08-06 カシオ計算機株式会社 伴奏ライン基音決定装置
US4896576A (en) * 1987-07-30 1990-01-30 Casio Computer Co., Ltd. Accompaniment line principal tone determination system
JPH01159697A (ja) * 1987-12-17 1989-06-22 Matsushita Electric Ind Co Ltd 音声認識装置
JP2969527B2 (ja) * 1990-03-27 1999-11-02 日通工株式会社 メロディ認識装置及びそれに使用されるメロディ情報抽出装置
US5451709A (en) * 1991-12-30 1995-09-19 Casio Computer Co., Ltd. Automatic composer for composing a melody in real time
JPH1115468A (ja) * 1997-05-01 1999-01-22 N T T Data:Kk 楽曲検索方法、楽曲検索装置、楽曲検索システム、及び記録媒体
US6766946B2 (en) * 1997-10-16 2004-07-27 Dentsu, Inc. System for granting permission of user's personal information to third party
JP2000036781A (ja) * 1998-07-17 2000-02-02 Sony Corp 著作権管理装置、著作物配信装置および著作物配信受信システム
US6389403B1 (en) 1998-08-13 2002-05-14 International Business Machines Corporation Method and apparatus for uniquely identifying a customer purchase in an electronic distribution system
US6912528B2 (en) * 2000-01-18 2005-06-28 Gregg S. Homer Rechargeable media distribution and play system
JP2001265779A (ja) * 2000-03-16 2001-09-28 Hitachi Ltd 音響検索方法
US6574594B2 (en) * 2000-11-03 2003-06-03 International Business Machines Corporation System for monitoring broadcast audio content
US7085613B2 (en) 2000-11-03 2006-08-01 International Business Machines Corporation System for monitoring audio content in a video broadcast
US7043473B1 (en) 2000-11-22 2006-05-09 Widevine Technologies, Inc. Media tracking system and method
DE10058811A1 (de) * 2000-11-27 2002-06-13 Philips Corp Intellectual Pty Verfahren zur Identifizierung von Musikstücken
US7072867B2 (en) * 2000-11-30 2006-07-04 International Business Machines Corporation System and method for third party logging server
US7266704B2 (en) * 2000-12-18 2007-09-04 Digimarc Corporation User-friendly rights management systems and methods
JP2002269276A (ja) 2001-01-05 2002-09-20 Sony Corp 著作物管理方法および装置
US20030088686A1 (en) * 2001-01-19 2003-05-08 Jennings Charles A. System and method for streaming media
JP2002259609A (ja) * 2001-03-05 2002-09-13 Sony Corp 権利処理促進装置、権利処理促進方法、権利処理促進プログラムおよび記録媒体
US7363278B2 (en) * 2001-04-05 2008-04-22 Audible Magic Corporation Copyright detection and protection system and method
US7328153B2 (en) * 2001-07-20 2008-02-05 Gracenote, Inc. Automatic identification of sound recordings
JP4468639B2 (ja) 2002-02-05 2010-05-26 パナソニック株式会社 Mpegipmpコンテンツにおける権利の分配形ipmp装置メッセージングおよび多重化の方法
US7502945B2 (en) 2002-06-28 2009-03-10 Microsoft Corporation Using a flexible rights template to obtain a signed rights label (SRL) for digital content in a rights management system
US7249060B2 (en) * 2002-08-12 2007-07-24 Paybyclick Corporation Systems and methods for distributing on-line content
MXPA05004472A (es) * 2002-10-28 2005-10-18 Gracenote Inc Sistema personal de grabacion de audio.
AU2002368387A1 (en) * 2002-11-28 2004-06-18 Agency For Science, Technology And Research Summarizing digital audio data
US7308573B2 (en) 2003-02-25 2007-12-11 Microsoft Corporation Enrolling / sub-enrolling a digital rights management (DRM) server into a DRM architecture
DE10313875B3 (de) * 2003-03-21 2004-10-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Analysieren eines Informationssignals
US7323629B2 (en) * 2003-07-16 2008-01-29 Univ Iowa State Res Found Inc Real time music recognition and display system
JP4212446B2 (ja) * 2003-09-30 2009-01-21 ヤマハ株式会社 カラオケ装置
JP2005115164A (ja) * 2003-10-09 2005-04-28 Denso Corp 楽曲検索装置
US20050086052A1 (en) * 2003-10-16 2005-04-21 Hsuan-Huei Shih Humming transcription system and methodology
JP2005141413A (ja) * 2003-11-05 2005-06-02 Sony Corp 情報処理装置及びその情報処理方法、並びにデータ通信システム及びデータ通信方法
US20080017017A1 (en) * 2003-11-21 2008-01-24 Yongwei Zhu Method and Apparatus for Melody Representation and Matching for Music Retrieval
WO2005079510A2 (en) 2004-02-17 2005-09-01 Auditude.Com, Inc. Generation of a media content database by correlating repeating media content in media streams
JP4333455B2 (ja) 2004-04-09 2009-09-16 ソニー株式会社 コンテンツ再生装置,プログラム及びコンテンツ再生制御方法
KR100676863B1 (ko) * 2004-08-31 2007-02-02 주식회사 코난테크놀로지 음악 검색 서비스 제공 시스템 및 방법
US20060095323A1 (en) 2004-11-03 2006-05-04 Masahiko Muranami Song identification and purchase methodology
US8660961B2 (en) * 2004-11-18 2014-02-25 Contentguard Holdings, Inc. Method, system, and device for license-centric content consumption
EP1785891A1 (en) * 2005-11-09 2007-05-16 Sony Deutschland GmbH Music information retrieval using a 3D search algorithm
US7711837B2 (en) * 2005-12-13 2010-05-04 Microsoft Corporation Transmission of business rules to portable devices
KR100749045B1 (ko) * 2006-01-26 2007-08-13 삼성전자주식회사 음악 내용 요약본을 이용한 유사곡 검색 방법 및 그 장치
SE0600243L (sv) * 2006-02-06 2007-02-27 Mats Hillborg Melodigenerator
US7555464B2 (en) * 2006-03-01 2009-06-30 Sony Corporation Multiple DRM management
US20070217648A1 (en) 2006-03-02 2007-09-20 Thomas Muehlbauer Fingerprinting Digital Media Content
US20070220592A1 (en) 2006-03-02 2007-09-20 Thomas Muehlbauer Comparing Media Files Against Database Content
US8324492B2 (en) 2006-04-21 2012-12-04 Vergence Entertainment Llc Musically interacting devices
US20070265969A1 (en) * 2006-05-15 2007-11-15 Apple Computer, Inc. Computerized management of media distribution agreements
US7707224B2 (en) * 2006-11-03 2010-04-27 Google Inc. Blocking of unlicensed audio content in video files on a video hosting website
AU2007316477A1 (en) * 2006-11-03 2008-05-15 Google Inc. Content management system
US20080228578A1 (en) 2007-01-25 2008-09-18 Governing Dynamics, Llc Digital rights management and data license management
KR20090000217A (ko) 2007-02-02 2009-01-07 홍현일 온라인을 통한 저작권관리 방법과 저작권관리 시스템
US7979464B2 (en) * 2007-02-27 2011-07-12 Motion Picture Laboratories, Inc. Associating rights to multimedia content
US20080240490A1 (en) * 2007-03-30 2008-10-02 Microsoft Corporation Source authentication and usage tracking of video
KR100862616B1 (ko) * 2007-04-17 2008-10-09 한국전자통신연구원 인덱스 정보를 이용한 오디오 핑거프린트 검색 시스템 및방법
WO2009020850A1 (en) 2007-08-03 2009-02-12 Infoflows Corporation Digital content management system and method
US8084677B2 (en) * 2007-12-31 2011-12-27 Orpheus Media Research, Llc System and method for adaptive melodic segmentation and motivic identification
DE102008013172B4 (de) * 2008-03-07 2010-07-08 Neubäcker, Peter Verfahren zur klangobjektorientierten Analyse und zur notenobjektorientierten Bearbeitung polyphoner Klangaufnahmen
JP2009244567A (ja) * 2008-03-31 2009-10-22 Brother Ind Ltd メロディライン特定システムおよびプログラム
US20090307409A1 (en) * 2008-06-06 2009-12-10 Apple Inc. Device memory management
US20100023328A1 (en) * 2008-07-28 2010-01-28 Griffin Jr Paul P Audio Recognition System
US8276184B2 (en) * 2008-08-05 2012-09-25 International Business Machines Corporation User-centric resource architecture
CN101493918A (zh) * 2008-10-21 2009-07-29 深圳市牧笛科技有限公司 在线音乐盗版监控方法和系统
US8364657B2 (en) 2008-10-31 2013-01-29 Disney Enterprises, Inc. System and method for providing media content
US8751494B2 (en) * 2008-12-15 2014-06-10 Rovi Technologies Corporation Constructing album data using discrete track data from multiple sources
CN102405495B (zh) 2009-03-11 2014-08-06 谷歌公司 使用稀疏特征对信息检索进行音频分类
US8168876B2 (en) * 2009-04-10 2012-05-01 Cyberlink Corp. Method of displaying music information in multimedia playback and related electronic device
US20120102516A1 (en) * 2009-08-12 2012-04-26 British Telecommunications Plc Communications system
US8049093B2 (en) * 2009-12-30 2011-11-01 Motorola Solutions, Inc. Method and apparatus for best matching an audible query to a set of audible targets
CN102236685A (zh) * 2010-05-07 2011-11-09 盛乐信息技术(上海)有限公司 一种基于音频指纹技术的本地音乐信息重获方法
US8158870B2 (en) * 2010-06-29 2012-04-17 Google Inc. Intervalgram representation of audio for melody recognition
US8495086B2 (en) * 2010-10-21 2013-07-23 International Business Machines Corporation Verifying licenses of musical recordings with multiple soundtracks

Also Published As

Publication number Publication date
KR20130131365A (ko) 2013-12-03
KR101489107B1 (ko) 2015-02-03
EP2638520A4 (en) 2014-05-21
US8584197B2 (en) 2013-11-12
WO2012064945A3 (en) 2012-07-05
CA2817340A1 (en) 2012-05-18
CN103314389B (zh) 2016-07-06
US20140040088A1 (en) 2014-02-06
WO2012064945A2 (en) 2012-05-18
US20120123831A1 (en) 2012-05-17
CN103314389A (zh) 2013-09-18
JP2014503871A (ja) 2014-02-13
US9142000B2 (en) 2015-09-22
EP2638520A2 (en) 2013-09-18

Similar Documents

Publication Publication Date Title
JP5726317B2 (ja) メロディ識別を使用するメディアの権利管理
JP5791730B2 (ja) メロディ認識およびオプトアウトを含むシンジケーション
EP3508986B1 (en) Music cover identification for search, compliance, and licensing
US20200058088A1 (en) Method and system for determining content treatment
US20160188979A1 (en) Method and system for audio-video signal processing
TW201947422A (zh) 基於區塊鏈的音樂原創性分析方法和裝置
US20170116694A1 (en) System and method for monitoring a digital work
US20210049509A1 (en) Blockchain-based method and apparatus for rewarding work performer
CN103975360A (zh) 视频站点上的音乐
US20110203004A1 (en) Method and System for Electronic Publishing and Distribution of Printed Sheet Music
US20220414808A1 (en) Methods, systems, and media for rights management of embedded sound recordings using composition clustering
JP7254376B2 (ja) アーティストアイディー統合管理のためのサーバー、システム、その方法
US11954147B1 (en) Methods, systems, and media for tracking content items
Rosenblatt THE GLOBAL DIGITAL MUSIC LANDSCAPE
KR20100007108A (ko) 온라인을 통한 디지털 컨텐츠의 판매중계시스템 및 그 방법
Blum et al. Audio Fingerprints: Technology and Applications
JP2002222287A (ja) 創作音楽作品の集中仲介方法、システム及び記録媒体
WO2002017169A1 (fr) Procede de courtage central d'oeuvres de creation musicales, systeme et support d'enregistrement

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140924

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140924

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20140924

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20141028

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20141104

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150204

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150303

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150331

R150 Certificate of patent or registration of utility model

Ref document number: 5726317

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250