JP2005322401A - メディア・セグメント・ライブラリを生成する方法、装置およびプログラム、および、カスタム・ストリーム生成方法およびカスタム・メディア・ストリーム発信システム - Google Patents

メディア・セグメント・ライブラリを生成する方法、装置およびプログラム、および、カスタム・ストリーム生成方法およびカスタム・メディア・ストリーム発信システム Download PDF

Info

Publication number
JP2005322401A
JP2005322401A JP2005136381A JP2005136381A JP2005322401A JP 2005322401 A JP2005322401 A JP 2005322401A JP 2005136381 A JP2005136381 A JP 2005136381A JP 2005136381 A JP2005136381 A JP 2005136381A JP 2005322401 A JP2005322401 A JP 2005322401A
Authority
JP
Japan
Prior art keywords
media
stream
segments
custom
generating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005136381A
Other languages
English (en)
Inventor
T Foote Jonathan
ティー. フート ジョナサン
Matthew Cooper
クーパー マシュー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Publication of JP2005322401A publication Critical patent/JP2005322401A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/22Means responsive to presence or absence of recorded information signals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/63Querying
    • G06F16/632Query formulation
    • G06F16/634Query by example, e.g. query by humming
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/63Querying
    • G06F16/635Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/63Querying
    • G06F16/638Presentation of query results
    • G06F16/639Presentation of query results using playlists
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/683Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying
    • G06F16/735Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7834Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using audio features
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • G11B27/031Electronic editing of digitised analogue information signals, e.g. audio or video signals
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/102Programmed access in sequence to addressed parts of tracks of operating record carriers
    • G11B27/105Programmed access in sequence to addressed parts of tracks of operating record carriers of operating discs
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • G11B27/30Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording on the same track as the main recording
    • G11B27/3027Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording on the same track as the main recording used signal is digitally coded

Abstract

【課題】 大量のメディア・データの管理機能を有用にサポートすることができるメディア・セグメント・ライブラリの生成、カスタム・ストリームの生成、カスタム・メディア・ストリームの発信を行う。
【解決手段】 本発明は、メディア・ストリームを受信し、該メディア・ストリーム内の1つ以上の境界ポイントを識別し、1つ以上の該境界ポイントに基づいて、複数のメディア・セグメントを生成する、ことによって、メディア・ストリームからメディア・セグメントのライブラリを生成する。
【選択図】 図2

Description

本発明は、ブロードキャストおよびストリーミング(送信)されるメディアの分析および構築に関する。詳細には、本発明は、メディア・ストリームからメディア・セグメントのライブラリを生成する方法、装置およびプログラム、および、メディア・セグメントを含むカスタム・ストリームを生成する方法およびカスタム・メディア・ストリームを発信するシステムに関する。
消費者が、大量のソフトウェアおよびデータ、特に、画像、音楽、およびビデオ・ファイル等のメディア・データを収集し記憶し始めてから、大容量データ記憶が安価にかつどこででもできるようになった。大容量データ記憶は、ブロードキャストまたはストリーミング(送信)された情報の受信、再生、および廃棄ばかりではなく、ブロードキャストまたはストリーミングされた情報の永久記憶を可能とする。例えば、MP3エンコーディングと組み合わされた160GB(ハード・)ディスクは、100日分のストリーミング・ソースの連続ステレオ・オーディオ、または20日分の5個のストリーミング・ソースの記憶ができる。その結果は、膨大なデジタル情報のコレクションとなり、「1」および「0」のほぼ理解できないブロックが作り出されるだろう。ブロードキャストされた特定の曲またはニュースを見付けることは、カード式目録なしに国会図書館内の本を探すのと同様にたいへんである。ストリームキャスト(Streamcast)またはストリームリッパー(StreamRipper)等の入手可能なツールは、メタ・データに依存してストリーミングされたブロードキャストの部分を識別するため、(これらが適用できるのは、)ストリーム内にエンコードされたメタ・データを有するストリーミングされたMP3に限定される。メタ・データ自体、ある場合には不完全または不正確であり、しばしば一貫していない。さらに、メタ・データがメディア・ストリーム内に含まれている場合には、作品を特徴付ける該メタ・データの能力は制限される。したがって、メタ・データのみでは、自動プレイリスト生成またはリズムの類似による曲の順序付け等の、他の多くの有用な管理機能をサポートしない。
特許文献1、信号のタイム−スケール変更に関する特許文献2、デジタル音声信号の編集点の識別に関する特許文献3、非特許文献1、非特許文献2、非特許文献3に記載されている技術は、本発明に関連する。
米国特許第6,542,869号明細書 米国特許第5,175,769号明細書 米国特許第5,227,892号明細書 カノら(Cano, et al.)、「オーディオ・フィンガープリントの検討(A Review of Audio Fingerprinting)」、マルチメディア信号処理(国際ワークショップ予稿集(International Workshop on Multimedia Signal Processing))、米国、2002年 シャイラーら(Scheirer et al.)、「ロバストな多特徴スピーチ/音楽弁別器の構築および評価(Construction and Evaluation for a Robust Multifeature Speech/Music Discriminator)」、ICASSP予稿集、ドイツ、1997年、頁1331〜1334 アレン P.、ダンネンベルグ R.(Allen P., Dannenberg R.)、「音楽ビートのリアル・タイム追跡 (Tracking Musical Beats in Real Time)」、国際コンピュータ音楽学会 (International Computer Music Associate) (国際コンピュータ音楽会議予稿集 (Proc. 1990 International Computer Music Conference))、1990年9月、頁140〜143
本発明の課題は、上記に鑑み、大量のメディア・データの管理機能を有用にサポートすることができるメディア・セグメント・ライブラリの生成、カスタム・ストリームの生成、カスタム・メディア・ストリームの発信を行うことである。
本発明の第1の態様のメディア・セグメント・ライブラリ生成方法は、メディア・ストリームからメディア・セグメントのライブラリを生成する方法であって、前記メディア・ストリームを受信し、前記メディア・ストリーム内の1つ以上の境界ポイントを識別し、1つ以上の前記境界ポイントに基づいて、複数のメディア・セグメントを生成する。
本発明の第2の態様は、第1の態様のメディア・セグメント・ライブラリ生成方法であって、1つ以上の境界ポイントを識別することが、新規閾値を定義し、前記メディア・ストリームと前記新規閾値と比較する、ことを含み、1つ以上の前記境界ポイントは前記新規閾値より大きい。ここで、用語「新規」は、変化の概念を含むものとする。
本発明の第3の態様は、第2の態様のメディア・セグメント・ライブラリ生成方法であって、メディア・ストリームを新規閾値と比較することが、前記メディア・ストリームの一部を複数のウィンドウとしてサンプリングし、複数の前記ウィンドウに対応する複数のベクトルを計算し、複数の前記ベクトルを使用してマトリックスを生成し、前記メディア・ストリームの一部の新規スコアを判断するために、前記マトリックスとカーネルとの積を計算し、前記メディア・ストリームの一部の前記新規スコアと前記新規閾値とを比較する、ことを含む。
本発明の第4の態様は、第1の態様のメディア・セグメント・ライブラリ生成方法であって、メディア・ストリームを受信することが、該メディア・ストリームをデコードする、ことを含む。
本発明の第5の態様は、第1の態様のメディア・セグメント・ライブラリ生成方法であって、前記メディア・ストリームがアナログ・ストリームおよびデジタル・ストリームの少なくとも一方である。
本発明の第6の態様は、第1の態様のメディア・セグメント・ライブラリ生成方法であって、複数の前記メディア・セグメントの少なくとも1つについてのメタ・データを識別し、前記メタ・データと、複数の前記メディア・セグメントの対応するメディア・セグメントと、を関連付ける、ことをさらに含む。
本発明の第7の態様は、第6の態様のメディア・セグメント・ライブラリ生成方法であって、メタ・データを識別することが、少なくとも1つの前記メディア・セグメントについての削減された表現を計算する、ことを含む。
本発明の第8の態様は、第7の態様のメディア・セグメント・ライブラリ生成方法であって、メタ・データを識別することが、削減された前記表現と、メタ・データ・データベースと、を比較する、ことをさらに含む。
本発明の第9の態様は、第6の態様のメディア・セグメント・ライブラリ生成方法であって、メタ・データを識別することが、少なくとも1つの前記メディア・セグメントについてのビート・スペクトルを計算する、ことを含む。
本発明の第10の態様は、第9の態様のメディア・セグメント・ライブラリ生成方法であって、メタ・データを識別することが、前記ビート・スペクトルと、メタ・データ・データベースと、を比較する、ことをさらに含む。
本発明の第11の態様は、第6の態様のメディア・セグメント・ライブラリ生成方法であって、関連付けられたメタ・データを有する少なくとも1つの前記メディア・セグメントと、メディア・セグメント・データベースに記憶されている少なくとも1つのメディア・セグメントと、を比較し、関連付けられたメタ・データを有する少なくとも1つの前記メディア・セグメントを、前記メディア・セグメント・データベースに加える、ことをさらに含む。
本発明の第12の態様は、第11の態様のメディア・セグメント・ライブラリ生成方法であって、少なくとも1つの前記メディア・セグメントを比較することが、少なくとも1つの前記メディア・セグメントについての削減された表現を計算し、少なくとも1つの前記メディア・セグメントについての削減された表現と、記憶されている少なくとも1つの前記メディア・セグメントの削減された表現と、を比較する、ことを含む。
本発明の第13の態様は、第11の態様のメディア・セグメント・ライブラリ生成方法であって、少なくとも1つの前記メディア・セグメントを比較することが、少なくとも1つの前記メディア・セグメントについてのビート・スペクトルを計算し、少なくとも1つの前記メディア・セグメントの前記ビート・スペクトルと、記憶されている複数のメディア・セグメントのビート・スペクトルと、を比較する、ことを含む。
本発明の第14の態様のカスタム・ストリーム生成方法は、1つ以上のメディア・ストリームからカスタム・ストリームを生成する方法であって、1つ以上の前記メディア・ストリームを受信し、1つ以上の前記メディア・ストリーム内の1つ以上の境界ポイントを識別し、1つ以上の前記境界ポイントに基づいて、複数のメディア・セグメントを生成し、複数の前記メディア・セグメントの1つ以上を識別し、1つ以上の前記メディア・セグメントの少なくとも1つのメディア・セグメントを選択し、少なくとも1つの前記メディア・セグメントを含むカスタム・ストリームを生成する。
本発明の第15の態様は、第14の態様のカスタム・ストリーム生成方法であって、前記カスタム・ストリームを発信する、ことをさらに含む。
本発明の第16の態様は、第14の態様のカスタム・ストリーム生成方法であって、1つ以上の境界ポイントを識別することが、新規閾値を定義し、前記メディア・ストリームと前記新規閾値とを比較する、ことを含み、1つ以上の前記境界ポイントは前記新規閾値より大きい。
本発明の第17の態様は、第16の態様のカスタム・ストリーム生成方法であって、メディア・ストリームと新規閾値とを比較することが、前記メディア・ストリームの一部を複数のウィンドウとしてサンプリングし、複数の前記ウィンドウに対応する複数のベクトルを計算し、複数の前記ベクトルを使用してマトリックスを生成し、前記メディア・ストリームの一部の新規スコアを判断するために、前記マトリックスとカーネルとの積を計算し、前記メディア・ストリームの一部の前記新規スコアと、前記新規閾値と、を比較する、ことを含む。
本発明の第18の態様は、第14の態様のカスタム・ストリーム生成方法であって、1つ以上のメディア・セグメントの少なくとも1つを選択することが、1つ以上の前記メディア・セグメントのテンポを測定し、前記テンポに基づいて、少なくとも1つのメディア・セグメントを選択する、ことを含む。
本発明の第19の態様は、第14の態様のカスタム・ストリーム生成方法であって、1つ以上のメディア・セグメントの少なくとも1つを選択することが、1つ以上の前記メディア・セグメントの1つ以上の特徴を測定し、1つ以上の前記特徴の少なくとも1つと基準との比較に基づいて、少なくとも1つのメディア・セグメントを選択する、ことを含む。
本発明の第20の態様は、第19の態様のカスタム・ストリーム生成方法であって、前記基準が、テンポ、発生頻度および、メディア・タイプ、の少なくとも1つを含む。
本発明の第21の態様は、第14の態様のカスタム・ストリーム生成方法であって、1つ以上の前記メディア・セグメントの少なくとも1つをフラグ付けし、少なくとも1つの前記メディア・セグメントの選択基準を識別する、ことをさらに含む。
本発明の第22の態様は、第21の態様のカスタム・ストリーム生成方法であって、1つ以上のメディア・セグメントの少なくとも1つを選択することが、1つ以上の前記メディア・セグメントと前記選択基準とを比較する、ことをさらに含む。
本発明の第23の態様は、第22の態様のカスタム・ストリーム生成方法であって、前記選択基準に基づいて1つ以上の前記メディア・セグメントを拒絶する、ことをさらに含む。
本発明の第24の態様のカスタム・メディア・ストリーム発信システムは、1つ以上のメディア・ストリームから生成されたカスタム・メディア・ストリームを発信するシステムであって、プロセッサと、音声出力装置と、を備え、前記プロセッサは、1つ以上の前記メディア・ストリームを複数のメディア・セグメントにセグメント化し、複数の前記メディア・セグメントの少なくとも1つを選択し、少なくとも1つの前記メディア・セグメントからカスタム・メディア・ストリームを生成し、前記音声出力装置は、前記カスタム・メディア・ストリームを出力する。
本発明の第25の態様は、第24の態様のカスタム・メディア・ストリーム発信システムであって、1つ以上の前記メディア・ストリームを受信する受信機をさらに備える。
本発明の第26の態様のメディア・セグメント・ライブラリ装置は、メディア・ストリームからメディア・セグメントのライブラリを生成する装置であって、前記メディア・ストリームを受信する受信手段と、前記メディア・ストリーム内の1つ以上の境界ポイントを識別する識別手段と、1つ以上の前記境界ポイントに基づいて、複数のメディア・セグメントを生成する生成手段と、を備える。
本発明の第27の態様のメディア・セグメント・ライブラリ生成プログラムは、メディア・ストリームを受信するステップと、前記メディア・ストリーム内の1つ以上の境界ポイントを識別するステップと、1つ以上の前記境界ポイントに基づいて、複数のメディア・セグメントを生成するステップと、を、プロセッサに実行させる。
本発明は、メディア・ストリームを受信し、該メディア・ストリーム内の1つ以上の境界ポイントを識別し、1つ以上の該境界ポイントに基づいて、複数のメディア・セグメントを生成するようにしているので、大量のメディア・データの管理機能を有用にサポートすることができるメディア・セグメント・ライブラリを生成することができる。
本発明の一実施形態におけるシステムは、1つ以上のメディア・ストリームから生成されたカスタム・メディア・ストリームを発信する。該システムは、プロセッサと、音声出力装置と、を備える。該プロセッサは、1つ以上の前記メディア・ストリームを複数のメディア・セグメントにセグメント化し、複数の前記メディア・セグメントの少なくとも1つを選択し、少なくとも1つの前記メディア・セグメントからカスタム・メディア・ストリームを生成する。該音声出力装置は、該カスタム・メディア・ストリームを出力する。
本発明の別の一実施形態における装置は、メディア・ストリームからメディア・セグメントのライブラリを生成する。該装置は、メディア・ストリームを受信する受信手段と、該メディア・ストリーム内の1つ以上の境界ポイントを識別する識別手段と、1つ以上の該境界ポイントに基づいて、複数のメディア・セグメントを生成する生成手段と、を備える。
上記システムおよび装置は、例えば、パーソナル・コンピュータ、ワーク・ステーションなどのコンピュータであってよく、また、パーソナル・メディア・プレーヤに埋め込まれているマイコンなどであってよい。該コンピュータは、処理および制御を行うプロセッサ、音楽ファイル、ビデオ・ファイル等のメディア・データやユーザの指示情報等を入力する入力部、プロセッサによる実行の際の作業領域を形成すると共にプログラムや処理対象としてのデータを格納する記憶部、及びデータを通信網などに出力する出力部などを含む。該コンピュータは処理内容や処理結果(処理結果等)を表示する表示部を含んでもよく、該表示部は、処理結果等の表示として、可視表示、可聴表示および永久可視表示のうち、少なくとも一つの表示を行うものであってよい。可視表示は、例えば、該表示装置の表示画面上に処理結果等を表示することでなされ、また、可聴表示は、例えば、スピーカ等の音声出力装置から処理結果等を音声で出力することによりなされる。永久可視表示は、例えば、印刷装置等の記録装置により、用紙等の記録媒体に該処理結果等を記録して出力することによりなされる。プロセッサは、プログラム(ソフトウェア)を読み出し実行することにより、処理対象のデータ等に対し当該プログラムの手順に対応した処理をする。
プロセッサは、本発明の受信手段、識別手段、生成手段であってよい。しかしながら、本発明は、パーソナル・コンピュータなどに限定されるものではない。本発明は、ハードウェアによって実現されることに限定されず、ソフトウェアによって実現されてもよいし、ファームウェアによって実現されてもよい。
本発明の詳細な実施の形態を、添付の図を参照して説明する。
(信号受信/信号デコーディング)
図1は、選択的再生を可能にし、削減されカスタマイズされたストリームを作成し、および/またはメディア・ライブラリを生成するための、本発明の1つの実施の形態によるシステムおよび方法のフローチャート100である。本発明のシステムおよび方法で使用されるメディア・ストリームは、例えば、地上波または衛星波受信機112を使用して、アナログまたはデジタル・ソースのいずれかから入手可能である。あるいは、メディア・ストリームは、インターネット120若しくはローカル・エリア・ネットワーク(LAN)を介して送信されるウェブ・テレビ放送(ウェブ放送)または他のブロードキャストを含んでもよい。
分析のためのデジタル・ストリームを作成するために、メディア・ストリームを捕捉し、デコードすることができる。例えば、アナログ・ラジオ(またはテレビ)放送を含むメディア・ストリームは、地上波受信機112によって捕捉され、アナログ/デジタル・コンバータを使用してデジタル化することができる。あるいは、エンコードされたデジタル・ブロードキャストは、地上波または衛星波受信機112によって捕捉され、ブロードキャスト・デコーダ114に供給され、有用なデジタル・ストリームに変換することができる。エンコードされたデジタル・ブロードキャストは、XMサテライト・ラジオ(XM Satellite Radio)またはダイレクトTV(Direct TV)等の契約サービスであってもよく、エンコードされたデジタル・ブロードキャストは、ローカル・テレビまたはラジオ局のデジタル・ブロードキャスト等の商業的なまたは公共のブロードキャスト・サービスであってもよい。あるいは、ウェブ放送またはオーディオ/ビデオ・ストリームを含むメディア・ストリームをストリーム・デコーダ122に供給することができる。ストリーム・デコーダ122は、メディア・ストリームをデコードおよび解凍および/またはさもなければ使用可能なデジタル・ストリームに調整することができる。ストリーム・デコーダ122は、単一のフォーマットを使用してエンコードされたストリームまたは異なるフォーマットを使用してエンコードされたストリームを、デコードすることができる。アナログまたはデジタルの圧縮または解凍されたストリームのいずれかまたは両方から作成されたデジタル・ストリームを、例えばプロセッサによって、分析およびセグメント化(116)することができる。
(ストリームのセグメント化)
デジタル・ストリームを一時的にセグメントに分割することによってデジタル・ストリームが管理されていることが好ましい。セグメントのグループに関連して、セグメントをより大きくクラスタリングし、識別可能としてもよいし、または、セグメントを個別に識別し、セグメント識別に基づいてクラスタリングしてもよい。セグメント境界は、任意の異なる技術を使用して、検出することができる。1つの実施の形態において、セグメント境界は、デジタル・ストリーム内の、エンコードされたメタ・データによってフラグ付けされた位置に対応可能である。メタ・データは、他のデータ(この場合ストリーミングされたビデオ又はオーディオ・クリップ)に関する情報を提供する定義データである。メタ・データはクリップに添付されており、コンテンツ、品質および条件、および/またはクリップの特徴についての記述的情報を含んでいてもよい。メタ・データの品質は、メタ・データのコンテンツのソースに依存し、実質的に変更可能である。メタ・データは、新しいクリップまたはメディアの部分の初めに、セグメント境界を示す、大まかなフラグを提供可能である。データ・ストリームが少なくとも部分的にエンコードされたメタ・データを含むことを要求するため、このような技術の応用は限られている。しかしながら、メタ・データが各オーディオまたはビデオ・クリップと関連しているところでは、本技術はシンプルであってもよい。
他の実施の形態において、デジタル・ストリームの短期エネルギーは、プレゼンテーションにおける、例えばある曲から他の曲への、変化から生ずる静寂に対応する、デジタル・ストリーム内の低出力の点について分析可能であり、データ・ストリームは、閾値より下の各識別された低出力の点においてセグメント化することができる。このような技術は、メディア・コンテンツ自体以外の情報に頼らず、それゆえ、使用可能なデジタル・ストリームに適切にデコードされ解凍された任意のメディア・ストリームに適用可能である。しかしながら、自動セグメント化技術は、スピーチと音楽とから構成されたコマーシャルをオーバー・セグメントしたり、同じアナウンサーが話したいくつかのレポートを含むニュース・ブロードキャストをアンダー・セグメントしたりする等、誤りを生じることがある。
さらに他の実施の形態において、デジタル・ストリームは、より高度な技術を使用して識別されるデジタル・ストリームの1つ以上の構造特性に基づいて、セグメント化可能である。例えば、特許文献1に記載されているように、変化または新規の点は、自己類似分析および/またはビート・スペクトル分析を使用して、デジタル・ストリーム内で識別可能である。自己類似分析は、時間順デジタル・ストリームの構造を分析するためのノン−パラメトリック手法である。図2は、このような分析を実行するためのステップを示すフローチャートである。デジタル・ストリームは、隣接したデータのブロックに依存せず、または関連して(例えば、ツリー構造を使用して)、のいずれかで、各ブロックが分析されてセグメント化され、暫定的にデータのブロックに分割可能である(ステップ200)。ブロックはタイム・ウィンドウ化可能であり(ステップ202)、ベクトル・パラメータ化値は各タイム・ウィンドウについて計算可能である(ステップ204)。ベクトル・パラメータ化は、多数の異なる技術を使用して計算可能である。例えば、ウィンドウ化されたデータは、短時間枠フーリエ変換(Short Time Frame Fourier Transform)(STFT)、または同様の周波数解析、メル周波数ケプストラル係数(Mel-Frequency Cepstral Coefficients)(MFCC)解析、スペクトログラム、ウェーブレット分解、または任意の他の既知のまたは今後開発される分析技術を使用して、パラメータ化可能である。パラメータ化値は、ブロックの1つおきのウィンドウに関連したブロックのいくつかまたは全てのウィンドウについて計算された2つの特徴ベクトル間の類似または非類似の測定を備える、二次元表現(すなわち、類似マトリックス)を構成するために、使用される(ステップ206)。類似の測定は、例えば、ユークリッド距離測定、ドット積、余弦角測定、ベクトル統計の関数(カルバック−ライブラー(Kullback-Leibler)距離等)、または情報ベクトルの類似を判断する任意の他の既知または今後開発される方法を備えていてもよい。図3を参照すると、類似マトリックスは、マトリックスの対角(すなわち、スーパー対角)に沿った要素D(i,j)が各要素それ自体への類似測定に対応するように、構成可能である。よって、ス−パ対角に沿って、自己類似が最大である。類似マトリックスは、セグメント境界の位置を絞り込むための多数の異なる分析を実行するための、有用なツールである。
1つの実施の形態において、自己類似マトリックスは、スーパー対角に近接したデータ・ポイントを有するカーネルの外積(cross-product)を計算することによって、チェッカーボード・カーネル(checkerboard kernel)に相関可能である。カーネルは小さくてもよく(例えば、2×2単位)、または(所望に応じて)大きくてもよい。小さいカーネルは短い時間単位で新規(変化)を検出する。これに対し、カーネルの寸法が増加すると時間解像度が減少され、検出可能な新規(変化)イベントの長さを増加させる。スーパー対角に沿って移動するカーネルの積(product)は、ベクトル距離のタイム−インデックス・プロットとしてプロット可能である(ステップ210)。ベクトル距離は、複数のウィンドウに近接した1つのウィンドウの非類似の大きさである(すなわち、新規(変化)の程度)。非類似の大きさが事前定義された新規(変化)閾値を越える場合には、そのウィンドウは、「新規(変化)」であるべき大きさにおいて十分に高い、すなわち新規(変化)ポイント(ステップ212)である、と言える。図4は、本発明の1つの実施の形態によって計算された、150秒の曲を構成するデータのブロックについての、例示的な新規(変化)プロットを示す。例えば、新規(変化)閾値が7.35の新規(変化)スコアとして定義されている場合には、5つの新規(変化)ポイント440が、150秒のブロック内で定義されるであろう。セグメント境界は、少なくともいくつかの新規(変化)ポイントによって定義可能である(ステップ214)。例えば、セグメント境界は、グローバル閾値を越える各新規(変化)ポイントまたはローカル閾値を越える新規(変化)ポイントの一部に対応可能である。ローカル閾値は、ブロックそれ自体内の新規(変化)の基準のある特徴によって、定義可能である。例えば、ブロックは、各セグメント境界が新規(変化)スコアの階層に基づいて定義されている最大数を越えることがないように、分割可能である。さらに、データが非常に大きなブロック、例えば1時間のストリーミングされた音楽、に分割されているところでは、新規(変化)ポイントは、大きな変化点を示す、有用なインデックスとしての役割を果たすことが可能である。新規(変化)ポイントは、最高点の新規(変化)ポイントがツリーのルートになり、ブロックを左右の部分に分割する、2値ツリー構造に構成可能である。左右の部分にある最高点のインデックス・ポイントは、ルート・ノードの左右の子になり、閾値を越える新規(変化)ポイントがなくなるまで、再帰的に繰り返される。ツリー構造は、新規(変化)ポイントのナビゲーションを容易にできる。さらに、ツリーは、所望の多数の新規(変化)ポイント(そしてそれゆえ、セグメント)を生じさせるために、任意の閾値レベルにおいて、切り取り可能である。さらに、ツリーは、ハード分割(hard division)としての役割を果たすことができる。ツリーを下ってツリーにかけられたカーネルの寸法が減ると、ツリーはハード分割の役割を果たすことができ、低レベル新規(変化)ポイントは次第に細かい時間精度を見せる。
他の実施の形態において、ビート追跡が、新規(変化)スコアを得るためのカーネル相関を実行する別の(または追加の)手段として、使用可能である。ビート追跡については、デジタル・ストリーム内のビートの周期性および相対的強度の両方を得ることができる。1つの実施の形態において、ビート・スペクトルは、図3の類似マトリックスを使用して生成可能であり、そのシンプルな予測は、デジタル・ストリーム内の基本的なリズムの周期性に対応するビート・スペクトル内のピークを伴う、経過(時間)(lag)の関数として自己類似の測定から識別されたスーパー(一つ上)対角およびサブ(一つ下)対角に沿って合計することによって、生成可能である(ステップ216)。他の実施の形態において、ビート・スペクトルは、類似マトリックの自己相関から得ることができる。より詳細な説明が、2003年4月1日出願の「リズムの類似により音楽を取り出し順序付ける方法およびシステム(Method and System for Retrieving and Sequencing Music by Rhythmic Similarity)」という名称の、米国特許出願第10/405,192号から得られる。図5は、データのブロックの一部の例示的なビート・スペクトル・プロットである。16音符でサブ−ハーモニックを有するフレーズの強い4音符の周期性ばかりでなく、各音符の周期性が見られる。ブロック内のビート・スペクトルにおける変化がセグメント境界を示すように、スペクトル特徴またはMFCCのように、ビート・スペクトルが特徴ベクトルとして使用可能である。ビート・スペクトルを狭いカーネル新規(変化)スコアと組み合せて使用すると、例えば音楽ストリーム内の音楽のテンポの推定値を与えることが可能である。音楽のテンポにおける変化が検出可能であり、特に音楽ストリームについて、適切にセグメント境界としての役割を果たすことが可能である。
さらに他の実施の形態において、聴覚または視覚作品(works)内または作品間の遷移を識別するための任意の他の技術が、デジタル・ストリームをセグメント化するために、適用可能である。このような技術は、セグメント化を、本発明による方法の他のステップ(例えば、セグメント化および識別)と組合せ可能である。例えば、スペクトル・ハッシングは、各クリップが一秒より小さい単位ではなく数秒の単位の比較的大きなウィンドウを有する重複するオーディオ・クリップに、実行可能である。スペクトル・ハッシングの結果はデータベースと比較可能であり、クリップは、例えば曲の一部として識別可能である。曲間に生じる遷移は、複雑かまたは要領を得ない結果によって識別可能であり、クリップはセグメント化のポイントとしての役割を果たすことができる。デジタル・ストリームをセグメント化する選ばれた方法は、メディア・ストリームのコンテンツに依存可能である。例えば、メディア・ストリームが上位40のブロードキャストを含むところではビート追跡とカーネル相関との組合せが好まれるかもしれないし、ストリーミングするMP3または関連したデジタル・メディアを有する他のオーディオ・データを含むことがメディア・ソースが知られているところでは、単純なメディア・データのセグメント化が好まれるかもしれない。本発明による方法およびシステムは、メディア・ストリームのコンテンツに適切であるとして、1つの技術または複数の技術の組合せをデジタル・ストリームに、選択的に適用することができる。
聴覚作品との関連で大まかに説明したが、データのブロックをセグメント化するための技術は、聴覚作品以外の時間順作品に適用可能である。例えば、このような技術は、映像と文章とを含むメディア・ストリームに適用可能である。2001年9月7日出願の米国特許出願第09/947,385号には、映像および文章情報のウィンドウ化およびパラメータ化が記載されている。例えば、映像情報は、映像情報の個別のフレームを選択し、および/または共に平均化されるフレームのグループを選択することによって、ウィンドウ化可能である。本発明による方法およびシステムは、任意のおよび全ての時間順作品に適用可能であり、聴覚作品のみに限定される、と解釈されるべきでない。
(セグメントの識別)
デジタル・ストリームがセグメント化されると、生じるセグメントは、より大きなセグメントのグループにクラスタリング可能である。セグメントは、時分割された繰り返されたセグメントを配置することとオーバー・セグメント化エラーを補正することとの両方のために、クラスタリング可能である。セグメント境界が与えられると、時間ではなくセグメントによってインデックス化された、低次元の完全な類似マトリクスが生成可能である。2002年10月15日出願の「デジタル・ファイルの要約(Summarization of Digital Files)」という名称の米国特許出願第10/271,407号に詳しく記載されているように、可変長セグメント間の類似が、統計的尺度を使用して推定される。セグメント類似マトリクスは、セグメントの各対間のセグメント間類似をセグメント・インデックス・マトリクス内に埋め込むことによって、生成される。セグメント間類似を判断するために、平均ベクトルと共分散マトリックスとが、各セグメントのスペクトル・データから計算可能である。セグメント間類似は、セグメントの各対についての平均ベクトルと共変数マトリックスとの間のカルバック・ライブラー(KL)距離を使用して、計算可能である。セグメントをクラスタリングするために、セグメント類似マトリックスは、繰り返されるかまたは略類似のセグメントのグループを見つけるために機能する。
フィンガープリント技術(例えば、非特許文献1)、あるいはグループ化されたセグメントをサーバ、ハード・ディスク・ドライブ等のアーカイブ内に記憶されたデータと比較することのいずれかを使用することによって、セグメントのグループは、識別可能である(図1:110)。フィンガープリント技術は、例えば、所与のオーディオ波形の削減された表示(例えば、スペクトル・ハッシュ)をこのような表示のデータベースと比較することによって、所与のオーディオ波形の同一のコピーを見つけることを含むことが可能である。シャザム(Shazam)等の外部データベース118が利用できるところでは、コンテンツを識別するために、グループ化されたセグメント上で適切なフィンガープリント分析が実行可能である。あるいは、グループ化されたセグメントが容易に識別できないところ、すなわち外部データベースが利用できないところ、またはそのように要望されているところでは、グループ化されたセグメントは、1つ以上のアーカイブされたクリップと比較可能である。このような比較は、各アーカイブされたクリップを有するグループ化されたセグメントのコンピュータによる集中的な分析、またはセグメント化若しくは各アーカイブされたメディア・クリップと関連した以前の分析からの結果を用いたフィンガープリント分析からのフィンガープリントから生じる特徴の低レベル比較を含んでいてもよい。例えば、各アーカイブされたメディア・クリップについてのスペクトル・ハッシュは、それぞれのクリップと関連し、グループ化されたセグメントのスペクトル・ハッシュの比較のために記憶されてもよい。あるいは、グループ化されたセグメントは、各アーカイブされたメディア・クリップと関連した検出された特徴(例えば、ビート追跡から生じたリズム)を使用することによって、識別可能である。例えば、ビート・スペクトルは、グループ化されたセグメントについて計算可能であり、各アーカイブされたメディア・クリップについて記憶されたビート・スペクトルと比較可能である。
他の実施の形態において、セグメント化の間に作成されたオリジナル・セグメントは、クラスタリングの前に識別可能である(図1:110)。グループ化されたセグメントと同様に、オリジナル・セグメントは、検出された特徴および外部データベース118からの象徴的な情報の1つまたは両方を使用して、識別可能である。しかしながら、フィンガープリントの効果は、オリジナル・セグメントが、時間において非常に近接して配置されているところでは、あまり明確でないかもしれない。例えば、1秒のセグメントは、10秒のセグメントに比べて識別がより難しいかもしれない。いくつかの実施の形態において、セグメント長が短かすぎて適格に識別できないと識別されているところでは、ローカルの新規(変化)閾値はツリー構造内の子に適用可能であり、あるいはグローバルの新規(変化)閾値は増加可能である。さらに他の実施の形態において、ブロックまたはブロック内の子はセグメント化および識別が可能であり、次に、セグメント識別の間の誤差率が余りにも高いところでは、再組立および再セグメント化が可能である。同様に、オリジナル・セグメントは検出された特徴を使用して識別可能であり、このような特徴データを記憶する外部データベースと比較可能である。上述のように、オリジナル・セグメントが容易に識別できないところでは、つまり外部データベースが利用できないところまたはそう要望されているところでは、オリジナル・セグメントは、1つ以上のアーカイブされたクリップと比較可能である。このような比較は、各アーカイブされたクリップを有するオリジナル・セグメントの分析、またはセグメント化若しくは各アーカイブされたメディア・クリップと関連した以前の分析からの結果を有するフィンガープリント分析からのフィンガープリントから生じる特徴の低レベル比較を含んでいてもよい。
象徴的データと特徴データとの結合は、ユーザのアプリケーションに従って可能である。例えば、セグメントは、データベースのような選択を使用して、アーティスト若しくはリズムまたはアーティストおよびリズムの両方によってランク付け可能である(例えば、最初にアーティストによって全てのセグメントを選択し、次にリズムによってランク付けする)。象徴的データまたは特徴データのいずれかがないばあいには、他のデータが適用可能である。オリジナル・セグメントが識別されると、そのセグメントは、セグメント間の関連性に基づいて、クラスタリング可能である。例えば、10のセグメントのストリングは、単一の曲の異なる部分(例えば、歌詞、コーラス)に関連付け可能である。セグメントは、その間の共通の関係、すなわちそれらが同じ曲の部分であるということ、に基づいてクラスタリング可能である。
(メディア・コレクションの構築)
上述のように、セグメント(またはセグメントのグループ)が識別されると、パーソナル・メディア・コレクション102のアーカイブされたセグメントとの比較が可能である。セグメントがアーカイブ102内に存在するところでは、セグメントについての情報が選択的に記録可能であり、そのセグメントは廃棄可能である。例えば、ラジオ・ブロードキャストをモニタするために本発明による方法およびシステムが適用されているところでは、セグメントが発生する都度セグメントをアーカイブせずに、プレイリストは、セグメントの発生頻度に注意しつつコンパイル可能である(ここで説明されたメディア・セグメントの選択的構成(例えば、プレイリストを作成し、ブラックリストを作り、カスタム・ストリームを作る等)はブロック106内に適用される)。いくつかの実施の形態において、セグメントがアーカイブ102内に存在しないところでは、セグメントは、アーカイブ102に単に追加可能である。他の実施の形態において、セグメントが「望まれているか」について判断するために、基準がセグメントに適用される。例えば、ビット追跡を同様のテンポまたはリズムを有するカーネル相関トラックと組み合わせることによってアーカイブが可能であり、プレイリストに追加可能である。ユーザは、140bpmを越える任意のセグメントが全体の流れを損なうおそれがあり、それゆえ望まれていないと判断してもよい。例えば本発明による方法がアップルのアイポッド(Apple iPod)等のパーソナル・メディア・プレーヤに適用されているところでは、このような基準は貴重となる。早いペースの「トレーニング(work−out)」音楽のみがユーザのアイポッド(iPod)に搭載されていることを音楽ユーザは望んでいるかもしれない。さらに他の実施の形態において、セグメントは、非特許文献2に記載されたスピーチおよび音楽分類器を通じてフィルタリングされてもよく、全ての識別されたスピーチが廃棄可能である。モニタされたラジオ・ブロードキャストが上位40ブロードキャストであり、ユーザが、任意の他の繰り返されたセグメントばかりでなく、DJの声、広告、その他を廃棄したいと望む場合には、このようなフィルターは有用である。
本発明の実施の形態による方法は、1つ以上の放送局からのラジオ・ブロードキャストを同時に連続してモニタし、放送局のプレイリストをアーカイブし、セグメントを選択するために、システムによって適用可能である。プレイリストは、各曲がどのくらい頻繁に演奏されるかの測定を有する、1つ以上の放送局で演奏された全ての歌の識別を含むことが可能である。1つの実施の形態において、データベース内の全ての曲は、データベース・キーの役割を果たすことが可能なユニークな数値識別子によって表示可能である。入ってくる曲がデータベース内の曲と一致する場合には、そのキーに関連したカウントはインクリメントされ、曲がブロードキャストされた時間は、ブロードキャスト・チャネルまたはソース識別子と共に、データベース内にセーブ可能である。チャネルのプレイリスト内の曲の相対周波数は、最初と最新のブロードキャスト時間との間の時差によって、ブロードキャスト・カウントを除算することによって、推定可能である。相対周波数は、また、同様の時間範囲にわたる異なるチャネルからのカウントを合計することによって、複数の入力チャネルにわたって計算可能である。本システムは、DJまたはコマーシャルの妨害なしに、ユーザがプレイリストに他の曲を加えるかまたはプレイリストから削除するばかりでなく、任意の特定の曲についての繰返し頻度を無効にできるという追加の利点を伴って、類似の放送を生成可能である。さらに、本システムは、ユーザに望んだ基準を満足する任意の新曲を報知するか、またはメタ・データまたは音声分析に基づいて任意の自動プレイリストにその曲を加えるようユーザに報知することができる。生成されたブロードキャストは、リアル−タイムで、あるいは、(時間)遅延されて、スピーカ(音声出力装置)104を通じて音声として出力され、および/または生成されたブロードキャストは後のアクセスおよび使用のために記憶可能である。
本発明による方法およびシステムは、アプリケーションの多様性を可能にするために、メディア・ストリームおよび/またはメディア・クリップのアーカイブに適用可能である。例えば、システムは、CD−ROM、CD−RW、DVD−ROM等の光学メディア・ソースを含んでいてもよい。CDリッパー108アプリケーションは、パーソナル・メディア・コレクション102をコンパイルするための音楽の追加のソースとして、システム内に組込み可能である。このようなアプリケーションは、メディア・ソースからトラックを識別するために、グレイスノートCDDB(Gracenote CDDB)等の外部データベース118にアクセス可能である。多くのCDに録音されているトラックは、トラックによってセグメント化されており、それゆえ、セグメント化分析を必要としないことが好適である。限定された容量のメディア(例えば、CD−R)上の記憶用にプレイリストをコンパイルするためにパーソナル・メディア・コレクションが使用されているところでは、本発明による方法は、リズムが類似したパーソナル音楽コレクションから多数のトラックを選択するか、または、メデイア上の記憶のために1つ以上のトラックをユーザが選択したいと考える場合に、適用可能である。このようなアプリケーションは、CD−Rまたはパーソナル音楽プレーヤ上の余分なスペースを利用するため、有用である。余分なトラックを自動的に提案することは、さもなければ無駄にしたであろう記憶領域を充たし、主題が一貫した記録または曲コレクションを生じさせる。
本発明のシステムおよび方法の他の実施の形態においては、パーソナル音楽コレクションが、ストリーミング・オーディオ・ソースとして「バックグラウンド」で再生可能である。自動トラック選択および順序付けは、トラック選択または順序付けに対するユーザの干渉なしに、ユーザのパーソナル音楽コレクションからの継ぎ目なしの混合を生成する。既存のメディア・プレーヤの「シャッフル」性能と異なり、音声およびリズムの類似によって音楽を順序付けることによって、不快な遷移のないことを保証するために、この機能は調整可能である。簡単なフィードバック性能が与えられると、本システムは、位置および時間に適合したユーザの好みを学習でき、要求に適合するように音楽を自動的に選択可能である。このアプリケーションは、「ハンド・オフ」機能が必要とされる(例えば、運動中のユーザの)パーソナル・オーディオ・プレーヤに特に適している。
さらに他の実施の形態において、本発明のシステムおよび方法は、自動車等の特定の環境に適合するように適用可能である。リアル−タイム情報がより重要であるから、所望の機能を可能にするために丁度十分な遅延を使用して、入ってくるブロードキャストはバッファ可能である。5分のバッファが与えられると、コマーシャルのスキップおよび「最後の10秒再生」のような直接的な機能が容易に実行可能である。曲検出および置換のような他の機能も可能であるが、「デッド・エア」なしに連続的に放送を実行するために、(所望の機能に応じて)タイム・スケール修正が必要である。交通情報、天気、またはニュース・ヘッドラインのようなリアル−タイム情報は、通勤者に特に重要である。本発明による方法は、特にメディア・クリップが既知の時間に生じる場合には、このようなメディア・クリップを自動的に検出してバッファするように適用可能である。よって、ボタンを触るだけで交通情報が入手でき、リアル−タイム・ニュース放送は、バッファされたストリーム内に挿入可能である。
音楽リテイル・ウェブサイトまたはレコード店は、本発明による方法およびシステムがさらに適用可能な環境である。ユーザが、大量のデジタル・オーディオをスキミングすることを望むことは、次第に一般的になってきている。音楽リテイル・ウェブサイトは試聴のために利用できる大量の音声を作り、現在のオーディオ・サーチ・エンジンに与える。したがって、ユーザの情報ニーズを満たすか否か判断するために、場合によっては多数の音声(結果)が試聴されなければならない。本発明による方法およびシステムは、音楽をブラウジングおよびスキミングするための迅速な方法を提供する。セグメント化116を通じて、歌詞およびリフレイン等の曲の中の重要な部分が、確実かつ自動的に取出し可能である。「次の楽節へのスキップ」機能は、曲の重要な部分を迅速に聴くことができるようにするが、これは現在の技術では不可能である。例えば、ユーザは、ある曲がラジオで一度だけ聞いて覚えた曲であるかを確認したくなることがある(ラジオには本発明の方法を適用するための、それによって曲目がコンパイル可能である、システムが設けられていないと仮定する)。そのユーザは、特定のリフレインまたは「興味を引くもの(フック)(hook)」のみを覚えていて、ゆっくりした導入部は聴き慣れない(または聞き漏らした)かも知れない。「次の楽節へのスキップ」・ボタンを使用すると、ユーザは迅速にフックを含むコーラスを検出することができる。曲が覚えていたものでない場合には、ユーザは、曲全体を聞く時間を取らずに、曲の最も重要な部分を聴いたことを確信できる。さらに、このようなメディア試聴は、そこではファイルが切り取られているかまたは不完全にエンコードされているか、あるいは偶然または故意に誤ったラベルが添付されていて、品質がしばしば疑わしい、ピアー・ツー・ピアー・サービスを通じて利用できるメディアを走査するために、有用である。
リオ(Rio)またはアップルのアイポッド(Apple iPod)等のハンドヘルド圧縮オーディオ・プレーヤが激増し、ジムでのトレーニングからクロス−カントリー旅行まで、種々の環境で使用されている。すでに、小さな装置が、一般的なユーザのCDコレクション全体(まさに数週間途切れないだけの音楽)を、容易に記憶できる。非常にサイズ制限されたユーザ・インタフェースと組み合わされたこの巨大な記憶容量は、新規の自動データ管理技術のための強力な論拠となる。本発明による方法は、自動プレイリストを生成するために適用可能であり、所望の音楽を見つけて予約するという必要性からユーザを解放する。ユーザは各曲の終わりで装置に注意する必要がないから、リズムの類似によって音楽を自動的に順序付けることは、ハンドオフ動作の利点を提供する。運動またはスポーツ用には、リズムの類似測定は、加速度計または類似の装置によって決定されたユーザの運動速度と適合したテンポを有する音楽を選択できる。さらに、ほぼ全てのプレーイヤがファイル交換のためにPCと接続(interface)するから、コンピュータにより集中したインデックス・タスクが、ホスト・コンピュータ上で実行可能である。この場合には、インデックス結果(ビート追跡等の)は、事前計算可能であり、後で使用するために装置に転送可能である。よって、追加機能をサポートするためには、わずかのハードウェアまたはソフトウェアだけが必要とされ、単価を低く抑えることが常に望まれる(一般)消費者(向)製品において、このことは重要であると考えられる。
さらに他の実施の形態において、本発明による方法およびシステムは、ユーザの嗜好を予想するように適用可能である。多くの音楽需要者は、彼らが好む音楽について強い好みを有する。「自動ブラックリスト」機能は、嫌いな歌、アーティスト、またはジャンルの音声的特徴を学習するために、ユーザのフィードバックを適用可能である。例えば、ボタン等の簡単なインターフェースが、嫌いな作品の再生中に押圧可能であり、代わりの作品(例えば、プレイリスト中の次の作品)が、すぐに置換可能である。嫌いな作品は、「フラグ付け」あるいは分析のために識別可能であり、フラグ付けされた作品の特徴をブラックリストに加えることによって、ブラックリストを生成および更新可能である。ブラックリストは、多数の機能について、使用可能である。すなわち、ブラックリストを使用して生成された拒否基準に基づいて作品を廃棄すること、プレイリストに優先順位を付けること、望ましくない検索結果を隠すこと、ブロードキャストされた音声から拒否基準に基づいてリアル−タイムに「不要部分を削除すること(sanitizing)」を実行すること、である。適切なバッファが与えられると、ブラックリストに載せられた歌は、ブロードキャストの採取の間に、あるいはリアル−タイム放送の間でさえ、検出および置換可能である。逆に、好まれた作品はフラグ付け可能であり、フラグ付けされた作品の特徴をホワイトリストに加えることによって、ホワイトリストを生成および更新可能である。ホワイトリストは、同様に、多数の機能のために使用可能である。すなわち、ホワイトリストを使用して好まれた基準に基づいて作品を記憶すること、プレイリストに優先順位を付けること、優先的に望ましい検索結果をリストアップすること、ブロードキャストされた音声を好まれた基準に基づいて、作品を置き換えまたは拒否するのではなく、受け入れることによって、リアル−タイムで不要部分削除を実行することである。
本発明の上記の記述は、説明および記述の目的のためになされている。本発明を網羅すること、または、開示された正確な形状に限定することは意図されていない。多くの修正および変更が、当業者には明らかであろう。これらの実施の形態は、本発明の原理を最もよく説明するために、選択され記述された。また、その実用化により、種々の実施の形態について、他の当業者が、意図された特定の使用に適合した種々の修正と共に本発明を理解できるようにする。本発明の範囲は、次の特許請求の範囲とそれらの等価物とによって定義されるように、意図されている。
本発明の実施の形態によるメディア・ライブラリを生成するシステムおよび方法を示すフローチャートである。 デジタル・ストリームから得られたデータ・ブロックをセグメント化するための技術を示すフローチャートである。 図2に示された例示的な技術を用いて使用される類似マトリックス・データ構造を示す。 デジタル・ストリームから得られたデータ・ブロックについて計算された新規(変化)スコアの例示的なプロットである。 デジタル・ストリームから得られたデータ・ブロックについて計算されたビート・スペクトルの例示的なプロットである。
符号の説明
100 システム
104 スピーカ
112 受信機
114 ブロードキャスト・デコーダ
118 データベース
120 インターネット
122 ストリーム・デコーダ

Claims (27)

  1. メディア・ストリームからメディア・セグメントのライブラリを生成する方法であって、
    前記メディア・ストリームを受信し、
    前記メディア・ストリーム内の1つ以上の境界ポイントを識別し、
    1つ以上の前記境界ポイントに基づいて、複数のメディア・セグメントを生成する、
    メディア・セグメント・ライブラリ生成方法。
  2. 1つ以上の境界ポイントを識別することが、
    新規閾値を定義し、
    前記メディア・ストリームと前記新規閾値と比較する、
    ことを含み、
    1つ以上の前記境界ポイントは前記新規閾値より大きい、
    請求項1に記載のメディア・セグメント・ライブラリ生成方法。
  3. メディア・ストリームを新規閾値と比較することが、
    前記メディア・ストリームの一部を複数のウィンドウとしてサンプリングし、
    複数の前記ウィンドウに対応する複数のベクトルを計算し、
    複数の前記ベクトルを使用してマトリックスを生成し、
    前記メディア・ストリームの一部の新規スコアを判断するために、前記マトリックスとカーネルとの積を計算し、
    前記メディア・ストリームの一部の前記新規スコアと前記新規閾値とを比較する、
    ことを含む、
    請求項2に記載のメディア・セグメント・ライブラリ生成方法。
  4. メディア・ストリームを受信することが、該メディア・ストリームをデコードする、ことを含む、請求項1に記載のメディア・セグメント・ライブラリ生成方法。
  5. 前記メディア・ストリームがアナログ・ストリームおよびデジタル・ストリームの少なくとも一方である、請求項1に記載のメディア・セグメント・ライブラリ生成方法。
  6. 複数の前記メディア・セグメントの少なくとも1つについてのメタ・データを識別し、
    前記メタ・データと、複数の前記メディア・セグメントの対応するメディア・セグメントと、を関連付ける、
    ことをさらに含む、請求項1に記載のメディア・セグメント・ライブラリ生成方法。
  7. メタ・データを識別することが、少なくとも1つの前記メディア・セグメントについての削減された表現を計算する、ことを含む、請求項6に記載のメディア・セグメント・ライブラリ生成方法。
  8. メタ・データを識別することが、削減された前記表現と、メタ・データ・データベースと、を比較する、ことをさらに含む、請求項7に記載のメディア・セグメント・ライブラリ生成方法。
  9. メタ・データを識別することが、少なくとも1つの前記メディア・セグメントについてのビート・スペクトルを計算する、ことを含む、請求項6に記載のメディア・セグメント・ライブラリ生成方法。
  10. メタ・データを識別することが、前記ビート・スペクトルと、メタ・データ・データベースと、を比較する、ことをさらに含む、請求項9に記載のメディア・セグメント・ライブラリ生成方法。
  11. 関連付けられたメタ・データを有する少なくとも1つの前記メディア・セグメントと、メディア・セグメント・データベースに記憶されている少なくとも1つのメディア・セグメントと、を比較し、
    関連付けられたメタ・データを有する少なくとも1つの前記メディア・セグメントを、前記メディア・セグメント・データベースに加える、
    ことをさらに含む、請求項6に記載のメディア・セグメント・ライブラリ生成方法。
  12. 少なくとも1つの前記メディア・セグメントを比較することが、
    少なくとも1つの前記メディア・セグメントについての削減された表現を計算し、
    少なくとも1つの前記メディア・セグメントについての削減された表現と、記憶されている少なくとも1つの前記メディア・セグメントの削減された表現と、を比較する、
    ことを含む、
    請求項11に記載のメディア・セグメント・ライブラリ生成方法。
  13. 少なくとも1つの前記メディア・セグメントを比較することが、
    少なくとも1つの前記メディア・セグメントについてのビート・スペクトルを計算し、
    少なくとも1つの前記メディア・セグメントの前記ビート・スペクトルと、記憶されている複数のメディア・セグメントのビート・スペクトルと、を比較する、
    ことを含む、
    請求項11に記載のメディア・セグメント・ライブラリ生成方法。
  14. 1つ以上のメディア・ストリームからカスタム・ストリームを生成する方法であって、
    1つ以上の前記メディア・ストリームを受信し、
    1つ以上の前記メディア・ストリーム内の1つ以上の境界ポイントを識別し、
    1つ以上の前記境界ポイントに基づいて、複数のメディア・セグメントを生成し、
    複数の前記メディア・セグメントの1つ以上を識別し、
    1つ以上の前記メディア・セグメントの少なくとも1つのメディア・セグメントを選択し、
    少なくとも1つの前記メディア・セグメントを含むカスタム・ストリームを生成する、
    カスタム・ストリーム生成方法。
  15. 前記カスタム・ストリームを発信する、ことをさらに含む、請求項14に記載のカスタム・ストリーム生成方法。
  16. 1つ以上の境界ポイントを識別することが、
    新規閾値を定義し、
    前記メディア・ストリームと前記新規閾値とを比較する、
    ことを含み、
    1つ以上の前記境界ポイントは前記新規閾値より大きい、
    請求項14に記載のカスタム・ストリーム生成方法。
  17. メディア・ストリームと新規閾値とを比較することが、
    前記メディア・ストリームの一部を複数のウィンドウとしてサンプリングし、
    複数の前記ウィンドウに対応する複数のベクトルを計算し、
    複数の前記ベクトルを使用してマトリックスを生成し、
    前記メディア・ストリームの一部の新規スコアを判断するために、前記マトリックスとカーネルとの積を計算し、
    前記メディア・ストリームの一部の前記新規スコアと、前記新規閾値と、を比較する、
    ことを含む、
    請求項16に記載のカスタム・ストリーム生成方法。
  18. 1つ以上のメディア・セグメントの少なくとも1つを選択することが、
    1つ以上の前記メディア・セグメントのテンポを測定し、
    前記テンポに基づいて、少なくとも1つのメディア・セグメントを選択する、
    ことを含む、
    請求項14に記載のカスタム・ストリーム生成方法。
  19. 1つ以上のメディア・セグメントの少なくとも1つを選択することが、
    1つ以上の前記メディア・セグメントの1つ以上の特徴を測定し、
    1つ以上の前記特徴の少なくとも1つと基準との比較に基づいて、少なくとも1つのメディア・セグメントを選択する、
    ことを含む、
    請求項14に記載のカスタム・ストリーム生成方法。
  20. 前記基準が、テンポ、発生頻度および、メディア・タイプ、の少なくとも1つを含む、請求項19に記載のカスタム・ストリーム生成方法。
  21. 1つ以上の前記メディア・セグメントの少なくとも1つをフラグ付けし、
    少なくとも1つの前記メディア・セグメントの選択基準を識別する、
    ことをさらに含む、請求項14に記載のカスタム・ストリーム生成方法。
  22. 1つ以上のメディア・セグメントの少なくとも1つを選択することが、
    1つ以上の前記メディア・セグメントと前記選択基準とを比較する、
    ことをさらに含む、
    請求項21に記載のカスタム・ストリーム生成方法。
  23. 前記選択基準に基づいて1つ以上の前記メディア・セグメントを拒絶する、ことをさらに含む、請求項22に記載のカスタム・ストリーム生成方法。
  24. 1つ以上のメディア・ストリームから生成されたカスタム・メディア・ストリームを発信するシステムであって、
    プロセッサと、
    音声出力装置と、
    を備え、
    前記プロセッサは、
    1つ以上の前記メディア・ストリームを複数のメディア・セグメントにセグメント化し、
    複数の前記メディア・セグメントの少なくとも1つを選択し、
    少なくとも1つの前記メディア・セグメントからカスタム・メディア・ストリームを生成し、
    前記音声出力装置は、前記カスタム・メディア・ストリームを出力する、
    カスタム・メディア・ストリーム発信システム。
  25. 1つ以上の前記メディア・ストリームを受信する受信機をさらに備える、請求項24に記載のカスタム・メディア・ストリーム発信システム。
  26. メディア・ストリームからメディア・セグメントのライブラリを生成する装置であって、
    前記メディア・ストリームを受信する受信手段と、
    前記メディア・ストリーム内の1つ以上の境界ポイントを識別する識別手段と、
    1つ以上の前記境界ポイントに基づいて、複数のメディア・セグメントを生成する生成手段と、
    を備える、メディア・セグメント・ライブラリ生成装置。
  27. メディア・ストリームを受信するステップと、
    前記メディア・ストリーム内の1つ以上の境界ポイントを識別するステップと、
    1つ以上の前記境界ポイントに基づいて、複数のメディア・セグメントを生成するステップと、
    を、プロセッサに実行させる、メディア・セグメント・ライブラリ生成プログラム。
JP2005136381A 2004-05-07 2005-05-09 メディア・セグメント・ライブラリを生成する方法、装置およびプログラム、および、カスタム・ストリーム生成方法およびカスタム・メディア・ストリーム発信システム Pending JP2005322401A (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US10/841,082 US20050249080A1 (en) 2004-05-07 2004-05-07 Method and system for harvesting a media stream

Publications (1)

Publication Number Publication Date
JP2005322401A true JP2005322401A (ja) 2005-11-17

Family

ID=35239324

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005136381A Pending JP2005322401A (ja) 2004-05-07 2005-05-09 メディア・セグメント・ライブラリを生成する方法、装置およびプログラム、および、カスタム・ストリーム生成方法およびカスタム・メディア・ストリーム発信システム

Country Status (2)

Country Link
US (1) US20050249080A1 (ja)
JP (1) JP2005322401A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008146616A1 (ja) * 2007-05-25 2008-12-04 Nec Corporation 画像音響区間群対応付け装置と方法およびプログラム
JP2012512444A (ja) * 2008-12-17 2012-05-31 トムソン ライセンシング データ管理装置、データ管理方法及びデータ管理プログラム

Families Citing this family (79)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9008812B2 (en) 2008-06-19 2015-04-14 Sirius Xm Radio Inc. Method and apparatus for using selected content tracks from two or more program channels to automatically generate a blended mix channel for playback to a user upon selection of a corresponding preset button on a user interface
US8223975B2 (en) * 2008-06-19 2012-07-17 Xm Satellite Radio Inc. Method and apparatus for multiplexing audio program channels from one or more received broadcast streams to provide a playlist style listening experience to users
US7680849B2 (en) 2004-10-25 2010-03-16 Apple Inc. Multiple media type synchronization between host computer and media device
US7827259B2 (en) 2004-04-27 2010-11-02 Apple Inc. Method and system for configurable automatic media selection
US9715500B2 (en) 2004-04-27 2017-07-25 Apple Inc. Method and system for sharing playlists
US7797446B2 (en) 2002-07-16 2010-09-14 Apple Inc. Method and system for updating playlists
US9412417B2 (en) 2002-04-05 2016-08-09 Apple Inc. Persistent group of media items for a media device
US7668842B2 (en) 2002-10-16 2010-02-23 Microsoft Corporation Playlist structure for large playlists
US7054888B2 (en) * 2002-10-16 2006-05-30 Microsoft Corporation Optimizing media player memory during rendering
US8346157B1 (en) 2004-06-16 2013-01-01 Colby Steven M Content customization in asymmertic communication systems
US8261246B1 (en) 2004-09-07 2012-09-04 Apple Inc. Method and system for dynamically populating groups in a developer environment
US7610011B2 (en) * 2004-09-19 2009-10-27 Adam Albrett Providing alternative programming on a radio in response to user input
DE102004047069A1 (de) * 2004-09-28 2006-04-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Ändern einer Segmentierung eines Audiostücks
DE102004047032A1 (de) * 2004-09-28 2006-04-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Bezeichnen von verschiedenen Segmentklassen
US20060080356A1 (en) * 2004-10-13 2006-04-13 Microsoft Corporation System and method for inferring similarities between media objects
JP4243862B2 (ja) * 2004-10-26 2009-03-25 ソニー株式会社 コンテンツ利用装置およびコンテンツ利用方法
US7752548B2 (en) * 2004-10-29 2010-07-06 Microsoft Corporation Features such as titles, transitions, and/or effects which vary according to positions
US9420021B2 (en) * 2004-12-13 2016-08-16 Nokia Technologies Oy Media device and method of enhancing use of media device
US7490775B2 (en) 2004-12-30 2009-02-17 Aol Llc, A Deleware Limited Liability Company Intelligent identification of multimedia content for synchronization
US7958441B2 (en) * 2005-01-07 2011-06-07 Apple Inc. Media management for groups of media items
US11314378B2 (en) 2005-01-07 2022-04-26 Apple Inc. Persistent group of media items for a media device
JP4247626B2 (ja) * 2005-01-20 2009-04-02 ソニー株式会社 再生装置および再生方法
JP4595555B2 (ja) * 2005-01-20 2010-12-08 ソニー株式会社 コンテンツ再生装置およびコンテンツ再生方法
US20060173692A1 (en) * 2005-02-03 2006-08-03 Rao Vishweshwara M Audio compression using repetitive structures
US7756388B2 (en) * 2005-03-21 2010-07-13 Microsoft Corporation Media item subgroup generation from a library
JP4741267B2 (ja) * 2005-03-28 2011-08-03 ソニー株式会社 コンテンツ推薦システム、通信端末およびコンテンツ推薦方法
US20060271855A1 (en) * 2005-05-27 2006-11-30 Microsoft Corporation Operating system shell management of video files
JP2007011928A (ja) * 2005-07-04 2007-01-18 Sony Corp コンテンツ提供システム、コンテンツ提供装置、コンテンツ配信サーバ、コンテンツ受信端末およびコンテンツ提供方法
JP4696734B2 (ja) * 2005-07-06 2011-06-08 ソニー株式会社 コンテンツデータ再生装置及びコンテンツデータ再生方法
JP5133508B2 (ja) 2005-07-21 2013-01-30 ソニー株式会社 コンテンツ提供システム、コンテンツ提供装置、コンテンツ配信サーバ、コンテンツ受信端末およびコンテンツ提供方法
US9230029B2 (en) * 2005-07-26 2016-01-05 Creative Technology Ltd System and method for modifying media content playback based on an intelligent random selection
US7739599B2 (en) * 2005-09-23 2010-06-15 Microsoft Corporation Automatic capturing and editing of a video
US7937422B1 (en) 2005-11-03 2011-05-03 Aol Inc. Digital asset hosting and distribution
JP4654896B2 (ja) * 2005-12-06 2011-03-23 ソニー株式会社 オーディオ信号の再生装置および再生方法
US20070136741A1 (en) * 2005-12-09 2007-06-14 Keith Stattenfield Methods and systems for processing content
JP4264752B2 (ja) * 2005-12-16 2009-05-20 ソニー株式会社 オーディオ信号の再生機および再生方法
US7882435B2 (en) * 2005-12-20 2011-02-01 Sony Ericsson Mobile Communications Ab Electronic equipment with shuffle operation
DE602007001281D1 (de) * 2006-01-20 2009-07-30 Yamaha Corp Vorrichtung zur Steuerung der Wiedergabe von Musik und Vorrichtung zur Wiedergabe von Musik
JP4811046B2 (ja) * 2006-02-17 2011-11-09 ソニー株式会社 コンテンツの再生装置、オーディオ再生機およびコンテンツの再生方法
JP4356700B2 (ja) * 2006-02-21 2009-11-04 ソニー株式会社 再生装置
US20070239780A1 (en) * 2006-04-07 2007-10-11 Microsoft Corporation Simultaneous capture and analysis of media content
US7945142B2 (en) * 2006-06-15 2011-05-17 Microsoft Corporation Audio/visual editing tool
US20080030456A1 (en) * 2006-07-19 2008-02-07 Sony Ericsson Mobile Communications Ab Apparatus and Methods for Providing Motion Responsive Output Modifications in an Electronic Device
US20080091717A1 (en) * 2006-09-27 2008-04-17 Zachary Adam Garbow Generation of Collaborative Playlist Based Upon Musical Preference Data from Multiple Digital Media Players
US8375302B2 (en) * 2006-11-17 2013-02-12 Microsoft Corporation Example based video editing
US20100077002A1 (en) * 2006-12-06 2010-03-25 Knud Funch Direct access method to media information
US8316000B2 (en) * 2006-12-07 2012-11-20 At&T Intellectual Property Ii, L.P. Method and apparatus for using tag topology
US8489594B2 (en) * 2007-02-07 2013-07-16 Cisco Technology, Inc. Playlist override queue
US20080228470A1 (en) * 2007-02-21 2008-09-18 Atsuo Hiroe Signal separating device, signal separating method, and computer program
US8269093B2 (en) * 2007-08-21 2012-09-18 Apple Inc. Method for creating a beat-synchronized media mix
US8046369B2 (en) 2007-09-04 2011-10-25 Apple Inc. Media asset rating system
WO2009070343A1 (en) 2007-11-27 2009-06-04 Xm Satellite Radio Inc Method for multiplexing audio program channels to provide a playlist
CN101567203B (zh) * 2008-04-24 2013-06-05 深圳富泰宏精密工业有限公司 自动搜寻及播放音乐的系统及方法
KR20090118752A (ko) * 2008-05-14 2009-11-18 삼성전자주식회사 컨텐트 재생 목록 제공 방법 및 그 장치
US8990848B2 (en) 2008-07-22 2015-03-24 At&T Intellectual Property I, L.P. System and method for temporally adaptive media playback
US7996422B2 (en) * 2008-07-22 2011-08-09 At&T Intellectual Property L.L.P. System and method for adaptive media playback based on destination
WO2010039193A2 (en) * 2008-10-01 2010-04-08 Entourage Systems, Inc. Multi-display handheld device and supporting system
US8866698B2 (en) 2008-10-01 2014-10-21 Pleiades Publishing Ltd. Multi-display handheld device and supporting system
US20100121891A1 (en) * 2008-11-11 2010-05-13 At&T Intellectual Property I, L.P. Method and system for using play lists for multimedia content
TWI382762B (zh) * 2008-11-17 2013-01-11 Ind Tech Res Inst 移動物體的追蹤方法
CN101783160A (zh) * 2009-01-16 2010-07-21 鸿富锦精密工业(深圳)有限公司 音频播放装置及其播放方法
US9014832B2 (en) * 2009-02-02 2015-04-21 Eloy Technology, Llc Augmenting media content in a media sharing group
US9514476B2 (en) * 2010-04-14 2016-12-06 Viacom International Inc. Systems and methods for discovering artists
US9166712B2 (en) 2010-06-22 2015-10-20 Sirius Xm Radio Inc. Method and apparatus for multiplexing audio program channels from one or more received broadcast streams to provide a playlist style listening experience to users
US20120271823A1 (en) * 2011-04-25 2012-10-25 Rovi Technologies Corporation Automated discovery of content and metadata
US8639706B1 (en) * 2011-07-01 2014-01-28 Google Inc. Shared metadata for media files
EP2771820A1 (en) * 2011-10-24 2014-09-03 Omnifone Ltd Method, system and computer program product for navigating digital media content
US9230620B1 (en) * 2012-03-06 2016-01-05 Inphi Corporation Distributed hardware tree search methods and apparatus for memory data replacement
EP2738686A1 (en) * 2012-11-29 2014-06-04 Thomson Licensing Synchronization of different versions of a multimedia content
US20150301718A1 (en) * 2014-04-18 2015-10-22 Google Inc. Methods, systems, and media for presenting music items relating to media content
US10805668B2 (en) 2015-05-20 2020-10-13 DISH Technologies L.L.C. Apparatus, systems and methods for trick function viewing of media content
US10136190B2 (en) 2015-05-20 2018-11-20 Echostar Technologies Llc Apparatus, systems and methods for song play using a media device having a buffer
US9516377B1 (en) 2015-06-12 2016-12-06 Sorenson Media, Inc. Detecting channel change in automatic content recognition fingerprint matching
US10289916B2 (en) * 2015-07-21 2019-05-14 Shred Video, Inc. System and method for editing video and audio clips
US10412183B2 (en) * 2017-02-24 2019-09-10 Spotify Ab Methods and systems for personalizing content in accordance with divergences in a user's listening history
CN108108457B (zh) 2017-12-28 2020-11-03 广州市百果园信息技术有限公司 从音乐节拍点中提取大节拍信息的方法、存储介质和终端
US10776415B2 (en) * 2018-03-14 2020-09-15 Fuji Xerox Co., Ltd. System and method for visualizing and recommending media content based on sequential context
CN110322886A (zh) * 2018-03-29 2019-10-11 北京字节跳动网络技术有限公司 一种音频指纹提取方法及装置
CN111651981B (zh) * 2019-02-19 2023-04-21 阿里巴巴集团控股有限公司 数据的审核方法、装置及设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000269840A (ja) * 1999-03-17 2000-09-29 Sharp Corp コンテンツ再生/コンテンツ受信装置
JP2002014691A (ja) * 2000-05-11 2002-01-18 Fuji Xerox Co Ltd ソース音声信号内の新規点の識別方法
JP2002262258A (ja) * 2001-03-05 2002-09-13 Sharp Corp コンテンツ配信システムおよびそれに用いるサーバーおよびそれに用いるクライアント端末およびコンテンツ配信方法およびその方法をコンピュータに実行させるためのプログラムを記録した記録媒体
JP2003203467A (ja) * 2002-01-08 2003-07-18 Sony Corp データ処理装置及び方法
JP2003256309A (ja) * 2002-02-28 2003-09-12 Promenade:Kk 電子情報内容配信処理システム、情報配信装置、情報処理装置及び情報処理方法
JP2003303195A (ja) * 2002-02-28 2003-10-24 Fuji Xerox Co Ltd 線形メディアの最適要約を自動作成する方法および情報を格納する情報格納メディアを備える製品

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2245745B (en) * 1990-07-06 1994-03-09 Sony Corp Editing digital audio signals associated with video signals
US5175769A (en) * 1991-07-23 1992-12-29 Rolm Systems Method for time-scale modification of signals
JP2550825B2 (ja) * 1992-03-24 1996-11-06 ヤマハ株式会社 自動伴奏装置
KR0183682B1 (ko) * 1993-06-30 1999-04-15 김광호 가라오케 텔레비젼의 메들리 기능 수행방법
US5655058A (en) * 1994-04-12 1997-08-05 Xerox Corporation Segmentation of audio data for indexing of conversational speech for real-time or postprocessing applications
JP3745403B2 (ja) * 1994-04-12 2006-02-15 ゼロックス コーポレイション オーディオデータセグメントのクラスタリング方法
US5598507A (en) * 1994-04-12 1997-01-28 Xerox Corporation Method of speaker clustering for unknown speakers in conversational audio data
US5614687A (en) * 1995-02-20 1997-03-25 Pioneer Electronic Corporation Apparatus for detecting the number of beats
US5616876A (en) * 1995-04-19 1997-04-01 Microsoft Corporation System and methods for selecting music on the basis of subjective content
JP2956569B2 (ja) * 1996-02-26 1999-10-04 ヤマハ株式会社 カラオケ装置
US5828994A (en) * 1996-06-05 1998-10-27 Interval Research Corporation Non-uniform time scale modification of recorded audio
US5918223A (en) * 1996-07-22 1999-06-29 Muscle Fish Method and article of manufacture for content-based analysis, storage, retrieval, and segmentation of audio information
US6201176B1 (en) * 1998-05-07 2001-03-13 Canon Kabushiki Kaisha System and method for querying a music database
US7022905B1 (en) * 1999-10-18 2006-04-04 Microsoft Corporation Classification of information and use of classifications in searching and retrieval of information

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000269840A (ja) * 1999-03-17 2000-09-29 Sharp Corp コンテンツ再生/コンテンツ受信装置
JP2002014691A (ja) * 2000-05-11 2002-01-18 Fuji Xerox Co Ltd ソース音声信号内の新規点の識別方法
JP2002262258A (ja) * 2001-03-05 2002-09-13 Sharp Corp コンテンツ配信システムおよびそれに用いるサーバーおよびそれに用いるクライアント端末およびコンテンツ配信方法およびその方法をコンピュータに実行させるためのプログラムを記録した記録媒体
JP2003203467A (ja) * 2002-01-08 2003-07-18 Sony Corp データ処理装置及び方法
JP2003256309A (ja) * 2002-02-28 2003-09-12 Promenade:Kk 電子情報内容配信処理システム、情報配信装置、情報処理装置及び情報処理方法
JP2003303195A (ja) * 2002-02-28 2003-10-24 Fuji Xerox Co Ltd 線形メディアの最適要約を自動作成する方法および情報を格納する情報格納メディアを備える製品

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008146616A1 (ja) * 2007-05-25 2008-12-04 Nec Corporation 画像音響区間群対応付け装置と方法およびプログラム
JPWO2008146616A1 (ja) * 2007-05-25 2010-08-19 日本電気株式会社 画像音響区間群対応付け装置と方法およびプログラム
JP5273042B2 (ja) * 2007-05-25 2013-08-28 日本電気株式会社 画像音響区間群対応付け装置と方法およびプログラム
US8558952B2 (en) 2007-05-25 2013-10-15 Nec Corporation Image-sound segment corresponding apparatus, method and program
JP2012512444A (ja) * 2008-12-17 2012-05-31 トムソン ライセンシング データ管理装置、データ管理方法及びデータ管理プログラム

Also Published As

Publication number Publication date
US20050249080A1 (en) 2005-11-10

Similar Documents

Publication Publication Date Title
JP2005322401A (ja) メディア・セグメント・ライブラリを生成する方法、装置およびプログラム、および、カスタム・ストリーム生成方法およびカスタム・メディア・ストリーム発信システム
US11461389B2 (en) Transitions between media content items
US10497378B2 (en) Systems and methods for recognizing sound and music signals in high noise and distortion
US7386357B2 (en) System and method for generating an audio thumbnail of an audio track
JP5362178B2 (ja) オーディオ信号からの特徴的な指紋の抽出とマッチング
US6748360B2 (en) System for selling a product utilizing audio content identification
US20120166631A1 (en) Device and method for monitoring, rating and/or tuning to an audio content channel
JP2007533274A (ja) コンテントのサンプリングおよび識別のための方法およびシステム
JP2005250472A (ja) オーディオサムネイルを生成するためのシステムおよび方法
JP2001147697A (ja) 音響データ分析方法及びその装置
EP1531457B1 (en) Apparatus and method for segmentation of audio data into meta patterns
KR101002732B1 (ko) 온라인을 통한 디지털 컨텐츠 관리 시스템
Walczyński et al. Effectiveness of the acoustic fingerprint in various acoustical environments

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080317

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090331

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090526

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090707