JPH11272287A - 楽曲識別方法及び楽曲識別システム - Google Patents
楽曲識別方法及び楽曲識別システムInfo
- Publication number
- JPH11272287A JPH11272287A JP10088308A JP8830898A JPH11272287A JP H11272287 A JPH11272287 A JP H11272287A JP 10088308 A JP10088308 A JP 10088308A JP 8830898 A JP8830898 A JP 8830898A JP H11272287 A JPH11272287 A JP H11272287A
- Authority
- JP
- Japan
- Prior art keywords
- music
- data
- block
- section
- dictionary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Electrophonic Musical Instruments (AREA)
Abstract
い計算量で高速に行う。 【解決手段】 モニタリング・サイトは、受信された楽
曲について、放送源又は送信元からパワーベクトルP
(l)を算出する(ステップS101)。つぎに、パワー
ベクトルのフレームlをシフトさせながら放送音からの
ブロックを作成する(ステップS103)。さらに、ブ
ロックをNフレーム毎取り出し、ブロック列を構成する
(ステップS105)。ブロックとセントロイドとの距
離を計算して、ブロック列に基づきクラスタリングを行
い、区間コードに変換する(ステップS107)。この
区間コードと辞書データの区間コードとを比較してマッ
チングをとり楽曲を認識する(ステップS109)。マ
ッチングされた楽曲は、他の情報とともにログデータフ
ァイルがフォーマットされてメモリに記録される。(ス
テップS111)。
Description
楽曲識別システムに係り、特に放送局又は送信元から放
送又は送信された楽曲とそれに関連する情報とを自動認
識することができる楽曲識別方法及び楽曲識別システム
に関する。
トなどのマスメディア上での音楽が現代社会に与える影
響は、もはや無視できないものとなっている。このよう
な放送又は送信を統計的に処理をして、楽曲の知的財産
権者・演奏者・楽曲製作販売会社等より、音楽放送楽曲
を自動識別する要請が高まっている。放送された楽曲に
ついて、例えば、どのような楽曲がどこからどれだけ放
送されたか(放送時間、回数等)を調べるための楽曲識
別方法が必要とされる。
送及び送信される形態としては、例えば、以下のような
場合等がある。
らの再生、 放送局のスタジオ・劇場等からのライブ中継、 コンサートや演奏会場等での録音・録画媒体の再生放
送、 インターネット、衛星放送等の新しいメディアを介し
ての放送及び送信。
プログラム(楽曲)をすべて録音又は録画をし、後ほど
これらを再生することにより、人が実際にこれらを聴い
て、放送された楽曲を識別していた。さらに、人手を介
して、認識された楽曲について放送局、放送時間、放送
回数等のデータについて、集計作業が行われていた。
の放送音楽楽曲の識別には、人が録画・録音を再生して
判断していたので、多くの人手がかかることとなる。さ
らに、従来においては、人手を介して行うため、確認ミ
スが生じやすくなり、信頼性もあまり高くないという問
題点があった。また、人によって認識できる楽曲数、楽
曲名、ジャンル等に限界があるという問題点があった。
用に編集されていたり、楽曲と音声が重畳していたりす
る場合があるので、部分マッチングも考慮しなければな
らない。そのため、パターン数が非常に多く、マッチン
グの計算量が膨大となる。
持って自動的に楽曲の識別をし、放送局、時間回数等の
その楽曲に関する情報を求めることができる楽曲識別方
法及び楽曲識別システムを提供することを目的とする。
らリアルタイムで楽曲スポッティング、即ち、不特定の
楽曲から任意の楽曲の区間を抽出しタグ付けを行うこと
により、正確且つ多数の楽曲の識別を少ない計算量で高
速に行うことを目的とする。
によると、受信された楽曲について、複数の帯域チャネ
ル毎のパワーデータを算出するステップと、算出された
前記パワーデータのフレームを複数含むブロックを作成
するステップと、連続した前記ブロックを複数含むブロ
ック列を作成するステップと、作成された前記ブロック
列について、前記ブロック単位でクラスタリングを行う
ことによりクラスタ番号で表わした区間コードに変換す
るステップと、前記区間コードと辞書データとを比較
し、マッチングされた楽曲を認識するステップとを備え
た楽曲識別方法を提供する。
号を受信する受信部と、前記受信部により受信された前
記楽曲信号を複数の帯域チャネルに分離して、前記帯域
チャネル毎のパワーデータを出力する帯域フィルタ部
と、時刻情報を出力する時計部と、受信された楽曲につ
いて、複数の帯域チャネル毎のパワーデータを算出する
手段と、算出された前記パワーデータのフレームを複数
含むブロックを作成する手段と、連続した前記ブロック
を複数含むブロック列を作成する手段と、作成された前
記ブロック列について、前記ブロック単位でクラスタリ
ングを行うことによりクラスタ番号で表わした区間コー
ドに変換する手段と、前記区間コードと辞書データとを
比較し、マッチングされた楽曲を認識する手段と、前記
時刻情報及び/又は前記楽曲コードを含むログデータを
出力する手段を含む楽曲識別部を備えた楽曲識別システ
ムを提供する。
説明する。
す。音の強度を示すパワーは、以下のように求められ
る。
T)を示す。ここで、Iは、帯域チャネル番号、Tは、サ
ンプリング周波数である。図1(B)は、この楽曲信号
を、フレーム間隔Fintで切り出し窓関数をかけたもの
である。図中、lは、フレーム番号を示す。窓関数とし
ては、例えば、方形窓、Hamming窓、Hanning窓、Blackm
an窓等がある。また、図1(C)及び(D)は、それぞ
れ、以下の式により求めた、フレームごとの平均振幅V
I(l)及び平均パワーPI(l)を示す。
長Flenについて説明する。図2に、フレーム構成の説
明図を示す。
とフレームの説明図を示す。本発明では、楽曲のサンプ
リング周波数は、例えば、11.025kHz(周期約0.0907m
s)としている。また、フレームは、例えば、1024個の
サンプリング時間である92.88msごとに、ある区間の平
均パワーデータを吐き出すのものである。そして、例え
ば、この1024サンプルがフレーム間隔Fintであり、本
発明の手法の基本単位となる。
ワー誤差の説明図を示す。
誤差が生じる。そして、フレーム間隔が最大1/2フレ
ームずれることによる自局間のパワーベクトルの距離を
自局間距離とし、他の楽曲のパワーベクトルとの距離を
他局間距離として、それらの確率分布により識別精度の
目安とすることができる。
以下のようになる。すなわち、この手法では、比較する
データどうしの時間ずれをカバーする工夫があるが、最
小単位はこのフレームなので、1フレーム=92.88ms以
内の時間ずれは吸収できないこになってしまう。そし
て、この問題から受けるダメージを検討したところ、2
分の1フレームずれた時に、そのダメージが最大になる
ことがわかった。
は1024sample(92.88ms)でも、吐き出すデータは前後大
幅にオーバーラップさせて、この問題を小さく抑えるよ
うにした。ここでは、図2(B)に示すように、例え
ば、8フレーム分である8192sample区間(=8×1024)
の平均パワーを求めることで、問題を解消している。つ
まり1フレーム進んでも、A/Dサンプリングデータの
中身は8分の1しか新データと入れ替えずに、平均パワ
ーを計算し出力していくので、最も誤差が大きくなる2
分の1フレームずれにおいても、その影響は受けにくく
なる。このように、本発明では、一例としてフレーム長
Flenは、8192サンプルとしている。
れた楽曲と辞書側のフレームとが完全に一致するとは限
らず、最大1/2フレームまでのずれが生じることがあ
る。
の説明図を示す。
とつの帯域チャネル番号に対して考えると、フレームが
複数多重化されたものであり、本発明では一例として、
フレーム20個分、1ブロックの周期は1.86秒とする。
ブロックの各要素は、例えば、以下のように、1行20
列で表現される。
P(18) P(19)] また、図4(B)に示すように、ブロックが10個集ま
ったものがブロック列であり、ここでは、例えば、18.6
秒である。
クトルの説明図を示す。ここでは、各帯域チャネル番号
Iごとにフレーム番号lのパワーPI(l)が図示される。
フレーム番号lによって、パワーベクトルP(l)は、次
のように表示される。
を示す。
てブロックになるので、ブロックの要素は、各帯域チャ
ネルを考慮して詳細には行20列となる。そして、1ブ
ロックには、100個の平均パワーが含まれることにな
る。これが本発明の認識手法の1単位となる。
パワーベクトルのブロック構成の説明図を示す。図示の
ように、楽曲M1のフレーム番号lからNフレーム分の
パワーベクトルをブロック化したデータであるブロック
BN M1(l)は、次式のように表わされる。
る。まず、高速化や時間ずれ対策を勘案しない場合を考
えると、単にフレームを各帯域チャネル毎に200ヶ集
めて1ブロックとした場合と同じで、行200列(=1
000)のパワー行列となる。この場合、1ブロックに
1000個の平均パワーが詰まった状態で、認識行為を
1単位実行することになるので、200フレーム=18.6
secで認識結果を出す。
を一括して辞書にブロック転送し、辞書の方にも、10
00個で1ブロックの辞書データが登録曲数分用意して
マッチングを実行するとすれば、大変な処理量になる。
すなわち、まず登録曲第1番と1000個のデータを比
較計算し、次に登録曲第2番と1000個マッチングを
とり、・・・最後第N番との比較まで行って終了となる
ため、辞書内の登録曲数に比例して、認識結果が出るま
での時間が膨大に膨れ上がることになる。辞書に、例え
ば1万曲あれば、1000万個(=1000x10000)のデー
タを比較しなければならない。しかも、それだけ時間を
かけても、楽曲の全演奏時間中のわずか18.6秒(1ブロ
ック時間)の区間を比較しただけに過ぎない。一般に、
このマッチング処理は、辞書データの全総数との総当た
りで比較するので、1曲の全区間を辞書化すると、また
辞書数が増え、総当たり回数もそれに比例して増加する
ことになってしまう。
うことで識別処理スピードをあげる方法を取っている。
クラスタリングとは、例えば、「LBGアルゴリズム」
と呼ばれるような、一般に使われている手法を採用する
が、これに限られず適宜の手法を採用することができ
る。即ち、入力ベクトル(ここでは、100次元のブロ
ックのパワーデータのこと)と各クラスタ(小集合)と
の距離を求め、その距離が最小のクラスタの番号を持っ
て量子化(置き換え)を行う。距離の計算は、例えば、
ユークリッド距離又は2乗和等から求めることができ
る。
図を示す。
球は、各軸は、前述の1ブロック=5行20列の要素で
100軸になるので、100次元の球体のイメージとな
る。セントロイドX#Qは、各球体イメージの中心(重
心)である。分類する数は、クラスタリングするブロッ
ク数には関係なく常に一定(例えば128)とする。た
だし、例えば1万曲とかの数多くの楽曲で辞書を作る場
合に、例えば256等に増やすことにより、分離性能を
さらに十分とることができる。
とクラスタ番号#Qとが対応したベクトル量子化辞書を
備え、まず、100次元のベクトルが距離計算によって
辞書から参照されてクラスタ番号#Qになる(ベクトル
量子化)。これにより、100次元が1次元に量子化さ
れる。なお、このような、辞書は、ベクトル量子化する
際の量子化歪み等を用いて、あまり距離が小さくならな
いベクトルが多く出現する場合、辞書を作成し直しする
こともできる。
より、ブロック列中に含まれる、例えば10個のブロッ
クそれぞれにクラスタ番号#Qを対応させるようにし
た。クラスタ番号#Qは、例えば、#1から#128ま
でとし、これは区間コードと呼ばれる。
タ)は、1つのクラスタの番号値におきかえられる。ブ
ロック列は、ブロックが10個連なったものであるが、
本来5行20列の10個分で1000個のパワーデータ
で表現されるべきものが、以上のアイデアで10個のク
ラスタ番号で表わすことができる。例えば以下のように
表現される。これが「区間コードへの変換」である。
#101 #3 #99 #44] 1行10列=10個の要素に変換 クラスタリングのメリットは、データ数が100分の1
に減少され、さらに、いろいろな値を取りうるパワー値
ではなく、単純な整数値(例えば128)なので、楽曲
の識別を高速化できる点である。
間コードに変換したものである。区間コードは、例えば
10ブロックの長さであるが、楽曲コードは、この区間
コードが曲の始めから終わりまで連続したものである。
このような楽曲コードを使い辞書登録する手法も考えら
れるが、その場合不完全演奏(途中でカット等)には対
応しにくい。その点区間コードは、これに対処すること
ができる。
作っただけならば、通常3分から5分程ある楽曲データ
中、わずか18.6秒の区間を辞書化したに過ぎない。ま
た、楽曲が、つねに曲の頭から演奏されると決まってい
れば、曲の頭部分18.6秒だけを辞書化しても良いが、実
際はそうではないので、曲の途中のどこから演奏されて
も良いようにする必要がある。そこで、本発明では、1
ブロックずつ後ろへずらしながら、ブロック列を作成す
るようにした。
図を示す。
塊とする。次々とスタートポイントを後ろにずらしなが
ら、ブロック列を作っていくと、曲の最後に、ブロック
列がぶつかり、ここで終了となる。これ以上ずらすと、
ブロック列が9ブロック構成、8ブロック構成・・・等
と短くなってしまう。こうして作成されたブロック列を
総称して「区間データ」と呼ぶ。区間データのブロック
列数は、曲の長さによって異なることになる。
楽曲ごとに区間データを作成する。すると辞書曲数のお
よそ100倍もの区間データに膨れあがってしまう(た
とえば1ブロック=約2秒で、演奏時間200秒の曲を
2秒ずらしては、次々と区間データをおこすので、2秒
×100sampleが200秒÷2秒分必要なので、200
秒×100倍)。本発明の認識では、リアルタイム認識
が目標であるので、これを総当たり検索させたのでは時
間がかかってしまう。
列するプロセスをとる。「区間コードを辞書順に整列」
とは、ブロック列に与えられた10個のクラスター番号
をソートすることで、上1桁から数字の若い順番になら
べ変え、次に上2桁目、上3桁目…全10桁をチェック
して並べ替える。リアルタイム認識の実際では、ブロッ
ク列の頭から時間経過に従いブロック列が1個ずつ生成
されるので、あらかじめ辞書をソートしておけば、1ブ
ロックデータが起きるたびに、それ以外の候補が自動的
に棄却されていく。ソートによりデータマッチングのた
めの探索木構造のデータベースを作成し、これを採用す
ることで、データマッチングまでの時間が短縮できる。
グデータは、ブロック単位で辞書とスタートポイントが
一致していなければならない。ブロック単位は1.86秒な
ので、辞書とはまったく無関係に非同期でサンプリング
されるデータには、この最大1.86秒のずれを補正する方
法を持たさなければならない。
とかたまりのブロックにする時に、まずスタート位置か
ら20個のフレームでブロック化する作業と平行して、
スタート位置を1フレームずらした(遅れた)場所から
ブロック化するようにした。さらに、同じく2フレーム
ずらした場所からブロック化する。さらに同じく3フレ
ーム目から…、というようにして、最後に20フレーム
遅れでブロック化するという作業が平行して行われる。
説明図を示す。
うな20種類の位置ずれブロックは、それぞれ10個集
めて、20種類のブロック列をつくる。1ブロックに含
まれる100個の平均パワーデータは、あらかじめ用意
された辞書のクラスタ空間において、どのクラスタに最
も近いかを判定し、そのクラスタ番号に置き換える。こ
の判定は、各クラスタのセントロイドとの距離(100
次元での誤差2乗和)が最小のものを基準として判断さ
れる。こうして20種類のブロック列は、20種類の区
間コードに置き換えられる。なお、1ブロック20フレ
ームであるので、21フレーム遅れは遅れなしスタート
のブロックと同じであるから、21フレーム遅れのデー
タは不要となる。さらに言えば、21フレーム遅れは第
2回目の認識作業での遅れなしブロック列で、22フレ
ーム遅れは同じく第2回目の認識作業での1フレーム遅
れのブロック列…ということで延々とつづくことにな
る。
(1フレーム)遅れで20種類の区間コードが時間とと
もに次々と先頭ブロックから順にデータが生成されて、
1.86秒で1ブロックを作り出し、つぎに、ソートされた
探索木構造のデータベースと比較されて、該当しないも
のを除きながら、マッチングしたものを認識していく。
えば10回分)探索木を枝別れすれば、かならず1つの
「結論」に帰着することになる。そして、最終的に何回
枝別れすれば、1つの楽曲名に特定できるかを実験した
ところ、10回程あれば満足できるものとなった。場合
によっては、枝別れは15回(15ブロック=1区間コ
ード)としても良いし、また、枝別れは10回(10ブ
ロック=1区間コード)のままで、クラスターの数を1
28から例えば256としても良い。
切れてしまう場合は、辞書にそのような区間コードが存
在しないことになり、認識結果は出力されない。辞書に
区間コードが見当たらないとは、未登録の楽曲だけでは
なく、アナウンサーの声や、その他辞書に登録されない
ような全ての音の場合に発生する。
時間つねにリアルタイム認識状態である必要があるた
め、このような高速化は非常に有益である。
うな2つの機能を有する。
のためのデータベース、 2)全登録楽曲についてのソートされた探索木構造にな
った区間コードのデータベース。
音楽であろうが、トークショーであろうが、とりあえず
フレーム数分(例えば20種類)の時間ずれ区間データ
を作るために参照する辞書データである。後者2)は、
その区間コードが登録楽曲かどうか、照合するための辞
書データである。辞書の再構築については、上記2)は
追加削除の度に実施するが、上記1)は大きく構成が変
わった時のみの実施でよい。
ば、回答は1つに帰着するのだけであるが、本発明で
は、時間ずれ対応で、1フレーム(92.88ms)遅れで、次
から次へと20種類の区間コードが探索木の上を走査さ
れていく。このとき、スローテンポの曲などではデータ
内容の時間変化が少ない場合があり、同時に走る20種
類の認識用区間コードの中で、時間がぴったり同期して
いるものは、当然、うまく10回枝別れして正しい答え
を出す。しかし、1フレームずれ程度の別な区間コード
の方でも、同じ枝別れ経路をたどり、同じ場所に帰着す
る(正答が返される)場合がある。そこで、20種類の
区間コードで認識させたとき、たとえ複数から同じ認識
結果がでても、それを1つにまとめて出力する事で、第
1回目の認識単位は完了する。
を、その楽曲がオンエア開始した時刻としてストアす
る。この後も第2回目、3回目…と認識行為は継続する
ものの、途中で10回枝別れできなくなる状況(例え
ば、曲が終わってアナウンサーの声に変わったとき等)
が複数回継続し出現したならば、その楽曲は中断または
終了したと判定し、その時刻をオンエアが終了した時刻
としてストアする。
る、2曲連続してかける場合の手法で説明する。例え
ば、1曲目をフェードアウトさせ、完全に音が消えきら
ない少し手前で2曲目を標準レベルからのカットインで
オンエアすることは非常に多くみられる。この場合、フ
ェードアウト中は平均パワーレベルが時間とともにスラ
イドしていくので、認識率は落ちるかもしれない。区間
コードが10回枝別れできない事態がある回数連続した
時点で、この1曲めは終了と判定される。もしフェード
アウトの傾きが緩やかであれば、次の曲がカットインし
てきたところで終了と判定される。一方、2曲目の方は
カットインの時点では、まだ1曲目の音が十分下がりき
っていなければ認識できない状況であり、十分下がった
時点で、初めて2曲目が認識され、その時刻が記録され
る。
る楽曲の全区間を細かく切った区間コードを利用して認
識するので、単なるx時x分x秒からx分x秒間演奏さ
れたという演奏事実の確認にとどまらず、ある曲のどの
区間(たとえば、さびの部分だけ、頭の1分20秒間だ
け)がオンエアされたかを付帯データとして出力できる
ことにある。
るシステムへの応用について説明する。
す。
1、ラジオ放送局2、テレビ用認識部20、ラジオ用認
識部30、時計部6、帯域フィルタ部7、モニタリング
・サイト8、センター設備9、通信線10及び楽曲辞書
作成装置11を備える。さらに、テレビ用認識部20
は、テレビ音声受信機3及び録音機4を含むテレビ用受
信部21を複数個有する。ラジオ用認識部30は、ラジ
オ受信機5及び録音機4を含むラジオ用受信部31を複
数個有する。
録音機4は、それぞれ複数の受信機回路を含むことがで
きる。録音機4は、例えば24時間等の長時間録音が可
能なものであり常時録音することにより、それぞれテレ
ビ音声受信機3及びラジオ受信機5に障害が発生した時
などの予備のバックアップ受信機として機能する。時計
部6は、障害や瞬断の時刻等を記録するため、各録音機
4にデータを供給するとともに、モニタリング・サイト
8にも時刻データを供給する。帯域フィルタ部7は、テ
レビ用認識部20及びラジオ用認識部30で受信された
音声信号を帯域分離するもので、複数のデジタルフィル
タ又はアナログフィルタ、A/Dコンバータ等を備え
る。
タ、内部メモリ、通信手段等を備え、テレビ用及びラジ
オ用認識部20及び30が設置された場所情報、受信信
号の放送源又は送信元の情報などの必要な各種情報を把
握及び管理する。モニタリング・サイト8は、楽曲識
別、楽曲データ記憶、楽曲スポッティング演算、放送時
間や局の特定、ログファイルやログデータの作成及び編
集、センターコンピュータとの通信機能等を有する。
ータ記憶部等のメモリ、通信手段等を備え、各地域に配
備された複数のモニタリング・サイト8とそれぞれ通信
線10を介して接続される。センター設備9は、識別結
果の受信や新譜データの送信等のデータの通信、システ
ム運用等を行う。また、楽曲辞書作成装置11とも接続
され、辞書データを受信する。楽曲辞書作成装置11
は、例えば新譜データ等の楽曲の辞書データを作成した
り、記憶したりする機器である。
回線、専用線、個別配線等適宜の接続線を用いることが
できる。
例を示す。ここでは、バンドパスフィルタ(BPF)と
してデジタルフィルタを用いた回路構成を示すが、アナ
ログフィルタ等により適宜帯域フィルタを構成すること
もできる。
01、複数のバンドパスフィルタ702、バスライン7
03及びマイクロプロセッサ704を備える。
からの音声信号は、帯域フィルタ部7の入力端子705
に入力される。入力端子705からの音声信号は、A/
Dコンバータ701でデジタルデータに変換され、バン
ドパスフイルタ702で楽曲信号のパワーデータのスペ
クトラムを取り出す。バンドパスフィルタ702は、複
数個用いられ、例えばヤマハ(商標)のYSS231等
を用いることにより実現できる。ここでは、一例とし
て、5個のバンドパスフィルタBPF1〜BPF5が使
用されている。バンドパスフィルタ702の特性の設定
は、マイクロプロセッサ704により行われる。バスラ
イン703は、データライン(細線)及びアドレスライ
ン(太線)を有する。出力データは、マイクロプロセッ
サ704の制御により、バスライン703を介して、出
力端子706から出力される。
説明図を示す。
タのバンドパスフイルタ特性の設定条件を示したもので
ある。また、図13(B)は、各デジタルフイルターの
パラメータを示す。このように、本発明の実施の形態で
は、バンドパスフイルタの通過特性は、聴覚特性を考慮
し、一例としてベースの音域である100Hz 〜200Hzを基
準に1オクターブ間隔にし、計5チャンネル備えるよう
にしている。各々のバンドパスフィルタ702により、
通過帯域別に取り出された音声デジタル信号は、マイク
ロプロセッサ704により、フレーム別且つ帯域別のパ
ワーの算出が行われる。
ライン703より出力端子706を通じて、帯域フィル
タ部7から出力される。この出力信号は、モニタリング
・サイト8に送られ楽曲のスポッティグ認識とログファ
イルの収集等を行う。
トを示す。
れた楽曲について、辞書作成時と同様に、随時、放送源
又は送信元からパワーベクトルP(l)を算出する(ステ
ップS101)。つぎに、パワーベクトルのフレームl
をシフトさせながら放送音からのブロックBN(l)、B
N(l+1)、・・・、を作成する(ステップS103)。さ
らに、ブロックBN(l)をNフレーム毎取り出し、ブロッ
ク間にオーバラップを生じないように、次式のようにブ
ロック列BLN(l)を構成する(ステップS105)。
を計算して、ブロック列BLN(l)に基づきクラスタリン
グを行い、区間コードCL(l)に変換する(ステップS1
07)。この区間コードと辞書データの区間コードとを
比較してマッチングをとり楽曲を認識する(ステップS
109)。受信した楽曲の中から辞書データと比較して
マッチングされた楽曲は、他の情報とともにログデータ
ファイルがフォーマットされてメモリに記録される。
(ステップS111)。この後、求められたログデータ
は、適当なタイミングで通信路10を介して、センター
設備9に伝送される。
例を示す。
れた年月日時分秒等の時刻情報、受信した地区名や都道
府県名等の場所情報、放送局名や送信局等の放送源又は
送信元情報、楽曲コード等の各データが含まれる。モニ
タリング・サイト8に楽曲認識されたデータは、このよ
うなフォーマットでログファイルに書き込まれ、センタ
ー設備9内部のコンピュータからの指示で又は自らの制
御でログデータを送る。
この図を参照して、楽曲の辞書作成方法について述べ
る。
より楽曲を再生を行うもので、市販する楽曲は一般的に
CD、テープレーコード等で販売されているので、通
常、複数の再生機器が必要となる。楽曲辞書作成装置1
1は、例えばCDプレーヤ1101、テープレコーダー
1102、レコードプレーヤ1103等の再生機器、ス
イッチ1104、帯域フィルタ1105及びコンピュー
タ1106を備える。再生装置としては、このほかにも
MD、レーザーディスク、ビデオ等多様な再生装置を備
えることができる。スイッチ1104は、例えばアナロ
グスイッチ、ディジタルスイッチであり、各再生装置を
切り替える。帯域フィルタ1105は、モニタリング・
サイト8に接続される図12に示した帯域フィルタ部7
の構成と同様であり、特性も同様に設定されている。な
お、コンピュータ1106は、センター設備9内に備え
るようにしても良い。
に示した帯域フィルタ部7と同様に、帯域フイルタ11
05等を通過してフレーム化及びブロック化等が行われ
る。コンピュータ1106は、スイッチ1104のゲー
ト指示を行うことにより、希望の再生機器より再生され
た楽曲を、図14で説明した手順でパワーベクトルの算
出、ブロックの作成、ブロック列の構成、クラスタリン
グ等が行われ、辞書データを作成する。作成された辞書
データは、楽曲辞書作成装置11はセンター設備9に転
送され、また、内部の辞書データ記憶部に記録される。
楽曲辞書作成装置11で作成された楽曲の辞書データ
は、センター設備9及び通信線10を通してモニタリン
グ・サイト8に辞書データとして伝送され、そこに多数
の楽曲の辞書データが保存されている。また、モニタリ
ング・サイト8の内部メモリは、モニタリング・サイト
8からログデータが送信されたときにこのときに辞書デ
ータの更新作業も同時に行うことができる。モニタリン
グサイト8では、図14のステップS109に示したよ
うな辞書データメモリとして、楽曲認識のデータマッチ
ングのデーターとして使用する。
明図を示す。
ド(楽曲の名称)、作曲家名、作詞家名、歌手名又は演
奏家名等の著作者に関する情報、及び楽曲の構成データ
等が含まれる。
グを行うことにより、楽曲の途中から放送が開始されて
も高速に確実に認識を行うことができる。
8又はセンター設備9の他にも、適宜の部分に設けられ
たコンピューター及びメモリ等により実行することもで
きる。
は、音楽が時間の流れに対してどのような変化をしてい
くかにより適宜設定することができる。また、クラスタ
数は、その瞬間での音質の構成比をどのくらい細かく分
類するかにより、適宜設定することができる。その他、
フレーム、ブロック、ブロック列等のデータ構成は適宜
変更することができる。例えば、辞書に登録される楽曲
のジャンルの偏り(例えば演奏速度、音質構成など)
や、曲数等によって適宜パラメータを変更してもよい。
頼性を持って自動的に楽曲の識別をし、放送局、時間回
数等のその楽曲に関する情報を求めることができる楽曲
識別方法及び楽曲識別システムを提供することができ
る。
ラムからリアルタイムで楽曲スポッティング、即ち、不
特定の楽曲から任意の楽曲の区間を抽出しタグ付けをす
ることにより、正確且つ多数の楽曲の識別を少ない計算
量で高速に行うことができる。
明図。
の説明図。
図。
ルのブロック構成の説明図。
ト。
Claims (14)
- 【請求項1】受信された楽曲について、複数の帯域チャ
ネル毎のパワーデータを算出するステップと、 算出された前記パワーデータのフレームを複数含むブロ
ックを作成するステップと、 連続した前記ブロックを複数含むブロック列を作成する
ステップと、 作成された前記ブロック列について、前記ブロック単位
でクラスタリングを行うことによりクラスタ番号で表わ
した区間コードに変換するステップと、 前記区間コードと辞書データとを比較し、マッチングさ
れた楽曲を認識するステップとを備えた楽曲識別方法。 - 【請求項2】前記認識された楽曲について、時刻情報、
楽曲の放送源若しくは送信元の情報及び/又は楽曲コー
ドを含むログデータを出力又は記憶するステップをさら
に備えた請求項1に記載の楽曲識別方法。 - 【請求項3】前記パワーデータは、 前後の複数のフレームのパワーデータの平均としたこと
を特徴とする請求項1又は2に記載の楽曲識別方法。 - 【請求項4】前記ブロックは、 受信された楽曲の前記フレームをひとつずつ前記ブロッ
クに含まれるフレーム数の長さ分までシフトすることに
より、複数種類作成されることを特徴とする請求項1乃
至3のいずれかに記載の楽曲識別方法。 - 【請求項5】前記クラスタ番号は、 分離した帯域数毎及び前記フレーム数毎の多次元の空間
領域を複数のクラスタに分けたときの、前記ブロックと
最も距離の近いセントロイドのクラスタ番号であること
を特徴とする請求項1乃至4のいずれかに記載の楽曲識
別方法。 - 【請求項6】前記辞書データは、 楽曲ソースから再生された楽曲について、複数の帯域チ
ャネル毎のパワーベクトルを算出するステップと、 算出された前記パワーベクトルのフレームを複数含むブ
ロックを作成するステップと、 連続した前記ブロックを複数含むブロック列を作成する
ステップと、 作成された前記ブロック列について、前記ブロック単位
でクラスタリングを行うことによりクラスタ番号で表わ
した区間コードに変換するステップとにより作成される
ことを特徴とする請求項1乃至5のいずれかに記載の楽
曲識別方法。 - 【請求項7】前記辞書データは、 楽曲全体に対して前記ブロック列の長さで切り出して複
数の前記区間コードで表現した区間データと、 さらにひとつずつ前記区間データに含まれるブロック数
の長さ分までシフトすることにより、それぞれ楽曲全体
に対して前記ブロック列の長さで切り出して複数の前記
区間コードで表現した複数の区間データとを備えること
を特徴とする請求項1乃至6のいずれかに記載の楽曲識
別方法。 - 【請求項8】前記辞書データの各区間コードは、辞書順
に整列されていることを特徴とする請求項1乃至7のい
ずれかに記載の楽曲識別方法。 - 【請求項9】楽曲信号を受信する受信部と、 前記受信部により受信された前記楽曲信号を複数の帯域
チャネルに分離して、前記帯域チャネル毎のパワーデー
タを出力する帯域フィルタ部と、 時刻情報を出力する時計部と、 受信された楽曲について、複数の帯域チャネル毎のパワ
ーデータを算出する手段と、算出された前記パワーデー
タのフレームを複数含むブロックを作成する手段と、連
続した前記ブロックを複数含むブロック列を作成する手
段と、作成された前記ブロック列について、前記ブロッ
ク単位でクラスタリングを行うことによりクラスタ番号
で表わした区間コードに変換する手段と、前記区間コー
ドと辞書データとを比較し、マッチングされた楽曲を認
識する手段と、前記時刻情報及び/又は前記楽曲コード
を含むログデータを出力する手段を含む楽曲識別部を備
えた楽曲識別システム。 - 【請求項10】前記楽曲識別部と通信線を介して接続さ
れ、前記楽曲辞書作成部により作成された前記辞書デー
タを前記楽曲識別部に送信し、一方、前記楽曲識別部に
より作成された前記ログデータを前記楽曲識別部から受
信するセンター設備をさらに備えた請求項9に記載の楽
曲識別システム。 - 【請求項11】再生された楽曲信号を複数の帯域チャネ
ルに分離して、前記帯域チャネル毎のパワーデータを出
力する帯域フィルタ手段と、 受信された楽曲について、複数の帯域チャネル毎のパワ
ーデータを算出する手段と、 算出された前記パワーデータのフレームを複数含むブロ
ックを作成する手段と、 連続した前記ブロックを複数含むブロック列を作成する
手段と、 作成された前記ブロック列について、前記ブロック単位
でクラスタリングを行うことによりクラスタ番号で表わ
した区間コードに変換する手段とを備え、前記辞書デー
タを作成する楽曲辞書作成部をさらに備えた請求項9又
は10に記載の楽曲識別システム。 - 【請求項12】前記受信部に対する予備装置として楽曲
を受信及び録音する録音部をさらに備えた請求項9乃至
11のいずれかに記載の楽曲識別システム。 - 【請求項13】前記ログデータは、 前記受信部が設置された場所情報及び/又は楽曲の放送
源若しくは送信元の情報を含むことを特徴とする請求項
9乃至12のいずれかに記載の楽曲識別システム。 - 【請求項14】前記辞書データは、楽曲コード、著作者
に関する情報及び/又は楽曲の構成データを含むことを
特徴とする請求項9乃至13のいずれかに記載の楽曲識
別システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP08830898A JP3964979B2 (ja) | 1998-03-18 | 1998-03-18 | 楽曲識別方法及び楽曲識別システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP08830898A JP3964979B2 (ja) | 1998-03-18 | 1998-03-18 | 楽曲識別方法及び楽曲識別システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH11272287A true JPH11272287A (ja) | 1999-10-08 |
JP3964979B2 JP3964979B2 (ja) | 2007-08-22 |
Family
ID=13939314
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP08830898A Expired - Fee Related JP3964979B2 (ja) | 1998-03-18 | 1998-03-18 | 楽曲識別方法及び楽曲識別システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3964979B2 (ja) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002258873A (ja) * | 2001-03-01 | 2002-09-11 | Sony Corp | 音楽認識装置及び音楽サービスシステム |
US6505160B1 (en) | 1995-07-27 | 2003-01-07 | Digimarc Corporation | Connected audio and other media objects |
JP2007141329A (ja) * | 2005-11-17 | 2007-06-07 | Matsushita Electric Ind Co Ltd | 音響再生制御装置 |
JP2007322598A (ja) * | 2006-05-31 | 2007-12-13 | Victor Co Of Japan Ltd | 楽曲分類装置、楽曲分類方法、及び楽曲分類プログラム |
JP2009508156A (ja) * | 2005-09-08 | 2009-02-26 | ユニバーシティー オブ イースト アングリア | 音楽分析 |
JP2009510509A (ja) * | 2005-09-29 | 2009-03-12 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | セグメント別特徴比較によりプレイリストを自動生成する方法及び装置 |
US7631095B2 (en) | 2005-02-16 | 2009-12-08 | Sharp Laboratories Of America, Inc. | Systems and methods for obtaining the metadata for an Internet radio station in a bandwidth-efficient manner |
JP4825800B2 (ja) * | 2004-07-09 | 2011-11-30 | ソニー ドイチュラント ゲゼルシャフト ミット ベシュレンクテル ハフツング | 楽曲分類方法 |
US10387618B2 (en) | 2006-07-12 | 2019-08-20 | The Nielsen Company (Us), Llc | Methods and systems for compliance confirmation and incentives |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9332363B2 (en) | 2011-12-30 | 2016-05-03 | The Nielsen Company (Us), Llc | System and method for determining meter presence utilizing ambient fingerprints |
-
1998
- 1998-03-18 JP JP08830898A patent/JP3964979B2/ja not_active Expired - Fee Related
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6505160B1 (en) | 1995-07-27 | 2003-01-07 | Digimarc Corporation | Connected audio and other media objects |
JP2002258873A (ja) * | 2001-03-01 | 2002-09-11 | Sony Corp | 音楽認識装置及び音楽サービスシステム |
JP4506004B2 (ja) * | 2001-03-01 | 2010-07-21 | ソニー株式会社 | 音楽認識装置 |
JP4825800B2 (ja) * | 2004-07-09 | 2011-11-30 | ソニー ドイチュラント ゲゼルシャフト ミット ベシュレンクテル ハフツング | 楽曲分類方法 |
US7631095B2 (en) | 2005-02-16 | 2009-12-08 | Sharp Laboratories Of America, Inc. | Systems and methods for obtaining the metadata for an Internet radio station in a bandwidth-efficient manner |
JP2009508156A (ja) * | 2005-09-08 | 2009-02-26 | ユニバーシティー オブ イースト アングリア | 音楽分析 |
JP2009510509A (ja) * | 2005-09-29 | 2009-03-12 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | セグメント別特徴比較によりプレイリストを自動生成する方法及び装置 |
JP2007141329A (ja) * | 2005-11-17 | 2007-06-07 | Matsushita Electric Ind Co Ltd | 音響再生制御装置 |
JP4575284B2 (ja) * | 2005-11-17 | 2010-11-04 | パナソニック株式会社 | 音響再生制御装置 |
JP2007322598A (ja) * | 2006-05-31 | 2007-12-13 | Victor Co Of Japan Ltd | 楽曲分類装置、楽曲分類方法、及び楽曲分類プログラム |
JP4665836B2 (ja) * | 2006-05-31 | 2011-04-06 | 日本ビクター株式会社 | 楽曲分類装置、楽曲分類方法、及び楽曲分類プログラム |
US10387618B2 (en) | 2006-07-12 | 2019-08-20 | The Nielsen Company (Us), Llc | Methods and systems for compliance confirmation and incentives |
US11741431B2 (en) | 2006-07-12 | 2023-08-29 | The Nielsen Company (Us), Llc | Methods and systems for compliance confirmation and incentives |
Also Published As
Publication number | Publication date |
---|---|
JP3964979B2 (ja) | 2007-08-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1998168B (zh) | 用于广播源辨识的方法与装置 | |
US6931451B1 (en) | Systems and methods for modifying broadcast programming | |
JP4658598B2 (ja) | ストリームに埋め込まれた反復オブジェクトに対するユーザ制御を提供するシステムおよび方法 | |
US8688248B2 (en) | Method and system for content sampling and identification | |
US8165306B2 (en) | Information retrieving method, information retrieving device, information storing method and information storage device | |
US6748360B2 (en) | System for selling a product utilizing audio content identification | |
US5615301A (en) | Automated language translation system | |
US20140214190A1 (en) | Method and System for Content Sampling and Identification | |
US7877438B2 (en) | Method and apparatus for identifying new media content | |
US6088455A (en) | Methods and apparatus for selectively reproducing segments of broadcast programming | |
US20050044561A1 (en) | Methods and apparatus for identifying program segments by detecting duplicate signal patterns | |
EP1197020B1 (en) | Electronic music and programme storage, comprising the recognition of programme segments, such as recorded musical performances and system for the management and playback of these programme segments | |
US20050249080A1 (en) | Method and system for harvesting a media stream | |
TW200402654A (en) | A system and method for providing user control over repeating objects embedded in a stream | |
KR20070082529A (ko) | 악곡 추출 프로그램, 악곡 추출 장치 및 악곡 추출 방법 | |
CN1639975A (zh) | 自动音频记录器-播放器及其操作方法 | |
JP3964979B2 (ja) | 楽曲識別方法及び楽曲識別システム | |
JPH10290441A (ja) | デジタル多チャンネル放送システムにおける音楽番組配信方法および受信再生装置 | |
KR100456408B1 (ko) | 오디오유전자 생성방법 및 오디오데이터 검색방법 | |
WO2018160007A1 (ko) | 멀티미디어 데이터를 처리하는 방법 및 장치 | |
JP2013171139A (ja) | 音楽放送の楽曲音声データと曲名との関連付け方法 | |
KR100798524B1 (ko) | 매체 신호 검색 및 레코딩 방법 및 장치 | |
KR20000072192A (ko) | 음악방송 자동통계 처리 시스템 및 그 서비스 방법 | |
GB2293683A (en) | Apparatus for generating signals representing textual information relating to recorded matter | |
WO2006075303A2 (en) | Broadcasting signal containing music data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050105 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20070122 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070130 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070328 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20070508 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20070525 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110601 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120601 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120601 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130601 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130601 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130601 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140601 Year of fee payment: 7 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |