JPH10307580A - 音楽検索方法および装置 - Google Patents

音楽検索方法および装置

Info

Publication number
JPH10307580A
JPH10307580A JP9115408A JP11540897A JPH10307580A JP H10307580 A JPH10307580 A JP H10307580A JP 9115408 A JP9115408 A JP 9115408A JP 11540897 A JP11540897 A JP 11540897A JP H10307580 A JPH10307580 A JP H10307580A
Authority
JP
Japan
Prior art keywords
music
sound
information
similarity
sound information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP9115408A
Other languages
English (en)
Other versions
JP3569104B2 (ja
Inventor
Kenichi Minami
憲一 南
Akito Akutsu
明人 阿久津
Yoshinobu Tonomura
佳伸 外村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP11540897A priority Critical patent/JP3569104B2/ja
Publication of JPH10307580A publication Critical patent/JPH10307580A/ja
Application granted granted Critical
Publication of JP3569104B2 publication Critical patent/JP3569104B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Electrophonic Musical Instruments (AREA)

Abstract

(57)【要約】 【課題】本発明は、音情報の音楽のみの区間について拍
子を測定し、大局的な類似性で測定対象を絞り込んだ
後、周波数スペクトルの相関を用いて効率的に音楽の整
合および検索を可能にすることを目的としている。 【解決手段】デジタルの形にした入力から、音楽の含ま
れる区間を抽出し、その上で背景音を除いた音楽のみの
区間を見出し、当該音楽の区間を用いて拍子を測定して
これを利用し、類似度を測定して音楽を検索するように
する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音楽情報検索の効
率化を図った音楽検索方法および装置に関する。
【0002】
【従来の技術】音楽情報を検索する際には、曲名、作詩
・作曲者名、歌手名といったキーワードを用いる方法が
あるが、キーワードの付与を自動的に行うことは難し
く、大量の情報を扱う場合にはデータベースの構築に多
大な労力を要する。また、曲名等が不明な場合の検索が
不可能である。
【0003】このような問題を解決するために、音楽の
旋律情報を手がかりとして検索方法が報告されており、
パーソナルコンピュータのキーボードを鍵盤楽器に見立
て、旋律を入力するもの(石塚ら:“パーソナルコンピ
ュータによる音楽情報検索システムの開発1.旋律検
索”、図書館情報大学研究報告、Vol.6,No.
1,pp.95−105,1987)や、曲を口ずさ
み、そのピッチを旋律として入力するもの(“蔭山ら:
ハミング歌唱を手掛かりとするメロディ検索、電子情報
通信学会論文誌、D−II,Vol.J77.No.
8,pp.1543−1551,1994)がある。入
力と音楽データベースとの整合には、旋律情報の動的プ
ログラミング(DP)を行う方法を用いている。
【0004】
【発明の解決しようとする課題】日常生活において音楽
の情報を得る機会は、テレビ放送による場合が少なくな
い。繰り返し流れる音楽を聞いているうちにその曲に対
する印象を持つようになり、視聴の欲求を喚起する場合
がある。しかし、うろ覚えのメロディ(旋律)程度の情
報しか持たない場合には旋律の入力が困難であり、所望
の音楽を特定することは難しい。更にテレビ放送では、
音楽に会話やナレーションなどの音声が重なる場合が多
いため、旋律を自動的かつ正確に検出できる対象は限定
されてしまう。また、旋律を用いる方法では、同じ曲で
あっても旋律の時間的な変化が異なる場合に対処するた
めに、時間方向のずれを許容するようなDPが必要であ
り、計算コストを増加させる原因となっている。
【0005】本発明の目的は、音情報の音楽のみの区間
について拍子を測定し、大局的な類似性で測定対象を絞
り込んだ後、周波数スペクトルの相関を用いて効率的に
音楽の整合および検索が可能にすることにある。
【0006】
【課題を解決するための手段】上記目的を達成するため
に本発明の請求項1記載の音楽検索方法は、音情報がア
ナログの場合あるいは音情報を伴う映像情報がアナログ
の場合にはA/D変換し、音情報あるいは音情報を伴う
映像情報がディジタルの場合にはそのまま入力する音・
映像入力段階と、入力された信号から音楽が含まれる区
間を検出する音楽検出段階と、該音情報から音楽以外の
音が含まれる区間を検出する背景音検出段階と、音楽が
含まれる区間の音情報、および音楽のみが含まれる区間
の開始/終了点、および入力が映像の場合には音楽が含
まれる区間の映像ならびに音情報を蓄積する音楽・映像
蓄積段階と、蓄積された音楽の類似度を測定する類似度
測定段階と、類似度の高い音楽を発生頻度順に表示する
音楽表示段階とを有することを特徴とする。
【0007】また、本発明の請求項2記載の音楽検索方
法は、音楽検出段階において、該音情報を周波数解析し
た際のスペクトルのピークが周波数方向に時間的に安定
していることを利用して音楽を検出することを特徴とす
る。
【0008】また、本発明の請求項3記載の音楽検索方
法は、背景音検出段階において、くし形フィルタを用い
て音声の有声音に含まれる調波構造を検出し、背景音の
1つである音声を検出することを特徴とする。
【0009】また、本発明の請求項4記載の音楽検索方
法は、背景音検出段階において、入力された音情報から
得られた周波数ケプストラム係数と符号帳とのユークリ
ッド距離が近いものを背景音として検出することを特徴
とする。
【0010】また、本発明の請求項5記載の音楽検索方
法は、類似度測定段階において、蓄積された音情報の音
楽のみが含まれる区間における周波数スペクトルパワー
の立ち上がり周期から音楽の拍子を測定し、同等の拍子
を持つものだけを類似度の測定対象とすることを特徴と
する。
【0011】また、本発明の請求項6記載の音楽検索方
法は、類似度測定段階において、蓄積された音情報の音
楽のみが含まれる区間における周波数スペクトルの相互
相関から、あるいは前記音情報の音楽のみが含まれる区
間の自己相関から得られたピッチの変化パターンの相互
相関から蓄積された音情報同士の類似度を測定すること
を特徴とする。
【0012】また、本発明の請求項7記載の音楽検索方
法は、音楽表示段階において、類似度の高い音楽を順に
アイコンで表示するようにし、かつ入力が映像の場合に
は音楽開始点に対応する画像をアイコンとして表示し、
前記アイコンを指定することにより対応する音楽を再生
することを特徴とする。
【0013】さらに、情報目的を達成するために本発明
の請求項8記載の音楽検索装置は、音情報がアナログの
場合あるいは音情報を伴う映像情報がアナログの場合に
はA/D変換し、音情報あるいは音情報を伴う映像情報
がディジタルの場合にはそのまま入力する音・映像入力
部と、入力された信号から音楽が含まれる区間を検出す
る音楽検出部と、音情報から音楽以外の音が含まれる区
間を検出する背景音検出部と、音楽が含まれる区間の音
情報、および音楽のみが含まれる区間の開始/終了点、
および入力が映像の場合には音楽が含まれる区間の映像
ならびに音情報を蓄積する音楽・映像蓄積部と、蓄積さ
れた音楽の類似度を測定する類似度測定部と、類似度の
高い音楽を発生頻度順に表示する音楽表示部とを具備す
ることを特徴とする。
【0014】また、本発明の請求項9記載の音楽検索装
置は、音楽検出部において、音情報を周波数解析した際
のスペクトルのピークが周波数方向に時間的に安定して
いることを利用して音楽を検出することを特徴とする。
【0015】また、本発明の請求項10記載の音楽検索
装置は、背景音検出部において、くし形フィルタを用い
て音声の有声音に含まれる調波構造を検出し、背景音の
1つである音声を検出することを特徴とする。
【0016】また、本発明の請求項11記載の音楽検索
装置は、背景音検出部において、入力された音情報から
得られた周波数ケプストラム係数と符号帳とのユークリ
ッド距離が近いものを背景音として検出することを特徴
とする。
【0017】また、本発明の請求項12記載の音楽検索
装置は、類似度測定部において、蓄積された音情報の音
楽のみが含まれる区間における周波数スペクトルパワー
の立ち上がり周期から音楽の拍子を測定し、同等の拍子
を持つものだけを類似度の測定対象とすることを特徴と
する。
【0018】また、本発明の請求項13記載の音楽検索
装置は、類似度測定部において、蓄積された音情報の音
楽のみが含まれる区間における周波数スペクトルの相互
相関から、あるいは前記音情報の音楽のみが含まれる区
間の自己相関から得られたピッチの変化パターンの相互
相関から蓄積された音情報同士の類似度を測定すること
を特徴とする。
【0019】また、本発明の請求項14記載の音楽検索
装置は、音楽表示部において、類似度の高い音楽を順に
アイコンで表示するようにし、かつ入力が映像の場合に
は音楽開始点に対応する画像をアイコンとして表示し、
前記アイコンを指定することにより対応する音楽が再生
可能なことを特徴とする。
【0020】請求項1および8記載の音楽検索方法およ
び装置は、音情報がアナログの場合あるいは音情報を伴
う映像情報がアナログの場合にはA/D変換し、音情報
あるいは音情報を伴う映像情報がディジタルの場合には
そのまま入力し、入力された音情報から音楽が含まれる
区間を検出し、音情報から音楽以外の音が含まれる区間
を検出し、音楽が含まれる区間の音情報、および音楽の
みが含まれる区間の開始/終了点、および入力が映像の
場合には音楽が含まれる区間の映像ならびに音情報を蓄
積し、蓄積された音楽の類似度を測定し、類似度の高い
音楽を発生頻度順に表示することにより、繰り返し入力
される音楽を発生頻度に基づいて検索することが可能と
なる。
【0021】請求項2および9記載の音楽検索方法およ
び装置は、音情報を周波数解析した際のスペクトルのピ
ークが周波数方向に時間的に安定していることを利用す
ることにより音楽を検出することが可能となる。
【0022】請求項3および10記載の音楽検索方法お
よび装置は、くし形フィルタを用いて音声の有声音に含
まれる調波構造を検出することにより背景音の1つであ
る音声を検出することが可能となる。
【0023】請求項4および11記載の音楽検索方法お
よび装置は、入力された音情報から得られた周波数ケプ
ストラム係数と符号帳とのユークリッド距離を算出する
ことにより距離が近いものを背景音として検出すること
が可能となる。
【0024】請求項5および12記載の音楽検索方法お
よび装置は、蓄積された音情報の音楽のみが含まれる区
間における周波数スペクトルパワーの立ち上がり周期か
ら音楽の拍子を測定し、同等の拍子を持つものだけを類
似度の測定対象とすることにより検索対象の絞り込みが
可能となる。
【0025】請求項6および13記載の音楽検索方法お
よび装置は、蓄積された音情報の音楽のみが含まれる区
間における周波数スペクトルの相互相関から、あるいは
前記音情報の音楽のみが含まれる区間の自己相関から得
られたピッチの変化パターンの相互相関を用いることに
より蓄積された音情報同士の類似度を測定することが可
能となる。
【0026】請求項7および14記載の音楽検索方法お
よび装置は、類似度の高い音楽を順にアイコンで表示す
るようにし、かつ入力が映像の場合には音楽開始点に対
応する画像をアイコンとして表示することにより視覚的
に音楽を選択・再生することが可能となる。
【0027】
【発明の実施の形態】次に、本発明の実施の形態につい
て図面を参照して説明する。図1は本発明の一実施形態
の音楽検索装置の概略構成を示すブロック図である。本
実施形態の音楽検索装置は、音あるいは映像(音を含
む)を入力する音・映像入力部101と、入力された音
情報から音楽を検出する音楽検出部102と、音楽以外
の音を検出する背景音検出部103と、音楽のみが存在
する区間の類似度を測定する類似度測定部104と、類
似度の高い音楽を頻度順に表示し、指定された音楽を再
生する音楽表示部105と、検出された音楽、映像、音
楽のみが含まれる区間の開始/終了点を蓄積する音楽・
映像蓄積部106とから構成されている。また、再生時
に音楽あるいは映像を高速に読み出すため、音楽・映像
蓄積部106と音楽表示部105とは、高速なバスで接
続されている。
【0028】図2は音楽と背景音との物理的な性質の差
異を説明する図である。音楽のような周期性のある信号
のスペクトラムは、図2(a)に示す如く多くの特定の
周波数において急峻に立ち上がるピークをもつものとな
る。また逆に、背景音の場合には、そのスペクトラム
は、図2(b)に示す如く所定の周波数帯域内で拡がり
をもちかつ特定の周波数において小さいピークをもつも
のとなる。
【0029】図2(a)に示すようなスペクトラムをも
つ信号と図2(b)に示すようなスペクトラムをもつ信
号との夫々のケプストラム係数をとると、図2(a)の
場合のスペクトル包絡や図2(b)の場合のスペクトル
包絡を近似的に表現する値となることから、両者の特徴
の違いを定量的に評価することができる。
【0030】なおケプストラム係数は、処理対象の信号
についてフーリエ変換をとり、それの対数値を計算し、
その上で逆フーリエ変換をとる処理を行うことによって
得られる。なお上記フーリエ変換の代わりに線形予測法
を用いることもできる。
【0031】図3は本発明の一実施形態の処理の流れを
示すフローチャートである。本発明をソフトウェアで実
現した場合でも同様の処理の流れとなる。まず、入力さ
れた音情報を処理201においてフーリエ変換し、パワ
ースペクトルを算出する。次にパワースペクトルの周波
数方向の微分値を取ることによりパワースペクトルのピ
ークの位置を算出し、数秒間の平均持続時間PTを処理
202において算出する。
【0032】図4は音楽におけるスペクトルピークの持
続性を説明する図である。音楽のサウンドスペクトログ
ラムにおいて夫々の周波数毎の音圧の高い所即ち夫々の
周波数でのピークが時間的にどのように持続するかを模
式的に表すと、図4に示す如きものとなる。図4におい
て、横軸は時間tであり、縦軸は周波数fであり、個々
の周波数毎に音圧の高い所(ピーク)が持続している状
況が図示の水平方向の実線で表現されている。
【0033】この実線の長さ(時間的な長さ)が大であ
る程、当該ピークの持続時間が大きいことを表してい
る。したがって、図4に示す如く所定の時間間隔の窓を
考えて、当該窓の中において、図示の実線の長さの平均
値(平均持続時間PT)をとると、当該平均値の大きい
窓の所では音楽が含まれているものと判断される。
【0034】平均持続時間PTが閾値TH1を越えた場
合に入力された音情報に音楽が含まれると判断し、音情
報の蓄積を開始し、また入力に映像がある場合にはその
映像をも蓄積を開始する(処理203)。平均持続時間
PTが閾値以下の場合には、処理211において蓄積を
終了する。
【0035】次にくし形フィルタの出力CRを処理20
4において算出する。くし形フィルタは、周波数方向に
等間隔に配置された複数の帯域フィルタであるので、声
に含まれる調波構造を検出することで人の声を検出する
ことが可能である。
【0036】調波構造は音楽においても観測されるた
め、くし形フィルタは、音楽のスペクトル成分を除去し
た後に適用される。処理202において算出されたパワ
ースペクトルのピークのうち、周波数方向の時間的な変
動が少ないものの値を強制的に零とし、その周囲のスペ
クトルの値を用いて零にされたスペクトルの値を補完す
るようにする。音声のスペクトルは時間的な変動が激し
いので保存されることになる。
【0037】複数の帯域フィルタの夫々の出力の和であ
る出力CRが閾値TH2以上の時、音情報に声が存在す
ると判断され、背景音の存在する期間が開始したとして
処理210において背景音開始点を蓄積する。CRが閾
値TH2以下の場合には、一般には音楽の存在する期間
に当たるものであるがなお背景音が含まれることがあ
る。このために雑踏等様々な背景音を学習データとして
用いて予め生成されたコードブック(符号帳)と入力さ
れた音情報のスペクトルの特徴量とのユークリッド距離
EDを処理205において算出する。特徴量には、周波
数ケプストラム等を用いる。
【0038】EDが閾値TH3以上の場合には、背景音
の存在する期間とみて背景音開始点を処理210におい
て蓄積し、閾値以下の場合には、背景音終了点を処理2
06において蓄積する。
【0039】このようにして入力が終わった後は、いわ
ば音楽のみの期間について当該音楽の期間の抽出が終了
する。次いで、蓄積された音楽の音楽のみの部分を用い
て拍子の測定を処理207において行う。拍子の測定に
当たっては、スペクトルの急激な立ち上がりを検出し自
己相関係数を求めることによって行う。
【0040】次いで各々の音楽を数段階の拍子レベルに
分類し、同じレベルに属するものを対象にして類似度を
測定する(処理208)。類似度の測定には、一方のス
ペクトルと、もう一方のスペクトルの相互相関係数を求
めることにより行う。また、音楽のピッチを検出してそ
の変化のパターンの相関係数を求めることにより行うこ
とも可能である。相関係数の算出過程においては、自乗
誤差が大きくなった場合に計算を打ち切り、処理時間を
低減するSSDA法等を併用する。相関が高い音楽区間
の数を頻度とし、頻度の高い順に音楽区間に対応する映
像を静止画像のアイコンとして処理209において表示
する図5は、インタフェース上に表示されたアイコンの
様子を示している。アイコン301上には、音楽区間の
先頭に対応する画像が表示されるようにされており、ス
クロールバー302,303を用いて枠外のアイコンを
表示させる。マウス等のポインティングデバイスを用い
てアイコンを指定することにより、対応する音楽あるい
は映像が再生される。入力が映像ではなく音情報のみの
場合には、疑似的なアイコンを用いて表示することが可
能である。
【0041】
【発明の効果】
(1)請求項1および8の発明は、入力情報を必要に応
じてA/D変換し、入力された音情報から音楽が含まれ
る区間を検出し、音情報から音楽以外の音が含まれる区
間を検出し、音楽が含まれる区間の音情報ならびに映像
情報、および音楽のみが含まれる区間の開始/終了点を
蓄積し、蓄積された音楽の類似度を測定し、類似度の高
い音楽を発生頻度順に表示することにより、繰り返し入
力される音楽を発生頻度に基づいて検索することができ
る。 (2)請求項2および9の記載の発明は、音情報を周波
数解析した際のスペクトルのピークが周波数方向に時間
的に安定していることを利用することにより音楽を検出
することができる。 (3)請求項3および10の発明は、くし形フィルタを
用いて音声の有声音に含まれる調波構造を検出すること
により背景音の1つである音声を検出することができ
る。 (4)請求項4および11の記載の発明は、入力された
音情報から得られた周波数ケプストラム係数と符号帳と
のユークリッド距離を算出することにより距離が近いも
のを背景音として検出することができる。 (5)請求項5および12の記載の発明は、蓄積された
音情報の音楽のみが含まれる区間における周波数スペク
トルパワーの立ち上がり周期から音楽の拍子を測定し、
同等の拍子を持つものだけを類似度の測定対象とするこ
とにより検索対象の絞り込みができる。 (6)請求項6および13の記載の発明は、蓄積された
音情報の音楽のみが含まれる区間における周波数スペク
トルの相互相関から、あるいは前記音情報の音楽のみが
含まれる区間の自己相関から得られたピッチの変化パタ
ーンの相互相関を用いることにより蓄積された音情報同
士の類似度を測定することができる。 (7)請求項7および14の記載の発明は、類似度の高
い音楽を順にアイコンで表示するようにし、かつ入力が
映像の場合には音楽開始点に対応する画像をアイコンと
して表示することにより視覚的に音楽を選択・再生する
ことができる。
【図面の簡単な説明】
【図1】本発明の一実施形態の音楽検索装置の概略構成
を示すブロック図である。
【図2】音楽と背景音との物理的な性質の差異を説明す
る図である。
【図3】本発明の一実施形態の処理の流れを示すフロー
チャートである。
【図4】音楽におけるスペクトルピークの持続性を説明
する図である。
【図5】本発明の一実施形態の音楽検索装置の音楽表示
部の外観を示す図である。
【符号の説明】
101 音・映像入力部 102 音楽検出部 103 背景音検出部 104 類似度測定部 105 音楽表示部 106 音楽・映像蓄積部 201 FFT処理 202 ピーク持続時間算出処理 203 音・映像蓄積開始処理 204 くし形フィルタ適用処理 205 ユークリッド距離算出処理 206 背景音終了点蓄積処理 207 拍子測定処理 208 類似度測定処理 209 音楽表示処理 210 背景音開始点蓄積処理 211 音・映像蓄積終了処理 301 アイコン 302,303 スクロールバー

Claims (14)

    【特許請求の範囲】
  1. 【請求項1】 大量の音情報から同じ種類の音楽を識別
    し所望の音楽を検索する音楽検索方法であって、 音情報がアナログの場合あるいは音情報を伴う映像情報
    がアナログの場合にはA/D変換し、音情報あるいは音
    情報を伴う映像情報がディジタルの場合にはそのまま入
    力する音・映像入力段階と、 入力された信号から音楽が含まれる区間を検出する音楽
    検出段階と、 該音情報から音楽以外の音が含まれる区間を検出する背
    景音検出段階と、 音楽が含まれる区間の音情報、および音楽のみが含まれ
    る区間の開始/終了点、および入力が映像の場合には音
    楽が含まれる区間の映像ならびに音情報を蓄積する音楽
    ・映像蓄積段階と、 蓄積された音楽の類似度を測定する類似度測定段階と、 類似度の高い音楽を発生頻度順に表示する音楽表示段階
    と、 を有することを特徴とする音楽検索方法。
  2. 【請求項2】 該音楽検出段階は、該音情報を周波数解
    析した際のスペクトルのピークが周波数方向に時間的に
    安定していることを利用して音楽を検出することを特徴
    とする請求項1記載の音楽検索方法。
  3. 【請求項3】 該背景音検出段階は、くし形フィルタを
    用いて音声の有声音に含まれる調波構造を検出し、背景
    音の1つである音声を検出することを特徴とする請求項
    1または2記載の音楽検索方法。
  4. 【請求項4】 該背景音検出段階は、音楽および音声以
    外の音情報の周波数ケプストラム係数を学習データとし
    て用いて予め作成された符号帳と、入力された音情報か
    ら得られた周波数ケプストラム係数とのユークリッド距
    離が近いものを背景音として検出することを特徴とする
    請求項1、2または3記載の音楽検索方法。
  5. 【請求項5】 該類似度測定段階は、前記蓄積された音
    情報の音楽のみが含まれる区間における周波数スペクト
    ルパワーの立ち上がり周期から音楽の拍子を測定し、同
    等の拍子を持つものだけを類似度の測定対象とすること
    を特徴とする請求項1、2、3または4記載の音楽検索
    方法。
  6. 【請求項6】 該類似度測定段階は、前記蓄積された音
    情報の音楽のみが含まれる区間における周波数スペクト
    ルの相互相関から、あるいは前記音情報の音楽のみが含
    まれる区間の自己相関から得られたピッチの変化パター
    ンの相互相関から蓄積された音情報同士の類似度を測定
    することを特徴とする請求項1、2、3、4または5記
    載の音楽検索方法。
  7. 【請求項7】 該音楽表示段階は、類似度の高い音楽を
    順にアイコンで表示するようにし、かつ入力が映像の場
    合には音楽開始点に対応する画像をアイコンとして表示
    し、前記アイコンを指定することにより対応する音楽が
    再生可能なことを特徴とする請求項1、2、3、4、5
    または6記載の音楽検索方法。
  8. 【請求項8】 大量の音情報から同じ種類の音楽を識別
    し所望の音楽を検索する音楽検索装置であって、 音情報がアナログの場合あるいは音情報を伴う映像情報
    がアナログの場合にはA/D変換し、音情報あるいは音
    情報を伴う映像情報がディジタルの場合にはそのまま入
    力する音・映像入力部と、 入力された信号から音楽が含まれる区間を検出する音楽
    検出部と、 該音情報から音楽以外の音が含まれる区間を検出する背
    景音検出部と、 音楽が含まれる区間の音情報、および音楽のみが含まれ
    る区間の開始/終了点、および入力が映像の場合には音
    楽が含まれる区間の映像ならびに音情報を蓄積する音楽
    ・映像蓄積部と、 蓄積された音楽の類似度を測定する類似度測定部と、 類似度の高い音楽を発生頻度順に表示する音楽表示部
    と、 を具備することを特徴とする音楽検索装置。
  9. 【請求項9】 該音楽検出部は、該音情報を周波数解析
    した際のスペクトルのピークが周波数方向に時間的に安
    定していることを利用して音楽を検出することを特徴と
    する請求項8記載の音楽検索装置。
  10. 【請求項10】 該背景音検出部は、くし形フィルタを
    用いて音声の有声音に含まれる調波構造を検出し、背景
    音の1つである音声を検出することを特徴とする請求項
    8または9記載の音楽検索装置。
  11. 【請求項11】 該背景音検出部は、音楽および音声以
    外の音情報の周波数ケプストラム係数を学習データとし
    て用いて作成された符号帳と、入力された音情報から得
    られた周波数ケプストラム係数とのユークリッド距離が
    近いものを背景音として検出することを特徴とする請求
    項8、9または10記載の音楽検索装置。
  12. 【請求項12】 該類似度測定部は、前記蓄積された音
    情報の音楽のみが含まれる区間における周波数スペクト
    ルパワーの立ち上がり周期から音楽の拍子を測定し、同
    等の拍子を持つものだけを類似度の測定対象とすること
    を特徴とする請求項8、9、10または11記載の音楽
    検索装置。
  13. 【請求項13】 該類似度測定部は、前記蓄積された音
    情報の音楽のみが含まれる区間における周波数スペクト
    ルの相互相関から、あるいは前記音情報の音楽のみが含
    まれる区間の自己相関から得られたピッチの変化パター
    ンの相互相関から蓄積された音情報同士の類似度を測定
    することを特徴とする請求項8、9、10、11または
    12記載の音楽検索装置。
  14. 【請求項14】 該音楽表示部は、類似度の高い音楽を
    順にアイコンで表示するようにし、かつ入力が映像の場
    合には音楽開始点に対応する画像をアイコンとして表示
    し、前記アイコンを指定することにより対応する音楽が
    再生可能なことを特徴とする請求項8、9、10、1
    1、12または13記載の音楽検索装置。
JP11540897A 1997-05-06 1997-05-06 音情報処理方法および装置 Expired - Fee Related JP3569104B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11540897A JP3569104B2 (ja) 1997-05-06 1997-05-06 音情報処理方法および装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11540897A JP3569104B2 (ja) 1997-05-06 1997-05-06 音情報処理方法および装置

Publications (2)

Publication Number Publication Date
JPH10307580A true JPH10307580A (ja) 1998-11-17
JP3569104B2 JP3569104B2 (ja) 2004-09-22

Family

ID=14661837

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11540897A Expired - Fee Related JP3569104B2 (ja) 1997-05-06 1997-05-06 音情報処理方法および装置

Country Status (1)

Country Link
JP (1) JP3569104B2 (ja)

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000227795A (ja) * 1999-02-08 2000-08-15 Yamaha Corp コード進行検索装置および記憶媒体
JP2000347659A (ja) * 1999-03-26 2000-12-15 Nippon Telegr & Teleph Corp <Ntt> 音楽検索装置,音楽検索方法および音楽検索プログラムを記録した記録媒体
WO2001016935A1 (fr) * 1999-08-26 2001-03-08 Sony Corporation Procede et dispositif d'extraction/traitement d'informations, et procede et dispositif de stockage
KR20040000798A (ko) * 2002-06-25 2004-01-07 엘지전자 주식회사 음악 데이터의 점진적 분할 방법과 음악 데이터 검색방법
JP2004534274A (ja) * 2001-03-23 2004-11-11 インスティチュート・フォー・インフォコム・リサーチ 内容ベースのマルチメディア情報検索で使用するためデジタル表示で音楽情報を表示する方法およびシステム
KR100484902B1 (ko) * 2002-01-17 2005-04-25 주식회사 옵투스 음악선률 수치화에 의한 곡 저장 및 검색방법
KR100497356B1 (ko) * 2002-06-12 2005-06-23 삼성전자주식회사 주파수 분석을 이용한 노래선곡방법 및 장치
JP2008026836A (ja) * 2006-07-25 2008-02-07 Yamaha Corp 音声の類似度を評価する方法、装置およびプログラム
JP2008310138A (ja) * 2007-06-15 2008-12-25 Toshiba Corp シーン分類装置
JP2010517060A (ja) * 2007-01-17 2010-05-20 上海▲イ▼得▲網▼▲絡▼有限公司 音楽のセグメントの情報に基づいてサーチする音楽捜索方法
JP2010154342A (ja) * 2008-12-25 2010-07-08 Toshiba Corp 電子機器および映像コンテンツ情報表示方法
CN102750948A (zh) * 2011-04-19 2012-10-24 索尼公司 音乐搜索设备及方法、程序以及记录介质
JP2012226106A (ja) * 2011-04-19 2012-11-15 Sony Corp 楽曲区間検出装置および方法、プログラム、記録媒体、並びに楽曲信号検出装置
JP2015125238A (ja) * 2013-12-26 2015-07-06 Pioneer DJ株式会社 音声信号処理装置、音声信号処理装置の制御方法、プログラム
JPWO2021060041A1 (ja) * 2019-09-27 2021-04-01

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06176543A (ja) * 1992-12-08 1994-06-24 Matsushita Electric Ind Co Ltd オーディオデータベース構築処理装置
JPH07121556A (ja) * 1993-10-21 1995-05-12 Nippon Telegr & Teleph Corp <Ntt> 音楽情報検索装置
JPH09293083A (ja) * 1996-04-26 1997-11-11 Toshiba Corp 楽曲検索装置および検索方法
JPH10134549A (ja) * 1996-10-30 1998-05-22 Nippon Columbia Co Ltd 楽曲検索装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06176543A (ja) * 1992-12-08 1994-06-24 Matsushita Electric Ind Co Ltd オーディオデータベース構築処理装置
JPH07121556A (ja) * 1993-10-21 1995-05-12 Nippon Telegr & Teleph Corp <Ntt> 音楽情報検索装置
JPH09293083A (ja) * 1996-04-26 1997-11-11 Toshiba Corp 楽曲検索装置および検索方法
JPH10134549A (ja) * 1996-10-30 1998-05-22 Nippon Columbia Co Ltd 楽曲検索装置

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000227795A (ja) * 1999-02-08 2000-08-15 Yamaha Corp コード進行検索装置および記憶媒体
JP2000347659A (ja) * 1999-03-26 2000-12-15 Nippon Telegr & Teleph Corp <Ntt> 音楽検索装置,音楽検索方法および音楽検索プログラムを記録した記録媒体
WO2001016935A1 (fr) * 1999-08-26 2001-03-08 Sony Corporation Procede et dispositif d'extraction/traitement d'informations, et procede et dispositif de stockage
US7260226B1 (en) 1999-08-26 2007-08-21 Sony Corporation Information retrieving method, information retrieving device, information storing method and information storage device
US8165306B2 (en) 1999-08-26 2012-04-24 Sony Corporation Information retrieving method, information retrieving device, information storing method and information storage device
JP2004534274A (ja) * 2001-03-23 2004-11-11 インスティチュート・フォー・インフォコム・リサーチ 内容ベースのマルチメディア情報検索で使用するためデジタル表示で音楽情報を表示する方法およびシステム
KR100484902B1 (ko) * 2002-01-17 2005-04-25 주식회사 옵투스 음악선률 수치화에 의한 곡 저장 및 검색방법
KR100497356B1 (ko) * 2002-06-12 2005-06-23 삼성전자주식회사 주파수 분석을 이용한 노래선곡방법 및 장치
KR20040000798A (ko) * 2002-06-25 2004-01-07 엘지전자 주식회사 음악 데이터의 점진적 분할 방법과 음악 데이터 검색방법
JP2008026836A (ja) * 2006-07-25 2008-02-07 Yamaha Corp 音声の類似度を評価する方法、装置およびプログラム
JP2010517060A (ja) * 2007-01-17 2010-05-20 上海▲イ▼得▲網▼▲絡▼有限公司 音楽のセグメントの情報に基づいてサーチする音楽捜索方法
JP2008310138A (ja) * 2007-06-15 2008-12-25 Toshiba Corp シーン分類装置
JP2010154342A (ja) * 2008-12-25 2010-07-08 Toshiba Corp 電子機器および映像コンテンツ情報表示方法
CN102750948A (zh) * 2011-04-19 2012-10-24 索尼公司 音乐搜索设备及方法、程序以及记录介质
JP2012226080A (ja) * 2011-04-19 2012-11-15 Sony Corp 楽曲検索装置および方法、プログラム、並びに記録媒体
JP2012226106A (ja) * 2011-04-19 2012-11-15 Sony Corp 楽曲区間検出装置および方法、プログラム、記録媒体、並びに楽曲信号検出装置
CN102750948B (zh) * 2011-04-19 2016-05-18 索尼公司 音乐搜索设备及方法
JP2015125238A (ja) * 2013-12-26 2015-07-06 Pioneer DJ株式会社 音声信号処理装置、音声信号処理装置の制御方法、プログラム
JPWO2021060041A1 (ja) * 2019-09-27 2021-04-01
WO2021060041A1 (ja) * 2019-09-27 2021-04-01 ヤマハ株式会社 音響信号解析方法、音響信号解析システムおよびプログラム

Also Published As

Publication number Publication date
JP3569104B2 (ja) 2004-09-22

Similar Documents

Publication Publication Date Title
US7386357B2 (en) System and method for generating an audio thumbnail of an audio track
US7035742B2 (en) Apparatus and method for characterizing an information signal
US6542869B1 (en) Method for automatic analysis of audio including music and speech
EP1577877B1 (en) Musical composition reproduction method and device, and method for detecting a representative motif section in musical composition data
JP3433818B2 (ja) 楽曲検索装置
Tzanetakis et al. Marsyas: A framework for audio analysis
US8440900B2 (en) Intervalgram representation of audio for melody recognition
JP4243682B2 (ja) 音楽音響データ中のサビ区間を検出する方法及び装置並びに該方法を実行するためのプログラム
JP3569104B2 (ja) 音情報処理方法および装置
Klapuri Musical meter estimation and music transcription
US20120132056A1 (en) Method and apparatus for melody recognition
JP5127982B2 (ja) 音楽検索装置
JP3789326B2 (ja) テンポ抽出装置、テンポ抽出方法、テンポ抽出プログラム及び記録媒体
US20060075883A1 (en) Audio signal analysing method and apparatus
US20110067555A1 (en) Tempo detecting device and tempo detecting program
JP2007520727A (ja) 楽曲のようなサウンドシーケンスを処理する方法
JP2005292207A (ja) 音楽分析の方法
JP5182892B2 (ja) 音声検索方法,音声検索装置および音声検索プログラム
JP2010097084A (ja) 携帯端末、拍位置推定方法および拍位置推定プログラム
Alonso et al. A study of tempo tracking algorithms from polyphonic music signals
Thomas et al. Detection of largest possible repeated patterns in indian audio songs using spectral features
JP4347815B2 (ja) テンポ抽出装置およびテンポ抽出方法
US20040158437A1 (en) Method and device for extracting a signal identifier, method and device for creating a database from signal identifiers and method and device for referencing a search time signal
Dupont et al. Audiocycle: Browsing musical loop libraries
Ong et al. Music loop extraction from digital audio signals

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040209

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20040213

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040406

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040511

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040615

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040617

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090625

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090625

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100625

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100625

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110625

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120625

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130625

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees