JP3569104B2 - 音情報処理方法および装置 - Google Patents

音情報処理方法および装置 Download PDF

Info

Publication number
JP3569104B2
JP3569104B2 JP11540897A JP11540897A JP3569104B2 JP 3569104 B2 JP3569104 B2 JP 3569104B2 JP 11540897 A JP11540897 A JP 11540897A JP 11540897 A JP11540897 A JP 11540897A JP 3569104 B2 JP3569104 B2 JP 3569104B2
Authority
JP
Japan
Prior art keywords
music
sound
sound information
information
section
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP11540897A
Other languages
English (en)
Other versions
JPH10307580A (ja
Inventor
憲一 南
明人 阿久津
佳伸 外村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP11540897A priority Critical patent/JP3569104B2/ja
Publication of JPH10307580A publication Critical patent/JPH10307580A/ja
Application granted granted Critical
Publication of JP3569104B2 publication Critical patent/JP3569104B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

【0001】
【発明の属する技術分野】
本発明は、音楽情報検索の効率化を図った音楽検索方法および装置に関する。
【0002】
【従来の技術】
音楽情報を検索する際には、曲名、作詩・作曲者名、歌手名といったキーワードを用いる方法があるが、キーワードの付与を自動的に行うことは難しく、大量の情報を扱う場合にはデータベースの構築に多大な労力を要する。また、曲名等が不明な場合の検索が不可能である。
【0003】
このような問題を解決するために、音楽の旋律情報を手がかりとして検索方法が報告されており、パーソナルコンピュータのキーボードを鍵盤楽器に見立て、旋律を入力するもの(石塚ら:“パーソナルコンピュータによる音楽情報検索システムの開発1.旋律検索”、図書館情報大学研究報告、Vol.6,No.1,pp.95−105,1987)や、曲を口ずさみ、そのピッチを旋律として入力するもの(“蔭山ら:ハミング歌唱を手掛かりとするメロディ検索、電子情報通信学会論文誌、D−II,Vol.J77.No.8,pp.1543−1551,1994)がある。入力と音楽データベースとの整合には、旋律情報の動的プログラミング(DP)を行う方法を用いている。
【0004】
【発明の解決しようとする課題】
日常生活において音楽の情報を得る機会は、テレビ放送による場合が少なくない。繰り返し流れる音楽を聞いているうちにその曲に対する印象を持つようになり、視聴の欲求を喚起する場合がある。しかし、うろ覚えのメロディ(旋律)程度の情報しか持たない場合には旋律の入力が困難であり、所望の音楽を特定することは難しい。更にテレビ放送では、音楽に会話やナレーションなどの音声が重なる場合が多いため、旋律を自動的かつ正確に検出できる対象は限定されてしまう。また、旋律を用いる方法では、同じ曲であっても旋律の時間的な変化が異なる場合に対処するために、時間方向のずれを許容するようなDPが必要であり、計算コストを増加させる原因となっている。
【0005】
本発明の目的は、音情報の音楽のみの区間について拍子を測定し、大局的な類似性で測定対象を絞り込んだ後、周波数スペクトルの相関を用いて効率的に音楽の整合および検索が可能にすることにある。
【0006】
【課題を解決するための手段】
上記目的を達成するために本発明の請求項1記載の音楽検索方法は、音楽および/または音楽以外の音からなる音情報と、当該音情報を伴う映像情報と、当該音情報を伴わない映像情報とが音・映像入力信号として入力される音・映像入力部をそなえると共に、当該音・映像入力部に入力された音・映像入力情報の中から音楽が含まれる区間を検出する音楽検出部をそなえ、かつ当該音楽検出部を経て蓄積された個々の音楽についての相互間の類似度を測定する類似度測定部を少なくともそなえる音楽検出装置における音楽検索方法であって、
音情報がアナログの場合あるいは音情報を伴う映像情報がアナログの場合にはA/D変換し、音情報あるいは音情報を伴う映像情報がディジタルの場合にはそのまま入力する音・映像入力段階と、
入力された音・映像入力信号からの音情報にもとづいて音楽が含まれる区間を検出する音楽検出段階と、
該音情報から音楽以外の音が含まれる区間を検出する背景音検出段階と、
音楽が含まれる区間の音情報、および当該音情報中に音楽のみが含まれる区間の開始/終了点、および前記音・映像入力信号中に映像情報が存在する場合には当該映像情報中に音楽が含まれている区間の映像情報および当該音楽が含まれている区間の音情報を蓄積する音楽・映像蓄積段階と、
蓄積された個々の音楽同士の類似度を測定する類似度測定段階と、
類似度の高い音楽を、前記音・映像入力信号中での発生頻度順に表示する音楽表示段階と、
を有することを特徴とする。
【0007】
また、本発明の請求項2記載の音楽検索方法は、音楽検出段階において、該音情報を周波数解析した際のスペクトルのピークが周波数方向に時間的に安定していることを利用して音楽を検出して音楽が含まれる区間を検出することを特徴とする。
【0008】
また、本発明の請求項3記載の音楽検索方法は、背景音検出段階において、くし形フィルタを用いて音声の有声音に含まれる調波構造を検出し、背景音の1つである音声を検出して音楽以外の音が含まれる区間を検出することを特徴とする。
【0009】
また、本発明の請求項4記載の音楽検索方法は、背景音検出段階において、入力された音情報から得られた周波数ケプストラム係数と符号帳とのユークリッド距離が近いものを背景音として検出して音楽以外の音が含まれる区間を検出することを特徴とする。
【0010】
また、本発明の請求項5記載の音楽検索方法は、類似度測定段階において、蓄積された音情報の音楽が含まれる区間における周波数スペクトルパワーの立ち上がり周期から音楽の拍子を測定し、同等の拍子を持つものだけを、前記蓄積された個々の音楽同士の類似度を測定する測定対象とすることを特徴とする。
【0011】
また、本発明の請求項6記載の音楽検索方法は、類似度測定段階において、蓄積された音情報の音楽が含まれる区間における周波数スペクトルの相互相関から、あるいは前記音情報の音楽が含まれる区間の自己相関から得られたピッチの変化パターンの相互相関から、前記蓄積された個々の音情報同士の類似度を測定することを特徴とする。
【0012】
また、本発明の請求項7記載の音楽検索方法は、音楽表示段階において、類似度の高い音楽を順にアイコンで表示するようにし、かつ音・映像入力信号が音情報を伴う映像情報である場合には音楽開始点に対応する画像をアイコンとして表示することを特徴とする。
【0013】
さらに、情報目的を達成するために本発明の請求項8記載の音楽検索装置は、音楽および/または音楽以外の音からなる音情報と、当該音情報を伴う映像情報と、当該音情報を伴わない映像情報とが音・映像入力信号として入力され、当該音・映像入力信号の中から同じ種類の音楽を識別し所望の音楽を検索する音楽検索装置であって、
音情報がアナログの場合あるいは音情報を伴う映像情報がアナログの場合にはA/D変換し、音情報あるいは音情報を伴う映像情報がディジタルの場合にはそのまま入力する音・映像入力部と、
入力された音・映像入力信号からの音情報にもとづいて音楽が含まれる区間を検出する音楽検出部と、
該音情報から音楽以外の音が含まれる区間を検出する背景音検出部と、
音楽が含まれる区間の音情報、および当該音情報中に音楽のみが含まれる区間の開始/終了点、および前記音・映像入力信号中に映像情報が存在する場合には当該映像情報中に音楽が含まれる区間の映像情報および当該音楽が含まれている区間の音情報を蓄積する音楽・映像蓄積部と、
蓄積された個々の音楽同士の類似度を測定する類似度測定部と、
類似度の高い音楽を、前記音・映像入力信号中での発生頻度順に表示する音楽表示部と、
を具備することを特徴とする。
【0014】
また、本発明の請求項9記載の音楽検索装置は、音楽検出部において、音情報を周波数解析した際のスペクトルのピークが周波数方向に時間的に安定していることを利用して音楽を検出して音楽が含まれる区間を検出することを特徴とする。
【0015】
また、本発明の請求項10記載の音楽検索装置は、背景音検出部において、くし形フィルタを用いて音声の有声音に含まれる調波構造を検出し、背景音の1つである音声を検出して音楽以外の音が含まれる区間を検出することを特徴とする。
【0016】
また、本発明の請求項11記載の音楽検索装置は、背景音検出部において、入力された音情報から得られた周波数ケプストラム係数と符号帳とのユークリッド距離が近いものを背景音として検出して音楽以外の音が含まれる区間を検出することを特徴とする。
【0017】
また、本発明の請求項12記載の音楽検索装置は、類似度測定部において、蓄積された音情報の音楽が含まれる区間における周波数スペクトルパワーの立ち上がり周期から音楽の拍子を測定し、同等の拍子を持つものだけを類似度の測定対象とすることを特徴とする。
【0018】
また、本発明の請求項13記載の音楽検索装置は、類似度測定部において、蓄積された音情報の音楽が含まれる区間における周波数スペクトルの相互相関から、あるいは前記音情報の音楽が含まれる区間の自己相関から得られたピッチの変化パターンの相互相関から、前記蓄積された個々の音情報同士の類似度を測定することを特徴とする。
【0019】
また、本発明の請求項14記載の音楽検索装置は、音楽表示部において、類似度の高い音楽を順にアイコンで表示するようにし、かつ音・映像入力信号が音情報を伴う映像情報である場合には音楽開始点に対応する画像をアイコンとして表示することを特徴とする。
【0020】
請求項1および8記載の音楽検索方法および装置は、音情報がアナログの場合あるいは音情報を伴う映像情報がアナログの場合にはA/D変換し、音情報あるいは音情報を伴う映像情報がディジタルの場合にはそのまま入力し、入力された音・映像入力信号からの音情報にもとづいて音楽が含まれる区間を検出し、音情報から音楽以外の音が含まれる区間を検出し、音楽が含まれる区間の音情報、および当該音情報中に音楽のみが含まれる区間の開始/終了点、および前記音・映像入力信号中に映像情報が存在する場合には当該映像情報中に音楽が含まれる区間の映像情報および当該音楽が含まれている区間の音情報を蓄積し、蓄積された個々の音楽同士の類似度を測定し、類似度の高い音楽を、前記音・映像入力信号中での発生頻度順に表示することにより、繰り返し入力される音楽を発生頻度に基づいて検索することが可能となる。
【0021】
請求項2および9記載の音楽検索方法および装置は、音情報を周波数解析した際のスペクトルのピークが周波数方向に時間的に安定していることを利用することにより音楽を検出して音楽が含まれる区間を検出することが可能となる。
【0022】
請求項3および10記載の音楽検索方法および装置は、くし形フィルタを用いて音声の有声音に含まれる調波構造を検出することにより背景音の1つである音声を検出して音楽以外の音が含まれる区間を検出することが可能となる。
【0023】
請求項4および11記載の音楽検索方法および装置は、入力された音情報から得られた周波数ケプストラム係数と符号帳とのユークリッド距離を算出することにより距離が近いものを背景音として検出して音楽以外の音が含まれる区間を検出することが可能となる。
【0024】
請求項5および12記載の音楽検索方法および装置は、蓄積された音情報の音楽が含まれる区間における周波数スペクトルパワーの立ち上がり周期から音楽の拍子を測定し、同等の拍子を持つものだけを、前記蓄積された個々の音楽同士の類似度を測定する測定対象とすることにより検索対象の絞り込みが可能となる。
【0025】
請求項6および13記載の音楽検索方法および装置は、蓄積された音情報の音楽が含まれる区間における周波数スペクトルの相互相関から、あるいは前記音情報の音楽が含まれる区間の自己相関から得られたピッチの変化パターンの相互相関から、前記蓄積された個々の音情報同士の類似度を測定することが可能となる。
【0026】
請求項7および14記載の音楽検索方法および装置は、類似度の高い音楽を順にアイコンで表示するようにし、かつ音・映像入力信号が音情報を伴う映像情報である場合には音楽開始点に対応する画像をアイコンとして表示することが可能となる。
【0027】
【発明の実施の形態】
次に、本発明の実施の形態について図面を参照して説明する。
図1は本発明の一実施形態の音楽検索装置の概略構成を示すブロック図である。本実施形態の音楽検索装置は、音・映像入力信号が入力される音・映像入力部101と、入力された音情報から音楽を検出する音楽検出部102と、音楽以外の音を検出する背景音検出部103と、音楽のみが存在する区間の音楽同士の類似度を測定する類似度測定部104と、類似度の高い音楽を頻度順に表示し、指定された音楽を再生する音楽表示部105と、検出された音楽、映像、音楽のみが含まれる区間の開始/終了点を蓄積する音楽・映像蓄積部106とから構成されている。また、再生時に音楽あるいは映像を高速に読み出すため、音楽・映像蓄積部106と音楽表示部105とは、高速なバスで接続されている。
【0028】
図2は音楽と背景音との物理的な性質の差異を説明する図である。音楽のような周期性のある信号のスペクトラムは、図2(a)に示す如く多くの特定の周波数において急峻に立ち上がるピークをもつものとなる。また逆に、背景音の場合には、そのスペクトラムは、図2(b)に示す如く所定の周波数帯域内で拡がりをもちかつ特定の周波数において小さいピークをもつものとなる。
【0029】
図2(a)に示すようなスペクトラムをもつ信号と図2(b)に示すようなスペクトラムをもつ信号との夫々のケプストラム係数をとると、図2(a)の場合のスペクトル包絡や図2(b)の場合のスペクトル包絡を近似的に表現する値となることから、両者の特徴の違いを定量的に評価することができる。
【0030】
なおケプストラム係数は、処理対象の信号についてフーリエ変換をとり、それの対数値を計算し、その上で逆フーリエ変換をとる処理を行うことによって得られる。なお上記フーリエ変換の代わりに線形予測法を用いることもできる。
【0031】
図3は本発明の一実施形態の処理の流れを示すフローチャートである。本発明をソフトウェアで実現した場合でも同様の処理の流れとなる。
まず、入力された音情報を処理201においてフーリエ変換し、パワースペクトルを算出する。次にパワースペクトルの周波数方向の微分値を取ることによりパワースペクトルのピークの位置を算出し、数秒間の平均持続時間PTを処理202において算出する。
【0032】
図4は音楽におけるスペクトルピークの持続性を説明する図である。
音楽のサウンドスペクトログラムにおいて夫々の周波数毎の音圧の高い所即ち夫々の周波数でのピークが時間的にどのように持続するかを模式的に表すと、図4に示す如きものとなる。図4において、横軸は時間tであり、縦軸は周波数fであり、個々の周波数毎に音圧の高い所(ピーク)が持続している状況が図示の水平方向の実線で表現されている。
【0033】
この実線の長さ(時間的な長さ)が大である程、当該ピークの持続時間が大きいことを表している。したがって、図4に示す如く所定の時間間隔の窓を考えて、当該窓の中において、図示の実線の長さの平均値(平均持続時間PT)をとると、当該平均値の大きい窓の所では音楽が含まれているものと判断される。
【0034】
平均持続時間PTが閾値TH1を越えた場合に入力された音情報に音楽が含まれると判断し、音情報の蓄積を開始し、また入力に映像がある場合にはその映像をも蓄積を開始する(処理203)。平均持続時間PTが閾値以下の場合には、処理211において蓄積を終了する。
【0035】
次にくし形フィルタの出力CRを処理204において算出する。くし形フィルタは、周波数方向に等間隔に配置された複数の帯域フィルタであるので、声に含まれる調波構造を検出することで人の声を検出することが可能である。
【0036】
調波構造は音楽においても観測されるため、くし形フィルタは、音楽のスペクトル成分を除去した後に適用される。処理202において算出されたパワースペクトルのピークのうち、周波数方向の時間的な変動が少ないものの値を強制的に零とし、その周囲のスペクトルの値を用いて零にされたスペクトルの値を補完するようにする。音声のスペクトルは時間的な変動が激しいので保存されることになる。
【0037】
複数の帯域フィルタの夫々の出力の和である出力CRが閾値TH2以上の時、音情報に声が存在すると判断され、背景音の存在する期間が開始したとして処理210において背景音開始点を蓄積する。CRが閾値TH2以下の場合には、一般には音楽の存在する期間に当たるものであるがなお背景音が含まれることがある。このために雑踏等様々な背景音を学習データとして用いて予め生成されたコードブック(符号帳)と入力された音情報のスペクトルの特徴量とのユークリッド距離EDを処理205において算出する。特徴量には、周波数ケプストラム等を用いる。
【0038】
EDが閾値TH3以上の場合には、背景音の存在する期間とみて背景音開始点を処理210において蓄積し、閾値以下の場合には、背景音終了点を処理206において蓄積する。
【0039】
このようにして入力が終わった後は、いわば音楽のみの期間について当該音楽の期間の抽出が終了する。次いで、蓄積された音楽の音楽のみの部分を用いて拍子の測定を処理207において行う。拍子の測定に当たっては、スペクトルの急激な立ち上がりを検出し自己相関係数を求めることによって行う。
【0040】
次いで各々の音楽を数段階の拍子レベルに分類し、同じレベルに属するものを対象にして類似度を測定する(処理208)。類似度の測定には、一方のスペクトルと、もう一方のスペクトルの相互相関係数を求めることにより行う。また、音楽のピッチを検出してその変化のパターンの相関係数を求めることにより行うことも可能である。相関係数の算出過程においては、自乗誤差が大きくなった場合に計算を打ち切り、処理時間を低減するSSDA法等を併用する。相関が高い音楽区間の数を頻度とし、頻度の高い順に音楽区間に対応する映像を静止画像のアイコンとして処理209において表示する。
【0041】
【発明の効果】
(1)請求項1および8の発明は、入力情報を必要に応じてA/D変換し、入力された音情報から音楽が含まれる区間を検出し、音情報から音楽以外の音が含まれる区間を検出し、音楽が含まれる区間の音情報ならびに映像情報、および音楽のみが含まれる区間の開始/終了点を蓄積し、蓄積された音楽の類似度を測定し、類似度の高い音楽を発生頻度順に表示することにより、繰り返し入力される音楽を発生頻度に基づいて検索することができる。
(2)請求項2および9の記載の発明は、音情報を周波数解析した際のスペクトルのピークが周波数方向に時間的に安定していることを利用することにより音楽を検出することができる。
(3)請求項3および10の発明は、くし形フィルタを用いて音声の有声音に含まれる調波構造を検出することにより背景音の1つである音声を検出することができる。
(4)請求項4および11の記載の発明は、入力された音情報から得られた周波数ケプストラム係数と符号帳とのユークリッド距離を算出することにより距離が近いものを背景音として検出することができる。
(5)請求項5および12の記載の発明は、蓄積された音情報の音楽のみが含まれる区間における周波数スペクトルパワーの立ち上がり周期から音楽の拍子を測定し、同等の拍子を持つものだけを類似度の測定対象とすることにより検索対象の絞り込みができる。
(6)請求項6および13の記載の発明は、蓄積された音情報の音楽のみが含まれる区間における周波数スペクトルの相互相関から、あるいは前記音情報の音楽のみが含まれる区間の自己相関から得られたピッチの変化パターンの相互相関を用いることにより蓄積された音情報同士の類似度を測定することができる。
(7)請求項7および14の記載の発明は、類似度の高い音楽を順にアイコンで表示するようにし、かつ入力が映像の場合には音楽開始点に対応する画像をアイコンとして表示することにより視覚的に音楽を選択・再生することができる。
【図面の簡単な説明】
【図1】本発明の一実施形態の音楽検索装置の概略構成を示すブロック図である。
【図2】音楽と背景音との物理的な性質の差異を説明する図である。
【図3】本発明の一実施形態の処理の流れを示すフローチャートである。
【図4】音楽におけるスペクトルピークの持続性を説明する図である。
【図5】本発明の一実施形態の音楽検索装置の音楽表示部の外観を示す図である。
【符号の説明】
101 音・映像入力部
102 音楽検出部
103 背景音検出部
104 類似度測定部
105 音楽表示部
106 音楽・映像蓄積部
201 FFT処理
202 ピーク持続時間算出処理
203 音・映像蓄積開始処理
204 くし形フィルタ適用処理
205 ユークリッド距離算出処理
206 背景音終了点蓄積処理
207 拍子測定処理
208 類似度測定処理
209 音楽表示処理
210 背景音開始点蓄積処理
211 音・映像蓄積終了処理
301 アイコン
302,303 スクロールバー

Claims (14)

  1. 映像情報を伴う音情報または映像情報を伴わない音情報を入力する音・映像入力段階と、
    入力された音情報にもとづいて音楽が含まれる区間を検出する音楽検出段階と、
    前記の音楽が含まれる区間の音情報から音楽以外の音が含まれる区間を検出する背景音検出段階と、
    音楽が含まれる区間の音情報、および当該音情報中音楽のみが含まれる区間の開始/終了点、および音情報が映像情報を伴う場合には音楽が含まれている区間の映像情報を蓄積する音楽・映像蓄積段階と、
    個々に蓄積された音楽が含まれる区間の音情報から、音楽のみが含まれる区間の音情報を音楽のみが含まれる区間の開始/終了点から抽出し、個々の音楽のみが含まれる区間の音情報同士の類似度を測定する類似度測定段階と、
    類似度の高い音楽のみが含まれる区間の音情報の数が多い順に、個々の蓄積された音楽が含まれる区間の音情報に対応する表示情報を並べて表示する音楽表示段階と、
    指定された表示情報に対応する音楽が含まれる区間の音情報を再生する音楽再生段階と
    を有することを特徴とする音情報処理方法。
  2. 該音楽検出段階は、該音情報を周波数解析した際のスペクトルのピークが時間軸方向に一定時間安定している区間を音楽が含まれる区間として検出することを特徴とする請求項1記載の音情報処理方法。
  3. 該背景音検出段階は、くし型フィルタを用いて背景音の1つである音声を検出して音楽以外の音が含まれる区間を検出することを特徴とする請求項1または2記載の音情報処理方法。
  4. 該背景音検出段階は、音楽および音声以外の音情報の周波数ケプストラム係数を学習データとして用いて予め作成された符号帳と、入力された音情報から得られた周波数ケプストラム係数とのユークリッド距離が近いものを背景音として検出して音楽以外の音が含まれる区間を検出することを特徴とする請求項1、2または3記載の音情報処理方法。
  5. 該類似度測定段階は、前記蓄積された音楽のみが含まれる区間の音情報における周波数スペクトルパワーの立ち上がり周期から音楽の拍子を測定し、同等の拍子を持つものだけを、前記蓄積された個々の音楽のみが含まれる区間の音情報同士の類似度を測定する測定対象とすることを特徴とする請求項1、2、3または4記載の音情報処理方法。
  6. 該類似度測定段階は、前記蓄積された音楽のみが含まれる区間の音情報における周波数スペクトルの相互相関から、あるいは前記音楽のみが含まれる区間の音情報の自己相関から得られたピッチの変化パターンの相互相関から、前記蓄積された個々の音楽のみが含まれる区間の音情報同士の類似度を測定することを特徴とする請求項1、2、3、4または5記載の音情報処理方法。
  7. 該音楽表示段階は、類似度の高い音楽のみが含まれる区間を順にアイコンで表示するようにし、かつ音情報が映像情報を伴う場合には音楽が含まれる区間の開始点に対応する画像をアイコンとして表示することを特徴とする請求項1、2、3、4、5または6記載の音情報処理方法。
  8. 映像情報を伴う音情報または映像情報を伴わない音情報を入力する音・映像入力部と、
    入力された音情報にもとづいて音楽が含まれる区間を検出する音楽検出部と、
    前記の音楽が含まれる区間の音情報から音楽以外の音が含まれる区間を検出する背景音検出部と、
    音楽が含まれる区間の音情報、および当該音情報音楽のみが含まれる区間の開始/終了点、および音情報が映像情報を伴う場合には音楽が含まれている区間の映像情報を蓄積する音楽・映像蓄積部と、
    個々に蓄積された音楽が含まれる区間の音情報から、音楽のみが含まれる区間の音情報を音楽のみが含まれる区間の開始/終了点から抽出し、個々の音楽のみが含まれる区間の音情報同士の類似度を測定する類似度測定部と、
    類似度の高い音楽のみが含まれる区間の音情報の数が多い順に、個々の蓄積された音楽が含まれる区間の音情報に対応する表示情報を並べて表示する音楽表示部と、
    指定された表示情報に対応する音楽が含まれる区間の音情報を再生する音楽再生部と
    を具備することを特徴とする音情報処理装置。
  9. 該音楽検出部は、該音情報を周波数解析した際のスペクトルのピークが時間軸方向に一定時間安定している区間を音楽が含まれる区間として検出することを特徴とする請求項8記載の音情報処理装置。
  10. 該背景音検出部は、くし形フィルタを用いて背景音の1つである音声を検出して音楽以外の音が含まれる区間を検出することを特徴とする請求項8または9記載の音情報処理装置。
  11. 該背景音検出部は、音楽および音声以外の音情報の周波数ケプストラム係数を学習データとして用いて予め作成された符号帳と、入力された音情報から得られた周波数ケプストラム係数とのユークリッド距離が近いものを背景音として検出して音楽以外の音が含まれる区間を検出することを特徴とする請求項8、9または10記載の音情報処理装置。
  12. 該類似度測定部は、前記蓄積された音楽のみが含まれる区間の音情報における周波数スペクトルパワーの立ち上がり周期から音楽の拍子を測定し、同等の拍子を持つものだけを、前記蓄積された個々の音楽のみが含まれる区間の音情報同士の類似度を測定する測定対象とすることを特徴とする請求項請求項8、9、10または11記載の音情報処理装置。
  13. 該類似度測定部は、前記蓄積された音楽のみが含まれる区間の音情報における周波数スペクトルの相互相関から、あるいは前記音楽のみが含まれる区間の音情報の自己相関から得られたピッチの変化パターンの相互相関から、前記蓄積された個々の音楽のみが含まれる区間の音情報同士の類似度を測定することを特徴とする請求項8、9、10、11または12記載の音情報処理装置。
  14. 該音楽表示部は、類似度の高い音楽のみが含まれる区間を順にアイコンで表示するようにし、かつ音情報が映像情報を伴う場合には音楽が含まれる区間の開始点に対応する画像をアイコンとして表示する
    ことを特徴とする請求項8、9、10、11、12または13記載の音情報処理装置。
JP11540897A 1997-05-06 1997-05-06 音情報処理方法および装置 Expired - Fee Related JP3569104B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11540897A JP3569104B2 (ja) 1997-05-06 1997-05-06 音情報処理方法および装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11540897A JP3569104B2 (ja) 1997-05-06 1997-05-06 音情報処理方法および装置

Publications (2)

Publication Number Publication Date
JPH10307580A JPH10307580A (ja) 1998-11-17
JP3569104B2 true JP3569104B2 (ja) 2004-09-22

Family

ID=14661837

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11540897A Expired - Fee Related JP3569104B2 (ja) 1997-05-06 1997-05-06 音情報処理方法および装置

Country Status (1)

Country Link
JP (1) JP3569104B2 (ja)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3637952B2 (ja) * 1999-02-08 2005-04-13 ヤマハ株式会社 コード進行検索装置および記憶媒体
JP3631650B2 (ja) * 1999-03-26 2005-03-23 日本電信電話株式会社 音楽検索装置,音楽検索方法および音楽検索プログラムを記録した計算機読み取り可能な記録媒体
EP1887561A3 (en) 1999-08-26 2008-07-02 Sony Corporation Information retrieving method, information retrieving device, information storing method and information storage device
WO2003005242A1 (en) * 2001-03-23 2003-01-16 Kent Ridge Digital Labs Method and system of representing musical information in a digital representation for use in content-based multimedia information retrieval
KR100484902B1 (ko) * 2002-01-17 2005-04-25 주식회사 옵투스 음악선률 수치화에 의한 곡 저장 및 검색방법
KR100497356B1 (ko) * 2002-06-12 2005-06-23 삼성전자주식회사 주파수 분석을 이용한 노래선곡방법 및 장치
KR20040000798A (ko) * 2002-06-25 2004-01-07 엘지전자 주식회사 음악 데이터의 점진적 분할 방법과 음악 데이터 검색방법
JP2008026836A (ja) * 2006-07-25 2008-02-07 Yamaha Corp 音声の類似度を評価する方法、装置およびプログラム
CN101226526A (zh) * 2007-01-17 2008-07-23 上海怡得网络有限公司 一种基于音乐片段信息查询的音乐搜索方法
JP4985134B2 (ja) * 2007-06-15 2012-07-25 富士通東芝モバイルコミュニケーションズ株式会社 シーン分類装置
JP5039020B2 (ja) * 2008-12-25 2012-10-03 株式会社東芝 電子機器および映像コンテンツ情報表示方法
JP2012226106A (ja) * 2011-04-19 2012-11-15 Sony Corp 楽曲区間検出装置および方法、プログラム、記録媒体、並びに楽曲信号検出装置
JP5732994B2 (ja) * 2011-04-19 2015-06-10 ソニー株式会社 楽曲検索装置および方法、プログラム、並びに記録媒体
JP6263382B2 (ja) * 2013-12-26 2018-01-17 Pioneer DJ株式会社 音声信号処理装置、音声信号処理装置の制御方法、プログラム
WO2021060041A1 (ja) * 2019-09-27 2021-04-01 ヤマハ株式会社 音響信号解析方法、音響信号解析システムおよびプログラム

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06176543A (ja) * 1992-12-08 1994-06-24 Matsushita Electric Ind Co Ltd オーディオデータベース構築処理装置
JPH07121556A (ja) * 1993-10-21 1995-05-12 Nippon Telegr & Teleph Corp <Ntt> 音楽情報検索装置
JPH09293083A (ja) * 1996-04-26 1997-11-11 Toshiba Corp 楽曲検索装置および検索方法
JPH10134549A (ja) * 1996-10-30 1998-05-22 Nippon Columbia Co Ltd 楽曲検索装置

Also Published As

Publication number Publication date
JPH10307580A (ja) 1998-11-17

Similar Documents

Publication Publication Date Title
JP3569104B2 (ja) 音情報処理方法および装置
JP3433818B2 (ja) 楽曲検索装置
JP4949687B2 (ja) ビート抽出装置及びビート抽出方法
US7386357B2 (en) System and method for generating an audio thumbnail of an audio track
US9542917B2 (en) Method for extracting representative segments from music
US6542869B1 (en) Method for automatic analysis of audio including music and speech
US7812241B2 (en) Methods and systems for identifying similar songs
EP1577877B1 (en) Musical composition reproduction method and device, and method for detecting a representative motif section in musical composition data
KR20070099501A (ko) 노래 학습 시스템 및 방법
JP2002278547A (ja) 楽曲検索方法、楽曲検索用データ登録方法、楽曲検索装置及び楽曲検索用データ登録装置
US20060075883A1 (en) Audio signal analysing method and apparatus
JP5127982B2 (ja) 音楽検索装置
CN110010159B (zh) 声音相似度确定方法及装置
JP2002116754A (ja) テンポ抽出装置、テンポ抽出方法、テンポ抽出プログラム及び記録媒体
JP2007520727A (ja) 楽曲のようなサウンドシーケンスを処理する方法
Mayer et al. Multimodal aspects of music retrieval: Audio, song lyrics–and beyond?
JP3716725B2 (ja) 音声処理装置、音声処理方法および情報記録媒体
JP2007072023A (ja) 情報処理装置及び情報処理方法
Thomas et al. Detection of largest possible repeated patterns in indian audio songs using spectral features
JP4024440B2 (ja) 曲検索システムのデータ入力装置
JP4347815B2 (ja) テンポ抽出装置およびテンポ抽出方法
JP2008040260A (ja) 楽曲練習支援装置、動的時間整合モジュールおよびプログラム
EP0367191B1 (en) Automatic music transcription method and system
US20040158437A1 (en) Method and device for extracting a signal identifier, method and device for creating a database from signal identifiers and method and device for referencing a search time signal
Dupont et al. Audiocycle: Browsing musical loop libraries

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040209

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20040213

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040406

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040511

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040615

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040617

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090625

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090625

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100625

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100625

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110625

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120625

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130625

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees