JP2011180417A - 音楽音響信号のピッチ推定装置及び方法 - Google Patents
音楽音響信号のピッチ推定装置及び方法 Download PDFInfo
- Publication number
- JP2011180417A JP2011180417A JP2010045275A JP2010045275A JP2011180417A JP 2011180417 A JP2011180417 A JP 2011180417A JP 2010045275 A JP2010045275 A JP 2010045275A JP 2010045275 A JP2010045275 A JP 2010045275A JP 2011180417 A JP2011180417 A JP 2011180417A
- Authority
- JP
- Japan
- Prior art keywords
- cepstrum
- pitch
- coefficient
- sequence
- acoustic signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Auxiliary Devices For Music (AREA)
Abstract
【解決手段】ケプストラム分析部4は、音楽音響信号3を入力し、入力信号に対するケプストラム分析を行い、第1のケプストラム系列5を出力する。2次元フィルタ処理部6は、第1のケプストラム系列5中に分布するケプストラム成分を所望の座標点に統合するための係数を有する2次元フィルタを用いて、第2のケプストラム系列7を求める。ピッチ抽出部8は、第2のケプストラム系列7を用いてピッチ周波数を推定する。
【選択図】図1
Description
例えば特許文献1に示された装置では、雑音下で雑音区間のケプストラムを求め、雑音下ケプストラムで正規化されたケプストラムを用いてピッチ情報(周波数、強度)を求めていた。また、特許文献2に示された装置では、入力された音響信号から、時間−スペクトルパターンを離散コサイン変換してケプストラムの時間軸方向の変化を示す時間−ケプストラムパターンを生成し、このように生成された時間−ケプストラムパターンの周辺部が持つ特徴を周辺特徴パターンとして抽出していた。更に、特許文献3に示された装置では、N乗根スペクトルをフーリエ逆変換してN乗根ケプストラムを求め、公知のケプストラム法を用いて音源情報を抽出していた。
図1は、この発明の実施の形態1による音楽音響信号のピッチ推定装置を示す構成図である。
図示の装置は、伴奏抑圧部2、ケプストラム分析部4、2次元フィルタ処理部6、ピッチ抽出部8を備えている。伴奏抑圧部2は、左右のチャンネルの信号からなりステレオ録音された楽曲の音楽音響信号1を入力する。そして、入力されたステレオの音楽音響信号1から左右のチャンネルの中央に定位する信号成分を残し伴奏の楽器成分を抑圧した上でモノラル信号に変換する機能を有している。音楽音響信号3は、この伴奏抑圧部2の出力としてのモノラルの音楽音響信号である。ケプストラム分析部4は、モノラルの音楽音響信号3を分析して第1のケプストラムの系列を生成する機能部であり、第1のケプストラム系列5は、ケプストラム分析部4の出力である。2次元フィルタ処理部6は、第1のケプストラム系列5を入力として2次元のフィルタを掛け、目的のケプストラム成分を強調し、第2のケプストラム系列を出力する機能部であり、第2のケプストラム系列7はその出力である。ピッチ抽出部8は、第2のケプストラム系列7中のピッチのピークを追跡してピッチ情報を出力する機能部であり、ピッチ情報9は、ピッチ抽出部8が出力するピッチ情報である。
音楽音響信号1は44.1kHzでサンプリングされたPCMのステレオ信号である。伴奏抑圧部2は、中央定位しているボーカル成分を強調するために、例えば、電子情報通信学会2009年総合大会講演論文集199頁「A−10−4 ステレオ音楽音響信号からのボーカルピッチ抽出の検討」といった文献に記載された技術に従い、短時間周波数スペクトル上で左右の音量比とローカルピークの一致性に基づいて,中央定位しているボーカル成分を強調したモノラル音響信号を生成することによりボーカル成分を強調した音楽音響信号3を生成する。
ここで、第1のケプストラム系列5は、フレーム方向とケプストラムの次数方向(すなわちケフレンシ方向)からなる2次元の平面上にケプストラムが分布したものと捉えることができる。図2に2次元平面として捉えなおしたケプストラム系列を示す。
W(i,j*2)=B(2)*V(0)*H(0) (2)
W(i,j*2+1)=B(2)*V(1)*H(0) (3)
W(i−1,j*2)=B(2)*V(0)*H(−1) (4)
W(i,j*2−1)=B(2)*V(−1)*H(0) (5)
W(i+1,j*2)=B(2)*V(0)*H(+1) (6)
P(i,j)=W(i,j)/Σ{i,j} W(i,j)(上記のi,j) (7)
P(i,j)=0(上記以外のi,j) (8)
V(y)=exp(−|y|2/σ2) (10)
H(x)=1+cos(π|x|/L)(|x|≦Lのとき) (11)
H(x)=0 (|x|>Lのとき) (12)
A(i,j)=Σ{x,y} C(i+x,j+y)*P(i+x,j+y)
(13)
2次元フィルタ処理部6は、以上のようにして、第2のケプストラム中のピッチ周期の探索範囲の座標点71の範囲についてフィルタ演算を行う。
q(i)=argmax{y} A(i,y) (15)
f(i)=1/q(i) (g(i)>Θのとき) (16)
f(i)=0 (g(i)≦Θのとき) (17)
実施の形態2では、2次元フィルタ処理部における2次元フィルタ係数として、フレーム方向に離れるほどケフレンシ方向に広がりを持たせたものである。図面上の構成及び2次元フィルタ係数以外の構成は図1に示した実施の形態1と同様であるため、その他の構成についての説明は省略する。
図4は、実施の形態2のフィルタ係数を示す説明図である。図示のように、2次元フィルタ係数として、フレーム方向に離れるほどケフレンシ方向に広がりを持たせている。これにより、フレーム方向にピッチが揺らぐ場合でもピッチ成分を集約することができる。
実施の形態3において、図面上の構成は実施の形態1の図1と同様であるため、図1を用いて説明する。本実施の形態では、2次元フィルタ処理部6における2次元フィルタの出力は、ケプストラムの総和で正規化して、第2のケプストラム系列7の値に確率分布としての形状を持たせている。これにより、第2のケプストラム系列7中の相互の値どうしを直接比較が可能となっている。そして、これにより、ピッチ抽出部8におけるピッチに対応するピークの探索処理が最大値を求める処理で可能となっている。
(a)は音楽音響信号3の対数スペクトル系列(スペクトログラム)を示す図である。
(b)は第1のケプストラム系列5を2次元平面上に濃淡表示した図である。図中、黒丸が所望の座標点であり、矩形枠がフィルタの重み係数を示している。2次元フィルタ処理部6では、第1のケプストラム系列5に対して、フレーム間の連続性と周期の倍数関係を強調するフィルタを用いてピッチ成分を強調する。
(c)は、このようなフィルタ処理を行った第2のケプストラム系列7を2次元平面上に濃淡表示した図である。
(d)は第2のケプストラム系列7から抽出された本実施の形態によるピッチ周波数のグラフであり、実線が結果を、破線が正解を示している。
(e)は第1のケプストラム系列5から抽出された従来のケプストラム法によるピッチ周波数のグラフであり、実線が結果を、破線が正解を示している。
図6は、実施の形態4の音楽音響信号のピッチ推定装置を示す構成図である。
図示の装置は、伴奏抑圧部2、ケプストラム分析部4、2次元フィルタ処理部6a,6b、ピッチ抽出部81を備えている。本実施の形態では、ケフレンシ方向に係数の幅の大きいフィルタを有する2次元フィルタ処理部6a(ボーカル成分の検出用)と、ケフレンシ方向に係数の幅の小さいフィルタを有する2次元フィルタ処理部6b(楽器音成分の検出用)とを備えている。これら2次元フィルタ処理部6a,6bにより、それぞれのフィルタ出力からなる第2のケプストラム7a,7bを求め、ピッチ抽出部81では、それぞれの第2のケプストラム7a,7b中のケプストラム係数の最大のピークの大きさを求め、両者を比較し、第2のケプストラム7a(ボーカル成分の検出用)によるピークのほうが第2のケプストラム7b(楽器音成分の検出用)によるピークよりも大きい区間(すなわち基本周波数の揺らぎの大きい区間)をボーカルに対応したピッチ区間として抽出する。これにより、高調波成分が主体となる楽器音によるピッチのピークを抑圧することができる。
Claims (6)
- 入力信号に対するケプストラム分析により第1のケプストラム系列を求めるケプストラム分析部と、
前記第1のケプストラム係数に対して、当該第1のケプストラム系列中に分布するケプストラム成分を所望の座標点に統合するための係数を有する2次元フィルタを用いて、第2のケプストラム系列を求める2次元フィルタ処理部と、
前記第2のケプストラム系列中に分布するケプストラム成分に基づいてピッチ周波数を推定するピッチ抽出部とを備えたことを特徴とする音楽音響信号のピッチ推定装置。 - 2次元フィルタの係数は、少なくとも所望の座標点の周期の整数倍の周期の座標またはその周辺の座標にある第1のケプストラム系列中の成分を集約する係数であることを特徴とする請求項1記載の音楽音響信号のピッチ推定装置。
- 2次元フィルタの係数は、少なくとも所望の座標点の前後のフレームの座標点またはその周辺の座標にある第1のケプストラム系列中の成分を集約する係数であることを特徴とする請求項1または請求項2に記載の音楽音響信号のピッチ推定装置。
- 2次元フィルタ処理部の出力は、ケプストラムの総和で正規化して、第2のケプストラム系列の値に確率分布としての形状を持たせたものであることを特徴とする請求項1から請求項3のうちのいずれか1項記載の音楽音響信号のピッチ推定装置。
- 2次元フィルタ処理部は、それぞれケフレンシ方向に係数の幅の異なる2つのフィルタを備え、それぞれのフィルタ出力として第2のケプストラム系列を出力し、ピッチ抽出部は、これら2つの第2のケプストラム系列に基づいて、基本周波数の揺らぎの大きい区間をボーカルに対応したピッチ区間として抽出することを特徴とする請求項1から請求項4のうちのいずれか1項記載の音楽音響信号のピッチ推定装置。
- 請求項1に記載の音楽音響信号のピッチ推定装置を用いて入力信号からピッチ周波数を推定する音楽音響信号のピッチ推定方法であって、
入力信号に対するケプストラム分析により第1のケプストラム系列を求めるケプストラム分析過程と、
前記第1のケプストラム係数に対して、当該第1のケプストラム系列中に分布するケプストラム成分を所望の座標点に統合するための係数を有する2次元フィルタを用いて、第2のケプストラム系列を求めるフィルタ過程と、
前記第2のケプストラム系列中に分布するケプストラム成分に基づいてピッチ周波数を推定するピッチ抽出過程とを備えたことを特徴とする音楽音響信号のピッチ推定方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010045275A JP5495858B2 (ja) | 2010-03-02 | 2010-03-02 | 音楽音響信号のピッチ推定装置及び方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010045275A JP5495858B2 (ja) | 2010-03-02 | 2010-03-02 | 音楽音響信号のピッチ推定装置及び方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011180417A true JP2011180417A (ja) | 2011-09-15 |
JP5495858B2 JP5495858B2 (ja) | 2014-05-21 |
Family
ID=44691949
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010045275A Expired - Fee Related JP5495858B2 (ja) | 2010-03-02 | 2010-03-02 | 音楽音響信号のピッチ推定装置及び方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5495858B2 (ja) |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0255398A (ja) * | 1988-08-20 | 1990-02-23 | Masayuki Kimura | 相対関係に基づく音声認識方式 |
JPH09210763A (ja) * | 1996-02-07 | 1997-08-15 | Nec Corp | 高調波ピッチ検出装置 |
JPH10133693A (ja) * | 1996-10-28 | 1998-05-22 | Nec Corp | 音声認識装置 |
JPH10288982A (ja) * | 1997-04-14 | 1998-10-27 | Roland Corp | ディジタルフィルタ及び信号抽出装置 |
JP2000200090A (ja) * | 1998-12-29 | 2000-07-18 | Nec Corp | ピッチ情報抽出装置及びピッチ情報抽出方法ならびにピッチ情報抽出プログラムを格納した記憶媒体 |
JP2008015388A (ja) * | 2006-07-10 | 2008-01-24 | Dds:Kk | 歌唱力評価方法及びカラオケ装置 |
JP2008015211A (ja) * | 2006-07-06 | 2008-01-24 | Dds:Kk | ピッチ抽出方法、歌唱力評価方法、歌唱訓練プログラム及びカラオケ装置 |
JP2008281776A (ja) * | 2007-05-10 | 2008-11-20 | Mitsubishi Electric Corp | 旋律抽出装置及び旋律抽出方法 |
JP2009069425A (ja) * | 2007-09-12 | 2009-04-02 | Sharp Corp | 音楽検出装置、音声検出装置、および音場制御装置 |
JP2009210593A (ja) * | 2008-02-29 | 2009-09-17 | Toshiba Corp | 特徴量抽出装置、方法及びプログラム |
-
2010
- 2010-03-02 JP JP2010045275A patent/JP5495858B2/ja not_active Expired - Fee Related
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0255398A (ja) * | 1988-08-20 | 1990-02-23 | Masayuki Kimura | 相対関係に基づく音声認識方式 |
JPH09210763A (ja) * | 1996-02-07 | 1997-08-15 | Nec Corp | 高調波ピッチ検出装置 |
JPH10133693A (ja) * | 1996-10-28 | 1998-05-22 | Nec Corp | 音声認識装置 |
JPH10288982A (ja) * | 1997-04-14 | 1998-10-27 | Roland Corp | ディジタルフィルタ及び信号抽出装置 |
JP2000200090A (ja) * | 1998-12-29 | 2000-07-18 | Nec Corp | ピッチ情報抽出装置及びピッチ情報抽出方法ならびにピッチ情報抽出プログラムを格納した記憶媒体 |
JP2008015211A (ja) * | 2006-07-06 | 2008-01-24 | Dds:Kk | ピッチ抽出方法、歌唱力評価方法、歌唱訓練プログラム及びカラオケ装置 |
JP2008015388A (ja) * | 2006-07-10 | 2008-01-24 | Dds:Kk | 歌唱力評価方法及びカラオケ装置 |
JP2008281776A (ja) * | 2007-05-10 | 2008-11-20 | Mitsubishi Electric Corp | 旋律抽出装置及び旋律抽出方法 |
JP2009069425A (ja) * | 2007-09-12 | 2009-04-02 | Sharp Corp | 音楽検出装置、音声検出装置、および音場制御装置 |
JP2009210593A (ja) * | 2008-02-29 | 2009-09-17 | Toshiba Corp | 特徴量抽出装置、方法及びプログラム |
Non-Patent Citations (2)
Title |
---|
CSNG200900509016; 竹内 英世 Hideyo Takeuchi: 'カラオケ採点用の高分解能ピッチ抽出法' 電気学会論文誌C Vol.129 No.10 IEEJ , 20091001, p.1889-1901, (社)電気学会 The Institute of Electrical Engine * |
JPN6013022658; 竹内 英世 Hideyo Takeuchi: 'カラオケ採点用の高分解能ピッチ抽出法' 電気学会論文誌C Vol.129 No.10 IEEJ , 20091001, p.1889-1901, (社)電気学会 The Institute of Electrical Engine * |
Also Published As
Publication number | Publication date |
---|---|
JP5495858B2 (ja) | 2014-05-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9111526B2 (en) | Systems, method, apparatus, and computer-readable media for decomposition of a multichannel music signal | |
Liutkus et al. | Adaptive filtering for music/voice separation exploiting the repeating musical structure | |
US9646592B2 (en) | Audio signal analysis | |
JP5992427B2 (ja) | 信号におけるピッチおよび/または基本周波数に関するパターンを推定する方法および装置 | |
KR20180050652A (ko) | 음향 신호를 사운드 객체들로 분해하는 방법 및 시스템, 사운드 객체 및 그 사용 | |
FitzGerald | Vocal separation using nearest neighbours and median filtering | |
JP2015525895A (ja) | オーディオ信号分析 | |
Magron et al. | Phase reconstruction of spectrograms with linear unwrapping: application to audio signal restoration | |
JP6174856B2 (ja) | 雑音抑制装置、その制御方法、及びプログラム | |
CN102054480A (zh) | 一种基于分数阶傅立叶变换的单声道混叠语音分离方法 | |
Mittal et al. | Study of characteristics of aperiodicity in Noh voices | |
WO2010097870A1 (ja) | 音楽検索装置 | |
JP2010210758A (ja) | 音声を含む信号の処理方法及び装置 | |
JP2005266797A (ja) | 音源信号分離装置及び方法、並びにピッチ検出装置及び方法 | |
JP5614261B2 (ja) | 雑音抑制装置、雑音抑制方法、及びプログラム | |
Benetos et al. | Auditory spectrum-based pitched instrument onset detection | |
Amado et al. | Pitch detection algorithms based on zero-cross rate and autocorrelation function for musical notes | |
JP5325130B2 (ja) | Lpc分析装置、lpc分析方法、音声分析合成装置、音声分析合成方法及びプログラム | |
JP5495858B2 (ja) | 音楽音響信号のピッチ推定装置及び方法 | |
JP3849679B2 (ja) | 雑音除去方法、雑音除去装置およびプログラム | |
Reddy et al. | Predominant melody extraction from vocal polyphonic music signal by combined spectro-temporal method | |
Rao et al. | A comparative study of various pitch detection algorithms | |
Sajid et al. | An Effective Framework for Speech and Music Segregation | |
JP2011164497A (ja) | テンポ値検出装置およびテンポ値検出方法 | |
Ingale et al. | Singing voice separation using mono-channel mask |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120815 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130412 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130514 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130702 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140204 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140304 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5495858 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |