JP2011180417A - 音楽音響信号のピッチ推定装置及び方法 - Google Patents

音楽音響信号のピッチ推定装置及び方法 Download PDF

Info

Publication number
JP2011180417A
JP2011180417A JP2010045275A JP2010045275A JP2011180417A JP 2011180417 A JP2011180417 A JP 2011180417A JP 2010045275 A JP2010045275 A JP 2010045275A JP 2010045275 A JP2010045275 A JP 2010045275A JP 2011180417 A JP2011180417 A JP 2011180417A
Authority
JP
Japan
Prior art keywords
cepstrum
pitch
coefficient
sequence
acoustic signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2010045275A
Other languages
English (en)
Other versions
JP5495858B2 (ja
Inventor
Yoshiharu Abe
芳春 阿部
Masaya Takahashi
真哉 高橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2010045275A priority Critical patent/JP5495858B2/ja
Publication of JP2011180417A publication Critical patent/JP2011180417A/ja
Application granted granted Critical
Publication of JP5495858B2 publication Critical patent/JP5495858B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Auxiliary Devices For Music (AREA)

Abstract

【課題】伴奏や背景音を伴う音声からでも安定したピッチ推定を行える音楽音響信号のピッチ推定方法を提供する。
【解決手段】ケプストラム分析部4は、音楽音響信号3を入力し、入力信号に対するケプストラム分析を行い、第1のケプストラム系列5を出力する。2次元フィルタ処理部6は、第1のケプストラム系列5中に分布するケプストラム成分を所望の座標点に統合するための係数を有する2次元フィルタを用いて、第2のケプストラム系列7を求める。ピッチ抽出部8は、第2のケプストラム系列7を用いてピッチ周波数を推定する。
【選択図】図1

Description

本発明は、主旋律のピッチに基づいて楽曲を検索するため、音楽音響信号中の主旋律のピッチ周波数の推定する方法に関し、特に、伴奏を伴う歌唱曲の主旋律のメロディーを推定するために、歌手のボーカル成分のピッチ周波数を推定する音楽音響信号のピッチ推定装置及び方法に関する。
従来から、人間の発する音声のピッチ周波数を推定する方法として、ケプストラム法によるピッチ推定法が知られている。音声の対数スペクトルは、基本周波数の高調波成分に対応する周期的な微細構造を有するが、これを逆フーリエ変換したケプストラムでは、基本周期に対応する位置に鋭いピークとなって現れるため、ケプストラムのピークを検出することでピッチ周期を求めることが出来る。すなわち、ケプストラム法では、入力した音声波形を一定の時間間隔で切り出し、フーリエ変換を行って対数を取ることにより対数スペクトルを求め、更に逆フーリエ変換を行うことによりケプストラム係数を求め、求められたケプストラム係数のうちで、所望するピッチ探索範囲とサンプリング周波数に基づいて決定されるケプストラム次数におけるケプストラム係数の最大値を探索し、最大値を与える次数に基づいてピッチ周波数を求める。
ケプストラムを用いる従来の技術として、次のものが知られている。
例えば特許文献1に示された装置では、雑音下で雑音区間のケプストラムを求め、雑音下ケプストラムで正規化されたケプストラムを用いてピッチ情報(周波数、強度)を求めていた。また、特許文献2に示された装置では、入力された音響信号から、時間−スペクトルパターンを離散コサイン変換してケプストラムの時間軸方向の変化を示す時間−ケプストラムパターンを生成し、このように生成された時間−ケプストラムパターンの周辺部が持つ特徴を周辺特徴パターンとして抽出していた。更に、特許文献3に示された装置では、N乗根スペクトルをフーリエ逆変換してN乗根ケプストラムを求め、公知のケプストラム法を用いて音源情報を抽出していた。
特開2000−200090号公報 特開2002−278580号公報 特開2007−47422号公報
従来のケプストラム法は、伴奏や背景音を伴わない歌声の音声からピッチ情報を抽出する場合には極めて効果的である。しかしながら、一般に、音楽音響信号には歌声とともに伴奏が存在するため、音楽音響信号のケプストラムには、歌声のピークとともに、伴奏の楽器音によるピーク、歌声成分と楽器音成分の干渉によるピークなど複数のピークを含む。このため、音楽音響信号中の歌声のピッチ情報の抽出が不安定になるという課題があった。
本発明は上記のような問題点を解決するためなされたもので、伴奏や背景音を伴う音声からでも安定したピッチ推定を行える音楽音響信号のピッチ推定方法を提供することを目的とする。
この発明に係る音楽音響信号のピッチ推定装置は、入力信号に対するケプストラム分析により第1のケプストラム系列を求めるケプストラム分析部と、第1のケプストラム係数に対して、第1のケプストラム系列中に分布するケプストラム成分を所望の座標点に統合するための係数を有する2次元フィルタを用いて、第2のケプストラム系列を求める2次元フィルタ処理部と、第2のケプストラム系列中に分布するケプストラム成分に基づいてピッチ周波数を推定するピッチ抽出部とを備えたものである。
この発明の音楽音響信号のピッチ推定装置は、第1のケプストラム系列中に分布するケプストラム成分を所望の座標点に統合するための係数を有する2次元フィルタを用いて、第2のケプストラム系列を求めるようにしたので、伴奏や背景音を伴う音声からでも安定したピッチ推定を行うことができる。
この発明の実施の形態1による音楽音響信号のピッチ推定装置を示す構成図である。 この発明の実施の形態1の音楽音響信号のピッチ推定装置による2次元平面上に展開される第1のケプストラム系列を示す説明図である。 この発明の実施の形態1の音楽音響信号のピッチ推定装置による2次元フィルタ処理を示す説明図である。 この発明の実施の形態2の音楽音響信号のピッチ推定装置によるフィルタ係数を示す説明図である。 この発明の実施の形態3の音楽音響信号のピッチ推定装置による分析例を示す説明図である。 この発明の実施の形態4による音楽音響信号のピッチ推定装置を示す構成図である。
実施の形態1.
図1は、この発明の実施の形態1による音楽音響信号のピッチ推定装置を示す構成図である。
図示の装置は、伴奏抑圧部2、ケプストラム分析部4、2次元フィルタ処理部6、ピッチ抽出部8を備えている。伴奏抑圧部2は、左右のチャンネルの信号からなりステレオ録音された楽曲の音楽音響信号1を入力する。そして、入力されたステレオの音楽音響信号1から左右のチャンネルの中央に定位する信号成分を残し伴奏の楽器成分を抑圧した上でモノラル信号に変換する機能を有している。音楽音響信号3は、この伴奏抑圧部2の出力としてのモノラルの音楽音響信号である。ケプストラム分析部4は、モノラルの音楽音響信号3を分析して第1のケプストラムの系列を生成する機能部であり、第1のケプストラム系列5は、ケプストラム分析部4の出力である。2次元フィルタ処理部6は、第1のケプストラム系列5を入力として2次元のフィルタを掛け、目的のケプストラム成分を強調し、第2のケプストラム系列を出力する機能部であり、第2のケプストラム系列7はその出力である。ピッチ抽出部8は、第2のケプストラム系列7中のピッチのピークを追跡してピッチ情報を出力する機能部であり、ピッチ情報9は、ピッチ抽出部8が出力するピッチ情報である。
次に、実施の形態1の動作を説明する。
音楽音響信号1は44.1kHzでサンプリングされたPCMのステレオ信号である。伴奏抑圧部2は、中央定位しているボーカル成分を強調するために、例えば、電子情報通信学会2009年総合大会講演論文集199頁「A−10−4 ステレオ音楽音響信号からのボーカルピッチ抽出の検討」といった文献に記載された技術に従い、短時間周波数スペクトル上で左右の音量比とローカルピークの一致性に基づいて,中央定位しているボーカル成分を強調したモノラル音響信号を生成することによりボーカル成分を強調した音楽音響信号3を生成する。
ケプストラム分析部4は、音楽音響信号3に対して、アンチエイリアスのためのLPFを掛け、ダウンサンプリングを行い、サンプリング周波数を1/4の11.0125kHzの信号に変換する。そして、プリエンファシスを行った後、ハミングの時間窓を一定のフレーム周期で移動させてフレームを切り出し、各フレームに対してフーリエ変換を行いスペクトルを求め、その対数をとり対数スペクトルに変換する。さらに、逆フーリエ変換によりケプストラム係数に変換し、第1のケプストラム系列5として出力する。
ここで、第1のケプストラム系列5は、フレーム方向とケプストラムの次数方向(すなわちケフレンシ方向)からなる2次元の平面上にケプストラムが分布したものと捉えることができる。図2に2次元平面として捉えなおしたケプストラム系列を示す。
2次元フィルタ処理部6は、2次元平面に分布するケプストラム係数に対して、所定の重み係数をもつ2次元フィルタを掛ける。図3は2次元フィルタの係数の与え方を示す。所望の座標点61の値を求めるための2次元フィルタの係数は、座標点61自身の係数と、座標点61と同一フレームにあり、かつ座標点61のケフレンシの整数倍(ここでは2倍)の位置にある座標点62に対する係数と、この座標点62の周辺の上下左右にある座標点63〜66に対する係数を有する。具体的には、所望の座標点61のフレーム方向の座標をi、ケフレンシ方向の座標をjとすると、2次元フィルタの係数は、図3の場合、以下の式(1)〜(8)で与えられる。
W(i,j)=B(1)*V(0)*H(0) (1)
W(i,j*2)=B(2)*V(0)*H(0) (2)
W(i,j*2+1)=B(2)*V(1)*H(0) (3)
W(i−1,j*2)=B(2)*V(0)*H(−1) (4)
W(i,j*2−1)=B(2)*V(−1)*H(0) (5)
W(i+1,j*2)=B(2)*V(0)*H(+1) (6)
P(i,j)=W(i,j)/Σ{i,j} W(i,j)(上記のi,j) (7)
P(i,j)=0(上記以外のi,j) (8)
ここで、P(i,j)がフィルタ係数であり、W(i,j)は座標(i,j)にある座標点に対する重み係数である。上記(i,j)以外の係数P(i,j)は0である。また、Σ{i,j} W(i,j)は上記(i,j)に関するW(i,j)の総和を表す。また、B(n)はケフレンシの倍数nの増大とともに小さくなる重み関数、V(y)はケフレンシ方向の座標のずれ量|y|(記号|x|はxの絶対値を表す)とともに減少する重み関数、H(x)はフレーム方向の座標のずれ量|x|とともに減少する重み関数である。重み関数のB,V,Hの関数形はそれぞれ以下の式(9)〜(12)で示される。ここで、σはケフレンシ方向の分布の広がりのパラメータで例えば0.9、Lはフレーム方向の分布の広がりのパラメータで例えば5である。
B(n)=1/n (9)
V(y)=exp(−|y|/σ) (10)
H(x)=1+cos(π|x|/L)(|x|≦Lのとき) (11)
H(x)=0 (|x|>Lのとき) (12)
上記のフィルタ係数を第1のケプストラム系列5中のピッチ周期の存在範囲についてフィルタ演算を行いフィルタ処理結果を得る。例えば、所望の座標点(i,j)のフィルタ演算は式(13)のように行う。ここで、総和演算Σの範囲{x,y}は式(1)〜(6)のWの係数の存在範囲について行う。ここで、A(i,j)は所望の座標点(i,j)における第2のケプストラム係数である。
A(i,j)=Σ{x,y} C(i+x,j+y)*P(i+x,j+y)
(13)
2次元フィルタ処理部6は、以上のようにして、第2のケプストラム中のピッチ周期の探索範囲の座標点71の範囲についてフィルタ演算を行う。
最後に、ピッチ抽出部8は、第2のケプストラム系列7をフレーム方向に探索し、各フレームにおけるケプストラムについて、ケフレンシ方向にケプストラム係数の最大のピークを探索し、このピークの値とこのピークの存在するケフレンシを求め、ケフレンシの逆数として、ピッチ周波数を決定する。もし、ピークの値が所定の閾値より小さいときは、無声音であると判定し、ピッチを0として出力する。ピッチ抽出処理は、式(14)の演算により行う。ここで、式(14)〜(17)中、iはフレーム番号、g(i)はピークの値(最大値)、q(i)はピークのケフレンシ、f(i)はピッチ周波数、Θは閾値である。また、max{y}は、添え字yに関する最大値演算を表す。また、argmax{y}は、最大値演算(max{y})において最大値を与える添え字yを求める演算を表す。
g(i)=max{y} A(i,y) (14)
q(i)=argmax{y} A(i,y) (15)
f(i)=1/q(i) (g(i)>Θのとき) (16)
f(i)=0 (g(i)≦Θのとき) (17)
以上のように、実施の形態1の音楽音響信号のピッチ推定装置によれば、入力信号に対するケプストラム分析により第1のケプストラム系列を求めるケプストラム分析部と、第1のケプストラム係数に対して、第1のケプストラム系列中に分布するケプストラム成分を所望の座標点に統合するための係数を有する2次元フィルタを用いて、第2のケプストラム系列を求める2次元フィルタ処理部と、第2のケプストラム系列中に分布するケプストラム成分に基づいてピッチ周波数を推定するピッチ抽出部とを備えたので、伴奏や背景音を伴う音声からでも安定したピッチ推定を行うことができる。
また、実施の形態1の音楽音響信号のピッチ推定装置によれば、2次元フィルタの係数は、少なくとも所望の座標点の周期の整数倍の周期の座標またはその周辺の座標にある第1のケプストラム系列中の成分を集約する係数であるようにしたので、より安定したピッチ推定を行うことができる。
また、実施の形態1の音楽音響信号のピッチ推定装置によれば、2次元フィルタの係数は、少なくとも所望の座標点の前後のフレームの座標点またはその周辺の座標にある第1のケプストラム系列中の成分を集約する係数であるようにしたので、より安定したピッチ推定を行うことができる。
また、実施の形態1の音楽音響信号のピッチ推定方法によれば、実施の形態1に記載の音楽音響信号のピッチ推定装置を用いて入力信号からピッチ周波数を推定する音楽音響信号のピッチ推定方法であって、入力信号に対するケプストラム分析により第1のケプストラム系列を求めるケプストラム分析過程と、第1のケプストラム係数に対して、第1のケプストラム系列中に分布するケプストラム成分を所望の座標点に統合するための係数を有する2次元フィルタを用いて、第2のケプストラム系列を求めるフィルタ過程と、第2のケプストラム系列中に分布するケプストラム成分に基づいてピッチ周波数を推定するピッチ抽出過程とを備えたので、伴奏や背景音を伴う音声からでも安定したピッチ推定を行うことができる。
実施の形態2.
実施の形態2では、2次元フィルタ処理部における2次元フィルタ係数として、フレーム方向に離れるほどケフレンシ方向に広がりを持たせたものである。図面上の構成及び2次元フィルタ係数以外の構成は図1に示した実施の形態1と同様であるため、その他の構成についての説明は省略する。
図4は、実施の形態2のフィルタ係数を示す説明図である。図示のように、2次元フィルタ係数として、フレーム方向に離れるほどケフレンシ方向に広がりを持たせている。これにより、フレーム方向にピッチが揺らぐ場合でもピッチ成分を集約することができる。
実施の形態3.
実施の形態3において、図面上の構成は実施の形態1の図1と同様であるため、図1を用いて説明する。本実施の形態では、2次元フィルタ処理部6における2次元フィルタの出力は、ケプストラムの総和で正規化して、第2のケプストラム系列7の値に確率分布としての形状を持たせている。これにより、第2のケプストラム系列7中の相互の値どうしを直接比較が可能となっている。そして、これにより、ピッチ抽出部8におけるピッチに対応するピークの探索処理が最大値を求める処理で可能となっている。
以上の処理を音楽音響処理に適用したときの例を図5に示す。
(a)は音楽音響信号3の対数スペクトル系列(スペクトログラム)を示す図である。
(b)は第1のケプストラム系列5を2次元平面上に濃淡表示した図である。図中、黒丸が所望の座標点であり、矩形枠がフィルタの重み係数を示している。2次元フィルタ処理部6では、第1のケプストラム系列5に対して、フレーム間の連続性と周期の倍数関係を強調するフィルタを用いてピッチ成分を強調する。
(c)は、このようなフィルタ処理を行った第2のケプストラム系列7を2次元平面上に濃淡表示した図である。
(d)は第2のケプストラム系列7から抽出された本実施の形態によるピッチ周波数のグラフであり、実線が結果を、破線が正解を示している。
(e)は第1のケプストラム系列5から抽出された従来のケプストラム法によるピッチ周波数のグラフであり、実線が結果を、破線が正解を示している。
図5において、(b)と(c)を比較するとピッチに対応するピークが強調されていることがわかる。また、(d)と(e)を比較するとピッチが安定して抽出されていることが分かる。
以上のように、実施の形態3の音楽音響信号のピッチ推定装置によれば、2次元フィルタ処理部6の出力は、ケプストラムの総和で正規化して、第2のケプストラム系列の値に確率分布としての形状を持たせたものとしたので、ピッチを安定して抽出することが出来る。
実施の形態4.
図6は、実施の形態4の音楽音響信号のピッチ推定装置を示す構成図である。
図示の装置は、伴奏抑圧部2、ケプストラム分析部4、2次元フィルタ処理部6a,6b、ピッチ抽出部81を備えている。本実施の形態では、ケフレンシ方向に係数の幅の大きいフィルタを有する2次元フィルタ処理部6a(ボーカル成分の検出用)と、ケフレンシ方向に係数の幅の小さいフィルタを有する2次元フィルタ処理部6b(楽器音成分の検出用)とを備えている。これら2次元フィルタ処理部6a,6bにより、それぞれのフィルタ出力からなる第2のケプストラム7a,7bを求め、ピッチ抽出部81では、それぞれの第2のケプストラム7a,7b中のケプストラム係数の最大のピークの大きさを求め、両者を比較し、第2のケプストラム7a(ボーカル成分の検出用)によるピークのほうが第2のケプストラム7b(楽器音成分の検出用)によるピークよりも大きい区間(すなわち基本周波数の揺らぎの大きい区間)をボーカルに対応したピッチ区間として抽出する。これにより、高調波成分が主体となる楽器音によるピッチのピークを抑圧することができる。
以上のように、実施の形態4の音楽音響信号のピッチ推定装置によれば、2次元フィルタ処理部6a,6bは、それぞれケフレンシ方向に係数の幅の異なる2つのフィルタを備え、それぞれのフィルタ出力として第2のケプストラム系列を出力し、ピッチ抽出部8は、これら2つの第2のケプストラム系列に基づいて、基本周波数の揺らぎの大きい区間をボーカルに対応したピッチ区間として抽出するようにしたので、高調波成分が主体となる楽器音によるピッチのピークを抑圧することができる。
1 音楽音響信号(ステレオ)、2 伴奏抑圧部、3 音楽音響信号(モノラル)、4 ケプストラム分析部、5 第1のケプストラム系列、6,6a,6b 2次元フィルタ処理部、7,7a,7b 第2のケプストラム系列、8,81 ピッチ抽出部、9 ピッチ情報。

Claims (6)

  1. 入力信号に対するケプストラム分析により第1のケプストラム系列を求めるケプストラム分析部と、
    前記第1のケプストラム係数に対して、当該第1のケプストラム系列中に分布するケプストラム成分を所望の座標点に統合するための係数を有する2次元フィルタを用いて、第2のケプストラム系列を求める2次元フィルタ処理部と、
    前記第2のケプストラム系列中に分布するケプストラム成分に基づいてピッチ周波数を推定するピッチ抽出部とを備えたことを特徴とする音楽音響信号のピッチ推定装置。
  2. 2次元フィルタの係数は、少なくとも所望の座標点の周期の整数倍の周期の座標またはその周辺の座標にある第1のケプストラム系列中の成分を集約する係数であることを特徴とする請求項1記載の音楽音響信号のピッチ推定装置。
  3. 2次元フィルタの係数は、少なくとも所望の座標点の前後のフレームの座標点またはその周辺の座標にある第1のケプストラム系列中の成分を集約する係数であることを特徴とする請求項1または請求項2に記載の音楽音響信号のピッチ推定装置。
  4. 2次元フィルタ処理部の出力は、ケプストラムの総和で正規化して、第2のケプストラム系列の値に確率分布としての形状を持たせたものであることを特徴とする請求項1から請求項3のうちのいずれか1項記載の音楽音響信号のピッチ推定装置。
  5. 2次元フィルタ処理部は、それぞれケフレンシ方向に係数の幅の異なる2つのフィルタを備え、それぞれのフィルタ出力として第2のケプストラム系列を出力し、ピッチ抽出部は、これら2つの第2のケプストラム系列に基づいて、基本周波数の揺らぎの大きい区間をボーカルに対応したピッチ区間として抽出することを特徴とする請求項1から請求項4のうちのいずれか1項記載の音楽音響信号のピッチ推定装置。
  6. 請求項1に記載の音楽音響信号のピッチ推定装置を用いて入力信号からピッチ周波数を推定する音楽音響信号のピッチ推定方法であって、
    入力信号に対するケプストラム分析により第1のケプストラム系列を求めるケプストラム分析過程と、
    前記第1のケプストラム係数に対して、当該第1のケプストラム系列中に分布するケプストラム成分を所望の座標点に統合するための係数を有する2次元フィルタを用いて、第2のケプストラム系列を求めるフィルタ過程と、
    前記第2のケプストラム系列中に分布するケプストラム成分に基づいてピッチ周波数を推定するピッチ抽出過程とを備えたことを特徴とする音楽音響信号のピッチ推定方法。
JP2010045275A 2010-03-02 2010-03-02 音楽音響信号のピッチ推定装置及び方法 Expired - Fee Related JP5495858B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010045275A JP5495858B2 (ja) 2010-03-02 2010-03-02 音楽音響信号のピッチ推定装置及び方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010045275A JP5495858B2 (ja) 2010-03-02 2010-03-02 音楽音響信号のピッチ推定装置及び方法

Publications (2)

Publication Number Publication Date
JP2011180417A true JP2011180417A (ja) 2011-09-15
JP5495858B2 JP5495858B2 (ja) 2014-05-21

Family

ID=44691949

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010045275A Expired - Fee Related JP5495858B2 (ja) 2010-03-02 2010-03-02 音楽音響信号のピッチ推定装置及び方法

Country Status (1)

Country Link
JP (1) JP5495858B2 (ja)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0255398A (ja) * 1988-08-20 1990-02-23 Masayuki Kimura 相対関係に基づく音声認識方式
JPH09210763A (ja) * 1996-02-07 1997-08-15 Nec Corp 高調波ピッチ検出装置
JPH10133693A (ja) * 1996-10-28 1998-05-22 Nec Corp 音声認識装置
JPH10288982A (ja) * 1997-04-14 1998-10-27 Roland Corp ディジタルフィルタ及び信号抽出装置
JP2000200090A (ja) * 1998-12-29 2000-07-18 Nec Corp ピッチ情報抽出装置及びピッチ情報抽出方法ならびにピッチ情報抽出プログラムを格納した記憶媒体
JP2008015388A (ja) * 2006-07-10 2008-01-24 Dds:Kk 歌唱力評価方法及びカラオケ装置
JP2008015211A (ja) * 2006-07-06 2008-01-24 Dds:Kk ピッチ抽出方法、歌唱力評価方法、歌唱訓練プログラム及びカラオケ装置
JP2008281776A (ja) * 2007-05-10 2008-11-20 Mitsubishi Electric Corp 旋律抽出装置及び旋律抽出方法
JP2009069425A (ja) * 2007-09-12 2009-04-02 Sharp Corp 音楽検出装置、音声検出装置、および音場制御装置
JP2009210593A (ja) * 2008-02-29 2009-09-17 Toshiba Corp 特徴量抽出装置、方法及びプログラム

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0255398A (ja) * 1988-08-20 1990-02-23 Masayuki Kimura 相対関係に基づく音声認識方式
JPH09210763A (ja) * 1996-02-07 1997-08-15 Nec Corp 高調波ピッチ検出装置
JPH10133693A (ja) * 1996-10-28 1998-05-22 Nec Corp 音声認識装置
JPH10288982A (ja) * 1997-04-14 1998-10-27 Roland Corp ディジタルフィルタ及び信号抽出装置
JP2000200090A (ja) * 1998-12-29 2000-07-18 Nec Corp ピッチ情報抽出装置及びピッチ情報抽出方法ならびにピッチ情報抽出プログラムを格納した記憶媒体
JP2008015211A (ja) * 2006-07-06 2008-01-24 Dds:Kk ピッチ抽出方法、歌唱力評価方法、歌唱訓練プログラム及びカラオケ装置
JP2008015388A (ja) * 2006-07-10 2008-01-24 Dds:Kk 歌唱力評価方法及びカラオケ装置
JP2008281776A (ja) * 2007-05-10 2008-11-20 Mitsubishi Electric Corp 旋律抽出装置及び旋律抽出方法
JP2009069425A (ja) * 2007-09-12 2009-04-02 Sharp Corp 音楽検出装置、音声検出装置、および音場制御装置
JP2009210593A (ja) * 2008-02-29 2009-09-17 Toshiba Corp 特徴量抽出装置、方法及びプログラム

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CSNG200900509016; 竹内 英世 Hideyo Takeuchi: 'カラオケ採点用の高分解能ピッチ抽出法' 電気学会論文誌C Vol.129 No.10 IEEJ , 20091001, p.1889-1901, (社)電気学会 The Institute of Electrical Engine *
JPN6013022658; 竹内 英世 Hideyo Takeuchi: 'カラオケ採点用の高分解能ピッチ抽出法' 電気学会論文誌C Vol.129 No.10 IEEJ , 20091001, p.1889-1901, (社)電気学会 The Institute of Electrical Engine *

Also Published As

Publication number Publication date
JP5495858B2 (ja) 2014-05-21

Similar Documents

Publication Publication Date Title
US9111526B2 (en) Systems, method, apparatus, and computer-readable media for decomposition of a multichannel music signal
Liutkus et al. Adaptive filtering for music/voice separation exploiting the repeating musical structure
US9646592B2 (en) Audio signal analysis
JP5992427B2 (ja) 信号におけるピッチおよび/または基本周波数に関するパターンを推定する方法および装置
KR20180050652A (ko) 음향 신호를 사운드 객체들로 분해하는 방법 및 시스템, 사운드 객체 및 그 사용
FitzGerald Vocal separation using nearest neighbours and median filtering
JP2015525895A (ja) オーディオ信号分析
Magron et al. Phase reconstruction of spectrograms with linear unwrapping: application to audio signal restoration
JP6174856B2 (ja) 雑音抑制装置、その制御方法、及びプログラム
CN102054480A (zh) 一种基于分数阶傅立叶变换的单声道混叠语音分离方法
Mittal et al. Study of characteristics of aperiodicity in Noh voices
WO2010097870A1 (ja) 音楽検索装置
JP2010210758A (ja) 音声を含む信号の処理方法及び装置
JP2005266797A (ja) 音源信号分離装置及び方法、並びにピッチ検出装置及び方法
JP5614261B2 (ja) 雑音抑制装置、雑音抑制方法、及びプログラム
Benetos et al. Auditory spectrum-based pitched instrument onset detection
Amado et al. Pitch detection algorithms based on zero-cross rate and autocorrelation function for musical notes
JP5325130B2 (ja) Lpc分析装置、lpc分析方法、音声分析合成装置、音声分析合成方法及びプログラム
JP5495858B2 (ja) 音楽音響信号のピッチ推定装置及び方法
JP3849679B2 (ja) 雑音除去方法、雑音除去装置およびプログラム
Reddy et al. Predominant melody extraction from vocal polyphonic music signal by combined spectro-temporal method
Rao et al. A comparative study of various pitch detection algorithms
Sajid et al. An Effective Framework for Speech and Music Segregation
JP2011164497A (ja) テンポ値検出装置およびテンポ値検出方法
Ingale et al. Singing voice separation using mono-channel mask

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120815

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130412

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130514

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130702

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140204

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140304

R150 Certificate of patent or registration of utility model

Ref document number: 5495858

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees