JP4710037B2 - 音高推定装置、音高推定方法およびプログラム - Google Patents
音高推定装置、音高推定方法およびプログラム Download PDFInfo
- Publication number
- JP4710037B2 JP4710037B2 JP2010188624A JP2010188624A JP4710037B2 JP 4710037 B2 JP4710037 B2 JP 4710037B2 JP 2010188624 A JP2010188624 A JP 2010188624A JP 2010188624 A JP2010188624 A JP 2010188624A JP 4710037 B2 JP4710037 B2 JP 4710037B2
- Authority
- JP
- Japan
- Prior art keywords
- sound
- fundamental frequency
- unit
- probability density
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Electrophonic Musical Instruments (AREA)
- Auxiliary Devices For Music (AREA)
Description
なお、音数が多い対象音から高精度に基本周波数を推定するためには、各音モデルの重み値の尤度を充分に高める必要がある。一方、対象音を構成する音数が少ない場合には重み値の尤度が余り高くなくても対象音の基本周波数を高精度に推定できる場合がある。各音モデルの重み値の尤度は単位処理の反復の回数が多いほど増加するから、本発明の好適な態様における制御手段は、対象音を構成する音数が多いほど単位処理の反復の回数を増加させる。本態様によれば、対象音を構成する音数が少ない場合には単位処理の回数の削減によって音高推定手段による処理の負荷が軽減され、対象音を構成する音数が多い場合には単位処理の回数の増加によって基本周波数が高精度に推定される。
なお、対象音を構成する音数が多い場合、基本周波数の確率密度関数には各々のピーク値が比較的に小さい多数のピークが現れる。これに対し、対象音を構成する音数が少ない場合、基本周波数の確率密度関数には他のピークよりも顕著な少数のピークが現れる。したがって、本発明の好適な態様に係る制御手段は、対象音を構成する音数が多い場合ほど閾値が低下する(対象音を構成する音数が少ない場合ほど閾値が上昇する)ように閾値を制御する。本態様によれば、対象音を構成する音数が多い場合には確率密度関数から多数の基本周波数を特定し、対象音を構成する音数が少ない場合には少数の基本周波数を特定することが可能となる。
例えば、対象音を構成する音数が多いほど、豊富な倍音成分を広範な帯域にわたって含む高調波構造のモデル列が選択されるように(換言すると、対象音を構成する音数が少ないほど、倍音成分が狭い帯域に存在する高調波構造のモデル列が選択されるように)音高推定手段を制御する。
対象音を構成する音数が多い場合には各々の基本周波数が広範な周波数帯域にわたる可能性が高い。したがって、制御手段は、例えば、対象音を構成する音数が多いほどフィルタの通過帯域が広くなるように音高推定手段を制御する。
図1は、本発明の第1実施形態に係る音高推定装置の機能的な構成を示すブロック図である。図1に示すように、音高推定装置Dは、音高推定部10と記憶部30と指標算定部50と制御部60とを含む。音高推定部10と指標算定部50と制御部60とは、例えばCPUなどの演算処理装置がプログラムを実行することで実現されてもよいし、基本周波数の推定に専用されるDSPなどのハードウェアによって実現されてもよい。
音数が多い対象音から高精度に基本周波数F0を推定するためには、各音モデルM[F]の重み値ω[F]の尤度を充分に高める必要がある。これに対し、対象音を構成する音数が少ない場合には、真ピークと偽ピークとでピーク値の相違が顕著となり易いから、重み値ω[F]の尤度が余り高くなくても対象音の基本周波数F0を推定できる場合がある。また、重み値ω[F]は、単位処理のたびに最適値(尤度が高い数値)に接近していく。そこで、本実施形態の制御部60は、対象音を構成する音数が多い(すなわち音数指標値Nが小さい)ほど単位処理の反復回数mが増加するように、音数指標値Nに基づいて関数推定部20を制御する。以上の構成によれば、対象音を構成する音数が少ない場合には、単位処理の反復回数mが削減されることで関数推定部20による処理の負荷が軽減され、対象音を構成する音数が多い場合には反復回数mの増加によって多数の音の基本周波数F0を高精度に推定することが可能となる。
図4は、確率密度関数Pの各ピークと閾値Pthとの関係を示す概念図である。同図の部分(a)は対象音を構成する音数が多い場合を示し、部分(b)は音数が少ない場合を示す。基本周波数Fの全範囲にわたる確率密度関数Pの積分値は「1」となるから、図4の部分(a)のように対象音を構成する音数が多い場合には、各々のピーク値が比較的に小さい多数のピークが確率密度関数Pに現れる。これに対し、図4の部分(b)のように対象音を構成する音数が少ない場合には、少数の真ピークのピーク値が他のピーク(偽ピーク)と比較して充分に大きい数値(PMAX)となる。
次に、本発明の第2実施形態について説明する。なお、以下に例示する各形態において第1実施形態と共通する要素には、以上と同じ符号を付して、各々に関する詳細な説明を適宜に省略する。
次に、本発明の第3実施形態について説明する。図6は、本実施形態に係る関数推定部20の具体的な構成を示すブロック図である。図6に示すように、関数推定部20は、推定形状特定部21と重み値算定部23と処理選定部25と偽ピーク抑制部27とを含む。
次に、本発明の第4実施形態について説明する。第1実施形態においては、確率密度関数Pの各ピーク値の分散が音数指標値Nとして算定される構成を例示した。これに対し、本実施形態においては、確率密度関数Pで表現される曲線の線長が音数指標値Nとして算定される。
以上の各形態には様々な変形を加えることができる。具体的な変形の態様を例示すれば以下の通りである。なお、以下の各態様を適宜に組み合わせてもよい。
音数指標値Nに応じて制御される対象(パラメータ)は以上の例示に限定されない。例えば、BPF14の通過帯域が音数指標値Nに応じて可変に制御される構成としてもよい。対象音を構成する音数が多い場合には各音の基本周波数F0が広範な帯域幅にわたる可能性が高いから、制御部60は、対象音を構成する音数が多いほどBPF14の通過帯域が広くなるように、音数指標値Nに基づいてBPF14を制御する。また、例えば音響信号Vを区分するフレームの時間長を音数指標値Nに基づいて制御する構成も採用される。以上のように、本発明の好適な態様においては、音高推定部10による処理が音数指標値Nに基づいて制御される構成であれば足り、音数指標値Nと各パラメータとの関係や制御の対象となるパラメータは適宜に変更される。
以上の各形態においては確率密度関数Pから音数指標値Nが算定される構成を例示したが、音数指標値Nを算定する方法は適宜に変更される。例えば、音響信号Vやその振幅スペクトル(周波数分析部12から出力される振幅スペクトルまたはBPF14から出力される振幅スペクトルS)に基づいて音数指標値Nを選定する構成も採用される。例えば、振幅スペクトルSに現れる多数のピークのうち所定の帯域幅に属するピークの個数(ピークの密度)を音数指標値Nとして算定してもよい。また、第2実施形態においては正規化後の確率密度関数Pが表わす曲線の線長から音数指標値Nが算定される構成を例示したが、基本周波数Fの所定の範囲にわたる確率密度関数Pの積分値(確率密度関数Pの曲線と基本周波数Fの軸線とで包囲された領域の面積)に基づいて音数指標値Nが算定される構成も採用される。さらに、正規化後の確率密度関数Pの表わす曲線が、所定の関数値に対応した直線(例えば図8の縦軸の数値が「0.5」となる直線)と交差する回数に基づいて音数指標値Nを算定してもよい。
確率密度関数Pから基本周波数F0を推定する方法は適宜に変更される。例えば、確率密度関数Pのうち重み値ω[F]が高い順番に計数して所定数のピークの周波数を対象音の基本周波数F0として特定してもよい。また、以上の各形態においては複数の基本周波数F0が推定される構成を例示したが、ひとつの基本周波数F0(例えば確率密度関数Pにおいて最大のピークが現れる周波数)を推定する構成としてもよい。
Claims (3)
- 相異なる基本周波数の高調波構造を示す複数の音モデルの混合分布として入力音響信号がモデル化されるように各音モデルの重み値を更新する単位処理を最尤推定アルゴリズムに基づいて反復し、前記単位処理の反復後の各音モデルの重み値を前記入力音響信号の基本周波数の確率密度関数として推定する関数推定手段と、
前記関数推定手段が推定した前記基本周波数の確率密度関数から前記入力音響信号の基本周波数を特定する音高特定手段と、
前記入力音響信号を構成する音数に応じた音数指標値を算定する指標算定手段と、
前記関数推定手段による前記単位処理の反復回数を前記音数指標値に応じて可変に制御する制御手段と
を具備する音高推定装置。 - 相異なる基本周波数の高調波構造を示す複数の音モデルの混合分布として入力音響信号がモデル化されるように各音モデルの重み値を更新する単位処理を最尤推定アルゴリズムに基づいて反復し、前記単位処理の反復後の各音モデルの重み値を前記入力音響信号の基本周波数の確率密度関数として推定する一方、
前記推定した前記基本周波数の確率密度関数から前記入力音響信号の基本周波数を特定し、
前記入力音響信号を構成する音数に応じた音数指標値を算定し、
前記単位処理の反復回数を前記音数指標値に応じて可変に制御する
音高推定方法。 - 相異なる基本周波数の高調波構造を示す複数の音モデルの混合分布として入力音響信号がモデル化されるように各音モデルの重み値を更新する単位処理を最尤推定アルゴリズムに基づいて反復し、前記単位処理の反復後の各音モデルの重み値を前記入力音響信号の基本周波数の確率密度関数として推定する関数推定処理と、
前記関数推定処理で推定した前記基本周波数の確率密度関数から前記入力音響信号の基本周波数を特定する音高特定処理と、
前記入力音響信号を構成する音数に応じた音数指標値を算定する指標算定処理と、
前記関数推定処理における前記単位処理の反復回数を前記音数指標値に応じて可変に制御する制御処理と
をコンピュータに実行させるプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010188624A JP4710037B2 (ja) | 2010-08-25 | 2010-08-25 | 音高推定装置、音高推定方法およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010188624A JP4710037B2 (ja) | 2010-08-25 | 2010-08-25 | 音高推定装置、音高推定方法およびプログラム |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007045012A Division JP4630981B2 (ja) | 2007-02-26 | 2007-02-26 | 音高推定装置、音高推定方法およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010286857A JP2010286857A (ja) | 2010-12-24 |
JP4710037B2 true JP4710037B2 (ja) | 2011-06-29 |
Family
ID=43542547
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010188624A Expired - Fee Related JP4710037B2 (ja) | 2010-08-25 | 2010-08-25 | 音高推定装置、音高推定方法およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4710037B2 (ja) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2005066927A1 (ja) * | 2004-01-09 | 2005-07-21 | Toudai Tlo, Ltd. | 多重音信号解析方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3413634B2 (ja) * | 1999-10-27 | 2003-06-03 | 独立行政法人産業技術総合研究所 | 音高推定方法及び装置 |
-
2010
- 2010-08-25 JP JP2010188624A patent/JP4710037B2/ja not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2005066927A1 (ja) * | 2004-01-09 | 2005-07-21 | Toudai Tlo, Ltd. | 多重音信号解析方法 |
Also Published As
Publication number | Publication date |
---|---|
JP2010286857A (ja) | 2010-12-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4630980B2 (ja) | 音高推定装置、音高推定方法およびプログラム | |
KR102132500B1 (ko) | 조화성 기반 단일 채널 음성 품질 추정 기법 | |
JP2011145372A (ja) | 雑音抑圧装置 | |
JP4630981B2 (ja) | 音高推定装置、音高推定方法およびプログラム | |
JP5152799B2 (ja) | 雑音抑圧装置およびプログラム | |
JP5157837B2 (ja) | ピッチ検出装置およびプログラム | |
JP4953068B2 (ja) | 和音判別装置、和音判別方法およびプログラム | |
JP4710037B2 (ja) | 音高推定装置、音高推定方法およびプログラム | |
JP5609157B2 (ja) | 係数設定装置および雑音抑圧装置 | |
JP5728903B2 (ja) | 音響処理装置およびプログラム | |
JP5152800B2 (ja) | 雑音抑圧評価装置およびプログラム | |
JP4630983B2 (ja) | 音高推定装置、音高推定方法およびプログラム | |
JP4630982B2 (ja) | 音高推定装置、音高推定方法およびプログラム | |
JP4630979B2 (ja) | 音高推定装置、音高推定方法およびプログラム | |
JP2007298607A (ja) | 音響信号分析装置、音響信号分析方法、及び音響信号分析用プログラム | |
JP2013250356A (ja) | 係数設定装置および雑音抑圧装置 | |
WO2020039598A1 (ja) | 信号処理装置、信号処理方法および信号処理プログラム | |
JP5131172B2 (ja) | 周期特定装置およびプログラム | |
JP2009150920A (ja) | エコーキャンセル装置、カラオケ装置、エコーキャンセル方法およびプログラム | |
JP6036141B2 (ja) | 音響処理装置 | |
JP7041911B2 (ja) | 呼吸音処理装置、呼吸音処理方法、及び、コンピュータプログラム | |
JPWO2017130417A1 (ja) | 生体音解析装置及び生体音解析方法、並びにコンピュータプログラム及び記録媒体 | |
JP5327375B2 (ja) | ピッチ検出装置およびプログラム | |
Barmatz | Algorithms for Automatic Segmentation of Trill Vocalizations in Birds | |
JP6064561B2 (ja) | 拍情報推定装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100906 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20101012 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101130 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110127 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110222 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110225 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |