JP3251555B2 - 信号分析装置 - Google Patents

信号分析装置

Info

Publication number
JP3251555B2
JP3251555B2 JP35094998A JP35094998A JP3251555B2 JP 3251555 B2 JP3251555 B2 JP 3251555B2 JP 35094998 A JP35094998 A JP 35094998A JP 35094998 A JP35094998 A JP 35094998A JP 3251555 B2 JP3251555 B2 JP 3251555B2
Authority
JP
Japan
Prior art keywords
frequency
signal
time
fundamental
window
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP35094998A
Other languages
English (en)
Other versions
JP2000181472A (ja
Inventor
英紀 河原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Science and Technology Agency
Original Assignee
Japan Science and Technology Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Japan Science and Technology Corp filed Critical Japan Science and Technology Corp
Priority to JP35094998A priority Critical patent/JP3251555B2/ja
Publication of JP2000181472A publication Critical patent/JP2000181472A/ja
Application granted granted Critical
Publication of JP3251555B2 publication Critical patent/JP3251555B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、信号分析装置に関
するものである。
【0002】
【従来の技術】信号の代表例として音について述べる。
これまでの音の分析においては、音色の主要な要因であ
るスペクトルの全体的な形と、有声音などの周期的な音
の高さを決めるスペクトルの微細構造とを別のものとし
て、それぞれ専用に開発された方法を用いてパラメータ
が抽出されてきた。
【0003】そのための手段としては、まずスペクトル
の全体的な形に関しては、人間の聴覚にならったほぼ対
数周波数軸上で等間隔に分布する周波数を有する帯域フ
ィルタ群を用いる方法や、スペクトルの概形を有理スペ
クトルと仮定して、モデルのパラメータを統計的に推定
する手法であるARモデルによる方法、対数スペクトル
のフーリエ変換を介して微細構造成分と概形の成分の分
離を図るCepstrum法および、それらを対象とす
る問題に応じて改良した様々な方法が用いられてきた。
【0004】また、スペクトルの微細構造に関しては、
上記のそれぞれの方法で求められたスペクトルの概形を
用いて元のパワースペクトルを正規化し、逆フーリエ変
換することにより求められる基本周期成分を強調した自
己相関関数を用いて基本周波数を求める方法や、遅延さ
せた波形との距離を最小にする遅延量として基本周期を
求める方法、基本波成分の瞬時周波数として基本周波数
を求める方法が用いられている。
【0005】
【発明が解決しようとする課題】しかしながら、上記し
たいずれの方法においても、もともと単一のものである
スペクトルをスペクトルの概形と微細構造という二重の
構造に天下りに分けようとするため、いずれも近似的な
分析にならざるを得ず、求められたそれぞれのパラメー
タの間に複雑な相関が残留し、高品質な処理や高精度の
分析が困難であるという問題があった。
【0006】更に、瞬時周波数は、特性が時間的に変動
する音声のような信号を適切に表現する方法として、正
弦波モデル(Robert J.McAulay an
dThomas F.Quatieri“Speech
analysis/synthesis based
on a sinusoidal represen
tation”IEEE Trans.ASSP,Vo
l.34,pp.744−754,1986)や基本周
波数の抽出方法やTEMPO法(河原英紀,Alain
de Cheveigne.“原理的に抽出誤りの存
在しないピッチ抽出方法とその評価について”信学技
報,Vol.SP96−96,pp.9−18,199
7)等に用いられている。
【0007】瞬時周波数の計算法は、様々なものが提案
されており、Flanaganによる方法(J.L.F
lanagan and R.M.Golden.“P
hase vocoder” Bell System
Technical Journal,Vol.4
5,pp.1439−1509,1966)や、その阿
部の方法(T.Abe T.Kobayashi,an
d S.Imai.“Harmonics estim
ation based on instaneous
frequency and its applic
ation topitch determinati
on”.IEICE Transaction Inf
ormation and Systems,Vol.
E78−D,No.9,pp.1188−1194,1
995及びT.Abe T.Kobayashi,an
d S.Imai.“Robust pitch es
timation with harmonics e
nhancement in noisy envir
onments based on instanta
neous frequency”.Proceedi
ng of International Spoke
n Language Proceedings 19
96(ICSLP 96),pp.1277−128
0,Philadelphia,1990.)による変
形は、位相を直接計算することを避け、また、逆三角関
数を用いずに瞬時周波数を計算することのできる優れた
計算方法である。
【0008】しかしながら、それらの方法では、スペク
トルの時間微分を求めたり、別に微分時間窓を用いるこ
とが必要であった。
【0009】本発明は、上記問題点を除去し、瞬時周波
数特性を周波数から周波数への写像とみなし、写像の不
動点(以下の説明では写像を繰り返した時の周囲の点の
安定性に注目するので、平衡点と呼ぶことにする)の性
質に基づいて、信号の構造ならびに、最小分散推定の意
味で最適な基本周波数及び、それぞれの周波数領域にお
ける周期性/雑音性/駆動エネルギーの集中度を併せて
求めることにより、信号の的確な分析を行うことができ
る信号分析装置を提供することを目的とする。
【0010】
【課題を解決するための手段】本発明は、上記目的を達
成するために、 〔1〕信号分析装置において、各周波数における瞬時周
波数を周波数から周波数への写像と見なして安定な平衡
点を求める装置と、この安定な平衡点を求める装置によ
り求めた安定な平衡点の周辺の変動に基づいた加重を設
定する装置と、この加重を設定する装置を通じて前記平
衡点の周波数に関する情報を統合して基本周波数を求め
る装置とを具備するようにしたものである。
【0011】〔2〕上記〔1〕記載の信号分析装置にお
いて、時間窓の分解能を基本周波数及び基本周期の近似
値と同程度に設定し、基本周波数及び調波成分の瞬時周
波数を求めて基本周波数を高精度に求めるようにしたも
のである。
【0012】〔3〕上記〔2〕記載の信号分析装置にお
いて、前記時間窓の分解能を基本周波数及び基本周期の
近似値と同程度に設定し、基本周期の近似値に適応的に
定められる周期成分抑圧用平滑化関数と畳み込んで作成
される窓を用いることにより、基本周波数及び調波成分
の瞬時周波数を求めて基本周波数を高精度に求めるよう
にしたものである。
【0013】〔4〕上記〔1〕記載の信号分析装置にお
いて、対数周波数軸上でほぼ等間隔あるいは、直線周波
数軸上でほぼ等間隔、あるいは、特定の時間サイズに密
に配置する等の不等間隔になるように設計された複数の
時間長の時間窓の組を用いることにより信号の階層構造
を分析するようにしたものである。
【0014】〔5〕上記〔1〕記載の信号分析装置にお
いて、画像の走査により得られる信号を入力信号として
用いることにより画像の構造を解析するようにしたもの
である。
【0015】
【発明の実施の形態】以下、本発明の実施の形態につい
て詳細に説明する。
【0016】図1は本発明の第1実施例を示す信号分析
装置の基本周波数抽出装置のブロック図である。
【0017】この図に示すように、この基本周波数抽出
装置は、入力回路1、窓作成手段2、サンプル遅延手段
3、FFT(短時間フーリエ変換)手段4,5、振幅正
規化手段6,7、差分抽出手段8、絶対値計算手段9、
瞬時周波数変換手段10、変動計算手段11、基本周波
数計算手段12から構成されている。なお、X(t)は
入力信号、Xout は出力信号である。
【0018】以下、この信号分析装置の基本周波数抽出
装置の各部分を詳細に説明する。
【0019】入力回路1は、分析の対象とする音声信号
あるいは、画像を走査して得られた信号のような時系列
として扱うことのできるアナログ信号あるいはディジタ
ル信号を、内部処理のための時間的に等間隔に標本化さ
れたディジタル信号に変換する。
【0020】窓作成手段2は、予め知られている信号の
基本周波数の分布等の事前の知識に基づいて、ガウス窓
と、2次のcardinal B−spline関数を
求め、それらを畳み込むことによって、FFT手段4及
び5で用いる時間窓を作成する。この時間窓は、性能の
劣化を許容すれば、上述したガウス窓とcardina
l B−spline関数の畳み込みによる窓以外の窓
を用いることもできる。
【0021】サンプル遅延手段3では、例えば1段のF
IFO(first in first out)メモ
リ等の方法により、入力回路で変換されたディジタル
信号を1サンプル時点だけ遅延させた信号を作成する。
【0022】FFT手段4は、窓作成手段2で作成され
た窓により入力回路1で変換されたディジタル信号のあ
る時間的区間を取り出して、高速フーリエ変換により信
号の短時間フーリエ変換を計算する。
【0023】FFT手段5は、窓作成手段2で作成され
た窓により入力回路1で変換されたディジタル信号をサ
ンプル遅延手段3で1サンプル時点だけ遅延させた信号
からある時間的区間を取り出して、高速フーリエ変換に
より遅延された信号の短時間フーリエ変換を計算する。
【0024】振幅正規化手段6は、FFT手段4で求め
られた信号の短時間フーリエ変換を、その絶対値で除算
することにより、絶対値が1で信号の位相情報のみを保
持する振幅正規化複素スペクトルを計算する。
【0025】振幅正規化手段7は、FFT手段5で求め
られた遅延された信号の短時間フーリエ変換を、その絶
対値で除算することにより、絶対値が1で遅延された信
号の位相情報のみを保持する振幅正規化複素スペクトル
を計算する。
【0026】差分抽出手段8は、絶対値が1で信号の位
相情報のみを保持する振幅正規化複素スペクトルと絶対
値が1で遅延された信号の位相情報のみを保持する振幅
正規化複素スペクトルとの差分を計算する。
【0027】絶対値計算手段9は、差分抽出手段8で求
められた差分の絶対値を計算する。
【0028】瞬時周波数変換手段10は、逆三角関数を
用いて絶対値計算手段9で求められた絶対値を各周波数
における瞬時周波数に変換する。また、周波数と瞬時周
波数の対応関係から安定平衡点を求める。
【0029】変動計算手段11は、瞬時周波数変換手段
10により求められた安定平衡点について、安定平衡点
の周波数の周囲の周波数における瞬時周波数と、瞬時周
波数の時間変化に基づいて瞬時周波数の分散の推定値で
ある変動を計算する。
【0030】基本周波数計算手段12は、瞬時周波数
手段10により求められたそれぞれの安定平衡点にお
ける瞬時周波数の情報を変動計算手段11により求めら
れた変動の値に基づき、最小分散推定となるように統合
して、基本周波数の推定値Xout を得る。
【0031】図2は本発明の第2実施例を示す信号分析
装置の構造解析及び基本周波数抽出装置のブロック図で
ある。
【0032】この図に示すように、この構造解析及び基
本周波数抽出装置は、入力回路21、窓作成手段22、
サンプル遅延手段23、FFT(短時間フーリエ変換)
手段24,25、振幅正規化手段26,27、差分抽出
手段28、絶対値計算手段29、瞬時周波数変換手段3
0、変動計算手段31、信号構造マップ作成手段32、
調波性マップ作成手段33、最適窓選択手段34、基本
周波数計算手段35から構成されている。なお、X
(t)は入力信号、Xout は出力信号である。
【0033】以下、この信号分析装置の構造解析及び基
本周波数抽出装置の各部分を詳細に説明する。
【0034】入力回路21は、分析の対象とする音声信
号あるいは、画像を走査して得られた信号のような時系
列として扱うことのできるアナログ信号あるいはディジ
タル信号を、内部処理のための時間的に等間隔に標本化
されたディジタル信号に変換する。
【0035】窓作成手段22は、予め知られている信号
の基本周波数の分布等の事前の知識に基づいて、幾つか
の基本周波数の候補を設定し、その各々についてガウス
窓と、2次のcardinal B−spline関数
を求め、それらを畳み込むことによって、FFT手段2
4及び25と信号構造マップ作成手段32で用いる時間
窓を作成する。この時間窓は、性能の劣化を許容すれ
ば、上で説明したガウス窓とcardinal B−s
pline関数の畳み込みによる窓以外の窓を用いるこ
ともできる。
【0036】サンプル遅延手段23では、例えば1段の
FIFO(first in first out)メ
モリ等の方法により、入力回路で変換されたディジタ
ル信号を1サンプル時点だけ遅延させた信号を作成す
る。
【0037】FFT手段24は、窓作成手段22で作成
された複数の窓により入力回路21で変換されたディジ
タル信号のある時間的区間を取り出して、高速フーリエ
変換により信号の短時間フーリエ変換を複数個計算す
る。
【0038】FFT手段25は、窓作成手段22で作成
された複数の窓により入力回路21で変換されたディジ
タル信号をサンプル遅延手段23で1サンプル時点だけ
遅延させた信号からある時間的区間を取り出して、高速
フーリエ変換により遅延された信号の短時間フーリエ変
換を複数個計算する。
【0039】振幅正規化手段26は、FFT手段24で
求められた信号の複数個の短時間フーリエ変換を、それ
ぞれの絶対値で除算することにより、絶対値が1で信号
の位相情報のみを保持する振幅正規化複素スペクトルを
複数個計算する。
【0040】振幅正規化手段27は、FFT手段25で
求められた遅延された信号の複数個の短時間フーリエ変
換を、その絶対値で除算することにより、絶対値が1で
遅延された信号の位相情報のみを保持する振幅正規化複
素スペクトルを複数個計算する。
【0041】差分抽出手段28は、絶対値が1で信号の
位相情報のみを保持する複数個の振幅正規化複素スペク
トルと絶対値が1で遅延された信号の位相情報のみを保
持する複数個の振幅正規化複素スペクトルとの各々の差
分を複数個計算する。
【0042】絶対値計算手段29は、差分抽出手段28
で求められた複数個の差分のそれぞれの絶対値を複数個
計算する。
【0043】瞬時周波数変換手段30は、逆三角関数を
用いて絶対値計算手段29で求められたそれぞれの時間
窓に対応する絶対値を各周波数における瞬時周波数に変
換する。また、周波数と瞬時周波数の対応関係からそれ
ぞれの時間窓に対応する安定平衡点を求める。
【0044】変動計算手段31は、瞬時周波数変換手段
30により求められたそれぞれの時間窓に対応する安定
平衡点について、安定平衡点の周波数の周囲の周波数に
おける瞬時周波数と、瞬時周波数の時間変化に基づいて
瞬時周波数の分散の推定値である変動を計算する。
【0045】信号構造マップ作成手段32では、瞬時周
波数変換手段30により求められたそれぞれの時間窓に
対応する安定平衡点を用いて、時間窓の窓長と安定平衡
点の瞬時周波数をそれぞれの軸とする平面にそれぞれの
時間窓について求められた安定平衡点を配置し、変動計
算手段31により求められた変動の値を付与することに
より、信号構造マップを作成する。
【0046】調波性マップ作成手段33では、安定平衡
点の瞬時周波数から求められる自己相関の次元を持つ余
弦関数を、それぞれの安定平衡点に付与された変動の値
から計算される加重を掛けて総和を計算することによ
り、それぞれの時間窓長についての正規化された相関関
数を求め、時間窓の窓長と時間差をそれぞれの軸とする
平面上のマップとして調波性マップを作成する。
【0047】最適窓選択手段34は、それぞれの時間窓
長について求められた相関関数により調波性マップ作成
手段33により作成されたマップを時間窓方向に統合す
ることにより、基本周波数のおおよその値を求め、それ
に近い窓長を有する時間窓を最適な時間窓として選択す
る。
【0048】基本周波数計算手段35は、信号構造マッ
プ作成手段32により求められたマップから最適窓選択
手段34により求められた最適な時間窓に相当する安定
平衡点の情報を選択抽出し、それぞれの安定平衡点にお
ける瞬時周波数の情報を変動計算手段31により求めら
れた変動の値に基づき、最小分散推定となるように統合
して基本周波数の推定値Xout を得る。
【0049】図3は本発明の第3実施例を示す信号分析
装置の高精度音源情報抽出装置のブロック図である。
【0050】この図に示すように、この高精度音源情報
抽出装置は、入力回路41、窓作成手段42、瞬時周波
数抽出(低域情報)手段43、安定平衡点抽出手段4
4、瞬時周波数時間微分抽出手段45、変動計算手段4
6、基本周波数計算(低域情報)手段47、瞬時周波数
抽出〔チャープ(Chirp)基底〕手段48、安定平
衡点抽出手段49、瞬時周波数時間微分抽出手段50、
変動計算手段51、基本周波数計算(チャープ基底)
52、周期性指標計算手段53、逆フィルタ54、駆
動力局所性指標計算手段55から構成されている。な
お、X(t)は入力信号、Xout 1〜Xout 3は出力信
号である。ここで、チャープ(Chirp)とは、搬送
波の周波数が一定の方向に変化するような信号を意味す
る。
【0051】本実施例は、音声分析合成システムに用い
るための音源情報を、本発明に基づいて抽出する装置に
関するものである。
【0052】以下、この信号分析装置の高精度音源情報
抽出装置の各部分を詳細に説明する。
【0053】入力回路41は、分析の対象とする音声信
号を表すアナログ信号あるいはディジタル信号を、内部
処理のための時間的に等間隔に標本化されたディジタル
信号に変換する。
【0054】窓作成手段42は、予め知られている信号
の基本周波数の分布等の事前の知識に基づいて、ガウス
窓と、2次のcardinal B−spline関数
を求め、それらを畳み込むことによって、瞬時周波数抽
出手段43で用いる時間窓を作成する。この時間窓は、
性能の劣化を許容すれば、上述したガウス窓とcard
inal B−spline関数の畳み込みによる窓以
外の窓を用いることもできる。
【0055】瞬時周波数抽出(低域情報)手段43は、
3次ないし、4次までの調波成分を含む周波数帯域につ
いて、入力回路41で変換されたディジタル信号と窓作
成手段42で作成された時間窓を用いて、第1実施例あ
るいは第2実施例に示した方法あるいはそれらと数学的
に等価である方法によって周波数毎の瞬時周波数を計算
する。
【0056】安定平衡点抽出手段44は、瞬時周波数抽
出(低域情報)手段43により求められた瞬時周波数に
基づいて、周波数から瞬時周波数への写像の安定な平衡
点を抽出する。
【0057】瞬時周波数時間微分抽出手段45は、瞬時
周波数抽出(低域情報)手段43で求められた瞬時周波
数の値および1サンプル過去の瞬時周波数の値との差に
基づいて瞬時周波数時間微分を求める。
【0058】変動計算手段46は、安定平衡点抽出手段
44で求められた安定平衡点の周辺での瞬時周波数と、
瞬時周波数時間微分抽出手段45で求められる瞬時周波
数時間微分の同じく安定平衡点の周辺での値に基づい
て、瞬時周波数の推定値の分散に相当する変動量を計算
する。
【0059】基本周波数計算(低域情報)手段47は、
安定平衡点抽出手段44で求められたそれぞれの安定平
衡点における瞬時周波数の情報を変動計算手段46によ
り求められた変動の値に基づき、最小分散推定となるよ
うに統合して基本周波数の低域情報に基づく推定値を計
算する。
【0060】瞬時周波数抽出(チャープ基底)手段48
は、瞬時周波数時間微分抽出手段45で求められた瞬時
周波数の時間微分に基づいて、瞬時周波数の時間変化を
直線近似することで見かけの周波数が一定となるような
新しい時間軸の上で短時間フーリエ変換を行い、第1実
施例あるいは第2実施例に示した方法あるいはそれらと
数学的に等価である方法によって、周波数毎の瞬時周波
数を計算する。
【0061】安定平衡点抽出手段49は、瞬時周波数抽
出(チャープ基底)手段48により求められた瞬時周波
数に基づいて、周波数から瞬時周波数への写像のチャー
プ基底における安定な平衡点を抽出する。
【0062】瞬時周波数時間微分抽出手段50は、瞬時
周波数抽出(チャープ基底)手段48で求められた瞬時
周波数の値および1サンプル過去の瞬時周波数の値との
差に基づいてチャープ基底における瞬時周波数時間微分
を求める。
【0063】変動計算手段51は、安定平衡点抽出手段
49で求められたチャープ基底における安定平衡点の周
辺での瞬時周波数と、瞬時周波数時間微分抽出手段50
で求められるチャープ基底における瞬時周波数時間微分
の同じく安定平衡点の周辺での値に基づいて、瞬時周波
数の推定値の分散に相当する変動量を計算する。
【0064】基本周波数計算(チャープ基底)手段52
は、安定平衡点抽出手段49で求められたチャープ基底
におけるそれぞれの安定平衡点における瞬時周波数の情
報を変動計算手段51により求められたチャープ基底に
おける変動の値に基づき、最小分散推定となるように統
合して基本周波数のチャープ基底に基づく推定値を計算
し、Xout 2とする。
【0065】周期性指標計算手段53は、安定平衡点抽
出手段49で求められたチャープ基底における安定平衡
点のそれぞれについて、変動計算手段51で求められた
チャープ基底における変動の値に基づき、安定平衡点の
周波数の付近での信号成分がどの程度周期的であるかを
表す指標を求め、Xout 1とする。因みに、変動の値が
ほぼ0であれば、当該の周波数の付近の信号成分は、ほ
ぼ完全に周期的であるとみなされ、指標の値として1が
与えられる。また、逆に変動の値が大きく、白色雑音を
分析したときの変動の期待値程度の大きさである場合に
は、当該の周波数の付近の信号成分は、ほぼ完全に非周
期的であるとみなされ、指標の値として0が与えられ
る。
【0066】逆フィルタ54と駆動力局所性指標計算手
段55は、本発明の請求項目に関わるものではないが、
音声分析合成用の信号分析装置として完結したものとす
るために記載するものである。
【0067】逆フィルタ54は、信号のスペクトルの概
形に起因する信号に内在する時間依存性を除去して冗長
性の無い残差信号を計算する。この逆フィルタには、線
形予測分析を用いても、ケプストラムに基づく方法を用
いても構わない。
【0068】駆動力局所性指標計算手段55は、ある時
間区間の中で残差信号の振幅の分布がどの程度偏ってい
るかを表す指標である。この指標としては、例えば、あ
る時間範囲内での振幅の標準偏差と振幅の絶対値の最大
値との比や統計量の一つである尖度を用いることができ
る。
【0069】本発明によれば、瞬時周波数の周波数特性
を周波数から周波数への写像ととらえ、その写像の安定
な平衡(不動)点が調波に対応するという着想と、調波
成分の統計的な性質を安定な平衡点の近傍の時間周波数
の形状から求めることができるという発見にある。ま
た、これを有効に生かすために、性質の良い時間窓の設
定を行う点が重要な点である。
【0070】更に、各調波成分の推定値に含まれる分散
を、調波成分に対応する安定な平衡点の近傍の形状から
求め、最小分散推定となるようにそれらの情報を統合し
て基本周波数を推定する。
【0071】調波成分の正弦波らしさについては、調波
成分の分散の推定値と、ガウス型の白色雑音で生ずる安
定平衡点の周波数の分散に基づいて決定する。
【0072】また、逆フィルタを用いて、残差信号を求
めることにより、信号への駆動の時間的不均一性を表現
する指標を得る。
【0073】なお、基本周波数が時間的に変化する場合
の問題点を、分析の時間軸を瞬時周波数の時間微分に基
づいて時間軸を非線形に伸縮することにより解消するよ
うにしている。
【0074】以下、本発明に係る音源情報抽出について
説明する。
【0075】図4は本発明に係る母音「ア」の振幅スペ
クトル(低周波部分)を示す図である。この図におい
て、横軸は周波数(Hz)、縦軸はレベル(dB)であ
る。こでは、窓の伸長係数=1である。
【0076】この図に示すように、特に、窓の伸長係数
=1とした母音「ア」の振幅スペクトルの低周波部分が
表されている。
【0077】図5は本発明に係る母音「ア」の振幅スペ
クトルにより正規化した隣接する時点での複素スペクト
ルの差の絶対値から求められた瞬時周波数(低周波部
分)を示す図である。
【0078】この図において、横軸は参照周波数(H
z)、縦軸は瞬時周波数(Hz)が示され、破線は、瞬
時周波数がフィルタの中心周波数と同じ場合を示し、窓
の伸長係数=1、破線を実線が左から右に横切る部分が
安定な平衡点を示している。
【0079】図6は本発明に係る母音「ア」の各周波数
における「単一正弦波らしさ」を示す図である。
【0080】この図において、横軸は参照周波数(H
z)、縦軸は平均標準誤差(Hz)であり、標準誤差で
表しているため、値が小さい程、単一正弦波らしい。横
軸の周波数は、フィルタの中心周波数。窓の伸長係数=
1である。
【0081】図7は本発明に係る母音「ア」の選択され
た平衡点における瞬時周波数を基本周波数に換算した値
を示す図である。ここで、縦軸は評価基底周波数(H
z)、横軸はフィルタの中心周波数(Hz)、窓の伸長
係数=1である。
【0082】図8は本発明に係る母音「ア」の平衡点に
ついて表示されているフィルタの中心周波数までの基本
周波数情報を統合したときの標準誤差を示す図である。
【0083】ここで、横軸は参照周波数(Hz)、縦軸
はトータル標準誤差(Hz)、窓の伸長係数=1であ
る。
【0084】図9は本発明に係る母音「ア」の平衡点に
ついて表示されているフィルタの中心周波数までの基本
周波数情報を統合したときの基本周波数の推定値を示す
図である。
【0085】この図において、横軸は参照周波数(H
z)、縦軸は評価基底周波数(Hz)であり、ここで、
窓の伸長係数=1である。
【0086】図10は本発明に係る持続発声された母音
「ア」の基本周波数の推定値を示す図である。
【0087】この図において、横軸は時間(ms)、縦
軸は評価基底周波数(Hz)であり、実線は11番目の
調波成分までの値から最小分散推定した結果を示し、+
印は基本波のみを使用して基本周波数を推定した結果を
示しており、窓の伸長係数=1である。
【0088】図11は本発明に係る持続発声された母音
「ア」からの正弦波成分の抽出を示す図である。
【0089】この図においては、抽出された平衡点の位
置を点により表しており、縦軸は窓の伸長係数、横軸は
抽出された成分の瞬時周波数(Hz)である。
【0090】図12は本発明に係る持続発声された母音
「ア」から抽出された正弦波成分の変動(その1)を示
す図である。
【0091】この図において、横軸は窓の伸長係数、縦
軸は抽出された成分の相対的変動量を示している。
【0092】図13は本発明に係る持続発声された母音
「ア」から抽出された正弦波成分の変動(その2)を示
す図である。この図において、横軸は抽出された成分の
周波数(Hz)、縦軸は抽出された成分の相対的変動量
を示している。
【0093】図14は本発明に係る持続発声された母音
「ア」からの事前情報無しの場合の基本周波数抽出マッ
プを示す図である。
【0094】この図において、横軸は対数周波数指標、
縦軸は伸長指標を示している。図14における濃度は、
補正された自己相関に相当する値を表している。
【0095】図15は本発明に係る持続発声された母音
「ア」からの事前情報無しの場合の基本周波数抽出マッ
プの一断面を示す図である。
【0096】この図において、横軸は候補基底周波数
(Hz)、縦軸は補正された自己相関を示している。
【0097】図16は本発明に係る白色雑音の混入した
400Hz正弦波を示す図である。この図において、横
軸は時間(ms)であり、20000Hzサンプリング
で、S/N=0dBである。
【0098】図17は本発明に係る各フィルタ周波数に
対する出力瞬時周波数を示す図である。
【0099】この図において、横軸は参照周波数(H
z)、縦軸は瞬時周波数(Hz)であり、信号は白色雑
音の混入した400Hz正弦波である。
【0100】図18は本発明に係る抽出された基準とな
る周波数から瞬時周波数への写像の安定な平衡点を示す
図である。
【0101】この図において、横軸は時間(ms)、縦
軸は周波数(Hz)であり、信号は白色雑音の混入した
400Hz正弦波(S/N=0dB)、伸長係数=1で
ある。
【0102】図19は本発明に係る抽出された平衡点の
相対的標準誤差を示す図である。
【0103】この図において、横軸は周波数(Hz)、
縦軸は相対的標準誤差であり、信号は白色雑音の混入し
た400Hz正弦波(S/N=0dB)、伸長係数=1
である。
【0104】図20は本発明に係る抽出された基準とな
る周波数から瞬時周波数への写像の安定な平衡点を示す
図である。
【0105】この図において、横軸は時間(ms)、縦
軸は周波数(Hz)であり、信号は白色雑音の混入した
400Hz正弦波(S/N=0dB)、伸長係数=4で
ある。
【0106】図21は本発明に係る抽出された平衡点の
相対的標準誤差を示す図である。
【0107】この図において、横軸は周波数(Hz)、
縦軸は相対的標準誤差を示し、信号は白色雑音の混入し
た400Hz正弦波(S/N=0dB)、伸長係数=4
である。
【0108】図22は本発明に係る抽出された基準とな
る周波数から瞬時周波数への写像の安定な平衡点を示す
図である。
【0109】この図において、横軸は時間(ms)、縦
軸は周波数(Hz)であり、信号は周期が増加するパル
ス列、伸長係数=1である。
【0110】図23は本発明に係る抽出された平衡点周
辺の傾きを示す図である。
【0111】この図において、横軸は周波数(Hz)、
縦軸は勾配であり、ここで、伸長係数=1である。
【0112】図24は本発明に係る音声波形「あいうえ
お」を示す図である。
【0113】この図において、横軸は時間(ms)であ
り、ここで、標本化周波数は44100Hzである。
【0114】図25は本発明に係る抽出された基準とな
る周波数から瞬時周波数への写像の安定な平衡点を示す
図である。
【0115】この図において、横軸は時間(ms)、縦
軸は周波数(Hz)であり、信号は男性の発声した「あ
いうえお」、伸長係数=1、ピッチ適応窓である。
【0116】図26は本発明に係わる音声波形「あいう
えお」についてチャープ基底を用いて求めた、基準とな
る周波数から瞬時周波数への写像の安定な平衡点を示す
図である。
【0117】図27は本発明に係る周期を1個だけ変更
したパルス列について求めた、基準となる周波数から瞬
時周波数への写像の安定な平衡点を示す図である。
【0118】この図において、横軸は時間(ms)、縦
軸は周波数(Hz)であり、ここで、周期5ms、1個
だけ5.05msである。
【0119】図28は本発明に係る周期を1個だけ変更
したパルス列について求めた、基準となる周波数から瞬
時周波数への写像の安定な平衡点のうち、第一次調波成
分に対応する平衡点を示す図である。
【0120】この図において、横軸は時間(ms)、縦
軸は周波数(Hz)であり、ここで、周期5ms、1個
だけ5.05ms、基本波成分だけの拡大表示を行って
いる。
【0121】まず、瞬時周波数の計算方法について説明
する(図1〜図3参照)。
【0122】ある信号(t)があったとき、瞬時周波
数は、その信号のヒルベルト(Hilbert)変換H
(t)]を用いて次のように定義される。
【0123】
【数1】
【0124】
【数2】
【0125】ここで、j=√−1は、虚数単位を表す。
この定義では、位相の時間微分として瞬時周波数を求め
ているため、履歴依存性のあるunwrapの処理が必
要である。これは、以下のような演算により、履歴依存
性の無い処理に置き換えることができる。
【0126】ここで、上で得られて、導入された複素数
として表される信号s(t)を次式のように表すことと
する。
【0127】
【数3】
【0128】この分解は、位相の2πの不定性を除けば
一意的に定まる。ここで用いられている位相φ(t)
と、瞬時周波数ω(t)との間には、次の関係がある。
【0129】
【数4】
【0130】ここでφ(t0 )は位相の初期値を表す。
【0131】ここで、信号を瞬時振幅a(t)で正規化
したものを時間微分した信号をy(t)とする。する
と、y(t)は次のように表される。
【0132】
【数5】
【0133】従って、y(t)の瞬時振幅を求めれば、
瞬時周波数となる。
【0134】実際には、離散時間系であるので、差分信
号を扱う必要がある。差分信号を、yd (t)とする。
また、サンプリング周期をΔtとする。
【0135】
【数6】
【0136】ここで、先に挙げた位相と瞬時角周波数ω
(t)の関係についての定義を参照する。角瞬時周波数
ω(t)の変化速度がゆっくりとしておりサンプリング
周期の間では一定であると近似できるものとする。する
と、yd (t)は、次のように書き換えることができ
る。
【0137】
【数7】
【0138】これを用いれば、瞬時角周波数は次式で求
められる。
【0139】
【数8】
【0140】瞬時周波数f(t)=ω(t)/(2π)
は、離散時間系の標本化周波数fsを用いて次のように
表される。
【0141】
【数9】
【0142】ここで、短時間フーリエ変換(FFT)の
定義を参照する。
【0143】
【数10】
【0144】ここで、w(t)は、目的とする信号を部
分的に切り出すための時間窓である。すると、各周波数
に対応する成分は、w(t−r)ejwt という複素数の
インパルス応答を有するフィルタの出力と解釈すること
ができる。w(t)のスペクトルが負の領域にもれを持
たなければ、この信号の実部と虚部はヒルベルト変換の
関係にあるから、上で行った議論を利用して、二つの引
き続く標本化時刻におけるフィルタ出力をそれぞれの振
幅で正規化した信号の差の絶対値から瞬時周波数を求め
ることができる。
【0145】上記の演算は、短時間フーリエ変換の各成
分に同時に適用することができる。したがって、以下の
演算により、各周波数における瞬時周波数f(λ,t)
を一括して求めることができる。
【0146】
【数11】
【0147】
【数12】
【0148】以上をまとめると、フーリエ変換を計算す
る装置と、逆正弦関数を計算する装置(逆関数表)があ
れば、簡単な積和演算により各周波数における瞬時周波
数が求められる。
【0149】以上の方法は、内容が直感的に理解しやす
い。しかし、毎回、逆三角関数を計算することは、実装
上では不経済である。そこで、テイラー(Taylo
r)展開の1次の項までを考慮し、それ以上の項を無視
することにより、毎回逆三角関数を計算する手間を以下
のようにして省くことができる。
【0150】
【数13】
【0151】ここで、sinの項とcosの項は注目す
る周波数だけの関数であるから、最初に表を作成してお
けば、毎回計算する必要は無い。この方法によれば、フ
ーリエ変換さえできれば、簡単な積和演算により、一挙
に各周波数における瞬時周波数が求められる。
【0152】Flanaganや阿部の方法に基づき、
微分を差分と位相調整で近似した計算法についても、以
下に記す。
【0153】
【数14】
【0154】
【数15】
【0155】ただし、1サンプルの移動では|X(λ、
t)|がほとんど変化しないと仮定して、次に示すよう
な簡単化を試みると、低い周波数領域でかつ平衡点の周
辺では、比較的良い近似を示すものの、平衡点と平衡点
の中間や高い周波数領域では誤差が大きくなり、実用に
耐えない。
【0156】
【数16】
【0157】次に、時間窓の設計について説明する。
【0158】瞬時周波数を抽出する時間窓に要求される
性能は、ピークの時間方向の変動が小さいことと、時間
周波数の不確定性が小さいことである。目的を調波複合
音の中の成分である単一正弦波の抽出とすれば、時間方
向の変動の主要な要因は、隣接する調波成分からの干渉
である。そこで、時間周波数の不確定性の小さな窓を最
用意し、隣接する調波成分からの干渉を抑圧するよ
うな変形を加えて、目的とする窓を作ることとする。
【0159】対象とする信号が音声ではなく、楽器や信
号音のように周波数が比較的安定しているものの場合に
は、時間方向の時間分解能を低下させることで、周波数
方向の分解能を向上させることができる。その場合に
は、以下で説明するようなcardinal B−sp
lineによるゼロの付加は必須ではない。しかし、音
声の場合は、常に基本周波数が変動しているため、窓の
長さを長くしていくと、測定値の信頼性が急速に低下す
る。
【0160】まず、時間周波数の不確定性が最小である
次のようなガウス(Gauss)関数から出発する。
【0161】
【数17】
【0162】
【数18】
【0163】ここでW(ω)は、時間窓w(t)のフー
リエ変換であり、ω0 =2πf0 は、時間と周波数分解
能が等方的になる角周波数及び周波数を表すものとす
る。
【0164】この時間窓をそのまま使用することは、不
適切である。なぜなら、負の周波数側への漏れが多く、
また、waveletの許容条件を満たしていないから
である。
【0165】等方的になる周波数が対象とする信号の基
本周波数(すなわち、隣接調波成分との間隔)であると
解釈すると、この時間窓と、基本周波数で定まる基本周
期の間隔を節点間隔とする2次のcardinal B
−splineを畳み込めば、基本波以外の調波の周波
数における応答がゼロでありかつ(ゼロが2次のゼロで
あるから、基本周波数の)誤差に鈍感になるようにでき
る。また、そうして作成された窓関数は、wavele
tの許容条件を実用的な意味において満たす。
【0166】
【数19】
【0167】ここで、◎は、畳み込みを表している。
【0168】次に、線スペクトル成分、スィープ成分の
抽出について説明する。
【0169】w(t−r)e(jλτ) が規定するフィル
タの通過帯域内に単一の周波数成分のみが存在する場合
には、フィルタ出力は、強制振動解であるから入力であ
る単一周波数成分の周波数が瞬時周波数として得られ
る。すなわち、瞬時周波数ω(λ,t)を注目する周波
数λに沿って見ていくと、雑音のみが存在する部分で
は、ωは、λの周辺を変動しながらλに追従して変化し
ていく。
【0170】しかし、一旦、w(t−τ)e(jλτ)
規定するフィルタの通過帯域内に単一の周波数成分が入
ってくると、ωは、急速にその単一周波数成分の周波数
ωcに接近し、再度単一周波数成分が通過域から外れる
λの位置を超えるまで、ωは一定値ωc を維持する。こ
の一定値がλと交差する位置を求めれば、そこがフィル
タの中心周波数と一致することが分かる。
【0171】ここで、表記の混乱を避けるため、ωが求
められた瞬時周波数を表し、λがフーリエ変換の周波数
軸を表すものとする。λはフーリエ変換を直線周波数軸
上で等間隔に並んだ複素帯域フィルタ群とみなした時
の、各フィルタの中心周波数とみなすこともできる。ω
とλは、両方とも周波数の次元を有しているので、ω
(λ)を周波数から周波数への写像と考えることもでき
る。
【0172】その場合、上記したことから明らかなよう
に、正弦波成分が存在する場合には、その正弦波の周波
数は、この写像の平衡点でかつ安定な平衡点となること
が分かる。安定な平衡点でないものは、いずれにせよ、
レベルが低いか、誤差が大きいかであり、注目する必要
の無い成分である。
【0173】したがって、この写像から安定平衡点を選
択することで、重要な線スペクトル成分は、全て拾い出
すことができる。
【0174】したがって、安定な平衡点(平衡点)を中
心として、フィルタの通過帯域内の瞬時周波数の一定値
ωc からのずれを指標(例えば、誤差の自乗和)とする
ことで、単一周波数成分の確からしさを表すことができ
る。
【0175】TEMPOで導入した「基本波らしさ」に
ならえば、「正弦波らしさ」と言えよう。
【0176】ここで、とりあえず、成分の変動量υ(λ
n ,t)の計算方法を示しておく。以下の式を用いる。
【0177】
【数20】
【0178】ここで、g( ) は、周波数の窓関数であ
る。この窓関数は、フィルタの通過帯域内部の情報を極
度な偏りなく拾い出すことができて、両端が滑らかに0
になるような関数であればよい。これは、時間窓w
(t)に連動して決められるべきものである。また、平
衡点の周波数(ただし、フィルタ中心周波数軸上の値)
λnは、次の条件を満たす周波数である。
【0179】
【数21】
【0180】
【数22】
【0181】ここで、εは適当な小さな定数である。実
際には、これはf(λn ,t)の性質により決まるもの
であるから、λn (t)と書かなければならない。むし
ろ扱いとしては、集合を規定した方がすっきりする。
【0182】
【数23】
【0183】この平衡点に対応する瞬時周波数に含まれ
る誤差に起因する変動量は、窓関数wの時間領域の表現
であるWの幅に依存した相対的な量になりそうである。
数式と数値シミュレーションにより確認することが必要
である。論理は、「同じ2次モーメントを持っていて
も、幅が広い方が、大きく離れた帯域内の他の周波数成
分からの影響を受ける。その影響の大きさは、Wの幅に
比例する。」である。ここでは、簡単な数式による検討
を行う。
【0184】微少成分の影響注目している帯域内に目的
とする成分ejwt の他に、僅かに周波数が違い、微少な
大きさの成分εej(ω +δ)tが存在すると仮定する。こ
こで、εとδは、適当な小さな定数である。この信号を
単一の成分がAM変調とFM変調を受けているものとし
て表現すると、以下のように近似できる。
【0185】
【数24】
【0186】提案した分析は、単一正弦波を仮定してい
るので、ここで求めたAM成分とFM成分が検出される
こととなる。この表現は、微少成分の周波数が主要な正
弦波の周波数からの差に比例して、周波数に対する誤差
が増加することを示している。また、最終的な近似式
は、εが微少な場合には、微少成分による影響は、線形
加算により近似できることを示している。
【0187】したがって、同じ大きさの微少成分(雑
音)の影響を2次のモーメントで評価することは妥当で
あるし、その2次のモーメントを分散と解釈して、抽出
された瞬時周波数の誤差を議論しても構わない。その結
果、同じ2次のモーメントが得られた場合であっても瞬
時周波数の抽出誤差は、窓関数の等価帯域幅に比例して
増加する。
【0188】周波数が一定方向に移動するようなスィー
プ信号の場合には、通過域の中に成分が入った場合に
は、傾いた直線状になる(傾きは、スィープ速度の2次
関数で近似される)。周波数が一定で、振幅が一様に増
加あるいは減少するような場合には、偶関数成分として
表れる。
【0189】スィープ成分までを許容とすれば、2次以
上の成分を変動成分として扱うことになる。複数の周波
数成分を統合する場合に、最小分散推定を導き出すこと
ができる。なお、瞬時周波数の解析で無視した2次の変
動成分は、対応する成分の瞬時振幅の変化の1次成分と
して、瞬時周波数を求めるために用いた二つの短時間フ
ーリエ変換から簡単に求めることができる。
【0190】変動成分の計算は、瞬時周波数の時間微分
抽出手段45,50を入れることにより、非常に性質の
良いものとなった。この計算はヒルベルト変換を用いた
包絡の計算を近似するものでもある。
【0191】次に、基本周波数の抽出について説明す
る。
【0192】まず、基本周波数のおおよそ(精度±20
%程度)の値が分かっており、精密な基本周波数を求め
たい場合について説明する。この精度で基本周波数が分
かっていれば、窓関数のパラメータτ0 をこの基本周波
数に対応する値に設定し、分析を行う。すると、平衡点
として、調波成分に対応するもののみが抽出されてく
る。
【0193】もし、調波成分だけが抽出されているな
ら、それらを統合して基本周波数の推定値を求めるため
の漸化式は次のようになる。
【0194】
【数25】
【0195】ここで、Vn (t;τc )は、n番目の調
波成分の誤差の分散を基本周波数に対応するものに換算
した値である。V(n) (t;τc )は、n番目までの調
波成分を考慮した最小分散推定による分散の値である。
また、fn (t;τc )は、n番目の調波成分の瞬時周
波数を基本周波数に対応するものに換算した値である。
0 (n) (t;τc )は、n番目までの調波成分を考慮
した最小分散推定による基本周波数の推定値である。τ
c は、時刻である。
【0196】次に、基本周波数の抽出、特に、音源特性
制御への応用について説明する。
【0197】分析情報に基づいて合成音源を作成する場
合、これまでは、有声/無声の判定は困難な問題とし
て、様々な工夫が行われてきた。各周波数における自己
相関やスペクトルの形状を利用して周波数帯域毎に有声
/無声を判定するMBEは、比較的品質の良い方法とし
て利用されてきた。また、非常に高品質の音声分析変換
合成法であるSTRAIGHT(河原英紀,増田郁代,
“時間周波数領域での補間を用いた音声の変換につい
て”信学技報,Vol.EA96−28,August
1996.8及びHideki Kawahara.
“Speech representation an
d transformation using ad
aptive interpolation of w
eighted spectrum:Vocoder
revisited”.in Proceedings
of IEEE int,Conf.Acous
t.,Speech and Signal Proc
eeding,Vol.2,pp.1303−130
6.Munich,1997.)においても、MBE
〔Daniel W.Griffin and Jae
S.Lim.“Multihaud excitat
ion Vocoder”.IEEE Trans.o
nAcoustics,Speech and Sig
nal Proceeding,36(8):1223
−1235,1988〕と類似のアイデアによる合成音
源の分析と制御が用いられていた。しかし、これらは、
近似的な発見的工夫を随所に取り入れたものであり、所
期の性能を発揮させるためには、様々な試行錯誤が必要
であった。
【0198】一方、本発明で求められる各正弦波成分の
変動Vn (t;τc )〔正確には、f0 n (t;
τc )/τc という形に正規化する必要がある〕は、音
源の性質そのものを直接表している。この量は、簡単な
変換でそのまま音源特性の制御に用いることができると
いう見通しの良さと性質の良さを併せ持っている。
【0199】基本周波数の変化速度が大きな場合には、
規則的な駆動源による信号であっても、このような評価
基準で見たときに「雑音性」の成分があるように見えて
しまうことがある。また、ホルマント等の共振が鋭い場
合のパルス性の駆動の場合にも、たまたま次のパルスに
よる応答が、以前のパルスによる応答の逆相となること
もあり得る。そのような場合も、見かけ上の雑音性は増
加する。
【0200】このような問題は、時間微分に基づく時間
軸の伸縮で解消された。また、定量的に変換法則を書け
る材料はそろってきた。
【0201】次に、正弦波モデルの直接推定について説
明する。
【0202】基本周波数よりも周波数分解能の高い窓を
利用して正弦波成分に帰着させることのできる成分の瞬
時周波数を求めることができる。これは、多数の繰り返
し演算を必要とする正弦波モデルを効率良く計算するた
めの別解を与える。
【0203】信頼性の高い成分と、エネルギーの大きな
成分を選択することにより、本質的な成分だけを取り出
すことができる。
【0204】まず、信号の構造解析について説明する。
【0205】Λ(t)の時刻を固定して、時間窓w
(t)の長さを短いものから拡大していくことを考え
る。あるいは、複素wavelet変換の二つの隣接す
る時刻を考えても良い。すると、Λは、観測時刻とスケ
ールの関数Λ(a、t)となる。ここで、aはスケール
を表す指標とする。
【0206】Λ(a、t)は、aの増加とともに要素数
が増加するので、ある時刻を固定して周波数λとスケー
ルaによって定められる2次元平面上に表示すると、分
岐図となる。それぞれのΛ(a、t)には、誤差の分散
と、周波数ならびに振幅方向の変化速度、その位置にお
けるエネルギーが付随しているので、それらをもとにし
て、信号の構造を規定することができる。
【0207】音声の場合には、ホルマントに起因する構
造、基本周波数に起因する構造、サブハーモニックな、
声帯の振動に起因する構造が見える。
【0208】次に、信号の構造解析、特に、信号の構造
解析を用いた基本周波数の抽出について説明する。
【0209】前に説明した基本周波数についての議論
は、予め基本周波数が分からなければ、利用することが
困難である。ここでは、信号の構造解析の結果を統合し
て基本周波数を求める方法を説明するまず、ある長さに
ついて、議論する。各単一正弦波成分をcos位相と
し、それぞれの振幅を標準偏差で正規化して合成すれ
ば、調波構造が存在する場合には、基本波の整数倍の部
分にピークが発生する。Lは、「周期らしさ」を表すと
言って良い。
【0210】
【数26】
【0211】
【数27】
【0212】ここでαk は、kが大きくなるに従って減
少するような正の数である。ただし、実際の音声では、
低い調波成分ほど変動が小さいようなので、用いる最高
の次数だけを決めておけば、αk は一定の値でも構わな
い。なお、実用的には、Vkの大きさに下限を設ける
か、ある時間範囲について積分したVk の値を用いて、
統計的な揺らぎによって1/√Vk が過大な値を取らな
いようにする工夫が必要である。
【0213】ここで、軸を対数周波数軸とすれば、整数
比の拾い出しにより生ずるピークの横軸上での間隔は、
基本周波数によらずに一定の系列になる。つまり、調波
構造が存在すれば、その形は、平行移動による変化を除
き、一定になる。対数周波数軸uを形式的に表せば以下
のようになる。
【0214】
【数28】
【0215】ここで、f0 は周波数である。
【0216】このように対数周波数軸を用いてより低い
基本周波数に対応するピークは、それよりも低い基本周
波数に対応するピークに用いられた成分を含んでいるか
ら、それらを差し引くことで、その低い方の基本周波数
のみに帰属させられる変動成分を求めるためには、上記
の一定の系列を利用した、デコンボリューションを行え
ば良い。
【0217】例えば、200Hzを基準として、窓の伸
長係数を、例えば0.2から2あるいは5まで、例え
ば、sqrt2の比で、対数軸上で等間隔に、変化させ
ながらこのようなデコンボリューションを行えば、調波
構造を明瞭にすることのできる伸長係数が、事前情報を
利用せずに求められる。この伸長係数(窓長)を利用し
て、適切な窓長を選択し、そこで窓長が既知の場合の方
法を用いることにより、基本周波数の最小分散推定が可
能になる。
【0218】なお、対数周波数軸を用いる直感的な方法
の他に、「周期らしさ」Lを計算する部分を修正し、整
数倍の周期への影響を計算の段階で取り除いて、「基本
周期らしさ」という指標Mを定義することができる。形
式的には、この操作は、以下のように示すことができ
る。
【0219】
【数29】
【0220】
【数30】
【0221】ここでR[]は、バイアスのある望ましく
は滑らかな半波整流関数である。バイアスは、考慮すべ
き平衡点の個数をNとすると、例えば、1/√Nと選択
すれば良い。
【0222】次に、本発明の第4実施例について説明す
る。
【0223】図29は本発明の第4実施例を示す信号分
析装置の基本周波数抽出装置のブロック図である。
【0224】この図に示すように、この基本周波数抽出
装置は、入力回路61、分析ウェーブレット作成手段6
2、ウェーブレット分析手段63、瞬時周波数抽出手段
64、安定平衡点抽出手段65、瞬時周波数時間微分抽
出手段66、変動計算手段67、基本周波数計算手段6
8から構成されている。なお、X(t)は、入力信号、
Xout は出力信号である。
【0225】以下、この基本周波数抽出装置の各部分に
ついて詳細に説明する。
【0226】入力回路61は、分析の対象とする音声信
号あるいは画像の走査によって得られるような時系列信
号を表すアナログ信号あるいはディジタル信号を、内部
処理のための時間的に等間隔に標本化されたディジタル
信号に変換する。
【0227】分析ウェーブレット作成手段62は、基本
周波数が出現し得る全周波数範囲をカバーするように搬
送周波数を設定して、その中の一つの搬送周波数に基づ
いて、ガウス窓と、2次のcardinal B−sp
line関数を求め、それらを畳み込んだものに、更に
搬送周波数の複素指数関数を掛けることによって、ウェ
ーブレット分析手段63で用いる分析ウェーブレットを
作成する。この分析ウェーブレットは、性能の劣化を許
容すれば、上述したガウス窓とcardinal B−
spline関数の畳み込みによるもの以外を用いるこ
ともできる。
【0228】ウェーブレット分析手段63は、分析ウェ
ーブレット作成手段62で求められた分析ウェーブレッ
トを対数周波数軸上で等間隔になるように伸縮して複数
の信号を作成し、それらをもとの信号と畳み込むことに
より複素ウェーブレット分析を計算する。
【0229】瞬時周波数抽出手段64は、それぞれの分
析ウェーブレットが対応する搬送周波数における瞬時周
波数を、第1実施例あるいは第2実施例に示した方法あ
るいはそれらと数学的に等価である方法によって計算す
る。
【0230】安定平衡点抽出手段65は、瞬時周波数抽
出手段64により求められた瞬時周波数に基づいて、周
波数から瞬時周波数への写像の安定な平衡点を抽出す
る。
【0231】瞬時周波数時間微分抽出手段66は、瞬時
周波数抽出手段64で求められた瞬時周波数の値および
1サンプル過去の瞬時周波数の値との差に基づいて瞬時
周波数時間微分を求める。
【0232】変動計算手段67は、安定平衡点抽出手段
65で求められた安定平衡点の周辺での瞬時周波数と、
瞬時周波数時間微分抽出手段66で求められる瞬時周波
数時間微分の同じく安定平衡点の周辺での値に基づい
て、瞬時周波数の推定値の分散に相当する変動量を計算
する。
【0233】基本周波数計算手段68は、安定平衡点抽
出手段67で求められたそれぞれの安定平衡点につい
て、変動計算手段67により求められた変動の値の時間
方向での累積値が最小になるような安定平衡点の系列を
選択することにより、基本周波数を求める。なお、音声
の開始や終了のような基本周波数成分が非常に弱い特殊
な場合以外であれば、単純にそれぞれの時刻において最
も変動が少ない安定平衡点を選択するだけで、基本周波
数が求められる。
【0234】この実施例の基本周波数抽出装置によれ
ば、第1実施例や第3実施例で必要であったある程度の
精度を有する基本周波数の近似値を必要としない基本周
波数の抽出を可能とする。また、本装置を、例えば第3
実施例の基本周波数計算(低域情報)手段までの部分と
置き換えて用いることもできる。
【0235】図30には、本発明の第4実施例に係わる
ウェーブレット分析を用いた安定平衡点の時間−スケー
ル平面における散布図が示されている。ここで用いた分
析ウェーブレットは、絶対値の形状を伸長係数μ=1を
用いて決定した。図中の最も滑らかな軌跡は、基本波成
分に対応する安定平衡点から構成されている。平均的に
は、この軌跡上での変動が最小となる。
【0236】なお、本発明は上記実施例に限定されるも
のではなく、本発明の趣旨に基づいて種々の変形が可能
であり、これらを本発明の範囲から排除するものではな
い。
【0237】
【発明の効果】以上、詳細に説明したように、本発明に
よれば、次のような効果を奏することができる。
【0238】(A)瞬時周波数特性を周波数から周波数
への写像とみなし、写像の安定な平衡点の性質に基づい
て、信号の構造ならびに、最小分散推定の意味で最適な
基本周波数及び、それぞれの周波数領域における周期性
/雑音性/駆動エネルギーの集中度を併せて求めること
により、信号の的確な分析を行うことができる。
【0239】(B)信号に対する仮定の少ない安定で高
精度の分析を行うことができる。
【0240】したがって、この信号分析装置では、単独
で、高精度の計測装置として利用できる他、音声認識
や、音声合成・変換、音響現象を用いた機械の診断、電
子楽器等の高品質化、高精度化のためにこれらの装置の
一部として組み込んで利用することができる。
【0241】(C)音声などの信号の基本周波数やそれ
ぞれの調波成分の正弦波らしさを精密に定量的に分析・
表示することができる。
【0242】(D)音声を特徴付ける声道の共振特性や
楽器を特徴付ける様々な共鳴腔の特性、振動物体の特徴
的な共振周波数や声の高さ(ピッチ)等を、安定に高速
に求めることができる。
【図面の簡単な説明】
【図1】本発明の第1実施例を示す信号分析装置の基本
周波数抽出装置のブロック図である。
【図2】本発明の第2実施例を示す信号分析装置の構造
解析及び基本周波数抽出装置のブロック図である。
【図3】本発明の第3実施例を示す信号分析装置の高精
度音源情報抽出装置のブロック図である。
【図4】母音「ア」の振幅スペクトル(低周波部分)を
示す図(窓の伸長係数=1)である。
【図5】母音「ア」の振幅スペクトルにより正規化した
隣接する時点での複素スペクトルの差の絶対値から求め
られた瞬時周波数(低周波部分)を示す図(窓の伸長係
数=1)である。
【図6】母音「ア」の各周波数における「単一正弦波ら
しさ」を示す図(窓の伸長係数=1)である。
【図7】母音「ア」の選択された平衡点における瞬時周
波数を基本周波数に換算した値を示す図(窓の伸長係数
=1)である。
【図8】母音「ア」の平衡点について、表示されている
フィルタの中心周波数までの基本周波数情報を統合した
ときの標準誤差を示す図(窓の伸長係数=1)である。
【図9】母音「ア」の平衡点について、表示されている
フィルタの中心周波数までの基本周波数情報を統合した
ときの基本周波数の推定値を示す図(窓の伸長係数=
1)である。
【図10】持続発声された母音「ア」の基本周波数の推
定値を示す図(窓の伸長係数=1)である。
【図11】持続発声された母音「ア」からの正弦波成分
の抽出を示す図である。
【図12】持続発声された母音「ア」から抽出された正
弦波成分の変動(その1)を示す図である。
【図13】持続発声された母音「ア」から抽出された正
弦波成分の変動(その2)を示す図である。
【図14】持続発声された母音「ア」からの事前情報無
しの場合の基本周波数抽出マップを示す図である。
【図15】持続発声された母音「ア」からの事前情報無
しの場合の基本周波数抽出マップの一断面を示す図であ
る。
【図16】白色雑音の混入した400Hz正弦波を示す
図である。
【図17】各フィルタ周波数に対する出力瞬時周波数を
示す図である。
【図18】抽出された基準となる周波数から瞬時周波数
への写像の安定な平衡点を示す図である。
【図19】抽出された平衡点の相対的標準誤差を示す図
(伸長係数=1)である。
【図20】抽出された基準となる周波数から瞬時周波数
への写像の安定な平衡点を示す図である。
【図21】抽出された平衡点の相対的標準誤差を示す図
(伸長係数=4)である。
【図22】抽出された基準となる周波数から瞬時周波数
への写像の安定な平衡点を示す図である。
【図23】抽出された平衡点周辺の傾きを示す図(伸長
係数=1)である。
【図24】音声波形「あいうえお」を示す図である。
【図25】抽出された基準となる周波数から瞬時周波数
への写像の安定な平衡点を示す図である。
【図26】本発明に係わる音声波形「あいうえお」につ
いてチャープ基底を用いて求めた、基準となる周波数か
ら瞬時周波数への写像の安定な平衡点を示す図である。
【図27】周期を1個だけ変更したパルス列を示す図
(その1)である。
【図28】周期を1個だけ変更したパルス列を示す図
(その2)である。
【図29】本発明の第4実施例を示す信号分析装置の基
本周波数抽出装置のブロック図である。
【図30】本発明の第4実施例に係わるウェーブレット
分析を用いた安定平衡点の時間−スケール平面における
散布図である。
【符号の説明】
1,21,41,61 入力回路 2,22,42 窓作成手段 3,23 サンプル遅延手段 4,5,24,25 FFT(短時間フーリエ変換)
手段 6,7,26,27 振幅正規化手段 8,28 差分抽出手段 9,29 絶対値計算手段 10,30 瞬時周波数変換手段 11,31,46,51,67 変動計算手段 12,35,68 基本周波数計算手段 32 信号構造マップ作成手段 33 調波性マップ作成手段 34 最適窓選択手段 43,64 瞬時周波数抽出(低域情報)手段 44,65 安定平衡点抽出手段 45,50,66 瞬時周波数時間微分抽出手段 47 基本周波数計算(低域情報)手段 48 瞬時周波数抽出〔チャープ(Chirp)基
底〕手段 49 安定平衡点抽出手段 52 基本周波数計算(チャープ基底)手段 53 周期性指標計算手段 54 逆フィルタ 55 駆動力局所性指標計算手段 62 分析ウェーブレット作成手段 63 ウェーブレット分析手段

Claims (5)

    (57)【特許請求の範囲】
  1. 【請求項1】(a)各周波数における瞬時周波数を周波
    数から周波数への写像と見なして安定な平衡点を求める
    装置と、 (b)該安定な平衡点を求める装置により求めた安定な
    平衡点の周辺の変動に基づいた加重を設定する装置と、 (c)該加重を設定する装置を通じて前記平衡点の周波
    数に関する情報を統合して基本周波数を求める装置とを
    具備することを特徴とする信号分析装置。
  2. 【請求項2】 請求項1記載の信号分析装置において、
    時間窓の分解能を基本周波数及び基本周期の近似値と同
    程度に設定し、基本周波数及び調波成分の瞬時周波数を
    求めて基本周波数を高精度に求めることを特徴とする信
    号分析装置。
  3. 【請求項3】 請求項2記載の信号分析装置において、
    前記時間窓の分解能を基本周波数及び基本周期の近似値
    と同程度に設定し、基本周期の近似値に適応的に定めら
    れる周期成分抑圧用平滑化関数と畳み込んで作成される
    窓を用いることにより、基本周波数及び調波成分の瞬時
    周波数を求めて基本周波数を高精度に求めることを特徴
    とする信号分析装置。
  4. 【請求項4】 請求項1記載の信号分析装置において、
    対数周波数軸上でほぼ等間隔あるいは、直線周波数軸上
    でほぼ等間隔、あるいは、特定の時間サイズに密に配置
    する等の不等間隔になるように設計された複数の時間長
    の時間窓の組を用いることにより信号の階層構造を分析
    することを特徴とする信号分析装置。
  5. 【請求項5】 請求項1記載の信号分析装置において、
    画像の走査により得られる信号を入力信号として用いる
    ことにより画像の構造を解析することを特徴とする信号
    分析装置。
JP35094998A 1998-12-10 1998-12-10 信号分析装置 Expired - Fee Related JP3251555B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP35094998A JP3251555B2 (ja) 1998-12-10 1998-12-10 信号分析装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP35094998A JP3251555B2 (ja) 1998-12-10 1998-12-10 信号分析装置

Publications (2)

Publication Number Publication Date
JP2000181472A JP2000181472A (ja) 2000-06-30
JP3251555B2 true JP3251555B2 (ja) 2002-01-28

Family

ID=18414011

Family Applications (1)

Application Number Title Priority Date Filing Date
JP35094998A Expired - Fee Related JP3251555B2 (ja) 1998-12-10 1998-12-10 信号分析装置

Country Status (1)

Country Link
JP (1) JP3251555B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109361477A (zh) * 2018-11-13 2019-02-19 中电科仪器仪表有限公司 一种瞬时频率测量装置及测量方法

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3417880B2 (ja) * 1999-07-07 2003-06-16 科学技術振興事業団 音源情報の抽出方法及び装置
WO2004084176A1 (ja) * 2000-08-15 2004-09-30 Yoichi Ando 音響評価方法およびそのシステム
JP4178319B2 (ja) 2002-09-13 2008-11-12 インターナショナル・ビジネス・マシーンズ・コーポレーション 音声処理におけるフェーズ・アライメント
JP2005202354A (ja) * 2003-12-19 2005-07-28 Toudai Tlo Ltd 信号解析方法
KR101248353B1 (ko) 2005-06-09 2013-04-02 가부시키가이샤 에이.지.아이 피치 주파수를 검출하는 음성 해석 장치, 음성 해석 방법,및 음성 해석 프로그램
JP4539920B2 (ja) * 2006-05-12 2010-09-08 国立大学法人 東京大学 振動波検出方法及び装置
JP4883408B2 (ja) * 2007-01-22 2012-02-22 独立行政法人情報通信研究機構 系列データ間の類似性検査方法及び装置
WO2008136443A1 (ja) * 2007-04-26 2008-11-13 The University Of Tokyo 正弦波パラメータ推定方法
KR20160021770A (ko) * 2013-06-17 2016-02-26 고쿠리츠켄큐카이하츠호진 상교기쥬츠 소고켄큐쇼 멀티패스 전파환경에 있어서의 전파지연특성의 측정방법과 장치 및 외부음 지각장치
JP2015102486A (ja) * 2013-11-27 2015-06-04 積水化学工業株式会社 欠陥位置の特定方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109361477A (zh) * 2018-11-13 2019-02-19 中电科仪器仪表有限公司 一种瞬时频率测量装置及测量方法
CN109361477B (zh) * 2018-11-13 2021-04-13 中电科思仪科技股份有限公司 一种瞬时频率测量装置及测量方法

Also Published As

Publication number Publication date
JP2000181472A (ja) 2000-06-30

Similar Documents

Publication Publication Date Title
JP5275612B2 (ja) 周期信号処理方法、周期信号変換方法および周期信号処理装置ならびに周期信号の分析方法
EP0388104B1 (en) Method for speech analysis and synthesis
Sukhostat et al. A comparative analysis of pitch detection methods under the influence of different noise conditions
EP1422693B1 (en) Pitch waveform signal generation apparatus; pitch waveform signal generation method; and program
Caetano et al. Improved estimation of the amplitude envelope of time-domain signals using true envelope cepstral smoothing
JP3251555B2 (ja) 信号分析装置
Manfredi et al. Perturbation measurements in highly irregular voice signals: Performances/validity of analysis software tools
JP3417880B2 (ja) 音源情報の抽出方法及び装置
Hess Algorithms and devices for pitch determination of speech signals
US7438689B2 (en) Method for arbitrary two-dimensional scaling of phonocardiographic signals
CN109584902B (zh) 一种音乐节奏确定方法、装置、设备及存储介质
Niederjohn et al. A zero-crossing consistency method for formant tracking of voiced speech in high noise levels
Esquef et al. Frequency-zooming ARMA modeling for analysis of noisy string instrument tones
Chowdhury et al. Formant estimation from speech signal using the magnitude spectrum modified with group delay spectrum
Rao et al. Speech formant frequency estimation: evaluating a nonstationary analysis method
JP2015040963A (ja) 音響用フィルタ装置、音響用フィルタリング方法、およびプログラム
Usman et al. Empirical mode decomposition for analysis and filtering of speech signals
Derrien A very low latency pitch tracker for audio to MIDI conversion
Beauchamp Comparison of vocal and violin vibrato with relationship to the source/filter model
KR100484666B1 (ko) 성도특성 변환을 이용한 음색변환장치 및 방법
Caetano et al. Adaptive sinusoidal modeling of percussive musical instrument sounds
Zhang et al. A matlab-based signal processing toolbox for the characterization and analysis of musical vibrato
KR0128851B1 (ko) 극성이 다른 가변길이 듀얼 임펄스의 스펙트럼 하모닉스 매칭에 의한 피치 검출 방법
d’Alessandro et al. Phase-based methods for voice source analysis
Fulop et al. The Reassigned Spectrogram

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20011106

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071116

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081116

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091116

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101116

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111116

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121116

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121116

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131116

Year of fee payment: 12

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees