JP2001249676A - 雑音が付加された周期波形の基本周期あるいは基本周波数の抽出方法 - Google Patents

雑音が付加された周期波形の基本周期あるいは基本周波数の抽出方法

Info

Publication number
JP2001249676A
JP2001249676A JP2000059853A JP2000059853A JP2001249676A JP 2001249676 A JP2001249676 A JP 2001249676A JP 2000059853 A JP2000059853 A JP 2000059853A JP 2000059853 A JP2000059853 A JP 2000059853A JP 2001249676 A JP2001249676 A JP 2001249676A
Authority
JP
Japan
Prior art keywords
noise
fundamental frequency
fundamental
sound
frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2000059853A
Other languages
English (en)
Other versions
JP3916834B2 (ja
Inventor
Masato Akagi
正人 赤木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Science and Technology Agency
Original Assignee
Japan Science and Technology Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Japan Science and Technology Corp filed Critical Japan Science and Technology Corp
Priority to JP2000059853A priority Critical patent/JP3916834B2/ja
Publication of JP2001249676A publication Critical patent/JP2001249676A/ja
Application granted granted Critical
Publication of JP3916834B2 publication Critical patent/JP3916834B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 雑音に強くしかも高精度な基本周期あるいは
基本周波数を抽出できる雑音が付加された周期波形の基
本周期あるいは基本周波数の抽出方法を提供する。 【解決手段】 調波構造をもつ目的音と雑音が混ざり合
った混合音x(t)を、ただ一つの受音源で観測し、雑
音n(t)に強い櫛型フィルタによる基本周波数推定法
を用いて、観測された混合音x(t)から目的音s
(t)の基本周波数を大まかに推定し、推定された基本
周波数に合わせた帯域幅可変櫛形フィルタによって推定
雑音を抽出し、推定雑音を元の混合音から引き去ること
により雑音の抑圧を行い、雑音を抑圧した信号に対し
て、瞬時周波数を基にした基本周波数推定法を用い、高
精度の基本周波数を推定し、この高精度の基本周波数を
用いた帯域幅可変櫛形フィルタで雑音を推定し除去し、
雑音を抑圧した目的音を得る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、雑音(妨害音)が
含まれた波形からの基本周波数あるいは基本周期の抽出
を行う基本周期あるいは基本周波数の抽出方法に関する
ものである。
【0002】
【従来の技術】音声は人間が用いるコミュニケーション
手段のなかで基本的かつ効果的なものである。そのた
め、ディジタル信号処理の発展に伴い、音声の特徴情報
を抽出することによる音声符号化、音声分析合成、音声
合成、音声認識、話者認識等の研究が幅広く行われてき
ている。また、信号処理技術の応用としてディジタル補
聴器のような製品も開発されており、人間−機械のコミ
ュニケーションシステムの実現へ向けて期待が寄せられ
ている。
【0003】(1)時間情報を用いた雑音抑圧 複数の音や雑音がある環境で特定の音源から生成される
音を聞き分けることは人間には容易なことである。「カ
クテルパーティ効果」と呼ばれる聴覚のこの機能を工学
的に実現することができれば、音声認識を様々な環境で
安定して動作させるために極めて有効であるし、補聴器
等の前処理に用いることで雑音による会話理解の妨害を
防ぐことが可能となる。
【0004】複数の音の中から目的の音を取り出す音源
分離(雑音抑圧)の研究は古くから行なわれているが、
それらは受音源の数で2種類に分けられる。1つは受音
源の数を複数にすることで音源の位置情報を利用して音
を取り出すというものである。受音源としてマイクロホ
ンアレーを使い、受音の指向性を鋭くすることで特定の
位置にある音源からの音のみを受音する方法や、音の到
来方向時間差から雑音スペクトルサブトラクションによ
って目的の音を得る方法等がある。もう1つは受音源の
数を1つのみとして受音した音から何らかの制約条件を
用い目的音や雑音を推定するというものである。これに
は、CookeやBrownのガンマトーンフィルタバ
ンクを用いた音響事象に基づいたモデルやEllisの
蝸牛殻フィルタバンクを用いた心理音響学的グルーピン
グの規則に基づいたモデル、中谷らのマルチエージェン
トシステムによる音響ストリーム分離モデル等がある。
【0005】しかし、これらの手法には、それぞれ問題
点がある。ある程度の広さのマイクロホン間隔をとらな
ければならないため、受音源が複数ある方法が補聴器へ
の応用に適しているとは言えない。また、受音源が単一
の手法は上述のものを含めてほとんどが振幅(あるいは
パワー)スペクトルを用いているために、音本来の情報
である基本周期や位相等の時間情報の多くが潰されてし
まい利用されない。
【0006】時間情報を用いた研究としては、de C
heveigneが調波構造を持つ混合音の基本周期を
推定するキャンセレーションモデルを提案している。こ
のモデルは1つの音の基本周期を推定し、基本周期に合
わせた遅延回路によってその音を混合音から除去するこ
とで残った信号の基本周期を推定している。この遅延線
と抑制性シナプスからなる遅延回路は猫や豚等多くの動
物の神経回路にも存在することが報告されている。しか
し、de Cheveigneは図18に示すような神
経回路の処理の定式化を考慮しており、分離を行なって
いるのは聴神経線維によるスパイク列である。工学的に
は櫛形フィルタによる基本周期推定の提案に留まってお
り、音声波形の分離の可能性を示唆しているものの波形
レベルでの分離は行なっていない。
【0007】(2)雑音環境における基本周波数推定 有声/無声判定や音量等とともに基本周波数は音源情報
のひとつであり、音声の符号化伝送上の役割は大きい。
音声の認識や理解、話者識別、音声分析合成などには声
道情報と音源情報の処理が必要であるが、基本周波数は
韻律性だけでなく実際は音韻情報を担うスペクトルパラ
メータとも相関があるので、音韻認識にも効果的に利用
することができる。また、聴覚の情景解析に関する研究
では、基本周波数が重畳する音を別々の音の流れである
と認識するための手掛りの一つであるとしている。
【0008】このように基本周波数は音声の信号処理上
重要であるため、基本周波数推定は音声分析の研究が始
まって以来の研究課題であり、これまでにも様々な方法
が提案されている。代表的なものとして、音声波形の自
己相関による方法、LPC分析の残差信号の自己相関に
よる方法、パワースペクトルの対数の逆フーリエ変換に
よりスペクトル包絡と微細構造を分離して微細構造から
基本周波数を求める方法、平均振幅差関数(AMDF)
によって周期性を検出する方法等がある。
【0009】しかし、音声が完全に周期的な波でなく準
周期的であることや状況に応じて雑音が含まれるために
基本周波数の抽出誤差が生まれる等の問題があるため、
まだ決定的な方法は確立していない。
【0010】短時間フーリエ変換の瞬時周波数には音源
情報が含まれていることに着目し、河原らはフィルタの
中心周波数からフィルタ出力の瞬時周波数への写像の不
動点を用いて基本周波数を抽出する方法を提案してい
る。河原らのこの基本周波数抽出法(TEMPO2)は
クリーンな音声から高精度の基本周波数を得ることがで
きる。しかし、雑音のある環境においては推定精度が低
下するという問題がある。
【0011】雑音に強い基本周波数推定法として、鵜木
は瞬時振幅に対して通過量が最大となるような周波数軸
上の櫛形フィルタによる方法を提案している。この鵜木
の櫛形フィルタによる基本周波数推定法は、信号対雑音
比が0dB程度の雑音が付加された音声に対しても基本
周波数を推定することができるが、クリーンな音声に対
してはTEMPO2よりも推定精度の点で劣る。
【0012】
【発明が解決しようとする課題】上記したように、音声
認識は一部実用化されているものの、雑音が存在しない
環境において使用することを前提とした認識アルゴリズ
ムによる研究がほとんどである。そのため、雑音のない
環境で発声した音声に対する音声認識システムの認識精
度が95%であるのに対し、18dBの信号対雑音比下
で発声した音声では誤り率が一桁大きくなると報告され
ている。また、雑音が定常的であれば雑音が付加された
音声から参照パターンを作成することにより、雑音によ
る認識精度の低下は非常に小さくできるが、突発的な雑
音には対処できない。さらに、実環境では参照パターン
の学習時とテスト時の条件が同一であることは滅多にな
いため、雑音環境においても頑健な性能の音声認識シス
テムはまだ実用化されていない。
【0013】音声信号処理のなかで実用化されている一
つとしてディジタル補聴器が挙げられる。ディジタル補
聴器では補聴器の調整及び音響処理をディジタル信号処
理で行なっている。補聴器は難聴者が聴きたい会話音を
難聴者の聴きやすい範囲に増幅するために使用される
が、外界からの音をそのまま増幅したのでは雑音も増幅
してしまうことになり、騒音により補聴器使用者にうる
さい感覚を引き起こし、また、騒音が語音を遮蔽してし
まうため会話理解を妨害する。これは、ノンリニア増幅
により周波数帯域ごとに利得を変えることで対処できる
が、環境によって利得調整を行なう必要がある。
【0014】このように雑音環境における音声信号処理
では、雑音を抑圧し音声波形や音声の特徴を抽出するこ
とが重要となる。
【0015】本発明は、上記状況に鑑みて、雑音には強
いが基本周期推定の精度が劣る方法から得られた基本周
波数をもとに、通過域可変櫛形フィルタを用いた妨害音
抑圧手法を組み合わせて妨害音を低減し、その後、雑音
には弱いが高精度で抽出可能な方法を適用することによ
り、雑音に強くしかも高精度な基本周期あるいは基本周
波数を抽出できる雑音が付加された周期波形の基本周期
あるいは基本周波数の抽出方法を提供することを目的と
する。
【0016】また、本発明は、有声音のように調波構造
を持つ波形を対象として、雑音環境における頑健で高精
度な基本周波数推定法及び雑音抑圧アルゴリズムを構築
する。
【0017】
【課題を解決するための手段】本発明は、上記目的を達
成するために、 〔1〕雑音が付加された周期波形の基本周期あるいは基
本周波数の抽出方法において、(a)調波構造をもつ目
的音と雑音が混ざり合った混合音を、ただ一つの受音源
で観測し、雑音に強い櫛型フィルタによる基本周波数推
定法を用いて、観測された混合音から目的音の基本周波
数を大まかに推定し、(b)推定された基本周波数に合
わせた帯域幅可変櫛形フィルタによって推定雑音を抽出
し、推定雑音を元の混合音から引き去ることにより雑音
の抑圧を行い、(c)雑音を抑圧した信号に対して、瞬
時周波数を基にした基本周波数推定法を用い、高精度の
基本周波数を推定し、(d)この高精度の基本周波数を
用いた帯域幅可変櫛形フィルタで雑音を推定し除去し、
雑音を抑圧した目的音を得ることを特徴とする。
【0018】〔2〕上記〔1〕記載の雑音が付加された
周期波形の基本周期あるいは基本周波数の抽出方法にお
いて、前記工程(c)において、前記基本周波数を一定
にするような波形伸縮を行なうことにより、雑音抑圧時
の誤差を低減させることを特徴とする。
【0019】〔3〕雑音が付加された周期波形の基本周
期あるいは基本周波数の抽出方法において、(a)雑音
に強い櫛型フィルタによる基本周波数推定法を用いて、
観測された混合音から音声の基本周波数を大まかに推定
し、(b)前記基本周波数を基にした帯域幅可変櫛形フ
ィルタを用い雑音を抑圧し、(c)雑音が抑圧された音
声に対して、雑音に弱いが高精度の基本周波数抽出法で
あるTEMPO2を用いることにより、雑音中の音声か
ら高精度の基本周波数を推定することを特徴とする。
【0020】〔4〕上記〔3〕記載の雑音が付加された
周期波形の基本周期あるいは基本周波数の抽出方法にお
いて、前記工程(b)において、前記帯域幅可変櫛形フ
ィルタのパラメータを調節して通過帯域幅を制御するこ
とにより周期波形の調波成分を抑圧しないようにするこ
とを特徴とする。
【0021】
【発明の実施の形態】以下、本発明の実施の形態につい
て詳細に説明する。
【0022】(雑音抑圧アルゴリズムの概要) (1)まず、本発明に係る雑音抑圧アルゴリズムについ
て概説する。
【0023】図1は本発明に係る雑音抑圧アルゴリズム
の処理フローチャートである。
【0024】この図において、調波構造をもつ目的音s
(t)と雑音n(t)が混ざり合った混合音x(t)
が、ただ一つの受音源で観測される。
【0025】基本周波数推定部1において、 まず、雑音に強い櫛型フィルタによる基本周波数推定
法〔電子情報通信学会論文誌(A),vol.J82−
A,No.10,pp.1497−1507,1999
参照〕を用いて、観測された混合音x(t)から目的音
の基本周波数を大まかに推定(F*0)(F0の上に ̄
が付く)する(ステップS1)。
【0026】次に、推定された基本周波数に合わせた
帯域幅可変櫛形フィルタによって推定雑音を抽出し、推
定雑音を元の混合音から引き去ることにより雑音の抑圧
を行なう(ステップS2〜ステップS4)。
【0027】このとき、基本周波数を一定にするような
波形伸縮を行なうことにより、雑音抑圧時の誤差を低減
させる。
【0028】雑音を抑圧した信号s′*(t)(sの
上に^が付く)に対して、瞬時周波数を基にした基本周
波数推定法〔電子情報通信学会技術報告、SP99−4
0,July 1999参照〕を用いる(ステップS
5)。
【0029】上記の操作によって高精度の基本周波数F
0が推定できる。
【0030】また、さらに次の雑音抑圧部2において、 この高精度のF0を用いた帯域幅可変櫛形フィルタで
雑音を推定し除去することで、雑音抑圧した目的音s*
(t)(sの上に〜が付く)を得ることができる(ステ
ップS7)。
【0031】(2)帯域幅可変櫛形フィルタによる雑音
抑圧部については詳しく後述する。
【0032】 帯域幅可変櫛形フィルタによる雑音抑圧 (2−1)基本周期を用いた雑音推定の定式化 目的音s(t)を基本周期T(t)の調波複合音とすれ
ば、雑音n(t)として、混合音x(t)は、
【0033】
【数1】
【0034】と表される。T(t)を一定値T(=2π
/ω0 )と仮定し、上記式(1)を、±Tだけ時間軸で
ずらして混合音から引き去る信号g(t)を計算すれ
ば、
【0035】
【数2】
【0036】となる。n(t)のフーリエ変換をN(ω
k )とすれば、g(t)のフーリエ変換G(ωk )は、 G(ωk )=N(ωk )sin2 〔ωk /ω0 (t)〕・π …(3) となる。よって、雑音スペクトルN(ωk )は、 N(ωk )=G(ωk )/[sin2 〔ωk /ω0 (t)〕・π] …(4) となる。N(ωk )を逆フーリエ変換した雑音n(t)
を、元の混合音から引き去ることにより雑音が除去さ
れ、目的音s(t)が推定できる。
【0037】しかし、このままでは、 ωk /ω0 が整数のとき、上記式(4)の雑音スペク
トルN(ωk )が無限大となる 実音声では時間的に変動する基本周期T(t)を上記
式(2)において一定と仮定しているため、推定される
雑音に誤差が生じるという問題がある。
【0038】そこで、これらの問題点について次のよう
な対策を試みる。
【0039】(2−2)雑音スペクトルの推定 上記式(4)では、ωk /ω0 (t)=整数のときに、
雑音スペクトルN(ωk )が無限大になってしまう。
【0040】そこで、実際の使用にはある値εを設定
し、
【0041】
【数3】
【0042】とする。
【0043】混合音を入力、目的音を出力とし基本周期
5ms(基本周波数200Hz)に合わせたシステムの
振幅特性を図2に示す。なお、図2(a)は通常の櫛形
フィルタの場合、図2(b)はε=0.2の場合、図2
(c)はε=0.5の場合、図2(d)はε=0.8の
場合をそれぞれを示している。
【0044】通常の櫛形フィルタの場合は通過帯域が非
常に狭くなるが、本発明で用いる方法ではεが小さけれ
ば通過帯域が狭く、εが大きければ通過帯域が広くな
る。すなわち、パラメータεの値によって通過帯域幅が
制御できる櫛形フィルタとなっている。
【0045】(2−3)基本周期一定のための波形伸縮 上記(2−1)節では基本周期Tを一定と仮定して計算
を行なっているが、実音声では基本周期は時間的に変動
する。そのため、このままでは実音声に対して推定雑音
n*(t)(nの上に〜が付く)に誤差が生じてしま
う。
【0046】そこで、図3に示すような基本周期を一定
とするための音声波形の時間軸での伸縮を行なう。音声
波形はあるサンプリング周波数1/Ts [Hz]でサン
プリングされているものとして、波形伸縮処理の流れを
以下に示す。
【0047】 音声の基本周期T(t)を求める。
【0048】 あるサンプリング点nにおける基本周
期T[n]と音声全体の平均基本周期Tave との比T
ave /T[n]を求める。
【0049】 Tave /T[n]によってそのサンプ
リング点とひとつ前のサンプリング点の時間間隔T′s
[n]を
【0050】
【数4】
【0051】とする。これにより時間軸での波形の伸縮
が起こる。
【0052】伸縮した波形に対して、新たにサンプリ
ング間隔Ts 毎に値を持つよう線形補間を行なう。
【0053】図4に表わす音声波形に上記の波形伸縮操
作を行なったものを図5に示す。ここで、図4(a)は
波形伸縮前の音声波形、図4(b)は基本周波数、図5
(a)は波形伸縮後の音声波形、図5(b)は基本周波
数を示している。
【0054】これらの図から、波形伸縮操作によって音
声の基本周波数がほぼ一定となっていることが分かる。
【0055】雑音抑圧後の音声に対しては、先に施した
波形伸縮操作と逆の操作を行なうことにより、元の基本
周波数を持つ音声を戻すことができる。
【0056】(2−4)雑音抑圧アルゴリズムの評価 本雑音抑圧アルゴリズムがどの程度雑音を抑圧できるか
評価するために、評価実験を行なう。
【0057】評価に利用する音声として、ATR音声デ
ータベースセットにある男性話者mhtと女性話者fs
uの単母音(/a//i//u//e//o/)を用い
る。また、雑音として白色雑音と60〜6000Hzに
帯域制限されたピンク帯域雑音を利用する。SNRは0
dBから20dBまで5dB刻みで変化させる。
【0058】雑音抑圧の例を図6に示す。図6(a)に
示すようなfsuの単母音/a/にSNRが5dBの白
色雑音を付加すると、図6(b)に示すような混合音と
なる。図6(c)に示す基本周波数を用いて雑音抑圧を
行なうと、図6(d)に示すように混合音からSNRが
11.2dBの音声が抽出できる。
【0059】基本周波数はクリーンな音声から瞬時周波
数を基にした基本周波数抽出法〔電子情報通信学会技術
報告、SP99−40,July 1999参照〕によ
って予め得ているものとする。フレーム長1024po
int、フレーム周期256point、帯域幅可変櫛
形フィルタのパラメータε=0.5とした。
【0060】評価尺度として音声全体の信号対雑音比
(SNR)、スペクトル歪み尺度(SD)、聴覚特性を
考慮した歪み評価尺度(ASD)〔水町光徳、赤木正
人,ASD,1999参照〕を用いて雑音抑圧前後の比
較を行なった結果、それぞれの値の平均と標準偏差とし
て図7〜図12を得た。
【0061】ここで、図7は雑音抑圧アルゴリズムのS
NRによる評価(白色雑音)、図8は雑音抑圧アルゴリ
ズムのSNRによる評価(ピンク帯域雑音)、図9は雑
音抑圧アルゴリズムのSDによる評価(白色雑音)、図
10は雑音抑圧アルゴリズムのSDによる評価(ピンク
帯域雑音)、図11は雑音抑圧アルゴリズムのASDに
よる評価(白色雑音)、図12は雑音抑圧アルゴリズム
のASDによる評価(ピンク帯域雑音)をそれぞれ示す
図である。
【0062】図7、図8から、雑音が大きい場合、雑音
抑圧前に比べてSNRが5〜7dB程度向上することが
分かる。
【0063】雑音が小さい場合、SNRは雑音抑圧前よ
りも低下するという結果がみられた。これは、帯域幅可
変櫛形フィルタによって雑音と共に目的音の成分の一部
も除去してしまうため、雑音が小さいときは除去する雑
音成分よりも多く目的音の成分を除去してしまうことが
原因である。今回の評価実験ではεの値を一定とした
が、音声によってεの値を変えて最適な通過帯域を選ぶ
ことである程度改善できる。
【0064】また、SNRが雑音抑圧前よりも低下して
いても、聴感上は、音色はやや変わって聴こえるものの
雑音感は減少している。これは、聴覚特性を考慮した評
価尺度であるASD(図11)ではSNRが20dBで
も雑音抑圧後の目的音の精度が向上していることと対応
している。
【0065】また、図10、図12に示すように、雑音
が小さなピンク帯域雑音であるとき、SD、ASDでも
抽出精度は低下している。これは、ピンク帯域雑音では
周波数の低域パワーが強いため、高域では雑音除去量よ
りも目的音の除去量が多くなることに加え、帯域幅可変
櫛形フィルタでは目的音の基本周波数や高調波と同じ周
波数帯域の雑音が除去できずに残ることによると考えら
れる。
【0066】(3)帯域幅可変櫛形フィルタを用いる基
本周波数推定法 雑音が小さい環境ではTEMPO2によって高精度の基
本周波数を推定できる。雑音が大きい環境では櫛型フィ
ルタによる方法が頑健性を示した。そこで、本発明では
上記(2)で述べた雑音抑圧アルゴリズムを用いて、雑
音環境において頑健で高精度な基本周波数推定法を作成
する。本発明の方法のアルゴリズムは、図13のように
TEMPO2と櫛型フィルタによる方法の2種類の基本
周波数推定法と帯域幅可変櫛形フィルタから構成され
る。
【0067】本方法の基本周波数推定の手順を以下に述
べる。
【0068】本方法は雑音抑圧部12を有する基本周波
数推定部11において実行される。
【0069】 まず、雑音に頑健な基本周波数推定法
である櫛型フィルタによる方法で混合音x(t)からあ
る程度の精度をもつ基本周波数F*0(Fの上に ̄が付
く)を得る(ステップS11)。
【0070】 その基本周波数(F*0)(Fの上に
 ̄が付く)を基にした帯域幅可変櫛形フィルタを用い上
記(2)で述べた雑音抑圧アルゴリズムによって雑音を
抑圧する(ステップS13)。
【0071】ここで、帯域幅可変櫛形フィルタのパラメ
ータεを調節して通過帯域幅を制御することにより、音
声の調波成分を抑圧しないようにする。
【0072】 そして、雑音が抑圧された音声に対し
て、雑音に弱いが高精度の基本周波数抽出法であるTE
MPO2を用いることにより、雑音中の音声から高精度
の基本周波数を推定する(ステップS15)。
【0073】雑音の付加された音声を用いて本発明の方
法の対雑音性能を調べる。帯域幅可変櫛形フィルタのパ
ラメータε=0.5とし、音声、雑音共に従来の基本周
波数推定法と同じものを用いた。
【0074】白色雑音をSNR=5dBで付加した音声
の基本周波数推定結果の例を図14、ピンク帯域雑音を
SNR=5dBで付加した音声の例を図15に示す。
【0075】ここで、図14(a)は櫛型フィルタによ
る方法を示す図、図14(b)はTEMPO2、図14
(c)は本発明による基本周波数推定結果を示す図、図
15(a)は櫛型フィルタによる方法を示す図、図15
(b)はTEMPO2、図15(c)は本発明による基
本周波数推定結果を示す図である。図15(b)におい
ては全区間で推定不能である。なお、推定されるべき基
本周波数は、図16で示すような150Hzから200
Hzまでを速度50Hz/4000サンプルで変化する
基本周波数である。
【0076】図17に推定精度(推定誤差の標準偏差)
と雑音強度の関係を示す。比較のため、櫛型フィルタに
よる方法のみの場合の推定精度と、TEMPO2のみの
場合の推定精度も示す。
【0077】図17から、白色雑音ではSNRが0d
B、ピンク帯域雑音ではSNRが5dBであるような大
きな雑音が付加された音声に対しても、本発明の方法
は、雑音が小さい場合のTEMPO2による推定と同じ
精度で基本周波数を推定することができることがわか
る。雑音が小さい場合においてもTEMPO2のみの場
合と同程度の精度が得られる。
【0078】また、本発明の方法の対雑音性能は、櫛型
フィルタによる方法の対雑音性能に大きく依存している
ため、雑音抑圧の前処理の基本周波数推定法の改良によ
りさらなる性能向上が可能であると考えられる。
【0079】上記したように、本発明によれば、 (1)帯域幅可変櫛形フィルタで雑音を推定・除去する
ことにより、スペクトルレベルではなく波形レベルでの
雑音抑圧が可能になった。 (2)帯域幅可変櫛形フィルタによる雑音抑圧と雑音に
は弱いが高精度な基本周波数推定法であるTEMPO
2、雑音に強い櫛形フィルタによる基本周波数推定法を
組み合せることにより、頑健で高精度な基本周波数推定
が可能になった。
【0080】櫛形フィルタによって、基本周波数が存
在する帯域を取り出す。
【0081】帯域可変櫛形フィルタによって、上記の
結果をもとに、抽出された基本周波数とその高調波成分
を通過させる櫛形フィルタを構築し、雑音の成分を取り
除く。通過帯域を可変とすることで、上記の結果に含
まれる誤りの伝播を防ぐ。
【0082】雑音を軽減した波形から、雑音には弱い
が高精度で抽出可能な手法を用いて、基本周期あるいは
基本周波数の抽出を行う。
【0083】したがって、本発明によれば、妨害音には
強いが精度が劣る手法と妨害音には弱いが高精度で抽出
可能な手法、および通過域可変櫛形フィルタを用いた妨
害音除去手法を組み合わせることにより、妨害音に強く
しかも高精度な基本周期あるいは基本周波数抽出方法が
実現できる。
【0084】音声認識・合成のための基本周波数の抽
出、基本周期を用いた雑音抑圧法への応用が可能であ
る。
【0085】また、音声認識や補聴器の前処理等に利用
できるような音声信号処理として、雑音環境における音
声の基本周波数推定法及び雑音抑圧法を提供することが
できる。
【0086】なお、本発明は上記実施例に限定されるも
のではなく、本発明の趣旨に基づいて種々の変形が可能
であり、これらを本発明の範囲から排除するものではな
い。
【0087】
【発明の効果】以上、詳細に説明したように、本発明に
よれば、妨害音には強いが精度が劣る手法と妨害音には
弱いが高精度で抽出可能な手法、および通過域可変櫛形
フィルタを用いた妨害音除去手法を組み合わせることに
より、妨害音に強くしかも高精度な基本周期あるいは基
本周波数抽出方法が実現できる。
【0088】音声認識・合成のための基本周波数の抽
出、基本周期を用いた雑音抑圧法への応用が可能であ
る。
【図面の簡単な説明】
【図1】本発明にかかる雑音抑圧アルゴリズムの処理フ
ローチャートである。
【図2】混合音を入力、目的音を出力とし基本周期5m
s(基本周波数200Hz)に合わせたシステムの振幅
特性を示す図である。
【図3】基本周期一定のための時間軸での波形伸縮の模
式図である。
【図4】波形伸縮前の音声波形及び基本周波数を示す図
である。
【図5】波形伸縮後の音声波形及び基本周波数を示す図
である。
【図6】雑音抑圧例を示す図である。
【図7】雑音抑圧アルゴリズムのSNRによる評価(白
色雑音)を示す図である。
【図8】雑音抑圧アルゴリズムのSNRによる評価(ピ
ンク帯域雑音)を示す図である。
【図9】雑音抑圧アルゴリズムのSDによる評価(白色
雑音)を示す図である。
【図10】雑音抑圧アルゴリズムのSDによる評価(ピ
ンク帯域雑音)を示す図である。
【図11】雑音抑圧アルゴリズムのASDによる評価
(白色雑音)を示す図である。
【図12】雑音抑圧アルゴリズムのASDによる評価
(ピンク帯域雑音)を示す図である。
【図13】本発明にかかる基本周波数推定アルゴリズム
の処理フローチャートである。
【図14】白色雑音を付加した音声の基本周波数推定結
果の例を示す図である。
【図15】ピンク帯域雑音を付加した音声の例を示す図
である。
【図16】150Hzから200Hzまでを速度50H
z/4000サンプルで変化する基本周波数を示す図で
ある。
【図17】推定精度(推定誤差の標準偏差)と雑音強度
の関係を示す図である。
【図18】ニューラルキャンセレーションモデルを示す
図である。
【符号の説明】
1,11 基本周波数推定部 2,12 雑音抑圧部

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 雑音が付加された周期波形の基本周期あ
    るいは基本周波数の抽出方法において、(a)調波構造
    をもつ目的音と雑音が混ざり合った混合音を、ただ一つ
    の受音源で観測し、(b)雑音に強い櫛型フィルタによ
    る基本周波数推定法を用いて、観測された混合音から目
    的音の基本周波数を大まかに推定し、(c)推定された
    基本周波数に合わせた帯域幅可変櫛形フィルタによって
    推定雑音を抽出し、推定雑音を元の混合音から引き去る
    ことにより雑音の抑圧を行い、(d)雑音を抑圧した信
    号に対して、瞬時周波数を基にした基本周波数推定法を
    用い、高精度の基本周波数を推定し、(e)該高精度の
    基本周波数を用いた帯域幅可変櫛形フィルタで雑音を推
    定し除去し、雑音を抑圧した目的音を得ることを特徴と
    する雑音が付加された周期波形の基本周期あるいは基本
    周波数の抽出方法。
  2. 【請求項2】 請求項1記載の雑音が付加された周期波
    形の基本周期あるいは基本周波数の抽出方法において、
    前記工程(c)において、前記基本周波数を一定にする
    ような波形伸縮を行なうことにより、雑音抑圧時の誤差
    を低減させることを特徴とする雑音が付加された周期波
    形の基本周期あるいは基本周波数の抽出方法。
  3. 【請求項3】 雑音が付加された周期波形の基本周期あ
    るいは基本周波数の抽出方法において、(a)雑音に強
    い櫛型フィルタによる基本周波数推定法を用いて、観測
    された混合音から音声の基本周波数を大まかに推定し、
    (b)前記基本周波数を基にした帯域幅可変櫛形フィル
    タを用い雑音を抑圧し、(c)雑音が抑圧された音声に
    対して、雑音に弱いが高精度の基本周波数抽出法である
    TEMPO2を用いることにより、雑音中の音声から高
    精度の基本周波数を推定することを特徴とする雑音が付
    加された周期波形の基本周期あるいは基本周波数の抽出
    方法。
  4. 【請求項4】 請求項3記載の雑音が付加された周期波
    形の基本周期あるいは基本周波数の抽出方法において、
    前記工程(b)において、前記帯域幅可変櫛形フィルタ
    のパラメータを調節して通過帯域幅を制御することによ
    り周期波形の調波成分を抑圧しないようにすることを特
    徴とする雑音が付加された周期波形の基本周期あるいは
    基本周波数の抽出方法。
JP2000059853A 2000-03-06 2000-03-06 雑音が付加された周期波形の基本周期あるいは基本周波数の抽出方法 Expired - Fee Related JP3916834B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000059853A JP3916834B2 (ja) 2000-03-06 2000-03-06 雑音が付加された周期波形の基本周期あるいは基本周波数の抽出方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000059853A JP3916834B2 (ja) 2000-03-06 2000-03-06 雑音が付加された周期波形の基本周期あるいは基本周波数の抽出方法

Publications (2)

Publication Number Publication Date
JP2001249676A true JP2001249676A (ja) 2001-09-14
JP3916834B2 JP3916834B2 (ja) 2007-05-23

Family

ID=18580252

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000059853A Expired - Fee Related JP3916834B2 (ja) 2000-03-06 2000-03-06 雑音が付加された周期波形の基本周期あるいは基本周波数の抽出方法

Country Status (1)

Country Link
JP (1) JP3916834B2 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003280696A (ja) * 2002-03-19 2003-10-02 Matsushita Electric Ind Co Ltd 音声強調装置及び音声強調方法
EP1542500A2 (de) * 2003-12-10 2005-06-15 Siemens Audiologische Technik GmbH Hörgerät mit Störgeräuschunterdrückung und entsprechendes Störgeräuschunterdrückungsverfahren
WO2008001779A1 (fr) * 2006-06-27 2008-01-03 National University Corporation Toyohashi University Of Technology procédé d'estimation de fréquence de référence et système d'estimation de signal acoustique
JP2009058708A (ja) * 2007-08-31 2009-03-19 Internatl Business Mach Corp <Ibm> 音声処理システム、方法及びプログラム
US7941315B2 (en) 2005-12-29 2011-05-10 Fujitsu Limited Noise reducer, noise reducing method, and recording medium
CN114387975A (zh) * 2021-12-28 2022-04-22 北京中电慧声科技有限公司 应用于混响环境声纹识别的基频信息提取方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62203199A (ja) * 1986-03-03 1987-09-07 富士通株式会社 ピツチ周期抽出方式
JPH02137889A (ja) * 1988-11-19 1990-05-28 Sony Corp 信号記録方法及び装置
JPH04230796A (ja) * 1990-05-28 1992-08-19 Matsushita Electric Ind Co Ltd 音声信号処理装置
JPH10124094A (ja) * 1996-10-18 1998-05-15 Sony Corp 音声分析方法、音声符号化方法および装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62203199A (ja) * 1986-03-03 1987-09-07 富士通株式会社 ピツチ周期抽出方式
JPH02137889A (ja) * 1988-11-19 1990-05-28 Sony Corp 信号記録方法及び装置
JPH04230796A (ja) * 1990-05-28 1992-08-19 Matsushita Electric Ind Co Ltd 音声信号処理装置
JPH10124094A (ja) * 1996-10-18 1998-05-15 Sony Corp 音声分析方法、音声符号化方法および装置

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
入野俊夫: ""聴覚フィルタバンクによる背景雑音抑圧"", 人工知能学会研究会資料, vol. SIG-Challenge-9801-6(1998-11), JPN4007001930, pages 33 - 40, ISSN: 0000813245 *
池田幹男他: ""直交櫛形フィルタを用いた音声中の雑音抑圧"", 電子情報通信学会技術研究報告, vol. SP96-45(1996-09), JPN4007001932, pages 23 - 30, ISSN: 0000813247 *
石本佑一他: ""雑音が付加された音声の基本周波数推定と雑音抑圧"", 電子情報通信学会技術報告, vol. SP99-169(2000-03), JPN4007001933, pages 17 - 24, ISSN: 0000813248 *
西一樹他: ""振幅変動とピッチ変動を同時に考慮した擬似周期信号抽出のためのIIR櫛形デジタルフィルタ"", 電子情報通信学会技術研究報告, vol. SP99-76(1999-09), JPN4007001931, pages 29 - 34, ISSN: 0000813246 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003280696A (ja) * 2002-03-19 2003-10-02 Matsushita Electric Ind Co Ltd 音声強調装置及び音声強調方法
EP1542500A2 (de) * 2003-12-10 2005-06-15 Siemens Audiologische Technik GmbH Hörgerät mit Störgeräuschunterdrückung und entsprechendes Störgeräuschunterdrückungsverfahren
EP1542500A3 (de) * 2003-12-10 2009-11-11 Siemens Audiologische Technik GmbH Hörgerät mit Störgeräuschunterdrückung und entsprechendes Störgeräuschunterdrückungsverfahren
US7941315B2 (en) 2005-12-29 2011-05-10 Fujitsu Limited Noise reducer, noise reducing method, and recording medium
WO2008001779A1 (fr) * 2006-06-27 2008-01-03 National University Corporation Toyohashi University Of Technology procédé d'estimation de fréquence de référence et système d'estimation de signal acoustique
JP2009058708A (ja) * 2007-08-31 2009-03-19 Internatl Business Mach Corp <Ibm> 音声処理システム、方法及びプログラム
US8812312B2 (en) 2007-08-31 2014-08-19 International Business Machines Corporation System, method and program for speech processing
CN114387975A (zh) * 2021-12-28 2022-04-22 北京中电慧声科技有限公司 应用于混响环境声纹识别的基频信息提取方法及装置

Also Published As

Publication number Publication date
JP3916834B2 (ja) 2007-05-23

Similar Documents

Publication Publication Date Title
CN109065067B (zh) 一种基于神经网络模型的会议终端语音降噪方法
Yegnanarayana et al. Enhancement of reverberant speech using LP residual signal
JP5666444B2 (ja) 特徴抽出を使用してスピーチ強調のためにオーディオ信号を処理する装置及び方法
Nakatani et al. Robust and accurate fundamental frequency estimation based on dominant harmonic components
Kim et al. Nonlinear enhancement of onset for robust speech recognition.
US10614827B1 (en) System and method for speech enhancement using dynamic noise profile estimation
US10176824B2 (en) Method and system for consonant-vowel ratio modification for improving speech perception
JP4434813B2 (ja) 雑音スペクトル推定方法、雑音抑圧方法および雑音抑圧装置
Alam et al. Perceptual improvement of Wiener filtering employing a post-filter
JP3916834B2 (ja) 雑音が付加された周期波形の基本周期あるいは基本周波数の抽出方法
KR100571427B1 (ko) 잡음 환경에서의 음성 인식을 위한 특징 벡터 추출 장치및 역상관 필터링 방법
JP2003510665A (ja) 適応フィルタリングアルゴリズムを用いるデエッサーのための装置および方法
Garg et al. Deep convolutional neural network-based speech signal enhancement using extensive speech features
RU2589298C1 (ru) Способ повышения разборчивости и информативности звуковых сигналов в шумовой обстановке
Maganti et al. A perceptual masking approach for noise robust speech recognition
Pandey et al. Attentive Training: A New Training Framework for Talker-independent Speaker Extraction.
EP1208561B1 (en) A method and apparatus for noise reduction in speech signals
Hepsiba et al. Computational intelligence for speech enhancement using deep neural network
Rahali et al. Robust Features for Speech Recognition using Temporal Filtering Technique in the Presence of Impulsive Noise
JP2899533B2 (ja) 音質改善装置
JP4313740B2 (ja) 残響除去方法、プログラムおよび記録媒体
Kurian et al. PNCC based speech enhancement and its performance evaluation using SNR Loss
Rahali et al. Enhancement of noise-suppressed speech by spectral processing implemented in a digital signal processor
Sharma et al. Separating the source information in repetition-dependent music and enhancing it by real-time digital audio processing
King Enhancing single-channel speech in wind noise using coherent modulation comb filtering

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20031031

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20040129

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050128

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070119

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070206

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070207

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees