JPH11175083A - 雑音らしさ算出方法および雑音らしさ算出装置 - Google Patents

雑音らしさ算出方法および雑音らしさ算出装置

Info

Publication number
JPH11175083A
JPH11175083A JP9346689A JP34668997A JPH11175083A JP H11175083 A JPH11175083 A JP H11175083A JP 9346689 A JP9346689 A JP 9346689A JP 34668997 A JP34668997 A JP 34668997A JP H11175083 A JPH11175083 A JP H11175083A
Authority
JP
Japan
Prior art keywords
histogram
noise
value
likeness
current frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9346689A
Other languages
English (en)
Inventor
Hirohisa Tazaki
裕久 田崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP9346689A priority Critical patent/JPH11175083A/ja
Publication of JPH11175083A publication Critical patent/JPH11175083A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 ヒストグラムの制御が簡単で、必要最小限の
メモリで実行でき、安定かつ分解能が高く、雑音変動に
対する追従性も悪くない高精度な背景雑音らしさ算出方
法を提供する。 【解決手段】 ヒストグラム加算部は、最終出力である
雑音らしさに加えて、ピッチ周期性評価手段、定常性評
価手段の出力結果を総合評価してヒストグラム手段内に
格納されているヒストグラムの複数の要素に対する加算
量を決定する。ヒストグラム抑制手段は、1より小さい
乗数を全ヒストグラム累積値に乗じることでヒストグラ
ムの抑制を行う。ピーク探索手段は、重心パワーより小
さく、累積値も適応閾値より大きい極大値を探索し、前
後の累積値との間を曲線近似して、分解能が高い推定雑
音パワーを算出する。雑音らしさ算出手段は、パワーと
推定雑音パワーを用いて雑音らしさを算出する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は,音声と背景雑音
区間を判別するための判定用パラメータや、背景雑音ら
しい区間に専用の加工処理を施す際の制御パラメータ、
として用いる雑音らしさの度合いを算出する雑音らしさ
算出方法および雑音らしさ算出装置に関する。音声と背
景雑音区間の判別結果は、音声認識における始終端検出
処理、音声符号化における符号化モード制御処理、雑音
除去に用いる平均雑音スペクトルの更新などに使用され
る。背景雑音らしい区間に専用の加工処理としては、振
幅抑圧処理、雑音の平滑化処理などがある。
【0002】
【従来の技術】(背景)雑音らしさの算出は、背景雑音
が音声に比べると比較的定常な特性を持っている、使用
条件にもよるが一般に音声に比べると平均パワーが小さ
い、という仮定に基づいて行われているものが多い。前
者の仮定に基づいて雑音レベル(パワー)を推定する方
法として、パワー時系列の低域通過フィルタリング(L
PF)処理や、パワー時系列に対して立ち上がり時定数
が長く、立ち下がり時定数が短い平滑化処理を施すもの
がある。そして、これらの推定雑音レベル(パワー)と
現在の入力信号レベル(パワー)を比較することで、現
在の入力信号の雑音らしさを評価することができる。こ
れらの雑音レベル推定方法と雑音レベル算出方法は構成
が簡単で比較的安定である利点があるが、精度があまり
高く取れない課題がある。
【0003】上記雑音レベル推定およびこれに基づく雑
音らしさ算出の精度を改善する方法として、パワーなど
のパラメータ値のヒストグラムを生成して、その分布を
分析して雑音レベルを推定し、これに基づいて雑音らし
さを算出する方法が提案されている。ヒストグラムを用
いる方法の一部には、音声に比べて雑音の平均パワー
(レベル)が小さい、という後者の仮定を導入している
ものもある。
【0004】この様なヒストグラムを用いて雑音レベル
を推定したり、雑音らしさを算出する従来の方法として
は、特開昭59−219797号、特開平3−3410
号、特開平3−15897号、特願平8−331304
号に開示されているものがある。
【0005】特開昭59−219797号は、音声認識
装置において、入力信号に重畳した背景雑音レベルが変
動した場合でも、高精度に音声区間を切り出すことを目
的とした音声区間切り出し方式に関するもので、現在か
ら一定期間前の過去までさかのぼって累計した入力音声
パワー別の頻度分布(ヒストグラム)を記録しておき、
頻度分布の最大頻度に対応するパワーを現在の背景雑音
レベルとして音声区間の切り出しを行うようにしたもの
である。ここで、ヒストグラムの更新は、入力パワーに
該当するレベルの頻度に1を加え、加えた後の頻度が所
定の最大値Cmaxを超える場合には入力パワーの各分
割毎の各頻度から1を減じることで行っている。但し、
入力音声が背景雑音でなく音声であるとみなされた場合
には、この頻度分布(ヒストグラム)は更新しないよう
にしている。
【0006】特開平3−3410号は、音声による影響
を除いて背景雑音の平均レベルを検出し、且つ有声音区
間においても検出した背景雑音レベルを維持できるよう
にすることを目的とした雑音(騒音)レベル検出方式に
関するもので、背景雑音が分布すると予想されるレベル
分布範囲を複数の微小レベル範囲に分割し、所定区間の
入力信号を平均化してどの微小レベル範囲に相当するか
決定し、決定された微小レベル範囲対応に生起度数を計
数し、計数値の中の最大となる微小レベル範囲で代表さ
れるレベルを平均雑音(騒音)レベルとするようにした
ものである。
【0007】ここで、ヒストグラム(微小レベル範囲毎
の生起度数)の生成は、シフトレジスタに格納されてい
る遅延時間内の値から行っている。このシフトレジスタ
を省略した場合には、オーバーフローを検知したら、全
計数値から「1」等の定数値を減算するようにしてい
る。また、ヒストグラムを多段処理とした構成も開示し
ている。即ち、レベル範囲の幅の広くとり、そのレベル
範囲で得られた最大度数レベル範囲を、更に分割して、
生起度数を計数することを繰り返すことで、1回あたり
の分割数を低減している。
【0008】特開平3−15897号は、背景雑音が変
化した場合でも、誤りの少ない音声と背景雑音との判別
閾値を設定できるようにすることを目的とした判別閾値
設定制御方法に関するもので、雑音(騒音)レベル分布
の標準偏差の定数倍に相当する値を判別閾値とするよう
にしたものである。
【0009】本出願人は同種の技術として特願平8−3
31304号を先に出願している。この特願平8−33
1304号は、離散パラメータ値の出現頻度値を計数す
るフレーム区間が短い場合や、音声フレーム数が雑音フ
レーム数を大きく上回っている場合でも誤判別が少な
く、且つ省メモリと高分解能を同時に実現することを目
的とした音声区間判別装置に関するもので、入力音声の
パラメータ値の出現頻度分布(ヒストグラム)の複数極
大点に対応する離散パラメータ値の中から平均雑音パラ
メータ値を算出するようにし、また、2個のヒストグラ
ムの一方の総計数量が十分でない場合に、総計数量が十
分になるように制御されているもう一方のヒストグラム
から計数値とパラメータ範囲をコピーするようにしたも
のである。
【0010】ここで、ヒストグラムの更新は、入力音声
のパラメータ値に対応する部分に一定値を加算すること
で行っている。複数の極大点中から1つを選択する方法
としては、最小離散パラメータ値を選択する方法、閾値
C1より小さい離散パラメータ値中の最大離散パラメー
タ値を選択する方法、閾値C2より出現頻度値が大きい
極大点に予備選択する方法である。
【0011】
【発明が解決しようとする課題】上記の従来法には、以
下に述べる課題がある。特開昭59−219797号に
は、入力音声が背景雑音でなく音声であるとみなされた
場合にヒストグラムを更新しないようにしているため
に、急に背景雑音レベルが上昇した場合に、背景雑音区
間を音声と誤判定してしまい、ヒストグラムの更新もな
されないので背景雑音レベルが変化しなくなり、誤判定
から脱出できなくなってしまう課題がある。
【0012】現在から一定期間前の過去までさかのぼっ
て累計したヒストグラムを用いているために、その期間
が短すぎたり、その期間内の背景雑音区間が少ない場合
に、背景雑音レベルの推定が不安定になってしまう課題
がある。逆に累計期間を長くしすぎると背景雑音レベル
の変動に対する追従性が悪くなってしまう課題がある。
【0013】入力パワーに該当するレベルの頻度に1を
加えることでヒストグラムの更新を行っているために、
ヒストグラムの分解能をあげると各ヒストグラム要素の
累積頻度値が小さくなって、連続する要素間で累計頻度
値ががたつき、背景雑音レベルの推定が不安定になって
しまうし、これを補うために累積期間を長くすると上述
の通り背景雑音レベルの変動に対する追従性が悪くなっ
てしまう課題がある。頻度分布の最大頻度に対応するパ
ワーを現在の背景雑音レベルとしているために、累積期
間内の背景雑音区間が音声区間に比べて少ない場合に、
音声のレベルを背景雑音レベルと誤ってしまう課題があ
る。
【0014】特開平3−3410号および特開平3−1
5897号には、入力音声の様態によらずに、全ての区
間の値をヒストグラムの頻度計数に等しく用いているた
め、背景雑音区間が音声区間に比べて少なく、雑音の変
動性が大きい場合に、音声のレベルを背景雑音レベルと
誤りやすい課題がある。
【0015】ヒストグラムの生成をシフトレジスタに格
納されている遅延時間内の値から行っているために、そ
の格納数が少なすぎたり、その期間内の背景雑音区間が
少ない場合に、背景雑音レベルの推定が不安定になって
しまう課題がある。逆に格納数を多くしすぎると背景雑
音レベルの変動に対する追従性が悪くなってしまう課題
がある。シフトレジスタを省略して、オーバーフローを
検知したら、全計数値から「1」等の定数値を減算する
ようにした場合には、オーバーフローに達するまでは、
全ての区間の計数結果が残っているし、オーバーフロー
に達した後でも過去の計数結果の影響がなかなか消えて
いかないために、背景雑音レベルの変動に対する追従性
が悪くなってしまう課題がある。
【0016】また、前記した特開昭59−219797
号と同様に、ヒストグラムの分解能をあげると各ヒスト
グラム要素の累積頻度値が小さくなって、連続する要素
間で累計頻度値ががたつき、背景雑音レベルの推定が不
安定になってしまうし、これを補うために累積期間を長
くすると上述の通り背景雑音レベルの変動に対する追従
性が悪くなってしまう課題がある。頻度分布の最大頻度
に対応するパワーを現在の背景雑音レベルとしているた
めに、累積期間内の背景雑音区間が音声区間に比べて少
ない場合に、音声のレベルを背景雑音レベルと誤ってし
まう課題がある。
【0017】特願平8−331304は、入力音声のパ
ラメータ値の出現頻度分布(ヒストグラム)の複数極大
点を求め、最小離散パラメータ値、または閾値C1より
小さい離散パラメータ値中の最大離散パラメータ値、ま
たは閾値C2より出現頻度値が大きい極大点を平均雑音
パラメータ値として選択することで、出現頻度値を計数
するフレーム区間が短い場合や、音声フレーム数が雑音
フレーム数を大きく上回っている場合でも誤判別が少な
くなるようにしているが、閾値C2が固定であるため、
極端に計数フレーム区間が短く、雑音フレームの比率が
少ない場合には、本来の雑音レベルの頻度値が閾値C2
を下回ってしまい、音声のレベルを背景雑音レベルと誤
ってしまう課題が残っている。また、閾値C1が固定で
あるため、音声のレベル自体が小さい場合に、音声のレ
ベルを背景雑音レベルと誤ってしまう課題がある。
【0018】また、ヒストグラムを2つ設けて、省メモ
リと高分解能を同時に実現するように構成しているが、
ヒストグラムの制御が複雑で、メモリは極端に多くはな
らないものの決して少なくなっていない課題がある。
【0019】この発明は、かかる課題を解決するために
なされたものであり、急に背景雑音レベルが上昇したた
めに背景雑音区間を音声らしい(雑音らしさが低い)と
する誤算出に陥った場合でも、この誤算出から脱出する
ことができる雑音らしさ算出方法を提供することを目的
としている。
【0020】また、ヒストグラムの累積期間が短い、累
積期間内の背景雑音区間が少ない、雑音の変動性が大き
い場合でも、雑音らしさの算出精度が不安定(背景雑音
レベルの推定が不安定)になったり、音声のレベルを背
景雑音レベルと誤って雑音らしさの算出結果が大きく劣
化することが少ない雑音らしさ算出方法を提供すること
を目的としている。逆に累積期間が長い場合でも、背景
雑音レベルの変動に対する追従性が悪くなってしまうこ
とが少ない雑音らしさ算出方法を提供することを目的と
している。また、安定度を犠牲にすることなく、分解能
を改善した雑音らしさ算出方法を提供することを目的と
している。
【0021】また、固定の閾値を使用しているために、
音声のレベルを背景雑音レベルと誤ってしまい、雑音ら
しさの算出結果が大きく劣化することがない雑音らしさ
算出方法を提供することを目的としている。また、ヒス
トグラムの制御が簡単で、必要最小限のメモリで実行で
きる雑音らしさ算出方法を提供することを目的としてい
る。
【0022】
【課題を解決するための手段】上記の課題を解決するた
めに、この発明の雑音らしさ算出方法は、入力音声を所
定長のフレーム毎に分析して所定のパラメータ値を算出
し、現フレームのパラメータ値を用いてパラメータ値の
分布に関するヒストグラムを更新し、このヒストグラム
に基づいて現フレーム時点での推定雑音パラメータ値を
算出し、現フレームのパラメータ値と算出した推定雑音
パラメータ値を比較することで現フレームの雑音らしさ
の度合いを算出する雑音らしさ算出方法であって、入力
音声を分析して得られる所定の評価値に基づいて、ヒス
トグラムの更新の大きさに0より大きい値を乗じるよう
にしたものである。
【0023】また、この発明の雑音らしさ算出方法はさ
らに、前記所定の評価値として、最終的に算出される雑
音らしさの度合いを含むようにしたものである。
【0024】また、この発明の雑音らしさ算出方法はさ
らに、前記所定の評価値として、入力音声のピッチ周期
性の大きさを含むようにしたものである。
【0025】また、この発明の雑音らしさ算出方法はさ
らに、前記所定の評価値として、入力音声に関する定常
性評価結果を含むようにしたものである。
【0026】また、この発明の雑音らしさ算出方法は、
現フレームのパラメータ値が指すヒストグラム要素の累
積値を増やすとともに、その他のヒストグラム要素また
は全ヒストグラム要素の累積値に1より小さい値を乗じ
ることでヒストグラムの更新を行うようにしたものであ
る。
【0027】また、この発明の雑音らしさ算出方法は、
現フレームのパラメータ値が指すヒストグラム要素およ
びこの要素に近接する1つ以上の要素の各々の累積値
を、各要素が持つ代表パラメータ値と現フレームのパラ
メータ値との差の大きさに従った量ずつ増やすことでヒ
ストグラムの更新を行うようにしたものである。
【0028】また、この発明の雑音らしさ算出方法は、
ヒストグラムの各要素の累積値を曲線近似することで要
素間の累積値推移を推定し、この推定結果に基づいて推
定雑音パラメータ値を算出するようにしたものである。
【0029】また、この発明の雑音らしさ算出方法は、
ヒストグラムの重心を与える重心パラメータ値を算出
し、この重心パラメータ値に所定のマージン値を加算し
た値より小さいパラメータ値の範囲内から推定雑音パラ
メータ値を算出するようにしたものである。
【0030】また、この発明の雑音らしさ算出方法は、
ヒストグラム全範囲または所定の範囲内の最大累積値を
探索し、この最大累積値に1より小さい値を乗じること
で累積値閾値を算出し、この累積値閾値より大きい累積
値を持つヒストグラム要素の中から推定雑音パラメータ
値を算出するようにしたものである。
【0031】また、この発明の雑音らしさ算出装置は、
入力音声を所定長のフレーム毎に分析して所定のパラ
メータ値を算出するパラメータ算出部と、前記入力音声
を別途分析して得られる所定の評価値に基づいて0より
大きい乗数を求めて、この乗数をパラメータ値の分布に
関するヒストグラムの更新の大きさに乗じ、前記パラメ
ータ算出部から出力された現フレームのパラメータ値を
用いて前記ヒストグラムの更新信号を算出するヒストグ
ラム更新部と、このヒストグラム更新部から出力された
更新信号に基づいて、現在のヒストグラムを更新するヒ
ストグラム手段と、ヒストグラム手段により更新された
ヒストグラムに基づいて現フレーム時点での推定雑音パ
ラメータ値を算出するピーク探索部と、前記パワー算出
部からの現フレームのパラメータ値と、前記ピーク探索
部が算出した推定雑音パラメータ値を比較することで現
フレームの雑音らしさの度合いを算出する雑音らしさ算
出手段を備えたものである。
【0032】また、この発明の雑音らしさ算出装置は、
ヒストグラム更新部を前記パラメータ算出部から出力さ
れた現フレームのパラメータ値が指すヒストグラム要素
の累積値を増やすための更新信号と、その他のヒストグ
ラム要素または全ヒストグラム要素の累積値に乗じる1
より小さい乗数を出力するよう構成したものである。
【0033】また、この発明の雑音らしさ算出装置は、
ヒストグラム更新部を前記パラメータ算出部から出力さ
れた現フレームのパラメータ値が指すヒストグラム要素
およびこの要素に近接する1つ以上の要素の各々の累積
値を、各要素が持つ代表パラメータ値と現フレームのパ
ラメータ値との差の大きさに従った量ずつ増やすための
更新信号を出力するように構成したものである。
【発明の実施の形態】以下図面を参照しながら、この発
明の実施の形態について説明する。
【0034】実施の形態1.図1は、この発明による雑
音らしさ算出方法の実施の形態1の全体構成を示し、図
中1は入力音声、2は雑音らしさ、3はパラメータ算出
部としてのパワー算出部、7はパワー、8は雑音らしさ
算出手段、9はヒストグラム更新部、12はヒストグラ
ム手段、13はピーク探索部、14は推定雑音パワーで
ある。パワー算出部3は、逆フィルタ手段4、パワー算
出手段5、推定雑音スペクトル更新手段6より構成され
ている。ヒストグラム更新部9は、ヒストグラム加算部
10、ヒストグラム抑制手段11より構成されている。
図2は、ヒストグラム加算部10の構成を示し、図中1
5はヒストグラム要素特定手段、16は加算量算出手
段、17は要素番号、18は加算量である。
【0035】以下、図に基づいて動作を説明する。まず
入力音声1が所定の時間長のフレーム毎にパワー算出部
3内の逆フィルタ手段4と推定雑音スペクトル推定手段
6に入力される。パワー算出部3内の逆フィルタ手段4
は、後述する推定雑音スペクトル更新手段6内に格納さ
れている推定雑音スペクトルパラメータを用いて、前記
現在のフレームの入力音声1に対する逆フィルタ処理を
行い、逆フィルタされた残差信号をパワー算出手段5に
出力する。この逆フィルタ処理によって、背景雑音の振
幅が大きい、つまり音声と背景雑音が拮抗している可能
性が高い成分の振幅抑圧を行っており、逆フィルタ処理
を行わない場合に比べて、音声区間と背景雑音区間の信
号パワー比が大きくとれるようになっている。
【0036】なお、推定雑音スペクトルパラメータは、
この雑音らしさ算出方法を使用するアプリケーションま
たは装置内の他のソフトウエアとのモジュールの共有化
といった観点で選択するのが良い。線スペクトル対(L
SP)、線形予測係数(LPC)、ケプストラムなどの
スペクトル包絡パラメータ、または振幅スペクトルその
ものを用いることができる。後述する推定雑音スペクト
ル更新手段6における更新処理としては線形補間や平均
処理などを用いる構成が簡単であり、このため、スペク
トル包絡パラメータの中では線形補間や平均処理を行っ
てもフィルタが安定であることが保証できるLSPとケ
プストラムが特に適している。雑音成分のスペクトルに
対する表現力としてはケプストラムが優れているが、逆
フィルタ手段の構成の容易さという点ではLSPが勝
る。振幅スペクトルを用いる場合には、この振幅スペク
トル特性をもつLPCを算出して逆フィルタに使用する
か、入力音声1をフーリエ変換した結果に対して振幅変
形処理を行って逆フィルタと同様の効果を実現すればよ
い。
【0037】次に、パワー算出手段5は、逆フィルタ手
段4から入力された残差信号のパワーを求め、算出され
たパワー7を雑音らしさ算出手段8とヒストグラム更新
部9に出力する。
【0038】一方、ヒストグラム手段12は、現時点ま
でのパワー7に関する重み付け出現頻度分布を示すヒス
トグラムを格納しており、後述するヒストグラム更新部
9からの入力に従ってヒストグラムに対する加算処理ま
たは抑制処理を行う。パワー7の所定の範囲を複数の微
小範囲毎に分割したものが各ヒストグラム要素であり、
各ヒストグラム要素は、要素番号、重み付け出現頻度を
表す累積値、要素を代表する代表パワー値を持ってい
る。各微小範囲の広さについては、対数パワー領域で一
定の値に設定するのが良い。ここで従来技術のように単
に出現頻度とせずに重み付け出現頻度を表す累積値とし
ているのは、ヒストグラム更新部9によって出現頻度の
加算に重みが乗じられ、更に抑制のための処理がなされ
るからである。詳細については、後述する。
【0039】ピーク探索部13では、ヒストグラム手段
12に格納されているヒストグラムを読み出し、最大の
累積値を持つヒストグラム要素を探索して、そのヒスト
グラム要素が持つ代表パワー値を推定雑音パワー14と
して雑音らしさ算出手段8に出力する。この他、特願平
8−331304号のように、累積値の複数の極大点を
求めて、この中の最小の代表パワー値、または閾値C1
より小さい代表パワー値中の最大値、または閾値C2よ
り累積値が大きい極大点に対応する代表パワー値を推定
雑音パワー14とする方法でも良い。
【0040】雑音らしさ算出手段8は、パワー算出手段
5から入力されたパワー7と、ピーク探索部13から入
力された推定雑音パワー14を用いて、現在のフレーム
の雑音らしさを算出し、これを雑音らしさ2として出力
する。また、算出した雑音らしさを後述する推定雑音ス
ペクトル更新手段6とヒストグラム加算部10に対して
出力する。ここで、雑音らしさについては、最も単純に
は、式1によって算出できる。
【0041】 V = log(Q) − log(P) ・・・ 式1 ここで、Pがパワー算出手段5から入力されたパワー
7、Qが推定雑音パワー14、Vが算出された雑音らし
さ2である。この場合、Vの値が大きい程(負値であれ
ばその絶対値が小さい程)雑音らしい、ということにな
る。この他にも、Q/Pを計算してVとするなど、様々
な算出方法が考えられる。
【0042】以上で、最終出力である雑音らしさ2の出
力までの動作を説明した。そして以降で、次のフレーム
の処理のための前準備にあたる、推定雑音スペクトルと
ヒストグラムの更新処理の説明を行う。
【0043】パワー算出部3内の推定雑音スペクトル更
新手段6は、まず現在のフレームの入力音声1を分析し
て、逆フィルタ手段4で使用したものと同じ種類のスペ
クトルパラメータを算出する。そして、雑音らしさ算出
手段8が最終的に出力した雑音らしさ2とここで算出し
たスペクトルパラメータを用いて、内部に格納してある
推定雑音スペクトルを更新する。例えば、入力された雑
音らしさ2が高い(Vの値が大きい)時に、次の式2に
従い、算出したスペクトルパラメータを推定雑音スペク
トルに反映させることで更新を行う。
【0044】 b’= (1−γ)× b + γ × a ・・・ 式2 ここで、aが現在のフレームのスペクトルパラメータ、
bが推定雑音スペクトルパラメータである。γは0〜1
の値を取る更新速度定数で、比較的0に近い値に設定す
るとよい。この式の右辺の値を求めて、左辺のb’を新
しい推定雑音スペクトルパラメータとすることで更新を
行う。なお、この推定雑音スペクトルの更新方法につい
ては、更に推定精度を向上させるためにフレーム間での
変動性を参照したり、入力された過去のスペクトルパラ
メータを複数格納しておいて、統計分析によって雑音ス
ペクトルパラメータの推定を行ったり、aの中で最低の
予測利得を持つものをそのまま推定雑音スペクトルパラ
メータとするなど様々な変形、改良が可能である。
【0045】ヒストグラム加算部10内のヒストグラム
要素特定手段15は、パワー算出部3から入力されたパ
ワー7に対応するヒストグラム要素を特定し、特定され
たヒストグラム要素が持つ要素番号を要素番号17とし
てヒストグラム手段12に出力する。ヒストグラム要素
の特定方法としては、全ヒストグラム要素の中で代表パ
ワー値とパワー7の差が対数パワー領域で最も近いもの
を選択することで行えば良い。また、ヒストグラム加算
部10内の加算量算出手段16は、雑音らしさ算出手段
8から入力された雑音らしさ2に基づいて、前記要素番
号17を持つヒストグラム要素に加算する加算量18を
算出し、これをヒストグラム手段12に出力する。そし
て、ヒストグラム手段12は、入力された要素番号17
を持つヒストグラム要素の累積値に対して加算量18を
加算する。
【0046】図3は、この加算量算出手段16におけ
る、雑音らしさ2に基づく加算量18の算出例を示す。
図3(a)では、雑音らしさ2に対する所定の閾値V1
を用いて、加算量18を切り換えている場合である。雑
音らしさ2が閾値V1以上の場合には、加算の大きさに
1を乗じる。つまり元々の大きさを1とすれば加算量1
8は1となる。雑音らしさ2が閾値V1未満の場合に
は、加算の大きさにαを乗じる。つまり加算量18はα
となる。ここでαは0より大きく、閾値V1以上の場合
の加算量(ここでは1)より小さい値とする。
【0047】この様に算出することで、雑音らしさ2が
低い区間ではヒストグラムへの加算量18を少なくし、
入力音声に含まれる雑音区間の比率が少ない場合でも、
音声区間の影響を抑制することができ、音声のパワーピ
ークを推定雑音パワーと誤ることを抑制できる。また、
雑音らしさ2が低くても完全にヒストグラムへの加算を
停止することが無いので、雑音レベルが急上昇して推定
雑音パワー14を上回って雑音らしさ2を誤算出し始め
ても、いずれ推定雑音パワー14が更新され、誤算出か
ら脱出できるようになる。
【0048】図3(b)では、2つの閾値V1とV2を
用いて加算量18を線形的に算出している場合である。
雑音らしさ2がV1未満の場合には、加算の大きさにα
を乗じる。つまり加算量18はαとなる。雑音らしさ2
がV2以上の場合には、加算の大きさに1を乗じる。つ
まり加算量18は1となる。そして雑音らしさ2がV1
以上でV2未満の場合には、加算の大きさにα〜1の間
の値を乗じ、加算量18はα〜1の間の値になる。
【0049】この様に算出することで、雑音らしさが中
途半端な値を持つ(V1以上V2未満で、音声区間か背
景雑音区間か判断がつきにくい)場合には、音声と雑音
のどちらの傾向が強いかに依存した加算量が18が出力
されるので、閾値近傍におけるヒストグラムの加算量が
急変して、ヒストグラムが乱れることを緩和できる。
【0050】図3(c)では、特に閾値を設定せずに、
連続的に変化する関数によって加算量18を算出してい
る場合である。雑音らしさ2が大きくなるにつれて加算
量18が1に近づき、雑音らしさ2が小さくなるにつれ
て加算量18が0(0より大きいαとしても良い)に近
づくように設定している。この様に算出することで、雑
音らしさ2が大きい程ヒストグラムへの加算が大きくな
るように連続的に制御されるので、より安定に推定雑音
パワーを求めることができるようになる。
【0051】ヒストグラム更新部9内では、ヒストグラ
ム抑制手段11が、ヒストグラム手段12に対して、ヒ
ストグラムの各要素が持つ累積値を減らすための情報を
出力する。具体的には、1より小さい乗数β(ここでは
定数)を出力する。そして、ヒストグラム手段12は、
ヒストグラム抑制手段12から入力された乗数βを全累
積値に乗じることで、ヒストグラムの各要素が持つ累積
値を減少させる。
【0052】ここで、乗数βが1に近いほど、ヒストグ
ラムの抑制が弱くなり、遠い過去のパワー7の影響が多
く残ることとなる。しかし、あまり乗数βが小さくなる
と、ヒストグラムの抑制が強くなり、最近のパワー7し
か反映しなくなり、推定雑音パワー14の算出が不安定
になる。丁度良い結果を与えるように調整することが必
要である。また、乗数βの値については、ここで説明し
たような一定値とすることが最も簡単であるが、ヒスト
グラム加算部10が出力した加算量18の大きさに基づ
いて変化させても良い。すなわち、加算量10が小さい
場合には、βを1に近づけてヒストグラムの抑制を弱く
することで、音声区間が長く続いた場合に、ヒストグラ
ムが過度に抑制されて、以降の推定雑音パワー14の算
出が不安定になることを防止することができる。以上、
次のフレームの処理のための前準備にあたる、推定雑音
スペクトルとヒストグラムの更新処理を説明した。
【0053】この実施の形態1によれば、入力音声を所
定長のフレーム毎に分析して所定のパラメータ値(パワ
ー7)を算出し、このパラメータ値の分布に関するヒス
トグラムを更新し、このヒストグラムに基づいて現フレ
ーム時点での推定雑音パラメータ値(推定雑音パワー1
4)を算出し、現フレームのパラメータ値(パワー7)
と算出した推定雑音パラメータ値(推定雑音パワー1
4)を比較することで現フレームの雑音らしさの度合い
を算出する雑音らしさ算出方法において、入力音声を分
析して得られる所定の評価値(雑音らしさ2)に基づい
て、ヒストグラムの更新の大きさに0より大きい値を乗
じるようにしたので、入力音声に含まれる雑音区間の比
率が少ない場合でも、所定の評価値によって雑音らしく
ない区間を判定して、この区間がヒストグラムに与える
影響を抑制することができ、音声のパワーを推定雑音パ
ワーと誤ることを抑制でき、最終的に誤算出の少ない雑
音らしさ算出方法が提供できる効果がある。
【0054】また、完全にヒストグラムへの加算を停止
することが無いので、所定の評価値による雑音らしい区
間の判定が何らかの原因で誤判定に陥った場合でも、徐
々にヒストグラムが更新されて、この誤判定から脱出す
ることができ、誤算出の少ない雑音らしさ算出方法を提
供できる効果がある。また、所定の評価値として、最終
的に算出される雑音らしさを含むようにしたので、特別
な評価手段の追加なしに、雑音らしさの低い区間がヒス
トグラムに与える影響を抑制することができ、音声のパ
ワーを推定雑音パワーと誤ることを抑制でき、誤算出の
少ない雑音らしさ算出方法を提供できる効果がある。
【0055】また、現フレームのパラメータ値(パワー
7)が指すヒストグラム要素の累積値を増やすととも
に、その他のヒストグラム要素の累積値に1より小さい
値(乗数β)を乗じることでヒストグラムの更新を行う
ようにしたので、遠い過去の影響は小さいが0ではな
く、最近の影響が大きくヒストグラムに反映しているの
で、累積期間が長い場合でも、背景雑音パワーの変動に
対する追従性が劣化しない雑音らしさ算出方法を提供で
きる効果がある。また、この様に更新を行うようにした
ので、従来のように固定の累積期間を設定する必要が無
く、累積期間を短かく設定しすぎて雑音らしさの算出精
度が不安定になることがない雑音らしさ算出方法を提供
できる効果がある。
【0056】実施の形態2.図4は、この発明による雑
音らしさ算出方法の実施の形態2の全体構成を示し、図
1に示した実施の形態1の全体構成に対して、ヒストグ
ラム更新手段9の内部構成が異なっている。この実施の
形態2におけるヒストグラム更新手段9は、ヒストグラ
ム加算部10、ヒストグラム抑制手段11、ピッチ周期
性評価手段19、定常性評価手段20より構成されてい
る。また、図5は、この実施の形態2におけるヒストグ
ラム加算部10の構成を示す。図中15はヒストグラム
要素特定手段、16は加算量算出手段、17は要素番
号、18は加算量、2は雑音らしさ算出手段8が出力し
た雑音らしさ、21はピッチ周期性評価値、22は定常
性評価値である。
【0057】以下、図に基づいて動作を説明する。まず
入力音声1が所定の時間長のフレーム毎にパワー算出部
3とヒストグラム更新部9に入力される。パワー算出部
3内では、実施の形態1と同様に、逆フィルタ手段4、
パワー算出手段5の処理を行い、得られたパワー7を雑
音らしさ算出手段8とヒストグラム更新部9に出力す
る。一方、ヒストグラム手段12は、実施の形態1と同
様に、現時点までのパワー7に関する重み付け出現頻度
分布を示すヒストグラムを格納しており、後述するヒス
トグラム更新部9からの入力に従ってヒストグラムに対
する加算処理または抑制処理を行う。パワー7の所定の
範囲を複数の微小範囲毎に分割したものが各ヒストグラ
ム要素であり、各ヒストグラム要素は、要素番号、重み
付け出現頻度を表す累積値、要素を代表する代表パワー
値を持っている。
【0058】ピーク探索部13は、実施の形態1と同様
に、ヒストグラム手段12に格納されているヒストグラ
ムを読み出し、最大の累積値を持つヒストグラム要素を
探索して、そのヒストグラム要素が持つ代表パワー値を
推定雑音パワー14として雑音らしさ算出手段8に出力
する。
【0059】雑音らしさ算出手段8は、実施の形態1と
同様に、パワー算出手段5から入力されたパワー7と、
ピーク探索部13から入力された推定雑音パワー14を
用いて、現在のフレームの雑音らしさを算出し、これを
雑音らしさ2として出力する。また、算出した雑音らし
さを推定雑音スペクトル更新手段7とヒストグラム更新
部9に対して出力する。
【0060】そして、最終出力である雑音らしさ2が算
出された後で、以降の推定雑音スペクトルとヒストグラ
ムの更新処理を行う。パワー算出部3内の推定雑音スペ
クトル更新手段6は、実施の形態1と同様に、現在のフ
レームの入力音声1を分析して、逆フィルタ手段4で使
用したものと同じ種類のスペクトルパラメータを算出
し、雑音らしさ算出手段8が最終的に出力した雑音らし
さ2とここで算出したスペクトルパラメータを用いて、
内部に格納してある推定雑音スペクトルを更新する。
【0061】ヒストグラム更新部9内のピッチ周期性評
価手段19は、入力された入力音声1を分析して、入力
音声のピッチ周期性の高さを評価し、この評価結果をピ
ッチ周期性評価値21として、定常性評価手段20とヒ
ストグラム加算部10に出力する。ここで、ピッチ周期
性の高さを評価する方法としては、入力音声1を最大ピ
ッチ周期長の2倍以上の長さ蓄積しておき、この信号の
相関分析を行い、ピッチ周期の存在範囲である2〜16
ms程度の範囲内の最大相関値を求める方法が一般的で
ある。この最大相関値が高いほどピッチ周期性が高いと
評価する。ピッチ周期性評価値21としては、この最大
相関値をそのまま用いれば良い。
【0062】定常性評価手段20は、ピッチ周期性評価
手段19から入力されたピッチ周期性評価値21、パワ
ー算出部3から入力されたパワー7、および雑音らしさ
算出手段8から入力された雑音らしさ2の定常性を各々
評価し、評価結果を総合して定常性評価値22として、
ヒストグラム加算部10に出力する。
【0063】ここで、各パラメータの定常性の評価方法
としては、最新の数フレームのパラメータ値を格納、更
新しておき、それらのパラメータ値の分散、最大値と最
小値の差異、などの大きさを所定の正規化定数で正規化
した値で評価する方法が簡単である。また、各パラメー
タの評価結果を総合する方法としては、評価値の積、重
み付き和、最小値などを用いることができる。背景雑音
の特性をある程度絞り込める場合には、この背景雑音と
音声を最も良く区別できるパラメータに対する重みを強
めた重み付き和が有効である。
【0064】ヒストグラム加算部10内のヒストグラム
要素特定手段15は、実施の形態1と同様に、パワー算
出部3から入力されたパワー7に対応するヒストグラム
要素を特定し、特定されたヒストグラム要素が持つ要素
番号を要素番号17としてヒストグラム手段12に出力
する。ヒストグラム加算部10内の加算量算出手段16
は、雑音らしさ算出手段8から入力された雑音らしさ
2、ピッチ周期性評価手段19から入力されたピッチ周
期性評価値21、定常性評価手段20から入力された定
常性評価値22に基づいて、前記要素番号17を持つヒ
ストグラム要素に加算する加算量18を算出し、これを
ヒストグラム手段12に出力する。
【0065】ここで、雑音らしさ2、ピッチ周期性評価
値21、定常性評価値22という3つのパラメータから
1つの加算量18を算出する方法としては、各パラメー
タに対して図3で説明した算出方法と同様な算出処理を
行って、得られた3つの加算量を総合して最終的な加算
量18とすればよい。雑音らしさ2に対しては図3の方
法をそのまま用い、ピッチ周期性評価値21に対しては
周期性が高いほど加算量を小さく算出し、定常性評価値
22に対しては定常性が高いほど加算量を大きく算出す
るようにする。3つの加算量を総合する簡単な方法とし
ては、最大値をとる方法がある。こうすることで不用意
に加算量が小さくなってヒストグラムへの加算量が小さ
くなりすぎることを抑止でき安全である。この他、3つ
の加算量の平均値や積をとったり、重み付き和をとる方
法もある。積をとった場合には、確実に雑音と判断でき
る区間を中心にヒストグラムが更新されるので、比較的
背景雑音が定常である場合には非常に安定に推定雑音パ
ワー14が算出でき、雑音らしさ2も安定に算出でき
る。そして、ヒストグラム手段12は、入力された要素
番号17を持つヒストグラム要素の累積値に対して加算
量18を加算する。
【0066】ヒストグラム更新部9内では、ヒストグラ
ム抑制手段11が、実施の形態1と同様に、ヒストグラ
ム手段12に対して、ヒストグラムの各要素が持つ累積
値を減らすための情報として乗数βを出力する。そし
て、ヒストグラム手段12は、ヒストグラム抑制手段1
2から入力された乗数βを全累積値に乗じることで、ヒ
ストグラムの各要素が持つ累積値を減少させる。以上、
次のフレームの処理のための前準備にあたる、推定雑音
スペクトルとヒストグラムの更新処理を説明した。
【0067】なお、この実施の形態2では、定常性評価
手段20がピッチ周期性評価値21、パワー7、雑音ら
しさ2という3つのパラメータの定常性を総合判定して
いるが、これに限ったものではなく、他のパラメータを
更に追加することも可能であるし、それらのパラメータ
中のどれか1つないし複数を選択して使用しても構わな
い。更に、ヒストグラム加算部10内の加算量算出手段
16が雑音らしさ2、ピッチ周期性評価値21、定常性
評価値22という3つのパラメータに基づいて加算量1
8を算出するようにしているが、これに限ったものでは
なく、背景雑音区間らしいか否かを評価することができ
るパラメータであれば更に追加することも可能である
し、それらのパラメータ中のどれか1つないし複数を選
択して使用しても構わない。
【0068】この実施の形態2によれば、実施の形態1
の構成に加えて、最終的に算出される雑音らしさ、入力
音声を分析して得られるピッチ周期性の大きさ、入力音
声に関する定常性評価結果に基づいて、ヒストグラムの
更新の大きさに0より大きい値を乗じるようにしたの
で、実施の形態1が持つ効果に加えて、雑音の変動性が
大きい場合でも、雑音らしくない区間を比較的精度良く
判定して、この区間がヒストグラムに与える影響を抑制
することができ、音声のパワーを推定雑音パワーと誤る
ことを更に抑制でき、雑音らしさの算出精度が安定(背
景雑音パワーの推定が安定)になり、最終的に誤算出の
少ない雑音らしさ算出方法が提供できる効果がある。
【0069】実施の形態3.図6は、この発明による雑
音らしさ算出方法の実施の形態3におけるヒストグラム
加算部10の構成を示し、図中15はヒストグラム要素
特定手段、16は加算量算出手段、2は雑音らしさ算出
手段8が出力した雑音らしさ、21はピッチ周期性評価
値、22は定常性評価値、23は分配率算出手段、24
は加算量分配手段、25は要素番号ベクトル、26は加
算量ベクトルである。なお、実施の形態3の雑音らしさ
算出方法の全体構成は、図4と同じであり、ヒストグラ
ム加算部10以外の構成の動作は同様であるため説明を
省略する。
【0070】以下、図に基づいて動作を説明する。ヒス
トグラム加算部10内のヒストグラム要素特定手段15
は、パワー算出部3から入力されたパワー7に最も近い
代表パワー値を持つヒストグラム要素と、次に近い代表
パワー値を持つヒストグラム要素を特定し、特定された
2つのヒストグラム要素が持つ2つの要素番号を要素番
号ベクトル25としてヒストグラム手段12に出力す
る。また、パワー7と2つの特定されたヒストグラム要
素の代表パワー値を分配率算出手段23に出力する。な
お、ヒストグラム要素の特定においては、対数パワー領
域の距離に基づいて行うのが良い。
【0071】分配率算出手段23は、ヒストグラム要素
特定手段15から入力されたパワー7と2つの代表パワ
ー値に基づいて、各々に対応するヒストグラム要素(そ
の要素番号が要素番号ベクトル25)への加算量の分配
率を算出し、加算量分配手段24に出力する。ここで、
加算量の分配率については、パワー7に近い代表パワー
値を持つヒストグラム要素ほど分配率が大きくなるよう
に制御する。
【0072】図7は、分配率算出手段23における加算
量の分配率の制御例を示す図である。横軸は対数パワー
を表わし、縦軸が算出される分配率を表わしている。図
中、P1とP2は、ヒストグラム要素特定手段15にて
特定された2つのヒストグラム要素の代表パワー値であ
る。また、W1とW2は、パワー7がP1とP2の間の
任意の位置にある時の、各々のヒストグラム要素に与え
る分配率の算出結果を表わしている。なお、P1とP2
はパワー7に最も近い代表パワー値と次に近い代表パワ
ー値であるので、必ずパワー7はP1とP2の間(両端
を含む)にくる。図7に示した例では、P1とP2の間
では、以下の式3、式4にしたがってW1とW2が算出
される。
【0073】 W1 = (log(P2)−log(P))/(log(P2)−log(P1))・・・ 式3 W2 = (log(P)−log(P1))/(log(P2)−log(P1))・・・ 式4 ここで、Pはパワー7を示す。
【0074】この制御例の場合、パワー7がP1に一致
する場合には、P1に対応するヒストグラム要素に対す
る分配率W1が1で、P2に対応するヒストグラム要素
に対する分配率W2が0となる。逆にパワー7がP2に
一致する場合には、P1に対応するヒストグラム要素に
対する分配率W1が0で、P2に対応するヒストグラム
要素に対する分配率W2が1となる。そして、P1とP
2の間にある場合には、距離の近さに応じて分配率が0
〜1の間で連続的に推移している。
【0075】次に加算量算出手段16は、実施の形態2
と同様に、雑音らしさ算出手段8から入力された雑音ら
しさ2、ピッチ周期性評価手段19から入力されたピッ
チ周期性評価値21、定常性評価手段20から入力され
た定常性評価値22に基づいて、ヒストグラム要素に加
算する加算量18を算出し、これを加算量分配手段24
に出力する。加算量分配手段24は、加算量算出手段1
6が算出した加算量18に、分配率算出手段24が出力
したヒストグラム要素毎の分配率を乗じて2つの加算量
を次の式5、式6のように算出し、これを加算量ベクト
ル26としてヒストグラム手段12に出力する。
【0076】A1 = A × W1 ・・・ 式5 A2 = A × W2 ・・・ 式6 ここで、Aが加算量18、A1とA2が算出された2つ
の加算量である。
【0077】そして、ヒストグラム手段12は、入力さ
れた要素番号ベクトル25内の2つの要素番号に対応す
る2つのヒストグラム要素に対して、入力された加算量
ベクトル26内の2つの加算量を加算する。具体的に
は、代表パワー値P1を持つヒストグラム要素の累積値
にA1を加算し、代表パワー値P2を持つヒストグラム
要素の累積値にA2を加算する。
【0078】なお、上記構成では、2つのヒストグラム
要素を特定して、その各要素毎の加算量を算出して、各
要素の累積値に加算しているが、3つ以上の所定数のヒ
ストグラム要素を特定して、その各要素毎の加算量を算
出して、各要素の累積値に加算することもできる。その
場合、ヒストグラム要素特定手段15では、パワー7に
近い順に所定数の代表パワー値を決定し、それらの代表
パワー値を持つヒストグラム要素を特定し、分配率算出
手段23がパワー7に近い代表パワー値を持つヒストグ
ラム要素ほど分配率が大きくなるように分配率を算出
し、加算量分配手段24が各ヒストグラム要素の加算量
を算出すればよい。分配率の算出方法としては、対数パ
ワー領域での代表パワー値とパワー7の距離に逆比例す
る値を加算するなどすればよい。
【0079】この実施の形態3によれば、実施の形態2
の構成に加えて、現フレームのパラメータ値(パワー
7)が指すヒストグラム要素およびこの要素に近接する
1つ以上の要素の各々の累積値を、各要素が持つ代表パ
ラメータ値(代表パワー値)と現フレームのパラメータ
値(パワー7)との差の大きさに従った量ずつ増やすこ
とでヒストグラムの更新を行うようにしたので、実施の
形態2が持つ効果に加えて、ヒストグラムの累積期間が
短い、累積期間内の背景雑音区間が少ない場合でも、ヒ
ストグラム要素間の累積値のがたつきが減少し、雑音ら
しさの算出精度が安定(推定雑音パラメータ値の算出が
安定)となり、音声のパワーを背景雑音パワーと誤って
雑音らしさの算出結果が大きく劣化することも少ない雑
音らしさ算出方法を提供することができる効果がある。
【0080】実施の形態4.図8は、この発明による雑
音らしさ算出方法の実施の形態4におけるピーク探索部
13の構成を示し、図中27は重心パワー算出手段、2
8はパワー閾値算出手段、29は累積値最大値探索手
段、30は累積値閾値算出手段、31はパワー最小極大
値探索手段、32は曲線近似手段である。なお、実施の
形態4の雑音らしさ算出方法の全体構成は、図1または
図4と同じであり、ピーク探索部13以外の構成の動作
は同様であるため説明を省略する。
【0081】以下、図に基づいて動作を説明する。ヒス
トグラム手段12は、現時点までのパワー7に関する重
み付け出現頻度分布を示すヒストグラムを格納してい
る。パワー7の所定の範囲を複数の微小範囲毎に分割し
たものが各ヒストグラム要素であり、各ヒストグラム要
素は、要素番号、重み付け出現頻度値を表す累積値、要
素を代表する代表パワー値を持っている。
【0082】ピーク探索部13内の重心パワー算出手段
27は、ヒストグラム手段12に格納されているヒスト
グラムを読み出し、ヒストグラムのパワーに関する重心
を算出し、得られた重心パワーをパワー閾値算出手段2
8に出力する。なお、重心パワーの算出は、以下の式7
に従って行うことができる。
【0083】 log(G) = Σ{H(i)×log(P(i))} / Σ{H(i)} ・・・ 式7 ここで、H(i)が第i番目のヒストグラム要素の累積
値、P(i)が第i番目のヒストグラム要素の代表パワー
値、Gが算出された重心パワーである。この式によって
対数パワー領域での重心パワーが算出されている。な
お、重心パワーの算出は、この式に限定されるものでは
ない。
【0084】パワー閾値算出手段28は、重心パワー算
出手段27より入力された重心パワーに、対数領域で所
定のマージン値を加算して、加算結果をパワー閾値とし
て累積値最大値探索手段29に出力する。なお、マージ
ン値の加算は以下の式8に従って行うことができる。
【0085】 log(G’) = log(G) + log(δ) ・・・ 式8 ここで、log(δ)がマージン値、G’がパワー閾値であ
る。この式は、以下の様にパワー領域の乗算によって行
うこともできる。
【0086】G’ = G × δ ・・・ 式9 このマージン値については、ヒストグラムが雑音区間の
みによって生成された場合でも、その分布のピークがこ
のパワー閾値を下回らないように設定する必要がある。
マージン値は固定値でもいいが、ヒストグラムの分布の
広がり具合に基づいて大きさを制御すると更に良い。
【0087】累積値最大値探索手段29は、ヒストグラ
ム手段12に格納されているヒストグラムを読み出し、
パワー閾値算出手段28から入力されたパワー閾値を下
回る代表パワー値を持つヒストグラム要素の中から、累
積値が最大のヒストグラム要素を探索し、その最大の累
積値を累積値閾値算出手段30に出力する。また、累積
値が最大のヒストグラム要素が持つ要素番号をパワー最
小極大値探索手段31に出力する。
【0088】図9は、累積値最大値探索手段29の動作
を説明するヒストグラム例を示す。横軸が各ヒストグラ
ム要素の代表パワー値(対数領域)、縦軸が各ヒストグ
ラム要素の累積値である。このヒストグラムには、P
1、P2という2つの累積値の極大点がある。P1が背
景雑音のピークであり、P2が音声のピークである。累
積値最大値探索手段29では、パワー閾値G’を下回る
代表パワー値の範囲内で、累積値の最大値を探索し、結
果としてHmaxを出力する。なお、パワー閾値G’の
位置における累積値がHmaxより大きければ、その値
を出力することになる。
【0089】なお、図中には、特願平8−331304
号がピーク探索に使用している固定閾値C1の例も示し
ている。特願平8−331304号では、代表パワー値
に関する固定の閾値C1を下回る範囲内で、出現頻度の
値を最大にする極大値を選択して、これを推定雑音パワ
ーとしている。累積値最大値探索手段29では推定雑音
パワーを算出しているわけではいし、極大値に限定して
いるわけではないので、全く別物であるが、代表パワー
値に対する閾値を設けて、これを下回る範囲で探索を行
う点が類似するので、比較のために説明する。
【0090】固定の閾値C1を用いて累積値最大値探索
手段29が探索を行った場合、入力信号のパワーが音声
も含めて非常に小さい場合に、図9のように音声のピー
クも固定閾値C1を下回ってしまい、この音声のピーク
P2に対する累積値を出力してしまうことになる。この
場合、後述するピーク探索部13内の処理を経て最終的
に出力される推定雑音パワーとして、音声のパワーが出
力されてしまうことが多くなってしまい好ましくない。
適応的に算出される重心パワーに基づく今回のパワー閾
値を用いることで、この様な固定閾値が持つ課題を解消
することができる。
【0091】累積値閾値算出手段30は、累積値最大値
探索手段29から入力された累積値の最大値Hmax
に、1より小さい値θを乗じることで、累積値に関する
閾値θHmaxを算出し、これをパワー最小極大値探索
手段31に出力する。
【0092】パワー最小極大値探索手段31は、ヒスト
グラム手段12に格納されているヒストグラムを読み出
し、累積値最大値探索手段29より入力された要素番号
と、累積値閾値算出手段30から入力された累積値に関
する閾値θHmaxに基づいて、1つのヒストグラム要
素を選択して、その極大値のヒストグラム要素の要素番
号を曲線近似手段32に出力する。具体的な選択方法
は、以下の通りである。
【0093】まず、累積値最大値探索手段29より入力
された要素番号に対応するヒストグラム要素を抽出し、
このヒストグラム要素およびこのヒストグラム要素より
も小さい代表パワー値を持つヒストグラム要素に以降の
探索範囲を限定する。そして、この探索範囲内から、累
積値が極大値をとり、且つ閾値θHmaxを上回るもの
を探索し、更にこの中で最も小さい代表パワー値を持つ
ものを選択する。なお、条件を満足する極大値が無い場
合には、累積値最大値探索手段29より入力された要素
番号をそのまま曲線近似手段32に出力する。
【0094】図10は、パワー最小極大値探索手段31
の動作を説明するヒストグラム例である。横軸が各ヒス
トグラム要素の代表パワー値(対数領域)、縦軸が各ヒ
ストグラム要素の累積値である。このヒストグラムに
は、パワー閾値以下にP1、P2、P3、P4という4
つの累積値の極大点がある。P1とP2が背景雑音の主
要なピークであり、P3とP4は低いパワーの雑音フレ
ーム数が少ないために、ヒストグラムの乱れとして現れ
てしまったピークである。また、P2が累積値最大値探
索手段29より入力された要素番号に対応する代表パワ
ー値であり、その累積値がHmaxとなっている。パワ
ー最小極大値探索手段31では、P2およびP2を下回
る代表パワー値の範囲内の4つの極大点P1、P2、P
3、P4の中で、累積値が閾値θHmaxを上回るP1
とP2をまず選択し、この2つの内最小の代表パワー値
を持つP1を最終選択する。
【0095】なお、図中には、特願平8−331304
号がピーク探索に使用している固定閾値C2の例も示し
ている。特願平8−331304号では、固定の閾値C
2を上回る累積値を持つ極大値の中から1つを選択し
て、これを推定雑音パワーとしている。この時、ヒスト
グラムへの累積期間が少なすぎたり多すぎたりした場合
に、固定値C2がヒストグラムの各累積値を全て上回っ
たり下回ったりして、全く効果を奏することができなく
なる、またはかえって悪さをする場合すら出てくる。適
応的に算出される今回の閾値を用いることで、この様な
固定閾値が持つ課題を解消することができる。
【0096】曲線近似手段32は、ヒストグラム手段1
2に格納されているヒストグラムを読み出し、パワー最
小極大値探索手段31から入力された要素番号を持つヒ
ストグラム要素が、累積値に関する極大値をとっている
場合に限って、前後数個のヒストグラム要素の累積値と
の間を曲線近似し、その曲線上の最大の累積値を与える
パワーを算出して、これを推定雑音パワー14として出
力する。累積値に関する極大値をとっていない場合に
は、入力された要素番号に対応するヒストグラム要素の
累積値に対応する代表パワー値をそのまま推定雑音パワ
ー14として出力する。なお、曲線近似方法としては、
前後の要素を使用した3点放物線近似が簡単である。
【0097】図11は、曲線近似手段32の動作を説明
する曲線近似例を示す。横軸がパワー値(対数領域)、
縦軸が累積値である。パワー最小極大値探索手段31か
ら入力された要素番号に対応するヒストグラム要素の代
表パワー値がp2、その累積値がh2である。p1とp
3はその前後のヒストグラム要素の代表パワー値、h1
とh3がその累積値である。この3点に対して、放物線
近似を行った結果が、図中の曲線である。この曲線上の
最大の累積値hmaxを与えるパワーpmaxは、以下
の数式によって簡単に算出できる。
【0098】 pmax = p2 + (h3−h1)/(2×h2−h1−h3)/2 ・・・ 式10
【0099】そして、この曲線近似手段32から出力さ
れた推定雑音パワー14を用いて、雑音らしさ算出手段
8が、最終出力である雑音らしさ2を算出し、出力す
る。
【0100】この実施の形態4によれば、実施の形態1
ないし3の構成に加えて、ヒストグラムの各要素の累積
値を曲線近似することで要素間の累積値推移を推定し、
この推定結果に基づいて推定雑音パラメータ値(推定雑
音パワー14)を算出するようにしたので、実施の形態
1ないし3が持つ効果に加えて、ヒストグラムの2重化
などの複雑な制御もなしに、安定度を犠牲にすることな
く、分解能を改善した雑音らしさ算出方法を提供するこ
とができる効果がある。また、分解能が改善されるの
で、従来と同じ分解能であれば、ヒストグラム要素数を
減らし、各要素のパラメータ値(パワー)の範囲を広く
することができるので、必要最小限のメモリで実行でき
る雑音らしさ算出方法が提供できる効果がある。ヒスト
グラム要素を減らすことによって、ヒストグラムの累積
期間が短い、累積期間内の背景雑音区間が少ない場合で
も、ヒストグラム要素間の累積値のがたつきが減少し、
雑音らしさの算出精度が安定(推定雑音パラメータ値の
算出が安定)となり、音声のパワーを背景雑音パワーと
誤って雑音らしさの算出結果が大きく劣化することも少
ない雑音らしさ算出方法を提供することができる効果が
ある。
【0101】また、ヒストグラムの重心を与える重心パ
ラメータ値(重心パワー)を算出し、この重心パラメー
タ値に所定のマージン値(log(δ))を加算した値より
小さいパラメータ値の範囲内から推定雑音パラメータ値
(推定雑音パワー14)を算出するようにしたので、累
積期間内の背景雑音区間が少ない場合でも、ヒストグラ
ムの分布中でパラメータ値(パワー)が小さい範囲内の
みからピーク探索が行え、音声のパワーを背景雑音パワ
ーと誤って雑音らしさの算出結果が大きく劣化すること
が少ない雑音らしさ算出方法を提供できる効果がある。
また、パラメータ値(パワー)に関する固定の閾値を使
用していないので、入力音声のレベルの大小に依存しな
い処理が可能で、音声のパワーを背景雑音パワーと誤っ
てしまい、雑音らしさの算出結果が大きく劣化すること
がない雑音らしさ算出方法を提供できる効果がある。
【0102】また、ヒストグラム全範囲または所定の範
囲内の最大累積値(Hmax)を探索し、この最大累積
値に1より小さい値(乗数θ)を乗じることで累積値閾
値(θHmax)を算出し、この累積値閾値より大きい
累積値を持つヒストグラム要素の中から推定雑音パラメ
ータ値(推定雑音パワー14)を算出するようにしたの
で、ヒストグラムの累積期間が短くて、ヒストグラムの
がたつきが多い場合でも、このがたつきが多い微小な極
値を除外してピーク探索が行え、推定雑音パラメータ値
(推定雑音パワー14)の算出精度があがり、安定な雑
音らしさの算出結果が得られる雑音らしさ算出方法を提
供できる効果がある。また、累積値に関する固定の閾値
を使用していないので、ヒストグラムの累積期間にあま
り依存しない処理が可能で、固定閾値の不整合によって
雑音らしさの算出結果が大きく劣化することがない雑音
らしさ算出方法を提供できる効果がある。
【0103】実施の形態5.上記実施の形態1ないし4
では、ヒストグラム抑制手段11が出力する乗数βにつ
いては、固定またはヒストグラム加算部10が出力した
加算量18の大きさに基づいて制御する、としている
が、ヒストグラム加算部10で算出する加算量18と同
様に、雑音らしさ2、ピッチ周期性評価値21、定常性
評価値22に基づいて制御する構成も可能である。すな
わち、雑音らしさ2が小さい場合、ピッチ周期性評価値
21が大きい場合、定常性評価値22が低い場合に、β
を1に近づけてヒストグラムの抑制を弱くすることで制
御を行う。
【0104】この実施の形態5によれば、実施の形態1
ないし4が持つ効果に加えて、音声区間が長く続いた場
合に、ヒストグラムが過度に抑制されて、推定雑音パワ
ー14の算出が不安定になることを防止することができ
る効果がある。
【0105】実施の形態6.上記実施の形態1ないし5
の構成において、ヒストグラム更新部9の処理を、加算
量18を一定値として雑音らしさ算出手段8の前に行
い、算出された雑音らしさ2に基づいて、図3にて説明
した方法を用いて加算量18を算出して、前記一定値と
の差異分を後でヒストグラムに反映させる構成も可能で
ある。
【0106】この実施の形態6によれば、実施の形態1
ないし5が持つ効果に加えて、現在のパワー7が反映し
たヒストグラムに基づいて雑音らしさ2の算出が行われ
るので、若干ではあるが、雑音区間における雑音らしさ
の算出精度が向上する効果がある。
【0107】実施の形態7.上記実施の形態1ないし6
の構成では、全ての処理をフレーム毎に行ったが、これ
に限ったものではない。例えば、1フレームを複数のサ
ブフレームに分割し、一部の処理をサブフレーム毎に行
うようにしても良い。例えば、パワー算出部3がサブフ
レーム毎にパワー7を算出し、雑音らしさ算出手段8が
この複数のパワー7と現フレームの推定雑音パワー14
に基づいて現フレームの雑音らしさ2を算出する構成も
可能である。
【0108】この実施の形態7によれば、フレーム内の
複数のパワー7の内の最小値を選択して、これに基づい
た雑音らしさ2を算出することで、実施の形態1ないし
6が持つ効果に加えて、音声区間を背景雑音らしいと誤
りにくい雑音らしさ算出方法が提供できる効果がある。
逆にフレーム内の複数のパワー7の内の最大値を選択し
て、これに基づいた雑音らしさ2を算出することで、実
施の形態1ないし6が持つ効果に加えて、雑音区間を背
景雑音らしくないと誤りにくい雑音らしさ算出方法が提
供できる効果がある。
【0109】実施の形態8.上記実施の形態1ないし7
の構成では、雑音らしさ算出手段8に入力するパラメー
タとして、逆フィルタ手段4、パワー算出手段5、推定
雑音スペクトル更新手段6によって算出した残差信号の
パワー7を使用したが、雑音らしさを評価するために適
切なもの(つまり音声区間と雑音区間でパラメータ値の
分布に差異があるもの)であれば、このパラメータに限
ったものではない。例えば、単に入力音声のパワーをパ
ラメータとした場合には、推定雑音パワー14がいわゆ
る雑音レベルに相当し、「雑音レベルからの差」として
雑音らしさ2が算出される。雑音のスペクトル特性があ
る程度限定できる場合には、雑音が多く含まれる帯域を
除外した帯域制限音声を生成し、そのパワーをパラメー
タとすることもできる。
【0110】また、単一のパラメータである必要はな
く、複数のパラメータの重み付き和をそのままパラメー
タとしたり、複数のパラメータに対応して複数のヒスト
グラムを生成し、これに基づいて複数の推定雑音パラメ
ータ(推定雑音パワー14の代わり)を算出し、これら
の算出結果を総合して最終的な雑音らしさ2を算出する
ことも可能である。
【0111】この実施の形態8によれば、適切なパラメ
ータを追加したり変更することで、実施の形態1ないし
7が持つ効果に加えて、更に算出精度の高い雑音らしさ
算出方法が提供できる効果がある。入力音声のパワーを
パラメータとした場合には、推定雑音パワー14をいわ
ゆる雑音レベルとして外部に出力し、雑音レベルを使用
する様々なアプリケーションや装置に入力することで、
それらの品質を改善できる効果がある。
【0112】
【発明の効果】以上説明したように請求項1の発明の雑
音らしさ算出方法および請求項10の発明の雑音らしさ
算出装置は、入力音声を所定長のフレーム毎に分析して
所定のパラメータ値を算出し、このパラメータ値の分布
に関するヒストグラムを更新し、このヒストグラムに基
づいて現フレーム時点での推定雑音パラメータ値を算出
し、現フレームのパラメータ値と算出した推定雑音パラ
メータ値を比較することで現フレームの雑音らしさの度
合いを算出する雑音らしさ算出方法であって、入力音声
を分析して得られる所定の評価値に基づいて、ヒストグ
ラムの更新の大きさに0より大きい値を乗じるようにし
たので、入力音声に含まれる雑音区間の比率が少ない場
合でも、所定の評価値によって雑音らしくない区間を判
定して、この区間がヒストグラムに与える影響を抑制す
ることができ、音声のパラメータ値のピークを推定雑音
パラメータ値と誤ることを抑制でき、最終的に誤算出の
少ない雑音らしさ算出方法が提供できる効果がある。
【0113】また、完全にヒストグラムへの加算を停止
することが無いので、所定の評価値による雑音らしい区
間の判定が何らかの原因で誤判定に陥った場合でも、徐
々にヒストグラムが更新されて、この誤判定から脱出す
ることができ、誤算出の少ない雑音らしさ算出方法を提
供できる効果がある。
【0114】請求項2の発明の雑音らしさ算出方法は、
請求項1の発明の雑音らしさ算出方法における所定の評
価値として、最終的に算出される雑音らしさを含むよう
にしたので、請求項1の雑音らしさ算出方法が持つ効果
に加えて、特別な評価手段の追加なしに、雑音らしさの
低い区間がヒストグラムに与える影響を抑制することが
でき、音声のパラメータ値のピークを推定雑音パラメー
タ値と誤ることを抑制でき、誤算出の少ない雑音らしさ
算出方法を提供できる効果がある。
【0115】請求項3の発明の雑音らしさ算出方法は、
請求項1の発明の雑音らしさ算出方法における所定の評
価値として、入力音声を分析して得られるピッチ周期性
の大きさらしさを含むようにしたので、請求項1の雑音
らしさ算出方法が持つ効果に加えて、雑音の変動性が大
きい場合でも、雑音らしくない区間を比較的精度良く判
定して、この区間がヒストグラムに与える影響を抑制す
ることができ、音声のパラメータ値のピークを推定雑音
パラメータ値と誤ることを更に抑制でき、雑音らしさの
算出精度が安定(背景雑音パラメータ値の推定が安定)
になり、最終的に誤算出の少ない雑音らしさ算出方法が
提供できる効果がある。
【0116】請求項4の発明の雑音らしさ算出方法は、
請求項1の発明の雑音らしさ算出方法における所定の評
価値として、入力音声に関する定常性評価結果を含むよ
うにしたので、請求項1の雑音らしさ算出方法が持つ効
果に加えて、雑音の変動性が大きい場合でも、雑音らし
くない区間を比較的精度良く判定して、この区間がヒス
トグラムに与える影響を抑制することができ、音声のパ
ラメータ値のピークを推定雑音パラメータ値と誤ること
を更に抑制でき、雑音らしさの算出精度が安定(背景雑
音パワーの推定が安定)になり、最終的に誤算出の少な
い雑音らしさ算出方法が提供できる効果がある。
【0117】請求項5の発明の雑音らしさ算出方法およ
び請求項11の発明の雑音らしさ算出装置は、現フレー
ムのパラメータ値が指すヒストグラム要素の累積値を増
やすとともに、その他のヒストグラム要素の累積値に1
より小さい値を乗じることでヒストグラムの更新を行う
ようにしたので、遠い過去の影響は小さいが0ではな
く、最近の影響が大きくヒストグラムに反映しているの
で、累積期間が長い場合でも、背景雑音パラメータ値の
変動に対する追従性が劣化しない雑音らしさ算出方法を
提供できる効果がある。また、この様に更新を行うよう
にしたので、従来のように固定の累積期間を設定する必
要が無く、累積期間を短かく設定しすぎて雑音らしさの
算出精度が不安定になることがない雑音らしさ算出方法
を提供できる効果がある。
【0118】請求項6の発明の雑音らしさ算出方法およ
び請求項12の発明の雑音らしさ算出装置は、現フレー
ムのパラメータ値が指すヒストグラム要素およびこの要
素に近接する1つ以上の要素の各々の累積値を、各要素
が持つ代表パラメータ値と現フレームのパラメータ値と
の差の大きさに従った量ずつ増やすことでヒストグラム
の更新を行うようにしたので、実施の形態2が持つ効果
に加えて、ヒストグラムの累積期間が短い、累積期間内
の背景雑音区間が少ない場合でも、ヒストグラム要素間
の累積値のがたつきが減少し、雑音らしさの算出精度が
安定(推定雑音パラメータ値の算出が安定)となり、音
声のパラメータ値のピークを背景雑音パラメータ値と誤
って雑音らしさの算出結果が大きく劣化することも少な
い雑音らしさ算出方法を提供することができる効果があ
る。
【0119】請求項7の発明の雑音らしさ算出方法は、
ヒストグラムの各要素の累積値を曲線近似することで要
素間の累積値推移を推定し、この推定結果に基づいて推
定雑音パラメータ値を算出するようにしたので、ヒスト
グラムの2重化などの複雑な制御もなしに、安定度を犠
牲にすることなく、分解能を改善した雑音らしさ算出方
法を提供することができる効果がある。また、分解能が
改善されるので、従来と同じ分解能であれば、ヒストグ
ラム要素数を減らし、各要素のパラメータ値の範囲を広
くすることができるので、必要最小限のメモリで実行で
きる雑音らしさ算出方法が提供できる効果がある。ヒス
トグラム要素を減らすことによって、ヒストグラムの累
積期間が短い、累積期間内の背景雑音区間が少ない場合
でも、ヒストグラム要素間の累積値のがたつきが減少
し、雑音らしさの算出精度が安定(推定雑音パラメータ
値の算出が安定)となり、音声のパラメータ値のピーク
を背景雑音パラメータ値と誤って雑音らしさの算出結果
が大きく劣化することも少ない雑音らしさ算出方法を提
供することができる効果がある。
【0120】請求項8の発明の雑音らしさ算出方法は、
ヒストグラムの重心を与える重心パラメータ値を算出
し、この重心パラメータ値に所定のマージン値を加算し
た値より小さいパラメータ値の範囲内から推定雑音パラ
メータ値を算出するようにしたので、累積期間内の背景
雑音区間が少ない場合でも、ヒストグラムの分布中でパ
ラメータ値が小さい範囲内のみからピーク探索が行え、
音声のパラメータ値のピークを背景雑音パラメータ値と
誤って雑音らしさの算出結果が大きく劣化することが少
ない雑音らしさ算出方法を提供できる効果がある。ま
た、パラメータ値に関する固定の閾値を使用していない
ので、入力音声のレベルの大小に依存しない処理が可能
で、音声のパラメータ値のピークを背景雑音パラメータ
値と誤ってしまい、雑音らしさの算出結果が大きく劣化
することがない雑音らしさ算出方法を提供できる効果が
ある。
【0121】請求項9の発明の雑音らしさ算出方法は、
ヒストグラム全範囲または所定の範囲内の最大累積値を
探索し、この最大累積値に1より小さい値を乗じること
で累積値閾値を算出し、この累積値閾値より大きい累積
値を持つヒストグラム要素の中から推定雑音パラメータ
値を算出するようにしたので、ヒストグラムの累積期間
が短くて、ヒストグラムのがたつきが多い場合でも、こ
のがたつきが多い微小な極値を除外してピーク探索が行
え、推定雑音パラメータ値の算出精度があがり、安定な
雑音らしさの算出結果が得られる雑音らしさ算出方法を
提供できる効果がある。また、累積値に関する固定の閾
値を使用していないので、ヒストグラムの累積期間にあ
まり依存しない処理が可能で、固定閾値の不整合によっ
て雑音らしさの算出結果が大きく劣化することがない雑
音らしさ算出方法を提供できる効果がある。
【図面の簡単な説明】
【図1】 この発明の実施の形態1の雑音らしさ算出方
法の全体構成を示す図である。
【図2】 この発明の実施の形態1のヒストグラム加算
部の構成を示す図である。
【図3】 この発明の実施の形態1の加算量算出手段に
おける雑音らしさに基づく加算量の算出例を示す図であ
る。
【図4】 この発明の実施の形態2の雑音らしさ算出方
法の全体構成を示す図である。
【図5】 この発明の実施の形態2のヒストグラム加算
部の構成を示す図である。
【図6】 この発明の実施の形態3のヒストグラム加算
部の構成を示す図である。
【図7】 この発明の実施の形態3の分配率算出手段に
おける加算量の分配率の制御例を示す図である。
【図8】 この発明の実施の形態4のピーク探索部の構
成を示す図である。
【図9】 この発明の実施の形態4の累積値最大値探索
手段の動作を説明するヒストグラム例を示す図である。
【図10】 この発明の実施の形態4のパワー最小極大
値探索手段の動作を説明するヒストグラム例を示す図で
ある。
【図11】 この発明の実施の形態4の曲線近似手段の
動作を説明する曲線近似例を示す図である。
【符号の説明】
1:入力音声、 2:雑音らしさ、 3:パワー
算出部、4:逆フィルタ手段、 5:パ
ワー算出手段、6:推定雑音スペクトル更新手段、
7:パワー、8:雑音らしさ算出手段、
9:ヒストグラム更新部、10:ヒストグラム加算部、
11:ヒストグラム抑制手段、12:ヒストグ
ラム手段、 13:ピーク探索部、14:推定
雑音パワー、 15:ヒストグラム要素特定
手段、16:加算量算出手段、 17:要素番号、
18:加算量、19:ピッチ周期性評価手段、
20:定常性評価手段、21:ピッチ周期性評価値、
22:定常性評価値、23:分配率算出手段、
24:加算量分配手段、25:要素番号ベ
クトル、 26:加算量ベクトル、27:重心
パワー算出手段、 28:パワー閾値算出手段、
29:累積値最大値探索手段、 30:累積値閾値
算出手段、31:パワー最小極大値探索手段、 32:
曲線近似手段

Claims (12)

    【特許請求の範囲】
  1. 【請求項1】入力音声を所定長のフレーム毎に分析して
    所定のパラメータ値を算出し、現フレームのパラメータ
    値を用いてパラメータ値の分布に関するヒストグラムを
    更新し、このヒストグラムに基づいて現フレーム時点で
    の推定雑音パラメータ値を算出し、現フレームのパラメ
    ータ値と算出した推定雑音パラメータ値を比較すること
    で現フレームの雑音らしさの度合いを算出する雑音らし
    さ算出方法であって、前記ヒストグラムの更新は、入力
    音声を分析して得られる所定の評価値に基づいて、ヒス
    トグラムの更新の大きさに0より大きい値を乗じるよう
    にしたことを特徴とする雑音らしさ算出方法。
  2. 【請求項2】前記所定の評価値として、最終的に算出さ
    れる雑音らしさの度合いを含むことを特徴とする請求項
    1記載の雑音らしさ算出方法。
  3. 【請求項3】前記所定の評価値として、入力音声のピッ
    チ周期性の大きさを含むことを特徴とする請求項1記載
    の雑音らしさ算出方法。
  4. 【請求項4】前記所定の評価値として、入力音声に関す
    る定常性評価結果を含むことを特徴とする請求項1記載
    の雑音らしさ算出方法。
  5. 【請求項5】入力音声を所定長のフレーム毎に分析して
    所定のパラメータ値を算出し、現フレームのパラメータ
    値を用いてパラメータ値の分布に関するヒストグラムを
    更新し、このヒストグラムに基づいて現フレーム時点で
    の推定雑音パラメータ値を算出し、現フレームのパラメ
    ータ値と算出した推定雑音パラメータ値を比較すること
    で現フレームの雑音らしさの度合いを算出する雑音らし
    さ算出方法であって、現フレームのパラメータ値が指す
    ヒストグラム要素の累積値を増やすとともに、その他の
    ヒストグラム要素または全ヒストグラム要素の累積値に
    1より小さい値を乗じることで前記ヒストグラムの更新
    を行うようにしたことを特徴とする雑音らしさ算出方
    法。
  6. 【請求項6】入力音声を所定長のフレーム毎に分析して
    所定のパラメータ値を算出し、現フレームのパラメータ
    値を用いてパラメータ値の分布に関するヒストグラムを
    更新し、このヒストグラムに基づいて現フレーム時点で
    の推定雑音パラメータ値を算出し、現フレームのパラメ
    ータ値と算出した推定雑音パラメータ値を比較すること
    で現フレームの雑音らしさの度合いを算出する雑音らし
    さ算出方法であって、現フレームのパラメータ値が指す
    ヒストグラム要素およびこの要素に近接する1つ以上の
    要素の各々の累積値を、各要素が持つ代表パラメータ値
    と現フレームのパラメータ値との差の大きさに従った量
    ずつ増やすことで前記ヒストグラムの更新を行うように
    したことを特徴とする雑音らしさ算出方法。
  7. 【請求項7】入力音声を所定長のフレーム毎に分析して
    所定のパラメータ値を算出し、現フレームのパラメータ
    値を用いてパラメータ値の分布に関するヒストグラムを
    更新し、このヒストグラムに基づいて現フレーム時点で
    の推定雑音パラメータ値を算出し、現フレームのパラメ
    ータ値と算出した推定雑音パラメータ値を比較すること
    で現フレームの雑音らしさの度合いを算出する雑音らし
    さ算出方法であって、ヒストグラムの各要素の累積値を
    曲線近似することで要素間の累積値推移を推定し、この
    推定結果に基づいて前記推定雑音パラメータ値を算出す
    るようにしたことを特徴とする雑音らしさ算出方法。
  8. 【請求項8】入力音声を所定長のフレーム毎に分析して
    所定のパラメータ値を算出し、現フレームのパラメータ
    値を用いてパラメータ値の分布に関するヒストグラムを
    更新し、このヒストグラムに基づいて現フレーム時点で
    の推定雑音パラメータ値を算出し、現フレームのパラメ
    ータ値と算出した推定雑音パラメータ値を比較すること
    で現フレームの雑音らしさの度合いを算出する雑音らし
    さ算出方法であって、ヒストグラムの重心を与える重心
    パラメータ値を算出し、この重心パラメータ値に所定の
    マージン値を加算した値より小さいパラメータ値の範囲
    内から前記推定雑音パラメータ値を算出するようにした
    ことを特徴とする雑音らしさ算出方法。
  9. 【請求項9】入力音声を所定長のフレーム毎に分析して
    所定のパラメータ値を算出し、現フレームのパラメータ
    値を用いてパラメータ値の分布に関するヒストグラムを
    更新し、このヒストグラムに基づいて現フレーム時点で
    の推定雑音パラメータ値を算出し、現フレームのパラメ
    ータ値と算出した推定雑音パラメータ値を比較すること
    で現フレームの雑音らしさの度合いを算出する雑音らし
    さ算出方法であって、ヒストグラム全範囲または所定の
    範囲内の最大累積値を探索し、この最大累積値に1より
    小さい値を乗じることで累積値閾値を算出し、この累積
    値閾値より大きい累積値を持つヒストグラム要素の中か
    ら前記推定雑音パラメータ値を算出するようにしたこと
    を特徴とする雑音らしさ算出方法。
  10. 【請求項10】入力音声を所定長のフレーム毎に分析し
    て所定のパラメータ値を算出するパラメータ算出部と、
    前記入力音声を別途分析して得られる所定の評価値に基
    づいて0より大きい乗数を求めて、この乗数をパラメー
    タ値の分布に関するヒストグラムの更新の大きさに乗
    じ、前記パラメータ算出部から出力された現フレームの
    パラメータ値を用いて前記ヒストグラムの更新信号を算
    出するヒストグラム更新部と、このヒストグラム更新部
    から出力された更新信号に基づいて、現在のヒストグラ
    ムを更新するヒストグラム手段と、ヒストグラム手段に
    より更新されたヒストグラムに基づいて現フレーム時点
    での推定雑音パラメータ値を算出するピーク探索部と、
    前記パワー算出部からの現フレームのパラメータ値と、
    前記ピーク探索部が算出した推定雑音パラメータ値を比
    較することで現フレームの雑音らしさの度合いを算出す
    る雑音らしさ算出手段を備えたことを特徴とする雑音ら
    しさ算出装置。
  11. 【請求項11】入力音声を所定長のフレーム毎に分析し
    て所定のパラメータ値を算出するパラメータ算出部と、
    前記パラメータ算出部から出力された現フレームのパラ
    メータ値が指すヒストグラム要素の累積値を増やすため
    の更新信号と、その他のヒストグラム要素または全ヒス
    トグラム要素の累積値に乗じる1より小さい乗数を出力
    するヒストグラム更新部と、このヒストグラム更新部か
    ら出力された更新信号と乗数に基づいて、現在のヒスト
    グラムを更新するヒストグラム手段と、ヒストグラム手
    段により更新されたヒストグラムに基づいて現フレーム
    時点での推定雑音パラメータ値を算出するピーク探索部
    と、前記パワー算出部からの現フレームのパラメータ値
    と、前記ピーク探索部が算出した推定雑音パラメータ値
    を比較することで現フレームの雑音らしさの度合いを算
    出する雑音らしさ算出手段を備えたことを特徴とする雑
    音らしさ算出装置。
  12. 【請求項12】入力音声を所定長のフレーム毎に分析し
    て所定のパラメータ値を算出するパラメータ算出部と、
    前記パラメータ算出部から出力された現フレームのパラ
    メータ値が指すヒストグラム要素およびこの要素に近接
    する1つ以上の要素の各々の累積値を、各要素が持つ代
    表パラメータ値と現フレームのパラメータ値との差の大
    きさに従った量ずつ増やすための更新信号を出力するヒ
    ストグラム更新部と、このヒストグラム更新部から出力
    された更新信号に基づいて、現在のヒストグラムを更新
    するヒストグラム手段と、ヒストグラム手段により更新
    されたヒストグラムに基づいて現フレーム時点での推定
    雑音パラメータ値を算出するピーク探索部と、前記パワ
    ー算出部からの現フレームのパラメータ値と、前記ピー
    ク探索部が算出した推定雑音パラメータ値を比較するこ
    とで現フレームの雑音らしさの度合いを算出する雑音ら
    しさ算出手段を備えたことを特徴とする雑音らしさ算出
    装置。
JP9346689A 1997-12-16 1997-12-16 雑音らしさ算出方法および雑音らしさ算出装置 Pending JPH11175083A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9346689A JPH11175083A (ja) 1997-12-16 1997-12-16 雑音らしさ算出方法および雑音らしさ算出装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9346689A JPH11175083A (ja) 1997-12-16 1997-12-16 雑音らしさ算出方法および雑音らしさ算出装置

Publications (1)

Publication Number Publication Date
JPH11175083A true JPH11175083A (ja) 1999-07-02

Family

ID=18385156

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9346689A Pending JPH11175083A (ja) 1997-12-16 1997-12-16 雑音らしさ算出方法および雑音らしさ算出装置

Country Status (1)

Country Link
JP (1) JPH11175083A (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002076960A (ja) * 2000-08-31 2002-03-15 Toshiba Corp ノイズ抑制方法及び携帯電話
WO2004086362A1 (ja) * 2003-03-26 2004-10-07 Kabushiki Kaisha Kenwood 音声信号雑音除去装置、音声信号雑音除去方法及びプログラム
US7024354B2 (en) 2000-11-06 2006-04-04 Nec Corporation Speech decoder capable of decoding background noise signal with high quality
US7478042B2 (en) 2000-11-30 2009-01-13 Panasonic Corporation Speech decoder that detects stationary noise signal regions
JP2010520513A (ja) * 2007-03-05 2010-06-10 テレフオンアクチーボラゲット エル エム エリクソン(パブル) 定常的な背景雑音の平滑化を制御するための方法及び装置
JP2011007722A (ja) * 2009-06-29 2011-01-13 Yamatake Corp 計数装置、物理量センサ、計数方法および物理量計測方法
JP2016177176A (ja) * 2015-03-20 2016-10-06 沖電気工業株式会社 音声処理装置、プログラム及び方法、並びに、交換装置
KR20180111716A (ko) * 2018-08-02 2018-10-11 경북대학교 산학협력단 이식형 보청기 및 이의 저작음 잡음 제거 장치

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002076960A (ja) * 2000-08-31 2002-03-15 Toshiba Corp ノイズ抑制方法及び携帯電話
JP4533517B2 (ja) * 2000-08-31 2010-09-01 株式会社東芝 信号処理方法および信号処理装置
US7024354B2 (en) 2000-11-06 2006-04-04 Nec Corporation Speech decoder capable of decoding background noise signal with high quality
US7478042B2 (en) 2000-11-30 2009-01-13 Panasonic Corporation Speech decoder that detects stationary noise signal regions
WO2004086362A1 (ja) * 2003-03-26 2004-10-07 Kabushiki Kaisha Kenwood 音声信号雑音除去装置、音声信号雑音除去方法及びプログラム
JP2010520513A (ja) * 2007-03-05 2010-06-10 テレフオンアクチーボラゲット エル エム エリクソン(パブル) 定常的な背景雑音の平滑化を制御するための方法及び装置
JP2011007722A (ja) * 2009-06-29 2011-01-13 Yamatake Corp 計数装置、物理量センサ、計数方法および物理量計測方法
JP2016177176A (ja) * 2015-03-20 2016-10-06 沖電気工業株式会社 音声処理装置、プログラム及び方法、並びに、交換装置
KR20180111716A (ko) * 2018-08-02 2018-10-11 경북대학교 산학협력단 이식형 보청기 및 이의 저작음 잡음 제거 장치

Similar Documents

Publication Publication Date Title
US8275609B2 (en) Voice activity detection
US6526378B1 (en) Method and apparatus for processing sound signal
US9373343B2 (en) Method and system for signal transmission control
EP1855272B1 (en) Robust noise estimation
US7302065B2 (en) Noise suppressor
JP2008534989A (ja) 音声アクティビティ検出装置および方法
US5774836A (en) System and method for performing pitch estimation and error checking on low estimated pitch values in a correlation based pitch estimator
US9548064B2 (en) Noise estimation apparatus of obtaining suitable estimated value about sub-band noise power and noise estimating method
US20230402048A1 (en) Method and Apparatus for Detecting Correctness of Pitch Period
JP3105465B2 (ja) 音声区間検出方法
US20040006470A1 (en) Word-spotting apparatus, word-spotting method, and word-spotting program
US10819301B2 (en) Audio loudness control method and system based on signal analysis and deep learning
US5313553A (en) Method to evaluate the pitch and voicing of the speech signal in vocoders with very slow bit rates
JPH11175083A (ja) 雑音らしさ算出方法および雑音らしさ算出装置
US5696873A (en) Vocoder system and method for performing pitch estimation using an adaptive correlation sample window
CN110702986B (zh) 一种自适应信号搜索门限实时动态生成方法及系统
EP1096475A2 (en) Frequency warping for speaker recognition
WO1997031366A1 (en) System and method for error correction in a correlation-based pitch estimator
US20070150277A1 (en) Method and system for segmenting phonemes from voice signals
JP2000250568A (ja) 音声区間検出装置
JPWO2003107326A1 (ja) 音声認識方法及びその装置
EP1914720A1 (en) Information processing apparatus and method, program, and record medium
JPH10171487A (ja) 音声区間判別装置
CN113742635A (zh) 一种干扰背景下k分布形状参数自适应估计方法及其系统
CN115424626A (zh) 一种语音活性检测的方法及设备