JP4018571B2

JP4018571B2 - 音声強調装置

Info

Publication number: JP4018571B2
Application number: JP2003080517A
Authority: JP
Inventors: 政直鈴木; 正清田中; 恭士大田; 義照土永
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2003-03-24
Filing date: 2003-03-24
Publication date: 2007-12-05
Anticipated expiration: 2023-03-24
Also published as: JP2004289614A

Description

【０００１】
【発明の属する技術分野】
本発明は，送話者の音声を強調して、該音声を受話者に聞き易くする音声強調装置に関し、特に、送話者の音声の特性および受話者側の周囲雑音の特性の双方を考慮して送話者の音声を強調する音声強調装置に関する。
【０００２】
【従来の技術】
近年、携帯電話が普及し、様々な場所で使われている。携帯電話は静かな場所だけでなく、空港のロビーや駅のホームのような騒がしい環境で使用されることが多い。このため、受話者側の周囲の雑音によって、送話者の音声が受話者に聞き取りにくくなるという問題がある。
【０００３】
雑音環境下で送話者の音声を受話者に聞きやすくする最も簡単な方法は、雑音レベルに応じて音量を大きくすることである。ところが、音量を大きくし過ぎると、携帯電話のスピーカへの入力が過大になり音声が歪んでしまい、かえって音質が劣化する場合がある。
【０００４】
音質の劣化を防止し、音声の明瞭度を改善する方法として、音声をイコライザに入力し、周囲の雑音レベルに応じてイコライザの特性パラメータを制御し、該特性パラメータによりイコライザ処理された音声をスピーカから出力するものがある（例えば特許文献１参照）。
【０００５】
この従来技術によると、受話者側の端末のマイクから得られる信号（音声および雑音を含む。）が背景雑音区間であるか音声区間であるかが判定される。雑音区間の場合には、その雑音レベルが推定され、推定された雑音レベルに基づいて、イコライザの特性を制御するための制御信号が生成される。イコライザは、該制御信号に基づいて、イコライザの特性を決定する特性パラメータをテーブルから選択する。音声（復号音声）は、選択された特性パラメータにより構成されるイコライザによりイコライザ処理され、Ｄ／Ａ変換された後、スピーカから出力される。
【０００６】
【特許文献１】
特開平９−１３５１９４号公報
【０００７】
【発明が解決しようとする課題】
しかし、上記従来技術は、周囲の雑音レベルを考慮して、音声に対するイコライザ処理を適応的に変化させているものの、音声の特徴が考慮されていない。このため、音声の種類によっては明瞭度の改善効果が十分でないという問題があった。
【０００８】
本発明は、以上のような問題点を鑑みなされたものであり、その目的は、背景雑音および送話者の音声の双方の特性を考慮して音声を強調することにより、送話者の音声をさらに明瞭にして聞き易くすることにある。
【０００９】
【課題を解決するための手段】
前記目的を達成するために，本発明の第１の側面による音声強調装置は、入力される受話者側の信号から該受話者の周囲雑音の特性を推定する雑音推定部と、入力される送話者の音声信号から該音声の特性を求め、求めた該音声の特性および前記雑音推定部により推定された前記周囲雑音の特性の双方に基づいて前記送話者の音声の強調特性を求める強調特性決定部と、前記強調特性決定部により求められた前記強調特性に基づいて前記送話者の音声を強調して出力する音声強調部と、を備える。
【００１０】
本発明の第１の側面によると、受話者側の信号から該受話者の周囲雑音の特性が求められる。また、送話者の音声信号から該音声の特性が求められる。これら求められた周囲雑音の特性および音声の特性の双方に基づいて、送話者の音声の強調特性が求められ、該強調特性に基づいて音声が強調される。このように、周囲雑音（背景雑音）の特性だけでなく、送話者の音声の特性も考慮して、音声が強調されるので、より聞き易い音声を受話者に提供することができる。
【００１１】
また、本発明の第２の側面による音声強調装置は、入力される受話者側の信号から該受話者側の周囲雑音の特性を求める雑音推定部と、入力される送話者の音声信号を音源特性と声道特性とに分離する分離部と、前記声道特性から特徴情報を抽出する特徴抽出部と、前記声道特性、前記特徴情報、および前記周囲雑音の特性から前記声道特性を修正する声道特性修正部と、前記声道特性修正部からの修正声道特性と前記音源特性とを合成する合成部と、を備える。
【００１２】
本発明の第２の側面によると、送話者の音声が音源特性と声道特性とに分離され、声道特性の特徴および周囲雑音の特性を考慮して声道特性が強調処理される。これにより、周囲雑音（背景雑音）の特性だけでなく、送話者の音声の特性も考慮して音声が強調され、より聞き易い音声を受話者に提供することができる。
【００１３】
本発明の第３の側面による音声強調装置は、入力される受話者側の信号から該受話者側の周囲雑音の平均電力または該受話者側の周囲雑音の周波数スペクトルを求める雑音推定部と、入力される送話者の音声信号の現フレームから自己相関を求める自己相関算出部と、前記現フレームの自己相関を記憶し、過去フレームの自己相関を出力するバッファ部と、前記現フレームの自己相関と前記過去フレームの自己相関との加重平均を求める平均化処理部と、前記加重平均から逆フィルタ係数を算出する逆フィルタ係数算出部と、前記逆フィルタ係数により構成され、入力される前記送話者の音声信号の残差信号を出力する逆フィルタと、前記逆フィルタ係数から周波数スペクトルを算出するスペクトル算出部と、前記算出された周波数スペクトルからホルマント周波数およびホルマント振幅を推定するホルマント推定部と、前記算出された周波数スペクトル、前記ホルマント周波数、前記ホルマント振幅、および前記周囲雑音の平均電力または前記周囲雑音の周波数スペクトルから、前記算出された周波数スペクトルに対する増幅率を求める増幅率算出部と、前記増幅率に基づいて前記算出された周波数スペクトルを変化させ、変化された周波数スペクトルを求めるスペクトル強調部と、前記変化された周波数スペクトルから合成フィルタ係数を算出する合成フィルタ係数算出部と、前記合成フィルタ係数から構成され、入力される前記逆フィルタからの前記残差信号から出力音声信号を求める合成フィルタと、を備える。
【００１４】
本発明の第３の側面によると、送話者の音声信号に含まれる音源特性が、逆フィルタにより、残差信号として分離される。一方、スペクトル算出部により、送話者の音声信号の声道特性が求められる。また、増幅率算出部により、該声道特性の特徴および背景雑音の特性を考慮した増幅率が求められ、該増幅率により、声道特性を表すスペクトルが増幅（強調）される。強調された声道特性は、合成フィルタにより、音源特性である残差信号と合成され、出力音声として出力される。これにより、周囲雑音の特性だけでなく、送話者の音声の特性も考慮して音声が強調され、より聞き易い音声を受話者に提供することができる。
【００１５】
【発明の実施の形態】
本発明による音声強調装置では、送話者（送信者）側の音声を強調する際に、送話者の音声の特性および受話者（受信者）側の背景雑音の特性の双方が考慮されて、該送話者の音声が強調される。この音声の強調には、大きく２つの方式がある。図１（ａ）および（ｂ）はこれら２つの方式を示している、図１（ａ）に示す第１の方式は、受信者側において、送話者の音声を強調するものである。図１（ｂ）は、送話者側において、該送話者の音声を強調するものである。
【００１６】
以下では、第１の方式を採用する音声強調装置の実施の形態を第１から第３の実施の形態に示し、第２の方式を採用する音声強調装置の実施の形態を第４の実施の形態に示す。
【００１７】
＜第１の実施の形態＞
図２は、本発明の第１の実施の形態による音声強調装置の原理図である。この図２は、携帯電話システムなどの双方向通信において、考慮の対象となる周囲雑音の発生源側、すなわち受話者側端末（例えば携帯電話機）に本発明を適用した場合の原理図を示している。
【００１８】
この音声強調装置は、音声復号器４からの復号音声（強調前音声）が入力される音声強調部１、マイク９からのアナログ信号Ｓ２から得られたディジタル信号（送信信号（上り信号））が入力される雑音推定部３、音声復号器４および雑音推定部３からの信号に基づいて強調特性を決定する強調特性決定部２を備える。
【００１９】
送話者側端末（例えば携帯電話機）から送信され、受話者側端末に受信された符号化データＣ１は、音声復号器４に入力され、復号音声（強調前音声）として音声強調部１および強調特性決定部２に入力される。
【００２０】
一方、マイク９に入力されたアナログ信号Ｓ２（すなわち受話者の音声および／または受話者側の周囲雑音）は、Ａ／Ｄ変換器８によりディジタル信号に変換され、送信信号（上り信号）として、音声符号器７および雑音推定部３に入力される。
【００２１】
雑音推定部３は、上り信号が背景雑音区間であるか音声区間であるかを判定し、雑音区間の場合には、その雑音特性を推定し、該雑音特性を強調特性決定部２に与える。
【００２２】
強調特性決定部２は、復号音声（強調前音声）の特性および雑音特性の双方に基づいて強調特性を決定する。この強調特性は音声強調部１に入力され、音声強調部１は、強調特性に基づいて復号音声を強調処理し、強調した音声（強調後音声）をＤ／Ａ変換器５に与える。強調後音声は、Ｄ／Ａ変換器５によりアナログ信号に変換され、スピーカ６からアナログ信号Ｓ１として、受話者に出力される。
【００２３】
このように、受話者側において、受話者側端末のマイク９で収音された周囲雑音の性質が推定され、該周囲雑音の性質および送話者の音声（強調前音声）の性質の双方に応じて適応的に送話者の音声が強調される。周囲雑音の性質に加えて、送話者の音声の性質も考慮して、適応的に強調処理がなされるので、従来技術に比べて更に明瞭度の高い音声を受話者に提供することができる。また、受話者側端末に音声強調装置を設けることにより、送話者側が特別な方式ないし装置を用いなくても明瞭度の高い音声を受話者側端末で再生することができる。
【００２４】
次に、図３を参照して、本実施の形態による音声強調処理をより詳細に説明する。図３は、本発明の第１の実施の形態による音声強調装置の詳細な構成を示すブロック図である。図２の原理図と同じ構成要素には同じ符号を付している。
【００２５】
図２の音声強調部１は、逆フィルタ（例えばＦＩＲフィルタ）１１、ピッチ強調部１２、合成フィルタ（例えばＩＩＲフィルタ）１３、合成フィルタ係数算出部１４、およびスペクトル強調部１５を備える。図２の強調特性決定部２は、自己相関算出部２１、平均化処理部２２、バッファ部２３、逆フィルタ係数算出部２４、スペクトル算出部２５、ホルマント推定部２６、および増幅率算出部２７を備える。なお、音声強調部１および強調特性決定部２のこれら構成要素の分類は一例に過ぎず、他の分類も考え得る。例えば増幅率算出部２７が音声強調部１に属していてもよい。
【００２６】
遠端側端末からの符号化データＣ１は、音声復号器４に入力され、時間軸領域において、所定のサンプリング周波数でサンプリングされた振幅値を有する入力音声信号、すなわち復号音声ｘ₁(ｎ)に復号され、出力される。ここで、ｎは音声信号のサンプル番号であり、Ｌをフレーム長とすると、０≦ｎ＜Ｌの整数である。この復号音声ｘ₁(ｎ)は、逆フィルタ１１および自己相関算出部２１に入力される。
【００２７】
自己相関算出部２１、平均化処理部２２、および逆フィルタ係数算出部２４は、線形予測係数（ＬＰＣ：Linear Prediction Coefficient）を求める。
【００２８】
すなわち、まず、自己相関算出部２１は、入力された復号音声ｘ₁(ｎ)の自己相関ｒ(ｉ)を求める。ここで、パラメータｉは、ｐを後述する逆フィルタ１１のフィルタ次数とすると、０≦ｉ≦ｐの整数である。
【００２９】
自己相関ｒ(ｉ)は平均化処理部２２に入力される。自己相関ｒ(ｉ)を逆フィルタ係数算出部２４に直接入力して、逆フィルタ係数を求めることもできるが、本実施の形態では、自己相関の時間的ばらつきを小さくするために、自己相関ｒ(ｉ)を平均化処理部２２に入力し、過去の自己相関を用いて平均化することとする。すなわち、平均化処理部２２は、現フレームの自己相関ｒ(ｉ)を、バッファ部２３に記憶された過去の自己相関ｒ_old(ｉ)を用いて平均化し、平均自己相関ｒ_ave(ｉ)を求める。平均化の方法としては、例えば次式（１）に示す加重平均を用いることができる。
【００３０】
【数１】

【００３１】
ここで、過去の自己相関ｒ_old(ｉ)は、前フレームにおいて自己相関算出部２１により求められた自己相関を用いることもできるし、前フレームにおいて平均化処理部２２により求められた平均自己相関を用いることもできる。図３は、後者が用いられる場合の構成を示している。また、ｗは重み付け係数であり、０＜ｗ＜１の任意の値（例えばｗ＝０．９等）である。
【００３２】
平均化処理部２２により求められた平均自己相関ｒ_ave(ｉ)は、逆フィルタ係数算出部２４に入力されると共に、次のフレームの平均自己相関の算出に使用するために、バッファ部２３に記憶される。すなわち、次フレームでは、現在のフレームで記憶された平均自己相関ｒ_ave(ｉ)がｒ_old(ｉ)としてバッファ２３から読み出される。なお、バッファ部２３は、前述したように、平均自己相関ｒ_ave(ｉ)に代えてｒ(ｉ)を保持してもよい。
【００３３】
逆フィルタ係数算出部２４は、入力された平均自己相関ｒ_ave(ｉ)に基づいて、レビンソン・アルゴリズム等の公知の方法により逆フィルタ係数α₁(ｉ)を求め、逆フィルタ１１およびスペクトル算出部２５に与える。
【００３４】
逆フィルタ１１の伝達関数は以下の式（２）で表される。
【００３５】
【数２】

【００３６】
逆フィルタ１１は、音声復号器４からの復号音声ｘ₁(ｎ)および逆フィルタ係数算出部２４からの逆フィルタ係数α₁(ｉ)に基づいて残差信号ｒ₁(ｎ)を求め、ピッチ強調部１２に与える。この残差信号ｒ₁(ｎ)は、復号音声から声道特性が除去された残りの信号、すなわち音源特性の信号である。一方、後述するスペクトル算出部２５から出力されるスペクトルｓｐ₁(ｌ)は、声道特性の信号である。したがって、自己相関算出部２１、平均化処理部２２、逆フィルタ係数算出部２４、および逆フィルタ１１による一連の処理により、復号音声ｘ₁(ｎ)は、音源特性と声道特性とに分離される。そして、音源特性および声道特性が、それぞれ個別に、以下に述べる後段の処理により強調される。
【００３７】
ピッチ強調部２２は、残差信号ｒ₁(ｎ)から、ピッチ性が強調された新たな残差信号ｒ₂(ｎ)を求める。これにより、音源特性が強調される。すなわち、ピッチ強調部１２は、音源特性強調部として機能する。ピッチ強調の方法は任意であるが、例えば、以下の式（３）の伝達関数で表されるピッチ強調フィルタを用いることができる。ここで、Ｔはピッチ周期であり、ｒ_pitは残差信号ｒ₁(ｎ)から求めたＴ次の残差自己相関値である。また、ｇ_pは重み付け係数である。
【００３８】
【数３】

【００３９】
図５（ａ）は、ピッチ強調前の残差信号ｒ₁(ｎ)の波形例を示し、同図（ｂ）は、ピッチ強調後の残差信号ｒ₂(ｎ)の波形例を示している。横軸は時間を表し、縦軸は振幅を表している。このように、ピッチ強調前の残差信号ｒ₁(ｎ)のパルスないしスパイク状の部分の振幅が増幅され、これにより音源特性が強調される。
【００４０】
図３に戻って、スペクトル算出部２５は、逆フィルタ係数α₁(ｉ)に基づいてフーリエ変換を行い、周波数スペクトルｓｐ₁(ｌ)を求める。周波数スペクトルｓｐ₁(ｌ)を求める式を以下の式（４）に示す。ここで、パラメータｌ（アルファベット小文字エル）は、０≦ｌ＜Ｎ_Fの整数であり、Ｎ_Fはスペクトル点数である。
【００４１】
【数４】

【００４２】
図６（ａ）は、音声の周波数スペクトルの一例を示している。横軸は周波数を表し、縦軸は電力を表している。この図に示すように、音声の周波数スペクトルには、一般に、ピークが存在し、このピークはホルマントと呼ばれる。周波数の低い方から順に第１ホルマント、第２ホルマント、第３ホルマントと呼ばれ、各ホルマントのピーク周波数ｆｐ(１)、ｆｐ(２)、ｆｐ(３)はホルマント周波数と呼ばれる。
【００４３】
なお、スペクトルｓｐ₁(ｌ)を、現フレームの音声から算出されるＬＰＣスペクトルと、過去の音声から算出されるＬＰＣスペクトルの加重平均として算出することもできるし、現フレームの音声から算出されるＦＦＴスペクトルと、過去の音声から算出されるＦＦＴスペクトルの加重平均として算出することもできる。
【００４４】
スペクトル算出部２５により求められた周波数スペクトルｓｐ₁(ｌ)は、ホルマント推定部２６およびスペクトル強調部１５に入力される。
【００４５】
ホルマント推定部２６は、入力された周波数スペクトルｓｐ₁(ｌ)からホルマント周波数ｆｐ(ｋ)および各周波数におけるホルマントの電力（振幅値）ａｍｐ(ｋ)を求める。ここで、パラメータｋは、ホルマントを表すインデックスであり、ｋ_maxをホルマントの個数とすると、１≦ｋ≦ｋ_maxの整数である。例えば、後述する図７におけるｆｐ(１)＝Ｆ(１)は第１ホルマルトの周波数を表す。なお、電話帯域音声（サンプリング周波数８ｋＨｚ）の場合には、ｋ_max＝4または５とすることができる。ホルマント推定の方法としては、ピークピッキング法などの公知の技術を用いることができる。
【００４６】
ホルマント推定部２６は、ホルマント周波数を、以下の式（５）に基づいて、離散データである離散ホルマント周波数ｆｐｌ(ｋ)に変換し、スペクトルｓｐ１(ｆｐｌ(ｋ))のホルマント振幅ａｍｐ(ｋ)を求める。
【００４７】
【数５】

【００４８】
ここで、int[ｘ]は、ｘを整数化する演算である。
【００４９】
ホルマント周波数ｆｐ(ｋ)およびホルマント振幅ａｍｐ(ｋ)は、増幅率算出部３８に入力される。
【００５０】
一方、受話者側端末のマイク９に入力したアナログ信号Ｓ２が、Ａ／Ｄ変換器８によりディジタル信号ｙ(ｎ)に変換され、音声符号器７および雑音推定部３に入力される。この信号ｙ(ｎ)には、近端側ユーザの音声や該ユーザの周囲の雑音（背景雑音）などが含まれる。
【００５１】
雑音推定部３は、ディジタル信号ｙ(ｎ)に基づいて周囲雑音のレベルＮ_Lを推定する。まず、雑音推定部３は、信号ｙ(ｎ)が音声区間であるのか、雑音区間（非音声区間）であるのかを検出する。この検出方法は任意であり、例えばＩＴＵ−Ｔ勧告Ｇ．７２９のＡｎｎｅｘ−Ｂに記載されているＶＡＤ（Voice Activity Detector）等の公知の技術を用いることができる。
【００５２】
この音声区間／非音声区間の判定により非音声区間であると判定された場合、雑音推定部３は、信号ｙ(ｎ)の非音声区間の平均電力（すなわち背景雑音電力）Ｎ_Lを計算し、増幅率算出部２７に与える。また、音声区間であると判定された場合、雑音推定部３は、過去のフレームで計算された最新の背景雑音電力Ｎ_Lを増幅率算出部２７に与える。
【００５３】
増幅率算出部２７は、背景雑音電力Ｎ_L，ホルマント周波数ｆｐ(ｋ)，ホルマント振幅ａｍｐ(ｋ)，およびスペクトルｓｐ₁(ｌ)に基づいて、スペクトルｓｐ₁(ｌ)に対する増幅率β(ｌ)を求める。この処理を、以下に詳述する。
【００５４】
図４は、増幅率算出部２７の詳細な構成を示すブロック図である。増幅率算出部２７は、基準電力算出部２７ａ、ホルマント増幅率算出部２７ｂ、補間関数算出部２７ｃ、極小点決定部２７ｄ、増幅率算出部２７ｅ、雑音レベル比算出部２７ｆ、および増幅率修正部２７ｇを備える。
【００５５】
増幅率算出部の処理は、（ａ）基準電力の算出、（ｂ）ホルマント増幅率の算出、（ｃ）増幅率の補間の順に行われる。以下、各処理について順に説明する
基準電力算出部２７ａは、スペクトルｓｐ₁(ｌ)から基準電力Pow_refを算出し、算出した基準電力Pow_refをホルマント増幅率算出部２７ｂに与える。この基準電力Pow_refとしては、全周波数帯域の平均電力や低域周波数の平均電力を用いることができる。全周波数帯域の平均電力を基準電力として用いる場合、Pow_refは次式（６）で表される。
【００５６】
【数６】

【００５７】
ホルマント増幅率算出部２７ｂは、ホルマントＦ(ｋ)の振幅を基準電力Pow_refに合わせるための増幅率（ホルマント増幅率）Ｇ(ｋ)を次式（７）により求める。
【００５８】
【数７】

【００５９】
図７は、スペクトル強調処理の説明図である。この図７では、第１ホルマントＦ(１)を基準電力Pow_refにするために、ホルマント増幅率Ｇ(１)（＝Pow_ref÷ａｍｐ(１)）が求められる。第２〜第４ホルマントについても同様に、ホルマント増幅率Ｇ(２)〜Ｇ(４)がそれぞれ求められる。
【００６０】
求められたホルマント増幅率は、補間関数算出部２７ｃおよび極小点決定部２７ｄに与えられる。
【００６１】
極小点決定部２７ｄは、ホルマント間の周波数における増幅率β₀(ｌ)を補間曲線Ｒ(ｋ，ｌ)により求める。補間曲線Ｒ(ｋ，ｌ)の形状は任意であり、例えば１次関数や２次関数などを用いることができる。図８は、補間曲線として２次関数を用いた場合の例を示す。２時関数の補間曲線Ｒ(ｋ，ｌ)は次式（８）で定義される。ここで、ａ，ｂ，ｃは補間曲線の形状を決定するパラメータである。
【００６２】
【数８】

【００６３】
続いて、極小点決定部２７ｄは、隣接する２つのホルマントＦ(ｋ)およびＦ(ｋ＋１)の間における増幅率の極小点を設定する。ここで、極小点の設定方法は任意であるが、例えば周波数ｆ_min＝（ｆｐｌ(ｋ)＋ｆｐｌ(ｋ＋１)）／２を極小点の周波数とし、γ・Ｇ(ｋ)を該極小点における増幅率と設定することができる。ここで、γは定数であり、０＜γ＜１である。このようにして求められた極小点の座標（ｆ_min，γ・Ｇ(ｋ)）は、補間関数算出部２７ｃに与えられる。
【００６４】
補間関数算出部２７ｃは、補間曲線Ｒ(ｋ，ｌ)がホルマントＦ(ｋ)およびＦ(ｋ＋１)ならびに極小点を通ると仮定して、上記式（８）を解くことによりパラメータａ，ｂ，ｃを求める。これにより、補間曲線Ｒ(ｋ，ｌ)が決定される。決定された補間曲線Ｒ(ｋ，ｌ)は、増幅率算出部２７ｅに与えられる。
【００６５】
増幅率算出部２７ｅは、補間曲線Ｒ(ｋ，ｌ)に基づいて、ホルマントＦ(ｋ)とＦ(ｋ＋１)との間のスペクトルに対する増幅率β₀(ｌ)を求め、求めた増幅率β₀(ｌ)を増幅率修正部２７ｇに与える。
【００６６】
一方、雑音レベル比算出部２７ｆは、あらかじめ設定された基準雑音レベルをＮ_L,0に対する雑音レベルＮ_Lの比ＮＲ＝Ｎ_L／Ｎ_L,0を求め、求めた比ＮＲを増幅率修正部２７ｇに与える。
【００６７】
増幅率修正部２７ｇは、比ＮＲ（背景雑音レベルＮ_L）に応じて、増幅率β₀(ｌ) を修正し、修正増幅率β(ｌ)を算出する。修正式は、次式（９）により与えられる。
【００６８】
【数９】

【００６９】
すなわち、増幅率は、背景雑音が大きい場合には大きくなり、背景雑音が小さい場合には小さくなるように修正される。
【００７０】
増幅率算出部２７は、上記処理を、全てのホルマントに対して行う。なお、第１ホルマントよりも低い周波数については、第１ホルマントに対する増幅率Ｇ(１)を用いることができる。また、最高次のホルマントよりも高い周波数については、最高次のホルマントに対する増幅率Ｇ(ｋ_max)を用いることができる。隣接する２つのホルマントの間の周波数においては、前記増幅率β(ｌ)を用いることができる。
【００７１】
図３に戻って、修正増幅率β(ｌ)は、スペクトル強調部１５に入力される。スペクトル強調部１５は、増幅率算出部２７から与えられた修正増幅率β(ｌ)およびスペクトル算出部２５から与えられたスペクトルｓｐ₁(ｌ)に基づいて、以下の式（１０）により、強調されたスペクトルｓｐ₂(ｌ)を求める。
【００７２】
【数１０】

【００７３】
図６（ｂ）は、周波数スペクトルの強調（ホルマント強調）の原理説明図である。破線のグラフが強調前の周波数スペクトルであり、実線のグラフが強調後の周波数スペクトルである。一般に、高次のホルマントを強調することにより、音声の明瞭度を改善することができる。スペクトル強調部１５の処理により、雑音特性を考慮して、高次のホルマントの電力が増幅され、強調される。これにより、雑音特性を考慮した声道特性の強調が行われる。
【００７４】
図３に戻って、強調されたスペクトルｓｐ₂(ｌ)は、合成フィルタ係数算出部１４に入力される。合成フィルタ係数算出部１４は、スペクトルｓｐ₂(ｌ)の逆フーリエ変換から自己相関を求め、前記自己相関からレビンソン・アルゴリズム等の公知の方法により合成フィルタ係数α₂(ｉ)を求める。ここで、パラメータｉは、前述したように、１≦ｉ≦ｐの整数である。合成フィルタ係数α₂(ｉ)は、合成フィルタ１３に入力される。
【００７５】
合成フィルタ係数α₂(ｉ)により構成される合成フィルタ１３は、ピッチ強調部１２からの残差信号ｒ₂(ｎ)から、音源特性および声道特性ともに強調された音声ｘ₂(ｎ)を求める。ここで、パラメータｎは、０≦ｎ＜Ｎの整数であり、合成フィルタの伝達関数は式（１１）である。
【００７６】
【数１１】

【００７７】
音声ｘ₂(ｎ)は、Ｄ／Ａ変換器５によりアナログ信号に変換され、スピーカ６から音声信号Ｓ１として出力される。
【００７８】
以上説明の通り、本実施の形態によれば、音声を逆フィルタ１１により声道特性と音源特性とに分離し、音声の特徴に応じて各特性を個別に強調することにより音声の明瞭度を向上させることができる。さらに、マイクで収録された周囲の雑音レベルに応じて増幅率を適応的に制御することにより、強調された音声の明瞭度を更に向上させることができる。
【００７９】
＜第２の実施の形態＞
上記本発明の第１の実施の形態における雑音推定部３は背景雑音電力Ｎ_Lを出力するが、背景雑音推定部として、背景雑音スペクトルを出力するものを使用することができる。本発明の第２の実施の形態では、背景雑音推定部として、背景雑音スペクトルを出力するものが使用される。
【００８０】
図９は、本発明の第２の実施の形態による音声強調装置の詳細な構成を示すブロック図である。背景雑音スペクトルを出力する雑音推定部３０が使用されることにより、図３の増幅率算出部２７も、図９では背景雑音スペクトルを処理する増幅率算出部２７０に置換される。それ以外の構成要素は、図３に示すものと同じであるので、同じ符号を付し、その説明を省略することとする。
【００８１】
図３の音声強調装置では、全周波数で共通の背景雑音レベルＮ_Lを用いて増幅率β₀(ｌ)が修正されるのに対し、図９の音声強調装置では、背景雑音の周波数スペクトルＮ_sp(ｌ)を用いて増幅率β₀(ｌ)が修正される。
【００８２】
図１０は、雑音推定部３０の詳細な構成を示すブロック図である。雑音推定部３０は、音声／非音声区間判定部３０ａ、フーリエ変換部３０ｂ、スペクトル算出部３０ｃ、およびバッファ部３０ｄを備える。
【００８３】
音声／非音声区間判定部３０ａには、図９のＡ／Ｄ変換器８から信号ｙ(ｎ)が入力される。音声／非音声区間判定部３０ａは、入力された信号ｙ(ｎ)が音声区間であるか、非音声区間であるかを判別し、その判定結果をフーリエ変換部３０ｂおよびスペクトル算出部３０ｃに出力する。
【００８４】
フーリエ変換部３０ｂは、判定結果が非音声区間の場合、信号ｙ(ｎ)のフーリエ変換を求め、フーリエ変換結果をスペクトル算出部３０ｃに与える。スペクトル算出部３０ｃは、フーリエ変換結果から雑音スペクトルＮ_sp(ｌ)を求めて、図９の増幅率算出部２７０に与えると共に、バッファ部３０ｄに記憶する。ここで、０≦ｌ＜Ｎ_Fである。一方、スペクトル算出部３０ｃは、判定結果が音声区間の場合、バッファ部３０ｄに記憶された最新のＮ_sp(ｌ)を雑音スペクトルとして用い、これを増幅率算出部２７０に出力する。この時、バッファ部３０ｄの更新は行われない。つまり、スペクトル算出部３０ｃは、常に最新の雑音スペクトルがバッファ部３０ｄに保持されるように動作する。
【００８５】
図９に戻って、増幅率算出部２７０は、雑音推定部３０からの雑音スペクトルＮ_sp(ｌ)に基づいて増幅率β(ｌ)を算出する。図１１は、増幅率算出部２７０の詳細な構成を示すブロック図である。図４に示す増幅率算出部と異なる点は、図４の雑音レベル比算出部２７ｆが、背景雑音の周波数スペクトルＮ_sp(ｌ)が入力される雑音レベル比算出部２７０ｆに置換され、また、図４の増幅率修正部２７ｇが、基準雑音レベルＮ_sp,0(ｌ)に対する雑音周波数スペクトルＮ_sp(ｌ)の比ＮＲ_sp(ｌ)が入力される増幅率修正部２７０ｇに置換されている点である。それ以外の構成要素は、図４に示すものと同じであるので、それらの説明を省略することとする。
【００８６】
雑音レベル比算出部２７０ｆは、基準雑音レベルＮ_sp,0(ｌ)に対する雑音周波数スペクトルＮ_sp(ｌ)の比ＮＲ_sp(ｌ)＝Ｎ_sp(ｌ)／Ｎ_sp,0(ｌ)を求め、増幅率修正部２７０ｇに与える。
【００８７】
増幅率修正部２７０ｇは、雑音レベル比算出部２７０ｆからの比ＮＲ_sp(ｌ)および増幅率算出部２７ｅからの増幅率β₀(ｌ)に基づいて、修正増幅率β(ｌ)を算出する。算出式は次式（１２）の通りである。
【００８８】
【数１２】

【００８９】
すなわち、背景雑音が大きい場合には修正増幅率β(ｌ)が大きくなり、背景雑音が小さい場合には修正増幅率β(ｌ)が小さくなるように制御される。また、背景雑音のスペクトルを用いることにより周波数帯域毎の制御が可能となるため、図４に示すものと比べて、さらに細かく増幅率を修正することが可能となり、音声の明瞭度をさらに高めることができる。
【００９０】
図９に戻って、修正増幅率β(ｌ)はスペクトル強調部１５に入力され、以後、前述した第１の実施の形態と同様に処理される。
【００９１】
本実施の形態では、上述したように、さらに細かく増幅率を修正することが可能となり、音声の明瞭度をさらに改善することができる。
【００９２】
＜第３の実施の形態＞
音源特性を強調するピッチ強調部においても、雑音特性を考慮した強調を行うことができる。第３の実施の形態は、音源特性の強調を雑音特性を考慮して行うものである。
【００９３】
図１２は、本発明の第３の実施の形態による音声強調装置の詳細な構成を示すブロック図である。図３に示す第１の実施の形態による音声強調装置と同じ構成要素には同じ符号を付し、その説明を省略することとする。
【００９４】
図１２では、雑音推定部３の出力である背景雑音レベルＮ_Lが増幅率算出部２７だけでなく、ピッチ強調部３へも入力される点が図３と異なっており、これにより、図３のピッチ強調部１２が、図１２ではピッチ強調部１２０に置換されている。その他の部分は図３と同じである。したがって、以下では、ピッチ強調部１２０の処理について説明する。
【００９５】
雑音推定部３により求められた雑音レベル比ＮＲ（＝Ｎ_L／Ｎ_L,0）は、ピッチ強調部１２０にも入力される。ピッチ強調部１２０は、比ＮＲの値に応じて以下の式（１３）によりピッチ強調フィルタの特性を変化させる。
【００９６】
【数１３】

【００９７】
ここで、ｇ_pは、第１の実施の形態で説明した通り、ピッチ強調フィルタの伝達関数（式（３））の重み付け係数である。この重み付け係数ｇ_pが、雑音レベル比ＮＲを考慮した重み付け係数ｇ_p´に修正され、この修正された重み付け係数ｇ_p´が上記式（３）の重み付け係数ｇ_pに代わって使用される。
【００９８】
これにより、基準雑音レベルＮ_L,0よりも雑音レベルが大きい場合には、ピッチ強調フィルタの重み付け係数ｇ_p´はｇ_pよりも大きくなり、ピッチ性を強くするように、音源特性が強調される。ピッチ性を強くすることにより、母音がはっきりと聞こえるため、音声の明瞭度が改善できる。一方、基準雑音レベルＮ_L,0よりも雑音レベルが小さい場合には、重み付け係数ｇ_p´はｇ_pよりも小さくなる。これにより、周囲の雑音レベルが小さい場合には、ピッチ強調の度合いが弱められ、ピッチ強調を強くし過ぎした場合に生じる音質劣化を防ぐことができる。
【００９９】
以上説明の通り、本実施の形態ではピッチ強調の度合いを背景雑音レベルに応じて変化させることにより、第１の実施の形態に比べて母音部の明瞭度をさらに改善することができる。
【０１００】
＜第４の実施の形態＞
図１３は、本発明の第４の実施の形態による音声強調装置の原理図である。この図１３は、携帯電話システムなどの双方向通信において、強調の対象となる音声の送信者（送話者）側の端末（例えば携帯電話機）に本発明を適用した場合の原理図を示している。したがって、送話者側の端末において、送話者の音声および受話者側の周囲雑音を考慮した音声の強調処理がなされる。
【０１０１】
この音声強調装置において、図２に示す第１の実施の形態と同じ構成要素には同じ符号を付している。
【０１０２】
符号化データＣ２は、近端側端末から送信され、遠端側（すなわち送信者側）端末に受信された音声信号（下り信号）である。この音声信号には、近端側（すなわち受信者側）ユーザの音声および近端側の背景雑音が含まれる。この符号化データＣ２は、音声復号器４から復号音声（強調前音声）として、Ｄ／Ａ変換器５および雑音推定部３に入力される。この受信された音声信号が雑音推定部３に入力される点が、第１の実施の形態と異なる。
【０１０３】
雑音推定部３では、下り信号に基づいて雑音特性が求められる。すなわち、近端側ユーザの背景雑音の特性が求められる。強調特性決定部２は、この雑音特性に基づいて強調特性を求め、求めた強調特性を音声強調部１に与える。
【０１０４】
一方、音声強調部１には、マイク９およびＡ／Ｄ変換器９を介して、送話者の音声（強調前音声）が入力される。音声強調部１は、送話者の強調前音声を、強調特性決定部２から入力される強調特性に基づいて強調し、強調された音声（強調後音声）を音声符号器７に出力する。この強調後音声は、音声符号器７に符号化され、符号化データＣ１として、近端側端末に送信される。
【０１０５】
このように、遠端側においても、近端側端末から送信された周囲雑音の性質が推定され、該周囲雑音の性質および送話者音声（強調前音声）の性質の双方に応じて適応的に音声を強調した後、強調後音声を近端側端末に送信することができる。これにより、従来技術に比べて更に明瞭度の高い音声を受話者に提供することができる。また、本実施の形態では、遠端側に音声強調装置を設けることにより、近端側が特別な方式ないし装置を用いなくても明瞭度の高い音声を近端側端末で再生することができる。
【０１０６】
図１４は、本発明の第４の実施の形態による音声強調装置の詳細な構成を示すブロック図である。図１３の原理図と同じ構成要素および図３に示す第１の実施の形態の音声強調装置と同じ構成要素には同じ符号を付している。
【０１０７】
図１４と図３を比較することにより明らかなように、音声強調部１および強調特性部２は同じ構成であり、各構成要素が行う処理内容も同じである。したがって、ここではその説明を省略することとする。
【０１０８】
このように、本実施の形態によっても、音声を逆フィルタにより声道特性と音源特性とに分離し、音声の特徴に応じて各特性を個別に強調することにより音声の明瞭度を向上させることができる。さらに、相手側から送られてきた符号化データを復号して得られる復号音声から、相手側ユーザの周囲雑音レベルを求め、前記周囲雑音レベルに応じて増幅率を適応的に制御することにより、自分が発声した音声を相手側で最も聞き取りやすくなるように強調処理することが可能となり、従来技術に比べて音声の明瞭度を更に向上させることができる。
【０１０９】
この第４の実施の形態においても、上記第２の実施の形態のように、雑音推定部３を、背景雑音スペクトルＮ_sp(ｌ)を出力するものに置換することができる。また、第３の実施の形態のように、雑音推定部３の雑音レベルをピッチ強調部に入力し、雑音特性を考慮したピッチ強調を行うこともできる。
【０１１０】
なお、上記第１から第４の実施の形態は、例示であって、本発明の技術的範囲を限定するものではない。また、本発明については、本発明の精神および範囲内において、種々の変更ないし変形が考えられることはいうまでもない。さらに、本発明は、携帯電話だけでなく、有線の電話機、他の無線通信機器等の種々の通信機器に適用することができる。
【０１１１】
（付記１）入力される受話者側の信号から該受話者の周囲雑音の特性を推定する雑音推定部と、
入力される送話者の音声信号から該音声の特性を求め、求めた該音声の特性および前記雑音推定部により推定された前記周囲雑音の特性の双方に基づいて前記送話者の音声の強調特性を求める強調特性決定部と、
前記強調特性決定部により求められた前記強調特性に基づいて前記送話者の音声を強調して出力する音声強調部と、
を備える音声強調装置。
【０１１２】
（付記２）付記１において、
前記雑音推定部、前記強調特性決定部、および前記音声強調部が、受話者側の通信端末に設けられる、音声強調装置。
【０１１３】
（付記３）付記１において、
前記雑音推定部、前記強調特性決定部、および前記音声強調部が、送話者側の通信端末に設けられる、音声強調装置。
【０１１４】
（付記４）付記１から３のいずれか１つにおいて、
前記雑音推定部により推定される前記周囲雑音の特性は、該周囲雑音の平均電力である、音声強調装置。
【０１１５】
（付記５）付記４において、
前記雑音推定部は、前記受話者側の信号から音声区間と雑音区間を識別し、前記受話者側の信号が前記雑音区間である場合に、前記雑音区間の信号の平均電力を前記周囲雑音の特性とし、前記受話者側の信号が前記音声区間である場合には、直前の雑音区間の信号の平均電力を前記周囲雑音の特性とする、
音声強調装置。
【０１１６】
（付記６）付記１から３のいずれか１つにおいて、
前記雑音推定部により推定される前記周囲雑音の特性は、該周囲雑音の周波数スペクトルである、音声強調装置。
【０１１７】
（付記７）付記６において、
前記雑音推定部は、前記受話者側の信号から音声区間と雑音区間を識別し、前記受話者側の信号が前記雑音区間である場合に、前記雑音区間の信号の周波数スペクトルを前記周囲雑音の特性とし、前記受話者側の信号が前記音声区間である場合には、直前の雑音区間の信号の周波数スペクトルを前記周囲雑音の特性とする、
音声強調装置。
【０１１８】
（付記８）付記１において、
前記強調特性決定部は、
前記送話者の音声信号を音源特性と声道特性とに分離する分離部と、
前記声道特性から特徴情報を抽出する特徴抽出部と、
を備え、
前記音声強調部は、
前記声道特性、前記特徴情報、および前記周囲雑音の特性から前記声道特性を修正する声道特性修正部と、
前記声道特性修正部からの修正声道特性と前記音源特性とを合成する合成部と、
を備える音声強調装置。
【０１１９】
（付記９）入力される受話者側の信号から該受話者側の周囲雑音の特性を求める雑音推定部と、
入力される送話者の音声信号を音源特性と声道特性とに分離する分離部と、
前記声道特性から特徴情報を抽出する特徴抽出部と、
前記声道特性、前記特徴情報、および前記周囲雑音の特性から前記声道特性を修正する声道特性修正部と、
前記声道特性修正部からの修正声道特性と前記音源特性とを合成する合成部と、
を備える音声強調装置。
【０１２０】
（付記１０）付記９において、
前記分離部は、前記送話者の音声信号を線形予測分析して得られる線形予測係数により構成されるフィルタである、
音声強調装置。
【０１２１】
（付記１１）付記１０において、
前記線形予測係数は、前記送話者の音声信号から算出した自己相関の平均から求められる、音声強調装置。
【０１２２】
（付記１２）付記１０において、
前記線形予測係数は、前記入力される送話者の音声信号の現フレームから算出した自己相関と、過去のフレームから算出した自己相関との加重平均から求められる、音声強調装置。
【０１２３】
（付記１３）付記９において、
前記声道特性は、前記送話者の音声信号を線形予測分析して得られる線形予測係数から算出される線形予測スペクトルまたは前記送話者の音声信号のフーリエ変換から求められるパワースペクトルである、音声強調装置。
【０１２４】
（付記１４）付記９において、
前記特徴抽出部は、前記送話者の音声信号を線形予測分析して得られる線形予測係数または前記送話者の音声信号のフーリエ変換から求められるパワースペクトルからホルマント周波数およびホルマント振幅を求める、音声強調装置。
【０１２５】
（付記１５）付記１４において、
前記雑音推定部は、前記周囲雑音の平均電力を前記周囲雑音の特性として求め、
前記声道特性修正部は、前記ホルマント振幅の平均振幅を求め、前記平均振幅および前記周囲雑音の平均電力に基づいて、前記ホルマント振幅を変化させる、
音声強調装置。
【０１２６】
（付記１６）付記１４において、
前記雑音推定部は、前記周囲雑音の周波数スペクトルを前記周囲雑音の特性として求め、
前記声道特性修正部は、前記ホルマント振幅の平均振幅を求め、前記平均振幅および前記周囲雑音の周波数スペクトルに基づいて、前記ホルマント振幅を変化させる、
音声強調装置。
【０１２７】
（付記１７）付記９において、
前記雑音推定部は、前記周囲雑音の平均電力を前記周囲雑音の特性として求め、
前記声道特性修正部は、前記送話者の音声信号を線形予測分析して得られる線形予測係数から算出される線形予測スペクトルまたは前記送話者の音声信号のパワースペクトルの平均振幅を求め、該平均振幅および前記周囲雑音の平均電力に基づいて、前記ホルマント振幅または前記ホルマントのバンド幅を変化させる、
音声強調装置。
【０１２８】
（付記１８）付記９において、
前記雑音推定部は、前記周囲雑音の周波数スペクトルを前記周囲雑音の特性として求め、
前記声道特性修正部は、前記送話者の音声信号を線形予測分析して得られる線形予測係数から算出される線形予測スペクトルまたは前記送話者の音声信号のパワースペクトルの平均振幅を求め、前記平均振幅および前記周囲雑音の周波数スペクトルに基づいて、前記ホルマント振幅または前記ホルマントのバンド幅を変化させる、
音声強調装置。
【０１２９】
（付記１９）付記９において、
前記音源特性である残差信号に対してピッチ強調を行うビッチ強調部をさらに備える、音声強調装置。
【０１３０】
（付記２０）付記１９において、
前記雑音推定部は、前記周囲雑音の平均電力を前記周囲雑音の特性として求め、
前記ピッチ強調部は、前記雑音推定部の前記周囲雑音の平均電力に基づいてピッチ強調の度合いを変化させる、
音声強調装置。
【０１３１】
（付記２１）入力される受話者側の信号から該受話者側の周囲雑音の平均電力または該受話者側の周囲雑音の周波数スペクトルを求める雑音推定部と、
入力される送話者の音声信号の現フレームから自己相関を求める自己相関算出部と、
前記現フレームの自己相関を記憶し、過去フレームの自己相関を出力するバッファ部と、
前記現フレームの自己相関と前記過去フレームの自己相関との加重平均を求める平均化処理部と、
前記加重平均から逆フィルタ係数を算出する逆フィルタ係数算出部と、
前記逆フィルタ係数により構成され、入力される前記送話者の音声信号の残差信号を出力する逆フィルタと、
前記逆フィルタ係数から周波数スペクトルを算出するスペクトル算出部と、
前記算出された周波数スペクトルからホルマント周波数およびホルマント振幅を推定するホルマント推定部と、
前記算出された周波数スペクトル、前記ホルマント周波数、前記ホルマント振幅、および前記周囲雑音の平均電力または前記周囲雑音の周波数スペクトルから、前記算出された周波数スペクトルに対する増幅率を求める増幅率算出部と、
前記増幅率に基づいて前記算出された周波数スペクトルを変化させ、変化された周波数スペクトルを求めるスペクトル強調部と、
前記変化された周波数スペクトルから合成フィルタ係数を算出する合成フィルタ係数算出部と、
前記合成フィルタ係数から構成され、入力される前記逆フィルタからの前記残差信号から出力音声信号を求める合成フィルタと、
を備える音声強調装置。
【０１３２】
（付記２２）付記２１において、
前記逆フィルタからの残差信号が入力され、該残差信号のピッチ強調を行い、ピッチ強調された残差信号を前記合成フィルタに出力するピッチ強調部をさらに備える、音声強調装置。
【０１３３】
（付記２３）付記２２において、
前記ピッチ強調部は、前記受話者側の周囲雑音の平均電力に基づいてピッチ強調の度合いを変化させる、音声強調装置。
【０１３４】
【発明の効果】
本発明によると，周囲雑音（背景雑音）の特性だけでなく、送話者の音声の特性も考慮して、音声が強調されるので、より聞き易い音声を受話者に提供することができる。
【図面の簡単な説明】
【図１】（ａ）は音声強調を受信者側で行う方式を示し、（ｂ）は音声強調を送信者側で行う方式を示す。
【図２】本発明の第１の実施の形態による音声強調装置の原理図である。
【図３】本発明の第１の実施の形態による音声強調装置の詳細な構成を示すブロック図である。
【図４】本発明の第１の実施の形態による音声強調装置の増幅率算出部の詳細な構成を示すブロック図である。
【図５】（ａ）は、ピッチ強調前の残差信号の波形例を示し、（ｂ）は、ピッチ強調後の残差信号の波形例を示す。
【図６】（ａ）は、音声の周波数スペクトルの一例を示し、（ｂ）は、周波数スペクトルの強調（ホルマント強調）の原理説明図である。
【図７】スペクトル強調処理の説明図である。
【図８】補間曲線として２次関数を用いた場合のスペクトル増幅率の補間方法の例を示す。
【図９】本発明の第２の実施の形態による音声強調装置の詳細な構成を示すブロック図である。
【図１０】本発明の第２の実施の形態による音声強調装置の雑音推定部の詳細な構成を示すブロック図である。
【図１１】本発明の第２の実施の形態による音声強調装置の増幅率算出部の詳細な構成を示すブロック図である。
【図１２】本発明の第３の実施の形態による音声強調装置の詳細な構成を示すブロック図である。
【図１３】本発明の第４の実施の形態による音声強調装置の原理図である。
【図１４】本発明の第４の実施の形態による音声強調装置の詳細な構成を示すブロック図である。
【符号の説明】
１音声強調部
２強調特性決定部
３，３０雑音推定部
１１逆フィルタ
１２，１２０ピッチ強調部
１３合成フィルタ
１４合成フィルタ係数算出部
１５スペクトル強調部
２１自己相関算出部
２２平均化処理部
２４逆フィルタ係数算出部
２５スペクトル算出部
２６ホルマント推定部
２７，２７０増幅率算出部

Claims

入力される受話者側の信号から該受話者側の周囲雑音の特性を求める雑音推定部と，
入力される送話者の音声信号を音源特性と声道特性とに分離する分離部と，
前記声道特性から特徴情報を抽出する特徴抽出部と，
前記声道特性，前記特徴情報，および前記周囲雑音の特性から前記声道特性を修正する声道特性修正部と，
前記声道特性修正部からの修正声道特性と前記音源特性とを合成する合成部とを有し，
前記特徴抽出部は，前記送話者の音声信号の現フレームから自己相関を求める自己相関算出部と，
前記現フレームの自己相関と前記過去フレームの自己相関との加重平均を求める平均化処理部と，
前記加重平均から逆フィルタ係数を算出する逆フィルタ係数算出部を有し，
さらに，前記合成部の前段側に，前記逆フィルタ係数により構成され，前記入力される送話者の音声信号入力される逆フィルタを有し，
前記声道特性修正部は，前記加重平均から算出した逆フィルタ係数のパワースペクトルを算出し，前記パワースペクトルからホルマント周波数およびホルマント振幅を求め，前記周囲雑音の特性と前記ホルマント周波数および前記ホルマント振幅に基づいて，前記ホルマント振幅を変化させる，
ことを特徴とする音声強調装置。
請求項１において，
前記雑音推定部は，前記周囲雑音の周波数スペクトルを前記周囲雑音の特性として求め，
前記声道特性修正部は，前記ホルマント振幅の平均振幅を求め，前記平均振幅および前記周囲雑音の周波数スペクトルに基づいて，前記ホルマント振幅を変化させる，
ことを特徴とする音声強調装置。
入力される受話者側の信号から該受話者側の周囲雑音の平均電力または該受話者側の周囲雑音の周波数スペクトルを求める雑音推定部と，
入力される送話者の音声信号の現フレームから自己相関を求める自己相関算出部と，
前記現フレームの自己相関を記憶し，過去フレームの自己相関を出力するバッファ部と，
前記現フレームの自己相関と前記過去フレームの自己相関との加重平均を求める平均化処理部と，
前記加重平均から逆フィルタ係数を算出する逆フィルタ係数算出部と，
前記逆フィルタ係数により構成され，入力される前記送話者の音声信号の残差信号を出力する逆フィルタと，
前記逆フィルタ係数から周波数スペクトルを算出するスペクトル算出部と，
前記算出された周波数スペクトルからホルマント周波数およびホルマント振幅を推定するホルマント推定部と，
前記算出された周波数スペクトル，前記ホルマント周波数，前記ホルマント振幅，および前記周囲雑音の平均電力または前記周囲雑音の周波数スペクトルから，前記算出された周波数スペクトルに対する増幅率を求める増幅率算出部と，
前記増幅率に基づいて前記算出された周波数スペクトルを変化させ，変化された周波数スペクトルを求めるスペクトル強調部と，
前記変化された周波数スペクトルから合成フィルタ係数を算出する合成フィルタ係数算出部と，
前記合成フィルタ係数から構成され，入力される前記逆フィルタからの前記残差信号から出力音声信号を求める合成フィルタを有する，
ことを特徴とする音声強調装置。
請求項３において，
前記逆フィルタからの残差信号が入力され，該残差信号のピッチ強調を行い，ピッチ強調された残差信号を前記合成フィルタに出力するピッチ強調部をさらに備える，
ことを特徴とする音声強調装置。
請求項４において，
前記ピッチ強調部は，前記受話者側の周囲雑音の平均電力に基づいてピッチ強調の度合いを変化させる，音声強調装置。