JP4227421B2

JP4227421B2 - 音声強調装置および携帯端末

Info

Publication number: JP4227421B2
Application number: JP2003007543A
Authority: JP
Inventors: 正清田中; 政直鈴木; 恭士大田; 義照土永
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2003-01-15
Filing date: 2003-01-15
Publication date: 2009-02-18
Anticipated expiration: 2023-01-15
Also published as: JP2004219757A

Description

【０００１】
【発明の属する技術分野】
本発明は、例えば携帯電話（携帯端末）の受話音声の聞きやすさを向上させる音声強調装置および携帯端末に関し、特に、携帯電話の周囲に背景雑音が存在する環境（以下、雑音環境下と称する。）において聞きやすさを向上させる技術に用いて好適な、音声強調装置および携帯端末に関する。
【０００２】
【従来の技術】
近年、携帯電話が普及し、様々な場所において使用されている。携帯電話は、静かな場所のみならず、空港又は駅のホーム等の騒がしい環境において使用されることも多い。この雑音環境下においては、受話音声の品質が劣化し、受話音声が聞きにくくなる。
【０００３】
この雑音環境下における受話音声の聞きにくさを改善する方法として、音声の周波数スペクトル（以下、音声スペクトル又は単にスペクトルと称する。）の極大をとる部分（ホルマント）を強調して音声の明瞭度を高める方法が知られている。なお、この強調とは、音声スペクトルの振幅を増幅することを意味する。
図１９は音声スペクトルの一例を示す図である。この図１９に示す音声スペクトル曲線は、極大をとる部分（ホルマント）を例えば３カ所有し、これらの極大部分は、周波数の低い側から順に、それぞれ、第１ホルマント，第２ホルマント，第３ホルマントと呼ばれている。また、極大値における周波数ｆｐ（１），ｆｐ（２）およびｆｐ（３）は、それぞれ、ホルマント周波数と呼ばれる。そして、携帯電話の音声処理部（図示省略）が、各ホルマントを強調し、これにより、音声の明瞭度が向上するのである。
【０００４】
ここで、以下の説明において使用される語句について、図２１を参照して説明する。
図２１は音声の生成モデルを示す図であって、特に母音のような有声音の時間波形の処理プロセスが表示されている。この図２１に示す音源５００は声帯の振動によって発生する周期的な波形（以下、声帯波と称する。）である。この声帯の振動周期は、一定の周期（ピッチ周期）を有する。また、調音系（Articulation）５０１は声道（Vocal Tract：声帯から唇までの空間）である。そして、肺からの空気が、声道の形状（例えば声道の太さ）に共振し母音が生成され、また、声道の形状の変更により複数の異なる母音が得られる。さらに、唇５０２は、音源５００および調音系５０１により生成された音声波を音響的な音声波形として空間に放射するものである。これにより、音源５００が発生した音源信号は、調音系５０１において声道特性が付加され、そして、唇５０２から音声となって放射される（例えば非特許文献１参照）。
【０００５】
また、図２１に示す生成モデルをスペクトルの観点から説明する。
唇５０２から出力される音声波形のスペクトルの包絡線は、音源５００（声帯波）のスペクトル包絡線と調音系５０１のスペクトル特性との積により得られる。ここで、唇５０２からの音声波形についての線形予測分析により抽出される特性は、音源５００の周波数特性と調音系５０１の周波数特性とが一体化されたものであり、従って、両者を分離抽出することができない。
【０００６】
一方、音声波形のスペクトルについて、線形予測分析によるシステム関数の逆関数に基づくフィルタリングを行なうと、音声波形のスペクトルの包絡線の特性が除去されて音源５００のほぼ一様なスペクトルが得られる。また、音声波形から線形予測可能な部分を除去したものは残差信号（音源信号）と呼ばれる。そして、この残差信号の自己相関を算出すると、音源５００の周期が抽出される。
【０００７】
次に、具体的に、ホルマント強調により音声の明瞭度を向上させる方法について説明する（例えば、特許文献１）。
特許文献１記載の音声スペクトル強調装置は、凸部帯域の周波数成分については振幅スペクトルを強調し、凹部帯域の周波数成分については振幅スペクトルを減衰させるものである。
【０００８】
図２２は従来の音声スペクトル強調装置のブロック図である。この図２２に示す音声スペクトル強調装置は、スペクトル推定部１０２にて推定されたスペクトルが、ホルマント／アンチホルマント決定部１０３において、ＬＰＣスペクトル（Linear Predictive Coding スペクトル[ＬＰＣ係数スペクトル]）を用いて、凸部周波数（ホルマント周波数を含む帯域）と凹部周波数（アンチホルマント（振幅が極小をとる部分）周波数を含む帯域）とが決定され、凸部周波数と凹部周波数を用いて凸部帯域と凹部帯域が決定される。また、ＬＰＣ係数を用いて凸部倍率と凹部倍率が得られる。フィルタ構成部１０６は、凸部帯域および凹部帯域と凸部倍率および凹部倍率を用いてスペクトル強調し、フィルタ部１０７にてフィルタリングされ、ゲイン算出部１１１でスペクトルが分岐され、合成部１１２で合成されて出力される。これにより、理想的なスペクトル強調が可能となる。
【０００９】
この半面、音声スペクトル強調装置は、次の２種類の課題を有する。
第１に、図２１に示す音声スペクトル強調装置は、音声を音源特性と声道特性とに分離せずに音声自体を直接強調するので、音源特性の歪みが大きい。このため、雑音感が増加し、明瞭度が劣化する。
図２１に示す音声の生成モデルにおいて、音源特性と声道特性とは全く異なる特性を有するにもかかわらず、音声スペクトル強調装置は、音声が有する特性を音源特性と声道特性とに分離せずに音声を直接増幅している。このため、音源特性の歪みが大きくなり、雑音感が増加し、明瞭度が劣化する。
【００１０】
第２に、図２１に示す音声スペクトル強調装置は、入力音声信号から得られたＬＰＣスペクトル又はＦＦＴ（Fast Fourier Transformation）スペクトルに対して直接ホルマントを強調するものである。このため、音声スペクトル強調装置が入力音声信号を符号化した入力音声データをフレーム毎に処理する場合は、フレーム間において増幅率又は減衰率が変化する。従って、フレーム間における増幅率又は減衰率が急激に変化する場合があり、その場合は、スペクトルが不連続となり急激に変化する。このスペクトルの変化は、ユーザが実際に音を聞くときに雑音感として認識される。
【００１１】
ここで、ＬＰＣスペクトルとは、ＬＰＣを用いて計算したスペクトルであり、ＦＦＴスペクトルとは、高速フーリエ変換を用いて計算した信号のパワースペクトルである。
このスペクトルの不連続性を改善する方法は、例えばフレーム長を大きくする方法が知られている。すなわち、フレーム長を長くすると時間的にスペクトル変動の少ない平均的なスペクトル特性が得られる。
【００１２】
この半面、フレーム長を長くすることは、音声処理および音声データの伝送について、遅延時間が大きくなる。一方、携帯電話などの通信用途は、遅延時間をできるだけ小さくする必要があるので、通信用途の観点からは、フレーム長は短いほうが望ましい。従って、フレーム長を大きくせずにスペクトルの急激な変動を防止する必要がある。
【００１３】
この課題に対して、発明者らは、受話音声の明瞭度を高めるとともに、雑音感の増加を抑制可能な音声強調装置を提案した。
図２３は受話音声品質を向上させる音声強調装置の構成例を示す図である。この図２３に示す音声強調装置６００に入力された入力音声信号は、信号分離部６０１において残差信号（音源信号）と声道特性とに分離される。そして、残差信号と声道特性とは、それぞれ、残差信号強調部６０２とホルマント強調部６０３とにおいて個別に強調され、これらの強調された強調残差信号と声道特性とは、信号合成部６０４において再合成され、これにより、強調された音声が出力されるようになっている。
【００１４】
この音声強調装置６００は、残差信号と声道特性とをそれぞれ分離して強調するので、残差信号と声道特性との各々の特性に合った音声強調が可能となる。従って、この音声強調装置６００は、特許文献１記載の音声スペクトル強調装置が有する技術課題、すなわち、音源特性の歪みを生じさせないで音声強調でき、また、特許文献１記載の音声スペクトル強調装置に比較して、高い明瞭度を得ることができる。さらに、音声強調装置６００は、声道特性のホルマントを強調するので一層明瞭度が改善される。
【００１５】
【非特許文献１】
中田和男著，「音声の高能率符号化」，森北出版株式会社，１９８６年９月，ｐ．６９−７１
【特許文献１】
特開２００１−１１７５７３号公報
【００１６】
【発明が解決しようとする課題】
しかしながら、図２３に示す音声強調装置６００は、声道特性と音源特性とを同時に強調するので、スペクトル歪が発生し、明瞭度が劣化する可能性がある。また、ホルマント周波数とアンチホルマント周波数との各位置が変更されることにより、雑音感が増加するという課題がある。
【００１７】
さらに、スペクトル強調によって出力音声信号の振幅が入力音声信号に比較して過度に大きくなる可能性が依然として残る。
加えて、フレーム間の急激なスペクトル変化が発生し雑音が生じる可能性があるという課題もある。
本発明は、このような課題に鑑み創案されたもので、例えば携帯電話等の受信信号の音声処理回路等において、受話音声の明瞭度を改善して聞きやすくし、出力音声信号が適切な大きさの振幅を有し、かつスペクトルの急激な変化に起因する雑音を防止し、受話音声の品質劣化および雑音感増加を抑圧可能な、音声強調装置および携帯端末を提供することを目的とする。
【００１８】
【課題を解決するための手段】
このため、本発明の音声強調装置は、入力音声信号の自己相関関数と過去のフレームから算出した自己相関関数との加重平均を用いて入力音声信号から平均的な声道特性を抽出するとともに前記平均的な声道特性を用いて入力音声信号から残差信号を分離する信号抽出分離部と、信号抽出分離部にて抽出された声道特性のホルマントを強調するとともに声道特性のアンチホルマントを減衰させた強調声道特性を出力する声道特性修正部と、信号抽出分離部にて分離された残差信号と、声道特性修正部から出力された強調声道特性とを合成した合成信号を出力する合成部とをそなえて構成されたことを特徴としている（請求項１）。
【００１９】
また、前記声道特性修正部は、信号抽出分離部にて抽出された声道特性のホルマントとアンチホルマントとのそれぞれについての物理的特性を推定する推定部と、信号抽出分離部にて抽出された声道特性と、推定部にて推定された物理的特性とに基づいて増幅率を算出する増幅率算出部とをそなえて構成されてもよい（請求項２）。
【００２０】
さらに、前記声道特性修正部は、極大周波数におけるホルマント振幅と極小周波数におけるアンチホルマント振幅との差が大きくなるように、声道特性の振幅を増幅又は減衰させるように構成されてもよい（請求項３）。
前記声道特性修正部は、隣接する極大周波数および極小周波数の間に存在する周波数の増幅率を、極小周波数における増幅率以上、極大周波数における増幅率以下の値をとる補間曲線を用いて補間するように構成されてもよい（請求項４）。
【００２１】
そして、合成信号の振幅を制御する自動利得制御部をそなえて構成することもできる（請求項５）。
また、本発明の音声強調装置は、入力音声信号の自己相関関数と過去のフレームから算出した自己相関関数との加重平均を用いて入力音声信号から平均的な声道特性を抽出するとともに前記平均的な声道特性を用いて入力音声信号から入力音声信号から残差信号を分離する信号抽出分離部と、信号抽出分離部にて抽出された声道特性のホルマントとアンチホルマントとのそれぞれについての物理的特性を推定する推定部と、信号抽出分離部にて抽出された声道特性と、推定部にて推定された物理的特性とに基づいて算出した増幅率を用いて、信号抽出分離部にて抽出された声道特性のホルマントを強調するとともに声道特性のアンチホルマントを減衰させた強調声道特性を出力する声道特性修正部と、信号抽出分離部にて分離された残差信号と、声道特性修正部から出力された強調声道特性とを合成した合成信号を出力する合成部とをそなえて構成されたことを特徴としている（請求項６）。
【００２３】
そして、本発明の携帯端末は、無線信号を受信する受信部と、受信部にて受信された無線信号を復調して音声信号を処理し音声信号を出力する音声処理部と、音声処理部にて処理された音声信号を強調する音声強調装置とをそなえ、音声強調装置が、音声処理部から入力される入力音声信号の自己相関関数と過去のフレームから算出した自己相関関数との加重平均を用いて入力音声信号から平均的な声道特性を抽出するとともに前記平均的な声道特性を用いて入力音声信号から入力音声信号から残差信号を分離する信号抽出分離部と、信号抽出分離部にて抽出された声道特性のホルマントを強調するとともに声道特性のアンチホルマントを減衰させた強調声道特性を出力する声道特性修正部と、信号抽出分離部にて分離された残差信号と声道特性修正部から出力された強調声道特性とを合成した合成信号を、前記強調された音声信号として出力する合成部とをそなえて構成されたことを特徴としている（請求項７）。
【００２４】
【発明の実施の形態】
以下、図面を参照して本発明の実施の形態を説明する。
（Ａ）本発明の原理の説明
図１は本発明の原理ブロック図である。この図１に示す音声強調装置１は、携帯電話等の受話部分に設けられ明瞭度が高い音声を出力するものであって、信号分離部（信号抽出分離部）２と、ホルマント／アンチホルマント強調部（ホルマントおよびアンチホルマント強調部：声道特性修正部）４と、残差信号強調部３と、信号合成部（合成部）５とをそなえて構成されている。
【００２５】
ここで、信号分離部２は、入力音声信号から声道特性を抽出するとともに入力音声信号から残差信号を分離するものである。ホルマント／アンチホルマント強調部４は、信号分離部２にて抽出された声道特性のホルマントを強調するとともに声道特性のアンチホルマントを減衰させた強調声道特性を出力するものである。また、残差信号強調部３は、入力音声信号を用いて信号分離部２にて分離された残差信号を強調するものである。さらに、信号合成部５は、残差信号強調部３にて強調された残差信号と、ホルマント／アンチホルマント強調部４から出力された強調声道特性とを合成した合成信号を出力するものである。
【００２６】
これにより、入力音声信号は、信号分離部２にて、残差信号と声道特性と分離され、残差信号は、残差信号強調部３にて強調され、その強調された残差信号が出力される。また、声道特性は、ホルマント／アンチホルマント強調部４にて強調されて強調された声道特性が出力される。そして、強調された残差信号と強調された声道特性とはいずれも、信号合成部５にて音声合成され出力音声として出力される。
【００２７】
また、ホルマント／アンチホルマント強調部４は、ホルマントを増幅するとともにアンチホルマントを減衰させ、これにより、ホルマントとアンチホルマントとの振幅差を示すコントラストを強調（コントラスト強調）している。
従って、本発明の音声強調方法は、まず、信号分離部２が、入力音声信号から声道特性と残差信号とを分離し、次に、残差信号強調部３が、分離された残差信号を強調し、声道特性についてホルマントとアンチホルマントとの振幅差を強調し、そして、信号合成部５が、強調された残差信号と強調された声道特性とを再合成した強調音声信号を出力する。これにより、音声の個々の特性に応じて強調できる。
【００２８】
さらに、本発明の音声強調装置１は、入力音声信号の周波数特性を抽出する周波数特性抽出部と、周波数特性抽出部にて抽出された周波数特性についてホルマント振幅が極大値をとる周波数である極大周波数と、アンチホルマント振幅が極小値をとる周波数である極小周波数とを算出する特徴算出部と、特徴算出部にて算出された極大周波数および極小周波数に基づいて、入力音声信号の周波数特性を修正した強調音声信号を出力する周波数特性修正部とをそなえて構成されている。
【００２９】
（１）信号分離部２
図２は本発明の原理ブロック図をさらに詳細に示す図である。この図２に示す音声強調装置１の信号分離部２は、入力音声信号ｘ（ｎ）（ここで、ｘ（ｎ），（０≦ｎ＜Ｎ）であり、Ｎはフレーム長を表す。）について、線形予測分析して得られるＬＰＣ係数（線形予測符号化係数）により定まる帯域フィルタリングを行なうことにより、残差信号を分離するものであって、平均スペクトル算出部１２と、第１フィルタ係数算出部２ｂと、逆フィルタ２ａとをそなえて構成されている。
【００３０】
この平均スペクトル算出部１２は、入力音声信号ｘ（ｎ）について算出された平均自己相関（自己相関値）から、平均スペクトルｓｐ₁（ｌ）を算出して出力するものである（ｌはelを表す。）。よく知られているように、自己相関は時間領域における音声波形の類似性を示し、また、自己相関はフーリエ変換されるとスペクトル分布（電力スペクトル密度）が得られるので、時間領域および周波数領域の両領域における音声波形の物理的特性の解析に有用である。
【００３１】
第１フィルタ係数算出部２ｂは、平均スペクトル算出部１２からの平均スペクトルｓｐ₁（ｌ）に基づいて逆フィルタ２ａのフィルタ係数を算出して逆フィルタ２ａに入力するものである。
そして、逆フィルタ２ａは、例えばＦＩＲ（Finite Impulse Response）フィルタである。この逆フィルタ２ａに入力される入力音声信号ｘ（ｎ）は、音源の周波数特性と調音系の周波数特性とが一体化された音声波形特性を有する（図２２参照）。そして、その一体化された入力音声信号ｘ（ｎ）が逆フィルタ２ａのフィルタリングにより、音声波形から線形予測可能な部分が除去されて、音源信号が抽出される。換言すれば、音源信号は、フィルタリング後に残された信号（残差信号）に相当する。
【００３２】
従って、フィルタ係数を適応的に設定でき、雑音環境下において、適切に音声を強調できる。
これにより、入力音声信号ｘ（ｎ）は、逆フィルタ２ａに入力される一方、平均スペクトル算出部１２に入力されて平均スペクトルｓｐ₁（ｌ）が算出される。そして、算出された平均スペクトルｓｐ₁（ｌ）は、第１フィルタ係数算出部２ｂに入力され、この第１フィルタ係数算出部２ｂにおいて算出されたフィルタ係数α₁が逆フィルタ２ａに設定される。また、この逆フィルタ２ａは、残差信号ｒ（ｎ）を出力する。さらに、平均スペクトル算出部１２からの平均スペクトルｓｐ₁（ｌ）は、ホルマント／アンチホルマント強調部４にも入力される。
【００３３】
これにより、入力音声信号ｘ（ｎ）は、残差信号ｒ（ｎ）と平均スペクトルｓｐ₁（ｌ）とに分離される。
（２）ピッチ強調部３
ピッチ強調部３は、信号分離部２にて分離された残差信号ｒ（ｎ）のピッチを強調するものであって、残差信号強調部として機能する。ピッチ強調部３は、残差信号ｒ（ｎ）を強調して強調残差信号ｓ（ｎ）を出力する。このピッチ強調により、ピッチ強調フィルタの係数が得られ、残差信号ｒ（ｎ）を適切に強調できる。
【００３４】
（３）ホルマント／アンチホルマント強調部４
ホルマント／アンチホルマント強調部４は、平均スペクトルｓｐ₁（ｌ）からホルマントおよびアンチホルマントを推定する機能と、その推定されたホルマントおよびアンチホルマントのそれぞれの振幅を増幅又は減衰する機能とを有し、ホルマント／アンチホルマント推定部（推定部）４ａと、増幅率算出部４ｂと、スペクトル強調部４ｃと、第２フィルタ係数算出部４ｄとをそなえて構成されている。
【００３５】
ここで、ホルマント／アンチホルマント推定部４ａは、信号分離部２にて抽出された声道特性のホルマントとアンチホルマントとのそれぞれについての物理的特性を推定するものである。この物理的特性は、特に断らない限り、以下の説明において、ホルマント周波数ｆｐ，アンチホルマント周波数ｆｖ，ホルマント周波数振幅ａｍｐｐおよびアンチホルマント周波数振幅ａｍｐｖを意味する。
【００３６】
増幅率算出部４ｂは、信号分離部２にて抽出された声道特性と、ホルマント／アンチホルマント推定部４ａにて推定された物理的特性（ホルマント周波数ｆｐ，アンチホルマント周波数ｆｖ，ホルマント周波数振幅ａｍｐｐおよびアンチホルマント周波数振幅ａｍｐｖ）とに基づいて増幅率β（ｌ）を算出するものである（ｌはelを表す。）。
【００３７】
この増幅率β（ｌ）の算出について、増幅率算出部４ｂは、例えば次の（Ｐ１）〜（Ｐ６）に示す算出方法を用い、また、ホルマント／アンチホルマント推定部４ａは、次の（Ｐ７），（Ｐ８）に示す算出方法を用いる。
（Ｐ１）極大周波数におけるホルマント振幅と極小周波数におけるアンチホルマント振幅との差が大きくなるように、声道特性の振幅を増幅又は減衰させる方法。
【００３８】
（Ｐ２）固定増幅率を用いた増幅又は減衰による方法。
（Ｐ３）極大周波数、極小周波数および声道特性の振幅のそれぞれに基づく算出方法。
（Ｐ４）極大周波数の増幅率を、複数の極大周波数の振幅平均値に基づいて算出し、極小周波数の増幅率を、複数の極小周波数の振幅平均値に基づいて算出する方法。
【００３９】
（Ｐ５）周波数に応じて増幅率に重み付けする方法。
（Ｐ６）隣接する極大周波数および極小周波数の間に存在する周波数の増幅率を、極小周波数における増幅率以上、極大周波数における増幅率以下の値をとる補間曲線を用いて補間する方法。
（Ｐ７）ホルマント／アンチホルマント強調部４は、補間曲線として、極大周波数を通り、かつ極小周波数において極小値をとる二次曲線を用いて補間する。
【００４０】
（Ｐ８）ホルマント／アンチホルマント強調部４は、現フレーム（現在時刻ｔのフレーム）にて算出された増幅率を前フレームの増幅率と比較して、前フレームからの増幅率の差分又は比率が予め設定した閾値以上の場合は、前フレームの増幅率に定数を加算又は乗算した値を現フレームの増幅率とする。
スペクトル強調部４ｃは、平均スペクトルｓｐ₁（ｌ）を、増幅率算出部４ｂにて算出された増幅率β（ｌ）により増幅しその増幅スペクトルｓｐ₂（ｌ）を出力するものである（ｌはelを表す。）。また、第２フィルタ係数算出部４ｄは、スペクトル強調部４ｃからの増幅スペクトルｓｐ₂（ｌ）に基づいてフィルタ係数を算出するものである。
【００４１】
さらに、合成フィルタ５（合成部，信号合成部）は、ピッチ強調部３からの強調残差信号ｓ（ｎ）と、第２フィルタ係数算出部４ｄからのフィルタ係数α₂とを合成して、出力音声ｙ（ｎ）を出力するものである。
これにより、ホルマント／アンチホルマント推定部４ａにおいて、平均スペクトル算出部１２から出力された平均スペクトルｓｐ₁（ｌ）についてホルマントとアンチホルマントとの双方が推定される。また、これらのホルマントとアンチホルマントとは、ともに、スペクトル強調部４ｃにおいて、増幅率算出部４ｂにおいて算出された増幅率を用いて強調されて、増幅スペクトルｓｐ₂（ｌ）が出力される。そして、第２フィルタ係数算出部４ｄは、この増幅スペクトルｓｐ₂（ｌ）に基づき、以下に述べる合成フィルタ５のフィルタ係数α₂を算出し、このフィルタ係数α₂を合成フィルタ５に入力する。
【００４２】
従って、本発明の音声強調装置１は、入力音声信号ｘ（ｎ）から声道特性を抽出するとともに入力音声信号ｘ（ｎ）から残差信号ｒ（ｎ）を分離する信号分離部２と、信号分離部２にて抽出された声道特性のホルマントとアンチホルマントとのそれぞれについての例えばホルマント周波数ｆｐ，アンチホルマント周波数ｆｖ，ホルマント周波数振幅ａｍｐｐおよびアンチホルマント周波数振幅ａｍｐｖ等の物理的特性を推定するホルマント／アンチホルマント推定部４ａと、信号分離部２にて抽出された声道特性と、ホルマント／アンチホルマント推定部４ａにて推定された物理的特性とに基づいて算出した増幅率を用いて、信号分離部２にて抽出された声道特性のホルマントを強調するとともに声道特性のアンチホルマントを減衰させた強調声道特性を出力するホルマント／アンチホルマント強調部４と、入力音声信号ｘ（ｎ）を用いて信号分離部２にて分離された残差信号ｒ（ｎ）を強調する残差信号強調部３と、残差信号強調部３にて強調された強調残差信号ｓ（ｎ）と、ホルマント／アンチホルマント強調部４から出力された強調声道特性とを合成した合成信号を出力する信号合成部５とをそなえて構成されたことになる。
【００４３】
このように、本発明の音声強調装置１は、入力音声信号ｘ（ｎ）から残差信号ｒ（ｎ）と声道特性とに分離し、分離した残差信号ｒ（ｎ）と声道特性とをそれぞれ強調するので、明瞭な音声が得られる。さらに、ホルマントとアンチホルマントとの振幅差が強調されるので、雑音感が除去される。
従って、携帯電話は、空港等の雑音環境下においても、受話音声の品質は劣化せず、受話音声の聞きにくさが改善される。
【００４４】
以下、音声強調方法について数式を用いて、（Ｑ１）〜（Ｑ１０）に詳述する。
（４）音声強調方法
（Ｑ１）信号分離部２は、入力音声信号ｘ（ｎ），（０≦ｎ＜Ｎ）から現フレームの自己相関関数を算出する。ここで、Ｎはフレーム長である。次に、現フレームの自己相関関数と過去フレームの自己相関関数との加重平均により平均自己相関を算出する。
【００４５】
（Ｑ２）信号分離部２は、その平均自己相関から平均スペクトルｓｐ₁（ｌ），（０≦ｌ＜Ｎ_F）を算出する。ここで、Ｎ_Fはスペクトル包絡線上のデータ点の個数であって、Ｎ≦Ｎ_Fとする。なお、平均スペクトルｓｐ₁（ｌ）は現フレームの入力音声から算出されるＬＰＣスペクトル又はＦＦＴスペクトルと、過去の入力音声から算出されるＬＰＣスペクトル又はＦＦＴスペクトルとの加重平均を算出して得てもよい。
【００４６】
（Ｑ３）信号分離部２は、平均スペクトルｓｐ₁（ｌ）をフィルタ係数算出部１に入力し逆フィルタ係数α₁（ｌ），（１≦ｉ≦ｐ₁）を算出する。ここで、ｐ₁は逆フィルタ２ａのフィルタ次数である。
（Ｑ４）入力音声信号ｘ（ｎ）をα₁（ｌ）で構成される逆フィルタ２ａに入力して残差信号ｒ（ｎ），（０≦ｎ＜Ｎ）を算出する。これにより、入力音声信号ｘ（ｎ）を残差信号ｒ（ｎ）と声道特性とに分離できる。
【００４７】
（Ｑ５）残差信号ｒ（ｎ）をピッチ強調部３に入力し、ピッチが強調された強調残差信号ｓ（ｎ）を算出する。
（Ｑ６）ホルマント／アンチホルマント推定部４ａに平均スペクトルｓｐ₁（ｌ）を入力し、ホルマント周波数ｆｐ（ｋ），（１≦ｋ≦ｋ_pmax）とその振幅ａｍｐｐ（ｋ），（１≦ｋ≦ｋ_pmax）およびアンチホルマント周波数ｆｖ（ｋ），（１≦ｋ≦ｋ_vmax）とその振幅ａｍｐｖ（ｋ），（１≦ｋ≦ｋ_vmax）を推定する。ここで、ｋ_pmaxは推定するホルマントの個数であり、また、ｋ_vmaxは推定するアンチホルマントの個数である。ｋ_pmaxおよびｋ_vmaxの値は所望の方法を用いて得ることができ、サンプリング周波数が８ｋＨｚの音声に対しては、ｋ_pmaxおよびｋ_vmaxは、ともに、４又は５などが好ましい。
【００４８】
（Ｑ７）平均スペクトルｓｐ₁（ｌ）と｛ｆｐ（ｋ），ａｍｐｐ（ｋ）｝および｛ｆｖ（ｋ），ａｍｐｖ（ｋ）｝とをそれぞれ増幅率算出部４ｂに入力し、平均スペクトルｓｐ₁（ｌ）についての増幅率β（ｌ）を算出する。ここで、増幅率β（ｌ）は、以下に示す条件Ｉ，IIを満たすように決定する。
Ｉ．隣接するホルマントとアンチホルマントとの振幅差が大きくなるようにする。
【００４９】
II．増幅によってホルマント周波数とアンチホルマント周波数との位置が変動しない
ようにする。
このように、増幅率β（ｌ）を決定することにより、雑音感や音の歪みが抑制され、明瞭度の向上および良好な音声強調が可能になり、受話音声の聞きにくさが改善される。
【００５０】
（Ｑ８）平均スペクトルｓｐ₁（ｌ）と増幅率β（ｌ）とをスペクトル強調部４ｃに入力し、強調された増幅スペクトルｓｐ₂（ｌ）を算出する。
（Ｑ９）増幅スペクトルｓｐ₂（ｌ）をフィルタ係数算出部２に入力して合成フィルタ係数α₂（ｉ），（１≦ｉ≦ｐ₂）を算出する。ここで、ｐ₂は合成フィルタ５のフィルタ次数である。
【００５１】
（Ｑ１０）ピッチ強調後の強調残差信号ｓ（ｎ）をα₂（ｉ）により構成される合成フィルタ５に入力し、出力音声ｙ（ｎ），（０≦ｎ＜Ｎ）を算出する。これにより、強調処理された音源特性と声道特性とが合成される。
このように、本発明の音声強調装置１は、入力音声信号ｘ（ｎ）を、残差信号ｒ（ｎ）と声道特性とに分離して個別に強調するので、強調残差信号ｓ（ｎ）および声道特性の各特性に適した音声強調が可能となり、また、強調によるスペクトル歪みが発生しない。
【００５２】
また、このように、声道特性について、ホルマントとアンチホルマントとのそれぞれの振幅差の強調により、例えば音声強調装置６００（図２３参照）よりも高い明瞭度を得られる。また、音声符号化処理後の音声などについて雑音感を抑制できる。
図２に示す平均スペクトル算出部１２の自己相関の算出とホルマント／アンチホルマント強調部４とについてさらに詳述する。
【００５３】
ここで、アンチホルマントは２つの隣接するホルマントの間に存在するものとして説明するが、本発明の音声強調方法は、アンチホルマントが最低次ホルマントより低い周波数に存在する場合、又は最高次ホルマントより高い周波数に存在する場合のいずれにおいても適応できる。
（Ｂ）本発明の第１実施形態の説明
図２０は本発明が適用される携帯電話（携帯端末）の概略的なブロック図である。この図２０に示す携帯電話１５は、音声通話を無線信号で送受信する基地局１６と通信するものであって、マイク１５ａ，送話部１５ｂ，コーダ１５ｃ，データ処理部１５ｄ，無線送受信部１５ｅ，アンテナ１５ｊ，デコーダ１５ｆ，受話部１５ｇ，スピーカ１５ｈおよび主制御部１５ｉをそなえて構成されている。
【００５４】
ここで、送話部１５ｂはマイク１５ａからのアナログ音声信号をディジタル音声信号に変換して出力するものであり、コーダ１５ｃは送話部１５ｂからのディジタル音声信号をアナログ圧縮されたディジタルコードに変換し符号化して出力するものであり、データ処理部１５ｄは送信データおよび受信データを処理するものであり、無線送受信部１５ｅはコーダ１５ｃからのディジタルコードを無線信号に変換するとともに基地局１６から受信した無線信号をディジタル音声データに変換してデータ処理部１５ｄに入力するものである。
【００５５】
さらに、データ処理部１５ｄには主制御部１５ｉが接続され、携帯電話１５の各機能部を制御するものである。そして、デコーダ１５ｆはデータ処理部１５ｄからの圧縮されたディジタルコードをディジタル音声信号に変換出力するものである。受話部１５ｇはデコーダ１５ｆから出力されたディジタル音声信号を入力され、その入力音声信号（図１等に示す入力音声ｘ（ｎ）に相当する）に本発明の音声強調方法を適用して強調された出力音声を出力するものである。また、スピーカ１５ｈは受話部１５ｇからの出力音声をディジタル・アナログ変換によりアナログ音声に変換した後に、増幅して音声出力するものである。
【００５６】
これにより、アンテナ１５ｊ，無線送受信部１５ｅおよび主制御部１５ｉとが協働することにより、受信部（１５ｊ，１５ｅ，１５ｉ）として機能し、また、データ処理部１５ｄ，デコーダ１５ｆおよび主制御部１５ｉが協働することにより、音声処理部（１５ｄ，１５ｆ，１５ｉ）として機能し、そして、受話部１５ｇが音声強調装置１に相当する。
【００５７】
従って、本発明の携帯電話１５は、無線信号を受信する受信部（１５ｊ，１５ｅ，１５ｉ）と、この受信部（１５ｊ，１５ｅ，１５ｉ）にて受信された無線信号を復調して音声信号を処理し音声信号を出力する音声処理部（１５ｄ，１５ｆ，１５ｉ）と、この音声処理部（１５ｄ，１５ｆ，１５ｉ）にて処理された音声信号を強調する音声強調装置１（受話部１５ｇ）とをそなえている。そして、この音声強調装置１が、図１に示すように、入力音声信号から声道特性を抽出するとともに入力音声信号から残差信号を分離する信号抽出分離部２と、信号抽出分離部２にて抽出された声道特性のホルマントを強調するとともに声道特性のアンチホルマントを減衰させた強調声道特性を出力する声道特性修正部４と、入力音声信号を用いて信号抽出分離部２にて分離された残差信号を強調する残差信号強調部３と、残差信号強調部３にて強調された残差信号と、声道特性修正部４から出力された強調声道特性とを合成した合成信号を出力する信号合成部５とをそなえて構成されている。
【００５８】
以下、特に断らない限り、本発明の音声強調装置１および後述する音声強調装置１ａ〜１ｅは、それぞれ、この図２０に示す携帯電話１５の受話部１５ｇに適用されるものとして、説明する。
このように、音声強調装置１は、携帯電話１５に設けられており、声道特性として音声の長時間特性を用いる方法、又は前フレームから増幅率に急激な変化を生じないように制限するので、短時間における急激なスペクトル変動に起因する雑音感を抑制でき、良好な音声強調を得られ、携帯電話の受話音声の聞きやすさが向上する。
【００５９】
図３は本発明の第１実施形態に係る音声強調装置のブロック図である。この図３に示す音声強調装置１ａの信号分離部２は、ＬＰＣ係数を、現フレームの入力音声信号ｘ（ｎ）から算出した自己相関関数と、過去のフレームから算出した自己相関関数との加重平均を用いて算出するものであって、自己相関算出部２ｄと、第１バッファ２ｆと、平均自己相関算出部２ｅとをそなえて構成されている。この図３に示すもので上述したものと同一のものは同一機能を有する。
【００６０】
ここで、自己相関算出部２ｄは、現フレーム（現在時刻ｔのフレーム）の自己相関関数（Auto Correlation Function）ａｃ（ｔ）を算出するものである。また、第１バッファ２ｆは、過去のフレームの複数の自己相関関数（時刻ｔ−１，…，時刻ｔ−Ｌ）（Ｌは２以上の自然数を表す。）を保持するものである。さらに、平均自己相関算出部２ｅは、現フレームの自己相関関数ａｃ（ｔ）と、第１バッファ２ｆに保持された例えばＬ個の過去フレームの自己相関関数との（Ｌ＋１）個の自己相関関数について加重平均した平均自己相関関数ａｃ_AVEを出力するものである。
【００６１】
そして、第１フィルタ係数算出部２ｂは、平均自己相関ａｃ_AVEのフーリエ変換に基づいて逆フィルタ２ａのフィルタ係数を算出する。従って、信号分離部２は、声道特性として、ＬＰＣ係数に基づき算出されたＬＰＣスペクトルを用いることになる。また、信号分離部２は、声道特性の極大周波数と声道特性の極小周波数とを、いずれも、ＬＰＣスペクトルを用いて算出するようになっている。
【００６２】
以下、数式を用いて、（Ｒ１）〜（Ｒ１６）に詳述する。
（Ｒ１）現フレームの入力音声信号ｘ（ｎ），（０≦ｎ＜Ｎ）は、自己相関算出部２ｄに入力され、現フレームの自己相関関数ａｃ（ｍ）（ｉ），（０≦ｉ≦ｐ₁）が式（１）により算出される。ここで、Ｎはフレーム長である。また、ｍは現フレームのフレーム番号であり、ｐ₁は後述する逆フィルタ係数の次数である。
【００６３】
【数１】

【００６４】
（Ｒ２）次に、信号分離部２は、現フレームの自己相関関数ａｃ（ｍ）（ｉ）と過去の自己相関関数とを平均化し、平均自己相関関数ａｃ_AVE（ｉ）を算出する。この平均化方法の一例として、過去のLフレームの自己相関関数との加重平均により算出する。さらに、第１バッファ２ｆから、過去のフレームの自己相関関数ａｃ（ｍ−ｊ）（ｉ），（１≦ｊ≦Ｌ，０≦ｉ≦ｐ₁）が出力される。平均自己相関ａｃ_AVE（ｉ）は、現フレームの自己相関関数を含む（Ｌ＋１）個の自己相関関数ａｃ（ｍ−ｊ）（ｉ），（０≦ｊ≦Ｌ，０≦ｉ≦ｐ₁）の加重平均により算出される。この加重平均は式（２）によって得られる。ここで、ｗ_jは重み係数である。
【００６５】
【数２】

【００６６】
平均自己相関の演算後、信号分離部２は、第１バッファ２ｆの状態を更新する。まず、第１バッファ２ｆに格納されている過去の自己相関関数のうちの時間的に最も古いａｃ（ｍ−Ｌ）（ｉ）を廃棄し、次に、現フレームで算出したａｃ（ｍ）（ｉ）を第１バッファ２ｆに格納する。
（Ｒ３）レビンソン・アルゴリズム等の公知の方法を用いることにより、ａｃ_AVE（ｉ）から逆フィルタ係数ａ１（ｉ），（１≦ｉ≦ｐ₁）を算出する。
【００６７】
（Ｒ４）入力音声信号ｘ（ｎ）をα₁（ｉ）で構成される式（３）の逆フィルタ２ａに入力して残差信号ｒ（ｎ），（０≦ｎ＜Ｎ）を算出する。これにより、入力音声信号ｘ（ｎ）を残差信号ｒ（ｎ）と声道特性とに分離することができる。
【００６８】
【数３】

【００６９】
（Ｒ５）スペクトル算出部２ｇにおいて、α₁（ｉ）を式（４）により、フーリエ変換してＬＰＣスペクトルｓｐ₁（ｌ）を算出する。ここで、Ｎ_Fはスペクトルのデータ点数である。また、サンプリング周波数をＦｓとすると、ＬＰＣスペクトルｓｐ₁（ｌ）の周波数分解能はＦｓ／Ｎ_Fとなる。ここで、変数Ｌはスペクトルのインデックスであり離散周波数を表す。この変数ＬをＨｚに換算すると、Ｌ・Ｆｓ／Ｎ_F[Ｈｚ]となる。
【００７０】
【数４】

【００７１】
（Ｒ６）ホルマント／アンチホルマント推定部４ａにＬＰＣスペクトルｓｐ₁（ｌ）を入力し、ホルマント周波数ｆｐ（ｋ），（１≦ｋ≦ｋ_pmax）と、その振幅ａｍｐｐ（ｋ），（１≦ｋ≦ｋ_pmax）およびアンチホルマント周波数ｆｖ（ｋ），（１≦ｋ≦ｋ_vmax）と、その振幅ａｍｐｖ（ｋ），（１≦ｋ≦ｋ_vmax）とのそれぞれを推定する。なお、前述した仮定により、ｋ_vmax＝ｋ_pmax−１となる。
【００７２】
なお、ホルマント周波数およびアンチホルマント周波数の推定方法は所望の方法を用いることができる。例えばホルマント周波数の推定は、ピークピッキング法など公知の技術を用いることができ、アンチホルマント周波数の推定は、スペクトルの逆数に対して前述のピークピッキング法を用いるなどの方法がある。算出したホルマントおよびアンチホルマントを、低次から順に、ｆｐ（１），ｆｐ（２），…，ｆｐ（ｋ_pmax）およびｆｖ（１），ｆｖ（２），…，ｆｖ（ｋ_pmax−１）とする。また、ｆｐ（ｋ）およびｆｖ（ｋ）での振幅値をそれぞれａｍｐｐ（ｋ），ａｍｐｖ（ｋ）とする。
【００７３】
（Ｒ７）次に、ｓｐ₁（ｌ）と｛ｆｐ（ｋ），ａｍｐｐ（ｋ）｝および｛ｆｖ（ｋ），ａｍｐｖ（ｋ）｝とを増幅率算出部４ｂに入力し、ｓｐ₁（ｌ）についての増幅率β（ｌ）を算出する。
図４は本発明の第１実施形態に係る増幅率算出部４ｂの増幅率算出を説明するためのフローチャートである。増幅率算出部４ｂは、ホルマントの増幅率を算出して決定し（ステップＨ１）、アンチホルマントの増幅率を算出して決定し（ステップＨ２）、そして、補間曲線Ｒｉ（ｋ，ｌ）を用いて増幅率を補間する（ステップＨ３）。
【００７４】
（Ｒ８）従って、ステップＨ１，Ｈ２のように、最初に、ホルマント／アンチホルマントの増幅率Ｇ_p（ｋ）とＧ_v（ｋ）とがそれぞれ決定される。ここで、増幅率は、ホルマントとアンチホルマントとの振幅差が音声強調前に比較して大きくなるように決定されることが好ましい。また、ホルマントとアンチホルマントとはいずれも固定の定数を用いてもよく、音声の性質に合わせて適応的に算出することもできる。さらに、ホルマント数の増幅率は適応的に算出し、アンチホルマントは固定の定数を用いてもよく、周波数の高さに応じて重み付けしてもよい。増幅率の決定方法の一例を以下に示す。
【００７５】
（Ｒ９）増幅率算出部４ｂは、ホルマントの振幅ａｍｐｐ（１），ａｍｐｐ（２），…，ａｍｐｐ（ｋ_pmax）の平均値ａｍｐｐ_AVEを算出し、算出したａｍｐｐ_AVEをリファレンス値として、振幅の増幅率を決定する。
図５は本発明の第１実施形態に係るホルマント増幅率の決定方法を説明するための図である。この図５に示す曲線は、周波数（単位elの離散周波数）と、この周波数スペクトルの振幅との関係を表し、また、ホルマント周波数の振幅平均値ａｍｐｐ_AVEが表示されている。そして、離散周波数ｆｐ（１）〜ｆｐ（４）のそれぞれにおいて、ホルマント周波数の振幅ａｍｐｐ（１）〜ａｍｐｐ（４）が振幅平均値ａｍｐｐ_AVEに一致するように、増幅率Ｇ_p（ｋ）が算出される。また、振幅平均値ａｍｐｐ_AVE，増幅率Ｇ_p（ｋ）は式（５）に示すように算出される。
【００７６】
【数５】

【００７７】
ここで、ｗｐ（ｌ）は周波数によって変動する重み付け係数である。
（Ｒ１０）次に、アンチホルマントの増幅率Ｇ_v（ｋ）をホルマント増幅率Ｇ_p（ｋ）と同様に算出する。
図６は本発明の第１実施形態に係るアンチホルマント増幅率の決定方法を説明するための図である。増幅率算出部４ｂは、この図６に示すアンチホルマントの振幅ａｍｐｖ（１），ａｍｐｖ（２），…，ａｍｐｖ（ｋ_pmax−１）を用いて算出したアンチホルマントの振幅平均値ａｍｐｖ_AVEをリファレンス値とし、このリファレンス値に一致するように、増幅率を決定する。
【００７８】
（Ｒ１１）アンチホルマントの振幅平均値ａｍｐｖ_AVEとアンチホルマントの増幅率Ｇ_v（ｋ）とは、それぞれ、式（６）により算出される。
【００７９】
【数６】

【００８０】
ここで、ｗｖ（ｌ）は、前述のｗｐ（ｌ）と同様、周波数によって変動する重み付け係数である。
（Ｒ１２）次に、隣接するホルマント周波数とアンチホルマント周波数との間の周波数における増幅率を、補間曲線Ｒｉ（ｋ，ｌ）により算出する。
ここで、ｉ＝１，２であり、区間［ｆｐ（ｋ），ｆｖ（ｋ）］の補間曲線をＲ１（ｋ，ｌ），区間［ｆｖ（ｋ），ｆｐ（ｋ＋１）］の補間曲線をＲ２（ｋ，ｌ）とする。補間曲線は、Ｒ１（ｋ，ｌ）の場合はＧ_v（ｋ）≦β（ｌ）≦Ｇ_p（ｋ）を満たし、Ｒ２（ｋ，ｌ）の場合はＧ_v（ｋ）≦β（ｌ）≦Ｇ_p（ｋ＋１）を満たすことが必要である。なぜならば、上記条件を満たすための増幅率の補間は、強調によってホルマント周波数およびアンチホルマント周波数の位置が変動する可能性を排除でき、明瞭度の低下および雑音感の増加を抑制できるからである。
【００８１】
（Ｒ１３）二次曲線を用いた補間曲線Ｒ１（ｋ，ｌ）の補間の一例を図７を参照して説明する。
図７は本発明の第１実施形態に係る二次曲線を用いた増幅率の補間方法を説明するための図である。ホルマント／アンチホルマント強調部４は、この図７に示す二次曲線（補間曲線Ｒ１（ｋ，ｌ）が、｛ｆｐ（ｋ），Ｇ_p（ｋ）｝を通り、｛ｆｖ（ｋ），Ｇ_v（ｋ）｝で極小値をとるように曲線を作成する。従って、この二次曲線は式（７）のように表せる。
【００８２】
【数７】

【００８３】
この式（７）が、｛ｆｐ（ｋ），Ｇ_p（ｋ）｝を通るので、｛ｌ，β（ｌ）｝＝｛ｆｐ（ｋ），Ｇ_p（ｋ）｝を代入して式（７）を整理すると、ａは式（８）のように表せる。
【００８４】
【数８】

【００８５】
従って、式（８）からａを算出し、二次曲線Ｒ１（ｋ，ｌ）を算出でき、ｆｖ（ｋ）とｆｐ（ｋ＋１）との間の補間曲線Ｒ２（ｋ，ｌ）も同様に算出できる。
（Ｒ１４）この算出したＲｉ（ｋ，ｌ）に基づいてｆｐ（ｋ）とｆｖ（ｋ）およびｆｖ（ｋ）と、ｆｐ（ｋ＋１）の間のスペクトルについての増幅率β（ｌ）が算出される。
【００８６】
（Ｒ１５）上記（７）〜（１３）の処理を、ホルマント周波数とアンチホルマント周波数との間に位置する全ての周波数について行なう。なお、最低次のホルマント周波数ｆｐ（１）よりも低い周波数については、ｆｐ（１）についての増幅率Ｇ_p（１）を用いる。また、最高次のホルマント周波数ｆｐ（ｋ_pmax）よりも高い周波数については、ｆｐ（ｋ_pmax）についての増幅率Ｇ_p（ｋ_pmax）を用いる。以上をまとめると式（９）のようになる。
【００８７】
【数９】

【００８８】
また、図８は本発明の第１実施形態に係る補間方法により補間された増幅率を示す図である。
（Ｒ１６）ｓｐ₁（ｌ）とβ（ｌ）とがスペクトル強調部４ｃに入力され、強調されたスペクトルｓｐ₂（ｌ）が式（１０）のように算出される。
【００８９】
【数１０】

【００９０】
（Ｒ１７）ｓｐ₂（ｌ）がフィルタ係数算出部２に入力され、ｓｐ₂（ｌ）の逆フーリエ変換から自己相関関数ａｃ２（ｉ）が算出される。次に、ａｃ２（ｉ）からレビンソン・アルゴリズム等の公知の方法により合成フィルタ係数α₂（ｉ），（１≦ｉ≦ｐ₂）が算出される。ここで、ｐ₂は合成フィルタ次数である。
（Ｒ１８）残差信号ｒ（ｎ）がα₂（ｉ）により構成される式（１１）の合成フィルタ５に入力され、出力音声ｙ（ｎ），（０≦ｎ＜Ｎ）が算出される。
【００９１】
【数１１】

【００９２】
図９は本発明の第１実施形態に係る音声強調方法を説明するためのフローチャートである。自己相関算出部２ｄは、自己相関関数ａｃを算出し（ステップＡ１）、平均自己相関算出部２ｅは、平均自己相関ａｃ_AVEを算出する（ステップＡ２）。また、第１フィルタ係数算出部２ｂは、逆フィルタ係数α₁を算出し（ステップＡ３）、逆フィルタ２ａの逆フィルタ係数α₁の設定後、入力音声信号ｘ（ｎ）を逆フィルタ２ａに入力することにより、残差信号ｒ（ｎ）を算出する（ステップＡ４）。
【００９３】
次に、フィルタ係数算出部２ｂは、ＬＰＣスペクトルｓｐ₁（ｌ）を算出し（ステップＡ５）、ホルマント／アンチホルマント推定部４ａは、ホルマントｆｐとアンチホルマントｆｖとを抽出し（ステップＡ６）、増幅率算出部４ｂは、増幅率βを算出する（ステップＡ７）。さらに、スペクトル強調部４ｃは、強調されたＬＰＣスペクトルｓｐ₂（ｌ）を算出し（ステップＡ８）、第２フィルタ係数算出部４ｄは、自己相関関数ａｃ２を算出し（ステップＡ９）、合成フィルタ係数α₂を算出し（ステップＡ１０）、合成フィルタ５の出力として出力音声信号ｙ（ｎ）を出力する（ステップＡ１１）。
【００９４】
また、従って、本発明の音声強調方法は、入力音声信号ｘ（ｎ）から声道特性を抽出し入力音声信号ｘ（ｎ）を、入力音声信号ｘ（ｎ）を線形予測分析して得られるＬＰＣ係数に起因する帯域特性についてフィルタリングし、ピッチが強調された強調残差信号ｓ（ｎ）を算出し、抽出した声道特性に含まれるホルマント，ホルマント振幅，アンチホルマントおよびアンチホルマント振幅をそれぞれ推定し、抽出された声道特性と、推定されたホルマント，ホルマント振幅，アンチホルマントおよびアンチホルマント振幅とに基づいて声道特性を強調し、強調された強調残差信号ｓ（ｎ）と、強調声道特性とを再合成した強調合成信号を出力する。
【００９５】
このように、入力音声信号ｘ（ｎ）を音源特性と声道特性とに分離し、声道特性のみを強調することができるので、従来技術が解決できなかったスペクトル歪（声道特性と音源特性との両方を同時に強調する場合に発生するスペクトル歪）が抑制され、かつ明瞭度が改善する。また、ホルマント周波数とアンチホルマント周波数の位置が変動しないように増幅率を算出することにより、明瞭度の低下又は雑音感の増加が回避される。
【００９６】
なお、スペクトルｓｐ₁（ｌ）についての増幅率を１スペクトル点数単位で算出したが、スペクトルを複数の周波数帯域に分割し、各帯域別に個別の増幅率を割り当てしてもよい。
（Ｃ）本発明の第２実施形態の説明
図１０は本発明の第２実施形態に係る音声強調装置のブロック図である。この図１０に示す音声強調装置１ｂが音声強調装置１ａと異なるところは、合成フィルタ５から合成音声が出力される側に、自動利得制御部（ＡＧＣ［Automatic Gain Controller］部）６が設けられている点である。これ以外の部分は上記と同一なので重複説明を省略する。
【００９７】
この自動利得制御部６の機能についてさらに詳述する。
自動利得制御部６は、入力音声信号ｘ（ｎ）が入力され、この入力音声信号ｘ（ｎ）の振幅に基づいて、合成フィルタ５からの出力音声信号ｙ（ｎ）の振幅を制御するものである。この自動利得制御部６は、入力音声信号ｘ（ｎ）と最終的な出力音声信号との電力比が例えば１となるように利得を調整するために、まず、ｘ（ｎ）とｙ（ｎ）とから振幅比ｇ₀を式（１２）により算出する。ここで、Ｎはフレーム長である。
【００９８】
【数１２】

【００９９】
そして、自動利得制御部６は、式（１３）により利得制御値Ｇａｉｎ（ｎ）を算出する。ここで、λは定数である。
【０１００】
【数１３】

【０１０１】
最終的な出力音声信号ｚ（ｎ）は式（１４）により得られる。
【０１０２】
【数１４】

【０１０３】
なお、この算出方法は一例であって、自動利得制御部６は、この方法以外の所望の方法を利用できる。
このような構成によって、自動利得制御部６を用いた場合の音声強調方法を説明する。
図１１は本発明の第２実施形態に係る音声強調方法を説明するためのフローチャートであり、合成フィルタ５（図１０参照）から出力音声信号ｙ（ｎ）が出力されるまでの処理は、自動利得制御部６がない場合の処理（図９参照）と同一である。すなわち、自己相関算出部２ｄは、自己相関関数ａｃを算出し（ステップＢ１）、平均自己相関算出部２ｅは、平均自己相関ａｃ_AVEを算出する（ステップＢ２）。また、第１フィルタ係数算出部２ｂは、逆フィルタ係数α₁を算出し（ステップＢ３）、逆フィルタ２ａの逆フィルタ係数α₁の設定後、入力音声信号ｘ（ｎ）を逆フィルタ２ａに入力することにより、残差信号ｒ（ｎ）を算出する（ステップＢ４）。
【０１０４】
次に、フィルタ係数算出部２ｂは、ＬＰＣスペクトルｓｐ₁（ｌ）を算出し（ステップＢ５）、ホルマント／アンチホルマント推定部４ａは、ホルマントｆｐとアンチホルマントｆｖとを抽出し（ステップＢ６）、増幅率算出部４ｂは、増幅率βを算出する（ステップＢ７）。さらに、スペクトル強調部４ｃは、強調されたＬＰＣスペクトルｓｐ₂（ｌ）を算出し（ステップＢ８）、第２フィルタ係数算出部４ｄは、自己相関関数ａｃ２を算出し（ステップＢ９）、合成フィルタ係数α₂を算出し（ステップＢ１０）、合成フィルタ５の出力として出力音声信号ｙ（ｎ）を出力する（ステップＢ１１）。
【０１０５】
そして、自動利得制御部６は、利得制御値Ｇａｉｎを算出し（ステップＢ１２）、利得調整された出力音声信号ｚ（ｎ）を算出して出力する（ステップＢ１３）。
このように、自動利得制御部６を設けることにより、スペクトル強調によって出力音声ｚ（ｎ）の振幅が入力音声信号ｘ（ｎ）の振幅に比較して、大きくならないように過度に利得を調整できる。これにより、滑らかで自然性の高い受話音声を得ることができる。
【０１０６】
（Ｄ）本発明の第３実施形態の説明
図１２は本発明の第３実施形態に係る音声強調装置のブロック図である。この図１２に示す音声強調装置１ｃが、音声強調装置１と異なるところは、増幅率算出部４ｂ′に第２バッファ４ｅが設けられていることと、増幅率算出部４ｂ′に比較部４ｆが設けられていることである。
【０１０７】
ここで、第２バッファ４ｅは、過去フレームについての１又は複数の増幅率を保持するものである。そして、比較部４ｆは、現フレームについての増幅率と過去フレームについての１又は複数の増幅率とを比較して増幅率を算出するものである。この比較部４ｆは、現フレームと過去フレームとのそれぞれについての増幅率の差分と、予め保持した閾値とを比較し、その増幅率の差分が閾値よりも大きくなる場合には、より適切な増幅率を決定する。
【０１０８】
なお、図１２においても上記と同一符号を有するものは上述したものと同一である。
次に、増幅率算出部４ｂ′の算出方法についてさらに詳述する。
増幅率算出部４ｂ′は、平均スペクトルｓｐ₁（ｌ）と、｛ｆｐ（ｋ），ａｍｐｐ（ｋ）｝および｛ｆｖ（ｋ），ａｍｐｖ（ｋ）｝とに基づいて仮の増幅率βｐｓｕ（ｌ）を算出する。このβｐｓｕ（ｌ）の算出方法は、第１実施形態における増幅率β（ｌ）の算出方法と同一である。
【０１０９】
次に、増幅率算出部４ｂ′は、仮の増幅率βｐｓｕ（ｌ）と、第２バッファ４ｅから出力される増幅率β−ｏｌｄ（ｌ）とに基づいて現フレームの増幅率β（ｌ）を算出する。ここで、β−ｏｌｄ（ｌ）は、複数の過去フレームのうちの直前のフレームにおいて算出された最終的な増幅率である。増幅率β（ｌ）の算出方法は、以下の（Ｓ１）〜（Ｓ４）に示すようになる。
【０１１０】
（Ｓ１）増幅率算出部４ｂ′は、現フレームの仮の増幅率βｐｓｕ（ｌ）と前フレームの増幅率β−ｏｌｄ（ｌ）との差分Δβ＝βｐｓｕ（ｌ）−β−ｏｌｄ（ｌ）を算出する。
（Ｓ２）増幅率算出部４ｂ′は、Δβが予め定められた閾値ΔＴＨよりも大きい場合は、増幅率β（ｌ）＝β−ｏｌｄ（ｌ）＋ΔＴＨとする。
【０１１１】
（Ｓ３）増幅率算出部４ｂ′は、Δβが閾値ΔＴＨよりも小さい場合は、増幅率β（ｌ）＝βｐｓｕ（ｌ）とする。
（Ｓ４）増幅率算出部４ｂ′は、最終的に求められた増幅率β（ｌ）をバッファに入力してβ−ｏｌｄ（ｌ）を更新する。
なお、この増幅率β（ｌ）を算出する部分以外は前記内容と同一であるので説明を省略する。
【０１１２】
このような構成によって、バッファ４ｅが設けられた場合の音声強調方法は次のようになる。
図１３は本発明の第３実施形態に係る音声強調方法を説明するためのフローチャートであり、ホルマント／アンチホルマント推定部４ａにおけるホルマントｆｐとアンチホルマントｆｖとの抽出までの処理は、第２バッファ４ｅが設けられていない場合の処理（図９参照）と同一である。すなわち、自己相関算出部２ｄは、自己相関関数ａｃを算出し（ステップＣ１）、平均自己相関算出部２ｅは、平均自己相関ａｃ_AVEを算出する（ステップＣ２）。また、第１フィルタ係数算出部２ｂは、逆フィルタ係数α₁を算出し（ステップＣ３）、逆フィルタ２ａの逆フィルタ係数α₁の設定後、入力音声信号ｘ（ｎ）を逆フィルタ２ａに入力することにより、残差信号ｒ（ｎ）を算出する（ステップＣ４）。
【０１１３】
次に、フィルタ係数算出部２ｂは、ＬＰＣスペクトルｓｐ₁（ｌ）を算出し（ステップＣ５）、ホルマント／アンチホルマント推定部４ａは、ホルマントｆｐとアンチホルマントｆｖとを抽出する（ステップＣ６）。
増幅率算出部４ｂ′は、仮増幅率βｕｓｕを算出し（ステップＣ７）、増幅率βを算出する（ステップＣ８）。さらに、スペクトル強調部４ｃは、強調されたＬＰＣスペクトルｓｐ₂（ｌ）を算出し（ステップＣ９）、第２フィルタ係数算出部４ｄは、自己相関関数ａｃ２を算出し（ステップＣ１０）、合成フィルタ係数α₂を算出し（ステップＣ１１）、合成フィルタ５の出力として出力音声信号ｙ（ｎ）を出力する（ステップＣ１２）。
【０１１４】
このように、増幅率算出部４ｂ′が、現フレームの増幅率が前フレームの増幅率から大きく変動しないように制限するので、フレーム間の急激なスペクトル変化が抑圧され、雑音感の増加を抑制しつつ明瞭度を改善できる。
（Ｅ）本発明の第４実施形態の説明
図１４は本発明の第４実施形態に係る音声強調装置のブロック図である。この図１４に示す音声強調装置１ｄが、音声強調装置１と異なるところは、逆フィルタ２ａからの残差信号ｒ（ｎ）についてピッチ強調部３が設けられている点である。ピッチ強調部３は、残差信号ｒ（ｎ）からピッチ係数を算出するピッチ係数算出部３ｂと、このピッチ係数算出部３ｂにて算出されたピッチ予測係数に基づくフィルタ係数を有し残差信号ｒ（ｎ）をピッチ強調して得た強調残差信号ｓ（ｎ）を出力するピッチ強調フィルタ３ａとを有する。
【０１１５】
なお、図１４においても、上記の符号と同一符号を有するものは、上述したものと同一である。
このような構成により、ピッチ強調方法は、例えば以下の（Ｔ１）〜（Ｔ４）に示すようになる。
（Ｔ１）ピッチ係数算出部３ｂは、残差信号ｒ（ｎ）の自己相関ｒｓｃｏｒ（ｉ）を式（１５）のように算出する。
【０１１６】
【数１５】

【０１１７】
ここで、Ｌａｇ_minおよびＬａｇ_maxはピッチラグの上限および下限を表す。
ピッチ係数算出部３ｂは、ｒｓｃｏｒ（ｉ）が最大となるを、ピッチラグＴとして算出する。
（Ｔ２）ピッチ係数算出部３ｂは、ピッチラグＴの近傍における残差信号ｒ（ｎ）の自己相関ｒｓｃｏｒ（Ｔ−１），ｒｓｃｏｒ（Ｔ），ｒｓｃｏｒ（Ｔ＋１）を用いて、レビンソン・アルゴリズム等の公知の方法を用いてピッチ予測係数ｐｃ（ｉ），（ｉ＝−１，０，１）を算出する。
【０１１８】
（Ｔ３）ピッチ係数算出部３ｂは、ピッチ予測係数を有するピッチ強調フィルタ３ａを用いて残差信号ｒ（ｎ）をフィルタリングし、ピッチ強調された強調残差信号ｓ（ｎ）を出力する。なお、ピッチ強調フィルタ３ａの伝達関数を式（１６）に示す。ここで、ｇ_pは重み付け係数を表す。
【０１１９】
【数１６】

【０１２０】
（Ｔ４）合成フィルタ５は、強調残差信号ｓ（ｎ）を、残差信号ｒ（ｎ）のかわりに式（１１）に代入して合成音声を得る。
なお、この例に示すピッチ強調フィルタ３ａは、自己相関から算出されたピッチ予測係数を有するＩＩＲフィルタを用いる代わりに、別個の方法を用いることもできる。例えば、ピッチ係数算出部３ｂは、残差信号ｒ（ｎ）を周波数領域に変換し、周波数領域においてピッチ周波数とピッチゲインとを算出し、そのピッチゲインに応じて増幅率を決定し、所望の増幅特性になる帯域特性を有するフィルタを用いることにより、残差信号ｒ（ｎ）をフィルタリングするようにもできる。
【０１２１】
このような構成によって、ピッチ強調部３が設けられた場合の音声強調方法は次のようになる。
図１５は本発明の第４実施形態に係る音声強調方法を説明するためのフローチャートである。自己相関算出部２ｄは、自己相関関数ａｃを算出し（ステップＤ１）、平均自己相関算出部２ｅは、平均自己相関ａｃ_AVEを算出する（ステップＤ２）。また、第１フィルタ係数算出部２ｂは、逆フィルタ係数α₁を算出し（ステップＤ３）、逆フィルタ２ａの逆フィルタ係数α₁の設定後、入力音声信号ｘ（ｎ）を逆フィルタ２ａに入力することにより、残差信号ｒ（ｎ）を算出する（ステップＤ４）。
【０１２２】
次に、ピッチ係数算出部３ｂは、ピッチラグＴを算出し（ステップＤ５）、ピッチ予測係数ｐｃを算出し（ステップＤ６），ピッチ強調された強調残差信号ｓ（ｎ）を算出する（ステップＤ７）。
また、スペクトル算出部２ｇは、ＬＰＣスペクトルｓｐ₁（ｌ）を算出し（ステップＤ８）、ホルマント／アンチホルマント推定部４ａは、ホルマントｆｐとアンチホルマントｆｖとを抽出する（ステップＤ９）。さらに、増幅率算出部４ｂは、増幅率βを算出し（ステップＤ１０）、スペクトル強調部４ｃは、強調されたＬＰＣスペクトルｓｐ₂（ｌ）を算出し（ステップＤ１１）、第２フィルタ係数算出部４ｄは、自己相関関数ａｃ２を算出し（ステップＤ１２）、合成フィルタ係数α₂を算出し（ステップＤ１３）、合成フィルタ５の出力として出力音声信号ｙ（ｎ）を出力する（ステップＤ１４）。
【０１２３】
このように、ピッチ強調フィルタ３ａの付加により、ピッチ係数算出部３ｂは、残差信号ｒ（ｎ）に含まれるピッチ周期成分を強調でき、ピッチ強調フィルタ３ａがない場合に比較して音声の明瞭度をさらに改善可能である。
さらに、増幅率が決定されるので、雑音感および音の歪みがともに抑制され、高い明瞭度の音声を安定して得ることができ、また、良好な音声強調が可能となる。
【０１２４】
そして、本発明の音声強調装置１ｄは、入力音声信号ｘ（ｎ）を残差信号ｒ（ｎ）と声道特性とに分離し、分離した残差信号ｒ（ｎ）と声道特性とを個別に強調するので、各特性に適した音声強調処理が可能となり、また、特性の強調による生じるスペクトル歪みを回避した強調が可能となる。
また、このように、本発明の音声強調装置１ｄは、声道特性に対して、ホルマントとアンチホルマントとの振幅差を強調することにより、音声強調装置６００（図２３参照）に比較して、高い明瞭度が改善できるととともに、音声符号化処理後の音声の雑音感が抑制される。
【０１２５】
このようにして、音声強調装置１ｄは、声道特性として音声の長時間の特性を用い、かつ前フレームから増幅率に急激な変化が生じないように制限するので、短時間での急激なスペクトル変動に起因する雑音感を抑制でき、良好な音声強調が実現される。
（Ｆ）本発明の第５実施形態の説明
第５実施形態の音声強調装置は、上記の各実施形態において説明した機能をすべて設けたものである。
【０１２６】
図１６は本発明の第５実施形態に係る音声強調装置のブロック図であり、この図１６に示す音声強調装置１ｅは、上記の各機能を併せもつものである。また、図１６においても、上記と同一符号を有するものは、上述したものと同一である。
また、図１７は本発明の第５実施形態に係る音声強調方法を説明するためのフローチャートである。自己相関算出部２ｄは、自己相関関数ａｃを算出し（ステップＥ１）、平均自己相関算出部２ｅは、平均自己相関ａｃ_AVEを算出する（ステップＥ２）。また、第１フィルタ係数算出部２ｂは、逆フィルタ係数α₁を算出し（ステップＥ３）、逆フィルタ２ａの逆フィルタ係数α₁の設定後、入力音声信号ｘ（ｎ）を逆フィルタ２ａに入力することにより、残差信号ｒ（ｎ）を算出する（ステップＥ４）。
【０１２７】
次に、ピッチ係数算出部３ｂは、ピッチラグＴを算出し（ステップＥ５）、ピッチ予測係数ｐｃを算出し（ステップＥ６），ピッチ強調された強調残差信号ｓ（ｎ）を算出する（ステップＥ７）。
さらに、フィルタ係数算出部２ｂは、ＬＰＣスペクトルｓｐ₁（ｌ）を算出し（ステップＥ８）、ホルマント／アンチホルマント推定部４ａは、ホルマントｆｐとアンチホルマントｆｖとを抽出する（ステップＥ９）。
【０１２８】
また、増幅率算出部４ｂ′は、仮増幅率βｕｓｕを算出し（ステップＥ１０）、増幅率βを算出する（ステップＥ１１）。さらに、スペクトル強調部４ｃは、強調されたＬＰＣスペクトルｓｐ₂（ｌ）を算出し（ステップＥ１２）、第２フィルタ係数算出部４ｄは、自己相関関数ａｃ２を算出し（ステップＥ１３）、合成フィルタ係数α₂を算出し（ステップＥ１４）、合成フィルタ５の出力として出力音声信号ｙ（ｎ）を出力する（ステップＥ１５）。
【０１２９】
そして、自動利得制御部６は、利得制御値Ｇａｉｎを算出し（ステップＥ１６）、利得調整された出力音声信号ｚ（ｎ）を算出して出力する（ステップＥ１７）。
このように、各機能をそなえることによって、一層聞きやすい音声が得られ、また、雑音感および音の歪みがともに抑制される。
【０１３０】
以下、本発明の音声強調方法と音声強調装置６００（図２３参照）を用いた音声強調方法とのそれぞれについて強調ホルマントを比較する。
図１８（ａ）は例えば音声強調装置６００の音声強調処理によるスペクトルを表す図であり、図１８（ｂ）は本発明の音声強調処理によるスペクトルを表す図である。この図１８（ｂ）に示す音声強調方法は、コントラスト強調によってホルマントを強調するので、明瞭度が向上する。加えて、本発明の音声強調方法は、アンチホルマントを減衰させることによって相対的なホルマント強調効果が得られ、これにより、音声強調装置６００（図２３参照）に比較して、一層の明瞭度の向上が可能となる。
【０１３１】
また、本発明の音声強調方法は、アンチホルマントを減衰させているので、特に、携帯電話が採用する音声符号化方法を用いて処理されるので、音声に生じやすい雑音感を抑制することができる。
よく知られているように、この音声符号化方法を用いて符号化および復号化された音声は、いずれも、量子化雑音と呼ばれる雑音がアンチホルマントに生じやすいが、発明の音声強調方法によれば、アンチホルマントを減衰させるため、量子化雑音を軽減でき、また、雑音感が小さく聞きやすい音声をユーザに提供できる。
【０１３２】
このようにして、第１実施形態では入力音声信号ｘ（ｎ）を音源特性と声道特性とに分離し、声道特性のみを強調することが可能になる。これにより、従来技術で未解決となっていた声道特性と音源特性とを同時に強調する場合に発生するスペクトル歪を抑制し、かつ明瞭度を改善することができる。また、ホルマント周波数とアンチホルマント周波数との位置が変動しないように増幅率を算出することにより、明瞭度の低下又は雑音感の増加が回避される。なお、スペクトルについての増幅率を１スペクトル点数単位で算出するが、スペクトルを複数の周波数帯域に分割し、各帯域別に個別の増幅率を割り当てしてもよい。
【０１３３】
（Ｇ）その他
本発明は上述した実施態様およびその変形態様に限定されるものではなく、本発明の趣旨を逸脱しない範囲で、種々変形して実施することができる。
（Ｈ）付記
（付記１）入力音声信号から声道特性を抽出するとともに該入力音声信号から残差信号を分離する信号抽出分離部と、
該信号抽出分離部にて抽出された声道特性のホルマントを強調するとともに該声道特性のアンチホルマントを減衰させた強調声道特性を出力する声道特性修正部と、
該入力音声信号を用いて該信号抽出分離部にて分離された残差信号を強調する残差信号強調部と、
該残差信号強調部にて強調された残差信号と、該声道特性修正部から出力された強調声道特性とを合成した合成信号を出力する合成部とをそなえて構成されたことを特徴とする、音声強調装置。
【０１３４】
（付記２）該信号抽出分離部は、
該入力音声信号について、線形予測分析して得られる線形予測符号化係数（Linear Predictive Coding 係数：ＬＰＣ係数）により定まるフィルタリングを行なうことにより、該残差信号を分離するように構成されたことを特徴とする、付記１記載の音声強調装置。
【０１３５】
（付記３）該信号抽出分離部は、
該ＬＰＣ係数を、現フレームの入力音声信号から算出した自己相関関数と、過去のフレームから算出した自己相関関数との加重平均を用いて算出するように構成されたことを特徴とする、付記２記載の音声強調装置。
（付記４）該信号抽出分離部は、
該声道特性として、該ＬＰＣ係数に基づき算出されたＬＰＣスペクトルを用いるように構成されたことを特徴とする、付記２又は付記３記載の音声強調装置。
【０１３６】
（付記５）該信号抽出分離部は、
該声道特性の該極大周波数と該声道特性の該極小周波数とを、いずれも、該ＬＰＣスペクトルを用いて算出するように構成されたことを特徴とする、付記２又は付記３記載の音声強調装置。
（付記６）該残差信号強調部が、
該信号抽出分離部にて分離された残差信号のピッチを強調するピッチ強調部をそなえて構成されたことを特徴とする、付記１記載の音声強調装置。
【０１３７】
（付記７）該声道特性修正部が、
該信号抽出分離部にて抽出された声道特性のホルマントとアンチホルマントとのそれぞれについての物理的特性を推定する推定部と、
該信号抽出分離部にて抽出された声道特性と、該推定部にて推定された該物理的特性とに基づいて増幅率を算出する増幅率算出部とをそなえて構成されたことを特徴とする、付記１記載の音声強調装置。
【０１３８】
（付記８）該声道特性修正部が、
該極大周波数におけるホルマント振幅と該極小周波数におけるアンチホルマント振幅との差が大きくなるように、該声道特性の振幅を増幅又は減衰させるように構成されたことを特徴とする、付記１記載の音声強調装置。
（付記９）該増幅率算出部は、
所定の固定増幅率を用いて増幅又は減衰するように構成されたことを特徴とする、付記８記載の音声強調装置。
【０１３９】
（付記１０）該増幅率算出部は、
該極大周波数、該極小周波数および該声道特性の振幅のそれぞれに基づいて該増幅率を算出するように構成されたことを特徴とする、付記８記載の音声強調装置。
（付記１１）該増幅率算出部は、
該極大周波数の増幅率を、複数の該極大周波数の振幅平均値に基づいて算出し、該極小周波数の増幅率を、複数の該極小周波数の振幅平均値に基づいて算出するように構成されたことを特徴とする、付記１０記載の音声強調装置。
【０１４０】
（付記１２）該声道特性修正部は、
周波数に応じて増幅率に重み付けるように構成されたことを特徴とする、付記７記載の音声強調装置。
（付記１３）該声道特性修正部は、
隣接する該極大周波数および該極小周波数の間に存在する周波数の増幅率を、該極小周波数における増幅率以上、該極大周波数における増幅率以下の値をとる補間曲線を用いて補間するように構成されたことを特徴とする、付記７記載の音声強調装置。
【０１４１】
（付記１４）該声道特性修正部は、
該補間曲線として、該極大周波数を通り、かつ該極小周波数において極小値をとる二次曲線を用いて補間するように構成されたことを特徴とする、付記１３記載の音声強調装置。
（付記１５）該声道特性修正部は、
現フレームにて算出された増幅率を、前フレームの増幅率と比較して、前フレームからの増幅率の差分又は比率が所定の閾値以上であった場合は、前フレームの増幅率に定数を加算又は乗算した値を現フレームの増幅率とするように構成されたことを特徴とする、付記７記載の音声強調装置。
【０１４２】
（付記１６）該強調音声信号の振幅を制御する自動利得制御部をそなえて構成されたことを特徴とする、付記１〜付記１５のいずれか１に記載の音声強調装置。
（付記１７）入力音声信号から声道特性を抽出するとともに該入力音声信号から残差信号を分離する信号抽出分離部と、
該信号抽出分離部にて抽出された声道特性のホルマントとアンチホルマントとのそれぞれについての物理的特性を推定する推定部と、
該信号抽出分離部にて抽出された声道特性と、該推定部にて推定された該物理的特性とに基づいて算出した増幅率を用いて、該信号抽出分離部にて抽出された声道特性のホルマントを強調するとともに該声道特性のアンチホルマントを減衰させた強調声道特性を出力する声道特性修正部と、
該入力音声信号を用いて該信号抽出分離部にて分離された残差信号を強調する残差信号強調部と、
該残差信号強調部にて強調された残差信号と、該声道特性修正部から出力された強調声道特性とを合成した合成信号を出力する合成部とをそなえて構成されたことを特徴とする、音声強調装置。
【０１４３】
（付記１８）入力音声信号の周波数特性を抽出する周波数特性抽出部と、
該周波数特性抽出部にて抽出された周波数特性についてホルマント振幅が極大値をとる周波数である極大周波数と、アンチホルマント振幅が極小値をとる周波数である極小周波数とを算出する特徴算出部と、
該特徴算出部にて算出された該極大周波数および該極小周波数に基づいて、該入力音声信号の周波数特性を修正した強調音声信号を出力する周波数特性修正部とをそなえて構成されたことを特徴とする、音声強調装置。
【０１４４】
（付記１９）入力音声信号から声道特性と残差信号とを分離し、
分離された残差信号を強調し、
該声道特性についてホルマントとアンチホルマントとの振幅差を強調し、
強調された該残差信号と強調された該声道特性とを再合成した強調音声信号を出力することを特徴とする、音声強調方法。
【０１４５】
（付記２０）入力音声信号から声道特性を抽出し
該入力音声信号を、該入力音声信号を線形予測分析して得られるＬＰＣ係数に起因する帯域特性についてフィルタリングし、
ピッチが強調された残差信号を算出し、
抽出した声道特性に含まれるホルマント，ホルマント振幅，アンチホルマントおよびアンチホルマント振幅をそれぞれ推定し、
抽出された声道特性と、推定されたホルマント，ホルマント振幅，アンチホルマントおよびアンチホルマント振幅とに基づいて該声道特性を強調し、
強調された残差信号と、該強調声道特性とを再合成した強調合成信号を出力することを特徴とする、音声強調方法。
【０１４６】
（付記２１）無線信号を受信する受信部と、該受信部にて受信された無線信号を復調して音声信号を処理し音声信号を出力する音声処理部と、該音声処理部にて処理された音声信号を強調する音声強調装置とをそなえ、
該音声強調装置が、
入力音声信号から声道特性を抽出するとともに該入力音声信号から残差信号を分離する信号抽出分離部と、
該信号抽出分離部にて抽出された声道特性のホルマントを強調するとともに該声道特性のアンチホルマントを減衰させた強調声道特性を出力する声道特性修正部と、
該入力音声信号を用いて該信号抽出分離部にて分離された残差信号を強調する残差信号強調部と、
該残差信号強調部にて強調された残差信号と、該声道特性修正部から出力された強調声道特性とを合成した合成信号を出力する合成部とをそなえて構成されたことを特徴とする、携帯端末。
【０１４７】
【発明の効果】
以上、詳述したように、本発明の音声強調装置および携帯端末によれば、以下のような効果ないし効果が得られる。
（１）本発明の音声強調装置によれば、入力音声信号から声道特性を抽出するとともに入力音声信号から残差信号を分離する信号抽出分離部と、信号抽出分離部にて抽出された声道特性のホルマントを強調するとともに声道特性のアンチホルマントを減衰させた強調声道特性を出力する声道特性修正部と、入力音声信号を用いて信号抽出分離部にて分離された残差信号を強調する残差信号強調部と、残差信号強調部にて強調された残差信号と、声道特性修正部から出力された強調声道特性とを合成した合成信号を出力する合成部とをそなえて構成されているので、残差信号と声道特性との個々の特性に合致して強調でき、音源特性の歪みが抑制され、また、高い明瞭度が得られる。
【０１４８】
（２）前記信号抽出分離部は、入力音声信号について、線形予測分析して得られる線形予測符号化係数により定まるフィルタリングを行なうことにより、残差信号を分離するように構成されてもよく、このようにすれば、フィルタ係数を適応的に設定でき、雑音環境下において、適切に音声を強調できる。
（３）前記信号抽出分離部は、線形予測符号化係数を、現フレームの入力音声信号から算出した自己相関関数と、過去のフレームから算出した自己相関関数との加重平均を用いて算出するように構成されてもよく、このようにすれば、例えば時間領域および周波数領域の両領域における音声波形の物理的特性を容易に解析できる。
【０１４９】
（４）前記信号抽出分離部は、声道特性として、線形予測符号化係数に基づき算出された線形予測符号化スペクトルを用いるように構成されてもよく、また、声道特性の極大周波数と声道特性の極小周波数とを、いずれも、線形予測符号化スペクトルを用いて算出するように構成されてもよく、このようにすれば、ホルマント周波数とアンチホルマント周波数の位置を変更せずに増幅率を算でき、明瞭度の低下又は雑音感の増加を回避できる。
【０１５０】
（５）前記残差信号強調部が、信号抽出分離部にて分離された残差信号のピッチを強調するピッチ強調部をそなえて構成されてもよく、このようにすれば、例えばピッチ強調フィルタの係数が得られ、残差信号を適切に強調できる。
（６）前記声道特性修正部が、信号抽出分離部にて抽出された声道特性のホルマントとアンチホルマントとのそれぞれについての物理的特性を推定する推定部と、信号抽出分離部にて抽出された声道特性と、推定部にて推定された物理的特性とに基づいて増幅率を算出する増幅率算出部とをそなえて構成されてもよく、また、極大周波数におけるホルマント振幅と極小周波数におけるアンチホルマント振幅との差が大きくなるように、声道特性の振幅を増幅又は減衰させるように構成されてもよい。
【０１５１】
従って、このようにすれば、明瞭度の向上に加えて、相対的なホルマント強調効果が得られ、さらに明瞭度を高めることができる。
（７）前記増幅率算出部は、例えば次に示す（Ｕ１）〜（Ｕ６）の方法を用いることができる。
（Ｕ１）極大周波数におけるホルマント振幅と極小周波数におけるアンチホルマント振幅との差が大きくなるように、声道特性の振幅を増幅又は減衰させる方法。
【０１５２】
従って、特にアンチホルマントの減衰により、音声符号化方式によって処理された音声に生じやすい雑音感を抑えることができる。
（Ｕ２）所定の固定増幅率を用いて増幅又は減衰するように構成されてもよく、このようにすれば、音声の性質に合わせて適応的にフィルタ係数が得られ、音声強調が可能になる。
【０１５３】
（Ｕ３）前記増幅率算出部は、極大周波数、極小周波数および声道特性の振幅のそれぞれに基づいて増幅率を算出するように構成されてもよく、このようにすれば、雑音環境下において適切な増幅率が得られる。
（Ｕ４）前記増幅率算出部は、極大周波数の増幅率を、複数の極大周波数の振幅平均値に基づいて算出し、極小周波数の増幅率を、複数の極小周波数の振幅平均値に基づいて算出するように構成されてもよく、このようにすれば、きめ細かい音声強調が可能になる。
【０１５４】
（Ｕ５）周波数に応じて増幅率に重み付けする方法。これにより、明瞭度が向上する。
（Ｕ６）隣接する極大周波数および極小周波数の間に存在する周波数の増幅率を、極小周波数における増幅率以上、極大周波数における増幅率以下の値をとる補間曲線を用いて補間する方法。これにより、例えばユーザは一定の受話音声を得られる。
【０１５５】
（８）前記声道特性修正部は、例えば次の２種類の方法を用いることができる。
第１に、補間曲線として、極大周波数を通り、かつ極小周波数において極小値をとる二次曲線を用いて補間する。これにより、効果的にコントラスト強調が可能になる。
【０１５６】
第２に、現フレームにて算出された増幅率を、前フレームの増幅率と比較して、前フレームからの増幅率の差分又は比率が所定の閾値以上であった場合は、前フレームの増幅率に定数を加算又は乗算した値を現フレームの増幅率とする。
このようにすれば、安定した音声の強調度を算出できる。
（９）前記強調音声信号の振幅を制御する自動利得制御部をそなえて構成されてもよく、このようにすれば、出力音声の振幅を過度に調整でき、滑らかで自然性の高い受話音声を得られる。
【０１５７】
（１０）本発明の音声強調装置によれば、入力音声信号から声道特性を抽出するとともに入力音声信号から残差信号を分離する信号抽出分離部と、信号抽出分離部にて抽出された声道特性のホルマントとアンチホルマントとのそれぞれについての物理的特性を推定する推定部と、信号抽出分離部にて抽出された声道特性と、推定部にて推定された物理的特性とに基づいて算出した増幅率を用いて、信号抽出分離部にて抽出された声道特性のホルマントを強調するとともに声道特性のアンチホルマントを減衰させた強調声道特性を出力する声道特性修正部と、入力音声信号を用いて信号抽出分離部にて分離された残差信号を強調する残差信号強調部と、残差信号強調部にて強調された残差信号と、声道特性修正部から出力された強調声道特性とを合成した合成信号を出力する合成部とをそなえて構成されているので、声道特性と音源特性を同時に強調する場合に発生するスペクトル歪を抑え、かつ明瞭度を改善できる。
【０１５８】
（１１）本発明の音声強調装置によれば、入力音声信号の周波数特性を抽出する周波数特性抽出部と、周波数特性抽出部にて抽出された周波数特性についてホルマント振幅が極大値をとる周波数である極大周波数と、アンチホルマント振幅が極小値をとる周波数である極小周波数とを算出する特徴算出部と、特徴算出部にて算出された極大周波数および極小周波数に基づいて、入力音声信号の周波数特性を修正した強調音声信号を出力する周波数特性修正部とをそなえて構成されているので、やはり、受話音声の明瞭度が向上する。
【０１６１】
（１２）本発明の携帯端末によれば、無線信号を受信する受信部と、受信部にて受信された無線信号を復調して音声信号を処理し音声信号を出力する音声処理部と、音声処理部にて処理された音声信号を強調する音声強調装置とをそなえ、音声強調装置が、入力音声信号から声道特性を抽出するとともに入力音声信号から残差信号を分離する信号抽出分離部と、信号抽出分離部にて抽出された声道特性のホルマントを強調するとともに声道特性のアンチホルマントを減衰させた強調声道特性を出力する声道特性修正部と、入力音声信号を用いて信号抽出分離部にて分離された残差信号を強調する残差信号強調部と、残差信号強調部にて強調された残差信号と、声道特性修正部から出力された強調声道特性とを合成した合成信号を出力する合成部とをそなえて構成されているので、例えば携帯電話の周囲に雑音が存在していても明瞭な音声が得られる。
【図面の簡単な説明】
【図１】本発明の原理ブロック図である。
【図２】本発明の原理ブロック図をさらに詳細に示す図である。
【図３】本発明の第１実施形態に係る音声強調装置のブロック図である。
【図４】本発明の第１実施形態に係る増幅率算出部の増幅率算出を説明するためのフローチャートである。
【図５】本発明の第１実施形態に係るホルマント増幅率の決定方法を説明するための図である。
【図６】本発明の第１実施形態に係るアンチホルマント増幅率の決定方法を説明するための図である。
【図７】本発明の第１実施形態に係る二次曲線を用いた増幅率の補間方法を説明するための図である。
【図８】本発明の第１実施形態に係る補間方法により補間された増幅率を示す図である。
【図９】本発明の第１実施形態に係る音声強調方法を説明するためのフローチャートである。
【図１０】本発明の第２実施形態に係る音声強調装置のブロック図である。
【図１１】本発明の第２実施形態に係る音声強調方法を説明するためのフローチャートである。
【図１２】本発明の第３実施形態に係る音声強調装置のブロック図である。
【図１３】本発明の第３実施形態に係る音声強調方法を説明するためのフローチャートである。
【図１４】本発明の第４実施形態に係る音声強調装置のブロック図である。
【図１５】本発明の第４実施形態に係る音声強調方法を説明するためのフローチャートである。
【図１６】本発明の第５実施形態に係る音声強調装置のブロック図である。
【図１７】本発明の第５実施形態に係る音声強調方法を説明するためのフローチャートである。
【図１８】（ａ）は従来技術の音声強調処理によるスペクトルを表す図であり、（ｂ）は本発明の音声強調処理によるスペクトルを表す図である。
【図１９】音声スペクトルの一例を示す図である。
【図２０】本発明が適用される携帯端末の概略的なブロック図である。
【図２１】音声の生成モデルを示す図である。
【図２２】従来の音声スペクトル強調装置のブロック図である。
【図２３】受話音声品質を向上させる音声強調装置の構成例を示す図である。
【符号の説明】
１，１ａ〜１ｅ音声強調装置
２信号分離部（信号抽出分離部）
３残差信号強調部（ピッチ強調部）
２ａ逆フィルタ
２ｂ第１フィルタ係数算出部
２ｄ自己相関算出部
２ｆ第１バッファ
２ｅ平均自己相関算出部
４ホルマント／アンチホルマント強調部（声道特性修正部）
４ａホルマント／アンチホルマント推定部（推定部）
４ｂ，４ｂ′ 増幅率算出部
４ｃスペクトル強調部
４ｄ第２フィルタ係数算出部
４ｅ第２バッファ
４ｆ比較部
５信号合成部（合成フィルタ，合成部）
６自動利得制御部
１２平均スペクトル算出部
１５携帯電話（携帯端末）
１５ａマイク
１５ｂ送話部
１５ｃコーダ
１５ｄデータ処理部
１５ｅ無線送受信部
１５ｆデコーダ
１５ｇ受話部
１５ｈスピーカ
１５ｉ主制御部
１５ｊアンテナ
１６無線基地局

Claims

入力音声信号の自己相関関数と過去のフレームから算出した自己相関関数との加重平均を用いて該入力音声信号から平均的な声道特性を抽出するとともに前記平均的な声道特性を用いて該入力音声信号から残差信号を分離する信号抽出分離部と、
該信号抽出分離部にて抽出された声道特性のホルマントを強調するとともに該声道特性のアンチホルマントを減衰させた強調声道特性を出力する声道特性修正部と、
該信号抽出分離部にて分離された該残差信号と、該声道特性修正部から出力された強調声道特性とを合成した合成信号を出力する合成部とをそなえて構成されたことを特徴とする、音声強調装置。
該声道特性修正部が、
該信号抽出分離部にて抽出された声道特性のホルマントとアンチホルマントとのそれぞれについての物理的特性を推定する推定部と、
該信号抽出分離部にて抽出された声道特性と、該推定部にて推定された該物理的特性とに基づいて増幅率を算出する増幅率算出部とをそなえて構成されたことを特徴とする、請求項１記載の音声強調装置。
該声道特性修正部が、
該極大周波数におけるホルマント振幅と該極小周波数におけるアンチホルマント振幅との差が大きくなるように、該声道特性の振幅を増幅又は減衰させるように構成されたことを特徴とする、請求項１記載の音声強調装置。
該声道特性修正部は、
隣接する該極大周波数および該極小周波数の間に存在する周波数の増幅率を、該極小周波数における増幅率以上、該極大周波数における増幅率以下の値をとる補間曲線を用いて補間するように構成されたことを特徴とする、請求項２記載の音声強調装置。
該合成信号の振幅を制御する自動利得制御部をそなえて構成されたことを特徴とする、請求項１〜請求項４のいずれか１項記載の音声強調装置。
入力音声信号の自己相関関数と過去のフレームから算出した自己相関関数との加重平均を用いて該入力音声信号から平均的な声道特性を抽出するとともに前記平均的な声道特性を用いて該入力音声信号から該入力音声信号から残差信号を分離する信号抽出分離部と、
該信号抽出分離部にて抽出された声道特性のホルマントとアンチホルマントとのそれぞれについての物理的特性を推定する推定部と、
該信号抽出分離部にて抽出された声道特性と、該推定部にて推定された該物理的特性とに基づいて算出した増幅率を用いて、該信号抽出分離部にて抽出された声道特性のホルマントを強調するとともに該声道特性のアンチホルマントを減衰させた強調声道特性を出力する声道特性修正部と、
該信号抽出分離部にて分離された該残差信号と、該声道特性修正部から出力された強調声道特性とを合成した合成信号を出力する合成部とをそなえて構成されたことを特徴とする、音声強調装置。
無線信号を受信する受信部と、該受信部にて受信された無線信号を復調して音声信号を処理し音声信号を出力する音声処理部と、該音声処理部にて処理された音声信号を強調する音声強調装置とをそなえ、
該音声強調装置が、
該音声処理部から入力される入力音声信号の自己相関関数と過去のフレームから算出した自己相関関数との加重平均を用いて該入力音声信号から平均的な声道特性を抽出するとともに前記平均的な声道特性を用いて該入力音声信号から該入力音声信号から残差信号を分離する信号抽出分離部と、
該信号抽出分離部にて抽出された声道特性のホルマントを強調するとともに該声道特性のアンチホルマントを減衰させた強調声道特性を出力する声道特性修正部と、
該信号抽出分離部にて分離された該残差信号と該声道特性修正部から出力された強調声道特性とを合成した合成信号を、前記強調された音声信号として出力する合成部とをそなえて構成されたことを特徴とする、携帯端末。