JP2004219757A - 音声強調装置,音声強調方法および携帯端末 - Google Patents

音声強調装置,音声強調方法および携帯端末 Download PDF

Info

Publication number
JP2004219757A
JP2004219757A JP2003007543A JP2003007543A JP2004219757A JP 2004219757 A JP2004219757 A JP 2004219757A JP 2003007543 A JP2003007543 A JP 2003007543A JP 2003007543 A JP2003007543 A JP 2003007543A JP 2004219757 A JP2004219757 A JP 2004219757A
Authority
JP
Japan
Prior art keywords
signal
unit
vocal tract
formant
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2003007543A
Other languages
English (en)
Other versions
JP4227421B2 (ja
Inventor
Masakiyo Tanaka
正清 田中
Masanao Suzuki
政直 鈴木
Takashi Ota
恭士 大田
Yoshiteru Tsuchinaga
義照 土永
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2003007543A priority Critical patent/JP4227421B2/ja
Publication of JP2004219757A publication Critical patent/JP2004219757A/ja
Application granted granted Critical
Publication of JP4227421B2 publication Critical patent/JP4227421B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Abstract

【課題】受話音声の処理回路において、受話音声の明瞭度を改善し出力音声信号の振幅を適切に制御しかつスペクトルの急激な変化による雑音感をなくし、受話音声の品質劣化および雑音感増加を抑圧可能な、音声強調装置を提供する。
【解決手段】音声強調装置1が、入力音声信号から声道特性を抽出するとともに入力音声信号から残差信号を分離する信号分離部2と、信号分離部2にて抽出された声道特性のホルマントを強調するとともに声道特性のアンチホルマントを減衰させた強調声道特性を出力するホルマント/アンチホルマント強調部4と、入力音声信号を用いて信号分離部2にて分離された残差信号を強調する残差信号強調部3と、残差信号強調部3にて強調された残差信号と、ホルマント/アンチホルマント強調部4から出力された強調声道特性とを合成した合成信号を出力する信号合成部5とをそなえて構成する。
【選択図】 図1

Description

【0001】
【発明の属する技術分野】
本発明は、例えば携帯電話(携帯端末)の受話音声の聞きやすさを向上させる音声強調装置,音声強調方法および携帯端末に関し、特に、携帯電話の周囲に背景雑音が存在する環境(以下、雑音環境下と称する。)において聞きやすさを向上させる技術に用いて好適な、音声強調装置,音声強調方法および携帯端末に関する。
【0002】
【従来の技術】
近年、携帯電話が普及し、様々な場所において使用されている。携帯電話は、静かな場所のみならず、空港又は駅のホーム等の騒がしい環境において使用されることも多い。この雑音環境下においては、受話音声の品質が劣化し、受話音声が聞きにくくなる。
【0003】
この雑音環境下における受話音声の聞きにくさを改善する方法として、音声の周波数スペクトル(以下、音声スペクトル又は単にスペクトルと称する。)の極大をとる部分(ホルマント)を強調して音声の明瞭度を高める方法が知られている。なお、この強調とは、音声スペクトルの振幅を増幅することを意味する。
図19は音声スペクトルの一例を示す図である。この図19に示す音声スペクトル曲線は、極大をとる部分(ホルマント)を例えば3カ所有し、これらの極大部分は、周波数の低い側から順に、それぞれ、第1ホルマント,第2ホルマント,第3ホルマントと呼ばれている。また、極大値における周波数fp(1),fp(2)およびfp(3)は、それぞれ、ホルマント周波数と呼ばれる。そして、携帯電話の音声処理部(図示省略)が、各ホルマントを強調し、これにより、音声の明瞭度が向上するのである。
【0004】
ここで、以下の説明において使用される語句について、図21を参照して説明する。
図21は音声の生成モデルを示す図であって、特に母音のような有声音の時間波形の処理プロセスが表示されている。この図21に示す音源500は声帯の振動によって発生する周期的な波形(以下、声帯波と称する。)である。この声帯の振動周期は、一定の周期(ピッチ周期)を有する。また、調音系(Articulation)501は声道(Vocal Tract:声帯から唇までの空間)である。そして、肺からの空気が、声道の形状(例えば声道の太さ)に共振し母音が生成され、また、声道の形状の変更により複数の異なる母音が得られる。さらに、唇502は、音源500および調音系501により生成された音声波を音響的な音声波形として空間に放射するものである。これにより、音源500が発生した音源信号は、調音系501において声道特性が付加され、そして、唇502から音声となって放射される(例えば非特許文献1参照)。
【0005】
また、図21に示す生成モデルをスペクトルの観点から説明する。
唇502から出力される音声波形のスペクトルの包絡線は、音源500(声帯波)のスペクトル包絡線と調音系501のスペクトル特性との積により得られる。ここで、唇502からの音声波形についての線形予測分析により抽出される特性は、音源500の周波数特性と調音系501の周波数特性とが一体化されたものであり、従って、両者を分離抽出することができない。
【0006】
一方、音声波形のスペクトルについて、線形予測分析によるシステム関数の逆関数に基づくフィルタリングを行なうと、音声波形のスペクトルの包絡線の特性が除去されて音源500のほぼ一様なスペクトルが得られる。また、音声波形から線形予測可能な部分を除去したものは残差信号(音源信号)と呼ばれる。そして、この残差信号の自己相関を算出すると、音源500の周期が抽出される。
【0007】
次に、具体的に、ホルマント強調により音声の明瞭度を向上させる方法について説明する(例えば、特許文献1)。
特許文献1記載の音声スペクトル強調装置は、凸部帯域の周波数成分については振幅スペクトルを強調し、凹部帯域の周波数成分については振幅スペクトルを減衰させるものである。
【0008】
図22は従来の音声スペクトル強調装置のブロック図である。この図22に示す音声スペクトル強調装置は、スペクトル推定部102にて推定されたスペクトルが、ホルマント/アンチホルマント決定部103において、LPCスペクトル(Linear Predictive Coding スペクトル[LPC係数スペクトル])を用いて、凸部周波数(ホルマント周波数を含む帯域)と凹部周波数(アンチホルマント(振幅が極小をとる部分)周波数を含む帯域)とが決定され、凸部周波数と凹部周波数を用いて凸部帯域と凹部帯域が決定される。また、LPC係数を用いて凸部倍率と凹部倍率が得られる。フィルタ構成部106は、凸部帯域および凹部帯域と凸部倍率および凹部倍率を用いてスペクトル強調し、フィルタ部107にてフィルタリングされ、ゲイン算出部111でスペクトルが分岐され、合成部112で合成されて出力される。これにより、理想的なスペクトル強調が可能となる。
【0009】
この半面、音声スペクトル強調装置は、次の2種類の課題を有する。
第1に、図21に示す音声スペクトル強調装置は、音声を音源特性と声道特性とに分離せずに音声自体を直接強調するので、音源特性の歪みが大きい。このため、雑音感が増加し、明瞭度が劣化する。
図21に示す音声の生成モデルにおいて、音源特性と声道特性とは全く異なる特性を有するにもかかわらず、音声スペクトル強調装置は、音声が有する特性を音源特性と声道特性とに分離せずに音声を直接増幅している。このため、音源特性の歪みが大きくなり、雑音感が増加し、明瞭度が劣化する。
【0010】
第2に、図21に示す音声スペクトル強調装置は、入力音声信号から得られたLPCスペクトル又はFFT(Fast Fourier Transformation)スペクトルに対して直接ホルマントを強調するものである。このため、音声スペクトル強調装置が入力音声信号を符号化した入力音声データをフレーム毎に処理する場合は、フレーム間において増幅率又は減衰率が変化する。従って、フレーム間における増幅率又は減衰率が急激に変化する場合があり、その場合は、スペクトルが不連続となり急激に変化する。このスペクトルの変化は、ユーザが実際に音を聞くときに雑音感として認識される。
【0011】
ここで、LPCスペクトルとは、LPCを用いて計算したスペクトルであり、FFTスペクトルとは、高速フーリエ変換を用いて計算した信号のパワースペクトルである。
このスペクトルの不連続性を改善する方法は、例えばフレーム長を大きくする方法が知られている。すなわち、フレーム長を長くすると時間的にスペクトル変動の少ない平均的なスペクトル特性が得られる。
【0012】
この半面、フレーム長を長くすることは、音声処理および音声データの伝送について、遅延時間が大きくなる。一方、携帯電話などの通信用途は、遅延時間をできるだけ小さくする必要があるので、通信用途の観点からは、フレーム長は短いほうが望ましい。従って、フレーム長を大きくせずにスペクトルの急激な変動を防止する必要がある。
【0013】
この課題に対して、発明者らは、受話音声の明瞭度を高めるとともに、雑音感の増加を抑制可能な音声強調装置を提案した。
図23は受話音声品質を向上させる音声強調装置の構成例を示す図である。この図23に示す音声強調装置600に入力された入力音声信号は、信号分離部601において残差信号(音源信号)と声道特性とに分離される。そして、残差信号と声道特性とは、それぞれ、残差信号強調部602とホルマント強調部603とにおいて個別に強調され、これらの強調された強調残差信号と声道特性とは、信号合成部604において再合成され、これにより、強調された音声が出力されるようになっている。
【0014】
この音声強調装置600は、残差信号と声道特性とをそれぞれ分離して強調するので、残差信号と声道特性との各々の特性に合った音声強調が可能となる。従って、この音声強調装置600は、特許文献1記載の音声スペクトル強調装置が有する技術課題、すなわち、音源特性の歪みを生じさせないで音声強調でき、また、特許文献1記載の音声スペクトル強調装置に比較して、高い明瞭度を得ることができる。さらに、音声強調装置600は、声道特性のホルマントを強調するので一層明瞭度が改善される。
【0015】
【非特許文献1】
中田和男著,「音声の高能率符号化」,森北出版株式会社,1986年9月,p.69−71
【特許文献1】
特開2001−117573号公報
【0016】
【発明が解決しようとする課題】
しかしながら、図23に示す音声強調装置600は、声道特性と音源特性とを同時に強調するので、スペクトル歪が発生し、明瞭度が劣化する可能性がある。
また、ホルマント周波数とアンチホルマント周波数との各位置が変更されることにより、雑音感が増加するという課題がある。
【0017】
さらに、スペクトル強調によって出力音声信号の振幅が入力音声信号に比較して過度に大きくなる可能性が依然として残る。
加えて、フレーム間の急激なスペクトル変化が発生し雑音が生じる可能性があるという課題もある。
本発明は、このような課題に鑑み創案されたもので、例えば携帯電話等の受信信号の音声処理回路等において、受話音声の明瞭度を改善して聞きやすくし、出力音声信号が適切な大きさの振幅を有し、かつスペクトルの急激な変化に起因する雑音を防止し、受話音声の品質劣化および雑音感増加を抑圧可能な、音声強調装置,音声強調方法および携帯端末を提供することを目的とする。
【0018】
【課題を解決するための手段】
このため、本発明の音声強調装置は、入力音声信号から声道特性を抽出するとともに入力音声信号から残差信号を分離する信号抽出分離部と、信号抽出分離部にて抽出された声道特性のホルマントを強調するとともに声道特性のアンチホルマントを減衰させた強調声道特性を出力する声道特性修正部と、入力音声信号を用いて信号抽出分離部にて分離された残差信号を強調する残差信号強調部と、残差信号強調部にて強調された残差信号と、声道特性修正部から出力された強調声道特性とを合成した合成信号を出力する合成部とをそなえて構成されたことを特徴としている(請求項1)。
【0019】
前記信号抽出分離部は、線形予測分析して得られるLPC係数を、現フレームの入力音声信号から算出した自己相関関数と、過去のフレームから算出した自己相関関数との加重平均を用いて算出するように構成することができる(請求項2)。
また、前記声道特性修正部は、信号抽出分離部にて抽出された声道特性のホルマントとアンチホルマントとのそれぞれについての物理的特性を推定する推定部と、信号抽出分離部にて抽出された声道特性と、推定部にて推定された物理的特性とに基づいて増幅率を算出する増幅率算出部とをそなえて構成されてもよい(請求項3)。
【0020】
さらに、前記声道特性修正部は、極大周波数におけるホルマント振幅と極小周波数におけるアンチホルマント振幅との差が大きくなるように、声道特性の振幅を増幅又は減衰させるように構成されてもよい(請求項4)。
前記声道特性修正部は、隣接する極大周波数および極小周波数の間に存在する周波数の増幅率を、極小周波数における増幅率以上、極大周波数における増幅率以下の値をとる補間曲線を用いて補間するように構成されてもよい(請求項5)。
【0021】
そして、強調音声信号の振幅を制御する自動利得制御部をそなえて構成することもできる(請求項6)。
また、本発明の音声強調装置は、入力音声信号から声道特性を抽出するとともに入力音声信号から残差信号を分離する信号抽出分離部と、信号抽出分離部にて抽出された声道特性のホルマントとアンチホルマントとのそれぞれについての物理的特性を推定する推定部と、信号抽出分離部にて抽出された声道特性と、推定部にて推定された物理的特性とに基づいて算出した増幅率を用いて、信号抽出分離部にて抽出された声道特性のホルマントを強調するとともに声道特性のアンチホルマントを減衰させた強調声道特性を出力する声道特性修正部と、入力音声信号を用いて信号抽出分離部にて分離された残差信号を強調する残差信号強調部と、残差信号強調部にて強調された残差信号と、声道特性修正部から出力された強調声道特性とを合成した合成信号を出力する合成部とをそなえて構成されたことを特徴としている(請求項7)。
【0022】
さらに、本発明の音声強調装置は、入力音声信号の周波数特性を抽出する周波数特性抽出部と、周波数特性抽出部にて抽出された周波数特性についてホルマント振幅が極大値をとる周波数である極大周波数と、アンチホルマント振幅が極小値をとる周波数である極小周波数とを算出する特徴算出部と、特徴算出部にて算出された極大周波数および極小周波数に基づいて、入力音声信号の周波数特性を修正した強調音声信号を出力する周波数特性修正部とをそなえて構成されたことを特徴としている(請求項8)。
【0023】
そして、本発明の音声強調方法は、入力音声信号から声道特性と残差信号とを分離し、分離された残差信号を強調し、声道特性についてホルマントとアンチホルマントとの振幅差を強調し、強調された残差信号と強調された声道特性とを再合成した強調音声信号を出力することを特徴としている(請求項9)。
加えて、本発明の携帯端末は、無線信号を受信する受信部と、受信部にて受信された無線信号を復調して音声信号を処理し音声信号を出力する音声処理部と、音声処理部にて処理された音声信号を強調する音声強調装置とをそなえ、音声強調装置が、入力音声信号から声道特性を抽出するとともに入力音声信号から残差信号を分離する信号抽出分離部と、信号抽出分離部にて抽出された声道特性のホルマントを強調するとともに声道特性のアンチホルマントを減衰させた強調声道特性を出力する声道特性修正部と、入力音声信号を用いて信号抽出分離部にて分離された残差信号を強調する残差信号強調部と、残差信号強調部にて強調された残差信号と、声道特性修正部から出力された強調声道特性とを合成した合成信号を出力する合成部とをそなえて構成されたことを特徴としている(請求項10)。
【0024】
【発明の実施の形態】
以下、図面を参照して本発明の実施の形態を説明する。
(A)本発明の原理の説明
図1は本発明の原理ブロック図である。この図1に示す音声強調装置1は、携帯電話等の受話部分に設けられ明瞭度が高い音声を出力するものであって、信号分離部(信号抽出分離部)2と、ホルマント/アンチホルマント強調部(ホルマントおよびアンチホルマント強調部:声道特性修正部)4と、残差信号強調部3と、信号合成部(合成部)5とをそなえて構成されている。
【0025】
ここで、信号分離部2は、入力音声信号から声道特性を抽出するとともに入力音声信号から残差信号を分離するものである。ホルマント/アンチホルマント強調部4は、信号分離部2にて抽出された声道特性のホルマントを強調するとともに声道特性のアンチホルマントを減衰させた強調声道特性を出力するものである。また、残差信号強調部3は、入力音声信号を用いて信号分離部2にて分離された残差信号を強調するものである。さらに、信号合成部5は、残差信号強調部3にて強調された残差信号と、ホルマント/アンチホルマント強調部4から出力された強調声道特性とを合成した合成信号を出力するものである。
【0026】
これにより、入力音声信号は、信号分離部2にて、残差信号と声道特性と分離され、残差信号は、残差信号強調部3にて強調され、その強調された残差信号が出力される。また、声道特性は、ホルマント/アンチホルマント強調部4にて強調されて強調された声道特性が出力される。そして、強調された残差信号と強調された声道特性とはいずれも、信号合成部5にて音声合成され出力音声として出力される。
【0027】
また、ホルマント/アンチホルマント強調部4は、ホルマントを増幅するとともにアンチホルマントを減衰させ、これにより、ホルマントとアンチホルマントとの振幅差を示すコントラストを強調(コントラスト強調)している。
従って、本発明の音声強調方法は、まず、信号分離部2が、入力音声信号から声道特性と残差信号とを分離し、次に、残差信号強調部3が、分離された残差信号を強調し、声道特性についてホルマントとアンチホルマントとの振幅差を強調し、そして、信号合成部5が、強調された残差信号と強調された声道特性とを再合成した強調音声信号を出力する。これにより、音声の個々の特性に応じて強調できる。
【0028】
さらに、本発明の音声強調装置1は、入力音声信号の周波数特性を抽出する周波数特性抽出部と、周波数特性抽出部にて抽出された周波数特性についてホルマント振幅が極大値をとる周波数である極大周波数と、アンチホルマント振幅が極小値をとる周波数である極小周波数とを算出する特徴算出部と、特徴算出部にて算出された極大周波数および極小周波数に基づいて、入力音声信号の周波数特性を修正した強調音声信号を出力する周波数特性修正部とをそなえて構成されている。
【0029】
(1)信号分離部2
図2は本発明の原理ブロック図をさらに詳細に示す図である。この図2に示す音声強調装置1の信号分離部2は、入力音声信号x(n)(ここで、x(n),(0≦n<N)であり、Nはフレーム長を表す。)について、線形予測分析して得られるLPC係数(線形予測符号化係数)により定まる帯域フィルタリングを行なうことにより、残差信号を分離するものであって、平均スペクトル算出部12と、第1フィルタ係数算出部2bと、逆フィルタ2aとをそなえて構成されている。
【0030】
この平均スペクトル算出部12は、入力音声信号x(n)について算出された平均自己相関(自己相関値)から、平均スペクトルsp(l)を算出して出力するものである(lはelを表す。)。よく知られているように、自己相関は時間領域における音声波形の類似性を示し、また、自己相関はフーリエ変換されるとスペクトル分布(電力スペクトル密度)が得られるので、時間領域および周波数領域の両領域における音声波形の物理的特性の解析に有用である。
【0031】
第1フィルタ係数算出部2bは、平均スペクトル算出部12からの平均スペクトルsp(l)に基づいて逆フィルタ2aのフィルタ係数を算出して逆フィルタ2aに入力するものである。
そして、逆フィルタ2aは、例えばFIR(Finite Impulse Response)フィルタである。この逆フィルタ2aに入力される入力音声信号x(n)は、音源の周波数特性と調音系の周波数特性とが一体化された音声波形特性を有する(図22参照)。そして、その一体化された入力音声信号x(n)が逆フィルタ2aのフィルタリングにより、音声波形から線形予測可能な部分が除去されて、音源信号が抽出される。換言すれば、音源信号は、フィルタリング後に残された信号(残差信号)に相当する。
【0032】
従って、フィルタ係数を適応的に設定でき、雑音環境下において、適切に音声を強調できる。
これにより、入力音声信号x(n)は、逆フィルタ2aに入力される一方、平均スペクトル算出部12に入力されて平均スペクトルsp(l)が算出される。そして、算出された平均スペクトルsp(l)は、第1フィルタ係数算出部2bに入力され、この第1フィルタ係数算出部2bにおいて算出されたフィルタ係数αが逆フィルタ2aに設定される。また、この逆フィルタ2aは、残差信号r(n)を出力する。さらに、平均スペクトル算出部12からの平均スペクトルsp(l)は、ホルマント/アンチホルマント強調部4にも入力される。
【0033】
これにより、入力音声信号x(n)は、残差信号r(n)と平均スペクトルsp(l)とに分離される。
(2)ピッチ強調部3
ピッチ強調部3は、信号分離部2にて分離された残差信号r(n)のピッチを強調するものであって、残差信号強調部として機能する。ピッチ強調部3は、残差信号r(n)を強調して強調残差信号s(n)を出力する。このピッチ強調により、ピッチ強調フィルタの係数が得られ、残差信号r(n)を適切に強調できる。
【0034】
(3)ホルマント/アンチホルマント強調部4
ホルマント/アンチホルマント強調部4は、平均スペクトルsp(l)からホルマントおよびアンチホルマントを推定する機能と、その推定されたホルマントおよびアンチホルマントのそれぞれの振幅を増幅又は減衰する機能とを有し、ホルマント/アンチホルマント推定部(推定部)4aと、増幅率算出部4bと、スペクトル強調部4cと、第2フィルタ係数算出部4dとをそなえて構成されている。
【0035】
ここで、ホルマント/アンチホルマント推定部4aは、信号分離部2にて抽出された声道特性のホルマントとアンチホルマントとのそれぞれについての物理的特性を推定するものである。この物理的特性は、特に断らない限り、以下の説明において、ホルマント周波数fp,アンチホルマント周波数fv,ホルマント周波数振幅amppおよびアンチホルマント周波数振幅ampvを意味する。
【0036】
増幅率算出部4bは、信号分離部2にて抽出された声道特性と、ホルマント/アンチホルマント推定部4aにて推定された物理的特性(ホルマント周波数fp,アンチホルマント周波数fv,ホルマント周波数振幅amppおよびアンチホルマント周波数振幅ampv)とに基づいて増幅率β(l)を算出するものである(lはelを表す。)。
【0037】
この増幅率β(l)の算出について、増幅率算出部4bは、例えば次の(P1)〜(P6)に示す算出方法を用い、また、ホルマント/アンチホルマント推定部4aは、次の(P7),(P8)に示す算出方法を用いる。
(P1)極大周波数におけるホルマント振幅と極小周波数におけるアンチホルマント振幅との差が大きくなるように、声道特性の振幅を増幅又は減衰させる方法。
【0038】
(P2)固定増幅率を用いた増幅又は減衰による方法。
(P3)極大周波数、極小周波数および声道特性の振幅のそれぞれに基づく算出方法。
(P4)極大周波数の増幅率を、複数の極大周波数の振幅平均値に基づいて算出し、極小周波数の増幅率を、複数の極小周波数の振幅平均値に基づいて算出する方法。
【0039】
(P5)周波数に応じて増幅率に重み付けする方法。
(P6)隣接する極大周波数および極小周波数の間に存在する周波数の増幅率を、極小周波数における増幅率以上、極大周波数における増幅率以下の値をとる補間曲線を用いて補間する方法。
(P7)ホルマント/アンチホルマント強調部4は、補間曲線として、極大周波数を通り、かつ極小周波数において極小値をとる二次曲線を用いて補間する。
【0040】
(P8)ホルマント/アンチホルマント強調部4は、現フレーム(現在時刻tのフレーム)にて算出された増幅率を前フレームの増幅率と比較して、前フレームからの増幅率の差分又は比率が予め設定した閾値以上の場合は、前フレームの増幅率に定数を加算又は乗算した値を現フレームの増幅率とする。
スペクトル強調部4cは、平均スペクトルsp(l)を、増幅率算出部4bにて算出された増幅率β(l)により増幅しその増幅スペクトルsp(l)を出力するものである(lはelを表す。)。また、第2フィルタ係数算出部4dは、スペクトル強調部4cからの増幅スペクトルsp(l)に基づいてフィルタ係数を算出するものである。
【0041】
さらに、合成フィルタ5(合成部,信号合成部)は、ピッチ強調部3からの強調残差信号s(n)と、第2フィルタ係数算出部4dからのフィルタ係数αとを合成して、出力音声y(n)を出力するものである。
これにより、ホルマント/アンチホルマント推定部4aにおいて、平均スペクトル算出部12から出力された平均スペクトルsp(l)についてホルマントとアンチホルマントとの双方が推定される。また、これらのホルマントとアンチホルマントとは、ともに、スペクトル強調部4cにおいて、増幅率算出部4bにおいて算出された増幅率を用いて強調されて、増幅スペクトルsp(l)が出力される。そして、第2フィルタ係数算出部4dは、この増幅スペクトルsp(l)に基づき、以下に述べる合成フィルタ5のフィルタ係数αを算出し、このフィルタ係数αを合成フィルタ5に入力する。
【0042】
従って、本発明の音声強調装置1は、入力音声信号x(n)から声道特性を抽出するとともに入力音声信号x(n)から残差信号r(n)を分離する信号分離部2と、信号分離部2にて抽出された声道特性のホルマントとアンチホルマントとのそれぞれについての例えばホルマント周波数fp,アンチホルマント周波数fv,ホルマント周波数振幅amppおよびアンチホルマント周波数振幅ampv等の物理的特性を推定するホルマント/アンチホルマント推定部4aと、信号分離部2にて抽出された声道特性と、ホルマント/アンチホルマント推定部4aにて推定された物理的特性とに基づいて算出した増幅率を用いて、信号分離部2にて抽出された声道特性のホルマントを強調するとともに声道特性のアンチホルマントを減衰させた強調声道特性を出力するホルマント/アンチホルマント強調部4と、入力音声信号x(n)を用いて信号分離部2にて分離された残差信号r(n)を強調する残差信号強調部3と、残差信号強調部3にて強調された強調残差信号s(n)と、ホルマント/アンチホルマント強調部4から出力された強調声道特性とを合成した合成信号を出力する信号合成部5とをそなえて構成されたことになる。
【0043】
このように、本発明の音声強調装置1は、入力音声信号x(n)から残差信号r(n)と声道特性とに分離し、分離した残差信号r(n)と声道特性とをそれぞれ強調するので、明瞭な音声が得られる。さらに、ホルマントとアンチホルマントとの振幅差が強調されるので、雑音感が除去される。
従って、携帯電話は、空港等の雑音環境下においても、受話音声の品質は劣化せず、受話音声の聞きにくさが改善される。
【0044】
以下、音声強調方法について数式を用いて、(Q1)〜(Q10)に詳述する。
(4)音声強調方法
(Q1)信号分離部2は、入力音声信号x(n),(0≦n<N)から現フレームの自己相関関数を算出する。ここで、Nはフレーム長である。次に、現フレームの自己相関関数と過去フレームの自己相関関数との加重平均により平均自己相関を算出する。
【0045】
(Q2)信号分離部2は、その平均自己相関から平均スペクトルsp(l),(0≦l<N)を算出する。ここで、Nはスペクトル包絡線上のデータ点の個数であって、N≦Nとする。なお、平均スペクトルsp(l)は現フレームの入力音声から算出されるLPCスペクトル又はFFTスペクトルと、過去の入力音声から算出されるLPCスペクトル又はFFTスペクトルとの加重平均を算出して得てもよい。
【0046】
(Q3)信号分離部2は、平均スペクトルsp(l)をフィルタ係数算出部1に入力し逆フィルタ係数α(l),(1≦i≦p)を算出する。ここで、pは逆フィルタ2aのフィルタ次数である。
(Q4)入力音声信号x(n)をα(l)で構成される逆フィルタ2aに入力して残差信号r(n),(0≦n<N)を算出する。これにより、入力音声信号x(n)を残差信号r(n)と声道特性とに分離できる。
【0047】
(Q5)残差信号r(n)をピッチ強調部3に入力し、ピッチが強調された強調残差信号s(n)を算出する。
(Q6)ホルマント/アンチホルマント推定部4aに平均スペクトルsp(l)を入力し、ホルマント周波数fp(k),(1≦k≦kpmax)とその振幅ampp(k),(1≦k≦kpmax)およびアンチホルマント周波数fv(k),(1≦k≦kvmax)とその振幅ampv(k),(1≦k≦kvmax)を推定する。ここで、kpmaxは推定するホルマントの個数であり、また、kvmaxは推定するアンチホルマントの個数である。kpmaxおよびkvmaxの値は所望の方法を用いて得ることができ、サンプリング周波数が8kHzの音声に対しては、kpmaxおよびkvmaxは、ともに、4又は5などが好ましい。
【0048】
(Q7)平均スペクトルsp(l)と{fp(k),ampp(k)}および{fv(k),ampv(k)}とをそれぞれ増幅率算出部4bに入力し、平均スペクトルsp(l)についての増幅率β(l)を算出する。ここで、増幅率β(l)は、以下に示す条件I,IIを満たすように決定する。
I.隣接するホルマントとアンチホルマントとの振幅差が大きくなるようにする。
【0049】
II.増幅によってホルマント周波数とアンチホルマント周波数との位置が変動しない
ようにする。
このように、増幅率β(l)を決定することにより、雑音感や音の歪みが抑制され、明瞭度の向上および良好な音声強調が可能になり、受話音声の聞きにくさが改善される。
【0050】
(Q8)平均スペクトルsp(l)と増幅率β(l)とをスペクトル強調部4cに入力し、強調された増幅スペクトルsp(l)を算出する。
(Q9)増幅スペクトルsp(l)をフィルタ係数算出部2に入力して合成フィルタ係数α(i),(1≦i≦p)を算出する。ここで、pは合成フィルタ5のフィルタ次数である。
【0051】
(Q10)ピッチ強調後の強調残差信号s(n)をα(i)により構成される合成フィルタ5に入力し、出力音声y(n),(0≦n<N)を算出する。これにより、強調処理された音源特性と声道特性とが合成される。
このように、本発明の音声強調装置1は、入力音声信号x(n)を、残差信号r(n)と声道特性とに分離して個別に強調するので、強調残差信号s(n)および声道特性の各特性に適した音声強調が可能となり、また、強調によるスペクトル歪みが発生しない。
【0052】
また、このように、声道特性について、ホルマントとアンチホルマントとのそれぞれの振幅差の強調により、例えば音声強調装置600(図23参照)よりも高い明瞭度を得られる。また、音声符号化処理後の音声などについて雑音感を抑制できる。
図2に示す平均スペクトル算出部12の自己相関の算出とホルマント/アンチホルマント強調部4とについてさらに詳述する。
【0053】
ここで、アンチホルマントは2つの隣接するホルマントの間に存在するものとして説明するが、本発明の音声強調方法は、アンチホルマントが最低次ホルマントより低い周波数に存在する場合、又は最高次ホルマントより高い周波数に存在する場合のいずれにおいても適応できる。
(B)本発明の第1実施形態の説明
図20は本発明が適用される携帯電話(携帯端末)の概略的なブロック図である。この図20に示す携帯電話15は、音声通話を無線信号で送受信する基地局16と通信するものであって、マイク15a,送話部15b,コーダ15c,データ処理部15d,無線送受信部15e,アンテナ15j,デコーダ15f,受話部15g,スピーカ15hおよび主制御部15iをそなえて構成されている。
【0054】
ここで、送話部15bはマイク15aからのアナログ音声信号をディジタル音声信号に変換して出力するものであり、コーダ15cは送話部15bからのディジタル音声信号をアナログ圧縮されたディジタルコードに変換し符号化して出力するものであり、データ処理部15dは送信データおよび受信データを処理するものであり、無線送受信部15eはコーダ15cからのディジタルコードを無線信号に変換するとともに基地局16から受信した無線信号をディジタル音声データに変換してデータ処理部15dに入力するものである。
【0055】
さらに、データ処理部15dには主制御部15iが接続され、携帯電話15の各機能部を制御するものである。そして、デコーダ15fはデータ処理部15dからの圧縮されたディジタルコードをディジタル音声信号に変換出力するものである。受話部15gはデコーダ15fから出力されたディジタル音声信号を入力され、その入力音声信号(図1等に示す入力音声x(n)に相当する)に本発明の音声強調方法を適用して強調された出力音声を出力するものである。また、スピーカ15hは受話部15gからの出力音声をディジタル・アナログ変換によりアナログ音声に変換した後に、増幅して音声出力するものである。
【0056】
これにより、アンテナ15j,無線送受信部15eおよび主制御部15iとが協働することにより、受信部(15j,15e,15i)として機能し、また、データ処理部15d,デコーダ15fおよび主制御部15iが協働することにより、音声処理部(15d,15f,15i)として機能し、そして、受話部15gが音声強調装置1に相当する。
【0057】
従って、本発明の携帯電話15は、無線信号を受信する受信部(15j,15e,15i)と、この受信部(15j,15e,15i)にて受信された無線信号を復調して音声信号を処理し音声信号を出力する音声処理部(15d,15f,15i)と、この音声処理部(15d,15f,15i)にて処理された音声信号を強調する音声強調装置1(受話部15g)とをそなえている。そして、この音声強調装置1が、図1に示すように、入力音声信号から声道特性を抽出するとともに入力音声信号から残差信号を分離する信号抽出分離部2と、信号抽出分離部2にて抽出された声道特性のホルマントを強調するとともに声道特性のアンチホルマントを減衰させた強調声道特性を出力する声道特性修正部4と、入力音声信号を用いて信号抽出分離部2にて分離された残差信号を強調する残差信号強調部3と、残差信号強調部3にて強調された残差信号と、声道特性修正部4から出力された強調声道特性とを合成した合成信号を出力する信号合成部5とをそなえて構成されている。
【0058】
以下、特に断らない限り、本発明の音声強調装置1および後述する音声強調装置1a〜1eは、それぞれ、この図20に示す携帯電話15の受話部15gに適用されるものとして、説明する。
このように、音声強調装置1は、携帯電話15に設けられており、声道特性として音声の長時間特性を用いる方法、又は前フレームから増幅率に急激な変化を生じないように制限するので、短時間における急激なスペクトル変動に起因する雑音感を抑制でき、良好な音声強調を得られ、携帯電話の受話音声の聞きやすさが向上する。
【0059】
図3は本発明の第1実施形態に係る音声強調装置のブロック図である。この図3に示す音声強調装置1aの信号分離部2は、LPC係数を、現フレームの入力音声信号x(n)から算出した自己相関関数と、過去のフレームから算出した自己相関関数との加重平均を用いて算出するものであって、自己相関算出部2dと、第1バッファ2fと、平均自己相関算出部2eとをそなえて構成されている。
この図3に示すもので上述したものと同一のものは同一機能を有する。
【0060】
ここで、自己相関算出部2dは、現フレーム(現在時刻tのフレーム)の自己相関関数(Auto Correlation Function)ac(t)を算出するものである。また、第1バッファ2fは、過去のフレームの複数の自己相関関数(時刻t−1,…,時刻t−L)(Lは2以上の自然数を表す。)を保持するものである。さらに、平均自己相関算出部2eは、現フレームの自己相関関数ac(t)と、第1バッファ2fに保持された例えばL個の過去フレームの自己相関関数との(L+1)個の自己相関関数について加重平均した平均自己相関関数acAVEを出力するものである。
【0061】
そして、第1フィルタ係数算出部2bは、平均自己相関acAVEのフーリエ変換に基づいて逆フィルタ2aのフィルタ係数を算出する。従って、信号分離部2は、声道特性として、LPC係数に基づき算出されたLPCスペクトルを用いることになる。また、信号分離部2は、声道特性の極大周波数と声道特性の極小周波数とを、いずれも、LPCスペクトルを用いて算出するようになっている。
【0062】
以下、数式を用いて、(R1)〜(R16)に詳述する。
(R1)現フレームの入力音声信号x(n),(0≦n<N)は、自己相関算出部2dに入力され、現フレームの自己相関関数ac(m)(i),(0≦i≦p)が式(1)により算出される。ここで、Nはフレーム長である。また、mは現フレームのフレーム番号であり、pは後述する逆フィルタ係数の次数である。
【0063】
【数1】
Figure 2004219757
【0064】
(R2)次に、信号分離部2は、現フレームの自己相関関数ac(m)(i)と過去の自己相関関数とを平均化し、平均自己相関関数acAVE(i)を算出する。この平均化方法の一例として、過去のLフレームの自己相関関数との加重平均により算出する。さらに、第1バッファ2fから、過去のフレームの自己相関関数ac(m−j)(i),(1≦j≦L,0≦i≦p)が出力される。平均自己相関acAVE(i)は、現フレームの自己相関関数を含む(L+1)個の自己相関関数ac(m−j)(i),(0≦j≦L,0≦i≦p)の加重平均により算出される。この加重平均は式(2)によって得られる。ここで、wは重み係数である。
【0065】
【数2】
Figure 2004219757
【0066】
平均自己相関の演算後、信号分離部2は、第1バッファ2fの状態を更新する。まず、第1バッファ2fに格納されている過去の自己相関関数のうちの時間的に最も古いac(m−L)(i)を廃棄し、次に、現フレームで算出したac(m)(i)を第1バッファ2fに格納する。
(R3)レビンソン・アルゴリズム等の公知の方法を用いることにより、acAVE(i)から逆フィルタ係数a1(i),(1≦i≦p)を算出する。
【0067】
(R4)入力音声信号x(n)をα(i)で構成される式(3)の逆フィルタ2aに入力して残差信号r(n),(0≦n<N)を算出する。これにより、入力音声信号x(n)を残差信号r(n)と声道特性とに分離することができる。
【0068】
【数3】
Figure 2004219757
【0069】
(R5)スペクトル算出部2gにおいて、α(i)を式(4)により、フーリエ変換してLPCスペクトルsp(l)を算出する。ここで、Nはスペクトルのデータ点数である。また、サンプリング周波数をFsとすると、LPCスペクトルsp(l)の周波数分解能はFs/Nとなる。ここで、変数Lはスペクトルのインデックスであり離散周波数を表す。この変数LをHzに換算すると、L・Fs/N[Hz]となる。
【0070】
【数4】
Figure 2004219757
【0071】
(R6)ホルマント/アンチホルマント推定部4aにLPCスペクトルsp(l)を入力し、ホルマント周波数fp(k),(1≦k≦kpmax)と、その振幅ampp(k),(1≦k≦kpmax)およびアンチホルマント周波数fv(k),(1≦k≦kvmax)と、その振幅ampv(k),(1≦k≦kvmax)とのそれぞれを推定する。なお、前述した仮定により、kvmax=kpmax−1となる。
【0072】
なお、ホルマント周波数およびアンチホルマント周波数の推定方法は所望の方法を用いることができる。例えばホルマント周波数の推定は、ピークピッキング法など公知の技術を用いることができ、アンチホルマント周波数の推定は、スペクトルの逆数に対して前述のピークピッキング法を用いるなどの方法がある。算出したホルマントおよびアンチホルマントを、低次から順に、fp(1),fp(2),…,fp(kpmax)およびfv(1),fv(2),…,fv(kpmax−1)とする。また、fp(k)およびfv(k)での振幅値をそれぞれampp(k),ampv(k)とする。
【0073】
(R7)次に、sp(l)と{fp(k),ampp(k)}および{fv(k),ampv(k)}とを増幅率算出部4bに入力し、sp(l)についての増幅率β(l)を算出する。
図4は本発明の第1実施形態に係る増幅率算出部4bの増幅率算出を説明するためのフローチャートである。増幅率算出部4bは、ホルマントの増幅率を算出して決定し(ステップH1)、アンチホルマントの増幅率を算出して決定し(ステップH2)、そして、補間曲線Ri(k,l)を用いて増幅率を補間する(ステップH3)。
【0074】
(R8)従って、ステップH1,H2のように、最初に、ホルマント/アンチホルマントの増幅率G(k)とG(k)とがそれぞれ決定される。ここで、増幅率は、ホルマントとアンチホルマントとの振幅差が音声強調前に比較して大きくなるように決定されることが好ましい。また、ホルマントとアンチホルマントとはいずれも固定の定数を用いてもよく、音声の性質に合わせて適応的に算出することもできる。さらに、ホルマント数の増幅率は適応的に算出し、アンチホルマントは固定の定数を用いてもよく、周波数の高さに応じて重み付けしてもよい。増幅率の決定方法の一例を以下に示す。
【0075】
(R9)増幅率算出部4bは、ホルマントの振幅ampp(1),ampp(2),…,ampp(kpmax)の平均値amppAVEを算出し、算出したamppAVEをリファレンス値として、振幅の増幅率を決定する。
図5は本発明の第1実施形態に係るホルマント増幅率の決定方法を説明するための図である。この図5に示す曲線は、周波数(単位elの離散周波数)と、この周波数スペクトルの振幅との関係を表し、また、ホルマント周波数の振幅平均値amppAVEが表示されている。そして、離散周波数fp(1)〜fp(4)のそれぞれにおいて、ホルマント周波数の振幅ampp(1)〜ampp(4)が振幅平均値amppAVEに一致するように、増幅率G(k)が算出される。また、振幅平均値amppAVE,増幅率G(k)は式(5)に示すように算出される。
【0076】
【数5】
Figure 2004219757
【0077】
ここで、wp(l)は周波数によって変動する重み付け係数である。
(R10)次に、アンチホルマントの増幅率G(k)をホルマント増幅率G(k)と同様に算出する。
図6は本発明の第1実施形態に係るアンチホルマント増幅率の決定方法を説明するための図である。増幅率算出部4bは、この図6に示すアンチホルマントの振幅ampv(1),ampv(2),…,ampv(kpmax−1)を用いて算出したアンチホルマントの振幅平均値ampvAVEをリファレンス値とし、このリファレンス値に一致するように、増幅率を決定する。
【0078】
(R11)アンチホルマントの振幅平均値ampvAVEとアンチホルマントの増幅率G(k)とは、それぞれ、式(6)により算出される。
【0079】
【数6】
Figure 2004219757
【0080】
ここで、wv(l)は、前述のwp(l)と同様、周波数によって変動する重み付け係数である。
(R12)次に、隣接するホルマント周波数とアンチホルマント周波数との間の周波数における増幅率を、補間曲線Ri(k,l)により算出する。
ここで、i=1,2であり、区間[fp(k),fv(k)]の補間曲線をR1(k,l),区間[fv(k),fp(k+1)]の補間曲線をR2(k,l)とする。補間曲線は、R1(k,l)の場合はG(k)≦β(l)≦G(k)を満たし、R2(k,l)の場合はG(k)≦β(l)≦G(k+1)を満たすことが必要である。なぜならば、上記条件を満たすための増幅率の補間は、強調によってホルマント周波数およびアンチホルマント周波数の位置が変動する可能性を排除でき、明瞭度の低下および雑音感の増加を抑制できるからである。
【0081】
(R13)二次曲線を用いた補間曲線R1(k,l)の補間の一例を図7を参照して説明する。
図7は本発明の第1実施形態に係る二次曲線を用いた増幅率の補間方法を説明するための図である。ホルマント/アンチホルマント強調部4は、この図7に示す二次曲線(補間曲線R1(k,l)が、{fp(k),G(k)}を通り、{fv(k),G(k)}で極小値をとるように曲線を作成する。従って、この二次曲線は式(7)のように表せる。
【0082】
【数7】
Figure 2004219757
【0083】
この式(7)が、{fp(k),G(k)}を通るので、{l,β(l)}={fp(k),G(k)}を代入して式(7)を整理すると、aは式(8)のように表せる。
【0084】
【数8】
Figure 2004219757
【0085】
従って、式(8)からaを算出し、二次曲線R1(k,l)を算出でき、fv(k)とfp(k+1)との間の補間曲線R2(k,l)も同様に算出できる。
(R14)この算出したRi(k,l)に基づいてfp(k)とfv(k)およびfv(k)と、fp(k+1)の間のスペクトルについての増幅率β(l)が算出される。
【0086】
(R15)上記(7)〜(13)の処理を、ホルマント周波数とアンチホルマント周波数との間に位置する全ての周波数について行なう。なお、最低次のホルマント周波数fp(1)よりも低い周波数については、fp(1)についての増幅率G(1)を用いる。また、最高次のホルマント周波数fp(kpmax)よりも高い周波数については、fp(kpmax)についての増幅率G(kpmax)を用いる。以上をまとめると式(9)のようになる。
【0087】
【数9】
Figure 2004219757
【0088】
また、図8は本発明の第1実施形態に係る補間方法により補間された増幅率を示す図である。
(R16)sp(l)とβ(l)とがスペクトル強調部4cに入力され、強調されたスペクトルsp(l)が式(10)のように算出される。
【0089】
【数10】
Figure 2004219757
【0090】
(R17)sp(l)がフィルタ係数算出部2に入力され、sp(l)の逆フーリエ変換から自己相関関数ac2(i)が算出される。次に、ac2(i)からレビンソン・アルゴリズム等の公知の方法により合成フィルタ係数α(i),(1≦i≦p)が算出される。ここで、pは合成フィルタ次数である。
(R18)残差信号r(n)がα(i)により構成される式(11)の合成フィルタ5に入力され、出力音声y(n),(0≦n<N)が算出される。
【0091】
【数11】
Figure 2004219757
【0092】
図9は本発明の第1実施形態に係る音声強調方法を説明するためのフローチャートである。自己相関算出部2dは、自己相関関数acを算出し(ステップA1)、平均自己相関算出部2eは、平均自己相関acAVEを算出する(ステップA2)。また、第1フィルタ係数算出部2bは、逆フィルタ係数αを算出し(ステップA3)、逆フィルタ2aの逆フィルタ係数αの設定後、入力音声信号x(n)を逆フィルタ2aに入力することにより、残差信号r(n)を算出する(ステップA4)。
【0093】
次に、フィルタ係数算出部2bは、LPCスペクトルsp(l)を算出し(ステップA5)、ホルマント/アンチホルマント推定部4aは、ホルマントfpとアンチホルマントfvとを抽出し(ステップA6)、増幅率算出部4bは、増幅率βを算出する(ステップA7)。さらに、スペクトル強調部4cは、強調されたLPCスペクトルsp(l)を算出し(ステップA8)、第2フィルタ係数算出部4dは、自己相関関数ac2を算出し(ステップA9)、合成フィルタ係数αを算出し(ステップA10)、合成フィルタ5の出力として出力音声信号y(n)を出力する(ステップA11)。
【0094】
また、従って、本発明の音声強調方法は、入力音声信号x(n)から声道特性を抽出し入力音声信号x(n)を、入力音声信号x(n)を線形予測分析して得られるLPC係数に起因する帯域特性についてフィルタリングし、ピッチが強調された強調残差信号s(n)を算出し、抽出した声道特性に含まれるホルマント,ホルマント振幅,アンチホルマントおよびアンチホルマント振幅をそれぞれ推定し、抽出された声道特性と、推定されたホルマント,ホルマント振幅,アンチホルマントおよびアンチホルマント振幅とに基づいて声道特性を強調し、強調された強調残差信号s(n)と、強調声道特性とを再合成した強調合成信号を出力する。
【0095】
このように、入力音声信号x(n)を音源特性と声道特性とに分離し、声道特性のみを強調することができるので、従来技術が解決できなかったスペクトル歪(声道特性と音源特性との両方を同時に強調する場合に発生するスペクトル歪)が抑制され、かつ明瞭度が改善する。また、ホルマント周波数とアンチホルマント周波数の位置が変動しないように増幅率を算出することにより、明瞭度の低下又は雑音感の増加が回避される。
【0096】
なお、スペクトルsp(l)についての増幅率を1スペクトル点数単位で算出したが、スペクトルを複数の周波数帯域に分割し、各帯域別に個別の増幅率を割り当てしてもよい。
(C)本発明の第2実施形態の説明
図10は本発明の第2実施形態に係る音声強調装置のブロック図である。この図10に示す音声強調装置1bが音声強調装置1aと異なるところは、合成フィルタ5から合成音声が出力される側に、自動利得制御部(AGC[Automatic Gain Controller]部)6が設けられている点である。これ以外の部分は上記と同一なので重複説明を省略する。
【0097】
この自動利得制御部6の機能についてさらに詳述する。
自動利得制御部6は、入力音声信号x(n)が入力され、この入力音声信号x(n)の振幅に基づいて、合成フィルタ5からの出力音声信号y(n)の振幅を制御するものである。この自動利得制御部6は、入力音声信号x(n)と最終的な出力音声信号との電力比が例えば1となるように利得を調整するために、まず、x(n)とy(n)とから振幅比gを式(12)により算出する。ここで、Nはフレーム長である。
【0098】
【数12】
Figure 2004219757
【0099】
そして、自動利得制御部6は、式(13)により利得制御値Gain(n)を算出する。ここで、λは定数である。
【0100】
【数13】
Figure 2004219757
【0101】
最終的な出力音声信号z(n)は式(14)により得られる。
【0102】
【数14】
Figure 2004219757
【0103】
なお、この算出方法は一例であって、自動利得制御部6は、この方法以外の所望の方法を利用できる。
このような構成によって、自動利得制御部6を用いた場合の音声強調方法を説明する。
図11は本発明の第2実施形態に係る音声強調方法を説明するためのフローチャートであり、合成フィルタ5(図10参照)から出力音声信号y(n)が出力されるまでの処理は、自動利得制御部6がない場合の処理(図9参照)と同一である。すなわち、自己相関算出部2dは、自己相関関数acを算出し(ステップB1)、平均自己相関算出部2eは、平均自己相関acAVEを算出する(ステップB2)。また、第1フィルタ係数算出部2bは、逆フィルタ係数αを算出し(ステップB3)、逆フィルタ2aの逆フィルタ係数αの設定後、入力音声信号x(n)を逆フィルタ2aに入力することにより、残差信号r(n)を算出する(ステップB4)。
【0104】
次に、フィルタ係数算出部2bは、LPCスペクトルsp(l)を算出し(ステップB5)、ホルマント/アンチホルマント推定部4aは、ホルマントfpとアンチホルマントfvとを抽出し(ステップB6)、増幅率算出部4bは、増幅率βを算出する(ステップB7)。さらに、スペクトル強調部4cは、強調されたLPCスペクトルsp(l)を算出し(ステップB8)、第2フィルタ係数算出部4dは、自己相関関数ac2を算出し(ステップB9)、合成フィルタ係数αを算出し(ステップB10)、合成フィルタ5の出力として出力音声信号y(n)を出力する(ステップB11)。
【0105】
そして、自動利得制御部6は、利得制御値Gainを算出し(ステップB12)、利得調整された出力音声信号z(n)を算出して出力する(ステップB13)。
このように、自動利得制御部6を設けることにより、スペクトル強調によって出力音声z(n)の振幅が入力音声信号x(n)の振幅に比較して、大きくならないように過度に利得を調整できる。これにより、滑らかで自然性の高い受話音声を得ることができる。
【0106】
(D)本発明の第3実施形態の説明
図12は本発明の第3実施形態に係る音声強調装置のブロック図である。この図12に示す音声強調装置1cが、音声強調装置1と異なるところは、増幅率算出部4b′に第2バッファ4eが設けられていることと、増幅率算出部4b′に比較部4fが設けられていることである。
【0107】
ここで、第2バッファ4eは、過去フレームについての1又は複数の増幅率を保持するものである。そして、比較部4fは、現フレームについての増幅率と過去フレームについての1又は複数の増幅率とを比較して増幅率を算出するものである。この比較部4fは、現フレームと過去フレームとのそれぞれについての増幅率の差分と、予め保持した閾値とを比較し、その増幅率の差分が閾値よりも大きくなる場合には、より適切な増幅率を決定する。
【0108】
なお、図12においても上記と同一符号を有するものは上述したものと同一である。
次に、増幅率算出部4b′の算出方法についてさらに詳述する。
増幅率算出部4b′は、平均スペクトルsp(l)と、{fp(k),ampp(k)}および{fv(k),ampv(k)}とに基づいて仮の増幅率βpsu(l)を算出する。このβpsu(l)の算出方法は、第1実施形態における増幅率β(l)の算出方法と同一である。
【0109】
次に、増幅率算出部4b′は、仮の増幅率βpsu(l)と、第2バッファ4eから出力される増幅率β−old(l)とに基づいて現フレームの増幅率β(l)を算出する。ここで、β−old(l)は、複数の過去フレームのうちの直前のフレームにおいて算出された最終的な増幅率である。増幅率β(l)の算出方法は、以下の(S1)〜(S4)に示すようになる。
【0110】
(S1)増幅率算出部4b′は、現フレームの仮の増幅率βpsu(l)と前フレームの増幅率β−old(l)との差分Δβ=βpsu(l)−β−old(l)を算出する。
(S2)増幅率算出部4b′は、Δβが予め定められた閾値ΔTHよりも大きい場合は、増幅率β(l)=β−old(l)+ΔTHとする。
【0111】
(S3)増幅率算出部4b′は、Δβが閾値ΔTHよりも小さい場合は、増幅率β(l)=βpsu(l)とする。
(S4)増幅率算出部4b′は、最終的に求められた増幅率β(l)をバッファに入力してβ−old(l)を更新する。
なお、この増幅率β(l)を算出する部分以外は前記内容と同一であるので説明を省略する。
【0112】
このような構成によって、バッファ4eが設けられた場合の音声強調方法は次のようになる。
図13は本発明の第3実施形態に係る音声強調方法を説明するためのフローチャートであり、ホルマント/アンチホルマント推定部4aにおけるホルマントfpとアンチホルマントfvとの抽出までの処理は、第2バッファ4eが設けられていない場合の処理(図9参照)と同一である。すなわち、自己相関算出部2dは、自己相関関数acを算出し(ステップC1)、平均自己相関算出部2eは、平均自己相関acAVEを算出する(ステップC2)。また、第1フィルタ係数算出部2bは、逆フィルタ係数αを算出し(ステップC3)、逆フィルタ2aの逆フィルタ係数αの設定後、入力音声信号x(n)を逆フィルタ2aに入力することにより、残差信号r(n)を算出する(ステップC4)。
【0113】
次に、フィルタ係数算出部2bは、LPCスペクトルsp(l)を算出し(ステップC5)、ホルマント/アンチホルマント推定部4aは、ホルマントfpとアンチホルマントfvとを抽出する(ステップC6)。
増幅率算出部4b′は、仮増幅率βusuを算出し(ステップC7)、増幅率βを算出する(ステップC8)。さらに、スペクトル強調部4cは、強調されたLPCスペクトルsp(l)を算出し(ステップC9)、第2フィルタ係数算出部4dは、自己相関関数ac2を算出し(ステップC10)、合成フィルタ係数αを算出し(ステップC11)、合成フィルタ5の出力として出力音声信号y(n)を出力する(ステップC12)。
【0114】
このように、増幅率算出部4b′が、現フレームの増幅率が前フレームの増幅率から大きく変動しないように制限するので、フレーム間の急激なスペクトル変化が抑圧され、雑音感の増加を抑制しつつ明瞭度を改善できる。
(E)本発明の第4実施形態の説明
図14は本発明の第4実施形態に係る音声強調装置のブロック図である。この図14に示す音声強調装置1dが、音声強調装置1と異なるところは、逆フィルタ2aからの残差信号r(n)についてピッチ強調部3が設けられている点である。ピッチ強調部3は、残差信号r(n)からピッチ係数を算出するピッチ係数算出部3bと、このピッチ係数算出部3bにて算出されたピッチ予測係数に基づくフィルタ係数を有し残差信号r(n)をピッチ強調して得た強調残差信号s(n)を出力するピッチ強調フィルタ3aとを有する。
【0115】
なお、図14においても、上記の符号と同一符号を有するものは、上述したものと同一である。
このような構成により、ピッチ強調方法は、例えば以下の(T1)〜(T4)に示すようになる。
(T1)ピッチ係数算出部3bは、残差信号r(n)の自己相関rscor(i)を式(15)のように算出する。
【0116】
【数15】
Figure 2004219757
【0117】
ここで、LagminおよびLagmaxはピッチラグの上限および下限を表す。
ピッチ係数算出部3bは、rscor(i)が最大となるを、ピッチラグTとして算出する。
(T2)ピッチ係数算出部3bは、ピッチラグTの近傍における残差信号r(n)の自己相関rscor(T−1),rscor(T),rscor(T+1)を用いて、レビンソン・アルゴリズム等の公知の方法を用いてピッチ予測係数pc(i),(i=−1,0,1)を算出する。
【0118】
(T3)ピッチ係数算出部3bは、ピッチ予測係数を有するピッチ強調フィルタ3aを用いて残差信号r(n)をフィルタリングし、ピッチ強調された強調残差信号s(n)を出力する。なお、ピッチ強調フィルタ3aの伝達関数を式(16)に示す。ここで、gは重み付け係数を表す。
【0119】
【数16】
Figure 2004219757
【0120】
(T4)合成フィルタ5は、強調残差信号s(n)を、残差信号r(n)のかわりに式(11)に代入して合成音声を得る。
なお、この例に示すピッチ強調フィルタ3aは、自己相関から算出されたピッチ予測係数を有するIIRフィルタを用いる代わりに、別個の方法を用いることもできる。例えば、ピッチ係数算出部3bは、残差信号r(n)を周波数領域に変換し、周波数領域においてピッチ周波数とピッチゲインとを算出し、そのピッチゲインに応じて増幅率を決定し、所望の増幅特性になる帯域特性を有するフィルタを用いることにより、残差信号r(n)をフィルタリングするようにもできる。
【0121】
このような構成によって、ピッチ強調部3が設けられた場合の音声強調方法は次のようになる。
図15は本発明の第4実施形態に係る音声強調方法を説明するためのフローチャートである。自己相関算出部2dは、自己相関関数acを算出し(ステップD1)、平均自己相関算出部2eは、平均自己相関acAVEを算出する(ステップD2)。また、第1フィルタ係数算出部2bは、逆フィルタ係数αを算出し(ステップD3)、逆フィルタ2aの逆フィルタ係数αの設定後、入力音声信号x(n)を逆フィルタ2aに入力することにより、残差信号r(n)を算出する(ステップD4)。
【0122】
次に、ピッチ係数算出部3bは、ピッチラグTを算出し(ステップD5)、ピッチ予測係数pcを算出し(ステップD6),ピッチ強調された強調残差信号s(n)を算出する(ステップD7)。
また、スペクトル算出部2gは、LPCスペクトルsp(l)を算出し(ステップD8)、ホルマント/アンチホルマント推定部4aは、ホルマントfpとアンチホルマントfvとを抽出する(ステップD9)。さらに、増幅率算出部4bは、増幅率βを算出し(ステップD10)、スペクトル強調部4cは、強調されたLPCスペクトルsp(l)を算出し(ステップD11)、第2フィルタ係数算出部4dは、自己相関関数ac2を算出し(ステップD12)、合成フィルタ係数αを算出し(ステップD13)、合成フィルタ5の出力として出力音声信号y(n)を出力する(ステップD14)。
【0123】
このように、ピッチ強調フィルタ3aの付加により、ピッチ係数算出部3bは、残差信号r(n)に含まれるピッチ周期成分を強調でき、ピッチ強調フィルタ3aがない場合に比較して音声の明瞭度をさらに改善可能である。
さらに、増幅率が決定されるので、雑音感および音の歪みがともに抑制され、高い明瞭度の音声を安定して得ることができ、また、良好な音声強調が可能となる。
【0124】
そして、本発明の音声強調装置1dは、入力音声信号x(n)を残差信号r(n)と声道特性とに分離し、分離した残差信号r(n)と声道特性とを個別に強調するので、各特性に適した音声強調処理が可能となり、また、特性の強調による生じるスペクトル歪みを回避した強調が可能となる。
また、このように、本発明の音声強調装置1dは、声道特性に対して、ホルマントとアンチホルマントとの振幅差を強調することにより、音声強調装置600(図23参照)に比較して、高い明瞭度が改善できるととともに、音声符号化処理後の音声の雑音感が抑制される。
【0125】
このようにして、音声強調装置1dは、声道特性として音声の長時間の特性を用い、かつ前フレームから増幅率に急激な変化が生じないように制限するので、短時間での急激なスペクトル変動に起因する雑音感を抑制でき、良好な音声強調が実現される。
(F)本発明の第5実施形態の説明
第5実施形態の音声強調装置は、上記の各実施形態において説明した機能をすべて設けたものである。
【0126】
図16は本発明の第5実施形態に係る音声強調装置のブロック図であり、この図16に示す音声強調装置1eは、上記の各機能を併せもつものである。また、図16においても、上記と同一符号を有するものは、上述したものと同一である。
また、図17は本発明の第5実施形態に係る音声強調方法を説明するためのフローチャートである。自己相関算出部2dは、自己相関関数acを算出し(ステップE1)、平均自己相関算出部2eは、平均自己相関acAVEを算出する(ステップE2)。また、第1フィルタ係数算出部2bは、逆フィルタ係数αを算出し(ステップE3)、逆フィルタ2aの逆フィルタ係数αの設定後、入力音声信号x(n)を逆フィルタ2aに入力することにより、残差信号r(n)を算出する(ステップE4)。
【0127】
次に、ピッチ係数算出部3bは、ピッチラグTを算出し(ステップE5)、ピッチ予測係数pcを算出し(ステップE6),ピッチ強調された強調残差信号s(n)を算出する(ステップE7)。
さらに、フィルタ係数算出部2bは、LPCスペクトルsp(l)を算出し(ステップE8)、ホルマント/アンチホルマント推定部4aは、ホルマントfpとアンチホルマントfvとを抽出する(ステップE9)。
【0128】
また、増幅率算出部4b′は、仮増幅率βusuを算出し(ステップE10)、増幅率βを算出する(ステップE11)。さらに、スペクトル強調部4cは、強調されたLPCスペクトルsp(l)を算出し(ステップE12)、第2フィルタ係数算出部4dは、自己相関関数ac2を算出し(ステップE13)、合成フィルタ係数αを算出し(ステップE14)、合成フィルタ5の出力として出力音声信号y(n)を出力する(ステップE15)。
【0129】
そして、自動利得制御部6は、利得制御値Gainを算出し(ステップE16)、利得調整された出力音声信号z(n)を算出して出力する(ステップE17)。
このように、各機能をそなえることによって、一層聞きやすい音声が得られ、また、雑音感および音の歪みがともに抑制される。
【0130】
以下、本発明の音声強調方法と音声強調装置600(図23参照)を用いた音声強調方法とのそれぞれについて強調ホルマントを比較する。
図18(a)は例えば音声強調装置600の音声強調処理によるスペクトルを表す図であり、図18(b)は本発明の音声強調処理によるスペクトルを表す図である。この図18(b)に示す音声強調方法は、コントラスト強調によってホルマントを強調するので、明瞭度が向上する。加えて、本発明の音声強調方法は、アンチホルマントを減衰させることによって相対的なホルマント強調効果が得られ、これにより、音声強調装置600(図23参照)に比較して、一層の明瞭度の向上が可能となる。
【0131】
また、本発明の音声強調方法は、アンチホルマントを減衰させているので、特に、携帯電話が採用する音声符号化方法を用いて処理されるので、音声に生じやすい雑音感を抑制することができる。
よく知られているように、この音声符号化方法を用いて符号化および復号化された音声は、いずれも、量子化雑音と呼ばれる雑音がアンチホルマントに生じやすいが、発明の音声強調方法によれば、アンチホルマントを減衰させるため、量子化雑音を軽減でき、また、雑音感が小さく聞きやすい音声をユーザに提供できる。
【0132】
このようにして、第1実施形態では入力音声信号x(n)を音源特性と声道特性とに分離し、声道特性のみを強調することが可能になる。これにより、従来技術で未解決となっていた声道特性と音源特性とを同時に強調する場合に発生するスペクトル歪を抑制し、かつ明瞭度を改善することができる。また、ホルマント周波数とアンチホルマント周波数との位置が変動しないように増幅率を算出することにより、明瞭度の低下又は雑音感の増加が回避される。なお、スペクトルについての増幅率を1スペクトル点数単位で算出するが、スペクトルを複数の周波数帯域に分割し、各帯域別に個別の増幅率を割り当てしてもよい。
【0133】
(G)その他
本発明は上述した実施態様およびその変形態様に限定されるものではなく、本発明の趣旨を逸脱しない範囲で、種々変形して実施することができる。
(H)付記
(付記1) 入力音声信号から声道特性を抽出するとともに該入力音声信号から残差信号を分離する信号抽出分離部と、
該信号抽出分離部にて抽出された声道特性のホルマントを強調するとともに該声道特性のアンチホルマントを減衰させた強調声道特性を出力する声道特性修正部と、
該入力音声信号を用いて該信号抽出分離部にて分離された残差信号を強調する残差信号強調部と、
該残差信号強調部にて強調された残差信号と、該声道特性修正部から出力された強調声道特性とを合成した合成信号を出力する合成部とをそなえて構成されたことを特徴とする、音声強調装置。
【0134】
(付記2) 該信号抽出分離部は、
該入力音声信号について、線形予測分析して得られる線形予測符号化係数(Linear Predictive Coding 係数:LPC係数)により定まるフィルタリングを行なうことにより、該残差信号を分離するように構成されたことを特徴とする、付記1記載の音声強調装置。
【0135】
(付記3) 該信号抽出分離部は、
該LPC係数を、現フレームの入力音声信号から算出した自己相関関数と、過去のフレームから算出した自己相関関数との加重平均を用いて算出するように構成されたことを特徴とする、付記2記載の音声強調装置。
(付記4) 該信号抽出分離部は、
該声道特性として、該LPC係数に基づき算出されたLPCスペクトルを用いるように構成されたことを特徴とする、付記2又は付記3記載の音声強調装置。
【0136】
(付記5) 該信号抽出分離部は、
該声道特性の該極大周波数と該声道特性の該極小周波数とを、いずれも、該LPCスペクトルを用いて算出するように構成されたことを特徴とする、付記2又は付記3記載の音声強調装置。
(付記6) 該残差信号強調部が、
該信号抽出分離部にて分離された残差信号のピッチを強調するピッチ強調部をそなえて構成されたことを特徴とする、付記1記載の音声強調装置。
【0137】
(付記7) 該声道特性修正部が、
該信号抽出分離部にて抽出された声道特性のホルマントとアンチホルマントとのそれぞれについての物理的特性を推定する推定部と、
該信号抽出分離部にて抽出された声道特性と、該推定部にて推定された該物理的特性とに基づいて増幅率を算出する増幅率算出部とをそなえて構成されたことを特徴とする、付記1記載の音声強調装置。
【0138】
(付記8) 該声道特性修正部が、
該極大周波数におけるホルマント振幅と該極小周波数におけるアンチホルマント振幅との差が大きくなるように、該声道特性の振幅を増幅又は減衰させるように構成されたことを特徴とする、付記1記載の音声強調装置。
(付記9) 該増幅率算出部は、
所定の固定増幅率を用いて増幅又は減衰するように構成されたことを特徴とする、付記8記載の音声強調装置。
【0139】
(付記10) 該増幅率算出部は、
該極大周波数、該極小周波数および該声道特性の振幅のそれぞれに基づいて該増幅率を算出するように構成されたことを特徴とする、付記8記載の音声強調装置。
(付記11) 該増幅率算出部は、
該極大周波数の増幅率を、複数の該極大周波数の振幅平均値に基づいて算出し、該極小周波数の増幅率を、複数の該極小周波数の振幅平均値に基づいて算出するように構成されたことを特徴とする、付記10記載の音声強調装置。
【0140】
(付記12) 該声道特性修正部は、
周波数に応じて増幅率に重み付けるように構成されたことを特徴とする、付記7記載の音声強調装置。
(付記13) 該声道特性修正部は、
隣接する該極大周波数および該極小周波数の間に存在する周波数の増幅率を、該極小周波数における増幅率以上、該極大周波数における増幅率以下の値をとる補間曲線を用いて補間するように構成されたことを特徴とする、付記7記載の音声強調装置。
【0141】
(付記14) 該声道特性修正部は、
該補間曲線として、該極大周波数を通り、かつ該極小周波数において極小値をとる二次曲線を用いて補間するように構成されたことを特徴とする、付記13記載の音声強調装置。
(付記15) 該声道特性修正部は、
現フレームにて算出された増幅率を、前フレームの増幅率と比較して、前フレームからの増幅率の差分又は比率が所定の閾値以上であった場合は、前フレームの増幅率に定数を加算又は乗算した値を現フレームの増幅率とするように構成されたことを特徴とする、付記7記載の音声強調装置。
【0142】
(付記16) 該強調音声信号の振幅を制御する自動利得制御部をそなえて構成されたことを特徴とする、付記1〜付記15のいずれか1に記載の音声強調装置。
(付記17) 入力音声信号から声道特性を抽出するとともに該入力音声信号から残差信号を分離する信号抽出分離部と、
該信号抽出分離部にて抽出された声道特性のホルマントとアンチホルマントとのそれぞれについての物理的特性を推定する推定部と、
該信号抽出分離部にて抽出された声道特性と、該推定部にて推定された該物理的特性とに基づいて算出した増幅率を用いて、該信号抽出分離部にて抽出された声道特性のホルマントを強調するとともに該声道特性のアンチホルマントを減衰させた強調声道特性を出力する声道特性修正部と、
該入力音声信号を用いて該信号抽出分離部にて分離された残差信号を強調する残差信号強調部と、
該残差信号強調部にて強調された残差信号と、該声道特性修正部から出力された強調声道特性とを合成した合成信号を出力する合成部とをそなえて構成されたことを特徴とする、音声強調装置。
【0143】
(付記18) 入力音声信号の周波数特性を抽出する周波数特性抽出部と、
該周波数特性抽出部にて抽出された周波数特性についてホルマント振幅が極大値をとる周波数である極大周波数と、アンチホルマント振幅が極小値をとる周波数である極小周波数とを算出する特徴算出部と、
該特徴算出部にて算出された該極大周波数および該極小周波数に基づいて、該入力音声信号の周波数特性を修正した強調音声信号を出力する周波数特性修正部とをそなえて構成されたことを特徴とする、音声強調装置。
【0144】
(付記19) 入力音声信号から声道特性と残差信号とを分離し、
分離された残差信号を強調し、
該声道特性についてホルマントとアンチホルマントとの振幅差を強調し、
強調された該残差信号と強調された該声道特性とを再合成した強調音声信号を出力することを特徴とする、音声強調方法。
【0145】
(付記20) 入力音声信号から声道特性を抽出し
該入力音声信号を、該入力音声信号を線形予測分析して得られるLPC係数に起因する帯域特性についてフィルタリングし、
ピッチが強調された残差信号を算出し、
抽出した声道特性に含まれるホルマント,ホルマント振幅,アンチホルマントおよびアンチホルマント振幅をそれぞれ推定し、
抽出された声道特性と、推定されたホルマント,ホルマント振幅,アンチホルマントおよびアンチホルマント振幅とに基づいて該声道特性を強調し、
強調された残差信号と、該強調声道特性とを再合成した強調合成信号を出力することを特徴とする、音声強調方法。
【0146】
(付記21) 無線信号を受信する受信部と、該受信部にて受信された無線信号を復調して音声信号を処理し音声信号を出力する音声処理部と、該音声処理部にて処理された音声信号を強調する音声強調装置とをそなえ、
該音声強調装置が、
入力音声信号から声道特性を抽出するとともに該入力音声信号から残差信号を分離する信号抽出分離部と、
該信号抽出分離部にて抽出された声道特性のホルマントを強調するとともに該声道特性のアンチホルマントを減衰させた強調声道特性を出力する声道特性修正部と、
該入力音声信号を用いて該信号抽出分離部にて分離された残差信号を強調する残差信号強調部と、
該残差信号強調部にて強調された残差信号と、該声道特性修正部から出力された強調声道特性とを合成した合成信号を出力する合成部とをそなえて構成されたことを特徴とする、携帯端末。
【0147】
【発明の効果】
以上、詳述したように、本発明の音声強調装置(請求項1〜8),音声強調方法(請求項9)および携帯端末(請求項10)によれば、以下のような効果ないし効果が得られる。
(1)本発明の音声強調装置によれば、入力音声信号から声道特性を抽出するとともに入力音声信号から残差信号を分離する信号抽出分離部と、信号抽出分離部にて抽出された声道特性のホルマントを強調するとともに声道特性のアンチホルマントを減衰させた強調声道特性を出力する声道特性修正部と、入力音声信号を用いて信号抽出分離部にて分離された残差信号を強調する残差信号強調部と、残差信号強調部にて強調された残差信号と、声道特性修正部から出力された強調声道特性とを合成した合成信号を出力する合成部とをそなえて構成されているので、残差信号と声道特性との個々の特性に合致して強調でき、音源特性の歪みが抑制され、また、高い明瞭度が得られる(請求項1)。
【0148】
(2)前記信号抽出分離部は、入力音声信号について、線形予測分析して得られる線形予測符号化係数により定まるフィルタリングを行なうことにより、残差信号を分離するように構成されてもよく、このようにすれば、フィルタ係数を適応的に設定でき、雑音環境下において、適切に音声を強調できる(請求項2)。
(3)前記信号抽出分離部は、線形予測符号化係数を、現フレームの入力音声信号から算出した自己相関関数と、過去のフレームから算出した自己相関関数との加重平均を用いて算出するように構成されてもよく、このようにすれば、例えば時間領域および周波数領域の両領域における音声波形の物理的特性を容易に解析できる。
【0149】
(4)前記信号抽出分離部は、声道特性として、線形予測符号化係数に基づき算出された線形予測符号化スペクトルを用いるように構成されてもよく、また、声道特性の極大周波数と声道特性の極小周波数とを、いずれも、線形予測符号化スペクトルを用いて算出するように構成されてもよく、このようにすれば、ホルマント周波数とアンチホルマント周波数の位置を変更せずに増幅率を算でき、明瞭度の低下又は雑音感の増加を回避できる。
【0150】
(5)前記残差信号強調部が、信号抽出分離部にて分離された残差信号のピッチを強調するピッチ強調部をそなえて構成されてもよく、このようにすれば、例えばピッチ強調フィルタの係数が得られ、残差信号を適切に強調できる。
(6)前記声道特性修正部が、信号抽出分離部にて抽出された声道特性のホルマントとアンチホルマントとのそれぞれについての物理的特性を推定する推定部と、信号抽出分離部にて抽出された声道特性と、推定部にて推定された物理的特性とに基づいて増幅率を算出する増幅率算出部とをそなえて構成されてもよく(請求項3)、また、極大周波数におけるホルマント振幅と極小周波数におけるアンチホルマント振幅との差が大きくなるように、声道特性の振幅を増幅又は減衰させるように構成されてもよい(請求項4)。
【0151】
従って、このようにすれば、明瞭度の向上に加えて、相対的なホルマント強調効果が得られ、さらに明瞭度を高めることができる。
(7)前記増幅率算出部は、例えば次に示す(U1)〜(U6)の方法を用いることができる。
(U1)極大周波数におけるホルマント振幅と極小周波数におけるアンチホルマント振幅との差が大きくなるように、声道特性の振幅を増幅又は減衰させる方法。
【0152】
従って、特にアンチホルマントの減衰により、音声符号化方式によって処理された音声に生じやすい雑音感を抑えることができる。
(U2)所定の固定増幅率を用いて増幅又は減衰するように構成されてもよく、このようにすれば、音声の性質に合わせて適応的にフィルタ係数が得られ、音声強調が可能になる。
【0153】
(U3)前記増幅率算出部は、極大周波数、極小周波数および声道特性の振幅のそれぞれに基づいて増幅率を算出するように構成されてもよく、このようにすれば、雑音環境下において適切な増幅率が得られる。
(U4)前記増幅率算出部は、極大周波数の増幅率を、複数の極大周波数の振幅平均値に基づいて算出し、極小周波数の増幅率を、複数の極小周波数の振幅平均値に基づいて算出するように構成されてもよく、このようにすれば、きめ細かい音声強調が可能になる。
【0154】
(U5)周波数に応じて増幅率に重み付けする方法。これにより、明瞭度が向上する。
(U6)隣接する極大周波数および極小周波数の間に存在する周波数の増幅率を、極小周波数における増幅率以上、極大周波数における増幅率以下の値をとる補間曲線を用いて補間する方法。これにより、例えばユーザは一定の受話音声を得られる(請求項5)。
【0155】
(8)前記声道特性修正部は、例えば次の2種類の方法を用いることができる。
第1に、補間曲線として、極大周波数を通り、かつ極小周波数において極小値をとる二次曲線を用いて補間する。これにより、効果的にコントラスト強調が可能になる。
【0156】
第2に、現フレームにて算出された増幅率を、前フレームの増幅率と比較して、前フレームからの増幅率の差分又は比率が所定の閾値以上であった場合は、前フレームの増幅率に定数を加算又は乗算した値を現フレームの増幅率とする。
このようにすれば、安定した音声の強調度を算出できる。
(9)前記強調音声信号の振幅を制御する自動利得制御部をそなえて構成されてもよく、このようにすれば、出力音声の振幅を過度に調整でき、滑らかで自然性の高い受話音声を得られる(請求項6)。
【0157】
(10)本発明の音声強調装置によれば、入力音声信号から声道特性を抽出するとともに入力音声信号から残差信号を分離する信号抽出分離部と、信号抽出分離部にて抽出された声道特性のホルマントとアンチホルマントとのそれぞれについての物理的特性を推定する推定部と、信号抽出分離部にて抽出された声道特性と、推定部にて推定された物理的特性とに基づいて算出した増幅率を用いて、信号抽出分離部にて抽出された声道特性のホルマントを強調するとともに声道特性のアンチホルマントを減衰させた強調声道特性を出力する声道特性修正部と、入力音声信号を用いて信号抽出分離部にて分離された残差信号を強調する残差信号強調部と、残差信号強調部にて強調された残差信号と、声道特性修正部から出力された強調声道特性とを合成した合成信号を出力する合成部とをそなえて構成されているので、声道特性と音源特性を同時に強調する場合に発生するスペクトル歪を抑え、かつ明瞭度を改善できる(請求項7)。
【0158】
(11)本発明の音声強調装置によれば、入力音声信号の周波数特性を抽出する周波数特性抽出部と、周波数特性抽出部にて抽出された周波数特性についてホルマント振幅が極大値をとる周波数である極大周波数と、アンチホルマント振幅が極小値をとる周波数である極小周波数とを算出する特徴算出部と、特徴算出部にて算出された極大周波数および極小周波数に基づいて、入力音声信号の周波数特性を修正した強調音声信号を出力する周波数特性修正部とをそなえて構成されているので、やはり、受話音声の明瞭度が向上する(請求項8)。
【0159】
(12)本発明の音声強調方法によれば、入力音声信号から声道特性と残差信号とを分離し、分離された残差信号を強調し、声道特性についてホルマントとアンチホルマントとの振幅差を強調し、強調された残差信号と強調された声道特性とを再合成した強調音声信号を出力するので、受話音声の明瞭度を向上させた副作用として生じる、受話音質の劣化および雑音感の増加が抑圧される(請求項9)。
【0160】
(13)本発明の音声強調方法によれば、入力音声信号から声道特性を抽出し入力音声信号を、入力音声信号を線形予測分析して得られる線形予測符号化係数に起因する帯域特性についてフィルタリングし、ピッチが強調された残差信号を算出し、抽出した声道特性に含まれるホルマント,ホルマント振幅,アンチホルマントおよびアンチホルマント振幅をそれぞれ推定し、抽出された声道特性と、推定されたホルマント,ホルマント振幅,アンチホルマントおよびアンチホルマント振幅とに基づいて声道特性を強調し、強調された残差信号と、強調声道特性とを再合成した強調合成信号を出力するので、音声の個々の特性に応じて強調できる。
【0161】
(14)本発明の携帯端末によれば、無線信号を受信する受信部と、受信部にて受信された無線信号を復調して音声信号を処理し音声信号を出力する音声処理部と、音声処理部にて処理された音声信号を強調する音声強調装置とをそなえ、音声強調装置が、入力音声信号から声道特性を抽出するとともに入力音声信号から残差信号を分離する信号抽出分離部と、信号抽出分離部にて抽出された声道特性のホルマントを強調するとともに声道特性のアンチホルマントを減衰させた強調声道特性を出力する声道特性修正部と、入力音声信号を用いて信号抽出分離部にて分離された残差信号を強調する残差信号強調部と、残差信号強調部にて強調された残差信号と、声道特性修正部から出力された強調声道特性とを合成した合成信号を出力する合成部とをそなえて構成されているので、例えば携帯電話の周囲に雑音が存在していても明瞭な音声が得られる(請求項10)。
【図面の簡単な説明】
【図1】本発明の原理ブロック図である。
【図2】本発明の原理ブロック図をさらに詳細に示す図である。
【図3】本発明の第1実施形態に係る音声強調装置のブロック図である。
【図4】本発明の第1実施形態に係る増幅率算出部の増幅率算出を説明するためのフローチャートである。
【図5】本発明の第1実施形態に係るホルマント増幅率の決定方法を説明するための図である。
【図6】本発明の第1実施形態に係るアンチホルマント増幅率の決定方法を説明するための図である。
【図7】本発明の第1実施形態に係る二次曲線を用いた増幅率の補間方法を説明するための図である。
【図8】本発明の第1実施形態に係る補間方法により補間された増幅率を示す図である。
【図9】本発明の第1実施形態に係る音声強調方法を説明するためのフローチャートである。
【図10】本発明の第2実施形態に係る音声強調装置のブロック図である。
【図11】本発明の第2実施形態に係る音声強調方法を説明するためのフローチャートである。
【図12】本発明の第3実施形態に係る音声強調装置のブロック図である。
【図13】本発明の第3実施形態に係る音声強調方法を説明するためのフローチャートである。
【図14】本発明の第4実施形態に係る音声強調装置のブロック図である。
【図15】本発明の第4実施形態に係る音声強調方法を説明するためのフローチャートである。
【図16】本発明の第5実施形態に係る音声強調装置のブロック図である。
【図17】本発明の第5実施形態に係る音声強調方法を説明するためのフローチャートである。
【図18】(a)は従来技術の音声強調処理によるスペクトルを表す図であり、(b)は本発明の音声強調処理によるスペクトルを表す図である。
【図19】音声スペクトルの一例を示す図である。
【図20】本発明が適用される携帯端末の概略的なブロック図である。
【図21】音声の生成モデルを示す図である。
【図22】従来の音声スペクトル強調装置のブロック図である。
【図23】受話音声品質を向上させる音声強調装置の構成例を示す図である。
【符号の説明】
1,1a〜1e 音声強調装置
2 信号分離部(信号抽出分離部)
3 残差信号強調部(ピッチ強調部)
2a 逆フィルタ
2b 第1フィルタ係数算出部
2d 自己相関算出部
2f 第1バッファ
2e 平均自己相関算出部
4 ホルマント/アンチホルマント強調部(声道特性修正部)
4a ホルマント/アンチホルマント推定部(推定部)
4b,4b′ 増幅率算出部
4c スペクトル強調部
4d 第2フィルタ係数算出部
4e 第2バッファ
4f 比較部
5 信号合成部(合成フィルタ,合成部)
6 自動利得制御部
12 平均スペクトル算出部
15 携帯電話(携帯端末)
15a マイク
15b 送話部
15c コーダ
15d データ処理部
15e 無線送受信部
15f デコーダ
15g 受話部
15h スピーカ
15i 主制御部
15j アンテナ
16 無線基地局

Claims (10)

  1. 入力音声信号から声道特性を抽出するとともに該入力音声信号から残差信号を分離する信号抽出分離部と、
    該信号抽出分離部にて抽出された声道特性のホルマントを強調するとともに該声道特性のアンチホルマントを減衰させた強調声道特性を出力する声道特性修正部と、
    該入力音声信号を用いて該信号抽出分離部にて分離された残差信号を強調する残差信号強調部と、
    該残差信号強調部にて強調された残差信号と、該声道特性修正部から出力された強調声道特性とを合成した合成信号を出力する合成部とをそなえて構成されたことを特徴とする、音声強調装置。
  2. 該信号抽出分離部は、
    線形予測分析して得られる線形予測符号化係数(Linear Predictive Coding 係数:LPC係数)を、現フレームの入力音声信号から算出した自己相関関数と、過去のフレームから算出した自己相関関数との加重平均を用いて算出するように構成されたことを特徴とする、請求項1記載の音声強調装置。
  3. 該声道特性修正部が、
    該信号抽出分離部にて抽出された声道特性のホルマントとアンチホルマントとのそれぞれについての物理的特性を推定する推定部と、
    該信号抽出分離部にて抽出された声道特性と、該推定部にて推定された該物理的特性とに基づいて増幅率を算出する増幅率算出部とをそなえて構成されたことを特徴とする、請求項1記載の音声強調装置。
  4. 該声道特性修正部が、
    該極大周波数におけるホルマント振幅と該極小周波数におけるアンチホルマント振幅との差が大きくなるように、該声道特性の振幅を増幅又は減衰させるように構成されたことを特徴とする、請求項1記載の音声強調装置。
  5. 該声道特性修正部は、
    隣接する該極大周波数および該極小周波数の間に存在する周波数の増幅率を、該極小周波数における増幅率以上、該極大周波数における増幅率以下の値をとる補間曲線を用いて補間するように構成されたことを特徴とする、請求項3記載の音声強調装置。
  6. 該強調音声信号の振幅を制御する自動利得制御部をそなえて構成されたことを特徴とする、請求項1〜請求項5のいずれか1項記載の音声強調装置。
  7. 入力音声信号から声道特性を抽出するとともに該入力音声信号から残差信号を分離する信号抽出分離部と、
    該信号抽出分離部にて抽出された声道特性のホルマントとアンチホルマントとのそれぞれについての物理的特性を推定する推定部と、
    該信号抽出分離部にて抽出された声道特性と、該推定部にて推定された該物理的特性とに基づいて算出した増幅率を用いて、該信号抽出分離部にて抽出された声道特性のホルマントを強調するとともに該声道特性のアンチホルマントを減衰させた強調声道特性を出力する声道特性修正部と、
    該入力音声信号を用いて該信号抽出分離部にて分離された残差信号を強調する残差信号強調部と、
    該残差信号強調部にて強調された残差信号と、該声道特性修正部から出力された強調声道特性とを合成した合成信号を出力する合成部とをそなえて構成されたことを特徴とする、音声強調装置。
  8. 入力音声信号の周波数特性を抽出する周波数特性抽出部と、該周波数特性抽出部にて抽出された周波数特性についてホルマント振幅が極大値をとる周波数である極大周波数と、アンチホルマント振幅が極小値をとる周波数である極小周波数とを算出する特徴算出部と、
    該特徴算出部にて算出された該極大周波数および該極小周波数に基づいて、該入力音声信号の周波数特性を修正した強調音声信号を出力する周波数特性修正部とをそなえて構成されたことを特徴とする、音声強調装置。
  9. 入力音声信号から声道特性と残差信号とを分離し、
    分離された残差信号を強調し、
    該声道特性についてホルマントとアンチホルマントとの振幅差を強調し、
    強調された該残差信号と強調された該声道特性とを再合成した強調音声信号を出力することを特徴とする、音声強調方法。
  10. 無線信号を受信する受信部と、該受信部にて受信された無線信号を復調して音声信号を処理し音声信号を出力する音声処理部と、該音声処理部にて処理された音声信号を強調する音声強調装置とをそなえ、
    該音声強調装置が、
    入力音声信号から声道特性を抽出するとともに該入力音声信号から残差信号を分離する信号抽出分離部と、
    該信号抽出分離部にて抽出された声道特性のホルマントを強調するとともに該声道特性のアンチホルマントを減衰させた強調声道特性を出力する声道特性修正部と、
    該入力音声信号を用いて該信号抽出分離部にて分離された残差信号を強調する残差信号強調部と、
    該残差信号強調部にて強調された残差信号と、該声道特性修正部から出力された強調声道特性とを合成した合成信号を出力する合成部とをそなえて構成されたことを特徴とする、携帯端末。
JP2003007543A 2003-01-15 2003-01-15 音声強調装置および携帯端末 Expired - Fee Related JP4227421B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003007543A JP4227421B2 (ja) 2003-01-15 2003-01-15 音声強調装置および携帯端末

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003007543A JP4227421B2 (ja) 2003-01-15 2003-01-15 音声強調装置および携帯端末

Publications (2)

Publication Number Publication Date
JP2004219757A true JP2004219757A (ja) 2004-08-05
JP4227421B2 JP4227421B2 (ja) 2009-02-18

Family

ID=32897609

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003007543A Expired - Fee Related JP4227421B2 (ja) 2003-01-15 2003-01-15 音声強調装置および携帯端末

Country Status (1)

Country Link
JP (1) JP4227421B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007243709A (ja) * 2006-03-09 2007-09-20 Fujitsu Ltd 利得調整方法及び利得調整装置
WO2010035438A1 (ja) * 2008-09-26 2010-04-01 パナソニック株式会社 音声分析装置および音声分析方法
JP2011203761A (ja) * 2011-07-12 2011-10-13 Yamaha Corp 音声合成装置および音声合成プログラム
JP2012003162A (ja) * 2010-06-18 2012-01-05 Adtex:Kk 人工的に有声音を生成する方法および有声音生成装置

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007243709A (ja) * 2006-03-09 2007-09-20 Fujitsu Ltd 利得調整方法及び利得調整装置
US7916874B2 (en) 2006-03-09 2011-03-29 Fujitsu Limited Gain adjusting method and a gain adjusting device
WO2010035438A1 (ja) * 2008-09-26 2010-04-01 パナソニック株式会社 音声分析装置および音声分析方法
JP4490507B2 (ja) * 2008-09-26 2010-06-30 パナソニック株式会社 音声分析装置および音声分析方法
JPWO2010035438A1 (ja) * 2008-09-26 2012-02-16 パナソニック株式会社 音声分析装置および音声分析方法
CN101981612B (zh) * 2008-09-26 2012-06-27 松下电器产业株式会社 声音分析装置以及声音分析方法
US8370153B2 (en) 2008-09-26 2013-02-05 Panasonic Corporation Speech analyzer and speech analysis method
JP2012003162A (ja) * 2010-06-18 2012-01-05 Adtex:Kk 人工的に有声音を生成する方法および有声音生成装置
JP2011203761A (ja) * 2011-07-12 2011-10-13 Yamaha Corp 音声合成装置および音声合成プログラム

Also Published As

Publication number Publication date
JP4227421B2 (ja) 2009-02-18

Similar Documents

Publication Publication Date Title
CN100369111C (zh) 话音增强装置
JP4018571B2 (ja) 音声強調装置
AU771444B2 (en) Noise reduction apparatus and method
JP4163267B2 (ja) 雑音抑圧器及び移動局並びに雑音抑圧方法
JP5293817B2 (ja) 音声信号処理装置及び音声信号処理方法
TW594676B (en) Noise reduction device
JP4836720B2 (ja) ノイズサプレス装置
US20060293882A1 (en) System and method for adaptive enhancement of speech signals
EP1100077A2 (en) Noise suppression apparatus
WO2005041170A1 (en) Noise-dependent postfiltering
JP2004272052A (ja) 音声区間検出装置
US7606702B2 (en) Speech decoder, speech decoding method, program and storage media to improve voice clarity by emphasizing voice tract characteristics using estimated formants
EP2008379A2 (en) Adjustable noise suppression system
US20080219471A1 (en) Signal processing method and apparatus, and recording medium in which a signal processing program is recorded
JP2004061617A (ja) 受話音声処理装置
JP6073456B2 (ja) 音声強調装置
JP4413480B2 (ja) 音声処理装置及び移動通信端末装置
JP2000122695A (ja) 後置フィルタ
JP4227421B2 (ja) 音声強調装置および携帯端末
JP2005331783A (ja) 音声強調装置,音声強調方法および通信端末
KR100746680B1 (ko) 음성 강조 장치
JP2010092057A (ja) 受話音声処理装置及び受話音声再生装置
JP4269364B2 (ja) 信号処理方法及び装置、並びに帯域幅拡張方法及び装置
JP2000081898A (ja) ホワイトノイズの生成方法、ホワイトノイズの振幅制御方法およびデジタル電話装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050609

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20071009

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071016

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071127

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20081104

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20081128

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111205

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4227421

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111205

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121205

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121205

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131205

Year of fee payment: 5

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees