JP4018571B2 - 音声強調装置 - Google Patents

音声強調装置 Download PDF

Info

Publication number
JP4018571B2
JP4018571B2 JP2003080517A JP2003080517A JP4018571B2 JP 4018571 B2 JP4018571 B2 JP 4018571B2 JP 2003080517 A JP2003080517 A JP 2003080517A JP 2003080517 A JP2003080517 A JP 2003080517A JP 4018571 B2 JP4018571 B2 JP 4018571B2
Authority
JP
Japan
Prior art keywords
unit
characteristic
speech
noise
formant
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2003080517A
Other languages
English (en)
Other versions
JP2004289614A (ja
Inventor
政直 鈴木
正清 田中
恭士 大田
義照 土永
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2003080517A priority Critical patent/JP4018571B2/ja
Publication of JP2004289614A publication Critical patent/JP2004289614A/ja
Application granted granted Critical
Publication of JP4018571B2 publication Critical patent/JP4018571B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
  • Telephone Function (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は,送話者の音声を強調して、該音声を受話者に聞き易くする音声強調装置に関し、特に、送話者の音声の特性および受話者側の周囲雑音の特性の双方を考慮して送話者の音声を強調する音声強調装置に関する。
【0002】
【従来の技術】
近年、携帯電話が普及し、様々な場所で使われている。携帯電話は静かな場所だけでなく、空港のロビーや駅のホームのような騒がしい環境で使用されることが多い。このため、受話者側の周囲の雑音によって、送話者の音声が受話者に聞き取りにくくなるという問題がある。
【0003】
雑音環境下で送話者の音声を受話者に聞きやすくする最も簡単な方法は、雑音レベルに応じて音量を大きくすることである。ところが、音量を大きくし過ぎると、携帯電話のスピーカへの入力が過大になり音声が歪んでしまい、かえって音質が劣化する場合がある。
【0004】
音質の劣化を防止し、音声の明瞭度を改善する方法として、音声をイコライザに入力し、周囲の雑音レベルに応じてイコライザの特性パラメータを制御し、該特性パラメータによりイコライザ処理された音声をスピーカから出力するものがある(例えば特許文献1参照)。
【0005】
この従来技術によると、受話者側の端末のマイクから得られる信号(音声および雑音を含む。)が背景雑音区間であるか音声区間であるかが判定される。雑音区間の場合には、その雑音レベルが推定され、推定された雑音レベルに基づいて、イコライザの特性を制御するための制御信号が生成される。イコライザは、該制御信号に基づいて、イコライザの特性を決定する特性パラメータをテーブルから選択する。音声(復号音声)は、選択された特性パラメータにより構成されるイコライザによりイコライザ処理され、D/A変換された後、スピーカから出力される。
【0006】
【特許文献1】
特開平9−135194号公報
【0007】
【発明が解決しようとする課題】
しかし、上記従来技術は、周囲の雑音レベルを考慮して、音声に対するイコライザ処理を適応的に変化させているものの、音声の特徴が考慮されていない。このため、音声の種類によっては明瞭度の改善効果が十分でないという問題があった。
【0008】
本発明は、以上のような問題点を鑑みなされたものであり、その目的は、背景雑音および送話者の音声の双方の特性を考慮して音声を強調することにより、送話者の音声をさらに明瞭にして聞き易くすることにある。
【0009】
【課題を解決するための手段】
前記目的を達成するために,本発明の第1の側面による音声強調装置は、入力される受話者側の信号から該受話者の周囲雑音の特性を推定する雑音推定部と、入力される送話者の音声信号から該音声の特性を求め、求めた該音声の特性および前記雑音推定部により推定された前記周囲雑音の特性の双方に基づいて前記送話者の音声の強調特性を求める強調特性決定部と、前記強調特性決定部により求められた前記強調特性に基づいて前記送話者の音声を強調して出力する音声強調部と、を備える。
【0010】
本発明の第1の側面によると、受話者側の信号から該受話者の周囲雑音の特性が求められる。また、送話者の音声信号から該音声の特性が求められる。これら求められた周囲雑音の特性および音声の特性の双方に基づいて、送話者の音声の強調特性が求められ、該強調特性に基づいて音声が強調される。このように、周囲雑音(背景雑音)の特性だけでなく、送話者の音声の特性も考慮して、音声が強調されるので、より聞き易い音声を受話者に提供することができる。
【0011】
また、本発明の第2の側面による音声強調装置は、入力される受話者側の信号から該受話者側の周囲雑音の特性を求める雑音推定部と、入力される送話者の音声信号を音源特性と声道特性とに分離する分離部と、前記声道特性から特徴情報を抽出する特徴抽出部と、前記声道特性、前記特徴情報、および前記周囲雑音の特性から前記声道特性を修正する声道特性修正部と、前記声道特性修正部からの修正声道特性と前記音源特性とを合成する合成部と、を備える。
【0012】
本発明の第2の側面によると、送話者の音声が音源特性と声道特性とに分離され、声道特性の特徴および周囲雑音の特性を考慮して声道特性が強調処理される。これにより、周囲雑音(背景雑音)の特性だけでなく、送話者の音声の特性も考慮して音声が強調され、より聞き易い音声を受話者に提供することができる。
【0013】
本発明の第3の側面による音声強調装置は、入力される受話者側の信号から該受話者側の周囲雑音の平均電力または該受話者側の周囲雑音の周波数スペクトルを求める雑音推定部と、入力される送話者の音声信号の現フレームから自己相関を求める自己相関算出部と、前記現フレームの自己相関を記憶し、過去フレームの自己相関を出力するバッファ部と、前記現フレームの自己相関と前記過去フレームの自己相関との加重平均を求める平均化処理部と、前記加重平均から逆フィルタ係数を算出する逆フィルタ係数算出部と、前記逆フィルタ係数により構成され、入力される前記送話者の音声信号の残差信号を出力する逆フィルタと、前記逆フィルタ係数から周波数スペクトルを算出するスペクトル算出部と、前記算出された周波数スペクトルからホルマント周波数およびホルマント振幅を推定するホルマント推定部と、前記算出された周波数スペクトル、前記ホルマント周波数、前記ホルマント振幅、および前記周囲雑音の平均電力または前記周囲雑音の周波数スペクトルから、前記算出された周波数スペクトルに対する増幅率を求める増幅率算出部と、前記増幅率に基づいて前記算出された周波数スペクトルを変化させ、変化された周波数スペクトルを求めるスペクトル強調部と、前記変化された周波数スペクトルから合成フィルタ係数を算出する合成フィルタ係数算出部と、前記合成フィルタ係数から構成され、入力される前記逆フィルタからの前記残差信号から出力音声信号を求める合成フィルタと、を備える。
【0014】
本発明の第3の側面によると、送話者の音声信号に含まれる音源特性が、逆フィルタにより、残差信号として分離される。一方、スペクトル算出部により、送話者の音声信号の声道特性が求められる。また、増幅率算出部により、該声道特性の特徴および背景雑音の特性を考慮した増幅率が求められ、該増幅率により、声道特性を表すスペクトルが増幅(強調)される。強調された声道特性は、合成フィルタにより、音源特性である残差信号と合成され、出力音声として出力される。これにより、周囲雑音の特性だけでなく、送話者の音声の特性も考慮して音声が強調され、より聞き易い音声を受話者に提供することができる。
【0015】
【発明の実施の形態】
本発明による音声強調装置では、送話者(送信者)側の音声を強調する際に、送話者の音声の特性および受話者(受信者)側の背景雑音の特性の双方が考慮されて、該送話者の音声が強調される。この音声の強調には、大きく2つの方式がある。図1(a)および(b)はこれら2つの方式を示している、図1(a)に示す第1の方式は、受信者側において、送話者の音声を強調するものである。図1(b)は、送話者側において、該送話者の音声を強調するものである。
【0016】
以下では、第1の方式を採用する音声強調装置の実施の形態を第1から第3の実施の形態に示し、第2の方式を採用する音声強調装置の実施の形態を第4の実施の形態に示す。
【0017】
<第1の実施の形態>
図2は、本発明の第1の実施の形態による音声強調装置の原理図である。この図2は、携帯電話システムなどの双方向通信において、考慮の対象となる周囲雑音の発生源側、すなわち受話者側端末(例えば携帯電話機)に本発明を適用した場合の原理図を示している。
【0018】
この音声強調装置は、音声復号器4からの復号音声(強調前音声)が入力される音声強調部1、マイク9からのアナログ信号S2から得られたディジタル信号(送信信号(上り信号))が入力される雑音推定部3、音声復号器4および雑音推定部3からの信号に基づいて強調特性を決定する強調特性決定部2を備える。
【0019】
送話者側端末(例えば携帯電話機)から送信され、受話者側端末に受信された符号化データC1は、音声復号器4に入力され、復号音声(強調前音声)として音声強調部1および強調特性決定部2に入力される。
【0020】
一方、マイク9に入力されたアナログ信号S2(すなわち受話者の音声および/または受話者側の周囲雑音)は、A/D変換器8によりディジタル信号に変換され、送信信号(上り信号)として、音声符号器7および雑音推定部3に入力される。
【0021】
雑音推定部3は、上り信号が背景雑音区間であるか音声区間であるかを判定し、雑音区間の場合には、その雑音特性を推定し、該雑音特性を強調特性決定部2に与える。
【0022】
強調特性決定部2は、復号音声(強調前音声)の特性および雑音特性の双方に基づいて強調特性を決定する。この強調特性は音声強調部1に入力され、音声強調部1は、強調特性に基づいて復号音声を強調処理し、強調した音声(強調後音声)をD/A変換器5に与える。強調後音声は、D/A変換器5によりアナログ信号に変換され、スピーカ6からアナログ信号S1として、受話者に出力される。
【0023】
このように、受話者側において、受話者側端末のマイク9で収音された周囲雑音の性質が推定され、該周囲雑音の性質および送話者の音声(強調前音声)の性質の双方に応じて適応的に送話者の音声が強調される。周囲雑音の性質に加えて、送話者の音声の性質も考慮して、適応的に強調処理がなされるので、従来技術に比べて更に明瞭度の高い音声を受話者に提供することができる。また、受話者側端末に音声強調装置を設けることにより、送話者側が特別な方式ないし装置を用いなくても明瞭度の高い音声を受話者側端末で再生することができる。
【0024】
次に、図3を参照して、本実施の形態による音声強調処理をより詳細に説明する。図3は、本発明の第1の実施の形態による音声強調装置の詳細な構成を示すブロック図である。図2の原理図と同じ構成要素には同じ符号を付している。
【0025】
図2の音声強調部1は、逆フィルタ(例えばFIRフィルタ)11、ピッチ強調部12、合成フィルタ(例えばIIRフィルタ)13、合成フィルタ係数算出部14、およびスペクトル強調部15を備える。図2の強調特性決定部2は、自己相関算出部21、平均化処理部22、バッファ部23、逆フィルタ係数算出部24、スペクトル算出部25、ホルマント推定部26、および増幅率算出部27を備える。なお、音声強調部1および強調特性決定部2のこれら構成要素の分類は一例に過ぎず、他の分類も考え得る。例えば増幅率算出部27が音声強調部1に属していてもよい。
【0026】
遠端側端末からの符号化データC1は、音声復号器4に入力され、時間軸領域において、所定のサンプリング周波数でサンプリングされた振幅値を有する入力音声信号、すなわち復号音声x1(n)に復号され、出力される。ここで、nは音声信号のサンプル番号であり、Lをフレーム長とすると、0≦n<Lの整数である。この復号音声x1(n)は、逆フィルタ11および自己相関算出部21に入力される。
【0027】
自己相関算出部21、平均化処理部22、および逆フィルタ係数算出部24は、線形予測係数(LPC:Linear Prediction Coefficient)を求める。
【0028】
すなわち、まず、自己相関算出部21は、入力された復号音声x1(n)の自己相関r(i)を求める。ここで、パラメータiは、pを後述する逆フィルタ11のフィルタ次数とすると、0≦i≦pの整数である。
【0029】
自己相関r(i)は平均化処理部22に入力される。自己相関r(i)を逆フィルタ係数算出部24に直接入力して、逆フィルタ係数を求めることもできるが、本実施の形態では、自己相関の時間的ばらつきを小さくするために、自己相関r(i)を平均化処理部22に入力し、過去の自己相関を用いて平均化することとする。すなわち、平均化処理部22は、現フレームの自己相関r(i)を、バッファ部23に記憶された過去の自己相関rold(i)を用いて平均化し、平均自己相関rave(i)を求める。平均化の方法としては、例えば次式(1)に示す加重平均を用いることができる。
【0030】
【数1】
Figure 0004018571
【0031】
ここで、過去の自己相関rold(i)は、前フレームにおいて自己相関算出部21により求められた自己相関を用いることもできるし、前フレームにおいて平均化処理部22により求められた平均自己相関を用いることもできる。図3は、後者が用いられる場合の構成を示している。また、wは重み付け係数であり、0<w<1の任意の値(例えばw=0.9等)である。
【0032】
平均化処理部22により求められた平均自己相関rave(i)は、逆フィルタ係数算出部24に入力されると共に、次のフレームの平均自己相関の算出に使用するために、バッファ部23に記憶される。すなわち、次フレームでは、現在のフレームで記憶された平均自己相関rave(i)がrold(i)としてバッファ23から読み出される。なお、バッファ部23は、前述したように、平均自己相関rave(i)に代えてr(i)を保持してもよい。
【0033】
逆フィルタ係数算出部24は、入力された平均自己相関rave(i)に基づいて、レビンソン・アルゴリズム等の公知の方法により逆フィルタ係数α1(i)を求め、逆フィルタ11およびスペクトル算出部25に与える。
【0034】
逆フィルタ11の伝達関数は以下の式(2)で表される。
【0035】
【数2】
Figure 0004018571
【0036】
逆フィルタ11は、音声復号器4からの復号音声x1(n)および逆フィルタ係数算出部24からの逆フィルタ係数α1(i)に基づいて残差信号r1(n)を求め、ピッチ強調部12に与える。この残差信号r1(n)は、復号音声から声道特性が除去された残りの信号、すなわち音源特性の信号である。一方、後述するスペクトル算出部25から出力されるスペクトルsp1(l)は、声道特性の信号である。したがって、自己相関算出部21、平均化処理部22、逆フィルタ係数算出部24、および逆フィルタ11による一連の処理により、復号音声x1(n)は、音源特性と声道特性とに分離される。そして、音源特性および声道特性が、それぞれ個別に、以下に述べる後段の処理により強調される。
【0037】
ピッチ強調部22は、残差信号r1(n)から、ピッチ性が強調された新たな残差信号r2(n)を求める。これにより、音源特性が強調される。すなわち、ピッチ強調部12は、音源特性強調部として機能する。ピッチ強調の方法は任意であるが、例えば、以下の式(3)の伝達関数で表されるピッチ強調フィルタを用いることができる。ここで、Tはピッチ周期であり、rpitは残差信号r1(n)から求めたT次の残差自己相関値である。また、gpは重み付け係数である。
【0038】
【数3】
Figure 0004018571
【0039】
図5(a)は、ピッチ強調前の残差信号r1(n)の波形例を示し、同図(b)は、ピッチ強調後の残差信号r2(n)の波形例を示している。横軸は時間を表し、縦軸は振幅を表している。このように、ピッチ強調前の残差信号r1(n)のパルスないしスパイク状の部分の振幅が増幅され、これにより音源特性が強調される。
【0040】
図3に戻って、スペクトル算出部25は、逆フィルタ係数α1(i)に基づいてフーリエ変換を行い、周波数スペクトルsp1(l)を求める。周波数スペクトルsp1(l)を求める式を以下の式(4)に示す。ここで、パラメータl(アルファベット小文字エル)は、0≦l<NFの整数であり、NFはスペクトル点数である。
【0041】
【数4】
Figure 0004018571
【0042】
図6(a)は、音声の周波数スペクトルの一例を示している。横軸は周波数を表し、縦軸は電力を表している。この図に示すように、音声の周波数スペクトルには、一般に、ピークが存在し、このピークはホルマントと呼ばれる。周波数の低い方から順に第1ホルマント、第2ホルマント、第3ホルマントと呼ばれ、各ホルマントのピーク周波数fp(1)、fp(2)、fp(3)はホルマント周波数と呼ばれる。
【0043】
なお、スペクトルsp1(l)を、現フレームの音声から算出されるLPCスペクトルと、過去の音声から算出されるLPCスペクトルの加重平均として算出することもできるし、現フレームの音声から算出されるFFTスペクトルと、過去の音声から算出されるFFTスペクトルの加重平均として算出することもできる。
【0044】
スペクトル算出部25により求められた周波数スペクトルsp1(l)は、ホルマント推定部26およびスペクトル強調部15に入力される。
【0045】
ホルマント推定部26は、入力された周波数スペクトルsp1(l)からホルマント周波数fp(k)および各周波数におけるホルマントの電力(振幅値)amp(k)を求める。ここで、パラメータkは、ホルマントを表すインデックスであり、kmaxをホルマントの個数とすると、1≦k≦kmaxの整数である。例えば、後述する図7におけるfp(1)=F(1)は第1ホルマルトの周波数を表す。なお、電話帯域音声(サンプリング周波数8kHz)の場合には、kmax=4または5とすることができる。ホルマント推定の方法としては、ピークピッキング法などの公知の技術を用いることができる。
【0046】
ホルマント推定部26は、ホルマント周波数を、以下の式(5)に基づいて、離散データである離散ホルマント周波数fpl(k)に変換し、スペクトルsp1(fpl(k))のホルマント振幅amp(k)を求める。
【0047】
【数5】
Figure 0004018571
【0048】
ここで、int[x]は、xを整数化する演算である。
【0049】
ホルマント周波数fp(k)およびホルマント振幅amp(k)は、増幅率算出部38に入力される。
【0050】
一方、受話者側端末のマイク9に入力したアナログ信号S2が、A/D変換器8によりディジタル信号y(n)に変換され、音声符号器7および雑音推定部3に入力される。この信号y(n)には、近端側ユーザの音声や該ユーザの周囲の雑音(背景雑音)などが含まれる。
【0051】
雑音推定部3は、ディジタル信号y(n)に基づいて周囲雑音のレベルNLを推定する。まず、雑音推定部3は、信号y(n)が音声区間であるのか、雑音区間(非音声区間)であるのかを検出する。この検出方法は任意であり、例えばITU−T勧告G.729のAnnex−Bに記載されているVAD(Voice Activity Detector)等の公知の技術を用いることができる。
【0052】
この音声区間/非音声区間の判定により非音声区間であると判定された場合、雑音推定部3は、信号y(n)の非音声区間の平均電力(すなわち背景雑音電力)NLを計算し、増幅率算出部27に与える。また、音声区間であると判定された場合、雑音推定部3は、過去のフレームで計算された最新の背景雑音電力NLを増幅率算出部27に与える。
【0053】
増幅率算出部27は、背景雑音電力NL,ホルマント周波数fp(k),ホルマント振幅amp(k),およびスペクトルsp1(l)に基づいて、スペクトルsp1(l)に対する増幅率β(l)を求める。この処理を、以下に詳述する。
【0054】
図4は、増幅率算出部27の詳細な構成を示すブロック図である。増幅率算出部27は、基準電力算出部27a、ホルマント増幅率算出部27b、補間関数算出部27c、極小点決定部27d、増幅率算出部27e、雑音レベル比算出部27f、および増幅率修正部27gを備える。
【0055】
増幅率算出部の処理は、(a)基準電力の算出、(b)ホルマント増幅率の算出、(c)増幅率の補間の順に行われる。以下、各処理について順に説明する
基準電力算出部27aは、スペクトルsp1(l)から基準電力Pow_refを算出し、算出した基準電力Pow_refをホルマント増幅率算出部27bに与える。この基準電力Pow_refとしては、全周波数帯域の平均電力や低域周波数の平均電力を用いることができる。全周波数帯域の平均電力を基準電力として用いる場合、Pow_refは次式(6)で表される。
【0056】
【数6】
Figure 0004018571
【0057】
ホルマント増幅率算出部27bは、ホルマントF(k)の振幅を基準電力Pow_refに合わせるための増幅率(ホルマント増幅率)G(k)を次式(7)により求める。
【0058】
【数7】
Figure 0004018571
【0059】
図7は、スペクトル強調処理の説明図である。この図7では、第1ホルマントF(1)を基準電力Pow_refにするために、ホルマント増幅率G(1)(=Pow_ref÷amp(1))が求められる。第2〜第4ホルマントについても同様に、ホルマント増幅率G(2)〜G(4)がそれぞれ求められる。
【0060】
求められたホルマント増幅率は、補間関数算出部27cおよび極小点決定部27dに与えられる。
【0061】
極小点決定部27dは、ホルマント間の周波数における増幅率β0(l)を補間曲線R(k,l)により求める。補間曲線R(k,l)の形状は任意であり、例えば1次関数や2次関数などを用いることができる。図8は、補間曲線として2次関数を用いた場合の例を示す。2時関数の補間曲線R(k,l)は次式(8)で定義される。ここで、a,b,cは補間曲線の形状を決定するパラメータである。
【0062】
【数8】
Figure 0004018571
【0063】
続いて、極小点決定部27dは、隣接する2つのホルマントF(k)およびF(k+1)の間における増幅率の極小点を設定する。ここで、極小点の設定方法は任意であるが、例えば周波数fmin=(fpl(k)+fpl(k+1))/2を極小点の周波数とし、γ・G(k)を該極小点における増幅率と設定することができる。ここで、γは定数であり、0<γ<1である。このようにして求められた極小点の座標(fmin,γ・G(k))は、補間関数算出部27cに与えられる。
【0064】
補間関数算出部27cは、補間曲線R(k,l)がホルマントF(k)およびF(k+1)ならびに極小点を通ると仮定して、上記式(8)を解くことによりパラメータa,b,cを求める。これにより、補間曲線R(k,l)が決定される。決定された補間曲線R(k,l)は、増幅率算出部27eに与えられる。
【0065】
増幅率算出部27eは、補間曲線R(k,l)に基づいて、ホルマントF(k)とF(k+1)との間のスペクトルに対する増幅率β0(l)を求め、求めた増幅率β0(l)を増幅率修正部27gに与える。
【0066】
一方、雑音レベル比算出部27fは、あらかじめ設定された基準雑音レベルをNL,0に対する雑音レベルNLの比NR=NL/NL,0を求め、求めた比NRを増幅率修正部27gに与える。
【0067】
増幅率修正部27gは、比NR(背景雑音レベルNL)に応じて、増幅率β0(l) を修正し、修正増幅率β(l)を算出する。修正式は、次式(9)により与えられる。
【0068】
【数9】
Figure 0004018571
【0069】
すなわち、増幅率は、背景雑音が大きい場合には大きくなり、背景雑音が小さい場合には小さくなるように修正される。
【0070】
増幅率算出部27は、上記処理を、全てのホルマントに対して行う。なお、第1ホルマントよりも低い周波数については、第1ホルマントに対する増幅率G(1)を用いることができる。また、最高次のホルマントよりも高い周波数については、最高次のホルマントに対する増幅率G(kmax)を用いることができる。隣接する2つのホルマントの間の周波数においては、前記増幅率β(l)を用いることができる。
【0071】
図3に戻って、修正増幅率β(l)は、スペクトル強調部15に入力される。スペクトル強調部15は、増幅率算出部27から与えられた修正増幅率β(l)およびスペクトル算出部25から与えられたスペクトルsp1(l)に基づいて、以下の式(10)により、強調されたスペクトルsp2(l)を求める。
【0072】
【数10】
Figure 0004018571
【0073】
図6(b)は、周波数スペクトルの強調(ホルマント強調)の原理説明図である。破線のグラフが強調前の周波数スペクトルであり、実線のグラフが強調後の周波数スペクトルである。一般に、高次のホルマントを強調することにより、音声の明瞭度を改善することができる。スペクトル強調部15の処理により、雑音特性を考慮して、高次のホルマントの電力が増幅され、強調される。これにより、雑音特性を考慮した声道特性の強調が行われる。
【0074】
図3に戻って、強調されたスペクトルsp2(l)は、合成フィルタ係数算出部14に入力される。合成フィルタ係数算出部14は、スペクトルsp2(l)の逆フーリエ変換から自己相関を求め、前記自己相関からレビンソン・アルゴリズム等の公知の方法により合成フィルタ係数α2(i)を求める。ここで、パラメータiは、前述したように、1≦i≦pの整数である。合成フィルタ係数α2(i)は、合成フィルタ13に入力される。
【0075】
合成フィルタ係数α2(i)により構成される合成フィルタ13は、ピッチ強調部12からの残差信号r2(n)から、音源特性および声道特性ともに強調された音声x2(n)を求める。ここで、パラメータnは、0≦n<Nの整数であり、合成フィルタの伝達関数は式(11)である。
【0076】
【数11】
Figure 0004018571
【0077】
音声x2(n)は、D/A変換器5によりアナログ信号に変換され、スピーカ6から音声信号S1として出力される。
【0078】
以上説明の通り、本実施の形態によれば、音声を逆フィルタ11により声道特性と音源特性とに分離し、音声の特徴に応じて各特性を個別に強調することにより音声の明瞭度を向上させることができる。さらに、マイクで収録された周囲の雑音レベルに応じて増幅率を適応的に制御することにより、強調された音声の明瞭度を更に向上させることができる。
【0079】
<第2の実施の形態>
上記本発明の第1の実施の形態における雑音推定部3は背景雑音電力NLを出力するが、背景雑音推定部として、背景雑音スペクトルを出力するものを使用することができる。本発明の第2の実施の形態では、背景雑音推定部として、背景雑音スペクトルを出力するものが使用される。
【0080】
図9は、本発明の第2の実施の形態による音声強調装置の詳細な構成を示すブロック図である。背景雑音スペクトルを出力する雑音推定部30が使用されることにより、図3の増幅率算出部27も、図9では背景雑音スペクトルを処理する増幅率算出部270に置換される。それ以外の構成要素は、図3に示すものと同じであるので、同じ符号を付し、その説明を省略することとする。
【0081】
図3の音声強調装置では、全周波数で共通の背景雑音レベルNLを用いて増幅率β0(l)が修正されるのに対し、図9の音声強調装置では、背景雑音の周波数スペクトルNsp(l)を用いて増幅率β0(l)が修正される。
【0082】
図10は、雑音推定部30の詳細な構成を示すブロック図である。雑音推定部30は、音声/非音声区間判定部30a、フーリエ変換部30b、スペクトル算出部30c、およびバッファ部30dを備える。
【0083】
音声/非音声区間判定部30aには、図9のA/D変換器8から信号y(n)が入力される。音声/非音声区間判定部30aは、入力された信号y(n)が音声区間であるか、非音声区間であるかを判別し、その判定結果をフーリエ変換部30bおよびスペクトル算出部30cに出力する。
【0084】
フーリエ変換部30bは、判定結果が非音声区間の場合、信号y(n)のフーリエ変換を求め、フーリエ変換結果をスペクトル算出部30cに与える。スペクトル算出部30cは、フーリエ変換結果から雑音スペクトルNsp(l)を求めて、図9の増幅率算出部270に与えると共に、バッファ部30dに記憶する。ここで、0≦l<NFである。一方、スペクトル算出部30cは、判定結果が音声区間の場合、バッファ部30dに記憶された最新のNsp(l)を雑音スペクトルとして用い、これを増幅率算出部270に出力する。この時、バッファ部30dの更新は行われない。つまり、スペクトル算出部30cは、常に最新の雑音スペクトルがバッファ部30dに保持されるように動作する。
【0085】
図9に戻って、増幅率算出部270は、雑音推定部30からの雑音スペクトルNsp(l)に基づいて増幅率β(l)を算出する。図11は、増幅率算出部270の詳細な構成を示すブロック図である。図4に示す増幅率算出部と異なる点は、図4の雑音レベル比算出部27fが、背景雑音の周波数スペクトルNsp(l)が入力される雑音レベル比算出部270fに置換され、また、図4の増幅率修正部27gが、基準雑音レベルNsp,0(l)に対する雑音周波数スペクトルNsp(l)の比NRsp(l)が入力される増幅率修正部270gに置換されている点である。それ以外の構成要素は、図4に示すものと同じであるので、それらの説明を省略することとする。
【0086】
雑音レベル比算出部270fは、基準雑音レベルNsp,0(l)に対する雑音周波数スペクトルNsp(l)の比NRsp(l)=Nsp(l)/Nsp,0(l)を求め、増幅率修正部270gに与える。
【0087】
増幅率修正部270gは、雑音レベル比算出部270fからの比NRsp(l)および増幅率算出部27eからの増幅率β0(l)に基づいて、修正増幅率β(l)を算出する。算出式は次式(12)の通りである。
【0088】
【数12】
Figure 0004018571
【0089】
すなわち、背景雑音が大きい場合には修正増幅率β(l)が大きくなり、背景雑音が小さい場合には修正増幅率β(l)が小さくなるように制御される。また、背景雑音のスペクトルを用いることにより周波数帯域毎の制御が可能となるため、図4に示すものと比べて、さらに細かく増幅率を修正することが可能となり、音声の明瞭度をさらに高めることができる。
【0090】
図9に戻って、修正増幅率β(l)はスペクトル強調部15に入力され、以後、前述した第1の実施の形態と同様に処理される。
【0091】
本実施の形態では、上述したように、さらに細かく増幅率を修正することが可能となり、音声の明瞭度をさらに改善することができる。
【0092】
<第3の実施の形態>
音源特性を強調するピッチ強調部においても、雑音特性を考慮した強調を行うことができる。第3の実施の形態は、音源特性の強調を雑音特性を考慮して行うものである。
【0093】
図12は、本発明の第3の実施の形態による音声強調装置の詳細な構成を示すブロック図である。図3に示す第1の実施の形態による音声強調装置と同じ構成要素には同じ符号を付し、その説明を省略することとする。
【0094】
図12では、雑音推定部3の出力である背景雑音レベルNLが増幅率算出部27だけでなく、ピッチ強調部3へも入力される点が図3と異なっており、これにより、図3のピッチ強調部12が、図12ではピッチ強調部120に置換されている。その他の部分は図3と同じである。したがって、以下では、ピッチ強調部120の処理について説明する。
【0095】
雑音推定部3により求められた雑音レベル比NR(=NL/NL,0)は、ピッチ強調部120にも入力される。ピッチ強調部120は、比NRの値に応じて以下の式(13)によりピッチ強調フィルタの特性を変化させる。
【0096】
【数13】
Figure 0004018571
【0097】
ここで、gpは、第1の実施の形態で説明した通り、ピッチ強調フィルタの伝達関数(式(3))の重み付け係数である。この重み付け係数gpが、雑音レベル比NRを考慮した重み付け係数gp´に修正され、この修正された重み付け係数gp´が上記式(3)の重み付け係数gpに代わって使用される。
【0098】
これにより、基準雑音レベルNL,0よりも雑音レベルが大きい場合には、ピッチ強調フィルタの重み付け係数gp´はgpよりも大きくなり、ピッチ性を強くするように、音源特性が強調される。ピッチ性を強くすることにより、母音がはっきりと聞こえるため、音声の明瞭度が改善できる。一方、基準雑音レベルNL,0よりも雑音レベルが小さい場合には、重み付け係数gp´はgpよりも小さくなる。これにより、周囲の雑音レベルが小さい場合には、ピッチ強調の度合いが弱められ、ピッチ強調を強くし過ぎした場合に生じる音質劣化を防ぐことができる。
【0099】
以上説明の通り、本実施の形態ではピッチ強調の度合いを背景雑音レベルに応じて変化させることにより、第1の実施の形態に比べて母音部の明瞭度をさらに改善することができる。
【0100】
<第4の実施の形態>
図13は、本発明の第4の実施の形態による音声強調装置の原理図である。この図13は、携帯電話システムなどの双方向通信において、強調の対象となる音声の送信者(送話者)側の端末(例えば携帯電話機)に本発明を適用した場合の原理図を示している。したがって、送話者側の端末において、送話者の音声および受話者側の周囲雑音を考慮した音声の強調処理がなされる。
【0101】
この音声強調装置において、図2に示す第1の実施の形態と同じ構成要素には同じ符号を付している。
【0102】
符号化データC2は、近端側端末から送信され、遠端側(すなわち送信者側)端末に受信された音声信号(下り信号)である。この音声信号には、近端側(すなわち受信者側)ユーザの音声および近端側の背景雑音が含まれる。この符号化データC2は、音声復号器4から復号音声(強調前音声)として、D/A変換器5および雑音推定部3に入力される。この受信された音声信号が雑音推定部3に入力される点が、第1の実施の形態と異なる。
【0103】
雑音推定部3では、下り信号に基づいて雑音特性が求められる。すなわち、近端側ユーザの背景雑音の特性が求められる。強調特性決定部2は、この雑音特性に基づいて強調特性を求め、求めた強調特性を音声強調部1に与える。
【0104】
一方、音声強調部1には、マイク9およびA/D変換器9を介して、送話者の音声(強調前音声)が入力される。音声強調部1は、送話者の強調前音声を、強調特性決定部2から入力される強調特性に基づいて強調し、強調された音声(強調後音声)を音声符号器7に出力する。この強調後音声は、音声符号器7に符号化され、符号化データC1として、近端側端末に送信される。
【0105】
このように、遠端側においても、近端側端末から送信された周囲雑音の性質が推定され、該周囲雑音の性質および送話者音声(強調前音声)の性質の双方に応じて適応的に音声を強調した後、強調後音声を近端側端末に送信することができる。これにより、従来技術に比べて更に明瞭度の高い音声を受話者に提供することができる。また、本実施の形態では、遠端側に音声強調装置を設けることにより、近端側が特別な方式ないし装置を用いなくても明瞭度の高い音声を近端側端末で再生することができる。
【0106】
図14は、本発明の第4の実施の形態による音声強調装置の詳細な構成を示すブロック図である。図13の原理図と同じ構成要素および図3に示す第1の実施の形態の音声強調装置と同じ構成要素には同じ符号を付している。
【0107】
図14と図3を比較することにより明らかなように、音声強調部1および強調特性部2は同じ構成であり、各構成要素が行う処理内容も同じである。したがって、ここではその説明を省略することとする。
【0108】
このように、本実施の形態によっても、音声を逆フィルタにより声道特性と音源特性とに分離し、音声の特徴に応じて各特性を個別に強調することにより音声の明瞭度を向上させることができる。さらに、相手側から送られてきた符号化データを復号して得られる復号音声から、相手側ユーザの周囲雑音レベルを求め、前記周囲雑音レベルに応じて増幅率を適応的に制御することにより、自分が発声した音声を相手側で最も聞き取りやすくなるように強調処理することが可能となり、従来技術に比べて音声の明瞭度を更に向上させることができる。
【0109】
この第4の実施の形態においても、上記第2の実施の形態のように、雑音推定部3を、背景雑音スペクトルNsp(l)を出力するものに置換することができる。また、第3の実施の形態のように、雑音推定部3の雑音レベルをピッチ強調部に入力し、雑音特性を考慮したピッチ強調を行うこともできる。
【0110】
なお、上記第1から第4の実施の形態は、例示であって、本発明の技術的範囲を限定するものではない。また、本発明については、本発明の精神および範囲内において、種々の変更ないし変形が考えられることはいうまでもない。さらに、本発明は、携帯電話だけでなく、有線の電話機、他の無線通信機器等の種々の通信機器に適用することができる。
【0111】
(付記1) 入力される受話者側の信号から該受話者の周囲雑音の特性を推定する雑音推定部と、
入力される送話者の音声信号から該音声の特性を求め、求めた該音声の特性および前記雑音推定部により推定された前記周囲雑音の特性の双方に基づいて前記送話者の音声の強調特性を求める強調特性決定部と、
前記強調特性決定部により求められた前記強調特性に基づいて前記送話者の音声を強調して出力する音声強調部と、
を備える音声強調装置。
【0112】
(付記2) 付記1において、
前記雑音推定部、前記強調特性決定部、および前記音声強調部が、受話者側の通信端末に設けられる、音声強調装置。
【0113】
(付記3) 付記1において、
前記雑音推定部、前記強調特性決定部、および前記音声強調部が、送話者側の通信端末に設けられる、音声強調装置。
【0114】
(付記4) 付記1から3のいずれか1つにおいて、
前記雑音推定部により推定される前記周囲雑音の特性は、該周囲雑音の平均電力である、音声強調装置。
【0115】
(付記5) 付記4において、
前記雑音推定部は、前記受話者側の信号から音声区間と雑音区間を識別し、前記受話者側の信号が前記雑音区間である場合に、前記雑音区間の信号の平均電力を前記周囲雑音の特性とし、前記受話者側の信号が前記音声区間である場合には、直前の雑音区間の信号の平均電力を前記周囲雑音の特性とする、
音声強調装置。
【0116】
(付記6) 付記1から3のいずれか1つにおいて、
前記雑音推定部により推定される前記周囲雑音の特性は、該周囲雑音の周波数スペクトルである、音声強調装置。
【0117】
(付記7) 付記6において、
前記雑音推定部は、前記受話者側の信号から音声区間と雑音区間を識別し、前記受話者側の信号が前記雑音区間である場合に、前記雑音区間の信号の周波数スペクトルを前記周囲雑音の特性とし、前記受話者側の信号が前記音声区間である場合には、直前の雑音区間の信号の周波数スペクトルを前記周囲雑音の特性とする、
音声強調装置。
【0118】
(付記8) 付記1において、
前記強調特性決定部は、
前記送話者の音声信号を音源特性と声道特性とに分離する分離部と、
前記声道特性から特徴情報を抽出する特徴抽出部と、
を備え、
前記音声強調部は、
前記声道特性、前記特徴情報、および前記周囲雑音の特性から前記声道特性を修正する声道特性修正部と、
前記声道特性修正部からの修正声道特性と前記音源特性とを合成する合成部と、
を備える音声強調装置。
【0119】
(付記9) 入力される受話者側の信号から該受話者側の周囲雑音の特性を求める雑音推定部と、
入力される送話者の音声信号を音源特性と声道特性とに分離する分離部と、
前記声道特性から特徴情報を抽出する特徴抽出部と、
前記声道特性、前記特徴情報、および前記周囲雑音の特性から前記声道特性を修正する声道特性修正部と、
前記声道特性修正部からの修正声道特性と前記音源特性とを合成する合成部と、
を備える音声強調装置。
【0120】
(付記10) 付記9において、
前記分離部は、前記送話者の音声信号を線形予測分析して得られる線形予測係数により構成されるフィルタである、
音声強調装置。
【0121】
(付記11) 付記10において、
前記線形予測係数は、前記送話者の音声信号から算出した自己相関の平均から求められる、音声強調装置。
【0122】
(付記12) 付記10において、
前記線形予測係数は、前記入力される送話者の音声信号の現フレームから算出した自己相関と、過去のフレームから算出した自己相関との加重平均から求められる、音声強調装置。
【0123】
(付記13) 付記9において、
前記声道特性は、前記送話者の音声信号を線形予測分析して得られる線形予測係数から算出される線形予測スペクトルまたは前記送話者の音声信号のフーリエ変換から求められるパワースペクトルである、音声強調装置。
【0124】
(付記14) 付記9において、
前記特徴抽出部は、前記送話者の音声信号を線形予測分析して得られる線形予測係数または前記送話者の音声信号のフーリエ変換から求められるパワースペクトルからホルマント周波数およびホルマント振幅を求める、音声強調装置。
【0125】
(付記15) 付記14において、
前記雑音推定部は、前記周囲雑音の平均電力を前記周囲雑音の特性として求め、
前記声道特性修正部は、前記ホルマント振幅の平均振幅を求め、前記平均振幅および前記周囲雑音の平均電力に基づいて、前記ホルマント振幅を変化させる、
音声強調装置。
【0126】
(付記16) 付記14において、
前記雑音推定部は、前記周囲雑音の周波数スペクトルを前記周囲雑音の特性として求め、
前記声道特性修正部は、前記ホルマント振幅の平均振幅を求め、前記平均振幅および前記周囲雑音の周波数スペクトルに基づいて、前記ホルマント振幅を変化させる、
音声強調装置。
【0127】
(付記17) 付記9において、
前記雑音推定部は、前記周囲雑音の平均電力を前記周囲雑音の特性として求め、
前記声道特性修正部は、前記送話者の音声信号を線形予測分析して得られる線形予測係数から算出される線形予測スペクトルまたは前記送話者の音声信号のパワースペクトルの平均振幅を求め、該平均振幅および前記周囲雑音の平均電力に基づいて、前記ホルマント振幅または前記ホルマントのバンド幅を変化させる、
音声強調装置。
【0128】
(付記18) 付記9において、
前記雑音推定部は、前記周囲雑音の周波数スペクトルを前記周囲雑音の特性として求め、
前記声道特性修正部は、前記送話者の音声信号を線形予測分析して得られる線形予測係数から算出される線形予測スペクトルまたは前記送話者の音声信号のパワースペクトルの平均振幅を求め、前記平均振幅および前記周囲雑音の周波数スペクトルに基づいて、前記ホルマント振幅または前記ホルマントのバンド幅を変化させる、
音声強調装置。
【0129】
(付記19) 付記9において、
前記音源特性である残差信号に対してピッチ強調を行うビッチ強調部をさらに備える、音声強調装置。
【0130】
(付記20) 付記19において、
前記雑音推定部は、前記周囲雑音の平均電力を前記周囲雑音の特性として求め、
前記ピッチ強調部は、前記雑音推定部の前記周囲雑音の平均電力に基づいてピッチ強調の度合いを変化させる、
音声強調装置。
【0131】
(付記21) 入力される受話者側の信号から該受話者側の周囲雑音の平均電力または該受話者側の周囲雑音の周波数スペクトルを求める雑音推定部と、
入力される送話者の音声信号の現フレームから自己相関を求める自己相関算出部と、
前記現フレームの自己相関を記憶し、過去フレームの自己相関を出力するバッファ部と、
前記現フレームの自己相関と前記過去フレームの自己相関との加重平均を求める平均化処理部と、
前記加重平均から逆フィルタ係数を算出する逆フィルタ係数算出部と、
前記逆フィルタ係数により構成され、入力される前記送話者の音声信号の残差信号を出力する逆フィルタと、
前記逆フィルタ係数から周波数スペクトルを算出するスペクトル算出部と、
前記算出された周波数スペクトルからホルマント周波数およびホルマント振幅を推定するホルマント推定部と、
前記算出された周波数スペクトル、前記ホルマント周波数、前記ホルマント振幅、および前記周囲雑音の平均電力または前記周囲雑音の周波数スペクトルから、前記算出された周波数スペクトルに対する増幅率を求める増幅率算出部と、
前記増幅率に基づいて前記算出された周波数スペクトルを変化させ、変化された周波数スペクトルを求めるスペクトル強調部と、
前記変化された周波数スペクトルから合成フィルタ係数を算出する合成フィルタ係数算出部と、
前記合成フィルタ係数から構成され、入力される前記逆フィルタからの前記残差信号から出力音声信号を求める合成フィルタと、
を備える音声強調装置。
【0132】
(付記22) 付記21において、
前記逆フィルタからの残差信号が入力され、該残差信号のピッチ強調を行い、ピッチ強調された残差信号を前記合成フィルタに出力するピッチ強調部をさらに備える、音声強調装置。
【0133】
(付記23) 付記22において、
前記ピッチ強調部は、前記受話者側の周囲雑音の平均電力に基づいてピッチ強調の度合いを変化させる、音声強調装置。
【0134】
【発明の効果】
本発明によると,周囲雑音(背景雑音)の特性だけでなく、送話者の音声の特性も考慮して、音声が強調されるので、より聞き易い音声を受話者に提供することができる。
【図面の簡単な説明】
【図1】(a)は音声強調を受信者側で行う方式を示し、(b)は音声強調を送信者側で行う方式を示す。
【図2】本発明の第1の実施の形態による音声強調装置の原理図である。
【図3】本発明の第1の実施の形態による音声強調装置の詳細な構成を示すブロック図である。
【図4】本発明の第1の実施の形態による音声強調装置の増幅率算出部の詳細な構成を示すブロック図である。
【図5】(a)は、ピッチ強調前の残差信号の波形例を示し、(b)は、ピッチ強調後の残差信号の波形例を示す。
【図6】(a)は、音声の周波数スペクトルの一例を示し、(b)は、周波数スペクトルの強調(ホルマント強調)の原理説明図である。
【図7】スペクトル強調処理の説明図である。
【図8】補間曲線として2次関数を用いた場合のスペクトル増幅率の補間方法の例を示す。
【図9】本発明の第2の実施の形態による音声強調装置の詳細な構成を示すブロック図である。
【図10】本発明の第2の実施の形態による音声強調装置の雑音推定部の詳細な構成を示すブロック図である。
【図11】本発明の第2の実施の形態による音声強調装置の増幅率算出部の詳細な構成を示すブロック図である。
【図12】本発明の第3の実施の形態による音声強調装置の詳細な構成を示すブロック図である。
【図13】本発明の第4の実施の形態による音声強調装置の原理図である。
【図14】本発明の第4の実施の形態による音声強調装置の詳細な構成を示すブロック図である。
【符号の説明】
1 音声強調部
2 強調特性決定部
3,30 雑音推定部
11 逆フィルタ
12,120 ピッチ強調部
13 合成フィルタ
14 合成フィルタ係数算出部
15 スペクトル強調部
21 自己相関算出部
22 平均化処理部
24 逆フィルタ係数算出部
25 スペクトル算出部
26 ホルマント推定部
27,270 増幅率算出部

Claims (5)

  1. 入力される受話者側の信号から該受話者側の周囲雑音の特性を求める雑音推定部と,
    入力される送話者の音声信号を音源特性と声道特性とに分離する分離部と,
    前記声道特性から特徴情報を抽出する特徴抽出部と,
    前記声道特性,前記特徴情報,および前記周囲雑音の特性から前記声道特性を修正する声道特性修正部と,
    前記声道特性修正部からの修正声道特性と前記音源特性とを合成する合成部とを有し,
    前記特徴抽出部は,前記送話者の音声信号の現フレームから自己相関を求める自己相関算出部と,
    前記現フレームの自己相関と前記過去フレームの自己相関との加重平均を求める平均化処理部と,
    前記加重平均から逆フィルタ係数を算出する逆フィルタ係数算出部を有し,
    さらに,前記合成部の前段側に,前記逆フィルタ係数により構成され,前記入力される送話者の音声信号入力される逆フィルタを有し,
    前記声道特性修正部は,前記加重平均から算出した逆フィルタ係数のパワースペクトルを算出し,前記パワースペクトルからホルマント周波数およびホルマント振幅を求め,前記周囲雑音の特性と前記ホルマント周波数および前記ホルマント振幅に基づいて,前記ホルマント振幅を変化させる
    ことを特徴とする音声強調装置。
  2. 請求項において,
    前記雑音推定部は,前記周囲雑音の周波数スペクトルを前記周囲雑音の特性として求め,
    前記声道特性修正部は,前記ホルマント振幅の平均振幅を求め,前記平均振幅および前記周囲雑音の周波数スペクトルに基づいて,前記ホルマント振幅を変化させる,
    ことを特徴とする音声強調装置。
  3. 入力される受話者側の信号から該受話者側の周囲雑音の平均電力または該受話者側の周囲雑音の周波数スペクトルを求める雑音推定部と,
    入力される送話者の音声信号の現フレームから自己相関を求める自己相関算出部と,
    前記現フレームの自己相関を記憶し,過去フレームの自己相関を出力するバッファ部と,
    前記現フレームの自己相関と前記過去フレームの自己相関との加重平均を求める平均化処理部と,
    前記加重平均から逆フィルタ係数を算出する逆フィルタ係数算出部と,
    前記逆フィルタ係数により構成され,入力される前記送話者の音声信号の残差信号を出力する逆フィルタと,
    前記逆フィルタ係数から周波数スペクトルを算出するスペクトル算出部と,
    前記算出された周波数スペクトルからホルマント周波数およびホルマント振幅を推定するホルマント推定部と,
    前記算出された周波数スペクトル,前記ホルマント周波数,前記ホルマント振幅,および前記周囲雑音の平均電力または前記周囲雑音の周波数スペクトルから,前記算出された周波数スペクトルに対する増幅率を求める増幅率算出部と,
    前記増幅率に基づいて前記算出された周波数スペクトルを変化させ,変化された周波数スペクトルを求めるスペクトル強調部と,
    前記変化された周波数スペクトルから合成フィルタ係数を算出する合成フィルタ係数算出部と,
    前記合成フィルタ係数から構成され,入力される前記逆フィルタからの前記残差信号から出力音声信号を求める合成フィルタを有する,
    ことを特徴とする音声強調装置。
  4. 請求項において,
    前記逆フィルタからの残差信号が入力され,該残差信号のピッチ強調を行い,ピッチ強調された残差信号を前記合成フィルタに出力するピッチ強調部をさらに備える,
    ことを特徴とする音声強調装置。
  5. 請求項において,
    前記ピッチ強調部は,前記受話者側の周囲雑音の平均電力に基づいてピッチ強調の度合いを変化させる,音声強調装置。
JP2003080517A 2003-03-24 2003-03-24 音声強調装置 Expired - Fee Related JP4018571B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003080517A JP4018571B2 (ja) 2003-03-24 2003-03-24 音声強調装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003080517A JP4018571B2 (ja) 2003-03-24 2003-03-24 音声強調装置

Publications (2)

Publication Number Publication Date
JP2004289614A JP2004289614A (ja) 2004-10-14
JP4018571B2 true JP4018571B2 (ja) 2007-12-05

Family

ID=33294345

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003080517A Expired - Fee Related JP4018571B2 (ja) 2003-03-24 2003-03-24 音声強調装置

Country Status (1)

Country Link
JP (1) JP4018571B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11523200B2 (en) 2021-03-22 2022-12-06 Kyndryl, Inc. Respirator acoustic amelioration

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4413546B2 (ja) * 2003-07-18 2010-02-10 富士通株式会社 音声信号の雑音低減装置
JP4534883B2 (ja) * 2005-07-11 2010-09-01 カシオ計算機株式会社 楽音制御装置および楽音制御処理のプログラム
JP2007295347A (ja) * 2006-04-26 2007-11-08 Mitsubishi Electric Corp 音声処理装置
JP4926005B2 (ja) * 2007-11-13 2012-05-09 ソニー・エリクソン・モバイルコミュニケーションズ株式会社 音声信号処理装置及び音声信号処理方法、通信端末
US8831936B2 (en) 2008-05-29 2014-09-09 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for speech signal processing using spectral contrast enhancement
JP5453740B2 (ja) 2008-07-02 2014-03-26 富士通株式会社 音声強調装置
US8538749B2 (en) 2008-07-18 2013-09-17 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for enhanced intelligibility
JP5151762B2 (ja) * 2008-07-22 2013-02-27 日本電気株式会社 音声強調装置、携帯端末、音声強調方法および音声強調プログラム
JP2010062663A (ja) 2008-09-01 2010-03-18 Sony Ericsson Mobilecommunications Japan Inc 音声信号処理装置、音声信号処理方法、及び、通信端末
JP5127754B2 (ja) 2009-03-24 2013-01-23 株式会社東芝 信号処理装置
JP5126145B2 (ja) * 2009-03-30 2013-01-23 沖電気工業株式会社 帯域拡張装置、方法及びプログラム、並びに、電話端末
US9202456B2 (en) 2009-04-23 2015-12-01 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for automatic control of active noise cancellation
US9053697B2 (en) 2010-06-01 2015-06-09 Qualcomm Incorporated Systems, methods, devices, apparatus, and computer program products for audio equalization
JPWO2012070670A1 (ja) * 2010-11-25 2014-05-19 日本電気株式会社 信号処理装置、信号処理方法、及び信号処理プログラム
JP5148026B1 (ja) 2011-08-01 2013-02-20 パナソニック株式会社 音声合成装置および音声合成方法
JP5443547B2 (ja) * 2012-06-27 2014-03-19 株式会社東芝 信号処理装置
JP5338962B2 (ja) * 2012-10-23 2013-11-13 沖電気工業株式会社 帯域拡張装置、方法及びプログラム、並びに、電話端末
JP5986901B2 (ja) * 2012-11-19 2016-09-06 日本電信電話株式会社 音声強調装置、その方法、プログラム及び記録媒体
JP6143887B2 (ja) 2013-12-26 2017-06-07 株式会社東芝 方法、電子機器およびプログラム
EP3107097B1 (en) * 2015-06-17 2017-11-15 Nxp B.V. Improved speech intelligilibility
JP2018037745A (ja) * 2016-08-29 2018-03-08 シャープ株式会社 電話機
JP2021117359A (ja) * 2020-01-27 2021-08-10 寿通信機株式会社 音声明瞭化装置および音声明瞭化方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11523200B2 (en) 2021-03-22 2022-12-06 Kyndryl, Inc. Respirator acoustic amelioration

Also Published As

Publication number Publication date
JP2004289614A (ja) 2004-10-14

Similar Documents

Publication Publication Date Title
JP4018571B2 (ja) 音声強調装置
EP2444966B1 (en) Audio signal processing device and audio signal processing method
CN100369111C (zh) 话音增强装置
JP4836720B2 (ja) ノイズサプレス装置
JP3963850B2 (ja) 音声区間検出装置
US7555075B2 (en) Adjustable noise suppression system
JP6147744B2 (ja) 適応音声了解度処理システムおよび方法
AU771444B2 (en) Noise reduction apparatus and method
JP4423300B2 (ja) 雑音抑圧装置
JP5151762B2 (ja) 音声強調装置、携帯端末、音声強調方法および音声強調プログラム
US20110054889A1 (en) Enhancing Receiver Intelligibility in Voice Communication Devices
US20080228473A1 (en) Method and apparatus for adjusting hearing intelligibility in mobile phones
JP2008216720A (ja) 信号処理の方法、装置、及びプログラム
JP2008309955A (ja) ノイズサプレス装置
US7565283B2 (en) Method and system for controlling potentially harmful signals in a signal arranged to convey speech
JP6197367B2 (ja) 通話装置及びマスキング音生成プログラム
JP4135242B2 (ja) 受信装置及び方法、通信装置及び方法
RU2589298C1 (ru) Способ повышения разборчивости и информативности звуковых сигналов в шумовой обстановке
JP4227421B2 (ja) 音声強調装置および携帯端末
JP2022547860A (ja) コンテキスト適応の音声了解度を向上させる方法
JP2010092057A (ja) 受話音声処理装置及び受話音声再生装置
JP2005331783A (ja) 音声強調装置,音声強調方法および通信端末
JP4269364B2 (ja) 信号処理方法及び装置、並びに帯域幅拡張方法及び装置
JP2019200366A (ja) エコー抑圧装置、エコー抑圧方法及びエコー抑圧プログラム
WO2008086920A1 (en) Disturbance reduction in digital signal processing

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20041026

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070403

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070517

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070612

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070809

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20070816

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070918

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070920

R150 Certificate of patent or registration of utility model

Ref document number: 4018571

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100928

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100928

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110928

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120928

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120928

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130928

Year of fee payment: 6

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees