JP2001265398A - 適応型雑音抑圧音声符号化装置及び符号化方法 - Google Patents

適応型雑音抑圧音声符号化装置及び符号化方法

Info

Publication number
JP2001265398A
JP2001265398A JP2000074286A JP2000074286A JP2001265398A JP 2001265398 A JP2001265398 A JP 2001265398A JP 2000074286 A JP2000074286 A JP 2000074286A JP 2000074286 A JP2000074286 A JP 2000074286A JP 2001265398 A JP2001265398 A JP 2001265398A
Authority
JP
Japan
Prior art keywords
noise
circuit
signal
autocorrelation function
audio signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000074286A
Other languages
English (en)
Inventor
Sachio Aoyama
左千男 青山
Shogo Iizuka
捷吾 飯塚
Kazuki Hoshino
一樹 星野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2000074286A priority Critical patent/JP2001265398A/ja
Publication of JP2001265398A publication Critical patent/JP2001265398A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【課題】 現在通話中の雑音レベルを検出し、それを除
去する、またはその影響を軽減するとともに、音声符号
化装置と雑音抑圧装置を一体化して、ハードウエアの簡
略化と消費電力の低減化を図ることのできる優れた適応
型雑音抑圧音声符号化装置及び音声符号化方法を提供す
る。 【解決手段】 音声信号と雑音の自己相関関数が有して
いる特徴に着目して、Rs(0)推定回路101により、自己相
関関数計算回路1303で計算した自己相関関数から音声信
号のみの自己相関関数Rs(0)を求め、その値を用いて、
予測係数算出回路102、係数変換回路103、係数量子化回
路104により、音声符号化のパラメータを作成すること
により、適応型雑音抑圧音声符号化装置を実現するもの
である。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、有線、無線の電話
(携帯電話や自動車電話)等の通信技術全般に適用可能
な適応型雑音抑圧音声符号化装置及び符号化方法に関
し、特に、現在通話中の雑音レベルを検出し、それを除
去する、またはその影響を軽減することを可能とすると
ともに、音声符号化装置と雑音抑圧装置を一体化して、
ハードウエアの簡略化と消費電力の低減をはかるよう構
成したものである。
【0002】
【従来の技術】近年、様々な環境の中で音声を入力情報
とした装置が使われるようになってきたため、騒音環境
の中でも使用できることが重要となってきた。携帯電話
や自動車電話等もその1例である。またIC化技術の進歩
により、このような装置にDSP(デジタルシグナルプロセ
ッサ)を用いて、かなり高度のデジタル信号処理技術を
用いて、音声信号に重畳した周囲雑音を低減する方法が
可能となってきた。以下、従来の雑音抑圧装置につい
て、図12乃至図19を用いて説明する。
【0003】従来の雑音抑圧装置に関しては、その方法
が、1979年4月に発表された、「IEEE Transaction on
Acoustics, Speech, and Signal Processing,vol.ASS
P-27,NO.2,pp.113-120」"Suppression of Acoustic No
ise Speech Using SpectralSubtraction "に、スペクト
ルサブトラクション法として、開示されている。
【0004】このスペクトルサブトラクション法につい
て、図12に示す従来の第1の雑音抑圧装置を用いて簡
単に説明する。図12は従来の第1の雑音抑圧装置の構
成を示したブロツク図である。図12において、901は
切り出し部、902はフーリエ分析部、903は雑音スペクト
ル平均算出部、904は雑音スペクトルメモリ、905は雑音
信号判定部、906は振幅引算部、907は半波整流部、908
は逆フーリエ変換部、909は波形再生部である。
【0005】以上のような構成要素からなる従来の第1
の雑音抑圧装置について、その動作を図13に示すフロ
ーチャートを用いて以下に説明する。ステツプ1001とし
て、入力された音声に対して、切り出し部901におい
て、後でフーリエ分析する際に必要な周波数分解精度が
得られる窓をかけて、10ms程度の周期で20ms程度の区間
の一定長のフレームにおける波形を切り出す。このよう
に連続する波形から一定区間の波形を切り出すため窓の
条件として、後の合成処理で合成して接続したときに不
連続な波形にならず、かつ、フーリエ分析の精度を確保
でき、元の波形が得られるように、50%ずつオーバーラ
ツプさせた分析窓を選択する。この窓関数として、下記
のハニング窓が用いられる。ここで、フーリエ分析のデ
ータ数をNとすると、窓掛け後のn番目のデータに対す
る重みずけW(n)は以下の式(1)に示すように表され
る。 W(n) = 0.5-0.5*cos[2nπ/ (N-1)] (1)
【0006】ステツプ1002として、フーリエ部902にお
いて、分析すべきフレームの音声波形を、フーリエ分析
で周波数分析(FFT分析)して、この分析結果が実数部と
虚数部から構成されるため、これらを振幅スペクトルと
位相スペクトルとに分解する。
【0007】振幅スペクトルは、雑音スペクトルメモリ
904、雑音信号判定部905および雑音引き算部906に出力
される。一方、位相スペクトルは、音声波形の再合成の
ため、逆フーリエ変換部908に出力される。
【0008】ステツプ1003として、雑音信号判定部905
において、入力された信号が音声信号に雑音信号が重畳
した信号であるか、雑音のみの信号であるかを判定す
る。この判定は、入力信号のパワー情報に基づいて行な
い、パワーの大きいところでは、音声の有る音声区間と
し、パワーの小さいところでは、音声のない雑音区間と
する。この音声の”あり”、”なし”の情報を雑音スペ
クトルメモリ904に出力する。
【0009】ステツプ1004として、雑音スペクトルメモ
リ904において、過去数10msの区間の雑音スペクトルを
記憶している。雑音区間においては、フーリエ分析部90
2からの振幅スペクトルを記憶する。また音声区間にお
いては、雑音スペクトルメモリ904にフーリエ分析部902
からの振幅スペクトルを記憶しない。このため、常に雑
音スペクトルメモリ904に最新の雑音スペクトルを記憶
していることになる。
【0010】ステツプ1005として、雑音スペクトル平均
算定部903では、雑音スペクトルメモリ904に記憶されて
いる過去数10フレームの振幅スペクトルの平均スペクト
ルを、雑音の推定量の振幅情報として計算し、音声發声
の直前の雑音の振幅スペクトル、すなわち雑音スペクト
ルとする。このように雑音スペクトルを計算するために
用いるメモリ量は、フーリエ分析で分析される、窓長個
*記憶フレーム数となる。
【0011】ステツプ1006として、振幅引算部906で
は、フーリエ分析部902からの雑音の重畳した音声信号
の各周波数に対応する振幅から、雑音スペクトル平均算
出部903の各周波数に対する雑音の振幅を、各々の周波
数について引算することによつて、音声のみの振幅を計
算する。
【0012】ステツプ1007として、半波整流部907で
は、振幅引算部906での引き算の結果、振幅が負になる
周波数について、その振幅を、ゼロにする。ステツプ10
08として、逆フーリエ変換部908では、半波整流部907か
らの各周波数に対応する振幅と、フーリエ分析部902か
らの各信号に対応する位相とから、雑音が除かれた、音
声波形を合成することにより、1フレーム分の雑音のな
い音声波形を生成する。
【0013】ステツプ1009として、波形再生部909で
は、逆フーリエ変換部908からの1フレーム分の雑音の
ない音声波形を、切り出し部における切り出し処理の逆
の処理を行って、1フレームずつ、1フレームの音声波
形をオーバーラツプさせ、加算して元の連続波形を出力
する。
【0014】以上説明した装置(または方法)は、雑音
の重畳した音声信号をデジタル化して、窓関数をかけて
一定フレームずつ取出し、FFT(高速フーリエ変換)し
て離散化された周波数領域の信号とし、一方、音声の無
い期間の雑音レベルを、予めフレーム単位で、同じくFF
T(高速フーリエ変換)して離散化された周波数領域の
信号として予め記憶装置に記憶しておき、その値を各周
波数ごとに差し引くと言う構成であるが、別の装置(方
法)も従来例として考えられている。
【0015】別の方法を採った従来の第2の雑音抑圧装
置の構成を示すブロツク図を図14に示す。図14にお
いて、901乃至905まで、ならびに908、909は図12に示
すものと同一のため省略する。図示番号1101は各チャン
ネルS/N測定部、1102は各チャンネル利得制御部、1103
は各チャンネル別可変利得増幅器である。
【0016】以上のような構成要素からなる従来の第2
の雑音抑圧装置について、その動作を図15に示すフロ
ーチャートを用いて以下に説明する。ステツプ1001乃至
ステツプ1005までは、図13ですでに説明した動作を行
う。次にステツプ1104では、各チャンネルS/N測定部で
は、周波数領域に変換された各周波数ごとに(周波数は
離散的な値を取る)現在の雑音を含む音声信号のレベル
と、ステツプ1005で雑音スペクトル・メモリ904に貯え
られた各周波数ごとの雑音レベルを取出し信号対雑音比
(S/N比)を計算し、ステツプ1105では、各チャンネル
利得制御部1102で、その値を用いて(信号対雑音比(S/
N比)をそのまま用いるのではなく、ある換算値を用い
る場合もある。)利得制御の値として、各チャンネル別
可変利得制御部1103に渡す。
【0017】ステツプ1106では、各チャンネル別可変利
得制御部1103からの値を用いて各チャンネル別に利得を
変えて雑音を含む音声信号を増幅する。すなわちS/N比
の良いチャンネルでは、利得を大にし、S/N比の悪いチ
ャンネルでは利得を小にすることにより雑音を抑圧する
ことが可能となる。
【0018】なお、実際は各周波数ごとに利得を変えて
制御するのは、数が多くなるので、各周波数をグループ
に分けチャンネルとし、チャンネル別に制御している。
ステツプ1008、1009の動作は図13で説明した。
【0019】以上に説明した、従来の第1及び第2の雑
音抑圧装置は、過去に音声がないと判断したフレームの
時の雑音レベルを周波数帯域毎に記憶しておき、音声が
有ると判断している現在のフレームの雑音を含む音声信
号を周波数領域に変換し各周波数帯域ごとに、記憶して
ある雑音のレベルを差し引く、または、各周波数毎にS/
N比を計算し各周波数毎に増幅器の利得を制御するとい
うものであり、現在通話しているフレームにおける雑音
レベルに適応して、雑音を低減するものではない。ま
た、この従来の装置には、雑音抑圧装置を現在携帯電話
で使用されている音声符号化装置と一体化して、ハード
ウエアの簡易化をはかると言うものではない。
【0020】本発明は、音声信号の中に含まれる雑音の
量を推定するのに、雑音を含む入力信号の自己相関関数
を計算し、自己相関関数の有する特徴を利用して、現在
の音声信号の中に含まれる雑音の量を推定する。ところ
がこれを使用するデジタル方式携帯電話では、雑音抑圧
装置の後には、音声符号化装置が接続される。そして音
声符号化装置では、やはり入力信号の自己相関関数を計
算し符号化のパラメータの算出系に利用している。この
ことに着目すると雑音抑圧装置と音声符号化装置は、一
体化できるはずであり、それにより、雑音抑圧装置の採
用による、回路の複雑化や消費電力の増加を防げるはず
である。そのためには現在、デジタル方式携帯電話に使
用されている音声符号化装置の内容を十分に把握し、そ
の上で一体化した装置を考案するのが良いと考えられ
る。
【0021】現在のデジタル方式携帯電話に使用されて
いる音声符号化装置は各種のものがあるが、その殆どが
CELP(Code-Excited Linear Prediction ;符号励振線形
予測)と呼ばれるものである。従つて以下に先行技術と
して、最も広く採用されている、ACELP(Algebraic CEL
P; 代数CELP)と称されるものについて以下に説明する。
説明には、GSM方式携帯電話の規格書である以下の資料
を利用する。「GSM Global System For Mobile Communi
cations」European Telecommunication Standard ETS 3
00726 March 1997“Digital cellular telecommunicati
onssystem ; Enhanced Full Rate speech transcoding
( GSM 06.06)”
【0022】ACELP音声符号化装置の簡易ブロツク図を
図16に示す。図16において、図示番号1201は固定コ
ードブック、1202は増幅器、1203は適応コードブック、
1204は増幅器、1205は加算器、1206は線形予測合成回
路、1207は聴覚修正回路である。
【0023】以下、図16を用いて、ACELP音声符号化
装置の概略の動作を説明する。固定コードブック1201
は、振幅1の正負のランダムインパルス列である。適応
コードブック1203は、一定周期の繰り返しパルス列であ
る。それらは増幅器1202及び増幅器1204でそれぞれ異な
るゲイン倍される。ここまでは人間の音声発生メカニズ
ムの音源部分に相当する。
【0024】そして両者は加算器1205に加えられ、一緒
になって線形予測合成回路1206に入力されその出力は音
声信号となる。ここまでのところは、人間の音声発生メ
カニズムの音道部分に相当する。すなわち喉や口を経由
して音声が外部に出るところまでである。
【0025】そして線形予測合成回路1206の出力は聴覚
修正回路に入力される。その出力は人間の音声感知特性
を考慮して修正された音声信号となる。なお音声符号化
装置から、受信側の復号化装置に送られるのは、固定コ
ードブック1201、増幅器1202、適応コードブック1203、
増幅器1204、線形予測合成回路1206のパラメータであ
る。
【0026】次にACELP音声符号化装置の詳細機能ブロ
ツク図を図17に示す。図17において、1301は前処理
回路、1302は窓掛け回路、1303は自己相関関数計算回
路、1304は予測係数算出回路、1305は係数変換回路、13
06は係数量子化回路、1307はサブフレーム係数内挿回
路、1308Aはサブフレーム係数内挿回路(量子化前)、1
308Bはインパルス応答計算回路、1309は4サブフレーム
重みずけ音声計算回路、1310Aは開ループピッチ遅れ発
見回路、1310Bは開ループピッチゲイン発見回路、1311A
は適用コードブック、1311Bはピッチゲイン調整回路、1
311Cはインパルス応答回路、1311Dは誤差計算回路、131
1Eは誤差最小化回路、1312は最適遅れとゲイン発見回
路、1313はピッチゲイン量子化回路、1314は適用コード
ブック寄与度計算回路、1316は固定コードブック、1317
Aは固定コードブックゲイン調整回路、1317Bはインパル
ス応答回路、1317Cは誤差計算回路、1317Dは誤差最小化
回路、1317Eは固定コードブック最適値発見回路、1318
は固定コードブックゲイン量子化回路、1319は励振計算
回路、1320は最適フィルタ記憶回路である。
【0027】なお、図16、図17で“回路“と称した
ものは、実際にはこれらは、現在ではデジタルシグナル
プロセッサ(DSP)と呼ばれる1チップの半導体集積
回路であってコンピュータとプログラム記憶装置とで構
成されているが、説明の便宜上、上記の名前を使用す
る。
【0028】以下に図17を用いて、ACELP音声符号化
装置の概略の動作を説明する。
【0029】[前処理回路1301]前処理回路1301は携帯電
話のマイクロホンが音声信号を電気信号として出力した
ものを増幅し、低域濾波器を通し、低域濾波器の遮断周
波数の2倍の周波数でサンプリングし、A/D変換器を通
しデジタル信号として音声符号化装置に供給する働きを
する。具体的な数値を1例として上げると、低域濾波器
の遮断周波数は4kHz、サンプリング周波数は8kHz、A/
D変換器は1サンプルを13bitsのデジタル信号とする。
このデジタル信号は窓掛け回路1302に入力される。
【0030】[窓掛け回路1302]窓掛け回路1302で、デジ
タル信号に窓掛け関数を掛けて取り出す状況を図18に
示す。すなわち音声信号の1フレームは20msであるが、
それを4等分し、1サブフレーム5msの4サブフレーム
で構成する。そして、実際にデータとして取り込むのは
第2サブフレームと第4サブフレームであり、信号の予
測係数の計算は、これらのサブフレームについて計算し
第1サブフレームと第3サブフレームについてはこれら
の計算結果を用いて、内挿計算により求める。第2サブ
フレームと第4サブフレームに掛ける窓関数の形は、図
18に示すように異なる形をしている。取り込むデータ
は30msの期間で、240サンプル有ることは両者同じであ
る。
【0031】[自己相関関数計算回路1303]自己相関関数
計算回路1303は、取り込んだ音声信号に冗長度が有るこ
とを利用して、過去のサンプルから現在のサンプルを予
測する。しかし完全には出来ないので誤差が残る。窓の
掛けられた音声信号をs’(n)をとすると、予測値s”(n)
は下記式(2)で表される。 s”(n)=−Σk=0 k=10ak s’(n-k) (2) すなわち過去10サンプル点のデータで予測している。
【0032】予測誤差e(n)は下記式(3)で表わされ
る。 e(n)=s’(n)−s”(n)=Σk=0 k=10ak s’(n-k) (3) 但し、 k=,0,1,2,3,-,-,,10、a0=1とする。
【0033】ここで、上記したa1,a2,−,−,a10
を下記式(4)及び式(5)が最小になるように選べば
良い。 e(n)*e(n)=Σk=0 k=10ak s’(n-k)*Σj=0 j=10aj s’(n-j) (4) e(n)*e(n)=Σk=0 k=10Σj=0 j=10akajs’(n-k)* s’(n-j) (5)
【0034】ここで、音声信号が窓を掛けて取り込ん
だ、短い時間内では、定常性を仮定できるとすると、
s’(n-k)* s’(n-j)は、(n-j)−(n-k)=(k−j)に
のみ依ることになり、下記式(6)による自己相関関数
で表わされる。 e(n)*e(n)=Σk=0 k=10Σj=0 j=10akaj R(k-j) (6) ここで、下記式(7)が成立している。 R(k-j)= s’(n-k)* s’(n-j) (7) 厳密にいえば、nを取り込んだ全サンプル値で計算し平
均値をとるのである。
【0035】[予測係数算出回路1304]予測係数算出回路
1304は、上記式(6)を最小にする、a1,a2,−,
−,a 10を選ぶことにより予測係数を算出する。その方
法は、上記式(6)のa1,a2,−,−,a10を、それ
ぞれで偏微分し、その結果をゼロとする値を選べば良
い。計算過程は省略するがその結果、下記式(8)が得
られる。
【数1】
【0036】上記式(8)は、レビンソン・ダービン・
アルゴリズムで解くことが出来るので、最適な予測係数
1,a2,−,−,a10が、自己相関関数を用いて求ま
ることになる。
【0037】[係数変換回路1305]係数変換回路1305は、
この様にして計算された最適な予測係数a1,a2,−,
−,a10は時間領域のパラメータ(インパルス応答の係
数)であるが、これを周波数領域のパラメータである、
ライン・スペクトル・ペア(LSP)と呼ばれる別の係
数に以下のようにして、変換する。すでに説明したよう
に、予測誤差は上記した式(3)で表わされた。
【0038】これをz変換すると、次式(9)が得られ
る。 E(z)= S(z)+Σk=1 k=10 akS(z)z-k ; k=1,2,3,-,-,,10 (9)
【0039】そして、予測推定回路の伝達関数として、
A(z)が下式(10)で定義される。 A(z) = E(z)/S(z)= 1 +Σk=1 k=10 akz-k ;k=1,2,3,-,-,,10 (10)
【0040】上記したA(z)を用いて、以下の関数を定
義する。 P(z)= A(z)−z-11A(z-1) (11) Q(z)= A(z)+z-11A(z-1) (12) P(z)、Q(z)はそれぞれ、(1−z-1)、(1+z-1)で割り切れ
る。そして残部は、zの多項式として表される。そして
この多項式は、zの単位円上に根を有する。従つて、 z=esT=eσ+jωT=ejωT (13) 上記式(13)で、T=1とおくと下式(14)を得る。 (z+z-1)/2 =( e + e -jω )/2 = cosω (14) この多項式はcosωに関する5ヶの根をもち、式(15)、
(16)で表わされる。 P(z)=(1−z-1i=1 i=5(1−2 z-1cos(ωi)+z-2 ) ;i=1,-,-,5 (15) Q(z)=(1+z-1) Πi=1 i=5(1−2 z-1cos(βi)+z-2 ) ;i=1,-,-,5 (16) この、ωiとβi合計10ヶの根がライン・スペクトル・
ペア(LSP)と呼ばれるものである。
【0041】この、ライン・スペクトル・ペア(LS
P)は以下のような利点が有ることが知られている。 (a)パラメターの比較だけでシステムの安定判別が出
来る。 (b)周波数軸のパラメータであるため、パラメータの
動きとスペクトル包絡の動きが類似している。すなわち
パラメータの補間特性がよい。 (c)スペクトルひずみに対するパラメータの感度がほ
ぼ一定である。
【0042】[係数量子化回路1306]係数量子化回路1306
は、この様にして得られた、LSPを無線系で受信側に
伝送するために、適切なビツト数に変換する。
【0043】[サブフレーム係数内挿回路1307]サブフレ
ーム係数内挿回路1307は、以上に説明したようにして計
算された、第2サブフレームと第4サブフレームのLS
Pの値を用いて、第1と第3サブフレームのLSPパラ
メータを下式(17)、(18)により、求める。 LSP(フレーム:m;サブフレーム:1)=0.5*LSP(フレーム:(m-1);サフ゛フレ ーム:4)+0.5*LSP(フレーム:(m);サフ゛フレーム:2) (17) LSP(フレーム:m;サブフレーム:3)=0.5*LSP(フレーム:(m);サフ゛フレーム :2)+0.5*LSP(フレーム:(m);サフ゛フレーム:4) (18)
【0044】さらに、これらの値を用いて線形予測回路
の伝達関数であるA’(z)を得る。Aに「 ’ 」を付けた
のは、次に述べる量子化をする前のLSPを用いて求め
たA(z)と区別するためである。
【0045】[サブフレーム係数内挿回路(量子化前)1
308A]サブフレーム係数内挿回路(量子化前)1308Aは無
線系に伝送するための量子化を実施する前のLSPを用
いて、第1と第3サブフレームのLSPパラメータを同
様にして求め、それを用いて、線形予測回路の伝達関数
であるA(z)を得る。
【0046】[インパルス応答計算回路1308B]インパル
ス応答計算回路1308Bは、サブフレーム係数内挿回路
(量子化前)1308Aで得られた、線形予測回路の伝達関
数であるA(z)とサブフレーム係数内挿回路1307で得られ
た量子化後の線形予測回路の伝達関数であるA’(z)とを
用いて、人間の聴覚補正のされた線形予測合成回路のイ
ンパルス応答である、h(n)を求める。h(n)のz変換
は下式(19)で表される。 H(z)=(1/A’(z))・(W(z))={A(z/γ1)}/{ A’(z)・A(z/γ2)} (19)
【0047】通常、γ1=0.9、γ2=0.6に選ばれる。H
(z)とA’(z)とは逆数関係にある。A’(z)は入力音声信
号から予測可能な分を差し引き、残差を出力する。残差
は予測が適切に行われるとランダムパルスとなる。これ
に対してH(z)は残差すなわちランダムパルスを入力し
て音声信号を出力し、その出力に人間の聴覚特性を補正
したものであることを示している。h(n)を求める詳細
方法は省略するが、h(n)は上記のH(z)の逆z変換で
求まる。このh(n)は適応コードブックと固定コードブ
ックのサーチに必要なものである。
【0048】[4サブフレーム重みずけ音声計算回路130
9]4サブフレーム重みずけ音声計算回路1309は窓掛けを
する前のデジタル音声信号4サブフレーム(すなわち音
声信号1フレーム)分の音声に人間の聴覚特性を考慮し
た伝達関数のフィルターを通す。人間の聴覚特性を考慮
した伝達関数のフィルターは下式(20)で表わされる。 W(z)= {A(z/γ1)} /{A(z/γ2)} (20) ここで、γ1=0.9、γ2=0.6である。すなわちサブフレー
ム係数内挿回路(量子化前)1308AでA(z)が判明したの
でW(z)も求まることになる。
【0049】[開ループピッチ遅れ発見回路1310A]、[開
ループピッチゲイン発見回路1310B] 開ループピッチ遅れ発見回路1310A、開ループピッチゲ
イン発見回路1310Bは、10msに1回、すなわち、音声信
号の1フレームである20msに2回、ピッチの周期すなわ
ち遅れ時間とゲインを推定する。開ループによるピッチ
遅れとゲイン発見の方法は、以下関係式(21)〜(24)
によって表される。 Rlag(open) = Σn=0 n=79sw(n)sw(n-k) ;n=0,-,-,79 (21) また、この値は、次の3つの範囲に分けて計算される。 (第3範囲;i=3): k= 18,-,-,-,35 (22) (第2範囲;i=2): k= 36,-,-,-,71 (23) (第1範囲;i=1): k= 72,-,-,-,143 (24)
【0050】その結果、Rlag(open)を最大にする、3つ
の範囲の中での3ヶの値の中からピッチ遅れとピッチゲ
イン最適値がRlag(open)を最大にする値として選ばれ、
遅れ時間は適応コードブック1311A、ピッチゲインはピ
ッチゲイン調整回路1311Bに夫々引き渡される。
【0051】[適応コードブック1311A]、[ピッチゲイン
調整回路1311B] 適応コードブック1311Aは、音声信号のピッチ成分を表
すインパルスのコードブックであり適応的にピッチ遅れ
時間を記憶しパルス列を発生する。ピッチゲイン調整回
路1311Bはピッチゲインを記憶しかつ調整する機能を有
する。まず適応コードブック1311Aとピッチゲイン調整
回路1311Bの初期値は、上記の開ループピッチ遅れ発見
回路1310Aと開ループピッチゲイン発見回路1310Bで求め
られたピッチ遅れ時間とピッチゲインがそれぞれ、適応
コードブック1311Aと、ピッチゲイン調整回路1311Bで使
用される。
【0052】[インパルス応答回路1311C]インパルス応
答回路1311Cはインパルス応答計算回路1308Bで求めたh
(n)と適応コードブック1311A、ピッチゲイン調整回路1
311Bにより合成されたピッチンパルスとを畳み込み積分
して重みずけ音声信号に相当する合成信号に変換しそれ
を誤差計算回路1311Dに入力する。
【0053】[誤差計算回路1311D]誤差計算回路1311D
は、4サブフレーム重みずけ音声計算回路1309で計算さ
れた、重みずけ音声信号と上記インパルス応答回路1311
Cの出力である重みずけ音声信号に相当する合成信号の
差すなわち誤差を計算し誤差最小化回路1311Eに出力す
る。
【0054】[誤差最小化回路1311E]誤差最小化回路131
1Eは誤差計算回路1311Dで計算された誤差の二乗平均値
を求め、その値を最小化するように適応コードブック13
11Aとピッチゲイン調整回路1311Bを制御する。その詳細
は省略するが、前述の開ループピッチ遅れ発見回路1310
Aと開ループピッチゲイン発見回路1310Bで求められたピ
ッチ遅れ時間とピッチゲインの周辺を精密にサーチす
る。
【0055】[最適遅れとゲイン発見回路1312]最適遅れ
とゲイン発見回路1312は誤差最小化回路1311Eの制御の
結果として最適な遅れ時間とゲイン値を発見する。こう
して求められた、適応コードブックの値とピッチゲイン
とは夫々記憶され、それを利用して次の、適応コードブ
ックとピッチゲインの最適値がサーチされるので、動作
が効率よく行われサーチに必要な遅れ時間はサブフレー
ム;40ヶ分(200ms)以下に抑えられている。
【0056】[ピッチゲイン量子化回路1313]ピッチゲイ
ン量子化回路1313は、最適遅れとゲイン発見回路1312で
見出された最適ピッチゲインを、無線系を通じて伝送す
るために、適切なビツト数で量子化する。
【0057】[適用コードブック寄与度計算回路1314]適
用コードブック寄与度計算回路1314は最適遅れとゲイン
発見回路1312で求められた値によるインパルス列を用い
て得られる誤差信号を誤差計算回路1311Dの出力として
誤差計算回路1317Cに出力する。
【0058】[固定コードブック1316]固定コードブック
1316は、5つのトラツクに分けられた全体で10ヶの単パ
ルスの組み合わせで作られているそれらのパルスは、
“+1”と“−1”の値を取ることが出来る。サブフレ
ームは、サンプル点として、40有るので各トラツクは8
サンプル点であり、各パルスの位置はトラツク毎に3ビ
ツトで表される。その状況は、図19に示す。
【0059】[固定ゲイン調整回路1317A]固定ゲイン調
整回路1317Aは固定コードブック1316が発生した1サブ
フレームににつき8ケのパルスの振幅を調整する回路で
あり、その出力をインパルス応答回路1317Bに渡す。
【0060】[インパルス応答回路1317B]インパルス応
答回路1317Bはインパルス応答計算回路1308Bで求めたh
(n)と固定コードブック1316、固定ゲイン調整回路131
7Aにより合成された固定コードインパルスとを畳み込み
積分して重みずけ音声信号に相当する合成信号に変換し
それを誤差計算回路1317Cに入力する。
【0061】[誤差計算回路1317C]誤差計算回路1317C
は、インパルス応答回路1315により、誤差最小化回路13
11Eで最小化された誤差信号を重みずけ音声信号に変換
した信号と、インパルス応答回路1317Bにより、固定コ
ードブック1316、固定ゲイン調整回路1317Aにより合成
された固定コードインパルスを、重みずけ音声信号に相
当する合成信号に変換した信号との差を計算しその値を
誤差最小化回路1317Dに出力する。
【0062】[誤差最小化回路1317D]誤差最小化回路131
7Dは誤差計算回路1317Cで計算された誤差の二乗平均値
を求め、その値を最小化するように固定コードブック13
16と固定ゲイン調整回路1317Aを制御する。その詳細
は省略する。
【0063】[固定コードブック最適値発見回路1317E]
固定コードブック最適値発見回路1317Eは誤差最小化回
路1317Dが誤差の二乗平均値を最小化するように固定コ
ードブック1316と固定ゲイン調整回路1317Aを制御した
結果として固定コードブックの最適値と固定ゲインの最
適値を発見する。
【0064】[固定コードブックゲイン量子化回路1318]
固定コードブックゲイン量子化回路1318は固定コードブ
ックのゲインを無線伝送に必要な適切なビツト数で量子
化する。
【0065】[励振計算回路1319]励振計算回路1319は今
までに説明した事柄により、作られた適応コードブック
ならびにピッチゲインの最適値と、固定コードブックな
らびに固定ゲインの最適値により、サブフレーム毎の合
成音声の励振パルス信号を下式(25)により作成する。 u(n)= gpv(n)+ga C (n) ; n=0,1,2,-,-,-,39 (25) ここで、u(n)は励振ベクトルであり、v(n)は適応コード
ブックの励振ベクトルであり、gpは、そのゲインであ
り、C(n)は固定コードブックの励振ベクトルであり、ga
は、そのゲインである。
【0066】[最適フィルタ記憶回路1320]最適フィルタ
記憶回路1320、図16の線形予測合成回路のパラメータ
やその初期条件を次の動作に備えて記憶しておく。AC
ELP音声符号化装置により、符号化データとして、受
信側に送られるデータは以下である。 (1)ライン・スペクトル・ペア (2)ピッチの遅れ時間 (3)ピッチのゲイン (4)固定コードブックのアドレス (5)固定コードブックのゲイン
【0067】
【発明が解決しようとする課題】しかしながら、以上に
説明した従来の雑音抑圧装置の音声から除去される雑音
は、過去の雑音であり、現在通話中の雑音ではないの
で、通話中に雑音が増減した場合には対応できてないと
いう問題点を有していた。
【0068】また携帯電話には、音声符号化装置を使用
されており、かなり複雑な、信号処理を行っているが、
さらに雑音抑圧装置を追加することは、ハードウエアや
ソフトウエアが、一層、複雑化することとなり問題点を
有していた。
【0069】本発明は、このような問題点を解決し、現
在通話中の雑音レベルを検出し、それを除去する、また
はその影響を軽減することを可能とするとともに、音声
符号化装置と雑音抑圧装置を一体化して、ハードウエア
の簡略化と消費電力の低減をはかることの出来る優れ
た、適応型雑音抑圧音声符号化装置を提供することを目
的とする。
【0070】
【課題を解決するための手段】本発明の請求項1に記載
の発明は、通話中の周囲雑音に適応して、周囲雑音を低
減して音声信号を符号化する音声符号化装置であり、音
声信号をアナログ・デジタル変換器でデジタル信号に変
換し、一定長のデータとして取り出し、自己相関関数を
計算し信号の短期間予測を行う音声符号化装置におい
て、計算した自己相関関数R(0),R(1),R(2),-,-,R(M)を
用いて、雑音を除去した音声信号のみの自己相関関数Rs
(0)として、R(1),R(2),-,-,R(M)のある関数で決まる値
を採用し、その値と、R(1),R(2),-,-,R(M)とで計算した
パラメータを量子化して受信側に伝送することにより、
通話中の周囲雑音に適応して、周囲雑音を低減した音声
信号を受信側で再現することを可能としたものであり、
きわめて簡単な方法で通話中の周囲雑音に適応して、周
囲雑音を低減して音声信号を符号化する音声符号化装置
を実現することができる。
【0071】また、請求項2に記載の発明は、通話中の
周囲雑音に適応して、周囲雑音を低減して音声信号を符
号化する音声符号化装置であり、音声信号をアナログ・
デジタル変換器でデジタル信号に変換し、一定長のデー
タとして取り出し、自己相関関数を計算し信号の短期間
予測を行う音声符号化装置において、取出した信号が雑
音のみのものか又は音声信号に雑音が重畳しているかを
判定する手段を有し、雑音のみの期間であると判定した
場合には、計算した自己相関関数、R(0),R(1),R(2),-,
-,R(M)を記憶手段に、Rnm(0),Rnm(1),Rnm(2),-,-,Rn
m(M)として記憶し、音声信号に雑音が重畳している期間
であると判定した場合は、音声信号のみの自己相関関数
Rs(0)として、R(1),R(2),-,-,R(M)のある関数で決まる
値を採用し、音声信号に重畳している雑音の自己相関関
数Rn(0)を、(R(0)−Rs(0))であるとして求め、その値と
前記記憶手段に貯えてある、Rnm(0)との比を雑音の変動
率、Kとして求め、音声信号に雑音が重畳している期間
の雑音の自己相関関数、Rn(1),Rn(2),-,-,Rn(M)とし
て、雑音のみの期間の自己相関関数として前記記憶手段
に貯えられたRnm(1),Rnm(2),-,-,Rnm(M)を夫々K倍した
値を採用し、このRn(1),Rn(2),-,-,Rn(M)の値を用い
て、音声信号のみの自己相関関数 Rs(1),Rs(2),-,-,Rs
(M)として、R(1)−Rn(1),R(2)−Rn(2),-,-,R(M)−Rn(M)
の値を採用し、このようにして計算されたRs(0),Rs(1),
Rs(2),-,-,Rs(M)を用いて短期予測のパラメータを計算
し、量子化して受信側に伝送することにより、通話中の
周囲雑音に適応して、周囲雑音を低減した音声信号を受
信側で再現することを可能とするものであり、請求項1
の場合が、主としてランダム雑音(ホワイト雑音)に有効
であるのに比べ、雑音自身が自己相関関数を有している
場合にも対応可能な、通話中の周囲雑音に適応して、周
囲雑音を低減して音声信号を符号化する音声符号化装置
を実現することができる。
【0072】なお、上記の動作過程で、雑音のみの期間
に、記憶手段に貯えられたRnm(0),Rnm(1),Rnm(2),- ,-
,Rnm(M)は、従来例図12の雑音スペクトル平均算出部
903、雑音スペクトルメモリ904のところで説明した様に
1フレームだけの値でなく数フレーム分の記憶の値にあ
る重みずけをしたものとしても良いことは言うまでもな
いことである。
【0073】また、請求項3に記載の発明は、請求項1
または2に記載される、通話中の周囲雑音に適応して、
周囲雑音を低減可能な音声符号化装置であり、音声信号
のみの自己相関関数Rs(0)として、R(1),R(2),-,-,R(M)
に、記憶手段に貯えられたピッチ周期Lの自己相関関数R
(L)を加え、それらのある関数で決まる値を採用するこ
とにより、通話中の周囲雑音に適応して、雑音を低減し
た音声信号を受信側で再現することを可能とするもので
あり、ピッチ周期Lの自己相関関数R(L)を加えることに
より、より精度よく周囲雑音を低減することが可能とな
る。
【0074】また、請求項4に記載の発明は、請求項1ま
たは2または3に記載される、通話中の周囲雑音に適応
して、雑音を低減して音声信号を符号化する音声符号化
装置であり、音声符号化装置に存在する音声信号の短期
間予測係数計算回路、係数変換回路、係数量子化回路
を、雑音を取り除いた音声信号の自己相関関数Rs(0)ま
たはRs(0),Rs(1),Rs(2),-,-,Rs(M)を用いて動作させる
ことにより装置の簡略化を可能としたものである。
【0075】また、請求項5に記載の発明は、適応型雑
音抑圧音声符号化装置としての記述である請求項1の発
明を適応型雑音抑圧音声符号化方法として記述したもの
であり、請求項1と同じ効果を得ることができる。
【0076】また、請求項6に記載の発明は、適応型雑
音抑圧音声符号化装置としての記述である請求項2の発
明を適応型雑音抑圧音声符号化方法として記述したもの
であり、請求項2と同じ効果を得ることができる。
【0077】また、請求項7に記載の発明は、適応型雑
音抑圧音声符号化装置としての記述である請求項3の発
明を適応型雑音抑圧音声符号化方法として記述したもの
であり、請求項3と同じ効果を得ることができる。
【0078】また、請求項8に記載の発明は、適応型雑
音抑圧音声符号化装置としての記述である請求項4の発
明を適応型雑音抑圧音声符号化方法として記述したもの
であり、請求項4と同じ効果を得ることができる。
【0079】
【発明の実施の形態】以下、本発明の実施の形態につい
て、図1から図11を用いて説明する。
【0080】(第1の実施の形態)図1は、請求項1及
び請求項5に記載の発明を説明するものであり、本発明
の第1の実施形態における適応型雑音抑圧音声符号化装
置または方法の機能ブロツク図である(以下装置として
記述し方法としての記述は省略する。)。
【0081】図1において、図示番号1301乃至1320まで
のものは図17に示すものと同一であり、すでに説明ず
みのため省略する。図示番号101乃至104までのものが、
本発明を実現するために追加されたものである。図示番
号101はRs(0)推定回路、102は予測係数算出回路、103は
係数変換回路、104は係数量子化回路である。
【0082】図16、図17の従来例ですでに説明した
ように、“回路“と言う名称は実際には、デジタルシグ
ナルプロセッサ(DSP)であってコンピュータとプロ
グラム記憶装置とで構成されているが、説明の便宜上、
回路の名前を使用する。以上のように構成された第1の
実施形態の適応型雑音抑圧音声符号化装置について、図
2、図3を用いてその動作を説明する。
【0083】音声符号化装置としては、ACELP型のもの
で説明するが、音声信号の短期間予測に信号の自己相関
関数を使用する方式のすべての音声符号化装置に適用で
きるものである。
【0084】[前処理回路1301]、[窓掛け回路1302]、
[自己相関関数計算回路1303]これらの回路により、マイ
クロホンからの、周囲雑音を含む入力信号は、アナログ
信号からデジタル信号に変換され、窓を掛けられ取り込
まれ、自己相関関数が計算される。そして、予測係数算
出回路1304から最新フィルタ記憶回路1320に至るまでの
動作は、すでに従来例で説明した音声符号化装置の動作
が行われる。
【0085】[Rs(0)推定回路101]一方自己相関関数計算
回路1303の出力すなわち、雑音を含む音声信号の自己相
関関数である、R(0),R(1),R(2),-,-,R(M)は分岐され
て、Rs(0)推定回路101に入る。まず雑音が、ランダム雑
音、すなわちホワイト雑音であるとする。するとその周
波数スペクトルは平坦であり、この雑音の自己相関関数
は図2に示すようになる。すなわちR(0)の値は正のある
値になり、これは雑音の平均電力を表している。そして
雑音はランダムなので、R(1),R(2),R(3)等の値
はゼロになる。一方音声信号の自己相関関数は各サンプ
ル点間には相関があるので、図3に示す様な値をとり、
R(0)の値は正の値を取り,音声信号の平均電力を示して
おり、R(1),R(2),R(3)等の値は音声信号の統計
的な特性により、夫々正または負の値を取る。従つて、
音声信号に雑音が重畳した信号の場合は、自己相関関数
は両者の和となるので、次式(26)、(27)が成立す
る。 R(0)=Rs(0)+Rn(0) (26) R(k)=Rs(k) ;k=1,2,-,-,-,M (27) ここで、R(0)等は雑音と音声信号の重畳された信号の自
己相関関数であり、Rs(0)等は音声信号の自己相関数で
あり、Rn(0)等は雑音の自己相関関数を表す。
【0086】従つて、音声信号に雑音が重畳された信号
の自己相関関数は、雑音の電力が多いほど、R(0)の値が
大になるが、R(0)以外ではそのようなことは起こらな
い。この性質を利用して、下式(28)によりRs(0)を推
定することが出来る。 Rs(0)=function{|R(1)|,|R(2)|,-,-,-,|R(M)|} (28) ここでfunction{ }は、{ }の中の値のある関数と
して定まることを意味する。又|R(1)|は絶対値をとる
ことを意味する。一例として2,3の例を示す。 Rs(0)=|R(1)| (29) Rs(0)=Max{|R(1)|,|R(2)|,-,-,-,|R(M)|} (30) 等、各種のものが考えられる。
【0087】この様な方法で推定することにより雑音を
含む音声信号の自己相関関数R(0)から、雑音の成分Rn
(0)を取り除き音声信号のみの、自己相関関数Rs(0)を推
定することが出来る。この値は、R(1),R(2),-,-,R(M)つ
ぎの予測係数算出回路102へ渡される。
【0088】[予測係数算出回路102]、[係数変換回路10
3]、[係数量子化回路104]これらの回路の動作は、予測
係数算出回路1304、係数変換回路1305、係数量子化回路
1306のところで説明した動作と同じ動作を雑音の自己相
関関数が除去されたものを使用して行い、受信側へ送ら
れる量子化された、音声符号化のパラメータであるライ
ン・スペクトル・ペア(LSP)の値を作成する。
【0089】一方、予測係数算出回路1304より、最新フ
ィルタ記憶回路1320はすでに説明した音声符号化装置と
しての動作を行う。ここで予測係数算出回路1304、係数
変換回路1305、係数量子化回路1306の代わりに、予測係
数算出回路102、係数変換回路103、係数量子化回路104
を使用しない理由は、予測係数算出回路1304、係数変換
回路1305、係数量子化回路1306の代わりに、予測係数算
出回路102、係数変換回路103、係数量子化回路104を使
用すると、その後の音声符号化装置の動作に悪影響を及
ぼす恐れがあるからである。
【0090】以上のように本発明の第1の実施形態によ
れば、周囲雑音の重畳された音声信号をデジタル信号に
変換して一定長を取り出し短期間予測を行う音声符号化
装置おいて、計算された、信号の自己相関関数から、音
声信号のみの自己相関関数Rs(0)をR(1),R(2),-,-,R(M)
のある関数で決まる値として推定し、その値を用いて計
算した符号化パラメータを受信側に伝送することによ
り、通話中の周囲雑音に適応して、周囲雑音を低減した
音声信号を受信側で再現することを可能とする、音声符
号化装置または方法を実現することができる。
【0091】(第2の実施の形態)図4は、請求項2及
び請求項6に記載の発明を説明するものであり、本発明
の第2の実施形態における適応型雑音抑圧音声符号化装
置または方法の機能ブロツク図である。(以下装置とし
て記述し方法としての記述は省略する。)図4において
図示番号1301乃至1320までのものは図17に示すものと
同一であり、すでに説明ずみのため省略する。図示番号
401乃至410までのものが、本発明を実現するために追加
されたものである。図示番号401は音声/雑音区間判定回
路、402は雑音区間ゲート、403は自己相関関数記憶回
路、404は音声区間ゲート、405はRs(0)推定回路、406は
雑音変化率推定回路、407は自己相関関数推定回路、408
は予測係数算出回路、409は係数変換回路、410は係数の
量子化回路である。以上のように構成された適応型雑音
抑圧音声符号化装置について、その動作を説明する。
【0092】[前処理回路1301]、[窓掛け回路1302]、
[自己相関関数計算回路1303] これらの回路により、マイクロホンからの、周囲雑音を
含む入力信号は、アナログ信号からデジタル信号に変換
され、窓を掛けられ取り込まれ、自己相関関数が計算さ
れる。
【0093】[音声/雑音区間判定回路401]取り込んだ区
間の信号が、雑音のみか、音声を有する区間かを判定す
る回路であるがその方法は公知の各種の方法がある。本
発明では、自己相関関数計算回路1303で、取り込んだ信
号の自己相関関数が計算されているので、これらをR
(0),R(1),-,-,R(M)とすると、R(0)はすなわち取り込ん
だ信号の電力を表しているのでこの値を用いて、R(0)が
ある一定値を超えている場合は音声信号のある期間と
し、一定値を超えない場合は、音声信号のない雑音のみ
の期間と判定するものとする。
【0094】[雑音区間ゲート402]雑音区間ゲート402
は、音声/雑音区間判定回路401が雑音区間と判定した場
合、自己相関関数計算回路1303が計算した、自己相関関
数の値、R(0),R(1),-,-,R(M)を取り込み、自己相関関数
記憶回路403に入力する。
【0095】[自己相関関数記憶回路403]自己相関関数
記憶回路403は、雑音区間ゲート402から供給された、自
己相関関数の値、R(0),R(1),-,-,R(M)を、雑音のみの期
間の、雑音の自己相関関数の値、Rnm(0),Rnm(1),-,-,Rn
m(M)として記憶装置に貯える。
【0096】記憶装置に貯えられたRnm(0),Rnm(1),Rn
m(2),-,-,Rnm(M)は、従来例図16の雑音スペクトル平
均算出部903、雑音スペクトルメモリ904のところで説明
した様に1フレームだけの値でなく数フレーム分の記憶
の値にある重みずけをしたものとしても良いことは言う
までもない。
【0097】[音声区間ゲート404]音声区間ゲート404
は、音声/雑音区間判定回路401が音声区間と判定した場
合、自己相関関数計算回路1303が計算した、雑音を含む
音声信号の自己相関関数の値、R(0),R(1),-,-,R(M)を取
り込み、Rs(0)推定回路405に入力する。
【0098】[Rs(0)推定回路405]Rs(0)推定回路405は、
自己相関関数計算回路1303が計算した、自己相関関数の
値、R(0),R(1),-,-,R(M)を用いて、雑音を含まない音声
信号のみの自己相関関数の値、Rs(0)を、本発明の第1
の実施形態ですでに説明したように、式(28)〜式(3
0)で推定することが出来る。
【0099】図3に、自己相関関数計算回路1303が計算
した、自己相関関数の値、R(0),R(1),-,-,-,の値を説明
のために描いてある。図2に描かれたものは、雑音を含
まない音声信号のみのが取り込まれた場合の、自己相関
関数を示している。従つて、Rs(0),Rs(1),-,-,-,と同
じものである。
【0100】次に雑音を含む音声信号の自己相関関数の
値がどうなるかを考えてみる。まず、音声信号をs(n)、
雑音をv(n)、両方が重畳した信号をy(n)と表す。正確
には窓関数を掛けて取り込んだ信号なので夫々、s’
(n)、v’(n)、y’(n)とすべきであるが、省略する。
【0101】s(n)、v(n)、y(n) の自己相関関数は、そ
れぞれ下式(31)〜(33)で表される。 Rs(j)=s(n)s(n-j) (31) Rn(j) =v(n)v(n-j) (32) Ry(j) =y(n)y(n-j) (33) 上記式(31)〜(33)は正確に言うと取り込んだすべて
のデータについて計算しその平均値を求めたものであ
る。
【0102】両方が重畳した信号をy(n)の自己相関関
数Ry(j)について更に検討すると下式(34)〜(37)を
得る。 y(n)=s(n)+v(n) (34) Ry(j) ={ s(n)+v(n)}{ s(n-j)+ v(n-j)} (35) Ry(j) = s(n) s(n-j) +v(n) s(n-j)+ s(n) v(n-j)+v(n) v(n-j) (36) Ry(j) = Rs(j)+ Rn(j) (37)
【0103】上記式(36)で、第2項と第3項は、音声
信号と雑音とはなんの相関も無いはずだから両者の積は
長時間の平均値としてはゼロになるはずであり、上記式
(37)が成立する。ここで、j=1,2,3,-,-,では、Ry
(j)は、Rn(j)が正負どのような値をとるか不明なので、
Rs(j)よりも大になることもあるし、小になることもあ
る。ところがj=0では、Rs(0)も、Rn(0)も必ず正の値
を取るので、Ry(0)は、必ずRs(0)よりも大であり、その
増加分がRn(0)となるのであり、すで説明したようにし
て、推定することが可能となる。
【0104】Rn(j)についてであるが、雑音がランダム
雑音で、いわゆるホワイト雑音であれば、その周波数ス
ペクトルは平坦で、自己相関関数は図2に示すごとく、
Rn(0)を除けばゼロであるが、今回は、そのような限定
はついていない。しかしながら雑音の統計的な性質すな
わち自己相関関数の形は、雑音のみの区間と、雑音に音
声信号が加わつた区間とで変化せず、雑音量のみが時間
とともに変化したと考えると、音声信号に雑音が重畳し
ている場合の雑音の自己相関関数を以下の式(38)によ
り推定することが可能となる。式(28)によりRs(0)を
推定すると、Rn(0)は次式(38)により推定可能とな
る。 Rn(0)=R(0)−Rs(0) (38) この値は次の雑音変化率推定回路406に渡される。
【0105】[雑音変化率推定回路406]雑音変化率推定
回路406は、引き渡された、式(38)を用いて、現在の
音声信号と雑音量が混在している場合と、音声信号が存
在しなかった時とでの、雑音量の変化率を下式(39)で
推定する。 K= Rn(0)/ Rnm(0) (39) この値を自己相関関数推定回路407へ渡す。
【0106】[自己相関関数推定回路407]自己相関関数
推定回路407は引き渡されたKの値と、自己相関関数記
憶回路403に貯えられた、Rnm(1),-,-,Rnm(M)の値を用い
て、現在の音声信号に混在している雑音の自己相関関数
を以下の式(40)により推定する。 Rn(j)=K* Rnm(j) ; j=1,2,-,-,M (40) 次に、音声信号のみの自己相関関数を、上式(40)を用い
て下式(41)により計算する。 Rs(j)=R(j)−Rn(j) ; j=1,2,-,-,M (41) 以上により得られたRs(0)、Rs(j)の値を予測係数算
出回路408に渡す。
【0107】[予測係数算出回路408]、[係数変換回路40
9]、[係数の量子化回路410] これらの回路の動作は、予測係数算出回路1304、係数変
換回路1305、係数量子化回路1306のところで説明した動
作と同じ動作を雑音の自己相関関数が除去されたものを
使用して行い、受信側へ送られる量子化された、音声符
号化のパラメータであるライン・スペクトル・ペア(L
SP)の値を作成する。一方、予測係数算出回路1304よ
り、最新フィルタ記憶回路1320はすでに説明した音声符
号化装置としての動作を行う。
【0108】以上説明したようにして、雑音がホワイト
雑音に限定されない場合についても音声信号に現在含ま
れている雑音の量に適応して、それを除去できることが
明らかになった。
【0109】以上のように本発明の第2の実施形態によ
れば、周囲雑音の重畳された音声信号をデジタル信号に
変換し、一定長を取り出し短期間予測を行う音声符号化
装置において、取り出した信号が雑音のみのものか又は
音声信号に雑音が重畳しているかを判定する判定手段を
有し、雑音のみの期間であると判定した場合には、計算
した自己相関関数を記憶手段に、Rnm(0),Rnm(1),Rn
m(2),-,-,Rnm(M)として記憶し、音声信号に雑音が重畳
している期間であると判定した場合は、音声信号のみの
自己相関関数Rs(0)として、R(1),R(2),-,-,R(M)のある
関数で決まる値を採用し、音声信号に重畳している雑音
の自己相関関数Rn(0)を、(R(0)−Rs(0))であるとして求
め、その値と記憶手段に貯えてある、Rnm(0)との比を雑
音の変動率、Kとして求め、音声信号に雑音が重畳して
いる期間の雑音の自己相関関数、Rn(1),Rn(2),-,-,Rn
(M)として、雑音のみの期間の自己相関関数として記憶
手段に貯えられたRnm(1),Rnm(2),-,-,Rnm(M)を夫々K倍
した値を採用し、このRn(1),Rn(2),-,-,Rn(M)の値を用
いて、音声信号のみの自己相関関数Rs(1),Rs(2),-,-,Rs
(M)として、R(1)−Rn(1),R(2)−Rn(2),-,-,R(M)−Rn(M)
の値を採用し、このようにして計算されたRs(0),Rs(1),
Rs(2),-,-,Rs(M)を用いて短期予測のパラメータとし
て、受信側に伝送することにより、通話中の周囲雑音に
適応して、その雑音がホワイト雑音ではなくても、その
周囲雑音を低減した音声信号を受信側で再現することを
可能とする、音声符号化装置または方法を実現すること
が出来る。
【0110】(第3の実施の形態)図5は、請求項3及
び請求項7に記載の発明を説明するもので、上記した請
求項1(又は請求項5)の発明と請求項2の発明(又は
請求項6)を組合せたものであり、本発明の第3の実施
形態の第1の適応型雑音抑圧音声符号化装置または方法
の機能ブロツク図である。(以下装置として記述し方法
としての記述は省略する。)図5において図示番号1301
乃至1320までのものは図17に示すものと同一であり、
すでに説明ずみのため省略する。また、図示番号101乃
至104までのものも図1で説明したものと同一である。
第3の実施形態の発明を実現するために追加したもの
は、ピッチ自己相関関数記憶回路501のみである。以上
のように構成された本発明の第3の実施形態における第
1の適応型雑音抑圧音声符号化装置について、図5及び
図6を用いて、その動作を説明する。
【0111】[ピッチ自己相関関数記憶回路501]ピッチ
自己相関関数記憶回路501は、一つ前のサブフレームに
おける、開ル―プピッチ遅れ発見回路1310A、開ループ
ピッチゲイン発見回路1310Bの動作において発見された
自己相関関数について、既に示した式(21)によって開ル
ープによるピッチ遅れとゲイン発見の方法は、 Rlag(open) = Σn=0 n=79sw(n)sw(n-k) ;n=0,-,-,79 (21) に基づいてその最大値を記憶しておき、その値をR(L)と
してRs(0)推定回路101へ渡す。ピッチ自己相関関数R(L)
の一例を図6に示す。
【0112】[Rs(0)推定回路101]Rs(0)推定回路101は、
下式(42)によりRs(0)を推定する。 Rs(0)= function{|R(1)|,|R(2)|,-,-,-,|R(M)|,|R(L)|} (42) ここでfunction{ }は、{ }の中の値のある関数と
して定まることを意味する。又|R(1)|は絶対値をとる
ことを意味する。一例を下式(43)に示す。 Rs(0)= Max{|R(1)|,|R(2)|,-,-,-,|R(M)|,|R(L)|} (43) 等、各種のものが考えられる。
【0113】すなわち、音声符号化装置ですでに計算し
ているピッチ周期Lにおける、雑音を含む音声の自己相
関関数を計算しその値を、Rs(0)の推定に加えると言
う考えである。その他の動作は、第1の実施形態の説明
と同様のため省略する。
【0114】次に、図7は請求項3に記載の発明を説明
するもので、上記した第2の実施形態の発明を付加した
ものであり、本発明の第3の実施形態に示す第2の適応
型雑音抑圧音声符号化装置の機能ブロツク図である。
【0115】図7において図示番号1301乃至1320までの
ものは図17に示すものと同一であり、すでに説明ずみ
のため省略する。また、図示番号401乃至410までのもの
も図4で説明したものと同一である。本発明を実現する
ために追加されたものは、ピッチ自己相関関数記憶回路
701のみである。以上のように構成された本発明の第3
の実施形態における第2の適応型雑音抑圧音声符号化装
置について、図4、図5及び図7を用いてその動作を説
明する。
【0116】[ピッチ自己相関関数記憶回路701]、[Rs
(0)推定回路101]この部分の説明は、図5の説明でピッ
チ自己相関関数記憶回路501、Rs(0)推定回路101で説明
した内容と同一のため省略する。その他の動作は、上記
した第2実施形態の説明と同様のため省略する。
【0117】以上説明したようにして、音声信号に現在
含まれている雑音の量に適応して、それを除去できるこ
とが明らかになった。
【0118】以上のように本発明の第3の実施形態によ
れば、第1の実施形態、または第2の実施形態におい
て、自己相関関数Rs(0)として、R(1),R(2),-,-,R(M)
に、音声符号化装置が求めた音声信号のピッチ周期Lを
用いて計算した、自己相関関数R(L)を更に加えたものの
ある関数で決まる値を採用することにより、第1又は第
2の実施形態における発明に比してより精度よくRs(0)
の推定を可能とする、通話中の周囲雑音を低減した音声
信号を受信側で再現する、音声符号化装置を実現するも
のである。以上説明したようにして、音声信号に現在含
まれている雑音の量に適応して、それを除去できること
が明らかになった。
【0119】(第4の実施の形態)図8は、請求項4及
び請求項8に記載の発明を説明するものであり、本発明
の第4の実施形態における第1の適応型雑音抑圧音声符
号化装置または方法の機能ブロツク図である(以下装置
として記述し方法としての記述は省略する。)。
【0120】図8において図示番号1301乃至1320までの
ものは図17に示すものと同一である。また、図示番号
101は、図1で説明したものと同一である。図1における
図示番号102、103、104のブロツクを、図8において
は、すでに音声符号化装置に存在し、同一の名称と働き
を有する、図示番号1304、1305、1306のブロツクで置き
換え、削除したものである。
【0121】次に図9は、請求項4及び請求項8に記載
の発明を説明するものであり、本発明の第4の実施形態
における第2の適応型雑音抑圧音声符号化装置または方
法の機能ブロツク図である(以下装置として記述し方法
としての記述は省略する。)。
【0122】図9において図示番号1301乃至1320までの
ものは図17に示すものと同一でる。また、図示番号40
1乃至407までのものは、図4で説明したものと同一であ
る。図4における図示番号408、409、410のブロツク
を、図9においては、すでに音声符号化装置に存在し、
同一の名称と働きを有する、図示番号1304、1305、1306
のブロツクで置き換え、削除したものである。
【0123】図8の動作と、図9の動作は、同じ考えに
基づく発明を具体化したものであり、図8は音声信号に
含まれる雑音がホワイト雑音の場合であり、第1の実施
形態に対応するものであり、図9は音声信号に含まれる
雑音がカラード雑音の場合であり、第2の実施形態に対
応するものである。従つて、以下の説明は図9について
行う。図8についての説明は図9の説明で自明のため省
略する。
【0124】[前処理回路1301]、[窓掛け回路1302]、
[自己相関関数計算回路1303]これらの回路の動作はすで
に図1で説明した。また予測係数算出回路1304乃至最新
フィルタ記憶回路1320にいたるブロツクの動作は、すで
に従来例図17により説明した。
【0125】[音声/雑音区間判定回路401]、[雑音区間
ゲート402]、[自己相関関数記憶回路403]、[音声区間ゲ
ート404]、[Rs(0)推定回路405]、[雑音変化率推定回路4
06]これらの回路の動作説明は第2の実施形態の説明と
同一のため省略する。
【0126】[自己相関関数推定回路407]自己相関関数
推定回路407の動作も第2の実施形態と同一であり、動
作の説明は省略するがその出力は予測係数算出回路1304
になされる。第2の実施形態では予測係数算出回路408
になされていたのが異なっている。そして第2の実施形
態に存在した、予測係数算出回路408、係数変換回路40
9、係数の量子化回路410は削除されている。
【0127】第2の実施形態の発明は、音声符号化装置
の内部動作には手を付けずに、受信装置に送るパラメ−
タのみ雑音を除去した自己相関関数を用いて計算したパ
ラメータとすることで、受信装置では雑音の除去された
音声を再現し、一方送信側の音声符号化装置の内部動作
は従来通りとして動作の安定化を保証したものである。
【0128】これと相違して第4の実施形態の発明は、
自己相関関数推定回路407で雑音の除去された音声信号
のみの自己相関関数を予測係数算出回路1304に渡してい
る点にある。こうすることにより第2の実施形態に存在
した、予測係数算出回路408、係数変換回路409、係数の
量子化回路410は削除され装置を簡略化することができ
る。一方音声符号化装置の内部動作は従来とは異なるも
のとなるので、動作の安定化が保証できるのかと言う問
題があり、以下その点について説明する。
【0129】[予測係数算出回路1304]予測係数算出回路
1304は、自己相関関数推定回路407により渡された雑音
の除去された音声信号の自己相関関数を用いて予測係
数、a1,a2,−,−,a10を算出する。
【0130】[係数変換回路1305]係数変換回路1305は、
この様にして計算された最適な予測係数、a1,a2
-,-,a10 をライン・スペクトル・ペア(LSP)と
呼ばれる別の係数に変換する。
【0131】[係数量子化回路1306]係数量子化回路1306
は、この様にして得られた、LSPを無線系で受信側に
伝送するために、適切なビツト数に変換する。
【0132】[サブフレーム係数内挿回路1307]サブフレ
ーム係数内挿回路1307は、以上に説明したようにして計
算された、第2サブフレームと第4サブフレームのLSP
の値を用いて、第1と第3サブフレームのLSPパラメー
タを既述した式(17)、(18)により、求める。 LSP(フレーム :m;サブフレーム : 1)=0.5*LSP(フレーム:(m-1);サフ゛ フレーム:4)+0.5*LSP(フレーム:(m);サフ゛フレーム:2) (17) LSP(フレーム :m;サブフレーム : 3)=0.5*LSPフレーム:(m);サフ゛フレ ーム:2)}+0.5*LSPフレーム:(m);サフ゛フレーム:4)} (18)
【0133】さらに、これらの値を用いて線形予測回路
の伝達関数であるA’(z)を得る。Aに「 ’ 」を付けた
のは、次に述べる量子化をする前のLSPを用いて求めた
A’(z)と区別するためである。ここで注意することはこ
のようにして計算されたA’(z)は雑音を含まない音声信
号のみに対するものとなっている点である。図17に示
す従来例の場合のA’(z)は雑音を含む音声信号に対する
ものとなっている点が異なっている。
【0134】[サブフレーム係数内挿回路(量子化前)1
308A]サブフレーム係数内挿回路(量子化前)1308Aは無
線系に伝送するための量子化を実施する前のLSPを用い
て、第1と第3サブフレームのLSPパラメータを同様に
して求め、それを用いて、線形予測回路の伝達関数であ
るA(z)を得る。ここで注意することはこのようにして計
算されたA(z)は雑音を含まない音声信号のみに対するも
のとなっており、一方図17に示す従来例の場合のA(z)
は雑音を含む音声信号に対するものとなっている。
【0135】[インパルス応答計算回路1308B]インパル
ス応答計算回路1308Bは、サブフレーム係数内挿回路
(量子化前)1308Aで得られた、線形予測回路の伝達関
数であるA(z)とサブフレーム係数内挿回路1307で得られ
た量子化後の線形予測回路の伝達関数であるA’(z)とを
用いて、人間の聴覚補正のされた線形予測合成回路のイ
ンパルス応答である、h(n)を求める。h(n)のz変換
は既述した式(19)で表される。 H(z)=(1/A’(z))・(W(z))={A(z/γ1)} /{ A'(z)・A(z/γ2)} (19) 通常、γ1=0.9、γ2=0.6に選ばれる。このh(n)は適
応コードブックと固定コードブックのサーチに必要なも
のである。
【0136】ここで注意することはこのようにして計算
されたh(n)は雑音を含まない音声信号のみに対する
ものとなっており、一方図17に示す従来例の場合のh
(n)は雑音を含む音声信号に対するものとなっている点
である。
【0137】[4サブフレーム重みずけ音声計算回路130
9]4サブフレーム重みずけ音声計算回路1309は窓掛けを
する前のデジタル音声信号4サブフレーム(すなわち音
声信号1フレーム)分の音声に人間の聴覚特性を考慮し
た伝達関数のフィルターを通す。人間の聴覚特性を考慮
した伝達関数のフィルターは既述した式(20)で表わさ
れる。 W(z)= {A(z/γ1)} /{A(z/γ2)} (20) ここで、γ1=0.9、γ2=0.6である。すなわちサブ
フレーム係数内挿回路(量子化前)1308AでA(z)が判明
したのでW(z)も求まることになる。このようにして計
算された重みずけ音声信号は誤差計算回路1311Dに出力
される。
【0138】ここで注意することはこのようにして計算
されたW(z)は雑音を含まない音声信号のみに対するも
のとなっており、一方図17に示す従来例の場合のW
(z)は雑音を含む音声信号に対するものとなっている点
である。
【0139】[開ループピッチ遅れ発見回路1310A]、[開
ループピッチゲイン発見回路1310B]開ループピッチ遅れ
発見回路1310A、開ループピッチゲイン発見回路1310B
は、10msに1回、すなわち、音声信号の1フレームであ
る20msに2回、ピッチの周期すなわち遅れ時間とゲイン
を推定する。開ループによるピッチ遅れとゲイン発見の
方法は、既述した式(21)に示した通りである。 Rlag(open) = Σn=0 n=79sw(n)sw(n-k) ;n=0,-,-,79 (21) この値は、次の3つの範囲に分けて計算される。 (第3範囲;i=3): k= 18,-,-,-,35 (22) (第2範囲;i=2): k= 36,-,-,-,71 (23) (第1範囲;i=1): k= 72,-,-,-,143 (24) その結果、Rlag(open)を最大にする、3つの範囲の中で
の3ヶの値の中からピッチ遅れとピッチゲイン最適値が
Rlag(open)を最大にする値として選ばれ、遅れ時間は適
応コードブック1311A、ピッチゲインはピッチゲイン調
整回路1311Bに夫々引き渡される。
【0140】[適応コードブック1311A]、[ピッチゲイン
調整回路1311B] 適応コードブック1311Aは、音声信号のピッチ成分を表
すインパルスのコードブックであり適応的にピッチ遅れ
時間を記憶しパルス列を発生する。ピッチゲイン調整回
路1311Bはピッチゲインを記憶しかつ調整する機能を有
する。まず適応コードブック1311Aとピッチゲイン調整
回路1311Bの初期値は、上記の開ループピッチ遅れ発見
回路1310Aと開ループピッチゲイン発見回路1310Bで求め
られたピッチ遅れ時間とピッチゲインがそれぞれ、適応
コードブック1311Aと、ピッチゲイン調整回路1311Bで使
用される。
【0141】[インパルス応答回路1311C]インパルス応
答回路1311Cはインパルス応答計算回路1308Bで求めたh
(n)と適応コードブック1311A、ピッチゲイン調整回路1
311Bにより合成されたピッチンパルスとを畳み込み積分
して重みずけ音声信号に相当する合成信号に変換しそれ
を誤差計算回路1311Dに入力する。
【0142】[誤差計算回路1311D]誤差計算回路1311D
は、4サブフレーム重みずけ音声計算回路1309で計算さ
れた、重みずけ音声信号と上記インパルス応答回路1311
Cの出力である重みずけ音声信号に相当する合成信号の
差すなわち誤差を計算し誤差最小化回路1311Eに出力す
る。
【0143】4サブフレーム重みずけ音声計算回路1309
では、雑音を含まない音声信号に基づく、W(z)が使用
され、インパルス応答回路1311Cでも雑音を含まない音
声信号に基づく、h(n)が使用されているので、誤差計
算回路1311Dで計算された両者の差は図17に示す従来
例の誤差計算回路1311Dで計算されたものとどのような
違いがあるかを以下で検討する。
【0144】ピッチ成分に関しては開ループピッチ遅れ
発見回路1310A、開ループピッチゲイン発見回路1310Bの
ところで説明したが、その範囲は (第3範囲;i=3): k= 18,-,-,-,35 (22) (第2範囲;i=2): k= 36,-,-,-,71 (24) (第1範囲;i=1): k= 72,-,-,-,143 (25) となっている。しかるにW(z)、h(n)が計算された元
になった、A’(z)、A(z)はk= 0,1,2,-,-,10 の範囲で
あり、ピッチ成分に関する限り、雑音を含む音声信号に
基づく、A’(z)、A(z)を用いた従来例と、本発明とで
は殆ど差が無いと言える。従つて特に悪影響はないと言
える。
【0145】[誤差最小化回路1311E]、[最適遅れとゲイ
ン発見回路1312]、[ピッチゲイン量子化回路1313]、[適
用コードブック寄与度計算回路1314]、[固定コードブッ
ク1316]、[固定ゲイン調整回路1317A]これらの回路の動
作の説明は図17に示す従来例とおなじである。
【0146】[インパルス応答回路1317B]インパルス応
答回路1317Bはインパルス応答計算回路1308Bで求めたh
(n)と固定コードブック1316、固定ゲイン調整回路1317
Aにより合成された固定コードインパルスとを畳み込み
積分して重みずけ音声信号に相当する合成信号に変換し
それを誤差計算回路1317Cに入力する。ここで注意する
ことは使用された、h(n)は雑音を含まない音声信号の
みに対するものとなっており、一方図17に示す従来例
の場合のh(n)は雑音を含む音声信号に対するものとな
っている点である。
【0147】[誤差計算回路1317C]誤差計算回路1311Dか
らの入力は従来例と同じと考えて良いことは説明した。
インパルス応答回路1317Bからの入力を考える。固定ゲ
イン調整回路1317Aを経由した固定コードブック1316の
出力パルスは、雑音を含まない音声信号のみに対応する
インパルス応答h(n)と畳み込み積分を受けることにな
る。このことは、雑音成分は再生されないことを意味す
る。従つて誤差計算回路1317Cの出力には雑音成分がそ
のまま現れ、誤差最小化回路1317Dに出力される。
【0148】[誤差最小化回路1317D]誤差最小化回路131
7Dは誤差計算回路1317Cで計算された誤差の二乗平均値
を求め、その値を最小化するように固定コードブック13
16と固定ゲイン調整回路1317Aを制御する。しかしなが
ら、インパルス応答回路1317Bは、雑音を含まない音声
信号のみに対応するh(n)を用いているので、誤差計算
回路1317Cの出力の雑音成分を除去することはできな
い。このことは音声符号化装置の動作に致命的な影響を
及ぼすとは考えられない。なぜならば雑音の平均値はゼ
ロであり、誤差最小化回路1317Dの最終値には影響しな
いからである。
【0149】しかしながら雑音がある程度以上になると
誤差最小化回路1317Dが誤動作したり、誤動作はしない
が最終値に到達する時間が長くなる等の不具合が生じる
可能性はある。予測係数算出回路408、係数変換回路40
9、係数の量子化回路410を削除して装置の簡略化を選択
するか、予測係数算出回路408、係数変換回路409、係数
の量子化回路410を用いて音声符号化装置の動作の安定
化を選択するかは、ケースバイケースのトレードオフの
問題と考えられる。
【0150】[固定コードブック最適値発見回路1317
E]、[固定コードブックゲイン量子化回路1318]、[励振
計算回路1319]これらの回路の動作の説明は図17に示
す従来例とおなじである。
【0151】次に図10は、請求項4及び請求項8に記
載の発明を説明するものであり、本発明の第4の実施形
態における第3の適応型雑音抑圧音声符号化装置または
方法の機能ブロツク図である。
【0152】図10において図示番号1301乃至1320まで
のものは図17に示すものと同一であり、すでに説明ず
みのため省略する。また、図示番号101、501は第3の実
施形態を示す図5で説明したものと同一である。図5に
おける図示番号102、103、104のブロツクを、図10に
おいては、すでに音声符号化装置に存在し、同一の名称
と働きを有する、図示番号1304、1305、1306のブロツク
で置き換え、削除したものである。図10の動作は第3
の実施形態を示す図5の説明と、上記した図9の説明か
ら自明のため省略する。
【0153】次に図11は、請求項4及び請求項8に記
載の発明を説明するものであり、本発明の第4の実施形
態における第4の適応型雑音抑圧音声符号化装置または
方法の機能ブロツク図である。
【0154】図11において図示番号1301乃至1320まで
のものは図17に示すものと同一であり、すでに説明ず
みのため省略する。また、図示番号401乃至407までのも
のは、図7で説明したものと同一である。図7における
図示番号408、409、410のブロツクを、図11において
は、すでに音声符号化装置に存在し、同一の名称と働き
を有する、図示番号1304、1305、1306のブロツクで置き
換え、削除したものである。図11の動作は上記した図
7の説明と、上記した図9の説明から自明のため省略す
る。
【0155】以上のように本発明の第4の実施形態によ
れば、第1の実施形態、第2の実施形態、又は第3の実
施形態において、音声符号化装置に存在する音声信号の
短期間予測係数計算回路、係数変換回路、係数量子化回
路を、雑音を取り除いた音声信号の自己相関関数Rs
(0)、またはRs(0),Rs(1),Rs(2),-,-,Rs(M)を用いて動作
させることにより、周囲雑音を低減可能な音声符号化装
置の大幅な簡略化を可能とするものである。以上説明し
たようにして、音声信号に現在含まれている雑音の量に
適応して、それを除去する、適応型音声符号化装置また
は方法が実現できることが明らかになった。
【0156】
【発明の効果】以上のように本発明は、音声信号の自己
相関関数と、雑音の自己相関関数が夫々有している特徴
と、音声信号と雑音が重畳している信号の自己相関関数
の特徴を用いて信号処理を行い、現在通話中のフレーム
に含まれている雑音のレベルに適応して、雑音抑圧動作
を行うと共に、この雑音を含む音声信号の自己相関関数
は、音声符号化装置で、音声の符号化処理の過程で使用
されるものなので、雑音抑圧装置と音声符号化装置と
を、それぞれ独立に設けるのではなく、一体化すること
により、通話中の雑音に適応した適応型雑音抑圧音声符
号化装置を実現することができ、ハードウエアやソフト
ウエアの増加を極力少なく出来るという効果を有する。
【図面の簡単な説明】
【図1】第1の実施の形態における適応型雑音抑圧音声
符号化装置の機能ブロツク図、
【図2】ランダム雑音(ホワイト雑音)の自己相関関数
のグラフ、
【図3】音声信号の自己相関関数のグラフ、
【図4】第2の実施の形態における適応型雑音抑圧音声
符号化装置の機能ブロツク図、
【図5】第3の実施の形態における第1の適応型雑音抑
圧音声符号化装置の機能ブロツク図、
【図6】ピッチ周期を考慮した、音声信号の自己相関関
数のグラフ、
【図7】第3の実施の形態における第2の適応型雑音抑
圧音声符号化装置の機能ブロツク図、
【図8】第4の実施の形態における第1の適応型雑音抑
圧音声符号化装置の機能ブロツク図、
【図9】第4の実施の形態における第2の適応型雑音抑
圧音声符号化装置の機能ブロツク図、
【図10】第4の実施の形態における第3の適応型雑音
抑圧音声符号化装置の機能ブロツク図、
【図11】第4の実施の形態における第4の適応型雑音
抑圧音声符号化装置の機能ブロツク図、
【図12】従来の第1の雑音抑圧装置のブロツク図、
【図13】従来の第1の雑音抑圧装置の動作フローチャ
ート、
【図14】従来の第2の雑音抑圧装置のブロツク図、
【図15】従来の第2の雑音抑圧装置の動作フローチャ
ート、
【図16】従来のACELP音声符号化装置の簡易ブロツク
図、
【図17】従来のACELP音声符号化装置の詳細機能ブロ
ツク図、
【図18】従来の音声信号の窓掛け取り込み図、
【図19】従来のACELP音声符号化装置のコードブック
構成表である。
【符号の説明】
101 Rs(0)推定回路 102 予測係数算出回路 103 係数変換回路 104 係数量子化回路 401 音声/雑音区間判定回路 402 雑音区間ゲート 403 自己相関関数記憶回路 404 音声区間ゲート 405 Rs(0)推定回路 406 雑音変化率推定回路 407 自己相関関数推定回路 408 予測係数算出回路 409 係数変換回路 410 係数の量子化回路 501 自己相関関数計算回路 701 自己相関関数計算回路 901 切り出し部 902 フーリエ分析部 903 雑音スペクトル平均算出部 904 雑音スペクトルメモリ 905 雑音信号判定部 906 振幅引算部 907 半波整流部 908 逆フーリエ変換部 909 波形再生部 1001 ステツプ窓掛け 1002 ステツプ FFT 分析 1003 ステツプ 音声区間検知 1004 ステツプ 雑音記憶 1005 ステツプ 平均スペクトル計算 1006 ステツプ 雑音引算部 1007 ステツプ 負係数ゼロ化 1008 ステツプ IFFT 1009 ステツプ 波形合成 1101 各チャンネルS/N測定部 1102 各チャンネル利得制御部 1103 各チャンネル別可変利得増幅器 1104 ステツプ各チャンネルS/N測定 1105 ステツプ各チャンネル利得制御 1106 ステツプ 各チャンネル別可変利得増幅 1201 固定コードブック 1202 増幅器 1203 適応コードブック 1204 増幅器 1205 加算器 1206 線形予測合成回路 1207 聴覚修正回路 1301 前処理回路 1302 窓掛け回路 1303 自己相関関数計算回路 1304 予測係数算出回路 1305 係数変換回路 1306 係数量子化回路 1307 サブフレーム係数内挿回路 1308A サブフレーム係数内挿回路(量子化前) 1308B インパルス応答計算回路 1309 4サブフレーム重みずけ音声計算回路 1310A 開ループピッチ遅れ発見回路 1310B 開ループピッチゲイン発見回路 1311A 適応コードブック 1311B ピッチゲイン調整回路 1311C インパルス応答回路 1311D 誤差計算回路 1311E 誤差最小化回路 1312 最適遅れとゲイン発見回路 1313 ピッチとゲイン量子化回路 1314 適用コードブック寄与度計算回路 1316 固定コードブック 1317A 固定ゲイン調整回路 1317B インパルス応答回路 1317C 誤差計算回路 1317D 誤差最小化回路 1317E 固定コードブック最適値発見回路 1318 固定コードブックゲイン量子化回路 1319 励振計算回路 1320 最適フィルタ記憶回路回路
───────────────────────────────────────────────────── フロントページの続き (72)発明者 星野 一樹 東京都目黒区三田一丁目4番4号 恵比寿 ビュータワー3102号室 Fターム(参考) 5D045 CA01 5J064 AA04 BA13 BB03 BB07 BB12 BC06 BC16 BC27 BD02 9A001 BB02 EE02 EE05 GG03 GG05 HH15

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】 周囲雑音の重畳された音声信号をアナロ
    グ・デジタル変換器でデジタル信号に変換する手段と、
    それを一定長のデータとして取り出す手段と、自己相関
    関数を計算する手段と、それにより信号の短期間予測を
    行う手段を有する音声符号化装置において、 計算した自己相関関数を、R(0),R(1),R(2),-,-,R(M)と
    すると、音声信号のみの自己相関関数Rs(0)を、R(1),R
    (2),-,-,R(M)のある関数で決まる値で推定する手段と、
    それにより推定した値と、R(1),R(2),-,-,R(M)とで予測
    係数を計算する手段と、それにより得たパラメータを別
    のパラメータに変換する手段を有し変換されたパラメー
    タを量子化する手段とを備え、その量子化されたパラメ
    ータを受信側に伝送することにより、通話中の周囲雑音
    に適応して、周囲雑音を低減する音声信号を受信側で再
    現することを可能とする、適応型雑音抑圧音声符号化装
    置。
  2. 【請求項2】 周囲雑音の重畳された音声信号をアナロ
    グ・デジタル変換器でデジタル信号に変換する手段と、
    それを一定長のデータとして取り出す手段と、信号の自
    己相関関数R(0),R(1),R(2),-,-,R(M)を計算する手段
    と、それにより信号の短期間予測を行う手段とを有する
    音声符号化装置において、 取り出した信号が雑音のみのものか又は音声信号に雑音
    が重畳しているかを判定する判定手段と、自己相関関数
    R(0),R(1),R(2),-,-,R(M)の値を記憶する記憶手段と、
    取り出した信号を前記判定手段が雑音のみの信号期間で
    あると判定した場合には、計算した自己相関関数、R
    (0),R(1),R(2),-,-,R(M)を前記記憶手段にRnm(0),Rn
    m(1),Rnm(2),-,-,Rnm(M)として記憶し、また取り出した
    信号を前記判定手段が音声信号に雑音が重畳している信
    号期間であると判定した場合には、音声信号のみの自己
    相関関数Rs(0)として、R(1),R(2),-,-,R(M)のある関数
    で決まる値を採用する手段と、音声信号に重畳している
    雑音の自己相関関数Rn(0)を、(R(0)−Rs(0))であるとし
    て求め、その値と前記記憶手段に貯えてある、Rnm(0)と
    の比を雑音の変動率、Kとして求める手段と、音声信号
    に雑音が重畳している期間の雑音の自己相関関数、Rn
    (1),Rn(2),-,-,Rn(M)として、雑音のみの期間の自己相
    関関数として前記記憶手段に貯えたRnm(1),Rnm(2),-,-,
    Rnm(M)を夫々K倍した値を採用して求め、このRn(1),Rn
    (2),-,-,Rn(M)の値を用いて、音声信号のみの自己相関
    関数Rs(1),Rs(2),-,-,Rs(M)として、R(1)−Rn(1),R(2)
    −Rn(2),-,-,R(M)−Rn(M)の値を求める手段と、このよ
    うにして計算されたRs(0),Rs(1),Rs(2),-,-,Rs(M)を用
    いて短期予測のパラメータ量を計算する計算手段と、そ
    れにより求めたパラメータを別のパラメータに変換する
    手段を有し変換されたパラメータを量子化する量子化手
    段とを備え、その量子化されたパラメータを受信側に伝
    送することにより、通話中の周囲雑音に適応して、周囲
    雑音を低減した音声信号を受信側で再現することを可能
    とする、適応型雑音抑圧音声符号化装置。
  3. 【請求項3】 音声信号のピッチ周期Lを用いて自己相
    関関数R(L)を計算する手段と、その値を記憶する記憶手
    段と、音声信号のみの自己相関関数Rs(0)として、R(1),
    R(2),-,-,R(M)に、前記記憶手段により記憶されたピッ
    チ周期Lの自己相関関数R(L)を加えたある関数で決まる
    値として求める手段とを備え、それにより得られた値を
    Rs(0)として採用することにより、通話中の周囲雑音に
    適応して、周囲雑音を低減した音声信号を受信側で再現
    することを可能とする、請求項1または請求項2のいず
    れかに記載の適応型雑音抑圧音声符号化装置。
  4. 【請求項4】 音声符号化装置に存在する音声信号の短
    期間予測係数計算手段、係数変換手段、係数量子化手段
    を、雑音を取り除いた音声信号の自己相関関数Rs(0)、
    またはRs(0),Rs(1),Rs(2),-,-,Rs(M)を用いて、動作さ
    せることにより装置の簡略化を可能とする、周囲雑音に
    適応して、周囲雑音を低減した音声信号を受信側で再現
    することを可能とする、請求項1乃至請求項3のいずれ
    かに記載の適応型雑音抑圧音声符号化装置。
  5. 【請求項5】 周囲雑音の重畳された音声信号をアナロ
    グ・デジタル変換器でデジタル信号に変換し、それを一
    定長のデータとして取り出し、自己相関関数を計算しそ
    れにより信号の短期間予測を行う音声符号化方法におい
    て、 計算した自己相関関数を、R(0),R(1),R(2),-,-,R(M)と
    すると、音声信号のみの自己相関関数Rs(0)として、R
    (1),R(2),-,-,R(M)のある関数で決まる値で推定し、そ
    れにより推定した値と、R(1),R(2),-,-,R(M)とで予測係
    数を計算し、それにより得たパラメータを量子化し、そ
    の量子化されたパラメータを受信側に伝送することによ
    り、通話中の周囲雑音に適応して、周囲雑音を低減する
    音声信号を受信側で再現することを可能とする、適応型
    雑音抑圧音声符号化方法。
  6. 【請求項6】 周囲雑音の重畳された音声信号をアナロ
    グ・デジタル変換器でデジタル信号に変換し、それを一
    定長のデータとして取り出し、信号の自己相関関数R
    (0),R(1),R(2),-,-,R(M)を計算し、それにより信号の短
    期間予測を行う音声符号化方法において、 取り出した信号が雑音のみのものか又は音声信号に雑音
    が重畳しているかを判定し、雑音のみの期間であると判
    定した場合には、計算した自己相関関数、R(0),R(1),R
    (2),-,-,R(M)をRnm(0),Rnm(1),Rnm(2),-,-,Rnm(M)とし
    て記憶し、音声信号に雑音が重畳している期間であると
    判定した場合は、音声信号のみの自己相関関数Rs(0)と
    して、R(1),R(2),-,-,R(M)のある関数で決まる値を採用
    し、音声信号に重畳している雑音の自己相関関数Rn(0)
    を、(R(0)−Rs(0))であるとして求め、その値と記憶し
    てある、Rnm(0)との比を雑音の変動率、Kとして求め、
    音声信号に雑音が重畳している期間の雑音の自己相関関
    数、Rn(1) ,Rn(2) ,-,-,Rn(M)として、雑音のみの期間
    の自己相関関数として記憶してある、Rnm(1),Rnm(2),-,
    -,Rnm(M)を夫々K倍した値を採用して求め、このRn(1),
    Rn(2),-,-,Rn(M)の値を用いて、音声信号のみの自己相
    関関数Rs(1),Rs(2),-,-,Rs(M)として、R(1)−Rn(1),R
    (2)−Rn(2),-,-,R(M)−Rn(M)の値を求め、このようにし
    て計算されたRs(0),Rs(1),Rs(2),-,-,Rs(M)を用いて短
    期予測のパラメータを量を計算し、それにより求めたパ
    ラメータを別のパラメータに変換し、変換されたパラメ
    ータを量子化し、その量子化されたパラメータを受信側
    に伝送することにより、通話中の周囲雑音に適応して、
    周囲雑音を低減した音声信号を受信側で再現することを
    可能とする、適応型雑音抑圧音声符号化方法。
  7. 【請求項7】 音声信号のみの自己相関関数Rs(0)を、R
    (1),R(2),-,-,R(M)に、記憶手段に貯えられた音声信号
    のピッチ周期Lを用いて計算した、自己相関関数R(L)を
    加えたある関数で決まる値として求め、それにより得ら
    れた値をRs(0)として採用することにより、通話中の周
    囲雑音に適応して、周囲雑音を低減した音声信号を受信
    側で再現することを可能とする、請求項5または請求項
    6のいずれかに記載の適応型雑音抑圧音声符号化方法。
  8. 【請求項8】 雑音を取り除いた音声信号の自己相関関
    数Rs(0)、またはRs(0),Rs(1),Rs(2),-,-,Rs(M)を用い
    て、音声信号の短期間予測係数計算、予測係数の係数変
    換、ならびに係数の量子化を行い、雑音を含む音声信号
    の自己相関関数R(0)、またはR(0),R(1),R(2),-,-,R(M)
    を用いて、雑音を含む音声信号の短期間予測係数計算、
    予測係数の係数変換、ならびに係数の量子化を行うこと
    に代えることにより、動作の簡易化を実現し、周囲雑音
    に適応して、周囲雑音を低減した音声信号を受信側で再
    現することを可能とする、請求項5乃至請求項7のいず
    れかに記載の適応型雑音抑圧音声符号化方法。
JP2000074286A 2000-03-16 2000-03-16 適応型雑音抑圧音声符号化装置及び符号化方法 Pending JP2001265398A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000074286A JP2001265398A (ja) 2000-03-16 2000-03-16 適応型雑音抑圧音声符号化装置及び符号化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000074286A JP2001265398A (ja) 2000-03-16 2000-03-16 適応型雑音抑圧音声符号化装置及び符号化方法

Publications (1)

Publication Number Publication Date
JP2001265398A true JP2001265398A (ja) 2001-09-28

Family

ID=18592370

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000074286A Pending JP2001265398A (ja) 2000-03-16 2000-03-16 適応型雑音抑圧音声符号化装置及び符号化方法

Country Status (1)

Country Link
JP (1) JP2001265398A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009539132A (ja) * 2006-05-30 2009-11-12 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオ信号の線形予測符号化
JP5556175B2 (ja) * 2007-06-27 2014-07-23 日本電気株式会社 信号分析装置と、信号制御装置と、そのシステム、方法及びプログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009539132A (ja) * 2006-05-30 2009-11-12 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオ信号の線形予測符号化
JP5556175B2 (ja) * 2007-06-27 2014-07-23 日本電気株式会社 信号分析装置と、信号制御装置と、そのシステム、方法及びプログラム

Similar Documents

Publication Publication Date Title
JP6804528B2 (ja) ステレオ音声信号をプライマリチャンネルおよびセカンダリチャンネルに時間領域ダウンミックスするために左チャンネルと右チャンネルとの間の長期相関差を使用する方法およびシステム
US10032461B2 (en) Method and apparatus for generating a speech signal
JP4764118B2 (ja) 帯域制限オーディオ信号の帯域拡大システム、方法及び媒体
JP4137634B2 (ja) 紛失フレームを取扱うための音声通信システムおよび方法
JP4213243B2 (ja) 音声符号化方法及び該方法を実施する装置
JP4173641B2 (ja) 音声活動に基づくゲイン制限による音声強化
EP1846920B1 (en) Method for generating concealment frames in communication system
US7539615B2 (en) Audio signal quality enhancement in a digital network
JP4520732B2 (ja) 雑音低減装置、および低減方法
JP4302978B2 (ja) 音声コーデックにおける擬似高帯域信号の推定システム
KR102417047B1 (ko) 잡음 환경에 적응적인 신호 처리방법 및 장치와 이를 채용하는 단말장치
US20080069016A1 (en) Packet based echo cancellation and suppression
JPWO2010113220A1 (ja) 雑音抑圧装置
JPH0962299A (ja) コード励振線形予測符号化装置
JP4127792B2 (ja) 音声強化デバイス
KR20070007851A (ko) 계층 부호화 장치 및 계층 부호화 방법
RU2707144C2 (ru) Аудиокодер и способ для кодирования аудиосигнала
Gomez et al. Recognition of coded speech transmitted over wireless channels
CN116052700B (zh) 声音编解码方法以及相关装置、系统
JP2001265398A (ja) 適応型雑音抑圧音声符号化装置及び符号化方法
JP2022547860A (ja) コンテキスト適応の音声了解度を向上させる方法
JP2001273000A (ja) 適応型雑音抑圧音声符号化装置
JP2018124304A (ja) 音声符号化装置、音声復号装置、音声符号化方法、音声復号方法、プログラム、および記録媒体
EP1944761A1 (en) Disturbance reduction in digital signal processing
US8583425B2 (en) Methods, systems, and computer readable media for fricatives and high frequencies detection