JP2002175100A - 適応型雑音抑圧音声符号化装置 - Google Patents

適応型雑音抑圧音声符号化装置

Info

Publication number
JP2002175100A
JP2002175100A JP2000375319A JP2000375319A JP2002175100A JP 2002175100 A JP2002175100 A JP 2002175100A JP 2000375319 A JP2000375319 A JP 2000375319A JP 2000375319 A JP2000375319 A JP 2000375319A JP 2002175100 A JP2002175100 A JP 2002175100A
Authority
JP
Japan
Prior art keywords
noise
section
speech
autocorrelation function
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000375319A
Other languages
English (en)
Inventor
Shigeru Hosoi
茂 細井
Kazuki Hoshino
一樹 星野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2000375319A priority Critical patent/JP2002175100A/ja
Publication of JP2002175100A publication Critical patent/JP2002175100A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【課題】 現在通話中の雑音を検出し、それを除去する
とともに、音声符号化装置と雑音除去装置を一体化し、
ハードウエアを簡略化出来る適応型雑音抑圧音声符号化
装置を提供する。 【解決手段】 音声信号と雑音の自己相関関数が有して
いる特徴に着目し、雑音区間/音声区間判定ブロツク22
0により取出した区間が雑音のみの区間か、雑音の重畳
している音声信号の区間かを判定し、雑音符号化ブロツ
ク221により周囲雑音を除去し、雑音除去音声自己相関
関数計算ブロツク224により、雑音を含まない音声信号
のみの自己相関関数{Rs(j)}を計算し、雑音除去音声符
号化ブロツク222により雑音を含まない音声信号を符号
化することにより、通話中の周囲雑音を除去して音声信
号を符号化する適応型雑音抑圧音声符号化装置が得られ
る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、有線、無線の電話
(携帯電話や自動車電話)等の通信技術分野に適用可能
な適応型雑音抑圧音声符号化装置に関し、特に、現在通
話中の雑音を検出し、それを除去するとともに、音声符
号化装置と雑音抑圧装置を一体化して、ハードウエアを
簡略化するよう構成したものである。
【0002】
【従来の技術】近年、様々な環境の中で音声を入力情報
とした装置が使われるようになつてきたため、騒音環境
の中でも使用できることが重要となつてきた。携帯電話
や自動車電話等もその1例である。またIC化技術の進歩
により、このような装置にDSP(デジタルシグナルプロセ
ツサ)を用いて、音声信号に重畳した周囲雑音を低減す
る方法が可能となつてきた。以下、従来の雑音抑圧装置
について、図面を参照しながら説明する。
【0003】従来の雑音抑圧装置に関しては、その方法
が、1979年4月に発表された、「IEEE Transaction on
Acoustics, speech, and Signal Processing vol, ASSP
-27,NO.2,pp.113-120“Supression of Acoustic Noise
Speech Using Spectral Subtraction ”」に、スペク
トルサブトラクション法として、開示されている。
【0004】このスペクトルサブトラクション法につい
て、図11に示す従来の第1の雑音抑圧装置をを用いて
簡単に説明する。図11は従来の第1の雑音抑圧装置の
構成を示したブロツク図である。
【0005】図11において、901は切り出し部、902は
フーリエ分析部、903は雑音スペクトル平均算出部、904
は雑音スペクトルメモリ、905は雑音/信号判定部、906
は振幅引算部、907は半波整流部、908は逆フーリエ変換
部、909は波形再生部である。以上のような構成要素か
らなる従来の雑音抑圧装置について、その動作を図12
に示すフローチャートを用いて以下に説明する。
【0006】ステツプ1001は、入力された音声に対し
て、切り出し部901において、後でフーリエ分析する際
に必要な周波数分解精度が得られる窓をかけて、10ms程
度の周期で20ms程度の区間の一定長のフレームにおける
波形を切り出す。このように連続する波形から一定区間
の波形を切り出すため窓の条件として、後の合成処理で
合成して接続したときに不連続な波形にならず、かつ、
フーリエ分析の精度を確保でき、元の波形が得られるよ
うに、50%ずつオーバーラツプさせた分析窓を選択す
る。
【0007】この窓関数として、下記のハニング窓が用
いられる。ここで、フーリエ分析のデータ数をNとする
と、窓掛け後のn番目のデータに対する重みずけW(n)は
下記の式1に示すように表される。 W(n) = 0.5−0.5・cos[2nπ/ (N-1)] (1)
【0008】ステツプ1002は、フーリエ部902におい
て、分析すべきフレームの音声波形を、フーリエ分析で
周波数分析(FFT分析)して、この分析結果が実数部と虚
数部から構成されるため、これらを振幅スペクトルと位
相スペクトルとに分解する。
【0009】振幅スペクトルは、雑音スペクトルメモリ
904、雑音/信号判定部905および雑音引き算部906に出
力される。一方、位相スペクトルは、音声波形の再合成
のため、逆フーリエ変換部908に出力される。
【0010】ステツプ1003は、雑音/信号判定部905に
おいて、入力された信号が音声信号に雑音が重畳した信
号であるか、雑音のみの信号であるかを判定する。この
判定は、入力信号のパワー情報に基づいて行い、パワー
の大きいところでは、音声の有る音声区間とし、パワー
の小さいところでは、音声のない雑音区間とする。この
音声の“あり”、“なし”の情報を雑音スペクトルメモ
リ94に出力する。
【0011】ステツプ1004は、雑音スペクトルメモリに
おいて、過去数10msの区間の雑音スペクトルを記憶して
いる。雑音区間においては、フーリエ分析部902からの
振幅スペクトルを記憶する。また音声区間においては、
雑音スペクトルメモリ904にフーリエ分析部902からの振
幅スペクトルを記憶しない。このため、常に雑音スペク
トルメモリ904に最新の雑音スペクトルを記憶している
ことになる。
【0012】ステツプ1005として、雑音スペクトル平均
算定部903では、雑音スペクトルメモリ904に記憶されて
いる過去数10フレームの振幅スペクトルの平均スペクト
ルを、雑音の推定量の振幅情報として計算し、音声發声
の直前の雑音の振幅スペクトル、すなわち雑音スペクト
ルとする。このように雑音スペクトルを計算するために
用いるメモリ量は、フーリエ分析で分析される、窓長個
*記憶フレーム数となる。
【0013】ステツプ1006は、振幅引算部906では、フ
ーリエ分析部902からの雑音の重畳した音声信号の各周
波数に対応するした振幅から、雑音スペクトル平均算出
部903の各周波数に対する雑音の振幅を、各々の周波数
について引算することによつて、音声のみの振幅を計算
する。
【0014】ステツプ1007は、半波整流部907では、振
幅引算部906での引き算の結果、振幅が負になる周波数
について、その振幅を、ゼロにする。
【0015】ステツプ1008は、逆フーリエ変換部908で
は、半波整流部907からの各周波数に対応する振幅と、
フーリエ分析部902からの各信号に対応する位相とか
ら、雑音が除かれた、音声波形を合成することにより、
1フレーム分の雑音のない音声波形を生成する。
【0016】ステツプ1009は、波形再生部909で、逆フ
ーリエ変換部908からの1フレーム分の雑音のない音声
波形を、切り出し部における切り出し処理の逆の処理を
行つて、1フレームずつ、1フレームの音声波形をオー
バーラツプさせ、加算して元の連続波形を出力する。
【0017】以上説明した装置(または方法)は、雑音
の重畳した音声信号をデジタル化して、窓関数をかけて
一定フレームずつ取出し、FFT(高速フーリエ変換)し
て離散化された周波数領域の信号とし、一方、音声の無
い期間の雑音レベルを、予めフレーム単位で、同じくFF
T(高速フーリエ変換)して離散化された周波数領域の
信号として予め記憶装置に記憶しておき、その値を各周
波数ごとに差し引くと言う構成であるが、別の装置(方
法)も従来例として考えられている。
【0018】そのような方法の従来の第2の雑音抑圧装
置の構成を示すブロツク図を図13に示す。図13にお
いて、901乃至905、ならびに図示番号908、909は図11
に示すものと同一のため省略する。図示番号1101は各チ
ャンネルS/N測定部、1102は各チャンネル利得制御部、1
103は各チャンネル別可変利得増幅器である。
【0019】以上のような構成要素からなる従来の第2
の雑音抑圧装置について、その動作を図14に示すフロ
ーチャートを用いて以下に説明する。ステツプ1001乃至
ステツプ1005は、図11ですでに説明した動作を行う。
【0020】次にステツプ1104では、各チャンネルS/N
測定部で、周波数領域に変換された各周波数ごとに(周
波数は離散的な値を取る)現在の雑音を含む音声信号の
レベルと、ステツプ1005で雑音スペクトル・メモリ904
に貯えられた各周波数ごとの雑音レベルを取出し信号対
雑音比(S/N比)を計算する。
【0021】ステツプ1105では、各チャンネル利得制御
部1102で、その値を用いて(信号対雑音比(S/N比)を
そのまま用いるのではなく、ある換算値を用いる場合も
ある。)利得制御の値として、各チャンネル別可変利得
制御部1103に渡す。
【0022】ステツプ1106では、各チャンネル別可変利
得制御部からの値を用いて各チャンネル別に利得を変え
て雑音を含む音声信号を増幅する。すなわちS/N比の良
いチャンネルでは、利得を大にし、S/N比の悪いチャン
ネルでは利得を小にすることにより雑音を抑圧すること
が可能となる。なる実際は各周波数ごとに利得を変えて
制御するのは、数が多くなるので、周波数を数ヶずつグ
ループに分けチャンネルとし、チャンネル別に制御して
いる。ステツプ1008、1009の動作は図11で説明した。
【0023】以上に説明した、雑音抑圧装置は、過去に
音声がないと判断したフレームの時の雑音レベルを周波
数帯域毎に記憶しておき、音声が有ると判断している現
在のフレームの雑音を含む音声信号を周波数領域に変換
し各周波数帯域ごとに、記憶してある雑音のレベルを差
し引く、または、各周波数毎にS/N比を計算し各周波数
毎に増幅器の利得を制御するというものであり、現在通
話しているフレームにおける雑音レベルに適応して、雑
音を低減するものではない。また、従来の雑音抑圧装置
は、雑音抑圧装置を現在携帯電話で使用されている音声
符号化装置と一体化して、ハードウエアの簡易化をはか
ると言うものではない。
【0024】本発明は、音声信号の中に含まれる雑音の
量を推定するのに、雑音を含む入力信号の自己相関関数
を計算し、自己相関関数の有する特徴を利用して、現在
の音声信号の中に含まれる雑音の量を推定する。
【0025】ところがこれを使用するデジタル方式(TD
MA方式、または、CDMA方式)携帯電話では、雑音抑圧装
置の後には、音声符号化装置が接続される。そして音声
符号化装置では、やはり入力信号の自己相関関数を計算
し符号化のパラメータの算出系に利用している。
【0026】このことに着目すると雑音抑圧装置と音声
符号化装置は、一体化できるはずであり、それにより、
雑音抑圧装置の採用による、部の複雑化や消費電力の増
加を防げるはずである。
【0027】そのためには現在、デジタル方式携帯電話
に使用されている音声符号化装置の内容を十分に把握
し、その上で一体化した装置を考案するのが良いと考え
られる。
【0028】現在のデジタル方式携帯電話に使用されて
いる音声符号化装置は各種のものがあるが、その殆どが
CELP(Code-Excited Linear Prediction ;符号励振線形
予測)と呼ばれるものである。従つて以下に先行技術と
して、最も広く採用されている、ACELP ( Algebraic CE
LP; 代数CELP)と称されるものについて以下に説明す
る。説明には、GSM方式携帯電話の規格書である以下の
資料を利用する。「European Telecommunication Stand
ard ETS 300726 March 1997“Digital cellular teleco
mmunications system;Enhanced Full Rate speech tran
scoding”(GSM 06.06)」
【0029】ACELP音声符号化装置の機能ブロツク図兼
フローチャートを図15に示す。ACELP音声符号化装置
のブロツク図は非常に複雑であり、図15は本発明との
関係で、必要な基本的な部分のみ示してある。
【0030】図15において、図示番号1301は前処理
部、1302は窓掛け部、1303は自己相関関数計算部、1304
は予測係数算出部、1307はサブフレーム係数内挿部、13
08は重みずけ音声計算部、1309Aは重みずけインパルス
応答計算部、1309Bは予測差計算部、1321は音声初期条
件設定部、1322は重みずけゼロ入力合成部、1323は差計
算部、1310は開ループピツチ遅れ時間計算部、1311Aは
適用コードブツク、1311Bは適用コードゲイン、1312は
重みずけインパルス応答部、1313は差計算部、1314は差
最小化部、1315は固定コードブツク、1316は固定コード
ゲイン、1317は差計算部、1318は差最小化部、1319は音
声最適励振計算部、1320Aは音声最適出力計算部、1320B
は音声最適出力記憶部、1324は音声符号化出力部であ
る。
【0031】なお、図15で“部“と言う名称を使用し
たが、実際にはこれらは、デジタルシグナルプロセツサ
(DSP)と呼ばれる半導体集積回路であつて、コンピュ
ータとプログラム記憶装置で構成されているが、説明の
便宜上、上記の名前を使用する。以下に図15を用い
て、ACELP音声符号化装置の概略の動作を本発明で必要
な事柄を中心に説明する。
【0032】ステツプ1:[前処理部1301] 前処理部1301は携帯電話のマイクロホンが音声信号を電
気信号として出力したものを増幅し、低域濾波器を通
し、低域濾波器の遮断周波数の2倍の周波数でサンプリ
ングし、A/D変換器を通しデジタル信号として音声符号
化装置に供給する働きをする。具体的な数値を1例とし
て上げると、低域濾波器の遮断周波数は4kHz、サンプ
リング周波数は8kHz、A/D変換器は1サンプルを13bits
のデジタル信号とする。このデジタル信号は窓掛け部13
02と重みずけ音声計算部1308に入力される。
【0033】ステツプ2:[窓掛け部1302] 窓掛け部1302で、デジタル信号に窓掛け関数を掛けて取
り出す状況を図16に示す。すなわち音声信号の1フレ
ームは20msであるが、それを4等分し、1サブフレーム
5msの4ヶのサブフレームで構成する。そして、予測係
数の計算は、第2と第4サブフレームについて計算し、
第1サブフレームと第3サブフレームについては内挿計
算により求める。図16に示すように、現在のフレーム
160ヶのデータに1つ前のフレームの後半のデータ80ヶ
加え240ヶのデータを取り込む。この240ヶのデータに第
2サブフレームの予測係数の計算のために、図16にD1
(n)として示す窓関数を掛ける。また第4サブフレーム
の予測係数の計算には、図16にD2(n)として示す窓関
数を掛ける。そして窓関数を掛けられたデジタル信号出
力は自己相関関数計算部1303に入力される。
【0034】ステツプ3:[自己相関関数計算部1303] 自己相関関数計算部1303は、窓掛け部1302で説明した第
2サブフレームと第4サブフレームの窓掛けデータを用
いて、次式により第2サブフレームと第4サブフレーム
の自己相関関数を計算する。 R(j)=(1/(240−j))≡n=j n=239s(n)・s(n−j) ; j=1,2,-,-,10 (2) s(n)のダツシュ“”は取り込んだ信号s(n)に窓関数D1
(n)、またはD2(n)を掛けたことを示す。なお、予測の分
析次数はp=10とする。
【0035】ステツプ4:[予測係数算出部1304] 窓の掛けられた音声信号をs(n)とすると予測値s(n)は下
式で表される。 s(n)=−Σj=1 j=10aj s(n-j) (3)
【0036】すなわち過去10サンプル点のデータで予測
している。予測差e(n)は下式で表わされる。 e(n)=s(n)−s(n)=Σj=0 j=10aj s(n-j) (4) 但しa0=1とする。
【0037】予測差e(n)の二乗和を最小にする、最適な
予測係数a1,a2,−,−,a10は、自己相関関数計算
部1303で計算した自己相関関数を用いて下式により計算
できる。
【数1】
【0038】上式(5)は、レビンソン・ダービン アル
ゴリズムで解くことが出来るので、最適な予測係数
1,a2,−,−,a10 が、自己相関関数を用いて求
まる。
【0039】ところで上式(4)をZ変換すると、下式が
得られる。 E(z)= S(z)+Σj=1 j=10 ajS(z)z-j (6)
【0040】S(z)を入力とし、E(z)を出力とするブロツ
クを「予測部」と言い、その伝達関数A(z)を下式で定
義する。 A(z) = E(z)/S(z)= 1 +Σj=1 j=10 ajz-j (7)
【0041】一方E(z)を入力とし、S(z)を出力とするブ
ロツクを「合成部」と言い、その伝達関数H(z)を下式
で定義する。 H(z)=1/ A(z) =S(z) / E(z) =1/( 1 +Σj=1 j=10 ajz-j ) (8) なお、求められた第2、第4サブフレームの予測係数は
サブフレーム係数内挿部1307に出力される。
【0042】ステツプ5:[サブフレーム係数内挿部130
7] サブフレーム係数内挿部1307は、ステツプ4で計算され
た、第2サブフレームと第4サブフレームの予測係数の
値を用いて、第1と第3サブフレームの値を内挿により
求める。その結果第1、第2、第3、第4サブフレーム
につき線形予測部の伝達関数である、上式(7)に示し
た、A(z)を得ることができる。
【0043】実際にはACELP音声符号化装置では予測係
数a1,a2,−,−,a10をLSP(ラインスペクトル
ペアと言う)係数に変換し第2と第4サブフレームのラ
インスペクトルペアから第3サブフレームのラインスペ
クトルペアを求め、1つ前のフレームの第4サブフレー
ムと現在のフレームの第2サブフレームの値から第1サ
ブフレームのラインスペクトルペアを求める。
【0044】そして、これらの値を再度予測係数a1
2,−,−,a10に変換する方法をとっている。
【0045】求められた各サブフレームの予測係数の値
は重みずけ音声計算部1308、重みずけインパルス応答計
算部1309A、予測差計算部1309Bに引き渡される。
【0046】ステツプ6:[重みずけ音声計算部1308] 重みずけ音声計算部1308は窓掛けをする前のデジタル音
声信号4サブフレーム(すなわち音声信号1フレーム)
分の音声に人間の聴覚特性を考慮した伝達関数のフィル
タを通す。人間の聴覚特性を考慮した伝達関数のフィル
タは下式で表わされる。 W(z)= {A(z/γ1)} /{A(z/γ2)} (9) ここで、γ1=0.9、γ2=0.6である。
【0047】すなわちサブフレーム係数内挿部1307でA
(z)が判明するとW(z)も求まる。得られた重みずけ音
声信号は予測差計算部1309B、差計算部1323、開ループ
ピツチ遅れ時間計算部1310に入力される。
【0048】ステツプ7A:[重みずけインパルス応答計
算部1309A] 重みずけインパルス応答計算部1309Aは、ステツプ5で
得られた、線形予測部の伝達関数であるA(z)とステツプ
6で得られた人間の聴覚特性を考慮した伝達関数W(z)
を用いて、人間の聴覚補正がなされた線形合成部のイン
パルス応答である、h(n)を求める。h(n)のz変
換は下式で表され、h(n)はH(z)を逆Z変換して
求まる。 H(z)=(1/A(z))・(W(z))={A(z/γ1)} /{ A(z)・A(z/γ2)} (10) このh(n)は適応コードブツクと固定コードブツクの
最適値のサーチに必要なものであり、重みずけゼロ入力
合成部1322、重みずけインパルス応答部1312、重みずけ
インパルス応答部1316へ渡される。
【0049】ステツプ7B:[ 予測差計算部1309B] 予測差計算部1309Bは、ステツプ6で計算された重みず
け音声信号の予測差信号をステツプ5で計算された各サ
ブフレームの予測係数a1,a2,−,−,a10を用いて
計算する。サンプル時点nの重みずけ音声信号をsw(n)、
その予測信号を sw(n)と表すと下式が成立する。 sw(n)=−Σj=1 j=10aj sw(n-j) (11)
【0050】すなわち過去10サンプル点のデータで予測
している。予測差信号をew(n)とすると、下式で表わさ
れる。 ew(n)= sw(n)−sw(n)=Σj=0 j=10aj sw(n-j) (12) 但しa0=1とする。
【0051】上式(12)で表される予測差ew(n)を求め、
適応コードブツク1311Aに渡す。過去10サンプルまでの
データを用い、最適予測係数を使用して計算されたew
(n)には、過去10サンプルよりも大きい相関を有するsw
(n)の信号成分はそのまま残留していることになる。こ
れがすなわちピッチ成分であり、適応コードとして、適
応コードブツク1311Aに渡される。
【0052】ステツプ8:[音声初期条件設定部1321] 音声符号化装置は、ステツプ7Aで求められた「合成
部」(その伝達関数は上式(9)のH(z)であり、重
みずけインパルス応答部1312と重みずけインパルス応答
部1316が「合成部」に相当する。)に、後にステツプ12
Aとステツプ16Aで説明する適応コードパルス列と固定コ
ードパルス列を入力し、その出力として重みずけ音声信
号に相当する合成信号を得て、実際の重みずけ音声信号
との差の二乗平均を最小にする制御を行うことにより、
音声の符号化を達成する。
【0053】「合成部」の伝達関数は各サブフレーム毎
に更新され、それに対して適応コードパルス列と固定コ
ードパルス列が各サブフレーム毎に40サンプル入力され
それに対応する出力が合成音声として出力される。この
場合出力サンプルは夫々のサブフレームの入力サンプル
に関係するだけでなく、各サブフレームのスタート時点
の「合成部」の状態にも関係する。「合成部」のスター
ト時点の状態は、スタート時点以前すなわち1つ前のサ
ブフレームでの「合成部」出力値により定まる。
【0054】「合成部」の出力をy(n)、入力をx(n)とす
ると下式が成立する。但し入出力間の利得は簡単にする
ため、1とする y(n)+c1y(n−1)+・・+cmy(n−m)= x(n) (13)
【0055】時点nにおける出力y(n)は時点nにおける入
力x(n)によるだけでなく、それ以前のmヶの出力、y(n-
1)、・・、y(n-m)にも左右される。y(n-1)、・・、y(n-
m)は時点nにおける「合成部」の状態を表すものであり
下式で定義する。 q1(n)=y(n−m),q2(n)=y(n−(m−1)),・・,qm(n)=y(n−1) (14) 式(13)に式(14)を代入すると、下式を得る。 y(n)+c1qm(n)+・・+cmq1(n)= x(n) (15) 式(15)でnを(n+1)とすると下式を得る。 q1(n+1)=y(n+1−m)=y(n−(m−1))=q2(n), q2(n+1)=y(n+1−(m−1))=y(n−(m−2)) , ・・・・・・・・・・・・・・・・・・, qm(n+1)=y(n+1−1)=y(n) (16)
【0056】「合成部」の状態を表す状態ベクトルq(n)
(太字かつ斜体)を下式(17)により定義する。
【数2】
【0057】式(16)、式(17)を用いると下式を得
る。
【数3】
【数4】
【0058】式(19)で、c(太字かつ斜体)を下式(20)
により定義するとy(n)について下式(21)を得る。
【数5】
【数6】
【0059】ここでマトリクスA(太字かつ斜体)を下式
で定義する。
【数7】
【0060】なお以後、マトリクスはアルファベツトの
大文字、ベクトルは小文字とし、共に太字かつ斜体を使
用し区別する。式(18)、(22)を用いると下式(23)を得
る。
【数8】
【0061】式(23)でn=0とすると、下式(24)を
【数9】
【0062】また上式(23)でn=1とすると、下式(25)を
【数10】
【0063】順次nを増加させて計算すると下式(26)を
得る。
【数11】
【0064】上式(21)、式(26)を用いると下式(27)を得
る。
【数12】
【0065】上式(27)の第2項は、「合成部」の出力y
(n)の同一サブフレームの入力、x(n),x(n−1),・・・
・,x(0)に対応する出力であり、“ゼロ状態出力”と言
う。また、式(27)の第1項は、「合成部」の出力y(n)
の初期状態に対応する出力であり、“ゼロ入力出力”と
言う。
【0066】従つて「合成部」では、各サブフレーム毎
に先ず初期状態に対応する“ゼロ入力出力”を計算し、
後にステツプ12とステツプ16で説明する適応コードパル
ス列と固定コードパルス列を入力し、式(27)の第2項
に示される出力すなわち“ゼロ状態出力”計算すること
になる。
【0067】初期条件q(0)は、上式(14)でn=0とすると
下式で表される。
【0068】すなわち「合成部」の初期状態q(0)は1つ
前のサブフレームの出力である。mの値がいくつになる
かであるが、予測部の次数は10であり、「合成部」とし
てはm=40すなわち1つ前のサブフレーム40サンプル点の
出力値が初期状態q(0)として必要となる。
【0069】後述する、音声最適励振計算部1319で計算
された、1つ前のサブフレームの励振パルス列により計
算された「合成部」の出力が、最適出力計算記憶部1320
に記憶され、次のサブフレームのq(0)として使用され
る。すなわち音声初期条件設定部1321は最適出力計算記
憶部1320に記憶された値を読み出し初期状態q(0)として
重みずけインパルス応答部1322に出力する。
【0070】ステツプ9:[重みずけゼロ入力合成出力
計算部1322] 重みずけゼロ入力合成出力計算部1322は重みずけインパ
ルス応答計算部1309Aで求めたh(n)とステツプ8で
音声初期条件設定部1321により設定された初期条件を用
いて「合成部」の初期状態q(0)に対応する重みずけ合成
音声信号を計算し、差計算部1323に入力する。
【0071】ステツプ10:[差計算部1323] 差計算部1323は、ステツプ6により、重みずけ音声計算
部1308で計算された、重みずけ音声信号とステツプ9に
より計算された重みずけゼロ入力合成出力との差を計算
し後述するステップ14を実行する差計算部1313に出力す
る。
【0072】ステツプ11:[開ループピツチ遅れ時間計
算部1310] 開ループピツチ遅れ時間計算部1310は、10msに1回、す
なわち、音声信号の1フレームである20msに2回、重み
ずけ音声計算部1308で計算された重みずけ音声信号を用
いて下式によるピツチ自己相関関数を計算し、その値を
最大にする遅れ時間を見出す。ピツチ自己相関関数の計
算に用いられるデータは図17に示されるように現在の
フレームのデータと1つ前のフレームのデータが用いら
れる。ピツチ自己相関関数を下式で表す。 Rp(j) = Σn=0 n=79sw(n)sw(n-j) ;n=1,2,-,-,79 (29) 遅れ時間jの値は、次の3つの範囲に分けて計算され
る。 (第3範囲;i=3): j= 18,-,-,-,35 (第2範囲;i=2): j= 36,-,-,-,71 (第1範囲;i=1): j= 72,-,-,-,143
【0073】Rp(j)が遅れ時間j=Lで最大になったとする
と、その値Lが適応コードブツク1311Aに引き渡される。
【0074】ステツプ12A:[適応コードブツク1311A] 適応コードブツク1311Aは、音声信号のピツチ成分を表
すインパルスのコードブツクである。その値はステツプ
7Bで、予測差計算部1309Bにより計算された予測差ew
(n)(式(12))が用いられる。その理由は式(3)に
よる予測は遅れ時間j=10程度までの予測であり、遅れ時
間j=18ないし143におよぶピツチ成分はそのまま予測差
として出力されるからである。従つて適応コードブツク
1311Aは現在のフレームだけでなく1つ前のフレームま
での予測差ew(n)を記憶し適応コードとして用いる。
【0075】ステツプ12B:[適応コードゲイン1311B] 適応コードゲイン1311Bは適応コードブツク1311Aの適応
コードに対して、後述のステツプ15の制御で定まる適切
なゲインを与える。
【0076】ステツプ13:[重みずけインパルス応答部1
312] 重みずけインパルス応答部1312は重みずけインパルス応
答計算部1309Aで求めたh(n)と前記適応コードが、
適応コードゲイン1311Bでゲイン倍された信号とを畳み
込み積分して重みずけ合成信号に変換しそれを差計算部
1313に入力する。
【0077】ステツプ14:[差計算部1313] 差計算部1313は、ステツプ10で差計算部1323から入力さ
れた信号とステツプ13で重みずけインパルス応答部1312
から入力された信号すなわち適応コードゲイン1311Bで
ゲイン倍された適応コードによる重みずけ合成信号との
差を計算し差最小化部1314に出力する。
【0078】ステツプ15:[差最小化部1314] 差最小化部1314は差計算部1313で計算された差の二乗平
均値を求め、その値を最小化するように適応コードブツ
ク1311Aの遅延時間と、適応コードゲイン1311Bのゲイン
を制御する。
【0079】ステツプ16A:[固定コードブツク1315A] 固定コードブツク1315Aは、5つのトラツクに分けられ
た全体で10ヶの単パルスの組み合わせで作られている。
それらのパルスは、“+1”と“−1”の値を取ること
が出来る。サブフレームは、サンプル点として、40有る
ので各トラツクは8サンプル点であり、各パルスの位置
はトラツク毎に3ビツトで表される。その状況は、図1
8に示される。
【0080】ステツプ16B:[固定コードゲイン1315B] 固定コードゲイン1315Bは固定コードブツク1315Aの固定
コードに対して、後述のステツプ18の制御で定まる適切
なゲインを与える。
【0081】ステツプ17:[重みずけインパルス応答部1
316] 重みずけインパルス応答部1316は重みずけインパルス応
答計算部1309Aで求めたh(n)と固定コードブツク131
5A、固定コードゲイン1315Bにより合成された固定コー
ドインパルスとを畳み込み積分して重みずけ音声信号に
相当する合成信号に変換しそれを差計算部1317に入力す
る。
【0082】ステツプ18:[差計算部1317] 差計算部1317は、ステツプ15で最小化された差計算部13
13の出力信号とステツプ17で合成された重みずけ音声信
号に相当する合成信号との差を計算しその値を差最小化
部1318に出力する。
【0083】ステツプ19:[差最小化部1318] 差最小化部1318は差計算部1317で計算された差の二乗平
均値を求め、その値を最小化するように固定コードブツ
ク1315A/固定コードゲイン1315Bを制御する。
【0084】ステツプ20:[音声最適励振計算部1319] 音声最適励振計算部1319は今までに説明した事柄によ
り、作られた適応コードブツクならびに適応コードゲイ
ンの最適値と、固定コードブツクならびに固定コードゲ
インの最適値により、サブフレーム毎の合成音声の励振
パルス列を下式により作成する。 u(n)= gpv(n)+ga C(n) ; n=0,1,2,-,-,-,39 (30) ここで、u(n)は励振パルス列であり、v(n)は適応コード
ブツクの励振パルス列であり、gpは、そのゲインであ
り、C(n)は固定コードブツクの励振パルス列であり、ga
は、そのゲインである。
【0085】ステツプ21A:[音声最適出力計算部1320A] ステツプ21Aで音声最適出力計算部1320Aでは、式(30)
に示す音声最適励振パルス列で音声の合成出力を計算し
(1サブフレームにつき40サンプルの値)、音声最適出
力記憶部1320Bに出力する。
【0086】ステツプ21B:[音声最適出力記憶部1320B] ステツプ21Bでは、ステツプ21Aで音声最適出力計算部13
20Aで計算した式(30)に示す励振パルス列での音声の
合成出力値を、次のサブフレームでの重みずけゼロ入力
合成部1322の初期値として用いるために記憶する(ステ
ツプ8参照)。
【0087】ステツプ21C:[音声符号化出力部1324] 上記のステツプ21B迄で各サブフレームごとのACEL
P音声符号化装置の動作説明は完了したが、上記ステツ
プ19で差最小化部1318の動作が完了すると、ステツプ21
Cにより、適応コードブツク1311A、適用コードゲイン13
11B、固定コードブツク1315A、固定コードゲイン1315
B、サブフレーム係数内挿部1307より、下記の値が音声
符号化出力部1324に送られ多重化され、送信機の変調部
に送られる。 (1)ライン・スペクトル・ペア(予測係数と等価なパラ
メータ) (2)ピツチの遅れ時間 (3)ピツチのゲイン (4)固定コードブツクのアドレス (5)固定コードブツクのゲイン
【0088】受信側ではこれらのデータを用いて、各サ
ブフレーム毎に適応コードパルス列と固定コードパルス
列を作り、既にACELP音声符号化装置で説明した方
法とほぼ同様な方法で合成音声を再現する。
【0089】
【発明が解決しようとする課題】以上に説明した雑音抑
圧装置においては、音声から除去される雑音は過去の雑
音であり、現在通話中の雑音ではないので、通話中に雑
音が増減した場合には対応できていないという問題点を
有していた。
【0090】また携帯電話には、音声符号化装置が使用
されており、かなり複雑な、信号処理を行っているが、
さらに雑音抑圧装置を追加することは、ハードウエア
が、一層、複雑化することとなり、消費電流の増加、信
号処理に伴う遅延時間の増加等の問題点を有していた。
【0091】本発明の目的は、このような問題点を解決
し、現在通話中の雑音レベルを検出し、それを除去す
る、またはその影響を軽減することを可能とするととも
に、音声符号化装置と雑音抑圧装置を一体化して、ハー
ドウエアを簡略化し、信号処理時間の増大を防止するこ
とに有る。
【0092】併せて、雑音抑圧装置に使用される雑音区
間/音声区間判定装置についても音声符号化装置の有す
る機能を活用して一体化することを図るものであり、同
一の趣旨で2000年3月23日に、同一出願人により出願さ
れた特願2000-082697号(適応型雑音抑圧音声符号化装
置)の内容を更に改良すると共に、同じく2000年7月18
日に、同一出願人により出願された特願2000-217717号
(雑音区間/音声区間判定装置)の内容を前記特願2000
-082697号(適応型雑音抑圧音声符号化装置)の内容と
結合して、更に種々の改善を施したものであり、入力信
号のレベルに依存せずに雑音区間/音声区間の判定がで
きる適応型雑音抑圧音声符号化装置を提供することを目
的とする。
【0093】
【課題を解決するための手段】上記問題を解決するため
に本発明は、音声信号の自己相関関数と、雑音の自己相
関関数が夫々有している特徴と、音声信号と雑音が重畳
している信号の自己相関関数の特徴を用いて信号処理を
行い、現在通話中のフレームに含まれている雑音のレベ
ルに適応して、雑音抑圧動作を行うと共に、この雑音を
含む音声信号の自己相関関数は、音声符号化装置で、音
声の符号化処理の過程で使用されるものなので、雑音抑
圧装置と音声符号化装置とを一体化するとともに、音声
符号化装置と同様の機能を有する雑音符号化手段を加え
ることにより、音声符号化装置に過大な雑音が加わって
も誤動作することのない、通話中の雑音に適応した適応
型雑音抑圧音声符号化装置を実現するものである。
【0094】
【発明の実施の形態】本発明の請求項1に記載の発明
は、周囲雑音の重畳された音声信号をデジタル信号に変
換し、それを一定長区間のデータとして取り出し、取り
出した信号の自己相関関数{R(j)}(分析次数をp次まで
とすると、j=0,1,2,-,-,p)を計算する前処理手段、取
出した区間が雑音のみの区間か、雑音の重畳している音
声信号の区間かを判定し、雑音区間と判定した場合は、
雑音のパラメータ(雑音の正規化自己相関関数{r
v(j)}、雑音の予測係数{av(j)}、雑音合成インパルス
応答{hv(j)}、及び[1+Σj=0 j=p av(j)rv(j)])を計算
し記憶する雑音区間/音声区間判定手段、周囲雑音の重
畳された音声信号から雑音を除去すると共に雑音最適出
力を計算し記憶する雑音符号化手段、雑音のゼロ次の自
己相関関数を計算して記憶し雑音を含まない音声信号の
みの自己相関関数{Rs(j)}を計算する雑音除去音声自己
相関関数計算手段、雑音を含まない音声信号を符号化
し、音声最適出力を記憶する雑音除去音声符号化手段に
より構成した音声符号化装置であり、通話中の周囲雑音
に適応して、周囲雑音を除去して音声信号を符号化する
という作用を有する。
【0095】また本発明の請求項2に記載の発明は、請
求項1記載の音声符号化装置において、前記雑音区間/
音声区間判定手段が、第1の区間を雑音区間と判定し、
引き続く第2の区間を音声区間と判定した場合は、前記
雑音区間/音声区間判定手段は、第1の区間において、
雑音のパラメータ({rv(j)}、{av(j)}、{hv(j)}、及
び[1+Σj=0 j=pav(j)rv(j)])を計算し記憶し、前記雑
音符号化手段は前記{hv(j)}と前記前処理手段からの雑
音を用いて雑音最適励振パルス列のゲイン定数gvを求
め、前記雑音除去音声自己相関関数計算手段は前記[1+
Σj=0 j=pav(j)rv(j)]と前記gvを用いて雑音のゼロ次の
自己相関関数Rv(0)を計算し記憶し、第2の区間の動作
において、前記Rv(0)と前記{rv(j)}を用いて雑音の自
己相関関数{Rv(j)}を計算し、前記{Rv(j)}を用いて、雑
音を含まない音声信号の自己相関関数{R s(j)}を計算し
前記雑音除去音声符号化手段に渡し、前記雑音除去音声
符号化手段は前記{Rs(j)}を用いて雑音を含まない音声
信号を符号化し、周囲雑音を除去して音声信号を符号化
するようにしたものであり、通話中の周囲雑音に適応し
て、周囲雑音を除去して音声信号を符号化するという作
用を有する。
【0096】また本発明の請求項3に記載の発明は、請
求項1記載の音声符号化装置において、前記雑音区間/
音声区間判定手段が、第1の区間を雑音区間と判定し、
引き続く第2、第3の区間を音声区間と判定した場合
は、前記雑音区間/音声区間判定手段は、第1の区間に
おいて雑音のパラメータ({rv(j)}、{av(j)}、{hv
(j)}、及び[1+Σj=0 j=pav(j)rv(j)])を計算し記憶
し、第2の区間においては、前記雑音符号化手段は前記
{hv(j)}と前記前処理手段からの雑音を含む音声信号を
用いて雑音最適励振パルス列のゲイン定数gvを求め、前
記雑音除去音声自己相関関数計算手段は前記[1+Σj=0
j=pav(j)rv(j)]と前記gvを用いて雑音のゼロ次の自己相
関関数Rv(0)を計算し記憶し、第3の区間においては前
記Rv(0)と前記{rv(j)}を用いて雑音の自己相関関数{R
v(j)}を計算し、前記{Rv(j)}を用いて、雑音を含まない
音声信号の自己相関関数{Rs(j)}を計算し前記雑音除去
音声符号化手段に渡し、前記雑音除去音声符号化手段で
は前記{Rs(j)}を用いて雑音を含まない音声信号を符号
化するようにしたものであり、通話中の周囲雑音に適応
して、周囲雑音を除去して音声信号を符号化するという
作用を有する。
【0097】また本発明の請求項4に記載の発明は、請
求項1記載の音声符号化装置において、前記雑音区間/
音声区間判定手段が、第1の区間を雑音区間と判定し、
引き続く第2の区間を音声区間と判定した場合は、第1
の区間において、前記雑音除去音声符号化手段に記憶さ
れている音声最適出力をゼロにリセツトし、第2の区間
において前記雑音除去音声符号化手段のゼロにリセツト
された音声最適出力値を用いて雑音除去音声符号化手段
の初期条件を設定するようにしたものであり、通話中の
周囲雑音に適応して、周囲雑音を除去して音声信号を符
号化するという作用を有する。
【0098】また本発明の請求項5に記載の発明は、請
求項1記載の音声符号化装置において、前記雑音区間/
音声区間判定手段が、第1の区間を雑音区間と判定し、
引き続く第2の区間を音声区間と判定した場合は、前記
雑音区間/音声区間判定手段は、第1の区間において、
雑音のパラメータ({rv(j)}、{av(j)}、{hv(j)}、及
び[1+Σj=0 j=pav(j)rv(j)])を計算し記憶し、前記雑
音符号化手段は前記{hv(j)}と前記前処理手段からの雑
音を用いて雑音最適励振パルス列を求め、前記雑音最適
励振パルス列を用いて雑音最適出力を計算し記憶し、第
2の区間の動作において、前記雑音最適出力を読み出し
雑音初期条件を設定し、前記前処理手段からの雑音を含
む音声信号から雑音を除去した音声信号を前記雑音除去
音声符号化手段に渡し、前記雑音除去音声符号化手段で
は前記雑音を含まない音声信号を符号化し、周囲雑音を
除去して音声信号を符号化するようにしたものであり、
通話中の周囲雑音に適応して、周囲雑音を除去して音声
信号を符号化するという作用を有する。
【0099】また本発明の請求項6に記載の発明は、請
求項1記載の音声符号化装置において、前記雑音区間/
音声区間判定手段が、第1の区間を雑音区間と判定し、
引き続く第2の区間を音声区間と判定した場合は、前記
雑音区間/音声区間判定手段は、第1の区間において、
雑音のパラメータ({rv(j)}、{av(j)}、{hv(j)}、及
び[1+Σj=0 j=pav(j)rv(j)])を計算し記憶し、前記雑
音除去音声自己相関関数計算手段は、前記前処理手段が
計算したR(0)をRv(0)として記憶し、第2の区間の動作
において、前記Rv(0)と前記{rv(j)}を用いて雑音の自
己相関関数{Rv(j)}を計算し、前記{Rv(j)}を用いて、雑
音を含まない音声信号の自己相関関数{R s(j)}を計算し
前記雑音除去音声符号化手段に渡し、前記雑音除去音声
符号化手段では前記{Rs(j)}を用いて雑音を含まない音
声信号を符号化し、周囲雑音を除去して音声信号を符号
化するようにしたものであり、通話中の周囲雑音に適応
して、周囲雑音を除去して音声信号を符号化するという
作用を有する。
【0100】また本発明の請求項7に記載の発明は、周
囲雑音の重畳された音声信号をデジタル信号に変換し、
それを一定長区間のデータとして取り出し、取り出した
信号の自己相関関数{R(j)}(分析次数をp次までとする
と、j=0,1,2,-,-,p)を計算する前処理手段、取出した
区間が雑音のみの区間か、雑音の重畳している音声信号
の区間かを判定し、雑音区間と判定した場合は、雑音の
パラメータ(雑音の正規化自己相関関数{rv(j)}、雑
音の予測係数{av(j)}、雑音合成インパルス応答{hv
(j)}、及び[1+Σj=0 j=p av(j)rv(j)])を計算し記憶す
る雑音区間/音声区間判定手段、周囲雑音の重畳された
音声信号から雑音を除去すると共に雑音最適出力を計算
し記憶する雑音符号化手段、雑音のゼロ次の自己相関関
数を計算し雑音を含まない音声信号のみの自己相関関数
{Rs(j)}を計算する雑音除去音声自己相関関数計算手
段、雑音を含まない音声信号を符号化し、音声最適出力
を記憶する雑音除去音声符号化手段により構成した音声
符号化装置であり、通話中の周囲雑音に適応して、周囲
雑音を除去して音声信号を符号化するという作用を有す
る。
【0101】また本発明の請求項8に記載の発明は、請
求項7記載の音声符号化装置において、前記雑音区間/
音声区間判定手段が、第1の区間を雑音区間と判定し、
引き続く第2の区間を音声区間と判定した場合は、前記
雑音区間/音声区間判定手段は、第1の区間において、
雑音のパラメータ({rv(j)}、{av(j)}、{hv(j)}、及
び[1+Σj=0 j=pav(j)rv(j)])を計算し記憶し、前記雑
音符号化手段は前記{hv(j)}と前記前処理手段からの雑
音を用いて雑音最適励振パルス列を求め、前記雑音最適
励振パルス列を用いて雑音最適出力を計算し記憶し、第
2の区間の動作において、前記雑音最適出力を読み出し
雑音初期条件を設定し、前記前処理手段からの雑音を含
む音声信号から雑音を除去した音声信号を前記雑音除去
音声符号化手段に渡し、前記雑音除去音声符号化手段で
は前記雑音を含まない音声信号を符号化し、周囲雑音を
除去して音声信号を符号化するようにしたものであり、
通話中の周囲雑音に適応して、周囲雑音を除去して音声
信号を符号化するという作用を有する。
【0102】また本発明の請求項9に記載の発明は、請
求項7記載の音声符号化装置において、前記雑音区間/
音声区間判定手段が、第1の区間を雑音区間と判定し、
引き続く第2の区間を音声区間と判定した場合は、前記
雑音区間/音声区間判定手段は、第1の区間において雑
音のパラメータ({rv(j)}、{av(j)}、{hv(j)}、及び
[1+Σj=0 j=pav(j)rv(j)])を計算し記憶し、第2の区
間においては、前記雑音符号化手段は前記{hv(j)}と前
記前処理手段からの雑音を含む音声信号を用いて雑音最
適励振パルス列のゲイン定数gvを計算し、前記雑音除去
音声自己相関関数計算手段は前記[1+Σj=0 j=pav(j)r
v(j)]と前記gvを用いて雑音のゼロ次の自己相関関数R
v(0)を計算し、前記Rv(0)と前記{rv(j)}を用いて雑音
の自己相関関数{Rv(j)}を計算し、前記{Rv(j)}を用い
て、雑音を含まない音声信号の自己相関関数{Rs(j)}を
計算し、前記雑音除去音声符号化手段に渡し、前記雑音
除去音声符号化手段では前記{Rs(j)}を用いて雑音を含
まない音声信号を符号化し、周囲雑音を除去して音声信
号を符号化するようにしたものであり、通話中の周囲雑
音に適応して、周囲雑音を除去して音声信号を符号化す
るという作用を有する。
【0103】また本発明の請求項10に記載の発明は、
請求項7記載の音声符号化装置において、前記雑音区間
/音声区間判定手段が、第1の区間を雑音区間と判定
し、引き続く第2の区間を音声区間と判定した場合は、
第1の区間において、前記雑音除去音声符号化手段に記
憶されている音声最適出力をゼロにリセツトし、第2の
区間において前記雑音除去音声符号化手段のゼロにリセ
ツトされた音声最適出力値を用いて雑音除去音声符号化
手段の初期条件を設定するようにしたものであり、通話
中の周囲雑音に適応して、周囲雑音を除去して音声信号
を符号化するという作用を有する。
【0104】以下、本発明の実施の形態について、図1
から図10を用いて説明する。
【0105】(第1の実施の形態)図1は第1の実施の
形態に係る適応型雑音抑圧音声符号化装置を説明するた
めの概略ブロツク図であり、図2はその詳細な機能ブロ
ツク図兼フローチャート図である。なお第1の実施の形
態に係る請求項としては、請求項1乃至請求項5が関係
する。
【0106】図1において適応型雑音抑圧音声符号化装
置は、前処理ブロツク219、雑音区間/音声区間判定ブ
ロツク220、雑音符号化ブロツク221、雑音除去音声自己
相関関数計算ブロツク224、雑音除去音声符号化ブロツ
ク222、および音声符号化出力ブロツク223から構成され
ている。図2は図1に示す適応型雑音抑圧音声符号化装
置の概略ブロツク図をさらにその動作を説明する為に詳
細化したものであり、前処理ブロツク219は前処理部130
1と、窓掛け部1302と、自己相関関数計算部1303とで構
成され、雑音区間/音声区間判定ブロツク220は、自己
相関関数正規化部301と、雑音区間/音声区間判定部302
と、雑音区間判定出力部303と、音声区間判定出力部304
と、雑音パラメータ計算部305とで構成され、雑音符号
化ブロツク221は、雑音初期条件設定部213と、ゼロ入力
合成部214と、差計算部215と、固定コードブツク207A
と、固定コードゲイン207Bと、インパルス応答部208
と、差計算部209と、差最小化部210と、雑音最適励振計
算部211と、雑音最適出力計算部212Aと、雑音最適出力
記憶部212Bとで構成され、雑音除去音声自己相関関数計
算ブロツク224は、Rv(0)計算部104Aと、Rv(0)記憶部104
Bと、Rv(j)計算部105と、音声自己相関関数計算部106と
で構成され、雑音除去音声符号化ブロツク222は、予測
係数算出部1304と、サブフレーム係数内挿部1307と、重
みずけ音声計算部1308と、重みずけインパルス応答計算
部1309Aと、音声初期条件設定部1321と、重みずけゼロ
入力合成部1322と、差計算部1323と、固定コードブツク
1315Aと、固定コードゲイン1315Bと、重みずけインパル
ス応答部1316と、差計算部1317と、差最小化部1318と、
音声最適励振計算部1319と、音声最適出力計算部1320A
と、音声最適出力記憶部1320Bとで構成され、音声符号
化出力ブロツク223は、コンホートノイズ発生部216と、
禁止ゲート部217と、音声符号化出力部1324と、論理和
部218とで構成される。
【0107】なお、前処理ブロツク219を構成する、前
処理部1301と、窓掛け部1302と、自己相関関数計算部13
03、並びに雑音除去音声符号化ブロツク222を構成す
る、予測係数算出部1304、サブフレーム係数内挿部130
7、重みずけ音声計算部1308、重みずけインパルス応答
計算部1309A、音声初期条件設定部1321、重みずけゼロ
入力合成部1322、差計算部1323、固定コードブツク1315
A、固定コードゲイン1315B、重みずけインパルス応答部
1316、差計算部1317、差最小化部1318、音声最適励振計
算部1319、音声最適出力計算部1320A、音声最適出力記
憶部1320B並びに、音声符号化出力ブロツク223を構成す
る音声符号化出力部1324は既に説明した図15に示すも
のと同一である。
【0108】以上のように構成された適応型雑音抑圧音
声符号化装置について、図1の概略ブロツク図ならびに
図2の機能ブロツク図兼フローチャート図を用いてその
動作を以下に説明する。図2において2重線で囲まれた
各部は、本発明を実現する上で重要な“部分”を表して
いる。
【0109】本発明の適応型雑音抑圧音声符号化装置の
動作の説明は、サブフレームごとに行うが、音声区間の
動作は1つ前のサブフレームが雑音区間か音声区間かで
異なる動作をするため、雑音を含む音声信号を取り込ん
だ区間を時系列的に、第1の区間、第2の区間および第
3の区間とし、第1の区間は雑音区間であり、第2の区
間は音声区間であり、第3の区間も音声区間であるとし
て、以下順番に動作を説明する。図5は各区間における
各ブロツクの動作の時間的な相互関係を示す図である。
【0110】<<図1の構成に基づく動作の概略説明>>図
2による各区間での各ブロツクの動作の説明に入る前
に、図1を用いて本発明の適応型雑音抑圧音声符号化装
置の動作の概略を説明する。それは請求項1の説明でも
ある。
【0111】図1において、前処理ブロツク219と、雑
音除去音声符号化ブロツク222は、既に図15を用いて
説明した先行例のACELP音声符号化装置の雑音処理と同
じものである。但し適応コードを用いた部分、すなわち
適応コードブツク1311A、適用コードゲイン1311Bならび
にそれに関連する制御の部分を除いてある。その理由は
本発明の説明上、ならびに請求項の上では関係ない部分
であり、説明を複雑にするからであって、これらを加え
たものも本発明の技術的範囲内である。
【0112】前処理ブロツク219の働きは、請求項1に
記載された“周囲雑音の重畳された音声信号をデジタル
信号に変換し、それを一定長区間のデータとして取り出
し、取り出した信号の自己相関関数{R(j)}(分析次数を
p次までとすると、j=0,1,2,-,-,p)を計算する前処理
手段”と記述されている動作と、その他に一定長区間の
データとして取り出した窓掛け前の信号を雑音符号化ブ
ロツク221に供給する働きをする。
【0113】雑音区間/音声区間判定ブロツク220は、
取込んだ区間が雑音のみか、雑音を含む音声の区間かを
判定する働きをする部分であるが、その方法は前処理ブ
ロツク219で信号の自己相関関数{R(j)}(分析次数をp次
までとすると、j=0,1,2,-,-,p)の計算を用いて行う。
その方法の詳細は、既に2000年7月18日に、同一出願人
により出願された特願2000-217717号(雑音区間/音声
区間判定装置)に記載済みであるが、それに加えて雑音
区間と判定した場合は、本発明の適応型雑音抑圧音声符
号化装置が雑音除去の動作を行う上で必要となる、雑音
のパラメータ(雑音の正規化自己相関関数{rv(j)}、
雑音の予測係数{av(j)}、雑音合成インパルス応答{hv
(j)}、及び[1+Σj=0 j=p av(j)rv(j)])を計算する働き
をする。
【0114】雑音符号化ブロツク221は、既に図15を
用いて説明した先行例のACELP音声符号化装置の雑音処
理と同様(但し説明を簡単にする為、適応コードを用い
た部分、すなわち適応コードブツク1311A、適用コード
ゲイン1311Bならびにそれに関連する制御の部分を除い
てあるが、これらを加えたものも本発明の技術的範囲内
である。)のものであり、ACELP音声符号化装置の有す
る入力信号と同等な合成信号を作り出す機能を用いて、
合成雑音を作り出す働きをする。その際に合成回路のイ
ンパルス応答としては雑音区間/音声区間判定ブロツク
220で計算した雑音合成インパルス応答{hv(j)}が使用さ
れる。
【0115】雑音除去音声自己相関関数計算ブロツク22
4は請求項1に記載される“雑音のゼロ次の自己相関関
数を計算し記憶し雑音を含まない音声信号のみの自己相
関関数{Rs(j)}を計算する”働きを有し、その値を雑音
除去音声符号化ブロツク222に引き渡す。
【0116】雑音除去音声符号化ブロツク222は雑音除
去音声自己相関関数計算ブロツク224が計算した雑音を
含まない音声信号のみの自己相関関数{Rs(j)}を用い
て、音声信号を符号化する。
【0117】以上の動作により、通話中の周囲雑音に適
応して、周囲雑音を除去して音声信号を符号化すること
が可能となる。
【0118】音声符号化出力ブロツク223については、
実際の適応型雑音抑圧音声符号化装置には存在するが、
先行技術の範囲内のものであり、本発明の請求項として
は不要の事柄であるが、その説明は後述する<<第1区間
の動作説明(雑音区間の場合)>>の<音声符号化出力ブ
ロツク223の動作:第1区間>で記載する。
【0119】なお、雑音符号化ブロツク221、ならびに
雑音除去音声符号化ブロツク222の動作は各区間毎(各
サブフレーム毎)に行われるが、その際重要なことは動
作の初期条件を設定することである。各区間の動作開始
の初期条件の設定は、1つ前の区間の雑音符号化ブロツ
ク221、または、雑音除去音声符号化ブロツク222におけ
る最適制御完了後の出力値を用いて行われる。
【0120】それを可能とする為に、雑音符号化ブロツ
ク221、または、雑音除去音声符号化ブロツク222では各
区間の動作で最適制御完了後にそれぞれ雑音最適出力値
または音声最適出力値を計算し記憶しておき、次の区間
においてそれを読み出し初期条件の設定を行う。
【0121】請求項1で、雑音符号化手段のところの
“雑音最適出力を計算し記憶する”と、雑音除去音声符
号化手段のところの“音声最適出力を記憶する”はそれ
ぞれ次の区間における初期条件の設定を可能とする為の
技術的事項である。
【0122】<<第1区間の動作説明(雑音区間の場合)
>>各ブロツクの動作説明の前に雑音区間での動作のもつ
意味を説明する。
【0123】請求項5には、“雑音符号化手段は前記{h
v(j)}と前記前処理手段からの雑音を用いて雑音最適励
振パルス列を求め、前記雑音最適励振パルス列を用いて
雑音最適出力を計算し記憶し、第2の区間の動作におい
て、前記雑音最適出力を読み出し雑音初期条件を設定
し”との記述があるが、第2区間で雑音を含む音声から
雑音のみを合成する雑音符号化手段の初期条件を設定可
能とする為である。
【0124】また請求項4には、“第1の区間におい
て、前記雑音除去音声符号化手段に記憶されている音声
最適出力をゼロにリセツトし第2の区間において前記雑
音除去音声符号化手段のゼロにリセツトされた音声最適
出力値を用いて雑音除去音声符号化手段の初期条件を設
定する”との記述があるが、説明していないが第1区間
の前にも区間が有りその区間は雑音区間と音声区間のい
ずれかであり、もし音声区間であるとするとその区間に
おいて、雑音除去音声符号化手段において、“音声最適
出力を記憶する”動作が行われている。この値を用いて
第2区間における雑音除去音声符号化手段の初期条件を
用いてはならない。なぜなら第1区間は雑音区間であ
り、音声はゼロであるからである。よつて第1区間が雑
音区間の場合、記憶されている音声最適出力をゼロにリ
セツトする必要がある。
【0125】また請求項2には、第1区間の動作とし
て、“雑音符号化手段は前記{hv(j)}と前記前処理手段
からの雑音を用いて雑音最適励振パルス列のゲイン定数
gvを計算し”との記述があるが、第2区間で雑音除去音
声符号化手段が“前記雑音除去音声符号化手段では前記
{Rs(j)}を用いて雑音を含まない音声信号を符号化し”
という動作を可能とする為に雑音除去音声自己相関関数
計算手段では、“前記[1+Σj=0 j=pav(j)rv(j)]と前記g
vを用いて雑音のゼロ次の自己相関関数Rv(0)を計算し記
憶し、第2の区間の動作において、前記Rv(0)と前記{r
v(j)}を用いて雑音の自己相関関数{Rv(j)}を計算し、
前記{Rv(j)}を用いて、雑音を含まない音声信号の自己
相関関数{Rs(j)}を計算し前記雑音除去音声符号化手段
に渡し”と記述されているように、第1区間の雑音符号
化手段の動作完了時点で求まるgvと雑音区間/音声区間
判定手段から渡された[1+Σj=0 j=pav(j)rv(j)]を用い
て第1区間のゼロ次の自己相関関数Rv(0)を計算し記憶
し、第2の区間が音声区間となった場合、前記Rv(0)と
雑音区間/音声区間判定手段から渡された{rv(j)}を用
いて雑音の自己相関関数{Rv(j)}を計算し、さらに雑音
の自己相関関数{Rv(j)}を用いて雑音を含まない音声信
号の自己相関関数{Rs(j)}を計算するためである。
【0126】第1区間すなわち雑音区間のRv(0)の計算
方法については、別の方法もあり、それについては後述
する本発明の第2の実施の形態で説明する。
【0127】このようにして第2区間の雑音除去音声符
号化手段が雑音を含まない音声信号の自己相関関数{R
s(j)= R(j)−Rv(j)}として使用する{Rv(j)}は第2区間
における{Rv(j)}ではなく1つ前の区間のものである。
その理由は第2区間の{Rv(j)}を用いる為には第2区間
における雑音符号化手段の動作が終わるまで、雑音除去
音声符号化手段の動作を待つ必要があるため上記の方法
としている。雑音符号化手段ならびに、雑音除去音声符
号化手段の動作が極めて短時間で行える場合には、第2
区間の{Rv(j)}を用いることが可能であり、これについ
ては、本発明の第3の実施の形態で説明する。
【0128】請求項2ないし請求項5についての内容で
上記の説明に無い事項については、以下の詳細動作の説
明で明らかになる。
【0129】<前処理ブロツク219の動作:第1区間>
周囲雑音の重畳された音声信号をデジタル信号に変換
し、それを一定長区間のデータとして取り出し、取り出
した信号の自己相関関数{R(j)}(分析次数をp次までと
すると、j=0,1,2,-,-,p)を計算する前処理手段、すな
わちステツプ1:[前処理部1301]、ステツプ2:[窓掛
け部1302]、ステツプ3:[自己相関関数計算部1303]の
動作は、動作状態によらず同一の動作をする。これらの
動作については、従来例図15で既に説明済みのステツ
プ1、2、3と同一の動作をし、マイクロホンからの、
周囲雑音を含む入力信号は、アナログ信号からデジタル
信号に変換され、窓関数を掛けて、第2サブフレームと
第4サブフレームの分析次数p次までの自己相関関数が
次式により計算される(p=10とする。)。 R(j)=(1/(240-j))≡n=j n=239s(n)・s(n-j) ; j=1,2,-,-,10 (2)
【0130】これらの値は雑音除去音声符号化ブロツク
222の音声自己相関関数計算部106と雑音区間/音声区間
判定ブロツク220の自己相関関数正規化部301に渡され
る。前処理ブロツク219は第1区間、第2区間、および
第3区間とも同じ動作をする。また以上の動作は各区間
においてで示すように最初の時点に行われる。
【0131】<雑音区間/音声区間判定ブロツク220の
動作:第1区間>雑音区間/音声区間判定ブロツク220
は、前処理ブロツク219からの雑音を含む音声信号の自
己相関関数を用いて、取り込んだ区間を、雑音区間また
は音声区間と判定する。その動作原理については既に20
00年7月18日に、同一出願人により出願された特願2000
-217717号(雑音区間/音声区間判定装置)に説明して
あるが、かなり複雑な内容の為、適応型雑音抑圧音声符
号化装置の動作を説明する上で必要な事項のみを、以下
に説明する。
【0132】ステツプ51では自己相関関数正規化部301
で、前処理ブロツク219より渡された、取り込んだ区間
の自己相関関数{R(j)}(分析次数をp次までとすると、
j=0,1,2,-,-,p)をR(0)で除して、正規化自己相関関数
{r(j)}(分析次数をp次までとすると、j=1,2,-,-,p)
を作る。
【0133】ステツプ52では雑音区間/音声区間判定部
302で、正規化自己相関関数{r(j)}を用いて取り込んだ
区間を雑音区間または音声区間に判定する。その詳細は
省略する。
【0134】ステツプ53による雑音区間判定出力部303
の出力は雑音除去音声符号化ブロツク222の音声最適出
力記憶部1320Bにリセツト信号として供給され、ステツ
プ54による音声区間判定出力部304の出力は音声符号化
出力ブロツク223にゲート信号として供給される。
【0135】ステツプ55の雑音パラメータ計算部305
は、適応型雑音抑圧音声符号化装置で使用される雑音抑
圧のために必要とされる雑音パラメータを下記の手順で
計算し適応型雑音抑圧音声符号化装置の各部に供給す
る。 {rv(j)}を用い、レビンソン・ダービン アルゴリズム
を用いて線形予測係数{a r(j)}を計算する。({r(j)}は
ステツプ52で雑音区間と判定されると{rv(j)}となる。r
vのvは雑音区間を表す。) {ar(j)}を用いて雑音合成関数インパルス応答{hv(n)}
を計算する。この値は雑音符号化ブロツク221に供給さ
れる。 { rv(j)r}と{av(j)}を用いて下式で定義される雑音電
力パラメータρを計算する。 ρ=[1+Σj=0 j=pav(j)rv(j)] (39) この値はRv(0)計算部104Aに渡される。
【0136】これらの雑音パラメータの働きについては
後に説明する。
【0137】以上の動作は図5に示す各区間において
で示すように前処理ブロツクの動作に引き続き行われ
る。
【0138】<雑音符号化ブロツク221の動作:第1区
間> ステツプ34B(その1):[雑音最適出力記憶部212B] 雑音最適出力記憶部212Bは、第1区間に先立つ区間が雑
音区間の場合であると、音声区間であるとには関係な
く、後述する、ステツプ34B(その2):[雑音最適出力
記憶部212B]で説明する動作により、既に雑音最適出力
のデータが記憶されているので、それを第1区間の動作
の最初に読み出し、雑音初期条件設定部213に送る。
【0139】ステツプ25:[雑音初期条件設定部213] 雑音初期条件設定部213はステツプ34Bで雑音最適出力記
憶部212Bから送られたデータを用いて、ステツプ26でゼ
ロ入力合成出力を計算するのに必要な初期条件を設定す
る。その詳細については既に図15で説明したステツプ
8の音声初期条件設定部1321の動作と同様であるので省
略する。
【0140】ステツプ26:[ゼロ入力合成部214] ゼロ入力合成部214は雑音区間/音声区間判定ブロツク2
20から引き渡された、雑音区間の雑音合成インパルス応
答{hv(n)}とステツプ25で設定された雑音初期条件設定
部213の初期状態qv(0)に対応する重みずけ合成雑音を計
算し、差計算部215に出力する。
【0141】ステツプ27:[差計算部215] 差計算部215は窓掛け前の音声信号(実際にはこの区間
は雑音区間と判定されているので雑音である。)とステ
ツプ26により計算されたゼロ入力合成出力との差を計算
し差計算部209に出力する。
【0142】ステツプ28:[固定コードブツク207A]、ス
テツプ29:[固定コードゲイン207B]既に図15のステツ
プ16Aで説明した固定コードブツク1315A、同じくステツ
プ16Bで説明した固定コードゲイン1315Bと同様の動作を
するので省略する。
【0143】ステツプ30:[インパルス応答部208] インパルス応答部208は雑音区間/音声区間判定ブロッ
ク220から引き渡された、雑音区間のインパルス応答{hv
(n)}と固定コードゲイン207Bの出力パルス列とを畳み込
み積分して現在の雑音区間の雑音に相当する合成信号を
出力し差計算部209に入力する。
【0144】ステツプ31:[差計算部209] 差計算部209は、差計算部215の出力とステツプ30で作ら
れた、現在の区間の雑音に相当する合成信号との差を計
算しその値を差最小化部210に出力する。
【0145】ステツプ32:[差最小化部210] 差最小化部210は差計算部209で計算された差の二乗平均
値を求め、その値を最小化するように固定コードブツク
207Aと固定コードゲイン207Bを制御する。
【0146】ステツプ33:[雑音最適励振計算部211] 雑音最適励振計算部211は差最小化部210の制御が完了し
たのを受けて、サブフレームの合成雑音の雑音最適励振
パルス列を下式により作成する。 uv(n)=gv Cv(n) ; n=0,1,2,-,-,-,39 (32) ここで、uv(n)は雑音最適励振パルス列であり、Cv(n)は
雑音に対応する固定コードブツクの雑音最適励振パルス
列であり、gvは、そのゲインである。
【0147】ステツプ34A:[雑音最適出力計算部212A] 雑音最適出力計算部212Aは、ステツプ33で計算された上
式(32)に示す雑音の雑音最適励振パルス列を用いて雑
音の合成出力を計算する。
【0148】ステツプ34B(その2):[雑音最適出力記
憶部212B] 雑音最適出力記憶部212Bはステツプ34Aで計算された、
1サブフレームにつき40サンプルの値を次のサブフレー
ムの動作に備えて記憶する。これらの値はステツプ25で
説明した、次のサブフレームで「合成部」での初期値と
して用いられる。
【0149】以上が<雑音符号化ブロツク221>の動作
である。以上の動作は図5に示す各区間においてで示
すように雑音/音声判定ブロツクの動作に引き続き行
われる。
【0150】<雑音除去音声自己相関関数計算ブロツク
224の動作:第1区間>図4は雑音符号化ブロツク221の
動作を説明する為に図2のその部分を抜き出したもので
あり、雑音除去音声自己相関関数計算ブロツク224の動
作を理解するのに役立つ。
【0151】以下の動作は、雑音符号化ブロツク221の
動作が図5に示すにより完了した時点で行われる。
【0152】ステツプ22A:[Rv(0)計算部104A] ステツプ22Aは、次の区間すなわちこの場合は、第2区
間のRv(0)すなわち雑音を含む音声区間の雑音のみのゼ
ロ次の自己相関関数として用いられる値を第1区間にお
いて計算する。(現在の区間が雑音区間の場合と、雑音
を含む音声区間の場合とで同一の方法のため第2区間の
動作もここで説明する。)Rv(0)を計算する方法を以下
に説明する。
【0153】雑音符号化ブロツク221の動作であるステ
ツプ33において雑音最適励振計算部211により雑音最適
励振パルス列が求められる。
【0154】現在の区間の雑音電圧をv(n)と表すものと
する。(区間が雑音区間の場合と、雑音を含む音声区間
の場合とがある。)また、差最小化部210におけるステ
ツプ32による最小化達成後の差計算部209の出力は下式
で表される。 ev(n)=Σj=1 j=10av(j) v(n-j) ; j=1,2,3,-,-,,10 (33) 但しav0=1とする。
【0155】上記式(33)の二乗平均値は下式となる。 J=(1/40)Σn=0 n=39v(n)・ ev(n) =(1/40)Σn=0 n=39j=1 j=10av(j) v(n-j)][ Σi=1 i=10avi v(n-i)] (34) j=1,2,3,-,-,,10 ; i=1,2,3,-,-,,10 ; av0=1とす
る。
【0156】Jをavlで偏微分しその値をゼロとすると下
式が得られる。 J=Rv(0)+Σj=1 j=10av(j)Rv(j) (35) 但し、雑音の自己相関関数Rv(j)は以下で定義される。 Rv(i−j) =(1/40)[Σn=0 n=39 v(n-j)・ v(n-i)] (36)
【0157】Jは式(31)の1サブフレーム間の二乗平
均値と等しくなるはずであるから、雑音の固定コードパ
ルス列であるCv(n)が1サブフレーム40サンプル期間で1
0ヶのパルスからなることを考慮すると下式が成立す
る。 40・[Rv(0)+Σj=1 j=10av(j)Rv(j)]=10・(gv)2 ;但し、(Cv(n))2=1) (37)
【0158】よつて、Rv(0)はステツプ33で求めたgv
用いて下式により求まる。 Rv(0) =(1/4)・( gv)2/[1+Σj=0 j=pav(j)rv(j)] (38)
【0159】ここで、簡略化のため、[1+Σj=0 j=pa
v(j)rv(j)]を下式で表す。 ρ=[1+Σj=0 j=pav(j)rv(j)] (39) ρは、雑音区間の正規化自己相関関数rv(j)と雑音区間
の線形予測係数av(j)から計算される値で、雑音区間/
音声区間判定ブロック220から引き渡されているのでR
v(0)が求まる。Rv(0)の値はRv(0)記憶部104Bに引き渡さ
れる。
【0160】ステツプ22B:[Rv(0)記憶部104B] Rv(0)記憶部104Bは、ステツプ22A、Rv(0)計算部104Aで
計算されたRv(0)の値を次の区間の動作に備えて記憶す
る。
【0161】ステツプ23:[Rv(j)計算部105]、ステツプ
24:[音声自己相関関数計算部106]第1区間すなわち雑
音区間の場合は動作しない。
【0162】<雑音除去音声符号化ブロツク222の動
作:第1区間>第1区間すなわち雑音区間においては、
雑音除去音声符号化ブロツク222の各部は動作を休止す
る。このことは雑音区間/音声区間判定ブロツク220の
ステツプ53の雑音区間判定出力部303からのゲート信号
により雑音除去音声符号化ブロツク222全体が休止する
と考えれば良い。常識的な事柄であり複雑さを避けるた
めに図2には記入していない。但し音声最適出力記憶部
1320Bに、後述する第2区間の動作説明でステツプ21Bの
動作と同様にして、第1区間(雑音区間)に先立ち存在
した音声区間により記憶された値があるので、この値を
ゼロにリセツトする。このことは図5にも示してある。
またこの動作は図5にとして示してあり、雑音区間/
音声区間判定ブロツク220の動作に続いて行われる。
【0163】<音声符号化出力ブロツク223の動作:第
1区間>音声符号化出力ブロツク223を構成するコンホ
ートノイズ発生部216と、禁止ゲート部217と、音声符号
化出力部1324と、論理和部218とについて、現在が雑音
区間の場合の動作をまず説明する。この部分の動作につ
いてはクレームの対象としないが、本発明の適応型雑音
抑圧音声符号化装置の動作を明確にするために以下に説
明する。図3は音声符号化出力ブロツク223の動作状態
−1の動作を説明するための図であり、図2に記載した
構成のうち動作状態−1で必要な部分のみ抜き出したも
のである。
【0164】音声符号化出力部1324は音声区間であると
の判定ゲート信号が来ないので出力はゼロとなる。一方
コンホートノイズ発生部216の出力は禁止ゲート部217を
通過して論理和部218に到り、音声符号化出力部1324の
出力がゼロなので、そのまま符号化出力として出力され
る。
【0165】すなわち雑音区間には雑音の符号化出力を
出力すると、受信機側の通話者に不快な感じを与えるの
で、回線がつながつていることを示す程度の通話者に不
快感を与えないノイズを出力するのがコンホートノイズ
発生部216の役割である。場合によつてはこのサブフレ
ームは送信を中止する方法もある。
【0166】次に、雑音区間ではなく音声区間と判定さ
れた場合は、図3に示す音声区間であることを示す信号
が来ているので、音声符号化出力部1324の出力には符号
化出力が現れる。一方コンホートノイズ発生部216は禁
止ゲート部217が動作しているので、その出力は論理和
部218には現れない。従って、音声の符号化出力のみが
論理和部218から出力される。
【0167】<<第2区間の動作説明(1つ前が雑音区間
で、現在が音声区間の場合)>> <前処理ブロツク219の動作:第2区間>第1区間の動
作説明で説明した内容と同一の為、省略する。
【0168】<雑音区間/音声区間判定ブロツク220の
動作:第2区間>雑音区間/音声区間判定ブロツク220
の動作は、第1区間の動作説明で説明した内容とほぼ同
様のため第1区間の動作と異なる個所のみ説明する。
【0169】ステツプ52で雑音区間/音声区間判定部30
2は、正規化自己相関関数{r(j)}を用いて取り込んだ区
間は音声区間と判定する。その詳細は省略する。
【0170】ステツプ54により音声区間判定出力部304
の出力は音声符号化出力ブロツク223へゲート信号とし
て供給される。その働きは第1区間の動作説明で<音声
符号化出力ブロツク223の動作>のところで行つたので
省略する。
【0171】ステツプ55で雑音パラメータ計算部305
は、現在が音声区間と判定されているので雑音区間と判
定された最も近い区間、すなわち第1区間で計算された
雑音パラメータが雑音抑圧のために必要とされる雑音パ
ラメータとして、{rv(j)}、 hv(n)、ρ=[1+Σj=0 j=pa
v(j)rv(j)]が適応型雑音抑圧音声符号化装置の各ブロツ
クに供給される。これらの雑音パラメータの働きについ
ては、既に第1区間の動作のところで説明済みである
が、第2区間での動作についてはそれぞれのブロツクで
説明する。
【0172】<雑音符号化ブロツク221の動作:第2区
間> ステツプ34B(その1):[雑音最適出力記憶部212B] 第2区間の最初の時点において、雑音最適出力記憶部21
2Bは、第1区間の動作により、既に雑音最適出力のデー
タが記憶されているので、それを読み出して雑音初期条
件設定部213に送る。
【0173】ステツプ25:[雑音初期条件設定部213]、
ステツプ26:[ゼロ入力合成部214] 第1区間での動作と同じであるため、説明を省略する。
【0174】ステツプ27:[差計算部215] 差計算部215は窓掛け前の雑音を含む音声信号と、ステ
ツプ26により計算されたゼロ入力合成出力との差を計算
し差計算部209に出力する。
【0175】ステツプ28:[固定コードブツク207A]、ス
テツプ29:[固定コードゲイン207B] これらの動作については、第1区間の動作と同一のため
省略する。
【0176】ステツプ30:[インパルス応答部208] インパルス応答部208は雑音区間/音声区間判定ブロツ
ク220から引き渡された、雑音区間のインパルス応答hv
(n)と固定コードゲイン207Bの出力パルス列とを畳み込
み積分して現在の雑音を含む音声区間に含まれている雑
音に相当する合成信号を出力し差計算部209に入力す
る。
【0177】ステツプ31:[差計算部209] 差計算部209は、差計算部215の出力とステツプ30で作ら
れた、現在の雑音を含む音声区間に含まれている雑音に
相当する合成信号との差を計算しその値を差最小化部21
0に出力する。
【0178】ステツプ32:[差最小化部210]、ステツプ3
3:[雑音最適励振計算部211]、ステツプ34A:[雑音最適
出力計算部212A]、ステツプ34B(その2):[雑音最適
出力記憶部212B] これらの動作については、第1区間の動作と同一のため
省略する。
【0179】以上が第2区間における、<雑音符号化ブ
ロツク221>の動作である。
【0180】<雑音除去音声自己相関関数計算ブロツク
224の動作:第2区間>図4は雑音符号化ブロツク221の
動作を説明する為に図2のその部分を抜き出したもので
あり、雑音除去音声自己相関関数計算ブロツク224の動
作を理解するのに役立つ。
【0181】ステツプ22A:[Rv(0)計算部104A]、ステツ
プ22B:[Rv(0)記憶部104B] これらの動作については、第1区間の動作と同一のため
省略する。
【0182】ステツプ23:[Rv(j)計算部105] 上記のステツプ22A:[Rv(0)計算部104A]、ステツプ22
B:[Rv(0)記憶部104B]の動作は図5においてと示すよ
うに、時間的に第2区間の後半、すなわち雑音符号化ブ
ロツク221の動作がほぼ完了した時点に行われるのに対
して、第2区間におけるステツプ23のRv(j)計算部105の
動作は、図5においてと示すように、第2区間の前
半、すなわち第2区間で雑音区間/音声区間判定ブロツ
ク220からステツプ54により音声区間であるとの判定出
力がRv(0)記憶部104Bに入力された時点で行われ、第1
区間のステツプ22Bの動作で、Rv(0)記憶部104Bに記憶さ
れたRv(0)の値は読み出されてRv(j)計算部105に出力さ
れる。
【0183】また同時に雑音区間/音声区間判定ブロツ
ク220から雑音のパラメータとして、{rv(j)}がRv(j)計
算部105には引き渡され、Rv(j)計算部105では下式によ
り、R v(j)を計算し、音声自己相関関数計算部106に渡
す。 Rv(j)= Rv(0)・rv(j) ; j=1,2,-,-,p (40)
【0184】ステツプ24:[音声自己相関関数計算部10
6] 音声自己相関関数計算部106には、前処理ブロック219の
ステツプ3における自己相関関数計算部1303から雑音を
含む音声信号の自己相関関数R(0),R(1),R(2),-,-,R(p)
が入力され、Rv(j)計算部105からは、ステツプ23により
雑音の自己相関関数Rv(0),Rv(1),Rv(2),-,-,Rv(p)が入
力されているので、音声のみの自己相関関数を下式によ
り求め、雑音除去音声符号化ブロツク222の予測係数算
出部1304へ出力する。 Rs(j)= R(j)− Rv(j) ; j=1,2,-,-,-,p (41)
【0185】<雑音除去音声符号化ブロツク222の動
作:第2区間>雑音除去音声符号化ブロツク222の第2
区間における動作は図5にと示すように雑音符号化ブ
ロツク221とほぼ同時点で動作する。このことは、雑音
除去音声自己相関関数計算ブロツク224が雑音を除去し
た自己相関関数Rs(j)を計算するのに用いた雑音の自己
相関関数計算したRv(j)は第2区間のものではなく1つ
前の区間すなわち第1区間のものであることを意味して
いる。
【0186】このようにした理由は雑音符号化ブロツク
221ならびに雑音除去音声符号化ブロツク222が動作を完
了するには、ある程度の時間を必要とすると考えられる
からである。
【0187】雑音符号化ブロツク221ならびに雑音除去
音声符号化ブロツク222の動作が迅速に行なわれ短時間
で動作が完了する場合には雑音符号化ブロツク221の動
作が完了してから雑音除去音声符号化ブロツク222が動
作を開始するように構成することが可能である。このよ
うに構成すると、雑音を除去した自己相関関数Rs(j)を
計算するのに用いる雑音の自己相関関数Rv(j)は第1区
間のものではなく第2区間のものとすることができる。
これについては第3の実施の形態で説明する。
【0188】ステツプ8:[音声初期条件設定部1321] 従来例図15で説明したが、「合成部」の初期状態q(0)
は1つ前のサブフレームの出力である。1つ前のサブフ
レーム40サンプル点の出力値が初期状態q(0)として使用
される。しかしながら、1つ前の区間は雑音区間であ
り、音声最適出力記憶部1320Bの値すなわち、q(0)はゼ
ロにリセツトされている。すなわち音声初期条件設定部
1321は、初期状態q(0)としてゼロ状態を、雑音除去音声
符号化ブロツク222の重みずけゼロ入力合成部1322に出
力する。
【0189】ステツプ4:[予測係数算出部1304] 雑音除去音声自己相関関数計算ブロツク224のステツプ2
4で得られた雑音を含まない音声信号のみの自己相関関
数を用いて、予測係数算出部1304は従来例図15のステ
ツプ4と同一の方法で、最適な予測係数a1,a2,−,
−,ap求める。
【0190】ステツプ5:[サブフレーム係数内挿部130
7] 従来例図15のステツプ5と同一の動作をする。サブフ
レーム係数内挿部1307は、ステツプ4で計算された、第
2サブフレームと第4サブフレームの予測係数の値を用
いて、第1と第3サブフレームの値を内挿により求め
る。但しこの事柄は発明の構成としては重要なことでは
なく各サブフレーム毎に予測係数を求める方法で良いの
である。この点については本発明の実施の形態の説明で
は、“取込んだ区間”と言う表現を使用し、第1区間、
第2区間、第3区間と言う時間系列において、各区間毎
に予測係数を求める方法として説明をしているが、その
理由は複雑な記述による無用な混乱を避けるためであ
る。
【0191】ステツプ6:[重みずけ音声計算部1308] 雑音符号化ブロツク221の差計算部209の出力すなわち前
処理ブロツク219からの雑音を含む音声信号から雑音の
除去された音声信号に対して従来例図15のステツプ6
と同一の方法で、重みずけ音声を計算する。
【0192】ステツプ7A:[重みずけインパルス応答計
算部1309A] 従来例図15のステツプ7Aと同一の動作をする。
【0193】ステツプ9:[重みずけゼロ入力合成部132
2] 重みずけゼロ入力合成部1322は重みずけインパルス応答
計算部1309Aで求めたh(n)とステツプ8で音声初期
条件設定部1321により設定された初期条件(ゼロ状態)
を用いて「合成部」の初期状態q(0)に対応する重みずけ
合成音声信号を計算し、差計算部1323に入力する。
【0194】ステツプ10:[差計算部1323]、ステツプ16
A:[固定コードブツク1315A]、ステツプ16B:[固定コー
ドゲイン1315B]、ステツプ17:[重みずけインパルス応
答部1316]、ステツプ18:[差計算部1317]、ステツプ1
9:[差最小化部1318] これらの動作は、従来例図15で説明したものと同じで
あるので省略する。
【0195】ステツプ20:[音声最適励振計算部1319] 音声最適励振計算部1319は今までに説明した事柄により
作られた固定コードブツクならびに固定コードゲインの
最適値により、サブフレーム毎の合成音声の音声最適励
振パルス列を下式により作成する。 u(n)= ga C(n) ; n=0,1,2,-,-,-,39 (31) ここで、u(n)は音声最適励振パルス列であり、C(n)は固
定コードブツクの励振パルス列であり、gaは、そのゲイ
ンである。
【0196】従来例図15で説明した、ステツプ20にお
ける音声最適励振計算部1319の動作との差は、上式(3
1)には、適応コードブツクv(n)ならびに適応コードゲ
インの最適値gpが存在しない点のみである。
【0197】ステツプ21A:[音声最適出力計算部1320
A]、ステツプ21B:[音声最適出力記憶部1320B] これらの動作は従来例図15で説明した動作と、適応コ
ードブツクv(n)ならびに適応コードゲインの最適値gp
相当する部分が存在しない点を除けば同一である。以上
で第2区間における、<雑音除去音声符号化ブロツク22
2>の動作説明を終わる。
【0198】<音声符号化出力ブロツク223の動作:第
2区間>音声符号化出力ブロツク223の動作は既に第1
区間の動作の説明の際に第2区間の動作についても説明
したので省略する。
【0199】<<第3区間の動作説明(1つ前が音声区間
で、現在が音声区間の場合)>> <前処理ブロツク219の動作:第3区間>前処理ブロツ
ク219の動作は、第1区間の動作説明で説明した内容と
同一のため省略する。
【0200】<雑音区間/音声区間判定ブロツク220の
動作:第3区間>雑音区間/音声区間判定ブロツク220
の動作は、第2区間の動作説明で説明した内容と同様の
ため省略する。
【0201】<雑音符号化ブロツク221の動作:第3区
間> ステツプ34B(その1):[雑音最適出力記憶部212B] 雑音最適出力記憶部212Bは、第2区間の動作により、既
に雑音最適出力のデータが記憶されているので、それを
読み出して雑音初期条件設定部213に送る。雑音符号化
ブロツク221の第3区間におけるその他のステツプの動
作は第2区間の動作と同一のため省略する。
【0202】<雑音除去音声自己相関関数計算ブロツク
224の動作:第3区間> ステツプ22A:[Rv(0)計算部104A]、ステツプ22B:[R
v(0)記憶部104B]、ステツプ23:[Rv(j)計算部105]、ス
テツプ24:[音声自己相関関数計算部106] これらの動作については、第2区間の動作と同一のため
省略する。
【0203】<雑音除去音声符号化ブロツク222の動
作:第3区間> ステツプ8:[音声初期条件設定部1321] 従来例図15で説明したが、「合成部」の初期状態q(0)
は1つ前のサブフレームの出力である。1つ前のサブフ
レーム40サンプル点の出力値が初期状態q(0)として使用
される。しかしながら、1つ前の区間は音声区間であ
り、第2区間における音声最適出力記憶部1320Bの値がq
(0)である。音声初期条件設定部1321はq(0)を、雑音除
去音声符号化ブロツク222の重みずけゼロ入力合成部132
2に出力する。
【0204】雑音除去音声符号化ブロツク222の第3区
間におけるその他のステツプの動作は第2区間の動作と
同一のため省略する。
【0205】<音声符号化出力ブロツク223の動作:第
3区間>音声符号化出力ブロツク223の動作は既に第1
区間の動作の説明の際に説明した第2区間の動作と同じ
であり省略する。
【0206】以上のように本発明の第1の実施の形態に
よれば、周囲雑音の重畳された音声信号をデジタル信号
に変換し、それを一定長区間のデータとして取り出し、
取り出した信号の自己相関関数{R(j)}(分析次数をp次
までとすると、j=0,1,2,-,-,p)を計算する前処理手
段、取出した区間が雑音のみの区間か、雑音の重畳して
いる音声信号の区間かを判定し、雑音区間と判定した場
合は、雑音のパラメータ(雑音の正規化自己相関関数
{rv(j)}、雑音の予測係数{av(j)}、雑音合成インパル
ス応答{hv(j)}、及び[1+Σj=0 j=p av(j)rv(j)])を計
算し記憶する雑音区間/音声区間判定手段、周囲雑音の
重畳された音声信号から雑音を除去すると共に雑音最適
出力を計算し記憶する雑音符号化手段、雑音のゼロ次の
自己相関関数を計算し記憶し雑音を含まない音声信号の
みの自己相関関数{Rs(j)}を計算する雑音除去音声自己
相関関数計算手段、および雑音を含まない音声信号を符
号化し、音声最適出力を記憶する雑音除去音声符号化手
段により構成し、通話中の周囲雑音に適応して、周囲雑
音を除去して音声信号を符号化することができる。
【0207】(第2の実施の形態)図1は第2の実施の
形態に係る適応型雑音抑圧音声符号化装置を説明するた
めの概略ブロツク図であり、また図6はより詳細な機能
ブロツク図兼フローチャート図である。なお第2の実施
の形態に係る請求項としては請求項6が関係する。また
図1は第1の実施の形態で用いたものと同一であり説明
を省略する。
【0208】図6と第1の実施の形態で説明した適応型
雑音抑圧音声符号化装置のより詳細の機能ブロツク図兼
フローチャートである図2との違いは、図6において雑
音除去音声自己相関関数計算ブロツク224にR(0)記憶部2
25が追加されていること並びにそれに伴いR(0)記憶部22
5への前処理ブロツク219からの入力線、R(0)記憶部225
からRv(0)記憶部104Bへの出力線、並びに雑音区間/音
声区間判定ブロツク220からの雑音区間判定信号がR(0)
記憶部225へ読み出し信号として加えられ、Rv(0)計算部
104Aへは禁止ゲート信号として加えられている点であ
る。
【0209】以上のように構成された第2の実施の形態
に係る適応型雑音抑圧音声符号化装置について、図6に
示す機能ブロツク図兼フローチャート図を用いてその動
作を以下に説明する。
【0210】第1の実施の形態の説明では<<第1区間の
動作説明(雑音区間の場合)>>のところで説明した様
に、第1区間の動作として、雑音符号化ブロツク221で
は{hv(j)}と前処理ブロツク219からの雑音を用いて雑音
最適励振パルス列のゲイン定数g vを求め、雑音除去音声
自己相関関数計算ブロツク224では、ゲイン定数gvと雑
音区間/音声区間判定ブロツク220が計算した[1+Σj=0
j=pav(j)rv(j)]を用いて雑音のゼロ次の自己相関関数Rv
(0)を計算し記憶した。この方法は雑音区間、音声区間
の区別なしに同じ方法を取れるという点では長所があ
り、特に音声区間におけるRv(0)を求める方法として優
れたものである。
【0211】しかし雑音区間のRv(0)を求める方法とし
ては以下に述べる方法がより直接的である。すなわち、
前処理ブロツク219で{R(j)}が計算されているので、そ
のR(0)をR(0)記憶部225に一時記憶しておき、雑音区間
/音声区間判定ブロツク220から雑音区間判定出力が供
給された時点で、R(0)記憶部225に記憶されたR(0)をR
v(0)として、Rv(0)記憶部104Bに記憶すれば良いことに
なる。以上の説明をより明確にする為、図6の上記動作
に関係のある部分を抜き取り、説明を加えたのものが図
7である。図7の説明は上述した説明で自明のため省略
する。
【0212】以上のように本発明の第2の実施の形態に
よれば、雑音区間/音声区間判定手段が、第1の区間を
雑音区間と判定し引き続く第2の区間を音声区間と判定
した場合は、前記雑音区間/音声区間判定手段は、第1
の区間において、雑音のパラメータ({rv(j)}、{a
v(j)}、{hv(j)}、及び[1+Σj=0 j=pav(j)rv(j)])を計
算し記憶し、前記雑音除去音声自己相関関数計算手段
は、前記前処理手段が計算したR(0)をRv(0)として記憶
し、第2の区間の動作において、前記Rv(0)と前記{r
v(j)}を用いて雑音の自己相関関数{Rv(j)}を計算し、
前記{Rv(j)}を用いて、雑音を含まない音声信号の自己
相関関数{Rs(j)}を計算し前記雑音除去音声符号化手段
に渡し、前記雑音除去音声符号化手段では前記{Rs(j)}
を用いて雑音を含まない音声信号を符号化し、周囲雑音
を除去して音声信号を符号化することができる。
【0213】(第3の実施の形態)図1は第3の実施の
形態に係る適応型雑音抑圧音声符号化装置を説明するた
めの概略ブロツク図であり、また図8はより詳細な機能
ブロツク図兼フローチャート図である。なお第3の実施
の形態に係る請求項としては、請求項7乃至請求項10
が関係する。また図1は第1の実施の形態で用いたもの
と同一であり説明を省略する。
【0214】図8は本発明の第3の実施の形態に係る適
応型雑音抑圧音声符号化装置のより詳細な機能ブロツク
図兼フローチャート図であり、概略ブロツク図について
は第1の実施の形態で説明した図1と同じであり説明を
省略する。
【0215】図8と第1の実施の形態で説明した適応型
雑音抑圧音声符号化装置のより詳細の機能ブロツク図兼
フローチャート図2との違いは、図8においては、図2
に存在したRv(0)記憶部104Bが削除されている点であ
る。
【0216】以上のように構成された第3の実施の形態
に係る適応型雑音抑圧音声符号化装置について、図8に
示す機能ブロツク図兼フローチャート図を用いてその動
作を以下に説明する。
【0217】第1の実施の形態の説明において各ブロツ
クの動作の時間関係を図4を用いて説明したが、第3の
実施の形態における各ブロツクの動作の時間関係を図1
0に示す。第3の実施の形態に関係して、第1の実施の
形態の<雑音除去音声符号化ブロツク222の動作:第2
区間>で以下のように説明した。
【0218】“雑音除去音声符号化ブロツク222の第2
区間における動作は図5にと示すように雑音符号化ブ
ロツク221とほぼ同時点で動作する。このことは、雑音
除去音声自己相関関数計算ブロツク224が雑音を除去し
た自己相関関数Rs(j)を計算するのに用いた雑音の自己
相関関数を計算したRv(j)は第2区間のものではなく1
つ前の区間すなわち第1区間のものであることを意味し
ている。このようにした理由は雑音符号化ブロツク221
ならびに雑音除去音声符号化ブロツク222が動作を完了
するには、ある程度の時間を必要とすると考えられるか
らである。雑音符号化ブロツク221ならびに雑音除去音
声符号化ブロツク222の動作が迅速に行なわれ短時間で
動作が完了する場合には雑音符号化ブロツク221の動作
が完了してから雑音除去音声符号化ブロツク222が動作
を開始するように構成することが可能である。このよう
に構成すると、雑音を除去した自己相関関数Rs(j)を計
算するのに用いる雑音の自己相関関数Rv(j)は第1区間
のものではなく第2区間のものとすることができる。こ
れについては第3の実施の形態で説明する。”
【0219】すなわち第3の実施の形態では、雑音符号
化ブロツク221と、雑音除去音声符号化ブロツク222の動
作速度が迅速であり、雑音符号化ブロツク221が最適化
動作を完了後計算した雑音最適励振パルス列のゲイン定
数gvを用いて雑音除去音声自己相関関数計算ブロツク22
4のステツプ22AでRv(0)を計算しそれを用いてRv(j)を計
算し更に雑音を除去した自己相関関数Rs(j)を計算する
ように構成することが可能となる。このようにすること
によりに、雑音の自己相関関数Rv(j)は1つ前の区間の
ものではなく、現在の区間のものになるので、雑音除去
音声符号化ブロツク222ではより正確に雑音を取り除い
た符号化が可能となる。
【0220】第1の実施の形態に係る各ブロツクの動作
の時間関係を示す図4と第3の実施の形態に係る各ブロ
ツクの動作の時間関係を示す図10を比較すると、第1
区間の動作で図4のが図10には存在しない。
【0221】すなわち第3の実施の形態ではRv(0)は実
際に音声が存在する第2区間において行われるのでその
必要が無いのである。
【0222】また第2区間について比較すると、雑音除
去音声自己相関関数計算ブロツク224の動作が図4では
前半のと後半のとに別れているが、図10では雑音
符号化ブロツク221が完了してからの1つの動作とな
つている。その理由は既に説明したので省略する。
【0223】図9は図8から第3の実施の形態を説明す
る上に必要な部分を抜き出し、説明を加えたものであ
る。この図の説明も上述の説明で自明であり省略する。
【0224】請求項7と請求項1を比較すると、その差
は雑音除去音声自己相関関数計算手段における記述が、
請求項7では、“雑音のゼロ次の自己相関関数を計算
し、雑音を含まない音声信号のみの自己相関関数{Rs
(j)}を計算する雑音除去音声自己相関関数計算手段”と
したが、請求項1では、“雑音のゼロ次の自己相関関数
を計算し記憶し雑音を含まない音声信号のみの自己相関
関数{Rs(j)}を計算する雑音除去音声自己相関関数計算
手段”とした点でだけである。
【0225】請求項8は、第1の実施の形態における請
求項5に対応し、請求項9は第1の実施の形態における
請求項2に対応し、請求項10は第1の実施の形態にお
ける請求項4に対応する。但し請求項9は上述の説明で
明らかな様に請求項2とはかなり相違している。
【0226】以上のように本発明の第3の実施の形態に
よれば、周囲雑音の重畳された音声信号をデジタル信号
に変換し、それを一定長区間のデータとして取り出し、
取り出した信号の自己相関関数{R(j)}(分析次数をp次
までとすると、j=0,1,2,-,-,p)を計算する前処理手
段、取出した区間が雑音のみの区間か、雑音の重畳して
いる音声信号の区間かを判定し、雑音区間と判定した場
合は、雑音のパラメータ(雑音の正規化自己相関関数
{rv(j)}、雑音の予測係数{av(j)}、雑音合成インパル
ス応答{hv(j)}、及び[1+Σj=0 j=p av(j)rv(j)])を計
算し記憶する雑音区間/音声区間判定手段、周囲雑音の
重畳された音声信号から雑音を除去すると共に雑音最適
出力を計算し記憶する雑音符号化手段、雑音のゼロ次の
自己相関関数を計算し雑音を含まない音声信号のみの自
己相関関数{Rs(j)}を計算する雑音除去音声自己相関関
数計算手段、および雑音を含まない音声信号を符号化
し、音声最適出力を記憶する雑音除去音声符号化手段に
より構成し、通話中の周囲雑音に適応して、周囲雑音を
除去して音声信号を符号化することができる。
【0227】
【発明の効果】以上のように本発明は、周囲雑音の重畳
された音声信号をデジタル信号に変換し、それを一定長
区間のデータとして取り出し、取り出した信号の自己相
関関数{R(j)}(分析次数をp次までとすると、j=0,1,2,
-,-,p)を計算する前処理手段、取出した区間が雑音の
みの区間か、雑音の重畳している音声信号の区間かを判
定し、雑音区間と判定した場合は、雑音のパラメータ
(雑音の正規化自己相関関数{rv(j)}、雑音の予測係
数{av(j)}、雑音合成インパルス応答{hv(j)}、及び[1+
Σj=0 j=p av(j)rv(j)])を計算し記憶する雑音区間/音
声区間判定手段、周囲雑音の重畳された音声信号から雑
音を除去すると共に雑音最適出力を計算し記憶する雑音
符号化手段、雑音のゼロ次の自己相関関数を計算し記憶
し雑音を含まない音声信号のみの自己相関関数{Rs(j)}
を計算する雑音除去音声自己相関関数計算手段、および
雑音を含まない音声信号を符号化し、音声最適出力を記
憶する雑音除去音声符号化手段により構成し、通話中の
周囲雑音に適応して、周囲雑音を除去して音声信号を符
号化することができるという効果を有する。
【図面の簡単な説明】
【図1】本発明の第1、第2、第3の実施の形態に係る
適応型雑音抑圧音声符号化装置の概略構成を示すブロツ
ク図、
【図2】本発明の第1の実施の形態に係る適応型雑音抑
圧音声符号化装置の詳細構成を示すブロツク図兼フロー
チャート図、
【図3】図2の音声符号化出力ブロツクの動作を説明す
るブロツク図、
【図4】図2の雑音除去音声自己相関関数計算ブロツク
の動作を説明するブロツク図、
【図5】本発明の第1の実施の形態に係る適応型雑音抑
圧音声符号化装置の各ブロツクの動作タイミング説明
図、
【図6】本発明の第2の実施の形態に係る適応型雑音抑
圧音声符号化装置の詳細構成を示すブロツク図兼フロー
チャート図、
【図7】図6の雑音除去音声自己相関関数計算ブロツク
の動作を説明するブロツク図、
【図8】本発明の第3の実施の形態に係る適応型雑音抑
圧音声符号化装置の詳細構成を示すブロツク図兼フロー
チャート図、
【図9】図8の雑音除去音声自己相関関数計算ブロツク
の動作を説明するブロツク図、
【図10】本発明の第3の実施の形態に係る適応型雑音
抑圧音声符号化装置の各ブロツクの動作タイミング説明
図、
【図11】従来における第1の雑音抑圧装置の構成を示
すブロツク図、
【図12】従来における第1の雑音抑圧装置の動作を説
明するフローチャート図、
【図13】従来の第2の雑音抑圧装置の構成を示すブロ
ツク図、
【図14】従来の第2の雑音抑圧装置の動作を説明する
フローチャート図、
【図15】従来のACELP音声符号化装置の詳細機能を示
すブロツク図、
【図16】従来例における音声信号の窓掛け取り込み
図、
【図17】従来例における音声信号のピツチデータ取り
込み図、
【図18】従来のACELP音声符号化装置におけるコード
ブツク構成表である。
【符号の説明】
101A 音声/雑音区間判定部 103 自己相関関数記憶部 104A Rv(0)計算部 104B Rv(0)記憶部 105 Rv(j)計算部 106 音声自己相関関数計算部 207A 固定コードブツク 207B 固定コードゲイン 208 インパルス応答部 209 差計算部 210 差最小化部 211 励振計算部 212A 雑音最適出力計算部 212B 雑音最適出力記憶部 213 雑音初期条件設定部 214 ゼロ入力合成部 215 差最小化部 216 コンホート・ノイズ発生部 217 禁止ゲート部 218 論理和部 219 前処理ブロツク 220 雑音区間/音声区間判定ブロツク 221 雑音符号化ブロツク 222 雑音除去音声符号化ブロツク 223 音声符号化出力ブロツク 224 雑音除去音声自己相関関数計算ブロツク 225 R(0)記憶部 901 切り出し部 902 フーリエ分析部 903 雑音スペクトル平均算出部 904 雑音スペクトルメモリ 905 雑音/信号判定部 906 振幅引算部 907 半波整流部 908 逆フーリエ変換部 909 波形再生部 1001 ステツプ窓掛け 1002 ステツプFFT分析 1003 ステツプ音声区間検知 1004 ステツプ雑音記憶 1005 ステツプ平均スペクトル計算 1006 ステツプ雑音引算部 1007 ステツプ負係数ゼロ化 1008 ステツプIFFT 1009 ステツプ波形合成 1101 各チャンネルS/N測定部 1102 各チャンネル利得制御部 1103 各チャンネル別可変利得増幅器 1104 ステツプ各チャンネルS/N測定 1105 ステツプ各チャンネル利得制御 1106 ステツプ各チャンネル別可変利得増幅 1301 前処理部 1302 窓掛け部 1303 自己相関関数計算部 1304 予測係数算出部 1305 係数変換部 1306 係数量子化部 1307 サブフレーム係数内挿部 1308 重みずけ音声計算部 1309A 重みずけインパルス応答計算部 1309B 予測差計算部 1310 開ループピツチ遅れ時間計算部 1311A 適応コードブツク 1311B 適用コードゲイン 1312 重みずけインパルス応答部 1313 差計算部 1314 差最小化部 1315A 固定コードブツク 1315B 固定コードゲイン 1316 重みずけインパルス応答部 1317 差計算部 1318 差最小化部 1319 励振計算部 1320A 音声最適出力計算部 1320B 音声最適出力記憶部 1321 音声初期条件設定部 1322 重みずけインパルス応答部 1323 差計算部

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 周囲雑音の重畳された音声信号をデジタ
    ル信号に変換し、それを一定長区間のデータとして取り
    出し、取り出した信号の自己相関関数{R(j)}(分析次数
    をp次までとすると、j=0,1,2,-,-,p)を計算する前処
    理手段、取出した区間が雑音のみの区間か、雑音の重畳
    している音声信号の区間かを判定し、雑音区間と判定し
    た場合は、雑音のパラメータ(雑音の正規化自己相関関
    数{rv(j)}、雑音の予測係数{av(j)}、雑音合成インパ
    ルス応答{hv(j)}、及び[1+Σj =0 j=p av(j)rv(j)])を
    計算し記憶する雑音区間/音声区間判定手段、周囲雑音
    の重畳された音声信号から雑音を除去すると共に雑音最
    適出力を計算し記憶する雑音符号化手段、雑音のゼロ次
    の自己相関関数を計算して記憶し雑音を含まない音声信
    号のみの自己相関関数{Rs(j)}を計算する雑音除去音声
    自己相関関数計算手段、および雑音を含まない音声信号
    を符号化し、音声最適出力を記憶する雑音除去音声符号
    化手段により構成され、通話中の周囲雑音に適応して、
    周囲雑音を除去して音声信号を符号化する適応型雑音抑
    圧音声符号化装置。
  2. 【請求項2】 前記雑音区間/音声区間判定手段が、第
    1の区間を雑音区間と判定し、引き続く第2の区間を音
    声区間と判定した場合は、前記雑音区間/音声区間判定
    手段は、第1の区間において、雑音のパラメータ({rv
    (j)}、{av(j)}、{hv(j)}、及び[1+Σj=0 j=pav(j)r
    v(j)])を計算し記憶し、前記雑音符号化手段は前記{hv
    (j)}と前記前処理手段からの雑音を用いて雑音最適励振
    パルス列のゲイン定数gvを求め、前記雑音除去音声自己
    相関関数計算手段は前記[1+Σj= 0 j=pav(j)rv(j)]と前
    記gvを用いて雑音のゼロ次の自己相関関数Rv(0)を計算
    し記憶し、第2の区間の動作において、前記Rv(0)と前
    記{rv(j)}を用いて雑音の自己相関関数{Rv(j)}を計算
    し、前記{Rv(j)}を用いて、雑音を含まない音声信号の
    自己相関関数{Rs(j)}を計算し前記雑音除去音声符号化
    手段に渡し、前記雑音除去音声符号化手段は前記{R
    s(j)}を用いて雑音を含まない音声信号を符号化し、周
    囲雑音を除去して音声信号を符号化するようにした請求
    項1記載の適応型雑音抑圧音声符号化装置。
  3. 【請求項3】 前記雑音区間/音声区間判定手段が、第
    1の区間を雑音区間と判定し、引き続く第2、第3の区
    間を音声区間と判定した場合は、前記雑音区間/音声区
    間判定手段は、第1の区間において雑音のパラメータ
    ({rv(j)}、{av(j)}、{hv(j)}、及び[1+Σj=0 j=pa
    v(j)rv(j)])を計算し記憶し、第2の区間においては、
    前記雑音符号化手段は前記{hv(j)}と前記前処理手段か
    らの雑音を含む音声信号を用いて雑音最適励振パルス列
    のゲイン定数gvを求め、前記雑音除去音声自己相関関数
    計算手段は前記[1+Σj=0 j=pav(j)rv(j)]と前記gvを用
    いて雑音のゼロ次の自己相関関数Rv(0)を計算し記憶
    し、第3の区間においては前記R v(0)と前記{rv(j)}を
    用いて雑音の自己相関関数{Rv(j)}を計算し、前記{R
    v(j)}を用いて、雑音を含まない音声信号の自己相関関
    数{Rs(j)}を計算し、前記雑音除去音声符号化手段に渡
    し、前記雑音除去音声符号化手段では前記{Rs(j)}を用
    いて雑音を含まない音声信号を符号化し、周囲雑音を除
    去して音声信号を符号化するようにした請求項1記載の
    適応型雑音抑圧音声符号化装置。
  4. 【請求項4】 前記雑音区間/音声区間判定手段が、第
    1の区間を雑音区間と判定し、引き続く第2の区間を音
    声区間と判定した場合は、第1の区間において、前記雑
    音除去音声符号化手段に記憶されている音声最適出力を
    ゼロにリセツトし、第2の区間において前記雑音除去音
    声符号化手段のゼロにリセツトされた音声最適出力値を
    用いて雑音除去音声符号化手段の初期条件を設定するよ
    うにした請求項1記載の適応型雑音抑圧音声符号化装
    置。
  5. 【請求項5】 前記雑音区間/音声区間判定手段が、第
    1の区間を雑音区間と判定し、引き続く第2の区間を音
    声区間と判定した場合は、前記雑音区間/音声区間判定
    手段は、第1の区間において、雑音のパラメータ({rv
    (j)}、{av(j)}、{hv(j)}、及び[1+Σj=0 j=pav(j)r
    v(j)])を計算し記憶し、前記雑音符号化手段は前記{hv
    (j)}と前記前処理手段からの雑音を用いて雑音最適励振
    パルス列を求め、前記雑音最適励振パルス列を用いて雑
    音最適出力を計算し記憶し、第2の区間の動作におい
    て、前記雑音最適出力を読み出し雑音初期条件を設定
    し、前記前処理手段からの雑音を含む音声信号から雑音
    を除去した音声信号を前記雑音除去音声符号化手段に渡
    し、前記雑音除去音声符号化手段では前記雑音を含まな
    い音声信号を符号化し、周囲雑音を除去して音声信号を
    符号化するようにした請求項1記載の適応型雑音抑圧音
    声符号化装置。
  6. 【請求項6】 前記雑音区間/音声区間判定手段が、第1
    の区間を雑音区間と判定し、引き続く第2の区間を音声
    区間と判定した場合は、前記雑音区間/音声区間判定手
    段は、第1の区間において、雑音のパラメータ({r
    v(j)}、{av(j)}、{hv(j)}、及び[1+Σj=0 j=pav(j)r
    v(j)])を計算し記憶し、前記雑音除去音声自己相関関
    数計算手段は、前記前処理手段が計算したR(0)をRv(0)
    として記憶し、第2の区間の動作において、前記Rv(0)
    と前記{rv(j)}を用いて雑音の自己相関関数{Rv(j)}を
    計算し、前記{Rv(j)}を用いて、雑音を含まない音声信
    号の自己相関関数{Rs(j)}を計算し前記雑音除去音声符
    号化手段に渡し、前記雑音除去音声符号化手段では前記
    {Rs(j)}を用いて雑音を含まない音声信号を符号化し、
    周囲雑音を除去して音声信号を符号化するようにした請
    求項1記載の適応型雑音抑圧音声符号化装置。
  7. 【請求項7】 周囲雑音の重畳された音声信号をデジタ
    ル信号に変換し、それを一定長区間のデータとして取り
    出し、取り出した信号の自己相関関数{R(j)}(分析次数
    をp次までとすると、j=0,1,2,-,-,p)を計算する前処
    理手段、取出した区間が雑音のみの区間か、雑音の重畳
    している音声信号の区間かを判定し、雑音区間と判定し
    た場合は、雑音のパラメータ(雑音の正規化自己相関関
    数{rv(j)}、雑音の予測係数{av(j)}、雑音合成インパ
    ルス応答{hv(j)}、及び[1+Σj =0 j=p av(j)rv(j)])を
    計算し記憶する雑音区間/音声区間判定手段、周囲雑音
    の重畳された音声信号から雑音を除去すると共に雑音最
    適出力を計算し記憶する雑音符号化手段、および雑音の
    ゼロ次の自己相関関数を計算し雑音を含まない音声信号
    のみの自己相関関数{Rs(j)}を計算する雑音除去音声自
    己相関関数計算手段、雑音を含まない音声信号を符号化
    し、音声最適出力を記憶する雑音除去音声符号化手段に
    より構成され、通話中の周囲雑音に適応して、周囲雑音
    を除去して音声信号を符号化する適応型雑音抑圧音声符
    号化装置。
  8. 【請求項8】 前記雑音区間/音声区間判定手段が、第
    1の区間を雑音区間と判定し、引き続く第2の区間を音
    声区間と判定した場合は、前記雑音区間/音声区間判定
    手段は、第1の区間において、雑音のパラメータ({rv
    (j)}、{av(j)}、{hv(j)}、及び[1+Σj=0 j=pav(j)r
    v(j)])を計算し記憶し、前記雑音符号化手段は前記{hv
    (j)}と前記前処理手段からの雑音を用いて雑音最適励振
    パルス列を求め、前記雑音最適励振パルス列を用いて雑
    音最適出力を計算し記憶し、第2の区間の動作におい
    て、前記雑音最適出力を読み出し雑音初期条件を設定
    し、前記前処理手段からの雑音を含む音声信号から雑音
    を除去した音声信号を前記雑音除去音声符号化手段に渡
    し、前記雑音除去音声符号化手段では前記雑音を含まな
    い音声信号を符号化し、周囲雑音を除去して音声信号を
    符号化するようにした請求項7記載の適応型雑音抑圧音
    声符号化装置。
  9. 【請求項9】 前記雑音区間/音声区間判定手段が、第
    1の区間を雑音区間と判定し、引き続く第2の区間を音
    声区間と判定した場合は、前記雑音区間/音声区間判定
    手段は、第1の区間において雑音のパラメータ({r
    v(j)}、{av(j)}、{hv(j)}、及び[1+Σj=0 j=pav(j)r
    v(j)])を計算し記憶し、第2の区間においては、前記
    雑音符号化手段は前記{hv(j)}と前記前処理手段からの
    雑音を含む音声信号を用いて雑音最適励振パルス列のゲ
    イン定数gvを計算し、前記雑音除去音声自己相関関数計
    算手段は前記[1+Σj=0 j=pav(j)rv(j)]と前記gvを用い
    て雑音のゼロ次の自己相関関数Rv(0)を計算し、前記R
    v(0)と前記{rv(j)}を用いて雑音の自己相関関数{R
    v(j)}を計算し、前記{Rv(j)}を用いて、雑音を含まない
    音声信号の自己相関関数{Rs(j)}を計算し、前記雑音除
    去音声符号化手段に渡し、前記雑音除去音声符号化手段
    では前記{Rs(j)}を用いて雑音を含まない音声信号を符
    号化し、周囲雑音を除去して音声信号を符号化するよう
    にした請求項7記載の適応型雑音抑圧音声符号化装置。
  10. 【請求項10】 前記雑音区間/音声区間判定手段が、
    第1の区間を雑音区間と判定し、引き続く第2の区間を
    音声区間と判定した場合は、第1の区間において、前記
    雑音除去音声符号化手段に記憶されている音声最適出力
    をゼロにリセツトし、第2の区間において前記雑音除去
    音声符号化手段のゼロにリセツトされた音声最適出力値
    を用いて雑音除去音声符号化手段の初期条件を設定する
    ようにした請求項7記載の適応型雑音抑圧音声符号化装
    置。
JP2000375319A 2000-12-08 2000-12-08 適応型雑音抑圧音声符号化装置 Pending JP2002175100A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000375319A JP2002175100A (ja) 2000-12-08 2000-12-08 適応型雑音抑圧音声符号化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000375319A JP2002175100A (ja) 2000-12-08 2000-12-08 適応型雑音抑圧音声符号化装置

Publications (1)

Publication Number Publication Date
JP2002175100A true JP2002175100A (ja) 2002-06-21

Family

ID=18844345

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000375319A Pending JP2002175100A (ja) 2000-12-08 2000-12-08 適応型雑音抑圧音声符号化装置

Country Status (1)

Country Link
JP (1) JP2002175100A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2034710A2 (en) 2007-06-11 2009-03-11 Fujitsu Ltd. Multipoint communication apparatus with sound level adjustment unit
JP2018528480A (ja) * 2015-09-25 2018-09-27 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 線形予測符号化を使用して低減された背景ノイズを有するオーディオ信号を符号化する符号器および方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2034710A2 (en) 2007-06-11 2009-03-11 Fujitsu Ltd. Multipoint communication apparatus with sound level adjustment unit
US8218777B2 (en) 2007-06-11 2012-07-10 Fujitsu Limited Multipoint communication apparatus
JP2018528480A (ja) * 2015-09-25 2018-09-27 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 線形予測符号化を使用して低減された背景ノイズを有するオーディオ信号を符号化する符号器および方法
US10692510B2 (en) 2015-09-25 2020-06-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoder and method for encoding an audio signal with reduced background noise using linear predictive coding

Similar Documents

Publication Publication Date Title
JP4512574B2 (ja) 音声活動に基づくゲイン制限による音声強化についての方法、記録媒体、及び装置
KR102158743B1 (ko) 자연어 음성인식의 성능향상을 위한 데이터 증강장치 및 방법
AU656787B2 (en) Auditory model for parametrization of speech
JP2006085176A (ja) 帯域制限オーディオ信号の帯域拡大
JPH10124088A (ja) 音声帯域幅拡張装置及び方法
EP1386313B1 (en) Speech enhancement device
KR20080027709A (ko) 음 신호 보정 방법, 음 신호 보정 장치 및 기록 매체
JP4180677B2 (ja) 音声符号化並びに復号化方法及びその装置
KR20070007851A (ko) 계층 부호화 장치 및 계층 부호화 방법
Kornagel Techniques for artificial bandwidth extension of telephone speech
JP2017532595A (ja) デジタルオーディオ信号におけるプレエコーの識別及び減衰
JP5840087B2 (ja) 音声信号復元装置および音声信号復元方法
KR0155315B1 (ko) Lsp를 이용한 celp보코더의 피치 검색방법
JPH07199997A (ja) 音声信号の処理システムにおける音声信号の処理方法およびその処理における処理時間の短縮方法
JP2002175100A (ja) 適応型雑音抑圧音声符号化装置
JPH08305396A (ja) 音声帯域拡大装置および音声帯域拡大方法
JPH06274196A (ja) 雑音除去方法および雑音除去装置
JP2739811B2 (ja) 雑音抑圧方式
JP4325044B2 (ja) 音声認識システム
JP2010026323A (ja) 話速検出装置
CN111226278B (zh) 低复杂度的浊音语音检测和基音估计
KR20180010115A (ko) 스피치를 향상하는 장치
JP2899533B2 (ja) 音質改善装置
JPH1138998A (ja) 雑音抑圧装置および雑音抑圧処理プログラムを記録した記録媒体
JPH1138999A (ja) 雑音抑圧装置および雑音抑圧処理プログラムを記録した記録媒体