JP2508007B2 - 音声波形符号復号化装置 - Google Patents

音声波形符号復号化装置

Info

Publication number
JP2508007B2
JP2508007B2 JP61180366A JP18036686A JP2508007B2 JP 2508007 B2 JP2508007 B2 JP 2508007B2 JP 61180366 A JP61180366 A JP 61180366A JP 18036686 A JP18036686 A JP 18036686A JP 2508007 B2 JP2508007 B2 JP 2508007B2
Authority
JP
Japan
Prior art keywords
noise
spectrum
speech
decoder
noise shaping
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP61180366A
Other languages
English (en)
Other versions
JPS6334600A (ja
Inventor
哲 田口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP61180366A priority Critical patent/JP2508007B2/ja
Publication of JPS6334600A publication Critical patent/JPS6334600A/ja
Application granted granted Critical
Publication of JP2508007B2 publication Critical patent/JP2508007B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は音声波形符号復号化装置に関し、特に互に対
向局側の騒音レベルに対応した量子化雑音整形の適応制
御を行なう音声波形符号復号化装置に関する。
〔従来の技術〕
音声符号復号化装置にあっては、量子化雑音を制御す
るのには、いわゆるノイズシェーピング(Noise Shapin
g)が多用されている。
このノイズシェーピングとは、量子化ノイズを音声ス
ペクトルに対応した、もしくは関係をもたせた形状に変
形し聴覚的マスキング効果を狙うものである。第8図は
ノイズシェーピングの原理図である。音声スペクトルに
重畳して量子化雑音スペクトルが存在すると、この量子
化雑音レベルが音声レベルよりも優勢なP,Q近傍では、
音声が量子化雑音に聴覚的にマスク(mask)されてしま
う聴覚マスキング現象が起る。ノイズシェーピングは、
このような現象に対し量子化ノイズスペクトルを音声ス
ペクトルに対応もしくは関係をもたせ、たとえば点線で
示すスペクトルに変形し上述したマスキング効果の減殺
を図るものである。このノイズシェーピングでは、量子
化雑音と共存する音声スペクトルもその変形に対応して
やや変形することとなるが、全体として聴覚的S/Nの改
善が行なわれることが可能となる。
〔発明が解決しようとする問題点〕
上述した従来のノイズシェーピングは、音声符号復号
化装置の送話側が低騒音環境に配置されているときは本
来の有効性を提供するが、高騒音環境に配置された場合
には、むしろノイズシェーピングをかけない方が知覚的
S/Nが高いことが多いという欠点がある。
これは、高騒音環境では、量子化ノイズの最大レベル
よりも騒音として音声に混入するノイズのレベルが高く
なる場合があるので、量子化ノイズが騒音として音声に
混入するノイズによりマスクされてしまい、ノイズシェ
ーピングの効果が大幅に抑圧され、逆に音声スペクトル
の望まざる変形の影響のみが顕在化することにもとづ
く。
本発明の目的は上述した欠点を除去し、互いに対向局
側の騒音レベルに対応したノイズシェーピングを図るこ
とにより、高騒音環境でも有効な量子化雑音整形の制御
が可能な音声波形符号復号化装置を提供することにあ
る。
〔問題点を解決するための手段〕
本発明の装置は、自局と対向局との間で音声波形の符
号複合化を行ない音声を送受信する音声符号化復号化装
置において、対向局側を介して計測される自局の環境騒
音レベルに対応して自局の量子化雑音整形を制御する手
段を備えて構成される。
〔実施例〕
次に図面を参照して本発明を詳細に説明する。
第1図は本発明の一実施例を示すブロック図であり、
相互に送受信する一対の符号復号化装置A,Bより成る。
これら符号復号化装置A,Bはそれぞれ、入力音声を分
析し符号化して送出する分析部1、および対向する装置
から送出された符号化音声信号を復号化して合成する合
成部2を備えて構成される。
分析部1は、スペクトル変形器11,LPC(Linear Predi
ction Coding,線形予測分析)分析器12,逆フィルタ13,
残差波形符号化器14,K量子化/復号化器15,K/α変換器1
6,減衰係数印加器17等を備えて構成される。
また、合成部2は、残差波形復号化器21,K復号化器2
2,スペクトル逆変形器23,K/α変換器24,雑音レベル推定
器25およびROM26等を備えて構成される。
これら符号復号化装置A,Bは伝送路3を介して送受信
を行なう。
さて、はじめに本発明の基本的概念について説明す
る。第2図は本発明の概念図である。
自局30は、入力音声を受けるとこれにスペクトル変形器
301によってノイズシェーピングのためのスペクトル変
形を加える。
第3図はノイズシェーピングにおけるスペクトル変形
を説明するためのスペクトル変形説明図である。
入力音声を分析しその分析結果がH(Z)の伝達関数
を有するフィルタのインパルス応答として与えられたと
する。ノイズシェーピングによって変形すべきスペクト
ルは、H(Z)の特性から算出される極のQ(選択度)
を運用条件に応じて減衰せしめたH′(Z)のスペクト
ルを有するものとなる。
第4図はノイズシェーピングの基本的処理を説明する
ための処理ブロック図である。入力音声はH′(Z)/H
(Z)変換101でH′(Z)/H(Z)なる伝達関数をも
つフィルタを通されそのスペクトルはH′(Z)に変換
される。この前処理で利用されるフィルタが聴感重み付
けフィルタと呼ばれるものである。
次に、H′(Z)/H(Z)による変形出力は符号化さ
れて対向局に送出され、対向局ではこれを復号化する符
号化/復号化102が行なわれる。この処理は第2図の符
号化器302,復号化器311で行なわれる。こうして符号化
/復号化の行なわれた後の音声スペクトルは特性H′
(Z)であり、ノイズスペクトルは白色である。さらに
H(Z)/H′(Z)変換を第2図のスペクトル逆変換器
312で行なうとふたたびH(Z)の特性をもつ出力音声
が得られ、一方ノイズスペクトルはH(Z)/H′(Z)
の特性の相対値を有し、H(Z)の特性をもつ出力音声
に対応した形状として有色化され、かくしてノイズシェ
ーピングが完了する。第2図に示す対向局31から自局30
に対して行なわれるスペクトル変換器313からスペクト
ル逆変換器304に至る処理フローも全く同じである。
上述した説明内容のうち、H(Z)およびH′(Z)
はそれぞれ次の(1)および(2)式で示される。
(1),(2)式において、α はLPC係数のαパラ
メータ,PはLPC分析次数,γは減衰係数で0γ1の
値をとり、γ=0のときH′(Z)=1でありH(Z)
と同一形状のノイズスペクトルとなり、またγ=1のと
きはH′(Z)=H(Z)の白色となる。さらに0<γ
<1のときは有色化されたノイズスペクトルとなる。つ
まりγが1から0に近づくに従ってノイズシェーピング
が強く作用する。
しかしながら、従来のこのようなノイズシェーピング
のもとでの双方向通信においては、自局ならびに対向局
の配置環境の環境騒音の影響は全く配慮されておらず、
このため前述した問題点が発生する。そこで本発明で
は、次のようにしてこの問題に対応している。
第2図において、復号化器311の出力にはH′(Z)
の特性をもつ音声スペクトルと白色のスペクトルの量子
化雑音に、さらに加えて優勢な環境騒音成分が出力され
る状態も考慮し、復号化器311の出力として得られるこ
れら雑音のレベルに対応してスペクトル変形器313にお
けるスペクトル変形の程度を変えるように適応制御する
ものである。つまり、環境騒音レベルに対応して前述し
たγの値を設定し、ノイズシェーピングが有効な低騒音
環境ではγの値を0.8とか0.9といった通常の運用値に設
定し、またノイズシェーピングがかえって逆効果を示す
高騒音環境ではγの値をより1に近づけ悪影響を排除す
る等の使い分けで量子化雑音の制御を行なう。このよう
な制御を制御3011で示す。制御3111についても全く同様
である。
このような量子化雑音整形の制御は、具体的には次の
ような手段によって実施することができる。
第5(a)図は本発明のノイズシェーピングの基本的
処理内容を説明するためのブロック図、第5(b)図は
第5(a)図の符号化器および復号化器を詳細に示すブ
ロック図、第5(c)図は第5(a)図と第5(b)図
の内容を組合せて示すブロック図である。以下にこれら
の図面にもとづいて本発明におけるノイズシェーピング
の基本的処理を説明する。
第5(a)図において、入力音声は自局側のH′
(Z)/H(Z)変換器401とH(Z)・H′(Z)推定
器402に入力される。
H(Z)・H′(Z)推定器402は入力音声のLPC分析
によってH(Z)を推定したうえ、さらに対向局側の入
力音声に含まれる環境騒音のレベルにもとづいて設定さ
れた減衰係数γを利用し、γH(Z)としてのH′
(Z)を推定し、これらをフィルタ係数としてH′
(Z)/H(Z)変換器401に提供する。H′(Z)/H
(Z)変換器401はH′(Z)/H(Z)を係数とするデ
ィジタルフィルタとして構成される変換器でありH
(Z)の特性をもつ入力音声を受けてこれをH′(Z)
の特性に変換したのちこれを符号化器403に供給する。
H(Z)・H′(Z)推定器402はまた、H(Z).
H′(Z)に関するデータを伝送路3を介して対向局側
に送出する。
符号化器403は、入力するH′(Z)を利用してH′
(Z)の逆フィルタH′-1(Z)を形成し、これにより
残差波形を抽出、これを所定の形式で符号化して対向局
側に送出する。符号化器403は第5(b)図に示す如
く、このような目的に利用されるH′(Z)逆フィルタ
4031および残差波形符号化器4032を有して構成される。
対向局側では復号化器404によって残差波形を復号化
したのち、H′(Z)の特性をもつ合成フィルタに通し
て音声合成を行ない、そのあとH(Z)/H′(Z)のフ
ィルタ係数を有するH(Z)/H′(Z)変換器405を通
すことによりふたたびH(Z)の特性を有するスペクト
ルに逆変換する。第5(b)図の残差波形復号化器4041
およびH′(Z)合成フィルタ4042を有する復号化器40
4、およびH(Z)/H′(Z)変換器405はこのような処
理を行ない、環境騒音のレベルに対応して0γ1の
範囲で選ばれるγの値にもとづいてノイズシェーピング
を受けた出力音声を発生する。この場合、環境騒音があ
らかじめ設定するレベル以上となれば、γ=1に設定さ
れ従ってノイズシェーピングは実施されない。
第5(a)図に第5(b)図の内容を加味したものが
第5(c)図であり、H′(Z)合成フィルタ4042とH
(Z)/H′(Z)変換器405とのカスケード接続は等価
的にH(Z)フィルタ406で表現することができ、これ
と残差波形復号化器4041とを組合せた簡素な構成で対向
局側を形成することができる。
ふたたび第1図に戻って実施例の説明を続行する。自
局の符号復号化装置Aの入力音声は、分析部1のスペク
トル変形器11とLPC分析器12とに供給される。
LPC分析器12は、入力音声を所定の高域遮断周波数3.4
KHzのLPF(Low Pass Filter)に通したあと、A/Dコンバ
ータで所定のサンプリング周波数8KHzで標本化し、さら
に12ビットの量子化ステップで量子化音声信号に変換し
つつ所定の分析フレーム周期20mSECごとに公知の手法で
所定の次数のLPC係数を抽出する。本実施例ではLPC係数
として10次のK(偏自己相関係数)パラメータを抽出し
ている。
LPC分析器12の出力するKパラメータは、K量子化/
復号化器15に供給され、一旦量子化されたのち復号化し
てK/α変換器16に供給される。
K/α変換器16は、入力したKパラメータをαパラメー
タに変換しこれをスペクトル変形器11と減衰係数印加器
17に供給する。K/α変換器16から出力されるαパラメー
タは、入力音声のスペクトル包絡を表現するH(Z)を
提供するものであり、また減衰係数印加器17はK/α変換
器16の出力するαパラメータに対し対向局の符号復号化
装置Bの配置された環境の環境騒音レベルに対応した減
衰係数γを乗算し、その結果にもとづいてH′(Z)を
得て、これをスペクトル変形器11と逆フィルタ13に供給
する。この場合、減衰係数印加器17で利用する減衰係数
γは、後述する如き処理により合成部2のROM26から供
給される。
スペクトル変形器11は、こうしてH(Z)とH′
(Z)に関するデータを受けてH′(Z)/H(Z)の特
性を有するフィルタを構成しこれを入力音声で駆動しそ
のスペクトルをH′(Z)に変形する。
逆フィルタ13は、H′(Z)に関するデータを受けて
H(Z)とは周波数応答特性が逆特性のH′-1(Z)の
特性の逆フィルタを形成し、スペクトル変形ずみの入力
音声の残差波形を抽出し、これを残差波形符号化器14に
供給する。
残差波形符号化器14は、残差波形を所定の形式で符号
化し、これを入力音声の音源情報として伝送路3経由、
対局側に送出する。
分析部1からはまた、K量子化/復号器15から量子化
データが所定の形式で符号化され、これを入力音声のス
ペクトル包絡情報を示すデータとして伝送路3に送出,
対局側に提供される。
一方、対向局の符号復号化装置Bも、入力音声が符号
復号化装置Aと同じ分析部1によって残差波形とKパラ
メータとが分析,抽出され、残差波形に関するデータは
自局側の残差波形復号化器21に、また、Kパラメータは
K復号化器22にそれぞれ供給されて復号化される。
自局側の残差波形復号化器21の復号化出力はスペクト
ル逆変形器23に供給される。
スペクトル逆変形器23は、H1(Z)の特性を有する合
成フィルタとして構成され、これを残差波形復号化器21
の出力する残差波形で駆動することにより出力音声とし
て入力音声の合成波形が得られる。また、このスペクト
ル逆変形器23でH1(Z)の特性をもつフィルタ形成に必
要なフィルタ係数はK復号化器22の出力を受けたK/α変
換器24が、Kパラメータをαパラメータに変換したうえ
これをスペクトル逆変換器23に提供する形式で得られ
る。
スペクトル逆変形器23の出力する出力音声には、符号
復号化装置Aが配置されている環境の騒音を含んでい
る。
雑音レベル推定器25は、環境騒音のレベルを推定する
ものでありその詳細は次のとおりである。
第6図は第1図の実施例の雑音レベル推定器25の部分
を詳細に示すブロック図である。
自局側で復号化して得たスペクトル逆変換器23の出力
する出力音声は短時間電力算出器251に供給され、分析
周期20mSECごとに遅れ時間零における自己相関係数を利
用する等の手段でその短時間平均電力を算出する。ただ
しこの算出に当っては、入力音声にしばしばあらわれる
ポーズ区間を利用する形式で行なわれる。入力音声に介
在するポーズ区間は1〜2SECもしくはそれ以上となるこ
とも珍らしくなく、また、このポーズ区間に伝送されて
くる波形の電力は雑音レベルと考えることができる。な
お、本実施例では、このポーズ区間の検出自体は不要と
しうる雑音レベル推定を行なっている。
短時間電力算出器251の出力は、20mSECをクロックと
して次次に動作されるn段の単位遅延素子251−1〜251
−nでn+1個の20mSEC刻みの短時間平均電力データの
時系列として最低値検出器253に供給される。この場合
nの個数は符号復号化装置の運用条件,配置環境等を勘
案し任意に設定することができる。
最低値検出器253は、こうして入力するn+1個の連
続する20mSEC区間の短時間平均電力を得てその最低値を
検出しこれをその区間の最小雑音レベルとしてROM26に
供給しつつ次次にこのような最低値検出を行なう。
雑音レベル推定器25の目的は、対向局の環境騒音レベ
ルがノイズシェーピングに有効な低騒音レベルである
か、もしくはノイズシェーピングを行なわない方がむし
ろ高評価が得られる高騒音レベルにあるかどうか等の状
態を判定することにあり、この観点からすれば相続く20
mSECごとの最低レベルを追跡することは低騒音レベルを
把握しノイズシェーピングが有効的な状態を検知せんと
するものであり、しかもこのような検知方法によれば、
特にポーズ区間を積極的に検出しなくとも、結果的にポ
ーズ区間を対象とする連続的最低レベル検出が可能とな
ることは明らかである。
さて、ROM26は、雑音レベルと減衰係数γとの対応を
経験的に最適化したデータをあらかじめ格納し、雑音レ
ベル推定器25から20mSECのクロックで次次に提供される
雑音レベル最低値に対してγを0γ1の範囲で決定
しこれを減衰係数印加器17に出力する。
減衰係数印加器17は、こうして提供されるγをK/α変
換器16の出力するαパラメータに乗じ、かくして対向局
の環境騒音に対応した変形スペクトルH′(Z)を得
て、有効な利用状態でだけノイズシェーピングが実行さ
れることが可能となり、さらにノイズシェーピングも経
験的に最適な減衰係数を利用して行なうことができるよ
うになる。
符号復号化装置Bの合成部2においても、符号復号化
装置Aの合成部2と全く同様にしてROM26から符号復号
化装置Aの環境騒音に対応して決定される減衰係数γを
出力し、これを分析部1に供される。
こうして、対向局の合成部2から出力される出力音声
も、また自己の合成部2から出力される出力音声も、い
ずれも互いに対向局の環境騒音に対応してノイズシェー
ピングが有効であると判定されたときだけ、ノイズシェ
ーピングを環境騒音レベルに対応した強さで行ない、対
向局側の環境騒音レベルに対応して量子化雑音整形を制
御することができる。
第7図は第1図の減衰係数印加器17における処理内容
を示すフローチャートである。
ステップ(1)で常数Iを0とし、ステップ(2)で
は常数Gを1.0のそれぞれ初期値に設定する。次にステ
ップ(3)で関数A(I)=G*B(I)を設定する。
ここでB(I),A(I)はそれぞれα,γαである。ス
テップ(4)と(5)を利用する(3)の演算をIがP
(分析次数)になるで繰返しつつステップ(6)までの
γαの演算を行ない終了する。
以上のようにして環境レベルの騒音レベルを配慮した
効果的なノイズシェーピングを前提とする符号復号化が
可能となる。
なお、上述した第1図の実施例において、雑音レベル
推定器25はポーズ区間の検出が不要な方法を利用してい
るが、ポーズ区間を検出しつつ雑音レベルの判定を行な
うことも自己相関係数を媒介とする方法とレベル判定処
理とを組合せる手段等で容易に実施できることは明らか
である。
また、第1図の実施例ではスペクトル逆変換器23の出
力を雑音レベル推定器25に供給して最低値の検出を行っ
ているが、雑音を入力として求めるスペクトル逆変形器
23のフィルタゲインは極めて小さいものであるため、雑
音レベル推定器25の入力は点線で示す如く、スペクトル
逆変形器23の出力する合成波形に代えて残差波形を利用
してもほぼ同様な結果が得られる。
〔発明の効果〕
以上説明した如く本発明によれば、自局と対向局との
間で音声を送受信する音声符号復号化装置において、対
向局側を介して計測される自局の環境騒音レベルに対応
して自局の量子化雑音整形を制御する手段を備えること
により、極めて効率的に量子化雑音の整形が可能となり
合成音質を著しく改善することができる音声符号復号化
装置が実現できるという効果がある。
【図面の簡単な説明】
第1図は本発明の一実施例を示すブロック図、第2図は
本発明の概念図、第3図はノイズシェーピングにおける
スペクトル変形を説明するためのスペクトル変形説明
図、第4図はノイズシェーピングの基本的処理を説明す
るための処理ブロック図、第5(a)図は本発明のノイ
ズシェーピングの基本的処理を説明するためのブロック
図、第5(b)図は第5(a)図の符号化器および復号
化器の部分を詳細に示すブロック図、第5(c)図は第
5(a)図と第5(b)図の内容を組合せて示すブロッ
ク図、第6図は第1図の実施例の雑音レベル推定器25の
部分を詳細に示すブロック図、第7図は第1図の実施例
の減衰係数印加器17の処理内容を示すフローチャート、
第8図はノイズシェーピングの原理図である。 1……分析部、2……合成部、3……伝送路、11……ス
ペクトル変形器、12……LPC分析器、13……逆フィル
タ、14……残差波形符号化器、15……K量子化/復号化
器、16……K/α変換器、17……減衰係数印加器、21……
残差波形復号化器、22……K復号化器、23……スペクト
ル逆変形器、24……K/α変換器、25……雑音レベル推定
器、26……ROM、251……短時間電力算出器、252−1〜2
52−n……単位遅延素子、253……最低値検出器。

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】自局と対向局との間で音声波形の符号復合
    化を行ない音声を送受信する音声符号化復号化装置にお
    いて、対向局側の環境騒音レベルに対応して自局の量子
    化雑音整形を制御する手段を有することを特徴とする音
    声波形符号復号化装置。
JP61180366A 1986-07-30 1986-07-30 音声波形符号復号化装置 Expired - Lifetime JP2508007B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61180366A JP2508007B2 (ja) 1986-07-30 1986-07-30 音声波形符号復号化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61180366A JP2508007B2 (ja) 1986-07-30 1986-07-30 音声波形符号復号化装置

Publications (2)

Publication Number Publication Date
JPS6334600A JPS6334600A (ja) 1988-02-15
JP2508007B2 true JP2508007B2 (ja) 1996-06-19

Family

ID=16081987

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61180366A Expired - Lifetime JP2508007B2 (ja) 1986-07-30 1986-07-30 音声波形符号復号化装置

Country Status (1)

Country Link
JP (1) JP2508007B2 (ja)

Also Published As

Publication number Publication date
JPS6334600A (ja) 1988-02-15

Similar Documents

Publication Publication Date Title
US6260009B1 (en) CELP-based to CELP-based vocoder packet translation
JP5220254B2 (ja) 広帯域オーディオ伝送システム
JP4302978B2 (ja) 音声コーデックにおける擬似高帯域信号の推定システム
KR100574031B1 (ko) 음성합성방법및장치그리고음성대역확장방법및장치
EP1587062B1 (en) Method for improving the coding efficiency of an audio signal
KR100915726B1 (ko) 잡음 억제 방법 및 장치
JP4489960B2 (ja) 音声の無声セグメントの低ビットレート符号化
US20090204397A1 (en) Linear predictive coding of an audio signal
US20100317396A1 (en) Communication system
KR100603167B1 (ko) 시간 동기식 파형 보간법을 이용한 피치 프로토타입파형으로부터의 음성 합성
JP2897551B2 (ja) 音声復号化装置
US8457953B2 (en) Method and arrangement for smoothing of stationary background noise
US6260017B1 (en) Multipulse interpolative coding of transition speech frames
JP3444131B2 (ja) 音声符号化及び復号装置
JP3092653B2 (ja) 広帯域音声符号化装置及び音声復号装置並びに音声符号化復号装置
JPH05158495A (ja) 音声符号化伝送装置
JP2508007B2 (ja) 音声波形符号復号化装置
JP2018511086A (ja) オーディオ信号を符号化するためのオーディオエンコーダー及び方法
KR100554164B1 (ko) 서로 다른 celp 방식의 음성 코덱 간의 상호부호화장치 및 그 방법
Yu et al. Harmonic+ noise coding using improved V/UV mixing and efficient spectral quantization
JPS6134697B2 (ja)
EP0984433A2 (en) Noise suppresser speech communications unit and method of operation
JPH0426119B2 (ja)
JPH034300A (ja) 音声符号化復号化方式
JPH02170199A (ja) 音声符号化復号化方式