JP2000235400A - 音響信号符号化装置、復号化装置、これらの方法、及びプログラム記録媒体 - Google Patents

音響信号符号化装置、復号化装置、これらの方法、及びプログラム記録媒体

Info

Publication number
JP2000235400A
JP2000235400A JP11035420A JP3542099A JP2000235400A JP 2000235400 A JP2000235400 A JP 2000235400A JP 11035420 A JP11035420 A JP 11035420A JP 3542099 A JP3542099 A JP 3542099A JP 2000235400 A JP2000235400 A JP 2000235400A
Authority
JP
Japan
Prior art keywords
background noise
frame
section
signal
synthesis filter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP11035420A
Other languages
English (en)
Other versions
JP3490324B2 (ja
Inventor
Naka Omuro
仲 大室
Kazunori Mano
一則 間野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP03542099A priority Critical patent/JP3490324B2/ja
Publication of JP2000235400A publication Critical patent/JP2000235400A/ja
Application granted granted Critical
Publication of JP3490324B2 publication Critical patent/JP3490324B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 CELP方式で雑音環境の符号化でも自然な
再生音を得る。 【解決手段】 当該フレームが背景雑音区間であるか否
かの情報を受信し、背景雑音区間で、合成フィルタ33
の出力のパワーの長時間平均値を表わすパワーレベルを
求め(61)、また復号線形予測パラメータからその長
時間平均を表わす平均スペクトルを求め(64)、この
平均スペクトルをフィルタ係数とする合成フィルタ63
を白色雑音で駆動し、そのフィルタ出力をパワーレベル
を振幅調整して背景雑音の定常成分信号を得、この信号
を合成フィルタ33の出力に加算する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、音声をはじめと
する音響信号の信号系列を、少ない情報量でディジタル
符号化する高能率音響信号符号化方法、その復号化方
法、これらの装置に関する。
【0002】
【従来の技術】ディジタル移動体通信において、電波を
効率的に利用したり、音声または音楽蓄積サービス等で
通信回線や記憶媒体を効率的に利用するために、高能率
音声符号化方法が用いられる。現在、音声を高能率に符
号化する方法として、原音声を、フレームまたはサブフ
レーム(以降総称してフレーム)と呼ばれる5〜50m
s程度の一定間隔の区間に分割し、その1フレームの音
声を、周波数スペクトルの包絡特性を表す線形フィルタ
の特性と、そのフィルタを駆動するための駆動音源信号
との2つの情報に分離し、それぞれを符号化する手法が
提案されている。この手法において、駆動音源信号を符
号化する方法として、音声のピッチ周期(基本周波数)
に対応すると考えられる周期成分と、それ以外の成分に
分離して符号化する方法が知られている。この駆動音源
情報の符号化法の例として、符号駆動線形予測符号化
(Code-Excited Linear Prediction:CELP)があ
る。この技術の詳細については、文献M.R. Schroeder a
nd B.S. Atal,“Code-Excited Linear Prediction(C
ELP):High Quality Speech at Very Low Bit Rate
s”,IEEE Proc. ICASSP-85,pp.937-940,1985に
記載されている。
【0003】図3に上記符号化方法の構成例を示す。入
力端子11に入力された音声xは、線形予測分析部1
2において、入力音声の周波数スペクトル包絡特性を表
す線形予測パラメータaが計算される。得られた線形
予測パラメータaは線形予測パラメータ符号化部13
において、量子化および符号化され、量子化値は合成フ
ィルタ係数aqに変換されて合成フィルタ14に、符
号baは符号送出部15へ送られる。なお、歪み計算
に聴覚特性を考慮するなど、入力音声のスペクトル情報
を利用して歪み計算を行う場合には、線形予測パラメー
タaまたは量子化された線形予測パラメータaqが
波形歪み計算部16へも送られる。線形予測分析の詳細
および線形予測パラメータの符号化例については、例え
ば古井貞煕著“ディジタル音声処理”(東海大学出版
会)に記載されている。ここで、線形予測分析部12、
線形予測パラメータ符号化部13および合成フィルタ1
4は非線形なものに置き換えてもよい。
【0004】駆動音源ベクトル生成部17では、1フレ
ーム分の長さの駆動音源ベクトル候補を生成し、合成フ
ィルタ14に送る。駆動音源ベクトル生成部17は、一
般に適応符号帳18と固定符号帳19から構成されるこ
とが多い。適応符号帳18からはバッファに記憶された
直前の過去の駆動音源ベクトル(既に量子化された直前
の1〜数フレーム分の駆動音源ベクトル)を、ある周期
に相当する長さで切り出し、その切り出したベクトルを
フレームの長さになるまで繰り返すことによって、音声
の周期成分に対応する時系列ベクトルの候補が出力され
る。上記「ある周期」とは、波形歪み計算部16におけ
る歪みが小さくなるような周期が選択されるが、選択さ
れた周期は、一般には音声のピッチ周期に相当すること
が多い。固定符号帳19からは、音声の非周期成分に対
応する1フレーム分の長さの時系列符号ベクトルの候補
が出力される。これらの候補は入力音声とは独立に符号
化のためのビット数に応じて、あらかじめ指定された数
の候補ベクトルを記憶してそのうちの1つであったり、
あらかじめ決められた生成規則によってパルスを配置し
て生成されたベクトルの1つであったりする。なお、固
定符号帳19は、本来音声の非周期成分に対応するもの
であるが、特に母音区間など、ピッチ周期性の強い音声
区間では、上記あらかじめ用意された候補ベクトルに、
ピッチ周期または適応符号帳で用いるピッチに対応する
周期を持つ櫛形フィルタをかけたり、適応符号帳での処
理と同様にベクトルを切り出して繰り返したりして固定
符号ベクトルとすることもある。適応符号帳18および
固定符号帳19から出力された時系列ベクトルの候補
caおよびcrは、乗算部21および22におい
て、それぞれゲイン符号帳23から出力されるゲイン候
補 ga,grが乗算され、加算部24において加
算され、駆動音源ベクトルの候補cとなる。図3の構
成例において、実際の動作中には適応符号帳18のみま
たは固定符号帳19のみが用いられる場合もある。
【0005】合成フィルタ14は、線形予測パラメータ
符号化部13において量子化された線形予測パラメータ
aqから得られる合成フィルタ係数をフィルタの係数
とする線形フィルタであって、駆動音源ベクトル候補
cを入力として再生音声の候補yを出力する。合成
フィルタ14の次数すなわち線形予測分析の次数は、一
般に10〜16次程度が用いられることが多い。なお、
既に述べたように、合成フィルタ14は非線形なフィル
タでもよい。
【0006】波形歪み計算部16では、合成フィルタ1
4の出力である再生音声の候補yと、入力音声xと
の歪みdを計算する。この歪みの計算は、例えば聴覚
重み付けに代表されるように、合成フィルタ14の係数
aqまたは量子化していない線形予測係数aを考慮
にいれて行なうことが多い。符号帳検索制御部25で
は、各再生音声候補yと入力音声xとの歪みが最小
または最小に準ずるような駆動音源符号bc、すなわ
ち周期符号、固定(雑音)符号およびゲイン符号を選択
し、そのフレームにおける駆動音源ベクトルを決定す
る。
【0007】符号帳検索制御部25において決定された
駆動音源符号bc(周期符号、固定符号、ゲイン符
号)と、線形予測パラメータ符号化部13の出力である
線形予測パラメータ符号baは、符号送出部15に送
られ、利用の形態に応じて記憶装置に記憶されるか、ま
たは通信路を介して受信側へ送られる。図4に、上記符
号化方法に対応する復号方法の構成例を示した。伝送路
または記憶媒体から符号受信部31において受信された
符号のうち、線形予測パラメータ符号baは線形予測
パラメータ復号部32において合成フィルタ係数aq
に復号され、合成フィルタ33および、必要に応じて後
処理部(ポストフィルタとも呼ばれる)34に送られ
る。受信された符号のうち、駆動音源符号bcは、駆
動音源ベクトル生成部35に送られ、符号に対応する音
源ベクトルcが生成される。合成フィルタ33は、駆
動音源ベクトルcを入力として、合成音声yを出力
し、後処理部34はスペクトル強調やピッチ強調の処理
を合成音声yに施して、量子化ノイズを聴覚的に低減
する。なお、後処理部34は一種の音声強調処理である
ので、処理量の関係や、入力信号の特性によって用いな
い場合もある。駆動音源ベクトル生成部35は駆動音源
符号bc中の周期符号により適応符号帳36から時系
列ベクトルcaが選択され、また固定符号により固定
符号帳37から時系列ベクトルcrが選択され、これ
ら時系列ベクトルca,crは乗算部38,39
で、ゲイン符号によりゲイン符号帳41から取り出され
たゲインga,grが乗算されて加算部42で互い
に加算されて駆動音源ベクトルcとして合成フィルタ
33に入力される。前述のように実際の動作中に、適応
符号帳18のみ又は固定符号帳19のみが符号化に用い
られる場合には、それに対応して、図4においては適応
符号帳36又は固定符号帳37のみが用いられる。
【0008】
【発明が解決しようとする課題】このようなCELP系
符号化方式をはじめとする音声の生成モデルに基づく符
号化方式において問題となるのは、静かな環境で録音さ
れた背景雑音のない音声信号が入力された場合には、少
ない情報量で高品質な符号化を実現することができる
が、オフィスや街頭など、背景雑音のある環境で録音さ
れた音声が入力されると、キュルキュルとかバチバチと
いった大変に不快な音が再生されるといった点である。
これらの背景雑音を入力した場合の問題は、ピッチ周期
性を利用するCELP系の音声符号化モデルが音声の生
成モデルに基づいているのに対して、背景雑音は音声と
は異なる性質を示すためである。具体的には、適応符号
帳が音声のピッチ周期に対応する信号成分を出力するの
に対して、背景雑音には一般にピッチ周期性がないた
め、背景雑音区間において、不自然な周期音が発生す
る。また、背景雑音が重畳された音声区間においては、
本来はピッチ周期性のある音声とピッチ周期性のない雑
音信号が加算された性質の信号であるにもかかわらず、
音声のピッチ周期性を重視する符号化モデルを適用する
ために、やはり背景雑音成分が不自然な周期音となって
重畳する。固定符号帳をピッチ周期で周期化して用いる
場合には、固定符号帳のピッチ周期化もまた不自然な周
期音の発生する原因となる。上記のように、適応符号帳
や固定符号帳の構成が信号の性質に合わない場合には、
ゲインの決定方法にも問題が生じる。つまり、従来のゲ
インの決定方法は、適応符号帳や固定符号帳から出力さ
れる駆動音源ベクトルの性質が、入力信号の性質によく
合っていることを前提としたものであり、駆動音源ベク
トルの性質が入力信号の性質に合わない場合に、従来の
方法では不自然に変動する信号となる。
【0009】この問題に対する代表的な解決法として、
ノイズリダクションによる方法と、コンフォートノイズ
ジェネレータという方法がある。前者は、入力信号の前
に、雑音低減処理を入れて、背景雑音成分を相対的に低
減するもので、雑音成分が低減された分だけ再生音にお
ける不快音も低減される。しかしながら、雑音低減処理
を入れても、完全に雑音がなくなるわけではなく、不快
音をなくしてしまうことはできない。また、背景雑音が
非定常音の場合には、十分な雑音低減効果そのものを得
ることが難しい。一方、後者のコンフォートノイズジェ
ネレータは、音声区間についてはCELP系符号化方式
でそのまま符号化し、雑音区間については、適当な「心
地よい」雑音、例えば白色雑音などを生成して置き換え
るというものである。コンフォートノイズジェネレータ
の方法を使うと、キュルキュルといった不快な音は再生
されなくなるが、オフィスや雑踏などさまざまな背景雑
音の性質に対して、再生される音の雑音区間は、常に同
じ性質の雑音になってしまって、背景音の情報は受信側
に伝達されないという問題が生じる。また、背景雑音の
レベルが高いときには、音声区間と雑音区間を誤りなく
切り替えることは難しく、区間検出誤りが原因で逆に再
生音が劣化してしまう場合や、区間検出誤りがなくても
音声区間と雑音区間の性質に違いがありすぎて不連続な
感じに聞こえてしまうことも多かった。
【0010】この発明では、CELP系の方式をはじめ
とする、音声の生成モデルに基づく音声符号化方式にお
いて、不快な音が再生されないでかつ、背景音の性質を
受信側に伝えて、より自然な再生音を実現する符号化お
よび復号する方法及びその装置を提供することにある。
【0011】
【課題を解決するための手段】この発明では、背景雑音
の特性を、例えばガタンという音や車が通過した音、足
音、遠くでの人の話し声などの短時間特性(短時間変動
成分)と、例えば定常的にざわざわした感じとかモータ
ーの回転音などの平均的な長時間特性(長時間変動成
分)という2つの立場でとらえ、両特性をCELP系符
号化モデルの枠組みの中で送信パラメータに情報を乗せ
て受信側に送り、再生側で両特性を再現する信号を生成
して、それらを混合することによって、背景音のある音
声入力の場合でも、自然な再生音を出力する。発明のポ
イントは、音声に特化された符号化モデルの枠組みを大
きく切り替えることなく、かつ、限られた情報量(ビッ
トレート)のなかで、うまく雑音の特性を乗せて送ると
いう点で、雑音区間の検出にもそれほどの厳密性は要求
されない。
【0012】この発明の復号方法によれば、適応符号帳
および固定符号帳の両方または一方からフレーム単位あ
るいはサブフレーム単位(以降総称してフレーム単位)
で取り出した符号ベクトルに、ゲイン符号帳より取り出
したゲインを乗算して駆動音源ベクトルを生成し、その
駆動音源ベクトルで合成フィルタを駆動して音声信号ま
たは音響信号(以降総称して音声信号)を生成する音声
の復号方法において、該当フレームが背景雑音区間であ
るか否かの情報を受け取り、背景雑音区間内のフレーム
において、合成フィルタの出力信号のパワーを測定し、
その長時間平均値を表すパワーレベルを計算し、背景雑
音区間内のフレームにおいて、合成フィルタのフィルタ
係数を表すスペクトルパラメータの長時間平均を表す平
均スペクトルを計算して、上記平均スペクトルの特性を
表すフィルタを、白色雑音で駆動して生成した信号を、
上記測定したパワーレベルをもとに振幅調整して、背景
雑音の定常成分信号を生成し、上記生成した背景雑音の
定常成分信号を、当該フレームが背景雑音区間であるか
否かにかかわらず、合成フィルタの出力信号に加算し
て、再生音声を生成する。
【0013】更に入力信号の特性とは独立した、一定の
スペクトル特性、一定の振幅を持つ定常音を、上記平均
スペクトルの特性を表すフィルタを白色雑音で駆動して
生成した信号とともに、前記背景雑音の定常成分信号と
して、合成フィルタの出力信号に加算して、再生音声を
生成する。また当該フレームが背景雑音区間または子音
区間であるか否かの情報を受け取り、駆動音源ベクトル
のフレーム毎のパワーを測定し、白色雑音に、上記駆動
音源ベクトルのパワーをもとに決定した振幅を乗算して
生成した背景雑音の変動成分信号を、当該フレームが背
景雑音区間または子音区間である場合に、駆動音源ベク
トルに加算する。
【0014】この発明の符号化方法によれば、適応符号
帳および固定符号帳の両方または一方からフレーム単位
あるいはサブフレーム単位(以降総称してフレーム単
位)で取り出した符号ベクトルに、ゲイン符号帳より取
り出したゲインを乗算して駆動音源ベクトルを生成し、
合成フィルタを駆動して生成した音声信号または音響信
号(以降総称して音声信号)と入力音声信号とを比較し
て、適応符号、固定符号、ゲイン符号を選択する符号化
方法において、入力信号を分析して、当該フレームが、
背景雑音区間または子音区間に相当するか否かを決定
し、当該フレームが、背景雑音区間または子音区間に相
当する場合には、上記合成フィルタの出力信号と入力信
号の波形歪み最小化に基づく距離尺度と、上記合成フィ
ルタの出力信号と入力信号のパワーレベル差最小化に基
づく距離尺度の、加重和を用いるか、またはパワーレベ
ル差最小化に基づく距離尺度のみを用いることによっ
て、ゲイン符号帳を検索して、最適なゲイン符号を選択
する。
【0015】なお、この発明の実現にあたっては、信号
処理用の専用プロセッサを用いてハードウェア的に実現
してもよいし、コンピュータプログラムの形でソフトウ
ェア的に実現してもよい。
【0016】
【発明の実施の形態】以下にこの発明の実施例を、図を
用いて説明する。図1は、この発明における符号化方法
の機能構成例を示したもので、図3と対応する部分に同
一番号を付けてある。また、図2は、この発明における
復号方法の機能構成例を示したもので、図4と対応する
部分の同一番号を付けてある。この発明のイメージをよ
りわかりやすく説明するため、まず図2の復号方法を先
に説明する。またこの発明は音声信号のみならず音楽信
号などの音響信号に適用できるが、以下の説明では音声
信号で代表して行う。
【0017】この発明による復号方法によって再生され
る音声信号は、図2において一点鎖線で示される、駆動
音源ベクトル生成部35、背景雑音変動成分生成部4
4、背景雑音定常成分生成部45のそれぞれにおいて生
成される信号の全部または一部から構成される。図4に
示した従来の復号方法は、上記3つの生成部のうち、駆
動音源ベクトル生成部35のみしか有しないため、背景
雑音のある音声信号を符号化、復号したときに再生音の
自然性が十分でなかった。自然性が十分でない理由は、
前述のように、駆動音源ベクトル生成部35のモデル
が、人間が音声を生成する機構のモデルに基づいてお
り、背景雑音のある音声のモデル化には必ずしも適当で
ないことに起因する。これに対して、この発明は、音声
の生成モデルによって表現される再生信号(駆動音源ベ
クトルによる成分)に、雑音モデルによって表現される
再生信号が加算されるというモデルに基づいており、加
算する雑音のモデルを、短時間で特性が変動する「背景
雑音変動成分」、時間的にゆっくりとした周期で特性が
変動するか、または変動しない「背景雑音定常成分」の
2つの成分で表現する。
【0018】まず、符号化部において送信または蓄積さ
れた符号は、符号受信部31において駆動音源符号b
c、線形予測パラメータ符号ba、モード情報bm
に分解される。モード情報bmは、雑音付加音声信号
において、母音区間、子音区間、無音区間、背景雑音区
間といったフレーム毎に区間を分類した情報である。た
だし、背景雑音のある入力音声信号を正確に上記区間に
分けることは困難であるため、曖昧なフレームは分類不
明としてもよい。
【0019】駆動音源ベクトル生成部35は、従来法と
同様に、適応符号帳36と固定符号帳37からなり、そ
れぞれの符号帳は、受信した駆動音源符号中の周期符
号、固定符号とそれぞれ対応する適応符号ベクトルc
a、固定符号ベクトルcrを出力する。これらベクト
ルca,crは、受信した駆動音源符号中のゲイン
符号に対応してゲイン符号帳41から出力されるゲイン
ga,grをそれぞれ乗算後、加算されて駆動音源
ベクトルcとなる。
【0020】背景雑音変動成分生成部44から出力され
るベクトルは、背景雑音の、フレーム単位でパワーやス
ペクトル特性が変動する成分に対応する。白色雑音生成
部51からは、1フレーム長の白色雑音系列ベクトル
s1が出力される。白色雑音の生成法として一般には
ガウス乱数を用いることが多いが、一様乱数を用いた
り、あらかじめ乱数系列をテーブルに記憶しておき、フ
レーム長単位で切り出して用いるといった擬似的な手法
を用いてもよい。
【0021】駆動音源ベクトル生成部35から出力され
た駆動音源ベクトルcは、音源パワー測定部52に入
力されて、当該フレームにおける駆動音源ベクトルc
のパワーPcが測定され、測定されたパワーPcと
モード情報bmに基づいて、白色雑音ベクトルs1
と駆動音源ベクトルcにそれぞれ乗算される重みw
s1およびwcが、重み作成部53において決定され
る。白色雑音ベクトルs1と駆動音源ベクトルc
は、それぞれ重みws1およびwcが、乗算部5
4,55で乗算された後、加算部56で加算されて、合
成フィルタ33への入力ベクトルcs1となる。
【0022】なお、重み作成部53において作成される
重みws1およびwcは、合成フィルタ入力cs
1のパワーが、駆動音源ベクトルcのパワーと同じに
なるように決める(完全に一致する必要はないが、聴感
上同じパワーに聞こえるようにする)。また、当該フレ
ームが母音区間であるか、区間が不明の場合には、w
s1は0または0に近い小さい値とする。これは、母音
区間においては、入力音声は音声の生成モデルに基づく
駆動音源ベクトル生成部35で十分良好に表現されるた
めで、背景雑音変動成分は加算する必要がない。また、
区間の分類が不確実な場合も、背景雑音変動成分は加算
しないほうが無難である。
【0023】図2では背景雑音変動成分生成部44の出
力は、合成フィルタ33の手前で駆動音源ベクトルに加
算されているが、合成フィルタ33が線形フィルタの場
合には、背景雑音変動成分生成部44の出力を合成フィ
ルタに通したものと、駆動音源ベクトルを合成フィルタ
33に通したものを加算しても(即ち合成してから加算
しても)結果は等価である。
【0024】合成フィルタ33の出力ys1は、後処
理部34において、従来法と同様に、スペクトル包絡や
ピッチ成分が強調される。ただし、音声区間以外は強調
されると逆に不自然になるため、モード情報bmが母
音区間についてのみ従来法と同程度の強調を行い、母音
性が低くなるにしたがって、強調の度合いを弱める。合
成フィルタ33の出力ys1は、背景雑音定常成分生
成部45の、平均雑音パワー測定部61へも送られる。
平均雑音パワー測定部61では、確実な背景雑音区間
(無音区間を含む)においてのみ、合成フィルタ33の
出力信号ys1のパワーを測定し、フレーム長に対し
て十分に長い時間にわたるパワーの平均値を計算する。
ここで「確実な背景雑音区間」とは、背景雑音区間でも
母音区間や子音区間の疑いのあるフレームは除外するこ
とを意味する。この確実な背景雑音区間だけ合成フィル
タ33の出力が平均雑音パワー測定部61へ供給される
ようにモード情報bmによりスイッチ46が制御され
る。また「フレーム長に対して十分に長い時間」とは、
1秒〜数十秒程度がよいと考えられる。長時間平均の計
算の方法としては、バッファにフレーム毎のパワーを記
憶しておいて、一定の時間毎に平均をとってもよいし、
第nフレームにおける瞬時パワーをP(n)、第nフレ
ームにおける平均パワーをPave(n) 、第n−1フレー
ムにおける平均パワーをPave(n−1) ,0<α<1と
して、 Pave(n) =(1−α)Pave(n−1)+αP( n) のような逐次更新式を用いて近似的に求めてもよい。な
おαは値が小さいほど長時間平均に相当する。計算され
た平均雑音パワーPyは、重み作成部62に送られ、
背景雑音定常成分のパワーを決定する重みwuが計算
される。背景雑音定常成分生成部45から出力される信
号のパワーは、平均雑音パワーPyとほぼ同じになる
ように決められるが、多少低くなるように決めると、聴
感上聞きやすい音になることが多い。なお、合成フィル
タ63の出力u2のパワーは平均雑音スペクトルa
uに依存するため、重み作成部62で重みwuを求め
る際には、平均雑音パワーPyと合成フィルタ63の
フィルタゲインを併用するか、合成フィルタ63の出力
u2のパワーを実際に測定してその値をもとにwu
を求めるとよい。
【0025】平均雑音スペクトル測定部64では、平均
雑音パワー測定部61と同様に、確実な背景雑音区間
(無音区間を含む)においてのみ、復号された線形予測
パラメータaqから、フレーム長に対して十分に長い
時間にわたるスペクトルの平均値を計算する。このため
確実な背景雑音区間のみ線形予測パラメータaqが平
均雑音スペクトル測定部64へ供給されるようにモード
情報bmによりスイッチ47が制御される。スペクト
ルの平均値は、一般に、線形予測パラメータの一種であ
る、線スペクトル対(LSP)の領域で平均操作を行う
ことが多いが、ケプストラムやパワースペクトルの領域
で平均をとってもよい。平均の計算方法は、上記パワー
の平均と同様に、バッファにフレーム毎のスペクトルパ
ラメータを記憶しておいて、一定の時間毎に平均をとっ
てもよいし、逐次更新式を用いてもよい。平均雑音スペ
クトル測定部64からは、平均雑音スペクトルに対応す
る、線形フィルタ係数auが出力され、合成フィルタ
63の係数となる。なお、線スペクトル対(LSP)か
らの線形フィルタ係数の計算方法は、前述の古井貞煕著
“ディジタル音声処理”(東海大学出版会)にも記載さ
れている。
【0026】白色雑音生成部65は、白色雑音生成部5
1と同様に、1フレーム長の白色雑音s2を出力し、
出力された白色雑音ベクトルs2は、合成フィルタ6
3に通されてu2となる。定常音生成部66は、入力
信号の性質に依存しない、完全に一定の音u3を出力
する。背景雑音定常成分生成部45の出力は、定常音
u3の振幅を乗算部67で重みwu3を乗算して調
整した信号と、合成フィルタ63の出力信号u2とを
加算部68で加算したものに、重み作成部62で作成さ
れる重みwuを乗算部69で乗算したものとなる。な
お、定常音生成部66から出力される信号u3は、入
力信号とは独立した音であるので、入力信号を符号化
し、復号して再生するという立場からいえば、用いても
用いなくてもよい。しかし、人間の聴覚特性上、定常な
背景雑音は安心感をもたらし、入力信号の特性と必ずし
も一致していなくても、より自然に感じることが多い。
したがって、定常音生成部66において、ブーンといっ
た低周波の音や、サーといった定常的な白色雑音を生成
して、合成フィルタ63の出力レベルに比べて相対的に
低いレベルに振幅を調整して加算すると、より自然な背
景雑音となる。
【0027】背景雑音定常成分生成部45の出力は、後
処理部34の出力信号ys1eに加算部71で加算さ
れて、再生信号出力となる。ここで注意すべきことは、
背景雑音定常成分のレベルは、平均雑音パワーの測定結
果Pyによって決定され、母音区間、子音区間、背景
雑音区間といった、フレーム毎のモードにかかわらず、
ほぼ一定のレベルで加算されることである。この点は、
背景雑音変動成分が、該当フレームのモード情報によっ
て、フレーム毎に、加算される雑音レベルが制御される
点と異なっている。
【0028】なお、背景雑音定常成分生成部45の出力
は、合成フィルタ33と後処理部34との間で加算して
もよいが、後処理部34は音声を強調するための処理で
あるので、音声強調の度合いが大きい場合には、図2に
示すように後処理部34の後で加算したほうが処理も簡
単で再生音声の自然性も高い。次に、図1を用いて、符
号化方法を説明する。
【0029】図2に示したような、復号方法を用いて自
然な再生音声を得るためには、符号化側では、従来の符
号化方法に加えて、以下の2点を実現しなければならな
い。1点目は、母音区間、子音区間、無音区間、背景雑
音区間といった、フレーム毎のモード分けをして、復号
側にモード情報の全部または一部を送ること、2点目
は、背景雑音区間において、雑音パワーの情報を復号側
に送ることである。
【0030】図1において、入力音声信号xは、モー
ド判定部81にも送られる。モード判定部81では、入
力信号を分析して、区間の特性を表すモード情報bm
を出力する。符号化側のモード分けとしては、「母音区
間である」「子音区間である」「無音区間である」「背
景雑音区間である」の4つに、「よくわからない(不
明)」というカテゴリも許すことにする。不明を許すの
は、背景雑音が重畳した音声信号を分析した場合、必ず
中間的な性質のフレームが存在するためで、強制的に4
つの区間のどれかに分類してしまうのは自然な音を再生
するという立場から適当でないと考えられるからであ
る。ただし、不明を含めた5つのモード情報を受信側に
送ろうとすると、送信情報が無駄になるため、不明モー
ドは符号化側のみで利用して、送信する際には「不明」
は母音区間に含めてもよい。上記4つのモード情報を送
る場合、一般的には2ビット必要であるが、最初に母音
であるかそうでないかを1ビットで表すと、母音以外の
区間については、母音区間よりも少ない情報で入力信号
を表現できるようになるため、つまり使用ビットに余り
が生じるため、この余ったビットで子音/無音/背景雑
音の各区間を表すことができ、実質的にはこの発明を実
施するためには、従来法と比べてフレームあたり1ビッ
ト余分に使用すればよいことになる。フレームあたり1
ビットとは、例えばフレーム長が20ミリ秒であれば5
0ビット/秒に相当し、全体の情報量の4kビット/秒
に対し、ごくわずかな情報量増でよい。
【0031】モードを母音区間/子音区間/無音区間/
背景雑音区間に分ける手法としては、信号のパワー、パ
ワーの変動分、スペクトル包絡の傾き、ピッチ周期性な
どを分析して求め、それぞれをしきい値と比較して判断
する。また、背景雑音区間の場合は、信号の性質が多岐
に渡るので、モードの連続性を考慮したり、過去の背景
雑音区間のパワーや性質と比較して、相対的なしきい値
を用いるとよい。分析して得られた値とそれぞれのしき
い値を比較しても、明確な区間分類ができない場合は、
区間が「不明」とする。
【0032】2点目の、背景雑音区間において雑音パワ
ーの情報を復号側に送るために、この発明では、ゲイン
符号帳23の探索に、歪み計算部16とパワーレベル差
計算部82のそれぞれの出力の加重和を用いて符号帳を
検索する。CELP系の符号化方式において、特に背景
雑音区間や子音区間では、入力信号のパワーが再生音の
パワーに必ずしも反映されない。これは、従来のCEL
P系符号化方式の符号帳探索が、サンプル単位の波形歪
みを小さくすることを念頭において行われていることに
対して、符号化のモデルが背景雑音や子音の生成過程に
合っていないことに起因する。したがって、従来法を用
いた場合、背景雑音区間や子音区間では、再生信号のパ
ワーが、入力信号のパワーを正しく表さないだけでな
く、不自然で不安定に変動することが多かった。この発
明では、復号側で、合成フィルタ出力ys1のパワー
を計算して、背景雑音レベルPyを推定するため、従
来の符号帳探索方法を用いるのでは、復号側で間違った
雑音レベルが推定されてしまうことになる。そこで、こ
の発明における符号化側では、合成フィルタ14の出力
yを従来と同様の波形歪み計算部16に送って、入力
信号とのサンプル単位での波形歪み値dを計算するほ
か、合成フィルタ出力yをパワーレベル計算部82に
も送り、入力信号のパワーと合成信号yのパワーの差
も計算する。一般にCELP系符号化では、適応符号ベ
クトルcaと固定符号ベクトルcrと、それらに乗
算するゲインga,grの最適な組み合わせを探索
するが、実際には、これらの同時最適値を探索するには
膨大な演算量が必要となるため、適応符号帳18と固定
符号帳19を先に探索して最適または準最適な適応符号
ベクトルcaと固定符号ベクトルcrを決めた後、
ゲイン符号帳23を最後に探索することが多い。
【0033】この発明でも上記探索順序によるものとす
るが、適応符号帳18と固定符号帳19の探索には、従
来と同様に、波形歪みdの最小化に基づいて符号帳を
探索し、ゲイン符号帳23の探索時には、波形歪みd
とパワーレベル差dpを併用して探索する。重み作成
部83では、当該フレームのモード情報bmに基づい
て、波形歪み値dとパワーレベル差dpのそれぞれ
の値に乗算部84,85で乗算する重みwd,wp
を作成する。例えば、母音区間では波形歪み値dのみ
を用いるか波形歪み値dを優先する重みの組を使い、
子音区間や背景雑音区間ではパワーレベル差dpのみ
を用いるかパワーレベル差dpを優先する重みの組を
使用する。この結果、母音区間では従来と同様の波形歪
みの少ない良好な品質の音が、子音区間や背景雑音区間
では、合成波形yの形状は入力信号xの形状と相似
性が高く、パワーは入力信号のパワーをできるだけ保存
するような音を再生するための駆動音源符号が選択され
る。なお、「不明」区間は母音区間と子音や背景雑音区
間との中間的な性質であるので、ゲイン符号帳23を探
索する重みとしてはパワーレベル差dpを重視するよ
うな重みを用いるのがよい。乗算部84,85でそれぞ
れ重み付けされた波形歪み値dとパワーレベル差d
pは加算部86で加算されて符号帳検索制御部25に入
力される。
【0034】
【発明の効果】この発明の効果を調べるために、この発
明をコンピュータプログラムによるシミュレーションの
形で実現し、実際の音声データを用いて主観品質評価実
験を行った。フレーム長は20ミリ秒とし、フレームは
2つのサブフレームに分割した。ビットレートは4キロ
ビット/秒で設計した。フレームあたりの詳細なビット
配分は、図5に示すように、線形予測パラメータ20ビ
ット、適応符号帳13ビット、固定符号帳34ビットと
し、ゲイン符号帳は母音区間では12ビット、母音以外
の区間では10ビットとした。モード情報は母音区間で
1ビット、母音以外の区間で3ビットである。
【0035】音声データは、修正IRS特性と呼ばれる
一般的な電話の特性に準拠したもので、SN比が15d
Bの自動車雑音付加音声と、SN比が30dBのオフィ
ス雑音付加音声を、それぞれ従来法とこの発明を用いて
符号化および復号して、それぞれ再生された音を実際に
聞いて比較した。被験者は一般人24名で、試験方法
は、原音と符号化音声の品質を比較して、非常に悪い
(−3)、悪い(−2)、少し悪い(−1)、同品質
(0)、少し良い(+1)、良い(+2)、非常に良い
(+3)の7段階で評価した。
【0036】図6に試験結果を示す。グラフは低いほど
原音に比べて品質が悪いことを示す。図より、この発明
を用いた場合の品質は、この発明を用いない従来の方法
による品質に比べて大きく改善することが示された。従
来法とこの発明による音の性質の差を言葉で表現する
と、従来法による再生音は、子音区間と背景雑音区間に
おいて、大変に不自然で不快な音であったが、この発明
によって再生された音は、自動車騒音とオフィス雑音の
それぞれの雰囲気が再現されているうえに、安心して聞
ける自然な品質の音であった。また、背景雑音区間だけ
でなく母音区間においても、音声と背景雑音が混合し
た、より自然な再生音という観点でこの発明のほうが優
れていた。
【0037】なお、この発明を背景雑音のない音声に適
用した場合には、「背景雑音」は無音区間として分類さ
れ、「背景雑音」の平均レベルは0であると判断される
ため、理論的に悪影響を及ぼさないことは言うまでもな
い。実際の音声を入力した場合も、母音区間と無音区間
(背景雑音区間)については従来法と同等の音質が、子
音区間については、この発明によるほうが自然な音質で
あった。
【図面の簡単な説明】
【図1】この発明による符号化装置の機能構成例を示す
ブロック図。
【図2】この発明による復号化装置の機能構成例を示す
ブロック図。
【図3】従来の音声の符号駆動線形予測符号化(Code-E
xcited Linear Prediction:CELP)装置の機能構成
を示すブロック図。
【図4】従来の音声の符号駆動線形予測符号化(Code-E
xcited Linear Prediction:CELP)に対応する復号
装置の機能構成を示すブロック図。
【図5】シミュレーション実験におけるビット配合を示
す図。
【図6】シミュレーション実験結果を示す図。
───────────────────────────────────────────────────── フロントページの続き Fターム(参考) 5D045 CA04 5K041 AA05 AA08 BB08 CC01 CC07 DD02 EE00 EE35 EE38 EE51 HH27 JJ14 9A001 CZ05 EE04 HH15 HH16

Claims (15)

    【特許請求の範囲】
  1. 【請求項1】 適応符号帳と固定符号帳の少くとも一方
    からフレーム単位で符号ベクトルを選択し、ゲイン符号
    帳から選択されたゲインを前記選択された符号ベクトル
    に乗算して駆動音源ベクトルを生成し、 前記駆動音源ベクトルで合成フィルタを駆動して音響信
    号を出力する音響信号復号化装置において、 当該フレームが背景雑音区間であるか否かを示す情報を
    受信する手段と、 背景雑音区間であるフレームにおいて前記合成フィルタ
    からの出力信号パワーの長時間平均値を表すパワーレベ
    ルを計算する手段と、 背景雑音区間であるフレームにおいて前記合成フィルタ
    のフィルタ係数よりスペクトルの長時間平均を表す平均
    スペクトルを計算する手段と、 白色雑音で駆動され、前記平均スペクトルがフィルタ係
    数として与えられる第2合成フィルタと、 前記第2合成フィルタで生成された信号を、前記計算さ
    れたパワーレベルに基づいて振幅調整して背景雑音の定
    常成分信号を生成する手段と、 前記定常成分信号を、当該フレームが背景雑音区間であ
    るか否かに関わらず前記合成フィルタからの出力信号に
    加算して再生音響信号を出力する手段と、 を有する音響信号復号化装置。
  2. 【請求項2】 一定のスペクトル特性及び一定の振幅を
    有する定常音を生成する手段と、 前記背景雑音の定常成分信号を生成する手段よりの定常
    成分信号と前記定常音を加算して定常成分信号として出
    力する手段とを備えることを特徴とする請求項1記載の
    音響信号復号化装置。
  3. 【請求項3】 当該フレームが背景雑音区間又は子音区
    間であるか否かを示す情報を受信する手段と、 前記駆動音源ベクトルのパワーに基づいて重みを決定す
    る手段と、 前記重みを白色雑音に乗算して背景雑音の変動成分信号
    を生成する手段と、 背景雑音区間又は子音区間であるフレームにおいて、前
    記変動成分信号を前記駆動音源ベクトルに加算する手段
    と、 を有することを特徴とする請求項1又は2記載の音響信
    号復号化装置。
  4. 【請求項4】 適応符号帳と固定符号帳の少くとも一方
    からフレーム単位で符号ベクトルを選択し、ゲイン符号
    帳から選択されたゲインを前記選択された符号ベクトル
    に乗算して駆動音源ベクトルを生成し、 前記駆動音源ベクトルで合成フィルタを駆動して得られ
    た音響信号と入力音響信号とを比較して前記符号ベクト
    ルと前記ゲインを選択する音響信号符号化装置におい
    て、 入力音響信号を分析して、当該フレームが背景雑音区間
    又は子音区間に相当するか否かを決定する手段と、 前記合成フィルタの出力信号と入力音響信号とのパワー
    レベル差を計算する手段と、 前記ゲイン選択に際し、背景雑音区間又は子音区間のフ
    レームにおいて前記パワーレベル差を距離尺度とし、そ
    の距離尺度を最小とするゲインをゲイン符号帳から選択
    する手段と、 を備えることを特徴とする音響信号符号化装置。
  5. 【請求項5】 前記距離尺度として、前記合成フィルタ
    からの出力信号と入力音響信号との波形歪みと、前記パ
    ワーレベル差との加重和が用いられることを特徴とする
    請求項4記載の音響信号符号化装置。
  6. 【請求項6】 適応符号帳と固定符号帳の少くとも一方
    からフレーム単位で符号ベクトルを選択し、ゲイン符号
    帳から選択されたゲインを前記選択された符号ベクトル
    に乗算して駆動音源ベクトルを生成し、 前記駆動音源ベクトルで合成フィルタを駆動して音響信
    号を出力する音響信号復号化方法において、 当該フレームが背景雑音区間であるか否かを示す情報を
    受信する過程と、 背景雑音区間であるフレームで前記合成フィルタからの
    出力信号パワーの長時間平均値を表すパワーレベルを計
    算する過程と、 前記合成フィルタのフィルタ係数よりスペクトルの長時
    間平均を表す平均スペクトルを計算する過程と、 前記平均スペクトルをフィルタ係数とする第2合成フィ
    ルタを白色雑音で駆動する過程と、 前記第2合成フィルタで生成された信号を、前記計算さ
    れたパワーレベルに基づいて振幅調整して背景雑音の定
    常成分信号を生成する過程と、 前記定常成分信号を、当該フレームが背景雑音区間であ
    るか否かに関わらず前記合成フィルタからの出力信号に
    加算して音響信号を出力する過程と、 を有する音響信号復号化方法。
  7. 【請求項7】 一定のスペクトル特性及び一定の振幅を
    有する定常音を生成する過程と、 前記背景雑音の定常成分信号と前記定常音を加算して定
    常成分信号として出力する過程とを有する、 ことを特徴とする請求項6記載の音響信号復号化方法。
  8. 【請求項8】 当該フレームが背景雑音区間又は子音区
    間であるか否かを示す情報を受信する過程と、 前記駆動音源ベクトルのパワーに基づいて重みを決定す
    る過程と、 前記重みを白色雑音に乗算して背景雑音の変動成分信号
    を生成する過程と、 背景雑音区間又は子音区間のフレームで、前記変動成分
    信号を前記駆動音源ベクトルに加算する過程と、を有す
    ることを特徴とする請求項6又は7記載の音響信号復号
    化方法。
  9. 【請求項9】 適応符号帳と固定符号帳の少くとも一方
    からフレーム単位で符号ベクトルを選択し、各々ゲイン
    符号帳から選択されたゲインを前記選択された符号ベク
    トルに乗算して駆動音源ベクトルを生成し、 前記駆動音源ベクトルで合成フィルタを駆動して得られ
    た音響信号と入力音響信号とを比較して前記符号ベクト
    ルと前記ゲインを選択する音響信号符号化方法におい
    て、 入力音響信号を分析して、当該フレームが背景雑音区間
    又は子音区間に相当するか否かを決定する過程と、 前記合成フィルタの出力信号と入力音響信号とのパワー
    レベル差を計算する過程と、 前記ゲイン選択に際し、背景雑音区間又は子音区間のフ
    レームで前記パワーレベル差を距離尺度とし、該距離尺
    度を最小とするゲインをゲイン符号帳から選択する過程
    と、 を有することを特徴とする音響信号符号化方法。
  10. 【請求項10】 前記距離尺度として、前記合成フィル
    タからの出力信号と入力音響信号との波形歪みと、前記
    パワーレベル差との加重和を用いることを特徴とする請
    求項9記載の音響信号符号化方法。
  11. 【請求項11】 適応符号帳と固定符号帳の少くとも一
    方からフレーム単位で符号ベクトルを選択し、各々ゲイ
    ン符号帳から選択されたゲインを前記選択された符号ベ
    クトルに乗算して駆動音源ベクトルを生成し、 前記駆動音源ベクトルで合成フィルタを駆動して音響信
    号を出力する音響信号復号化装置のコンピュータに、 当該フレームが背景雑音区間であるか否かを示す情報を
    受信する処理と、 背景雑音区間のフレームで前記合成フィルタからの出力
    信号パワーの長時間平均値を表すパワーレベルを計算す
    る処理と、 前記合成フィルタのフィルタ係数よりスペクトルの長時
    間平均を表す平均スペクトルを計算する処理と、 白色雑音で前記平均スペクトルをフィルタ係数とする第
    2合成フィルタを白色雑音で駆動する処理と、 前記第2合成フィルタで生成された信号を、前記計算さ
    れたパワーレベルに基づいて振幅調整して背景雑音の定
    常成分信号を生成する処理と、 前記定常成分信号を、当該フレームが背景雑音区間であ
    るか否かに関わらず前記合成フィルタからの出力信号に
    加算して音響信号を出力する処理と、 を実行させるプログラムを記憶した記録媒体。
  12. 【請求項12】 一定のスペクトル特性及び一定の振幅
    を有する定常音を生成する処理と、 前記背景雑音の定常成分信号と前記定常音を加算して定
    常成分信号として出力する処理とを、 前記コンピュータに実行させるプログラムを前記プログ
    ラムが含むことを特徴とする請求項11記載の記録媒
    体。
  13. 【請求項13】 当該フレームが背景雑音区間又は子音
    区間であるか否かを示す情報を受信する処理と、 前記駆動音源ベクトルのパワーに基づいて重みを決定す
    る処理と、 前記重みを白色雑音に乗算して背景雑音の変動成分信号
    を生成する処理と、 背景雑音区間又は子音区間のフレームで、前記変動成分
    信号を前記駆動音源ベクトルに加算する処理と、 を前記コンピュータに実行させるプログラムを前記プロ
    グラムが含むことを特徴とする請求項11又は12記載
    の記録媒体。
  14. 【請求項14】 適応符号帳と固定符号帳の少くとも一
    方からフレーム単位で符号ベクトルを選択し、各々ゲイ
    ン符号帳から選択されたゲインを前記選択された符号ベ
    クトルに乗算して駆動音源ベクトルを生成し、 前記駆動音源ベクトルで合成フィルタを駆動して得られ
    た音響信号と入力音響信号とを比較して前記符号ベクト
    ルと前記ゲインを選択する音響信号符号化装置のコンピ
    ュータに、 入力音響信号を分析して、当該フレームが背景雑音区間
    又は子音区間に相当するか否かを決定する処理と、 前記合成フィルタの出力信号と入力音響信号とのパワー
    レベル差を計算する処理と、 前記ゲイン選択に際し、背景雑音区間又は子音区間のフ
    レームで前記パワーレベル差を距離尺度とし、該距離尺
    度を最小とするゲインをゲイン符号帳から選択する処理
    と、 を実行するプログラムを記憶した記録媒体。
  15. 【請求項15】 前記距離尺度として、前記合成フィル
    タからの出力信号と入力音声信号との波形歪みと、前記
    パワーレベル差との加重和を求める処理を前記コンピュ
    ータに実行させるプログラムを前記プログラムに含むこ
    とを特徴とする請求項14記載の記録媒体。
JP03542099A 1999-02-15 1999-02-15 音響信号符号化装置、復号化装置、これらの方法、及びプログラム記録媒体 Expired - Fee Related JP3490324B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP03542099A JP3490324B2 (ja) 1999-02-15 1999-02-15 音響信号符号化装置、復号化装置、これらの方法、及びプログラム記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP03542099A JP3490324B2 (ja) 1999-02-15 1999-02-15 音響信号符号化装置、復号化装置、これらの方法、及びプログラム記録媒体

Publications (2)

Publication Number Publication Date
JP2000235400A true JP2000235400A (ja) 2000-08-29
JP3490324B2 JP3490324B2 (ja) 2004-01-26

Family

ID=12441391

Family Applications (1)

Application Number Title Priority Date Filing Date
JP03542099A Expired - Fee Related JP3490324B2 (ja) 1999-02-15 1999-02-15 音響信号符号化装置、復号化装置、これらの方法、及びプログラム記録媒体

Country Status (1)

Country Link
JP (1) JP3490324B2 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6859775B2 (en) 2001-03-06 2005-02-22 Ntt Docomo, Inc. Joint optimization of excitation and model parameters in parametric speech coders
US7024354B2 (en) 2000-11-06 2006-04-04 Nec Corporation Speech decoder capable of decoding background noise signal with high quality
US7167828B2 (en) 2000-01-11 2007-01-23 Matsushita Electric Industrial Co., Ltd. Multimode speech coding apparatus and decoding apparatus
US7478042B2 (en) 2000-11-30 2009-01-13 Panasonic Corporation Speech decoder that detects stationary noise signal regions
WO2014034697A1 (ja) * 2012-08-29 2014-03-06 日本電信電話株式会社 復号方法、復号装置、プログラム、及びその記録媒体
CN105264596A (zh) * 2013-01-29 2016-01-20 弗劳恩霍夫应用研究促进协会 用于码激励线性预测类编码器的无边信息的噪声填充

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7167828B2 (en) 2000-01-11 2007-01-23 Matsushita Electric Industrial Co., Ltd. Multimode speech coding apparatus and decoding apparatus
US7577567B2 (en) 2000-01-11 2009-08-18 Panasonic Corporation Multimode speech coding apparatus and decoding apparatus
US7024354B2 (en) 2000-11-06 2006-04-04 Nec Corporation Speech decoder capable of decoding background noise signal with high quality
US7478042B2 (en) 2000-11-30 2009-01-13 Panasonic Corporation Speech decoder that detects stationary noise signal regions
US6859775B2 (en) 2001-03-06 2005-02-22 Ntt Docomo, Inc. Joint optimization of excitation and model parameters in parametric speech coders
CN104584123A (zh) * 2012-08-29 2015-04-29 日本电信电话株式会社 解码方法、解码装置、程序、及其记录介质
WO2014034697A1 (ja) * 2012-08-29 2014-03-06 日本電信電話株式会社 復号方法、復号装置、プログラム、及びその記録媒体
JPWO2014034697A1 (ja) * 2012-08-29 2016-08-08 日本電信電話株式会社 復号方法、復号装置、プログラム、及びその記録媒体
US9640190B2 (en) 2012-08-29 2017-05-02 Nippon Telegraph And Telephone Corporation Decoding method, decoding apparatus, program, and recording medium therefor
CN105264596A (zh) * 2013-01-29 2016-01-20 弗劳恩霍夫应用研究促进协会 用于码激励线性预测类编码器的无边信息的噪声填充
JP2016504635A (ja) * 2013-01-29 2016-02-12 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン Celp状コーダのためのサイド情報を用いないノイズ充填
US10269365B2 (en) 2013-01-29 2019-04-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Noise filling without side information for CELP-like coders
US10984810B2 (en) 2013-01-29 2021-04-20 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Noise filling without side information for CELP-like coders

Also Published As

Publication number Publication date
JP3490324B2 (ja) 2004-01-26

Similar Documents

Publication Publication Date Title
McCree et al. A mixed excitation LPC vocoder model for low bit rate speech coding
JP2004510174A (ja) Celp型音声符号化装置用の利得量子化
US20070061135A1 (en) Optimized windows and interpolation factors, and methods for optimizing windows, interpolation factors and linear prediction analysis in the ITU-T G.729 speech coding standard
KR101892662B1 (ko) 스피치 처리를 위한 무성음/유성음 결정
KR19990006262A (ko) 디지털 음성 압축 알고리즘에 입각한 음성 부호화 방법
JPH08328591A (ja) 短期知覚重み付けフィルタを使用する合成分析音声コーダに雑音マスキングレベルを適応する方法
JP4040126B2 (ja) 音声復号化方法および装置
Jelinek et al. Wideband speech coding advances in VMR-WB standard
JP3180786B2 (ja) 音声符号化方法及び音声符号化装置
JP2002140099A (ja) 音声復号化装置
JP3490324B2 (ja) 音響信号符号化装置、復号化装置、これらの方法、及びプログラム記録媒体
Hagen et al. Voicing-specific LPC quantization for variable-rate speech coding
JP3353852B2 (ja) 音声の符号化方法
JPH0782360B2 (ja) 音声分析合成方法
US7389226B2 (en) Optimized windows and methods therefore for gradient-descent based window optimization for linear prediction analysis in the ITU-T G.723.1 speech coding standard
JP3481027B2 (ja) 音声符号化装置
JP3153075B2 (ja) 音声符号化装置
JP3232701B2 (ja) 音声符号化方法
JP3192051B2 (ja) 音声符号化装置
JP3785363B2 (ja) 音声信号符号化装置、音声信号復号装置及び音声信号符号化方法
US20070061136A1 (en) Optimized windows and methods therefore for gradient-descent based window optimization for linear prediction analysis in the ITU-T G.723.1 speech coding standard
JP2001142499A (ja) 音声符号化装置ならびに音声復号化装置
JP2992998B2 (ja) 音声符号化復号化装置
JP3006790B2 (ja) 音声符号化復号化方法及びその装置
JP2853170B2 (ja) 音声符号化復号化方式

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071107

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081107

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091107

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101107

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees