JP3575967B2 - 音声通信システムおよび音声通信方法 - Google Patents
音声通信システムおよび音声通信方法 Download PDFInfo
- Publication number
- JP3575967B2 JP3575967B2 JP31859897A JP31859897A JP3575967B2 JP 3575967 B2 JP3575967 B2 JP 3575967B2 JP 31859897 A JP31859897 A JP 31859897A JP 31859897 A JP31859897 A JP 31859897A JP 3575967 B2 JP3575967 B2 JP 3575967B2
- Authority
- JP
- Japan
- Prior art keywords
- code
- update
- codebook
- transmission
- noise
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/012—Comfort noise or silence coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0004—Design or structure of the codebook
- G10L2019/0005—Multi-stage vector quantisation
Description
【発明の属する技術分野】
この発明は、例えば移動体通信システム等の通信システムにおいて、音声信号を符号化・復号化する技術に関するものである。
【0002】
【従来の技術】
電話での会話においては、通常は、通話者が自分で話している時間と通話相手の話を聞いている時間とが交互に存在する。ここで、通話相手の話しを聞いている時は、相手側に送る情報は「無音」の情報となる(すなわち自分は話していない)ので、それ程多くの情報量を必要としない。この様なことから、有音時(話している時)は伝送レートを高くし、無音時(聞いている時)は伝送レートを低くするような可変レート型音声符号化・復号化方式が提案されている(下記文献1参照)。この可変レート型音声符号化・復号化方式によれば、音声品質を保ったまま平均伝送レートを下げることができるという効果を得ることができる。
【0003】
参考文献1:DeJaco A., Gardner W., JacobsP., Lee C. ”QCELP”:The North American CDMA Digital Cellular Variable Rate Speech Coding Standard”, IEEE Workshop on Speech Coding for Telecommun., pp.5−6(1993)
【0004】
【発明が解決しようとする課題】
上述のような可変レート型音声符号化・復号化方式は、伝送容量を可変とすることができる伝送路を用いる場合には、大きい効果を得ることができる。しかし、伝送容量が固定である伝送路を用いる場合には、十分な効果を得ることができない。つまり、音声情報を伝送する伝送路の伝送容量が固定であった場合には、その伝送路を伝送する情報量が伝送容量よりも小さい場合であっても常に一定量の伝送路を占有してしまうこととなるため、伝送レートを可変とする意味がない。
【0005】
また、音声符号化・復号化方式では、符号化に用いる量子化コードと音声情報との相関性が良い場合には良好な音声品質を得ることができるが、この相関性が悪い場合には十分な音声品質を得ることができない。
【0006】
【課題を解決するための手段】
(1)第1の発明は、送信側の符号化装置で符号化された音声ベクトルを受信側の復号化装置で復号化する音声通信システムに関する。
そして、符号化装置が、外部から入力された入力音声ベクトルの特性に最も適合するコードを送信用量子化テーブルから選択することにより、有音時の符号化処理を行う送信用符号帳と、送信用符号帳によって選択されたコードと入力音声ベクトルとの相関値を求めるとともにコードごとに相関値の積算値を順次計算し、入力音声ベクトルが有音時のものから無音時のものに切り換わる度に前回の更新処理の後に行われた符号化処理で最も多く選択されたコードを当該符号化処理のうち有音時の当該符号化処理のみを用いて判定し、この判定で得られた当該コードについての積算値を用いて更新用コードを生成し、この更新用コードを送信用符号帳の所望のコードと入れ替えることにより更新処理を行う符号帳更新回路と、有音時には送信用符号帳で選択された最適コードの情報を送信情報に格納し、且つ、無音時には符号帳更新回路で生成された更新用コードを送信情報の剰余ビットに格納して送信する送信回路とを有し、且つ、
復号化装置が、符号化装置から受信した情報から最適コードの情報または更新用コードを取り出す受信回路と、最適コードの情報が取り出されたときは当該情報に対応するコードを受信用量子化テーブルから選択することによって入力音声ベクトルの有音時の復号化処理を行い、更新用コードが取り出されたときは当該更新用コードを所望のコードと入れ替えることにより更新処理を行う受信用符号帳とを有する。
【0007】
(2)第2の発明は、送信処理で符号化された音声ベクトルを受信処理で復号化する音声通信方法に関する。
そして、送信処理が、外部から入力された入力音声ベクトルの特性に最も適合するコードを送信用量子化テーブルから選択することにより、有音時の符号化処理を行う符号化過程と、符号化過程によって選択されたコードと入力音声ベクトルとの相関値を求めるとともにコードごとに相関値の積算値を順次計算し、入力音声ベクトルが有音時のものから無音時のものに切り換わる度に前回の更新処理の後に行われた符号化処理で最も多く選択されたコードを当該符号化処理のうち有音時の当該符号化処理のみを用いて判定し、この判定で得られた当該コードについての積算値を用いて更新用コードを生成し、この更新用コードを送信用量子化テーブルの所望のコードと入れ替えることにより更新処理を行う送信側更新過程と、有音時には符号化過程で選択された最適コードの情報を送信情報に格納し、且つ、無音時には送信側更新過程で生成された更新用コードを送信情報の剰余ビットに格納して送信する送信過程とを有し、且つ、
受信処理が、符号化装置から受信した情報から最適コードの情報または更新用コードを取り出す受信過程と、最適コードの情報が取り出されたときに、当該情報に対応するコードを受信用量子化テーブルから選択することによって入力音声ベクトルの有音時の復号化を行う復合化過程と、更新用コードが取り出されたときは当該更新用コードを所望のコードと入れ替える受信側更新過程とを有する。
【0008】
第1、第2の発明によれば、入力音声ベクトルが有音時のものから無音時のものに切り換わる度に送信用量子化テーブルおよび受信用量子化テーブルの両方を更新することができ、したがって、雑音感を向上させてノイズの低減を図ることができる。
また、無音時送信情報の剰余ビットを用いるので、入力音声ベクトルが有音時のものから無音時のものに切り換わる度に更新コードを送信しても、伝送速度に影響を与えない。
加えて、符号化処理で最も多く選択されたコードを判定する際に、有音時の符号化処理での選択結果のみを考慮することとし、無音時の符号化処理での選択結果を考慮しないので、有音時の周波数特性を非常に有効に向上させることができる。
【0011】
【発明の実施の形態】
一般に、音声合成では、ピッチやパワーなどの情報をもつ音源部と、音韻を表わすスペクトル情報をもつフィルタ部(人間の声道に相当)とを独立に制御して合成音を得る。母音などの有声音に対してはパルス発生器により周期的音源を、無声音に対しては雑音発生器より非周期性音源を生成し、声道の伝達特性と等価な合成フィルタを駆動して音声を合成する。
【0012】
第1の実施の形態
この発明の第1の実施の形態に係る音声信号の符号化・復号化装置および符号化・復号化方法について、図面を用いて説明する。
【0013】
まず、この実施の形態に係る符号器について説明する。
【0014】
図1に示したように、符号器は、有音・無音判定器101、LPC(Linear Predictive Coding:線形予測符号化)分析・量子化部102、合成フィルタ103、加算器104、重み付き誤差計算回路105、多重化回路106、送信端子107、ランダム雑音発生器108、積算器109、ランダム雑音用ゲイン符号帳110、雑音符号帳111、積算器112、ピッチ合成フィルタ113、スイッチ114、雑音ゲイン符号帳115、ピッチラグ符号帳116、ピッチゲイン符号帳117および雑音符号帳更新回路118の各ブロックから構成される。
【0015】
以下に各ブロックの機能を説明する。
【0016】
有音・無音判定器101には、入力音声ベクトルs101がフレーム単位で入力される。この入力音声ベクトルs101は、音声波形を示すデータであり、各フレームはn個の標本値{yi },i=1,2,・・・,nによって構成されている。有音・無音判定器101は、この入力音声ベクトルs101が示す音声信号パワー(すなわち音声波形の振幅)をしきい値と比較する。そして、この入力音声パワーがしきい値よりも大きいときは、そのフレームを有音であると判定し、入力音声パワーがしきい値よりも小さいときはそのフレームを無音であると判定する。さらに、この有音・無音判定器101は、この鑑定結果に基づいて、有音・無音フラグs102をセットまたはリセットする。
【0017】
LPC分析・量子化部102としては、例えばCELP(Code Excited Linear Predictive:コード励振線形予測)型のものが使用される。このLPC分析・量子化部にも、入力音声ベクトルs101がフレーム単位で入力される。そして、この入力音声ベクトルs101が示す入力音声の声道分析(LPC分析)と量子化とを行い、この量子化の結果を示すデータであるLPCインデックスs103を多重化回路106に対して出力するとともに、LPC分析の結果を示すデータであるLPC係数量子化値(すなわち、後述の線形予測係数{αi},i=1,2,・・・,p)s104を合成フィルタ103に対して出力する。
【0018】
ここで、LPC分析は、以下のようにして行われる。
【0019】
式(A)において、yn は音声波形(入力音声ベクトルs101によって得られる)の任意の標本値であり、yn−1 ,・・・,yn−p は標本値yn より前(過去)のp個の標本値である(同じフレーム内の前の標本数がp個に満たない場合は前のフレーム内の標本値を使用する)。また、α1 ,α2 ,・・・,αp は係数である。この式(A)は、任意の標本値yn が、それ以前の標本値yn−1 ,・・・,yn−p と係数α1 ,α2 ,・・・,αp とを掛け合わせたもの(加重平均すなわち線形一次結合)で近似できることを意味している。すなわち、式(A)によれば、それ以前の標本値yn−1 ,・・・,yn−p を用いて、標本値yn を予測することが可能である。ここで、yn の予測値と実際の測定値との誤差は、上述の係数α1 ,α2 ,・・・,αp に応じて異なる値となる。そして、この誤差の自乗平均が最小の値(これを最小自乗誤差と称する)をとるときのα1 ,α2 ,・・・,αp を線形予測係数と称し、この線形予測係数{αi},i=1,2,・・・,pを求めることをLPC分析(線形予測分析)という。
【0020】
yn ≒α1 yn−1 +α2 yn−2 +・・・+αp yn−p −(A)
最小自乗誤差は、以下のようにして求めることができる。まず、標本値yn の予測値をy´n とすると、
y´n =α1 yn−1 +α2 yn−2 +・・・+αp yn−p −(B)
となる。従って、予測値y´n と実際の測定値yn との誤差(予測誤差)をεn とすると、このεn は下式(C)で表される。
【0021】
【数1】
【0022】
ここで、上式Cの−αi をαi に置き換えると、この予測誤差は、下式(D)で表される。
【0023】
【数2】
【0024】
したがって、予測誤差の自乗平均は下式(E)で表される。
【0025】
εn 2=(yn +α1 ynー1 +α2 ynー2 +・・・+αp yn−p )2 −(E)
これは正もしくは0の量であり、極値が一つしかなければ、それが最小値である。よって、予測誤差の自乗平均を最小にするような係数{αi}は、式(E)の各αiについての偏微分係数を0とおく連立p元一次方程式の解として求められる。
【0026】
合成フィルタ103は、音韻を表わすスペクトル情報をもつフィルタ部(人間の声道に相当する)である。有音時には、この声道による調整は、全極型(all pole type) もしくは極零型(zero pole type)のフィルタ特性で近似される。このフィルタの特性には、音源のマクロな周波数特性(スペクトルエンベロープ特性)も織り込まれており、更に放射特性も含まれる。また、無音時には、ベクトルs111にゲインs112を乗じた後で合成フィルタ103に通すことにより、合成音ベクトルs105を得る。
【0027】
上述したように、この合成フィルタ103は、線形予測係数{αi},i=1,2,・・・,pをLPC係数量子化値s104として入力する。そして、かかる線形予測係数を用いて所定の演算処理を行い、さらに演算結果をz変換することにより、下式(F)に示したような声道特性H(z)を得る。
【0028】
H(z)=ε(z)−1y(z) −(F)
そして、スイッチ114を介して入力したデータにこの声道特性H(z)を乗じることにより、後述の合成音ベクトルs115またはs116を生成し、出力する。
【0029】
重み付き誤差計算回路105は、外部から入力した誤差ベクトルs107を用いて重み付き誤差Ewr[i]を計算する。そして、この重み付き誤差計算回路105は、重み付き誤差Ewr[i]が最小となるときのiを判断し、このiを最適ゲインインデックスs119として多重化回路106に出力する。
【0030】
多重化回路106は、有音・無音フラグs102により、現在処理している入力音声ベクトルs101のフレームが無音フレームであるのか或いは有音フレームであるのかを判断する。そして、無音フレームの場合には、有音・無音フラグ値s102、LPCインデックスs103および最適ゲインインデックスs119を多重化し、トータルコードs109として、後述のようにして伝送路へ出力する。一方、有音フレームの場合には、有音・無音フラグ値s102、LPCインデックスs103、最適ゲインインデックスs119、最適雑音コードインデックスs118、最適ピッチラグs121および最適ピッチゲインs122を多重化し、トータルコードs110として、後述のようにして伝送路へ出力する。図9に、有音フレームおよび無音フレームの伝送方法の例を概念的に示す。同図に示したように、多重化回路106は、トータルコードs109をTs ビットの無音フレームとして伝送し、また、トータルコードs110をTs ビットの有音フレームとして伝送する。
【0031】
また、図18に、有音フレームの各パラメータのビット割り当てを示す。同図において、LPCインデックスs103は例えば39ビットの声道パラメータとして、最適ピッチラグs121および最適ピッチゲインs122はピッチフィルタパラメータとして、最適雑音コードインデックスs118および最適ゲインインデックスs119はコードブックパラメータとして、伝送される。
【0032】
ランダム雑音発生器108は、無声部分用の音源である。このランダム雑音発生器108が出力するランダム雑音コードベクトルs111は、無音状態を、空気の乱流に相当する白色ランダム雑音で近似することによって生成される。また、このランダム雑音コードベクトルs111の平均エネルギーは、人間の声の強さに対応している。
【0033】
ランダム雑音用ゲイン符号帳110には、ランダム雑音のゲインを示すスカラ量のデータである、ランダム雑音ゲインs112(Gr[i](i=1〜N))が格納される。
【0034】
雑音符号帳111は、有声部分用の音源である。この雑音符号帳111には、雑音を表わすベクトル量である、雑音コードベクトルs113(Cs[j](j=1〜M))が格納される。この雑音コードベクトルs113は、後述するようにして、更新されるとともに復号器側へ伝送される。図10は、雑音符号帳111の量子化テーブルを示す概念図である。同図に示したように、M(=Mf +Ma )個あるコードベクトルCs[1]〜Cs[Mf +Ma ]のうち、Mf 個のコードベクトルCs[1]〜Cs[Mf ]は固定のベクトルであり、Ma 個のコードベクトルCs[Mf +1]〜Cs[Mf +Ma ]は可変のベクトルである。可変のベクトルCs[Mf +1]〜Cs[Mf +Ma ]は、ある初期値、例えばランダム雑音を持つ。
【0035】
ピッチ合成フィルタ113は、人間の声帯に相当し、雑音(すなわち雑音コードベクトルs113)に周期性を与える。この繰り返し周期が声の高さ(ピッチ周期)に対応し、波形のピーク値が声の強さに対応する。
【0036】
スイッチ114は、有音・無音判定器101が現在処理している入力音声ベクトルのフレームが無音フレームであると判定した場合には、ランダム雑音発生器108側へ倒され、かかるフレームが有音フレームと判定された場合には雑音符号帳111側へ倒される。
【0037】
雑音ゲイン符号帳115は、雑音のゲインを表わすスカラ量のデータである、ゲインs114(Gs[k](k=1〜X))を格納する。
【0038】
ピッチラグ符号帳116はピッチ周期を表わすスカラ量のデータである、ピッチラグs115(L[m](m=1〜Y))を格納し、ピッチ合成フィルタ113へ出力する。
【0039】
ピッチゲイン符号帳117は、相関の度合を表わすスカラ量のデータである、ピッチゲインs116(b[n](n=1〜Z))を格納し、ピッチ合成フィルタ113へ出力する。
【0040】
雑音符号帳更新回路118は、雑音符号帳111の可変領域に格納されたコードベクトルCs[Mf +1]〜Cs[Mf +Ma ](図10参照)のうち、前回までの有音フレームで一番選択回数の多かったコードベクトルを用いて、以下のような演算を行うことにより、更新用の雑音ベクトルを生成する。
【0041】
まず、有音時の処理において、有音フレームで選択されたコードベクトルに対する相関値を計算する。そして、有音フレームが連続する場合には、各コードベクトルごとに、相関値を積算していく。
【0042】
相関の演算としては、例えばLPC分析・量子化部102と同様に最小自乗誤差を求める方法がある。この方法では、入力音声ベクトルs101に対する相関値sは、各音声フレーム(1〜n)の入力信号s1、s2、・・・、snを用いて、(s1+s2+・・・+sn)/nより求められ、また、インパルス応答マトリクスの相関値Hは、各フレーム(1〜n)のインパルス応答マトリクスH1 、H2 、・・・、Hn を用いて、(H1 +H2 +・・・+Hn )/nより求められる。ここで、インパルス応答マトリクスH1 、H2 、・・・、Hn は、合成フィルタ103のフィルタ特性を表すインパルス応答マトリクスである。
【0043】
ここで、更新用の雑音コードベクトルをC´i とすると、
s=H・c´i −(G)
となればよいので、式(G)より、
c´i =Hー1・s −(H)
となり、式(H)より最適な更新用コードベクトルc´i が求められる。
【0044】
このコードベクトルc´i は、可変ベクトル中で最も古いベクトルと置き換えられる。
【0045】
以下に、コードベクトルを更新する際の動作例を、図14〜図18を用いて説明する。なお、ここでは、説明を簡単にするために、固定コードベクトルを4組とし、可変コードベクトル1組とする。また、これらの5組のコードベクトルは、二次元であるものとする。
【0046】
図14は、ある時点における符号器および復号器(図2を用いて後述する)の雑音符号帳111,126の状態を示す図である。図14に示したように、雑音符号帳111内の量子化テーブルには、固定コードベクトル0,1,2,3として(x,y)=(1,1),(1,2),(2,1),(2,2)が格納され、また、可変コードベクトル(x,y)=(−1,−1)が格納されている。
【0047】
図16は、図14に示した雑音符号帳111,126にそれぞれ格納された2次元コードベクトルの分布状態を示す図である。図16において、固定コードベクトル0〜3について入力信号に対して良好な相関を有しているものとすると、一般的には、可変コードベクトル4については良好な相関を有しているとはいえない。このため、この実施の形態では、上述のようにして、雑音符号帳更新回路118(図1参照)が、雑音符号帳111,126にそれぞれ格納された可変コードベクトル4を、より量子化誤差の少ないコードベクトルに更新する。ここでは、図17に示したように、この可変コードベクトル4を(−1,−1)から(a1 ,a2 )に更新したとする。更新後の可変コードベクトル4は、図14に示したように、雑音符号帳111に伝送されるとともに、多重化回路106および多重分離回路121を介して雑音符号帳126へも送られる。これにより、図15に示したように、復号器の雑音符号帳111,126内の可変コードベクトル4が、それぞれ、(−1,−1)から(a1 ,a2 )に更新される。
【0048】
このように、この実施の形態では、可変コードベクトル4を入力音声ベクトルs101に応じてリアルタイムに適切なベクトルに置き換え、さらに、更新後の可変コードベクトル4を復号器側に伝送し(後述するように変更フラグs123とともに伝送される)、復号器の雑音符号帳126も同様に更新することにより、予測誤差の少ない、より精度の高い符号化・復号化を行うことができる。
【0049】
さらに、この実施の形態では、更新されたコードベクトルを、無音フレームの剰余ビットを用いて伝送する。上述したように、伝送路の伝送容量が固定であった場合には、その伝送路を伝送する情報量が伝送容量よりも小さい場合であっても常に一定量の伝送路を占有してしまうこととなる。そして、伝送する情報が無音フレームであるときは、有音フレームを伝送する場合よりも情報量が少ないため、剰余ビットが生じる。この実施の形態では、この無音フレーム伝送時の剰余ビットを利用して、更新されたコードベクトルを符号器から復号器に伝送する。
【0050】
上述の図9に示したように、有音フレームを伝送するときの伝送容量と無音フレームを伝送するときの伝送容量とは同一であり、ともにTs ビットである。また、上述の図18に示したように、有音フレームを伝送する場合には、伝送容量と同じビット数の情報が伝送される(図18はTs =160の例を示している)。これに対して、無音フレームを伝送するときに必要な伝送容量はTr ビットであり(図9参照)、伝送容量Ts ビットよりも小さいため、Ts −Tr ビットの剰余ビット(空き容量)が生じる。この実施の形態では、このTs −Tr ビットの領域を用いて、各コードベクトル0,1,2,3,4を符号器から復号器に伝送するのである。
【0051】
次に、この実施の形態に係る復号器について説明する。
【0052】
図2に示したように、復号器は、入力端子122、多重分離回路121、ランダム雑音発生器123、ランダム雑音用ゲイン符号帳125、乗算器124、雑音符号帳126、雑音ゲイン符号帳130、乗算器127、ピッチ合成フィルタ128、ピッチラグ符号帳131、ピッチゲイン符号帳132、スイッチ129、LPC逆量子化部119、および合成フィルタ120から構成される。
【0053】
以下、図2に示した各ブロックの機能について説明する。
【0054】
多重分離回路121は、入力端子122を介して符号器から音声フレームを入力する。そして、このフレームの情報の一部である有音・無音フラグs102により、入力されたフレームが無音フレームであるのか或いは有音フレームであるのかを判断する。そして、このフレームが無音フレームである場合(すなわち、このフレーム内の情報がトータルコードs109である場合)には、このフレーム内の情報を有音・無音フラグ値s102、LPCインデックスs103、最適ゲインインデックスs119等に多重分離する。一方、入力されたフレームが有音フレームである場合(すなわち、このフレーム内の情報がトータルコードs110である場合)には、このフレーム内の情報を有音・無音フラグ値s102、LPCインデックスs103、最適ゲインインデックスs119、最適雑音コードインデックスs118、最適ピッチラグs121、最適ピッチゲインs122等に多重分離する。
【0055】
LPC逆量子化部119は、LPCインデックスs103を用いてLPC係数量子化値s104を計算する。
【0056】
スイッチ129は、多重分離回路121から入力した有音・無音フラグs102が有音フレームである場合は雑音符号帳126側へ倒され、無音フレームである場合はランダム雑音発生器123側へ倒される。
【0057】
雑音符号帳126は、雑音を表わすベクトル量のデータである雑音コードベクトルが格納される。また、更新用の雑音コードベクトルs117と更新フラグs123とを多重分離回路121から入力し、これらの情報s117,s123に基づいて、内部の量子化テーブルに格納された雑音コードベクトルを更新する。
【0058】
雑音ゲイン符号帳130は、雑音のゲインを表すスカラ量である、雑音ゲインを格納する。
【0059】
ピッチ合成フィルタ128は、人間の声帯に相当し、雑音(すなわち雑音コードベクトルs113)に周期性を与える。この繰り返し周期が声の高さ(ピッチ周期)に対応し、波形のピーク値が声の強さに対応する。
【0060】
ピッチラグ符号帳131は、ピッチ周期を表わすスカラ量のデータである、ピッチラグを格納する。
【0061】
ピッチゲイン符号帳132は、長期相関の度合を表わすスカラ量データである、ピッチゲインを格納する。
【0062】
ランダム雑音発生器123は、無声音源であり、ランダム雑音コードベクトルを格納する。
【0063】
ランダム雑音用ゲイン符号帳125は、ランダム雑音のゲインを表わすスカラ量のデータである、ランダム雑音ゲインs124を格納する。
【0064】
合成フィルタ120は、合成音ベクトルを生成する。この合成音ベクトルは、音韻を表わすスペクトル情報であり、この合成フィルタ120は人間の声道に相当する。
【0065】
次に、符号器および復号器の全体動作について説明する。
【0066】
最初に、符号器の全体動作について説明する。
【0067】
まず、上述のように、符号器のLPC分析・量子化部102が、フレーム単位で入力した入力音声ベクトルs101を用いてLPC係数量子化値s104およびLPCインデックスs103を算出し、合成フィルタ103および多重化回路106へ出力する。
【0068】
これと平行して、上述のように、有音・無音判定器101が、入力音声ベクトルs101をフレーム単位で入力して、かかるフレームが有音フレームであるのか或いは無音フレームであるのかを判定する。
【0069】
そして、かかるフレームを無音フレームと判定した場合には、この有音・無音判定器101は、有音・無音フラグを「無音」にセットして、このフラグ値s102を多重化回路106へ出力するとともに、スイッチ114をランダム雑音発生器108側へ倒す。続いて、ランダム雑音発生器108が、ランダム雑音コードベクトルs111を出力する。これと同時に、ランダム雑音用ゲイン符号帳110が、ランダム雑音ゲインs112(Cr〔i〕(i=1〜N))を出力する。積算器109は、ランダム雑音コードベクトルs111にランダム雑音ゲインs112を積算した結果を、スイッチ114を介して合成フィルタ103に送る。そして、この合成フィルタ103が、上述したような合成音ベクトルs105を生成する。加算器104は、入力音声ベクトルs101から合成音ベクトルs105を減算することにより、誤差ベクトルs107を算出する。重み付き誤差計算回路105は、この誤差ベクトルs107を用いて重み付き誤差Ewr〔i〕を算出した後、この重み付き誤差Ewr〔i〕を最小とするiを判定し、さらに、この判定結果を最適ゲインインデックスs119として多重化回路106に送る。そして、多重化回路106が、上述の有音・無音フラグs102、LPCインデックスs103および最適ゲインインデックスs119を多重化する。また、このとき、多重化回路106は、雑音符号帳更新回路118が生成した雑音コードベクトルs117および更新フラグs123も、併せて多重化する。そして、多重化されたデータは、トータルコードs109として伝送路へ出力される。なお、雑音符号帳更新回路118が雑音コードベクトルs117および更新フラグs123を生成する動作については、後述する。
【0070】
一方、有音・無音判定器101が入力音声ベクトルs101のフレームを有音フレームであると判定した場合には、この有音・無音判定器101は有音・無音フラグを「有音」にセットして、このフラグ値s102を多重化回路106へ出力するとともに、スイッチ114を雑音符号帳111側へ倒す。続いて、雑音符号帳111が、雑音コードベクトルs113(Cs〔j〕(j=1〜M))を出力する。雑音ゲイン符号帳115は、ゲインs114(Gs〔k〕(k=1〜X))を出力する。そして、積算器112が、雑音コードベクトルs113にゲインs114を積算した結果を、ピッチ合成フィルタ113に送る。また、ピッチラグ符号帳116は、ピッチラグs115(L〔m〕(m=1〜Y))をピッチ合成フィルタ113へ出力する。さらに、ピッチゲイン符号帳117は、ピッチゲインs116(b〔n〕(n=1〜Z))をピッチ合成フィルタ113へ出力する。そして、ピッチ合成フィルタ113が、上述のようにして雑音コードベクトルs113に周期性を与え、合成フィルタ103に送る。合成フィルタ103は、上述のようにして、合成音ベクトルs106(Ss〔j,k,m,n〕)を生成する。続いて、加算器104が、入力音声ベクトルs101から合成音ベクトルs106を減じることによって誤差ベクトルs108(Es〔j,k,m,n〕)を生成する。次に、重み付き誤差計算回路105が、重み付き誤差Ews〔j,k,m,n〕を算出した後で、この重み付き誤差Ews〔j,k,m,n〕が最小となるj,k,m,nの組合わせを判定する。そして、この判定の結果として得られた値jを最適雑音コードインデックスs118として雑音符号帳111に送り、判定結果として得られた値kを最適ゲインインデックスs119として雑音ゲイン符号帳115に送り、判定結果として得られた値mを最適ピッチラグs121としてピッチラグ符号帳116へ送り、さらに、判定結果として得られた値nを最適ピッチゲインs122としてピッチゲイン符号帳117に送る。また、これらのデータs118,s119,s121,s122は、多重化回路106へも送られる。その後、多重化回路106が、有音・無音フラグs102、LPCインデックスs103、最適雑音コードインデックスs118、最適ゲインインデックスs119、最適ピッチラグs121および最適ピッチゲインs122を多重化し、トータルコードs110として伝送路へ出力する。
【0071】
次に、雑音符号帳更新回路118を用いて雑音符号帳111の雑音コードベクトルを更新する動作について、図21のフローチャートを用いて説明する。
【0072】
まず、有音・無音判定器101により入力音声ベクトルs101のフレームが有音フレームであると判定された場合には(ステップs2101、s2102)、雑音符号帳更新回路118は、選択されたコードベクトルと入力音声ベクトルs101との相関を計算する(ステップs2103)。そして、この計算結果を、前回までの計算結果の積算値に、さらに積算する(ステップs2104)。これにより、入力音声ベクトルs101のフレームとして有音フレームが連続している場合には、各コードベクトルについての相関値を順次積算していくこととなる。
【0073】
一方、ステップs2101,s2102で入力音声ベクトルs101が無音フレームであると判定された場合には、続いて、前回の判定結果が有音フレームであったのか或いは無音フレームであったのか(すなわち更新用コードベクトルs117を搭載すべき無音フレームであるのか或いは搭載しないフレームであるのか)を判断する(s2105)。
【0074】
そして、更新用コードベクトルs117を搭載すべき無音フレームであると判断された場合は、前回の更新用コードベクトルs117の搭載から今回の無音フレームまでの間の各有音フレームにおいて選択回数が一番多かったコードベクトルを判定し、さらに、上述のステップs2104で得られた積算結果を用いて、更新用雑音コードベクトルs117を算出する(ステップs2106)。そして、更新フラグs123を、「更新」にセットする(ステップs2107)。続いて、更新用コードベクトルs117を、Ma 個の可変ベクトル中で最も古いベクトルと置き換えることにより、雑音符号帳111の雑音コードベクトルを更新する(ステップs2108)。また、これと同時に、更新用コードベクトルs117と更新フラグs123とは、多重化回路106に送られる。多重化回路106は、上述したように、無音フラグの剰余ビットを利用して、これらのデータs117,s123を、復号器側へ伝送する(スッテップs2109)。
【0075】
一方、ステップs2105で、更新用コードベクトルs117を搭載しない無音フレームであると判断された場合は、更新フラグを「無変更」にセットした後(s2210)、この更新フラグ値s123を多重化回路106に送る。この場合には、多重化回路106は、無音フラグの剰余ビットを利用して、この更新フラグ値s123を送る(ステップs2111)。
【0076】
図19は、更新用コードベクトルs117をフレームに搭載する場合と搭載しない場合の区分を説明するための概念図である。同図において、○印は更新用コードベクトルs117を搭載するフレームを示しており、×印は更新用コードベクトルs117を搭載しないフレームを示している。このように、無音フレームが連続する場合には、最初の無音フレームで更新コードベクトルs117と更新フラグ値s123とを伝送し、2番目以降の無音フレームでは更新フラグ値s123のみを伝送する。
【0077】
次に、復号器の全体動作について説明する。
【0078】
上述したようなトータルコードs109またはs110が入力端子122から入力されると、このトータルコードs109またはs110を多重分離回路121が多重分離する。
【0079】
そして、符号器から入力された有音・無音フラグs102が「有音」であった場合には、復号器は、以下のような動作を行う。
【0080】
まず、LPC逆量子化部119は、上述したように、多重分離回路121から入力されたLPCインデックスs103を用いて、LPC係数量子化値s104を計算する。また、スイッチ129は、有音・無音フラグs102によって雑音符号帳126側に倒される。次に、雑音符号帳126が、多重分離回路121から最適雑音コードインデックスs118を入力して、これに対応する雑音コードベクトルs126を出力する。また、雑音ゲイン符号帳130は、多重分離回路121から最適ゲインインデックスs119を入力し、これに対応する雑音ゲインs127を出力する。さらに、ピッチラグ符号帳131は、多重分離回路121から入力した最適ピッチラグs121に対応するピッチラグs128を、ピッチ合成フィルタ128へ出力する。同様に、ピッチゲイン符号帳132は、多重分離回路121から入力した最適ピッチゲインs122に対応するピッチゲインs129をピッチ合成フィルタ128へ出力する。雑音符号帳126が出力した雑音コードベクトルs126は、積算器127で雑音ゲインs127を積算された後、ピッチ合成フィルタ128で周期性を与えられ、スイッチ129を介して合成フィルタ120に入力される。そして、合成フィルタ120が、LPC逆量子化部119から入力したLPC係数量子化値s104とピッチ合成フィルタ128から入力した雑音コードベクトルs126とを用いて、合成音ベクトルを生成する。
【0081】
一方、符号器から入力された有音・無音フラグs102が「無音」であった場合には、復号器は、以下のような動作を行う。
【0082】
まず、LPC逆量子化部119は、上述したように、多重分離回路121から入力されたLPCインデックスs103を用いて、LPC係数量子化値s104を計算する。また、スイッチ129が、有音・無音フラグs102によって、ランダム雑音発生器123側へ倒される。ランダム雑音発生器123は、ランダム雑音コードベクトルs111を出力する。そして、ランダム雑音用ゲイン符号帳125が、多重分離回路121から最適ゲインインデックスs119を入力し、これに対応するランダム雑音ゲインs124を出力する。これにより、ランダム雑音コードベクトルs111は、積算器124で最適ゲインインデックスs119を積算された後、スイッチ129を介して合成フィルタ120に入力される。そして、合成フィルタ120が、LPC係数量子化値s104とランダム雑音コードベクトルs111とを用いて、合成音ベクトルを生成する。
【0083】
また、有音・無音フラグs102が「無音」である場合には、雑音符号帳126は、多重分離回路121から更新フラグ値s123を入力する。そして、この更新フラグ値s123が「更新」を示している場合には、続いて雑音コードベクトルs117を入力し、符号器の場合と同様にして雑音符号帳126の雑音コードベクトルを更新する。一方、更新フラグ値s123が「無変更」を示している場合は、雑音符号帳126は、雑音コードベクトルを更新しない。
【0084】
以上説明したように、この実施の形態によれば、雑音符号帳更新回路118を用いて符号器の雑音符号帳111および復号器の雑音符号帳126に格納された雑音コードベクトルを随時更新することとしたので、有音時の周波数特性をサンプル単位で向上させることができ、従って雑音感を向上させてノイズの低減をはかることができる。
【0085】
また、更新のための雑音コードベクトルs117を、無音フレームの剰余ビットを用いて符号器から復号器に送ることとしたので、伝送路を有効に利用することができ、全体としての伝送速度に影響を与えることがない。
【0086】
第2の実施の形態
次に、この発明の第2の実施の形態について説明する。この実施の形態は、雑音ゲイン符号帳に格納されたゲインコード(スカラ量)を更新する例である。
【0087】
図3は、この実施の形態にかかる符号器の構成を概念的に示している。
【0088】
同図に示したように、この符号器は、有音・無音判定器101、LPC分析・量子化部102、合成フィルタ103、加算器104、重み付き誤差計算回路105、多重化回路106、送信端子107、ランダム雑音発生器108、積算器109、ランダム雑音用ゲイン符号帳110、雑音符号帳211、積算器112、ピッチ合成フィルタ113、スイッチ114、雑音ゲイン符号帳215、ピッチラグ符号帳116、ピッチゲイン符号帳117および雑音ゲイン符号帳更新回路218の各ブロックから構成される。
【0089】
図3において、図1と同じ符号を付したブロックの機能は、図1の場合とほぼ同様であるので、説明を省略する。
【0090】
雑音符号帳211は、固定コードベクトルのみを格納しており、可変コードベクトルは格納されていない点で、図1の雑音符号帳111の場合(図10参照)と異なる。これは、この実施の形態では雑音符号帳211に格納されたコードベクトルの更新を行わないからである。
【0091】
雑音ゲイン符号帳215は、第1の実施の形態の場合と異なり、Xf 個の固定コードに加えて、Xa 個の可変コード(これらのコードはともにスカラ量である)も格納している。図11は、この雑音ゲイン符号帳215の量子化テーブルを示す概念図である。同図に示したように、X(=Xf +Xa )個あるコードベクトルGs[1]〜Gs[Xf +Xa ]のうち、Xf 個のコードベクトルGs[1]〜Gs[Xf ]は固定のベクトルであり、Xa 個のコードベクトルGs[Xf +1]〜Gs[Xf +Xa ]は可変のベクトルである。可変のベクトルGs[Xf +1]〜Gs[Xf +Xa ]は、ある初期値を有している。
【0092】
また、この実施の形態に係る符号器は、雑音ゲイン符号帳更新回路218を備えている。この雑音ゲイン符号帳更新回路218は、雑音ゲイン符号帳215の可変コードの更新を行う。更新用の新しいゲインコードs217を生成するための原理は、図1に示した雑音符号帳更新回路118の場合と同様である。すなわち、入力音声ベクトルs101の有音フレームの相関値を順次算出し、これらの相関値の積算値を用いて、新しいゲインコードs217を生成することができる。
【0093】
更新用ゲインコードs217を復号器に伝送する方法は、上述の第1の実施の形態の場合と同様である。すなわち、無音フレームをトータルコードs109として伝送する際に生じる(Ts−Tr)ビットの剰余ビットを利用して、更新用ゲインコード217および更新フラグ値s225を復号器に伝送する。
【0094】
以下、雑音ゲイン符号帳更新回路218を用いて雑音ゲイン符号帳215のゲインコードを更新する動作について、図22のフローチャートを用いて説明する。
【0095】
まず、有音・無音判定器101により入力音声ベクトルs101のフレームが有音フレームであると判定された場合には(ステップs2201、s2202)、雑音ゲイン符号帳更新回路218は、選択されたゲインコードと入力音声ベクトルs101との相関を計算する(ステップs2203)。そして、この計算結果を、前回までの計算結果の積算値に、さらに積算する(ステップs2204)。これにより、入力音声ベクトルs101のフレームとして有音フレームが連続している場合には、各ゲインコードについての相関値を順次積算していくこととなる。
【0096】
一方、ステップs2201,s2202で入力音声ベクトルs101が無音フレームであると判定された場合には、続いて、前回の判定結果が有音フレームであったのか或いは無音フレームであったのか(すなわち更新用ゲインコードs217を搭載すべき無音フレームであるのか或いは搭載しないフレームであるのか)を判断する(s2205)。そして、更新用ゲインコードs217を搭載すべき無音フレームであると判断された場合は、前回の更新用ゲインコードs217の搭載から今回の無音フレームまでの間の各有音フレームにおいて選択回数が一番多かったゲインコードを判定し、さらに、上述のステップs2204で得られた積算結果を用いて、更新用ゲインコードs217を算出する(ステップs2206)。そして、更新フラグs223を、「更新」にセットする(ステップs2207)。続いて、更新用ゲインコードs217を、Ma 個の可変ベクトル中で最も古いゲインコードと置き換えることにより、雑音ゲイン符号帳215のゲインコードを更新する(ステップs2208)。また、これと同時に、更新用の新しいゲインコードs217と更新フラグs223とは、多重化回路106に送られる。多重化回路106は、上述したように、無音フラグの剰余ビットを利用して、これらのデータs217,s223を、復号器側へ伝送する(スッテップs2209)。
【0097】
一方、ステップs2205で、更新用ゲインコードs217を搭載しない無音フレームであると判断された場合は、更新フラグを「無変更」にセットした後(ステップs2210)、この更新フラグ値s223を多重化回路106に送る。この場合には、多重化回路106は、無音フラグの剰余ビットを利用して、この更新フラグ値s223を送る(ステップs2211)。
【0098】
なお、他の構成要素の動作については、第1の実施の形態の場合とほぼ同様であるので、説明を省略する。但し、雑音符号帳211に格納されたコードベクトルの更新を行わない点で第1の実施の形態の場合と異なるのは、上述したとおりである。
【0099】
図4は、この実施の形態に係る復号器の構成を概念的に示している。同図に示したように、この復号器は、入力端子122、多重分離回路121、ランダム雑音発生器123、ランダム雑音用ゲイン符号帳125、乗算器124、雑音符号帳226、雑音ゲイン符号帳230、乗算器127、ピッチ合成フィルタ128、ピッチラグ符号帳131、ピッチゲイン符号帳132、スイッチ129、LPC逆量子化部119および合成フィルタ120から構成される。
【0100】
図4において、図2と同じ符号を付したブロックの機能は、図2の場合とほぼ同様であるので、説明を省略する。
【0101】
雑音符号帳226は、固定コードベクトルのみを格納しており、可変コードベクトルは格納されていない点で、図2の雑音符号帳126の場合と異なる。これは、この実施の形態では雑音符号帳226に格納されたコードベクトルの更新を行わないからである。
【0102】
雑音ゲイン符号帳230は、第1の実施の形態の場合と異なり、Xf 個の固定コードに加えて、Xa 個の可変コード(これらのコードはともにスカラ量である)も格納している。
【0103】
以下、復号器の動作について説明する。
【0104】
まず、多重分離回路121が、入力端子122からトータルコードs109またはs110を入力し、このトータルコードs109またはs110を多重分離する。
【0105】
そして、有音・無音フラグs102が「無音」である場合には、雑音ゲイン符号帳230が、多重分離回路121から更新フラグ値s223を入力する。そして、この更新フラグ値s223が「更新」を示している場合には、続いて雑音ゲインコードs217を入力し、符号器の場合と同様にして雑音ゲイン符号帳230のゲインコードを更新する。一方、更新フラグ値s223が「無変更」を示している場合には、雑音ゲイン符号帳230は、ゲインコードを更新しない。
【0106】
なお、他の構成要素の動作については、第1の実施の形態の場合とほぼ同様であるので、説明を省略する。但し、雑音符号帳226に格納されたコードベクトルの更新を行わない点で第1の実施の形態の場合と異なるのは、上述したとおりである。
【0107】
以上説明したように、この実施の形態によれば、雑音ゲイン符号帳更新回路218を用いて符号器の雑音ゲイン符号帳215および復号器の雑音ゲイン符号帳230に格納されたゲインコードを随時更新することとしたので、有音時の周波数特性をサンプル単位で向上させることができ、従って雑音感を向上させてノイズの低減をはかることができる。
【0108】
また、更新用ゲインコードs217を、無音フレームの剰余ビットを用いて符号器から復号器に送ることとしたので、伝送路を有効に利用することができ、全体としての伝送速度に影響を与えることがない。
【0109】
第3の実施の形態
次に、この発明の第3の実施の形態について説明する。この実施の形態は、ピッチラグ符号帳に格納されたピッチラグコード(スカラ量)を更新する例である。
【0110】
図5は、この実施の形態にかかる符号器の構成を概念的に示している。
【0111】
同図に示したように、この符号器は、有音・無音判定器101、LPC分析・量子化部102、合成フィルタ103、加算器104、重み付き誤差計算回路105、多重化回路106、送信端子107、ランダム雑音発生器108、積算器109、ランダム雑音用ゲイン符号帳110、雑音符号帳211、積算器112、ピッチ合成フィルタ113、スイッチ114、雑音ゲイン符号帳115、ピッチラグ符号帳316、ピッチゲイン符号帳117およびピッチラグ符号帳更新回路318の各ブロックから構成される。
【0112】
図5において、図1と同じ符号を付したブロックの機能は、図1の場合とほぼ同様であるので、説明を省略する。
【0113】
また、雑音符号帳211は、図3の場合と同様、固定コードベクトルのみを格納し、コードベクトルの更新は行われない。
【0114】
ピッチラグ符号帳316は、第1、第2の実施の形態の場合と異なり、Yf 個の固定コードに加えて、Ya 個の可変コード(これらのコードはともにスカラ量である)も格納している。図12は、このピッチラグ符号帳316の量子化テーブルを示す概念図である。同図に示したように、Y(=Yf +Ya )個あるコードベクトルL[1]〜L[Yf +Ya ]のうち、Yf 個のコードベクトルL[1]〜L[Yf ]は固定のベクトルであり、Ya 個のコードベクトルL[Yf +1]〜L[Yf +Ya ]は可変のベクトルである。可変のベクトルL[Yf +1]〜L[Yf +Ya ]は、ある初期値を有している。
【0115】
また、この実施の形態に係る符号器は、ピッチラグ符号帳更新回路318を備えている。このピッチラグ符号帳更新回路318は、ピッチラグ符号帳316の可変コードの更新を行う。更新用の新しいピッチラグコードs317を生成するための原理は、図1に示した雑音符号帳更新回路118の場合と同様である。すなわち、入力音声ベクトルs101の有音フレームの相関値を順次算出し、これらの相関値の積算値を用いて、新しいピッチラグコードs317を生成することができる。
【0116】
更新用ピッチラグコードs317を復号器に伝送する方法は、上述の第1の実施の形態の場合と同様である。すなわち、無音フレームをトータルコードs109として伝送する際に生じる(Ts−Tr)ビットの剰余ビットを利用して、更新用ピッチラグコードs317および更新フラグ値s223を復号器に伝送する。
【0117】
以下、ピッチラグ符号帳更新回路318を用いてピッチラグ符号帳316のピッチラグコードを更新する動作について、図23のフローチャートを用いて説明する。
【0118】
まず、有音・無音判定器101により入力音声ベクトルs101のフレームが有音フレームであると判定された場合には(ステップs2301、s2302)、ピッチラグ符号帳更新回路318は、選択されたピッチラグコードと入力音声ベクトルs101との長期的相関を計算する(ステップs2303)。そして、この計算結果を、前回までの計算結果の積算値に、さらに積算する(ステップs2304)。これにより、入力音声ベクトルs101のフレームとして有音フレームが連続している場合には、各ピッチラグコードについての相関値を順次積算していくこととなる。
【0119】
一方、ステップs2301,s2302で入力音声ベクトルs101が無音フレームであると判定された場合には、続いて、前回の判定結果が有音フレームであったのか或いは無音フレームであったのか(すなわち更新用ピッチラグコードs317を搭載すべき無音フレームであるのか或いは搭載しないフレームであるのか)を判断する(s2305)。そして、更新用ピッチラグコードs317を搭載すべき無音フレームであると判断された場合は、前回の更新用ピッチラグコードs317の搭載から今回の無音フレームまでの間の各有音フレームにおいて選択回数が一番多かったピッチラグコードを判定し、さらに、上述のステップs2304で得られた積算結果を用いて、更新用ピッチラグコードs317を算出する(ステップs2306)。そして、更新フラグs333を、「更新」にセットする(ステップs2307)。続いて、更新用ピッチラグコードs317を、Ma 個の可変ベクトル中で最も古いピッチラグコードと置き換えることにより、ピッチラグ符号帳316のピッチラグコードを更新する(ステップs2308)。また、これと同時に、更新用の新しいピッチラグコードs317と更新フラグs323とは、多重化回路106に送られる。多重化回路106は、上述したように、無音フラグの剰余ビットを利用して、これらのデータs317,s323を、復号器側へ伝送する(スッテップs2309)。
【0120】
一方、ステップs2305で、更新用ピッチラグコードs317を搭載しない無音フレームであると判断された場合は、更新フラグを「無変更」にセットした後(ステップs2310)、この更新フラグ値s323を多重化回路106に送る。この場合には、多重化回路106は、無音フラグの剰余ビットを利用して、この更新フラグ値s323を送る(ステップs2311)。
【0121】
なお、他の構成要素の動作については、第1,第2の実施の形態の場合とほぼ同様であるので、説明を省略する。但し、雑音符号帳211に格納されたコードベクトルおよび雑音ゲイン符号帳115に格納されたコードの更新は、行われない。
【0122】
図6は、この実施の形態に係る復号器の構成を概念的に示している。同図に示したように、この復号器は、入力端子122、多重分離回路121、ランダム雑音発生器123、ランダム雑音用ゲイン符号帳125、乗算器124、雑音符号帳226、雑音ゲイン符号帳130、乗算器127、ピッチ合成フィルタ128、ピッチラグ符号帳331、ピッチゲイン符号帳132、スイッチ129、LPC逆量子化部119および合成フィルタ120から構成される。
【0123】
図6において、図2と同じ符号を付したブロックの機能は、図2の場合とほぼ同様であるので、説明を省略する。
【0124】
雑音符号帳226は、固定コードベクトルのみを格納しており、可変コードベクトルは格納されていない点で、図2の雑音符号帳126の場合と異なる。これは、この実施の形態では雑音符号帳226に格納されたコードベクトルの更新を行わないからである。
【0125】
ピッチラグ符号帳331は、第1の実施の形態の場合と異なり、Yf 個の固定コードに加えて、Ya 個の可変コード(これらのコードはともにスカラ量である)も格納している。
【0126】
以下、復号器の動作について説明する。
【0127】
まず、多重分離回路121が、入力端子122からトータルコードs109またはs110を入力し、このトータルコードs109またはs110を多重分離する。
【0128】
そして、有音・無音フラグs102が「無音」である場合には、ピッチラグ符号帳331が、多重分離回路121から更新フラグ値s323を入力する。そして、この更新フラグ値s323が「更新」を示している場合には、続いてピッチラグコードs317を入力し、符号器の場合と同様にしてピッチラグ符号帳331のピッチラグコードを更新する。一方、更新フラグ値s323が「無変更」を示している場合は、ピッチラグ符号帳331は、ピッチラグコードを更新しない。
【0129】
なお、他の構成要素の動作については、第1の実施の形態の場合とほぼ同様であるので、説明を省略する。但し、雑音符号帳226に格納されたコードベクトルおよび雑音ゲイン符号帳130に格納されたゲインコードの更新は、行われない。
【0130】
以上説明したように、この実施の形態によれば、ピッチラグ符号帳更新回路318を用いて符号器のピッチラグ符号帳316および復号器のピッチラグ符号帳331に格納されたピッチラグコードs317を随時更新することとしたので、有音時の周波数特性をサンプル単位で向上させることができ、従って雑音感を向上させてノイズの低減をはかることができる。
【0131】
また、更新のためのピッチラグコードs317を、無音フレームの剰余ビットを用いて符号器から復号器に送ることとしたので、伝送路を有効に利用することができ、全体としての伝送速度に影響を与えることがない。
【0132】
第4の実施の形態
次に、この発明の第4の実施の形態について説明する。この実施の形態は、ピッチゲイン符号帳に格納されたピッチゲインコード(スカラ量)を更新する例である。
【0133】
図7は、この実施の形態にかかる符号器の構成を概念的に示している。
【0134】
同図に示したように、この符号器は、有音・無音判定器101、LPC分析・量子化部102、合成フィルタ103、加算器104、重み付き誤差計算回路105、多重化回路106、送信端子107、ランダム雑音発生器108、積算器109、ランダム雑音用ゲイン符号帳110、雑音符号帳211、積算器112、ピッチ合成フィルタ113、スイッチ114、雑音ゲイン符号帳115、ピッチラグ符号帳116、ピッチゲイン符号帳417およびピッチゲイン符号帳更新回路418の各ブロックから構成される。
【0135】
図7において、図1と同じ符号を付したブロックの機能は、図1の場合とほぼ同様であるので、説明を省略する。
【0136】
また、雑音符号帳211は、図3、図5の場合と同様、固定コードベクトルのみを格納し、コードベクトルの更新は行われない。
【0137】
ピッチゲイン符号帳417は、上述の各実施の形態の場合と異なり、Yf 個の固定コードに加えて、Ya 個の可変コード(これらのコードはともにスカラ量である)も格納している。図13は、このピッチゲイン符号帳417の量子化テーブルを示す概念図である。同図に示したように、Z(=Zf +Za )個あるコードベクトルb[1]〜b[Zf +Za ]のうち、Zf 個のコードベクトルb[1]〜b[Zf ]は固定のベクトルであり、Za 個のコードベクトルb[Zf +1]〜b[Zf +Za ]は可変のベクトルである。可変のベクトルb[Zf +1]〜b[Zf +Za ]は、ある初期値を有している。
【0138】
また、この実施の形態に係る符号器は、ピッチゲイン符号帳更新回路418を備えている。このピッチゲイン符号帳更新回路418は、ピッチゲイン符号帳417の可変コードの更新を行う。更新用の新しいピッチゲインコードs417を生成するための原理は、図1に示した雑音符号帳更新回路118の場合と同様である。すなわち、入力音声ベクトルs101の有音フレームの相関値を順次算出し、これらの相関値の積算値を用いて、新しいピッチゲインコードs417を生成することができる。
【0139】
更新用の新しいピッチゲインコードs417を復号器に伝送する方法は、上述の第1の実施の形態の場合と同様である。すなわち、無音フレームをトータルコードs109として伝送する際に生じる(Ts−Tr)ビットの剰余ビットを利用して、ピッチゲインコードs417および更新フラグ値s423を復号器に伝送する。
【0140】
以下、ピッチゲイン符号帳更新回路418を用いてピッチゲイン符号帳417のピッチゲインコードを更新する動作について、図24のフローチャートを用いて説明する。
【0141】
まず、有音・無音判定器101により入力音声ベクトルs101のフレームが有音フレームであると判定された場合には(ステップs2401、s2402)、ピッチゲイン符号帳更新回路418は、選択されたピッチゲインコードと入力音声ベクトルs101との長期的相関を計算する(ステップs2403)。そして、この計算結果を、前回までの計算結果の積算値に、さらに積算する(ステップs2404)。これにより、入力音声ベクトルs101のフレームとして有音フレームが連続している場合には、各ピッチゲインコードについての相関値を順次積算していくこととなる。
【0142】
一方、ステップs2401,s2402で入力音声ベクトルs101が無音フレームであると判定された場合には、続いて、前回の判定結果が有音フレームであったのか或いは無音フレームであったのか(すなわち更新用ピッチゲインコードs417を搭載すべき無音フレームであるのか或いは更新用ピッチゲインコードs417を搭載しないフレームであるのか)を判断する(s2405)。そして、更新用ピッチゲインコードs417を搭載すべき無音フレームであると判断された場合は、前回の更新用ピッチゲインコードs417の搭載から今回の無音フレームまでの間の各有音フレームにおいて選択回数が一番多かったピッチゲインコードを判定し、さらに、上述のステップs2404で得られた積算結果を用いて、更新用の新しいピッチゲインコードs417を算出する(ステップs2406)。そして、更新フラグs433を、「更新」にセットする(ステップs2407)。続いて、更新用ピッチゲインコードs417を、Ma 個の可変ベクトル中で最も古いピッチゲインコードと置き換えることにより、雑音ゲイン符号帳115のピッチゲインコードを更新する(ステップs2408)。また、これと同時に、更新用ピッチゲインコードs417と更新フラグs423とは、多重化回路106に送られる。多重化回路106は、上述したように、無音フラグの剰余ビットを利用して、これらのデータs417,s423を、復号器側へ伝送する(スッテップs2409)。
【0143】
一方、ステップs2405で、更新用ピッチゲインコードs417を搭載しない無音フレームであると判断された場合は、更新フラグを「無変更」にセットした後(ステップs2410)、この更新フラグ値s423を多重化回路106に送る。この場合には、多重化回路106は、無音フラグの剰余ビットを利用して、この更新フラグ値s423のみを送る(ステップs2411)。
【0144】
なお、他の構成要素の動作については、第1,第2の実施の形態の場合とほぼ同様であるので、説明を省略する。但し、雑音符号帳211に格納されたコードベクトルおよび雑音ゲイン符号帳115に格納されたコードの更新は、行われない。
【0145】
図8は、この実施の形態に係る復号器の構成を概念的に示している。同図に示したように、この復号器は、入力端子122、多重分離回路121、ランダム雑音発生器123、ランダム雑音用ゲイン符号帳125、乗算器124、雑音符号帳226、雑音ゲイン符号帳130、乗算器127、ピッチ合成フィルタ128、ピッチラグ符号帳131、ピッチゲイン符号帳432、スイッチ129、LPC逆量子化部119および合成フィルタ120から構成される。
【0146】
図8において、図2と同じ符号を付したブロックの機能は、図2の場合とほぼ同様であるので、説明を省略する。
【0147】
雑音符号帳226は、固定コードベクトルのみを格納しており、可変コードベクトルは格納されていない点で、図2の雑音符号帳126の場合と異なる。これは、この実施の形態では雑音符号帳226に格納されたコードベクトルの更新を行わないからである。
【0148】
ピッチゲイン符号帳432は、第1の実施の形態の場合と異なり、Zf 個の固定コードに加えて、Za 個の可変コード(これらのコードはともにスカラ量である)も格納している。
【0149】
以下、復号器の動作について説明する。
【0150】
まず、多重分離回路121が、入力端子122からトータルコードs109またはs110を入力し、このトータルコードs109またはs110を多重分離する。
【0151】
そして、有音・無音フラグs102が「無音」である場合には、ピッチゲイン符号帳432が、多重分離回路121から更新フラグ値s423を入力する。そして、この更新フラグ値s423が「更新」を示している場合には、続いてピッチゲインコードs417を入力し、符号器の場合と同様にしてピッチゲイン符号帳432のピッチゲインコードを更新する。一方、更新フラグ値s423が「無変更」を示している場合は、ピッチゲイン符号帳432は、ピッチゲインコードを更新しない。
【0152】
なお、他の構成要素の動作については、第1の実施の形態の場合とほぼ同様であるので、説明を省略する。但し、雑音符号帳226に格納されたコードベクトル、雑音ゲイン符号帳130に格納されたゲインコードおよびピッチラグ符号帳131に格納されたピッチラグコードの更新は、行われない。
【0153】
以上説明したように、この実施の形態によれば、ピッチゲイン符号帳更新回路418を用いて符号器のピッチゲイン符号帳417および復号器のピッチゲイン符号帳432に格納されたピッチゲインコードを随時更新することとしたので、有音時の周波数特性をサンプル単位で向上させることができ、従って雑音感を向上させてノイズの低減をはかることができる。
【0154】
また、更新のためのピッチゲインコードs417を、無音フレームの剰余ビットを用いて符号器から復号器に送ることとしたので、伝送路を有効に利用することができ、全体としての伝送速度に影響を与えることがない。
【0155】
なお、以上説明した各実施の形態において、更新用コード(雑音コードベクトルs117、ゲインコードs217、ピッチラグコードs317、ピッチゲインコードs417)の情報量が無音フレームの剰余ビットの容量よりも大きい場合には、複数の無音フレームに分けて伝送することとしてもよい。また、更新用コードを複数の無音フレームに分けて伝送する場合には、連続する2個以上の無音フレームに分けて伝送してもよいし、不連続の無音フレームに分けて伝送してもよい。さらに、更新用コードの伝送に使用する無音フレームを伝送路の特性や伝送情報の特性に応じて選択することとしてもよい。
【0156】
図20は、更新用コードの情報量が無音フレームの剰余ビットの容量よりも大きい場合に、かかる更新用コードを連続する2個の無音フレームに分けて伝送する方法の一例を示す図である。同図において、○印は更新用コードを搭載するフレームを示しており、×印は更新用コードを搭載しないフレームを示している。同図に示したように、無音フレームが連続しない場合には、この無音フレームで伝送できる更新用コードのみを伝送する。また、無音フレームが2個以上連続する場合には、最初の2個の無音フレームを用いて更新用コードを伝送する。更新用コードの伝送に使用しない無音フレームでは、図9の(Ts −Tr )ビットの領域で送られるのは、更新フラグs123,s223,s323,s423のみである。
【0157】
また、上述の各実施の形態で示したように、更新用コードはベクトル量であってもよいし、スカラ量であってもよい。
【0158】
この発明では、伝送路の種類は特に限定されることはなく、無線の伝送路であってもよいし、有線の伝送路であってよい。
【0159】
上述した各実施の形態では、更新用コードを無音フレームの剰余ビットを利用して伝送することとしたが、剰余ビットを用いずに更新用コードを送ることも可能である。
【0160】
また、上述した各実施の形態では、LPC分析・量子化部102としてCELP型のものを使用したが、他のタイプのもの、例えばパルス駆動型のもの、残差駆動型のもの、量子化テーブルを使用するもの等を使用することも可能である。
【0161】
【発明の効果】
このように、この発明によれば、有音情報の量子化に使用する量子化テーブルのコードを随時更新することとしたので、有音時の周波数特性をサンプル単位で向上させることができ、従って雑音感を向上させてノイズの低減を図ることができる。
【0162】
また、量子化テーブルのコードを更新するのための情報を、無音フレームの剰余ビットを用いて符号器から復号器に送ることとしたので、伝送路を有効に利用することができ、全体としての伝送速度に影響を与えることがない。
【図面の簡単な説明】
【図1】この発明の第1の実施の形態における音声信号の符号化装置のブロック図である。
【図2】この発明の第1の実施の形態における音声信号の復号化装置のブロック図である。
【図3】この発明の第2の実施の形態における音声信号の符号化装置のブロック図である。
【図4】この発明の第2の実施の形態における音声信号の復号化装置のブロック図である。
【図5】この発明の第3の実施の形態における音声信号の符号化装置のブロック図である。
【図6】この発明の第3の実施の形態における音声信号の復号化装置のブロック図である。
【図7】この発明の第4の実施の形態における音声信号の符号化装置のブロック図である。
【図8】この発明の第4の実施の形態における音声信号の復号化装置のブロック図である。
【図9】この発明の第1の実施の形態における有音・無音フレームの伝送方法の例を示す概念図である。
【図10】この発明の第1の実施の形態における雑音符号帳の量子化テーブルの構造を示す概念図である。
【図11】この発明の第2の実施の形態における雑音ゲイン符号帳の量子化テーブルの構造を示す概念図である。
【図12】この発明の第3の実施の形態におけるピッチラグ符号帳の量子化テーブルの構造を示す概念図である。
【図13】この発明の第4の実施の形態におけるピッチゲイン符号帳の量子化テーブルの構造を示す概念図である。
【図14】この発明の第1の実施の形態における伝送の原理を説明するための概念図である。
【図15】この発明の第1の実施の形態における伝送の原理を説明するための概念図である。
【図16】この発明の第1の実施の形態における雑音コードベクトルの更新の原理を説明するための分布図である。
【図17】この発明の第1の実施の形態における雑音コードベクトルの更新の原理を説明するための分布図である。
【図18】有音フレームの各パラメータのビット割り当て例を示す表である。
【図19】この発明の第1の実施の形態において、更新用のフレームを符号化装置から復号化装置に伝送する方法の一例を説明するための概念図である。
【図20】この発明において、更新用のフレームを符号化装置から復号化装置に伝送する方法の他の例を説明するための概念図である。
【図21】本発明の第1の実施の形態におけるコードベクトル更新方法を示すフローチャートである。
【図22】本発明の第2の実施の形態におけるコード更新方法を示すフローチャートである。
【図23】本発明の第3の実施の形態におけるコード更新方法を示すフローチャートである。
【図24】本発明の第4の実施の形態におけるコード更新方法を示すフローチャートである。
【符号の説明】
101・・・有音・無音判定器
102・・・LPC分析・量子化部
103・・・合成フィルタ
105・・・重み付き誤差計算回路
106・・・多重化回路
108・・・ランダム雑音発生器
110・・・ランダム雑音用ゲイン符号帳
113・・・ピッチ合成フィルタ
114・・・スイッチ
115・・・雑音ゲイン符号帳
116・・・ピッチラグ符号帳
117・・・ピッチゲイン符号帳
118・・・雑音符号帳更新回路
Claims (18)
- 送信側の符号化装置で符号化された音声ベクトルを受信側の復号化装置で復号化する音声通信システムであって、
前記符号化装置が、
外部から入力された入力音声ベクトルの特性に最も適合するコードを送信用量子化テーブルから選択することにより、有音時の符号化処理を行う送信用符号帳と、
前記送信用符号帳によって選択された前記コードと前記入力音声ベクトルとの相関値を求めるとともに前記コードごとに前記相関値の積算値を順次計算し、前記入力音声ベクトルが有音時のものから無音時のものに切り換わる度に前回の更新処理の後に行われた前記符号化処理で最も多く選択された前記コードを当該符号化処理のうち前記有音時の当該符号化処理のみを用いて判定し、この判定で得られた当該コードについての前記積算値を用いて更新用コードを生成し、この更新用コードを前記送信用符号帳の所望のコードと入れ替えることにより更新処理を行う符号帳更新回路と、
有音時には前記送信用符号帳で選択された最適コードの情報を送信情報に格納し、且つ、無音時には前記符号帳更新回路で生成された前記更新用コードを送信情報の剰余ビットに格納して送信する送信回路と、
を有し、且つ、
前記復号化装置が、
前記符号化装置から受信した情報から前記最適コードの情報または更新用コードを取り出す受信回路と、
前記最適コードの情報が取り出されたときは当該情報に対応するコードを受信用量子化テーブルから選択することによって入力音声ベクトルの有音時の復号化処理を行い、前記更新用コードが取り出されたときは当該更新用コードを所望の前記コードと入れ替えることにより更新処理を行う受信用符号帳と、
を有することを特徴とする音声通信システム。 - 前記符号帳更新回路および前記受信用符号帳が、前記コードのうち、前回入れ替えられてからの経過時間が最も長いコードを前記更新用コードと入れ替えることを特徴とする請求項1に記載の音声通信システム。
- 前記符号帳更新回路が前記更新用コードを生成したときに送信情報の更新フラグをセットし、且つ、前記受信用符号帳が受信情報の前記更新フラグがセットされているときに更新処理を行うことを特徴とする請求項1または2に記載の音声通信システム。
- 前記送信回路が多重化回路であり、且つ、前記受信回路が多重分離回路であることを特徴とする請求項1〜3のいずれかに記載の音声通信システム。
- 前記送信用量子化テーブルおよび前記受信用量子化テーブルが、前記符号帳更新回路によって更新することができない固定コードと前記符号帳更新回路によって更新することができる可変コードとを格納するテーブルであることを特徴とする請求項1〜4のいずれかに記載の音声通信システム。
- 前記送信用量子化テーブルおよび前記受信用量子化テーブルが、雑音を表わすベクトル量である雑音コードベクトルを格納するテーブルであることを特徴とする請求項1〜5のいずれかに記載の音声通信システム。
- 前記送信用量子化テーブルおよび前記受信用量子化テーブルが、雑音のゲインを表すスカラ量である雑音ゲインコードを格納するテーブルであることを特徴とする請求項1〜5のいずれかに記載の音声通信システム。
- 前記送信用量子化テーブルおよび前記受信用量子化テーブルが、音声のピッチ周期を表すスカラ量であるピッチラグコードを格納するテーブルであることを特徴とする請求項1〜5のいずれかに記載の音声通信システム。
- 前記送信用量子化テーブルおよび前記受信用量子化テーブルが、ピッチ周期の度合いを表すスカラ量であるピッチゲインコードを格納するテーブルであることを特徴とする請求項1〜5のいずれかに記載の音声通信システム。
- 送信処理で符号化された音声ベクトルを受信処理で復号化する音声通信方法であって、
前記送信処理が、
外部から入力された入力音声ベクトルの特性に最も適合するコードを送信用量子化テーブルから選択することにより、有音時の符号化処理を行う符号化過程と、
前記符号化過程によって選択された前記コードと前記入力音声ベクトルとの相関値を求めるとともに前記コードごとに前記相関値の積算値を順次計算し、前記入力音声ベクトルが有音時のものから無音時のものに切り換わる度に前回の更新処理の後に行われた前記符号化処理で最も多く選択された前記コードを当該符号化処理のうち前記有音時の当該符号化処理のみを用いて判定し、この判定で得られた当該コードについての前記積算値を用いて更新用コードを生成し、この更新用コードを前記送信用量子化テーブルの所望のコードと入れ替えることにより更新処理を行う送信側更新過程と、
有音時には前記符号化過程で選択された最適コードの情報を送信情報に格納し、且つ、無音時には前記送信側更新過程で生成された前記更新用コードを送信情報の剰余ビットに格納して送信する送信過程と、
を有し、且つ、
前記受信処理が、
前記符号化装置から受信した情報から前記最適コードの情報または更新用コードを取り出す受信過程と、
前記最適コードの情報が取り出されたときに、当該情報に対応するコードを受信用量子化テーブルから選択することによって入力音声ベクトルの有音時の復号化を行う復合化過程と、
前記更新用コードが取り出されたときは当該更新用コードを所望の前記コードと入れ替える受信側更新過程と、
を有することを特徴とする音声通信方法。 - 前記送信側更新過程および前記受信側更新過程が、前記コードのうち、前回入れ替えられてからの経過時間が最も長いコードを前記更新用コードと入れ替えることを特徴とする請求項10に記載の音声通信方法。
- 前記送信側更新過程が前記更新用コードを生成したときに送信情報の更新フラグをセットし、且つ、前記受信側更新過程が受信情報の前記更新フラグがセットされているときに更新を行うことを特徴とする請求項10または11に記載の音声通信方法。
- 前記送信過程が多重化処理を含み、且つ、前記受信過程が多重分離処理を含むことを特徴とする請求項10〜12のいずれかに記載の音声通信方法。
- 前記送信用量子化テーブルおよび前記受信用量子化テーブルが、前記符号帳更新回路によって更新することができない固定コードと前記符号帳更新回路によって更新することができる可変コードとを格納するテーブルであることを特徴とする請求項10〜13のいずれかに記載の音声通信方法。
- 前記送信用量子化テーブルおよび前記受信用量子化テーブルが、雑音を表わすベクトル量である雑音コードベクトルを格納するテーブルであることを特徴とする請求項10〜13のいずれかに記載の音声通信方法。
- 前記送信用量子化テーブルおよび前記受信用量子化テーブルが、雑音のゲインを表すスカラ量である雑音ゲインコードを格納するテーブルであることを特徴とする請求項10〜13のいずれかに記載の音声通信方法。
- 前記送信用量子化テーブルおよび前記受信用量子化テーブルが、音声のピッチ周期を表すスカラ量であるピッチラグコードを格納するテーブルであることを特徴とする請求項10〜13のいずれかに記載の音声通信方法。
- 前記送信用量子化テーブルおよび前記受信用量子化テーブルが、ピッチ周期の度合いを表すスカラ量であるピッチゲインコードを格納するテーブルであることを特徴とする請求項10〜13のいずれかに記載の音声通信方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP31859897A JP3575967B2 (ja) | 1996-12-02 | 1997-11-19 | 音声通信システムおよび音声通信方法 |
US08/978,353 US5974375A (en) | 1996-12-02 | 1997-11-25 | Coding device and decoding device of speech signal, coding method and decoding method |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP8-321314 | 1996-12-02 | ||
JP32131496 | 1996-12-02 | ||
JP31859897A JP3575967B2 (ja) | 1996-12-02 | 1997-11-19 | 音声通信システムおよび音声通信方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH10222195A JPH10222195A (ja) | 1998-08-21 |
JP3575967B2 true JP3575967B2 (ja) | 2004-10-13 |
Family
ID=26569423
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP31859897A Expired - Lifetime JP3575967B2 (ja) | 1996-12-02 | 1997-11-19 | 音声通信システムおよび音声通信方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US5974375A (ja) |
JP (1) | JP3575967B2 (ja) |
Families Citing this family (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100205251B1 (ko) * | 1996-12-09 | 1999-07-01 | 정선종 | 코드분할 다중접속 기지국에서의 음성 부호화 장치 및 방법 |
US6240386B1 (en) * | 1998-08-24 | 2001-05-29 | Conexant Systems, Inc. | Speech codec employing noise classification for noise compensation |
US6449590B1 (en) * | 1998-08-24 | 2002-09-10 | Conexant Systems, Inc. | Speech encoder using warping in long term preprocessing |
US7072832B1 (en) | 1998-08-24 | 2006-07-04 | Mindspeed Technologies, Inc. | System for speech encoding having an adaptive encoding arrangement |
MY141074A (en) * | 1998-11-24 | 2010-03-15 | Ericsson Telefon Ab L M | Efficient in-band signaling for discontinuous transmission and configuration changes in adaptive multi-rate communications systems |
US6226607B1 (en) * | 1999-02-08 | 2001-05-01 | Qualcomm Incorporated | Method and apparatus for eighth-rate random number generation for speech coders |
US6278478B1 (en) * | 1999-03-18 | 2001-08-21 | Microsoft Corporation | End-to-end network encoding architecture |
JP4464484B2 (ja) * | 1999-06-15 | 2010-05-19 | パナソニック株式会社 | 雑音信号符号化装置および音声信号符号化装置 |
US6959274B1 (en) * | 1999-09-22 | 2005-10-25 | Mindspeed Technologies, Inc. | Fixed rate speech compression system and method |
CN1192355C (zh) * | 1999-11-16 | 2005-03-09 | 皇家菲利浦电子有限公司 | 宽带音频传输系统 |
KR20060066483A (ko) * | 2004-12-13 | 2006-06-16 | 엘지전자 주식회사 | 음성 인식을 위한 특징 벡터 추출 방법 |
US20090048827A1 (en) * | 2007-08-17 | 2009-02-19 | Manoj Kumar | Method and system for audio frame estimation |
US8515747B2 (en) * | 2008-09-06 | 2013-08-20 | Huawei Technologies Co., Ltd. | Spectrum harmonic/noise sharpness control |
WO2010028297A1 (en) | 2008-09-06 | 2010-03-11 | GH Innovation, Inc. | Selective bandwidth extension |
US8532983B2 (en) * | 2008-09-06 | 2013-09-10 | Huawei Technologies Co., Ltd. | Adaptive frequency prediction for encoding or decoding an audio signal |
US8407046B2 (en) * | 2008-09-06 | 2013-03-26 | Huawei Technologies Co., Ltd. | Noise-feedback for spectral envelope quantization |
US8577673B2 (en) * | 2008-09-15 | 2013-11-05 | Huawei Technologies Co., Ltd. | CELP post-processing for music signals |
WO2010031003A1 (en) * | 2008-09-15 | 2010-03-18 | Huawei Technologies Co., Ltd. | Adding second enhancement layer to celp based core layer |
CN101599272B (zh) * | 2008-12-30 | 2011-06-08 | 华为技术有限公司 | 基音搜索方法及装置 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5276765A (en) * | 1988-03-11 | 1994-01-04 | British Telecommunications Public Limited Company | Voice activity detection |
US5509102A (en) * | 1992-07-01 | 1996-04-16 | Kokusai Electric Co., Ltd. | Voice encoder using a voice activity detector |
JP3182032B2 (ja) * | 1993-12-10 | 2001-07-03 | 株式会社日立国際電気 | 音声符号化通信方式及びその装置 |
CA2154911C (en) * | 1994-08-02 | 2001-01-02 | Kazunori Ozawa | Speech coding device |
FR2739995B1 (fr) * | 1995-10-13 | 1997-12-12 | Massaloux Dominique | Procede et dispositif de creation d'un bruit de confort dans un systeme de transmission numerique de parole |
US5689615A (en) * | 1996-01-22 | 1997-11-18 | Rockwell International Corporation | Usage of voice activity detection for efficient coding of speech |
-
1997
- 1997-11-19 JP JP31859897A patent/JP3575967B2/ja not_active Expired - Lifetime
- 1997-11-25 US US08/978,353 patent/US5974375A/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US5974375A (en) | 1999-10-26 |
JPH10222195A (ja) | 1998-08-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3575967B2 (ja) | 音声通信システムおよび音声通信方法 | |
FI118396B (fi) | Algebrallinen koodikirja signaalin avulla valituin pulssiamplitudein puheen nopeata koodausta varten | |
RU2262748C2 (ru) | Многорежимное устройство кодирования | |
EP0764941B1 (en) | Speech signal quantization using human auditory models in predictive coding systems | |
KR100357254B1 (ko) | 음성수치 전송시스템내의 쾌적잡음 생성방법및 장치 | |
CN1244907C (zh) | 宽带语音编解码器中的高频增强层编码方法和装置 | |
EP0764939B1 (en) | Synthesis of speech signals in the absence of coded parameters | |
US8396706B2 (en) | Speech coding | |
JPH09152895A (ja) | 合成フィルタの周波数応答に基づく知覚ノイズマスキング測定法 | |
WO2004097796A1 (ja) | 音声符号化装置、音声復号化装置及びこれらの方法 | |
KR20020052191A (ko) | 음성 분류를 이용한 음성의 가변 비트 속도 켈프 코딩 방법 | |
GB2466669A (en) | Encoding speech for transmission over a transmission medium taking into account pitch lag | |
JP4445328B2 (ja) | 音声・楽音復号化装置および音声・楽音復号化方法 | |
JP2005241761A (ja) | 通信装置及び信号符号化/復号化方法 | |
KR20010022714A (ko) | 음성 부호화 장치 및 음성 복호화 장치 | |
KR100421648B1 (ko) | 음성코딩을 위한 적응성 표준 | |
KR101610765B1 (ko) | 음성 신호의 부호화/복호화 방법 및 장치 | |
WO1997015046A9 (en) | Repetitive sound compression system | |
EP0856185A1 (en) | Repetitive sound compression system | |
WO1994025959A1 (en) | Use of an auditory model to improve quality or lower the bit rate of speech synthesis systems | |
CA2293165A1 (en) | Method for transmitting data in wireless speech channels | |
JPH11504733A (ja) | 聴覚モデルによる量子化を伴う予測残余信号の変形符号化による多段音声符号器 | |
WO2003001172A1 (en) | Method and device for coding speech in analysis-by-synthesis speech coders | |
JPH11259098A (ja) | 音声符号化/復号化方法 | |
RU2343564C2 (ru) | Способ адаптивного кодирования речевых сигналов на основе системы с переменной структурой |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20040706 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20040706 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080716 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090716 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100716 Year of fee payment: 6 |