JP3653826B2 - 音声復号化方法及び装置 - Google Patents

音声復号化方法及び装置 Download PDF

Info

Publication number
JP3653826B2
JP3653826B2 JP27948995A JP27948995A JP3653826B2 JP 3653826 B2 JP3653826 B2 JP 3653826B2 JP 27948995 A JP27948995 A JP 27948995A JP 27948995 A JP27948995 A JP 27948995A JP 3653826 B2 JP3653826 B2 JP 3653826B2
Authority
JP
Japan
Prior art keywords
filter
gain
noise
lpc
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP27948995A
Other languages
English (en)
Other versions
JPH09127996A (ja
Inventor
正之 西口
和幸 飯島
淳 松本
士郎 大森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP27948995A priority Critical patent/JP3653826B2/ja
Priority to US08/736,342 priority patent/US5752222A/en
Priority to ES96307724T priority patent/ES2165960T3/es
Priority to DE69618422T priority patent/DE69618422T2/de
Priority to EP96307724A priority patent/EP0770988B1/en
Priority to KR1019960048691A priority patent/KR100421816B1/ko
Publication of JPH09127996A publication Critical patent/JPH09127996A/ja
Application granted granted Critical
Publication of JP3653826B2 publication Critical patent/JP3653826B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering

Description

【0001】
【発明の属する技術分野】
本発明は、符号化された音声信号を復号化した後にポストフィルタ処理を施すような音声復号化方法及び装置に関する。
【0002】
【従来の技術】
オーディオ信号(音声信号や音響信号を含む)の時間領域や周波数領域における統計的性質と人間の聴感上の特性を利用して信号圧縮を行うような符号化方法が種々知られている。この符号化方法としては、大別して時間領域での符号化、周波数領域での符号化、分析合成符号化等が挙げられる。
【0003】
音声信号等の高能率符号化の例として、ハーモニック(Harmonic)符号化、MBE(Multiband Excitation: マルチバンド励起)符号化等のサイン波分析符号化や、SBC(Sub-band Coding:帯域分割符号化)、LPC(Linear Predictive Coding: 線形予測符号化)、あるいはDCT(離散コサイン変換)、MDCT(モデファイドDCT)、FFT(高速フーリエ変換)等が知られている。
【0004】
このような符号化が施された信号を復号化した後に、スペクトル整形及び聴感上の品質向上のため等にポストフィルタが用いられることがある。
【0005】
【発明が解決しようとする課題】
ところで、このようなポストフィルタにおいて、入力に応じて特性を更新する場合に、更新周期が長いと短時間の音声スペクトルの変化にポストフィルタ特性が追従できず、滑らかで良好な品質改善が行えない。また更新周期が短いとレベル変化が激しくなり、クリックノイズを発生する等の欠点がある。
【0006】
本発明は、このような実情に鑑みてなされたものであり、少ないビット数の音声符号化復号化に用いた場合でも比較的良好な復号出力を得ることができ、高品質の再生音が得られるような音声復号化方法の提供を目的とする。
【0007】
【課題を解決するための手段】
本発明は、符号化された音声信号が復号化されて供給されるスペクトル整形フィルタのフィルタ係数を第1の周期で更新するようにし、このスペクトル整形によるゲイン変化を補正するためのゲイン調整のゲインを第1の周期とは異なる第2の周期で更新することにより、上述した課題を解決する。
【0008】
この場合、スペクトル整形フィルタのフィルタ係数の更新周期である第1の周期を短くし、ゲイン調整のゲイン更新周期である第2の周期を長くすることにより、追従速度が速く滑らかに変化してゆくフィルタ係数の切換を行うと共に、頻繁なゲイン切換によるレベル変動を抑えることができる。
【0009】
【発明の実施の形態】
本発明に係る音声復号化方法は、音声コーデックのデコーダに用いられるポストフィルタのスペクトル整形フィルタのフィルタ係数の更新周期と、スペクトル整形によるゲイン変化を補正するためのゲイン調整用のゲイン値の更新周期とを異ならせ、特に、スペクトル整形フィルタ更新周期よりもゲイン調整用のゲイン値の更新周期を長くすることにより、より効果的なポストフィルタ処理を可能とするものである。
【0010】
これは、ポストフィルタ内のスペクトル整形フィルタのフィルタ係数の更新周期が長いと短時間の音声スペクトルの変化にポストフィルタ特性が追従できずに出力音声が劣化することがある点を考慮し、フィルタ係数を短い周期で更新することが考えられるが、これに応じてゲイン調整用のゲイン値も短い周期で更新させると、ピッチ、ピークの位相の関係から1ピッチの期間内でゲイン値が大きく変動することがあり、クリックノイズを発生することがある。そこで、フィルタ係数の更新周期は短くし、ゲイン調整用のゲイン値の更新周期を長くすることにより、ゲイン変動を抑え、良好なポストフィルタ処理を実現するわけである。
【0011】
ここで、本発明の実施の形態の説明に先立って、本発明が適用される音声コーデックの一例となる音声符号化装置及び復号化装置について、図面を参照しながら説明する。
【0012】
先ず、図1は、音声符号化装置の基本構成を示している。
【0013】
ここで、図1の音声符号化装置の基本的な考え方は、入力音声信号の短期予測残差例えばLPC(線形予測符号化)残差を求めてサイン波分析(sinusoidal analysis )符号化、例えばハーモニックコーディング(harmonic coding )を行う第1の符号化部110と、入力音声信号に対して位相伝送を行う波形符号化により符号化する第2の符号化部120とを有し、入力信号の有声音(V:Voiced)の部分の符号化に第1の符号化部110を用い、入力信号の無声音(UV:Unvoiced)の部分の符号化には第2の符号化部120を用いるようにすることである。
【0014】
上記第1の符号化部110には、例えばLPC残差をハーモニック符号化やマルチバンド励起(MBE)符号化のようなサイン波分析符号化を行う構成が用いられる。上記第2の符号化部120には、例えば合成による分析法を用いて最適ベクトルのクローズドループサーチによるベクトル量子化を用いた符号励起線形予測(CELP)符号化の構成が用いられる。
【0015】
図1の例では、入力端子101に供給された音声信号が、第1の符号化部110のLPC逆フィルタ111及びLPC分析・量子化部113に送られている。LPC分析・量子化部113から得られたLPC係数あるいはいわゆるαパラメータは、LPC逆フィルタ111に送られて、このLPC逆フィルタ111により入力音声信号の線形予測残差(LPC残差)が取り出される。また、LPC分析・量子化部113からは、後述するようにLSP(線スペクトル対)の量子化出力が取り出され、これが出力端子102に送られる。LPC逆フィルタ111からのLPC残差は、サイン波分析符号化部114に送られる。サイン波分析符号化部114では、ピッチ検出やスペクトルエンベロープ振幅計算が行われると共に、V(有声音)/UV(無声音)判定部115によりV/UVの判定が行われる。サイン波分析符号化部114からのスペクトルエンベロープ振幅データがベクトル量子化部116に送られる。スペクトルエンベロープのベクトル量子化出力としてのベクトル量子化部116からのコードブックインデクスは、スイッチ117を介して出力端子103に送られ、サイン波分析符号化部114からの出力は、スイッチ118を介して出力端子104に送られる。また、V/UV判定部115からのV/UV判定出力は、出力端子105に送られると共に、スイッチ117、118の制御信号として送られており、上述した有声音(V)のとき上記インデクス及びピッチが選択されて各出力端子103及び104からそれぞれ取り出される。
【0016】
図1の第2の符号化部120は、この例ではCELP(符号励起線形予測)符号化構成を有しており、雑音符号帳121からの出力を、重み付きの合成フィルタ122により合成処理し、得られた重み付き音声を減算器123に送り、入力端子101に供給された音声信号を聴覚重み付けフィルタ125を介して得られた音声との誤差を取り出し、この誤差を距離計算回路124に送って距離計算を行い、誤差が最小となるようなベクトルを雑音符号帳121でサーチするような、合成による分析(Analysis by Synthesis )法を用いたクローズドループサーチを用いた時間軸波形のベクトル量子化を行っている。このCELP符号化は、上述したように無声音部分の符号化に用いられており、雑音符号帳121からのUVデータとしてのコードブックインデクスは、上記V/UV判定部115からのV/UV判定結果が無声音(UV)のときオンとなるスイッチ127を介して、出力端子107より取り出される。
【0017】
次に、図2は、本発明に係る音声復号化方法が適用される音声復号化装置として、上記図1の音声符号化装置に対応する音声復号化装置の基本構成を示すブロック図である。
【0018】
この図2において、入力端子202には上記図1の出力端子102からの上記LSP(線スペクトル対)の量子化出力としてのコードブックインデクスが入力される。入力端子203、204、及び205には、上記図1の各出力端子103、104、及び105からの各出力、すなわちエンベロープ量子化出力としてのインデクス、ピッチ、及びV/UV判定出力がそれぞれ入力される。また、入力端子207には、上記図1の出力端子107からのUV(無声音)用のデータとしてのインデクスが入力される。
【0019】
入力端子203からのエンベロープ量子化出力としてのインデクスは、逆ベクトル量子化器212に送られて逆ベクトル量子化され、LPC残差のスペクトルエンベロープが求められて有声音合成部211に送られる。有声音合成部211は、サイン波合成により有声音部分のLPC(線形予測符号化)残差を合成するものであり、この有声音合成部211には入力端子204及び205からのピッチ及びV/UV判定出力も供給されている。有声音合成部211からの有声音のLPC残差は、LPC合成フィルタ214に送られる。また、入力端子207からのUVデータのインデクスは、無声音合成部220に送られて、雑音符号帳を参照することにより無声音部分のLPC残差が取り出される。このLPC残差もLPC合成フィルタ214に送られる。LPC合成フィルタ214では、上記有声音部分のLPC残差と無声音部分のLPC残差とがそれぞれ独立に、LPC合成処理が施される。あるいは、有声音部分のLPC残差と無声音部分のLPC残差とが加算されたものに対してLPC合成処理を施すようにしてもよい。ここで入力端子202からのLSPのインデクスは、LPCパラメータ再生部213に送られて、LPCのαパラメータが取り出され、これがLPC合成フィルタ214に送られる。LPC合成フィルタ214によりLPC合成されて得られた音声信号は、出力端子201より取り出される。
【0020】
次に、上記図1に示した音声信号符号化装置のより具体的な構成について、図3を参照しながら説明する。なお、図3において、上記図1の各部と対応する部分には同じ指示符号を付している。
【0021】
この図3に示された音声信号符号化装置において、入力端子101に供給された音声信号は、ハイパスフィルタ(HPF)109にて不要な帯域の信号を除去するフィルタ処理が施された後、LPC(線形予測符号化)分析・量子化部113のLPC分析回路132と、LPC逆フィルタ回路111とに送られる。
【0022】
LPC分析・量子化部113のLPC分析回路132は、入力信号波形の256サンプル程度の長さを1ブロックとしてハミング窓をかけて、自己相関法により線形予測係数、いわゆるαパラメータを求める。データ出力の単位となるフレーミングの間隔は、160サンプル程度とする。サンプリング周波数fsが例えば8kHzのとき、1フレーム間隔は160サンプルで20msec となる。
【0023】
LPC分析回路132からのαパラメータは、α→LSP変換回路133に送られて、線スペクトル対(LSP)パラメータに変換される。これは、直接型のフィルタ係数として求まったαパラメータを、例えば10個、すなわち5対のLSPパラメータに変換する。変換は例えばニュートン−ラプソン法等を用いて行う。このLSPパラメータに変換するのは、αパラメータよりも補間特性に優れているからである。
【0024】
α→LSP変換回路133からのLSPパラメータは、LSP量子化器134によりマトリクスあるいはベクトル量子化される。このとき、フレーム間差分をとってからベクトル量子化してもよく、複数フレーム分をまとめてマトリクス量子化してもよい。ここでは、20msec を1フレームとし、20msec 毎に算出されるLSPパラメータを2フレーム分まとめて、マトリクス量子化及びベクトル量子化している。
【0025】
このLSP量子化器134からの量子化出力、すなわちLSP量子化のインデクスは、端子102を介して取り出され、また量子化済みのLSPベクトルは、LSP補間回路136に送られる。
【0026】
LSP補間回路136は、上記20msec あるいは40msec 毎に量子化されたLSPのベクトルを補間し、8倍のレートにする。すなわち、2.5msec 毎にLSPベクトルが更新されるようにする。これは、残差波形をハーモニック符号化復号化方法により分析合成すると、その合成波形のエンベロープは非常になだらかでスムーズな波形になるため、LPC係数が20msec 毎に急激に変化すると異音を発生することがあるからである。すなわち、2.5msec 毎にLPC係数が徐々に変化してゆくようにすれば、このような異音の発生を防ぐことができる。
【0027】
このような補間が行われた2.5msec 毎のLSPベクトルを用いて入力音声の逆フィルタリングを実行するために、LSP→α変換回路137により、LSPパラメータを例えば10次程度の直接型フィルタの係数であるαパラメータに変換する。このLSP→α変換回路137からの出力は、上記LPC逆フィルタ回路111に送られ、このLPC逆フィルタ111では、2.5msec 毎に更新されるαパラメータにより逆フィルタリング処理を行って、滑らかな出力を得るようにしている。このLPC逆フィルタ111からの出力は、サイン波分析符号化部114、具体的には例えばハーモニック符号化回路、の直交変換回路145、例えばDFT(離散フーリエ変換)回路に送られる。
【0028】
LPC分析・量子化部113のLPC分析回路132からのαパラメータは、聴覚重み付けフィルタ算出回路139に送られて聴覚重み付けのためのデータが求められ、この重み付けデータが後述する聴覚重み付きのベクトル量子化器116と、第2の符号化部120の聴覚重み付けフィルタ125及び聴覚重み付きの合成フィルタ122とに送られる。
【0029】
ハーモニック符号化回路等のサイン波分析符号化部114では、LPC逆フィルタ111からの出力を、ハーモニック符号化の方法で分析する。すなわち、ピッチ検出、各ハーモニクスの振幅Amの算出、有声音(V)/無声音(UV)の判別を行い、ピッチによって変化するハーモニクスのエンベロープあるいは振幅Amの個数を次元変換して一定数にしている。
【0030】
図3に示すサイン波分析符号化部114の具体例においては、一般のハーモニック符号化を想定しているが、特に、MBE(Multiband Excitation: マルチバンド励起)符号化の場合には、同時刻(同じブロックあるいはフレーム内)の周波数軸領域いわゆるバンド毎に有声音(Voiced)部分と無声音(Unvoiced)部分とが存在するという仮定でモデル化することになる。それ以外のハーモニック符号化では、1ブロックあるいはフレーム内の音声が有声音か無声音かの択一的な判定がなされることになる。なお、以下の説明中のフレーム毎のV/UVとは、MBE符号化に適用した場合には全バンドがUVのときを当該フレームのUVとしている。
【0031】
図3のサイン波分析符号化部114のオープンループピッチサーチ部141には、上記入力端子101からの入力音声信号が、またゼロクロスカウンタ142には、上記HPF(ハイパスフィルタ)109からの信号がそれぞれ供給されている。サイン波分析符号化部114の直交変換回路145には、LPC逆フィルタ111からのLPC残差あるいは線形予測残差が供給されている。オープンループピッチサーチ部141では、入力信号のLPC残差をとってオープンループによる比較的ラフなピッチのサーチが行われ、抽出された粗ピッチデータは高精度ピッチサーチ146に送られて、後述するようなクローズドループによる高精度のピッチサーチ(ピッチのファインサーチ)が行われる。また、オープンループピッチサーチ部141からは、上記粗ピッチデータと共にLPC残差の自己相関の最大値をパワーで正規化した正規化自己相関最大値r(p) が取り出され、V/UV(有声音/無声音)判定部115に送られている。
【0032】
直交変換回路145では例えばDFT(離散フーリエ変換)等の直交変換処理が施されて、時間軸上のLPC残差が周波数軸上のスペクトル振幅データに変換される。この直交変換回路145からの出力は、高精度ピッチサーチ部146及びスペクトル振幅あるいはエンベロープを評価するためのスペクトル評価部148に送られる。
【0033】
高精度(ファイン)ピッチサーチ部146には、オープンループピッチサーチ部141で抽出された比較的ラフな粗ピッチデータと、直交変換部145により例えばDFTされた周波数軸上のデータとが供給されている。この高精度ピッチサーチ部146では、上記粗ピッチデータ値を中心に、0.2〜0.5きざみで±数サンプルずつ振って、最適な小数点付き(フローティング)のファインピッチデータの値へ追い込む。このときのファインサーチの手法として、いわゆる合成による分析 (Analysis by Synthesis)法を用い、合成されたパワースペクトルが原音のパワースペクトルに最も近くなるようにピッチを選んでいる。このようなクローズドループによる高精度のピッチサーチ部146からのピッチデータについては、スイッチ118を介して出力端子104に送っている。
【0034】
スペクトル評価部148では、LPC残差の直交変換出力としてのスペクトル振幅及びピッチに基づいて各ハーモニクスの大きさ及びその集合であるスペクトルエンベロープが評価され、高精度ピッチサーチ部146、V/UV(有声音/無声音)判定部115及び聴覚重み付きのベクトル量子化器116に送られる。
【0035】
V/UV(有声音/無声音)判定部115では、直交変換回路145からの出力と、高精度ピッチサーチ部146からの最適ピッチと、スペクトル評価部148からのスペクトル振幅データと、オープンループピッチサーチ部141からの正規化自己相関最大値r(p) と、ゼロクロスカウンタ142からのゼロクロスカウント値とに基づいて、当該フレームのV/UV判定が行われる。さらに、MBEの場合の各バンド毎のV/UV判定結果の境界位置も当該フレームのV/UV判定の一条件としてもよい。このV/UV判定部115からの判定出力は、出力端子105を介して取り出される。
【0036】
ところで、スペクトル評価部148の出力部あるいはベクトル量子化器116の入力部には、データ数変換(一種のサンプリングレート変換)部が設けられている。このデータ数変換部は、上記ピッチに応じて周波数軸上での分割帯域数が異なり、データ数が異なることを考慮して、エンベロープの振幅データ|Am| を一定の個数にするためのものである。すなわち、例えば有効帯域を3400kHzまでとすると、この有効帯域が上記ピッチに応じて、8バンド〜63バンドに分割されることになり、これらの各バンド毎に得られる上記振幅データ|Am| の個数mMX+1も8〜63と変化することになる。このためデータ数変換部119では、この可変個数mMX+1の振幅データを一定個数M個、例えば44個、のデータに変換している。
【0037】
このスペクトル評価部148の出力部あるいはベクトル量子化器116の入力部に設けられたデータ数変換部からの上記一定個数M個(例えば44個)の振幅データあるいはエンベロープデータが、ベクトル量子化器116により、所定個数、例えば44個のデータ毎にまとめられてベクトルとされ、重み付きベクトル量子化が施される。この重みは、聴覚重み付けフィルタ算出回路139からの出力により与えられる。ベクトル量子化器116からの上記エンベロープのインデクスは、スイッチ117を介して出力端子103より取り出される。なお、上記重み付きベクトル量子化に先だって、所定個数のデータから成るベクトルについて適当なリーク係数を用いたフレーム間差分をとっておくようにしてもよい。
【0038】
ここで、スペクトル評価部148の出力側あるいはベクトル量子化器116の入力側に設けられたスペクトルエンベロープの振幅のデータ数を一定個数にするデータ数変換の具体例について説明する。
【0039】
このデータ数変換には種々の方法が考えられるが、本実施の形態においては、例えば、周波数軸上の有効帯域1ブロック分の振幅データに対して、ブロック内の最後のデータからブロック内の最初のデータまでの値を補間するようなダミーデータを付加してデータ個数をNF 個に拡大した後、帯域制限型のOS 倍(例えば8倍)のオーバーサンプリングを施すことによりOS 倍の個数の振幅データを求め、このOS 倍の個数((mMX+1)×OS 個)の振幅データを直線補間してさらに多くのNM 個(例えば2048個)に拡張し、このNM 個のデータを間引いて上記一定個数M(例えば44個)のデータに変換している。
【0040】
次に、第2の符号化部120について説明する。第2の符号化部120は、いわゆるCELP(符号励起線形予測)符号化構成を有しており、特に、入力音声信号の無声音部分の符号化のために用いられている。この無声音部分用のCELP符号化構成において、雑音符号帳、いわゆるストキャスティック・コードブック(stochastic code book)121からの代表値出力である無声音のLPC残差に相当するノイズ出力を、ゲイン回路126を介して、聴覚重み付きの合成フィルタ122に送っている。重み付きの合成フィルタ122では、入力されたノイズをLPC合成処理し、得られた重み付き無声音の信号を減算器123に送っている。減算器123には、上記入力端子101からHPF(ハイパスフィルタ)109を介して供給された音声信号を聴覚重み付けフィルタ125で聴覚重み付けした信号が入力されており、合成フィルタ122からの信号との差分あるいは誤差を取り出している。この誤差を距離計算回路124に送って距離計算を行い、誤差が最小となるような代表値ベクトルを雑音符号帳121でサーチする。このような合成による分析(Analysis by Synthesis )法を用いたクローズドループサーチを用いた時間軸波形のベクトル量子化を行っている。
【0041】
このCELP符号化構成を用いた第2の符号化部120からのUV(無声音)部分用のデータとしては、雑音符号帳121からのコードブックのシェイプインデクスと、ゲイン回路126からのコードブックのゲインインデクスとが取り出される。雑音符号帳121からのUVデータであるシェイプインデクスは、スイッチ127sを介して出力端子107sに送られ、ゲイン回路126のUVデータであるゲインインデクスは、スイッチ127gを介して出力端子107gに送られている。
【0042】
ここで、これらのスイッチ127s、127g及び上記スイッチ117、118は、上記V/UV判定部115からのV/UV判定結果によりオン/オフ制御され、スイッチ117、118は、現在伝送しようとするフレームの音声信号のV/UV判定結果が有声音(V)のときオンとなり、スイッチ127s、127gは、現在伝送しようとするフレームの音声信号が無声音(UV)のときオンとなる。
【0043】
次に、図4は、上記図2に示した本発明に係る実施の形態としての音声信号復号化装置のより具体的な構成を示している。この図4において、上記図2の各部と対応する部分には、同じ指示符号を付している。
【0044】
この図4において、入力端子202には、上記図1、3の出力端子102からの出力に相当するLSPのベクトル量子化出力、いわゆるコードブックのインデクスが供給されている。
【0045】
このLSPのインデクスは、LPCパラメータ再生部213のLSPの逆ベクトル量子化器231に送られてLSP(線スペクトル対)データに逆ベクトル量子化され、LSP補間回路232、233に送られてLSPの補間処理が施された後、LSP→α変換回路234、235でLPC(線形予測符号)のαパラメータに変換され、このαパラメータがLPC合成フィルタ214に送られる。ここで、LSP補間回路232及びLSP→α変換回路234は有声音(V)用であり、LSP補間回路233及びLSP→α変換回路235は無声音(UV)用である。またLPC合成フィルタ214は、有声音部分のLPC合成フィルタ236と、無声音部分のLPC合成フィルタ237とを分離している。すなわち、有声音部分と無声音部分とでLPCの係数補間を独立に行うようにして、有声音から無声音への遷移部や、無声音から有声音への遷移部で、全く性質の異なるLSP同士を補間することによる悪影響を防止している。
【0046】
また、図4の入力端子203には、上記図1、図3のエンコーダ側の端子103からの出力に対応するスペクトルエンベロープ(Am)の重み付けベクトル量子化されたコードインデクスデータが供給され、入力端子204には、上記図1、図3の端子104からのピッチのデータが供給され、入力端子205には、上記図1、図3の端子105からのV/UV判定データが供給されている。
【0047】
入力端子203からのスペクトルエンベロープAmのベクトル量子化されたインデクスデータは、逆ベクトル量子化器212に送られて逆ベクトル量子化が施され、上記データ数変換に対応する逆変換が施されて、スペクトルエンベロープのデータとなって、有声音合成部211のサイン波合成回路215に送られている。
【0048】
なお、エンコード時にスペクトルのベクトル量子化に先だってフレーム間差分をとっている場合には、ここでの逆ベクトル量子化後にフレーム間差分の復号を行ってからデータ数変換を行い、スペクトルエンベロープのデータを得る。
【0049】
サイン波合成回路215には、入力端子204からのピッチ及び入力端子205からの上記V/UV判定データが供給されている。サイン波合成回路215からは、上述した図1、図3のLPC逆フィルタ111からの出力に相当するLPC残差データが取り出され、これが加算器218に送られている。
【0050】
また、逆ベクトル量子化器212からのエンベロープのデータと、入力端子204、205からのピッチ、V/UV判定データとは、有声音(V)部分のノイズ加算のためのノイズ合成回路216に送られている。このノイズ合成回路216からの出力は、重み付き重畳加算回路217を介して加算器218に送っている。これは、サイン波合成によって有声音のLPC合成フィルタへの入力となるエクサイテイション(Excitation:励起、励振)を作ると、男声等の低いピッチの音で鼻づまり感がある点、及びV(有声音)とUV(無声音)とで音質が急激に変化し不自然に感じる場合がある点を考慮し、有声音部分のLPC合成フィルタ入力すなわちエクサイテイションについて、音声符号化データに基づくパラメータ、例えばピッチ、スペクトルエンベロープ振幅、フレーム内の最大振幅、残差信号のレベル等を考慮したノイズをLPC残差信号の有声音部分に加えているものである。
【0051】
加算器218からの加算出力は、LPC合成フィルタ214の有声音用の合成フィルタ236に送られてLPCの合成処理が施されることにより時間波形データとなり、さらに有声音用ポストフィルタ238vでフィルタ処理された後、加算器239に送られる。この有声音用ポストフィルタ238vは、後述するように、内部のスペクトル整形フィルタのフィルタ係数の更新周期を20サンプル、2.5msec と短くし、ゲイン調整回路のゲイン更新周期を160サンプル、20msec と長くしている。
【0052】
次に、図4の入力端子207s及び207gには、上記図3の出力端子107s及び107gからのUVデータとしてのシェイプインデクス及びゲインインデクスがそれぞれ供給され、無声音合成部220に送られている。端子207sからのシェイプインデクスは、無声音合成部220の雑音符号帳221に、端子207gからのゲインインデクスはゲイン回路222にそれぞれ送られている。雑音符号帳221から読み出された代表値出力は、無声音のLPC残差に相当するノイズ信号成分であり、これがゲイン回路222で所定のゲインの振幅となり、窓かけ回路223に送られて、上記有声音部分とのつなぎを円滑化するための窓かけ処理が施される。
【0053】
窓かけ回路223からの出力は、無声音合成部220からの出力として、LPC合成フィルタ214のUV(無声音)用の合成フィルタ237に送られる。合成フィルタ237では、LPC合成処理が施されることにより無声音部分の時間波形データとなり、この無声音部分の時間波形データは無声音用ポストフィルタ238uでフィルタ処理された後、加算器239に送られる。この無声音用ポストフィルタ238uも、後述するように、内部のスペクトル整形フィルタのフィルタ係数の更新周期を20サンプル、2.5msec と短くし、ゲイン調整回路のゲイン更新周期を160サンプル、20msec と長くしている。
【0054】
加算器239では、有声音用ポストフィルタ238vからの有声音部分の時間波形信号と、無声音用ポストフィルタ238uからの無声音部分の時間波形データとが加算され、出力端子201より取り出される。
【0055】
次に、図4の音声信号復号化装置の要部のより具体的な構成及び動作についてさらに詳細に説明する。
【0056】
LPC合成フィルタ214は、上述したように、V(有声音)用の合成フィルタ236と、UV(無声音)用の合成フィルタ237とに分離されている。すなわち、合成フィルタを分離せずにV/UVの区別なしに連続的にLSPの補間を20サンプルすなわち2.5msec 毎に行う場合には、V→UV、UV→Vの遷移(トランジェント)部において、全く性質の異なるLSP同士を補間することになり、Vの残差にUVのLPCが、UVの残差にVのLPCが用いられることにより異音が発生するが、このような悪影響を防止するために、LPC合成フィルタをV用とUV用とで分離し、LPCの係数補間をVとUVとで独立に行わせたものである。
【0057】
この場合の、LPC合成フィルタ236、237の係数補間方法について説明する。これは、次の表1に示すように、V/UVの状態に応じてLSPの補間を切り換えている。
【0058】
【表1】
Figure 0003653826
【0059】
この表1において、均等間隔LSPとは、例えば10次のLPC分析の例で述べると、フィルタの特性がフラットでゲインが1のときのαパラメータ、すなわち α0=1,α1=α2=・・・=α10=0に対応するLSPであり、
LSPi =(π/11)×i 0≦i≦10
である。
【0060】
このような10次のLPC分析、すなわち10次のLSPの場合は、図5に示す通り、0〜πの間を11等分した位置に均等間隔で配置されたLSPで、完全にフラットなスペクトルに対応している。合成フィルタの全帯域ゲインはこのときが最小のスルー特性となる。
【0061】
図6は、ゲイン変化の様子を概略的に示す図であり、UV(無声音)部分からV(有声音)部分への遷移時における1/HUV(z) のゲイン及び1/HV(z)のゲインの変化の様子を示している。
【0062】
ここで、補間を行う単位は、フレーム間隔が160サンプル(20msec )のとき、1/HV(z)の係数は2.5msec (20サンプル)毎、また1/HUV(z) の係数は、ビットレートが2kbps で10msec (80サンプル)、6kbps で5msec (40サンプル)毎である。なお、UV時はエンコード側の第2の符号化部120で合成による分析法を用いた波形マッチングを行っているので、必ずしも均等間隔LSPと補間せずとも、隣接するV部分のLSPとの補間を行ってもよい。ここで、第2の符号化部120におけるUV部の符号化処理においては、V→UVへの遷移部で1/A(z) の重み付き合成フィルタ122の内部状態をクリアすることによりゼロインプットレスポンスを0にする。
【0063】
これらのLPC合成フィルタ236、237からの出力は、それぞれ独立に設けられたポストフィルタ238v、238uに送られており、ポストフィルタもVとUVとで独立にかけることにより、ポストフィルタの強度、周波数特性をVとUVとで異なる値に設定している。
【0064】
次に、LPC残差信号、すなわちLPC合成フィルタ入力であるエクサイテイションの、V部とUV部のつなぎ部分の窓かけについて説明する。これは、図4の有声音合成部211のサイン波合成回路215と、無声音合成部220の窓かけ回路223とによりそれぞれ行われるものである。
【0065】
V(有声音)部分では、隣接するフレームのスペクトルを用いてスペクトルを補間してサイン波合成するため、図7に示すように、第nフレームと第n+1フレームとの間にかかる全ての波形を作ることができる。しかし、図7の第n+1フレームと第n+2フレームとのように、VとUV(無声音)に跨る部分、あるいはその逆の部分では、UV部分は、フレーム中に±80サンプル(全160サンプル=1フレーム間隔)のデータのみをエンコード及びデコードしている。このため、図8に示すように、V側ではフレームとフレームとの間の中心点CNを越えて窓かけを行い、UV側では中心点CN以降の窓かけを行って、接続部分をオーバーラップさせている。UV→Vの遷移(トランジェント)部分では、その逆を行っている。なお、V側の窓かけは破線のようにしてもよい。
【0066】
次に、V(有声音)部分でのノイズ合成及びノイズ加算について説明する。これは、図4のノイズ合成回路216、重み付き重畳回路217、及び加算器218を用いて、有声音部分のLPC合成フィルタ入力となるエクサイテイションについて、次のパラメータを考慮したノイズをLPC残差信号の有声音部分に加えることにより行われる。
【0067】
すなわち、上記パラメータとしては、ピッチラグPch、有声音のスペクトル振幅Am[i]、フレーム内の最大スペクトル振幅Amax 、及び残差信号のレベルLevを挙げることができる。ここで、ピッチラグPchは、所定のサンプリング周波数fs (例えばfs=8kHz)でのピッチ周期内のサンプル数であり、スペクトル振幅Am[i]のiは、fs/2 の帯域内でのハーモニックスの本数をI=Pch/2とするとき、0<i<Iの範囲内の整数である。
【0068】
このノイズ合成回路216による処理は、例えばMBE(マルチバンド励起)符号化の無声音の合成と同様な方法で行われる。図9は、ノイズ合成回路216の具体例を示している。
【0069】
すなわち図9において、ホワイトノイズ発生部401からは、時間軸上のホワイトノイズ信号波形に所定の長さ(例えば256サンプル)で適当な窓関数(例えばハミング窓)により窓かけされたガウシャンノイズが出力され、これがSTFT処理部402によりSTFT(ショートタームフーリエ変換)処理を施すことにより、ノイズの周波数軸上のパワースペクトルを得る。このSTFT処理部402からのパワースペクトルを振幅処理のための乗算器403に送り、ノイズ振幅制御回路410からの出力を乗算している。乗算器403からの出力は、ISTFT処理部404に送られ、位相は元のホワイトノイズの位相を用いて逆STFT処理を施すことにより時間軸上の信号に変換する。ISTFT処理部404からの出力は、上記図4の重み付き重畳加算回路217に送られる。
【0070】
ノイズ振幅制御回路410は、例えば図10のような基本構成を有し、上記図4のスペクトルエンベロープの逆量子化器212から端子411を介して与えられるV(有声音)についての上記スペクトル振幅Am[i]と、上記図4の入力端子204から端子412を介して与えられる上記ピッチラグPchに基づいて、乗算器403での乗算係数を制御することにより、合成されるノイズ振幅Am_noise[i]を求めている。すなわち図10において、スペクトル振幅Am[i]とピッチラグPchとが入力される最適なnoise_mix 値の算出回路416からの出力をノイズの重み付け回路417で重み付けし、得られた出力を乗算器418に送ってスペクトル振幅Am[i]と乗算することにより、ノイズ振幅Am_noise[i]を得ている。
【0071】
ここで、ノイズ合成加算の第1の具体例として、ノイズ振幅Am_noise[i]が、上記4つのパラメータの内の2つ、すなわちピッチラグPch及びスペクトル振幅Am[i]の関数f1(Pch,Am[i])となる場合について説明する。
【0072】
このような関数f1(Pch,Am[i])の具体例として、
1(Pch,Am[i])=0 (0<i<Noise_b×I)
1(Pch,Am[i])=Am[i]×noise_mix (Noise_b×I≦i<I)
noise_mix = K×Pch/2.0
とすることが挙げられる。
【0073】
ただし、noise_mix の最大値は、noise_mix_max とし、その値でクリップする。一例として、K=0.02、noise_mix_max=0.3、Noise_b=0.7とすることが挙げられる。ここで、Noise_b は、全帯域の何割からこのノイズの付加を行うかを決める定数である。本例では、7割より高域側、すなわちfs=8kHzのとき、4000×0.7=2800Hzから4000Hzの間でノイズを付加するようにしている。
【0074】
次に、ノイズ合成加算の第2の具体例として、上記ノイズ振幅Am_noise[i]を、上記4つのパラメータの内の3つ、すなわちピッチラグPch、スペクトル振幅Am[i]及び最大スペクトル振幅Amax の関数f2(Pch,Am[i],Amax) とする場合について説明する。
【0075】
このような関数f2(Pch,Am[i],Amax) の具体例として、
2(Pch,Am[i],Amax)=0 (0<i<Noise_b×I)
2(Pch,Am[i],Amax)=Am[i]×noise_mix (Noise_b×I≦i<I)
noise_mix = K×Pch/2.0
を挙げることができる。ただし、noise_mix の最大値は、noise_mix_max とし、一例として、K=0.02、noise_mix_max=0.3、Noise_b=0.7とすることが挙げられる。
【0076】
さらに、
もしAm[i]×noise_mix>Amax×C×noise_mix ならば、
2(Pch,Am[i],Amax)=Amax×C×noise_mix
とする。ここで、定数Cは、C=0.3 としている。この条件式によりノイズレベルが大きくなり過ぎることを防止できるため、上記K、noise_mix_max をさらに大きくしてもよく、高域のレベルも比較的大きいときにノイズレベルを高めることができる。
【0077】
次に、ノイズ合成加算の第3の具体例として、上記ノイズ振幅Am_noise[i]を、上記4つのパラメータの内の4つ全ての関数f3(Pch,Am[i],Amax,Lev) とすることもできる。
【0078】
このような関数f3(Pch,Am[i],Amax,Lev) の具体例は、基本的には上記第2の具体例の関数f2(Pch,Am[i],Amax) と同様である。ただし、残差信号レベルLev は、スペクトル振幅Am[i]のrms(root mean square)、あるいは時間軸上で測定した信号レベルである。上記第2の具体例との違いは、Kの値とnoise_mix_max の値とをLev の関数とする点である。すなわち、Lev が小さくなったときには、K、noise_mix_max の各値を大きめに設定し、Lev が大きいときは小さめに設定する。あるいは、連続的にLev の値を逆比例させてもよい。
【0079】
次に、ポストフィルタ238v、238uについて説明する。
【0080】
図11は、図4の例のポストフィルタ238v、238uとして用いられるポストフィルタを示しており、ポストフィルタの要部となるスペクトル整形フィルタ440は、ホルマント強調フィルタ441と高域強調フィルタ442とから成っている。このスペクトル整形フィルタ440からの出力は、スペクトル整形によるゲイン制御を補正するためのゲイン調整回路443に送られており、このゲイン調整回路443のゲインGは、ゲイン制御回路445により、スペクトル整形フィルタ440の入力xと出力yとを比較してゲイン変化を計算し、補正値を算出することで決定される。
【0081】
スペクトル整形フィルタの440特性PF(z) は、LPC合成フィルタの分母Hv(z)、Huv(z) の係数、いわゆるαパラメータをαi とすると、
【0082】
【数1】
Figure 0003653826
【0083】
と表せる。この式の分数部分がホルマント強調フィルタ特性を、(1−kz-1)の部分が高域強調フィルタ特性をそれぞれ表す。また、β、γ、kは定数であり、一例としてβ=0.6、γ=0.8、k=0.3を挙げることができる。
【0084】
また、ゲイン調整回路443のゲインGは、
【0085】
【数2】
Figure 0003653826
【0086】
としている。この式中のx(i) はスペクトル整形フィルタ440の入力、y(i) はスペクトル整形フィルタ440の出力である。
【0087】
ここで、上記スペクトル整形フィルタ440の係数の更新周期は、図12に示すように、LPC合成フィルタの係数であるαパラメータの更新周期と同じく20サンプル、2.5msec であるのに対して、ゲイン調整回路443のゲインGの更新周期は、160サンプル、20msec である。
【0088】
このように、ポストフィルタのスペクトル整形フィルタ440の係数の更新周期に比較して、ゲイン調整回路443のゲインGの更新周期を長くとることにより、ゲイン調整の変動による悪影響を防止している。
【0089】
すなわち、一般のポストフィルタにおいては、スペクトル整形フィルタの係数の更新周期とゲインの更新周期とを同じにしており、このとき、ゲインの更新周期を20サンプル、2.5msec とすると、図12からも明らかなように、1ピッチ周期の中で変動することになり、クリックノイズを生じる原因となる。そこで本例においては、ゲインの切換周期をより長く、例えば1フレーム分の160サンプル、20msec とすることにより、ゲインの変動を防止することができる。また逆に、スペクトル整形フィルタの係数の更新周期を160サンプル、20msec と長くするときには、短時間の音声スペクトルの変化にポストフィルタ特性が追従できず、良好な聴感上の品質改善が行えないが、このフィルタ係数の更新周期を20サンプル、2.5msec と短くすることにより、効果的なポストフィルタ処理が可能となる。
【0090】
なお、隣接するフレーム間でのゲインのつなぎ処理は、図13に示すように、前フレームのフィルタ係数及びゲインと、現フレームのフィルタ係数及びゲインとを用いて算出した結果に、次のような三角窓
W(i) = i/20 (0≦i≦20)

1−W(i) (0≦i≦20)
をかけてフェードイン、フェードアウトを行って加算する。図13では、前フレームのゲインG が現フレームのゲインG に変化する様子を示している。すなわち、オーバーラップ部分では、前フレームのゲイン、フィルタ係数を使用する割合が徐々に減衰し、現フレームのゲイン、フィルタ係数の使用が徐々に増大する。なお、図13の時刻Tにおけるフィルタの内部状態は、現フレームのフィルタ、前フレームのフィルタ共に同じもの、すなわち前フレームの最終状態からスタートする。
【0091】
以上説明したような信号符号化装置及び信号復号化装置は、例えば図14及び図15に示すような携帯通信端末あるいは携帯電話機等に使用される音声コーデックとして用いることができる。
【0092】
すなわち、図14は、上記図1、図3に示したような構成を有する音声符号化部160を用いて成る携帯端末の送信側構成を示している。この図14のマイクロホン161で集音された音声信号は、アンプ162で増幅され、A/D(アナログ/ディジタル)変換器163でディジタル信号に変換されて、音声符号化部160に送られる。この音声符号化部160は、上述した図1、図3に示すような構成を有しており、この入力端子101に上記A/D変換器163からのディジタル信号が入力される。音声符号化部160では、上記図1、図3と共に説明したような符号化処理が行われ、図1、図2の各出力端子からの出力信号は、音声符号化部160の出力信号として、伝送路符号化部164に送られる。伝送路符号化部164では、いわゆるチャネルコーディング処理が施され、その出力信号が変調回路165に送られて変調され、D/A(ディジタル/アナログ)変換器166、RFアンプ167を介して、アンテナ168に送られる。
【0093】
また、図15は、上記図2、図4に示したような構成を有する音声復号化部260を用いて成る携帯端末の受信側構成を示している。この図15のアンテナ261で受信された音声信号は、RFアンプ262で増幅され、A/D(アナログ/ディジタル)変換器263を介して、復調回路264に送られ、復調信号が伝送路復号化部265に送られる。264からの出力信号は、上記図2、図4に示すような構成を有する音声復号化部260に送られる。音声復号化部260では、上記図2、図4と共に説明したような復号化処理が施され、図2、図4の出力端子201からの出力信号が、音声復号化部260からの信号としてD/A(ディジタル/アナログ)変換器266に送られる。このD/A変換器266からのアナログ音声信号がスピーカ268に送られる。
【0094】
なお、本発明は上記実施の形態のみに限定されるものではなく、例えば上記図1、図3の音声分析側(エンコード側)の構成や、図2、図4の音声合成側(デコード側)の構成については、各部をハードウェア的に記載しているが、いわゆるDSP(ディジタル信号プロセッサ)等を用いてソフトウェアプログラムにより実現することも可能である。また、デコーダ側の合成フィルタ236、237や、ポストフィルタ238v、238uは、図4のように有声音用と無声音用とで分離しなくとも、有声音及び無声音の共用のLPC合成フィルタやポストフィルタを用いるようにしてもよい。さらに、本発明の適用範囲は、伝送や記録再生に限定されず、ピッチ変換やスピード変換、規則音声合成、あるいは雑音抑圧のような種々の用途に応用できることは勿論である。
【0095】
【発明の効果】
以上の説明から明らかなように、本発明によれば、符号化された音声信号が復号化されて供給されるスペクトル整形フィルタのフィルタ係数を第1の周期で更新するようにし、このスペクトル整形によるゲイン変化を補正するためのゲイン調整のゲインを第1の周期とは異なる第2の周期で更新しており、それぞれの機能に応じた最適の周期を選ぶことで、ポストフィルタ全体としての特性を改善できる。
【0096】
特に、スペクトル整形フィルタのフィルタ係数の更新周期である第1の周期を短くし、ゲイン調整のゲイン更新周期である第2の周期を長くすることにより、追従速度が速く滑らかに変化してゆくフィルタ係数の切換を行うと共に、頻繁なゲイン切換によるレベル変動を抑えることができ、より効果的なポストフィルタ処理が可能となって、聴感上の品質改善がより高められる。
【図面の簡単な説明】
【図1】本発明に係る音声復号化装置に入力される符号化音声を得るための音声符号化装置の一例の基本構成を示すブロック図である。
【図2】本発明に係る音声復号化方法の実施の形態が適用される音声信号復号化装置の基本構成を示すブロック図である。
【図3】図1の音声信号符号化装置のより具体的な構成を示すブロック図である。
【図4】本発明の実施の形態となる音声信号復号化装置のより具体的な構成を示すブロック図である。
【図5】10次のLPC分析により得られたαパラメータに基づく10次のLSP(線スペクトル対)を示す図である。
【図6】UV(無声音)フレームからV(有声音)フレームへのゲイン変化の様子を説明するための図である。
【図7】フレーム毎に合成されるスペクトルや波形の補間処理を説明するための図である。
【図8】V(有声音)フレームとUV(無声音)フレームとの接続部でのオーバーラップを説明するための図である。
【図9】有声音合成の際のノイズ加算処理を説明するための図である。
【図10】有声音合成の際に加算されるノイズの振幅計算の例を示す図である。
【図11】ポストフィルタの構成例を示す図である。
【図12】ポストフィルタのフィルタ係数更新周期とゲイン更新周期とを説明するための図である。
【図13】ポストフィルタのゲイン、フィルタ係数のフレーム境界部分でのつなぎ処理を説明するための図である。
【図14】本発明の実施の形態となる音声信号符号化装置が用いられる携帯端末の送信側構成を示すブロック図である。
【図15】本発明の実施の形態となる音声信号復号化装置が用いられる携帯端末の受信側構成を示すブロック図である。
【符号の説明】
110 第1の符号化部
111 LPC逆フィルタ
113 LPC分析・量子化部
114 サイン波分析符号化部
115 V/UV判定部
120 第2の符号化部
121 雑音符号帳
122 重み付き合成フィルタ
123 減算器
124 距離計算回路
125 聴覚重み付けフィルタ
238 ポストフィルタ
238v 有声音用ポストフィルタ
238u 無声音用ポストフィルタ
440 スペクトル整形フィルタ
441 ホルマント強調フィルタ
442 高域強調フィルタ
443 ゲイン調整回路
445 ゲイン制御回路

Claims (5)

  1. 符号化された音声信号が入力され、復号化した後にポストフィルタ処理を施す音声復号化方法において、
    復号化された信号が入力され、フィルタ係数が第1の周期で更新されるスペクトル整形フィルタ処理工程と、
    このスペクトル整形フィルタ処理によるゲイン変化を補正するためのゲイン調整を行うと共に調整ゲインが上記第1の周期とは異なる第2の周期で更新されるゲイン調整工程とを有すること
    を特徴とする音声復号化方法。
  2. 上記第2の周期を上記第1の周期よりも長くすること
    を特徴とする請求項1記載の音声復号化方法。
  3. 上記ゲイン調整工程は、上記スペクトル整形フィルタ処理前のレベルと処理後のレベルとを比較することにより調整ゲインを決定すること
    を特徴とする請求項1記載の音声復号化方法。
  4. 符号化された音声信号が入力され、復号化した後にポストフィルタ処理を施す音声復号化装置において、
    復号化された信号が入力され、フィルタ係数が第1の周期で更新されるスペクトル整形フィルタ手段と、
    このスペクトル整形フィルタ手段からの出力が入力され、ゲインが上記第1の周期とは異なる第2の周期で更新されるゲイン調整手段とを有すること
    を特徴とする音声復号化装置。
  5. 上記第2の周期を上記第1の周期よりも長くすること
    を特徴とする請求項4記載の音声復号化装置。
JP27948995A 1995-10-26 1995-10-26 音声復号化方法及び装置 Expired - Fee Related JP3653826B2 (ja)

Priority Applications (6)

Application Number Priority Date Filing Date Title
JP27948995A JP3653826B2 (ja) 1995-10-26 1995-10-26 音声復号化方法及び装置
US08/736,342 US5752222A (en) 1995-10-26 1996-10-23 Speech decoding method and apparatus
ES96307724T ES2165960T3 (es) 1995-10-26 1996-10-25 Metodo de descodificacion de voz y aparato terminal portatil.
DE69618422T DE69618422T2 (de) 1995-10-26 1996-10-25 Verfahren zur Sprachdekodierung und tragbares Endgerät
EP96307724A EP0770988B1 (en) 1995-10-26 1996-10-25 Speech decoding method and portable terminal apparatus
KR1019960048691A KR100421816B1 (ko) 1995-10-26 1996-10-25 음성복호화방법 및 휴대용 단말장치

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP27948995A JP3653826B2 (ja) 1995-10-26 1995-10-26 音声復号化方法及び装置
US08/736,342 US5752222A (en) 1995-10-26 1996-10-23 Speech decoding method and apparatus

Publications (2)

Publication Number Publication Date
JPH09127996A JPH09127996A (ja) 1997-05-16
JP3653826B2 true JP3653826B2 (ja) 2005-06-02

Family

ID=26553357

Family Applications (1)

Application Number Title Priority Date Filing Date
JP27948995A Expired - Fee Related JP3653826B2 (ja) 1995-10-26 1995-10-26 音声復号化方法及び装置

Country Status (5)

Country Link
US (1) US5752222A (ja)
EP (1) EP0770988B1 (ja)
JP (1) JP3653826B2 (ja)
DE (1) DE69618422T2 (ja)
ES (1) ES2165960T3 (ja)

Families Citing this family (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3707116B2 (ja) * 1995-10-26 2005-10-19 ソニー株式会社 音声復号化方法及び装置
JP2940464B2 (ja) * 1996-03-27 1999-08-25 日本電気株式会社 音声復号化装置
JPH09319397A (ja) * 1996-05-28 1997-12-12 Sony Corp ディジタル信号処理装置
JP4040126B2 (ja) * 1996-09-20 2008-01-30 ソニー株式会社 音声復号化方法および装置
JPH10105195A (ja) * 1996-09-27 1998-04-24 Sony Corp ピッチ検出方法、音声信号符号化方法および装置
JP4121578B2 (ja) * 1996-10-18 2008-07-23 ソニー株式会社 音声分析方法、音声符号化方法および装置
JP3164038B2 (ja) * 1997-11-05 2001-05-08 日本電気株式会社 音声帯域分割復号装置
KR100429180B1 (ko) * 1998-08-08 2004-06-16 엘지전자 주식회사 음성 패킷의 파라미터 특성을 이용한 오류 검사 방법
KR20000047944A (ko) * 1998-12-11 2000-07-25 이데이 노부유끼 수신장치 및 방법과 통신장치 및 방법
JP2000305599A (ja) * 1999-04-22 2000-11-02 Sony Corp 音声合成装置及び方法、電話装置並びにプログラム提供媒体
FR2796190B1 (fr) * 1999-07-05 2002-05-03 Matra Nortel Communications Procede et dispositif de codage audio
CN100362568C (zh) * 2000-04-24 2008-01-16 高通股份有限公司 用于预测量化有声语音的方法和设备
US6941263B2 (en) * 2001-06-29 2005-09-06 Microsoft Corporation Frequency domain postfiltering for quality enhancement of coded speech
US7110942B2 (en) * 2001-08-14 2006-09-19 Broadcom Corporation Efficient excitation quantization in a noise feedback coding system using correlation techniques
US7512535B2 (en) * 2001-10-03 2009-03-31 Broadcom Corporation Adaptive postfiltering methods and systems for decoding speech
US7206740B2 (en) * 2002-01-04 2007-04-17 Broadcom Corporation Efficient excitation quantization in noise feedback coding with general noise shaping
US7065485B1 (en) * 2002-01-09 2006-06-20 At&T Corp Enhancing speech intelligibility using variable-rate time-scale modification
US20030135374A1 (en) * 2002-01-16 2003-07-17 Hardwick John C. Speech synthesizer
US7328151B2 (en) * 2002-03-22 2008-02-05 Sound Id Audio decoder with dynamic adjustment of signal modification
JP3881943B2 (ja) * 2002-09-06 2007-02-14 松下電器産業株式会社 音響符号化装置及び音響符号化方法
US7876966B2 (en) * 2003-03-11 2011-01-25 Spyder Navigations L.L.C. Switching between coding schemes
SE0301272D0 (sv) * 2003-04-30 2003-04-30 Coding Technologies Sweden Ab Adaptive voice enhancement for low bit rate audio coding
US7844451B2 (en) 2003-09-16 2010-11-30 Panasonic Corporation Spectrum coding/decoding apparatus and method for reducing distortion of two band spectrums
WO2006009074A1 (ja) * 2004-07-20 2006-01-26 Matsushita Electric Industrial Co., Ltd. 音声復号化装置および補償フレーム生成方法
KR100644627B1 (ko) * 2004-09-14 2006-11-10 삼성전자주식회사 음장 제어 정보 부호화 방법 및 이에 적합한 음장 처리 방법
US7590523B2 (en) * 2006-03-20 2009-09-15 Mindspeed Technologies, Inc. Speech post-processing using MDCT coefficients
US8335684B2 (en) * 2006-07-12 2012-12-18 Broadcom Corporation Interchangeable noise feedback coding and code excited linear prediction encoders
EP2096631A4 (en) 2006-12-13 2012-07-25 Panasonic Corp TONE DECODING DEVICE AND POWER ADJUSTMENT METHOD
JP5339919B2 (ja) * 2006-12-15 2013-11-13 パナソニック株式会社 符号化装置、復号装置およびこれらの方法
CN101303858B (zh) * 2007-05-11 2011-06-01 华为技术有限公司 实现基音增强后处理的方法及装置
EP2466580A1 (en) * 2010-12-14 2012-06-20 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Encoder and method for predictively encoding, decoder and method for decoding, system and method for predictively encoding and decoding and predictively encoded information signal
FR2969805A1 (fr) * 2010-12-23 2012-06-29 France Telecom Codage bas retard alternant codage predictif et codage par transformee
JP6147744B2 (ja) * 2011-07-29 2017-06-14 ディーティーエス・エルエルシーDts Llc 適応音声了解度処理システムおよび方法
FR3023646A1 (fr) * 2014-07-11 2016-01-15 Orange Mise a jour des etats d'un post-traitement a une frequence d'echantillonnage variable selon la trame
EP2980799A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for processing an audio signal using a harmonic post-filter
EP2980796A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method and apparatus for processing an audio signal, audio decoder, and audio encoder
CN116168719A (zh) * 2022-12-26 2023-05-26 杭州爱听科技有限公司 一种基于语境分析的声音增益调节方法及系统

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5307441A (en) * 1989-11-29 1994-04-26 Comsat Corporation Wear-toll quality 4.8 kbps speech codec
US5233660A (en) * 1991-09-10 1993-08-03 At&T Bell Laboratories Method and apparatus for low-delay celp speech coding and decoding
US5339384A (en) * 1992-02-18 1994-08-16 At&T Bell Laboratories Code-excited linear predictive coding with low delay for speech or audio signals
US5574825A (en) * 1994-03-14 1996-11-12 Lucent Technologies Inc. Linear prediction coefficient generation during frame erasure or packet loss
US5664055A (en) * 1995-06-07 1997-09-02 Lucent Technologies Inc. CS-ACELP speech compression system with adaptive pitch prediction filter gain based on a measure of periodicity

Also Published As

Publication number Publication date
ES2165960T3 (es) 2002-04-01
DE69618422D1 (de) 2002-02-14
EP0770988A3 (en) 1998-10-14
US5752222A (en) 1998-05-12
DE69618422T2 (de) 2002-08-29
EP0770988B1 (en) 2002-01-09
JPH09127996A (ja) 1997-05-16
EP0770988A2 (en) 1997-05-02

Similar Documents

Publication Publication Date Title
JP3653826B2 (ja) 音声復号化方法及び装置
JP4132109B2 (ja) 音声信号の再生方法及び装置、並びに音声復号化方法及び装置、並びに音声合成方法及び装置
JP4662673B2 (ja) 広帯域音声及びオーディオ信号復号器における利得平滑化
JP3707116B2 (ja) 音声復号化方法及び装置
US5778335A (en) Method and apparatus for efficient multiband celp wideband speech and music coding and decoding
JP3566652B2 (ja) 広帯域信号の効率的な符号化のための聴覚重み付け装置および方法
KR100421226B1 (ko) 음성 주파수 신호의 선형예측 분석 코딩 및 디코딩방법과 그 응용
JP4550289B2 (ja) Celp符号変換
JP3483891B2 (ja) スピーチコーダ
JP4121578B2 (ja) 音声分析方法、音声符号化方法および装置
JP4040126B2 (ja) 音声復号化方法および装置
EP1141946B1 (en) Coded enhancement feature for improved performance in coding communication signals
JP3234609B2 (ja) 32Kb/sワイドバンド音声の低遅延コード励起線型予測符号化
JPH1091194A (ja) 音声復号化方法及び装置
EP0843302B1 (en) Voice coder using sinusoidal analysis and pitch control
JPH10105195A (ja) ピッチ検出方法、音声信号符号化方法および装置
JP4826580B2 (ja) 音声信号の再生方法及び装置
JP3785363B2 (ja) 音声信号符号化装置、音声信号復号装置及び音声信号符号化方法
JP4230550B2 (ja) 音声符号化方法及び装置、並びに音声復号化方法及び装置
KR100421816B1 (ko) 음성복호화방법 및 휴대용 단말장치
JP3896654B2 (ja) 音声信号区間検出方法及び装置
EP1164577A2 (en) Method and apparatus for reproducing speech signals

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20041201

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050208

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050221

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080311

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090311

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100311

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100311

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110311

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110311

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120311

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130311

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140311

Year of fee payment: 9

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees