JP2013178545A - 可変レートスピーチ符号化 - Google Patents
可変レートスピーチ符号化 Download PDFInfo
- Publication number
- JP2013178545A JP2013178545A JP2013087419A JP2013087419A JP2013178545A JP 2013178545 A JP2013178545 A JP 2013178545A JP 2013087419 A JP2013087419 A JP 2013087419A JP 2013087419 A JP2013087419 A JP 2013087419A JP 2013178545 A JP2013178545 A JP 2013178545A
- Authority
- JP
- Japan
- Prior art keywords
- speech
- active
- codebook
- encoding
- mode
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/20—Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
- G10L2025/783—Detection of presence or absence of voice signals based on threshold decision
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/93—Discriminating between voiced and unvoiced parts of speech signals
- G10L2025/935—Mixed voiced class; Transitions
Abstract
【解決手段】入力スピーチ信号が分類され、この分類に基づいて、許容可能なスピーチ再生品質で最も低いビットレートを達成する符号化モードが選択される。高忠実度モード(すなわち、異なったタイプのスピーチに広く適用可能な高ビットレート)を、許容可能な出力のために要求されるスピーチの部分の期間中に使用するだけで、低い平均ビットレートが達成される。入力スピーチ信号は、アクティブおよび非アクティブ領域に分類される。アクティブ領域はさらに、有声音領域、無声音領域声および過渡領域に分類される。要求される忠実度のレベルに応じて、種々の符号化モードが適用される。スピーチ信号の特性が時間的に変化するにしたがって、これらのモード間で動的に切換わる。また、適切である場合には、スピーチの領域が擬似ランダム雑音としてモデル化され、その結果著しく低いビットレートが実現される。
【選択図】図3
Description
II.本発明の概説
III .初期パラメータの決定
A.LPC係数の計算
B.LSI計算
C.NACF計算
D.ピッチトラックおよび遅延の計算
E.帯域エネルギおよびゼロ交差(Zero Crossing)レートの計算
F.ホルマント残留の計算
IV.アクティブ/非アクティブスピーチ分類
A.ハングオーバーフレーム
V.アクティブスピーチフレームの分類
VI.符号器/復号器モード選択
VII .コード励起線形予測(CELP)符号化モード
A.ピッチ符号化モジュール
B.符号化コードブック
C.CELP復号器
D.フィルタ更新モジュール
VIII.原型(Prototype)ピッチ周期(PPP)符号化モード
A.抽出モジュール
B.回転コリレータ(Correlator)
C.符号化コードブック
D.フィルタ更新モジュール
E.PPP復号器
F.周期インターポレータ(Interporator)
IX.雑音励起線形予測(NELP)符号化モード
X.結論
[I.環境の概説]
本発明は、可変レートスピーチ符号化のための新しい改善された方法および装置に関する。図1は、符号器102 、復号器104 および伝送媒体106 を含む信号伝送環境100 を示している。符号器102 はスピーチ信号s(n)を符号化し、伝送媒体106 を横切って復号器104 に伝送するために符号化されたスピーチ信号senc (n)を形成する。復号器104 はsenc (n)を復号し、それによって合成されたスピーチ信号:
本発明の方法および装置は、スピーチ信号s(n)の符号化を含んでいる。図2は、符号器102 および復号器104 をさらに詳細に示している。本発明によると、符号器102 は初期パラメータ計算モジュール202 と、分類モジュール208 と、および1以上の符号器モード204 とを含んでいる。復号器104 は1以上の復号器モード206 を含んでいる。復号器モードの数Nd は一般に、符号器モードの数Ne に等しい。当業者に明らかなように、符号器モード1は復号器モード1と通信し、その他も同様に通信している。示されているように、符号化されたスピーチ信号senc (n)は伝送媒体106 を介して伝送される。
図5は、ステップ302 をさらに詳細に説明するフローチャートである。本発明にしたがって種々の初期パラメータが計算される。パラメータは、たとえば、LPC係数、線スペクトル情報(LSI)係数、正規化された自己相関関数(NACFs)、開ループ遅延、帯域エネルギ、ゼロ交差レート、およびホルマント残留信号等を含んでいることが好ましい。これらのパラメータは、以下に説明するようにシステム全体内において種々の方法で使用される。
R(k)=h(k)R(k),0≦k≦10
によって与えられるLPC係数から得られた線スペクトル対(LSP)のルート(roots)をミスする確率を減少するためにウインドウ化され、その結果、たとえば25Hz等のわずかな帯域幅拡張になる。値h(k)は、255ポイントハミングウインドウの中心からとられることが好ましい。
ステップ504 において、LPC係数は量子化および補間のために線スペクトル情報(LSI)係数に変換される。LSI係数は、本発明にしたがって以下の方法で計算される。
A(z)=1−a1 z-1−…−a10z-10 ,
によって与えられ、ここでai はLPC係数であり、1≦i≦10である。
ilscj =(1−αi )lscprevj +αi lsccurrj ,
1≦j≦10
によって与えられる。ここで、αi は40個の各サンプルの4つのサブフレームに対する補間係数0.375,0.625,0.875,1.000であり、ilscは補間されたLSCである。^PA (z)および^QA (z)は補間されたISCにより次式にしたがって計算される:
ステップ506 において、正規化された自己相関関数(NACFs)が本発明にしたがって計算される。
してローパスフィルタ処理され、デシメート(decimate)され、ゼロ位
相FIRフィルタの係数dfi (−7≦i≦7)は{0.0800,0.125
6,0.2532,0.4376,0.6424,0.8268,0.9544
,1.000,0.9544,0.8268,0.6424,0.4376,0
.2532,0.1256,0.0800}である。ローパスフィルタ処理され
、デシメートされた残留は次のように計算される:
+i)は、量子化されていないLPC係数に基づく現在のフレームの残留の最後
の14個の値から得られる。上述したように、これらのLPC係数は、前のフレ
ーム中に計算され記憶される。
ステップ508 において、ピッチトラックおよびピッチ遅延が本発明にしたがって計算される。ピッチ遅延は、以下のようにバックワードトラック(backward track)と共にビタビ状(Viterbi-like)サーチを使用して計算されることが好ましい。
s(n)s(n+1)<0ならば、ZCR=ZCR+1、 0≦n≦159
のように計算される。
図3を参照すると、ステップ304 において現在のフレームはアクティブスピーチ(たとえば、話されたワード)または非アクティブスピーチ(たとえば、背景雑音、沈黙)のいずれかとして分類される。図6は、ステップ304 をさらに詳細に示すフローチャート600である。好ましい実施形態において、2つのエネルギ帯域ベースの閾値化(thresholding)方式は、アクティブスピーチが存在するか否かを決定するために使用される。低い帯域(帯域0)の周波数範囲は0.1−2.0kHzであり、高い帯域(帯域1)の周波数範囲は2.0−4.0kHzである。音声アクティビティ検出は、以下に示す方法で現在のフレームに対する符号化手順中に次のフレームに対して決定されることが好ましい。
Esm(i)=0.6Esm(i)+0.4Eb (i),i=0,1
ステップ606 において、信号エネルギおよび雑音エネルギ推定が更新される。信号エネルギ推定Es (i)は、以下の式を使用して更新されることが好ましい:
Es (i)=max(Esm(i),Es (i)),i=0,1
雑音エネルギ推定En (i)は以下の式を使用して更新されることが好ましい:
En (i)=min(Esm(i),En (i)),i=0,1
ステップ608 において、2つの帯域に対する長期間の信号対雑音比SNR(i)が計算される:
SNR(i)=Es (i)−En (i),i=0,1
ステップ610 において、これらのSNR値は以下のように規定される8つの領域RegSNR (i)に分割されることが好ましい:
Es (i)=Es (i)−0.014499,i=0,1
雑音エネルギ推定En (i)は、以下の式を使用して更新されることが好ましい:
信号対雑音比が低いとき、再構成されるスピーチの品質を改良するために“ハングオーバ”フレームが付加されることが好ましい。前の3つのフレームがアクティブとして分類され、現在のフレームは非アクティブと分類される場合、現在のフレームを含む次のMフレームはアクティブスピーチとして分類される。ハングオーバフレームの数Mは、表3に規定されているようにSNR(0)の関数として定められることが好ましい。
表 3:SNR(0)の関数としてのハングオーバフレーム
再び図3を参照すると、ステップ308 において、ステップ304 でアクティブであると分類された現在のフレームがスピーチ信号s(n)により示された特性にしたがってさらに分類される。好ましい実施形態では、アクティブスピーチは有声音スピーチ、無声音スピーチ、あるいは過渡スピーチのいずれかとして分類される。アクティブスピーチ信号によって示される周期性の程度は、それがどのように分類されるかを決定する。有声音スピーチは最高度の周期性を示す(本質的に擬似周期的)。無声音スピーチは周期性をほとんど、あるいは全く示さない。過渡スピーチは有声音スピーチと無声音スピーチの間の周期性の程度を示す。
ステップ310 において、符号器/復号器モードがステップ304 および308 の現在のフレームの分類に基づいて選択される。好ましい実施形態によると、モードは次のように選択される:非アクティブフレームおよびアクティブな無声音フレームはNELPモードを使用して符号化され、アクティブな有声音フレームはPPPモードを使用して符号化され、アクティブな過渡フレームはCELPモードを使用して符号化される。以下のセクションでこれらの各符号器/復号器モードをさらに詳細に説明する。
上述のように、現在のフレームがアクティブ過渡スピーチとして分類された場合、CELP符号器/復号器モードが使用される。CELPモードは最も正確な信号再生(ここに示されている別のモードと比較して)を最高のビットレートで提供する。
ピッチ符号化モジュール702 は、スピーチ信号s(n)および前のフレームからの量子化された残留pc (n)(以下説明する)を受取る。この入力に基づいて、ピッチ符号化モジュール702 はターゲット信号x(n)と1組のピッチフィルタパラメータを生成する。好ましい実施形態において、これらのピッチフィルタパラメータは最適ピッチ遅延L*と最適ピッチ利得b* を含んでいる。これらのパラメータは、符号化プロセスがこれらのパラメータを使用して、入力されたスピーチと合成されたスピーチとの間の加重されたエラーを最小にするピッチフィルタパラメータを選択する“合成による解析”方法にしたがって選択される。
W(z)=A(z)/A(z/γ)
という形態のものである。ここでA(z)はLPC予測エラーフィルタであり、γは0.8に等しいことが好ましい。加重されたLPC解析フィルタ806 は、初期パラメータ計算モジュール202 により計算されたLPC係数を受取る。フィルタ806 はazir (n)を出力し、これはLPC係数を与えられたゼロ入力応答である。加算器804 は負の入力と濾波された入力信号を合計してターゲット信号x(n)を形成する。
するLの値を決定し、次にb* を計算することにより見出されることができる。
符号化コードブック704 はターゲット信号x(n)を受取り、量子化された残留信号を再構成するために、ピッチフィルタパラメータと共に、CELP復号器モード206 により使用される1組のコードブック励起パラメータを決定する。
x(n)=x(n)−ypzir(n),0≦n≦40
ここでypzir(n)は、パラメータ^L* および^b* (ならびに前のサブフレームの処理の結果得られたメモリ)を有するピッチフィルタのゼロ入力応答である入力への、加重されたLPC合成フィルタ(前のサブフレームの終わりから保存されたメモリを有する)の出力である。
CELP復号器モード206 は、コードブック励起パラメータおよびピッチフィルタパラメータを含んでいることが好ましい符号化されたスピーチ信号をCELP符号器モード204 から受取り、このデータに基づいて合成されたスピーチ^s(n)を出力する。復号コードブックモジュール708 はコードブック励起パラメータを受取り、Gの利得を有する励起信号cb(n)を発生する。j番目のサブフレームに対する励起信号cb(n)は一般に、全ての値が
Sk =1−2SIGNjk,0≦k<5
のインパルスを対応的に有する5つの位置:
Ik =5CBIjk+k,0≦k<5
を除いてゼロを含んでいる。
フィルタ更新モジュール706 は、前のセクションにおいて説明したようにフィルタメモリを更新するためにスピーチを合成する。フィルタ更新モジュール706 はコードブック励起パラメータおよびピッチフィルタパラメータを受取り、励起信号cb(n)およびピッチフィルタGcb(n)を生成し、その後^s(n)を合成する。この合成を符号器において行うことにより、ピッチフィルタおよびLPC合成フィルタ中のメモリは、後続するサブフレームの処理時に使用されるように更新される。
原型ピッチ周期(PPP)符号化は、CELP符号化を使用して得られることのできるものより低いビットレートを達成するためにスピーチ信号の周期性を使用する。一般に、PPP符号化は、ここでは原型残留と呼ばれる残留信号の代表的な周期を抽出し、その後その原型を使用して、現在のフレームの原型残留と前のフレームからの類似のピッチ周期(すなわち、最後のフレームがPPPであった場合は原型残留)との間で補間を行うことにより初期のピッチ周期をフレーム中に構成することを含んでいる。PPP符号化の効果(低くされたビットレートに関する)は部分的に、現在および前の原型残留がどの程度その介在ピッチ周期に似ているかに依存する。この理由のために、PPP符号化は、ここでは擬似周期スピーチ信号と呼ばれる比較的高度の周期性を示すスピーチ信号(たとえば、有声音スピーチ)に適用されることが好ましい。
ステップ1002において、抽出モジュール904 は残留信号r(n)から原型残留rp (n)を抽出する。上記のセクションIII .Fで述べたように、初期パラメータ計算モジュール202 は、各フレームに対するr(n)を計算するためにLPC解析フィルタを使用する。好ましい実施形態においては、このフィルタ中のLPC係数はセクションVII .Aにおいて説明されているように知覚的に加重される。rp (n)の長さは、現在のフレームの中の最後のサブフレーム中に初期パラメータ計算モジュール202 によって計算されたピッチ遅延Lに等しい。
再び図10を参照すると、ステップ1004において回転コリレータ906 は、現在の原型残留rp (n)と、前のフレームからの原型残留rprev(n)とに基づいて1組の回転パラメータを計算する。これらのパラメータは、rprev(n)がrp (n)の予測子として使用されるためにどのように回転され、スケールされるのが一番よいかを記述している。好ましい実施形態において、回転パラメータのセットは、最適回転R* と最適利得b* とを含んでいる。図13は、ステップ1004をさらに詳細に示すフローチャートである。
x(n)=tmp2(n)+tmp2(n+L),0≦n<L
によって与えられる。
rwprev(n)=rprev(n* TWF),0≦n<L
として表されることができ、ここでTWFは時間ワープ係数Lp /Lである。非整数点におけるサンプル値n* TWFは、1組のsinc関数テーブルを使用して計算されることが好ましい。選択されたsincシーケンスは、sinc(−3−F:4−F)であり、ここでFは1/8の最も近い倍数に丸められた(rounded)n* TWFの端数部分である。このシーケンスの始めは、rprev((N−3)%Lp )と整列され、ここでNは最も近い1/8に丸められた後のn* TWFの整数部分である。
再び図10を参照すると、ステップ1006において、符号化コードブック908 は受取られたターゲット信号x(n)に基づいて1組のコードブックパラメータを発生する。符号化コードブック908 は、スケールされて加算され濾波されたときに合計するとx(n)に近似した信号となる1以上のコードベクトルを見出そうとする。好ましい実施形態では、符号化コードブック908 は、各ステージがスケールされたコードベクトルを生成する好ましくは3つのステージの、マルチステージコードブックとして構成される。したがって、コードブックパラメータのセットは、3つのコードベクトルに対応したインデックスおよび利得を含んでいる。図14はステップ1006をさらに詳細に示すフローチャートである。
x(n)=x(n)−by((n−R* )%L),0≦n<L
のように更新される。
再び図10を参照すると、ステップ1008において、フィルタ更新モジュール910 はPPP符号器モード204 により使用されたフィルタを更新する。図15Aおよび16Aに示されているように、フィルタ更新モジュール910 として2つの別の実施形態が与えられている。図15Aの第1の別の実施形態で示されているように、フィルタ更新モジュール910は復号コードブック1502と、回転子1504と、ワープフィルタ1506と、加算器1510と、整列および補間モジュール1508と、更新ピッチフィルタモジュール1512と、およびLPC合成フィルタ1514とを含んでいる。図16Aに示されている第2の実施形態は、復号コードブック1602と、回転子1604と、ワープフィルタ1606と、加算器1608と、更新ピッチフィルタモジュール1610と、循環LPC合成フィルタ1612と、および更新LPCフィルタモジュール1614とを含んでいる。図17および18は、この2つの実施形態によるステップ1008をさらに詳細に示すフローチャートである。
rcurr((n+R* )%L)=brwprev(n),0≦n<L
にしたがって前の原型残留のワープされた形態を回転させる。ここでrcurrは生成されるべき現在の原型であり、rwprevはピッチフィルタメモリの最も新しいL個のサンプルから得られた前の周期のワープされた(上記のセクションVIII.Aで述べたように、TWF=Lp /Lにより)形態であり、bおよびRはそれぞれパケット伝送コード:
図9および10を参照すると、ステップ1010においてPPP復号器モード206 は、受取られたコードブックおよび回転パラメータに基づいて原型残留rcurr(n)を再構成する。復号コードブック912 、回転子914 およびワープフィルタ918 は、前のセクションで述べたように動作する。周期インターポレータ920 は再構成された原型残留rcurr(n)と、前の再構成された原型残留rprev(n)を受取り、2つの原型の間のサンプルを補間し、合成されたスピーチ信号^s(n)を出力する。次のセクションにおいて周期インターポレータ920 を説明する。
ステップ1012において周期インターポレータ920 はrcurr(n)を受取り、合成されたスピーチ信号^s(n)を出力する。周期インターポレータ920 に対する2つの別の実施形態は、ここでは図15Bおよび16Bに示されている。図15Bの第1の別の実施形態において、周期インターポレータ920 は、整列および補間モジュール1516と、LPC合成フィルタ1518と、および更新ピッチフィルタモジュール1520とを含んでいる。図16Bに示されている第2の別の実施形態のものは、循環LPC合成フィルタ1616と、整列および補間モジュール1618と、更新ピッチフィルタモジュール1622と、および更新LPCフィルタモジュール1620とを含んでいる。図20および21はこれら2つの実施形態によるステップ1012をさらに詳細に示すフローチャートである。
雑音励起線形予測(NELP)符号化はスピーチ信号を擬似ランダム雑音シーケンスとしてモデル化し、それによってCELPまたはPPP符号化のいずれを使用して得られるより低いビットレートを達成する。NELP符号化は、スピーチ信号が無声音スピーチまたは背景雑音のようなピッチ構造をほとんど、あるいは全く有しない場合、信号再生に関して最も効率的に動作する。
上記において本発明の種々の実施形態を説明してきたが、それらは単なる例示として与えられたに過ぎず、何等本発明に制限を課すものではないことを理解すべきである。したがって、本発明の技術的範囲は上記に示されている例示的な実施形態のいずれの制限も受けず、添付された請求の範囲およびその等価なものによってのみ規定される。
以下に、本願出願の当初の特許請求の範囲に記載された発明を付記する。
[C1] 以下のステップを含むスピーチ信号の可変レート符号化のための方法:
(a)スピーチ信号をアクティブまたは非アクティブのいずれかとして分類する;
(b)前記アクティブスピーチを複数のタイプのアクティブスピーチの1つに分類する;
(c)スピーチ信号がアクティブであるか、あるいは非アクティブであるかに基づいて、およびアクティブならば、さらに前記アクティブスピーチのタイプに基づいて符号化モードを選択する;
(d)前記符号化モードにしたがってスピーチ信号を符号化して、符号化されたスピーチ信号を形成する。
[C2] さらに、前記符号化モードにしたがって前記符号化されたスピーチ信号を復号して、合成されたスピーチ信号を形成するステップを含んでいるC1記載の方法。
[C3] 前記符号化モードはCELP符号化モード、PPP符号化モード、またはNELP符号化モードを含んでいるC1記載の方法。
[C4] 前記符号化するステップは、前記符号化モードに関連した予め定められたビットレートで前記符号化モードにしたがって符号化するC3記載の方法。
[C5] 前記CELP符号化モードは8500ビット/秒のビットレートに関連し、前記PPP符号化モードは3900ビット/秒のビットレートに関連し、そして、前記NELP符号化モードは1550ビット/秒のビットレートに関連しているC4記載の方法。
[C6] 前記符号化モードはさらに、ゼロレートモードを含んでいるC3記載の方法。
[C7] 前記複数のタイプのアクティブスピーチは、有声音、無声音、および過渡アクティブスピーチを含んでいるC1記載の方法。
[C8] 符号化モードを選択する前記ステップは、
(a)前記スピーチがアクティブな過渡スピーチとして分類された場合には、CELPモードを選択する、
(b)前記スピーチがアクティブな有声音スピーチとして分類された場合には、PPPモードを選択する、
(c)前記スピーチが非アクティブスピーチまたはアクティブな無声音スピーチとして分類された場合には、NELPモードを選択する、
ステップを含んでいるC7記載の方法。
[C9] 前記符号化されたスピーチ信号は、前記CELPモードが選択された場合にはコードブックパラメータおよびピッチフィルタパラメータを含み、前記PPPモードが選択された場合にはコードブックパラメータおよび回転パラメータを含み、前記NELPモードが選択された場合にはコードブックパラメータを含んでいるC8記載の方法。
[C10] スピーチをアクティブまたは非アクティブとして分類する前記ステップは、2つのエネルギ帯域ベースの閾値化方式を含んでいるC1記載の方法。
[C11] スピーチをアクティブまたは非アクティブとして分類する前記ステップは、前のN ho フレームがアクティブとして分類されていた場合、次のMフレームをアクティブとして分類するステップを含んでいるC1記載の方法。
[C12] さらに、“ルックアヘッド”を使用して初期パラメータを計算するステップを含んでいるC1記載の方法。
[C13] 前記初期パラメータはLPC係数を含んでいるC12記載の方法。
[C14] 前記符号化モードはNELP符号化モードを含み、スピーチ信号は、線形予測符号化(LPC)解析フィルタによりスピーチ信号を濾波することにより発生された残留信号により表され、前記符号化するステップは、以下のステップを含む:
(i)残留信号のエネルギを推定する、
(ii)第1のコードブックからコードベクトルを選択する、前記コードベクトルは前記推定されたエネルギに近似する、
前記復号するステップは、以下のステップを含む:
(i)ランダムベクトルを発生する、
(ii)前記コードベクトルを第2のコードブックから検索する、
(iii)前記コードベクトルに基づいて前記ランダムベクトルをスケールする、前記スケールされたランダムベクトルのエネルギは前記推定されたエネルギに近似する、
(iv)前記スケールされたランダムベクトルをLPC合成フィルタで濾波する、前記濾波されたスケールされたランダムベクトルが前記合成されたスピーチ信号を形成する、C1記載の方法。
[C15] スピーチ信号はフレームに分割され、前記各フレームは2以上のサブフレームを含み、エネルギを推定する前記ステップは、前記サブフレームのそれぞれに関する残留信号のエネルギを推定するステップを含み、前記コードベクトルは、前記サブフレームのそれぞれに関する前記推定されたエネルギに近似した値を含んでいるC14記載の方法。
[C16] 前記第1のコードブックおよび前記第2のコードブックは確率コードブックであるC14記載の方法。
[C17] 前記第1のコードブックおよび前記第2のコードブックは訓練されたコードブックであるC14記載の方法。
[C18] 前記ランダムベクトルは単位分散ランダムベクトルであるC14記載の方法。
[C19] 以下を具備するスピーチ信号を符号化するための可変レート符号化システム:
スピーチ信号をアクティブまたは非アクティブとして分類し、アクティブの場合、アクティブスピーチを複数のタイプのアクティブスピーチの1つとして分類するための分類手段、
スピーチ信号を符号化されたスピーチ信号として符号化するための複数の符号化手段、前記符号化手段は、スピーチ信号がアクティブであるか、あるいは非アクティブであるかに基づいて、およびアクティブである場合には、さらに前記タイプのアクティブスピーチに基づいて、スピーチ信号を符号化するために動的に選択される。
[C20] さらに、前記符号化されたスピーチ信号を復号するための複数の復号手段を含んでいるC19記載のシステム。
[C21] 前記複数の符号化手段はCELP符号化手段、PPP符号化手段およびNELP符号化手段を含んでいるC19記載のシステム。
[C22] 前記複数の復号手段はCELP復号手段、PPP復号手段およびNELP復号手段を含んでいるC20記載のシステム。
[C23] 前記各符号化手段は、予め定められたビットレートで符号化するC21記載のシステム。
[C24] 前記CELP符号化手段は8500ビット/秒のレートで符号化し、前記PPP符号化手段は3900ビット/秒のレートで符号化し、または前記NELP符号化手段は1550ビット/秒のレートで符号化するC23記載のシステム。
[C25] 前記複数の符号化手段はさらに、ゼロレート符号化手段を含み、前記複数の復号手段はさらに、ゼロレート復号手段を含んでいるC21記載のシステム。
[C26] 前記複数のタイプのアクティブスピーチは、有声音、無声音、および過渡アクティブスピーチを含んでいるC19記載のシステム。
[C27] 前記スピーチがアクティブな過渡スピーチとして分類された場合には前記CELP符号器が選択され、前記スピーチがアクティブな有声音スピーチとして分類された場合にはPPP符号器が選択され、前記スピーチが非アクティブスピーチまたはアクティブな無声音スピーチとして分類された場合にはNELP符号器が選択されるC26記載のシステム。
[C28] 前記符号化されたスピーチ信号は、前記CELP符号器が選択された場合にはコードブックパラメータおよびピッチフィルタパラメータを含み、前記PPP符号器が選択された場合にはコードブックパラメータおよび回転パラメータを含み、あるいは、前記NELP符号器が選択された場合にはコードブックパラメータを含んでいるC27記載のシステム。
[C29] 前記分類手段は、2つのエネルギ帯域閾値化方式に基づいてスピーチをアクティブまたは非アクティブとして分類するC19記載のシステム。
[C30] 前記分類手段は、前のN ho フレームがアクティブとして分類された場合、次のMフレームをアクティブとして分類するC19記載のシステム。
[C31] スピーチ信号は、線形予測符号化(LPC)解析フィルタでスピーチ信号を濾波することにより発生された残留信号によって表され、前記複数の符号化手段は、以下を含むNELP符号化手段を含む:
残留信号のエネルギの推定を計算するためのエネルギ推定装置手段、
コードベクトルを第1のコードブックから選択するためのコードブック符号化手段、ここにおいて前記コードベクトルは、前記推定されたエネルギに近似する、ここにおいて前記複数の復号手段は、以下を含むNELP復号手段を含む:
ランダムベクトルを発生するためのランダム数発生手段、
前記コードベクトルを第2のコードブックから検索するためのコードブック復号手段、 前記コードベクトルに基づいて前記ランダムベクトルをスケールする、前記スケールされたランダムベクトルのエネルギは前記推定に近似するための乗算手段、
前記スケールされたランダムベクトルをLPC合成フィルタで濾波するための手段、前記濾波されたスケールされたランダムベクトルは、前記合成されたスピーチ信号を形成するC19記載のシステム。
[C32] スピーチ信号はフレームに分割され、前記各フレームは2以上のサブフレームを含み、前記エネルギ推定装置手段は、前記サブフレームのそれぞれに関する残留信号のエネルギの推定を計算し、前記コードベクトルは、前記サブフレームのそれぞれに関する前記サブフレーム推定に近似した値を含んでいるC19記載のシステム。
[C33] 前記第1のコードブックおよび前記第2のコードブックは確率コードブックであるC19記載のシステム。
[C34] 前記第1のコードブックおよび前記第2のコードブックは訓練されたコードブックであるC19記載のシステム。
[C35] 前記ランダムベクトルは、単位分散ランダムベクトルを含んでいるC19記載のシステム。
Claims (35)
- 以下のステップを含むスピーチ信号の可変レート符号化のための方法:
(a)スピーチ信号をアクティブまたは非アクティブのいずれかとして分類する;
(b)前記アクティブスピーチを複数のタイプのアクティブスピーチの1つに分類する;
(c)スピーチ信号がアクティブであるか、あるいは非アクティブであるかに基づいて、およびアクティブならば、さらに前記アクティブスピーチのタイプに基づいて符号化モードを選択する;
(d)前記符号化モードにしたがってスピーチ信号を符号化して、符号化されたスピーチ信号を形成する。 - さらに、前記符号化モードにしたがって前記符号化されたスピーチ信号を復号して、合成されたスピーチ信号を形成するステップを含んでいる請求項1記載の方法。
- 前記符号化モードはCELP符号化モード、PPP符号化モード、またはNELP符号化モードを含んでいる請求項1記載の方法。
- 前記符号化するステップは、前記符号化モードに関連した予め定められたビットレートで前記符号化モードにしたがって符号化する請求項3記載の方法。
- 前記CELP符号化モードは8500ビット/秒のビットレートに関連し、前記PPP符号化モードは3900ビット/秒のビットレートに関連し、そして、前記NELP符号化モードは1550ビット/秒のビットレートに関連している請求項4記載の方法。
- 前記符号化モードはさらに、ゼロレートモードを含んでいる請求項3記載の方法。
- 前記複数のタイプのアクティブスピーチは、有声音、無声音、および過渡アクティブスピーチを含んでいる請求項1記載の方法。
- 符号化モードを選択する前記ステップは、
(a)前記スピーチがアクティブな過渡スピーチとして分類された場合には、CELPモードを選択する、
(b)前記スピーチがアクティブな有声音スピーチとして分類された場合には、PPPモードを選択する、
(c)前記スピーチが非アクティブスピーチまたはアクティブな無声音スピーチとして分類された場合には、NELPモードを選択する、
ステップを含んでいる請求項7記載の方法。 - 前記符号化されたスピーチ信号は、前記CELPモードが選択された場合にはコードブックパラメータおよびピッチフィルタパラメータを含み、前記PPPモードが選択された場合にはコードブックパラメータおよび回転パラメータを含み、前記NELPモードが選択された場合にはコードブックパラメータを含んでいる請求項8記載の方法。
- スピーチをアクティブまたは非アクティブとして分類する前記ステップは、2つのエネルギ帯域ベースの閾値化方式を含んでいる請求項1記載の方法。
- スピーチをアクティブまたは非アクティブとして分類する前記ステップは、前のNhoフレームがアクティブとして分類されていた場合、次のMフレームをアクティブとして分類するステップを含んでいる請求項1記載の方法。
- さらに、“ルックアヘッド”を使用して初期パラメータを計算するステップを含んでいる請求項1記載の方法。
- 前記初期パラメータはLPC係数を含んでいる請求項12記載の方法。
- 前記符号化モードはNELP符号化モードを含み、スピーチ信号は、線形予測符号化(LPC)解析フィルタによりスピーチ信号を濾波することにより発生された残留信号により表され、前記符号化するステップは、以下のステップを含む:
(i)残留信号のエネルギを推定する、
(ii)第1のコードブックからコードベクトルを選択する、前記コードベクトルは前記推定されたエネルギに近似する、
前記復号するステップは、以下のステップを含む:
(i)ランダムベクトルを発生する、
(ii)前記コードベクトルを第2のコードブックから検索する、
(iii)前記コードベクトルに基づいて前記ランダムベクトルをスケールする、前記スケールされたランダムベクトルのエネルギは前記推定されたエネルギに近似する、
(iv)前記スケールされたランダムベクトルをLPC合成フィルタで濾波する、前記濾波されたスケールされたランダムベクトルが前記合成されたスピーチ信号を形成する、請求項1記載の方法。 - スピーチ信号はフレームに分割され、前記各フレームは2以上のサブフレームを含み、エネルギを推定する前記ステップは、前記サブフレームのそれぞれに関する残留信号のエネルギを推定するステップを含み、前記コードベクトルは、前記サブフレームのそれぞれに関する前記推定されたエネルギに近似した値を含んでいる請求項14記載の方法。
- 前記第1のコードブックおよび前記第2のコードブックは確率コードブックである請求項14記載の方法。
- 前記第1のコードブックおよび前記第2のコードブックは訓練されたコードブックである請求項14記載の方法。
- 前記ランダムベクトルは単位分散ランダムベクトルである請求項14記載の方法。
- 以下を具備するスピーチ信号を符号化するための可変レート符号化システム:
スピーチ信号をアクティブまたは非アクティブとして分類し、アクティブの場合、アクティブスピーチを複数のタイプのアクティブスピーチの1つとして分類するための分類手段、
スピーチ信号を符号化されたスピーチ信号として符号化するための複数の符号化手段、前記符号化手段は、スピーチ信号がアクティブであるか、あるいは非アクティブであるかに基づいて、およびアクティブである場合には、さらに前記タイプのアクティブスピーチに基づいて、スピーチ信号を符号化するために動的に選択される。 - さらに、前記符号化されたスピーチ信号を復号するための複数の復号手段を含んでいる請求項19記載のシステム。
- 前記複数の符号化手段はCELP符号化手段、PPP符号化手段およびNELP符号化手段を含んでいる請求項19記載のシステム。
- 前記複数の復号手段はCELP復号手段、PPP復号手段およびNELP復号手段を含んでいる請求項20記載のシステム。
- 前記各符号化手段は、予め定められたビットレートで符号化する請求項21記載のシステム。
- 前記CELP符号化手段は8500ビット/秒のレートで符号化し、前記PPP符号化手段は3900ビット/秒のレートで符号化し、または前記NELP符号化手段は1550ビット/秒のレートで符号化する請求項23記載のシステム。
- 前記複数の符号化手段はさらに、ゼロレート符号化手段を含み、前記複数の復号手段はさらに、ゼロレート復号手段を含んでいる請求項21記載のシステム。
- 前記複数のタイプのアクティブスピーチは、有声音、無声音、および過渡アクティブスピーチを含んでいる請求項19記載のシステム。
- 前記スピーチがアクティブな過渡スピーチとして分類された場合には前記CELP符号器が選択され、前記スピーチがアクティブな有声音スピーチとして分類された場合にはPPP符号器が選択され、前記スピーチが非アクティブスピーチまたはアクティブな無声音スピーチとして分類された場合にはNELP符号器が選択される請求項26記載のシステム。
- 前記符号化されたスピーチ信号は、前記CELP符号器が選択された場合にはコードブックパラメータおよびピッチフィルタパラメータを含み、前記PPP符号器が選択された場合にはコードブックパラメータおよび回転パラメータを含み、あるいは、前記NELP符号器が選択された場合にはコードブックパラメータを含んでいる請求項27記載のシステム。
- 前記分類手段は、2つのエネルギ帯域閾値化方式に基づいてスピーチをアクティブまたは非アクティブとして分類する請求項19記載のシステム。
- 前記分類手段は、前のNhoフレームがアクティブとして分類された場合、次のMフレームをアクティブとして分類する請求項19記載のシステム。
- スピーチ信号は、線形予測符号化(LPC)解析フィルタでスピーチ信号を濾波することにより発生された残留信号によって表され、前記複数の符号化手段は、以下を含むNELP符号化手段を含む:
残留信号のエネルギの推定を計算するためのエネルギ推定装置手段、
コードベクトルを第1のコードブックから選択するためのコードブック符号化手段、ここにおいて前記コードベクトルは、前記推定されたエネルギに近似する、ここにおいて前記複数の復号手段は、以下を含むNELP復号手段を含む:
ランダムベクトルを発生するためのランダム数発生手段、
前記コードベクトルを第2のコードブックから検索するためのコードブック復号手段、 前記コードベクトルに基づいて前記ランダムベクトルをスケールする、前記スケールされたランダムベクトルのエネルギは前記推定に近似するための乗算手段、
前記スケールされたランダムベクトルをLPC合成フィルタで濾波するための手段、前記濾波されたスケールされたランダムベクトルは、前記合成されたスピーチ信号を形成する請求項19記載のシステム。 - スピーチ信号はフレームに分割され、前記各フレームは2以上のサブフレームを含み、前記エネルギ推定装置手段は、前記サブフレームのそれぞれに関する残留信号のエネルギの推定を計算し、前記コードベクトルは、前記サブフレームのそれぞれに関する前記サブフレーム推定に近似した値を含んでいる請求項19記載のシステム。
- 前記第1のコードブックおよび前記第2のコードブックは確率コードブックである請求項19記載のシステム。
- 前記第1のコードブックおよび前記第2のコードブックは訓練されたコードブックである請求項19記載のシステム。
- 前記ランダムベクトルは、単位分散ランダムベクトルを含んでいる請求項19記載のシステム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US09/217,341 | 1998-12-21 | ||
US09/217,341 US6691084B2 (en) | 1998-12-21 | 1998-12-21 | Multiple mode variable rate speech coding |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011002269A Division JP2011123506A (ja) | 1998-12-21 | 2011-01-07 | 可変レートスピーチ符号化 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013178545A true JP2013178545A (ja) | 2013-09-09 |
JP5373217B2 JP5373217B2 (ja) | 2013-12-18 |
Family
ID=22810659
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000590164A Expired - Lifetime JP4927257B2 (ja) | 1998-12-21 | 1999-12-21 | 可変レートスピーチ符号化 |
JP2011002269A Withdrawn JP2011123506A (ja) | 1998-12-21 | 2011-01-07 | 可変レートスピーチ符号化 |
JP2013087419A Expired - Lifetime JP5373217B2 (ja) | 1998-12-21 | 2013-04-18 | 可変レートスピーチ符号化 |
Family Applications Before (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000590164A Expired - Lifetime JP4927257B2 (ja) | 1998-12-21 | 1999-12-21 | 可変レートスピーチ符号化 |
JP2011002269A Withdrawn JP2011123506A (ja) | 1998-12-21 | 2011-01-07 | 可変レートスピーチ符号化 |
Country Status (11)
Country | Link |
---|---|
US (3) | US6691084B2 (ja) |
EP (2) | EP1141947B1 (ja) |
JP (3) | JP4927257B2 (ja) |
KR (1) | KR100679382B1 (ja) |
CN (3) | CN100369112C (ja) |
AT (1) | ATE424023T1 (ja) |
AU (1) | AU2377500A (ja) |
DE (1) | DE69940477D1 (ja) |
ES (1) | ES2321147T3 (ja) |
HK (1) | HK1040807B (ja) |
WO (1) | WO2000038179A2 (ja) |
Families Citing this family (112)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3273599B2 (ja) * | 1998-06-19 | 2002-04-08 | 沖電気工業株式会社 | 音声符号化レート選択器と音声符号化装置 |
JP4438127B2 (ja) * | 1999-06-18 | 2010-03-24 | ソニー株式会社 | 音声符号化装置及び方法、音声復号装置及び方法、並びに記録媒体 |
FI116992B (fi) * | 1999-07-05 | 2006-04-28 | Nokia Corp | Menetelmät, järjestelmä ja laitteet audiosignaalin koodauksen ja siirron tehostamiseksi |
US6782360B1 (en) * | 1999-09-22 | 2004-08-24 | Mindspeed Technologies, Inc. | Gain quantization for a CELP speech coder |
US6959274B1 (en) * | 1999-09-22 | 2005-10-25 | Mindspeed Technologies, Inc. | Fixed rate speech compression system and method |
US7054809B1 (en) * | 1999-09-22 | 2006-05-30 | Mindspeed Technologies, Inc. | Rate selection method for selectable mode vocoder |
JP2001102970A (ja) * | 1999-09-29 | 2001-04-13 | Matsushita Electric Ind Co Ltd | 通信端末装置及び無線通信方法 |
US6715125B1 (en) * | 1999-10-18 | 2004-03-30 | Agere Systems Inc. | Source coding and transmission with time diversity |
US7263074B2 (en) * | 1999-12-09 | 2007-08-28 | Broadcom Corporation | Voice activity detection based on far-end and near-end statistics |
US7260523B2 (en) * | 1999-12-21 | 2007-08-21 | Texas Instruments Incorporated | Sub-band speech coding system |
CN1187735C (zh) * | 2000-01-11 | 2005-02-02 | 松下电器产业株式会社 | 多模式话音编码装置和解码装置 |
EP1279167B1 (en) * | 2000-04-24 | 2007-05-30 | QUALCOMM Incorporated | Method and apparatus for predictively quantizing voiced speech |
US6584438B1 (en) | 2000-04-24 | 2003-06-24 | Qualcomm Incorporated | Frame erasure compensation method in a variable rate speech coder |
US6954745B2 (en) | 2000-06-02 | 2005-10-11 | Canon Kabushiki Kaisha | Signal processing system |
US7010483B2 (en) | 2000-06-02 | 2006-03-07 | Canon Kabushiki Kaisha | Speech processing system |
US7072833B2 (en) | 2000-06-02 | 2006-07-04 | Canon Kabushiki Kaisha | Speech processing system |
US7035790B2 (en) | 2000-06-02 | 2006-04-25 | Canon Kabushiki Kaisha | Speech processing system |
US6937979B2 (en) * | 2000-09-15 | 2005-08-30 | Mindspeed Technologies, Inc. | Coding based on spectral content of a speech signal |
CN1212605C (zh) * | 2001-01-22 | 2005-07-27 | 卡纳斯数据株式会社 | 用于数字音频数据的编码方法和解码方法 |
FR2825826B1 (fr) * | 2001-06-11 | 2003-09-12 | Cit Alcatel | Procede pour detecter l'activite vocale dans un signal, et codeur de signal vocal comportant un dispositif pour la mise en oeuvre de ce procede |
US20030120484A1 (en) * | 2001-06-12 | 2003-06-26 | David Wong | Method and system for generating colored comfort noise in the absence of silence insertion description packets |
US20040199383A1 (en) * | 2001-11-16 | 2004-10-07 | Yumiko Kato | Speech encoder, speech decoder, speech endoding method, and speech decoding method |
US7546238B2 (en) | 2002-02-04 | 2009-06-09 | Mitsubishi Denki Kabushiki Kaisha | Digital circuit transmission device |
KR20030066883A (ko) * | 2002-02-05 | 2003-08-14 | (주)아이소테크 | 음성 재생 속도를 이용한 인터넷상에서의 학습 능력 향상장치 및 방법 |
US7096180B2 (en) * | 2002-05-15 | 2006-08-22 | Intel Corporation | Method and apparatuses for improving quality of digitally encoded speech in the presence of interference |
US7657427B2 (en) * | 2002-10-11 | 2010-02-02 | Nokia Corporation | Methods and devices for source controlled variable bit-rate wideband speech coding |
US7406096B2 (en) * | 2002-12-06 | 2008-07-29 | Qualcomm Incorporated | Tandem-free intersystem voice communication |
WO2004084467A2 (en) * | 2003-03-15 | 2004-09-30 | Mindspeed Technologies, Inc. | Recovering an erased voice frame with time warping |
US20050004793A1 (en) * | 2003-07-03 | 2005-01-06 | Pasi Ojala | Signal adaptation for higher band coding in a codec utilizing band split coding |
US20050096898A1 (en) * | 2003-10-29 | 2005-05-05 | Manoj Singhal | Classification of speech and music using sub-band energy |
JP4089596B2 (ja) * | 2003-11-17 | 2008-05-28 | 沖電気工業株式会社 | 電話交換装置 |
FR2867649A1 (fr) * | 2003-12-10 | 2005-09-16 | France Telecom | Procede de codage multiple optimise |
US20050216260A1 (en) * | 2004-03-26 | 2005-09-29 | Intel Corporation | Method and apparatus for evaluating speech quality |
KR101407429B1 (ko) * | 2004-09-17 | 2014-06-17 | 코닌클리케 필립스 엔.브이. | 지각적 왜곡을 최소화하는 복합 오디오 코딩 |
EP1815463A1 (en) * | 2004-11-05 | 2007-08-08 | Koninklijke Philips Electronics N.V. | Efficient audio coding using signal properties |
KR20070109982A (ko) * | 2004-11-09 | 2007-11-15 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 오디오 코딩 및 디코딩 |
US7567903B1 (en) | 2005-01-12 | 2009-07-28 | At&T Intellectual Property Ii, L.P. | Low latency real-time vocal tract length normalization |
CN100592389C (zh) * | 2008-01-18 | 2010-02-24 | 华为技术有限公司 | 合成滤波器状态更新方法及装置 |
US20090210219A1 (en) * | 2005-05-30 | 2009-08-20 | Jong-Mo Sung | Apparatus and method for coding and decoding residual signal |
US7599833B2 (en) * | 2005-05-30 | 2009-10-06 | Electronics And Telecommunications Research Institute | Apparatus and method for coding residual signals of audio signals into a frequency domain and apparatus and method for decoding the same |
US7184937B1 (en) * | 2005-07-14 | 2007-02-27 | The United States Of America As Represented By The Secretary Of The Army | Signal repetition-rate and frequency-drift estimator using proportional-delayed zero-crossing techniques |
US8483704B2 (en) * | 2005-07-25 | 2013-07-09 | Qualcomm Incorporated | Method and apparatus for maintaining a fingerprint for a wireless network |
US8477731B2 (en) * | 2005-07-25 | 2013-07-02 | Qualcomm Incorporated | Method and apparatus for locating a wireless local area network in a wide area network |
CN100369489C (zh) * | 2005-07-28 | 2008-02-13 | 上海大学 | 动态接入编码策略的嵌入式无线编码装置 |
US8259840B2 (en) * | 2005-10-24 | 2012-09-04 | General Motors Llc | Data communication via a voice channel of a wireless communication network using discontinuities |
EP1955320A2 (en) * | 2005-12-02 | 2008-08-13 | QUALCOMM Incorporated | Systems, methods, and apparatus for frequency-domain waveform alignment |
ATE475171T1 (de) * | 2005-12-05 | 2010-08-15 | Qualcomm Inc | Verfahren und vorrichtung zur erkennung tonaler komponenten von audiosignalen |
US8032369B2 (en) * | 2006-01-20 | 2011-10-04 | Qualcomm Incorporated | Arbitrary average data rates for variable rate coders |
US8346544B2 (en) * | 2006-01-20 | 2013-01-01 | Qualcomm Incorporated | Selection of encoding modes and/or encoding rates for speech compression with closed loop re-decision |
US8090573B2 (en) * | 2006-01-20 | 2012-01-03 | Qualcomm Incorporated | Selection of encoding modes and/or encoding rates for speech compression with open loop re-decision |
US20100161323A1 (en) * | 2006-04-27 | 2010-06-24 | Panasonic Corporation | Audio encoding device, audio decoding device, and their method |
US8682652B2 (en) * | 2006-06-30 | 2014-03-25 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic |
US7873511B2 (en) * | 2006-06-30 | 2011-01-18 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic |
US8532984B2 (en) | 2006-07-31 | 2013-09-10 | Qualcomm Incorporated | Systems, methods, and apparatus for wideband encoding and decoding of active frames |
US8725499B2 (en) * | 2006-07-31 | 2014-05-13 | Qualcomm Incorporated | Systems, methods, and apparatus for signal change detection |
US8260609B2 (en) | 2006-07-31 | 2012-09-04 | Qualcomm Incorporated | Systems, methods, and apparatus for wideband encoding and decoding of inactive frames |
US8239190B2 (en) * | 2006-08-22 | 2012-08-07 | Qualcomm Incorporated | Time-warping frames of wideband vocoder |
CN101145343B (zh) * | 2006-09-15 | 2011-07-20 | 展讯通信(上海)有限公司 | 一种用于音频处理框架中的编码和解码方法 |
US8489392B2 (en) * | 2006-11-06 | 2013-07-16 | Nokia Corporation | System and method for modeling speech spectra |
CN100483509C (zh) * | 2006-12-05 | 2009-04-29 | 华为技术有限公司 | 声音信号分类方法和装置 |
US8200483B2 (en) * | 2006-12-15 | 2012-06-12 | Panasonic Corporation | Adaptive sound source vector quantization device, adaptive sound source vector inverse quantization device, and method thereof |
US8279889B2 (en) | 2007-01-04 | 2012-10-02 | Qualcomm Incorporated | Systems and methods for dimming a first packet associated with a first bit rate to a second packet associated with a second bit rate |
CN101246688B (zh) * | 2007-02-14 | 2011-01-12 | 华为技术有限公司 | 一种对背景噪声信号进行编解码的方法、系统和装置 |
CN101320563B (zh) * | 2007-06-05 | 2012-06-27 | 华为技术有限公司 | 一种背景噪声编码/解码装置、方法和通信设备 |
US9653088B2 (en) * | 2007-06-13 | 2017-05-16 | Qualcomm Incorporated | Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding |
CN101325059B (zh) * | 2007-06-15 | 2011-12-21 | 华为技术有限公司 | 语音编解码收发方法及装置 |
EP2198426A4 (en) * | 2007-10-15 | 2012-01-18 | Lg Electronics Inc | METHOD AND DEVICE FOR PROCESSING A SIGNAL |
US8600740B2 (en) * | 2008-01-28 | 2013-12-03 | Qualcomm Incorporated | Systems, methods and apparatus for context descriptor transmission |
KR101441896B1 (ko) * | 2008-01-29 | 2014-09-23 | 삼성전자주식회사 | 적응적 lpc 계수 보간을 이용한 오디오 신호의 부호화,복호화 방법 및 장치 |
DE102008009720A1 (de) * | 2008-02-19 | 2009-08-20 | Siemens Enterprise Communications Gmbh & Co. Kg | Verfahren und Mittel zur Dekodierung von Hintergrundrauschinformationen |
US20090319263A1 (en) * | 2008-06-20 | 2009-12-24 | Qualcomm Incorporated | Coding of transitional speech frames for low-bit-rate applications |
US20090319261A1 (en) * | 2008-06-20 | 2009-12-24 | Qualcomm Incorporated | Coding of transitional speech frames for low-bit-rate applications |
US8768690B2 (en) * | 2008-06-20 | 2014-07-01 | Qualcomm Incorporated | Coding scheme selection for low-bit-rate applications |
US9327193B2 (en) | 2008-06-27 | 2016-05-03 | Microsoft Technology Licensing, Llc | Dynamic selection of voice quality over a wireless system |
KR20100006492A (ko) * | 2008-07-09 | 2010-01-19 | 삼성전자주식회사 | 부호화 방식 결정 방법 및 장치 |
CN103000186B (zh) | 2008-07-11 | 2015-01-14 | 弗劳恩霍夫应用研究促进协会 | 提供时间扭曲激活信号以及使用该时间扭曲激活信号对音频信号编码 |
MY154452A (en) | 2008-07-11 | 2015-06-15 | Fraunhofer Ges Forschung | An apparatus and a method for decoding an encoded audio signal |
KR101230183B1 (ko) * | 2008-07-14 | 2013-02-15 | 광운대학교 산학협력단 | 오디오 신호의 상태결정 장치 |
GB2466670B (en) * | 2009-01-06 | 2012-11-14 | Skype | Speech encoding |
GB2466669B (en) * | 2009-01-06 | 2013-03-06 | Skype | Speech coding |
GB2466671B (en) * | 2009-01-06 | 2013-03-27 | Skype | Speech encoding |
GB2466675B (en) | 2009-01-06 | 2013-03-06 | Skype | Speech coding |
GB2466673B (en) | 2009-01-06 | 2012-11-07 | Skype | Quantization |
GB2466672B (en) * | 2009-01-06 | 2013-03-13 | Skype | Speech coding |
GB2466674B (en) * | 2009-01-06 | 2013-11-13 | Skype | Speech coding |
US8462681B2 (en) * | 2009-01-15 | 2013-06-11 | The Trustees Of Stevens Institute Of Technology | Method and apparatus for adaptive transmission of sensor data with latency controls |
KR101622950B1 (ko) * | 2009-01-28 | 2016-05-23 | 삼성전자주식회사 | 오디오 신호의 부호화 및 복호화 방법 및 그 장치 |
CN101615910B (zh) | 2009-05-31 | 2010-12-22 | 华为技术有限公司 | 压缩编码的方法、装置和设备以及压缩解码方法 |
CN101930426B (zh) * | 2009-06-24 | 2015-08-05 | 华为技术有限公司 | 信号处理方法、数据处理方法及装置 |
KR20110001130A (ko) * | 2009-06-29 | 2011-01-06 | 삼성전자주식회사 | 가중 선형 예측 변환을 이용한 오디오 신호 부호화 및 복호화 장치 및 그 방법 |
US8452606B2 (en) * | 2009-09-29 | 2013-05-28 | Skype | Speech encoding using multiple bit rates |
US20110153337A1 (en) * | 2009-12-17 | 2011-06-23 | Electronics And Telecommunications Research Institute | Encoding apparatus and method and decoding apparatus and method of audio/voice signal processing apparatus |
US20130268265A1 (en) * | 2010-07-01 | 2013-10-10 | Gyuhyeok Jeong | Method and device for processing audio signal |
CN102971789B (zh) | 2010-12-24 | 2015-04-15 | 华为技术有限公司 | 用于执行话音活动检测的方法和设备 |
EP2671323B1 (en) * | 2011-02-01 | 2016-10-05 | Huawei Technologies Co., Ltd. | Method and apparatus for providing signal processing coefficients |
DK2975611T3 (en) * | 2011-03-10 | 2018-04-03 | Ericsson Telefon Ab L M | FILLING OF UNCODED SUBVECTORS IN TRANSFORM CODED AUDIO SIGNALS |
US8990074B2 (en) | 2011-05-24 | 2015-03-24 | Qualcomm Incorporated | Noise-robust speech coding mode classification |
WO2012177067A2 (ko) * | 2011-06-21 | 2012-12-27 | 삼성전자 주식회사 | 오디오 신호 처리방법 및 장치와 이를 채용하는 단말기 |
US20130110522A1 (en) | 2011-10-21 | 2013-05-02 | Samsung Electronics Co., Ltd. | Energy lossless-encoding method and apparatus, audio encoding method and apparatus, energy lossless-decoding method and apparatus, and audio decoding method and apparatus |
KR20130093783A (ko) * | 2011-12-30 | 2013-08-23 | 한국전자통신연구원 | 오디오 객체 전송 장치 및 방법 |
US9111531B2 (en) * | 2012-01-13 | 2015-08-18 | Qualcomm Incorporated | Multiple coding mode signal classification |
PL2922052T3 (pl) * | 2012-11-13 | 2021-12-20 | Samsung Electronics Co., Ltd. | Sposób ustalania trybu kodowania |
CN103915097B (zh) * | 2013-01-04 | 2017-03-22 | 中国移动通信集团公司 | 一种语音信号处理方法、装置和系统 |
CN104517612B (zh) * | 2013-09-30 | 2018-10-12 | 上海爱聊信息科技有限公司 | 基于amr-nb语音信号的可变码率编码器和解码器及其编码和解码方法 |
CN105096958B (zh) | 2014-04-29 | 2017-04-12 | 华为技术有限公司 | 音频编码方法及相关装置 |
GB2526128A (en) * | 2014-05-15 | 2015-11-18 | Nokia Technologies Oy | Audio codec mode selector |
EP2980795A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor |
US10186276B2 (en) * | 2015-09-25 | 2019-01-22 | Qualcomm Incorporated | Adaptive noise suppression for super wideband music |
CN106160944B (zh) * | 2016-07-07 | 2019-04-23 | 广州市恒力安全检测技术有限公司 | 一种超声波局部放电信号的变速率编码压缩方法 |
CN108932944B (zh) * | 2017-10-23 | 2021-07-30 | 北京猎户星空科技有限公司 | 解码方法及装置 |
CN110390939B (zh) * | 2019-07-15 | 2021-08-20 | 珠海市杰理科技股份有限公司 | 音频压缩方法和装置 |
US11715477B1 (en) * | 2022-04-08 | 2023-08-01 | Digital Voice Systems, Inc. | Speech model parameter estimation and quantization |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1992005539A1 (en) * | 1990-09-20 | 1992-04-02 | Digital Voice Systems, Inc. | Methods for speech analysis and synthesis |
JPH05130067A (ja) * | 1991-10-31 | 1993-05-25 | Nec Corp | 可変閾値型音声検出器 |
JPH07225599A (ja) * | 1994-02-15 | 1995-08-22 | Nippon Telegr & Teleph Corp <Ntt> | 音声の符号化方法 |
JPH08254998A (ja) * | 1995-03-17 | 1996-10-01 | Ido Tsushin Syst Kaihatsu Kk | 音声符号化/復号化装置 |
JPH0955665A (ja) * | 1995-08-14 | 1997-02-25 | Toshiba Corp | 音声符号化装置 |
JPH09212195A (ja) * | 1995-12-12 | 1997-08-15 | Nokia Mobile Phones Ltd | 音声活性検出装置及び移動局並びに音声活性検出方法 |
JPH10143199A (ja) * | 1996-11-15 | 1998-05-29 | Nippon Telegr & Teleph Corp <Ntt> | 音声符号化方法および復号化方法 |
JPH10232697A (ja) * | 1997-02-21 | 1998-09-02 | Nippon Telegr & Teleph Corp <Ntt> | 音声符号化方法および復号化方法 |
Family Cites Families (64)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3633107A (en) | 1970-06-04 | 1972-01-04 | Bell Telephone Labor Inc | Adaptive signal processor for diversity radio receivers |
JPS5017711A (ja) | 1973-06-15 | 1975-02-25 | ||
US4076958A (en) | 1976-09-13 | 1978-02-28 | E-Systems, Inc. | Signal synthesizer spectrum contour scaler |
US4214125A (en) | 1977-01-21 | 1980-07-22 | Forrest S. Mozer | Method and apparatus for speech synthesizing |
CA1123955A (en) | 1978-03-30 | 1982-05-18 | Tetsu Taguchi | Speech analysis and synthesis apparatus |
DE3023375C1 (ja) | 1980-06-23 | 1987-12-03 | Siemens Ag, 1000 Berlin Und 8000 Muenchen, De | |
USRE32580E (en) | 1981-12-01 | 1988-01-19 | American Telephone And Telegraph Company, At&T Bell Laboratories | Digital speech coder |
JPS6011360B2 (ja) | 1981-12-15 | 1985-03-25 | ケイディディ株式会社 | 音声符号化方式 |
US4535472A (en) | 1982-11-05 | 1985-08-13 | At&T Bell Laboratories | Adaptive bit allocator |
EP0111612B1 (fr) | 1982-11-26 | 1987-06-24 | International Business Machines Corporation | Procédé et dispositif de codage d'un signal vocal |
US4764963A (en) * | 1983-04-12 | 1988-08-16 | American Telephone And Telegraph Company, At&T Bell Laboratories | Speech pattern compression arrangement utilizing speech event identification |
EP0127718B1 (fr) | 1983-06-07 | 1987-03-18 | International Business Machines Corporation | Procédé de détection d'activité dans un système de transmission de la voix |
US4672670A (en) | 1983-07-26 | 1987-06-09 | Advanced Micro Devices, Inc. | Apparatus and methods for coding, decoding, analyzing and synthesizing a signal |
US4937873A (en) | 1985-03-18 | 1990-06-26 | Massachusetts Institute Of Technology | Computationally efficient sine wave synthesis for acoustic waveform processing |
US4885790A (en) | 1985-03-18 | 1989-12-05 | Massachusetts Institute Of Technology | Processing of acoustic waveforms |
US4856068A (en) | 1985-03-18 | 1989-08-08 | Massachusetts Institute Of Technology | Audio pre-processing methods and apparatus |
US4827517A (en) | 1985-12-26 | 1989-05-02 | American Telephone And Telegraph Company, At&T Bell Laboratories | Digital speech processor using arbitrary excitation coding |
US4797929A (en) | 1986-01-03 | 1989-01-10 | Motorola, Inc. | Word recognition in a speech recognition system using data reduced word templates |
JPH0748695B2 (ja) | 1986-05-23 | 1995-05-24 | 株式会社日立製作所 | 音声符号化方式 |
US4899384A (en) | 1986-08-25 | 1990-02-06 | Ibm Corporation | Table controlled dynamic bit allocation in a variable rate sub-band speech coder |
US4771465A (en) | 1986-09-11 | 1988-09-13 | American Telephone And Telegraph Company, At&T Bell Laboratories | Digital speech sinusoidal vocoder with transmission of only subset of harmonics |
US4797925A (en) | 1986-09-26 | 1989-01-10 | Bell Communications Research, Inc. | Method for coding speech at low bit rates |
US5054072A (en) | 1987-04-02 | 1991-10-01 | Massachusetts Institute Of Technology | Coding of acoustic waveforms |
US4890327A (en) | 1987-06-03 | 1989-12-26 | Itt Corporation | Multi-rate digital voice coder apparatus |
US4899385A (en) | 1987-06-26 | 1990-02-06 | American Telephone And Telegraph Company | Code excited linear predictive vocoder |
US4852179A (en) | 1987-10-05 | 1989-07-25 | Motorola, Inc. | Variable frame rate, fixed bit rate vocoding method |
US4896361A (en) | 1988-01-07 | 1990-01-23 | Motorola, Inc. | Digital speech coder having improved vector excitation source |
EP0331858B1 (en) | 1988-03-08 | 1993-08-25 | International Business Machines Corporation | Multi-rate voice encoding method and device |
EP0331857B1 (en) | 1988-03-08 | 1992-05-20 | International Business Machines Corporation | Improved low bit rate voice coding method and system |
US5023910A (en) | 1988-04-08 | 1991-06-11 | At&T Bell Laboratories | Vector quantization in a harmonic speech coding arrangement |
US4864561A (en) | 1988-06-20 | 1989-09-05 | American Telephone And Telegraph Company | Technique for improved subjective performance in a communication system using attenuated noise-fill |
US5222189A (en) | 1989-01-27 | 1993-06-22 | Dolby Laboratories Licensing Corporation | Low time-delay transform coder, decoder, and encoder/decoder for high-quality audio |
GB2235354A (en) | 1989-08-16 | 1991-02-27 | Philips Electronic Associated | Speech coding/encoding using celp |
JPH0398318A (ja) * | 1989-09-11 | 1991-04-23 | Fujitsu Ltd | 音声符号化方式 |
BR9206143A (pt) | 1991-06-11 | 1995-01-03 | Qualcomm Inc | Processos de compressão de final vocal e para codificação de taxa variável de quadros de entrada, aparelho para comprimir im sinal acústico em dados de taxa variável, codificador de prognóstico exitado por córdigo de taxa variável (CELP) e descodificador para descodificar quadros codificados |
US5657418A (en) * | 1991-09-05 | 1997-08-12 | Motorola, Inc. | Provision of speech coder gain information using multiple coding modes |
US5884253A (en) * | 1992-04-09 | 1999-03-16 | Lucent Technologies, Inc. | Prototype waveform speech coding with interpolation of pitch, pitch-period waveforms, and synthesis filter |
US5734789A (en) * | 1992-06-01 | 1998-03-31 | Hughes Electronics | Voiced, unvoiced or noise modes in a CELP vocoder |
US5495555A (en) * | 1992-06-01 | 1996-02-27 | Hughes Aircraft Company | High quality low bit rate celp-based speech codec |
US5341456A (en) * | 1992-12-02 | 1994-08-23 | Qualcomm Incorporated | Method for determining speech encoding rate in a variable rate vocoder |
US5459814A (en) * | 1993-03-26 | 1995-10-17 | Hughes Aircraft Company | Voice activity detector for speech signals in variable background noise |
IT1270438B (it) * | 1993-06-10 | 1997-05-05 | Sip | Procedimento e dispositivo per la determinazione del periodo del tono fondamentale e la classificazione del segnale vocale in codificatori numerici della voce |
US5602961A (en) * | 1994-05-31 | 1997-02-11 | Alaris, Inc. | Method and apparatus for speech compression using multi-mode code excited linear predictive coding |
TW271524B (ja) | 1994-08-05 | 1996-03-01 | Qualcomm Inc | |
JP3328080B2 (ja) * | 1994-11-22 | 2002-09-24 | 沖電気工業株式会社 | コード励振線形予測復号器 |
US5751903A (en) * | 1994-12-19 | 1998-05-12 | Hughes Electronics | Low rate multi-mode CELP codec that encodes line SPECTRAL frequencies utilizing an offset |
US5956673A (en) * | 1995-01-25 | 1999-09-21 | Weaver, Jr.; Lindsay A. | Detection and bypass of tandem vocoding using detection codes |
JP3308764B2 (ja) * | 1995-05-31 | 2002-07-29 | 日本電気株式会社 | 音声符号化装置 |
US5774837A (en) * | 1995-09-13 | 1998-06-30 | Voxware, Inc. | Speech coding system and method using voicing probability determination |
FR2739995B1 (fr) * | 1995-10-13 | 1997-12-12 | Massaloux Dominique | Procede et dispositif de creation d'un bruit de confort dans un systeme de transmission numerique de parole |
JP3092652B2 (ja) * | 1996-06-10 | 2000-09-25 | 日本電気株式会社 | 音声再生装置 |
JPH1091194A (ja) * | 1996-09-18 | 1998-04-10 | Sony Corp | 音声復号化方法及び装置 |
US5960389A (en) * | 1996-11-15 | 1999-09-28 | Nokia Mobile Phones Limited | Methods for generating comfort noise during discontinuous transmission |
JP3331297B2 (ja) * | 1997-01-23 | 2002-10-07 | 株式会社東芝 | 背景音/音声分類方法及び装置並びに音声符号化方法及び装置 |
US5995923A (en) * | 1997-06-26 | 1999-11-30 | Nortel Networks Corporation | Method and apparatus for improving the voice quality of tandemed vocoders |
US6104994A (en) * | 1998-01-13 | 2000-08-15 | Conexant Systems, Inc. | Method for speech coding under background noise conditions |
US6240386B1 (en) * | 1998-08-24 | 2001-05-29 | Conexant Systems, Inc. | Speech codec employing noise classification for noise compensation |
EP1279167B1 (en) * | 2000-04-24 | 2007-05-30 | QUALCOMM Incorporated | Method and apparatus for predictively quantizing voiced speech |
US6477502B1 (en) * | 2000-08-22 | 2002-11-05 | Qualcomm Incorporated | Method and apparatus for using non-symmetric speech coders to produce non-symmetric links in a wireless communication system |
US6804218B2 (en) * | 2000-12-04 | 2004-10-12 | Qualcomm Incorporated | Method and apparatus for improved detection of rate errors in variable rate receivers |
US7472059B2 (en) * | 2000-12-08 | 2008-12-30 | Qualcomm Incorporated | Method and apparatus for robust speech classification |
US8355907B2 (en) * | 2005-03-11 | 2013-01-15 | Qualcomm Incorporated | Method and apparatus for phase matching frames in vocoders |
US8155965B2 (en) * | 2005-03-11 | 2012-04-10 | Qualcomm Incorporated | Time warping frames inside the vocoder by modifying the residual |
US20070026028A1 (en) | 2005-07-26 | 2007-02-01 | Close Kenneth B | Appliance for delivering a composition |
-
1998
- 1998-12-21 US US09/217,341 patent/US6691084B2/en not_active Expired - Lifetime
-
1999
- 1999-12-21 CN CNB998148199A patent/CN100369112C/zh not_active Expired - Lifetime
- 1999-12-21 EP EP99967507A patent/EP1141947B1/en not_active Expired - Lifetime
- 1999-12-21 CN CN201210082801.8A patent/CN102623015B/zh not_active Expired - Lifetime
- 1999-12-21 AT AT99967507T patent/ATE424023T1/de not_active IP Right Cessation
- 1999-12-21 CN CN2007101621095A patent/CN101178899B/zh not_active Expired - Lifetime
- 1999-12-21 ES ES99967507T patent/ES2321147T3/es not_active Expired - Lifetime
- 1999-12-21 WO PCT/US1999/030587 patent/WO2000038179A2/en active IP Right Grant
- 1999-12-21 AU AU23775/00A patent/AU2377500A/en not_active Abandoned
- 1999-12-21 KR KR1020017007895A patent/KR100679382B1/ko active IP Right Grant
- 1999-12-21 EP EP09002600A patent/EP2085965A1/en not_active Withdrawn
- 1999-12-21 DE DE69940477T patent/DE69940477D1/de not_active Expired - Lifetime
- 1999-12-21 JP JP2000590164A patent/JP4927257B2/ja not_active Expired - Lifetime
-
2002
- 2002-03-22 HK HK02102211.7A patent/HK1040807B/zh not_active IP Right Cessation
-
2003
- 2003-11-14 US US10/713,758 patent/US7136812B2/en not_active Expired - Lifetime
-
2006
- 2006-11-13 US US11/559,274 patent/US7496505B2/en not_active Expired - Fee Related
-
2011
- 2011-01-07 JP JP2011002269A patent/JP2011123506A/ja not_active Withdrawn
-
2013
- 2013-04-18 JP JP2013087419A patent/JP5373217B2/ja not_active Expired - Lifetime
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1992005539A1 (en) * | 1990-09-20 | 1992-04-02 | Digital Voice Systems, Inc. | Methods for speech analysis and synthesis |
JPH05130067A (ja) * | 1991-10-31 | 1993-05-25 | Nec Corp | 可変閾値型音声検出器 |
JPH07225599A (ja) * | 1994-02-15 | 1995-08-22 | Nippon Telegr & Teleph Corp <Ntt> | 音声の符号化方法 |
JPH08254998A (ja) * | 1995-03-17 | 1996-10-01 | Ido Tsushin Syst Kaihatsu Kk | 音声符号化/復号化装置 |
JPH0955665A (ja) * | 1995-08-14 | 1997-02-25 | Toshiba Corp | 音声符号化装置 |
JPH09212195A (ja) * | 1995-12-12 | 1997-08-15 | Nokia Mobile Phones Ltd | 音声活性検出装置及び移動局並びに音声活性検出方法 |
JPH10143199A (ja) * | 1996-11-15 | 1998-05-29 | Nippon Telegr & Teleph Corp <Ntt> | 音声符号化方法および復号化方法 |
JPH10232697A (ja) * | 1997-02-21 | 1998-09-02 | Nippon Telegr & Teleph Corp <Ntt> | 音声符号化方法および復号化方法 |
Also Published As
Publication number | Publication date |
---|---|
EP1141947A2 (en) | 2001-10-10 |
US6691084B2 (en) | 2004-02-10 |
HK1040807B (zh) | 2008-08-01 |
AU2377500A (en) | 2000-07-12 |
US20040102969A1 (en) | 2004-05-27 |
CN102623015B (zh) | 2015-05-06 |
JP5373217B2 (ja) | 2013-12-18 |
KR20010093210A (ko) | 2001-10-27 |
ATE424023T1 (de) | 2009-03-15 |
EP1141947B1 (en) | 2009-02-25 |
EP2085965A1 (en) | 2009-08-05 |
CN100369112C (zh) | 2008-02-13 |
JP4927257B2 (ja) | 2012-05-09 |
CN1331826A (zh) | 2002-01-16 |
DE69940477D1 (de) | 2009-04-09 |
JP2002533772A (ja) | 2002-10-08 |
US7496505B2 (en) | 2009-02-24 |
ES2321147T3 (es) | 2009-06-02 |
CN101178899A (zh) | 2008-05-14 |
KR100679382B1 (ko) | 2007-02-28 |
CN101178899B (zh) | 2012-07-04 |
US20020099548A1 (en) | 2002-07-25 |
WO2000038179A2 (en) | 2000-06-29 |
CN102623015A (zh) | 2012-08-01 |
WO2000038179A3 (en) | 2000-11-09 |
JP2011123506A (ja) | 2011-06-23 |
US20070179783A1 (en) | 2007-08-02 |
US7136812B2 (en) | 2006-11-14 |
HK1040807A1 (en) | 2002-06-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5373217B2 (ja) | 可変レートスピーチ符号化 | |
JP4824167B2 (ja) | 周期的スピーチコーディング | |
KR100769508B1 (ko) | Celp 트랜스코딩 | |
KR100956623B1 (ko) | 잔여분 변경에 의한 보코더 내부의 프레임들을 시간 와핑하는 시스템 및 방법 | |
US6081776A (en) | Speech coding system and method including adaptive finite impulse response filter | |
US6078880A (en) | Speech coding system and method including voicing cut off frequency analyzer | |
JP4270866B2 (ja) | 非音声のスピーチの高性能の低ビット速度コード化方法および装置 | |
US6138092A (en) | CELP speech synthesizer with epoch-adaptive harmonic generator for pitch harmonics below voicing cutoff frequency | |
JP4302978B2 (ja) | 音声コーデックにおける擬似高帯域信号の推定システム | |
US20030004710A1 (en) | Short-term enhancement in celp speech coding | |
WO2003001172A1 (en) | Method and device for coding speech in analysis-by-synthesis speech coders | |
KR100550003B1 (ko) | 상호부호화기에서 개회로 피치 추정 방법 및 그 장치 | |
WO2002023536A2 (en) | Formant emphasis in celp speech coding | |
GB2352949A (en) | Speech coder for communications unit | |
Gardner et al. | Survey of speech-coding techniques for digital cellular communication systems |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130820 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130918 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5373217 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |