JP2014517933A - Celpコーダおよびデコーダ内の変換領域コードブック - Google Patents
Celpコーダおよびデコーダ内の変換領域コードブック Download PDFInfo
- Publication number
- JP2014517933A JP2014517933A JP2014509572A JP2014509572A JP2014517933A JP 2014517933 A JP2014517933 A JP 2014517933A JP 2014509572 A JP2014509572 A JP 2014509572A JP 2014509572 A JP2014509572 A JP 2014509572A JP 2014517933 A JP2014517933 A JP 2014517933A
- Authority
- JP
- Japan
- Prior art keywords
- codebook
- transform domain
- stage
- adaptive
- transform
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000009466 transformation Effects 0.000 title description 14
- 230000003044 adaptive effect Effects 0.000 claims abstract description 111
- 230000005284 excitation Effects 0.000 claims description 93
- 230000015572 biosynthetic process Effects 0.000 claims description 35
- 238000003786 synthesis reaction Methods 0.000 claims description 35
- 239000013598 vector Substances 0.000 claims description 30
- 239000012634 fragment Substances 0.000 claims description 14
- 238000013139 quantization Methods 0.000 claims description 13
- 230000004044 response Effects 0.000 claims description 12
- 230000008859 change Effects 0.000 claims description 5
- 238000000034 method Methods 0.000 claims description 5
- 230000006978 adaptation Effects 0.000 claims description 3
- 230000008569 process Effects 0.000 claims description 3
- 238000006243 chemical reaction Methods 0.000 description 13
- 238000004364 calculation method Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 9
- 238000001914 filtration Methods 0.000 description 9
- 230000003111 delayed effect Effects 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/22—Mode decision, i.e. based on audio signal content versus external parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/038—Vector quantisation, e.g. TwinVQ audio
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/10—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
- G10L19/107—Sparse pulse excitation, e.g. by using algebraic codebook
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0004—Design or structure of the codebook
- G10L2019/0005—Multi-stage vector quantisation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
図1のACELPコーダ100では適応コードブック検索が、適応コードブックステージ120において、各々のサブフレームの間に、元の音声と合成された音声との間の平均二乗加重誤差を最小化することにより遂行される。このことは、次式の項を最大化することにより実現される。
新規コードブック検索が、新規コードブックステージ130において、計算器111において、適応コードブック寄与を除去した後で平均二乗加重誤差を最小化することにより、すなわち次式のように遂行される。
x2(n)=x1(n)-gp・y1(n) (4)
図4は、この非限定的な例ではACELPデコーダを使用する、デコーダに適用される修正されたCELPモデルの第1の構造体を示す概略ブロック図である。修正されたCELPモデルの第1の構造体は、適応コードブックステージ220、変換領域コードブックステージ420、および新規コードブックステージ230を含む第1のコードブック装置を備える。図4に例示するように、全励振e(n)408は以下の寄与、すなわち、
- 適応コードブックステージ220において適応コードブックベクトルv(n)が、適応コードブック201により適応コードブックインデックスTに応答して生成され、適応コードブックゲインgpを使用する増幅器202によりスケーリングされて、適応コードブック励振寄与203を生成する、
- 変換領域コードブックステージ420において変換領域ベクトルq(n)が生成され、変換領域コードブックゲインgqを使用する増幅器407によりスケーリングされて、変換領域コードブック励振寄与409を生成する、および、
- 新規コードブックステージ230において新規コードブックベクトルc(n)が、新規コードブック204により新規コードブックインデックスkに応答して生成され、新規コードブックゲインgcを使用する増幅器205によりスケーリングされて、新規コードブック励振寄与206を生成する、
を含む。このことは、以下の関係式により例示される。
e(n)=gp・v(n)+gq・q(n)+gc・c(n)、n=0、…、N-1 (7)
コーダ(図3)では、第1のコードブック装置の変換領域コードブックステージ320の変換領域コードブックは以下のように動作する。(新規コードブックのサブフレームと位置合わせされた)所与のサブフレームにおいて、変換領域コードブック用の目標信号qin(n)300、すなわちスケーリングされた適応コードブックベクトルgp・v(n)を除去した後の励振残差r(n)が次式のように算出される。
qin(n)=r(n)-gp・v(n)、n=0、…、N-1 (8)
変換領域コードブックでは変換領域コードブック用の目標信号qin(n)300は、フィルタF(z)301を用いてプリエンファシスされる。プリエンファシスフィルタの例はF(z)=1/(1-α・z-1)であり、差分方程式は次式により与えられる。
qin,d(n)=qin(n)+α・qin,d(n-1) (9)
変換領域コードブックは、変換領域DCT係数Qin,d(k)304のブロックを生成するために、例えば矩形の非重複の窓を使用して、プリエンファシスされた目標信号qin,d(n)302に、例えばDCTを適用するための変換計算器303をさらに備える。DCT-IIを使用することが可能であり、DCT-IIは次式のように規定される。
ビットレートに応じて変換領域コードブックは、例えばAVQエンコーダ305を使用して、変換領域DCT係数Qin,d(k)304のすべてのブロック、または、通常はより低い周波数に対応する一部のブロックのみを量子化して、量子化された変換領域DCT係数Qd(k)306を生成する。他の量子化されない変換領域DCT係数Qin,d(k)304は、0に設定される(量子化されない)。AVQの実装形態の例は、米国特許第7,106,228号において見出すことが可能であり、この特許の内容は参照により本明細書に組み込まれている。AVQエンコーダ305からの量子化かつ符号化された変換領域係数306のインデックスが、変換領域コードブックパラメータとしてデコーダに送信される。
時間領域での変換領域コードブック励振寄与を得るために、変換領域コードブックステージ320では最初に、逆DCT(iDCT)を使用する逆変換計算器307で、量子化された変換領域DCT係数Qd(k)306を逆変換して、逆変換されたエンファシスされた量子化された励振(逆変換された音響信号)qd(n)308を生成する。逆DCT-II(スケールファクタ2/Nを除けばDCT-IIIに対応する)が使用され、次式のように規定される。
次いでデエンファシスフィルタ1/F(z)309が、逆変換されたエンファシスされた量子化された励振qd(n)308に適用されて、変換領域コードブックステージからの時間領域励振q(n)310を得る。デエンファシスフィルタ309は、プリエンファシスフィルタF(z)301の逆伝達関数(1/F(z))を有する。上記の式(9)で与えられるプリエンファシスフィルタF(z)に関する非限定的な例では、デエンファシスフィルタ1/F(z)の差分方程式は次式により与えられることになる。
q(n)=qd(n)-α・qd(n-1) (12)
変換領域コードブックステージからの時間領域励振信号q(n)310が算出されると、計算器(図示せず)が次式のように変換領域コードブックゲインを算出する。
修正されたCELPモデルの第1の構造体が使用されるとき、変換領域コードブックステージからの時間領域励振信号q(n)310を使用して、次式のように適応コードブック検索用の元の目標信号x1(n)315を精密化することが可能である。
x1,updt(n)=x1(n)-gq・y3(n) (15)
変換領域コードブックステージ320が使用されるとき、新規コードブック検索用の目標信号x2(n)316の算出が、x1(n)=x1,updt(n)であり、gp=gp,updtである式(4)、すなわち、
x2(n)=x1,updt(n)-gp,updt・y1(n)
=x1(n)-gq・y3(n)-gp,updt・y1(n) (16)
を使用して遂行される。
rupdt(n)=r(n)-gq・q(n)-gp,updt・v(n) (17)
図4に戻って参照するとデコーダでは、変換領域コードブックステージ420からの励振寄与409が、量子化された変換領域DCT係数Qd(k)および変換領域コードブックゲインgqを含む受信された変換領域コードブックパラメータから得られる。
通常はビットレートが高くなるほど、より多くのビットが、新規コードブックのサイズを異なるビットレートにわたって同じにする変換領域コードブックにより使用される。修正されたCELPモデルの上記で開示した第1の構造体は、音声信号を実際的に意識されないような形で符号化するために、および一般的なオーディオ信号も効率的に符号化するために、高いビットレート(およそ48kビット/s以上)で使用することが可能である。
新規コードブックステージにより追随される変換領域コードブックステージを使用する、修正されたCELPモデルの上記で説明した第1の構造体(図3)を、入力音響信号の特性に応じてさらに適応的に変更することが可能である。例えば非活動状態の(inactive)音声断片を符号化する際は、変換領域コードブックステージおよびACELP新規コードブックステージの順序を変更することが有利である場合がある。したがって修正されたCELPモデルの第2の構造体は、第1のコードブックステージでの時間領域適応コードブックを、第3のコードブックステージでの変換領域コードブックにより追随される、第2のコードブックステージでの時間領域ACELP新規コードブックにより追随される状態で組み合わせる第2のコードブック装置を使用する。第2のステージのACELP新規コードブックは通常、非常に小さなコードブックを備える場合があり、回避される場合さえある。
修正されたCELPモデルの第2の構造体のブロック図である図5を参照すると、変換領域コードブックステージ520は以下のように動作する。所与のサブフレームにおいて、変換領域コードブック検索用の目標信号x3(n)518が、適応コードブック検索目標信号x1(n)から、適応コードブックゲインgpを使用する増幅器106によりスケーリングされるフィルタリングされた適応コードブック励振信号y1(n)を減算して新規コードブック検索目標信号x2(n)を形成する減算器104、および、(新規コードブックが使用されるならば)新規コードブック検索目標信号x2(n)から、新規コードブックゲインgcを使用する増幅器109によりスケーリングされるフィルタリングされた新規コードブック励振信号y2(n)を減算する減算器525を使用する計算器により、次式のように算出される。
x3(n)=x1(n)-gp・y1(n)-gc・y2(n), n=0、…、N-1 (18)
信号uin(n)500は、変換領域コードブック検索に対する入力信号として使用される。この非限定的な例では変換領域コードブックでは信号uin(n)500は、最初にフィルタF(z)301を用いてプリエンファシスされて、プリエンファシスされた信号uin,d(n)502を生成する。そのようなプリエンファシスフィルタの例が、式(9)により与えられる。式(9)のフィルタは、より低い周波数を強調するために信号uin(n)500にスペクトル傾斜を付与する。
変換領域コードブックは、変換領域DCT係数Uin,d(k)504のブロックを生成するために、例えば矩形の非重複の窓を使用して、プリエンファシスされた信号uin,d(n)502に、変換計算器303により適用される例えばDCTをさらに備える。DCTの例は式(10)で与えられる。
通常は変換領域DCT係数Uin,d(k)504のすべてのブロックが、例えばAVQエンコーダ305を使用して量子化されて、量子化された変換領域DCT係数Ud(k)506を生成する。しかしながら量子化された変換領域DCT係数Ud(k)506は、前述の説明で解説したように低いビットレートではゼロに設定される場合がある。第1のコードブック装置の変換領域コードブックに反して、AVQエンコーダ305を、より低い周波数に対応するブロックを符号化するようにAVQに強制する代わりに、すべての帯域幅にわたって最も高いエネルギーを伴うブロックを符号化するために使用することが可能である。
量子化された変換領域DCT係数Ud(k)506は、例えば逆DCT(iDCT)を使用する逆変換計算器307で逆変換されて、逆変換されたエンファシスされた量子化された励振ud(n)508を生成する。逆変換の例は式(11)で与えられる。
逆変換されたエンファシスされた量子化された励振ud(n)508は、デエンファシスフィルタ1/F(z)309によって処理されて、変換領域コードブックステージからの時間領域励振信号u(n)510を得る。デエンファシスフィルタ309は、プリエンファシスフィルタF(z)301の逆伝達関数を有し、上記で説明したプリエンファシスフィルタF(z)に関する非限定的な例では、デエンファシスフィルタ309の伝達関数は式(12)により与えられる。
変換領域コードブック励振寄与u(n)510が算出されると、変換領域コードブックゲインgqが以下の関係式を使用して得られる。
非活動状態の音響信号断片、例えば非活動状態の音声断片を符号化するとき、適応コードブック励振寄与は、合成での強い周期性を回避するために制限される。実際、適応コードブックゲインgpは通常0≦gp≦1.2により制約される。非活動状態の音響信号断片を符号化するとき、0≦gp≦0.65により適応コードブックゲインgpを制約するために適応コードブック検索ではリミッタが設けられる。
デコーダでは、変換領域コードブックからの励振寄与が、最初に(例えばAVQデコーダ(図示せず)を使用して)復号化された(量子化された)変換領域(DCT)係数を逆量子化し、逆変換(例えば逆DCT(iDCT))をこれらの逆量子化された変換領域(DCT)係数に適用することにより得られる。最後にデエンファシスフィルタ1/F(z)が逆DCT変換の後に適用されて、変換領域コードブックゲインgqによりスケーリングされる時間領域励振信号u(n)を形成する(図4の変換領域コードブック402を参照)。
複数の可能な構造体を用いる一般的な修正されたCELPコーダを図6に示す。
101 知覚加重フィルタW(z)
102 減算器
103 加重合成フィルタH(z)
104 減算器
105 加重合成フィルタH(z)
106 増幅器
107 新規コードブック
108 加重合成フィルタH(z)
109 増幅器
110 減算器
111 計算器
120 適応コードブックステージ
121 適応コードブック
130 新規コードブックステージ
200 ACELPデコーダ
201 適応コードブック
202 増幅器
203 適応コードブック励振寄与
204 新規コードブック
205 増幅器
206 新規コードブック励振寄与
207 加算器
208 LP合成フィルタ1/A(z)
220 適応コードブックステージ
230 新規コードブックステージ
300 変換領域コードブック用の目標信号qin(n)
301 プリエンファシスフィルタF(z)
302 プリエンファシスされた目標信号qin,d(n)
303 変換計算器
304 変換領域DCT係数Qin,d(k)
305 AVQエンコーダ
306 量子化された変換領域DCT係数Qd(k)
307 逆変換計算器
308 逆変換されたエンファシスされた量子化された励振qd(n)
309 デエンファシスフィルタ1/F(z)
310 変換領域コードブックステージからの時間領域励振信号q(n)
311 加重合成フィルタH(z)
312 増幅器
313 項v(n)
314 適応コードブックゲインgp
315 目標信号x1(n)
316 新規コードブック検索用の目標信号x2(n)
317 減算器
320 変換領域コードブックステージ
402 変換領域コードブック
404 AVQデコーダ
405 逆変換計算器
406 デエンファシスフィルタ1/F(z)
407 増幅器
408 全励振e(n)
409 変換領域コードブック励振寄与
410 加算器
420 変換領域コードブックステージ
500 信号uin(n)
502 プリエンファシスされた信号uin,d(n)
504 変換領域DCT係数Uin,d(k)
506 量子化された変換領域DCT係数Ud(k)
508 逆変換されたエンファシスされた量子化された励振ud(n)
510 変換領域コードブックステージからの時間領域励振信号u(n)、変換領域コードブック励振寄与u(n)
511 計算器
516 変換領域コードブック励振信号y3(n)
518 変換領域コードブック検索用の目標信号x3(n)
520 変換領域コードブックステージ
525、530 減算器
601 分類器
602 第1のスイッチ
603 第2のスイッチ
604 ACELP符号化、第2のACELPステージ
605 変換領域(TD)符号化、第2のTDステージ
607 ACELPステージ
Claims (24)
- 時間領域CELPコードブックおよび変換領域コードブックのうちの一方を含む第1のコードブックステージと、
前記第1のコードブックステージに追随し、前記時間領域CELPコードブックおよび前記変換領域コードブックのうちの他方を含む第2のコードブックステージと
を備える、入力音響信号を符号化する際に使用するためのコードブック装置。 - (a)前記入力音響信号の特性、および(b)前記コードブック構造体を使用するコーデックのビットレートのうちの少なくとも1つの関数としての、それぞれ前記第1および第2のコードブックステージでの、前記時間領域CELPコードブックおよび前記変換領域コードブックの順序の選択器をさらに備える、請求項1に記載のコードブック構造体。
- 前記選択器が、前記入力音響信号の前記特性、および前記コードブック構造体を使用する前記コーデックの前記ビットレートの両方に応答して、前記第2のコードブックステージを迂回する、請求項2に記載のコードブック構造体。
- 前記選択器が、前記入力音響信号の分類器、ならびに、前記第1および第2のコードブックステージでの、前記時間領域CELPコードブックおよび前記変換領域コードブックの前記順序を変更するために前記分類器により制御される少なくとも1つのスイッチを備える、請求項2または3に記載のコードブック構造体。
- 前記分類器が、前記入力音響信号の連続的な断片の各々を、活動状態の音声断片または非活動状態の音声断片として分類する、請求項4に記載のコードブック構造体。
- 前記第1のコードブックステージの前に、適応コードブックを備えるステージを備える、請求項1から5のいずれか一項に記載のコードブック構造体。
- (a)前記入力音響信号の特性、および(b)前記コードブック構造体を使用するコーデックのビットレートのうちの少なくとも1つに関していくつかのコードブックステージを備える、請求項1に記載のコードブック構造体。
- 適応コードブックを検索して適応コードブックインデックスおよび適応コードブックゲインを索出するように構成される第1の適応コードブックステージと、
時間領域CELPコードブックおよび変換領域コードブックのうちの一方を含む第2のコードブックステージと、
前記第2のコードブックステージに追随し、前記時間領域CELPコードブックおよび前記変換領域コードブックのうちの他方を含む第3のコードブックステージと
を備え、
前記第2および第3のコードブックステージが、前記それぞれの時間領域CELPコードブックおよび変換領域コードブックを検索して、新規コードブックインデックス、新規コードブックゲイン、変換領域係数、および変換領域コードブックゲインを索出するように構成される、入力音響信号のコーダ。 - (a)前記入力音響信号の特性、および(b)前記コードブック構造体を使用するコーデックのビットレートのうちの少なくとも1つの関数としての、それぞれ前記第2および第3のコードブックステージでの、前記時間領域CELPコードブックおよび前記変換領域コードブックの順序の選択器をさらに備える、請求項8に記載のコーダ。
- 前記選択器が、前記入力音響信号の前記特性、および前記コードブック構造体を使用する前記コーデックのビットレートの両方に応答して、前記第3のコードブックステージを迂回する、請求項9に記載のコーダ。
- 前記選択器が、前記入力音響信号の分類器、ならびに、前記第2および第3のコードブックステージでの、前記時間領域CELPコードブックおよび前記変換領域コードブックの前記順序を変更するために前記分類器により制御される少なくとも1つのスイッチを備える、請求項9または10に記載のコーダ。
- 前記分類器が、前記入力音響信号の連続的な断片の各々を、活動状態の音声断片または非活動状態の音声断片として分類する、請求項11に記載のコーダ。
- 前記変換領域コードブックが、変換領域コードブック目標信号を変換する変換計算器、および前記変換計算器からの変換領域係数の量子化器を備える、請求項8から12のいずれか一項に記載のコーダ。
- 前記変換が離散コサイン変換であり、前記量子化器が代数ベクトル量子化器である、請求項13に記載のコーダ。
- 前記変換領域コードブックが、前記変換領域コードブック目標信号を前記変換計算器に供給する前に、前記変換領域コードブック目標信号を処理するプリエンファシスフィルタを備える、請求項13または14に記載のコーダ。
- 前記変換領域コードブックのステージが、前記量子化器からの量子化された変換領域係数の逆変換の計算器、前記逆変換された量子化された変換領域係数を処理して時間領域励振信号を生成するためのデエンファシスフィルタ、前記時間領域励振信号を処理してフィルタリングされた変換領域コードブック励振信号を生成するための加重合成フィルタ、および、前記フィルタリングされた変換領域コードブック励振信号をスケーリングして変換領域コードブック励振寄与を生成するための、前記変換領域コードブックゲインを使用する増幅器をさらに備える、請求項13から15のいずれか一項に記載のコーダ。
- 前記第1の適応コードブックステージが、適応コードブックインデックスが供給されて適応コードブックベクトルを生成する適応コードブックを備え、前記コーダが、前記変換領域コードブックが前記第2のコードブックステージに含まれるときに、前記適応コードブックベクトルを使用する前記変換領域コードブック目標信号の計算器を備える、請求項13から16のいずれか一項に記載のコーダ。
- 前記第1の適応コードブックステージが、適応コードブックを備え、適応コードブック励振寄与を、適応コードブックインデックスを前記適応コードブックに供給して適応コードブックベクトルを生成すること、加重合成フィルタによって前記適応コードブックベクトルを処理してフィルタリングされた適応コードブック励振信号を生成すること、および、前記フィルタリングされた適応コードブック励振信号を、適応コードブックゲインを使用する増幅器を用いて増幅して前記適応コードブック励振寄与を生成することにより算出し、
前記時間領域CELPコードブックステージが、前記時間領域CELPコードブックとして新規コードブックを備え、新規コードブック励振寄与を、新規コードブックインデックスを前記新規コードブックに適用して新規コードブックベクトルを生成すること、加重合成フィルタによって前記新規コードブックベクトルを処理してフィルタリングされた新規コードブック励振信号を生成すること、および、前記フィルタリングされた新規コードブック励振信号を、新規コードブックゲインを使用する増幅器を用いて増幅して前記新規コードブック励振寄与を生成することにより算出する、請求項13から16のいずれか一項に記載のコーダ。 - 前記変換領域コードブックが前記第3のコードブックステージに含まれるときに、前記適応コードブック励振寄与および前記新規コードブック励振寄与を使用する前記変換領域コードブック目標信号の計算器を備える、請求項18に記載のコーダ。
- 前記変換領域コードブックのステージが、固定ビット配分および浮動的な数のビットの和である、前記量子化器による量子化に割り当てられるビット配分を備える、請求項13から19のいずれか一項に記載のコーダ。
- 現在のサブフレームでの前記浮動的な数のビットが、前のサブフレームでの前記量子化に対して未使用のビットを含む、請求項20に記載のコーダ。
- 前記変換領域コードブックのステージが、前記変換計算器からの変換領域係数、および前記量子化器からの量子化された変換領域係数を使用する前記変換領域コードブックゲインの計算器を備える、請求項13から21のいずれか一項に記載のコーダ。
- 前記変換領域コードブックのステージが、変換領域コードブック励振寄与を生成し、前記適応コードブックのテージが、前記変換領域コードブック励振寄与を使用して適応コードブックゲインを精密化する、請求項8から22のいずれか一項に記載のコーダ。
- 非活動状態の音響信号断片の存在下で前記適応コードブックゲインのリミッタを備える、請求項8から23のいずれか一項に記載のコーダ。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201161484968P | 2011-05-11 | 2011-05-11 | |
US61/484,968 | 2011-05-11 | ||
PCT/CA2012/000441 WO2012151676A1 (en) | 2011-05-11 | 2012-05-09 | Transform-domain codebook in a celp coder and decoder |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014517933A true JP2014517933A (ja) | 2014-07-24 |
JP6173304B2 JP6173304B2 (ja) | 2017-08-02 |
Family
ID=47138606
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014509572A Active JP6173304B2 (ja) | 2011-05-11 | 2012-05-09 | Celpコーダにおける変換領域コードブック装置 |
Country Status (11)
Country | Link |
---|---|
US (1) | US8825475B2 (ja) |
EP (1) | EP2707687B1 (ja) |
JP (1) | JP6173304B2 (ja) |
CN (1) | CN103518122B (ja) |
CA (1) | CA2830105C (ja) |
DK (1) | DK2707687T3 (ja) |
ES (1) | ES2668920T3 (ja) |
HK (1) | HK1191395A1 (ja) |
NO (1) | NO2669468T3 (ja) |
PT (1) | PT2707687T (ja) |
WO (1) | WO2012151676A1 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9070356B2 (en) * | 2012-04-04 | 2015-06-30 | Google Technology Holdings LLC | Method and apparatus for generating a candidate code-vector to code an informational signal |
US9263053B2 (en) * | 2012-04-04 | 2016-02-16 | Google Technology Holdings LLC | Method and apparatus for generating a candidate code-vector to code an informational signal |
ES2821141T3 (es) * | 2016-12-16 | 2021-04-23 | Ericsson Telefon Ab L M | Método y codificador para manejar coeficientes de representación de envolvente |
BR112020004883A2 (pt) * | 2017-09-20 | 2020-09-15 | Voiceage Corporation | método e dispositivo para alocar um bit-budget entre subquadros em um codec celp |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080040105A1 (en) * | 2005-05-31 | 2008-02-14 | Microsoft Corporation | Sub-band voice codec with multi-stage codebooks and redundant coding |
Family Cites Families (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
IT1281001B1 (it) * | 1995-10-27 | 1998-02-11 | Cselt Centro Studi Lab Telecom | Procedimento e apparecchiatura per codificare, manipolare e decodificare segnali audio. |
US6134518A (en) * | 1997-03-04 | 2000-10-17 | International Business Machines Corporation | Digital audio signal coding using a CELP coder and a transform coder |
DE69926821T2 (de) * | 1998-01-22 | 2007-12-06 | Deutsche Telekom Ag | Verfahren zur signalgesteuerten Schaltung zwischen verschiedenen Audiokodierungssystemen |
US6453289B1 (en) * | 1998-07-24 | 2002-09-17 | Hughes Electronics Corporation | Method of noise reduction for speech codecs |
US7072832B1 (en) * | 1998-08-24 | 2006-07-04 | Mindspeed Technologies, Inc. | System for speech encoding having an adaptive encoding arrangement |
SE519985C2 (sv) * | 2000-09-15 | 2003-05-06 | Ericsson Telefon Ab L M | Kodning och avkodning av signaler från flera kanaler |
US20030135374A1 (en) * | 2002-01-16 | 2003-07-17 | Hardwick John C. | Speech synthesizer |
CA2388358A1 (en) | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for multi-rate lattice vector quantization |
FR2849727B1 (fr) * | 2003-01-08 | 2005-03-18 | France Telecom | Procede de codage et de decodage audio a debit variable |
CN100583241C (zh) * | 2003-04-30 | 2010-01-20 | 松下电器产业株式会社 | 音频编码设备、音频解码设备、音频编码方法和音频解码方法 |
CA2457988A1 (en) * | 2004-02-18 | 2005-08-18 | Voiceage Corporation | Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization |
KR101295729B1 (ko) * | 2005-07-22 | 2013-08-12 | 프랑스 텔레콤 | 비트 레이트규모 가변적 및 대역폭규모 가변적 오디오디코딩에서 비트 레이트 스위칭 방법 |
US7877253B2 (en) * | 2006-10-06 | 2011-01-25 | Qualcomm Incorporated | Systems, methods, and apparatus for frame erasure recovery |
PT2102619T (pt) * | 2006-10-24 | 2017-05-25 | Voiceage Corp | Método e dispositivo para codificação de tramas de transição em sinais de voz |
US8566106B2 (en) * | 2007-09-11 | 2013-10-22 | Voiceage Corporation | Method and device for fast algebraic codebook search in speech and audio coding |
US8515767B2 (en) * | 2007-11-04 | 2013-08-20 | Qualcomm Incorporated | Technique for encoding/decoding of codebook indices for quantized MDCT spectrum in scalable speech and audio codecs |
JP2011518345A (ja) * | 2008-03-14 | 2011-06-23 | ドルビー・ラボラトリーズ・ライセンシング・コーポレーション | スピーチライク信号及びノンスピーチライク信号のマルチモードコーディング |
EP2345027B1 (en) * | 2008-10-10 | 2018-04-18 | Telefonaktiebolaget LM Ericsson (publ) | Energy-conserving multi-channel audio coding and decoding |
FR2947945A1 (fr) * | 2009-07-07 | 2011-01-14 | France Telecom | Allocation de bits dans un codage/decodage d'amelioration d'un codage/decodage hierarchique de signaux audionumeriques |
PL2491555T3 (pl) * | 2009-10-20 | 2014-08-29 | Fraunhofer Ges Forschung | Wielotrybowy kodek audio |
DK2559028T3 (en) | 2010-04-14 | 2015-11-09 | Voiceage Corp | FLEXIBLE AND SCALABLE COMBINED INNOVATIONSKODEBOG FOR USE IN CELPKODER encoder and decoder |
-
2008
- 2008-10-17 NO NO13180475A patent/NO2669468T3/no unknown
-
2012
- 2012-05-09 PT PT127826410T patent/PT2707687T/pt unknown
- 2012-05-09 JP JP2014509572A patent/JP6173304B2/ja active Active
- 2012-05-09 WO PCT/CA2012/000441 patent/WO2012151676A1/en active Application Filing
- 2012-05-09 CA CA2830105A patent/CA2830105C/en active Active
- 2012-05-09 CN CN201280022757.XA patent/CN103518122B/zh active Active
- 2012-05-09 ES ES12782641.0T patent/ES2668920T3/es active Active
- 2012-05-09 DK DK12782641.0T patent/DK2707687T3/en active
- 2012-05-09 EP EP12782641.0A patent/EP2707687B1/en active Active
- 2012-05-11 US US13/469,744 patent/US8825475B2/en active Active
-
2014
- 2014-05-16 HK HK14104605.3A patent/HK1191395A1/zh unknown
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080040105A1 (en) * | 2005-05-31 | 2008-02-14 | Microsoft Corporation | Sub-band voice codec with multi-stage codebooks and redundant coding |
Non-Patent Citations (2)
Title |
---|
JAR-FERR YANG: "Transform-Based CELP Vocoders with Low-Delay Low-Complexity and Variable-Rate Features", IEICE, JPN6016018773, June 2002 (2002-06-01) * |
JURGEN SCHNITZLER: "WIDE BAND SPEECH CODING USING FORWARD/BACKWARD ADAPTIVE PREDICTION WITH MIXED TIME/FREQUENCY DOMAIN", IEEE, JPN6016018772, 1999 * |
Also Published As
Publication number | Publication date |
---|---|
CA2830105C (en) | 2018-06-05 |
HK1191395A1 (zh) | 2014-07-25 |
CA2830105A1 (en) | 2012-11-15 |
CN103518122A (zh) | 2014-01-15 |
JP6173304B2 (ja) | 2017-08-02 |
PT2707687T (pt) | 2018-05-21 |
EP2707687A1 (en) | 2014-03-19 |
DK2707687T3 (en) | 2018-05-28 |
EP2707687B1 (en) | 2018-03-28 |
WO2012151676A1 (en) | 2012-11-15 |
EP2707687A4 (en) | 2014-11-19 |
NO2669468T3 (ja) | 2018-06-02 |
US20120290295A1 (en) | 2012-11-15 |
ES2668920T3 (es) | 2018-05-23 |
CN103518122B (zh) | 2016-04-20 |
US8825475B2 (en) | 2014-09-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101180676B (zh) | 用于谱包络表示的向量量化的方法和设备 | |
KR100956877B1 (ko) | 스펙트럼 엔벨로프 표현의 벡터 양자화를 위한 방법 및장치 | |
US20100174541A1 (en) | Quantization | |
US11798570B2 (en) | Concept for encoding an audio signal and decoding an audio signal using deterministic and noise like information | |
JPH08328591A (ja) | 短期知覚重み付けフィルタを使用する合成分析音声コーダに雑音マスキングレベルを適応する方法 | |
JP6456412B2 (ja) | Celp符号器および復号器で使用するための柔軟で拡張性のある複合革新コードブック | |
KR101849613B1 (ko) | 스피치 관련 스펙트럼 정형 정보를 사용하는 오디오 신호의 인코딩 및 오디오 신호의 디코딩을 위한 개념 | |
JP6173304B2 (ja) | Celpコーダにおける変換領域コードブック装置 | |
CN107710324B (zh) | 音频编码器和用于对音频信号进行编码的方法 | |
US6098037A (en) | Formant weighted vector quantization of LPC excitation harmonic spectral amplitudes | |
Tseng | An analysis-by-synthesis linear predictive model for narrowband speech coding |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150422 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160513 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160523 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160822 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170110 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170405 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170605 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170704 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6173304 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |