DK2707687T3 - Transformationsdomæne-kodebog i en celp-koder og -afkoder - Google Patents
Transformationsdomæne-kodebog i en celp-koder og -afkoder Download PDFInfo
- Publication number
- DK2707687T3 DK2707687T3 DK12782641.0T DK12782641T DK2707687T3 DK 2707687 T3 DK2707687 T3 DK 2707687T3 DK 12782641 T DK12782641 T DK 12782641T DK 2707687 T3 DK2707687 T3 DK 2707687T3
- Authority
- DK
- Denmark
- Prior art keywords
- codebook
- domain
- adaptive
- stage
- transform
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/22—Mode decision, i.e. based on audio signal content versus external parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/038—Vector quantisation, e.g. TwinVQ audio
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/10—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
- G10L19/107—Sparse pulse excitation, e.g. by using algebraic codebook
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0004—Design or structure of the codebook
- G10L2019/0005—Multi-stage vector quantisation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
Claims (16)
1. Koder af et inputlydsignal (s(n)), omfattende: et adaptivt kodebogsstadie struktureret til at søge i en adaptiv kodebog (120) for at finde et adaptivt kodebogsindeks (7) og en adaptiv kodebogsforstærkning {gP)\ en kodebogsanordning omfattende: et første kodebogsstadie, der inkluderer en af en tidsdomæne-CELP-kodebog (130, 604, 607) og en transformationsdomæne-kodebog (320, 520, 605, 606), der inkluderer en kalkulator (303) af en transformation af et transformationsdomæne-kodebog-målsignal (300, 500) og en quantizer (305) af transformationsdomænekoefficienter (304, 504) fra transformationskalkulatoren (303); og et andet kodebogsstadie, der inkluderer den anden af tidsdomæne-CELP-kodebogen (130, 604, 607) og transformationsdomæne-kodebogen (320, 520, 605, 606); hvor det første og andet kodebogsstadie er struktureret til at søge i den respektive tidsdomæne-CELP-kodebog (130, 604, 607) og transformationsdomæne-kodebog (320, 520, 605, 606) for at finde et innovativt kodebogsindeks (k), en innovativ kodebogsforstærkning (gc), transformationsdomænekoefficienter (304, 504), og en transformationsdomæne-kodebogsforstærkning (gq); hvor kodebogsstadierne anvendes i sekvensen adaptivt kodebogsstadie, første kodebogsstadie, andet kodebogsstadie til kodning af inputlydsignalet; kendetegnet ved, at kodebogsanordningen yderligere omfatter: en selektor af en rækkefølge af henholdsvis tidsdomæne-CELP-kodebogen (130, 604, 607) og transformationsdomæne-kodebogen (320, 520, 605, 606) i det første og andet kodebogsstadie, som en funktion af mindst en af (a) karakteristika af inputlydsignalet {s(n)) og (b) en bitrate af et codec, der anvender kodebogsanordningen.
2. Koder som defineret i krav 1, hvor selektoren omfatter en sorterer (601) af inputlydsignalet (s(n)), og mindst en første omskifter (602) styret af sortereren (601) til at ændre rækkefølgen af tidsdomæne-CELP-kodebogen (130, 604, 607) og transformationsdomæne-kodebogen (320, 520, 605, 606) i det første og andet kodebogsstadie.
3. Koder som defineret i krav 2, hvor selektoren omfatter en anden omskifter (603), som reagerer på både karakteristikaene af inputlydsignalet (s(n)) og bitraten af codecet under anvendelse af kodebogsanordningen for at omgå det andet kodebogsstadie.
4. Koder som defineret i krav 2, hvor sortereren (601) sorterer hvert af successive segmenter af inputlydsignalet (s(n)) som aktivt tale-segment eller inaktivt tale-segment.
5. Koder som defineret i krav 1, hvor kodebogsanordningen omfatter et antal af kodebogsstadier relateret til mindst en af (a) karakteristika af inputlydsignalet og (b) en bitrate af et codec, der anvender kodebogsanordningen.
6. Koder som defineret i krav 1, hvor transformationen er en diskret cosinus-transformation og quantizeren (305) er en algebraisk vektor-quantizer.
7. Koder som defineret i krav 1 eller 6, hvor transformationsdomæne-kodebogen (320, 520, 605, 606) omfatter et efterbetoningsfilter (301), der behandler transformationsdomæne-kodebog-målsignalet (300, 500) før forsyning af nævnte transformationsdomæne-kodebog-målsignal (302, 502) til transformationskalkulatoren (303).
8. Koder som defineret i et hvilket som helst af kravene 1, 6 og 7, hvor stadiet af transformationsdomæne-kodebog (320, 520, 605, 606) yderligere omfatter en kalkulator (307) af en invers transformation (30, 508) af kvantiserede transformationsdomænekoefficienter (306, 506) fra quantizeren (305), et betoningsudligningsfilter (309) til behandling af de invers transformerede, kvantiserede transformationsdomænekoefficienter (308, 508) for at producere et tidsdomæne-excitationssignal (310, 510), et vægtet syntesefilter (311) til behandling af tidsdomæne-excitationssignalet (310, 510) for at producere et filtreret transformationsdomæne-kodebog-excitationssignal (y3(n)), og en forstærker (312) under anvendelse af transformationsdomæne-kodebogsforstærkningen (gq) til at skalere det filtrerede transformationsdomæne-kodebog-excitationssignal (/3(77)) for at producere transformationsdomæne-kodebog-excitationsbidraget (409).
9. Koder som defineret i et hvilket som helst af kravene 1 og 6 til 8, hvor det adaptive kodebogsstadie omfatter en adaptiv kodebog (120) forsynet med det adaptive kodebogsindeks (7) til at producere en adaptiv kodebog-vektor (v(n)), og hvor koderen omfatter en kalkulator (104, 105, 106) af transformationsdomæne-kodebog-målsignalet (300), der anvender den adaptive kodebog-vektor (v(n)) når transformationsdomæne-kodebogen (320, 520, 605, 606) er inkluderet i det første kodebogsstadie.
10. Koder som defineret i et hvilket som helst af kravene 1 og 6 til 8, hvor: det adaptive kodebogsstadie omfatter en adaptiv kodebog (120) og beregner et adaptivt kodebog-excitationsbidrag (203) ved at forsyne det adaptive kodebogsindeks (7) til den adaptive kodebog (120) for at producere en adaptiv kodebog-vektor (v(n)), der behandler den adaptive kodebog-vektor (v(n)) via et vægtet syntesefilter (105) for at producere et filtreret adaptivt kodebog-excitationssignal (yi(n)), og der forstærker det filtrerede adaptive kodebog-excitationssignal med en forstærker (106) under anvendelse af den adaptive kodebogsforstærkning (gP) for at producere det adaptive kodebog-excitationsbidrag (203); og tidsdomæne-CELP-kodebogsstadiet omfatter som tidsdomæne-CELP-kodebogen (130, 604, 607) en innovationskodebog og beregner et innovationskodebog-excitationsbidrag (206) ved at anvende innovationskodebogsindekset (k) på innovationskodebogen for at producere en innovationskodebog-vektor (c(n)), behandle innovationskodebog-vektoren (c(n)) via et vægtet syntesefilter (108) for at producere et filtreret innovationskodebog-excitationssignal (y2(n)), og forstærke det filtrerede innovationskodebog-excitationssignal (y2(n)) med en forstærker (109) under anvendelse af innovationskodebogsforstærkningen (gc) for at producere innovationskodebog-excitationsbidraget (206).
11. Koder som defineret i krav 10, omfattende en kalkulator (108, 109, 1 10) af transformationsdomæne-kodebog-målsignalet (500), der anvender det adaptive kodebog-excitationsbidrag (203) og innovationskodebog-excitationsbidraget (206) når transformationsdomæne-kodebogen (320, 520, 605, 606) er inkluderet i det andet kodebogsstadie.
12. Koder som defineret i et hvilket som helst af kravene 1 og 6 til 11, hvor stadiet af transformationsdomæne-kodebogen (320, 520, 605, 606) omfatter et bitbudget allokeret til kvantiseringen af quantizeren (305), der er en sum af et fast bitbudget og et flydende antal af bit.
13. Koder som defineret i krav 12, hvor det flydende antal af bit i en aktuel underramme omfatter bit ubrugt til kvantiseringen i en tidligere underramme.
14. Koder som defineret i et hvilket som helst af kravene 1 og 6 til 13, hvor trinnet af transformationsdomæne-kodebogen (320, 520, 605, 606) omfatter en kalkulator af transformationsdomæne-kodebogsforstærkningen (gq), der anvender transformationsdomænekoefficienter (304, 504) fra transformationskalkulatoren (303) og kvantiserede transformationsdomænekoefficienter (306, 506) fra quantizeren (305).
15. Koder som defineret i et hvilket som helst af kravene 1 og 6 til 14, hvor trinnet af transformationsdomæne-kodebogen (320, 520, 605, 606) producerer et transformationsdomæne-kodebog-excitationsbidrag, og hvor det adaptive kodebogs (120) -stadie bruger transformationsdomæne-kodebog-excitationsbidraget til at redefinere den adaptive kodebogsforstærkning (gP).
16. Koder som defineret i et hvilket som helst af kravene 1 og 6 til 15, omfattende en begrænser af den adaptive kodebogsforstærkning (gP) i tilstedeværelsen af inaktive lydsignal-segmenter.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201161484968P | 2011-05-11 | 2011-05-11 | |
PCT/CA2012/000441 WO2012151676A1 (en) | 2011-05-11 | 2012-05-09 | Transform-domain codebook in a celp coder and decoder |
Publications (1)
Publication Number | Publication Date |
---|---|
DK2707687T3 true DK2707687T3 (da) | 2018-05-28 |
Family
ID=47138606
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DK12782641.0T DK2707687T3 (da) | 2011-05-11 | 2012-05-09 | Transformationsdomæne-kodebog i en celp-koder og -afkoder |
Country Status (11)
Country | Link |
---|---|
US (1) | US8825475B2 (da) |
EP (1) | EP2707687B1 (da) |
JP (1) | JP6173304B2 (da) |
CN (1) | CN103518122B (da) |
CA (1) | CA2830105C (da) |
DK (1) | DK2707687T3 (da) |
ES (1) | ES2668920T3 (da) |
HK (1) | HK1191395A1 (da) |
NO (1) | NO2669468T3 (da) |
PT (1) | PT2707687T (da) |
WO (1) | WO2012151676A1 (da) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9263053B2 (en) * | 2012-04-04 | 2016-02-16 | Google Technology Holdings LLC | Method and apparatus for generating a candidate code-vector to code an informational signal |
US9070356B2 (en) * | 2012-04-04 | 2015-06-30 | Google Technology Holdings LLC | Method and apparatus for generating a candidate code-vector to code an informational signal |
CN111133510B (zh) * | 2017-09-20 | 2023-08-22 | 沃伊斯亚吉公司 | 用于在celp编解码器中高效地分配比特预算的方法和设备 |
Family Cites Families (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
IT1281001B1 (it) * | 1995-10-27 | 1998-02-11 | Cselt Centro Studi Lab Telecom | Procedimento e apparecchiatura per codificare, manipolare e decodificare segnali audio. |
US6134518A (en) * | 1997-03-04 | 2000-10-17 | International Business Machines Corporation | Digital audio signal coding using a CELP coder and a transform coder |
DE69926821T2 (de) * | 1998-01-22 | 2007-12-06 | Deutsche Telekom Ag | Verfahren zur signalgesteuerten Schaltung zwischen verschiedenen Audiokodierungssystemen |
US6453289B1 (en) * | 1998-07-24 | 2002-09-17 | Hughes Electronics Corporation | Method of noise reduction for speech codecs |
US7072832B1 (en) * | 1998-08-24 | 2006-07-04 | Mindspeed Technologies, Inc. | System for speech encoding having an adaptive encoding arrangement |
SE519985C2 (sv) * | 2000-09-15 | 2003-05-06 | Ericsson Telefon Ab L M | Kodning och avkodning av signaler från flera kanaler |
US20030135374A1 (en) * | 2002-01-16 | 2003-07-17 | Hardwick John C. | Speech synthesizer |
CA2388358A1 (en) | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for multi-rate lattice vector quantization |
FR2849727B1 (fr) * | 2003-01-08 | 2005-03-18 | France Telecom | Procede de codage et de decodage audio a debit variable |
CN101615396B (zh) * | 2003-04-30 | 2012-05-09 | 松下电器产业株式会社 | 语音编码设备、以及语音解码设备 |
CA2457988A1 (en) * | 2004-02-18 | 2005-08-18 | Voiceage Corporation | Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization |
US7177804B2 (en) * | 2005-05-31 | 2007-02-13 | Microsoft Corporation | Sub-band voice codec with multi-stage codebooks and redundant coding |
JP5009910B2 (ja) * | 2005-07-22 | 2012-08-29 | フランス・テレコム | レートスケーラブル及び帯域幅スケーラブルオーディオ復号化のレートの切り替えのための方法 |
US7877253B2 (en) * | 2006-10-06 | 2011-01-25 | Qualcomm Incorporated | Systems, methods, and apparatus for frame erasure recovery |
JP5166425B2 (ja) * | 2006-10-24 | 2013-03-21 | ヴォイスエイジ・コーポレーション | 音声信号中の遷移フレームの符号化のための方法およびデバイス |
WO2009033288A1 (en) * | 2007-09-11 | 2009-03-19 | Voiceage Corporation | Method and device for fast algebraic codebook search in speech and audio coding |
US8515767B2 (en) * | 2007-11-04 | 2013-08-20 | Qualcomm Incorporated | Technique for encoding/decoding of codebook indices for quantized MDCT spectrum in scalable speech and audio codecs |
WO2009114656A1 (en) * | 2008-03-14 | 2009-09-17 | Dolby Laboratories Licensing Corporation | Multimode coding of speech-like and non-speech-like signals |
CN102177542B (zh) * | 2008-10-10 | 2013-01-09 | 艾利森电话股份有限公司 | 能量保留多通道音频编码 |
FR2947945A1 (fr) * | 2009-07-07 | 2011-01-14 | France Telecom | Allocation de bits dans un codage/decodage d'amelioration d'un codage/decodage hierarchique de signaux audionumeriques |
AU2010309894B2 (en) * | 2009-10-20 | 2014-03-13 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Multi-mode audio codec and CELP coding adapted therefore |
CA2789107C (en) | 2010-04-14 | 2017-08-15 | Voiceage Corporation | Flexible and scalable combined innovation codebook for use in celp coder and decoder |
-
2008
- 2008-10-17 NO NO13180475A patent/NO2669468T3/no unknown
-
2012
- 2012-05-09 PT PT127826410T patent/PT2707687T/pt unknown
- 2012-05-09 JP JP2014509572A patent/JP6173304B2/ja active Active
- 2012-05-09 DK DK12782641.0T patent/DK2707687T3/da active
- 2012-05-09 CA CA2830105A patent/CA2830105C/en active Active
- 2012-05-09 EP EP12782641.0A patent/EP2707687B1/en active Active
- 2012-05-09 WO PCT/CA2012/000441 patent/WO2012151676A1/en active Application Filing
- 2012-05-09 ES ES12782641.0T patent/ES2668920T3/es active Active
- 2012-05-09 CN CN201280022757.XA patent/CN103518122B/zh active Active
- 2012-05-11 US US13/469,744 patent/US8825475B2/en active Active
-
2014
- 2014-05-16 HK HK14104605.3A patent/HK1191395A1/zh unknown
Also Published As
Publication number | Publication date |
---|---|
JP6173304B2 (ja) | 2017-08-02 |
PT2707687T (pt) | 2018-05-21 |
EP2707687A4 (en) | 2014-11-19 |
EP2707687A1 (en) | 2014-03-19 |
US8825475B2 (en) | 2014-09-02 |
EP2707687B1 (en) | 2018-03-28 |
CA2830105A1 (en) | 2012-11-15 |
CA2830105C (en) | 2018-06-05 |
ES2668920T3 (es) | 2018-05-23 |
NO2669468T3 (da) | 2018-06-02 |
HK1191395A1 (zh) | 2014-07-25 |
CN103518122B (zh) | 2016-04-20 |
CN103518122A (zh) | 2014-01-15 |
JP2014517933A (ja) | 2014-07-24 |
WO2012151676A1 (en) | 2012-11-15 |
US20120290295A1 (en) | 2012-11-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
USRE49363E1 (en) | Variable bit rate LPC filter quantizing and inverse quantizing device and method | |
CN101180676B (zh) | 用于谱包络表示的向量量化的方法和设备 | |
CA2778240A1 (en) | Multi-mode audio codec and celp coding adapted therefore | |
RU2005137320A (ru) | Способ и устройство для квантования усиления в широкополосном речевом кодировании с переменной битовой скоростью передачи | |
DK2559028T3 (da) | Fleksible og skalerbar kombineret innovationskodebog til anvendelse i celpkoder og -afkoder | |
DK2707687T3 (da) | Transformationsdomæne-kodebog i en celp-koder og -afkoder | |
US9640191B2 (en) | Apparatus and method for processing an encoded signal and encoder and method for generating an encoded signal |