DK2707687T3 - Transformationsdomæne-kodebog i en celp-koder og -afkoder - Google Patents

Transformationsdomæne-kodebog i en celp-koder og -afkoder Download PDF

Info

Publication number
DK2707687T3
DK2707687T3 DK12782641.0T DK12782641T DK2707687T3 DK 2707687 T3 DK2707687 T3 DK 2707687T3 DK 12782641 T DK12782641 T DK 12782641T DK 2707687 T3 DK2707687 T3 DK 2707687T3
Authority
DK
Denmark
Prior art keywords
codebook
domain
adaptive
stage
transform
Prior art date
Application number
DK12782641.0T
Other languages
English (en)
Inventor
Vaclav Eksler
Original Assignee
Voiceage Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=47138606&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=DK2707687(T3) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Voiceage Corp filed Critical Voiceage Corp
Application granted granted Critical
Publication of DK2707687T3 publication Critical patent/DK2707687T3/da

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/038Vector quantisation, e.g. TwinVQ audio
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
    • G10L19/107Sparse pulse excitation, e.g. by using algebraic codebook
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0004Design or structure of the codebook
    • G10L2019/0005Multi-stage vector quantisation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals

Claims (16)

1. Koder af et inputlydsignal (s(n)), omfattende: et adaptivt kodebogsstadie struktureret til at søge i en adaptiv kodebog (120) for at finde et adaptivt kodebogsindeks (7) og en adaptiv kodebogsforstærkning {gP)\ en kodebogsanordning omfattende: et første kodebogsstadie, der inkluderer en af en tidsdomæne-CELP-kodebog (130, 604, 607) og en transformationsdomæne-kodebog (320, 520, 605, 606), der inkluderer en kalkulator (303) af en transformation af et transformationsdomæne-kodebog-målsignal (300, 500) og en quantizer (305) af transformationsdomænekoefficienter (304, 504) fra transformationskalkulatoren (303); og et andet kodebogsstadie, der inkluderer den anden af tidsdomæne-CELP-kodebogen (130, 604, 607) og transformationsdomæne-kodebogen (320, 520, 605, 606); hvor det første og andet kodebogsstadie er struktureret til at søge i den respektive tidsdomæne-CELP-kodebog (130, 604, 607) og transformationsdomæne-kodebog (320, 520, 605, 606) for at finde et innovativt kodebogsindeks (k), en innovativ kodebogsforstærkning (gc), transformationsdomænekoefficienter (304, 504), og en transformationsdomæne-kodebogsforstærkning (gq); hvor kodebogsstadierne anvendes i sekvensen adaptivt kodebogsstadie, første kodebogsstadie, andet kodebogsstadie til kodning af inputlydsignalet; kendetegnet ved, at kodebogsanordningen yderligere omfatter: en selektor af en rækkefølge af henholdsvis tidsdomæne-CELP-kodebogen (130, 604, 607) og transformationsdomæne-kodebogen (320, 520, 605, 606) i det første og andet kodebogsstadie, som en funktion af mindst en af (a) karakteristika af inputlydsignalet {s(n)) og (b) en bitrate af et codec, der anvender kodebogsanordningen.
2. Koder som defineret i krav 1, hvor selektoren omfatter en sorterer (601) af inputlydsignalet (s(n)), og mindst en første omskifter (602) styret af sortereren (601) til at ændre rækkefølgen af tidsdomæne-CELP-kodebogen (130, 604, 607) og transformationsdomæne-kodebogen (320, 520, 605, 606) i det første og andet kodebogsstadie.
3. Koder som defineret i krav 2, hvor selektoren omfatter en anden omskifter (603), som reagerer på både karakteristikaene af inputlydsignalet (s(n)) og bitraten af codecet under anvendelse af kodebogsanordningen for at omgå det andet kodebogsstadie.
4. Koder som defineret i krav 2, hvor sortereren (601) sorterer hvert af successive segmenter af inputlydsignalet (s(n)) som aktivt tale-segment eller inaktivt tale-segment.
5. Koder som defineret i krav 1, hvor kodebogsanordningen omfatter et antal af kodebogsstadier relateret til mindst en af (a) karakteristika af inputlydsignalet og (b) en bitrate af et codec, der anvender kodebogsanordningen.
6. Koder som defineret i krav 1, hvor transformationen er en diskret cosinus-transformation og quantizeren (305) er en algebraisk vektor-quantizer.
7. Koder som defineret i krav 1 eller 6, hvor transformationsdomæne-kodebogen (320, 520, 605, 606) omfatter et efterbetoningsfilter (301), der behandler transformationsdomæne-kodebog-målsignalet (300, 500) før forsyning af nævnte transformationsdomæne-kodebog-målsignal (302, 502) til transformationskalkulatoren (303).
8. Koder som defineret i et hvilket som helst af kravene 1, 6 og 7, hvor stadiet af transformationsdomæne-kodebog (320, 520, 605, 606) yderligere omfatter en kalkulator (307) af en invers transformation (30, 508) af kvantiserede transformationsdomænekoefficienter (306, 506) fra quantizeren (305), et betoningsudligningsfilter (309) til behandling af de invers transformerede, kvantiserede transformationsdomænekoefficienter (308, 508) for at producere et tidsdomæne-excitationssignal (310, 510), et vægtet syntesefilter (311) til behandling af tidsdomæne-excitationssignalet (310, 510) for at producere et filtreret transformationsdomæne-kodebog-excitationssignal (y3(n)), og en forstærker (312) under anvendelse af transformationsdomæne-kodebogsforstærkningen (gq) til at skalere det filtrerede transformationsdomæne-kodebog-excitationssignal (/3(77)) for at producere transformationsdomæne-kodebog-excitationsbidraget (409).
9. Koder som defineret i et hvilket som helst af kravene 1 og 6 til 8, hvor det adaptive kodebogsstadie omfatter en adaptiv kodebog (120) forsynet med det adaptive kodebogsindeks (7) til at producere en adaptiv kodebog-vektor (v(n)), og hvor koderen omfatter en kalkulator (104, 105, 106) af transformationsdomæne-kodebog-målsignalet (300), der anvender den adaptive kodebog-vektor (v(n)) når transformationsdomæne-kodebogen (320, 520, 605, 606) er inkluderet i det første kodebogsstadie.
10. Koder som defineret i et hvilket som helst af kravene 1 og 6 til 8, hvor: det adaptive kodebogsstadie omfatter en adaptiv kodebog (120) og beregner et adaptivt kodebog-excitationsbidrag (203) ved at forsyne det adaptive kodebogsindeks (7) til den adaptive kodebog (120) for at producere en adaptiv kodebog-vektor (v(n)), der behandler den adaptive kodebog-vektor (v(n)) via et vægtet syntesefilter (105) for at producere et filtreret adaptivt kodebog-excitationssignal (yi(n)), og der forstærker det filtrerede adaptive kodebog-excitationssignal med en forstærker (106) under anvendelse af den adaptive kodebogsforstærkning (gP) for at producere det adaptive kodebog-excitationsbidrag (203); og tidsdomæne-CELP-kodebogsstadiet omfatter som tidsdomæne-CELP-kodebogen (130, 604, 607) en innovationskodebog og beregner et innovationskodebog-excitationsbidrag (206) ved at anvende innovationskodebogsindekset (k) på innovationskodebogen for at producere en innovationskodebog-vektor (c(n)), behandle innovationskodebog-vektoren (c(n)) via et vægtet syntesefilter (108) for at producere et filtreret innovationskodebog-excitationssignal (y2(n)), og forstærke det filtrerede innovationskodebog-excitationssignal (y2(n)) med en forstærker (109) under anvendelse af innovationskodebogsforstærkningen (gc) for at producere innovationskodebog-excitationsbidraget (206).
11. Koder som defineret i krav 10, omfattende en kalkulator (108, 109, 1 10) af transformationsdomæne-kodebog-målsignalet (500), der anvender det adaptive kodebog-excitationsbidrag (203) og innovationskodebog-excitationsbidraget (206) når transformationsdomæne-kodebogen (320, 520, 605, 606) er inkluderet i det andet kodebogsstadie.
12. Koder som defineret i et hvilket som helst af kravene 1 og 6 til 11, hvor stadiet af transformationsdomæne-kodebogen (320, 520, 605, 606) omfatter et bitbudget allokeret til kvantiseringen af quantizeren (305), der er en sum af et fast bitbudget og et flydende antal af bit.
13. Koder som defineret i krav 12, hvor det flydende antal af bit i en aktuel underramme omfatter bit ubrugt til kvantiseringen i en tidligere underramme.
14. Koder som defineret i et hvilket som helst af kravene 1 og 6 til 13, hvor trinnet af transformationsdomæne-kodebogen (320, 520, 605, 606) omfatter en kalkulator af transformationsdomæne-kodebogsforstærkningen (gq), der anvender transformationsdomænekoefficienter (304, 504) fra transformationskalkulatoren (303) og kvantiserede transformationsdomænekoefficienter (306, 506) fra quantizeren (305).
15. Koder som defineret i et hvilket som helst af kravene 1 og 6 til 14, hvor trinnet af transformationsdomæne-kodebogen (320, 520, 605, 606) producerer et transformationsdomæne-kodebog-excitationsbidrag, og hvor det adaptive kodebogs (120) -stadie bruger transformationsdomæne-kodebog-excitationsbidraget til at redefinere den adaptive kodebogsforstærkning (gP).
16. Koder som defineret i et hvilket som helst af kravene 1 og 6 til 15, omfattende en begrænser af den adaptive kodebogsforstærkning (gP) i tilstedeværelsen af inaktive lydsignal-segmenter.
DK12782641.0T 2011-05-11 2012-05-09 Transformationsdomæne-kodebog i en celp-koder og -afkoder DK2707687T3 (da)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201161484968P 2011-05-11 2011-05-11
PCT/CA2012/000441 WO2012151676A1 (en) 2011-05-11 2012-05-09 Transform-domain codebook in a celp coder and decoder

Publications (1)

Publication Number Publication Date
DK2707687T3 true DK2707687T3 (da) 2018-05-28

Family

ID=47138606

Family Applications (1)

Application Number Title Priority Date Filing Date
DK12782641.0T DK2707687T3 (da) 2011-05-11 2012-05-09 Transformationsdomæne-kodebog i en celp-koder og -afkoder

Country Status (11)

Country Link
US (1) US8825475B2 (da)
EP (1) EP2707687B1 (da)
JP (1) JP6173304B2 (da)
CN (1) CN103518122B (da)
CA (1) CA2830105C (da)
DK (1) DK2707687T3 (da)
ES (1) ES2668920T3 (da)
HK (1) HK1191395A1 (da)
NO (1) NO2669468T3 (da)
PT (1) PT2707687T (da)
WO (1) WO2012151676A1 (da)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9263053B2 (en) * 2012-04-04 2016-02-16 Google Technology Holdings LLC Method and apparatus for generating a candidate code-vector to code an informational signal
US9070356B2 (en) * 2012-04-04 2015-06-30 Google Technology Holdings LLC Method and apparatus for generating a candidate code-vector to code an informational signal
CN111133510B (zh) * 2017-09-20 2023-08-22 沃伊斯亚吉公司 用于在celp编解码器中高效地分配比特预算的方法和设备

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IT1281001B1 (it) * 1995-10-27 1998-02-11 Cselt Centro Studi Lab Telecom Procedimento e apparecchiatura per codificare, manipolare e decodificare segnali audio.
US6134518A (en) * 1997-03-04 2000-10-17 International Business Machines Corporation Digital audio signal coding using a CELP coder and a transform coder
DE69926821T2 (de) * 1998-01-22 2007-12-06 Deutsche Telekom Ag Verfahren zur signalgesteuerten Schaltung zwischen verschiedenen Audiokodierungssystemen
US6453289B1 (en) * 1998-07-24 2002-09-17 Hughes Electronics Corporation Method of noise reduction for speech codecs
US7072832B1 (en) * 1998-08-24 2006-07-04 Mindspeed Technologies, Inc. System for speech encoding having an adaptive encoding arrangement
SE519985C2 (sv) * 2000-09-15 2003-05-06 Ericsson Telefon Ab L M Kodning och avkodning av signaler från flera kanaler
US20030135374A1 (en) * 2002-01-16 2003-07-17 Hardwick John C. Speech synthesizer
CA2388358A1 (en) 2002-05-31 2003-11-30 Voiceage Corporation A method and device for multi-rate lattice vector quantization
FR2849727B1 (fr) * 2003-01-08 2005-03-18 France Telecom Procede de codage et de decodage audio a debit variable
CN101615396B (zh) * 2003-04-30 2012-05-09 松下电器产业株式会社 语音编码设备、以及语音解码设备
CA2457988A1 (en) * 2004-02-18 2005-08-18 Voiceage Corporation Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization
US7177804B2 (en) * 2005-05-31 2007-02-13 Microsoft Corporation Sub-band voice codec with multi-stage codebooks and redundant coding
JP5009910B2 (ja) * 2005-07-22 2012-08-29 フランス・テレコム レートスケーラブル及び帯域幅スケーラブルオーディオ復号化のレートの切り替えのための方法
US7877253B2 (en) * 2006-10-06 2011-01-25 Qualcomm Incorporated Systems, methods, and apparatus for frame erasure recovery
JP5166425B2 (ja) * 2006-10-24 2013-03-21 ヴォイスエイジ・コーポレーション 音声信号中の遷移フレームの符号化のための方法およびデバイス
WO2009033288A1 (en) * 2007-09-11 2009-03-19 Voiceage Corporation Method and device for fast algebraic codebook search in speech and audio coding
US8515767B2 (en) * 2007-11-04 2013-08-20 Qualcomm Incorporated Technique for encoding/decoding of codebook indices for quantized MDCT spectrum in scalable speech and audio codecs
WO2009114656A1 (en) * 2008-03-14 2009-09-17 Dolby Laboratories Licensing Corporation Multimode coding of speech-like and non-speech-like signals
CN102177542B (zh) * 2008-10-10 2013-01-09 艾利森电话股份有限公司 能量保留多通道音频编码
FR2947945A1 (fr) * 2009-07-07 2011-01-14 France Telecom Allocation de bits dans un codage/decodage d'amelioration d'un codage/decodage hierarchique de signaux audionumeriques
AU2010309894B2 (en) * 2009-10-20 2014-03-13 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Multi-mode audio codec and CELP coding adapted therefore
CA2789107C (en) 2010-04-14 2017-08-15 Voiceage Corporation Flexible and scalable combined innovation codebook for use in celp coder and decoder

Also Published As

Publication number Publication date
JP6173304B2 (ja) 2017-08-02
PT2707687T (pt) 2018-05-21
EP2707687A4 (en) 2014-11-19
EP2707687A1 (en) 2014-03-19
US8825475B2 (en) 2014-09-02
EP2707687B1 (en) 2018-03-28
CA2830105A1 (en) 2012-11-15
CA2830105C (en) 2018-06-05
ES2668920T3 (es) 2018-05-23
NO2669468T3 (da) 2018-06-02
HK1191395A1 (zh) 2014-07-25
CN103518122B (zh) 2016-04-20
CN103518122A (zh) 2014-01-15
JP2014517933A (ja) 2014-07-24
WO2012151676A1 (en) 2012-11-15
US20120290295A1 (en) 2012-11-15

Similar Documents

Publication Publication Date Title
USRE49363E1 (en) Variable bit rate LPC filter quantizing and inverse quantizing device and method
CN101180676B (zh) 用于谱包络表示的向量量化的方法和设备
CA2778240A1 (en) Multi-mode audio codec and celp coding adapted therefore
RU2005137320A (ru) Способ и устройство для квантования усиления в широкополосном речевом кодировании с переменной битовой скоростью передачи
DK2559028T3 (da) Fleksible og skalerbar kombineret innovationskodebog til anvendelse i celpkoder og -afkoder
DK2707687T3 (da) Transformationsdomæne-kodebog i en celp-koder og -afkoder
US9640191B2 (en) Apparatus and method for processing an encoded signal and encoder and method for generating an encoded signal