DK172571B1 - Kodning af tale - Google Patents

Kodning af tale Download PDF

Info

Publication number
DK172571B1
DK172571B1 DK198902061A DK206189A DK172571B1 DK 172571 B1 DK172571 B1 DK 172571B1 DK 198902061 A DK198902061 A DK 198902061A DK 206189 A DK206189 A DK 206189A DK 172571 B1 DK172571 B1 DK 172571B1
Authority
DK
Denmark
Prior art keywords
pulse
frame
excitation
speech
frames
Prior art date
Application number
DK198902061A
Other languages
English (en)
Other versions
DK206189D0 (da
DK206189A (da
Inventor
Daniel Kenneth Freeman
Ivan Boyd
Original Assignee
British Telecomm
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from GB878720389A external-priority patent/GB8720389D0/en
Priority claimed from GB878721667A external-priority patent/GB8721667D0/en
Application filed by British Telecomm filed Critical British Telecomm
Publication of DK206189D0 publication Critical patent/DK206189D0/da
Publication of DK206189A publication Critical patent/DK206189A/da
Application granted granted Critical
Publication of DK172571B1 publication Critical patent/DK172571B1/da

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
    • G10L19/107Sparse pulse excitation, e.g. by using algebraic codebook

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Physics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)

Description

i DK PR 172571 B1
En almindelig teknik til kodning af tale er den såkaldte LPC kodning, hvori et indgangstalesignal på en koder opdeles i tidsintervaller, og hvert interval analyseres for at bestemme parametrene af et syntesefilter, hvis reaktion er repræsentativ for sekvensspektret af signalet i det pågældende interval. Parametrene transmitteres til en dekoder, 5 hvor de periodisk opdaterer parametrene for et syntesefilter, som, når det fødes med et passende excitationssignal, frembringer et udgangssignal i form af en syntetisk tale, som tilnærmelsesvis svarer til det oprindelige indgangssignal.
Det er klart, at koderen også skal sende information, hvad angår arten af excitationen, som skal anvendes, til dekoderen. Et antal forskellige muligheder er blevet foreslået for 10 at opnå dette, og de falder i to hovedkategorier, nemlig: (i) Residuel exciteret lineær forudsigelig kodning (RELP), hvor indgangssignalet ledes gennem et filter, som er det omvendte af syntesefilteret, for at producere et residualsig-nal, som kan kvantiseres og sendes (muligvis efter filtrering) for at blive anvendt som excitation (fødesignal), eller som kan analyseres, f.eks. for at opnå stemme- og tonehøj· 15 de (eng.: pitch) parametre for transmission til en excitationsgenerator i dekoderen.
(ii) Analyse ved syntesemetoder, hvori excitation udledes således, at når den ledes gennem syntesefilteret, minimaliseres differensen mellem det opnåede udgangssignal og indgangstalesignalet. I denne kategori er der to forskellige løsninger: Den ene er en multiimpulsexcitation (MP-LPC), hvori en tidsramme svarende til et antal taleeksem- 20 pieringer indeholder et, noget mindre, begrænset antal excitationsimpulser, hvis amplituder og positioner er kodede. En modificeret form for multipulsexcitation er beskrevet i europæisk patentansøgning publiceret som EP 0195487A, hvor excitationsimpulser er tvunget til at ligge på ét af et antal regelmæssige gitre med forskellig fase; gitterpositionen kan opnås ved at rette den ind med den første impuls, der skal bestemmes. Den 25 anden løsning er stokastisk kodning eller kode-exciteret lineær forudsigelse (CELP).
Koderen og dekoderen har hver en lagret liste af standardrammer for excitationer. For hver taleramme identificeres den ene af kodebogsindgangene, som, når den ledes gen- DK PR 172571 B1 2 nem syntesefilteret, danner syntetisk tale tættest på den virkelige tale, og et kodeord, som er knyttet til den, sendes til dekoderen, som derefter kan genfinde den samme indgang ud fra den liste, der er lagret i den. Sådanne kodebøger kan kompileres ved brug af vilkårlig sekvensdannelse. En anden variant er imidlertid den såkaldte "sparse 5 vektor"-kodebog, hvori en ramme kun indeholder et lille antal impulser (f.eks. 4 eller 5 impulser ud af 32 mulige positioner for en ramme). En CELP koder kan typisk have en kodebog med 1024 indgange.
CELP kodere er beskrevet i Proceedings of the ICASSP 87, International Conference in Acoustics, Speech, and Signal Processing, Dallas, Texas, 6. - 9- april 1987, Vol. 3, 10 pages 1354-1357, IEEE, New York, US; D. Lin: "Speech coding using efficient pseudostochastic block codes" og også Proceedings of the ICASSP 86, International Conference on Acoustics Speech and Signal Processing, Tokyo, 7. - 11. april 1986, Vol. I, pages 469-472, IEEE, New York, US; L. A. Hemandez-Gomez et al. "On the behaviour of reduced complexity code-excited linear prediction” (CELP). Lin beskriver en tre-struk-15 tureret undersøgelse til at vælge den ønskede kodebogsindgang. Hemandez-Gomez et al. forslaget involverer undersøgelse af kode-bogen ved anvendelse af et første kriterie til at opnå en delmængde af indgangene og så søge ved at anvende et andet kriterie til at identificere den ønskede indgang inden for delmængden.
Ifølge den foreliggende opfindelse er der tilvejebragt en talekoder omfattende: 20 midler indrettet til i drift ud fra successive tidsrammeperioder af indgangstalesignaler at danne filterinformation, som definerer successive repræsentationer for en syntesefilterre-aktion, og til at udsende filterinformationen; midler indrettet dl i drift, for hver af de successive tidsrammeperioder af talen at modtage indgangstalesignaleme og den respektive filterinformation, og at danne excitationsin-25 formation, omfattende: DK PR 172571 B1 3 (a) et datalager, som definerer flere excitationsrammer, der hver især består af flere impulser; (b) midler til at vælge en excitations ramme ud af de mange rammer og rotations forskudte versioner af rammerne og til at danne data, som identificerer lagerindgangen og 5 størrelsen om nogen af dens rotationsforskydninger, kendetegnet ved, at vælgennidlerae er indrettet til: (i) ud fra et antal af enkeltimpulsrammer, som hver består af en enkelt impuls ved et forskelligt sted, at bestemme hvilken ramme, der opfylder det kriterium, at den, når den bliver påtrykt indgangen af et filler med den af filterinformationen dannede karakteristik, 10 vil frembringe en ramme af syntetisk tale, som tættest ligner rammen af indgangstale; og (ii) bestemme hvilken af de mange oplagrede rammer der, når den rotationsmæssigt forskydes en størrelse afledt af den fastlagte impulsposition, opfylder det nævnte kriterium.
15 Andre træk ifølge opfindelsen fremgår af underkravene.
Det vil kunne forstås ud fra indledningen, at multiimpulskodere og spredte vektor-CELP-kodere har det til fælles, at den anvendte excitation i begge tilfælde er en ramme indeholdende et antal impulser, der er væsentligt mindre end antallet af tilladelige positioner inden for rammen.
20 Den koder, som nu skal beskrives, ligner CELP ved, at den anvender en spredt vektor-kodebog, som imidlertid er meget mindre end den, der konventionelt anvendes, f.eks.
32 eller 64 indgange.
DK PR 172571 B1 4
Opfindelsen skal i det følgende forklares nærmere ud fra nogle eksempler og under henvisning til den ledsagende tegning, hvorpå fig· 1 viser den roterende impuls forskydning, der anvendes ifølge opfindelsen, fig. 2 et blokdiagram af en udførelsesform for en talekoder ifølge opfindelsen, og 5 fig. 3 et blokdiagram af en passende dekoder.
Det vil kunne forstås ud fra indledningen, at multiimpulskodere og spredte vektor-CELP-kodere har det tilfælles, at den anvendte excitation i begge tilfælde er en ramme indeholdende et antal impulser, der er væsentligt mindre end antallet af tilladelige positioner inden for rammen.
10 Den koder, som nu skal beskrives, ligner CELP ved, at den anvender en spredt vektor-kodebog, som imidlertid er meget mindre end den, der konventionelt anvendes, f.eks.
32 eller 64 indgange. Hver indgang repræsenterer en excitation, hvorfra der kan udledes andre medlemmer af et sæt af excitationer, som alene afviger fra den ene excitation - og fra hinanden - ved en cyklisk forskydning. Tre sådanne medlemmer af sættet er vist i 15 fig. la, lb og lc for en 32 positionsramme med fem impulser, hvoraf det ses, at lb kan dannes af la ved cyklisk at forskyde indgangen til venstre og tilsvarende lc ud fira la. Forskydningens størrelse angives i figuren af en pil med to hoveder. En cyklisk forskydning betyder, at impulser forskydes ud til venstre, kører randt og kommer ind igen fra højre side. Den indgang, der repræsenterer sættet, lagres med den største impuls i 20 position 1, som vist i fig. Id. Størrelsen af den største impuls behøver ikke at blive lagret, hvis de andre normaliseres i forhold til den.
Hvis antallet af kodebogsindgange er 32, kan den valgte excitation repræsenteres af 5 bit kodeord, der identificerer indgangen, og et yderligere 5 bit, der giver antallet af DK PR 172571 B1 5 forskydninger fra den lagrede position (hvis alle 32 mulige forskydninger skal være tilladte).
Fig. 2 er et blokdiagram af en talekoder. Talesignalet modtaget på en indgang l, konverteres til eksempleringer eller med andre ord samplede værdier af en samplingenhed 2 og 5 bringes derefter på digital form i en analog-til-digital konverter 3. En analyseenhed 4 beregner for hver successive gruppe af eksempleringer koefficienterne for et syntesefilter med en reaktion svarende til det spektrale indhold af talen. Udledning af LPC koefficienter er velkendt og vil ikke blive beskrevet yderligere her. Koefficienterne tilføres til en udgangsmultiplekser 5 og endvidere til et lokalt syntesefilter 6. Filtreret opdaterings-10 hastighed kan typisk være én gang for hver 20 ms.
Kodeenheden har også et kodebogslager 7, der indeholder de ovennævnte 32 kodebogs-indgange. Den måde, hvorpå indgangene lagres, er ikke væsentlig for den foreliggende opfindelse, men det antages, at hver indgang (for en fem impuls excitation i en perioderamme med 32 eksempleringer) indeholder positionerne inden for rammen og aroplitu-15 deme af de fire impulser efter den første. Denne information, som, når den læses fra lageret, tilføres en excitationsgenerator 8, som frembringer en aktuel excitationsramme (f.eks. 32 værdier, hvoraf 27 ef nul, naturligvis). Dens udgangssignal tilføres via en styret forskydningsenhed 9 til indgangen af syntesefilteret 6. Udgangssignalet fra filteret sammenlignes af et subtraktionsled 10 med indgangseksempleringeme, som tilføres i en 20 buffer 11 (således at antallet af sammenligninger kan foretages mellem en taleramme på 32 eksempleringer (sampler) og forskellige filtrerede excitationer).
For at sikre en passende forskydningsværdi lånes visse teknikker fra multiimpulskod-ning. Ved multiimpulskodning er en almindelig fremgangsmåde til at udligne impulspositioner og amplituder en iterativ metode, hvorved kun én impuls beregnes, hvilket 25 formindsker fejlen mellem den syntetiske og den aktuelle tale; der findes derefter en yderligere impuls, som kombineret med den første formindsker fejlen og således videre.
DK PR 172571 B1 6
Analyse af de statistiske MP-LPC impulser viser, at den første impuls, som skal udledes, i almindelighed har den største amplitude.
Denne udførelsesform for opfindelsen gør brug af dette ved at udføre en multiimpulssøg-ning for at finde positionen af denne største impuls alene. En hvilken som helst af de 5 kendte metoder til dette kan anvendes, f.eks. hvad der er beskrevet i B.S. Atal & J. R.
Remde, "A New Model of LPC Excitation for producing Natural Sounding Speech at Low Bit rates" (PROC. IEEE Int. Conf. ASSP, Paris, 1982, side 614).
En søgeenhed 12 er vist i fig. 2 til dette formål. Dens udgangssignal føder forskydnings-enhed 9 for at bestemme den rotationsforskydning, som anvendes på excitationen, der 10 dannes af generatoren 8. Dette vælger effektivt blandt 1024 excitationer, der er tilladt af kodebogen, en særlig klasse af excitationer, nemlig dem, der har den største impuls, der optager den specielle position bestemt af søgeenheden i 13.
Udgangssignalet fra subtraktionsleddet 10 føder en styreenhed 13, som også tilfører adresser til lageret 7 og forskyder værdierne til forskydningsenheden 9. Formålet med 15 styreenheden er at fastslå, hvilke af de 32 mulige excitationer, der repræsenteres af den valgte klasse, der giver det mindste udgangssignal fra subtraktionsleddet (i almindelighed middelkvadratværdien af differenserne over en ramme). Den endelige bestemte indgang udsendes i form af et kodeord C og en forskydningsværdi S til udgangsmuldplekseren 5.
20 Indgangsbestemmelsen ved hjælp af styreenheden for en given taleramme, der er til rådighed på udgangen af bufferen 11, er som følger: (i) anvende successive kodeord (kodebogsadresser) på lageret 7, (ii) anvend på hver kodebogs indgang en forskydning, således at den første impuls flyttes til den position, der er angivet af multiimpulssøgningen, DK PR 172571 B1 7 (iii) overvåg udgangssignalet fra subtraktionsleddet 10 for alle 32 indgange for at fastslå, hvilken der giver anledning til den laveste middellcvadratdifferens, (iv) udsend kodeordet og forskydningsværdien til multiplekseren.
Sammenlignet med en konventionel CELP koder, der anvender en kodebog med 1024 S indgange, er der kun en lille reduktion i det opnåede signals støjforhold på grund af begrænsningerne, der er placeret på excitationeme (dvs. hvis de falder i 32 indbyrdes forskydelige klasser). Der er imidlertid en (betydelig) reduktion i størrelsen af kodebo-gen og dermed i kravene til lagerplads i lageret 7. Den beregningsmængde, som skal udføres af styreenheden 13, er endvidere væsentligt reduceret, eftersom der kun skal 10 udføres 32 prøver i stedet for 1024.
For at tillade den suboptimale udvælgelse, der er indbygget i "multiimpulssøgningen”, kan den ovennævnte fremgangsmåde også indbefatte excitationer, som forskydes nogle få positioner før og efter den position, der findes ved søgningen.
Dette kunne opnås af styreenheden ved addition/subtraktion af passende værdier fra 15 forskydningsværdien, som tilføres til forskydningsenheden 9, som angivet af den punkterede ledningsforbindelse. Eftersom det filtrerede udgangssignal fra en tidsforskudt version af en given excitation er en tidsforskudt version af filterets reaktion på den givne excitation, kunne disse forskydninger i stedet udføres af et andet forskydningsled 14 placeret efter syntesefilteret 6. Når der først er sket en rotation, er resultatet imidlertid 20 ikke længere korrekt. Dette problem kan afhjælpes ved (a) ikke at udføre forskydninger, som kan bevirke en rotation, (b) at udføre forskydningen, men at tillade, at impulserne går tabt i stedet for at blive roteret rundt (og ved at informere dekoderen) eller (c) tillade rotation, men udføre en korrektion for at korrigere for fejlen.
Dannelsen af kodebogen mangler at blive beskrevet. Kodebogen kan dannes ved hjælp 25 af gaussisk støjteknik på den måde, der allerede er foreslået i: "Scolastic Coding of DK PR 172571 B1 8
Speech Signals at very low Bit Rates", B. S. Atal & M. R. Schroeder, Proc - IEEE lut.
Conf. on Communications, 1984, side 1610-1613. En yderligere fordel kan opnås ved dannelse af kodebogen ved hjælp af statistisk analyse af resultaterne, som frembringes af en multiimpulskoder. Dette kan fjerne den tilnærmelse, der ligger i antagelsen af, at 5 den første impuls, der udledes af multiimpulssøgningen, er den største, eftersom kode-bogsindgangene da kan lagres med første opnåede impuls i en standardposition, og forskudt således, at denne impuls bringes til den position, der er udledt af enheden.
Selv om de forskellige funktionselementer, der er vist i fig. 2, er vist separat, kan nogle eller alle elementerne i praksis udføres af det samme udstyr. Et af de i handelen værende 10 digitale signalbehandlings integrerede kredsløb (DSP) kan f.eks. anvendes passende programmeret.
Selv om "multiimpulssøgnings"-muligheden er blevet beskrevet i forbindelse med forskudte kodebogsindgange, kan den også anvendes til andre situationer, hvor de tilladte excitationer kan være opdelt i klasser, inden for hvilke alle excitationeme har den største 15 eller den mest betydende impuls i en særlig position inden for rammen. Positionen af den udledte impuls anvendes da til at vælge den korrekte klasse, og kun kodebogsindgange i den klasse behøver at blive afprøvet.
Fig. 3 viser en dekoder til at reproducere signaler, der er indkodet med apparatet i fig.
2.
20 En indgang 30 forsynet en demultiplekser 31, som (a) tilfører filterkoefficienter til et syntetisk filter 32, (b) tilfører kodeord til adresseindgangen på et kodebogslager 33, (c) tilfører forskydningsværdier til en forskydningsenhed 34, som leder udgangssignalet fra en excitations generator 35, der er forbundet til lageret 33, til indgangen af syntesefilteret 32. Udgangssignalet for talen fra filteret 32 tilføres via en digital-til-analog konverter 25 36 til en udgang 37.

Claims (4)

  1. 2. Talekoder ifølge krav 1,kendetegnet ved, at nævnte rotationsforskudte versioner bestir af oplagrede rammer, som er blevet forskudt med en størrelse, der svarer til den forudbestemte impulsposition.
  2. 3. Talekoder ifølge krav 1, kendetegnet ved, at de rotationsforskudte versioner 5 omfatter de oplagrede rammer, som hver er forskudt med en størrelse, som svarer til den fastlagte impulsposition, og de rammer, som er udsat for yderligere forskydninger, som er små i forhold til rammestørrelsen.
  3. 4. Talekoder ifølge krav 2 eller 3, kendetegnet ved, at forskydningsstørrelsen svarende til den fastlagte impuls position er den forskydning, som bringer den største 10 impuls af excitationsrammen ind i den samme position inden for rammen som den bestemte enkelte impuls.
  4. 5. Talekoder ifølge krav 3 eller 4, kendetegnet ved, at hver af antallet af oplagrede excitationsrammer er blevet dannet ved en træningssekvens omfattende identifikation af positionen, inden for en enkelt-impulsramme, som opfylder kriteriet for en 15 enkelt, første, impuls efterfulgt af bestemmelsen af yderligere impulser, som skal være indeholdt i excitationsrammen, og at mængden af forskydning svarende til den bestemte position er den forskydning, som bringer den første impuls af excitationsrammen ind i den samme position inden for rammen, som den enkelte impuls af den enkelte impuls-ramme bestemt ved de vælgende midler.
DK198902061A 1987-08-28 1989-04-27 Kodning af tale DK172571B1 (da)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
GB8720389 1987-08-28
GB878720389A GB8720389D0 (en) 1987-08-28 1987-08-28 Speech coding
GB8721667 1987-09-15
GB878721667A GB8721667D0 (en) 1987-09-15 1987-09-15 Speech coding
PCT/GB1988/000708 WO1989002147A1 (en) 1987-08-28 1988-08-26 Speech coding
GB8800708 1988-08-26

Publications (3)

Publication Number Publication Date
DK206189D0 DK206189D0 (da) 1989-04-27
DK206189A DK206189A (da) 1989-04-27
DK172571B1 true DK172571B1 (da) 1999-01-25

Family

ID=26292660

Family Applications (1)

Application Number Title Priority Date Filing Date
DK198902061A DK172571B1 (da) 1987-08-28 1989-04-27 Kodning af tale

Country Status (10)

Country Link
US (1) US4991214A (da)
EP (1) EP0307122B1 (da)
JP (1) JP2957588B2 (da)
CA (1) CA1337217C (da)
DE (1) DE3870114D1 (da)
DK (1) DK172571B1 (da)
FI (1) FI103221B (da)
HK (1) HK128896A (da)
NO (1) NO301356B1 (da)
WO (1) WO1989002147A1 (da)

Families Citing this family (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2632758B1 (fr) * 1988-06-13 1991-06-07 Matra Communication Procede de codage et codeur de parole a prediction lineaire
US5261027A (en) * 1989-06-28 1993-11-09 Fujitsu Limited Code excited linear prediction speech coding system
NL8902347A (nl) * 1989-09-20 1991-04-16 Nederland Ptt Werkwijze voor het coderen van een binnen een zeker tijdsinterval voorkomend analoog signaal, waarbij dat analoge signaal wordt geconverteerd in besturingscodes die bruikbaar zijn voor het samenstellen van een met dat analoge signaal overeenkomend synthetisch signaal.
US5701392A (en) * 1990-02-23 1997-12-23 Universite De Sherbrooke Depth-first algebraic-codebook search for fast coding of speech
US5754976A (en) * 1990-02-23 1998-05-19 Universite De Sherbrooke Algebraic codebook with signal-selected pulse amplitude/position combinations for fast coding of speech
EP0500961B1 (en) * 1990-09-14 1998-04-29 Fujitsu Limited Voice coding system
CA2051304C (en) * 1990-09-18 1996-03-05 Tomohiko Taniguchi Speech coding and decoding system
US5061924B1 (en) * 1991-01-25 1996-04-30 American Telephone & Telegraph Efficient vector codebook
US5195137A (en) * 1991-01-28 1993-03-16 At&T Bell Laboratories Method of and apparatus for generating auxiliary information for expediting sparse codebook search
US5182773A (en) * 1991-03-22 1993-01-26 International Business Machines Corporation Speaker-independent label coding apparatus
FI98104C (fi) * 1991-05-20 1997-04-10 Nokia Mobile Phones Ltd Menetelmä herätevektorin generoimiseksi ja digitaalinen puhekooderi
ES2225321T3 (es) * 1991-06-11 2005-03-16 Qualcomm Incorporated Aparaato y procedimiento para el enmascaramiento de errores en tramas de datos.
US5253811A (en) * 1991-11-08 1993-10-19 Kohler Co. Sheet flow spout
ES2042410B1 (es) * 1992-04-15 1997-01-01 Control Sys S A Metodo de codificacion y codificador de voz para equipos y sistemas de comunicacion.
EP0577488B9 (en) * 1992-06-29 2007-10-03 Nippon Telegraph And Telephone Corporation Speech coding method and apparatus for the same
TW271524B (da) 1994-08-05 1996-03-01 Qualcomm Inc
US5742734A (en) * 1994-08-10 1998-04-21 Qualcomm Incorporated Encoding rate selection in a variable rate vocoder
US5727125A (en) * 1994-12-05 1998-03-10 Motorola, Inc. Method and apparatus for synthesis of speech excitation waveforms
US5602959A (en) * 1994-12-05 1997-02-11 Motorola, Inc. Method and apparatus for characterization and reconstruction of speech excitation waveforms
FR2729247A1 (fr) * 1995-01-06 1996-07-12 Matra Communication Procede de codage de parole a analyse par synthese
FR2729244B1 (fr) * 1995-01-06 1997-03-28 Matra Communication Procede de codage de parole a analyse par synthese
FR2729246A1 (fr) * 1995-01-06 1996-07-12 Matra Communication Procede de codage de parole a analyse par synthese
SE506379C3 (sv) * 1995-03-22 1998-01-19 Ericsson Telefon Ab L M Lpc-talkodare med kombinerad excitation
US5864797A (en) * 1995-05-30 1999-01-26 Sanyo Electric Co., Ltd. Pitch-synchronous speech coding by applying multiple analysis to select and align a plurality of types of code vectors
US5822724A (en) * 1995-06-14 1998-10-13 Nahumi; Dror Optimized pulse location in codebook searching techniques for speech processing
JP3196595B2 (ja) * 1995-09-27 2001-08-06 日本電気株式会社 音声符号化装置
JP3284874B2 (ja) 1996-03-29 2002-05-20 松下電器産業株式会社 音声符号化装置
US5751901A (en) * 1996-07-31 1998-05-12 Qualcomm Incorporated Method for searching an excitation codebook in a code excited linear prediction (CELP) coder
JP3372908B2 (ja) * 1999-09-17 2003-02-04 エヌイーシーマイクロシステム株式会社 マルチパルス探索処理方法と音声符号化装置
US6879955B2 (en) * 2001-06-29 2005-04-12 Microsoft Corporation Signal modification based on continuous time warping for low bit rate CELP coding
FI118704B (fi) 2003-10-07 2008-02-15 Nokia Corp Menetelmä ja laite lähdekoodauksen tekemiseksi
JP3981399B1 (ja) * 2006-03-10 2007-09-26 松下電器産業株式会社 固定符号帳探索装置および固定符号帳探索方法
BRPI1012064A2 (pt) 2009-05-23 2016-03-15 Scott Anthony Wozny sistema de destruição de risco rígido

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
USRE32580E (en) * 1981-12-01 1988-01-19 American Telephone And Telegraph Company, At&T Bell Laboratories Digital speech coder
JPS60225200A (ja) * 1984-04-23 1985-11-09 日本電気株式会社 音声符号化器
JPS61134000A (ja) * 1984-12-05 1986-06-21 株式会社日立製作所 音声分析合成方式
CA1252568A (en) * 1984-12-24 1989-04-11 Kazunori Ozawa Low bit-rate pattern encoding and decoding capable of reducing an information transmission rate
FR2579356B1 (fr) * 1985-03-22 1987-05-07 Cit Alcatel Procede de codage a faible debit de la parole a signal multi-impulsionnel d'excitation
NL8500843A (nl) * 1985-03-22 1986-10-16 Koninkl Philips Electronics Nv Multipuls-excitatie lineair-predictieve spraakcoder.
GB8621932D0 (en) * 1986-09-11 1986-10-15 British Telecomm Speech coding

Also Published As

Publication number Publication date
FI892049A (fi) 1989-04-28
JP2957588B2 (ja) 1999-10-04
NO301356B1 (no) 1997-10-13
DK206189D0 (da) 1989-04-27
DE3870114D1 (de) 1992-05-21
CA1337217C (en) 1995-10-03
EP0307122A1 (en) 1989-03-15
FI103221B1 (fi) 1999-05-14
WO1989002147A1 (en) 1989-03-09
HK128896A (en) 1996-07-26
NO891724L (no) 1989-04-26
JPH02501166A (ja) 1990-04-19
DK206189A (da) 1989-04-27
EP0307122B1 (en) 1992-04-15
NO891724D0 (no) 1989-04-26
FI103221B (fi) 1999-05-14
FI892049A0 (fi) 1989-04-28
US4991214A (en) 1991-02-05

Similar Documents

Publication Publication Date Title
DK172571B1 (da) Kodning af tale
US5127053A (en) Low-complexity method for improving the performance of autocorrelation-based pitch detectors
EP0232456A1 (en) Digital speech processor using arbitrary excitation coding
EP0342687B1 (en) Coded speech communication system having code books for synthesizing small-amplitude components
SE506379C3 (sv) Lpc-talkodare med kombinerad excitation
CN1292914A (zh) 语音编码
SE521225C2 (sv) Förfarande och anordning för CELP-kodning/avkodning
NO302205B1 (no) Fremgangsmåte for posisjonering av eksitasjonspulser i en lineærpredikativ talekoder
US20030046067A1 (en) Method for the algebraic codebook search of a speech signal encoder
KR20040083903A (ko) 전역 펄스 교체를 통한 고정 코드북 검색 방법
EP1473710B1 (en) Multistage multipulse excitation audio encoding apparatus and method
US6768978B2 (en) Speech coding/decoding method and apparatus
KR100371977B1 (ko) 음성처리를위한개선된코드북검색방법
EP0578436A1 (en) Selective application of speech coding techniques
US5963897A (en) Apparatus and method for hybrid excited linear prediction speech encoding
EP1049073B1 (en) Method of operating a vocoder
US5839098A (en) Speech coder methods and systems
SE508788C2 (sv) Förfarande att bestämma positionerna inom en talram för excitationspulser
JPH05265495A (ja) 音声符号化装置並びにその分析器及び合成器
JPH01245299A (ja) 音声符号化器
USRE35057E (en) Speech coding using sparse vector codebook and cyclic shift techniques
JP4580622B2 (ja) 広帯域音声符号化方法及び広帯域音声符号化装置
AU617993B2 (en) Multi-pulse type coding system
Hernandez-Gomez et al. On the behaviour of reduced complexity code-excited linear prediction (CELP)
KR100346732B1 (ko) 잡음코드북작성과그를이용한선형예측부호화/복호화방법및그장치

Legal Events

Date Code Title Description
B1 Patent granted (law 1993)
PBP Patent lapsed

Country of ref document: DK