DK172571B1 - Kodning af tale - Google Patents
Kodning af tale Download PDFInfo
- Publication number
- DK172571B1 DK172571B1 DK198902061A DK206189A DK172571B1 DK 172571 B1 DK172571 B1 DK 172571B1 DK 198902061 A DK198902061 A DK 198902061A DK 206189 A DK206189 A DK 206189A DK 172571 B1 DK172571 B1 DK 172571B1
- Authority
- DK
- Denmark
- Prior art keywords
- pulse
- frame
- excitation
- speech
- frames
- Prior art date
Links
- 230000005284 excitation Effects 0.000 claims description 39
- 238000006073 displacement reaction Methods 0.000 claims description 10
- 230000015572 biosynthetic process Effects 0.000 description 13
- 238000003786 synthesis reaction Methods 0.000 description 11
- 238000000034 method Methods 0.000 description 7
- 230000004044 response Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 125000004122 cyclic group Chemical group 0.000 description 2
- 101000822695 Clostridium perfringens (strain 13 / Type A) Small, acid-soluble spore protein C1 Proteins 0.000 description 1
- 101000655262 Clostridium perfringens (strain 13 / Type A) Small, acid-soluble spore protein C2 Proteins 0.000 description 1
- 101000655256 Paraclostridium bifermentans Small, acid-soluble spore protein alpha Proteins 0.000 description 1
- 101000655264 Paraclostridium bifermentans Small, acid-soluble spore protein beta Proteins 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 239000000945 filler Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000001308 synthesis method Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/10—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
- G10L19/107—Sparse pulse excitation, e.g. by using algebraic codebook
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Mathematical Physics (AREA)
- Pure & Applied Mathematics (AREA)
- Algebra (AREA)
- General Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
Description
i DK PR 172571 B1
En almindelig teknik til kodning af tale er den såkaldte LPC kodning, hvori et indgangstalesignal på en koder opdeles i tidsintervaller, og hvert interval analyseres for at bestemme parametrene af et syntesefilter, hvis reaktion er repræsentativ for sekvensspektret af signalet i det pågældende interval. Parametrene transmitteres til en dekoder, 5 hvor de periodisk opdaterer parametrene for et syntesefilter, som, når det fødes med et passende excitationssignal, frembringer et udgangssignal i form af en syntetisk tale, som tilnærmelsesvis svarer til det oprindelige indgangssignal.
Det er klart, at koderen også skal sende information, hvad angår arten af excitationen, som skal anvendes, til dekoderen. Et antal forskellige muligheder er blevet foreslået for 10 at opnå dette, og de falder i to hovedkategorier, nemlig: (i) Residuel exciteret lineær forudsigelig kodning (RELP), hvor indgangssignalet ledes gennem et filter, som er det omvendte af syntesefilteret, for at producere et residualsig-nal, som kan kvantiseres og sendes (muligvis efter filtrering) for at blive anvendt som excitation (fødesignal), eller som kan analyseres, f.eks. for at opnå stemme- og tonehøj· 15 de (eng.: pitch) parametre for transmission til en excitationsgenerator i dekoderen.
(ii) Analyse ved syntesemetoder, hvori excitation udledes således, at når den ledes gennem syntesefilteret, minimaliseres differensen mellem det opnåede udgangssignal og indgangstalesignalet. I denne kategori er der to forskellige løsninger: Den ene er en multiimpulsexcitation (MP-LPC), hvori en tidsramme svarende til et antal taleeksem- 20 pieringer indeholder et, noget mindre, begrænset antal excitationsimpulser, hvis amplituder og positioner er kodede. En modificeret form for multipulsexcitation er beskrevet i europæisk patentansøgning publiceret som EP 0195487A, hvor excitationsimpulser er tvunget til at ligge på ét af et antal regelmæssige gitre med forskellig fase; gitterpositionen kan opnås ved at rette den ind med den første impuls, der skal bestemmes. Den 25 anden løsning er stokastisk kodning eller kode-exciteret lineær forudsigelse (CELP).
Koderen og dekoderen har hver en lagret liste af standardrammer for excitationer. For hver taleramme identificeres den ene af kodebogsindgangene, som, når den ledes gen- DK PR 172571 B1 2 nem syntesefilteret, danner syntetisk tale tættest på den virkelige tale, og et kodeord, som er knyttet til den, sendes til dekoderen, som derefter kan genfinde den samme indgang ud fra den liste, der er lagret i den. Sådanne kodebøger kan kompileres ved brug af vilkårlig sekvensdannelse. En anden variant er imidlertid den såkaldte "sparse 5 vektor"-kodebog, hvori en ramme kun indeholder et lille antal impulser (f.eks. 4 eller 5 impulser ud af 32 mulige positioner for en ramme). En CELP koder kan typisk have en kodebog med 1024 indgange.
CELP kodere er beskrevet i Proceedings of the ICASSP 87, International Conference in Acoustics, Speech, and Signal Processing, Dallas, Texas, 6. - 9- april 1987, Vol. 3, 10 pages 1354-1357, IEEE, New York, US; D. Lin: "Speech coding using efficient pseudostochastic block codes" og også Proceedings of the ICASSP 86, International Conference on Acoustics Speech and Signal Processing, Tokyo, 7. - 11. april 1986, Vol. I, pages 469-472, IEEE, New York, US; L. A. Hemandez-Gomez et al. "On the behaviour of reduced complexity code-excited linear prediction” (CELP). Lin beskriver en tre-struk-15 tureret undersøgelse til at vælge den ønskede kodebogsindgang. Hemandez-Gomez et al. forslaget involverer undersøgelse af kode-bogen ved anvendelse af et første kriterie til at opnå en delmængde af indgangene og så søge ved at anvende et andet kriterie til at identificere den ønskede indgang inden for delmængden.
Ifølge den foreliggende opfindelse er der tilvejebragt en talekoder omfattende: 20 midler indrettet til i drift ud fra successive tidsrammeperioder af indgangstalesignaler at danne filterinformation, som definerer successive repræsentationer for en syntesefilterre-aktion, og til at udsende filterinformationen; midler indrettet dl i drift, for hver af de successive tidsrammeperioder af talen at modtage indgangstalesignaleme og den respektive filterinformation, og at danne excitationsin-25 formation, omfattende: DK PR 172571 B1 3 (a) et datalager, som definerer flere excitationsrammer, der hver især består af flere impulser; (b) midler til at vælge en excitations ramme ud af de mange rammer og rotations forskudte versioner af rammerne og til at danne data, som identificerer lagerindgangen og 5 størrelsen om nogen af dens rotationsforskydninger, kendetegnet ved, at vælgennidlerae er indrettet til: (i) ud fra et antal af enkeltimpulsrammer, som hver består af en enkelt impuls ved et forskelligt sted, at bestemme hvilken ramme, der opfylder det kriterium, at den, når den bliver påtrykt indgangen af et filler med den af filterinformationen dannede karakteristik, 10 vil frembringe en ramme af syntetisk tale, som tættest ligner rammen af indgangstale; og (ii) bestemme hvilken af de mange oplagrede rammer der, når den rotationsmæssigt forskydes en størrelse afledt af den fastlagte impulsposition, opfylder det nævnte kriterium.
15 Andre træk ifølge opfindelsen fremgår af underkravene.
Det vil kunne forstås ud fra indledningen, at multiimpulskodere og spredte vektor-CELP-kodere har det til fælles, at den anvendte excitation i begge tilfælde er en ramme indeholdende et antal impulser, der er væsentligt mindre end antallet af tilladelige positioner inden for rammen.
20 Den koder, som nu skal beskrives, ligner CELP ved, at den anvender en spredt vektor-kodebog, som imidlertid er meget mindre end den, der konventionelt anvendes, f.eks.
32 eller 64 indgange.
DK PR 172571 B1 4
Opfindelsen skal i det følgende forklares nærmere ud fra nogle eksempler og under henvisning til den ledsagende tegning, hvorpå fig· 1 viser den roterende impuls forskydning, der anvendes ifølge opfindelsen, fig. 2 et blokdiagram af en udførelsesform for en talekoder ifølge opfindelsen, og 5 fig. 3 et blokdiagram af en passende dekoder.
Det vil kunne forstås ud fra indledningen, at multiimpulskodere og spredte vektor-CELP-kodere har det tilfælles, at den anvendte excitation i begge tilfælde er en ramme indeholdende et antal impulser, der er væsentligt mindre end antallet af tilladelige positioner inden for rammen.
10 Den koder, som nu skal beskrives, ligner CELP ved, at den anvender en spredt vektor-kodebog, som imidlertid er meget mindre end den, der konventionelt anvendes, f.eks.
32 eller 64 indgange. Hver indgang repræsenterer en excitation, hvorfra der kan udledes andre medlemmer af et sæt af excitationer, som alene afviger fra den ene excitation - og fra hinanden - ved en cyklisk forskydning. Tre sådanne medlemmer af sættet er vist i 15 fig. la, lb og lc for en 32 positionsramme med fem impulser, hvoraf det ses, at lb kan dannes af la ved cyklisk at forskyde indgangen til venstre og tilsvarende lc ud fira la. Forskydningens størrelse angives i figuren af en pil med to hoveder. En cyklisk forskydning betyder, at impulser forskydes ud til venstre, kører randt og kommer ind igen fra højre side. Den indgang, der repræsenterer sættet, lagres med den største impuls i 20 position 1, som vist i fig. Id. Størrelsen af den største impuls behøver ikke at blive lagret, hvis de andre normaliseres i forhold til den.
Hvis antallet af kodebogsindgange er 32, kan den valgte excitation repræsenteres af 5 bit kodeord, der identificerer indgangen, og et yderligere 5 bit, der giver antallet af DK PR 172571 B1 5 forskydninger fra den lagrede position (hvis alle 32 mulige forskydninger skal være tilladte).
Fig. 2 er et blokdiagram af en talekoder. Talesignalet modtaget på en indgang l, konverteres til eksempleringer eller med andre ord samplede værdier af en samplingenhed 2 og 5 bringes derefter på digital form i en analog-til-digital konverter 3. En analyseenhed 4 beregner for hver successive gruppe af eksempleringer koefficienterne for et syntesefilter med en reaktion svarende til det spektrale indhold af talen. Udledning af LPC koefficienter er velkendt og vil ikke blive beskrevet yderligere her. Koefficienterne tilføres til en udgangsmultiplekser 5 og endvidere til et lokalt syntesefilter 6. Filtreret opdaterings-10 hastighed kan typisk være én gang for hver 20 ms.
Kodeenheden har også et kodebogslager 7, der indeholder de ovennævnte 32 kodebogs-indgange. Den måde, hvorpå indgangene lagres, er ikke væsentlig for den foreliggende opfindelse, men det antages, at hver indgang (for en fem impuls excitation i en perioderamme med 32 eksempleringer) indeholder positionerne inden for rammen og aroplitu-15 deme af de fire impulser efter den første. Denne information, som, når den læses fra lageret, tilføres en excitationsgenerator 8, som frembringer en aktuel excitationsramme (f.eks. 32 værdier, hvoraf 27 ef nul, naturligvis). Dens udgangssignal tilføres via en styret forskydningsenhed 9 til indgangen af syntesefilteret 6. Udgangssignalet fra filteret sammenlignes af et subtraktionsled 10 med indgangseksempleringeme, som tilføres i en 20 buffer 11 (således at antallet af sammenligninger kan foretages mellem en taleramme på 32 eksempleringer (sampler) og forskellige filtrerede excitationer).
For at sikre en passende forskydningsværdi lånes visse teknikker fra multiimpulskod-ning. Ved multiimpulskodning er en almindelig fremgangsmåde til at udligne impulspositioner og amplituder en iterativ metode, hvorved kun én impuls beregnes, hvilket 25 formindsker fejlen mellem den syntetiske og den aktuelle tale; der findes derefter en yderligere impuls, som kombineret med den første formindsker fejlen og således videre.
DK PR 172571 B1 6
Analyse af de statistiske MP-LPC impulser viser, at den første impuls, som skal udledes, i almindelighed har den største amplitude.
Denne udførelsesform for opfindelsen gør brug af dette ved at udføre en multiimpulssøg-ning for at finde positionen af denne største impuls alene. En hvilken som helst af de 5 kendte metoder til dette kan anvendes, f.eks. hvad der er beskrevet i B.S. Atal & J. R.
Remde, "A New Model of LPC Excitation for producing Natural Sounding Speech at Low Bit rates" (PROC. IEEE Int. Conf. ASSP, Paris, 1982, side 614).
En søgeenhed 12 er vist i fig. 2 til dette formål. Dens udgangssignal føder forskydnings-enhed 9 for at bestemme den rotationsforskydning, som anvendes på excitationen, der 10 dannes af generatoren 8. Dette vælger effektivt blandt 1024 excitationer, der er tilladt af kodebogen, en særlig klasse af excitationer, nemlig dem, der har den største impuls, der optager den specielle position bestemt af søgeenheden i 13.
Udgangssignalet fra subtraktionsleddet 10 føder en styreenhed 13, som også tilfører adresser til lageret 7 og forskyder værdierne til forskydningsenheden 9. Formålet med 15 styreenheden er at fastslå, hvilke af de 32 mulige excitationer, der repræsenteres af den valgte klasse, der giver det mindste udgangssignal fra subtraktionsleddet (i almindelighed middelkvadratværdien af differenserne over en ramme). Den endelige bestemte indgang udsendes i form af et kodeord C og en forskydningsværdi S til udgangsmuldplekseren 5.
20 Indgangsbestemmelsen ved hjælp af styreenheden for en given taleramme, der er til rådighed på udgangen af bufferen 11, er som følger: (i) anvende successive kodeord (kodebogsadresser) på lageret 7, (ii) anvend på hver kodebogs indgang en forskydning, således at den første impuls flyttes til den position, der er angivet af multiimpulssøgningen, DK PR 172571 B1 7 (iii) overvåg udgangssignalet fra subtraktionsleddet 10 for alle 32 indgange for at fastslå, hvilken der giver anledning til den laveste middellcvadratdifferens, (iv) udsend kodeordet og forskydningsværdien til multiplekseren.
Sammenlignet med en konventionel CELP koder, der anvender en kodebog med 1024 S indgange, er der kun en lille reduktion i det opnåede signals støjforhold på grund af begrænsningerne, der er placeret på excitationeme (dvs. hvis de falder i 32 indbyrdes forskydelige klasser). Der er imidlertid en (betydelig) reduktion i størrelsen af kodebo-gen og dermed i kravene til lagerplads i lageret 7. Den beregningsmængde, som skal udføres af styreenheden 13, er endvidere væsentligt reduceret, eftersom der kun skal 10 udføres 32 prøver i stedet for 1024.
For at tillade den suboptimale udvælgelse, der er indbygget i "multiimpulssøgningen”, kan den ovennævnte fremgangsmåde også indbefatte excitationer, som forskydes nogle få positioner før og efter den position, der findes ved søgningen.
Dette kunne opnås af styreenheden ved addition/subtraktion af passende værdier fra 15 forskydningsværdien, som tilføres til forskydningsenheden 9, som angivet af den punkterede ledningsforbindelse. Eftersom det filtrerede udgangssignal fra en tidsforskudt version af en given excitation er en tidsforskudt version af filterets reaktion på den givne excitation, kunne disse forskydninger i stedet udføres af et andet forskydningsled 14 placeret efter syntesefilteret 6. Når der først er sket en rotation, er resultatet imidlertid 20 ikke længere korrekt. Dette problem kan afhjælpes ved (a) ikke at udføre forskydninger, som kan bevirke en rotation, (b) at udføre forskydningen, men at tillade, at impulserne går tabt i stedet for at blive roteret rundt (og ved at informere dekoderen) eller (c) tillade rotation, men udføre en korrektion for at korrigere for fejlen.
Dannelsen af kodebogen mangler at blive beskrevet. Kodebogen kan dannes ved hjælp 25 af gaussisk støjteknik på den måde, der allerede er foreslået i: "Scolastic Coding of DK PR 172571 B1 8
Speech Signals at very low Bit Rates", B. S. Atal & M. R. Schroeder, Proc - IEEE lut.
Conf. on Communications, 1984, side 1610-1613. En yderligere fordel kan opnås ved dannelse af kodebogen ved hjælp af statistisk analyse af resultaterne, som frembringes af en multiimpulskoder. Dette kan fjerne den tilnærmelse, der ligger i antagelsen af, at 5 den første impuls, der udledes af multiimpulssøgningen, er den største, eftersom kode-bogsindgangene da kan lagres med første opnåede impuls i en standardposition, og forskudt således, at denne impuls bringes til den position, der er udledt af enheden.
Selv om de forskellige funktionselementer, der er vist i fig. 2, er vist separat, kan nogle eller alle elementerne i praksis udføres af det samme udstyr. Et af de i handelen værende 10 digitale signalbehandlings integrerede kredsløb (DSP) kan f.eks. anvendes passende programmeret.
Selv om "multiimpulssøgnings"-muligheden er blevet beskrevet i forbindelse med forskudte kodebogsindgange, kan den også anvendes til andre situationer, hvor de tilladte excitationer kan være opdelt i klasser, inden for hvilke alle excitationeme har den største 15 eller den mest betydende impuls i en særlig position inden for rammen. Positionen af den udledte impuls anvendes da til at vælge den korrekte klasse, og kun kodebogsindgange i den klasse behøver at blive afprøvet.
Fig. 3 viser en dekoder til at reproducere signaler, der er indkodet med apparatet i fig.
2.
20 En indgang 30 forsynet en demultiplekser 31, som (a) tilfører filterkoefficienter til et syntetisk filter 32, (b) tilfører kodeord til adresseindgangen på et kodebogslager 33, (c) tilfører forskydningsværdier til en forskydningsenhed 34, som leder udgangssignalet fra en excitations generator 35, der er forbundet til lageret 33, til indgangen af syntesefilteret 32. Udgangssignalet for talen fra filteret 32 tilføres via en digital-til-analog konverter 25 36 til en udgang 37.
Claims (4)
- 2. Talekoder ifølge krav 1,kendetegnet ved, at nævnte rotationsforskudte versioner bestir af oplagrede rammer, som er blevet forskudt med en størrelse, der svarer til den forudbestemte impulsposition.
- 3. Talekoder ifølge krav 1, kendetegnet ved, at de rotationsforskudte versioner 5 omfatter de oplagrede rammer, som hver er forskudt med en størrelse, som svarer til den fastlagte impulsposition, og de rammer, som er udsat for yderligere forskydninger, som er små i forhold til rammestørrelsen.
- 4. Talekoder ifølge krav 2 eller 3, kendetegnet ved, at forskydningsstørrelsen svarende til den fastlagte impuls position er den forskydning, som bringer den største 10 impuls af excitationsrammen ind i den samme position inden for rammen som den bestemte enkelte impuls.
- 5. Talekoder ifølge krav 3 eller 4, kendetegnet ved, at hver af antallet af oplagrede excitationsrammer er blevet dannet ved en træningssekvens omfattende identifikation af positionen, inden for en enkelt-impulsramme, som opfylder kriteriet for en 15 enkelt, første, impuls efterfulgt af bestemmelsen af yderligere impulser, som skal være indeholdt i excitationsrammen, og at mængden af forskydning svarende til den bestemte position er den forskydning, som bringer den første impuls af excitationsrammen ind i den samme position inden for rammen, som den enkelte impuls af den enkelte impuls-ramme bestemt ved de vælgende midler.
Applications Claiming Priority (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
GB8720389 | 1987-08-28 | ||
GB878720389A GB8720389D0 (en) | 1987-08-28 | 1987-08-28 | Speech coding |
GB8721667 | 1987-09-15 | ||
GB878721667A GB8721667D0 (en) | 1987-09-15 | 1987-09-15 | Speech coding |
PCT/GB1988/000708 WO1989002147A1 (en) | 1987-08-28 | 1988-08-26 | Speech coding |
GB8800708 | 1988-08-26 |
Publications (3)
Publication Number | Publication Date |
---|---|
DK206189D0 DK206189D0 (da) | 1989-04-27 |
DK206189A DK206189A (da) | 1989-04-27 |
DK172571B1 true DK172571B1 (da) | 1999-01-25 |
Family
ID=26292660
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DK198902061A DK172571B1 (da) | 1987-08-28 | 1989-04-27 | Kodning af tale |
Country Status (10)
Country | Link |
---|---|
US (1) | US4991214A (da) |
EP (1) | EP0307122B1 (da) |
JP (1) | JP2957588B2 (da) |
CA (1) | CA1337217C (da) |
DE (1) | DE3870114D1 (da) |
DK (1) | DK172571B1 (da) |
FI (1) | FI103221B (da) |
HK (1) | HK128896A (da) |
NO (1) | NO301356B1 (da) |
WO (1) | WO1989002147A1 (da) |
Families Citing this family (33)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2632758B1 (fr) * | 1988-06-13 | 1991-06-07 | Matra Communication | Procede de codage et codeur de parole a prediction lineaire |
US5261027A (en) * | 1989-06-28 | 1993-11-09 | Fujitsu Limited | Code excited linear prediction speech coding system |
NL8902347A (nl) * | 1989-09-20 | 1991-04-16 | Nederland Ptt | Werkwijze voor het coderen van een binnen een zeker tijdsinterval voorkomend analoog signaal, waarbij dat analoge signaal wordt geconverteerd in besturingscodes die bruikbaar zijn voor het samenstellen van een met dat analoge signaal overeenkomend synthetisch signaal. |
US5701392A (en) * | 1990-02-23 | 1997-12-23 | Universite De Sherbrooke | Depth-first algebraic-codebook search for fast coding of speech |
US5754976A (en) * | 1990-02-23 | 1998-05-19 | Universite De Sherbrooke | Algebraic codebook with signal-selected pulse amplitude/position combinations for fast coding of speech |
EP0500961B1 (en) * | 1990-09-14 | 1998-04-29 | Fujitsu Limited | Voice coding system |
CA2051304C (en) * | 1990-09-18 | 1996-03-05 | Tomohiko Taniguchi | Speech coding and decoding system |
US5061924B1 (en) * | 1991-01-25 | 1996-04-30 | American Telephone & Telegraph | Efficient vector codebook |
US5195137A (en) * | 1991-01-28 | 1993-03-16 | At&T Bell Laboratories | Method of and apparatus for generating auxiliary information for expediting sparse codebook search |
US5182773A (en) * | 1991-03-22 | 1993-01-26 | International Business Machines Corporation | Speaker-independent label coding apparatus |
FI98104C (fi) * | 1991-05-20 | 1997-04-10 | Nokia Mobile Phones Ltd | Menetelmä herätevektorin generoimiseksi ja digitaalinen puhekooderi |
ES2225321T3 (es) * | 1991-06-11 | 2005-03-16 | Qualcomm Incorporated | Aparaato y procedimiento para el enmascaramiento de errores en tramas de datos. |
US5253811A (en) * | 1991-11-08 | 1993-10-19 | Kohler Co. | Sheet flow spout |
ES2042410B1 (es) * | 1992-04-15 | 1997-01-01 | Control Sys S A | Metodo de codificacion y codificador de voz para equipos y sistemas de comunicacion. |
EP0577488B9 (en) * | 1992-06-29 | 2007-10-03 | Nippon Telegraph And Telephone Corporation | Speech coding method and apparatus for the same |
TW271524B (da) | 1994-08-05 | 1996-03-01 | Qualcomm Inc | |
US5742734A (en) * | 1994-08-10 | 1998-04-21 | Qualcomm Incorporated | Encoding rate selection in a variable rate vocoder |
US5727125A (en) * | 1994-12-05 | 1998-03-10 | Motorola, Inc. | Method and apparatus for synthesis of speech excitation waveforms |
US5602959A (en) * | 1994-12-05 | 1997-02-11 | Motorola, Inc. | Method and apparatus for characterization and reconstruction of speech excitation waveforms |
FR2729247A1 (fr) * | 1995-01-06 | 1996-07-12 | Matra Communication | Procede de codage de parole a analyse par synthese |
FR2729244B1 (fr) * | 1995-01-06 | 1997-03-28 | Matra Communication | Procede de codage de parole a analyse par synthese |
FR2729246A1 (fr) * | 1995-01-06 | 1996-07-12 | Matra Communication | Procede de codage de parole a analyse par synthese |
SE506379C3 (sv) * | 1995-03-22 | 1998-01-19 | Ericsson Telefon Ab L M | Lpc-talkodare med kombinerad excitation |
US5864797A (en) * | 1995-05-30 | 1999-01-26 | Sanyo Electric Co., Ltd. | Pitch-synchronous speech coding by applying multiple analysis to select and align a plurality of types of code vectors |
US5822724A (en) * | 1995-06-14 | 1998-10-13 | Nahumi; Dror | Optimized pulse location in codebook searching techniques for speech processing |
JP3196595B2 (ja) * | 1995-09-27 | 2001-08-06 | 日本電気株式会社 | 音声符号化装置 |
JP3284874B2 (ja) | 1996-03-29 | 2002-05-20 | 松下電器産業株式会社 | 音声符号化装置 |
US5751901A (en) * | 1996-07-31 | 1998-05-12 | Qualcomm Incorporated | Method for searching an excitation codebook in a code excited linear prediction (CELP) coder |
JP3372908B2 (ja) * | 1999-09-17 | 2003-02-04 | エヌイーシーマイクロシステム株式会社 | マルチパルス探索処理方法と音声符号化装置 |
US6879955B2 (en) * | 2001-06-29 | 2005-04-12 | Microsoft Corporation | Signal modification based on continuous time warping for low bit rate CELP coding |
FI118704B (fi) | 2003-10-07 | 2008-02-15 | Nokia Corp | Menetelmä ja laite lähdekoodauksen tekemiseksi |
JP3981399B1 (ja) * | 2006-03-10 | 2007-09-26 | 松下電器産業株式会社 | 固定符号帳探索装置および固定符号帳探索方法 |
BRPI1012064A2 (pt) | 2009-05-23 | 2016-03-15 | Scott Anthony Wozny | sistema de destruição de risco rígido |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
USRE32580E (en) * | 1981-12-01 | 1988-01-19 | American Telephone And Telegraph Company, At&T Bell Laboratories | Digital speech coder |
JPS60225200A (ja) * | 1984-04-23 | 1985-11-09 | 日本電気株式会社 | 音声符号化器 |
JPS61134000A (ja) * | 1984-12-05 | 1986-06-21 | 株式会社日立製作所 | 音声分析合成方式 |
CA1252568A (en) * | 1984-12-24 | 1989-04-11 | Kazunori Ozawa | Low bit-rate pattern encoding and decoding capable of reducing an information transmission rate |
FR2579356B1 (fr) * | 1985-03-22 | 1987-05-07 | Cit Alcatel | Procede de codage a faible debit de la parole a signal multi-impulsionnel d'excitation |
NL8500843A (nl) * | 1985-03-22 | 1986-10-16 | Koninkl Philips Electronics Nv | Multipuls-excitatie lineair-predictieve spraakcoder. |
GB8621932D0 (en) * | 1986-09-11 | 1986-10-15 | British Telecomm | Speech coding |
-
1988
- 1988-08-25 CA CA000575696A patent/CA1337217C/en not_active Expired - Fee Related
- 1988-08-26 DE DE8888307978T patent/DE3870114D1/de not_active Expired - Lifetime
- 1988-08-26 US US07/358,350 patent/US4991214A/en not_active Ceased
- 1988-08-26 EP EP88307978A patent/EP0307122B1/en not_active Expired - Lifetime
- 1988-08-26 JP JP63507220A patent/JP2957588B2/ja not_active Expired - Lifetime
- 1988-08-26 WO PCT/GB1988/000708 patent/WO1989002147A1/en active IP Right Grant
-
1989
- 1989-04-26 NO NO891724A patent/NO301356B1/no unknown
- 1989-04-27 DK DK198902061A patent/DK172571B1/da not_active IP Right Cessation
- 1989-04-28 FI FI892049A patent/FI103221B/fi not_active IP Right Cessation
-
1996
- 1996-07-18 HK HK128896A patent/HK128896A/xx not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
FI892049A (fi) | 1989-04-28 |
JP2957588B2 (ja) | 1999-10-04 |
NO301356B1 (no) | 1997-10-13 |
DK206189D0 (da) | 1989-04-27 |
DE3870114D1 (de) | 1992-05-21 |
CA1337217C (en) | 1995-10-03 |
EP0307122A1 (en) | 1989-03-15 |
FI103221B1 (fi) | 1999-05-14 |
WO1989002147A1 (en) | 1989-03-09 |
HK128896A (en) | 1996-07-26 |
NO891724L (no) | 1989-04-26 |
JPH02501166A (ja) | 1990-04-19 |
DK206189A (da) | 1989-04-27 |
EP0307122B1 (en) | 1992-04-15 |
NO891724D0 (no) | 1989-04-26 |
FI103221B (fi) | 1999-05-14 |
FI892049A0 (fi) | 1989-04-28 |
US4991214A (en) | 1991-02-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DK172571B1 (da) | Kodning af tale | |
US5127053A (en) | Low-complexity method for improving the performance of autocorrelation-based pitch detectors | |
EP0232456A1 (en) | Digital speech processor using arbitrary excitation coding | |
EP0342687B1 (en) | Coded speech communication system having code books for synthesizing small-amplitude components | |
SE506379C3 (sv) | Lpc-talkodare med kombinerad excitation | |
CN1292914A (zh) | 语音编码 | |
SE521225C2 (sv) | Förfarande och anordning för CELP-kodning/avkodning | |
NO302205B1 (no) | Fremgangsmåte for posisjonering av eksitasjonspulser i en lineærpredikativ talekoder | |
US20030046067A1 (en) | Method for the algebraic codebook search of a speech signal encoder | |
KR20040083903A (ko) | 전역 펄스 교체를 통한 고정 코드북 검색 방법 | |
EP1473710B1 (en) | Multistage multipulse excitation audio encoding apparatus and method | |
US6768978B2 (en) | Speech coding/decoding method and apparatus | |
KR100371977B1 (ko) | 음성처리를위한개선된코드북검색방법 | |
EP0578436A1 (en) | Selective application of speech coding techniques | |
US5963897A (en) | Apparatus and method for hybrid excited linear prediction speech encoding | |
EP1049073B1 (en) | Method of operating a vocoder | |
US5839098A (en) | Speech coder methods and systems | |
SE508788C2 (sv) | Förfarande att bestämma positionerna inom en talram för excitationspulser | |
JPH05265495A (ja) | 音声符号化装置並びにその分析器及び合成器 | |
JPH01245299A (ja) | 音声符号化器 | |
USRE35057E (en) | Speech coding using sparse vector codebook and cyclic shift techniques | |
JP4580622B2 (ja) | 広帯域音声符号化方法及び広帯域音声符号化装置 | |
AU617993B2 (en) | Multi-pulse type coding system | |
Hernandez-Gomez et al. | On the behaviour of reduced complexity code-excited linear prediction (CELP) | |
KR100346732B1 (ko) | 잡음코드북작성과그를이용한선형예측부호화/복호화방법및그장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
B1 | Patent granted (law 1993) | ||
PBP | Patent lapsed |
Country of ref document: DK |