SE456618B - Forfarande och talprocessor for att behandla en talsignal for att bilda en digital kod, som representerar talmonstret - Google Patents
Forfarande och talprocessor for att behandla en talsignal for att bilda en digital kod, som representerar talmonstretInfo
- Publication number
- SE456618B SE456618B SE8206641A SE8206641A SE456618B SE 456618 B SE456618 B SE 456618B SE 8206641 A SE8206641 A SE 8206641A SE 8206641 A SE8206641 A SE 8206641A SE 456618 B SE456618 B SE 456618B
- Authority
- SE
- Sweden
- Prior art keywords
- signal
- interval
- generating
- speech
- signals
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 16
- 230000008569 process Effects 0.000 title description 2
- 230000005284 excitation Effects 0.000 claims description 75
- 230000004044 response Effects 0.000 claims description 40
- 238000012545 processing Methods 0.000 claims description 9
- 238000001228 spectrum Methods 0.000 claims description 6
- 238000007493 shaping process Methods 0.000 claims description 2
- 238000003384 imaging method Methods 0.000 claims 1
- 230000000875 corresponding effect Effects 0.000 description 17
- 238000010586 diagram Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 238000012546 transfer Methods 0.000 description 6
- 230000015572 biosynthetic process Effects 0.000 description 5
- 230000003111 delayed effect Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- FTGYKWAHGPIJIT-UHFFFAOYSA-N hydron;1-[2-[(2-hydroxy-3-phenoxypropyl)-methylamino]ethyl-methylamino]-3-phenoxypropan-2-ol;dichloride Chemical compound Cl.Cl.C=1C=CC=CC=1OCC(O)CN(C)CCN(C)CC(O)COC1=CC=CC=C1 FTGYKWAHGPIJIT-UHFFFAOYSA-N 0.000 description 2
- 238000001208 nuclear magnetic resonance pulse sequence Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 101100122490 Drosophila melanogaster Galphaq gene Proteins 0.000 description 1
- 241000288147 Meleagris gallopavo Species 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 235000013405 beer Nutrition 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/10—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Monitoring And Testing Of Transmission In General (AREA)
- Analogue/Digital Conversion (AREA)
Description
1S ZS 40 456 618 _,_ - linjärprediktiva modellen. Försök att minska excitationsbithastig- heten i resttypanläggningar har vanligen resulterat i en väsentlig kvalitetsförsämring. Ett ändamål med uppfinningen är att åstad- komma en bättre talkodning med hög kvalitet vid lägre bithastigheter än vid restkodningsscheman.
Vi har funnit att de tidigare problemen med restkodning kan lösas genom bildande av ett mönster, som är prediktivt för ett mönster (exempelvis talmönster), som skall kodas, och jämförande av det för kodning avsedda mönstret med det prediktiva mönstret på ram- -för-ram-bas. Skillnaderna mellan det för kodning avsedda mönstret och det prediktiva mönstret över varje ram används för att bilda en kodad signal av ett föreskrivet format, vilken kodade signal ändrar det prediktiva mönstret för minskning av ramskillnaderna.
Bithastigheten hos den föreskrivna formatkodade signalen väljs på sådant sätt, att det modifierade prediktiva mönstret approximerar talmönstret till en önskad nivå, som är förenlig med kodningskraven.
Uppfinningen är riktad på ett sekventialmönsterbehandlings- arrangemang, i vilket sekventialmönstret är uppdelat í efter varand- ra följande tidsintervall. I varje tídsintervall bildas en grupp signaler representerande intervallsekventialmönstret samt en sig- nal representerande skillnaderna mellan intervallsekventialmönstret och den intervallrepresentativa signalgruppen. En första signal, motsvarande intervallmönstret, bildas såsom svar på nämnda inter- vallmönsterrepresentativa signaler och nämnda intervallskillnads- representativa signal och en andra intervallmotsvarande signal bildas såsom svar på nämnda intervallmönsterrepresentativa signaler.
En signal, som motsvarar skillnaderna mellan den första och den andra intervallmotsvarande signalen bildas och en tredje signal åstadkommes såsom svar på nämnda intervallskillnadsmotsvarande signal, som ändrar den andra signalen för att minska skillnaden mellan nämnda första och andra intervallmotsvarande signaler.
Enligt en aspekt av uppfinningen uppdelas ett talmönster i successiva tidsintervall. I varje intervall genereras en grupp signaler representerande talmönstret i varje tídsintervall samt en signal representerande skillnaderna mellan nämnda intervalltal- mönster och den intervalltalmönsterrepresentativa signalgruppen.
En första signal, motsvarande intervalltalmönstret, bildas såsom svar på nämnda intervalltalrepresentativa signaler och den skill- nadsrepresentativa signalen och en andra intervallmotsvarande signal genereras såsom svar på de interval1talmönsterrepresentativa 3 456 618 Sígnalerna. En signal, som motsvarar skillnaderna mellan den första och den andra intervallrepresentatíva signalen, bildas och en tredje signal àstadkommes såsom svar på den intervallskillnads- motsvarande signalen, som ändrar nämnda andra intervallmotsvaran- de signal för att minska den skillnadsmotsvarande signalen.
Enligt en annan sida av uppfinningen används den tredje signalen för att åstadkomma en kopia av intervallmönstret.
Vid en utföringsform av uppfinningen genereras en grupp prediktiva parametersignaler för varje tidsram från en talsígnal.
En predíktionsrestsignal bildas, som reagerar för tidsramtal- signalen och de tidsrampredíktíva parametrarna. Prediktionsres- signalen föres genom ett första prediktívt filter för åstadkomman- de av en första talrepresentatív signal för tídsramen. En andra signal, som representerar artificíellt tal, genereras för tids- ramen i ett andra predíktivt filter från ramprediktionsparamet- rarna. Såsom svar på den första talrepresentativa signalen samt den andra talrepresentativa signalen hos tídsramen bildas en kodad excitationssignal, vilken sändes till det andra prediktiva filtret för att till ett minimum minska den perceptuellt vägda medel- kvadratskillnaden mellan ramens första och andra talrepresentíva signaler. Den kodade ekcitationssignalen och prediktivparametersíg- nalerna användes för att konstruera en kopia av tidsramtal- -40 456 618 1, mönstret.
Ritningsbeskrivníng Pig. 1 visar ett blockschema för en talprocessorkrets, som åskådliggör uppfinningen.
Pig. 2 visar ett blockschema för en excítationssignalbildan- de processor, som kan användas i kretsen enligt fig. 1.
Fig. 3 visar ett strömningsschema, som åskådliggör driften av den excitationssignalbildande kretsen enligt fig. 1.
Fig. 4 och 5 visar flödesscheman, som åskådliggör driften av kretsen enligt fig. 2.
Pig. 6 visar ett tidsstyrningsdiagram, som åskådliggör driften av den excitationssignalbildande kretsen enligt fig. 1 och 2.
Fig. 7 visar vågformer, som åskådliggör talbehandlingen enligt uppfinningen.
Detaljerad beskrivning Pig. 1 visar ett generellt blockschema för en talprocessor, som åskådliggör uppfinningen. I fig. 1 mottages ett talmönster, t.ex. ett talat meddelande, av mikrofonomvandlaren 101. Den mot- svarande analoga talsignalen därifrån bandbegränsas och omvand- las till en sekvens av pulssamplar í filter- och samplerkretsen 113 hos prediktionsanalysatorn 110. Filtreringen kan arrangeras för att avlägsna frekvenskomponenter hos talsignalen över 4,0 kHz och samplingen kan ske med en frekvenshastighet av 8,0 kHz, så- som är välkänt inom tekniken. Tidsstyrningen av samplarna styres genom sampelklockan CL från klockgeneratorn 103.Varje sampel från kretsen 113 transformeras till en amplitudrepresentativ digitalkod i analog/digital-omvandlaren 115.
Sekvensen av talsamplar matas till prediktivparameterdatorn 119, vilken, såsom är väl känt inom tekniken, arbetar för att uppdela talsignalerna i intervall om 10-20 ms och för att gene- ak, 1,2,..., p som representerar det förutsagda korta tidsspekt- rera en grupp linjärprediktionskoefficientsignaler k = ret hos de N >> p talsamplarna i varje intervall. Talsamplarna från analog/digital-omvandlaren 115 fördröjes i fördröjningsan- ordningen 117 för att ge tid för bildandet av signaler ak. De fördröjda samplarna matas till ingången hos prediktionsrest- generatorn 118. Prediktionsrestgeneratorn reagerar, såsom är väl- känt inom tekniken, för de fördröjda talsamplarna och predik- tionsparametrarna ak för att bilda en signal, vilken motsvarar 40 456 618 skillnaden däremellan. Bildandet av prediktivparametrarna och prediktionsrestsignalen för varje ram, som visas i prediktiv- analysatorn 110, kan utföras enligt det arrangemang, som visas i det amerikanska patentet 3 740 476 eller i andra inom tekniken välkända arrangemang.
Ehuru prediktivparametersignalerna ak bildar en ändamåls- enlig representation av korttidstalspektret varierar restsigna- len vanligen mycket från intervall till intervall och uppvisar en hög bíthastighet, som är olämplig för många applikationer. I den tonhöjdsexciterade vokodern sändes endast topparna av resten såsom tonhöjdspulskoder. Den resulterande kvalitén är emeller- tid vanligen dålig. Vågformen 701 i fig. 7 åskådliggör ett nor- malt talmönster över två tidsramar. Vågformen 703 visar den prediktivrestsignal, som erhålles från mönstret enligt vågform 701 och ramarnas prediktivparametrar. Såsom lätt framgår är , vågformen 703 relativt komplex, så att kodning av tonhöjdspulser, motsvarande topparna däri, inte åstadkommer en adekvat approxi- mering av prediktivresten. Enligt uppfinningen mottager excita- tionskodprocessorn 120 restsignalen dk och prediktionsparamet- rarna ak hos ramen och genererar en intervallexcítationskod, som har ett förutbestämt antal bitpositioner. Den resulterande excitationskoden, vilken visas i vågform 705, uppvisar en rela- tivt låg bíthastighet, vilken är konstant. En kopia av talmönst- ret i vågform 701, konstruerad från excitationskoden och ramar- nas prediktionsparametrar, visas i vågform 707. Såsom framgår vid en jämförelse av vågformerna 701 och 707 erhålles mera hög- kvalitativ talkarakteristik av adaptív prediktivkodning vid mycket lägre bithastigheter.
Prediktionsrestsígnalen dk na ak för varje efterföljande ram sändes från kretsen 110 till den excitationssignalbildande kretsen 120 vid början av den efterföljande ramen. Kretsen 120 arbetar för att producera en multielementramexcitationskod EC med ett förutbestämt antal bitpositioner för varje ram. Varje cxcitationskod motsvarar en samt prediktivparametersignaler- sekvens av 1 5 i 5 I pulser, som representerar ramens excita- tionsfunktion. Amplituden ßí samt läget mi för varje puls i ramen bestämmes i den excitationssignalformande kretsen för att tillåta konstruktion av en kopia av ramtalsignalcn ur cxcita- tionssignalen och ramens prediktivparamctcrsígnalcr. 6 i- och mi-signalerna kodas i kodaren 131 och multipliceras mod ramens 456 618 6 prediktionsparametersignaler í multiplexorn 135 för åstadkom- mande av en digital signal, som motsvarar ramtalmönstret.
I den excitationssignalbildande kretsen 120 matas predik- tivrestsignalen dk och prediktivparametersignalerna ak hos en ram till filtret 121 via grinden 122 respektive 124. Vid början av varje ram öppnar ramklocksignalen FC grindarna 122 och 124, varigenom dk-signalerna matas till filtret 121 och ak-signalerna till filtren 121 och 123. Filtret 121 är avpassat att modifiera signalen dk, så att kvantiseringsspektrum för felsignalen koncentreras i dess formantomràden. Såsom visas i det amerikanska patentet 4 133 976 är detta filterarrangemang lämpligt för att maskera felet i spektrets högsignalenergidelar.
Filtrets 121 överföringsfunktion uttryckes i z-transforma- tionsform såsom nu) "(1) där B(z) styres av ramprediktivparametrarna' ak.
Prediktívfiltret 123 mottager ramprediktivparametersignaler- na från datorn 119 och en artificiell excitationssignal EC från excitationssignalprocessorn 127. Filtret 123 har överförings- funktíonen enligt ekvation 1. Filtret 121 bildar en vägd ramtal- signal X, som reagerar för prediktivresten dk, under det att filtret 123 genererar en vägd artificiell talsignal §, som rea- gerar för excitationssignalen från signalprocessorn 127. Signa- lerna X och § korreleras i korrelationsprocessorn 125, som genererar en signal E, vilken motsvarar den vägda skillnaden där- emellan. Signalen E sändes till signalprocessorn 127 för juste- ring av excitatíonssignalen EC, så att skillnaderna mellan den vägda talrepresentativa signalen från filtret 121 och den vägda signal från filtret 123, vilken representerar artificiellt tal, reduceras.
Excitationssignalen är en sekvens av 1 5 i 5 I pulser. Varje pulslwr en amplitud Öi samt ett läge mi. Processorn 127 är avsedd att successivt bilda ßš-, mi-signaler, som reducerar skillnaden mellan den vägda talrepresentativa ramsignalen från filtret 121, samt den vägda ramsignal från filtret 123, vilken representerar artificiellt tal. Den vägda talrepresentativa ram- signalen kan uttryckas såsom: 11 2 = 2 d h _ 1 5 n 5 N (2) Yn k=n_k k n k IS i t 456 me ? ; och den vägda signal hos ramen, representerande artíficiellt tal, kan uttryckas såsom: ßjhn-m- 1 5 n 5 N 1 J (3) där hn är pulssvaret hos filtret 121 eller filtret 123.
Den i kretsen 120 bildade excitationssignalen är en kodad 1,2,...,I. Varjé element är pulsens amplitud och signal med elementen Gi, mi, i = representerar en puls i tidsramen. ßi mi är läget för pulsen i ramen. Korrelationssignalgenerator- kretsen 125 verkar för att successivt generera en korrelations- signal för varje element. Varje element kan lokaliseras vid tidpunkten 1 5 q 5 Q i tidsramen. Följaktligen bildar korre- lationsprocessorkretsen Q möjliga kandidater för element i överensstämmelse med ekvation 4 (5) Excitationssignalgeneratorn 127 mottager från korrelationssignalgeneratorkretsen och utväljer den Ciq-signal, som har det maximala absolutvärdet, och bildar det Ciq-signalerna ízte elementet av den kodade signalen ß K 2 .=., h 1 Ciq kšo k ._ '-1- mi q där q* är läget för den korrelationssignal, som har det maximala absolutvärdet. Indexet i är tillägget till í+1 och signalen in vid prediktiv-filtrets 123 utgång är modifierad. Processen enligt ekvationerna 4, 5 och 6 upprepas för bildande av elemen- ten @ Efter bildandet av elementen 51, ml, överföres (6) 111 í+1' i+1' den signal, som har elementen êímï, @¿m2,..., ßImI till koda- ren 131. Såsom är välkänt inom tekniken arbetar kodaren 131 för att kvnncisera ßímí-elementen och för att bilda en kodad sig- nal, som är lämplig för överföring till nätet 140. 40 456 618 3 ' Varje filter 121 och 123 i fig. 1 kan innefatta ett trans- versalfilter av den i det ovannämnda amerikanska patentet nr 4 133 976 beskrivna typen. Varje processor 125 och 127 kan inne- fatta ett av de processorarrangemang, välkända inom tekniken och avsedda att utföra den behandling, som kräves enligt ekva- tionerna 4 och 6, t.ex. C.S.P., Inc. Macro Arithmetic Processor System 100 eller andra inom tekniken välkända processorarrange- mang.
Processor 125 innefattar ett läsminne, som permanent lagrar programmerade instruktioner för att styra Ciq-signalbíldningen i överensstämmelse med ekvation 4, och processorn 127 innefattar ett läsminne, som permanent lagrar programmerade instruktioner för att välja ßí-, mi-signalelementen enligt ekvation 6, sàsom är välkänt inom tekniken. Programinstruktionerna i processorn 125 är angivna i FORTRAN-spràkform i Appendix A och programin- struktionerna i processorn 127 är angivna i FORTRAN-sprákform i Appendix B.
Pig. 3 visar ett flödesschema, som åskådliggör driften hos processorerna 125 och 127 för varje tidsram. Under hänvisning till fig. 3 genereras de hk ímpulssvarssignalerna i ruta 305 såsom svar på ramprediktivparametrarna för överföríngsfunktíonen i ekvation 1. Detta sker efter mottagande av FC-signalen från klockan 103 i fig. 1, enligt vänteruta 303. Blementindexet i samt excitationspulslägeindexet 3 är initialt inställda på 1 _ och ?n,i_1 från predíktivfiltren 121 och 123 bildas signalen Cíq enligt ruta 309. Lägesindexet 3 tillägges i ruta 311 och bildandet av i ruta 307.Vid mottagande av signalerna yn nästa lägessignal Ciq initieras.
Efter det att Cíq i processorn 125 aktiveras processorn 127. -signalen bildats för excítationssignal- elementet i -índexet i processorn 127 inställes initialt på 1 i ruta 315 och i indexet samt de i processorn 125 bildade Cíq-signalerna överföras till processorn 127. Ci *-signalen, som representerar den Ciq-signal, vilken har det maximala absoluta värdet, och dess läge q* inställes på noll i ruta 317. De absoluta värdena av Cíq-signalerna jämföres med signalen Ciq* och maximum av dessa absolutvärden lagras såsom signalen Ci * i den slinga, som innefattar rutorna 319, 321, 323 och 325.
Efter det att Ciq lats sker överföring från ruta 325 till ruta 327. Excitations- -signalen från processorn 125 har behand- -25 40 9 456 618 kodelementläget mi inställes på q* och excitationselcmentets ßi storlek genereras enligt ekvation 6. ßímí-elementet utmatas till prediktivfiltret 123 enligt ruta 329 och indexet i till- lägges enligt ruta 329. Vid bildande av ramens ßlml -element sker ny överföring från vänterutan 303 från beslutsrutan 331.
Processorerna 125 och 127 placeras då i vänttíllstánd fram till den efterföljande ramens FC-ramklockpuls.
Excitationskoden i processorn 127 matas också till kodaren 131. Kodaren arbetar för att transformera excitationskoden från processorn 127 till en form, som är lämplig för användning í nätet 140. Prediktionsparametersignalerna ak för ramen sändes till en ingång hos multiplexorn 135 via fördröjningsanordningen 133 säsom prediktíonssignaler. Den excitationskodade signalen ECS från kodaren 131 sändes till multiplexorns andra ingång. De multíplícerade excitations- och prediktivparameterkoderna från ramen sändes sedan till nätet 140. 1 Nätet 140 kan vara .en kommuníkationsanläggning, meddelande- minnet hos ett ljudlagringsarrangemang eller en apparat, som är avsedd att lagra ett komplett meddelande eller en vokabulär av föreskrivna meddelandeenheter, t.ex. ord, fonem, etc för använd- ning i talsyntetíserare. Vilken meddelandeenheten än är fram- matas den resulterande sekvensen av ramkoder från kretsen 120 via nätet 140 till talsyntetíseraren 150. Syntetiseraren utnytt- jar i sin tur ramexcitationskoderna från kretsen 120 samt ram- prediktivparameterkoderna för att konstruera en kopia av tal- mönstret.
Demultiplexorn 152 i syntetiseraren 150 separerar excita- tionskoden EC i en första rad från dess prediktíonsparametrar ak. Efter det att excitationskoden har avkodats i en excitatíons- pulssekvens i avkodaren 153 sändes koden till excitationsin- gängen hos talsyntetiserarfiltret 154. ak-koderna sändes till filtrets 154 parameteringángar. Filtret 154 arbetar såsom svar på excitations- och predíktivparametersignalerna för att bilda en kodad kopia av ramtalsignalen, såsom är välkänt inom omradet.
Digital/analog-omvandlaren 156 är avsedd att transformera den kodade kopian till en analog signal, som föres genom lågpass- filtret 158 och transformeras till ett talmönster via omvandla- ren 160.
Ett alternativt arrangemang för att utföra excitationskod- bíldningsoperationerna hos kretsen 120 kan baseras på det vägdn 456 e fana. n, medelkvadratfelet mellan signalerna yn och in. Detta vägda medel- kvadratfel vid bildande av ßi och mí för den izte excitatíons- signalpulsen är - N i Q 2 E. = 2 y - .h ) 1 n=1 <\n j=1 J n-mj sampel hos pulssvaret för H(z), (7) där hn är den nzte mj är läget för den jzte pulsen i excitationskodsignalen och ßj är styrkan av den jzte pulsen.
Pulslägena och Excitatíonens izte ekvation 7 till ett pulsamplituderna genereras sekventíellt. element bestämmes genom minskning av Ei i minimum. Ekvatíon 7 kan omskrivas såsom -2ß. (rn - z .mn (e) l n fl"'m. . l J: så att de kända excitationskodelementen, som föregår ßí, mi endast uppträder i det första uttrycket.
Såsom är väl känt kan det värde på ßí, som minskar Ei till ett minimum, bestämmas genom dífferentiering av ekvation 8 med avseende på fií och genom att sätta ' ---E-= O (9) Följaktligen är det optimala värdet av ßí i~1 d é . * 3 ß å _ i_K k |¿-mä j=1 j|mj md = (10) där (11) .L 456 618 är autokorrelatíonskoefficienterna hos prediktivfilterpulssvars- signalen hk. ßí i ekvation 10 är en funktion av pulsstället och bestäm- mes för varje möjligt värde därav. Maximum för |ßí\-värdena över de möjliga pulsställena väljes sedan. Efter det att värdena för Öí och mi har erhållits genereras värdena ßí+1 och m¿+1 genom att ekvation 10 löses på samma sätt. Det första uttrycket i ekvation 10, dvs mk+K 1<=m;-K dk bkmi' l motsvarar den talrepresentativa signalen hos ramen vid predik- tivfiltrets 121 utgång. Den andra termen i ekvation 10, dvs i-1 jš] 'mia motsvarar den signal hos ramen, vilken representerar artifi- ciellt tal, vid prediktivfiltrets 123 utgång. ßi hos en excitationspuls vid läget mi , vilket minskar skillnaden mellan den första och den andra termen till ett minimum. är amplituden Den i fig. 2 visade databehandlingskretsen ger ett alterna- tivt arrangemang för excitationssignalformningskretsen 120 i fig. 1. Kretsen i fig. 2 ger excitationskoden för varje ram hos talmönstret såsom svar på ramprediktionsrestsignalen dk och ramprediktionsparametersignalerna ak i enlighet med ekvation 10 och kan innefatta det tidigare kända arrangemanget C.S.P., Inc.
Macro Arithmetic Processor System 100 eller andra processor- arrangemang, såsom är välkänt inom området.
Såsom framgår av fig. 2 mottager processorn 210 prediktiv- parametersignalerna ak och prediktionsrestsignalerna dn hos varje efterföljande ram av talmönstret från kretsen 110 via min- net 218. Processorn arbetar för att bilda excitationskodsignal- elementen 51 m1, 52, mz, ..., Öl, ml under styrning av perma- nent lagrade instruktioner i prediktivfilterunderprogramläsmin- net 201 och excitationsbehandlingsunderprogramläsminnet 205.
Prediktivfilterunderprogrammet hos minnet ROM 201 angives i Appendix C och excitationsbehandlingsunderprogrammet hos minnet ROM 205 angives i Appendix D.
Processorn 210 innefattar den gemensamma bussledningen 225, datamínnet 230, centralprocessorn 240, den aritmetiska processorn 250, kontrollgränssníttet 220 samt ingång-utgång-gränssnittet260. 40 456 618 M Såsom är välkänt inom omrâdet är centralprocessorn 240 avsedd att styra frekvensen av operationer hos processorns 210 andra enheter såsom svar på kodade instruktioner från kontrollern 215.
Den aritmetiska processorn 250 är avsedd att styra den aritme- tiska behandlingen beträffande kodade signaler från dataminnet 230 såsom svar pà styrsignaler från centralprocessorn 240.
Datamínnet 230 styr signaler, vilka dírigerats via centralpro- cessorn 240, och tillhandahåller dessa signaler för den aritme- tiska processorn 250 och ingángs~utgângs-gränssnittet 260. Kon- trollgränssnittet 220 utgör en kommunikationslänk för program- instruktionerna i minnet ROM 201 och minnet ROM 205 till central- processorn 240 via kontrollern 215 och íngångs-utgàngs-gräns- snittet 260 tillåter signalerna dk och ak att matas till dataminnet 230 samt matar utsígnaler från datamin- net till kodaren 131 i fig. 1.
Driften av kretsen enligt fig. 2 åskàdliggöres i det filter- parameterbehandlande flödesdiagrammet enligt fig. 4, det excita- tionskodbehandlande flödesdíagrammet enligt fig. 5 och tidsstyr- ßí och mi - níngsdiagrammet enligt fig. 6. Vid början av talsígnalen passe- rar man in i ruta 410 i fig. 4 via ruta 405 och ramräknevärdet r inställes för den första ramen genom en enda puls ST från klockgeneratorn 103. Fíg. 6 illustrerar driften av kretsen en- ligt fig. 1 och 2 för två efter varandra följande ramar. Mellan tidpunkterna to i den första ramen bildar prediktions- analysatorn 110 talmönstersamplarna hos ramen r+2 vågform 605 under styrning av sampelklockpulserna med vàgform' 601. Analysatorn 110 genererar de ak-signaler, som motsvarar och t3 och bildar predik- tívrestsignalen dk mellan tidpunkterna t3 och tó, såsom antydes i vågform 607. Signalen FC (vågform 603) uppträder mel- från restsignal- och t7 såsom i ramen r+1, mellan tidpunkterna to lan tidpunkterna to och t1. Sígnalerna dk generatorn 118, vilka tidigare lagrats i minnet 218 under den föregående ramen, placeras i dataminnet 230 via íngângs-utgångs- -gränssnittet 260 och den gemensamma bussledningen 225 under styrning av centralprocessorn 240. Såsom antydes med arbets- rutan 415 i fig. 4 reagerar dessa operationer för ramklocksig- nalen RC. Rampredíktionsparametersignalerna ak från predik- tionsparameterdatorn 119, vilka tidigare placerats i minnet 218 under den föregående ramen, införes också i minnet 230 enligt arbetsrutan 420. Dessa operationer uppträder mellan tidpunkterna 13. 4456 6'18 t och r 1 fig. 6. 0 1 Efter införande av ramsignalerna dk och ak i minnet 230 övergår man till ruta 425 och de prediktivfilterkoefficien- ter bk, vilka motsvarar överföringsfunktíonen i ekvation 1, bk =°¿kak k = 1,2,...,p (12) genereras i den aritmetiska processorn 250 och placeras i data- minnet 230. p är normalt 16 och oc är normalt 0,85 för en samplingshastighet av 8 kHz. Prediktivfilterpulssvarssignalerna hk mmm ,p) z bkhk_í hk i=1 II k= 1,Z,...,K (13) genereras sedan i den aritmetiska processorn 250 och lagras i dataminnet 230. ruta 435 och prediktivfilterautokorrelationssígnalerna enligt När hk-pulssvarssignalen är lagrad går man till ekvation 11 genereras och lagras.
Vid tidpunkten tz net ROM 201 från gränssnittet 220 och ansluter excitationsbe- i fig. 6 kopplar kontrollern 215 min- handlingsunderprogrammínnet ROM 205 till gränssnittet. Bildandet av excitationspulskoderna ßi och mi, vilka visas i flödes- diagrammet enligt fig. 5, initieras sedan. Mellan tidpunkterna tz och t4 i fig. 6 bildas excitatíonspulssekvensen. Excite- tionspulsindexet i inställes initialt på 1 och pulsläges- indexet Q inställes på 1 i ruta S05. Ö] inställes på noll i ruta 510 och man gär till operationsrutan S15 för att bestämma “iq = ß11' 611 q = 1 hos ramen. Absolutvärdet för 511 jämföres sedan med det tidigare lagrade värdet för 01 i beslutsrutan 520. Eftersom 51 från början är noll inställes mi-koden på q = 1 och Pi-koden på 611 1 ruta szs.
Lägesindexet Q tillägges sedan i ruta S30 och man går är den optimala excitationspulsen vid läget till ruta 515 via beslutsrutan S35 för att generera signalen en. 535 itereras för alla pulslägesvärden 1 5 q 5 Q. Efter den Qzte iterationen lagrasden första excitationspulsamplituden ß = ß. 1 iq sätt bestämmes den första av de I Den slinga, som innefattar rutorna 515, 520, S25, 530 och * och dess läge i ramen m1 = q* i minnet 230. På detta excitatíonspulserna. Under 40 456 618 - u, hänvisning till vàgformen 705 i fig. 7 uppträder ramen 3 mellan tidpunkterna to och t1. Excitationskoden för ramen be- och i fig. 7, såsom är be- står av 8 pulser. Den första pulsen med amplituden ß1 läget m1 uppträder vid tidpunkten tm] stämt i flödesdiagrammet i fig. 5 för index i = 1.
Index i tillägges till den efterföljande excitationspul- sen i ruta 545 och man fortsätter till operationsrutan 515-via rutan S50 och rutan S10. Vid avslutande av varje iteration av slíngan mellan rutorna S10 och S50 modifieras excitationssignalen för att ytterligare reducera signalen i ekvation 7. Vid avslu- tande av den andra iterationen bildas pulsen 52 m2 (tidpunkten tmz i vågform 705). Excitationspulserna ß3m3 (tidpunkten tm3), ß4m4 (tidpunkten tm4), ßsms (tidpunkten tms), ßómö (tidpunkten tmó), ß7m7 (tidpunkten tm7) och Ûämg (tidpunkten tms) bildas sedan successivt allt eftersom index i tillägges.
Efter den Izte iterationen (vågformen 609 vid t4) fortsät- ter man till rutan SSS från beslutsrutan S50 och den aktuella ramexcitationskoden ß1m1, ß2m2,..., ßïml genereras däri. Ram- indexet tilläggas i ruta S60 och prediktivfilteroperationerna enligt fig. 4 för nästa ram startas i rutan 415 vid tidpunkten t7 i fig. 6. Vid uppträdande av FC-klocksignalen för nästa ram vid t7 r + 1 (vågform 605 mellan tidpunkterna t7 och t14) och ak- samt dk-signalerna genereras för ramen r+2 (vàgform 607 mel- lan tidpunkterna t7 och E13) och excitationskoden för ramen och i fig. 6 bildas prediktivparametersignalerna för ramen r + 1 àstadkommes (vägform 609 mellan tidpunkterna t7 ). 12 Ramexcitationskoden från processorn i fig. 2 matas via ingångs-utgångs-gränssnittet 260 till kodaren 131 i fig. 1, såsom är välkänt inom området. Kodaren 131 arbetar såsom tidi- gare nämnts för att kvantisera och formatbestämma excitations- koden för applicering på nätet 140. ak-prediktíonsparameter- signalerna hos ramen sändes till en ingång hos multiplexorn 135 via fördröjningsanordningen 133, så att ramexcitationskoden från kodaren 131 kan på lämpligt sätt multipliceras därmed.
Uppfinningen har beskrñülâ under hänvisning till speciella íllustrativa utföringsformer. Det är uppenbart för fackmannen inom området att olika modifikationer kan åstadkommas utan att uppfínníngens ram överskrides. Exempelvis har de här beskrivna utföringsformerna utnyttjat linjärprediktiva parametrar samt w 456 ens en prediktivrest. De linjärpredíktiva parametrarna kan ersättas med formantparametrar eller andra talparametrar, som är välkända inom omrâdet. Predítivfiltren anordnas då för att reagera för de talparametrar, som utnyttjas, och för talsignalen, så att den i kretsen 120 enligt fíg. 1 bildade excitatíonssignalen an- vändes i kombination med talparametersígnalerna för konstruktion av en kopia av talmönstret hos ramen i överensstämmelse med uppfinningen. Kodningsarrangemanget enligt uppfinningen kan ut- sträckas till sekventialmönster, t.ex. biologiska och geologiska mönster, för erhållande av ändamålsenliga representationer därav.
H0 456 618 w RPPENDIX A C THIS SUBROUTINE IHPLEMENTS BOX NOS 125-FIG. 1 ++++++ CORRELATION SIGHAL GENERATDR ++++++ f) COHHON Y(110),YHAT(110)|H(15),CI(110);Ã(16)1F(16)r &BETA(12):M(12) INTEGER I,K,Q,QSTAR,QHAX DÅTA NLPC/16/,KMAX/15/,NKHX/110/I EQHAX/95/,ÅLPHA/0.85/;IHÅX/12/ C++++ COHPUIE COEFFICIENIS FOR THE PREDICTIVE FILTER G=1 D0101K=1,NLPC G=G*ÅLPHÅ 101 F(K)=A(K)*G C++++ BOX 305 FIG. 3 c++++ COHPUIE IHPULSE RESPONSE OF C++++ PBEDICIIVB FILIER H(Z) _C++++ H(O) IS STORED AS H(1) , H(1) IS C++++ STORED AS R(2), AND SO ON H(1)=1 D0102K=2,NLPC H(K)=0 D0132I=1,K-1 102 H(K)=H(K)+ï(I)*H(K-I) D0103K=NLPC+1,KHAX H(K)=0 DO103I=1,NLPC 103 H(K)=H(K)+F(I)*H(K-I) SUMSQH=O D010UK=1,KHAX 10H SUMSQH=SUHSQH+H(K)*H(K) C++++ SET INITIÄL EXCIIATION SIGNAL COUflT - BOX 307 I=1 G=1 son Q=1> 200 CONIINUE C++++ COMPUTE CORRELATION SIGNRL - BOX 309 D0201K=Q,ï§Rï 201 CI(Q)=CI(Q)+(Y(N)-YHhT(N))*B(N-Q+1) Q=Q+1 .
IF(Q-LE.QMAX)GOT0200 cauj acmzvußunsarz) I=I+1 IF(I-LE-IfiEX)GOTO500 Atal-Remde 9-1 HO 456 618 REIURN END ÅPPENDIX B C THIS SUBROUTINE IHPLEMENTS BOX NOS 127 - FIG. 1 ++++++ EXCITEIION SIGNAL SENERÅTOR ++++++ f) COMMON Y(110)»YHAT(110)fH(15)|CI(110)fÅ(15,F(16), ¿BETÅ(12),H(12) _ INTEGER I,K,Q,QSTÅR,QUAX DATA NLPC/16/,KMÅX/15/,NÄAX/110/,QMAX/95/, EALPHA/0.85/, IHAX/12/ C++++ :++++ _ D=1 QSTAR=0 CIQSIAR=0 FIND PEÅK OF THE CORRELÅTION SIGNAL ~ BOX 315-325 300 IF(ÅBS(CI(Q))-LT.ABS(CIQSÉhR))SOT0301 QSTAR=Q CIQSIAR=CI(Q) 301 Q=Q+1 IF(Q.LE.QHÅX)GQTO300 H(I)=DSTAR BETA(I)=CI25IÄR/SUHSQH RETURN END APPEHDIX C C THIS SUBROUTINE IMPLEHENTS ROH 201 - FIG. 2 C ++++++ PREDICTIVE FILTER ++++++ COEHON D(110),H(15);BETAI(80),A(16),F(16), 8PHI(15),BETA(12),M(12) INTEGER I,K,Q,QSTAR,QNAX ' DÅTÅ NLPC/16/.KHÅX/15/,NHAX/110/,QEÅX/BO/1 GALPHA/0.85/, IHHX/12/ C++++ READ PREDICTIVE RESIDUAL SIGNAL - BOX 015 CALL INPUI (D(29)f80) REÄD PREDICTION PARAHETERS ~ BÛX H20 CALL INPUT(A,16) C++++ SÛMPUTE COEFFICIENIS FÖR TH? PREDICTIVE FILTER ~ BOX N25 C++++ C++++ G=1 D0101K=1,NLPC G=G'ALPHA 101 F(K)=A(K)*G Atal-Pemde 9-1 UD H5 Anal-Pemde 4556 C++++ C++++ C++++ C++++ C++++ 102 103 C++++ C++++ 100 F)Û C++++ C++++ 105 C++++ 500 200 C++++ . ._ -..- .v- ~. 6'|8 xß 5 COHPÜTE IHPULSÉ RÉSPÛNSÉ OF PRÉDICTIVE FILTÉR “(2) H Is sronsn As n(1> , a<1> IS SIÛRED ÅS H(2)r ÃND SO UN aox usa u<1>=1 nø1o2x=z,nL2c a=o uo1ozI=1,x-1 H=a+s<1>*HcK-1) DO103K=NLPC+1,KHAX fi(x>=o oo1o3I=1.NLPc a=nfn C0flPUTE AUIOCORRELAIION FUNCTIOK SIGNAL3 _ BOX 035 DO10ßK=1,KHAX PHI(K)=0 D010UN=K,KHàX PHI(K)=PHI(K)+ä(N)*H(N+K-1) RETURN BHD APPENDIX D THIS SUBROUIIN2 IMPLEHENIS ROH 205 - FIG. 2 ++++++ EXCITATION PROCESSING ++++++ COHMON D(110),H(15),8EIAI(80):5(16)f= &PHI(15),BETÅ(12)fH(12) INIEGER I,K,Q,QSTARfQHAX DAIA NLPC/15/,KHAX/15/,NäAX/110/IQMAX/BO/, EALPHA/0.85/1 IHAX/12/ COHPUTE INITIAL BETAI SIGNAL (I=1) TERM NO 1 EQUATION 13 AND BOX 515 D0105Q=1,QHAX BEIAI(Q)=0 DO10SN=Q,Q+2*KMAX-2 K=ä-XMAX+1 BEIAI(Q)=BETAI(Q)+D(N)*PHI(1+IA3S(K-3)) I INIIIAL EXCITÅTION SIGNAL CDUNI - B31 S35 CONTINUE B5IEfiAX=O CONTINUE COHPUIE BSTAI SIGNAL - BOV I?(I.EQ.1)COT0300 515 O I -J 201 C++++ 300 301 5 Q 456 618 D0201J=1,I-1 BEIAIIQÄ=BETAI(0)-BEIÅ(J)*PHI(1+IABS(H(J)'Q)) FIND PEAK OF THE BBTAI SIGNAL - BOX 520-525 IF(AES(BETAI(Q)).LT.BETRHAX)GOTO301 H(I)=Q BEIAXAX=ABS(BETAI(Q)) BETA(I)=BETAI(Q)/PHI(I) o=a+1 _ IF(Q-LE.JäAX)GOT020O I=I+1 IF(I.LE.InAX>GOTOS90 CALL 0UTPUT(BETÅ,IHAX) CÅLL OUT?UT(M,IMAX) DOSK=1,29 D(K)=D(K+B0) RETURN END Åtal-Remde 9-1 . LM- ~._..~. l.'.' L... _
Claims (20)
1. Förfarande för att behandla en talsignal för att bilda en digital kod, som representerar talmönstret, innefatt- ande att uppdela talmönstret i successiva tidsintervall (119), att generera en grupp signaler, som representerar nämnda tal- mönster hos varje tidsintervall såsom svar på intervallets talmonster (119), att generera en signal, som representerar skillnaderna mellan intervallets talmönster och intervallets talmönsterrepresentativa signalgrupp såsom svar på inver- vallets talmönster och intervallets talmönsterrepresentativa signaler (118), att generera en signal, som representerar exciteringen av tidsintervallet (120) samt att bilda en digi- talkodad signal, som representerar talmönstret hos tidsinter- vallet såsom svar pà den signalgrupp, som representerar tal- mönstret hos tidsintervallet samt exciteringssignalen hos tidsintervallet (135), varvid genereringen av tidsintervallets exciteringssignal k ä n n e t e c k n a s av att bilda en första signal motsvarande intervallets tal- mönster såsom svar på de intervallmönsterrepresentativa signa- lerna och den intervallskillnadsrepresentativa signalen (121), att bilda en andra intervallmotsvarande signal sasom svar på de intervalltalmönsterrepresentativa signalerna (123), att generera en signal motsvarande skillnaderna mellan den första och den andra intervallmotsvarande signalen (125) samt att astadkomma en tredje signal såsom svar pà den intervallskill- nadsmotsvarande signalen för att ändra den andra signalen i och för att reducera den intervallskillnadsmotsvarande signa- len (127). _
2. Forfarande enligt kravet 1, k ä n n e t e c k n a t av att genereringssteget för den intervallrepresenterande signalgruppen innefattar generering av en grupp talparameter- signaler, som representerar intervalltalmönstet (119), varvid formningssteget för den första intervallmotsvarande signalen innefattar generering av den första intervallmotsvarande signalen såsom svar pa talparametersignalerna och den skill- nadsrepresentativa signalen (201, 210, 215, 218) och att form- ningssteget för den andra intervallmotsvarande signalen inne- fattar generering av den andra intervallmotsvarande signalen 10 15 20 25 30 35 40 456 618 2! såsom svar pá intervalltalparametersignalerna (201, 210, 218). 215,
3. Förfarande enligt kravet 2, k ä n n e t e c k n a t av att genereringeeteget för talparametersignalen innefattar generering av en grupp signaler representerande intervalltal- spektret.
4. Förfarande enligt kravet 3, k ä n n e t e c k n a t av att steget för astadkommande av den tredje signalen inne- fattar generering av en signal med åtminstone ett element sa- som svar pà den intervallekillnadsmotevarande signalen (205, 210, 215) och att den andra intervallmotsvarande signalen modifieras såsom svar på nämnda signal med åtminstone ett element (201, 210, 215, 218).
5. Förfarande enligt kravet 4, k ä n n e t e c k n a t av att nämnda signal med atminetone ett element utgöres av en multipelelementsignal och att steget för generering av multi- för ett förutbestämt antal tid- punkter, generering av ett element hos multipelelementsignalen pelelementsignalen innefattar, såsom svar pa den intervallakillnadsmotsvarande signalen (309~327) och att ändra den andra intervallmotsvarande signa- len såsom svar på de genererade elementen hos multipelelemsnt- signalen (328).
6. Förfarande enligt kravet 5, k ä n n e t e c k n a t av att steget för generering av den skillnadsmotsvarande sig- nalen innefattar generering av en signal representerande korrelationen mellan den första intervallmotsvarande signalen och den intervallmotsvarande signalen.
7. Förfarande enligt kravet 4, k ä n n e t e c k n a t av ett steget för generering av den skillnadsmotsvarande signalen innefattar genersring av en signal representerande medelkvadratskillnaden mellan nämnda första och andra inter- vallmotsvarande signaler.
8. Pörfarande enligt kravet 4, k ä n n e t e c k n a t av att den aetadkomna signalen med atminetone ett element och talparametersignalerna kombineras för bildande av en kodad signal representerande ramtalmönstret (135).
9. Förfarande enligt kravet 4, k ä n n e t e c k n a t av att genereringen av talparametersignalgruppen innefattar generering av en grupp 1injärpredikativparametersignaler för ramen såsom svar på ramtalmönstret (119) samt att genereringen 10 15 20 25 30 35 40 456 618 ZZ av den skillnadsrepresentativa signalen innefattar generering av en prediktivrestsignal såsom svar på ramens linjärpredik- tivparametersignaler och ramtalmönstret (118).
10. Förfarande enligt kravet 9, k ä n n e t e c k n a t av att steget för åstadkommande av nämnda signal med åtmin- stone ett element innefattar generering av en signal med åt- minstone ett element såsom svar på den skillnadsmotsvarande signalen (205, 210) samt modifiering av ramens andra signal sasom svar på signalelementen (201, 210, 218).
11. Förfarande enligt kravet 10, k ä n n e t e c k - n a t av att steget för astadkommande av nämnda signal med åtminstone ett element innefattar generering av en multi- elementsignal genom successiv generering av ett signalelement såsom svar på nämnda skillnadsmotsvarande signal (205, 210) samt ändring av nämnda andra signal såsom svar på nämnda element hos multipelelementsignalen (201, 210, 218).
12. Talprocessor för att utföra förfarandet för att be- handla talmönster för digital kodning enligt kravet 1, inne- fattande organ (119) för uppdelning av ett talmönster i successiva tidsintervall, organ (119) för generering av en grupp signaler, som representerar nämnda talmönster i varje tidsintervall såsom svar på intervallets talmönster, organ (118), som reagerar för nämnda intervalltalmönster och de intervalltalmönsterrepresentativa signalerna för generering av en signal, som representerar skillnaderna mellan intervalltal- mönstret och den intervalltalmönsterrepresentativa signal- gruppen, organ (120) för generering av en signal, som repre- senterar exciteringen av tidsintervallet, samt organ (135) för bildande av en digitalkodad signal, som representerar tal- mönstret i tidsintervallet såsom svar på den signalgrupp, vilken representerar talmönstret i tidsintervallet samt exci- teringssignalen i tidsintervallet (135), varvid nämnda organ -(120) för generering av tidsintervallets exciteringssignal kännetecknas av organ (121), som reagerar för intervallets talmönster- representativa signaler och intervallets skillnadsrepreeenta- tiva signal för bildande av en första signal, svarande mot intervallets talmönster, organ (123), som reagerar för inter- vallets talmönsterrepresentativa signaler för bildande av en andra intervallmotsvarande signal, organ (125) för generering 10 15 20 25 30 35 = 456 618 2.5 _~ av en signal, motsvarande skillnaden mellan den första och den andra intervallmotsvarande signalen, samt organ (127), som reagerar för den intervallskillnadsmotsvarande signalen för att åstadkomma en trejde signal för ändring av den andra intervallmotsvarande signalen i och för att minska den inter- vallskillnadsmotsvarande signalen.
13. Talprocessor enligt kravet 12, k ä n n e t e c k- n a d av att organet för generering av den talintervall- representativa signalgruppen innefattar organ (119) för gene- rering av en grupp signaler representerande föreskrivna tal- parametrar av intervalltalmönstret, varvid organet för bild- ande av den första intervallmotsvarande signalen innefattar organ (201, 210, 215, 218), som reagerar för intervallets föreskrivna talparametersignaler och den skillnadsrepresenta- tiva signalen för generering av den första intervallmotsvar- ande signalen, varvid organet för bildande av den andra inter- vallmotsvarande signalen innefattar organ (201, 210, 215, 218), som reagerar för intervallets föreskrivna talparameter- signaler för generering av den andra intervallmotsvarande signalen.
14. Talprocessor enligt kravet 13, k Ä n n e t e c k - n a d av att organet för generering av den föreskrivna tal- parametersignalen innefattar organ för generering av en grupp signaler representerande intervalltalmönsterspektret.
15. Talprocessor enligt kraavet 14,_ k ä n n e t e c k - n a d av att organet för àstadkommande av den tredje signa- len innefattar organ (205, 210, 215), som reagerar för den intervallskillnadsmotsvarande signalen för generering av en kodad signal, som har åtminstone ett element, samt att organ (201, 210, 215, 218) är anordnade att reagera för elementet eller elementen hos signalen med atminstone ett element för ändring av den andra intervallmotsvarande signalen.
16. Talprocessor enligt kravet 15, k ä n n e t e c k - n a d av att organet för generering av nämnda signal med åtminstone ett element innefattar organ (205, 210, 215), som opererar N gånger för att åstadkomma en kodad N-elementsignal, inkluderande organ, som reagerar för nämnda skillnadsmotsvar~ ande signal för att generera kodade signalelement samt organ (201, 210, 215, 218), som reagerar för de genererade kodade 10 15 20 25 30 35 40 456 618 - ZH t signalelementen för att ändra den andra intervallmotsvarande signalen.
17. Talproceeeor enligt kravet 16, k Ä n n e t e c k- n a d av att organet för generering av den intervallskill- nadsmotsvarande signalen innefattar organ (205, 210) för att generera en signal, representerande korrelationen mellan nämnda första och andra intervallmotsvarande signaler.
18. Talprocessor enligt kravet 16, k ä n n e t e c k - n a d av att organet för generering av den intervallskill- nadsmotsvarande signalen innefattar organ (205, 210) för att generera en signal, representerande medelkvadratskillnaden mellan nämnda första och andra intervallmotevarande signaler.
19. Talproceesor enligt kravet 12, k ä n n e t e c k - n a d av organ för att kombinera den ástadkomna tredje signalen samt gruppen av parametersignaler representerande talmönstet för att bilda en kodad signal repreeenterande tal- mönstet (135).
20. Talprocessor enligt kravet 12, k ä n n e t e c k - n a d av att organet för generering av talmönstersignal- gruppen innefattar organ (119), som reagerar för talmönstret för generering av en grupp av linjärprediktivparametersignaler för tidsintervallet, att det organ, som genererar den skill- nadsrepresentativa signalen, innefattar organ (118), som reagerar för nämnda linjärprediktioneparametersignaler och nämnda talmönater för generering av en prediktiv restsignal, att organet för generering av den första signalen innefattar organ (201, 210, 215, 218), metersignalerna och predíktivrestsignalen för att bilda nämnda som reagerar för prediktivpara- samt att organet för generering av 210, 215, 218), som första motsvarande signal, den andra signalen innefattar organ (201, _reagerar för linjärprediktivparametersignalerna för att bilda den andra motsvarande signalen.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US06/326,371 US4472832A (en) | 1981-12-01 | 1981-12-01 | Digital speech coder |
Publications (3)
Publication Number | Publication Date |
---|---|
SE8206641D0 SE8206641D0 (sv) | 1982-11-22 |
SE8206641L SE8206641L (sv) | 1983-06-02 |
SE456618B true SE456618B (sv) | 1988-10-17 |
Family
ID=23271926
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
SE8206641A SE456618B (sv) | 1981-12-01 | 1982-11-22 | Forfarande och talprocessor for att behandla en talsignal for att bilda en digital kod, som representerar talmonstret |
SE8704178A SE467429B (sv) | 1981-12-01 | 1987-10-27 | Talprocessor foer aastadkommande av talmeddelande |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
SE8704178A SE467429B (sv) | 1981-12-01 | 1987-10-27 | Talprocessor foer aastadkommande av talmeddelande |
Country Status (8)
Country | Link |
---|---|
US (1) | US4472832A (sv) |
JP (2) | JPS6046440B2 (sv) |
CA (1) | CA1181854A (sv) |
DE (1) | DE3244476A1 (sv) |
FR (1) | FR2517452B1 (sv) |
GB (1) | GB2110906B (sv) |
NL (1) | NL193037C (sv) |
SE (2) | SE456618B (sv) |
Families Citing this family (60)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4720863A (en) * | 1982-11-03 | 1988-01-19 | Itt Defense Communications | Method and apparatus for text-independent speaker recognition |
JPS59153346A (ja) * | 1983-02-21 | 1984-09-01 | Nec Corp | 音声符号化・復号化装置 |
EP0119033B1 (en) * | 1983-03-11 | 1987-04-15 | Prutec Limited | Speech encoder |
US4731846A (en) * | 1983-04-13 | 1988-03-15 | Texas Instruments Incorporated | Voice messaging system with pitch tracking based on adaptively filtered LPC residual signal |
US4667340A (en) * | 1983-04-13 | 1987-05-19 | Texas Instruments Incorporated | Voice messaging system with pitch-congruent baseband coding |
US4638451A (en) * | 1983-05-03 | 1987-01-20 | Texas Instruments Incorporated | Microprocessor system with programmable interface |
CA1219079A (en) * | 1983-06-27 | 1987-03-10 | Tetsu Taguchi | Multi-pulse type vocoder |
US4669120A (en) * | 1983-07-08 | 1987-05-26 | Nec Corporation | Low bit-rate speech coding with decision of a location of each exciting pulse of a train concurrently with optimum amplitudes of pulses |
NL8302985A (nl) * | 1983-08-26 | 1985-03-18 | Philips Nv | Multipulse excitatie lineair predictieve spraakcodeerder. |
CA1236922A (en) * | 1983-11-30 | 1988-05-17 | Paul Mermelstein | Method and apparatus for coding digital signals |
CA1223365A (en) * | 1984-02-02 | 1987-06-23 | Shigeru Ono | Method and apparatus for speech coding |
US4701954A (en) * | 1984-03-16 | 1987-10-20 | American Telephone And Telegraph Company, At&T Bell Laboratories | Multipulse LPC speech processing arrangement |
EP0163829B1 (en) * | 1984-03-21 | 1989-08-23 | Nippon Telegraph And Telephone Corporation | Speech signal processing system |
US4709390A (en) * | 1984-05-04 | 1987-11-24 | American Telephone And Telegraph Company, At&T Bell Laboratories | Speech message code modifying arrangement |
JPS60239798A (ja) * | 1984-05-14 | 1985-11-28 | 日本電気株式会社 | 音声信号符号化/復号化装置 |
US4872202A (en) * | 1984-09-14 | 1989-10-03 | Motorola, Inc. | ASCII LPC-10 conversion |
CA1249061A (en) * | 1984-12-25 | 1989-01-17 | Takashi Mochizuki | Method and apparatus for encoding/decoding image signal |
US4675863A (en) | 1985-03-20 | 1987-06-23 | International Mobile Machines Corp. | Subscriber RF telephone system for providing multiple speech and/or data signals simultaneously over either a single or a plurality of RF channels |
FR2579356B1 (fr) * | 1985-03-22 | 1987-05-07 | Cit Alcatel | Procede de codage a faible debit de la parole a signal multi-impulsionnel d'excitation |
NL8500843A (nl) * | 1985-03-22 | 1986-10-16 | Koninkl Philips Electronics Nv | Multipuls-excitatie lineair-predictieve spraakcoder. |
US4944013A (en) * | 1985-04-03 | 1990-07-24 | British Telecommunications Public Limited Company | Multi-pulse speech coder |
US4912764A (en) * | 1985-08-28 | 1990-03-27 | American Telephone And Telegraph Company, At&T Bell Laboratories | Digital speech coder with different excitation types |
US4890328A (en) * | 1985-08-28 | 1989-12-26 | American Telephone And Telegraph Company | Voice synthesis utilizing multi-level filter excitation |
US4720861A (en) * | 1985-12-24 | 1988-01-19 | Itt Defense Communications A Division Of Itt Corporation | Digital speech coding circuit |
US4827517A (en) * | 1985-12-26 | 1989-05-02 | American Telephone And Telegraph Company, At&T Bell Laboratories | Digital speech processor using arbitrary excitation coding |
USRE34247E (en) * | 1985-12-26 | 1993-05-11 | At&T Bell Laboratories | Digital speech processor using arbitrary excitation coding |
US4935963A (en) * | 1986-01-24 | 1990-06-19 | Racal Data Communications Inc. | Method and apparatus for processing speech signals |
CA1323934C (en) * | 1986-04-15 | 1993-11-02 | Tetsu Taguchi | Speech processing apparatus |
US4868867A (en) * | 1987-04-06 | 1989-09-19 | Voicecraft Inc. | Vector excitation speech or audio coder for transmission or storage |
US4969192A (en) * | 1987-04-06 | 1990-11-06 | Voicecraft, Inc. | Vector adaptive predictive coder for speech and audio |
US4890327A (en) * | 1987-06-03 | 1989-12-26 | Itt Corporation | Multi-rate digital voice coder apparatus |
US4817157A (en) * | 1988-01-07 | 1989-03-28 | Motorola, Inc. | Digital speech coder having improved vector excitation source |
US4896361A (en) * | 1988-01-07 | 1990-01-23 | Motorola, Inc. | Digital speech coder having improved vector excitation source |
US5285520A (en) * | 1988-03-02 | 1994-02-08 | Kokusai Denshin Denwa Kabushiki Kaisha | Predictive coding apparatus |
JP2625998B2 (ja) * | 1988-12-09 | 1997-07-02 | 沖電気工業株式会社 | 特徴抽出方式 |
SE463691B (sv) * | 1989-05-11 | 1991-01-07 | Ericsson Telefon Ab L M | Foerfarande att utplacera excitationspulser foer en lineaerprediktiv kodare (lpc) som arbetar enligt multipulsprincipen |
US5261027A (en) * | 1989-06-28 | 1993-11-09 | Fujitsu Limited | Code excited linear prediction speech coding system |
JPH0332228A (ja) * | 1989-06-29 | 1991-02-12 | Fujitsu Ltd | ゲイン―シェイプ・ベクトル量子化方式 |
US5263119A (en) * | 1989-06-29 | 1993-11-16 | Fujitsu Limited | Gain-shape vector quantization method and apparatus |
JPH0365822A (ja) * | 1989-08-04 | 1991-03-20 | Fujitsu Ltd | ベクトル量子化符号器及びベクトル量子化復号器 |
US5235669A (en) * | 1990-06-29 | 1993-08-10 | At&T Laboratories | Low-delay code-excited linear-predictive coding of wideband speech at 32 kbits/sec |
SE467806B (sv) * | 1991-01-14 | 1992-09-14 | Ericsson Telefon Ab L M | Metod att kvantisera linjespektralfrekvenser (lsf) vid beraekning av parametrar foer ett analysfilter ingaaende i en talkodare |
US5301274A (en) * | 1991-08-19 | 1994-04-05 | Multi-Tech Systems, Inc. | Method and apparatus for automatic balancing of modem resources |
US5659659A (en) * | 1993-07-26 | 1997-08-19 | Alaris, Inc. | Speech compressor using trellis encoding and linear prediction |
US5546383A (en) | 1993-09-30 | 1996-08-13 | Cooley; David M. | Modularly clustered radiotelephone system |
US5602961A (en) * | 1994-05-31 | 1997-02-11 | Alaris, Inc. | Method and apparatus for speech compression using multi-mode code excited linear predictive coding |
AU696092B2 (en) * | 1995-01-12 | 1998-09-03 | Digital Voice Systems, Inc. | Estimation of excitation parameters |
SE508788C2 (sv) * | 1995-04-12 | 1998-11-02 | Ericsson Telefon Ab L M | Förfarande att bestämma positionerna inom en talram för excitationspulser |
JP3137176B2 (ja) * | 1995-12-06 | 2001-02-19 | 日本電気株式会社 | 音声符号化装置 |
DE19643900C1 (de) * | 1996-10-30 | 1998-02-12 | Ericsson Telefon Ab L M | Nachfiltern von Hörsignalen, speziell von Sprachsignalen |
US5839098A (en) | 1996-12-19 | 1998-11-17 | Lucent Technologies Inc. | Speech coder methods and systems |
US5832443A (en) * | 1997-02-25 | 1998-11-03 | Alaris, Inc. | Method and apparatus for adaptive audio compression and decompression |
US6003000A (en) * | 1997-04-29 | 1999-12-14 | Meta-C Corporation | Method and system for speech processing with greatly reduced harmonic and intermodulation distortion |
US7392180B1 (en) | 1998-01-09 | 2008-06-24 | At&T Corp. | System and method of coding sound signals using sound enhancement |
US6182033B1 (en) | 1998-01-09 | 2001-01-30 | At&T Corp. | Modular approach to speech enhancement with an application to speech coding |
US5963897A (en) * | 1998-02-27 | 1999-10-05 | Lernout & Hauspie Speech Products N.V. | Apparatus and method for hybrid excited linear prediction speech encoding |
US6516207B1 (en) * | 1999-12-07 | 2003-02-04 | Nortel Networks Limited | Method and apparatus for performing text to speech synthesis |
US7295614B1 (en) | 2000-09-08 | 2007-11-13 | Cisco Technology, Inc. | Methods and apparatus for encoding a video signal |
JP4209257B2 (ja) | 2003-05-29 | 2009-01-14 | 三菱重工業株式会社 | 分散型コントローラとその動作方法、及び、分散型コントローラを備えるフォークリフト |
EP2595146A1 (en) * | 2011-11-17 | 2013-05-22 | Nederlandse Organisatie voor toegepast -natuurwetenschappelijk onderzoek TNO | Method of and apparatus for evaluating intelligibility of a degraded speech signal |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3346695A (en) * | 1963-05-07 | 1967-10-10 | Gunnar Fant | Vocoder system |
US3624302A (en) * | 1969-10-29 | 1971-11-30 | Bell Telephone Labor Inc | Speech analysis and synthesis by the use of the linear prediction of a speech wave |
US3740476A (en) * | 1971-07-09 | 1973-06-19 | Bell Telephone Labor Inc | Speech signal pitch detector using prediction error data |
DE2435654C2 (de) * | 1974-07-24 | 1983-11-17 | Gretag AG, 8105 Regensdorf, Zürich | Verfahren und Vorrichtung zur Analyse und Synthese von menschlicher Sprache |
JPS5246642A (en) * | 1975-10-09 | 1977-04-13 | Mitsubishi Metal Corp | Swimming pool |
JPS5343403A (en) * | 1976-10-01 | 1978-04-19 | Kokusai Denshin Denwa Co Ltd | System for analysing and synthesizing voice |
US4130729A (en) * | 1977-09-19 | 1978-12-19 | Scitronix Corporation | Compressed speech system |
US4133976A (en) * | 1978-04-07 | 1979-01-09 | Bell Telephone Laboratories, Incorporated | Predictive speech signal coding with reduced noise effects |
US4184049A (en) * | 1978-08-25 | 1980-01-15 | Bell Telephone Laboratories, Incorporated | Transform speech signal coding with pitch controlled adaptive quantizing |
JPS5648690A (en) * | 1979-09-28 | 1981-05-01 | Hitachi Ltd | Sound synthesizer |
-
1981
- 1981-12-01 US US06/326,371 patent/US4472832A/en not_active Ceased
-
1982
- 1982-11-18 CA CA000415816A patent/CA1181854A/en not_active Expired
- 1982-11-22 SE SE8206641A patent/SE456618B/sv not_active IP Right Cessation
- 1982-11-25 FR FR8219772A patent/FR2517452B1/fr not_active Expired
- 1982-11-29 GB GB08233923A patent/GB2110906B/en not_active Expired
- 1982-11-30 NL NL8204641A patent/NL193037C/nl not_active IP Right Cessation
- 1982-12-01 JP JP57209489A patent/JPS6046440B2/ja not_active Expired
- 1982-12-01 DE DE19823244476 patent/DE3244476A1/de active Granted
-
1985
- 1985-07-25 JP JP60163090A patent/JPH0650437B2/ja not_active Expired - Lifetime
-
1987
- 1987-10-27 SE SE8704178A patent/SE467429B/sv not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
NL8204641A (nl) | 1983-07-01 |
SE8704178D0 (sv) | 1987-10-27 |
JPS6156400A (ja) | 1986-03-22 |
SE8206641L (sv) | 1983-06-02 |
JPS6046440B2 (ja) | 1985-10-16 |
NL193037C (nl) | 1998-08-04 |
SE8704178L (sv) | 1987-10-27 |
FR2517452B1 (fr) | 1986-05-02 |
DE3244476A1 (de) | 1983-07-14 |
GB2110906A (en) | 1983-06-22 |
CA1181854A (en) | 1985-01-29 |
JPS58105300A (ja) | 1983-06-23 |
SE467429B (sv) | 1992-07-13 |
JPH0650437B2 (ja) | 1994-06-29 |
DE3244476C2 (sv) | 1988-01-21 |
NL193037B (nl) | 1998-04-01 |
GB2110906B (en) | 1985-10-02 |
US4472832A (en) | 1984-09-18 |
SE8206641D0 (sv) | 1982-11-22 |
FR2517452A1 (fr) | 1983-06-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
SE456618B (sv) | Forfarande och talprocessor for att behandla en talsignal for att bilda en digital kod, som representerar talmonstret | |
CA1222568A (en) | Multipulse lpc speech processing arrangement | |
KR0143076B1 (ko) | 다중-요소 신호 코딩 방법 및 장치 | |
USRE32580E (en) | Digital speech coder | |
US4220819A (en) | Residual excited predictive speech coding system | |
US3624302A (en) | Speech analysis and synthesis by the use of the linear prediction of a speech wave | |
US5457783A (en) | Adaptive speech coder having code excited linear prediction | |
JPS61220000A (ja) | マルチパルス励起線形予測符号器 | |
US4827517A (en) | Digital speech processor using arbitrary excitation coding | |
US4520499A (en) | Combination speech synthesis and recognition apparatus | |
CN111816158B (zh) | 一种语音合成方法及装置、存储介质 | |
SE518319C2 (sv) | Förfarande och anordning för vektorkvantisering | |
US5953697A (en) | Gain estimation scheme for LPC vocoders with a shape index based on signal envelopes | |
SE517793C2 (sv) | Sätt att åstadkomma ett spektralbrusviktningsfilter att använda i en talkodare | |
WO1992011627A2 (en) | Speech coding | |
JP3255190B2 (ja) | 音声符号化装置並びにその分析器及び合成器 | |
US4873724A (en) | Multi-pulse encoder including an inverse filter | |
JPH10222197A (ja) | 音声合成方法およびコード励振線形予測合成装置 | |
WO1989002148A1 (en) | Coded communications system | |
NO862602L (no) | Vocoder innebygd i digitale signalbehandlingsenheter. | |
CA1336841C (en) | Multi-pulse type coding system | |
KR950013373B1 (ko) | 음성 메시지 공급 장치와 음성 메시지 생성 방법 | |
US5058165A (en) | Speech excitation source coder with coded amplitudes multiplied by factors dependent on pulse position | |
JPS61103322A (ja) | 波形符号化装置 | |
JPH03177900A (ja) | 音声符号化方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
NAL | Patent in force |
Ref document number: 8206641-6 Format of ref document f/p: F |
|
NUG | Patent has lapsed |