SE422377B - Talkodningssystem - Google Patents

Talkodningssystem

Info

Publication number
SE422377B
SE422377B SE8008245A SE8008245A SE422377B SE 422377 B SE422377 B SE 422377B SE 8008245 A SE8008245 A SE 8008245A SE 8008245 A SE8008245 A SE 8008245A SE 422377 B SE422377 B SE 422377B
Authority
SE
Sweden
Prior art keywords
signal
signals
excitation
speech
response
Prior art date
Application number
SE8008245A
Other languages
English (en)
Other versions
SE8008245L (sv
Inventor
B S Atal
Original Assignee
Western Electric Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Western Electric Co filed Critical Western Electric Co
Publication of SE8008245L publication Critical patent/SE8008245L/sv
Publication of SE422377B publication Critical patent/SE422377B/sv

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Telephonic Communication Services (AREA)

Description

15 20 25 30 35 40 f"šoos24s-6 2 varandra följande intervall och varvid man alstrar en uppsättning parametersignaler vilka är representativa för talet i respektive intervall. Dessa parametersignaler innefattar en uppsättning linjär- predikteringskoefficient-signaler motsvarande den spektrala enveloppen för talintervallet samt tonhöjd-signaler och signaler representativa för "tonande/tonlöst"motsvarande talalstringen. Parametersignalerna kodas i en mycket lägre bittakt än vad som erfordras för att koda talsignalen som helhet. De kodade parametersignalerna överföres på en digital signal till en bestämmelseort där en efterbildning av den inkommande talsígnalen medelst syntes alstras ur parametersignalerna.
Syntetiseringsarrangemanget innefattar alstring av en exciteringssig- nal ur de avkodade tonhöjd- och tonande/tonlöst-signalerna, i fort- sättningen kallade "tonande-signalerna", samt modifiering av excite- ringssignalen medelst för enveloppen representativa predikteringskoef- fícienter i ett allpol-predikteringsfilter.
Den ovannämnda tonhöjds-exciterade linjära predikteringskodningen är visserligen mycket effektiv när det gäller bitfrekvensreducering, men talefterbildningen från.syntetisatorn får en syntetisk karaktär som skiljer sig från den naturliga mänskliga rösten. Den syntetiska. karaktären beror i stort sett på dels bristande noggrannhet i de alstrade linjär-predikteringskoefficient-signalerna, vilket medför att den linjära predikterings-spektralenveloppen avviker från den verkliga spektralenveloppen för talsignalen och dels bristande noggranhet i tonhöjds- och tonande-signalerna. Dessa brister förefaller att bero på skillnader mellan det mänskliga talorganet och den i kodaren använ- da allpol-filtermodellen samt skillnader mellan det mänskliga talalst- ringsorganet och kodarens tonhöjdsperiod- och tonande-arrangemang.
Förbättring av talkvaliteten har hittills krävt mycket komplicerade kodningsmetoder där man använder mycket högre bitfrekvenser än metoden med tonhöjdsexciterad linjär prediktering. Ett ändamål med uppfin- ningen är att åstadkomma naturligt klingande tal i en digital talkcda- re vid relativt låga bitfrekvenser.
Sammanfattning av uppfinningen Allmänt sett är den av syntetiseraren alstrade exciteringen under tonande delar av talsignalen en serie tonhöjdsperiod-separerade pul- Det har visat sig att variationer i excíteringspulsformen påver- En fast excite- SSI". kar den syntetiserade talefterbildningens kvalitet. ringspulsform ger emellertid ej en talåterbildning som låter natur- ligt. Speciella exciteringspulsformer medför dock en förbättring av valda särdrag. Jag har upptäckt att bristerna i noggrannhet vid de 10 15 20 25 30 35 NO 8008245-6 3 linjär-predikteringskoefficientsignaler som alstras i predikterings- analysatorn kan korrigeras genom att man formar den predikterande exciteringssignalen från syntetisatorn för att kompensera för felen i predikteringskoefficientsignalerna. Det resulterande kodningsarrange- manget ger naturligt klingande talsignalefterbildningar vid bitfrek- venser som är betydligt lägre än vid andra kodningssystem, som t.ex.
PCM eller adaptiv predikterande kodning.
Uppfinningen är inriktad på ett talbehandlingsarrangemang där en talanalysator är anordnad att indela en talsignal i intervaller och att alstra en första uppsättning signaler som är representativa för intervall-talsignalens predikteringsparametrar och de för tonhöjd representativa signalerna samt tonande-signalerna. En signal motsva- rande predikteringsfelet för intervallet alstras även. En talsynteti- serare är anordnad att alstra en exciteringssignal som påverkas av de för tonhöjd och tonande/tonlöst representativa signalerna och att kombinera exoiteringssignalen med nämnda första signaler för alstring av en efterbildning av talsignalen. Analysatorn innehåller vidare en anordning för att alstra en uppsättning andra signaler vilka är repre- sentativa för spektret för intervallets felpredikteringssignal. Som svar på de för tonhöjd och tonande/tonlöst representativa signalerna och nämnda andra signaler bildas i syntetiseraren en predikteringsfel- kompenserande exciteringssígnal varigenom ett naturligt klingande efterbildat tal àstadkommes.
Enligt en första aspekt på uppfinningen bildas den predikterings- felkompenserande exeiteringssignalen genom att man först alstrar en första exciteringssignal vilken påverkas av tonhöjdësignalen och tonande-signalen och formar den första exciteringssignalen under påverkan från nämnda andra signaler.
Enligt en andra aspekt på uppfinningen innehåller den första exciteringssignalen en serie exciteringspulser vilken alstras som svar på såväl tonnöjd-signalen som tonandelsignalen. Exoiteringspulserna modifieras som svar på nämnda andra signaler för alstring av en serie predikteringsfelkompenserande exciteringspulser.
Enligt ytterligare en aspekt på uppfinningen alstras ett flertal predikteringsfel-spektralsignaler som svar på predikteringsfelsignalen i talanalysatorn. Varje predikteringsfel-spektralsignal motsvarar en förutbestämd frekvens. Predikteringsfel-spektralsignalerna samplas under varje intervall för alstring av nämnda andra signaler.
Enligt ännu en aspekt på uppfinningen alstras de modifierade exciteringspulserna i talanalysatorn genom att man alstrar ett flertal 10 15 20 25 30 35 40 . enligt fig. 1. 8 0 0 812 4 5 - 6 u, exciterings-spektralkomponentsignaler motsvarande de förutbestämda frekvenserna ur nämnda tonhöjd-signalerna och tonande-signaler och ett flertal predikteringsfel-spektralkoefficientsignaler motsvarande de förutbestämda frekvenserna ur den för tonhöjden representativa signa- len och nämnda andra signaler. Exciterings-spektralkomponentsigna- lerna kombineras med predikteringsfel-spektralkoefficientsignalerna för alstring av de predikteringsfelkompenserande exciteringspulserna.
Uppfinningen skall i det följande närmare beskrivas i anslutning till på bifogade ritning med fig. 1 - 8 visade utföringsexempel.
Fig. 1 är ett blockschema över en talsignalkodningskrets som åskådlig- gör uppfinningen. Fig. 2 är ett blocksohema över en talsignalavkod- ningskrets som åskådliggör uppfinningen. Fig. 3 är ett blockschema över en predikteringsfelsignalgenerator som kan användas i anordningen Fig. U är ett blockschema över en talintervallparame- terkalkylator som kan användas i anordningen enligt fig. 1. Fig. 5 är ett bloekschema över en predikteringsfel-spektralsignalkalkylator som kan användas i anordningen enligt fig. 1. Fig. 6 är ett blockschema över en talsignal-exeiteringsgenerator vilken kan användas i anord- ningen enligt fig. 2. Fig. 7 är ett detaljerat blooksohema över predikteringsfel-spektralkoefficientgeneratorn i anordningen enligt fig. 2, och fig. 8 visar vågformer som åskådliggör arbetssättet för den i fig. Ä visade talintervallparameterkalkylatornt Detaljerad beskrivning En typisk talsignalkodningskrets för användning 1 anordningen enligt uppfinningen visas i fig. 1. I denna krets alstras en talsig- nal i talsignalkällan 101, vilken kan utgöras av en mikrofon, en telefonapparat eller en annan elektroakustisk omvandlare. Talsignalen s(t) från talsignalkällan 101 tillföres till filtrerings- och samp- lingskretsen 103, där signalen s(t) filtreras och samplas i en förut- bestämd takt. Kretsen 103 kan exempelvis innefatta ett lâgpassfilter med en gränsfrekvens av H kHz och en samplare som har en samplinga- frekvens av åtminstone 8 kHz. Signalsampelserien Sn tillföras till analog/digital-omvandlaren 105, där varje sampel omvandlas till en digital k°d Sn som är användbar för användning i kodaren. Analogldi- gital-omvandlaren 105 är dessutom anordnad att indela de kodade sig- nalsamplerna i på varandra följande tidsintervall eller ramar med en varaktighet av 10 ms. ' i Sisšnalsamnlerna Sn från analog/aiginai-ømvanøiaren 105 tillfö- res till ingången hos predíkteringsfelsignalgeneratorn 122 via för- dröjningsorganet 120 och till ingången hos intervallparameterkalkyla- 0 10 15 20 25 30 35 H0 8008245-6 5 torn 130 via ledningen 107. Parameterkalkylatorn 130 är anordnad att _ alstra en uppsättning signaler som karaktäriserar ingángstalet men som kan överföras med en väsentligt lägre bitfrekvens än själva talsigna- len. Sänkningen av bitfrekvensen erhålles tack vare att talet är kvasistationärt till sin natur under intervall om 10 till 20 millise- kunder. För varje intervall i detta omrâde kan man alstra en enda uppsättning signaler vilka representerar informationsinnehållet i detta intervall av talet. Det är välkänt för en faokman att de för talet representativa signalerna kan innefatta en uppsättning predikte- ringskoefficientsignaler jämte för tonhöjden och röstläget representa- tiva signaler. Predikteringskoefficientsignalerna karaktäriserar talorganet under talintervallet, under det att tonhöjds- och röst- lägessignalerna karaktäriserar stämbandspulsexciteringen för tal- organet.
Intervallparameterkalkylatorn 130 visas mera i detalj i fig. H.
Kretsen enligt fig. H innehåller ett styrorgan H01 och en processor H10. Processorn H10 är anordnad att ta emot talsamplerna sn 1 vara och ett av de på varandra följande intervallen och att alstra en uppsättning linjära predikteringskoefficientsignaler, en uppsättning reflexionskoefficientsignaler, en för tonhöjden representativ signal samt en tonande-signal vilka utgör svar på intervalltalsamplerna. De alstrade signalerna lagras i minnena H30, H32, H3H resp. H36. Proces- sorn H10 kan vara den av företaget CSP Incorporated under handels- benämníngen Macro-Arithmetic Processor System 100 marknadsförde anord- ningen eller också kan den innehålla andra processor- eller mikropro- cessoranordningar som är välkända för en fackman. Processorns H10 funktion styrs av permanent lagrad programinformation från de uteslu- tande för läsning utförda minnena (ROM-minnena) H03, H05 och H07.
Styrorganet H01 i fig. H är anordnat att indela varje 10 milli- sekunder långt talintervall i en serie om åtminstone fyra förutbestäm- da tidsperioder. Varje tidsperiod är reserverad för ett visst arbets- sätt. Arbetssätt-sekvensen åskådliggöres av vågformerna enligt fig. 8. Vågformen 803 i fig. 8 visar klockpulser CL2, vilka inträffar vid början av varje talintervall. Den klockpuls CL2 som inträffar vid fiidPUflkt6H 31 försätter styrorganet H01 i dess datainmatningsmod som åskádliggöres genom vågformen 805. styrorganet H01 anslutet till processorn och till talsignalminnet H09. Som svar på styrsignaler från styrorganet H01 överföres de 80 sampelkoder som är införda i talsignalminnet H09 under det närmast föregående 10 millisekunder långa talintervallet till dataminnet H18 Under datainmatningsmoden är * 10 15 20 25 30 35 Ä0 8GÛ8245~6 6 via in/ut-gränssnittkretsen N20. Under det att de lagrade 80 sampler- na för det närmast föregående talintervallet överföras till dataminnet H18, lagras det aktuella talintervallets sampler i talsignalminnet H09 via ledningen 107.
Efter det att överföringen av det närmast föregående intervallets sampler har införts i dataminnet B18, kopplar styrorganet H01 om till sitt predikteringskoefficient-arbetssätt som svar pà klockpulsen CL1 Vid Üidpuflktefl Ü2. Mellan tidpunkterna tg och t3 är styrorganet H01 kopplat till LPC~prcgramminnet H03 och till den centrala proces- sorn ü1U och den aritmetiska processorn N16 via styrorgan-gränssnittet Ä12. Sålunda är LPG-programminnet H03 kopplat till processorn 401.
Processorn 310 är anordnad att som svar på de permanent lagrade inst- ruktionerna i ROM-minnet ë03 alstra partial-korrelationskoefficient- Sišflalêf R = P1, rg, ..., r12 och linjära predikteringskoeffi- ßieflfißíäflalel' P- = H1, se, ..., an. Det är välkänt för en fackman att partial-korrelationskoefficientsignalen är negativa värdet av reflexicnskoefficienten. Signalerna R och A överföres från proces- sorn Ä10 till minnena Ä32 resp. H30 via in/ut-gränssnittet H20. De lagrade instruktionerna för alstring av reflexicnskoeffíoientsignalen I och den linjära predikteringskoefficientsígnalen i ROM H03 är förteck- nade i Fortran-språket i Bihang 1.
Det är välkänt för en fackman att reflexíonskoefficientsignalerna R alstras genom att man först bildar den kovarians-matris P vars termer är _ 1¶ ÛII, 80 i = Pm = Z snásm. m n=1 j=1, 2;.now3 och talkorrelationsfaktorerna 80 Ci - snsn_i 1 = 1, 2, ..,, 12 (2) n=1 FakÜ°”°Pnad51 t.o.m. g10 beräknas därefter enligt g1 i 01 S2 02 T . _ = . (3) °12 10 15 20 25 30 35 NO 8008245-6 7 där T är den undre triangulära matris som erhålles genom triangulär upplösning av '- [Pm] = r f* (u) Partial-korrelationskoefficienterna alstras sedan enligt I . ______5f=__._____ m . [co _ E85) gizll/Z n=i m = 1,2,....,12 (5) É% l 2 Co * sn n=1 VaPVïd 00 motsvarar den energi som förefinns i talsignalen i det 10 millisekunder långa intervallet. De linjära predikteringskoefficient- sisnalerna A = a1, az, ..., a12 beräknas ur partialkorrelations- k°effí°i8HfiSí8flalGPflfi Pm enligt den rekursiva formeln aí(m) = ai(m-1) + rmflm_l(m“1) (6) l,2,....,m-1 1,2,....,12 a°(o) = 1; i ' i Partialkorrelationskoefficientsignalerna H och de linjära predikte- ringskoefficientsígnalerna A, som alstras i processorn vid arbetssät- tet för alstring av linjära predikteringskoefficienter, överföras från dataminnet Ä18 till minnena Ä30 och N32 för senare användning.
Efter det att partialkorrelationskoefficientsignalerna R och de linjära predikteringskoeffioientsignalerna A har införts i minnena N30 Och H32 (Vid tidpunkten t3), avslutas arbetssättet för alstring av linjära predikteringskoefficienter, och arbetssättet för alstring av tonhöjdsperiodsignaler startas. Vid denna tidpunkt omkopplas styror- ganet H01 till sin tonhöjds-mod såsom framgår av vågformen 809. Vid detta arbetssätt är tonhöjdsprogramminnet 405 anslutet till proces- sorns H10 styrorgan-gränssnitt H12. Processorn 410 styrs då av de permanent lagrade instruktionerna i ROM-minnet H05 så-att en för tonhöjden representativ signal för det närmast föregående talinterval- let alstras som svar på talsamplerna i dataminnet N18 motsvarande det _' 8008245-6 10 15 20 25 30 35 H0 8 närmast föregående talintervallet. De permanent lagrade instruktio- nerna i ROM 405 är förtecknade i Fortran-språket i Bihang 2. Den för tonhöjden representativa signal som alstrats genom operationerna i den centrala processorn H14 och den aritmetiska processorn 416 överföres från dataminnet 418 till tonhöjdssignalminnet U3H via in/ut-gränssnit- tet n20- Vid tidpunkten tg införes den för tonhöjden representativa signalen i minnet N34, och tonhöjdperiod-arbetssättet avslutas.
Vid tidPUflkteH tu omkopplas styrorganet ÄO1 från tonhöjdperiod- -moden till tonande/tonlöst-moden såsom framgår av vågformen 811.
Mellan ßidfluflktevfla in; een u; är Ron-minnet nov anslutet till processorn H10. ROM ÄO7 innehåller permanent lagrade signaler motsva- rande en serie styrinstruktioner för bestämning av tonande/tonlöst i det närmast föregående talintervallet ur en analys av detta intervalls talsampler. Det permanent lagrade programmet i ROM H07 är förtecknat i Fortran-språket i Bihang 3. Processorn H10 är anordnad att som svar på dessa instruktioner i ROM H07 analysera talsamplerna i det närmast föregående intervallet i enlighet med vad som beskrivits i artikeln "A Pattern-Recognition Approach to Voiced-Unvoiced-Silence Classification With Applications to Speech Recognition" av B. S. Atal och L. R.
Rabiner i IEEE Transactions on Acoustics, Speech, and Signal Proces- sing. vol. ASSP-2H, nr 3, juni 1976. En signal V alstras då i den aritmetiska processorn H16, vilken signal är karaktäristisk för talin- tervallet såsom ett tonande eller ej tonande intervall. Den resulte- rande tonande-signalen tillföres till dataminnet 418 och överföras därifrån till tonande-signalminnet H36 via in/ut-gränssnittet H20 vid tidpunkten Ü5. Styrorganet H01 kopplar bort ROM N07 från processorn 310 Vid fiídpunkïêfl fi5 och tonande-signalalstringsmoden avslutas i enlighet med vad som framgår av vågformen 811.
Reflexionskoefficientsignalerna R och de tonhöjds- -representativa signalerna P och V från minnena H32, 434 och 436 tillföras till parametersignalkodaren 1H0 i fig. 1 via fördröjnings- organen 137, 138 och 139 som svar på den klockpuls CL2 som inträffar vid tidpunkten hö. Ehuru en efter-bildning av det tillför-da talet kan syntetiseras ur reflexionskoefficienten, tonhöjdssignalen och tonande-signalen, som erhålles från parameterkalkylatorn 130, låter det som resultat erhållna talet ej som en naturlig mänsklig röst. och tonande- Att -det sålunda ur från parameterkalkylatorn 130 erhållen reflexionskoef- ficient, tonhöjdssignal och tonande-signal framställda talet låter artificiellt är i första hand resultatet av fel i de predikterande reflexionskoefficienter som alstras i parameterkalkylatorn 130. I 10 15 20 25 30 35 NO 8008245-6 9 enlighet med uppfinningen detekteras dessa predikteringskoeffícíentfel i predikteringsfel-signalgeneratorn 122. Signaler som är representa- tiva för predikteringsfelspektret för varje intervall alstras och kodas i predikteringsfelspektralsignalgeneratorn 124 resp. i spektral- signalkodaren 126. Kodare-spektralsignalerna multiplexeras tillsam- mans med de signaler som är karaktäristiska för reflexíonskoefficíen- ten, tonhöjden och egenskapen tonande/tonlöst från parameterkodaren 140 i multiplexern 150. Tillförandet av predikteringsfel-spektralsig- nalerna i den kodade utgångssignalen från talkodaren i fig. 1 för varje talintervall möjliggör kompensation för felen i de linjära predikteringsparametrarna under avkodningen 1 talavkodaren 1 fig. 2.
Den som resultat erhållna talefterbildningen från avkodaren i fig. 2 låter som naturligt tal.
Predikteringsfelsignalen alstras i generatorn 122, vilken mera i detalj visas i fig. 3. I kretsen enligt fig. 3 mottages signalsamp- lerna från A/D-omvandlaren 105 på ledningen 312 efter det att signal- samplerna har fördröjts ett talintervall i fördröjningsorganet 120.
De fördröjda signalsamplerna tillföres till skiftregistret 301, vilket är anordnat att skifta de inkommande samplerna i CL1-klooktakten 8 kHz. Varje steg i skiftregistret 301 ger en utsignal till ett av multipliceringsorganen 303-1 t.o.m. 303-12. De linjära predikterings- koeffieientsignalerna för de intervall a1, az, ,,_, 312 som motsvarar de sampler som tillföres till skiftregistret 301 tíllföres till multiplioeringsorganen 303-1 t.o.m. 303-12 från minnet N30 via ledningen 315. Utgångsstorheterna från multipliceringsorganen 303-1 t.o.m. 303-12 summeras 1 adderarna 305-2 t.o.m. 305-12, så att ut- gångsstorheten från adderaren 305-12 är den predikterade talsignalen 12 2 aisn-i i=1 Subtraktionsorganet 320 tar emot de på varandra följande talsig- flalsfimpleffla Sn från ledningen 312 och det predikterade värdet för de på varandra följande talsamplerna från utgången hos adderaren 305-12 och avger en skillnadssignal dn vilken motsvarar pnenikte- ringsfelet.
Serien predikteringsfelsignaler för varje talintervall tillföres till predikteringsfel-spektralsignalgeneratorn 12U från subtraherings- organet 320. Spektralsignalgeneratorn 12U, som mera i detalj visas i fig. 5, innehåller spektralanalysatorn 504 och spektralsamplaren 513.
Som svar på varje predikteringsfelsampel du på ledningen 501 avger Å sn = 10 15 20 25 36 35 40 8008245-6 10 spektralanalysatorn 504 en uppsättning om 10 signaler, e(f1), @, ..., e; för en spektralkomponent av predikteringsfelsignalen. nentfvekvenserna f1, fg, ..., f10 är förutbestämda och fasta.
Dessa förutbestämda frekvenser är valda så att de likformigt täcker talsignalens frekvensomrâde. För varje förutbestämd frekvens fi tillföres serien av predikteringsfelsignalsampler dn för galingep- vallet till ingången hos ett kosinusfilter vars mittfrekvens fk Qch PUlSSVaP hk är givna av sambandet hk=(2/o,5u)(o,5ß-0,16 eostzfï foki) eos fiki Var och en av dessa signaler är representativ Spektralkompo- (8) där T_E samplingsintervallet = 125/usek, fo E frekvensintervallet mellan filtermittfrekvenserna = k = 0,1, ..., 26. och till ingången hos ett sinusfilter med samma mittfrekvens vars pulssvar hå är givet av sambandet h¿ = <2/o,su> sin fíkæ <9) Kosinusfiltret 503~1 och sinusfiltret 505-1 har samma mittfrek- VGUS f1, vilken kan vara 300 Hz. Kosinusfiltret 503-2 och sinus- fíltret 505-2 har en gemensam mittfrekvens fa, vilken kan vara 309 Hz, och kosinusfiltret 503-10 och sinusfiltret 505-10 har samma mitt- ffekvenfl f10, vilken kan vara 3000 Hz.
Utgångssignalen från kosinusfiltret 503-1 multipliceras med sig själv i kvadreringskretsen 507-1, under det att_utgängssignalen från sinusfiltret på liknande sätt multipliceras med sig själv i kvadre- ringskretsen 509-1. Summan av de kvadrerade signalerna från kretsarna 507-1 och 509-1 bildas i adderaren 510-1, och kvadratrotutdragnings- kretsen 512-1 är anordnad att alstra den spektralkomponentsignal som m°tSVaPaP fP@kVenSen f1. Analogt samverkar filtren 503-2, 505-2, I kvadreringskretsarna 507-2 och 509-2, adderingskretsen 510-2 och kvadratrotutdragningskretsen 512-2 för att bilda spektralkomponenten °(f2) motsvarande frekvensen fa. På liknande sätt erhålles spekt- ralkomponentsignalen för den förutbestämda frekvensen f10 från kvadratrotutdragningskretsen 512-10. Predíkteringsfelspektralsigna- lerna från utgångarna hos kvadratrotutdragningskretsarna 512-1 t.o.m. 512-10 tillföras till respektive samplingskretsar 513-1 t.o.m 513-10.
I varje samplingskrets samplas predikteringsfelspektralsignalen vid slutet.av varje talintervall av klocksignalen CL2 och lagras i denna krets. Uppsättningen predikteringsfel-spektraisignaler från samp- 300 Hz lingskretsarna 513-1 t.o.m. 513-10 tillföres parallellt till spektral- 10 15 20 25 30 35 NO 8008245-6 11 signalkodaren 126, vars utgångssignal tillföras till multiplexern 150. På detta sätt mottar multiplexern 150 kodade reflexionskoeffici- entsignaler R samt tonhöjds- och tonande-signaler P resp. V för varje talintervall från parametersignalkodaren 1üO och den mottar även de kodade predikteringsfelspektralsignalerna c(fn) för Samma ingepvall från spektralsignalkodaren 126. De till multiplexern 150 tillförda signalerna definierar talet i varje intervall i form av en multiplexe- rad kombination av parametersignaler. De multiplexerade parametersig- nalerna överföres via kanalen 180 med en mycket lägre bitfrekvens än de kodade 8 kHz talsignalsampler ur vilka parametersignalerna här- leddes.
De multiplexerade kodade parametersignalerna från kommunikations- kanalen 180 tillföres till talavkodningskretsen i fig. 2, där en efterbildning av talsignalen från talkällan 101 ástadkommes genom syntes. Kommunikatíonskanalen 180 är ansluten till ingången hos demultiplexern 201 vilken är anordnad att skilja ut de kodade parame- tersignalerna för varje talintervall. De kodade predikteringsfel- spektralsignalerna för intervallet tillföres till avkodaren 203. Den kodade tonhöjdsrepresentativa signalen tillföras sedan till avkodaren 205. Den kodade tonande-signalen för intervallet tillföres till avkodaren 207, och de kodade reflexionskoefficientsignalerna för intervallet tillföras till avkodaren 209.
Spektralsignalerna från avkodaren 203, den för tonhöjden repre- sentativa signalen från avkodaren 205 och den tonande-representativa signalen från avkodaren 207 lagras i minnena 213, 215 resp. 217.
Utgångsstorheterna från dessa minnen kombineras sedan i exeíterings- signalgeneratorn 220 vilken tillför en predikteringsfelkompenserande exciteringssignal till ingången hos den linjära predikteringskoeffici- entsyntetisatorn 230. Till syntetiseraren tillförs de linjära predik- teringskoeffieientsignalerna a1, az, ,__, a12 från koefficient- omvandlaren och minnet 219, vilka koefficienter är härledda ur avko- darens 209 reflexionskoefficientsignaler.
Exeiteringssignalgeneratorn 220 visas mera detaljerat i fig. 6.
Kretsen enligt fig. 6 innefattar exeiteringspulsgeneratorn 618 och exciteringspulsformaren 650. Exciteringspulsgeneratorn tar emot tonhöjdsrepresentationssignalerna från minnet 215, vilka signaler tillföres till pulsgeneratorn 620. Som svar på tonhöjdsrepresenta- tionssignalerna avger pulsgeneratorn 620 en serie likformiga pulser.
Dessa likformiga pulser är åtskilda av tonhöjdsperioderna, vilka definieras av tonhöjdsrepresentationssignalen från minnet 215. Ut- ' 8008245-6 10 15 20 25 30 35 40 12 _ gângssignalen från pulsgeneratorn 620 tillföres till omkopplaren 62ħ till vilken även tillföres utgångssignalen från vittbrusgeneratorn 622. Omkopplaren 624 är anordnad att reagera på den tonande-represen- tativa signalen från minnet 217. I det fall att der tonande-represen- tativa signalen är i ett tillstånd som motsvarar ett tonande inter- vall, ansluts pulsgeneratorns 620 utgång till excíteringsformnings- kretsens 650 ingång. I det fall att den tonande-representativa signalen anger ett tonlöst intervall, ansluter omkopplaren 623 vitt- brusgeneratorns 622 utgång till exciteringsformningskretsens 650 ingång.
Exeiteringssignalen från omkopplaren 62% tillföres till spektral- komponentgeneratorn 603, vilken generator innehåller ett par filter för varje förutbestämd frekvens f1, fa, ___, f10_ Filteppapeg innehåller ett kosinusfilter med en karaktäristika i enlighet med ekvation 8 och ett sinusfilter med en karaktäristika i enlighet med ekvation 9. Kosinusfiltret 603-11 och sinusfiltret 603-12 avger spektralkomponentsignaler för den förutbestämda frekvensen f1_ Analogt avger kosinusfiltret 603-21 och sinusfiltret 603-22 spektral- 2 komponentsignalerna för frekvensen fa, Qch på Samma säg; avger kosinusfiltret 603-n1 och sinusfiltret 603-n2 spektralkomponentsigna- lerna för frekvensen f10_ Predikteringsfelspektralsignalerna från talkodningskretsen enligt fig. 1 tillföres till filteramplitudkoefficientgeneratorn 601 tillsam- mans med den för tonhöjden representativa signalen från kodaren.
Kretsen 601, som i detalj är visad i fig. 7, är anordnad att alstra en uppsättning spektralkoefficientsignaler för varje talintervall. Dessa spektralkoefficientsignaler definierar spektret för predikteríngsfel- signalen för talintervallet ifråga. Kretsen 610 är anordnad att kombinera de spektrala komponentsignalerna från spektralkomponentgene- ratorn 603 med spektralkoefficientsignalerna från koefficientgenera- torn 601. Den kombinerade signalen från kretsen 610 är en serie predikteringsfelkompenserande exciteringspulser som tillföras till syntetiseringskretsen 230.
Koefficientgeneratorkretsen enligt fig. 7 innehåller ett grupp- fördröjningsminne, en fassignalgenerator 703 samt en spektralkoeffici- entgenerator 705. Gruppfördröjningsminnet 701 är anordnat att lagra en uppsättning förutbestämda fördröjningstider 23, mä, ,___ Tfio. Dessa fördröjningar har valts experimentellt genom en analys av representativa talfragment. Fördröjníngarna motsvarar en median- gruppfördröjning som är karaktäristisk för ett representativt tal- 10 15 20 25 30 35 #0 8008245-6 . 13 fragment och som har visat sig vara användbar även för andra talfrag- ment; Fassignalgeneratorn 703 är anordnad att alstra en grupp fassigna- 19” 91, 02, ..., 010 i enlighet med ' øiaq/p 1=1,2, ..., 10 (10) som svar på den för tonhöjden representativa signalen från ledningen 710 och gruppfördröjningssignalerna Qf, Tš, ___, 210 från minnet 701. Som framgår av ekvation 10 är faslågena för spektralkoef- ficientsignalerna en funktion av gruppfördröjningssignalerna och tonhöjdsperiodsignalen från talkodaren 1 fig. 1. Fassignalerna 01, ..., 010 tillföres till spektralkoefficientgeneratorn 705 via ledningen 730. Koefficientgeneratorn 705 mottar även predikterings- felspektralsignalerna från minnet 213 via ledningen 720. En spektral- koefficientsígnal alstras för varje förutbestämd frekvens i generatorn 705 i enlighet med Hí,1 = C(f1)C0S øi 02, i = 1, 2, ..., 10 och H1,2 = C(fi) sin øi (11) Som framgår av ekvationerna 10 och 11 kan fassignalgeneratorn 703 och spektralkoefficientgeneratorn 705 innehålla aritmetiska kretsar av för faokmannen välkända typer.
Utgángssignalerna från spektralkoefficientgeneratorn 705 tillfö- res till kombineringskretsen 610 via ledningen 7H0. I kretsen 610 multipliceras spektralkomponentsignalen från kosinusfiltret 603-11 med SDekfiP8lk°effi°ieflfisißflalefl 51,1 i multipliceraren 607-11 under det att spektralkomponentsignalen från sinusfiltret 603-12 multipliceras med spektralkveffiflienten 111,2 1 multipiieeraren 607-12. På samma sätt är multipliceraren 607-21 anordnad att kombinera spektralkompo- nentsignalen från kosinusfiltret 603-21 och spektralkoefficientsigna- len H2,1 från kretsen 601 under det att multipliceraren 607~22 är anordnad att kombinera spektralkomponentsignalen från sinusfiltret 603-22 och spektralkoefficientsignalen H2,2_ på liknande Sätt kombineras spektralkomponent- och spektralkoefficientsignalerna av förutbestämda ffekvenfief f10 i multiplicerarna 607-n1 och 607-n2.
Utgångssignalerna från multiplicerarna i kretsen 610 tillföras till adderingskretsarna 609-11 t.o.m. 609-n2 så att den kumulativa summan från alla multiplicerare alstras och finns tillgänglig på ledningen 670. Signalen på denna ledning 670.kan representeras av 10 15 20 25 30 ”35 40 8008245-6 114 1o g enn) = 2 c(fk)' eos (zíïfkt - øk) (12) k=1 där C(fk) representerar amplituden för varje förutbestämd frekvens- komponent, fk är den förutbestämda frekvensen för kosinus- och sinusfiltren och 0 är fasläget för den förutbestämda frekvenskomponen- ten i enlighet med ekvation 10. Exoiteringssignalen enligt ekvation 12 är en funktion av predikteringsfelet för det talíntervall ur vilket den härletts och är ägnad att kompensera för fel i de linjära predik- teringskoeffioienter som tillföres till syntetisatorn 230 under det motsvarande talintervallet.
LPG-syntetisatorn 230 kan innehålla en för faokmannen välkänd allpolfilter-kretsanordning för att genomföra LPC-syntesen i enlighet med vad som beskrivee i artikeln "Speech Analysis and Synthesis by Linear Prediction of the Speech Wave" av P. S. Atal och S. L. Hanauer i JOURNAL OF THE ACOUSTICAL SOCIETY OF AMERICA, vol 50, del 2, sid 637-655, augusti 1971. Som svar på både predikteringsfelkompense- rings-exciteringspulserna och de linjära predikteringskoefficienterna för de på varandra följande talintervallen alstrar syntetiseraren 230 en serie kodade talsignalsampler Ek, vilka sampler tillföres till D/A-omvandlarens 240 ingång. D/A-omvandlaren 240 är anordnad att alstra en samplad signal šg vilken är en efterbíldníng av den till talkodningskretsen i fig. 1 tillförda talsignalen. Den samplade signalen från omvandlaren 240 lågpass-filtreras i filtret 250, och den analoga efterbildnings-utgångssignalen §(t) från filtret 250 erhålles från högtalaranordningen 254 efter förstärkning i förstärkaren 252. u--n-n--n-u--uu--n-u- soos245f6 15 ' j nIHANG 1 GENERATE LPC PARAMETERS - MAIN §UBROUTINE PROGRAM NEEDS INPROD SUBROUTINE LPCPAR COMMON/BLKSIG/S[320),SP(80) COMMON/BLKPAR/LPBAK,RMS,VUV,R(l0),A(lÛ),PS,PE COMMON/BLKSCR/PQ10,l0),T(l0,10),C[l0),Q[10),W(101 10 s(1) ........ sçszo) ARE svsscu sAMPLss s(1s1) ........ sç1so) Ana sAMPLss Fann rus Pasvxous FRAME s(161) ........ s(z4o) ARE sAMPLEs FROM THE cuanßuf FRAME 1s comvuwa ENERGY 0? svascn SAMPLES ENERGY = Ps _ ' cAL1 1NPaonçs(161),sç1e1),sq,vs) zo GENERATH svzscn coansLAT1oN coEFF1c1sNrs _ c(1) .... c(1o) no 1 1 = 1; 10 , 1 CALL INPRon(s(161),s(1e1-1),so,c(1)) 25 GENERATE PARTIAL CORRELATIONS AND PREDICTOR COEFFICIENTS EE=PS DO 100 I = 1, 10 30 GENERATE CGVARIANCE MATRIX ELEMENTS P(I,J) Do 20 J =-I, 10 xx = o.o IF (1 .EQ. 1 .ANn. 1 .sQ. J) xx = Ps IF (1 .EQ. 1 .AND. J .GT. 1) xx = c(J-1) ss IF (1 .cT. 1) xx = P(1-1, J-1) zo P(I,J) = xx + s(161-1)*s(161-J) - s(241-I)*s(241-J) 8008245~6 \ 'I 16 , ' couvfiaw To TRIANGULAR MATR1x T ^ wanna P = T*r çTaANsPoss); no 40 J = 1,1 su - P(J,1) 5 K = 1 = s 13 (K .ßQ. J) eo To 4 sm = än _ T(I,x)*TçJ,x) K = K + 1 co ro 3' 1o 4 -IP (1 LEQ. J) wçJ) = 1/sqnrgsm) ' IF ç1.Nn.J) T(1,J) = sM*wiJ) 40 conrxuun - 1s ' GENERATE PARTIAL coaRaLAT1oN nçx) sm = c(x) IF (1 .ßQ. 1) co To s no so J e 2,1 ' so sm = sm ~ T(1,JÄ1)*Q(q-1) 20 s Qçz) é sM*w(I) IF (I .EQ. 1) Go To so En = za - Q(I-1)*Q(1-1) _80 RCI) = -QCIJ/SQRTCEE) 25 GENERATE PREDICTOR COEFFICIBNTS A(1)'... A(I) A(I) = R(I) IF (I .EQ. 1) G0 TO 100 K = 1 6 IF (K .GT. I/2) G0 T0 100 30 TI = ACK) TJ = A(I-K) ALKJ = TI + R(1)*TJ A(I-K) =-Tq + R(I)*TI K = K + 1 35 G0 TO 6 100 CONTINUE 17 COMPUTB PREDITION ERROR PE=0 DO 1610 N = l61,240 DN = S(N) L = N - 1 DO 10 I = 1,10 DN = DN + A(I)*S(L) 10 L = L - 1, 1610 PE=PE+DN*DN RETURN END comvurfl INNHR Pnønucr SUBROUTINE 1NPRoD(s,Y,N,Ps) nIMaNsIoNAY(N),s(N) Ps = 0.0 no 1 I = 1,N 1 Ps = Ps +s(1)*Y(x) RETURN Enn 8008245-6 8008245-6 10 15 20 25 30 35 100 18 BIHANG 2 Prwcfl ANALYSIS - MAIN PRocRAM suBRoUTINE NEEDS SUBROUTINES - LPFILT PITCHP Movß INPRQD CPSTRM SELMAX INTRPL'NoRmEQ SUBROUTINE PITCH COMMON/BLKSIG/S(320),SP(80) COMMON/BLKPAR/LPEAK,RMS,VUV,RC(10),AC(l0),PS,PE LOGICAL INIT DATA INIT/T/ IF(,NOT.INIT)GOTOl00« SET UP 1-KHZ LOWPASS FILTER COEFFICIENTS , FOR FILTERING SPEECH AND CEPSTRUM I -CALL LPFILT(HL,666,333) cALL LPFïLT(nT,o,1ooo) Iu1r=.F.
CONTINUE LOW-PASS FILTER SPEECH TO l KHZ AND STORE IN SP n=321 Do3I=6i,ao cALL :NPRon(š(N-48),flL,4ä,sP(1)) u=n+4 _ COMPUTE PITCH PERIOD CÅLL PITCHP -A 10 15 20 25 30 ' 35 ll 19 COMPUTB RMS VALUE SM=0 DO4I=l6l~LPEAK,l6l SM=SM+S(I)**2 RMS=SQRT(SM/LPEAK) MOVE SPEECH SAMPLES FOR PROCESSING IN THE NEXT INTERVAL CALL MOVE(S(8l),S,240) CALL MOVE(SP(2l),SP,60) RETURN END FIND PITCH PERIOD BY CEPSTRAL PEAK PICKING SUBROÜTINE PITCHP common/enxsxc/s(3z9>,sP(ao) common/BLKPAR/LPEAK,nMs,vuv,Rc(lo),A(1o),Ps,Ps common/BLKLPF/n(4a),aR(16) ' Dïmßnsxou P(31),c(31) common/snkscn/a(3z) compuws AuToconRsLAT1oN Fuucwxou or spzzcn no11x=1,a2 CALL INPROD(SP,SP(I),8l-I,R(I)) no31=z,a2 R(I)=R(I)/R(l) R(1ï=1 COMPUTE PREDICTOR COÉFFICIENTS CALL NORMEQ(R(2),P,3l,C) CON=0.97 FAC=CON DO 125 K=2,32 8008245-6 8008245-6 20 xM1=xx LM1=LX 1F(Lm1.LT.Lm) coro zoo 1F(xfi1.ca.(2.*xm2)) sowo zoo Lma=Lm1/2 IF(IAßs(1m-LMa).GT.2) Goro zoo Goro zso sToRE PITCH IN LPEAK CONTINUE LPEAK=LM1 RETURN END coMPuTE PREDICTOR CQEFFICIENTS FROM AuTocoRnsLAT1oNs susnouwxus uoRmzQ(A,x,N,w) Dzmsusïou A(1),x(1),T(1} M=N D05I=l,M - X(I+l)=0 T(I)=0 X(l)=l.
X(2)=-Å(l) T(l)=-A(l) _ D0'3 I=2,N_ ~ Sl=§(I) 150 s 10 zoo 15 zo s 25 30 as 4 sz=1. _ DO 4 J=l,I-l Sl=Sl+A(I-J)*X(J+l) S2=S2+A(J)*X(J+l) IF(S2.LE.(l.0E-7)) RETURN M=I 10 15 20 25 30 35 125 '20 10 300 250 21 P(K)=FAC*P(K) FAC=FAC*CON COMPUTE CEPSTRUM CALL CPSTRM(P,(32),C,(32)) LOCATE TWO LARGEST PEAKS OF CEPSTRUM L=l CALL SELMAX(C(L+l),(3l-L),XMl,LMl) IF(XMl.GT.0.) GOTO 10 LPEAK=l RETURN LMl=LMl+L XM2=0.
LM2=0 DO l I=L+l,32 IF(C(I).LE.0.) GOTO l IF(I.EQ.LM1) GOTO l IF(C(I).GT.C(I-1).AND.C(I).GT.C(I+l)) GOTO 2 GOTO l ' 'IF(C(I).LE.XM2) GOTO l xM2=c(If LM2=: couwxuuß INTERPOLATE TRUE VALUES OF CEPSTRAL PsAxs CALL 1NTRPL(c,32,a,16,4,xM1,LM1) CALL INTRPL(C,32,H,16,4,XM2,LM) 1FgLM1.LT.LM.ANn.xm1.es.xM2) eoro zoo IF(xmI.Gz.xMz) GoTo 150 I \ ssnscr THE Tnuß PEAR xx=xM2 Lx=LM2 LM2=LM1 ' xM2=xm1 8008245-6 10 15 20 25 30 as". _%= soos24s-6 22 ac=-sl/sz T(I)=Rc x(1+1)=Rc no 1 J=1,I/2 T1=x(J+1) TJ=x(I-J+1) x(J+1)=wI+nc*TJ l X(I~J+l)=TI*RC+TJ CONTINUE RETURN 'END TRANSFORM POLYNOMIAL COEFFICIENTS BY NEWTON FORMULA SUBROUTINE CPSTRM(P,LP,S»LS) DIMENSION P(LP),S(LS)_ S(l)=l.
NP=LP-1 XN=l./NP ~S(2)=-P(2)*XN IF(Ls.LEÄ2) Rsrunu Du 1 m+3,Ls h SM=0.
IF(M.LE.LP) SM=-(M-l)*P(M)*XN JJ86AA=MINO( (M~2),NP) DO 2 K=1,JJ86AA 2 sM=sM=P(K+;)*s(M-K) s(M)=sm_.
RETURN END SELECT MAXIMUM VALUE SUBROUTINE SELMAX(X,LX,SM,LM) 10 15 20 25 30 35 100 546 '100 405 23 B = -1.0E+37 Do 2 1=1,Lx. 1F(x(1).LT.ß) soro 2 ß=x(1) LL=1 coNTINus LM=LL 0 xM=í RETURN END FIND PEAK AFTER INTERPOLATION SUBROUTINE INTRPL (C,LC,H,IH,IR,XM,LM) DIMENSION C(LC),H(LH),T(30) L=LH/2 K1=(LM-2.o)*1R+1 K2=(LM)*IR+1.s ' xz=M1Noçx2,(Lc*IR-L)J no 1oo x=x1,xz KL=K+L N=(Ku-1)/1R+1 Kx=xL-(N~1)*1R cI=H(KK)*c(N) N=N-1 Kx=xx+1R IF(xx.cT.LH) GoTo c1=c1+H(xx)*c(N) cowo z TLK-x1+1)=cI 100 CALL SELMAX(T,(K2-Kl+l),XM,LM) LM=LM+K1-2 RETURN END 8008245-6 8008245-6 10 15 20 25 30 35 24 GENERATE coßvsrcxzuws oF A Low-PASS ' FILTER - SUBROUTINE LPFILT(H,F0,DF) DIMENSION H(l) p1¥3.141s9z6s39 Mm=15ooo/nF+o.s -T=-1/DF 100 -ll 12 300 31 M=1 ïI=T ns1N=Fo/(o.s*nF)+o.s HW=0.54+0.46*COS(PI*DF*T) Hc=o.s , r=Fo F=F+nF*o.5 L=1 ¶Is(L.GT.Ns1N)Gowø12 nc=nc+cos<2*P:*s*w) L=L+1 F=F+DF*0.$ Gowo11 n(m)=aw*ac 1F(M.cs.MM)Go:ø3oo T=m*o.ooo12s+T1 M=M+l GOTOIOO sm=o.
PFm=Pr*(Fo) no 31 I=1,M sM=sm + n(I)*cos(PFM*((I-I)*o.ooo12s+T1)) ,CONTINUE DO 3 I=l,M H(I)=H(I)/SM 10 15 10 25 RETURN END nova AN ARRAY sußnourrnz nova (x,Y,N) Drmßuszon x(N),y(u) D0lI=1,N Y(I)=X(I) nzrunu sun COMPUTE INNER PRODUCT susnouwxus 1NPaon(s,y,N,Ps) nrmssuxou y,s(u) ps = o.o no 1 1 = 1,u Ps = Ps + s<1)*Y(1) Rzrunu ann 8008245-6 8008245-6 10 15 20 25 30 35 25 .
BIHANG 3 'VOICED-UNVOICED ANALYSIS - MAIN SUBROUTINE PROGRAM NEEDS 3 SUBROUTINES ~ VUVDEC VUVPAR ZERCRS SUBROUTINE VUVANL_ COMMON/BLKSIG/S(320),SP(80) COMMON/BLKPAR/LPEAK,RMS,VUV,R(lO}A(l0),PS,PE CALL VUVDEC RMS=SQRT(PS/80) RETURN END VOICED-UNVOICBD DECISION BY LIN PRED SUQROUTINE VUVDEC common/BLKSIG/s(32o),sp(so)' common/BLKPAR/LPzAK,nms,vuv,a(10),A(1o),Ps,Pa .INTEGER VUV common/šßxwæs/w(s,s,2;,u(s,2),sn(s,z> nzmsusron Q(s),c COMPUTE VOICED-UNVOICED PARAMETERS' Q = PARAMETERS CALL VUVPAR(Q) ívorczn-unvoxcsn-srLsucs nrcrszou no zo x=1,2 no 21 1é1,s¶ '21- crn=-v vsvfrno D(K)=0 . no 22 1=1,s no 22 J=1,s 10 15 20. 25 30 35 22 20 8008245-6 27 D(K)=D(K)+W(I,J,K)*C(I)*C(J) D(K)=-D(K) CONTINUE IF(D(l).GT.D(2)) VUV=0 IF(D(l).LE.D(2)) VUV=l RETURN END COMPUTE PARAMETER5 FOR VUVDEC SUBROUTINE VUVPAR (Q) DIMENSION Q(5) COMMON/BLKSIG/S(320),SP(80) _ COMMON/BLKPAR/LPEAK,RMS,VUV,R(l0),A(l0),PS,PE comvurß PARAMzTERs - Q(1) ..... Q(5o Nzsa = Numsßa or zsao caossrucs Ps = svsscu ENERGY ~ Ps = Pnznzcrrou Eanon ENERGY A(1) = FIRST Pnßnxcæon cosrr - R(1) = Fzasr conazLATIo~ ' CALL zsncR§(s,1s1,24o,Nzsa) Q(1)=NzER Q(3)=1o.*ALoG1o(1.oß-5+Ps*o.o12s) Q(2)=Q(3)-1o.*ALoG1o(1.oE-6+o.o125*Pß) Q(4)=A (l) Q(5)=R(l) RETURN END COMÉUTE ZEROCROSSINGS FOR UNVOICED/VOICED DECISIQN SUBROUTINE ZERCRS (S,LP,NS,NZER) DIMENSION S(l) NZER=0 SPREV=S(LP-1) 8008245-6 28 no 1 x=LP,Ns sPnss=s(x) _ IF(sPnss.LT.o..ANn.sPRßv.Lr.o.) Gowo 1 1F(sPRßs.GT.o..ANn.sPREv.GT.0.) GoTo 1 5' 1Nzßn=NzsR+1 1 1 sPnEv=sPaEs RETURN END 10

Claims (10)

800 - 29 8245 6 Patentkrav 7
1. Sätt att behandla en talsignal, vilket sätt innefattar förfa- ringsstegen att man underkastar talsignalen en analys som innefattar indel- ning av talsignalen i konsekutiva tidsintervall, alstring av en uppsättning första signaler vilka är representativa för predikte- ringsparametrarna för den i intervall indelade talsignalen, en för tonhöjden representativ signal samt en för egenskapen tonande/tonlös representativ signal, i det följande kallad tonande-signal, som svar på talsignalen i varje intervall; att man alstrar en signal som motsvarar predikteringsfelet för nämnda talintervall och vilken utgör svar på dels intervall-tal-sig- nalen och dels intervallets nämnda första signaler; samt att man syntetiserar en efterbildning av talsignalen och därun- der alstrar en exciteringssignal som utgör svar på nämnda för ton- höjd representativa signal och nämnda tonande-signal och alstrar en efterbildning av talsignalen vilken utgör svar på både exciterings- signalen och nämnda första signaler, k ä n n e t e c k n a t av att analyseringen av talsignalen dessutom innefattar förfaringssteget att man alstrar en uppsättning andra signaler vilka är representa- tiva för spektret av intervall-prediketeringsfelsignalen som svar på predikteringsfelsignalen; varjämte förfaringssteget att man alstrar en exciteringssignal innefattar att man alstrar en predikterings- fel-kompenserande exciteringssignal vilken utgör svar på dels den för tonhöjden representativa signalen, dels tonande-signalen och dels nämnda andra signaler.
2. Sätt enligt kravet 1, k ä n n e t e o k n.a t av att förfa- ringssteget att man alstrar en predikteringsfel-kompenserande exci- teringssignal innefattar att man alstrar en första exciteringssignal som utgör svar på den för tonhöjden representativa signalen och tonande-signalen; samt att man alstrar den första exciteringssigna- len som svar pá nämnda andra signaler för att bilda den predikte- ringsfel-kompenserande exciteringssignalen.
3. Sätt enligt kravet 2, k ä n n e t e c k n a t av att alst- ringen av den första exciteringssignalen innefattar att man alstrar en serie exciteringspulser vilka utgör svar på både den för tonhöjd representativa signalen och tonande-signalen; och att alstringen av den första exciteringssignalen innefattar att man modifierar excite- ringspulserna som svar på nämnda andra signaler för alstring av en serie predikteringsfelkompenserande exciteringspulser. 8 0 0 8 2 4 5 - 6 30
4. H. Sätt enligt kravet 3, k ä n n e t e c k n a t av förfarings- steget att man alstrar en andra signal innefattar att man bildar ett flertal spektrala predikteringsfelkompenserande signaler, var och en för en förutbestämd frekvens, vilka utgör svar på interva1l-predik- teringsfelsignalen; samt att man samplar nämnda spektrala intervall- -predikteringsfelsignaler under intervallet för alstring av nämnda andra signaler. '
5. Sätt enligt kravet 4, knä n n e t e c k n a t av att modifi- eringen av exciteringspulserna innefattar att man alstrar ett fler- tal exiterings-spektralkomponent-sígnaler motsvarande nämnda förut- bestämda frekvenser som svar på nämnda första exciteringspulser; samt att man alstrar ett flertal predikteringsfel-spektralkoeffioi- entsignaler motsvarande nämnda förutbestämda frekvenser som svar på -dels de för tonhöjden representativa signalerna och dels nämnda andra signaler, samt att man kombinerar nämnda exoiterings-spektral- komponentsignaler med predikteringsfel-spektralkoefficientsignalerna för att bilda nämnda predikteringsfelkompenserande exoiteringspulser.
6. Anordning för genomförande av sättet att behandla en talsig- nal, vilket sätt innefattar förfaringsstegen att man underkastar talsignalen en analys som innefattar indel- ning av talsignalen i konsekutiva tidsintervall, alstring av en uppsättning första signaler vilka är representativa för predikte- ringsparametrarna för den i intervall indelade talsignalen, en för tonhöjden representativ signal samt en för egenskapen tonande/tonlös representativ signal, i det följande kallad tonande-signal, som svar på talsignalen i varje intervall; att man alstrar en signal som motsvarar predikteringsfelet för nämnda talintervall och vilken utgör svar på dels intervall-tal-sig- nalen och dels intervallets nämnda första signaler; samt att man syntetiserar en efterbildning av talsignalen och därun- der alstrar en exciteringssignal som utgör svar på nämnda för ton- höjd representativa signal och nämnda tonande-signal och alstrar en efterbildning av talsignalen vilken utgör svar på både exoiterings- signalen och nämnda första signaler, enligt kravet 1, vilken anord- ning innefattar, dels en talanalysator som innehåller organ för att indela en inkommande uaisignai i tiasintervaii; ' dels organ som är anordnade att som svar på talsignalen i varje intervall alstra en uppsättning första signaler vilka är representa- tiva för predikteringsparametrarna för intervall-talsignalen, en 8008245-6 31 tonhöjd-representativ signal och en tonande-signal; dels organ som är anordnade att som svar på dels intervall-tal- signalen och dels intervall-första-signalerna alstra en signal som motsvarar intervallets predikteringsfelsignal; dels en talsyntetiserare som innehåller en exciteringsgenerator vilken är anordnad att som svar på den för tonhöjden representativa signalen och tonande-signalen alstra en exciteringssignal; samt dels organ som är anordnade att som svar på dels excite- ringssignalen och nämnda första signaler alstra en efterbildning av den inkommande talsignalen; vilken anordning är k ä n n e t e c k n a d av att talanalysatorn dessutom innehål- ler organ (124, 126) som är anordnade att som svar på predikterings- felsignalen alstra en uppsättning andra signaler vilka är represen- tativa för intervall-predíkteringsfelsignalens spektrum; varjämte syntetiserarens exciteringsgenerator (220) är anordnad att som svar på dels den för tonnöjden representativa signalen, dels tonande-sig- nalen och dels nämnda andra signaler alstra en predikteringsfelkom- penserande exciteringssignal.
7. Anordning enligt kravet 6, k ä n n e t e c k n a d av att syntetiserarens exciteringsgeneratorn (220) innehåller á ena sidan ett organ (618) som är anordnat att som svar på dels den för tonhöj- den representativa signalen och dels tonande-signalen alstra en första exciteringssignal och å andra sidan ett organ (650) som är anordnat att som svar på nämnda andra signaler forma den första exoiteringssignalen så att den bildar nämnda predíkteringsfelkompen- serande exciteringssignal.
8. Anordning enligt kravet 7, k ä n n e t e e k n a d av att organet (618) för alstring av den första exciteringssignalen inne- fattar organ (620, 622, 62ü) som är anordnade att som svar på dels den för tonhöjden representativa signalen och dels tonande-signalen alstra en serie exoiteringspulser, varjämte organet (650) för form- ning av den första exciteringssignalen innefattar organ (601, 603, 610) som är anordnade att som svar på nämnda andra signaler modifi- era exoiteringspulserna för att bilda en serie predikteringsfelkom- penserande exoíteringspulser.
9. Anordning enligt kravet 8, k ä'n n e t e c k n a d av att organen (123, 126) för alstring av den andra signalen innefattar ett organ (SOU) som är anordnat att som svar på intervall-predikterings- felsignalen bilda ett flertal predikteringsfel-spektralsignaler, var och en för en särskild förutbestämd frekvens; samt organ (S13) för 8008245-6 32 att sample nämnda intervallepredikteringsfel-spektralsignaler under nämnda intervall för alstring av nämnda andra signaler.
10. Anordning enligt kravet 9, k ä n n e t e c k n a d av att nämnda exciteringspuls-modifieringsorgan (601, 603, 610) innefattar ett organ (603) som är anordnat att som svar på nämnda första exci- teringspulser bilda ett flertal exeiterings-spektralkomponentsigna- ler motsvarande nämnda förutbestämda frekvenser; ett organ (601) som är anordnat att som svar på dels den för tonnöjden representativa signalen och dels nämnda andra signaler alstra ett flertal predikte- ringsfel-spektralkoefficientsígnaler motsvarande nämnda förutbestäm- da frekvenser; samt ett organ (610) för att kombinera nämnda excite- rings-spektralkomponentsignaler med nämnda predikteringsfel-koeffi- eientsignaler för att bilda nämnda predikteringsfelkompenserande exciteringspulser.
SE8008245A 1979-03-30 1980-11-25 Talkodningssystem SE422377B (sv)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US06/025,731 US4220819A (en) 1979-03-30 1979-03-30 Residual excited predictive speech coding system

Publications (2)

Publication Number Publication Date
SE8008245L SE8008245L (sv) 1980-11-25
SE422377B true SE422377B (sv) 1982-03-01

Family

ID=21827763

Family Applications (1)

Application Number Title Priority Date Filing Date
SE8008245A SE422377B (sv) 1979-03-30 1980-11-25 Talkodningssystem

Country Status (8)

Country Link
US (1) US4220819A (sv)
JP (1) JPS5936275B2 (sv)
DE (1) DE3041423C1 (sv)
FR (1) FR2452756B1 (sv)
GB (1) GB2058523B (sv)
NL (1) NL8020114A (sv)
SE (1) SE422377B (sv)
WO (1) WO1980002211A1 (sv)

Families Citing this family (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NL188189C (nl) * 1979-04-04 1992-04-16 Philips Nv Werkwijze ter bepaling van stuursignalen voor besturing van polen van een louter-polen filter in een spraaksynthese-inrichting.
JPS57500901A (sv) * 1980-05-19 1982-05-20
US4544919A (en) * 1982-01-03 1985-10-01 Motorola, Inc. Method and means of determining coefficients for linear predictive coding
US4520499A (en) * 1982-06-25 1985-05-28 Milton Bradley Company Combination speech synthesis and recognition apparatus
JPS59153346A (ja) * 1983-02-21 1984-09-01 Nec Corp 音声符号化・復号化装置
US4731846A (en) * 1983-04-13 1988-03-15 Texas Instruments Incorporated Voice messaging system with pitch tracking based on adaptively filtered LPC residual signal
US4667340A (en) * 1983-04-13 1987-05-19 Texas Instruments Incorporated Voice messaging system with pitch-congruent baseband coding
CA1223365A (en) * 1984-02-02 1987-06-23 Shigeru Ono Method and apparatus for speech coding
US4704730A (en) * 1984-03-12 1987-11-03 Allophonix, Inc. Multi-state speech encoder and decoder
JPS60239798A (ja) * 1984-05-14 1985-11-28 日本電気株式会社 音声信号符号化/復号化装置
CA1255802A (en) * 1984-07-05 1989-06-13 Kazunori Ozawa Low bit-rate pattern encoding and decoding with a reduced number of excitation pulses
US4675863A (en) * 1985-03-20 1987-06-23 International Mobile Machines Corp. Subscriber RF telephone system for providing multiple speech and/or data signals simultaneously over either a single or a plurality of RF channels
US5067158A (en) * 1985-06-11 1991-11-19 Texas Instruments Incorporated Linear predictive residual representation via non-iterative spectral reconstruction
US4776014A (en) * 1986-09-02 1988-10-04 General Electric Company Method for pitch-aligned high-frequency regeneration in RELP vocoders
US4860360A (en) * 1987-04-06 1989-08-22 Gte Laboratories Incorporated Method of evaluating speech
US5202953A (en) * 1987-04-08 1993-04-13 Nec Corporation Multi-pulse type coding system with correlation calculation by backward-filtering operation for multi-pulse searching
US4817157A (en) * 1988-01-07 1989-03-28 Motorola, Inc. Digital speech coder having improved vector excitation source
US4896361A (en) * 1988-01-07 1990-01-23 Motorola, Inc. Digital speech coder having improved vector excitation source
AU620384B2 (en) * 1988-03-28 1992-02-20 Nec Corporation Linear predictive speech analysis-synthesis apparatus
JPH0782359B2 (ja) * 1989-04-21 1995-09-06 三菱電機株式会社 音声符号化装置、音声復号化装置及び音声符号化・復号化装置
US5261027A (en) * 1989-06-28 1993-11-09 Fujitsu Limited Code excited linear prediction speech coding system
JPH0332228A (ja) * 1989-06-29 1991-02-12 Fujitsu Ltd ゲイン―シェイプ・ベクトル量子化方式
US5263119A (en) * 1989-06-29 1993-11-16 Fujitsu Limited Gain-shape vector quantization method and apparatus
JPH0365822A (ja) * 1989-08-04 1991-03-20 Fujitsu Ltd ベクトル量子化符号器及びベクトル量子化復号器
US5054075A (en) * 1989-09-05 1991-10-01 Motorola, Inc. Subband decoding method and apparatus
CA2066568A1 (en) * 1989-10-17 1991-04-18 Ira A. Gerson Lpc based speech synthesis with adaptive pitch prefilter
US5195168A (en) * 1991-03-15 1993-03-16 Codex Corporation Speech coder and method having spectral interpolation and fast codebook search
US5265190A (en) * 1991-05-31 1993-11-23 Motorola, Inc. CELP vocoder with efficient adaptive codebook search
US5255339A (en) * 1991-07-19 1993-10-19 Motorola, Inc. Low bit rate vocoder means and method
US5357567A (en) * 1992-08-14 1994-10-18 Motorola, Inc. Method and apparatus for volume switched gain control
US5546383A (en) 1993-09-30 1996-08-13 Cooley; David M. Modularly clustered radiotelephone system
US5621852A (en) * 1993-12-14 1997-04-15 Interdigital Technology Corporation Efficient codebook structure for code excited linear prediction coding
US5761633A (en) * 1994-08-30 1998-06-02 Samsung Electronics Co., Ltd. Method of encoding and decoding speech signals
JP3137176B2 (ja) * 1995-12-06 2001-02-19 日本電気株式会社 音声符号化装置
US5839098A (en) * 1996-12-19 1998-11-17 Lucent Technologies Inc. Speech coder methods and systems
EP1093230A4 (en) * 1998-06-30 2005-07-13 Nec Corp speech
US7171355B1 (en) * 2000-10-25 2007-01-30 Broadcom Corporation Method and apparatus for one-stage and two-stage noise feedback coding of speech and audio signals
US7110942B2 (en) * 2001-08-14 2006-09-19 Broadcom Corporation Efficient excitation quantization in a noise feedback coding system using correlation techniques
US7206740B2 (en) * 2002-01-04 2007-04-17 Broadcom Corporation Efficient excitation quantization in noise feedback coding with general noise shaping
US6751587B2 (en) 2002-01-04 2004-06-15 Broadcom Corporation Efficient excitation quantization in noise feedback coding with general noise shaping
US8473286B2 (en) * 2004-02-26 2013-06-25 Broadcom Corporation Noise feedback coding system and method for providing generalized noise shaping within a simple filter structure
DK2309776T3 (da) * 2009-09-14 2014-10-27 Gn Resound As Høreapparat med midler til adaptiv feedbackkompensation

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US2928902A (en) * 1957-05-14 1960-03-15 Vilbig Friedrich Signal transmission
US3979557A (en) * 1974-07-03 1976-09-07 International Telephone And Telegraph Corporation Speech processor system for pitch period extraction using prediction filters
US3975587A (en) * 1974-09-13 1976-08-17 International Telephone And Telegraph Corporation Digital vocoder
JPS6051720B2 (ja) * 1975-08-22 1985-11-15 日本電信電話株式会社 音声の基本周期抽出装置

Also Published As

Publication number Publication date
NL8020114A (nl) 1981-01-30
JPS56500314A (sv) 1981-03-12
GB2058523B (en) 1983-09-14
US4220819A (en) 1980-09-02
GB2058523A (en) 1981-04-08
SE8008245L (sv) 1980-11-25
DE3041423C1 (de) 1987-04-16
WO1980002211A1 (en) 1980-10-16
JPS5936275B2 (ja) 1984-09-03
FR2452756A1 (fr) 1980-10-24
FR2452756B1 (fr) 1985-08-02

Similar Documents

Publication Publication Date Title
SE422377B (sv) Talkodningssystem
US3624302A (en) Speech analysis and synthesis by the use of the linear prediction of a speech wave
US4701954A (en) Multipulse LPC speech processing arrangement
KR101039343B1 (ko) 디코딩된 음성의 피치 증대를 위한 방법 및 장치
US4544919A (en) Method and means of determining coefficients for linear predictive coding
CN102682777B (zh) 一种衰减因子的获取方法和获取装置
US5457783A (en) Adaptive speech coder having code excited linear prediction
EP0714089A2 (en) Code-excited linear predictive coder and decoder with conversion filter for converting stochastic and impulse excitation signals
CN101207459A (zh) 一种信号处理方法和处理装置
US4945565A (en) Low bit-rate pattern encoding and decoding with a reduced number of excitation pulses
US5048088A (en) Linear predictive speech analysis-synthesis apparatus
JPS5946000B2 (ja) 多重チヤンネルデジタル声音合成装置
US4962536A (en) Multi-pulse voice encoder with pitch prediction in a cross-correlation domain
EP0162585B1 (en) Encoder capable of removing interaction between adjacent frames
JPS63118200A (ja) マルチパルス符号化装置
JP2535807B2 (ja) 音声合成装置
JP2629762B2 (ja) ピッチ抽出装置
Ma Multiband Excitation Based Vocoders and Their Real Time Implementation
JPH05323999A (ja) 音声復号装置
JP2615862B2 (ja) 音声符号化復号化方法とその装置
JPH05232998A (ja) 合成による分析技術に基づく音声コーダの改良
JPS6113300A (ja) 音声分析合成方式
KR100310930B1 (ko) 음성합성장치및그방법
EP0119033B1 (en) Speech encoder
Madour A low-delay code excited linear prediction speech coder at 8 kbit/s

Legal Events

Date Code Title Description
NUG Patent has lapsed

Ref document number: 8008245-6

Effective date: 19900125

Format of ref document f/p: F