NL8204641A - Digitale spraakprocessor. - Google Patents
Digitale spraakprocessor. Download PDFInfo
- Publication number
- NL8204641A NL8204641A NL8204641A NL8204641A NL8204641A NL 8204641 A NL8204641 A NL 8204641A NL 8204641 A NL8204641 A NL 8204641A NL 8204641 A NL8204641 A NL 8204641A NL 8204641 A NL8204641 A NL 8204641A
- Authority
- NL
- Netherlands
- Prior art keywords
- signal
- speech
- representative
- generating
- interval
- Prior art date
Links
- 230000005284 excitation Effects 0.000 claims description 79
- 230000004044 response Effects 0.000 claims description 56
- 238000000034 method Methods 0.000 claims description 16
- 238000012545 processing Methods 0.000 claims description 11
- 238000001228 spectrum Methods 0.000 claims description 7
- 210000000056 organ Anatomy 0.000 claims 1
- 230000000875 corresponding effect Effects 0.000 description 10
- 230000015572 biosynthetic process Effects 0.000 description 7
- 230000006870 function Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- FTGYKWAHGPIJIT-UHFFFAOYSA-N hydron;1-[2-[(2-hydroxy-3-phenoxypropyl)-methylamino]ethyl-methylamino]-3-phenoxypropan-2-ol;dichloride Chemical compound Cl.Cl.C=1C=CC=CC=1OCC(O)CN(C)CCN(C)CC(O)COC1=CC=CC=C1 FTGYKWAHGPIJIT-UHFFFAOYSA-N 0.000 description 4
- 238000012546 transfer Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 230000003111 delayed effect Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000007493 shaping process Methods 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000005311 autocorrelation function Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 229920000833 poly(n-hexyl isocyanate) polymer Polymers 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/10—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Monitoring And Testing Of Transmission In General (AREA)
- Analogue/Digital Conversion (AREA)
Description
s * ' VO 3951
Titel: Digitale spraakprocessor.
De uitvinding heeft betrekking op spraakverwerking en meer in het bijzonder op een digitaal spraakcodeerstelsel.
Bij digitale spraakcammunicatiestelsels, welke spraak opzamel- en spraakresponsiefaciliteiten bezitten, wordt gebruik gemaakt van signaal-5 compressie om de bitfrequentle, welke nodig is voor opslag en/of overdracht te reduceren. Zoals bekend bevat een spraakpatroon redundanties, welke voor de schijnbare kwaliteit daarvan niet essentieel zijn. Het verwijderen van redundante componenten van het spraakpatroon verlaagt,op een significante wijze het aantal digitale codes, dat nodig is om een 10 replica van de spraak te construeren. De subjectieve kwaliteit van de spraakreplica is evenwel afhankelijk van de compressie- en codeermethoden.
Een bekend digitaal codeerstelsel, zoals beschreven in het Amerikaanse octrooischrift 3.624.302 omvat een lineaire voorspellingsanalyse 15 van een ingangsspraaksignaal. Het spraaksignaal wordt in opeenvolgende intervallen gesplitst en er wordt een stel parameters, die representatief zijn voor de intervalspraak, opgewekt. Het parameterstel omvat lineaire voorspellingscoëfficiëntiesignalen,die representatief zijn voor de spec-traalomhullende van de spraak in het interval, en toonhoogte- en klank-20 signalen, overeenkomende met de spraakexcitatie. Deze parametersignalen kunnen bij een veel lagere bitfrequentle worc£n gecodeerd dan de spraak-signaalgolfvorm zelf. Een replica van het ingangsspraaksignaal wordt door synthese uit de parametersignaalcodes gevormd. Het synthesestelsel omvat in het algemeen een model van de stemholte waarin de excitatie-25 pulsen door de spectraalomhullende representatieve voorspellingscoëffi- 4 ciënten in een uitsluitend van polen voorzien voorspellingsfilter worden gemodifiëerd.
De bovenstaande toonhoogte-geëxciteerde lineaire voorspellings-codering is zeer doeltreffend. De gevormde spraakreplica vertoont even-30 wel een synthetische kwaliteit, welke men dikwijls moeilijk kan verstaan. In het algemeen is de geringe spraakkwaliteit een gevolg van het gemis aan overeenstemming tussen het spraakpatroon en het gebruikte lineaire voorspellingsmodel. Fouten in de toonhoogtecode of fouten bij het 8 2 0 4 6 4 1 • (· - 2 - bepalen of een spraakinterval stemhebbend of niet stemhebbend is/Veroorzaken, dat de spraakreplica gestoord of onnatuurlijk klinkt. Soortgelijke problemen doen zich ook voor bij de formantcodering van spraak. Andere codeerstelsels, waarin de spraakexcitatie wordt verkregen uit de 5 rest navoorspelling bijvoorbeeld ADPCM of APC, voorzien in een uitgesproken verbetering omdat de excitatie afhankelijk is van een niet-exact model. De excitatiebitfrequentie van deze stelsels is echter ten minste een orde van grootte hoger dan bij het lineaire voorspellingsmodel. Pogingen om de excitatiebitfrequentie in stelsels van het resttype te verlagen 10 hebben in het algemeen geleid tot een sterke verlaging van de kwaliteit.
De uitvinding beoogt te voorzien in een verbeterde spraakcodering van goede kwaliteit bij lagere bitfrequenties dan bij de restcodeerscheraa's.
De uitvinding is gericht op een sequentieel patroonverwerkings-stelsel, waarin het sequentiële patroon in opeenvolgende tijdintervallen 15 wordt gesplitst. In elk tijdinterval worden een signaal, dat representatief is voor het interval-sequentiële patroon en een kunstmatig patroon-signaal gevormd. In responsie op.de interval-sequentiële patroon- :- , :: . en kunstmatige patroonsignalen wordt een gecodeerd signaal, dat bestemd is om het verschil .tussen interval-sequentiële en kunstmatige patronen 20 te reduceren, gevormd voor het voorstellen van het sequentiële patroon.
Volgens de uitvinding wordt een spraakpatroon in opeenvolgende tijdintervallen gesplitst. In elk interval wordt het signaal, dat representatief is voor het intervalspraakpatroon gevormd, zoals een kunstmatig spraak-representatief signaal. Een signaal, dat overeenkomt met de 25 verschillen .tussen de intervalspraakrepresentatieve en kunstmatige spraakrepresentatieve signalen wordt opgewekt, en er wordt een signaal gevormd, dat bestemd is om het kunstmatige intervalspraakrepresentatieve signaal zodanig te modifiëren, dat het overeenkomstige verschilsignaal wordt gereduceerd.
30 Bij een uitvoeringsvorm volgens de uitvinding wordt een stel voor- spellingsparametersignalen voor elk tijdraster van een spraaksignaal opgewekt. Er wordt in responsie op het tijdrasterspraaksignaal en de tijd-rastervoorspellingsparameters een voorspellingsrestsignaal gevormd. Het voorspellingsrestsignaal wordt door een eerste voorspellingsfilter ge-35 voerd teneinde een spraakrepresentatief signaal voor het tijdraster te verschaffen. Er wordt een kunstmatig spraakrepresentatief signaal voor 8204641 ' ' ' ' ' .*)............!".....................:i--\ - 3 - het tijdraster In een tweede voorspellingsfilter uit de rastervoor-spellingsparameters opgewekt. In responsie op de spraakrepresentatieve en kunstmatige spraakrepresentatieve signalen van het tijdraster wordt een gecodeerd excitatiesignaal gevormd en dit wordt aan een tweede voor-5 spellingsfilter toegevoerd teneinde het perceptueel gewogen effectieve verschil tussen de rasterspraakrepresentatieve en kunstmatige spraakrepresentatieve signalen tot een minimum terug te brengen. Het gecodeerde excitatiesignaal en de voorspellingsparametersignalen worden gebruikt voor het opbouwen van een replica van het tijdrasterspraakpatroon.
10 De uitvinding zal onderstaand nader worden toegelicht onder ver wijzing naar de tekening. Daarbij toont: fig. l.een blokschema van een spraakprocessorketen ter illustratie van de uitvinding; fig. 2 een blokschema van een excitatiesignaalvormende processor, 15 en die in de keten van fig. 1 kan worden toegepast; fig. 3 een stroomdiagram ter toelichting van de werking van de excitatiesignaalvormende keten «volgens fig.1; fig. 4 en 5 stroomdiagrammen ter toelichting van de werking van de keten volgens fig. 2; 20 fig. 6 een tijddiagram ter illustratie van de werking van de excitatiesignaalvormende keten volgens fig. 1 en fig. 2; en fig. 7 golf vormen ter illustratie van de spraakverwerking volgens de uitvinding.
Fig. 1 toont een algemeen blokschema van een spraakprocessor vol-25 gens de uitvinding. In fig. 1 wordt een spraakpatroon, zoals een gesproken bericht, ontvangen door een microfoontransducent 101. Het overeenkomstige analoge spraaksignaal daarvan wordt wat bandbreedte betreft begrensd en in een filter- en steekproefketen 113 van een voorspellings-analisator 110 in een reeks pulssteekproeven omgezet. Het filteren dient 30 voor het verwijderen van frequentiecomponenten van het spraaksignaal boven 4,0 kHz en het nemen van steekproeven kan geschieden bij een frequentie van 8,0 kHz, zoals op zichzelf bekend is. De tempering van de steekproeven wordt bestuurd door de steekproefklok CL uit de klok-generator 103. Elke steekproef uit keten 113 wordt in een analoog-35 digitaalomzetter 115 omgezet in een amplitude-representatieve digitale code.
8204641 I
% 4 - 4 -
De reeks spraaksteekproeven wordt toegevoerd aan een voorspellings-parameterrekentuig 119, dat, zoals bekend, dient om de spraaksignalen te splitsen in intervallen van 10 tot 20 ms en een stel lineaire voorspel- lingscoëfficiëntsignalen a^ op te wekken, waarbij k = 1, 2, ...... p, 5 representatief voor het voorspelde een korte tijd durende spectrum van de N » p spraaksignalen van elk interval. De spraaksteekproeven uit de A/D omzetter 115 worden in een vertragingsinrichting 117 vertraagd om tijd te scheppen voor het vormen van de signalen a^. De vertraagde steekproeven worden toegevoerd aan de ingang van een voorspellingsrest-10 generator 118. De voorspellingsrestgenerator vormt, zoals bekend, in responsie op de vertraagde spraaksteekproeven en de voorspellingspara-meters a^ een signaal, overeenkomende met het verschil daartussen.
De vorming van de voorspellingsparameters en het voorspellingsrest-signaal voor elk raster, aangegeven in de voorspellingsanalisator 110, 15 kan plaatsvinden overeenkomstig hetgeen is beschreven in het Amerikaanse octrooischrift 3.740.476.
Ofschoon de voorspellingsparametersignalen a^ een efficiënte representatie. van het kortdurende spraakspectrum vormen, varieert het rest-signaal in het algemeen sterk van interval tot interval en vertoont dit • 20 een hoge bitfrequentie, die voor vele toepassingen ongeschikt is. Bij de toonhoogte-geëxciteerde vocoder worden slechts de pieken van de rest als toonhoogtepulscodes overgedragen. De resulterende kwaliteit is evenwel in het algemeen slecht. De golfvorm 701 van fig. 7 toont een typerend spraakpatroon over twee tijdrasters. De golfvorm 703 toont het voorspel-25 lingsrestsignaal, dat afkomstig is uit het patroon van de golfvorm 701 en de voorspellingsparameters van de rasters. Zoals blijkt, is de golfvorm 703 betrekkelijk complex, zodat codeertoonhoogtepulsen, welke overeenkomen met pieken daarin, geen adequate benadering van de voorspel-lingsrest verschaffen. Volgens de uitvinding ontvangt de excitatiecode-30 processor 120 het restsignaal d^ en de voorspellingsparameters a^ van het raster en wekt een intervalexcitatiecode op, welke een voorafbepaald aantal bitposities bezit. De resulterende excitatiecode, aangegeven in de golfvorm 705, bezit een relatief lage bitfrequentie, die constant is. Een replica van het spraakpatroon van de golfvorm 701, opgebouwd uit 35 de excitatiecode en de voorspellingsparameters van de rasters, is aan- 8204641 - 5 - gegeven bij de golfvorm 707. Zoals uit een vergelijking van de golf-vormen 701 en 707 blijkt, worden bij veel lagere bitfrequenties spraak-karakteristieken van adaptieve voor spell ingscodering met betere kwaliteit verkregen.
5 Het voorspellingsrestslgnaal d^ en de voorspellingsparametersigna- len a^ voor elk opeenvolgend raster worden vanuit de keten 110 toegevoerd aan de excitatiesignaalvormende keten 120 bij het begin van het volgende raster. De keten 120 wekt een uit een aantal elementen bestaande raster-excitatiecode EC met een voorafbepaald aantal bitposities voor elk raster 10 op. Elkeexcitatiecode komt avereen met een reeks 1 < i < I pulsen, die representatief zijn voor de excitatiefunctie van het raster. De amplitude en de plaats m^ van elke puls binnen het raster wordt bepaald in de excitatiesignaalvocmende keten teneinde een opbouw van een replica van het rasterspraaksignaal uit het excitatiesignaal en de voorspellings-15 parametersignalen van het raster mogelijk te maken. De (S^-en m^-signalen worden in de codeerinrichting 131 gecodeerd en met de voorspellingspara-metersignalen van het raster aan een multiplexbewerking onderworpen in een multiplexinrichting 135 voor het verschaffen van een digitaal signaal, dat met het rasterspraakpatroon overeenkomt.
20 In de excitatiesignaalvormende keten 120 worden het voorspellinga- restsignaal d^ en de voorspellingsparametersignalen afc van een raster via respectieve poorten 122 en 124 toegevoerd aan een filter 121. Bij het begin van elk raster opent het rasterkloksignaal PC de poorten 122 en 124, waardoor de d^-signalen aan het filter 121 en de a^-signalen aan de fil-25 ters 121 en 123 worden toegevoerd. Het filter 121 modifiëert het signaal d^ zodanig, dat het kwantiseerspectrum van het foutsignaal in de fonnant-c^ebieden daarvan is geconcentreerd. Zoals beschreven in het Amerikaanse octrooischrift 4.133.976 dient dit filterstelsel om de fout in de energie-gedeelten met een sterk signaal van het spectrum te maskeren.
30 De overdrachtsfunctie van het filter 121 wordt in z transformatfe- notatie uitgedrukt door «"-fcrar (11 waarbij B(z) wordt geregeld door de rastervoorspellingsparameters a^.
Het voorspellingsfilter 123 ontvangt de rastervoorspellingspara-35 metersignalen uit het rekentuig 119 en een kunstmatig excitatiesignaal EC
8204641 I
i » · - 6 - uit de excitatiesignaalprocessor 127. Het filter 123 heeft de overdrachtsfunctie volgens vergelijking (1). Het filter 121 vormt een gewogen ras-terspraaksignaal y in responsie op het voorspellingsrestsignaal d^, terwijl het filter 123 een gewogen kunstmatig spraaksignaal y optrekt in 5 responsie op het excitatiesignaal uit de signaalprocessor 127. De signalen y en y worden gecorreleerd in de correlatieprocessor 125, welke een signaal E opwekt, dat overeenkomt met het gewogen verschil daartussen.
Het signaal E wordt toegevoerd aan de signaalprocessor 127 om het excitatiesignaal EC zodanig in te stellen, dat de verschillen tussen het 10 gewogen spraakrepresentatieve sigaal uit het filter 121 en het gewogen kunstmatige spraakrepresentatieve signaal uit het filter 123 worden gereduceerd.
Het excitatiesignaal bestaat uit een reeks vein 1 < i < I pulsen.
Elke puls heeft een aplitude β^ en een plaats nu. De processor 127 dient 15 voor het achtereenvolgens vormen van de β^, nu-signalen, welke de verschillen tussen het gewogen rasterspraakrepresentatieve signaal uit het filter 121 en het gewogen kunstmatige rasterspraakrepresentatieve signaal uit het filter 123 reduceren. Het gewogen rasterspraakrepresentatieve signaal 20 yn. l !<n<N (2) k=n-k en het gewogen kunstmatige spraakrepresentatieve signaal van het raster i y = Σ 0.h 1 < η < N (3) η , , 1 n-m. - = 3=1 3 ^aarbij hn de pulsresponsie van het filter 121 of het filter 123 is.
Het in de keten 120 gevormde excitatiesignaal is een gecodeerd 25 signaal met elementen β^, nu, waarbij i = 1,2,..........,1. Elk element stelt een puls in het .tijdraster .voor. β^ is de amplitude van de puls en nu is de plaats van de puls in het raster. De correlatiesignaal-generatorketen 125 wekt achtereenvolgens voor elk element een correla-tiesignaal op. Elk element kan op het tijdstip 1 < q < Q in het tijd-30 raster worden geplaatst. Derhalve vormt de correlatieprocessorketen Q mogelijke kandidaten voor het element i overeenkomstig vergelijking (4).
3204641 : / - ' .
- 7 - ik '· ^ *' Λ ^ <4) waarbij ^ »jVs <«
De excitatiesignaalgenerator 127 ontvangt de C^-signalen uit de 5 correlatieslgnaalgeneratorketen, kiest het C, -signaal met de maximale de ^ absolute waarde en vormt het i element van het gecodeerde signaal.
ei * v /i < <6> - q* waarbij q de plaats van het correlatiesignaal met de maximale absolute 10 waarde is. De index J. wordt gelncrementeerd tot i+1 en het signaal aan de uitgang van het voorspellingsfilter 123 wordt gewijzigd. Het proces volgens dè vergelijkingen (4), (5) en (6) wordt herhaald voor het vormen van het element β^+1, ®i+1· Na de vorming van het element V -I ”rdt het Mt *> W ®Λ........*Λ .
15 de.codeerinrichting 131 over gedragen. Zoals bekend kwantiseert de codeer-inrichting 131 de 0^m^ elementen en vormt een gecodeerd signaal, dat geschikt is om naar het netwerk 140 te worden overgedragen.
Elk van de filters 121 en 123 in fig. 1 kan bestaan uit een transversaal filter van het type, beschreven in het bovengenoemde Amerikaanse 20 octrooischrift 4.133.976. Elk van de processors 125 en 127 kan bestaan uit een van de bekende processorstelsels voor het uitvoeren van een ver- , φ vrèrking, zoals deze wordt, vereist door de vergelijkingen (4) en (6) zoals het C.S.P., Ine. Macro Arithmetic Processor System 100 of een ander bekend processorstelsel. De processor 125 omvat een geheugen, dat slechts 25 kan worden uitgelezen, welk geheugen permanent geprogrammeerde instructies opslaat om de vorming van het C^-signaal overeenkomstig vergelijking (4) te regelen en de processor 127 omvat een slechts uitleesbaar geheugen, dat permanent geprogrammeerde instructies opslaat voor het kl«ea van de ^-m^ignaal.len.enten over«n*®,ttg vergeUjking (6) 30 zoals bekend. De programmainstructies in processor 125 zijn aangegeven 8204641 | - 8 - in FORTRAN-taalvorm in appendix A en de programmainstructies in de processor 127 zijn in de Appendix B in FORTRAN-taalvorm opgesomd.
Fig. 3 toont een stroomdiagram ter toelichting van de werking van de processor 125 en 127 voor elk tijdraster. Onder verwijzing naar fig. 3, 5 worden de pulsresponsiesignalen in de rechthoek 305 opgewekt in responsie op de rastervoorspellingsparameters voor de overdrachtsfunctie van de vergelijking 1. Dit vindt plaats na ontvangst van het FC-signaal uit de klok 103 in fig. 1 bijvoorbeeld via de wachtrechthoek 303. De elementindex i_ en de excitatiepuls plaatsindex £ worden in de rechthoek 10 307 initieel ingesteld op 1. Bij ontvangst van de signalen y^ en yn uit de voorspellingsfilters 121 en 123, wcrdt het signaal door de rechthoek 309 gevormd. De plaatsindex £ wordt in de rechthoek 311 ge-incrementeerd en de vorming van het volgende C^-plaatssignaal wordt ingeleid.
15 Nadat het C^-signaal is gevormd om het signaalelement _i in de processor 125 te exciteren, wordt de processor 127 geactiveerd. De £-index in de processor 127 wordt in de rechthoek 315 initieel-ingesteld op 1 en de _i-index evenals de in de processor 125 gevormd C. -signalen worden overgedragen naar de processor 127. Het signaal C. x, dat het x 20 C^-signaal met de maximale absolute waarde voorstelt, en de plaats q daarvan, worden in de rechthoek 317 op 0 ingesteld. De absolute waarden * van de -signalen worden vergeleken met het signaal C^* en het maximum van deze absolute waarden wordt als het signaal C^x opgeslagen in de lus, welke de rechthoeken 319, 321, 323 en 325 omvat.
25 Nadat het C ^-signaal uit de processor 125 is verwerkt, wordt de rechthoek 327 vanuit de rechthoek 325 geïntroduceerd. De excitatiecode-
Je elementplaats m. wordt ingesteld op q en de waarde van het excitatie-codeëlement wordt opgewekt in overeenstemming met vergelijking (6).
Het β jiK-element wordt via de rechthoek 328 naar het voorspellingsfilter 30 123 gevoerd en de index i wordt door de rechthoek 329 gelncrementeerd.
Bij vorming van het (3^m^.-element van het raster, wordt de wachtrechthoek 303 opnieuw vanuit de beslissingsrechthoek 331 geïntroduceerd. De processors 125 en 127 worden dam in de wachttoestand gebracht totdat de FC-rasterklokpuls van het volgende raster optreedt.
35 Ook de excitatiecode in de processor 127 wordt toegevoerd aan de 8204641 - 9 - codeerinrichting 131. De codeerinrichting transformeert de excitatie-code uit de processor 127 in een vorm, welke geschikt is om in het netwerk 140 te worden gebruikt. De voorspellingsparametersignalen a^ voor het raster worden via een vertragingsinrichting 133 toegevoerd «urn de 5 ingang van de multiplexinrichting 135v Het excitatiegecodeerde signaal 1C uit de codeerinrichting 131 wordt toegevoerd aan de andere ingang van de multiplexinrichting. De multiplex excitatie- en voorspellings-parametercodes voor het raster worden dan naar het netwerk 140 gezonden.
Het netwerk 140 kan een communicatiestelsel, de berichtopzamel-10 inrichting van een spraakopzamelstelsel, of een inrichting, bestemd voor het opslaan van een volledig bericht of een vocabulaire van voorgeschreven berichteenheden bijvoorbeeld woorden, fonemen, enz. ten gebruike bij spraaksynthetisators zijn. Wat ook de berichteenheid is, de resulterende reeks van rastercodes uit de keten 120 wordt via een netwerk 15 140 toegevoerd aan de spraaksynthetisator 150. De synthetisator gebruikt op zijn beurt de rasterexcitatiecodes uit de keten 120 evenals de rastervoorspellingsparametercodes voor het opbouwen van een replica van het spraakpatroon.
De demultiplexinrichting 152 in de synthetisator 150 scheidt de 20 excitatiecode SC van een raster van de voorspellingsparameters a^ daarvan. De excitatiecode wordt nadat deze in de decodeerinrichting 153 tot een excitatiepulsreeks is gedecodeerd, toegevoerd aan de excitatieingang van het spraaksynthetisatorfilter 154. De a^-codes worden toegevoerd aan de parameteringangen van het filter 154. Het filter 154 vormt in 25 responsie op de excitatie- en voorspellingsparametersignalen een gecodeerde replica van het rasterspraaksignaal, zoals bekend. De D/A-om-zetter 156 transformeert de gecodeerde replica in een analoog signaal, 4 dat over het laagdoorlaatfilter 158 wordt gevoerd en door de transducent 160 in een spraakpatroon wordt getransformeerd.
30 Een andere inrichting voor het uitvoeren van de excitatiecode vormhandelingen van de keten 120 kan zijn gebaseerd op de gewogen effectieve fout tussen de signalen yn en y . Deze gewogen effectieve fout bij het vormen van 6^ en m^ voor de i-de excitatiesignaalpuls wordt gegeven door N / i \ 2 35 E - £ I y - Σ β .h / ...
1 n*»l \ “ j-1 J n’mj/ (7) ί 8204641 f - 10 - waarbij de n-de steekproef van de pulsresponsie van H(z), πκ de plaats van de j-de puls in het excitatiecodesignaal en de waarde van de j-de puls is.
De pulsplaatsen en -amplituden worden sequentieel gevormd. Het 5 i-de element van de excitatie wordt bepaald door Ei in vergelijking (7) minimaal te maken. De vergelijking (7) kan opnieuw worden geschreven als N f/ i_1 \2 2 2 E. = Σ /y - Σ 8.h I + B7h 1 n*l[l n j=l 3n'mj/ in_mi + -2Bi Σ ®jhn_m hn-m.) (8) V i 3=1 J j i' m zodat de bekende excitatiecode elementen, welke voorafgaan aan 10 slechts in de eerste term optreden.
Zoals bekend kan de waarde van fj^, welke minimaal maakt, worden bepaald door vergelijking (8) ten aanzien van 8^ te differentiëren en gelijk aan 0 te stellen.
3E.
ίζ * 0 (9)
15 Derhalve is de optimale waarde van (L
mi +K i-1 . ** |k-m. f .**. ^jlm.-m.j n.
ksnn^-K I x' 0=1 JI j ïl (10) *0 waarbij I φ. = Σ h h , 0 < k < K (11) n=k de autocorrelatiecoëfficiënten van het voorspellingsfilterpulsresponsie-20 signaal h^ zijn.
8^ in vergelijking (10) is een functie van de pulsplaats en wordt voor elke mogelijke waarde daarvan bepaald. Het maximum van de {L -waarden over de mogelijke pulsplaatsen wordtdan gekozen. Nadat f}^ en m^-waarden zijn verkregen, worden m^+1-waarden gevormd door vergelij- 25 king (10) op een soortgelijke wijze op te lossen. De eerste term van de 8204541 - H - '
' ' «j+K
vergelijking (10), d.w.z. X d. φ , komt overeen met het spraak- kPB^-K * representatieve signaal van het raster aan de uitgang van het voorspel- lingsfilter 121. De tweede term van vergelijking (10), d.w.2.
' i-1 /. ' , ·.
Σ β.φ komt overeen met het kunstmatige spraakrepreseritatieve j»l 3 ®j~mi 5 signaal van het raster van de uitgang van het voorspellingsfilter 123. is de amplitude van een excitatiepuls op de plaats m^, waarbij het verschil tussen de eerste en tweede termen minimaal is.
De in fig. 2 af geheelde informstieverwerkingsketen voorziet in een andere constructie van de excitatieslgnaalvormingsketen 120 volgens 10 fig. 1. De keten volgens fig. 2 levert de excitatiecode voor elk raster van het spraakpatroon in responsie op het rastervoorspellingsrest-signaal d^ en de rastervoorspellingsparametersignalen a^ overeenkomstig, vergelijking (10) en kan bestaan uit het eerdergenoemde C.S.P., Ine. Macro Arithmetic Processor System 100 of een ander bekend processórstel-15 sel.
Zoals uit fig. 2 blijkt, ontvangt de processor 210 de voorspel- lingsparametersignalen a^ en de voorspellingsrestsignalen dfl van elk opeenvolgend raster van het spraakpatroon via de opzamelinrichting 218 uit de keten 110. De processor vormt de excitatiecode signaalelementen 20 B2,m2# .......* Bjifflj onder bestuur van permanent opgeslagen instructies in het slechts uitleesbare voorspellingsfilter subroutine geheugen 201 en het slechts uitleesbare excitatieverwerkingssubroutine- • geheugen 205. De voorspellingsflitersubroutine van de ROM 201 vindt men in appendix C en de excitatieverwerkingssubroutine van de ROM 205 vindt * 25 nien in de appendix D,
De processor 210 omvat een gemeenschappelijke lijn 225, een informs tiegeheugen 230, een centrale processor 240, een rekenkundige processor 250, een regelkoppelinrichting 220 en een ingangs-uitgangskoppelinrich-ting 260. Zoals bekend dient de centrale processor 240 voor het regelen 30 van de volgorde van werking van de andere eenheden van de processor 210 in responsie op gecodeerde Instructies uit de regelaar 215. De rekenkundige processor 250 dient voor het uitvoeren van de rekenkundige bewerkingen op gecodeerde signalen uit het informatiegeheugen 230 in res- 8204641 - 12 - ponsie op stuursignalen uit de centrale processor 240. Het informatiegeheugen 230 slaat signalen op, onder bestuur van de centrale processor 240 en levert deze signalen aan de rekenkundige processor 250 en de koppelinrichting 260. De koppelinrichting 220 voorziet in een communi-5 catieverbinding voor de programmainstructies in de ROM 201 en de ROM 205 naar de centrale processor 240 via de regelaar 215, en de koppelinrichting 260 maakt het mogelijk, dat het d^- en a^-signaal aan het informa-tiegeheugen 230 wordt toegevoerd en de uitgangssignalen (} m. uit het •I» 1 informatiegeheugen aan de codeerinrichting 131 in fig. 1 wordt toegevoerd. 10 De werking van de keten volgens fig.2 is aangegeven in het filter- parameterverwerkingsstroomdiagram volgens fig. 4, het excitatiecode-verwerkingsstroomdiagram volgens fig. 5 en het tijddiagram volgens . fig.-6. Bij het begin van het spraaksignaal wordt de rechthoek 401 in fig. 4 via de rechthoek 405 geïntroduceerd en wordt de rastertelling JL 15 op het eerste raster ingesteld door een enkele puls ST uit de klok- generator 103. Fig. 6 toont de werking van de keten volgens fig. 1 en 2 voor twee opeenvolgende rasters. Tussen de tijdstippen tg en t^ in het eerste raster vormt de voorspellingsanalisator 110 de spraakpatroon-steekproeven van het raster r+2 als bij de golfvorm 605 onder bestuur van 20 de steekproefklokpulsen met de golfvorm 601. De analisator 110 wekt de a^-signalen overeenkomende met het raster r+1 tussen de tijdstippen tg en t^ op en vormt het voorspellingsrestsignaal d^ tussen de tijdstippen t_ en t- als aangegeven bij de golfvorm 607.- Het signaal FC (golf-vorm 603) treedt op tussen de tijdstippen tg en t^. De signalen d^ uit 25 de restsignaalgenerator 118, die eerder.in de opzamelinrichting 218 waren opgeslagen tijdens het voorafgaande raster, worden via de koppel-iftrichting 260 en de lijn 225 onder bestuur van de centrale processor 240 in het informatiegeheugen 230 gebracht. Zoals aangegeven bij de rechthoek 415 in fig. 4 vinden deze handelingen plaats in responsie op 30 het rasterkloksignaal FC. De rastervoorspellingsparametersignalen a^ uit de voorspellingsparameter rekeninrichting 119, welke zich eerst in de opzamelinrichting 218 bevonden tijdens het voorafgaande raster, worden eveneens via de rechthoek 420 in het geheugen 230 gebracht. Deze handelingen vinden plaats tussen de tijdstippen tg en t^ in fig. 6.
35 Na het toevoeren van de d^ en a^-rastersignalen aan het geheugen 8204641 ..........
: '•-VT'r.; -;· · .··· -¾.. .
- 13 - •230» wordt de rechtboek 425 geïntroduceerd en worden de voorspellings-filtercoêfflciënten b^, overeenkomende met de overdrachtsfunctie volgens vergelijking (1) k bj^ * ® k * 1,2,......,p (12)' 5 in de rekenkundige processor 250 opgewekt en in het informatiegeheugen 230 gebracht, p is meer in het bijzonder 16 en .a .is meer in het bijzonder 0,85 voor era steekproeffrequentie van 8 kHz. De voorspellingsfil-terpulsrresponsiesignalen h^ Λ 1 min(k-l /p) 10 h^ - Σ W-i k* l'2·----'K (131 i*l ~ worden dan in de rekenkundige processor 250 opgewekt en in het informatiegeheugen 230 opgeslagen. Wanneer het h^-pulsresponsiesignaal wordt opgeslagen, wordt de rechthoek 435 geïntroduceerd en worden de voor-spellingsfliter autocorrelatiesignalen volgens vergelijking (11) opge-15 wekt en opgeslagen.
Op het Ujdstip t2 in fig. 6, wordt de verbinding tussen de HOM 201 en de koppelinrichting 220 door de regelaar 215 verbroken en wordt de excitatieverwerkingssubroutine-ROM 205 met de koppelinrichting verbonden. Daarna wordt de vorming van de ,m^-excitatiepulscodes, 20 aangegeven in het stroomdiagram volgens fig. 5, ingeleid. Tussen de tijdstippen t2 en t^ in fig. 6, wordt de excitatiepulsreeks gevormd.
De excitatiepulsindex i^ wordt initieel ingesteld op 1 en de pulsplaats- index £ wordt in de rechthoek 505 op 1 ingesteld. 8. wordt in de recht- / 1 hoek 510 op 0 ingesteld en de rechthoek 515 wordt geïntroduceerd om 25 te bepalen, dat = 8^· β^ is de optimale excltatiepuls op de plaats q»l van het raster. Daarna wordt de absolute waarde van β^ vergeleken met de eerder opgeslagen 8^ in de rechthoek 520. Aangezien 8j initieel 0 is, wordt de m^-code ingesteld op <pl en wordt β^-code ingesteld op 8jj in de rechthoek 525.
30 Daarna wordt de plaatsindex £ in de rechthoek 530 gelncrementeerd en wordt de rechthoek 515 geïntroduceerd via de rechthoek 535 voor het opwekken van het signaal β De lus, die de rechthoeken 515, 520, 525, 820 46 41” t - 14 -
A
530 en 535 omvat, wordt voor alle pulsplaatswaarden 1 < q < Q geltereerd.
Na de Q-iteratie wordt de eerste excitatiepulsamplitude β^ = β. x en de plaats daarvan in het raster m^=q in het geheugen 230 opgeslagen.
Op deze wijze wordt de eerste van de I excitatiepulsen bepaald. Onder 5 verwijzing naar de golfvorm 705 in fig. 7 treedt het raster r tussen de tij stippen t^ en t^ op. De excitatiecode voor het raster bestaat uit 8 pulsen. De eerste puls met de amplitude β^ en de plaats m^ treedt op op het tijdstip t , in fig. 7, als bepaald in het stroomdiagram van mi fig. 5 voor de index i=l.
IQ De index i wordt in de rechthoek 545 naar de volgende excitatie- puls gelncrementeerd en de rechthoek 515 wordt via de rechthoek 550 en de rechthoek 510 geïntroduceerd. Bij het voltooien van elke iteratie van de lus tussen de rechthoeken 510 en 550 wordt het excitatiesignaal gemodifieerd om het signaal volgens vergelijking (7) verder te reduce- 15 ren. Aan het eind van de tweede iteratie wordt de puls &2m2 t „ in golfvorm 705) gevormd. Vervolgens worden excitatiepulsen β m, m2 J j (tijdstip t^), $4m4 (tijdstip t 4), β^ (tijdstip tm5>, (tijdstip t^g)·, (tijdstip t en ggiiig (tijdstip t^g) achtereenvolgens gevormd, wanneer de index i_ wordt gelncrementeerd.
20 Na de I-de iteratie (golfvorm 609 bij t4) wordt de rechthoek 555 uit de rechthoek 550 geïntroduceerd en wordt daarin de geldende en raster- * excitatiecode β^ιη^, β^π^, ..... ^imi °P9ewelct* De rasterindex wordt in de rechthoek 560 gelncrementeerd en de voorspellingsfilterwerkingen van fig. 4 voor het volgende raster worden op het tijdstip t^ in fig. 6 25 iri de rechthoek 415 ingeleid. Bij het optreden van het FC-kloksignaal voor het volgende raster bij t^ in fig. 6 worden de voorspellingspara-metersignalen voor het raster r+3 gevormd (golfvorm 605 tussen de tijdstippen t^ en t14), worden de a^- en d^-signalen opgewekt voor het raster r+2 (golfvorm 607 tussen de tijdstippen t^ en t^) en wordt de 30 excitatiecode voor het raster r+1 verschaft (golfvorm 609 tussen de tijdstippen t7 en t^).
De rasterexcitatiecode uit de processor volgens fig. 2 wordt via de koppelinrichting 260 aan de codeerinrichting 131 in fig. 1 op de bekende wijze toegevoerd. De codeerinrichting 131 kwantiseert, zoals 35 reeds is vermeld, de excitatiecode en geeft hieraan een bepaald . type 8204641 _______ '·' _______________;_____κ______________;______________________________________^ - 15 - voor het toevoeren aan het netwerk 140. De a^ -voorspellingsparameter-signalen van het raster worden toegevoerd aan een Ingang van de multi-plexinrichting 135 via de vertragingsinrichting 133, zodat de raster-excitatiecode uit de codeerinrichting 131 daarmede op geschikte wijze 5 aan een imiltiplexbeverking kan worden onderworpen.
Het Is duidelijk, dat binnen het kader van de uitvinding verschillende wijzigingen mogelijk zijn. Zo worden bij de bovenbeschreven uitvoeringsvormen lineaire voorspellingsparameters en voorspellingsrest gebruikt. De lineaire voorspellingsparameters kunnen worden vervangen* 10 door fozmantparameters of andere bekende spraakparameters. De voorspel-lingsfilters worden dan zodanig ingericht, dat deze reageren op de spraakparameters, welke worden gebruikt, en op het spraaksignaal, zodat in de keten 120 van fig. 1 gevormde excitatiesignaal in combinatie met de spraakparametersignalen kan worden gebruikt voor het opbouwen van een 15 replica van het spraakpatroon van het raster volgens de uitvinding. Het codeerstelsel volgens de uitvinding kan worden uitgebreid tot sequentiële patronen, zoals biologische en geologische patronen teneinde doeltreffende representaties daarvan te verkrijgen.
.ν'-' 4 8204641 - 16 -
APPENDIX A
C THIS SUBROUTINE IMPLEMENTS BOX NOS 125-FIG. 1 C ++++++ CORRELATION SIGNAL GENERATOR ++++++ COMMON ï(110),THAT(110),H(15),CI<110),A<16),FC16), ...-5 £BETA(12),MC12)
INTEGER I,K,Q,QSTAR,QHAX
DATA NLPC/16/,KMAX/15/,NKAX/110/, EQMAX/95//ALPHA/0.85/,IMAX/12/ C++++ COMPUTE COEFFICIENTS FOR THE PREDICTIVE FILTER 10 G=1
D0101K=1,NLPC
G=G*ALPHA
101 F(K)=A(K)*G
C++++ BOX 305 FIG. 3 ·
15 C++++ COMPUTE IMPULSE RESPONSE OF
C++++ PREDICTIVE FILTER H(Z)
C++++ H(0) IS STORED AS H(1) , H(1) IS C++++ STORED AS H(2), AND SO ON
H(1)-1
20 . D0102K=2,NLPC
H(K)=0 D0102I=1,K-1 102 H(K)=HOO+F(I)*HCK-I)
D01Q3K=NLPC+1/KMAX 25 Η(K)=G
D01031*1tNLPC
103 H (K)=H(fC) +F(I )*H( K-I) SUMSQH=0
D0104K=1,KMAX
30 104 SUKSQH=SUMSQH+H(K)*H(K) C++++ SET INITIAL EXCITATION SIGNAL COUNT - BOX 307 1*1 Q=1 500 Q=1
35 200 CONTINUE
C++++ COMPUTE CORRELATION SIGNAL - BOX 309 D0201H*Q/NHAX
201 CI(Q)=CI(Q)+(Y(N)-YHAT(N))*H(N-Q+1) Q=Q+1 40 IF(Q.LE.QMAX)G0T0200 CALL BQX127(I/SUMSQH) 1=1+1 Λ IFCI.LE.IMAX)GOTO500 \ 8204641 'Λ ' tf· ’ - 17 .
SEIURH END
APPENDIX B
C THIS SUBROUTINE IMPLEMENTS BOX NOS 127 - FIG. 1 5 C ++++++ EXCITATION SIGNAL GENERATOR ++++++ COMMON Y(110),YHAT(110),H(15),CIC110),A<16,F(16), SBETA(12),M<12>
INTEGER I#K*Q*QSTAR,CMAX
DATA HLPC/16/,KMAX/15/,NHAX/110/,QMAX/95/, 10 EALPHA/0.85/, IMAX/12/ C++++ FIND PEAK OF THE CORRELATION SIGNAL -C++++ BOX 315-325 0s 1
QSTARsO
15 CIOSTAR=0
300 IF(ABS(CI(Q)).LT.ABS(CIQSTAR))G0T0301 QSTARsQ
CIQSIAReCI(Q) 301 QsQ+1 20 IF(Q.LE.QMAX)GOT0300
M(I)*eSTAH
BETA(I)=CIflSTAR/SUMSQH
RETURN
END
25 APPENDIX C
C THIS SUBROUTINE IMPLEMENTS ROM 201 - FIG. 2 C ++++++ PREDICTIVE FILTER ++++++ COMMON 0(110) / H( 15) ,ΒΕΤΑΗΒΟ) ,A(16),F(16), EPHI(15),BEIA(12),M(12>
30. INTEGER I/K,QfQSTAR ,QMAX
DATA NLPC/16/,KMAX/15/,NMAX/110/,QMAX/80/, EALPHA/O.85/, IMAX/12/ C++++ READ PREDICTIVE RESIDUAL SIGNAL -BOX 415 CALL INPUT (DC29)/80) 35 C++++ READ PREDICTION PARAMETERS - BOX 420 CALL INPUT(Af16)
C++++ COMPUTE COEFFICIENTS FOR THE PREDICTIVE
C++++ FILTER - BOX 425 OG* 1
40 D0101K*1,NLPC
I G=G*ALPHA
1 101 FCK)=A(K)*G
8204641 i -18-.
C++++ COMPOTE IMPULSE RESPONSE OF PREDICTIVE
C++++ FILTER H(Z) C++++ HCO) IS STORED US H(1) , H(1) C++++ IS STORED AS H(2), AND SO ON 5 C++++ BOX 430 H( 1) = 1
D0102K=2,NLPC
H(K)=0 D01021=1,K-1 10 102 HCK)=H(K)+FCI)*H(IC-I) D0103K=NLPC+1/KMAX H(K)=0 D01031=1,NLPC 103 H(K)=H(K)+F(I)*H(K-I) 15 C++++ COMPUTE AUTOCORRELATION FUNCTION SIGNALS - C++++ BOX 435 D01Q4K=1,ΚΜΑΧ PHI(K)=0
D0104N=K/KMAX
20 104 PKI(tC)=PHI(K) + HCN)*H(N+1C-1)
RETURN
END
APPENDIX D
C THIS SUBROUTINE IMPLEMENTS ROM 205 - FIG. 2 25 C ++++++ EXCITATION PROCESSING ++++++ COMMON DC 110),HC15),BETAI(80),A(16)„ EPHIC15),8EIA(12)/M(12)
INTEGER I/K/Q/QSTAE/QMAX
DATA NLPC/16/rKHAX/15/#NHAX/110//QMAX/80// 30 EAL?HA/0.85/, IMAX/12/ C++++ COMPUTE INITIAL BETAI SIGNAL CI=1) C++++ TERM NO 1 EQUATION 10 AND BOX 515 D0105Q=1,QMAX BETAI(Q)=0 35 DQ105N=Q,Q+2*KMAX-2 K=N-KMAX+1 105 BEIAI(Q)=BETAI(Q)+D(N)*PHI(1+IA35(X-Q)) C++++ SET INITIAL EXCITATION SIGNAL COUNT - BOX 505 1=1 40 Q=1
500 CONTINUE
BEIAMAX=0
200 CONTINUE
'i C++++ COMPUTE BETAI SIGNAL - BOX 515 W' 45 IFCI.EQ.1) GOT 03 00 £ 1 8204641 & - D0201J*1,I-1 201 BETlI(Q)s8EIAI(Q)*ΒΕΓΑ(J)*PHI(1+IABS(H(J)-Q)) C++++ FIND PEAK OF THE BETAI SIGNAL - BOX 520-525 300 IFCABSCBETAICQ)).LT.BETAMAX)G0T0301
5 M(I)*Q
BETAKAX-ABS(BETAI(Q)) BETA (I)«ΒΕΤΑΙCO)/PHIC I) 301 Q*Q+1 IFCQ .LE.QMAX) GOTO 20*0 10 .1*1+1 " IF(I.LE.IMAX)G0T0500 CALI ΟϋΤΡϋΤ(ΒΕΤΑ,ΙΜΛΧ) CALL OUTPUT(M,IMAX) D05K*1,29 15 5 Q(K)*D(K+80) BEÏÜBN '
END
;
J
'4 »: I 8204641
Claims (26)
1. Werkwijze voor het verwerken van een sequentieel patroon, waarbij het sequentiële patroon in opeenvolgende tijdintervallen wordt gesplitst, en een signaal, dat representatief is voor het sequentiële patroon voor elk tijdinterval wordt opgewekt met het kenmerk, dat een kunstmatig : 5 patroon representatief signaal voor het interval wordt opgewekt, een signaal wordt gevormd, dat bestemd is om het verschil tussen de sequentiële patroonrepresentatieve en kunstmatige patroonrepresentatieve signalen voor het interval te reduceren, en het gevormde signaal wordt gebruikt voor het opbouwen van een replica van het sequentiële interval-10 patroon.
2. Werkwijze volgens conclusie 1 met het kenmerk, dat het signaal, dat bestemd is om het verschil te reduceren, wordt gevormd door het opwekken van een signaal, overeenkomende met de verschillen tussen de intervalspraakrepresentatieve en kunstmatige spraakrepresentatieve 15 signalen, en een signaal wordt gevormd, dat bestemd is om het kunstmatige spraakrepresentatieve signaal te modifiëren teneinde het met het verschil overeenkomende signaal te reduceren.
3. Werkwijze volgens conclusie 2 met het kenmerk, dat bij het opwekken van het spraakrepresentatieve signaal een stel spraakparametersignalen 20 wordt opgewekt, die representatief zijn voor het intervalspraakpatroon, en een spraakrepresentatief signaal wordt opgewekt in responsie op de spraakparametersignalen en het spraakpatroon, terwijl bij het opwekken van het kunstmatige spraakrepresentatieve signaal het kunstmatige spraakrepresentatieve intervalsignaal wordt gevormd in responsie op de 25 spraakparametersignalen, terwijl bij het vormen van het signaal een t eerste signaal wordt opgewekt in responsie op het met het verschil overeenkomende signaal, en het kunstmatige spraakrepresentatieve intervalsignaal in responsie op het eerste signaal wordt gewijzigd.
4. Werkwijze volgens conclusie 3 met het kenmerk, dat bij het opwekken 30 van het spraakparametersignaal een stel signalen wordt opgewekt, die O representatief zijn voor het intervalspraakspectrum-
5. Werkwijze volgens conclusie 4, met het kenmerk, dat bij het op-^ wekken van het intervalspraakspectrums ignaal een stel lineaire voor- 8204641 vp . ; - 2¥— . j ' ♦ - * spellingsparametersignalen wordt gevormd in responsie op het interval· spraakpatroon, bij het opwekken van het spraakrepresentatieve signaal een voorspellingsrestsignaal wordt opgewekt in responsie op het inter-valspraakpatroon en de lineaire voorspellingsparameterintervalsignalen, 5 en de lineaire voorspellingsparametersignalen met de voorspellingspara-, metersignalen worden gecombineerd, en bij het opwekken van het eerste signaal een gecodeerd signaal met ten minste één element wordt opgewekt i in responsie op het met het verschil overeenkomende signaal, en hét kunstmatige spraakrepresentatieve intervalsignaal in responsie op het 10 gecodeerde signaalelement wordt gemodifiêerd.
6. Werkwijze volgens conclusie 5, met het kenmerk, dat bij het opwekken van het eerste signaal gedurende een voorafbepaald aantal malen een gecodeerd signaalelement wordt opgewekt in responsie op het met het verschil overeenkomende signaal, en het kunstmatige spraakrepresen- 15 tatieve intervalsignaal in responsie op de gecodeerde signaalelementen wordt gemodifiêerd.
7. Werkwijze volgens conclusie 6 met het kenmerk, dat bij het op- , wekken van het met het verschil overeenkomende signaal een signaal wordt opgewekt, dat representatief is voor de correlatie tussen de spraak-20 representatieve interval- en kunstmatige spraakrepresentatieve signalen.
8. Werkwijze volgens conclusie 5, met het kenmerk, dat bij het opwekken van het met het verschil overeenkomende signaal een signaal wordt opgewekt, dat representatief is voor het effectieve verschil tussen de spraakrepresentatieve interval- en kunstmatige spraakrepresentatieve 25 signalen.
9. Werkwijze volgens conclusie 2 met het kenmerk, dat een gecodeerd signaal wordt opgewekt dat bestemd is cm het kunstmatige spraakrepresentatieve signaal te modifiêren teneinde het met het verschil overeen- i komende signaal te reduceren.
10. Werkwijze volgens conclusie 9 met het kenmerk, dat het opgewekte gecodeerde signaal en de spraakparametersignalen worden gecombineerd voor het opwekken van een gecodeerd signaal, dat representatief, is voor het spraakpatroon. /'% 11. Werkwijze volgens conclusie 9 met het kenmerk, dat bij het opwek- 35 ken van het spraakpatroonsignaal een stel linieaire voorspellingspara-1 metersignalen voor het raster in responsie op een rasterspraakpatxoon 8204641 \ - 22 - wordt opgewekt, bij het opwekken van het rasterspraakrepresentatieve signaal een voorspellingssignaal wordt opgewekt in responsie op de lineaire rastervoorspellingsparametersignalen en het rasterspraakpatroon, en het rasterspraakrepresentatieve signaal wordt gevormd in responsie 5 op de lineaire rastervoorspellingsparametersignalen en het rastervoor-spellingssignaal.
12. Werkwijze volgens conclusie 11 met het kenmerk, dat bij het opwekken van het gecodeerde signaal een gecodeerd signaal met ten minste één element wordt opgewekt in responsie op een met het verschil overeen- 10 komend signaal, en het kunstmatige rasterspraakrepresentatieve signaal in responsie op de gecodeerde signaalelementen wordt gemodifiëerd.
13. Werkwijze volgens conclusie 11 met het kenmerk, dat bij het opwekken van het signaal een uit een aantal elementen bestaand gecodeerd signaal wordt opgewekt door achtereenvolgens een gecodeerd signaalelement 15 op te wekken in responsie op het met het verschil overeenkomende signaal, en het kunstmatige spraakrepresentatieve signaal wordt gemodifiëerd in responsie op de gecodeerde signaalelementen.
14. Werkwijze volgens een der conclusies 2' t/m 13 met het kenmerk, dat het gevormde signaal wordt gebruikt voor het opbouwen van een replica 20 van het intervalspraakpatroon. 15v Sequentiële patroonprocessor voorzien van organen om een sequentieel patroon in opeenvolgende tijdintervallen te splitsen en organen voor het opwekken van een signaal, dat representatief is voor het sequentiële patroon gedurende elk tijdinterval gekenmerkt door organen 25 voor het opwekken van een kunstmatig patroonsignaal voor het interval, organen voor het vormen vein een signaal, dat bestemd is om het verschil tussen de sequentiële patroonrepresentatieve en kunstmatige signalen voor het interval te reduceren, en organen om het gevormde signaal te gebruiken voor het opbouwen van een replica van het sequentiële inter-30 valpatroon.
16. Spraakprocessor voorzien van organen voor het splitsen van een spraakpatroon in opeenvolgende tijdintervallen en organen voor het opwekken van een signaal, dat representatief is voor het spraakpatroon vein elk interval gekenmerkt door organen voor het opwekken van een $ 35 kunstmatig spraakrepresentatief signaal gedurende het tijdinterval, organen voor het opwekken van een signaal dat overeenkomt met de ver- 8204641 .............................. '.........'.....'T*':.........:......'P·.....................*iir:'"ï.......'...........·, ......... 'V,'· v-'cVV' . ·: ......: ·*ΙΪ· ; ï-- ;. r-y y·. ' . ................. ' ;; *’·- * . " *·. ; . . - 23 - schillen tussen de spraakrepresentatieve Interval- en kunstmatige spraakrepresentatieve signalen, en organen voor het vormen van een signaal, dat bestemd om het kunstmatige spraakrepresentatieve signaal te modifiêren teneinde het met het verschil overeenkomende signaal te redu-. j 5 eer en..
17. Spraakprocessor volgens conclusie 16 met het kenmerk, dat de organen voor het opwekken van het spraakrepresentatieve signaal zijn voorzien I, van organen voor het opwekken van een stel spraakparametersignalen voor het intervalspraakpatroon, en organen, die in responsie op de spraak-10 parametersignalen en het spraakpatroon het spraakrepresentatieve signa&l opwekken, waarbij de organen voor het opwekken van het kunstmatige spraakrepresentatieve signaal zijn voorzien van organen, die in responsie op de spraakparametersignalen het kunstmatige spraakrepresentatieve intervalsignaal opwekken» en de signaalvozmingsorganen zijn voorzien 15 van organen, die in responsie op het met het verschil overeenkomende signaal een eerste signaal opwekken, en organen, die in responsie op het eerste signaal het kunstmatige spraakrepresentatieve intervalsignaal modifiêren.
18. Spraakprocessor volgens conclusie 17 met het kenmerk, dat de 20 organen voor het opwekken van het spraakparamaterslgnaal zijn voorzien van organen voor het opwekken van een stel signalen, die representatief zijn voor het intervalspraakpatroonspectrum.
19. Spraakprocessor volgens conclusie 18 met het kenmerk, dat de organen voor het opwekken van het spraakparameterslgnaal zijn voorzien 25 van organen, die in responsie op het intervalspraakpatroon een stel lineaire voorspellingsparametersignalen vormen, de organen voor het opwekken van het spraakrepresentatieve signaal zijn voorzien van organen, die in responsie op het Intervalspraakpatroon en de lineaire voorspellingsparametersignalen een voorspellingsrestsignaal vormen, en organen 30 voor het combineren van de lineaire intervalvoorspellingsparametersignalen met het voorspellingsrestsignaal teneinde het spraakrepresentatieve intervalsignaal te vormen, waarbij de organen voor het opwekken | van het eerste signaal zijn voorzien van organen, die in responsie op '/ het met het verschil overeenkomende signaal een gecodeerd signaal met \ 35 ten minste één element opwekken, en organen, die in responsie op het 820 46 41 ~ - - 24 - gecodeerde signaalelement het kunstmatige intervalsignaal modifiëren.
20. Spraakprocessor volgens conclusie 19 met het kenmerk, dat de organen voor het opwekken van het eerste signaal zijn voorzien van organen, die N maal in werking treden voor het opwekken van een gecodeerd signaal 5 met N elementen, voorzien van organen, die in responsie op het met het verschil overeenkomende signaal een gecodeerd signaalelement opwekken, en organen, die in responsie op het gecodeerde signaalelement het kunstmatige spraakrepresentatieve intervalsignaal modifiëren.
21. Spraakprocessor volgens conclusie 20 met het kenmerk, dat de 10 organen voor het opwekken van het met het verschil overeenkomende signaal zijn voorzien van organen voor het opwekken van een signaal, dat representatief is voor de correlatie tussen de spraakrepresentatieve interval-en kunstmatige spraakrepresentatieve signalen.
22. Spraakprocessor volgens conclusie 15 met het kenmerk, dat de orga-15 nen voor het opwekken van het met het verschil overeenkomende signaal zijn voorzien van organen voor het opwekken van een signaal, dat representatief is voor het effectieve verschil tussen de spraakrepresentatieve interval- en kunstmatige spraakrepresentatieve signalen.
23. Spraakprocessor volgens conclusie 16 gekenmerkt door organen voor 20 het opwekken van een gecodeerd signaal, dat bestemd is om het kunstmatige spraakrepresentatieve signaal te modifiëren teneinde het met het verschil overeenkomende signaal te reduceren.
24. Spraakprocessor volgens conclusie 23 gekenmerkt door organen voor het combineren van het opgewekte gecodeerde signaal en de spraakparameter- 25 signalen tenéinde een gecodeerd signaal te vormen, dat representatief is voor het spraakpatroon.
25. Spraakprocessor volgens conclusie 23 met het kenmerk, dat de orga-nen voor het opwekken van het spraakparametersignaal zijn voorzien van organen, die in responsie op het spraakpatroon een stel lineaire voor- 30 spellingsparametersignalen opwekken, de organen voor het opwekken van het spraakrepresentatieve signaal zijn voorzien van organen, die in responsie op de lineaire voorspellingsparametersignalen en het spraakpatroon een voorspellingsrestsignaal opwekken, en organen, die in responsie op de lineaire voorspellingsparametersignalen en het voorspellings-35 restsignaal het spraakrepresentatieve signaal vormen. \ 8204641----------------- ..........................................’.....' ” .............:............;.............'.......................... . ' ' ' - 'TV*" Ί-i——*—:----— -—— -:-:----:-----\ : - 25 - f '
26. Spraakprocessor volgen* conclusie 25 met het kenmerk, dat de orga- m * nen voor het opwekken van het gecodeerde signaal zijn voorzien van organen, die in responsie op het met het verschil overeenkomende signaal een gecodeerdsignaal met ten minste één element opwekken, en organen,' die ' • 5 in responsie op het gecodeerde signaalelement het kunstmatige spraak-representatieve signaal modifiéren. "I" 27. Spraakprocessor volgens conclusie 25 met het kenmerk, dat de | organen voor het opwekken van het gecodeerde signaal zijn voorzien van organen voor het opwekken van een uit een aantaLelementen bestaandecode-10 signaal voorzien van organen, die achtereenvolgens in werking treden voor het opwekken van een gecodeerd signaalelement in responsie op het Ί'. ’ met het verschil overeenkomende signaal en het wijzigen van het kunstmatige spraakrepresentatieve signaal in responsie op de gecodeerde signaalelementen. 15 28v Spraakprocessor volgens conclusie 16 gekenmerkt door organen, die in responsie op het met het verschil overeenkomende signaal een gecodeerd excitatiesignaal voor het Interval opwekken en het gecodeerde excitatie-signaal toevoeren aan de organen voor het opwekken van het kunstmatige spraakrepresentatieve signaal teneinde het met het verschil overeenkomende 20 signaal te reduceren.
29. Spraakprocessor volgens conclusie 28, gekenmerkt door organen, die in responsie op het gecodeerde excitatiesignaal en de voorspellings-parametersignalen een replica van het spraakpatroon opbouwen.
30. Spraakprocessor volgens conclusie 28 of 29 met het kenmerk, dat 25 de organen voor het opwekken van het gecodeerde excitatiesignaal zijn voorzien van organen, die achtereenvolgens in werking treden voor het Vormen van een uit een aantal elementen opgebouwd gecodeerd signaal, voorzien van organen, die in responsie op het met het verschil overeenkomende signaal een element van de uit een aantal elementen bestaande 30 code vormen en het kunstmatige spraakrepresentatieve signaal in responsie op de gecodeerde signaalelementen wijzigen. 820 4 6 4 ! " ' —— TT’’ " ί
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US32637181 | 1981-12-01 | ||
US06/326,371 US4472832A (en) | 1981-12-01 | 1981-12-01 | Digital speech coder |
Publications (3)
Publication Number | Publication Date |
---|---|
NL8204641A true NL8204641A (nl) | 1983-07-01 |
NL193037B NL193037B (nl) | 1998-04-01 |
NL193037C NL193037C (nl) | 1998-08-04 |
Family
ID=23271926
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
NL8204641A NL193037C (nl) | 1981-12-01 | 1982-11-30 | Werkwijze en inrichting voor het bewerken van spraak. |
Country Status (8)
Country | Link |
---|---|
US (1) | US4472832A (nl) |
JP (2) | JPS6046440B2 (nl) |
CA (1) | CA1181854A (nl) |
DE (1) | DE3244476A1 (nl) |
FR (1) | FR2517452B1 (nl) |
GB (1) | GB2110906B (nl) |
NL (1) | NL193037C (nl) |
SE (2) | SE456618B (nl) |
Families Citing this family (60)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4720863A (en) * | 1982-11-03 | 1988-01-19 | Itt Defense Communications | Method and apparatus for text-independent speaker recognition |
JPS59153346A (ja) * | 1983-02-21 | 1984-09-01 | Nec Corp | 音声符号化・復号化装置 |
EP0119033B1 (en) * | 1983-03-11 | 1987-04-15 | Prutec Limited | Speech encoder |
US4731846A (en) * | 1983-04-13 | 1988-03-15 | Texas Instruments Incorporated | Voice messaging system with pitch tracking based on adaptively filtered LPC residual signal |
US4667340A (en) * | 1983-04-13 | 1987-05-19 | Texas Instruments Incorporated | Voice messaging system with pitch-congruent baseband coding |
US4638451A (en) * | 1983-05-03 | 1987-01-20 | Texas Instruments Incorporated | Microprocessor system with programmable interface |
US4720865A (en) * | 1983-06-27 | 1988-01-19 | Nec Corporation | Multi-pulse type vocoder |
US4669120A (en) * | 1983-07-08 | 1987-05-26 | Nec Corporation | Low bit-rate speech coding with decision of a location of each exciting pulse of a train concurrently with optimum amplitudes of pulses |
NL8302985A (nl) * | 1983-08-26 | 1985-03-18 | Philips Nv | Multipulse excitatie lineair predictieve spraakcodeerder. |
CA1236922A (en) * | 1983-11-30 | 1988-05-17 | Paul Mermelstein | Method and apparatus for coding digital signals |
CA1223365A (en) * | 1984-02-02 | 1987-06-23 | Shigeru Ono | Method and apparatus for speech coding |
US4701954A (en) * | 1984-03-16 | 1987-10-20 | American Telephone And Telegraph Company, At&T Bell Laboratories | Multipulse LPC speech processing arrangement |
EP0163829B1 (en) * | 1984-03-21 | 1989-08-23 | Nippon Telegraph And Telephone Corporation | Speech signal processing system |
US4709390A (en) * | 1984-05-04 | 1987-11-24 | American Telephone And Telegraph Company, At&T Bell Laboratories | Speech message code modifying arrangement |
JPS60239798A (ja) * | 1984-05-14 | 1985-11-28 | 日本電気株式会社 | 音声信号符号化/復号化装置 |
US4872202A (en) * | 1984-09-14 | 1989-10-03 | Motorola, Inc. | ASCII LPC-10 conversion |
US4722002A (en) * | 1984-12-25 | 1988-01-26 | Nec Corporation | Method and apparatus for encoding/decoding image signal |
US4675863A (en) | 1985-03-20 | 1987-06-23 | International Mobile Machines Corp. | Subscriber RF telephone system for providing multiple speech and/or data signals simultaneously over either a single or a plurality of RF channels |
FR2579356B1 (fr) * | 1985-03-22 | 1987-05-07 | Cit Alcatel | Procede de codage a faible debit de la parole a signal multi-impulsionnel d'excitation |
NL8500843A (nl) * | 1985-03-22 | 1986-10-16 | Koninkl Philips Electronics Nv | Multipuls-excitatie lineair-predictieve spraakcoder. |
US4944013A (en) * | 1985-04-03 | 1990-07-24 | British Telecommunications Public Limited Company | Multi-pulse speech coder |
US4912764A (en) * | 1985-08-28 | 1990-03-27 | American Telephone And Telegraph Company, At&T Bell Laboratories | Digital speech coder with different excitation types |
US4890328A (en) * | 1985-08-28 | 1989-12-26 | American Telephone And Telegraph Company | Voice synthesis utilizing multi-level filter excitation |
US4720861A (en) * | 1985-12-24 | 1988-01-19 | Itt Defense Communications A Division Of Itt Corporation | Digital speech coding circuit |
US4827517A (en) * | 1985-12-26 | 1989-05-02 | American Telephone And Telegraph Company, At&T Bell Laboratories | Digital speech processor using arbitrary excitation coding |
USRE34247E (en) * | 1985-12-26 | 1993-05-11 | At&T Bell Laboratories | Digital speech processor using arbitrary excitation coding |
US4935963A (en) * | 1986-01-24 | 1990-06-19 | Racal Data Communications Inc. | Method and apparatus for processing speech signals |
CA1323934C (en) * | 1986-04-15 | 1993-11-02 | Tetsu Taguchi | Speech processing apparatus |
US4868867A (en) * | 1987-04-06 | 1989-09-19 | Voicecraft Inc. | Vector excitation speech or audio coder for transmission or storage |
US4969192A (en) * | 1987-04-06 | 1990-11-06 | Voicecraft, Inc. | Vector adaptive predictive coder for speech and audio |
US4890327A (en) * | 1987-06-03 | 1989-12-26 | Itt Corporation | Multi-rate digital voice coder apparatus |
US4896361A (en) * | 1988-01-07 | 1990-01-23 | Motorola, Inc. | Digital speech coder having improved vector excitation source |
US4817157A (en) * | 1988-01-07 | 1989-03-28 | Motorola, Inc. | Digital speech coder having improved vector excitation source |
US5285520A (en) * | 1988-03-02 | 1994-02-08 | Kokusai Denshin Denwa Kabushiki Kaisha | Predictive coding apparatus |
JP2625998B2 (ja) * | 1988-12-09 | 1997-07-02 | 沖電気工業株式会社 | 特徴抽出方式 |
SE463691B (sv) * | 1989-05-11 | 1991-01-07 | Ericsson Telefon Ab L M | Foerfarande att utplacera excitationspulser foer en lineaerprediktiv kodare (lpc) som arbetar enligt multipulsprincipen |
US5261027A (en) * | 1989-06-28 | 1993-11-09 | Fujitsu Limited | Code excited linear prediction speech coding system |
JPH0332228A (ja) * | 1989-06-29 | 1991-02-12 | Fujitsu Ltd | ゲイン―シェイプ・ベクトル量子化方式 |
US5263119A (en) * | 1989-06-29 | 1993-11-16 | Fujitsu Limited | Gain-shape vector quantization method and apparatus |
JPH0365822A (ja) * | 1989-08-04 | 1991-03-20 | Fujitsu Ltd | ベクトル量子化符号器及びベクトル量子化復号器 |
US5235669A (en) * | 1990-06-29 | 1993-08-10 | At&T Laboratories | Low-delay code-excited linear-predictive coding of wideband speech at 32 kbits/sec |
SE467806B (sv) * | 1991-01-14 | 1992-09-14 | Ericsson Telefon Ab L M | Metod att kvantisera linjespektralfrekvenser (lsf) vid beraekning av parametrar foer ett analysfilter ingaaende i en talkodare |
US5301274A (en) * | 1991-08-19 | 1994-04-05 | Multi-Tech Systems, Inc. | Method and apparatus for automatic balancing of modem resources |
US5659659A (en) * | 1993-07-26 | 1997-08-19 | Alaris, Inc. | Speech compressor using trellis encoding and linear prediction |
US5546383A (en) | 1993-09-30 | 1996-08-13 | Cooley; David M. | Modularly clustered radiotelephone system |
US5602961A (en) * | 1994-05-31 | 1997-02-11 | Alaris, Inc. | Method and apparatus for speech compression using multi-mode code excited linear predictive coding |
AU696092B2 (en) * | 1995-01-12 | 1998-09-03 | Digital Voice Systems, Inc. | Estimation of excitation parameters |
SE508788C2 (sv) * | 1995-04-12 | 1998-11-02 | Ericsson Telefon Ab L M | Förfarande att bestämma positionerna inom en talram för excitationspulser |
JP3137176B2 (ja) * | 1995-12-06 | 2001-02-19 | 日本電気株式会社 | 音声符号化装置 |
DE19643900C1 (de) * | 1996-10-30 | 1998-02-12 | Ericsson Telefon Ab L M | Nachfiltern von Hörsignalen, speziell von Sprachsignalen |
US5839098A (en) * | 1996-12-19 | 1998-11-17 | Lucent Technologies Inc. | Speech coder methods and systems |
US5832443A (en) * | 1997-02-25 | 1998-11-03 | Alaris, Inc. | Method and apparatus for adaptive audio compression and decompression |
US6003000A (en) * | 1997-04-29 | 1999-12-14 | Meta-C Corporation | Method and system for speech processing with greatly reduced harmonic and intermodulation distortion |
US7392180B1 (en) | 1998-01-09 | 2008-06-24 | At&T Corp. | System and method of coding sound signals using sound enhancement |
US6182033B1 (en) | 1998-01-09 | 2001-01-30 | At&T Corp. | Modular approach to speech enhancement with an application to speech coding |
US5963897A (en) * | 1998-02-27 | 1999-10-05 | Lernout & Hauspie Speech Products N.V. | Apparatus and method for hybrid excited linear prediction speech encoding |
US6516207B1 (en) * | 1999-12-07 | 2003-02-04 | Nortel Networks Limited | Method and apparatus for performing text to speech synthesis |
US7295614B1 (en) | 2000-09-08 | 2007-11-13 | Cisco Technology, Inc. | Methods and apparatus for encoding a video signal |
JP4209257B2 (ja) | 2003-05-29 | 2009-01-14 | 三菱重工業株式会社 | 分散型コントローラとその動作方法、及び、分散型コントローラを備えるフォークリフト |
EP2595146A1 (en) * | 2011-11-17 | 2013-05-22 | Nederlandse Organisatie voor toegepast -natuurwetenschappelijk onderzoek TNO | Method of and apparatus for evaluating intelligibility of a degraded speech signal |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3346695A (en) * | 1963-05-07 | 1967-10-10 | Gunnar Fant | Vocoder system |
US3624302A (en) * | 1969-10-29 | 1971-11-30 | Bell Telephone Labor Inc | Speech analysis and synthesis by the use of the linear prediction of a speech wave |
US3740476A (en) * | 1971-07-09 | 1973-06-19 | Bell Telephone Labor Inc | Speech signal pitch detector using prediction error data |
DE2435654C2 (de) * | 1974-07-24 | 1983-11-17 | Gretag AG, 8105 Regensdorf, Zürich | Verfahren und Vorrichtung zur Analyse und Synthese von menschlicher Sprache |
JPS5246642A (en) * | 1975-10-09 | 1977-04-13 | Mitsubishi Metal Corp | Swimming pool |
JPS5343403A (en) * | 1976-10-01 | 1978-04-19 | Kokusai Denshin Denwa Co Ltd | System for analysing and synthesizing voice |
US4130729A (en) * | 1977-09-19 | 1978-12-19 | Scitronix Corporation | Compressed speech system |
US4133976A (en) * | 1978-04-07 | 1979-01-09 | Bell Telephone Laboratories, Incorporated | Predictive speech signal coding with reduced noise effects |
US4184049A (en) * | 1978-08-25 | 1980-01-15 | Bell Telephone Laboratories, Incorporated | Transform speech signal coding with pitch controlled adaptive quantizing |
JPS5648690A (en) * | 1979-09-28 | 1981-05-01 | Hitachi Ltd | Sound synthesizer |
-
1981
- 1981-12-01 US US06/326,371 patent/US4472832A/en not_active Ceased
-
1982
- 1982-11-18 CA CA000415816A patent/CA1181854A/en not_active Expired
- 1982-11-22 SE SE8206641A patent/SE456618B/sv not_active IP Right Cessation
- 1982-11-25 FR FR8219772A patent/FR2517452B1/fr not_active Expired
- 1982-11-29 GB GB08233923A patent/GB2110906B/en not_active Expired
- 1982-11-30 NL NL8204641A patent/NL193037C/nl not_active IP Right Cessation
- 1982-12-01 JP JP57209489A patent/JPS6046440B2/ja not_active Expired
- 1982-12-01 DE DE19823244476 patent/DE3244476A1/de active Granted
-
1985
- 1985-07-25 JP JP60163090A patent/JPH0650437B2/ja not_active Expired - Lifetime
-
1987
- 1987-10-27 SE SE8704178A patent/SE467429B/sv not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
JPS6156400A (ja) | 1986-03-22 |
CA1181854A (en) | 1985-01-29 |
FR2517452B1 (fr) | 1986-05-02 |
SE8704178L (sv) | 1987-10-27 |
DE3244476A1 (de) | 1983-07-14 |
NL193037C (nl) | 1998-08-04 |
SE467429B (sv) | 1992-07-13 |
JPS58105300A (ja) | 1983-06-23 |
NL193037B (nl) | 1998-04-01 |
JPH0650437B2 (ja) | 1994-06-29 |
SE8704178D0 (sv) | 1987-10-27 |
SE8206641L (sv) | 1983-06-02 |
GB2110906A (en) | 1983-06-22 |
DE3244476C2 (nl) | 1988-01-21 |
SE456618B (sv) | 1988-10-17 |
FR2517452A1 (fr) | 1983-06-03 |
GB2110906B (en) | 1985-10-02 |
US4472832A (en) | 1984-09-18 |
SE8206641D0 (sv) | 1982-11-22 |
JPS6046440B2 (ja) | 1985-10-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
NL8204641A (nl) | Digitale spraakprocessor. | |
CA1222568A (en) | Multipulse lpc speech processing arrangement | |
USRE32580E (en) | Digital speech coder | |
US4975958A (en) | Coded speech communication system having code books for synthesizing small-amplitude components | |
JPH10187196A (ja) | 低ビットレートピッチ遅れコーダ | |
EP0477960B1 (en) | Linear prediction speech coding with high-frequency preemphasis | |
EP1420391B1 (en) | Generalized analysis-by-synthesis speech coding method, and coder implementing such method | |
CA2006487C (en) | Communication system capable of improving a speech quality by effectively calculating excitation multipulses | |
US5598504A (en) | Speech coding system to reduce distortion through signal overlap | |
US5202953A (en) | Multi-pulse type coding system with correlation calculation by backward-filtering operation for multi-pulse searching | |
CA1240396A (en) | Relp vocoder implemented in digital signal processors | |
EP0539103B1 (en) | Generalized analysis-by-synthesis speech coding method and apparatus | |
CA1336841C (en) | Multi-pulse type coding system | |
US7472056B2 (en) | Transcoder for speech codecs of different CELP type and method therefor | |
JPH0411040B2 (nl) | ||
JP2853126B2 (ja) | マルチパルス符号化装置 | |
Chu | Tree encoding of speech signals at low bit rates | |
JPH09297598A (ja) | 音声符号化/復号化装置 | |
JPS6041100A (ja) | マルチパルス型ボコ−ダ | |
JPS60239799A (ja) | マルチパルス型ボコ−ダ | |
JPH043880B2 (nl) | ||
JPH0242239B2 (nl) | ||
JPH043877B2 (nl) |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
BA | A request for search or an international-type search has been filed | ||
A85 | Still pending on 85-01-01 | ||
BB | A search report has been drawn up | ||
BC | A request for examination has been filed | ||
V4 | Discontinued because of reaching the maximum lifetime of a patent |
Effective date: 20021130 |