NL8503304A - Werkwijze en inrichting voor het segmenteren van een uit een akoestisch signaal, bij voorbeeld een spraaksignaal, afgeleid elektrisch signaal. - Google Patents

Werkwijze en inrichting voor het segmenteren van een uit een akoestisch signaal, bij voorbeeld een spraaksignaal, afgeleid elektrisch signaal. Download PDF

Info

Publication number
NL8503304A
NL8503304A NL8503304A NL8503304A NL8503304A NL 8503304 A NL8503304 A NL 8503304A NL 8503304 A NL8503304 A NL 8503304A NL 8503304 A NL8503304 A NL 8503304A NL 8503304 A NL8503304 A NL 8503304A
Authority
NL
Netherlands
Prior art keywords
transition
transition functions
functions
equality
combined
Prior art date
Application number
NL8503304A
Other languages
English (en)
Original Assignee
Philips Nv
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Philips Nv filed Critical Philips Nv
Priority to NL8503304A priority Critical patent/NL8503304A/nl
Priority to US06/930,835 priority patent/US4813074A/en
Priority to EP86202092A priority patent/EP0227146B1/en
Priority to DE8686202092T priority patent/DE3679966D1/de
Priority to JP61281628A priority patent/JP2527168B2/ja
Priority to CA000523797A priority patent/CA1296101C/en
Publication of NL8503304A publication Critical patent/NL8503304A/nl

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/04Segmentation; Word boundary detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

♦ * >”* PHN 11.575 1 N.V. Philips' Gloeilampenfabrieken te Eindhoven.
Werkwijze en inrichting voor het segmenteren van een uit een akoestisch signaal, bij voorbeeld een spraaksignaal, afgeleid elektrisch signaal.
De uitvinding heeft betrekking op een werkwijze voor het segementeren van een uit een akoestisch signaal afgeleid elektrisch signaal waarbij achtereenvolgens - uit het elektrische signaal een aantal parameters worden afgeleid als 5 funktie van de tijd, - voor opeenvolgende tijdstippen de binnen een rond elk tijdstip gelegen tijdinterval liggende gedeelten van de parameters worden ingenomen, - voor elk tijdstip uit de binnen het bijbehorende tijdinterval liggende gedeelten van de parameters een transitiefunktie 0 wordt bepaald, en 10 - uit de bij de tijdstippen behorende transitiefunkties, informatie betreffende de segmenten waaruit het akoestische signaal is opgebouwd, wordt afgeleid.
De uitvindinge heeft eveneens betrekking op een inrichting voor het uitvoeren van de werkwijze. Een werkwijze van de in de aanhef 15 genoemde soort is bekend uit de PTC aanvrage WO 84/04194.
De aanvrage beschrijft een temporele decompositie-werkwijze van B.S. Atal voor het zo ekonomisch mogelijk koderen en vervolgens overzenden van spraak, welke werkwijze de akoestische vektoren en hun bijbehorende transitiefunkties voor een spraakuiting 20 bepaalt. Atal beschrijft daarin een procedure voor het bepalen van een transitiefunktie die het meest centraal is gelegen in een zeker tijdinterval. Door het schuiven van het tijdinterval over kleine tijdstappen kunnen opvolgende transitiefunkties worden bepaald. Voor een gedetaileerde beschrijving van de werkwijze zij verwezen naar de 25 publikatie "Efficient coding of LPC parameters by temporal decomposition" van B.S. Atal in ICASSP 83, de proceedings p. 81-84, en naar de publikatie "Temporal decomposition of speech" van S.M. Marcus et al, IPO annual progress report nr. 19 van 1984, p. 25 ev.
De werkwijze van Atal maakt gebruik van een mathematische 30 procedure die transitiefunkties (en bijbehorende akoestische vektoren) oplevert die in de praktijk weinig overeenkomst blijken te hebben met fonetisch relevante gebeurtenissen in het spraaksignaal.
r* ·» ** ·* -v \ A Λ ;* Λ ·* *: J Ϊ PHN 11.575 2 E.A. Zuk heeft nu ontdekt dat de bekende werkwijze een belangrijk nadeel heeft, welk nadeel in het bijzonder tot uitdrukking komt indien men met de bekende werkwijze fonetisch relevante gebeurtenissen in het spraaksignaal zou willen vastleggen, zie E.A. Zuk 5 “An investigation of temporal decomposition of speech parameters for automatic segmentation of Speech", IPO rapport nr. 459. Zuk vond dat kleine variaties in bijvoorbeeld de lengte van het tijdinterval een grote invloed hadden op de met de bekende werkwijze verkregen transitiefunkties. Vooral indien men een fysische relatie wenst tussen 10 akoestische vektoren waaruit het spraaksignaal is opgebouwd en fonetisch relevante gebeurtenissen in het spraaksignaal, is deze grote invloed zeer ongewenst. Het zou namelijk betekenen dat een andere keuze voor de lengte van het tijdvenster op een zeker tijdstip tijdens het spraaksignaal zou leiden tot een andere akoestische vektor in het 15 betreffende tijdvenster.
De uitvinding beoogt dit nadeel te ondervangen en beoogt een werkwijze respektievelijk inrichting te verschaffen die minder afhankelijk is van de keuze van bijvoorbeeld de lengte van de tijdintervallen, waardoor op een betere wijze een spraaksignaal kan 20 worden gesegmenteerd in in de tijd overlappende gebeurtenissen die nauw aansluiten bij de fonetisch relevante gebeurtenissen in het spraaksignaal.
De werkwijze volgens de uitvinding heeft daartoe het kenmerk, dat 25 (a) geli'jkheidsfaktoren (similarity factors) C— worden bepaald tussen telkens twee transitiefunkties (0^ en 0j) behorende bij twee bij elkaar in de buurt liggende tijdstippen i en j, (b) uit de transitiefunkties van ten minste één groep van twee transitiefunkties met een bijbehorende gelijkheidsfaktor groter 30 dan een referentiewaarde V een vervangende transitiefunktie wordt afgeleid die de voornoemde twee transitiefunkties vervangt.
De werkwijze van Atal voor het verkrijgen van de informatie betreffende de segmenten bestaat daarin dat voor elk tijdstip een transitiefunktie en zijn bijbehorend zwaartepunt wordt bepaald 35 en het verschil tussen het tijdstip waartoe de transitiefunktie behoorde en het zwaartepunt langs de tijdas wordt uitgezet. Men verkrijgt dan de zaagtandvormige kurve zoals in figuur 11 van WO 84/04194 is aangegeven.
^ ^ 1 fi jj
V ij » "J
PHN 11.575 3
Uit deze kurve kan dan de gewenste informatie, bijvoorbeeld het werkelijke aantal transitiefunkties dat nodig is om het spraaksignaal in de tijd te beschrijven worden bepaald.
In tegenstelling tot de bekende werkwijze worden nu alle 5 transitiefunkties volledig opgeslagen (in ieder geval dat deel van de transitiefunkties binnen het tijdinterval dat een - duidelijk - van nul verschillende waarde heeft) en verder verwerkt. De volgens de uitvinding verkregen vervangende transitiefunkties blijken veel minder gevoelig te zijn voor variaties in meetomstandigheden, zoals bijvoorbeeld de 10 keuze van de grootte van het tijdvenster dat gebruikt is.
Een en ander maakt de werkwijze volgens de uitvinding zeer bruikbaar voor toepassing bij spraakherkenning, een toepassing die met de bekende werkwijze niet goed mogelijk was.
Het afleiden van de vervangende transitiefunktie kan op 15 verschillende manieren gerealiseerd worden.
Een eerste mogelijkheid is dat men transitiefunkties met elkaar kombineert en daaruit een gekombineerde transitiefunktie berekent. De vervangende transitiefunktie heet dan een gekombineerde transitiefunktie. Men kan bij voorbeeld twee transitiefunkties uit 20 één groep kombineren. Ook kan men transitiefunkties uit twee of meer groepen kombineren. Aangenomen dat deze groepen alle voldoen aan de eis dat de bijbehorende gelijkheidsfaktoren groter zijn dan de referentiewaarde V. In dat geval kunnen dan drie of meer transitiefunkties gekombineerd worden. Het kombineren van 25 transitiefunkties kan betekenen, zoals later zal blijken, het (gewogen) gemiddelde bepalen van de transitiefunkties in kwestie. Doch het zij hier vermeld dat ook andere manieren van het kombineren van transitiefunkties tot de mogelijkheden behoren.
Een tweede mogelijkheid is dat een vervangende 30 transitiefunktie wordt afgeleid uit één of meer groepen (twee of meer transitiefunkties) bij voorbeeld doordat van de twee transitiefunkties uit een groep één transitiefunktie genomen wordt die als vervangende transitiefunktie optreedt, of doordat van de drie of meer transitiefunkties uit twee of meer groepen met bijbehorende 35 gelijkheidsfaktoren groter dan de referentiewaarde V, die transitiefunktie als vervangende transitiefunktie genomen wordt die de meeste gelijkheid vertoont met de andere transitiefunkties behorende bij *-*-’* *' # PHN 11.575 · 4 de twee of meer groepen.
In de verdere beschrijving zal steeds aangenomen worden dat slechts twee transitiefunkties uit,één groep gekombineerd zullen worden en daaruit een gekombineerde transitiefunktie berekend zal 5 worden.
De werkwijze kan verder zijn gekenmerkt door (c) dat de gekombineerde transitiefunktie de ene van de twee transitie-funkties waaruit de gekombineerde transitiefunktie is afgeleid, vervangt en de andere van de twee transitiefunkties wordt weggelaten, 10 (d) dat vervolgens gelijkheidsfaktoren worden bepaald tussen de gekombineerde transitiefunktie en de transitiefunkties behorende bij tijdstippen liggend in de buurt van het tijdstip waartoe de gekombineerde transitiefunktie behoort, en dat de gelijkheidsfaktoren behorend tot die kombinaties van twee transitiefunkties, waarvan er 15 één één van de twee transitiefunkties is waaruit de gekombineerde transitiefunktie is afgeleid, worden weggelaten. Het maakt daarbij niet direkt uit voor welke van de twee transitiefunkties de gekombineerde transitiefunktie in de plaats komt.
De beslissing dat twee transitiefunkties (moeten) worden 20 gekombineerd kan op verschillende manieren worden genomen.
Men kan bijvoorbeeld de referentiewaarde in eerste instantie zodanig kiezen dat deze ligt tussen de waardes van de grootste en de op één na grootste gelijkheidsfaktor. In dat geval worden de twee transitiefunkties met de grootste gelijkheidsfaktor met elkaar 25 gekombineerd.
De werkwijze kan dan verder zijn gekenmerkt door (e) dat, indien er vervolgens ten minste één gelijkheidsfaktor is die groter is dan de voornoemde referentiewaarde, de bij deze gelijkheidsfaktor behorende transitiefunkties worden samengenomen en uit 30 deze twee transitiefunkties een gekombineerde transitiefunktie wordt afgeleid die de voornoemde twee transitiefunkties vervangt, waarna de werkwijze wordt vervolgd met stap (c), (f) dat, indien er geen gelijkheidsfaktoren zijn die groter zijn dan de voornoemde referentiewaarde, de referentiewaarde met een konstante 35 waarde wordt verlaagd, (g) dat vervolgens bepaald wordt of de aldus verkregen referentiewaarde groter is dan een zekere konstante, q * η ~ 1 3 i -J: v ij v v 'w c. —* :.-- · '« PHN 11.575 5 (h) dat, indien de referentiewaarde groter is dan de genoemde konstante, de werkwijze wordt vervolgd met stap (e), en (i) dat, indien de referentiewaarde kleiner is dan de genoemde konstante, de werkwijze wordt beëindigd.
5 Een andere mogelijkheid is dat de twee transitiefunkties met de grootste gelijkheidsfaktor worden gekombineerd. De eerder genoemde referentiewaarde is dan een fiktief getal. In dit geval kan de werkwijze zijn gekenmerkt doordat bepaald wordt of de grootste gelijkheidsfaktor groter is dan een zekere konstante, 10 (e) dat, indien de grootste gelijkheidsfaktor groter is dan deze konstante, uit de bij deze gelijkheidsfaktor behorende transitiefunkties een gekombineerde transitiefunktie wordt afgeleid die de voornoemde twee transitiefunkties vervangt, waarna de werkwijze wordt vervolgd met stap (c), 15 (f) dat, indien de grootste gelijkheidsfaktor kleiner is dan of gelijk is aan deze konstante, de werkwijze wordt beëindigd.
Indien transitiefunkties 0^ en 0j voor het eerst dienen te worden gekombineerd kan. men de gekombineerde transitiefunktie 0jj bijvoorbeeld door middel van de volgende formule worden 20 berekend: 0ijc = (0j_ + 0j)/2
In feite is de gekombineerde transitiefunktie hier het gemiddelde vein de originele transitiefunkties 0^ en 0j.
Indien een gekombineerde transitiefunktie 0^jC 25 dient te worden afgeleid uit transitiefunkties 0^ respektievelijk 0^ die zelf in eerdere stappen (b) respektievelijk (e) van de werkwijze zijn verkregen uit kombinaties van transitiefunkties, kan deze gekombineerde transitiefunktie bijvoorbeeld als volgt worden verkregen: 0ijC = (HjL0i+nj0j)/(ni+nj) 30 waarbij n^ en nj aangeven dat aantal van de oorspronkelijke transitiefunkties waaruit de transitiefunkties 0^ en 0j, door het in één of meer voorgaande kombinatiestappen kombineren van twee transitiefunkties, zijn verkregen.
In feite is 0jjC hier gelijk aan het gewogen 35 gemiddelde van 0j_ en 0j en daarmee gelijk aan het gemiddelde van nj+nj oorspronkelijke transitiefunkties. Aan de gekombineerde transitiefunktie dient nu een nieuw getal n te worden toegevoegd. De
» \) J y* U
i * i PHN 11.575 6 werkwijze heeft daartoe het kenmerk, dat aan de gekombineerde transitiefunktie een getal nc wordt toegevoegd dat gelijk is aan n-ttij, welk getal nc aangeeft uit hoeveel oorspronkelijke transitiefunkties de gekombineerde transitiefunktie door het 5 in één of meer voorgaande kombinatiestappen kombineren van twee transitiefunkties, is verkregen, dat het getal nc het getal (n^ of nj) vervangt behorend bij die van de transitiefunkties of 0j) die wordt vervangen door de gekombineerde transitiefunktie, en dat het getal (nj of n^) behorend 10 bij die van de twee transitiefunkties die wordt weggelaten, eveneens wordt weggelaten.
Voor het berekenen van de gelijkheidsfaktor tussen twee transitiefunkties kunnen deze transitiefunkties worden beschouwd als zijnde vektoren in een meerdimensionale ruimte. Een mogelijkheid is dan 15 om de gelijkheidsfaktor gelijk te nemen aan de reciprokewaarde van de euclidische afstand tussen de eindpunten van deze vektoren. Een andere mogelijkheid is om de gelijkheidsfaktor gelijk te nemen aan de cosinus van de hoek tussen de twee vektoren. In dit laatste geval kan men de genoemde konstante een waarde geven die ligt tussen 0,5 en 0,8. Het 20 voordeel hierbij is dat variatie van de konstante binnen dit gebied praktisch geen invloed heeft op de uiteindelijk verkregen (gekombineerde) transitiefunkties.
Een inrichting voor het uitvoeren van de werkwijze, voorzien van 25 - eerste middelen voor het afleiden van een aantal parameters uit het elektrische signaal als funktie van de tijd, - tweede middelen voor het voor elk tijdstip uit de binnen het bijbehorende tijdinterval liggende gedeelten van de parameters afleiden van een transitiefunktie, 30 heeft het kenmerk, dat de inrichting verder is voorzien van - een eerste geheugen voor het opslaan van de transitiefunkties, - derde middelen voor het berekenen van een gelijkheidsfaktor tussen twee transitiefunkties behorende bij twee bij elkaar in de buurt liggende tijdstippen i en j, 35 - een tweede geheugen voor het opslaan van de gelijkheidsfaktoren, - vierde middelen voor het afleiden van de vervangende respektievelijk gekombineerde transitiefunktie uit de transitiefunkties van ten minste = Λ >=» *=7 Λ f -· ··. ΐ 'ij 4
-r ·„· .> "V V J J
PHN 11.575 7 één groep van transitiefunkties waarvoor de bijbehorende gelijkheidsfaktor groter is dan een referentiewaarde.
De in de eerste middelen afgeleide parameters kunnen bijvoorbeeld zijn: de formantparameters of de "log area"-parameters. Formantparameters en 5 "log area"-parameters zijn beide uit de literatuur bekend, zie bijvoorbeeld "Analyse, zuinige codering en resynthese van spraak", de dissertatie van L.L.M. Vogten (1983) en "Linear prediction of speech" van J.D. Markel en A.H. Gray (1976), Springer Berlijn.
De inrichting kan verder zijn gekenmerkt, doordat zij een 10 beslissingseenheid bevat met een ingang gekoppeld met een uitgang van het tweede geheugen, en een uitgang gekoppeld met een adresingang van het eerste geheugen. De beslissingseenheid bepaalt bijvoorbeeld de maximale c^j en geeft aan zijn uitgang de rangnummers i en j van de grootste gelijkheidsfaktor af.
15 De inrichting kan verder een derde geheugen bevatten voor het opslaan van de getallen n^ behorend bij de transitiefunktie 0^, waarbij de uitgang van de beslissingseenheid is gekoppeld met een adresingang van het derde geheugen, een uitgang waarvan is gekoppeld met een andere ingang van de vierde middelen. Verder kunnen de vierde 20 middelen eveneens zijn ingericht voor het afleiden van het getal nc uit de getallen nj_ en nj en zijn ingericht voor het toevoeren van dit getal aan een tweede uitgang, en dat deze uitgang is gekoppeld met een ingang van het derde geheugen.
De uitvinding zal hierna aan de hand van de 25 figuurbeschrijving nader uiteen worden gezet. Hierin toont figuur 1 een eerste en figuur 2 een tweede uitvoeringsvoorbeeld van de werkwijze, figuur 3 transitiefunkties behorende bij een aantal 30 tijdstippen, als funktie van de tijd, figuur 4 een matrix met de berekende gelijkheidsfaktoren, figuur 5 en figuur 6 twee voorbeelden van het kombineren van twee transitiefunkties, figuur 7 een uitvoeringsvoorbeeld van een inrichting voor 35 het uitvoeren van de werkwijze, figuur 8 een uitvoeringsvoorbeeld van de vierde middelen uit figuur 7, ·+ τ * τ V ^ i __ ♦ * PHN 11.575 8 figuur 9 een eerste en figuur 10 een tweede uitvoeringsvoorbeeld van de beslissingseenheid uit figuur 7, figuur 11 een tijdsignaal met de bijbehorende 5 transitiefunkties zoals uiteindelijk verkregen door middel van de werkwijze, en figuur 12 de kodering van een difoon, gebruik makend van transitiefunkties en akoestische vektoren verkregen volgens de werkwijze.
10 Figuur 1 toont een eerste uitvoeringsvoorbeeld van de werkwijze. In blok 1 wordt het programma gestart. In blok 2 wordt het akoestische signaal, bijvoorbeeld een spraaksignaal, ingenomen en worden uit dit akoestische signaal een aantal parameters afgeleid als funktie van de tijd. Zoals reeds eerder vermeld kunnen dit de "log area" 15 parameters zijn. In blok 3 worden voor opvolgende tijdstippen de binnen een rond elk tijdstip gelegen tijdinterval liggende gedeelten van de parameters ingenomen en voor elk tijdstip uit de binnen het bijbehorende tijdinterval liggende gedeelten van de parameters een transitiefunktie Φ bepaald. De tijdstippen kunnen bijvoorbeeld op 10 ms afstand van 20 elkaar liggen en voor het tijdinterval kan een interval van 200 tot 300 ms genomen worden. Alle transitiefunkties worden opgeslagen in een geheugen (het geheugen 38 in figuur 7).
Figuur 3 toont in figuur 3a een gedeelte uit een spraaksignaal als funktie van de tijd en in figuur 3b transitiefunkties 25 0^ voor opvolgende tijdstippen i. Rechts langs de figuur 3b staan de rangnummers van de transitiefunkties aangegeven. De bovenste transitiefunktie heeft het rangnummer 85. Dat wil zeggen dat deze transitiefunktie in het hiervoor aangegeven getallenvoorbeeld hoort bij het tijdstip 850 ms. De lijn 1 die van links boven naar rechts onder 30 door figuur 3b loopt is de verbindingslijn van de tijdstippen waartoe de verschillende transitiefunkties behoren.
fn blok 4 in figuur 1 worden gelijkheidsfaktoren C··
X J
berekend tussen telkens twee transitiefunkties behorende bij twee bij elkaar in de buurt liggende tijdstippen i en j (zie de derde middelen 41 35 in figuur 7).
In figuur 4 is aangegeven voor welke kombinaties van twee transitiefunkties de gelijkheidsfaktoren bepaald worden. Een
-** fh e* v-7 --V
. ¾ i : w» ** .*4 . ‘ V -u? 'J 'V “j PHN 11.575 9 voorbeeld: bepaald worden de gelijkheidsfaktoren C1,6' C2,6' C3f6f C4,6' C5,6' C6,7(= C7,6}' C6,8(= C8,6}' C6r9^= C9,6^' C6,10(= C10,6} enC6,11 (= C11 ¢)- Daarmee zijn bekend de gelijkheidsfaktoren van een 5 transitiefunktie behorend bij een zeker tijdstip (j = 6) met de transitiefunkties behorend bij vijf naburige, en dus tien omliggende tijdstippen i (= 1 tot en met 5 en 6 tot en met 11). De berekende gelijkheidsfaktoren C— worden opgeslagen in een geheugen (het geheugen 44 in figuur 7).
10 De gelijkheidsfaktoren kunnen worden bepaald door iedere tijdsample 0(m) van de transitiefunkties te beschouwen als de m-de komponent van een vektor in een meer-dimensionale ruimte en voor een gelijkheidsfaktor de reciprokewaarde van de euclidische afstand tussen de eindpunten van de twee relevante vektoren te nemen. Een andere 15 mogelijkheid is om voor de gelijkheidsfaktor de cosinus van de hoek te nemen tussen de twee relevante vektoren. Dus: 2Z Φ- Λ»)
Vvl J
=- - Π) 20 [fΣ f I *V*.j waarbij 0^(m) respektievelijk 0j(m) de komponenten van 0^ en 0j op hetzelfde tijdstip t = m en waarbij de sommatie uitgevoerd dient te worden over die tijden waarvoor ten minste één van de beide 25 funkties ongelijk nul is.
Het berekenen van C^j volgens formule (1) zal nader worden uitgelegd aan de hand van figuur 5a, b en figuur 6a, b. Figuur 5a toont de transitiefunktie 0^ en figuur 5b de transitiefunktie 0j beide als funktie van de tijd. De transitiefunktie 0^ is 30 gedefinieerd in het tijdinterval (t^, t3) en de funktie 0j is gedefinieerd in het tijdinterval (t3, t4). De sommatie volgens formule (1) dient in feite uitgevoerd te worden binnen het tijdinterval (t.j, t4). Daar altijd tenminste één van de funkties ongelijk nul is op een tijdstip liggend binnen het tijdinterval (tg, tg) hoeft de 35 sommatie slechts uitgevoerd te worden binnen dit tijdinterval (tg, ^¢) ·
Figuren 6a en 6b tonen transitiefunkties 0^ en ·*» -·% Λ ƒ «* * "“·* j « * PHN 11.575 10 0j, die verder uit elkaar liggen. Op een tijdstip liggend binnen het tijdinterval (tg, tg) is er altijd tenminste één funktie die ongelijk nul is. De sommatie dient zich dan ook uit te strekken over dit tijdinterval (tg, tg). Dit betekent dat men 0^ in het 5 tijdinterval (t3, tg) (fiktief) aanvult met nullen en 0j in het tijdinterval (tg, t2) (fiktief) aanvult met nullen, ter verkrijging van de juiste vektoren voor het berekenen van Cjj.
Vervolgens wordt in blok 5 in figuur 1 bepaald welke gelijkheidsfaktor Cjj de grootste is. Daarna wordt in blok 6 uit de 10 twee transitiefunkties behorend bij de grootste gelijkheidsfaktor Cjj een gekombineerde transitiefunktie 0jjc bepaald. Daarbij dienen de volgende spelregels in acht genomen te worden. Voor dat gedeelte waarbinnen de twee tijdintervallen elkaar overlappen wordt de gekombineerde transitiefunktie bepaald. De gekombineerde 15 transitiefunktie 0j_jC wordt berekend uit het (gewogen) gemiddelde van de twee transitiefunkties 0^ en 0j. Voor de eerste keer dat blok 6 doorlopen wordt betekent dit dat 0jjC(m) = (0i(m)+0j(m))/2 (2) 20
Figuur 5 en figuur 6 tonen twee voorbeelden van het berekenen van 0jjC volgens formule (2) waarbij figuren 5c en 6c de verkregen gekombineerde transitiefunkties tonen. De gekombineerde transitiefunktie 0^jC wordt dus berekend in het tijdinterval 25 tussen t2 en tg en is in dit tijdinterval gelijk aan het gemiddelde van de transitiefunkties 0^ en 0j, zie figuur 5(c). De tijdintervallen (t1ftg) en (t2,t^) in figuur 6 liggen verder uit elkaar. Het tijdinterval t2, tg waarbinnen de gekombineerde transitiefunktie 0j_jC wordt bepaald is dan ook kleiner dan in het 30 voorbeeld van figuur 5. Bovendien is 0j_jC niet nul binnen het tijdinterval (t2,tg), zie figuur 6(c).
Vervolgens wordt in blok 7 één van de twee transitiefunkties 0^ of 0j, bijvoorbeeld 0^ vervangen door de gekombineerde transitiefunktie 0jjc, ofwel 35
"0^ (nieuw) = 0ijC
> Γ O W -4 . ' 'IT - ΡΗΝ 11.575 11
De aldus verkregen nieuwe transitiefunktie 0^ wordt nu in het geheugen 38 van figuur 7 opgeslagen op die positie waar de oorspronkelijke transitiefunktie 0^ was opgeslagen. Bovendien wordt de transitiefunktie 0j uit het geheugen gewist.
5 Het zij hier vermeld dat men ook 0j had kunnen vervangen door 0j_jC. 0j_ zou dan zijn gewist.
Men heeft in het geheugen dus nu één transitiefunktie minder opgeslagen. In blok 8 worden nu nieuwe gelijkheidsfaktoren berekend tussen de nieuwe transitiefunktie 0^ en zijn omliggende 10 transitiefunkties, zie de derde middelen 41 in figuur 7.
Een voorbeeld: stel dat in blok 5 was bepaald dat Cgfy de grootste waarde had, dan is op de hiervoor beschreven wijze 0QtjC berekend en de originele 0g vervangen door 0gf7c en is 07 gewist. Er dienen nu de volgende gelijkheidsfaktoren .
15 opnieuw berekend te worden: C^gf C2fgr c3f6» c4,6' c5f6' C6,8' c6,9' C6,10' C6,11 en C6,12 en dienen de vol9ende gelijkheidsfaktoren uit de tabel van figuur 4 verwijderd te worden: C2,7' C3,7' C4,7' C5,7' C6,7' C7,8' C7,9' C7,10' C7,11 en C7 12· Het een en ander vanwege het feit dat 0y niet meer 20 aanwezig is.
Vervolgens wordt in blok 9 opnieuw de grootste gelijkheidsfaktor bepaald, en wordt er in blok 10 gekeken of deze grootste gelijkheidsfaktor cijmax groter is dan een zekere konstante k. Zo ja, dan loopt het programma via de tak 11 terug naar blok 6 en 25 wordt er opnieuw een gekombineerde transitiefunktie 0jLjC berekend.
Nu kan het zijn dat er twee transitiefunkties gekombineerd dienen te worden waarvan er één (of beide) reeds eerder verkregen is (zijn) uit een kombinatie van voorgaande transitiefunkties.
Een voorbeeld: er zou nu kunnen blijken dat Cg g de 30 grootste gelijkheidsfaktor is. Dit betekent dat 0g en 08 gekombineerd moeten worden, terwijl 0g in het hiervoor beschreven voorbeeld is verkregen uit een eerdere kombinatie van de oorspronkelijke transitiefunktie 0g en 0y.
In de berekening van de nieuwe gekombineerde 35 transitiefunktie 0gfgC zal hiermee rekening gehouden dienen te worden door 0g zwaarder te laten meewegen. Dit gebeurt als volgt: «>6,aC = (2-S»6+«>a)/3 * » PHN 11.575 12 of, meer algeméén: 0ijC = (ni0i+nj0j)/(ni+nj) (3) 5 waarbij en nj aangeven dat aantal van de oorspronkelijke transitiefunkties waaruit de transitiefunkties 0^ en 0j, door het in één of meer voorgaande kombinatiestappen kombineren van twee transitiefunkties, zijn verkregen. De tijdafhankelijkheid is in de 10 voorgaande formules voor de eenvoud weggelaten.
Bij 0£jC behoort nu een getal nc dat als volgt wordt bepaald: nc = n^+nj (4) 15 nc geeft bijgevolg aan dat aantal van de oorspronkelijke transitiefunkties waaruit de transitiefunktie 0£jC, door het in één of meer voorgaande kombinatiestappen kombineren van twee transitiefunkties, zijn verkregen. Vervangt 0^jC vervolgens de 20 oude 0^ dan vervangt nc de waarde n^ behorend bij de oude 0^ en wordt samen met de transitiefunktie 0j de bijbehorende waarde nj weggelaten. Vervangt 0^jC echter 0j dan wordt de nieuwe nj gelijk aan nc en wordt n^ weggelaten.
De programmalus via de keten 11 wordt net zolang herhaald 25 tot er geen gelijkheidsfaktoren C^j meer zijn die groter zijn dan de konstante k. In dat geval loopt het programma van blok 10 naar blok 12 en is de werkwijze beëindigd.
De kons tante k kan men, in het geval de gelijkheidsfaktoren zijn berekend met formule (1), gelijk nemen aan een 30 getal dat ligt tussen 0,5 en 0,8.
Figuur 2 toont een andere werkwijze. De werkwijze verloopt via de blokken 1 tot en met 4 op dezelfde wijze als de werkwijze van figuur 1. Na het bepalen van de gelijkheidsfaktoren C — in blok 4 wordt in blok 20 gekeken of er ten minste één 35 gelijkheidsfaktor C^j is die groter is dan een zekere referentiewaarde V. Indien de gelijkheidsfaktoren zijn bepaald volgens formule (1), dan kan men V bijvoorbeeld gelijk aan 0.95 nemen. Is er een C^j groter dan Λ -“* ** -r -Λ y “7 .-* ί *»> vs V I -*
* .....V -W
PHN 11.575 13 V dan doorloopt het programma de blokken 6, 7 en 8, op dezelfde wijze zoals beschreven aan de hand van de werkwijze van figuur 1, en loopt het programma via de keten 21 terug naar blok 20. De prograramalus via de tak 21 wordt telkens opnieuw doorlopen tot er geen gelijkheidsfaktoren meer 5 zijn die groter zijn dan V. Het programma loopt dan via het blok 20 naar het blok 22 waarin de referentiewaarde V met een zeker bedrag d, bijvoorbeeld gelijk aan 0,05, wordt verlaagd. Vervolgens wordt vastgesteld of de aldus verkregen referentiewaarde V groter is dan de eerder genoemde konstante k. Zo ja, dan loopt het programma via de keten 10 24 en 21 weer terug naar het blok 20.
Opnieuw wordt de lus via de tak 21 en bevattende de blokken 6 tot en met 8 doorlopen totdat er geen gelijkheidsfaktoren meer zijn groter dan V. Het programma loopt dan opnieuw via blok 20 naar blok 22 waar de referentiewaarde opnieuw verlaagd wordt. Dit gaat zo door 15 totdat V kleiner is dan of gelijk is aan de konstante k. Het programma loopt dan via het blok 23 naar het blok 12 en is de werkwijze beëindigd.
Men had de referentiewaarde V, op het moment dat het blok 20 voor de eerste maal doorlopen werd, zodanig kunnen kiezen dat deze 20 lag tussen de grootste en de op één na grootste C^j. In dat geval wordt de eerste gekombineerde transitiefunktie uit dezelfde twee transitiefunkties berekend als indien de werkwijze van figuur 1 zou zijn toegepast op hetzelfde spraaksignaal.
Figuur 7 toont een uitvoeringsvoorbeeld van een 25 inrichting voor het uitvoeren van de werkwijze voorzien van mikrofoon 30 waaraan een akoestisch signaal, bijvoorbeeld een spraaksignaal, wordt toegevoerd. De mikrofoon 30 is gekoppeld met een ingang 31 van eerste middelen 32 voor het afleiden van een aantal parameters, bijvoorbeeld "log area"-parameters, als funktie van de tijd uit het elektrische 30 signaal dat de mikrofoon 30 aanbiedt aan de ingang 31. Een uitgang 33 van de eerste middelen 32 is gekoppeld met een ingang 34 van tweede middelen 35. Deze tweede middelen leiden voor elk tijdstip de bijbehorende transitiefunkties af uit de binnen het bij dit tijdstip behorende tijdinterval liggende gedeelten van de parameters die via de 35 ingang 34 door de eerste middelen 32 worden aangeboden aan de tweede middelen. Een uitgang 36 van de tweede middelen 35 is gekoppeld met een ingang 37 van een eerste geheugen 38. In dit geheugen 38 worden de .*» * . , ^ ? ή ιί Λ * w ·> v i « <? * PHN 11.575 14 transitiefunkties opgeslagen die zijn berekend door de tweede middelen 35. Eveneens worden in dit geheugen 38 opgeslagen de begintijd en de lengte van elke transitiefunktie. Dat wil zeggen voor de voorbeelden van figuren 5 en 6: voor 0^ de tijd t1 en de lengte (t1r t3) en 5 voor 0j de tijd t£ en de lengte (t2 r £4). Een uitgang 39 van het eerste geheugen is gekoppeld met een ingang 40 van derde middelen 41. Deze derde middelen 41 zijn ingericht voor het berekenen van de gelijkheidsfaktoren C^j tussen telkens twee transitiefunkties 0^ en 0j behorende bij twee bij elkaar in de buurt liggende tijdstippen 10 i en j. Een uitgang 42 van de derde middelen 41 is gekoppeld met een ingang 43 van een tweede geheugen 44. Dit geheugen 44 is ingericht voor het opslaan van de gelijkheidsfaktoren Cjj berekend in de derde middelen 41. Een uitgang 45 van het tweede geheugen 44 is gekoppeld met een ingang 46 van een beslissingseenheid 47. De beslissingseenheid 47 is 15 ingericht voor het uitvoeren van de stappen aangeduid met de blokken 5 en 20 in de werkwijze van figuur 1 respektievelijk 2. Dat betekent dat volgens blok 5 in figuur 1 de beslissingseenheid uit de in het tweede geheugen 44 opgeslagen gelijkheidsfaktoren Cjj die faktor C^j bepaalt die de grootste is. De bijbehorende rangnummers i en j 20 verschijnen vervolgens aan een uitgang 48 van de beslissingseenheid 47, zie ook figuur 9.
Was de beslissingseenheid 47 ingericht voor het uitvoeren van de werkwijzestap volgens blok 20 in figuur 2, dan bevatte de beslissingseenheid 47 een komparator en werd er bepaald of er een 25 gelijkheidsfaktor Cjj was die groter was dan de referentiewaarde V.
Dit kan gerealiseerd worden door aan de twee ingangen van de komparator een gelijkheidsfaktor Cjj en de referentiewaarde V toe te voeren, zie ook figuur 10. Is er een C^j groter dan V dan wordt er aan de uitgang van de komparator een stuursignaal afgegeven waardoor de bijbehorende 30 rangnummers i en j aan de uitgang 48 van de beslissingseenheid 47 verschijnen.
De uitgang 39 van het eerste geheugen 38 is eveneens gekoppeld met een ingang 49 van vierde middelen 50 voor het berekenen van de gekombineerde transitiefunktie 0^jC uit de 35 transitiefunkties 0j_ en 0j uit het eerste geheugen, via de ingang 49 aan de vierde middelen 50 toegevoerd. Voor het uit geheugen 38 uitlezen van de juiste transitiefunkties en 0j is de uitgang •Λ V» '-7 «7 * 'ï/ ‘.y? V. ‘J M? 1 ΡΗΝ 11.575 15 48 van de beslissingseenheid 47, met daarop de informaties betreffende de rangnummers i en j van de transitiefunkties die dienen te worden gekombineerd, gekoppeld met een adresingang 51 van het geheugen 38. De uitgang 48 is eveneens gekoppeld met een adresingang 52 van een derde 5 geheugen 53 waarin de getallen nj_ behorend bij de transitiefunkties 0^ zijn opgeslagen. Een uitgang 54 van het derde geheugen 53 is gekoppeld met een tweede ingang 55 van de vierde middelen 50. Door aan de adresingang 52 de rangnummers i en j aan het derde geheugen 53 toe te voeren kunnen de getallen n^ en nj op de adressen i en j in dit 10 geheugen 53 worden uitgelezen en via de uitgang 54 aan de ingang 55 van de vierde middelen 50 worden toegevoerd.
De vierde middelen 50 kunnen nu, gebruikmakend van formule (3) de gekombineerde transitiefunktie 0jjc berekenen, en gebruik makend van formule (4) de nieuwe waarde nc berekenen.
15 0^jC verschijnt aan een eerste uitgang 56 die gekoppeld is met een tweede ingang 57 van het eerste geheugen 38. nc verschijnt aan een tweede uitgang 58 die gekoppeld is met een ingang 59 van het derde geheugen 53, zie ook figuur 8.
Wordt 0ijC in het geheugen 38 opgeslagen op de 20 plaats van 0j_ dan wordt nc in het geheugen 53 opgeslagen op de plaats van n^. De transitiefunktie 0j en het getal nj worden gewist uit de respektievelijke geheugens 38 en 53. Wordt 0^jC in het geheugen 38 opgeslagen op de plaats van 0j dan wordt dienovereenkomstig nj in het geheugen 53 vervangen door nc en worden 25 0j_ en n^ gewist uit de geheugens 38 respektievelijk 53. Verder wordt samen met 0^jC in het geheugen opgeslagen de begintijd en de lengte van 0jjC. Wat wil zeggen voor het voorbeeld van figuur 5 of 6: de tijd t2 en de lengte (t2, t3).
De besturing van de inrichting vindt plaats vanuit een 30 centrale besturingseenheid 60. Tussen de besturingseenheid 60 en de diverse komponenten zijn elektrische leidingen 61 tot en met 68 aangebracht via welke stuursignalen van de besturingseenheid 60 naar de diverse komponenten kunnen worden gestuurd, en via welke terugmeldingen van de komponenten naar de besturingseenheid 60 kunnen worden 35 verstuurd.
De besturingseenheid 60 zorgt ervoor dat na de start van het programma via de leiding 61 de eerste middelen 32 worden geaktiveerd » :» -¾ -γ - -* ^ » * „ ^ ? ; _ i rJ- -· V > * . ' · * --fc' V * PHN 11.575 16 voor het afleiden van de ("log area") parameters. Vervolgens worden via de leiding 62 de tweede middelen 35 geaktiveerd voor het berekenen van de transitiefunkties, Onder invloed van stuursignalen over de leiding 63 worden deze transitiefunkties in het eerste geheugen 38 opgeslagen.
5 Vervolgens worden onder invloed van stuursignalen over de leiding 65 de derde middelen 41 geaktiveerd voor het berekenen van de gelijkheidsfaktoren Cj_j. De juiste transitiefunkties hiervoor worden geleverd door het eerste geheugen 38 onder invloed van stuursignalen via de leiding 63 aan het geheugen 38 toegevoerd. De berekende 10 gelijkheidsfaktoren Cj_j worden onder invloed van stuursignalen via de leiding 67 toegevoerd aan het geheugen 44 in dit geheugen opgeslagen.
Onder invloed van stuursignalen via de leiding 66 aan het derde geheugen 53 toegevoerd wordt dit geheugen gevuld met'allemaal enen, dat wil zeggen n^ = 1 voor alle i.
15 Voor het uitvoeren van de werkwijze zoals beschreven aan de hand van figuur 1 bepaalt de beslissihgseenheid onder invloed van een stuursignaal op de leiding 68 de grootste van de in het geheugen 44 opgeslagen waarden. Dit kan bijvoorbeeld gerealiseerd worden met de schakeling van figuur 9, die later zal worden besproken.
20 Voor het uitvoeren van de werkwijze zoals beschreven aan de hand van figuur 2 bepaalt de beslissingseenheid 47 onder invloed van een stuursignaal op de leiding 68 een gelijkheidsfaktor C— waarvoor geldt dat deze groter is dan een referentiewaarde V. Dit kan bijvoorbeeld gerealiseerd worden met de schakeling van figuur 10, die 25 eveneens later besproken zal worden.
Aan de uitgang 48 staan dan de twee rangnummers i en j ter beschikking behorend bij de maximale C^j respektievelijk behorend bij de Cjj die groter is dan V. Deze informatie wordt als adressignaal via de leiding 69 toegevoerd aan de adresingangen 51 en 52 van het 30 geheugen 38 respektievelijk 53.
Onder invloed van deze adressignalen en onder invloed van stuursignalen via de leidingen 63, 64 en 66 toegevoerd aan het geheugen 38, de vierde middelen 50 en het derde geheugen 53 respektievelijk worden de bij de rangnummers i en j horende transitiefunkties 0^ en 35 0j en de getallen n^ en nj toegevoerd aan de vierde middelen 50 en wordt daarin de gekombineerde transitiefunktie 0j_jC en het getal nc berekend.
r» rj re* or } 'Λ ï . „Λ ; J i-» ΡΗΝ 11.575 17 λ 1 :
Onder invloed van stuursignalen over de leiding 63 wordt vervolgens 0^jC op de positie i (of juist j) in het geheugen 38 opgeslagen en wordt de positie j (of juist i) in het geheugen 38 gewist. Op dezelfde wijze wordt onder invloed van stuursignalen over de 5 leiding 66 nc in het geheugen 53 opgeslagen op de positie i (of juist j) en de positie j (of juist i) in dit geheugen gewist.
Vervolgens worden onder invloed van stuursignalen van de besturingseenheid 60 toegevoerd via de leidingen 63, 65 en 67 in de derde middelen 41 nieuwe gelijkheidsfaktoren bepaald voor kombinaties 10 van de nieuwe transitiefunktie 0^ met transitiefunkties behorend bij rond het tijdstip i liggende tijdstippen, welke nieuwe gelijkheidsfaktoren vervolgens in het tweede geheugen worden opgeslagen. Bovendien worden die gelijkheidsfaktoren waarvoor één van de twee rangnummers gelijk is aan j, uit het geheugen 44 gewist 15 onder invloed van stuursignalen van de besturingseenheid op de leiding 67.
De vierde middelen 50 kunnen bijvoorbeeld worden uitgevoerd zoals in figuur 8 getoond, en zijn daar aangeduid met het referentienumaer 50'.
20 De ingang 49 is opgebouwd uit twee deelingangen 49' en 49" via welke de transitiefunkties 0j_ respektievelijk 0j aan de middelen 50' worden toegevoerd. Evenzo is de ingang 55 opgebouwd uit twee deelingangen 55' en 55" via welke de getallen n^ respektievelijk nj worden toegevoerd. De ingangen 49' en 55' zijn gekoppeld met 25 respektievelijke ingangen van een vermenigvuldiger 71. De ingangen 49" en 55" zijn gekoppeld met respektievelijke ingangen van een vermenigvuldiger 72. De ingangen 55' en 55" zijn bovendien gekoppeld met respektievelijke ingangen van een opteller 74. De uitgangen van de vermenigvuldigers 71 en 72 zijn gekoppeld met respektievelijke ingangen 30 van een opteller 73. De uitgangen van de optellers 73 en 74 zijn gekoppeld met respektievelijke ingangen van een deler 75. De uitgangen van de deler 75 en de opteller 74 zijn gekoppeld met de uitgangen 56 respektievelijk 58 van de middelen 50'. De hiervoor beschreven middelen 50' zijn in staat om 0ijC en nc te berekenen volgens de 35 respektievelijke formules (3) en (4).
Figuur 9 toont een uitvoeringsvoorbeeld van de beslissingseenheid 47 te gebruiken in de werkwijze van figuur 1, en die *. * * «?* w -τΛ f J* * PHN 11.575 18 is aangeduid met het referentiecijfer 47'. De beslissingseenheid 47' bevat een geheugen 77 en een komparator 78 die samen als maximumwaarde-bepaler funktioneren.
Voordat voor de eerste keer in blok 5 van figuur 1 wordt 5 begonnen met het bepalen van de maximale Cjj wordt vanuit de centrale besturingseenheid 60 via de leiding 68.1 een resetsignaal toegevoerd aan de resetingang 81 van het geheugen 77. De inhoud van het geheugen 77 is dan gelijk aan nul. Vervolgens wordt aan de ingang 46 de eerste gelijkheidsfaktor C^j (dat is C12) aangeboden aan de ingang van het 10 geheugen 77 en aan een ingang van de komparator. De uitgang van het geheugen 77 is gekoppeld met een andere ingang van de komparator 78.
Aannemende dat C^2 ongelijk aan nul is, wordt de uitgang van de komparator 78 “hoog". Deze uitgang is gekoppeld met de laadingang 82 van het geheugen 77 en met de laadingang 84 van een twee 15 positiegeheugen 80. Door het "hoog" worden van de uitgang 85 wordt de waarde C12 in het geheugen 77 geladen en worden de rangnummers i, j (zijnde 1, 2) aanwezig op de leidingen 68.3 en 68.4 in het geheugen 80 opgeslagen. Doordat aan de ingangen van de komparator 78 nu twee gelijke getallen staan wordt de uitgang 85 weer laag.
20 Op de leidingen 68.3 en 68.4 verschijnen nu de rangnummers van de volgende gelijkheidsfaktor (bijvoorbeeld 3) en verschijnt deze gelijkheidsfaktor aan de ingang 46. Is deze gelijkheidsfaktor kleiner dan of gelijk aan de in het geheugen 77 opgeslagen waarde, dan gebeurt er niets en blijven de rangnummers i, j 25 in het geheugen 80 behorend bij de tot nu toe hoogste gelijkheidsfaktor bewaard en evenzo blijft de in het geheugen 77 opgeslagen waarde behouden. Is deze gelijkheidsfaktor groter dan de in het geheugen 77 opgeslagen waarde dan wordt deze gelijkheidsfaktor als nieuwe waarde in het geheugen 77 opgeslagen en de bijbehorende rangnummers in het 30 geheugen 80. Dit gaat zo door totdat alle gelijkheidsfaktoren zijn toegevoerd via de ingang 46. De daarna aan de uitgang 48 aanwezig getallen i, j geven de rangnummers aan behorend bij de grootste gelijkheidsfaktor. Op dit moment wordt ook bekeken of C^jmax groter is dan de konstante k. Daartoe is de uitgang van het geheugen 77 gekoppeld 35 met een ingang van een tweede komparator 79 aan een tweede ingang waarvan de konstante k wordt toegevoerd. Blijkt C—fflax kleiner dan of gelijk aan k te zijn dan wordt via de leiding 68.2 een stuursignaal naar c’A -a .* tst m ^ f z3 ϋ οόυ % PHN 11.575 19 de centrale besturingseenheid 60 gestuurd waarna het programma stopt.
Figuur 10 toont een uitvoeringsvoorbeeld van de beslissingseenheid 47 te gebruiken in de werkwijze van figuur 2, en die is aangeduid met het referentiecijfer 47". Voordat voor de eerste keer 5 in blok 20 bepaald wordt of een Cjj groter is dan V worden er vanuit de centrale besturingseenheid 60 stuursignalen via de leidingen 68.1 en 68.5 aan de beslissingseenheid 47" toegevoerd. Het stuursignaal op de leiding 68.1 is bedoeld om de schakelaar 87 korstondig te sluiten. Het stuursignaal op de leiding 68.5 wordt toegevoerd aan een laadingang 88 10 van een geheugen 89. Daar beide stuursignalen gelijktijdig plaatsvinden wordt bij gevolg de initiële referentiewaarde V (te weten V^) in het geheugen 89 geladen. is bijvoorbeeld gelijk aan 0.95.
Vervolgens wordt de eerste gelijkheidsfaktor C| 2 vi-a de ingang 46 toegevoerd aan een ingang van de komparator 78. De uitgang 15 van het geheugen 89 is gekoppeld met een andere ingang van de komparator 78. Stel C.j 2 is kleiner dan of gelijk aan V^. De uitgang 85 van de komparator 78 levert dan geen laadsignaal aan de laadingang 84 van het twee positiegeheugen 80. Vervolgens wordt de gelijkheidsfaktor C.j 3 via de ingang 46 toegevoerd. Stel dat deze C1 3 groter is dan V^. De 20 komparator 78 levert nu een laadsignaal aan het geheugen 80 waardoor de rangnummers i, j (zijnde 1, 3) in dit geheugen worden opgeslagen en aan de uitgang 48 beschikbaar zijn. Bovendien wordt dit laadsignaal via de leiding 68.6 toegevoerd aan de besturingseenheid 60 zodat deze weet dat er een gelijkheidsfaktor gevonden is die groter is dan V^. De 25 besturingseenheid kan het programma nu verder laten lopen via de blokken 6, 7 en 8 in figuur 2. Zijn de stappen in deze blokken uitgevoerd dan komt het programma terug bij blok 20.
Het programma kan nu de volgende c.· -r dus vanaf C1 * laten vergelijken met Vj_. Een andere mogelijkheid is dan weer vanaf 30 C.j 2 wordt gestart met het vergelijken van de j met V^.
Blijken alle C.· ^ met V; vergeleken te zijn en geen 1 J «* van deze C· ^ groter dan V* te zijn, dan wordt er over de leiding * t J J- 68.5 opnieuw een laadpuls toegevoerd aan het geheugen 89.
De ingang 90 van het geheugen 89 is gekoppeld met een 35 uitgang van een aftrekker 91, waarvan een ingang 92 is gekoppeld met de uitgang van het geheugen 89 en aan een andere ingang 93 een getal d wordt toegevoerd (d is bijvoorbeeld gelijk aan 0,05). Bij toevoeging van λ «t sy t V' ·' 1 *1 jj-
w \» V ^ J
PHN 11.575 20 de laadpuls aan de laadingang 88 wordt dus het getal V = V^-d in het geheugen 89 geladen (blok 22 in figuur 2).
Vervolgens worden de gelijkheidsfaktoren Cjj met de nieuwe referentiewaarde V vergeleken. Na een aantal malen het blok 22 in 5 figuur 2 doorlopen te hebben wordt V op een gegeven moment kleiner dan of gelijk aan k. De komparator 79 waarvan de ene ingang is gekoppeld met de uitgang van het geheugen 89 levert dan een stuursignaal af over de leiding 68.2 naar de besturingseenheid 60 zodat het programma wordt beëindigd.
10 Het resultaat van de werkwijze, zoals aan de hand van de figuren 1 tot en met 10 uiteengezet, is dat een beperkt aantal transitiefunkties overblijven, waarvan in het algemeen slechts twee naburige transitiefunkties elkaar in de tijd gedeeltelijk zullen overlappen, zie figuur 11, waarin figuur 11a het normale spraaksignaal 15 aangeeft en figuur 11b de transitiefunkties zijn die zijn verkregen met de werkwijze volgens de uitvinding.
Uitgaande van deze transitiefunkties kunnen nu de bijbehorende akoestische vektoren berekend worden, gebruik makend van formule (2) op pagina 4 van WO 84/04194, te weten 20 Y - A 0 (5) .
waarin Y een matrix voorstelt waarvan de kolommen de uit het elektrische signaal afgeleide (“log area") parameters op de diverste tijdstippen aangeven, 0 de matrix voorstelt waarvan de rijen de voornoemde transitiefunkties zijn (waaraan nullen zijn toegevoegd voor en na de 25 transitiefunktie om een funktie te verkrijgen gedurende de gehele spraakuiting) en A evenees een matrix voorstelt waarvan de kolommen de (te berekenen) akoestische vektoren voorstellen.
De aldus verkregen akoestische vektoren en hun bijbehorende transitiefunkties kunnen nu gebruikt worden bij 30 transmissie. Door middel van de werkwijze volgens de uitvinding is een zeer efficiënte datareduktie gerealiseerd. De transitiefunkties zijn namelijk in de tijd langzaam variërende funkties die slechts gedurende een korte tijd een waarde ongelijk nul bezitten. Transmissie kan nu vervolgens plaats vinden met een geringe datastroom.
35 Een andere toepassing van de verkregen akoestische vektoren en transitiefunkties kan liggen op het gebied van de spraakherkenning. Voor die toepassing dient men vooraf de werkwijze een r= ..Λ 0-* «·>; -2, 0 U '3 \j v βΤ^· ···
* « -vV'J C
PHN 11.575 21 groot aantal malen toe te- passen op een evengroot aantal verschillende spraakuitingen zodanig dat alle klanken in de spraak ten minste een aantal malen zijn verwerkt. Men verkrijgt dan een groot aantal akoestische vektoren, zeg meer dan 1000.
5 Door deze 1000 vektoren te clusteren, bij voorbeeld door middel van de uit de literatuur bekende techniek van de vektorquantisatie (zie R.M. Gray "Vector quantization" in IEEE ASSP magazine April 1984, p. 4-29), verkrijgt men als resultaat een set van tussen de 50 en 100 vektoren die een fysische relevantie hebben, 10 aangezien zij gerelateerd kunnen worden aan de 50 tot 100 te onderscheiden klanken waaruit de spraak van een bepaalde taal kan zijn opgebouwd.
Spraakherkenning kan nu gerealiseerd worden door een onbekende spraakuiting te onderwerpen aan de werkwijze volgens de 15 uitvinding en de verkregen akoestische vektoren vervolgens te vergelijken met de hiervoor genoemde 50 tot 100 fysisch relevante vektoren.
In de vergelijkingsstap worden de akoestische vektoren na herkenning toegewezen aan een van de 50 tot 100 voornoemde vektoren.
20 Daar iedere vektor behoort tot een klank is bijgevolg ook bekend tot welke klanken- de akoestische vektoren van de onbekende spraakuiting behoren en is daarmee de spraakuiting herkend.
De werkwijze volgens de uitvinding is ook bruikbaar voor het zuinig koderen van difonen. Difonen zijn segmenten die gebruikt 25 worden bij spraaksynthese en die de overgangen tussen twee spraakklanken beschrijven.
Wanneer men de spraakuiting, waaruit de difoonsegmenten dienen te worden afgeleid, wordt geanalyseerd met de werkwijze volgens de uitvinding kan men ook hier een datareduktie verkrijgen. Difonen 30 worden in het algemeen afgeleid uit nietszeggende woorden zoals bij voorbeeld het woord "nenoone".
Na het toepassen van de werkwijze volgens de uitvinding op het woord "nenoone" kan men als resultaat dus zes transitiefunkties met bijbehorende akoestische vektoren verwachten overeenkomende met de 35 zes klanken in dat woord, te weten de klanken "n", "e", "n", "oo", "n" en "e".
Voor het difoon "ne" heeft men dus de overgang nodig «v r·* .·* T * * ^ ’ *. ' : * i i PHN 11.575 22 tussen de eerste en de tweede akoestische vektor. Dit is in figuur 12 weergegeven. Figuur 12 toont de transitiefunkties 0^ en 02 als funktie van de tijd die akoestische vektoren respektievelijk A2 opleveren, gebruikmakend van formule (5), welke transitiefunkties/ 5 akoestische vektoren overeenkomen met de klanken "n“ en "e" respektievelijk.
De kodering van het "ne“ difoon wordt nu gerealiseerd door de beide akoestische vektoren en A2 op te slaan en dat gedeelte van de beide transitiefunkties φ^ en 02 °P te slaan dat 10 ligt tussen en t2, waarbij en t2 bij voorbeeld de tijden aangeven waar zich de maxima van de transitiefunkties bevinden.
Tabel 15
Inschriften in de blokken van figuren 1 en 2 bloknummer inschrift 20 1 start 2 derivation of (log area)-parameters 3 calculation of transition functions 0 4 calculation of similarity factors C— 5, 9 determine largest C^j
25 6 calculate combined transition function 0^jC
7 replace one of original 0's by 0^jC and delete other of original 0's 8 calculate new similarity factors Cj^ 10 largest C^j larger than constant k? 30 12 stop 20 C— larger than reference value V?
22 decrease V
23 V larger than constant k? -S* Λ ~trf a ·' l) <1 h i:.· v S) V .

Claims (16)

1. Werkwijze voor het segementeren van een uit een akoestisch signaal afgeleid elektrisch signaal waarbij achtereenvolgens - uit het elektrische signaal een aantal parameters worden afgeleid als funktie van de tijd, 5. voor opeenvolgende tijdstippen de binnen een rond elk tijdstip gelegen tijdinterval liggende gedeelten van de parameters worden ingenomen, - voor elk tijdstip uit de binnen het bijbehorende tijdinterval liggende gedeelten van de parameters een transitiefunktie 0 wordt bepaald, en - uit de bij de tijdstippen behorende transitiefunkties informatie 10 betreffende de segementen waaruit het akoestische signaal is opgebouwd wordt afgeleid, met het kenmerk, dat (a) gelijkheidsfaktoren (similarity factors) Cjj worden bepaald tussen · telkens twee transitiefunkties (0^ en 0j) behorende bij twee 15 bij elkaar in de buurt liggende tijdstippen i en j, (b) uit de transitiefunkties van ten minste één groep van twee transitiefunkties met een bijbehorende gelijkheidsfaktor groter dan een referentiewaarde V een vervangende transitiefunktie wordt afgeleid die de voornoemde transitiefunkties vervangt.
2. Werkwijze volgens conclusie 1, met het kenmerk, dat de referentiewaarde V een getal is dat ligt tussen de grootste en de op één na grootste gelijkheidsfaktor.
3. Werkwijze volgens conclusie 1 of 2 waarbij in stap (b) de twee transitiefunkties van slechts één groep worden samengenomen en 25 uit deze twee transitiefunkties een gekombineerde transitiefunktie wordt afgeleid die de voornoemde twee transitiefunkties vervangt, met het kenmerk, (c) dat de gekombineerde transitiefunktie de ene van de twee transitiefunkties waaruit de gekombineerde transitiefunktie is afgeleid, 30 vervangt en de andere van de twee transitiefunkties wordt weggelaten, (d) dat vervolgens gelijkheidsfaktoren worden bepaald tussen de gekombineerde transitiefunktie en de transitiefunkties behorende bij tijdstippen liggend in de buurt van het tijdstip waartoe de gekombineerde transitiefunktie behoort, en dat de gelijkheidsfaktoren 35 behorend tot die kombinaties van twee transitiefunkties, waarvan er één één van de twee transitiefunkties is waaruit de gekombineerde transitiefunktie is afgeleid, worden weggelaten. ** ^ ar ry m > I * *1 * '2 ' * v i PHN 11.575 24
4. Werkwijze volgens conclusie 3, met het kenmerk, (e) dat, indien er vervolgens ten minste één gelijkheidsfaktor is die groter is dan de voornoemde referentiewaarde, de bij deze gelijkheidsfaktor behorende transitiefunkties worden samengenomen en uit 5 deze twee transitiefunkties een gekombineerde transitiefunktie wordt afgeleid die de voornoemde twee transitiefunkties vervangt, waarna de werkwijze wordt vervolgd met stap (c), (f) dat, indien er geen gelijkheidsfaktoren zijn die groter zijn dan de voornoemde referentiewaarde, de referentiewaarde met een konstante 10 waarde wordt verlaagd, (g) dat vervolgens bepaald wordt of de aldus verkregen referentiewaarde groter is dan een zekere konstante, (h) dat, indien de referentiewaarde groter is dan de genoemde konstante, de werkwijze wordt vervolgd met stap (e), en 15 (i) dat, indien de referentiewaarde kleiner is dan de genoemde konstante, de werkwijze wordt beëindigd.
5. Werkwijze volgens conclusie 3, met het kenmerk, dat bepaald wordt of de grootste gelijkheidsfaktor groter is dan een zekere konstante, 20 (e) dat, indien de grootste gelijkheidsfaktor groter is dan deze konstante, uit de bij deze gelijkheidsfaktor behorende transitiefunkties een gekombineerde transitiefunktie wordt afgeleid die de voornoemde twee transitiefunkties vervangt, waarna de werkwijze wordt vervolgd met stap (c), 25 (£) dat, indien de grootste gelijkheidsfaktor kleiner is dan of gelijk is aan deze konstante, de werkwijze wordt beëindigd.
6. Werkwijze volgens conclusie 1 of 2 waarbij in stap (b) de twee transitiefunkties van slechts één groep worden samengenomen en uit deze twee transitiefunkties een gekombineerde transitiefunktie wordt 30 afgeleid die de voornoemde twee transitiefunkties vervangt, met het kenmerk, dat in stap (b) de gekombineerde transitiefunktie op de volgende wijze wordt berekend uit de twee transitiefunkties 0^ en 0j; 0j_ jC = (0i + 0j)/2 35
7. Werkwijze volgens conclusie 4 of 5, met het kenmerk, dat in stap (e) de gekombineerde transitiefunktie 0jjC op de volgende 0 > A ^ T f\ f. V ij ·’.* V ij/ “i1 PHN 11.575 25 wijze wordt berekend uit de twee transitiefunkties 0^ en 0j: = (Mi + Mj)/(ni+nj> waarbij en aangeven dat aantal van de oorspronkelijke transitiefunkties waaruit de transitiefunkties 0^ en 0j, door 5 het in één of meer voorgaande kombinatiestappen kombineren van twee transitiefunkties, zijn verkregen.
8. Werkwijze volgens conclusie 7, met het kenmerk, dat aan de gekombineerde transitiefunktie een getal nc wordt toegevoegd dat gelijk is aan n^+nj, welk getal nc aangeeft uit hoeveel 10 oorspronkelijke transitiefunkties de gekombineerde transitiefunktie 0^jC, door het in één of meer voorgaande kombinatiestappen kombineren van twee transitiefunkties, is verkregen, dat het getal nc het getal (n^ of nj) vervangt behorend bij die van de transitiefunktie (0^ of 0j) die wordt vervangen door de 15 gekombineerde transitiefunktie, en dat het getal (nj of n^) behorend bij die van de twee transitiefunkties die wordt weggelaten, eveneens wordt weggelaten.
9. Werkwijze volgens één der voorgaande conclusies, met het kenmerk, dat voor het berekenen van de gelijkheidsfaktor C^j 20 tussen twee transitiefunkties 0^ en 0j, de transitiefunkties worden beschouwd als zijnde vektoren in een meer dimensionale ruimte, en dat de gelijkheidsfaktor gelijk is aan de reciprokewaarde van de euclidische afstand tussen de eindpunten van deze vektoren.
10. Werkwijze volgens één der conclusies 1 tot en met 8, 25 met het kenmerk, dat voor het berekenen van de gelijkheidsfaktor C^j tussen twee transitiefunkties 0^ en 0j, de transitiefunkties worden beschouwd als zijnde vektoren in een meer dimensionale ruimte, en dat de gelijkheidsfaktor gelijk is aan de cosinus van de hoek tussen de twee vektoren.
11. Werkwijze volgens conclusie 10, voor zover afhankelijk van conclusie 4 of 5, met het kenmerk, dat de genoemde konstante een waarde heeft die ligt tussen 0,5 en 0,8.
12. Inrichting voor het uitvoeren van de werkwijze volgens één der voorgaande conclusies, voorzien van 35 - eerste middelen voor het afleiden van een aantal parameters uit het elektrische signaal als funktie van de tijd, - tweede middelen voor het voor elk tijdstip uit de binnen het Γs * 1 * * - ”* ' - ' ' - V/ «> - PHN 11.575 26 bijbehorende tijdinterval liggende gedeelten van de parameters afleiden van een transitiefunktie, met het kenmerk, dat de inrichting verder is voorzien van - een eerste geheugen voor het opslaan van de transitiefunkties, 5. derde middelen voor het berekenen van een gelijkheidsfaktor tussen twee transitiefunkties behorende bij twee bij elkaar in de buurt liggende tijdstippen i en j, - een tweede geheugen voor het opslaan van de gelijkheidsfaktoren, - vierde middelen voor het afleiden van de vervangende respektievelijk 10 de gekombineerde transitiefunktie uit de transitiefunkties van ten minste één groep van transitiefunkties waarvoor de bijbehorende gelijkheidsfaktor groter is dan een referentiewaarde.
13. Inrichting volgens conclusie 12, met het kenmerk, dat de inrichting een beslissingseenheid bevat met een ingang gekoppeld met een 15 uitgang van het tweede geheugen, en een uitgang gekoppeld met een adresingang van het eerste geheugen.
14. Inrichting volgens conclusie 12 of 13, met het kenmerk, dat een uitgang van het eerste geheugen is gekoppeld met een ingang van de vierde middelen, een uitgang waarvan is gekoppeld met een ingang van 20 het eerste geheugen.
15. Inrichting volgens conclusie 12, 13 of 14, voor het uitvoeren van de werkwijze volgens conclusie 7 of 8, met het kenmerk, dat de inrichting een derde geheugen bevat voor het opslaan van de getallen n^ behorend bij de transitiefunkties 0^, dat de uitgang 25 van de beslissingseenheid is gekoppeld met een adresingang van het derde geheugen, een uitgang waarvan is gekoppeld met een andere ingang van de vierde middelen.
16. Inrichting volgens conclusie 15, voor het uitvoeren van de werkwijze volgens conclusie 8, met het kenmerk, dat de vierde 30 middelen eveneens zijn ingericht voor het afleiden van het getal nc uit de getallen n^ en nj en zijn ingericht voor het toevoeren van dit getal aan een tweede uitgang, en dat deze uitgang is gekoppeld met een ingang van het derde geheugen. -r* r-3 Λ r- 4 Λ*7 'v *·- V
NL8503304A 1985-11-29 1985-11-29 Werkwijze en inrichting voor het segmenteren van een uit een akoestisch signaal, bij voorbeeld een spraaksignaal, afgeleid elektrisch signaal. NL8503304A (nl)

Priority Applications (6)

Application Number Priority Date Filing Date Title
NL8503304A NL8503304A (nl) 1985-11-29 1985-11-29 Werkwijze en inrichting voor het segmenteren van een uit een akoestisch signaal, bij voorbeeld een spraaksignaal, afgeleid elektrisch signaal.
US06/930,835 US4813074A (en) 1985-11-29 1986-11-14 Method of and device for segmenting an electric signal derived from an acoustic signal
EP86202092A EP0227146B1 (en) 1985-11-29 1986-11-25 Method of and device for segmenting an electric signal derived from an acoustic signal, for example a speech signal
DE8686202092T DE3679966D1 (de) 1985-11-29 1986-11-25 Verfahren und vorrichtung zur segmentierung eines elektrischen signals, abgeleitet aus einem akustischen signal, zum beispiel einem sprachsignal.
JP61281628A JP2527168B2 (ja) 1985-11-29 1986-11-26 音響信号から導かれた電気信号を区分する方法及び装置
CA000523797A CA1296101C (en) 1985-11-29 1986-11-26 Method of and device for segmenting an electric signal derived froman acoustic signal, for example a speech signal

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
NL8503304 1985-11-29
NL8503304A NL8503304A (nl) 1985-11-29 1985-11-29 Werkwijze en inrichting voor het segmenteren van een uit een akoestisch signaal, bij voorbeeld een spraaksignaal, afgeleid elektrisch signaal.

Publications (1)

Publication Number Publication Date
NL8503304A true NL8503304A (nl) 1987-06-16

Family

ID=19846941

Family Applications (1)

Application Number Title Priority Date Filing Date
NL8503304A NL8503304A (nl) 1985-11-29 1985-11-29 Werkwijze en inrichting voor het segmenteren van een uit een akoestisch signaal, bij voorbeeld een spraaksignaal, afgeleid elektrisch signaal.

Country Status (6)

Country Link
US (1) US4813074A (nl)
EP (1) EP0227146B1 (nl)
JP (1) JP2527168B2 (nl)
CA (1) CA1296101C (nl)
DE (1) DE3679966D1 (nl)
NL (1) NL8503304A (nl)

Families Citing this family (118)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NL8503304A (nl) * 1985-11-29 1987-06-16 Philips Nv Werkwijze en inrichting voor het segmenteren van een uit een akoestisch signaal, bij voorbeeld een spraaksignaal, afgeleid elektrisch signaal.
US5168524A (en) * 1989-08-17 1992-12-01 Eliza Corporation Speech-recognition circuitry employing nonlinear processing, speech element modeling and phoneme estimation
US5729656A (en) * 1994-11-30 1998-03-17 International Business Machines Corporation Reduction of search space in speech recognition using phone boundaries and phone ranking
DE19516106C2 (de) * 1995-05-05 2003-04-03 Philips Corp Intellectual Pty Verfahren zum Bestimmen von Referenzwerten
DE69607928T2 (de) * 1995-08-14 2000-10-05 Koninkl Philips Electronics Nv Verfahren und vorrichtung zur bereitstellung und verwendung von diphonen für mehrsprachige text-nach-sprache systeme
US6278972B1 (en) * 1999-01-04 2001-08-21 Qualcomm Incorporated System and method for segmentation and recognition of speech signals
US8645137B2 (en) 2000-03-16 2014-02-04 Apple Inc. Fast, language-independent method for user authentication by voice
DE10031518A1 (de) 2000-06-28 2002-01-10 Basf Ag Verfahren zur Herstellung von Hydroformylierungsprodukten des Propylens und von Acrylsäure und/oder Acrolein
US7409347B1 (en) * 2003-10-23 2008-08-05 Apple Inc. Data-driven global boundary optimization
US7643990B1 (en) * 2003-10-23 2010-01-05 Apple Inc. Global boundary-centric feature extraction and associated discontinuity metrics
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
US10496753B2 (en) 2010-01-18 2019-12-03 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US20100030549A1 (en) 2008-07-31 2010-02-04 Lee Michael M Mobile device having human language translation capability with positional feedback
WO2010067118A1 (en) 2008-12-11 2010-06-17 Novauris Technologies Limited Speech recognition involving a mobile device
WO2010117031A1 (ja) * 2009-04-10 2010-10-14 日本電気株式会社 類型化装置、類型化方法及び類型化プログラム
US9858925B2 (en) 2009-06-05 2018-01-02 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US20120309363A1 (en) 2011-06-03 2012-12-06 Apple Inc. Triggering notifications associated with tasks items that represent tasks to perform
US9431006B2 (en) 2009-07-02 2016-08-30 Apple Inc. Methods and apparatuses for automatic speech recognition
US10705794B2 (en) 2010-01-18 2020-07-07 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US10679605B2 (en) 2010-01-18 2020-06-09 Apple Inc. Hands-free list-reading by intelligent automated assistant
US10553209B2 (en) 2010-01-18 2020-02-04 Apple Inc. Systems and methods for hands-free notification summaries
WO2011089450A2 (en) 2010-01-25 2011-07-28 Andrew Peter Nelson Jerram Apparatuses, methods and systems for a digital conversation management platform
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
US10762293B2 (en) 2010-12-22 2020-09-01 Apple Inc. Using parts-of-speech tagging and named entity recognition for spelling correction
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US8994660B2 (en) 2011-08-29 2015-03-31 Apple Inc. Text correction processing
US10134385B2 (en) 2012-03-02 2018-11-20 Apple Inc. Systems and methods for name pronunciation
US9483461B2 (en) 2012-03-06 2016-11-01 Apple Inc. Handling speech synthesis of content for multiple languages
US9280610B2 (en) 2012-05-14 2016-03-08 Apple Inc. Crowd sourcing information to fulfill user requests
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
US9495129B2 (en) 2012-06-29 2016-11-15 Apple Inc. Device, method, and user interface for voice-activated navigation and browsing of a document
US9576574B2 (en) 2012-09-10 2017-02-21 Apple Inc. Context-sensitive handling of interruptions by intelligent digital assistant
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
EP3809407A1 (en) 2013-02-07 2021-04-21 Apple Inc. Voice trigger for a digital assistant
US9368114B2 (en) 2013-03-14 2016-06-14 Apple Inc. Context-sensitive handling of interruptions
WO2014144579A1 (en) 2013-03-15 2014-09-18 Apple Inc. System and method for updating an adaptive speech recognition model
AU2014233517B2 (en) 2013-03-15 2017-05-25 Apple Inc. Training an at least partial voice command system
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
WO2014197336A1 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for detecting errors in interactions with a voice-based digital assistant
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
KR101922663B1 (ko) 2013-06-09 2018-11-28 애플 인크. 디지털 어시스턴트의 둘 이상의 인스턴스들에 걸친 대화 지속성을 가능하게 하기 위한 디바이스, 방법 및 그래픽 사용자 인터페이스
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
JP2016521948A (ja) 2013-06-13 2016-07-25 アップル インコーポレイテッド 音声コマンドによって開始される緊急電話のためのシステム及び方法
AU2014306221B2 (en) 2013-08-06 2017-04-06 Apple Inc. Auto-activating smart responses based on activities from remote devices
US9620105B2 (en) 2014-05-15 2017-04-11 Apple Inc. Analyzing audio input for efficient speech and music recognition
US10592095B2 (en) 2014-05-23 2020-03-17 Apple Inc. Instantaneous speaking of content on touch devices
US9502031B2 (en) 2014-05-27 2016-11-22 Apple Inc. Method for supporting dynamic grammars in WFST-based ASR
US9633004B2 (en) 2014-05-30 2017-04-25 Apple Inc. Better resolution when referencing to concepts
US9760559B2 (en) 2014-05-30 2017-09-12 Apple Inc. Predictive text input
US9785630B2 (en) 2014-05-30 2017-10-10 Apple Inc. Text prediction using combined word N-gram and unigram language models
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US9966065B2 (en) 2014-05-30 2018-05-08 Apple Inc. Multi-command single utterance input method
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US10078631B2 (en) 2014-05-30 2018-09-18 Apple Inc. Entropy-guided text prediction using combined word and character n-gram language models
US9734193B2 (en) 2014-05-30 2017-08-15 Apple Inc. Determining domain salience ranking from ambiguous words in natural speech
US10289433B2 (en) 2014-05-30 2019-05-14 Apple Inc. Domain specific language for encoding assistant dialog
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
US9842101B2 (en) 2014-05-30 2017-12-12 Apple Inc. Predictive conversion of language input
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US10659851B2 (en) 2014-06-30 2020-05-19 Apple Inc. Real-time digital assistant knowledge updates
US10446141B2 (en) 2014-08-28 2019-10-15 Apple Inc. Automatic speech recognition based on user feedback
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10789041B2 (en) 2014-09-12 2020-09-29 Apple Inc. Dynamic thresholds for always listening speech trigger
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US9886432B2 (en) 2014-09-30 2018-02-06 Apple Inc. Parsimonious handling of word inflection via categorical stem + suffix N-gram language models
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US9646609B2 (en) 2014-09-30 2017-05-09 Apple Inc. Caching apparatus for serving phonetic pronunciations
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US10552013B2 (en) 2014-12-02 2020-02-04 Apple Inc. Data detection
US9711141B2 (en) 2014-12-09 2017-07-18 Apple Inc. Disambiguating heteronyms in speech synthesis
US9865280B2 (en) 2015-03-06 2018-01-09 Apple Inc. Structured dictation using intelligent automated assistants
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US9899019B2 (en) 2015-03-18 2018-02-20 Apple Inc. Systems and methods for structured stem and suffix language models
US9842105B2 (en) 2015-04-16 2017-12-12 Apple Inc. Parsimonious continuous-space phrase representations for natural language processing
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US10127220B2 (en) 2015-06-04 2018-11-13 Apple Inc. Language identification from short strings
US10101822B2 (en) 2015-06-05 2018-10-16 Apple Inc. Language input correction
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US10255907B2 (en) 2015-06-07 2019-04-09 Apple Inc. Automatic accent detection using acoustic models
US10186254B2 (en) 2015-06-07 2019-01-22 Apple Inc. Context-based endpoint detection
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US9697820B2 (en) 2015-09-24 2017-07-04 Apple Inc. Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
DK179309B1 (en) 2016-06-09 2018-04-23 Apple Inc Intelligent automated assistant in a home environment
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
DK179049B1 (en) 2016-06-11 2017-09-18 Apple Inc Data driven natural language event detection and classification
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2648138B2 (ja) * 1983-04-12 1997-08-27 エイ・ティ・アンド・ティ・コーポレーション 音声パターンを圧縮する方法
NL8503304A (nl) * 1985-11-29 1987-06-16 Philips Nv Werkwijze en inrichting voor het segmenteren van een uit een akoestisch signaal, bij voorbeeld een spraaksignaal, afgeleid elektrisch signaal.

Also Published As

Publication number Publication date
JP2527168B2 (ja) 1996-08-21
EP0227146A1 (en) 1987-07-01
US4813074A (en) 1989-03-14
DE3679966D1 (de) 1991-08-01
CA1296101C (en) 1992-02-18
JPS62133500A (ja) 1987-06-16
EP0227146B1 (en) 1991-06-26

Similar Documents

Publication Publication Date Title
NL8503304A (nl) Werkwijze en inrichting voor het segmenteren van een uit een akoestisch signaal, bij voorbeeld een spraaksignaal, afgeleid elektrisch signaal.
Raj et al. Probing the information encoded in x-vectors
US10026405B2 (en) Method for speaker diarization
JP2597791B2 (ja) 音声認識装置及び方法
CN108711422A (zh) 语音识别方法、装置、计算机可读存储介质和计算机设备
Jung et al. Knowledge distillation in acoustic scene classification
US5680509A (en) Method and apparatus for estimating phone class probabilities a-posteriori using a decision tree
CN109147771B (zh) 音频分割方法和系统
Vogl et al. Drum transcription from polyphonic music with recurrent neural networks
CN108257615A (zh) 一种用户语言评估方法及系统
Hamel et al. Building musically-relevant audio features through multiple timescale representations
JPS58192100A (ja) 第1の音声パタ−ンを第2の音声パタ−ンと時間的に整列させる方法とその装置
Avramidis et al. Deep convolutional and recurrent networks for polyphonic instrument classification from monophonic raw audio waveforms
CN109471951A (zh) 基于神经网络的歌词生成方法、装置、设备和存储介质
JP6580911B2 (ja) 音声合成システムならびにその予測モデル学習方法および装置
CN110047463B (zh) 一种语音合成方法、装置和电子设备
Gref et al. Multi-Staged Cross-Lingual Acoustic Model Adaption for Robust Speech Recognition in Real-World Applications--A Case Study on German Oral History Interviews
Al Mojaly et al. Detection and classification of voice pathology using feature selection
KR20030046434A (ko) 스피치 인식의 빠른 검색
CN113012723B (zh) 多媒体文件播放方法、装置、电子设备
CN115240656A (zh) 音频识别模型的训练、音频识别方法、装置和计算机设备
Meire et al. The impact of missing labels and overlapping sound events on multi-label multi-instance learning for sound event classification
Dighe et al. Far-field ASR using low-rank and sparse soft targets from parallel data
Agrawal et al. Comparison of Unsupervised Modulation Filter Learning Methods for ASR.
Burred et al. An adaptive system for music classification and tagging

Legal Events

Date Code Title Description
A1B A search report has been drawn up
BV The patent application has lapsed