NL8900520A - Probabilistische toonhoogtemeter. - Google Patents

Probabilistische toonhoogtemeter. Download PDF

Info

Publication number
NL8900520A
NL8900520A NL8900520A NL8900520A NL8900520A NL 8900520 A NL8900520 A NL 8900520A NL 8900520 A NL8900520 A NL 8900520A NL 8900520 A NL8900520 A NL 8900520A NL 8900520 A NL8900520 A NL 8900520A
Authority
NL
Netherlands
Prior art keywords
probability
frequency
density function
pitch
probability density
Prior art date
Application number
NL8900520A
Other languages
English (en)
Original Assignee
Philips Nv
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Philips Nv filed Critical Philips Nv
Priority to NL8900520A priority Critical patent/NL8900520A/nl
Priority to EP19900200440 priority patent/EP0386820B1/en
Priority to DE1990601627 priority patent/DE69001627T2/de
Priority to JP4598490A priority patent/JP3030382B2/ja
Publication of NL8900520A publication Critical patent/NL8900520A/nl
Priority to US08/019,811 priority patent/US5321636A/en

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01HMEASUREMENT OF MECHANICAL VIBRATIONS OR ULTRASONIC, SONIC OR INFRASONIC WAVES
    • G01H3/00Measuring characteristics of vibrations by using a detector in a fluid
    • G01H3/04Frequency
    • G01H3/08Analysing frequencies present in complex vibrations, e.g. comparing harmonics present

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Description

N.V. Philips' Gloeilampenfabrieken te Eindhoven.
Probabilistische toonhoogtemeter.
De uitvinding heeft betrekking op een werkwijze voor het bepalen van een toonhoogte in een signaal, waarbij uit het signaal een kansdichtheidsfunktie van de toonhoogte wordt afgeleid als funktie van de frekwentie en waarbij vervolgens uit de kansdichtheidsfunktie de toonhoogte wordt bepaald, en op een inrichting voor het uitvoeren van de werkwijze.
Een dergelijke werkwijze en inrichting is bekend uit de publikatie "An optimum processor theory for the central formation of the pitch of complex tones" van J.L. Goldstein, J.A.S.A. Vol. 54, No. 6 (1973), p. 1496-1516.
Het is bekend dat personen verschillende toonhoogten in een komplexe toon kunnen herkennen. Proefnemingen hebben aangetoond dat toonhoogte een niet-deterministische, subjektieve grootheid is die stochastisch gemodelleerd moet worden. Voor een sinus toon is de kansdichtheidsfunktie van de ervaren toonhoogte unimodaal. Daarmee wordt bedoeld dat er in hoofdzaak maar één maximum in de kurve aanwezig is, Deze kansdichtheidsfunktie kan gemodelleerd worden als een Gauss-kurve met een gemiddelde waarde overeenkomend met de frekwentie van de sinus toon en een zekere standaarddeviatie σ.
Voor een komplexe toon is de situatie ingewikkelder.
Personen kunnen in een komplexe toon twee soorten toonhoogten waarnemen, afhankelijk of ze het geluid als één geheel waarnemen (synthetisch luisteren) of dat ze naar de afzonderlijke deeltonen luisteren (analystisch luisteren). Bij het synthetisch luisteren kunnen we toonhoogten horen die overeenkomen met frekwenties die niet in het signaal aanwezig zijn. Deze viruele toonhoogten worden beschreven met een multimodale kansdichtheidsfunctie. Neemt men bijvoorbeeld een komplexe toon die is opgebouwd uit twee sinussen met frekwenties van 1200 Hz en 1400 Hz, dan wordt door personen niet alleen een toonhoogte van 200 Hz (de grondtoon) waargenomen, doch ook toonhoogtes bij 17.3 Hz en 236 Hz. In dit geval is de kansdichtheidsfunktie trimodaal, bevat dus drie maxima. Dit perceptieve gedrag wordt onder andere beschreven door het door Goldstein in zijn bovengenoemd artikel voorgestelde model voor toonhoogtegewaarwording.
Goldstein's model is gebaseerd op een stochastische formulering die de multimodale kansdichtheidsfunktie van de waargenomen virtuele toonhoogte voorspelt. In zijn model wordt iedere spektrale komponent in het waargenomen signaal gerepresenteerd door een stochastische variabele die een Gauss-vormige kansdichtheidsfunktie heeft met een gemiddelde waarde die overeenkomt met de frekwentie van de spektrale komponent. De standaarddeviatie van de kansdichtheidsfunktie is een vrije parameter van het model die alleen afhangt van de spektrale frekwentie. In Goldstein's model wordt, bij aanbieding van een komplexe toon, uit iedere Gauss-vormige kansdichtheidsfunktie een bemonstering bepaald. Met. deze bemonsteringen voert een patroonherkenner een schatting uit van de (ontbrekende) grondtoon. Dit proces resulteerden in een multimodale kansdichtheidsfunktie van de virtuele toonhoogte. A.1 hoewel het mode] redelijk goed bruikbaar is voor de beschrijving van de virtuele toonhoogte in signalen, heeft het toch enkele belangrijke nadelen. Zo kan de kansdichtheidsfunktie alleen worden berekend voor signalen die uit niet meer dan twee sinussen zijn opgebouwd. Voor signalen die uit meer dan twee sinussen bestaan kan de kansdichtheidsfunktie alleen worden bepaald met behulp van een Monte Carlosimulatie. Verder kan het model alleen worden gebruikt voor bepaling van de kansdichtheidsfunktie als bekend is binnen welk oktaaf de toonthoogte zich bevindt
De uitvinding beoogt nu een werkwijze en een inrichting te verschaffen die voor komplexe signalen in staat is de kansdichtheidsfunktie voor de (virtuele) toonhoogte te berekenen en die weinig rekentijd benodigt voor het bepalen van deze kansdichtheidsfunktie. Uit de kansdichtheidsfunktie kan dan één of meer toonhoogtes van het signaal worden afgeleid, met hun bijbehorende standaarddeviaties.
De werkwijze heeft daartoe het kenmerk dat (a) uit een binnen een zeker tijdinterval gelegen deel van het signaal een frekwentiespektrum van het binnen het tijdinterval gelegen deel van het signaal wordt afgeleid, welk frekwentiespektrum is opgebouwd uit bemonsteringen .liggend op in hoofdzaak eguidistante frekwentie waardes binnen een zeker eerste frekwentie-interval, (b) dat voor een frekwentiewaarde liggend in een tweede frekwentieinterval een kansbijdrage wordt bepaald, zijnde een grootheid die het gevolg is van de aanwezigheid van een frekwentiekomponent in het frekwentiespektrum ter plaatse f^, (c) dat de stap (b) ten minste éénmaal wordt herhaald ter verkrijging van ten minste een tweede kansbijdrage K.,j, ten gevolge van de aanwezigheid van ten minste een tweede frekwentiekomponent aanwezig in het frekwentiespektrum ter plaatse f j' (d) dat de ten minste twee kansbijdragen K^, met elkaar worden vermenigvuldigd ter verkrijging van een kansmaal Kfi, (e) dat de stappen (b), (c) en (d) worden herhaald ter verkrijging van ten minste een tweede kansmaat Kf2, dat de kansmaten K^-j,
Kj2, ··· elk een maat zijn voor de relatieve kans van optreden van een toonhoogte op de frekwentie f^, f2, ... respektievelijk, en dat de kansbijdragen K^, K^, ... elk een maat zijn voor de relatieve kans dat een toonhoogte bij de frekwentie het gevolg is van een frekwentiekomponent bij de frekwentiekomponent f j, fj, ... respektievelijk, (f) dat uit de aldus verkregen kansmaten Kf2, · een kansdichtheidsfunktie van de toonhoogte als funktie van de frekwentie wordt afgeleid, waaruit dan weer een toonhoogte wordt bepaald.
De uitvinding is gebaseerd op het inzicht dat de kansdichtheidsfunktie van de virtuele toonhoogte direkt bepaald kan worden uit de stochastische representaties van de spektrale komponenten in het signaal. Dit maakt de methode tamelijk robuust en snel. Dat wil zeggen dat minder rekentijd benodigd is dan in de bekende methode.
De werkwijze kan verder zijn gekenmerkt doordat voor het bepalen van de kansbijdrage een kansdichtheidsfunktie G(f, fj, dj) wordt afgeleid, met een gemiddelde waarde liggend ter plaatse van de frekwentie f j en een standaarddeviatie dj, welke kansdichtheidsfunktie een representatie is van de menselijke gewaarwording van een toon met frekwentie fj, dat uit deze kansdichtheidsfunktie G(f, fj, d^) een tweede kansdichtheidsfunktie G^(f, fjjn, djn) wordt, afgeleid met een gemiddelde waarde ii/n en een standaarddeviatie djn, waarbij n een geheel getal is en zodanig gekozen wordt dat f j^n het dichtst bij f1 ligt, en dat in hoofdzaak gelijk genomen wordt aan Gn(£1f. fi/n' crin)
Hierbij wordt gebruik gemaakt van subharmonischen van de spektrale komponenten in het signaal, waarbij een stochastische representatie voor deze subharmonischen wordt gebruikt ter verkrijging van de kansbijdrage.
De inrichting voor het uitvoeren van de werkwijze, die is voorzien van een ingangsklem voor het ontvangen van het signaal, is gekenmerkt doordat de ingangsklem is gekoppeld met een ingang van een frekwentie-analyseereenheid die is ingericht voor het verkrijging van een frekwentiespektrum van het binnen het tijdinterval gelegen deel van het signaal, dat een uitgang van de frekwentie-analyseereenheid is gekoppeld met een ingang van een eenheid, die is ingericht voor het bepalen van de kansbijdragen K^, K2i, K2j, · en voor het toevoeren van de kansbijdragen aan een uitgang, welke uitgang is gekoppeld met een ingang van een vermenigvuldigingseenheid, dat de vermenigvuldigingseenheid is ingericht voor het berekenen van de kansmaten Kf1, Kf2, ... uit de kansbijdragen K1if K^, ...
respektievelijk K2j, K2j, ... respektievelijk ... , welke kansen v worden toegevoerd aan een uitgang, dat deze uitgang is rf1' f2' gekoppeld met een ingang van een toonhoogtebepaler voor het bepalen een toonhoogte uit de kansdichtheidsfunktie pdf, die is verkregen uit rb kansmaten Kf-j, K^2.
De uitvinding zal aan de hand van de hiernavolgende figuurbeschrijving nader worden uiteengezet. Hierin toont figuur 1 het signaal als funktie van de tijd, liggend m het tijdinterval, figuur 2 het frekwentiespektrum van het signaal, figuur 3 de bepaling van de kansbijdrage K1ir figuur 4 twee voorbeelden van de kansdichtheidsfunktie pdf voor de toonhoogte als funktie van de frekwentie, figuur 5 een ander voorbeeld van de tweede kansdichtheidsfunktie, en figuur 6 een inrichting voor het uitvoeren van de werkwijze.
Figuur 1 toont een signaal als funktie van de tijd. Het kan daarbij gaan om een spraaksignaal. Noodzakelijk is dit niet. Het signaal kan bijvoorbeeld ook een muzieksignaal zijn. De mens is namelijk ook in staat om bij muzieksignalen een toonhoogtegewaarwording te hebben. Het signaal dat ligt in een zeker tijdinterval T wordt bemonsterd en gedigitaliseerd en vervolgens wordt het bemonsterde en gedigitaliseerde signaal onderworpen aan een fourier-transformatie, bijvoorbeeld een digitale fourier-transformatie of snelle fourier-transformatie.
Figuur 2 toont het uit de fourier-transformatie verkregen frekwentiespetrum A(f). In feite is het frekwentiespektrum geen kontinue kurve, doch is opgebouwd uit allemaal frekwentiebemonstêringen voor frekwentiewaardes m.Af, waarbij Δί=1/Τ en m loopt van 1 tot M, waarbij M bijvoorbeeld gelijk aan 512 of 1024 is. M hangt in feite af van de bemonsteringsfrekwentie f waarmee het signaal s(t) bemonsterd is, en wel als volgt: M=T/2^S.
Vervolgens wordt in een tweede frekwentiegebied TG een frekwentiewaarde f^ genomen, zie figuur 3a. Het frekwentiegebied TG behoeft niet noodzakelijkerwijs in het frekwentiegebied te liggen waarbinnen het frekwentiespektrum A(f) voor het signaal is bepaald. Nu wordt de kansbijdrage bepaald. De betekenis van het begrip kansbijdrage zal later worden uiteengezet. De kansbijdrage is een gevolg van een aanwezigheid van een frekwentiekomponent bij de frekwentie fj in het spektrum A(f). Mocht f., binnen het frekwentiebereik van het spektrum A(f) liggen, dan hoeft f1 niet noodzakelijkerwijs samen te vallen met één van de frekwentiekomponenten m.Af in het spektrum.
De manier waarop wordt bepaald zal eveneens later worden uiteengezet. Vervolgens wordt voor dezelfde frekwentie f.| de kansbijdrage K^j bepaald. Deze kansbijdrage is het gevolg van de aanwezigheid van een frekwentiekomponent bij de frekwentie fj in het spektrum A(f). Dit is in figuur 3b aangegeven. De bepaling van K^j vindt op dezelfde wijze plaats als de bepaling van (zie later).
De kansbijdragebepaling voor de frekwentie f1 kan nog worden voortgezet door te kijken naar een derde en eventueel nog meer frekwentiekomponenten f^, f^,... (niet getekend) eveneens liggend in het frekwentiespektrum A(f).
De betekenis van de kansbijdragen kan als volgt worden verklaard. De kansbijdragen Κ.^·, K-jj, ... kunnen worden beschouwd als zijnde een maat voor de relatieve kans dat een toonhoogte bij de frekwentie f j het gevolg is ven een frekwentiekomponent bi] de frekwentie fj, ... respektievelijk. Stel als voorbeeld, dat slechts twee kansbijdragen en Kjj zijn bepaald en dat Kjj.-0,2 en K jj=0,1 - De betekenis hiervan is nu dat de kans dat een toonhoogte op de frekwentie f j het gevolg is van de frekwentiekomponent op fj twee keer zo groot is als de kans dat de toonhoogte op de frekwentie fj het gevolg is van de frekwentiekomponent op fj.
De frekwentiekomponenten f^, fj hoeven niet noodzakelijk op elkaar volgende frekwentiekomponenten in het spektruin A(f) te zijn. Het is ook mogelijk alleen die frekwentiekomponenten uit het frekwentiespektrum mee te nemen die een grote amplitude hebben, aangezien aangenomen mag worden dat de frekwentiekomponenten met grote amplitude de meeste invloed zullen hebben op de kansbijdragen voor een toonhoogte ter plaatse van de frekwentie fj.
De kansbijdragen Kjj en Kjj worden met elkaar vermenigvuldigd en, indien meer kansbijdragen K1k, Κ1χ ... waren (of nog worden) bepaald, ook nog vermenigvuldigd met Kjk, Kjj... enz.
Het verkregen produkt Kfj wordt een kansmaat genoemd.
De betekenis van het begrip kansmaat zal later worden uiteengezet.
De hiervoor beschreven procedure wordt nu herhaald voor een tweede frekwentie f2 liggend in het tweede frekwentieyebied TG. De kansbijdrage K2j wordt bepaald. De kansbijdrage K2i is weer een gevolg van de aanwezigheid van een frekwentiekomponent ter plaatse fj in het spektrum A(f). Dit is weergegeven in figuur 3c. Voor een nadere uitleg, zie later. Tenminste een tweede kansbijdrage K2j en eventueel noy meer kansbijdragen K2k, K21, ... enz. worden bepaald.
Ook nu worden de kansbijdragen weer met elkaar vermenigvuldigd ter verkrijging van het produkt (de kansmaat) Ki2-Bij voorkeur worden voor het bepalen van de kansbijdragen voor de frekwentie f2 weer dezelfde frekwenties fj, fj ... enz genomen als de frekwenties die zijn gebruikt voor de bepaling van de kansbijdragen voor de frekwentie fj. Strikt noodzakelijk is dit echter niet.
Vervolgens kan de procedure opnieuw worden herhaald voor nog andere frekwenties f3, f4 -- enz., liggend in het deelinterval TG ter verkrijging van kansmaten Kf3, Kf4.
De betekenis van de kansmaten kan als volgt worden verklaard. De kansmaten Kf1, Kf2, ... kunnen worden beschouwd als zijnde een maat voor de relatieve kans van optreden van een toonhoogte op de frekwentie f.,, f2, ... respektievelijk. Stel, als voorbeeld, dat slechts twee kansmaten Kf1 en Kf2 zijn bepaald en dat Kf1=0.02 en Kf2=0.01. De betekenis hiervan is dat de kans dat er een toonhoogte is op de frekwentie f1 twee keer zo groot is als de kans dat er een toonhoogte is op de frekwentie f2.
Er zij hier vermeld dat de volgorde van de hiervoor aangegeven stappen waar mogelijk, anders genomen kan worden. Ook is het mogelijk sommmige stappen min of meer parallel uit te voeren.
Zo kunnen eerst alle kansbijdragen K^, K^j, ...
K2i, K2j, ... enz. worden bepaald en pas daarna de kansmaten Kfi, I<£2, enz. Het is natuurlijk evengoed mogelijk om, nadat de kansbijdragen K^, K^j, ... zijn bepaald, eerst de kansmaat te berekenen, voordat wordt overgegaan tot het bepalen van de kansbijdragen K2i, K2j, ... enz.
Alle produkten Κ^, K^2, K^, ., enz. kunnen nu als funktie van de frekwentie worden uitgezet, zie figuur 4a. Men verkrijgt daarmee, na normering van de oppervlakte onder de verkregen kurve op 1, de kansdichtheidsfunkt.ie pdf voor de toonhoogte als funktie van de frekwentie. Uit deze kansdichtheidsfunktie pdf is nu de toonhoogte af te leiden. Men kan bijvoorbeeld het absolute maximum in de kurve. bepalen. De frekwentie waarbij dit maximum optreedt kan men dan als de toonhoogte ft van het signaal beschouwen. Men kan ook de met 0^ aangegeven oppervlakte beschouwen als zijnde de kans dat de frekwentie f^ de toonhoogte van het signaal is.
Een andere mogelijkheid is om de oppervlakten 0.,, 0?, 03, (zie figuur 4a) onder de kurve pdf te bepalen die liggen tussen telkens twee naast elkaar liggende relatieve minima in de kurve. Het grootste oppervlak kan dan worden bepaald. Als toonhoogte kan men dan nemen die frekwentie waarbij het zich tussen de bijbehorende twee minima liggende maximum zich bevindt. De oppervlakte komt dan overeen met de kans dat de frekwentie die gevonden wordt de toonhoogte van het signaal is.
Vervolgens kan een nieuw signaal worden ingenomen en kan voor dit nieuwe signaal de hiervoor beschreven werkwijze in zijn geheel worden herhaald. Op deze wijze kan men de toonhoogteverloop van het signaal als funktie van de tijd bepalen.
Figuur 4b geeft een mogelijk ander resultaat voor de kansdichtheidsfunktie pdf. Duidelijk zichtbaar is hier dat er twee belangrijke pieken in de kurve aanwezig zijn, liggend bij de frekwenties f en f.-. Dit zou dus kunnen betekenen dat het signaal twee t I h w toonhoogtes bezit, bij deze frekwenties en f^·
Nu zal de bepaling van de kansbijdrage nader uitgelegd worden. Om de kansbijdrage KTi te bepalen, zie figuur 3a, wordt uitgegaan van een stochastische representatie van de spektrale komponent bij de frekwentie f^. Deze is in figuur 3a weergegeven door middel van de Gausskromme G(f, fj_, 0^). Deze Gausskrommes zijn uit de literatuur bekend, zie de eerder genoemde publikatie van Goldstein.
De gemiddelde waarde ligt bij de frekwentie f1_. De standaarddeviatie (t (jie hjj dergelijke Gausskrommes behoren, worden uitvoerig besproken in onder andere de publikatie "Frequency difference limens for short duration tones* van B.C.J. Moore in JASA 54 (1973), pag. 610-61-.
Uitgaande van de Gausskromme G(f, f^, CTj) wordt nu de kromme Gn(f, fi/n, &in) bepaald. Daartoe wordt die subharmonische van fi bepaald die het dichtst ligt bij de frekwentie fv Dit is de frekwentie fi/n, n zijnde een geheel getal.
Een getallenvoorbeeld: stel dat f^=1200 Hz en f.j=145 Hz. De subharmonische die het dichtst bij 145 Hz ligt heeft eet. frekwentie van 150 Hz. Dit betekent dat n=8, want 1200/8 is 150 Hz.
De kromme Gn(f, fi/n, σ±η) is weer een Gausskromme met een gemiddelde waarde gelijk aan de subharmonische frekwentie fj/r, en een standaarddeviatie u^n, die als volgt kan worden bepaald.
*in = met a <. 1, zijnde een vrije parameter in het model waarmee het model gepast kan worden op psychoakoestische data. De oppervlakte onder Gausskurve Gn is gelijk aan 1. De Gausskromme Gn wordt vervolgens geschaald met een faktor (B)n, waarbij fl < 1, een vrije parameter is, ofwel: G ' = (H)n.Gn. De kansbijdrage kan nu uit de kurve ' (f, f^yn, cr^n) worden afgeleid. is nu namelijk gelijk aan Gn(f1f fj^n, tTjn) Eventueel kan men Gausskrommen G waarvan wordt uitgegaan vooraf schalen met een amplitudefaktor H(A(fj)). Deze amplitudefaktor geeft dan in feite aan in hoeverre de kansbijdrage afhangt van de amplitude van de frekwentiekomponent op Op dezelfde wijze kunnen de andere kansbijdragen worden afgeleid.
Figuur 5 toont een andere mogelijkheid voor de Gausskromme Gn'(f, fjjn, (Tj_n); hier aangeduid met Gn"(f, fj^n, ain) Voor frekwenties lager dan fg en hoger dan is de Gausskromme hier met een onderbroken lijn aangegeven. Voor deze frekwenties is de Gausskromme kleiner dan een zekere drempelwaarde D. Voor deze frekwenties wordt nu voor het bepalen van de kansbijdrage K^j de Gausskromme Gn'' gelijk genomen aan de drempelwaarde D.
Ligt f^ dus op de plaats zoals aangegeven in figuur 5, dan is gelijk aan D. De drempelwaarde is een vrije parameter in het model.
Figuur 6 toont een inrichting voor het uitvoeren van de werkwijze. Aan een ingangsklem 1 wordt het signaal s(t) van figuur 1 aangeboden. Deze klem is gekoppeld met een ingang 2 van een eenheid 3.
De eenheid 3 leidt de bemonsteringen af uit het in het tijdinterval T liggende gedeelte van het signaal s(t). De bemonsteringen worden via de uitgang 4 toegevoerd aan de ingang 5 van een analoog-digitaal omzetter 6, waarin de bemonsteringen worden gedigitaliseerd. De gedigitaliseerde bemonsteringen worden via de uitgang 7 toegevoerd aan de ingang 8 van een frekwentie-analyseereenheid 9. De analyseereenheid 9 bepaalt het frekwentiespektrum A(f), zie figuur 2. Via de uitgang 10 wordt dit frekwentiespektrum toegevoerd aan een tweede eenheid 12. In de eenheid 12 worden de kansbijdragen K^, K1j' ··· K2i' K2j' · · · bepaald, zie figuur 3. Via. de uitgang 13 worden deze kansbijdragen toegevoerd aan de ingang 14 van een vermenigvuldigingseenheid 15 waarin de kansbijdragen met elkaar worden vermenigvuldigd ter verkrijging van de kansdichtheidsfunktie pdf, zie figuur 4.
Deze kansdichtheidsfunktie pdf wordt via de uitgang 16 toegevoerd aan de ingang van een toonhoogtebepaler 18, waarin uit de kansdichtheidsfunktie pdf de toonhoogte ft wordt afgeleid. Deze toonhoogte wordt via de uitgang 19 toegevoerd aan de u.itgangsklem 20 van de inrichting.
Door het signaal in opvolgende tijdsintervallen door de inrichting te laten verwerken ontstaat aan de uitgangsklem 20 de toonhoogte van het signaal als funktie van de tijd.
Het zij vermeld dat de uitvinding niet is beperkt tot enkel datgene wat in der hiervoor gaande figuurbeschrijving is beschreven. De uitvinding is evenzeer van toepassing op die uit.voeringsvoorbeelden die op niet op de uitvinding betrekking hebbende punten van de besproken voorbeelden verschillen.

Claims (5)

1. Werkwijze voor het bepalen van een toonhoogte in een signaal, waarbij uit het signaal een kansdichtheidsfunktie van de toonhoogte wordt afgeleid als funktie van de frekwentie en waarbij vervolgens uit de kansdichtheidsfunktie de toonhoogte wordt bepaald, met het kenmerk, dat (a) uit een binnen een zeker tijdinterval gelegen deel van het signaal een frekwentiespektrum van het binnen het tijdinterval gelegen deel van het signaal wordt afgeleid, welk frekwentiespektrum is opgebouwd uit bemonsteringen liggend op in hoofdzaak equidistante frekwentie waardes binnen een zeker eerste frekwentie-interval, (b) dat voor een frekwentiewaarde f^ liggend in een tweede frekwentieinterval een kansbijdrage K-y wordt bepaald, zijnde een grootheid die het gevolg is van de aanwezigheid van een frekwentiekomponent in het frekwentiespektrum ter plaatse f^, (c) dat de stap (b) ten minste éénmaal wordt herhaald ter verkrijging van ten minste een tweede kansbijdrage K^j, ten gevolge van de aanwezigheid van ten minste een tweede frekwentiekomponent aanwezig in het frekwentiespektrum ter plaatse f 3' (d) dat de ten minste twee kansbijdragen K^, K^j met elkaar worden vermenigvuldigd ter verkrijging van een kansmaal (e) dat de stappen (b), (c) en (d) worden herhaald ter verkrijging van ten minste een tweede kansmaat K^i dat de kansmaten K^, K^2, ··· elk een maat zijn voor de relatieve kans van optreden van een toonhoogte op de frekwentie f^, f2, ... respektievelijk, en dat de kansbijdragen K^, K^j, ... elk een maat zijn voor de relatieve kans dat een toonhoogte bij de frekwentie f^ het gevolg is van een frekwentiekomponent bij de frekwentiekomponent f^, fj, ... respektïevelijk, (f) dat uit de aldus verkregen kansmaten Κ^, ··· een kansdichtheidsfunktie van de toonhoogte als funktie van de frekwentie wordt afgeleid, waaruit dan weer een toonhoogte wordt bepaald.
2 Werkwijze volgens konklusie 1, met het kenmerk, dat voor het bepalen van de kansbijdrage een kansdichtheidsfunktie G(f, f^, σ±) wordt afgeleid, met een gemiddelde waarde liggend ter plaatse van de frekwentie en een standaarddeviatie 0^, welke kansdichtheidsfunktie een representatie is van de menselijke gewaarwording van een toon met frekwentie f^, dat uit deze kansdichtheidsfunktie G(f, f^, 0^) een twee(^e kansdichtheidsfunktie G'(f, f · , , ff- ) wordt afgeleid met een gemiddelde waarde nv ' ï/n' in f·, en een standaarddeviatie 0in, waarbij n een geheel getal is en i/n zodanig gekozen wordt dat f^n het dichtst bij f^ ligt, en dat in hoofdzaak gelijk genomen wordt aan Gn(f^, fj^nr i Werkwijze volgens konklusie 2, met het kenmerk, dat voor die frekwenties waarvoor de tweede kansdichtheidsfunktie Gn‘'{f, fj^n, 0^n) kleiner is dan een zekere drempelwaarde, de tweede kansdichtheidsfunktie Gn' gelijk genomen wordt aan deze drempelwaarde.
4 Werkwijze volgens konklusie 1, 2 of 3, met het kenmerk, dat de grootte van de oppervlakten onder de kansdichtheidsfunktie van de toonhoogte wordt bepaald telkens liggend tussen twee frekwentiewaarden waarbij de kansdichtheidsfunktie (relatieve) minima bezit die worden gescheiden door één tussenliggend maximum, en dat de frekwentie bij dat maximum waarvoor het bijbehorende oppervlakte het grootst is als een toonhoogte voor het signaal wordt genomen.
5 Inrichting voor het uitvoeren van de werkwijze volgens éér: der voorgaande konklusies, voorzien van een ingangsklem voor het ontvangen van het signaal, met het kenmerk, dat de ingangsklem is gekoppeld met een ingang van een frekwentie-analyseereenheid die is ingericht voor het verkrijging van een frekwentiespektrum van het binnen het tijdinterval gelegen deel van het signaal, dat een uitgang van de frekwentie-analyseereenheid is gekoppeld met een ingang van een eenheid, die is ingericht voor het bepalen van de kansbijdragen K.^, K^j,..., ^2i' ^2j' *·· en voor het toevoeren van de kansbijdragen aan een uitgang, welke uitgang is gekoppeld met een ingang van een vermenigvuldigingseenheid, dat de vermenigvuldigingseenheid is ingericht, voor het berekenen van de kansmaten Kf1, Kf?, ··· uit de kansbijdragen K^j, K^j, ... respektievelijk 1^2j' respektievelij.k ... , welke kansen K£2» ··· worden toegevoerd aan een uitgang, dat deze uitgang is gekoppeld met een ingang van een toonhoogtebepaler voor het bepalen van een toonhoogte uit de kansdichtheidsfunktie pdf, die is verkregen uit de kansmaten K^, Kf 2'
6. Inrichting volgens konklusie 5 voor het uitvoeren van de werkwijze volgens konklusie 2 of 3, met het kenmerk, dat de tweede eenheid is ingericht voor het afleiden van de kansdichtheidsfunktie G(f, f^, Uj) en voor het uit deze kansdichtheidsfunktie afleiden van de tweede kansdichtheidsfunktie Gn'(f, fj^n, }£n) en is ingericht voor het afleiden van K^, zijnde in hoofdzaak gelijk aan Gn'(fi, fj_/n» σϊη)·
NL8900520A 1989-03-03 1989-03-03 Probabilistische toonhoogtemeter. NL8900520A (nl)

Priority Applications (5)

Application Number Priority Date Filing Date Title
NL8900520A NL8900520A (nl) 1989-03-03 1989-03-03 Probabilistische toonhoogtemeter.
EP19900200440 EP0386820B1 (en) 1989-03-03 1990-02-26 Method and arrangement for probabilistic pitch measuring
DE1990601627 DE69001627T2 (de) 1989-03-03 1990-02-26 Wahrscheinlichkeits-Tonhöhenmessgerät und Verfahren.
JP4598490A JP3030382B2 (ja) 1989-03-03 1990-02-28 確率的ピッチメーター
US08/019,811 US5321636A (en) 1989-03-03 1993-02-04 Method and arrangement for determining signal pitch

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
NL8900520A NL8900520A (nl) 1989-03-03 1989-03-03 Probabilistische toonhoogtemeter.
NL8900520 1989-03-03

Publications (1)

Publication Number Publication Date
NL8900520A true NL8900520A (nl) 1990-10-01

Family

ID=19854235

Family Applications (1)

Application Number Title Priority Date Filing Date
NL8900520A NL8900520A (nl) 1989-03-03 1989-03-03 Probabilistische toonhoogtemeter.

Country Status (4)

Country Link
EP (1) EP0386820B1 (nl)
JP (1) JP3030382B2 (nl)
DE (1) DE69001627T2 (nl)
NL (1) NL8900520A (nl)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0972779A (ja) * 1995-09-04 1997-03-18 Pioneer Electron Corp 音声波形のピッチ検出装置
JP3112654B2 (ja) 1997-01-14 2000-11-27 株式会社エイ・ティ・アール人間情報通信研究所 信号分析方法
JP5463655B2 (ja) * 2008-11-21 2014-04-09 ソニー株式会社 情報処理装置、音声解析方法、及びプログラム
CN115798502B (zh) * 2023-01-29 2023-04-25 深圳市深羽电子科技有限公司 一种用于蓝牙耳机的音频去噪方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4004096A (en) * 1975-02-18 1977-01-18 The United States Of America As Represented By The Secretary Of The Army Process for extracting pitch information
NL177950C (nl) * 1978-12-14 1986-07-16 Philips Nv Spraakanalysesysteem voor het bepalen van de toonhoogte in menselijke spraak.

Also Published As

Publication number Publication date
JP3030382B2 (ja) 2000-04-10
DE69001627T2 (de) 1993-12-09
JPH02277100A (ja) 1990-11-13
EP0386820B1 (en) 1993-05-19
DE69001627D1 (de) 1993-06-24
EP0386820A1 (en) 1990-09-12

Similar Documents

Publication Publication Date Title
de Cheveigné Separation of concurrent harmonic sounds: Fundamental frequency estimation and a time‐domain cancellation model of auditory processing
Cohen et al. A spectral network model of pitch perception
Grossberg et al. ARTSTREAM: a neural network model of auditory scene analysis and source segregation
Mathieu et al. YAAFE, an Easy to Use and Efficient Audio Feature Extraction Software.
Pinto et al. Unification of perturbation measures in speech signals
EP2088518A1 (en) Method for music structure analysis
NZ566782A (en) Neural network classifier for separating audio sources from a monophonic audio signal
JP4572218B2 (ja) 音楽区間検出方法、音楽区間検出装置、音楽区間検出プログラム及び記録媒体
US5321636A (en) Method and arrangement for determining signal pitch
Xie et al. Adaptive frequency scaled wavelet packet decomposition for frog call classification
JP2005346078A (ja) 2つの調波信号の共通源の判定方法
CN101404155A (zh) 信号处理设备、信号处理方法及其程序
NL7812151A (nl) Werkwijze en inrichting voor het bepalen van de toon- hoogte in menselijke spraak.
Deepak et al. Epoch extraction using zero band filtering from speech signal
NL8900520A (nl) Probabilistische toonhoogtemeter.
Little et al. Fluency Profiling System: An automated system for analyzing the temporal properties of speech
O'Toole et al. Time-frequency detection of slowly varying periodic signals with harmonics: Methods and performance evaluation
JP3950667B2 (ja) 信号源毎の信号を求める方法及び装置
WO2018046088A1 (en) A device and method for classifying an acoustic environment
Pilia et al. Time scaling detection and estimation in audio recordings
Korhonen Modeling continuous emotional appraisals of music using system identification
Sripriya et al. Non-intrusive technique for pathological voice classification using jitter and shimmer
Pandey et al. Combination of k-means clustering and support vector machine for instrument detection
Pimpale et al. A survey on: Sound source separation methods
Plant et al. Analysis of voice changes after thyroplasty using linear predictive coding

Legal Events

Date Code Title Description
A1B A search report has been drawn up
BV The patent application has lapsed