SE517026C2 - Metod och anordning för talanalys - Google Patents

Metod och anordning för talanalys

Info

Publication number
SE517026C2
SE517026C2 SE0004221A SE0004221A SE517026C2 SE 517026 C2 SE517026 C2 SE 517026C2 SE 0004221 A SE0004221 A SE 0004221A SE 0004221 A SE0004221 A SE 0004221A SE 517026 C2 SE517026 C2 SE 517026C2
Authority
SE
Sweden
Prior art keywords
frequency
speech
analysis
fundamental tones
tones
Prior art date
Application number
SE0004221A
Other languages
English (en)
Other versions
SE0004221D0 (sv
SE0004221L (sv
Inventor
Boerje Clavbo
Original Assignee
Forskarpatent I Syd Ab
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Forskarpatent I Syd Ab filed Critical Forskarpatent I Syd Ab
Priority to SE0004221A priority Critical patent/SE517026C2/sv
Publication of SE0004221D0 publication Critical patent/SE0004221D0/sv
Priority to GB0311031A priority patent/GB2384903B/en
Priority to DE10196858T priority patent/DE10196858T1/de
Priority to PCT/SE2001/002482 priority patent/WO2002041300A1/en
Priority to AU2002214476A priority patent/AU2002214476A1/en
Priority to JP2002543426A priority patent/JP4495907B2/ja
Publication of SE0004221L publication Critical patent/SE0004221L/sv
Publication of SE517026C2 publication Critical patent/SE517026C2/sv
Priority to US10/438,805 priority patent/US7092874B2/en
Priority to US12/191,963 priority patent/USRE43406E1/en

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification
    • G10L17/26Recognition of special voice characteristics, e.g. for use in lie detectors; Recognition of animal voices

Description

IvL-ß 10 15 20 25 30 35 517 026 2 sker i. Det är vidare känt att försöka återskapa sådana kontextbundna variationer i talsyntes. Detta beskrivs exempelvis i EP 0 674 307.
Vidare sänder talaren med sitt kroppsspråk signaler till åhöraren.
Det finns dock fortfarande mycket information som överförs medelst mänskligt tal som ej medveten uppfattas, och som därmed inte kan analyseras. Det finns sålunda ett behov av verktyg såsom metoder och anordningar för förbättrad talanalys och/eller analys av ytterligare aspekter i talet.
Uppfinningens svfte Det är därför ett syfte med föreliggande uppfinning att tillhandahålla en metod och en anordning för talanalys som helt eller åtminstone delvis löser de ovan relaterade problemen hos den kända tekniken.
Detta problem löses medelst metoden och anordningen enligt uppfinningen.
Sammanfattning av uppfinningen Det har nu överraskande visats av uppfinnaren till föreliggande uppfinning, att även det kontinuerliga byte av grundtoner som sker vid normalt tal och de intervall som därvid används har betydelse för hur talet uppfattas.
Detta kontinuerliga byte av tonhöjd analyseras enligt uppfinningen utifrån vilka intervall som används vid dessa byten, och förekomsten av olika intervall påverkar sålunda hur talet uppfattas. Till exempel kan talet, beroende på i vilken utsträckning olika intervall används, uttrycka olika sinnesstämningar, olika känslotillstånd, olika grad av tillförlitlighet osv.
Medelst talet sker sålunda en emotionell kommunikation som undermedvetet uppfattas av åhörare beroende på vilka intervall som används, utöver innehållet i de ord som yttras, det röstläge som används, tempot i språket och andra uppenbart kommunicerande delar hos talet. Såväl >»;>; 10 15 20 25 30 35 517 026 3 talare som åhörare är dock normalt helt omedvetna om denna ytterligare kommunikativa dimension hos talet.
Trots att valet av intervall då man talar normalt är omedvetet, har det dock visat sig vara i viss mån pàverkbart. Det är sålunda möjligt att även utnyttja uppfinningen för att medvetet modifiera valet av intervall för att på så vis medvetet ge rösten och talet vissa eftersökta uttryck. Detta ingår som en annan aspekt i den föreliggande uppfinningen.
Det har vidare överraskande framkommit att det undermedvetna valet av intervall som människan gör när hon talar påverkas av det psykiska och fysiska välbefinnandet. Sålunda är det medelst analys enligt uppfinningen även möjligt att urskilja psykiska eller fysiska försämringar hos talaren eller även direkta sjukdomstillstånd. Detta kan även vid många typer av sjukdomar ske vid en tidigare tidpunkt i sjukdomsförloppen än för många andra, alternativa diagnosticeringsmetoder. Detta ingår som ytterligare en annan aspekt av föreliggande uppfinning.
Kort beskrivning av ritninqarna Uppfinningen skall nu i exemplifierande syfte beskrivas mer ingående med hjälp av utföringsexempel, och med hänvisning till de bifogade ritningarna, på vilka: Fig l visar ett schematiskt flödesschema över ett första utförande av en metod enligt uppfinningen; och Fig 2 visar ett schematiskt blockschema över ett första utförande av en anordning enligt uppfinningen.
Beskrivninq av föredragna utföringsformer Fig 1 visar schematiskt ett flödesschema för ett utförande av en metod för talanalys enligt uppfinningen.
I ett första steg S1 talas en talsekvens för analys in.
Detta kan ske genom att direkt tala in tal för analys i en behandlande enhet, varvid den efterföljande analysen med fördel kan utföras i real-tid. Det är dock också »|,v. lO 15 20 25 30 35 517 026 4 möjligt att i förväg registrera talsekvenser pà ett registreringsmedium sàsom kassettband, CD-skivor, dataminnen osv.
Därefter med fördel en filtrering i steg S2.
Denna filtrering kan omfatta bortfiltrerande av för korta toner, så att endast toner med en tillräckligt láng varaktighet, företrädesvis över ett bestämt tidströskelvärde, förs vidare till analys. Alternativt, eller som komplement, kan filtreringen även avse urskiljande av toner med en tillräckligt hög styrka, företrädesvis över ett bestämt amplitudtröskelvärde.
Härigenom rensas för svaga toner bort.
Filtreringen kan alternativt eller som komplement även omfatta medelvärdesbildande av tonhöjden över ett bestämt tidsintervall, varvid det sålunda bildade medelvärdet används för den vidare analysen. Pà detta sätt kan glissandon, dvs glidande tonhöjdsrörelser över flera toner, förslag osv enkelt hanteras.
Därefter analyseras i steg S3 de framfiltrerade tonerna, varvid grundtonerna identifieras.
Identifieringen omfattar analys av talljudet och identifierande av den lägsta ljudande frekvensen. Detta kan exempelvis ske pà det vis som beskrivs i EP O 821 345 och US 6 014 617, men andra sätt är också möjliga. Sàväl melismatiskt som syllabiskt förekommande toner identifieras företrädesvis.
Alternativt kan dock identifieringen istället ske före filtreringen.
Därefter analyseras de sålunda identifierade grundtonerna vidare i steg S4, varvid ätminstone vissa intervall mellan närliggande grundtoner identifieras.
Företrädesvis identifieras alla intervall mellan närliggande toner, men det är också möjligt att endast identifiera alla, eller ätminstone de flesta, av de intervall som bedöms speciellt viktiga för det aktuella syftet med analysen. Det kan också vara motiverat för ätminstone vissa tillämpningar att steget att identifiera 10 l5 20 25 30 35 517 026 5 intervall inte enbart omfattar framtagande av frekvensskillnader mellan närliggande toner, utan även i vilken riktning förändringen sker, dvs stigande eller sjunkande tonhöjd/intervall.
Därefter bestäms i steg S5 medelst någon lämplig statistisk metod ett mått pà hur ofta vissa, för analysen centrala intervall förekommer i den för analys avsedda talsekvensen. Exempelvis kan sådana mätt omfatta en eller flera av: 0 hur stor del av alla intervall ett visst intervall utgör; 0 hur stor del av en viss mängd bestämda intervall ett visst intervall utgör; och 0 proportionerna i förekomst mellan ett, tvà eller fler utvalda intervall.
Det är dock även möjligt och i vissa fall användbart att bestämma förekomst av vissa sekvenser av intervall, dvs intervall mellan tre eller fler efter varandra följande grundtoner och intervallens belägenhet, dvs placering i tonhöjd.
För analysen av de framtagna intervallen kan allmänt följande egenskaper förknippas med olika intervall: 0 Ren prim (R1): Fundersamt, progressivt 0 Liten sekund (L2): Sökande, orienterande 0 Stor sekund (S2): Behagfullt, själexponerande 0 Liten ters (L3): Moll, passiv 0 Stor ters (S3): Dur, sporrande 0 Ren kvart (R4): Vänskapligt 0 Överstigande kvart/förminskad kvint/tritonus (Trit.): Kreativt, pàträngande 0 Liten sext (L6): Mjukhet 0 Stor sext (S6): 0 Liten septima (L7): Smärtfyllt (S7): 0 Ren oktav (R8): Glatt, uppmuntrande Stimulerande 0 Stor septima Häftigt, vredgat - -.- 10 15 20 25 30 35 517 026 6 Intervall överstigande en oktav kan normalt klassificeras och grupperas för sig, eller alternativt kombineras ihop med motsvarande intervall understigande en oktav.
För många undersökningar kan det vara användbart att särskilja intervall från undergrupperna [A] prim (Rl), liten sekund (L2), stor sekund (S2), liten ters (L3), stor ters (S3), liten sext (L6) och stor sext (S6); respektive [B] ren kvart (R4), överstigande kvart/understigande kvint (tritonus), ren kvint (R5), liten septima (L7), stor septima (S7) och ren oktav (R8).
Vidare kan intervall som oftast förekommer som stigande karakteriseras som bekräftande, intervall som oftast förekommer sjunkande som obundna, och intervall som förekommer väsentligen lika ofta stigande som sjunkande som diplomatiska.
Sekvenser som speciellt är intressanta att identifiera är sekvenser med toner som ingår i dur~ eller mollackord, dvs grundton, ters och kvint. Framförallt är det grundlägesarpeggion med tre toner som är intressanta, reverserat eller icke-reverserat. Dock kan grundtonen även förekomma i två lägen (dvs i oktavintervall). Även andra ackordsekvenser kan dock vara av intresse, beroende pà hur analysen skall användas.
Speciellt är det vidare ofta av intresse att jämföra förekomsten av små terser (L3) och stora terser (S3). Det är också ofta intressant att urskilja förekomst av tretons ackordrörelser. Vidare är det ofta av intresse att urskilja förekomst och speciellt upprepningar av primer (R1), speciellt vid ritardandon. Detta kan exempelvis tyda på tveksamhet, eftertänksamhet osv. Även belägenheten för olika intervall, dvs på vilken tonhöjd de börjar eller slutar, kan vara signifikant för olika tillstånd.
Analysen som beskrivits ovan kan användas på många olika sätt. Ett användningsområde är vid psykologisk analys av den talande. Detta kan användas för bedömning 10 15 20 25 30 35 517 026 7 av personlighet, av den talandes sinnesstämning och känsloläge osv. Sålunda är metoden användbar i många fall när sådana psykologiska utredningar och analyser är av intresse, såsom vid anställningsintervjuer, kliniskt vid psykiatrisk vård och liknande, vid lögndetektering osv.
Det har också framkommit att denna talanalys kan användas för tolkning av den talandes fysiska välbefinnande, och därmed även för diagnosticering av olika sjukdomstillstånd. Exempelvis verkar förekomsten av icke fundamentala rörelser (dvs tretoners ackordrörelser) reduceras eller helt bortfalla, samt förekomsten av mollintervall (L3) öka vid många sjukdomstillstånd.
Då analysen skall användas för något bestämt ändamål sker normalt även ett efterföljande tolkningssteg S6.
Denna tolkning kan bygga på en jämförelse med normalvärden. Sådana normalvärden kan antingen vara allmänna, eller företrädesvis avpassad för olika kategorier. Kategorierna kan exempelvis avspegla språktillhörighet, nationalitet och/eller andra miljö- och kontextaspekter. Alternativt eller som komplement kan indelningen i kategorier även vara baserat på personliga egenskaper, såsom kön, ålder, tidigare erfarenheter osv.
Olika standardvärden och jämförelser kan också lämpligen användas beroende på vilket syfte som avses.
Det är dock också möjligt att istället för standardvärden, eller som tillägg till en sådan jämförelse, använda tidigare analyser av samma talare.
Härvid kan förändringar över tiden urskiljas, vilka förändringar kan användas för att exempelvis identifiera psykiska och fysiska sjukdomstillstånd.
Analysen enligt ovan kan även användas för talträning, varvid de uppskattade intervallfrekvenserna jämförs med föredragna värden. Dess föredragna värden kan vara framtagna för att passa olika situationer och känslolägen. Vidare kan jämförelsen presenteras för användaren, företrädesvis i real-tid. Det är också föredraget att automatiskt urskilja föredragna åtgärder 10 15 20 25 30 35 517 026 8 för att minska differenser mellan det analyserade talet och de föredragna värdena. Detta kan ske genom att identifiera exempelvis för vilka intervall differensen är störst eller vilka intervall som bedöms vara viktigast och därefter utifrân detta hämta förlagrade instruktioner för lämpliga åtgärder. Metoden för talträning kan användas för språkinlärning, för träning av skådespelare, för träning inför offentliga framträdanden osv.
En anordning för utförande av en metod enligt ovan omfattar i ett utförande ett organ 1 för upptagande av en talsekvens och ett registreringsmedium 2 för lagrande av den upptagna sekvensen. Upptagningsorganet kan exempelvis vara en mikrofon, och registreringsmediet en kassett, ett dataminne, en CD-skiva eller liknande. Eventuellt kan dock redan på förhand lagrade talsekvenser användas för analysen. Vidare är det möjligt att utföra analysen i real-tid, varvid registreringsmediet kan uteslutas.
Vidare omfattar anordningen filtreringsorgan 3 för att filtrera den intalade signalen. Filtret kan vara inrättat att utföra någon eller alla av de ovan angivna filtreringarna. Filtret kan även omfatta flera olika filtreringsenheter.
Vidare omfattar anordningen mätorgan 4 för bestämmande av grundtoner i talsignalen. Denna anordning kan exempelvis vara en DSP-enhet (”Digital Signal Processing”), och arbeta i enlighet med vad som beskrivs i EP 0 821 345 eller US 6 014 617, innefattas genom hänvisning. Andra mätorgan som utför vilka härmed bestämmande av grundtoner är dock också tänkbara. Vidare kan mätorganet alternativt vara anordnad före filterorganen.
De analyserade grundtonerna förs vidare till ett organ 5 för identifierande av intervall mellan närliggande grundtoner, på sà vis som beskrivits ovan, och de identifierade intervallen förs vidare till ett organ för uppskattande av med vilken frekvens åtminstone 10 15 20 25 30 35 517 026 9 vissa eftersökta intervall förekommer. Detta organ kan med fördel omfatta ett kommersiellt tillgängligt statistikprogram.
Anordningen kan vidare omfatta ett jämförande organ 6, vilket jämför åtminstone några av intervalluppskattningarna_ Detta jämförande organ jämför härvid företrädesvis den uppskattade frekvensen för vissa eller alla intervall med en på förhand fastställd föredragen frekvens, såsom diskuterats tidigare. De tidigare fastställda värdena är företrädesvis lagrade i en minnesenhet eller databas 6.
Anordningen omfattar vidare med fördel ett tolkande organ 7, vilket analyserar de framkomna differenserna.
Det tolkande organet kan vidare vara kopplat till en databas 8 för automatiskt tillhandahållande av instruktioner för åtgärder, diagnoser osv. Dessa instruktioner, jämförelseresultat osv kan med fördel presenteras för användaren via ett presentationsorgan 9, vilket exempelvis kan vara en skärm, en högtalare eller liknande.
Anordningen enligt ovan kan med fördel realiseras på en konventionell persondator utrustad med mikrofon och ljudkort för signalbehandling. Databaserna kan antingen vara lagrade i ett eller flera minnen hos datorn eller vara åtkomliga via kommunikationsnätverk, såsom Internet.
Metoden och anordningen för analys enligt ovan kan även användas för att styra talsyntes. Härvid kan konventionella, och i sig sedan tidigare kända, metoder och anordningar för talsyntes användas, varvid dessa metoder och anordningar styrs i enlighet med analyser framtagna medelst uppfinningen. Härvid kan syntesen styras för att förmedla olika känslotillstånd, sinnesstämningar och andra uttryck. Vidare kan talsyntesen härvid anpassas för att efterlikna olika personer eller grupper av människor. a nu' vv~. n-v 10 15 20 517 026 10 Uppfinningen har ovan beskrivits med hjälp av utföringsexempel. Det skall dock inses att andra varianter av uppfinningen än de här angivna är möjliga.
Exempelvis är det möjligt att endast identifiera ett fåtal intervall, att använda andra intervall eller grupper av intervall för analysen, att mäta grundtoner pà andra sätt osv. Det är vidare möjligt att använda analysmetoden och analysanordningen enligt uppfinningen för andra ändamål än för talträning och diagnosticering.
Exempelvis är det tänkbart att använda en dylik analys för lögndetektering, för en inledande bedömning av människor i samband med exempelvis anställningsintervjuer, osv. Troligen skulle en mer detaljerad analys av en talsekvens även kunna användas för identifieringsändamàl. Vidare kan en analys enligt uppfinningen användas för utväljande och sammansättande av personer i olika gruppkonstellationer och liknande, varvid anpassning kan göras för att öka sannolikheten för harmoni och gott samarbete inom gruppen.
Sådana och andra närliggande varianter måste anses omfattas av uppfinningen sàsom den avgränsas av de bifogade patentkraven.

Claims (40)

lO 15 20 25 30 35 517 026 . . u n nu n o I ' :oo n. ll PATENTKRAV
1. Metod för analyserande av mänskligt tal omfattande: - uppmätande av ljudande grundtoner i en för analys avsedd talsekvens; - identifierande av frekvensintervall mellan åtminstone två på varandra följande av nämnda grundtoner; - uppskattande av med vilken frekvens åtminstone ett av dessa sålunda identifierade frekvensintervall förekommer i den för analys avsedda talsekvensen.
2. Metod enligt patentkrav 1, varvid uppmätandet av grundtoner i den för analys avsedda talsekvensen omfattar urskiljande av grundtoner med en tillräckligt lång varaktighet, företrädesvis över ett bestämt tidströskelvärde, varvid endast de sålunda urskilda grundtoner identifieras.
3. Metod enligt patentkrav 1 eller 2, varvid uppmätandet av grundtoner i den för analys avsedda talsekvensen omfattar urskiljande av grundtoner med en tillräckligt hög styrka, företrädesvis över ett bestämt amplitudtröskelvärde, varvid endast de sålunda urskilda grundtonerna identifieras.
4. Metod enligt något av patentkraven 1-3, varvid uppmätandet av grundtoner i den för analys avsedda talsekvensen omfattar medelvärdesbildande av tonhöjden över ett bestämt tidsintervall, varvid det sålunda bildade medelvärdet används för identifierande av grundtoner.
5. Metod enligt något av ovanstående patentkrav, varvid identifierande av frekvensintervall även omfattar identifierande av om frekvensintervallet är stigande eller sjunkande.
6. Metod enligt något av ovanstående patentkrav, varvid åtminstone små terser (L3) och stora terser (S3) identifieras. 10 15 20 25 30 35 517 026 12
7. Metod enligt något av ovanstående patentkrav, varvid åtminstone ett frekvensintervall identifieras från gruppen: prim (Rl), liten sekund (L2), stor sekund (S2), liten ters (L3), sext (S6); och åtminstone ett frekvensintervall från stor ters (S3), liten sext (L6) och stor gruppen ren kvart (R4), överstigande kvart/understigande kvint (trit.), (R5), liten septima (L7) och (S7).
8. Metod enligt något av ovanstående patentkrav, ren kvint stor septima varvid de identifierade frekvensintervallen uppdelas i åtminstone undergrupperna: prim (R1), liten sekund (L2), stor sekund (S2), liten ters (L3), stor ters (S3), liten sext (L6) och stor sext (S6); respektive: ren kvart (R4), överstigande kvart/understigande kvint (tritonus), ren kvint (R5), (S7) (R8).
9. Metod enligt något av ovanstående patentkrav, liten septima (L7), stor septima och ren oktav varvid frekvensintervallsekvenser mellan toner i åtminstone någon grupp om åtminstone tre på varandra följande av nämnda grundtoner identifieras.
10. Metod enligt patentkrav 9, varvid de identifierade frekvensintervallsekvenserna omfattar toner i ett dur- eller mollackord.
11. ll. Metod enligt patentkrav 10, varvid de identifierade frekvensintervallsekvenserna omfattar stigande eller sjunkande arpeggio av dur- eller mollackord.
12. Anordning för analyserande av mänskligt tal omfattande: - mätorgan för uppmätande av ljudande grundtoner i en för analys avsedd talsekvens; - organ för identifierande av frekvensintervall mellan åtminstone två på varandra följande av nämnda grundtoner; - organ för uppskattande av med vilken frekvens åtminstone ett av dessa sålunda identifierade frekvensintervall förekommer i den för analys avsedda talsekvensen. 10 15 20 25 30 35 51 7 026%* 13
13. Anordning enligt patentkrav 12, varvid mätorganet för uppmätande av grundtoner vidare omfattar en filtreringsenhet för urskiljande av grundtoner med en varaktighet över ett bestämt tidströskelvärde.
14. Anordning enligt patentkrav 12 eller 13, varvid mätorganet för uppmätande av grundtoner vidare omfattar en filtreringsenhet för urskiljande av grundtoner med en styrka över ett bestämt amplitudtröskelvärde.
15. Anordning enligt något av patentkraven 12-14, varvid mätorganet för uppmätande av grundtoner vidare omfattar en organ för medelvärdesbildande av tonhöjden över ett bestämt tidsintervall.
16. Anordning enligt något av patentkraven 12-15, varvid organet för identifierande av frekvensintervall åtminstone är inrättat att identifiera små terser (L3) (S3).
17. Anordning enligt något av patentkraven 12-16, och stora terser varvid organet för identifierande av frekvensintervall vidare är inrättat att identifiera frekvensintervallsekvenser mellan toner i åtminstone någon grupp om åtminstone tre på varandra följande av nämnda grundtoner.
18. Metod för automatiserad talträning omfattande - uttalande av en talsekvens av en användare; - uppmätande av ljudande grundtoner i den för analys avsedd talsekvensen; - identifierande av frekvensintervall mellan åtminstone två på varandra följande av nämnda grundtoner; - uppskattande av med vilken frekvens åtminstone ett av dessa sålunda identifierade frekvensintervall förekommer i den för analys avsedda talsekvensen; - jämförande av den uppskattade frekvensintervallfrekvensen med en på förhand fastställd föredragen frekvens för den aktuella användaren.
19. Metod enligt patentkrav 18, vidare omfattande presenterande av ett resultat av jämförelsen mellan den uppskattade frekvensintervallfrekvensen och den på 10 15 20 25 30 35 517 026 14 förhand fastställda föredragna frekvens för den aktuella användaren.
20. omfattande identifierande av lämpliga åtgärder för Metod enligt patentkrav 18 eller 19, vidare minskande av differensen mellan den uppskattade frekvensintervallfrekvensen med den pà förhand fastställd föredragna frekvensen.
21. Metod enligt något av patentkraven 18-20, varvid den utförs i real-tid.
22. Metod enligt något av patentkraven 18-21, varvid den på förhand fastställd föredragna frekvens för den aktuella användaren omfattar standardvärden.
23. standardvärdena är indelade i åtminstone en av Metod enligt patentkrav 22, varvid kategorierna användartyper och talträningssyfte.
24. - organ för registrerande av en uttalad talsekvens; Anordning för talträning omfattande - mätorgan för uppmätande av ljudande grundtoner i den för analys avsedd talsekvensen; - identifieringsorgan för identifierande av frekvensintervall mellan åtminstone två på varandra följande av nämnda grundtoner; - uppskattningsorgan för uppskattande av med vilken frekvens åtminstone ett av dessa sålunda identifierade frekvensintervall förekommer i den för analys avsedda talsekvensen; - organ för jämförande av den uppskattade frekvensintervallfrekvensen med en på förhand fastställd föredragen frekvens för den aktuella användaren.
25. omfattande presentationsorgan för presenterande av ett Anordning enligt patentkrav 24, vidare resultat av jämförelsen mellan den uppskattade frekvensintervallfrekvensen och den på förhand fastställda föredragna frekvens för den aktuella användaren.
26. omfattande analysorgan för identifierande av lämpliga Anordning enligt patentkrav 24 eller 25, vidare 10 15 20 25 30 35 517 026 o non. o 15 åtgärder för minskande av differensen mellan den uppskattade frekvensintervallfrekvensen med den på förhand fastställd föredragna frekvensen.
27. Anordning enligt något av patentkraven 24-26, varvid den vidare omfattar en databas med åtminstone en uppsättning standardvärden för användning som den på förhand fastställda föredragna frekvensen för den aktuella användaren, och företrädesvis ett flertal uppsättningar standardvärden indelade avseende åtminstone en av kategorierna användartyper och talträningssyfte.
28. Metod för diagnosticering av sjukdomstillstånd utifrån en talanalys omfattande - uttalande av en talsekvens av en patient; - uppmätande av ljudande grundtoner i den för analys avsedd talsekvensen; - identifierande av frekvensintervall mellan åtminstone två på varandra följande av nämnda grundtoner; - uppskattande av med vilken frekvens åtminstone ett av dessa sålunda identifierade frekvensintervall förekommer i den för analys avsedda talsekvensen; - utvärdering av åtminstone en sådan uppskattad frekvensintervallfrekvens genom jämförande med en på förhand fastställd frekvens för diagnosticering.
29. Metod enligt patentkrav 28, varvid den på förhand fastställda frekvensen är baserad på åtminstone en motsvarande tidigare analys av en talsekvens från samma patient.
30. Metod enligt patentkrav 29, varvid den på förhand fastställda frekvensen är baserad på en sammanvägning av motsvarande analyser av åtminstone två, och företrädesvis ett flertal talsekvenser från samma patient.
31. Metod enligt patentkrav 28, varvid den på förhand fastställda frekvensen är baserad på normalvärden.
32. Metod enligt patentkrav 31, varvid patienter vidare indelas i kategorier, varvid den på förhand 10 15 20 25 30 35 517 026 16 fastställda frekvensen är baserad på normalvärden för den aktuella kategorin användare.
33. vidare omfattande presenterande av ett resultat av Metod enligt något av patentkraven 28-32, utvärdering av jämförelsen mellan frekvensintervallfrekvens och den på förhand fastställda frekvensen.
34. Anordning för diagnosticering av sjukdomstillstånd utifrån en talanalys omfattande - organ för registrerande av en uttalad talsekvens; - mätorgan för uppmätande av ljudande grundtoner i den för analys avsedd talsekvensen; - identifieringsorgan för identifierande av frekvensintervall mellan åtminstone två på varandra följande av nämnda grundtoner; - uppskattningsorgan för uppskattande av med vilken frekvens åtminstone ett av dessa sålunda identifierade frekvensintervall förekommer i den för analys avsedda talsekvensen; - organ för utvärdering av åtminstone en sådan uppskattad frekvensintervallfrekvens genom jämförande med en på förhand fastställd frekvens för diagnosticering.
35. omfattande presentationsorgan för presenterande av ett Anordning enligt patentkrav 34, vidare resultat av utvärderingen av den uppskattade frekvensintervallfrekvensen_
36. omfattande vidare omfattar en databas med åtminstone en Anordning enligt patentkrav 34 eller 35, vidare uppsättning standardvärden för användning som den på förhand fastställda föredragna frekvensen för den aktuella användaren, och företrädesvis ett flertal uppsättningar standardvärden indelade avseende åtminstone en av kategorierna användartyper och diagnosticeringssyfte.
37. analysera åtminstone en talsekvens från åtminstone en Metod för talsyntes, omfattande stegen att person medelst en analysmetod i enlighet med något av 10 15 517 026 17 patentkraven 1-11, samt att utifrån denna analys styra framställande av syntetiskt tal utifrån åtminstone någon apsekt hos denna analys.
38. Metod enligt patentkrav 37, varvid analysen omfattar en sammanvägning av flera talsekvenser hos samma person.
39. Metod enligt patentkrav 37 eller 38, varvid analysen omfattar en sammanvägning av talsekvenser från flera olika personer.
40. Anordning för talsyntes, omfattande en anordning för analyserande av åtminstone en talsekvens från åtminstone en person i enlighet med något av patentkraven 12-17, samt organ för framställande av syntetiskt tal, varvid organet för framställande av syntetiskt tal styrs utifrån åtminstone någon apsekt hos den av analysanordningen framställda analysen.
SE0004221A 2000-11-17 2000-11-17 Metod och anordning för talanalys SE517026C2 (sv)

Priority Applications (8)

Application Number Priority Date Filing Date Title
SE0004221A SE517026C2 (sv) 2000-11-17 2000-11-17 Metod och anordning för talanalys
GB0311031A GB2384903B (en) 2000-11-17 2001-11-09 Method and device for speech analysis
DE10196858T DE10196858T1 (de) 2000-11-17 2001-11-09 Verfahren und Gerät für die Sprachanalyse
PCT/SE2001/002482 WO2002041300A1 (en) 2000-11-17 2001-11-09 Method and device for speech analysis
AU2002214476A AU2002214476A1 (en) 2000-11-17 2001-11-09 Method and device for speech analysis
JP2002543426A JP4495907B2 (ja) 2000-11-17 2001-11-09 音声の分析の方法及び装置
US10/438,805 US7092874B2 (en) 2000-11-17 2003-05-16 Method and device for speech analysis
US12/191,963 USRE43406E1 (en) 2000-11-17 2008-08-14 Method and device for speech analysis

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
SE0004221A SE517026C2 (sv) 2000-11-17 2000-11-17 Metod och anordning för talanalys

Publications (3)

Publication Number Publication Date
SE0004221D0 SE0004221D0 (sv) 2000-11-17
SE0004221L SE0004221L (sv) 2002-04-02
SE517026C2 true SE517026C2 (sv) 2002-04-02

Family

ID=20281867

Family Applications (1)

Application Number Title Priority Date Filing Date
SE0004221A SE517026C2 (sv) 2000-11-17 2000-11-17 Metod och anordning för talanalys

Country Status (7)

Country Link
US (2) US7092874B2 (sv)
JP (1) JP4495907B2 (sv)
AU (1) AU2002214476A1 (sv)
DE (1) DE10196858T1 (sv)
GB (1) GB2384903B (sv)
SE (1) SE517026C2 (sv)
WO (1) WO2002041300A1 (sv)

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7917366B1 (en) * 2000-03-24 2011-03-29 Exaudios Technologies System and method for determining a personal SHG profile by voice analysis
SE517026C2 (sv) 2000-11-17 2002-04-02 Forskarpatent I Syd Ab Metod och anordning för talanalys
JP4502246B2 (ja) * 2003-04-24 2010-07-14 株式会社河合楽器製作所 音程判定装置
KR20060066416A (ko) * 2004-12-13 2006-06-16 한국전자통신연구원 음성 코덱을 이용한 후두 원격 진단 서비스 장치 및 그 방법
US7398213B1 (en) * 2005-05-17 2008-07-08 Exaudios Technologies Method and system for diagnosing pathological phenomenon using a voice signal
US8346559B2 (en) 2007-12-20 2013-01-01 Dean Enterprises, Llc Detection of conditions from sound
WO2010123483A2 (en) * 2008-02-28 2010-10-28 Mcclean Hospital Corporation Analyzing the prosody of speech
US10002608B2 (en) * 2010-09-17 2018-06-19 Nuance Communications, Inc. System and method for using prosody for voice-enabled search
EP2693429A1 (en) * 2012-08-02 2014-02-05 JaJah Ltd System and method for analyzing voice communications
EP3007165B1 (en) 2013-05-31 2018-08-01 Yamaha Corporation Technology for responding to remarks using speech synthesis
JP6428774B2 (ja) 2014-07-02 2018-11-28 ヤマハ株式会社 音声制御装置、音声制御方法およびプログラム
JP6446993B2 (ja) 2014-10-20 2019-01-09 ヤマハ株式会社 音声制御装置およびプログラム
JP6464703B2 (ja) 2014-12-01 2019-02-06 ヤマハ株式会社 会話評価装置およびプログラム
JP6780182B2 (ja) 2015-10-08 2020-11-04 コルディオ メディカル リミテッド 音声分析による肺疾患の評価
JP6746963B2 (ja) * 2016-03-04 2020-08-26 ヤマハ株式会社 会話評価装置、プログラムおよび会話評価方法
WO2018146690A1 (en) * 2017-02-12 2018-08-16 Cardiokol Ltd. Verbal periodic screening for heart disease
JP6909733B2 (ja) * 2018-01-26 2021-07-28 株式会社日立製作所 音声分析装置および音声分析方法
US10847177B2 (en) 2018-10-11 2020-11-24 Cordio Medical Ltd. Estimating lung volume by speech analysis
US11024327B2 (en) 2019-03-12 2021-06-01 Cordio Medical Ltd. Diagnostic techniques based on speech models
US11011188B2 (en) 2019-03-12 2021-05-18 Cordio Medical Ltd. Diagnostic techniques based on speech-sample alignment
US11484211B2 (en) 2020-03-03 2022-11-01 Cordio Medical Ltd. Diagnosis of medical conditions using voice recordings and auscultation
US11417342B2 (en) 2020-06-29 2022-08-16 Cordio Medical Ltd. Synthesizing patient-specific speech models
JP7179209B1 (ja) 2022-02-04 2022-11-28 由美子 中島 音声診断装置、音声診断方法、及び音声診断プログラム
JP7191269B1 (ja) 2022-02-04 2022-12-16 由美子 中島 発声健康法促進装置、発声健康法促進方法、及び発声健康法促進プログラム

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US2183248A (en) * 1939-12-12 Wave translation
US3971034A (en) 1971-02-09 1976-07-20 Dektor Counterintelligence And Security, Inc. Physiological response analysis method and apparatus
CA943230A (en) 1971-02-09 1974-03-05 Charles R. Mcquiston Physiological response analysis method and apparatus
JPS5054195A (sv) * 1973-09-08 1975-05-13
US4093821A (en) * 1977-06-14 1978-06-06 John Decatur Williamson Speech analyzer for analyzing pitch or frequency perturbations in individual speech pattern to determine the emotional state of the person
US5976081A (en) 1983-08-11 1999-11-02 Silverman; Stephen E. Method for detecting suicidal predisposition
US5148483A (en) * 1983-08-11 1992-09-15 Silverman Stephen E Method for detecting suicidal predisposition
WO1986005617A1 (en) * 1985-03-18 1986-09-25 Massachusetts Institute Of Technology Processing of acoustic waveforms
JPH0627971B2 (ja) * 1987-02-06 1994-04-13 ティアツク株式会社 イントネーション測定装置および語学学習装置
JPH0512023A (ja) * 1991-07-04 1993-01-22 Omron Corp 感情認識装置
JPH08286693A (ja) * 1995-04-13 1996-11-01 Toshiba Corp 情報処理装置
JP3280825B2 (ja) * 1995-04-26 2002-05-13 富士通株式会社 音声特徴分析装置
JP3266819B2 (ja) * 1996-07-30 2002-03-18 株式会社エイ・ティ・アール人間情報通信研究所 周期信号変換方法、音変換方法および信号分析方法
JP3174777B2 (ja) * 1999-01-28 2001-06-11 株式会社エイ・ティ・アール人間情報通信研究所 信号処理方法および装置
US6151571A (en) * 1999-08-31 2000-11-21 Andersen Consulting System, method and article of manufacture for detecting emotion in voice signals through analysis of a plurality of voice signal parameters
US6353810B1 (en) * 1999-08-31 2002-03-05 Accenture Llp System, method and article of manufacture for an emotion detection system improving emotion recognition
US6275806B1 (en) * 1999-08-31 2001-08-14 Andersen Consulting, Llp System method and article of manufacture for detecting emotion in voice signals by utilizing statistics for voice signal parameters
US7139699B2 (en) * 2000-10-06 2006-11-21 Silverman Stephen E Method for analysis of vocal jitter for near-term suicidal risk assessment
SE517026C2 (sv) 2000-11-17 2002-04-02 Forskarpatent I Syd Ab Metod och anordning för talanalys

Also Published As

Publication number Publication date
SE0004221D0 (sv) 2000-11-17
DE10196858T1 (de) 2003-11-20
US7092874B2 (en) 2006-08-15
US20040002853A1 (en) 2004-01-01
GB2384903B (en) 2004-08-04
GB2384903A (en) 2003-08-06
USRE43406E1 (en) 2012-05-22
SE0004221L (sv) 2002-04-02
GB0311031D0 (en) 2003-06-18
WO2002041300A1 (en) 2002-05-23
JP2004514178A (ja) 2004-05-13
AU2002214476A1 (en) 2002-05-27
JP4495907B2 (ja) 2010-07-07

Similar Documents

Publication Publication Date Title
SE517026C2 (sv) Metod och anordning för talanalys
JP6263308B1 (ja) 認知症診断装置、認知症診断方法、及び認知症診断プログラム
Thomas Sociophonetics: an introduction
US6697457B2 (en) Voice messaging system that organizes voice messages based on detected emotion
US6353810B1 (en) System, method and article of manufacture for an emotion detection system improving emotion recognition
US6480826B2 (en) System and method for a telephonic emotion detection that provides operator feedback
EP1222448B1 (en) System, method, and article of manufacture for detecting emotion in voice signals by utilizing statistics for voice signal parameters
Latinus et al. Human voice perception
US7627475B2 (en) Detecting emotions using voice signal analysis
Schellenberg et al. Music lessons, pitch processing, and g
Honorof et al. Perception of pitch location within a speaker’s F0 range
US20090043586A1 (en) Detecting a Physiological State Based on Speech
JP2003508805A (ja) 複数の音声信号パラメータの分析を通して音声信号の感情を検出する装置、方法、及び、製造物品
US20020077825A1 (en) Methods and apparatus for evaluating near-term suicidal risk using vocal parameters
Chebbi et al. On the use of pitch-based features for fear emotion detection from speech
Jessen Speaker profiling and forensic voice comparison: The auditory-acoustic approach
Vanden Bosch der Nederlanden et al. Change detection in complex auditory scenes is predicted by auditory memory, pitch perception, and years of musical training
Baird et al. An evaluation of the effect of anxiety on speech-computational prediction of anxiety from sustained vowels
Kopf et al. Pitch strength as an outcome measure for treatment of dysphonia
Kurt et al. Musical feature based classification of Parkinson's disease using dysphonic speech
Hussenbocus et al. Statistical differences in speech acoustics of major depressed and non-depressed adolescents
JP7307507B2 (ja) 病態解析システム、病態解析装置、病態解析方法、及び病態解析プログラム
Johnson et al. The perception of personal identity in speech: Evidence from the perception of twins’ speech
CN113425293A (zh) 一种听觉失认障碍评估系统及方法
KR20230151197A (ko) 음성 데이터를 이용한 ai 기반의 질병 진단 방법 및 장치

Legal Events

Date Code Title Description
NUG Patent has lapsed