FI91925B - Menetelmä puhujan tunnistamiseksi - Google Patents

Menetelmä puhujan tunnistamiseksi Download PDF

Info

Publication number
FI91925B
FI91925B FI912088A FI912088A FI91925B FI 91925 B FI91925 B FI 91925B FI 912088 A FI912088 A FI 912088A FI 912088 A FI912088 A FI 912088A FI 91925 B FI91925 B FI 91925B
Authority
FI
Finland
Prior art keywords
model
speaker
lossless tube
calculated
cross
Prior art date
Application number
FI912088A
Other languages
English (en)
Swedish (sv)
Other versions
FI912088A0 (fi
FI912088L (fi
FI91925C (fi
Inventor
Marko Vaenskae
Original Assignee
Nokia Telecommunications Oy
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nokia Telecommunications Oy filed Critical Nokia Telecommunications Oy
Publication of FI912088A0 publication Critical patent/FI912088A0/fi
Priority to FI912088A priority Critical patent/FI91925C/fi
Priority to AU16530/92A priority patent/AU653811B2/en
Priority to JP50856192A priority patent/JP3184525B2/ja
Priority to EP92909205A priority patent/EP0537316B1/en
Priority to AT92909205T priority patent/ATE140552T1/de
Priority to PCT/FI1992/000128 priority patent/WO1992020064A1/en
Priority to DE69212261T priority patent/DE69212261T2/de
Publication of FI912088L publication Critical patent/FI912088L/fi
Priority to NO924782A priority patent/NO306965B1/no
Publication of FI91925B publication Critical patent/FI91925B/fi
Application granted granted Critical
Publication of FI91925C publication Critical patent/FI91925C/fi
Priority to US08/387,623 priority patent/US5522013A/en

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/02Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Analogue/Digital Conversion (AREA)
  • Telephonic Communication Services (AREA)
  • Complex Calculations (AREA)
  • Input Circuits Of Receivers And Coupling Of Receivers And Audio Equipment (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Image Processing (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

91925
Menetelmä puhujan tunnistamiseksi
Keksinnön kohteena on menetelmä puhujan tunnistamiseksi, joka menetelmä käsittää puhesignaalista otettujen 5 näytteiden perusteella lasketun mallin vertaamisen ainakin yhden tunnetun puhujan tallennettuun malliin.
Eräs tunnettu tapa tunnistaa ja varmentaa käyttäjä erilaisissa järjestelmissä, kuten tietokonejärjestelmissä tai puhelinjärjestelmissä, on tunnistaa käyttäjä puhesig-10 naalin perusteella. Kaikissa tunnetuissa puhujantunnistus-menetelmissä pyritään löytämään sellaisia puheäänen ominaisuuksia, joiden avulla voidaan automaattisesti tunnistaa ja erotella puhujat toisistaan. Tällöin kunkin puhujan puheesta otetun näytteen perusteella muodostetaan tiettyjä 15 puheäänelle ominaisia parametreja sisältäviä malleja, jotka tallennetaan puhujantunnistusjärjestelmän muistiin. Kun sitten nimetön puhuja halutaan tunnistaa, hänen puhesignaalistaan otetuista näytteistä muodostetaan samat parametrit sisältävä malli, jota verrataan järjestelmän muis-20 tissa oleviin vertailumalleihin. Mikäli tunnistettavasta puhesignaalista kehitetty malli riittävällä tarkkuudella ennalta määrätyn kriteerin mukaisesti vastaa jotakin muistiin tallennettua tunnetun puhujan mallia, nimetön puhuja tunnistetaan henkilöksi, jonka puhesignaalista kyseinen ' 25 vertailuinani on muodostettu. Yleisesti ottaen kaikissa tunnetuissa puhujantunnistusjärjestelmissä noudatetaan edellä esitettyä yleisperiaatetta, mutta puhujan äänen mallintamisessa käytetyt parametrit ja ratkaisut poikkeavat hyvinkin paljon toisistaan. Esimerkkejä puhujan 30 tunnistusmenetelmistä ja -järjestelmistä on esitetty US-patenttijulkaisuissa 4 720 863 ja 4 837 830, GB-patentti-hakemuksessa 2 169 120 sekä EP-patenttihakemuksessa 0 369 485.
Keksinnön päämääränä on uudentyyppinen puhujantun-35 nistusmenetelmä, jolla pyritään aikaisempaa paremmin ja 91 >25 2 yksinkertaisemmalla algoritmilla tunnistamaan puhuja mielivaltaisen puhesignaalin perusteella.
Tämä saavutetaan johdannossa esitetyn tyyppisellä menetelmällä, jolle on keksinnön mukaisesti tunnusomaista, 5 että verrataan puhesignaalin näytteistä laskettuja, puhujan ääniväylää mallintavan häviöttömän putken osien poikkipinta-alojen tai muiden poikkimittojen keskiarvoja ainakin yhden tunnetun puhujan tallennetun ääniväylämallin osien vastaaviin keskiarvoihin.
10 Keksinnön perusajatuksena on tunnistaa puhuja puhu jalle ominaisen ääniväylän perusteella. Ääniväylällä tarkoitetaan tässä yhteydessä ihmisen äänijänteiden, kurkunpään, nielun, suun ja huulten muodostamaa äänikanavaa, jonka avulla ihminen muodostaa puheäänen. Puhujan ääni-15 väylän profiili muuttuu ajassa jatkuvasti ja ääniväylän tarkkaa muotoa on vaikea laskea pelkästään puhesignaalista saatavilla tiedoilla, mikä johtuu ääniväylän eri osien monimutkaisista vuorovaikutussuhteista ja ääniväylän sei-nämämateriaalin eri koostumuksesta eri ihmisillä. Keksin-20 nön mukaisessa menetelmässä ei kuitenkaan tarvita ääni-väylän tarkkaa muotoa. Keksinnössä puhujan ääniväylää mallinnetaan ns. häviöttömän putken mallilla, jonka muoto on puhujalle ominainen. Lisäksi vaikka puhujan ääniväylän profiili ja samalla häviöttömän putken malli muuttuu jat-25 kuvasti puhumisen aikana, ääniväylän ja häviöttömän putken mallin äärimitat ja keskiarvo sen sijaan ovat puhujalle tyypillisiä vakioita. Tämän vuoksi keksinnön mukaisessa menetelmässä voidaan kohtalaisella tarkkuudella tunnistaa puhuja puhujan ääniväylää mallintaman häviöttömän putken 30 keskimääräisen muodon tai muotojen perusteella. Keksinnön eräässä suoritusmuodossa tunnistuksessa käytetään häviöttömän putken mallin sylinteriosien keskimääräisten poikkipinta-alojen lisäksi myös sylinteriosien poikkipinta-alojen ääriarvoja eli maksimi- ja minimiarvoja.
35 Keksinnön toisessa suoritusmuodossa henkilön tun- 3 91925 nistamisen tarkkuutta on edelleen parannettu muodostamalla häviöttömän putken mallin keskiarvo yksittäisille äänteille. Tietyn äänteen aikana ääniväylän muoto pysyy lähes muuttumattomana ja kuvaa paremmin puhujan ääniväylää. Kun 5 tunnistamisessa käytetään useampia äänteitä, saadaan hyvin tarkka tunnistus.
Keksinnössä käytettävän häviöttömän putken mallin sylinteriosien poikkipinta-alat voidaan helposti laskea tavanomaisissa puheenkoodausalgoritmeissa muodostetuista 10 ns. heijastuskertoimista. Luonnollisesti pinta-alasta voi daan määrittää vertailuparametriksi muukin poikkimitta, kuten säde tai halkaisija. Toisaalta putken poikkileikkauksella voi olla ympyrämuodon sijasta jokin muukin muoto.
15 Keksintöä selitetään seuraavassa yksityiskohtaisem min suoritusesimerkin avulla viitaten oheiseen piirrokseen, joissa kuviot 1 ja 2 havainnollistavat puhujan ääniväylän mallintamista häviöttömän putken avulla, joka muodostuu 20 peräkkäisistä sylinteriosista, kuvio 3 esittää vuokaavion, joka havainnollistaa erästä keksinnön mukaista puhujan tunnistusmenetelmää, kuvio 4 havainnollistaa häviöttömän putken mallien muuttumista puheen aikana, ja 25 kuvio 5 esittää lohkokaavion, joka havainnollistaa puhujan tunnistamista äännetasolla.
Nyt viitataan kuvioon 1, jossa on esitetty perspektiivikuvana peräkkäisistä sylinteriosuuksista C1-C8 muodostuva häviöttömän putken malli, joka muodostaa karkean 30 mallin ihmisen ääniväylälle. Kuvion 1 häviöttömän putken malli on nähtävissä sivukuvana kuviossa 2. Ihmisen ääni-väylällä tarkoitetaan yleensä ihmisen äänijänteiden, kurkun, nielunsuun ja huulten muodostamaa äänikäytävää, jolla ihminen muodostaa puheäänet. Kuvioissa 1 ja 2 sylinteriosa 35 Cl kuvaa välittömästi äänijänteiden välisen ääniraon (glottis) jälkeen olevan ääniväylän osuuden muotoa, sylin- 4 91925 teriosuus C8 kuvaa ääniväylän muotoa huulien kohdalla ja välissä olevat sylinteriosuudet C2-C7 kuvaavat ääniraon ja huulten välissä olevien diskreettien ääniväyläosuuksien muotoa. Ääniväylän muodolle on ominaista, että se vaihte-5 lee jatkuvasti puhumisen aikana, kun muodostetaan erilaisia äänteitä. Samalla tavoin myös ääniväylän eri osia kuvaavien diskreettien sylintereiden C1-C8 halkaisijat ja pinta-alat vaihtelevat puhumisen aikana. Keksijä on kuitenkin havainnut, että suurehkosta määrästä hetkellisiä 10 ääniväylän muotoja laskettu keskimääräinen ääniväylän muoto on kullekin puhujalle ominainen vakio, jota voidaan käyttää puhujan tunnistamiseen. Samalla tavoin myös ääni-väylää mallintavan häviöttömän putken mallin sylintereiden C1-C8 poikkipinta-alojen hetkellisistä arvoista pitkällä 15 aikavälillä lasketut sylinteriosuuksien C1-C8 poikkipinta-alojen keskiarvot ovat suhteellisen tarkkaan vakioita. Edelleen myös sylintereiden poikkimittojen ääriarvot määräytyvät todellisen ääniväylän äärimitoista ja ovat siten puhujalle ominaisia suhteellisen tarkkoja vakioita.
20 Keksinnön mukaisessa menetelmässä käytetään hyväksi alalla hyvin tunnetussa lineaarisessa ennustavassa koodauksessa (LPOLinear Predictive Coding) välituloksena muodostettavia ns. heijastuskertoimia eli ns. PARCOR-ker-toimia rk, joilla on tietty yhteys ääniväylän muotoon ja 25 rakenteeseen. Hei j astuskertoimien rk ja ääni väylää kuvaavan häviöttömän putken mallin sylinteriosuuksien pinta-alojen Ak välinen yhteys on yhtälön (1) mukainen A(k+1) - A(k) - r(k) - - (1) 30 A(k+1) + A(k) : missä k - 1,2,3,....
Keksinnössä käytettävät heijastuskertoimet tuottavaa LPC-analyysiä käytetään hyväksi monissa tunnetuissa pu-35 heenkoodausmenetelmissä. Keksinnön mukaisen menetelmän erääksi edulliseksi sovellutukseksi on ajateltu tilaajien
II
5 ?'Ί?'έ5 tunnistamista radiopuhelinjärjestelmissä, erityisesti yleiseurooppalaisessa digitaalisessa radiopuhelinjärjestelmässä GSM. GSM-suositus 06.10 määrittelee hyvin tarkasti järjestelmässä käytettävän RPE-LTP-puheenkoodausmene-5 telmän (Regular Pulse Excitation-Long Term Prediction). Keksinnön mukaisen menetelmän käyttö tämän puheenkoodaus-menetelmän yhteydessä on edullista, koska keksinnössä tarvittavat heijastuskertoimet saadaan välituloksena edellä mainitussa RPE-LPC-koodausmenetelmässä. Keksinnön ensisi-10 jäisessä suoritusmuodossa kaikki menetelmän vaiheet hei-jastuskertoimien laskemiseen asti noudattavat mainittua GSM 06.10 suosituksen mukaista puheenkoodausalgoritmia ja näiden vaiheiden yksityiskohtien osalta viitataan mainittuun suositukseen. Seuraavassa näitä menetelmävaiheita 15 kuvataan vain yleisesti keksinnön ymmärtämisen kannalta oleellisilta osin viitaten kuvion 3 vuokaavioon.
Kuviossa 3 lohkossa 10 otetaan näytteitä sisääntu-losignaalista IN näytteenottotaajuudella 8 kHz ja muodostetaan 8 bitin näytteiden jono sG. Lohkossa 11 näytteistä 20 poistetaan tasakomponentti (dc-komponentti) koodauksessa mahdollisesti syntyvän häiritsevän sivuäänen poistamiseksi. Tämän jälkeen lohkossa 12 esikorostetaan näytesignaa-lia painottamalla korkeita signaalitaajuuksia ensimmäisen asteen FIR-suodattimella. Lohkossa 13 näytteet segmentoi-25 daan 160 näytteen kehyksiksi, jolloin kehyksen kesto on noin 20 ms.
Lohkossa 14 puhesignaalin spektri mallinnetaan suorittamalla jokaiselle kehykselle autokorrelaatiomenetel-mällä LPC-analyysi, jonka astelukuna on p=8. Tällöin ke-30 hyksestä lasketaan p+1 kappaletta autokorrelaatiofunktio ACF:n arvoja 160 ACF(k) = Σ s(i)s(i-k) (2) i = l 35 missä k=0,1,...,8.
Autokorrelaatiofunktion sijasta voidaan käyttää 6 91925 muutakin sopivaa funktiota, kuten esim. kovarianssifunk-tiota. Saaduista autokorrelaatiofunktion arvoista lasketaan Schurin rekursiolla tai muulla sopivalla rekur-siomenetelmällä puhekooderissa käytettävän lyhyen aikavä-5 Iin analyysisuodattimen kahdeksan ns. heijastuskertoimen rk arvot. Schurin rekursio tuottaa uudet heijastuskertoimet aina joka 20 ms. Keksinnön ensisijaisessa suoritusmuodossa kertoimet ovat 16-bittisiä ja niitä on 8 kappaletta. Jatkamalla Schurin rekursiota pidempään heijastuskertoimien 10 määrää voidaan haluttaessa lisätä.
Lohkossa 16 lasketaan kustakin kehyksestä lasketuista heijastuskertoimista rk puhujan ääniväylää sylinte-rimäisillä osilla mallintavan häviöttömän putken kunkin sylinteriosan Ck pinta-ala Ak. Koska Schurin rekursio tuot-15 taa uudet heijastuskertoimet joka 20. ms, pinta-aloja kullekin sylinteriosalla Ck saadaan 50 kpl/s. Kun on laskettu häviöttömän putken sylinteripinta-alat n-kappaleelle kehyksiä, kohdassa 17 lasketaan näin saatujen N:n häviöttömän putken mallin sylinteriosien Ck pinta-alojen keskiarvot 20 Ak.ave sekä määritetään kullekin sylinteriosuudelle Ck suurin poikkipinta-ala Ak nax, joka näiden N kehyksen aikana on esiintynyt. Tämän jälkeen kohdassa 18 verrataan näin saatuja puhujan ääniväylää mallintavan häviöttömän putken sylinteriosien Ck keskimääräisiä pinta-aloja Ak ave ja maksi-25 mipinta-aloja Ak max ainakin yhden tunnetun puhujan tallennetun häviöttömän putken malliin sylinteriosien keskimääräisiin ja maksimipinta-aloihin. Mikäli laskettu keskimääräinen häviöttömän putken muoto vertailtujen parametrien perusteella vastaa jotakin tallennettua mallia, päätöksen-30 tekolohkosta 19 siirrytään lohkoon 21, jossa puhuja vah- vistetaan tunnistetuksi kyseisen mallin osoittamaksi henkilöksi. Mikäli lasketut parametrit eivät vastaa minkään tallennetun mallin vastaavia parametreja, päätöksenteko-lohkosta 19 siirrytään lohkoon 20, jossa puhuja osoitetaan 35 tuntemattomaksi.
7 91925
Esimerkiksi radiopuhelinjärjestelmässä lohko 21 voi sallia esimerkiksi yhteyden muodostamisen tai jonkin palvelun käytön ja lohko 20 vastaavasti estää nämä toimenpiteet.
5 Uusien mallien laskeminen ja tallentaminen muistiin tunnistamista varten voidaan suorittaa oleellisesti samanlaisella proseduurilla kuin kuvion 3 vuokaaviossa, paitsi että keskimääräisten ja maksimipinta-alojen laskemisen jälkeen lohkossa 18 nämä pinta-alatiedot tallennetaan pu-10 hujakohtaiseksi tiedostoksi järjestelmän muistiin yhdessä muiden tarvittavien henkilötietojen, kuten nimi, puhelinnumero jne., kanssa.
Keksinnön toisessa suoritusmuodossa tunnistuksessa käytettävää analyysiä tarkennetaan äännetasolle siten, 15 että ääniväylää mallintavan häviöttömän putken mallin sy-linteriosien poikkipinta-alojen keskiarvot lasketaan analysoitavasta puhesignaalista tietyn äänteen aikana muodostettujen hetkellisten häviöttömän putken mallien sylinte-riosien pinta-aloista. Yhden äänteen kestoaika on melko 20 pitkä, joten yhdestä puhesignaalissa esiintyvästä äänteestä voidaan laskea useita, jopa kymmeniä ajallisesti peräkkäisiä häviöttömän putken malleja. Tätä on havainnollistaa kuvio 4, jossa on esitetty neljä ajallisesti peräkkäistä hetkellistä häviöttömän putken mallia S1-S4. Kuviosta 4 25 voidaan selvästi havaita, että häviöttömän putken yksittäisten sylintereiden säteet (ja poikkipinta-alat) muuttuvat ajan mukana. Esimerkiksi hetkellisten mallien SI, S2 ja S3 voisivat karkeasti luokiteltuna olla saman äänteen aikana muodostettuja, jolloin niistä voitaisiin laskea 30 keskiarvo. Sen sijaan malli S4 on selvästi erilainen ja eri äänteeseen liittyvä eikä sen vuoksi tule huomioiduksi keskiarvon laskemisessa.
Seuraavassa selostetaan äännetasolla tapahtuvaa tunnistusta viitaten kuvion 5 lohkokaavioon. Vaikka tun-35 nistus voidaan tehdä jo yhden äänteen perusteella, tunnis- 8 91925 tuksessa käytetään edullisesti vähintään kahta eri äännettä, esim. vokaalia ja/tai konsonanttia, joita vastaavat tunnetun puhujan tallennetut häviöttömän putken mallit muodostavat ns. kombinaatiotaulukon 58. Yksinkertainen 5 kombinaatiotaulukko voi sisältää esimerkiksi kolmelle äänteelle "a", "e" ja "i" laskettujen häviöttömän putken mallien sylinterien keskimääräiset pinta-alat, ts. kolme erilaista keskimääräistä häviöttömän putken mallia. Tämä kombinaatiotaulukko tallennetaan mainittuun puhujakohtaiseen 10 tiedostoon. Kun puhujaa tunnistettaessa puheesta heijas-tuskertoimien avulla laskettu (lohko 51) hetkellinen häviöttömän putken malli tunnistetaan ( "kvantisoidaan") karkeasti jotakin näistä ennalta määrätyistä malleista vastaavaksi (lohko 52), se tallennetaan muistiin (lohko 53) 15 myöhempää keskiarvon laskemista varten. Kun jokaista äännettä varten on saatu riittävän monta hetkellistä häviöttömän putken mallia, lasketaan kullekin äänteelle erikseen häviöttömän putken mallin sylinteriosien poikkipinta-alojen keskiarvot Ai;| (lohko 55), joita sitten verrataan kom-20 binaatiotaulukkoon 58 tallennettuihin vastaavien mallien sylintereiden poikkipinta-aloihin A^. Kombinaatiotaulukon 58 jokaista mallia varten on oma vertailufunktio 56 ja 57, esim. ristikorrelaatiofunktio, jolla puheesta lasketun mallin ja kombinaatiotaulukon 58 kyseisen tallennetun mal-25 Iin välinen yhtenevyys tai korrelaatio arvioidaan. Tuntematon puhuja määritellään tunnistetuksi, jos kaikki tai riittävän monen äänteen tapauksessa laskettu malli ja tallennettu malli korreloi riittävän tarkasti keskenään.
Puhesignaalista muodostettu hetkellinen häviöttömän 30 putken malli 59 voidaan tunnistaa lohkossa 52 tiettyä ään-: nettä vastaavaksi mikäli hetkellisen häviöttömän putken - mallin 59 jokaisen sylinteriosan poikkimitta on tunnetun puhujan vastaavan äänteen ennalta määrättyjen tallennettujen raja-arvojen sisällä. Nämä äännekohtaiset ja sylinte-35 rikohtaiset raja-arvot ovat tallennettuina ns. kvantisoin- 9 91925 titaulukkoon 54. Kuviossa 5 viitenumeroilla 60 ja 61 on havainnollistettu kuinka mainitut äänne- ja sylinterikoh-taiset raja-arvot muodostavat kullekin äänteelle maskin tai mallinteen, joiden sallitulle alueelle 60A ja 61A 5 (varjostamattomat alueet) tunnistettavan hetkellisen ääni- väylämallin 59 on sovittava. Kuviossa 5 hetkellinen ääni-väylämalli 59 sopii äännemaskiin 60 mutta ei selvästikään sovi äännemaskiin 61. Lohko 52 toimii siten eräänlaisena äännesuodattimena, joka lajittelee ääniväylämallit oikei-10 siin äänneryhmiin a, e, i, jne.
Menetelmä voidaan käytännössä toteuttaa esimerkiksi ohjelmallisesti tavanomaisessa signaaliprosessorissa.
Kuviot ja niihin liittyvä selitys on tarkoitettu vain havainnollistamaan esillä olevaa keksintöä. Yksityis-15 kohdiltaan keksinnön mukainen menetelmä voi vaihdella oheisten patenttivaatimusten puitteissa.

Claims (7)

91925
1. Menetelmä puhujan tunnistamiseksi, joka menetelmä käsittää puhesignaalista otettujen näytteiden perus- 5 teella lasketun mallin vertaamisen ainakin yhden tunnetun puhujan tallennettuun malliin, tunnettu siitä, että verrataan puhesignaalin näytteistä laskettuja, puhujan ääniväylää mallintavan häviöttömän putken osien poikkipinta-alojen tai muiden poikkimittojen keskiarvoja ainakin 10 yhden tunnetun puhujan tallennetun ääniväylämallin osien vastaaviin keskiarvoihin.
2. Patenttivaatimuksen 1 mukainen menetelmä, joka käsittää a) puhesignaalista otettujen näytteiden ryhmit-15 telemisen M kappaletta näytteitä sisältäviksi kehyksiksi, b) ennalta määrätyn autokorrelaatiofunktion tai vastaavan funktion arvojen laskemisen kehyksen näytteistä, c) heijastuskertoimien laskemisen rekursiivisesti autokorrelaatiofunktion tai vastaavan arvoista, 20 d) heijastuskertoimia hyväksikäyttäen laskettujen parametrien vertaamisen muistiin tallennettuihin, ainakin yhden tunnetun puhujan vastaaviin parametreihin, tunnettu siitä, että vaiheessa d) lasketaan kehyksen heijastuskertoimista puhujan 25 ääniväylää sylinterimäisillä osilla mallintavan häviöttömän putken kunkin sylinteriosan pinta-ala, toistetaan mainittujen pinta-alojen laskenta N kappaleella kehyksiä ja lasketaan näin saatujen pinta-alojen keskiarvo erikseen kullekin sylinteriosalle, ja 30 verrataan näin laskettuja keskimääräisiä pinta-alo- . ja ainakin yhden tunnetun puhujan tallennetun mallin sy- linteriosien keskimääräisiin pinta-aloihin.
3. Patenttivaatimuksen 1 tai 2 mukainen menetelmä, tunnettu siitä, että määritetään kunkin sylinte- 35 riosan pinta-alan ääriarvo N kehyksen aikana, ja verrataan II 91925 sylinteriosien keskimääräisiä ja maksimipinta-aloja ainakin yhden tunnetun puhujan tallennetun ääniväylämallin sylinteriosien keskimääräisiin ja maksimipinta-aloihin.
4. Patenttivaatimuksen 1, 2 tai 3 mukainen menetel-5 mä, tunnettu siitä, että ääniväylää mallintavan häviöttömän putken mallin sylinteriosien keskimääräiset poikkimitat muodostuvat tietyn äänteen aikana muodostettujen hetkellisten häviöttömän putken mallien sylinteri-osien poikkimittojen keskiarvoista.
5. Patenttivaatimuksen 4 mukainen menetelmä, tun nettu siitä, että häviöttömän putken mallin sylinteriosien poikkimittojen keskiarvot lasketaan erikseen vähintään kahdelle eri äänteelle, 15 kunkin äänteen häviöttömän putken mallin sylinteri- osien keskiarvoja verrataan tunnetun puhujan vastaavan äänteen tallennetun häviöttömän putken mallin sylinteri-osien poikkimittoihin, ja puhuja tunnistetaan mikäli riittävän monen äänteen 20 laskettu häviöttömän putken malli korreloi riittävän tarkasti sitä vastaavan tallennetun häviöttömän putken mallin kanssa.
6. Patenttivaatimuksen 4 tai 5 mukainen menetelmä, tunnettu siitä, että puhesignaalista muodostettu 25 hetkellinen häviöttömän putken malli tunnistetaan tiettyä äännettä vastaavaksi mikäli hetkellisen häviöttömän putken mallin jokaisen osan poikkimitta on kvantisointitaulukkoon tallennettujen vastaavan äänteen ennalta määrättyjen raja-arvojen sisällä.
7. Patenttivaatimuksen 4, 5 tai 6 mukainen menetel mä, tunnettu siitä, että mainitut äänteet ovat vokaaleja ja/tai konsonantteja. 91925
FI912088A 1991-04-30 1991-04-30 Menetelmä puhujan tunnistamiseksi FI91925C (fi)

Priority Applications (9)

Application Number Priority Date Filing Date Title
FI912088A FI91925C (fi) 1991-04-30 1991-04-30 Menetelmä puhujan tunnistamiseksi
AT92909205T ATE140552T1 (de) 1991-04-30 1992-04-29 Verfahren zur sprechererkennung
JP50856192A JP3184525B2 (ja) 1991-04-30 1992-04-29 話者認識方法
EP92909205A EP0537316B1 (en) 1991-04-30 1992-04-29 Speaker recognition method
AU16530/92A AU653811B2 (en) 1991-04-30 1992-04-29 Speaker recognition method
PCT/FI1992/000128 WO1992020064A1 (en) 1991-04-30 1992-04-29 Speaker recognition method
DE69212261T DE69212261T2 (de) 1991-04-30 1992-04-29 Verfahren zur sprechererkennung
NO924782A NO306965B1 (no) 1991-04-30 1992-12-10 Fremgangsmåte for gjenkjennelse av en taler
US08/387,623 US5522013A (en) 1991-04-30 1995-02-13 Method for speaker recognition using a lossless tube model of the speaker's

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FI912088A FI91925C (fi) 1991-04-30 1991-04-30 Menetelmä puhujan tunnistamiseksi
FI912088 1991-04-30

Publications (4)

Publication Number Publication Date
FI912088A0 FI912088A0 (fi) 1991-04-30
FI912088L FI912088L (fi) 1992-10-31
FI91925B true FI91925B (fi) 1994-05-13
FI91925C FI91925C (fi) 1994-08-25

Family

ID=8532415

Family Applications (1)

Application Number Title Priority Date Filing Date
FI912088A FI91925C (fi) 1991-04-30 1991-04-30 Menetelmä puhujan tunnistamiseksi

Country Status (8)

Country Link
EP (1) EP0537316B1 (fi)
JP (1) JP3184525B2 (fi)
AT (1) ATE140552T1 (fi)
AU (1) AU653811B2 (fi)
DE (1) DE69212261T2 (fi)
FI (1) FI91925C (fi)
NO (1) NO306965B1 (fi)
WO (1) WO1992020064A1 (fi)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FI96246C (fi) * 1993-02-04 1996-05-27 Nokia Telecommunications Oy Menetelmä koodatun puheen lähettämiseksi ja vastaanottamiseksi
FI96247C (fi) * 1993-02-12 1996-05-27 Nokia Telecommunications Oy Menetelmä puheen muuntamiseksi
JP4556028B2 (ja) * 2005-11-04 2010-10-06 株式会社国際電気通信基礎技術研究所 発話主体同定装置及びコンピュータプログラム

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA1334868C (en) * 1987-04-14 1995-03-21 Norio Suda Sound synthesizing method and apparatus
FR2632725B1 (fr) * 1988-06-14 1990-09-28 Centre Nat Rech Scient Procede et dispositif d'analyse, synthese, codage de la parole
US5054082A (en) * 1988-06-30 1991-10-01 Motorola, Inc. Method and apparatus for programming devices to recognize voice commands

Also Published As

Publication number Publication date
ATE140552T1 (de) 1996-08-15
EP0537316A1 (en) 1993-04-21
NO924782L (no) 1993-02-26
AU1653092A (en) 1992-12-21
FI912088A0 (fi) 1991-04-30
NO306965B1 (no) 2000-01-17
EP0537316B1 (en) 1996-07-17
DE69212261D1 (de) 1996-08-22
AU653811B2 (en) 1994-10-13
WO1992020064A1 (en) 1992-11-12
JPH05508242A (ja) 1993-11-18
NO924782D0 (no) 1992-12-10
DE69212261T2 (de) 1997-02-20
JP3184525B2 (ja) 2001-07-09
FI912088L (fi) 1992-10-31
FI91925C (fi) 1994-08-25

Similar Documents

Publication Publication Date Title
AU8227798A (en) Method and apparatus for speech enhancement in a speech communication system
FI96247B (fi) Menetelmä puheen muuntamiseksi
KR100216018B1 (ko) 배경음을 엔코딩 및 디코딩하는 방법 및 장치
US5522013A (en) Method for speaker recognition using a lossless tube model of the speaker's
US6915257B2 (en) Method and apparatus for speech coding with voiced/unvoiced determination
FI91925B (fi) Menetelmä puhujan tunnistamiseksi
KR100291584B1 (ko) 피치 구간별 fo/f1률의 유사성에 의한 음성파형 압축방법
JPH1097274A (ja) 話者認識方法及び装置
KR100399057B1 (ko) 이동통신 시스템의 음성 활성도 측정 장치 및 그 방법
GB2343822A (en) Using LSP to alter frequency characteristics of speech
JPH1097288A (ja) 背景雑音除去装置及び音声認識装置
KR100647291B1 (ko) 음성의 특징을 이용한 음성 다이얼링 장치 및 방법
KR100278640B1 (ko) 이동 전화기를 위한 음성 다이얼링 장치 및방법
KR100322704B1 (ko) 음성신호의지속시간변경방법
Krebber Prediction of speech transmission quality of wideband and narrow‐band telephone handsets using short‐time sub‐band analysis and psychoacoustic models
JPS6054000A (ja) 音声の有声・無声判定方法
HK1015183B (en) Method and apparatus for encoding/decoding of background sounds

Legal Events

Date Code Title Description
HC Name/ company changed in application

Owner name: NOKIA TELECOMMUNICATIONS OY

BB Publication of examined application