FI92113C - Puheprosessori ja soluradiopääte - Google Patents
Puheprosessori ja soluradiopääte Download PDFInfo
- Publication number
- FI92113C FI92113C FI872450A FI872450A FI92113C FI 92113 C FI92113 C FI 92113C FI 872450 A FI872450 A FI 872450A FI 872450 A FI872450 A FI 872450A FI 92113 C FI92113 C FI 92113C
- Authority
- FI
- Finland
- Prior art keywords
- speech
- gain
- speech processor
- stored
- level
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/20—Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B1/00—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
- H04B1/38—Transceivers, i.e. devices in which transmitter and receiver form a structural unit and in which at least one part is used for functions of transmitting and receiving
- H04B1/40—Circuits
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02168—Noise filtering characterised by the method used for estimating noise the estimation exclusively taking place during speech pauses
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
Description
9 2113
Puheprosessori ja soluradiopååte. - Talprocessor och cellular radioterminal.
Keksinnon kohteena ovat puheprosessorit, joilla on automaatti-nen vahvistuksen sååto, ja erityisesti puheentunnistimet, sekå puheprosessorin sisaltåvåt soluradiopaatteet.
Automaattiset puheentunnistimet toimivat vertaamalla ominai-suuksia, jotka on poimittu kuuluvista puhesignaaleista. Niitå puheesta poimittuja ominaisuuksia, jotka on tarkoitus tunnistaa, verrataan talletettuihin ominaisuuksiin, jotka on poimittu tunnetusta lausumasta.
Tarkkaa tunnistusta vårten on tårkeåå, ettå samasta sanasta tai åanestå poimitut piirteet ovat eri kerroilla lausuttuna riittå-van samanlaisia. Puheen laaja dynaaminen alue tekee tåmån saa-vuttamisen vaikeaksi, erityisesti sellaisilla alueilla kuten hands-free-puhelinliikenne, jossa mikrofonissa vastaanotettu åånen taso voi vaihdella laajalla alueella. Åanitason vaihte-luiden kompensoimiseksi kåyttavåt useimmat aanentunnistimet jonkunlaista automaattista vahvistuksen sååtoå (AGC).
AGC-piiri ohjaa vahvistusta varmistaakseen, ettå keskiarvoinen signaalitaso, jota kåytetåån ominaisuuspoimijalla, on niin låhellå vakiota kuin mahdollista annetussa aikajaksossa. Siten hiljaisille lausumille annetaan suurempi vahvistus kuin kovaåå-nisille lausumille. Tåman kaltainen AGC toimii hyvin, kun sisååntulosignaalina on jatkuva puhe, koska tietyn ajanjakson jålkeen piirin vahvistus optimoi signaalitason antaen yhdenmu-kaisen omainsuuspoiminnan. Puheen puuttuessa kuitenkin AGC— piirin vahvistus nousee tasolle, jonka mååråå taustakohina siten, ettå aloitettaessa puhe AGC-piirin vahvistus on asetettu liian suureksi. Lausuman aikana piirin vahvistusta pienennetåån automaattisesti, jolloin vahvistuksen muutoksen nopeuden mååråå AGC:n iskuvasteaika. Puheen alkuun kohdistetaan siten paljon 2 92113 suurempi vahvistus ja millå tahansa poimitulla ominaisuudella on paljon suurempi energiasisålto kuin samanlaisilla ominai-suuksilla, jotka poimitaan myohemmin, kun vahvistus on pienentynyt.
Tåmå vååristymåilmid riippuu sisååntulosignaalin tasosta; mita suurempi puhetaso on, sitå suurempi on vååristymå. Siten ensim-måiset poimitut ominaisuudet eivåt vastaa samanlaisia talletet-tuja ominaisuuksia, ja tåstå voi usein olla seurauksena huono tunnistussuoritus.
Keksinnon tarkoitus on muodostaa ratkaisu tåhån ongelmaan.
Keksinnon mukaisesti on muodostettu puheprosessori, joka koos-tuu sisååntulosta, joka vastaanottaa puhesignaalit; signaalin kåsittelyelimestå spektriparametrien poimimiseksi mainituista puhesignaaleista: analogia-digitaalimuuntimesta mainittujen poimittujen parametrien digitoimiseksi; automaattisesta vahvis-tuksen ohjauselimestå mainittuun muuntajaan syotetyn signaali-tason ohjaamiseksi; tunnettu siitå, ettå spektriparametrit tal-letetaan ainakin tilapåisesti, ja jokaista tållaista talletet-tua parametria kohti talletetaan myos vahvistuskerroin, joka ilmaisee vahvistuksen ohjauselimen syottåmån vahvistuksen; ja ettå nåytteenottoajan lopussa tåsså ajassa talletetut vahvis-tuskertoimet, jos ne ovat erilaisia, asetetaan yhtåsuureksi kuin tåsså ajassa talletettu alhaisin vahvistuskerroin, jolloin vastaavasti talletettujen spektriparametrien suuruuksia såådetåån samassa suhteessa.
Keksinnon mukaisessa puheprosessorissa, joka on rakennettu puheentunnistimeksi, on automaattinen vahvistuksen ohjaus muodostettu digitaalisesti kytketyllå vaimentimella, jonka vahvistuksen mååråå puheentunnistuksen suorittava mikroprosessori. Mikroprosessori ohjaa vahvistusta varmistaakseen, ettå analo-giadigitaalimuuntimen dynaamista aluetta (mikå tapahtuu ominai- 3 92113 suuksien poiminnan ja mikroprosessorin tunnistinohjauksen vålisså, vaikka kåytetåån analogisia AGC:tå) ei ylitetå (paitsi AGC:n sovituksen aikana). Periaatteellinen ero tunnettujen analogisten AGCrden ja keksinnon mukaisen jårjestelmån vålillå on, ettå jålkimmåisesså mikroprosessori ohjaa vahvistuksen asetusta ja se voi tåmån vuoksi tallettaa kullekin poimitulle ominaisuu-delle kåytetyn vahvistuksen. Kun puhe on loppunut, mikroprosessori voi måårittåå optimaalisen vahvistuksen asetuksen koko lauseelle. Kaikki talletetut ominaisuudet normalisoidaan sitten tålle optimaaliselle vahvistuksen asetukselle. Tållå tavalla poimitaan yhdenmukainen sarja ominaisuuksia riippumatta sisåån-tulosignaalin vahvistuksesta. Keksinnon mukaisen soluradiopååt-teen suhteen viitataan vaatimukseen 8.
Keksinnon toteutuksia kuvataan ja selitetåån lisåå viitaten liitteenå olevaan piirrokseen, jossa kuva 1 on kaaviokuva keksinnon mukaisesta puheentunnistimesta.
Tåsså patenttihakemuksessa keksinto kuvataan viitaten puheen-tunnistimeen, joka kåyttåå malli-yhteensovitusta, mutta kuten alan asiantuntijat ovat tietoisia, on keksinto sovellettavissa yhtå hyvin mihin tahansa konventionaalisen tyyppiseen puheen-tunnistimeen, jolloin nåihin kuuluvat myos ne, jotka kåyttåvåt stokastista mallitusta, Markov-ketjuja, dynaamista-aikakiertoa ja foneemitunnistusta.
Puheentunnistus perustuu energiaååriviivojen vertailuun lukui-silta (yleenså 8 tai 16) suodatinkanavilta. Puhuttaessa digi-toidaan energiaspektri jokaiselta suodatinkanavalta analogia-digitaalimuuntimella, jotta muodostettaisiin malli, joka talle-tetaan muistiin.
Tunnistuksen alkuvaihe tunnetaan "harjoitteluna" ja se koostuu referenssimallien muodostamisesta puhumalla tunnistimeen ne sanat, jotka on tarkoitus tunnistaa. Kun referenssimallit on • · 4 92113 muodostettu tunnistettaville sanoille, voidaan yrittåå puheen tunnistusta.
Kun tunnistimeen syotetåån lause, se muodostaa testimallin, jota voidaan verrata referenssimalliin muistissa lahimmån yhtålåisyyden loytåmiseksi.
Keksinnon mukaisen puheentunnistimen peruselementit on esitetty kuvassa 1. Mikrofonilla 1 vastaanotetut ja vahvistimella 2 vah-vistetut åånisignaalit viedåån suodatinryhmåan 3a. Suodatinryh-måsså åånisignaalit suodatetaan lukuisiin (tåsså tapauksessa 16) taajuuskaistaan ja signaalit tasasuunnataan tasasuuntaajal-la 4. Suodatetut ja tasasuunnatut signaalit tasoitetaan ali-pååstosuodattimilla 3b ja keråtåån sitten sekventiaalisesti limittimellå 5, joka syottåå seurauksena olevan yksikanavasig-naalin DAGC-piiriin 8, joka puolestaan syottåå analogiadigitaa-limuunninta 6, josta digitoitu signaalivirta viedåån ohjaavalle mikroprosessorille 7.
Limitin osoittaa kutakin suodatinkanavaa 20 mikrosekunttia, ennen seuraavan osoittamista. Jokaisen 10 millisekunnin aikavå-lin lopuksi jokaisen kanavan koottu energia tållå aikavålillå talletetaan. Mallit, jotka on muodostettu harjoituksessa tai tunnistuksessa, koostuvat enintåån 100 aikavålinåytteestå jokaista suodatinkanavaa kohti.
Digitaalinen AGC toimii seuraavalla tavalla. Joka kerta, kun limitin osoittaa suodatinkanavaa, mikroprosessori hakee kanavan energiatason mååråtåkseen, onko analogia-digitaalimuunnin ollut ylikuormitettu, eli vahvistus on liian suuri. Kun mikroprosessori måårittåå, ettå vahvistus on liian suuri, se pienentåå AGC:n vahvistusta askelella 1, mikå vastaa vahvistuksen pienen-tåmistå tekijållå 1.5dB, ja tarkistaa uudelleen kanavan energiatason. Limitin ei siirry seuraavalle kanavalle, ennenkuin mikroprosessori on måårånnyt, ettå vahvistusta on pienennetty • « • · 5 92113 riittåvåsti analogia-digitaalimuuntimen ylikuormituksen eståmi-seksi. Kun limitin siirtyy seuraavalle suodatinkanavalle, pidetaan AGC-piirin vahvistus uudella matalalla tasolla, jollei tåmå taso aiheuta analogia-digitaalimuuntimen ylikuormitusta uuden kanavan energiatasolla, misså tapauksessa vahvistusta pienennetåån kuten edellå kuvattiin. Kun limitin on osoittanut viimeisen suodatinkanavan, normalisoi mikroprosessori kaikkien kanavien energiatasot asettamalla niiden vahvistuskertoimet (jotka on talletettu yhdesså energiatasotiedon kanssa mikropro-sessorissa olevaan muistiin) uuteen minimiin, jonka mikroprosessori on muodostanut. Tållå tavalla poimitaan yhtenevåiset joukot ominaisuuksia riippumatta alussa olevasta sisååntulosig-naalin vahvistuksesta ja mistå tahansa muutoksista vahvistuk-sessa mallin muodostamisen aikana.
Puheentunnistimelta vaaditaan myos, ettå se havaitsee puheen tai sanan alun ja lopun suurella tarkkuudella. Keksinnon mukainen puheentunnistin kåyttåå seuraavaa tekniikkaa: A. Taustakohinan energiataso mitataan ja talletetaan 32 aikavå-liin (10 millisekuntia nåytettå kohti), kun samanaikaisesti såådetåån (våhennetåån) AGC-piirin vahvistuksia, kuten yllå on kuvattu, jotta pystyttåisiin kåsittelemåån maksimaalista kohi-naenergiaa.
B. Maksimaalinen energianåyte loydetåån summaamalla kaikki suo-datinarvot kutakin aikavåliå kohti, jakamalla 16:ta (suodatin-kanavien lukumåårå) ja kertomalla vahvistustekijållå, joka vas-taa DAGC-piirin vahvistusta, ja vertaamalla sitten jokaista aikavåliå maksimin loytåmiseksi.
C. Kynnys, joka tarvitsee ylittåå, ennenkuin puhetta pidetåån alkaneena, asetetaan yhtåsuureksi kuin 1.5-kertaa maksimaalinen kohinaenergia, joka mååråttiin kohdassa B.
D. Keskiarvoinen kohinaenergia kutakin suodatinkanavaa kohti loydetåån ja talletetaan (kullekin kanavalle se on kaikkien 32 aikavålin energioiden summa jaettuna 32:11a) kohinamallin muo-dostamiseksi.
• · 6 92113 E. Tåmån jålkeen suodatinryhmåå skannataan joka 10 millisekunt-ti ja tieto talletetaan våliaikaiseen sykliseen muistiin, jossa on 100 aikanåytettå, kunnes keskiarvoinen suodatinenergia ylit-tåå kohina/puhekynnyksen, joka laskettiin kohdassa C.
F. Jos kohina/puhekynnystå ei ylitetå 32 nåytteen jålkeen, suo-ritetaan tarkistus, jotta varmistettaisiin, ettei DAGC-piirin vahvistusta ole asetettu liian matalaksi. Tåmå tehdåån katso-malla maksimaalista suodatinkanava-arvoa, joka on talletettu mainittuihin 32 aikavåliin. Jos tåmå maksimitaso on 1.5dB tai enemmån maksimaalisen hyvåksyttåvån sisååntulotason alapuolella analogia-digitaalimuuntimelle, lisåtåån AGC:n vahvistusta arvolla 1, jotta lisåttåisiin vahvistusta 1.5dB. Jos kynnystå ei saavuteta 32 nåytteen jålkeen ja DAGCrn asetus on oikein, niin kohina/puhekynnys lasketaan uudelleen etsimållå maksimi-energia 32 nåytteen yli (kuten kohdassa B), ja kertomalla tåmå arvolla 1.5 (kuten kohdassa C).
G. Kun kohina/puhekynnys on ylitetty, skannataan suodatinryhmåå joka 10 millisekuntti, ja suodatintieto talletetaan muistiin muodostamaan puhemalleja, kunnes joko 100 nåytettå on saatu tai kunnes energiataso putoaa kohina/puhekynnyksen alapuolelle 20 peråkkåiseksi nåytteeksi. Kuten edellå on kuvattu, jos tiedon sisååntulon aikaan analogia-digitaalimuunnin on ylikuormitettu, pienennetåån AGC:n asetusta tekijållå 1, ja sitå suodatinkana-vaa koskeva tieto kåsitellåån uudelleen. Jos 16 suodatinkanavan skannauksen aikana DAGC-piirin vahvistusta pienennetåån, syote-tåån tieto kaikilta 16 kanavalta uudelleen sisåån siten, ettå kaikki suodatintieto vastaa samaa AGC-asetusta. Kåytetty AGC-arvo talletetaan muistiin yhdesså suodatintiedon kanssa. Jokai-sen aikavålin alussa kåytetty AGC-asetus otetaan edellisestå aikakehyksestå, joten vahvistusta voidaan pienentåå (ei suuren-taa) ainoastaan puheen kåsittelyn aikana. Tåmå ei ole ongelma, koska mallijakson lopussa kaikki mallitieto normalisoidaan yhtenåiseen AGC-asetukseen.
H. Sen varmistamiseksi, ettå puheen alku ei jåå huomaamatta puhe/kohinailmaisimen kynnyksen takia, siirretåån puheen • · i • ·' 7 9211 3 havaitsemista edeltåvåt 15 aikanåytettå våliaikaisesta sykli-sestå muistista "puhe"-mallin eteen.
I. Jos yli 100 nåytettå kåsiteltiin, ennenkuin puhe havaittiin, lasketaan kohinamalli uudelleen analysoimalla (kuten kohdassa D) 32 vanhinta aikakehystå våliaikaisessa syklisesså muistissa. Jos kåsiteltiin våhemmån kuin 100 nåytettå, ennenkuin puhe havaittiin, kåytetåån kohdassa D muodostettua kohinamallia seuraavilla askelmilla.
J. AGC:n minimivahvistusasetus puhemallille loydetåån sitten ja sekå puhe- ettå kohinamallit normalisoidaan tålle asetukselle, mistå on seurauksena, ettå molemmat mallit sisåltåvåt arvot, jotka olisi saatu, jos tåtå vahvistusta olisi kåytetty alusta låhtien.
K. Normalisoitu kohinamalli våhennetåån sitten normalisoidun puhemallin jokaisesta aikakehyksestå.
L. Maksimaalinen energia normalisoidussa puhemallissa loydetåån nyt, ja lasketaan uusi kohina/puhekynnys - yhtåsuuri kuin maksimienergia miinus 18dB. Tåtå uutta kynnystå kåytetåån skannaamaan normalisoitua puhemallia, jotta mååritettåisiin puheen alku- ja loppukohdat.
M. Puhemalli katkaistaan sitten alku- ja loppupisteiståån ja se joko talletetaan muistiin (harjoittelu) tai sitå kåytetåån tun-nistukseen. Seuraava taulukkoesimerkki edustaa talletettuja arvoja sen jålkeen, kun taustakohinaa on mitattu 320 millise-kunttia (32 aikavåliå, kukin 10 millisekuntia).
92113 8
Suodatinryhmå todell. keskim.
DAGC 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 energia 4 210 220 232 245 224 216 167 188 176 234 250 177 134 170 213 209 408 4 210 218 230 250 220 222 170 190 173 230 255 170 137 172 215 212 409 4 210 222 234 247 216 225 171 189 178 233 253 171 140 170 214 208 410 4 213 220 231 251 218 223 166 184 174 230 250 168 133 165 220 216 408 4 215 217 228 253 220 220 160 186 180 231 254 166 132 164 223 220 409 4 210 220 232 245 224 216 172 187 177 235 253 160 130 172 214 207 407 4 210 220 232 245 224 216 167 188 176 234 250 177 134 170 213 209 408 A 4 211 218 230 250 220 222 170 190 173 230 255 170 137 172 215 212 409 I 4 210 222 234 247 216 225 171 189 178 233 253 171 140 170 214 208 410 K 4 213 220 231 251 218 223 166 184 174 230 250 168 133 165 220 216 408 4 215 217 228 253 220 220 160 186 180 231 254 166 132 164 223 220 409 A 4 210 220 232 245 224 216 172 187 177 235 253 160 130 172 214 207 407 v 4 210 220 232 245 224 216 167 188 176 234 250 177 134 170 213 209 408 A 4 211 218 230 250 220 222 170 190 173 230 255 170 137 172 215 212 409 L 4 210 222 234 247 216 225 171 189 178 233 253 171 140 170 214 208 410 j 4 213 220 231 251 218 223 166 184 174 230 250 168 133 165 220 216 408 _ 4 215 217 228 253 220 220 160 186 180 231 254 166 132 164 223 220 409 1 4 210 220 232 245 224 216 172 187 177 235 253 160 130 172 214 207 407 4 210 220 232 245 224 216 167 188 176 234 250 177 134 170 213 209 408 4 211 218 230 250 220 222 170 190 173 230 255 170 137 172 215 212 409 4 210 222 234 247 216 225 171 189 178 233 253 171 140 170 214 208 410 4 213 220 231 251 218 223 166 184 174 230 250 168 133 165 220 216 408 4 215 217 228 253 220 220 160 186 180 231 254 166 132 164 223 220 409 4 210 220 232 245 224 216 172 187 177 235 253 160 130 172 214 207 407 4 210 222 234 247 216 225 171 189 178 233 253 171 140 170 214 208 410 4 213 220 231 251 218 223 166 184 174 230 250 168 133 165 220 216 408 ψ 4 215 217 228 253 220 220 160 186 180 231 254 166 132 164 223 220 409 4 210 220 232 245 224 216 172 187 177 235 253 160 130 172 214 207 407 4 210 220 232 245 224 216 167 188 176 234 250 177 134 170 213 209 408 4 211 218 230 250 220 222 170 190 173 230 255 170 137 172 215 212 409 4 213 220 231 251 218 223 166 184 174 230 250 168 133 165 220 216 408 4 215 217 228 253 220 220 160 186 180 231 254 166 132 164 223 220 409
Keskimååråinen kohinamalli: 212 219 231 248 220 220 167 187 176 232 252 169 134 169 217 212 > · >•1 92113 9 DAGCrn arvo 4 vastaa analogia-digitaalimuuntimeen menevån sig-naalin vaimennusta 6dB, siten "todellisen" energian laskemisek-si tåytyy kaikki yllåolevat suodatinryhmån arvot kaksinkertais-taa. Maksimaalinen todellinen energia (keskiarvona kaikkien suodattimien yli) oli 410. Mallin tallettamisen aloittami-seen/lopettamiseen tarvittava kynnys on 615.
Koska keksinnon ensimmåinen sovellutus on aånen tunnistus, on se kuvattu viitaten tåhån sovellutukseen. Kuten alan asiantun-tijat kuitenkin ovat tietoisia, ei keksinnon ainoa sovellutus ole åånentunnistus, vaan sitå voidaan soveltaa kaytånnollisesti katsoen mihin tahansa tilanteeseen, jossa åånisignaaleja kåsi-tellåan nåytteiden poimintaa vårten.
Keksinnon mukainen puheprosessori on erityisen sopiva kåytettå-våksi sovellutuksissa, joissa taustakohina ja tåmån taustakohi-nan tason muutokset ovat ongelmana tunnetuille puheprosesso-reille. Eras tållainen sovellutus on hands-free-puhelinliiken-teesså, ja erityisesti kun kåytossa on soluradiopååtteitå. Tållaisia påatteitå kåytetåån useasti autoissa, jossa on edullista kayttåå puheentunnistusta hands-free-kutsunkytkennån ja numeronvalinnan muodostamiseksi. Ongelmaksi nousee kuitenkin, ettå tuuli-, tie- ja moottorimelut aaltoilevat suuressa måårin ja tekevåt puheen tarkan tunnistuksen vaikeaksi. On selvåå, ettå jos puheentunnistuksen hands-free-puhelinliiken-teesså tåytyy olla tåysin hyvåksyttåvåå tåsså sovellutuksessa, on tarpeen, ettå tunnistin hyvåksyy ja toimii oikein vastineena puhutuille komennoille taustakohinan aikana ilman, ettå vaadi-taan koko ajan komentojen toistoa.
Keksinnon muodostama parempi tunnistuksen tarkkuus on erityinen etu tåsså sovellutuksessa.
Claims (8)
1. Puheprosessori, joka koostuu sisååntulosta, joka vastaanot-taa puhesignaalit; signaalin kåsittelyelimestå spektriparamet-rien poimimiseksi mainituista puhesignaaleista: analogia-digitaalimuuntimesta mainittujen poimittujen parametrien digitoimiseksi: automaattisesta vahvistuksen ohjauselimestå mainittuun muuntimeen syotetyn signaalitason sååtåmiseksi; tunnettu siitå, ettå spektriparametrit talletetaan ainakin tilapåisesti, ja jokaista tållaista talletettua parametria kohti talletetaan myos vahvistuskerroin, joka ilmaisee vahvistuksen ohjauselimen syottåmån vahvistuksen: ja ettå nåytteenottoajan lopussa tåsså ajassa talletetut vahvistusker-toimet, jos ne ovat erilaisia, asetetaan yhtåsuureksi kuin tåsså ajassa talletettu alhaisin vahvistuskerroin, jolloin vastaavasti talletettujen spektriparametrien suuruuksia sååde-tåån samassa suhteessa.
2. Patenttivaatimuksen 1 mukainen puheprosessori, jossa jokai-nen poimittu spektriparametri vastaa tietyn taajuuskaistan energiasisåltoå t:n pituisessa aikavålisså, tunnettu siitå, ettå jokaista poimittua parametria kohti analogia-digitaalimuuntimeen syotetty signaalitaso mååråtåån pienesså ajan t osassa, ja jos signaalitaso on suurempi kuin edeltåmåå-råtty taso, vahvistusta pienennetåån ja signaalitaso arvioidaan uudelleen, jolloin signaalitason arviointi ja vahvistuksen pienennys toistetaan aikavålisså t, kunnes signaalitaso on lopullisella tasolla, joka ei ylitå mainittua edeltåmååråttyå tasoa.
3. Patenttivaatimuksen 2 mukainen puheprosessori, tunnettu siitå, ettå mainittu edeltåmååråtty taso on yhtå-suuri kuin maksimitaso, joka ei ylitå analogia-digitaalimuuntimen dynaamista aluetta. • « 92113
4. Patenttivaatimuksen 2 tai 3 mukainen puheprosessori, jossa t:n pituisessa yksittaisesså aikavalisså muodostetaan spektri-parametrit lukuisille diskreeteille taajuuskaistoille, tunnettu siitå, ettå eri taajuuskaistoja osoite- taan sekventiaalisesti, jolloin minkå tahansa taajuuskaistan lopullista vahvistuskerrointa kåytetåån seuraavan osoitetun taajuuskaistan aloitusvahvistuskertoimena.
5. Minkå tahansa patenttivaatimuksen 2-4 mukainen puheprosessori, tunnettu siitå, ettå nåytteenottoaika muodostuu lukuisista t:n pituisista aikavåleistå.
6. Minkå tahansa edellåolevan patenttivaatimuksen mukainen puheprosessori, tunnettu siitå, ettå se on rakennettu puheentunnistimeksi.
7. Minkå tahansa edellåolevan patenttivaatimuksen mukainen puheprosessori, tunnettu siitå, ettå vahvistuksen ohjauselin pitåå sisållåån digitaalisesti kytketyn vaimentimen sellaisen mikroprosessorin ohjauksessa, jonka yksi sisåån-tuloista on kytketty analogia-digitaalimuuntimen digitoituun ulostuloon, jolloin vaimentimen vahvistus mååråtåån mikropro-sessorilla.
8. Soluradiopååte, joka sisåltåå puheentunnistimen toimintojen valitsemiseksi vastineena puhutuille kåskyille, tunnettu siitå, ettå puheentunnistin sisåltåå puheprosessorin, joka on minkå tahansa patenttivaatimusten 1 - 5 mukainen. • · 92113
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
GB868613327A GB8613327D0 (en) | 1986-06-02 | 1986-06-02 | Speech processor |
GB8613327 | 1986-06-02 |
Publications (4)
Publication Number | Publication Date |
---|---|
FI872450A0 FI872450A0 (fi) | 1987-06-02 |
FI872450A FI872450A (fi) | 1987-12-03 |
FI92113B FI92113B (fi) | 1994-06-15 |
FI92113C true FI92113C (fi) | 1994-09-26 |
Family
ID=10598774
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
FI872450A FI92113C (fi) | 1986-06-02 | 1987-06-02 | Puheprosessori ja soluradiopääte |
Country Status (13)
Country | Link |
---|---|
US (1) | US4912766A (fi) |
EP (2) | EP0248609B1 (fi) |
JP (3) | JP2561850B2 (fi) |
KR (1) | KR950011963B1 (fi) |
AT (2) | ATE183009T1 (fi) |
CA (1) | CA1310418C (fi) |
DE (2) | DE3752288T2 (fi) |
DK (1) | DK171426B1 (fi) |
ES (1) | ES2056819T3 (fi) |
FI (1) | FI92113C (fi) |
GB (1) | GB8613327D0 (fi) |
HK (1) | HK137096A (fi) |
WO (1) | WO1987007750A1 (fi) |
Families Citing this family (50)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DK510275A (da) * | 1975-11-12 | 1977-05-13 | Struers K S | Elektrolytisk polerapparat |
JPH02189600A (ja) * | 1989-01-19 | 1990-07-25 | Sanyo Electric Co Ltd | 音声認識装置 |
US5333155A (en) * | 1991-04-25 | 1994-07-26 | Rohde & Schwarz Gmbh & Co. Kg | Method and system for transmitting digital audio signals from recording studios to the various master stations of a broadcasting network |
US6134521A (en) * | 1994-02-17 | 2000-10-17 | Motorola, Inc. | Method and apparatus for mitigating audio degradation in a communication system |
AU720511B2 (en) * | 1995-08-24 | 2000-06-01 | British Telecommunications Public Limited Company | Pattern recognition |
US5774841A (en) * | 1995-09-20 | 1998-06-30 | The United States Of America As Represented By The Adminstrator Of The National Aeronautics And Space Administration | Real-time reconfigurable adaptive speech recognition command and control apparatus and method |
US7630895B2 (en) * | 2000-01-21 | 2009-12-08 | At&T Intellectual Property I, L.P. | Speaker verification method |
US6012027A (en) * | 1997-05-27 | 2000-01-04 | Ameritech Corporation | Criteria for usable repetitions of an utterance during speech reference enrollment |
US6353809B2 (en) * | 1997-06-06 | 2002-03-05 | Olympus Optical, Ltd. | Speech recognition with text generation from portions of voice data preselected by manual-input commands |
US6188986B1 (en) | 1998-01-02 | 2001-02-13 | Vos Systems, Inc. | Voice activated switch method and apparatus |
GB9822529D0 (en) * | 1998-10-16 | 1998-12-09 | Dragon Syst Uk Ltd | Speech processing |
DE19960161C2 (de) * | 1998-12-15 | 2002-03-28 | Daimler Chrysler Ag | Verfahren zur Detektion von sprachmodulierten Sendungen |
FI118359B (fi) * | 1999-01-18 | 2007-10-15 | Nokia Corp | Menetelmä puheentunnistuksessa ja puheentunnistuslaite ja langaton viestin |
US6519559B1 (en) * | 1999-07-29 | 2003-02-11 | Intel Corporation | Apparatus and method for the enhancement of signals |
US6910011B1 (en) | 1999-08-16 | 2005-06-21 | Haman Becker Automotive Systems - Wavemakers, Inc. | Noisy acoustic signal enhancement |
US7117149B1 (en) | 1999-08-30 | 2006-10-03 | Harman Becker Automotive Systems-Wavemakers, Inc. | Sound source classification |
US6594630B1 (en) * | 1999-11-19 | 2003-07-15 | Voice Signal Technologies, Inc. | Voice-activated control for electrical device |
US7155385B2 (en) | 2002-05-16 | 2006-12-26 | Comerica Bank, As Administrative Agent | Automatic gain control for adjusting gain during non-speech portions |
KR100841096B1 (ko) * | 2002-10-14 | 2008-06-25 | 리얼네트웍스아시아퍼시픽 주식회사 | 음성 코덱에 대한 디지털 오디오 신호의 전처리 방법 |
US8271279B2 (en) | 2003-02-21 | 2012-09-18 | Qnx Software Systems Limited | Signature noise removal |
US7895036B2 (en) | 2003-02-21 | 2011-02-22 | Qnx Software Systems Co. | System for suppressing wind noise |
US7949522B2 (en) | 2003-02-21 | 2011-05-24 | Qnx Software Systems Co. | System for suppressing rain noise |
US8073689B2 (en) | 2003-02-21 | 2011-12-06 | Qnx Software Systems Co. | Repetitive transient noise removal |
US7885420B2 (en) | 2003-02-21 | 2011-02-08 | Qnx Software Systems Co. | Wind noise suppression system |
US7725315B2 (en) | 2003-02-21 | 2010-05-25 | Qnx Software Systems (Wavemakers), Inc. | Minimization of transient noises in a voice signal |
US8326621B2 (en) | 2003-02-21 | 2012-12-04 | Qnx Software Systems Limited | Repetitive transient noise removal |
AU2003901539A0 (en) * | 2003-03-28 | 2003-05-01 | Cochlear Limited | Noise floor estimator |
US7949520B2 (en) | 2004-10-26 | 2011-05-24 | QNX Software Sytems Co. | Adaptive filter pitch extraction |
US7716046B2 (en) | 2004-10-26 | 2010-05-11 | Qnx Software Systems (Wavemakers), Inc. | Advanced periodic signal enhancement |
US7680652B2 (en) | 2004-10-26 | 2010-03-16 | Qnx Software Systems (Wavemakers), Inc. | Periodic signal enhancement system |
US8306821B2 (en) | 2004-10-26 | 2012-11-06 | Qnx Software Systems Limited | Sub-band periodic signal enhancement system |
US8543390B2 (en) | 2004-10-26 | 2013-09-24 | Qnx Software Systems Limited | Multi-channel periodic signal enhancement system |
US8170879B2 (en) | 2004-10-26 | 2012-05-01 | Qnx Software Systems Limited | Periodic signal enhancement system |
US8284947B2 (en) | 2004-12-01 | 2012-10-09 | Qnx Software Systems Limited | Reverberation estimation and suppression system |
US20060146652A1 (en) * | 2005-01-03 | 2006-07-06 | Sdi Technologies, Inc. | Sunset timer |
US8027833B2 (en) | 2005-05-09 | 2011-09-27 | Qnx Software Systems Co. | System for suppressing passing tire hiss |
US8170875B2 (en) | 2005-06-15 | 2012-05-01 | Qnx Software Systems Limited | Speech end-pointer |
US8311819B2 (en) | 2005-06-15 | 2012-11-13 | Qnx Software Systems Limited | System for detecting speech with background voice estimates and noise estimates |
US7117075B1 (en) * | 2005-08-15 | 2006-10-03 | Report On Board Llc | Driver activity and vehicle operation logging and reporting |
US7995713B2 (en) * | 2006-04-03 | 2011-08-09 | Agere Systems Inc. | Voice-identification-based signal processing for multiple-talker applications |
US7844453B2 (en) | 2006-05-12 | 2010-11-30 | Qnx Software Systems Co. | Robust noise estimation |
US8326620B2 (en) | 2008-04-30 | 2012-12-04 | Qnx Software Systems Limited | Robust downlink speech and noise detector |
US8335685B2 (en) | 2006-12-22 | 2012-12-18 | Qnx Software Systems Limited | Ambient noise compensation system robust to high excitation noise |
US8904400B2 (en) | 2007-09-11 | 2014-12-02 | 2236008 Ontario Inc. | Processing system having a partitioning component for resource partitioning |
US8850154B2 (en) | 2007-09-11 | 2014-09-30 | 2236008 Ontario Inc. | Processing system having memory partitioning |
US8694310B2 (en) | 2007-09-17 | 2014-04-08 | Qnx Software Systems Limited | Remote control server protocol system |
US8209514B2 (en) | 2008-02-04 | 2012-06-26 | Qnx Software Systems Limited | Media processing system having resource partitioning |
DE102010041435A1 (de) * | 2010-09-27 | 2012-03-29 | Siemens Medical Instruments Pte. Ltd. | Verfahren zum Rekonstruieren eines Sprachsignals und Hörvorrichtung |
WO2013061252A2 (en) | 2011-10-24 | 2013-05-02 | Cochlear Limited | Post-filter common-gain determination |
JP6127422B2 (ja) | 2012-09-25 | 2017-05-17 | セイコーエプソン株式会社 | 音声認識装置及び方法、並びに、半導体集積回路装置 |
Family Cites Families (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3411153A (en) * | 1964-10-12 | 1968-11-12 | Philco Ford Corp | Plural-signal analog-to-digital conversion system |
US4000369A (en) * | 1974-12-05 | 1976-12-28 | Rockwell International Corporation | Analog signal channel equalization with signal-in-noise embodiment |
US4032710A (en) * | 1975-03-10 | 1977-06-28 | Threshold Technology, Inc. | Word boundary detector for speech recognition equipment |
CA1056504A (en) * | 1975-04-02 | 1979-06-12 | Visvaldis A. Vitols | Keyword detection in continuous speech using continuous asynchronous correlation |
US4052568A (en) * | 1976-04-23 | 1977-10-04 | Communications Satellite Corporation | Digital voice switch |
FR2451680A1 (fr) * | 1979-03-12 | 1980-10-10 | Soumagne Joel | Discriminateur parole/silence pour interpolation de la parole |
US4262355A (en) * | 1979-05-11 | 1981-04-14 | Rca Corporation | System for limiting intermodulation distortion of talkspurt signals |
US4292470A (en) * | 1979-09-10 | 1981-09-29 | Interstate Electronics Corp. | Audio signal recognition computer |
JPS56126896A (en) * | 1980-03-10 | 1981-10-05 | Nippon Electric Co | Voice recognizing system |
US4352957A (en) * | 1980-03-17 | 1982-10-05 | Storage Technology Corporation | Speech detector circuit with associated gain control for a tasi system |
JPS56159400U (fi) * | 1980-04-24 | 1981-11-27 | ||
JPS57177197A (en) * | 1981-04-24 | 1982-10-30 | Hitachi Ltd | Pick-up system for sound section |
JPS57178299A (en) * | 1981-04-27 | 1982-11-02 | Kyosan Electric Mfg | Recognition pattern preparation system |
US4410763A (en) * | 1981-06-09 | 1983-10-18 | Northern Telecom Limited | Speech detector |
US4489434A (en) * | 1981-10-05 | 1984-12-18 | Exxon Corporation | Speech recognition method and apparatus |
JPS5984300A (ja) * | 1982-11-08 | 1984-05-15 | 株式会社日立製作所 | 音声区間検出回路 |
JPS59111697A (ja) * | 1982-12-17 | 1984-06-27 | 株式会社日立製作所 | 音声認識方式 |
US4627091A (en) * | 1983-04-01 | 1986-12-02 | Rca Corporation | Low-energy-content voice detection apparatus |
JPS6063600A (ja) * | 1983-08-26 | 1985-04-11 | 日本電気株式会社 | 可変閾値型音声検出器 |
US4696040A (en) * | 1983-10-13 | 1987-09-22 | Texas Instruments Incorporated | Speech analysis/synthesis system with energy normalization and silence suppression |
JPS6085628A (ja) * | 1983-10-15 | 1985-05-15 | Fujitsu Ten Ltd | 通信装置 |
JPS60254100A (ja) * | 1984-05-30 | 1985-12-14 | 沖電気工業株式会社 | 音声認識方式 |
JPS6195398A (ja) * | 1984-10-17 | 1986-05-14 | 株式会社東芝 | 音声認識装置 |
US4821325A (en) * | 1984-11-08 | 1989-04-11 | American Telephone And Telegraph Company, At&T Bell Laboratories | Endpoint detector |
JPS61113100A (ja) * | 1984-11-08 | 1986-05-30 | ヤマハ株式会社 | 音声パラメ−タ検出装置 |
FR2576472B1 (fr) * | 1985-01-22 | 1988-02-12 | Alcatel Thomson Faisceaux | Procede et dispositif de commande automatique de gain d'un recepteur en acces multiple a repartition temporelle |
JPH0673079B2 (ja) * | 1985-03-29 | 1994-09-14 | 沖電気工業株式会社 | 音声区間検出回路 |
JPH06105394B2 (ja) * | 1986-03-19 | 1994-12-21 | 株式会社東芝 | 音声認識方式 |
-
1986
- 1986-06-02 GB GB868613327A patent/GB8613327D0/en active Pending
-
1987
- 1987-05-29 EP EP87304793A patent/EP0248609B1/en not_active Expired - Lifetime
- 1987-05-29 DE DE3752288T patent/DE3752288T2/de not_active Expired - Fee Related
- 1987-05-29 DE DE3750314T patent/DE3750314T2/de not_active Expired - Fee Related
- 1987-05-29 WO PCT/GB1987/000376 patent/WO1987007750A1/en unknown
- 1987-05-29 KR KR1019880700114A patent/KR950011963B1/ko not_active IP Right Cessation
- 1987-05-29 EP EP93203407A patent/EP0750291B1/en not_active Expired - Lifetime
- 1987-05-29 AT AT93203407T patent/ATE183009T1/de not_active IP Right Cessation
- 1987-05-29 ES ES87304793T patent/ES2056819T3/es not_active Expired - Lifetime
- 1987-05-29 AT AT87304793T patent/ATE109582T1/de active
- 1987-05-29 JP JP62503341A patent/JP2561850B2/ja not_active Expired - Lifetime
- 1987-06-01 CA CA000538514A patent/CA1310418C/en not_active Expired - Fee Related
- 1987-06-01 US US07/055,966 patent/US4912766A/en not_active Expired - Lifetime
- 1987-06-02 FI FI872450A patent/FI92113C/fi not_active IP Right Cessation
- 1987-06-02 DK DK282587A patent/DK171426B1/da not_active IP Right Cessation
-
1993
- 1993-01-11 JP JP5019720A patent/JP2654503B2/ja not_active Expired - Fee Related
-
1996
- 1996-07-25 HK HK137096A patent/HK137096A/xx not_active IP Right Cessation
-
1997
- 1997-01-30 JP JP9032774A patent/JPH09325790A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
EP0248609B1 (en) | 1994-08-03 |
ATE183009T1 (de) | 1999-08-15 |
KR880701435A (ko) | 1988-07-27 |
DE3750314D1 (de) | 1994-09-08 |
JPH0677894A (ja) | 1994-03-18 |
DE3750314T2 (de) | 1994-11-17 |
HK137096A (en) | 1996-08-02 |
EP0248609A1 (en) | 1987-12-09 |
US4912766A (en) | 1990-03-27 |
JP2561850B2 (ja) | 1996-12-11 |
FI92113B (fi) | 1994-06-15 |
FI872450A (fi) | 1987-12-03 |
CA1310418C (en) | 1992-11-17 |
DK282587A (da) | 1987-12-03 |
WO1987007750A1 (en) | 1987-12-17 |
JP2654503B2 (ja) | 1997-09-17 |
EP0750291A1 (en) | 1996-12-27 |
ATE109582T1 (de) | 1994-08-15 |
FI872450A0 (fi) | 1987-06-02 |
EP0750291B1 (en) | 1999-08-04 |
ES2056819T3 (es) | 1994-10-16 |
JPS63503487A (ja) | 1988-12-15 |
JPH09325790A (ja) | 1997-12-16 |
DE3752288T2 (de) | 2000-07-06 |
GB8613327D0 (en) | 1986-07-09 |
KR950011963B1 (ko) | 1995-10-12 |
DK171426B1 (da) | 1996-10-21 |
DE3752288D1 (de) | 1999-09-09 |
DK282587D0 (da) | 1987-06-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
FI92113C (fi) | Puheprosessori ja soluradiopääte | |
US4455676A (en) | Speech processing system including an amplitude level control circuit for digital processing | |
EP0077194B1 (en) | Speech recognition system | |
US5146504A (en) | Speech selective automatic gain control | |
US4531228A (en) | Speech recognition system for an automotive vehicle | |
US4516215A (en) | Recognition of speech or speech-like sounds | |
US4597098A (en) | Speech recognition system in a variable noise environment | |
US4610023A (en) | Speech recognition system and method for variable noise environment | |
US20010029449A1 (en) | Apparatus and method for recognizing voice with reduced sensitivity to ambient noise | |
US4543537A (en) | Method of and arrangement for controlling the gain of an amplifier | |
US6768801B1 (en) | Hearing aid having improved speech intelligibility due to frequency-selective signal processing, and method for operating same | |
JPS6257040B2 (fi) | ||
CA1147071A (en) | Method of and apparatus for detecting speech in a voice channel signal | |
JPS6334477B2 (fi) | ||
JPH09297596A (ja) | 音声認識装置 | |
JP2966452B2 (ja) | 音声認識装置の雑音除去システム | |
JPH0646359B2 (ja) | 単語音声認識装置 | |
WO1991011696A1 (en) | Method and apparatus for recognizing command words in noisy environments | |
JPS6172299A (ja) | 音声認識装置 | |
JPH0422999A (ja) | 信号処理回路及び音声認識装置 | |
JPH04369697A (ja) | 音声認識装置 | |
JPH0731506B2 (ja) | 音声認識方法 | |
JPH0627991A (ja) | 音声認識装置 | |
SU1601635A2 (ru) | Аналого-цифровой преобразователь речевых сигналов | |
JPH02189600A (ja) | 音声認識装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
BB | Publication of examined application | ||
MM | Patent lapsed |
Owner name: BRITISH TELECOMMUNICATIONS PUBLIC LIMITED COMPANY |