FI104526B - Menetelmä akustisen kohinan vähentämiseksi puhesignaalissa - Google Patents
Menetelmä akustisen kohinan vähentämiseksi puhesignaalissa Download PDFInfo
- Publication number
- FI104526B FI104526B FI930655A FI930655A FI104526B FI 104526 B FI104526 B FI 104526B FI 930655 A FI930655 A FI 930655A FI 930655 A FI930655 A FI 930655A FI 104526 B FI104526 B FI 104526B
- Authority
- FI
- Finland
- Prior art keywords
- spectrum
- noise
- angle
- frequency
- channels
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 29
- 230000005534 acoustic noise Effects 0.000 title claims description 8
- 238000001228 spectrum Methods 0.000 claims abstract description 117
- 230000005236 sound signal Effects 0.000 claims abstract description 30
- 238000006243 chemical reaction Methods 0.000 claims abstract description 4
- 230000003595 spectral effect Effects 0.000 claims description 9
- 238000004519 manufacturing process Methods 0.000 claims description 2
- 101100421135 Caenorhabditis elegans sel-5 gene Proteins 0.000 claims 1
- 239000013598 vector Substances 0.000 description 12
- 238000004364 calculation method Methods 0.000 description 3
- 230000010363 phase shift Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000003672 processing method Methods 0.000 description 2
- 230000001629 suppression Effects 0.000 description 2
- 238000011282 treatment Methods 0.000 description 2
- 101000822695 Clostridium perfringens (strain 13 / Type A) Small, acid-soluble spore protein C1 Proteins 0.000 description 1
- 101000655262 Clostridium perfringens (strain 13 / Type A) Small, acid-soluble spore protein C2 Proteins 0.000 description 1
- 101000655256 Paraclostridium bifermentans Small, acid-soluble spore protein alpha Proteins 0.000 description 1
- 101000655264 Paraclostridium bifermentans Small, acid-soluble spore protein beta Proteins 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000001427 coherent effect Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 230000008054 signal transmission Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S3/00—Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received
- G01S3/80—Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received using ultrasonic, sonic or infrasonic waves
- G01S3/802—Systems for determining direction or deviation from predetermined direction
- G01S3/808—Systems for determining direction or deviation from predetermined direction using transducers spaced apart and measuring phase or time difference between signals therefrom, i.e. path-difference systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/005—Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Otolaryngology (AREA)
- Remote Sensing (AREA)
- Radar, Positioning & Navigation (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- General Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- Circuit For Audible Band Transducer (AREA)
- Amplifiers (AREA)
- Fire Alarms (AREA)
- Alarm Systems (AREA)
- Fire-Detection Mechanisms (AREA)
- Noise Elimination (AREA)
- Heat Treatment Of Articles (AREA)
- Nonmetallic Welding Materials (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
- Input Circuits Of Receivers And Coupling Of Receivers And Audio Equipment (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
- Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
Description
104526
Menetelmä akustisen kohinan vähentämiseksi puhesignaalissa 5 Keksinnön alana ovat menetelmät, joilla voidaan vaimentaa puhesignaalissa esiintyvää akustista kohinaa.
Kuten tunnettua, meluisassa ympäristössä äänitettäessä on edullista poistaa ympäristön melua, jotta äänisignaalin 10 tallennus- tai siirtolaitteet eivät tallentaisi tai siirtäisi kohinaa. Jälkimmäinen tapaus esiintyy matkapuhelin-alalla, jossa on toivottavaa, että puhesignaalin vastaanottajalle ei lähetetä ympäristön melua, esimerkiksi kulkuneuvon, jossa radiopuhelinta käytetään, moottorin me-15 lua.
Tieteellisessä artikkelissa Dal, Degan, Prati, "Acoustic noise analysis and speech enhancement techniques for mobile radio applications" (Akustisen kohinan analyysi- ja 20 puheenparannusmenetelmät matkapuhelinsovelluksia varten),
Signal Processing 15, 1988, Elsevier Science Publishers B.V., s 43 - 56, on esitelty ja vertailtu autosta peräisin olevan puhesignaalin eri kohinankäsittelytekniikoi-ta.
25 Tämän artikkelin mukaan tunnetaan signaalinkäsittelymenetelmiä, joissa ympäristön kohinan spektri estimoidaan ja vähennetään mikrofonilta tulevan mitatun signaalin spektristä. Tämä menetelmä perustuu spektrien vähentämistä 30 käyttävään kohinankumoamisperiaatteeseen ja sitä on seli tetty myös artikkelissa S. F. Boll, Suppression of acoustic noises in speech using spectral substraction (Akustisen kohinan vaimentaminen puheessa spektrien vähentämistä käyttämällä), IEEE Trans. ASSP Voi. ASSP-27, 1979, sivut 35 113 - 120.
Tämän menetelmän pääasiallisena epäkohtana on kuitenkin, että kohinaspektri on päivitettävä usein ympäristön kohi- 2 104526 nan muutoksien huomioonottamiseksi ja että tämä päivitys voidaan tehdä vain silloin, kun käyttäjä ei puhu eli toisin sanoen hiljaisina jaksoina. Ympäristössä, jossa ympäristön kohina vaihtelee usein ja voimakkaasti, erikoises-5 ti autossa, ympäristön kohinan spektrin usein toistuvaan päivitykseen tarvitaan siten useita hiljaisia jaksoja.
Aina ei kuitenkaan ole käytettävissä kohinaspektrin päivittämiseksi riittävän pitkiä hiljaisia jaksoja ja kun hiljaisia jaksoja on liian harvoin, se huonontaa kohina-10 spektriä, joka ei enää voi ottaa huomioon lyhyitä häiriöitä. Tämä vaikuttaa siirrettyjen puhesignaalien laatuun.
Esillä olevan keksinnön tarkoituksena on lievittää näitä epäkohtia.
15 Täsmällisemmin esitettynä keksinnön eräänä tavoitteena on saada aikaan äänisignaalien käsittelymenetelmä, jolla voidaan vaimentaa voimakkaasti ympäristön kohinaa ja parantaa siten puhesignaalien siirron laatua, joka kohinan-20 vaimennus toteutetaan lähtien kohinaspektristä, joka voidaan päivittää, ilman että puhujalta edellytettäisin hiljaista jaksoa.
Tämä tavoite samoin kuin muut seuraavasta ilmenevät ta-25 voitteet saavutetaan menetelmällä vastaanotetussa, puhesignaalin sisältävässä äänisignaalissa olevan akustisen kohinan pienentämiseksi, joka menetelmä on sen tyyppinen, jossa vastaanotetusta äänisignaalista vähennetään kohi-naspektrikomponentit puhesignaalin spektrin rekonstruoi-30 miseksi ja johon sisältyy: kahden, kiinteän välimatkan päässä toisistaan olevan ja mainitun äänisignaalin vastaanottavan mikrofonin antamien signaalien analogia-digitaalimuunnoksen tuloksena 35 saatujen digitaalisten signaalien muuntaminen jaksolli sesta Fourier-muunnoksella kahdeksi diskreettien tietojen sarjaksi, joiden sarjojen jokainen diskreetti tieto edus 3 104526 taa äänisignaalin spektrin taajuuskanavan energiaa ja vaihetta, jolloin taajuuskanavat ovat vierekkäisiä siten, että ne edustavat vastaanotetun äänisignaalin spektriä, 5 - vastaanotetun äänisignaalin vallitsevan tulokulman mää rääminen mainittujen sarjojen samoja taajuuskanavia vastaavien diskreettien tietojen välisten vaihe-erojen perusteella, joka vallitseva tulokulma vastaa mainitun puhesignaalin tulokulmaa, 10 - mainitun vastaanotetun äänisignaalin hetkellisen spektrin muodostaminen, joka spektri vastaa toista mainituista diskreettien tietojen sarjoista tai joka on saatu mainitut diskreetit sarjat yhdistämällä, millä mainittua pu- 15 hesignaalin saadaan vahvistetuksi kohinan suhteen, - kohinaspektrin päivittäminen vertaamalla mainitun hetkellisen spektrin jokaisen taajuuskanavan tapauksessa vallitsevan tulokulman ja tarkastellun taajuuskanavan 20 tulokulman välistä erotusta toleranssikynnysarvoon, mainitun kohinaspektrin muodostuessa samoista taajuus-kanavista kuin mainittu hetkellinen spektri, jolloin kohinaspektrin taajuuskanavien energiat päivitetään mainitun hetkellisen spektrin sellaisten taajuuskanavien ener-25 gioiden avulla, joiden vallitsevan tulokulman ja taajuus-kanavien tulokulman erotus on suurempi kuin mainittu to-leranssikynnysarvo, - mainitun päivitetyn kohinaspektrin vähentäminen hetkel-30 lisestä spektristä lähtöspektrin saamiseksi, joka muodostuu mainitun puhesignaalin spektristä.
Menetelmän periaate perustuu siten vallitsevan tulokulman, joka vastaa puhujan sijaintia molempien äänisignaa-35 lia vastaanottavien mikrofonien suhteen, arvioimiseen puhesignaalin erottamiseksi kohinasignaalista spektrien vähentämisen avulla.
4 104526
Menetelmään sisältyy edullisesti myös päivitetyn kohina-spektrin korjausvaihe mainitun vähennyslaskun tuloksesta riippuen.
5 Päivitetyn kohinaspektrin korjaukseen sisältyy edullisesti niiden kanavien, joiden energia on suurempi kuin energian kynnysarvo, lukumäärän laskenta mainitun vähennys-laskun jälkeen ja päivitetyn kohinaspektrin korvaaminen koko hetkellisellä spektrillä, jos niiden kanavien, joi-10 den energia on suurempi kuin mainittu energian kynnysarvo, lukumäärä on pienempi kuin ennalta määrätty arvo.
Mainitun vähennyslaskun tuloksen diskreettien tietojen energiat, jotka ovat suurempia kuin mainittu energian 15 kynnysarvo, asetetaan edullisesti nollaksi ennen kuin mainittu tulos muodostaa lähtöspektrin.
Siten vältetään suuriamplitudiset kohinaa sisältävät taajuudet lähtöspektrissä.
20
Keksinnön erään suoritusmuodon mukaan mainittuun päivitetyn kohinaspektrin korjaukseen sisältyy edullisesti niiden taajuuskanavien, joiden energia on suurempi kuin mainittu energian kynnysarvo, lukumäärän laskeminen vähen-25 nyslaskun jälkeen ja mainitun päivitetyn kohinaspektrin kanavien korvaaminen niillä hetkellisen spektrin kanavilla, jotka ovat antaneet negatiivisen tuloksen mainitun vähennyslaskun jälkeen, jos niiden taajuuskanavien, joiden energia on suurempi kuin mainittu energian kynnysar-30 vo, lukumäärä on suurempi kuin mainittu ennalta määrätty arvo.
Erään edullisen suoritusmuodon mukaan mainittu vallitsevan tulokulman määritys suoritetaan summaamalla muisti-35 paikkoihin jokaisen taajuuskanavan tapauksessa taajuus-kanavien energiaan verrannolliset painot, jokaisen muistipaikan vastatessa tulokulmaväliä, jolloin mainitut pai- 5 104526 not summataan mainittujen taajuuskanavien tulokulmia vastaaviin muistipaikkoihin, jolloin vallitseva tulokulma vastaa tulokulmaa, joka liittyy muistipaikkaan, jonka paino on suurin.
5
Siten määrätään vallitseva tulokulma, joka vastaa puhujan sijaintia kahden mikrofonin suhteen, jos puhuja antaa puhesignaalin.
10 Mainitut painot ovat edullisesti verrannollisia mainittujen taajuuskanavien taajuuksiin ja mainitut summaukset käsittävät liukuvien keskiarvojen muodostamisen.
Erään edullisen suoritusmuodon mukaan mainittu diskreet-15 tien sarjojen yhdistäminen, jolla mainittua puhesignaalia voidaan vahvistaa kohinan suhteen, käsittää: - toisen sarjan diskreettien tietojen asettamisen samaan vaiheeseen toisen sarjan diskreettien tietojen kanssa 20 vallitsevan tulokulman perusteella siten, että mainittujen sarjojen diskreetit tiedot, jotka vastaavat vallitsevaa tulokulmaa, asetetaan samaan vaiheeseen, - mainittujen sarjojen diskreettien tietojen summaamisen 25 puhesignaalia vastaavien diskreettien tietojen vahvistamiseksi akustista kohinaa vastaavien diskreettien tietojen suhteen.
Keksinnön mukaista menetelmää on edullista soveltaa pu-30 hesignaalin käsittelyyn radiopuhelimessa.
Keksinnön muut piirteet ja edut selviävät lukemalla seu-raavan keksinnön mukaisen menetelmän edullisen suoritusmuodon selityksen, joka on esitetty havainnollistavana ja 35 ei rajoittavana esimerkkinä, joka menetelmä toteutetaan laitteella, jonka lohkokaavio on esitetty oheisessa ainoassa kuviossa.
6 104526
Esillä olevan keksinnön mukainen mentelmä voidaan jakaa seitsemään peräkkäiseen vaiheeseen, jotka selitetään yksityiskohtaisesti seuraavassa: 5 - ensimmäinen signaalinkäsittelyvaihe käsittää kahden mikrofonin antamien signaalien digitalisoinnin ja Fourier-muunnosten suorittamisen näille digitalisoiduille signaaleille kahden diskreettien tietojen sarjan aikaansaamiseksi, jolloin sarjan jokainen diskreetti tieto 10 edustaa kahden mikrofonin vastaanottaman äänisignaalin spektrin tietyn taajuuskanavan energiaa ja vaihetta, - toinen käsittelyvaihe käsittää kahden kiinteän mikrofonin sieppaamien signaalien tulokulman määräämisen disk- 15 reettien sarjojen kahden identtisen taajuuskanavan välillä esiintyvien vaihe-erojen perusteella. Tämän tulokulman tuntemisen perusteella voidaan saada puhujan sijainti molempien mikrofonien suhteen, 20 - kolmas käsittelyvaihe käsittää molempien kiinteiden mikrofonien antamien puhesignaalien yhdistämisen saman-vaiheisina puhesignaalin tehon suurentamiseksi kohinan suhteen, 25 - neljäs käsittelyvaihe käsittää kohinaspektrin päivittä misen puhesignaalin tulokulman perusteella, - viides käsittelyvaihe käsittää kohinaspektrin vähentämisen mitatusta hetkellisestä spektristä lähtöspektrin 30 aikaansaamiseksi, - kuudes käsittelyvaihe käsittää kohinaspektrin korjaamisen vähennyslaskun tuloksesta riippuen, 35 - seitsemäs ja viimeinen käsittelyvaihe käsittää läh- tösignaalin rekonstruoinnin esimerkiksi sen lähettämistä varten (radiopuhelinsovellus).
7 104526
Ensimmäinen signaalinkäsittelyvaihe käsittää kahden mikrofonin antamien analogisten signaalien digitalisoinnin ja Fourier-muunnoksen suorittamisen näille digitaalisille signaaleille kahden digitaalisten signaalien sarjan saa-5 miseksi.
Mikrofonit, jotka on osoitettu oheisessa kuviossa viitenumeroilla 10 ja 11, muodostavat akustisen antennin. Ne ovat molemmat kiinteitä ja keksinnön toteuttavaa laitetta 10 voidaan siten parhaiten soveltaa hands-free-järjestelmäs-sä. Mikrofonien 10 ja 11 antamat analogiset signaalit syötetään analogia-digitaalimuuntimille, jotka on merkitty 12 ja 13 ja jotka suorittavat myös signaalien suodatuksen (taajuuskaista 300 - 3400 Hz). Digitalisoidut sig-15 naalit johdetaan sitten digitaalisessa muodossa Hamming- ikkunoihin 14, 15 ja muunnetaan tämän jälkeen digitaalisiksi vektoreiksi N-kertaluvun nopean Fourier-muunnoksen (FFT) laskennan suorittavissa laitteissa 16, 17.
20 Analogia-digitaalimuuntimet 12 ja 13 antavat kumpikin sekventiaalisesti 256 digitaalista arvoa ei esitetylle lähtöpuskurille, jossa on 512 muistipaikkaa. Hetkellä t puskuri antaa 512 digitaalista arvoa Hamming-ikkunaan, näiden 512 digitaalisen arvon muodostuessa 256 hetkellä t 25 lasketusta arvosta, jotka on asetettu 256 hetkellä t-1 lasketun arvon jälkeen. Kumpikin Hamming-ikkuna 14 ja 15 vaimentaa vastaanotetun signaalin sivukaistoja, millä voidaan parantaa FFT-piirien 16 ja 17 signaaliresoluu-tiota. Kumpikin ikkuna 14 ja 15 antaa 512 digitaalista 30 arvoa yhdelle laitteista 16 ja 17. Nämä antavat kumpikin 512 taajuuskanavan sarjan, jotka kanavat jakautuvat taajuuskaistalle 0-8 kHz. Jokainen taajuuskanava on siten hieman suurempi kuin 15 Hz. FFT-laskentalaitteissa 14 ja 15 käytetään ajoituskelloa H.
Tämän kellon voi myös korvata laskuri, joka laskee FFT-piirien 14 ja 15 antamien näytteiden lukumäärän ja joka 35 8 104526 palautetaan nollaan, kun 512 käsittelyä on suoritettu.
Näiden laskentojen tulokset SI ja S2 ovat tällöin digitaalisessa muodossa olevien vektorien sarjoja, jolloin 5 jokainen vektori vastaa yhden tulosignaalin spektrin näytettä ja muodostuu esimerkiksi kahdesta 16-bittisestä sanasta, jotka määrittelevät kompleksiluvun.
Todellisuudessa vain 256 erilaista vektoria voidaan ottaa 10 huomioon sen vuoksi, että reaalisen (käsitteen matemaattisessa merkityksessä) signaalin tapauksessa Fourier-muunnoksen itseisarvo on parillinen funktio, kun taas vaihe on pariton. Jäljellä olevia 256 vektoria ei oteta huomioon. FFT-laitteen lähdössä kumpikin kanava antaa 15 siten 256 vektoria, jotka kukin muodostuvat kahdesta 16-bittisestä sanasta.
Toinen käsittelyvaihe käsittää kahden kiinteän mikrofonin sieppaaman signaalin tulokulman määräämisen diskreettien 20 sarjojen kahden identtisen taajuuskanavan välisten vaihe-erojen perusteella.
FFT-laitteiden antamat vektorit syötetään peräkkäin mikrofonien 10 ja 11 antamien kahden signaalin välisen vai-25 hesiirron laskevalle laitteelle 18. Sarjoille SI ja S2 on · ominaista identtiset taajuuskanavat, jolloin kummankin tulokanavan jokaisella taajuuskanavalla on vaihe φχ ja φ2 ja eri itseisarvot, mikäli mikrofoniin 10 tuleva äänisignaali ei ole täsmälleen samanlainen kuin mikrofoniin 11 30 tuleva äänisignaali (viiveestä johtuva signaalien vai-hesiirto).
Signaalit SI ja S2 muodostuvat siten vektorisarjoista, jokaisen vektoriparin vastatessa yhtä taajuuskanavaa, ja 35 ne syötetään piirille 18, joka laskee signaalien SI ja S2 välisen vaihesiirron taajuuskanavittain.
9 104526
Kun molempien mikrofonien välinen etäisyys tunnetaan, äänisignaalin tulokulma voidaan saada approksimoimalla äänisignaalia tasoaallolla jokaisessa taajuuskanavassa seuraavan riippuvuuden avulla: 5 ν.δθ sin θ = ------- 2.n.d.f missä 10 Θ on tarkastellun taajuuskanavan äänisignaalin etsit ty tulokulma, v on äänen nopeus, δφ on molempien signaalien välinen vaihe-ero, d on mikrofonien 10 ja 11 välimatka, 15 f on tarkasteltua taajuuskanavaa vastaava taajuus hertseinä. Taajuus f on esimerkiksi taajuuskanavan keskitaajuus.
Laskentalaite 1Θ suorittaa siten molempien mikrofonien 20 antamien signaalien välisen vaihesiirron laskennan kana-vittain.
Laite 18 antaa eri taajuuskanaville lasketut tulokulmat Θ tulokulmanmäärityspiirille 19. Piiri 19 päivittää tulo-25 kulmien histogrammin, jossa on m paikkaa, jotka kattavat kulmat -90 - +90°. Jokaisen paikan pituus on siten 180/m astetta.
Histogrammin päivitys käsittää jokaisen taajuuskanavan 30 tapauksessa taajuuteen ja tarkastellussa kanavassa esiintyvään energiaan (spektrikomponentin amplitudiin) verrannollisen painon yhdistämisen laskentapiirin 18 laskemaa tulokulmaa vastaavaan paikkaan. Yhdistetty paino on edullisesti verrannollinen taajuuteen, koska kulman määritys 35 on luotettavampi suurilla taajuuksilla, joka johtuu taso-aallon paremmasta approksimaatiosta ja pienemmästä arvosta 6f/f. Paikkaan tallennettu arvo on itse asiassa tulos seuraavan yhtälön mukaan lasketusta liukuvasta keskiar- 104526 5 vosta: c(n) = a.c(n-l) + (1-a).paino(n) missä: - c(n) on histogrammin paikan hetkellä n sisältämä arvo, - a on reaaliluku, joka on pienempi kuin 1 ja lähellä arvoa 1, 10 - paino(n) on painon arvo hetkellä n. Tämä arvo on esi merkiksi yhtäsuuri kuin tarkastellun kanavan energia kerrottuna kanavan taajuudella.
Jos kahden mikrofonin 10 ja 11 vastaanottamassa äänisig-15 naalissa ei ole puhesignaalia, eri muistipaikkoihin tallennetut arvot pienenevät sitä mukaa kuin uusia tietoja saapuu niin, että lopputuloksena eri muistipaikkojen painot tulevat oleellisesti yhtäsuuriksi, kohinan jakautuessa tasaisesti eri lokeroihin, mikäli ei ole olemassa pai-20 kallistettavaa lähdettä, kuten esimerkiksi kulkuneuvon moottoria.
Histogrammi päivitetään siten jaksollisesti, esimerkiksi joka 32 ms.
25
Ei esitetyt välineet voivat myös estää histogrammin päivityksen, kun käyttäjä vastaanottaa puhesignaalia.
Kun päivitys on suoritettu kaikissa kanavissa, piiri 17 30 etsii histogrammin maksimin, eli toisin sanoen paikan, . jossa on suurimmat painot. Tämän paikan muistipaikka, eli toisin sanoen siihen liittyvä tulokulma, vastaa vallitsevaa tulokulmaa. Tämä vallitseva tulokulma, josta seuraa-vassa käytetään merkintää θΒβχ, on se tulokulma, josta 35 äänisignaalit saapuvat suurimmalla energialla.
Kun äänisignaali muodostuu puheesta, vallitseva tulokulma 11 104526 θ„.. vastaa puhujan sijaintia molempien mikrofonien suhteen. Ei paikallistettavista lähteistä tulevat kohinataa-juudet jakautuvat itse asiassa lähes tasaisesti histogrammin eri lokeroihin, kun taas paikallistettavan läh-5 teen antamat puhetaajuudet (jotka tulevat puhujalta) kerääntyvät aina samaan paikkaan, näkyen nopeasti histo-grammissa vallitsevaa tulokulmaa 6aaz vastaavan paikan piikkinä.
10 Toisen suoritusmuodon mukaan kehitetään taajuuskanavien lukumäärää vastaava määrä histogrammeja ja muodostetaan kaikkien kanavien histogrammien keskiarvo vallitsevan tulokulman havaitsemiseksi. Tämä suoritusmuoto edellyttää kuitenkin kooltaan suurempia muistivälineitä ja tämän 15 vuoksi on edullisempaa laskea liukuvat keskiarvot jokaiselle muistipaikalle.
Myös muita ratkaisuja puhesignaalin tulokulman selville saamiseksi voidaan käyttää.
20
Keksinnön signaalinkäsittelymenetelmän toinen vaihe mahdollistaa siten puhesignaalien tulokulman enax määräämisen.
25 Kolmas signaalinkäsittelyvaihe käsittää molempien mikro-** fonien antamien signaalien yhdistämisen samanvaiheisina.
Tämän yhdistämisen tarkoituksena on vahvistaa puhesignaalia kohinasignaalin suhteen. Tässä vaiheessa käytetään lohkoja 20 ja 21, jotka sisältävät välineet, jotka vai-30 heistavat molemmat kanavat samanvaiheisiksi, ja välineet, jotka summaavat vaiheistetut kanavat.
Tulokulman etsivä laite 19 antaa vaiheistusvälineille 20 vallitsevan tulokulman arvon 0Bax. Välineet 20 laskevat 35 jokaiselle taajuuskanavalle molempien tulokanavien välillä esiintyvän vaihe-eron vallitsevalla tulokulmalla 0B„, jonka se saa laitteelta 19. Tämä laskenta suoritetaan 12 104526 edellä olevan riippuvuuden perusteella, missä Θ on korvattu arvolla θΒβχ eli: δφ = (2. π. d. f. sinöeax) /v 5
Jokaiselle taajuuskanavalle saatu vaihe-ero summataan toisen signaalin vaiheeseen (tai vähennetään siitä arvon δφ laskennan muodosta riippuen). Esitetyssä suoritusmuodossa vaihe-ero lisätään signaaliin S2 (vähennetään sii-10 tä). Vaiheistusvälineiden 20 avulla voidaan siten saada signaali S2, jonka puhesignaalia vastaavat taajuuskanavat ovat samassa vaiheessa signaalin SI vastaavien kanavien kanssa (koska näillä taajuuskanavilla on suurin energia, mikä mahdollistaa arvon θΒβχ määräämisen).
15 Tämän jälkeen vaiheistettujen kanavien summausvälineet 21 summaavat signaalin SI vaiheistettuun signaaliin S2. Molempien kanavien vaiheistettuja kanavia yhdistettäessä puhesignaali summautuu koherentilla tavalla ja siten saa-20 daan suuriamplitudinen puhesignaali. Toisaalta kohinasig- naali heikkenee siten saatuun puhesignaaliin verrattuna kohinan spektraalisen hajonnan vuoksi (kohinasignaali ei ole peräisin paikallistettavasta lähteestä, kuten puhesignaali). Vaiheistettujen signalien summaus aikaansaa 25 siten puhesignaalin vahvistuksen kohinasignaaliin verrat- • tuna.
Tämä kohinanvaimennus ei kuitenkaan yleensä riitä jään-nöskohinan vuoksi, jonka spektrikomponenteilla on sama 30 tulokulma kuin puhesignaalilla. Tämän vuoksi on suoritet tava lisäkäsittelyvaihe.
On kuitenkin todettava, että tämä kolmas signaalinkäsit-telyvaihe on valinnainen, koska jompaa kumpaa signaaleis-35 ta, esimerkiksi signaalia S2 voidaan käyttää suoraan menetelmän seuraavissa vaiheissa. Tässä tapauksessa sum-mausvälineiden 21 antaman signaalin korvaa signaali S2.
13 104526
Myös useampia kiinteitä mikrofoneja voidaan käyttää. Useampien mikrofonien vastaanottamia signaaleja vastaavien digitaalisten signaalien käyttäminen monimutkaistaa kuitenkin tulokulman Θ laskenta-algoritmia jokaisella taa-5 juuskanavalla ja samoin näiden signaalien vaiheistusta esimerkiksi niiden summausta varten. Ei myöskään ole edullista käyttää kolmannen mikrofonin vastaanottamaa äänisignaalia vastaavia signaaleja korvaamaan summaimen 21 antamia, koska niiden tulokulmat eroaisivat välttämät-10 tä signaalien SI ja S2 tulokulmista eikä löydetty vallitseva tulokulma voisi ottaa huomioon näitä kolmannen mikrofonin vastaanottamia signaaleja.
Lisäkäsittelyvaihe muodostaa aikaisemmin mainitun neljän-15 nen vaiheen ja se käsittää kohinaspektrin päivittämisen.
Tämä kohinaspektrin päivitys suoritetaan toisaalta puheen tulokulmaksi tunnistetun tulokulman perusteella ja toisaalta hetkellisen spektrin perusteella, jonka sum-mausvälineiden 21 antamat digitaalisten tietojen sarjat 20 muodostavat.
Jokaisen taajuuskanavan tapauksessa kohinaspektrin päivi-tyslaite 22 vertaa laskentalaitteen 18 laskemaa tulokulmaa Θ puheen tulokulmaan eeax, jonka laite 19 antaa sille.
25 Laite 22 voi esimerkiksi verrata jokaisessa taajuus-‘‘ kanavassa arvojen 0Bax ja Θ välisen erotuksen itseisarvoa toleranssikynnykseen Θ..
Jos näiden kulmien välisen poikkeaman itseisarvo on suu-30 rempi kuin toleranssikynnys Θ,, vastaava taajuuskanava katsotaan kohinaspektriin kuuluvaksi. Tässä kanavassa olevaa energiaa käytetään siten kohinaspektrin päivittämiseen, esimerkiksi liukuvalla keskiarvolla. Tämä päivitys voi tietenkin sisältää yksinkertaisesti kohinaspekt-35 rin tietojen osan korvaamisen vastaavilla hetkellisen spektrin tiedoilla. Tämä kohinaspektri tallennetaan digitaaliseen muistiin 23. Toleranssikynnystä Θ. käyttämällä 14 104526 voidaan ottaa huomioon puhujan sijainnin pienet vaihtelut molempien mikrofonien suhteen ja samoin laskennan epätarkkuudet .
5 Jos kahden tulokulman Θ,.., ja Θ välisen poikkeman itseisarvo on pienempi kuin toleranssikynnys Θ., tarkasteltu taajuuskanava katsotaan puhespektriin kuuluvaksi eikä sen energiaa siten käytetä kohinaspektrin päivittämisen muistissa 23.
10
Piiri 22 mahdollistaa siten kohinaspektrin päivittämisen vertaamalla jokaisen taajuuskanavan tulokulmaa Θ vallitsevaan tulokulmaan θΒβχ. Tämän lasketun kulman 0Bax tehtävänä on siten mahdollistaa FFT-muunnoksella saadun spekt-15 rin taajuuksien valinta. Kuten on selvää, ei ole välttämätöntä muodostaa vallitsevan tulokulman ja hetkellisen spektrin jokaisen taajuuskanavan tulokulman välisen erotuksen itseisarvoa. Esimerkiksi voitaisiin rajoittaa tulokulma-alue, jonka leveys on 20, ja joka on keskitetty 20 arvon 0Bax suhteen, ja tarkastaa jokaisen taajuuskanavan osalta onko sen tulokulma Θ tällä alueella.
On huomattava, että kohinaspektrin päivitystä suoritetaan jatkuvasti, joka 32 ms, siitä riippumatta esiintyykö kah-25 den mikrofonin 10, 11 vastaanottamassa signaalissa puhesignaalia vai ei. Keksinnön menetelmä eroaa siten edellä mainitusta tekniikan tasosta siten, että kohinaspektrin päivittämistä varten ei tarvitse olla käytettävissä hiljaisia jaksoja, koska jokaisen taajuuskanavan kuulumi-30 nen kohinaspektriin tai puhesignaalin spektriin määrätään . lasketun vallitsevan tulokulman ja tarkastellun kanavan havaitun tulokulman perusteella.
Viides vaihe käsittää kohinaspektrin vähentämisen mita-35 tusta hetkellisestä spektristä.
Tässä vaiheessa käytetään kohinaspektrin hetkellisestä 15 104526 spektristä vähentävää laitetta 24. Kohinaspektri luetaan digitaalisesta muistista 23 ja vähennetään laitteelta 22 tulevasta hetkellisestä spektristä. Jos esillä olevan keksinnön toisen vaiheen muodostavaa vahvistusta ei käy-5 tetä, hetkellisen spektrin muodostavat jomman kumman signaalin, esimerkiksi signaalin S2, vektorit.
Tämän vähennyslaskun avulla voidaan saada lähtöspektri, joka muodostuu puhesignaalin spektristä, josta kohina-10 spektrikomponentit on lähes kokonaan poistettu. Saadulle spektrille voidaan kuitenkin suorittaa lisäkäsittely, jonka avulla voidaan korjata päivitettyä kohinaspektriä.
Vähennyslaskun jäkeen negatiiviset tulokset asetetaan 15 nolliksi. Tällöin voi esiintyä kaksi tapausta: hetkellinen spektri ei sisällä puhesignaalia ja jään-nösspektri sisältää siten vain harvoja merkitseviä taajuuksia, 20 - hetkellinen spektri sisältää puhesignaalin ja jään- nösspektri sisältää siten paljon taajuuksia, jotka sisältävät pääasiassa puhespektriä vastaavaa energi aa.
25 Hetkellisen spektrin sisällön tuntemiseksi riittää täi-löin, että lasketaan niiden taajuuskanavien lukumäärä, joilla spektrin teho on suurempi kuin kynnysarvoa Sp, minkä avulla voidaan välttää ottamasta huomioon taajuus-kanavia, joiden energia on pieni, jotka voidaan siten 30 jättää pois. Nämä taajuuskanavat, jotka voivat vastata jäännöskohinaa tai sellaisia puheen taajuuskanavia, joiden energia on niin pieni, että sitä ei tarvitse siirtää vastaanottajalle (radiopuhelinsovellus). 1
Kynnyksen Sp arvo ei edullisesti ole sama kaikille taajuuskanaville ja se riippuu kullakin taajuuskanavalla esiintyvästä energiasta. Esimerkiksi taajuuskaistan 0-2 16 104526 kHz kanaville voidaan antaa ensimmäinen kynnysarvo ja taajuuskaistan 2-4 kHz kanaville voidaan antaa toinen kynnysarvo, joka on esimerkiksi yhtäsuuri kuin puolet ensimmäisestä kynnysarvosta. Tämän avulla voidaan ottaa 5 huomioon se, että kohinaspektrin energiat ovat ajoneuvossa suurempia alemmilla taajuuksilla kuin korkeilla taajuuksilla.
Jos niiden kanavien lukumäärä, joiden energia on suurempi 10 kuin Sp, on pieni (kynnysarvoa pienempi), laskettujen taajuuskanavien katsotaan muodostuvan kohinan jäännöstaa-juuksista. Hetkellistä spektriä (toisin sanoen laitteen 22 tulossa olevia tietoja) käytetään siten kokonaisuudessaan kohinaspektrin päivittämiseen. Tämä toimitus tapah-15 tuu digitalisessa muistissa 23 ja se muodostaa signaalinkäsittelyn kuudennen vaiheen. Se käsittää täsmällisemmin esitettynä päivitetyn kohinaspektrin taajuuskanavien energian korvaamisen hetkellisen spektrin vastaavien taajuuskanavien energioilla. Lisäksi ne taajuuskanavat, joi-20 den energia ylittää kynnyksen Sp, asetetaan nolliksi ennen kohinaspektrin taajuuskanavien korvaamista. Siten jätetään pois taajuudet, jotka sisältävät suuriamplitu-dista kohinaa. 1 2 3 4 5 6 7 8 9 10 11
Eräässä toteutusmuodossa vain niitä hetkellisen spektrin 2 taajuuskanavia, joiden energiat ylittävät kohinaspektrin 3 vastaavien taajuuskanavien energiat, käytetään korvauk 4 sessa. Siten otetaan huomioon ainoastaan hetkellisen 5 spektrin ne taajuuskanavat, joiden energia on suuri.
6 7
Jos vähennyslaskun jälkeen saatu spektri vastaa puhesig 8 naalia (toisin sanoen niiden taajuuskanavien lukumäärä, 9 joiden energia on vähennyslaskun jälkeen suurempi kuin 10
Sp, on suurempi kuin kynnysarvo), vain niiden hetkellisen 11 spektrin taajuuskanavien energioita, jotka vastaavat jäännösspektrin taajuuskanavia, joiden tulos vähennyslaskun jälkeen oli negatiivinen, käytetään kohinaspektrin 17 104526 korjaamiseen. Itse asiassa vähennyslaskun jälkeinen negatiivinen tulos osoittaa, että vastaavan päivitetyn ko-hinaspektrin vastaavan taajuuskanavan energia on liian suuri. Tällä korjauksella voidaan välttää se, että jään-5 nöskohinan spektri (eli päivitetty spektri) muodostuisi vain joistakin suuriamplitudisista kanavista, mikä tekisi siitä erittäin epämiellyttävän ja äänen toistoa huonontavan.
10 On selvää että käsittelyn kuudennen vaiheen muodostava kohinaspektrin korjaus on valinnainen ja se voidaan suorittaa eri tavoilla alkaen hetkestä, jolloin päätetään katsotaanko vähennyslaskulla saadun spektrin sisältävän hyödyllisiä, esimerkiksi vastaanottajalle lähetettäviä 15 puhetaajuuskanavia vai ei.
Käsittelyn viimeinen seitsemäs vaihe käsittää analogisen lähtösignaalin rekonstruoimisen esimerkiksi sen lähetystä varten. Tässä vaiheessa käytetään lähtösignaalin kehittä-20 vää laitetta 25, joka sisältää käänteisen nopean Fourier-muunnoksen (FFT"1) suorittavan laitteen 26, joka antaa 512 puhesignaalin näytettä. Laitetta FFT"1 edeltää ei esitetty laite, joka mahdollistaa 256 vastaanotetun vektorin re-generoinnin 512 vektorin saamiseksi laitteen FFT"1 tuloon.
25 Laitetta 26 seuraa kerrostuslaite 27, joka helpottaa lähtösignaalin rekonstruointia. Laite 27 kerrostaa 256 ensin vastaanotettua näytettä 256 myöhemmän näytteen kanssa, jotka on vastaanotettu aikaisemmin (edellisen käsittelyn osana). Tämän kerrostuksen avulla lähdössä voidaan kom-30 pensoida tulon Hamming-ikkuna. Digitaali-analogiamuunnin 28 antaa vähemmän kohinaisen äänisignaalin, joka on valmis lähetettäväksi vastaanottajalle. Yhtä hyvin tämä signaali voidaan tallentaa esimerkiksi magneettinauhalle tai sitä voidaan käsitellä muulla tavalla.
Tätä seitsemättä vaihetta ei välttämättä käytetä tietyissä sovellutuksissa. Keksintöä voidaan käyttää esimerkiksi 35 18 104526 puheentunnistukseen ja tässä tapauksessa seitsemäs käsittelyvaihe voidaan jättää pois, koska puheentunnistuslait-teet käyttävät puhesignaalin spektrimuotoista esitystä.
5 Keksinnön avulla voidaan siten vähentää huomattavasti äänisignaalin kohinaspektriä puhesignaalin saamiseksi, ilman että kohinaspektrin päivittämiseen tarvittaisiin puhujan äänettömiä jaksoja, koska kohinan erottamiseen puheesta käytetään signaalin tulokulman tuntemusta.
Claims (12)
19 104526
1. Menetelmä vastaanotetussa, puhesignaalin sisältävässä äänisignaalissa olevan akustisen kohinan pienentämiseksi, 5 joka menetelmä on sen tyyppinen, jossa vastaanotetusta äänisignaalista vähennetään kohinaspektrikomponentit puhesignaalin spektrin rekonstruoimiseksi, tunnettu siitä, että menetelmään sisältyy: 10. kahden, kiinteän välimatkan päässä toisistaan olevan ja mainitun äänisignaalin vastaanottavan mikrofonin (10, 11. antamien signaalien analogia-digitaalimuunnoksen (12, 13. tuloksena saatujen digitaalisten signaalien muuntaminen (16, 17) jaksollisesti Fourier-muunnoksella kahdeksi 15 diskreettien tietojen sarjaksi (SI, S2), joiden sarjojen jokainen diskreetti tieto edustaa äänisignaalin spektrin taajuuskanavan energiaa ja vaihetta, jolloin taajuuskanavat ovat vierekkäisiä siten, että ne edustavat vastaanotetun äänisignaalin spektriä, - vastaanotetun äänisignaalin vallitsevan tulokulman (ΘΒΜ) määrääminen (18, 12) mainittujen sarjojen (SI, S2) samoja taajuuskanavia vastaavien diskreettien tietojen välisten vaihe-erojen perusteella, joka vallitseva tulo- 25 kulma (ΘΒΜ) vastaa mainitun puhesignaalin tulokulmaa, * - mainitun vastaanotetun äänisignaalin hetkellisen spektrin muodostaminen, joka spektri vastaa toista mainituista diskreettien tietojen sarjoista (SI, S2) tai joka on saa- 30 tu mainitut diskreetit sarjat (SI, S2) yhdistämällä (20, 21), millä mainittua puhesignaalin saadaan vahvistetuksi kohinan suhteen, - kohinaspektrin (23) päivittäminen (22) vertaamalla mai-35 nitun hetkellisen spektrin jokaisen taajuuskanavan tapauksessa vallitsevan tulokulman (θΒβχ) ja tarkastellun taajuuskanavan tulokulman (Θ) välistä erotusta tolerans- 20 104526 sikynnysarvoon (Θ.), mainitun kohinaspektrin (23) muodostuessa samoista taajuuskanavista kuin mainittu hetkellinen spektri, jolloin kohinaspektrin (23) taajuuskanavien energiat päivitetään mainitun hetkellisen spektrin sel-5 laisten taajuuskanavien energioiden avulla, joiden vallitsevan tulokulman (θΒβχ) ja taajuuskanavien tulokulman (Θ) erotus on suurempi kuin mainittu toleranssikynnysarvo (e.), 10. mainittu päivitetyn kohinaspektrin (23) vähentäminen (24) hetkellisestä spektristä lähtöspektrin saamiseksi, joka muodostuu mainitun puhesignaalin spektristä.
2. Patenttivaatimuksen 1 mukainen menetelmä, t u n - 15. e t t u siitä, että siihen sisältyy päivitetyn kohina-spektrin (23) korjaus mainitun vähennyslaskun (24) tuloksesta riippuen.
3. Patenttivaatimuksen 2 mukainen menetelmä, t u n -20 n e t t u siitä, että päivitetyn kohinaspektrin (23) korjaukseen (24) sisältyy niiden kanavien, joiden energia on suurempi kuin energian kynnysarvo (Sp), lukumäärän laskenta mainitun vähennyslaskun jälkeen ja päivitetyn kohinaspektrin (23) korvaaminen koko hetkellisellä spekt-25 rillä, jos niiden kanavien, joiden energia on suurempi kuin mainittu energian kynnysarvo (Sp), lukumäärä on pienempi kuin ennalta määrätty arvo.
4. Patenttivaatimuksen 3 mukainen mentelmä, t u n - 30. e t t u siitä, että mainitun vähennyslaskun tuloksen diskreettien tietojen energiat, jotka ovat suurempia kuin mainittu energian kynnysarvo (Sp), asetetaan nollaksi ennen kuin mainittu tulos korvaa lähtöspektrin. 1
5. Jonkin patenttivaatimuksista 2-4 mukainen menetelmä, tunnettu siitä, että mainittuun päivitetyn kohinaspektrin (23) korjaukseen sisältyy edullisesti niiden 21 104526 taajuuskanavien, joiden energia on suurempi kuin mainittu energian kynnysarvo (Sp), lukumäärän laskeminen vähennys-laskun jälkeen ja mainitun päivitetyn kohinaspektrin (23) kanavien korvaaminen niillä hetkellisen spektrin kanavil-5 la, jotka ovat antaneet negatiivisen tuloksen mainitun vähennyslaskun (24) jälkeen, jos niiden taajuuskanavien, joiden energia on suurempi kuin mainittu energian kynnysarvo (Sp), lukumäärä on suurempi kuin mainittu ennalta määrätty arvo. 10
6. Jonkin patenttivaatimuksista 1-5 mukainen menetelmä, tunnettu siitä, että mainittu vallitsevan tulo-kulman (Qmax) määritys (18, 19) suoritetaan summaamalla muistipaikkoihin jokaisen taajuuskanavan tapauksessa taa- 15 juuskanavien energiaan verrannolliset painot, jokaisen muistipaikan vastatessa tulokulmaväliä, jolloin mainitut painot summataan mainittujen taajuuskanavien tulokulmia (Θ) vastaaviin muistipaikkoihin, jolloin vallitseva tulo-kulma (ΘΒ„) vastaa tulokulmaa (Θ), joka liittyy muisti- 20 paikkaan, jonka paino on suurin.
7. Patenttivaatimuksen 6 mukainen mentelmä, tunnettu siitä, että mainitut painot ovat myös verrannollisia mainittujen taajuuskanavien taajuuksiin. 25
8. Jommankumman patenttivaatimuksista 6 ja 7 mukainen menetelmä, tunnettu siitä, että mainitut summaukset käsittävät liukuvien keskiarvojen muodostamisen.
9. Jonkin patenttivaatimuksista 1-8 mukainen menetelmä, tunnettu siitä, että mainittu diskreettien sarjojen (SI, S2) yhdistäminen (20, 21), jolla mainittua puhesignaalia voidaan vahvistaa kohinan suhteen, käsittää: 1 - toisen sarjan (S2) diskreettien tietojen asettamisen samaan vaiheeseen (20) toisen sarjan (SI) diskreettien tietojen kanssa vallitsevan tulokulman (θββχ) perusteella 22 104526 siten, että mainittujen sarjojen (SI, S2) diskreetit tiedot, jotka vastaavat vallitsevaa tulokulmaa (0max), asetetaan samaan vaiheeseen, 5. mainittujen sarjojen (SI, S2) diskreettien tietojen summaamisen (21) puhesignaalia vastaavien diskreettien tietojen vahvistamiseksi akustista kohinaa vastaavien diskreettien tietojen suhteen.
10. Jonkin patenttivaatimuksista 1-9 mukainen menetel mä, tunnettu siitä, että sitä sovelletaan puhesignaalin käsittelyyn radiopuhelimessa.
15 Patentkrav
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR9201819A FR2687496B1 (fr) | 1992-02-18 | 1992-02-18 | Procede de reduction de bruit acoustique dans un signal de parole. |
FR9201819 | 1992-02-18 |
Publications (3)
Publication Number | Publication Date |
---|---|
FI930655A0 FI930655A0 (fi) | 1993-02-15 |
FI930655A FI930655A (fi) | 1993-08-19 |
FI104526B true FI104526B (fi) | 2000-02-15 |
Family
ID=9426753
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
FI930655A FI104526B (fi) | 1992-02-18 | 1993-02-15 | Menetelmä akustisen kohinan vähentämiseksi puhesignaalissa |
Country Status (11)
Country | Link |
---|---|
US (1) | US5539859A (fi) |
EP (1) | EP0557166B1 (fi) |
AT (1) | ATE159373T1 (fi) |
AU (1) | AU662199B2 (fi) |
DE (1) | DE69314514T2 (fi) |
DK (1) | DK0557166T3 (fi) |
ES (1) | ES2107635T3 (fi) |
FI (1) | FI104526B (fi) |
FR (1) | FR2687496B1 (fi) |
GR (1) | GR3025804T3 (fi) |
NZ (1) | NZ245850A (fi) |
Families Citing this family (68)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3046203B2 (ja) * | 1994-05-18 | 2000-05-29 | 三菱電機株式会社 | ハンズフリー通話装置 |
SE505156C2 (sv) * | 1995-01-30 | 1997-07-07 | Ericsson Telefon Ab L M | Förfarande för bullerundertryckning genom spektral subtraktion |
DE19521258A1 (de) * | 1995-06-10 | 1996-12-12 | Philips Patentverwaltung | Spracherkennungssystem |
JP3639352B2 (ja) * | 1995-06-28 | 2005-04-20 | 富士通株式会社 | 波動解析方法及びその装置 |
US6772182B1 (en) | 1995-12-08 | 2004-08-03 | The United States Of America As Represented By The Secretary Of The Navy | Signal processing method for improving the signal-to-noise ratio of a noise-dominated channel and a matched-phase noise filter for implementing the same |
SE9700772D0 (sv) * | 1997-03-03 | 1997-03-03 | Ericsson Telefon Ab L M | A high resolution post processing method for a speech decoder |
FR2761800A1 (fr) * | 1997-04-02 | 1998-10-09 | Scanera Sc | Dispositif de transmission de voix et telephone le mettant en oeuvre |
US6766029B1 (en) | 1997-07-16 | 2004-07-20 | Phonak Ag | Method for electronically selecting the dependency of an output signal from the spatial angle of acoustic signal impingement and hearing aid apparatus |
EP0802699A3 (en) * | 1997-07-16 | 1998-02-25 | Phonak Ag | Method for electronically enlarging the distance between two acoustical/electrical transducers and hearing aid apparatus |
FI114422B (fi) | 1997-09-04 | 2004-10-15 | Nokia Corp | Lähteen puheaktiviteetin tunnistus |
US6157908A (en) * | 1998-01-27 | 2000-12-05 | Hm Electronics, Inc. | Order point communication system and method |
DE19812697A1 (de) * | 1998-03-23 | 1999-09-30 | Volkswagen Ag | Verfahren und Einrichtung zum Betrieb einer Mikrofonanordnung, insbesondere in einem Kraftfahrzeug |
WO1999052097A1 (fr) * | 1998-04-02 | 1999-10-14 | Scanera S.C. | Dispositif et procede de communication |
WO1999059139A2 (en) * | 1998-05-11 | 1999-11-18 | Koninklijke Philips Electronics N.V. | Speech coding based on determining a noise contribution from a phase change |
US6549586B2 (en) * | 1999-04-12 | 2003-04-15 | Telefonaktiebolaget L M Ericsson | System and method for dual microphone signal noise reduction using spectral subtraction |
US7209567B1 (en) | 1998-07-09 | 2007-04-24 | Purdue Research Foundation | Communication system with adaptive noise suppression |
EP1035752A1 (en) | 1999-03-05 | 2000-09-13 | Phonak Ag | Method for shaping the spatial reception amplification characteristic of a converter arrangement and converter arrangement |
DE19942868A1 (de) * | 1999-09-08 | 2001-03-15 | Volkswagen Ag | Verfahren zum Betrieb einer Mehrfachmikrofonanordnung in einem Kraftfahrzeug sowie Mehrfachmikrofonanordnung selbst |
EP1089092A1 (en) * | 1999-10-01 | 2001-04-04 | Baggermaatschappij Boskalis B.V. | Method and apparatus for measuring physical parameters from the phase and amplitude histories of an acoustic signal |
US6243322B1 (en) * | 1999-11-05 | 2001-06-05 | Wavemakers Research, Inc. | Method for estimating the distance of an acoustic signal |
JP2001166025A (ja) | 1999-12-14 | 2001-06-22 | Matsushita Electric Ind Co Ltd | 音源の方向推定方法および収音方法およびその装置 |
US6668062B1 (en) * | 2000-05-09 | 2003-12-23 | Gn Resound As | FFT-based technique for adaptive directionality of dual microphones |
US8280072B2 (en) | 2003-03-27 | 2012-10-02 | Aliphcom, Inc. | Microphone array with rear venting |
US20070233479A1 (en) * | 2002-05-30 | 2007-10-04 | Burnett Gregory C | Detecting voiced and unvoiced speech using both acoustic and nonacoustic sensors |
US8019091B2 (en) * | 2000-07-19 | 2011-09-13 | Aliphcom, Inc. | Voice activity detector (VAD) -based multiple-microphone acoustic noise suppression |
US7246058B2 (en) * | 2001-05-30 | 2007-07-17 | Aliph, Inc. | Detecting voiced and unvoiced speech using both acoustic and nonacoustic sensors |
US20030179888A1 (en) * | 2002-03-05 | 2003-09-25 | Burnett Gregory C. | Voice activity detection (VAD) devices and methods for use with noise suppression systems |
AU2001295016A1 (en) * | 2000-09-01 | 2002-03-13 | Sri International, Inc. | Probabilistic alert correlation |
US20020099541A1 (en) * | 2000-11-21 | 2002-07-25 | Burnett Gregory C. | Method and apparatus for voiced speech excitation function determination and non-acoustic assisted feature extraction |
GB2375698A (en) * | 2001-02-07 | 2002-11-20 | Canon Kk | Audio signal processing apparatus |
WO2002098169A1 (en) * | 2001-05-30 | 2002-12-05 | Aliphcom | Detecting voiced and unvoiced speech using both acoustic and nonacoustic sensors |
US8452023B2 (en) | 2007-05-25 | 2013-05-28 | Aliphcom | Wind suppression/replacement component for use with electronic systems |
US20030095674A1 (en) * | 2001-11-20 | 2003-05-22 | Tokheim Corporation | Microphone system for the fueling environment |
JP3940662B2 (ja) * | 2001-11-22 | 2007-07-04 | 株式会社東芝 | 音響信号処理方法及び音響信号処理装置及び音声認識装置 |
US7315623B2 (en) * | 2001-12-04 | 2008-01-01 | Harman Becker Automotive Systems Gmbh | Method for supressing surrounding noise in a hands-free device and hands-free device |
KR101434071B1 (ko) * | 2002-03-27 | 2014-08-26 | 앨리프컴 | 통신 시스템에서 사용을 위한 마이크로폰과 음성 활동 감지(vad) 구성 |
EP1881738B1 (de) * | 2002-06-14 | 2009-03-25 | Phonak AG | Verfahren zum Betrieb eines Hörgerätes und Anordnung mit einem Hörgerät |
US7457426B2 (en) * | 2002-06-14 | 2008-11-25 | Phonak Ag | Method to operate a hearing device and arrangement with a hearing device |
US6874796B2 (en) * | 2002-12-04 | 2005-04-05 | George A. Mercurio | Sulky with buck-bar |
US9066186B2 (en) | 2003-01-30 | 2015-06-23 | Aliphcom | Light-based detection for acoustic applications |
TW200425763A (en) * | 2003-01-30 | 2004-11-16 | Aliphcom Inc | Acoustic vibration sensor |
DK1599742T3 (da) * | 2003-02-25 | 2009-07-27 | Oticon As | Fremgangsmåde til detektering af en taleaktivitet i en kommunikationsanordning |
US9099094B2 (en) | 2003-03-27 | 2015-08-04 | Aliphcom | Microphone array with rear venting |
EP1473964A3 (en) * | 2003-05-02 | 2006-08-09 | Samsung Electronics Co., Ltd. | Microphone array, method to process signals from this microphone array and speech recognition method and system using the same |
DE102004005998B3 (de) | 2004-02-06 | 2005-05-25 | Ruwisch, Dietmar, Dr. | Verfahren und Vorrichtung zur Separierung von Schallsignalen |
WO2005109951A1 (en) * | 2004-05-05 | 2005-11-17 | Deka Products Limited Partnership | Angular discrimination of acoustical or radio signals |
US20060140415A1 (en) * | 2004-12-23 | 2006-06-29 | Phonak | Method and system for providing active hearing protection |
US20060140416A1 (en) * | 2004-12-23 | 2006-06-29 | Phonak Ag | Active hearing protection system and method |
US20060262104A1 (en) * | 2005-05-19 | 2006-11-23 | Sullivan Darius M | Systems and methods for distinguishing contact-induced plate vibrations from acoustic noise-induced plate vibrations |
JP4912036B2 (ja) * | 2006-05-26 | 2012-04-04 | 富士通株式会社 | 指向性集音装置、指向性集音方法、及びコンピュータプログラム |
JP4367484B2 (ja) * | 2006-12-25 | 2009-11-18 | ソニー株式会社 | 音声信号処理装置、音声信号処理方法及び撮像装置 |
JP4516157B2 (ja) * | 2008-09-16 | 2010-08-04 | パナソニック株式会社 | 音声分析装置、音声分析合成装置、補正規則情報生成装置、音声分析システム、音声分析方法、補正規則情報生成方法、およびプログラム |
US8818802B2 (en) * | 2008-10-10 | 2014-08-26 | Spansion Llc | Real-time data pattern analysis system and method of operation thereof |
JP5714495B2 (ja) * | 2008-10-10 | 2015-05-07 | スパンション エルエルシー | 解析システム、およびデータパターン解析の方法 |
FR2948484B1 (fr) * | 2009-07-23 | 2011-07-29 | Parrot | Procede de filtrage des bruits lateraux non-stationnaires pour un dispositif audio multi-microphone, notamment un dispositif telephonique "mains libres" pour vehicule automobile |
DE102009029367B4 (de) * | 2009-09-11 | 2012-01-12 | Dietmar Ruwisch | Verfahren und Vorrichtung zur Analyse und Abstimmung akustischer Eigenschaften einer Kfz-Freisprecheinrichtung |
JP5493850B2 (ja) * | 2009-12-28 | 2014-05-14 | 富士通株式会社 | 信号処理装置、マイクロホン・アレイ装置、信号処理方法、および信号処理プログラム |
CN102111697B (zh) * | 2009-12-28 | 2015-03-25 | 歌尔声学股份有限公司 | 一种麦克风阵列降噪控制方法及装置 |
JP5593852B2 (ja) * | 2010-06-01 | 2014-09-24 | ソニー株式会社 | 音声信号処理装置、音声信号処理方法 |
US9531344B2 (en) * | 2011-02-26 | 2016-12-27 | Nec Corporation | Signal processing apparatus, signal processing method, storage medium |
US8818800B2 (en) * | 2011-07-29 | 2014-08-26 | 2236008 Ontario Inc. | Off-axis audio suppressions in an automobile cabin |
US9258645B2 (en) * | 2012-12-20 | 2016-02-09 | 2236008 Ontario Inc. | Adaptive phase discovery |
GB2516314B (en) * | 2013-07-19 | 2017-03-08 | Canon Kk | Method and apparatus for sound sources localization with improved secondary sources localization |
US20150356982A1 (en) * | 2013-09-25 | 2015-12-10 | Robert Bosch Gmbh | Speech detection circuit and method |
ES2941782T3 (es) * | 2013-12-19 | 2023-05-25 | Ericsson Telefon Ab L M | Estimación de ruido de fondo en señales de audio |
US10013981B2 (en) | 2015-06-06 | 2018-07-03 | Apple Inc. | Multi-microphone speech recognition systems and related techniques |
US9865265B2 (en) | 2015-06-06 | 2018-01-09 | Apple Inc. | Multi-microphone speech recognition systems and related techniques |
CN110415718B (zh) * | 2019-09-05 | 2020-11-03 | 腾讯科技(深圳)有限公司 | 信号生成的方法、基于人工智能的语音识别方法及装置 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US112430A (en) * | 1871-03-07 | Improvement in machines for cutting files | ||
US4112430A (en) * | 1977-06-01 | 1978-09-05 | The United States Of America As Represented By The Secretary Of The Navy | Beamformer for wideband signals |
US4333170A (en) * | 1977-11-21 | 1982-06-01 | Northrop Corporation | Acoustical detection and tracking system |
US4653102A (en) * | 1985-11-05 | 1987-03-24 | Position Orientation Systems | Directional microphone system |
US4918732A (en) * | 1986-01-06 | 1990-04-17 | Motorola, Inc. | Frame comparison method for word recognition in high noise environments |
JPH01118900A (ja) * | 1987-11-01 | 1989-05-11 | Ricoh Co Ltd | 雑音抑圧装置 |
US4912767A (en) * | 1988-03-14 | 1990-03-27 | International Business Machines Corporation | Distributed noise cancellation system |
DE69011709T2 (de) * | 1989-03-10 | 1994-12-15 | Nippon Telegraph & Telephone | Einrichtung zur Feststellung eines akustischen Signals. |
US5212764A (en) * | 1989-04-19 | 1993-05-18 | Ricoh Company, Ltd. | Noise eliminating apparatus and speech recognition apparatus using the same |
GB2239971B (en) * | 1989-12-06 | 1993-09-29 | Ca Nat Research Council | System for separating speech from background noise |
EP0747879B1 (en) * | 1990-05-28 | 2002-08-07 | Matsushita Electric Industrial Co., Ltd. | Voice signal coding system |
EP0472356B1 (en) * | 1990-08-16 | 1994-03-30 | Fujitsu Ten Limited | Speech recognition apparatus for a vehicle, using a microphone arrangement to determine the seat from which a command is generated |
JPH05134694A (ja) * | 1991-11-15 | 1993-05-28 | Sony Corp | 音声認識装置 |
US5400409A (en) * | 1992-12-23 | 1995-03-21 | Daimler-Benz Ag | Noise-reduction method for noise-affected voice channels |
-
1992
- 1992-02-18 FR FR9201819A patent/FR2687496B1/fr not_active Expired - Fee Related
-
1993
- 1993-02-05 AU AU32854/93A patent/AU662199B2/en not_active Ceased
- 1993-02-05 NZ NZ245850A patent/NZ245850A/en unknown
- 1993-02-11 DK DK93400346.8T patent/DK0557166T3/da active
- 1993-02-11 AT AT93400346T patent/ATE159373T1/de not_active IP Right Cessation
- 1993-02-11 DE DE69314514T patent/DE69314514T2/de not_active Expired - Fee Related
- 1993-02-11 ES ES93400346T patent/ES2107635T3/es not_active Expired - Lifetime
- 1993-02-11 EP EP93400346A patent/EP0557166B1/fr not_active Expired - Lifetime
- 1993-02-15 FI FI930655A patent/FI104526B/fi active
- 1993-02-16 US US08/017,780 patent/US5539859A/en not_active Expired - Lifetime
-
1997
- 1997-12-30 GR GR970403450T patent/GR3025804T3/el unknown
Also Published As
Publication number | Publication date |
---|---|
FI930655A (fi) | 1993-08-19 |
FI930655A0 (fi) | 1993-02-15 |
FR2687496B1 (fr) | 1994-04-01 |
GR3025804T3 (en) | 1998-03-31 |
AU3285493A (en) | 1993-08-19 |
EP0557166A1 (fr) | 1993-08-25 |
EP0557166B1 (fr) | 1997-10-15 |
DE69314514D1 (de) | 1997-11-20 |
ATE159373T1 (de) | 1997-11-15 |
FR2687496A1 (fr) | 1993-08-20 |
ES2107635T3 (es) | 1997-12-01 |
US5539859A (en) | 1996-07-23 |
NZ245850A (en) | 1995-11-27 |
DE69314514T2 (de) | 1998-02-12 |
DK0557166T3 (da) | 1997-11-03 |
AU662199B2 (en) | 1995-08-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
FI104526B (fi) | Menetelmä akustisen kohinan vähentämiseksi puhesignaalissa | |
JP3565226B2 (ja) | ノイズ低減システム、ノイズ低減装置及びこの装置を具える移動無線局 | |
US6377637B1 (en) | Sub-band exponential smoothing noise canceling system | |
CA2346251C (en) | A method and system for updating noise estimates during pauses in an information signal | |
EP0809842B1 (en) | Adaptive speech filter | |
US8116471B2 (en) | Audio signal dereverberation | |
US5602962A (en) | Mobile radio set comprising a speech processing arrangement | |
US6363345B1 (en) | System, method and apparatus for cancelling noise | |
US8855330B2 (en) | Automated sensor signal matching | |
US20020013695A1 (en) | Method for noise suppression in an adaptive beamformer | |
US5706395A (en) | Adaptive weiner filtering using a dynamic suppression factor | |
US5400409A (en) | Noise-reduction method for noise-affected voice channels | |
US6263307B1 (en) | Adaptive weiner filtering using line spectral frequencies | |
US8010355B2 (en) | Low complexity noise reduction method | |
CN1666495A (zh) | 与平稳频谱功率相关的音频增强系统 | |
AU705590B2 (en) | A power spectral density estimation method and apparatus | |
JP2962572B2 (ja) | 雑音除去装置 | |
US10043530B1 (en) | Method and audio noise suppressor using nonlinear gain smoothing for reduced musical artifacts | |
US9659575B2 (en) | Signal processor and method therefor | |
CN1188547A (zh) | 一种功率谱密度估计方法及设备 | |
CN113870884A (zh) | 单麦克风噪声抑制方法和装置 |