FI115569B - Äänisignaalin käsittelylaite - Google Patents

Äänisignaalin käsittelylaite Download PDF

Info

Publication number
FI115569B
FI115569B FI910293A FI910293A FI115569B FI 115569 B FI115569 B FI 115569B FI 910293 A FI910293 A FI 910293A FI 910293 A FI910293 A FI 910293A FI 115569 B FI115569 B FI 115569B
Authority
FI
Finland
Prior art keywords
signal
peak
section
analysis period
analysis
Prior art date
Application number
FI910293A
Other languages
English (en)
Swedish (sv)
Other versions
FI910293A0 (fi
FI910293A (fi
Inventor
Joji Kane
Akira Nohara
Original Assignee
Matsushita Electric Ind Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from JP2008595A external-priority patent/JP2712692B2/ja
Priority claimed from JP2008592A external-priority patent/JP2712691B2/ja
Priority claimed from JP2017348A external-priority patent/JPH03220600A/ja
Priority claimed from JP2026506A external-priority patent/JP2712703B2/ja
Priority claimed from JP2026507A external-priority patent/JP2712704B2/ja
Priority claimed from JP2034297A external-priority patent/JP2712708B2/ja
Application filed by Matsushita Electric Ind Co Ltd filed Critical Matsushita Electric Ind Co Ltd
Publication of FI910293A0 publication Critical patent/FI910293A0/fi
Publication of FI910293A publication Critical patent/FI910293A/fi
Application granted granted Critical
Publication of FI115569B publication Critical patent/FI115569B/fi

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L2025/783Detection of presence or absence of voice signals based on threshold decision
    • G10L2025/786Adaptive threshold
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/24Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being the cepstrum

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)
  • Selective Calling Equipment (AREA)
  • Input Circuits Of Receivers And Coupling Of Receivers And Audio Equipment (AREA)
  • Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

115569 Äänisignaalin käsittelylaite
Esillä oleva keksintö koskee äänisignaalin käsittelylaitetta äänen il-maisun ja äänentunnistuksen menetelmien kannalta.
5 Viime aikoina on äänenilmaisulaitteita äänen esiintymisen/puuttumi- sen ilmaisemiseksi käytetty laajalti sellaisiin sovellutuksiin kuin äänentunnistus, puhujan tunnistus, laitteen käyttö ääniohjauksella, ja tiedon syöttäminen tietokoneeseen äänen avulla.
Kuvio 1 on lohkokaavio joka esittää aiemmin tunnettua äänenil-10 maisulaitetta, jonka rakenne ja toiminta tullaan tämän jälkeen selittämään. Te-hoilmaisuosa 19 ilmaisee tulosignaalin tehoarvon arvon antamiseksi verrattavaksi komparaattorilla 21 ja sitten komparaattori 21 vertaa arvoa ennalta määrättyyn kynnystason asetusosan 20 asettamaan arvoon, jotta tuotettaisiin ääni-ilmaistu-signaali, kun arvo on suurempi kuin ennalta määrätty asetusarvo.
15 Aiemmin tunnetun mukaisesti yllä kuvatun kaltainen äänenilmaisuiai- te kuitenkin, jopa silloin jos tuleva ääni on heikko, kun tuleva signaali sisältää jonkin muun häiriön kuin ääni, tehonilmaisuosan 19 ilmaisema teho on suurempi kuin kynnyksenasetusosan 20 asetusarvo, aiheuttaa ääni-ilmaistu-signaalin lähettämisen, mikä siten muodostaa hankaluuksia usein esiintyvien virheellisten 20 ilmaisujen muodossa.
,, . Esillä oleva keksintö pyrkii ilmaisemaan äänen tarkasti kepstrianalyy- ·' >* siä käyttämällä.
v : Esillä olevan keksinnön mukainen signaalinilmaisulaite sisältää; ' * · kepstrin laskentalaitteen äänisignaalin kepstrin muodostamiseksi, ·,,,: 25 keskiarvon laskentalaitteen kepstrin laskentalaitteen lähtevän kepst- ’: i rin tekemiseksi tasaiseksi; kynnysarvon asetuslaitteen äänen ilmaisun kynnystason asettamiseksi keskiarvon laskentalaitteelta tulevan kepstrin keskiarvon perusteella, ja : ·, äänenilmaisulaitteen, johon keskiarvon laskentalaitteelta tuleva ’ 30 kepstrin keskiarvo, kepstrin laskentalaitteelta tuleva kepstrin lähtöarvo ja kyn- nysarvon asetuslaitteelta lähtevä kynnysarvosignaali syötetään, ja joka ilmaisee i äänen.
Esillä olevan keksinnön mukaisella rakenteella kepstrin laskentalaite laskee tulevan signaalin kepstriarvon lasketun signaalin saamiseksi ja kepstrin 35 keskiarvosignaalin lasketusta signaalista. Sen jälkeen suoritetaan äänen ilmaisu » 2 115569 signaalin perusteella, joka ylittää kepstrin keskiarvosignaalin ja jota laskettu kyn-nysarvosignaali ohjaa ja joka on asetettu kepstrin keskiarvosignaalilla.
Esillä olevan keksinnön tarkoituksena on tarjota sellainen laite, että käsittelyaika kepstrin huippuarvon saamiseksi on lyhyt.
5 Esillä olevan keksinnön mukainen signaalinilmaisulaite sisältää; kepstrin laskentalaitteen tulevan äänen kepstrin laskemiseksi, huippuarvon ilmaisulaitteen kepstrin laskentalaitteelta lähtevän kepstrin huippuarvon ilmaisemiseksi, analyysijakson asetuslaitteen analyysijakson asettamiseksi huippuar-10 von ilmaisulaitteelta tulevan huippuarvo-ilmaistu-signaalin ja toimintamoodin asetussignaalin perusteella, ja äänenilmaisulaitteen, johon huippuarvon ilmaisulaitteelta tuleva huippuarvo-ilmaistu signaali syötetään äänen ilmaisemiseksi, huippuarvon ilmaisulaitteen huippuarvon ilmaisujakson, jota ana-15 lyysijakson asetuslaitteen lähtösignaali ohjaa.
Esillä olevan keksinnön mukaisella rakenteella kepstrin laskentalaite laskee tulevan äänen kepstrin sen syöttämiseksi huippuarvon ilmaisulaitteelle. Huippuarvon ilmaisulaite ilmaisee kepstrin laskentalaitteelta tulevan kepstrin huippuarvon analyysijakson sisällä, jonka analyysijakson asetuslaite osoittaa, 20 huippuarvon syöttämiseksi äänenilmaisulaitteeseen. Äänenilmaisulaite vertaa , huippuarvon ilmaisulaitteelta tulevaa huippuarvoa ennalta määrättyyn kynnysar- • · : voon äänen ilmaisemiseksi. Toimintamoodi ja osa huippuarvon ilmaisulaitteelta : tulevasta huippuarvo-ilmaistu-signaalista syötetään analyysijakson asetuslait- : teeseen. Toimintamoodin yhdessä tilassa analyysijakson asetuslaite lähettää 25 ennalta määrätyn analyysijakson huippuarvon ilmaisulaitteelle, ja samaan ai-·: i kaan se asettaa analyysijakson lähtöön toisen toimintamoodin aikana huippuar- : vo-ilmaistu-lähtösignaalin ohjaamana. Toisessa toimintamoodissa analyysijak son asetuslaite toimii tavalla jossa se ohjaa edellisessä toimintamoodissa asete-. tun analyysijakson huippuarvon ilmaisulaitteelle, mikä samalla pienentää ana- ‘ 30 lyysijaksoa ja lyhentää käsittelyaikaa.
Esillä olevan keksinnön on tarkoitus toteuttaa samanlainen päämäärä ; kuin yllä.
: Esillä olevan keksinnön mukainen signaalinilmaisulaite sisältää; kepstrin laskentalaitteen tulevan äänen kepstrin laskemiseksi, ,. 35 huippuarvon ilmaisulaitteen kepstrin laskentalaitteelta tulevan kepst rin huippuarvon laskemiseksi, 3 115569 jaksodatan asetuslaitteen analysoitavan kefrenssijakson asettamiseksi huippuarvon ilmaisulaitteelta tulevan huippuarvo-ilmaistu-lähtösignaalin perusteella, ensimmäisen muistiryhmän johon asetettu jaksodatan asetuslaitteen 5 lähtöarvo syötetään ensimmäisen kytkimen kautta, toisen muistiryhmän aiemman jaksodatan asettamista varten, toisen kytkimen muistin lähdön valitsemiseksi useista muistiryhmistä, ohjauslaitteen ensimmäisen ja toisen kytkimen ohjausta varten, ja äänenilmaisulaitteen johon huippuarvon ilmaisulaitteelta tuleva huip-10 puarvo-ilmaistu-lähtösignaali syötetään äänen ilmaisemista varten, huippuarvon ilmaisulaitteen huippuarvon ilmaisujakson ollessa yhden muistiryhmän, joka on valittu toisella kytkimellä, lähdön ohjaamana.
Esillä olevan keksinnön mukaisella rakenteella ohjausosa ohjaa toi-mintamoodin ohjaamana, tuleeko kefrenssianalyysijakso, joka ohjataan huippu-15 arvon ilmaisuosaan, saada ensimmäisestä muistista vai toisesta muistista, ja se ohjaa, tuleeko jaksonasetusosalta tuleva data tallentaa ensimmäiseen muistiin vai ei. Yhdessä toimintamoodissa ohjausosa toimii sillä tavoin, että toiselta muistilta tuleva kefrenssianalyysijakso ohjataan huippuarvon ilmaisuosaan, ja kefrenssianalyysijakso syötetään tulevan äänen ohjaamana jaksonasetusosasta ja 20 tallennetaan ensimmäiseen muistiin. Toisessa toimintamoodissa ohjausosa toimii sillä tavoin, että kefrenssianalyysijakso ensimmäiseltä muistilta ohjataan : huippuarvon ilmaisuosaan, mikä siten sallii käsittelyajan lyhentämisen.
: Esillä olevan keksinnön tarkoituksena on toteuttaa samanlainen ta- : voite kuin yllä.
•, , · 25 Esillä olevan keksinnön mukainen signaalinkäsittelylaite sisältää; i kepstrin laskentaosan, johon ääni syötetään ja jossa kepstri laske taan, huippuarvon ilmaisuosan, jossa huippuarvo ilmaistaan määrätyssä analyysijaksossa kepstristä, 30 äänenilmaisuosan ääni-ilmaistu-lähtösignaalin saamiseksi huippuar- vo-ilmaistu-lähtösignaalista, t : analyysijakson asetusosan optimaalisen analyysijakson laskemista : varten huippuarvo-ilmaistu-lähtösignaalin perusteella, ja määrätyn analyysijak son ohjaamiseksi huippuarvon ilmaisuosaan, 35 analyysijakson muistin analyysijakson informaation tallentamista var ten, ja 4 115569 analyysijakson luokitteluosan analyysijakson luokittelemiseksi optimaalisen analyysijakson perusteella ja luokitellun analyysijakson tallentamisen analyysijakson muistiin, analyysijakson, jota analyysijakson asetusosa ohjaa huippuarvon il-5 maisuosaan ohjattavaksi analyysijakson luokitteluosalla moodinasetustulon ohjaamana, ja analyysijakson luokitteluosan, joka tarkistaa optimaalisen analyysijakson analyysijakson muistin sisältöä vastaan moodinasetustulon ohjaamana, analyysijakson ohjaamiseksi tarkistetun tuloksen perusteella analyysijak-10 son asetusosaan.
Esillä olevan keksinnön mukaisella rakenteella kepstrin laskentaosa laskee tulevan äänen kepstrin ja syöttää kepstrin huippuarvon ilmaisuosaan. Huippuarvon ilmaisuosa ilmaisee kepstrin laskentaosalta syötetyn kepstrin huippuarvon analyysijakson mukaisesti, joka on syötetty analyysijakson asetusosal-15 ta. Sen jälkeen äänenilmaisuosa ilmaisee äänen esiintymisen/puuttumisen huippuarvon ilmaisuosalta tulevan signaalin osasta ääni-ilmaistu-lähtösignaalin saamiseksi. Tämän jälkeen suoritetaan jaksonasetusosan jaksonasetustoiminta ja analyysijakson luokitteluosan luokittelunkäsittelytoiminta seuraavalla tavalla. Ensiksi, kun moodinasetustulona on "REKISTERÖINTI", analyysijakson ase-20 tusosa syöttää ennalta määrätyn leveän analyysijakson huippuarvon ilmai-,, , suosaan ja laskee optimaalisen analyysijakson kepstrin huippuarvon perusteella tulevalle äänelle, joka on syötetty huippuarvon ilmaisuosalta, optimaalisen ana-V : lyysijakson syöttämiseksi analyysijakson luokitteluosaan. Analyysijakson luokit-
* I
\ ί teluosa vertaa optimaalisen analyysijakson dataa analyysijakson dataan, joka on : 25 tallennettu analyysijakson muistiin, ja jos molemmat datat ovat luokaltaan toisis- •: : taan poikkeavia, se tallentaa lisäksi optimaalisen analysointijakson datan ana- lyysijakson muistiin. Tämän jälkeen, kun moodinasetustulo on "TUNNISTUS", analyysijakson asetusosa syöttää analyysijakson datan, joka on syötetty analyysijakson muistista analyysijakson luokitteluosan ohjaamana, tai ennalta mää-30 rätyn leveän analyysijakson asetetun arvon huippuarvon ilmaisuosaan, ja laskee optimaalisen analyysijakson tulevan äänen, joka on syötetty huippuarvon ilmai- • suosasta, kepstrin huippuarvon mukaisesti, optimaalisen analyysijakson syöttä- : miseksi analyysijakson luokitteluosaan. Analyysijakson luokitteluosa valitsee op timaalisen analyysijakson kanssa samanlaisen analyysijakson muistista ja ohjaa 35 muistia syöttämään valitun analyysijakson analyysijakson asetusosalle. Yllä ku- 5 115569 vatut samanlaiset analyysijaksot määritellään kahdeksi analyysijaksoksi joiden päällekkäin asetettu jakso on suurempi kuin ennalta määrätty osa.
Esillä olevan keksinnön tarkoituksena on ilmaista ääni tarkasti.
Esillä olevan keksinnön mukainen signaalinohjauslaite sisältää; 5 tehonlaskentaosan tulevan signaalin tehon laskemista varten, kepstrin laskentaosan tulevan signaalin kepstrin laskemista varten, huippuarvon ilmaisuosan kepstrin laskentaosalta tulevan kepstrin huippuarvon ilmaisemista varten, S/N-laskentaosan tulevan signaalin S/N-suhteen laskemista varten 10 tehonlaskentaosan ja huippuarvon ilmaisuosan antamien lähtösignaalien perusteella, signaalinilmaisuosan tulevan signaalin esiintymisen/puuttumisen ilmaisemiseksi huippuarvon ilmaisuosan lähtösignaalin perusteella, ja ohjauslaitteen tulevan signaalin lähettämisen ohjaamiseksi loogisella 15 tulolla S/N-laskentaosan lähtösignaalista ja signaalinilmaisuosan lähtösignaalis-ta.
Esillä olevan keksinnön mukaisella rakenteella tehonlaskentaosa laskee tulevan signaalin tehon, ja kepstrin laskentaosa ilmaisee huippuarvon ilmaisuosan kautta lasketun kepstrin huippuarvon. Signaalinilmaisuosa ilmaisee sig-20 naalin esiintymisen/puuttumisen kepstrin huippuarvosta, ja kun signaali esiintyy, ,, , se syöttää signaali-ilmaistu-signaalin AND-osalle. S/N-laskentaosa laskee myös • · : S/N-suhteen käyttämällä tulevan signaalin tehoa, joka saadaan tehonlaskenta- :· : osalta, ja kepstrin huippuarvoa, joka saadaan huippuarvon ilmaisuosalta, ja kun I * \ : laskettu S/N on yhtä suuri tai suurempi kuin määritelty S/N-arvo, se syöttää las- t ' } 25 ketun S/N-suhteen AND-osalle. AND-osa toimii tavalla jossa se ottaa loogisen 1; : tulon S/N-ilmaisuosalta tulevasta signaalista ja signaalinilmaisuosalta tulevasta : ; signaalista kytkimen ohjaamiseksi. Näin ollen, kun tulevan signaalin S/N-suhde on hyvä ja signaali esiintyy, AND-osa toimii lähtevän signaalin tuottamiseksi.
Esillä olevan keksinnön on tarkoitus tarjota sellainen laite, joka toimii t 30 vain tunnistettavan tulevan äänen esiintyessä, ilmaisten äänen tarkasti kepstri-analyysiä käyttämällä.
» : Esillä olevan keksinnön mukainen signaalinkäsittelylaite sisältää; äänianalyysiosan tulevan äänen analysoimista varten ja analysoidun signaalin lähettämistä varten, 35 sovitusosan analysoidun signaalin vertaamiseksi malliin ja tunnistet tu-signaalin lähettämiseksi, 6 115569 kepstrin laskentaosan kepstrin laskemiseksi tulevasta äänestä ja kepstrin lähettämistä varten, huippuarvon ilmaisuosan kepstrin huippuarvon ilmaisemiseksi ja huippuarvosignaalin lähettämistä varten, 5 äänenilmaisuosan äänen esiintymisen/puuttumisen ilmaisemiseksi signaalin huippuarvon avulla, ja ensimmäisen ohjaussignaalin lähettämiseksi sovitusosaan, ohjausosan toisen ohjaussignaalin lähettämiseksi sovitusosalle moo-dinasetustulossignaalin ja huippuarvon ilmaisuosalta tulevan huippuarvosignaa-10 Iin ohjaamana, ja huippuarvomuistin huippuarvosignaalin tallentamista varten; ja ohjausosan joka kirjoittaa huippuarvosignaalin huippuarvomuistiin moodiasetuksen "ASETUS" ohjaamana, ja joka kykenee vertaamaan huippuarvomuistin huippuarvosignaalia tulevan äänen kepstrin huippuarvosignaaliin 15 moodiasetuksen "TUNNISTUS" ohjaamana, jotta lähetettäisiin toinen ohjaussignaali joka vastaa kutakin verrattujen tulosten kefrenssieroa, ja sovitusosan joka lähettää tunnistettu-lähtösignaalin ensimmäisen ohjaussignaalin ja toisen ohjaussignaalin mukaisesti.
Esillä olevan keksinnön mukaisella rakenteella kepstrin laskentaosa 20 ilmaisee huippuarvon ilmaisuosan avulla tulevan äänen kepstrin huippuarvon. Tämän jälkeen äänenilmaisuosa ilmaisee äänen esiintymisen/puuttumisen il-: ’ maistun kepstrin huippuarvon perusteella ja syöttää ensimmäisen ohjaussignaa- * f ! v : Iin, joka vastaa äänen esiintymistä/puuttumista, sovitusosaan. Ohjausosa myös- ·.* · kin, kun moodin asetus on "REKISTERÖINTI", tallentaa huippuarvon ilmai- : 25 suosalta saadun kepstrin huippuarvosignaalin huippuarvomuistiin, ja kun moo- • :· · · din asetus on "TUNNISTUS", se vertaa huippuarvon ilmaisuosalta saatua kepst- ; rin huippuarvosignaalia huippuarvomuistiin talletettuun huippuarvosignaaliin ja syöttää toisen ohjaussignaalin vastaavan kefrenssierotuksen mukaisesti sovitusosaan. Äänianalyysiosa edelleen analysoi tulevan äänen käytettäväksi sovi-.' 30 tusosassa, joka puolestaan suorittaa analysoidun tulosignaalin sovitusproses- soinnin aiemmin rekisteröidyn datan kanssa tunnistettu-lähdön saamiseksi.
• Tuolla hetkellä sovitusprosessoinnin aloitusta ohjataan äänenilmaisuosalta ja ohjausosalta tulevilla ensimmäisellä ja toisella ohjaussignaalilla. Tämä tarkoittaa, että äänenilmaisuosalta tuleva ensimmäinen ohjaussignaali aloittaa sovitus-35 toiminnan, kun ääni ilmaistaan, kun taas ohjausosalta tuleva toinen ohjaussig-• ‘ naali aloittaa sovitustoiminnan silloin kun ohjausosa määrää, kun moodin asetus 7 115569 on "TUNNISTUS", jottei ole mitään eroa tulevan äänen kepstrin kefrenssin ja aiemmin muistiin rekisteröidyn huippuarvosignaalin kefrenssin välillä kun moodin asetus on "ASETUS".
Esillä olevan keksinnön tarkoituksena on tarjota sellainen laite, joka 5 tunnistaa tehokkaasti vain rekisteröidyn tulosignaalin useiden tulosignaalien joukosta, ilmaisemalla äänen tarkasti kepstriä käyttämällä.
Esillä olevan keksinnön mukainen signaalinkäsittelylaite sisältää; äänianalyysiosan tulevan äänen analysoimiseksi ja analysoitu-signaalin tuottamiseksi, 10 sovitusosan analysoidun signaalin vertaamiseksi malliin ja tunnistet tu-signaalin tuottamiseksi, kepstrin laskentaosan kepstrin laskemiseksi tulevasta äänestä ja kepstrin lähettämistä varten, huippuarvon ilmaisuosan kepstrin huippuarvon ilmaisemiseksi määrä-15 tyssä jaksossa ja huippuarvosignaalin tuottamista varten, äänenilmaisuosan äänen esiintymisen/puuttumisen ilmaisemiseksi huippuarvosignaalin avulla ja ensimmäisen ohjaussignaalin lähettämiseksi sovi-tusosaan, analyysijakson käsittelyosan analyysijakson ohjaamiseksi huippuar-20 von ilmaisuosaan, ja optimaalisen analyysijakson laskemiseksi vastaten kepstrin huippuarvoa ja jakson lähettämisen, ja : ' analyysijakson luokitteluosan analyysijakson luokittelemiseksi opti- ·’ maalisen analyysijakson perusteella ja jakson tallentamiseksi analyysijakson · muistiin; ja \* 25 analyysijakson joka ohjataan huippuarvon ilmaisuosaan analyysijak- ·;· i son käsittelyosan avulla ohjattavaksi analyysijakson luokitteluosan avulla moo- ; '. dinasetustulon moodin ohjaamana, analyysijakson luokitteluosan, joka tarkastaa optimaalisen jakson jak-somuistin analyysijakson dataa vastaan moodinasetustulon ohjaamana toisen 30 signaalin lähettämiseksi, joka vastaa tunnistettavaa äänisignaalia, sovitusosalle, ja joka luokittelee jaksomuistin analyysijakson datan ja ohjaa analyysijakson t • analyysijakson käsittelyosalle, ja sovitusosan joka käyttää ensimmäistä ja toista ohjaussignaalia tun-nistuskäsittelyn rajoittamiseksi tavalla, jossa se suoritetaan vain kun äänisignaali 35 esiintyy ja tulee tunnistaa.
8 115569
Esillä olevan keksinnön mukaisella rakenteella kepstrin laskentaosa ilmaisee huippuarvon ilmaisuosan avulla tulevan äänisignaalin kepstrin huippu-arvon analyysijaksossa, joka on määritelty analyysijakson käsittelyosalla. Ää-nenilmaisuosa ilmaisee äänen esiintymisen/puuttumisen kepstrin huippuarvon 5 perusteella ja syöttää ensimmäisen ohjaussignaalin sovitusosalle. Tuolla hetkellä huippuarvon ilmaisuosalle annettu analyysijakso on sellainen kuin alla on esitetty moodinasetustulon moodin mukaisesti. Ensiksi kun moodin asetus on "REKISTERÖINTI", analyysijakson käsittelyosa syöttää ennalta määrätyn analyysijakson huippuarvon ilmaisuosalle ja laskee optimaalisen analyysijakson vas-10 täten kepstrin huippuarvoa, lasketun jakson lähettämiseksi analyysijakson luokitteluosaan. Analyysijakson luokitteluosa suorittaa luokittelukäsittelyn alla esitetyn mukaisesti. Tämä tarkoittaa, että analyysijakson luokitteluosa vertaa optimaalista analyysijaksoa analyysijaksomuistiin, ja kun muistin jaksodatassa on analyysijakso, joka sisältää ja asettuu päällekkäin optimaalisen analyysijakson 15 kanssa suhteessa, joka on yhtä suuri tai suurempi kuin ennalta määrätty arvo (joka on määritelty samanlaisella analyysijaksolla), se syöttää samanlaisen analyysijakson analyysijakson käsittelyosan kautta huippuarvon ilmaisuosalle ja vertaa muistin analyysijaksoa analyysijaksoon, joka on yhdistetty kuten alla kuvatulla tavalla, tallentamista varten; kun muistin jaksodatassa taas ei ole mitään sa-20 manlaista analyysijaksoa, analyysijakson luokitteluosa kirjoittaa optimaalisen analyysijakson analyysijakson muistiin. Yhdistetty analyysijakson data sisältää • ; optimaalisen analyysijakson ja päälle asetetun osan analyysijaksosta joka on v : saatu muistidatasta, ja yhdistetyn analyysijakson alempi raja ja ylempi raja ovat t * jomman kumman yllä kuvatun analyysijakson sisällä. Silloin kun moodinasetus-25 tulo on "TUNNISTUS", analyysijakson käsittelyosa syöttää ennalta määrätyn , : analyysijakson huippuarvon ilmaisuosaan ja laskee optimaalisen analyysijakson : huippuarvoa vastaten lasketun jakson lähettämiseksi analyysijakson luokitte luosalle. Analyysijakson luokitteluosa vertaa optimaalista analyysijaksoa ana-lyysijaksomuistin suhteen. Tuolla hetkellä, kun optimaalisen analyysijakson ’ 30 kanssa samanlainen analyysijakso esiintyy muistissa, luokitteluosa syöttää muistin analyysijakson analyysijakson käsittelyosan kautta huippuarvon ilmai-• suosalle ja lähettää toisen ohjaussignaalin, joka vastaa tunnistettavaa signaalia; jos taas mitään sellaista jaksoa ei esiinny muistissa, ennalta määrätty ana- j., lyysijakso säilytetään sellaisena kuin se on huippuarvon ilmaisuosan ana- * > 35 lyysijaksolle.
t 9 115569
Toisaalta äänianalyysiosa analysoi tulevan äänen, joka vastaa sovi-tusosan analyysikäsittelyä, joka puolestaan suorittaa analysoidun tulevan datan sovituskäsittelyn aiemmin rekisteröidyn data kanssa tunnistettu-lähdön saamiseksi. Tuolla hetkellä sovituskäsittelyosaa ohjataan siten, että käsittely suorite-5 taan vain kun ensimmäinen ja toinen ohjaussignaali vastaavat äänisignaalin esiintymistä ja tunnistettavaa signaalia, vastaavasti.
Kuvio 1 on tekniikan tasona olevasta äänenilmaisulaitteesta;
Kuvio 2 on lohkokaavio esillä olevan keksinnön toteutuksessa olevasta äänenilmaisulaitteesta; 10 Kuvio 3 on lohkokaavio toisen esillä olevan keksinnön toteutuksessa olevasta äänenilmaisulaitteesta;
Kuvio 4 on kepstrin ominaiskaavio;
Kuvio 5 on lohkokaavio toisen esillä olevan keksinnön toteutuksessa olevasta äänenilmaisulaitteesta; 15 Kuvio 6 on ajasta riippuva kepstrin ominaiskaavio;
Kuvio 7 on lohkokaavio toisen esillä olevan keksinnön toteutuksessa olevasta äänenilmaisulaitteesta;
Kuvio 8 on lohkokaavio toisen esillä olevan keksinnön toteutuksessa olevasta äänenilmaisulaitteesta; 20 Kuvio 9 on kepstrin ominaiskaavio;
Kuvio 10 on lohkokaavio toisen esillä olevan keksinnön toteutukses- r: :.: : Kuvio 11 on kepstrin ominaiskaavio, joka kuvaa esillä olevan keksin- :,' i nön toteutuksen toimintaa; 25 Kuvio 12 on lohkokaavio toisen esillä olevan keksinnön toteutukses- ta;
Kuvio 13 on lohkokaavio toisen esillä olevan keksinnön toteutuksesta;
Kuvio 14 on lohkokaavio toisen esillä olevan keksinnön toteutukses- 30 ta;ja
Kuvio 15 on lohkokaavio toisen esillä olevan keksinnön toteutukses- I ta-
Piirroksia tarkastelemalla tullaan tämän jälkeen selittämään esillä .:. olevan keksinnön toteutus.
35 Kuviossa 2 esitetään lohkokaavio esillä olevan keksinnön toteutuk sessa olevasta äänenilmaisulaitteesta. Kuviota 2 tarkastelemalla tullaan selittä- 10 115569 mään laitteen rakenne ja toiminta. Äänisignaali syötetään kepstrin laskenta-osaan 1, joka toimii kepstrin laskentalaitteena, joka puolestaan muodostaa signaalin kepstrin.
Termiä "kepstri", joka saadaan termistä "spektri", symboloi tässä so-5 vellutuksessa c(t), ja se saadaan käänteisellä Fourier-muunnoksella lyhytaikaisen spektrin S(co) logaritmista.
M
c(t) = Σ log! S(&) m)!2 cos(tgo m) 10 m=0 τ:η mittana on aika ja x(aika):aa nimitetään "kefrenssiksi", joka saadaan sanasta "frekvenssi" (taajuus).
Osa kepstristä syötetään keskiarvon laskentaosalle 2, joka toimii 15 keskiarvon laskentalaitteena, joka puolestaan muodostaa kepstrin keskiarvon. Äänenilmaisuosaan 3, joka toimii äänenilmaisulaitteena, syötetään kepstrin las-kentaosalta 1 tuleva kepstri ja kepstrin keskiarvo keskiarvon laskentaosalta 2. Tämän jälkeen äänenilmaisuosa 3 ilmaisee kepstrin huippuarvon, joka on yhtä suuri tai suurempi kuin kesptrin keskiarvo, ilmaisee äänen esiintymisen/puut-20 tumisen huippuarvon avulla, ja kun kepstrin keskiarvon ylittävä kepstri on suurempi kuin kynnysarvon asetusarvo, se muodostaa ääni-ilmaistu-signaalin. Tuol-la hetkellä kynnysarvon asetusosa 4, joka toimii kynnysarvon asetuslaitteena, muodostaa huippuarvon ohjaussignaalin, jonka arvo on laskettu määritellyn yh-..: tälön mukaisesti kepstrin keskiarvon perusteella, joka tulee keskiarvon laskenta- ,··*’ 25 osalta 2, ja määrittelee äänen ilmaisun minimitason äänenilmaisuosassa 3 I · (‘ ‘ . kepstrin keskiarvon mukaisesti.
!,.* Esillä olevan yllä kuvatun toteutuksen mukaisesti laite voi ilmaista » » · v ' tarkasti kepstrin huippuarvon jopa häiriön esiintyessä, mikä siten sallii äänen il maisun suorittamisen suurella tarkkuudella.
i 30 Tämä tarkoittaa, että esillä olevalla keksinnöllä on rakenne, joka si- sältää kepstrin laskentaosan kepstrin arvon laskemiseksi äänisignaalista, kes-: kiarvon laskentaosan kepstrin keskiarvon laskemiseksi asetetun kefrenssin jak-
I I
sosta, äänenilmaisuosan kepstrin huippuarvon määrittämiseksi ja määritetyn arvon vertaamiseksi vertailuarvoon äänen esiintymisen/puuttumisen erottelemi-·' : 35 seksi, ja kynnysarvon asetusosan äänenilmaisuosan vertailuarvon asettamiseksi j käyttämällä kepstrin keskiarvoa, sillä seurauksella, että kepstrin huippuarvo voi- 11 115569 daan ilmaista tarkasti jopa häiriötä sisältävässä ympäristössä, mikä siten sallii äänen ilmaisun suorittamisen suurella tarkkuudella.
Piirroksia tarkastelemalla tullaan tämän jälkeen selittämään toisen esillä olevan keksinnön toteutus.
5 Kuviossa 3 esitetään lohkokaavio esillä olevan keksinnön toteutuk sessa olevasta äänenilmaisulaitteesta.
Kuviossa 4 esitetään kuviossa 3 olevan kepstrin laskentaosan kepst-ri, joka on esitetty verhokäyrällä todellisuudessa diskreetteihin arvoihin perustuen. Selitetään kuviossa 3 ja 4 esitetyn esillä olevan toteutuksen mukaisen ää-10 nenilmaisulaitteen rakenne ja toiminta. Ensin äänisignaali syötetään kepstrin laskentaosaan 5, joka puolestaan muodostaa kepstrin. Sen jälkeen osa kepstris-tä syötetään keskiarvon laskentaosaan 7, joka puolestaan muodostaa kepstrin keskiarvotason m kefrenssijaksossa a - b, joka on esitetty kuviossa 3. Kepstrin summausosaan 8 syötetään kepstrin laskentaosalta 5 tuleva kepstri ja kepstrin 15 keskiarvo keskiarvon laskentaosalta 7. Sen jälkeen kepstrin summausosa 8 summaa kepstrin arvon, joka on yhtä suuri tai suurempi kuin kepstrin keskiarvo-taso m kefrenssin leveydellä w kefrenssijakson a - b alueella, ja syöttää kepstri-summattu-tuloksen komparaattorille 9. Komparaattorille 9 syötetään kepstri-summattu-tulos kepstrin summausosalta 8 ja asetettu lähtöarvo kynnystason 20 asetusosalta 10, ja kun kepstri-summattu-tulos on suurempi kuin kynnysarvon asetusarvo, se antaa ääni-ilmaistu-signaalin. Tuolla hetkellä kynnysarvon ase- • ♦ : ·' tusosa 10 laskee kynnysarvon määritellyn yhtälön mukaisesti kepstrin keskiarvo- : tason m, joka on esitetty kuviossa 4, mukaisesti, ja syöttää kynnysarvon ase- :.'i tusarvon verrattavaksi kepstri-summattu-tuloksen kanssa komparaattoriin 9.
•\ 25 Esillä olevan keksinnön mukaisesti, kuten yllä kuvattiin, kepstrin *:**: huippuarvo voidaan ilmaista tarkasti ja riippuvuus kepstrin muodosta kepstrin ; huippuarvon lähellä tulee pienemmäksi siten, että kyky kepstrin huippuarvon il maisuun tulee suureksi, mikä siten sallii äänen ilmaisun suorittamisen suurella • tarkkuudella. Kynnysarvon asettaminen kepstrin keskiarvon mukaiseksi myöskin » : .* 30 sallii äänen ilmaisun suorittamisen riippumatta tulevan signaalin suuruudesta.
Tämä tarkoittaa, että äänenilmaisuosassa sallitaan olevan rakenteen, • · joka sisältää kepstrin summausosan kepstrin lisäämiseksi, kun se on suurempi kuin kepstrin keskiarvo, ja komparaattorin kynnysarvon asetusosalta tulevan asetusarvon vertaamiseksi kepstrin summausosalta tulevan summatun tuloksen 35 kanssa äänen ilmaisun suorittamiseksi, sillä vaikutuksella, että huippuarvon il-·’ maisun riippuvuus kepstrin huippuarvon muodosta tulee vähäisemmäksi, mikä 12 115569 siten sallii äänen ilmaisun suorittamisen suurella tarkkuudella. Vaikutuksena edelleen on, että kynnysarvon asetusarvon määrittäminen kepstrin keskiarvon mukaan sallii äänen ilmaisun suorittamisen riippumatta tulevan signaalin suuruudesta.
5 Piirroksia tarkastelemalla tullaan tämän jälkeen selittämään toisen esillä olevan keksinnön toteutus.
Kuviossa 5 esitetään lohkokaavio äänenilmaisulaitteesta esillä olevan keksinnön toteutuksessa, ja kuviossa 6 esitetään kepstrin laskentaosan 11 lähtevä kepstri. Kuviossa 6 a - b ilmaisee kefrenssijakson, m1 ja mn ovat kepstrin 10 keskiarvoja jaksossa a - b hetkillä t1 ja tn, ja w on huippuarvon ilmaisuleveys. Käyttämällä kuviota 6 tullaan selittämään kuviossa 5 esitetyn toteutuksen rakenne ja toiminta. Ensiksi äänisignaali syötetään kepstrin laskentaosaan 11, joka puolestaa tuottaa kepstrin lähtöarvon. Osa kepstrin lähtöarvosta syötetään keskiarvon laskentaosaan 13, joka puolestaan muodostaa kepstrin keskiarvon kef-15 renssijaksossa a - b, joka on esitetty kuviossa 6. Muistiryhmälle 17, jossa on joukko n muistipaikkoja, syötetään kepstrin keskiarvo keskiarvon laskentaosalta 13, se tallentaa kepstrin keskiarvosta m1 lähtien hetkellä t1 arvot kepstrin keskiarvoon mn saakka hetkellä tn, kuten kuviossa 6 on esitetty, ja syöttää tallennetut arvot kepstrin summausosaan 14. Muistiryhmä 16, jossa on joukko n muisti-20 paikkoja joihin syötetään kepstrin lähtöarvo kepstrin laskentaosalta 11, tallentaa kepstrin arvosta hetkellä t1 arvoon hetkellä tn saakka ja syöttää tallennetut arvot ' ·* kepstrin summausosaan 14. Kepstrin summausosalle 14 syötetään muistilta 16 v : tuleva kepstri ja kepstrin keskiarvo muistilta 17, se summaa kepstrin arvot jotka ·,’·: ovat suurempia kuin kepstrin keskiarvo kullakin hetkellä hetkestä t1 hetkeen tn 25 saakka ja kefrenssijakson a - b leveydeltä w, kuten kuviossa 6 on esitetty, ja ·:**: syöttää kepstri-summattu-tuloksen komparaattorille 15. Komparaattorille 15 syö- tetään kepstri-summattu-tulos kepstrin summausosalta 14 ja kynnysarvo-asetettu-arvo, jonka kynnysarvon asetusosa 18 on laskenut, ja kun kepstri-sum- • >( mattu-tulos on suurempi kuin kynnysarvo-asetettu-arvo, se lähettää ääni- 30 ilmaistu-signaalin. Tuolla hetkellä kepstrin keskiarvon mukaisesti hetkien t1 ja tn välillä, jotka on esitetty kuviossa 6, kynnysarvon asetusosa 18 syöttää kynnysar->; vo-asetettu-arvon verrattavaksi kepstri-summattu-tuloksen kanssa komparaatto riin 15. Muistiryhmät 16 ja 17 ovat sellaisessa tilassa, että kun uutta syöttöarvoa syötetään muistiryhmiin, vanha data siirretään seuraavaan muistipaikkaan, siten ; 35 että useita datoja voidaan aina tarkastella rinnakkaisesti. Esillä olevan yllä kuva- • · 13 115569 tun toteutuksen mukaisesti kepstrin huippuarvon ajasta riippuvien muutosten tarkastelu sallii tarkemman äänen ilmaisun suorittamisen.
Kuten yllä olevasta selityksestä ilmenee, esillä olevalla keksinnöllä on rakenne, joka sisältää kepstrin laskentaosan kepstrin arvon laskemiseksi ää-5 nisignaalista, keskiarvon laskentaosan kepstrin keskiarvon laskemiseksi asetetun kefrenssin jaksossa, äänenilmaisuosan kepstrin huippuarvon määrittämiseksi ja määritetyn arvon vertaamiseksi vertailuarvoon äänen esiintymisen/puuttu-misen erottamiseksi, ja kynnysarvon asetusosan äänenilmaisuosan vertailuarvon asettamiseksi käyttämällä kepstrin keskiarvoa, sillä vaikutuksella että kepst-10 rin huippuarvo voidaan ilmaista tarkasti jopa häiriötä sisältävässä ympäristössä, mikä siten sallii äänen ilmaisun suorittamisen suurella tarkkuudella.
Tämä tarkoittaa, että äänenilmaisuosalfa sallitaan olevan rakenne, joka sisältää ensimmäisen muistiryhmän, joka muodostuu n joukosta kepstrin tallentamista varten, toisen muistiryhmän joka muodostuu n joukosta kepstrin 15 keskiarvon tallentamista varten, kepstrin summausosan kepstrien summaamiseksi kun ne ovat suurempia kuin kepstrin keskiarvo, ja komparaattorin ase-tusarvon, joka tulee kynnysarvon asetusosalta, vertaamiseksi kepstrin sum-mausosalta tulevan summatun tuloksen kanssa, sillä vaikutuksella, että datan akkumulointi ajallisessa sarjassa muistiryhmiin sallii kepstrin ajasta riippuvien 20 muutoksien ilmaisemisen ja tarkemman äänen ilmaisemisen suorittamisen.
Piirroksia tarkastelemalla tullaan tämän jälkeen selittämään toisen : ·' esillä olevan keksinnön toteutus.
v : Kuviossa 7 esitetään lohkokaavio toisen esillä olevan keksinnön mu- :: kaisessa toteutuksessa olevasta äänenilmaisulaitteesta.
25 Piirrosten mukaisesti tullaan selittämään laitteen rakenne ja toiminta.
·:·: Ensiksi tuleva ääni syötetään kepstrin laskentaosaan 71, joka toimii kepstrin las- kentalaitteena, joka puolestaan tuottaa kepstrin. Kepstri syötetään huippuarvon ilmaisuosaan 72, joka toimii huippuarvon ilmaisulaitteena, joka puolestaan antaa : kepstrin huippuarvon analyysijaksossa, jota analyysin asetusosa 73 ohjaa. Ää- a 30 nenilmaisuosa 74, joka toimii äänen ilmaisulaitteena, vertaa kepstrin huippuarvoa ennalta määrättyyn kynnysarvoon, ja kun se ilmaisee tulevan signaalin ole-• van ääni, se antaa ääni-ilmaistu-signaalin. Tuolla hetkellä analyysijakson ase- tusosa 73, joka toimii analyysijakson asetuslaitteena, johtaa analyysijakson ^ huippuarvon ilmaisuosaan 72, ja analyysijakson asetusosaa 73 ohjataan toimin- 35 tamoodin asetussignaalilla alla kuvattavalla tavalla. Ensiksi ensimmäisessä toi-mintamoodissa analyysijakson asetusosa 73 ohjaa ennalta määrätyn kefrenssi- 14 115569 analyysijakson huippuarvon ilmaisuosaan 72 ja asettaa kefrenssianalyysijakson, joka ohjataan huippuarvon ilmaisuosaan 72 toisessa toimintamoodissa kepstrin huippuarvon ohjaama, joka saadaan huippuarvon ilmaisuosalta 72. Sen jälkeen toisessa toimintamoodissa analyysijakson asetusosa 73 ohjaa analyysijakson, 5 joka on asetettu ensimmäisen toimintamoodin aikana, huippuarvon ilmaisuosaan 72.
Siirtymä ensimmäisestä moodista toiseen moodiin voidaan suorittaa joko manuaalisen toiminnan moodinasetussignaalilla, tai muodostamalla automaattisesti toimintamoodin asetussignaali sen jälkeen, kun määrätty aika on kulo lunut tai määrätty määrä äänenilmaisusignaaleja on lähetetty.
Yllä kuvatun esillä olevan toteutuksen mukaisesti huippuarvon analyysijakson asetus voidaan asettaa aiemmin siten, että analyysijakso kepstrin huippuarvon määrittämiseksi voidaan kaventaa käsittelynopeuden parantamiseksi. Myöskin ilmaistavan kepstrin huippuarvon alue ilmaistaan ensimmäisessä 15 toimintamoodissa, ja puhuja kaventaa sitä, mikä siten sallii tarkan äänen ilmaisun samalle ilmaistavalle puhujalle. Edelleen havaitaan, että vaikka ääni on väliaikaisesti päällekkäin toisen ääni/häiriösignaalin kanssa, ilmaistavan kepstrin huippuarvon alue tulee kaventaa, mikä siten sallii tarkan äänen ilmaisun suorittamisen.
20 Tämä tarkoittaa, mikä on ilmeistä yllä olevasta selityksestä, että esillä . oleva keksintö sisältää kepstrin laskentalaitteen tulevan äänen kepstrin laske- : mistä varten, huippuarvon ilmaisulaitteen kepstrin laskentalaitteen lähtevän kepstrin huippuarvon ilmaisemista varten, analyysijakson asetuslaitteen ana- * · lyysijakson asettamiseksi huippuarvon ilmaisulaitteen huippuarvo-ilmaistu- * »» 25 lähdön ja toimintamoodin asetussignaalin avulla, ja äänenilmaisuosan, johon •: ·: huippuarvon ilmaisulaitteen huippuarvo-ilmaistu-lähtösignaali syötetään, ja huip- puarvon ilmaisulaitteen huippuarvon ilmaisjaksoa ohjataan analyysijakson asetuslaitteen asettamalla lähtöarvolla siten, että kepstrin huippuarvon analyysijak- , ·. so voidaan aiemmin asettaa optimaalisesti ja kaventaa moodia siirtämällä, mikä .* 30 siten sallii kepstrin huippuarvon määrittämiseksi tarvittavan käsittelyn nopeuden parantamisen. Myöskin kepstrin huippuarvon, joka ilmaistaan puhujan mukai-• sesti, alueen kaventaminen sallii tarkan äänen ilmaisun suorittamisen samalle / puhujalle. Edelleen analysoitavan kepstrin huippuarvo kaventuu jopa, kun ääni on asetettu päällekkäin häiriön kanssa, mikä siten sallii erittäin tarkan äänen il-35 maisun suorittamisen ja erinomaisen käytettävyyden saavuttamisen.
15 115569
Piirroksia tarkastelemalla tullaan tämän jälkeen selittämään eräs esillä olevan keksinnön toteutus.
Kuvion 8 mukaisesti tullaan selittämään laitteen rakenne ja toiminta. Ensiksi kepstrin laskentaosa 75 muodostaa kepstrin tulevasta äänestä ja syöt-5 tää kepstrin huippuarvon ilmaisuosalle 76. Huippuarvon ilmaisuosa 76 ilmaisee kepstrin huippuarvon syötetystä kepstristä, ja sitä ohjataan sillä tavoin että kepstrin laskentaosalta 75 syötetyn kepstrin huippuarvoilmaisun leveyttä ohjataan käyttämällä kefrenssijakson dataa, joka saadaan toisen kytkimen 712 läpi jaksodatan muistiosalta 711. Äänenilmaisuosa 714 suorittaa äänen ilmaisun 10 kepstrin huippuarvosta, joka saadaan huippuarvon ilmaisuosalta 76, ennalta määrätyn kynnysarvon perusteella, ja ilmaistessaan tulevan signaalin olevan ääni, se lähettää ääni-ilmaistu-signaalin. Tuolla hetkellä jaksodatan asetusosa 78 asettaa kefrenssijakson ilmaistavaksi kepstrin huippuarvon perusteella, joka saadaan huippuarvon ilmaisuosalta 76. Jaksodata, joka on asetettu jaksodatan 15 asetusosalta 78, kirjoitetaan ensimmäiseen muistiryhmään 79 kytkemällä ensimmäinen kytkin 713 pois päältä ohjausosalta 77 tulevalla ohjaussignaalilla toimintamoodin ohjaamana. Ohjausosa 77 ohjaa, kuten yllä on kuvattu, ensimmäistä kytkintä 713 ja ohjaa myös toista kytkintä 712 toimintamoodin ohjaamana. Toista kytkintä 712 ohjataan sillä tavoin, että kytkin yhdistetään ensimmäi-20 seen muistiryhmään 79 silloin kun ensimmäinen kytkin 713 on pois päältä, ja se yhdistetään toiseen muistiryhmään 710 kun ensimmäinen kytkin 713 on päällä. .* Jaksodatan muistiosan 111 ensimmäisen muistiryhmän 79 ja toisen muistiryh- : män 710 jaksodata syötetään toisen kytkimen 712 läpi huippuarvon ilmaisuosal- · le 76 analyysijakson datana toimintamoodin ohjaamana. Jaksodata on aiemmin : [: 25 asetettu toisessa muistiryhmässä 710.
• Kuviota 9 tarkastelemalla jaksodata, joka on syötetty huippuarvon il- ’. maisuosaan 76, tullaan selittämään yksityiskohtaisesti tämän jälkeen.
Kepstrin laskentaosalta 75 saatu kepstri on esitetty kuviossa 9, ja se ·, on esitetty verhokäyrällä todellisuudessa diskreeteistä arvoista. Vertailusymboli 30 p ilmaisee kepstrin huippuarvon kefrenssin, aO - bO ilmaisee analyysijakson, joka on aiemmin tallennettu toiseen muistiryhmään 710, ja a1 - b1 ilmaisee ana-j lyysijakson joka on tallennettu ensimmäiseen muistiryhmään 79. Tulevalla ää- neliä kepstrin huippuarvo sijoittuu kefrenssin kohtaan p, kuten kuviossa 9 on esi-:·. tetty.
35 Ensiksi tarkastellaan tapausta, jossa ensimmäisen moodin aikana toinen kytkin 712 on kytketty toiseen muistiryhmään 710, ja ensimmäinen kytkin 16 115569 713 on kytketty ensimmäiseen muistiryhmään. Tuossa tapauksessa, tulevan äänen esiintyessä, koska toinen kytkin 712 on kytketty toiseen muistiryhmään 710, huippuarvon ilmaisuosa 76 määrittää kepstrin huippuarvon toisen muistin sisällön jaksodatassa aO - bO, ja saa kepstrin huippuarvon kefrenssin p. Jakso-5 datan asetusosa 78 valitsee, käyttämällä kefrenssiä p, joka on huippuarvon il-maisuosalla 76 saatu kepstrin huippuarvo, arvon lähellä kefrenssiä p jaksodatan a1 - b1 määrittämiseksi, ja tallentaa jaksodatan a1 - b1 ensimmäisen kytkimen 713 läpi ensimmäiseen muistiryhmään 79. Sen jälkeen, tarkastelemalla tapausta, jossa toisessa toimintamoodissa toinen kytkin 712 on kytketty ensimmäiseen 10 muistiryhmään 79, ja ensimmäinen kytkin 713 on pois päältä. Tuossa tapauksessa, koska toinen kytkin on kytketty ensimmäiseen muistiryhmään 79, huippuarvon ilmaisuosa 76 ilmaisee kepstrin huippuarvon ensimmäisen muistin jaksodatassa a1 - b1, joka on kuvattu kuviossa 7.
Esillä olevan toteutuksen mukaisesti, kuten yllä kuvattiin, kepstrin 15 huippuarvon analyysijakso on aiemmin asetettu muistiin tallennettavaksi siten, että optimaalinen kepstrin huippuarvon analyysijakso voidaan aina tuottaa, ja nollaus kapeammalle analyysijaksolle ilmaistun tuloksen mukaisesti, mikä siten sallii käsittelyajan lyhentämisen ja äänen ilmaisun suorittamisen suurella tarkkuudella häiriön eston suhteen. Huomataan myös, että kun analyysijakso on 20 kerran asetettu, analyysijakso on aina voimassa, mikä siten sallii tehokkaan ää- ,, , nenilmaisukäsittelyn suorittamisen erinomaisella käytettävyydellä.
* · : Muistiryhmiä ei rajoiteta kahteen joukkoon, ja mitään ongelmaa ei v : esiinny, vaikka lisäjoukko lisätään tarvittaessa ryhmiin, joista joukkoa käytetään •Yi selektiivisesti.
t I t 7.: 25 Tämä tarkoittaa, että edellisen esillä olevan keksinnön analyysijakson : i asetuslaitteen sijasta esillä oleva keksintö sisältää jaksodatan asetuslaitteen, : 7: useita muistiryhmiä, ensimmäisen kytkimen jaksodatan kytkemiseksi ensimmäi seen muistiin, toisen kytkimen jaksodatan valitsemiseksi muistiryhmistä ja datan syöttämiseksi huippuarvon ilmaisuosalle, ja ohjausosan ensimmäisen ja toisen / 30 kytkimen ohjaamiseksi toimintamoodin ohjaamana siten, että kepstrin ana lyysijakso kapenee ennalta määrätyn analyysijakson ja tulosignaalin ohjaamana • samalla tavoin kuin edellisessä esillä olevassa keksinnössä, ja muistiryhmien määrän kasvu sallii analyysijakson asettamisen useilla tavoilla.
*, Kuviossa 10 esitetään lohkokaavio toisen esillä olevan toteutuksen 35 äänenkäsittelylaitteesta. Kuten kuviossa 10 on esitetty, kepstrin laskentaosa 81 laskee tulevan äänen kepstrin ja syöttää lasketun kepstrin huippuarvon ilmai- 17 115569 suosaan 82, ja huippuarvon ilmaisuosa 82 ilmaisee kepstrin huippuarvon ana-lyysijaksossa, joka on syötetty analyysijakson asetusosalta 84, ja se syöttää huippuarvon äänenilmaisuosalle 83 ja äänijakson asetusosalle 84. Äänenil-maisuosa 83 ilmaisee äänen esiintymisen/puuttumisen kepstrin huippuarvosta, 5 joka on syötetty huippuarvon ilmaisuosalta 82, ääni-ilmaistu-lähtöarvon saamiseksi. Äänijakson asetusosa 84 laskee optimaalisen analyysijakson kepstrin huippuarvon ohjaamana, joka on syötetty huippuarvon ilmaisuosalta 82, ja syöttää lasketun arvon analyysijakson luokitteluosaan 85, ja syöttää edelleen analyysijakson datan, joka on syötetty analyysijakson muistista 86, analyysijakson 10 luokitteluosan 85 toimesta moodinasetustulon ohjaamana, tai ennalta määrätyn analyysijakson datan huippuarvon ilmaisuosalle 82. Analyysijakson luokitteluosa 85 vertaa optimaalista analyysijakson dataa analyysijakson dataan, joka on tallennettu analyysijakson muistiin 86, luokittelukäsittelyn suorittamiseksi ja tallentaa datan analyysijakson muistiin 86 moodinasetustulon ohjaamana tai lukee 15 datan analyysijakson muistista 86 analyysijakson ohjaamista varten.
Selitetään rakenteeltaan yllä olevan kaltaisen laitteen toiminta.
Tuleva ääni lasketaan sen kepstristä kepstrin laskentaosalla 81, ilmaistaan sitten kepstrin huippuarvon osalta huippuarvon ilmaisuosalla 82, ilmaistaan sitten äänen esiintymisen/puuttumisen osalta äänenilmaisuosalla 83, ja lähete-20 tään ääni-ilmaistu-signaalina. Tuolla hetkellä huippuarvon ilmaisuosa 82 toimii sillä tavoin, että osa 82 määrää kefrenssin kepstrin huippuarvon määrittämiseksi t · ·' analyysijakson mukaisesti, joka on syötetty äänijakson asetusosalta 84, huippu- : arvon ilmaisun suorittamiseksi. Kuviota 11 tarkastelemalla tullaan tämän jälkeen selittämään analyysijakson asetusosan 84, analyysijakson luokitteluosan 85 ja 25 analyysijakson muistin 86 toiminta. Keps-trin laskentaosan määrittämä kepstri on ·:«: esitetty kuviossa 11, jossa ordinaatan akseli edustaa kepstrin tasoa ja abskissa . ‘: esittää kepstriä. Viitesymbolit p1 ja p2 osoittavat kefrenssiarvot, jotka on määrätty huippuarvon ilmaisuosalla 82, ja jaksot aO - bO, a2 - b2 ja a3 - b3 osoittavat ana- • ,·, lyysijaksoja, jotka on lähetetty analyysijakson asetusosasta 84, analyysijakson » · 30 muistista 86 ja analyysijakson luokitteluosalta 85, vastaavasti. Ensiksi, kun moodin asetustulo on tilassa "REKISTERÖINTI", analyysijakson asetusosa 84 syöttää • leveimmän analyysijakson aO - bO huippuarvon tunnistusta varten huippuarvon ilmaisuosaan 82, ja kepstri, jonka huippuarvo on kefrenssillä p1, joka on osoitettu ehjällä viivalla kuviossa 11, tulevan äänen ohjaamana, saadaan huippuarvon il-35 maisuosasta 82. Analyysijakson asetusosa 84 laskee optimaalisen analyysijak-son a3 - b3, joka on kapeampi kuin analyysijakso aO - bO, kefrenssin p1 suhteen, 18 115569 ja syöttää lasketun jakson analyysijakson luokitteluosaan 85. Analyysijakson luokitteluosa 85 vertaa optimaalista analyysijaksoa analyysijakson muistin 86 sisältämään analyysijaksoon, ja kun analyysijaksoa, joka sisältää optimaalisen analyysijakson, jonka osuus on yhtä suuri tai suurempi kuin ennalta määrätty arvo 5 (joka määritellään samanlaiseksi analyysijaksoksi), ei esiinny, se tallentaa optimaalisen analyysijakson a3 - b3 analyysijakson muistiin 86, kun taas silloin kun analyysijakso esiintyy, se korvaa samanlaisen analyysijakson yhdistetyllä alla kuvattavalla analyysijaksolla, ja tallentaa yhdistetyn analyysijakson. Yhdistetty analyysijakso on analyysijakso, joka sisältää päällekkäin asetetun optimaalisen ana-10 lyysijakson ja muistin analyysijakson muodostaman yhdistetyn analyysijakson, ja jonka alemmat ja ylemmät rajat sisältyvät kumpaankin yllä kuvatuista jaksoista.
Sen jälkeen, kun moodin asetukseksi tulee "TUNNISTUS" analyysijakson a3 - b3 ollessa tallennettuna muistiin, analyysijakson asetusosa 84 syöttää ennalta määrätyn jakson aO - bO tai muistin analyysijakson, joka on le-15 veämpi kuin aO - bO, huippuarvon ilmaisuosalle 82.
Nyt olettamalla, että kepstri, jolla on huippuarvo kefrenssillä p1, saadaan tulevan äänen seurauksena, kuten katkoviivalla kuviossa 11 on esitetty, huippuarvon ilmaisuosalta 82, analyysijakson asetusosa 84 laskee analyysijakson a3 - b3 p1:n ohjaamana, analyysijakson luokitteluosa 85 tarkistaa ana-20 lyysijakson esiintymisen, joka on samanlainen kuin analyysijakso a3 - b3 ana-,, , lyysijakson muistissa 86, ja koska jakso esiintyy tuossa tapauksessa, huippuar- > i · : von ilmaisuosalle 82 syötetään analyysijakso a3 -b3 muistista 86. Tuolla hetkel- : lä, koska analyysijakso on rajoitettu lähellä huippua olevaan arvoon, huippuar- :.' j von ilmaisu huippuarvon ilmaisuosalla 82 voidaan käsitellä suurella nopeudella.
25 Kun tuleva ääni, jolla on huippuarvo kefrenssillä p2, esiintyy, analyysijakson ase- .* i tusosa 84 laskee optimaalisen analyysijakson a2 - b2, analyysijakson luokitte- :' ·luosa 85 tarkistaa jakson, joka on samanlainen kuin optimaalinen analyysijakso ja koska jaksoa ei esiinny tuossa tapauksessa, analyysijaksona, joka syötetään huippuarvon ilmaisuosalle 82, säilyy aO - bO.
V 30 Esillä olevan yllä kuvatun keksinnön toteutusten mukaisissa äänen käsittelylaitteissa analyysijakso useiden puhujien äänestä luokitellaan ryhmään t * tai yksittäiseksi, kun "REKISTERÖITY", jolloin analyysijakso huippuarvon ilmai- : sulle voidaan määritellä ja asettaa tunnistettaessa. Näin ollen äänen ilmaisu voi daan käsitellä suurella nopeudella ja analyysijakso luokitellaan ja määritellään, 35 jolloin toiminta voidaan suorittaa tehokkaasti häiriön eston suhteen, kun kepstrin huippu ilmaistaan, ja tarkka äänen ilmaisu voidaan suorittaa.
19 115569
Kuten yllä olevista toteutuksista on ilmeistä, esillä olevan keksinnön signaalinkäsittelylaitteella on rakenne, joka sisältää analyysijakson asetusosan optimaalisen analyysijakson laskemiseksi huippuarvon ilmaisuosan antaman lähtevän huippuarvon ohjaamana, ja analyysijakson syöttämiseksi moo-5 dinasetustulon ohjaamana huippuarvon ilmaisuosalle, ja analyysijakson luokitteluosan optimaalisen analyysijakson luokittelemiseksi, joka on laskettu analyysijakson asetusosalla, ja analyysijakson tallennettuna analyysijakson muistiin jonoon; ja sillä on vaikutuksena, että koska useiden puhujien ääni, joka ei rajoitu yksittäiseen ääneen, luokitellaan ja kepstrin huipun analyysijakso asetetaan 10 ryhmittäin tai yksittäin rekisteröitäessä, jolloin kepstrin huippuarvon analyysijakso tunnistettaessa voidaan määritellä suorittamaan suurinopeuksinen käsittely. Laitteella on myös sellainen toinen erinomainen vaikutus, että analyysijakso luokitellaan ryhmiin tai yksittäin, jolloin jopa häiriön esiintyessä ilmaistaessa kepstrin huippuarvoa saadaan erittäin hyvä äänenilmaisutoiminta, mikä sallii tarkan ää-15 nen ilmaisun suorittamisen.
Kuviota 12 tarkastellen tullaan tämän jälkeen selittämään toisen esillä olevan keksinnön toteutus.
Kuten kuviossa 12 on esitetty, tehonlaskentaosalle 91 syötetään tuleva ääni, se laskee sen tehon ja syöttää lasketun tehon S/N-laskentaosaan 94. 20 Kepstrin laskentaosalle 92 syötetään myös tuleva ääni, se laskee kepstrin ja syöttää kepstrin huippuarvon ilmaisuosalle 93. Huippuarvon ilmaisuosa 93 ilmai-i see kepstrin huippuarvon ja syöttää huippuarvon S/N-laskentaosalle 94 ja ää- :: : nenilmaisuosalle 95. Äänenilmaisuosa 95 ilmaisee äänen esiintymisen/ puuttu- ‘.' ·; misen huippuarvon ilmaisuosan 93 kepstrin huipusta ja syöttää tuloksen AND- : 25 osalle 96. S/N-laskentaosalle 94 syötetään teho tehonlaskentaosalta 91 ja :··· kepstrin huippuarvo huippuarvon ilmaisuosalta 93, ja se laskee S/N-suhteen ;·. syötetystä datasta ja syöttää lasketun tuloksen parempi/heikompi-tuloksen las ketusta tuloksesta määriteltynä arvona AND-osalle 96. AND-osa 96 on rakennettu silla tavoin, että se ottaa loogisen tulon äänenilmaisuosalta 95 ja S/N-30 laskentaosalta syötetyistä signaaleista kytkimen 97 ohjaamiseksi.
Selitetään yllä olevan rakenteen mukaisen laitteen toiminta.
• i Tulevasta äänisignaalista lasketaan sen teho tehonlaskentaosalta 91 ja siitä ilmaistaan kepstrin huippuarvo kepstrinlaskentaosalla 92 ja huippuarvon ilmaisuosalla 93. Äänenilmaisuosa 95 ilmaisee kepstrin huippuarvoa käyttämällä 35 äänisignaalin esiintymisen/puuttumisen ja syöttää äänisignaalin esiintymis-tä/puuttumista osoittavan signaalin AND-osalle 96. Käyttämällä äänisignaalin tu- 20 115569 lotehoa, joka saadaan tehonlaskentaosalta 91, ja kepstrin huippuarvoa, joka saadaan huippuarvon ilmaisuosalta 93, S/N-laskentaosa 94 laskee tulevan äänisignaalin S/N-suhteen, ilmaisee onko S/N-suhde yhtä suuri tai suurempi kuin määritelty arvo, tai pienempi kuin määritelty arvo, ja syöttää ilmaistun signaalin 5 AND-osalle 96. AND-osa 96 toimii siten että osa 96, vain kun se saa signaalin, joka osoittaa, että tulevan äänisignaalin S/N-suhde on yhtä suuri tai suurempi kuin määritelty arvo joka saadaan S/N-laskentaosalta 94, ja kun se saa signaalin, joka ilmaisee, että ääni esiintyy äänen ilmaisulta 95 äänisignaalitulossa, syöttää signaalin kytkimen 97 kääntämiseksi päälle kytkimeen 7 ja sallii tulevan ää-10 nisignaalin läpäistä, jotta saadaan lähtevä äänisignaali.
Esillä olevan keksinnön toteutuksen signaalinohjauslaitteen mukaisesti tulokseksi saadaan, että lähtevä äänisignaali saadaan vain kun ääni esiintyy äänisignaalin tulossa ja sen S/N-suhde on hyvä, joten äänisignaalin tulon häiriöteho on suuri, lähtevää äänisignaalia ei saada. Toisena ilmiönä on myös, 15 että saadulla lähtevällä äänisignaalilla on hyvä S/N-suhde, jolloin kun lähtevä äänisignaali syötetään äänentunnistuslaitteeseen ja vastaavaan, voidaan saada hyvä tulos. Silloin esillä olevaa keksintöä voidaan soveltaa muuhunkin signaalin kuin äänisignaaliin.
Tämä tarkoittaa yllä olevassa toteutuksessa, että esillä oleva keksintö 20 sisältää S/N-laskentaosan S/N-suhteen laskemiseksi tulevan signaalin tehoi-neen ja kepstrin huippuineen, ja signaalinilmaisuosan signaalin ilmaisemiseksi ·' tulevan signaalin kepstrin huippuarvosta, ja sillä on rakenne, jossa on AND-osa v : loogisen tulon ottamiseksi S/N-laskentaosalta tulevasta S/N-suhteesta ja signaa- linilmaisuosalta tulevasta ilmaistusta lähtöarvosta, se syöttää signaalin kytkimen 25 ohjaamiseksi ja ohjaa tulevan signaalin läpikulkua lähtevän signaalin saamisek-• si, jolloin vain signaalin esiintyessä tulossa ja kun sen S/N-suhde on hyvä, lähte- \ vä signaali voidaan lähettää.
Näin ollen saadaan ilmiö, että jos tulevan signaalin häiriöteho on suu-., ri, lähtevää signaalia ei lähetetä. Vaikutuksena on myös, että koska saadun läh- 30 tevän signaalin S/N-suhde on hyvä, hyvä tulos voidaan saada kun lähtevä sig-γ’ naali syötetään äänentunnistuslaitteeseen ja vastaavaan.
, ; Kuviota 13 tarkastelemalla tullaan tämän jälkeen selittämään toisen ; esillä olevan keksinnön toteutuksen signaalinohjauslaite. Toteutus on samanlai- .;. nen kuin kuviossa 12.
35 Kuviossa 13 laite on rakennettu siten, että komparaattori 913 vertaa ♦ * '···' tehonlaskentaosalta 98 tulevaa tehoa tulevaan vertailusignaaliin ja syöttää ver- 21 115569 ratun tuloksen AND-osaan 114. AND-osa 114 ottaa loogisen tulon äänenil-maisuosalta 912, S/N-laskentaosalta ja komparaattorilta 913 syötetyistä signaaleista kytkimen 915 ohjaamista varten.
Selitetään laitteen, jolla on yllä kuvattu rakenne, toiminta.
5 Tehonlaskentaosa 98 laskee tulevan äänisignaalin tehon ja sen jäl keen komparaattori 913 ilmaisee, onko teho yhtä suuri tai suurempi kuin määritelty arvo, tai pienempi kuin määritelty arvo, ja syöttää ilmaistun signaalin AND-osalle 114. Kepstrin laskentaosa 99 ilmaisee huippuarvon ilmaisuosan 910 avulla tulevan äänisignaalin kepstrin huippuarvon. Kepstrin huippuarvoa käyttämällä 10 äänenilmaisuosa 912 ilmaisee äänisignaali esiintymisen/puuttumisen ja syöttää signaalin, joka ilmaisee äänisignaalin esiintymistä/puuttumista osoittavan signaalin AND-osalle 114. Käyttämällä äänisignaalin tulotehoa, joka saadaan te-honlaskentaosalta 98, ja kepstrin huippuarvoa, joka saadaan huippuarvon ilmai-suosalta 910, S/N-laskentaosa 911 laskee S/N-suhteen, joka on yhtä suuri tai 15 suurempi kuin määritelty arvo, ja syöttää ilmaistun signaalin AND-osalle 114. AND-osa 114 toimii siten, että vain kun tuo osa saa signaalin, joka osoittaa, että äänisignaalin tuloteho on yhtä suuri tai suurempi kuin komparaattorilta 913 tuleva määritelty arvo, signaalin, joka osoittaa, että tulevan äänisignaalin S/N-suhde on yhtä suuri tai suurempi kuin S/N-laskentaosalta 911 tuleva määritelty arvo, ja 20 edelleen signaalin, joka ilmaisee, että ääni esiintyy äänenilmaisuosalta 912 tulevassa äänisignaalitulossa, tuo osa syöttää signaalin kytkimen 915 kytkemiseksi • '* päälle kytkimeen 915, sallii tulevan äänisignaalin mennä läpi ja muodostaa läh- : tevän äänisignaalin. Yllä kuvatun esillä olevan keksinnön toteutuksen mukaisesti lähtevä äänisignaali voidaan lähettää vain kun ääni esiintyy äänisignaalin tulos-25 sa, S/N-suhde on hyvä ja tarpeeksi tehoa on käytettävissä. Näin ollen laitteella ·;· · on vaikutus, että ääni, jossa on riittävästi tehoa ja hyvä S/N-suhde saadaan läh- ; . teväksi äänisignaaliksi. Myöskin, koska myös teho ilmaistaan, äänen tulostatus voidaan ilmaista, ja esimerkiksi käyttämällä toteutuksen signaalinohjauslaitetta äänen tunnistukseen, se sallii signaalin, jolla on hyvä puhestatus, erityisesti hyvä 30 puhujan ääntämistaso, valitsemisen, mikä samalla aiheuttaa paremman tuloksen saamisen.
i Tämä tarkoittaa, että laite rakennetaan tavalla, jossa se sisältää : komparaattorin signaalin tulotehon vertaamiseksi määrätyn arvon kanssa ja kyt kimen ohjaamiseksi ottamalla looginen tulo S/N-laskentaosan lähtevästä S/N-35 suhteesta, jolloin vain kun signaali esiintyy signaalitulossa, S/N-suhde on hyvä ja teho on riittävä, lähtevä signaali voidaan tuottaa. Näin ollen laite aiheuttaa, että 22 115569 saadaan signaali, jolla on riittävä teho ja hyvä S/N-suhde. Myöskin, koska myös teho ilmaistaan, äänen tulostatus voidaan ilmaista ja signaali, jolla on hyvä pu-hestatus, erityisesti hyvä puhujan ääntämistaso, voidaan valita, joka samalla aiheuttaa, että kun käytetään esillä olevan keksinnön mukaista signaalinohjauslai-5 tetta äänentunnistuslaitteessa ja vastaavassa, saadaan hyvä tulos.
Kuviota 14 tarkastelemalla tullaan tämän jälkeen selittämään toisen esillä olevan keksinnön toteutus.
Kuvio 14 on lohkokaavio toisen esillä olevan keksinnön toteutuksessa olevasta signaalinkäsittelylaitteesta. Kuviota 14 käyttämällä alla tullaan selittä-10 mään laitteen rakenne. Kepstrin laskentaosa 101 laskee kepstrin tulevasta äänestä ja syöttää kepstrin huippuarvon ilmaisuosalle 102. Huippuarvon ilmai-suosa 102 ilmaisee kepstrin huippuarvon ja syöttää huippuarvon ohjausosalle 103 ja äänenilmaisuosalle 106. Äänenilmaisuosa 106 ilmaisee äänen esiintymi-sen/puuttumisen kepstrin huippuarvosignaalista, joka on syötetty huippuarvon 15 ilmaisosalta 102, ja syöttää ensimmäisen ohjaussignaalin sovitusosalle 107. Ohjausosa 103 syöttää kepstrin huippuarvosignaalin, joka on syötetty huippuarvon ilmaisosalta 102, huippuarvomuistiin 104 moodinasetustulos mukaisesti, ja käyttämällä huippuarvomuistista 104 syötettyä dataa, se lähettää toisen ohjaussignaalin sovitusosalle 107. Huippuarvomuisti 104, joka tallentaa kepstrin huippu-20 arvosignaalin huippuarvon ilmaisuosalta 102, tallentaa ja lukee dataa ohjausosan 103 kautta. Äänianalyysiosa 105 analysoi tulevan signaalin dataformaat-·' : tiin, jota käytetään sovitusosassa 107, ja syöttää analysoidun signaalin sovi- : : tusosalle 107. Sovitusosalle 107 syötetään analysoitu signaali äänianalyysiosal- *' * ta 105 ja ensimmäinen ja toinen ohjaussignaali äänenilmaisuosalta 106 ja ohja- 25 usosalta 103, ja ohjaussignaalien ohjaamana se tarkistaa analysoidun signaalin, ; * joka syötetään äänianalyysiosalta 105, mallin suhteen tunnistettu-lähdön saami- . : ·. seksi.
Selitetään laitteen, jonka rakenne on yllä olevan kaltainen, toiminta.
. Ensiksi, kun moodinasetustulo on "REKISTERÖINTI", kepstrin laskentaosa 101 30 laskee kepstrin tulevasta äänestä, sen jälkeen äänenilmaisuosa 102 ilmaisee ;·’ kepstrin huippuarvon, syöttää huippuarvon ohjausosalle 103 ja tallentaa sitten huippuarvon ohjausosan 103 kautta huippuarvomuistiin 104. Sen jälkeen ohja-usosa 103 syöttää toisen ohjaussignaalin sovituskäsittelyn estämiseksi sovitusosalle 107. Sen jälkeen, kun moodinasetustulo on "TUNNISTUS", kepstrin 35 laskentaosa 101 laskee samalla tavoin tulevan äänen kepstrin ja sen jälkeen huippuarvon ilmaisuosa 102 ilmaisee kepstrin huippuarvon. Sen jälkeen ää- 23 115569 nenilmaisuosa 106 ilmaisee äänen esiintymisen/puuttumisen huippuarvon ilmai-suosalta 102 tulevan kepstrin huippuarvosignaalin esiintymisen/puuttumisen perusteella, ja kun ääni esiintyy, se syöttää ensimmäisen ohjaussignaalin sovitus-prosessin suorittamiseksi sovitusosalle 107, kun taas äänen puuttuessa se syöt-5 tää ensimmäisen signaalin sovitusprosessin estämiseksi sovitusosalle 107. Samaan aikaan ohjausosa 103 vertaa huippuarvon ilmaisuosalta 102 tulevaa huippuarvosignaalia huippuarvomuistiin 104 aiemmin tallennettuun sisältöön, ja kun molempien kefrenssiarvot ovat lähellä toisiaan, se syöttää toisen signaalin sovituskäsittelyn suorittamista varten sovitusosalle 107, kun taas molempien 10 kefrenssiarvot eivät ole lähellä toisiaan, se syöttää toisen signaalin sovituskäsittelyn estämistä varten sovitusosalle 107. Sen jälkeen sovitusosa 107, kun sekä ensimmäinen että toinen signaali, jotka on syötetty äänenilmaisuosalta 106 ja ohjausosalta 103 ovat niitä, joilla sovituskäsittely suoritetaan, se vertaa ääniana-lyysiosalta 105 tulevaa analysoitua signaalia mallin dataan tunnistuskäsittelytoi-15 minnan suorittamiseksi, ja lähettää tuloksen tunnistettu-lähtösignaalina.
Yllä kuvatun esillä olevan keksinnön toteutuksen signaalin käsittelylaitteen mukaisesti, vain kun tulevan äänen kepstrin huippuarvon kefrenssi, eli puhujan äänitaajuus, on lähellä aiemmin rekisteröityä taajuutta, suoritetaan sovi-tusprosessointi mallin kanssa siten, että kun syötetään muu kuin rekisteröidyn 20 puhujan tuleva ääni, sovitusprosessointia ei suoriteta, mikä samalla sallii sovi-tusosan sovitusprosessoinnin tarvitseman prosessointiajan eliminoimisen, eli > * · : ·' kun syötetään muu kuin rekisteröidyn puhujan ääni, hylkäävä tulos annetaan vä- v : littömästi.
• · . ·· Edelleen, kun laite on rakennettu mikroprosessorin tai vastaavan 25 avulla, sovitusprosessoinnin käsittely voidaan pitää minimissään, jolloin CPU:n •; *: kuormaa voidaan vähentää ja varata vähennetty osa toiselle prosessointikäsitte- :T: lylle.
Havaitaan myös, että antamalla ulos tulos, sellainen kuin tunnistettu-: lähtösignaali, se että tulosignaali on erilainen kuin rekisteröidyllä puhujalla, voi- 30 daan helposti suorittaa käyttämällä ohjausosan 103 ohjaussignaalia.
Kuten yllä olevasta toteutuksesta on ilmeistä, esillä olevalla keksin-• | nöllä on rakenne, joka sisältää ohjausosan, joka tallentaa lähtevän huippuar- vosignaalin kepstrin huippuarvon ilmaisuosalta huippuarvomuistiin moodin-'.t asetustulon ohjaamana, tai vertaa kepstrin huippuarvon ilmaisuosalta tulevaa 35 lähtevää huippuarvosignaalia huippuarvomuistin kanssa toisen ohjaussignaalin syöttämiseksi sovitusosalle siten, että vain kun tulevan äänen äänitaajuus on lä- 24 115569 hellä aiemmin rekisteröityä taajuutta, sovitustoiminta voidaan suorittaa, jolloin seurauksena on, että kun muu ääni kuin rekisteröidyn puhujan ääni syötetään, sovitusprosessointia ei suoriteta prosessointikäsittelyn jättämiseksi pois, ja hylätty-tulos saadaan nopeasti. On myös toinen seuraus, että kun laite on rakennettu 5 mikroprosessorilla tai vastaavalla, sovitusprosessoinnin käsittely voidaan pitää minimissään, jolloin CPU:n kuormaa voidaan vähentää ja vähennetty osa varata toiselle prosessointikäsittelylle, josta seuraa rationalisoitu CPU:n rakenne.
Kuviota 15 tarkastelemalla tullaan tämän jälkeen selittämään toisen esillä olevan keksinnön toteutus.
10 Kuvio 15 on lohkokaavio toisen esillä olevan keksinnön toteutuksen signaalinkäsittelylaitteesta. Kuviota 15 käyttämällä alla tullaan selittämään laitteen rakenne. Kepstrin laskentaosa 208 laskee kepstrin tulevasta äänestä ja syöttää kepstrin huippuarvon ilmaisuosalle 209 ja huippuarvon ilmaisuosa 209 ilmaisee kepstrin huippuarvon ja syöttää huippuarvon analyysijakson käsittely-15 osalle 210 ja äänenilmaisuosalle 214. Äänenilmaisuosa 214 ilmaisee äänen esiintymisen/puuttumisen kepstrin huippuarvosta, joka syötetään huippuarvon ilmaisuosalta 209, ja se syöttää ensimmäisen ohjaussignaalin, joka vastaa äänisignaalin esiintymistä/puuttumista sovitusosalle 215. Analyysijakson käsittely-osa 210 asettaa optimaalisen analyysijakson kepstrin huippuarvon ohjaamana, 20 joka syötetään huippuarvon ilmaisuosalta 209, ja se syöttää asetetun jakson analyysijakson luokitteluosalle 211 ja syöttää myös samanlaisen analyysijakso-datan tai ennalta määrätyn analyysijakson datan, joka syötetään analyysijakson ' : muistilta 212, huippuarvon ilmaisuosalle 209 moodinasetustulon ohjaamana.
'.i Analyysijakson luokitteluosa 211 vertaa optimaalista analyysijakson dataa, joka 25 on syötetty analyysijakson käsittelyosalta 210, analyysijakson dataan, joka on ··· syötetty analyysijakson muistilta 212, luokittelun suorittamiseksi, ja moo- . dinasetustulon ohjaamana se kirjoittaa datan analyysijakson muistiin 212 tai lu kee sen sieltä analyysijakson ohjausta varten, ja syöttää luokitellun tuloksen toi-. . sena ohjaussignaalina sovitusosalle 215. Äänianalyysiosa 213 analysoi tulevan / 30 signaalin dataformaattiin, jota käytetään sovitusosassa 215, ja syöttää analysoi- / dun signaalin sovitusosalle 215. Sovitusosalle 215 syötetään tuleva ääni, joka : on analysoitu äänianalyysiosalla 213, ja ensimmäinen ja toinen ohjaussignaali : äänenilmaisuosalta 214 ja analyysijakson luokitteluosalta 211, ja ohjaussignaa lien ohjaamana se tarkistaa analysoidun signaalin, joka syötetään äänianalyy-35 siosalta 105, mallin suhteen tunnistettu-lähdön saamiseksi.
25 115569
Selitetään yllä olevan rakenteen sisältävän laitteen rakenne.
Kepstrin laskentaosa 208 ilmaisee huippuarvon ilmaisuosan 209 avulla tulevan äänen kepstrin huippuarvon, ja kepstrin huippuarvo syötetään sitten äänenilmaisuosalle 214 ja se ilmaisee äänen esiintymisen/puuttumisen. Ää-5 nenilmaisuosa 214 syöttää ensimmäisen ohjaussignaalin sovitusosalle 215 äänen esiintymisen/puuttumisen ohjaamana. Tällöin huippuarvon ilmaisuosa 209 toimii tavalla, jossa se ilmaisee kepstrin huippuarvon analyysijakson mukaisesti, joka on syötetty analyysijakson prosessointiosalta 210. Tuolla hetkellä ana-lyysijakso, joka on syötetty huippuarvon ilmaisuosaan 209, vastaa moo-10 dinasetustuloa myöhemmin esitettävällä tavalla. Äänianalyysiosa 213 analysoi tulevan äänen siten, että sovituskäsittely voidaan suorittaa sovitusosassa 215. Tarkastellaan nyt laitteen toimintaa tapauksessa, jossa moodinasetustulo on "REKISTERÖINTI" ja kun tulo on "TUNNISTUS".
Ensiksi, kun moodinasetustulo on "REKISTERÖINTI", analyysijakson 15 käsittelyosa 210 asettaa huippuarvon ilmaisun analyysijakson huippuarvon il-maisuosassa 209 ennalta määrätyksi jaksoksi, laskee analyysijakson suurella tarkkuudella kepstrin huippuarvon ohjaamana, joka saadaan huippuarvon ilmai-suosalta 209, ja se syöttää optimaalisen analyysijakson luokitteluosalle 211. Analyysijakson luokitteluosa 211 tarkistaa, esiintyykö samanlainen analyysijakso 20 optimaalista analyysijaksoa varten analyysijakson muistissa 212, ja jos jaksoa ei esiinny, se tallentaa uudelleen optimaalisen analyysijakson analyysijakson muistiin 212, kun taas jakson esiintyessä se yhdistää optimaalisen analyysijakson ja : : analyysijaksomuistin 212 samanlaisen analyysijakson, kuten yllä kuvattiin, ja korvaa analyysijakson muistin 212 sisällön yhdistetyllä jaksolla tallennusta var-25 ten.
· ·; Tämän jälkeen, kun moodinasetustuloksi tulee "TUNNISTUS", ana- . lyysijakson käsittelyosa 210 syöttää aiemmin syötetyn analyysijakson datan huippuarvon ilmaisuosaan 209. Huippuarvon ilmaisuosa 209 ilmaisee kepstrin huippuarvon tulevan äänen ohjaamana, sitten analyysijakson käsittelyosa 210 l .* 30 laskee optimaalisen analyysijakson huippuarvon ohjaamana ja syöttää lasketun jakson analyysijakson luokitteluosalle 211. Analyysijakson luokitteluosa 211 te- . i kee tarkistuksen nähdäkseen, esiintyykö samanlainen jakso optimaaliselle syö- tetylle analyysijaksolle analyysijakson muistissa 212, ja jos jakso esiintyy, se : , syöttää samanlaisen analyysijakson analyysijakson käsittelyosan 210 läpi huip- > · 35 puarvon ilmaisuosalle 209 korvaten aiemmin asetetun analyysijakson samanlaisella analyysijaksoila, kun taas jos jaksoa ei esiinny, se säilyttää ennalta määrä- 26 115569 tyn analyysijakson ja syöttää jakson huippuarvon ilmaisuosalle 209. Edelleen osa 211 syöttää toisen ohjaussignaalin, joka osoittaa samanlaisen analyysijakson esiintymisen/puuttumisen, sovitusosalle 215. Kun ääni todella esiintyy äänen tulossa, ja tulevan äänen kepstrin huippuarvon analyysijakso on samanlai-5 nen kuin aiemmin rekisteröity jakso yllä kuvatun mukaisesti, sovitusosa 215 suorittaa sovitustoiminnan mallin suhteen ensimmäisellä ohjaussignaalilla, joka on syötetty äänenilmaisuosalta 214, ja toisella ohjaussignaalilla, joka on syötetty analyysijakson luokitteluosalta 211.
Yllä kuvatun kaltaisen esillä olevan keksinnön toteutuksen signaalin-10 käsittelylaitteen mukaisesti rekisteröitäessä äänisignaalia analyysijakso, joka vastaa kepstrin huippuarvoa, joka vastaa äänitaajuutta, joka osoittaa äänen luonteen, luokitellaan ja tallennetaan muistiin, jolloin samanlaiset tulevat äänet useiden tulevien rekisteröityjen äänien joukosta vastaavat yhdistettyä ana-lyysijaksoa ja ne tallennetaan, kun taas muut tulevat äänet vastaavat yksittäistä 15 analyysijaksoa, ja ne tallennetaan. Molemmissa tapauksissa, kun ääni tulee tunnistaa, analyysijaksoa, joka vastaa valinnaisen tulevan äänen kepstrin huippuarvoa, verrataan muistiin rekisteröityyn analyysijaksoon, jolloin se, onko tuleva ääni rekisteröity vai ei, voidaan määritellä. Myöskin asettamalla analyysijakso, kepstrin huippuarvon ilmaisun analyysikäsittely tulee suorittaa määrätyllä jaksol-20 la, mikä samalla sallii tulevan äänen esiintymisen/puuttumisen määrittämisen suorittamisen tehokkaasti ja suurella nopeudella. Edelleen häiriö, jossa ei ole kepstrin huippua, poistuu, aiheuttaen samalla virheellisen toiminnan eliminoin-: nin. Edelleen vielä äänentunnistuskäsittely suoritetaan sen jälkeen kun tuleva • ääni on käytännössä vahvistettu ja sen rekisteröinti on vahvistettu yllä kuvatulla 25 tavalla, mikä samalla sallii tunnistuksen suorittamisen tarvittaessa, ja laitteen *: käyttämisen tehokkaasti.
·. Vaikutuksena on myös, että kun laite rakennetaan mikroprosessorilla ja vastaavalla, käsittelytoiminta ilman hukka-aikaa aiheuttaa osien käsittely-kuorman alenemisen, mikä samalla sallii monen käsittelyn suorittamisen ja ra-;;. ‘ 30 kenteen yksinkertaistumisen.
Kuten yllä olevasta toteutuksesta on ilmeistä, esillä olevan keksinnön j mukainen signaalinkäsittelylaite, jossa on ensimmäinen ohjaussignaalin tulolaite : ja toinen ohjaussignaalin tulolaite sisällytettynä sovitusosaan ja sovitusosan, jo- .. ka vastaanottaa lähtevän tunnistuksen käyttämällä analysoitua lähtöä äänenil- 35 maisulaitteelta, johon äänisignaali syötetään, tunnistustoimintaa ohjaamassa, ja ’··' laite on varustettu huippuarvon ilmaisulaitteella äänisignaalin kepstrin, joka on 115569 27 laskettu määritellyssä analyysijaksossa, huippuarvon ilmaisua varten ja ensimmäisen ohjaussignaalin tuottamista varten, joka vastaa äänisignaalin esiintymis-tä/puuttumista, ja on varustettu laitteella, jolla analyysijakso luokitellaan optimaalisen jakson perusteella, joka on laskettu tulevaa ääntä vastaten, jakson tallen-5 tamisen muistiin ja jakson syöttämisen huippuarvon ilmaisuosalle, laitteen ana-lyysijakson, joka vastaa valinnaista tulevaa ääntä, vertaamiseksi tallennetun analyysijakson kanssa valinnaisen tulevan äänen tunnistuskäsittelyssä ja toisen ohjaussignaalin tuottamisen, ja ensimmäisen ja toisen ohjaussignaalin, jotka rajoittavat tunnistuskäsittelyä tavalla, että se suoritetaan vain kun äänisignaali 10 esiintyy ja se tulee tunnistaa, jolloin tunnistuskäsittely suoritetaan tarvittaessa, kepstrin huippuarvon ilmaisun analysointinopeutta kasvatetaan asettamalla analyysijakso, ja häiriö, jossa ei ole kepstrin huippua, poistuu aiheuttaen virheellisen toiminnan eliminoitumisen. Myöskin tunnistuskäsittely suoritetaan tarvittaessa, mikä siten aiheuttaa laitteen tehokkaan käytön.
15 Lopputuloksena on myös, että käsittelytoiminta ilman hukka-aikaa ai heuttaa laitteen osien prosessointikuorman alenemisen, mikä siten sallii sen rakenteen yksinkertaistamisen.
Alan ammattimiehet edelleen ymmärtävät, että edellä oleva kuvaus sisältää edulliset toteutukset ja että useita muutoksia ja muunnelmia voidaan 20 tehdä keksintöön poikkeamatta sen hengestä ja sovellutusalueesta.

Claims (4)

28 115569
1. Puhesignaaiinilmaisulaite, tunnettu siitä, että se käsittää kepstrin laskentalaitteen (1, 5, 11) sisääntulosignaalin kepstrin muo- 5 dostamista varten, keskiarvon laskentalaitteen (2, 7, 13) kepstriulostulosta kepstrin las-kentalaitteelta (1, 5, 11) kepstrin keskiarvon muodostamiseksi annetulla kef-renssivälillä, kynnysarvon asetuslaitteen (4, 10, 18) äänen ilmaisun kynnystason 10 asettamiseksi keskiarvon laskentalaitteelta (2, 7, 13) tulevan kepstrin keskiarvon perusteella, ja äänenilmaisulaitteen (3, 8, 9, 14 -17), johon keskiarvon laskentalaitteelta (2, 7,13) tuleva kepstrin keskiarvo, kepstrin laskentalaitteelta (1, 5,11) tuleva kepstri ja kynnysarvon asetuslaitteelta (4, 10, 18) lähtevä kynnysarvosig-15 naali syötetään ja joka vertaa lähtevää kepstriä, joka ylittää mainitun lähtevän kepstrin keskiarvon, mainitun lähtevän kynnysarvosignaalin kanssa puhesignaalin esiintymisen/puuttumisen ilmaisemiseksi tulosignaalissa.
2. Patenttivaatimuksen 1 mukainen signaalinilmaisulaite, tunnet-t u siitä, että: 20 mainitussa äänenilmaisulaitteessa (3, 8, 9, 14 -17) on kepstrin sum- mausosa (8, 14) kepstrin arvon summaamiseksi, joka ylittää mainitun kepstrin .* keskiarvon ja komparaattori (9,15) kepstri-summattu-lähdön vertaamiseksi, joka tulee mainitulta kepstrin summausosalta (8, 14), mainitun lähtevän kynnysar-‘ * · vosignaalin kanssa.
3. Patenttivaatimuksen 1 mukainen signaalinilmaisulaite, tunnet- *·· t u siitä, että mainitussa äänenilmaisulaitteessa (3, 8, 9,14 -17) on: n-osainen ensimmäinen muistiryhmä (16) mainitun kepstrin tallentamista varten, : n:n monikerta toisia muistiryhmiä (17) mainitun kepstrin keskiarvon 30 tallentamista varten, ; kepstrin summausosa (14) ensimmäisen muistin lähdön lisäämiseksi, ; joka ylittää lähdön toisesta muistiryhmästä (17), joka vastaa mainittua ensim- ; '; mäistä muistia (16), ja komparaattori (15) kepstri-summattu-lähdön, kepstrin summausosas-35 ta (14), vertaamiseksi lähtevän kynnysarvosignaalin, joka tulee mainitulta kyn- I » ’ ' nysarvon asetuslaitteelta (18), kanssa. 29 115569
4. Puhesignaalin ilmaisumenetelmä, tunnettu siitä, että se käsittää vaiheet: lasketaan kepstri tulevan signaalin kepstrin muodostamiseksi, lasketaan keskiarvo annetulla kefrenssivälillä kepstriulostulosta 5 kepstrin laskentavaiheesta, asetetaan kynnys puheilmaisukynnyksen tason asettamiseksi kepstrin keksiarvoulostulon perusteella keskiarvon laskentavaiheesta, ja ilmaistaan puhesignaalin esiintyminen/puuttuminen tulosignaalissa vertaamalla kepstrin ulostuloa, joka ylittää kepstrin keskiarvoulostulon keskiar-10 von laskentavaiheesta, kynnysulostulosignaalin haussa, kynnyksen asettamis-vaiheesta. » 30 115569
FI910293A 1990-01-18 1991-01-18 Äänisignaalin käsittelylaite FI115569B (fi)

Applications Claiming Priority (12)

Application Number Priority Date Filing Date Title
JP2008595A JP2712692B2 (ja) 1990-01-18 1990-01-18 信号制御装置
JP859590 1990-01-18
JP2008592A JP2712691B2 (ja) 1990-01-18 1990-01-18 信号処理装置
JP859290 1990-01-18
JP1734890 1990-01-26
JP2017348A JPH03220600A (ja) 1990-01-26 1990-01-26 音声検出装置
JP2026506A JP2712703B2 (ja) 1990-02-06 1990-02-06 信号処理装置
JP2650690 1990-02-06
JP2650790 1990-02-06
JP2026507A JP2712704B2 (ja) 1990-02-06 1990-02-06 信号処理装置
JP3429790 1990-02-14
JP2034297A JP2712708B2 (ja) 1990-02-14 1990-02-14 音声検出装置

Publications (3)

Publication Number Publication Date
FI910293A0 FI910293A0 (fi) 1991-01-18
FI910293A FI910293A (fi) 1991-07-19
FI115569B true FI115569B (fi) 2005-05-31

Family

ID=27548141

Family Applications (4)

Application Number Title Priority Date Filing Date
FI910293A FI115569B (fi) 1990-01-18 1991-01-18 Äänisignaalin käsittelylaite
FI20030087A FI117953B (fi) 1990-01-18 2003-01-21 Äänisignaalin käsittelylaite
FI20030088A FI116594B (fi) 1990-01-18 2003-01-21 Äänisignaalin käsittelylaite
FI20030089A FI116595B (fi) 1990-01-18 2003-01-21 Äänisignaalin käsittelylaite

Family Applications After (3)

Application Number Title Priority Date Filing Date
FI20030087A FI117953B (fi) 1990-01-18 2003-01-21 Äänisignaalin käsittelylaite
FI20030088A FI116594B (fi) 1990-01-18 2003-01-21 Äänisignaalin käsittelylaite
FI20030089A FI116595B (fi) 1990-01-18 2003-01-21 Äänisignaalin käsittelylaite

Country Status (9)

Country Link
US (1) US5195138A (fi)
EP (4) EP0614171B1 (fi)
KR (1) KR960005739B1 (fi)
AU (1) AU644124B2 (fi)
CA (1) CA2034333C (fi)
DE (4) DE69112855T2 (fi)
FI (4) FI115569B (fi)
HK (4) HK184795A (fi)
NO (4) NO306489B1 (fi)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5414674A (en) * 1993-11-12 1995-05-09 Discovery Bay Company Resonant energy analysis method and apparatus for seismic data
US5502717A (en) * 1994-08-01 1996-03-26 Motorola Inc. Method and apparatus for estimating echo cancellation time
KR20000022285A (ko) 1996-07-03 2000-04-25 내쉬 로저 윌리엄 음성 액티비티 검출기 및 검출 방법
US6314396B1 (en) 1998-11-06 2001-11-06 International Business Machines Corporation Automatic gain control in a speech recognition system
WO2001039175A1 (fr) * 1999-11-24 2001-05-31 Fujitsu Limited Procede et appareil de detection vocale
US6876965B2 (en) 2001-02-28 2005-04-05 Telefonaktiebolaget Lm Ericsson (Publ) Reduced complexity voice activity detector
US7426470B2 (en) * 2002-10-03 2008-09-16 Ntt Docomo, Inc. Energy-based nonuniform time-scale modification of audio signals
WO2006005337A1 (en) * 2004-06-11 2006-01-19 Nanonord A/S A method for analyzing fundamental frequencies and application of the method
US8264909B2 (en) * 2010-02-02 2012-09-11 The United States Of America As Represented By The Secretary Of The Navy System and method for depth determination of an impulse acoustic source by cepstral analysis
KR102057795B1 (ko) * 2013-03-15 2019-12-19 애플 인크. 콘텍스트-민감성 방해 처리
CN104967793B (zh) * 2015-07-28 2023-09-19 格科微电子(上海)有限公司 适用于cmos图像传感器的电源噪声抵消电路
CN111883183B (zh) * 2020-03-16 2023-09-12 珠海市杰理科技股份有限公司 语音信号筛选方法、装置、音频设备和系统

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA1116300A (en) * 1977-12-28 1982-01-12 Hiroaki Sakoe Speech recognition system
AU598933B2 (en) * 1987-04-03 1990-07-05 American Telephone And Telegraph Company An adaptive threshold voiced detector

Also Published As

Publication number Publication date
EP0614170B1 (en) 2000-04-26
FI910293A0 (fi) 1991-01-18
DE69132148D1 (de) 2000-05-31
DE69130294T2 (de) 1999-05-06
NO308337B1 (no) 2000-08-28
DE69132148T2 (de) 2000-09-21
NO992256D0 (no) 1999-05-10
AU6868891A (en) 1991-07-25
HK1010007A1 (en) 1999-06-11
EP0614170A1 (en) 1994-09-07
NO992258D0 (no) 1999-05-10
FI20030087A (fi) 2003-01-21
AU644124B2 (en) 1993-12-02
NO992258L (no) 1991-07-19
DE69132147T2 (de) 2000-09-21
FI116594B (fi) 2005-12-30
HK184795A (en) 1995-12-15
EP0439073A1 (en) 1991-07-31
KR960005739B1 (ko) 1996-05-01
EP0614169A1 (en) 1994-09-07
NO910221D0 (no) 1991-01-18
US5195138A (en) 1993-03-16
HK1010006A1 (en) 1999-06-11
FI116595B (fi) 2005-12-30
DE69132147D1 (de) 2000-05-31
EP0614171A1 (en) 1994-09-07
DE69112855T2 (de) 1996-02-15
NO910221L (no) 1991-07-19
EP0439073B1 (en) 1995-09-13
NO992257D0 (no) 1999-05-10
KR910014869A (ko) 1991-08-31
DE69130294D1 (de) 1998-11-05
EP0614171B1 (en) 2000-04-26
CA2034333C (en) 1996-04-16
DE69112855D1 (de) 1995-10-19
FI20030088A (fi) 2003-01-21
CA2034333A1 (en) 1991-07-19
NO306489B1 (no) 1999-11-08
NO308335B1 (no) 2000-08-28
FI910293A (fi) 1991-07-19
FI117953B (fi) 2007-04-30
EP0614169B1 (en) 1998-09-30
HK1010008A1 (en) 1999-06-11
FI20030089A (fi) 2003-01-21
NO992256L (no) 1991-07-19
NO992257L (no) 1991-07-19
NO308336B1 (no) 2000-08-28

Similar Documents

Publication Publication Date Title
FI115569B (fi) Äänisignaalin käsittelylaite
US7957967B2 (en) Acoustic signal classification system
US6317507B1 (en) Signal verification device
US4677673A (en) Continuous speech recognition apparatus
US8200488B2 (en) Method for processing speech using absolute loudness
EP1005019A2 (en) Segment-based similarity measurement method for speech recognition
CN111916109A (zh) 一种基于特征的音频分类方法、装置及计算设备
US7127392B1 (en) Device for and method of detecting voice activity
EP1513135A1 (en) Speech recognizing method and device thereof
US20030023434A1 (en) Linear discriminant based sound class similarities with unit value normalization
US20040172244A1 (en) Voice region detection apparatus and method
US20060150805A1 (en) Method of automatically detecting vibrato in music
US6349148B1 (en) Signal verification device
CN109118242B (zh) 一种账户创建方法及其装置、电子设备
JP2975772B2 (ja) 音声認識装置
JPH01502779A (ja) 適応多変数推定装置
CA1336212C (en) Distance measurement control of a multiple detector system
JP3360978B2 (ja) 音声認識装置
JP3008593B2 (ja) 音声認識装置
JPH0683384A (ja) 音声中の複数話者の発話区間自動検出同定装置
JP3031081B2 (ja) 音声認識装置
KR100349656B1 (ko) 다수의 하위 음성검출 시스템을 이용한 음성검출 장치 및그 방법
KR20010091093A (ko) 음성 인식 및 끝점 검출방법
CN117198282A (zh) 语音控制方法、装置、机器人及计算机可读存储介质
JPH04276579A (ja) レーダパルス信号分析装置

Legal Events

Date Code Title Description
FG Patent granted

Ref document number: 115569

Country of ref document: FI