FI128000B

FI128000B - Puheentunnistusmenetelmä ja -laite herätesanaan pohjautuen

Info

Publication number: FI128000B
Application number: FI20156000A
Authority: FI
Inventors: Tapio Koivuniemi; Tuomas Tuononen; Teijo Kinnunen; Jarkko Koivikko
Original assignee: Code Q Oy
Priority date: 2015-12-22
Filing date: 2015-12-22
Publication date: 2019-07-15
Also published as: FI20156000A

Abstract

Esillä olevassa keksinnössä esitetään puheentunnistusjärjestelmiä varten menetelmä, laite ja tietokoneohjelma, joissa käytetään herätyssanaa ja parannetaan sen toimintaa algoritmisesti. Menetelmässä tarkistetaan ensin tuleva audiovirta, ja kun ilmaistaan ehdokkaana oleva herätyssana, verrataan sitä herätyssanojen positiiviseen akustiseen malliin ja herätyssanojen negatiiviseen akustiseen malliin. Jos päätös on negatiivinen, tarkistetaan, onko negatiivisesti identifioitu ääninäyte lähellä aikaisemmin ilmaistua negatiivisesti identifioitua ääninäytettä, jotka molemmat vastaanotettiin tietyn aikajakson sisällä. Tämä suoritetaan vertaamalla kahden vastaanotetun ääninäytteen, jotka molemmat ilmaistaan mahdollisina herätyssanoina, varmuustasoja. Jos ehdokkaana olevaa herätyssanaa koskeva päätös on positiivinen, päätetään, että herätyssana sanottiin todella ja tarkoituksellisesti, ja laite menee komentojenkuuntelumoodiin.

Claims

Patenttivaatimukset

1. Menetelmä puheentunnistukseen kykenevässä laitteessa (31) käytettävän herätyssanan tunnistuksen laadun parantamiseksi ja laitteen (31) tai ulkoisen laitteen ohjaamiseksi ihmisäänikomennoilla, jolloin menetelmä käsittää vaiheen, jossa -asetetaan laite (31) aktiiviseen kuuntelumoodiin tai pidetään laite (31) aktiivisessa kuuntelumoodissa, jolloin on määritelty ennalta ainakin yksi herätyssana ja sen akustinen malli laitteen (31) käytettävissä olevaan muistiin (42);

tunnettu siitä, että menetelmä käsittää lisäksi vaiheet, joissa

- identifioidaan ainakin yksi herätyssana (11) audioympäristöstä aktiivisen kuuntelumoodin aikana vertaamalla vastaanotettuja ääninäytteitä aikaisemmin määriteltyyn akustiseen malliin ja ilmaistaan positiivisesti identifioitu herätyssana, kun vastaanotetun ääninäytteen identifiointivastaavuus ylittää asetetun kynnysarvon, päättämällä (12), onko ilmaistu ääninäyte lähempänä positiivista herätyssanamallia vai negatiivista herätyssanamallia, ja tehdään päätös positiivisesti identifioidusta herätyssanasta siinä tapauksessa, että ilmaistu ääninäyte on lähempänä positiivista herätyssanamallia; ja kun positiivisesti identifioitua herätyssanaa seuraa laitteelle (31) tai ulkoisen laitteen ohjaamiseen tarkoitettu tunnistettavissa oleva audiokomento (16) ennalta asetetussa ensimmäisessä aikajaksossa positiivisesti identifioidun herätyssanan ilmaisemisen jälkeen,

-annetaan komento laitteelle (31) tai ulkoiselle laitteelle laitteen (31) tai ulkoisen laitteen suorittaman toimenpiteen käynnistämiseksi.
2. Patenttivaatimuksen 1 mukainen menetelmä, tunnettu siitä, että menetelmä lisäksi käsittää, että

- määritetään (22), onko negatiivisesti identifioitu ääninäyte lähellä herätyssanan akustista mallia, ja jos on,

-verrataan (25) negatiivisesti identifioitua ääninäytettä aikaisemmin ilmaistuun negatiivisesti identifioituun ääninäytteeseen, jotka molemmat vastaanotettiin ennalta asetetun toisen aikajakson aikana audioympäristöstä, ja siinä tapauksessa, että näiden kahden negatiivisesti identifioidun ääninäytteen välillä on keskinäinen vastaavuus,

- muunnetaan (26) negatiivisesti identifioitu jälkimmäinen ääninäyte positiivisesti identifioiduksi herätyssanaksi.

20156000 prh 26 -03- 2019
3. Patenttivaatimuksen 1 mukainen menetelmä, tunnettu siitä, että menetelmässä kerätään positiivisia ja negatiivisia herätyssanamalleja kumulatiivisesti ja/tai käyttäjäkohtaisesti menetelmän toiminnan aikana, mistä on seurauksena herätyssanojen ja komentojen käyttäjäkohtainen ja ympäristön mukaan säädettävä identifiointi.
4. Patenttivaatimuksen 2 mukainen menetelmä, tunnettu siitä, että negatiivisesti identifioitu ääninäyte, jonka määritetään olevan lähellä, tallennetaan (24) väliaikaiseen sanatietokantaan.
5. Patenttivaatimuksen 1 mukainen menetelmä, tunnettu siitä, että jos negatiivisesti identifioitu ääninäyte ei ole lähellä oikeaa herätyssanaa,

- negatiivisesti identifioitu ääninäyte tallennetaan negatiiviseen herätyssanamalliin (23); ja

- menetelmä palaa audioympäristön aktiiviseen kuuntelumoodiin.
6. Patenttivaatimuksen 1 mukainen menetelmä, tunnettu siitä, että positiivisesti identifioitu herätyssana tallennetaan positiiviseen herätyssanamalliin (21), kun tunnistettavissa oleva audiokomento on vastaanotettu ennalta asetetussa ensimmäisessä aikajaksossa.
7. Patenttivaatimuksen 1 tai 2 mukainen menetelmä, tunnettu siitä, että identifiointi-, määritys- ja vertailuvaiheet perustuvat herätyssanan varmuustasoon; ja jolloin varmuustaso on jatkuvasti säädettävissä kunkin vastaanotetun ääninäytteen perusteella.
8. Patenttivaatimuksen 7 mukainen menetelmä, tunnettu siitä, että jos on suoritettu negatiivisesti identifioidun jälkimmäisen ääninäytteen muuntaminen positiivisesti identifioiduksi herätyssanaksi,

- säädetään herätyssanan varmuustasoa ja tallennetaan molemmat mainitut ääninäytteet positiiviseen herätyssanamalliin.
9. Patenttivaatimuksen 1 mukainen menetelmä, tunnettu siitä, että laitteen (31) muistissa (42) on tallennettuna informaatiota ainakin kahdesta eri herätyssanasta ja niiden akustisista malleista; ja menetelmä käsittää lisäksi vaiheen, jossa

20156000 prh 26 -03- 2019

- kerätään vastaavat positiiviset herätyssanamallit ja negatiiviset herätyssanamallit muistiin (42) erikseen kunkin herätyssanan osalta.
10. Patenttivaatimuksen 7 mukainen menetelmä, tunnettu siitä, että laitteen (31) muistissa (42) on tallennettuna informaatiota ainakin kahdesta eri herätyssanasta ja niiden akustisista malleista; ja menetelmä käsittää lisäksi vaiheen, jossa

- asetetaan ja säädetään varmuustasoja erikseen kunkin herätyssanan osalta.
11. Patenttivaatimuksen 7 mukainen menetelmä, tunnettu siitä, että varmuustasot voidaan tallentaa ja säätää erikseen laitteen kunkin eri ihmiskäyttäjän osalta.
12. Laite (31) herätyssanan tunnistuksen laadun parantamiseksi, jolloin laite (31) kykenee puheentunnistukseen, ja laitteen (31) tai ulkoisen laitteen ohjaamiseksi ihmisäänikomennoilla, jolloin

-laite (31) on konfiguroitu asetettavaksi aktiiviseen kuuntelumoodiin tai pidettäväksi aktiivisessa kuuntelumoodissa, jolloin on määritelty ennalta ainakin yksi herätyssana ja sen akustinen malli laitteen (31) käytettävissä olevaan muistiin (42); tunnettu siitä, että laite (31) käsittää

- prosessointivälineet (41), jotka on konfiguroitu identifioimaan ainakin yksi herätyssana (11) audioympäristöstä aktiivisen kuuntelumoodin aikana vertaamalla vastaanotettuja ääninäytteitä aikaisemmin määriteltyyn akustiseen malliin ja ilmaisemaan positiivisesti identifioitu herätyssana, kun vastaanotetun ääninäytteen identifiointivastaavuus ylittää asetetun kynnysarvon, jossa laite (31) käsittää lisäksi positiivisen herätyssanamallin ja negatiivisen herätyssanamallin, jolloin prosessointivälineet (41) on edelleen konfiguroitu päättämään (12), onko ilmaistu ääninäyte lähempänä positiivista herätyssanamallia vai negatiivista herätyssanamallia, ja tekemään päätös positiivisesti identifioidusta herätyssanasta siinä tapauksessa, että ilmaistu ääninäyte on lähempänä positiivista herätyssanamallia; ja kun positiivisesti identifioitua herätyssanaa seuraa laitteelle (31) tai ulkoisen laitteen ohjaamiseen tarkoitettu tunnistettavissa oleva audiokomento (16) ennalta asetetussa ensimmäisessä aikajaksossa positiivisesti identifioidun herätyssanan ilmaisemisen jälkeen, prosessointivälineet (41) on edelleen konfiguroitu

-antamaan komento laitteelle (31) tai ulkoiselle laitteelle laitteen (31) tai ulkoisen laitteen suorittaman toimenpiteen käynnistämiseksi.

20156000 prh 26 -03- 2019
13. Patenttivaatimuksen 12 mukainen laite, tunnettu siitä, että prosessointivälineet (41) on edelleen konfiguroitu

- määrittämään (22), onko negatiivisesti identifioitu ääninäyte lähellä herätyssanan akustista mallia, ja jos on, prosessointivälineet (41) on edelleen konfiguroitu

-vertaamaan (25) negatiivisesti identifioitua ääninäytettä aikaisemmin ilmaistuun negatiivisesti identifioituun ääninäytteeseen, jotka molemmat vastaanotettiin ennalta asetetun toisen aikajakson aikana audioympäristöstä, ja siinä tapauksessa, että näiden kahden negatiivisesti identifioidun ääninäytteen välillä on keskinäinen vastaavuus, prosessointivälineet (41) on edelleen konfiguroitu

- muuntamaan (26) negatiivisesti identifioitu jälkimmäinen ääninäyte positiivisesti identifioiduksi herätyssanaksi.
14. Patenttivaatimuksen 12 mukainen laite, tunnettu siitä, että laite (31) on konfiguroitu keräämään positiivisia ja negatiivisia herätyssanamalleja kumulatiivisesti ja/tai käyttäjäkohtaisesti laitteen (31) käytön aikana, mistä on seurauksena herätyssanojen ja komentojen käyttäjäkohtainen ja ympäristön mukaan säädettävä identifiointi.
15. Patenttivaatimuksen 13 mukainen laite, tunnettu siitä, että laite (31) käsittää väliaikaisen sanatietokannan, johon negatiivisesti identifioitu ääninäyte, jonka on määritetty olevan lähellä, tallennetaan (24).
16. Patenttivaatimuksen 12 mukainen laite, tunnettu siitä, että jos negatiivisesti identifioitu ääninäyte ei ole lähellä oikeaa herätyssanaa,

- negatiivisesti identifioitu ääninäyte tallennetaan negatiiviseen herätyssanamalliin (23); ja

- laite (31) on konfiguroitu palaamaan audioympäristön aktiiviseen kuuntelumoodiin.
17. Patenttivaatimuksen 12 mukainen laite, tunnettu siitä, että prosessointivälineet (41) on konfiguroitu tallentamaan positiivisesti identifioitu herätyssana positiiviseen herätyssanamalliin (21), kun tunnistettavissa oleva audiokomento on vastaanotettu ennalta asetetussa ensimmäisessä aikajaksossa.

20156000 prh 26 -03- 2019
18. Patenttivaatimuksen 12 tai 13 mukainen laite, tunnettu siitä, että prosessointivälineet (41) on konfiguroitu identifioimaan, määrittämään ja vertaamaan herätyssanan varmuustasoon perustuen; ja jolloin varmuustaso on konfiguroitu olemaan jatkuvasti säädettävissä kunkin vastaanotetun ääninäytteen perusteella.
19. Patenttivaatimuksen 18 mukainen laite, tunnettu siitä, että jos on suoritettu negatiivisesti identifioidun jälkimmäisen ääninäytteen muuntaminen positiivisesti identifioiduksi herätyssanaksi,

- prosessointivälineet (41) on konfiguroitu säätämään herätyssanan varmuustasoa ja tallentamaan molemmat mainitut ääninäytteet positiiviseen herätyssanamalliin.
20. Patenttivaatimuksen 12 mukainen laite, tunnettu siitä, että laitteen (31) muistissa (42) on tallennettuna informaatiota ainakin kahdesta eri herätyssanasta ja niiden akustisista malleista; ja prosessointivälineet (41) on edelleen konfiguroitu

- keräämään vastaavat positiiviset herätyssanamallit ja negatiiviset herätyssanamallit muistiin (42) erikseen kunkin herätyssanan osalta.
21. Patenttivaatimuksen 18 mukainen laite, tunnettu siitä, että laitteen (31) muistissa (42) on tallennettuna informaatiota ainakin kahdesta eri herätyssanasta ja niiden akustisista malleista; ja prosessointivälineet (41) on edelleen konfiguroitu

- asettamaan ja säätämään varmuustasoja erikseen kunkin herätyssanan osalta.
22. Patenttivaatimuksen 18 mukainen laite, tunnettu siitä, että laite (31) on konfiguroitu tallentamaan ja säätämään varmuustasot erikseen laitteen kunkin eri ihmiskäyttäjän osalta.
23. Tietokoneohjelma puheentunnistukseen kykenevässä laitteessa (31) käytettävän herätyssanan tunnistuksen laadun parantamiseksi ja laitteen (31) tai ulkoisen laitteen ohjaamiseksi ihmisäänikomennoilla, jolloin tietokoneohjelma käsittää koodin, joka on suoritettavissa prosessointivälineillä (41), ja tietokoneohjelma käsittää vaiheen, jossa

-asetetaan laite (31) aktiiviseen kuuntelumoodiin tai pidetään laite (31) aktiivisessa kuuntelumoodissa, jolloin on määritelty ennalta ainakin yksi herätyssana ja sen akustinen malli laitteen (31) käytettävissä olevaan muistiin (42);

tunnettu siitä, että tietokoneohjelma käsittää lisäksi vaiheet, joissa

20156000 prh 26 -03- 2019

- identifioidaan ainakin yksi herätyssana (11) audioympäristöstä aktiivisen kuuntelumoodin aikana vertaamalla vastaanotettuja ääninäytteitä aikaisemmin määriteltyyn akustiseen malliin ja ilmaistaan positiivisesti identifioitu herätyssana, kun vastaanotetun ääninäytteen identifiointivastaavuus ylittää asetetun kynnysarvon, päättämällä (12), onko ilmaistu ääninäyte lähempänä positiivista herätyssanamallia vai negatiivista herätyssanamallia, ja tehdään päätös positiivisesti identifioidusta herätyssanasta siinä tapauksessa, että ilmaistu ääninäyte on lähempänä positiivista herätyssanamallia; ja kun positiivisesti identifioitua herätyssanaa seuraa laitteelle (31) tai ulkoisen laitteen ohjaamiseen tarkoitettu tunnistettavissa oleva audiokomento (16) ennalta asetetussa ensimmäisessä aikajaksossa positiivisesti identifioidun herätyssanan ilmaisemisen jälkeen,

-annetaan komento laitteelle (31) tai ulkoiselle laitteelle laitteen (31) tai ulkoisen laitteen suorittaman toimenpiteen käynnistämiseksi.
24. Patenttivaatimuksen 23 mukainen tietokoneohjelma, tunnettu siitä, että tietokoneohjelma käsittää lisäksi vaiheet, joissa

- määritetään (22), onko negatiivisesti identifioitu ääninäyte lähellä herätyssanan akustista mallia, ja jos on,

-verrataan (25) negatiivisesti identifioitua ääninäytettä aikaisemmin ilmaistuun negatiivisesti identifioituun ääninäytteeseen, jotka molemmat vastaanotettiin ennalta asetetun toisen aikajakson aikana audioympäristöstä, ja siinä tapauksessa, että näiden kahden negatiivisesti identifioidun ääninäytteen välillä on keskinäinen vastaavuus,

- muunnetaan (26) negatiivisesti identifioitu jälkimmäinen ääninäyte positiivisesti identifioiduksi herätyssanaksi.
25. Patenttivaatimuksen 23 tai 24 mukainen tietokoneohjelma, tunnettu siitä, että tietokoneohjelma on toteutettu tietokoneella luettavaan välineeseen.

1/3