FI118062B

FI118062B - Pienimuistinen päätöspuu

Info

Publication number: FI118062B
Application number: FI20035055A
Authority: FI
Inventors: Janne Suontausta; Jilei Tian
Original assignee: Nokia Corp
Priority date: 2003-04-30
Filing date: 2003-04-30
Publication date: 2007-06-15
Also published as: DE602004023072D1; WO2004097673A1; FI20035055A; KR100883577B1; EP1618498B1; ATE442642T1; FI20035055A0; US7574411B2; KR20070094984A; US20040267785A1; EP1618498A1; KR20060016758A; CN1781102A; CN1781102B

Description

I

ί 118062

Pienimuistinen päätöspuu

Keksintö kohdistuu oheisen itsenäisen patenttivaatimuksen 1 johdanto-osan mukaiseen menetelmään puumaisen tietorakenteen hallitsemi-5 seksi. Keksinnön kohteena on myös oheisen itsenäisen patenttivaatimuksen 11 johdanto-osan mukainen järjestelmä edellä mainitun menetelmän toteuttamiseksi. Keksinnön kohteena on lisäksi oheisen itsenäisen patenttivaatimuksen 21 johdanto-osan mukainen laite. Keksinnön kohteena on myös oheisen itsenäisen patenttivaatimuksen 26 mu-10 kainen puumainen tietorakenne, sekä oheisen itsenäisen patenttivaatimuksen 30 mukainen tietokoneohjelmatuote edellä mainitun puumaisen tietorakenteen käyttämiseksi.

Monikielisyyteen liittyvät näkökohdat ovat tulossa yhä tärkeämmiksi 15 automaattisissa puheentunnistusjärjestelmissä. Tällainen puheen-tunnistusjärjestelmä käsittää puheentunnistuskoneen, joka voi käsittää esimerkiksi automaattisen kielentunnistuksen, on-line ääntämismallin-nuksen (tekstistä-foneemiksi; text-to-phoneme) ja monikielisen akustisen mallinnuksen yksikköjä. Puheentunnistuskone toimii sillä oletuk-20 sella, että sanastoyksiköt annetaan tekstimuodossa. Aluksi kielen-tunnistusmoduuli tunnistaa kielen sanastoyksikön kirjoitetun esitys- I v muodon perusteella. Kun kieli on määritelty, käytetään sopivaa on-line * * * :;;t: tekstistä-foneemiksi-mallinnusta sanastoyksikköön liittyvän foneemi- sarjan selvittämiseksi. Foneemi on pienin yksikkö, joka erottaa sanan • · : 25 ääntämisen toisen sanan ääntämisestä. Minkä tahansa kielen mikä :'**·* tahansa sanastoyksikkö voidaan esittää foneemisarjalla, joka vastaa ihmisen puheenmuodostusjärjestelmässä tapahtuvia muutoksia.

Monikielisiä akustisia malleja voidaan ketjuttaa tunnistusmallin muo- !···. 30 dostamiseksi jokaista sanastoyksikköä varten. Näitä perusmalleja • · T’ käyttäen tunnistin voi periaatteessa käsitellä automaattisesti monikieli- siä sanastoyksikköjä ilman käyttäjän apua. Tekstistä-foneemiksi-mal- linnuksella on avainasema tarkkojen foneemisarjojen muodostami- sessa sanastoyksiköille sekä automaattisessa puheentunnistuksessa Λ - 35 että tekstin muuntamisessa puheeksi (text-to-speech). Tekstistä-fo- • · * neemiksi-muunnoksessa käytetään yleensä neuroverkko- tai päätös- 2 118062 puuratkaisuja. Kieli- ja puhujariippumattomissa puheentunnistusratkai-suissa päätöspuupohjaisella lähestymistavalla on saatu aikaan tarkimmat foneemisarjat. Erästä esimerkkiä puurakenteen muodostamis-menetelmästä on kuvattu julkaisussa US 6,411,957B1.

5 Päätöspuupohjaisessa lähestymistavassa jokainen kielen aakkosissa esiintyvä kirjain mallinnetaan erikseen, ja jokaiselle kirjaimelle koulutetaan (train) oma päätöspuu. Kun sanan ääntäminen löydetään, sanaa käsitellään kirjain kerrallaan, ja kyseessä olevan kirjaimen ääntämis-10 tapa löydetään ko. kirjaimen päätöspuun tekstistä-foneemiksi-mallin perusteella.

Kuvassa 1 on esitetty esimerkki päätöspuusta. Se koostuu solmuista, jotka voivat olla joko sisäsolmuja I tai lehtiä L. Haara koostuu useista 15 solmuista, jotka ovat liittyneet toisiinsa juuresta R lehtiin L. Solmu voi olla joko vanhempisolmu tai lapsisolmu. Vanhempisolmu on solmu, jonka kautta puussa edetään, ts. sillä on lapsisolmu. Puun lapsisolmu on solmu, johon päästään vanhempisolmun kautta. Sisäsolmu I voi olla sekä vanhempisolmu että lapsisolmu, mutta lehti on vain lapsisolmu. 20 Päätöspuun jokaiseen solmuun on tallennettu tietoa. Tallennetut tiedot : ... vaihtelevat päätöspuun kontekstin mukaan.

• * · • · · · * ·

Iti

Puheentunnistusjärjestelmissä sisäsolmut I sisältävät yleensä tietoja ;···*’ tunnistettavasta sanasta sekä sanan ääntämisestä. Sanan kirjainten : 25 ääntäminen voidaan määritellä tietyissä konteksteissa esiintyvien fo- •» * : neemien (p,) avulla. Konteksti viittaa esimerkiksi sanassa oleviin kirjai- :[[[: miin käsiteltävänä olevan kirjaimen oikealla ja vasemmalla puolella.

Konteksti-informaation tyyppi voidaan määritellä attribuutin (a,) (josta käytetään myös nimitystä attribuuttityyppi) mukaan, ja konteksti otetaan .···. 30 huomioon päätöspuussa edettäessä. Eteneminen voidaan toteuttaa attribuuttiarvon avulla, joka määrittelee sen haaran johon hakualgorit-min tulisi edetä tietyn kirjaimen konteksti-informaation mukaisesti.

* • ·

Puurakenteeseen kiivetään juurisolmusta R alkaen. Jokaisessa sol-.·. : 35 mussa tulisi tutkia attribuuttityyppi (a) ja sitä vastaavaa informaatiota tulisi käyttää kulloinkin kyseessä olevan kirjaimen kontekstin mää- 3 118062 rittelemiseksi. Tietojen avulla konteksti-informaatiota vastaavassa haarassa voidaan siirtyä seuraavaan solmuun. Puussa edetään kunnes löydetään lehtisolmu L, tai puussa ei ole sen hetkistä kontekstia vastaavaa attribuuttiarvoa.

5

Kuvassa 2 on esitetty yksinkertaistettu esimerkki päätöspuupohjaisesta tekstistä-foneemiksi-muunnoksesta. Kuvassa esitetty päätöspuu on kirjainta ’a’ varten, jolloin solmut esittävät kirjaimen ’a’ foneemeja. On huomattava, että esitys on yksinkertaistettu, eikä se sisällä kaikkia kir-10 jaimen ’a’ foneemeja. Juurisolmussa on tieto attribuuttityypistä, joka on ensimmäinen kirjain oikealla, ja joka on merkitty viitteellä r7. Kahden muun sisäsolmun attribuuttityypit ovat ensimmäinen kirjain vasemmalla, jota on merkitty viitteellä h ja toinen kirjain oikealla, jota on merkitty viitteellä r2. Lehtisolmuille ei ole määritelty attribuuttityyppejä.

15

Etsittäessä sanan ’Ada’ ääntämistapaa, sanan foneemisarja voidaan saada aikaan esimerkissä esitetyn päätöspuun ja kirjaimen ’d’ päätös-puun avulla. Esimerkissä kirjaimen ’d’ päätöspuu koostuu vain juuri-solmusta, ja juurisolmulle määritelty foneemi on /d/.

20 . . Foneemisarjaa muodostettaessa sana käydään lävitse kirjain kerral- ;*V laan vasemmalta oikealle. Ensimmäinen kirjain on ’a’, joten kirjaimen • * · ’··' · ’a’ päätöspuu otetaan ensin käyttöön (ks. kuva 2). Juurisolmuun on lii- tetty attribuutti η. Kirjainta ’a’ seuraa kirjain ’d’, jolloin siirrytään juuri- a « * 25 solmua seuraavaan haaraan joka vastaa attribuuttiarvoa ’d’. Tämä Y\: solmu on sisäsolmu, johon on liitetty attribuuttiarvo r2. Toinen kirjain oikealla on ’a’, jolloin siirrytään kirjainta ’a’ vastaavaan haaraan, sekä vastaavaan solmuun, joka on lehti. Lehteä vastaava foneemi on /el/. Näin ollen sarjan ensimmäinen foneemi on /el/.

:::·. 30 • *

Esimerkkisanan seuraava kirjain on ’d\ Kuten edellä mainittiinkin, kir-jaimen ’d* päätöspuu koostuu vain juurisolmusta, jossa yleisin foneemi on /d/. Näin ollen sarjan toinen foneemi on /d/.

• · • · · • · · .·. * 35 Sanan viimeinen kirjain on ’a’, joten kirjaimen ’a’ päätöspuu otetaan * · * käyttöön uudelleen (ks. kuva 2). Juurisolmuun liitetty attribuutti on η.

118062 4

Koska’a’on sanan viimeinen kirjain, kirjainta’a’oikealla seuraava kirjain on grafeemi epsilon Puussa edetään vastaavaa haraa pitkin lehtisolmuun. Lehtisolmuun liittyvä foneemi on N/, joka on sarjan viimeinen foneemi.

5 Näin sanan ’Ada’ täydellinen foneemisarja on /el/ /d/ N/. Minkä tahansa sanan foneemisarja voidaan muodostaa samalla tavalla, sitten kun päätöspuut on koulutettu kaikille aakkosissa esiintyville kirjaimille.

10 Päätöspuun koulutus suoritetaan ääntämissanakirjalla, joka sisältää sanoja ääntämistapoineen. Päätöspuun vahvuutena on se, että se pystyy informaatioteoreettisia periaatteita käyttämällä oppimaan tiiviin muunnoksen koulutussanastosta.

15 Kuten edellä mainittiin, päätöspuupohjaisten sovellusten avulla on fo-neemisarjat saatu tarkimmin määriteltyä, mutta niiden epäkohtana on suuri muistintarve käytettäessä päätöspuuratkaisua tekstistä-fonee-miksi-muunnoksessa. Suuri muistintarve johtuu lukuisista osoittimista, joita käytetään linkitetyn listan päätöspuuratkaisussa. Muistinkulutus 20 lisääntyy erityisesti sellaisissa kielissä kuten englanti, jossa ääntämi- . t.m sessä esiintyy usein epäsäännöllisyyttä.

* » · *··* • »

Mainittua ongelmaa koskevat tunnetut ratkaisut voidaan luokitella hä-viöllisiin ja häviöttömiin menetelmiin. Kun yritetään pienentää päätös-: 25 puiden muistitarvetta käytetään yleensä häviöllisiä menetelmiä. Näihin • V ratkaisuihin kuuluu mm. päätöspuiden attribuuttiarvojen ryhmittely, päätöspuun koulutusprosessin lopetuskriteerien optimointi, päätöspuun karsiminen virhelukemien perusteella ja muita vastaavia menetelmiä.

• · * !*·". 30 Tunnetun tekniikan mukaisissa pienimuistisissa päätöspuumenetel- • « ‘H missä suorituskyky kärsii aina, kun järjestelmä optimoidaan muistin suhteen. Tarkkuuden ja muistintarpeen välillä on aina tehtävä komp-romisseja. Nyt esillä olevan keksinnön mukainen ratkaisu sen sijaan mahdollistaa sen, että tarkkuus ei kärsi, ja muistin käyttö optimoituu. - 35 Muistin tarvetta voidaan vähentää huomattavasti suoritustehon kärsi mättä.

5 · 118062 Tämän tarkoituksen saavuttamiseksi menetelmä puumaisen tietorakenteen käsittelemiseksi käsittää vaiheet, joissa luodaan päätöspuu, joka koostuu vanhempisolmusta ja ainakin yhdestä lehtisolmusta, ja 5 lisäksi etsitään tietoa mainituista solmuista. Mainitulle menetelmälle on tunnusomaista päätöspuu, joka muodostetaan tallentamalla solmut peräkkäin siten, että solmut seuraavat vanhempisolmua tallennusjärjes-tyksessä, jolloin haettavan tiedon kontekstin määritteleviin solmuihin voidaan päästä ilman niiden vanhempisolmusta lähtevää linkkiä.

10 Järjestelmälle puumaisen tietorakenteen käsittelemiseksi on ominaista muodostaja, joka on järjestetty muodostamaan päätöspuu tallentamalla solmut peräkkäin siten, että solmut seuraavat vanhempisolmua tallennusjärjestyksessä, jolloin haettavan tiedon kontekstin määrittele-15 viin solmuihin voidaan päästä ilman niiden vanhempisolmusta lähtevää linkkiä.

Keksinnön mukainen laite käsittää tallennusvälineen tietojen tallentamiseksi puumaisessa tietorakenteessa sekä suorittimen tietojen käsit-20 telemiseksi mainitussa rakenteessa, joka suoritin käsittää päätöspuun . . muodostajan ja tietojen hakijan mainituista solmuista. Laitteelle on » · · :.·γ tunnusomaista se, että muodostaja on järjestetty laatimaan päätöspuu ‘ i tallentamalla solmut peräkkäin siten, että solmut seuraavat vanhempi- solmua tallennusjärjestyksessä, jolloin haettavan tiedon kontekstin • · · 25 määritteleviin solmuihin voidaan päästä ilman niiden vanhempi- solmusta lähtevää linkkiä.

* * -« · « • · ·

Mainitulle puumaiselle rakenteelle, joka koostuu vanhempisolmusta ja ainakin yhdestä lehtisolmusta, jotka mainitut solmut käsittävät haetta- !···, 30 vaa tietoa, on tunnusomaista se, että solmut sijaitsevat peräkkäin siten, • · että solmut seuraavat vanhempisolmua tallennusjärjestyksessä, jolloin haettavan tiedon kontekstin määritteleviin solmuihin voidaan päästä ‘:‘*j ilman niiden vanhempisolmusta lähtevää linkkiä.

• * • 4 · • *· ,·. i 35 Keksinnön mukainen tietokoneohjelmatuote käsittää tietokoneen tal-‘ * lennusvälineen sekä tietokoneella luettavan koodin, joka on tallennettu ' 6 118062 tietokoneen muistivälineeseen puumaisen tietorakenteen käyttämiseksi, joka käsittää vanhempisolmun ja ainakin yhden lehtisolmun ja joka on tallennettu mainittuun tallennusvälineeseen. Tietokoneella luettava koodi käsittää käskyjä tietojen etsimiseksi solmuista. Tieto-5 koneohjelmatuotteelle on tunnusomaista se, että tietokoneella luettava koodi sisältää käskyjä solmujen järjestämiseksi peräkkäin siten, että solmut seuraavat vanhempisolmua tallennusjärjestyksessä, jolloin haettavan tiedon kontekstin määritteleviin solmuihin voidaan päästä ilman niiden vanhempisolmuista lähtevää linkkiä.

10

Keksinnön ensimmäisessä osassa on kuvattu karsivaa ryhmittely-menetelmää (clipped alignment method) jota käytetään päätöspuun kouluttamisessa. Tämä menetelmä mahdollistaa korkealaatuisen ryhmitellyn sanakirjan muodostamisen lingvististen tietojen pohjalta. Ilman 15 karsintamenetelmää, kuten tunnetun tekniikan mukaisissa menetelmissä, kielellistä tietämystä ei saada täysin hyödynnettyä. Nyt esillä olevan keksinnön ansiosta voidaan myös helposti löytää väärät hakusanat (foneemi-kirjainparit). Tämän johdosta säännönvastaisuudet vähenevät, ja muistin sekä ryhmitellyn sanakirjan avulla koulutettavien 20 päätöspuiden tarkkuus paranee. Keksintö mahdollistaa vastaavasti . . sellaisten vieraskielisten sanojen ja nimien hakusanojen poistamisen, • k · |*V jotka noudattavat englanninkielestä poikkeavia ääntämissääntöjä.

·· ; Luonnollisesti myös säännönvastaisuudet vähenevät. Karsiva ryhmittelymenetelmä voi myös jossain määrin havaita virheellisiä tran- · 25 skriptioita, jotka se voi jättää huomioimatta. Koska virheellisiä j*\: muunnospareja (mapping pair) sisältävät hakusanat karsiutuvat pois, voidaan mahdollista pienen todennäköisyyden muunnosparia hyödyntää oikealla tavalla.

*

«M

* [*·*. 30 Keksinnön edullinen suoritusmuoto on esitetty kuvissa, joiden yksityis- • · kohtaisempi selostus seuraa jäljempänä, sekä oheisissa vaatimuk-sissa. Keksinnön muita tavoitteita ja etuja on myös kuvattu selityk- » sessä. Itse keksintö on kuvattu yksityiskohtaisesti vaatimuksissa.

• · • » « * ·« .·. j 35 Kuva 1 esittää esimerkkiä päätöspuusta, joka käsittää attribuut- * · m teja ja foneemin sisältäviä solmuja ja lehtiä, 118062 7 kuva 2 esittää esimerkinomaista tekstistä-foneemiksi-muunnok- sessa käytettävää kirjaimen’a’päätöspuuta, 5 kuva 3 esittää esimerkkiä grafeemia koskevasta Markovin piilo- mallista, kuva 4 esittää keksinnön mukaista menetelmää periaatteelli sena kuvantona, 10 kuva 5 < esittää esimerkkiä linkitetyn listan menetelmästä, jossa solmu käsittää osoitintaulukon, kuvat 6a -6d esittävät esimerkkejä neljästä menetelmästä päätös-15 puun tallentamiseksi, ja kuva 7 esittää erittäin pelkistettyä esimerkkiä keksinnön mu kaista menetelmä soveltavasta laitteesta.

20 Keksinnön mukaisessa menetelmässä sovelletaan päätöspuun hä- ; viötöntä koodausta yhdessä rajoitetun Viterbi-algoritmin kanssa. Kek- ··: : sintö soveltuu sellaisille kielille kuten esimerkiksi englanti, joissa yksi * * : kirjain voi vastata ei yhtään, yhtä tai kahta foneemia.

• · * • * · : 25 Kuvassa 4 on esitetty korkean tason kuvaus ehdotetusta päätöspuihin perustuvasta ääntämismallinnuksesta. Ratkaisu perustuu ääntämis- ·"*. sanakirjaan, joka on ryhmitelty karsivan ryhmittelyalgoritmin avulla.

Päätöspuiden kouluttaminen perustuu ryhmiteltyyn ääntämissana- kirjaan, ja koulutuksen tuloksena on päätöspuupohjainen ääntämis- "M 30 malli. Koulutuksen jälkeen puut muunnetaan pienimuistiseen muotoon '*:** päätöspuiden muistitarpeen pienentämiseksi. Pienimuistinen päätös- puuesitys muodostuu päätöspuun solmujen muokkaamisesta sopivaan *:**: muotoon ja päätöspuun muuttujien pakkaamisesta pakkausmenetel- .·!: mällä, joka saa aikaan pienimmän muistinkulutuksen. Keksintö esittää • · · | 35 menetelmät karsivan koulutusryhmittelyn suorittamiseksi ja päätös- ** puiden muuntamiseksi pienimuistiseen muotoon. Ääntämissanakirja 8 118062 sisältää sanat ja niiden ääntämisasut. Päätöspuu pystyy oppimaan tiiviin muunnoksen koulutussanastosta informaatioteoreettisia periaatteita käyttäen.

5 Keksinnön selkiyttämiseksi keksintö on jaettu seuraaviin osiin: 1. Karsiva ryhmittelymenetelmä 2. Pienimuistinen päätöspuumenetelmä 3. Bittivaraus päätöspuun dataelementeille.

10 Keksinnön mukaisen karsivan ryhmittelymenetelmän ensimmäinen osuus on tarkoitettu pienimuistisen päätöspuun koulutusta varten, jota pienimuistista päätöspuuta on kuvattu tarkemmin osiossa kaksi. Kolmannessa osassa on esitetty menetelmiä päätöspuun dataelementtien pakkaamiseksi minimimuistitarpeen aikaansaamiseksi. Ensimmäiseksi, 15 ennen päätöspuun kouluttamista, hakusanat, tai selityksessä käytetyn termin mukaan ääntämissanakirjan hakusanat kuitenkin ryhmitellään kirjainten ja foneemien välisen vastaavuuden löytämiseksi. Ryhmittely voidaan saada aikaan lisäämällä foneemisia tyhjämerkkejä (joita kutsutaan foneemiepsiloneiksi, ja jotka merkitään niiden kirjainten fo-20 neemisarjoihin joita ei lausuta, ja näennäisfoneemeja niitä kirjaimia varten, jotka muodostavat kaksi foneemia. Näennäisfoneemit saadaan * · ;1: 2· aikaan liittämällä yhteen kaksi foneemia (/el/, /oU/,...), joiden tiedetään : vastaavan yhtä kirjainta.

* · · 25 Ryhmittelyssä sovelletaan HMM-VIterbi-algoritmia. HMM-Viterbi-algo- :1·2: ritmin käyttö varmistaa sen, että ryhmittely suoritetaan optimaalisella :3· tavalla tilastollisessa mielessä, mikä näin ollen pienentää sanakirjan • · · hakusanojen jäljellejäävää entropiaa. Lisäksi HMM-Viterbi-algoritmin käytön etuna ryhmittelyssä on se, että voidaan saada aikaan tilastoni- 30 sesti optimaalinen ryhmittely. Taulukossa 1 on esitetty esimerkki ryh- *:1’ mitellystä ääntämissanakirjasta.

* 1 1 • · • · - * · • 1 « · · ··· 2 • · · • · · 3 • φ 118062 9

Sana Ryhmitelty foneemisarja aaron _Er2s@n abraham elbr2s@häm accola A:_koUls@ ackerman ä _ k _ s@r m s@ n ada el d s@ adelaide äds@lel_d_ ahmanson A: _m s@ n s s@ n aikman el _ k m s@ n alabamas A: 1 A: b A: m s@ z

Taulukko 1 Esimerkki ryhmitellystä ääntämissanakirjasta.

5

Markovin piilomalli (Hidden Markov Model, HMM) on tunnettu ja laajasti käytössä oleva tilastollinen menetelmä, jota on sovellettu mm. puheentunnistuksessa. Tätä mallia on voidaan myös kutsua Markovin lähteiksi tai Markovin ketjun todennäköisyysfunktioiksi. HMM:iin sisältyy se ole-10 tus, että signaalia voidaan luonnehtia parametriseksi satunnaisproses- . . siksi, ja että satunnaisprosessin parametrit voidaan määritellä/arvioida • · · : tarkalla, hyvin määritellyllä tavalla. HMM voidaan jakaa epäjatkuviin : malleihin ja jatkuviin malleihin sen mukaan ovatko kutakin tilaa vastaa- • · · vat tarkasteltavat tapahtumat epäjatkuvia, kuten koodisanoja, vai jatku- I.;’: 15 via. Kummassakin tapauksessa havainnot ovat todennäköisyyteen pe- rustuvia. Malli liittyy taustalla olevaan satunnaisprosessiin, joka ei ole suoraan havaittavissa (joka on piilotettu), vaan joka voidaan havaita vain toisten havaintosarjan muodostavien satunnaisprosessien avulla. .·. HMM koostuu piilotetuista tiloista, joiden välillä tapahtuu siirtymiä. Ma- 20 temaattinen esitys sisältää kolme kohtaa: tilojen välisten tilasiirtymien • · "* todennäköisyys, jokaisen tilan havainnointitodennäköisyys ja alkutila- • · * jakauma. HMM:n ja havaintojen perusteella käytetään Viterbi-algoritmia *"*: havaintotilan ryhmittelyssä seuraamalla parasta polkua.

• · • · * • · · .·. j 25 Ääntämissanakirjan ryhmittelemiseksi tietylle kirjain-foneemiparille ‘ * määritellyt lukuarvot P(f, I) alustetaan nollalla, mikäli foneemi f löytyy 118062 10 kirjaimelle / sallittujen foneemien listalta, muussa tapauksessa ne alustetaan suurilla positiivisilla arvoilla. Kun alkuarvot on määritelty, sanakirja ryhmitellään kahdessa vaiheessa. Ensimmäisessä vaiheessa kaikki mahdolliset ryhmittelyt suoritetaan jokaiselle sanakirjan haku-5 sanalle. Tämän jälkeen lukuarvot lasketaan uudelleen ryhmiteltyjen hakusanojen perusteella. Toisessa vaiheessa etsitään vain yksi paras ryhmittely kullekin hakusanalle.

Jokaiselle hakusanalle voidaan löytää paras ryhmittely grafeemeihin 10 liittyvän HMM-mallin Viterbi-algoritmilla. Kuvassa 3 on esitetty esimerkki Markovin piilomallista. Grafeemeihin liittyvä HMM-malli käsittää hakusanan E, poistumiskohdan X ja kirjainten S1, S2, S3 tilat. Ne kirjaimet, jotka voisivat vastata näennäisfoneemeja käsitellään siten, että niillä on kestotila D. Kuvassa 3 esitetyt tilat S1 - S3 ovat sanan ään-15 nettyjä kirjaimia vastaavia tiloja. Tila S2 vastaa kirjainta, joka voi muodostaa näennäisfoneemin, ja tästä syystä tilalla S2 on kestotila D. Siirtymiset kaikista edellisistä tiloista nykyiseen tilaan sallitaan foneemi-epsilonien tukemiseksi. Jokaiseen tilaan ja kestoillaan liittyy merkki, joka sisältää kumulatiivisen lukuarvon foneemisarjan grafeemeihin liit-20 tyvän HMM-mallin avulla tapahtuvaa ryhmittelyä varten, sekä kumula-, . tiivistä lukuarvoa vastaavat tilasarjat. Foneemisarja ryhmitellään käy- · mällä foneemisarja läpi alusta loppuun foneemi kerrallaan. Kirjainten ja : foneemien välisen Viterbi-ryhmittelyn selvittämiseksi suoritetaan merk- ··« kien kopiointia tilojen välillä (token passing). Lopuksi se merkki, jonka 25 kumulatiivinen lukuarvo on pienin löytyy kaikista HMM-mallin tiloista.

Merkin tilasarjan perusteella voidaan määritellä sanan kirjainten ja fo- :***; neemien välinen ryhmittely.

• · *

Ryhmitelty sanakirja voi sisältää seuraavia hakusanoja: *::: 30 • · a) Vierasperäiset nimet ja sanat, kuten ’’Juan, Xiong, jne” sisältyvät ··· englanninkieliseen ääntämissanakirjaan. Tekstistä-foneemiksi-muun- *:*·: noksessa on suositeltavampaa käyttää näitä sanoja vastaavan kielen .·!: yhteydessä englannin sijaan. Nämä sanat synnyttävät ääntämiseen • · · I 35 epäsäännönmukaisuuksia, jotka tekevät päätöspuusta suuremman ja ** epätarkemman.

11 b) Virheellinen transkriptio. Sanakirjaan syntyy väistämättäkin joitakin virheellisiä transkriptioita kirjoitusvirheiden tai muiden ennalta-arvaa-mattomien syiden johdosta. Ne saavat aikaan epäsäännönmukaisuuk- 5 siä ääntämiseen sekä ääntämisvirheitä.

c) Virheellinen ryhmittely, esimerkiksi “apple-äpVl_ “ Kielitieteellisen perustiedon perusteella tiedetään, että kirjain "p” ei koskaan vastaa vokaalifoneemia ”V”. Tämä saa jälleen aikaan epäsäännönmukaisuuk- 10 siä ääntämiseen sekä ääntämisvirheitä.

Edellä mainittujen ongelmien ratkaisemiseksi on esitetty keksinnön mukainen karsiva ryhmittelymenetelmä, joka hyödyntää Viterbi-algo-ritmia. Tämän menetelmän avulla ryhmitelty ääntäminen saadaan 15 säännönmukaisemmaksi, mikä johtaa pienempään muistintarpeeseen keksinnön mukaisissa päätöspuupohjaisissa tekstistä-foneemiksi-mal-leissa.

1. Karsiva ryhmittelymenetelmä pienimuististen Däätösouiden koulut- 20 tamiseksi • » ··* · Keksinnön mukaisesti ryhmittely suoritetaan päivitettyjen lukuarvojen : P(f l) perusteella, joka päivitys suoritetaan edellä kuvatun ryhmitellyn sanakirjan avulla. Luonnollisesti tällainen ryhmittely on erittäin epä- : 25 tarkka, jolloin lukuarvot P(f, l) ovat likimääräisiä. Se myös päivittää luku- :*·*: arvon P(f l) silloin kun se ei ole lingvistisesti mahdollista. Esimerkiksi « * ;···. P(“V“, “p”):Ile annetaan arvo, mutta se on selvästi vastoin kielellistä tietoa. Tämän välttämiseksi ja edellä mainittujen ongelmien (a - c) eli- minoimiseksi Viterbi-dekoodauksessa sovelletaan rajoituksia, joita kut- *::: 30 sutaan karsivaksi menetelmäksi.

• # • « • « · • C!: Esitetyn karsivan ryhmittelyalgoritmin tulee määritellä kohdekielen aak- *:*·: koselliset ja foneettiset joukot. Taulukossa 2 esitetty lista määrittelee .·!; ne foneemit ja näennäisfoneemit, joita kirjain voi lingvistisen tiedon lm | 35 mukaan vastata (määrittely perustuu asiantuntijan kielelliseen tietä- • K * · 118062 12 mykseen). Alla oleva taulukko 2 sisältää vain täysin kieliriippuvaista tietoa.

Kirjain Vastaavat (näennäis)foneemit a V, A, ä, el, e, O, _ b b,_ c k, s, tS, S, _ 1 1,V,V_1,_ z z, s, tS, t, t_s, dZ, S, _ 5 Taulukko 2 Esimerkki aakkosten foneemi- ja näennäisfoneemi-määrittelyistä

Taulukko 2 voidaan toteuttaa eri tavoin, mutta toteutusten päämäärä on sama.

10

Ryhmiteltyjen hakusanojen perusteella lukuarvot lasketaan uudelleen. Näin jokaiselle hakusanalle etsitään vain yksi paras ryhmittely. P(f, l) päivitetään normaaliin tapaan jos foneemi 2/on löydettävissä taulu- • » i kosta 2, mikä tarkoittaa sitä, että foneemi / on lingvistisesti sallittu kir- :.f; 15 jaimelle l. Jos taulukosta 2 ei löydy foneemia /tietylle kirjaimelle /, so- velletaan rajoitusta ja P(f l) asetetaan korkeimmaksi arvoksi päivitystä • suorittamatta.

• * * * • * · • · * • · .··*·. Näin vain ne kirjain-foneemiparit jotka löytyvät edellä esitetystä taulu- 20 kosta ovat sallittuja ryhmitellyssä sanakirjassa tekstistä-foneemiksi-muunnoksen toteuttavan päätöspuun kouluttamiseksi.

«•tl • · * • · *♦;·* Menetelmän ansioista lingvistinen tieto voidaan ottaa huomioon melko :**/ helposti. Jotkut hakusanat karsiutuvat pois ryhmittelyssä käytettävän ·:··; 25 karsintamenetelmän johdosta. Karsitun hakusanalistan avulla voidaan .· . helposti löytää tai muokata lingvististä informaatiota, esimerkiksi mää- *: *; rittää uusia näennäisfoneemeja, lisätä puuttuvia foneemeja kirjain- • · φ ’· " riippuvaiseen foneemiryhmään, jne. Kun käytössä on parempaa ling- : 13 118062 .

vististä informaatiota, voidaan ryhmittelyä tehostaa ja muistinkäyttöä vähentää.

2. Päätöspuun mallirakenne 5

Tietyn kielen tekstistä-foneemiksi-mallin koko minimoidaan minimoimalla kaikkien kirjainten tekstistä-foneemiksi-mallien muistintarve. Tästä syystä tarkastellaan yksittäisen päätöspuun muistitarpeen minimointia.

10

Kuvissa 1 ja 2 esitettyä päätöspuumallin suoraa linkitetyn listan toteutusta ei sopivimmin käytetä. Syynä on se, että linkitetyn listan menetelmässä puun jokainen solmu sisältäisi ylimääräisen osoitintaulukon. Tämän ylimääräisen muistinkulutuksen poistamiseksi puun solmut tal-15 lennetään muistiin sopivimmin sellaisessa järjestyksessä, että niitä voidaan käyttää tekstistä-foneemiksi-konversiossa.

Järjestyksen tulee olla sellainen, että kun kirjaimelle määritellään oikea konteksti, seuraava sopiva konteksti on myös välittömästi seuraavan 20 tason konteksti. Toisin sanoen, vaikka tunnetun tekniikan mukainen linkitetyn listan puu voidaan tallentaa muistiin missä tahansa järjestyk- : sessä, keksinnön mukaista puuta ei voida niin tallentaa. Tunnetun tek- · nilkan mukaisen linkitetyn listan puun rakenne huolehtii oikeanlaisten viittausten muodostamisesta automaattisesti: seuraavan tason solmuja : 25 etsittäessä algoritmi löytää tiedot käyttämällä solmuihin tallennettuja ·*.·; linkkejä (osoittimia). Nämä linkit käyttävät muistia, ja niiden ainoana • · .*··. tarkoituksena on mahdollistaa puussa eteneminen. Kuvassa 5 voidaan nähdä esimerkki linkitetyn listan menetelmästä, jossa solmu (I0) käsit-tJi tää osoitintaulukon, josta päästään kirjaimia vastaaviin lapsisolmuihin ":i 30 (11,12,13,14,15,16). Jollei lapsisolmu ole lehtisolmu (kuten I2,15), niin se *·;·* käsittää edelleen osoitintaulukon.

• · · • · • · • · * *:··· Keksintö perustuu siihen ajatukseen, että kun puun solmut tallennetaan . muistiin oikeassa järjestyksessä, voidaan linkit tai osoittimet jättää pois *: *i 35 solmuista, jolloin muistia säästyy. Tällaisia järjestelyjä ovat esimerkiksi f I · syvyyssuuntaiset ja leveyssuuntaiset tallennusmenetelmät, tai niiden 118062 14 yhdistelmät, kuten kuvissa 6a - d on esitetty. Toisin sanoen keksinnön ajatuksena on tallentaa puiden sisältö tietyssä tekstistä-foneemiksi-konversioon soveltuvassa järjestyksessä siten, että puuhun voidaan kohdistaa kunnollisia hakuja vaikka siinä ei olisikaan linkkejä, δ

Syvyyssuuntaisessa tallennusmenetelmässä puun solmut tallennetaan seuraamalla puurakennetta ensin äärimmäisenä vasemmalla olevaan lehteen. Tämän jälkeen siirrytään seuraavana oikealla olevassa haarassa aina viimeiseen lehteen asti. Kuvassa 6a on esitetty esimerkki 10 kuvan 1 päätöspuurakenteesta, jossa solmut ja lehdet on muunnettu pienimuistiseen syvyyssuuntaiseen muotoon. Syvyyssuuntaisessa tallennusmuodossa jokainen solmu on tallennettu sopivimmin vain kerran.

Esimerkiksi juurisolmu tallennetaan vain kerran. On itsestään selvää, että jokainen solmu, esimerkiksi juurisolmu, voidaan tallentaa kahdesti 15 tai useammin (kuten kuvassa 6a).

Leveyssuuntaisessa tallennusmenetelmässä puun juuri R tallennetaan ensin, jonka jälkeen seuraavat kaikki ensimmäisen tason solmut, sitten kaikki toisen tason solmut, jne. Kuvassa 6b on esitetty esimerkki kuvan 20 1 päätöspuurakenteesta, jossa kaikki solmut ja lehdet on muunnettu . pienimuistiseen leveyssuuntaiseen muotoon.

• · · ···#, * * φ * · :;j.: Yhdistetyssä tallennusmenetelmässä voidaan yhdistää syvyyssuuntai- nen ja leveyssuuntainen menetelmä. Kuvissa 6c ja 6d on esitetty esi- • · : 25 merkkejä yhdistetystä päätöspuun 1 tallennusmenetelmästä, jota on j\‘: jatkettu alemmilla solmutasoilla (M, N, O). Kuten kuvassa 6c on esi- tetty, voidaan leveyssuuntaista menetelmää käyttää aina kolmannelle tasolle (L) asti, josta eteenpäin käytetään syvyyssuuntaista menetel-mää. Vaihtoehtoisesti, kuten kuvassa 6d on esitetty, voidaan täydellistä !"·. 30 leveyssuuntaista menetelmää käyttää aina kolmannelle tasolle (L) asti, josta eteenpäin jokaisen solmun alipuut kolmannella tasolla (L) tallen-netaan yksittäin leveyssuuntaisessa järjestyksessä. Tämä voidaan " tehdä nopeamman muistinsaannin mahdollistamiseksi todennäköisesti : tarvittaville solmuille.

• * * Λ i 35 • · * • · ' 15 118062 Näiden tallennusmenetelmien tarkoituksena on mahdollistaa puun tallentaminen ilman puurakenteessa olevia linkkejä tai osoittimia. Toimiakseen kunnolla tallennusmenetelmän tulee olla sellainen, että kun linkit on poistettu, solmut järjestetään peräkkäin muistiin niin, että ne sol-5 mut, joita voidaan käyttää kontekstin määrittelemiseen, seuraavat aina vanhempisolmua tallennusjärjestyksessä.

Puun solmut tallennetaan kuvatulla tavalla haara haaralta. Päätöspuun yksittäinen sisäsolmu I käsittää seuraavaa tietoa sisältäviä data-10 elementtejä: - attribuuttiarvo, kuten kirjain - sisäsolmun I ja lehden L erottava yksi bitti - attribuuttityyppi aj - foneemi pj, joka vastaa tiettyä kontekstia 15

Yksittäinen lehtisolmu L käsittää seuraavaa tietoa sisältäviä data-elementtejä: - attribuuttiarvo, kuten kirjain - sisäsolmun 1 ja lehden L erottava yksi bitti 20 - foneemi Pi, joka vastaa tiettyä kontekstia , . - bitti, joka ilmoittaa, onko kyseessä vanhempisolmun viimeinen lv lehti • · * • ta • · * * • · *

Esitetyn menetelmän avulla voidaan minimoida päätöspuumallien > · · 25 muistintarve. Viimeksi mainittua tarkoitusta varten päätöspuun data- j'*‘: elementiksi on määritelty attribuuttityyppi, attribuuttiarvo tai foneemi.

• · * • · .

• • * · 3. Menetelmiä dataelementtien esittämiseksi päätöspuussa • · · "··. 30 Tämä keksinnön osa kuvaa kolmea menetelmää päätöspuun data- ♦ # *" elementtien esittämiseksi minimimuistivaatimusten aikaansaamiseksi.

···

Esitetyt menetelmät ovat päätöspuun dataelementtien kiinteäbittinen varaus (fixed bit allocation) ja muuttuvabittinen varaus (variable bit al-: location), sekä päätöspuun dataelementtien Huffman-koodaus.

I 35 • · · • · ...

16 118062 Päätöspuun dataelementtien kiinteäbittinen varaus Päätöspuun koko on kaikkien sen sisäsolmujen ja lehtien kokojen summa. Seuraavassa analysoidaan sisäsolmujen ja lehtien kokoa. 5 Tässä yhteydessä esitetyt luvut pätevät englanninkieleen.

a) Attribuuttiarvojen lukumäärä: kirjaimia on kaksikymmentäkuusi, foneemeja on alle kuusi-kymmentäneljä ja foneemiluokkia on alle kuusitoista. Näi-10 den välinen maksimiarvo on kuusikymmentäneljä, jolloin attribuuttiarvoille on varattu kuusi bittiä b) Attribuuttityyppien lukumäärä:

Neljän pituiselle kontekstille on neljä kirjainta käsiteltävänä 15 olevan kirjaimen vasemmalla ja oikealla puolella, neljä fo neemia sen vasemmalla puolella ja neljä foneemiluokkaa käsiteltävänä olevan kirjaimen vasemmalla puolella. Näin ollen yhteissummaksi saadaan kuusitoista, ja näin ollen attribuuttityypeille varataan neljä foneemia.

20 . „ c) Foneemien lukumäärä: • · ·

Englannin kielessä lukumäärä on kolmenkymmenenkah- • * * , :y · den ja kuudenkymmenenneljän välillä, jolloin foneemeille on varattu kuusi bittiä.

: 25 d) Sisäsolmuja/lehtiä ilmaiseva lippu vaatii vain yhden bitin.

• · « * * · e) Tietyn sisäsolmun lehtien päättymisen ilmaiseva lippu vaatii vain yhden bitin.

**·· ..

.**. 30

Edellä esitettyä bittivarausta kutsutaan kiinteäbittiseksi varaukseksi, koska bittien lukumäärä on ennalta määrätty ja muuttumaton.

* * : Sisäsolmun ja lehden koot voidaan määritellä seuraavalla tavalla: : 35 * ·«

Sisäsolmun kohdalla koko on kohtien a), b), c) ja d) summa: 118062 17

Sisäsolmunjcoko = 6 + 4 + 6 + 1 = 17 bittiä

Lehden koko on kohtien a), c), d) ja e) summa:

Lehden_koko = 6 + 6 + 1 + 1 =14 bittiä 5 Päätösouun dataelementtien muuttuvabittinen varaus Päätöspuupohjaisessa tekstistä-foneemiksi-muunnoksessa jokainen 10 puu vastaa yhtä kirjainta. Keksinnön ensimmäisessä osiossa on esitetty karsintamenetelmä. Vain vastaavat foneemit, jotka on listattu taulukkoon 2 sallitaan tietylle kirjaimelle ryhmitellyssä sanakirjassa. Tästä syystä jokaisen puun foneemien lukumäärä on rajoitettu Taulukon 2 mukaan. Esimerkiksi kirjaimella ”a” on 7 mahdollista foneemia, jolloin 15 foneemeille tulee varata 3 bittiä sen sijaan että kaikille foneemeille varattaisiin 6 bittiä, kuten edellä on kuvattu (c). Tämän syynä on se, että kirjaimelle ”a” käytetään vain seitsemää foneemia, kaikki muut karsiutuvat pois ryhmittelyn aikana. Nyt bittien lukumäärä vähenee kolmella sekä sisäsolmujen että lehtien kohdalla. Foneemeille varattujen bittien 20 lukumäärä vaihtelee luonnollisestikin eri lehdissä.

* · • · * ;·γ Karsintamenetelmässä jokainen kirjain / voi vastata vain kirjainriippu- :*j · väistä foneemijoukkoa.

« · • * * · * 25 l ->p, jossa Pe {/>,,/7,,:..,pj.

• · * • * · ♦ · * *

Foneemi voidaan koodata kirjainriippuvaisen foneemijoukon perusteella kokonaisen kieliriippuvaisen foneemijoukon sijaan. Tätä mene-telmää kutsutaan muuttuvabittiseksi varaukseksi, koska foneemeille .··*. 30 varattujen bittien lukumäärä voi vaihdella kirjaimesta ja puusta toiseen.

Esimerkiksi kiinteäbittisen varauksen menetelmissä ”a” muunnetaan • · · koko foneemijoukon (40 foneemia) perusteella, kun taas muuttuvabitti- sen varauksen menetelmässä kirjain ”a” voidaan muuntaa kirjainriippu- vaisen foneemijoukon mukaan (englannin kielessä 8 foneemia). Näin .·. · 35 se vaatii [Iog2(40)j = 6 bittiä kiinteäbittisessä varauksessa ja • * · [log2(8)j = 3 bittiä muuttuvabittisessä varauksessa.

118062 18

Kirjainriippuvaista bittivarausta voidaan käyttää myös muita data-elementtejä kuten attribuuttityyppejä ja attribuuttiarvoja varten. Tämän toteuttamiseksi tulee tietylle kirjaimelle löytää kaikki mahdolliset attri-5 buuttityyppien ja attribuuttiarvojen joukot. Kun nämä joukot ovat tiedossa, attribuuttityyppien ja attribuuttiarvojen vaatima bittimäärä voidaan laskea.

Muuttuvabittisen varauksen soveltamiseksi päätöspuun dataelemen-10 teille jokaiselle kirjaimelle etsitään sallitut foneemit, attribuuttityypit ja attribuuttiarvot. Kun joukot on saatu selville, ne tallennetaan taulukoihin. Jos taulukon dataelementtiä vastaava koko on n, dataelementin tallentamiseen muuttuvan bittiallokaation avulla tarvittava bittimäärä on [log2(n)j bittiä. Taulukko tulee tallentaa muistiin, mikä aiheuttaa yleis-15 rasitteen. Tästä syystä muuttuvabittistä varausta käytetään vain jos muuttuvabittisestä varauksesta syntyvä säästö (Saved_var_bits) on suurempi kuin taulukon tallennuksesta syntyvä ylimäärä {Overheadvarjbits).

20 Säästettyjen bittien lukumäärä lasketaan seuraavalla tavalla: , , Saved var_bits = • · · j··'· (NumjbitsJixed — Num_bits_variable)Count_occurrence ···.' • ·

NumjbitsJixed vastaa dataelementeille varattujen bittien lukumäärää !.:*· 25 kiinteäbittisessä varauksessa. Num__bitsjvariable vastaa dataelementille varattujen bittien lukumäärää muuttuvabittisessä varauksessa.

Countoccurrence on dataelementin esiintymiskertojen lukumäärä «·· päätöspuussa.

*·* T", 30 Dataelementille tallennetun taulukon ylimäärä lasketaan seuraavalla Γ* tavalla: * · ·

Overhead_var_bits = (Sizejable + 1 JBitsJnJbyte • ‘ 1 • · * * * * * .·! : Siz&jable vastaa taulukossa olevien elementtien määrää, ja Bits_in_byte • · · ! * 35 on kahdeksan • « » • ♦ * * 118062 ' 19

Elementtien Saved_var_bits ja Overhead_var__bits välinen vertailu suoritetaan jokaisen dataelementin kohdalla (attribuuttityyppi, attribuuttiako ja foneemi) ja jos Saved_var_bits on suurempi kuin Overhead_var_bits, käytetään muuttuvabittistä varausta: 5 jos Saved_var_bits > Overhead_var_bits Päätöspuun dataelementtien Huffman-koodaus 10

Binäärikoodin varaamiseksi päätöspuun dataelementeille voidaan käyttää Huffman-koodia. Huffman-koodin käyttäminen voi säästää muistia, jos päätöspuun dataelementin jakaumassa on suurta vaihtelua. Huffman-koodauksen perusajatuksena on varata suuren toden-15 näköisyyden dataelementeille lyhyitä koodisanoja, ja matalan todennäköisyyden dataelementeille pitkiä koodisanoja. Huffman-koodit ovat optimaalisia ja häviöttömiä. Koodi on pituudeltaan muuttuva, ja data-elementin koodauksessa käytettävien bittien lukumäärä määräytyy tiettyä dataelementtiä vastaavan koodisanan pituuden mukaan. 20 Huffman-koodi tulee määritellä jokaiselle päätöspuun muuttujalle erik- . . seen.

• · » • · · *·*· • * : Alla olevassa taulukossa 3 on esitetty esimerkki Huffman-koodauk- * · · Σ...: sesta kirjaimen ”a” foneemeille englannin kielessä. Foneemien 25 pakkaussuhde on 1.2554. Taulukossa käytetty lyhenne ”FLC” tarkoittaa :*·[: kiinteämittaista koodia (Fixed Length Code).

• * » • · ♦ • · · ··*·.

* · · • · • · * ·* • * » • · • * · ♦ ··«««< • * ··· • * « • »* • » * · « · * » · 118062 20

Foneemit A: ä ai E el I V _

Toden- 0.2238 0.277 0.0019 0.0250 0.1211 0.0075 0.2650 0.0780 näköisyys FLC 000 001 010 011 100 101 110 111

Huffman- 10 01 110000 11001 111 110001 00 1101 koodi

Taulukko 3 Kirjaimen "a” foneemien koodaus amerikan englannissa päätöspuun avulla 5 Jotta Huffman-koodausta voitaisiin käyttää päätöspuun dataelementeille, tulee Huffman-koodit, jokaisen koodin bittimäärä ja vastaava aakkosten kirjain tallentaa muistiin, mikä aiheuttaa yleisrasitetta. Päätös siitä, käytetäänkö Huffman-koodausta tehdään jokaiselle data-elementille erikseen. Tietylle dataelementille voidaan käyttää Huffman-10 koodausta vain jos Huffman-koodauksesta saatava säästö (Scivedjiuffjbits) on suurempi kuin ylimäärä (Overheadjiuffjbits).

Huffman-koodauksella säästettyjen bittien lukumäärä voidaan laskea kaavalla: . . 15 Saved huff bits - * m m " 'θ,· (NumJjitsJixed - Num_bits_CWi)Count_CWi • * · • * · « · « • · *

NumjbitsJixed vastaa dataelementille varattujen bittien lukumäärää kiinteäbittisessä varauksessa. Numjits.„CW, vastaa i:ntena koodina : j 20 Huffman-koodatussa puussa esiintyvälle koodille varattujen bittien lukumäärää.

* · * .i. Huffman-koodin tallennuksen ylimäärä voidaan laskea kaavasta: ***· * * · • * * * *·* 25 OverheadJhuff Jbits = (3 NumJmjfjCW + 1) Bits_perjbyte • i • * ·**

Num_huffLCW vastaa dataelementin Huffman-koodien määrää, ja Bitsjn_byte on kahdeksan. Oletuksena on, että Huffman-koodit, :*.J Huffman-koodeissa olevien bittien määrää ilmaisevat muuttujat sekä 30 aakkosten kirjaimet on tallennettu yksittäisiin tavumuuttujiin.

118062 21

Elementtien Saved_huff_bits ja Overheadjiuffjbits välinen vertailu suoritetaan jokaisen dataelementin kohdalla (attribuuttityyppi, attribuuttiako ja foneemi) ja Huffman-koodausta sovelletaan dataelementtiin, jos määritelty ehto toteutuu seuraavalla tavalla 5 jos Saved_huffjbits > Overheadjhuffjbits.

Päätöspuun dataelementtien tallentamisessa vaadittavan muistin mää-10 rän minimointi

Puun tallentamisen perusrakenne on määrätynlainen, kuten osan 2 alussa on selostettu, mutta puussa olevat dataelementit voidaan esittää usealla tavalla. Bittien varaus voi olla pysyvää tai muuttuvaa, tai 15 käytössä voi olla Huffman-koodaus. Päätökset näiden koodausmenetelmien käyttämisestä tehdään jokaiselle päätöspuun dataelementille (attribuuttityyppi, attribuuttiako ja foneemi). Koska jokaiselle kirjaimelle on olemassa päätöspuupohjainen tekstistä-foneemiksi-malli, valinta toistetaan jokaiselle kirjaimelle.

20 . ^ Vaihtoehtoisessa suoritusmuodossa päätöstä joko kiinteämittaisen 5*V koodauksen tai Huffman-koodauksen käyttämisestä täydennetään ··· ·* mahdollisuudella käyttää niin sanottua katkaistua Huffman-koodausta.

·♦· Tässä koodausmenetelmässä tietyt dataelementtien akot, joilla on j 25 erittäin matala todennäköisyys, on ryhmitelty yhteen, ja ryhmälle an-:***: netaan yhteinen Huffman-etuliite. Dataelementin ako koodataan tä- män jälkeen akojen joukosta kiinteämittaisella koodilla. Esimerkiksi kahdeksan erittäin epätodennäköisen arvon ryhmä voitaisiin koodata 7 bitin Huffman-koodilla, jota seuraa 3 bitin kiinteämittainen koodi.

*::: 30 * * ‘J* Tietyn dataelementin kohdalla tietyssä puussa tehtävä valinta siitä, käytetäänkö kiinteäbittistä varausta, muuttuvabittistä varausta vai Huffman-koodausta suoritetaan siten, että pienimuistisen päätös-: puumailin muistivaatimukset minimoituvat. Tästä syystä päätöksenteko .·. | 35 perustuu seuraavaan logiikkaan: • · · * · 118062 22 a) Alustus: Oletetaan, että dataelementille käytetään kiinteäbittistä varausta.

b) Jos Saved_varjbits > Overhead_var_bits, dataelementille käytetään 5 muuttuvabittistä varausta: c) Jos Huffman-koodauksella saatu säästö on suurempi kuin muuttuva-bittisellä varauksella saatu säästö ja suurempi kuin Huffman-koodille määritelty ylimäärä, käytetään dataelementille Huffman-koodausta: 10

Saved_hujf_bits ~ OverheadJwffJbits >Saved_var_bits - Overhead_var_bits JA

Saved_huff_bits > Overheadjiuffjbits.

15 Keksinnössä hyödynnetään tätä minimointimenetelmää minimibitti-varauksen määrittämiseksi automaattisesti jokaiselle päätöspuun data-elementille kaikissa päätöspuissa.

Testi: 20 . . Keksintöä on testattu koulutettaessa päätöspuita USA:n henkikirjoitus- * · · listoissa esiintyvien nimien ääntämistä varten CMU:n (Carnegie Mellon : University) sanakirjasta poimittujen ääntämysten pohjalta. Ääntämis- • ♦ 1 tapojen kokonaismäärä on 40 529. Perussovelluksessa käytetään alku-j.·1: 25 peräistä ryhmittelyä päätöspuun dataelementtien kiinteäbittisellä vara- :1·1: uksella. Kuten alla olevasta taulukosta 4 käy ilmi, päätöspuumallin koko on huomattavasti pienentynyt (36%) ja tekstistä-foneemiksi-suori- • · · tuksessa ole havaittavissa heikentymistä foneemien tarkkuuden ja sarjatason (string rate) suhteen. Tämä todistaa keksinnön hyödyllisyy- *·1’ 30 den.

• « ♦ ♦ ··♦ »·· • · • · ··· • 1 • 1 • · · • · · • · • · · 118062 23

Menetelmät Muisti (kB) Foneemien tarkkuus Sarjataso

Tekniikan taso 132.5 99.27%_97.12 %

Keksintö Ιδ4.9 [99.27% [97.17%

Taulukko 4 Päätöspuun vertailu tunnetun tekniikan ja keksinnön mu-: kaisissa menetelmissä 5 Keksinnössä on esitetty erilaisia innovatiivisia tekniikoita: Ryhmittelyssä käytettävä karsintamenetelmä, päätöspuurakenne, kiinteäbittinen varaus päätöspuun dataelementeille, muuttuvabittinen varaus päätös-puun dataelementeille sekä bittien Huffman-koodaus päätöspuun data-elementeille. On itsestään selvää, että kaikkia tekniikoita voidaan hyö-10 dyntää yksin tai eri tavoin yhdistäen, mistä syystä tätä keksinnön kuvausta ei tule tulkita keksintöä rajoittavaksi.

Tekstistä-foneemiksi-järjestelmää voidaan soveltaa osana puheen-tunnistusjärjestelmää elektroniikkalaitteessa, esimerkiksi digitaalisena 15 signaalinkäsittely-yksikkönä. Elektroniikkalaite voi käsittää muita toimintoja, kuten esimerkiksi tietoliikennevälineet, kuten matkapuhelimessa T (kuva 7). Laite käsittää sopivimmin kaiuttimen H ja mikrofonin M. Tekstistä-foneemiksi-järjestelmää voidaan myös soveltaa elektro-;*V niikkalaitteen kanssa käytettävässä oheislaitteessa. Jos elektroniikka- · 20 laite on matkapuhelin, oheislaite voi muodostua kuulokkeista tai video- laseista.

• · · * · · ·*· ♦ :**]: Tekstistä-foneemiksi-järjestelmää voidaan lisäksi käyttää älykkäässä ympäristössä (ubiquitous environment) jolloin järjestelmää voidaan so-25 veltaa talon eri huoneissa, eri kodinkonelaitteissa (kuten videot, pesu-kone), huonekaluissa, tai asusteissa (esim. vaatteissa).

4 * · · *·» • * * · T On itsestään selvää, että edellä kuvattuja suoritusmuotoja ei tule tulkita • · « keksintöä rajoittaviksi, vaan ne voivat vaihdella seuraavissa patentti- "·" 30 vaatimuksissa esitettyjen keksinnöllisten piirteiden puitteissa.

• » • · « • ·· • · • · • · · • · · * ·

Claims

118062

1. Menetelmä puumaisen tietorakenteen hallitsemiseksi, joka menetelmä käsittää vaiheet joissa muodostetaan vanhempisolmun ja ainakin 5 yhden lehtisolmun käsittävä päätöspuu, ja jossa menetelmässä lisäksi etsitään tietoa mainituista solmuista, tunnettu siitä, että päätöspuu muodostetaan tallentamalla solmut peräkkäin siten, että solmut seu-raavat vanhempisolmua tallennusjärjestyksessä, jotka solmut käsittävät ainakin yhden tiedon, joka on koodattu käyttämällä informaatiota van-10 hempisolmun tai isovanhempisolmun ainakin yhdestä tiedosta, jolloin haettavan tiedon kontekstin määritteleviin solmuihin voidaan päästä ilman niiden vanhempisolmusta lähtevää linkkiä.

2. Patenttivaatimuksen 1 mukainen menetelmä, tunnettu siitä, että 15 päätöspuun solmut tallennetaan jonkin seuraavan menetelmän mukaan: syvyyssuuntaisella tallennusmenetelmällä, leveyssuuntaisella tallennusmenetelmällä tai niiden yhdistelmällä.

3. Patenttivaatimuksen 1 tai 2 mukainen menetelmä, tunnettu siitä, 20 että ennen tallennusta päätöspuu koulutetaan ryhmiteltyjen data- elementtien avulla, jotka elementit alustetaan lukuarvolla, joka on riip-: puvainen mainitun elementin oikeellisuudesta, jolloin lukuarvo aluste- • * : taan uudelleen mainitun elementin tunnettujen ominaisuuksien perus- £[·* teella lisäämällä rajoitus virheellisille elementeille. ί 25

··· · "·*· 4. Patenttivaatimuksen 1, 2 tai 3 mukainen menetelmä, tunnettu siitä, • · .·*·. että menetelmä kohdistuu tekstistä-foneemiksi-muunnokseen, jossa mainittu tieto käsittää elementtejä, kuten kirjaimia ja foneemeja, jolloin e!e päätöspuu muodostetaan yhtä kirjainta varten, ja solmut käsittävät ‘lii 30 mainitun kirjaimen foneemit. • · • · *··

5. Patenttivaatimuksen 4 mukainen menetelmä, tunnettu siitä, että ·:··· solmut käsittävät lisäksi tietoa mainitun kirjaimen kontekstista, kuten /.ί ympäröivistä kirjaimista. • ·· : : 35 • * · • ♦ · • · : 25' 118062

6. Jonkin patenttivaatimuksen 3-5 mukainen menetelmä, tunnettu siitä, että foneemin oikeellisuuden tarkistamiseksi tarkistetaan onko se jokin sallituista foneemeista, jolloin mainittu lukuarvo alustetaan nollalla, vai onko se ei-sallittu foneemi, jolloin mainittu lukuarvo alustetaan 5 suurella positiivisella arvolla.

7. Jonkin patenttivaatimuksen 3-6 mukainen menetelmä, tunnettu siitä, että foneemin oikeellisuuden tarkistamiseksi tarkistetaan lisäksi onko se lingvistisesti sallittu foneemi, jolloin mainittu lukuarvo aluste- 10 taan uudelleen nollalla, vai onko se lingvistisesti ei-sallittu foneemi, jolloin mainittu lukuarvo alustetaan uudelleen suurella positiivisella arvolla.

8. Jonkin patenttivaatimuksen 1 - 7 mukainen menetelmä, tunnettu 15 siitä, että solmun sisältämä tieto tallennetaan jossakin seuraavassa muodossa: kiinteäbittisenä, muuttuvabittisenä tai Huffman-koodeilla.

9. Patenttivaatimuksen 8 mukainen menetelmä, tunnettu siitä, että elementit esitetään muuttuvabittisenä jos muuttuvalla bittimuodolla 20 saavutettu säästö on suurempi kuin elementeistä koostuvan taulukon . . tallennuksen ylimäärä, tai elementeille suoritetaan Huffman-koodaus, |·· ·* jos Huffman-koodauksella saavutettu säästö on suurempi kuin : muuttuvabittisenä muodolla saavutettu säästö ja suurempi kuin Huffman-koodin ylimäärä. : 25

• · · · :*·*: 10. Patenttivaatimuksen 8 tai 9 mukainen menetelmä, tunnettu siitä, • · että tallennusmuoto valitaan oleellisesti jokaiselle elementille erikseen.

·« * ,·. 11. Järjestelmä puumaisen tietorakenteen hallitsemiseksi, joka järjes- 30 telmä käsittää päätöspuun muodostajan, joka päätöspuu käsittää van-**:*' hempisolmun ja ainakin yhden lehtisolmun, ja järjestelmä käsittää li- t"'/· säksi tiedonhakijan joka hakee tietoja mainituista solmuista, tunnettu *:··: siitä, että päätöspuun muodostaja on järjestetty muodostamaan ; päätöspuu tallentamalla solmut peräkkäin siten, että solmut seuraavat : : 35 vanhempisolmua tallennusjärjestyksessä, jotka solmut käsittävät aina- ’* kin yhden tiedon, joka on koodattu käyttämällä informaatiota vanhempi- 118062 solmun tai isovanhempisolmun ainakin yhdestä tiedosta, jolloin haettavan tiedon kontekstin määritteleviin solmuihin voidaan päästä ilman niiden vanhempisolmusta lähtevää linkkiä.

12. Patenttivaatimuksen 11 mukainen järjestelmä, tunnettu siitä, että tallennusmenetelmä on jokin seuraavista: syvyyssuuntainen tallennus, leveyssuuntainen tallennus tai näiden yhdistelmä.

13. Patenttivaatimuksen 11 tai 12 mukainen järjestelmä, tunnettu siitä, 10 että järjestelmä käsittää lisäksi välineet päätöspuun kouluttamiseksi ryhmitellyn dataelementtijoukon avulla, jotka välineet ovat kykeneviä alustamaan elementit lukuarvolla, joka on riippuvainen mainitun elementin oikeellisuudesta, ja alustamaan uudelleen lukuarvolla, joka on riippuvainen mainitun elementin tunnetuista ominaisuuksista lisäämällä 15 rajoitus virheellisille elementeille.

14. Patenttivaatimuksen 11, 12 tai 13 mukainen järjestelmä, tunnettu siitä, että järjestelmässä sovelletaan tekstistä-foneemiksi-muunnosta, jossa mainittu tieto käsittää elementtejä, kuten kirjaimia ja foneemeja, 20 jolloin päätöspuu vastaa yhtä kirjainta, ja mainitut solmut käsittävät mainitun kirjaimen foneemit. • * · • ♦ · • * · · • k

: 15. Patenttivaatimuksen 14 mukainen järjestelmä, tunnettu siitä, että ***** solmut käsittävät lisäksi tietoa mainitun kirjaimen kontekstista, kuten : 25 ympäröivistä kirjaimista.

• · · * · · * · * · .*··. 16. Jonkin patenttivaatimuksen 11-15 mukainen järjestelmä, tun nettu siitä, että järjestelmä on järjestetty tarkistamaan foneemin oikeel-... lisuus, eli onko se jokin sallituista foneemeista, jolloin järjestelmä on ":l 30 järjestetty alustamaan mainittu lukuarvo nollalla, vai onko se ei-sallittu *"·* foneemi, jolloin järjestelmä on järjestetty alustamaan mainittu lukuarvo suurella positiivisella arvolla. • *

17. Jonkin patenttivaatimuksen 11-16 mukainen järjestelmä, tun- *.* ! 35 nettu siitä, että järjestelmä on lisäksi järjestetty tarkistamaan foneemin ’* *: oikeellisuus, eli onko foneemi lingvistisesti sallittu, jolloin järjestelmä on 21 : ; 118062 järjestetty alustamaan mainittu lukuarvo nollalla, vai onko se lingvistisesti ei-sallittu foneemi, jolloin järjestelmä on järjestetty alustamaan mainittu lukuarvo suurella positiivisella arvolla.

18. Jonkin patenttivaatimuksen 11-17 mukainen järjestelmä, tunnettu siitä, että solmuissa sijaitseva tieto esitetään jollakin seuraavista tavoista: muuttuvina, pysyvinä tai Huffman-koodattuina binäärisinä lukuina.

19. Patenttivaatimuksen 18 mukainen järjestelmä, tunnettu siitä, että järjestelmä on järjestetty tarkistamaan mikä mainituista muodoista saa aikaan suuremman säästön vertaamalla mainittuja muotoja toisiinsa, jolloin järjestelmä on järjestetty soveltamaan kyseistä binäärimuotoa.

20. Jonkin patenttivaatimuksen 11-18 mukainen järjestelmä, tun nettu siitä, että järjestelmä on puheentunnistusjärjestelmä.

21. Laite joka käsittää tallennusvälineen tiedon tallennusta varten puumaisessa tietorakenteessa, joka koostuu vanhempisolmusta ja ai- 20 nakin yhdestä lehtisolmusta, joka mainittu laite käsittää lisäksi suorittimien tiedon käsittelemiseksi mainitussa rakenteessa, joka suoritin kä-: sittää päätöspuun muodostajan ja solmuissa olevan tiedon hakijan, : tunnettu siitä, että päätöspuun muodostaja on järjestetty muodosta- maan päätöspuu tallentamalla solmut peräkkäin siten, että solmut seu-: 25 raavat vanhempisolmua tallennusjärjestyksessä, jotka solmut käsittävät ··*: ainakin yhden tiedon, joka on koodattu käyttämällä informaatiota van- .·*·. hempisolmun tai isovanhempisolmun ainakin yhdestä tiedosta, jolloin haettavan tiedon kontekstin määritteleviin solmuihin voidaan päästä ... ilman niiden vanhempisolmusta lähtevää linkkiä. 30

• · ’·;·* 22. Patenttivaatimuksen 21 mukainen laite, tunnettu siitä, että tallennusjärjestys on jokin seuraavista: syvyyssuuntainen tallennus, ·:··: leveyssuuntainen tallennus tai näiden yhdistelmä. • « · *: 35

23. Patenttivaatimuksen 21 tai 22 mukainen laite, tunnettu siitä, että • * * '* *: laite soveltaa tekstistä-foneemiksi-muunnosta, jossa mainittu tieto kä- 118062 ' 28 sittää elementtejä, kuten kirjaimia ja foneemeja, jolloin päätöspuu vastaa yhtä kirjainta, ja mainitut solmut käsittävät mainitun kirjaimen foneemit.

24. Jonkin patenttivaatimuksen 21 -23 mukainen laite, tunnettu siitä, että laite käsittää lisäksi puheentunnistusjärjestelmän.

25. Jonkin patenttivaatimuksen 21 - 24 mukainen laite, tunnettu siitä, että laite käsittää lisäksi tietoliikennevälineet. 10

26. Puumainen tietorakenne, joka koostuu vanhempisolmusta ja ainakin yhdestä lehtisolmusta, jotka mainitut solmut käsittävät haettavaa tietoa, tunnettu siitä, että solmut sijaitsevat peräkkäin siten, että solmut seuraavat vanhempisolmua tallennusjärjestyksessä, jotka solmut 15 käsittävät ainakin yhden tiedon, joka on koodattu käyttämällä informaatiota vanhempisolmun tai isovanhempisolmun ainakin yhdestä tiedosta, jolloin haettavan tiedon kontekstin määritteleviin solmuihin voidaan päästä ilman niiden vanhempisolmusta lähtevää linkkiä.

27. Patenttivaatimuksen 26 mukainen puumainen tietorakenne, tun nettu siitä, että solmuissa sijaitseva tieto esitetään jollakin seuraavista : tavoista: muuttuvina, pysyvinä tai Huffman-koodattuina binäärisinä lu- * · · kuina. • · · • · • · ·♦· l25

28. Patenttivaatimuksen 26 tai 27 mukainen puumainen tietorakenne, "·*: tunnettu siitä, että rakenteessa hyödynnetään tekstistä-foneemiksi- * · .·*·. muunnosta, jolloin päätöspuu käsittää tiedon yhdestä kirjaimesta ja solmut käsittävät tiedon sen foneemeista. #·'·'· 'i:'.' 30

29. Jonkin patenttivaatimuksen 26 - 28 mukainen puumainen tieto- **:** rakenne, tunnettu siitä, että solmut käsittävät tietoa kirjainta ympäröi- vistä kirjaimista. « · · · X

: 30. Tietokoneohjelmatuote joka käsittää tietokoneen tallennusvälineen • *· X | 35 sekä tietokoneella luettavan koodin, joka on tallennettu tietokoneen ** tallennusvälineeseen puumaisen tietorakenteen käyttämiseksi, joka on 118062 tallennettu mainittuun tallennusvälineeseen, joka mainittu puumainen tietorakenne koostuu vanhempisolmusta ja ainakin yhdestä lehti-solmusta, jolloin mainittu tietokoneella luettava koodi käsittää käskyjä mainittujen solmujen sisällön etsimiseksi, tunnettu siitä, että tieto-5 koneella luettava koodi käsittää käskyjä solmujen järjestämiseksi peräkkäin siten, että solmut seuraavat vanhempisolmua tallennusjärjes-tyksessä, jotka solmut käsittävät ainakin yhden tiedon, joka on koodattu käyttämällä informaatiota vanhempisolmun tai isovanhempi-solmun ainakin yhdestä tiedosta, jolloin haettavan tiedon kontekstin 10 määritteleviin solmuihin voidaan päästä ilman niiden vanhempi-solmusta lähtevää linkkiä • · • · · • * · *···'' ♦ ···' • · · * * · · ' * · • · • * · • · • · *··· ·*· *·· • · · · · · • · • · • · • * · · • · * · * · « * · • * *·· • · ... • · * · · * · · · · • · ♦ • · ♦ • * · • · • * • · · • ·· 118062