FI118062B - Pienimuistinen päätöspuu - Google Patents

Pienimuistinen päätöspuu Download PDF

Info

Publication number
FI118062B
FI118062B FI20035055A FI20035055A FI118062B FI 118062 B FI118062 B FI 118062B FI 20035055 A FI20035055 A FI 20035055A FI 20035055 A FI20035055 A FI 20035055A FI 118062 B FI118062 B FI 118062B
Authority
FI
Finland
Prior art keywords
nodes
information
phoneme
decision tree
parent node
Prior art date
Application number
FI20035055A
Other languages
English (en)
Swedish (sv)
Other versions
FI20035055A (fi
FI20035055A0 (fi
Inventor
Janne Suontausta
Jilei Tian
Original Assignee
Nokia Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nokia Corp filed Critical Nokia Corp
Publication of FI20035055A0 publication Critical patent/FI20035055A0/fi
Priority to FI20035055A priority Critical patent/FI118062B/fi
Priority to KR1020057020316A priority patent/KR20060016758A/ko
Priority to KR1020077019768A priority patent/KR100883577B1/ko
Priority to EP04728830A priority patent/EP1618498B1/en
Priority to PCT/FI2004/050044 priority patent/WO2004097673A1/en
Priority to DE602004023072T priority patent/DE602004023072D1/de
Priority to AT04728830T priority patent/ATE442642T1/de
Priority to CN2004800115762A priority patent/CN1781102B/zh
Priority to US10/835,597 priority patent/US7574411B2/en
Publication of FI20035055A publication Critical patent/FI20035055A/fi
Application granted granted Critical
Publication of FI118062B publication Critical patent/FI118062B/fi

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/183Speech classification or search using natural language modelling using context dependencies, e.g. language models
    • G10L15/187Phonemic context, e.g. pronunciation rules, phonotactical constraints or phoneme n-grams
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/316Indexing structures
    • G06F16/322Trees
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Machine Translation (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Executing Machine-Instructions (AREA)
  • Devices For Executing Special Programs (AREA)

Description

I
ί 118062
Pienimuistinen päätöspuu
Keksintö kohdistuu oheisen itsenäisen patenttivaatimuksen 1 johdanto-osan mukaiseen menetelmään puumaisen tietorakenteen hallitsemi-5 seksi. Keksinnön kohteena on myös oheisen itsenäisen patenttivaatimuksen 11 johdanto-osan mukainen järjestelmä edellä mainitun menetelmän toteuttamiseksi. Keksinnön kohteena on lisäksi oheisen itsenäisen patenttivaatimuksen 21 johdanto-osan mukainen laite. Keksinnön kohteena on myös oheisen itsenäisen patenttivaatimuksen 26 mu-10 kainen puumainen tietorakenne, sekä oheisen itsenäisen patenttivaatimuksen 30 mukainen tietokoneohjelmatuote edellä mainitun puumaisen tietorakenteen käyttämiseksi.
Monikielisyyteen liittyvät näkökohdat ovat tulossa yhä tärkeämmiksi 15 automaattisissa puheentunnistusjärjestelmissä. Tällainen puheen-tunnistusjärjestelmä käsittää puheentunnistuskoneen, joka voi käsittää esimerkiksi automaattisen kielentunnistuksen, on-line ääntämismallin-nuksen (tekstistä-foneemiksi; text-to-phoneme) ja monikielisen akustisen mallinnuksen yksikköjä. Puheentunnistuskone toimii sillä oletuk-20 sella, että sanastoyksiköt annetaan tekstimuodossa. Aluksi kielen-tunnistusmoduuli tunnistaa kielen sanastoyksikön kirjoitetun esitys- I v muodon perusteella. Kun kieli on määritelty, käytetään sopivaa on-line * * * :;;t: tekstistä-foneemiksi-mallinnusta sanastoyksikköön liittyvän foneemi- sarjan selvittämiseksi. Foneemi on pienin yksikkö, joka erottaa sanan • · : 25 ääntämisen toisen sanan ääntämisestä. Minkä tahansa kielen mikä :'**·* tahansa sanastoyksikkö voidaan esittää foneemisarjalla, joka vastaa ihmisen puheenmuodostusjärjestelmässä tapahtuvia muutoksia.
Monikielisiä akustisia malleja voidaan ketjuttaa tunnistusmallin muo- !···. 30 dostamiseksi jokaista sanastoyksikköä varten. Näitä perusmalleja • · T’ käyttäen tunnistin voi periaatteessa käsitellä automaattisesti monikieli- siä sanastoyksikköjä ilman käyttäjän apua. Tekstistä-foneemiksi-mal- linnuksella on avainasema tarkkojen foneemisarjojen muodostami- sessa sanastoyksiköille sekä automaattisessa puheentunnistuksessa Λ - 35 että tekstin muuntamisessa puheeksi (text-to-speech). Tekstistä-fo- • · * neemiksi-muunnoksessa käytetään yleensä neuroverkko- tai päätös- 2 118062 puuratkaisuja. Kieli- ja puhujariippumattomissa puheentunnistusratkai-suissa päätöspuupohjaisella lähestymistavalla on saatu aikaan tarkimmat foneemisarjat. Erästä esimerkkiä puurakenteen muodostamis-menetelmästä on kuvattu julkaisussa US 6,411,957B1.
5 Päätöspuupohjaisessa lähestymistavassa jokainen kielen aakkosissa esiintyvä kirjain mallinnetaan erikseen, ja jokaiselle kirjaimelle koulutetaan (train) oma päätöspuu. Kun sanan ääntäminen löydetään, sanaa käsitellään kirjain kerrallaan, ja kyseessä olevan kirjaimen ääntämis-10 tapa löydetään ko. kirjaimen päätöspuun tekstistä-foneemiksi-mallin perusteella.
Kuvassa 1 on esitetty esimerkki päätöspuusta. Se koostuu solmuista, jotka voivat olla joko sisäsolmuja I tai lehtiä L. Haara koostuu useista 15 solmuista, jotka ovat liittyneet toisiinsa juuresta R lehtiin L. Solmu voi olla joko vanhempisolmu tai lapsisolmu. Vanhempisolmu on solmu, jonka kautta puussa edetään, ts. sillä on lapsisolmu. Puun lapsisolmu on solmu, johon päästään vanhempisolmun kautta. Sisäsolmu I voi olla sekä vanhempisolmu että lapsisolmu, mutta lehti on vain lapsisolmu. 20 Päätöspuun jokaiseen solmuun on tallennettu tietoa. Tallennetut tiedot : ... vaihtelevat päätöspuun kontekstin mukaan.
• * · • · · · * ·
Iti
Puheentunnistusjärjestelmissä sisäsolmut I sisältävät yleensä tietoja ;···*’ tunnistettavasta sanasta sekä sanan ääntämisestä. Sanan kirjainten : 25 ääntäminen voidaan määritellä tietyissä konteksteissa esiintyvien fo- •» * : neemien (p,) avulla. Konteksti viittaa esimerkiksi sanassa oleviin kirjai- :[[[: miin käsiteltävänä olevan kirjaimen oikealla ja vasemmalla puolella.
Konteksti-informaation tyyppi voidaan määritellä attribuutin (a,) (josta käytetään myös nimitystä attribuuttityyppi) mukaan, ja konteksti otetaan .···. 30 huomioon päätöspuussa edettäessä. Eteneminen voidaan toteuttaa attribuuttiarvon avulla, joka määrittelee sen haaran johon hakualgorit-min tulisi edetä tietyn kirjaimen konteksti-informaation mukaisesti.
* • ·
Puurakenteeseen kiivetään juurisolmusta R alkaen. Jokaisessa sol-.·. : 35 mussa tulisi tutkia attribuuttityyppi (a) ja sitä vastaavaa informaatiota tulisi käyttää kulloinkin kyseessä olevan kirjaimen kontekstin mää- 3 118062 rittelemiseksi. Tietojen avulla konteksti-informaatiota vastaavassa haarassa voidaan siirtyä seuraavaan solmuun. Puussa edetään kunnes löydetään lehtisolmu L, tai puussa ei ole sen hetkistä kontekstia vastaavaa attribuuttiarvoa.
5
Kuvassa 2 on esitetty yksinkertaistettu esimerkki päätöspuupohjaisesta tekstistä-foneemiksi-muunnoksesta. Kuvassa esitetty päätöspuu on kirjainta ’a’ varten, jolloin solmut esittävät kirjaimen ’a’ foneemeja. On huomattava, että esitys on yksinkertaistettu, eikä se sisällä kaikkia kir-10 jaimen ’a’ foneemeja. Juurisolmussa on tieto attribuuttityypistä, joka on ensimmäinen kirjain oikealla, ja joka on merkitty viitteellä r7. Kahden muun sisäsolmun attribuuttityypit ovat ensimmäinen kirjain vasemmalla, jota on merkitty viitteellä h ja toinen kirjain oikealla, jota on merkitty viitteellä r2. Lehtisolmuille ei ole määritelty attribuuttityyppejä.
15
Etsittäessä sanan ’Ada’ ääntämistapaa, sanan foneemisarja voidaan saada aikaan esimerkissä esitetyn päätöspuun ja kirjaimen ’d’ päätös-puun avulla. Esimerkissä kirjaimen ’d’ päätöspuu koostuu vain juuri-solmusta, ja juurisolmulle määritelty foneemi on /d/.
20 . . Foneemisarjaa muodostettaessa sana käydään lävitse kirjain kerral- ;*V laan vasemmalta oikealle. Ensimmäinen kirjain on ’a’, joten kirjaimen • * · ’··' · ’a’ päätöspuu otetaan ensin käyttöön (ks. kuva 2). Juurisolmuun on lii- tetty attribuutti η. Kirjainta ’a’ seuraa kirjain ’d’, jolloin siirrytään juuri- a « * 25 solmua seuraavaan haaraan joka vastaa attribuuttiarvoa ’d’. Tämä Y\: solmu on sisäsolmu, johon on liitetty attribuuttiarvo r2. Toinen kirjain oikealla on ’a’, jolloin siirrytään kirjainta ’a’ vastaavaan haaraan, sekä vastaavaan solmuun, joka on lehti. Lehteä vastaava foneemi on /el/. Näin ollen sarjan ensimmäinen foneemi on /el/.
:::·. 30 • *
Esimerkkisanan seuraava kirjain on ’d\ Kuten edellä mainittiinkin, kir-jaimen ’d* päätöspuu koostuu vain juurisolmusta, jossa yleisin foneemi on /d/. Näin ollen sarjan toinen foneemi on /d/.
• · • · · • · · .·. * 35 Sanan viimeinen kirjain on ’a’, joten kirjaimen ’a’ päätöspuu otetaan * · * käyttöön uudelleen (ks. kuva 2). Juurisolmuun liitetty attribuutti on η.
118062 4
Koska’a’on sanan viimeinen kirjain, kirjainta’a’oikealla seuraava kirjain on grafeemi epsilon Puussa edetään vastaavaa haraa pitkin lehtisolmuun. Lehtisolmuun liittyvä foneemi on N/, joka on sarjan viimeinen foneemi.
5 Näin sanan ’Ada’ täydellinen foneemisarja on /el/ /d/ N/. Minkä tahansa sanan foneemisarja voidaan muodostaa samalla tavalla, sitten kun päätöspuut on koulutettu kaikille aakkosissa esiintyville kirjaimille.
10 Päätöspuun koulutus suoritetaan ääntämissanakirjalla, joka sisältää sanoja ääntämistapoineen. Päätöspuun vahvuutena on se, että se pystyy informaatioteoreettisia periaatteita käyttämällä oppimaan tiiviin muunnoksen koulutussanastosta.
15 Kuten edellä mainittiin, päätöspuupohjaisten sovellusten avulla on fo-neemisarjat saatu tarkimmin määriteltyä, mutta niiden epäkohtana on suuri muistintarve käytettäessä päätöspuuratkaisua tekstistä-fonee-miksi-muunnoksessa. Suuri muistintarve johtuu lukuisista osoittimista, joita käytetään linkitetyn listan päätöspuuratkaisussa. Muistinkulutus 20 lisääntyy erityisesti sellaisissa kielissä kuten englanti, jossa ääntämi- . t.m sessä esiintyy usein epäsäännöllisyyttä.
* » · *··* • »
Mainittua ongelmaa koskevat tunnetut ratkaisut voidaan luokitella hä-viöllisiin ja häviöttömiin menetelmiin. Kun yritetään pienentää päätös-: 25 puiden muistitarvetta käytetään yleensä häviöllisiä menetelmiä. Näihin • V ratkaisuihin kuuluu mm. päätöspuiden attribuuttiarvojen ryhmittely, päätöspuun koulutusprosessin lopetuskriteerien optimointi, päätöspuun karsiminen virhelukemien perusteella ja muita vastaavia menetelmiä.
• · * !*·". 30 Tunnetun tekniikan mukaisissa pienimuistisissa päätöspuumenetel- • « ‘H missä suorituskyky kärsii aina, kun järjestelmä optimoidaan muistin suhteen. Tarkkuuden ja muistintarpeen välillä on aina tehtävä komp-romisseja. Nyt esillä olevan keksinnön mukainen ratkaisu sen sijaan mahdollistaa sen, että tarkkuus ei kärsi, ja muistin käyttö optimoituu. - 35 Muistin tarvetta voidaan vähentää huomattavasti suoritustehon kärsi mättä.
5 · 118062 Tämän tarkoituksen saavuttamiseksi menetelmä puumaisen tietorakenteen käsittelemiseksi käsittää vaiheet, joissa luodaan päätöspuu, joka koostuu vanhempisolmusta ja ainakin yhdestä lehtisolmusta, ja 5 lisäksi etsitään tietoa mainituista solmuista. Mainitulle menetelmälle on tunnusomaista päätöspuu, joka muodostetaan tallentamalla solmut peräkkäin siten, että solmut seuraavat vanhempisolmua tallennusjärjes-tyksessä, jolloin haettavan tiedon kontekstin määritteleviin solmuihin voidaan päästä ilman niiden vanhempisolmusta lähtevää linkkiä.
10 Järjestelmälle puumaisen tietorakenteen käsittelemiseksi on ominaista muodostaja, joka on järjestetty muodostamaan päätöspuu tallentamalla solmut peräkkäin siten, että solmut seuraavat vanhempisolmua tallennusjärjestyksessä, jolloin haettavan tiedon kontekstin määrittele-15 viin solmuihin voidaan päästä ilman niiden vanhempisolmusta lähtevää linkkiä.
Keksinnön mukainen laite käsittää tallennusvälineen tietojen tallentamiseksi puumaisessa tietorakenteessa sekä suorittimen tietojen käsit-20 telemiseksi mainitussa rakenteessa, joka suoritin käsittää päätöspuun . . muodostajan ja tietojen hakijan mainituista solmuista. Laitteelle on » · · :.·γ tunnusomaista se, että muodostaja on järjestetty laatimaan päätöspuu ‘ i tallentamalla solmut peräkkäin siten, että solmut seuraavat vanhempi- solmua tallennusjärjestyksessä, jolloin haettavan tiedon kontekstin • · · 25 määritteleviin solmuihin voidaan päästä ilman niiden vanhempi- solmusta lähtevää linkkiä.
* * -« · « • · ·
Mainitulle puumaiselle rakenteelle, joka koostuu vanhempisolmusta ja ainakin yhdestä lehtisolmusta, jotka mainitut solmut käsittävät haetta- !···, 30 vaa tietoa, on tunnusomaista se, että solmut sijaitsevat peräkkäin siten, • · että solmut seuraavat vanhempisolmua tallennusjärjestyksessä, jolloin haettavan tiedon kontekstin määritteleviin solmuihin voidaan päästä ‘:‘*j ilman niiden vanhempisolmusta lähtevää linkkiä.
• * • 4 · • *· ,·. i 35 Keksinnön mukainen tietokoneohjelmatuote käsittää tietokoneen tal-‘ * lennusvälineen sekä tietokoneella luettavan koodin, joka on tallennettu ' 6 118062 tietokoneen muistivälineeseen puumaisen tietorakenteen käyttämiseksi, joka käsittää vanhempisolmun ja ainakin yhden lehtisolmun ja joka on tallennettu mainittuun tallennusvälineeseen. Tietokoneella luettava koodi käsittää käskyjä tietojen etsimiseksi solmuista. Tieto-5 koneohjelmatuotteelle on tunnusomaista se, että tietokoneella luettava koodi sisältää käskyjä solmujen järjestämiseksi peräkkäin siten, että solmut seuraavat vanhempisolmua tallennusjärjestyksessä, jolloin haettavan tiedon kontekstin määritteleviin solmuihin voidaan päästä ilman niiden vanhempisolmuista lähtevää linkkiä.
10
Keksinnön ensimmäisessä osassa on kuvattu karsivaa ryhmittely-menetelmää (clipped alignment method) jota käytetään päätöspuun kouluttamisessa. Tämä menetelmä mahdollistaa korkealaatuisen ryhmitellyn sanakirjan muodostamisen lingvististen tietojen pohjalta. Ilman 15 karsintamenetelmää, kuten tunnetun tekniikan mukaisissa menetelmissä, kielellistä tietämystä ei saada täysin hyödynnettyä. Nyt esillä olevan keksinnön ansiosta voidaan myös helposti löytää väärät hakusanat (foneemi-kirjainparit). Tämän johdosta säännönvastaisuudet vähenevät, ja muistin sekä ryhmitellyn sanakirjan avulla koulutettavien 20 päätöspuiden tarkkuus paranee. Keksintö mahdollistaa vastaavasti . . sellaisten vieraskielisten sanojen ja nimien hakusanojen poistamisen, • k · |*V jotka noudattavat englanninkielestä poikkeavia ääntämissääntöjä.
·· ; Luonnollisesti myös säännönvastaisuudet vähenevät. Karsiva ryhmittelymenetelmä voi myös jossain määrin havaita virheellisiä tran- · 25 skriptioita, jotka se voi jättää huomioimatta. Koska virheellisiä j*\: muunnospareja (mapping pair) sisältävät hakusanat karsiutuvat pois, voidaan mahdollista pienen todennäköisyyden muunnosparia hyödyntää oikealla tavalla.
*
«M
* [*·*. 30 Keksinnön edullinen suoritusmuoto on esitetty kuvissa, joiden yksityis- • · kohtaisempi selostus seuraa jäljempänä, sekä oheisissa vaatimuk-sissa. Keksinnön muita tavoitteita ja etuja on myös kuvattu selityk- » sessä. Itse keksintö on kuvattu yksityiskohtaisesti vaatimuksissa.
• · • » « * ·« .·. j 35 Kuva 1 esittää esimerkkiä päätöspuusta, joka käsittää attribuut- * · m teja ja foneemin sisältäviä solmuja ja lehtiä, 118062 7 kuva 2 esittää esimerkinomaista tekstistä-foneemiksi-muunnok- sessa käytettävää kirjaimen’a’päätöspuuta, 5 kuva 3 esittää esimerkkiä grafeemia koskevasta Markovin piilo- mallista, kuva 4 esittää keksinnön mukaista menetelmää periaatteelli sena kuvantona, 10 kuva 5 < esittää esimerkkiä linkitetyn listan menetelmästä, jossa solmu käsittää osoitintaulukon, kuvat 6a -6d esittävät esimerkkejä neljästä menetelmästä päätös-15 puun tallentamiseksi, ja kuva 7 esittää erittäin pelkistettyä esimerkkiä keksinnön mu kaista menetelmä soveltavasta laitteesta.
20 Keksinnön mukaisessa menetelmässä sovelletaan päätöspuun hä- ; viötöntä koodausta yhdessä rajoitetun Viterbi-algoritmin kanssa. Kek- ··: : sintö soveltuu sellaisille kielille kuten esimerkiksi englanti, joissa yksi * * : kirjain voi vastata ei yhtään, yhtä tai kahta foneemia.
• · * • * · : 25 Kuvassa 4 on esitetty korkean tason kuvaus ehdotetusta päätöspuihin perustuvasta ääntämismallinnuksesta. Ratkaisu perustuu ääntämis- ·"*. sanakirjaan, joka on ryhmitelty karsivan ryhmittelyalgoritmin avulla.
Päätöspuiden kouluttaminen perustuu ryhmiteltyyn ääntämissana- kirjaan, ja koulutuksen tuloksena on päätöspuupohjainen ääntämis- "M 30 malli. Koulutuksen jälkeen puut muunnetaan pienimuistiseen muotoon '*:** päätöspuiden muistitarpeen pienentämiseksi. Pienimuistinen päätös- puuesitys muodostuu päätöspuun solmujen muokkaamisesta sopivaan *:**: muotoon ja päätöspuun muuttujien pakkaamisesta pakkausmenetel- .·!: mällä, joka saa aikaan pienimmän muistinkulutuksen. Keksintö esittää • · · | 35 menetelmät karsivan koulutusryhmittelyn suorittamiseksi ja päätös- ** puiden muuntamiseksi pienimuistiseen muotoon. Ääntämissanakirja 8 118062 sisältää sanat ja niiden ääntämisasut. Päätöspuu pystyy oppimaan tiiviin muunnoksen koulutussanastosta informaatioteoreettisia periaatteita käyttäen.
5 Keksinnön selkiyttämiseksi keksintö on jaettu seuraaviin osiin: 1. Karsiva ryhmittelymenetelmä 2. Pienimuistinen päätöspuumenetelmä 3. Bittivaraus päätöspuun dataelementeille.
10 Keksinnön mukaisen karsivan ryhmittelymenetelmän ensimmäinen osuus on tarkoitettu pienimuistisen päätöspuun koulutusta varten, jota pienimuistista päätöspuuta on kuvattu tarkemmin osiossa kaksi. Kolmannessa osassa on esitetty menetelmiä päätöspuun dataelementtien pakkaamiseksi minimimuistitarpeen aikaansaamiseksi. Ensimmäiseksi, 15 ennen päätöspuun kouluttamista, hakusanat, tai selityksessä käytetyn termin mukaan ääntämissanakirjan hakusanat kuitenkin ryhmitellään kirjainten ja foneemien välisen vastaavuuden löytämiseksi. Ryhmittely voidaan saada aikaan lisäämällä foneemisia tyhjämerkkejä (joita kutsutaan foneemiepsiloneiksi, ja jotka merkitään niiden kirjainten fo-20 neemisarjoihin joita ei lausuta, ja näennäisfoneemeja niitä kirjaimia varten, jotka muodostavat kaksi foneemia. Näennäisfoneemit saadaan * · ;1: 2· aikaan liittämällä yhteen kaksi foneemia (/el/, /oU/,...), joiden tiedetään : vastaavan yhtä kirjainta.
* · · 25 Ryhmittelyssä sovelletaan HMM-VIterbi-algoritmia. HMM-Viterbi-algo- :1·2: ritmin käyttö varmistaa sen, että ryhmittely suoritetaan optimaalisella :3· tavalla tilastollisessa mielessä, mikä näin ollen pienentää sanakirjan • · · hakusanojen jäljellejäävää entropiaa. Lisäksi HMM-Viterbi-algoritmin käytön etuna ryhmittelyssä on se, että voidaan saada aikaan tilastoni- 30 sesti optimaalinen ryhmittely. Taulukossa 1 on esitetty esimerkki ryh- *:1’ mitellystä ääntämissanakirjasta.
* 1 1 • · • · - * · • 1 « · · ··· 2 • · · • · · 3 • φ 118062 9
Sana Ryhmitelty foneemisarja aaron _Er2s@n abraham elbr2s@häm accola A:_koUls@ ackerman ä _ k _ s@r m s@ n ada el d s@ adelaide äds@lel_d_ ahmanson A: _m s@ n s s@ n aikman el _ k m s@ n alabamas A: 1 A: b A: m s@ z
Taulukko 1 Esimerkki ryhmitellystä ääntämissanakirjasta.
5
Markovin piilomalli (Hidden Markov Model, HMM) on tunnettu ja laajasti käytössä oleva tilastollinen menetelmä, jota on sovellettu mm. puheentunnistuksessa. Tätä mallia on voidaan myös kutsua Markovin lähteiksi tai Markovin ketjun todennäköisyysfunktioiksi. HMM:iin sisältyy se ole-10 tus, että signaalia voidaan luonnehtia parametriseksi satunnaisproses- . . siksi, ja että satunnaisprosessin parametrit voidaan määritellä/arvioida • · · : tarkalla, hyvin määritellyllä tavalla. HMM voidaan jakaa epäjatkuviin : malleihin ja jatkuviin malleihin sen mukaan ovatko kutakin tilaa vastaa- • · · vat tarkasteltavat tapahtumat epäjatkuvia, kuten koodisanoja, vai jatku- I.;’: 15 via. Kummassakin tapauksessa havainnot ovat todennäköisyyteen pe- rustuvia. Malli liittyy taustalla olevaan satunnaisprosessiin, joka ei ole suoraan havaittavissa (joka on piilotettu), vaan joka voidaan havaita vain toisten havaintosarjan muodostavien satunnaisprosessien avulla. .·. HMM koostuu piilotetuista tiloista, joiden välillä tapahtuu siirtymiä. Ma- 20 temaattinen esitys sisältää kolme kohtaa: tilojen välisten tilasiirtymien • · "* todennäköisyys, jokaisen tilan havainnointitodennäköisyys ja alkutila- • · * jakauma. HMM:n ja havaintojen perusteella käytetään Viterbi-algoritmia *"*: havaintotilan ryhmittelyssä seuraamalla parasta polkua.
• · • · * • · · .·. j 25 Ääntämissanakirjan ryhmittelemiseksi tietylle kirjain-foneemiparille ‘ * määritellyt lukuarvot P(f, I) alustetaan nollalla, mikäli foneemi f löytyy 118062 10 kirjaimelle / sallittujen foneemien listalta, muussa tapauksessa ne alustetaan suurilla positiivisilla arvoilla. Kun alkuarvot on määritelty, sanakirja ryhmitellään kahdessa vaiheessa. Ensimmäisessä vaiheessa kaikki mahdolliset ryhmittelyt suoritetaan jokaiselle sanakirjan haku-5 sanalle. Tämän jälkeen lukuarvot lasketaan uudelleen ryhmiteltyjen hakusanojen perusteella. Toisessa vaiheessa etsitään vain yksi paras ryhmittely kullekin hakusanalle.
Jokaiselle hakusanalle voidaan löytää paras ryhmittely grafeemeihin 10 liittyvän HMM-mallin Viterbi-algoritmilla. Kuvassa 3 on esitetty esimerkki Markovin piilomallista. Grafeemeihin liittyvä HMM-malli käsittää hakusanan E, poistumiskohdan X ja kirjainten S1, S2, S3 tilat. Ne kirjaimet, jotka voisivat vastata näennäisfoneemeja käsitellään siten, että niillä on kestotila D. Kuvassa 3 esitetyt tilat S1 - S3 ovat sanan ään-15 nettyjä kirjaimia vastaavia tiloja. Tila S2 vastaa kirjainta, joka voi muodostaa näennäisfoneemin, ja tästä syystä tilalla S2 on kestotila D. Siirtymiset kaikista edellisistä tiloista nykyiseen tilaan sallitaan foneemi-epsilonien tukemiseksi. Jokaiseen tilaan ja kestoillaan liittyy merkki, joka sisältää kumulatiivisen lukuarvon foneemisarjan grafeemeihin liit-20 tyvän HMM-mallin avulla tapahtuvaa ryhmittelyä varten, sekä kumula-, . tiivistä lukuarvoa vastaavat tilasarjat. Foneemisarja ryhmitellään käy- · mällä foneemisarja läpi alusta loppuun foneemi kerrallaan. Kirjainten ja : foneemien välisen Viterbi-ryhmittelyn selvittämiseksi suoritetaan merk- ··« kien kopiointia tilojen välillä (token passing). Lopuksi se merkki, jonka 25 kumulatiivinen lukuarvo on pienin löytyy kaikista HMM-mallin tiloista.
Merkin tilasarjan perusteella voidaan määritellä sanan kirjainten ja fo- :***; neemien välinen ryhmittely.
• · *
Ryhmitelty sanakirja voi sisältää seuraavia hakusanoja: *::: 30 • · a) Vierasperäiset nimet ja sanat, kuten ’’Juan, Xiong, jne” sisältyvät ··· englanninkieliseen ääntämissanakirjaan. Tekstistä-foneemiksi-muun- *:*·: noksessa on suositeltavampaa käyttää näitä sanoja vastaavan kielen .·!: yhteydessä englannin sijaan. Nämä sanat synnyttävät ääntämiseen • · · I 35 epäsäännönmukaisuuksia, jotka tekevät päätöspuusta suuremman ja ** epätarkemman.
11 b) Virheellinen transkriptio. Sanakirjaan syntyy väistämättäkin joitakin virheellisiä transkriptioita kirjoitusvirheiden tai muiden ennalta-arvaa-mattomien syiden johdosta. Ne saavat aikaan epäsäännönmukaisuuk- 5 siä ääntämiseen sekä ääntämisvirheitä.
c) Virheellinen ryhmittely, esimerkiksi “apple-äpVl_ “ Kielitieteellisen perustiedon perusteella tiedetään, että kirjain "p” ei koskaan vastaa vokaalifoneemia ”V”. Tämä saa jälleen aikaan epäsäännönmukaisuuk- 10 siä ääntämiseen sekä ääntämisvirheitä.
Edellä mainittujen ongelmien ratkaisemiseksi on esitetty keksinnön mukainen karsiva ryhmittelymenetelmä, joka hyödyntää Viterbi-algo-ritmia. Tämän menetelmän avulla ryhmitelty ääntäminen saadaan 15 säännönmukaisemmaksi, mikä johtaa pienempään muistintarpeeseen keksinnön mukaisissa päätöspuupohjaisissa tekstistä-foneemiksi-mal-leissa.
1. Karsiva ryhmittelymenetelmä pienimuististen Däätösouiden koulut- 20 tamiseksi • » ··* · Keksinnön mukaisesti ryhmittely suoritetaan päivitettyjen lukuarvojen : P(f l) perusteella, joka päivitys suoritetaan edellä kuvatun ryhmitellyn sanakirjan avulla. Luonnollisesti tällainen ryhmittely on erittäin epä- : 25 tarkka, jolloin lukuarvot P(f, l) ovat likimääräisiä. Se myös päivittää luku- :*·*: arvon P(f l) silloin kun se ei ole lingvistisesti mahdollista. Esimerkiksi « * ;···. P(“V“, “p”):Ile annetaan arvo, mutta se on selvästi vastoin kielellistä tietoa. Tämän välttämiseksi ja edellä mainittujen ongelmien (a - c) eli- minoimiseksi Viterbi-dekoodauksessa sovelletaan rajoituksia, joita kut- *::: 30 sutaan karsivaksi menetelmäksi.
• # • « • « · • C!: Esitetyn karsivan ryhmittelyalgoritmin tulee määritellä kohdekielen aak- *:*·: koselliset ja foneettiset joukot. Taulukossa 2 esitetty lista määrittelee .·!; ne foneemit ja näennäisfoneemit, joita kirjain voi lingvistisen tiedon lm | 35 mukaan vastata (määrittely perustuu asiantuntijan kielelliseen tietä- • K * · 118062 12 mykseen). Alla oleva taulukko 2 sisältää vain täysin kieliriippuvaista tietoa.
Kirjain Vastaavat (näennäis)foneemit a V, A, ä, el, e, O, _ b b,_ c k, s, tS, S, _ 1 1,V,V_1,_ z z, s, tS, t, t_s, dZ, S, _ 5 Taulukko 2 Esimerkki aakkosten foneemi- ja näennäisfoneemi-määrittelyistä
Taulukko 2 voidaan toteuttaa eri tavoin, mutta toteutusten päämäärä on sama.
10
Ryhmiteltyjen hakusanojen perusteella lukuarvot lasketaan uudelleen. Näin jokaiselle hakusanalle etsitään vain yksi paras ryhmittely. P(f, l) päivitetään normaaliin tapaan jos foneemi 2/on löydettävissä taulu- • » i kosta 2, mikä tarkoittaa sitä, että foneemi / on lingvistisesti sallittu kir- :.f; 15 jaimelle l. Jos taulukosta 2 ei löydy foneemia /tietylle kirjaimelle /, so- velletaan rajoitusta ja P(f l) asetetaan korkeimmaksi arvoksi päivitystä • suorittamatta.
• * * * • * · • · * • · .··*·. Näin vain ne kirjain-foneemiparit jotka löytyvät edellä esitetystä taulu- 20 kosta ovat sallittuja ryhmitellyssä sanakirjassa tekstistä-foneemiksi-muunnoksen toteuttavan päätöspuun kouluttamiseksi.
«•tl • · * • · *♦;·* Menetelmän ansioista lingvistinen tieto voidaan ottaa huomioon melko :**/ helposti. Jotkut hakusanat karsiutuvat pois ryhmittelyssä käytettävän ·:··; 25 karsintamenetelmän johdosta. Karsitun hakusanalistan avulla voidaan .· . helposti löytää tai muokata lingvististä informaatiota, esimerkiksi mää- *: *; rittää uusia näennäisfoneemeja, lisätä puuttuvia foneemeja kirjain- • · φ ’· " riippuvaiseen foneemiryhmään, jne. Kun käytössä on parempaa ling- : 13 118062 .
vististä informaatiota, voidaan ryhmittelyä tehostaa ja muistinkäyttöä vähentää.
2. Päätöspuun mallirakenne 5
Tietyn kielen tekstistä-foneemiksi-mallin koko minimoidaan minimoimalla kaikkien kirjainten tekstistä-foneemiksi-mallien muistintarve. Tästä syystä tarkastellaan yksittäisen päätöspuun muistitarpeen minimointia.
10
Kuvissa 1 ja 2 esitettyä päätöspuumallin suoraa linkitetyn listan toteutusta ei sopivimmin käytetä. Syynä on se, että linkitetyn listan menetelmässä puun jokainen solmu sisältäisi ylimääräisen osoitintaulukon. Tämän ylimääräisen muistinkulutuksen poistamiseksi puun solmut tal-15 lennetään muistiin sopivimmin sellaisessa järjestyksessä, että niitä voidaan käyttää tekstistä-foneemiksi-konversiossa.
Järjestyksen tulee olla sellainen, että kun kirjaimelle määritellään oikea konteksti, seuraava sopiva konteksti on myös välittömästi seuraavan 20 tason konteksti. Toisin sanoen, vaikka tunnetun tekniikan mukainen linkitetyn listan puu voidaan tallentaa muistiin missä tahansa järjestyk- : sessä, keksinnön mukaista puuta ei voida niin tallentaa. Tunnetun tek- · nilkan mukaisen linkitetyn listan puun rakenne huolehtii oikeanlaisten viittausten muodostamisesta automaattisesti: seuraavan tason solmuja : 25 etsittäessä algoritmi löytää tiedot käyttämällä solmuihin tallennettuja ·*.·; linkkejä (osoittimia). Nämä linkit käyttävät muistia, ja niiden ainoana • · .*··. tarkoituksena on mahdollistaa puussa eteneminen. Kuvassa 5 voidaan nähdä esimerkki linkitetyn listan menetelmästä, jossa solmu (I0) käsit-tJi tää osoitintaulukon, josta päästään kirjaimia vastaaviin lapsisolmuihin ":i 30 (11,12,13,14,15,16). Jollei lapsisolmu ole lehtisolmu (kuten I2,15), niin se *·;·* käsittää edelleen osoitintaulukon.
• · · • · • · • · * *:··· Keksintö perustuu siihen ajatukseen, että kun puun solmut tallennetaan . muistiin oikeassa järjestyksessä, voidaan linkit tai osoittimet jättää pois *: *i 35 solmuista, jolloin muistia säästyy. Tällaisia järjestelyjä ovat esimerkiksi f I · syvyyssuuntaiset ja leveyssuuntaiset tallennusmenetelmät, tai niiden 118062 14 yhdistelmät, kuten kuvissa 6a - d on esitetty. Toisin sanoen keksinnön ajatuksena on tallentaa puiden sisältö tietyssä tekstistä-foneemiksi-konversioon soveltuvassa järjestyksessä siten, että puuhun voidaan kohdistaa kunnollisia hakuja vaikka siinä ei olisikaan linkkejä, δ
Syvyyssuuntaisessa tallennusmenetelmässä puun solmut tallennetaan seuraamalla puurakennetta ensin äärimmäisenä vasemmalla olevaan lehteen. Tämän jälkeen siirrytään seuraavana oikealla olevassa haarassa aina viimeiseen lehteen asti. Kuvassa 6a on esitetty esimerkki 10 kuvan 1 päätöspuurakenteesta, jossa solmut ja lehdet on muunnettu pienimuistiseen syvyyssuuntaiseen muotoon. Syvyyssuuntaisessa tallennusmuodossa jokainen solmu on tallennettu sopivimmin vain kerran.
Esimerkiksi juurisolmu tallennetaan vain kerran. On itsestään selvää, että jokainen solmu, esimerkiksi juurisolmu, voidaan tallentaa kahdesti 15 tai useammin (kuten kuvassa 6a).
Leveyssuuntaisessa tallennusmenetelmässä puun juuri R tallennetaan ensin, jonka jälkeen seuraavat kaikki ensimmäisen tason solmut, sitten kaikki toisen tason solmut, jne. Kuvassa 6b on esitetty esimerkki kuvan 20 1 päätöspuurakenteesta, jossa kaikki solmut ja lehdet on muunnettu . pienimuistiseen leveyssuuntaiseen muotoon.
• · · ···#, * * φ * · :;j.: Yhdistetyssä tallennusmenetelmässä voidaan yhdistää syvyyssuuntai- nen ja leveyssuuntainen menetelmä. Kuvissa 6c ja 6d on esitetty esi- • · : 25 merkkejä yhdistetystä päätöspuun 1 tallennusmenetelmästä, jota on j\‘: jatkettu alemmilla solmutasoilla (M, N, O). Kuten kuvassa 6c on esi- tetty, voidaan leveyssuuntaista menetelmää käyttää aina kolmannelle tasolle (L) asti, josta eteenpäin käytetään syvyyssuuntaista menetel-mää. Vaihtoehtoisesti, kuten kuvassa 6d on esitetty, voidaan täydellistä !"·. 30 leveyssuuntaista menetelmää käyttää aina kolmannelle tasolle (L) asti, josta eteenpäin jokaisen solmun alipuut kolmannella tasolla (L) tallen-netaan yksittäin leveyssuuntaisessa järjestyksessä. Tämä voidaan " tehdä nopeamman muistinsaannin mahdollistamiseksi todennäköisesti : tarvittaville solmuille.
• * * Λ i 35 • · * • · ' 15 118062 Näiden tallennusmenetelmien tarkoituksena on mahdollistaa puun tallentaminen ilman puurakenteessa olevia linkkejä tai osoittimia. Toimiakseen kunnolla tallennusmenetelmän tulee olla sellainen, että kun linkit on poistettu, solmut järjestetään peräkkäin muistiin niin, että ne sol-5 mut, joita voidaan käyttää kontekstin määrittelemiseen, seuraavat aina vanhempisolmua tallennusjärjestyksessä.
Puun solmut tallennetaan kuvatulla tavalla haara haaralta. Päätöspuun yksittäinen sisäsolmu I käsittää seuraavaa tietoa sisältäviä data-10 elementtejä: - attribuuttiarvo, kuten kirjain - sisäsolmun I ja lehden L erottava yksi bitti - attribuuttityyppi aj - foneemi pj, joka vastaa tiettyä kontekstia 15
Yksittäinen lehtisolmu L käsittää seuraavaa tietoa sisältäviä data-elementtejä: - attribuuttiarvo, kuten kirjain - sisäsolmun 1 ja lehden L erottava yksi bitti 20 - foneemi Pi, joka vastaa tiettyä kontekstia , . - bitti, joka ilmoittaa, onko kyseessä vanhempisolmun viimeinen lv lehti • · * • ta • · * * • · *
Esitetyn menetelmän avulla voidaan minimoida päätöspuumallien > · · 25 muistintarve. Viimeksi mainittua tarkoitusta varten päätöspuun data- j'*‘: elementiksi on määritelty attribuuttityyppi, attribuuttiarvo tai foneemi.
• · * • · .
• • * · 3. Menetelmiä dataelementtien esittämiseksi päätöspuussa • · · "··. 30 Tämä keksinnön osa kuvaa kolmea menetelmää päätöspuun data- ♦ # *" elementtien esittämiseksi minimimuistivaatimusten aikaansaamiseksi.
···
Esitetyt menetelmät ovat päätöspuun dataelementtien kiinteäbittinen varaus (fixed bit allocation) ja muuttuvabittinen varaus (variable bit al-: location), sekä päätöspuun dataelementtien Huffman-koodaus.
I 35 • · · • · ...
16 118062 Päätöspuun dataelementtien kiinteäbittinen varaus Päätöspuun koko on kaikkien sen sisäsolmujen ja lehtien kokojen summa. Seuraavassa analysoidaan sisäsolmujen ja lehtien kokoa. 5 Tässä yhteydessä esitetyt luvut pätevät englanninkieleen.
a) Attribuuttiarvojen lukumäärä: kirjaimia on kaksikymmentäkuusi, foneemeja on alle kuusi-kymmentäneljä ja foneemiluokkia on alle kuusitoista. Näi-10 den välinen maksimiarvo on kuusikymmentäneljä, jolloin attribuuttiarvoille on varattu kuusi bittiä b) Attribuuttityyppien lukumäärä:
Neljän pituiselle kontekstille on neljä kirjainta käsiteltävänä 15 olevan kirjaimen vasemmalla ja oikealla puolella, neljä fo neemia sen vasemmalla puolella ja neljä foneemiluokkaa käsiteltävänä olevan kirjaimen vasemmalla puolella. Näin ollen yhteissummaksi saadaan kuusitoista, ja näin ollen attribuuttityypeille varataan neljä foneemia.
20 . „ c) Foneemien lukumäärä: • · ·
Englannin kielessä lukumäärä on kolmenkymmenenkah- • * * , :y · den ja kuudenkymmenenneljän välillä, jolloin foneemeille on varattu kuusi bittiä.
: 25 d) Sisäsolmuja/lehtiä ilmaiseva lippu vaatii vain yhden bitin.
• · « * * · e) Tietyn sisäsolmun lehtien päättymisen ilmaiseva lippu vaatii vain yhden bitin.
**·· ..
.**. 30
Edellä esitettyä bittivarausta kutsutaan kiinteäbittiseksi varaukseksi, koska bittien lukumäärä on ennalta määrätty ja muuttumaton.
* * : Sisäsolmun ja lehden koot voidaan määritellä seuraavalla tavalla: : 35 * ·«
Sisäsolmun kohdalla koko on kohtien a), b), c) ja d) summa: 118062 17
Sisäsolmunjcoko = 6 + 4 + 6 + 1 = 17 bittiä
Lehden koko on kohtien a), c), d) ja e) summa:
Lehden_koko = 6 + 6 + 1 + 1 =14 bittiä 5 Päätösouun dataelementtien muuttuvabittinen varaus Päätöspuupohjaisessa tekstistä-foneemiksi-muunnoksessa jokainen 10 puu vastaa yhtä kirjainta. Keksinnön ensimmäisessä osiossa on esitetty karsintamenetelmä. Vain vastaavat foneemit, jotka on listattu taulukkoon 2 sallitaan tietylle kirjaimelle ryhmitellyssä sanakirjassa. Tästä syystä jokaisen puun foneemien lukumäärä on rajoitettu Taulukon 2 mukaan. Esimerkiksi kirjaimella ”a” on 7 mahdollista foneemia, jolloin 15 foneemeille tulee varata 3 bittiä sen sijaan että kaikille foneemeille varattaisiin 6 bittiä, kuten edellä on kuvattu (c). Tämän syynä on se, että kirjaimelle ”a” käytetään vain seitsemää foneemia, kaikki muut karsiutuvat pois ryhmittelyn aikana. Nyt bittien lukumäärä vähenee kolmella sekä sisäsolmujen että lehtien kohdalla. Foneemeille varattujen bittien 20 lukumäärä vaihtelee luonnollisestikin eri lehdissä.
* · • · * ;·γ Karsintamenetelmässä jokainen kirjain / voi vastata vain kirjainriippu- :*j · väistä foneemijoukkoa.
« · • * * · * 25 l ->p, jossa Pe {/>,,/7,,:..,pj.
• · * • * · ♦ · * *
Foneemi voidaan koodata kirjainriippuvaisen foneemijoukon perusteella kokonaisen kieliriippuvaisen foneemijoukon sijaan. Tätä mene-telmää kutsutaan muuttuvabittiseksi varaukseksi, koska foneemeille .··*. 30 varattujen bittien lukumäärä voi vaihdella kirjaimesta ja puusta toiseen.
Esimerkiksi kiinteäbittisen varauksen menetelmissä ”a” muunnetaan • · · koko foneemijoukon (40 foneemia) perusteella, kun taas muuttuvabitti- sen varauksen menetelmässä kirjain ”a” voidaan muuntaa kirjainriippu- vaisen foneemijoukon mukaan (englannin kielessä 8 foneemia). Näin .·. · 35 se vaatii [Iog2(40)j = 6 bittiä kiinteäbittisessä varauksessa ja • * · [log2(8)j = 3 bittiä muuttuvabittisessä varauksessa.
118062 18
Kirjainriippuvaista bittivarausta voidaan käyttää myös muita data-elementtejä kuten attribuuttityyppejä ja attribuuttiarvoja varten. Tämän toteuttamiseksi tulee tietylle kirjaimelle löytää kaikki mahdolliset attri-5 buuttityyppien ja attribuuttiarvojen joukot. Kun nämä joukot ovat tiedossa, attribuuttityyppien ja attribuuttiarvojen vaatima bittimäärä voidaan laskea.
Muuttuvabittisen varauksen soveltamiseksi päätöspuun dataelemen-10 teille jokaiselle kirjaimelle etsitään sallitut foneemit, attribuuttityypit ja attribuuttiarvot. Kun joukot on saatu selville, ne tallennetaan taulukoihin. Jos taulukon dataelementtiä vastaava koko on n, dataelementin tallentamiseen muuttuvan bittiallokaation avulla tarvittava bittimäärä on [log2(n)j bittiä. Taulukko tulee tallentaa muistiin, mikä aiheuttaa yleis-15 rasitteen. Tästä syystä muuttuvabittistä varausta käytetään vain jos muuttuvabittisestä varauksesta syntyvä säästö (Saved_var_bits) on suurempi kuin taulukon tallennuksesta syntyvä ylimäärä {Overheadvarjbits).
20 Säästettyjen bittien lukumäärä lasketaan seuraavalla tavalla: , , Saved var_bits = • · · j··'· (NumjbitsJixed — Num_bits_variable)Count_occurrence ···.' • ·
NumjbitsJixed vastaa dataelementeille varattujen bittien lukumäärää !.:*· 25 kiinteäbittisessä varauksessa. Num__bitsjvariable vastaa dataelementille varattujen bittien lukumäärää muuttuvabittisessä varauksessa.
Countoccurrence on dataelementin esiintymiskertojen lukumäärä «·· päätöspuussa.
*·* T", 30 Dataelementille tallennetun taulukon ylimäärä lasketaan seuraavalla Γ* tavalla: * · ·
Overhead_var_bits = (Sizejable + 1 JBitsJnJbyte • ‘ 1 • · * * * * * .·! : Siz&jable vastaa taulukossa olevien elementtien määrää, ja Bits_in_byte • · · ! * 35 on kahdeksan • « » • ♦ * * 118062 ' 19
Elementtien Saved_var_bits ja Overhead_var__bits välinen vertailu suoritetaan jokaisen dataelementin kohdalla (attribuuttityyppi, attribuuttiako ja foneemi) ja jos Saved_var_bits on suurempi kuin Overhead_var_bits, käytetään muuttuvabittistä varausta: 5 jos Saved_var_bits > Overhead_var_bits Päätöspuun dataelementtien Huffman-koodaus 10
Binäärikoodin varaamiseksi päätöspuun dataelementeille voidaan käyttää Huffman-koodia. Huffman-koodin käyttäminen voi säästää muistia, jos päätöspuun dataelementin jakaumassa on suurta vaihtelua. Huffman-koodauksen perusajatuksena on varata suuren toden-15 näköisyyden dataelementeille lyhyitä koodisanoja, ja matalan todennäköisyyden dataelementeille pitkiä koodisanoja. Huffman-koodit ovat optimaalisia ja häviöttömiä. Koodi on pituudeltaan muuttuva, ja data-elementin koodauksessa käytettävien bittien lukumäärä määräytyy tiettyä dataelementtiä vastaavan koodisanan pituuden mukaan. 20 Huffman-koodi tulee määritellä jokaiselle päätöspuun muuttujalle erik- . . seen.
• · » • · · *·*· • * : Alla olevassa taulukossa 3 on esitetty esimerkki Huffman-koodauk- * · · Σ...: sesta kirjaimen ”a” foneemeille englannin kielessä. Foneemien 25 pakkaussuhde on 1.2554. Taulukossa käytetty lyhenne ”FLC” tarkoittaa :*·[: kiinteämittaista koodia (Fixed Length Code).
• * » • · ♦ • · · ··*·.
* · · • · • · * ·* • * » • · • * · ♦ ··«««< • * ··· • * « • »* • » * · « · * » · 118062 20
Foneemit A: ä ai E el I V _
Toden- 0.2238 0.277 0.0019 0.0250 0.1211 0.0075 0.2650 0.0780 näköisyys FLC 000 001 010 011 100 101 110 111
Huffman- 10 01 110000 11001 111 110001 00 1101 koodi
Taulukko 3 Kirjaimen "a” foneemien koodaus amerikan englannissa päätöspuun avulla 5 Jotta Huffman-koodausta voitaisiin käyttää päätöspuun dataelementeille, tulee Huffman-koodit, jokaisen koodin bittimäärä ja vastaava aakkosten kirjain tallentaa muistiin, mikä aiheuttaa yleisrasitetta. Päätös siitä, käytetäänkö Huffman-koodausta tehdään jokaiselle data-elementille erikseen. Tietylle dataelementille voidaan käyttää Huffman-10 koodausta vain jos Huffman-koodauksesta saatava säästö (Scivedjiuffjbits) on suurempi kuin ylimäärä (Overheadjiuffjbits).
Huffman-koodauksella säästettyjen bittien lukumäärä voidaan laskea kaavalla: . . 15 Saved huff bits - * m m " 'θ,· (NumJjitsJixed - Num_bits_CWi)Count_CWi • * · • * · « · « • · *
NumjbitsJixed vastaa dataelementille varattujen bittien lukumäärää kiinteäbittisessä varauksessa. Numjits.„CW, vastaa i:ntena koodina : j 20 Huffman-koodatussa puussa esiintyvälle koodille varattujen bittien lukumäärää.
* · * .i. Huffman-koodin tallennuksen ylimäärä voidaan laskea kaavasta: ***· * * · • * * * *·* 25 OverheadJhuff Jbits = (3 NumJmjfjCW + 1) Bits_perjbyte • i • * ·**
Num_huffLCW vastaa dataelementin Huffman-koodien määrää, ja Bitsjn_byte on kahdeksan. Oletuksena on, että Huffman-koodit, :*.J Huffman-koodeissa olevien bittien määrää ilmaisevat muuttujat sekä 30 aakkosten kirjaimet on tallennettu yksittäisiin tavumuuttujiin.
118062 21
Elementtien Saved_huff_bits ja Overheadjiuffjbits välinen vertailu suoritetaan jokaisen dataelementin kohdalla (attribuuttityyppi, attribuuttiako ja foneemi) ja Huffman-koodausta sovelletaan dataelementtiin, jos määritelty ehto toteutuu seuraavalla tavalla 5 jos Saved_huffjbits > Overheadjhuffjbits.
Päätöspuun dataelementtien tallentamisessa vaadittavan muistin mää-10 rän minimointi
Puun tallentamisen perusrakenne on määrätynlainen, kuten osan 2 alussa on selostettu, mutta puussa olevat dataelementit voidaan esittää usealla tavalla. Bittien varaus voi olla pysyvää tai muuttuvaa, tai 15 käytössä voi olla Huffman-koodaus. Päätökset näiden koodausmenetelmien käyttämisestä tehdään jokaiselle päätöspuun dataelementille (attribuuttityyppi, attribuuttiako ja foneemi). Koska jokaiselle kirjaimelle on olemassa päätöspuupohjainen tekstistä-foneemiksi-malli, valinta toistetaan jokaiselle kirjaimelle.
20 . ^ Vaihtoehtoisessa suoritusmuodossa päätöstä joko kiinteämittaisen 5*V koodauksen tai Huffman-koodauksen käyttämisestä täydennetään ··· ·* mahdollisuudella käyttää niin sanottua katkaistua Huffman-koodausta.
·♦· Tässä koodausmenetelmässä tietyt dataelementtien akot, joilla on j 25 erittäin matala todennäköisyys, on ryhmitelty yhteen, ja ryhmälle an-:***: netaan yhteinen Huffman-etuliite. Dataelementin ako koodataan tä- män jälkeen akojen joukosta kiinteämittaisella koodilla. Esimerkiksi kahdeksan erittäin epätodennäköisen arvon ryhmä voitaisiin koodata 7 bitin Huffman-koodilla, jota seuraa 3 bitin kiinteämittainen koodi.
*::: 30 * * ‘J* Tietyn dataelementin kohdalla tietyssä puussa tehtävä valinta siitä, käytetäänkö kiinteäbittistä varausta, muuttuvabittistä varausta vai Huffman-koodausta suoritetaan siten, että pienimuistisen päätös-: puumailin muistivaatimukset minimoituvat. Tästä syystä päätöksenteko .·. | 35 perustuu seuraavaan logiikkaan: • · · * · 118062 22 a) Alustus: Oletetaan, että dataelementille käytetään kiinteäbittistä varausta.
b) Jos Saved_varjbits > Overhead_var_bits, dataelementille käytetään 5 muuttuvabittistä varausta: c) Jos Huffman-koodauksella saatu säästö on suurempi kuin muuttuva-bittisellä varauksella saatu säästö ja suurempi kuin Huffman-koodille määritelty ylimäärä, käytetään dataelementille Huffman-koodausta: 10
Saved_hujf_bits ~ OverheadJwffJbits >Saved_var_bits - Overhead_var_bits JA
Saved_huff_bits > Overheadjiuffjbits.
15 Keksinnössä hyödynnetään tätä minimointimenetelmää minimibitti-varauksen määrittämiseksi automaattisesti jokaiselle päätöspuun data-elementille kaikissa päätöspuissa.
Testi: 20 . . Keksintöä on testattu koulutettaessa päätöspuita USA:n henkikirjoitus- * · · listoissa esiintyvien nimien ääntämistä varten CMU:n (Carnegie Mellon : University) sanakirjasta poimittujen ääntämysten pohjalta. Ääntämis- • ♦ 1 tapojen kokonaismäärä on 40 529. Perussovelluksessa käytetään alku-j.·1: 25 peräistä ryhmittelyä päätöspuun dataelementtien kiinteäbittisellä vara- :1·1: uksella. Kuten alla olevasta taulukosta 4 käy ilmi, päätöspuumallin koko on huomattavasti pienentynyt (36%) ja tekstistä-foneemiksi-suori- • · · tuksessa ole havaittavissa heikentymistä foneemien tarkkuuden ja sarjatason (string rate) suhteen. Tämä todistaa keksinnön hyödyllisyy- *·1’ 30 den.
• « ♦ ♦ ··♦ »·· • · • · ··· • 1 • 1 • · · • · · • · • · · 118062 23
Menetelmät Muisti (kB) Foneemien tarkkuus Sarjataso
Tekniikan taso 132.5 99.27%_97.12 %
Keksintö Ιδ4.9 [99.27% [97.17%
Taulukko 4 Päätöspuun vertailu tunnetun tekniikan ja keksinnön mu-: kaisissa menetelmissä 5 Keksinnössä on esitetty erilaisia innovatiivisia tekniikoita: Ryhmittelyssä käytettävä karsintamenetelmä, päätöspuurakenne, kiinteäbittinen varaus päätöspuun dataelementeille, muuttuvabittinen varaus päätös-puun dataelementeille sekä bittien Huffman-koodaus päätöspuun data-elementeille. On itsestään selvää, että kaikkia tekniikoita voidaan hyö-10 dyntää yksin tai eri tavoin yhdistäen, mistä syystä tätä keksinnön kuvausta ei tule tulkita keksintöä rajoittavaksi.
Tekstistä-foneemiksi-järjestelmää voidaan soveltaa osana puheen-tunnistusjärjestelmää elektroniikkalaitteessa, esimerkiksi digitaalisena 15 signaalinkäsittely-yksikkönä. Elektroniikkalaite voi käsittää muita toimintoja, kuten esimerkiksi tietoliikennevälineet, kuten matkapuhelimessa T (kuva 7). Laite käsittää sopivimmin kaiuttimen H ja mikrofonin M. Tekstistä-foneemiksi-järjestelmää voidaan myös soveltaa elektro-;*V niikkalaitteen kanssa käytettävässä oheislaitteessa. Jos elektroniikka- · 20 laite on matkapuhelin, oheislaite voi muodostua kuulokkeista tai video- laseista.
• · · * · · ·*· ♦ :**]: Tekstistä-foneemiksi-järjestelmää voidaan lisäksi käyttää älykkäässä ympäristössä (ubiquitous environment) jolloin järjestelmää voidaan so-25 veltaa talon eri huoneissa, eri kodinkonelaitteissa (kuten videot, pesu-kone), huonekaluissa, tai asusteissa (esim. vaatteissa).
4 * · · *·» • * * · T On itsestään selvää, että edellä kuvattuja suoritusmuotoja ei tule tulkita • · « keksintöä rajoittaviksi, vaan ne voivat vaihdella seuraavissa patentti- "·" 30 vaatimuksissa esitettyjen keksinnöllisten piirteiden puitteissa.
• » • · « • ·· • · • · • · · • · · * ·

Claims (30)

118062
1. Menetelmä puumaisen tietorakenteen hallitsemiseksi, joka menetelmä käsittää vaiheet joissa muodostetaan vanhempisolmun ja ainakin 5 yhden lehtisolmun käsittävä päätöspuu, ja jossa menetelmässä lisäksi etsitään tietoa mainituista solmuista, tunnettu siitä, että päätöspuu muodostetaan tallentamalla solmut peräkkäin siten, että solmut seu-raavat vanhempisolmua tallennusjärjestyksessä, jotka solmut käsittävät ainakin yhden tiedon, joka on koodattu käyttämällä informaatiota van-10 hempisolmun tai isovanhempisolmun ainakin yhdestä tiedosta, jolloin haettavan tiedon kontekstin määritteleviin solmuihin voidaan päästä ilman niiden vanhempisolmusta lähtevää linkkiä.
2. Patenttivaatimuksen 1 mukainen menetelmä, tunnettu siitä, että 15 päätöspuun solmut tallennetaan jonkin seuraavan menetelmän mukaan: syvyyssuuntaisella tallennusmenetelmällä, leveyssuuntaisella tallennusmenetelmällä tai niiden yhdistelmällä.
3. Patenttivaatimuksen 1 tai 2 mukainen menetelmä, tunnettu siitä, 20 että ennen tallennusta päätöspuu koulutetaan ryhmiteltyjen data- elementtien avulla, jotka elementit alustetaan lukuarvolla, joka on riip-: puvainen mainitun elementin oikeellisuudesta, jolloin lukuarvo aluste- • * : taan uudelleen mainitun elementin tunnettujen ominaisuuksien perus- £[·* teella lisäämällä rajoitus virheellisille elementeille. ί 25
··· · "·*· 4. Patenttivaatimuksen 1, 2 tai 3 mukainen menetelmä, tunnettu siitä, • · .·*·. että menetelmä kohdistuu tekstistä-foneemiksi-muunnokseen, jossa mainittu tieto käsittää elementtejä, kuten kirjaimia ja foneemeja, jolloin e!e päätöspuu muodostetaan yhtä kirjainta varten, ja solmut käsittävät ‘lii 30 mainitun kirjaimen foneemit. • · • · *··
5. Patenttivaatimuksen 4 mukainen menetelmä, tunnettu siitä, että ·:··· solmut käsittävät lisäksi tietoa mainitun kirjaimen kontekstista, kuten /.ί ympäröivistä kirjaimista. • ·· : : 35 • * · • ♦ · • · : 25' 118062
6. Jonkin patenttivaatimuksen 3-5 mukainen menetelmä, tunnettu siitä, että foneemin oikeellisuuden tarkistamiseksi tarkistetaan onko se jokin sallituista foneemeista, jolloin mainittu lukuarvo alustetaan nollalla, vai onko se ei-sallittu foneemi, jolloin mainittu lukuarvo alustetaan 5 suurella positiivisella arvolla.
7. Jonkin patenttivaatimuksen 3-6 mukainen menetelmä, tunnettu siitä, että foneemin oikeellisuuden tarkistamiseksi tarkistetaan lisäksi onko se lingvistisesti sallittu foneemi, jolloin mainittu lukuarvo aluste- 10 taan uudelleen nollalla, vai onko se lingvistisesti ei-sallittu foneemi, jolloin mainittu lukuarvo alustetaan uudelleen suurella positiivisella arvolla.
8. Jonkin patenttivaatimuksen 1 - 7 mukainen menetelmä, tunnettu 15 siitä, että solmun sisältämä tieto tallennetaan jossakin seuraavassa muodossa: kiinteäbittisenä, muuttuvabittisenä tai Huffman-koodeilla.
9. Patenttivaatimuksen 8 mukainen menetelmä, tunnettu siitä, että elementit esitetään muuttuvabittisenä jos muuttuvalla bittimuodolla 20 saavutettu säästö on suurempi kuin elementeistä koostuvan taulukon . . tallennuksen ylimäärä, tai elementeille suoritetaan Huffman-koodaus, |·· ·* jos Huffman-koodauksella saavutettu säästö on suurempi kuin : muuttuvabittisenä muodolla saavutettu säästö ja suurempi kuin Huffman-koodin ylimäärä. : 25
• · · · :*·*: 10. Patenttivaatimuksen 8 tai 9 mukainen menetelmä, tunnettu siitä, • · että tallennusmuoto valitaan oleellisesti jokaiselle elementille erikseen.
·« * ,·. 11. Järjestelmä puumaisen tietorakenteen hallitsemiseksi, joka järjes- 30 telmä käsittää päätöspuun muodostajan, joka päätöspuu käsittää van-**:*' hempisolmun ja ainakin yhden lehtisolmun, ja järjestelmä käsittää li- t"'/· säksi tiedonhakijan joka hakee tietoja mainituista solmuista, tunnettu *:··: siitä, että päätöspuun muodostaja on järjestetty muodostamaan ; päätöspuu tallentamalla solmut peräkkäin siten, että solmut seuraavat : : 35 vanhempisolmua tallennusjärjestyksessä, jotka solmut käsittävät aina- ’* kin yhden tiedon, joka on koodattu käyttämällä informaatiota vanhempi- 118062 solmun tai isovanhempisolmun ainakin yhdestä tiedosta, jolloin haettavan tiedon kontekstin määritteleviin solmuihin voidaan päästä ilman niiden vanhempisolmusta lähtevää linkkiä.
12. Patenttivaatimuksen 11 mukainen järjestelmä, tunnettu siitä, että tallennusmenetelmä on jokin seuraavista: syvyyssuuntainen tallennus, leveyssuuntainen tallennus tai näiden yhdistelmä.
13. Patenttivaatimuksen 11 tai 12 mukainen järjestelmä, tunnettu siitä, 10 että järjestelmä käsittää lisäksi välineet päätöspuun kouluttamiseksi ryhmitellyn dataelementtijoukon avulla, jotka välineet ovat kykeneviä alustamaan elementit lukuarvolla, joka on riippuvainen mainitun elementin oikeellisuudesta, ja alustamaan uudelleen lukuarvolla, joka on riippuvainen mainitun elementin tunnetuista ominaisuuksista lisäämällä 15 rajoitus virheellisille elementeille.
14. Patenttivaatimuksen 11, 12 tai 13 mukainen järjestelmä, tunnettu siitä, että järjestelmässä sovelletaan tekstistä-foneemiksi-muunnosta, jossa mainittu tieto käsittää elementtejä, kuten kirjaimia ja foneemeja, 20 jolloin päätöspuu vastaa yhtä kirjainta, ja mainitut solmut käsittävät mainitun kirjaimen foneemit. • * · • ♦ · • * · · • k
: 15. Patenttivaatimuksen 14 mukainen järjestelmä, tunnettu siitä, että ***** solmut käsittävät lisäksi tietoa mainitun kirjaimen kontekstista, kuten : 25 ympäröivistä kirjaimista.
• · · * · · * · * · .*··. 16. Jonkin patenttivaatimuksen 11-15 mukainen järjestelmä, tun nettu siitä, että järjestelmä on järjestetty tarkistamaan foneemin oikeel-... lisuus, eli onko se jokin sallituista foneemeista, jolloin järjestelmä on ":l 30 järjestetty alustamaan mainittu lukuarvo nollalla, vai onko se ei-sallittu *"·* foneemi, jolloin järjestelmä on järjestetty alustamaan mainittu lukuarvo suurella positiivisella arvolla. • *
17. Jonkin patenttivaatimuksen 11-16 mukainen järjestelmä, tun- *.* ! 35 nettu siitä, että järjestelmä on lisäksi järjestetty tarkistamaan foneemin ’* *: oikeellisuus, eli onko foneemi lingvistisesti sallittu, jolloin järjestelmä on 21 : ; 118062 järjestetty alustamaan mainittu lukuarvo nollalla, vai onko se lingvistisesti ei-sallittu foneemi, jolloin järjestelmä on järjestetty alustamaan mainittu lukuarvo suurella positiivisella arvolla.
18. Jonkin patenttivaatimuksen 11-17 mukainen järjestelmä, tunnettu siitä, että solmuissa sijaitseva tieto esitetään jollakin seuraavista tavoista: muuttuvina, pysyvinä tai Huffman-koodattuina binäärisinä lukuina.
19. Patenttivaatimuksen 18 mukainen järjestelmä, tunnettu siitä, että järjestelmä on järjestetty tarkistamaan mikä mainituista muodoista saa aikaan suuremman säästön vertaamalla mainittuja muotoja toisiinsa, jolloin järjestelmä on järjestetty soveltamaan kyseistä binäärimuotoa.
20. Jonkin patenttivaatimuksen 11-18 mukainen järjestelmä, tun nettu siitä, että järjestelmä on puheentunnistusjärjestelmä.
21. Laite joka käsittää tallennusvälineen tiedon tallennusta varten puumaisessa tietorakenteessa, joka koostuu vanhempisolmusta ja ai- 20 nakin yhdestä lehtisolmusta, joka mainittu laite käsittää lisäksi suorittimien tiedon käsittelemiseksi mainitussa rakenteessa, joka suoritin kä-: sittää päätöspuun muodostajan ja solmuissa olevan tiedon hakijan, : tunnettu siitä, että päätöspuun muodostaja on järjestetty muodosta- maan päätöspuu tallentamalla solmut peräkkäin siten, että solmut seu-: 25 raavat vanhempisolmua tallennusjärjestyksessä, jotka solmut käsittävät ··*: ainakin yhden tiedon, joka on koodattu käyttämällä informaatiota van- .·*·. hempisolmun tai isovanhempisolmun ainakin yhdestä tiedosta, jolloin haettavan tiedon kontekstin määritteleviin solmuihin voidaan päästä ... ilman niiden vanhempisolmusta lähtevää linkkiä. 30
• · ’·;·* 22. Patenttivaatimuksen 21 mukainen laite, tunnettu siitä, että tallennusjärjestys on jokin seuraavista: syvyyssuuntainen tallennus, ·:··: leveyssuuntainen tallennus tai näiden yhdistelmä. • « · *: 35
23. Patenttivaatimuksen 21 tai 22 mukainen laite, tunnettu siitä, että • * * '* *: laite soveltaa tekstistä-foneemiksi-muunnosta, jossa mainittu tieto kä- 118062 ' 28 sittää elementtejä, kuten kirjaimia ja foneemeja, jolloin päätöspuu vastaa yhtä kirjainta, ja mainitut solmut käsittävät mainitun kirjaimen foneemit.
24. Jonkin patenttivaatimuksen 21 -23 mukainen laite, tunnettu siitä, että laite käsittää lisäksi puheentunnistusjärjestelmän.
25. Jonkin patenttivaatimuksen 21 - 24 mukainen laite, tunnettu siitä, että laite käsittää lisäksi tietoliikennevälineet. 10
26. Puumainen tietorakenne, joka koostuu vanhempisolmusta ja ainakin yhdestä lehtisolmusta, jotka mainitut solmut käsittävät haettavaa tietoa, tunnettu siitä, että solmut sijaitsevat peräkkäin siten, että solmut seuraavat vanhempisolmua tallennusjärjestyksessä, jotka solmut 15 käsittävät ainakin yhden tiedon, joka on koodattu käyttämällä informaatiota vanhempisolmun tai isovanhempisolmun ainakin yhdestä tiedosta, jolloin haettavan tiedon kontekstin määritteleviin solmuihin voidaan päästä ilman niiden vanhempisolmusta lähtevää linkkiä.
27. Patenttivaatimuksen 26 mukainen puumainen tietorakenne, tun nettu siitä, että solmuissa sijaitseva tieto esitetään jollakin seuraavista : tavoista: muuttuvina, pysyvinä tai Huffman-koodattuina binäärisinä lu- * · · kuina. • · · • · • · ·♦· l25
28. Patenttivaatimuksen 26 tai 27 mukainen puumainen tietorakenne, "·*: tunnettu siitä, että rakenteessa hyödynnetään tekstistä-foneemiksi- * · .·*·. muunnosta, jolloin päätöspuu käsittää tiedon yhdestä kirjaimesta ja solmut käsittävät tiedon sen foneemeista. #·'·'· 'i:'.' 30
29. Jonkin patenttivaatimuksen 26 - 28 mukainen puumainen tieto- **:** rakenne, tunnettu siitä, että solmut käsittävät tietoa kirjainta ympäröi- vistä kirjaimista. « · · · X
: 30. Tietokoneohjelmatuote joka käsittää tietokoneen tallennusvälineen • *· X | 35 sekä tietokoneella luettavan koodin, joka on tallennettu tietokoneen ** tallennusvälineeseen puumaisen tietorakenteen käyttämiseksi, joka on 118062 tallennettu mainittuun tallennusvälineeseen, joka mainittu puumainen tietorakenne koostuu vanhempisolmusta ja ainakin yhdestä lehti-solmusta, jolloin mainittu tietokoneella luettava koodi käsittää käskyjä mainittujen solmujen sisällön etsimiseksi, tunnettu siitä, että tieto-5 koneella luettava koodi käsittää käskyjä solmujen järjestämiseksi peräkkäin siten, että solmut seuraavat vanhempisolmua tallennusjärjes-tyksessä, jotka solmut käsittävät ainakin yhden tiedon, joka on koodattu käyttämällä informaatiota vanhempisolmun tai isovanhempi-solmun ainakin yhdestä tiedosta, jolloin haettavan tiedon kontekstin 10 määritteleviin solmuihin voidaan päästä ilman niiden vanhempi-solmusta lähtevää linkkiä • · • · · • * · *···'' ♦ ···' • · · * * · · ' * · • · • * · • · • · *··· ·*· *·· • · · · · · • · • · • · • * · · • · * · * · « * · • * *·· • · ... • · * · · * · · · · • · ♦ • · ♦ • * · • · • * • · · • ·· 118062
FI20035055A 2003-04-30 2003-04-30 Pienimuistinen päätöspuu FI118062B (fi)

Priority Applications (9)

Application Number Priority Date Filing Date Title
FI20035055A FI118062B (fi) 2003-04-30 2003-04-30 Pienimuistinen päätöspuu
PCT/FI2004/050044 WO2004097673A1 (en) 2003-04-30 2004-04-22 Low memory decision tree
KR1020077019768A KR100883577B1 (ko) 2003-04-30 2004-04-22 로우메모리 결정트리
EP04728830A EP1618498B1 (en) 2003-04-30 2004-04-22 Low memory decision tree
KR1020057020316A KR20060016758A (ko) 2003-04-30 2004-04-22 로우메모리 결정트리
DE602004023072T DE602004023072D1 (de) 2003-04-30 2004-04-22 Entscheidungsbaum mit geringem speicherplatzbedarf
AT04728830T ATE442642T1 (de) 2003-04-30 2004-04-22 Entscheidungsbaum mit geringem speicherplatzbedarf
CN2004800115762A CN1781102B (zh) 2003-04-30 2004-04-22 低速存储器判定树
US10/835,597 US7574411B2 (en) 2003-04-30 2004-04-29 Low memory decision tree

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FI20035055 2003-04-30
FI20035055A FI118062B (fi) 2003-04-30 2003-04-30 Pienimuistinen päätöspuu

Publications (3)

Publication Number Publication Date
FI20035055A0 FI20035055A0 (fi) 2003-04-30
FI20035055A FI20035055A (fi) 2004-10-31
FI118062B true FI118062B (fi) 2007-06-15

Family

ID=8566389

Family Applications (1)

Application Number Title Priority Date Filing Date
FI20035055A FI118062B (fi) 2003-04-30 2003-04-30 Pienimuistinen päätöspuu

Country Status (8)

Country Link
US (1) US7574411B2 (fi)
EP (1) EP1618498B1 (fi)
KR (2) KR100883577B1 (fi)
CN (1) CN1781102B (fi)
AT (1) ATE442642T1 (fi)
DE (1) DE602004023072D1 (fi)
FI (1) FI118062B (fi)
WO (1) WO2004097673A1 (fi)

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7421453B2 (en) * 2005-08-16 2008-09-02 International Business Machines Corporation Asynchronous linked data structure traversal
KR100748720B1 (ko) 2006-02-09 2007-08-13 삼성전자주식회사 다중 계층 중심 어휘 목록에 기초하여 대규모 단어 음성인식 방법 및 그 장치
JP4379894B2 (ja) * 2006-11-28 2009-12-09 株式会社エスグランツ カップルドノードツリーの分割/結合方法及びプログラム
DE102007015535A1 (de) * 2007-03-30 2008-10-02 Siemens Ag Verfahren zur digitalen Speicherung von Daten auf einem Datenspeicher mit beschränktem verfügbarem Speicherplatz
US8200609B2 (en) * 2007-08-31 2012-06-12 Fair Isaac Corporation Construction of decision logic with graphs
US8266090B2 (en) * 2007-08-31 2012-09-11 Fair Isaac Corporation Color-coded visual comparison of decision logic
US8280836B2 (en) * 2008-09-08 2012-10-02 Fair Isaac Corporation Converting unordered graphs to oblivious read once ordered graph representation
US8730241B2 (en) * 2008-09-08 2014-05-20 Fair Isaac Corporation Techniques for drawing curved edges in graphs
JP2010152081A (ja) * 2008-12-25 2010-07-08 Toshiba Corp 話者適応装置及びそのプログラム
GB2473197A (en) 2009-09-02 2011-03-09 Nds Ltd Advert selection using a decision tree
JP5032602B2 (ja) * 2010-01-21 2012-09-26 株式会社東芝 認識装置
US8543517B2 (en) 2010-06-09 2013-09-24 Microsoft Corporation Distributed decision tree training
CN101950307B (zh) * 2010-09-26 2012-10-10 南威软件股份有限公司 一种面向用户资源的自定义方法
US9171264B2 (en) 2010-12-15 2015-10-27 Microsoft Technology Licensing, Llc Parallel processing machine learning decision tree training
US8488888B2 (en) 2010-12-28 2013-07-16 Microsoft Corporation Classification of posture states
US8984246B2 (en) * 2011-04-04 2015-03-17 Texas Instruments Incorporated Method, system and computer program product for reading a decision tree
US10671841B2 (en) 2011-05-02 2020-06-02 Microsoft Technology Licensing, Llc Attribute state classification
US9280575B2 (en) * 2012-07-20 2016-03-08 Sap Se Indexing hierarchical data
US9336192B1 (en) * 2012-11-28 2016-05-10 Lexalytics, Inc. Methods for analyzing text
CN103854643B (zh) * 2012-11-29 2017-03-01 株式会社东芝 用于合成语音的方法和装置
US9305036B2 (en) 2014-03-27 2016-04-05 International Business Machines Corporation Data set management using transient data structures
US10108608B2 (en) * 2014-06-12 2018-10-23 Microsoft Technology Licensing, Llc Dialog state tracking using web-style ranking and multiple language understanding engines
US10339465B2 (en) * 2014-06-30 2019-07-02 Amazon Technologies, Inc. Optimized decision tree based models
US20160063099A1 (en) * 2014-08-29 2016-03-03 Lexmark International Technology, SA Range Map and Searching for Document Classification
US9619165B1 (en) * 2015-10-30 2017-04-11 Sandisk Technologies Llc Convertible leaf memory mapping
CN110555205B (zh) * 2018-05-31 2024-04-19 北京京东尚科信息技术有限公司 否定语义识别方法及装置、电子设备、存储介质
US10997083B2 (en) * 2018-09-04 2021-05-04 Arm Limited Parallel page table entry access when performing address translations
KR20210033258A (ko) 2019-09-18 2021-03-26 삼성전자주식회사 시퀀스 처리 방법 및 장치

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4571679A (en) * 1983-09-06 1986-02-18 The United States Of America As Represented By The Secretary Of The Navy Fault tree data array
US5033087A (en) 1989-03-14 1991-07-16 International Business Machines Corp. Method and apparatus for the automatic determination of phonological rules as for a continuous speech recognition system
US5530957A (en) 1992-08-07 1996-06-25 At&T Corp. Storing trees in navigable form
GB2277387A (en) 1993-04-21 1994-10-26 Ibm Natural language processing system
US5619615A (en) * 1994-07-22 1997-04-08 Bay Networks, Inc. Method and apparatus for identifying an agent running on a device in a computer network
US6163769A (en) 1997-10-02 2000-12-19 Microsoft Corporation Text-to-speech using clustered context-dependent phoneme-based units
TW422967B (en) * 1998-04-29 2001-02-21 Matsushita Electric Ind Co Ltd Method and apparatus using decision trees to generate and score multiple pronunciations for a spelled word
US6411957B1 (en) * 1999-06-30 2002-06-25 Arm Limited System and method of organizing nodes within a tree structure

Also Published As

Publication number Publication date
DE602004023072D1 (de) 2009-10-22
WO2004097673A1 (en) 2004-11-11
FI20035055A (fi) 2004-10-31
KR100883577B1 (ko) 2009-02-13
EP1618498B1 (en) 2009-09-09
ATE442642T1 (de) 2009-09-15
FI20035055A0 (fi) 2003-04-30
US7574411B2 (en) 2009-08-11
KR20070094984A (ko) 2007-09-27
US20040267785A1 (en) 2004-12-30
EP1618498A1 (en) 2006-01-25
KR20060016758A (ko) 2006-02-22
CN1781102A (zh) 2006-05-31
CN1781102B (zh) 2010-05-05

Similar Documents

Publication Publication Date Title
FI118062B (fi) Pienimuistinen päätöspuu
US5758024A (en) Method and system for encoding pronunciation prefix trees
US5949961A (en) Word syllabification in speech synthesis system
DE3876379D1 (de) Automatische bestimmung von kennzeichen und markov-wortmodellen in einem spracherkennungssystem.
WO1992014237A1 (en) Method for recognizing speech using linguistically-motivated hidden markov models
WO2004027752A1 (en) Method and apparatus to facilitate correlating symbols to sounds
JP2008262279A (ja) 音声検索装置
WO2003041051A2 (en) Hmm-based text-to-phoneme parser and method for training same
Riley et al. Transducer composition for context-dependent network expansion.
Hifny Open vocabulary Arabic diacritics restoration
Seneff et al. ANGIE: A new framework for speech analysis based on morpho-phonological modelling
US20050267755A1 (en) Arrangement for speech recognition
Park et al. Korean grapheme unit-based speech recognition using attention-ctc ensemble network
Tian Data-driven approaches for automatic detection of syllable boundaries.
Sak et al. Written-domain language modeling for automatic speech recognition
Svendsen Pronunciation modeling for speech technology
Ash et al. Grapheme to phoneme translation using conditional random fields with re-ranking
Chen et al. Automatic discovery of contextual factors describing phonological variation
Keri et al. Pause prediction from lexical and syntax information
Wei et al. Research on Syllable-Based Language Model in Malay Speech Recognition
Suontausta et al. Low memory decision tree method for text-to-phoneme mapping
Kuhn et al. Applications of decision tree methodology in speech recognition and understanding
Würzner et al. A hybrid approach to grapheme-phoneme conversion
Vazirnezhad et al. A hybrid statistical model to generate pronunciation variants of words
van den Bosch et al. Linguistic pattern matching capabilities of connectionist networks

Legal Events

Date Code Title Description
FG Patent granted

Ref document number: 118062

Country of ref document: FI

MM Patent lapsed