FI102425B

FI102425B - Menetelmä muistin toteuttamiseksi

Info

Publication number: FI102425B
Application number: FI971066A
Authority: FI
Inventors: Matti Tikkanen; Jukka-Pekka Iivonen
Original assignee: Nokia Telecommunications Oy
Priority date: 1997-03-14
Filing date: 1997-03-14
Publication date: 1998-11-30
Also published as: FI971066A; WO1998041932A1; FI102425B1; AU6623998A; WO1998041932A8; FI971066A0; EP0970430A1

Description

102425

Menetelmä muistin toteuttamiseksi

Keksinnön ala 5 Keksintö liittyy yleisesti assosiatiivisen muistin toteuttamiseen, erityi sesti digitaaliseen trie-rakenteeseen perustuvan assosiatiivisen muistin toteuttamiseen. Keksinnön mukainen ratkaisu on tarkoitettu käytettäväksi lähinnä keskusmuistitietokantojen yhteydessä. Sopivia sovelluskohteita ovat erityisesti sellaiset tietokannat, joissa tehdään hakuihin nähden myös paljon lisäyk-10 siä ja poistoja. Tällaisia sovelluskohteita ovat esim. matkaviestinverkkojen vierailijarekisterit (VLR, Visitor Location Register).

Keksinnön tausta

Keksinnön mukainen periaate pohjautuu sinänsä tunnettuun yksilö ulotteiseen hakemistorakenteeseen, jota kutsutaan nimellä digitaalinen trie (engl. digital trie, sana “trie” tulee englannin kielen sanasta “retrieval”). Digitaalisia trie-rakenteita voidaan toteuttaa kahden tyyppisinä: sellaisina, joissa on sankoja (bucket trie) ja sellaisina, joissa ei ole sankoja.

Sangollinen digitaalinen trie-rakenne on puumainen rakenne, jossa 20 on kahdenlaisia solmuja: sankoja ja trie-solmuja. Sangoksi kutsutaan tässä vaiheessa tietorakennetta, joka sisältää joukon tietoyksikköjä tai joukon osoittimia tietoyksiköihin tai joukon hakuavain/osoitin-pareja (joukkoon voi kuulua vain yksi tietoyksikkö, yksi osoitin tai yksi avain/osoitin-pari). Trie-solmu on puolestaan hakua ohjaava taulukko, jonka koko on kaksi potenssiin k (2k) 25 alkiota. Jos trie-solmun alkio on käytössä, se osoittaa joko hakemistopuun seuraavalla tasolla olevaan trie-solmuun tai sankoon. Muutoin alkio on vapaa (tyhjä).

Tietokantaan kohdistuva haku etenee tutkimalla hakuavainta (joka on esim. matkaviestinverkon tai puhelinkeskuksen tilaajatietokannan tapauksessa 30 tyypillisesti se binääriluku, joka vastaa tilaajan puhelinnumeroa) k bittiä kerrallaan. Tutkittavat bitit valitaan siten, että rakenteen ylimmällä tasolla (ensimmäisessä trie-solmussa) tutkitaan k:ta eniten vasemmalla olevia bittiä, rakenteen toisella tasolla vasemmalta lukien seuraavia k:ta bittiä, jne. Tutkittavat bitit tulkitaan etumerkittömänä kaksijärjestelmän lukuna, jota käytetään 35 suoraan trie-solmun sisältämän alkiotaulukon indeksinä, joka osoittaa tietyn 2 102425 alkion taulukosta. Jos indeksin mukainen alkio ei ole käytössä, haku päättyy epäonnistuneena. Jos alkio osoittaa seuraavalla tasolla olevaan trie-solmuun, siellä tutkitaan edellä kuvatulla tavalla k:ta seuraavaa bittiä, jotka on irrotettu hakuavaimesta. Vertailun perusteella haaraudutaan trie-solmussa edelleen 5 joko seuraavalla tasolla olevaan trie-solmuun tai sankoon. Jos alkio osoittaa avaimen sisältävään sankoon, talletettua avainta verrataan hakuavaimeen. Koko hakuavaimen vertailu tapahtuu siten vasta haun saavuttaessa sangon. Avainten ollessa samat haku on onnistunut, ja haluttu tietoyksikkö saadaan sangon osoittimen osoittamasta muistiosoitteesta. Avainten ollessa erisuuret 10 haku päättyy epäonnistuneena.

Sangottomassa trie-rakenteessa ei ole sankoja, vaan viittaus tietoyksikköön tapahtuu puumaisessa hierarkiassa alimmalla tasolla olevasta trie-solmusta, jota kutsutaan lehtisolmuksi. Sangoista poiketen sangottoman rakenteen lehtisolmut eivät voi sisältää tietoyksikköjä, vaan ainoastaan osoit-15 timia tietoyksiköihin. Myös sangollisessa rakenteessa on lehtisolmuja, joten trie-solmuista lehtisolmuja ovat sellaiset solmut, jotka sisältävät ainakin yhden osoittimen sankoon (sangollinen rakenne) tai tietoyksikköön (sangoton rakenne). Trien muut solmut ovat sisäsolmuja. Trie-solmut voivat siis olla joko si-säsolmuja tai lehtisolmuja. Sankojen avulla saadaan hakemistorakenteen 20 muokkaustarvetta lykättyä ajallisesti, koska sankoihin saadaan mahtumaan paljon osoittimia/tietoyksiköitä ennen kuin kyseinen tarve syntyy.

Keksinnön mukaista ratkaisua voidaan soveltaa sekä sangolliseen että sangottomaan rakenteeseen. Jatkossa käytetään kuitenkin esimerkkeinä « sangollisia rakenteita.

25 Kuviossa 1 on esitetty esimerkki digitaalisesta trie-rakenteesta, jossa avaimen pituus on 4 bittiä ja k=2, jolloin siis kussakin trie-solmussa on 22=4 alkiota ja kullakin tasolla tutkitaan kahta avaimesta irrotettua bittiä. Tietueen sisältäviä sankoja on merkitty viitemerkeillä A, B, C, D...H...M, N, O ja P. Sanko on siis sellainen solmu, josta ei enää osoiteta puun alemmalle tasolle. Trie-30 solmuja on kuviossa 1 merkitty viitemerkillä IN1...IN5 ja trie-solmun alkioita vii-temerkillä NE.

Kuvion 1 mukaisessa esimerkkitapauksessa ovat esitettyjen sankojen hakuavaimet seuraavat: A=0000, B=0001, C=0010,..., H=0111,... ja P=1111. Kuhunkin sankoon on tässä tapauksessa talletettu osoitin siihen 35 tietokannan SD muistipaikkaan, josta varsinainen data, esim. kyseisen tilaajan 3 102425 puhelinnumero sekä muut kyseistä tilaajaa koskevat tiedot löytyvät. Tietokannassa voi varsinainen tilaajadata olla talletettuna esim. peräkkäis-tiedostoksi kuviossa esitettyyn tapaan. Esim. tietueen H hakuavaimen perusteella tapahtuu haku irrottamalla hakuavaimesta ensin kaksi vasem-5 manpuoleisinta bittiä (01) ja tulkitsemalla ne, jolloin päädytään solmun IN1 toiseen alkioon, joka sisältää osoittimen seuraavalla tasolla olevaan solmuun IN3. Tällä tasolla irrotetaan hakuavaimesta seuraavat kaksi bittiä (11), jolloin päädytään ko. solmun neljänteen alkioon, joka osoittaa tietueeseen H.

Osoittimen asemesta sanko voi sisältää (hakuavaimen lisäksi) varsi-10 naisen datatietueen (josta käytetään myös yleisempää nimitystä tietoyksikkö). Näin ollen esim. tilaajaa A koskevat tiedot (kuvio 1) voivat olla sangossa A, tilaajaa B koskevat tiedot sangossa B, jne. Assosiatiivisen muistin ensimmäisessä suoritusmuodossa sankoon on siis talletettu avain-osoitin-pari ja toisessa suoritusmuodossa avain ja varsinainen data, joskaan avain ei ole välttä-15 mätön.

Hakuavain voi olla myös moniulotteinen. Toisin sanoen, hakuavain voi koostuu useasta attribuutista (esim. tilaajan sukunimi ja yksi tai useampi etunimi). Tällainen moniulotteinen trie-rakenne on kuvattu kansainvälisessä patenttihakemuksessa PCT/FI95/00319 (julkaisunumero WO 95/34155). 20 Kyseisessä rakenteessa suoritetaan osoitelaskentaa siten, että kustakin dimensiosta valitaan, muista dimensioista riippumatta, kerrallaan tietty ennalta määrätty lukumäärä bittejä. Trie-rakenteen yksittäisen trie-solmun kullekin dimensiolle asetetaan siis kiinteä, muista dimensioista riippumaton raja määrää-mällä etukäteen kussakin dimensiossa tutkittavien hakuavainbittien lukumäärä. 25 Tällaisella rakenteella saadaan muistipiirien tarve pieneksi silloin, kun hakua-vainten arvojen jakaumat ovat etukäteen tiedossa, jolloin rakenne voidaan toteuttaa staattisena.

Käytännössä on kuitenkin havaittu, että kyseisellä rakenteella ei aina (kaikilla avainjakaumilla) pystytäkään saavuttamaan muistinkulutuksen kan-30 naita optimaalista trie-solmujen täyttöastetta.

Keksinnön yhteenveto

Keksinnön tarkoituksena on päästä eroon edellä kuvatusta epäkohdasta ja saada aikaan menetelmä, jonka avulla kiinteää solmukokoa käyttä-35 vässä rakenteessa pystytään vaadittu muistitila pitämään mahdollisimman 4 102425 pienenä ja muistinhallinta tehokkaana, erityisesti tietokannoissa, joissa on paljon lisäyksiä ja poistoja.

Tämä päämäärä saavutetaan ratkaisulla, joka on määritelty itsenäisissä patenttivaatimuksissa. Näistä ensimmäinen kuvaa rakennetta, jossa 5 käytetään sankoja ja toinen rakennetta, jossa ei käytetä sankoja.

Keksinnön ajatuksena on käyttää rakenteessa kiinteää, neljän kokoista solmua ja korvata sellaiset peräkkäiset nelisolmut, jotka muodostavat vain yhden polun alaspäin puussa (yhdellä tai useammalla) kompressoidu(i)lla solmuilla, johon/joihin on tiivistetty yhdestä tai useasta peräkkäisestä nelisol-10 musta se informaatio, joka tarvitaan rakenteessa etenemiseen ja solmujen uudelleen muodostamiseen, ilman, että kuitenkaan tarvitaan muistitilaa alkio-taulukoille. Ajatuksena on siis käyttää muistitilan tarpeen ja muistin tehokkuuden kannalta optimaalista solmukokoa ja lisäksi vähentää muistitilan tarvetta edelleen niiden peräkkäisten nelisolmujen osalta, jotka muodostavat vain 15 yhden polun alaspäin puussa (ja joiden täyttöaste ei ole optimaalinen). Toisin sanoen, ajatuksena on pienentää muistitilan tarvetta erityisesti epätasaisten avainjakaumien yhteydessä pienentämällä rakenteen syvyyttä kompressoitujen solmujen avulla.

Keksinnön mukainen ratkaisu takaa myös joukko-operaatioiden 20 tehokkaan toteutuksen, koska rakenne on järjestyksen säilyttävä digitaalinen trie.

Kuvioluettelo

Seuraavassa keksintöä ja sen edullisia toteutustapoja kuvataan tar-25 kemmin viitaten oheisten piirustusten mukaisiin esimerkkeihin, joissa kuvio 1 havainnollistaa yksiulotteisen digitaalisen trie-rakenteen käyttöä puhelinkeskuksen tilaajatietojen ylläpitämisessä, kuvio 2 esittää erästä moniulotteista trie-rakennetta, kuvio 3 esittää erästä kolmiulotteista muistirakennetta, 30 kuvio 4 havainnollistaa keksinnön mukaista muistirakennetta, kuvio 5 havainnollistaa osoitelaskennan toteuttamista keksinnön mukaisessa muistissa, kuviot 6a ja 6b havainnollistavat nelisolmuketjun korvausta kompressoidulla solmulla, 35 kuviot 7a ja 7b esittävät kompressoidun solmun muodostamisperiaa- 5 102425 tetta,

Kuviot 8a ja 8b esittävät erästä esimerkkiä muistirakenteen ylläpidosta, kuvio 9 havainnollistaa muistissa käytettävän kompressoidun solmun 5 rakennetta, kuvio 10a havainnollistaa käytetyn sananpituuden aiheuttamaa rajoitusta solmujen yhdistämiselle, kuvio 10b esittää kuvion 10a solmuketjusta muodostettavan kokoavan solmun rakennetta, ja 10 kuvio 11 esittää keksinnön mukaista muistijärjestelyä lohkokaaviota- solla.

Keksinnön yksityiskohtainen kuvaus

Kuten edellä mainittiin, toteutetaan trie-rakenne esillä olevassa kek-15 sinnössä moniulotteisena (yleisesti ottaen n-ulotteisena). Tällainen moniulotteinen rakenne on muutoin aivan samanlainen kuin alussa kuvattu yksiulotteinen rakenne, mutta trie-solmun sisältämä alkiotaulukko on moniulotteinen. Kuviossa 2 on esitetty esimerkkinä kaksiulotteinen 22*21-rakenne, jossa alkiotau-lukossa on toisessa dimensiossa neljä alkiota ja toisessa dimensiossa kaksi al-20 kiota. Trie-solmun alkioista osoitettuja sankoja on kuviossa merkitty ympyröillä.

Osoitelaskenta tapahtuu moniulotteisessa tapauksessa samalla periaatteella kuin yksiulotteisessa tapauksessa. Peruserona on kuitenkin se, että yhden alkiotaulukkoindeksin sijaan lasketaankin indeksi jokaiselle alkiotaulu-kon dimensiolle (n kappaletta). Kullakin dimensiolla on tällöin oma haku-25 avainavaruutensa {0, 1,..., 2v'-1}(vj on hakuavaimen pituus bitteinä kussakin dimensiossa ja i e {1,...n}).

Trie-solmun koko kunkin dimension suunnassa on 2“· alkiota ja trie-solmun alkioiden kokonaislukumäärä S on myös kakkosen potenssi: : S = U2k‘ = 2klx2klx2k,x..=2N (1) 30 Trie-solmun, jolla on n kappaletta dimensioita, kaikki alkiot voidaan siten osoittaa n kappaleella kokonaislukuja (n>2), joista kukin voi saada arvon, joka on välillä {0,1...2^-1}. Etukäteen kiinteäksi määrätty parametri on siis hakuavaimen kokonaispituus kussakin dimensiossa. Mikäli esim. hakuavaimen yhdessä dimensiossa on korkeintaan 256 attribuuttia (esim. etunimeä), on 35 hakuavaimen kokonaispituus 8 bittiä.

β 102425

Kuviossa 3 on esitetty esimerkkinä muistin hakemistorakenteessa käytettävää solmua N10, kun käytettävä hakuavain on kolmiulotteinen. Ensimmäisen dimension (x) suunnassa trie-solmussa on 22=4 alkiota, toisen dimension (y) suunnassa 21=2 alkiota ja kolmannen dimension (z) suunnassa 5 23=8 alkiota, jolloin trie-solmussa on yhteensä 26=64 alkioita, jotka on nume roitu välillä 0...63.

Koska käytännön laitteiden (esim. tietokonelaitteiden) muistiavaruus on yksiulotteinen, moniulotteinen taulukko linearisoidaan eli muunnetaan yksiulotteiseksi osoitelaskentaprosessissa (eli edettäessä hakemistopuussa). Li-10 nearisointi on aritmeettinen operaatio, jonka voi tehdä kaikenkokoisille taulukoille. Näin ollen ei ole väliä, katsotaanko trie-solmujen alkiotaulukot yksi- vai moniulotteisiksi, koska moniulotteiset taulukot linearisoidaan joka tapauksessa yksiulotteisiksi.

Linearisoinnissa taulukon alkiot numeroidaan nollasta alkaen (aivan 15 kuin on esitetty kuviossa 3), jolloin viimeisen alkion numero on yhtä pienempi kuin kaikkien ulottuvuuksien kokojen tulo. Alkion numero on summa jokaisen koordinaatin (esim. kolmiulotteisessa tapauksessa x-, y- ja z-koordinaatit) ja sitä edeltävien dimensioiden kokojen tuloista. Näin laskettua numeroa käytetään suoraan yksiulotteisen taulukon indeksinä.

20 Kuviossa 3 esitetyn trie-solmun tapauksessa lasketaan alkion nume ro VAn edellä esitetyn mukaisesti kaavalla: VAn= x+yx4+zx4x2 (2) missä xe{0,1,2,3}, ye{0,1} ja ze{0,1,2,3,4,5,6,7}. Esim. alkiolle 54 saadaan näin sen koordinaateista (2,1,6): 2+1x4+6x4x2=2+4+48=54.

25 Linearisoitaessa n-ulotteisen trie-rakenteen trie-solmun (n-ulotteista) alkiotaulukkoa jokaisen dimension koko on edellä esitetyn mukaisesti 2k|, missä kj on ko. dimension kerralla tutkittavien bittien lukumäärä. Jos viitemer-killä a, merkitään dimension mukaista koordinaattia (je{0,1,2...n)), linearisointi voidaan kirjoittaa muotoon: n j-1 30 Π 2 elo,1,2,...,2^-ι}λΛ0= 0 (3) j=\ /»o

Linearisointi voidaan toteuttaa suorittamalla kaavan (3) mukainen kertolasku, mutta on kuitenkin edullista suorittaa linearisointi muodostamalla hakuavainbiteistä jollakin sinänsä tunnetulla tavalla bittijono, jota vastaava luku 7 102425 ilmoittaa sen alkion, jonka sisällön perusteella hakemistopuussa edetään. Tällaista linearisointitapaa kutsutaan bittilimitykseksi.

Kuten edellä mainittiin, käytännössä on havaittu, että alussa mainitussa kansainvälisessä patenttihakemuksessa kuvatulla ratkaisulla ei kaikissa 5 olosuhteissa (kaikilla avainjakaumilla) pystytäkään saavuttamaan optimaalista muistinkulutusta. Kun asiaa tutkitaan matemaattisesti, voidaan osoittaa, että n-haarautuvan trie-rakenteen (n-ary trie) keskimääräinen trie-solmujen muistitilan tarve E tasaisilla avainjakaumilla on kaavan (4) mukaisesti: n loge n E = ——v--- (4) m log n rt -1 10 missä n on trie-solmun taulukon koko, m on osoittimien maksimilukumäärä sangossa, v on tietueiden lukumäärä koko rakenteessa ja e on Neperin luku. Kaava (4) voidaan johtaa artikkelissa C. H. Ang and H. Samet: Approximate average Storage utilization of bucket methods with arbitrary fanout, Nordic Journal of Computing 3, (1996), ss. 280-291 (myös Computer Science TR 15 3618) esitettyjen kaavojen avulla.

Kaavassa (4) on keksinnön kannalta oleellista se, että sillä on minimit parametrin n arvoilla 2 ja 4. Näin ollen muistinkulutus on minimissään arvoilla 2 ja 4. Näistä valitaan keksinnön mukaisen muistin käyttöön arvo 4, koska tällä tavoin saadaan rakenteen syvyys pienemmäksi ja muisti tehokkaammaksi 20 (nopeammaksi). Trie-rakenne toteutetaan siis esillä olevassa keksinnössä ulotteisuusriippumattomana nelihaarautuvana rakenteena. Tämä tarkoittaa sitä, että edellä kuvattujen dimensioiden lukumäärä n voi olla mikä tahansa, mutta trie-solmuissa tutkittavien bittien lukumäärä on kuitenkin kiinteästi kaksi (lukuunottamatta kompressoituja solmuja, joita kuvataan jäljempänä). Toisin 25 sanoen, rakenteen kaikkien tavallisten trie-solmujen kooksi valitaan kiinteästi neljä, riippumatta siitä, mikä on käytettävien dimensioiden lukumäärä. Näitä trie-solmuja kutsutaan jatkossa myös nelisolmuiksi.

Erästä tällaista rakennetta on havainnollistettu kuviossa 4. Kuviossa on esitetty viisi tavallista nelisolmua N41...N45, joissa on yhteensä kuusi 30 osoitinta sankoihin (L1...L6). Nelisolmujen ja sankojen lisäksi rakenteessa voi olla kompressoituja solmuja, joita kuvataan tarkemmin jäljempänä.

Kuviossa 5 on havainnollistettu erästä esimerkkiä keksinnön mukaisen muistin trie-solmuissa suoritettavasta osoitelaskennasta. Kuviossa on oletettu, että avaruuden ulotteisuus on 3 (dimensiot x, y ja z), mutta kuten 8 102425 edellä mainittiin avaruuden ulotteisuus voi olla mielivaltainen. Lisäksi on oletettu, että hakuavain ax dimension x suunnassa on ax = 011011, hakuavain ay dimension y suunnassa a, = 110100 ja hakuavain az dimension z suunnassa on az = 101010. Hakuavaimet on merkitty kuvioon allekkain.

5 Trie-rakenteen solmuissa yksiulotteisen alkiotaulukon indeksin muodostavat bitit on esitetty yhtenäisillä viivoilla esitetyissä kehyksissä. Nämä kehykset kuvaavat siis sitä, kuinka globaali hakuavain jaetaan paikallisiksi hakuavaimiksi, joista kutakin käytetään trie-rakenteen yhdessä solmussa. Rakenteen solmuja on merkitty etenemisjärjestyksessä viitemerkeillä N1...N9. 10 Jokaisessa solmussa tutkitaan kaksi bittiä, joten ensimmäisessä solmussa käytetään hakuavaimen ax vasemmanpuoleisin bitti ja hakuavaimen a, vasemmanpuoleisin bitti. Tämän jälkeen siirrytään nuolen mukaisesti seuraavaan solmuun (N2), jossa alkiotaulukkoindeksin muodostavat kaksi seuraavaa bittiä. Nämä ovat hakuavaimen az vasemmanpuoleisin bitti ja hakuavaimen ax va-15 semmaita lukien toinen bitti. Tällä tavoin edeten saadaan seuraavat solmu-kohtaiset alkiotaulukkoindeksit: 01 (solmu N1), 11 (solmu N2), 10 (solmu N3), 10 (solmu N4), 10 (solmu N5), 10 (solmu N6), 10 (solmu N7), 11 (solmun N8) ja 00 (solmu N9).

Koska kussakin trie-solmussa tutkittavien bittien lukumäärä on kiin-20 teästi kaksi, ei solmuun tarvitse tallettaa tutkittavien bittien lukumäärää. Mini-mikokoonpanossaan solmu käsittää siis ainoastaan alkiotaulukon, jossa on neljä alkiota. Hakemistopuussa etenemiseksi on lisäksi tiedettävä kunkin solmun tyyppi. Tämä tieto voidaan tallettaa hakemistorakenteessa esim. kuhunkin solmuun tai solmun isäsolmun osoittimeen. Osoittimen kahdella 25 “ylimääräisellä” bitillä voidaan koodata osoittimeen tieto siitä, onko kysymyksessä nollaosoitin (tyhjä alkio) vai osoittaako osoitin tavalliseen trie-solmuun, sankoon vai kompressoituun trie-solmuun (jota kuvataan jäljempänä). San-gottoman rakenteen tapauksessa talletetaan muistiin tieto siitä, osoittaako osoitin kompressoimattomaan solmuun, kompressoituun solmuun vai tietoyk-30 sikköön.

Koska osoitelaskenta suoritetaan käyttäen sinänsä tunnettua bittili-mitystä, ei osoitelaskentaa kuvata tässä yhteydessä tarkemmin.

Muistitilan minimoimiseksi edelleen muodostetaan nelisolmuista tietyissä tapauksissa kompressoituja solmuja. Mikäli tavallisella nelisolmulla on 35 vain yksi lapsi, tarkoittaa tämä sitä, että ko. nelisolmun kautta kulkee vain yksi 9 102425 polku “alaspäin” puussa. Sellainen nelisolmu, joka sisältää vain yhden osoitti-men (polun alaspäin) on muistitilan optimoimiseksi edullista korvata kompressoidulla solmulla, jossa kerrotaan kyseisellä polulla tutkittujen bittien lukumäärä ja laskettu taulukkoindeksin arvo. Koska tarvittavan muistitilan kannalta on 5 edullista muodostaa yhden lapsen nelisolmuista kompressoituja solmuja koko muistirakenteessa, tarkoittaa kompressointi myös sitä, että muistirakenteen tavallisilla (ei-kompressoiduilla) nelisolmuilla ylläpidetään aina vähintään kaksi lasta, eli yksittäisestä (tavallisesta) nelisolmusta on osoittimet ainakin kahteen eri alemman tason solmuun (lapsisolmuun). Kompressoitu solmu korvaa 10 yhden tai useamman peräkkäisen sisäsolmun, joilla kaikilla on yksi lapsi, joten edellä mainittu yksi lapsi ei voi olla sanko (eikä lehti rakenteessa, jossa sankoja ei ole). Lapsisolmun on siis oltava tavallinen nelisolmu, jotta kompressointi voidaan tehdä. Muistitilan optimoinnin kannalta on siis edullista ylläpitää myös sankoa edeltävillä nelisolmuilla aina vähintään kaksi lasta.

15 Kompressoitujen nelisolmujen muodostamisperiaatetta on havain nollistettu kuviossa 6a ja 6b. Jos rakenteeseen syntyy kuvion 6a mukainen tilanne, jossa yhden tai usean peräkkäisen nelisolmun QN läpi kulkee vain yksi polku, voidaan kyseisellä polulla olevat nelisolmut korvata yhdellä kompressoidulla solmulla CN (kuvio 6b), joka käsittää tiedon tutkittavien bittien lukumää-20 rästä B, alkiotaulukkoindeksin i ja osoittimen lapsisolmuun. Tämä lapsisolmu on aina tavallinen nelisolmu. Toisin sanoen, kompressoitu solmu ei osoita sankoon. Jos kyseisellä polulla tutkittavien hakuavainbittien lukumäärä on suurempi kuin käytetyn tietokoneen käyttämä sananpituus, tarvitaan useampia kuin yksi kompressoitu solmu korvaamaan ko. polulla olevat nelisolmut.

25 Keksinnön mukaisessa muistissa on siis kahdenlaisia trie-solmuja: tavallisia nelisolmuja, jotka sisältävät kuvion 5 mukaisesti alkiotaulukon ja kompressoituja solmuja, joita kuvataan seuraavassa.

Kuvioissa 7a ja 7b orv havainnollistettu kompressoidun nelisolmun : muodostamista. Kuviossa 7a on esitetty kolmesta nelisolmusta muodostuva 30 paikallinen trie-rakenne, jossa on kahden ylimmän solmun osalta vain yksi polku. Nämä kaksi solmua voidaan korvata yhdellä alkiotaulukolla, joka on esitetty kuviossa 7b. Koska rakenteessa on ko. solmujen osalta vain yksi polku, on taulukosta käytössä vain yksi alkio, joka on tässä esimerkkitapauksessa alkio 14, joka on ympyröity kuviossa (14=1011, kun bitit otetaan rivijär-35 jestyksessä, eli ensin x-bitit ja sen jälkeen y-bitit). Näin ollen kuvion 7a the- 10 102425 rakenne voidaan kahden ylimmäisen solmun osalta korvata kompressoidulla nelisolmulla, johon on talletettu tutkittavien bittien lukumäärä (4) ja taulukkoin-deksin arvo (14).

Kuvioissa 8a ja 8b on esitetty edellistä kuviota vastaava ylläpitoesi-5 merkki, kun tietoyksikköjä ja niitä vastaavia avaimia poistetaan tietokannasta. Kuviossa 8a on esitetty alkutilanne, jossa muistirakenne käsittää trie-solmut N81...N83 ja sangot L2...L4. Tämän jälkeen muistista poistetaan sanko L2 ja sen sisältämä osoitin/tietue, jolloin solmut N81 ja N82 voidaan korvata kompressoidulla solmulla CN, jossa kerrotaan solmun sisältämän osoittimien indeksi 10 ja niiden bittien lukumäärä, jotka on tutkittu sillä polulla, jonka kompressoitu solmu korvaa.

Kompressoitu solmu on siis periaatteessa samanlainen kuin tavallinen nelisolmu, mutta sen sijaan, että talletettaisiin alkiotaulukko, jossa on vain yksi osoitin, talletetaanko kyseisen osoittimen indeksi ja polulla tutkittavien 15 bittien lukumäärä. Kompressoidussa solmussa on siis virtuaalinen taulukko, joka korvaa polulla olleen, yhden tai useamman solmutaulukon sisältämän informaation. Mikäli kompressoitu solmu korvaa useita tavallisia nelisolmuja, on kompressoidussa solmussa ilmoitettava tutkittavien bittien lukumäärä yhtä suuri kuin korvatuissa solmuissa tutkittavien bittien lukumäärien summa.

20 Kuviossa 9 on havainnollistettu kompressoidun solmun rakennetta.

Solmun minimikokoonpanoon kuuluu 3 osaa: kenttä 90, joka kertoo tutkittavien bittien lukumäärän, kenttä 91, johon on talletettu taulukkoindeksin arvo ja kenttä 92, johon on talletettu osoitin lapsisolmuun. Kompressoidussa solmussa tarvitaan em. tiedot siksi, että haku voisi jatkua myös kompressoidun solmun 25 kohdalla oikealla arvolla ja että solmun uudelleenmuokkaus onnistuisi rakenteen muutosten yhteydessä. (Ilman tietoa tutkittavien bittien lukumäärästä ei hakuavaimesta voida laskea taulukkoindeksin arvoa ja toisaalta ilman taulukkoindeksin arvoa ei laskettua arvoa voitaisi verrata solmuun talletettuun ar-: voon.) 30 Mikäli kompressoidussa solmussa tapahtuu lisäyksen yhteydessä yhteentörmäys eli kompressoituun solmuun tuleekin uusi osoitin, tutkitaan, kuinka mones bitti erottaa alkuperäisen osoittimen indeksin ja uuden osoittimen indeksin. Tämän mukaan luodaan alkuperäisen kompressoidun solmun korvaava rakenne, jossa uusi kompressoitu solmu sisältää indeksin bittien 35 lukumäärän siltä osin kuin yhteisiä bittejä on. Lisäksi rakenteeseen syntyy yksi 11 102425 tai useampi trie-solmu niitä bittejä vastaaville kohdille, joiden osalta indeksit eroavat toisistaan.

Mikäli kompressoitua solmua edeltää yksi tai useampi kompressoitu solmu tai trie-solmuketju, joka muodostaa vain yhden polun, on muistitilan 5 tarpeen ja muistin tehokkuuden kannalta edelleen edullista yhdistää kyseisiä solmuja. Muistin tehokkuuden kannalta on edelleen edullista suorittaa solmujen yhdistäminen niin, että vain ketjun viimeisenä (alimpana) olevassa kompressoidussa solmussa tutkittavien bittien lukumäärä on pienempi kuin käytetyn tietokoneen käyttämä sananpituus. Toisin sanoen, solmuja yhdistetään niin, 10 että tutkittavien bittien lukumäärä saadaan kussakin kompressoidussa solmussa mahdollisimman suureksi. Esim. kolme peräkkäistä kompressoitua solmua, joissa tutkittavien bittien lukumäärät ovat 5, 10 ja 15 voidaan yhdistää yhdeksi kompressoiduksi solmuksi, jossa tutkittavien bittien lukumäärä on 30. Vastaavasti esim. kolme peräkkäistä kompressoitua solmua (tai kolme peräk-15 käistä tavallista trie-solmua, jotka virittävät vain yhden polun), joissa tutkittavien bittien lukumäärät ovat 10, 10 ja 15 voidaan yhdistää kahdeksi kompressoiduksi solmuksi, joissa tutkittavien bittien lukumäärät ovat 32 ja 3, kun käytetty sananpituus on 32. Mahdollisimman moneen kompressoituun solmuun pyritään siis saamaan tietokoneen sananpituutta vastaava määrä tutkittavia 20 bittejä, ja mahdolliset “ylimääräiset” bitit jätetään hierarkiassa alimpana olevaan kompressoituun solmuun.

Kompressoituja solmuja ei kuitenkaan voida yhdistää niin, että yhdessä solmussa tutkittavien bittien lukumäärä olisi suurempi kuin käytetyn tietokoneen sananpituus. Erityisesti useampiulotteisissa (n>3) tapauksissa on taval-25 lista, että peräkkäisiä yhden lapsen sisältäviä solmuja on niin monta, että polkua ei voida esittää yhdellä kompressoidulla solmulla. Niinpä hakupolku tai sen osa korvautuu usean peräkkäisen kompressoidun solmun muodostamalla ketjulla, jossa muissa paitsi viimeisessä solmussa on tutkittavien bittien luku-: määrä sama kuin bittien lukumäärä sanassa, esim. Intel-arkkitehtuurissa 32, ja 30 viimeisessä solmussa pienempi tai yhtä suuri kuin bittien lukumäärä sanassa.

Tällaista tilannetta on havainnollistettu kuviossa 10a, jossa on esitetty kolme peräkkäistä kompressoitua solmua CN1...CN3. Solmuissa tutkittavien bittien lukumääriä on merkitty viitemerkeillä b, b’ ja b” ja solmujen sisältämien taulukkoindeksien arvoja vastaavasti viitemerkeillä i, i’ ja i". Kahdessa ylim-35 mässä solmussa on tutkittavien bittien lukumäärällä maksimiarvonsa (olettaen, 12 102425 että käytetään 32-bittistä tietokonearkkitehtuuria).

Rajoitetun sananpituuden aiheuttamasta, useiden peräkkäisten kompressoitujen solmujen muodostamasta ketjusta on edullista muodostaa yksi ko. kompressoidut solmut kokoava solmu. Tämä kokoava solmu muodostetaan 5 siten, että kokoavan solmun osoitin asetetaan osoittamaan ko. ketjussa viimeisenä olevan kompressoidun solmun lapseen, kokoavan solmun tutkittavien bittien lukumääräksi B asetetaan ketjussa olevien kompressoitujen solmujen tutkittavien bittien lukumäärien summa ja bittiiimityksellä tuotetut taulukkoin-deksit (eli hakusanat) asetetaan solmussa sijaitsevaan listaan tai taulukkoon T 10 siinä järjestyksessä, missä ne esiintyvät peräkkäisissä kompressoiduissa solmuissa. Kokoavasta solmusta tulee näin ollen kuvion 10b mukainen solmu CN4, jossa on kolme osaa: kenttä 130, joka sisältää osoittimen mainittuun alemman tason solmuun, kenttä 131, joka sisältää tutkittavien bittien lukumäärän B (em. summan) ja lista tai taulukko T, joka sisältää peräkkäin bittilimityk-15 sellä tuotetut taulukkoindeksit. Tämä kolmas osa on siis kooltaan muuttuva. Kuvion esimerkissä indeksien lukumäärä on kolme, koska kuvion 10a esimerkissä on peräkkäin kolme solmua.

Taulukon T alkioiden (eli indeksien) lukumäärä NE saadaan selville tutkittavien bittien lukumäärästä B seuraavasti:

, BIW, jos B MOD W = 0 on \rc — / J

l [β I W\+\, jos B MODW

missä L J on floor-funktio, joka poistaa luvusta desimaalit, W on käytetyn sanan pituus, esim. 32 ja MOD viittaa modulo-aritmetiikkaan. Kokoavaan solmuun ei siis tarvitse tallettaa indeksien lukumäärää erillisenä tietona, vaan se saadaan selville tutkittavien bittien lukumäärän perusteella.

25 Taulukossa viimeisenä olevan indeksin laskennassa tarvittava bittien lukumäärä B’ (jota on kuviossa merkitty viitemerkillä b”), joka ei välttämättä ole ' yhtä suuri kuin sanan pituus, saadaan seuraavasti: , W, jos B MODW = 0 B = 'B MODW, jos B MODW* 0

Muodostamalla useasta peräkkäisestä kompressoidusta solmusta ko-30 koava solmu saadaan muistiviittauksien (osoittimien) lukumäärä entistä pienemmäksi. Nykyisessä tietokonearkkitehtuurissa, jossa on useampitasoisia cache-muisteja, vaativat muistiviittaukset suhteellisen paljon laskenta-aikaa, 13 102425 joten laskenta-aika saadaan näin ollen pienemmäksi. Samalla poistuu muistitilan tarve osoittimien osalta.

Kompressoitujen solmujen avulla pystytään muistintarvetta minimoimaan tehokkaasti erityisesti epätasaisten avainjakaumien yhteydessä, koska 5 kompression avulla pystytään rakenteen syvyyttä kasvattamaan paikallisesti mielivaltaisen suureksi ilman, että tilantarve kasvaa.

Kuten edellä jo epäsuorasti mainittiin, keksinnön mukaisessa muistissa sankoa ei voi edeltää kompressoitu solmu vaan isäsolmuna on aina joko tavallinen nelisolmu tai tyhjä alkio. Kompressoitu solmu ei siis voi osoittaa 10 sankoon, vaan se osoittaa aina joko toiseen kompressoituun solmuun tai tavalliseen nelisolmuun. Tyhjällä alkiolla tarkoitetaan sitä, että jos tietueiden kokonaislukumäärä on pienempi kuin sankoon mahtuvien osoittimi-en/tietueiden lukumäärä, ei puumaista rakennetta vielä tarvita, vaan rakenteessa tullaan toimeen yhdellä sangolla (jolloin ko. solmua edeltää käsitteelli-15 sesti tyhjä alkio). Tällä tavoin on edullista menetellä muistin käyttöönoton alkuvaiheessa. Puumaista rakennetta kannattaa siis lähteä kasvattamaan vasta sitten, kun se on välttämätöntä.

Muistissa suoritettavat haut, lisäykset ja poistot suoritetaan muissa suhteissa sinänsä tunnetulla tavalla. Tämän suhteen viitataan esim. alussa 20 mainittuun kansainväliseen patenttihakemukseen, jossa kuvataan esim. lisäysten yhteydessä tapahtuvia törmäystilanteita tarkemmin. Tavanomaisten tuhoavien päivitysten asemesta rakenteessa voidaan käyttää myös tunnettuja funktionaalisia päivityksiä, jotka toteutetaan tunnetulla tekniikalla kopioimalla polku juuresta sankoihin.

25 Kuten alussa jo mainittiin, edellä kuvatut periaatteet koskevat myös sangotonta trie-rakennetta. Tällöin sankoa vastaa tietoyksikkö (johon sangot-toman rakenteen lehtisolmu osoittaa). Sangottomassa vaihtoehdossa tulee ongelmaksi se, millainen juurisolmun on oltava, kun rakenteessa on vain yksi : tietoyksikkö (johon juurisolmusta osoitetaan). Periaatteessa juurisolmun to- 30 teutukseen on kaksi vaihtoehtoa. Ensimmäisen vaihtoehdon mukaan juuressa voi tässä tapauksessa olla nelisolmu, jossa on vain yksi osoitin. Toisen, edullisemman vaihtoehdon mukaan juurisolmuna on kompressoitu solmu, joka viittaa suoraan ko. tietoyksikköön. Yhden tietoyksikön tapauksessa on siis sangottomassa vaihtoehdossa oltava em. poikkeus edellä kuvattuihin sääntöi-35 hin.

14 102425

Kuviossa 11 on esitetty keksinnön mukaista muistia lohkokaaviota-solla. Kutakin dimensiota varten on oma tulorekisteri, joten tulorekisterejä on siis yhteensä n kappaletta. Näihin tulorekistereihin, joita on merkitty vii-temerkeillä R^.R,,, talletetaan kunkin dimension hakuavain, kukin omaan 5 rekisteriinsä. Tulorekisterit on kytketty rekisteriin TR, johon muodostetaan edellä kuvattu hakusana edellä kuvatun bittilimitysmenetelmän mukaisesti. Rekisteri TR on kytketty summaimen S kautta muistin MEM osoitesisäänmenoon. Muistin ulostulo on puolestaan kytketty osoiterekisterille AR, jonka ulostulo on puolestaan kytketty summaimelle S. Aluksi luetaan jokaisesta rekisteristä vali-10 tut bitit oikeaan jäijestykseen yhteisrekisteriin TR. Kussakin tavallisessa ne-lisolmussa valitaan rekistereistä kaksi bittiä, mutta kompressoidun solmun kohdalla vaihtelee valittavien bittien lukumäärä sen mukaan, mikä on ko. solmussa tutkittavien bittien lukumäärä. Osoiterekisteriin AR on aluksi talletettu ensimmäisen trie-solmun aloitusosoite, jolloin tähän osoitteeseen summataan 15 summaimessa S se osoite, joka saadaan offset-osoitteena rekisteriltä TR. Tämä osoite syötetään muistin MEM osoitesisäänmenoon, jolloin muistin da-taulostulosta saadaan seuraavan trie-solmun aloitusosoite, joka kirjoitetaan osoiterekisteriin AR siellä olleen edellisen osoitteen päälle. Tämän jälkeen ladataan tulorekistereistä jälleen seuraavaksi valittavat bitit oikeaan järjestyk-20 seen yhteisrekisteriin TR ja näin saatu taulukko-osoite summataan ko. taulukon (eli trie-solmun) aloitusosoitteeseen, joka saadaan osoiterekisteristä AR. Tämä osoite syötetään jälleen muistin MEM osoitesisäänmenoon, jolloin • muistin dataulostulosta saadaan seuraavan solmun aloitusosoite. Edellä kuvattuja menettelyä toistetaan kunnes on edetty haluttuun pisteeseen asti ja 25 voidaan suorittaa talletus tai lukea haluttu tietue.

Ohjauslogiikka CL huolehtii muistirakenteen ylläpidosta sekä siitä, että kussakin kompressoidussa solmussa otetaan rekistereistä oikea määrä bittejä.

Osoitelaskennan nopeuteen voidaan vaikuttaa sillä, minkälainen . laitetoteutus valitaan. Koska eteneminen tapahtuu edellä esitettyjen bitti- 30 manipulaatioiden avulla, voidaan osoitelaskentaa nopeuttaa siirtymällä yhden prosessorin käytöstä moniprosessoriympäristöön, jossa suoritetaan rinnakkaista prosessointia. Moniprosessoriympäristölle vaihtoehtoinen toteutustapa on ASIC-piiri.

Vaikka keksintöä on edellä selostettu viitaten oheisten piirus-35 tusten mukaisiin esimerkkeihin, on selvää, ettei keksintö ole rajoittunut siihen, 15 102425 vaan sitä voidaan muunnella oheisissa patenttivaatimuksissa esitetyn keksinnöllisen ajatuksen puitteissa. Osoitelaskenta voi myös jatkua vielä sangossakin, edellyttäen, että bittejä on vielä tutkimatta. Rakenne voidaan toteuttaa myös vaihtuvan mittaisille avaimille. Osoitelaskenta voi myös jatkua vielä 5 sangossakin, edellyttäen, että bittejä on vielä tutkimatta. Alussa esitettyä sangon määritelmää onkin laajennettava siten, että sanko on tietorakenne, joka voi sisältää myös toisen trie-rakenteen. Useita keksinnön mukaisia hake-mistorakenteita voidaan siis linkittää peräkkäin siten, että sankoon on talletettu toinen hakemistorakenne (eli toinen trie-rakenne) tai sangon tai lehden sisäl-10 tämä osoitin osoittaa toiseen hakemistorakenteeseen. Viittaus sangosta tai lehdestä tapahtuu suoraan seuraavan hakemistorakenteen juurisolmuun. Yleisesti ottaen voidaan todeta, että sanko sisältää ainakin yhden elementin siten, että yksittäisen elementin tyyppi on valittu joukosta, joka käsittää tietoyksikön, osoittimen talletettuun tietoyksikköön, osoittimen toiseen hakemistora-15 kenteeseen ja toisen hakemistorakenteen. Sankojen tarkempi toteutus riippuu sovelluksesta. Useissa tapauksissa kaikki sangoissa olevat elementit voivat esim. olla samaa tyyppiä, joka on joko tietoyksikkö tai osoitin tietoyksikköön. Sen sijaan esim. sovelluksessa, jossa muistiin talletetaan merkkijonoja sangossa voi olla elementtipareja siten, että sangon kaikki parit ovat joko osoitin 20 tietoyksikköön/osoitin hakemistorakenteeseen -pareja tai tietoyksikkö/osoitin hakemistorakenteeseen -pareja tai tietoyksikkö/hakemistorakenne -pareja. Tällöin voidaan esim. merkkijonon etuosa (prefix) tallettaa tietoyksikköön ja jatkaa hakua tietoyksikköä vastaavaan pariin kuuluvasta hakemistoraken-teesta.

25 t «

Claims

16 102425

1. Menetelmä muistin toteuttamiseksi, johon muistiin tieto talletetaan tietoyksikköinä, joista jokaiselle varataan muistissa oma muistitilansa, jonka 5 menetelmän mukaisesti - muisti toteutetaan hakemistorakenteena, joka muodostuu puumaisesta hierarkiasta, jossa on useilla eri tasoilla olevia solmuja, jolloin yksittäinen solmu voi olla (i) trie-solmu, joka käsittää taulukon, jonka yksittäinen alkio voi sisältää puumaisessa hierarkiassa alempana olevan solmun osoitteen ja jonka 10 yksittäinen alkio voi myös olla tyhjä, tai (ii) sanko, joka sisältää ainakin yhden elementin siten, että sangon yksittäisen elementin tyyppi on valittu joukosta, joka käsittää tietoyksikön, osoittimen talletettuun tietoyksikköön, osoittimien toiseen hakemistorakenteeseen ja toisen hakemistorakenteen, - hakemistorakenteessa suoritetaan osoitelaskentaa siten, että 15 -(a) valitaan puumaisessa hierarkiassa ylimmällä tasolla olevas sa solmussa ennalta määrätty lukumäärä bittejä käytettyjen hakuavaimien muodostamasta bittijonosta, muodostetaan valituista biteistä hakusana, jonka perusteella haetaan kyseisessä solmussa seuraavan solmun osoite ja edetään mainittuun solmuun, 20 - (b) valitaan käytettyjen hakuavaimien muodostaman bittijonon vielä valitsematta olevien bittien joukosta ennalta määrätty lukumäärä bittejä ja muodostetaan valituista biteistä hakusana, jonka avulla haetaan jälleen uuden, alemmalla tasolla olevan solmun osoite sen solmun taulukosta, johon on edetty. 25. toistetaan askelta (b) kunnes päästään tyhjään alkioon tai kun nes uuden, alemmalla tasolla olevan solmun osoite on sangon osoite, tunnettu siitä, että trie-solmujen taulukot toteutetaan kiinteästi neljän alkion kokoisina : nelisolmuina ja ainakin osassa hakemistorakennetta korvataan keskenään 30 peräkkäisten nelisolmujen joukkoja kompressoiduilla solmuilla siten, että yksittäinen joukko, joka muodostuu keskenään peräkkäisistä nelisolmuista, joista jokaisesta on ainoastaan yksi osoite alemman tason nelisolmuun, korvataan kompressoidulla solmulla (CN), johon talletetaan osoite siihen nelisolmuun, johon korvattavassa joukossa alimpana oleva solmu osoittaa, tieto sen 35 hakusanan arvosta, jolla mainittu osoite löytyy sekä tieto niiden bittien koko 17 102425 naislukumäärästä, joista korvattavassa joukossa muodostetaan hakusanat.

2. Patenttivaatimuksen 1 mukainen menetelmä, tunnettu siitä, että korvausta suoritetaan koko hakemistorakenteessa siten, että kaikki mainitut joukot korvataan kompressoiduilla solmuilla.

3. Patenttivaatimuksen 1 mukainen menetelmä, tunnettu siitä, että korvaus suoritetaan myös joukolle, johon kuuluu vain yksi nelisolmu, jolloin talletettava bittien kokonaislukumäärä vastaa niiden bittien lukumäärää, joista mainitussa nelisolmussa muodostetaan hakusana.

4. Patenttivaatimuksen 1 mukainen menetelmä, tunnettu siitä, 10 että hakemistorakenteeseen muodostetaan useita peräkkäisiä kompressoituja solmuja siten, että ainakin ylimmällä tasolla olevaan kompressoituun solmuun kerätään käytettyä sanan pituutta vastaava lukumäärä tutkittavia hakuavain-bittejä.

5. Patenttivaatimuksen 1 mukainen menetelmä, tunnettu siitä, 15 että useita peräkkäisiä kompressoituja solmuja yhdistetään yhdeksi uudeksi kompressoiduksi solmuksi, jolloin uuteen solmuun talletetaan bittien lukumääräksi yhdistettävistä solmuista saatujen lukumäärien summa.

6. Patenttivaatimuksen 4 mukainen menetelmä, tunnettu siitä, että sellaisten peräkkäisten kompressoitujen solmujen muodostama ketju, 20 jossa ainakin kahdessa ylimmäisessä solmussa tutkittavien bittien lukumäärä vastaa käytettyä sanan pituutta korvataan yhdellä kokoavalla solmulla (CN4), joka sisältää: - osoitteen siihen solmuun, johon ketjussa alimpana ollut solmu sisälsi osoitteen, 25. ketjun solmuista saadun tutkittavien bittien lukumäärän summan, ja - peräkkäisjärjestyksessä ketjun solmujen sisältämät hakusana-arvot.

7. Patenttivaatimuksen 1 mukainen menetelmä, tunnettu siitä, että muistin kaikissa kompressoimattomissa nelisolmuissa ylläpidetään vähintään kaksi osoitetta alemman tason solmuun.

8. Menetelmä muistin toteuttamiseksi, johon muistiin tieto talletetaan tietoyksikköinä, joista jokaiselle varataan muistissa oma muistitilansa, jonka menetelmän mukaisesti - muisti toteutetaan hakemistorakenteena, joka muodostuu puumaisesta hierarkiasta, jossa on useilla eri tasoilla olevia solmuja, jolloin yksittäinen 35 solmu voi olla (i) sisäsolmu, joka käsittää taulukon, jonka yksittäinen alkio voi 18 102425 sisältää puumaisessa hierarkiassa alempana olevan solmun osoitteen ja jonka yksittäinen alkio voi myös olla tyhjä, tai (ii) lehti, joka sisältää ainakin yhden elementin, jonka tyyppi on yksi joukosta, joka käsittää osoittimen talletettuun tietoyksikköön ja osoittimen toisen hakemistorakenteen solmuun, 5. hakemistorakenteessa suoritetaan osoitelaskentaa siten, että - (a) valitaan puumaisessa hierarkiassa ylimmällä tasolla olevassa solmussa ennalta määrätty lukumäärä bittejä käytettyjen hakuavaimien muodostamasta bittijonosta, muodostetaan valituista biteistä hakusana, jonka perusteella haetaan kyseisessä solmussa seuraavan solmun osoite ja edetään 10 mainittuun solmuun, - (b) valitaan käytettyjen hakuavaimien muodostaman bittijonon vielä valitsematta olevien bittien joukosta ennalta määrätty lukumäärä bittejä ja muodostetaan valituista biteistä hakusana, jonka avulla haetaan jälleen uuden, alemmalla tasolla olevan solmun osoite sen solmun taulukosta, johon on edet- 15 ty, - toistetaan askelta (b) kunnes päästään tyhjään alkioon tai kunnes uuden, alemmalla tasolla olevan solmun osoite on lehden osoite, tunnettu siitä, että sisäsolmujen taulukot toteutetaan kiinteästi neljän alkion kokoisina 20 nelisolmuina ja ainakin osassa hakemistorakennetta korvataan keskenään peräkkäisten nelisolmujen joukkoja kompressoiduilla solmuilla siten, että yksittäinen joukko, joka muodostuu keskenään peräkkäisistä nelisolmuista, joista jokaisesta on ainoastaan yksi osoite alemman tason nelisolmuun, korvataan kompressoidulla solmulla (CN), johon talletetaan osoite siihen nelisol- 25 muun, johon korvattavassa joukossa alimpana oleva solmu osoittaa, tieto sen hakusanan arvosta, jolla mainittu osoite löytyy sekä tieto niiden bittien kokonaislukumäärästä, joista korvattavassa joukossa muodostetaan hakusanat.

9. Patenttivaatimuksen, 8 mukainen menetelmä, tunnettu siitä, *: että korvausta suoritetaan koko hakemistorakenteessa siten, että kaikki mai- 30 nitut joukot korvataan kompressoiduilla solmuilla.

10. Patenttivaatimuksen 8 mukainen menetelmä, tunnettu siitä, että korvaus suoritetaan myös joukolle, johon kuuluu vain yksi nelisolmu, jolloin talletettava bittien kokonaislukumäärä vastaa niiden bittien lukumäärää, joista mainitussa nelisolmussa muodostetaan hakusana.

11. Patenttivaatimuksen 8 mukainen menetelmä, tunnettu siitä, 19 102425 että hakemistorakenteeseen muodostetaan useita peräkkäisiä kompressoituja solmuja siten, että ainakin ylimmällä tasolla olevaan kompressoituun solmuun kerätään käytettyä sanan pituutta vastaava lukumäärä tutkittavia hakuavain-bittejä.

12. Patenttivaatimuksen 8 mukainen menetelmä, tunnettu siitä, että useita peräkkäisiä kompressoituja solmuja yhdistetään yhdeksi uudeksi kompressoiduksi solmuksi, jolloin uuteen solmuun talletetaan bittien lukumääräksi yhdistettävistä solmuista saatujen lukumäärien summa.

13. Patenttivaatimuksen 11 mukainen menetelmä, tunnettu siitä, 10 että sellaisten peräkkäisten kompressoitujen solmujen muodostama ketju, jossa ainakin kahdessa ylimmäisessä solmussa tutkittavien bittien lukumäärä vastaa käytettyä sanan pituutta korvataan yhdellä kokoavalla solmulla (CN4), joka sisältää: - osoitteen siihen solmuun, johon ketjussa alimpana ollut solmu sisälsi 15 osoitteen, - ketjun solmuista saadun tutkittavien bittien lukumäärän summan, ja - peräkkäisjärjestyksessä ketjun solmujen sisältämät hakusana-arvot.

14. Patenttivaatimuksen 8 mukainen menetelmä, tunnettu siitä, että muistin kaikissa kompressoimattomissa nelisolmuissa ylläpidetään vähin- 20 tään kaksi osoitetta alemman tason solmuun. 20 102425