FI3889768T3

FI3889768T3 - Järjestelmät ja menetelmät käskyjen suorittamiseksi muuntaa 16-bittiseen liukulukumuotoon

Info

Publication number: FI3889768T3
Application number: FIEP21169540.8T
Authority: FI
Inventors: Alexander F Heinecke; Robert Valentine; Mark J Charney; Raanan Sade; Menachem Adelman; Zeev Sperber; Amit Gradstein; Simon Rubanovich
Original assignee: Intel Corp
Priority date: 2018-11-09
Filing date: 2019-10-08
Publication date: 2024-03-26
Also published as: EP3651019A2; EP3651019A3; DK3889768T3; CN112527396B; EP3798827A1; EP3889768A1; PL3889768T3; US20210124581A1; US20190079762A1; CN112527396A; US11372643B2; US11068263B2; EP3889768B1; EP3822774A1; CN113076139A; US11068262B2; US20210124580A1; CN111176730A; US20220326948A1

Claims

PATENTTIVAATIMUKSET

1. Prosessori (260), joka käsittää: dekoodausyksikön (109) dekoodaamaan muotomuun- noskäsky (261), joka toteuttaa muotomuunnoksen 32-bit- tisestä yksinkertaisen tarkkuuden liukuluvusta 16-bit- tiseksi liukuluvuksi, muotomuunnoskäsky (261) ilmaisee ensimmäisen lähdeoperandin sijainnin (266), toisen läh- deoperandin (268) sijainnin, kohderekisterin (264), kirjoituspeiterekisterin (270) ja peitetyypin (271), ensimmäinen lähdeoperandi (266) sisältää ensimmäisen joukon 32-bittisiä yksinkertaisen tarkkuuden liukuluku- tietoelementtejä, toinen lähdeoperandi (268) sisältää toisen joukon 32-bittisiä yksinkertaisen tarkkuuden liukulukutietoelementtejä, kirjoituspeiterekisteri (270) tallentaa useita peitebittejä, joista kukin vastaa tietoelementtisijaintia kohderekisterissä (264), peite- tyyppi (271) on joko nollaava peite tai yhdistävä peite; ja suoritusyksikön (117, 274), joka on kytketty dekoodausyksikköön (109), joka suoritusyksikkö (115, 274) suorittaa dekoodatun muodon muunnoskäskyn (261): kullekin ensimmäiselle joukolle 32-bitti- siä yksinkertaisen tarkkuuden liukulukutietoelement- tejä, jotka ovat ensimmäistä tyyppiä, muuntamaan 32- bittinen yksinkertaisen tarkkuuden liukulukutietoele- mentti 16-bittiseksi liukulukutietoelementiksi (276A- 276D) käyttämällä pyöristystä lähimpään parilliseen pyöristystoimintaan ja tallentamaan tulostietoelementti vastaavaan tietoelementtipaikkaan tuloksen ensimmäiseen puoliskoon kohderekisterissä (264), jos peitebitti, joka vastaa tietoelementtipaikkaa useissa peitebi- teissä, on asetettu, ja muuten tallentamaan peitetty tietoelementti mainittuun tietoelementtipaikkaan, ja kullekin toiselle joukolle 32-bittisiä yk- sinkertaisen tarkkuuden liukulukutietoelementtejä, jotka ovat ensimmäistä tyyppiä, muuntamaan 32-bittinen yksinkertaisen tarkkuuden liukulukutietoelementti 16- bittiseksi liukulukutietoelementiksi (276E-276H) käyt- tämällä pyöristystä lähimpään parilliseen pyöristystoi- mintaan ja tallentamaan tulostietoelementti vastaavaan tietoelementtipaikkaan tuloksen toiseen puolikkaaseen kohderekisterissä (264), jos peitebitti, joka vastaa tietoelementtipaikkaa mainituissa useissa peitebi- teissä, on asetettu, ja muuten tallentamaan peitetty tietoelementti mainittuun tietoelementtipaikkaan, koh- derekisteriin (264) tallennetuilla tulostietoelemen- teillä on muoto, joka sisältää yhden etumerkkibitin, kahdeksan eksponenttibittiä ja seitsemän eksplisiit- tistä mantissabittiä, peitetty tietoelementti on nolla- arvo, jos peitetyyppi (271) on nollaava peite, ja säi- lytettävä arvo, jos peitetyyppi (271) on yhdistävä peite, missä ensimmäinen tyyppi on normaali luku, missä mitä tahansa epänormaalia tai nollatie- toelementtiä ensimmäisessä joukossa 32-bittisiä yksin- kertaisen tarkkuuden liukulukutietoelementtejä ja toi- sessa joukossa 32-bittisiä yksinkertaisen tarkkuuden liukulukutietoelementtejä käsitellään nolla-arvoina, samalla kun säilytetään 32-bittisten yksinkertaisen tarkkuuden liukulukutietoelementtien etumerkkibitin arvo.

2. Patenttivaatimuksen 1 mukainen prosessori (260), missä muoto on BF16-muoto.

3. Patenttivaatimuksen 1 tai 2 mukainen pro- sessori (260), missä tuloksen ensimmäinen puolikas on alemman kertaluvun puoli tuloksesta ja tuloksen toinen puolisko on ylemmän kertaluvun puoli tuloksesta.

4. Jonkin patenttivaatimuksen 1 - 3 mukainen prosessori (260), missä ensimmäisen Jlähdeoperandin (266) sijainti on rekisteri- tai muistipaikka.

5. Jonkin patenttivaatimuksen 1 - 4 mukainen prosessori (260), missä ensimmäinen lähdeoperandi (266) ja toinen lähdeoperandi (268) koostuvat samasta määrästä bittejä, missä sama määrä bittejä on 128, 256 tai 512 bittiä.

6. Jonkin patenttivaatimuksen 1 - 5 mukainen prosessori (260), missä pyöristystä lähimpään tasapyö- ristystoimintaan käytetään riippumatta ohjausrekisterin määrittämästä pyöristystoiminnasta.

7. Jonkin patenttivaatimuksen 1 - 6 mukainen prosessori (260), missä muoto sisältää yhden implisiit- tisen mantissabitin.

8. Jonkin patenttivaatimuksen 1 - 7 mukainen prosessori (260), missä ensimmäinen tyyppi sulkee pois nollan.

9. Jonkin patenttivaatimuksen 1 - 8 mukainen prosessori (260), missä ensimmäinen tyyppi sulkee pois epänormaalin.

10. Jonkin patenttivaatimuksen 1 - 9 mukainen prosessori (260), missä ensimmäinen tyyppi sulkee pois äärettömän.

11. Jonkin patenttivaatimuksen 1-10 mukainen prosessori (260), missä ensimmäinen tyyppi ei sisällä NaN:a.

12. Prosessorin suorittama menetelmä (450), joka käsittää: dekoodataan muotomuunnoskäsky (473), joka to- teuttaa muotomuunnoksen 32-bittisestä yksinkertaisen tarkkuuden liukuluvusta 16-bittiseksi liukuluvuksi, muotomuunnoskäsky ilmaisee ensimmäisen lähdeoperandin sijainnin, toisen lähdeoperandin sijainnin, kohderekis- terin, kirjoituspeiterekisterin ja peitetyypin, ensim- mäinen lähdeoperandi sisältää ensimmäisen joukon 32- bittisiä yksinkertaisen tarkkuuden liukulukutietoele- menttejä, toinen lähdeoperandi sisältää toisen joukon 32-bittisiä yksinkertaisen tarkkuuden liukulukutie- toelementtejä, kirjoituspeiterekisteri tallentaa useita peitebittejä, joista kukin vastaa tietoelementtisijain- tia kohderekisterissä, peitetyyppi on joko nollaava peite tai yhdistävä peite; ja suoritetaan dekoodattu muotomuunnoskäsky (477) : kullekin ensimmäiselle joukolle 32-bitti- siä yksinkertaisen tarkkuuden liukulukutietoelement- tejä, jotka ovat ensimmäistä tyyppiä, muuntamaan 32- bittinen yksinkertaisen tarkkuuden liukulukutietoele- mentti 16-bittiseksi liukulukutietoelementiksi (276A- 276D) käyttämällä pyöristystä lähimpään parilliseen pyöristystoimintaan ja tallentamaan tulostietoelementti vastaavaan tietoelementtipaikkaan tuloksen ensimmäiseen puoliskoon kohderekisterissä (264), jos peitebitti, joka vastaa tietoelementtipaikkaa useissa peitebi- teissä, on asetettu, ja muuten tallentamaan peitetty tietoelementti mainittuun tietoelementtipaikkaan, ja kullekin toiselle joukolle 32-bittisiä yk- sinkertaisen tarkkuuden liukulukutietoelementtejä, jotka ovat ensimmäistä tyyppiä, muuntamaan 32-bittinen yksinkertaisen tarkkuuden liukulukutietoelementti 16- bittiseksi liukulukutietoelementiksi (276E-276H) käyt- tämällä pyöristystä lähimpään parilliseen pyöristystoi- mintaan ja tallentamaan tulostietoelementti vastaavaan tietoelementtipaikkaan tuloksen toiseen puolikkaaseen kohderekisterissä (264), jos peitebitti, joka vastaa tietoelementtipaikkaa mainituissa useissa peitebi- teissä, on asetettu, ja muuten tallentamaan peitetty tietoelementti mainittuun tietoelementtipaikkaan, koh-

derekisteriin (264) tallennetuilla tulostietoelemen- teillä on muoto, joka sisältää yhden etumerkkibitin, kahdeksan eksponenttibittiä ja seitsemän eksplisiit- tistä mantissabittiä, peitetty tietoelementti on nolla- 5 arvo, jos peitetyyppi (271) on nollaava peite, ja säi- lytettävä arvo, jos peitetyyppi (271) on yhdistävä peite, missä ensimmäinen tyyppi on normaali luku, missä mitä tahansa epänormaalia tai nollatie- toelementtiä ensimmäisessä joukossa 32-bittisiä yksin- kertaisen tarkkuuden liukulukutietoelementtejä ja toi- sessa joukossa 32-bittisiä yksinkertaisen tarkkuuden liukulukutietoelementtejä käsitellään nolla-arvoina, samalla kun säilytetään 32-bittisten yksinkertaisen tarkkuuden liukulukutietoelementtien etumerkkibitin arvo.

13. Koneella luettava väline, joka tallentaa koodia, joka suoritettuna aiheuttaa patenttivaatimuksen 1 mukaisen prosessorin suorittaa patenttivaatimuksen 12 mukainen menetelmä (450).