NO343250B1

NO343250B1 - Compilation for node device gpu-based parallel processing

Info

Publication number: NO343250B1
Application number: NO20171277A
Authority: NO
Inventors: Henry Gabriel Victor Bequet; Huina Chen
Original assignee: Sas Inst Inc
Priority date: 2016-08-25
Filing date: 2017-08-01
Publication date: 2018-12-27
Also published as: DK179709B1; DK201770596A1; NO20171277A1; BE1025002B1; FR3055438A1; CN107783782A; GB2553424B; GB2553424A; DE102017213160A1; DE102017213160B4; FR3055438B1; CA2974556C; CA2974556A1; CN107783782B; GB201712171D0; BE1025002A1; HK1245439B

Claims

1. Anordning som omfatter en prosessor og en lagring for a lagre instruksjoner som, nar de eksekveres av prosessoren, bevirker prosessoren til a utfore operasjoner som omfatter:

a analysere en aktuell status for ressurser hos minst en nodeanordning av en flerhet av nodeanordninger for a bestemme en tilgjengelighet av minst en grafikkprosessorenhet (GPU) hos den minst ene nodeanordningen som skal tildeles a utfore en forste oppgave av en analyserutine, hvori:

betjening av de flere nodeanordninger koordineres for a utfore oppgaver av analyserutiner i det minste delvis parallelt;

analyserutinen genereres for a eksekveres av minst en sentral prosesseringsenhet (CPU) hos den minst ene noden; og

ressursene hos den minst ene nodeanordningen er valgt fra en gruppe som bestar av den minst ene CPU-en, den minst ene GPU-en, oglagringsrom i minst en lagring hos den minst ene nodeanordningen;

som respons pa en bestemmelse av at den minst ene GPU-en er tilgjengeligfor a tildeles a utfore den forste oppgaven av analyserutinen:

a analysere en forste oppgaverutine av analyserutinen for a bestemme hvorvidt den forste oppgaverutinen kan kompileres til a generere en GPU-oppgaverutine for a eksekveres av den minst ene GPUen for a bevirke den minst ene GPU-en til a utfore flere forekomster av denforste oppgaven av analyserutinen i det minste delvis parallelt uten en avhengighet blant innmating og utmating av de flere forekomstene av den forste oppgaven, hvori:

den forste oppgaverutinen genereres for a eksekveres av den minst ene CPU-en for a utfore den forsteoppgaven av analyserutinen; og

bestemmelsen av hvorvidt den forste

oppgaverutinen kan kompileres for a generere GPUoppgaverutinen omfatter en bestemmelse av hvorvidt den forste oppgaverutinen inkluderer en instruksjon som forhindrer

omperngena generere-oppgaverunen, og enbestemmelse av hvorvidt innmating og utmating av den forste oppgaverutinen er definert til a ikke kreve avhengigheten; og som respons pa en bestemmelse av at den forste oppgaverutinen kan kompileres til a generere GPU-oppgaverutinen:

a tildele en datasettpartisjon av en flerhet av datasettpartisjoner av et datasett til den minst ene nodeanordningen for a muliggjore tilgang til datasettpartisjonen for den minst ene GPU-en;

a anvende en konverteringsregel for a konvertere minst en instruksjon til den forste oppgaverutinen til minst en korresponderende instruksjon til GPU-oppgaverutinen;

a kompilere den minst ene korresponderende instruksjonen til GPU-oppgaverutinen for a eksekveres av denminst ene GPU-en; og

a tildele en utforelse av den forste oppgaven av analyserutinen med datasettpartisjonen til den minst ene nodeanordningen for a muliggjore utforelse av de flere forekomstene av den forste oppgaven med datasettpartisjonen for den minst ene GPU-en.

2. Anordning ifolge krav 1, hvori for a bestemme hvorvidt den forste oppgaverutinen inkluderer en instruksjon som forhindrer kompileringen i a generere GPU-oppgaverutinen, prosessorenbevirkes til a:

a bestemme hvorvidt instruksjonen til den forste oppgaverutinen er inkludert i et sett av instruksjoner som ikke kan konverteres til minst en instruksjon som kan eksekveres av den minst ene GPU-en; og

som respons pa en bestemmelse om at instruksjonen til den forste oppgaverutinen ikke er inkludert i settet av instruksjoner, a bestemme hvorvidt instruksjonen til den forste oppgaverutinen anvendes i den forste oppgaverutinen pa en mate som forhindrer konvertering til minst en instruksjon som kan eksekveres av den minst ene GPU-en.

.nornngogerav,voror aonverereen mnsenensrusonenenorse oppgaverutinen til den minst ene korresponderende instruksjonen til GPU-oppgaverutinen,prosessoren bevirkes til a konvertere den minst ene instruksjonen til den forste oppgaverutinen fra et forste programmeringssprak til den minst ene korresponderende instruksjonen i et andre programmeringssprak i samsvar med konverteringsregelen.

4. Anordning ifolge krav 1, hvori:

den minst ene lagringen av den minst ene nodeanordningen omfatter en forste flyktig lagring som er kommunikativt forbundet med den minst ene CPU-en, ogen andre flyktig lagring som er kommunikativt forbundet med den minst ene GPU-en;

a tildele datasettpartisjonen til den minst ene nodeanordningen for a muliggjore tilgang til datasettpartisjonen for den minst ene GPU-en omfatter aforarsake at datasettpartisjonen lagres i den andre flyktige lagringen; og

som respons pa en bestemmelse av at den minst ene GPU-en ikke ertilgjengelig for a bli tilde It a utfore den forste oppgaven av analyserutinen, bevirkes prosessoren til a utfore operasjoner som omfatter:

a avsta fra a analysere den forste oppgaverutinen for a bestemme hvorvidt den forste oppgaverutinen kan kompileres til a generere GPU-oppgaverutinen;

a tildele datasettpartisjonen til den minst ene nodeanordningen for a forarsake lagring av datasettpartisjonen i den forste flyktige lagringen for a muliggjore tilgang til datasettpartisjonen for den minst ene CPU-en;

a kompilere den forste oppgaverutinen for eksekvering av den minst ene CPU-en; og

a tildele utforelsen av den forste oppgaven av analyserutinen med datasettpartisjonen til den minst ene nodeanordningen for a muliggjore utforelse av den forste oppgaven med datasettpartisjonen for den minst ene CPU-en.

.nornngogerav,vor:

anordningen omfatter en koordineringsanordning som koordinerer operasjonen av flerheten av nodeanordninger;

prosessoren bevirkes til a gjentakende motta oppdateringer av aktuell status fra hver nodeanordning av flerheten av nodeanordninger; og

for a analysere den aktuelle statusen for a bestemme tilgjengelighet av den minst ene GPU-en hos den minst ene nodeanordningen, prosessoren bevirkes til aidentifisere en nodeanordning av flerheten av nodeanordninger som inkorporerer en GPU indikert av den aktuelle statusen som tilgjengelig.

6. Anordning ifolge krav 5, hvori for a tildele datasettpartisjonen av datasettet til den minst ene nodeanordningen, prosessoren bevirkes til a utfore operasjoner som omfatter:

a analysere en metadata som indikerer strukturelle egenskaper i datasettet for a identifisere en restriksjon pa en mate som gjor at datasettet kan deles inn i flerheten av datasettpartisjoner, hvori restriksjonen er valgt fra en gruppe som bestar av en indikasjon pa en minste atomisk dataenhet i datasettet, og en spesifikasjon av et partisjoneringsoppsett; og

a derivere en oppdeling av datasettet inn i flerheten av datasettpartisjoner basert i det minste delvis pa restriksjonen.

7. Anordning ifolge krav 6, hvori prosessoren bevirkes til a utfore operasjoner som omfatter:

a hente metadataen fra minst en lagringsanordning der datasettet er lagret; og

a sende en indikasjon pa tildelingen av datasettpartisjonen til den minst ene nodeanordningen eller den minst ene lagringsanordningen for a forarsake en sending av datasettpartisjonen fra den minst ene lagringsanordningen til den minst ene nodeanordningen.

.nornngogerav,vor:

anordningen omfatter en nodeanordning av den minst ene nodeanordningen;

nodeanordningen omfatter en GPU av den minst ene GPU-en;

prosessoren omfatter en CPU av den minst ene CPU-en; og

for a analysere den aktuelle statusen for a bestemme tilgjengelighet av den minst ene GPU-en hos den minst ene nodeanordningen, CPU-en bevirkes til abestemme hvorvidt GPU-en hos nodeanordningen er indikert av den aktuelle statusensom tilgjengelig.

9. Anordning ifolge krav 1, hvori prosessoren bevirkes til a utfore operasjoner som omfatter:

a analysere en andre oppgaverutine av analyserutinen for a bestemme hvorvidt den andre oppgaverutinen kan bli kompilert til a generere en annen GPUoppgaverutine for a eksekveres av den minst ene GPU-en for a bevirke den minst eneGPU-en til a utfore flere forekomster av den andre oppgaven av analyserutinen i detminste delvis parallelt uten en avhengighet blant innmating og utmating av de flere forekomstene av den andre oppgaven, hvori den andre oppgaverutinen genereres for a eksekveres av den minst ene CPU-en for a utfore en andre oppgave av analyserutinen;og

som respons pa en bestemmelse av at den andre oppgaverutinen ikke kan kompileres til a generere den andre GPU-oppgaverutinen:

a kompilere den andre oppgaverutinen for eksekvering av den minst ene CPU-en; og

a tildele en utforelse av den andre oppgaven av analyserutinen med datasettpartisjonen til den minst ene nodeanordningen for a muliggjore utforelse av den andre oppgaven med datasettpartisjonen for den minst ene CPU-en.

10.Anordning ifolge krav 1, hvori konverteringsregelen er valgt fra en gruppe som bestar av:

en spesason av eseavnsrusoner somverornrer kompilering av den fiarstc oppgaverutinen i a generere GPU-oppgaverutinen dersomden er til stede i den forste oppgaverutinen;

en spesifikasjon av et sett av instruksjoner som hver ikke ville forhindre kompilering av den forste oppgaverutinen i a generere GPU-oppgaverutinen dersomden er til stede i den forste oppgaverutinen;

en spesifikasjon av en bruksmate av en instruksjon som forhindrer kompilering av den forste oppgaverutinen i a generere GPU-oppgaverutinen dersombruksmaten av instruksjonen forekommer i den forste oppgaverutinen, hvori tilstedevserelsen av instruksjonen i den forste oppgaverutinen ellers ikke forhindrer kompilering av den forste oppgaverutinen i a generere GPU-oppgaverutinen;

en spesifikasjon av en prosedyre for a konvertere instruksjoner i den forste oppgaverutinen som skal eksekveres i en lokke av den minst ene CPU-en tilkorresponderende instruksjoner hos GPU-oppgaverutinen som skal eksekveresparallel! av den minst ene GPU-en i en korresponderende lokke med ferre iterasjonerenn lokken;

en spesifikasjon av en prosedyre for a konvertere instruksjoner i den forste oppgaverutinen som skal eksekveres i en lokke av den minst ene CPU-en tilkorresponderende instruksjoner hos GPU-oppgaverutinen som skal eksekveresparallelt av den minst ene GPU-en og ikke i en lokke; og

en spesifikasjon av en prosedyre for a konvertere instruksjoner i den forste oppgaverutinen som definerer en datastruktur som omfatter oppforinger som skal tilgas sekvensielt under eksekvering av den forste oppgaverutinen av den minst ene CPU-en, til korresponderende instruksjoner hos GPU-oppgaverutinen som definereren korresponderende datastruktur som omfatter oppforinger som skal tilgas parallelt under eksekvering av GPU-oppgaverutinen av den minst ene GPU-en.

11. Datamaskinprogramprodukt som er fast innlemmet i et ikke-transitorisk, maskinlesbartlagringsmedium, der datamaskinprogramproduktet inkluderer instruksjoner betjenelige for a forarsake en prosessor til a utfore operasjoner som omfatter:

a analysere en aktuell status for ressurser hos minst en nodeanordning av en flerhet av nodeanordninger for a bestemme en tilgjengelighet av minst en

graprosessoreneosen mnsene noeanornngen som saees a utfore en forste oppgave av en analyserutine, hvori:

operas)on av flerheten av nodeanordninger koordineres for a utfore oppgaver av analyserutinen i det minste delvis parallelt;

analyserutinen genereres for a eksekveres av minst en hovedprosessor (CPU) hos den minst ene noden; og

bestemmelsen av hvorvidt den forste oppgaverutinen kan kompileres for a generere GPUoppgaverutinen omfatter en bestemmelse av hvorvidt den forste oppgaverutinen omfatter en instruksjon som forhindrer kompileringen i a generere GPU-oppgaverutinen, og enbestemmelse av hvorvidt innmating og utmating av den forste oppgaverutinen defineres til a ikke kreve avhengigheten; og som respons pa en bestemmelse av at den forste

oppgaverutinen kan kompileres til a generere GPU-oppgaverutinen:

a tildele en datasettpartisjon av en flerhet av datasettpartisjoner av et datasett til den minst ene

noeanornngenor a muggoregangaaseparsonen for den minst ene GPU-en;

a kompilere den minst ene korresponderende instruksjonen til GPU-oppgaverutinen for eksekvering av denminst ene GPU-en; og

a tildele en utforelse av den forste oppgaven av analyserutinen med datasettpartisjonen til den minst ene nodeanordningen for a muliggjore utforelse av de Here forekomstene av den forste oppgaven med datasettpartisjonen for den minst ene GPU-en.

12. Datamaskinprogramprodukt ifolge krav 11, hvori for a bestemme hvorvidt den forste oppgaverutinen omfatter en instruksjon som forhindrer kompileringen i a generere GPUoppgaverutinen, prosessoren bevirkes til a:

som respons pa en bestemmelse om at instruksjonen til den forste oppgaverutinen ikke inkluderes i settet av instruksjoner, a bestemme hvorvidt instruksjonen til den forste oppgaverutinen brukes i den forste oppgaverutinen pa en mate som hindrer konvertering til minst en instruksjon som kan eksekveres av den minst ene GPU-en.

13. Datamaskinprogramprodukt ifolge krav 11, hvori for a konvertere den minst ene instruksjonen til den forste oppgaverutinen til den minst ene korresponderende instruksjonen til GPU-oppgaverutinen, prosessoren bevirkes til a konvertere den minst ene instruksjonen til denforste oppgaverutinen fra et forste programmeringssprak til den minst ene korresponderende instruksjonen i et andre programmeringssprak i samsvar med konverteringsregelen.

14. Datamaskinprogramprodukt ifolge krav 11, hvori:

som respons pa en bestemmelse av at den minst ene GPU-en ikke ertilgjengelig for a tildeles a utfore den forste oppgaven av analyserutinen, bevirkes prosessoren til a utfore operasjoner som omfatter:

a tildele datasettpartisjonen til den minst ene nodeanordningen for a forarsake lagring av datasettpartisjonen i den forste flyktige lagringen til a muliggjore tilgang til datasettpartisjonen for den minst ene CPU-en;

15. Datamaskinprogramprodukt ifolge krav 11, hvori:

prosessoren er en komponent av en koordineringsanordning som koordinerer operasjonen av flerheten av nodeanordninger;

prosessoren bevirkes til a gjentakende motta oppdateringer av den aktuelle statusen fra hver nodeanordning av flerheten av nodeanordninger; og

or a anaysereen auee sausenor aesemmegengegeaven minst ene GPU-en hos den minst ene nodeanordningen, prosessoren bevirkes til aidentifisere en nodeanordning av flerheten av nodeanordninger som inkorporerer en GPU indikert i den aktuelle statusen som tilgjengelig.

16. Datamaskinprogramprodukt ifolge krav 15, hvori for a tildele datasettpartisjonen av datasettet til den minst ene nodeanordningen, prosessoren bevirkes til a utfore operasjoner som omfatter:

a derivere en oppdeling av datasettet i flerheten av datasettpartisjoner basert i det minste delvis pa restriksjonen.

17. Datamaskinprogramprodukt ifolge krav 16, hvori prosessoren bevirkes til a utfore operasjoner som omfatter:

a hente metadataen fra minst en lagringsanordning der datasettet er lagret; og

18. Datamaskinprogramprodukt ifolge krav 11, hvori:

prosessoren omfatter en CPU av den minst ene CPU-en;

CPU-en er en komponent av en nodeanordning av den minst enenodeanordningen;

nodeanordningen omfatter en GPU av den minst ene GPU-en; og

or a anaysereen auee sausenor aesemmegengegeaven minst ene GPU-en hos den minst ene nodeanordningen, CPU-en bevirkes til abestemme hvorvidt GPU-en hos nodeanordningen er indikert av den aktuelle statusensom tilgjengelig.

19. Datamaskinprogramprodukt ifolge krav 11, hvori prosessoren bevirkes til a utfore operasjoner som omfatter:

a analysere en andre oppgaverutine av analyserutinen for a bestemme hvorvidt den andre oppgaverutinen kan kompileres til a generere en annen GPUoppgaverutine for a eksekveres av den minst ene GPU-en for a bevirke den minst eneGPU-en til a utfore flere forekomster av den andre oppgaven av analyserutinen i detminste delvis parallelt uten en avhengighet blant innmating og utmating av de flere forekomstene av den andre oppgaven, hvori den andre oppgaverutinen genereres for eksekvering av den minst ene CPU-en for a utfore en andre oppgave avanalyserutinen; og

20. Datamaskinprogramprodukt ifolge krav 11, hvori den minst ene GPU-en stotter eksekveringav den minst ene korresponderende instruksjonen til GPU-oppgaverutinen parallelt pa tvers avminst ett tusen eksekveringstrader.

21. Datamaskinimplementert framgangsmate som omfatter:

graprosessoreneosen mnsene noeanornngen som saees a utfore en forste oppgave av en analyserutine, der:

operas)on av flerheten av nodeanordninger koordineres for a utfore oppgaver av analyserutiner i det minste delvis parallelt;

a analysere en forste oppgaverutine av analyserutinen for a bestemme hvorvidt den forste oppgaverutinen kan kompileres til a generere en GPU-oppgaverutine for a eksekveres av den minst ene GPUen for a forarsake den minst ene GPU-en til a utfore flere forekomster avden forste oppgaven av analyserutinen i det minste delvis parallelt uten en avhengighet blant innmating og utmating av de flere forekomstene av den forste oppgaven, hvori:

bestemmelsen av om hvorvidt den forste oppgaverutinen kan kompileres for a generere GPUoppgaverutinen omfatter en bestemmelse av hvorvidt den forste oppgaverutinen inkluderer en instruksjon som forhindrer kompileringen i a generere GPU-oppgaverutinen, og enbestemmelse av om hvorvidt innmating og utmating av den forste oppgaverutinen defineres til a ikke kreve avhengigheten; og

som respons pa en bestemmelse av at den forste oppgaverutinen kan kompileres til a generere GPU-oppgaverutinen:

aee enaaseparson av enereav datasettpartisjoner av et datasett til den minst ene nodeanordningen for a muliggjore tilgang til datasettpartisjonen for den minst ene GPU-en;

22. Datamaskinimplementert framgangsmate ifolge krav 21, hvori a bestemme hvorvidt den forste oppgaverutinen omfatter en instruksjon som forhindrer kompileringen i a generere GPUoppgaverutinen, omfatter:

som respons pa en bestemmelse om at instruksjonen til den forste oppgaverutinen ikke inkluderes i settet av instruksjoner, a bestemme hvorvidt instruksjonen til den forste oppgaverutinen blir brukt i den forste oppgaverutinen pa en mate som forhindrer konvertering til minst en instruksjon som kan eksekveres av den minst ene GPU-en.

23. Datamaskinimplementert framgangsmate ifolge krav 21, hvori a konvertere den minst ene instruksjonen til den forste oppgaverutinen til den minst ene korresponderende instruksjonen til GPU-oppgaverutinen, omfatter a konvertere den minst ene instruksjonen til den forste

oppgaverunenra eorse programmerngsspraen mnseneorresponerene instruksjonen i et andre programmeringssprak i samsvar med konverteringsregelen.

24. Datamaskinimplementert framgangsmate ifolge krav 21, hvori:

som respons pa en bestemmelse av at den minst ene GPU-en ikke ertilgjengelig for a tildeles a utfore den forste oppgaven av analyserutinen, omfatter framgangsmaten:

a tildele datasettpartisjonen til den minst ene nodeanordningen for a bevirke lagring av datasettpartisjonen i den forste flyktige lagringen for a muliggjore tilgang til datasettpartisjonen for den minst ene CPU-en;

25. Datamaskinimplementert framgangsmate ifolge krav 21, hvori:

en koordineringsanordning koordinerer operasjonen av flerheten av nodeanordninger;

oornerngsanornngen genaene moar oppaernger aven aktuelle statusen fra hver nodeanordning av flerheten av nodeanordninger; og

a analysere den aktuelle statusen for a bestemme tilgjengelighet av den minst ene GPU-en hos den minst ene nodeanordningen, omfatter a identifisere, hoskoordineringsanordningen, en nodeanordning av flerheten av nodeanordninger som inkorporerer en GPU indikert i den aktuelle statusen som tilgjengelig.

26. Datamaskinimplementert framgangsmate ifolge krav 25, hvori a tildele datasettpartisjonen av datasettet til den minst ene nodeanordningen omfatter:

a analysere, hos koordineringsanordningen, en metadata som indikerer strukturelle egenskaper i datasettet for a identifisere en restriksjon pa en mate som gjor at datasettet kan deles inn i flerheten av datasettpartisjoner, hvori restriksjonen er valgt fra en gruppe som bestar av en indikasjon pa en minste atomisk dataenhet i datasettet, og en spesifikasjon av et partisjoneringsoppsett; og

27. Datamaskinimplementert framgangsmate ifolge krav 26, som omfatter:

a hente metadataen fra minst en lagringsanordning der datasettet er lagret; og

28. Datamaskinimplementert framgangsmate ifolge krav 21, hvori:

a analysere den aktuelle statusen for a bestemme tilgjengelighet av den minst ene GPU-en hos den minst ene nodeanordningen, omfatter a analysere, av enCPU hos en nodeanordning, en aktuell status hos nodeanordningen til hvorvidt en GPU hos nodeanordningen er tilgjengelig i oyeblikket, hvori:

en mnsene-en omaer-en;

den minst ene nodeanordningen omfatter nodeanordningen; og

den minst ene GPU-en omfatter GPU-en.

29. Datamaskinimplementert framgangsmate ifolge krav 21, som omfatter:

a analysere en andre oppgaverutine av analyserutinen for a bestemme om den andre oppgaverutinen kan kompileres til a generere en annen GPU-oppgaverutinefor a eksekveres av den minst ene GPU-en for a bevirke den minst ene GPU-en til autfore flere forekomster av den andre oppgaven av analyserutinen i det minste delvis parallelt uten en avhengighet blant innmating og utmating av de flere forekomstene av den andre oppgaven, hvori den andre oppgaverutinen genereres for eksekvering av den minst ene CPU-en for a utfore en andre oppgave av analyserutinen; og

a tildele en utforelse av den andre oppgaven av analyserutinen med datasettpartisjonen til den minst ene nodeanordningen for a muliggjore utforelse av den andre oppgaven med datasettpartisjonene for den minst ene CPU-en.

30. Datamaskinimplementert framgangsmate ifolge krav 29, som omfatter a analysere analyserutinen for a bestemme en rekkefolge av oppgaver i analyserutinen, hvori rekkefolgen av oppgavene omfatter en relativ rekkefolge av den forste og andre oppgaven.