EP3019957B1

EP3019957B1 - Verfahren zur optimierung der parallelen verarbeitung von daten auf einer hardwareplattform

Info

Publication number: EP3019957B1
Application number: EP14736856.7A
Authority: EP
Inventors: Rémi BARRERE; Paul BRELET; Michel BARRETEAU; Eric Lenormand
Original assignee: Thales SA
Current assignee: Thales SA
Priority date: 2013-07-10
Filing date: 2014-07-09
Publication date: 2020-03-18
Anticipated expiration: 2034-07-09
Also published as: FR3008505B1; FR3008505A1; WO2015004207A1; US20160147571A1; EP3019957A1; US10120717B2

Claims

Verfahren zum Optimieren der parallelen Verarbeitung von Daten auf einer Hardware-Plattform, wobei die Hardware-Plattform aufweist:
- mindestens eine Recheneinheit, welche eine Mehrzahl von Verarbeitungseinheiten aufweist, welche imstande sind, parallel eine Mehrzahl von ausführbaren Aufgaben in einem Verarbeitungsraum auszuführen, wobei der Verarbeitungsraum ein Raum ist, in welchem eine gleiche Abfolge von Vorgängen an der Gruppe der Daten durchgeführt wird, wobei der Verarbeitungsraum in Verarbeitungsuntergruppen zerlegbar ist, wobei jede Untergruppe diese gleiche Verarbeitung an einer Datenuntergruppe realisiert,
wobei das Verfahren dadurch gekennzeichnet ist, dass das Verfahren die Schritte aufweist des:
- Erlangens einer maximalen Zahl von parallel ausführbaren Aufgaben mittels einer Recheneinheit der Hardware-Plattform,

- Ermittelns von Größen der Datenuntergruppen des Verarbeitungsraums mittels einer gleichen Abfolge von Vorgängen, um ermittelte Größen zu erlangen,

- Optimieren der Größe von mindestens einer Datenuntergruppe des Verarbeitungsraums, wobei das Optimieren aufweist einen Schritt des:
- Auswählens, für mindestens eine in Betracht gezogene Untergruppe, mindestens einer ganzen Zahl, welche strikt größer ist als die ermittelte Größe, und mehrerer Zahlen, welche kleiner sind als die ermittelte Größe der in Betracht gezogenen Untergruppe, wobei die Zahl oder die Zahlen, welche kleiner sind als die vorbestimmte Größe der in Betracht gezogenen Untergruppe, vorzugsweise 2, 4 oder 8 sind,

- Erzeugens, für jede im Schritt des Auswählens in Betracht gezogene Untergruppe, einer Rechenuntergruppe, welche als Größe die ausgehend von der Untergruppe ausgewählte ganze Zahl hat und alle Daten der in Betracht gezogenen Untergruppe aufweist, wobei die Rechenuntergruppe die in Betracht gezogene Datenuntergruppe im Verarbeitungsraum ersetzt, um einen neuen Verarbeitungsraum zu erlangen,
wobei das Optimieren durchgeführt wird, um eine verbesserte Ausführungsleistungsmessung für den neuen Verarbeitungsraum im Vergleich zur Ausführungsleistungsmessung zu erlangen, welche für den Verarbeitungsraum erlangt wird, in welchem die in Betracht gezogene Datenuntergruppe die Größe hat, welche gemäß mindestens einem ausgewählten Kriterium ermittelt wird, wobei die Messung assoziiert ist mit dem Ausführen eines Programms, welches Programmcodeanweisungen aufweist, welche eine Verarbeitungsaufteilung durchführen, welche zur Aufteilung des in Betracht gezogenen Verarbeitungsraums in Datenuntergruppen korrespondiert, und mit dem Zuordnen mindestens einer ausführbaren Aufgabe, welche imstande ist, die besagte Abfolge von Vorgängen auszuführen, zu jeder Datenuntergruppe, wobei die Gesamtzahl an ausführbaren Aufgaben pro Datenuntergruppe kleiner oder gleich ist zur besagten maximalen Zahl an Aufgaben.
Verfahren gemäß Anspruch 1, wobei die Zahlen, die kleiner sind als die ermittelte Größe der in Betracht gezogenen Untergruppe, aus einer parametrierbaren Datei stammen.
Verfahren gemäß Anspruch 1 oder 2, wobei der Schritt des Optimierens aufweist, für jede Untergruppengröße, einen Schritt des:
- Ermittelns der Verarbeitungsaufteilung, welche es erlaubt, die Ausführungsleitungsmessung zu minimieren, welche mit dem Ausführen eines Programms assoziiert ist, welches Programmcodeanweisungen aufweist, welche die Verarbeitungsaufteilung durchführen.
Verfahren gemäß Anspruch 3, wobei der Schritt des Ermittelns der Verarbeitungsaufteilung ferner aufweist einen Schritt des:
- Ermittelns mindestens zweier Verarbeitungsaufteilungen,

- Erlangens eines Programms, welches Programmiercodeanweisungen aufweist, welche die besagte Verarbeitungsaufteilung durchführen,

- Erlangens des Wertes einer Ausführungsleistungsmessung, welche mit dem ausgewählten Kriterium und der Ausführung des besagten Programms auf der besagten Hardware-Plattform assoziiert ist,

- Auswählens der Verarbeitungsaufteilung, welche es erlaubt, einen optimalen Messwert zu erlangen, welcher das ausgewählte Kriterium einhält.
Verfahren gemäß Anspruch 3, wobei die ausgewählten Kriterien ein erstes Kriterium und ein vom ersten Kriterium verschiedenes zweites Kriterium aufweisen, wobei der Schritt des Ermittelns der Verarbeitungsaufteilung ferner aufweist einen Schritt des:
- Ermittelns mindestens zweier Verarbeitungsaufteilungen,

- Erlangens eines Programms, welches Programmiercodeanweisungen aufweist, welche die besagte Verarbeitungsaufteilung durchführen,

- Erlangens des Wertes von Ausführungsleistungsmessungen, welche jeweilig mit dem ersten Kriterium und dem zweiten Kriterium und mit der Ausführung des besagten Programms auf der besagten Hardware-Plattform assoziiert sind,

- ersten Auswählens der Verarbeitungsaufteilungen, welche es erlauben, eine Mehrzahl von optimalen Messwerten zu erlangen, welche das erste ausgewählte Kriterium erfüllen,

- zweiten Auswählens der Verarbeitungsaufteilung, welche es erlaubt, einen optimalen Messwert gemäß dem zweiten Kriterium, welches ausgewählt ist aus den Verarbeitungsaufteilungen, welche im Schritt des ersten Auswählens ausgewählt werden, zu erlangen.
Verfahren gemäß Anspruch 4 oder 5, wobei das Verfahren ferner aufweist einen Schritt des:
- Erlangens von Informationen, welche es erlauben, Programmiercodeanweisungen zu erzeugen, welche die besagte ausgewählte Verarbeitungsaufteilung durchführen.
Verfahren gemäß Anspruch 5, wobei der besagte Wert einer Ausführungsleistungsmessung, welcher mit dem ersten Kriterium assoziiert ist, eine Ausführungszeit auf der besagten Hardware-Plattform ist.
Computerprogrammprodukt, welches Programmiercodeanweisungen aufweist, welche, wenn sie mittels eines Prozessors durchgeführt werden, ein Verfahren zum Optimieren der parallelen Verarbeitung von Daten auf einer Hardware-Plattform gemäß irgendeinem der Ansprüche 1 bis 7 durchführen.