-
QUERVERWEIS AUF VERWANDTE PATENTANMELDUNGEN
-
TECHNISCHES GEBIET
-
Diese Erfindung betrifft im Allgemeinen Neuronalnetz-Kraftfeld(Neural Network Force Field, NNFF)-Berechnungsalgorithmen zur direkten Vorhersage von atomaren Kräften in Molekulardynamik-Computersimulationen in Materialsystemen, wie etwa elektrochemische und Wasserfiltrations-Vorrichtungen.
-
HINTERGRUND
-
Die Molekulardynamik ist eine rechnergestützte materialwissenschaftliche Methodik zur Simulation der Bewegung von Atomen in einem Materialsystem bei realen Betriebsdruck- und Temperaturbedingungen. Es gibt Methodiken zur Berechnung der zugrunde liegenden atomaren Kräfte, die bei der Simulation der Bewegung von Atomen verwendet werden. Eine Methodik ist der Ab-initio-Quantenmechanik-Ansatz. Dieser Ansatz ist sehr genau, aber auch sehr teuer, da eine enorme Menge an Rechenressourcen notwendig ist, um den Ansatz anzuwenden. Es gibt zwar noch andere Ansätze, die weniger Rechenressourcen verbrauchen, aber diese anderen Ansätze liefern keine so große Genauigkeit.
-
KURZFASSUNG
-
In einer ersten Ausführungsform wird ein Berechnungsverfahren zum Simulieren der Bewegung von Elementen innerhalb eines Mehrelementesystems unter Verwendung eines Neuronalnetzwerk-Kraftfeldes (NNFF) offenbart. Das Verfahren umfasst das Empfangen einer Kombination aus einer Anzahl von rotationsinvarianten Merkmalen und einer Anzahl von rotationskovarianten Merkmalen einer lokalen Umgebung des Mehrelementesystems. Das Verfahren umfasst ferner das Vorhersagen eines Kraftvektors für jedes Element innerhalb des Mehrelementesystems basierend auf der Kombination aus der Anzahl von rotationsinvarianten Merkmalen, der Anzahl von rotationskovarianten Merkmalen und des NNFF, um eine simulierte Bewegung der Elemente innerhalb des Mehrelementesystems zu erhalten.
-
In einer zweiten Ausführungsform wird ein nichtvergängliches, computerlesbares Medium, das computerlesbare Anweisungen für ein Softwareprogramm greifbar verkörpert, offenbart. Das Softwareprogramm ist von einem Prozessor einer Rechenvorrichtung ausführbar, um Operationen bereitzustellen. Die Operationen umfassen das Empfangen einer Kombination aus einer Anzahl von rotationsinvarianten Merkmalen und einer Anzahl von rotationskovarianten Merkmalen einer lokalen Umgebung des Mehrelementesystems. Die Operationen umfassen ferner das Vorhersagen eines Kraftvektors für jedes Element innerhalb des Mehrelementesystems basierend auf der Kombination aus der Anzahl von rotationsinvarianten Merkmalen und der Anzahl von rotationskovarianten Merkmalen und eines NNFF, um eine simulierte Bewegung der Elemente innerhalb des Mehrelementesystems zu erhalten.
-
In einer dritten Ausführungsform wird ein Computersystem zum Simulieren der Bewegung von Elementen innerhalb eines Mehrelementesystems unter Verwendung eines NNFF offenbart. Das Computersystem umfasst einen Simulationscomputer mit einem Prozessor zur Ausführung computerlesbarer Anweisungen und einem Speicher zum Beibehalten der computerausführbaren Anweisungen. Die computerausführbaren Anweisungen führen, wenn sie durch den Prozessor ausgeführt werden, die folgenden Funktionen durch: Empfangen einer Kombination aus einer Anzahl von rotationsinvarianten Merkmalen und einer Anzahl von rotationskovarianten Merkmalen einer lokalen Umgebung des Mehrelementesystems; und Vorhersagen eines Kraftvektors für jedes Element innerhalb des Mehrelementesystems basierend auf der Kombination aus der Anzahl von rotationsinvarianten Merkmalen und der Anzahl von rotationskovarianten Merkmalen und des NNFF, um eine simulierte Bewegung der Elemente innerhalb des Mehrelementesystems zu erhalten.
-
Figurenliste
-
- 1 stellt ein schematisches Schaubild dar, das den Kompromiss zwischen Umfang und Genauigkeit für verschiedene Molekulardynamik(MD)-Kraftberechnungsverfahren aus dem Stand der Technik darstellt.
- 2 ist ein schematisches Diagramm eines Neuronalnetz-Knotens eines Neuronalnetz-Kraftfeld(NNFF)-Energievorhersage-Schemas nach dem Behler-Parrinello-Ansatz aus dem Stand der Technik.
- 3 zeigt ein Neuronalnetzknoten-Prinzip eines NNFF-Algorithmus gemäß einer Ausführungsform.
- 4 ist ein Schaubild der vorhergesagten Kraft unter Verwendung eines NNFF-Algorithmus einer Ausführungsform im Vergleich mit einer auf Grundlage der Quantenmechanik berechneten Kraft für Massen-Polyethylenoxid (PEO).
- 5A zeigt ein Diagramm eines Fingerabdruck-Neuronalnetzes (NN) eines NNFF-Algorithmus einer Ausführungsform.
- 5B, 5C und 5D stellen jeweils Schaubilder dar, die Ergebnisse für die Vorhersage von H-, C- bzw. O-Atomen von Massen-PEO unter Verwendung des Fingerabdruck-NN des NNFF-Algorithmus einer Ausführungsform zeigen.
- 6A zeigt ein Diagramm eines Fingerabdruck-NN und eines Inversionsprojektion-NN, die kombiniert sind, um ein kombiniertes NN in einem NNFF-Algorithmus einer Ausführungsform zu erzeugen.
- 6B, 6C und 6D stellen jeweils Schaubilder dar, die Ergebnisse für die Vorhersagen von H-, C- bzw. O-Atomen von Massen-PEO unter Verwendung des kombinierten NNFF-Algorithmus einer Ausführungsform zeigen.
- 7 ist ein schematisches Diagramm einer Rechenplattform, die verwendet werden kann, um die NNFF-Algorithmen in einer oder mehreren Ausführungsformen zu implementieren, wie etwa dem NNFF-Algorithmus aus 6a.
-
DETAILLIERTE BESCHREIBUNG
-
Wie erforderlich, werden hierin detaillierte Ausführungsformen der vorliegenden Erfindung offenbart; es versteht sich jedoch, dass die offenbarten Ausführungsformen nur beispielhaft für die Erfindung sind, die in verschiedenen und alternativen Formen verkörpert werden kann. Die Figuren sind nicht unbedingt maßstabsgetreu; einige Merkmale können übertrieben oder minimiert sein, um Details bestimmter Komponenten zu zeigen. Deshalb sind spezifische strukturelle und funktionale Details, die hierin offenbart werden, nicht als einschränkend zu interpretieren, sondern lediglich als repräsentative Grundlage dafür, einem Fachmann zu lehren, die vorliegende Erfindung auf unterschiedliche Art und Weise zu nutzen.
-
Der Begriff „im Wesentlichen“ kann hierin verwendet werden, um offenbarte oder beanspruchte Ausführungsformen zu beschreiben. Der Begriff „im Wesentlichen“ kann einen Wert oder eine relative Eigenschaft, die in der vorliegenden Offenbarung offenbart oder behauptet wird, modifizieren. In solchen Fällen kann „im Wesentlichen“ bedeuten, dass der Wert oder die relative Eigenschaft, die er modifiziert, innerhalb von ± 0%, 0,1%, 0,5%, 1%, 2%, 3%, 4%, 5% oder 10% des Wertes oder der relativen Eigenschaft liegt.
-
Methodiken der Molekulardynamik (MD) sind zur Untersuchung physikalischer Phänomene von Vorteil, wie etwa u.a. Ionentransport, chemische Reaktionen und Degradation von Massen-Material und an der Oberfläche in Materialsystemen, wie etwa Vorrichtungen oder funktionalen Materialien. Nicht einschränkende Beispiele für solche Materialsysteme umfassen Brennstoffzellen, Oberflächenbeschichtungen, Batterien, Wasserentsalzung und Wasserfiltration. Es gibt Methodiken zur Berechnung der zugrunde liegenden atomaren Kräfte, die bei der Simulation der Bewegung von Atomen verwendet werden. Der Ab-initio-Quantenmechanik-Ansatz ist sehr genau, aber auch sehr teuer, da eine enorme Menge an Rechenressourcen notwendig ist, um den Ansatz anzuwenden.
-
Neuronale Netze wurden benutzt, um Quantenmechanik-Energien anzupassen und vorherzusagen. Diese Methodiken wurden als Neuronalnetz-Kraftfelder (NNFF) bezeichnet. Ableitungen von Energie in Bezug auf atomare Positionen und Kräfte werden unter Verwendung von quantenmechanischen Energien vorhergesagt. Diese Methodiken sind jedoch auch rechenintensiv. In Anbetracht des Vorstehenden ist das, was gebraucht wird, eine rechnergestützte Methodik zur Berechnung atomarer Kräfte, die ein adäquates Maß an Genauigkeit bei gleichzeitigem Verbrauch einer angemessenen Menge an Rechenressourcen liefert.
-
Die Molekulardynamik verwendet Atompositionen (und möglicherweise Ladungen, Bindungen oder andere strukturelle Informationen), um die interatomaren Kräfte jedes Atoms zu berechnen, die folglich verwendet werden, um die Geschwindigkeiten der Atome in der Simulation zu modifizieren. Die resultierenden Trajektorien der Atome werden benutzt, um physikalische Phänomene zu beschreiben, wie etwa u.a. Ionentransport in Batterien und Brennstoffzellen, chemische Reaktionen während der Degradation von Massen-Material und an der Oberfläche und den Phasenwechsel von Festkörpern. Es besteht ein Kompromiss zwischen der Genauigkeit und der Größe (gemessen an der Anzahl von Atomen und der simulierten Dynamikzeit) der Simulation in Abhängigkeit von dem zugrunde liegenden Verfahren, das zur Berechnung der atomaren Kräfte verwendet wird. Wie oben bereits dargelegt, verwendet ein genaues, aber teures Verfahren den Ab-initio-Quantenmechanik-Ansatz, bekannt als Ab-initio-Molekulardynamik (AIMD).
-
1 stellt das schematische Schaubild 100 dar, das den Kompromiss zwischen Umfang und Genauigkeit für verschiedene MD-Kraftberechnungsverfahren aus dem Stand der Technik zeigt, z.B. AIMD 102, Kraftfeld MD 104 und grobkörniges MD 106. Die y-Achse 108 stellt die Genauigkeit und die x-Achse 110 den Umfang (z.B. 100 Atome, 1-10K Atome und 100K Atome) dar. AIMD 102 kann benutzt werden, um die Degradation von Antihaft-Beschichtungen zu modellieren. Durch die Kraftfeldanpassung 112 kann Kraftfeld-MD zum Modellieren von amorphen Elektrolyten und Protonenaustauschmembran-Brennstoffzellen (PEMFC)- oder Bipolarplatten(BPP)-Oxidbeschichtungen verwendet werden. Grobkörnige MD 106 kann zur Modellierung von PEMFC-Nafionpolymeren verwendet werden.
-
AIMD ist für viele relevante Anwendungen zu rechenintensiv. So würde beispielsweise gemäß einer Schätzung eine AIMD-Simulation auf einem Hochleistungscomputer mit zweihundert (200) Kernen fünfundsechzig (65) Jahre dauern, um die Untersuchung des Dynamikverhaltens von amorphem Lithiumphosphatglas mit etwa fünfhundert (500) Atomen für fünfhundert (500) Nanosekunden fertigzustellen.
-
Eine Alternative zur AIMD ist die klassische Molekulardynamik. Mit dieser Alternative wurden interatomare Kräfte in einige geschlossene funktionale Formen eingepasst, um eine Beschleunigung um mehrere Größenordnungen gegenüber AIMD zu ermöglichen. Dieser alternative Ansatz wurde verwendet, um große Systeme, wie etwa Polymere und amorphe Materialien, zu simulieren. Nach einer Schätzung endet die gleiche Simulation, die oben unter Verwendung des klassischen molekulardynamischen Ansatzes identifiziert wurde, in weniger als zwei (2) Tagen.
-
Einer der Nachteile des klassischen molekulardynamischen Modells unter Verwendung von vordefinierten funktionalen Formen ist, dass sie das Verhalten interatomarer Interaktionen innerhalb von Annahmen einschränken, die unter bestimmten Bedingungen gültig bleiben. So geht beispielsweise ein klassisches Kraftfeld mit quadratischen Funktionsformen für die Bindung zwischen Atomen davon aus, dass die chemische Bindung zwischen Atomen nicht bricht. Diese Annahme steht im Widerspruch zum Verhalten der Natur, wo sich chemische Bindungen in Molekülen während chemischer Reaktionen bilden und brechen. Es gibt relativ komplexere vorab angenommene funktionale Formen zur Simulation chemischer Reaktionen. Beispielsweise sind reaktive Kraftfelder, wie etwa ReaxFF, ein solches Modell. Diese Modelle haben den Nachteil, dass sie schwer zu parametrisieren sind und erfordern eine große Anzahl von relativ komplexen, handgemachten, geschlossenen funktionalen Formen.
-
Wie vorstehend beschrieben, gibt es NNFF-Algorithmen, die die Berechnung von quantenmechanischen Energien erfordern. Eine Implementierung von NNFF verwendet rotationsinvariante Merkmale, die von Behler und Parrinello entwickelt wurden (auch bekannt als der Behler-Parrinello-Ansatz), wie in den folgenden Artikeln beschrieben: J. Behler und M. Parrinello, „Generalized Neural-Network Representation of High-Dimensional Potential-Energy Surfaces", Phys. Rev. Lett. 98, 146401 (2007); M. Gastegger, J. Behler und P. Marquetand, „Machine Learning Molecular Dynamics for Simulation of Infrared Spectra", Chem. Sci. 2017, 8, 6924; undJ. Behler, „Atom-centered Symmetry Functions for Constructing High-Dimensional Neural Network Potentials", J. Chem. Phys., 134, 074106 (2011), die alle durch Verweis in ihrer Gesamtheit hierin aufgenommen sind.
-
In dieser Implementierung werden Atome, die das Zentralatom i innerhalb eines vordefinierten Radius Rc umgeben, als Eingänge in das neuronale Netz verwendet. Anstatt atomare kartesische Koordinaten der Atome als Eingabemerkmale zu verwenden, werden die atomaren kartesischen Koordinaten in Fingerabdruckmerkmalsvektoren umgewandelt. Diese Vektoren sind invariant unter physikalischen Operationen, die die Energiekoordinaten der lokalen atomaren Struktur nicht verändern sollten. Diese physischen Operationen umfassen Rotation, Translation und Permutation. Rotationsinvarianz bezieht sich auf die Energieinvarianz beim Drehen der gesamten kartesischen Koordinaten der lokalen atomaren Umgebung um eine identische Rotation in Bezug auf einen beliebigen Punkt im Raum, wie etwa das Zentralatom i. Die Translationsinvarianz bezieht sich auf die Energieinvarianz beim Verschieben der gesamten kartesischen Koordinaten der lokalen atomaren Umgebung um eine identische Verlagerung. Permutationsinvarianz bezieht sich auf die Energieinvarianz beim Ändern der Ordnungsreihenfolge der Atome in der lokalen atomaren Umgebung und beim Beibehalten ihrer Positionen. Zusätzlich zur Erfüllung dieser drei (3) Bedingungen können die gewählten Fingerabdruck-Merkmalsvektoren auch die folgenden Kriterien erfüllen (die als der Physik des Systems entsprechend angenommen werden): zerfallende Beiträge von Atomen, die weiter vom Zentralatom i entfernt sind (bis zu 0 für R > Rc); und leicht variierend, wenn die Atompositionen in der lokalen atomaren Umgebung leicht variieren.
-
In einer Implementierung werden diese fünf (5) Anforderungen erreicht, indem eine Liste von Atomkoordinaten, die ein Zentralatom i
umgeben, in Fingerabdruck-Merkmalsvektoren
umgewandelt wird, die durch Zwei- und Dreikörperfunktionen beschrieben werden. Nachfolgend sind einige nicht einschränkende Beispiele für Fingerabdruckfunktionen aufgeführt:
wobei η, κ, ζ und λ benutzerdefinierte Parameter von G-Fingerabdruck-Funktionen sind, wie in J. Behler: „Atom-centered Symmetry Functions for Constructing High-Dimensional Neural Network Potentials“, J. Chem. Phys., 134, 074106 (2011) beschrieben. Die Werte dieser Parameter werden typischerweise so gewählt, dass sie die für das betrachtete lokale Atomsystem relevanten Längenskalen angemessen abdecken (typischerweise innerhalb eines Cutoff-Radius R
c < 10 A). Die Cutoff-Funktion ∫
c ist abhängig von R
c und kann wie folgt definiert werden:
-
Die Permutationsinvarianz gilt nur für Atome der gleichen Elemente. So beschreibt beispielsweise der Austausch eines C-Atoms an Position 1 und eines C-Atoms an Position 2 zwei Systeme mit der gleichen Physik, und entsprechend gilt die Permutationsinvarianz. Als weiteres Beispiel beschreibt der Austausch eines C-Atoms an Position 1 und eines O-Atoms an Position 2 zwei Systeme mit unterschiedlicher Physik, und die Permutationsinvarianz gilt nicht. Daher sollten bei der Untersuchung von Mehrelementesystemen die Summierungen in den obigen G- Funktionen nur für Atome mit den gleichen Elementen (für Zweikörper-G) oder gleichen Elementpaaren (für Dreikörper-G) vorgenommen werden. Bei einer gegebenen Anzahl m von Elementen in einem MD-System von Interesse, die ein Zentralatom i umgeben, werden m verschiedene G für jede parametrisierte 2-Körper-Funktion und m(m+1)/2 verschiedene G für jede parametrisierte Dreikörper-Funktion berechnet. Aufgrund der Konstruktion dieser Funktionen (einschließlich der Rotationsinvarianz) stellen diese Funktionen vorteilhafte Darstellungen zum Lernen der rotationsinvarianten Natur der Quantenmechanik. Ein maschinell lernendes System, das diese invarianten Merkmale verwendet, ist jedoch darauf beschränkt, das Vorhersagen von rotationsinvarianten Ausgängen, wie etwa Energie, zu verwenden.
-
Viele auf der Quantenmechanik basierende Methodiken (z.B. Dichtefunktionaltheorie) werden verwendet, um die Energie E eines Systems zu berechnen. Diese Methodiken können jedoch die elektronische Energie nicht bequem in Beiträge einzelner Atome aufteilen. Dementsprechend werden in einer oder mehreren Ausführungsformen
Merkmalsvektoren für jedes Atom in einem System berechnet und dann zum Trainieren oder Vorhersagen einer einzelnen skalaren Menge an Energie E verwendet, wie in
2 dargestellt.
2 zeigt ein schematisches Diagramm eines Neuronalnetz-Knotens eines NNFF-Energievorhersage-Schemas nach dem Behler-Parrinello-Ansatz aus dem Stand der Technik. Die Atomkoordinatenumgebungen
R1 bis
RN 202 werden jeweils als Eingänge des NNFF-Algorithmus
200 verwendet. Die Atomkoordinatenumgebungen
R1 bis
RN 202 werden zur Berechnung der Symmetriefunktionen
G1 bis
GN 204 verwendet. Jede Atomkoordinatenumgebung
R1 bis
RN 202 steht mit jeder Symmetriefunktion
G1 bis
GN 204 in Beziehung. Atomare NNs
206 werden unter Verwendung von Symmetriefunktionen
G1 bis
GN 204 trainiert, um die atomaren Energien
208 zu erhalten, die verwendet werden, um die Gesamtenergie E 210 zu erhalten.
-
Der NNFF-Ansatz für AIMD-Anwendungen leidet an einer oder mehreren Einschränkungen. So wird beispielsweise während eines Trainingszyklus jedes der atomaren NNs (typischerweise ein NN für jedes Element) für eine einzige Energiemenge E mit trainiert, die an das System von Interesse gebunden ist. Dementsprechend sind die NNs koabhängig, da sie jeweils zur Vorhersage eines einzelnen Energiewertes E mitverwendet werden müssen und nur für die Vorhersage des genauen MD-Systems, das in dem Trainingssatz verwendet wird, optimiert sind. Es gibt keine unabhängigen
Muster, die für das Training verschiedener MD-Systeme, die lokale atomare Umgebungen ähnlich wie
enthalten, einbezogen werden können. Zweitens werden während der MD-Laufzeit (Kraftvorhersagezyklus) teure Berechnungen durchgeführt, um den Kraftvektor
auf Atom i zu berechnen.
ist die Ableitung der Gesamtsystemenergie E in Bezug auf die Verlagerung eines einzelnen Atoms
Allerdings erfordert die Vorhersage von E, dass G für alle Atome in dem MD-System
bekannt ist. Folglich erfordert die Berechnung von
die Berechnung des Fingerabdruckvektors
3N mal, wie in der folgenden Gleichung dargestellt.
wobei α die kartesischen x-, y- und z-Achsen angibt, N die Gesamtzahl der Atome in dem MD-System ist und
Mi die Gesamtzahl der Fingerabdruckfunktionen ist, die das Atom i beschreiben. Dementsprechend wächst die Berechnung von Kräften für alle N Atome in dem System mit O (
N2 ). In bestimmten Implementierungen können bestimmte Algorithmusmodifikationen die Anzahl von Fingerabdruckvektorberechnungen auf 3P mal reduzieren, wobei P die durchschnittliche Anzahl von Atomen in der lokalen atomaren Umgebung der Atome ist, wodurch das Rechenkostenausmaß auf O(N) reduziert wird. Dennoch erfordert diese Einschränkung
Berechnungen für eine
Vorhersage (P kann zwischen 100 und 400 Atomen liegen, je nach gewählter
Rc ), im Gegensatz zu einer
Berechnung in einer direkten
Vorhersage. Dementsprechend kann ein NNFF-Algorithmus mit direkter
Vorhersage die NNFF-basierten MD
Berechnungen um zwei (2) bis drei (3) Größenordnungen beschleunigen.
-
In einer oder mehreren Ausführungsformen wird ein Computersystem offenbart, das dazu konfiguriert ist, einen Algorithmus zur direkten Vorhersage quantenmechanischer atomarer Kräfte aus einer Molekularstruktur unter Verwendung eines neuronalen Netzes ohne Verwendung von Energieableitungen zu implementieren. In bestimmten Ausführungsformen kann dieser Algorithmus zwei (2) bis (3) Größenordnungen weniger rechenintensiv sein (z.B. weniger Rechenzeit eines Hochleistungsrechnersystems (High-Performance Computing(HPC) System)) im Vergleich zu bekannten NNFF-Algorithmen, die die Berechnung quantenmechanischer Energien erfordern.
-
Die Fähigkeit eines HPC-Systems, bestimmte Aufgaben durchzuführen, kann unter Verwendung von Bezugsgrößen quantifiziert werden, wie beispielsweise Anwendungsbezugsgrößen aus Rechencodes, wie sie in den Suiten SPEC HPC2002 und SPEC MPI2007 der Standard Performance Evaluation Corporation (www.spec.org/hpg) und im HPC-System-Erwerbsprozess der US National Science Foundation (NSF) dargestellt sind, die hiermit durch Bezugnahme in ihrer Gesamtheit aufgenommen sind.
-
In einer oder mehreren Ausführungsformen werden einfachere funktionale Formen klassischer molekularer Dynamikmodelle durch neuronale Netze ersetzt. Solche Netze können leicht auf der Grundlage eines mitgelieferten Datensatzes [Eingang, Ausgang] abgestimmt werden. Die lokale Umgebung von Atomen, die ein Atom i umgeben, kann verwendet werden, um die Kraft, die das Atom i erfährt, vorherzusagen. In einem üblichen NNFF-Modell wird das Zentrumsatom i verlagert und dann die Änderung des Energiebeitrags aus dem Atom i und allen anderen Atomen in der Nähe von i berechnet. Die numerische Ableitung der Gesamtsystemenergie im Vergleich zu der Verlagerung des Atoms i ist die atomare Kraft, die das Atom i erfährt. Dieser Ansatz ist zeitaufwendig, da die Änderung des Energiebeitrags von allen Atomen, die das Atom i umgeben, berechnet werden muss, um die Kraft zu berechnen. In einer oder mehreren Ausführungsformen sagen die hierin offenbarten Systeme direkt die Kraft auf das Atom i vorher. Dieses Rechensystem kann zwei (2) bis drei (3) Größenordnungen schneller sein als der Gesamtsystemansatz, da es nicht notwendig ist, zusätzliche Beiträge von anderen Atomen, die das Atom i umgeben, zu berechnen, während die erforderliche Genauigkeit beibehalten wird.
-
In einer Ausführungsform wird ein Berechnungsalgorithmus offenbart, der dazu konfiguriert ist, einen Kraftvektor auf einem Atom direkt vorherzusagen, indem er die lokale atomare Umgebung, die ein Zentrumsatom umgibt, analysiert. Ein neuronales Netz kann auf rotationsinvariante Merkmale einer lokalen atomaren Umgebung trainiert werden. Das trainierte neuronale Netz ist dazu konfiguriert, die atomaren Kräfte innerhalb einer MD-Simulation vorherzusagen. In einer oder mehreren Ausführungsformen können rotationsinvariante Merkmale eingerichtet sein, um eine relativ geringe Anzahl von rotationsinvarianten Zwischenzuständen vorherzusagen. Anschließend kann diesen rotationsinvarianten Zwischenzuständen eine Anzahl von rotationskovarianten Merkmalen hinzugefügt werden, die dann in einem späteren Teil des neuronalen Netzes zur Vorhersage von Kraftvektorwerten verwendet werden können. Die Kraftvektorwerte stellen einen rotationskovarianten Ausgang dar.
-
In einer Ausführungsform können, da dieser Berechnungsalgorithmus eine direkte
Vorhersage für jedes Trainingsmuster ermöglicht (im Gegensatz zur E-Vorhersage, die die Kenntnis aller
Datenmuster im Simulationsrahmen erfordert),
Muster aus verschiedenen Sätzen von Systemen oder Materialien für das Kraftfeldtraining und/oder die Kraftfeldentwicklung kombiniert werden. So kann etwa der Berechnungsalgorithmus einer oder mehrerer Ausführungsformen verwendet werden, um ein Kraftfeld für ein großes atomares System der Schnittstelle zwischen den Materialien A und B zu entwickeln. Unter Verwendung dieses Algorithmus kann ein Trainingssatz durch Kombination separater kleinerer Strukturen von Material A, Material B und der Schnittstelle zwischen Materia A und B erstellt werden. Dieser Trainingssatz kann nicht unter Verwendung eines Algorithmus erstellt werden, der eine E-Vorhersage als Teil der Routine erfordert, da die E des kombinierten großen atomistischen Systems aus rechnerischer Sicht zu teuer ist, um aus quantenmechanischer Sicht berechnet zu werden.
-
Der Berechnungsalgorithmus einer oder mehrerer Ausführungsformen kann in eine MD-Simulationsfunktionseinheit integriert werden, um eine MD-Simulation mit einer Genauigkeit durchzuführen, die der einer erheblich teureren AIMD-Methode nahe kommt. So kann beispielsweise die MD-Simulation einer oder mehrerer Ausführungsformen nützlich sein, um die Atom/Ionen-Dynamik und chemische Reaktionen zu modellieren, die für Funktionsmaterialien, die in Brennstoffzellen, Wasserentsalzung, Katalyse, Beschichtungen und Batterien verwendet werden, relevant sind.
-
In einer oder mehreren Ausführungsformen ist der Vorhersagealgorithmus für atomare Kraft einer oder mehrerer Ausführungsformen in MD-Software integriert. Ein nicht einschränkendes Beispiel für eine geeignete MD-Software ist der Large-scale Atomic/Molecular Massively Parallel Simulator (LAMMPS). LAMMPS ist erhältlich bei Sandia National Laboratories in Albuquerque, New Mexico. LAMMPS verwendet ein Message Passing Interface (MPI) für die parallele Kommunikation. LAMMPS ist eine Open-Source-Software, die unter den Bedingungen von GNU General Public License vertrieben wird.
-
Ein Hauptprinzip dieses Algorithmus zur Ermöglichung direkter Kraftvorhersage ist eine Definition eines Satzes von k internen Achsen
für jede Atomkoordinatenumgebung
, die sich mit der lokalen atomaren Umgebungsstruktur dreht (rotationskovariante Vektoren), und projiziert dann den rotationskovarianten Kraftvektor
auf
um den internen Kraftvektor
zu erhalten. Da
später zurück auf die kartesische Koordinate projiziert wird, ist k eine feste Anzahl und ist größer oder gleich 3. Obwohl sowohl
als auch
rotationskovariant sind, sind diese Vektoren gebundene Vektoren in Bezug auf die lokale atomare Struktur selbst (beide Vektoren drehen sich mit der Struktur). Dementsprechend dreht eine Rotationstransformation T̂ ∈ S0(3) der Atompositionen
entsprechend. Folglich ist der interne Proj ektionsvektor
rotationsinvariant. In einer oder mehreren Ausführungsformen wird der rotationsinvariante Merkmalsvektor
dazu verwendet, den rotationsinvarianten Zwischenzustand
vorherzusagen. Der rotationsinvariante
und der rotationskovariante
werden verwendet, um eine inverse Projektion durchzuführen und die rotationskovariante kartesische Zentralatoms-Ausgangskraft
zu erhalten. Eine Übersicht über die invarianten und kovarianten Vektor-Notationen ist in der nachfolgenden Tabelle 1 dargestellt.
Tabelle 1
Beschreibung | Vektor | Unter Rotation T̂ ∈ S0(3) |
Kartesische Position der atomaren Umgebung, die das Atom i (aus N) umgibt | | |
Interne Achsenanzahl k (von mindestens 3) | | |
Kartesische Kraft des Atoms i (aus N) | | |
Projektion der Kraft des Atoms i (aus N) auf die interne Achsanzahl k (aus mindestens 3) | | Unverändert |
Liste der am Atom zentrierten Fingerabdrücke | | Unverändert |
-
Es wird ein Satz von internen Achsen
definiert, wobei k eine Gruppe von mindestens einigen der Atome angibt, die das Zentralatom i umgeben. Das Kriterium, ob ein Atom j als Teil der Gruppe k betrachtet wird oder nicht, ist benutzerdefiniert und kann abhängig von dem betrachteten MD-System weiter optimiert werden. Nachdem dieses Atomgruppierungskriterium bestimmt wurde, wird die Einschränkung, dass
der gewichtete Mittelwert aller relativen Positionsvektoren der Atome in der Gruppe relativ zu dem Zentralatom i sein sollte, angewendet. Diese Einschränkung kann mathematisch wie folgt dargestellt werden:
wobei f
A,k eine Achsfunktion wie hierin beschrieben ist. In einer oder mehreren Ausführungsformen wird der gleiche
Rc für die
Berechnung wie bei der
Berechnung eingestellt. In anderen Ausführungsformen werden stabilere
Vektoren in Bezug auf die Variation lokaler Atomkoordinaten eingestellt, da
nur für Referenzachsen der Vektorprojektion verwendet werden. Die folgenden
gA parametrisierten funktionalen Formen werden anstelle von f
A,k für das Polyethylenoxid (PEO) - Polymer (C
2H
4O)
n verwendet:
-
Im Beispiel einer NNFF-Entwicklung für PEO sind die Gruppierungskriterien nachfolgend in Tabelle 2 umrissen:
Tabelle 2
k | Kriterium für die Atom-j-Inklusion in Gruppe k | Parametrisierte Funktion für f A,k |
1 | j ist von Atomelement C | |
2 | j ist von Atomelement H | |
3 | j ist von Atomelement O | |
4 | j ist von Atomelement C | |
5 | j ist von Atomelement H | |
6 | j ist von Atomelement O | |
-
Sobald die Art und Weise zum Berechnen von
aus
definiert ist, wird
(unter Verwendung von Quantenmechanik) auf
projiziert, um einen internen Kraftprojektionssatz
zu finden. Da sowohl
als auch
rotationsinvariant sind, kann ein erstes neuronales Netz (NN1) trainiert werden, um die
Vorhersage direkt durchzuführen. Als nächster Schritt wird eine inverse Projektion von der inneren Kraft
zurück auf die kartesische atomare Kraft
durchgeführt. In einer Ausführungsform, da die Beziehung
gilt, wird die inverse Projektion unter Verwendung einer pseudoinversen Matrixbeziehung durchgeführt, um die Lösung mit dem kleinsten Fehlerquadrat zu finden:
. In der Praxis führt dies möglicherweise nicht zu geeigneten Ergebnissen, da der Satz interner Achsen
möglicherweise nicht als orthogonale (oder nahezu orthogonale) Basis für den gesamten 3D-xyz-Raum eingeschränkt ist. Dementsprechend können, wenn sich die Basisvektoren überlappen, kleine Mengen an Rauschen (sei es durch Fehler oder durch Störungen von Atomkoordinaten) zu numerischen Instabilitäten führen. Dies ist zwar kein Problem, wenn es null Fehler in der
Vorhersage gibt, aber jeglicher Fehler in der
Vorhersage durch NN1 kann während der
Berechnung durch das pseudoinverse Verfahren um mehrere Größenordnungen verstärkt werden. Dies macht in einer oder mehreren Ausführungsformen das Matrixverfahren des kleinsten Fehlerquadrats oder das Pseudoinversionsverfahren ungeeignet für die umgekehrte Projektion des Kraftvektors.
-
Ein zweites, kleineres neuronales Netz (NN2) kann dazu trainiert werden, das Problem der inversen Projektion zu lösen.
werden als Eingänge für NN2 verwendet und NN2 sagt
als Ausgang vorher. In einer oder mehreren Ausführungsformen berücksichtigt NN2 einen gewissen Grad an Rotationssymmetrie, indem es eine Datenvergrößerung durchführt. In einer oder mehreren Ausführungsformen werden nicht nur
sondern auch
als Teil der Trainingsmuster verwendet, wobei T̂ eine zufällige 3D-Rotationsmatrix ist (viele verschiedene T̂ können zur NN2-Datenvergrößerung verwendet werden).
-
Im nächsten Schritt können NN1 und NN2 zu einem einzigen neuronalen Netz kombiniert werden, indem die Gewichtungen und Verzerrungen von NN1 und NN2 in eine kombinierte NN-Architektur mit Knotenabmessungen identisch zu NN1 und NN2 übertragen werden (Transferlernen). Fehler des kombinierten NN können reduziert und/oder minimiert werden, indem eine kleinere Anzahl von Trainingszyklen in dem kombinierten Netz unter Verwendung des
Trainingsdatensatzes ausgeführt wird.
-
Die Modifikationen an einem NNFF-Algorithmus, die oben in einer oder mehreren Ausführungsformen identifiziert wurden, ermöglichen eine Vereinfachung der Kraftvorhersage, wobei rotationsinvariante und rotationskovariante Merkmale verwendet werden, um eine direkte Vorhersage der atomaren Kraft auf Atom
zu ermöglichen, wenn nur die Koordinaten der lokalen atomaren Umgebung
und die das Atom i umgebenden Elemente gegeben sind.
3 zeigt ein Neuronalnetzknoten-Prinzip eines NNFF-Algorithmus
300 gemäß einer Ausführungsform. Atomkoordinatenumgebungen
R1 bis
RN werden als Eingänge
302a bis
302n des NNFF-Algorithmus
300 verwendet. Atomkoordinatenumgebungen
R1 bis
RN werden zur Berechnung der Symmetriefunktionen
G1 bis
GN (in
3 als Symmetriefunktionen
304a bis
304n bezeichnet) und der Achsenfunktionen
A1 bis
AN (in
3 als Symmetriefunktionen
306a bis
306n bezeichnet) verwendet. Das erste Neuronalnetz NN1 (in
3 als 308 bezeichnet) wird unter Verwendung der Symmetriefunktionen
G1 bis
GN trainiert, um die internen Kraftvektoren
Fint,1 bis
Fint,N (in
3 als 310a bis 310n bezeichnet) zu erhalten. Die Achsfunktionen
A1 bis AN und die internen Kraftvektoren
Fint,1 bis
Fint,N werden zum Trainieren des zweiten neuronalen Netzes NN2 verwendet (siehe 312 in
3). Der Ausgang des NNFF-Algorithmus
300 sind die atomaren Kräfte
F1 bis
FN (in
3 als 314a bis 314n bezeichnet) im kartesischen Koordinatensystem. In einer oder mehreren Ausführungsformen weist der NNFF-Algorithmus
300 der
3 keine Abhängigkeit zwischen den
Trainingsmusterdaten untereinander auf. Dementsprechend kann eine direkte
Vorhersage durchgeführt werden, was die Rechengeschwindigkeit der Kraftvorhersage deutlich verbessert.
-
In einem Beispiel wird eine Massenversion von Polyethylenoxid (PEO)-Polymer, wie unten gezeigt, verwendet, um einen Trainingssatz von H-Atomen von PEO unter Verwendung des Fingerabdrucks
Vorhersage zu erzeugen.
-
4 ist ein Schaubild
400 von
402, vorhergesagt unter Verwendung eines NNFF-Algorithmus einer Ausführungsform, im Vergleich zu
404, berechnet unter Verwendung einer quantenmechanischen Dichtefunktionaltheorie-Simulation (DFT-Simulation). Das Schaubild
400 zeigt die Kräfte auf den H-Atomen für PEO unter Verwendung der beiden verschiedenen Ansätze. Der Fehler zwischen dem NNFF-Algorithmus und der quantenmechanischen DFT-Simulation kann als
ausgedrückt werden. Unter Verwendung dieses Ausdrucks beträgt der durchschnittliche Fehler 0,01 (eV/A)
2, was in einem akzeptablen Bereich liegt. In diesem Beispiel wurden während des Trainingszyklus kein Muster aus dem Testsatz gesehen.
-
5A zeigt ein Diagramm
500 eines Fingerabdruck-Neuronalnetzes (NN)
502 eines NNFF-Algorithmus einer Ausführungsform. Die rotationsinvariante Komponente
504 des Fingerabdruck-NN entspricht einer Vorhersage des Zwischenzustands der internen Kraftprojektion
506. Die
5B,
5C und
5D stellen die Schaubilder
508,
510 bzw.
512 dar, die Ergebnisse für die Vorhersage von H-, C- bzw. O-Atomen in dem Testsatz von atomaren Momentaufnahmen, entnommen aus Massen-PEO, unter Verwendung des NNFF-Algorithmus einer Ausführungsform zeigen. Unter Verwendung der vorstehend dargelegten Fehlergleichung beträgt der Fehler zwischen dem NNFF-Algorithmus und der Quantenmechanik-DFT-Simulation 0,01 (eV/A)2, 0,04 (eV/A)2und 0,16 (eV/A)2 für die Vorhersage von H-, C- bzw. O-Atomen, was in einem akzeptablen Bereich liegt. In diesen Beispielen wurden während des Trainingszyklus keine Proben aus dem Testsatz gesehen.
-
6A zeigt das Diagramm
600 des Fingerabdruck-NN
602 und des Inversionsprojektions-NN
604 kombiniert, um ein kombiniertes NN
606 in einem NNFF-Algorithmus einer Ausführungsform zu produzieren. Gemäß einer oder mehreren Ausführungsformen werden Gewichtungen der NN
602 und
604 übertragen und das kombinierte NN
606 erneut trainiert. Das Fingerabdruck-NN
602 ist eine rotationsinvariante Komponente des NNFF-Algorithmus und das Inversionsprojektions-NN
604 ist eine rotationskovariante Komponente des NNFF-Algorithmus. Das kombinierte NN
606 sagt die kartesische atomare Kraft
vorher. Die
6B,
6C und
6D stellen die Schaubilder
608,
610 bzw.
612 dar, die Ergebnisse für die Vorhersage von H-, C- bzw. O-Atomen in dem Testsatz von atomaren Momentaufnahmen, entnommen aus Massen-PEO, unter Verwendung des NNFF-Algorithmus einer Ausführungsform zeigen.
bezeichnet die Projektion von
auf die kartesische x-, y- und z-Achse. Unter Verwendung der vorstehend dargelegten Fehlergleichung beträgt der Fehler zwischen dem NNFF-Algorithmus und der Quantenmechanik-DFT-Simulation 0,03 (eV/A)2, 0,58 (eV/A)2und 0,42 (eV/A)2 für die Vorhersage von H-, C- bzw. O-Atomen, was in einem akzeptablen Bereich liegt. In diesen Beispielen wurden während des Trainingszyklus keine Proben aus dem Testsatz gesehen.
-
Die NNFF-Algorithmen und/oder -Methodiken einer oder mehrerer Ausführungsformen werden unter Verwendung einer Rechenplattform, wie beispielsweise der in 7 dargestellten Rechenplattform 700, implementiert. Die Rechenplattform 700 kann einen Prozessor 702, einen Speicher 704 und einen nichtflüchtigen Speicher 706 umfassen. Der Prozessor 702 kann eine oder mehrere Vorrichtungen umfassen, die ausgewählt sind aus Hochleistungsrechnersystemen (HPC-Systemen), einschließlich Hochleistungskernen, Mikroprozessoren, Mikrocontrollern, Digitalsignalprozessoren, Mikrocomputern, Zentraleinheiten, feldprogrammierbaren Gate-Arrays, programmierbaren Logikvorrichtungen, Zustandsmaschinen, Logikschaltungen, analogen Schaltungen, digitalen Schaltungen oder irgendwelcher anderer Vorrichtungen, die Signale (analog oder digital) basierend auf computerausführbaren Anweisungen, die sich im Speicher 704 befinden, manipulieren. Der Speicher 704 kann eine einzelne Speichervorrichtung oder eine Anzahl von Speichervorrichtungen umfassen, einschließlich u.a. Direktzugriffsspeicher (RAM), flüchtigem Speicher, nichtflüchtigem Speicher, statischem Direktzugriffsspeicher (SRAM), dynamischem Direktzugriffsspeicher (DRAM), Flash-Speicher, Cache-Speicher oder irgendeine andere Vorrichtung, die Informationen speichern kann. Der nichtflüchtige Speicher 706 kann eine oder mehrere persistente Datenspeichervorrichtungen, wie etwa eine Festplatte, ein optisches Laufwerk, ein Bandlaufwerk, eine nichtflüchtige Festkörper-Vorrichtung, einen Cloud-Speicher oder irgendeine andere Vorrichtung, die zum persistenten Speichern von Informationen in der Lage ist, umfassen.
-
Der Prozessor 702 kann dazu konfiguriert sein, in dem Speicher 704 zu lesen und computerausführbare Anweisungen, die sich im NNFF-Softwaremodul 708 des nichtflüchtigen Speichers 706 befinden, auszuführen und NNFF-Algorithmen und/oder Methodiken einer oder mehrerer Ausführungsformen umsetzen. Der Prozessor 702 kann ferner dazu konfiguriert sein, in dem Speicher 704 zu lesen und computerausführbare Anweisungen auszuführen, die sich im MD-Softwaremodul 710 (wie etwa LAMMPS) des nichtflüchtigen Speichers 706 befinden, und MD-Algorithmen und/oder -Methodiken umzusetzen. Die Softwaremodule 708 und 710 können Betriebssysteme und Anwendungen umfassen. Die Softwaremodule 708 und 710 können aus Computerprogrammen zusammengestellt oder interpretiert werden, die unter Verwendung einer Vielzahl von Programmiersprachen und/oder Technologien erstellt wurden, einschließlich u.a. und entweder allein oder in Kombination, Java, C, C++, C#, Objective C, Fortran, Pascal, Java Script, Python, Perl und PL/SQL.
-
Bei der Ausführung durch den Prozessor 702 können die computerausführbaren Anweisungen des NNFF-Softwaremoduls 708 und des MD-Softwaremoduls 710 die Rechenplattform 700 veranlassen, einen oder mehrere der hierin offenbarten NNFF-Algorithmen und/oder -Methodiken und MD-Algorithmen und/oder -Methodiken zu implementieren. Der nichtflüchtige Speicher 706 kann auch NNFF-Daten 712 und MD-Daten 714 umfassen, die die Funktionen, Merkmale und Prozesse der einen oder mehreren hierin beschriebenen Ausführungsformen unterstützen.
-
Der Programmcode, der die hierin beschriebenen Algorithmen und/oder Methodiken verkörpert, kann einzeln oder kollektiv als Programmprodukt in einer Vielzahl von unterschiedlichen Formen verteilt werden. Der Programmcode kann unter Verwendung eines computerlesbaren Speichermediums mit darauf befindlichen computerlesbaren Programmanweisungen zum Veranlassen eines Prozessors, Aspekte einer oder mehrerer Ausführungsformen auszuführen, verteilt werden. Computerlesbare Speichermedien, die von Natur aus nichtvergänglich sind, können flüchtige und nichtflüchtige sowie entfernbare und nicht entfernbare greifbare Medien umfassen, die in irgendeinem Verfahren oder irgendeiner Technologie zur Speicherung von Informationen, wie etwa computerlesbare Anweisungen, Datenstrukturen, Programmmodule oder andere Daten implementiert sind. Computerlesbare Speichermedien können ferner Folgendes umfassen: RAM, ROM, löschbare programmierbare Nur-Lese-Speicher (EPROM), elektrisch löschbare programmierbare Nur-Lese-Speicher (EEPROM), Flash-Speicher oder andere Festkörperspeichertechnologie, eine tragbare CD-ROM (Compact Disc Read-Only Memory) oder andere optische Speicher, Magnetkassetten, Magnetbänder, Magnetplattenspeicher oder andere magnetische Speichervorrichtungen oder jegliches andere Medium, das zum Speichern der gewünschten Informationen verwendet werden kann und das von einem Computer gelesen werden kann. Computerlesbare Programmanweisungen können von einem computerlesbaren Speichermedium auf einen Computer, eine andere Art von programmierbarem Datenverarbeitungsgerät oder eine andere Vorrichtung heruntergeladen werden oder über ein Netzwerk auf einen externen Computer oder eine externe Speichervorrichtung.
-
Computerlesbare Programmanweisungen, die auf einem computerlesbaren Medium gespeichert sind, können verwendet werden, um einen Computer, andere Arten von programmierbaren Datenverarbeitungsvorrichtungen oder andere Vorrichtungen anzuweisen, auf eine bestimmte Weise zu funktionieren, so dass die in dem computerlesbaren Medium gespeicherten Anweisungen einen Herstellungsartikel produzieren, der Anweisungen umfasst, die die in den Flussdiagrammen oder Diagrammen spezifizierten Funktionen, Handlungen und/oder Operationen ausführen. In bestimmten alternativen Ausführungsformen können die in den Flussdiagrammen und Diagrammen spezifizierten Funktionen, Handlungen und/oder Operationen neu geordnet, seriell verarbeitet und/oder gleichzeitig in Übereinstimmung mit einer oder mehreren Ausführungsformen verarbeitet werden. Darüber hinaus kann jedes der Flussdiagramme und/oder Diagramme mehr oder weniger Knoten oder Blöcke enthalten, als die dargestellten, die mit einer oder mehreren Ausführungsformen übereinstimmen.
-
Obwohl die gesamte Erfindung durch eine Beschreibung verschiedener Ausführungsformen veranschaulicht wurde und diese Ausführungsformen im Detail beschrieben wurden, ist es nicht die Absicht des Anmelders, den Schutzbereich der beigefügten Ansprüche auf diese Details zu beschränken oder in irgendeiner Weise zu begrenzen. Zusätzliche Vorteile und Modifikationen werden für den Fachmann leicht ersichtlich. Die Erfindung in ihren breiteren Aspekten beschränkt sich daher nicht nur auf die spezifischen Details, die repräsentativen Vorrichtungen und Verfahren sowie veranschaulichende Beispiele, die gezeigt und beschrieben werden. Dementsprechend können Abweichungen von diesen Details vorgenommen werden, ohne das vom Wesen oder Schutzbereich des allgemeinen erfinderischen Konzepts abgewichen wird.
-
ZITATE ENTHALTEN IN DER BESCHREIBUNG
-
Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
-
Zitierte Nicht-Patentliteratur
-
- J. Behler und M. Parrinello, „Generalized Neural-Network Representation of High-Dimensional Potential-Energy Surfaces“, Phys. Rev. Lett. 98, 146401 (2007) [0015]
- M. Gastegger, J. Behler und P. Marquetand, „Machine Learning Molecular Dynamics for Simulation of Infrared Spectra“, Chem. Sci. 2017, 8, 6924 [0015]
- J. Behler, „Atom-centered Symmetry Functions for Constructing High-Dimensional Neural Network Potentials“, J. Chem. Phys., 134, 074106 (2011) [0015]