DE102019217222A1

DE102019217222A1 - Neuronalnetz-Kraftfeld-Berechnungsalgorithmen für Molekulardynamik-Computersimulationen

Info

Publication number: DE102019217222A1
Application number: DE102019217222.9A
Authority: DE
Inventors: Jonathan Mailoa; Boris Kozinsky; Georgy Samsonidze; Nathan P. Craig; Mordechai Kornbluth
Original assignee: Robert Bosch GmbH
Current assignee: Robert Bosch GmbH
Priority date: 2018-11-28
Filing date: 2019-11-07
Publication date: 2020-05-28
Also published as: CN111241655A; US20200167439A1; US11455439B2

Abstract

Ein Berechnungsverfahren zum Simulieren der Bewegung von Elementen innerhalb eines Mehrelementesystems unter Verwendung eines Neuronalnetz-Kraftfeldes (NNFF). Das Verfahren umfasst das Empfangen einer Kombination aus einer Anzahl von rotationsinvarianten Merkmalen und einer Anzahl von rotationskovarianten Merkmalen einer lokalen Umgebung des Mehrelementesystems; und das Vorhersagen eines Kraftvektors für jedes Element innerhalb des Mehrelementesystems basierend auf der Kombination aus der Anzahl von rotationsinvarianten Merkmalen, der Anzahl von rotationskovarianten Merkmalen und des NNFF, um eine simulierte Bewegung der Elemente innerhalb des Mehrelementesystems zu erhalten.

Description

QUERVERWEIS AUF VERWANDTE PATENTANMELDUNGEN
TECHNISCHES GEBIET
Diese Erfindung betrifft im Allgemeinen Neuronalnetz-Kraftfeld(Neural Network Force Field, NNFF)-Berechnungsalgorithmen zur direkten Vorhersage von atomaren Kräften in Molekulardynamik-Computersimulationen in Materialsystemen, wie etwa elektrochemische und Wasserfiltrations-Vorrichtungen.
HINTERGRUND
Die Molekulardynamik ist eine rechnergestützte materialwissenschaftliche Methodik zur Simulation der Bewegung von Atomen in einem Materialsystem bei realen Betriebsdruck- und Temperaturbedingungen. Es gibt Methodiken zur Berechnung der zugrunde liegenden atomaren Kräfte, die bei der Simulation der Bewegung von Atomen verwendet werden. Eine Methodik ist der Ab-initio-Quantenmechanik-Ansatz. Dieser Ansatz ist sehr genau, aber auch sehr teuer, da eine enorme Menge an Rechenressourcen notwendig ist, um den Ansatz anzuwenden. Es gibt zwar noch andere Ansätze, die weniger Rechenressourcen verbrauchen, aber diese anderen Ansätze liefern keine so große Genauigkeit.
KURZFASSUNG
In einer ersten Ausführungsform wird ein Berechnungsverfahren zum Simulieren der Bewegung von Elementen innerhalb eines Mehrelementesystems unter Verwendung eines Neuronalnetzwerk-Kraftfeldes (NNFF) offenbart. Das Verfahren umfasst das Empfangen einer Kombination aus einer Anzahl von rotationsinvarianten Merkmalen und einer Anzahl von rotationskovarianten Merkmalen einer lokalen Umgebung des Mehrelementesystems. Das Verfahren umfasst ferner das Vorhersagen eines Kraftvektors für jedes Element innerhalb des Mehrelementesystems basierend auf der Kombination aus der Anzahl von rotationsinvarianten Merkmalen, der Anzahl von rotationskovarianten Merkmalen und des NNFF, um eine simulierte Bewegung der Elemente innerhalb des Mehrelementesystems zu erhalten.
In einer zweiten Ausführungsform wird ein nichtvergängliches, computerlesbares Medium, das computerlesbare Anweisungen für ein Softwareprogramm greifbar verkörpert, offenbart. Das Softwareprogramm ist von einem Prozessor einer Rechenvorrichtung ausführbar, um Operationen bereitzustellen. Die Operationen umfassen das Empfangen einer Kombination aus einer Anzahl von rotationsinvarianten Merkmalen und einer Anzahl von rotationskovarianten Merkmalen einer lokalen Umgebung des Mehrelementesystems. Die Operationen umfassen ferner das Vorhersagen eines Kraftvektors für jedes Element innerhalb des Mehrelementesystems basierend auf der Kombination aus der Anzahl von rotationsinvarianten Merkmalen und der Anzahl von rotationskovarianten Merkmalen und eines NNFF, um eine simulierte Bewegung der Elemente innerhalb des Mehrelementesystems zu erhalten.
In einer dritten Ausführungsform wird ein Computersystem zum Simulieren der Bewegung von Elementen innerhalb eines Mehrelementesystems unter Verwendung eines NNFF offenbart. Das Computersystem umfasst einen Simulationscomputer mit einem Prozessor zur Ausführung computerlesbarer Anweisungen und einem Speicher zum Beibehalten der computerausführbaren Anweisungen. Die computerausführbaren Anweisungen führen, wenn sie durch den Prozessor ausgeführt werden, die folgenden Funktionen durch: Empfangen einer Kombination aus einer Anzahl von rotationsinvarianten Merkmalen und einer Anzahl von rotationskovarianten Merkmalen einer lokalen Umgebung des Mehrelementesystems; und Vorhersagen eines Kraftvektors für jedes Element innerhalb des Mehrelementesystems basierend auf der Kombination aus der Anzahl von rotationsinvarianten Merkmalen und der Anzahl von rotationskovarianten Merkmalen und des NNFF, um eine simulierte Bewegung der Elemente innerhalb des Mehrelementesystems zu erhalten.
Figurenliste

1 stellt ein schematisches Schaubild dar, das den Kompromiss zwischen Umfang und Genauigkeit für verschiedene Molekulardynamik(MD)-Kraftberechnungsverfahren aus dem Stand der Technik darstellt.
2 ist ein schematisches Diagramm eines Neuronalnetz-Knotens eines Neuronalnetz-Kraftfeld(NNFF)-Energievorhersage-Schemas nach dem Behler-Parrinello-Ansatz aus dem Stand der Technik.
3 zeigt ein Neuronalnetzknoten-Prinzip eines NNFF-Algorithmus gemäß einer Ausführungsform.
4 ist ein Schaubild der vorhergesagten Kraft unter Verwendung eines NNFF-Algorithmus einer Ausführungsform im Vergleich mit einer auf Grundlage der Quantenmechanik berechneten Kraft für Massen-Polyethylenoxid (PEO).
5A zeigt ein Diagramm eines Fingerabdruck-Neuronalnetzes (NN) eines NNFF-Algorithmus einer Ausführungsform.
5B, 5C und 5D stellen jeweils Schaubilder dar, die Ergebnisse für die Vorhersage von H-, C- bzw. O-Atomen von Massen-PEO unter Verwendung des Fingerabdruck-NN des NNFF-Algorithmus einer Ausführungsform zeigen.
6A zeigt ein Diagramm eines Fingerabdruck-NN und eines Inversionsprojektion-NN, die kombiniert sind, um ein kombiniertes NN in einem NNFF-Algorithmus einer Ausführungsform zu erzeugen.
6B, 6C und 6D stellen jeweils Schaubilder dar, die Ergebnisse für die Vorhersagen von H-, C- bzw. O-Atomen von Massen-PEO unter Verwendung des kombinierten NNFF-Algorithmus einer Ausführungsform zeigen.
7 ist ein schematisches Diagramm einer Rechenplattform, die verwendet werden kann, um die NNFF-Algorithmen in einer oder mehreren Ausführungsformen zu implementieren, wie etwa dem NNFF-Algorithmus aus 6a.

DETAILLIERTE BESCHREIBUNG
Wie erforderlich, werden hierin detaillierte Ausführungsformen der vorliegenden Erfindung offenbart; es versteht sich jedoch, dass die offenbarten Ausführungsformen nur beispielhaft für die Erfindung sind, die in verschiedenen und alternativen Formen verkörpert werden kann. Die Figuren sind nicht unbedingt maßstabsgetreu; einige Merkmale können übertrieben oder minimiert sein, um Details bestimmter Komponenten zu zeigen. Deshalb sind spezifische strukturelle und funktionale Details, die hierin offenbart werden, nicht als einschränkend zu interpretieren, sondern lediglich als repräsentative Grundlage dafür, einem Fachmann zu lehren, die vorliegende Erfindung auf unterschiedliche Art und Weise zu nutzen.
Der Begriff „im Wesentlichen“ kann hierin verwendet werden, um offenbarte oder beanspruchte Ausführungsformen zu beschreiben. Der Begriff „im Wesentlichen“ kann einen Wert oder eine relative Eigenschaft, die in der vorliegenden Offenbarung offenbart oder behauptet wird, modifizieren. In solchen Fällen kann „im Wesentlichen“ bedeuten, dass der Wert oder die relative Eigenschaft, die er modifiziert, innerhalb von ± 0%, 0,1%, 0,5%, 1%, 2%, 3%, 4%, 5% oder 10% des Wertes oder der relativen Eigenschaft liegt.
Methodiken der Molekulardynamik (MD) sind zur Untersuchung physikalischer Phänomene von Vorteil, wie etwa u.a. Ionentransport, chemische Reaktionen und Degradation von Massen-Material und an der Oberfläche in Materialsystemen, wie etwa Vorrichtungen oder funktionalen Materialien. Nicht einschränkende Beispiele für solche Materialsysteme umfassen Brennstoffzellen, Oberflächenbeschichtungen, Batterien, Wasserentsalzung und Wasserfiltration. Es gibt Methodiken zur Berechnung der zugrunde liegenden atomaren Kräfte, die bei der Simulation der Bewegung von Atomen verwendet werden. Der Ab-initio-Quantenmechanik-Ansatz ist sehr genau, aber auch sehr teuer, da eine enorme Menge an Rechenressourcen notwendig ist, um den Ansatz anzuwenden.
Neuronale Netze wurden benutzt, um Quantenmechanik-Energien anzupassen und vorherzusagen. Diese Methodiken wurden als Neuronalnetz-Kraftfelder (NNFF) bezeichnet. Ableitungen von Energie in Bezug auf atomare Positionen und Kräfte werden unter Verwendung von quantenmechanischen Energien vorhergesagt. Diese Methodiken sind jedoch auch rechenintensiv. In Anbetracht des Vorstehenden ist das, was gebraucht wird, eine rechnergestützte Methodik zur Berechnung atomarer Kräfte, die ein adäquates Maß an Genauigkeit bei gleichzeitigem Verbrauch einer angemessenen Menge an Rechenressourcen liefert.
Die Molekulardynamik verwendet Atompositionen (und möglicherweise Ladungen, Bindungen oder andere strukturelle Informationen), um die interatomaren Kräfte jedes Atoms zu berechnen, die folglich verwendet werden, um die Geschwindigkeiten der Atome in der Simulation zu modifizieren. Die resultierenden Trajektorien der Atome werden benutzt, um physikalische Phänomene zu beschreiben, wie etwa u.a. Ionentransport in Batterien und Brennstoffzellen, chemische Reaktionen während der Degradation von Massen-Material und an der Oberfläche und den Phasenwechsel von Festkörpern. Es besteht ein Kompromiss zwischen der Genauigkeit und der Größe (gemessen an der Anzahl von Atomen und der simulierten Dynamikzeit) der Simulation in Abhängigkeit von dem zugrunde liegenden Verfahren, das zur Berechnung der atomaren Kräfte verwendet wird. Wie oben bereits dargelegt, verwendet ein genaues, aber teures Verfahren den Ab-initio-Quantenmechanik-Ansatz, bekannt als Ab-initio-Molekulardynamik (AIMD).
1 stellt das schematische Schaubild 100 dar, das den Kompromiss zwischen Umfang und Genauigkeit für verschiedene MD-Kraftberechnungsverfahren aus dem Stand der Technik zeigt, z.B. AIMD 102, Kraftfeld MD 104 und grobkörniges MD 106. Die y-Achse 108 stellt die Genauigkeit und die x-Achse 110 den Umfang (z.B. 100 Atome, 1-10K Atome und 100K Atome) dar. AIMD 102 kann benutzt werden, um die Degradation von Antihaft-Beschichtungen zu modellieren. Durch die Kraftfeldanpassung 112 kann Kraftfeld-MD zum Modellieren von amorphen Elektrolyten und Protonenaustauschmembran-Brennstoffzellen (PEMFC)- oder Bipolarplatten(BPP)-Oxidbeschichtungen verwendet werden. Grobkörnige MD 106 kann zur Modellierung von PEMFC-Nafionpolymeren verwendet werden.
AIMD ist für viele relevante Anwendungen zu rechenintensiv. So würde beispielsweise gemäß einer Schätzung eine AIMD-Simulation auf einem Hochleistungscomputer mit zweihundert (200) Kernen fünfundsechzig (65) Jahre dauern, um die Untersuchung des Dynamikverhaltens von amorphem Lithiumphosphatglas mit etwa fünfhundert (500) Atomen für fünfhundert (500) Nanosekunden fertigzustellen.
Eine Alternative zur AIMD ist die klassische Molekulardynamik. Mit dieser Alternative wurden interatomare Kräfte in einige geschlossene funktionale Formen eingepasst, um eine Beschleunigung um mehrere Größenordnungen gegenüber AIMD zu ermöglichen. Dieser alternative Ansatz wurde verwendet, um große Systeme, wie etwa Polymere und amorphe Materialien, zu simulieren. Nach einer Schätzung endet die gleiche Simulation, die oben unter Verwendung des klassischen molekulardynamischen Ansatzes identifiziert wurde, in weniger als zwei (2) Tagen.
Einer der Nachteile des klassischen molekulardynamischen Modells unter Verwendung von vordefinierten funktionalen Formen ist, dass sie das Verhalten interatomarer Interaktionen innerhalb von Annahmen einschränken, die unter bestimmten Bedingungen gültig bleiben. So geht beispielsweise ein klassisches Kraftfeld mit quadratischen Funktionsformen für die Bindung zwischen Atomen davon aus, dass die chemische Bindung zwischen Atomen nicht bricht. Diese Annahme steht im Widerspruch zum Verhalten der Natur, wo sich chemische Bindungen in Molekülen während chemischer Reaktionen bilden und brechen. Es gibt relativ komplexere vorab angenommene funktionale Formen zur Simulation chemischer Reaktionen. Beispielsweise sind reaktive Kraftfelder, wie etwa ReaxFF, ein solches Modell. Diese Modelle haben den Nachteil, dass sie schwer zu parametrisieren sind und erfordern eine große Anzahl von relativ komplexen, handgemachten, geschlossenen funktionalen Formen.
Wie vorstehend beschrieben, gibt es NNFF-Algorithmen, die die Berechnung von quantenmechanischen Energien erfordern. Eine Implementierung von NNFF verwendet rotationsinvariante Merkmale, die von Behler und Parrinello entwickelt wurden (auch bekannt als der Behler-Parrinello-Ansatz), wie in den folgenden Artikeln beschrieben: J. Behler und M. Parrinello, „Generalized Neural-Network Representation of High-Dimensional Potential-Energy Surfaces", Phys. Rev. Lett. 98, 146401 (2007); M. Gastegger, J. Behler und P. Marquetand, „Machine Learning Molecular Dynamics for Simulation of Infrared Spectra", Chem. Sci. 2017, 8, 6924; undJ. Behler, „Atom-centered Symmetry Functions for Constructing High-Dimensional Neural Network Potentials", J. Chem. Phys., 134, 074106 (2011), die alle durch Verweis in ihrer Gesamtheit hierin aufgenommen sind.
In dieser Implementierung werden Atome, die das Zentralatom i innerhalb eines vordefinierten Radius R_c umgeben, als Eingänge in das neuronale Netz verwendet. Anstatt atomare kartesische Koordinaten der Atome als Eingabemerkmale zu verwenden, werden die atomaren kartesischen Koordinaten in Fingerabdruckmerkmalsvektoren umgewandelt. Diese Vektoren sind invariant unter physikalischen Operationen, die die Energiekoordinaten der lokalen atomaren Struktur nicht verändern sollten. Diese physischen Operationen umfassen Rotation, Translation und Permutation. Rotationsinvarianz bezieht sich auf die Energieinvarianz beim Drehen der gesamten kartesischen Koordinaten der lokalen atomaren Umgebung um eine identische Rotation in Bezug auf einen beliebigen Punkt im Raum, wie etwa das Zentralatom i. Die Translationsinvarianz bezieht sich auf die Energieinvarianz beim Verschieben der gesamten kartesischen Koordinaten der lokalen atomaren Umgebung um eine identische Verlagerung. Permutationsinvarianz bezieht sich auf die Energieinvarianz beim Ändern der Ordnungsreihenfolge der Atome in der lokalen atomaren Umgebung und beim Beibehalten ihrer Positionen. Zusätzlich zur Erfüllung dieser drei (3) Bedingungen können die gewählten Fingerabdruck-Merkmalsvektoren auch die folgenden Kriterien erfüllen (die als der Physik des Systems entsprechend angenommen werden): zerfallende Beiträge von Atomen, die weiter vom Zentralatom i entfernt sind (bis zu 0 für R > R_c); und leicht variierend, wenn die Atompositionen in der lokalen atomaren Umgebung leicht variieren.
In einer Implementierung werden diese fünf (5) Anforderungen erreicht, indem eine Liste von Atomkoordinaten, die ein Zentralatom i ${{\vec{R}}_{i}}$
umgeben, in Fingerabdruck-Merkmalsvektoren ${{\vec{G}}_{i}}$
umgewandelt wird, die durch Zwei- und Dreikörperfunktionen beschrieben werden. Nachfolgend sind einige nicht einschränkende Beispiele für Fingerabdruckfunktionen aufgeführt:
$G_{i}^{l} = \sum_{j} f_{c} (R_{i j})$

$G_{i}^{3} = \sum_{j} c o s (κ R_{i j}) \cdot f_{c} (R_{i j})$

wobei η, κ, ζ und λ benutzerdefinierte Parameter von G-Fingerabdruck-Funktionen sind, wie in J. Behler: „Atom-centered Symmetry Functions for Constructing High-Dimensional Neural Network Potentials“, J. Chem. Phys., 134, 074106 (2011) beschrieben. Die Werte dieser Parameter werden typischerweise so gewählt, dass sie die für das betrachtete lokale Atomsystem relevanten Längenskalen angemessen abdecken (typischerweise innerhalb eines Cutoff-Radius R_c < 10 A). Die Cutoff-Funktion ∫_c ist abhängig von R_c und kann wie folgt definiert werden:
$f_{c} (R_{i j}) = {\begin{array}{l} 0,5 \cdot [cos (\frac{π R_{i j}}{R_{c}}) + 1] & {f \ddot{u} r R}_{i j} \leq R_{c} \\ 0 & {f \ddot{u} r R}_{i j} \leq R_{c} \end{array}$
Die Permutationsinvarianz gilt nur für Atome der gleichen Elemente. So beschreibt beispielsweise der Austausch eines C-Atoms an Position 1 und eines C-Atoms an Position 2 zwei Systeme mit der gleichen Physik, und entsprechend gilt die Permutationsinvarianz. Als weiteres Beispiel beschreibt der Austausch eines C-Atoms an Position 1 und eines O-Atoms an Position 2 zwei Systeme mit unterschiedlicher Physik, und die Permutationsinvarianz gilt nicht. Daher sollten bei der Untersuchung von Mehrelementesystemen die Summierungen in den obigen G- Funktionen nur für Atome mit den gleichen Elementen (für Zweikörper-G) oder gleichen Elementpaaren (für Dreikörper-G) vorgenommen werden. Bei einer gegebenen Anzahl m von Elementen in einem MD-System von Interesse, die ein Zentralatom i umgeben, werden m verschiedene G für jede parametrisierte 2-Körper-Funktion und m(m+1)/2 verschiedene G für jede parametrisierte Dreikörper-Funktion berechnet. Aufgrund der Konstruktion dieser Funktionen (einschließlich der Rotationsinvarianz) stellen diese Funktionen vorteilhafte Darstellungen zum Lernen der rotationsinvarianten Natur der Quantenmechanik. Ein maschinell lernendes System, das diese invarianten Merkmale verwendet, ist jedoch darauf beschränkt, das Vorhersagen von rotationsinvarianten Ausgängen, wie etwa Energie, zu verwenden.
Viele auf der Quantenmechanik basierende Methodiken (z.B. Dichtefunktionaltheorie) werden verwendet, um die Energie E eines Systems zu berechnen. Diese Methodiken können jedoch die elektronische Energie nicht bequem in Beiträge einzelner Atome aufteilen. Dementsprechend werden in einer oder mehreren Ausführungsformen ${{\vec{G}}_{i}}$
Merkmalsvektoren für jedes Atom in einem System berechnet und dann zum Trainieren oder Vorhersagen einer einzelnen skalaren Menge an Energie E verwendet, wie in 2 dargestellt. 2 zeigt ein schematisches Diagramm eines Neuronalnetz-Knotens eines NNFF-Energievorhersage-Schemas nach dem Behler-Parrinello-Ansatz aus dem Stand der Technik. Die Atomkoordinatenumgebungen R₁ bis R_N 202 werden jeweils als Eingänge des NNFF-Algorithmus 200 verwendet. Die Atomkoordinatenumgebungen R₁ bis R_N 202 werden zur Berechnung der Symmetriefunktionen G₁ bis G_N 204 verwendet. Jede Atomkoordinatenumgebung R₁ bis R_N 202 steht mit jeder Symmetriefunktion G₁ bis G_N 204 in Beziehung. Atomare NNs 206 werden unter Verwendung von Symmetriefunktionen G₁ bis G_N 204 trainiert, um die atomaren Energien 208 zu erhalten, die verwendet werden, um die Gesamtenergie E 210 zu erhalten.
Der NNFF-Ansatz für AIMD-Anwendungen leidet an einer oder mehreren Einschränkungen. So wird beispielsweise während eines Trainingszyklus jedes der atomaren NNs (typischerweise ein NN für jedes Element) für eine einzige Energiemenge E mit trainiert, die an das System von Interesse gebunden ist. Dementsprechend sind die NNs koabhängig, da sie jeweils zur Vorhersage eines einzelnen Energiewertes E mitverwendet werden müssen und nur für die Vorhersage des genauen MD-Systems, das in dem Trainingssatz verwendet wird, optimiert sind. Es gibt keine unabhängigen ${{\vec{R}}_{i}} \to E_{i}$
Muster, die für das Training verschiedener MD-Systeme, die lokale atomare Umgebungen ähnlich wie ${{\vec{R}}_{i}}$
enthalten, einbezogen werden können. Zweitens werden während der MD-Laufzeit (Kraftvorhersagezyklus) teure Berechnungen durchgeführt, um den Kraftvektor ${\vec{F}}_{i}$
auf Atom i zu berechnen. ${\vec{F}}_{i}$
ist die Ableitung der Gesamtsystemenergie E in Bezug auf die Verlagerung eines einzelnen Atoms ${\vec{R}}_{i} .$
Allerdings erfordert die Vorhersage von E, dass G für alle Atome in dem MD-System ${{\vec{G}}_{1}, {\vec{G}}_{2}, \dots, {\vec{G}}_{N}}$
bekannt ist. Folglich erfordert die Berechnung von ${\vec{F}}_{i}$
die Berechnung des Fingerabdruckvektors 3N mal, wie in der folgenden Gleichung dargestellt.
wobei α die kartesischen x-, y- und z-Achsen angibt, N die Gesamtzahl der Atome in dem MD-System ist und M_i die Gesamtzahl der Fingerabdruckfunktionen ist, die das Atom i beschreiben. Dementsprechend wächst die Berechnung von Kräften für alle N Atome in dem System mit O (N² ). In bestimmten Implementierungen können bestimmte Algorithmusmodifikationen die Anzahl von Fingerabdruckvektorberechnungen auf 3P mal reduzieren, wobei P die durchschnittliche Anzahl von Atomen in der lokalen atomaren Umgebung der Atome ist, wodurch das Rechenkostenausmaß auf O(N) reduziert wird. Dennoch erfordert diese Einschränkung $3 P {{\vec{G}}_{i}}$
Berechnungen für eine ${\vec{F}}_{i}$
Vorhersage (P kann zwischen 100 und 400 Atomen liegen, je nach gewählter R_c ), im Gegensatz zu einer ${{\vec{G}}_{i}}$
Berechnung in einer direkten ${\vec{F}}_{i}$
Vorhersage. Dementsprechend kann ein NNFF-Algorithmus mit direkter ${\vec{F}}_{i}$
Vorhersage die NNFF-basierten MD ${\vec{F}}_{i}$
Berechnungen um zwei (2) bis drei (3) Größenordnungen beschleunigen.
In einer oder mehreren Ausführungsformen wird ein Computersystem offenbart, das dazu konfiguriert ist, einen Algorithmus zur direkten Vorhersage quantenmechanischer atomarer Kräfte aus einer Molekularstruktur unter Verwendung eines neuronalen Netzes ohne Verwendung von Energieableitungen zu implementieren. In bestimmten Ausführungsformen kann dieser Algorithmus zwei (2) bis (3) Größenordnungen weniger rechenintensiv sein (z.B. weniger Rechenzeit eines Hochleistungsrechnersystems (High-Performance Computing(HPC) System)) im Vergleich zu bekannten NNFF-Algorithmen, die die Berechnung quantenmechanischer Energien erfordern.
Die Fähigkeit eines HPC-Systems, bestimmte Aufgaben durchzuführen, kann unter Verwendung von Bezugsgrößen quantifiziert werden, wie beispielsweise Anwendungsbezugsgrößen aus Rechencodes, wie sie in den Suiten SPEC HPC2002 und SPEC MPI2007 der Standard Performance Evaluation Corporation (www.spec.org/hpg) und im HPC-System-Erwerbsprozess der US National Science Foundation (NSF) dargestellt sind, die hiermit durch Bezugnahme in ihrer Gesamtheit aufgenommen sind.
In einer oder mehreren Ausführungsformen werden einfachere funktionale Formen klassischer molekularer Dynamikmodelle durch neuronale Netze ersetzt. Solche Netze können leicht auf der Grundlage eines mitgelieferten Datensatzes [Eingang, Ausgang] abgestimmt werden. Die lokale Umgebung von Atomen, die ein Atom i umgeben, kann verwendet werden, um die Kraft, die das Atom i erfährt, vorherzusagen. In einem üblichen NNFF-Modell wird das Zentrumsatom i verlagert und dann die Änderung des Energiebeitrags aus dem Atom i und allen anderen Atomen in der Nähe von i berechnet. Die numerische Ableitung der Gesamtsystemenergie im Vergleich zu der Verlagerung des Atoms i ist die atomare Kraft, die das Atom i erfährt. Dieser Ansatz ist zeitaufwendig, da die Änderung des Energiebeitrags von allen Atomen, die das Atom i umgeben, berechnet werden muss, um die Kraft zu berechnen. In einer oder mehreren Ausführungsformen sagen die hierin offenbarten Systeme direkt die Kraft auf das Atom i vorher. Dieses Rechensystem kann zwei (2) bis drei (3) Größenordnungen schneller sein als der Gesamtsystemansatz, da es nicht notwendig ist, zusätzliche Beiträge von anderen Atomen, die das Atom i umgeben, zu berechnen, während die erforderliche Genauigkeit beibehalten wird.
In einer Ausführungsform wird ein Berechnungsalgorithmus offenbart, der dazu konfiguriert ist, einen Kraftvektor auf einem Atom direkt vorherzusagen, indem er die lokale atomare Umgebung, die ein Zentrumsatom umgibt, analysiert. Ein neuronales Netz kann auf rotationsinvariante Merkmale einer lokalen atomaren Umgebung trainiert werden. Das trainierte neuronale Netz ist dazu konfiguriert, die atomaren Kräfte innerhalb einer MD-Simulation vorherzusagen. In einer oder mehreren Ausführungsformen können rotationsinvariante Merkmale eingerichtet sein, um eine relativ geringe Anzahl von rotationsinvarianten Zwischenzuständen vorherzusagen. Anschließend kann diesen rotationsinvarianten Zwischenzuständen eine Anzahl von rotationskovarianten Merkmalen hinzugefügt werden, die dann in einem späteren Teil des neuronalen Netzes zur Vorhersage von Kraftvektorwerten verwendet werden können. Die Kraftvektorwerte stellen einen rotationskovarianten Ausgang dar.
In einer Ausführungsform können, da dieser Berechnungsalgorithmus eine direkte ${{\vec{R}}_{i}} \to {\vec{F}}_{i}$
Vorhersage für jedes Trainingsmuster ermöglicht (im Gegensatz zur E-Vorhersage, die die Kenntnis aller ${{\vec{R}}_{i}}$
Datenmuster im Simulationsrahmen erfordert), ${{\vec{R}}_{i}} \to {\vec{F}}_{i}$
Muster aus verschiedenen Sätzen von Systemen oder Materialien für das Kraftfeldtraining und/oder die Kraftfeldentwicklung kombiniert werden. So kann etwa der Berechnungsalgorithmus einer oder mehrerer Ausführungsformen verwendet werden, um ein Kraftfeld für ein großes atomares System der Schnittstelle zwischen den Materialien A und B zu entwickeln. Unter Verwendung dieses Algorithmus kann ein Trainingssatz durch Kombination separater kleinerer Strukturen von Material A, Material B und der Schnittstelle zwischen Materia A und B erstellt werden. Dieser Trainingssatz kann nicht unter Verwendung eines Algorithmus erstellt werden, der eine E-Vorhersage als Teil der Routine erfordert, da die E des kombinierten großen atomistischen Systems aus rechnerischer Sicht zu teuer ist, um aus quantenmechanischer Sicht berechnet zu werden.
Der Berechnungsalgorithmus einer oder mehrerer Ausführungsformen kann in eine MD-Simulationsfunktionseinheit integriert werden, um eine MD-Simulation mit einer Genauigkeit durchzuführen, die der einer erheblich teureren AIMD-Methode nahe kommt. So kann beispielsweise die MD-Simulation einer oder mehrerer Ausführungsformen nützlich sein, um die Atom/Ionen-Dynamik und chemische Reaktionen zu modellieren, die für Funktionsmaterialien, die in Brennstoffzellen, Wasserentsalzung, Katalyse, Beschichtungen und Batterien verwendet werden, relevant sind.
In einer oder mehreren Ausführungsformen ist der Vorhersagealgorithmus für atomare Kraft einer oder mehrerer Ausführungsformen in MD-Software integriert. Ein nicht einschränkendes Beispiel für eine geeignete MD-Software ist der Large-scale Atomic/Molecular Massively Parallel Simulator (LAMMPS). LAMMPS ist erhältlich bei Sandia National Laboratories in Albuquerque, New Mexico. LAMMPS verwendet ein Message Passing Interface (MPI) für die parallele Kommunikation. LAMMPS ist eine Open-Source-Software, die unter den Bedingungen von GNU General Public License vertrieben wird.

Ein Hauptprinzip dieses Algorithmus zur Ermöglichung direkter Kraftvorhersage ist eine Definition eines Satzes von k internen Achsen

{{\vec{A}}_{i}} = {\vec{A_{i,1}}, \vec{A_{i,2}}, \dots, \vec{A_{i, k}}}

für jede Atomkoordinatenumgebung

{{\vec{R}}_{i}}

, die sich mit der lokalen atomaren Umgebungsstruktur dreht (rotationskovariante Vektoren), und projiziert dann den rotationskovarianten Kraftvektor

{\vec{F}}_{i}

auf

{{\vec{A}}_{i}},

um den internen Kraftvektor

{\vec{F}}_{i n t, i}

zu erhalten. Da

{\vec{F}}_{i n t, i}

später zurück auf die kartesische Koordinate projiziert wird, ist k eine feste Anzahl und ist größer oder gleich 3. Obwohl sowohl

{{\vec{A}}_{i}}

als auch

{\vec{F}}_{i}

rotationskovariant sind, sind diese Vektoren gebundene Vektoren in Bezug auf die lokale atomare Struktur selbst (beide Vektoren drehen sich mit der Struktur). Dementsprechend dreht eine Rotationstransformation T̂ ∈ S0(3) der Atompositionen

\begin{matrix} {{\vec{R}}_{i}} \to \hat{T} {{\vec{R}}_{i}} & {\vec{F}}_{i} \end{matrix} \to \hat{T} {\vec{F}}_{i} and {{\vec{A}}_{i}} \to \hat{T} {{\vec{A}}_{i}}

entsprechend. Folglich ist der interne Proj ektionsvektor

{\vec{F}}_{i n t, i}

rotationsinvariant. In einer oder mehreren Ausführungsformen wird der rotationsinvariante Merkmalsvektor

{\vec{G_{l}}}

dazu verwendet, den rotationsinvarianten Zwischenzustand

{\vec{F}}_{i n t, i}

vorherzusagen. Der rotationsinvariante

{\vec{F}}_{i n t, i}

und der rotationskovariante

{\vec{A_{l}}}

werden verwendet, um eine inverse Projektion durchzuführen und die rotationskovariante kartesische Zentralatoms-Ausgangskraft

\vec{F_{l}}

zu erhalten. Eine Übersicht über die invarianten und kovarianten Vektor-Notationen ist in der nachfolgenden Tabelle 1 dargestellt. Tabelle 1

Beschreibung	Vektor	Unter Rotation T̂ ∈ S0(3)
Kartesische Position der atomaren Umgebung, die das Atom i (aus N) umgibt	${\vec{R_{l}}}$	$\hat{T} {\vec{R_{l}}}$
Interne Achsenanzahl k (von mindestens 3)	${\vec{A_{l}}}$	$\hat{T} {\vec{A_{l}}}$
Kartesische Kraft des Atoms i (aus N)	$\vec{F_{l}}$	$\hat{T} \vec{F_{l}}$
Projektion der Kraft des Atoms i (aus N) auf die interne Achsanzahl k (aus mindestens 3)	$F_{i n t, i, k} = {\vec{F}}_{i n t, i} \cdot \vec{A_{l, k}}$	Unverändert
Liste der am Atom zentrierten Fingerabdrücke	${\vec{G_{l}}}$	Unverändert

Es wird ein Satz von internen Achsen ${\vec{A_{l}}} = {\vec{A_{l,1}}, \vec{A_{l,2}}, \dots, \vec{A_{l, k}}}$
definiert, wobei k eine Gruppe von mindestens einigen der Atome angibt, die das Zentralatom i umgeben. Das Kriterium, ob ein Atom j als Teil der Gruppe k betrachtet wird oder nicht, ist benutzerdefiniert und kann abhängig von dem betrachteten MD-System weiter optimiert werden. Nachdem dieses Atomgruppierungskriterium bestimmt wurde, wird die Einschränkung, dass $\vec{A_{l, k}}$
der gewichtete Mittelwert aller relativen Positionsvektoren der Atome in der Gruppe relativ zu dem Zentralatom i sein sollte, angewendet. Diese Einschränkung kann mathematisch wie folgt dargestellt werden:
$\vec{V_{i, k}} = \sum_{j \in k} f_{A, k} (R_{i j}) \cdot \vec{R_{i j}} \cdot f_{c} (R_{i j})$
$\vec{A_{i, k}} = {\begin{matrix} 0 & f \ddot{u} r \vec{V_{i, k}} = 0 \\ \vec{V_{i, k}} / | \vec{V_{i, k}} | & anderweiting \end{matrix}$
$f_{c} (R_{i j}) = {\begin{array}{l} 0,5 \cdot [cos (\frac{π R_{i j}}{R_{c}}) + 1] & f \ddot{u} r R_{i j} \leq f \ddot{u} r R_{i j} \\ 0 & f \ddot{u} r R_{i j} > R_{c} \end{array},$
wobei f_A,k eine Achsfunktion wie hierin beschrieben ist. In einer oder mehreren Ausführungsformen wird der gleiche R_c für die $\vec{A_{l, k}}$
Berechnung wie bei der ${\vec{G_{l}}}$
Berechnung eingestellt. In anderen Ausführungsformen werden stabilere $\vec{A_{l, k}}$
Vektoren in Bezug auf die Variation lokaler Atomkoordinaten eingestellt, da $\vec{A_{l, k}}$
nur für Referenzachsen der Vektorprojektion verwendet werden. Die folgenden g_A parametrisierten funktionalen Formen werden anstelle von f_A,k für das Polyethylenoxid (PEO) - Polymer (C₂H₄O)_n verwendet: $\begin{array}{l} g_{A}^{1} (R_{i j}) = e^{η R_{i j}^{2}}, & η = 1.0 \\ g_{A}^{2} (R_{i j}) = e^{- η {(R_{i j} - R_{s})}^{2}}, & η = 2,0, R_{s} = 1.0 \end{array}$

Im Beispiel einer NNFF-Entwicklung für PEO sind die Gruppierungskriterien nachfolgend in Tabelle 2 umrissen: Tabelle 2

k	Kriterium für die Atom-j-Inklusion in Gruppe k	Parametrisierte Funktion für f _A,k
1	j ist von Atomelement C	$g_{A}^{1}$
2	j ist von Atomelement H	$g_{A}^{1}$
3	j ist von Atomelement O	$g_{A}^{1}$
4	j ist von Atomelement C	$\bar{\underline{g_{A}^{2}}}$
5	j ist von Atomelement H	$\bar{\underline{g_{A}^{2}}}$
6	j ist von Atomelement O	$\bar{\underline{g_{A}^{2}}}$

Sobald die Art und Weise zum Berechnen von ${\vec{A_{l}}}$
aus ${\vec{R_{l}}}$
definiert ist, wird $\vec{F_{l}}$
(unter Verwendung von Quantenmechanik) auf ${\vec{A_{l}}}$
projiziert, um einen internen Kraftprojektionssatz ${\vec{F}}_{i n t, i}$
zu finden. Da sowohl ${\vec{G_{l}}}$
als auch ${\vec{F}}_{i n t, i}$
rotationsinvariant sind, kann ein erstes neuronales Netz (NN1) trainiert werden, um die ${\vec{G_{l}}} \to {\vec{F}}_{i n t, i}$
Vorhersage direkt durchzuführen. Als nächster Schritt wird eine inverse Projektion von der inneren Kraft ${\vec{F}}_{i n t, i}$
zurück auf die kartesische atomare Kraft $\vec{F_{l}}$
durchgeführt. In einer Ausführungsform, da die Beziehung ${\vec{F}}_{i n t, i} = {\vec{A_{l}}} \vec{F_{l}}$
gilt, wird die inverse Projektion unter Verwendung einer pseudoinversen Matrixbeziehung durchgeführt, um die Lösung mit dem kleinsten Fehlerquadrat zu finden: $\vec{F_{l}} = {({\vec{A_{l}}}^{T} {\vec{A_{l}}})}^{- 1} {\vec{A_{l}}} {\vec{F}}_{i n t, i}$
. In der Praxis führt dies möglicherweise nicht zu geeigneten Ergebnissen, da der Satz interner Achsen ${\vec{A_{l}}}$
möglicherweise nicht als orthogonale (oder nahezu orthogonale) Basis für den gesamten 3D-xyz-Raum eingeschränkt ist. Dementsprechend können, wenn sich die Basisvektoren überlappen, kleine Mengen an Rauschen (sei es durch Fehler oder durch Störungen von Atomkoordinaten) zu numerischen Instabilitäten führen. Dies ist zwar kein Problem, wenn es null Fehler in der ${\vec{F}}_{i n t, i}$
Vorhersage gibt, aber jeglicher Fehler in der ${\vec{F}}_{i n t, i}$
Vorhersage durch NN1 kann während der $\vec{F_{l}}$
Berechnung durch das pseudoinverse Verfahren um mehrere Größenordnungen verstärkt werden. Dies macht in einer oder mehreren Ausführungsformen das Matrixverfahren des kleinsten Fehlerquadrats oder das Pseudoinversionsverfahren ungeeignet für die umgekehrte Projektion des Kraftvektors.
Ein zweites, kleineres neuronales Netz (NN2) kann dazu trainiert werden, das Problem der inversen Projektion zu lösen. ${\vec{F}}_{i n t, i} und {\vec{A_{l}}}$
werden als Eingänge für NN2 verwendet und NN2 sagt $\vec{F_{l}}$
als Ausgang vorher. In einer oder mehreren Ausführungsformen berücksichtigt NN2 einen gewissen Grad an Rotationssymmetrie, indem es eine Datenvergrößerung durchführt. In einer oder mehreren Ausführungsformen werden nicht nur $({\vec{F}}_{i n t, i}, {\vec{A_{l}}}) \to \vec{F_{l}}$
sondern auch $({\vec{F}}_{i n t, i}, \hat{T} {\vec{A_{l}}}) \to \hat{T} \vec{F_{l}}$
als Teil der Trainingsmuster verwendet, wobei T̂ eine zufällige 3D-Rotationsmatrix ist (viele verschiedene T̂ können zur NN2-Datenvergrößerung verwendet werden).
Im nächsten Schritt können NN1 und NN2 zu einem einzigen neuronalen Netz kombiniert werden, indem die Gewichtungen und Verzerrungen von NN1 und NN2 in eine kombinierte NN-Architektur mit Knotenabmessungen identisch zu NN1 und NN2 übertragen werden (Transferlernen). Fehler des kombinierten NN können reduziert und/oder minimiert werden, indem eine kleinere Anzahl von Trainingszyklen in dem kombinierten Netz unter Verwendung des $({\vec{G_{l}}}, {\vec{A_{l}}}) \to \vec{F_{l}}$
Trainingsdatensatzes ausgeführt wird.
Die Modifikationen an einem NNFF-Algorithmus, die oben in einer oder mehreren Ausführungsformen identifiziert wurden, ermöglichen eine Vereinfachung der Kraftvorhersage, wobei rotationsinvariante und rotationskovariante Merkmale verwendet werden, um eine direkte Vorhersage der atomaren Kraft auf Atom $i (\vec{F_{l}})$
zu ermöglichen, wenn nur die Koordinaten der lokalen atomaren Umgebung ${\vec{R_{l}}}$
und die das Atom i umgebenden Elemente gegeben sind. 3 zeigt ein Neuronalnetzknoten-Prinzip eines NNFF-Algorithmus 300 gemäß einer Ausführungsform. Atomkoordinatenumgebungen R₁ bis R_N werden als Eingänge 302a bis 302n des NNFF-Algorithmus 300 verwendet. Atomkoordinatenumgebungen R₁ bis R_N werden zur Berechnung der Symmetriefunktionen G₁ bis G_N (in 3 als Symmetriefunktionen 304a bis 304n bezeichnet) und der Achsenfunktionen A₁ bis A_N (in 3 als Symmetriefunktionen 306a bis 306n bezeichnet) verwendet. Das erste Neuronalnetz NN1 (in 3 als 308 bezeichnet) wird unter Verwendung der Symmetriefunktionen G₁ bis G_N trainiert, um die internen Kraftvektoren F_int,1 bis F_int,N (in 3 als 310a bis 310n bezeichnet) zu erhalten. Die Achsfunktionen A₁ bis AN und die internen Kraftvektoren F_int,1 bis F_int,N werden zum Trainieren des zweiten neuronalen Netzes NN2 verwendet (siehe 312 in 3). Der Ausgang des NNFF-Algorithmus 300 sind die atomaren Kräfte F₁ bis F_N (in 3 als 314a bis 314n bezeichnet) im kartesischen Koordinatensystem. In einer oder mehreren Ausführungsformen weist der NNFF-Algorithmus 300 der 3 keine Abhängigkeit zwischen den ${\vec{R_{l}}}$
Trainingsmusterdaten untereinander auf. Dementsprechend kann eine direkte ${\vec{R_{l}}} \to \vec{F_{l}}$
Vorhersage durchgeführt werden, was die Rechengeschwindigkeit der Kraftvorhersage deutlich verbessert.
In einem Beispiel wird eine Massenversion von Polyethylenoxid (PEO)-Polymer, wie unten gezeigt, verwendet, um einen Trainingssatz von H-Atomen von PEO unter Verwendung des Fingerabdrucks ${\vec{G_{l}}} zur \vec{F_{l}}$
Vorhersage zu erzeugen.
4 ist ein Schaubild 400 von $| \vec{F_{l}} |$
402, vorhergesagt unter Verwendung eines NNFF-Algorithmus einer Ausführungsform, im Vergleich zu $| \vec{F_{l}} |$
404, berechnet unter Verwendung einer quantenmechanischen Dichtefunktionaltheorie-Simulation (DFT-Simulation). Das Schaubild 400 zeigt die Kräfte auf den H-Atomen für PEO unter Verwendung der beiden verschiedenen Ansätze. Der Fehler zwischen dem NNFF-Algorithmus und der quantenmechanischen DFT-Simulation kann als $F e h l e r = {(| {\vec{F}}_{i, N N} | - | {\vec{F}}_{i, Q M} |)}^{2}$

ausgedrückt werden. Unter Verwendung dieses Ausdrucks beträgt der durchschnittliche Fehler 0,01 (eV/A)², was in einem akzeptablen Bereich liegt. In diesem Beispiel wurden während des Trainingszyklus kein Muster aus dem Testsatz gesehen.
5A zeigt ein Diagramm 500 eines Fingerabdruck-Neuronalnetzes (NN) 502 eines NNFF-Algorithmus einer Ausführungsform. Die rotationsinvariante Komponente 504 des Fingerabdruck-NN entspricht einer Vorhersage des Zwischenzustands der internen Kraftprojektion ${\vec{F}}_{i n t, i}$
506. Die 5B, 5C und 5D stellen die Schaubilder 508, 510 bzw. 512 dar, die Ergebnisse für die Vorhersage von H-, C- bzw. O-Atomen in dem Testsatz von atomaren Momentaufnahmen, entnommen aus Massen-PEO, unter Verwendung des NNFF-Algorithmus einer Ausführungsform zeigen. Unter Verwendung der vorstehend dargelegten Fehlergleichung beträgt der Fehler zwischen dem NNFF-Algorithmus und der Quantenmechanik-DFT-Simulation 0,01 (eV/A)2, 0,04 (eV/A)2und 0,16 (eV/A)2 für die Vorhersage von H-, C- bzw. O-Atomen, was in einem akzeptablen Bereich liegt. In diesen Beispielen wurden während des Trainingszyklus keine Proben aus dem Testsatz gesehen.
6A zeigt das Diagramm 600 des Fingerabdruck-NN 602 und des Inversionsprojektions-NN 604 kombiniert, um ein kombiniertes NN 606 in einem NNFF-Algorithmus einer Ausführungsform zu produzieren. Gemäß einer oder mehreren Ausführungsformen werden Gewichtungen der NN 602 und 604 übertragen und das kombinierte NN 606 erneut trainiert. Das Fingerabdruck-NN 602 ist eine rotationsinvariante Komponente des NNFF-Algorithmus und das Inversionsprojektions-NN 604 ist eine rotationskovariante Komponente des NNFF-Algorithmus. Das kombinierte NN 606 sagt die kartesische atomare Kraft $\vec{F_{l}}$
vorher. Die 6B, 6C und 6D stellen die Schaubilder 608, 610 bzw. 612 dar, die Ergebnisse für die Vorhersage von H-, C- bzw. O-Atomen in dem Testsatz von atomaren Momentaufnahmen, entnommen aus Massen-PEO, unter Verwendung des NNFF-Algorithmus einer Ausführungsform zeigen. ${\vec{F}}_{i, x | y | z}$
bezeichnet die Projektion von $\vec{F_{l}}$
auf die kartesische x-, y- und z-Achse. Unter Verwendung der vorstehend dargelegten Fehlergleichung beträgt der Fehler zwischen dem NNFF-Algorithmus und der Quantenmechanik-DFT-Simulation 0,03 (eV/A)2, 0,58 (eV/A)2und 0,42 (eV/A)2 für die Vorhersage von H-, C- bzw. O-Atomen, was in einem akzeptablen Bereich liegt. In diesen Beispielen wurden während des Trainingszyklus keine Proben aus dem Testsatz gesehen.
Die NNFF-Algorithmen und/oder -Methodiken einer oder mehrerer Ausführungsformen werden unter Verwendung einer Rechenplattform, wie beispielsweise der in 7 dargestellten Rechenplattform 700, implementiert. Die Rechenplattform 700 kann einen Prozessor 702, einen Speicher 704 und einen nichtflüchtigen Speicher 706 umfassen. Der Prozessor 702 kann eine oder mehrere Vorrichtungen umfassen, die ausgewählt sind aus Hochleistungsrechnersystemen (HPC-Systemen), einschließlich Hochleistungskernen, Mikroprozessoren, Mikrocontrollern, Digitalsignalprozessoren, Mikrocomputern, Zentraleinheiten, feldprogrammierbaren Gate-Arrays, programmierbaren Logikvorrichtungen, Zustandsmaschinen, Logikschaltungen, analogen Schaltungen, digitalen Schaltungen oder irgendwelcher anderer Vorrichtungen, die Signale (analog oder digital) basierend auf computerausführbaren Anweisungen, die sich im Speicher 704 befinden, manipulieren. Der Speicher 704 kann eine einzelne Speichervorrichtung oder eine Anzahl von Speichervorrichtungen umfassen, einschließlich u.a. Direktzugriffsspeicher (RAM), flüchtigem Speicher, nichtflüchtigem Speicher, statischem Direktzugriffsspeicher (SRAM), dynamischem Direktzugriffsspeicher (DRAM), Flash-Speicher, Cache-Speicher oder irgendeine andere Vorrichtung, die Informationen speichern kann. Der nichtflüchtige Speicher 706 kann eine oder mehrere persistente Datenspeichervorrichtungen, wie etwa eine Festplatte, ein optisches Laufwerk, ein Bandlaufwerk, eine nichtflüchtige Festkörper-Vorrichtung, einen Cloud-Speicher oder irgendeine andere Vorrichtung, die zum persistenten Speichern von Informationen in der Lage ist, umfassen.
Der Prozessor 702 kann dazu konfiguriert sein, in dem Speicher 704 zu lesen und computerausführbare Anweisungen, die sich im NNFF-Softwaremodul 708 des nichtflüchtigen Speichers 706 befinden, auszuführen und NNFF-Algorithmen und/oder Methodiken einer oder mehrerer Ausführungsformen umsetzen. Der Prozessor 702 kann ferner dazu konfiguriert sein, in dem Speicher 704 zu lesen und computerausführbare Anweisungen auszuführen, die sich im MD-Softwaremodul 710 (wie etwa LAMMPS) des nichtflüchtigen Speichers 706 befinden, und MD-Algorithmen und/oder -Methodiken umzusetzen. Die Softwaremodule 708 und 710 können Betriebssysteme und Anwendungen umfassen. Die Softwaremodule 708 und 710 können aus Computerprogrammen zusammengestellt oder interpretiert werden, die unter Verwendung einer Vielzahl von Programmiersprachen und/oder Technologien erstellt wurden, einschließlich u.a. und entweder allein oder in Kombination, Java, C, C++, C#, Objective C, Fortran, Pascal, Java Script, Python, Perl und PL/SQL.
Bei der Ausführung durch den Prozessor 702 können die computerausführbaren Anweisungen des NNFF-Softwaremoduls 708 und des MD-Softwaremoduls 710 die Rechenplattform 700 veranlassen, einen oder mehrere der hierin offenbarten NNFF-Algorithmen und/oder -Methodiken und MD-Algorithmen und/oder -Methodiken zu implementieren. Der nichtflüchtige Speicher 706 kann auch NNFF-Daten 712 und MD-Daten 714 umfassen, die die Funktionen, Merkmale und Prozesse der einen oder mehreren hierin beschriebenen Ausführungsformen unterstützen.
Der Programmcode, der die hierin beschriebenen Algorithmen und/oder Methodiken verkörpert, kann einzeln oder kollektiv als Programmprodukt in einer Vielzahl von unterschiedlichen Formen verteilt werden. Der Programmcode kann unter Verwendung eines computerlesbaren Speichermediums mit darauf befindlichen computerlesbaren Programmanweisungen zum Veranlassen eines Prozessors, Aspekte einer oder mehrerer Ausführungsformen auszuführen, verteilt werden. Computerlesbare Speichermedien, die von Natur aus nichtvergänglich sind, können flüchtige und nichtflüchtige sowie entfernbare und nicht entfernbare greifbare Medien umfassen, die in irgendeinem Verfahren oder irgendeiner Technologie zur Speicherung von Informationen, wie etwa computerlesbare Anweisungen, Datenstrukturen, Programmmodule oder andere Daten implementiert sind. Computerlesbare Speichermedien können ferner Folgendes umfassen: RAM, ROM, löschbare programmierbare Nur-Lese-Speicher (EPROM), elektrisch löschbare programmierbare Nur-Lese-Speicher (EEPROM), Flash-Speicher oder andere Festkörperspeichertechnologie, eine tragbare CD-ROM (Compact Disc Read-Only Memory) oder andere optische Speicher, Magnetkassetten, Magnetbänder, Magnetplattenspeicher oder andere magnetische Speichervorrichtungen oder jegliches andere Medium, das zum Speichern der gewünschten Informationen verwendet werden kann und das von einem Computer gelesen werden kann. Computerlesbare Programmanweisungen können von einem computerlesbaren Speichermedium auf einen Computer, eine andere Art von programmierbarem Datenverarbeitungsgerät oder eine andere Vorrichtung heruntergeladen werden oder über ein Netzwerk auf einen externen Computer oder eine externe Speichervorrichtung.
Computerlesbare Programmanweisungen, die auf einem computerlesbaren Medium gespeichert sind, können verwendet werden, um einen Computer, andere Arten von programmierbaren Datenverarbeitungsvorrichtungen oder andere Vorrichtungen anzuweisen, auf eine bestimmte Weise zu funktionieren, so dass die in dem computerlesbaren Medium gespeicherten Anweisungen einen Herstellungsartikel produzieren, der Anweisungen umfasst, die die in den Flussdiagrammen oder Diagrammen spezifizierten Funktionen, Handlungen und/oder Operationen ausführen. In bestimmten alternativen Ausführungsformen können die in den Flussdiagrammen und Diagrammen spezifizierten Funktionen, Handlungen und/oder Operationen neu geordnet, seriell verarbeitet und/oder gleichzeitig in Übereinstimmung mit einer oder mehreren Ausführungsformen verarbeitet werden. Darüber hinaus kann jedes der Flussdiagramme und/oder Diagramme mehr oder weniger Knoten oder Blöcke enthalten, als die dargestellten, die mit einer oder mehreren Ausführungsformen übereinstimmen.
Obwohl die gesamte Erfindung durch eine Beschreibung verschiedener Ausführungsformen veranschaulicht wurde und diese Ausführungsformen im Detail beschrieben wurden, ist es nicht die Absicht des Anmelders, den Schutzbereich der beigefügten Ansprüche auf diese Details zu beschränken oder in irgendeiner Weise zu begrenzen. Zusätzliche Vorteile und Modifikationen werden für den Fachmann leicht ersichtlich. Die Erfindung in ihren breiteren Aspekten beschränkt sich daher nicht nur auf die spezifischen Details, die repräsentativen Vorrichtungen und Verfahren sowie veranschaulichende Beispiele, die gezeigt und beschrieben werden. Dementsprechend können Abweichungen von diesen Details vorgenommen werden, ohne das vom Wesen oder Schutzbereich des allgemeinen erfinderischen Konzepts abgewichen wird.
ZITATE ENTHALTEN IN DER BESCHREIBUNG
Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
Zitierte Nicht-Patentliteratur

J. Behler und M. Parrinello, „Generalized Neural-Network Representation of High-Dimensional Potential-Energy Surfaces“, Phys. Rev. Lett. 98, 146401 (2007) [0015]
M. Gastegger, J. Behler und P. Marquetand, „Machine Learning Molecular Dynamics for Simulation of Infrared Spectra“, Chem. Sci. 2017, 8, 6924 [0015]
J. Behler, „Atom-centered Symmetry Functions for Constructing High-Dimensional Neural Network Potentials“, J. Chem. Phys., 134, 074106 (2011) [0015]

Claims

Berechnungsverfahren zum Simulieren der Bewegung von Elementen innerhalb eines Mehrelementesystems unter Verwendung eines Neuronalnetz-Kraftfeldes (NNFF), wobei das Verfahren Folgendes umfasst: Empfangen einer Kombination aus einer Anzahl von rotationsinvarianten Merkmalen und einer Anzahl von rotationskovarianten Merkmalen einer lokalen Umgebung des Mehrelementesystems; und Vorhersagen eines Kraftvektors für jedes Element innerhalb des Mehrelementesystems basierend auf der Kombination aus der Anzahl von rotationsinvarianten Merkmalen und der Anzahl von rotationskovarianten Merkmalen und des NNFF, um eine simulierte Bewegung der Elemente innerhalb des Mehrelementesystems zu erhalten.
Berechnungsverfahren gemäß Anspruch 1, ferner umfassend das Trainieren eines ersten neuronalen Netzes (NN1) basierend auf der Anzahl von rotationsinvarianten Merkmalen, um eine Anzahl von rotationsinvarianten Zwischenzuständen vorherzusagen.
Berechnungsverfahren gemäß Anspruch 2, ferner umfassend das Trainieren eines zweiten neuronalen Netzes (NN2) basierend auf der Anzahl von rotationsinvarianten Zwischenzuständen und der Anzahl von rotationskovarianten Merkmalen, um eine Anzahl von rotationskovarianten Ausgängen vorherzusagen.
Berechnungsverfahren gemäß Anspruch 3, ferner umfassend das Konzentrieren von NN1 und NN2 in einem dritten neuronalen Netz (NN3), das verwendet wird, um die simulierte Bewegung der Elemente innerhalb des Mehrelementesystems zu erhalten.
Berechnungsverfahren gemäß Anspruch 4, wobei das Mehrelementesystem ein Materialsystem ist, die Elemente Atome innerhalb des Materialsystems sind und die lokale Umgebung eine atomare lokale Umgebung ist.
Berechnungsverfahren gemäß Anspruch 5, wobei die Anzahl von rotationskovarianten Merkmalen einen Satz interner Achsen ${\vec{A_{l}}}$
umfasst.
Berechnungsverfahren gemäß Anspruch 6, wobei die Anzahl von rotationsinvarianten Zwischenzuständen eine Skalarprojektion einer atomaren Kraft, die von einem Zentrumsatom $i (\vec{F_{l}})$
erfahren wird, auf den Satz interner Achsen ${\vec{A_{l}}}$
umfasst.
Berechnungsverfahren gemäß Anspruch 7, wobei die Anzahl von rotationskovarianten Ausgängen einen Satz kartesischer Komponenten der atomaren Kraft, die von dem Zentrumsatom $i (\vec{F_{l}})$
erfahren wird, umfasst.
Berechnungsverfahren gemäß Anspruch 1, wobei die Anzahl von rotationsinvarianten Merkmalen einen oder mehrere Fingerabdruck-Merkmalsvektoren vom Typ Behler-Parrinello umfasst.
Berechnungsverfahren gemäß Anspruch 1, wobei das Mehrelementesystem ein Abschnitt eines der folgenden Systeme ist: Brennstoffzelle, Wasserentsalzung, Katalyse, Beschichtung und Batterie.
Nichtvergängliches, computerlesbares Medium, das computerlesbare Anweisungen für ein Softwareprogramm greifbar verkörpert, wobei das Softwareprogramm durch einen Prozessor einer Rechenvorrichtung ausführbar ist, um Operationen bereitzustellen, die Folgendes umfassen: Empfangen einer Kombination aus einer Anzahl von rotationsinvarianten Merkmalen und einer Anzahl von rotationskovarianten Merkmalen einer lokalen Umgebung eines Mehrelementesystems, das Elemente aufweist; und Vorhersagen eines Kraftvektors für jedes Element innerhalb des Mehrelementesystems basierend auf der Kombination aus der Anzahl von rotationsinvarianten Merkmalen und der Anzahl von rotationskovarianten Merkmalen und eines Neuronalnetz-Kraftfeldes (NNFF), um eine simulierte Bewegung der Elemente innerhalb des Mehrelementesystems zu erhalten.
Nichtvergängliches, computerlesbares Medium gemäß Anspruch 11, wobei das Softwareprogramm durch den Prozessor der Rechenvorrichtung ausführbar ist, um den weiteren Betrieb des Trainierens eines ersten neuronalen Netzes (NN1) basierend auf der Anzahl von rotationsinvarianten Merkmalen bereitzustellen, um eine Anzahl von rotationsinvarianten Zwischenzuständen vorherzusagen.
Nichtvergängliches, computerlesbares Medium gemäß Anspruch 12, wobei das Softwareprogramm durch den Prozessor der Rechenvorrichtung ausführbar ist, um den weiteren Betrieb des Trainierens eines zweiten neuronalen Netzes (NN2) basierend auf der Anzahl von rotationsinvarianten Zwischenzuständen und der Anzahl von rotationskovarianten Merkmalen bereitzustellen, um eine Anzahl von rotationskovarianten Ausgängen vorherzusagen.
Nichtvergängliches, computerlesbares Medium gemäß Anspruch 13, wobei das Softwareprogramm durch den Prozessor der Rechenvorrichtung ausführbar ist, um den weiteren Betrieb des Konzentrierens von NN1 und NN2 in einem dritten neuronalen Netz (NN3) bereitzustellen, das verwendet wird, um die simulierte Bewegung der Elemente innerhalb des Mehrelementesystems zu erhalten.
Nichtvergängliches, computerlesbares Medium gemäß Anspruch 11, wobei die Anzahl von rotationsinvarianten Merkmalen einen oder mehrere Fingerabdruck-Merkmalsvektoren vom Typ Behler-Parrinello umfasst.
Computersystem zum Simulieren der Bewegung von Elementen innerhalb eines Mehrelementesystems unter Verwendung eines Neuronalnetz-Kraftfeldes (NNFF), das einen Simulationscomputer enthält, der einen Prozessor zum Ausführen von computerlesbaren Anweisungen und einen Speicher zum Beibehalten der computerausführbaren Anweisungen aufweist, wobei die computerausführbaren Anweisungen, wenn sie durch den Prozessor ausgeführt werden, die folgenden Funktionen durchführen: Empfangen einer Kombination aus einer Anzahl von rotationsinvarianten Merkmalen und einer Anzahl von rotationskovarianten Merkmalen einer lokalen Umgebung des Mehrelementesystems, das Elemente aufweist; und Vorhersagen eines Kraftvektors für jedes Element innerhalb des Mehrelementesystems basierend auf der Kombination aus der Anzahl von rotationsinvarianten Merkmalen und der Anzahl von rotationskovarianten Merkmalen und des NNFF, um eine simulierte Bewegung der Elemente innerhalb des Mehrelementesystems zu erhalten.
Computersystem gemäß Anspruch 16, wobei die computerausführbaren Anweisungen, wenn sie durch den Prozessor ausgeführt werden, die weitere Funktion des Trainierens eines ersten neuronalen Netzes (NN1) basierend auf der Anzahl von rotationsinvarianten Merkmalen durchführen, um eine Anzahl von rotationsinvarianten Zwischenzuständen vorherzusagen.
Computersystem gemäß Anspruch 17, wobei die computerausführbaren Anweisungen, wenn sie durch den Prozessor ausgeführt werden, die weitere Funktion des Trainierens eines zweiten neuronalen Netzes (NN2) basierend auf der Anzahl von rotationsinvarianten Zwischenzuständen und der Anzahl von rotationskovarianten Merkmalen durchführen, um eine Anzahl von rotationskovarianten Ausgängen vorherzusagen.
Computersystem gemäß Anspruch 18, wobei die computerausführbaren Anweisungen, wenn sie durch den Prozessor ausgeführt werden, die weitere Funktion des Konzentrierens von NN1 und NN2 in einem dritten neuronalen Netz (NN3) durchführen, das verwendet wird, um die simulierte Bewegung der Elemente innerhalb des Mehrelementesystems zu erhalten.
Computersystem gemäß Anspruch 16, wobei die Anzahl von rotationsinvarianten Merkmalen einen oder mehrere Fingerabdruck-Merkmalsvektoren vom Typ Behler-Parrinello umfasst.