WO2020099080A1

WO2020099080A1 - Verfahren und vorrichtung zur umsetzung einer matrix-operation

Info

Publication number: WO2020099080A1
Application number: PCT/EP2019/078869
Authority: WO
Inventors: Tobias Kirchner
Original assignee: Robert Bosch Gmbh
Priority date: 2018-11-13
Filing date: 2019-10-23
Publication date: 2020-05-22
Also published as: US20210382961A1; DE102018219313A1; CN112955863A

Abstract

Verfahren zur Umsetzung einer Matrix-Operation wobei für die Matrix-Operation ein erstes digitales Ergebnis abhängig von einer ersten analogen Addition mittels einer ersten Memristor-Anordnung (102) bestimmt wird, wobei ein zweites digitales Ergebnis abhängig von einer zweiten analogen Addition mittels einer zweiten Memristor-Anordnung (102) bestimmt wird und wobei das erste Ergebnis und das zweite Ergebnis digital addiert werden. Vorrichtung (100) zur Umsetzung einer Matrix-Operation, wobei die Vorrichtung (100) wenigstens eine erste Memristor-Anordnung (102) und eine zweite Memristor-Anordnung (102) umfasst, wobei die Vorrichtung (100) eine ersten Analog-Digital-Wandler (106, 116) und einen zweiten Analog-Digital-Wandler (106, 116) umfasst, und wobei die Vorrichtung (100) ausgebildet ist, für die Matrix-Operation ein erstes digitales Ergebnis abhängig von einer ersten analogen Addition mittels der ersten Memristor-Anordnung (102) und des ersten Analog-Digital-Wandlers (106, 116) zu bestimmen, und ein zweites digitales Ergebnis abhängig von einer zweiten analogen Addition mittels der zweiten Memristor-Anordnung (102) und des zweiten Analog-Digital-Wandlers (106, 116) zu bestimmen.

Description

Beschreibung

Titel

Verfahren und Vorrichtung zur Umsetzung einer Matrix-Operation

Stand der Technik

Die mathematische Bestimmung eines Skalarprodukts aus einem Vektor und einer passend dimensionierten Matrix durch einen Rechner erfordert sehr viele Additionen und Multiplikationen und damit sehr viel Speicherplatz im Rechner.

Die Berechnung von Skalarprodukten mittels einer entsprechend dimensionierten Matrix durch in-memory computing benötigt demgegenüber weniger

Speicherplatz. Dasselbe trifft auf das Lösen von Differenzialgleichungssystemen zu.

Für derartige Anwendungen wird eine dedizierte Hardware, beispielsweise eine dot product engine verwendet.

Wünschenswert ist es eine demgegenüber effizientere Möglichkeit zum

Durchführen derartiger Berechnungen zu schaffen.

Offenbarung der Erfindung

Dies wird durch den Gegenstand der unabhängigen Ansprüche erreicht.

Ein diesbezügliches Verfahren zur Umsetzung einer Matrix-Operation sieht vor, dass für die Matrix-Operation ein erstes digitales Ergebnis abhängig von einer ersten analogen Addition mittels einer ersten Memristor-Anordnung bestimmt wird, wobei ein zweites digitales Ergebnis abhängig von einer zweiten analogen Addition mittels einer zweiten Memristor-Anordnung bestimmt wird und wobei das erste Ergebnis und das zweite Ergebnis digital addiert werden. Die analogen Additionen in verschiedenen Memristor-Anordnungen ermöglichen eine schnelle Berechnung der analogen Ergebnisse. Die Matrix-Operation wird mit der digitalen Addition der analogen Ergebnisse abgeschlossen und zur weiteren Verarbeitung digital bereitgestellt.

Vorzugsweise ist vorgesehen, dass das erste digitale Ergebnis abhängig von einem ersten analogen Ergebnis bestimmt wird, wobei das zweite digitale Ergebnis abhängig von einem zweiten analogen Ergebnis bestimmt wird, wobei die analogen Ergebnisse zumindest teilweise zeitlich überlappend bestimmt werden. Diese Parallelisierung beschleunigt die Berechnung.

Vorzugsweise ist vorgesehen, dass an einen ersten Memristor der ersten Memristor-Anordnung eine erste Spannung angelegt wird, wobei an einen zweiten Memristor der ersten Memristor-Anordnung zumindest teilweise zeitlich überlappend dazu eine zweite Spannung angelegt wird, wobei an einem ersten Ausgang der ersten Memristor-Anordnung ein erster Summenstrom erfasst wird, der den Stromfluss durch den ersten Memristor und den zweiten Memristor charakterisiert, wobei an einen dritten Memristor der zweiten Memristor- Anordnung zumindest teilweise zeitlich überlappend dazu die erste Spannung angelegt wird, wobei an einen vierten Memristor der zweiten Memristor- Anordnung zumindest teilweise zeitlich überlappend dazu die zweite Spannung oder eine dritte Spannung angelegt wird, wobei an einem zweiten Ausgang der zweiten Memristor-Anordnung ein zweiter Summenstrom erfasst wird, der den Stromfluss durch den dritten Memristor und den vierten Memristor charakterisiert, wobei abhängig vom ersten Summenstrom und vom zweiten Summenstrom das Ergebnis bestimmt wird. Durch hohe Parallelisierung wird die Berechnung einer Matrix-Multiplikation beschleunigt.

Vorzugseise ist vorgesehen, dass die erste Spannung abhängig von einem ersten Element einer ersten Matrix definiert ist, wobei die zweite Spannung abhängig von einem zweiten Element der ersten Matrix definiert ist, wobei ein erster Widerstandswert des ersten Memristors abhängig von einem ersten Element einer zweiten Matrix definiert ist, wobei ein zweiter Widerstandwert des zweiten Memristors abhängig von einem zweiten Element der zweiten Matrix definiert ist, und wobei das Ergebnis ein Skalarprodukt der Matrizen

charakterisiert. Durch hohe Parallelisierung wird die Berechnung eines

Skalarprodukts sehr schnell ausführbar. Vorzugsweise ist vorgesehen, dass wenigstens ein Widerstandswert eines Memristors abhängig von einem Element der zweiten Matrix programmiert wird. Damit wird die Anordnung für neue Berechnungen einfach initialisiert.

Vorzugsweise ist vorgesehen, dass der Widerstandswert von wenigstens zwei Memristoren abhängig von einem Element der zweiten Matrix definiert ist oder programmiert wird. Dieselbe Matrix wird zur Parallelisierung mehrfach in der Anordnung verwendet. Damit wird die Berechnung weiter beschleunigt.

Vorzugsweise ist vorgesehen, dass eine Vielzahl Memristoren in einer Matrix- Anordnung angeordnet ist, wobei die zweite Matrix oder eine Vielzahl zweiter Matrizen eine Anordnung von Widerstandswerten für die Vielzahl der

Memristoren definieren, und wobei ein Memristor in der Matrix-Anordnung den Widerstandswert aufweist, oder mit dem Widerstandswert programmiert wird, der in der Anordnung der Widerstandswerte seiner Position in der Matrix-Anordnung insbesondere bezüglich seiner Indizes entspricht. Diese Zuordnung ist besonders übersichtlich.

Vorzugsweise ist vorgesehen, dass wenigstens zwei Gruppen von Memristoren Widerstandswerte aufweisen oder mit Widerstandswerten programmiert werden, die gemäß den Elementen derselben zweiten Matrix definiert sind. Die

Gruppierung erleichtert die Zuordnung signifikant.

Vorzugsweise ist vorgesehen, dass die wenigstens ein Teil der Memristoren aus den wenigstens zwei Gruppen von Memristoren in der Matrix-Anordnung zur Bestimmung desselben Summenstroms verwendet werden. Die Matrizen werden in derselben Reihe untereinander abgebildet. Dadurch sind Analog-Digital- Wandler mit geringer Auflösung verwendbar.

Vorzugsweise ist vorgesehen, dass wenigstens einer der Memristoren aus einer der wenigstens zwei Gruppen von Memristoren in der Matrix-Anordnung bei der Bestimmung des Summenstroms von Memristoren der anderen der wenigstens zwei Gruppen unberücksichtigt bleibt. Dadurch können Analog-Digital-Wandler mit hoher Auflösung ausgelastet werden. Vorzugsweise ist vorgesehen, dass die erste Spannung ein analoges Signal ist, das von einem Digital-Analog-Wandler abhängig von einem digitalen Signal erzeugt wird, das durch das erste Element der ersten Matrix definiert ist und/oder dass die zweite Spannung ein analoges Signal ist, das von einem Digital-Analog- Wandler abhängig von einem digitalen Signal erzeugt wird, das durch das zweite Element der ersten Matrix definiert ist. Damit werden die Eingangsgrößen für die Berechnung besonders geschickt erzeugt.

Vorzugsweise ist vorgesehen, dass sich die erste Spannung und die zweite Spannung um einen Faktor unterscheiden, insbesondere um eine Potenz von 2, der insbesondere abhängig von einer Auflösung des Analog-Digital-Wandlers oder abhängig von einer der Matrix-Operation zugrunde liegenden Bit-Faktoren- Zerlegung definiert ist. Damit kann eine Auflösung des Signals insbesondere abhängig von einer Auflösung des Analog-Digital-Wandlers beeinflusst werden. Der Faktor kann sich auch abhängig davon unterscheiden, ob eine 1 Bit oder eine 2 Bit Zerlegung der zugrunde liegenden Matrix-Operation vorliegt.

Vorzugsweise ist vorgesehen, dass der erste Summenstrom wenigstens einen ersten Strom und einen zweiten Strom umfasst, wobei der erste Strom beim Anlegen der ersten Spannung an den ersten Memristor durch den ersten

Memristor fließt, und wobei der zweite Strom beim Anlegen der zweiten

Spannung an den zweiten Memristor durch den zweiten Memristor fließt. Dies ist eine besonders günstige Berücksichtigung der einzelnen Ströme.

Vorzugsweise ist vorgesehen, dass die erste Spannung zur selben Zeit an den ersten Memristor und einen dritten Memristor angelegt wird oder wobei die zweite Spannung zur selben Zeit an wenigstens den zweiten Memristor und einen vierten Memristor angelegt wird, wobei ein erster Summenstrom für den Strom durch den ersten Memristor und den zweiten Memristor erfasst wird, wobei ein zweiter Summenstrom für den Strom durch den dritten Memristor und/oder den vierten Memristor erfasst wird, und wobei das Ergebnis abhängig vom ersten Summenstrom und vom zweiten Summenstrom bestimmt wird. Das ermöglicht es mehrere Rechnungen parallel auszuwerten.

Vorzugsweise ist vorgesehen, dass ein digitales Signal, das einen Wert wenigstens eines Bits definiert, durch einen Analog-Digital-Wandler abhängig vom Summenstrom bestimmt wird. Damit werden die Werte für die Register eines Speichers besonders geschickt bestimmt.

Vorzugsweise ist vorgesehen, dass eine Vielzahl Summenströmen bestimmt wird, wobei abhängig von der Vielzahl der Summenströme eine Vielzahl Bits bestimmt wird, wobei wenigstens ein Bit, das abhängig von einem der

Summenströme definiert ist, zu wenigstens einem Bit addiert wird, das abhängig von einem anderen der Summenströme definiert ist. Die Auflösung ist variierbar indem je ein Bit zu einem anderen Bit oder indem mehrere Bits gleichzeitig zu mehreren Bits addiert werden.

Vorzugsweise ist vorgesehen, dass wenigstes eines der Bits in einem Register vor der Addition mit dem anderen Bit aus einem anderen Register bezüglich eines least significant bits des Ergebnisses in Richtung des most significant bits des Ergebnisses verschoben angeordnet wird. Damit ist eine Ansteuerung einzelner Memristoren mit einer erhöhten Spannung möglich, die es erlaubt die Auflösung der Analog-Digital-Wandler zu reduzieren.

Vorzugsweise ist vorgesehen, dass wenigstes eines der Bits in einem Register vor der Addition mit dem anderen Bit aus einem anderen Register bezüglich eines least significant bits des Ergebnisses benachbart zu dem anderen Bit angeordnet wird. Damit wird der Raum im Register besonders effizient genutzt.

Memristoren definieren, und wobei ein Memristor in der Matrix-Anordnung den Widerstandswert aufweist, oder mit dem Widerstandswert programmiert wird, der in der Anordnung der Widerstandswerte seiner Position in der Matrix-Anordnung insbesondere bezüglich seiner Indizes entspricht. Diese Zuordnung ist besonders einfach darstellbar.

Eine Vorrichtung zur Umsetzung einer Matrix-Operation umfasst eine erste Memristor-Anordnung und eine zweite Memristor-Anordnung, wobei die

Vorrichtung eine ersten Analog-Digital-Wandler und einen zweiten Analog- Digital-Wandler umfasst, und wobei die Vorrichtung ausgebildet ist, für die Matrix-Operation ein erstes digitales Ergebnis abhängig von einer ersten analogen Addition mittels der ersten Memristor-Anordnung und des ersten Analog-Digital-Wandlers zu bestimmen, und ein zweites digitales Ergebnis abhängig von einer zweiten analogen Addition mittels der zweiten Memristor- Anordnung und des zweiten Analog-Digital-Wandlers zu bestimmen. Diese Vorrichtung ermöglicht eine schnelle Berechnung der Matrix-Operation.

Vorzugsweise ist vorgesehen, dass an einen ersten Memristor der Memristor- Anordnung eine erste Spannung anlegbar ist, wobei an einen zweiten Memristor der Memristor-Anordnung zumindest teilweise zeitlich überlappend dazu eine zweite Spannung anlegbar ist, wobei an einem ersten Ausgang der Memristor- Anordnung ein erster Summenstrom erfassbar ist, der den Stromfluss durch den ersten Memristor und den zweiten Memristor charakterisiert, wobei an einen dritten Memristor der Memristor-Anordnung zumindest teilweise zeitlich überlappend dazu die erste Spannung anlegbar ist, wobei an einen vierten Memristor der Memristor-Anordnung zumindest teilweise zeitlich überlappend dazu die zweite Spannung anlegbar ist, wobei an einem zweiten Ausgang der Memristor-Anordnung ein zweiter Summenstrom erfassbar ist, der den

Stromfluss durch den dritten Memristor und den vierten Memristor charakterisiert.

Vorzugsweise ist vorgesehen, dass eine Vielzahl Memristoren-Anordnungen eine Matrix-Anordnung bildet. Dies ist besonders effizient darstellbar.

Vorzugsweise ist vorgesehen, dass die Digital-Analog-Wandler zur Erfassung von Information über den wenigstens einen Summenstrom ausgebildet sind.

Vorzugsweise ist vorgesehen, dass die Vorrichtung einen ersten Analog-Digital- Wandler zur Erzeugung der ersten Spannung und einen zweiten Analog- Digitalwandler zur Erzeugung der zweiten Spannung umfasst. Damit ist diese Vorrichtung besser ansteuerbar.

Vorzugsweise ist vorgesehen, dass die Vorrichtung eine Memristor-Anordnung vorsieht, in der an einem Knoten von einer Zeile und einer Spalte der Matrix- Anordnung zwei Memristoren angeordnet sind, die hinsichtlich ihrer

ladungsabhängigen Widerstandswerte in einander entgegengesetzter Richtung veränderlich sind. Zur Ansteuerung ist eine Vorrichtung vorgesehen, die einen Mikroprozessor, eine Schalteinrichtung und insbesondere einen Speicher mit Registern aufweist, die ausgebildet sind.

Weitere vorteilhafte Ausführungsformen ergeben sich aus der folgenden

Beschreibung und der Zeichnung. In der Zeichnung zeigt:

Fig. 1 schematisch eine Matrix-Anordnung,

Fig. 2 schematisch eine Memristor-Anordnung,

Fig. 3 ein erstes Berechnungs-Schema,

Fig. 4 schematisch eine elektrische Beschaltung,

Fig. 5 Schritte in einem Verfahren zur Berechnung,

Fig. 6 ein zweites Berechnungs-Schema,

Fig. 7 eine Zuordnung von Matrizen in der Memristor-Anordnung,

Fig. 8 ein drittes Berechnungs-Schema,

Fig. 9 schematisch eine Memristor-Anordnung mit Ausleitungen,

Fig. 10 ein viertes Berechnungs-Schema,

Fig. 1 1 schematisch eine Memristor-Anordnung mit weiteren Ausleitungen,

Fig. 12 ein fünftes Berechnungs-Schema,

Fig. 13 schematisch eine weitere Memristor-Anordnung,

Fig. 14 ein sechstes Berechnungs-Schema,

Fig. 15 schematisch eine weitere Memristor-Anordnung,

Fig. 16 ein siebtes Berechnungs-Schema.

In der folgenden Beschreibung bezeichnet Memristor ein elektronisches Bauteil, dessen Widerstand durch einen Stromfluss veränderlich ist, wenn eine an den Memristor angelegte Spannung einen Schwellwert überschreitet. Die

Programmierung des Memristors auf einen bestimmten Widerstandswert erfolgt beispielsweise durch einen iterativen Algorithmus, welcher Spannungspulse mit definierter Höhe, Dauer und Form an den Memristor anlegt. Nach jedem

Spannungspuls wird vorzugsweise durch eine Berechnung kontrolliert, ob der Memristor seinen Zielwert für den Widerstandswert erreicht hat.

Mit einem solchem Algorithmus können Memristoren nur auf wenige diskrete Widerstandswerte mit einer hinreichenden Genauigkeit programmiert werden. Dazu werden beispielsweise digital codierte Widerstandswerte durch einen Digital-Analog-Wandler in einen entsprechenden Spannungspuls umgewandelt. Zur Berechnung des Widerstandswertes nach jedem Spannungspuls wird ein analoges Stromsignal als analoges Ergebnis erfasst und von einem Analog- Digital-Wandler digitalisiert. Die Genauigkeit des digitalisierten Ergebnisses ist abhängig von der Qualität des Analog-Digital-Wandlers mit dem das analoge Ergebnis nach erfolgter Berechnung wieder in den digitalen Bereich zurück gewandelt wird. Aufgrund der Wandlung der Werte von digital nach analog und zurück ist davon auszugehen, dass die Berechnungen einer gewissen Unschärfe unterliegen. Ursächlich hierfür sind Wandlungsfehler wie digitale Restfehler oder Nichtlinearitäten der Wandler. Auch Rauschen kann das Ergebnis

beeinträchtigen, insbesondere dann, wenn die Auflösung der Wandler groß ist.

Memristoren können für eine Vielzahl von Effekten verwendet werden. Ein physikalisches System in dem der Effekt zur Anwendung kommt, weist einen veränderlichen Widerstand auf, der von einem Stromfluss zu dem Memristor oder den Memristoren in der Vergangenheit beeinflusst wird.

Die Memristoren können im physikalischen System in einer Matrix einer

Dimension n x m angeordnet sein und als Koeffizienten oder Gewichte einer mathematischen Matrix derselben Dimension n x m verwendet werden. In einem derartigen physikalischen System bilden die Memristoren einen Speicher für Koeffizienten oder Gewichte.

Mit Memristoren sind aufgrund ihres sehr geringen Platzbedarfs preiswerte physikalische Systeme darstellbar. Analog-Digital-Wandler und Digital-Analog- Wandler weisen diese Vorteile nicht auf. Die Genauigkeit des physikalischen Systems hängt insofern wesentlich von der erreichbaren Auflösung der

Memristorwerte und der Qualität und damit dem Preis der Analog-Digital-Wandler und der Digital-Analog-Wandler ab.

In Figur 1 ist beispielhafte für eine Vorrichtung zur Umsetzung einer Matrix- Operation beispielsweise einer Matrix-Multiplikation eine Matrix-Anordnung 100 schematisch dargestellt. Die Matrix-Anordnung 100 umfasst eine Vielzahl Memristor-Anordnungen 102, deren Aufbau in Figur 2 am Beispiel einer Memristor-Anordnung 102 detailliert dargestellt ist.

Memristoren, die mit ihrem ersten an einer gemeinsamen Zeilenleitung angeordnet sind, bilden ein Memristor-Array.

Eine Memristor-Anordnung 102 umfasst im Beispiel, wie auch in Figur 2 dargestellt, neun Memristoren a, ..., i. Ein erster Memristor a ist zwischen einer ersten Zeilenleitung ji und einer ersten Spaltenleitung mz angeordnet. Ein zweiter Memristor b ist zwischen einer zweiten Zeilenleitung ki und der ersten

Spaltenleitung mz angeordnet. Ein dritter Memristor c ist zwischen einer dritten Zeilenleitung li und der ersten Spaltenleitung mz angeordnet. Ein vierter

Memristor d ist zwischen der ersten Zeilenleitung ji und einer zweiten

Spaltenleitung nz angeordnet. Ein fünfter Memristor e ist zwischen der zweiten Zeilenleitung ki und der zweiten Spaltenleitung nz angeordnet. Ein sechster Memristor f ist zwischen der dritten Zeilenleitung li und der zweiten

Spaltenleitung nz angeordnet. Ein siebter Memristor g ist zwischen der ersten Zeilenleitung ji und einer dritten Spaltenleitung oz angeordnet. Ein achter Memristor h ist zwischen der zweiten Zeilenleitung ki und der dritten

Spaltenleitung oz angeordnet. Ein neunter Memristor i ist zwischen der dritten Zeilenleitung li und der dritten Spaltenleitung oz angeordnet.

Die Memristor-Anordnung 102 bildet im Beispiel eine symmetrische Memristor- Matrix der Dimension 3 x 3. Die Dimension kann größer oder kleiner sein. Die Memristor-Matrix kann unsymmetrisch sein.

Die Matrix-Anordnung 100 umfasst im Beispiel fünfzehn Memristor-Anordnungen 102, die in drei Zeilen und fünf Spalten angeordnet sind. In derselben Zeile der Memristor-Matrix angeordnete Memristoren der Memristor-Anordnungen 102 der ersten Zeile der Matrix-Anordnung 100 verwenden dieselbe erste Zeilenleitung und sind mit einem ersten Eingang jO verbunden. In derselben Zeile der

Memristor-Matrix angeordnete Memristoren der Memristor-Anordnungen 102 der zweiten Zeile der Matrix-Anordnung 100 verwenden dieselbe zweite Zeilenleitung und sind mit einem ersten Eingang kO verbunden. In derselben Zeile der

Memristor-Matrix angeordnete Memristoren der Memristor-Anordnungen 102 der dritten Zeile der Matrix-Anordnung 100 verwenden dieselbe dritte Zeilenleitung und sind mit einem ersten Eingang IO verbunden. In derselben Spalte der Memristor-Matrix angeordnete Memristoren der Memristor-Anordnungen 102 der ersten Spalte der Matrix-Anordnung 100 verwenden dieselbe erste

Spaltenleitung und sind mit einem ersten Ausgang m5 verbunden. In derselben Spalte der Memristor-Matrix angeordnete Memristoren der Memristor- Anordnungen 102 der zweiten Spalte der Matrix-Anordnung 100 verwenden dieselbe zweite Spaltenleitung und sind mit einem zweiten Ausgang n5 verbunden. In derselben Spalte der Memristor-Matrix angeordnete Memristoren der Memristor-Anordnungen 102 der dritten Spalte der Matrix-Anordnung 100 verwenden dieselbe dritte Spaltenleitung und sind mit einem zweiten Ausgang o5 verbunden.

Die übrigen Memristor-Anordnungen 102 der Matrix-Anordnung 100 sind entsprechend dieses Schaltungsschemas mit den Eingängen j1 , k1 , 11 , j2, k2, 12 und den Ausgängen m4, n4, o4, m3, n3, o3, m2, n2, o2, m1 , n1 , o1 verbunden.

Allgemein gibt der in Figur 2 dargestellt Index i für eine Memristor-Anordnung 102 die Zeile in der Matrix-Anordnung 100 an, in der diese Memristor-Anordnung 102 angeordnet ist. Der in Figur 2 dargestellt Index z charakterisiert für eine Memristor-Anordnung 102 die Spalte in der Matrix-Anordnung 100, in der diese Memristor-Anordnung 102 angeordnet ist. Im Beispiel ist die erste Spalte der Matrix-Anordnung 100 dem most significant Bit, MSB, eines Ergebnisses der Berechnung zugeordnet. Im Beispiel ist die letzte Spalte der Matrix-Anordnung 100 dem least significant Bit, LSB, des Ergebnisses der Berechnung zugeordnet. Je drei benachbarte der in Figur 1 dargestellten Ausgänge, die mit demselben Index bezeichnet sind, sind als Spalten zusammengefasst. Den Spalten sind von der ersten Spalte links zur letzten Spalte rechts die Faktoren 16, 8, 4, 2, 1 zugeordnet. Diese geben die Potenz von 2 an, mit der das Ergebnis der analogen Summenbildung einer Spalte in der digitalen Summenbildung für das Ergebnis berücksichtigt wird. Beispielsweise sind die Faktoren abhängig von der Bit-Faktoren-Zerlegung definiert, die der Matrix-Operation zugrunde gelegt ist.

An jeder der Zeilenleitungen ist im Beispiel ein Digital-Analog-Wandler 104 angeordnet, welcher ein Memristor-Array mit einer Eingangsspannung versorgt. Werden die Berechnungen binär ausgeführt, entfallen die Digital-Analog-Wandler 104. Der Digital-Analog-Wandler 104 muss in der Lage sein, den Spaltenstrom abzubilden. Der Spaltenstrom stellt die Summe der maximalen Gewichte in einer Spalte dar. Dabei wird berücksichtigt, dass in manchen Auslegungen die

Zeilenspannung für die Spalte bereits mit einem Faktor versehen ist. An jeder der Spaltenleitungen ist ein Digital-Analog-Wandler 106 angeordnet. Die Analog- Digital-Wandler 106 welche die analogen Ergebnisse auslesen benötigen eine entsprechend der Größe der Memristor-Matrix und entsprechend der Bitbreite der Eingangsgrößen angepasste Auflösung, um an ihren Ausgängen die

Ausgangswerte mit ausreichender Auflösung digital auszugeben. Bei einer 4x4 Matrix werden z.B. pro Spalte vier Werte addiert, so dass der Digital-Analog- Wandler 106 in diesem Fall einen mindestens 4mal so großen Wertebereich abdecken muss. Wenn die Zeilenspannung bereits mit einem Faktor belegt ist, muss der Wertebereich entsprechend größer ausgebildet sein. Dies entspricht einem 2bit mal so großen Wertebereich. Die Faktoren, die den Spalten zugeordnet sind, können auch abhängig von der Auflösung der Digital-Analog- Wandler definiert sein. Dies kann eine im Folgenden beschriebene Anpassung der Eingangsspannungen bedingen.

Die Eingänge der Digital-Analog-Wandler 104 und die Ausgänge der Analog- Digital-Wandler 106 sind im Beispiel wie folgt beschrieben in Zeilen oder Spalten zusammengefasst gruppiert, und so ausgebildet, die folgende Berechnung durchzuführen.

Durch diese Vorgehensweise können Berechnungen, die eine Matrix betreffen, mit beliebigen Genauigkeiten gerechnet werden. Wie im Folgenden beschrieben, werden sowohl Eingangswerte als auch Gewichte der Matrix in einzelne Bits zerlegt. Im Beispiel wird ein Eingangswert von 0x03 in 1 Bit-Faktoren zerlegt und entspricht

dann 0^*2^L2 + 1^*2^L1 + 1 ^*2^L0.

Gemäß diesem Ansatz wird die gesamte Matrix-Operation ausformuliert.

Beispielsweise lässt sich eine Matrix-Operation mit 3 Bit breiten Eingangswerten und 3 Bit Gewichten in 81 Matrix-Operationen mit je 1 Bit zerlegen, wobei alle Matrix-Operationen gleichzeitig durchgeführt werden. Dazu werden 81 Memristoren gleichzeitig benötigt. Die verwendeten Digital- Analog-Wandler und Analog-Digital-Wandler müssen nur wenige Stufen auflösen.

Die Matrix kann bezüglich der Auflösung der Komponenten flexibel ausgelegt werden. Das bedeutet:

Die Auflösung von Digital-Analog-Wandler und Analog-Digital-Wandler sind skalierbar. Die Matrix kann beispielsweise so dimensioniert werden, dass viele Analog-Digital-Wandler verwendet werden, die mit geringerer Auflösung arbeiten oder umgekehrt.

Wenn eine Geschwindigkeit der verwendeten Analog-Digital-Wandler im

Vergleich mit einer Geschwindigkeit einer Reaktion der Matrix, d.h. ihrer Bauteile oder Elemente, schneller gewählt wird, oder die eingesetzten Analog-Digital- Wandler und die verwendete Matrix es zulassen, ist in einem Aspekt vorgesehen, die Analog-Digital-Wandler zu multiplexen. Das multiplexen kann innerhalb der Matrix oder auch zu anderen Matrizen im Speicher erfolgen.

Die Memristoren können stabil und unabhängig von der Temperatur betrieben werden, weil die Anzahl der Zustände reduziert werden kann.

Bei binärem Betrieb entfallen die Digital-Analog-Wandler. Im binären Betrieb benötigten die Analog-Digital-Wandler nur n-Stufen Auflösung bei einer Matrix der Dimension n x n. Bei binärem Betrieb benötigen die Memristoren je nur 2 Zustände, d.h. 1 Bit. Bei binärem Betrieb können die Memristoren sehr schnell insbesondere ohne repetitiven Algorithmus programmiert werden.

Die Matrix-Anordnung 100 ist beliebig skalierbar. Die Anzahl der Matrizen hängt linear von der Auflösung der Gewichte ab. Je Bit wird im Beispiel eine Matrix verwendet. Für eine Matrix der Dimension 3 x 3 mit 3 Bit Eingangswerten und 3 Bit Ausgangswerten ist beispielsweise eine Schaltungsanordnung mit drei Matrizen geeignet, die jeweils dreimal für eine Berechnung verwendet werden. Die Anzahl der zusätzlichen Iterationen hängt von der Auflösung

der Eingangswerte ab. Pro Bit ist im Beispiel ein Iterations-Schritt vorgesehen. Die Verwendung von Memristoren mit höherer Auflösung ist ebenfalls möglich. Werden Memristor mit mehr als einem Bit Auflösung programmierbar, so reduziert sich die Anzahl der Matrizen entsprechend.

Zur Ansteuerung der Matrix-Anordnung wird eine Matrix Operation in binäre Bestandteile zerlegt. Dies wird im Folgenden anhand einer Matrix der Dimension 3 x 3 und einem Vektor der Dimension 3 x 1 beschrieben.

Zunächst wird die gewünschte Matrix Operation in einzelne Bits zerlegt

Dann werden die 2er Faktoren ausgeklammert werden, so dass sich beispielhaft für 3 Bit aufgelöste Werte ergibt:

Durch substituieren der Matrizen

ergibt sich

In Figur 1 ist eine Ansteuerung der Matrix-Anordnung 100 für die Berechnung dieses Produkts dargestellt. Genauer werden zunächst die Memristoren mit den Werten aus den Matrizen E0, E1 , E2 an den in der Figur 1 dargestellten Knoten belegt, d.h. die Memristoren werden entsprechend programmiert. Die Werte aus Zeilen der jeweiligen Matrizen E0, E1 , E2 werden im Beispiel als

Widerstandswerte oder Leitwerte in Spalten der Memristor-Anordnungen 102, wie in Figur 2 dargestellt, programmiert. In Figur 1 ist die Zuordnung der jeweiligen Matrizen E0, E1 , E2 zur Anordnung in der Hardware der Matrix- Anordnung 100 mit demselben Index bezeichnet. Dann werden die

Eingangswerte der in Figur 1 mit jO, j1 , j2, kO, k1 , k2, I0, 11 , I2 bezeichneten Eingänge mit den Werten der Vektoren A0, A1 , A2 desselben Index belegt. Das bedeutet, die Digital-Analog-Wandler 104 dieser Eingänge legen eine

entsprechende Spannung an. Genauer wird im Beispiel aufgrund der

Bitzerlegung für logisch 0 keine Spannung angelegt. Für logisch 1 wird eine demgegenüber höhere Spannung angelegt.

Eine derartige Matrix-Anordnung 100 ist ein Speicher aus Memristoren. Werden mit diesem Speicher Rechenoperationen, d.h. in-memory computing, ausgeführt, so werden zunächst die Speicherstellen, d.h. die Memristoren, entsprechend beschrieben. Anschließend wird an eine Zeile der Matrix, eine Spannung angelegt. Zeitlich zumindest teilweise überlappend damit wird eine Spalte mit Masse verbunden. Der Strom, der durch den Memristor an dem Knotenpunkt von dieser Zeile und dieser Spalte zum Massepunkt fließt, hängt von einem

Widerstandswert RKnoten des Memristors ab: I = U/RKnoten.

Legt man an mehrere Zeilen gleichzeitig Spannungen an und verbindet wieder nur eine Zeile mit Masse, so fließt durch jeden Memristor dieser Spalte ein Strom UZeile * 1/RKnoten. Im Beispiel werden mehrere Zeilen in Gruppen [jO, kO, I0],

01 , k1 , 11] und 02, k2, I2] zusammengefasst angesteuert.

Im Massepunkt, d.h. im Beispiel auf der Spaltenleitung nahe des Analog-Digital- Wandlers 106 der Spalte, die mit Masse verbunden ist, addieren sich diese Ströme dann so dass für die Memristoren mit den Widerstandswerten Ra, Rb, ..., die an Knotenpunkten der Zeilen mit dieser Spalte angeordnet sind, beim Anlegen einer Spannung U_Zeile an jeder dieser Zeilen der folgende

Summenstrom entsteht:

Bei den Termen handelt es sich um eine Summe aus Divisionen. Verwendet man statt dieser Darstellung die entsprechenden Leitwerte wird eine Summe aus Produkten ausgewertet. Wird zudem angenommen, dass die an eine Zeile angelegte Spannung U_Zeile über die gesamte Zeile gleich ist, und werden mehrere Spalten gleichzeitig mit Masse verbunden, können so mehrere dieser Operationen gleichzeitig ausgeführt werden.

Der sich einstellende Summenstrom stellt das analoge Ergebnis dieser

Berechnung für die betrachtete Spaltenleitung dar und wird im Beispiel durch die jeweiligen Analog-Digital-Wandler 106 erfasst. Der Analog-Digital-Wandler 106 hat vorzugsweise einen virtuellen Nullpunkt. Das bedeutet, die Spalten sind nicht tatsächlich mit Masse verbunden. Das Masse Potential wird über den virtuellen Nullpunkt bereitgestellt. Der Analog-Digital-Wandler 106 ist beispielsweise ein Transimpedanzverstärker. Das digitale Ergebnis dieser Berechnung ist eine Summe S im Beispiel der Länge 8 Bit wird für jeden der Skalare j, k, I nach einem in Figur 3 für den Skalar j beispielhaft dargestellten Berechnungs-Schema 300 bestimmt.

Die digitalisierten Ergebnisse der Spaltenleitungen, die den Skalar j zugeordnet sind, sind im Beispiel von der ersten Spalte der Matrix-Anordnung 100 links beginnend mit m5, m4, m3, m2 und m1 bezeichnet. Die digitalisierten Ergebnisse werden in Figur 3 in Zeilen angeordnet. In einer Zeile ist im Beispiel Raum für 8 Bit zwischen einem in der Figur 3 links dargestellten MSB der Summe S, und einem in der Figur 3 rechts dargestellten LSB der Summe S. Beispielsweise sind entsprechende Register in einem Speicher vorgesehen, in die das jeweilige digitalisierte Ergebnis geschrieben wird. In der ersten Zeile ist ein erstes digitalisiertes Ergebnis m1 der letzten Spalte der Matrix-Anordnung 100 angeordnet. Das erste digitalisierte Ergebnis m1 liefert zwei Bit und wird am LSB der Summe S angeordnet. Ein zweites digitalisiertes Ergebnis m2 der vorletzten Spalte liefert drei Bit, deren LSB bezüglich des LSB der Summe S um vier Bit zum MSB der Summe S hin verschoben angeordnet wird. Ein drittes digitalisiertes Ergebnis m3 der dritten Spalte liefert vier Bit, deren LSB bezüglich des LSB der Summe S um zwei Bit zum MSB der Summe S hin verschoben angeordnet wird. Ein viertes digitalisiertes Ergebnis m4 der zweiten Spalte liefert drei Bit, deren LSB bezüglich des LSB der Summe S um drei Bit zum MSB der Summe S hin verschoben angeordnet wird. Ein fünftes digitalisiertes Ergebnis m1 m5 der ersten Spalte liefert zwei Bit, deren LSB bezüglich des LSB der Summe S um vier Bit zum MSB der Summe S hin verschoben angeordnet wird. Durch Summenbildung über die Spalten des ersten Berechnungs-Schema 300 wird das Ergebnis der Berechnung als 8 Bit Summe S bestimmt.

Figur 4 stellt eine elektrische Beschaltung 400 zum Ansteuern der Digital-Analog- Wandler 104 zum Beaufschlagen der Zeilenleitungen mit Spannung, und zum Ansteuern der Analog-Digital-Wandler 106 zum Erfassen des sich einstellenden Stroms an den Spaltenleitungen schematisch dar. Im Beispiel ist wenigstens eine elektrische Schalteinrichtung 402 realisiert, der von einem Mikroprozessor 404 über wenigstens eine Signalleitung 406 schaltbar ist. Beispielsweise werden Sperrschicht-Feldeffekttransistoren als elektrische Schalter in der

Schalteinrichtung 402 eingesetzt. Die Matrix-Anordnung 100 ist über wenigstens eine entsprechende Stromversorgung 408 mit der Schalteinrichtung 402 verbunden. Ein Speicher 410 mit Registern für die Berechnung ist über einen Datenbus 412 mit dem Mikroprozessor 404 verbunden.

Der Mikroprozessor 404 ist ausgebildet, die Matrix-Anordnung 100 nach dem beschriebenen Verfahren anzusteuern, um die Berechnung auszuführen.

Schematisch ist der Ablauf des Verfahrens in Figur 5 dargestellt.

In einem Schritt 502 wird die zu lösende Gleichung einer Matrix-Operation zerlegt. Genauer werden die Matrizen E0, E1 , E2 bestimmt.

Anschließend wird ein Schritt 504 ausgeführt.

Im Schritt 504 werden die Memristor-Anordnungen 102 der Matrix-Anordnung 100 für die Berechnung programmiert. Im Beispiel werden die Memristoren gemäß den Werten aus den Matrizen E0, E1 , E2 programmiert. Für die Matrix der Dimension 3 x 3 mit 3 Bit Eingangswerten und 3 Bit Ausgangswerten ist eignet sich die Schaltungsanordnung mit drei Matrizen, die jeweils dreimal für eine Berechnung verwendet werden. Eine mögliche Umsetzung ist in Figur 1 dargestellt, in der die Zuordnung von Memristor-Anordnung 102 zu Matrizen E0, E1 , E2 mit E0, E1 , E2 bezeichnet ist. Alle Matrix Multiplikationen, die mit demselben Faktor multipliziert werden, werden im Beispiel untereinander angeordnet, d.h. die Memristoren werden durch entsprechende Ansteuerung ausgewählt und programmiert. Ein hoher Widerstandswert bedeutet

beispielsweise logisch 1 und ein demgegenüber niederer Widerstandswert bedeutet beispielsweise logisch 0.

Anschließend wird ein Schritt 506 ausgeführt.

Im Schritt 506 werden die Eingangswerte der mit jO, j1 , j2, kO, k1 , k2, 10, 11 , 12 bezeichneten Eingänge mit Spannung gemäß der Eingangswerte der mit jO, j1 , j2, kO, k1 , k2, 10, 11 , 12 belegt. Das bedeutet, die Digital-Analog-Wandler 104 dieser Eingänge legen eine entsprechende Spannung an.

Zumindest teilweise zeitlich überlappend damit wird der sich einstellende Summenstrom als analoges Ergebnis der Berechnung an den entsprechenden Spaltenleitungen bestimmt. Der Summenstrom der jeweils betrachteten

Spaltenleitung wird im Beispiel durch den jeweiligen Analog-Digital-Wandler 106 erfasst. Das digitale Ergebnis wird im Beispiel nach dem ersten Berechnungs- Schema 300 an entsprechender Stelle in das Register für die Bestimmung der Summe S geschrieben.

Im Beispiel werden die Gruppen [jO, kO, I0], [j1 , k1 , 11] und [j2, k2, I2]

zusammengefasst angesteuert und das digitale Ergebnis für die entsprechenden Spaltenleitungen bestimmt.

Anschließend wird ein Schritt 508 ausgeführt.

Im Schritt 508 wird für jeden der Skalare j, k, I die 8 Bit Summe S als Ergebnis der Berechnung bestimmt.

Gemäß diesem Ansatz wird die gesamte Matrix-Operation ausformuliert.

Beispielsweise lässt sich eine Matrix-Operation mit 3 Bit breiten Eingangswerten und 3 Bit Gewichten in 81 Matrix-Operationen mit je 1 Bit zerlegen, wobei alle Matrix Operationen gleichzeitig durchgeführt werden.

Figur 6 stellt ein zweites Berechnungs-Schema 600 dar. Die Umsetzung der Berechnung nach dem zweiten Berechnungs-Schema 600 optimiert die zuvor beschriebene Vorgehensweise weiter, indem eine Anzahl benötigter Register reduziert wird. Im Unterschied zum ersten Berechnungs-Schema 300 werden das erste digitalisierte Ergebnis m1 und das dritte digitalisierte Ergebnis m3 in derselben Zeile angeordnet. Im Unterschied zum ersten Berechnungs-Schema 300 werden das zweite digitalisierte Ergebnis m2 und das fünfte digitalisierte Ergebnis m1 m5 in derselben Zeile angeordnet. Die übrige Vorgehensweise ist wie für das erste Berechnungs-Schema 300 beschrieben.

In diesen Berechnungen werden einige Memristoren in einer ansonsten regelmäßigen Matrix-Anordnung 100 nicht genutzt. Diese Berechnungen stellt ungleichmäßigen Anforderungen an die verwendeten Digital-Analog-Wandler 106. Der Digital-Analog-Wandler 106 für die Bestimmung des Ausgangswerts m3 ist ausgebildet, vier Bit aufzulösen, die Digital-Analog-Wandler 106 für die Bestimmung der Ausgangswerts m4 und m2 sind im Beispiel ausgebildet drei Bit aufzulösen. Die anderen Digital-Analog-Wandler 106 sind im Beispiel ausgebildet nur zwei Bit aufzulösen.

Dies kann vermieden werden, wenn in der Zuordnung der Matrizen E0, E1 , E2 für die Programmierung der Memristoren-Anordnungen 102 in den Zeilen der Matrix-Anordnung 100 so verschoben, dass die Matrizen E0, E1 , E2 wie in Figur 7 dargestellt untereinander liegen.

In diesem Fall wird die Änderung der Zuordnung durch eine angepasste

Spannung korrigiert. Das Verschieben der Zuordnung in einer Zeile nach rechts erzeugt bei allen beteiligten Matrizen einen Fehler mit dem Faktor 2. Dies wird ausgeglichen indem die Eingangsspannungen an den Zeilen für jede

Verschiebung um eine Memristoren-Anordnungen 102 nach rechts um den Faktor 2 erhöht wird. Statt einer Multiplikation mit einem Faktor durch ein

Vervielfachen, kann einfacherweise ausgehend von einer Versorgungsspannung eine Division mittels eines Spannungsteilers durchgeführt werden. Ein

Verschieben um eine Position wird einmal korrigiert, eine Verschiebung um zwei Positionen wird zweimal korrigiert. Daraus resultiert die Ansteuerung der Gruppen mit den Eingangswerten [jO, kO, 10], 2 ^* [j1 , k1 , 11] und 4 ^* [j2, k2, I2]

Die nötige Auflösung der Analog-Digital-Wandler berechnet sich für Werte X des Faktors am Eingang wie folgt:

wobei Y und Z Maximalwerte für Zustände der Memristoren sind, d.h. für eine Auflösung von n Bit: Y, Z = 2n - 1

Im Beispiel mit 1 -Bit Memristoren ist Z=1. Die Eingangswerte an den Zeilen haben ebenfalls 1 Bit, daher ist Y=1.

Für die Matrix der Dimension 3 x 3 mit 1 Bit Memristoren und 3 Bit

Eingangswerten, d.h. 1 Bit pro Zeile, beträgt die Anzahl der Zustände die der Analog-Digital-Wandler auflösen muss 21.

Figur 8 stellt ein drittes Berechnungs-Schema 800 dar. Die Umsetzung der Berechnung nach dem dritten Berechnungs-Schema 800 optimiert die zuvor beschriebene Vorgehensweise weiter. Im Unterschied zum ersten Berechnungs- Schema 300 werden nur das erste digitalisierte Ergebnis m1 das zweite digitalisierte Ergebnis m2 und das dritte digitalisierte Ergebnis m3 angeordnet. Im Unterschied zum ersten Berechnungs-Schema 300 weisen die digitalisierten Ergebnisse dieselbe Bitlängen auf. Die übrige Vorgehensweise ist wie für das erste Berechnungs-Schema 300 beschrieben.

Die erforderliche Auflösung der Analog-Digital-Wandler ergibt sich im

Wesentlichen aus dem erreichbaren Zahlenbereich während der Matrix- Operationen.

In einem Aspekt ist vorgesehen, dass Zwischensummen ausgeleitet werden. Sollte der für eine Matrix-Operationen erforderliche Zahlenbereich größer sein, als die Auflösung der zur Verfügung stehenden Analog-Digital-Wandler es zulässt, so können beispielsweise Zwischensummen ausgeleitet werden. Die Anzahl der insgesamt erforderlichen Analog-Digital-Wandler erhöht sich dabei, die Auflösung reduziert sich. Eine Beispielhafte Umsetzung ist in Figur 9 zu sehen.

Im Unterschied zu der zuvor anhand der Figur 7 beschriebenen Umsetzung ist zwischen der zweiten Zeile und der dritten Zeile der Matrix-Anordnung 100 an jeder der Spaltenleitungen je ein Abgriff für je einen Analog-Digital-Wandler 106 angeordnet. Eine Reihenfolge der Schaltung Spaltenleitungen auf Masse und der Beaufschlagung der Zeilenleitungen mit Spannung kann so gewählt werden, dass je Spaltenleitung nur durch einen der Abgriffe Strom fließt, die an dieser Spaltenleitung angeordnet sind. Dann kann diese Spaltenleitung durchgängig ausgebildet sein, ohne die Berechnung des Summenstroms zu beeinträchtigen. Die Spaltenleitung kann an der Stelle der Ausleitung zwischen den Memristoren- Anordnungen der dritten Zeile und der zweiten Zeile zum analogen bestimmen des Summenstroms vorzugsweise permanent elektrisch unterbrochen sein. So entstehende analoge Zwischensummen werden durch die Abgriffe erfasst und anschließend digital addiert.

Gruppen mit den Ausgangswerten, die die analogen Zwischensummen der dritten Zeile angeben, sind mit [m5, n5, o5], [m4, n4, o4], [m3, n3, o3], [m2, n2, o2], [m1 , n1 , o1] bezeichnet. Gruppen mit den Ausgangswerten, die die analogen Zwischensummen der ersten und der zweiten Zeile angeben sind mit [r5, s5, t5], [r4, s4, t4], [r3, s3, t3], [r2, s2, t2], [r1 , s1 , t1] bezeichnet.

Die übrige Vorgehensweise entspricht der zuvor beschriebenen, wobei für die Berechnung der Skalare j, k, I das in Figur 10 beispielhaft für den Skalar j dargestellte Berechnungs-Schema 1000 eingesetzt wird.

Dem Skalar j zugeordnete Ausgangswerte r1 , r2 und r3, werden beginnend mit dem Ausgangswert r1 beim LSB der Summe S zeilenweise in dieser Reihenfolge angeordnet. Der Ausgangswert r1 wird mit seinem LSB am LSB der Summe S angeordnet. Die nachfolgenden Ausgangswerte werden mit ihrem LSB in den folgenden Zeilen um je eine weitere Stelle zum MSB hin verschoben angeordnet. Dem Skalar j zugeordnete Ausgangswerte m1 , m2 und m3 werden beginnend mit dem Ausgangswert m1 bezüglich des LSB der Summe S um zwei Bit zum MSB der Summe S hin verschoben angeordnet. Die nachfolgenden Ausgangswerte werden mit ihrem LSB in den folgenden Zeilen um je eine weitere Stelle zum MSB hin verschoben angeordnet. Die Summenberechnung des Ergebnisses erfolgt wie zuvor beschrieben spaltenweise.

Im Beispiel benötigen die Analog-Digital-Wandler, die die dritte Zeile

berücksichtigen eine Auflösung von 2 Bit. Die die Analog-Digital-Wandler, die die dritte Zeile nicht berücksichtigen benötigen eine Auflösung von 4 Bit.

Das Ausleiten von derartigen analogen Zwischensummen kann an

verschiedenen Stellen erfolgen. In Figur 11 ist eine andere Aufteilung dargestellt, bei der jede Zwischensumme ausgeleitet wird. Gegebenenfalls kann der Faktor der Spannungen an den Zeilen angepasst werden oder entfallen, wenn dieser bei der weiteren digitalen Verrechnung der Zwischensumme berücksichtigt wird.

Im Unterschied zu der zuvor anhand der Figur 9 beschriebenen Anordnung sind nur neun Memristor-Anordnungen 102 in einer Matrix der Dimension 3 x 3 angeordnet. Zusätzlich sind Analog-Digital-Wandler 106 in Ausleitungen zwischen der ersten Spalte und der zweiten Spalte der Matrix-Anordnung 100 angeordnet.

Gruppen mit den Ausgangswerten, die die Zwischensummen der dritten Zeile angeben, sind mit [m3, n3, o3], [m2, n2, o2], [m1 , n1 , o1] bezeichnet. Gruppen mit den Ausgangswerten, die die zweite Zeile aber nicht die erste und die dritte Zeile mitberücksichtigen sind mit [r3, s3, t3], [r2, s2, t2], [r1 , s1 , t1] bezeichnet. Gruppen mit den Ausgangswerten, die nur die erste Zeile berücksichtigen sind mit [u3, u3, u3], [u2, v2, w2], [u1 , v1 , w1] bezeichnet. Derselben Spaltenleitung sind mit j, r und u mit k, s und v mit I, r und w gekennzeichnete Ausgänge zugeordnet.

Eine Reihenfolge der Schaltung Spaltenleitungen auf Masse und der

Beaufschlagung der Zeilenleitungen mit Spannung kann so gewählt werden, dass je Spaltenleitung nur durch einen Abgriff Strom fließt. Dann kann die Spaltenleitung am Abgriff durchgängig ausgebildet sein, ohne die Berechnung des Summenstroms zu beeinträchtigen. Die Spaltenleitung kann an der Stelle der Ausleitung zwischen den Memristoren-Anordnungen der dritten Zeile und der zweiten Zeile zum bestimmen des Summenstroms oder permanent elektrisch unterbrochen sein.

Die übrige Vorgehensweise entspricht der zuvor beschriebenen, wobei für die Berechnung der Skalare j, k, I das in Figur 12 beispielhaft für den Skalar j dargestellte Berechnungs-Schema 1200 eingesetzt wird.

Die Zeilenspannungen sind bei der Beaufschlagung der Zeilenlinien immer die gleichen. Der zuvor nötige Faktor, im Beispiel 2 oder 4, wird dadurch realisiert, dass die Ergebnisse der Analog-Digital-Wandler an eine andere Bit Position im Register eingeblendet werden.

Die Ausgangswerte zwischen der ersten Zeile und der zweiten Zeile werden mit dem LSB des Ausgangswerts u1 am LSB der Summe S beginnend angeordnet. Die Ausgangswerte u2 und u3 werden in folgenden Zeilen je um eine weitere Stelle zum MSB der Summ S hin verschoben angeordnet.

Die Ausgangswerte zwischen der zweiten Zeile und der dritten Zeile werden mit dem LSB des Ausgangswerts r1 bezüglich des LSB der Summe S bereits um eine Stelle zum MSB der Summe S hin verschoben beginnend angeordnet. Die Ausgangswerte r2 und r3 werden in folgenden Zeilen je um eine weitere Stelle zum MSB der Summ S hin verschoben angeordnet.

Die Ausgangswerte nach der dritten Zeile werden mit dem LSB des

Ausgangswerts m1 bezüglich des LSB der Summe S bereits um zwei Stellen zum MSB der Summe S hin verschoben beginnend angeordnet. Die

Ausgangswerte m2 und m3 werden in folgenden Zeilen je um eine weitere Stelle zum MSB der Summ S hin verschoben angeordnet.

Im Fall der ersten und dritten Zeile ist es sogar möglich, dass beide Analog- Digital-Wandler ihr Ergebnis in dieselbe Zwischensumme einblenden.

Die Summenbildung für das Ergebnis erfolgt wie beschrieben spaltenweise.

In dieser Anordnung sind nur noch Analog-Digital-Wandler mit einer Auflösung von 2 Bit nötig. Diese Analog-Digital-Wandler können lediglich aus zwei Komparatoren bestehen. Diese Analog-Digital-Wandler können bis in den GHz Bereich arbeiten.

Ein weiterer Aspekt betrifft eine Erhöhung der Auflösung der Memristoren auf 2 Bit. Dies bedeutet, dass mehrere Zustände in einen Memristor programmiert werden. Dies wird bei der Zerlegung der Matrix analog zur beschriebenen Matrix- Operation mit 1 Bit Zerlegung berücksichtigt.

Das bedeutet, 2 Bit Werten werden so dargestellt, dass jeweils zwei bits, im Beispiel die bits 0 und 1 , die bits 2 und 3, ... zusammengefasst werden. Durch die Ersetzung der Größen in der Matrix-Operation mit folgenden

sind

Analog zur Vorgehensweise bei eine 1 Bit Zerlegung ergibt sich für die 2 Bit Matrix

2° (E₀A₀2° + E_QA_X2^X + E₀A₂2²) + Die Umsetzung dieser Gleichungsterme in eine Memristor Matrix geschieht ebenfalls analog zur Matrix-Anordnung 100 für die 1 Bit Matrix-Operation.

Diese Umsetzung wird ausgehend von der Beschreibung der Matrix-Anordnung 100, die anhand der Figur 7 beschrieben wurde in Figur 13 dargestellt. Die Anordnung insbesondere der Matrizen E0, E1 , E2 und der Faktor 2 bei den Eingangswerten j1 , k1 , 11 und der Faktor 4 bei den Eingangswerten j2, k2, 12 sind wie zuvor beschrieben.

Im Unterschied zu der für Figur 7 dargestellten Anordnung sind die geänderten Faktoren vor den Termen berücksichtigt. Die im Beispiel verwendeten

Ausgangswerte m1 , ... o5 der drei rechten Spalten der Matrix, sind entsprechend gekennzeichnet. Diese Anordnung bedingt eine erhöhte Anforderung an die Auflösung, die im Analog-Digital-Wandler 116 umgesetzt ist.

Die nötige Auflösung der Analog-Digital-Wandler 116 berechnet sich für Werte X wie im Beispiel mit 2-Bit Memristoren mit Z=4 und Y=1 aus

Für die Matrix der Dimension 3 x 3 beträgt mit 2 Bit Memristoren und 3 Bit Eingangswerten, d.h. nur 1 Bit pro Zeile der Matrix-Anordnung 100, die

Anzahl der Zustände die der Analog-Digital-Wandler 116 auflösen muss 84.

Das in Figur 14 dargestellte Berechnungs-Schema 1400 berücksichtigt diese Änderungen beispielhaft für alle Skalare j, k, I durch eine 12 Bit Summe S, die abhängig von einer ersten Ausgangsgröße m1 , einer zweiten Ausgangsgröße m3 und einer dritten Ausgangsgröße m5 bestimmt wird. Dazu wird die erste

Ausgangsgröße m1 mit ihrem LSB beginnend beim LSB der Summe S angeordnet. Die zweite Ausgangsgröße m3 wird mit ihrem LSB um zwei Stellen zum MSB der Summe S hin verschoben beginnend in einer weiteren Zeile angeordnet. Die dritte Ausgangsgröße m5 wird mit ihrem LSB um vier Stellen zum MSB der Summe S hin verschoben beginnend in einer weiteren Zeile angeordnet. Die Bestimmung der Summe S erfolgt spaltenweise.

Entsprechend wird für eine Erhöhung der Auflösung der Memristoren und der Eingangswerte verfahren.

Dazu wird die zuvor verwendete Zerlegung durch eine Vektorzerlegung mit den Faktoren 2°, 2², 2⁴ und mit der Substitution

wie folgt geändert:

Die Umsetzung dieser Gleichungsterme in eine Memristor Matrix erfolgt analog zur der anhand der Figur 13 beschriebenen Umsetzung.

Die resultierende Matrix-Anordnung 100 ist in Figur 15 dargestellt. Die Spannung an den Eingängen j1 , k1 , 11 ist im Unterschied zur vorherigen Umsetzung nun mit einem Faktor 4 beaufschlagt. Die Spannung an den Eingängen j2, k2, I2 ist im Unterschied zur vorherigen Umsetzung nun mit einem Faktor 16 beaufschlagt. Die geänderten Faktoren vor den Termen führen zu Anforderungen an die Analog-Digital-Wandler 1 16 hinsichtlich der Auflösung. Bei der 1 Bit Matrix mit 1 Bit Memristoren und 3 Bit Eingangswerten ist Z=1 und Y=1. Die nötige Auflösung Analog-Digital-Wandler 1 16 berechnet sich in diesem Beispiel mit 2-Bit

Memristoren und 6Bit Eingangswerten, d.h. mit Z=2 und Y= 2. Für die im Beispiel dargestellte Matrix der Dimension 3 x 3 mit 2 Bit Memristoren und 6 Bit

Eingangswerten, die 2 Bit pro Zeile betragen, beträgt Anzahl der Zustände die der Analog-Digital-Wandler 1 16 auflösen muss 1008.

Das in Figur 16 dargestellte Berechnungs-Schema 1600 berücksichtigt diese Änderungen beispielhaft für alle Skalare j, k, I durch eine 12 Bit Summe S, die abhängig von einer ersten Ausgangsgröße m1 , einer zweiten Ausgangsgröße m3 und einer dritten Ausgangsgröße m5 bestimmt wird. Dazu wird die erste

Die Klassische Berechnung einer n^*n Matrix benötigt n² Multiplikationen sowie n²- n Additionen. Im Fall einer 8x8 Matrix wären dies 64 Multiplikationen und 56 Additionen mit 8 Bit Eingangswerten, also mit 16 Bit Breite. Es werden ca. 1 18 Takte benötigt.

Das vorgeschlagene Verfahren benötigt 3^*8 Shift Operationen der

Eingangswerte und 8^*8 Additionen der Ausgangswerte sowie 64 AD Wandlungen mit 3 Bit Auflösung. Durch die hohe Parallelisierung werden jedoch nur etwa 10 Takte benötigt.

Das Verfahren ist auf Matrizen anderer Größen und Auflösungen

anwendbar.

In einem Aspekt ist eine Memristor-Anordnung vorgesehen, in der an einem Knoten von einer Zeile und einer Spalte der Matrix-Anordnung 100 zwei Memristoren angeordnet sind, die hinsichtlich ihrer ladungsabhängigen

Widerstandswerte in einander entgegengesetzter Richtung veränderlich sind. Diese können mit derselben Spannung gleichzeitig mit invertierten Gewichten programmiert werden. Zwei Stromwerte-Berechnungen können somit gleichzeitig ausgeführt werden. Eine der beiden Berechnungen verwendet dabei jedoch invertierte Gewichte. Dadurch werden vom Analog-Digital-Konverter Nullen gezählt, was entweder bei der Interpretation der Ergebnisse oder im

Algorithmus berücksichtigt werden kann. Diese Redundanz kann beispielsweise zur Plausibilisierung der Ergebnisse herangezogen werden.

Claims

Ansprüche

1. Verfahren zur Umsetzung einer Matrix-Operation, dadurch gekennzeichnet, dass für die Matrix-Operation ein erstes digitales Ergebnis abhängig von einer ersten analogen Addition mittels einer ersten Memristor-Anordnung (102) bestimmt wird, wobei ein zweites digitales Ergebnis abhängig von einer zweiten analogen Addition mittels einer zweiten Memristor-Anordnung (102) bestimmt wird und wobei das erste Ergebnis und das zweite Ergebnis digital addiert werden.

2. Verfahren nach Anspruch 1 , dadurch gekennzeichnet, dass das erste

digitale Ergebnis abhängig von einem ersten analogen Ergebnis bestimmt wird, wobei das zweite digitale Ergebnis abhängig von einem zweiten analogen Ergebnis bestimmt wird, wobei die analogen Ergebnisse zumindest teilweise zeitlich überlappend bestimmt werden.

3. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, dass an einen ersten Memristor der ersten Memristor-Anordnung (102) eine erste

Spannung angelegt wird (506), wobei an einen zweiten Memristor der Memristor-Anordnung (102) zumindest teilweise zeitlich überlappend dazu eine zweite Spannung angelegt wird (506), wobei an einem ersten Ausgang der Memristor-Anordnung ein erster Summenstrom erfasst wird, der den Stromfluss durch den ersten Memristor und den zweiten Memristor charakterisiert, wobei an einen dritten Memristor der zweiten Memristor- Anordnung (102) zumindest teilweise zeitlich überlappend dazu die erste Spannung angelegt wird (506), wobei an einen vierten Memristor der zweiten Memristor-Anordnung (102) zumindest teilweise zeitlich überlappend dazu die zweite Spannung oder eine dritte Spannung angelegt wird (506), wobei an einem zweiten Ausgang der Memristor-Anordnung ein zweiter

Summenstrom erfasst wird (506), der den Stromfluss durch den dritten Memristor und den vierten Memristor charakterisiert, wobei abhängig vom ersten Summenstrom und vom zweiten Summenstrom das Ergebnis bestimmt wird (508).

4. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, dass die erste Spannung abhängig von einem ersten Element einer ersten Matrix (AO, A1 , A2) definiert ist, wobei die zweite Spannung abhängig von einem zweiten Element der ersten Matrix (AO, A1 , A2) definiert ist, wobei ein erster

Widerstandswert des ersten Memristors abhängig von einem ersten Element einer zweiten Matrix (EO, E1 , E2) definiert ist, wobei ein zweiter

Widerstandwert des zweiten Memristors abhängig von einem zweiten Element der zweiten Matrix (EO, E1 , E2) definiert ist, und wobei das

Ergebnis ein Skalarprodukt der Matrizen charakterisiert.

5. Verfahren nach Anspruch 3, dadurch gekennzeichnet, dass wenigstens ein Widerstandswert eines Memristors abhängig von einem Element der zweiten Matrix (EO, E1 , E2) programmiert wird (504).

6. Verfahren nach einem der Ansprüche 3 oder 4, dadurch gekennzeichnet, dass der Widerstandswert von wenigstens zwei Memristoren abhängig von einem Element der zweiten Matrix (EO, E1 , E2) definiert ist oder

programmiert wird (504).

7. Verfahren nach einem der Ansprüche 3 bis 5, dadurch gekennzeichnet, dass eine Vielzahl Memristoren in einer Matrix-Anordnung (100) angeordnet ist, wobei die zweite Matrix oder eine Vielzahl zweiter Matrizen (E0, E1 , E2) eine Anordnung von Widerstandswerten für die Vielzahl der Memristoren definieren, und wobei ein Memristor in der Matrix-Anordnung (100) den Widerstandswert aufweist, oder mit dem Widerstandswert programmiert wird (504), der in der Anordnung der Widerstandswerte seiner Position in der Matrix-Anordnung (100) insbesondere bezüglich seiner Indizes entspricht.

8. Verfahren nach einem der Ansprüche 3 bis 6, dadurch gekennzeichnet, dass wenigstens zwei Gruppen von Memristoren Widerstandswerte aufweisen oder mit Widerstandswerten programmiert werden (504), die gemäß den Elementen derselben zweiten Matrix definiert sind.

9. Verfahren nach Anspruch 6, dadurch gekennzeichnet, dass die wenigstens ein Teil der Memristoren aus den wenigstens zwei Gruppen von Memristoren in der Matrix-Anordnung (100) zur Bestimmung desselben Summenstroms verwendet werden.

10. Verfahren nach Anspruch 6, dadurch gekennzeichnet, dass wenigstens einer der Memristoren aus einer der wenigstens zwei Gruppen von Memristoren in der Matrix-Anordnung (100) bei der Bestimmung des Summenstroms von Memristoren der anderen der wenigstens zwei Gruppen unberücksichtigt bleibt.

1 1. Verfahren nach einem der vorherigen Ansprüche, dadurch gekennzeichnet, dass die erste Spannung ein analoges Signal ist, das von einem Digital- Analog-Wandler (104) abhängig von einem digitalen Signal erzeugt wird, das durch das erste Element der ersten Matrix definiert ist, und/oder dass die zweite Spannung ein analoges Signal ist, das von einem Digital-Analog- Wandler (104) abhängig von einem digitalen Signal erzeugt wird, das durch das zweite Element der ersten Matrix definiert ist.

12. Verfahren nach einem der vorherigen Ansprüche, dadurch gekennzeichnet, dass sich die erste Spannung und die zweite Spannung um einen Faktor unterscheiden, insbesondere um eine Potenz von 2, der insbesondere abhängig von einer Auflösung des Analog-Digital-Wandlers (106, 1 16) oder abhängig von einer der Matrix-Operation zugrunde liegenden Bit-Faktoren- Zerlegung definiert ist.

13. Verfahren nach einem der vorherigen Ansprüche, dadurch gekennzeichnet, dass der erste Summenstrom wenigstens einen ersten Strom und einen zweiten Strom umfasst, wobei der erste Strom beim Anlegen der ersten Spannung an den ersten Memristor durch den ersten Memristor fließt, und wobei der zweite Strom beim Anlegen der zweiten Spannung an den zweiten Memristor durch den zweiten Memristor fließt.

14. Verfahren nach einem der vorherigen Ansprüche, dadurch gekennzeichnet, dass die erste Spannung zur selben Zeit an den ersten Memristor und einen dritten Memristor angelegt wird oder wobei die zweite Spannung zur selben Zeit an wenigstens den zweiten Memristor und einen vierten Memristor angelegt wird, wobei ein erster Summenstrom für den Strom durch den ersten Memristor und den zweiten Memristor erfasst wird, wobei ein zweiter Summenstrom für den Strom durch den dritten Memristor und/oder den vierten Memristor erfasst wird, und wobei das Ergebnis abhängig vom ersten Summenstrom und vom zweiten Summenstrom bestimmt wird.

15. Verfahren nach einem der vorherigen Ansprüche, dadurch gekennzeichnet, dass ein digitales Signal, das einen Wert wenigstens eines Bits definiert, durch einen Analog-Digital-Wandler (106, 116) abhängig vom Summenstrom bestimmt wird.

16. Verfahren nach einem der vorherigen Ansprüche, dadurch gekennzeichnet, dass eine Vielzahl Summenströmen bestimmt wird, wobei abhängig von der Vielzahl der Summenströme eine Vielzahl Bits bestimmt wird, wobei wenigstens ein Bit, das abhängig von einem der Summenströme definiert ist, zu wenigstens einem Bit addiert wird, das abhängig von einem anderen der Summenströme definiert ist.

17. Verfahren nach Anspruch 16, dadurch gekennzeichnet, dass wenigstes

eines der Bits in einem Register vor der Addition mit dem anderen Bit aus einem anderen Register bezüglich eines least significant bits des

Ergebnisses in Richtung des most significant bits des Ergebnisses verschoben angeordnet wird.

18. Verfahren nach Anspruch 16 oder 17, dadurch gekennzeichnet, dass

wenigstes eines der Bits in einem Register vor der Addition mit dem anderen Bit aus einem anderen Register bezüglich eines least significant bits des Ergebnisses benachbart zu dem anderen Bit angeordnet wird.

19. Verfahren nach einem der vorherigen Ansprüche, dadurch gekennzeichnet, dass eine Vielzahl Memristoren in einer Matrix-Anordnung (100) angeordnet ist, wobei die zweite Matrix oder eine Vielzahl zweiter Matrizen (E0, E1 , E2) eine Anordnung von Widerstandswerten für die Vielzahl der Memristoren definieren, und wobei ein Memristor in der Matrix-Anordnung (100) den Widerstandswert aufweist, oder mit dem Widerstandswert programmiert wird, der in der Anordnung der Widerstandswerte seiner Position in der Matrix- Anordnung (100) insbesondere bezüglich seiner Indizes entspricht. 20. Vorrichtung (100) zur Umsetzung einer Matrix-Operation, dadurch gekennzeichnet, dass die Vorrichtung (100) eine erste Memristor-Anordnung (102) und eine zweite Memristor-Anordnung (102) umfasst, wobei die Vorrichtung (100) eine ersten Analog-Digital-Wandler (106, 1 16) und einen zweiten Analog-Digital-Wandler (106, 1 16) umfasst, und wobei die

Vorrichtung (100) ausgebildet ist, für eine Matrix-Operation ein erstes digitales Ergebnis abhängig von einer ersten analogen Addition mittels der ersten Memristor-Anordnung (102) und des ersten Analog-Digital-Wandlers (106, 116) zu bestimmen, und ein zweites digitales Ergebnis abhängig von einer zweiten analogen Addition mittels der zweiten Memristor-Anordnung

(102) und des zweiten Analog-Digital-Wandlers (106, 1 16) zu bestimmen.

21. Vorrichtung (100) nach Anspruch 20, dadurch gekennzeichnet, dass an einen ersten Memristor der Memristor-Anordnung (102) eine erste Spannung anlegbar ist, wobei an einen zweiten Memristor der Memristor-Anordnung (102) zumindest teilweise zeitlich überlappend dazu eine zweite Spannung anlegbar ist, wobei an einem ersten Ausgang der Memristor-Anordnung (102) ein erster Summenstrom erfassbar ist, der den Stromfluss durch den ersten Memristor und den zweiten Memristor charakterisiert, wobei an einen dritten Memristor der Memristor-Anordnung (102) zumindest teilweise zeitlich überlappend dazu die erste Spannung anlegbar ist, wobei an einen vierten Memristor der Memristor-Anordnung (102) zumindest teilweise zeitlich überlappend dazu die zweite Spannung anlegbar ist, wobei an einem zweiten Ausgang der Memristor-Anordnung ein zweiter Summenstrom erfassbar ist, der den Stromfluss durch den dritten Memristor und den vierten Memristor charakterisiert.

22. Vorrichtung (100) nach einem der Ansprüche 20 oder 21 , dadurch

gekennzeichnet, dass eine Vielzahl Memristoren-Anordnungen (102) eine Matrix-Anordnung bildet.

23. Vorrichtung (100) nach einem der Ansprüche 20 bis 22, dadurch

gekennzeichnet, dass die Digital-Analog-Wandler (106, 1 16) zur Erfassung von Information über wenigstens einen Summenstrom ausgebildet sind.

24. Vorrichtung nach einem der Ansprüche 21 bis 23, dadurch gekennzeichnet, dass die Vorrichtung (100) einen ersten Analog-Digital-Wandler (104) insbesondere zur Erzeugung der ersten Spannung und einen zweiten

Analog-Digitalwandler (104) zur Erzeugung der zweiten Spannung umfasst.

25. Vorrichtung (100) nach einem der Ansprüche 20 bis 24, dadurch

gekennzeichnet, dass die Vorrichtung (100) eine Memristor-Anordnung vorsieht, in der an einem Knoten von einer Zeile und einer Spalte der Matrix- Anordnung (100) zwei Memristoren angeordnet sind, die hinsichtlich ihrer ladungsabhängigen Widerstandswerte in einander entgegengesetzter

Richtung veränderlich sind.

26. Vorrichtung (400), dadurch gekennzeichnet, dass die Vorrichtung (400) einen Mikroprozessor (404), eine Schalteinrichtung (402) und insbesondere einen Speicher (410) mit Registern aufweist, die ausgebildet sind, eine Vorrichtung gemäß einem der Ansprüche 20 bis 25 in einem Verfahren nach einem der Ansprüche 1 bis 19 anzusteuern.

27. Computerprogramm, welches Befehle umfasst, die beim Ausführen dieser mittels eines Computers, den Computer veranlassen das Verfahren nach einem der Ansprüche 1 bis 19 auszuführen.

28. Maschinenlesbares Speichermedium, auf welchem das Computerprogramm nach Anspruch 27 hinterlegt ist.