DE4414172C2

DE4414172C2 - Gleit-Komma-Arithmetikeinheit und Verfahren zur Division und Quadratwurzelberechnung, die eine modifizierte Newton-Raphson Technik verwendet

Info

Publication number: DE4414172C2
Application number: DE4414172A
Authority: DE
Inventors: Alan Karp; Dennis Brzezinski; Peter Markstein
Original assignee: Hewlett Packard Co
Current assignee: HP Inc
Priority date: 1993-05-05
Filing date: 1994-04-22
Publication date: 1998-09-03
Anticipated expiration: 2014-04-23
Also published as: DE4414172A1; GB2278940B; GB2278940A; GB9408712D0; US5515308A; JP3626769B2; US5341321A; JPH0749772A

Description

Die vorliegende Erfindung bezieht sich auf ein Datenverar beitungssystem mit einer Gleit-Komma-Arithmetikeinheit und insbesondere auf ein Verfahren und eine Vorrichtung zum Durchführen von Gleit-Komma-Divisions- und Quadratwurzel operationen.

Gleit-Komma-Arithmetikeinheiten sind seit langem dazu fähig, Divisions- und Quadratwurzeloperationen durchzuführen. Ob wohl zweckorientierte Divisions- und Quadratwurzelschal tungen bei Datenverarbeitungssystemen verwendet wurden, um Divisions- und Quadratwurzeloperationen durchzuführen, geht der derzeitige Trend dahin, diese Operationen unter Ver wendung einer Schaltung, die der Multiplikation und Addition zugeordnet ist, durchzuführen. Beispiele von Datenverarbei tungssystemen, die einen Multiplizierer und Addierer ver wenden, um eine Division oder Quadratwurzeloperation durch zuführen, sind in der Europäischen Patentanmeldung 89313402.3 (EPA-Veröffentlichungsnummer 0377992 A2), der Europäischen Patentanmeldung 85106938.5 (EPA-Veröffent lichungsnummer 0166999 A2) und in der Europäischen Pa tentanmeldung 82111929.4 (EPA-Veröffentlichungsnummer 0111587 A1) enthalten.

Durch das Ausschließen der zweckorientierten Divisions- und Quadratwurzelschaltung aus den Entwürfen von Gleit-Komma- Arithmetikeinheiten können Entwickler von Datenverarbei tungssystemen nicht nur die Kosten reduzieren, sondern eben falls Platz auf der Platine oder dem Baustein einsparen. Bei diesen Datenverarbeitungssystemen werden die Divisions- und Quadratwurzeloperationen unter Verwendung des Multiplizie rers und Addierers der Gleit-Komma-Arithmetikeinheit durch geführt. Dies ermöglicht es, mehr Entwurfszeit, Leistung und Fläche auf die wesentlich häufiger verwendete Addierer- und Multiplizierer-Hardware zu konzentrieren. Nachdem herausge funden wurde, daß etwa nur jede zehnte Operation, die in einem Datenverarbeitungssystem durchgeführt wird, eine Divi sions- oder Quadratwurzeloperation einschließt, sind solche Entwürfe realisierbar. Ein ständiges Problem bei diesem An satz besteht jedoch darin, daß Divisions- und Quadratwur zeloperationen eine erheblich längere Zeit zur Berechnung benötigen als dies Additions- und Multiplikationsoperationen tun. Dieser Unterschied der Berechnungszeit beruht auf der Tatsache, daß die Additions- und Multiplikationsoperationen direkt berechnet werden, während Divisions- und Quadratwur zeloperationen mittels einer iterativen Prozedur indirekt berechnet werden.

Iterative Prozeduren zur Division können abhängig von ihrem iterativen Operator in unterschiedliche Klassen eingeteilt werden. Eine Klasse verwendet die Subtraktion als iterativen Operator (z. B. nicht- umspeichernde Division), und eine an dere Klasse verwendet die Multiplikation als iterativen Ope rator. Die iterativen Prozeduren, die die Multiplikation als iterativen Operator verwenden, werden bevorzugt, weil sie die Ergebnisse wesentlich schneller berechnen. Genauer ge sagt werden für die Division diese iterativen Prozeduren verwendet, um einen Reziprokwert des Divisors zu erhalten und dann den Quotienten zu erhalten, wobei der sich erge bende Reziprokwert mit den Dividenden multipliziert wird. Es gibt zwei gut bekannte iterative Verfahren, die die Multi plikation als Iterativoperator verwenden, um den Reziprok wert zu bestimmen, nämlich die Serienerweiterung und Newton- Raphson. Von diesen iterativen Verfahren wird das Newton- Raphson-Verfahren am häufigsten verwendet. Eine allgemeine Beschreibung von iterativen Prozeduren zur Division kann bei Waser und Flynn, "Introduction to Arithmetic For Digital Sy stems Designers", New York, 1982, gefunden werden.

Das Newton-Raphson-Verfahren ist ein besonders attraktives Berechnungsverfahren für einen sehr schnellen Computer mit einem Gleit-Komma-Multiplizierer und einem Gleit-Komma- Addierer-Subtrahierer. Das Newton-Raphson-Verfahren wird nicht nur für die Division verwendet sondern ebenfalls für die Quadratwurzeloperation. Bei jeder Iteration konvergiert das Newton-Raphson-Verfahren quadratisch auf sein Ergebnis.

Herkömmlicherweise wird die Newton-Raphson-Iteration verwen det, um eine Näherung an den Nenner, im Fall der Division, oder die inverse Quadratwurzel, im Fall der Quadratwurzel, zu erreichen. Danach erhöht jede nachfolgende Newton-Raph son-Iteration die Genauigkeit des inversen Wertes. Sobald die erwünschte Genauigkeit erreicht ist, wird der inverse Wert mit dem Nenner, im Fall der Division, oder dem Ein gangsargument, im Fall der Quadratwurzeloperation, multipli ziert. Obwohl der herkömmliche Ansatz recht gut arbeitet, wenn die Ergebnisse auf eine Genauigkeit berechnet werden, die durch die der Addition und Multiplikation zugeordneten Hardware angeboten wird, ist der herkömmliche Ansatz unbe friedigend, wenn Ergebnisse mit höherer Präzision benötigt werden. Insbesondere erfordert es einen ungeheueren Zeitauf wand, um die abschließende Multiplikation (abschließender inverser Wert mal dem Nenner) für Resultate mit höherer Ge nauigkeit durchzuführen.

Es besteht folglich ein bestimmter Bedarf an einer verbes serten Technik zum Erhalten von sehr genauen Ergebnissen von Divisions- und Quadratwurzeloperationen, die mit einer er heblich höheren Geschwindigkeit arbeiten als der herkömm liche Ansatz.

Die EP 0,395,240 A2 offenbart einen numerischen Hochge schwindigkeitsprozessor für Divisions- und Quadratwurzelbe rechnungen mit einer Mehrzahl von Registern und einem Multi plizierer 38. Die Divisions- oder Quadratwurzelberechnung erfolgt derart, daß in einem ersten Schritt ein Startwert S ausgewählt wird, der das Ergebnis einer Multiplikation des Divisors mit dem Startwert Eins treibt. In den nachfolgenden Schritten erfolgt eine Iteration, die bewirkt, daß der aus gewählte Startwert so an einen Endwert angenähert wird, daß das Ergebnis einer Multiplikation von S mit dem Divisor Y näherungsweise 1 wird. Bei der Berechnung einer Quadratwur zel wird ein ausgewählter Startwert S an den Multiplizierer ausgegeben. Der numerische Prozessor über eine Operandensi gnalführung, eine Startwerterzeugungseinrichtung und eine Lo gikschaltung gesteuert.

Die US 5,157,624 betrifft ein Maschinenverfahren zum Durchführen von Newton-Iterationen für reziproke Quadratwur zeln. Eine Vorrichtung umfaßt eine Mehrzahl von Registern, Gleit-Komma-Multiplizierer, Gleit-Komma-Addierer und Sub trahierereinheiten zur Berechnung einer reziproken Quadrat wurzel. Die Berechnung gemäß dem Newton-Verfahren umfaßt das Auswählen eines Startwertes für den Reziprokwert der Qua dratwurzel und die Annäherung dieses ausgewählten Start wertes an einen Zielwert, wobei sich hierbei die Genauigkeit des angenäherten Wertes erhöht.

Die US 4,999,801 betrifft eine Gleit-Komma-Operationsein heit für Divisions- und Quadratwurzeloperationen, die die Betriebsgeschwindigkeit bei einer Divisions- oder Quadrat wurzeloperation durch eine Reduzierung der Anzahl von Zyklen durch Operationen erhöht.

Der vorliegenden Erfindung liegt die Aufgabe zugrunde, eine Vorrichtung und ein Verfahren zu schaffen, das die sehr ge naue und die sehr schnelle Erzeugung von Divisions- und Qua dratwurzeloperationen ermöglicht.

Diese Aufgabe wird durch eine Gleit-Komma-Arithmetikeinheit gemäß Anspruch 1 und Anspruch 2 sowie gemäß einem Verfahren nach Anspruch 7 oder Anspruch 8 gelöst.

Allgemein erzielt die Erfindung sehr genaue Divisions- und Quadratwurzelergebnisse, wobei eine modifizierte Form des Newton-Raphson-Verfahrens verwendet wird, bei dem keine Mul tiplikationen von Zahlen mit der Genauigkeit des Ergebnisses erforderlich sind.

Ein Ausführungsbeispiel der Erfindung führt Gleit-Komma- Divisions- und -Quadratwurzeloperationen in einem arith metischen Verarbeitungssystem mit einer Multipliziererein heit und einer Addierereinheit durch. Um die Divisions- und Quadratwurzel-Befehle auszuführen, schließt der Divisions- und Quadratwurzel-Mikrocode iterative Prozeduren ein, die sowohl auf der herkömmlichen Form des Newton-Raphson-Verfah rens und auch der modifizierten Form des Newton-Raphson-Ver fahrens basieren. Durch Verwendung der modifizierten Form des Newton-Raphson-Verfahrens erreicht die Erfindung eine wesentliche Verbesserung der Geschwindigkeit, mit der die Ergebnisse für eine sehr genaue Division und Quadratwurzel berechnet werden. Die Erfindung ermöglicht ebenfalls eine praktische Hardwareausführung, weil ein ungefähres Ergebnis mit fast 2N-Bits Genauigkeit ohne einen 2N-auf-2N breiten Multiplizierer erreicht werden kann.

Als Vorrichtung ist die Erfindung einer Gleit-Komma-Arithme tikeinheit zugeordnet. Die Erfindung ermöglicht es der Gleit-Komma-Arithmetikeinheit eine Gleit-Komma-Division eines Dividenden durch einen Divisor, um einen bestimmten Quotienten zu erzeugen, oder eine Gleit-Komma-Quadratwurzel operation eines Wertes, um eine bestimmte Quadratwurzel zu erzeugen, durchzuführen. Die Vorrichtung schließt ein Spei cherbauelement mit mehreren Anschlüssen zum Speichern von Daten, eine arithmetische Einrichtung zum Multiplizieren von zwei Zahlen, um ein Produkt zu erzeugen, und zum Addieren von zwei Zahlen, um eine Summe zu erzeugen, einen Divisions- und Quadratwurzel-Mikrocode, der die iterativen Prozeduren zum Durchführen der Dividierer- und Quadratwurzeloperationen enthält, eine Reziprokwertnäherungseinrichtung zum Enthalten der anfänglichen Näherungen der Reziprokwerte des Divisors und der Reziprokwerte der Quadratwurzel des Wertes, und eine Steuerungseinheit zum Steuern der Gleit-Komma-Einheit ein. Die iterativen Prozeduren, die in dem Divisions- und Qua dratwurzel-Mikrocode enthalten sind, führen die Divisions- und Quadratwurzel-Operationen aus, um den bestimmten Quo tienten und die Quadratwurzel mit einer Genauigkeit in der Nähe von 2N-Bits zu erzeugen, ohne daß 2N-mal-2N-Bit Multi plikationen erforderlich sind.

Als Verfahren führt die Erfindung eine Divisions- oder Qua dratwurzeloperation in einem Datenverarbeitungssystem aus, um ein sehr genaues Ergebnis zu erzeugen. Anfänglich wird eine Näherung eines Reziprokwertes erhalten. Die Näherung des Reziprokwertes kann zum Beispiel aus eines Reziprokwert näherungstabelle erhalten werden. Als nächstes werden eine oder mehrere Iterationen eines herkömmlichen Newton- Raphson-Verfahrens durchgeführt, um die Genauigkeit des Re ziprokwertes zu erhöhen. Danach wird eine zusätzliche Iteration unter Verwendung eines modifizierten Newton-Raph son-Verfahrens durchgeführt, um das sehr genaue Ergebnis zu erzeugen.

Bevorzugte Ausführungsbeispiele der vorliegenden Erfindung werden nachfolgend unter Bezugnahme auf die beiliegenden Zeichnungen näher erläutert. Es zeigen:

Fig. 1 ein Blockdiagramm einer Gleit-Komma-Arithmetikein heit gemäß einem ersten Ausführungsbeispiel der Er findung;

Fig. 2 ein Blockdiagramm einer Gleit-Komma-Arithmetikein heit gemäß einem zweiten Ausführungsbeispiel der Erfindung;

Fig. 3 ein Flußdiagramm der grundsätzlichen Operationen, die durch eine Steuerungseinheit ausgeführt werden;

Fig. 4 ein Flußdiagramm der grundsätzlichen Operationen, die durch den Divisions- und Quadratwurzel-Mikro code ausgeführt werden;

Fig. 5 ein Flußdiagramm der detaillierten Operationen, die durch den Divisions-Mikrocode ausgeführt werden; und

Fig. 6 ein Flußdiagramm der detaillierten Operationen, die durch den Quadratwurzel-Mikrocode ausgeführt wer den.

Die Erfindung ist zur Verwendung in einer Gleit-Komma-Arith metikeinheit vorgesehen. Die Erfindung ermöglicht es einer Gleit-Komma-Arithmetikeinheit, Ergebnisse mit einer Genauig keit zu produzieren, die mindestens zweimal derjenigen ent spricht, die durch die Hardware angeboten wird. Bevorzugter weise erzeugt die Erfindung eine 2N-Bit Näherung (volle Ge nauigkeit) aus einer N-Bit Näherung (Halb-Genauigkeit). Wenn die Hardware zum Beispiel fähig ist, doppelt genaue Erge bnisse bereit zu stellen, wird die Erfindung vierfach genaue Ergebnisse erzeugen. Die Erfindung ist ebenso auf mehrfach genaue Zahlen anwendbar. Mehrfach genaue Zahlen sind Zahlen mit einer Genauigkeit größer als die Vierfachgenauigkeit. Diese Zahlen können in einem einfach genauen Gleit-Komma- Array gespeichert sein. Bei einer Ausführung ist das erste Wort in dem Array eine Gleit-Komma-Zahl mit ganzzahligem Wert, deren Absolutwert die Anzahl der Wörter in der Man tisse darstellt. Das Vorzeichen des ersten Worts ist das Vorzeichen der mehrfach genauen Zahl. Das nächste Wort ist eine Gleit-Komma-Zahl mit ganzzahligem Wert, die den Ex ponenten der Basis darstellt. Der Dezimalpunkt folgt dem ersten Mantissenwort. Bekannte Softwarebibliotheksroutinen sind erhältlich, um mathematische Operationen bezüglich dieser Zahlen auszuführen. Siehe zum Beispiel Bailey, "A Portable High Performance Multiprecision Package", RNR Technical Report RNR-90-022, NAS Applied Research Branch, NASA Ames Research Center, Moffett Field, Kalifornien, Mai 1992.

Ausführungsbeispiele der Erfindung werden im Folgenden in den Fig. 1 bis 6 beschrieben. Für Fachleute ist es jedoch offensichtlich, daß die hier gegebene detaillierte Beschrei bung bezüglich dieser Figuren aus erklärenden Gründen er folgt, nachdem sich die Erfindung über diese beschränkten Ausführungsbeispiele hinaus erstreckt.

Fig. 1 stellt ein erstes Ausführungsbeispiel einer Gleit- Komma-Arithmetikeinheit 100 dar. Dieses Ausführungsbeispiel speichert vierfach genaue Zahlen in einem Doppel-Doppel-For mat. Die Arithmetikeinheit 100 schließt eine getrennte Schaltung für die Multiplikation und Addition ein.

Eine Registerdatei 102 mit mehreren Anschlüssen schließt Leseanschlüsse A, B, C, D und E und Schreibanschlüsse F, G, H und I ein. Die Registerdatei 102 speichert Daten mit einer N-Bit Wortgröße. Eine Multiplikationseinheit 104 ist mit den Leseanschlüssen A und B verbunden, um jeweils einen Multi plikanden und einen Multiplikator zu empfangen. Die Multi plikationseinheit 104 stellt einem Übertragübergabeaddierer (CPA = Carry Propagate Adder) 106 ein hohes Teilprodukt und ein niedriges Teilprodukt bereit. Der CPA 106 addiert das hohe und das niedrige Teilprodukt. Die durch den CPA 106 er zeugte Summe wird dann durch einen Rundungsaufwärtszähler 108 auf 2N-Bits gerundet.

Das gerundete Ergebnis besteht aus zwei N-Bitabschnitten, die jeweils in einem Zwischenspeicher für ein hohes Produkt 110 und in einen Zwischenspeicher für ein niedriges Produkt 112 enthalten sind. Ein Multiplexer 114 empfängt die zwi schengespeicherten N-Bitabschnitte von den Zwischenspeichern 110, 112. Der Ausgang des Multiplexers 114 ist mit dem Schreibanschluß F der Registerdatei 102 verbunden, so daß die zwei N-Bitabschnitte der Multiplikationsoperationen in der Registerdatei 102 in zwei Schreiboperationen, eine für den hohen Abschnitt und eine für den niedrigen Abschnitt, gespeichert werden können.

Entsprechend stellen die Leseanschlüsse A und B der Multi plikationseinheit 104 den Multiplikanden und den Multipli kator bereit. Die Ergebnisse der Multiplikation bestehen aus zwei N-Bitwerten, die gerundet sind und an den Schreiban schluß F der Registerdatei 102 zur vorübergehenden Spei cherung weitergegeben werden.

Andere Anschlüsse der Registerdatei 102 sind der Additions schaltung der Gleit-Komma-Arithmetikeinheit 100 zugeordnet. Ein Synchronisationsschieber 116 empfängt die Summanden von den Leseanschlüssen C und D der Registerdatei 102 und syn chronisiert sie für die Addition. Ein Übertragübergabead dierer (CPA) 118 addiert dann die synchronisierten Werte und führt eine Summe einem Normalisierungsschieber 120 zu. Die normalisierte Summe wird dann durch einen Rundungsaufwärts zähler auf 2N-Bits gerundet, um eine gerundete Summe zu er zeugen. Die ersten N-Bits der gerundeten Summe werden in einem Zwischenspeicher 124 für eine hohen Abschnitt zwi schengespeichert und die zweiten N-Bits der gerundeten Summe werden in einem Zwischenspeicher 126 für einen niedrigen Abschnitt zwischengespeichert. Ein Multiplexer 128 empfängt die zwischengespeicherten Summen von den Zwischenspeichern 124, 126 als Eingangssignale und gibt die zwischengespei cherten Summen in zwei Durchgängen zurück an den Schreiban schluß G.

Eine Steuerungseinheit 130 empfängt auszuführende Befehle und gibt die notwendigen Steuerungssignale 132 an die ver schiedenen Schaltungen, die in Fig. 1 gezeigt sind. Die Steuerungseinheit 130 steuert daher die Multiplikations- und Additionsschaltung, um die Befehle auszuführen.

Um die Gleit-Komma-Arithmetikeinheit anzupassen, so daß sie Divisions- und Quadratwurzel-Befehle unter Verwendung ihrer Multiplikations- und Additionsschaltung ordnungsgemäß aus führt, kann durch die Steuerungseinheit 130 auf einen Divi sions- und Quadratwurzel-Mikrocode 134 zugegriffen werden. Die iterativen Prozeduren, die innerhalb des Divisions- und Quadratwurzel-Mikrocodes 134 enthalten sind, werden später genauer beschrieben. Nachdem die iterativen Prozeduren mit einem anfänglichen Schätzwert oder Näherung eines Reziprok wertes oder einer reziproken Quadratwurzel beginnen, sind Näherungstabellen 136 für den Reziprokwert oder die Rezi prokquadratwurzel innerhalb der Gleit-Komma-Arithmetik schaltung 100 eingeschlossen. Diese Näherungswerte werden der Registerdatei 102 zugeführt, so daß sie entweder in der Multiplikationsschaltung oder der Additionsschaltung ver wendet werden können.

Tabelle 1 zeigt einige Beispiele (im dezimalen Format) einer Reziprokwertnäherungstabelle und Tabelle 2 stellt dasselbe für eine Näherungstabelle für eine reziproke Quadratwurzel dar.

Tabelle 1 Division

A
Näherung
0.1	10.0
0.2	5.0
0.3	3.33
0.4	2.50
0.5	2.00
0.6	1.67
0,7	1.43
0,8	1.25
0.9	1.11
1.0	1.0

Tabelle 2 Quadratwurzel

A
Näherung √U/A
0.1	3.16
0.2	2.24
0.3	1.83
0.4	1.58
0.5	1.41
0.6	1.29
0,7	1.20
0,8	1.12
0.9	1.05
1.0	1.00

Die tatsächlichen Näherungstabellen würden viel mehr Ein träge in der hexadezimalen Darstellung enthalten, wie etwa im Anhang A der Europäischen Patentanmeldung 89313402.3 (EPA-Veröffentlichungsnummer 0377992 A2), deren Offenba rungsgehalt hiermit durch Bezugnahme aufgenommen ist.

In jedem Fall stellen die Näherungen, die in den Näherungs tabellen 136 gespeichert sind, lediglich die ersten wenigen Bits des erwünschten Reziprokwertes dar. Nachdem eine Ta belle für alle möglichen Gleit-Komma-Zahlen unpraktisch groß wäre, ist ein Exponenteinsteller 138 vorgesehen, um den Ex ponenten herauszuziehen und einzustellen. Der Exponentein steller 138 speichert und erhält Daten von der Registerdatei 102 über den Schreibanschluß I bzw. den Leseanschluß E. Durch getrenntes Behandeln des Exponenten- und Mantissen- Feldes der Gleit-Komma-Zahlen können die Näherungstabellen in einer verwaltbaren Größe aufgebaut werden. Für die Divi sion werden die Mantissenbits verwendet, um die entsprechen den Einträge aus den Näherungstabellen 136 auszuwählen und der Exponenteinsteller 138 zieht den Exponenten heraus und stellt ihn durch Verwenden des negativen Exponenten ein. Für die Quadratwurzeloperation wird wiederum die Mantisse ver wendet, um die geeigneten Einträge aus den Näherungstabellen 136 auszuwählen, der Exponenteinsteller ist aber kompli zierter. Wenn der Exponent gerade ist, reduziert der Expo nenteinsteller 138 den Exponenten um eine Hälfte. Wenn der Exponent ungerade ist, modifiziert der Exponenteinsteller 138 den Exponenten derart, daß vom Exponenten Eins abgezogen wird und der Exponent dann um die Hälfte reduziert wird. In jedem Fall ist der eingestellte Exponent mit der iterativen Prozedur verbunden, bevor die Näherung verwendet wird.

Fig. 2 ist ein Blockdiagramm einer Gleit-Komma-Arithmetik einheit 200 gemäß einem zweiten Ausführungsbeispiel der Erfindung. Die Gleit-Komma-Arithmetikeinheit 200, die in Fig. 2 dargestellt ist, weist einen verschmolzenen Multipli kations-Additionsentwurf auf (MAF = multiply-add-fused design). Das heißt, eine Multiplikationseinheit und ein Ad dierer sind zusammen verschmolzen, so daß die Multiplikation und die Addition als eine Operation auftreten können.

Eine Registerdatei mit mehreren Anschlüssen 202 schließt Le seanschlüsse A, B, C und D und Schreibanschlüsse E, F und G ein. Eine Multiplikationseinheit 204 empfängt einen Multi plikanden und einen Multiplikator von den Leseanschlüssen A und B und erzeugt ein Produkt. Ein Synchronisationsschieber 206 empfängt einen Summanden von dem Leseanschluß D und synchronisiert den Summanden gemäß dem Exponenten des Pro dukts, unter Verwendung eines Signals 207 von der Multipli kationseinheit 204.

Ein 3 : 2-Übertragsicherungsaddierer 208 empfängt Eingangs signale von der Multiplikationseinheit 204 und dem Synchro nisationsschieber 206 und stellt einem Übertragübergabead dierer 210 mindestens 2N-Bits eines Ausgangssignals bereit. Die Erfindung erfordert lediglich die Verwendung der füh renden 2N-Bits des Übertragsicherungsaddierers 208. Der Übertragübergabeaddierer 210 erzeugt ein 2N-Bit Ergebnis, das dann durch einen Normalisierungsschieber 212 normali siert wird und durch einen Rundungsaufwärtszähler 214 auf ein 2N-Bit Ergebnis gerundet wird. Das gerundete Ergebnis wird dann in zwei N-Bit Abschnitten einem Zwischenspeicher 216 für einen hohen Abschnitt bzw. einem Zwischenspeicher 218 für einen niedrigen Abschnitt zugeführt. Ein Multiplexer 220 empfängt die zwischengespeicherten N-Bit Abschnitte von den Zwischenspeichern 216, 218. Der Ausgang des Multiplexers 220 ist mit dem Schreibanschluß F der Registerdatei 202 ver bunden, so daß die zwei N-Bits Abschnitte in der Register datei 202 in zwei Schreiboperationen, eine für den hohen Abschnitt und eine für den niedrigen Abschnitt, gespeichert werden können.

Eine Steuerungseinheit 222 empfängt einen Befehl und führt diesen aus. Genauer gesagt steuert die Steuerungseinheit 222 die Schaltung der Gleit-Komma-Arithmetikeinheit 200 unter Verwendung verschiedener Steuerungssignale 224. Wenn der an der Steuerungseinheit 222 empfangene Befehl entweder ein Divisions-Befehl oder ein Quadratwurzel-Befehl ist, greift die Steuerungseinheit 222 auf den Divisions- und Quadratwur zel-Mikrocode 226 zu, um die iterativen Prozeduren auszufüh ren, die erforderlich sind, um die Divisions- und Quadrat wurzeloperation unter Verwendung der Multiplikations- und Additions-Schaltung durchzuführen.

Obwohl die erforderlichen iterativen Prozeduren später be schrieben werden, erfordern die iterativen Prozeduren die Verwendung von anfänglichen Näherungen oder Schätzwerten für einen Reziprokwert oder einen Reziprokwert für die Quadrat wurzel, die in den Näherungstabellen 228 für den Reziprok wert und die reziproke Quadratwurzel gespeichert sind. Ta belle 1 und 2 enthalten ein Beispiel einer Näherungstabelle für einen Reziprokwert und einer Näherungstabelle für eine reziproke Quadratwurzel. Die geeigneten Näherungen werden durch die Steuerungseinheit 222 (über die Steuerungssignale 224) ausgewählt und dem Schreibanschluß G zugeführt, so daß die Gleit-Komma-Arithmetikeinheit 200 die durch den Mikro code 226 angeforderten iterativen Prozeduren ausführen kann. Ein Exponenteinsteller 230 ist mit dem Leseanschluß C und dem Schreibanschluß E der Registerdatei 202 verbunden und ist genauso wirksam wie der oben beschriebene Exponentein steller 138.

Aus Verhaltensgründen können das erste und das zweite Aus führungsbeispiel (Fig. 1 und 2) unter Verwendung einer gut bekannten Schaltung weiter verbessert werden. Um zum Bei spiel die Verarbeitung von Befehlsfolgen zu vereinfachen, können zusätzliche Zwischenspeicher zwischen die Register datei und die Multiplikationseinheit oder den Synchronisie rungsschieber hinzugefügt werden. Es könnten ebenfalls Mul tiplexer zwischen die Registerdatei 102 und die Multiplika tionseinheit 104 und den Synchronisierungsschieber eingefügt werden, um die Multiplikationseinheit oder den Synchroni sierungsschieber schneller mit Eingangssignalen zu versor gen. Nichtsdestoweniger sind diese und zahlreiche andere gut bekannte Verbesserungen kein Teil der Erfindung, sondern sind hauptsächlich Entwurfsauswahlen für die Hardware und sind aus diesem Grund hier nicht weiter beschrieben.

Obwohl das erste und das zweite Ausführungsbeispiel (Fig. 1 und Fig. 2) mit Näherungstabellen 136, 228 für die Rezi prokwerte beschrieben sind, kann der anfängliche Schätzwert oder die Näherung eines Reziprokwertes oder einer reziproken Quadratwurzel auch durch andere Einrichtungen erhalten wer den. Es ist in Fachkreisen zum Beispiel bekannt, daß solche Näherungen unter Verwendung einer polynomen Gleichung er haltbar sind, um die Koeffizienten zu erhalten, die ver wendet werden, um die Näherung zu erzeugen. Siehe zum Bei spiel Cody und Waite, "Software Manual for the Elementary Functions", Seiten 17-27, 1980; A. Karp, "Speeding up N-Body Calculations on Machines without Hardware Square Root", IBM Scientific Center, Doc. No. G320-3565, April 1992.

Fig. 3 ist ein Flußdiagramm der grundsätzlichen Prozeduren, die durch die Steuerungseinheit 130, 222 durchgeführt oder gesteuert werden. Wenn die Steuerungseinheit 130, 222 einen Befehl empfängt, treten verschiedene Operationen in einer Gleit-Komma-Arithmetikeinheit auf. Anfänglich wird der Be fehl decodiert 302 und seine Operanden werden gelesen 304. Als nächstes wird eine Entscheidung 306 getroffen, die da rauf basiert, ob ein spezieller Fall existiert oder nicht. Ein spezieller Fall existiert, wenn die Operanden keine normalen Zahlen sind. Wenn die Operanden keine normalen Zahlen sind, erfolgt gemäß dem IEEE-Standard 754-1985 ein "Fix-up" 308 und die Flußsteuerung fährt fort, als ob die Zahlen anfänglich normal wären. Wenn zum Beispiel eine der Zahlen 0,02×10⁻³ ist, würde ein "Fix-up" auf 0,2×10⁻⁴ erfolgen (in diesem Fall normalisiert), bevor die Verarbei tung weiter geht.

Als nächstes wird eine Entscheidung getroffen 310, die dar auf basiert, ob der Befehl ein Divisions-Befehl ist oder nicht. Wenn der Befehl ein Divisions-Befehl ist, führt die Steuerungseinheit 130, 222 den Divisions-Mikrocode 156, 238 aus 312. Nach der Vollendung des Divisions-Mikrocodes 134, 226 kehrt die Flußsteuerung zum Schritt 302 zurück, um den nächsten Befehl zu decodieren.

Wenn die Entscheidung 310 feststellt, daß der Befehl kein Divisions-Befehl ist, wird eine Entscheidung 314 durchge führt, die darauf basiert, ob der Befehl ein Quadratwurzel- Befehl ist oder nicht. Wenn der Befehl ein Quadratwurzel-Be fehl ist, führt die Steuerungeinheit 130, 222 den Quadrat wurzel-Mikrocode 134, 226 aus, und der Steuerungsfluß kehrt dann zum Schritt 302 zurück, um den nächsten Befehl zu de codieren. Wenn andererseits erkannt wird 314, daß der Befehl kein Quadratwurzel-Befehl ist, dann wird eine Multiplika tionsoperation 318 und/oder eine Additionsoperation 320 auf herkömmliche Art durch die Multiplikationseinheit 104, 204 und den Addierer 118, 208, die in Fig. 1 und 2 dargestellt sind, ausgeführt. Danach wird ein Ergebnis zur vorübergehen den Speicherung in die Registerdatei 102, 202 zurückge schrieben 322.

Fig. 4 ist ein Flußdiagramm der grundsätzlichen Prozedur, die durch den Divisions- und Quadratwurzel-Mikrocode 134, 226 aufgerufen wird. Die Prozedur beginnt mit dem Erhalten eines genäherten Reziprokwertes 402. Die anfänglichen Rezi prokwerte für den Divisor im Fall der Division oder die Quadratwurzel selbst im Fall der Quadratwurzel sind in den Näherungstabellen 136, 228 für den Reziprokwert und die re ziproke Quadratwurzel gespeichert. Beispiele dieser Tabellen 136, 228 sind in den Tabellen 1 und 2 enthalten, die oben beschrieben wurden. Wenn ein Divisions- oder Quadratwurzel- Befehl durch die Steuerungseinheit 130, 222 empfangen wird, greift die Steuerungeinheit 103, 222 auf die Näherungsta bellen 136, 228 für den Reziprokwert oder die reziproke Qua dratwurzel zu, um einen genäherten Reziprokwert zu erhalten 402. Wenn zum Beispiel ein Befehl empfangen wird, um 1 durch 0,9 zu teilen, würde die Steuerungeinheit 130, 222 unter Verwendung des Divisors als Index auf die Tabelle 136, 228 zugreifen, um den Wert 1,11 auszulesen.

Als nächstes ist die Prozedur wirksam, um n Iterationen des Newton-Raphson-Verfahrens durchzuführen 404, um die Genauig keit des Reziprokwertes zu verbessern. Diese n Iterationen verwenden eine herkömmliche Form des Newton-Raphson-Verfah rens, die Fachleuten bekannt ist. Die Verbesserung der Ge nauigkeit des Reziprokwertes konvergiert unter Verwendung des Newton-Raphson-Verfahrens geometrisch. Sobald die ersten n Iterationen des Newton-Raphson-Verfahrens durchgeführt wurden, wird die letzte oder (n + 1)-te Iteration unter Ver wendung eines modifizierten Newton-Raphson-Verfahrens aus geführt 406. Diese letzte Operation ist direkt wirksam, um das Ergebnis zu erzeugen, das heißt, den Wert des Quotienten oder der Quadratwurzel.

Der Vorteil der Erfindung besteht darin, daß die letzte Ope ration wirksam ist, um zwei Zahlen mit halber Genauigkeit zu multiplizieren, wohingegen die herkömmliche Technik es er fordern würde, die Multiplikation von zwei Zahlen mit voll ständiger Genauigkeit als Trennungsschritt nach der letzten Iteration des Newton-Raphson-Verfahrens durchzuführen, das in dem herkömmlichen Fall lediglich den Reziprokwert schafft.

Die durch die Erfindung verwendete Prozedur, um einen Quo tienten oder eine Quadratwurzel zu erhalten, enthält ver schiedene Kombinationen von Genauigkeiten der Multiplika tionsoperationen. Einige dieser Kombinationen der Genauig keiten sind in Tabelle 3 dargestellt.

Tabelle 3

In der Tabelle 3 werden folgende Bezeichnungen verwendet. A und B sind Zahlen mit vollständiger Genauigkeit mit 2N Stel len, während a und b Zahlen mit halber Genauigkeit mit N Stellen sind. Der Index (kd) zeigt die Anzahl (k) von Wör tern mit halber Genauigkeit in dem Ergebnis an, wobei (d) die Hardwaregenauigkeit bezeichnet. V_d kann zum Beispiel hardwaremäßig berechnet sein, und U_2d kann hardwaremäßig er hältlich sein, aber wenn dies nicht der Fall ist, kann eine Software (unten beschrieben) eine Einzel-Einzel Darstellung verwenden, um das gleiche zu erzeugen. Die Aufwandsab schätzungen, die in Tabelle 3 enthalten sind, sind für Ope rationen mit doppelter Genauigkeit, die Ergebnisse mit vier facher Genauigkeit, die hardwaremäßig (Q_h) und softwaremäßig (Q_s) erhalten wurden, zurückgeben. Zusätzlich sind die Auf wandsabschätzungen für herkömmliche Operationen mit mehr facher Genauigkeit bis zu einigen hundert Stellen (C) und für die schnelle Fouriertransformationsmultiplikation für Zahlen mit mehr als einigen hundert Stellen (F) angegeben. Der relative Aufwand ist relativ zu einer Halbgenauigkeit mal Halbgenauigkeits-Multiplikation, von der angenommen wird, während einer Zeiteinheit stattzufinden.

Die Operationen, die dem Divisions- und Quadratwurzel-Mikro code 134, 226 zugeordnet sind, werden im Folgenden getrennt beschrieben. Der Divisions-Mikrocode wird ausgeführt, um einen Divisions-Befehl auszuführen, während der Quadrat wurzel-Mikrocode ausgeführt wird, um einen Quadratwurzel-Be fehl durchzuführen.

Die durch den Divisions-Mikrocode durchgeführten Operationen werden im Folgenden in Fig. 5 beschrieben, die ein Flußdia gramm der detaillierten Operationen darstellt, die durch den Divisions-Mikrocode ausgeführt werden. Der Division-Mikro code schließt sowohl das herkömmliche Newton-Raphson-Ver fahren und das modifizierte Newton-Raphson-Verfahren ein, um die Vorteile der Erfindung zu erzeugen.

Um eine Division durchzuführen, bestimmt das Newton-Raphson- Verfahren zuerst einen Reziprokwert des Divisors und dann wird der sich ergebende Reziprokwert mit dem Dividenden multipliziert. Das Divisionsverfahren kann durch die folgen de Gleichung dargestellt werden.

Im allgemeinen kann jede Iteration für den Reziprokwert des Wertes (A) gemäß dem Newton-Raphson-Verfahren durch die folgende Gleichung ausgedrückt werden.

x_n+1 = x_n+x_n(1-Ax_n)

Die ersten n Iterationen (d. h. alle außer der letzten Ite ration) einer Berechnung mit hoher Genauigkeit werden unter Verwendung der obigen Gleichung durchgeführt 404, wie es herkömmlich gemacht wird. Jede Iteration schließt folgende Operationen ein: Erhalten 502 eines anfänglichen Schätzwer tes für einen Reziprokwert des Divisors gemäß einer Rezi prokwerttabelle, wie sie in Tabelle 1 gezeigt ist, Bestimmen 504 eines Restfehlers für den Schätzwert und Erhöhen 506 der Genauigkeit des Schätzwertes auf der Grundlage des Restfeh lers und des vorhandenen Schätzwertes.

Die Anzahl der erforderlichen Iterationen, um das Ergebnis mit einer bestimmten Genauigkeit zu erzeugen, hängt von der Genauigkeit des anfänglichen Schätzwertes ab. Wenn der an fängliche Schätzwert aus der Reziprokwerttabelle zum Bei spiel auf 8-Bits genau ist und das Ergebnis 128 Bits sein soll, dann ist eine Gesamtheit von vier Iterationen notwen dig. In diesem Fall verwenden die ersten drei (d. h. n) Ite rationen das herkömmliche Newton-Raphson-Verfahren und die letzte und vierte Iteration verwendet das modifizierte New ton-Raphson-Verfahren. Nachdem sich die Genauigkeit bei je der Iteration verdoppelt, ist dann, wenn die Genauigkeit als größer oder gleich N-Bits festgestellt wird 508, nur eine weitere Iteration notwendig, um ein Ergebnis mit einer Ge nauigkeit von 2N-Bits zu erhalten. Mit Bezug auf das obige Beispiel können die Iterationen des herkömmlichen Newton- Raphson-Verfahrens eingestellt werden, wenn die Genauigkeit des Schätzwertes gleich 64 Bits ist oder diese überschrei tet.

Solange die Näherung ungenauer ist als das Basiszahlenformat (d. h. < N) verwenden frühe Iterationen bevorzugterweise die Hardware-Addition und -Multiplikation. Bei jeder Iteration nach dieser Genauigkeit wird die Anzahl der übertragenen Stellen verdoppelt, um mit der Genauigkeit der Näherung übereinzustimmen, siehe Bailey, "A Portable High Performance Multiprecision Package", RNR Technical Report RNR-90-022, NAS Applied Research Branch, NASA Ames Research Center, Moffett Field, Kalifornien, Mai 1992.

Die Erfindung modifiziert das herkömmliche Newton-Raphson- Verfahren durch Durchführen der Multiplikation mit dem Wert (B) vor der letzten Iteration ((n+1)-te Iteration) bei der Bestimmung des Reziprokwertes des Wertes (A). Die folgenden Gleichungen zeigen, wie die letzte Iteration für die Rezi prokwertberechnung durch das bevorzugte Ausführungsbeispiel der Erfindung modifiziert ist.

Herkömmlicherweise kann die letzte Iteration wie folgt aus gedrückt werden.

x_n+1 = x_n+x_n(1-Ax_n)

Zu diesem Zeitpunkt, bevor die letzte Iteration ausgeführt wird, wie es herkömmlicherweise gemacht würde, wird die letzte Iteration mit dem Wert (B) multipliziert. Die letzte Iteration kann dann wie folgt ausgedrückt werden.

Bx_n+1 = Bx_n+Bx_n(1-Ax_n)

Danach wird die obige Gleichung durch Hineinziehen des Wertes (B) in die Klammer vereinfacht. Als ein Ergebnis kann die obige Gleichung wie folgt geschrieben werden.

Bx_n+1 = Bx_n+x_n(B-A(Bx_n))

Die obige Gleichung kann durch Zuordnen von y_n=Bx_n weiter vereinfacht werden. Die abschließende Iteration nach New ton-Raphson für die Division gemäß der Erfindung kann dann durch die folgende Gleichung ausgedrückt werden.

y_n+1 = y_n+x_n(B-Ay_n)

Es ist wichtig, den Multiplikanden in die Klammern zu brin gen. Das Ergebnis ist nämlich, daß der Restfehler (B-Ay_n) auf der Grundlage der Zahl, die korrigiert wird, d. h. y_n, berechnet wird. Daher wird y_n+1 mit fast 2N-Bits richtig sein, sogar wenn y_n nur aus N-Bits berechnet ist.

Weiterhin ist y_n+1 das erwünschte genäherte Endergebnis der Division von B/A, das fast bis zu der Anzahl von Stellen einer Zahl mit vollständiger Genauigkeit genau ist. Das End ergebnis ist speziell bis auf wenige hintere Stellen (ULP = Units in the Last Place) genau.

Die einzelnen Operationen für die abschließende Iteration des modifizierten Newton-Raphson-Verfahrens können gemäß der folgenden Schritte aus Tabelle 4 durchgeführt werden 406.

Tabelle 4

Bei einem verschmolzenen Multiplikations-Additions-Entwurf (MAF) (Fig. 2) können sowohl der Schritt 2 und der Schritt 3, als auch die Schritte 4 und 5 miteinander verschmolzen sein.

In Fig. 5 bestimmt der Schritt 1 510 einen abgeschätzten Quotienten (y_n) unter Verwendung des Schätzwertes (x_n) und des Dividenden (B). Dann bestimmen die Schritte 2 und 3 512 einen Restfehler (B-Ay_n) für den abgeschätzten Quotienten. Bei den Schritten 4 und 5 wird abschließend die Genauigkeit des abgeschätzten Quotienten auf fast 2N-Bits erhöht 514.

Folglich liegt die einzige aufwendige Operation für die Division, die bei der letzten Iteration notwendig ist, beim Schritt 2, wo eine Zahl A mit vollständiger Genauigkeit mit einer Zahl y_n mit halber Genauigkeit multipliziert wird, um ein Ergebnis mit vollständiger Genauigkeit zu erzeugen. Folglich erreicht das modifizierte Newton-Raphson-Verfahren erhebliche Zeiteinsparungen (der Verarbeitungszeit), weil die aufwendige Multiplikation von zwei Zahlen mit vollstän diger Genauigkeit (nämlich einer vollständig genauen Zahl x_n+1 multipliziert mit einer vollständig genauen Zahl B), die herkömmlicherweise erforderlich war, vermieden wird. Folglich beschleunigt der modifizierte Ansatz der Erfindung die letzte Iteration um einen Faktor 10.

Die Operationen, die durch den Quadratwurzel-Mikrocode durchgeführt werden, werden im Folgenden mit Bezug auf Fig. 6 beschrieben, die ein Flußdiagramm der detaillierten Opera tionen ist, die durch den Quadratwurzel-Mikrocode ausgeführt werden. Der Quadratwurzel-Mikrocode verwendet sowohl das herkömmliche Newton-Raphson-Verfahren als auch das modifi zierte Newton-Raphton-Verfahren, um die Vorteile der Erfin dung zu erzeugen.

Um eine Quadratwurzel eines Wertes (A) zu bestimmen, be stimmt das Newton-Raphson-Verfahren zuerst einen Reziprok wert der Quadratwurzel des Wertes und der sich ergebende Reziprokwert wird dann mit dem Wert multipliziert. Das Qua dratwurzel-Verfahren kann durch die folgende Gleichung aus gedrückt werden.

Die Iterationen für den Reziprokwert der Quadratwurzel des Wertes (A) gemäß dem herkömmlichen Newton-Raphson-Verfahren können durch die folgende Gleichung ausgedrückt werden.

Die ersten n Iterationen (d. h., alle außer der letzten Ite ration) einer Berechnung mit hoher Genauigkeit werden unter Verwendung der obigen Gleichung durchgeführt 404, wie es herkömmlich gemacht wird. Die erste Iteration schließt fol gende Operationen ein: Erhalten 602 eines anfänglichen Schätzwertes für einen Reziprokwert der Quadratwurzel aus der Reziprokwerttabelle, wie zum Beispiel aus der oben ge zeigten Tabelle 2. Alle ersten n Iterationen schließen die folgenden Operationen ein: Bestimmen 604 eines Restfehlers für den Schätzwert und Erhöhen 606 der Genauigkeit des Schätzwertes auf der Grundlage des Restfehlers und des vor handenen Schätzwertes.

Wie im Fall der Division hängt die Anzahl der Iterationen, die erforderlich ist, um das Quadratwurzelergebnis mit einer bestimmten Genauigkeit zu erzeugen, von der Genauigkeit des anfänglichen Schätzwertes ab. Nachdem sich die Genauigkeit mit jeder Iteration verdoppelt, ist dann, wenn die Genauig keit als größer oder gleich N-Bits bestimmt wird 608, ledig lich eine weitere Iteration notwendig, um das Ergebnis mit einer Genauigkeit von 2N-Bits zu erhalten.

Solange die Näherung ungenauer als das Basiszahlenformat (d. h. < N) ist, verwenden die frühen Iterationen bevor zugterweise die Hardwareaddition und -Multiplikation. Bei jeder Iteration nach dieser Genauigkeit wird die Anzahl der übertragenen Stellen verdoppelt, um die Genauigkeit der Näherung anzupassen, siehe Bailey oben.

Die Erfindung modifiziert das herkömmliche Newton-Raphson- Verfahren durch Durchführen der Multiplikation mit A vor der letzten (n+1)-ten Iteration. Bevorzugterweise ist es die letzte Iteration des herkömmlichen Newton-Raphson-Verfahrens für die Reziprokwertberechnung, die durch die Erfindung mo difiziert ist. Vor dem Durchführen der letzten Iteration wird die letzte Iteration nämlich mit dem Wert (A) multi pliziert. Durch die Multiplikation mit dem Wert (A) wird die obige Gleichung für die letzte Iteration die Folgende.

Als nächstes wird der Wert (A) in die Klammern gezogen, wo durch die Gleichung wie folgt geschrieben werden kann.

Danach kann die Gleichung durch Zuordnung von y_n = Ax_n ver einfacht werden. Die abschließende Iteration des Newton- Raphson-Verfahrens für die Quadratwurzel gemäß der Erfindung wird dann durch die folgende Gleichung ausgedrückt.

Wie im Fall der Division ist es bedeutend, den Multiplikan den in die Klammern zu bringen. Der Effekt besteht nämlich darin, daß der Restfehler (A-y² _n) auf der Grundlage der Zahl die korrigiert wird, d. h. y_n, berechnet wird.

Die einzelnen Operationen für die abschließende Itertion des modifizierten Newton-Raphson-Verfahrens können dann gemäß den folgenden Schritten der Tabelle 5 durchgeführt werden 406.

Tabelle 5

Bei einem verschmolzenen Multiplikations-Additions-Entwurf (MAF, Fig. 2) können sowohl die Schritte 2 und 3 als auch die Schritte 4 und 5 miteinander verschmolzen sein.

Das Ergebnis, das im Schritt 5 erzeugt wird, ist die er wünschte Quadratwurzel, die fast so genau ist wie die Anzahl der Stellen einer Zahl mit vollständiger Genauigkeit. Insbe sondere ist das abschließende Ergebnis bis auf wenige hinte re Stellen (ULP) genau.

In Fig. 6 bestimmt der Schritt 1 610 eine geschätzte Qua dratwurzel (y_n) unter Verwendung des Schätzwertes (x_n) und des Wertes (A). Dann bestimmen die Schritte 2 und 3 612 einen Restfehler (A-y² _n) für die abgeschätzte Quadratwurzel. Abschließend wird in den Schritten 4 und 5 die Genauigkeit der abgeschätzten Quadratwurzel auf fast 2N-Bits erhöht 614.

Die einzig notwendige aufwendige Operation für die Quadrat wurzeloperation erfolgt folglich im Schritt 2, bei dem ein Produkt einer Zahl mit vollständiger Genauigkeit y² _n aus zwei Zahlen mit halber Genauigkeit erhalten wird. Daher wird die aufwendige Multiplikation einer Zahl x_n+1 mit vollstän diger Genauigkeit mal einer Zahl A mit vollständiger Genau igkeit, wie es herkömmlich erforderlich ist, durch die Er findung vermieden.

Die Erfindung nimmt an, daß die Hardware sowohl alle Stellen in einem Produkt von zwei Zahlen mit Hardwaregenauigkeit als auch den führenden Teil einer Summe mit vierfacher Genauig keit (z. B. 2N) bereitstellen kann. Einige existierende Com puter haben Hardware-Befehle, die das Ergebnis mit vierfa cher Genauigkeit (d. h. alle Stellen) der Multiplikation von zwei doppelt genauen Zahlen zurückgeben, wohingegen andere Computer keine solche Befehle haben. Einige Computer (z. B. IBM S/370) haben Befehle, die den vierfach genauen Teil der Summe von zwei Zahlen zurückgeben.

Obwohl es bevorzugt ist, daß die Hardware diese Anforderung unterstützt, kann dann, wenn die Hardware eines Computers nicht fähig ist, diese Anforderungen zu unterstützen, Soft ware in Verbindung mit der Hardware verwendet werden, um selbige bereitzustellen. Ein Beispiel eines Codes, der ver wendet werden kann, um die Hardware zu vergrößern, um ein vierfach genaues Ergebnis des Produkts von zwei doppelt ge nauen Zahlen zurückzugeben, ist der Folgende. In diesem Fall sind die Variablen als einfach genaue Zahlen gespeichert. Der C-Programmiersprachencode zur Zurückgabe aller Bits eines Produkts mit doppelt genauen Zahlen, die in dem Ein fach-Einfach Format gespeichert sind, liest sich wie folgt.

Daher wird das Ergebnis als vier einfach genaue Zahlen zu rückgegeben. Dieser Ansatz nimmt an, daß das doppelt genaue Format mindestens zwei Stellen mehr als das Produkt von zwei einfach genauen Zahlen enthält, eine Bedingung, die durch IEEE-Vorschrift "Gleit-Komma" erfüllt wird.

Eine Summe kann eine sehr große Anzahl von Stellen enthal ten, wenn sich die Exponenten erheblich voneinander unter scheiden. Der führende vierfach genaue Teil (z. B. 2N-Bits) des Ergebnisses wird von der Erfindung benötigt. Nachdem die Hardware die Wiedergewinnung der führenden 2N-Bits nicht di rekt unterstützen kann, liest sich daher ein Beispiel eines C-Programmiersprachencodes, der verwendet werden kann, um den führenden vierfach genauen Teil der Summe von zwei dop pelt genauen Zahlen zurückzugeben, wie folgt.

Bei diesem Beispiel sind die höheren und niedrigeren Teile der Eingaben in getrennten einfach genauen Wörtern gespei chert, die hohen und niedrigen Teile werden dann addiert, wobei der Übertrag der niedrigen Ordnung auf die höhere Ord nung übertragen wird. Die Summe wird als vier einfach genaue Zahlen gespeichert.

Obwohl die Erfindung Zugriff auf alle Stellen in einem Pro dukt von zwei Hardware-genauen Zahlen als auch auf den füh renden 2N-Bits (z. B. vierfach) genauen Teil einer Summe er fordert, erfordert die Erfindung keine spezielle Hardware (nach der Multiplizierer- und Addierer-Subtrahierer-Einheit) innerhalb der Gleit-Komma-Arithmetikeinheit, weil die Soft ware die Defizite der Hardware ausgleichen kann. Die Ver wendung einer solchen Software wird jedoch das Verhalten verschlechtern.

Die Erfindung ist ebenfalls unabhängig vom Rundungsmodus. Nichtsdestotrotz gibt es, als Hintergrundinformation, vier gut bekannte Rundungsmoden. Der erste Modus wird als "Runde-auf-das-nächste" bezeichnet, der die nächstliegende, darstellbare Zahl in der Mantisse auswählt. Die zweite Möglichkeit ist ein "Runde-auf-Null", der die Teil-Bits, die nicht in die Mantisse passen, löscht. Diese zweite Möglich keit ist allgemein als Abschneiden bekannt. Ein dritter Run dungsmodus ist die "Runde-auf-Positive große Größe", was bedeutet, daß das Runden durch Runden auf die nächst größere, darstellbare Zahl erfolgt. Die vierte Möglichkeit ist die "Runde-auf-Negative große Zahl", was auf die nächst kleinere, darstellbare Zahl rundet. In der Praxis ist der Runde-aufnächsten-Modus der am schwierigsten ausführbare.

Eine Multiplikations-Additions-Operation kann weiterhin als eine Multiplikations-Operation gefolgt durch eine Additions- Operation, der eine Rundungsoperation zugeordnet ist, durch geführt werden. Wenn verschmolzene Multiplikations-Addi tions-Operationen durch die Gleit-Komma-Arithmetikeinheit unterstützt werden, ist alternativ nur eine Rundung not wendig.

Die Divisions- und Quadratwurzel-Prozeduren, die oben be schrieben wurden, sind auf verschiedene Arten ausführbar. Eine Art ist es, die Prozeduren in einem Mikrocode auszu führen, wie es oben beschrieben wurde. Wenn zum Beispiel ein Divisions- oder ein Quadratwurzel-Befehl ausgeführt werden soll, greift eine Steuerungseinheit auf den Divisions- und Quadratwurzel-Mikrocode zu, der innerhalb der Gleit-Komma- Arithmetikeinheit gespeichert ist. Ein weiterer Weg ist es, einen Compiler zu haben, der den Objektcode direkt unter Verwendung der gleichen Prozeduren erzeugt. Beim Compelieren des Codes würde zum Beispiel irgendeine Abfrage einer Divi dierer- oder Quadratwurzel-Operation durch die geeignete Folge von Additions- und Multiplikations-Operationen gemäß der herkömmlichen und modifizierten Form des Newton-Raph son-Verfahrens ersetzt.

Die Erfindung schafft eine verbesserte Technik zum Erhalten von sehr genauen Ergebnissen von Divisions- und Quadrat wurzel-Operationen, die mit einer erheblich höhere Ge schwindigkeit betrieben werden als beim herkömmlichen An satz. Dieser Erhöhung der Berechnungsgeschwindigkeit liegt hauptsächlich die Tatsache zugrunde, daß es die Erfindung einer Gleit-Komma-Einheit ermöglicht, ein Ergebnis mit einer Genauigkeit von fast 2N-Bits zu erzeugen, ohne irgendeine 2N-mal-2N Bit-Multiplikation durchführen zu müssen. Folglich macht die Erfindung die Gleit-Komma-Hardware praktischer, weniger komplex und weniger teuer als herkömmlicherweise erforderte, weil ein 2N-mal-2N Bit breiter Multiplizierer durch die Erfindung nicht erforderlich ist.

Claims

1. Gleit-Komma-Arithmetikeinheit (100; 200) zum Durch führen einer Quadratwurzel-Operation eines Wertes, um eine geschätzte Quadratwurzel zu erzeugen, mit:
einem Speichergerät (102; 202) mit mehreren Anschlüssen zum Speichern von Daten;
einer Arithmetikeinrichtung (104; 118; 204; 208) zum Multiplizieren von zwei Zahlen, die jeweils in dem Speichergerät (102; 202) mit mehreren Anschlüssen ge speichert sind, um ein Produkt zu erzeugen, und zum Addieren von zwei Zahlen, die jeweils in dem Speicher gerät (102; 202) mit mehreren Anschlüssen gespeichert sind, um eine Summe zu erzeugen;
einer Reziprokwertnäherungseinrichtung (136; 228) zum Zuführen einer anfänglichen Näherung für einen Rezi prokwert der Quadratwurzel des Wertes zu dem Speicher gerät (102; 202) mit mehreren Anschlüssen;
einer Steuerungseinheit (130; 222), die durch einen Quadratwurzel-Mikrocode programmiert ist, zur Steuerung der Gleit-Komma-Arithmetikeinheit (100; 200); und
einem Quadratwurzel-Mikrocode (134; 226), der die ite rativen Prozeduren zum Durchführen einer Quadratwur zel-Operation enthält, wobei der Quadratwurzel-Mikro code folgende Merkmale aufweist:
eine Prozedur (602) zum Erhalt einer anfänglichen Nä herung für einen Reziprokwert für die Quadratwurzel des Wertes;
eine Prozedur (604) zur Veranlassung, daß ein erster Restfehler für die Näherung des Reziprokwertes der Quadratwurzel bestimmt wird;
eine Prozedur (606) zur Veranlassung, daß die Genauigkeit der Näherung für den Reziprokwert der Quadratwurzel unter Verwendung des ersten Restfehlers und der vorhandenen Näherung für den Reziprokwert der Quadratwurzel erhöht wird;
und die dadurch gekennzeichnet ist, daß
der Quadratwurzel-Mikrocode (134; 226), der die ite rativen Prozeduren zum Durchführen einer Quadratwur zel-Operation enthält, auch die folgenden Merkmale aufweist:
eine Prozedur (610) zur Veranlassung, daß eine abge schätzte Quadratwurzel unter Verwendung der revi dierten Näherung für den Reziprokwert der Quadrat wurzel und des Wertes bestimmt wird;
eine Prozedur (612) zur Veranlassung, daß ein zweiter Restfehler für die abgeschätzte Quadratwurzel unter Verwendung des Wertes und der abgeschätzten Quadrat wurzel bestimmt wird; und
eine Prozedur (614) zur Veranlassung, daß die Genauigkeit der abgeschätzten Quadratwurzel unter Verwendung der abgeschätzten Quadratwurzel, der revidierten Näherung für den Reziprokwert der Quadratwurzel und des zweiten Restfehlers für die abgeschätzte Quadratwurzel erhöht wird.

2. Gleit-Komma-Arithmetikeinheit (100; 200) zum Durch führen einer Divisions-Operation eines Wertes, um einen Dividenden durch einen Divisor zu teilen, um einen geschätzten Quotienten zu erzeugen, mit:
einem Speichergerät (102; 202) mit mehreren Anschlüssen zum Speichern von Daten;
einer Arithmetikeinrichtung (104; 118; 204; 208) zum Multiplizieren von zwei Zahlen, die jeweils in dem Speichergerät (102; 202) mit mehreren Anschlüssen ge speichert sind, um ein Produkt zu erzeugen, und zum Addieren von zwei Zahlen, die jeweils in dem Speicher gerät (102; 202) mit mehreren Anschlüssen gespeichert sind, um eine Summe zu erzeugen;
einer Reziprokwertnäherungseinrichtung (136; 228) zum Zuführen einer anfänglichen Näherung für einen Rezi prokwert des Divisors zu dem Speichergerät (102; 202) mit mehreren Anschlüssen;
einer Steuerungseinheit (130; 222), die durch einen Divisions-Mikrocode programmiert ist, zur Steuerung der Gleit-Komma-Arithmetikeinheit (100; 200); und
einem Divisions-Mikrocode (134; 226), der die iterati ven Prozeduren zum Durchführen einer Divisions-Opera tion enthält, wobei der Divisions-Mikrocode (134; 226) folgende Merkmale aufweist:
eine Prozedur (502) zum Erhalt einer anfänglichen Nä herung für einen Reziprokwert des Divisors;
eine Prozedur (504) zur Veranlassung, daß ein erster Restfehler für die Näherung des Reziprokwertes des Divisors bestimmt wird;
eine Prozedur (506) zur Veranlassung, daß die Genauigkeit der Näherung für den Reziprokwert des Divisors aufgrund des ersten Restfehlers und der vorhandenen Näherung für den Reziprokwert des Divisors erhöht wird;
und die dadurch gekennzeichnet ist, daß
der Divisions-Mikrocode (134; 226), der die iterativen Prozeduren zum Durchführen einer Divisions-Operation enthält, auch die folgenden Merkmale aufweist:
eine Prozedur (510) zur Veranlassung, daß ein abge schätzter Quotient unter Verwendung der revidierten Näherung für den Reziprokwert des Divisors und des Dividenden bestimmt wird;
eine Prozedur (512) zur Veranlassung, daß ein zweiter Restfehler für den abgeschätzten Quotienten unter Verwendung des Dividenden, des Divisors und des abge schätzten Quotienten bestimmt wird; und
eine Prozedur (514) zur Veranlassung, daß die Genauigkeit des abgeschätzten Quotienten unter Verwendung des abgeschätzten Quotienten, der revidierten Näherung für den Reziprokwert des Divisors und des zweiten Restfehlers für den abgeschätzten Quotienten erhöht wird.

3. Gleit-Komma-Arithmetikeinheit (100) nach Anspruch 1 oder 2, bei der das Speichergerät (102) mit mehreren Anschlüssen Daten speichert, die N-Bits breit sind, und bei dem die arithmetische Einrichtung folgende Merkmale aufweist:
einen Multiplizierer (104), der wirksam mit dem Spei chergerät (102) mit mehreren Anschlüssen verbunden ist, zum Multiplizieren von zwei N-Bit-Zahlen, um ein Pro dukt zu erzeugen;
einen ersten Rundungsaufwärtszähler (108), der mit dem Multiplizierer (104) wirksam verbunden ist, zum Runden des Produkts auf 2N-Bits;
einen ersten Zwischenspeicher (110) für einen hohen Ab schnitt, der wirksam mit dem ersten Rundungsaufwärts zähler (108) verbunden ist, zum Speichern der ersten N-Bits des Produkts;
einen ersten Zwischenspeicher (112) für den niedrigen Abschnitt, der wirksam mit dem ersten Rundungsaufwärts zähler (108) verbunden ist, zum Speichern der zweiten N-Bits des Produkts; und
einen ersten Multiplexer (114), der wirksam mit den Zwischenspeichern (110, 112) für den hohen und den nie drigen Abschnitt verbunden ist, zum Auswählen eines er sten Zwischenspeichers (110) für einen hohen Abschnitt oder eines ersten Zwischenspeichers (112) für einen niedrigen Abschnitt zum Speichern der ersten oder zwei ten N-Bits des Produkts in dem Speichergerät (102) mit mehreren Anschlüssen.

4. Gleit-Komma-Arithmetikeinheit (100) nach Anspruch 1, 2 oder 3, bei der die Arithmetikeinrichtung folgende Merkmale aufweist:
einen Synchronisationsschieber (116), der wirksam mit dem Speichergerät (102) mit mehreren Anschlüssen ver bunden ist, zum Synchronisieren des ersten und zweiten N-Bit Summanden, der von dem Speichergerät (102) mit mehreren Anschlüssen empfangen wird;
einen Addierer (118), der wirksam mit dem Synchronisa tionsschieber (116) verbunden ist, zum Addieren des er sten und zweiten N-Bit Summanden, um die Summe zu er zeugen;
einen zweiten Rundungsaufwärtszähler (122), der wirksam mit dem Addierer (118) verbunden ist, zum Runden der Summe auf 2N-Bits;
einen zweiten Zwischenspeicher (124) für den hohen Ab schnitt, der wirksam mit dem zweiten Rundungsaufwärts zähler (122) verbunden ist, zum Speichern der ersten N-Bits der Summe;
einen zweiten Zwischenspeicher (126) für den niedrigen Abschnitt, der wirksam mit dem zweiten Rundungsauf wärtszähler (122) verbunden ist, zum Speichern der zweiten N-Bits der Summe; und
einen zweiten Multiplexer (128), der wirksam mit den zweiten Zwischenspeichern (124, 126) für den hohen und niederen Abschnitt verbunden ist, zum Auswählen des zweiten Zwischenspeichers (124) für den hohen Abschnitt oder des zweiten Zwischenspeichers (126) für den nied rigen Abschnitt, zum Speichern der ersten oder zweiten N-Bits der Summe in dem Speichergerät (102) mit mehre ren Anschlüssen.

5. Gleit-Komma-Arithmetikeinheit (200) nach Anspruch 1 oder 2, bei der das Speichergerät (202) mit mehreren Anschlüssen Daten speichert, die N-Bits breit sind, und bei der die Arithmetikeinrichtung folgende Merkmale aufweist:
einen Multiplizierer (204), der wirksam mit dem Spei chergerät (202) mit mehreren Anschlüssen verbunden ist, zum Multiplizieren von zwei Zahlen, um das Produkt zu erzeugen;
einen Synchronisationsschieber (206), der wirksam mit dem Speichergerät (202) mit mehreren Anschlüssen ver bunden ist, zum Synchronisieren eines Summanden gemäß dem Exponenten des Produkts;
einen Addierer (208), der wirksam mit dem Multiplizie rer (204) und dem Synchronisationsschieber (206) ver bunden ist, zum Addieren des Produkts und des synchro nisierten Summanden, um ein Ergebnis zu erzeugen;
einen Rundungsaufwärtszähler (214), der wirksam mit dem Addierer (208) verbunden ist, zum Runden des Ergebnis ses auf 2N-Bits;
einen Zwischenspeicher (216) für den hohen Abschnitt, der wirksam mit dem Rundungsaufwärtszähler (214) ver bunden ist, um die ersten N-Bits des Ergebnisses zu speichern;
einen Zwischenspeicher (218) für den niedrigen Ab schnitt, der wirksam mit dem Rundungsaufwärtszähler (214) verbunden ist, zum Speichern der zweiten N-Bits des Ergebnisses; und
einen Multiplexer (220), der wirksam mit den Zwischen speichern (216, 218) für den hohen und den niedrigen Abschnitt verbunden ist, zum Auswählen des Zwischen speichers (216) für den hohen Abschnitt oder des Zwi schenspeichers (218) für den niedrigen Abschnitt zum Speichern der ersten oder zweiten N-Bits des Ergebnis ses in dem Speichergerät (202) mit mehreren Anschlüs sen.

6. Gleit-Komma-Arithmetikeinheit (100; 200) nach einem der Ansprüche 1 bis 5, bei dem der Divisions- und Quadrat wurzel-Mikrocode (134; 226) folgende Merkmale aufweist:
eine Prozedur (404) zum Durchführen von n Iterationen des Newton-Raphson-Verfahrens, um die Genauigkeit der Näherung des Reziprokwertes geometrisch zu verbessern; und
eine Prozedur (406) zum Durchführen einer zusätzlichen Iteration unter Verwendung eines modifizierten Newton- Raphson-Verfahrens, um das abschließende Näherungser gebnis zu erzeugen.

7. Verfahren zur Durchführung einer Gleit-Komma-Division eines Dividenden durch einen Divisor zur Erzeugung eines Quotienten mit einer Mantisse mit einer Genauigkeit von nahezu 2N-Bits, wobei das Verfahren in einer Gleit- Komma-Arithmetikeinheit durchgeführt wird und dabei zunächst folgende Schritte aufweist:

(a) Erhalt (502) eines derzeitigen Schätzwertes eines Reziprokwertes des Divisors;
(b) Erhöhung (506) der Genauigkeit des derzeitigen Schätzwertes des Reziprokwertes durch Berechnung (504) eines Fehlerparameters und Berechnung eines revidierten Schätzwertes des Reziprokwertes aus dem Fehlerparameter und dem derzeitigen Schätzwert des Reziprokwertes;
(c) Wiederholung (508) des Schrittes (b) bis die Genauigkeit des revidierten Schätzwertes des Reziprokwertes mindestens im wesentlichen nahe an N-Bits kommt;
und dadurch gekennzeichnet ist, daß das Verfahren im weiteren noch die folgenden Schritte aufweist:
(d) Bestimmung (510) eines anfänglichen Schätzwertes des Quotienten aus dem revidierten Schätzwert des Rezi prokwertes mal dem Dividenden;
(e) Bestimmung (512) eines Restfehlers für den anfäng lichen Schätzwert des Quotienten auf der Grundlage des anfänglichen Schätzwertes des Quotienten; und
(f) Bestimmung (514) des Quotienten aus dem anfänglichen Schätzwert des Quotienten plus dem revidierten Schätzwert des Reziprokwertes mal dem Restfehler.

8. Verfahren zur Durchführung der Gleit-Komma-Quadratwurzel operation eines Wertes, um eine Quadratwurzel mit einer Mantisse mit einer Genauigkeit von fast 2N-Bits zu er zeugen, wobei das Verfahren in einer Gleit-Komma-Arithme tikeinheit ausgeführt wird und dabei zunächst folgende Schritte aufweist:

(a) Erhalt (602) eines derzeitigen Schätzwertes eines Reziprokwertes der Quadratwurzel;
(b) Erhöhung (606) der Genauigkeit des derzeitigen Schätzwertes des Reziprokwertes durch Berechnung (604) eines Fehlerparameters und Berechnen eines re vidierten Schätzwertes des Reziprokwertes aus dem Fehlerparameter und dem derzeitigen Schätzwert des Reziprokwertes;
(c) Wiederholung (608) des Schrittes (b) bis die Genauigkeit des revidierten Schätzwertes des Reziprokwertes mindestens im wesentlichen nahe an N-Bits kommt;
und dadurch gekennzeichnet ist, daß das Verfahren im weiteren noch die folgenden Schritte aufweist:
(d) Bestimmung (610) eines anfänglichen Schätzwertes der Quadratwurzel aus dem revidierten Schätzwert des Re ziprokwertes mal dem Wert;
(e) Bestimmung (612) eines Restfehlers als dem anfäng lichen Schätzwert der Quadratwurzel auf der Grundla ge des Wertes und des anfänglichen Schätzwertes der Quadratwurzel; und
(f) Bestimmung (614) der Quadratwurzel aus dem anfäng lichen Schätzwert der Quadratwurzel plus einer Häl fte des Produkts des revidierten Schätzwertes des Reziprokwertes mal dem Restfehler.

9. Gleit-Komma-Arithmetikeinheit zur Durchführung des Ver fahrens gemäß Anspruch 7 oder 8, mit einer Additionsein heit (118; 208), einer Multiplikationseinheit (102; 204) und einer Steuerungseinheit (130; 222), die eine itera tive Newton-Raphson-Routine verwendet, um jeweils einen abgeschätzten Reziprokwert unter Verwendung der Addi tionseinheit (118; 208) und der Multiplikationseinheit (102; 204) zu erzeugen, wenn die Steuerungseinheit (130; 222) einen auszuführenden Divisions- oder Quadratwurzel- Befehl erfaßt, wobei die letzte Iteration der iterativen Newton-Raphson-Routine derart modifiziert ist, daß ein abschließender Näherungsquotient oder eine abschließende Näherungsquadratwurzel durch die letzte Iteration durch Abschätzen des Quotienten oder der Quadratwurzel und dann durch Verbessern der Genauigkeit des abgeschätzten Quo tienten oder der Quadratwurzel gemäß einem Restfehler er zeugt werden, der aufgrund des abgeschätzten Quotienten oder der Quadratwurzel erzeugt wird, wodurch der ab schließende Näherungsquotient oder die abschließende Qua dratwurzel erzeugt wird.