JPH04507023A - Ieee 754―1985標準に準拠した2進浮動小数点演算丸め - Google Patents

Ieee 754―1985標準に準拠した2進浮動小数点演算丸め

Info

Publication number
JPH04507023A
JPH04507023A JP3502792A JP50279291A JPH04507023A JP H04507023 A JPH04507023 A JP H04507023A JP 3502792 A JP3502792 A JP 3502792A JP 50279291 A JP50279291 A JP 50279291A JP H04507023 A JPH04507023 A JP H04507023A
Authority
JP
Japan
Prior art keywords
equal
value
status
division
rounding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3502792A
Other languages
English (en)
Inventor
リュウ・クリフ
リンズレイ・ブレット ルイス
Original Assignee
モトローラ・インコーポレーテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by モトローラ・インコーポレーテッド filed Critical モトローラ・インコーポレーテッド
Publication of JPH04507023A publication Critical patent/JPH04507023A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F7/00Methods or arrangements for processing data by operating upon the order or content of the data handled
    • G06F7/38Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F7/00Methods or arrangements for processing data by operating upon the order or content of the data handled
    • G06F7/38Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation
    • G06F7/48Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices
    • G06F7/52Multiplying; Dividing
    • G06F7/535Dividing only
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F7/00Methods or arrangements for processing data by operating upon the order or content of the data handled
    • G06F7/38Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation
    • G06F7/48Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices
    • G06F7/544Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices for evaluating functions by calculation
    • G06F7/552Powers or roots, e.g. Pythagorean sums
    • G06F7/5525Roots or inverse roots of single operands
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2207/00Indexing scheme relating to methods or arrangements for processing data by operating upon the order or content of the data handled
    • G06F2207/535Indexing scheme relating to groups G06F7/535 - G06F7/5375
    • G06F2207/5355Using iterative approximation not using digit recurrence, e.g. Newton Raphson or Goldschmidt
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F7/00Methods or arrangements for processing data by operating upon the order or content of the data handled
    • G06F7/38Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation
    • G06F7/48Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices
    • G06F7/483Computations with numbers represented by a non-linear combination of denominational numbers, e.g. rational numbers, logarithmic number system or floating-point numbers
    • G06F7/487Multiplying; Dividing
    • G06F7/4873Dividing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F7/00Methods or arrangements for processing data by operating upon the order or content of the data handled
    • G06F7/38Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation
    • G06F7/48Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices
    • G06F7/499Denomination or exception handling, e.g. rounding or overflow
    • G06F7/49942Significance control
    • G06F7/49947Rounding
    • G06F7/49957Implementation of IEEE-754 Standard

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Complex Calculations (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるため要約のデータは記録されません。

Description

【発明の詳細な説明】 IEEE 754−1985標準に準拠した2進浮動小数点演算丸め 発明の背景 固定小数点割算および平方根アルゴリズムが長い間使用されてきている。そのよ うなアルゴリズムは、以後IEEE FPSと称する、丸めのためのIEEE  754−1985の2進浮動小数点演算標準に従うが、その理由は該アルゴリズ ムの各々の反復が無限精度の結果の対応するビットと同じビットを計算しかつ該 計算の余りがいつも決定できるからである。
余りのないアルゴリズムが割算および平方根の決定のためのより高速の計算を提 供するために利用されているが、それはそのようなアルゴリズムはしばしば固定 小数点のカウンタパートより早く計算できるからである。特に、回復型および非 回復型アルゴリズムを利用すると、計算時間は基数(radix)により除算し たワード長に比例し、より特定的には、アルゴリズムの計算時間はワード長にリ ニアに関係している。収束アルゴリズムを用いると、計算時間は最初の近似精度 で除算したワード長の、収束レートのベースに対する、対数に比例し、より特定 的には、アルゴリズムの計算時間はワード長の対数に関係する。
しかしながら、割算および平方根の決定のための余りのない(remainde rless)アルゴリズムは数値的に非常に近い結果を発生することができるが 、無限精度の結果からはビットワイズには非常に異なっている。従って、そのよ うなアルゴリズムはIEEE FPSに適合しない丸められた結果を与えるかも 知れない。従って、丸められた結果が引用された標準に適合するように、割算お よび平方根の決定のための余りのないアルゴリズムからの結果を丸める方法の必 要性が存在する。
発明の概要 割算および平方根の決定のための余りのないアルゴリズムを用いることにより得 られる結果を、該結果がI EEEFPSに従うように丸める方法に対する必要 性は本発明の方法およびその方法を導入した高速プロセッサにより実質的に満た される。
本発明は余りのない割算アルゴリズムおよび余りのない平方根アルゴリズムを実 行することにより発生される出方を表す電気的信号を処理するための方法および 高速プロセッサを記述し、前記出力は最下位ビットを有する丸め精度に丸められ 、該丸め精度はIEEE FPSに与えられた精度により特定され、かつ実行さ れる所望の丸めモードはrEEE FPS丸めモードに対応して適用される。利 用される出力、C1は、大きさINIおよび符号を有する、被除数値N、および 大きさIDIおよび符号を有する、除数値りを用いる剰余のない割算により、あ るいは大きさ]Slおよび符号を有する、入力値Sを用いる剰余のない平方根決 定により発生される。Cは大きさ、IEEE FPSに適合する符号、および特 定された丸め精度の最下位ビットの右手の方のビットである丸めビットを有し、 Cは拡張精度にあり該拡張精度は丸め精度より高い精度を有している。
本発明の1つの実施例においては、剰余のない割算に対し、INI、D、および Cが得られ、かつ剰余のない平方根決定に対しては、IsIおよびCが得られる 。Cは、Cの大きさ、Cの符号、およびIEEE FPSによって特定される丸 めモードの内の少なくとも1つに関係する丸め精度において、各々大きさおよび 符号を有しがっHは最下位ビット(lsb)を有する2つの丸め値、LおよびH lの内の少なくとも1つを決定するために使用される。
2つの丸め値、LおよびHlの内の少なくとも1つが、Cの大きさ、Cの符号、 およびIEEE FPSによって特定される所望の丸めモードの内の少なくとも 1つに関係する中間値Aを発生するために利用される。次に、本発明の方法の実 施により、また剰余のない割算に対しては、大きさl A*D lを得るために 、A*Dの符号を無視して、中間値Aを除数値りに乗算することにより、また剰 余のない平方根決定に対しては、大きさl AHA lを得るために中間値Aを それ自身に乗算することにより、積の値の太きさを得る。
上記実行は次に、剰余のない割算アルゴリズムに対しては、もしIA*D1がI NIより小さければ“より小さい”、もしIA*D1がl N lに等しければ “等しい”、そしてもし1A*D1がINIより大きければ“より大きい”を有 する除算ステータスを、そして剰余のない平方根アルゴリズムに対しては、もし l AHA IがIsIより小さければ“より小さい”、もしlAlAlがIs Iに等しければ“等しい”、およびもしl AHA lがIsIより大きければ “より大きい”を有する平方根ステータスを発生する。
上記実行はIEEE FPSによって特定される所望の丸めモードに適合する丸 め精度で丸められた結果の値Rとして少なくとも除算ステータスまたは平方根ス テータスに関連する丸め値しまたはHを選択する。
図面の簡単な説明 第1図は、IEEE FPSに準拠した剰余のない割算の丸めのための本発明の 方法を示すフロー図である。
第2図は、IEEE FPSに準拠した剰余のない平方根丸めのための本発明の 方法を示すフロー図である。
策3図は、丸めビットがセットされた最近接点への丸め(偶数)モードに従った り、H,およびCに対する剰余のない割算における相対的な数直線(numbe  r 11ne)位置を示す説明図である。
第4図は、丸めビットがクリアされた最近接点への丸め(偶数)モードに従った り、H,およびCに対する剰余のない割算における相対的な数直線位置を示す説 明図である。
第5図は、丸めビットがセットされたゼロ方向への丸めに従ったり、 H,およ びCに対する剰余のない割算における相対的な数直線位置を示す説明図である。
第6図は、丸めビットがクリアされたゼロ方向への丸めに従ったり、 H,およ びCに対する剰余のない割算における相対的な数直線位置を示す説明図である。
第7図は、丸めビットがセットされかっCの符号が正である正の無限大方向への 丸めに従ったり、 H,およびCに対する剰余のない割算における相対的な数直 線位置を示す説明図である。
第8図は、丸めビットがクリアされかっCの符号が正である正の無限大へ向けて の丸めに従ったり、H,およびCに対する剰余のない割算における相対的な数直 線位置を示す説明図である。
第9図は、丸めビットがセットされかつCの符号が負である場合の正の無限大へ の丸めに従ったり、 H,およびCに対する剰余のない割算における相対的な数 直線位置を示す説明図である。
第10図は、丸めビットがクリアされかっCの符号が負である場合の正の無限大 への丸めに従ったり、H,およびCに対する剰余のない割算における相対的な数 直線位置を示す説明図である。
第11図は、丸めビットがセットされかつCの符号が正である場合の負の無限大 に向けての丸めに従ったり、 H。
およびCに対する剰余のない割算における相対的な数直線位置を示す説明図であ る。
第12図は、丸めビットがクリアされかつCの符号が正である場合の負の無限大 に向けての丸めに従ったり、 H。
およびCに対する剰余のない割算における相対的な数直線位置を示す説明図であ る。
第13図は、丸めビットがセットされかっCの符号が負である場合の負の無限大 に向けての丸めに従ったり、H。
およびCに対する剰余のない割算における相対的な数直線位置を示す説明図であ る。
第14図は、丸めビットがクリアされかつCの符号が負である場合の負の無限大 へ向けての丸めに従ったり、 H。
およびCに対する剰余のない割算における相対的な数直線位置を示す説明図であ る。
第15図は、丸めビットがセットされた場合における最近接点への丸め(偶数) モードに従ったり、H,およびCに対する剰余のない平方根決定における相対的 な数直線位置を示す説明図である。
接点への丸め(偶数)モードに従ったり、 H,およびCに対する剰余のない平 方根決定における相対的な数直線位置を示す説明図である。
第17図は、丸めビットがセットされた場合のゼロに向けての丸めモードに従っ たり、 H,およびCに対する剰余のない平方根決定における相対的な数直線位 置を示す説明図である。
第18図は、丸めビットがクリアされた場合のゼロに向けての丸めモードに従っ たり、 H,およびCに対する剰余のない平方根決定における相対的な数直線位 置を示す説明図である。
第19図は、丸めビットがセットされた場合の正の無限大に向けての丸めモード に従ったり、 H,およびCに対する剰余のない平方根決定における相対的な数 直線位置を示す説明図である。
第20図は、丸めビットがクリアされた場合の正の無限大へ向けての丸めモード に従ったり、 H,およびCに対する剰余のない平方根決定における相対的な数 直線位置を示す説明図である。
第21図は、丸めビットがセットされた場合の負の無限大に向けての丸めモード に従ったり、 H,およびCに対する剰余のない平方根決定における相対的な数 直線位置を示す説明図である。
第22r!gJは、丸めビットがクリアされた場合の負の無限大に向けての丸め モードに従ったり、 H,およびCに対する剰余のない平方根決定における相対 的な数直線位置を示す説明図である。
第23図は、最近接点への丸め(偶数)丸めモードを利用する剰余のない割算に 対するIEEE FPS丸めを示す本発明の詳細な説明する一般的なフローチャ ートである。
第24図は、ゼロに向けての丸めの丸めモードを利用した剰余のない割算に対す るIEEE EPS丸めを示す本発明の詳細な説明する一般的なフローチャート である。
第25図は、正の無限大に向けての丸めの丸めモードを利用した剰余のない割算 に対するrEEE FPS丸めを示す本発明の詳細な説明する一般的なフローチ ャートである。
第26図は、負の無限大に向けての丸めの丸めモードを利用した剰余のない割算 に対するIEEE FPS丸めを示す本発明の詳細な説明する一般的なフローチ ャートである。
第27図は、打ち切りを有するゼロに向けての丸めの丸めモードを利用した剰余 のない割算に対するIEEE FPS丸めを示す本発明の詳細な説明するための 一般的なフローチャートである。
第28図は、打ち切りを有する最近接点への丸め(偶数)の丸めモードを利用し た剰余のない割算に対するI EEEFPS丸めを示す本発明の実施のための一 般的なフローチャートである。
第29図は、打ち切りを有する正の無限大に向けての丸めの丸めモードを利用し た剰余のない割算に対するIEEE FPS丸めを示す本発明の実施のための一 般的なフローチャートである。
第30図は、打ち切りを有する負の無限大に向けての丸めの丸めモードを利用し た剰余のない割算のためのIEEE FPS丸めを示す本発明の実施のための一 般的なフローチャートである。
第31図は、最近接点への丸め(偶数)の丸めモードを利用した剰余のない平方 根決定に対するIEEE FPS丸めを示す本発明の実施のための一般的なフロ ーチャートである。
第32図は、ゼロに向けての丸めまたは負の無限大に向けての丸めの丸めモード を利用した剰余のない平方根決定に対するIEEE FPS丸めを示す本発明の 実施のための一般的なフローチャートである。
第33図は、正の無限大に向けての丸めの丸めモードを利用した剰余のない平方 根決定に対するIEEE FPS丸めを示す本発明の実施のための一般的なフロ ーチャートである。
第34図は、打ち切りを有する最近接点への丸め(偶数)の丸めモードを利用し た剰余のない平方根決定に対するIEEE FPS丸めを示す本発明の実施のた めの一般的なフローチャートである。
第35図は、打ち切りを有するゼロに向けての丸めまたは負の無限大に向けての 丸めの丸めモードを利用した剰余のない平方根決定に対するIEEE FPS丸 めを示す本発明の実施のための一般的なフローチャートである。
第36図は、打ち切りを有する正の無限大に向けた丸めの丸めモードを利用した 剰余のない平方根決定に対するIEEE FPS丸めを示す本発明の実施のため の一般的なフローチャートである。
第37図は、本発明のためのコンピュータハードウェアの実施例を示すブロック 図である。
発明を実施するための最良の形態 第1図は、一般的に数字100で示された、最下位ビットを有する丸め精度の出 力C(102)を丸めるための本発明の方法を導入した高速プロセッサ(HS  P)により実行されるステップの1つの実施例を示し、前記丸め精度は典型的に は、以後IEEE FPSと称される、I EEE754−1985の2進浮動 小数点演算標準において与えられる精度により特定され、IEEE FPS丸め モードによって規定される所望の丸めモードを利用し、前記出力は、大きさlN fおよび符号を有する、被除数値N1および大きさIDIおよび符号を有する、 除数値りを利用する剰余のない割算により発生される。ここで用いられているよ うに、い(つかの用語は次のように定義される。
+Iunc (x)はXの大きさより小さいかまたは等しい大きさを有するXに 最も近い丸め精度における数字として定義され、 EEEE FPS符号大きさのフォーマットに対しては、++unc (X)は 丸め精度の最下位ビットの右側のすべてのビットを捨てることにより計算でき、 newtavay (x)は次のように定義される。すなわち、もし符号付きX が正であればne[alter (x、 −t−oo)、そして もし符号付きXが負であれば、nexLa[ter (x、 −CI:l)、 と定義され、この関数はlxlより大きな大きさを有するXの後の丸め精度の次 に表現可能な浮動小数点数であり、 かつn e I t a [f、 e r関数はそのIEEE定義に従って定義 される。
第一のデータ記憶および操作ユニットは、少なくとも1つの電気的信号により表 されかつ、大きさlNfおよび符号を有する、被除数値N1および大きさIDI および符号を有する、除数値りに対する剰余のない割算により発生される、出力 Cを得かつ利用し、この場合Cは大きさ、IEEE FPSに適合する符号、お よび特定された丸め精度の最下位ビットの右側のビットである丸めビットを有し 、かつCは拡張精度であり、該拡張精度は丸め精度(102)より高い精度を有 する。
第一の決定ユニットは各々大きさ、符号を有し、かつ少なくとも1つの電気的信 号により表される、2つの丸め値しおよびHの内の少なくとも1つを発生し、か つこの場合Hは最下位ビット(1,sb)を有し、前記2つの丸め値しおよびH の内の少なくとも1つの発生は、Cの大きさ、Cの符号、およびIEEE FP S (104)によって特定される丸めモード、の内の少なくとも1つに関係す る丸め精度で発生される。
単一拡張精度、2倍拡張精度、とともにより高度の拡張精度を拡張精度として利 用することができる。
Lの大きさはHの大きさより小さく、かつHの大きさは前記丸め精度におけるし の大きさより大きな次の表現し得る大きさである。
第一の決定ユニットは丸め値しおよびH(104)を次のように決定する。すな わち、 第3図、第4図および第23図に示されるように、IEEEの最近接点への丸め (Even:偶数)手順を導入し、前記丸め値(rounding value )LはHunc(C)であり、前記丸め値Hはne!IaVa7 (L)に等し い(2304)。
第5図および第24図に示されるように、I EEEのゼロに向けての丸め手順 を導入し、Cの丸めビット(2402)がセットされかつ丸め値Hはnexta v@7 [t+unc (C) ]に等しく、かツL=nexjaftct ( H,O)である(2404)。
第6図および第24図に示されるように、I EEEのゼロに向けての丸め手順 を導入し、Cの丸めビ・ソト(2402)がクリアされかつ丸め値Hは++un c (C)に等しく、かつL=net(allet (8,0)である(240 6)。
第7図および第25図に示されるように、I EEEの正の無限大に向けての丸 め手順を導入し、Cの丸めビット(2402)がセットされ、Cの符号(250 2)が正であり、Lの値はnextavay [t+unc (C) ]に等し く、かつH=nex+avay (L)である(2504)。
第8図および第25図に示されるように、IEEEの正の無限大に向けての丸め 手順を導入し、Cの丸めビット(2402)はクリアされ、Cの符号(2502 )は正であり、Lの値は1runc (C)に等しく、かツH= nexf、a vay(L)である(2506)。
第9図および第25図に示されるように、IEEEの正の無限大に向けての丸め 手順を導入し、Cの丸めビット(2402)はセットされ、Cの符号(25Q  2)は負であり、Hの値はnextava7 [t+unc (C) ]に等し く、かつL =nextafte+ (H,O)である(2508)。
第10図および第25図に示されるように、IEEEの正の無限大に向けての丸 め手順を導入し、Cの丸めビット(2402)はクリアされ、Cの符号(250 2)は負であり、Hの値はNone (C)に等しく、かツL =nex+af tet (H,O)である(2510)。
第11図および第26図に示されるように、I EEEの負の無限大に向けての 丸め手順を導入し、Cの丸めビット(2402)はセットされ、Cの符号(26 02)は正であり、Hの値はnexlavH[truc (C)コに等しく、か つL=nexjalle+ (H,O)である(2608)。
第12図および第26図に示されるように、I EEEの負の無限大に向けての 丸め手順を導入し、Cの丸めビット(2402)はクリアされ、Cの符号(26 02)は正であり、Hの値はNone (C)に等しく、かッL = net+ aHer (H,O)である(2610)。
第13図および第26図に示されるように、I EEEの負の無限大に向けての 丸め手順を導入し、Cの丸めビット(2402)はセットされ、Cの符号(26 02)は負であり、Lの値はne[ava7 [+runc (C) ]に等し く、かっH= nex(ava7 (L )である(2304)。
第14図および第26図に示されるように、IEEEの負の無限大に向けての丸 め手順を導入し、Cの丸めビット(2402)はクリアされ、Cの符号(260 2)は負であり、Lの値は+runc (C)に等しく、かッH= nexta way(L)である(2604)。
第2の決定ユニットは次にAを決定するが(第1図、106)、このAは少なく とも1つの電気的信号により表されかつ、Cの大きさ、Cの符号、およびIEE E FPS(104)により特定される所望の丸めモード、の内の少なくとも1 つに関係し、Aは次のようにして決定される。
すなわち、 第23図に示されるように、I EEEの最近接点への丸め(偶数)手順を導入 し、Aの値はLの値プラスHの値の和の2分の1にセットしく2306)、第2 4図に示されるように、fEEEのゼロに向けての丸め手順を導入し、への値は Hの値にセットしく2408)第25図に示されるように、IEEEの正の無限 大に向けての丸め手順を導入しかつCの符号(2502)は正であり、Aの値は Lの値にセットされ(2512)、第25図に示されるように、I EEEの正 の無限大に向けての丸め手順を導入し、かつCの符号(2502)は負であり、 Aの値はHの値にセットされ(2514)、第26図に示されるように、I E EEの負の無限大に向けての丸め手順を導入しかつCの符号(2602)は正で あり、Aの値はHの値にセットされ(2514)、そして第26図に示されるよ うに、IEEEの負の無限大に向けての丸め手順を導入しかつCの符号(260 2)は負であり、Aの値はLの値にセットされる(2512)。
第3の決定ユニットは次に少なくとも1つの電気的信号により表される、積の値 、1.6*Dl (108)の大きさを、AIDの符号を無視し、除数値りに中 間値Aを乗算して大きさl AID Iを得ることにより決定する。
次に、第4の決定ユニットはl AID lをINIと比較しかつ、少なくとも 1つの電気的信号により表されるステータス(110)を次のようにして発生す る。すなわち、割算ステータスは、もしl AID lがINIより小さければ “より’4−さい”を、もしl AID IがINIIこ等しければ“等しい” を、もしl AID iがINIより大きければ“より大きい”を有するステー タスを発生する。
第五の決定ユニットが次に、IEEE FPSにより特定される所望の丸めモー ドに適合した丸め精度で、少なくとも前記第四の決定手段に関しかつ少なくとも 1つの電気的信号により表される丸め結果値R(112)を、次のように決定す る。すなわち、 第23図に示されるように、I EEE最近接点への丸め(偶数)の丸めモード を導入し、除算ステータスを用いるしまたはHの選択はさらにもし該除算ステー タスが“より小さい”であればRをHに等しく設定しく2312)、かつもし該 除算ステータスが“より大きい”であればLに等しく設定する(2314)段階 を含み、第23図に示されるように、IEEEEEE最近接点め(偶数)の丸め モードを導入し、“等しい”の除算ステータスの使用はさらにもしHのtsbが 1に等しければRをLに等しくセットしく2314)、またはもしHの1sb( 2310’)がOに等しければRをHに等しくセットする(2312)段階を含 み、 第24図に示されるように、IEEEゼロに向けての丸めの丸めモードを導入し 、除算ステータスを用いるしまたはHの選択はさらにもし該除算ステータスが“ より小さい”であればRをHに等しくセットしく2312)、もし該除算ステー タスが“より大きい”であればLに等しくセットしく2314)、またはもし該 除算ステータスが“等しい”であればRをHに等しくセットする(2312)段 階を含み、 第25図に示されるように、I EEE正の無限大に向けての丸めの丸めモード を導入し、Cの符号(2502)が正の場合に除算ステータスを用いてLまたは Hを選択する段階はさらにもし該除算ステータスが“より小さい”であればRを Hに等しくセットしく2312)、もし除算ステータスが“より大きい”であれ ばLに等しくセットしく2314)、また(よもし除算ステータスが“等しい” であればRをLに等しくセットする(2314)ステップを含み、第25図に示 されるように、IEEE正の無限大に向けての丸めの丸めモードを導入し、Cの 符号(2502)が負の場合に除算ステータスを用いてLまたはHを選択する段 階はさらにもし除算ステータスが“より小さい”であればRをHに等しくセット しく2312)、もし除算ステータスが“より大きい”であればLに等しくセッ トしく2314)、またはもし除算ステータスが“等しい”であればRをHに等 しくセットする(2312)ステップを含み、第26図に示されるように、I  EEE負の無限大に向けての丸めの丸めモードを導入し、除算ステータスを用い かつCの符号(2602)が正の場合にLまたはHを選択する段階はさらにもし 除算ステータスが“より小さい”であればRをHに等しくセットしく2312) 、もし除算ステータスが“より大きい”であればLに等しくセットしく2314 )、またはもし除算ステータスが“等しい”であればRをHに等しくセットする (2312)ステップを含み、そして 第26図に示されるように、IEEE負の無限大に向けての丸めの丸めモードを 導入し、Cの符号(2602)が負の場合に除算ステータスを用いてLまたはH を選択する段階はさらにもし除算ステータスが“より小さい”であればRをHに 等しくセットしく2312)、もし除算ステータスが“より大きい”であればL に等しくセットしく2314)、またはもし除算ステータスが“等しい”であれ ばRをLに等しくセットする(2314)ステップを含む。
本発明の他の実施例はl A*D +の決定の後にINIの精度へのl A*D  +の打ち切り、該打ち切られたl A*DIの、IEEE FPSによって規 定される、不正確(1nexact)ステータスがセットされたかまたはクリア されたか(116)の決定、および少なくとも1つの電気的信号により表される 、R(112)の以下のような決定を導入する。すなわち、 第27図に示されるように、IEEEゼロ方向への丸め手順を導入し、丸められ た結果R(112)の値を次のように決定し、すなわち、 “より大きい”の除算ステータスに対しては、RはLの値に等しくセットされ( 2314)、 ”等しい”の除算ステータスに対しては、そしてセットされた不正確ステータス ビットに対しては、RはLの値に等しくセットされ(2314)、 “等しい”の除算ステータス、およびクリアされた不正確ステータスビットに対 しては、RはHの値に等しくセットされ(2312)、そして “より小さい”の除算ステータスに対してはRはHの値に等しくセットされ(2 312)、 第28図に示されるように、IEEE最近接点への丸め(偶数)手順を導入し、 丸められた結果Rの値(112)は次のように決定され、すなわち、 “より大きい”の除算ステータスに対しては、RはLの値に等しくセットされ( 2314)、 “等しい“の除算ステータスに対しては、そしてセットされた不正確ステータス ビットに対しては、RはLの値に等しくセットされ(2314,)、 “等しい“の除算ステータス、Hの最下位ビット−〇(2310)、およびクリ アされた不正確ステータスビットに対しては、RはHの値に等しくセットされ( 2312)“等しい”の除算ステータス、Hの最下位ビット=1(2310)、 およびクリアされた不正確ステータスビ・ソトに対しては、RはLの値に等しく セットされ(2314)、かつ “より小さい”の除算ステータスに対しては、RはHの値に等しくセットされ( 2312)、そして第29図に示されるように、Cの符号が正の場合のIEEE 正の無限大に向けての丸め手順を導入し、丸められた結果Rの値(112)は次 のように決定され、すなわち、“より小さい”の除算ステータスに対しては、R はHの値に等しくセットされ(2312)、かつ“より大きい”または“等しい ”の除算ステータスに対しては、RはLの値に等しくセットされる(2314) 。
第29図に示されるようにCの符号が負の場合のIEEE正の無限大に向けての 丸め手順を導入し、丸められた結果Rの値(112)は次のように決定され、す なわち、“より大きい”の除算ステータスに対しては、RはLの値に等しくセッ トされ(2314)、 1等しい”の除算ステータス、およびセットされた不正確ステータスビットに対 しては、RはLの値に等しくセットされ(2314)、 “等しい1の除算ステータス、およびクリアされた不正確ステータスビットに対 しては、RはHの値に等しくセットされ(2312)、そして “より小さい”の除算ステータスに対しては、RはHの値に等しくセットされ( 2312)、 第30図に示されるように、Cの符号が正の場合のIEEE負の無限大に向けて の丸め手順を導入し、丸められた結果Rの値(112)は次のように決定され、 すなわち、“より大きい”の除算ステータスに対しては、RはLの値に等しくセ ットされ(2314)、 “等しい”の除算ステータス、およびセットされた不正確ステータスビットに対 しては、RはLの値に等しくセットされ(2314)、 “等しい”の除算ステータス、およびクリアされた不正確ステータスビットに対 しては、RはHの値に等しくセットされ(2312)、そして “より小さい”の除算ステータスに対しては、RはHの値に等しくセットされ( 2312)、 第30図に示されるように、Cの符号が負の場合のIEEE負の無限大に向けて の丸め手順を導入し、丸められた結果Rの値(112)は次のように決定され、 すなわち、“より小さい”の除算ステータスに対しては、RはHの値に等しくセ ットされ(2312)、そして“より大きい”または“等しい”の除算ステータ スに対しては、RはLの値に等しくセットされる(2314)。
第2図は、一般的に数字200によって示される、最下位ビットを有するある丸 め精度の出力C(202)を丸めるための本発明の方法を導入した高速プロセッ サ(H4F)により実行されるステップの1つの実施例を示し、前記丸め精度は 典型的には、以後IEEE FPSと称される、IEEE 754−1985の 2進浮動小数点演算標準において与えられる精度により特定され、IEEE F PS丸めモードにより規定される所望の丸めモードを利用し、前記出力は、大き さIsIおよび符号を有する、入力値Sを利用する剰余のない平方根決定により 発生される。ここで用いられているように、ある用語は上に述べたように定義さ れる。すなわち、Hunc (x) 、neNavay (x) 、およびne xtafte+関数は上に述べたように定義される。
第一のデータ記憶および操作ユニットは少なくとも1つの電気的信号により表さ れかつ剰余のない平方根決定により発生される、出力Cを得かつ利用し、大きさ 、IsIおよび符号を有する、入力値Sを使用し、この場合Cは大きさ、IEE E FPSに適合する符号、および特定された丸め精度の最下位ビットの右手の ビットである丸めビットを有し、かつCは拡張精度または該拡張精度が丸め精度 (202)より大きな精度を有する拡張精度を模擬する変更されたモードにある 。
第一の決定ユニットは、Cの大きさ、Cの符号、およびIEEE FPSにより 特定される丸めモード、の内の少なくとも1つに関係する丸め精度で、2つの丸 め値しおよびHの内の少なくとも1つを発生しく104)、2つの丸め値しおよ びHの各々は大きさ、符号を有し、かつ少なくとも1つの電気的信号により表さ れ、そしてHは最下位ビット(lsb)を有する。
単一の拡張精度、2倍拡張精度、とともにより高い拡張精度を拡張精度として用 いることができる。
Lの大きさはHの大きさより小さく、かつHの大きさは丸め精度におけるしの大 きさより大きな次に表現可能な大きさである。
第一の決定ユニットは丸め値りおよびH(104)を次のように決定する。すな わち、 第15図および第31図に示されるように、IEEE最近接点への丸め(偶数) 手順を導入し、丸め値りはHunC(C)に等しく (2304)、 第16図および第31図に示されるように、IEEE最近接点への丸め(偶数) 手順を導入し、丸め値HはnextaWay(L)に等しく (2304)、 第17図および第32図に示されるように、IEEEゼロに向けての丸め手順、 または第21図および第32図に示されるように、I EEE負の無限大に向け ての丸め手順を導入し、この場合Cの丸めビットはセットされており(2402 )、丸め値Hはnextavay [trunc (C) ]に等しく、かつ丸 め値りはnex+aftet (H,O)に等しく(2404)、 第18図および第32図に示されるようにfEEEゼロに向けての丸め手順、ま たは第22図および第32図に示されるように、IEEE負の無限大に向けての 丸め手順を導入し、この場合Cの丸めビット(2402)はクリアされ、丸め値 Hはtrunc (C)に等しく、かつ丸め値りはnextalle+ (H, O)に等しく (2406)、第19図および第33図に示されるように、IE EE正の無限大に向けての丸め手順を導入し、この場合Cの丸めビット(240 2)はセットされ、丸め値りはnextaway[trunc (C) ]に等 しく、かつ丸め値Hはnexjaway (L)に等しく(2504)、そして 第20図および第33図に示されるように、IEEE正の無限大に向けての丸め 手順を導入し、この場合Cの丸めビット(2402)はクリアされ、丸め値しは trunc(C)に等しく、かつ丸め値Hはnexjaway(L)に等しい( 2506)。
第二の決定ユニットは次にAを次のように決定する(106)。すなわち、 第32図に示されるように、IEEEゼロに向けての丸め手順またはIEEE負 の無限大に向けての丸め手順を導入し、Aの値はHの値にセットされ(2408 )、第33図に示されるように、IEEE正の無限大に向けての丸め手順を導入 し、Aの値はLの値にセットされる(2512)。
第3の決定ユニットは次に大きさl A*A lを得るために中間値Aをそれ自 身に乗算することによりl A*A lを決定する(204)。
次に、第四の決定ユニットは1A*A lを!]と比較しかつ次のようにステー タスを発生する(206)。すなわち、平方根ステータスであって、もしI A *A IがISlより小さければ“より小さい”となり、もしIA*A1がIs Iに等しければ“等しい”となり、かつもしIA*A1がIsIより大きければ “より大きい”となるものを発生する。
第五の決定ユニットは次に次のようにしてIEEE FPSにより特定される所 望の丸めモードに適合する丸め精度で丸められた結果値Rを決定する(112) 。すなわち、第31図に示されるように、I EEE最近接点への丸め(偶数) の丸めモードを導入し、平方根ステータスを用いるしまたはHの選択はさらにも し平方根ステータスが4より小さい”であればRをHに等しくセットしく231 2)、およびもし平方根ステータスが“より大きい”であればLに等しくセット する(2314)ステップを含み、第31図に示されるように、I EEE最近 接点への丸め(偶数)の丸めモードを導入し、“等しい“の平方根ステータスの 使用はさらにHの1sb(2310)が1に等しければRをLに等しくセットし く2314)、またはHの1sb(2310)が0に等しければ(2312)R をHに等しくセットするステップを含み、 第32図に示されるように、IEEEゼロに向けての丸めまたはI EEE負の 無限大に向けての丸めの丸めモードを導入し、平方根ステータスを用いるLまた はHの選択はさらにもし該平方根ステータスが“より小さい”であればRをHに 等しくセットしく2312)、もし該平方根ステータスが“より大きい”であれ ばLに等しくセットしく2314)、またはもし平方根ステータスが“等しい” であればRをHに等しくセットする(2312)ステップをさらに含み、そして 第33図に示されるように、I EEE正の無限大に向けての丸めの丸めモード を導入し、平方根ステータスを用いるしまたはHの選択はさらにもし該平方根ス テータスが”より小さい”であればRをHに等しくセットしく2312)、もし 平方根ステータスが1より大きい”であればLに等しくセットしく2314)、 またはもし平方根ステータスが“等しい”であればRをLに等しくセットする( 2314)ステップを含む。
本発明の他の実施例はl A*A +の決定の後に(204)l A*A lの IsIの精度への打ち切り(truncation)(2C18)、打ち切られ たl A*A +の、IEEE FPSにより規定される、不正確ステータスが セットされているかまたはクリアされているか(210)の決定、および次のよ うにRを決定する(112)ことを導入する。
すなわち、 第35図に示されるように、IEEEゼロに向けての丸め手順または負の無限大 に向けての丸めを導入し、丸められた結果Rの値(112)は次のように決定さ れ、すなわち、“より大きい“の平方根ステータスに対しては、RはLの値に等 しくセットされ(2314)、“等しい”の平方根ステータスおよびセットされ た不正確ステータスビットに対しては、RはLの値に等しくセットされ(231 4)、 0等しい”の平方根ステータス、およびクリアされた不正確ステータスビットに 対しては、RはHの値に等しくセットされ(2312)、そして “より小さい”の平方根ステータスに対しては、RはHの値に等しくセットされ (2312)、第34図に示されるように、I EEE最近接点への丸め(偶数 )手順を導入し、丸められた結果の値R(112)は次のようにして決定され、 すなわち、“より大きい”の平方根ステータスに対しては、RはL) の値に等 しくセットされ(2314)、“等しい”の平方根ステータス、およびセットさ れた不正確ステータスビットに対しては、RはLの値に等しくセットされ(23 14)、 “等しい”の平方根ステータス、Hの最下位ビット=0(2310)、およびク リアされた不正確ステータスビットに対しては、RはHの値に等しくセットされ (2312)“等しい”の平方根ステータス、Hの最下位ビット=1(2310 )、およびクリアされた不正確ステータスビットに対しては、RはI7の値に等 しくセットされ(2314)、そして “より小さい”の平方根ステータスに対しては、RはHの値に等しくセットされ (2312)、そして第36図に示されるように、IEEE正の無限大に向けて の丸め手順を導入し、丸められた結果の値R(1,12)は次のように決定され る。すなわち、 “より小さい”の平方根ステータスに対しては、RはHの値に等しくセットされ (2312)、“より大きい”または“等しい″の平方根ステータスに対しては 、Rは乙の値に等しくセットされ(2314)、“等しい”の平方根ステータス に対しては、RはLの値に等しくセットされる(2314)。
第37図は、一般的に数字3700で示される、本発明のコンピュータハードウ ェアの実施例のブロック図を示す。
1つの実施例においては、第一のデータ記憶および操作ユニットは剰余のない割 算に対しては入力、INI、D、およびCを得かつ剰余のない平方根決定に対し てはIsIおよびCを得そしてこれらの値をプログラム制御ユニット(3702 )に送る。前記値はバス(3710)を通り、かつメモリ(3712)に置かれ る。ALU (3706)は前に述べたように、表示された不正確ステータスに 対しステータスレジスタ(3708)を用いて計算を行う。プログラムメモリ( 3704)は本発明を実行するための命令を保持する。ALU (3706)に おける第一の決定ユニットは前に述べたように、LおよびHを発生する。ALU (3076)における第二の決定ユニットは前に述べたようにしてAを決定し、 ALU (3706)における第三の決定ユニットは前に述べたようにしてIA *D1またはl A4CA +を決定し、ALU (3706)における第四の 決定ユニットは前に述べたように除算ステータスまたは平方根ステータスを決定 し、そしてALU (3706)における第五の決定ユニットは前に述べたよう にして正しい丸め結果Rを選択する。
第23図〜第36図にあるように、以後IEEE FPSと表される、IEEE  754−1985の2進浮動小数点演算標準に適合する剰余のない割算および 平方根決定出力をこれらの操作を用いるシステムにおいて発生するための本発明 に係わるデジタル信号処理方法は、少なくとも1つの第一のデータ記憶装置およ び操作装置を、大きさINlおよび符号を有する、被除数値N1および大きさI Dlおよび符号を有する、除数値りを用いる、被除数値Nおよび除数値りの剰余 のない割算、または入力値Sの剰余のない平方根決定(102,202)からの 、または大きさIsIを有する、入力値Sを用いる剰余のない平方根決定による 、出力値Cの選択、記憶、および操作のために割り当てる。
この方法は2つの可能な丸め値、HおよびLlであってIEEE FPSに適合 するもの(104)、の少なくとも1つを得るために出力値Cを操作するため少 なくとも1つのデータ記憶および操作装置を割り当て、かつさらに中間値Aを決 定するために、可能な丸め値、HおよびLlの内の少なくとも1つを操作するた めに少なくとも1つのデータ記憶および操作装置を割り当てる。
該方法はまた中間値Aおよび所定のチェック値の積の大きさを次のようにして得 るために少なくとも1つのデータ記憶および操作装置を割り当てる。すなわち、 剰余のない割算に対しては、大きさl AID lを得るために、AIDの符号 を無視し、中間値Aを除数値りに乗算することにより、または剰余のない平方根 決定に対しては、大きさIA*A1を得るために中間値Aをそれ自身に乗算する ことにより、前記積を得る。
該方法は前記積I AID lまたは1AHAlの大きさの第二の所定のチェッ ク値との比較出力を次のようにして得るために少なくとも1つのデータ記憶およ び操作装置を割り当てる。すなわち、剰余のない割算アルゴリズムに対しては、 もしl AID lがINIより小さければ“より小さい”であり、もしl A ID lがINIに等しければ“等しい”であり、かつもしl AID IがI NIより大きければ“より大きい”を有する除算ステータスを、そして剰余のな い平方根アルゴリズムに対しては、もしl AHA lがISlより小さければ “より小さい”であり、もしl AHAlがIsIに等しければ、“等しい”で あり、かつもしIA*A IがIsIより大きければ“より大きい”を有する平 方根ステータスを得る。
前記方法はさらに丸め値がIEEE FPSに適合して丸められた出力値Cに対 応するように少なくとも前記比較出力に関し可能な丸め値Rを選択するために少 なくとも1つのデータ記憶および操作装置を割り当てる。Rの選択は上に述べた ような、他の要素に依存するであろう。
他の実施例においては、システムは制御信号セットおよび入力、および計算処理 を制御するための制御信号セットに応答する処理制御装置を利用し、剰余のない 割算または剰余のない平方根決定からの出力の丸めの、以後I EEEFPSと 表される、IEEE 754−1985の2進浮動小数点演算標準との相関を可 能にするために本発明の方法を利用する。制御信号セットおよび入力は、とりわ け、剰余のない割算に対しては大きさINIおよび符号を育する、被除数値N1 および大きさIDIおよび符号を有する、除数値りの入力値、および出力値Cを 、また剰余のない平方根決定に対しては、大きさl 511および符号を有する 、入力値S、および出力値Cを含む。
処理制御装置および複数のセンサは上に述べたフロー図に記載された手順を実行 するために操作およびデータ記、憧装置を含む。
制御装置は上に述べた本発明の方法に従い、IEEEFPSに適合して丸められ た出力値Cに対応する丸め値を得るために入力値を利用するため少なくとも1つ の操作装置を含む。
当業者には、 本発明はALUそれ自体で完全に実施できること、ステータス決定または判定ス テップは、減算を含む、多くの様式で実施できること、 Lの最下位ビットはIEEE FPSに適合する丸め結果を決定するために代わ りに利用できること、そして除算および平方根ステータス決定は示された以外の ものでも良いこと、 が明らかであろう。
第3図から第22図までは近似値Cおよび無限精度の結果Pの間の差はこの発明 の適切な動作のためには1つのlsbの2分の1より小さいことが要求されるこ とを示しているように見えるが、CおよびPの間の実際の差は1つの]、 s  bの4分の1でなければならない。隣接の数の間の分解能はIEEE FPSに よって規定されるように、指数(、e xptの、n e n t )か1だけ 変化すると変化する。IEE、Eの指数・が増大すると、lE、EE FPSに 規定されている、仮数部(significand)の分解能が半分にカットさ れる。従って、無限精度の結果Pおよび近似値Cの間の差は最も小さな分解能の lsbの2分の1より小さくなければならず、または等測的には、その差はその 差かより精密な分解能のLsbの2分の1より小さくなるようにより粗い分解能 のlsbの4分の1より小さくなければならない。
FIG、24 FIG、32 FIG、33 FIG、36 要約帯 IEEE 754−1985における2進浮動小数点演算標準に準拠した丸め出 力を得るように剰余のない除算アルゴリズムおよび剰余のない平方根アルゴリズ ムによって発生される出力を表わす信号を処理するための方法およびその方法を 導入した高速プロセッサ(HS P)が開示されている。本発明のこの方法およ び手順は浮動小数点計算の解が丸められるようにし、この場合丸められた結果の 、2進ビットのみならず、符号ビットも前記標準のすべてのガイドラインに完全 に適合している。
国際調査報告 ”II’−1111−H’11111’!+16N’161コ−71枦11/’ +I”+(−1−1/n7WQ1

Claims (10)

    【特許請求の範囲】
  1. 1.大きさ|N|および符号を有する、符号付き被除数値N、および大きさ|D |および符号を有する、符号付き除数値Dを用いる剰余のない除算に応じて、ま たは、大きさ|S|および符号を有する入力値Sを用いる剰余のない平方根決定 に応じて、拡張精度で、出力値Cを得るための丸めの、以後IEEEFPSと称 する、IEEE754−1985の2進浮動小数点演算標準に適合する値Rを得 るために一組の数学的操作を行うための高速プロセッサ(HSP)のためのデジ タル演算ユニットであって、A)出力値Cが大きさ、符号、および特定された丸 め精度の最下位ビットの右側のビットである丸めビットを有するように出力値C を操作しかつ記憶するための第一のデータ記憶および操作手段であって、Cは拡 張精度にあり該拡張精度は丸め精度より大きな精度を有するもの、B)前記第一 のデータ記憶および操作手段に応答して、各々大きさおよび符号を有し、かつH は最下位ビット(lsb)を有する、2つの丸め値LおよびHの内の少なくとも 1つを、Cの大きさ、Cの符号、およびIEEEFPSにより特定される所望の 丸めモード、の内の少なくとも1つに関係する丸め精度で、発生するための第一 の決定手段、 C)前記第一のデータ記憶および操作手段にかつ前記第一の決定手段に応答して 、Cの大きさ、Cの符号、およびIEEEFPSにより特定される所望の丸めモ ード、の内の少なくとも1つに関係する中間値Aを発生するための第二の決定手 段、 D)前記第二の決定手段に応答して、剰余のない除算に対しては、大きさ|A* D|を得るために、A*Dの符号を無視して、中間値Aを除数値Dに乗算するこ とにより、または剰余のない平方根決定に対しては、大きさ|A*A|を得るた めに中間値Aをそれ自身に乗算することにより、積の値の大きさを発生するため の第三の決定手段、E)前記第三の決定手段に応答して、剰余のない除算アルゴ リズムに対しては、もし|A*D|が|N|より小さければ“より小さい”を、 もし|A*D|が|N|に等しければ“等しい”を、かつもし|A*D|が|N |より大きければ“より大きい”を有する除算ステータスを発生するための、か つ 剰余のない平方根アルゴリズムに対しては、もし|A*A|が|S|より小さけ れば“より小さい”を、もし|A*A|が|S|に等しければ“等しい”を、か つもし|A*A|が|S|より大きければ“より大きい”を有する平方根ステー タスを発生するための第四の決定手段、F)少なくとも前記第四の決定手段に関 連して前記第一の決定手段に応答し、所望のIEEEFPS丸めモードに適合す る丸め精度での丸められた結果値Rとして前記ステップ(E)における少なくと も前記除算ステータスまたは平方根ステータスに関連して前記ステップ(B)か らLまたはHを選択するための第五の決定手段、を具備することを特徴とする高 速プロセッサ(HSP)のためのデジタル演算ユニット。
  2. 2.前記拡張精度は、単一拡張精度および2倍拡張精度の内の1つであり、かつ 前記丸め精度は単一精度または2倍精度の内の1つである請求の範囲第1項に記 載のHSP。
  3. 3.前記Lの大きさはHの大きさより小さいか、またはHの大きさは前記丸め精 度におけるLの大きさより大きい次に表現可能な大きさである、 請求の範囲第1項に記載のHSP。
  4. 4.請求の範囲第1項に記載のHSPであって、A)IEEE最近接点への丸め (偶数)手順を導入する剰余のない除算に対し、 前記丸め値Lはtrunc(C)でありかつ前記丸め値Hはnextaway( L)に等しく、 Aの値はLの値プラスHの値の和の2分の1にセットされ、 除算ステータスを用いてLまたはHを選択するステップはさらにもし該除算ステ ータスが“より小さい”であればRをHに等Lくセットしかつもし前記除算ステ ータスが“より大きい”であればLに等しくセットするステップを含み、そして 除算ステータス“等しい”を用いるステップはさらにもしHのlsbが1に等し ければRをLに等しくセットし、またはHのlsbが0に等しければRをHに等 しくセットするもの、 B)Cの丸めビットがセットされている場合の、IEEEゼロに向けての丸め手 順を導入する剰余のない除算に対しては、 丸め値Hはnextaway[trunc(C)]に等しくかつL=nexta fter(H,O)であり、Aの値がHの値にセットされ、かつ 除算ステータスを用いてLまたはHを選択するステップはさらにもし該除算ステ ータスが“より小さい”であればRをHに等しくセットし、もし該除算ステータ スが“より大きい”であればLに等しくセットし、またはもし該除算ステータス が“等しい”であればRをHに等しくセットするステップを含むもの、 C)Cの丸めビットがクリアされている場合の、ゼロに向けてのIEEE丸め手 順を導入した剰余のない除算に対しては、 前記丸め値Hはtrunc(C)に等しくかつL=nextafter(H,O )であり、 Aの値はHの値にセットされ、かつ 除算ステータスを用いるLまたはHの選択ステップはさらにもし該除算ステータ スが“より小さい”であればRをHに等しくセットし、もし該除算ステータスが “より大きい”であればLに等しくセットし、またはもし該除算ステータスが“ 等しい”であればRをHに等しくセットするステップを含むもの、 D)Cの丸めビットがセットされかつCの符号が正である場合の、正の無限大に 向けてのIEEE丸め手順を導入した剰余のない除算に対しては、 Lの値はnextaway[trunc(C)]に等しくかつH=nextaw ay(L)であり、 この場合Cの符号は正であり、Aの値はLの値にセットされ、かつ Cの符号が正である場合の除算ステータスを用いたLまたはHの選択ステップは もし該除算ステータスが“より小さい”であればRをHに等しくセットし、もし 該除算ステータスが“より大きい”であればLに等しくセットし、またはもし該 除算ステータスが“等しい”であればRをLに等しくセットするステップを含む もの、E)Cの丸めビットがクリアされかつCの符号が正である場合の、正の無 限大に向けてのIEEE丸め手順を導入した剰余のない除算に対しては、 しの値はtrunc(C)に等しくかつH=nextaway(L)であり、 この場合Cの符号は正であり、Aの値はLの値にセットされ、かつ Cの符号が正である場合の除算ステータスを用いるLまたはHの選択ステップは さらにもし該除算ステータスが“より小さい”であればRをHに等しくセットし 、もし該除算ステータスが“より大きい”であればLに等しくセットし、または もし該除算ステータスが“等しい”であればRをLに等しくセットするステップ を含むもの、F)Cの丸めビットがセットされかつCの符号が負である場合の、 正の無限大に向けてのIEEE丸め手順を導入した剰余のない除算に対しては、 Hの値はnextaway[trunc(C)]に等しくかつL=nextaf ter(H,O)であり、 この場合Cの符号は負であり、Aの値はHの値にセットされ、かつ Cの符号が負である場合の除算ステータスを用いるLまたはHの選択ステップは さらにもし該除算ステータスが“より小さい”であればRをHに等しくセットし 、もし該除算ステータスが“より大きい”であればLに等しくセットし、または もし該除算ステータスが“等しい”であればRをHに等しくセットするステップ を含むもの、G)Cの丸めビットがクリアされかつCの符号が負である場合の、 正の無限大に向けてのIEEE丸め手順を導入した剰余のない除算に対しては、 Hの値はtrunc(C)に等しくかつL=nextafter(H,O)であ り、 この場合Cの符号は負であり、Aの値はHの値にセットされ、かつ Cの符号が正である場合の除算ステータスを用いたLまたはHの選択ステップは さらにもし該除算ステータスが“より小さい”であればRをHに等しくセットし 、もし該除算ステータスが“より大きい”であればLに等しくセットし、または もし該除算ステータスが“等しい”であればRをLに等しくセットするステップ を含むもの、H)Cの丸めビットがセットされかつCの符号が正である場合の、 負の無限大に向けてのIEEE丸め手順を導入した剰余のない除算に対しては、 Hの値はnextaway[trunc(C)]に等しくかつL=nextaf ter(H,O)であり、 この場合Cの符号は正であり、Aの値はHの値にセットされ、かつ Cの符号が正である場合の除算ステータスを用いるLまたはHの選択ステップは さらにもし該除算ステータスが“より小さい”であればRをHに等しくセットし 、もし該除算ステータスが“より大きい”であればLに等しくセットし、または もし該除算ステータスが“等しい”であればRをHに等しくセットするステップ を含むもの、I)Cの丸めビットがクリアされかつCの符号が正である場合の、 負の無限大に向けてのIEEE丸め手順を導入した剰余のない除算に対しては、 Hの値はtrunc(C)に等しくかつL=nextafter(H,O)であ り、 この場合Cの符号は正であり、Aの値はHの値にセットされ、かつ Cの符号が正である場合の除算ステータスを用いるLまたはHの選択はさらにも し該除算ステータスが“より小さい”であればRをHに等しくセットし、もし該 除算ステータスが“より大きい”であればLに等しくセットし、または該除算ス テータスが“等しい”であればRをHに等しくセットするステップを含むもの、 J)Cの丸めビットがセットされかつCの符号が負である場合の、負の無限大に 向けてのIEEE丸め手順を導入した剰余のない除算に対しては、 Lの値はnextaway[trunc(C)]に等しくかつH=nextaw ay(L)であり、 この場合Cの符号は負であり、Aの値はLの値にセットされ、かつ Cの符号が負である場合の除算ステータスを用いたLまたはHの選択ステップは さらにもし該除算ステータスが“より小さい”であればRをHに等しくセットし 、もし該除算ステータスが“より大きい”であればしに等しくセットし、または もし該除算ステータスが“等しい”であればRをLに等しくセットするステップ を含むもの、そしてK)Cの丸めビットがクリアされかつCの符号が負である場 合の、負の無限大に向けてのIEEE丸め手順を導入した剰余のない除算に対し ては、 Lの値はtrunc(C)に等しくかつH=nextaway(L)であり、 この場合Cの符号は負であり、Aの値はLの値にセットされ、かつ Cの符号が負である場合の除算ステータスを用いたLまたはHの選択ステップは さらに、もし該除算ステータスが“より小さい”であればRをHに等しくセット し、もし該除算ステータスが“より大きい”であればLに等しくセットし、また はもし該除算ステータスが“等しい”であればRをLに等しくセットするステッ プを含むもの、の内のいずれか1つに該当する請求の範囲第1項に記載のHSP 。
  5. 5.請求の範囲第1項に記載のHSPであって、A)IEEE最近接点への丸め (偶数)手順を導入した剰余のない平方根決定に対し、 前記丸め値Lはtrunc(C)に等しく、Aの値はLの値プラスHの値の和の 2分の1にセットされ、 平方根ステータスを使用するLまたはHを選択するステップはさらに、もし該平 方根ステータスが“より小さい”であればRをHに等しくセットしかつもし該平 方根ステータスが“より大きい”であればLに等しくセットするステップを含み 、かつ “等しい”の平方根ステータスを用いるステップはさらに、もしHのlsbが1 に等しければRをLに等しくセットし、またはもしHのlsbが0に等しければ RをHにセットするステップを含むもの、 B)IEEE最近接点への丸め(偶数)手順を導入した剰余のない平方根決定に 対L、 前記丸め値Hはnextaway[trunc(C)]に等しく、Aの値はLの 値プラスHの値の和の2分の1にセットされ、 平方根ステータスを用いてLまたはHを選択するステップはさらに、もし前記平 方根ステータスが“より小さい”であればRをHに等しくセットしかつもし該平 方根ステータスが“より大きい”であればLに等しくセットするステップを含み 、かつ “等しい”の平方根ステータスを使用するステップはさらに、もしHのlsbが 1に等しければRをLに等しくセットし、またはもしHのlsbが0に等しけれ ばRをHに等しくセットするステップを含むもの、C)Cの丸めビットがセット されている場合の、IEEEゼロに向けての丸め手順またはIEEE負の無限大 に向けての丸め手順を導入した剰余のない平方根決定に対し、前記丸め値Hはn extaway[trunc(C)]に等しくかつ前記丸め値Lはnextaf ter(H,O)に等しく、Aの値はHの値にセットされ、かつ 前記平方根ステータスを用いてLまたはHを選択するステップはさらに、もし該 平方根ステータスが“より小さい”であればRをHに等しくセットし、もし該平 方根ステータスが“より大きい”であればLに等しくセットし、またはもし該平 方根ステータスが“等しい”であればRをHに等しくセットするステップを含む もの、 D)Cの丸めビットがクリアされている場合のIEEEゼロに向けての丸め手順 またはIEEE負の無限大に向けての丸め手順を導入した剰余のない平方根決定 に対し、前記丸め値Hはtrunc(C)に等しくかつ前記丸め値Lはnext after(H,O)に等しく、Aの値はHの値にセットされ、かつ 平方根ステースを用いてLまたはHを選択するステップはさらに、もし該平方根 ステータスが“より小さい”であればRをHに等しくセットし、もし該平方根ス テータスが“より大きい”であればLに等しくセットし、またはもし該平方根ス テータスが“等しい”であればRをHに等しくセットするステップを含むもの、 E)Cの丸めビットがセットされている場合の、IEEE正の無限大に向けての 丸め手順を導入した剰余のない平方根決定に対し、 前記丸め値Lはnextaway[trunc(C)]に等しくかつ前記丸め値 Hはnextaway(L)に等しく、Aの値はLの値にセットされ、かつ 平方根ステータスを用いてLまたはHを選択するステップはさらに、もし該平方 根ステータスが“より小さい”であればRをHに等しくセットし、もし該平方根 ステータスが“より大きい”であればLに等しくセットし、またはもし該平方根 ステータスが“等しい”であればRをLに等しくセットするステップを含むもの 、そしてF)Cの丸めビットがクリアされている場合のIEEE正の無限大に向 けての丸め手順を導入した剰余のない平方根決定に対し、 前記丸め値Lはtrunc(C)に等しくかつ前記丸め値Hはnextaway (L)に等しく、 Aの値はLの値にセットされ、かつ 前記平方根ステータスを用いてLまたはHを選択するステップはさらに、もし該 平方根ステータスが“より小さい”であればRをHに等しくセットし、もし該平 方根ステータスが“より大きい”であればLに等しくセットし、またはもし該平 方根ステータスが“等しい”であればRをLに等しくセットするステップを含む もの、 のいずれか1つに該当する請求の範囲第1項に記載のHSP。
  6. 6.出力を最下位ビットを有する丸め精度に丸める方法であって、該丸め精度は 典型的には、以後IEEEFPSと称される、IEEE754−1985の2進 浮動小数点演算標準に与えられる精度により、IEEEFPS丸めモードによっ て規定される所望の丸めモードを用いて、特定され、前記出力Cは、大きさ|N |および符号を有する、被除数値N、および、大きさ|D|および符号を有する 、除数値Dを用いた剰余のない除算により、または、大きさ|S|および符号を 有する、入力値Sを用いる剰余のない平方根決定により発生され、前記方法は、 A)大きさ、IEEEFPSに適合する符号、および前記特定された丸め精度の 最下位ビットの右側のビットである丸めビットを有する出力値Cを得るステップ であって、Cは拡張精度にあり該拡張精度は前記丸め精度より大きな精度を有し 、Cは符号付きの被除数値Nおよび符号付きの除数値Dを用いた示された剰余の ない除数アルゴリズムまたは入力値Sを用いた剰余のない平方根アルゴリズムか ら得られ、かつ符号付きの出力値Cは少なくとも1つの電気的信号により表され るもの、 B)2つの丸め値LおよびHの内の少なくとも1つを発生するステップであって 、前記2つの丸め値LおよびHの各々は大きさおよび符号を有し、かつHは最下 位ビット(lsb)を有し、前記2つの丸め値LおよびHの内の少なくとも1つ の発生は、Cの大きさ、Cの符号、およびIEEEFPSにより特定される丸め モード、の内の少なくとも1つに関係する丸め精度で行われ、かつ前記2つの丸 め値LおよびHの各々は少なくとも1つの電気的信号により表されるもの、 C)前記Cの大きさ、Cの符号、およびIEEEFPSにより特定される所望の 丸めモードの内の少なくとも1つに関係し、かつ少なくとも1つの電気的信号に より表される中間値Aを発生するステップ、 D)剰余のない除算に対しては、大きさ|A*D|を得るために、A*Dの符号 を無視し、中間値Aを除数値Dに乗算することにより、または剰余のない平方根 決定に対しては、大きさ|A*A|を得るために中間値Aをそれ自体に乗算する ことにより、積の値の大きさを発生するステップであって、|A*D|または| A*A|は少なくとも1つの電気的信号により表されるもの、 E)剰余のない除算アルゴリズムに対しては、もし|A*D|が|N|より小さ ければ“より小さい”を、もし|A*D|が|N|に等しければ“等しい”を、 かつもし|A*D|が|N|より大きければ“より大きい”を有する除算ステー タスを発生し、かつ 剰余のない平方根アルゴリズムに対しては、もし|A*A|が|S|より小さけ れば“より小さい”を、もし|A*A|が|S|に等しければ“等しい”を、か つもし|A*A|が|S|より大きければ“より大きい”を有する平方根ステー タスを発生するステップであって、前記発生されるステータスは少なくとも1つ の電気的信号により表されるもの、 F)IEEEFPSにより特定される所望の丸めモードに適合する丸め精度での 丸められた結果値Rとして少なくとも前記ステップ(E)における除算ステータ スまたは平方根ステータスに関し前記ステップ(B)からLまたはHを選択する ステップであって、選択された前記丸められた結果値Rは少なくとも1つの電気 的信号により表されるもの、 を具備することを特徴とする出力を丸める方法。
  7. 7.前記拡張精度は、単一の拡張精度および2倍拡張精度の内の1つであって、 かつ前記丸め精度は単一精度および2倍精度の内の1つである請求の範囲第6項 に記載の方法。
  8. 8.前記Lの大きさは前記Hの大きさより小さいか、前記Hの大きさは前記丸め 精度におけるLの大きさより大きな次に表現可能な大きさであるか、のいずれか 1つに該当する請求の範囲第6項に記載の方法。
  9. 9.請求の範囲第6項に記載の方法であって、A)IEEE最近接点への丸め( 偶数)手順を導入する剰余のない除算に対し、 前記丸め値Lはtrunc(C)でありかつ前記丸め値Hはnextaway( L)に等しく、 Aの値はLの値プラスHの値の和の2分の1にセットされ、 除算ステータスを用いてLまたはHを選択するステップはさらにもし該除算ステ ークスが“より小さい”であればRをHに等しくセットしかつもし前記除算ステ ータスが“より大きい”であればLに等しくセットするステップを含み、そして 除算ステータス“等しい”を用いるステップはさらにもしHのlsbが1に等し ければRをLに等しくセットし、またはHの1sbが0に等しければRをHに等 しくセットするもの、 B)Cの丸めビットがセットされている場合の、IEEEゼロに向けての丸め手 順を導入する剰余のない除算に対しては、 丸め値Hはnextaway[trunc(C)]に等しくかつL=nexta fter(H,O)であり、Aの値がHの値にセットされ、かつ 除算ステータスを用いてLまたはHを選択するステップはさらにもし該除算ステ ータスが“より小さい”であればRをHに等しくセットし、もし該除算ステータ スが“より大きい”であればLに等しくセットし、またはもし該除算ステータス が“等しい”であればRをHに等しくセットするステップを含むもの、 C)Cの丸めビットがクリアされている場合の、ゼロに向けてのIEEE丸め手 順を導入した剰余のない除算に対しては、 前記丸め値Hはtrunc(C)に等しくかつL=nextafter(H,O )であり、 Aの値はHの値にセットされ、かつ 除算ステータスを用いるLまたはHの選択ステップはさらにもし該除算ステータ スが“より小さい”であればRをHに等しくセットし、もし該除算ステータスが “より大きい”であればLに等しくセットし、またはもし該除算ステータスが“ 等しい”であればRをHに等しくセットするステップを含むもの、 D)Cの丸めビットがセットされかつCの符号が正である場合の、正の無限大に 向けてのIEEE丸め手順を導入した剰余のない除算に対しては、 Lの値はnextaway[trunc(C)]に等しくかつH=nextaw ay(L)であり、 この場合Cの符号は正であり、Aの値はLの値にセットされ、かつ Cの符号が正である場合の除算ステータスを用いたLまたはHの選択ステップは もし該除算ステータスが“より小さい”であればRをHに等しくセットし、もし 該除算ステータスが“より大きい”であればLに等しくセットし、またはもし該 除算ステータスが“等しい”であればRをLに等しくセットするステップを含む もの、E)Cの丸めビットがクリアされかつCの符号が正である場合の、正の無 限大に向けてのIEEE丸め手順を導入Lた剰余のない除算に対しては、 Lの値はtrunc(C)に等しくかつH=nextaway(L)であり、 この場合Cの符号は正であり、Aの値はLの値にセットされ、かつ Cの符号が正である場合の除算ステータスを用いるLまたはHの選択ステップは さらにもし該除算ステータスが“より小さい”であればRをHに等しくセットし 、もし該除算ステータスが“より大きい”であればLに等しくセットし、または もし該除算ステータスが“等しい”であればRをLに等しくセットするステップ を含むもの、F)Cの丸めビットがセットされかつCの符号が負である場合の、 正の無限大に向けてのIEEE丸め手順を導入した剰余のない除算に対しては、 Hの値はnextaway[trunc(C)]に等しくかつL=nextaf ter(H,O)であり、 この場合Cの符号は負であり、Aの値はHの値にセットされ、かつ Cの符号が負である場合の除算ステータスを用いるLまたはHの選択ステップは さらにもし該除算ステータスが“より小さい”であればRをHに等しくセットし 、もし該除算ステータスが“より大きい”であればLに等しくセットL、または もし該除算ステータスが“等しい”であればRをHに等しくセットするステップ を含むもの、G)Cの丸めビットがクリアされかつCの符号が負である場合の、 正の無限大に向けてのIEEE丸め手順を導入した剰余のない除算に対しては、 Hの値はtrunc(C)に等しくかつL=nextaftet(H,O)であ り、 この場合Cの符号は負であり、Aの値はHの値にセットされ、かつ Cの符号が正である場合の除算ステータスを用いたLまたはHの選択ステップは さらにもし該除算ステータスが“より小さい”であればRをHに等しくセットし 、もし該除算ステータスが“より大きい”であればLに等しくセットし、または もし該除算ステータスが“等しい”であればRをLに等しくセットするステップ を含むもの、H)Cの丸めビットがセットされかつCの符号が正である場合の、 負の無限大に向けてのIEEE丸め手順を導入した剰余のない除算に対しては、 Hの値はnextaway[trunc(C)]に等しくかつL=nextaf ter(H,O)であり、 この場合Cの符号は正であり、Aの値はHの値にセットされ、かつ Cの符号が正である場合の除算ステータスを用いるLまたはHの選択ステップは さらにもし該除算ステータスが“より小さい”であればRをHに等しくセットし 、もし該除算ステータスが“より大きい”であればLに等しくセットし、または もし該除算ステータスが“等しい”であればRをHに等しくセットするステップ を含むもの、I)Cの丸めビットがクリアされかつCの符号が正である場合の 、負の無限大に向けてのIEEE丸め手順を導入した剰余のない除算に対しては 、 Hの値はtrunc(C)に等しくかつL=nextafter(H.O)であ り、 この場合Cの符号は正であり、Aの値はHの値にセットされ、かつ Cの符号が正である場合の除算ステータスを用いるLまたはHの選択はさらにも し該除算ステータスが“より小さい”であればRをHに等しくセットし、もし該 除算ステータスが“より大きい”であればLに等しくセットし、または該除算ス テータスが“等しい”であればRをHに等しくセットするステップを含むもの、 J)Cの丸めビットがセットされかつCの符号が負である場合の、負の無限大に 向けてのIEEE丸め手順を導入した剰余のない除算に対しては、 Lの値はnextaway[trunc(C)]に等しくかつH=nextaw ay(L)であり、 この場合Cの符号は負であり、Aの値はLの値にセットされ、かつ Cの符号が負である場合の除算ステータスを用いたLまたはHの選択ステップは さらにもし該除算ステータスが“より小さい”であればRをHに等しくセットし 、もし該除算ステータスが“より大きい”であればLに等しくセットL、または もし該除算ステータスが“等しい”であればRをLに等しくセットするステップ を含むもの、そしてK)Cの丸めビットがクリアされかつCの符号が負である場 合の、負の無限大に向けてのIEEE丸め手順を導入した剰余のない除算に対し ては、 Lの値はtrunc(C)に等しくかつH=nextaway(L)であり、 この場合Cの符号は負であり、Aの値はLの値にセットされ、かつ Cの符号が負である場合の除算ステータスを用いたLまたはHの選択ステップは さらに、もし該除算ステータスが“より小さい”であればRをHに等しくセット し、もし該除算ステータスが“より大きい”であればLに等しくセットし、また はもし該除算ステータスが“等しい”であればRをLに等しくセットするステッ プを含むもの、のいずれか1つに該当する請求の範囲第6項に記載の方法。
  10. 10.請求の範囲第6項に記載の方法であって、A)IEEE最近接点への丸め (偶数)手順を導入した剰余のない平方根決定に対し、 前記丸め値Lはtrunc(C)に等しく、Aの値はLの値プラスHの値の和の 2分の1にセットされ、 平方根ステータスを使用するLまたはHを選択するステップはさらに、もし該平 方根ステータスが“より小さい”であればRをHに等しくセットしかつもし該平 方根ステータスが“より大きい”であればLに等しくセットするステップを含み 、かつ “等しい”の平方根ステータスを用いるステップはさらに、もしHのlsbが1 に等しければRをLに等しくセットし、またはもしHのlsbが0に等しければ RをHにセットするステップを含むもの、 B)IEEE最近接点への丸め(偶数)手順を導入した剰余のない平方根決定に 対し、 前記丸め値Hはnextaway[trunc(C)]に等しく、Aの値はLの 値プラスHの値の和の2分の1にセットされ、 平方根ステータスを用いてLまたはHを選択するステップはさらに、もし前記平 方根ステータスが“より小さい”であればRをHに等しくセットしかつもし該平 方根ステータスが“より大きい”であればLに等しくセットするステップを含み 、かつ “等しい”の平方根ステータスを使用するステップはさらに、もしHのlsbが 1に等しければRをLに等しくセットし、またはもしHのlsbが0に等しけれ ばRをHに等しくセットするステップを含むもの、C)Cの丸めビットがセット されている場合の、IEEEゼロに向けての丸め手順またはIEEE負の無限大 に向けての丸め手順を導入した剰余のない平方根決定に対し、前記丸め値Hはn extaway[trunc(C)]に等しくかつ前記丸め値Lはnextaf ter(H,O)に等しく、Aの値はHの値にセットされ、かつ 前記平方根ステータスを用いてLまたはHを選択するステップはさらに、もし該 平方根ステータスが“より小さい”であればRをHに等しくセットし、もし該平 方根ステータスが“より大きい”であればLに等しくセットし、またはもし該平 方根ステータスが“等しい”であればRをHに等しくセットするステップを含む もの、 D)Cの丸めビットがクリアされている場合のIEEEゼロに向けての丸め手順 またはIEEE負の無限大に向けての丸め手順を導入した剰余のない平方根決定 に対し、前記丸め値Hはtrunc(C)に等しくかつ前記丸め値Lはnext after(H,O)に等しく、Aの値はHの値にセットされ、かつ 平方根ステースを用いてLまたはHを選択するステップはさらに、もし該平方根 ステータスが“より小さい”であればRをHに等しくセットし、もし該平方根ス テータスが“より大きい”であればLに等しくセットし、またはもし該平方根ス テータスが“等しい”であればRをHに等しくセットするステップを含むもの、 E)Cの丸めビットがセットされている場合の、IEEE正の無限大に向けての 丸め手順を導入した剰余のない平方根決定に対し、 前記丸め値Lはnextaway[trunc(C)]に等しくかつ前記丸め値 Hはnextaway(L)に等しく、Aの値はLの値にセットされ、かつ 平方根ステータスを用いてLまたはHを選択するステップはさらに、もし該平方 根ステータスが“より小さい”であればRをHに等しくセットし、もし該平方根 ステータスが“より大きい”であればLに等しくセットし、またはもし該平方根 ステータスが“等しい”であればRをLに等しくセットするステップを含むもの 、そしてF)Cの丸めビットがクリアされている場合のIEEE正の無限大に向 けての丸め手順を導入した剰余のない平方根決定に対し、 前記丸め値Lはtrunc(C)に等しくかつ前記丸め値Hはnextaway (L)に等しく、 Aの値はLの値にセットされ、かつ 前記平方根ステータスを用いてLまたはHを選択するステップはさらに、もし該 平方根ステータスが“より小さい”であればRをHに等しくセットし、もし該平 方根ステータスが“より大きい”であればLに等しくセットし、またはもし該平 方根ステータスが“等しい”であればRをLに等しくセットするステップを含む もの、 の内のいずれか1つに該当する請求の範囲第6項に記載の方法。
JP3502792A 1989-12-29 1990-12-17 Ieee 754―1985標準に準拠した2進浮動小数点演算丸め Pending JPH04507023A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US45902189A 1989-12-29 1989-12-29
US459,021 1989-12-29

Publications (1)

Publication Number Publication Date
JPH04507023A true JPH04507023A (ja) 1992-12-03

Family

ID=23823065

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3502792A Pending JPH04507023A (ja) 1989-12-29 1990-12-17 Ieee 754―1985標準に準拠した2進浮動小数点演算丸め

Country Status (5)

Country Link
EP (1) EP0461241A4 (ja)
JP (1) JPH04507023A (ja)
KR (1) KR940008611B1 (ja)
CA (1) CA2045662C (ja)
WO (1) WO1991010189A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007063601A1 (ja) 2005-12-02 2007-06-07 Fujitsu Limited 浮動小数点数の除算または平方根演算を行う演算装置及び演算方法

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9312745D0 (en) * 1993-06-21 1993-08-04 Questech Ltd Accurate digital divider
US5729481A (en) * 1995-03-31 1998-03-17 International Business Machines Corporation Method and system of rounding for quadratically converging division or square root
US6898614B2 (en) 2001-03-29 2005-05-24 Koninklijke Philips Electronics N.V. Round-off algorithm without bias for 2's complement data

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01275377A (ja) * 1988-04-27 1989-11-06 Tech Res & Dev Inst Of Japan Def Agency 高速繰り出し用光ファイバリール

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4468748A (en) * 1981-06-11 1984-08-28 Data General Corporation Floating point computation unit having means for rounding the floating point computation result
JPS6125245A (ja) * 1984-07-12 1986-02-04 Nec Corp 丸め処理回路
JPS61213927A (ja) * 1985-03-18 1986-09-22 Hitachi Ltd 浮動小数点演算処理装置
JPH0644225B2 (ja) * 1986-03-27 1994-06-08 日本電気株式会社 浮動小数点丸め正規化回路
US4777613A (en) * 1986-04-01 1988-10-11 Motorola Inc. Floating point numeric data processor
US4758972A (en) * 1986-06-02 1988-07-19 Raytheon Company Precision rounding in a floating point arithmetic unit

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01275377A (ja) * 1988-04-27 1989-11-06 Tech Res & Dev Inst Of Japan Def Agency 高速繰り出し用光ファイバリール

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007063601A1 (ja) 2005-12-02 2007-06-07 Fujitsu Limited 浮動小数点数の除算または平方根演算を行う演算装置及び演算方法

Also Published As

Publication number Publication date
KR920701902A (ko) 1992-08-12
EP0461241A1 (en) 1991-12-18
EP0461241A4 (en) 1993-09-01
WO1991010189A1 (en) 1991-07-11
CA2045662A1 (en) 1991-06-30
KR940008611B1 (ko) 1994-09-24
CA2045662C (en) 1994-04-26

Similar Documents

Publication Publication Date Title
CN107769791B (zh) 用于定点到浮点的转换的装置和方法及2的负幂检测器
CN107273090A (zh) 面向神经网络处理器的近似浮点乘法器及浮点数乘法
WO2002023326A1 (en) Handler for floating-point denormalized numbers
EP1806652B1 (en) Normalization and rounding of an arithmetic operation result
JPH0727456B2 (ja) 浮動小数点演算装置
JP2015170359A (ja) 浮動小数点オペランドを乗算するためのデータ処理装置及び方法
CN113721884B (zh) 运算方法、装置、芯片、电子装置及存储介质
JPH05324270A (ja) 浮動小数点数のためのフォーマット変換方法及びその装置
CN106250098B (zh) 用于在执行浮点运算时控制舍入的装置及方法
JP3345894B2 (ja) 浮動小数点乗算器
US5260889A (en) Computation of sticky-bit in parallel with partial products in a floating point multiplier unit
JPH04283831A (ja) 除算器
US4996660A (en) Selection of divisor multipliers in a floating point divide circuit
EP3798929A1 (en) Information processing apparatus, information processing method, and information processing program
US5867413A (en) Fast method of floating-point multiplication and accumulation
JPH04507023A (ja) Ieee 754―1985標準に準拠した2進浮動小数点演算丸め
US6598065B1 (en) Method for achieving correctly rounded quotients in algorithms based on fused multiply-accumulate without requiring the intermediate calculation of a correctly rounded reciprocal
JPH0545980B2 (ja)
EP0377992A2 (en) Floating point division method and apparatus
US5710730A (en) Divide to integer
EP0166999A2 (en) Time saving method for computing square roots on a computer having a "one bit at a time" division instruction
JP2645422B2 (ja) 浮動小数点演算処理装置
JP2023000142A (ja) 演算装置
KR100974190B1 (ko) 부동 소수점을 이용한 복소수 곱셈방법
JPH01282633A (ja) 非正規化数の処理方式