JPH0445860B2 - - Google Patents

Info

Publication number
JPH0445860B2
JPH0445860B2 JP58194249A JP19424983A JPH0445860B2 JP H0445860 B2 JPH0445860 B2 JP H0445860B2 JP 58194249 A JP58194249 A JP 58194249A JP 19424983 A JP19424983 A JP 19424983A JP H0445860 B2 JPH0445860 B2 JP H0445860B2
Authority
JP
Japan
Prior art keywords
data
pipeline
multiplier
vector
division
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP58194249A
Other languages
English (en)
Other versions
JPS6086671A (ja
Inventor
Yasuhiro Inagami
Koichiro Omoda
Shigeo Nagashima
Takayuki Nakagawa
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP58194249A priority Critical patent/JPS6086671A/ja
Publication of JPS6086671A publication Critical patent/JPS6086671A/ja
Publication of JPH0445860B2 publication Critical patent/JPH0445860B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/76Architectures of general purpose stored program computers
    • G06F15/80Architectures of general purpose stored program computers comprising an array of processing units with common control, e.g. single instruction multiple data processors
    • G06F15/8053Vector processors

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Theoretical Computer Science (AREA)
  • Computing Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Complex Calculations (AREA)

Description

【発明の詳細な説明】 〔発明の利用分野〕 本発明は、ベクトル処理装置において、ベクト
ルデータの除算をパイプラインにて高速に処理す
る装置に関するものである。
〔発明の背景〕
演算数の集合に対し一連の演算を行うベクトル
データ処理装置においては、次々と供給されるベ
クトルデータをパイプラインで処理し、1マシン
サイクルピツチで次々と演算結果を算出するパイ
プライン演算器を有している場合が多い。加算、
減算、乗算を行うパイプライン演算器については
既に知られているが、除算をパイプラインで行つ
ている例はない。このため、いくつかの四則演算
の組合せで実行されるプログラムを考えた場合、
除算を含まない演算はパイプラインにて高速に処
理されるが、除算を含む演算においては極端に性
能が低下する場合があり、除算をパイプラインで
高速に処理する必要がある。
除算を高速に処理する演算方式として、逆数近
似方式が広く用いられている。この方式は、被除
数をN、除数をD、商をQとしたとき、 Q=N/D=N×R0×R1×……/D×R0×R1
×…… とおいて、D×R0×R1×……を1に近づけるよ
うなR0、R1、R2……を求めることにより、 QN×R0×R1×…… を求めるものである。
最初のR0は除数Dより近似逆数表を引いてD
の逆数を近似的に求める。除数Dの近似的な逆数
であるR0の精度は、近似逆数表の大きさに依存
するが、今仮に次式で示される精度であつたとす
る。
D×R0=1±ε 0<ε≪1 (1) ここで、 R1=2−D×R0 (2) とすると、 R1=2−(1±ε)=1〓ε (3) と表わされ、 D×R0×R1=(1±ε)(1〓ε)=1−ε2 0<ε2≪1 (4) となる。次に R2=2−D×R0×R1 (5) とすると R2=2−(1−ε2)=1+ε2 (6) D×R0×R1×R2=(1−ε2)(1+ε2) =1−ε4 0<ε≪1 (7) となる。同様の操作を繰り返すことにより、 R0×R1×……×Ro→1 (8) とすることができる。
いま仮にε4が対象とするベクトル処理装置のデ
ータ表示有効桁数以下の精度となれば、 Q=N/D=N×R0×R1×R2/D×R0×R1×R2 =N×R0×R1×R2/1−ε4 (9) となつて、 Q=N×R0×R1×R2 (10) を商とすることができる。
このように逆数近似方式による除算はデータ表
現有効桁数より精度の悪い除数の近似的な逆数を
あらかじめ用意しておき、乗算処理を繰り返すこ
とにより逆数の精度を上げて商を得ようとするも
のである。
高速の乗算器をもつ処理装置においては、逆数
近似方式は除算を高速に処理する有効な演算方式
であるが、一方、パイプライン方式で除算を行う
場合には、所望の精度を得るまでに必要な乗算の
回数に等しい乗算器を直列に結合する必要があ
り、パイプラインで除算を行うために必要な回路
の規模が膨大なものとなる。
このため、従来のベクトル処理装置においては
所望の精度を得るまでに必要な乗算の回数に等し
い数だけ、1個のパイプライン乗算器を繰り返し
用いることにより除算を実現している例があつ
た。
すなわち、被除数N、除数Dとした場合、次の
4ステツプで商Qを得る。
ステツプ1:近似逆数の計算 R01/D (11) ステツプ2:近似逆数の精度向上 R1=(2−D×R0) (12) ステツプ3:分子の近似 N1=N×R0 (13) ステツプ4:商の精度向上 Q==N1×R1 (13) 第1図は、このときに用いる浮動小数点データ
表現形式を示したものである。
浮動小数点データは、符号の表現に1ビツト、
指数の表現に15ビツト、仮数の表現に48ビツト、
合計64ビツトを使用して表現される。この従来技
術では、逆数近似方式による除算によつて仮数部
のデータ有効表現桁数48ビツトの精度を確保すれ
ばよく、そのために上記ステツプ1からステツプ
4の4段階の演算で除算を実現している。
ステツプ1では除数Dの近似逆数R0を精度30
ビツトで求める。次にステツプ2で精度を47ビツ
トまで向上させてR1を求め、ステツプ3、ステ
ツプ4で、N1=N×R0およびQ=N1×R1を計算
して商Qを算出している。第2図は、この除算処
理における精度向上の様子を示したものである。
従来技術では上記4ステツプから成るベクトル
データの除算処理を、次に示すような命令および
ハードウエア構成で実現している。
ステツプ1の精度30ビツトの近似逆数R0を求
める処理は、この処理のためだけに用意された
Floating point reciprocal approximation命令
で行われる。
ステツプ2の処理は、この処理のためだけに用
意されたReciprocal Iterations命令で処理され
る。
ステツプ3およびステツプ4の処理は、通常の
浮動小数点ベクトル乗算命令を用いて処理され
る。
以上の処理のために従来では浮動小数点乗算ユ
ニツトおよび浮動小数点逆数近似ユニツトが用い
られる。浮動小数点乗算ユニツトは、通常のベク
トル乗算命令の処理に用いられる演算器で、1マ
シンサイクルピツチで次々と送られてくるデータ
をパイプラインで処理し、1マシンサイクルに1
演算結果の割合で乗算結果を出力するパイプライ
ン構造の乗算器である。浮動小数点逆数近似ユニ
ツトは、Floating Point Reciprocal
Approximation命令を処理するユニツトで、1
マシンサイクルピツチで次々と送られてくるデー
タの精度30ビツトの近似的な逆数をパイプライン
で算出し、1マシンサイクルに1演算結果の割合
で近似逆数を出力するパイプライン構造の演算器
である。
上記のことからわかるように、従来ベクトルデ
ータの除算においては、浮動小数点逆数近似ユニ
ツトを1回、浮動小数点乗算ユニツトを3回使用
して、いずれもパイプラインで処理される。
Floating Point Reciprocal Approximation
命令を1回、Reciprocal Iterations命令を1回、
浮動小数点乗算命令を2回、計4命令を実行して
ベクトルデータの除算をバイプライン的に処理す
る。このような処理方式では、ベクトルデータの
除算処理に4命令の実行を必要とし処理時間がか
かるとともに、除算処理のために浮動小数点乗算
ユニツトが使用されている間、通常の乗算処理が
行えないといつた問題がある。また、商Qを得る
までに、ステツプ2、ステツプ3の演算結果R1
N1を商Qを得るまでの中間結果として保持する
必要があり、余分の記憶領域あるいはベクトルレ
ジスタが必要であるといつた問題がある。
〔発明の目的〕
本発明の目的は、乗算を繰り返して商を求める
除算方式を採用しているベクトル処理装置におい
て、ベクトルデータの除算をパイプラインで高速
に処理する回路を提供することにある。
〔発明の概要〕 本発明の特徴とするところは、高速性を追求す
るために複数個のパイプライン演算器を装備した
ベクトル処理装置において、乗算処理を繰り返し
て商を求める除算方式を採用してベクトルデータ
の除算を行うとき、商を求めるまでに必要な乗算
を専用に処理する乗算回路を用意することはせ
ず、ベクトルデータの乗算を行う命令の処理に使
用することを目的として設けられたパイプライン
乗算器2個を有機的に結合し、かつ連動して動作
させて除算に必要な乗算処理を行い、除算をパイ
プラインにて高速に処理するところにある。すな
わち、2個のパイプライン乗算器を組とし、一方
の乗算器の出力結果を他方の乗算器に送るデータ
パスを設けることにより2個のパイプライン乗算
器を結合し、また後者のパイプライン乗算器とデ
ータの供給口を共用する除算専用のパイプライン
構造の付加回路を設け、これらを連動して動作さ
せることにより、ベクトルデータの除算をパイプ
ラインで処理する。パイプラインによる除算は、
入力オペランドとして除数を指定し、その近似的
な逆数を出力オペランドとする命令、および入力
オペランドとして被除数、除数、除数の近似的な
逆数を指定し、商を出力オペランドとする命令の
合計2命令を連続して実行することにより行われ
る。
〔発明の実施例〕
以下、実施例を用いて本発明の詳細を説明す
る。
本発明における除算方式は、逆数近似方式を基
本としている。本実施例においては、第3図に示
す浮動小数点データ形式をもつベクトル処理装置
を考える。ベクトル処理装置のデータ表現形式が
どのような形式であるかは本発明の本質ではな
い。
本実施例で扱うデータ表現形式は、第3図に示
す如く、符号部を1ビツト、指数部をeビツト、
仮数部をmビツトで表現している。また、仮数部
の小数点は仮数部の先頭に位置する。
逆数近似方式による除算で特に関係あるのは、
仮数部の表現桁数であり、第3図のデータ表現形
式では、仮数部の有効桁数はmビツトであるので
逆数近似方式による除算において、乗算の繰り返
しにより、精度mビツト(精度2-m)の商を求め
ればよい。
本実施例においては、近似逆数表に記憶させて
おく除数の第一近似逆数は精度lビツトとし、か
つ、第一次近似逆数の精度と浮動小数点有効桁数
との間には次の関係がある。
6l≦m<7l (15) 即ち、近似逆数表を引いて得られる除数の第一
次近似逆数に対し、浮動小数点有効桁数mビツト
を満たす商を得るには、逆数近似方式により乗算
を繰り返すことにより、精度を6倍に上げる必要
がある。第3図に、第一次近似逆数の精度lと浮
動小数点データ仮数部有効桁数mとの関係を示
す。
本実施例において、被除数をN、除数をDと
し、近似逆数表を引いて除数Dの第一次近似逆数
であるrを得てから、精度を6倍に上げて、商 Q=N/D (16) を得るまでの原理は次の通りである。
商Qを得るまでの処理は、次の6ステツプより
成る。
ステツプ1: 除数Dの仮数部上位lビツトをもとに、近似逆
数表を引いて、除数Dの第一次近似逆数rを得
る。第一次近似逆数rの精度は前述のようにlビ
ツトであるので、第一次近似逆数rを得るのに必
要な除数Dのビツト数は、仮数部mビツトのうち
の上位lビツトでよい。
ステツプ2: r1=1+(1−D×r0)+(1−D×r02 (17) の計算。
ステツプ3: R0=r0×r1 (18) の計算。
ステツプ4: R1=2−D×R0 (19) の計算。
ステツプ5: N1=N+R0 (20) の計算。
ステツプ6: Q=N1×R1 (21) の計算。
次に上記ステツプ1からステツプ6の処理で、
精度mビツトの商Qが得られることを示す。
除数Dと第一次近似逆数r0を乗じると1に近い
値となり、その誤差をε(0≦ε<1)とすると
次式がいえる。
D×r0=1±ε (22) 誤差εは第1次近似逆数r0が浮動小数点仮数部
有効桁数mビツトより小さいlビツトの精度しか
持たないことに起因する。
式(17)、(18)、(19)、(20)、(21)と式(22)より次

一連の式が導かれる。
●1−D×r0=1−(1±ε) =〓ε (23) ●(1−D×r02=ε2 (24) ●r1=1〓ε+ε2 (25) ●D×R0=D×r0×r1 =(1±εf)(1〓ε+ε2) 1±ε3 (26) ●R1=2−D×R0 =2−(1±ε3) =1〓ε3 (27) ●D×R0×R1=(1±ε3)(1〓ε3) =1−ε6 (28) 式(28)より、D×R0×R1を計算することに
よつて、除数Dの逆数の精度が、第一次近似逆数
r0のεからその6倍の精度であるε6に上がり、浮
動小数点データ仮数部有効表現桁数以下の精度と
なる。
従つて、商Qを Q=N×R0×R1 (29) とすれば、 Q=N/D =N×R0×R1/D×R0×R1 =N×R0×R1/1−ε6 N×R0×R1 (30) となつて、浮動小数点データ仮数部有効桁数の精
度を満たす値となる。
上述のステツプ5、ステツプ6は式(29)を計
算するためのものである。
本実施例においては、商を得るまでに必要な上
述のステツプ1からステツプ6までの処理を次の
ようにして実現する。即ち、ステツプ1からステ
ツプ3までの処理をVER命令(Vector
Elementwise Reciprocal命令)で行う。VER命
令の出力結果は式(18)で与えられるR0であり、R0
は式(26)から、除数Dの誤差ε3の近似的な逆数
となつている、従つて、VER命令は、商Qを得
る中間結果を出力する命令であるとともに、近似
逆数を算出する命令ともなつている。ステツプ4
からステツプ6の処理はVED命令(Vector
Elementwise Divide命令)で行う。
このように、前記のステツプ1からステツプ6
までの除算の処理を、VER命令、VED命令の2
個の命令を連続して実行することにより行う。
VER命令およびVED命令の処理は、通常の乗算
命令−VEM命令(Vector Elementwise
Multiply命令)と呼ぶことにする−をパイプラ
インで処理するパイプライン乗算器および除算処
理のために設けたパイプライン構造の除算回路を
連動させて動作させることにより、パイプライン
で処理される。以下、処理の内容を詳細に示す。
最初に、パイプライン乗算器の構造例を示す。
第4図はパイプライン乗算器の構成を示したもの
である。第4図の中で、1,2はそれぞれ被乗
数、乗数が送られてくるデータパス、3は乗算結
果を出力するデータパス、10〜17はデータレ
ジスタ、20〜23は倍数発生回路、30〜33
はCSAトリー(Carry Save Adderトリー)、3
4はパラレルアダー、40は第1部分積のキヤリ
ー出力レジスタ、41は第1部分積のサム出力レ
ジスタ、以下42〜47は第2部分積、第3部分
積、第4部分積のキヤリー出力レジスタおよびサ
ム出力レジスタ、48は乗算結果レジスタであ
る。第4図に示すパイプライン乗算器の乗算方式
は既に公知の技術であつて、乗数を2ビツト単位
でデコードして被乗数の倍数を発生させ(乗数の
仮数部は第3図に示した如くmビツトであるの
で、m/2個の倍数が発生される)、これら倍数を
Carry Save Adderおよびパラレル・アダーで加
算して乗算結果を得るものである。第4図の例で
は、mビツトの乗数をm/4ビツトずつ4等分し、
まず最初に、データレジスタ14に保持され乗数
の下位m/4ビツトと、データレジスタ10に保持
される被乗数を倍数発生回路20に入力して倍数
を発生させ、これらの倍数をCSAトリー30に
入力して加算し、データレジスタ40にキヤリー
出力、データレジスタ41にサム出力を得る(第
1部分積の算出)。次に、乗数の第2下位m/4ビ
ツトと被乗数を倍数発生回路21に入力して倍数
を発生させ、これらの倍数と第1部分積のキヤリ
ー出力、サム出力とをCSAトリー31で加算し
て、第2部分積のキヤリー出力、サム出力をそれ
ぞれデータレジスタ42,43に得る。以下同様
の処理をして、第4部分積のキヤリー出力をデー
タレジスタ46、サム出力をデータレジスタ47
に得、これらをパラレルアダー34で加算して、
データレジスタ48に最終積を得る。
第4図に示した例では、上記に示した乗算処理
がパイプラインで行える構造となつている。即
ち、入力データである被乗数である乗数がそれぞ
れデータパス1および2から処理装置の基本処理
単位時間である1マシンサイクルに1データの割
合で次々と送られてくる。最初に送られてきた被
乗数および乗数がそれぞれデータレジスタ10,
14にセツトされると直ちに第1部分積の計算に
移り、1マシンサイクル後にキヤリー出力、サム
出力がデータレジスタ40,41に求まる。これ
と同時に、最初に送られてきた被乗数はデータレ
ジスタ11、乗数の上位3m/4ビツトはデータレ
ジスタ15にセツトされ、データレジスタ10お
よび14には第2番目に送られてきた被乗数およ
び乗数がセツトされる。以下同様に、最初に送ら
れてきたデータの第2部分積がデータレジスタ4
2,43に求まるとき、データレジスタ40,4
1には第2番目に送られてきたデータの第1部分
積が、またデータレジスタ10,14には第3番
目に送られてきた被乗数および乗数がそれぞれセ
ツトされる。そして、データレジスタ48に最初
に送られてきたデータの最終積が求まるとき、第
2番目に送られてきたデータの第4部分積がデー
タレジスタ46,47に、第3番目に送られてき
たデータの第3部分積がデータレジスタ44,4
5に、第3番目に送られてきたデータの第2部分
種がデータレジスタの42,43に、第4番目に
送られてきたデータの第1部分積がデータレジス
タ40,41に、第5番目に送られてきた被乗数
および乗数がデータレジスタ10,14にセツト
されている。
このようにして乗算がパイプラインで処理さ
れ、最初に送られてきたデータの乗算結果がデー
タパス3を介して送出されると、以後1マシンサ
イクルピツチで次々と乗算結果が送出される。
次に、前記のステツプ1からステツプ6までの
除算処理を、第4図に示したパイプライン乗算器
2個および除算専用のパイプライン構造の付加回
路を有機的に結合して処理する実施例を第5図を
用いて詳細に説明する。
第5図において、1および3はパイプライン乗
算器であつて、構造は第4図に示したパイプライ
ン乗算器と全く同じである。パイプライン乗算器
1および3は独立に動作することができ、ベクト
ルデータの乗算を行うVEM命令をそれぞれ独立
に処理できる。即ち、パイプライン乗算器1で
VEM命令を処理する場合は、データバス10,
11から被乗数データ、乗数データが次々と供給
され、乗算結果がデータパス12から次々と送出
される。また、パイプライン乗算器3でVEM命
令を処理する場合は、データパス13,14から
被乗数データ、乗数データが次々と供給され、乗
算結果がデータパス15から次々と送出される。
パイプライン乗算器1と3で別のVEM命令を同
時に処理することが可能である。
次に、第5図に示した実施例における除算処理
の動作を説明する。第5図に示した実施例におい
て除算処理を行うとき、回路の構成上次の点が特
徴的である。
(1) 第5図において、4はパイプライン除算付加
回路であり、前記の除算処理ステツプ1からス
テツプ6のうち、ステツプ2とステツプ5の処
理を行うために特別に設けられた回路であり、
パイプライン構造となつている。パイプライン
除算付加回路の内部構成の詳細は後述する。
(2) 第5図において、パイプライン除算付加回路
4の入力データの供給口は、パイプライン乗算
器3の入力データの供給口と共通となつてお
り、パイプライン除算付加回路4にデータを供
給するときは、パイプライン乗算器3にデータ
を供給するデータパス13,14から、データ
パス19,20を介して行われる。
(3) 第5図において、パイプライン除算付加回路
4の出力データパス17,18を介してパイプ
ライン乗算器3へ送られる。
(4) (2)、(3)より、パイプライン除算付加回路4は
専用の入力データ供給口および出力データ送出
口を持たず、パイプライン乗算器3に併設され
た付加回路の性格をもつ。従つて、第5図にお
いて、第5図の回路を含むベクトル処理装置か
らみたとき、パイプライン除算付加回路4は1
個の独立した演算器でなく、パイプライン乗算
器3と合わせた回路が1個の演算器として扱わ
れる。第5図において、パイプライン乗算器と
パイプライン除算付加回路を合わせた回路2
を、除算付加機構付パイプライン乗算器と呼
ぶ。即ち、本実施例における除算処理専用に設
けたパイプライン除算付加回路4は、ベクトル
処理装置全体から見た場合、大量のベクトルデ
ータのやりとりをするデータパスを新たに設け
る必要がないという点で有利であり、本実施例
の特徴の1つである。
(5) 第5図において、パイプライン除算器1の出
力データを、パイプライン乗算器3に送るデー
タパス16があり、且つ、その間にビツト反転
回路21および1加算回路22が入つている。
(6) 第5図において、30,31はデータパスセ
レクト回路であり、データパスセレクト回路3
0はパイプライン乗算器3へ被乗数データを供
給するパス13、パイプライン除算付加回路4
の出力データを送るパス17、パイプライン乗
算器1の出力データをビツト反転したデータを
送るパス16のいずれかを選択することがで
き、またデータセレクト回路31は、パイプラ
イン乗算器3へ乗数データを供給するパス1
4、パイプライン除算付加回路4の出力データ
を送るパス18のいずれかを選択することがで
きる。
次に、パイプライン除算付加回路4の内部構成
を説明する。第5図において、40〜51および
78,79はデータレジスタ、60〜62は第4
図で説明した倍数発生回路と同一の回路、63〜
65は第4図で説明したCSAトリーと同一の回
路、66,67は第4図で説明したパラレルアダ
ーと同一の回路、70〜75はそれぞれCSAト
リー63〜65のキヤリー出力レジスタ、サム出
力レジスタ、76,77はそれぞれパラレルアダ
ー66,67の出力レジスタ、32,33はデー
タパスセレクト回路である。また、第5図におい
て80は記憶回路であつて、近似逆数表の登録を
目的とする。以上の構成をもつパイプライン除算
付加回路4は機能的には次の3つのコンポーネン
トから構成されている。
(1) 乗数巾m/4ビツトのパイプライン乗算器 第5図のデータレジスタ40、倍数発生回路
60、CSAトリー63、パラレルアダー66、
データレジスタ70,71,76で構成される
回路は、データレジスタ40に貯えられている
データを被乗数、記憶回路80から読出しデー
タを乗数とするパイプライン乗算器となつてい
る。乗数のビツト数は、倍数発生回路60、
CSAトリー63が第4図で説明したそれらと
同一であるのでm/4ビツトである。
(2) 乗数巾m/2ビツトのパイプライン乗算器 データレジスタ48〜51、倍数発生回路6
1,62、CSAトリー64,65、パラレル
アダー67、データレジスタ72〜75および
77で構成される回路は、データレジスタ48
に貯えられているデータを被乗数、データレジ
スタ49に貯わえられているデータを乗数とす
るパイプライン乗算器となつている。乗数のビ
ツト数は、第4図で説明したものと同じ倍数発
生回路、CSAトリーがそれぞれ2組あるので
m/2ビツトである。
(3) 近似逆数表 第5図の記憶回路80は、データレジスタ4
0に貯わえられているデータをアドレスとして
データを読出すもので、除算処理における第一
次近似逆数を保持する近似逆数として使われ
る。
このように、パイプライン除算付加回路は除算
処理のために特別に用意されてはいるが、回路構
成は通常のパイプライン乗算器と類似したものと
なつており、回路実現上有利である。
以上のような特徴的な構成をもつ第5図の実施
例において、前記のステツプ1からステツプ6の
除算処理がパイプラインで実行される様子を次に
説明する。本実施例における除算処理は前述のよ
うに、VER命令 VED命令の計2個の命令で行
われる。
(1) VER命令の処理 VER命令は除数Dを入力データとし、前記
のステツプ1〜ステツプ3の処理を行つて、式
(18)で与えられる除数Dの近似的な逆数R0を出
力データとして出力する。処理は第5図の除算
付加機構付パイプライン乗算器2を用いて行わ
れる。以下各ステツプ毎に処理の詳細を示す。
ステツプ1: 入力データ除数Dが、第5図のデータパス1
3および19を介して1マシンサイクルピツチ
で次々と供給され、データレジスタ40にセツ
トされる。データレジスタ40にセツトされた
除数Dの仮数部mビツトのうちの上位lビツト
をアドレスとして記憶回路80に登録されてい
る近似逆数を引き、除数Dの第一次近似逆数r0
を得る。r0のビツト巾はlビツトである。
ステツプ2: 除数Dおよび第一次近似逆数rより次式を計
算する。
r1=1+(1−D×r0)+(1−D×r02 (17) まず、 1−D×r0 (31) の計算をパイプライン除算付加回路4の中の乗
数巾m/4ビツトのパイプライン乗算器で行う。
第一次近似逆数r0はlビツト巾であり、またl
と浮動小数点仮数部ビツト数mとの間には式(15)
に示す関係があり、 l≦m/6<m/4 (32) が成立する。
従つて、式(31)の計算で、D×rは、Dを
被乗数、r0を乗数として乗数巾m/4ビツトのパ
イプライン乗算器で計算できる。
実際には式(31)を変形して式(33)の形で
計算する。
1+D×(−r0) (33) 式(33)の計算において、 ●乗数をr0から−r0とする処理は第5図のビツ
ト反転回路81で行われ1の補数化を行い処
理する。
●値1の加算は、倍数発生回路60で発生され
た倍数をCSAトリー70で加算するときに、
値1発生回路82の出力を合わせて加算する
ことにより処理する。
以上の処理によりデータレジスタ76に式
(33)の値が求まる。これらの処理はパイプラ
インで行われる。即ち、データ13,19を介
して除数Dが1マシンサイクルピツチで次々と
供給され、第一番目のデータの演算結果がデー
タレジスタ76にセツトされるとき、第2番目
のデータの部分積がデータレジスタ70,71
に、第3番目のデータがデータレジスタ40に
セツトされる。
次に、式(33)の計算結果を用いて式(17)を計
算する。式(17)の計算はパイプライン除算付加回
路4の中の乗数巾m/2ビツトのパイプライン乗
算器を用いて行う。式(17)の計算は、式(17)を式
(34)のように変形して行う。
1+(1−D×r0)・{1+(1−D×r0)} (34) 即ち、データセレクト回路32,33をデー
タレジスタ76の値を選択するように制御し、
データレジスタ76に得られた(1−D×r0
の値を乗数としてデータレジスタ48にセツト
し、データレジスタ76に得られた値を+1回
路83を通して得られる値{1+(1−D×
r0)}を被乗数としてデータレジスタ49にセ
ツトする。
データレジスタ48,49に被乗数および乗
数がセツトされると、倍数発生回路61,6
2、CSAトリー64,65、パラレル・アダ
ー67を用いてパイプラインで乗算処理が開始
される。
また式(34)における値1の加算は、式
(33)の計算において用いたのと同じ手法で、
倍数発生回路61が発生した倍数をCSAトリ
ー64で加算するときに値1発生回路84の出
力を合わせて加算することにより処理する。
以上の処理により式(17)の値r1がデータレジス
タ77に求まる。
また記憶回路80から読み出された第一次近
似逆数rは、それと対応する式(17)を求めるまで
の乗算処理が進行するのと同期してデータレジ
スタ42〜47を進む。即ち、第i番目(iは
自然数)のデータに対応する式(17)の演算結果r1
(i)がデータレジスタ77にセツトされるとき、
データレジスタ47には、第i番目のデータに
対応する第一次近似倍数r(i)がセツトされる。
なお、式(34)の計算において、乗数1−D
×r0の精度は式(23)で与えられ、lビツトあ
ればよいので、式(32)の関係より乗数巾m/2
は充分である。
ステツプ3: 式(18)の乗算処理はパイプライン乗算器3を用
いて行われる。
即ち、データパスセレクト回路30をデータ
パス17を選択するように制御し、またデータ
セレクト回路31をデータパス18を選択する
ように制御して、データレジスタ47に得られ
た値r0およびデータレジスタ77に得られた値
r1をそれぞれデータレジスタ100,101に
取り込む。データレジスタ100,101にデ
ータが取り込まれると、パイプライン乗算器3
が第4図の説明で述べたように動作し、式(18)の
乗算処理がパイプラインで処理され、演算結果
R0がデータレジスタ102に得られ、データ
パス15を介して、VER命令の演算結果とし
て送出される。
以上示したVER命令の処理において、入力
データである除数Dがデータレジスタ40にセ
ツトされてから演算結果R0がデータレジスタ
102に求まるまでの一連の処理はパイプライ
ンで行われ、データパス13,19を介して1
マシンサイクルピツチでベクトルデータを次々
と供給するとき、第1番目のデータの演算結果
がデータパス15を介して送出されると、以後
1マシンサイクルピツチで次々と演算結果が送
出される。
(2) VED命令の処理 VED命令は、被除数N、除数DおよびVER
命令の演算結果であるR0を入力データとし、
前記のステツプ4〜ステツプ6の処理を行つ
て、商Qを出力データとして出力する。処理は
第5図のパイプライン乗算器1および乗算付加
機構付パイプライン乗算器2を連動して動作さ
せることにより行う。以下各ステツプ毎の処理
の詳細を示す。
ステツプ4: 式(19)の演算はパイプライン乗算器1により行
われる。
R1=2−D×R0 (19) 第6図において、データパス10を介して除
数D、データパス11を介して近似逆数R0
1マシンサイクルピツチで次々と供給される。
除数Dおよび近似逆数R0がそれぞれデータレ
ジスタ200,201にセツトされると、パイ
プライン乗算器1が第4図の説明で述べたよう
に動作し、D×R0の乗算処理がパイプライン
で処理され、演算結果がデータレジスタ202
に得られる。
D×R0の値を2から減じてR1を求める処理
は、D×R0の値の2の補数値を得ることに相
当し、これは、ビツト反転回路21、+1回路
22により実現される。
以上により得られた値R1はデータパス16
を介して除算付加機構付パイプライン乗算器2
へ送られる。
ステツプ5: 式(20)の乗算処理はパイプライン除算付加回路
4の中の乗数巾m/2ビツトの乗算器で行われ
る。
N1=N×R0 (20) 第5図において、データパス13および19
を介して被除数N、データパス14および20
を介して近似逆数R0が1マシンサイクルピツ
チで次々と供給され、それぞれデータレジスタ
40および41にセツトされる。本ステツプの
処理においてはデータパスセレクト回路32は
データレジスタ78を選択、データパスセレク
ト回路33はデータレジスタ78の値を選択す
るよう制御される。この結果、データレジスタ
40にセツトされた被除数Nは、データレジス
タ78、データパスセレクト回路32を介して
データレジスタ48にセツトされる。同様にデ
ータレジスタ41にセツトされた近似逆数R0
はデータレジスタ79およびデータパスセレク
ト回路33を介してデータレジスタ49にセツ
トされる。
データレジスタ48にセツトされたNを被乗
数、データレジスタ49にセツトされたR0
乗数として、倍数発生回路61,62、CSA
トリー64,65、パラレルアダー67を用い
て式(20)の乗算処理がパイプラインで行われ、結
果N1がデータレジスタ77に得られる。
式(20)の乗算処理において、乗数となるR0
式(26)に示した精度をもつ。即ち、第一次近
似逆数rの精度の3倍の精度をもつ。第一次近
似逆数rがlビツトで表現されるから、R0
3×lビツトで表現すれば精度的に問題ない。
lと浮動小数点仮数部有効桁数mとの間には式
(15)の関係があるので、 3l≦m/2 (35) が成立し、乗数巾m/2ビツトで乗算処理を行つ
て問題はない。
ここで、ステツプ4およびステツプ5の処理
は同期して行われる。即ち、1マシンサイクル
ピツチで次々と入力データが供給されるとき、
第i番目の除数D、第i番目の被除数N、第i
番目の近似逆数R0がデータレジスタ200,
100,101および201にセツトされるの
は同一時刻である。さらに、第i番目の除数
D、近似逆数R0がそれぞれデータレジスタの
200,201にセツトされてから、ステツプ
4の演算においてD×R0の値がデータレジス
タ202にセツトされるまでの時間と、第i番
目の被除数N、近似逆数R0がそれぞれデータ
レジスタ40,41にセツトされてから、ステ
ツプ5の演算結果N1がデータレジスタ77に
セツトされるまでの時間は共に5マシンサイク
ルとなるよう、パイプライン乗算器1およびパ
イプライン除算付加回路4は構成されている。
従つて、次に説明するステツプ6の処理におい
て、第i番目のR1、第i番目のN1がそれぞれ
データレジスタ100,101にセツトされる
のは同一時刻である。
ステツプ6: 式(21)の乗算処理がパイプライン乗算器3
で処理される。VED命令実行時、第6図のデ
ータパスセレクト回路30はデータパス16を
選択、データパスセレクト回路31はデータパ
ス18を選択するよう制御される。
パイプライン乗算器1でパイプラインで計算
されたステツプ4の結果R1はデータパス16
を介して1マシンサイクルピツチで次々と送ら
れ、データレジスタ100にセツトされる。ま
たパイプライン除算付加回路でパイプラインで
計算されたステツプ5の結果N1はデータパス
18を介して1マシンサイクルピツチで次々と
送られ、データレジスタ101にセツトされ
る。このとき、前にも述べた通り、第i番目の
R1がデータレジスタ100、第i番目のN1
データレジスタ101にセツトされるのは同一
時刻である。
R1およびN1がそれぞれデータレジスタ10
0,101にセツトされると、パイプライン乗
算器3が第4図の説明で述べたように動作し、
式(21)の乗算処理がパイプラインで行われ、
演算結果がデータレジスタ102に得られる。
データレジスタ102に得られたデータは
VED命令の乗算結果、商Qとして、データパ
ス15を介して1マシンサイクルピツチで次々
と送出される。
以上示したVED命令の処理において、入力デ
ータである除数D、被除数N、近似逆数R0がそ
れぞれデータレジスタ200,100,201,
101にセツトされてから出力データである商Q
がデータレジスタ102に求まるまでの一連の処
理はパイプラインで行われ、入力データが1マシ
ンサイクルピツチで次々と供給されるとき、第1
番目のデータの演算結果がデータパス15を介し
て送出されると、以後1マシンサイクルピツチで
次々と演算結果が送出される。
以上第5図を用いて説明した本発明の実施例に
おいては、乗算を繰り返して商を求める逆数近似
方式のベクトルデータの除算を、第5図に示した
回路を用いて、VER命令、VED命令の2命令を
連続して実行することにより行う。さらに、
VER命令、VED命令はいずれもパイプラインで
処理され、それぞれ1マシンサイクルに1演算結
果が得られる。従つて、第5図の実施例では商Q
が等価的に2マシンサイクルに1演算経過の割合
で得られる。
第6図は、第5図に示したベクトル除算処理用
の回路構成を含むベクトル処理装置の一実施例を
示したものである。第6図において、パイプライ
ン乗算器1、除算付加機構付パイプライン乗算器
2、データパス10〜16は第5図のそれらと対
応している。主記憶装置100はベクトルデータ
やベクトル命令列を保持する、200はベクトル
レジスタ群であつて、主記憶装置とパイプライン
演算器との間に位置し、ベクトルデータを一時的
に記憶するためのものである。第6図の実施例で
はベクトルレジスタはN本あり、それぞれ0、
1、2、…、N−1と番号付けされている。また
各ベクトルレジスタは最大L個の要素から成るベ
クトルデータを保持することができるようになつ
ている。データパス101〜105は主記憶装置
とベクトルレジスタとの間のデータ転送を行うも
のである。
206はベクトルレジスタ読出/書込制御回路
であつて、ベクトルレジスタとパイプライン演算
器との間のデータパスの結合関係を制御するもの
である。データパス201〜205はベクトルレ
ジスタとベクトルレジスタ読出/書込制御回路と
の間のデータパスである。
300はベクトル命令レジスタ(Vector
Instruction Register VIRと略す)であつて、デ
ータパス304を介して主記憶装置から読出され
たベクトル命令を一時的に保持するレジスタであ
る。
301はベクトル命令レジスタ300に保持さ
れているベクトル命令を解読する回路であつて、
信号線302はベクトル命令の解読結果をベクト
ルレジスタ読出/書込制御回路へ通知するための
もの、また信号線303は、第5図で示した除算
付加機構付パイプライン乗算器2内のデータセレ
クト回路30,31,32,33を制御するため
のものである。
なお、第6図の実施例においては、パイプライ
ン演算器として除算処理に関係のある2個のパイ
プライン演算器のみを示したが、他にパイプライ
ン演算器があつても差しつかえない。
第7図は、第6図に示したベクトル処理装置に
おいて除算を実行するためのベクトル命令列の一
例を示したものである。第7図において、命令
は主記憶装置上にあるベクトルデータ被除数
N、除数Dをそれぞれベクトルレジスタの0番、
1番にロードするVector LoaD命令(略号
VLD)である。命令は前記で示したVER命令
であつて、命令によつてベクトルレジスタの第
1番にロードされた除数Dを読出して近似逆数
R0を計算し結果をベクトルレジスタの第2番に
格納するものである。命令は前記で示した
VED命令であつて、命令、、でそれぞれ
ベクトルレジスタの第0番、第1番、第2番に格
納されている被除数N、除数D、近似逆数R0
読出して、商Qを計算し結果をベクトルレジスタ
の第3番に格納するものである。なお、命令で
は、R0が格納されているベクトルレジスタ第2
番の指定がないがこれは、VED命令のオペラン
ドの指定方式として、除数Dが格納されているベ
クトルレジスタの番号より1多い番号のベクトル
レジスタに除数Dの近似逆数R0が格納されてい
ると仮定して、オペランドの指定数を減らしてい
ることによる。
次に、第7図に示したベクトル命令列が第6図
に示したベクトル処理装置において実行される様
子を説明する。ここで第7図の命令、は本発
明と特に関連をもたないので説明を省略する。
(1) VER命令の処理 主記憶装置100よりデータパス304を介
して第7図の命令、VER命令が読出される
と、ベクトル命令レジスタ300にセツトされ
直ちにベクトル命令解読回路301に送られ
る。ベクトル命令解読回路301において命令
の内容が解読されると、信号線302を介して
ベクトルレジスタ読出/書込制御回路に対し、
データパス202とデータパス13、データパ
ス203とデータパス15を結合し、ベクトル
レジスタ第1番からのデータの読出し、および
ベクトルレジスタ第2番へのデータの書込みを
指示する。また信号線303を介して、除算付
加機構付パイプライン乗算器に付し、VER命
令の処理を指示する。しかる後、ベクトルレジ
スタの第1番から除数Dを次々と読出し、デー
タパス202及び13を介して除算付加機構付
パイプライン乗算器に供給し、パイプラインで
R0を計算し、データパス15および203を
介してベクトルレジスタ第2番へ次々と書き込
まれる。
(2) VED命令の処理 前述のVER命令の場合と全く同様に主記憶
装置100から読出された第7図の命令、
VED命令はベクトル命令解読回路301で解
読される。ベクトル命令解読回路301で命令
の内容が解読されると、信号線302を介して
ベクトルレジスタ読出/書込制御回路に対し、
データパス201とデータパス13、データパ
ス202とデータパス10、データパス203
とデータパス11および14をそれぞれ結合
し、ベクトルレジスタの第0番、第1番、第2
番の読出しおよび第3番への書込みを指示す
る。また信号線303を介し、除算付加機構付
パイプライン乗算器に対しVED命令の処理を
指示する。しかる後、ベクトルレジスタの第0
番、第1番、第2番からそれぞれ被除数N、除
数D、近似逆数R0を次々と読出し、それぞれ
データパス201と13,202と10,20
3と11および14を介してパイプライン乗算
器1および除算付加機構付パイプライン乗算器
2へ供給し、商Qをパイプラインで計算し、デ
ータパス15および204を介してベクトルレ
ジスタ第3番に次々と書込む。
このように、本実施例によれば、通常の乗算処
理機能を持ち、パイプライン除算のための付加機
構を有するパイプライン乗算器2と、本来通常の
乗算処理を行うために装備されているパイプライ
ン乗算器1を組み合せて用い、VER命令及び
VED命令の2個の命令を、逐次的に連続して実
行することにより、除算をパイプライン処理にて
高速に実行することができる。なお、VER命令、
VED命令は独立した命令であり、必ずしも連続
して実行する必要はなく、間に別の命令が挿入さ
れ実行されて構わない。
VER命令が実行されるときには、パイプライ
ン除算付加機構を持つパイプライン乗算器2のみ
が使用される。VER命令実行の後、VED命令を
実行するときには、パイプライン乗算器1とパイ
プライン乗算器2とが同時に使用される。
VER命令、VED命令が処理されるとき、パイ
プライン乗算器1及びパイプライン乗算器2がど
のように使用されるかを、第8図に示すタイムチ
ヤートにて説明する。第8図においては、演算器
の種類と、各演算器の入出力信号線を縦軸にと
り、横軸には処理する命令の時間的経過を示して
いる。演算器及び入出力信号線の番号は第6図に
あるものと同じである。第8図においては、要素
の数がn個のベクトルデータを処理することを仮
定している。各要素は、1、2…、nで何番目の
要素であるかを表す。N(1)、N(2)、N(n)はそれぞ
れ被除数の第1目、第2番目、第n番目の要素を
表す。D(1)、D(2)、D(n)は除数、Q(1)、Q(2)、Q
(n)は最終演算結果である商、また、R0(1)、R0(2)、
R0(n)、R1(1)、R1(2)、R1(n)、N1(1)、N1(2)、N1(n)
はそれぞれ補正量である。VER命令の処理時、
パイプライン演算器2のみが使用され、パイプラ
イン演算器1は使用されない。パイプライン乗算
器2の入力信号線13には、除数Dが毎サイクル
毎次々と入力される。出力信号線15からは、D
(1)、D(2)、D(n)に対応するR0(1)、R0(2)、…、R0
(n)が次々と出力され、VER命令の結果が求めら
れる。VED命令の処理時には、パイプライン乗
算器1の入力信号線10より除数D、パイプライ
ン乗算器2の入力信号線13より被除数N、パイ
プライン乗算器1の入力信号線11及びパイプラ
イン乗算器2の入力信号線14にはVER命令で
求めた補正量R0が、各要素同期して次々と入力
される。パイプライン乗算器1では、D(i)及び
R0(i)[i=1〜n]により求められるR1(1)、R
(2)、…、R1(n)が出力信号線16から次々と出力
され、パイプライン乗算器2に送られる。パイプ
ライン乗算器2においてもN(i)及びR0(i)[i=
1〜n]から求められるN1(1)、N1(2)、…、N1(n)
が次々と求められる。N1(i)とR1(i)[i=1〜n]
とから商Q(1)、Q(2)、…、Q(n)が次々と求めら
れ、パイプライン乗算器2の出力信号線15から
次々と送出される。
以上のように、本実施例によれば、通常の乗算
処理に用いるパイプライン乗算器を流用して、ベ
クトルデータの除算をパイプラインで処理すると
ともに、商Qを得るまでの途中経過としてR0
保持するベクトルレジスタが1本で済むといつた
特徴がある。
〔発明の効果〕
以上述べたように、ベクトル処理装置において
乗算を繰り返して商を求める逆数近似方式により
ベクトルデータの除算を行うとき、従来は通常の
乗算器を用い商を得るまでに必要な繰り返しの乗
算と通常の乗算命令等を用いて行つていたのに対
し、本発明では、通常のパイプライン乗算処理に
用いる2個のパイプライン乗算器に対し、一方の
乗算器の出力結果を直接他方の乗算器の入力デー
タとするパスを設け、また通常のパイプライン乗
算器と類似した構造をもつ除算処理専用のパイプ
ライン構造の付加回路1個を入口データの供給口
をパイプライン乗算器と共用する形で併設し、ベ
クトル処理装置内に除算処理専用の大規模な回路
を設けることなく、ベクトルデータの除算をパイ
プラインで高速に処理することができる。
【図面の簡単な説明】
第1図は従来の浮動小数点数値データ表現形式
を示す図、第2図は従来の除算処理における精度
向上の概念を示す図、第3図は本発明の一実施例
で扱う浮動小数点データ表現形式を示す図、第4
図は本発明の一実施例で扱うパイプライン乗算器
のブロツク図、第5図および第6図は本発明の一
実施例を示すブロツク図、第7図は本発明の一実
施例で扱うベクトル命令列を示す図である。第8
図は、第4図の装置の動作を説明する図である。 1……パイプライン乗算器、2……除算付加機
構付パイプライン乗算器、3……パイプライン乗
算器、4……パイプライン除算付加回路。

Claims (1)

    【特許請求の範囲】
  1. 1 複数の除数(D)の各々に対して、第0近似の逆
    数(r0)を出力するメモリと、該メモリから出力
    される第0近似の逆数(r0)から誤差(1−D×
    r0)を算出する第1のパイプライン演算器と、こ
    の誤差から第1の補正量r1=1+(1−D×r0
    (1−D×r02を算出する第2のパイプライン演
    算器と、この第1の補正量r1から第2の補正量R0
    =r0×r1を算出する第3のパイプライン演算器
    と、該第2の補正量R0とその除数(D)との積D×
    R0を算出する第4のパイプライン演算器と、そ
    の積の2の補数2−D×R0からなる第3の補正
    量R1を算出する補数回路とを有し、上記複数の
    除数(D)にそれぞれ対応する複数の被除数(N)の各々
    と、その被除数(N)に対応する除数(D)に対して該第
    3のパイプライン演算器で算出された第2の補正
    量R0との積N×R0を該第2のパイプライン演算
    器により算出し、さらに該積N×R0と、その被
    除数(N)に対応する除数Dに対して該補数回路から
    も出力された第3の補正量R1との積を近似商(Q)
    として該第3のパイプライン演算器により算出す
    る除算回路。
JP58194249A 1983-10-19 1983-10-19 除算回路 Granted JPS6086671A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58194249A JPS6086671A (ja) 1983-10-19 1983-10-19 除算回路

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58194249A JPS6086671A (ja) 1983-10-19 1983-10-19 除算回路

Publications (2)

Publication Number Publication Date
JPS6086671A JPS6086671A (ja) 1985-05-16
JPH0445860B2 true JPH0445860B2 (ja) 1992-07-28

Family

ID=16321463

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58194249A Granted JPS6086671A (ja) 1983-10-19 1983-10-19 除算回路

Country Status (1)

Country Link
JP (1) JPS6086671A (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62118474A (ja) * 1985-11-19 1987-05-29 Hitachi Ltd ベクトル除算装置の制御方式
JPH0535773A (ja) * 1991-07-30 1993-02-12 Nec Corp ベクトル除算方式とその装置
KR100434391B1 (ko) * 2001-07-20 2004-06-04 학교법인대우학원 디에스피 프로세서 및 마이크로프로세서의 실시간영상데이터 처리를 위한 연산회로 및 그 연산방법

Also Published As

Publication number Publication date
JPS6086671A (ja) 1985-05-16

Similar Documents

Publication Publication Date Title
US9753695B2 (en) Datapath circuit for digital signal processors
US4707798A (en) Method and apparatus for division using interpolation approximation
US5046038A (en) Method and apparatus for performing division using a rectangular aspect ratio multiplier
US5515308A (en) Floating point arithmetic unit using modified Newton-Raphson technique for division and square root
US6327605B2 (en) Data processor and data processing system
CA2286647C (en) Arithmetic processor
US5768170A (en) Method and apparatus for performing microprocessor integer division operations using floating point hardware
KR101202445B1 (ko) 프로세서
US5206823A (en) Apparatus to perform Newton iterations for reciprocal and reciprocal square root
JPS6347874A (ja) 算術演算装置
US5426600A (en) Double precision division circuit and method for digital signal processor
JPS6125188B2 (ja)
JPH0477932B2 (ja)
JPH05250146A (ja) 整数累乗処理を行なうための回路及び方法
JPH0250492B2 (ja)
US4991132A (en) Apparatus for executing division by high-speed convergence processing
Buell et al. A multiprecise integer arithmetic package
JPH0445860B2 (ja)
JP2737933B2 (ja) 除算装置
JP2508286B2 (ja) 平方根演算装置
WO2020084721A1 (ja) 演算処理装置及び演算処理装置の制御方法
JPH01233520A (ja) 高基数非回復型除算装置
Ehrman “Logical” arithmetic on computers with two's complement binary arithmetic
JP2607759B2 (ja) 除算器
JPH01205330A (ja) 除算装置