JPH0477932B2

JPH0477932B2 -

Info

Publication number: JPH0477932B2
Application number: JP60259448A
Authority: JP
Inventors: Hiroshi Nakano
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 1985-11-19
Filing date: 1985-11-19
Publication date: 1992-12-09
Also published as: JPS62118474A; US4797849A

Description

【発明の詳細な説明】〔産業上の利用分野〕本発明は除算装置の制御方式に係り、特にベク
トルプロセツサにおけるベクトル除算装置の制御
方式に関する。

〔発明の背景〕

ベクトルプロセツサでは、演算パイプラインに
より処理の高速化を実現しているが、ベクトル除
算をパイプラインで処理するのは容易ではない。

従来、例えば特願昭56−55549号、特願昭58−
194249号に示されるように、物量を多くして必要
な数だけの乗算器、加算器を組合せることによ
り、ベクトル除算をパイプラインで処理する方式
が提案されている。この方式の場合、ベクトルプ
ロセツサにおけるベクトル除算の性能向上は確保
できるが、物量が膨大となり、ベクトルプロセツ
サのコスト高は免がれない。

〔発明の目的〕

本発明の目的は、乗算器を１個程度しか持たな
いベクトル除算装置において、ベクトル除算をパ
イプラインで処理することを可能にすることにあ
る。

〔発明の概要〕

一定の時間間隔毎に、一定の長さの部分商を算
出し、該部分商をマージすることにより所望の長
さの商を求めるベクトル除算装置において、同一
の回路を繰返し使用して部分商を算出する回路を
主要処理部と総称し、主要処理部の前段に位置す
る回路を前処理部、主要処理部の後段に位置する
回路を後処理部とそれぞれ総称することにする。

例えば前処理部がA₁ないしA₆の基本動作から
なり、主要処理部については、重複的に回路を使
用することを許容して、処理するデータが異なる
のに対応して記号を変えてB₁ないしB₆の基本動
作からなるとし、また後処理部はC₁ないしC₃の
基本動作からなるとする。このとき特にベクトル
要素間でのパイプラインを意図せず、ｉ番目の１
組のベクトル要素の除算が終了してから、ｉ＋１
番目の１組のベクトル要素の除算を開始する除算
装置では、処理の流れは第２図のようになる。こ
れに対して、制御回路を工夫することによつて、
ｉ番目の１組のベクトル要素の除算が完全に終了
しないうちに、ｉ＋１番目の１組のベクトル要素
の除算を開始するベクトル除算装置の処理の流れ
を第３図に示す。第３図において、主要処理部の
動作は同一回路を重複して使用しているので、原
理的に重複して動作させることはできず、第３図
に示すように、主要処理部として動作に矛盾がな
く、動作に空きのないのはｉ番目の最終動作B₆
とｉ＋１番目の開始動作B₁が隣り合う場合であ
る。

以上により、主要処理部の基本動作の数が除算
の起動ピツチを決定しており、これは商のマージ
回数に依存するので、制御回路を工夫することに
よつて、主要処理部の基本動作の数と同数のクロ
ツクピツチで除算を起動することにより、乗算器
を１個しか持たないベクトル除算装置において、
演算パイプラインを導入してベクトル除算を処理
することができる。

〔発明の実施例〕

第１図は本発明によるベクトル除算装置の一実
施例のブロツク図を示す。第１図に示すベクトル
除算装置は、除算装置自体を取り出せば特願昭58
−247646号に示された構成と大きく異なる部分は
ないが、制御回路１による制御が大きく異なつて
いる。

本発明を使用したときの第１図の動作のタイム
チヤートを第４図に、また、本発明を使用し、動
作一時停止が２クロツク発生したときの第１図の
動作タイムチヤートを第５図にそれぞれ示す。な
お、本実施例では、部分商は12ビツトずつ求め、
商は24ビツト求めるものとする。

第４図、第５図における記号の意味は次の通り
である。また、各記号の下にある丸印で囲んだ数
字は要素番号を表す。

Ｎ：被除数Ｄ：除数 N₀：正規化後の被除数 D₀：正規化後の除数Ｍ：D₀の近似逆数 Q_i：第ｉ番目の部分商 Q_i ^*：補正後の第ｉ番目の部分商 R_i：第ｉ番目の部分剰余、たゞしR₀＝N₀とする。

N_i：R_i-1とＭの積より、Q_iを減じた数Ａ：Q_i、N_iより第ｉ番目の部分剰余R_iのＭ倍であ
るQ_i+1＋N_i+1を求めるとき、Q_iに掛けられる被
乗数Ｑ：最終商商を求める手順は次の通りである。反復計算に
入る前に、(1)式、(2)式で示される計算を行う。

Ａ＝１−D₀×Ｍ (1) Q₁＋N₁＝N₀×Ｍ (2) 反復計算では(3)式に示すようにして部分商を求
めるとゝもに直前の部分商の補正を行う。

Q_i＋N_i＝Ａ×Q_i-1＋N_i-1（ｉ２） (3) 部分商の補正は次のようにして行う。

Q_i-1＋N_i-1０、Q_i＋N_i０のとき、 Q_i-1 ^*＝Q_i-1 (4) Q_i-1＋N_i-1０、Q_i＋N_i＜０のとき、 Q_i-1 ^*＝Q_i-1−１ (5) Q_i-1＋N_i-1＜０、Q_i＋N_i０のとき、 Q_i-1 ^*＝Q_i-1＋１ (6) Q_i-1＋N_i-1＜０、Q_i＋N_i＜０のとき、 Q_i-1 ^*＝Q_i-1 (7) たゞし、(5)式での−１、(6)式での＋１は、各反
復計算におけるQ_i-1の最下位の桁と同じ位とす
る。

さて、第１図のような乗算器を１個しか持たな
いベクトル除算装置において、パイプラインを導
入して商を求める場合、要素間のデータの追突、
追越しに対して考慮を払う必要がある。この場合
の本発明による動作を第４図のタイムチヤートを
参照しながら説明する。

第１図において、ベクトル除算は以下の順序で
行われるが、その全体の制御を司どるのが制御回
路１である。制御回路１は除算器を制御するとゝ
もに、除算器がデータ待ちで遊びが生じないよう
に除算に先立つて記憶装置（図示せず）に対して
オペランドをオペランドバツフア２、オペランド
バツフア３に送ることを要求するとゝもに、送ら
れてきたオペランドをオペランドバツフア２，３
に格納後、除算の実行に先立ち、要素番号に対応
したオペランドをオペランドバツフア２、オペラ
ンドバツフア３にそれぞれ格納されたデータから
選択して被除数レジスタ４、除数レジスタ５に供
給する制御も行つている。さらに制御回路１は要
素毎に、除算の終了後、記憶装置に対して除算結
果を格納するよう要求する。

除数レジスタ５にセツトされた番目の除数Ｄ
を正規化回路６により正規化し、その除数の上位
ビツトにより、テーブル情報格納ユニツト９から
近似逆数と差分を読出すとゝもに、被乗数選択回
路およびレジスタ７に正規化された番目の除数
D₀をセツトする。

内挿近似回路１０により近似逆数の精度を向上
させた後、先ず−Ｍを出力し、乗数選択回路８に
より−Ｍを選択して、(1)式のD₀×（−Ｍ）を乗算
器１１にて行う。このとき、ハーフキヤリ、ハー
フサムが各レジスタ１２，１３にセツトされると
同時に、番目の要素が被除数レジスタ４、除数
レジスタ５にセツトされる。以下、特に言及しな
いが、番目に対する演算が番目に対する演算
の６クロツク後に実行される（第４図参照）。

D₀×（−Ｍ）のハーフキヤリとハーフサムは、
加算器１４により１つにまとめられ、積が乗算結
果レジスタ１５にセツトされる。

次に、被除数レジスタ４にセツトされた番目
の被乗数Ｎを正規化回路６で正規化した後、該被
除数N₀を被乗数選択回路およびレジスタ７にセ
ツトするとゝもに、内挿近似回路１０からＭを出
力して、乗数選択回路８によりＭを選択し、(2)式
のN₀×Ｍを実行する。番目のN₀が被乗数レジ
スタ７にセツトされるのと、番目のＮが被除数
レジスタ４にセツトされるのは同一時刻であり、
番目の被除数は要素間の追突、追越しによるデ
ータ破壊から免れている。N₀×Ｍの積がハーフ
キヤリレジスタ１２、ハーフサムレジスタ１３に
セツトされた時、同時に乗算結果レジスタ１５に
D₀×（−Ｍ）をセツトした後、被乗数選択回路お
よびレジスタ７にセツトする。(1)式ではD₀×（−
Ｍ）に１を加えることになつているが、１を加え
た後2^-13以上の位は負の符号ビツトとなるので、
該除算装置としてはD₀×（−Ｍ）の2^-12以下をＡ
として被乗数とするのである。Ａを被乗数レジス
タ７にセツトするとゝもに、N₀×Ｍの積を乗算
結果レジスタ１５にセツトする。

以下、(3)式で示す反復計算を２回行い、同時に
(4)式から(7)式の部分商の補正を部分商補正回路１
６で行い、補正された部分商は12ビツトずつ２回
に分けて部分商マージレジスタ１７に含まれる部
分商マージレジスタ１、部分商マージレジスタ２
にそれぞれセツトされる。商が24ビツト揃つた
後、除算結果レジスタ１８に最終商としてセツト
される。

以上の説明において、番目をｉ番目に、番
目をｉ＋１番目に置き換え、ｉ＝１、２、３、…
…とすると、一般的なベクトル除算の動作を理解
することができる。

反復計算では乗算結果の上位の部分商Q_i-1が乗
数選択回路８に選択されるとゝもに、乗算結果の
下位のN_i-1が倍数の一種として乗算器１１に入力
され、Ａ×Q_i-1に足し込まれる。反復計算以外の
(1)式、(2)式の計算では、N_i-1の乗算器１１への入
力は制御回路１により抑止される。

第５図は時刻１２，１３で一時停止したときの
動作を示すタイムチヤートであり、各レジスタの
更新が２クロツク遅れた後、正常動作に復帰する
よう制御回路１により制御されている様子が示さ
れている。

第４図及び第５図に対し、パイプラインを意図
しない場合の動作を第６図に示す。第６図では、
番目の要素に対する商が求められて後、番目
の要素除算器の入力レジスタである被除数レジス
タ４、除数レジスタ５にセツトされており、特に
要素間でのデータの追突、追越しに対する考慮を
払う必要は全然ない。

第４図乃至第６図から明らかな如く、本発明を
実施しないときの除算の起動ピツチは15クロツク
であるの対して、本発明を実施したときの除算の
起動ピツチは６クロツクになり、2.5倍の性能の
向上がある。

なお、実施例では内挿近似を使用した除算装置
について取上げたが、本発明は一般的に、一定の
時間間隔毎に、一定の長さの部分商を算出し、部
分商をマージすることにより所望の長さの商を求
める除算装置に対して適用可能である。

〔発明の効果〕本発明によれば、ベクトルプロセツサの乗算
器、加算器等の物量を増加させることなく、ベク
トル除算をパイプラインで処理することが可能に
なる。

【図面の簡単な説明】

第１図は本発明によるベクトル除算装置の一実
施例のブロツク図、第２図及び第３図は本発明の
原理を説明するためのタイミングチヤート、第４
図及び第５図は本発明による第１図の動作を説明
するためのタイミングチヤート、第６図は本発明
によらない場合のタイミングチヤートである。１……制御回路、２，３……オペランドバツフ
ア、４……被除数レジスタ、５……除数レジス
タ、６……正規化回路、７……被乗数選択回路お
よびレジスタ、８……乗数選択回路、９……テー
ブル情報格納ユニツト、１０……内挿近似回路、
１１……乗算器、１２……ハーフキヤリレジス
タ、１３……ハーフサムレジスタ、１４……加算
器、１５……乗算結果レジスタ、１６……部分商
補正回路、１７……部分商マージレジスタ、１８
……除算結果レジスタ。

Claims

【特許請求の範囲】１ベクトルの対応する要素を順次入力し、同一
の回路を繰返し使用して、一定の時間間隔毎に、
一定の長さの部分商を算出し、該算出した部分商
とマージして所望の長さの商を、前記ベクトルの
対応する要素について順次求めるベクトル除算装
置において、前記繰返し使用して部分商を算出する回路を主
要処理部、該主要処理部の前段に位置する回路を
前処理部及び後段に位置する回路を後処理部と
し、前記前処理部と前記後処理部を、前記主要処理
部で所望の長さの商にマージするために必要とす
る部分商を求める回数に依存する時間間隔毎に動
作するように、前記主要処理部とオーバーラツプ
させて動作せしめることを特徴とするベクトル除
算装置の制御方式。