JPH0535773A

JPH0535773A - ベクトル除算方式とその装置

Info

Publication number: JPH0535773A
Application number: JP3189074A
Authority: JP
Inventors: Fuyuki Okamoto; 冬樹岡本
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 1991-07-30
Filing date: 1991-07-30
Publication date: 1993-02-12
Also published as: US5309385A

Abstract

(57)【要約】【目的】１クロック毎に商が出力でき、かつ、全ベクト
ル要素の演算が終了するまでの時間も短くできるベクト
ル除算方式とその装置を提供する。【構成】被除数格納領域１２と、中間結果格納領域１１
とを有するベクトルレジスタ１を備える。除数格納領域
２１と中間結果格納領域２２を有するベクトルレジスタ
２を備える。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明はベクトル除算方式とその
装置に関し、特に収束型除算法を用いたベクトル除算方
式とその装置に関する。

【０００２】

【従来の技術】周知のように、収束型除算法では、Ｎ÷
Ｄ（０＜Ｎ＜Ｄ）の計算において、まず次式のように、
除数Ｄに乗算すると答が１に収束する数列Ｐ₀ ，Ｐ₁ ，
…，Ｐ_n-1 を探す。

【０００３】

【０００４】このとき、Ｎ×Ｐ₀ ×Ｐ₁×…×Ｐ_n-1 は
次式に示すように商Ｑに近ずく。

【０００５】

【０００６】今、除数Ｄが次式の範囲の数とすると、

【０００７】

【０００８】次のように表される。

【０００９】

【００１０】そこで、Ｐ₀ ＝１＋ηとすれば、次式によ
り次の除数Ｄ₁ が求められる。

【００１１】

【００１２】次に、Ｐ₁ ＝１＋η² とすると、次式によ
り次の除数Ｄ₂ が求められる。

【００１３】

【００１４】以上のように、除数Ｄ_i は一般に次式のよ
うに求められ、１に近ずく。

【００１５】

【００１６】ところで、Ｐ_i とＤ_i とは次式の関係があ
るから、各Ｐ_i はＤ_i の２の補数をとれば求められる。

【００１７】

【００１８】すると、上述のように、Ｎ×Ｐ₀ ×Ｐ₁×
…×Ｐ_n-1 は商Ｑに収束する。したがって、以下の計算
を行なうことで商が求められる。

【００１９】

【００２０】以上に説明した、従来のベクトル除算方式
は図３に示した従来のベクトル除算装置により実現でき
る。

【００２１】従来のベクトル除算装置は、図３に示すよ
うに、２つのベクトルレジスタ１４，１５と除算装置１
３とを備えて構成されていた。

【００２２】除算装置１３は、図４に示すように、４つ
のセレクタ４，５，７，８と、補数生成器３と、乗算器
６と、２つのレジスタ９，１０とを備えて構成されてい
た。

【００２３】次に、従来のベクトル除算装置の動作につ
いて説明する。

【００２４】まず、除算装置１３によるスカラデータに
対する除算について説明する。（Ａ）まず、Ｎ₁ の計算について説明する。

【００２５】被除数Ｎがデータ線Ｌ１から、除数Ｄがデ
ータ線Ｌ２からそれぞれ入力される。除数Ｄはセレクタ
５を介して補数生成器３に入力され、Ｄの補数Ｐ₀ ＝２
−Ｄが出力される。セレクタ４とセレクタ７は、被除数
Ｎを選択的に乗算器６へ出力する。乗算器６は、Ｎ₁ ＝
Ｎ×Ｐ₀ を計算し、結果をレジスタ９に格納する。（Ｂ）次に、Ｄ₁ の計算について説明する。

【００２６】除数Ｄがデータ線Ｌ２から入力され、セレ
クタ５を介して補数生成器３に入力されてＤの補数Ｐ₀
＝２−Ｄが出力される。セレクタ７は、セレクタ５の出
力である除数Ｄを選択的に乗算器６へ出力する。乗算器
６は、Ｄ₁ ＝Ｄ×Ｐ₀ を計算し、結果をレジスタ１０に
格納する。（Ｃ）次に、Ｎ₂ の計算について説明する。

【００２７】次に、Ｎ₁ がレジスタ９から読出される。
このＮ₁ はセレクタ４，７を経由して乗算器６に入力さ
れる。また、Ｄ₁ がレジスタ１０から読出される。この
Ｄ₁はセレクタ５を経由して補数生成器３に入力され
る。補数生成器３はＤ₁ の補数Ｐ₁ ＝２−Ｄ₁ を出力す
る。Ｐ₁ はセレクタ８を経由して乗算器６に入力され
る。乗算器６は、Ｎ₂ ＝Ｎ₁ ×Ｐ₁を計算し、結果をレ
ジスタ９に格納する。（Ｄ）次に、Ｄ₂ の計算について説明する。

【００２８】次に、Ｄ₁ がレジスタ１０から読出され
る。このＤ₁ はセレクタ５，７を経由して乗算器６に入
力される。また、Ｄ₁はセレクタ５を経由して補数生成
器３に入力される。補数生成器３はＤ₁ の補数Ｐ₁ ＝２
−Ｄ₁ を出力する。Ｐ₁ はセレクタ８を経由して乗算器
６に入力される。乗算器６は、Ｄ₂ ＝Ｄ₁ ×Ｐ₁ を計算
し、結果をレジスタ１０に格納する。

【００２９】以下、Ｎ_i とＤ_i の計算が上記の手順
（Ｃ），（Ｄ）と同様にして行なわれる。手順（Ｃ），
（Ｄ）を反復していくうちに、Ｎ_i は商Ｑに収束してい
く。商Ｑは最後にデータ線Ｌ３から出力される。

【００３０】次に、図３に示す従来のベクトル除算装置
により、ベクトルデータを処理する場合について説明す
る。ベクトルデータを処理する場合は、従来の除算方式
及び除算装置１３を以下のように用いていた。

【００３１】第一要素に対して、式（１）ａ〜（２
_n-1 ）ａを実行する。以下同様にして全部のベクトル要
素に対して繰返す。

【００３２】図３において、ベクトルレジスタ１４に
は、被除数のベクトルデータが格納されており、ベクト
ルレジスタ１５には、除数のベクトルデータが格納され
ている。除算装置１３のデータ線Ｌ１〜Ｌ３は、図４の
データ線Ｌ１〜Ｌ３にそれぞれ対応している。

【００３３】まず、第一要素について、被除数と除数と
がそれぞれベクトルレジスタ１４，１５から読出され、
これに対して上述のＮ_i ，Ｄ_iの繰返し計算を施して商
を出力する。次に、第二要素の被除数と除数とがそれぞ
れベクトルレジスタ１４，１５から読出され、商の計算
が行なわれる。以下同様にして、順番に最終要素までの
商計算が行なわれるというものであった。

【００３４】図５は従来のベクトル除算装置の動作の一
例を示すタイムチャートである。

【００３５】図５の例は、ベクトル要素の数を４個と
し、各Ｎ_i ，Ｄ_i の計算は２クロック周期で実行され、
商を求めるためには５回の乗算を必要とする場合のもの
である。

【００３６】通常のベクトル処理装置は、オペランドが
クロック周期毎にベクトルレジスタから読出され、加算
や乗算等の演算はパイプライン処理されるので、結果デ
ータもクロック周期毎に出力される。

【００３７】ところが、上述したように、除算処理にお
いては商を求めるために乗算を何回も繰返さなければな
らないので、計算結果をクロック周期毎に出力すること
はできない。同様に、オペランドの被除数と除数の読出
しも、クロック周期毎に行なうことはできない。

【００３８】一般に、ベクトル長をｖ、１個のベクトル
要素の商を求るまでに必要な乗算回数をｍ、また、各Ｎ
_i ，Ｄ_i の計算に必要なクロック数、すなわち、図４の
除算装置１３を構成するパイプラインの段数をｐとす
る。従来のベクトル除算装置では、商はｍｐクロック周
期で出力され、また、ｖ個のベクトル要素について演算
が終了するまでに要するクロック数は約ｖｍｐである。
一方、加算器や乗算器での和あるいは積は１クロック周
期で出力され、所要演算クロック数は約ｖであるという
ものであった。

【００３９】

【発明が解決しようとする課題】上述した従来のベクト
ル除算方式とその装置は、１個の商に対し複数回の乗算
を行なう必要があるため、クロック周期毎の計算結果の
出力及び、オペランドの被除数と除数の読出しが不可能
であるので、パイプライン処理による高速化が実現でき
ないという欠点があった。

【００４０】本発明の目的は、１クロック毎に商が出力
でき、かつ、全ベクトル要素の演算が終了するまでの時
間も短くできるベクトル除算方式とその装置を提供する
ことにある。

【００４１】

【課題を解決するための手段】本発明のベクトル除算方
式は、漸化式により与えられベクトルデータである複数
の収束因子をベクトルデータである除数とベクトルデー
タである被除数の両方に順次繰返し乗算を行ない、前記
除数側の前記繰返し乗算の結果を１に収束させ、前記被
除数側の前記繰返し乗算の結果を商に収束させて答を得
る収束型徐算法を用いたベクトル除算方式において、第
一の前記被除数と第一の前記収束因子との乗算をパイプ
ライン処理により１要素当り１クロック周期の速度で実
行して収束前の中間結果である第一の中間結果ベクトル
データを出力し、第一の前記除数と第一の前記収束因子
との乗算をパイプライン処理により１要素当り１クロッ
ク周期の速度で実行して収束前の中間結果である第二の
中間結果ベクトルデータを出力し、前記第一及び第二の
中間結果ベクトルデータをそれぞれ第一及び第二の中間
結果用ベクトルレジスタに格納し、前記第一及び第二の
中間結果用ベクトルレジスタから前記中間結果ベクトル
データを１クロック周期毎に読出し前記パイプライン処
理により次の前記収束因子である第二の前記収束因子と
の乗算を実行するという処理を繰返すことで最終の収束
結果である商ベクトルを１要素当り１クロック周期の速
度で出力することを特徴とするものである。

【００４２】また、第２の発明のベクトル除算装置は、
請求項１記載のベクトル除算方式を実行するベクトル除
算装置において、前記被除数を格納する領域と前記第一
の中間結果ベクトルデータを格納する領域とを備える第
一のベクトルレジスタと、前記除数を格納する領域と前
記第二の中間結果ベクトルデータを格納する領域とを備
える第二のベクトルレジスタと、前記第一および第二の
ベクトルレジスタのそれぞれの出力を入力していずれか
一方を選択的に出力する第一のセレクタと、前記第二の
ベクトルレジスタの出力を入力する補数生成器と、前記
第二のベクトルレジスタの出力と前記補数生成器の出力
とを入力していずれか一方を選択的に出力する第二のセ
レクタと、前記第一および第二のセレクタのそれぞれの
出力を入力して両者の積を前記第一および第二のベクト
ルレジスタにそれぞれ格納する乗算器とを備えて構成さ
れている。

【００４３】

【実施例】次に、本発明の実施例について図面を参照し
て説明する。

【００４４】図１は本発明のベクトル除算方式とその装
置の一実施例を示すブロック図である。

【００４５】本実施例のベクトル除算方式とその装置
は、図１に示すように、２つのベクトルレジスタ１，２
と、補数生成器３と、２つのセレクタ４，５と、乗算器
６とを備えて構成されている。

【００４６】ベクトルレジスタ１は、中間結果格納領域
１１と、被除数格納領域１２とを有し、ベクトルレジス
タ２は、中間結果格納領域２１と、除数格納領域２２と
を有している。

【００４７】次に、本実施例の動作について説明する。

【００４８】本実施例の除算方式は、次に示す２_n-1 個
の式を処理することでベクトル除算を実行するものであ
る。なお次の各式はパイプライン処理されることで１ク
ロック周期毎に１要素ずつ連続して結果が出力される。

【００４９】

【００５０】図１に示すベクトル除算装置により、以下
のようにベクトル除算が実行される。

【００５１】なお、説明文中では、ベクトルデータを次
のようにＶを後置することにより表す。

【００５２】

【００５３】（Ａ）まず、被除数Ｎ₁ のベクトルデータ
Ｎ₁ Ｖの計算について説明する。

【００５４】ベクトルレジスタ１の被除数格納領域１２
に格納された被除数ベクトルデータＮＶと、ベクトルレ
ジスタ２の除数格納領域２２に格納された除数ベクトル
データＤＶとが読出される。除数ベクトルＤＶは補数生
成器３に入力されて、ＤＶの補数ベクトルＰ₀ Ｖ＝２−
ＤＶが出力される。セレクタ４は被除数ベクトルＮを選
択的に乗算器６へ出力する。また、セレクタ５は、補数
生成器３の出力Ｐ₀ Ｖを選択的に乗算器６へ出力する。
乗算器６は、Ｎ₁ Ｖ＝ＮＶ×Ｐ₀ Ｖを計算し、結果をベ
クトルレジスタ１の中間結果格納領域１１に格納する。
以上の処理はパイペライン化することで１要素毎に連続
して、すなわち、１クロック周期毎に行なわれる。（Ｂ）次に、除数ベクトルデータＤ₁ Ｖの計算について
説明する。

【００５５】除数ベクトルＤＶが再び読出され、補数生
成器３に入力されてＤＶの補数Ｐ₀Ｖ＝２−ＤＶが出力
される。セレクタ４は、除数ベクトルＤＶを選択的に乗
算器６へ出力する。また、セレクタ５は、補数生成器３
の出力Ｐ₀ Ｖを選択的に乗算器６へ出力する。乗算器６
は、Ｄ₁ Ｖ＝ＤＶ×Ｐ₀ Ｖを計算し、結果をベクトルレ
ジスタ２の中間結果格納領域２１に格納する。以上の処
理はパイペライン化することで１要素毎に連続して、す
なわち、１クロック周期毎に行なわれる。（Ｃ）次に、Ｎ₂ Ｖの計算について説明する。

【００５６】次に、Ｎ₁ Ｖがベクトルレジスタ１の中間
結果格納領域１１から読出される。このＮ₁ Ｖはセレク
タ４を経由して乗算器６に入力される。また、Ｄ₁ Ｖが
ベクトルレジスタ２の中間結果格納領域２１から読出さ
れる。このＤ₁ Ｖは補数生成器３に入力される。補数生
成器３はＤ₁ Ｖの補数Ｐ₁ Ｖ＝２−Ｄ₁ Ｖを出力する。
Ｐ₁ Ｖはセレクタ５を経由して乗算器６に入力される。
乗算器６は、Ｎ₂ Ｖ＝Ｎ₁ Ｖ×Ｐ₁ Ｖを計算し、結果を
ベクトルレジスタ１の中間結果格納領域１１に格納す
る。以上の処理はパイペライン化することで１要素毎に
連続して、すなわち、１クロック周期毎に行なわれる。（Ｄ）次に、Ｄ₂ Ｖの計算について説明する。

【００５７】次に、Ｄ₁ がベクトルレジスタ２の中間結
果格納領域２１から読出される。このＤ₁ Ｖはセレクタ
４を経由して乗算器６に入力される。また、Ｄ₁ Ｖは補
数生成器３に入力される。補数生成器３はＤ₁ Ｖの補数
Ｐ₁ Ｖ＝２−Ｄ₁ Ｖを出力する。Ｐ₁ Ｖはセレクタ５を
経由して乗算器６に入力される。乗算器６は、Ｄ₂ Ｖ＝
Ｄ₁ Ｖ×Ｐ₁ Ｖを計算し、結果をベクトルレジスタ２の
中間結果格納領域２１に格納する。

【００５８】以下、Ｎ_i ＶとＤ_i Ｖの計算が上記の手順
（Ｃ），（Ｄ）と同様にして行なわれる。手順（Ｃ），
（Ｄ）を反復していくうちに、Ｎ_i Ｖは商Ｑに収束して
いく。商Ｑは最後にデータ線Ｌ４から出力される。商ベ
クトルの各要素は１つずつ１クロック周期毎に出力され
る。

【００５９】図２は、図１で示す本実施例のベクトル除
算装置によってベクトル除算を実行した場合のタイムチ
ャ―トである。ここで、Ｎ_i ＶとＤ_i Ｖの各要素の計算
は２クロック周期で実行されるとしている。ただし、パ
イプライン処理によってＮ_i ＶとＤ_i Ｖの各要素の出力
は１クロック周期毎に行なわれる。また、従来例と同様
に、全ベクトル要素の個数を４個とし、さらに、商を求
めるための乗算回数は５回とする。図５に示す同条件の
従来例によるタイムチャートと比較すると、商を出力す
るためのスループット及び全要素について処理が終了す
るまでの時間の両者共に本発明による方が優れているこ
とが分る。

【００６０】

【発明の効果】以上説明したように、本発明のベクトル
除算方式とその装置は、被除数を格納する領域と中間結
果とを格納する領域とを備えるベクトルレジスタと、除
数を格納する領域と中間結果を格納する領域を備えるベ
クトルレジスタとを備えているので、繰返し処理中の１
回の乗算処理毎にパイプライン処理した中間結果を一時
的に格納することにより、１クロック周期毎に商を出力
でき、また、全ベクトル要素の演算が終了するまでの時
間も短くできるという効果がある。

【図面の簡単な説明】

【図１】本発明のベクトル除算方式とその装置の一実施
例を示すブロック図である。

【図２】本実施例のベクトル除算方式とその装置におけ
る動作の一例を示すタイムチャートである。

【図３】従来のベクトル除算方式とその装置の一例を示
すブロック図である。

【図４】図３に示す除算装置の一例を示すブロック図で
ある。

【図５】従来のベクトル除算方式とその装置における動
作の一例を示すタイムチャートである。

【符号の説明】

１，２，１４，１５ベクトルレジスタ３補数生成器４，５，７，８セレクタ６乗算器９，１０レジスタ１１，２１中間結果格納領域１２被除数格納領域１３除算装置２２除数格納領域

Claims

【特許請求の範囲】

【請求項１】漸化式により与えられベクトルデータで
ある複数の収束因子をベクトルデータである除数とベク
トルデータである被除数の両方に順次繰返し乗算を行な
い、前記除数側の前記繰返し乗算の結果を１に収束さ
せ、前記被除数側の前記繰返し乗算の結果を商に収束さ
せて答を得る収束型徐算法を用いたベクトル除算方式に
おいて、第一の前記被除数と第一の前記収束因子との乗算をパイ
プライン処理により１要素当り１クロック周期の速度で
実行して収束前の中間結果である第一の中間結果ベクト
ルデータを出力し、第一の前記除数と第一の前記収束因子との乗算をパイプ
ライン処理により１要素当り１クロック周期の速度で実
行して収束前の中間結果である第二の中間結果ベクトル
データを出力し、前記第一及び第二の中間結果ベクトルデータをそれぞれ
第一及び第二の中間結果用ベクトルレジスタに格納し、前記第一及び第二の中間結果用ベクトルレジスタから前
記中間結果ベクトルデータを１クロック周期毎に読出し
前記パイプライン処理により次の前記収束因子である第
二の前記収束因子との乗算を実行するという処理を繰返
すことで最終の収束結果である商ベクトルを１要素当り
１クロック周期の速度で出力することを特徴とするベク
トル除算方式。
【請求項２】請求項１記載のベクトル除算方式を実行
するベクトル除算装置において、前記被除数を格納する領域と前記第一の中間結果ベクト
ルデータを格納する領域とを備える第一のベクトルレジ
スタと、前記除数を格納する領域と前記第二の中間結果ベクトル
データを格納する領域とを備える第二のベクトルレジス
タと、前記第一および第二のベクトルレジスタのそれぞれの出
力を入力していずれか一方を選択的に出力する第一のセ
レクタと、前記第二のベクトルレジスタの出力を入力する補数生成
器と、前記第二のベクトルレジスタの出力と前記補数生成器の
出力とを入力していずれか一方を選択的に出力する第二
のセレクタと、前記第一および第二のセレクタのそれぞれの出力を入力
して両者の積を前記第一および第二のベクトルレジスタ
にそれぞれ格納する乗算器とを備えることを特徴とする
ベクトル除算装置。