JPH07121354A

JPH07121354A - 倍精度・単精度・内積演算および複素乗算が可能な乗算器

Info

Publication number: JPH07121354A
Application number: JP5263724A
Authority: JP
Inventors: Mikio Shiraishi; 幹雄白石
Original assignee: Toshiba Corp
Current assignee: Toshiba Corp
Priority date: 1993-10-21
Filing date: 1993-10-21
Publication date: 1995-05-12
Anticipated expiration: 2020-04-06
Also published as: EP0650115B1; DE69426801D1; EP0650115A1; JP3637073B2; DE69426801T2; US5521856A; KR100305530B1

Abstract

(57)【要約】【目的】一度に複数のデータ対の乗算が可能な乗算器を
提供する。【構成】アンドゲ−ト７は、制御信号Ｓ₁ に基づき、被
乗数の上位ワードＹ_7-4が入力されるブースデコーダ１
の最下位ビット入力に、被乗数の下位ワードＹ_3-0 の最
上位ビットと０とを切り替えて入力する。ブ−スのセレ
クタ２は、部分積の一部を０で置き換える。並列加算回
路３は、部分積の他の一部をそれよりも下位のビットの
部分積の１ビットで置き換える。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、乗算器に関するもの
で、特に並列型乗算器に使用されるものである。

【０００２】

【従来の技術】図５は、ブース（Ｂｏｏｔｈ）のアルゴ
リズムを利用した従来の並列型乗算器を示している。図
５において、１は、ブースのデコーダ、２は、ブースの
セレクタ、３は、部分積を加算するための並列加算回路
である。

【０００３】図６は、図５のブースのデコーダ１を構成
する回路の一例を示している。図６において、４は、ナ
ンド・ゲート、５は、ノア・ゲート、６は、オア・ゲー
ト、７は、アンド・ゲート、８は、インバータである。

【０００４】図７は、図５のブースのセレクタ２を構成
する回路の一例を示している。図７において、９は、エ
クスクルーシブ・ノア・ゲートである。なお、並列加算
回路３については、例えば特開昭６３−５５６２７に開
示されるものを使用することができる。

【０００５】ブースのアルゴリズムは、第１式及び第２
式のように、２の補数表現された乗数Ｘと被乗数Ｙを高
速に乗算するためのアルゴリズムである。このアルゴリ
ズムでは、第３式のように、被乗数Ｙの値を３ビット毎
にデコーダ１でデコードし、そのデコード結果に応じて
乗数Ｘの各ビットをセレクタ２で選択すると、部分積ｐ
_m が生成される。

【０００６】積Ｚは、第４式のように、部分積ｐ_m をｍ
＝０からｍ＝ｎ／２−１まで足し合わせることによって
得られる。このアルゴリズムによれば、部分積の数は、
部分積の生成にアンドゲートを用いるアレイ型乗算器の
半分にできるため、演算速度を高速にできる。通常、ｍ
＝０のときのｙ_2m-1の値は０とおく。（乗数）Ｘ＝−２^n-1 ｘ_n-1 ＋２^n-2 ｘ_n-2 ＋…＋２ｘ₁ ＋ｘ₀ ［１］（被乗数）Ｙ＝−２^n-1 ｙ_n-1 ＋２^n-2 ｙ_n-2 ＋…＋２ｙ₁ ＋ｙ₀ ［２］（部分積）ｐ_m ＝Ｘ（−２ｙ_2m+1＋ｙ_2m＋ｙ_2m-1）２^2m ［３］ここで、ｙ_-1＝０である。となる。

【０００７】近年、携帯用情報通信機器の普及により、
これらの機器に搭載されるＬＳＩには、電池寿命の長期
化を図るため、消費電力が少ないものが要求されてい
る。さらに、雑音や回線容量の不足に対処するため処理
のディジタル化が必須となり、当該機器には、ディジタ
ル信号処理用のＬＳＩ、即ちディジタル・シグナル・プ
ロセッサ（ＤＳＰ）が搭載されるようになった。

【０００８】また、近年の携帯用情報通信機器は、ディ
ジタル・シグナル・プロセッサの搭載により、複雑かつ
高度な処理が実現できるようになったが、処理が高度化
するにつれて、次のような問題も発生している。

【０００９】即ち、ディジタル・シグナル・プロセッサ
の動作原理は、一般のマイクロプロセッサと変わらない
ため、処理が複雑になればなるほど処理時間が長くな
る。実時間動作が必要な携帯用情報通信機器において
は、処理時間に上限があるので、動作クロックの周波数
を上げざるを得ない。ところが、クロック周波数を上げ
ると、単位時間内にＬＳＩ内部で充放電される電流が増
え、消費電力が増大する。このような事態は、携帯用情
報通信機器に搭載されるＬＳＩに対する要求と相反する
ものである。

【００１０】こうした問題を回避する手段として、処理
の並列化がある。処理の並列化は、複数の処理を並列に
実行するもので、クロック周波数を上げずに、単位時間
内の処理量を増やすことが可能である。

【００１１】しかし、ディジタル信号処理の基本演算
は、積和演算、即ち乗算した結果を累積加算する操作で
ある。従って、ディジタル・シグナル・プロセッサに
は、乗算器と加算器の両方が内蔵されている。

【００１２】このため、上述のような従来の乗算器で
は、一度に１対のデータ（Ｘ，Ｙ）しか乗算できないた
め、積和演算を並列化により、２倍の速度で実行しよう
とすると、２つの同じ乗算器２をディジタル・シグナル
・プロセッサに内蔵しなければならなくなる。

【００１３】また、乗算結果を累積加算するためには、
少なくとも２つの加算器を内蔵する必要がある。さら
に、最終的な累積加算結果を得ようとすると、別々に加
算された結果を足し合わせなければならないため、もう
１つ加算器を内蔵するか、別々に加算された結果を保存
するためのレジスタ（アキュムレータ）を２組用意しな
ければならない。

【００１４】こうした並列化されたアーキテクチャを使
いこなすには、最適化機能付きのコンパイラが不可欠で
ある。しかし、コンパイラのオブジェクト変換効率が十
分でないため、ディジタル・シグナル・プロセッサのプ
ログラミングは、普通アセンブラを用いて行われてい
る。このことから、並列化されたアーキテクチャは、プ
ログラムに最適化の負担をかけ、ソフトウエアの開発効
率を落としてしまう。

【００１５】さらに、ディジタル信号処理には、演算精
度の問題が常につきまとう。これは、固定小数点ＤＳＰ
を採用したときに特に問題となる。累積加算により、乗
算結果に含まれる誤差も累積され、システム全体の動作
が不安定になってしまうのである。

【００１６】なお、倍精度演算を取り入れると、精度の
問題は改善されるが、倍精度乗算器は単精度乗算器の４
倍の回路規模があり、ＬＳＩ上の面積占有率が大きくな
る。これに従来の乗算器を用いると、上で述べた理由か
ら、処理の並列化に際して乗算器が複数必要になるた
め、実用には、はなはだ不向きである。

【００１７】

【発明が解決しようとする課題】このように、従来は、
処理が複雑になるにつれてクロック周波数を上げなけれ
ばならず、消費電力が増大する欠点がある。また、処理
の並列化は、ディジタル・シグナル・プロセッサの回路
規模を大きくする欠点がある。また、並列化されたア−
キテクチャはプログラマに最適化の負担をかけるなどの
欠点がある。

【００１８】本発明は、上記欠点を解決すべくなされた
もので、その目的は、消費電力の増大や回路規模の増大
なく、一度に複数のデータ対の乗算が可能な乗算器を提
供することである。

【００１９】

【課題を解決するための手段】上記目的を達成するた
め、本発明の乗算器は、ブースのアルゴリズムを利用
し、被乗数の上位ワードが入力されるブースデコーダの
最下位ビット入力に被乗数の下位ワードの最上位ビット
と０とを切り替えて入力する被乗数分割手段と、部分積
の一部を０で置き換える０化手段と、部分積の他の一部
をそれよりも下位のビットの部分積の１ビットで置き換
えるビット拡張手段とから構成されている。

【００２０】本発明の乗算器は、ブースのアルゴリズム
を利用しており、被乗数の下位ワードが入力されるブー
スデコーダの最下位ビット入力に０と１とを切り替えて
入力すると共に、前記ブースデコーダに被乗数の下位ワ
ードとその反転信号とを切り替えて入力する被乗数補数
化手段と、被乗数の上位ワードが入力されるブースデコ
ーダの最下位ビット入力に被乗数の下位ワードの最上位
ビットと０とを切り替えて入力する被乗数分割手段と、
部分積の一部を０で置き換える０化手段と、部分積の他
の一部をそれよりも下位のビットの部分積の１ビットで
置き換えるビット拡張手段とから構成されている。

【００２１】本発明の乗算器は、ブースのアルゴリズム
を利用しており、被乗数の上位ワードが入力されるブー
スデコーダの最下位ビット入力に被乗数の下位ワードの
最上位ビットと１とを切り替えて入力する被乗数分割手
段と、被乗数の上位ワードとその反転信号とを切り替え
て入力する被乗数反転手段と、部分積の一部を０で置き
換える０化手段と、部分積の他の一部をそれよりも下位
のビットの部分積の１ビットで置き換えるビット拡張手
段とから構成されている。

【００２２】

【作用】上記構成によれば、乗算器内部で生成される部
分積の一部を０にし、また、部分積の他の一部をそれよ
りも下位の部分積の１ビットで置き換えることによっ
て、１つの乗算器の中で、複数のデータ対の乗算が可能
になる。

【００２３】また、一度に複数のデータ対の乗算が可能
なため、１つの乗算器でありながら、通常の乗算はもち
ろんのこと、倍精度乗算、ベクトルの内積、複素乗算が
可能である。

【００２４】本乗算器をプロセッサに応用すると、上記
すべての演算が単一マシンサイクルで実行できるため、
プログラムのステップ数が削減され、特に積和演算が主
体の信号処理プログラムにおいて、従来の約１／２にま
でステップ数を短縮できる。

【００２５】また、演算スループットを同一とすると、
マシンサイクルは従来よりも長くとれるため、プロセッ
サ全体の消費電力が削減される。特に、信号処理を専門
に行うディジタル・シグナル・プロセッサにおいては、
従来の約１／２にまで消費電力を削減できる。

【００２６】

【実施例】以下、図面を参照しながら、本発明の乗算器
について詳細に説明する。まず、第１の実施例について
説明する。図１は、本発明の第１の実施例に係わる乗算
器を示している。図１において、１は、ブースのデコー
ダ、２は、ブースのセレクタ、３は、部分積加算のため
の並列加算回路、７は、アンドゲート、１０は、セレク
タである。

【００２７】図２は、本発明の乗算器に使用するセレク
タ１０の一例を示す回路図である。図２において、５
は、ノア・ゲート、７は、アンド・ゲート、８は、イン
バータである。

【００２８】図１の乗算器の動作を説明する。まず、乗
数Ｘと被乗数Ｙとを上位ワードと下位ワードとに分割
し、（乗数）Ｘ＝Ｘ_H ＋Ｘ_L ［５］（被乗数）Ｙ＝Ｙ_H ＋Ｙ_L ［６］とする。

【００２９】このとき、積Ｚは次式で表される。（積）Ｚ＝（Ｘ_H ＋Ｘ_L ）（Ｙ_H ＋Ｙ_L ）＝Ｘ_H Ｙ_H ＋Ｘ_H Ｙ_L ＋Ｘ_L Ｙ_H ＋Ｘ_L Ｙ_L ［７］なお、図１のＸ_7-4 、Ｘ_3-0 がそれぞれＸ_H 、Ｘ_L の入
力端子であり、図１のＹ_7-4 、Ｘ_3-0 がそれぞれＹ_H 、
Ｙ_L の入力端子である。また、Ｓ₁ は、制御信号であ
る。

【００３０】この実施例では、入力信号をワードごとに
加工し、制御信号Ｓ₁ を切り換えることにより、単精
度、倍精度、それに内積の３種類の乗算が可能である。
以下、単精度、倍精度及び内積の乗算について順次説明
する。

【００３１】［単精度］第７式において、乗数、被乗数
の下位ワードＸ_L 、Ｙ_L をＸ_L ＝０、Ｙ_L ＝０とおく
と、第７式の第２〜４項はすべて０になるので、積Ｚ
は、（単精度）Ｚ＝Ｘ_H Ｙ_H ［８］になる。

【００３２】Ｘ_L ＝０、Ｌ_L ＝０にするには、図１で制
御信号Ｓ₁ ＝１とし、入力端子Ｘ_3-0 、Ｙ_3-0 に０を入
力する。制御信号Ｓ₁ ＝１のときには、この実施例の乗
算器は、図５の従来例と同じ動作を行う。セレクタ１０
は、右側の入力Ｘ₇ ，Ｘ₆ ，Ｘ₅ ，Ｘ₄ を選択し、アン
ド・ゲート７は、一方の入力端子に入力されている制御
信号Ｓ₁ が１になるので、他方の入力をそのまま出力す
る。

【００３３】この状態で、Ｘ_H 、Ｙ_H 、即ちＸ_7-4 、Ｙ
_7-4 に４ビットの単精度データを入力すれば、単精度乗
算の結果が得られる。入力データが固定小数点データの
ときは、出力の小数点位置は、Ｚ₁₄とＺ₁₃の間になり、
入力データが整数データのときは、出力の小数点位置
は、Ｚ₈ とＺ₇ の間になる。

【００３４】［倍精度］第７式をそのまま計算する。図
１で制御信号Ｓ₁ ＝１とすれば、本実施例の乗算器は、
図５の従来の乗算器と同じ動作をするので、Ｘ，Ｙに８
ビットの倍精度データを入力すれば、出力に倍精度乗算
の結果が得られる。

【００３５】入力データが固定小数点データのときは、
出力の小数点位置は、Ｚ₁₄とＺ₁₃の間になり、入力デー
タが整数データのときは、出力の小数点位置は、Ｚ₀ の
すぐ下になる。

【００３６】［内積］２つのベクトル → Ａ＝（ａ₀ ，ａ₁ ） → Ｂ＝（ｂ₀ ，ｂ₁ ）の内積は次のようにして計算できる。

【００３７】まず、第７式において、Ｘ_H ＝ａ₁ ，Ｘ_L ＝ａ₀ ，Ｙ_H ＝ｂ₀ ，Ｙ_L ＝ｂ₁ ．［９］とおいて乗算を実行する。

【００３８】その結果、次式が得られる。Ｚ＝ａ₁ ｂ₀ ＋ａ₁ ｂ₁ ＋ａ₀ ｂ₀ ＋ａ₀ ｂ₁ ［１０］第１０式において、第１項と第４項とを乗算器内部で０
にすると、第１１式が（内積）Ｚ＝ａ₁ ｂ₁ ＋ａ₀ ｂ₀ ［１１］第９式を実行するには、乗数の上位ワードＸ_7-4 にａ₁
を、下位ワードＸ_3-0にａ₀ をそれぞれ４ビット・デー
タとして入力し、被乗数の上位ワードＹ_7-4 にｂ₀ を、
下位ワードＹ_3-0 にｂ₁ をそれぞれ４ビット・データと
して入力する。

【００３９】第１０式で、第１項と第４項とを乗算器内
部で０にする操作は、制御信号Ｓ₁＝０にすることに対
応する。このとき、アンド・ゲート７は０を出力し、セ
レクタ１０は乗数の下位ワードＸ_L の符号ビットＸ₃ を
出力するので、Ｘ_L Ｙ_L ＝ａ₀ ｂ₁ に対応する部分積Ｐ
₀₃〜Ｐ₀₀、Ｐ₁₃〜Ｐ₁₀を生成するブースのセレクタ２の
左右の入力Ｌ、Ｒにはどちらにも０が入力され、Ｘ_H Ｙ
_H ＝ａ₁ ｂ₀ に対応する部分積Ｐ₂₈〜Ｐ₂₄、Ｐ₃₈〜Ｐ₃₄
を生成するブースのセレクタ２の左右の入力Ｌ、Ｒには
どちらにも符号ビットＸ₃ が入力される。

【００４０】また、被乗数Ｙの上位ワードＹ_H ＝ｂ₀ が
入力されるブースのデコーダ１の最下位ビット入力Ｙ
_m-1 には、Ｙ₃ の代わりに０が入力されるので、被乗数
Ｙの上位ワードＹ_H ＝ｂ₀ と下位ワードＹ_L ＝ｂ₁ とは
独立した４ビットの数値としてデコードされる。その結
果、第７式の第１項と第４項、即ち第１０式の第１項と
第４項が０となって、第１１式の値が出力される。

【００４１】入力データが固定小数点データのときは、
出力の小数点位置は、Ｚ₁₀とＺ₉ の間になり、入力デー
タが整数データのときは、出力の小数点位置は、Ｚ₄ と
Ｚ₃の間になる。このことは、内積演算では、オーバー
フロー（桁溢れ）が生じないことを意味する。オーバー
フローは、乗算で１ビット、加算で１ビット発生する可
能性がある。内積演算では２組の乗算が行われるから、
オーバーフローの桁数は、合計３ビットである。符号ビ
ットの上には上下各ワードのビット数分符号拡張がされ
ているので、各ワードのビット数が２ビットよりも大き
ければオーバーフローは生じない。次に、第２の実施例
について説明する。図３は、本発明の第２の実施例に係
わる乗算器を示している。図３において、１１は、エク
スクルーシブ・オア・ゲート、Ｓ₂ は、制御信号であ
る。なお、図１と同じ構成要素には同じ番号を付して、
その説明を省略する。

【００４２】本実施例の乗算器は、制御信号Ｓ₂ が０の
ときには、図１の乗算器とまったく同じ動作をするが、
制御信号Ｓ₂ が１になると、被乗数Ｙの下位ワードＹ_L
の符号が反転する。このことを利用して、複素乗算が実
行できる。

【００４３】いま、２つの複素数Ｆ＝ａ＋ｊｂＧ＝ｃ＋ｊｄの積を計算することを考える。

【００４４】［実数部］積の実数部は、次のようにして
計算できる。まず、第７式において、Ｘ_H ＝ｂ，Ｘ_L ＝ａ，Ｙ_H ＝ｃ，Ｙ_L ＝−ｄ．［１２］とおいて乗算を実行する。

【００４５】その結果、次式が得られる。Ｚ＝ｂｃ＋ｂ（−ｄ）＋ａｃ＋ａ（−ｄ）［１３］第１３式で、第１項と第４項とを乗算器内部で０にする
と次式が得られ、複素数Ｆ、Ｇの積の実数部が計算され
る。（実数部）Ｚ＝ａｃ−ｂｄ［１４］第１２式を実行するには、乗数の上位ワードＸ_7-4 にｂ
を、下位ワードＸ_3-0にａをそれぞれ４ビット・データ
として入力し、被乗数の上位ワード入力Ｙ_7-4にｃを、
下位ワードＹ_3-0 にｄをそれぞれ４ビット・データとし
て入力し、Ｓ₂＝１にする。

【００４６】Ｓ₂ ＝１にすると、エクスクルーシブ・オ
ア・ゲート１１により下位ワードＹ_3-0 の各ビットは反
転され、被乗数Ｙの下位ワードＹ_L ＝ｄが入力されるブ
ースのデコーダ１の最下位ビット入力Ｙ_m-1 にはＳ₂ ＝
１が入力されるので、下位ワードＹ_L ＝ｄの符号は反転
される。この被乗数符号反転方法は、例えば特開昭６２
−２２９４３９に開示されている。

【００４７】第１３式で、第１項と第４項とを乗算器内
部で０にする操作は、制御信号Ｓ_１＝０にすることに対
応する。このとき、アンド・ゲート７は０を出力し、セ
レクタ１０は乗数の下位ワードＸ_Ｌの符号ビットＸ₃
を出力するので、Ｘ_L Ｙ_L ＝ａ（−ｄ）に対応する部分
積Ｐ₀₃〜Ｐ₀₀、Ｐ₁₃〜Ｐ₁₀を生成するブースのセレクタ
２の左右の入力Ｌ、Ｒにはどちらにも０が入力され、Ｘ
_H Ｙ_H ＝ｂｃに対応する部分積Ｐ₂₈〜Ｐ₂₄、Ｐ₃₈〜Ｐ₃₄
を生成するブースのセレクタ２の左右の入力Ｌ、Ｒには
どちらにも符号ビットＸ₃ が入力される。

【００４８】また、被乗数Ｙの上位ワードＹ_H ＝ｃが入
力されるブースのデコーダ１の最下位ビット入力Ｙ_m-1
には、Ｙ₃ の代わりに０が入力されるので、被乗数Ｙの
上位ワードＹ_H ＝ｃと下位ワードＹ_L ＝ｄとは独立した
４ビットの数値としてデコードされる。

【００４９】その結果、第７式の第１項と第４項、すな
わち第１３式の第１項と第４項が０になって、第１４式
の値が出力される。入力データが固定小数点データのと
きは、出力の小数点位置は、Ｚ₁₀とＺ₉ の間になり、入
力データが整数データのときは、出力の小数点位置は、
Ｚ₄ とＺ₃ の間になる。この場合も、符号ビットの上に
は上下各ワードのビット数分符号拡張がされているの
で、各ワードのビット数が２ビットよりも大きければオ
ーバーフローは生じない。

【００５０】［虚数部］積の虚数部は、次のようにして
計算できる。まず、第７式において、Ｘ_H ＝ａ，Ｘ_L ＝ｂ，Ｙ_H ＝ｃ，Ｙ_L ＝ｄ．［１５］とおいて乗算を実行する。

【００５１】その結果、次式が得られる。Ｚ＝ａｃ＋ａｄ＋ｂｃ＋ｂｄ［１６］第１６式で、第１項と第４項とを乗算器内部で０にする
と第１７式が得られ、複素数Ｆ、Ｇの積の虚数部が計算
される。（虚数部）Ｚ＝ａｄ＋ｂｃ［１７］第１５式を実行するには、乗数の上位ワードＸ_7-4 にａ
を、下位ワードＸ_3-0にｂをそれぞれ４ビット・データ
として入力し、被乗数の上位ワードＹ_7-4 にｃを、下位
ワードＹ_3-0 にｄをそれぞれ４ビット・データとして入
力し、Ｓ₂ ＝０にする。

【００５２】Ｓ₂ ＝０にすると、エクスクルーシブ・オ
ア・ゲート１１は下位ワードＹ_3-0各ビットをそのまま
出力し、被乗数Ｙの下位ワードＹ_L ＝ｄが入力されるブ
ースのデコーダ１の最下位ビット入力Ｙ_m-1 にはＳ₂ ＝
０が入力されるので、下位ワードＹ_L ＝ｄの符号は反転
されない。

【００５３】第１６式で、第１項と第４項とを乗算器内
部で０にする操作は、制御信号Ｓ₁＝０にすることに対
応する。このとき、アンド・ゲート７は０を出力し、セ
レクタ１０は乗数の下位ワードＸ_L の符号ビットＸ₃ を
出力するので、Ｘ_L Ｙ_L ＝ｂｄに対応する部分積Ｐ₀₃〜
Ｐ₀₀、Ｐ₁₃〜Ｐ₁₀を生成するブースのセレクタ２の左右
の入力Ｌ、Ｒにはどちらにも０が入力され、Ｘ_H Ｙ_H ＝
ａｃに対応する部分積Ｐ₂₈〜Ｐ₂₄、Ｐ₃₈〜Ｐ₃₄を生成す
るブースのセレクタ２の左右の入力Ｌ、Ｒにはどちらに
も符号ビットＸ₃ が入力される。

【００５４】また、被乗数Ｙの上位ワードＹ_H ＝ｃが入
力されるブースのデコーダ１の最下位ビット入力Ｙ_m-1
には、Ｙ₃ の代わりに０が入力されるので、被乗数Ｙの
上位ワードＹ_H ＝ｃと下位ワードＹ_L ＝ｄとは独立した
４ビットの数値としてデコードされる。

【００５５】その結果、第７式の第１項と第４項、即ち
第１６式の第１項と第４項が０になって、第１７式の値
が出力される。入力データが固定小数点データのとき
は、出力の小数点位置はＺ₁₀とＺ₉ の間になり、入力デ
ータが整数データのときは、出力の小数点位置はＺ₄ と
Ｚ₃ の間になる。この場合も、各ワードのビット数が２
ビットよりも大きければオーバーフローは生じない。次
に、第３の実施例について説明する。図４は、本発明の
第３の実施例に係わる乗算器を示している。図４におい
て、６は、オア・ゲート、Ｓ₂ は、制御信号である。な
お、図１及び図３の乗算器と同じ構成要素には同じ番号
を付して、その説明を省略する。

【００５６】本実施例の乗算器は、制御信号Ｓ₂ が０の
ときには、図１の乗算器とまったく同じ動作をするが、
制御信号Ｓ₂ が１になると、被乗数Ｙの上位ワードＹ_H
の符号が反転する。このことを利用して、複素乗算が実
行できる。

【００５７】再び、２つの複素数Ｆ＝ａ＋ｊｂＧ＝ｃ＋ｊｄの積を計算することを考える。

【００５８】［実数部］積の実数部は、次のようにして
計算できる。まず、第７式において、Ｘ_H ＝ａ，Ｘ_L ＝ｂ，Ｙ_H ＝−ｄ，Ｙ_L ＝ｃ．［１８］とおいて乗算を実行する。

【００５９】その結果、次式が得られる。Ｚ＝ａ（−ｄ）＋ａｃ＋ｂ（−ｄ）＋ｂｃ［１９］第１９式で、第１項と第４項とを乗算器内部で０にする
と第２０式が得られ、複素数Ｆ、Ｇの積の実数部が計算
される。（実数部）Ｚ＝ａｃ−ｂｄ［２０］第１８式を実行するには、乗数の上位ワードＸ_7-4 にａ
を、下位ワードＸ_3-0にｂをそれぞれ４ビット・データ
として入力し、被乗数の上位ワードＹ_7-4 にｄを、下位
ワードＹ_3-0 にｃをそれぞれ４ビット・データとして入
力し、Ｓ₂ ＝１にする。

【００６０】Ｓ₂ ＝１にすると、エクスクルーシブ・オ
ア・ゲート１１により上位ワードＹ_7-4 の各ビットは反
転され、被乗数Ｙの上位ワードＹ_H ＝ｄが入力されるブ
ースのデコーダ１の最下位ビット入力Ｙ_m-1 にはオア・
ゲート６の出力（＝１）が入力されるので、上位ワード
Ｙ_H ＝ｄの符号は反転される。

【００６１】第１９式で、第１項と第４項とを乗算器内
部で０にする操作は、制御信号Ｓ₁＝０にすることに対
応する。このとき、アンド・ゲート７は０を出力し、セ
レクタ１０は乗数の下位ワードＸ_L の符号ビットＸ₃ を
出力するので、Ｘ_L Ｙ_L ＝ｂｃに対応する部分積Ｐ₀₃〜
Ｐ₀₀、Ｐ₁₃〜Ｐ₁₀を生成するブースのセレクタ２の左右
の入力Ｌ、Ｒにはどちらにも０が入力され、Ｘ_H Ｙ_H ＝
ａ（−ｄ）に対応する部分積Ｐ₂₈〜Ｐ₂₄、Ｐ₃₈〜Ｐ₃₄を
生成するブースのセレクタ２の左右の入力Ｌ、Ｒにはど
ちらにも符号ビットＸ₃ が入力される。

【００６２】また、被乗数Ｙの上位ワードＹ_H ＝ｄが入
力されるブースのデコーダ１の最下位ビット入力Ｙ_m-1
には、Ｙ₃ の代わりに１が入力されるので、被乗数Ｙの
上位ワードＹ_H ＝ｄと下位ワードＹ_L ＝ｃとは独立した
４ビットの数値としてデコードされる。

【００６３】その結果、第７式の第１項と第４項、即ち
第１９式の第１項と第４項が０になって、第２０式の値
が出力される。入力データが固定小数点データのとき
は、出力の小数点位置は、Ｚ₁₀とＺ₉ の間になり、入力
データが整数データのときは、出力の小数点位置は、Ｚ
₄ とＺ₃ の間になる。各ワードのビット数が２ビットよ
りも大きければオーバーフローは生じない。

【００６４】［虚数部］積の虚数部は、図３の実施例と
同じ様にして計算することができる。なお、本発明にお
いて、乗算されるデータ対の数は、２対に限定されるも
のではなく、３対以上であっても良い。

【００６５】

【発明の効果】以上、説明したように、本発明の乗算器
によれば、次のような効果を奏する。一度に複数のデー
タ対の乗算が可能なため、１つの乗算器でありながら、
通常の乗算はもちろんのこと、倍精度乗算、ベクトルの
内積、複素乗算が可能である。本乗算器をプロセッサに
組み込んだ場合、上記すべての演算が単一マシンサイク
ルで実行可能なため、プログラムのステップ数削減に効
果があり、特に積和演算が主体の信号処理プログラムに
おいては、場合により従来の約１／２にまでステップ数
を短縮できる。逆に、演算スループットを同一とした場
合、マシンサイクルは従来よりも長くとれ、プロセッサ
全体の消費電力削減に効果がある。特に、信号処理を専
門に行うディジタル・シグナル・プロセッサにおいて
は、場合により従来の約１／２にまで消費電力を削減で
きる。

【図面の簡単な説明】

【図１】本発明の第１の実施例に係わる乗算器を示すブ
ロック図。

【図２】本発明の乗算器に使用するセレクタ１０の一例
を示す回路図。

【図３】本発明の第２の実施例に係わる乗算器を示すブ
ロック図。

【図４】本発明の第３の実施例に係わる乗算器を示すブ
ロック図。

【図５】従来の乗算器を示すブロック図。

【図６】従来の乗算器に使用するブースのデコーダ１の
一例を示す回路図。

【図７】従来の乗算器に使用するブースのセレクタ２の
一例を示す回路図。

【符号の説明】

１ …ブースのデコーダ、２ …ブースのセレクタ、３ …並列加算回路、４ …ナンド・ゲート、５ …ノアゲート、６ …オア・ゲート、７ …アンド・ゲート、８ …インバータ、９ …エクスクルーシブ・ノア・ゲート、１０ …セレクタ、１１ …エクスクルーシブ・オア・ゲート。

Claims

【特許請求の範囲】

【請求項１】ブースのアルゴリズムを利用した乗算器
において、被乗数の上位ワードが入力されるブースデコーダの最下
位ビット入力に被乗数の下位ワードの最上位ビットと０
とを切り替えて入力する被乗数分割手段と、部分積の一部を０で置き換える０化手段と、部分積の他の一部をそれよりも下位のビットの部分積の
１ビットで置き換えるビット拡張手段とを具備したこと
を特徴とする乗算器。
【請求項２】ブースのアルゴリズムを利用した乗算器
において、被乗数の下位ワードが入力されるブースデコーダの最下
位ビット入力に０と１とを切り替えて入力すると共に、
前記ブースデコーダに被乗数の下位ワードとその反転信
号とを切り替えて入力する被乗数補数化手段と、被乗数の上位ワードが入力されるブースデコーダの最下
位ビット入力に被乗数の下位ワードの最上位ビットと０
とを切り替えて入力する被乗数分割手段と、部分積の一部を０で置き換える０化手段と、部分積の他の一部をそれよりも下位のビットの部分積の
１ビットで置き換えるビット拡張手段とを具備したこと
を特徴とする乗算器。
【請求項３】ブースのアルゴリズムを利用した乗算器
において、被乗数の上位ワードが入力されるブースデコーダの最下
位ビット入力に被乗数の下位ワードの最上位ビットと１
とを切り替えて入力する被乗数分割手段と、被乗数の上位ワードとその反転信号とを切り替えて入力
する被乗数反転手段と、部分積の一部を０で置き換える０化手段と、部分積の他の一部をそれよりも下位のビットの部分積の
１ビットで置き換えるビット拡張手段とを具備したこと
を特徴とする乗算器。