JPS61173382A - デイジタル信号処理装置 - Google Patents
デイジタル信号処理装置Info
- Publication number
- JPS61173382A JPS61173382A JP60013703A JP1370385A JPS61173382A JP S61173382 A JPS61173382 A JP S61173382A JP 60013703 A JP60013703 A JP 60013703A JP 1370385 A JP1370385 A JP 1370385A JP S61173382 A JPS61173382 A JP S61173382A
- Authority
- JP
- Japan
- Prior art keywords
- circuit
- accumulator
- arithmetic
- logic operation
- output
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Complex Calculations (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
産業上の利用分野
本発明は高速のディジタル信号処理が可能なディジタル
信号処理装置に関し、たとえば;データ伝送用の高速変
復調装置などの各種通信用、産業用ロボットの高速数値
制御用などに適用できるディジタル信号処理装置に関す
るものである。
信号処理装置に関し、たとえば;データ伝送用の高速変
復調装置などの各種通信用、産業用ロボットの高速数値
制御用などに適用できるディジタル信号処理装置に関す
るものである。
従来の技術
ディジタル信号処理を行なう方法として、従来から、ビ
ットスライスのバイポーラ演算チップおよびメモリなど
を用いる方法、あるいは汎用のマイクロプロセッサを用
いる方法がある。しかし、前者は相当なハード規模にな
り、その結果、コスト、大きさ、設計時間、消費電力等
の問題があシ、後者は演算精度、演算速度(乗算をソフ
トウェアで実行する時に要するプログラムステップ数、
パスを介するデータ転送時間等)に問題がある。
ットスライスのバイポーラ演算チップおよびメモリなど
を用いる方法、あるいは汎用のマイクロプロセッサを用
いる方法がある。しかし、前者は相当なハード規模にな
り、その結果、コスト、大きさ、設計時間、消費電力等
の問題があシ、後者は演算精度、演算速度(乗算をソフ
トウェアで実行する時に要するプログラムステップ数、
パスを介するデータ転送時間等)に問題がある。
これらの問題点を克服するために、信号処理装置のLS
I化によるハード化が有望な方法として考えられ、近年
、各種の汎用のディジタル信号処理LSIが実現されて
いる。
I化によるハード化が有望な方法として考えられ、近年
、各種の汎用のディジタル信号処理LSIが実現されて
いる。
発明が解決しようとする問題点
フィルタリング処理、自己相関処理、自動等化処理、距
離計算、高速フーリエ変換等の信号処理の演算にはいく
つかの良く使われるタイプがあり、たとえば積和の形は
その代表的な例である。従って、多くの信号処理LSI
は信号の高速処理のために乗算器および加算器をオンチ
ップ化している。
離計算、高速フーリエ変換等の信号処理の演算にはいく
つかの良く使われるタイプがあり、たとえば積和の形は
その代表的な例である。従って、多くの信号処理LSI
は信号の高速処理のために乗算器および加算器をオンチ
ップ化している。
しかし、その数はせいぜい各々−個である。
いま、xi をデータ、ω、をデータまたは係数とする
と、積和演算は Σ y=iω1”! ・・・・・・・・・(1)
の形で示される。しかし、上記使号処理LSIでは、そ
の乗算器および加算器の数から、1マシンサイクルで実
行出来る論理演算は、せいぜいω。+ωに・xk
・・・・・・…(2)(ωに+ ”k:乗算器の
二人力、ω。、ωに−xk:加算器の二人力)である。
と、積和演算は Σ y=iω1”! ・・・・・・・・・(1)
の形で示される。しかし、上記使号処理LSIでは、そ
の乗算器および加算器の数から、1マシンサイクルで実
行出来る論理演算は、せいぜいω。+ωに・xk
・・・・・・…(2)(ωに+ ”k:乗算器の
二人力、ω。、ωに−xk:加算器の二人力)である。
例えば、積項を4個有するパイカッド・フィルタでは、
4回の積を実行するために少なくとも4マシンサイクル
を必要とし、さらに、各マシンサイクル毎の中間データ
を保持するだめに、データ転送用に4マシンサイクルを
必要とすると、フィルタ、エレメントとして、1゜マシ
ンサイクル程度が必要である0同様に、高速フーリエ変
換の複素バタフライ演算では26マシンサイクル程度が
必要となる0 本発明は上記信号処理LSIで実現出来る1マシンサイ
クルでの各1回の積和演算の能力を拡大し、1マシンサ
イクルで複数回の積和演算を可能とし、さらに、データ
転送用のマシンサイクル数を削減することにより、全体
として、高速化を実現する信号処理LSIを実現するこ
とを目的とするO 問題点を解決するための手段 すなわち、本発明は、乗算器および論理演算回路(例え
ば加算器)からなるユニットを、複数個互いに縦続に接
続し、さらにこれらの複数個のユニットによるデータの
処理を1マシンサイクル内で実行することによ゛す、高
速処理を実現するものである。
4回の積を実行するために少なくとも4マシンサイクル
を必要とし、さらに、各マシンサイクル毎の中間データ
を保持するだめに、データ転送用に4マシンサイクルを
必要とすると、フィルタ、エレメントとして、1゜マシ
ンサイクル程度が必要である0同様に、高速フーリエ変
換の複素バタフライ演算では26マシンサイクル程度が
必要となる0 本発明は上記信号処理LSIで実現出来る1マシンサイ
クルでの各1回の積和演算の能力を拡大し、1マシンサ
イクルで複数回の積和演算を可能とし、さらに、データ
転送用のマシンサイクル数を削減することにより、全体
として、高速化を実現する信号処理LSIを実現するこ
とを目的とするO 問題点を解決するための手段 すなわち、本発明は、乗算器および論理演算回路(例え
ば加算器)からなるユニットを、複数個互いに縦続に接
続し、さらにこれらの複数個のユニットによるデータの
処理を1マシンサイクル内で実行することによ゛す、高
速処理を実現するものである。
作 用
本発明は上記した構成により、第(1)式において、1
マシンサイクルで複数個の積和演算が可能となり、前記
したフィルタリング処理を始めとする積和演算を含む各
種信号処理のマシンサイクル数を従来に比較して少なく
出来、これによシ高速化が実現出来る。
マシンサイクルで複数個の積和演算が可能となり、前記
したフィルタリング処理を始めとする積和演算を含む各
種信号処理のマシンサイクル数を従来に比較して少なく
出来、これによシ高速化が実現出来る。
実施例
第1図は本発明の一実施例におけるディジタル信号処理
装置の構成図で、乗算器および加算器からなる回路ユニ
ットが2個の場合を示している。
装置の構成図で、乗算器および加算器からなる回路ユニ
ットが2個の場合を示している。
第1図において、1.2は乗算器、3,4は論理演算回
路、5〜1oはレジスタ、11.12はアキュムレータ
、13〜19はマルチプレクサ−120〜23はデータ
あるいは係数を記憶するためのメモリ、24〜27はデ
ータバスを示す。乗算器1,2の出力端はそれぞれマル
チプレクサ14゜18を介して論理演算回路3,4の第
1の入力端に接続されている。また一方の論理演算回路
3の出力端が他方の演算回路4の第2入力端にマルチプ
レクサ17を介して接続され七いる。他方の論理演算回
路4の出力端はアキュムレータ11,12、及びマルチ
プレクサ13.17を介して2つの論理演算回路3,4
の第2の入力端に接続されている。
路、5〜1oはレジスタ、11.12はアキュムレータ
、13〜19はマルチプレクサ−120〜23はデータ
あるいは係数を記憶するためのメモリ、24〜27はデ
ータバスを示す。乗算器1,2の出力端はそれぞれマル
チプレクサ14゜18を介して論理演算回路3,4の第
1の入力端に接続されている。また一方の論理演算回路
3の出力端が他方の演算回路4の第2入力端にマルチプ
レクサ17を介して接続され七いる。他方の論理演算回
路4の出力端はアキュムレータ11,12、及びマルチ
プレクサ13.17を介して2つの論理演算回路3,4
の第2の入力端に接続されている。
以下に信号処理の演算に良くあられれる2、3の型を例
にあげて、装置の動作を説明する。
にあげて、装置の動作を説明する。
(1)演算 Ci= Σ A1・B、 の場合1=
=1 データあるいは係数Ai、Biが記憶されている。
=1 データあるいは係数Ai、Biが記憶されている。
メモリー20〜23よシ、レジスタ7〜1oへ、A、、
B、 、 Ai+1. Bi+1 をロードする。た
とえば、レジスタ7へAiヲ、レジスタ8へB、 ヲ
、レジスタ9へAi+1を、レジスターoへBi+1
をそれぞれロードする。そして、次のマシンサイクル
で、各々2個の乗算器および論理演算回路を同時に動作
させ、その結果A1−1・B t−1+At・Bi+A
i+1・Bi+。
B、 、 Ai+1. Bi+1 をロードする。た
とえば、レジスタ7へAiヲ、レジスタ8へB、 ヲ
、レジスタ9へAi+1を、レジスターoへBi+1
をそれぞれロードする。そして、次のマシンサイクル
で、各々2個の乗算器および論理演算回路を同時に動作
させ、その結果A1−1・B t−1+At・Bi+A
i+1・Bi+。
ヲアキュムレータ11に格納する0
但し、A1−1・B1−1 はあらかじめ、アキュム
レータ11に格納されていた値である。
レータ11に格納されていた値である。
即ち、1マシンサイクルでの実質上の処理は、アキュム
レータの内容を(A、、)とすると、(A、、 ) +
A 1・Bi+A1−1@B1−1→(A、c) ・
・−・・(3)となる。
レータの内容を(A、、)とすると、(A、、 ) +
A 1・Bi+A1−1@B1−1→(A、c) ・
・−・・(3)となる。
この時、最も時間を要する回路ブロックは、乗算器1,
2であるが、これらの乗算器によるデータの処理は、各
々、並列に処理されるので、乗算器を複数個設けても、
上記積和演算の計算で、計算時間が累積されることはな
い。
2であるが、これらの乗算器によるデータの処理は、各
々、並列に処理されるので、乗算器を複数個設けても、
上記積和演算の計算で、計算時間が累積されることはな
い。
ここで、従来の場合を第4図を用いて説明すると、デー
タあるいは係数A1.Biが記憶されているメモリー3
6よシ、データバス37を介して、レジスタ33.34
へA、、B、をロードする。そして、次のマシンサイク
ルで、各1個の乗算器31および論理演算回路32によ
る処理により、演算結果、A1−1・B、−1+A、*
Biがアキュムレータ36に格納される。但し、A1−
1・B1−1 はあらかじめ、アキュムレータ35に
格納されていた値であるので、1マシンサイクルでの実
質上の処理は、−(Acc”A1−B1 = (A
cc) ””””・(4)となる。
タあるいは係数A1.Biが記憶されているメモリー3
6よシ、データバス37を介して、レジスタ33.34
へA、、B、をロードする。そして、次のマシンサイク
ルで、各1個の乗算器31および論理演算回路32によ
る処理により、演算結果、A1−1・B、−1+A、*
Biがアキュムレータ36に格納される。但し、A1−
1・B1−1 はあらかじめ、アキュムレータ35に
格納されていた値であるので、1マシンサイクルでの実
質上の処理は、−(Acc”A1−B1 = (A
cc) ””””・(4)となる。
第(3)式と第(4)式を比較することによシ、本実施
例の装置による積和演算は従来の装置に比較して。
例の装置による積和演算は従来の装置に比較して。
2倍のパフォーマンスが得られることがわかる。
なお、第4図で38.39はレジスタ、40.41はマ
ルチプレクサ−を示す。
ルチプレクサ−を示す。
次に、信号処理でボトルネックとなるのは、データ転送
である。例えば、第4図において、メモリー領域36か
ら、データバス37を介して、データをレジスタ33.
34にロードする場合、少なくとも2マシンサイクルを
必要とする。この、各−個のメモリーとデータバスを、
本発明の実施例装置に適用したとすると、4個のレジス
タ7〜10にデータをロードするのに少なくとも4マシ
ンサイクルが必要となり、積和演算を高速に実行できた
としても、全体としての高速化の実現の効果は少なくな
る。この問題点を克服するために、第1図に示す本実施
例装置では、レジスタ数(レジスタ7〜10の4個)に
対応したデータバス24〜27および、メモリー領域2
0〜23を設けている。これによシ、4個のデータをメ
モリーからレジスタに1マシンサイクルでロードするこ
とが可能になり、データ転送の高速化が図れることにな
る。この場合のメモリー20〜23はスクラッチパッド
型の多ポートメモリーが必要とされる。
である。例えば、第4図において、メモリー領域36か
ら、データバス37を介して、データをレジスタ33.
34にロードする場合、少なくとも2マシンサイクルを
必要とする。この、各−個のメモリーとデータバスを、
本発明の実施例装置に適用したとすると、4個のレジス
タ7〜10にデータをロードするのに少なくとも4マシ
ンサイクルが必要となり、積和演算を高速に実行できた
としても、全体としての高速化の実現の効果は少なくな
る。この問題点を克服するために、第1図に示す本実施
例装置では、レジスタ数(レジスタ7〜10の4個)に
対応したデータバス24〜27および、メモリー領域2
0〜23を設けている。これによシ、4個のデータをメ
モリーからレジスタに1マシンサイクルでロードするこ
とが可能になり、データ転送の高速化が図れることにな
る。この場合のメモリー20〜23はスクラッチパッド
型の多ポートメモリーが必要とされる。
(2) 演算 C1=、Σ (A、−B、)2 の
場合。
場合。
l=1
第4図に示す従来の装置では、少なくとも数マシンサイ
クルを要して得られたアキュムレータ36の内容(A、
−B、) を、(Ai+1−Bi+1 )2 の演
算を行なうために、さらに内部メモリー36に回避させ
なければならない。従って、中間データのアキュムレー
タ36とメモリー36間の遺り取りが頻繁になり、効率
の悪い演算となる。
クルを要して得られたアキュムレータ36の内容(A、
−B、) を、(Ai+1−Bi+1 )2 の演
算を行なうために、さらに内部メモリー36に回避させ
なければならない。従って、中間データのアキュムレー
タ36とメモリー36間の遺り取りが頻繁になり、効率
の悪い演算となる。
一方、第1図に示す本実施例装置の場合は、メそり−か
らレジスタ6.6にロードされたデータA1およびB、
は論理演算回路3および4、乗算回路2により、1マシ
ンサイクルで、演算結果(As −1−Bs −1)
2+ (At B t )2がアキュムレータ11に得
られる。
らレジスタ6.6にロードされたデータA1およびB、
は論理演算回路3および4、乗算回路2により、1マシ
ンサイクルで、演算結果(As −1−Bs −1)
2+ (At B t )2がアキュムレータ11に得
られる。
但し、(Ai−1−B1−1 )2はあらかじめアキュ
ムレータ11に格納されていたデータである。従ってこ
の場合には、中間データを内部メモリー20等に回避す
る必要がなく、演算自体も高速に実行できるため、全体
として、効率の良い高速演算が可能となる。
ムレータ11に格納されていたデータである。従ってこ
の場合には、中間データを内部メモリー20等に回避す
る必要がなく、演算自体も高速に実行できるため、全体
として、効率の良い高速演算が可能となる。
マタ、マルチプレクサ13のφ入力を選択し、乗算回路
1および論理演算回路4により、第4図と同様の処理を
行なうことも容易である。
1および論理演算回路4により、第4図と同様の処理を
行なうことも容易である。
さらに、アキュムレータ12は中間データの保持のため
に、アキュムレータ11に加えて設けられたものであシ
、パイカッドフィルタ(BfquadFilter)等
の演算の際に、内部メモリーへのデータの回避を行なう
ことなしに、演算が実行できる。
に、アキュムレータ11に加えて設けられたものであシ
、パイカッドフィルタ(BfquadFilter)等
の演算の際に、内部メモリーへのデータの回避を行なう
ことなしに、演算が実行できる。
以上は、乗算器および論理演算回路からなる回路ユニッ
トが2個の場合であまたが、同様の考え方によシ、第2
図、第3図に示すように、n個の回路ユニットからなる
ディジタル信号処理装置を構成することが可能になる。
トが2個の場合であまたが、同様の考え方によシ、第2
図、第3図に示すように、n個の回路ユニットからなる
ディジタル信号処理装置を構成することが可能になる。
第2図で61は乗算器および論理演算回路からなる回路
ユニットを示す。第2図で第1図と同じ部番(2,4,
9,10,115,16,17,18)は第1図と同じ
部分を示す。なお、52は前段のユニットの論理演算回
路の出力、53はアキュムレータからの出力、64は論
理演算回路の出力、55.56はデータバスを示す。
ユニットを示す。第2図で第1図と同じ部番(2,4,
9,10,115,16,17,18)は第1図と同じ
部分を示す。なお、52は前段のユニットの論理演算回
路の出力、53はアキュムレータからの出力、64は論
理演算回路の出力、55.56はデータバスを示す。
このユニット61を(n−1>個および初段の1ユニツ
トを加えて合計nユニットの場合の信号処理装置の例を
第3図に示す。第3図で、1,3゜5.6,7,8,1
1.12,13,14,51゜52.53は第1図およ
び第2図に対応する番号と同じ部分を示す。なお、61
はデータバス、62はセグメントメモリーを示し、その
数は第1図の場合を参考にして、2n個必要となる。
トを加えて合計nユニットの場合の信号処理装置の例を
第3図に示す。第3図で、1,3゜5.6,7,8,1
1.12,13,14,51゜52.53は第1図およ
び第2図に対応する番号と同じ部分を示す。なお、61
はデータバス、62はセグメントメモリーを示し、その
数は第1図の場合を参考にして、2n個必要となる。
この実施例においても、最もデータ遅延が顕著であるn
個の乗算器は各々独立に並列に処理されるので、複数の
乗算器がクリティカルバスにはならない0 発明の効果 このよう忙、この発明によれば、各種のディジタル信号
処理に必要な演算を高速に実行し、且つ。
個の乗算器は各々独立に並列に処理されるので、複数の
乗算器がクリティカルバスにはならない0 発明の効果 このよう忙、この発明によれば、各種のディジタル信号
処理に必要な演算を高速に実行し、且つ。
データ転送に必要なマシンサイクル数を減することによ
り、全体として高速信号処理が可能となる。
り、全体として高速信号処理が可能となる。
第1図、第2図、第3図は本発明のディジタル信号処理
装置の各実施例を示す構成図、第4図は従来のディジタ
ル信号処理装置を示す構成図である0 1.2・・・・・・乗算器、3,4・・・・・・論理演
算回路、6〜10・・・・・・レジスタ、11.12・
・・−・・アキュムレータ、13〜19・・・・・・マ
ルチプレクサ、20〜23・・・・・・メモリー、24
〜27・・・・・・データバス。 代理人の氏名 弁理士 中 尾 敏 男 ほか1名第1
図 第2図 第3図 第4図
装置の各実施例を示す構成図、第4図は従来のディジタ
ル信号処理装置を示す構成図である0 1.2・・・・・・乗算器、3,4・・・・・・論理演
算回路、6〜10・・・・・・レジスタ、11.12・
・・−・・アキュムレータ、13〜19・・・・・・マ
ルチプレクサ、20〜23・・・・・・メモリー、24
〜27・・・・・・データバス。 代理人の氏名 弁理士 中 尾 敏 男 ほか1名第1
図 第2図 第3図 第4図
Claims (1)
- 乗算器と、この乗算器の出力が第1の入力となる論理演
算回路からなる回路ユニットを複数個備え、一回路ユニ
ットの論理演算回路の出力が次段の回路ユニットの論理
演算回路の少なくとも第2の入力となるように縦続に接
続され、最終段の回路ユニットの論理演算回路の出力が
、アキュムレータを介して、すべての回路ユニットの論
理演算回路の第2の入力側に印加されるように構成され
、上記複数の回路ユニットの乗算器および論理演算回路
によるデータの処理が一マシンサイクルで終了するよう
にしたことを特徴とするディジタル信号処理装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP60013703A JPS61173382A (ja) | 1985-01-28 | 1985-01-28 | デイジタル信号処理装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP60013703A JPS61173382A (ja) | 1985-01-28 | 1985-01-28 | デイジタル信号処理装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS61173382A true JPS61173382A (ja) | 1986-08-05 |
Family
ID=11840566
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP60013703A Pending JPS61173382A (ja) | 1985-01-28 | 1985-01-28 | デイジタル信号処理装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS61173382A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6491272A (en) * | 1987-10-01 | 1989-04-10 | Nec Corp | Arithmetic circuit |
JPH03223960A (ja) * | 1989-11-30 | 1991-10-02 | Mitsubishi Electric Corp | プロセッサ |
-
1985
- 1985-01-28 JP JP60013703A patent/JPS61173382A/ja active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6491272A (en) * | 1987-10-01 | 1989-04-10 | Nec Corp | Arithmetic circuit |
JPH03223960A (ja) * | 1989-11-30 | 1991-10-02 | Mitsubishi Electric Corp | プロセッサ |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Harris et al. | An improved unified scalable radix-2 Montgomery multiplier | |
EP0100511B1 (en) | Processor for fast multiplication | |
US8645450B1 (en) | Multiplier-accumulator circuitry and methods | |
JPS6297060A (ja) | デイジタルシグナルプロセツサ | |
US4769779A (en) | Systolic complex multiplier | |
JPS6125188B2 (ja) | ||
JPS635774B2 (ja) | ||
JPH0231511A (ja) | プロセッサ | |
JPH11306163A (ja) | 積和演算装置 | |
CN101258464A (zh) | 全加器模块和使用该全加器模块的乘法器装置 | |
US20040128335A1 (en) | Fast fourier transform (FFT) butterfly calculations in two cycles | |
JPS61173382A (ja) | デイジタル信号処理装置 | |
US6484193B1 (en) | Fully pipelined parallel multiplier with a fast clock cycle | |
KR100481586B1 (ko) | 모듈러 곱셈 장치 | |
CN108255463A (zh) | 一种数字逻辑运算方法、电路和fpga芯片 | |
Jullien et al. | Hardware realization of digital signal processing elements using the residue number system. | |
Vesterbacka et al. | Realization of serial/parallel multipliers with fixed coefficients | |
JPH01119861A (ja) | ディジタル信号処理用lsi | |
JPH05324694A (ja) | 再構成可能並列プロセッサ | |
JP2696903B2 (ja) | 数値計算装置 | |
JPH07141148A (ja) | パイプライン並列乗算器 | |
JPS63133268A (ja) | パイプライン式のfftバタフライ計算装置 | |
JPH0613843A (ja) | ディジタル信号処理回路 | |
Bowlyn et al. | A novel distributed arithmetic approach for computing a radix-2 FFT butterfly implementation | |
JP3723311B2 (ja) | 並列演算プロセッサ |