JPH03138759A - 信号プロセツサ - Google Patents

信号プロセツサ

Info

Publication number
JPH03138759A
JPH03138759A JP2248983A JP24898390A JPH03138759A JP H03138759 A JPH03138759 A JP H03138759A JP 2248983 A JP2248983 A JP 2248983A JP 24898390 A JP24898390 A JP 24898390A JP H03138759 A JPH03138759 A JP H03138759A
Authority
JP
Japan
Prior art keywords
signal processor
alu
data
register file
macu
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2248983A
Other languages
English (en)
Inventor
Jr Gardner D Jones
ガードナー・ダラニー・ジヨーンズ、ジユニア
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JPH03138759A publication Critical patent/JPH03138759A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F7/00Methods or arrangements for processing data by operating upon the order or content of the data handled
    • G06F7/38Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation
    • G06F7/48Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices
    • G06F7/57Arithmetic logic units [ALU], i.e. arrangements or devices for performing two or more of the operations covered by groups G06F7/483 – G06F7/556 or for performing logical operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/76Architectures of general purpose stored program computers
    • G06F15/78Architectures of general purpose stored program computers comprising a single central processing unit
    • G06F15/7839Architectures of general purpose stored program computers comprising a single central processing unit with memory
    • G06F15/7842Architectures of general purpose stored program computers comprising a single central processing unit with memory on one IC chip (single chip microcontrollers)
    • G06F15/7857Architectures of general purpose stored program computers comprising a single central processing unit with memory on one IC chip (single chip microcontrollers) using interleaved memory
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/30Arrangements for executing machine instructions, e.g. instruction decode
    • G06F9/38Concurrent instruction execution, e.g. pipeline or look ahead
    • G06F9/3885Concurrent instruction execution, e.g. pipeline or look ahead using a plurality of independent parallel functional units

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Computer Hardware Design (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computing Systems (AREA)
  • Advance Control (AREA)
  • Complex Calculations (AREA)
  • Executing Machine-Instructions (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 A、産業上の利用分野 本発明は一般にデータ処理システムに関し、具体的には
フーリエ変換、デジタル・フィルタ、圧縮コーディング
、相関、等化、モデム機能、音声の認識、合成または圧
縮、およびイメージの認識または強調ならびに計測やフ
ィルタリングのための高速反復計算に適した、デジタル
信号処理用コンピュータに関するものである。
B、従来の技術及びその課題 現在様々な高速信号プロセッサが市販されている。たと
えば、米国特許第4794517号明細書は、3段バイ
ブライン式信号プロセッサのアーキテクチャを記載して
いる。
このアーキテクチャは、多数の高速操作が可能であり、
分離した演算論理機構(ALU)ならびに分離した乗算
機能を有する。しかし、この先行特許における乗算器は
、累算レジスタもALUと累積乗算機構(MACU)の
独立した同時並列な動作を可能にする2重データ・バス
構造も有していない。なお、累積乗算機構(Multi
plierAccumulator Llnit)は、
乗算累算機構または乗算累積機構とも呼ばれる。
同様に、ヴアンウェイク(VanWijk)他の論文「
並列処理機能を備えた2マイクロメートルCMO888
MIPSデジタル・プロセッサ(A Tw。
Micrometer CMo5s 8 MIPS D
igital Processorwith Para
llel Processing Capabilit
y) J N IEEEJournal of 5ol
id 5tate C1rcuitst V o l 
、 5C−21、No、5 (1988年10月)p、
750以降は、並列処理能力を有するデジタル信号プロ
セッサを記載している。
このプロセッサは、分離したMACUとALUを示して
いるが、使用されるバスとレジスタとの構成のために、
高速記憶転送機能を伴う、A L UとMACUの並列
動作は不可能である。バスXとYを介してデータ記憶機
構からALUに2つのオペランドを転送しなければなら
ない場合、データ・バスがALUへのオペランド転送に
占有されているため、MACUは記憶機構からもALU
からも入力を得ることができない。ALUによって2つ
のオペランドを加算し、MACU内でその結果に第3の
オペランドを乗算するといった単純な同時並列操作も、
MACUを動かすための転送経路が使用不可能であるた
め、実行できない。このような構成では、乗算ステップ
のためにALtJの出力レジスタから結果を取り出し、
データ・バスを介してそれを転送し、MACUの入力レ
ジスタに置りノニ追加のマシン・サイクルを必要とする
。このようなアーキテクチャでは、ALUまたはMAC
Uは独立に動作するが、同時にまたは並列には動作しな
い。したがって、このアーキテクチャでは、2つの機能
ALUとMACUの分離による性能の向上はない。
分離したALUとMACUを有するもう1つの市販の信
号プロセッサは、アナログ・デバイシズ(Analog
 Devices)社のプロセッサであり嘱同社の使用
解説書E971−10−4/198Bに記載されている
。このアーキテクチャでは、ALUとMACUは別々に
動作し同時には動作しない。
このアーキテクチャは、データ・バスをブロックせずに
ALUとMACUの間で直前の結果を転送するための追
加の結果バスを有する。しかし、この方法で結果バスを
介して転送できるのはMACUとALUのいずれか一方
からの直前の計算結果だけであり、他の機構に転送でき
るのは2個ではなくただ1個の結果オペランドに限られ
る。2つのオペランドがデータ・バスを介してALUに
転送されるとき、ALUの出力はMACUに1つの入力
を供給できる。もう1つのオペランドは、データ・バス
またはAI、UからMACUの入力レジスタに事前にロ
ードしておかなければならない。この構成では同時操作
の宵月性が限られているため、ベンダーは命令中に同時
操作を実行する機能を設けていないものと思われる。A
LUとMACUは別々に独立して動作し、同時には動作
しない。したがって、この構成によって性能の向上は得
られない。前述のどちらベンダーのアーキテクチャでも
、ALUとMACUの間により一般的な経路指定能力を
設けたとしても、これら従来技術のALU機構およびM
ACU機構はどちらも分離した入力レジスタ・ファイル
を有するため、処理機能自体の分離によって可能な最大
の処理能力は得られないはずである。したがって、この
どちらのアーキテクチャにおいても、オペランドがデー
タ記憶機構から転送された後は、処理機構ALUおよび
MACUはこのオペランドに対して共通のアクセス権を
持たない。オペランドに対する共通アクセス権を得るに
は、オペランドをALUとMACUの両方の入力レジス
タに並行してロードしなければならず、そうしないと転
送実行に追加のマシン・サイクルが必要となる。
従来技術の信号プロセッサおよびそのアーキテクチャに
伴う前述の既知の問題に鑑み、本発明の目的は、独立か
つ同時に動作可能なALUおよびMACtJを有する改
良された信号プロセッサを提供することである。
C8課題を解決するための手段 本発明による改良された信号プロセッサは、オペランド
用の汎用バッファまたはプールとしてeくレジスタ・フ
ァイルを設けることにより、ALUとMACUの同時動
作を可能にする。すべてのオペランド転送は、分離した
データ記憶機構から2本の分離したバスを介してレジス
タ・ファイルへ、またはファイルから記憶機構へ行なわ
れる。
ALUとMACUは、ファイル内の全データに対してい
つでも同等のアクセス権を有する。ファイルはまた以前
のA’LUの結果に対するバッファとしても働く。AL
Uは1回の動作ごとに結果に対する演算を行ない、また
必要ならばMACUからの出力がALUの各動作ごとに
得られるので、MACUの出力がレジスタ・ファイル内
で得られるようにする必要はない。そうではなく  M
ACUは多数の動作を行なって存意な結果を生成するこ
とができる。レジスタ・ファイルはALUおよびMAC
Uの両者が独立に使用するためのオペランドを提供する
能力を与える。これなくしては計算の進行に伴ってオペ
ランドを再ロードする必要が生じ、そのため冗長な転送
ロードが行なわれて計算処理能力が低下する。オペラン
ドの再ロードを避けるには、ALU内の演算がrR= 
(AとBの演算)」の形で表現可能でなければならない
。この形では、どちらの入力オペランドも破壊せずに第
3のオペランドすなわち結果Rが生成される。
これはrA= (AとBの演算)」の形をとり、入力オ
ペランドの1つAが新しい結果Aで置き換えられる、従
来の演算とは対照的である。改善されたこの命令の形の
重要性は、数サイクル以内に後続の動作で使用するため
に消去されたオペランドを再ロードする必要がなくなる
ことである。この再ロードは余分なデータ・バスの争奪
を引き起こして処理能力を低下させる。ALUとMAC
Uが独立して並列に動作するには、改善された動作モー
ドを要求する命令が、各機種ごとに別々の制御フィール
ドならびにレジスタ・ファイルの入出力用の制御フィー
ルドを持つ必要がある。
D、実施例 このアーキテクチャは、オペランド用の汎用バッファ・
プールとして働くレジスタ・ファイルを介して、ALU
とMACUを動作させる。データ記憶機構との間のオペ
ランド転送は、すべてこのレジスタ・ファイルを用いて
行なわれる。ALUとMACUはレジスタ・ファイル内
の全データに対して同等のアクセス権を有する。さらに
このファイルは以前のALUの結実用のバッファでもあ
る。
このようにして、個々の機構、データ・バス、ALUお
よびMACUすべての帯域幅が、衝突なしに完全に利用
できる。一般に本発明で提案する構成は、データと結果
が、計算全体で使用され、再使用され、しかも保持レジ
スタ内にそれを保持しておかなければならない多くの信
号処理計算中で、冗長構成性または待ち時間を利用する
。レジスタ・ファイルは、ALUとMACUの両方が独
立して使用できるようにこれらのオペランドを供給する
能力を与える。共通のレジスタ・ファイルがなければ、
計算の進行に伴ってオペランドを再ロードしなければな
らなくなる。この冗長なロードは計算の処理能力を低下
させる。
信号プロセッサは、本発明者の前記の米国特許第479
4517号およびそこに挙げられている参考文献、なら
びに市販のデジタル信号プロセッサを表す前記の従来技
術から明らかなように周知である。構成の一般原則、A
LUとMACUの細部、データ記憶構造、およびアドレ
ス生成や命令復号などのための制御の大部分は既知であ
り、それ自体は本発明の一部ではない。
本発明は、独立してかつ同時に動作可能なALUおよび
MACU機構、ならびに記憶機構とALUおよびMAC
U機構との間のすべてのデータ転送用のバッファ・プー
ルとして山くレジスタ・ファイルのアーキテクチャを対
象とする。したがって、命令取出しのための命令アドレ
ス用シーケンサなどの要素の細部や、命令復号論理回路
やアドレス生成などの詳細は、従来技術の参照文献から
得ることができ、当業者には十分理解されていることな
ので、本明細書では説明しない。本出願発明の基礎であ
り、この詳細な説明で扱う分野は、基本的な動作可能要
素の配置とその相互接続および制御である。
第1図には、独立してかつ同時に動作可能なALUとM
ACUを有する信号プロセッサを構成する動作可能機構
の全体的概略配置が示されている。
命令が要求され、または命令復号論理回路3に「取り出
」される時、シーケンサ1は、命令記憶機構2に事前ロ
ードされた命令リスト中をステッピングして、命令を個
別に提供する。入力命令が復号され、その結果が命令復
号レジスタ(IDR)4にロードされる。I DR4か
らは、ALUおよびMACUの機能を設定し、またアク
セス制御論理回路8および12を介してレジスタ・ファ
イル9に対するデータおよびオペランドの入出力アクセ
スを制御するための、種々の出力制御信号線が出ている
。IDR4は、ALUIOとMACUllならびにレジ
スタ・ファイル9とアクセス制御回路8および12を制
御する。1対の選択制御線がアドレス生成機構5に接続
され、アドレス生成機構5はデータ・アドレス・バス1
および2上を介してデータ記憶機構6および7にデータ
・アドレス入力を供給する。データ記憶機構6および7
は、第1図に示すように、レジスタ・ファイル9との間
で入出力を行なうため、その出力データをバス19およ
び20を介してアクセス制御回路8に供給する。第1図
のこれらの機構すべての構成は、レジスタ選択制御手段
8.12、IDR4およびアドレス生成機構5の細部を
除き、従来技術で周知なので、ここでは要素自体の構成
の詳細は示さない。
第2図には主要構成要素がより詳細に示されている。レ
ジスタ・ファイル9および分離したALUIOとMAC
UIIからなるグループと、2重データ記憶機構および
2重バス構造、ならびにデータ記憶機構用の2重アドレ
ス生成機構が示されているが、わかりやすいように入力
制御線とクロックは省略しである。図を見るとわかるよ
うに、データ記憶機構6および7は、それぞれアドレス
生成機構5Aおよび5Bによって個々に駆動され、デー
タ・バス19および20を介して、レジスタ・ファイル
をロードするために入力制御手段8Aに、またレジスタ
・ファイルから読み取るために入出力制御手段8Bに独
立の出力を供給する。さらに、レジスタ・ファイル9か
らの出力を、出力制御回路12を介してオペランドとし
て選択することができ、またALUの出力を制御回路1
2の別の部分を介してレジスタ・ファイル9への入力と
して選択することもできる。出力制御回路8Cは、出力
BまたはB゛の選択を制御する。出力B″は、乗算器1
3または、乗算累算レジスタ15Aと15Bのどちらか
の出力である。レジスタ15Aと15Bのどちらの出力
が選択されるかは、選択回路8Cを通るIDR4からの
出力によって制御される。選択回路8Cはこの部分のオ
ペランド選択用のアクセス制御手段として働く。レジス
タ・ファイル9からの出力はALUl 0への入力とし
て選択でき、またレジスタ・ファイル9からのもう1つ
の出力または乗算器13の結果もしくは累算レジスタ1
5Aまたは15Bに現れる加算または減算の結果が、A
LUIOのもう一方の入力のオペランドBまたはB′と
して選択できる。BとB゛のどちらの出力がオペランド
として選択されるか1よ、後に更に詳細に説明するよう
に、IDR4の制御下でオペランド・レジスタ・ファイ
ル・アクセス制御回路8Cによって決定される。
乗算器13は、32ビツト加算器14に出力を供給し、
加算器14はまた、IDRの制御下で32ビット選択回
路16からも入力を受け取って、加算器14中での後の
算術演算のためにやはりIDR制御下で累算レジスタ1
5Bの内容を循環させることに留意されたい。したがっ
て、分離した乗算と累算の結果が、IDRからの選択信
号(図示せず)に応じて、レジスタ15Aまたは15B
に別々に記憶される。
2つのデータ記憶機構6および7用のアドレス生成論理
回路も分離され、独立している。アドレス生成機構5B
はデータ記憶機構7用のアドレスを生成し、分離したレ
ジスタすなわち変位レジスタ17Bおよび増分レジスタ
18Bを有する。これらのレジスタは、データ記憶機構
7のアドレスを生成するのに利用できる。アドレス生成
機構5Aについても別に同様の構造が存在し、分離した
変位レジスタ17Aと増分レジスタ18Aを有する。こ
れはデータ記憶機構6に対するアドレスをもたらす。独
立のアドレス生成機構を有する独立のデータ記憶機構は
、その結果または出力を独立にそれぞれデータ・バス1
9または20上に供給する。したがって、いかなるクロ
ック・サイクルにおいても、データ記憶機構6および7
からの2つのオペランドが同時にレジスタ・ファイル9
に提示され、あるいはレジスタ・ファイル9からの2つ
の出力がデータ記憶機構への入力またはレジスタ・ファ
イルへの循環入力として選択される。
これと同時に、2つの分離した出力XおよびYがMAC
Uへの入力として選択され、2つの出力がALUへの入
力として選択され、ALUからの入力がレジスタ・ファ
イルへの同時入力として選択される。
第3A図は、ロード後計算動作の場合の8個のレジスタ
・ファイル9について命令復号レジスタ(IDR)4の
内容の代表例を示す。IDR4内での制御フィールドの
割当ておよび選択される機能が第3A図に示されている
。ALU制御機能はrC= (AとBの演算)」の形の
いくつかの機能を含んでいる。この場合、ALU出力の
結果が、元の入力オペランドA、Bのいずれをも破壊せ
ずに新しいレジスタCに格納される。
アドレス選択および制御用のフィールドは、増分レジス
タまたは増分レジスタ、および選択制御コードに応じ、
2つの異なる値または2つの異なる増分から選択される
固定変位を使用することができる。
MACU制御フィールドは、図の形の8つの指定可能操
作を含む。
第3B図は、記憶後計算動作の場合の8個のレジスタ・
ファイルについての命令復号レジスタの内容の代表例を
示す。この場合、出力記憶選択制御が、第2図に示すよ
うにファイル・レジスタ・アクセス選択機構8Bに与え
られる。
第4図は、IDR4の制御下でレジスタ・ファイル・ア
クセス制御要素(8A、8B、8C112)を動作する
ためのクロックおよび制御回路をより詳細に示し、また
I DR4がアドレス生成機構5Aおよび5B、ALU
IOおよびMACUllをどう制御するかを示す。クロ
ック21は、図のように刻時信号をレジスタ・ファイル
9、アドレス生成機構5Aおよび5B1MACU機構1
1を含めて全ての動作可能機構に同時に供給し、また図
示していないが、この刻時信号は、累算レジスタ15A
、15BをセットするためにMACUの出力に供給され
°、その出力をI DR4中でセットする命令復号論理
回路3にも供給される。
第1図、第2図および第4図に示した要素のアーキテク
チャ配置は、パイプライン式動作モードでも非パイプラ
イン式動作モードでも使用できる。
第5A図は、非パイプライン式動作時のこのアーキテク
チャの動作の場合において、クロック21からの定期的
に発生するパルスによる順序付けを示す。この動作は「
命令取出し」、「命令復号」、命令の実行に必要な「デ
ータの転送」および命令の「計算または実行」の各ステ
ップを含んでいる。
各動作のタイミングは、刻時パルスが所与の刻時期間を
終了して次の刻時期間を開始する境界上にあることがわ
かる。
第5B図は、3段バイブライン式動作モードのタイミン
グと順序付けを示す。この場合、ある命令に対するデー
タ転送と計算は同じ刻時サイクル中に行なわれるが、こ
の命令の復号はその直前の刻時サイクルで行わなれ、更
に1つ前の刻時サイクルでその命令の取出しが行なわれ
ている。
ファイル・レジスタのアクセス制御要素用のレジスタ入
出力選択回路は、たとえばテキサス・インスッルメンツ
社の標準TTL、部品番号54ALS151の8型選択
回路16個を利用して構成できる。第6図は、8行16
列のファイル・レジスタのアレイと見なされるものに対
する1組の制御要素の概略を示す。IDR4の個々の制
御フィールドが復号器22A〜22N内で復号されて、
ゲート論理回路を通り、レジスタ・ファイル9内のレジ
スタエないしレジスタ8の設定を制御する。
ALUとMACUが分離され、同じ刻時サイクルで独立
して同時に動作できるという、上記のアーキテクチャお
よびデータの流れにより、ALU内で実行中の処理とは
独立して乗算および和の累算を行なうことが可能になり
、またその逆も可能になる。このような動作中にALU
の独立した制御が可能になることにより、一般に使用さ
れる多数の信号処理アルゴリズムおよび信号処理装置の
場合に比べて処理能力が少なくとも2倍になる。このデ
ータ流れは実施上いくつかの利点を何する。
第1に、ALUおよびレジスタ・ファイルがデータ流れ
の単精度部分にあり、データ・バスへのインタフェース
は同一のワード長である。加算レジスタと累算レジスタ
だけが積の累算に必要な倍精度をもてばよく、累算レジ
スタの出力は、32ビツト倍精度オペランドではなく単
精度(16ビツト)オペランドとしてデータ流れに取り
込まれる。このデータ流れのアーキテクチャは、ALU
が行なう複雑な制御やマイクロプロセッサのタスクから
、積の累算などの複雑ではないが高精度の信号処理タス
クを分離する。データ流れに対する処理能力の向上は、
MACU機構内で分離して積の和を生成する間に、AL
Uを独立に動作させることによって達成される。この独
立動作は全般的動作の処理能力の向上をもたらすが、こ
れは方程式(A)で表されるタイプの動作で最も明白で
ある。
A (i) CB (j) 十〇 (k)コ 式(A)
式(A)に示すタイプの和を計算する場合、中間の和ま
たは差がALUによって生成され、積の和がMACU内
の加算累算器によって生成される。
式(A)の形の方程式は、偶対称の直線位相フィルタと
奇対称のヒルベルト・フィルタを含む対称インパルス応
答を有するFIRフィルタの出力を計算する際に有用で
ある。このタイプのフィルタを計算する場合、(A)の
形の和は、プロセッサの1サイクルごとに2フイルタ・
タップの有効スループットをもたらす。
第2のデータ記憶機構とデータ・バスをこのアーキテク
チャに追加しても、ALU機能とMACU機能が分離し
て同時に動作可能になっていない限り、処理能力の有意
な向上をもたらさない。
式(A)で示すタイプまたは形の方程式は、計算実行の
ために1サイクルあたり3個のオペランドを使用し、そ
れらのオペランドはデータ・バスの共用によって本明細
書に示すレジスタ・ファイルを介して転送される。2つ
のデータ記憶機構が物理的に分離されているため、それ
らと演算機構との間のデータ転送は、バス1あたり2個
のアドレス・ポインタが必要であり、2つの記憶機構内
でデータ・アレイを編成する際に注意が必要である。通
常は、係数を一方の記憶機構に入れ、データ・サンプル
をもう一方の記憶機構に入れる。しかし、通常の自己相
関の例では、刻時サイクルごとに同じデータ・アレイか
ら2つのサンプルにアクセスしなければならない。この
場合、データは両方の記憶機構に書き込まれる。データ
の編成は、ある動作の実行中にALUがそれ自体のオペ
ランドの一方を重ね書きするかどうかによっても決まる
。ALUがA=A+Bではなく C=A+B型の演算を
実行できる場合には、記憶機構内でのデータの編成はよ
り容易に行なえる。A=A+B型の関数は一方のオペラ
ンドの再ロードを必要とすることがあり、そのため全体
的転送負荷が増大し、処理能力が低下する。このアーキ
テクチャ設計に従って構成されたプロセッサは、本明細
書の「産業上の利用分野」の項で指摘したように、数多
くの能力を備え、ALUとMACUの独立した同時の動
作を可能にして、2重データ記憶機構バスの転送帯域幅
を最大限に活用する。
MACU機構およびALU機構が信号プロセッサ内で分
離して同時に動作する2重データ・バス記憶機構アーキ
テクチャを利用するという趣旨および範囲から逸脱する
ことなく、実施様態における多数の変更が容易に示唆さ
れるはずである。
E0発明の詳細 な説明したように、本発明によれば、従来の信号プロセ
ッサの処理能力を向上させることができる。
【図面の簡単な説明】
第1図は、独立かつ同時に動作可能な分離したALUお
よびMACU機横を有するプロセッサを構成する際の主
要動作部分とその相互接続を示す図である。 第2図は、好ましい実施例で利用される、ALUおよび
MACUのレジスタ・ファイルへの相互接続と、分離し
たアドレス生成経路およびデータ記憶経路を示す、改良
された信号プロセッサの部分の詳細図である。 第3A図は、ロード及び計算動作用の代表的な命令復号
レジスタの形式を示す図である。 第3B図は、記憶及び計算動作用の代表的な命令復号レ
ジスタの形式を示す図である。 第4図は、レジスタ・ファイルと独立のALUおよびM
ACU機構を命令復号論理回路からの制御信号相互接続
および主システム刻時信号と共に組み込んだ、改良され
た信号プロセッサの主要動作要素を示す図である。 第5A図は、非パイプライン構成の好ましい実施例にお
ける命令プロセッサのアーキテクチャの動作タイミング
を概略的に示す図である。 第5B図は、同じアーキテクチャの3段パイプライン・
モードの動作の刻時と順序付けを概略的に示す図である
。 第6図はレジスタ・ファイル内のレジスタの入力選択を
選択復号論理回路と共に示す図である。 4・・・・命令復号レジスタ(IDR)、5・・・・ア
ドレス生成機構、6.7・・・・データ記憶機構、8・
・・・アクセス制御要素、9・・・・レジスタ・ファイ
ル、10・・・・ALUl 11・・・・MACUl 
19.20・・・・データ・バス、21・・・・クロッ
ク。

Claims (9)

    【特許請求の範囲】
  1. (1)システム・クロック、ランダム・アクセス・レジ
    スタ・ファイル、レジスタ・ファイル、アクセス制御手
    段、2つの独立して動作可能なランダム・アクセス・デ
    ータ記憶機構、演算論理機構(ALU)、累積乗算機構
    (MACU)、および前記レジスタ・ファイル・アクセ
    ス制御手段と前記の2つのランダム・アクセス・データ
    記憶機構とに接続された2本の独立して動作可能なデー
    タ・バスを含む信号プロセッサであって、 前記データ記憶機構、前記MACUおよび前記ALUが
    、前記レジスタ・ファイル内の1つまたは複数のレジス
    タに同時にアクセスできるように、前記レジスタ・ファ
    イルが、前記レジスタ・ファイル・アクセス制御手段を
    介して前記データ・バス、前記MACUおよび前記AL
    Uに接続されており、かつ 前記データ記憶機構と前記ALUおよび前記MACUと
    の間のすべてのデータ転送が、前記レジスタ・ファイル
    内に前記データを置くことによって行なわれ、前記デー
    タの所期の受取りにより前記データにアクセスできるよ
    うにした ことを特徴とする信号プロセッサ。
  2. (2)請求項1に記載の信号プロセッサであって、さら
    に、システム・クロックが前記プロセッサ中の刻時され
    る全要素に同時に単一の刻時信号を供給することを特徴
    とする、前記信号プロセッサ。
  3. (3)請求項1に記載の信号プロセッサであって、さら
    に、前記MACUが、並列に接続されかつ前記MACU
    の演算の出力結果を受け取るように接続された、少なく
    とも2個の独立した累算レジスタ手段を有することを特
    徴とする、前記信号プロセッサ。
  4. (4)請求項2に記載の信号プロセッサであって、さら
    に、前記MACUが、並列に接続されかつ前記MACU
    の演算の出力結果を受け取るように接続された、少なく
    とも2個の独立した累算レジスタ手段を有することを特
    徴とする前記信号プロセッサ。
  5. (5)請求項1、請求項2、請求項3または請求項4に
    記載の信号プロセッサであって、さらに、2個の独立し
    たデータ記憶アドレスを生成するための2個の独立した
    データ記憶アドレッシング制御手段を含むことを特徴と
    する、前記信号プロセッサ。
  6. (6)請求項5に記載の信号プロセッサであって、さら
    に、前記データ記憶アドレッシング制御手段が、それぞ
    れ少なくとも2個の指標レジスタと少なくとも2個の変
    位レジスタを含むことを特徴とする、前記信号プロセッ
    サ。
  7. (7)請求項1に記載の信号プロセッサであって、さら
    に、命令記憶機構、前記命令記憶機構に接続された命令
    記憶アドレス制御順序付け手段、および前記命令記憶機
    構に接続された、前記命令記憶機構から命令を受け取っ
    て復号するための命令復号論理手段を含み、さらに、前
    記記憶機構アドレッシング制御手段と前記レジスタ・フ
    ァイル・アクセス制御手段と前記ALUと前記MACU
    に接続された、前記レジスタ・ファイルのデータ入出力
    のためのレジスタ選択の制御と前記ALUおよび前記M
    ACUの機能の制御とを行なうための命令復号出力レジ
    スタ(IDR)を含み、 前記IDRが、少なくとも2個の分離した記憶機構アド
    レス制御フィールド・セグメント、2個の分離したレジ
    スタ・ファイル・データ入力選択制御フィールド・セグ
    メント、4個の分離したレジスタ・ファイル出力制御フ
    ィールド・セグメント、少なくとも1個の分離したAL
    U機能制御フィールド・セグメント、少なくとも1個の
    分離したMACU制御フィールド・セグメントおよびA
    LU結果オペランドの非破壊保存を選択するための少な
    くとも1個の分離した機能制御フィールド・セグメント
    を含む、復号された命令を保持するためのレジスタ・セ
    グメントを有することを特徴とする、前記信号プロセッ
    サ。
  8. (8)請求項7に記載の信号プロセッサであって、前記
    IDRの前記ALU用の制御フィールドが、所定の算術
    制御の選択を指定することを特徴とする、前記信号プロ
    セッサ。
  9. (9)請求項7に記載の信号プロセッサであって、前記
    IDRの前記MACU用の制御フィールドが、所定の算
    術制御の選択を指定することを特徴とする、前記信号プ
    ロセッサ。
JP2248983A 1989-10-23 1990-09-20 信号プロセツサ Pending JPH03138759A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US425150 1989-10-23
US07/425,150 US5175863A (en) 1989-10-23 1989-10-23 Signal data processing system having independently, simultaneously operable alu and macu

Publications (1)

Publication Number Publication Date
JPH03138759A true JPH03138759A (ja) 1991-06-13

Family

ID=23685382

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2248983A Pending JPH03138759A (ja) 1989-10-23 1990-09-20 信号プロセツサ

Country Status (4)

Country Link
US (1) US5175863A (ja)
EP (1) EP0425410B1 (ja)
JP (1) JPH03138759A (ja)
DE (1) DE69033444T2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06149861A (ja) * 1992-11-12 1994-05-31 Nec Corp Dct及び逆dct演算装置並びにその演算方法
US6683470B2 (en) 2000-08-31 2004-01-27 Advantest Corp. DC testing apparatus and semiconductor testing apparatus

Families Citing this family (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6370623B1 (en) 1988-12-28 2002-04-09 Philips Electronics North America Corporation Multiport register file to accommodate data of differing lengths
EP0440452B1 (en) * 1990-01-31 1996-10-09 Hewlett-Packard Company Multiple bus system memory architecture
GB9018990D0 (en) * 1990-08-31 1990-10-17 Ncr Co Register control for workstation interfacing means
US5305446A (en) * 1990-09-28 1994-04-19 Texas Instruments Incorporated Processing devices with improved addressing capabilities, systems and methods
JP2959104B2 (ja) * 1990-10-31 1999-10-06 日本電気株式会社 信号処理プロセッサ
US5588152A (en) * 1990-11-13 1996-12-24 International Business Machines Corporation Advanced parallel processor including advanced support hardware
US5367648A (en) * 1991-02-20 1994-11-22 International Business Machines Corporation General purpose memory access scheme using register-indirect mode
US6343363B1 (en) 1994-09-22 2002-01-29 National Semiconductor Corporation Method of invoking a low power mode in a computer system using a halt instruction
US5507000A (en) * 1994-09-26 1996-04-09 Bull Hn Information Systems Inc. Sharing of register stack by two execution units in a central processor
US5704052A (en) * 1994-11-06 1997-12-30 Unisys Corporation Bit processing unit for performing complex logical operations within a single clock cycle
US5680578A (en) * 1995-06-07 1997-10-21 Advanced Micro Devices, Inc. Microprocessor using an instruction field to specify expanded functionality and a computer system employing same
US5822778A (en) * 1995-06-07 1998-10-13 Advanced Micro Devices, Inc. Microprocessor and method of using a segment override prefix instruction field to expand the register file
US5768574A (en) * 1995-06-07 1998-06-16 Advanced Micro Devices, Inc. Microprocessor using an instruction field to expand the condition flags and a computer system employing the microprocessor
US5822609A (en) * 1995-06-22 1998-10-13 International Business Machines Corporation Processing circuit for performing a convolution computation
US5768553A (en) * 1995-10-30 1998-06-16 Advanced Micro Devices, Inc. Microprocessor using an instruction field to define DSP instructions
US5819080A (en) * 1996-01-02 1998-10-06 Advanced Micro Devices, Inc. Microprocessor using an instruction field to specify condition flags for use with branch instructions and a computer system employing the microprocessor
US5732251A (en) * 1996-05-06 1998-03-24 Advanced Micro Devices DSP with register file and multi-function instruction sequencer for vector processing by MACU
GB2317465B (en) * 1996-09-23 2000-11-15 Advanced Risc Mach Ltd Data processing apparatus registers.
US5870581A (en) * 1996-12-20 1999-02-09 Oak Technology, Inc. Method and apparatus for performing concurrent write operations to a single-write-input register file and an accumulator register
US6674536B2 (en) 1997-04-30 2004-01-06 Canon Kabushiki Kaisha Multi-instruction stream processor
US6507898B1 (en) * 1997-04-30 2003-01-14 Canon Kabushiki Kaisha Reconfigurable data cache controller
US6163836A (en) 1997-08-01 2000-12-19 Micron Technology, Inc. Processor with programmable addressing modes
US6230259B1 (en) 1997-10-31 2001-05-08 Advanced Micro Devices, Inc. Transparent extended state save
KR100303136B1 (ko) * 1997-11-10 2001-11-22 김영환 디지탈신호처리장치를구비한마이크로프로세서구조
US6157996A (en) * 1997-11-13 2000-12-05 Advanced Micro Devices, Inc. Processor programably configurable to execute enhanced variable byte length instructions including predicated execution, three operand addressing, and increased register space
US6367003B1 (en) 1998-03-04 2002-04-02 Micron Technology, Inc. Digital signal processor having enhanced utilization of multiply accumulate (MAC) stage and method
EP0942357A3 (en) 1998-03-11 2000-03-22 Matsushita Electric Industrial Co., Ltd. Data processor compatible with a plurality of instruction formats
EP2267896A3 (en) * 1999-05-12 2013-02-20 Analog Devices, Inc. Method for implementing finite impulse response filters
US6820189B1 (en) 1999-05-12 2004-11-16 Analog Devices, Inc. Computation core executing multiple operation DSP instructions and micro-controller instructions of shorter length without performing switch operation
US7111155B1 (en) 1999-05-12 2006-09-19 Analog Devices, Inc. Digital signal processor computation core with input operand selection from operand bus for dual operations
US6859872B1 (en) 1999-05-12 2005-02-22 Analog Devices, Inc. Digital signal processor computation core with pipeline having memory access stages and multiply accumulate stages positioned for efficient operation
US7107302B1 (en) 1999-05-12 2006-09-12 Analog Devices, Inc. Finite impulse response filter algorithm for implementation on digital signal processor having dual execution units
US6877084B1 (en) 2000-08-09 2005-04-05 Advanced Micro Devices, Inc. Central processing unit (CPU) accessing an extended register set in an extended register mode
US6981132B2 (en) 2000-08-09 2005-12-27 Advanced Micro Devices, Inc. Uniform register addressing using prefix byte
US7433414B2 (en) * 2004-07-26 2008-10-07 Sigma Designs, Inc. Intelligent array radio architecture
WO2011011591A2 (en) * 2009-07-22 2011-01-27 Diba Industries, Inc. Connection assembly comprising barbed tubing connector and shell
US10275247B2 (en) * 2015-03-28 2019-04-30 Intel Corporation Apparatuses and methods to accelerate vector multiplication of vector elements having matching indices

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62290936A (ja) * 1986-06-11 1987-12-17 Toshiba Corp アドレス制御回路
JPS6433672A (en) * 1987-07-29 1989-02-03 Ricoh Kk Cumulative multiplier
JPH01119861A (ja) * 1987-11-02 1989-05-11 Sharp Corp ディジタル信号処理用lsi
JPH01169669A (ja) * 1987-12-25 1989-07-04 Yokogawa Medical Syst Ltd 高速数値演算装置

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4928223A (en) * 1982-10-06 1990-05-22 Fairchild Semiconductor Corporation Floating point microprocessor with directable two level microinstructions
US4766564A (en) * 1984-08-13 1988-08-23 International Business Machines Corporation Dual putaway/bypass busses for multiple arithmetic units
US4713749A (en) * 1985-02-12 1987-12-15 Texas Instruments Incorporated Microprocessor with repeat instruction
US4862392A (en) * 1986-03-07 1989-08-29 Star Technologies, Inc. Geometry processor for graphics display system
JPS63216170A (ja) * 1987-03-05 1988-09-08 Mitsubishi Electric Corp デイジタル信号処理プロセツサ
EP0554917B1 (en) * 1987-06-05 1998-05-06 Mitsubishi Denki Kabushiki Kaisha Digital signal processing system having two instruction memories accessed by a processor under control of host
US5072418A (en) * 1989-05-04 1991-12-10 Texas Instruments Incorporated Series maxium/minimum function computing devices, systems and methods
US4955024A (en) * 1987-09-14 1990-09-04 Visual Information Technologies, Inc. High speed image processing computer with error correction and logging
US4885684A (en) * 1987-12-07 1989-12-05 International Business Machines Corporation Method for compiling a master task definition data set for defining the logical data flow of a distributed processing network
US4949250A (en) * 1988-03-18 1990-08-14 Digital Equipment Corporation Method and apparatus for executing instructions for a vector processing system

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62290936A (ja) * 1986-06-11 1987-12-17 Toshiba Corp アドレス制御回路
JPS6433672A (en) * 1987-07-29 1989-02-03 Ricoh Kk Cumulative multiplier
JPH01119861A (ja) * 1987-11-02 1989-05-11 Sharp Corp ディジタル信号処理用lsi
JPH01169669A (ja) * 1987-12-25 1989-07-04 Yokogawa Medical Syst Ltd 高速数値演算装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06149861A (ja) * 1992-11-12 1994-05-31 Nec Corp Dct及び逆dct演算装置並びにその演算方法
US6683470B2 (en) 2000-08-31 2004-01-27 Advantest Corp. DC testing apparatus and semiconductor testing apparatus

Also Published As

Publication number Publication date
EP0425410A2 (en) 1991-05-02
US5175863A (en) 1992-12-29
DE69033444D1 (de) 2000-03-09
EP0425410B1 (en) 2000-02-02
EP0425410A3 (en) 1992-05-20
DE69033444T2 (de) 2000-09-07

Similar Documents

Publication Publication Date Title
JPH03138759A (ja) 信号プロセツサ
US5872987A (en) Massively parallel computer including auxiliary vector processor
US5226171A (en) Parallel vector processing system for individual and broadcast distribution of operands and control information
EP0075593B1 (en) A bit slice microprogrammable processor for signal processing applications
JP3983857B2 (ja) ベクトルレジスタの複数バンクを用いた単一命令複数データ処理
EP1047989B1 (en) Digital signal processor having data alignment buffer for performing unaligned data accesses
US4594655A (en) (k)-Instructions-at-a-time pipelined processor for parallel execution of inherently sequential instructions
US5261113A (en) Apparatus and method for single operand register array for vector and scalar data processing operations
US5081573A (en) Parallel processing system
US8412917B2 (en) Data exchange and communication between execution units in a parallel processor
US5815723A (en) Picket autonomy on a SIMD machine
US6687810B2 (en) Method and apparatus for staggering execution of a single packed data instruction using the same circuit
US5179530A (en) Architecture for integrated concurrent vector signal processor
US3787673A (en) Pipelined high speed arithmetic unit
EP1124181B1 (en) Data processing apparatus
EP0619557A2 (en) A data processing system and method thereof
US5121502A (en) System for selectively communicating instructions from memory locations simultaneously or from the same memory locations sequentially to plurality of processing
JPS635775B2 (ja)
US5036454A (en) Horizontal computer having register multiconnect for execution of a loop with overlapped code
US5276819A (en) Horizontal computer having register multiconnect for operand address generation during execution of iterations of a loop of program code
WO1992009968A1 (en) VECTOR WORD SHIFT BY Vo SHIFT COUNT IN VECTOR SUPERCOMPUTER PROCESSOR
CN111381880A (zh) 加载-存储指令
US4837678A (en) Instruction sequencer for parallel operation of functional units
US5226128A (en) Horizontal computer having register multiconnect for execution of a loop with a branch
US6728741B2 (en) Hardware assist for data block diagonal mirror image transformation