JPH01501264A - 再帰方程式を高速で処理するベクトル処理装置 - Google Patents

再帰方程式を高速で処理するベクトル処理装置

Info

Publication number
JPH01501264A
JPH01501264A JP63504021A JP50402188A JPH01501264A JP H01501264 A JPH01501264 A JP H01501264A JP 63504021 A JP63504021 A JP 63504021A JP 50402188 A JP50402188 A JP 50402188A JP H01501264 A JPH01501264 A JP H01501264A
Authority
JP
Japan
Prior art keywords
circuit
data
calculation
data storage
vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP63504021A
Other languages
English (en)
Other versions
JPH077389B2 (ja
Inventor
星野 明彦
中谷 彰二
浩二 黒田
哲 河合
Original Assignee
富士通株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 富士通株式会社 filed Critical 富士通株式会社
Priority to JP63504021A priority Critical patent/JPH077389B2/ja
Publication of JPH01501264A publication Critical patent/JPH01501264A/ja
Publication of JPH077389B2 publication Critical patent/JPH077389B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/76Architectures of general purpose stored program computers
    • G06F15/80Architectures of general purpose stored program computers comprising an array of processing units with common control, e.g. single instruction multiple data processors
    • G06F15/8053Vector processors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/11Complex mathematical operations for solving equations, e.g. nonlinear equations, general mathematical optimization problems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/11Complex mathematical operations for solving equations, e.g. nonlinear equations, general mathematical optimization problems
    • G06F17/13Differential equations

Abstract

(57)【要約】本公報は電子出願前の出願データであるため要約のデータは記録されません。

Description

【発明の詳細な説明】 再帰方程式を高速で処理するベクトル処理装置技術分野 本発明はデータ処理システムに関し、特に再帰方程式を高速で処理するためのベ クトル処理装置に関する。
背景技術 最近のコンピュータ技術における目ざましい進歩は、例えばベクトル処理装置を 提供することによってスーパーコンピュータの演算速度を向上させてきた。これ らベクトル処理装置は科学計算を実行するために使用される。例えば−次方程弐 の数値解法や微分方程式の数値解法を高速で行うために使用される。
科学技術計算においては、次のような再帰演算アルゴリズム(または再帰方程式 )を頻繁に使用して一次方程式の数値解法を行ったり、差分法によって微分方程 式を解く。
ai ==a、−,Xbi 十ci ・・・(1)但し、i=1 、2 、3  、・・・、nこの演算アルゴリズム(1)は、データai とデータai−1の 再帰関係を示す、一般に、上記再帰方程式の演算は、ベクトル処理装置による高 速の計算には適していない。これはデータa8−1が再使用されてデータaiを 計算するからである。
すなわちデータaiは項a i−1の計算の後で計算しなければならないためで ある。従って従来のベクトル処理装置は、高速で再帰方程式を計算することがで きない。再帰方程式を扱うために使用される従来のベクトル処理装置については 図面を参照して後述する。
それにもかかわらず、ベクトル処理装置を使用して高速で再帰方程式を計算する ことに対する要求は強い。これは多くの再帰方程式が科学技術計算分野で使用さ れるがらである。
発明の開示 本発明の目的は再帰方程式を高速で処理できるベクトル処理装置を提供すること である。
本発明の他の目的は、容易に構成できる簡単な回路構成を有するベクトル処理装 置を提供することである。
本発明の提供するベクトル処理装置は、ベクトル命令を制御するためのベクトル 命令制御ユニットと、主記憶ユニットにおける入力ベクトルデータと計算された データとをアクセスするためのベクトル記憶アクセスユニットと、前記ベクトル 命令制御ユニットの制御下においてベクトルデータを計算するためのベクトル計 算ユニットと、前記ベクトルデータアクセスユニットと前記ベクトル計算ユニッ トとの間でデータを転送するためのデータ分配ユニットとを備え、前記ベクトル 処理装置が、少なくとも1個の奇数項計算回路と少な(とも1個の偶数項計算回 路とを有するベクトル計算ユニットと、前記ベクトル計算ユニットに作動的に接 続されそれと協働するデータ分配ユニットとを備えることにより、変形された再 帰方程式を処理することを特徴とする。各奇数項計算回路は、変形された再帰方 程式の各奇数項を計算するように構成され、加算回路と、乗算回路と、計算した 奇数項を保持する少なくとも1個のデータ記憶回路と、前記データ記憶回路を介 して前記乗算回路、および/または、前記加算回路に前記計算した奇数項をフィ ードバックするための少なくとも1本のフィードバック線を備える。各偶数項計 算回路は、再帰方程式の偶数項を計算するように構成され、他の加算回路と、別 の乗算回路と、計算された偶数項を保持する少なくとも1個の他のデータ記憶回 路と、前記他のデータ記憶回路を介して前記他の乗算回路、および/または、前 記側の加算回路に前記計算した偶数項をフィードバックするための少なくとも1 本のフィードバック線を備える。前記データ分配ユニットは、0を出力するため の第1のデータ設定器と、1を出力するための第2のデータ設定器と、前記設定 器からの定数データ0および1と計算された奇数項および偶数項とを使用して再 帰方程式を計算するための入力オペランドを選択する第1〜第6セレククと、変 形された再帰方程式によって規定される所定の方法において前記セレクタを制御 するためのセレクタ制御回路とを備え、選択されたデータを前記奇数項および偶 数項計算回路へ供給する。
式(1)によって表される再帰方程式は、−次漸化すると次の式のように変形で きる。
a、=ai−1xb、+C。
”” (Cat−t xbi−+)+ CH−1)xbf + CB −= a i−z X bt−+ X bi + bi X Ci−+ + C; ”’  (2)添字iが偶数、例えば偶数の添字に=2 、4 、6の場合、at ”” a6 XblXbz +b2 XCI +C1a 4 =az Xb 3 Xb a + ba XC3+ C4ah ”=a4Xb5 Xba +ba XCs  +Cb ”’ (3)添字iが奇数、例えば奇数の添字j=1.3,5.7の 場合、 ar ””an Xbl X1+IXc+ 十〇as =aIxb、 Xb3  +b3 XC2+C3as ””ax xb4xb5+b5 XCa +c5a フ=as xbh Xbt +bt XCb +C7・・’ (4)ここで各項 a2とao、a4と”2、abとa4の間には直接の再帰関係がないことに注意 すべきである。同様に、項a3とalsasとan、affとa5との間にも直 接の再帰関係がない。従って奇数項計算回路は、奇数項ajの計算を直接再帰に よって遅延なしに行うことができる。また偶数項計算回路は、偶数項akの計算 を直接再帰による遅延なしに行うことができる。このため再帰方程式の高速計算 に寄与する。
図面の簡単な説明 第1図は、本発明のベクトル処理装置を含む高速データ処理システムを示すブロ ック図、 第2図は、第1図に示したデータ処理システムに使用される汎用ベクトル処理装 置を示すブロック図、第3図は、従来のベクトル処理装置を示す回路図、第4図 は、第3図に示したベクトル処理装置の動作タイミング図、 第5図は、本発明に基づくベクトル処理装置の一実施例を示す回路図、 第6図は、第5図に示したベクトル処理装置の動作タイミング図、 第7図は、本発明に基づくベクトル処理装置の別の実施例を示す回路図、および 第8図は、第7図に示したベクトル処理装置の動作タイミング図、である。
発明を実施するための最良の形態 本発明に基づくベクトル処理装置の好適実施例を説明する前に、ベクトル処理装 置を備えた高速データ処理システムを第1図を参照して説明する。
第1図において、高速データ処理システムは、主記憶ユニッ)(MSU)1と、 主記憶制御ユニッl−(MSCU) 2と、入出力(Ilo)処理ユニット3と 、スカラデータ処理ユニット(スカラ処理装置)4と、ベクトルデータ処理ユニ ット(ベクトル処理装置)5とを備える。I10処理ユニット3は、計算される データを入力すると共に、スカラ処理装置4、および/または、ベクトル処理装 置5において計算されたデー夕を出力する。MSU 1はこれら入力データと計 算されたデータとを格納する。スカラ処理装置4は全ての計算を制御する。
演算コマンドがスカラ演算に関連する場合は、スカシ処理装置4自体がスカラデ ータの計算を実行する。演算コマンドがベクトル演算に関連する場合は、スカラ 処理装置4は制御をベクトル処理装置5に移し、ベクトル処理装置5においてベ クトル計算が実行される。すなわちベクトル処理装置5は、ベクトル計算が要求 される場合にスカラ処理装置4によってトリガされ、当該ベクトル計算を実行す る0M5Cυ2は、MSU1とI10処理ユニット3とスカラ処理装置4とベク トル処理装置5とのデータの流れを制御する。
第1図に示したベクトル処理装置5の全体構成を第2図に示す、第2図において ベクトル処理装置5は、デコーダと制御レジスタとを有するベクトル命令制御ユ ニット(VICU)51と、ベクトルアドレス発生器とアクセスデータ処理装置 とベクトルレジスタユニットとを有するベクトル記憶アクセスユニット(VSA U)52と、データ分配ユニット54と、加減算ユニット55と乗算ユニット5 6と除算ユニット57とを有するベクトル計算部とを備える。 VIC551は スカラ処理装置5からデータ制御命令を受け取る。その制御レジスタは前記デー タ制御命令の制御データを格納する。前記デコーダは前記データ制御命令を復号 する。VSAU52は、MSCU 2およびデータ分配ユニット54を介して、 MSU iとベクトル計算部との間でデータを転送する。前記ベクトルアドレス 発生器は、復号された命令に基づきMSU I内のデータをアクセスするための アドレスを発生する。前記アクセスデータ処理装置は、MSLI 1とベクトル レジスタユニットとの間のデータを制御する。ベクトル計算に使用されるデータ は、まずベクトルレジスタユニットに格納される。また、ベクトル計算部におい て計算されたデータは、ベクトルレジスタユニットに格納される。データ分配ユ ニット40は、ベクトルレジスタユニットからのデータを分配し、それを復号さ れた命令に基づいて加減算ユニット55と乗算ユニット56と除算ユニット57 とに供給する。
これらユニット55 、56 、57は動作接続されており、ベクトル計算を行 う。ベクトル計算されたデータは、データ分配ユニット40を介してベクトルレ ジスタユニットに格納され、その後MStl 1に格納される。
従来のベクトル処理装置を第3図および第4図を参照して説明する。第3図は、 前記した再帰方程式を処理するための基本的な回路図を示す、第4図は第3図に 示したベクトル処理装置の動作タイミング図である。
第3図において、ベクトル処理装置は、セレクタ30と、レジスタ14 、15  、16と、乗算回路17と、レジスタ18 、19と、加算器110と、レジ スタ112と、レジスタ112の出力端子とセレクタ30の入力端子との間に接 続されたフィードバック線31とを備える。これら回路構成要素は第3図に示し たベクトル計算部の一部である0乗算回路17はa、−IXb=の項を計算する 。加算器110はC4と乗算回路17からの結果とを加算する。一方において、 この加算されたデータはフィードバック線31とセレクタ30とレジスタ15と を介して乗算回路17にフィードバックされて次の項の計算に使用され、他方に おいてベクトルレジスタユニットに出力される。
セレクタ30は最初に初期ベクトルデータa0を出力する。
レジスタ14 、15 、16とレジスタ18 、19とレジスタ112とは、 前記データを各々保持するように設けられている。レジスタ112とフィードバ ック線31とは、計算されたデータa1をレジスタ15にフィードバックして次 の項ai*1 を計算するように設けられている。
ここで、減算および除算は再帰方程式の計算に必要ないので、減算回路および除 算回路は第3図から省略されている。
第3図に示したベクトル処理装置の動作を第4図を参照してさらに詳細に説明す る。
再帰方程式の添字を示す整数iが1であれば、再帰方程式は次のように表される 。
al ””a@ xb、+C+ このため動作サイクル01においては、初期データCI +ao、btが第2図 に示したベクトルレジスタユニットからレジスタ14 、15 、16にロード される。次に(aoXb+)の計算が乗算回路17において実行される。動作サ イクル02において、レジスタ14にロードされたデータC,がレジスタ18に 転送される0乗算回路17において計算されたデータはレジスタ19に転送され る。従って加算器110はデータc1とレジスタ19に格納されたデータとを加 算し、結果a、を得る・動作サイクル03において、結果a1はレジスタ112 に格納され、次にデータ分配ユニット54を介して第2図に示したベクトルレジ スタユニットに出力される。
動作サイクル04において、次のベクトルデータb2+C1がベクトルレジスタ ユニットを介してレジスタ16 、14にロードされる。同時に、レジスタ11 2に格納されているデータa。
がフィードバック線31とセレクタ30とを介してレジスタ15にロードされる 。動作サイクル04〜06において次の項at ”al XJ +Czの計算が 実行される。
同様に、動作サイクル07〜09において項a、=azxb。
+c、の計算が実行される。動作サイクル10〜12では項a4−a3 xb4 +Caの計算が実行される。動作サイクル13〜15では項a5 =aa xb 、 十csの計算が実行される。
前記したように、一つの項a、を得るための計算時間は3つの動作サイクルを必 要とする。100項のベクトル処理が必要の場合、100の再帰方程式の計算デ ータを得るために300の動作サイクルが必要である。従って再帰方程式、特に 高次再帰方程式を計算するための高速動作が従来のベクトル処理装置では実現で きない。
この欠点は、項aiの計算が直前の項a、−1の計算の後に実行されなければな らないという再帰関係の故である。このため従来のベクトル処理装置は、次の項 の計算を進める前に直前の項を計算するためのアイドル時間を生ずる。従って、 ベクトル処理装置が前記再帰方程式を正確に解くことができても、このベクトル 処理装置は前記低速演算の欠点を逃れられない。
本発明は再帰方程式を変形することによって前記欠点を解決する。
前記した再帰方程式は次のように変形可能である。
ai *3.−、xbi +ci = (al−z xbi−、+ct−,)Xbi+c。
= (aH−z xbi−1xb、)+b6 XC1−+ +C+ ”’ (2 )但し、iは整数であり添字i=1 、2 、3s−、nを表し、hは計算され たベクトルデータであり、b、は入力ベクトルデータであり、 C8は入力ベクトルデータである。
第(2)式から、項a、と他の項a、−2との間番二しま項a。
と他の項ai−+ との間のような直接再帰関係のなし)こと力<ヤ1かる。前 記第(2)式に基づき項aiの計算器よ、直ロゴの項a 6−+の計算に影響さ れない0項a i−zは項a、の2段階前に計算されており、項ai は直前の 項a、−3の8+算Gこよる遅延なしに実行することができる。しかしながら前 記概念しよ奇数項と偶数項とを別々に演算しない限り実現できなし)。
添字iが偶数であれば、偶数添字kを使用して前記第(2)式は次のように表さ れる。
k”’2 : az =C6xb、 ×bz +bz Xc、+C2に=4 :  C4=a、xb、xb、+bn XC,+C4に=6 : C6=C4xb、  xb6 +b6 XCs +Ch添字iが奇数であれば、奇数添字jを使用し て前記第(1)式は次のように表される。
j=1 : al =a、Xb、xl+1xc、+OJ =3 : C3=aH xbZ xb、+b3 Xcz +ciJ=5 : C5=C3xba xb、 + C5XCa + C5例えば項a0とat、項a2とC4、項a4とab、 項a。
とC3、または項a、とa、との間には、項a0とa、とを除いて直接の再帰関 係がないので、1対の項、例えばC3とC4とは平行に計算できる。これにより 高速のベクトルデータ計算が可能となる。しかしながら項a、とC4の計算は項 at とC2の計算の後に実行されなければならない。
本発明に基づくベクトル処理装置の第1実施例を第5図に基づき詳細に説明する 。
第5図においてこのベクトル処理装置は、データ分配回路40aと、奇数項計算 回路10Aおよび偶数項計算回路10Bからなるベクトルデータ計算ユニットと を備える。
データ分配回路40aは、第2図に示したベクトルレジスタユニットと奇数項計 算回路10Aと偶数項計算回路10Bとに設けられ、奇数項および偶数項計算回 路10A 、 IOBに初期オペランド(データ)aOとオペランド(人力ベク トルデータ)bi+ci とを後述の所定の方法で供給する。またデータ分配回 路40aは、奇数項計算回路10Aにおいて計算された奇数項データajと、偶 数項計算回路10Bにおいて計算された偶数項データakとを受け取り、これら をベクトルレジスタユニットに出力する。
データ分配回路40aは、セレクタ制御回路41aと、オペランドb+をファー ストイン・ファーストアウト(FIFO) Bバ°ツファ(B−BtlFF)と 、オペランドCiをFIFOバッファであるCバッファ(C−BOFF)とを備 える。またデータ分配回路40aは、セレクタ46A 、 47A 、 48A  、 46B 、 47B 、 48Bを含む。データ分配回路40aはさらに 、セレクタ46A 、 46BにOを出力するためのゼロ(0)設定器(図示せ ず)と、セレクタ47A。
48A 、 47B 、 48Bに1を出力するための1設定器(図示せず)と を備える。
奇数項ajを計算するための奇数項計算回路10Aは、第1段レジスタ14A  、 15A 、 16Aと、乗算回路17Aと、第2段レジスタ18A 、 1 9Aと、加算器110Aと、第1段レジスタ14Aと、第4段レジスタ112A と、レジスタ19Aの出力端子とセレクタ48Aの入力端子との間に接続された 第1フイードバツク線21 Aと、レジスタ112Aの入力端子とセレクタ46 Aの入力端子との間に接続された第2フイードバツク線22Aと、レジスタII Aの出力端子とセレクタ47Aの入力端子との間に接続された第3フイードバツ ク線23Aとを備える。計算された奇数項ajはレジスタ111Aからベクトル レジスタユニットに順次に出力される。
レジスタIIA、および/または、112Aはデータ分配回路40aに含めるこ ともできる。
偶数項a、を計算するための偶数項計算回路10Bは、奇数項計算回路10Aと 同一の回路構成を有する。これは演算アルゴリズム自体がどちらも同じだからで ある。奇数項および偶数項計算回路10A 、 IOBは同一の構造を有するこ とができるので、それらの製造およびプリント回路基板(PCB)への搭載は極 めて簡単である。奇数項および偶数項計算回路10A。
10Bは、独立して同時に動作可能である。
第5図に示したベクトル処理装置の動作を説明する。
オペランドai、C4および初期オペランドa0があらかじめ第1図に示したM SU 2内に格納されており、スカラ処理装置4において以下に示すような命令 セントが検出されると、スカラ処理装置4は動作の制御を第5図に示したベクト ル処理装置に移し当該ベクトル処理装置をトリガする。
第1表 VL A(0) To νROO VL B(1) To VROI VL C(t) To VRO2 VCAL A(i) = A(i−1) XB(1) +C(i)VST A( i) To VROO ここでVLはベクトルロード命令を表し、VCALはベクトル計算命令を表し、 VSTはベクトル格納命令を表す、 A(i)。
B (i) 、 C(i)はai 、b、+Ciに対応する。 VROO、VR OI 。
VRO2は、第2図に示したベクトルレジスタユニット内のベクトルレジスタ0 0 、01 、02を表す、なお本実施例において、各ベクトルレジスタは10 0ワードの記憶容量を有する。
まず第2図に示すベクトル記憶アクセスユニット(VSAU)52は、前記ベク トルロード命令に応じて、第2図に示すベクトル命令制御ユニッ) (VICU )51の制御下で、主記憶ユニット(MSU) 1に格納されているベクトルデ ータaO+b+ ・・・blOoとcl・・・C1゜。とを主記憶制御ユニ・ノ I−(MSCU) 2を介してベクトルレジスタユニットのベクトルレジスタV ROO、VROI 。
VRO2にロードする。
前記ベクトルデータロードの間、第5図に示した回路Gこおける再帰方程式a、 =a、−,Xb、+Ciの計算と、計算されたデータatのベクトルレジスタV ROOへの格納とが、前記ベクトル計算命令およびベクトル格納命令とに応じて VICti51の制御下で実行される。
ベクトルレジスタVROO内の計算されたデータaiは前記演算中にMSU 1 に格納できる。
第5図の回路の動作の詳細を第6図を参照して説明する。
計算は初期項al+azを計算するための初期項計算と、それに続く、例えば、 a、とaa+asとal等を計算するための通常項計算とからなる。
まず初期項計算を説明する。
次の第2表および第3表は、セレクタ制御回路40bの制御下でレジスタ14A  、 15A 、 16A 、111Aおよびレジスタ14B。
15B 、 16B 、IIIBにロードされるデータを示す。
第2表 演 算 REG REG REG REG04 0 ao xb、 +c、1 06a。
第3表 演 算 REG REG REG REG04 C2ao xl)、 +c、b zデータ分配回路40aは、その中に初期オペランドaO+bt、c+をロード し、オペランドb1およびc、をB−BLIFF42とC−BUFF43とに各 々格納する。
肩】≧妹仁久四」」− 演算サイクル01において、セレクタ制御回路41aはセレクタ46A 、 4 7A 、 48Aを制御して奇数項計算回路10A内のレジスタ14A 、 1 5A 、 16AにオペランドCH+ 1)+ r aOを出力する。これらレ ジスタ14A 、 15A 、 16Aは、前記オペランド’l + bI +  aoを格納する。同時に、セレクタ制御回路41aはセレクタ46B 、 4 7B 、 48Bを制御して偶数項計算回路10B内のレジスタ14B 、 1 5B 、 16BにオペランドCI+bl+a0を出力する。これらレジスタ1 4B 、 15B 、 16Bは、やはり前記オペランドao 、bI +CI を格納する。
奇数項計算回路10Aでは、レジスタ16Aが格納したオペランドa0を被乗数 として乗算回路17Aに出力し、レジスタ15AがbIを乗数として乗算回路1 7Aに出力する。これにより乗算回路17Aは(aoXb+)を計算する。
同時に偶数項計算回路10Bでは、レジスタ16Bが格納したオペランドa0を 被乗数として乗算回路17Bに出力し、レジスタ15B#(blを乗数として乗 算回路17Bに出力する。これにより乗算回路17Bは(a6 X b +)を 計算する。
艮】」シ仁久四追」ユ 奇数項計算回路10Aでは、乗算回路17Aにおいて計算されたデータ(aoX b+)がレジスタ19Aに転送されて格納される。レジスタ14Aに格納されて いるデータC1はレジスタ18Aに転送されて格納される。
同時に偶数項計算回路10Bでは、乗算回路17Bにおいて計算されたデータ( a(IXb+)がレジスタ19Bに転送されて格納される。レジスタ14Bに格 納されているデータC,はレジスタ18Bに転送されて格納される。
次に奇数項計算回路10Aにおいて、加算器110Aがデータ(aoxb+)と データc、とを加算する。この結果、次のような第1の奇数項が得られる。
aH=ao xl)、+C+ この時同時に同様の方法で、偶数項計算回路10Bでしょ前言2第1の奇数項a 、が加算器110 Bによって得られる。
遺夏並並久上立主 奇数項計算回路10Aにおいて、計算された第1の奇数項alがレジスタ111 Aに転送されて格納される。
偶数項計算回路10Bでは、計算された第1の奇数項al力くレジスタ111B に転送されて格納される。
前記演算中にデータ分配回路40aは、ベクトルレジスタVROI 、 VRO 2からB−BUFF42 、 C−BUFF43ニオペランド(b2 。
b、、ba)および(Ct * C3r ca)を各々ロードする。
第1の奇数項alを得たものの、データ分自己回路40aLよこの時点ではそれ をベクトルレジスタVROO&こ出力しなし)。これは第1の偶数項a2が得ら れていないからである。
゛ サイクル04〜06 偶数項計算回路10Bにおいて第1の偶数項a2力く得られ5るまで、奇数項計 算回路10Aとデータ分配回路40aと番よ協(妨してデータa、をそのままに 保持し、第2の奇数項a、を8を算するために使用されるオペランドを準備する 。
演算サイクル04において、セレクタ制御11回路41auまセレクタ46A  、 47A 、 48Aを制御してレジスタ14Aにゼロデータをセットし、計 算された第1の奇数項a+をレジスタ111人およびフィードバック線23Aを 介してレジスタ15A&こ設定し、データ1をレジスタ16Aに設定する。この 結果、演算サイクル04において乗算回路17Aは(alXl)を計算し、演算 サイクル06において加算器110Aはレジスタ19Aからのデータ(atX1 )とレジスタ18Aからのゼロ(0)とを加算する。すなわち次のダミー計算が 実行される。
at = (at X 1 ) +0 前記演算中に、演算サイクル05においてセレクタ制御回路41aは、セレクタ 47A 、 48Aを制j11シてレジスタ15Aにオペランドb3を設定し、 レジスタ16Aにオペランドb2を設定する。データal は演算サイクル05 においてレジスタ111Aに転送され、さらに演算サイクル06においてレジス タ112Aに格納される。
偶数項計算回路10Bにおいては、次の第1偶数項a2が、そこで計算されレジ スタ112Bに退避されている第1奇数項aiを使用して計算される。
ax = (at Xbz) 十cz この目的のため、演算サイクル04においてセレクタ制御回路41aは、セレク タ46B 、 47B 、 48Bを制i1して1zジスタ14Bにオペランド C,を設定し、レジスタ111Bに退避された第1奇数項a、をフィードバック 線23Bを介してレジスタ15Bに設定し、オペランドb、をレジスタ16Bに 設定する。
演算サイクル05において、第1偶数項a2が加算器110Bに得られ、演算サ イクル06において第1の偶数項a、がレジスタ111Bに退避される。
データ分配回路40aは、一対の第1奇数項および偶数項a Hr a zをレ ジスタIIIA、IIIBからベクトルレジスタVROOに転送する。
初期項計算はこれで完了する。
次に通常項計算を説明する。
・′ サイクル03〜09 まず、奇数項計算回路10Aにおける第2奇数項a3の計算を説明する。
第2奇数項a、は以下に示す方程式によって定義されるので、セレクタ制2+’ B回路41aはセレクタ46A 、 47A 、 48Aを制御して、第4表に 示すようなデータを、第4表に示すような演算サイクルにおいて、レジスタ14 A 、 15A 、 16Aにロードする。
as =a、X (b、Xb、)+b、xC= +c=第4表 演 算 REG REG REG 05 b 3 b 2 07 bs x(、+c:+ at b、 Xt)+演算サイクル03において 乗算値(bsXcz)が乗算回路17Aに得られる。演算サイクル05において 合計(b、×C2)+C3が加算器110Aに得られる。演算サイクルO5にお いて乗算値(bzxb3)が乗算回路17Aに得られる。演算サイクル07にお いて乗算値(a、xb、Xb、)が乗算回路17Aに得られる。演算サイクル0 8において計算されたデータ(a、xb、Xb、)が加算器110Aに供給され る。前記第2奇数項a、は加算器111Aで得られる。計算された第2奇数項a 、は演算サイクル08においてレジスタ111A&こ退避される。演算サイクル 09においてレジスタ111Aに退避されている第2奇数項a、がベクトルレジ スタVROOに転送されレジスタ112Aに格納される。
前記において、レジスタ112Aに格納されたデータa、lよフィードバック線 22Aを介してレジスタ15Aにフィードツマ・ツクされる。またレジスタ19 Aに格納されたデータ(bz xbz)はフィードバック線21Aを介してレジ スタ16Aにフィードバックされる。レジスタ111Aに格納された合計(b3 ×(Z)+C,はフィードバック線23Aを介してレジスタ14A&こフィード バックされる。
同様に、次のような第2偶数項a4が偶数項計算回路10Bに得られる。
a4 =az X b3 X b4+ ba X C3+Caセレクタ制御回路 41aは同様にセレクタ46B 、 47B 、 48Bを制御して次の第5表 に示すデータをレジスタ14B 、 15B 。
16Bにロードする。
第5表 演 算 REG REG REG 05 b a b 3 07 c3Xtz+c4ax b3Xb4演算サイクル09において奇数項およ び偶数項ax+aaがベクトルレジスタユニット内のベクトルレジスタVROO に転送される。
“ サイクル06〜12 同様に、演算サイクル06〜12において、次の第3奇数項および偶数項as+ 36が奇数項および偶数項計算回路10A。
10Bに得られる。
a5−as xb4xb、 十bs ×Ca +csah ”a4xb5×bb  +bbXCs +Cb前記計算を実行するため、セレクタ制御回路41aはセ レクタ46A 、 47A 、 48A 、 46B 、 47B 、 48B を制御して第6表および第7表に示すようなデータをレジスタ14A 、 15 A 、 16A。
14B 、 15B 、 16Bにロードする。
第6表 演 算 REG REG REG ヱコ」と火 14A −ユIM 06 c 、 b 5c a Q3 b 、 b。
10 C4Xbs +cs a3b4 Xbs第7表 演 算 REG REG REG os b 、 b 。
10 Cs ×bb +Cb aa b、 xb。
演算サイクル11において奇数項a、およびa、が加算器111A、IIIBに 得られ、それらはベクトルレジスタVROOに転送される。
他の複数の対の奇数項および偶数項も前記と同様の方法で得られる。
一対の奇数項および偶数項の計算は、第1の奇数項および偶数項の計算を除いて わずかに3演算サイクルを必要とするだけである。第1の奇数項および偶数項の 計算は、従来のベクトル処理装置のサイクル数と同数のサイクル数を要する。
第5図に示したベクトル処理装置によれば、初期計算を除いて、3演算サイクル において2倍のデータを得ることができる。このため第5図に示すベクトル処理 装置は、再帰方程式の多(の項を計算する場合、従来のベクトル処理装置に比較 して計算能力が2倍である。
本発明に基づくベクトル処理装置の他の実施例を第7図を参照して説明する。
第7図において、ベクトル処理装置は、データ分配回路40bと、奇数項計算回 路10AAおよび偶数項計算回路10BBを有するベクトルデータ計算ユニット とを備える。
データ分配回路40bは、第2図に示したベクトルレジスタユニットと奇数項計 算回路10AAと偶数項計算回路108Bとに設けられ、初期オペランドa0と オペランド(入力データ)b、、ciとを奇数項および偶数項計算回路10AA  、 IQBBに後述の所定の方法で供給する。またデータ分配回路40bは、 奇数項計算口11(lAaにおいて計算された奇数項データajと、偶数項計算 回路108Bにおいて計算された偶数項データakとを受け取り、これらをベク トルレジスタユニットに出力する。
データ分配回路40bは、セレクタ制御回路41bと、B−BUFF42と、C −BUFF43と、バッファレジスタ51A 、 52Aと、セレクタ53A  、 54A 、 55Aと、レジスタ51B、52Bと、セレクタ53B 、  54B 、 55Bとを備える。またデータ分配回路40bはゼロ設定器と1設 定器とを備える(図示せず)、。
奇数項計算回路10AAは、第1段レジスタ14A 、 15A 、 16Aと 、乗算回路17Aと、第2段レジスタ18A 、 19Aと、加算器110Aと 、第3段レジスタ111Aと、レジスタIIIAの出力端子とレジスタ51Aの 入力端子との間に接続されたフィードバック線24Aとを備える。
偶数項計算回路108Bは、奇数項計算回路10AAと同一の回路構成を有する 。
第7図に示すベクトル処理装置は、第(2)式によって定義される再帰方程式を 計算する。奇数項計算回路10AAとデータ分配回路40bとは協働して第(4 )式によって定義される再帰方程式を計算し、偶数項計算回路108Bとデータ 分配回路40bとは、やはり協働して第(3)式によって定義される再帰方程式 を計算する。
第7図に示したベクトル処理装置の動作を、第1表に示すような命令セットが与 えられる場合について、第8図を参照して詳細に説明する。
第2図に示したMSU 1 、 MSCU 2 、 VICU51、およびVS AU52(7)動作は、前記したものと実質的に同一なので省略する。
第8図において協働サイクルは、初期演算サイクル01〜08と、通常演算サイ クル04〜11 、10〜14などである。
遣夏並土り土■二邸 次の第8表および第9表は、初期演算サイクルにおけるレジスタ14A 、 1 5A 、 16A 、IIIA内のデータとレジスタ14B。
15B 、 16B 、IIIB内のデータとを示す。
第8表 演 算 REG REG REG IIIEG06 blXO+cl IXao +Olxb、+Q演 算 REG REG REG REG06 c、×bt+ ct IXa、+Ob、Xb、+08a2 セレクタ制御回路41bはセレクタ53A 、 54A 、 55Aを制御して 第8表に示すようにデータをレジスタ14A 、 15A 、 16Aにロード する。またセレクタ制御回路41bはセレクタ53B。
54B、55Bを制御して第9表に示すようにデータをレジスタ14B 、 1 5B 、 16Bにロードする。
まず奇数項計算回路10AAにおける項ajの計算を説明する。
遺豆孟圧えy立上 データO,bl、1がレジスタ14A 、 15A 、 16Aにロードされ、 (blX1)の計算が乗算回路17Aにおいて実行される。
慎】」2−υと釘1 データO,(bl Xi)がレジスタ18A 、 19Aにロードされ、これら データが加算器110Aにおいて加算されて結果(blX1+0)が得られる。
同時にデータCI + bl r Oがレジスタ14A 、 15A 、 16 Aにロードされ、(bl xo)が乗算回路1.7Aにおいて実行される。
蓬夏丈不又土立主 データ(b、xi+o)がレジスタ111Aに格納される。
レジスタ18Aに格納されたデータC6とレジスタ19Aに格納されたデータ( bl xo)とは加算器110Aにおいて加算され、結果(brXO+c+)が 得られる。同時にデータ0゜ao 、1がレジスタ14A 、 15A 、 1 6Aにロードされ、(a。
×1)の計算が乗算回路17Aにおいて実行される。
且夏丈土又)LtQ土 レジスタ111Aに格納されたデータ(b+xx+o)がレジスタ51Aに転送 される。レジスタ18Aに格納されたデータ0とレジスタ19Aに格納されたデ ータ(aoXl)とは加算器111Aにおいて加算され、結果(ao xl+O )が得られる。
遣l土不久四■エ データ(bl X1+CI)とデータ(b + X O+ c +)とは、レジ スタ51’A 、 52Aに各々順次にロードされる。データ(aOx 1 + o)はレジスタ111Aに格納される。
揮】」」シ偲ヒ灸旦 レジスタIIIAに格納されたデータ(aoX1+o)はレジスタ15Aに転送 され、レジスタ52Aに格納されたデータ(blX1+o)はレジスタ16Aに 転送される。この結果、データ(ao X 1 + O) X (I X bl  + O)が乗算回路17Aに得られる。レジスタ51Aに格納されたデータ( b、XQ+C+)はレジスタ14Aにロードされる。
遺1」」シソに彰エ レジスタ14Aからのデータ(b r X O+ c + )はレジスタ18A にロードされる。
レジスタ18Aに格納されたデータ(blxo+cυとレジスタ19Aに格納さ れたデータ(a o X 1 + O) X (I X b I+0)とは加算 器110Aにおいて加算され、次のような結果データを得る。
(ao X1+O)X (IXbl +O)+ (bl XO+CI)=;36  xb、+C+ 箇】巳し仁久四刈」− 計算されたデータa、はレジスタ111Aに格納されベクトルレジスタVROO に転送される。
次に偶数項計算回路108Bにおける項a、の計算を第9表を参照して説明する 。
° サイクル 1 データO,bz、b+がレジスタ14B 、 15B 、 16Bにロードされ 、(blxbz)の計算が乗算回路17Bにおいて実行される。
撰2+シし賢史2 データO、(bl Xbz)がレジスタ18B 、 19Bニo −)−サれ、 これらデータが加算器110Bにおいて加算されて結果(bl ×bt+o)が 得られる。同時にデータcz l CI +btがレジスタ14B 、 15B  、 16Bにロードされ、(C,Xbi)が乗算回路17Bにおいて実行され る。
11丈土り土立主 データ(bl ×bz+0)がレジスタ111 Bに格納される。
レジスタ18Bに格納されたデータc2とレジスタ19Bに格納されたデータ( CIXbz)とは加算器110Bにおいて加算され、結果(c、xb、+c、) が得られる。同時にデータO1a、、1がレジスタ14B 、 15B 、 1 6Bにロードされ、(a。
×1)の計算が乗算回路17Bにおいて実行される。
演】コし仁え四」」エ レジスタ111Bに格納されたデータ(bl xbz +O)がレジスタ51B に転送される。データ(c+ Xbz +cz)がレジスタ111Bに転送され る。レジスタ18Bに格納されたデータ0とレジスタ19Bに格納されたデータ (aoX1+o)とは加算器110Bにおいて加算され、結果(aox1+o) が得られる。
撰1」」シυh史i データ(C1Xbz +cz)とデータ(bl Xb2+0)とはレジスタ51 B、52Bに各々順次にロードされる。データ(ao X1+O)はレジスタ1 11Bに格納される。
遣lユ土叉ル立旦 データ(c+ Xbz +Cりはレジスタ14Bにロードされる。
レジスタ111Bに格納されたデータはレジスタ15Bに転送され、レジスタ5 2Bに格納されたデータ(b、Xbz +O)はレジスタ16Bに転送される。
この結果、データ(aoX1+ 0 ) X (bl X bz + O)が乗 算回路17Bで得られる。
肩】巳し仁久四副j− レジスタ18Bに格納されたデータ(c+ Xbz 十C2)とデータ(ao  XI+o)x (bl Xb、+O)とが加算器110Bにおいて加算され、次 のような結果データが得られる。
(ao XI +O)X (bl Xbz +0)−1−(c+ Xbz +c z)−a、xb、xb2+b2 XCI +cz計算されたデータa2はレジス タ111Bに格納され、alと共にベクトルレジスタVROOに転送される。
初期計算はこれで完了する。
さて通常計算を簡単に説明する。通常計算は初期計算と同様であるが、データの ロードと転送とが異なる。このため以下の説明は主としてデータのロードに関す る。
° ル〜 これらサイクルの間に奇数項a、と偶数項a4とが計算される。
次の第10表および第11表は、レジスタ14A 、 15A 。
16A、IIIAとレジスタ14B 、 15B 、 16B 、IIIB内の データを示す。
第10表 演 算 REG REG REG REGサイクル 14A 15A 16A  IIIA04 0 b3 bz 05 C3C2b2 09 b + X C2+ C2a 1 1)z ×l):+ +Q1a3 第11表 演 算 REG REG REG REG09 baXt4+ca ax b3 Xba+ 0これらサイクルにおいて奇数項a、と偶数項a6とが計算される。
次の第12表および第13表は、レジスタ14A 、 15A 。
16A、IIIAとレジスタ14B 、 15B 、 16B 、IIIB内の データを示す。
第12表 演 算 REG REG REG REGサイクル 14A 15A 16A  IIIA07 0 bs b4 08 C5C4bs 12 bsXc4+cs a3 ba×b5 + 014a。
第13表 演 算 REG REG REG REGサイクル 14B 、 15B 16 B IIIB07 0 b6 b。
08 cb Cs b& 12 b、Xb、+c、a4b5Xb6+。
14 ah 奇数項および偶数項の他の複数の対は、前記と同様の方法で計算できる。
本発明は前記実施例に限定されるものではない。例えば前記実施例においては第 (2)弐〜第(4)式で表されるような一次展開再帰方程式を説明してきた。第 (1)式で表されるような再帰方程式を二次展開を使用して変形すれば次の式が 得られる。
a、 +=3.−. xbi +c6 =a、−2xbi−1xb、+b= ×(4−+ +c、t=a4−、xbi− 2xb、−、xbi +bi−z Xc4−z+biX(H−、XCi −(5 ) 明らかなように、前記式は項ai とa i−3との間に直接再帰関係がないこ とを示している。
添字iが奇数の場合、例えば奇数添字jを3および5とすれば、前記式は次のよ うに表せる。
j=3 : a、=aOXb、Xb、Xb3+b、Xb、XC4+bb X(, 2+cx ・” (6)j=s : a、=3.Xb、XI)4Xb5+b、x ba xCal + b、X C4+ C5”’ (7)添字iが偶数の場合、 例えば奇数添字kを4および6とすれば、前記式は次のように表せる。
k=4 : an =a、Xb、Xb:+ Xb、+bz Xb3xC2+b4 XC3+Ca ”’ (8)k−6: ah =ax xb4xl)、xb、+ ba xb、XC4+bb x(、+C6”” (9)前記第(6)弐〜第(9 )弐から、2つの奇数項a3+a%と2つの偶数項a4.a、とが同一タイミン グで同時に計算できる。このため演算時間はさらに短縮される。この実施例にお いて、奇数項計算回路は2つの隣接する奇数項、例えばa3+asを同一タイミ ングで計算するように形成されている。同様に偶数項計算回路は2つの隣接する 偶数項を同一タイミングで計算するように形成されている。データ分配回路はデ ータを奇数および偶数項計算回路に分配して前記式の計算を実行させる。
産業上の利用可能性 本発明のベクトル処理装置は種々のデータ処理システムに適用可能である。
会−jL」E−号 10A 、 l0AA・・・奇数項計算回路10B 、 l0BB・・・偶数項 計算回路14A−16A・・・レジスタ 14B−16B・・・レジスタ 17A 、 17B・・・乗算回路 18A 、 19A・・・レジスタ 18B 、 19B・・・レジスタ 21A 、 22A・・・フィードバック線21B、22B・・・フィードバッ ク線40a、40b・・・データ分配回路 41a、41b・・・セレクタ制御回路46A−48A・・・セレクタ 46B−48B・・・セレクタ 51A 、 52A・・・レジスタ 51B、52B・・・レジスタ 53A−55A・・・セレクタ 53B−55B・・・セレクタ 110A、ll0B・・・加算器 111A、112A・・・レジスタ 111B 、112B・・・レジスタ 国際調査報告 SA 22157

Claims (1)

  1. 【特許請求の範囲】 1.ベクトル命令を制御するためのベクトル命令制御ユニット(51)と、主記 憶ユニットにおける入力ベクトルデータと計算されたデータとをアクセスするた めのベクトル記憶アクセスユニット(52)と、前記ベクトル命令ユニットの制 御下においてベクトルデータを計算するためのベクトル計算ユニットと、前記ベ クトルデータアクセスユニットと前記ベクトル計算ユニットとの間でデータを転 送するためのデータ分配ユニット(54)とを備え、 前記ベクトル処理装置が、少なくとも1個の奇数項計算回路(10A,10AA )と少なくとも1個の偶数項計算回路(10B,10BB)とを有するベクトル 計算ユニットと、前記ベクトル計算ユニットに作動的に接続されて協働するデー タ分配ユニット(40a,40b)とを備え、変形された再帰方程式を処理し、 各奇数項計算回路が、変形された再帰方程式の各奇数項を計算するように形成さ れ、加算回路(110A)と、乗算回路(17A)と、計算した奇数項を保持す る少なくとも1個のデータ記憶回路(H2A,51A,52A)と、前記データ 記憶回路を介して前記乗算回路、および/または、前記加算回路に前記計算した 奇数項をフィードバックする少なくとも1本のフィードバック線(21A,22 A,23A,24A)とを備え、各偶数項計算回路が、再帰方程式の偶数項を計 算するように形成され、他の加算回路(110B)と、他の乗算回路(17B) と、計算された偶数項を保持する少なくとも1個の他のデータ記憶回路(112 B,51B,52B)と、前記他のデータ記憶回路を介して前記別の乗算回路、 および/または、前記他の加算回路に前記計算した偶数項をフィードバックする 少なくとも1本のフィードバック線(21B,22B.23B,24B)とを備 え、 前記データ分配ユニットが、0を出力するための第1のデータ設定器と、1を出 力するための第2のデータ設定器と、前記設定器からの定数データ0および1と 計算された奇数項および偶数項とを使用して再帰方程式を計算するための入力オ ペランド(ai,bi)を選択する第1〜第6セレクタ(46A,47A,48 A,46B,47B,48B)と、変形された再帰方程式によって規定される所 定の方法において前記セレクタを制御するためのセレクタ制御回路(40a,4 0b)とを備え、選択されたデータを前記奇数および偶数項計算回路へ供給する 、ベクトル処理装置。 2.前記奇数項および偶数項計算回路が独立して同時に動作可能であり、同一演 算時間に前記再帰方程式の少なくとも各1対の隣接する奇数項および偶数項(a i,ai+1)を計算する、請求の範囲1に基づくベクトル処理装置。 3.前記データ分配ユニット(40a,40b)が、元の乗数、および/または 、被乗数として複数の前記第1オペランド(bi)を入出力するためのファース トイン・ファーストアウトバッファ(42)と、元の加数として複数の前記第2 オペランド(Ci)を入出力するためのファーストイン・ファーストアウトバッ ファ(43)とを備える、請求の範囲2に基づくベクトル処理装置。 4.前記変形された再帰方程式が1次展開されて次のように表され、 ai=ai−2×bi−1×bi+bl×Ci−1十Ci…(1)前記奇数項計 算回路が次の式を計算し、a1=a0×b1+C1 aj=aj−2×bj−1×bj+bj×Cj−1+Cj…(2)ここでjは奇 数の整数(j=1,3,…,n)であり、前記偶数項計算回路が次の式を計算し 、 ak=ak−2×bk−1×bk+bk×Ck−1+Ck…(3)ここでkは偶 数の整数(k=2,4,…,n+1)である、請求の範囲3に基づくベクトル処 理装置。 5.前記奇数項計算回路が第1〜第3フィードバック線(21A,22A,23 A)を備えると共に、(a)前記加算回路(110A)が前記第1セレクタ(4 6A)から加数を受け取り、 (b)前記乗算回路(17A)が前記第2および第3セレクタ(47A,48A )から乗数および被乗数を受け取り、(c)前記加算回路(110A)が前記乗 算回路で乗算されたデータを受け取り、 (d)前記データ記憶回路(112A)が前記加算回路で加算されたデータを受 け取り、 (e)前記第1セレクタ(46A)が定数0と、前記第2バッファ(43)から の前記第2オペランド(Ci)と、前記第2フィードバック線(22A)を介し ての前記データ記憶回路(112A)からの前記格納データとを受け取り、(f )前記第2セレクタ(47A)が前記定数1と、前記第1オペランド(bi)と 、前記第3フィードバック線(23A)を介して前記加算されたデータとを受け 取り、(g)前記第3セレクタ(48A)が前記定数1と、初期データ(ao) と、前記第1および第2バッファ(42,43)からの前記第1および第2オペ ランドと、前記第1フィードバック線(21A)を介して前記乗算回路(17A )からの前記乗算されたデータとを受け取るように構成され、前記偶数項計算回 路が別の第1〜第3フィードバック線(21B,22B,23B)を備えると共 に、(h)前記他の加算回路(110B)が前記第4セレクタ(46B)から加 数を受け取り、 (i)前記他の乗算回路(17B)が前記第5および第6セレクタ(47B,4 8B)から乗数および被乗数を受け取り、(j)前記他の加算回路(110B) が前記他の乗算回路で乗算されたデータを受け取り、 (k)前記他のデータ記憶回路(112B)が前記他の加算回路で加算されたデ ータを受け取り、 (1)前記第4セレクタ(46B)が定数0と、前記第2バッファ(43)から の前記第2オペランド(Ci)と、前記第2フィードバック線(22B)を介し て前記データ記憶回路(112B)からの前記格納データとを受け取り、(m) 前記第5セレクタ(47B)が前記定数1と、前記第1オペランド(bi)と、 前記他の第3フィードバック線(23B)を介して前記加算されたデータとを受 け取り、(n)前記第6セレクタ(48B)が前記定数1と、前記初期データ( ao)と、前記第1および第2バッファ(42,43)からの前記第1および第 2オペランド(bi,ci)と、前記他の第1フィードバック線(21B)を介 して前記乗算回路(17B)からの前記乗算されたデータとを受け取るように構 成された、請求の範囲4に基づくベクトル処理装置。 6.前記奇数項計算回路(10A)が、前記第1セレクタ(46A)に接続され てそこからのデータを一時的に格納する第1段の第1データ記憶回路(14A) と、前記第2および第3セレクタ(47A,48A)と前記乗算回路(17A) との間に接続され前記第2および第3セレクタからのデータを一時的に格納する 第1段の第2および第3データ記憶回路(15A,16A)と、 前記第1段の第1データ記憶回路と前記加算回路との間に接続されて前記第1段 の第1データ記憶回路からのデータを一時的に格納する第2段の第1データ記憶 回路(18A)と、前記乗算回路に入力端子が接続され前記加算回路と前記第1 フィードバック線とに出力端子が接続されて前記乗算回路において乗算されたデ ータを一時的に格納する第2段の第2データ記憶回路(19A)と、 前記加算回路と前記データ記憶回路(112A)との間に接続されると共に前記 第3フィードバック線に接続されて前記加算回路において加算されたデータを一 時的に格納する第3段のデータ記憶回路(111A)とを備え、前記偶数項計算 回路(10B)が、 前記他の第1セレクタ(46B)に接続されてそこからのデータを一時的に格納 する他の第1段の第1データ記憶回路(14B)と、 前記他の第2および第3セレクタ(47B,48B)と前記他の乗算回路(17 B)との間に接続され前記他の第2および第3セレクタからのデータを一時的に 格納する他の第1段の第2および第3データ記憶回路(15B,16B)と、前 記他の第1段の第1データ記憶回路と前記他の加算回路との間に接続されて前記 他の第1段の第1データ記憶回路からのデータを一時的に格納する他の第2段の 第1データ記憶回路(18B)と、 前記他の乗算回路に入力端子が接続され前記他の加算回路と前記他の第1フィー ドバック線とに出力端子が接続されて前記他の乗算回路において乗算されたデー タを一時的に格納する他の第2段の第2データ記憶回路(19B)と、前記他の 加算回路と前記他のデータ記憶回路(112B)との間に接続されると共に前記 他の第3フィードバック線に接続されて前記他の加算回路において加算されたデ ータを一時的に格納する他の第3段データ記憶回路(111B)とを備える、請 求の範囲5に基づくベクトル処理装置。 7.初期演算時において、 前記奇数項計算回路と前記データ分配回路とが協働して次の項を2つの演算時間 の間に計算し、 a1=a0×b1+c1 a1=a1×1+0 前記偶数項計算回路と前記データ分配回路とが協働して次の項を前記2つの演算 時間の間に計算し、a1=a0×b1+c1 a2=a1×b2+c2 前記初期演算時の後の通常演算時において、前記奇数項計算回路と前記データ分 配回路とが協働して次の式の各奇数項を各演算時間内に計算し、aj=aj−2 ×bj−1×bj+bj×cj−1+cjここでj=1,3,…,nであり、 前記偶数項計算回路と前記データ分配回路とが協働して次の式の各偶数項を前記 演算時間内に計算し、ak=ak−2×bk−1×bk+bk×ck−1+ck ここでk=2,4,…,n+1である、請求の範囲6に基づくベクトル処理装置 。 8.各前記演算時間が前記ベクトル処理装置における複数の演算サイクルからな り、 前記演算時間が各項の計算について同一であり、隣接する項を計算するための隣 接する演算時間が部分的に重なり合う、請求の範囲7に基づくベクトル処理装置 。 9.前記データ分配ユニット(40a)が前記第3段および前記別の第3段デー タ記憶回路(110A,110B)からデータを受け取り当該データを前記ベク トル記憶アクセスユニット(52)に出力する、請求の範囲8に基づくベクトル 処理装置。 10.前記ベクトル記憶アクセスユニットが前記入力オペランドと前記計算され た奇数項および偶数項とを一時的に格納するためのベクトルレジスタユニットを 備え、前記データ分配回路が前記入力オペランドと前記計算された奇数項および 偶数項を転送する、請求の範囲9に基づくベクトル処理装置。 11.前記奇数項計算回路が、フィードバック線(24A)と、前記フィードバ ック線(24A)を介して供給される計算された奇数項を格納するための直列接 続された第1および第2データ記憶回路(51A,52A)とを備えると共に、 (a)前記加算回路(110A)が前記第1セレクタ(53A)から加数を受け 取り、 (b)前記乗算回路(17A)が前記第2および第3セレクタ(54A,55A )から乗数および被乗数を受け取り、(c)前記加算回路(110A)が前記乗 算回路で乗算されたデータを受け取り、 (d)前記第1データ記憶回路(51A)が前記加算回路で加算されたデータを 受け取り、 (e)前記第2データ記憶回路(52A)が前記第1データ記憶回路からデータ を受け取り、 (f)前記第1セレクタ(53A)が前記定数0と、前記第2バッファ(43) からの前記第2オペランド(ci)と、前記第1データ記憶回路からのデータと を受け取り、(g)前記第2セレクタ(54A)が前記定数0と、初期データ( ao)と、前記第1および第2オペランド(bi,ci)と、前記第1のフィー ドバック線を介しての前記加算回路で加算された前記データとを受け取り、 (h)前記第3セレクタ(55A)が前記定数1と、前記第1バッファ(42) からの前記第1オペランドと、前記第2データ記憶回路(52A)に格納された 前記データを受け取るように構成され、 前記偶数項計算回路が、他のフィードバック線(24B)と、前記フィードバッ ク線(24B)を介して供給される前記計算された偶数項を格納するための直列 接続された他の第1および第2データ記憶回路(51B,52B)とを備えると 共に、(i)前記他の加算回路(110B)が前記第4セレクタ(53B)から 加数を受け取り、 (j)前記他の乗算回路(17B)が前記第5および第6セレクタ(54B,5 5B)から乗数および被乗数を受け取り、(k)前記他の加算回路(110B) が前記他の乗算回路で乗算されたデータを受け取り、 (l)前記他の第1データ記憶回路(51B)が前記他の加算回路で加算された データを受け取り、(m)前記他の第2データ記憶回路(52B)が前記他の第 1データ記憶回路からデータを受け取り、(n)前記第4セレクタ(53B)が 定数0と、前記第2バッファ(43)からの前記第2オペランド(ci)と、前 記第1データ記憶回路からのデータとを受け取り、(o)前記第5セレクタ(5 4B)が前記定数0と、前記初期データ(ao)と、前記第1および第2オペラ ンド(bi,ci)と、前記他のフィードバック線を介して前記他の加算回路で 加算された前記データとを受け取り、(p)前記第6セレクタ(55B)が前記 定数1と、前記第1バッファ(42)からの前記第1オペランドと、前記別の第 2データ記憶回路(52B)に格納された前記データとを受け取るように構成さ れた、請求の範囲4に基づくベクトル処理装置。 12.前記奇数項計算回路(10AA)が、前記第1セレクタ(53A)に接続 されてそこからのデータを一時的に格納する第1段の第1データ記憶回路(14 A)と、前記第2および第3セレクタ(54A,55A)と前記乗算回路(17 A)との間に接続され前記第2および第3セレクタからのデータを一時的に格納 する第1段の第2および第3データ記憶回路(15A,16A)と、 前記第1段の第1データ記憶回路と前記加算回路との間に接続されて前記第1段 の第1データ記憶回路からのデータを一時的に格納する第2段の第1データ記憶 回路(18A)と、前記乗算回路に入力端子が接続され前記加算回路に出力端子 が接続されて前記乗算回路において乗算されたデータを一時的に格納する第2段 の第2データ記憶回路(19A)と、前記加算回路と前記データ記憶回路(51 A)との間に前記フィードバック線を介して接続されて前記加算回路において加 算されたデータを一時的に格納する第3段データ記憶回路(111A)とを備え 、 前記偶数項計算回路(10BB)が、 前記他の第1セレクタ(53B)に接続されてそこからのデータを一時的に格納 する別の第1段の第1データ記憶回路(14B)と、 前記他の第2および第3セレクタ(54B,55B)と前記他の乗算回路(17 B)との間に接続されて前記他の第2および第3セレクタからのデータを一時的 に格納する他の第1段の第2および第3データ記憶回路(15B,16B)と、 前記他の第1段の第1データ記憶回路と前記他の加算回路との間に接続されて前 記他の第1段の第1データ記憶回路からのデータを一時的に格納する別の第2段 の第1データ記憶回路(18B)と、 前記他の乗算回路に入力端子が接続され前記他の加算回路に出力端子が接続され て前記他の乗算回路において乗算されたデータを一時的に格納する他の第2段の 第2データ記憶回路(19B)と、 前記他の加算回路と前記他のデータ記憶回路(51B)との間に前記他のフィー ドバック線を介して接続されて前記他の加算回路において加算されたデータを一 時的に格納する他の第3段データ記憶回路(111B)とを備える、請求の範囲 11に基づくベクトル処理装置。 13.初期演算時において、 前記奇数項計算回路と前記データ分配回路とが協働して次の項を2つの演算時間 の間に計算し、 a1=a0×b1+c1 a1=a1×1+0 前記偶数項計算回路と前記データ分配回路とが協働して次の項を前記2つの演算 時間の間に計算し、a1=a0×b1+c1 a2=a1×b2+c2 前記初期演算時の後の通常演算時において、前記奇数項計算回路と前記データ分 配回路とが協働して次の式の各奇数項を各演算時間内に計算し、aj=aj−2 ×bj−1×bj+bj×Cj−1+cjここでj=1,3,…,nであり、 前記偶数項計算回路と前記データ分配回路とが協働して次の式の各偶数項を前記 演算時間内に計算し、ak=ak−2×bk−1×bk+bk×ck−1+ck ここでk=2,4,…,n+1である、請求の範囲12に基づくベクトル処理装 置。 14.各前記演算時間が前記ベクトル処理装置における複数の演算サイクルから なり、 前記演算時間が各項の計算について同一であり、隣接する項を計算するための隣 接する演算時間が部分的に重なり合う、請求の範囲13に基づくベクトル処理装 置。 15.前記データ分配ユニット(40b)が前記第3段および前記他の第3段デ ータ記憶回路(110A,110B)からデータを受け取り当該データを前記ベ クトル記憶アクセスユニット(52)に出力する、請求の範囲14に基づくベク トル処理装置。 16.前記ベクトル記憶アクセスユニットが前記入力オペランドと前記計算され た奇数項および偶数項とを一時的に格納するためのベクトルレジスタユニットを 備え、前記データ分配回路が前記入力オペランドと前記計算された奇数項および 偶数項を転送する、請求の範囲15に基づくベクトル処理装置。
JP63504021A 1987-05-14 1988-05-14 再帰方程式を高速で処理するベクトル処理装置 Expired - Fee Related JPH077389B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63504021A JPH077389B2 (ja) 1987-05-14 1988-05-14 再帰方程式を高速で処理するベクトル処理装置

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP62-117719 1987-05-14
JP11771987 1987-05-14
JP63504021A JPH077389B2 (ja) 1987-05-14 1988-05-14 再帰方程式を高速で処理するベクトル処理装置
PCT/JP1988/000464 WO1988009016A1 (en) 1987-05-14 1988-05-14 Vector processor for processing recurrent equations at a high speed

Publications (2)

Publication Number Publication Date
JPH01501264A true JPH01501264A (ja) 1989-04-27
JPH077389B2 JPH077389B2 (ja) 1995-01-30

Family

ID=14718599

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63504021A Expired - Fee Related JPH077389B2 (ja) 1987-05-14 1988-05-14 再帰方程式を高速で処理するベクトル処理装置

Country Status (6)

Country Link
US (1) US4949292A (ja)
EP (1) EP0314809B1 (ja)
JP (1) JPH077389B2 (ja)
KR (1) KR920004772B1 (ja)
DE (1) DE3882487T2 (ja)
WO (1) WO1988009016A1 (ja)

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5226135A (en) * 1987-09-25 1993-07-06 Hitachi, Ltd. Method for sorting vector data on the basis of partial vectors and vector processor
JP3068138B2 (ja) * 1989-04-06 2000-07-24 甲府日本電気株式会社 ベクトル演算処理装置
JP2658397B2 (ja) * 1989-06-13 1997-09-30 日本電気株式会社 マルチプロセッサシステム
US5179531A (en) * 1990-04-27 1993-01-12 Pioneer Electronic Corporation Accelerated digital signal processor
JPH04177462A (ja) * 1990-11-08 1992-06-24 Koufu Nippon Denki Kk ベクトル総和演算装置
DE4036455C1 (ja) * 1990-11-15 1992-04-02 Siemens Ag, 8000 Muenchen, De
JP3237858B2 (ja) * 1991-01-30 2001-12-10 沖電気工業株式会社 演算装置
JPH0628485A (ja) * 1992-07-09 1994-02-04 Toshiba Corp テクスチャーアドレス生成器、テクスチャーパターン生成器、テクスチャー描画装置及びテクスチャーアドレス生成方法
US5517667A (en) * 1993-06-14 1996-05-14 Motorola, Inc. Neural network that does not require repetitive training
US5390136A (en) * 1993-06-14 1995-02-14 Motorola, Inc. Artificial neuron and method of using same
US5446651A (en) * 1993-11-30 1995-08-29 Texas Instruments Incorporated Split multiply operation
CA2135857A1 (en) * 1994-01-03 1995-07-04 Shay-Ping Thomas Wang Neural network utilizing logarithmic function and method of using same
JPH08241301A (ja) * 1995-03-07 1996-09-17 Nec Corp 直交変換処理装置
US5553012A (en) * 1995-03-10 1996-09-03 Motorola, Inc. Exponentiation circuit utilizing shift means and method of using same
US5685008A (en) * 1995-03-13 1997-11-04 Motorola, Inc. Computer Processor utilizing logarithmic conversion and method of use thereof
JP2636789B2 (ja) * 1995-03-31 1997-07-30 日本電気株式会社 マイクロプロセッサ
US5668749A (en) * 1995-05-04 1997-09-16 Motorola, Inc. Circuit for performing arithmetic operations in a demodulator
US5644520A (en) * 1995-05-31 1997-07-01 Pan; Shao Wei Accumulator circuit and method of use thereof
US5771391A (en) * 1995-08-28 1998-06-23 Motorola Inc. Computer processor having a pipelined architecture and method of using same
FR2745647B3 (fr) * 1996-03-01 1998-05-29 Sgs Thomson Microelectronics Coprocesseur d'arithmetique modulaire permettant de realiser des operations non modulaires rapidement
JPH1055352A (ja) * 1996-08-08 1998-02-24 Fuji Xerox Co Ltd 浮動小数点数累積加算装置
FR2758195B1 (fr) * 1997-01-09 1999-02-26 Sgs Thomson Microelectronics Coprocesseur d'arithmetique modulaire comprenant deux circuits de multiplication operant en parallele
KR100287894B1 (ko) * 1998-03-05 2001-05-02 김영환 콤필터의미분기
US6748411B1 (en) 2000-11-20 2004-06-08 Agere Systems Inc. Hierarchical carry-select multiple-input split adder
US7454701B2 (en) * 2003-10-30 2008-11-18 Sap Ag Systems and methods for implementing formulas
US20070074008A1 (en) * 2005-09-28 2007-03-29 Donofrio David D Mixed mode floating-point pipeline with extended functions

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60136875A (ja) * 1983-12-26 1985-07-20 Hitachi Ltd ベクトル演算器
EP0167061A3 (en) * 1984-06-20 1988-07-27 Convex Computer Corporation Vector processing computer
JPH0650512B2 (ja) * 1984-07-11 1994-06-29 日本電気株式会社 デ−タ処理装置

Also Published As

Publication number Publication date
KR890702149A (ko) 1989-12-23
DE3882487D1 (de) 1993-08-26
JPH077389B2 (ja) 1995-01-30
US4949292A (en) 1990-08-14
EP0314809B1 (en) 1993-07-21
WO1988009016A1 (en) 1988-11-17
KR920004772B1 (ko) 1992-06-15
DE3882487T2 (de) 1993-11-04
EP0314809A1 (en) 1989-05-10

Similar Documents

Publication Publication Date Title
JPH01501264A (ja) 再帰方程式を高速で処理するベクトル処理装置
US4679163A (en) Inverse discrete cosine transform calculation processor
US5239660A (en) Vector processor which can be formed by an integrated circuit of a small size
US8024394B2 (en) Dual mode floating point multiply accumulate unit
US4881168A (en) Vector processor with vector data compression/expansion capability
US5081573A (en) Parallel processing system
US4725973A (en) Vector processor
US20080208942A1 (en) Parallel Architecture for Matrix Transposition
US4675836A (en) Discrete cosine transform calculation processor
JPH07117948B2 (ja) コンピユータ装置
JPH06502265A (ja) 信号処理におけるマトリクス演算の計算回路装置
JPS62134763A (ja) 3アドレス・コ−ドの指標づけ装置
US4849926A (en) Data processing circuit for calculating either a total sum or a total product of a series of data at a high speed
US5822609A (en) Processing circuit for performing a convolution computation
JPS6310263A (ja) ベクトル処理装置
Chang et al. A parallel Householder tridiagonalization stratagem using scattered row decomposition
JPH06309349A (ja) プログラム制御のプロセッサ
JP3620887B2 (ja) データ処理装置
JPH0445860B2 (ja)
Soegtrop et al. A Massively Parallel Neurocomputer
JPH02235174A (ja) バス・マトリツクス
JPH04307662A (ja) 離散コサイン変換装置および逆離散コサイン変換装置
CN115033843A (zh) 基于三角脉动阵列的协方差矩阵计算的电路实现方法
JPH0241563A (ja) ベクトル処理方式
KR19990017608A (ko) 신호 처리 프로세서의 연산 유닛 및 입출력 장치

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees