JPH01501264A

JPH01501264A - 再帰方程式を高速で処理するベクトル処理装置

Info

Publication number: JPH01501264A
Application number: JP63504021A
Authority: JP
Inventors: 星野　明彦; 中谷　彰二; 浩二黒田; 哲河合
Original assignee: 富士通株式会社
Priority date: 1987-05-14
Filing date: 1988-05-14
Publication date: 1989-04-27
Anticipated expiration: 2010-01-30
Also published as: KR890702149A; DE3882487D1; JPH077389B2; US4949292A; EP0314809B1; WO1988009016A1; KR920004772B1; DE3882487T2; EP0314809A1

Abstract

(57)【要約】本公報は電子出願前の出願データであるため要約のデータは記録されません。

Description

【発明の詳細な説明】再帰方程式を高速で処理するベクトル処理装置技術分野本発明はデータ処理システムに関し、特に再帰方程式を高速で処理するためのベクトル処理装置に関する。

背景技術最近のコンピュータ技術における目ざましい進歩は、例えばベクトル処理装置を提供することによってスーパーコンピュータの演算速度を向上させてきた。これらベクトル処理装置は科学計算を実行するために使用される。例えば−次方程弐の数値解法や微分方程式の数値解法を高速で行うために使用される。

科学技術計算においては、次のような再帰演算アルゴリズム（または再帰方程式）を頻繁に使用して一次方程式の数値解法を行ったり、差分法によって微分方程式を解く。

ａｉ　＝＝ａ、−，Ｘｂｉ　十ｃｉ　・・・（１）但し、ｉ＝１　、２　、３　、・・・、ｎこの演算アルゴリズム（１）は、データａｉ　とデータａｉ−１の再帰関係を示す、一般に、上記再帰方程式の演算は、ベクトル処理装置による高速の計算には適していない。これはデータａ８−１が再使用されてデータａｉを計算するからである。

すなわちデータａｉは項ａ　ｉ−１の計算の後で計算しなければならないためである。従って従来のベクトル処理装置は、高速で再帰方程式を計算することができない。再帰方程式を扱うために使用される従来のベクトル処理装置については図面を参照して後述する。

それにもかかわらず、ベクトル処理装置を使用して高速で再帰方程式を計算することに対する要求は強い。これは多くの再帰方程式が科学技術計算分野で使用されるがらである。

発明の開示本発明の目的は再帰方程式を高速で処理できるベクトル処理装置を提供することである。

本発明の他の目的は、容易に構成できる簡単な回路構成を有するベクトル処理装置を提供することである。

本発明の提供するベクトル処理装置は、ベクトル命令を制御するためのベクトル命令制御ユニットと、主記憶ユニットにおける入力ベクトルデータと計算されたデータとをアクセスするためのベクトル記憶アクセスユニットと、前記ベクトル命令制御ユニットの制御下においてベクトルデータを計算するためのベクトル計算ユニットと、前記ベクトルデータアクセスユニットと前記ベクトル計算ユニットとの間でデータを転送するためのデータ分配ユニットとを備え、前記ベクトル処理装置が、少なくとも１個の奇数項計算回路と少な（とも１個の偶数項計算回路とを有するベクトル計算ユニットと、前記ベクトル計算ユニットに作動的に接続されそれと協働するデータ分配ユニットとを備えることにより、変形された再帰方程式を処理することを特徴とする。各奇数項計算回路は、変形された再帰方程式の各奇数項を計算するように構成され、加算回路と、乗算回路と、計算した奇数項を保持する少なくとも１個のデータ記憶回路と、前記データ記憶回路を介して前記乗算回路、および／または、前記加算回路に前記計算した奇数項をフィードバックするための少なくとも１本のフィードバック線を備える。各偶数項計算回路は、再帰方程式の偶数項を計算するように構成され、他の加算回路と、別の乗算回路と、計算された偶数項を保持する少なくとも１個の他のデータ記憶回路と、前記他のデータ記憶回路を介して前記他の乗算回路、および／または、前記側の加算回路に前記計算した偶数項をフィードバックするための少なくとも１本のフィードバック線を備える。前記データ分配ユニットは、０を出力するための第１のデータ設定器と、１を出力するための第２のデータ設定器と、前記設定器からの定数データ０および１と計算された奇数項および偶数項とを使用して再帰方程式を計算するための入力オペランドを選択する第１〜第６セレククと、変形された再帰方程式によって規定される所定の方法において前記セレクタを制御するためのセレクタ制御回路とを備え、選択されたデータを前記奇数項および偶数項計算回路へ供給する。

式（１）によって表される再帰方程式は、−次漸化すると次の式のように変形できる。

ａ、＝ａｉ−１ｘｂ、＋Ｃ。

””　（Ｃａｔ−ｔ　ｘｂｉ−＋）＋　ＣＨ−１）ｘｂｆ　＋　ＣＢ　−＝　ａｉ−ｚ　Ｘ　ｂｔ−＋　Ｘ　ｂｉ　＋　ｂｉ　Ｘ　Ｃｉ−＋　＋　Ｃ；　”’　（２）添字ｉが偶数、例えば偶数の添字に＝２　、４　、６の場合、ａｔ　”” ａ６　ＸｂｌＸｂｚ　＋ｂ２　ＸＣＩ　＋Ｃ１ａ　４　＝ａｚ　Ｘｂ　３　Ｘｂａ　＋　ｂａ　ＸＣ３＋　Ｃ４ａｈ　”＝ａ４Ｘｂ５　Ｘｂａ　＋ｂａ　ＸＣｓ　＋Ｃｂ　”’　（３）添字ｉが奇数、例えば奇数の添字ｊ＝１．３，５．７の場合、ａｒ　””ａｎ　Ｘｂｌ　Ｘ１＋ＩＸｃ＋　十〇ａｓ　＝ａＩｘｂ、　Ｘｂ３　＋ｂ３　ＸＣ２＋Ｃ３ａｓ　””ａｘ　ｘｂ４ｘｂ５＋ｂ５　ＸＣａ　＋ｃ５ａフ＝ａｓ　ｘｂｈ　Ｘｂｔ　＋ｂｔ　ＸＣｂ　＋Ｃ７・・’　（４）ここで各項ａ２とａｏ、ａ４と”２、ａｂとａ４の間には直接の再帰関係がないことに注意すべきである。同様に、項ａ３とａｌｓａｓとａｎ、ａｆｆとａ５との間にも直接の再帰関係がない。従って奇数項計算回路は、奇数項ａｊの計算を直接再帰によって遅延なしに行うことができる。また偶数項計算回路は、偶数項ａｋの計算を直接再帰による遅延なしに行うことができる。このため再帰方程式の高速計算に寄与する。

図面の簡単な説明第１図は、本発明のベクトル処理装置を含む高速データ処理システムを示すブロック図、第２図は、第１図に示したデータ処理システムに使用される汎用ベクトル処理装置を示すブロック図、第３図は、従来のベクトル処理装置を示す回路図、第４図は、第３図に示したベクトル処理装置の動作タイミング図、第５図は、本発明に基づくベクトル処理装置の一実施例を示す回路図、第６図は、第５図に示したベクトル処理装置の動作タイミング図、第７図は、本発明に基づくベクトル処理装置の別の実施例を示す回路図、および第８図は、第７図に示したベクトル処理装置の動作タイミング図、である。

発明を実施するための最良の形態本発明に基づくベクトル処理装置の好適実施例を説明する前に、ベクトル処理装置を備えた高速データ処理システムを第１図を参照して説明する。

第１図において、高速データ処理システムは、主記憶ユニッ）（ＭＳＵ）１と、主記憶制御ユニッｌ−（ＭＳＣＵ）　２と、入出力（Ｉｌｏ）処理ユニット３と、スカラデータ処理ユニット（スカラ処理装置）４と、ベクトルデータ処理ユニット（ベクトル処理装置）５とを備える。Ｉ１０処理ユニット３は、計算されるデータを入力すると共に、スカラ処理装置４、および／または、ベクトル処理装置５において計算されたデー夕を出力する。ＭＳＵ　１はこれら入力データと計算されたデータとを格納する。スカラ処理装置４は全ての計算を制御する。

演算コマンドがスカラ演算に関連する場合は、スカシ処理装置４自体がスカラデータの計算を実行する。演算コマンドがベクトル演算に関連する場合は、スカラ処理装置４は制御をベクトル処理装置５に移し、ベクトル処理装置５においてベクトル計算が実行される。すなわちベクトル処理装置５は、ベクトル計算が要求される場合にスカラ処理装置４によってトリガされ、当該ベクトル計算を実行する０Ｍ５Ｃυ２は、ＭＳＵ１とＩ１０処理ユニット３とスカラ処理装置４とベクトル処理装置５とのデータの流れを制御する。

第１図に示したベクトル処理装置５の全体構成を第２図に示す、第２図においてベクトル処理装置５は、デコーダと制御レジスタとを有するベクトル命令制御ユニット（ＶＩＣＵ）５１と、ベクトルアドレス発生器とアクセスデータ処理装置とベクトルレジスタユニットとを有するベクトル記憶アクセスユニット（ＶＳＡＵ）５２と、データ分配ユニット５４と、加減算ユニット５５と乗算ユニット５６と除算ユニット５７とを有するベクトル計算部とを備える。　ＶＩＣ５５１はスカラ処理装置５からデータ制御命令を受け取る。その制御レジスタは前記データ制御命令の制御データを格納する。前記デコーダは前記データ制御命令を復号する。ＶＳＡＵ５２は、ＭＳＣＵ　２およびデータ分配ユニット５４を介して、ＭＳＵ　ｉとベクトル計算部との間でデータを転送する。前記ベクトルアドレス発生器は、復号された命令に基づきＭＳＵ　Ｉ内のデータをアクセスするためのアドレスを発生する。前記アクセスデータ処理装置は、ＭＳＬＩ　１とベクトルレジスタユニットとの間のデータを制御する。ベクトル計算に使用されるデータは、まずベクトルレジスタユニットに格納される。また、ベクトル計算部において計算されたデータは、ベクトルレジスタユニットに格納される。データ分配ユニット４０は、ベクトルレジスタユニットからのデータを分配し、それを復号された命令に基づいて加減算ユニット５５と乗算ユニット５６と除算ユニット５７とに供給する。

これらユニット５５　、５６　、５７は動作接続されており、ベクトル計算を行う。ベクトル計算されたデータは、データ分配ユニット４０を介してベクトルレジスタユニットに格納され、その後ＭＳｔｌ　１に格納される。

従来のベクトル処理装置を第３図および第４図を参照して説明する。第３図は、前記した再帰方程式を処理するための基本的な回路図を示す、第４図は第３図に示したベクトル処理装置の動作タイミング図である。

第３図において、ベクトル処理装置は、セレクタ３０と、レジスタ１４　、１５　、１６と、乗算回路１７と、レジスタ１８　、１９と、加算器１１０と、レジスタ１１２と、レジスタ１１２の出力端子とセレクタ３０の入力端子との間に接続されたフィードバック線３１とを備える。これら回路構成要素は第３図に示したベクトル計算部の一部である０乗算回路１７はａ、−ＩＸｂ＝の項を計算する。加算器１１０はＣ４と乗算回路１７からの結果とを加算する。一方において、この加算されたデータはフィードバック線３１とセレクタ３０とレジスタ１５とを介して乗算回路１７にフィードバックされて次の項の計算に使用され、他方においてベクトルレジスタユニットに出力される。

セレクタ３０は最初に初期ベクトルデータａ０を出力する。

レジスタ１４　、１５　、１６とレジスタ１８　、１９とレジスタ１１２とは、前記データを各々保持するように設けられている。レジスタ１１２とフィードバック線３１とは、計算されたデータａ１をレジスタ１５にフィードバックして次の項ａｉ＊１　を計算するように設けられている。

ここで、減算および除算は再帰方程式の計算に必要ないので、減算回路および除算回路は第３図から省略されている。

第３図に示したベクトル処理装置の動作を第４図を参照してさらに詳細に説明する。

再帰方程式の添字を示す整数ｉが１であれば、再帰方程式は次のように表される。

ａｌ　””ａ＠　ｘｂ、＋Ｃ＋このため動作サイクル０１においては、初期データＣＩ　＋ａｏ、ｂｔが第２図に示したベクトルレジスタユニットからレジスタ１４　、１５　、１６にロードされる。次に（ａｏＸｂ＋）の計算が乗算回路１７において実行される。動作サイクル０２において、レジスタ１４にロードされたデータＣ，がレジスタ１８に転送される０乗算回路１７において計算されたデータはレジスタ１９に転送される。従って加算器１１０はデータｃ１とレジスタ１９に格納されたデータとを加算し、結果ａ、を得る・動作サイクル０３において、結果ａ１はレジスタ１１２に格納され、次にデータ分配ユニット５４を介して第２図に示したベクトルレジスタユニットに出力される。

動作サイクル０４において、次のベクトルデータｂ２＋Ｃ１がベクトルレジスタユニットを介してレジスタ１６　、１４にロードされる。同時に、レジスタ１１２に格納されているデータａ。

がフィードバック線３１とセレクタ３０とを介してレジスタ１５にロードされる。動作サイクル０４〜０６において次の項ａｔ　”ａｌ　ＸＪ　＋Ｃｚの計算が実行される。

同様に、動作サイクル０７〜０９において項ａ、＝ａｚｘｂ。

＋ｃ、の計算が実行される。動作サイクル１０〜１２では項ａ４−ａ３　ｘｂ４＋Ｃａの計算が実行される。動作サイクル１３〜１５では項ａ５　＝ａａ　ｘｂ、　十ｃｓの計算が実行される。

前記したように、一つの項ａ、を得るための計算時間は３つの動作サイクルを必要とする。１００項のベクトル処理が必要の場合、１００の再帰方程式の計算データを得るために３００の動作サイクルが必要である。従って再帰方程式、特に高次再帰方程式を計算するための高速動作が従来のベクトル処理装置では実現できない。

この欠点は、項ａｉの計算が直前の項ａ、−１の計算の後に実行されなければならないという再帰関係の故である。このため従来のベクトル処理装置は、次の項の計算を進める前に直前の項を計算するためのアイドル時間を生ずる。従って、ベクトル処理装置が前記再帰方程式を正確に解くことができても、このベクトル処理装置は前記低速演算の欠点を逃れられない。

本発明は再帰方程式を変形することによって前記欠点を解決する。

前記した再帰方程式は次のように変形可能である。

ａｉ　＊３．−、ｘｂｉ　＋ｃｉ＝　（ａｌ−ｚ　ｘｂｉ−、＋ｃｔ−，）Ｘｂｉ＋ｃ。

＝　（ａＨ−ｚ　ｘｂｉ−１ｘｂ、）＋ｂ６　ＸＣ１−＋　＋Ｃ＋　”’　（２）但し、ｉは整数であり添字ｉ＝１　、２　、３ｓ−、ｎを表し、ｈは計算されたベクトルデータであり、ｂ、は入力ベクトルデータであり、Ｃ８は入力ベクトルデータである。

第（２）式から、項ａ、と他の項ａ、−２との間番二しま項ａ。

と他の項ａｉ−＋　との間のような直接再帰関係のなし）こと力＜ヤ１かる。前記第（２）式に基づき項ａｉの計算器よ、直ロゴの項ａ　６−＋の計算に影響されない０項ａ　ｉ−ｚは項ａ、の２段階前に計算されており、項ａｉ　は直前の項ａ、−３の８＋算Ｇこよる遅延なしに実行することができる。しかしながら前記概念しよ奇数項と偶数項とを別々に演算しない限り実現できなし）。

添字ｉが偶数であれば、偶数添字ｋを使用して前記第（２）式は次のように表される。

ｋ”’２　：　ａｚ　＝Ｃ６ｘｂ、　×ｂｚ　＋ｂｚ　Ｘｃ、＋Ｃ２に＝４　：　Ｃ４＝ａ、ｘｂ、ｘｂ、＋ｂｎ　ＸＣ，＋Ｃ４に＝６　：　Ｃ６＝Ｃ４ｘｂ、　ｘｂ６　＋ｂ６　ＸＣｓ　＋Ｃｈ添字ｉが奇数であれば、奇数添字ｊを使用して前記第（１）式は次のように表される。

ｊ＝１　：　ａｌ　＝ａ、Ｘｂ、ｘｌ＋１ｘｃ、＋ＯＪ　＝３　：　Ｃ３＝ａＨｘｂＺ　ｘｂ、＋ｂ３　Ｘｃｚ　＋ｃｉＪ＝５　：　Ｃ５＝Ｃ３ｘｂａ　ｘｂ、＋　Ｃ５ＸＣａ　＋　Ｃ５例えば項ａ０とａｔ、項ａ２とＣ４、項ａ４とａｂ、項ａ。

とＣ３、または項ａ、とａ、との間には、項ａ０とａ、とを除いて直接の再帰関係がないので、１対の項、例えばＣ３とＣ４とは平行に計算できる。これにより高速のベクトルデータ計算が可能となる。しかしながら項ａ、とＣ４の計算は項ａｔ　とＣ２の計算の後に実行されなければならない。

本発明に基づくベクトル処理装置の第１実施例を第５図に基づき詳細に説明する。

第５図においてこのベクトル処理装置は、データ分配回路４０ａと、奇数項計算回路１０Ａおよび偶数項計算回路１０Ｂからなるベクトルデータ計算ユニットとを備える。

データ分配回路４０ａは、第２図に示したベクトルレジスタユニットと奇数項計算回路１０Ａと偶数項計算回路１０Ｂとに設けられ、奇数項および偶数項計算回路１０Ａ　、　ＩＯＢに初期オペランド（データ）ａＯとオペランド（人力ベクトルデータ）ｂｉ＋ｃｉ　とを後述の所定の方法で供給する。またデータ分配回路４０ａは、奇数項計算回路１０Ａにおいて計算された奇数項データａｊと、偶数項計算回路１０Ｂにおいて計算された偶数項データａｋとを受け取り、これらをベクトルレジスタユニットに出力する。

データ分配回路４０ａは、セレクタ制御回路４１ａと、オペランドｂ＋をファーストイン・ファーストアウト（ＦＩＦＯ）　Ｂバ°ツファ（Ｂ−ＢｔｌＦＦ）と、オペランドＣｉをＦＩＦＯバッファであるＣバッファ（Ｃ−ＢＯＦＦ）とを備える。またデータ分配回路４０ａは、セレクタ４６Ａ　、　４７Ａ　、　４８Ａ　、　４６Ｂ　、　４７Ｂ　、　４８Ｂを含む。データ分配回路４０ａはさらに、セレクタ４６Ａ　、　４６ＢにＯを出力するためのゼロ（０）設定器（図示せず）と、セレクタ４７Ａ。

４８Ａ　、　４７Ｂ　、　４８Ｂに１を出力するための１設定器（図示せず）とを備える。

奇数項ａｊを計算するための奇数項計算回路１０Ａは、第１段レジスタ１４Ａ　、　１５Ａ　、　１６Ａと、乗算回路１７Ａと、第２段レジスタ１８Ａ　、　１９Ａと、加算器１１０Ａと、第１段レジスタ１４Ａと、第４段レジスタ１１２Ａと、レジスタ１９Ａの出力端子とセレクタ４８Ａの入力端子との間に接続された第１フイードバツク線２１　Ａと、レジスタ１１２Ａの入力端子とセレクタ４６Ａの入力端子との間に接続された第２フイードバツク線２２Ａと、レジスタＩＩＡの出力端子とセレクタ４７Ａの入力端子との間に接続された第３フイードバツク線２３Ａとを備える。計算された奇数項ａｊはレジスタ１１１Ａからベクトルレジスタユニットに順次に出力される。

レジスタＩＩＡ、および／または、１１２Ａはデータ分配回路４０ａに含めることもできる。

偶数項ａ、を計算するための偶数項計算回路１０Ｂは、奇数項計算回路１０Ａと同一の回路構成を有する。これは演算アルゴリズム自体がどちらも同じだからである。奇数項および偶数項計算回路１０Ａ　、　ＩＯＢは同一の構造を有することができるので、それらの製造およびプリント回路基板（ＰＣＢ）への搭載は極めて簡単である。奇数項および偶数項計算回路１０Ａ。

１０Ｂは、独立して同時に動作可能である。

第５図に示したベクトル処理装置の動作を説明する。

オペランドａｉ、Ｃ４および初期オペランドａ０があらかじめ第１図に示したＭＳＵ　２内に格納されており、スカラ処理装置４において以下に示すような命令セントが検出されると、スカラ処理装置４は動作の制御を第５図に示したベクトル処理装置に移し当該ベクトル処理装置をトリガする。

第１表ＶＬ　Ａ（０）　Ｔｏ　νＲＯＯＶＬ　Ｂ（１）　Ｔｏ　ＶＲＯＩＶＬ　Ｃ（ｔ）　Ｔｏ　ＶＲＯ２ＶＣＡＬ　Ａ（ｉ）　＝　Ａ（ｉ−１）　ＸＢ（１）　＋Ｃ（ｉ）ＶＳＴ　Ａ（ｉ）　Ｔｏ　ＶＲＯＯここでＶＬはベクトルロード命令を表し、ＶＣＡＬはベクトル計算命令を表し、ＶＳＴはベクトル格納命令を表す、　Ａ（ｉ）。

Ｂ　（ｉ）　、　Ｃ（ｉ）はａｉ　、ｂ、＋Ｃｉに対応する。　ＶＲＯＯ、ＶＲＯＩ　。

ＶＲＯ２は、第２図に示したベクトルレジスタユニット内のベクトルレジスタ００　、０１　、０２を表す、なお本実施例において、各ベクトルレジスタは１００ワードの記憶容量を有する。

まず第２図に示すベクトル記憶アクセスユニット（ＶＳＡＵ）５２は、前記ベクトルロード命令に応じて、第２図に示すベクトル命令制御ユニッ）　（ＶＩＣＵ）５１の制御下で、主記憶ユニット（ＭＳＵ）　１に格納されているベクトルデータａＯ＋ｂ＋　・・・ｂｌＯｏとｃｌ・・・Ｃ１゜。とを主記憶制御ユニ・ノＩ−（ＭＳＣＵ）　２を介してベクトルレジスタユニットのベクトルレジスタＶＲＯＯ、ＶＲＯＩ　。

ＶＲＯ２にロードする。

前記ベクトルデータロードの間、第５図に示した回路Ｇこおける再帰方程式ａ、＝ａ、−，Ｘｂ、＋Ｃｉの計算と、計算されたデータａｔのベクトルレジスタＶＲＯＯへの格納とが、前記ベクトル計算命令およびベクトル格納命令とに応じてＶＩＣｔｉ５１の制御下で実行される。

ベクトルレジスタＶＲＯＯ内の計算されたデータａｉは前記演算中にＭＳＵ　１に格納できる。

第５図の回路の動作の詳細を第６図を参照して説明する。

計算は初期項ａｌ＋ａｚを計算するための初期項計算と、それに続く、例えば、ａ、とａａ＋ａｓとａｌ等を計算するための通常項計算とからなる。

まず初期項計算を説明する。

次の第２表および第３表は、セレクタ制御回路４０ｂの制御下でレジスタ１４Ａ　、　１５Ａ　、　１６Ａ　、１１１Ａおよびレジスタ１４Ｂ。

１５Ｂ　、　１６Ｂ　、ＩＩＩＢにロードされるデータを示す。

第２表演　算　ＲＥＧ　ＲＥＧ　ＲＥＧ　ＲＥＧ０４　０　ａｏ　ｘｂ、　＋ｃ、１０６ａ。

第３表演　算　ＲＥＧ　ＲＥＧ　ＲＥＧ　ＲＥＧ０４　Ｃ２ａｏ　ｘｌ）、　＋ｃ、ｂｚデータ分配回路４０ａは、その中に初期オペランドａＯ＋ｂｔ、ｃ＋をロードし、オペランドｂ１およびｃ、をＢ−ＢＬＩＦＦ４２とＣ−ＢＵＦＦ４３とに各々格納する。

肩】≧妹仁久四」」− 演算サイクル０１において、セレクタ制御回路４１ａはセレクタ４６Ａ　、　４７Ａ　、　４８Ａを制御して奇数項計算回路１０Ａ内のレジスタ１４Ａ　、　１５Ａ　、　１６ＡにオペランドＣＨ＋　１）＋　ｒ　ａＯを出力する。これらレジスタ１４Ａ　、　１５Ａ　、　１６Ａは、前記オペランド’ｌ　＋　ｂＩ　＋　ａｏを格納する。同時に、セレクタ制御回路４１ａはセレクタ４６Ｂ　、　４７Ｂ　、　４８Ｂを制御して偶数項計算回路１０Ｂ内のレジスタ１４Ｂ　、　１５Ｂ　、　１６ＢにオペランドＣＩ＋ｂｌ＋ａ０を出力する。これらレジスタ１４Ｂ　、　１５Ｂ　、　１６Ｂは、やはり前記オペランドａｏ　、ｂＩ　＋ＣＩを格納する。

奇数項計算回路１０Ａでは、レジスタ１６Ａが格納したオペランドａ０を被乗数として乗算回路１７Ａに出力し、レジスタ１５ＡがｂＩを乗数として乗算回路１７Ａに出力する。これにより乗算回路１７Ａは（ａｏＸｂ＋）を計算する。

同時に偶数項計算回路１０Ｂでは、レジスタ１６Ｂが格納したオペランドａ０を被乗数として乗算回路１７Ｂに出力し、レジスタ１５Ｂ＃（ｂｌを乗数として乗算回路１７Ｂに出力する。これにより乗算回路１７Ｂは（ａ６　Ｘ　ｂ　＋）を計算する。

艮】」シ仁久四追」ユ奇数項計算回路１０Ａでは、乗算回路１７Ａにおいて計算されたデータ（ａｏＸｂ＋）がレジスタ１９Ａに転送されて格納される。レジスタ１４Ａに格納されているデータＣ１はレジスタ１８Ａに転送されて格納される。

同時に偶数項計算回路１０Ｂでは、乗算回路１７Ｂにおいて計算されたデータ（ａ（ＩＸｂ＋）がレジスタ１９Ｂに転送されて格納される。レジスタ１４Ｂに格納されているデータＣ，はレジスタ１８Ｂに転送されて格納される。

次に奇数項計算回路１０Ａにおいて、加算器１１０Ａがデータ（ａｏｘｂ＋）とデータｃ、とを加算する。この結果、次のような第１の奇数項が得られる。

ａＨ＝ａｏ　ｘｌ）、＋Ｃ＋この時同時に同様の方法で、偶数項計算回路１０Ｂでしょ前言２第１の奇数項ａ、が加算器１１０　Ｂによって得られる。

遺夏並並久上立主奇数項計算回路１０Ａにおいて、計算された第１の奇数項ａｌがレジスタ１１１Ａに転送されて格納される。

偶数項計算回路１０Ｂでは、計算された第１の奇数項ａｌ力くレジスタ１１１Ｂに転送されて格納される。

前記演算中にデータ分配回路４０ａは、ベクトルレジスタＶＲＯＩ　、　ＶＲＯ２からＢ−ＢＵＦＦ４２　、　Ｃ−ＢＵＦＦ４３ニオペランド（ｂ２　。

ｂ、、ｂａ）および（Ｃｔ　＊　Ｃ３ｒ　ｃａ）を各々ロードする。

第１の奇数項ａｌを得たものの、データ分自己回路４０ａＬよこの時点ではそれをベクトルレジスタＶＲＯＯ＆こ出力しなし）。これは第１の偶数項ａ２が得られていないからである。

゛　サイクル０４〜０６偶数項計算回路１０Ｂにおいて第１の偶数項ａ２力く得られ５るまで、奇数項計算回路１０Ａとデータ分配回路４０ａと番よ協（妨してデータａ、をそのままに保持し、第２の奇数項ａ、を８を算するために使用されるオペランドを準備する。

演算サイクル０４において、セレクタ制御１１回路４１ａｕまセレクタ４６Ａ　、　４７Ａ　、　４８Ａを制御してレジスタ１４Ａにゼロデータをセットし、計算された第１の奇数項ａ＋をレジスタ１１１人およびフィードバック線２３Ａを介してレジスタ１５Ａ＆こ設定し、データ１をレジスタ１６Ａに設定する。この結果、演算サイクル０４において乗算回路１７Ａは（ａｌＸｌ）を計算し、演算サイクル０６において加算器１１０Ａはレジスタ１９Ａからのデータ（ａｔＸ１）とレジスタ１８Ａからのゼロ（０）とを加算する。すなわち次のダミー計算が実行される。

ａｔ　＝　（ａｔ　Ｘ　１　）　＋０前記演算中に、演算サイクル０５においてセレクタ制御回路４１ａは、セレクタ４７Ａ　、　４８Ａを制ｊ１１シてレジスタ１５Ａにオペランドｂ３を設定し、レジスタ１６Ａにオペランドｂ２を設定する。データａｌ　は演算サイクル０５においてレジスタ１１１Ａに転送され、さらに演算サイクル０６においてレジスタ１１２Ａに格納される。

偶数項計算回路１０Ｂにおいては、次の第１偶数項ａ２が、そこで計算されレジスタ１１２Ｂに退避されている第１奇数項ａｉを使用して計算される。

ａｘ　＝　（ａｔ　Ｘｂｚ）　十ｃｚこの目的のため、演算サイクル０４においてセレクタ制御回路４１ａは、セレクタ４６Ｂ　、　４７Ｂ　、　４８Ｂを制ｉ１して１ｚジスタ１４ＢにオペランドＣ，を設定し、レジスタ１１１Ｂに退避された第１奇数項ａ、をフィードバック線２３Ｂを介してレジスタ１５Ｂに設定し、オペランドｂ、をレジスタ１６Ｂに設定する。

演算サイクル０５において、第１偶数項ａ２が加算器１１０Ｂに得られ、演算サイクル０６において第１の偶数項ａ、がレジスタ１１１Ｂに退避される。

データ分配回路４０ａは、一対の第１奇数項および偶数項ａ　Ｈｒ　ａ　ｚをレジスタＩＩＩＡ、ＩＩＩＢからベクトルレジスタＶＲＯＯに転送する。

初期項計算はこれで完了する。

次に通常項計算を説明する。

・′　サイクル０３〜０９まず、奇数項計算回路１０Ａにおける第２奇数項ａ３の計算を説明する。

第２奇数項ａ、は以下に示す方程式によって定義されるので、セレクタ制２＋’ Ｂ回路４１ａはセレクタ４６Ａ　、　４７Ａ　、　４８Ａを制御して、第４表に示すようなデータを、第４表に示すような演算サイクルにおいて、レジスタ１４Ａ　、　１５Ａ　、　１６Ａにロードする。

ａｓ　＝ａ、Ｘ　（ｂ、Ｘｂ、）＋ｂ、ｘＣ＝　＋ｃ＝第４表演　算　ＲＥＧ　ＲＥＧ　ＲＥＧ０５　ｂ　３　ｂ　２０７　ｂｓ　ｘ（、＋ｃ：＋　ａｔ　ｂ、　Ｘｔ）＋演算サイクル０３において乗算値（ｂｓＸｃｚ）が乗算回路１７Ａに得られる。演算サイクル０５において合計（ｂ、×Ｃ２）＋Ｃ３が加算器１１０Ａに得られる。演算サイクルＯ５において乗算値（ｂｚｘｂ３）が乗算回路１７Ａに得られる。演算サイクル０７において乗算値（ａ、ｘｂ、Ｘｂ、）が乗算回路１７Ａに得られる。演算サイクル０８において計算されたデータ（ａ、ｘｂ、Ｘｂ、）が加算器１１０Ａに供給される。前記第２奇数項ａ、は加算器１１１Ａで得られる。計算された第２奇数項ａ、は演算サイクル０８においてレジスタ１１１Ａ＆こ退避される。演算サイクル０９においてレジスタ１１１Ａに退避されている第２奇数項ａ、がベクトルレジスタＶＲＯＯに転送されレジスタ１１２Ａに格納される。

前記において、レジスタ１１２Ａに格納されたデータａ、ｌよフィードバック線２２Ａを介してレジスタ１５Ａにフィードツマ・ツクされる。またレジスタ１９Ａに格納されたデータ（ｂｚ　ｘｂｚ）はフィードバック線２１Ａを介してレジスタ１６Ａにフィードバックされる。レジスタ１１１Ａに格納された合計（ｂ３ ×（Ｚ）＋Ｃ，はフィードバック線２３Ａを介してレジスタ１４Ａ＆こフィードバックされる。

同様に、次のような第２偶数項ａ４が偶数項計算回路１０Ｂに得られる。

ａ４　＝ａｚ　Ｘ　ｂ３　Ｘ　ｂ４＋　ｂａ　Ｘ　Ｃ３＋Ｃａセレクタ制御回路４１ａは同様にセレクタ４６Ｂ　、　４７Ｂ　、　４８Ｂを制御して次の第５表に示すデータをレジスタ１４Ｂ　、　１５Ｂ　。

１６Ｂにロードする。

第５表演　算　ＲＥＧ　ＲＥＧ　ＲＥＧ０５　ｂ　ａ　ｂ　３０７　ｃ３Ｘｔｚ＋ｃ４ａｘ　ｂ３Ｘｂ４演算サイクル０９において奇数項および偶数項ａｘ＋ａａがベクトルレジスタユニット内のベクトルレジスタＶＲＯＯに転送される。

“　サイクル０６〜１２同様に、演算サイクル０６〜１２において、次の第３奇数項および偶数項ａｓ＋３６が奇数項および偶数項計算回路１０Ａ。

１０Ｂに得られる。

ａ５−ａｓ　ｘｂ４ｘｂ、　十ｂｓ　×Ｃａ　＋ｃｓａｈ　”ａ４ｘｂ５×ｂｂ　＋ｂｂＸＣｓ　＋Ｃｂ前記計算を実行するため、セレクタ制御回路４１ａはセレクタ４６Ａ　、　４７Ａ　、　４８Ａ　、　４６Ｂ　、　４７Ｂ　、　４８Ｂを制御して第６表および第７表に示すようなデータをレジスタ１４Ａ　、　１５Ａ　、　１６Ａ。

１４Ｂ　、　１５Ｂ　、　１６Ｂにロードする。

第６表演　算　ＲＥＧ　ＲＥＧ　ＲＥＧヱコ」と火　１４Ａ　−ユＩＭ０６　ｃ　、　ｂ　５ｃ　ａＱ３　ｂ　、　ｂ。

１０　Ｃ４Ｘｂｓ　＋ｃｓ　ａ３ｂ４　Ｘｂｓ第７表演　算　ＲＥＧ　ＲＥＧ　ＲＥＧｏｓ　ｂ　、　ｂ　。

１０　Ｃｓ　×ｂｂ　＋Ｃｂ　ａａ　ｂ、　ｘｂ。

演算サイクル１１において奇数項ａ、およびａ、が加算器１１１Ａ、ＩＩＩＢに得られ、それらはベクトルレジスタＶＲＯＯに転送される。

他の複数の対の奇数項および偶数項も前記と同様の方法で得られる。

一対の奇数項および偶数項の計算は、第１の奇数項および偶数項の計算を除いてわずかに３演算サイクルを必要とするだけである。第１の奇数項および偶数項の計算は、従来のベクトル処理装置のサイクル数と同数のサイクル数を要する。

第５図に示したベクトル処理装置によれば、初期計算を除いて、３演算サイクルにおいて２倍のデータを得ることができる。このため第５図に示すベクトル処理装置は、再帰方程式の多（の項を計算する場合、従来のベクトル処理装置に比較して計算能力が２倍である。

本発明に基づくベクトル処理装置の他の実施例を第７図を参照して説明する。

第７図において、ベクトル処理装置は、データ分配回路４０ｂと、奇数項計算回路１０ＡＡおよび偶数項計算回路１０ＢＢを有するベクトルデータ計算ユニットとを備える。

データ分配回路４０ｂは、第２図に示したベクトルレジスタユニットと奇数項計算回路１０ＡＡと偶数項計算回路１０８Ｂとに設けられ、初期オペランドａ０とオペランド（入力データ）ｂ、、ｃｉとを奇数項および偶数項計算回路１０ＡＡ　、　ＩＱＢＢに後述の所定の方法で供給する。またデータ分配回路４０ｂは、奇数項計算口１１（ｌＡａにおいて計算された奇数項データａｊと、偶数項計算回路１０８Ｂにおいて計算された偶数項データａｋとを受け取り、これらをベクトルレジスタユニットに出力する。

データ分配回路４０ｂは、セレクタ制御回路４１ｂと、Ｂ−ＢＵＦＦ４２と、Ｃ −ＢＵＦＦ４３と、バッファレジスタ５１Ａ　、　５２Ａと、セレクタ５３Ａ　、　５４Ａ　、　５５Ａと、レジスタ５１Ｂ、５２Ｂと、セレクタ５３Ｂ　、　５４Ｂ　、　５５Ｂとを備える。またデータ分配回路４０ｂはゼロ設定器と１設定器とを備える（図示せず）、。

奇数項計算回路１０ＡＡは、第１段レジスタ１４Ａ　、　１５Ａ　、　１６Ａと、乗算回路１７Ａと、第２段レジスタ１８Ａ　、　１９Ａと、加算器１１０Ａと、第３段レジスタ１１１Ａと、レジスタＩＩＩＡの出力端子とレジスタ５１Ａの入力端子との間に接続されたフィードバック線２４Ａとを備える。

偶数項計算回路１０８Ｂは、奇数項計算回路１０ＡＡと同一の回路構成を有する。

第７図に示すベクトル処理装置は、第（２）式によって定義される再帰方程式を計算する。奇数項計算回路１０ＡＡとデータ分配回路４０ｂとは協働して第（４）式によって定義される再帰方程式を計算し、偶数項計算回路１０８Ｂとデータ分配回路４０ｂとは、やはり協働して第（３）式によって定義される再帰方程式を計算する。

第７図に示したベクトル処理装置の動作を、第１表に示すような命令セットが与えられる場合について、第８図を参照して詳細に説明する。

第２図に示したＭＳＵ　１　、　ＭＳＣＵ　２　、　ＶＩＣＵ５１、およびＶＳＡＵ５２（７）動作は、前記したものと実質的に同一なので省略する。

第８図において協働サイクルは、初期演算サイクル０１〜０８と、通常演算サイクル０４〜１１　、１０〜１４などである。

遣夏並土り土■二邸次の第８表および第９表は、初期演算サイクルにおけるレジスタ１４Ａ　、　１５Ａ　、　１６Ａ　、ＩＩＩＡ内のデータとレジスタ１４Ｂ。

１５Ｂ　、　１６Ｂ　、ＩＩＩＢ内のデータとを示す。

第８表演　算　ＲＥＧ　ＲＥＧ　ＲＥＧ　ＩＩＩＥＧ０６　ｂｌＸＯ＋ｃｌ　ＩＸａｏ＋Ｏｌｘｂ、＋Ｑ演　算　ＲＥＧ　ＲＥＧ　ＲＥＧ　ＲＥＧ０６　ｃ、×ｂｔ＋ｃｔ　ＩＸａ、＋Ｏｂ、Ｘｂ、＋０８ａ２セレクタ制御回路４１ｂはセレクタ５３Ａ　、　５４Ａ　、　５５Ａを制御して第８表に示すようにデータをレジスタ１４Ａ　、　１５Ａ　、　１６Ａにロードする。またセレクタ制御回路４１ｂはセレクタ５３Ｂ。

５４Ｂ、５５Ｂを制御して第９表に示すようにデータをレジスタ１４Ｂ　、　１５Ｂ　、　１６Ｂにロードする。

まず奇数項計算回路１０ＡＡにおける項ａｊの計算を説明する。

遺豆孟圧えｙ立上データＯ，ｂｌ、１がレジスタ１４Ａ　、　１５Ａ　、　１６Ａにロードされ、（ｂｌＸ１）の計算が乗算回路１７Ａにおいて実行される。

慎】」２−υと釘１データＯ，（ｂｌ　Ｘｉ）がレジスタ１８Ａ　、　１９Ａにロードされ、これらデータが加算器１１０Ａにおいて加算されて結果（ｂｌＸ１＋０）が得られる。

同時にデータＣＩ　＋　ｂｌ　ｒ　Ｏがレジスタ１４Ａ　、　１５Ａ　、　１６Ａにロードされ、（ｂｌ　ｘｏ）が乗算回路１．７Ａにおいて実行される。

蓬夏丈不又土立主データ（ｂ、ｘｉ＋ｏ）がレジスタ１１１Ａに格納される。

レジスタ１８Ａに格納されたデータＣ６とレジスタ１９Ａに格納されたデータ（ｂｌ　ｘｏ）とは加算器１１０Ａにおいて加算され、結果（ｂｒＸＯ＋ｃ＋）が得られる。同時にデータ０゜ａｏ　、１がレジスタ１４Ａ　、　１５Ａ　、　１６Ａにロードされ、（ａ。

×１）の計算が乗算回路１７Ａにおいて実行される。

且夏丈土又）ＬｔＱ土レジスタ１１１Ａに格納されたデータ（ｂ＋ｘｘ＋ｏ）がレジスタ５１Ａに転送される。レジスタ１８Ａに格納されたデータ０とレジスタ１９Ａに格納されたデータ（ａｏＸｌ）とは加算器１１１Ａにおいて加算され、結果（ａｏ　ｘｌ＋Ｏ）が得られる。

遣ｌ土不久四■エデータ（ｂｌ　Ｘ１＋ＣＩ）とデータ（ｂ　＋　Ｘ　Ｏ＋　ｃ　＋）とは、レジスタ５１’Ａ　、　５２Ａに各々順次にロードされる。データ（ａＯｘ　１　＋ｏ）はレジスタ１１１Ａに格納される。

揮】」」シ偲ヒ灸旦レジスタＩＩＩＡに格納されたデータ（ａｏＸ１＋ｏ）はレジスタ１５Ａに転送され、レジスタ５２Ａに格納されたデータ（ｂｌＸ１＋ｏ）はレジスタ１６Ａに転送される。この結果、データ（ａｏ　Ｘ　１　＋　Ｏ）　Ｘ　（Ｉ　Ｘ　ｂｌ　＋　Ｏ）が乗算回路１７Ａに得られる。レジスタ５１Ａに格納されたデータ（ｂ、ＸＱ＋Ｃ＋）はレジスタ１４Ａにロードされる。

遺１」」シソに彰エレジスタ１４Ａからのデータ（ｂ　ｒ　Ｘ　Ｏ＋　ｃ　＋　）はレジスタ１８Ａにロードされる。

レジスタ１８Ａに格納されたデータ（ｂｌｘｏ＋ｃυとレジスタ１９Ａに格納されたデータ（ａ　ｏ　Ｘ　１　＋　Ｏ）　Ｘ　（Ｉ　Ｘ　ｂ　Ｉ＋０）とは加算器１１０Ａにおいて加算され、次のような結果データを得る。

（ａｏ　Ｘ１＋Ｏ）Ｘ　（ＩＸｂｌ　＋Ｏ）＋　（ｂｌ　ＸＯ＋ＣＩ）＝；３６　ｘｂ、＋Ｃ＋箇】巳し仁久四刈」− 計算されたデータａ、はレジスタ１１１Ａに格納されベクトルレジスタＶＲＯＯに転送される。

次に偶数項計算回路１０８Ｂにおける項ａ、の計算を第９表を参照して説明する。

°　サイクル　１データＯ，ｂｚ、ｂ＋がレジスタ１４Ｂ　、　１５Ｂ　、　１６Ｂにロードされ、（ｂｌｘｂｚ）の計算が乗算回路１７Ｂにおいて実行される。

撰２＋シし賢史２データＯ、（ｂｌ　Ｘｂｚ）がレジスタ１８Ｂ　、　１９Ｂニｏ　−）−サれ、これらデータが加算器１１０Ｂにおいて加算されて結果（ｂｌ　×ｂｔ＋ｏ）が得られる。同時にデータｃｚ　ｌ　ＣＩ　＋ｂｔがレジスタ１４Ｂ　、　１５Ｂ　、　１６Ｂにロードされ、（Ｃ，Ｘｂｉ）が乗算回路１７Ｂにおいて実行される。

１１丈土り土立主データ（ｂｌ　×ｂｚ＋０）がレジスタ１１１　Ｂに格納される。

レジスタ１８Ｂに格納されたデータｃ２とレジスタ１９Ｂに格納されたデータ（ＣＩＸｂｚ）とは加算器１１０Ｂにおいて加算され、結果（ｃ、ｘｂ、＋ｃ、）が得られる。同時にデータＯ１ａ、、１がレジスタ１４Ｂ　、　１５Ｂ　、　１６Ｂにロードされ、（ａ。

×１）の計算が乗算回路１７Ｂにおいて実行される。

演】コし仁え四」」エレジスタ１１１Ｂに格納されたデータ（ｂｌ　ｘｂｚ　＋Ｏ）がレジスタ５１Ｂに転送される。データ（ｃ＋　Ｘｂｚ　＋ｃｚ）がレジスタ１１１Ｂに転送される。レジスタ１８Ｂに格納されたデータ０とレジスタ１９Ｂに格納されたデータ（ａｏＸ１＋ｏ）とは加算器１１０Ｂにおいて加算され、結果（ａｏｘ１＋ｏ）が得られる。

撰１」」シυｈ史ｉデータ（Ｃ１Ｘｂｚ　＋ｃｚ）とデータ（ｂｌ　Ｘｂ２＋０）とはレジスタ５１Ｂ、５２Ｂに各々順次にロードされる。データ（ａｏ　Ｘ１＋Ｏ）はレジスタ１１１Ｂに格納される。

遣ｌユ土叉ル立旦データ（ｃ＋　Ｘｂｚ　＋Ｃりはレジスタ１４Ｂにロードされる。

レジスタ１１１Ｂに格納されたデータはレジスタ１５Ｂに転送され、レジスタ５２Ｂに格納されたデータ（ｂ、Ｘｂｚ　＋Ｏ）はレジスタ１６Ｂに転送される。

この結果、データ（ａｏＸ１＋　０　）　Ｘ　（ｂｌ　Ｘ　ｂｚ　＋　Ｏ）が乗算回路１７Ｂで得られる。

肩】巳し仁久四副ｊ− レジスタ１８Ｂに格納されたデータ（ｃ＋　Ｘｂｚ　十Ｃ２）とデータ（ａｏ　ＸＩ＋ｏ）ｘ　（ｂｌ　Ｘｂ、＋Ｏ）とが加算器１１０Ｂにおいて加算され、次のような結果データが得られる。

（ａｏ　ＸＩ　＋Ｏ）Ｘ　（ｂｌ　Ｘｂｚ　＋０）−１−（ｃ＋　Ｘｂｚ　＋ｃｚ）−ａ、ｘｂ、ｘｂ２＋ｂ２　ＸＣＩ　＋ｃｚ計算されたデータａ２はレジスタ１１１Ｂに格納され、ａｌと共にベクトルレジスタＶＲＯＯに転送される。

初期計算はこれで完了する。

さて通常計算を簡単に説明する。通常計算は初期計算と同様であるが、データのロードと転送とが異なる。このため以下の説明は主としてデータのロードに関する。

°　ル〜これらサイクルの間に奇数項ａ、と偶数項ａ４とが計算される。

次の第１０表および第１１表は、レジスタ１４Ａ　、　１５Ａ　。

１６Ａ、ＩＩＩＡとレジスタ１４Ｂ　、　１５Ｂ　、　１６Ｂ　、ＩＩＩＢ内のデータを示す。

第１０表演　算　ＲＥＧ　ＲＥＧ　ＲＥＧ　ＲＥＧサイクル　１４Ａ　１５Ａ　１６Ａ　ＩＩＩＡ０４　０　ｂ３　ｂｚ０５　Ｃ３Ｃ２ｂ２０９　ｂ　＋　Ｘ　Ｃ２＋　Ｃ２ａ　１　１）ｚ　×ｌ）：＋　＋Ｑ１ａ３第１１表演　算　ＲＥＧ　ＲＥＧ　ＲＥＧ　ＲＥＧ０９　ｂａＸｔ４＋ｃａ　ａｘ　ｂ３Ｘｂａ＋　０これらサイクルにおいて奇数項ａ、と偶数項ａ６とが計算される。

次の第１２表および第１３表は、レジスタ１４Ａ　、　１５Ａ　。

第１２表演　算　ＲＥＧ　ＲＥＧ　ＲＥＧ　ＲＥＧサイクル　１４Ａ　１５Ａ　１６Ａ　ＩＩＩＡ０７　０　ｂｓ　ｂ４０８　Ｃ５Ｃ４ｂｓ１２　ｂｓＸｃ４＋ｃｓ　ａ３　ｂａ×ｂ５　＋　０１４ａ。

第１３表演　算　ＲＥＧ　ＲＥＧ　ＲＥＧ　ＲＥＧサイクル　１４Ｂ　、　１５Ｂ　１６Ｂ　ＩＩＩＢ０７　０　ｂ６　ｂ。

０８　ｃｂ　Ｃｓ　ｂ＆１２　ｂ、Ｘｂ、＋ｃ、ａ４ｂ５Ｘｂ６＋。

１４　ａｈ奇数項および偶数項の他の複数の対は、前記と同様の方法で計算できる。

本発明は前記実施例に限定されるものではない。例えば前記実施例においては第（２）弐〜第（４）式で表されるような一次展開再帰方程式を説明してきた。第（１）式で表されるような再帰方程式を二次展開を使用して変形すれば次の式が得られる。

ａ、　＋＝３．−．　ｘｂｉ　＋ｃ６＝ａ、−２ｘｂｉ−１ｘｂ、＋ｂ＝　×（４−＋　＋ｃ、ｔ＝ａ４−、ｘｂｉ− ２ｘｂ、−、ｘｂｉ　＋ｂｉ−ｚ　Ｘｃ４−ｚ＋ｂｉＸ（Ｈ−、ＸＣｉ　−（５）明らかなように、前記式は項ａｉ　とａ　ｉ−３との間に直接再帰関係がないことを示している。

添字ｉが奇数の場合、例えば奇数添字ｊを３および５とすれば、前記式は次のように表せる。

ｊ＝３　：　ａ、＝ａＯＸｂ、Ｘｂ、Ｘｂ３＋ｂ、Ｘｂ、ＸＣ４＋ｂｂ　Ｘ（，２＋ｃｘ　・”　（６）ｊ＝ｓ　：　ａ、＝３．Ｘｂ、ＸＩ）４Ｘｂ５＋ｂ、ｘｂａ　ｘＣａｌ　＋　ｂ、Ｘ　Ｃ４＋　Ｃ５”’　（７）添字ｉが偶数の場合、例えば奇数添字ｋを４および６とすれば、前記式は次のように表せる。

ｋ＝４　：　ａｎ　＝ａ、Ｘｂ、Ｘｂ：＋　Ｘｂ、＋ｂｚ　Ｘｂ３ｘＣ２＋ｂ４ＸＣ３＋Ｃａ　”’　（８）ｋ−６：　ａｈ　＝ａｘ　ｘｂ４ｘｌ）、ｘｂ、＋ｂａ　ｘｂ、ＸＣ４＋ｂｂ　ｘ（、＋Ｃ６””　（９）前記第（６）弐〜第（９）弐から、２つの奇数項ａ３＋ａ％と２つの偶数項ａ４．ａ、とが同一タイミングで同時に計算できる。このため演算時間はさらに短縮される。この実施例において、奇数項計算回路は２つの隣接する奇数項、例えばａ３＋ａｓを同一タイミングで計算するように形成されている。同様に偶数項計算回路は２つの隣接する偶数項を同一タイミングで計算するように形成されている。データ分配回路はデータを奇数および偶数項計算回路に分配して前記式の計算を実行させる。

産業上の利用可能性本発明のベクトル処理装置は種々のデータ処理システムに適用可能である。

会−ｊＬ」Ｅ−号１０Ａ　、　ｌ０ＡＡ・・・奇数項計算回路１０Ｂ　、　ｌ０ＢＢ・・・偶数項計算回路１４Ａ−１６Ａ・・・レジスタ１４Ｂ−１６Ｂ・・・レジスタ１７Ａ　、　１７Ｂ・・・乗算回路１８Ａ　、　１９Ａ・・・レジスタ１８Ｂ　、　１９Ｂ・・・レジスタ２１Ａ　、　２２Ａ・・・フィードバック線２１Ｂ、２２Ｂ・・・フィードバック線４０ａ、４０ｂ・・・データ分配回路４１ａ、４１ｂ・・・セレクタ制御回路４６Ａ−４８Ａ・・・セレクタ４６Ｂ−４８Ｂ・・・セレクタ５１Ａ　、　５２Ａ・・・レジスタ５１Ｂ、５２Ｂ・・・レジスタ５３Ａ−５５Ａ・・・セレクタ５３Ｂ−５５Ｂ・・・セレクタ１１０Ａ、ｌｌ０Ｂ・・・加算器１１１Ａ、１１２Ａ・・・レジスタ１１１Ｂ　、１１２Ｂ・・・レジスタ国際調査報告ＳＡ　２２１５７

Claims

【特許請求の範囲】１．ベクトル命令を制御するためのベクトル命令制御ユニット（５１）と、主記憶ユニットにおける入力ベクトルデータと計算されたデータとをアクセスするためのベクトル記憶アクセスユニット（５２）と、前記ベクトル命令ユニットの制御下においてベクトルデータを計算するためのベクトル計算ユニットと、前記ベクトルデータアクセスユニットと前記ベクトル計算ユニットとの間でデータを転送するためのデータ分配ユニット（５４）とを備え、前記ベクトル処理装置が、少なくとも１個の奇数項計算回路（１０Ａ，１０ＡＡ）と少なくとも１個の偶数項計算回路（１０Ｂ，１０ＢＢ）とを有するベクトル計算ユニットと、前記ベクトル計算ユニットに作動的に接続されて協働するデータ分配ユニット（４０ａ，４０ｂ）とを備え、変形された再帰方程式を処理し、各奇数項計算回路が、変形された再帰方程式の各奇数項を計算するように形成され、加算回路（１１０Ａ）と、乗算回路（１７Ａ）と、計算した奇数項を保持する少なくとも１個のデータ記憶回路（Ｈ２Ａ，５１Ａ，５２Ａ）と、前記データ記憶回路を介して前記乗算回路、および／または、前記加算回路に前記計算した奇数項をフィードバックする少なくとも１本のフィードバック線（２１Ａ，２２Ａ，２３Ａ，２４Ａ）とを備え、各偶数項計算回路が、再帰方程式の偶数項を計算するように形成され、他の加算回路（１１０Ｂ）と、他の乗算回路（１７Ｂ）と、計算された偶数項を保持する少なくとも１個の他のデータ記憶回路（１１２Ｂ，５１Ｂ，５２Ｂ）と、前記他のデータ記憶回路を介して前記別の乗算回路、および／または、前記他の加算回路に前記計算した偶数項をフィードバックする少なくとも１本のフィードバック線（２１Ｂ，２２Ｂ．２３Ｂ，２４Ｂ）とを備え、前記データ分配ユニットが、０を出力するための第１のデータ設定器と、１を出力するための第２のデータ設定器と、前記設定器からの定数データ０および１と計算された奇数項および偶数項とを使用して再帰方程式を計算するための入力オペランド（ａｉ，ｂｉ）を選択する第１〜第６セレクタ（４６Ａ，４７Ａ，４８Ａ，４６Ｂ，４７Ｂ，４８Ｂ）と、変形された再帰方程式によって規定される所定の方法において前記セレクタを制御するためのセレクタ制御回路（４０ａ，４０ｂ）とを備え、選択されたデータを前記奇数および偶数項計算回路へ供給する、ベクトル処理装置。２．前記奇数項および偶数項計算回路が独立して同時に動作可能であり、同一演算時間に前記再帰方程式の少なくとも各１対の隣接する奇数項および偶数項（ａｉ，ａｉ＋１）を計算する、請求の範囲１に基づくベクトル処理装置。３．前記データ分配ユニット（４０ａ，４０ｂ）が、元の乗数、および／または、被乗数として複数の前記第１オペランド（ｂｉ）を入出力するためのファーストイン・ファーストアウトバッファ（４２）と、元の加数として複数の前記第２オペランド（Ｃｉ）を入出力するためのファーストイン・ファーストアウトバッファ（４３）とを備える、請求の範囲２に基づくベクトル処理装置。４．前記変形された再帰方程式が１次展開されて次のように表され、ａｉ＝ａｉ−２×ｂｉ−１×ｂｉ＋ｂｌ×Ｃｉ−１十Ｃｉ…（１）前記奇数項計算回路が次の式を計算し、ａ１＝ａ０×ｂ１＋Ｃ１ａｊ＝ａｊ−２×ｂｊ−１×ｂｊ＋ｂｊ×Ｃｊ−１＋Ｃｊ…（２）ここでｊは奇数の整数（ｊ＝１，３，…，ｎ）であり、前記偶数項計算回路が次の式を計算し、ａｋ＝ａｋ−２×ｂｋ−１×ｂｋ＋ｂｋ×Ｃｋ−１＋Ｃｋ…（３）ここでｋは偶数の整数（ｋ＝２，４，…，ｎ＋１）である、請求の範囲３に基づくベクトル処理装置。５．前記奇数項計算回路が第１〜第３フィードバック線（２１Ａ，２２Ａ，２３Ａ）を備えると共に、（ａ）前記加算回路（１１０Ａ）が前記第１セレクタ（４６Ａ）から加数を受け取り、（ｂ）前記乗算回路（１７Ａ）が前記第２および第３セレクタ（４７Ａ，４８Ａ）から乗数および被乗数を受け取り、（ｃ）前記加算回路（１１０Ａ）が前記乗算回路で乗算されたデータを受け取り、（ｄ）前記データ記憶回路（１１２Ａ）が前記加算回路で加算されたデータを受け取り、（ｅ）前記第１セレクタ（４６Ａ）が定数０と、前記第２バッファ（４３）からの前記第２オペランド（Ｃｉ）と、前記第２フィードバック線（２２Ａ）を介しての前記データ記憶回路（１１２Ａ）からの前記格納データとを受け取り、（ｆ）前記第２セレクタ（４７Ａ）が前記定数１と、前記第１オペランド（ｂｉ）と、前記第３フィードバック線（２３Ａ）を介して前記加算されたデータとを受け取り、（ｇ）前記第３セレクタ（４８Ａ）が前記定数１と、初期データ（ａｏ）と、前記第１および第２バッファ（４２，４３）からの前記第１および第２オペランドと、前記第１フィードバック線（２１Ａ）を介して前記乗算回路（１７Ａ）からの前記乗算されたデータとを受け取るように構成され、前記偶数項計算回路が別の第１〜第３フィードバック線（２１Ｂ，２２Ｂ，２３Ｂ）を備えると共に、（ｈ）前記他の加算回路（１１０Ｂ）が前記第４セレクタ（４６Ｂ）から加数を受け取り、（ｉ）前記他の乗算回路（１７Ｂ）が前記第５および第６セレクタ（４７Ｂ，４８Ｂ）から乗数および被乗数を受け取り、（ｊ）前記他の加算回路（１１０Ｂ）が前記他の乗算回路で乗算されたデータを受け取り、（ｋ）前記他のデータ記憶回路（１１２Ｂ）が前記他の加算回路で加算されたデータを受け取り、（１）前記第４セレクタ（４６Ｂ）が定数０と、前記第２バッファ（４３）からの前記第２オペランド（Ｃｉ）と、前記第２フィードバック線（２２Ｂ）を介して前記データ記憶回路（１１２Ｂ）からの前記格納データとを受け取り、（ｍ）前記第５セレクタ（４７Ｂ）が前記定数１と、前記第１オペランド（ｂｉ）と、前記他の第３フィードバック線（２３Ｂ）を介して前記加算されたデータとを受け取り、（ｎ）前記第６セレクタ（４８Ｂ）が前記定数１と、前記初期データ（ａｏ）と、前記第１および第２バッファ（４２，４３）からの前記第１および第２オペランド（ｂｉ，ｃｉ）と、前記他の第１フィードバック線（２１Ｂ）を介して前記乗算回路（１７Ｂ）からの前記乗算されたデータとを受け取るように構成された、請求の範囲４に基づくベクトル処理装置。６．前記奇数項計算回路（１０Ａ）が、前記第１セレクタ（４６Ａ）に接続されてそこからのデータを一時的に格納する第１段の第１データ記憶回路（１４Ａ）と、前記第２および第３セレクタ（４７Ａ，４８Ａ）と前記乗算回路（１７Ａ）との間に接続され前記第２および第３セレクタからのデータを一時的に格納する第１段の第２および第３データ記憶回路（１５Ａ，１６Ａ）と、前記第１段の第１データ記憶回路と前記加算回路との間に接続されて前記第１段の第１データ記憶回路からのデータを一時的に格納する第２段の第１データ記憶回路（１８Ａ）と、前記乗算回路に入力端子が接続され前記加算回路と前記第１フィードバック線とに出力端子が接続されて前記乗算回路において乗算されたデータを一時的に格納する第２段の第２データ記憶回路（１９Ａ）と、前記加算回路と前記データ記憶回路（１１２Ａ）との間に接続されると共に前記第３フィードバック線に接続されて前記加算回路において加算されたデータを一時的に格納する第３段のデータ記憶回路（１１１Ａ）とを備え、前記偶数項計算回路（１０Ｂ）が、前記他の第１セレクタ（４６Ｂ）に接続されてそこからのデータを一時的に格納する他の第１段の第１データ記憶回路（１４Ｂ）と、前記他の第２および第３セレクタ（４７Ｂ，４８Ｂ）と前記他の乗算回路（１７Ｂ）との間に接続され前記他の第２および第３セレクタからのデータを一時的に格納する他の第１段の第２および第３データ記憶回路（１５Ｂ，１６Ｂ）と、前記他の第１段の第１データ記憶回路と前記他の加算回路との間に接続されて前記他の第１段の第１データ記憶回路からのデータを一時的に格納する他の第２段の第１データ記憶回路（１８Ｂ）と、前記他の乗算回路に入力端子が接続され前記他の加算回路と前記他の第１フィードバック線とに出力端子が接続されて前記他の乗算回路において乗算されたデータを一時的に格納する他の第２段の第２データ記憶回路（１９Ｂ）と、前記他の加算回路と前記他のデータ記憶回路（１１２Ｂ）との間に接続されると共に前記他の第３フィードバック線に接続されて前記他の加算回路において加算されたデータを一時的に格納する他の第３段データ記憶回路（１１１Ｂ）とを備える、請求の範囲５に基づくベクトル処理装置。７．初期演算時において、前記奇数項計算回路と前記データ分配回路とが協働して次の項を２つの演算時間の間に計算し、ａ１＝ａ０×ｂ１＋ｃ１ａ１＝ａ１×１＋０前記偶数項計算回路と前記データ分配回路とが協働して次の項を前記２つの演算時間の間に計算し、ａ１＝ａ０×ｂ１＋ｃ１ａ２＝ａ１×ｂ２＋ｃ２前記初期演算時の後の通常演算時において、前記奇数項計算回路と前記データ分配回路とが協働して次の式の各奇数項を各演算時間内に計算し、ａｊ＝ａｊ−２ ×ｂｊ−１×ｂｊ＋ｂｊ×ｃｊ−１＋ｃｊここでｊ＝１，３，…，ｎであり、前記偶数項計算回路と前記データ分配回路とが協働して次の式の各偶数項を前記演算時間内に計算し、ａｋ＝ａｋ−２×ｂｋ−１×ｂｋ＋ｂｋ×ｃｋ−１＋ｃｋここでｋ＝２，４，…，ｎ＋１である、請求の範囲６に基づくベクトル処理装置。８．各前記演算時間が前記ベクトル処理装置における複数の演算サイクルからなり、前記演算時間が各項の計算について同一であり、隣接する項を計算するための隣接する演算時間が部分的に重なり合う、請求の範囲７に基づくベクトル処理装置。９．前記データ分配ユニット（４０ａ）が前記第３段および前記別の第３段データ記憶回路（１１０Ａ，１１０Ｂ）からデータを受け取り当該データを前記ベクトル記憶アクセスユニット（５２）に出力する、請求の範囲８に基づくベクトル処理装置。１０．前記ベクトル記憶アクセスユニットが前記入力オペランドと前記計算された奇数項および偶数項とを一時的に格納するためのベクトルレジスタユニットを備え、前記データ分配回路が前記入力オペランドと前記計算された奇数項および偶数項を転送する、請求の範囲９に基づくベクトル処理装置。１１．前記奇数項計算回路が、フィードバック線（２４Ａ）と、前記フィードバック線（２４Ａ）を介して供給される計算された奇数項を格納するための直列接続された第１および第２データ記憶回路（５１Ａ，５２Ａ）とを備えると共に、（ａ）前記加算回路（１１０Ａ）が前記第１セレクタ（５３Ａ）から加数を受け取り、（ｂ）前記乗算回路（１７Ａ）が前記第２および第３セレクタ（５４Ａ，５５Ａ）から乗数および被乗数を受け取り、（ｃ）前記加算回路（１１０Ａ）が前記乗算回路で乗算されたデータを受け取り、（ｄ）前記第１データ記憶回路（５１Ａ）が前記加算回路で加算されたデータを受け取り、（ｅ）前記第２データ記憶回路（５２Ａ）が前記第１データ記憶回路からデータを受け取り、（ｆ）前記第１セレクタ（５３Ａ）が前記定数０と、前記第２バッファ（４３）からの前記第２オペランド（ｃｉ）と、前記第１データ記憶回路からのデータとを受け取り、（ｇ）前記第２セレクタ（５４Ａ）が前記定数０と、初期データ（ａｏ）と、前記第１および第２オペランド（ｂｉ，ｃｉ）と、前記第１のフィードバック線を介しての前記加算回路で加算された前記データとを受け取り、（ｈ）前記第３セレクタ（５５Ａ）が前記定数１と、前記第１バッファ（４２）からの前記第１オペランドと、前記第２データ記憶回路（５２Ａ）に格納された前記データを受け取るように構成され、前記偶数項計算回路が、他のフィードバック線（２４Ｂ）と、前記フィードバック線（２４Ｂ）を介して供給される前記計算された偶数項を格納するための直列接続された他の第１および第２データ記憶回路（５１Ｂ，５２Ｂ）とを備えると共に、（ｉ）前記他の加算回路（１１０Ｂ）が前記第４セレクタ（５３Ｂ）から加数を受け取り、（ｊ）前記他の乗算回路（１７Ｂ）が前記第５および第６セレクタ（５４Ｂ，５５Ｂ）から乗数および被乗数を受け取り、（ｋ）前記他の加算回路（１１０Ｂ）が前記他の乗算回路で乗算されたデータを受け取り、（ｌ）前記他の第１データ記憶回路（５１Ｂ）が前記他の加算回路で加算されたデータを受け取り、（ｍ）前記他の第２データ記憶回路（５２Ｂ）が前記他の第１データ記憶回路からデータを受け取り、（ｎ）前記第４セレクタ（５３Ｂ）が定数０と、前記第２バッファ（４３）からの前記第２オペランド（ｃｉ）と、前記第１データ記憶回路からのデータとを受け取り、（ｏ）前記第５セレクタ（５４Ｂ）が前記定数０と、前記初期データ（ａｏ）と、前記第１および第２オペランド（ｂｉ，ｃｉ）と、前記他のフィードバック線を介して前記他の加算回路で加算された前記データとを受け取り、（ｐ）前記第６セレクタ（５５Ｂ）が前記定数１と、前記第１バッファ（４２）からの前記第１オペランドと、前記別の第２データ記憶回路（５２Ｂ）に格納された前記データとを受け取るように構成された、請求の範囲４に基づくベクトル処理装置。１２．前記奇数項計算回路（１０ＡＡ）が、前記第１セレクタ（５３Ａ）に接続されてそこからのデータを一時的に格納する第１段の第１データ記憶回路（１４Ａ）と、前記第２および第３セレクタ（５４Ａ，５５Ａ）と前記乗算回路（１７Ａ）との間に接続され前記第２および第３セレクタからのデータを一時的に格納する第１段の第２および第３データ記憶回路（１５Ａ，１６Ａ）と、前記第１段の第１データ記憶回路と前記加算回路との間に接続されて前記第１段の第１データ記憶回路からのデータを一時的に格納する第２段の第１データ記憶回路（１８Ａ）と、前記乗算回路に入力端子が接続され前記加算回路に出力端子が接続されて前記乗算回路において乗算されたデータを一時的に格納する第２段の第２データ記憶回路（１９Ａ）と、前記加算回路と前記データ記憶回路（５１Ａ）との間に前記フィードバック線を介して接続されて前記加算回路において加算されたデータを一時的に格納する第３段データ記憶回路（１１１Ａ）とを備え、前記偶数項計算回路（１０ＢＢ）が、前記他の第１セレクタ（５３Ｂ）に接続されてそこからのデータを一時的に格納する別の第１段の第１データ記憶回路（１４Ｂ）と、前記他の第２および第３セレクタ（５４Ｂ，５５Ｂ）と前記他の乗算回路（１７Ｂ）との間に接続されて前記他の第２および第３セレクタからのデータを一時的に格納する他の第１段の第２および第３データ記憶回路（１５Ｂ，１６Ｂ）と、前記他の第１段の第１データ記憶回路と前記他の加算回路との間に接続されて前記他の第１段の第１データ記憶回路からのデータを一時的に格納する別の第２段の第１データ記憶回路（１８Ｂ）と、前記他の乗算回路に入力端子が接続され前記他の加算回路に出力端子が接続されて前記他の乗算回路において乗算されたデータを一時的に格納する他の第２段の第２データ記憶回路（１９Ｂ）と、前記他の加算回路と前記他のデータ記憶回路（５１Ｂ）との間に前記他のフィードバック線を介して接続されて前記他の加算回路において加算されたデータを一時的に格納する他の第３段データ記憶回路（１１１Ｂ）とを備える、請求の範囲１１に基づくベクトル処理装置。１３．初期演算時において、前記奇数項計算回路と前記データ分配回路とが協働して次の項を２つの演算時間の間に計算し、ａ１＝ａ０×ｂ１＋ｃ１ａ１＝ａ１×１＋０前記偶数項計算回路と前記データ分配回路とが協働して次の項を前記２つの演算時間の間に計算し、ａ１＝ａ０×ｂ１＋ｃ１ａ２＝ａ１×ｂ２＋ｃ２前記初期演算時の後の通常演算時において、前記奇数項計算回路と前記データ分配回路とが協働して次の式の各奇数項を各演算時間内に計算し、ａｊ＝ａｊ−２ ×ｂｊ−１×ｂｊ＋ｂｊ×Ｃｊ−１＋ｃｊここでｊ＝１，３，…，ｎであり、前記偶数項計算回路と前記データ分配回路とが協働して次の式の各偶数項を前記演算時間内に計算し、ａｋ＝ａｋ−２×ｂｋ−１×ｂｋ＋ｂｋ×ｃｋ−１＋ｃｋここでｋ＝２，４，…，ｎ＋１である、請求の範囲１２に基づくベクトル処理装置。１４．各前記演算時間が前記ベクトル処理装置における複数の演算サイクルからなり、前記演算時間が各項の計算について同一であり、隣接する項を計算するための隣接する演算時間が部分的に重なり合う、請求の範囲１３に基づくベクトル処理装置。１５．前記データ分配ユニット（４０ｂ）が前記第３段および前記他の第３段データ記憶回路（１１０Ａ，１１０Ｂ）からデータを受け取り当該データを前記ベクトル記憶アクセスユニット（５２）に出力する、請求の範囲１４に基づくベクトル処理装置。１６．前記ベクトル記憶アクセスユニットが前記入力オペランドと前記計算された奇数項および偶数項とを一時的に格納するためのベクトルレジスタユニットを備え、前記データ分配回路が前記入力オペランドと前記計算された奇数項および偶数項を転送する、請求の範囲１５に基づくベクトル処理装置。