JPH06230964A - キャッシュメモリを備えた計算機 - Google Patents

キャッシュメモリを備えた計算機

Info

Publication number
JPH06230964A
JPH06230964A JP5014785A JP1478593A JPH06230964A JP H06230964 A JPH06230964 A JP H06230964A JP 5014785 A JP5014785 A JP 5014785A JP 1478593 A JP1478593 A JP 1478593A JP H06230964 A JPH06230964 A JP H06230964A
Authority
JP
Japan
Prior art keywords
data
cache memory
memory
main memory
arithmetic unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5014785A
Other languages
English (en)
Inventor
Mitsuo Asai
光男 浅井
Shigeru Yabuuchi
繁 藪内
Tetsuhiko Okada
哲彦 岡田
Takehisa Hayashi
林  剛久
Hiroshi Takeda
博 武田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP5014785A priority Critical patent/JPH06230964A/ja
Publication of JPH06230964A publication Critical patent/JPH06230964A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 ベクトル演算を多く必要とするようなグラフ
ィック機能や数値演算のアプリケーションを高速に実行
することができる計算機をコンパクトでかつ低価格で、
提供する。 【構成】 パイプライン制御を採用し、キャッシュメモ
リを備えた計算機において、同期型メインメモリ104
と、該同期型メインメモリの記憶内容の一部のコピーを
格納するキャッシュメモリ103と、同期型メインメモ
リからクロックに同期して順次データを読み出す読み出
し手段1120と、データの演算を行う演算ユニット1
01,102と、読み出されたデータを直接前記演算ユ
ニットに供給する供給手段121,122,105と、
演算ユニットの出力をキャッシュメモリに書き込む書込
み手段と、パイプライン制御の制御信号を計算機各部へ
供給するパイプライン制御手段141とを備えた。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、キャッシュメモリを備
えた計算機に関し、特に、低価格な個人用計算機を構成
するのに適した計算機に関する。
【0002】
【従来の技術】従来の計算機の高速化手法として、演算
ユニットとメインメモリの間にキャッシュメモリを置く
方法がある。
【0003】従来の計算機では、メモリ上からデータを
プロセッサ内のレジスタにロードし、レジスタにロード
されたデータに対して演算を行う。通常のプログラムで
は、頻繁にアクセスされるデータや命令が一部のアドレ
スに集中するというローカル性がある。キャッシュメモ
リによる高速化手法は、間近にアクセスされたデータま
たは命令のコピーをアクセス時間の短いキャッシュメモ
リに残しておくことによりアクセス時間の短縮を図るも
のである。キャッシュメモリはメインメモリより高速に
読み出し及び書き込みが可能である。しかし、高価格な
ためキャッシュの大容量化は高コスト化を招いてしま
う。一般に、メインメモリにはダイナミック型ランダム
アクセスメモリ(DRAM)が用いられ、キャッシュメ
モリは、プロセッサチップ内に持つ場合が多く、外部に
持つ場合は高速なスタテイック型ランダムアクセスメモ
リが用いられている。
【0004】
【発明が解決しようとする課題】しかし、数値演算や画
像処理などでは、アクセスするデータがキャッシュメモ
リの容量よりはるかに大きいため、上記のローカル性が
低く、常にメインメモリからデータを読み出さなければ
ならず、キャッシュメモリによる高速化が期待できない
という問題がある。そのため、数値演算用の計算機で
は、メインメモリもすべて高速なスタテイック型ランダ
ムアクセスメモリから構成したりしている。また、グラ
フィック処理を高速に行うために、画像データ用の高速
なフレームバッファや専用のプロセッサを付加したりし
て高速化を行っているものがある。しかし、それらはい
ずれも特殊なハードウエアを持つため、高コストなもの
となってしまう。
【0005】一方、同期型(シンクロナス)DRAM
(日経エレクトロニクス1992.5.11 no.553)や、DRA
Mを使ったメモリモジュールのRambus(日経エレ
クトロニクス1992.3.16 no.549)など低価格で高スルー
プットを実現するものが発表がされている。
【0006】本発明は、同期型DRAMなどの低価格で
高スループットなメモリを利用し、それに適した計算機
を実現することにある。大規模なデータを扱う数値演算
や高速なグラフィック機能を、特別なハードウエアを付
加せず低価格で提供し、かつコンパクトに実現すること
である。
【0007】
【課題を解決するための手段】本発明による、キャッシ
ュメモリを備えた計算機は、パイプライン制御を採用
し、キャッシュメモリを備えた計算機において、同期型
メインメモリと、該同期型メインメモリの記憶内容の一
部のコピーを格納するキャッシュメモリと、前記同期型
メインメモリからクロックに同期して順次データを読み
出す読み出し手段と、データの演算を行う演算ユニット
と、前記読み出されたデータを直接前記演算ユニットに
供給する供給手段と、前記演算ユニットの出力を前記キ
ャッシュメモリに書き込む書込み手段と、前記パイプラ
イン制御の制御信号を計算機各部へ供給するパイプライ
ン制御手段とを備えたことを特徴とする。
【0008】好ましくは、前記同期型メインメモリは同
期型ダイナミックRAMからなる少なくとも2個のバン
クを有し、前記読み出し手段は、前記2個のバンクから
2つのデータを同時に読み出し、前記供給手段は該2つ
のデータを同時に前記演算ユニットに転送する第1およ
び第2のパスを有する。
【0009】また、クロックに同期して、前記同期型メ
インメモリから前記演算ユニットの処理速度に対応する
速度でデータが順次読みだされ、前記演算ユニットの演
算結果が前記キャッシュメモリに順次書き込まれる。
【0010】
【作用】本発明による計算機では、スループットの高い
同期型ダイナミックRAM(DRAM)などでメインメ
モリを構成する。同期型DRAMは、連続してデータを
読み出せば、プロセッサのデータ処理能力と等しいデー
タ量の読み出しが可能である。また、このメインメモリ
を少なくとも2個のバンクで構成するとともに、2つの
読み出しパスを設けることにより、演算の対象となる2
つのデータを同時に読み出すことができる。また、本発
明による計算機は、このように同期型DRAMで構成す
るメインメモリから順次転送されるデータを演算し、そ
の演算結果をキャッシュメモリに順次書き込む命令を設
ける。したがって、ベクトル演算を、パイプライン動作
をみださずに高速に実行することができる。
【0011】また、グラフィック表示のために、キャッ
シュメモリ上のデータをメモリ上の任意のアドレスに書
き込む命令を持つ。この命令により、例えば、フォント
データを変形または加工したデータやいろいろなパター
ンデータをキャッシュメモリ上に作り、それを画面上の
いろいろな場所に高速にコピーすることなどが可能とな
る。
【0012】本発明によれば、メインメモリから高速に
データを読みだして処理を行うことができ、膨大なベク
トル演算や高速なグラフィック機能を必要とするアプリ
ケーションを高速に実行でき、かつ低価格でコンパクト
な計算機を市場に提供することができる。
【0013】
【実施例】以下、実施例を用いて本発明を説明する。
【0014】図9に本発明を適用した、液晶型ディスプ
レイ部1002およびキーボード部1001からなる小
型ワークステーション1000を示す。本実施例では、
まず、このような小型ワークステーションにより高速に
ベクトル演算を行う方法及び命令について説明する。
【0015】図1において、本実施例の計算機の構成を
説明する。本図において、101は整数系演算ユニッ
ト、102は浮動小数点演算ユニットを示す。これらの
演算ユニットは同時に2つのデータを入力し、1つの結
果を出力する。整数系演算ユニット101は整数値同士
の加算、減算、論理演算、シフト演算等を行うことがで
きる。浮動小数点演算ユニット102は浮動小数点演算
を行うユニットである。103はキャッシュメモリ、1
04は前記文献に記載されたような同期型DRAMを用
いたメインメモリを示す。105は読み出しデータ制御
回路、106は書き込みデータ制御回路を示す。112
は整数系演算ユニット101の結果を送る演算結果パ
ス、113は浮動小数点演算ユニット102の結果を送
る演算結果パスである。115と116はそれぞれ演算
ユニットの入力パスである。121と122は同期型メ
インメモリからの読み出しパス、131と132はキャ
ッシュメモリからの読み出しパスである。111はキャ
ッシュメモリの内容を同期型メインメモリ104に書き
込むフラッシュキャッシュメモリ用パスである。
【0016】整数系演算ユニット101と浮動小数点演
算ユニット102は、読み出しデータ制御回路105よ
り演算入力パス115、116を介して、演算対象とな
る2つのデータを入力する。同期型メインメモリ104
とキャシュメモリ103は、それぞれ、読み出しパス1
21、122と読み出しパス131と132とを介し
て、読み出しデータ制御回路105に接続される。命令
に応じて、同期型メインメモリ104またはキャッシュ
メモリ103のデータが演算ユニット101,102へ
送られる。2つの演算ユニット101,102の演算結
果は演算結果パス112と113から書き込みデータ制
御回路106に送られる。そして、命令により、書き込
みパス123を介して同期型メインメモリ104へ、ま
たは書き込みパス124を介してキャッシュメモリ10
3へ、データが送られ書き込まれる。また、キャッシュ
メモリ103のデータは、フラッシュキャッシュメモリ
用パス111、書き込みデータ制御回路106および書
き込みパス123を介して、同期型メインメモリ104
へ送ることができる。図1中、同期型メインメモリ10
4以外のプロセッサ部140を、1つの集積回路に集積
することが可能である。また、141はプロセッサ部制
御回路であり、制御信号線142によって、プロセッサ
部140内の制御を行う。以下に説明するプロセッサ部
140内での動作は全て、プロセッサ部制御回路141
が制御を行う。
【0017】次に、図10を用いて、読み出しデータ制
御回路105および同期型メインメモリ104の詳細を
説明する。図10において、読み出しデータ制御回路1
05は2個の選択回路1101、1102からなる。選
択回路1101は、キャッシュメモリ103からの読み
出しパス131またはメインメモリ104からの読み出
しパス121のいずれかを選択して、演算入力パス11
5へ出力する。いずれを選択するかは、命令によって決
まり、プロセッサ部制御回路141が制御する。同様
に、選択回路1102は、キャッシュメモリ103から
の読み出しパス132またはメインメモリ104からの
読み出しパス122のいずれかを選択して、演算入力パ
ス116へ出力する。
【0018】同期型メインメモリ104は、2個のバン
ク1111,1112を有する。図1では図示しなかっ
たメモリ制御回路1120により、バンク1側の読み出
しデータを読み出しパス121,122のいずれに出力
するか、およびバンク2側の読み出しデータを読み出し
パス121,122のいずれに出力するかが制御され
る。メモリ制御回路1120はプロセッサ部制御回路1
41により制御され、また、プロセッサ部制御回路14
1へ割り込み発生信号1130を出力する。この割り込
み信号1130は次のように用いられる。すなわち、後
述するVADD命令、MFMUL命令等では、メインメ
モリ104から同時に2つのデータの読出しを要する。
そのため、これらの命令の対象となる2つのデータは、
メインメモリ104に格納する段階で、それぞれ別個の
バンクに格納しておくようにすることが好ましい。しか
し、プロセッサ部制御回路141がメモリ制御回路11
20に対して別個のバンクに存在するデータの読出しを
同時に行う要求を出す場合もあり、このような場合に、
メモリ制御回路1120はその旨、割り込み発生信号1
130によりプロセッサ部制御回路141へ通知する。
これに応じてプロセッサ部制御回路141は、割り込み
処理を行い、ソフトウエアによる割り込みハンドラによ
り、一方のデータを別のバンクに移動させる処理を行う
ことにより動作を継続することができる。この処理は特
別なハードウエアにより行うことも可能である。
【0019】次に図2を用いて、図1の計算機が持つベ
クトル演算命令について、説明する。ベクトル演算命令
の1つVADD,A,B,C,n命令は、ベクトルAと
ベクトルBを加算し、その結果をベクトルCとする命令
であり、C[k]=A[k]+B[k](k=0,…,
n−1)を行う。ここに、nはベクトルの次元を示す。
ここで、A,B,Cは実際のメインメモリ上のアドレス
として説明をするが、アクセスするメモリのポインタを
演算ユニット内のレジスタに格納しておくことにより、
A,B,Cを参照するレジスタ番号とすることも可能で
ある。ベクトルの次元nはメモリ上ではワード数に対応
する。図2では、横方向に進むと、クロックサイクルが
進む。IF,ID,E,M,W,Lはパイプライン動作
の各ステージの名称である。IFはインストラクション
フェッチステージを示し、命令をメモリよりフェッチす
るステージである。IDはインストラクションデコード
ステージであり、IFステージでフェッチした命令のデ
コードを行う。また、演算するデータの読み出しを行
う。Eはエクゼキューションステージを示し、演算を行
う。Mはメモリアクセスステージであり、メモリへの書
き込み動作を行う。Wはレジスタライトステージであ
り、演算ユニット内のレジスタにデータを書き込む。V
ADD命令では、同期型メインメモリ104から直接デ
ータを読み出し、キャッシュメモリ103を介すること
なく、読み出しデータ制御回路105を通して直接演算
ユニットに転送する。同期型メインメモリ104では、
このメモリに対して読み出し命令を送出してからデータ
が出力され、演算ユニットへ到達するまでに、レイテン
シーと呼ぶ数クロックサイクルが必要である。Lは、こ
のレイテンシーのクロックサイクルを示す。また、本実
施例の計算機はパイプライン動作を行う。図2で上段か
ら1パイプライン目の動作、2パイプライン目の動作と
続き、n+1パイプライン目の動作となる。各パイプラ
インでの動作は1クロックサイクルづつずれている。1
パイプライン目の動作以降はIFステージ及びIDステ
ージは不要である。VADD,A,B,C,n命令は、
図2から分かるように、n+1回のパイプライン(すな
わちn+1クロック)で終了する。例えば、メインメモ
リ104から取りだした値A[0]、B[0]の加算お
よびその結果のC[0]への格納の一連の処理に関し
て、従来であれば、値A[0]の第1レジスタへのロー
ド(load)、B[0]の第2レジスタへのロード
(load)、両値の加算(add)、この加算結果の
格納(store)の4命令を実行するために少なくと
も4クロックを要するが、本実施例では図2から分かる
ようにこれを1クロックで実行する。これを可能とする
構成は、メインメモリとして同期型メモリを採用したこ
と、同期型メモリを2バンク構成としたこと、メインメ
モリの2出力をプロセッサ部140内のレジスタ(図示
せず)を介することなく演算ユニットに直接供給するよ
うにしたことである。
【0020】VADD命令の動作を、図4を参照しなが
ら、図2にしたがって説明する。まず、図2の1パイプ
ライン目の動作として、VADD命令をフェッチする
と、同期型メインメモリ104上のアドレスCからn個
のデータを、読み出しパス121および書き込みデータ
制御回路106を介して、キャッシュメモリ103にも
ってくる(これをムーブイン動作と呼ぶ)。キャッシュ
メモリ103内にあった既存のデータはパージすること
になる。これにより、メインメモリ104のアドレスC
(k)に対応する領域がキャッシュメモリ103内に確
保される。次に2パイプライン目の動作として、同期型
メインメモリ104から、A[0]とB[0]にあたる
データをパス121、122より読み出し、読み出し制
御回路105を介して、整数系演算ユニット101へ送
る。このとき、データが出力されるまでに同期型メイン
メモリ104のレイテンシーの数クロックサイクルが必
要である。図2ではこれを仮に2クロックサイクルとし
ている。整数系演算ユニット101の演算結果は演算結
果パス112に出力され、書き込みデータパス106を
介して、キャッシュメモリ103上のC[0]に書き込
まれる。この計算機ではパイプライン動作を行うので、
次の演算C[1]=A[1]+B[1]は1クロックサ
イクル遅れて、動作を始めている。その後、パイプライ
ン動作がC[n−1]=A[n−1]+B[n−1]ま
で進むと、この命令が全て終了したことになる。本実施
例では、メインメモリ104に同期型DRAMを用い、
演算ユニットのデータ処理能力と同一のスループットで
データの読み出しを行うことができるので、上記の一連
の動作をパイプラインを乱さずに行うことができる。
【0021】次に、キャッシュメモリ103上のデータ
をメインメモリ104上の任意のアドレスに書き込むた
めの、本実施例で新たに設けたFLUSH,n,C命令
について図3を用いて説明する。
【0022】通常、キャッシュメモリ103の各記憶領
域はメインメモリ104のいずれかの記憶領域と対応づ
けられており、キャッシュメモリ103の内容がメイン
メモリに書き戻されるときには、その対応するメインメ
モリ領域に書き込まれる。これに対して、本実施例にお
けるFLUSH,n,C命令はキュッシュメモリ103
上の有効なデータをメインメモリ104へ指定された領
域に書き込むものである。このFLUSH命令の実行前
に、図3に示すように、VADDC,A,B,n命令を
実行している。この命令は、図2に示したVADD命令
と同様、A[k]+B[k](k=0,…,n−1)を
行い、その演算結果をキャッシュメモリ103上に書き
込むものであるが、VADD命令と異なる点は、同期型
メインメモリ104からキャッシュメモリ103へのム
ーブイン動作がなく、キャッシュメモリ103をパージ
するだけである(図3の上部の1パイプライン目参
照)。また、演算結果の書き込み先の指定がなく、キャ
ッシュメモリ103を出力用のバッファのようにして結
果を書き込む。すなわち、キャッシュメモリ103の先
頭のアドレスからn個のデータを書き込むものである。
VADDC命令のようなキャッシュメモリ103上に演
算結果を書き込む命令の後、FLUSH,n,C命令に
よりキャッシュメモリ103の先頭からn個のデータを
同期型メインメモリ104の指定するアドレスCに書き
込む。FLUSH,n,C命令は、キャッシュ上のデー
タが次に説明するようなグラフィックデータの時など、
そのデータをいろいろな場所にコピーする場合に有用で
あり、高速なコピー処理を行うことができる。
【0023】次に、このような本実施例の処理を利用し
て、グラフィック機能を高速化する方法について、図5
を用いて説明する。
【0024】本図において、500は同期型メインメモ
リ104内の画像表示用メモリ空間を示す。この空間の
メモリの内容がデイスプレイの画面に表示される。50
1はソースレクト、502はデステイネーションレクト
である。本図はソースレクト501とデステイネーショ
ンレクト502の各画素の排他的ORを取り、デステイ
ネーションレクト502にその結果を書き込む動作を示
した図である。レクトを加工して、別のレクトに張り付
ける動作は、フォント表示など、グラフィック処理に非
常に多く発生する動作である。この場合、ソースレクト
501とデステイネーションレクト502は同じ画素数
であり、幅(Wビット)、高さ(Hビット)とも同じで
ある。
【0025】図6を用いて図5の動作を説明する。同期
型メインメモリ104からソースレクト501とデステ
イネーションレクト502をそれぞれアドレスS,Dか
ら読み出す。ワード単位で読み出すことも可能で、1ワ
ードを32ビットとし、1画素が1ビットとすると、1
度に32画素づつ演算を行うことができる。VADD命
令と同様に、2つのデータを同期型メインメモリ104
から読み出し、読み出しパス121および122、読み
出しデータ制御回路105、演算入力パス115および
116を介して、整数系演算ユニット101に送る。整
数系演算ユニット101において、2つのデータに対し
て排他的ORの論理演算を行い、演算結果パス112、
書き込みデータ制御回路106、書き込みパス124を
介して、キャッシュメモリ103に演算結果を書き込
む。その後、書込み先アドレスをDとして、キャッシュ
メモリ103の演算結果を同期型メインメモリ104へ
フラッシュすることにより、目的の演算を行うことがで
きる。
【0026】次に、浮動小数点の複数の乗算を高速に行
う方法及び命令を図7により説明する。
【0027】また本実施例の計算機では、複数の乗算を
連続して行うMFMUL,A,B,C,n命令を設け
る。MFMUL,A,B,C,n命令はC[k]=A
[k]*B[k](k=0,…,n−1)の複数の浮動
小数点の乗算を高速に行う命令である。図1及び図2に
示したVADD命令とほとんど同様であるが、整数系の
演算の異なる点は、浮動小数点演算ユニット102を用
い、エグゼキューションステージにおいて複数クロック
サイクルを必要とすることである。本図では、E1ステ
ージ、E2ステージ、E3ステージの3クロックサイク
ルとした。エグゼキューションステージで複数サイクル
を要しても、図7から分かるように、2パイプライン目
から順次1クロックごとに演算結果が出力され、キャッ
シュメモリ103に書き込まれていくことは図2の場合
と同様である。
【0028】さらに、浮動小数点の累積加算ΣA[k]
(k=0,…,n−1)を高速に行うためのVFIAD
D命令を設ける。これを図8により説明する。本図は、
VFIADD命令を説明するために、図1の一部を詳細
に示した図である。本図において、102は浮動小数点
演算ユニットであり、浮動小数点演算について説明する
が整数系の累積加算命令VIADDについても同様に実
現することが可能である。901は浮動小数点演算ユニ
ット102内の演算器、902〜906はラッチであ
り、クロックに同期して入力したデータを取り込み、保
持する。ラッチ902〜906より、各ラッチ間の動作
を個別にかつ並列に行うことができる。これにより、パ
イプライン動作が可能となる。同期型メインメモリ10
4よりA[k]を順次読み出し、ラッチ906および読
み出し制御回路105を介して、ラッチ903に取り込
む。演算器901は、ラッチ902のデータとラッチ9
03のデータを加算して、ラッチ904に書き込む。こ
のデータは次にラッチ902に書き込まれる。この動作
をクロックに同期して、パイプライン動作を行い、n−
1まで行えば、累積加算ΣA[k](k=0,…,n−
1)を行うことができる。
【0029】数値演算のアプリケーションでは、行列演
算y=Ax、(ここで、Aはn次元の行列、x,yはn
次元のベクトル)を行う場合が非常に多く、これを高速
に演算することにより、アプリケーションの性能を上げ
ることができる。本実施例による計算機では、MFMU
L命令とVFIADD命令を組み合わせることによりこ
れを高速に行うことが可能である。
【0030】以上は同期型DRAMを用いた場合につい
て説明したが、メインメモリにRambusを利用して
も同様に高速で低価格な計算機を実現することが可能で
ある。
【0031】以上、本実施例によれば、高速でかつ、コ
ンパクト、低価格な計算機を実現することができる。
【0032】
【発明の効果】本発明によれば、数値演算用のアクセラ
レータやグラフィック用のアクセラレータ等の特別なハ
ードウエアを付加することなく、それらのアプリケーシ
ョンを高速に実行することができる。そのため、低価格
で高性能かつコンパクトな計算機を提供することができ
る。
【図面の簡単な説明】
【図1】本発明を適用した計算機の実施例の全体構成を
示すブロック図
【図2】図1の計算機の第1の命令による動作例の説明
【図3】図1の計算機の第2および第3の命令による動
作例の説明図
【図4】図2の動作説明に供する説明図
【図5】図1の計算機により行うグラフィック処理の説
明図
【図6】図5のグラフィック処理の説明に供する説明図
【図7】図1の計算機の第3の命令による動作例の説明
【図8】図1の計算機の第4の命令による動作例の説明
【図9】本発明を適用した小型ワークステーションの外
観図
【図10】図1の要部の詳細を示すブロック図
【符号の説明】
101…整数系演算ユニット 102…浮動小数点演算ユニット 103…キャッシュメモリ 104…同期型メインメモリ 105…読み出しデータ制御回路 106…書き込みデータ制御回路 111…フラッシュキャッシュメモリ用パス 112…演算結果出力パス 113…演算結果出力パス 115…演算入力パス 116…演算入力パス 121…読み出しパス 122…読み出しパス 123…書き込みパス 131…読み出しパス 132…読み出しパス 140…プロセッサ部 500…画像表示用メモリ空間 501…ソースレクト 502…デステイネーションレクト 901…演算器 902…ラッチ 903…ラッチ 904…ラッチ 905…ラッチ 906…ラッチ 1000…小型ワークステーション 1001…キーボード 1002…液晶型デイスプレイ
───────────────────────────────────────────────────── フロントページの続き (72)発明者 林 剛久 東京都国分寺市東恋ケ窪一丁目280番地 株式会社日立製作所中央研究所内 (72)発明者 武田 博 東京都小平市上水本町五丁目20番1号 株 式会社日立製作所半導体設計開発センタ内

Claims (11)

    【特許請求の範囲】
  1. 【請求項1】パイプライン制御を採用し、キャッシュメ
    モリを備えた計算機において、 同期型メインメモリと、 該同期型メインメモリの記憶内容の一部のコピーを格納
    するキャッシュメモリと、 前記同期型メインメモリからクロックに同期して順次デ
    ータを読み出す読み出し手段と、 データの演算を行う演算ユニットと、 前記読み出されたデータを直接前記演算ユニットに供給
    する供給手段と、 前記演算ユニットの出力を前記キャッシュメモリに書き
    込む書込み手段と、 前記パイプライン制御の制御信号を計算機各部へ供給す
    るパイプライン制御手段と、 を備えたことを特徴とするキャッシュメモリを備えた計
    算機。
  2. 【請求項2】前記同期型メインメモリは同期型ダイナミ
    ックRAMからなる少なくとも2個のバンクを有し、前
    記読み出し手段は、前記2個のバンクから2つのデータ
    を同時に読み出し、前記供給手段は該2つのデータを同
    時に前記演算ユニットに転送する第1および第2のパス
    を有することを特徴とする請求項1記載のキャッシュメ
    モリを備えた計算機。
  3. 【請求項3】前記クロックに同期して、前記同期型メイ
    ンメモリから前記演算ユニットの処理速度に対応する速
    度でデータが順次読みだされ、前記演算ユニットの演算
    結果が前記キャッシュメモリに順次書き込まれることを
    特徴とする請求項1または2記載のキャッシュメモリを
    備えた計算機。
  4. 【請求項4】前記同期型メインメモリに格納されたベク
    トルデータに順次演算を施し、該演算結果を前記キャッ
    シュメモリに書き込むベクトル演算命令を有することを
    特徴とする請求項2記載のキャッシュメモリを備えた計
    算機。
  5. 【請求項5】前記ベクトル演算命令において、前記演算
    結果のキャッシュメモリへの格納先を指定し、該ベクト
    ル演算命令の最初の動作で前記同期型メインメモリ内の
    演算対象となるデータを読み出して前記キャッシュメモ
    リの格納先に予め格納することを特徴とする請求項4記
    載のキャッシュメモリを備えた計算機。
  6. 【請求項6】前記ベクトル演算命令において、前記演算
    結果のキャッシュメモリへの格納先を指定せず、該ベク
    トル演算命令の最初の動作で前記キャッシュメモリをパ
    ージし、前記書込み手段は前記演算結果を前記キャッシ
    ュメモリの予め定められたアドレスから順次書き込むこ
    とを特徴とする請求項4記載のキャッシュメモリを備え
    た計算機。
  7. 【請求項7】前記予め定められたアドレスから順次書き
    込まれた前記キャッシュメモリの内容を、前記同期型メ
    インメモリの指定したアドレス以降に書き込む命令をさ
    らに有することを特徴とする請求項6記載のキャッシュ
    メモリを備えた計算機。
  8. 【請求項8】前記同期型メインメモリの少なくとも一部
    を画像表示用メモリ空間として用い、該画像表示用メモ
    リ空間から読み出したデータに対して前記命令を実行す
    ることを特徴とする請求項5、6または7記載のキャッ
    シュメモリを備えた計算機。
  9. 【請求項9】前記演算ユニットは、整数系演算ユニット
    および浮動小数点演算ユニットを有し、前記供給手段
    は、前記制御手段の制御に応じて前記同期型メインメモ
    リの読み出しデータを両演算ユニットのいずれかに選択
    的に供給する読み出しデータ制御手段を有することを特
    徴とする請求項1または2記載のキャッシュメモリを備
    えた計算機。
  10. 【請求項10】前記同期型メインメモリから読み出すべ
    き2つのデータが同一のバンクに属することを検知する
    手段と、該検知結果に応じて前記2つのデータが別々の
    バンクに属するように一方のバンクに格納されたデータ
    を他方のバンクに移動させる手段を備えたことを特徴と
    する請求項2記載のキャッシュメモリを備えた計算機。
  11. 【請求項11】前記演算ユニットにおいてデータの累積
    加算を行う命令を有することを特徴とする請求項1記載
    のキャッシュメモリを備えた計算機。
JP5014785A 1993-02-01 1993-02-01 キャッシュメモリを備えた計算機 Pending JPH06230964A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5014785A JPH06230964A (ja) 1993-02-01 1993-02-01 キャッシュメモリを備えた計算機

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5014785A JPH06230964A (ja) 1993-02-01 1993-02-01 キャッシュメモリを備えた計算機

Publications (1)

Publication Number Publication Date
JPH06230964A true JPH06230964A (ja) 1994-08-19

Family

ID=11870715

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5014785A Pending JPH06230964A (ja) 1993-02-01 1993-02-01 キャッシュメモリを備えた計算機

Country Status (1)

Country Link
JP (1) JPH06230964A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6711345B1 (en) 1998-03-21 2004-03-23 Matsushita Electric Industrial Co., Ltd. Data stream recording/reproducing apparatus, recording/reproducing method, and recording medium
US7716267B2 (en) 2004-08-30 2010-05-11 Casio Computer Co., Ltd. Decimal computing apparatus, electronic device connectable decimal computing apparatus, arithmetic operation apparatus, arithmetic operation control apparatus, and program-recorded recording medium
JP2014532221A (ja) * 2011-09-28 2014-12-04 エイアールエム リミテッド 乳幼児のためのインタラクションサービスを提供する装置及び方法、これを利用したシステム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6711345B1 (en) 1998-03-21 2004-03-23 Matsushita Electric Industrial Co., Ltd. Data stream recording/reproducing apparatus, recording/reproducing method, and recording medium
US7716267B2 (en) 2004-08-30 2010-05-11 Casio Computer Co., Ltd. Decimal computing apparatus, electronic device connectable decimal computing apparatus, arithmetic operation apparatus, arithmetic operation control apparatus, and program-recorded recording medium
US8316067B2 (en) 2004-08-30 2012-11-20 Casio Computer Co., Ltd. Decimal computing apparatus, electronic device connectable decimal computing apparatus, arithmetic operation apparatus, arithmetic operation control apparatus, and program-recorded recording medium
JP2014532221A (ja) * 2011-09-28 2014-12-04 エイアールエム リミテッド 乳幼児のためのインタラクションサービスを提供する装置及び方法、これを利用したシステム

Similar Documents

Publication Publication Date Title
US10379772B2 (en) Apparatuses and methods for operations using compressed and decompressed data
Elliott et al. Computational RAM: A memory-SIMD hybrid and its application to DSP
US10877754B2 (en) Matrix computation engine
US4229801A (en) Floating point processor having concurrent exponent/mantissa operation
US4974146A (en) Array processor
KR20220054357A (ko) 직렬 할당 데이터에 대해 pim(processing-in-memory) 연산을 수행하기 위한 방법, 및 관련 메모리 디바이스 및 시스템
KR100648293B1 (ko) 그래픽 시스템 및 그것의 그래픽 처리 방법
US11934824B2 (en) Methods for performing processing-in-memory operations, and related memory devices and systems
JP2531648B2 (ja) メモリ装置
EP0777233A1 (en) A memory architecture using conserved adressing and systems and methods using the same
US5053986A (en) Circuit for preservation of sign information in operations for comparison of the absolute value of operands
US5119324A (en) Apparatus and method for performing arithmetic functions in a computer system
JPH08320786A (ja) 命令装置
JP2006099232A (ja) 半導体信号処理装置
US7043519B2 (en) SIMD sum of product arithmetic method and circuit, and semiconductor integrated circuit device equipped with the SIMD sum of product arithmetic circuit
US6631457B1 (en) Surface computer and computing method using the same
JPH06230964A (ja) キャッシュメモリを備えた計算機
JP2002269067A (ja) 行列演算装置
JP3132566B2 (ja) 命令先行制御装置
JP3441847B2 (ja) データメモリを有するプロセッサ
JP2011192305A (ja) 半導体信号処理装置
JPH10116191A (ja) 圧縮命令用バッファを備えたプロセッサ
Li et al. Design of dual port RAM for parallel volume rendering system
JP2842024B2 (ja) レジスタファイル回路
CN117150192A (zh) 一种高带宽利用率的稀疏矩阵向量相乘加速装置