JP3204157B2 - 計算機のデータ供給方式 - Google Patents
計算機のデータ供給方式Info
- Publication number
- JP3204157B2 JP3204157B2 JP08741597A JP8741597A JP3204157B2 JP 3204157 B2 JP3204157 B2 JP 3204157B2 JP 08741597 A JP08741597 A JP 08741597A JP 8741597 A JP8741597 A JP 8741597A JP 3204157 B2 JP3204157 B2 JP 3204157B2
- Authority
- JP
- Japan
- Prior art keywords
- line
- asic
- cpu
- main memory
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Description
CPUとASIC(Application Spec
ific IC)で主記憶を共有するUMA(Unif
ied Memory Architecture;ユ
ニファイドメモリアーキテクチャ)構造を採用する計算
機に関する。
struction Set Computer;縮小
命令セットコンピュータ)方式等のCPUを用いた計算
機では、画像処理等の特定応用に対する処理性能を向上
するため、(1)CPUの内部に特定応用の一部の処理
を高速化するために演算器を追加して命令セットを拡張
する方式(Intel社製の「i860」、「P55
C」、SunMicrosystems社製の「Ult
raSPARC」、HewletPackard社製の
「PA7100LC」等)、あるいは(2)CPUとは
別に特定応用の処理を高速化するASIC(Appli
cation Specific IC;特定用途向き
ICともいう)とそのASICが専用に使用するメモリ
を、主記憶とは別に用意し、CPUがASICを制御す
ることで特定応用に対する処理性能の向上を実現する方
式(各社のハイエンド計算機)等が用いられている。
処理性能はそれほど改善されないが、安価に主記憶共有
の計算機を構成できる。一方、第2の方式では、ASI
Cに専用のメモリを用意するために高価になるが、特定
応用に対する処理性能は著しく向上する。
による特定応用の処理性能向上と低コスト化を両立する
計算機の構成として、(3)主記憶をCPUとASIC
で共有するUMA構成(Unified Memory
Architecture)が提案されている(Cy
rix社等)。
式(1)を採用しているSunMicrosystem
s社製の汎用マイクロプロセッサ(「Ultra SP
ARC」)の構成の一部を示している。特定処理(ここ
では画像処理)を実行する画像処理演算器305へのデ
ータ供給は、キャッシュまたは主記憶301からレジス
タファイル302を介して語(word)単位で行われ
る。図中、浮動小数点加算器303、浮動小数点乗算器
304はレジスタファイル302を、画像処理演算器3
05と共有する構造である。
ャッシュまたは主記憶301と共有しているため、特定
処理に専用のメモリを必要としない。また演算器とこれ
を制御する命令を拡張するだけなので、他の処理と特定
処理で主記憶アクセスが競合することがなく、排他制御
を行う必要がない。
(2)の構成を示している。図4を参照して、CPU4
03、主記憶404、外部キャッシュ405は、チップ
セット401を介して接続され、一方、ASIC402
とは、専用メモリ407に直接接続されている。またチ
ップセット401とASIC402は、低速バス406
を介して接続されている。この構成では、ASIC40
2は、専用メモリ407に格納されたデータを使用する
ため、専用処理に対して高速化が可能であり、CPU4
03とASIC402の間に高速なデータ転送のための
バスを必要としない。
(3)の構成を示している。図5を参照して、CPU5
03はチップセット501を介して、主記憶504、お
よび外部キャッシュ505をアクセスする。一方、AS
IC502も、チップセット501に接続されており、
主記憶504を直接アクセス可能にしたものである。こ
の構成では、CPU503とASICは主記憶504を
共有しており、上記した従来の第2の方式(図4参照)
に比べて主記憶の使用効率を向上することが可能であ
る。
記に記載する問題点を有している。
するという上記従来の第1の方式では、演算器と主記憶
と間のバンド幅が制限されるために、特定用途の処理性
能を効果的に向上することができない。また他の演算器
と同じ形式の命令セットで制御するため、複雑な処理を
実装するのが困難である。
するという上記従来の第2の方式では、主記憶とは別に
専用メモリを用意しなければならないので、大規模かつ
高価な計算機となってしまう。またASICを使用しな
い他の処理をCPUが実行している間、専用メモリは使
用されないので、メモリの使用効率を低下させる。
UとASICで主記憶を共有するという上記従来の第3
の方式を用いても、主記憶とASIC間のバンド幅を大
きくすることは困難である。すなわち、バンド幅を向上
し、ASICの処理性能を向上するためには、チップセ
ット内に大量のバッファを必要とし、更に、チップセッ
トとASIC間のデータ転送速度または転送幅を広げる
ことが必要であり、大規模かつ複雑化は避けられない。
またCPUとASICで主記憶を共有することによっ
て、両者が同一の記憶領域をアクセスする場合に、主記
憶上の記憶内容に対して排他制御を行う必要があり、こ
れも処理性能の低下の原因になる。
題点に鑑みてなされたものであって、その目的は、汎用
計算機等において画像処理等の特定応用に対する処理性
能を向上する方式を提供する、ことにある。
モリ使用効率の高い、簡単な構造の汎用計算機を構成す
ることである。
め、本願第1発明は、CPUと、特定応用に関する処理
を高速化するために設けられたASICと、が、主記憶
に格納されたデータを共有する構成を有する計算機にお
いて、外部キャッシュと前記主記憶とを低速のデータバ
スで接続し、前記外部キャッシュの第1のデータ出力と
前記CPUのデータ入力とを語単位のデータ転送幅で接
続し、前記外部キャッシュの第2のデータ出力と前記A
SICのデータ入力とを前記外部キャッシュのライン幅
で指定される複数語単位のデータ転送幅で接続し、前記
CPUと前記ASICからの前記主記憶へのアクセス要
求は、調停手段によって調停され前記外部キャッシュに
与えられる、ことを特徴とする。
部キャッシュが、タグメモリとデータメモリと、を含ん
で構成され、前記タグメモリのラインに対応するデータ
メモリのラインが、前記CPUに対してアクセスを許可
されたラインか、前記ASICに対してアクセスを許可
されたラインかを区別する所有ビットと、前記ラインが
前記主記憶の対応する位置のデータと一致するか否かを
区別する状態ビット、および対応する前記主記憶のアド
レスの一部であるタグデータと、を含むことを特徴とす
る。
おいて、前記ASICが使用するデータを、前記ASI
Cまたは前記CPUが前記主記憶から前記外部キャッシ
ュの特定ラインに転送し、該ラインの前記所有ビットを
前記ASICが所有している状態に変更する手段と、前
記ASICが使用を完了した時点で、前記ラインの前記
所有ビットを、前記CPUが所有している状態に戻し、
前記CPUの該ラインへのアクセスを許可する手段と、
前記CPUが該ラインへのアクセスを行う際に、前記所
有ビットを検査することによって、前記CPUが当該ラ
インへアクセス可能かを判断する手段と、を備え、前記
CPUと前記ASICが前記主記憶への排他制御を行
う、ことを特徴とする。
する。本発明は、その好ましい実施の形態において、図
1を参照すると、CPU(101)と、特定応用に関す
る処理を高速化するために設けられたASIC(10
2)とが、主記憶(103)に格納されたデータを共有
する構成を有する計算機において、外部キャッシュ(1
04)と主記憶(103)を低速のデータバス(10
6)で接続し、外部キャッシュ(104)の第1のデー
タ出力とCPU(101)のデータ入力とを語単位のデ
ータ転送幅で接続し、外部キャッシュ(104)の第2
のデータ出力とASIC(102)のデータ入力を外部
キャッシュ(104)のライン幅で指定される複数語単
位のデータ転送幅で接続し、CPU(101)とASI
C(102)とからの、主記憶へのアクセス要求を調停
手段(105)によって調停し、外部キャッシュ(10
4)へ与えられるデータ供給方式としている。
1)と外部キャッシュ(104)を語単位のデータ幅で
結合し、ASIC(102)と外部キャッシュ(10
4)を、外部キャッシュ104のライン幅(通常複数
語)のデータ幅で結合し、これによってASIC(10
2)へのデータ供給のバンド幅を広げることができ、C
PU(101)と主記憶(103)を共有しながら、A
SICの処理性能を向上できる。
において、図2を参照すると、外部キャッシュ(20
3)は、タグメモリ(201)とデータメモリ(20
2)とから構成され、タグメモリ(201)のライン
を、対応するデータメモリ(202)のラインがCPU
に対してアクセスを許可されたラインか、ASICに対
してアクセスを許可されたラインかを区別する所有ビッ
ト(205)と、前記ラインが主記憶の対応する位置の
データと一致するか否かを区別する状態ビット(20
4)、対応する主記憶のアドレスの一部であるタグデー
タ(206)と、を備えて構成されている。
(203)のタグメモリ(201)にASIC(10
2)が使用しているラインか、CPU(101)が使用
しているラインかを区別する所有ビット(205)を設
けることによって、主記憶(103)に比べて排他制御
を高速化できる。
施の形態において、図1及び図2を参照すると、ASI
Cが使用するデータを、ASIC(102)またはCP
U(101)が主記憶(103)から外部キャッシュ
(104)の特定ラインに転送し、当該ラインの所有ビ
ット(205)をASIC(102)が所有している状
態に変更する手段と、ASIC(102)が使用を完了
した時点で当該ラインの所有ビットをCPU(101)
が所有している状態に戻し、CPU(101)の当該ラ
インへのアクセスを許可する手段と、CPU(101)
が当該ラインへのアクセスを行う際に、所有ビット(2
05)を検査することで、CPU(101)が当該ライ
ンへアクセス可能かを判断する手段を有することによっ
て、CPU(101)とASIC(102)が主記憶
(103)への排他制御を行う。
ASICへのデータ供給を、主記憶から語単位で行うの
ではなく、外部キャッシュのライン幅単位(通常複数
語)で行う。また、CPUとASICが同一の記憶領域
をアクセスする可能性の検出を主記憶上で行うのではな
く、外部キャッシュのタグを用いて行う。
更に詳細に説明すべく、本発明の実施例について、図面
を参照して詳細に説明する。
す図である。図1を参照すると、本発明の第1の実施例
は、CPU101と、ASIC102と、主記憶103
と、外部キャッシュ104と、調停手段105と、低速
バス106と、を含む。CPU101とASIC102
とは外部キャッシュ104に接続され、外部キャッシュ
104と主記憶103とは低速バス106を介して接続
され、CPU101とASIC102の主記憶103へ
のアクセス要求は調停手段105によって調停されて、
外部キャッシュ104に与えられる構成とされている。
なお、この調停手段105は、次の外部キャッシュ10
4へのアクセス要求に対してCPU101とASIC1
02のいずれのアクセス要求を優先するかを情報として
保持する、例えば1ビットのフリップフロップ等の情報
記憶手段を用いて実現することができる。この場合、C
PU101とASIC102とからアクセス要求があっ
た場合、例えば、フリップフロップが“1”の時はCP
U101からのアクセス要求を優先し、“0”の時はA
SIC102のアクセス要求を優先し、さらにアクセス
がある毎にフリップフロップの内容を反転するという、
ラウンドロビン方式の調停としても実現することができ
る。
スに伴うデータ転送は、外部キャッシュ104を介して
語単位で行われる。一方、ASIC102から主記憶1
03へのアクセスに伴うデータ転送は、外部キャッシュ
104を介して複数語の単位で行われるので、主記憶1
03から低速バス106を経由して転送する場合に比べ
て、同一の動作周波数でバンド幅を向上することができ
る。また、通常、外部キャッシュ104のアクセス速度
(レイテンシ)は主記憶103よりも速いので、さらに
バンド幅の向上が可能である。
C102から主記憶103へのアクセス要求を、調停手
段105を用いて調停してから外部キャッシュ104に
与える場合について説明したが、上記2つのアクセス要
求を同時に受け付け可能な、2ポートの外部キャッシュ
を用いて調停手段を削除してもよい。
す図である。図2を参照すると、本発明の第2の実施例
は、タグ206と、状態ビット204と、所有ビット2
05を含むタグメモリ201と、データメモリ202を
含む外部キャッシュ203と、を含んで構成される。
の当該ラインが図1の主記憶103の対応する位置の内
容と同一であるか否かを示し、従来のライトバックキャ
ッシュと同様である。
02の当該ラインがASIC102で使用されているか
否かを示し、ASIC102が使用中の場合はCPU1
01の当該ラインの使用を禁止し、ASIC102の使
用が完了した時点でCPU101に当該ラインの使用を
許可する排他制御が可能な構成である。
102のタグを用いて行うので、主記憶103を用いて
行うより高速である。
記記載の効果を奏する。
のデータ供給を、主記憶から語単位で行うのではなく、
外部キャッシュのライン幅単位(通常複数語単位)で行
っているので、主記憶から供給する場合に比べて同一の
動作周波数でバンド幅を向上することができる、という
ことである。例えば、キャッシュライン幅を4語とする
と、同一周波数で最大4倍のバンド幅を得ることが可能
である。
キャッシュのアクセス速度(レインテンシ)は主記憶よ
りも速いので、さらにバンド幅を向上することが可能で
ある、ということである。例えば同期型SRAMを用い
た外部キャッシュのレイテンシは10ns程度であり、
主記憶に同期型DRAMを用いたとしても60ns程度
である。
SICが同一の記憶領域をアクセスする可能性の検出を
主記憶上で行うのではなく、外部キャッシュのタグを用
いて行うので、より高速な排他制御が可能である、とい
うことである。
り、外部キャッシュとそのアクセス方式を説明する図で
ある。
Claims (3)
- 【請求項1】CPUと、特定応用に関する処理を高速化
するために設けられたASIC(applicatio
n specific integrated cir
cuit)と、が、主記憶に格納されたデータを共有す
る構成を有する計算機において、 外部キャッシュと前記主記憶とを低速のデータバスで接
続し、 前記外部キャッシュの第1のデータ出力と前記CPUの
データ入力とを語単位のデータ転送幅で接続し、 前記外部キャッシュの第2のデータ出力と前記ASIC
のデータ入力とを前記外部キャッシュのライン幅で指定
される複数語単位のデータ転送幅で接続し、 前記CPU及び前記ASICからの前記主記憶へのアク
セス要求は、直接に、又は、調停手段によって調停され
て、前記外部キャッシュに与えられる、ように構成した
ことを特徴とする計算機。 - 【請求項2】前記外部キャッシュが、タグメモリと、デ
ータメモリと、を含んで構成され、 前記タグメモリのラインに対応するデータメモリのライ
ンが、前記CPUに対してアクセスを許可されたライン
か、前記ASICに対してアクセスを許可されたライン
かを区別する所有ビットと、 前記ラインが前記主記憶の対応する位置のデータと一致
するか否かを区別する状態ビットと、 対応する前記主記憶のアドレスの一部であるタグデータ
と、 を含むことを特徴とする請求項1記載の計算機。 - 【請求項3】前記ASICが使用するデータを、前記A
SICまたは前記CPUが前記主記憶から前記外部キャ
ッシュの特定ラインに転送し、該ラインの前記所有ビッ
トを前記ASICが所有している状態に変更する手段
と、 前記ASICが前記ラインの使用を完了した時点で、前
記ラインの前記所有ビットを、前記CPUが所有してい
る状態に戻し、前記CPUの前記ラインへのアクセスを
許可する手段と、 前記CPUが前記ラインへのアクセスを行う際に、前記
所有ビットを検査することによって、前記CPUが当該
ラインへアクセス可能かを判断する手段と、 を備え、前記CPUと前記ASICが前記主記憶への排
他制御を行う、 ことを特徴とする請求項2記載の計算機。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP08741597A JP3204157B2 (ja) | 1997-03-21 | 1997-03-21 | 計算機のデータ供給方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP08741597A JP3204157B2 (ja) | 1997-03-21 | 1997-03-21 | 計算機のデータ供給方式 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH10269166A JPH10269166A (ja) | 1998-10-09 |
JP3204157B2 true JP3204157B2 (ja) | 2001-09-04 |
Family
ID=13914256
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP08741597A Expired - Fee Related JP3204157B2 (ja) | 1997-03-21 | 1997-03-21 | 計算機のデータ供給方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3204157B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7831780B2 (en) * | 2005-06-24 | 2010-11-09 | Nvidia Corporation | Operating system supplemental disk caching system and method |
-
1997
- 1997-03-21 JP JP08741597A patent/JP3204157B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPH10269166A (ja) | 1998-10-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3698358B2 (ja) | 高速プロセッサシステム、これを使用する方法及び記録媒体 | |
EP0646873B1 (en) | Single-chip microcomputer | |
US7519774B2 (en) | Data processor having a memory control unit with cache memory | |
US8037253B2 (en) | Method and apparatus for global ordering to insure latency independent coherence | |
US7475190B2 (en) | Direct access of cache lock set data without backing memory | |
WO1999016200A2 (en) | Intelligent data bus interface using multi-port memory | |
US6751704B2 (en) | Dual-L2 processor subsystem architecture for networking system | |
JP2004508634A (ja) | 分割トランザクション相互接続のスループットを改善するための中間バッファ制御 | |
JPH09179780A (ja) | バースト可でキャッシュ不可のメモリアクセスを支援するマイクロプロセッサ装置 | |
JPS5868286A (ja) | キヤツシユメモリおよびその作動方法 | |
US7774513B2 (en) | DMA circuit and computer system | |
JP2591502B2 (ja) | 情報処理システムおよびそのバス調停方式 | |
JP3204157B2 (ja) | 計算機のデータ供給方式 | |
US7254667B2 (en) | Data transfer between an external data source and a memory associated with a data processor | |
US6799247B1 (en) | Remote memory processor architecture | |
EP1285340B1 (en) | Shared bus interface for digital signal processor | |
EP0795827B1 (en) | Memory device and method for accessing memories of the memory device | |
JP2568017B2 (ja) | マイクロプロセッサ及びそれを使用したデータ処理システム | |
KR100334298B1 (ko) | 기억 소자 | |
JPH0351943A (ja) | 高速バスと低速バスのバスライン共用化方式 | |
CN117435251A (zh) | 一种后量子密码算法处理器及其片上系统 | |
CN114385529A (zh) | 直接记忆体存取控制器、使用其之电子装置以及操作其的方法 | |
JP2000066946A (ja) | メモリコントローラ | |
JPH07129519A (ja) | デュアルcpuシステム | |
JPH05324533A (ja) | デュアルポートメモリ装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20010529 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080629 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090629 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100629 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100629 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110629 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110629 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120629 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120629 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130629 Year of fee payment: 12 |
|
LAPS | Cancellation because of no payment of annual fees |