JP3204157B2 - 計算機のデータ供給方式 - Google Patents

計算機のデータ供給方式

Info

Publication number
JP3204157B2
JP3204157B2 JP08741597A JP8741597A JP3204157B2 JP 3204157 B2 JP3204157 B2 JP 3204157B2 JP 08741597 A JP08741597 A JP 08741597A JP 8741597 A JP8741597 A JP 8741597A JP 3204157 B2 JP3204157 B2 JP 3204157B2
Authority
JP
Japan
Prior art keywords
line
asic
cpu
main memory
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP08741597A
Other languages
English (en)
Other versions
JPH10269166A (ja
Inventor
俊明 井上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP08741597A priority Critical patent/JP3204157B2/ja
Publication of JPH10269166A publication Critical patent/JPH10269166A/ja
Application granted granted Critical
Publication of JP3204157B2 publication Critical patent/JP3204157B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は計算機に関し、特に
CPUとASIC(Application Spec
ific IC)で主記憶を共有するUMA(Unif
ied Memory Architecture;ユ
ニファイドメモリアーキテクチャ)構造を採用する計算
機に関する。
【0002】
【従来の技術】従来、RISC(Reduced In
struction Set Computer;縮小
命令セットコンピュータ)方式等のCPUを用いた計算
機では、画像処理等の特定応用に対する処理性能を向上
するため、(1)CPUの内部に特定応用の一部の処理
を高速化するために演算器を追加して命令セットを拡張
する方式(Intel社製の「i860」、「P55
C」、SunMicrosystems社製の「Ult
raSPARC」、HewletPackard社製の
「PA7100LC」等)、あるいは(2)CPUとは
別に特定応用の処理を高速化するASIC(Appli
cation Specific IC;特定用途向き
ICともいう)とそのASICが専用に使用するメモリ
を、主記憶とは別に用意し、CPUがASICを制御す
ることで特定応用に対する処理性能の向上を実現する方
式(各社のハイエンド計算機)等が用いられている。
【0003】第1の方式(1)では、特定応用に対する
処理性能はそれほど改善されないが、安価に主記憶共有
の計算機を構成できる。一方、第2の方式では、ASI
Cに専用のメモリを用意するために高価になるが、特定
応用に対する処理性能は著しく向上する。
【0004】また近年、両者の中間に位置し、ASIC
による特定応用の処理性能向上と低コスト化を両立する
計算機の構成として、(3)主記憶をCPUとASIC
で共有するUMA構成(Unified Memory
Architecture)が提案されている(Cy
rix社等)。
【0005】例えば、図3は、上記した従来の第1の方
式(1)を採用しているSunMicrosystem
s社製の汎用マイクロプロセッサ(「Ultra SP
ARC」)の構成の一部を示している。特定処理(ここ
では画像処理)を実行する画像処理演算器305へのデ
ータ供給は、キャッシュまたは主記憶301からレジス
タファイル302を介して語(word)単位で行われ
る。図中、浮動小数点加算器303、浮動小数点乗算器
304はレジスタファイル302を、画像処理演算器3
05と共有する構造である。
【0006】この構成では、画像処理演算器305はキ
ャッシュまたは主記憶301と共有しているため、特定
処理に専用のメモリを必要としない。また演算器とこれ
を制御する命令を拡張するだけなので、他の処理と特定
処理で主記憶アクセスが競合することがなく、排他制御
を行う必要がない。
【0007】また、図4は、上記した従来の第2の方式
(2)の構成を示している。図4を参照して、CPU4
03、主記憶404、外部キャッシュ405は、チップ
セット401を介して接続され、一方、ASIC402
とは、専用メモリ407に直接接続されている。またチ
ップセット401とASIC402は、低速バス406
を介して接続されている。この構成では、ASIC40
2は、専用メモリ407に格納されたデータを使用する
ため、専用処理に対して高速化が可能であり、CPU4
03とASIC402の間に高速なデータ転送のための
バスを必要としない。
【0008】また、図5は、上記した従来の第3の方式
(3)の構成を示している。図5を参照して、CPU5
03はチップセット501を介して、主記憶504、お
よび外部キャッシュ505をアクセスする。一方、AS
IC502も、チップセット501に接続されており、
主記憶504を直接アクセス可能にしたものである。こ
の構成では、CPU503とASICは主記憶504を
共有しており、上記した従来の第2の方式(図4参照)
に比べて主記憶の使用効率を向上することが可能であ
る。
【0009】
【発明が解決しようとする課題】上記した従来技術は下
記に記載する問題点を有している。
【0010】(1)特定用途のために演算器のみを追加
するという上記従来の第1の方式では、演算器と主記憶
と間のバンド幅が制限されるために、特定用途の処理性
能を効果的に向上することができない。また他の演算器
と同じ形式の命令セットで制御するため、複雑な処理を
実装するのが困難である。
【0011】(2)また、ASICと専用メモリを付加
するという上記従来の第2の方式では、主記憶とは別に
専用メモリを用意しなければならないので、大規模かつ
高価な計算機となってしまう。またASICを使用しな
い他の処理をCPUが実行している間、専用メモリは使
用されないので、メモリの使用効率を低下させる。
【0012】(3)そして、チップセットを介してCP
UとASICで主記憶を共有するという上記従来の第3
の方式を用いても、主記憶とASIC間のバンド幅を大
きくすることは困難である。すなわち、バンド幅を向上
し、ASICの処理性能を向上するためには、チップセ
ット内に大量のバッファを必要とし、更に、チップセッ
トとASIC間のデータ転送速度または転送幅を広げる
ことが必要であり、大規模かつ複雑化は避けられない。
またCPUとASICで主記憶を共有することによっ
て、両者が同一の記憶領域をアクセスする場合に、主記
憶上の記憶内容に対して排他制御を行う必要があり、こ
れも処理性能の低下の原因になる。
【0013】したがって、本発明は、上記従来技術の問
題点に鑑みてなされたものであって、その目的は、汎用
計算機等において画像処理等の特定応用に対する処理性
能を向上する方式を提供する、ことにある。
【0014】本発明の他の目的は、特定応用においてメ
モリ使用効率の高い、簡単な構造の汎用計算機を構成す
ることである。
【0015】
【課題を解決するための手段】前記目的を達成するた
め、本願第1発明は、CPUと、特定応用に関する処理
を高速化するために設けられたASICと、が、主記憶
に格納されたデータを共有する構成を有する計算機にお
いて、外部キャッシュと前記主記憶とを低速のデータバ
スで接続し、前記外部キャッシュの第1のデータ出力と
前記CPUのデータ入力とを語単位のデータ転送幅で接
続し、前記外部キャッシュの第2のデータ出力と前記A
SICのデータ入力とを前記外部キャッシュのライン幅
で指定される複数語単位のデータ転送幅で接続し、前記
CPUと前記ASICからの前記主記憶へのアクセス要
求は、調停手段によって調停され前記外部キャッシュに
与えられる、ことを特徴とする。
【0016】本願第2発明は、上記第1発明は、前記外
部キャッシュが、タグメモリとデータメモリと、を含ん
で構成され、前記タグメモリのラインに対応するデータ
メモリのラインが、前記CPUに対してアクセスを許可
されたラインか、前記ASICに対してアクセスを許可
されたラインかを区別する所有ビットと、前記ラインが
前記主記憶の対応する位置のデータと一致するか否かを
区別する状態ビット、および対応する前記主記憶のアド
レスの一部であるタグデータと、を含むことを特徴とす
る。
【0017】本願第3発明は、上記第1又は第2発明に
おいて、前記ASICが使用するデータを、前記ASI
Cまたは前記CPUが前記主記憶から前記外部キャッシ
ュの特定ラインに転送し、該ラインの前記所有ビットを
前記ASICが所有している状態に変更する手段と、前
記ASICが使用を完了した時点で、前記ラインの前記
所有ビットを、前記CPUが所有している状態に戻し、
前記CPUの該ラインへのアクセスを許可する手段と、
前記CPUが該ラインへのアクセスを行う際に、前記所
有ビットを検査することによって、前記CPUが当該ラ
インへアクセス可能かを判断する手段と、を備え、前記
CPUと前記ASICが前記主記憶への排他制御を行
う、ことを特徴とする。
【0018】
【発明の実施の形態】本発明の実施の形態について説明
する。本発明は、その好ましい実施の形態において、図
1を参照すると、CPU(101)と、特定応用に関す
る処理を高速化するために設けられたASIC(10
2)とが、主記憶(103)に格納されたデータを共有
する構成を有する計算機において、外部キャッシュ(1
04)と主記憶(103)を低速のデータバス(10
6)で接続し、外部キャッシュ(104)の第1のデー
タ出力とCPU(101)のデータ入力とを語単位のデ
ータ転送幅で接続し、外部キャッシュ(104)の第2
のデータ出力とASIC(102)のデータ入力を外部
キャッシュ(104)のライン幅で指定される複数語単
位のデータ転送幅で接続し、CPU(101)とASI
C(102)とからの、主記憶へのアクセス要求を調停
手段(105)によって調停し、外部キャッシュ(10
4)へ与えられるデータ供給方式としている。
【0019】この実施の形態においては、CPU(10
1)と外部キャッシュ(104)を語単位のデータ幅で
結合し、ASIC(102)と外部キャッシュ(10
4)を、外部キャッシュ104のライン幅(通常複数
語)のデータ幅で結合し、これによってASIC(10
2)へのデータ供給のバンド幅を広げることができ、C
PU(101)と主記憶(103)を共有しながら、A
SICの処理性能を向上できる。
【0020】本発明は、その好ましい第2の実施の形態
において、図2を参照すると、外部キャッシュ(20
3)は、タグメモリ(201)とデータメモリ(20
2)とから構成され、タグメモリ(201)のライン
を、対応するデータメモリ(202)のラインがCPU
に対してアクセスを許可されたラインか、ASICに対
してアクセスを許可されたラインかを区別する所有ビッ
ト(205)と、前記ラインが主記憶の対応する位置の
データと一致するか否かを区別する状態ビット(20
4)、対応する主記憶のアドレスの一部であるタグデー
タ(206)と、を備えて構成されている。
【0021】この実施の形態によれば、外部キャッシュ
(203)のタグメモリ(201)にASIC(10
2)が使用しているラインか、CPU(101)が使用
しているラインかを区別する所有ビット(205)を設
けることによって、主記憶(103)に比べて排他制御
を高速化できる。
【0022】さらに、本発明は、その好ましい第3の実
施の形態において、図1及び図2を参照すると、ASI
Cが使用するデータを、ASIC(102)またはCP
U(101)が主記憶(103)から外部キャッシュ
(104)の特定ラインに転送し、当該ラインの所有ビ
ット(205)をASIC(102)が所有している状
態に変更する手段と、ASIC(102)が使用を完了
した時点で当該ラインの所有ビットをCPU(101)
が所有している状態に戻し、CPU(101)の当該ラ
インへのアクセスを許可する手段と、CPU(101)
が当該ラインへのアクセスを行う際に、所有ビット(2
05)を検査することで、CPU(101)が当該ライ
ンへアクセス可能かを判断する手段を有することによっ
て、CPU(101)とASIC(102)が主記憶
(103)への排他制御を行う。
【0023】本発明は、上記した実施の形態において、
ASICへのデータ供給を、主記憶から語単位で行うの
ではなく、外部キャッシュのライン幅単位(通常複数
語)で行う。また、CPUとASICが同一の記憶領域
をアクセスする可能性の検出を主記憶上で行うのではな
く、外部キャッシュのタグを用いて行う。
【0024】
【実施例】次に、上記した本発明の実施の形態について
更に詳細に説明すべく、本発明の実施例について、図面
を参照して詳細に説明する。
【0025】図1は、本発明の第1の実施例の構成を示
す図である。図1を参照すると、本発明の第1の実施例
は、CPU101と、ASIC102と、主記憶103
と、外部キャッシュ104と、調停手段105と、低速
バス106と、を含む。CPU101とASIC102
とは外部キャッシュ104に接続され、外部キャッシュ
104と主記憶103とは低速バス106を介して接続
され、CPU101とASIC102の主記憶103へ
のアクセス要求は調停手段105によって調停されて、
外部キャッシュ104に与えられる構成とされている。
なお、この調停手段105は、次の外部キャッシュ10
4へのアクセス要求に対してCPU101とASIC1
02のいずれのアクセス要求を優先するかを情報として
保持する、例えば1ビットのフリップフロップ等の情報
記憶手段を用いて実現することができる。この場合、C
PU101とASIC102とからアクセス要求があっ
た場合、例えば、フリップフロップが“1”の時はCP
U101からのアクセス要求を優先し、“0”の時はA
SIC102のアクセス要求を優先し、さらにアクセス
がある毎にフリップフロップの内容を反転するという、
ラウンドロビン方式の調停としても実現することができ
る。
【0026】CPU101から主記憶103へのアクセ
スに伴うデータ転送は、外部キャッシュ104を介して
語単位で行われる。一方、ASIC102から主記憶1
03へのアクセスに伴うデータ転送は、外部キャッシュ
104を介して複数語の単位で行われるので、主記憶1
03から低速バス106を経由して転送する場合に比べ
て、同一の動作周波数でバンド幅を向上することができ
る。また、通常、外部キャッシュ104のアクセス速度
(レイテンシ)は主記憶103よりも速いので、さらに
バンド幅の向上が可能である。
【0027】第1の実施例では、CPU101とASI
C102から主記憶103へのアクセス要求を、調停手
段105を用いて調停してから外部キャッシュ104に
与える場合について説明したが、上記2つのアクセス要
求を同時に受け付け可能な、2ポートの外部キャッシュ
を用いて調停手段を削除してもよい。
【0028】図2は、本発明の第2の実施例の構成を示
す図である。図2を参照すると、本発明の第2の実施例
は、タグ206と、状態ビット204と、所有ビット2
05を含むタグメモリ201と、データメモリ202を
含む外部キャッシュ203と、を含んで構成される。
【0029】状態ビット204は、データメモリ202
の当該ラインが図1の主記憶103の対応する位置の内
容と同一であるか否かを示し、従来のライトバックキャ
ッシュと同様である。
【0030】また所有ビット205は、データメモリ2
02の当該ラインがASIC102で使用されているか
否かを示し、ASIC102が使用中の場合はCPU1
01の当該ラインの使用を禁止し、ASIC102の使
用が完了した時点でCPU101に当該ラインの使用を
許可する排他制御が可能な構成である。
【0031】このように、排他制御を、外部キャッシュ
102のタグを用いて行うので、主記憶103を用いて
行うより高速である。
【0032】
【発明の効果】以上説明したように、本発明によれば下
記記載の効果を奏する。
【0033】(1)本発明の第1の効果は、ASICへ
のデータ供給を、主記憶から語単位で行うのではなく、
外部キャッシュのライン幅単位(通常複数語単位)で行
っているので、主記憶から供給する場合に比べて同一の
動作周波数でバンド幅を向上することができる、という
ことである。例えば、キャッシュライン幅を4語とする
と、同一周波数で最大4倍のバンド幅を得ることが可能
である。
【0034】(2)本発明の第2の効果は、通常、外部
キャッシュのアクセス速度(レインテンシ)は主記憶よ
りも速いので、さらにバンド幅を向上することが可能で
ある、ということである。例えば同期型SRAMを用い
た外部キャッシュのレイテンシは10ns程度であり、
主記憶に同期型DRAMを用いたとしても60ns程度
である。
【0035】(3)本発明の第3の効果は、CPUとA
SICが同一の記憶領域をアクセスする可能性の検出を
主記憶上で行うのではなく、外部キャッシュのタグを用
いて行うので、より高速な排他制御が可能である、とい
うことである。
【図面の簡単な説明】
【図1】本発明の第1の実施例の構成を示す図である。
【図2】本発明の第2の実施例を説明するための図であ
り、外部キャッシュとそのアクセス方式を説明する図で
ある。
【図3】従来の第1の方式の構成を示す図である。
【図4】従来の第2の方式の構成を示す図である。
【図5】従来の第3の方式の構成を示す図である。
【符号の説明】
101、403、503 CPU 102、402、502 ASIC 103、404、504 主記憶 104、203、405、505 外部キャッシュ 105 調停手段 106、406、506 低速バス 201 タグメモリ 202 データメモリ 204 状態ビット 205 所有ビット 301 キャッシュまたは主記憶 302 レジスタファイル 303 浮動小数点加算器 304 浮動小数点乗算器 305 画像処理演算器 401、501 チップセット 407 専用メモリ
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平2−242429(JP,A) 特開 平3−42745(JP,A) 特開 平3−42744(JP,A) 特開 平7−191908(JP,A) 特開 平4−373025(JP,A) 特開 平5−165641(JP,A) 特開 昭61−262922(JP,A) 特開 平5−88966(JP,A) 特開 昭55−6633(JP,A) 特開 平4−347749(JP,A) 特開 平3−78071(JP,A) 特開 平6−35866(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06F 12/08 - 12/12 G06F 12/00 560 - 12/06 G06F 15/16 - 15/177 G06F 17/16 G06T 1/60

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】CPUと、特定応用に関する処理を高速化
    するために設けられたASIC(applicatio
    n specific integrated cir
    cuit)と、が、主記憶に格納されたデータを共有す
    る構成を有する計算機において、 外部キャッシュと前記主記憶とを低速のデータバスで接
    続し、 前記外部キャッシュの第1のデータ出力と前記CPUの
    データ入力とを語単位のデータ転送幅で接続し、 前記外部キャッシュの第2のデータ出力と前記ASIC
    のデータ入力とを前記外部キャッシュのライン幅で指定
    される複数語単位のデータ転送幅で接続し、 前記CPU及び前記ASICからの前記主記憶へのアク
    セス要求は、直接に、又は、調停手段によって調停され
    て、前記外部キャッシュに与えられる、ように構成した
    ことを特徴とする計算機。
  2. 【請求項2】前記外部キャッシュが、タグメモリと、デ
    ータメモリと、を含んで構成され、 前記タグメモリのラインに対応するデータメモリのライ
    ンが、前記CPUに対してアクセスを許可されたライン
    か、前記ASICに対してアクセスを許可されたライン
    かを区別する所有ビットと、 前記ラインが前記主記憶の対応する位置のデータと一致
    するか否かを区別する状態ビットと、 対応する前記主記憶のアドレスの一部であるタグデータ
    と、 を含むことを特徴とする請求項1記載の計算機。
  3. 【請求項3】前記ASICが使用するデータを、前記A
    SICまたは前記CPUが前記主記憶から前記外部キャ
    ッシュの特定ラインに転送し、該ラインの前記所有ビッ
    トを前記ASICが所有している状態に変更する手段
    と、 前記ASICが前記ラインの使用を完了した時点で、前
    記ラインの前記所有ビットを、前記CPUが所有してい
    る状態に戻し、前記CPUの前記ラインへのアクセスを
    許可する手段と、 前記CPUが前記ラインへのアクセスを行う際に、前記
    所有ビットを検査することによって、前記CPUが当該
    ラインへアクセス可能かを判断する手段と、 を備え、前記CPUと前記ASICが前記主記憶への排
    他制御を行う、 ことを特徴とする請求項記載の計算機。
JP08741597A 1997-03-21 1997-03-21 計算機のデータ供給方式 Expired - Fee Related JP3204157B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP08741597A JP3204157B2 (ja) 1997-03-21 1997-03-21 計算機のデータ供給方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP08741597A JP3204157B2 (ja) 1997-03-21 1997-03-21 計算機のデータ供給方式

Publications (2)

Publication Number Publication Date
JPH10269166A JPH10269166A (ja) 1998-10-09
JP3204157B2 true JP3204157B2 (ja) 2001-09-04

Family

ID=13914256

Family Applications (1)

Application Number Title Priority Date Filing Date
JP08741597A Expired - Fee Related JP3204157B2 (ja) 1997-03-21 1997-03-21 計算機のデータ供給方式

Country Status (1)

Country Link
JP (1) JP3204157B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7831780B2 (en) * 2005-06-24 2010-11-09 Nvidia Corporation Operating system supplemental disk caching system and method

Also Published As

Publication number Publication date
JPH10269166A (ja) 1998-10-09

Similar Documents

Publication Publication Date Title
JP3698358B2 (ja) 高速プロセッサシステム、これを使用する方法及び記録媒体
EP0646873B1 (en) Single-chip microcomputer
US7519774B2 (en) Data processor having a memory control unit with cache memory
US8037253B2 (en) Method and apparatus for global ordering to insure latency independent coherence
US7475190B2 (en) Direct access of cache lock set data without backing memory
WO1999016200A2 (en) Intelligent data bus interface using multi-port memory
US6751704B2 (en) Dual-L2 processor subsystem architecture for networking system
JP2004508634A (ja) 分割トランザクション相互接続のスループットを改善するための中間バッファ制御
JPH09179780A (ja) バースト可でキャッシュ不可のメモリアクセスを支援するマイクロプロセッサ装置
JPS5868286A (ja) キヤツシユメモリおよびその作動方法
US7774513B2 (en) DMA circuit and computer system
JP2591502B2 (ja) 情報処理システムおよびそのバス調停方式
JP3204157B2 (ja) 計算機のデータ供給方式
US7254667B2 (en) Data transfer between an external data source and a memory associated with a data processor
US6799247B1 (en) Remote memory processor architecture
EP1285340B1 (en) Shared bus interface for digital signal processor
EP0795827B1 (en) Memory device and method for accessing memories of the memory device
JP2568017B2 (ja) マイクロプロセッサ及びそれを使用したデータ処理システム
KR100334298B1 (ko) 기억 소자
JPH0351943A (ja) 高速バスと低速バスのバスライン共用化方式
CN117435251A (zh) 一种后量子密码算法处理器及其片上系统
CN114385529A (zh) 直接记忆体存取控制器、使用其之电子装置以及操作其的方法
JP2000066946A (ja) メモリコントローラ
JPH07129519A (ja) デュアルcpuシステム
JPH05324533A (ja) デュアルポートメモリ装置

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20010529

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080629

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090629

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100629

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100629

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110629

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110629

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120629

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120629

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130629

Year of fee payment: 12

LAPS Cancellation because of no payment of annual fees