JPH1049428A - 演算処理機能付メモリlsiとそれを用いる主記憶システム及びその制御方法 - Google Patents
演算処理機能付メモリlsiとそれを用いる主記憶システム及びその制御方法Info
- Publication number
- JPH1049428A JPH1049428A JP8204668A JP20466896A JPH1049428A JP H1049428 A JPH1049428 A JP H1049428A JP 8204668 A JP8204668 A JP 8204668A JP 20466896 A JP20466896 A JP 20466896A JP H1049428 A JPH1049428 A JP H1049428A
- Authority
- JP
- Japan
- Prior art keywords
- arithmetic processing
- memory
- main storage
- processing function
- storage system
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012545 processing Methods 0.000 title claims abstract description 235
- 230000015654 memory Effects 0.000 title claims abstract description 175
- 230000006870 function Effects 0.000 title claims abstract description 128
- 238000000034 method Methods 0.000 title claims abstract description 44
- 239000000758 substrate Substances 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 16
- 230000002457 bidirectional effect Effects 0.000 description 8
- 238000013507 mapping Methods 0.000 description 7
- 230000000694 effects Effects 0.000 description 6
- 230000008569 process Effects 0.000 description 5
- 230000001360 synchronised effect Effects 0.000 description 5
- 238000012546 transfer Methods 0.000 description 3
- 230000004913 activation Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11C—STATIC STORES
- G11C11/00—Digital stores characterised by the use of particular electric or magnetic storage elements; Storage elements therefor
- G11C11/21—Digital stores characterised by the use of particular electric or magnetic storage elements; Storage elements therefor using electric elements
- G11C11/34—Digital stores characterised by the use of particular electric or magnetic storage elements; Storage elements therefor using electric elements using semiconductor devices
- G11C11/40—Digital stores characterised by the use of particular electric or magnetic storage elements; Storage elements therefor using electric elements using semiconductor devices using transistors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F7/00—Methods or arrangements for processing data by operating upon the order or content of the data handled
- G06F7/38—Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation
- G06F7/48—Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices
- G06F7/57—Arithmetic logic units [ALU], i.e. arrangements or devices for performing two or more of the operations covered by groups G06F7/483 – G06F7/556 or for performing logical operations
- G06F7/575—Basic arithmetic logic units, i.e. devices selectable to perform either addition, subtraction or one of several logical operations, using, at least partially, the same circuitry
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F15/00—Digital computers in general; Data processing equipment in general
- G06F15/76—Architectures of general purpose stored program computers
- G06F15/78—Architectures of general purpose stored program computers comprising a single central processing unit
- G06F15/7807—System on chip, i.e. computer system on a single chip; System in package, i.e. computer system on one or more chips in a single package
- G06F15/7821—Tightly coupled to memory, e.g. computational memory, smart memory, processor in memory
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/30003—Arrangements for executing specific machine instructions
- G06F9/30007—Arrangements for executing specific machine instructions to perform operations on data operands
- G06F9/3001—Arithmetic instructions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/38—Concurrent instruction execution, e.g. pipeline or look ahead
- G06F9/3877—Concurrent instruction execution, e.g. pipeline or look ahead using a slave processor, e.g. coprocessor
- G06F9/3879—Concurrent instruction execution, e.g. pipeline or look ahead using a slave processor, e.g. coprocessor for non-native instruction execution, e.g. executing a command; for Java instruction set
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11C—STATIC STORES
- G11C7/00—Arrangements for writing information into, or reading information out from, a digital store
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Computer Hardware Design (AREA)
- Pure & Applied Mathematics (AREA)
- Computing Systems (AREA)
- Computational Mathematics (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Microelectronics & Electronic Packaging (AREA)
- Dram (AREA)
- Memory System (AREA)
Abstract
(57)【要約】
【課題】 メモリバスに要求されるデータバンド幅を削
減することが可能な演算処理機能付きの主記憶システム
を提供する。 【解決手段】 任意個数の演算処理機能付メモリ12と
任意個数のメモリ11から演算処理機能付主記憶システ
ム1を構成する。演算処理機能付メモリ12は、メモリ
部13の記憶データに対して演算処理部14で演算処理
を実行することができる。演算処理機能付メモリ12と
メモリ11は同一のメモリバス16に接続される。メモ
リバス16を介した特定アドレスへのリード/ライトア
クセス動作を利用する等の制御方法により、プロセッサ
31から演算処理機能付主記憶システム1に対して演算
処理開始要求と演算処理結果要求を行ない、演算処理機
能付主記憶システム1からプロセッサ31へ演算処理結
果回答を行なう。
減することが可能な演算処理機能付きの主記憶システム
を提供する。 【解決手段】 任意個数の演算処理機能付メモリ12と
任意個数のメモリ11から演算処理機能付主記憶システ
ム1を構成する。演算処理機能付メモリ12は、メモリ
部13の記憶データに対して演算処理部14で演算処理
を実行することができる。演算処理機能付メモリ12と
メモリ11は同一のメモリバス16に接続される。メモ
リバス16を介した特定アドレスへのリード/ライトア
クセス動作を利用する等の制御方法により、プロセッサ
31から演算処理機能付主記憶システム1に対して演算
処理開始要求と演算処理結果要求を行ない、演算処理機
能付主記憶システム1からプロセッサ31へ演算処理結
果回答を行なう。
Description
【0001】
【発明の属する技術分野】本発明はプロセッサシステム
の中で用いられる演算処理機能付メモリとそれを使った
主記憶システム及びこのシステムの制御方法に関する。
の中で用いられる演算処理機能付メモリとそれを使った
主記憶システム及びこのシステムの制御方法に関する。
【0002】
【従来の技術】パーソナルコンピュータ、ワークステー
ションなどの計算機システムあるいはコンピュータは、
一般的にプロセッサシステムという名称で呼ばれる。従
来技術によるプロセッサシステムに関しては、例えば、
ヘネシー(John L. Hennessy),パタ
ーソン(David A. Patterson)著の
Computer Architecture: A
Quantitative Approach (Mo
rgan Kaufmann Publishers
Inc.発行)や、アレクサンドリディス(Nikit
as Alexandridis)著のDesign
of Microprocessor−Based S
ystems (Prentice Hall発行)な
どに詳しい説明がある。
ションなどの計算機システムあるいはコンピュータは、
一般的にプロセッサシステムという名称で呼ばれる。従
来技術によるプロセッサシステムに関しては、例えば、
ヘネシー(John L. Hennessy),パタ
ーソン(David A. Patterson)著の
Computer Architecture: A
Quantitative Approach (Mo
rgan Kaufmann Publishers
Inc.発行)や、アレクサンドリディス(Nikit
as Alexandridis)著のDesign
of Microprocessor−Based S
ystems (Prentice Hall発行)な
どに詳しい説明がある。
【0003】図9に、従来のプロセッサシステムの一般
的な構成を示した。図9において、プロセッサシステム
は、プロセッサ31、システムコントローラ32、2次
キャッシュメモリ34、主記憶システム9、I/Oサブ
システム33などで構成される。
的な構成を示した。図9において、プロセッサシステム
は、プロセッサ31、システムコントローラ32、2次
キャッシュメモリ34、主記憶システム9、I/Oサブ
システム33などで構成される。
【0004】プロセッサ31は、1つのLSI上に集積
化されたマイクロプロセッサとして実現されるのが普通
である。また、プロセッサ31は、その内部に1次キャ
ッシュメモリ35を搭載している。システムコントロー
ラ32はプロセッサ31からの主記憶アクセスもしくは
I/Oアクセスにより主記憶システム9や二次キャッシ
ュメモリ34、もしくはI/Oサブシステム33をコン
トロールしたり、I/Oサブシステム33からの割り込
み要求をプロセッサ31に伝えたりする。
化されたマイクロプロセッサとして実現されるのが普通
である。また、プロセッサ31は、その内部に1次キャ
ッシュメモリ35を搭載している。システムコントロー
ラ32はプロセッサ31からの主記憶アクセスもしくは
I/Oアクセスにより主記憶システム9や二次キャッシ
ュメモリ34、もしくはI/Oサブシステム33をコン
トロールしたり、I/Oサブシステム33からの割り込
み要求をプロセッサ31に伝えたりする。
【0005】プロセッサ31とシステムコントローラ3
2は、コントロール信号線36−1、アドレス信号線3
6−2、データ信号線36−3で接続されている。
2は、コントロール信号線36−1、アドレス信号線3
6−2、データ信号線36−3で接続されている。
【0006】また、システムコントローラ32と主記憶
システム9はメモリバス16で接続されている。パーソ
ナルコンピュータの世界では、システムコントローラ3
2は複数のLSIに分かれて実現されており、よって一
般にチップセットあるいは周辺チップセットという名前
で呼ばれている。
システム9はメモリバス16で接続されている。パーソ
ナルコンピュータの世界では、システムコントローラ3
2は複数のLSIに分かれて実現されており、よって一
般にチップセットあるいは周辺チップセットという名前
で呼ばれている。
【0007】図10に従来の主記憶システム9の構成例
を示した。主記憶システム9とは、プロセッサシステム
がその演算処理を行なうための入力データ、演算処理途
中データや演算処理の出力データ、あるいは演算処理を
行なうためのプログラムなどを記憶するシステムであ
る。
を示した。主記憶システム9とは、プロセッサシステム
がその演算処理を行なうための入力データ、演算処理途
中データや演算処理の出力データ、あるいは演算処理を
行なうためのプログラムなどを記憶するシステムであ
る。
【0008】プロセッサ31においてロード/ストア命
令が発行されることにより、プロセッサ31から主記憶
システム9内の記憶データに対する主記憶空間リード/
ライト動作が実行される。
令が発行されることにより、プロセッサ31から主記憶
システム9内の記憶データに対する主記憶空間リード/
ライト動作が実行される。
【0009】図10において、主記憶システム9は複数
のDRAMLSI11(以下DRAM11)から構成さ
れており、それぞれのDRAM11は内部にDRAMセ
ルアレイとセンスアンプやデコーダ等からなるメモリ部
13を含んでいる。それぞれのDRAM11は、コント
ロール信号線16−1、アドレス信号線16−2、デー
タ信号線16−3に接続されている。これら3つの信号
線をまとめてメモリバス16と呼ぶ。メモリバス16
は、図9に示したように、主記憶システム9とシステム
コントローラ32の接続に用いられる。データ信号線1
6−3は読みだしデータと書き込みデータの双方に用い
られるため、双方向の信号線である。
のDRAMLSI11(以下DRAM11)から構成さ
れており、それぞれのDRAM11は内部にDRAMセ
ルアレイとセンスアンプやデコーダ等からなるメモリ部
13を含んでいる。それぞれのDRAM11は、コント
ロール信号線16−1、アドレス信号線16−2、デー
タ信号線16−3に接続されている。これら3つの信号
線をまとめてメモリバス16と呼ぶ。メモリバス16
は、図9に示したように、主記憶システム9とシステム
コントローラ32の接続に用いられる。データ信号線1
6−3は読みだしデータと書き込みデータの双方に用い
られるため、双方向の信号線である。
【0010】また、主記憶システム9のデータバンド
幅、すなわちメモリバス16のバスバンド幅を大きくす
るため、データ信号線16−3に各DRAM11のデー
タ入出力端子数よりも大きなビット幅を持たせ、データ
信号線16−3の一部分を個別のDRAM11に接続す
る構成が一般的である。例えば、それぞれのデータ入出
力端子の数が16ビットであるDRAM11を8個用い
て128ビットの幅を持つデータ信号線16−3に接続
する構成などが良く用いられる。このような主記憶シス
テム9の構成で用いられるDRAM11には、例えば、
ファーストページモードDRAM、エクステンデッド・
データ・アウト(EDO)DRAM、シンクロナスDR
AMなどがある。
幅、すなわちメモリバス16のバスバンド幅を大きくす
るため、データ信号線16−3に各DRAM11のデー
タ入出力端子数よりも大きなビット幅を持たせ、データ
信号線16−3の一部分を個別のDRAM11に接続す
る構成が一般的である。例えば、それぞれのデータ入出
力端子の数が16ビットであるDRAM11を8個用い
て128ビットの幅を持つデータ信号線16−3に接続
する構成などが良く用いられる。このような主記憶シス
テム9の構成で用いられるDRAM11には、例えば、
ファーストページモードDRAM、エクステンデッド・
データ・アウト(EDO)DRAM、シンクロナスDR
AMなどがある。
【0011】図11に従来の主記憶システム9の別の構
成例を示した。図11においては、メモリバス16はコ
ントロール信号線16−1と双方向のデータ/アドレス
信号線16−4で接続されている。この場合、データ/
アドレス信号線16−4は、図10の構成例におけるデ
ータ信号線16−3と違い、各DRAM11のデータ/
アドレス入出力端子のビット幅と同一のビット幅分だけ
用意されている。
成例を示した。図11においては、メモリバス16はコ
ントロール信号線16−1と双方向のデータ/アドレス
信号線16−4で接続されている。この場合、データ/
アドレス信号線16−4は、図10の構成例におけるデ
ータ信号線16−3と違い、各DRAM11のデータ/
アドレス入出力端子のビット幅と同一のビット幅分だけ
用意されている。
【0012】このような構成は、図10における主記憶
システム9の構成では、メモリバスバンド幅を大きくす
るためには多くのDRAM11を主記憶システム9に使
用しなければならないという問題を解決するために考え
出されたものである。このような主記憶システム9の構
成で用いられるDRAM11には、例えば、ランバスD
RAMなどがある。
システム9の構成では、メモリバスバンド幅を大きくす
るためには多くのDRAM11を主記憶システム9に使
用しなければならないという問題を解決するために考え
出されたものである。このような主記憶システム9の構
成で用いられるDRAM11には、例えば、ランバスD
RAMなどがある。
【0013】このような構成は、メモリバス16を構成
する信号線とDRAM11の入出力端子を少なくし、か
わりに信号線を高速に駆動することによりバスバンド幅
を高めることを狙ったものである。ここで、信号線の本
数を減らすことにより、高速駆動によるノイズの発生
や、信号線間の遅延時間のばらつきなどの問題を低減す
ることが出来るので、このような高速駆動が可能とな
る。
する信号線とDRAM11の入出力端子を少なくし、か
わりに信号線を高速に駆動することによりバスバンド幅
を高めることを狙ったものである。ここで、信号線の本
数を減らすことにより、高速駆動によるノイズの発生
や、信号線間の遅延時間のばらつきなどの問題を低減す
ることが出来るので、このような高速駆動が可能とな
る。
【0014】図10における主記憶システム9の構成で
は、DRAM11を並列に並べることでメモリバスバン
ド幅を確保しているため、メモリバスバンド幅を大きく
するためには多くのDRAM11を主記憶システム9に
使用しなければならないという問題がある。図11にお
ける主記憶システム9の構成では、メモリバス16を高
速に駆動することでメモリバスバンド幅を確保するた
め、このような問題は生じない。図11における主記憶
システム9の構成で用いられるDRAM11には、例え
ば、ランバスDRAMなどがある。
は、DRAM11を並列に並べることでメモリバスバン
ド幅を確保しているため、メモリバスバンド幅を大きく
するためには多くのDRAM11を主記憶システム9に
使用しなければならないという問題がある。図11にお
ける主記憶システム9の構成では、メモリバス16を高
速に駆動することでメモリバスバンド幅を確保するた
め、このような問題は生じない。図11における主記憶
システム9の構成で用いられるDRAM11には、例え
ば、ランバスDRAMなどがある。
【0015】ランバスDRAMでは、メモリバス16の
高速駆動を実現するために、メモリバス16の構成方法
や駆動方法に関して独自の技術を開発しているが、本発
明とは関係ないため、ここでは説明を省略する。なお、
ランバスDRAMに関しては、米国ランバス(Ramb
us)社発行のランバステクノロジガイドに詳しい記述
がある。
高速駆動を実現するために、メモリバス16の構成方法
や駆動方法に関して独自の技術を開発しているが、本発
明とは関係ないため、ここでは説明を省略する。なお、
ランバスDRAMに関しては、米国ランバス(Ramb
us)社発行のランバステクノロジガイドに詳しい記述
がある。
【0016】一方、メモリ、特にDRAMと演算処理回
路とを1つのLSI上に混載し、チップ内のメモリもし
くはDRAMを用いて一定の演算処理機能を実行するこ
とが可能なLSIを構成する方法が提案されている。こ
のような技術は一般にロジック−DRAM混載技術など
と呼ばれている。ロジック−DRAM混載技術に関する
従来技術の代表的な例が、1996年のInterna
tional Solid−State Circui
ts Conferenceで発表された、“A Mu
ltimedia 32b RISC Micropr
ocessorwith 16Mb DRAM”(To
ru Shimizu氏他、216頁)や“A 7.6
8GIPS,3.84GB/s,1W,Paralle
l Image−Processing RAM In
tegrating a 16Mb DRAM and
128 Processors”(Yoshihar
u Aimoto氏他、372頁)などである。これら
を以下では、それぞれロジック−DRAM混載従来技術
1及びロジック−DRAM混載従来技術2と呼ぶことに
する。
路とを1つのLSI上に混載し、チップ内のメモリもし
くはDRAMを用いて一定の演算処理機能を実行するこ
とが可能なLSIを構成する方法が提案されている。こ
のような技術は一般にロジック−DRAM混載技術など
と呼ばれている。ロジック−DRAM混載技術に関する
従来技術の代表的な例が、1996年のInterna
tional Solid−State Circui
ts Conferenceで発表された、“A Mu
ltimedia 32b RISC Micropr
ocessorwith 16Mb DRAM”(To
ru Shimizu氏他、216頁)や“A 7.6
8GIPS,3.84GB/s,1W,Paralle
l Image−Processing RAM In
tegrating a 16Mb DRAM and
128 Processors”(Yoshihar
u Aimoto氏他、372頁)などである。これら
を以下では、それぞれロジック−DRAM混載従来技術
1及びロジック−DRAM混載従来技術2と呼ぶことに
する。
【0017】ロジック−DRAM混載従来技術1は、プ
ロセッサ31と主記憶システム9の内の一部を一つのL
SI内に搭載したものである。プロセッサシステムの中
ではプロセッサ31の位置を占め、主記憶容量がチップ
内のDRAMだけで充分な場合は、外づけの主記憶シス
テム9をまったく必要としないという利点がある。
ロセッサ31と主記憶システム9の内の一部を一つのL
SI内に搭載したものである。プロセッサシステムの中
ではプロセッサ31の位置を占め、主記憶容量がチップ
内のDRAMだけで充分な場合は、外づけの主記憶シス
テム9をまったく必要としないという利点がある。
【0018】一方、ロジック−DRAM混載従来技術2
は、画像処理専用の並列プロセッサとその並列プロセッ
サに画像データを供給するDRAMとを一つのLSI内
に搭載したものである。プロセッサシステムの中ではI
/Oサブシステム33の位置を占め、画像処理だけをI
/Oサブシステム33内で高速処理する機能を持つ。
は、画像処理専用の並列プロセッサとその並列プロセッ
サに画像データを供給するDRAMとを一つのLSI内
に搭載したものである。プロセッサシステムの中ではI
/Oサブシステム33の位置を占め、画像処理だけをI
/Oサブシステム33内で高速処理する機能を持つ。
【0019】
【発明が解決しようとする課題】上で説明した主記憶シ
ステムに関する従来の技術には、必要なメモリバスバン
ド幅の確保が困難であるという問題がある。充分なメモ
リバスバンド幅の確保ができない場合、たとえプロセッ
サの性能が高くてもプロセッサシステムの実効的な性能
は不十分なメモリバスバンド幅により律速されてしま
う。また、上で説明したロジック−DRAM混載技術に
関する従来の技術には、このような主記憶システムのメ
モリバスバンド幅の確保の問題に対する有効な解決策に
は成り得ないという問題がある。以下これらの問題を説
明する。
ステムに関する従来の技術には、必要なメモリバスバン
ド幅の確保が困難であるという問題がある。充分なメモ
リバスバンド幅の確保ができない場合、たとえプロセッ
サの性能が高くてもプロセッサシステムの実効的な性能
は不十分なメモリバスバンド幅により律速されてしま
う。また、上で説明したロジック−DRAM混載技術に
関する従来の技術には、このような主記憶システムのメ
モリバスバンド幅の確保の問題に対する有効な解決策に
は成り得ないという問題がある。以下これらの問題を説
明する。
【0020】一般にプロセッサ31の処理能力と、その
処理能力をフルに引き出すために必要とされる主記憶シ
ステム9のメモリバス9のデータバンド幅、すなわちメ
モリバスバンド幅とは比例することが知られている。こ
れは、任意のプログラムの全体の処理の中で必要とする
主記憶アクセスの回数が決まっているため、より高速に
その処理を実行しようとすると、単位時間あたりにより
多くの主記憶アクセスを実行する必要が生じるからであ
る。半導体技術の進展に伴い、プロセッサ31の処理能
力は等比級数的な向上を続けている。このような性能向
上に見合うだけのメモリバスバンド幅を確保することは
非常に困難である。その理由は、一つにはメモリバス1
6が複数のLSI間を結ぶボード上の配線であるため、
配線あたりの負荷容量が大きく、LSI内部の配線に比
べて高速動作が難しいためである。
処理能力をフルに引き出すために必要とされる主記憶シ
ステム9のメモリバス9のデータバンド幅、すなわちメ
モリバスバンド幅とは比例することが知られている。こ
れは、任意のプログラムの全体の処理の中で必要とする
主記憶アクセスの回数が決まっているため、より高速に
その処理を実行しようとすると、単位時間あたりにより
多くの主記憶アクセスを実行する必要が生じるからであ
る。半導体技術の進展に伴い、プロセッサ31の処理能
力は等比級数的な向上を続けている。このような性能向
上に見合うだけのメモリバスバンド幅を確保することは
非常に困難である。その理由は、一つにはメモリバス1
6が複数のLSI間を結ぶボード上の配線であるため、
配線あたりの負荷容量が大きく、LSI内部の配線に比
べて高速動作が難しいためである。
【0021】また、別の理由は、LSIの外部I/Oピ
ンを通してLSI内とボード上の配線であるメモリバス
16が結ばれるため、LSI内部の配線に比べて信号線
の本数自体が限られてしまうためである。このように、
メモリバス16の信号線の動作速度の点からも信号線の
本数の点からも、必要なメモリバスバンド幅の確保は非
常に難しい問題となっている。
ンを通してLSI内とボード上の配線であるメモリバス
16が結ばれるため、LSI内部の配線に比べて信号線
の本数自体が限られてしまうためである。このように、
メモリバス16の信号線の動作速度の点からも信号線の
本数の点からも、必要なメモリバスバンド幅の確保は非
常に難しい問題となっている。
【0022】一般に、二つの回路ブロック間のデータ転
送バンド幅の向上を図りたい時に、最も効果的な手段は
これらの回路ブロックを一つのLSI内部に搭載するこ
とである。これは、LSI内部では、信号線の動作速度
と信号線の本数の両面においてボード上の配線に比べて
大幅な向上を見込めるためである。従って、ロジック−
DRAM混載技術は、上に述べたような主記憶システム
9のメモリバスバンド幅の確保という点で、解決策とな
り得る可能性がある。しかしながら、従来のロジック−
DRAM混載技術はプロセッサ31かもしくはI/Oサ
ブシステム33内に適用されているもので、それぞれ、
主記憶システム9のメモリバスバンド幅の改善という点
では満足な解決策とは言えない。これは以下の理由によ
る。
送バンド幅の向上を図りたい時に、最も効果的な手段は
これらの回路ブロックを一つのLSI内部に搭載するこ
とである。これは、LSI内部では、信号線の動作速度
と信号線の本数の両面においてボード上の配線に比べて
大幅な向上を見込めるためである。従って、ロジック−
DRAM混載技術は、上に述べたような主記憶システム
9のメモリバスバンド幅の確保という点で、解決策とな
り得る可能性がある。しかしながら、従来のロジック−
DRAM混載技術はプロセッサ31かもしくはI/Oサ
ブシステム33内に適用されているもので、それぞれ、
主記憶システム9のメモリバスバンド幅の改善という点
では満足な解決策とは言えない。これは以下の理由によ
る。
【0023】前述のロジック−DRAM混載従来技術1
は、プロセッサ31(もしくはその上で走るアプリケー
ションプログラム)が本来必要とする主記憶システムの
記憶容量の大きさよりもプロセッサ31に混載したDR
AMの容量の方が大きければ、メモリバスバンド幅の確
保の点で有効な解となっている。
は、プロセッサ31(もしくはその上で走るアプリケー
ションプログラム)が本来必要とする主記憶システムの
記憶容量の大きさよりもプロセッサ31に混載したDR
AMの容量の方が大きければ、メモリバスバンド幅の確
保の点で有効な解となっている。
【0024】しかしながら、主記憶システム9の記憶容
量は拡張可能性を有していることが極めて重要であり、
かつその絶対値はLSI内に混載可能なDRAMの容量
よりも大きい場合が多い。拡張可能性が必要なのは、ア
プリケーションの種類により必要な記憶容量が異なるた
め、コストの観点から様々な記憶容量を持つ主記憶シス
テム9をサポート可能なことが重要だからである。ま
た、必要な主記憶システム9の記憶容量は、例えば16
メガバイト程度から256メガバイト程度に亙り、一つ
のLSI内に混載可能なDRAMの容量よりも大きい。
このような原因によりロジック−DRAM混載従来技術
1に基づくプロセッサ11の外部に主記憶システム9を
接続しなければならないようになった場合、プロセッサ
11と外部の主記憶システム9間に必要なメモリバスバ
ンド幅を確保することは非常に難しい。
量は拡張可能性を有していることが極めて重要であり、
かつその絶対値はLSI内に混載可能なDRAMの容量
よりも大きい場合が多い。拡張可能性が必要なのは、ア
プリケーションの種類により必要な記憶容量が異なるた
め、コストの観点から様々な記憶容量を持つ主記憶シス
テム9をサポート可能なことが重要だからである。ま
た、必要な主記憶システム9の記憶容量は、例えば16
メガバイト程度から256メガバイト程度に亙り、一つ
のLSI内に混載可能なDRAMの容量よりも大きい。
このような原因によりロジック−DRAM混載従来技術
1に基づくプロセッサ11の外部に主記憶システム9を
接続しなければならないようになった場合、プロセッサ
11と外部の主記憶システム9間に必要なメモリバスバ
ンド幅を確保することは非常に難しい。
【0025】一方、ロジック−DRAM混載従来技術2
は、I/Oサブシステム33内で特定の処理を行なう場
合にのみ一つのLSI内での高バンド幅データ転送を活
かすことができる技術であり、主記憶システム9のメモ
リバスバンド幅確保の点では何ら解決策にはなり得な
い。
は、I/Oサブシステム33内で特定の処理を行なう場
合にのみ一つのLSI内での高バンド幅データ転送を活
かすことができる技術であり、主記憶システム9のメモ
リバスバンド幅確保の点では何ら解決策にはなり得な
い。
【0026】プロセッサ31の代わりにI/Oサブシス
テム33内で特定の処理を実行することで、副次的効果
として、プロセッサ31の負荷とそれに伴って要求され
るメモリバスバンド幅とを減らすことが可能ではある
が、逆に高性能化を続けるプロセッサ31の性能をフル
に活かすことができないという問題もある。
テム33内で特定の処理を実行することで、副次的効果
として、プロセッサ31の負荷とそれに伴って要求され
るメモリバスバンド幅とを減らすことが可能ではある
が、逆に高性能化を続けるプロセッサ31の性能をフル
に活かすことができないという問題もある。
【0027】なぜならば、このような方法は、プロセッ
サ31で行なわれていた処理をI/Oサブシステム33
に移すことを意味するからである。また、前述の従来技
術1と同様に、I/Oサブシステム33内のロジック−
DRAM混載従来技術2に基づくLSI内のDRAM以
外のメモリをアクセスしようとした時に、高バンド幅デ
ータ転送が行なえなくなるなど、記憶容量の拡張性とい
う点で問題がある。
サ31で行なわれていた処理をI/Oサブシステム33
に移すことを意味するからである。また、前述の従来技
術1と同様に、I/Oサブシステム33内のロジック−
DRAM混載従来技術2に基づくLSI内のDRAM以
外のメモリをアクセスしようとした時に、高バンド幅デ
ータ転送が行なえなくなるなど、記憶容量の拡張性とい
う点で問題がある。
【0028】本発明の目的は、高性能化するプロセッサ
11に見合うだけの主記憶システム9のメモリバスバン
ド幅の確保が困難であるという問題を解決する、演算処
理機能付メモリLSIと演算処理機能付主記憶システム
とを提供することにある。本発明の他の目的は、従来技
術の主記憶システムからスムーズに移行することが可能
な上記演算処理機能付主記憶システムを提供することに
ある。
11に見合うだけの主記憶システム9のメモリバスバン
ド幅の確保が困難であるという問題を解決する、演算処
理機能付メモリLSIと演算処理機能付主記憶システム
とを提供することにある。本発明の他の目的は、従来技
術の主記憶システムからスムーズに移行することが可能
な上記演算処理機能付主記憶システムを提供することに
ある。
【0029】
【課題を解決するための手段】本発明の演算処理機能付
メモリLSIは、チップ内部にメモリ部と共に演算処理
部を搭載しており、演算処理部においてメモリ部に記憶
されたデータを対象とした演算を行なうものである。本
発明の演算処理機能付メモリLSIは、演算処理部を搭
載せずにメモリ部だけで構成されたメモリLSIと同一
の入出力端子を具備するか、もしくはメモリ部だけで構
成されたメモリLSIが接続されるメモリバスにそのま
ま接続して使用することが可能なことが特徴である。
メモリLSIは、チップ内部にメモリ部と共に演算処理
部を搭載しており、演算処理部においてメモリ部に記憶
されたデータを対象とした演算を行なうものである。本
発明の演算処理機能付メモリLSIは、演算処理部を搭
載せずにメモリ部だけで構成されたメモリLSIと同一
の入出力端子を具備するか、もしくはメモリ部だけで構
成されたメモリLSIが接続されるメモリバスにそのま
ま接続して使用することが可能なことが特徴である。
【0030】本発明の演算処理機能付主記憶システム
は、複数の演算処理機能付メモリLSIと複数の従来技
術のメモリLSIから構成され、それぞれの個数を、そ
れぞれが零個の場合を含み、任意に設定可能なことが特
徴である。また、演算処理機能付メモリLSIとメモリ
部だけで構成されたメモリLSIが同一のメモリバスに
接続されることも特徴である。
は、複数の演算処理機能付メモリLSIと複数の従来技
術のメモリLSIから構成され、それぞれの個数を、そ
れぞれが零個の場合を含み、任意に設定可能なことが特
徴である。また、演算処理機能付メモリLSIとメモリ
部だけで構成されたメモリLSIが同一のメモリバスに
接続されることも特徴である。
【0031】本発明の演算処理機能付主記憶システムを
用いたプロセッサシステムは、一部の演算処理を、プロ
セッサではなく、演算処理機能付主記憶システム側で実
行することがその特徴である。
用いたプロセッサシステムは、一部の演算処理を、プロ
セッサではなく、演算処理機能付主記憶システム側で実
行することがその特徴である。
【0032】本発明の演算処理機能付主記憶システムの
制御方法は、プロセッサのロード/ストア命令の発行に
基づく主記憶空間へのリード/ライト動作を利用し、演
算処理機能付主記憶システムにおいて、特定のアドレス
へのライト動作を演算処理開始要求、特定のアドレスへ
のリード動作を演算処理結果要求として解釈することを
特徴とする。
制御方法は、プロセッサのロード/ストア命令の発行に
基づく主記憶空間へのリード/ライト動作を利用し、演
算処理機能付主記憶システムにおいて、特定のアドレス
へのライト動作を演算処理開始要求、特定のアドレスへ
のリード動作を演算処理結果要求として解釈することを
特徴とする。
【0033】本発明の演算処理機能付主記憶システムの
別の制御方法は、プロセッサのコプロセッサ制御命令の
発行に基づくコプロセッサ制御動作を利用し、演算処理
機能付主記憶システムにおいて、コプロセッサ起動動作
を演算処理開始要求、コプロセッサ同期動作を演算処理
結果要求として解釈することを特徴とする。
別の制御方法は、プロセッサのコプロセッサ制御命令の
発行に基づくコプロセッサ制御動作を利用し、演算処理
機能付主記憶システムにおいて、コプロセッサ起動動作
を演算処理開始要求、コプロセッサ同期動作を演算処理
結果要求として解釈することを特徴とする。
【0034】本発明の演算処理機能付メモリモジュール
は、外部端子としてメモリバス入出力端子を有し、プリ
ント基板上に演算処理機能付メモリLSIとメモリ部だ
けで構成されたメモリLSIとをそれぞれ任意個数ずつ
搭載することを特徴とする。
は、外部端子としてメモリバス入出力端子を有し、プリ
ント基板上に演算処理機能付メモリLSIとメモリ部だ
けで構成されたメモリLSIとをそれぞれ任意個数ずつ
搭載することを特徴とする。
【0035】本発明の演算処理機能付メモリLSIは、
LSI外部へデータを取り出さずにLSI内部で演算処
理を行なうことができる。また、メモリ部だけで構成さ
れたメモリLSIと同一の入出力端子を有するか、もし
くは同一のメモリバスに接続して使用することが可能な
ため、従来のプロセッサを用いたままで、演算処理機能
付メモリLSIを用いた主記憶システムを構成すること
が可能である。
LSI外部へデータを取り出さずにLSI内部で演算処
理を行なうことができる。また、メモリ部だけで構成さ
れたメモリLSIと同一の入出力端子を有するか、もし
くは同一のメモリバスに接続して使用することが可能な
ため、従来のプロセッサを用いたままで、演算処理機能
付メモリLSIを用いた主記憶システムを構成すること
が可能である。
【0036】本発明の演算処理機能付主記憶システム
は、それぞれの演算処理機能付メモリLSI内部で演算
処理を行なうため、これを用いたプロセッサシステムに
おいては、記憶容量の拡張可能性を維持しながら、必要
とされるメモリバスバンド幅が少なくて済む。
は、それぞれの演算処理機能付メモリLSI内部で演算
処理を行なうため、これを用いたプロセッサシステムに
おいては、記憶容量の拡張可能性を維持しながら、必要
とされるメモリバスバンド幅が少なくて済む。
【0037】また、本発明の演算処理機能付主記憶シス
テムは、従来のプロセッサとメモリバスをそのままにし
たままで、従来の主記憶システムと置き換えるだけで使
用できるため、従来の主記憶システムからスムーズに移
行することが可能である。
テムは、従来のプロセッサとメモリバスをそのままにし
たままで、従来の主記憶システムと置き換えるだけで使
用できるため、従来の主記憶システムからスムーズに移
行することが可能である。
【0038】更に、本発明の演算処理機能付メモリモジ
ュールを演算処理機能付主記憶システムに用いることに
より、従来のメモリモジュールと差し替えるだけで簡便
に本発明の演算処理機能付主記憶システムを使用するこ
とが可能である。
ュールを演算処理機能付主記憶システムに用いることに
より、従来のメモリモジュールと差し替えるだけで簡便
に本発明の演算処理機能付主記憶システムを使用するこ
とが可能である。
【0039】
【発明の実施の形態】図1は、本発明による演算処理機
能付主記憶システムの構成の第1の実施の形態の構成を
示すブロック図である。図1において演算処理機能付主
記憶システム1は、任意個数のDRAMLSI11(以
下DRAM11)と任意個数の演算処理機能付DRAM
LSI12(以下DRAM12)とから構成されてい
る。
能付主記憶システムの構成の第1の実施の形態の構成を
示すブロック図である。図1において演算処理機能付主
記憶システム1は、任意個数のDRAMLSI11(以
下DRAM11)と任意個数の演算処理機能付DRAM
LSI12(以下DRAM12)とから構成されてい
る。
【0040】DRAM11はメモリ部13のみで構成さ
れており、演算処理機能付DRAM12はメモリ部13
と演算処理部14とから構成されている。主記憶システ
ム1内のDRAM11及び12はそれぞれメモリバス1
6に接続されている。メモリバス16はコントロール信
号線16−1、アドレス信号線16−2、データ信号線
16−3で構成されている。従来技術の第1の例として
図10に示した主記憶システム9と同様に、データ信号
線16−3のみが双方向の信号線である。
れており、演算処理機能付DRAM12はメモリ部13
と演算処理部14とから構成されている。主記憶システ
ム1内のDRAM11及び12はそれぞれメモリバス1
6に接続されている。メモリバス16はコントロール信
号線16−1、アドレス信号線16−2、データ信号線
16−3で構成されている。従来技術の第1の例として
図10に示した主記憶システム9と同様に、データ信号
線16−3のみが双方向の信号線である。
【0041】演算処理機能付DRAM12内の演算処理
部14で行なう処理の典型的な例は、画像を対象とした
処理である。例えば、動画像の伸長を行なうアプリケー
ションプログラムにおいては、DCT(Discret
e Cosine Transformation)処
理、逆DCT処理や、画像フレーム間の差分処理、フィ
ルタリング処理などを行なう。また、逆に動画像の圧縮
を行なうアプリケーションプログラムにおいては、これ
らの処理の他に、動きベクトルの検索を行なう処理など
を実行する。プロセッサ31側では、これらのアプリケ
ーションプログラム全体の制御を行ない、以上のような
動画像データを直接取り扱う処理の実行を演算処理機能
付DRAM12に要求し、処理結果を受けとる。
部14で行なう処理の典型的な例は、画像を対象とした
処理である。例えば、動画像の伸長を行なうアプリケー
ションプログラムにおいては、DCT(Discret
e Cosine Transformation)処
理、逆DCT処理や、画像フレーム間の差分処理、フィ
ルタリング処理などを行なう。また、逆に動画像の圧縮
を行なうアプリケーションプログラムにおいては、これ
らの処理の他に、動きベクトルの検索を行なう処理など
を実行する。プロセッサ31側では、これらのアプリケ
ーションプログラム全体の制御を行ない、以上のような
動画像データを直接取り扱う処理の実行を演算処理機能
付DRAM12に要求し、処理結果を受けとる。
【0042】このような処理を行なうために、演算処理
部14は、加算器、乗算器などのハードウェアを備えて
いる必要が有る。典型的には、DSP(Digital
Signal Processor)や近年のマイク
ロプロセッサに搭載されているマルチメディア処理ユニ
ットなどを演算処理部14として搭載することが考えら
れる。マルチメディア処理ユニットについては、例えば
Intel社のMMX(Multimedia Ext
ention)仕様などで詳しく述べられている。
部14は、加算器、乗算器などのハードウェアを備えて
いる必要が有る。典型的には、DSP(Digital
Signal Processor)や近年のマイク
ロプロセッサに搭載されているマルチメディア処理ユニ
ットなどを演算処理部14として搭載することが考えら
れる。マルチメディア処理ユニットについては、例えば
Intel社のMMX(Multimedia Ext
ention)仕様などで詳しく述べられている。
【0043】図2は、本発明による演算処理機能付主記
憶システムの構成の第2の実施の形態の構成を示すブロ
ック図である。図2において演算処理機能付主記憶シス
テム1は、任意個数のDRAM11と任意個数の演算処
理機能付DRAM12とから構成されている。DRAM
11はメモリ部13から構成されており、演算処理機能
付DRAM12はメモリ部13と演算処理部14とから
構成されている。演算処理機能付主記憶システム1内の
DRAM11及び演算処理機能付DRAM12はそれぞ
れメモリバス16に接続されている。メモリバス16は
コントロール信号線16−1、データ/アドレス信号線
16−4に接続されている。従来技術の第2の例として
図11に示した主記憶システム9と同様に、データ/ア
ドレス信号線16−4は双方向の信号線である。
憶システムの構成の第2の実施の形態の構成を示すブロ
ック図である。図2において演算処理機能付主記憶シス
テム1は、任意個数のDRAM11と任意個数の演算処
理機能付DRAM12とから構成されている。DRAM
11はメモリ部13から構成されており、演算処理機能
付DRAM12はメモリ部13と演算処理部14とから
構成されている。演算処理機能付主記憶システム1内の
DRAM11及び演算処理機能付DRAM12はそれぞ
れメモリバス16に接続されている。メモリバス16は
コントロール信号線16−1、データ/アドレス信号線
16−4に接続されている。従来技術の第2の例として
図11に示した主記憶システム9と同様に、データ/ア
ドレス信号線16−4は双方向の信号線である。
【0044】図1及び図2において演算処理機能付DR
AM12とDRAM11が同一のメモリバス16にそれ
ぞれ接続されていることから明らかなように、本発明に
よる演算処理機能付DRAM12は通常用いられている
DRAM11と同一の入出力信号端子を有するか、もし
くは最低限同一のメモリバス16に入出力信号端子をそ
のまま接続可能なことを特徴としている。
AM12とDRAM11が同一のメモリバス16にそれ
ぞれ接続されていることから明らかなように、本発明に
よる演算処理機能付DRAM12は通常用いられている
DRAM11と同一の入出力信号端子を有するか、もし
くは最低限同一のメモリバス16に入出力信号端子をそ
のまま接続可能なことを特徴としている。
【0045】ここで同一の入出力信号端子を有すると
は、入出力端子の端子数とその端子位置が同一であり、
かつ電気的な信号インタフェースが同一であることを意
味する。電気的な信号インタフェースとは、例えば入力
端子であるか出力端子であるか、あるいは信号の電位レ
ベルの設定や、有効に信号を入出力できるタイミングの
設定などを意味する。また、同一のメモリバス16に入
出力信号端子をそのまま接続可能であるとは、演算処理
機能付DRAM12の入出力端子の内の一部がDRAM
11の入出力信号端子と同一であることを意味する。
は、入出力端子の端子数とその端子位置が同一であり、
かつ電気的な信号インタフェースが同一であることを意
味する。電気的な信号インタフェースとは、例えば入力
端子であるか出力端子であるか、あるいは信号の電位レ
ベルの設定や、有効に信号を入出力できるタイミングの
設定などを意味する。また、同一のメモリバス16に入
出力信号端子をそのまま接続可能であるとは、演算処理
機能付DRAM12の入出力端子の内の一部がDRAM
11の入出力信号端子と同一であることを意味する。
【0046】なお、ここで同一のメモリバス16に接続
可能なのは、任意の入出力信号端子構成を持つDRAM
11と、これをベースにして演算処理部14を追加する
ことにより構成された演算処理機能付DRAM12に関
してであって、任意の入出力端子構成を持つDRAM1
1と任意の入出力端子構成を持つ演算処理機能付DRA
Mが同一のメモリバス16に接続されて可能なことを意
味している訳ではない。
可能なのは、任意の入出力信号端子構成を持つDRAM
11と、これをベースにして演算処理部14を追加する
ことにより構成された演算処理機能付DRAM12に関
してであって、任意の入出力端子構成を持つDRAM1
1と任意の入出力端子構成を持つ演算処理機能付DRA
Mが同一のメモリバス16に接続されて可能なことを意
味している訳ではない。
【0047】図1及び図2において、本発明による演算
処理機能付主記憶システム1は、演算処理機能付DRA
M12の数を任意に設定できる点をその特徴としてい
る。演算処理機能付DRAM12が零個であれば、従来
技術の主記憶システム9の第1、第2の例とそれぞれ同
一の構成となる。
処理機能付主記憶システム1は、演算処理機能付DRA
M12の数を任意に設定できる点をその特徴としてい
る。演算処理機能付DRAM12が零個であれば、従来
技術の主記憶システム9の第1、第2の例とそれぞれ同
一の構成となる。
【0048】図3は、本発明による演算処理機能付主記
憶システム1を用いたプロセッサシステムの実施の形態
の構成を示すブロック図である。図3において本発明に
よるプロセッサシステム3は、プロセッサ31、システ
ムコントローラ32、2次キャッシュメモリ34、演算
処理機能付主記憶システム1、I/Oサブシステム33
で構成される。
憶システム1を用いたプロセッサシステムの実施の形態
の構成を示すブロック図である。図3において本発明に
よるプロセッサシステム3は、プロセッサ31、システ
ムコントローラ32、2次キャッシュメモリ34、演算
処理機能付主記憶システム1、I/Oサブシステム33
で構成される。
【0049】プロセッサ31は、1つのLSI上に集積
化されたマイクロプロセッサとして実現されるのが普通
である。また、プロセッサ31は、その内部に1次キャ
ッシュ35を搭載している。
化されたマイクロプロセッサとして実現されるのが普通
である。また、プロセッサ31は、その内部に1次キャ
ッシュ35を搭載している。
【0050】システムコントローラ32はプロセッサ3
1からの主記憶アクセスもしくはI/Oアクセスにより
演算処理機能付主記憶システム1や二次キャッシュメモ
リ34、もしくはI/Oサブシステム33をコントロー
ルしたり、I/Oサブシステム33からの割り込み要求
をプロセッサ31に伝えたりする機能を持つ。更に、プ
ロセッサ31から主記憶システム1への演算処理開始要
求や演算処理結果要求、もしくは主記憶システム1から
プロセッサ31への演算処理結果回答もシステムコント
ローラ32を介してそれぞれ主記憶システム1やプロセ
ッサ31へ伝えられる。プロセッサ31とシステムコン
トローラ32は、コントロール信号線36−1、アドレ
ス信号線36−2、データ信号線36−3で接続されて
いる。また、システムコントローラ32と主記憶システ
ム1はメモリバス16で接続されている。
1からの主記憶アクセスもしくはI/Oアクセスにより
演算処理機能付主記憶システム1や二次キャッシュメモ
リ34、もしくはI/Oサブシステム33をコントロー
ルしたり、I/Oサブシステム33からの割り込み要求
をプロセッサ31に伝えたりする機能を持つ。更に、プ
ロセッサ31から主記憶システム1への演算処理開始要
求や演算処理結果要求、もしくは主記憶システム1から
プロセッサ31への演算処理結果回答もシステムコント
ローラ32を介してそれぞれ主記憶システム1やプロセ
ッサ31へ伝えられる。プロセッサ31とシステムコン
トローラ32は、コントロール信号線36−1、アドレ
ス信号線36−2、データ信号線36−3で接続されて
いる。また、システムコントローラ32と主記憶システ
ム1はメモリバス16で接続されている。
【0051】本発明による演算処理機能付主記憶システ
ム1の制御方法では、プロセッサ31から主記憶システ
ム1に対して演算処理開始要求を送ることにより主記憶
システム1で演算処理を開始し、プロセッサ31から主
記憶システム1に対して演算処理結果要求を送ること
で、主記憶システム1からプロセッサ31に演算処理結
果回答を送ることを特徴としている。
ム1の制御方法では、プロセッサ31から主記憶システ
ム1に対して演算処理開始要求を送ることにより主記憶
システム1で演算処理を開始し、プロセッサ31から主
記憶システム1に対して演算処理結果要求を送ること
で、主記憶システム1からプロセッサ31に演算処理結
果回答を送ることを特徴としている。
【0052】図4は、本発明のプロセッサシステム3に
おいて演算処理機能付主記憶システム1における演算処
理を可能にするための、本発明の主記憶システム1の制
御方法の第1の実施の形態を示す説明図である。図4の
実施の形態では、プロセッサ31においてストア命令と
ロード命令をそれぞれ実行することにより、プロセッサ
31の演算処理開始要求と演算処理結果要求を演算処理
機能付主記憶システム1へ送ることを特徴としている。
おいて演算処理機能付主記憶システム1における演算処
理を可能にするための、本発明の主記憶システム1の制
御方法の第1の実施の形態を示す説明図である。図4の
実施の形態では、プロセッサ31においてストア命令と
ロード命令をそれぞれ実行することにより、プロセッサ
31の演算処理開始要求と演算処理結果要求を演算処理
機能付主記憶システム1へ送ることを特徴としている。
【0053】図4において、プロセッサ31は、何らか
の処理を行なった後に、まず特定の主記憶アドレスA1
へのストア命令を発行している。この時、ストアされる
べきライトデータはレジスタRxの内容として与えられ
る。主記憶システム1側では、この特定の主記憶アドレ
スA1へのライト動作を演算処理開始要求だと解釈す
る。演算処理開始要求の中身は主記憶システム1側でラ
イトデータを解釈することにより得られる。
の処理を行なった後に、まず特定の主記憶アドレスA1
へのストア命令を発行している。この時、ストアされる
べきライトデータはレジスタRxの内容として与えられ
る。主記憶システム1側では、この特定の主記憶アドレ
スA1へのライト動作を演算処理開始要求だと解釈す
る。演算処理開始要求の中身は主記憶システム1側でラ
イトデータを解釈することにより得られる。
【0054】次に、プロセッサ31は、特定の主記憶ア
ドレスA2へのロード命令を発行している。主記憶シス
テム1側では、この特定の主記憶アドレスへのリード動
作を演算処理結果要求だと解釈する。演算処理結果要求
に対して、主記憶システム1は、当該の演算処理結果回
答をリードデータとしてプロセッサ31へ送る。プロセ
ッサ31は、送られてきたリードデータをレジスタRy
に格納する。
ドレスA2へのロード命令を発行している。主記憶シス
テム1側では、この特定の主記憶アドレスへのリード動
作を演算処理結果要求だと解釈する。演算処理結果要求
に対して、主記憶システム1は、当該の演算処理結果回
答をリードデータとしてプロセッサ31へ送る。プロセ
ッサ31は、送られてきたリードデータをレジスタRy
に格納する。
【0055】このように、本発明の制御方法の第1の実
施の形態では、特定のアドレスへのロード/ストア命令
発行による当該のアドレスへのリード/ライト動作を主
記憶システム1側で解釈することにより、演算処理開始
要求、演算処理結果要求、演算処理結果回答のそれぞれ
を実現することを特徴としている。
施の形態では、特定のアドレスへのロード/ストア命令
発行による当該のアドレスへのリード/ライト動作を主
記憶システム1側で解釈することにより、演算処理開始
要求、演算処理結果要求、演算処理結果回答のそれぞれ
を実現することを特徴としている。
【0056】これらのリード/ライト動作は、DRAM
11に対する通常のリード/ライト動作と全く同様に行
なわれる。従って、図1のメモリバス16上では、コン
トロール信号線16−1を用いてリードもしくはライト
の動作の種類が伝達され、アドレス信号線16−2を用
いてリード/ライト動作のアドレスが伝達され、双方向
のデータ信号線16−3を用いて演算処理開始要求の際
の要求内容と演算処理結果回答とがそれぞれ伝達され
る。
11に対する通常のリード/ライト動作と全く同様に行
なわれる。従って、図1のメモリバス16上では、コン
トロール信号線16−1を用いてリードもしくはライト
の動作の種類が伝達され、アドレス信号線16−2を用
いてリード/ライト動作のアドレスが伝達され、双方向
のデータ信号線16−3を用いて演算処理開始要求の際
の要求内容と演算処理結果回答とがそれぞれ伝達され
る。
【0057】図2のメモリバス16上では、双方向のデ
ータ/アドレス信号線16−4を用いてリード/ライト
動作のアドレスが伝達され、演算処理開始要求の際の要
求内容と演算処理結果回答とがそれぞれ伝達される。
ータ/アドレス信号線16−4を用いてリード/ライト
動作のアドレスが伝達され、演算処理開始要求の際の要
求内容と演算処理結果回答とがそれぞれ伝達される。
【0058】図5は、図4の本発明による演算処理機能
付主記憶システムの制御方法の実施の形態に対応する、
演算処理機能付メモリLSI内の主記憶空間のマッピン
グ方法に関する実施の形態の説明図である。図5では、
演算処理機能付DRAM12に関して、その内部主記憶
空間のマッピング方法の二つの場合を示している。
付主記憶システムの制御方法の実施の形態に対応する、
演算処理機能付メモリLSI内の主記憶空間のマッピン
グ方法に関する実施の形態の説明図である。図5では、
演算処理機能付DRAM12に関して、その内部主記憶
空間のマッピング方法の二つの場合を示している。
【0059】図5(a)では演算処理機能付DRAM1
2の内部主記憶空間はデータ領域とI/F領域(インタ
フェース領域)に分けられている。演算処理機能付DR
AM12は、I/F領域に対するライト動作は演算処理
開始要求、リード動作は演算処理結果要求として解釈す
る。データ領域には演算処理の対象となる入力データや
演算処理途中データ、演算処理の結果データなどが記憶
されている。
2の内部主記憶空間はデータ領域とI/F領域(インタ
フェース領域)に分けられている。演算処理機能付DR
AM12は、I/F領域に対するライト動作は演算処理
開始要求、リード動作は演算処理結果要求として解釈す
る。データ領域には演算処理の対象となる入力データや
演算処理途中データ、演算処理の結果データなどが記憶
されている。
【0060】図5(b)では、更にマクロコード領域が
設けられている。この領域には、演算処理機能付DRA
M12内で行なわれる演算処理の手順を示す部分的なプ
ログラムが記憶される。この部分的なプログラムをマク
ロコードと呼ぶ。
設けられている。この領域には、演算処理機能付DRA
M12内で行なわれる演算処理の手順を示す部分的なプ
ログラムが記憶される。この部分的なプログラムをマク
ロコードと呼ぶ。
【0061】図5(a)と図5(b)に示したメモリマ
ップ方法のどちらを使用するかは図4で説明した主記憶
システム1の制御方法のより具体的な演算処理要求方法
に依存する。プロセッサ31の演算処理開始要求に際し
て、具体的な処理内容を要求内容として送る場合は図5
(a)のメモリマップ方法が適している。この場合、複
数のステップからなる演算処理を要求するためにはその
ステップ毎にプロセッサ31から演算処理要求を発行す
る必要が生じる。
ップ方法のどちらを使用するかは図4で説明した主記憶
システム1の制御方法のより具体的な演算処理要求方法
に依存する。プロセッサ31の演算処理開始要求に際し
て、具体的な処理内容を要求内容として送る場合は図5
(a)のメモリマップ方法が適している。この場合、複
数のステップからなる演算処理を要求するためにはその
ステップ毎にプロセッサ31から演算処理要求を発行す
る必要が生じる。
【0062】一方、図5(b)に示したように演算処理
機能付DRAM12にマクロコードを記憶している場合
は、一連の演算処理をプロセッサ31から演算処理機能
付主記憶システム1へ要求するに際して、当該のマクロ
コードの先頭アドレスを含む演算処理要求を発行すれば
良い。
機能付DRAM12にマクロコードを記憶している場合
は、一連の演算処理をプロセッサ31から演算処理機能
付主記憶システム1へ要求するに際して、当該のマクロ
コードの先頭アドレスを含む演算処理要求を発行すれば
良い。
【0063】図6は、図4で説明した制御方法の実施の
形態に対応する、演算処理機能付主記憶システムの主記
憶空間マッピング方法に関する実施の形態の説明図であ
る。図6の左側には実主記憶空間が、右側には仮想主記
憶空間がそれぞれ示されている。
形態に対応する、演算処理機能付主記憶システムの主記
憶空間マッピング方法に関する実施の形態の説明図であ
る。図6の左側には実主記憶空間が、右側には仮想主記
憶空間がそれぞれ示されている。
【0064】図6では、実主記憶空間のうち、一つの演
算処理機能付DRAM12内の主記憶空間の部分だけが
示されており、この部分は、図5(b)にならって、デ
ータ領域、マクロコード領域、I/F領域に分けられて
いる。
算処理機能付DRAM12内の主記憶空間の部分だけが
示されており、この部分は、図5(b)にならって、デ
ータ領域、マクロコード領域、I/F領域に分けられて
いる。
【0065】一方、図6の仮想主記憶空間は、図9の従
来の主記憶システム9の場合と同様に、データ空間とテ
キスト空間の二つの空間に分けられている。演算処理機
能付DRAM12のデータ領域及びI/F領域は仮想主
記憶空間のデータ空間から、マクロコード領域は仮想主
記憶空間のテキスト空間からそれぞれマッピングされ
る。ここでテキスト空間とはプログラムが格納される空
間で、データ空間とはそれ以外のものが格納される空間
で、データ領域とI/F領域を含む。
来の主記憶システム9の場合と同様に、データ空間とテ
キスト空間の二つの空間に分けられている。演算処理機
能付DRAM12のデータ領域及びI/F領域は仮想主
記憶空間のデータ空間から、マクロコード領域は仮想主
記憶空間のテキスト空間からそれぞれマッピングされ
る。ここでテキスト空間とはプログラムが格納される空
間で、データ空間とはそれ以外のものが格納される空間
で、データ領域とI/F領域を含む。
【0066】図4から図6を引用して説明した本発明に
よる演算処理機能付主記憶システムの制御方法の実施の
形態に関しては、次のような注意が必要である。図6に
おいて説明した仮想主記憶空間から実主記憶空間へのマ
ッピングを実現するためには、例えばメモリマップ関数
などという名前で知られているライブラリ関数を用い
て、それぞれの領域が当該の演算処理機能付DRAM1
2に対応する実主記憶空間へ正しくマッピングされるよ
うに制御する必要がある。また、I/F領域、マクロコ
ード領域はキャッシングされないように、アンキャッシ
ャブル指定にする必要がある。
よる演算処理機能付主記憶システムの制御方法の実施の
形態に関しては、次のような注意が必要である。図6に
おいて説明した仮想主記憶空間から実主記憶空間へのマ
ッピングを実現するためには、例えばメモリマップ関数
などという名前で知られているライブラリ関数を用い
て、それぞれの領域が当該の演算処理機能付DRAM1
2に対応する実主記憶空間へ正しくマッピングされるよ
うに制御する必要がある。また、I/F領域、マクロコ
ード領域はキャッシングされないように、アンキャッシ
ャブル指定にする必要がある。
【0067】ここでキャッシングとは、プロセッサ31
内に搭載された1次キャッシュメモリ35あるいは2次
キャッシュメモリ34に、これらの領域の記憶内容がコ
ピーされてしまう事である。アンキャッシャブル指定に
するとは、このようなコピーが起きないように指定する
ことを意味する。このような指定が必要は理由は、これ
らの領域はプロセッサ31と演算処理機能付DRAM1
2の双方がこれらの領域にアクセスするため、演算処理
機能付DRAM12内のこれらの領域の記憶内容の他に
1次キャッシュメモリ35あるいは2次キャッシュメモ
リ34にコピーが存在すると、記憶内容のくい違いが生
じる可能性が有るためである。
内に搭載された1次キャッシュメモリ35あるいは2次
キャッシュメモリ34に、これらの領域の記憶内容がコ
ピーされてしまう事である。アンキャッシャブル指定に
するとは、このようなコピーが起きないように指定する
ことを意味する。このような指定が必要は理由は、これ
らの領域はプロセッサ31と演算処理機能付DRAM1
2の双方がこれらの領域にアクセスするため、演算処理
機能付DRAM12内のこれらの領域の記憶内容の他に
1次キャッシュメモリ35あるいは2次キャッシュメモ
リ34にコピーが存在すると、記憶内容のくい違いが生
じる可能性が有るためである。
【0068】図7は、本発明のプロセッサシステム3に
おいて演算処理機能付主記憶システム1における演算処
理を可能にするための、本発明の制御方法の第2の実施
の形態を示す説明図である。この実施の形態において
は、プロセッサ31において、主記憶空間へのロード/
ストア命令ではなく、コプロセッサ制御命令を用いて演
算処理開始要求、演算処理結果要求、演算処理結果回答
の動作を行なう点を特徴としている。ここで、コプロセ
ッサ制御命令とは、以下に説明するコプロセッサ起動命
令、コプロセッサ同期命令の双方を意味する。
おいて演算処理機能付主記憶システム1における演算処
理を可能にするための、本発明の制御方法の第2の実施
の形態を示す説明図である。この実施の形態において
は、プロセッサ31において、主記憶空間へのロード/
ストア命令ではなく、コプロセッサ制御命令を用いて演
算処理開始要求、演算処理結果要求、演算処理結果回答
の動作を行なう点を特徴としている。ここで、コプロセ
ッサ制御命令とは、以下に説明するコプロセッサ起動命
令、コプロセッサ同期命令の双方を意味する。
【0069】図7において、コプロセッサ起動命令が、
Act Cpという命令コードで示されている。この命
令によりコプロセッサ起動動作、すなわち演算処理開始
要求が行なわれる。コプロセッサ起動命令における引数
Nは、コプロセッサNを起動することを意味し、引数R
xは要求内容を保持するレジスタを指定する。また、コ
プロセッサ同期命令はSync Cpという命令コード
で示されている。この命令によりコプロセッサ同期動
作、すなわち演算処理結果要求と演算処理結果回答が行
なわれる。コプロセッサ同期命令における引数Nは、コ
プロセッサNを起動することを意味し、引数Ryは演算
処理結果を受けとるレジスタを指定する。
Act Cpという命令コードで示されている。この命
令によりコプロセッサ起動動作、すなわち演算処理開始
要求が行なわれる。コプロセッサ起動命令における引数
Nは、コプロセッサNを起動することを意味し、引数R
xは要求内容を保持するレジスタを指定する。また、コ
プロセッサ同期命令はSync Cpという命令コード
で示されている。この命令によりコプロセッサ同期動
作、すなわち演算処理結果要求と演算処理結果回答が行
なわれる。コプロセッサ同期命令における引数Nは、コ
プロセッサNを起動することを意味し、引数Ryは演算
処理結果を受けとるレジスタを指定する。
【0070】これらのコプロセッサ起動動作/コプロセ
ッサ同期動作は、メモリバス16を介して演算処理機能
付主記憶システム1内の演算処理機能付DRAM12へ
伝達される。従って、図1のメモリバス16上では、コ
ントロール信号線16−1を用いてコプロセッサ起動も
しくは同期の動作の種類が伝達され、アドレス信号線1
6−2を用いてコプロセッサの番号が伝達され、双方向
のデータ信号線16−3を用いて演算処理開始要求の際
の要求内容と演算処理結果回答とがそれぞれ伝達され
る。
ッサ同期動作は、メモリバス16を介して演算処理機能
付主記憶システム1内の演算処理機能付DRAM12へ
伝達される。従って、図1のメモリバス16上では、コ
ントロール信号線16−1を用いてコプロセッサ起動も
しくは同期の動作の種類が伝達され、アドレス信号線1
6−2を用いてコプロセッサの番号が伝達され、双方向
のデータ信号線16−3を用いて演算処理開始要求の際
の要求内容と演算処理結果回答とがそれぞれ伝達され
る。
【0071】また図2のメモリバス16上では、双方向
のデータ/アドレス信号線16−4を用いてコプロセッ
サの番号が伝達され、演算処理開始要求の際の要求内容
と演算処理結果回答とがそれぞれ伝達される。なお、コ
プロセッサ番号はそれぞれの演算処理機能付DRAM1
2と1対1に対応する場合もあり得るし、それぞれのD
RAM12に複数のコプロセッサ番号が割り当てられる
場合もあり得る。
のデータ/アドレス信号線16−4を用いてコプロセッ
サの番号が伝達され、演算処理開始要求の際の要求内容
と演算処理結果回答とがそれぞれ伝達される。なお、コ
プロセッサ番号はそれぞれの演算処理機能付DRAM1
2と1対1に対応する場合もあり得るし、それぞれのD
RAM12に複数のコプロセッサ番号が割り当てられる
場合もあり得る。
【0072】このようなコプロセッサ制御命令を備えた
プロセッサの例としてはベクトル型計算機システムにお
けるスカラープロセッサが例として上げられる。また、
一般のマイクロプロセッサにおけるI/O空間へのアク
セス命令をコプロセッサ制御命令として使用することも
可能である。また、この実施の形態では、コントロール
信号線16−1にリード/ライト動作のみでなくコプロ
セッサ制御動作をも伝達させるため、図1に示した実施
の形態においてファーストページモードDRAM、ED
O DRAM、シンクロナスDRAMなどのDRAM1
1を用いた場合は、DRAM11のコントロール信号入
力端子に比べて演算処理機能付DRAM12のコントロ
ール信号入力端子の数を増やす必要がある。
プロセッサの例としてはベクトル型計算機システムにお
けるスカラープロセッサが例として上げられる。また、
一般のマイクロプロセッサにおけるI/O空間へのアク
セス命令をコプロセッサ制御命令として使用することも
可能である。また、この実施の形態では、コントロール
信号線16−1にリード/ライト動作のみでなくコプロ
セッサ制御動作をも伝達させるため、図1に示した実施
の形態においてファーストページモードDRAM、ED
O DRAM、シンクロナスDRAMなどのDRAM1
1を用いた場合は、DRAM11のコントロール信号入
力端子に比べて演算処理機能付DRAM12のコントロ
ール信号入力端子の数を増やす必要がある。
【0073】一方、図2に示した実施の形態においてラ
ンバスDRAMをDRAM11として用いた場合には、
ランバスDRAMが限られたコントロール信号入力端子
上に伝達されるパケットの時系列的なプロトコルにより
動作モードを表現する手法をとっているため、コントロ
ール信号入力端子の数を増やさずに、プロトコルを変更
するだけで演算処理機能付DRAM12を図7を用いて
説明したコプロセッサ命令により制御動作に対応させる
ことが可能になる。
ンバスDRAMをDRAM11として用いた場合には、
ランバスDRAMが限られたコントロール信号入力端子
上に伝達されるパケットの時系列的なプロトコルにより
動作モードを表現する手法をとっているため、コントロ
ール信号入力端子の数を増やさずに、プロトコルを変更
するだけで演算処理機能付DRAM12を図7を用いて
説明したコプロセッサ命令により制御動作に対応させる
ことが可能になる。
【0074】図8は、本発明による演算処理機能付メモ
リモジュールの実施の形態の構成を示した説明図であ
る。図8に示した演算処理機能付メモリモジュール8は
複数個数のDRAM11と複数個数の演算処理機能付D
RAM12とから構成され、プリント基板81上にこれ
らを実装したものである。外部端子はメモリバス入出力
端子86であり、演算処理機能付主記憶システムに用い
た場合、メモリバス16に接続される。DRAM11と
演算処理機能付DRAM12の個数の比は任意に設定可
能である。図8の演算処理機能付メモリモジュール8
は、演算機能付DRAM12を一切含まない場合、主に
パーソナルコンピュータ等の主記憶に使用されるSIM
M(Single Inlined Memory M
odule)やDIMM(Dual Inlined
Memory Module)などと呼ばれるメモリモ
ジュールに対応するものである。
リモジュールの実施の形態の構成を示した説明図であ
る。図8に示した演算処理機能付メモリモジュール8は
複数個数のDRAM11と複数個数の演算処理機能付D
RAM12とから構成され、プリント基板81上にこれ
らを実装したものである。外部端子はメモリバス入出力
端子86であり、演算処理機能付主記憶システムに用い
た場合、メモリバス16に接続される。DRAM11と
演算処理機能付DRAM12の個数の比は任意に設定可
能である。図8の演算処理機能付メモリモジュール8
は、演算機能付DRAM12を一切含まない場合、主に
パーソナルコンピュータ等の主記憶に使用されるSIM
M(Single Inlined Memory M
odule)やDIMM(Dual Inlined
Memory Module)などと呼ばれるメモリモ
ジュールに対応するものである。
【0075】
【発明の効果】本発明の第1の効果は、演算処理機能付
主記憶システム内で演算処理を行なうことにより、プロ
セッサシステムのメモリバス上に必要とされるデータバ
ンド幅を削減できることである。これは、従来のプロセ
ッサシステムでは、主記憶システムからプロセッサへメ
モリバス上を転送されていたデータが、演算処理機能付
主記憶システム内、より具体的には演算処理機能付メモ
リLSI内で処理されるようになるためである。
主記憶システム内で演算処理を行なうことにより、プロ
セッサシステムのメモリバス上に必要とされるデータバ
ンド幅を削減できることである。これは、従来のプロセ
ッサシステムでは、主記憶システムからプロセッサへメ
モリバス上を転送されていたデータが、演算処理機能付
主記憶システム内、より具体的には演算処理機能付メモ
リLSI内で処理されるようになるためである。
【0076】例えば、縦方向に8画素、横方向に8画素
の二つの画像ブロック間で引き算をする処理を考える。
1画素の大きさは1バイトであるとし、引き算に要する
時間がS秒であるとする。プロセッサ上で処理を行なう
場合、メモリバス上のデータバンド幅はトータルで毎秒
192バイト/Sとなる。これは、64画素の画像ブロ
ック二つをプロセッサ側に読みだし、引き算した結果の
64画素の画像ブロック一つを主記憶システム側に書き
込むからである。つまり64×2+64=192であ
る。×2の部分は引き算をする二つの画像の読み出し、
+の部分は計算結果の書き込みである。
の二つの画像ブロック間で引き算をする処理を考える。
1画素の大きさは1バイトであるとし、引き算に要する
時間がS秒であるとする。プロセッサ上で処理を行なう
場合、メモリバス上のデータバンド幅はトータルで毎秒
192バイト/Sとなる。これは、64画素の画像ブロ
ック二つをプロセッサ側に読みだし、引き算した結果の
64画素の画像ブロック一つを主記憶システム側に書き
込むからである。つまり64×2+64=192であ
る。×2の部分は引き算をする二つの画像の読み出し、
+の部分は計算結果の書き込みである。
【0077】一方、演算処理機能付主記憶システム内で
当該の演算処理を行なう場合、プロセッサから演算処理
機能付主記憶システムへ演算処理開始要求を送り、演算
処理が終ったかどうかを演算処理結果要求により検知す
るだけでよい。演算処理開始要求、演算処理結果要求、
演算処理結果回答はそれぞれ4バイト程度で実現可能で
あるため、この場合のデータバンド幅は毎秒12B/S
バイトとなり、従来技術の場合の約6%と大幅に削減さ
れる。
当該の演算処理を行なう場合、プロセッサから演算処理
機能付主記憶システムへ演算処理開始要求を送り、演算
処理が終ったかどうかを演算処理結果要求により検知す
るだけでよい。演算処理開始要求、演算処理結果要求、
演算処理結果回答はそれぞれ4バイト程度で実現可能で
あるため、この場合のデータバンド幅は毎秒12B/S
バイトとなり、従来技術の場合の約6%と大幅に削減さ
れる。
【0078】本発明の第2の効果は、従来のプロセッサ
システムで、主記憶システムをそのまま演算処理機能付
主記憶システムに置き換えるだけで、その他の変更は全
くないかもしくは軽微な変更のみで、上記第1の効果を
得ることができる点である。その理由を以下、二つの場
合に分けて説明する。
システムで、主記憶システムをそのまま演算処理機能付
主記憶システムに置き換えるだけで、その他の変更は全
くないかもしくは軽微な変更のみで、上記第1の効果を
得ることができる点である。その理由を以下、二つの場
合に分けて説明する。
【0079】第1の場合は、主記憶空間へのリード/ラ
イト動作を用いて演算処理機能付主記憶システムの演算
処理を動作させる制御方法を用いた場合である。この場
合は、従来のプロセッサシステムにおける一時的なマイ
クロプロセッサ、メモリバス等をそのまま用いることが
できる。
イト動作を用いて演算処理機能付主記憶システムの演算
処理を動作させる制御方法を用いた場合である。この場
合は、従来のプロセッサシステムにおける一時的なマイ
クロプロセッサ、メモリバス等をそのまま用いることが
できる。
【0080】第2の場合は、コプロセッサ制御命令を用
いて演算処理機能付主記憶システムの演算処理を動作さ
せる制御方法を用いた場合である。この場合でも、従来
技術として紹介したランバスDRAM等をメモリLSI
として使用すれば、同一のメモリバスをそのまま用いて
演算処理機能付DRAMの演算処理を制御することがで
きる。
いて演算処理機能付主記憶システムの演算処理を動作さ
せる制御方法を用いた場合である。この場合でも、従来
技術として紹介したランバスDRAM等をメモリLSI
として使用すれば、同一のメモリバスをそのまま用いて
演算処理機能付DRAMの演算処理を制御することがで
きる。
【0081】本発明の第3の効果は、第2の効果によ
り、従来の主記憶システムを本発明の演算処理機能付主
記憶システムに置き換えるだけで、従来のプロセッサシ
ステムから簡単に性能の向上を図ることができる点であ
る。更に、本発明による演算処理機能付メモリモジュー
ルを演算処理機能付主記憶システムとして用いることに
より、メモリモジュールを差し替えるだけで簡便にこの
ような効果を得ることができる。
り、従来の主記憶システムを本発明の演算処理機能付主
記憶システムに置き換えるだけで、従来のプロセッサシ
ステムから簡単に性能の向上を図ることができる点であ
る。更に、本発明による演算処理機能付メモリモジュー
ルを演算処理機能付主記憶システムとして用いることに
より、メモリモジュールを差し替えるだけで簡便にこの
ような効果を得ることができる。
【0082】本発明の第4の効果は、演算処理機能付メ
モリLSIの数を増やすことにより、段階的に演算処理
性能の向上を図ることができる点である。これは、演算
処理部の数が増えるため、これらを並列に動作させるこ
とで性能向上が実現できるからである。
モリLSIの数を増やすことにより、段階的に演算処理
性能の向上を図ることができる点である。これは、演算
処理部の数が増えるため、これらを並列に動作させるこ
とで性能向上が実現できるからである。
【0083】なお、本発明の実施の形態の説明において
は、メモリLSIとして、DRAMLSIを特に取り上
げ説明を行なったが、他のメモリLSI、例えば不揮発
性の強誘電体メモリLSIなどを用いても同様の演算処
理機能付メモリLSI及び演算処理機能付主記憶システ
ムを構成することが可能である。
は、メモリLSIとして、DRAMLSIを特に取り上
げ説明を行なったが、他のメモリLSI、例えば不揮発
性の強誘電体メモリLSIなどを用いても同様の演算処
理機能付メモリLSI及び演算処理機能付主記憶システ
ムを構成することが可能である。
【図1】本発明による演算処理機能付主記憶システムの
構成の第1の実施の形態を示すブロック図である。
構成の第1の実施の形態を示すブロック図である。
【図2】本発明による演算処理機能付主記憶システムの
構成の第2の実施の形態を示すブロック図である。
構成の第2の実施の形態を示すブロック図である。
【図3】本発明による演算処理機能付主記憶システムを
用いたプロセッサシステムの構成の実施の形態を示すブ
ロック図である。
用いたプロセッサシステムの構成の実施の形態を示すブ
ロック図である。
【図4】本発明による演算処理機能付主記憶システムの
制御方法の第1の実施の形態に関する説明図である。
制御方法の第1の実施の形態に関する説明図である。
【図5】図4の実施の形態に対応する、本発明による演
算処理機能付主記憶システムの制御方法における演算処
理機能付メモリLSI内の主記憶空間のマッピング方法
の実施の形態を示した説明図である。
算処理機能付主記憶システムの制御方法における演算処
理機能付メモリLSI内の主記憶空間のマッピング方法
の実施の形態を示した説明図である。
【図6】図4の実施の形態に対応する、本発明による演
算処理機能付主記憶システムの制御方法における演算処
理機能付主記憶システムの主記憶空間のマッピング方法
の実施の形態を示した説明図である。
算処理機能付主記憶システムの制御方法における演算処
理機能付主記憶システムの主記憶空間のマッピング方法
の実施の形態を示した説明図である。
【図7】本発明による演算処理機能付主記憶システムの
制御方法の第2の実施の形態に関する説明図である。
制御方法の第2の実施の形態に関する説明図である。
【図8】本発明による演算処理機能付メモリモジュール
の実施の形態の構成を示した説明図である。
の実施の形態の構成を示した説明図である。
【図9】従来技術による主記憶システムを用いたプロセ
ッサシステムの構成の例を示したブロック図である。
ッサシステムの構成の例を示したブロック図である。
【図10】従来技術による主記憶システムの構成の例を
示したブロック図である。
示したブロック図である。
【図11】従来技術による主記憶システムの別の構成の
例を示したブロック図である。
例を示したブロック図である。
1 演算処理機能付主記憶システム 11 DRAMLSI 12 演算処理機能付DRAMLSI 16 メモリバス 3 プロセッサシステム 8 演算処理機能付メモリモジュール 86 メモリバス入出力端子
Claims (9)
- 【請求項1】一つのLSI内に演算処理部とメモリ部と
を混載し、前記演算処理部により前記メモリ部内に記憶
されたデータを用いて演算処理を行なうことが可能な演
算処理機能付メモリLSIであって、メモリ部のみで構
成されるメモリLSIの入出力端子構成と入出力端子構
成が全く同一であることを特徴とする演算処理機能付メ
モリLSI。 - 【請求項2】メモリ部のみで構成されるメモリLSIの
入出力端子と端子数、端子配置、信号インタフェースが
同一である請求項1に記載の演算処理機能付メモリLS
I。 - 【請求項3】一つのLSI内に演算処理部とメモリ部と
を混載し、前記演算処理部により前記メモリ部内に記憶
されたデータを用いて演算処理を行なうことが可能な演
算処理機能付メモリLSIであって、メモリ部のみで構
成されるメモリLSIが接続されるメモリバスに入出力
端子をそのまま接続することが可能な前記演算処理機能
付メモリLSI。 - 【請求項4】メモリバスにつながる入出力端子の端子
数、端子配置、信号インタフェースが、メモリ部のみで
構成されるメモリLSIと同一である請求項3に記載の
演算処理機能付メモリLSI。 - 【請求項5】請求項1、2、3または4に記載の演算処
理機能付メモリLSIであって、前記メモリ部をダイナ
ミックランダムアクセスメモリとして構成することを特
徴とする演算処理機能付メモリLSI。 - 【請求項6】プロセッサと共に用いることでプロセッサ
システムを構成し、請求項1、2、3、4または5に記
載の演算処理機能付メモリLSIと、メモリ部のみで構
成されるメモリLSIをそれぞれ任意個数用いて構成さ
れ、かつ同一のメモリバスに複数の演算処理機能付メモ
リLSIと複数の前記メモリLSIが接続されることを
特徴とする演算処理機能付主記憶システム。 - 【請求項7】前記プロセッサのロード/ストア命令によ
り実行される主記憶空間へのリード/ライト動作を用
い、主記憶空間ライト動作により演算処理機能付主記憶
システムへの演算処理開始要求、主記憶空間リード動作
により演算処理機能付主記憶システムへの演算処理結果
要求をそれぞれ行なうことを特徴とする請求項6に記載
の演算処理機能付主記憶システムの制御方法。 - 【請求項8】前記プロセッサのコプロセッサ制御命令に
より実行されるコプロセッサへの起動/同期動作を用
い、コプロセッサ起動動作により演算処理機能付主記憶
システムへの演算処理開始要求、コプロセッサ同期動作
により演算処理機能付主記憶システムへの演算処理結果
要求をそれぞれ行なうことを特徴とする請求項6記載の
演算処理機能付主記憶システムの制御方法。 - 【請求項9】プリンタ基板上に、請求項1、2、3、4
または5に記載の演算処理機能付メモリLSIとメモリ
部のみで構成されるLSIをそれぞれ任意個数搭載する
ことで構成され、外部端子としてメモリバス入出力端子
を有することを特徴とする演算処理機能付メモリモジュ
ール。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP08204668A JP3075184B2 (ja) | 1996-08-02 | 1996-08-02 | 演算処理機能付主記憶システム及びその制御方法 |
US08/897,430 US5862396A (en) | 1996-08-02 | 1997-07-21 | Memory LSI with arithmetic logic processing capability, main memory system using the same, and method of controlling main memory system |
GB9715993A GB2316205B (en) | 1996-08-02 | 1997-07-29 | Memory lsi with arithmetic logic processing capability,main memory system using the same,and method of controlling main memory system |
KR1019970037435A KR100324187B1 (ko) | 1996-08-02 | 1997-08-02 | 연산논리처리기능을 가진 메모리엘에스아이(lsi), 이를 이용한 주메모리시스템, 및 주메모리시스템 제어방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP08204668A JP3075184B2 (ja) | 1996-08-02 | 1996-08-02 | 演算処理機能付主記憶システム及びその制御方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH1049428A true JPH1049428A (ja) | 1998-02-20 |
JP3075184B2 JP3075184B2 (ja) | 2000-08-07 |
Family
ID=16494319
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP08204668A Expired - Fee Related JP3075184B2 (ja) | 1996-08-02 | 1996-08-02 | 演算処理機能付主記憶システム及びその制御方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US5862396A (ja) |
JP (1) | JP3075184B2 (ja) |
KR (1) | KR100324187B1 (ja) |
GB (1) | GB2316205B (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR19990007287A (ko) * | 1997-06-24 | 1999-01-25 | 모리 가즈히로 | 반도체 집적회로, 컴퓨터 시스템, 데이터 처리장치 및 데이터 처리방법 |
JP2002108691A (ja) * | 2000-09-29 | 2002-04-12 | Mitsubishi Electric Corp | 半導体記憶装置および半導体記憶装置の制御方法 |
US6505276B1 (en) | 1998-06-26 | 2003-01-07 | Nec Corporation | Processing-function-provided packet-type memory system and method for controlling the same |
JP2010532905A (ja) * | 2008-06-26 | 2010-10-14 | ラッセル・エイチ・フィッシュ | スレッドに最適化されたマルチプロセッサアーキテクチャ |
JP2010287249A (ja) * | 2010-08-09 | 2010-12-24 | Renesas Electronics Corp | 半導体記憶装置およびメモリ制御システム |
JP2013250914A (ja) * | 2012-06-04 | 2013-12-12 | I-Cubed Research Center Inc | メモリモジュール、情報処理装置、およびデータ処理方法 |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10326224A (ja) * | 1997-05-27 | 1998-12-08 | Nec Corp | ディジタル・シグナル・プロセッサ |
US8489861B2 (en) * | 1997-12-23 | 2013-07-16 | Round Rock Research, Llc | Split embedded DRAM processor |
US6226738B1 (en) * | 1997-08-01 | 2001-05-01 | Micron Technology, Inc. | Split embedded DRAM processor |
US6760833B1 (en) * | 1997-08-01 | 2004-07-06 | Micron Technology, Inc. | Split embedded DRAM processor |
US7243133B2 (en) * | 1999-03-30 | 2007-07-10 | Sedna Patent Services, Llc | Method and apparatus for reducing latency in an interactive information distribution system |
EP1059781B1 (de) * | 1999-05-06 | 2007-09-05 | Siemens Aktiengesellschaft | Kommunikationseinrichtung mit Mitteln zur Echtzeitverarbeitung von zu übertragenden Nutzdaten |
JP2002175689A (ja) | 2000-09-29 | 2002-06-21 | Mitsubishi Electric Corp | 半導体集積回路装置 |
GB0125711D0 (en) * | 2001-10-26 | 2001-12-19 | Ibm | In-memory arithmetic |
WO2007119373A1 (ja) * | 2006-04-04 | 2007-10-25 | Panasonic Corporation | システム制御装置 |
CN108241484B (zh) * | 2016-12-26 | 2021-10-15 | 上海寒武纪信息科技有限公司 | 基于高带宽存储器的神经网络计算装置和方法 |
US20200117449A1 (en) * | 2018-10-12 | 2020-04-16 | Micron Technology, Inc. | Accelerated Access to Computations Results Generated from Data Stored in Memory Devices |
US11157213B2 (en) | 2018-10-12 | 2021-10-26 | Micron Technology, Inc. | Parallel memory access and computation in memory devices |
US10461076B1 (en) | 2018-10-24 | 2019-10-29 | Micron Technology, Inc. | 3D stacked integrated circuits having functional blocks configured to accelerate artificial neural network (ANN) computation |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4138734A (en) * | 1976-10-01 | 1979-02-06 | Canon Kabushiki Kaisha | Electronic equipment capable of arithmetic operations |
DE3587882T2 (de) * | 1984-05-20 | 1994-11-24 | Hitachi Ltd | Speichereinheit mit arithmetischen und logischen Funktionen, insbesondere für graphische Datenverarbeitung. |
US5444665A (en) * | 1985-06-17 | 1995-08-22 | Hitachi, Ltd. | Semiconductor memory device |
US5023838A (en) * | 1988-12-02 | 1991-06-11 | Ncr Corporation | Random access memory device with integral logic capability |
US5345555A (en) * | 1990-11-23 | 1994-09-06 | Network Computing Devices, Inc. | Image processor memory for expediting memory operations |
JPH04248642A (ja) * | 1991-01-18 | 1992-09-04 | Kenneth W Iobst | メモリ集積回路のpimチップおよびその制御方法 |
JP3780011B2 (ja) * | 1995-07-14 | 2006-05-31 | 株式会社ルネサステクノロジ | 半導体記憶装置 |
-
1996
- 1996-08-02 JP JP08204668A patent/JP3075184B2/ja not_active Expired - Fee Related
-
1997
- 1997-07-21 US US08/897,430 patent/US5862396A/en not_active Expired - Lifetime
- 1997-07-29 GB GB9715993A patent/GB2316205B/en not_active Expired - Fee Related
- 1997-08-02 KR KR1019970037435A patent/KR100324187B1/ko not_active IP Right Cessation
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR19990007287A (ko) * | 1997-06-24 | 1999-01-25 | 모리 가즈히로 | 반도체 집적회로, 컴퓨터 시스템, 데이터 처리장치 및 데이터 처리방법 |
US6505276B1 (en) | 1998-06-26 | 2003-01-07 | Nec Corporation | Processing-function-provided packet-type memory system and method for controlling the same |
JP2002108691A (ja) * | 2000-09-29 | 2002-04-12 | Mitsubishi Electric Corp | 半導体記憶装置および半導体記憶装置の制御方法 |
JP2010532905A (ja) * | 2008-06-26 | 2010-10-14 | ラッセル・エイチ・フィッシュ | スレッドに最適化されたマルチプロセッサアーキテクチャ |
JP2010287249A (ja) * | 2010-08-09 | 2010-12-24 | Renesas Electronics Corp | 半導体記憶装置およびメモリ制御システム |
JP2013250914A (ja) * | 2012-06-04 | 2013-12-12 | I-Cubed Research Center Inc | メモリモジュール、情報処理装置、およびデータ処理方法 |
Also Published As
Publication number | Publication date |
---|---|
GB2316205A (en) | 1998-02-18 |
GB9715993D0 (en) | 1997-10-01 |
GB2316205B (en) | 1998-11-25 |
KR100324187B1 (ko) | 2002-06-20 |
US5862396A (en) | 1999-01-19 |
JP3075184B2 (ja) | 2000-08-07 |
KR19980018403A (ko) | 1998-06-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3075184B2 (ja) | 演算処理機能付主記憶システム及びその制御方法 | |
US6918012B2 (en) | Streamlined cache coherency protocol system and method for a multiple processor single chip device | |
US4110823A (en) | Soft display word processing system with multiple autonomous processors | |
US5781763A (en) | Independent control of DMA and I/O resources for mixed-endian computing systems | |
US20090077320A1 (en) | Direct access of cache lock set data without backing memory | |
JPH06215160A (ja) | データ処理方法および装置 | |
JP2013178823A (ja) | パーティションフリーマルチソケットメモリシステムアーキテクチャ | |
US7321438B2 (en) | Parallel processing for a first and second image data from one input image | |
US6097403A (en) | Memory including logic for operating upon graphics primitives | |
KR970008189B1 (ko) | 메모리 공간 제어방법 및 메모리 장치 | |
JP4055339B2 (ja) | 画像処理システムおよび画像処理装置 | |
JPS61233869A (ja) | 画像処理装置 | |
JP2001290790A (ja) | ディスク制御装置 | |
JP3204297B2 (ja) | Dma転送制御装置 | |
JPH09186836A (ja) | ディジタル複写機 | |
JP3810175B2 (ja) | グラフィックスプロセッサおよび図形処理装置 | |
JPH11338774A (ja) | 情報処理装置及びそのシステムバス最適化方法並びにその制御プログラムを記録した記録媒体 | |
JPS6240565A (ja) | メモリ制御方式 | |
JPH0713920A (ja) | Dma転送方法 | |
JP3219422B2 (ja) | キャッシュメモリ制御方式 | |
JP2000010856A (ja) | メモリ制御装置 | |
JPS62115562A (ja) | Dmaコントロ−ラ | |
KR19990037241U (ko) | 마이크로 프로세서 | |
JP2000010854A (ja) | メモリ制御装置 | |
JPS62115563A (ja) | Dmaコントロ−ラ |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20000509 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080609 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090609 Year of fee payment: 9 |
|
LAPS | Cancellation because of no payment of annual fees |