JP5417674B2 - 計算機システム及び主記憶装置 - Google Patents
計算機システム及び主記憶装置 Download PDFInfo
- Publication number
- JP5417674B2 JP5417674B2 JP2012503797A JP2012503797A JP5417674B2 JP 5417674 B2 JP5417674 B2 JP 5417674B2 JP 2012503797 A JP2012503797 A JP 2012503797A JP 2012503797 A JP2012503797 A JP 2012503797A JP 5417674 B2 JP5417674 B2 JP 5417674B2
- Authority
- JP
- Japan
- Prior art keywords
- marching
- array
- information
- storage device
- computer system
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003860 storage Methods 0.000 title claims description 282
- 230000015654 memory Effects 0.000 claims description 377
- 239000013598 vector Substances 0.000 claims description 152
- 238000012545 processing Methods 0.000 claims description 94
- 238000012546 transfer Methods 0.000 claims description 33
- 230000001360 synchronised effect Effects 0.000 claims description 7
- 230000017525 heat dissipation Effects 0.000 claims description 3
- 238000003491 array Methods 0.000 claims 1
- 230000004044 response Effects 0.000 claims 1
- 239000003990 capacitor Substances 0.000 description 76
- 239000004065 semiconductor Substances 0.000 description 63
- 238000005304 joining Methods 0.000 description 29
- 238000000034 method Methods 0.000 description 20
- 238000005265 energy consumption Methods 0.000 description 19
- 238000010586 diagram Methods 0.000 description 18
- 230000002457 bidirectional effect Effects 0.000 description 17
- 239000010931 gold Substances 0.000 description 12
- 230000006870 function Effects 0.000 description 11
- 229910045601 alloy Inorganic materials 0.000 description 8
- 239000000956 alloy Substances 0.000 description 8
- 239000010949 copper Substances 0.000 description 8
- 229910003460 diamond Inorganic materials 0.000 description 7
- 239000010432 diamond Substances 0.000 description 7
- 239000011159 matrix material Substances 0.000 description 7
- 239000000463 material Substances 0.000 description 6
- 238000012986 modification Methods 0.000 description 6
- 230000004048 modification Effects 0.000 description 6
- 229910052777 Praseodymium Inorganic materials 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 4
- BQCADISMDOOEFD-UHFFFAOYSA-N Silver Chemical compound [Ag] BQCADISMDOOEFD-UHFFFAOYSA-N 0.000 description 4
- JDNQIVVMUDFBLD-UHFFFAOYSA-N [Ni][In][Au] Chemical compound [Ni][In][Au] JDNQIVVMUDFBLD-UHFFFAOYSA-N 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 229910052802 copper Inorganic materials 0.000 description 4
- 238000013461 design Methods 0.000 description 4
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 4
- 229910052737 gold Inorganic materials 0.000 description 4
- MSNOMDLPLDYDME-UHFFFAOYSA-N gold nickel Chemical compound [Ni].[Au] MSNOMDLPLDYDME-UHFFFAOYSA-N 0.000 description 4
- 229910052709 silver Inorganic materials 0.000 description 4
- 239000004332 silver Substances 0.000 description 4
- 229910000679 solder Inorganic materials 0.000 description 4
- 230000003068 static effect Effects 0.000 description 4
- 238000009826 distribution Methods 0.000 description 3
- 230000012447 hatching Effects 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 239000000203 mixture Substances 0.000 description 2
- 230000006399 behavior Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000001816 cooling Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 238000011982 device technology Methods 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 239000002887 superconductor Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/38—Concurrent instruction execution, e.g. pipeline or look ahead
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11C—STATIC STORES
- G11C7/00—Arrangements for writing information into, or reading information out from, a digital store
- G11C7/10—Input/output [I/O] data interface arrangements, e.g. I/O data control circuits, I/O data buffers
- G11C7/1072—Input/output [I/O] data interface arrangements, e.g. I/O data control circuits, I/O data buffers for memories with random access ports synchronised on clock signal pulse trains, e.g. synchronous memories, self timed memories
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/04—Generating or distributing clock signals or signals derived directly therefrom
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/26—Power supply means, e.g. regulation thereof
- G06F1/32—Means for saving power
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F12/00—Accessing, addressing or allocating within memory systems or architectures
- G06F12/02—Addressing or allocation; Relocation
- G06F12/08—Addressing or allocation; Relocation in hierarchically structured memory systems, e.g. virtual memory systems
- G06F12/0802—Addressing of a memory level in which the access to the desired data or data block requires associative addressing means, e.g. caches
- G06F12/0875—Addressing of a memory level in which the access to the desired data or data block requires associative addressing means, e.g. caches with dedicated cache, e.g. instruction or stack
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F13/00—Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
- G06F13/14—Handling requests for interconnection or transfer
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F15/00—Digital computers in general; Data processing equipment in general
- G06F15/76—Architectures of general purpose stored program computers
- G06F15/78—Architectures of general purpose stored program computers comprising a single central processing unit
- G06F15/7807—System on chip, i.e. computer system on a single chip; System in package, i.e. computer system on one or more chips in a single package
- G06F15/7821—Tightly coupled to memory, e.g. computational memory, smart memory, processor in memory
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F5/00—Methods or arrangements for data conversion without changing the order or content of the data handled
- G06F5/06—Methods or arrangements for data conversion without changing the order or content of the data handled for changing the speed of data flow, i.e. speed regularising or timing, e.g. delay lines, FIFO buffers; over- or underrun control therefor
- G06F5/065—Partitioned buffers, e.g. allowing multiple independent queues, bidirectional FIFO's
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F5/00—Methods or arrangements for data conversion without changing the order or content of the data handled
- G06F5/06—Methods or arrangements for data conversion without changing the order or content of the data handled for changing the speed of data flow, i.e. speed regularising or timing, e.g. delay lines, FIFO buffers; over- or underrun control therefor
- G06F5/08—Methods or arrangements for data conversion without changing the order or content of the data handled for changing the speed of data flow, i.e. speed regularising or timing, e.g. delay lines, FIFO buffers; over- or underrun control therefor having a sequence of storage locations, the intermediate ones not being accessible for either enqueue or dequeue operations, e.g. using a shift register
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/30098—Register arrangements
- G06F9/3012—Organisation of register space, e.g. banked or distributed register file
- G06F9/30134—Register stacks; shift registers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/38—Concurrent instruction execution, e.g. pipeline or look ahead
- G06F9/3824—Operand accessing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/38—Concurrent instruction execution, e.g. pipeline or look ahead
- G06F9/3885—Concurrent instruction execution, e.g. pipeline or look ahead using a plurality of independent parallel functional units
- G06F9/3889—Concurrent instruction execution, e.g. pipeline or look ahead using a plurality of independent parallel functional units controlled by multiple instructions, e.g. MIMD, decoupled access or execute
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11C—STATIC STORES
- G11C19/00—Digital stores in which the information is moved stepwise, e.g. shift registers
- G11C19/18—Digital stores in which the information is moved stepwise, e.g. shift registers using capacitors as main elements of the stages
- G11C19/182—Digital stores in which the information is moved stepwise, e.g. shift registers using capacitors as main elements of the stages in combination with semiconductor elements, e.g. bipolar transistors, diodes
- G11C19/184—Digital stores in which the information is moved stepwise, e.g. shift registers using capacitors as main elements of the stages in combination with semiconductor elements, e.g. bipolar transistors, diodes with field-effect transistors, e.g. MOS-FET
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/04—Generating or distributing clock signals or signals derived directly therefrom
- G06F1/08—Clock generators with changeable or programmable clock frequency
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F7/00—Methods or arrangements for processing data by operating upon the order or content of the data handled
- G06F7/38—Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation
- G06F7/48—Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices
- G06F7/57—Arithmetic logic units [ALU], i.e. arrangements or devices for performing two or more of the operations covered by groups G06F7/483 – G06F7/556 or for performing logical operations
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Microelectronics & Electronic Packaging (AREA)
- Computer Hardware Design (AREA)
- Computing Systems (AREA)
- Power Engineering (AREA)
- Advance Control (AREA)
- Memory System Of A Hierarchy Structure (AREA)
- Memory System (AREA)
- Multi Processors (AREA)
- Image Processing (AREA)
Description
(計算機システムの基本構成)
図2に示すように、本発明の第1の実施の形態に係る計算機システムは、プロセッサ11とマーチング主記憶装置31とを備えている。プロセッサ11は、クロック信号を生成するクロック発生回路113を有する制御装置111と、クロック信号に同期して演算論理動作を実行する演算論理装置(ALU)112とを含む。図3に示すように、マーチング主記憶装置31は、複数のメモリユニットU1、U2、U3、…….、Un−1、Unにおいて、それぞれワード・サイズのデータ又は命令を含んだ一組の情報群を格納した、複数のメモリユニットU1、U2、U3、…….、Un−1、Unのアレイと、アレイの入力端子と、アレイの出力端子とを有している。図3に示すように、マーチング主記憶装置31は、情報を複数のメモリユニットU1、U2、U3、…….、Un−1、Unのそれぞれに格納し、情報をクロック信号に同期して、ステップごとに、出力端子の方向に転送し、格納された情報をプロセッサ11に能動的に逐次出力し、ALU112は、格納された情報により演算論理動作を実行する。
最も一般的な従来の計算機では、アドレス決定の単位は、文字(character)(例えば、バイト)又はワードである。単位がワードの場合、大量のメモリに、あるサイズのアドレスを用いてアクセスできる。他方で、単位がバイトの場合、それぞれの文字をアドレスできる(すなわち、メモリ動作中に選択できる)。マシン命令は、通常は、アーキテクチュアのワード・サイズの分数または倍数である。これは、命令とデータが通常は同じメモリ・サブシステムを共有するので、自然な選定である。
ルM1nに設けられた次段のANDゲートG1nの一方の入力に接続された出力を有するANDゲートG1、n−1とを備えている。したがって、セルM11、M12、M13、……、M1、n−1、M1nのそれぞれは、情報を格納し、情報をクロック信号と同期して、ステップごとに、出力端子O1の方向に向けて転送し、格納された情報をプロセッサ11に能動的に逐次出力し、ALU112は、格納された情報により演算論理動作を実行する。
第1のpMOSトランジスタQij1と、第2のpMOSトランジスタQij2と、第1のnMOSトランジスタQij3と、第2のnMOSトランジスタQij4は、j番目のコンデンサCijに接続された一方の入力、クロック信号供給配線に接続された他方の入力、を有するNANDゲートを形成する。そして、第3のpMOSトランジスタQij5と第3のnMOSトランジスタQij6は、j番目のセルMijのNANDゲートの出力に接続された入力と、隣接する(j+1)番目のセルMi、j+1に設けられた次段の(j+1)番目のANDゲートGi、j+1の一方の入力に接続された出力を有するインバータを形成する。
図3〜6では、情報を複数のメモリユニットU1、U2、U3、……、Un−1、Unのそれぞれに格納し、情報をクロック信号と同期して、ステップごとに、入力端子から出力端子の方向に転送する、マーチング主記憶装置を示したが、図7では、これらとは異なる他のマーチング主記憶装置を示す。
図12(a)〜(c)に示すように、本発明の第1の実施の形態に係るマーチング主記憶装置31は、情報/データの双方向の転送を実現できる。即ち、図12(a)は、情報/データが前方に隊列進行する状況を示しており、情報/データが1次元のマーチング主記憶装置31において右手方向(前方)に隊列進行(シフト)している。図12(b)は、1次元のマーチング主記憶装置31の漂遊状態を示す。図12(c)は、情報/データが逆方向に隊列進行する状況(後方に隊列進行する状況)を示しており、情報/データが1次元のマーチング主記憶装置31の左手方向(逆方向)に隊列進行(シフト)している。
図14(a)は、プロセッサに隣接する1次元のマーチング主記憶装置の命令の双方向転送モードを示す。図14(a)では、命令が、プロセッサの方向に向けて移動し且つ次段へ、又は次段から移動している。図14(b)は、ALU112に隣接する1次元のマーチング主記憶装置のスカラデータの双方向転送モードを示す。図14(b)では、スカラデータはALUに向けて移動し且つ次段へ、又は次段から移動している。図14(c)は、後述する第3の実施の形態で説明される、パイプライン117に隣接する1次元のマーチング主記憶装置におけるベクトルデータ又はストリーミングデータの単一方向転送モードを示す。図14(c)では、ベクトルデータ又はストリーミングデータは、パイプライン117に向けて移動し且つ次段のメモリから移動する。
従来の計算機システムにおけるメモリ・アクセス時間とCPUサイクル時間との間の速度ギャップは、例えば、1:100である。しかし、マーチング記憶装置アクセス時間の速度は、第1の実施の形態に係る計算機システムのCPUサイクル時間と等しい。図19は、キャッシュの無い従来の計算機システムの速度/処理能力を、本発明の第1の実施の形態に係る計算機システムに用いるように構成されたマーチング主記憶装置31のものとを比較したものである。即ち、図19(b)は、100個のメモリユニットU1、U2、U3、……、U100で形成されたマーチング主記憶装置31の速度/処理能力を概略的に示して、図19(a)に示した現行の記憶装置の速度/処理能力と比較している。我々がマーチング主記憶装置31からデータを使用するために必要な処理装置を有するという条件において、更に、マーチング主記憶装置31の99個の同時に動作するメモリユニットも駆動できる。したがって、従来の計算機システムの一つのメモリユニット時間Tmueは、本発明の第1の実施の形態に係るマーチング主記憶装置31の100個のメモリユニット・ストリーミング時間Tmusに等しいと評価される。
メモリユニットは図24〜30に示すように2次元で配置できるので、様々なモードの動作が、スイッチ/ネットワークなしに実現できる。図24〜30に示す第1の実施の形態に係る2次元のマーチング主記憶装置31によれば、複数のメモリユニットU11、U12、U13、……、U1、v−1、U1v; U22、U22、U23、……、U2、v−2、U2v; ……; Uu1、Uu2、Uu3、……、Uu、v−1、Uuvはリフレッシュが要求されない。何故ならば、複数のメモリユニットU11、U12、U13、……、U1、v−1、U1v; U22、U22、U23、……、U2、v−2、U2v; ……; Uu1、Uu2、Uu3、……、Uu、v−1、Uuvのすべては、通常は、情報移動スキーム(情報の隊列進行スキーム)により自動的にリフレッシュされるからである。そして、複数のメモリユニットU11、U12、U13、……、U1、v−1、U1v; U22、U22、U23、……、U2、v−2、U2v; ……; Uu1、Uu2、Uu3、……、Uu、v−1、Uuvのそれぞれに対するアドレス指定が消滅し、要求される情報は、メモリの端部に設けられた、その宛先ユニットに向かう。第1の実施の形態に係る2次元のマーチング主記憶装置31にアクセスするメカニズムは、従来の計算機システムで情報の読み出し及び書き込みを行うためのアドレス指定モードから始まる、現行の記憶装置スキームの真の代わりとなるものである。したがって、第1の実施の形態に係る2次元のマーチング主記憶装置31によれば、第1の実施の形態に係る計算機システムでアドレス指定モードのないメモリ−アクセス・処理が、従来の計算機システムの現行の記憶装置スキームより遙かに単純になる。
本発明の第1の実施の形態に係る計算機システムのアーキテクチュア、設計及び実現に関する改点善を明確にするために、エネルギー消費の改善を説明する。図31(a)は、マイクロプロセッサのエネルギー消費が、静的な電力消費と動的電力消費に分割できることを示す。図31(a)に示す動的電力消費において、電力消費のネット(正味)とオーバーヘッドが図31(b)で著しい。図31(c)に示すように、正味のエネルギー部分だけが、計算機システムの或るジョブを動作させるために実際に必要になるので、これらの純粋なエネルギー部分が、計算機システムを実施するうえでの最小のエネルギー消費になる。これは、最短の処理時間が、図31(c)に示す正味のエネルギー消費によって実現されることを意味する。
1)プログラムが、メモリのデータのように格納される。
2)すべての処理が、単一のプロセッサにおいて基本的に逐次的である。
3)プログラムの動作は、命令の逐次的な実行である。
4)ベクトルデータは、ベクトル命令によりCPUで逐次的に処理される。
5)ストリーミングデータは、スレッドで逐次的に処理される。
6)プログラムには、スレッドが逐次的に配置されている。
7)データ・パラレルは、ベクトルとしてのデータの配置から成る。
8)ストリーミングデータは、データの流れである。
図34に示すように、本発明の第2の実施の形態に係る計算機システムは、プロセッサ11とマーチング主記憶装置31とを備えている。プロセッサ11は、クロック信号を生成するクロック発生回路113を有する制御装置111と、クロック信号に同期して演算論理動作を実行する演算論理装置(ALU)112と、制御装置111に接続されたマーチング命令レジスタファイル(RF)22aと、ALU112に接続されたマーチング・データ・レジスタファイル(RF)22bとを含む。
図35に示すように、本発明の第3の実施の形態に係る計算機システムは、プロセッサ11とマーチング・キャッシュメモリ(21a、21b)とマーチング主記憶装置31とを備えている。第2の実施の形態と同様に、プロセッサ11は、クロック信号を生成するクロック発生回路113を有する制御装置111と、クロック信号と同期して演算論理動作を実行する、演算論理装置(ALU)112と、制御装置111に接続されたマーチング命令レジスタファイル(RF)22aと、ALU112に接続されたマーチング・データ・レジスタファイル(RF)22bとを含む。
図42に示すように、第4の実施の形態に係る計算機システムは、従来の主記憶装置31sと、従来の主記憶装置31sに接続されたマザー・マーチング主記憶装置31−0と、グラフィック処理装置(GPU)を基礎とした汎用計算に使用できる、高性能コンピューティング(HPC)システムを形成するためにマザー・マーチング主記憶装置31−0と通信する複数の処理装置12−1、12−2、12−3、……とを備えている。図示を省略しているが、第4の実施の形態に係るHPCシステムは、クロック信号を生成するクロック発生回路113を有する制御装置111と、複数の処理装置12−1、12−2、12−3、……の動作を切り替え及び制御をするフィールド・プログラマブル・ゲートアレイ(FPGA)とを含んでおり、平行で作動することにより高速処理計算の流れを最適化して、帯域幅消費の管理と運営を支援することを意図している。FPGAは、あるタスクのために自らを書き換えることができる、本質的には、計算機チップである。FPGAは、VHDL又はヴェリログ(Verilog)のようなハードウェア記述言語でプログラム化できる。
図43に示すように、本発明の第5の実施の形態に係る計算機システムは、プロセッサ11と、プロセッサ11に接続された3次元のマーチング・レジスタファイルを形成するマーチング・レジスタファイル22−1、22−2、22−3、……のスタックと、3次元のマーチング・レジスタファイル(22−1、22−2、22−3、……)に接続された3次元のマーチング・キャッシュメモリを形成するマーチング・キャッシュメモリ21−1、21−2、21−3、……のスタックと、3次元のマーチング・キャッシュ(21−1、21−2、21−3、……)に接続された3次元のマーチング主記憶装置を形成するマーチング主記憶装置31−1、31−2、31−3、……のスタックとを備えている。プロセッサ11は、クロック信号を生成するクロック発生回路113を有する制御装置111と、クロック信号と同期して演算論理動作を実行する演算論理装置(ALU)112とを含む。
熱の流れを、能動的なコンピューティング半導体チップから、放熱板58c−1、58c−2、58c−3、……、58c−1、58c−2、58c−3、……、58r−1、58r−2、58r−3、……を介してシステムの外部に向けて、より効率的に作るのに適している。したがって、第5の実施の形態に係る計算機システムでは、これらの半導体チップを、システムの規模に応じて重ねることができる。また、図44(a)〜45(c)に示すように、マーチング主記憶装置31−1、31−2、31−3、……と、マーチング・キャッシュメモリ21−1、21−2、21−3、……とマーチング・レジスタファイル22−1、22−2、22−3、……とを含む複数の半導体チップを容易に重ねて3次元構成を形成できるので、拡張性のある計算機システムを容易に編成して、システムの温度をより低温に維持できる。
図43、44(a)、44(b)、44(c)に示す3次元構成は単なる例であり、拡張性のある計算機システムの編成を進めるために3次元構成を形成する方法として、種々の方式と組み合わせがある。
様々な変形例が、本明細書及び図面の開示から、本発明の趣旨から逸脱せずに、当業者に明らかとなろう。
Claims (24)
- クロック信号を生成するクロック発生回路を有する制御装置、及び、前記クロック信号に同期した演算論理動作を実行する演算論理装置を含むプロセッサと、
複数のセルの列方向の配列からなるメモリユニットを複数個、前記列方向に更に配列し、それぞれのメモリユニットに対しそれぞれ一組の情報群を前記列方向の配列に沿って前記複数のセルに格納し、前記メモリユニットの複数個を前記列方向に配列した構成を、複数個、更に行方向に配列したアレイを含むマーチング主記憶装置と、
を備える計算機システムであって、
前記マーチング主記憶装置が、前記列方向に配列されたそれぞれのメモリユニットのそれぞれの前記複数のセルの配列に対応して設けられた、前記アレイの入力端子列及び出力端子列を更に有し、
前記出力端子列の少なくとも一部を前記演算論理装置に接続し、
前記入力端子列を介して、前記列方向に配列された複数のメモリユニットのそれぞれの前記複数のセルに、一組の情報群が入力され、
前記クロック信号に同期して、前記列方向に配列された複数のメモリユニットのそれぞれに格納された情報群を、前記出力端子列の方向に前記アレイの内部において隊列進行させ、該隊列進行された前記複数のメモリユニットのそれぞれに格納された情報群を前記出力端子列の前記少なくとも一部を介して前記プロセッサにパラレルに出力し、
前記演算論理装置が、前記出力端子列の前記少なくとも一部を介して逐次入力された前記情報群を用いた演算論理動作を、前記クロック信号に同期して逐次実行可能であることを特徴とする計算機システム。 - 前記出力端子列の他の一部が、前記制御装置に接続され、
前記列方向に配列された複数のメモリユニットの内の、前記出力端子列の前記他の一部に対応する行上のメモリユニットのそれぞれのセルに一組の命令群が前記列方向に格納され、
前記クロック信号に同期して、前記出力端子列の前記他の一部方向に向かう一組の命令群が隊列進行し、
前記出力端子列の前記他の一部から、前記一組の命令群の流れが前記制御装置に入力し、
該入力された前記一組の命令群の流れを用いて、前記演算論理装置が、前記演算論理動作を実行することを特徴とする請求項1に記載の計算機システム。 - 前記列方向に配列された複数のメモリユニットのそれぞれが、
前記クロック信号に同期して、前記一組の情報群を前記出力端子列方向に隊列進行させるために用いる第1のセルの配列と、
第2のクロック信号に同期して、一組の情報群を前記入力端子列方向に隊列進行させるために用いる第2のセルの配列とを有することを特徴とする請求項1又は2に記載の計算機システム。 - 前記列方向に配列された複数のメモリユニットの一部が、前記クロック信号に同期して、前記一組の情報群を前記出力端子列方向に隊列進行させるために用いる複数の第1のセルの配列からなる第1のメモリユニットを含み、
前記列方向に配列された複数のメモリユニットの他の一部が、第2のクロック信号に同期して、一組の情報群を前記入力端子列方向に隊列進行させるために用いる第2のセルの配列からなる第2のメモリユニットを含むことを特徴とする請求項1又は2に記載の計算機システム。 - 前記クロック信号と前記第2のクロック信号を選択するクロック・セレクタを更に備え、
前記制御装置が前記クロック・セレクタに前記第2のクロック信号を選択させることにより、前記演算論理装置の処理の結果が一組の情報群として前記出力端子列の前記少なくとも一部を介して前記マーチング主記憶装置に逐次入力され、前記アレイの内部を前記入力端子列方向に隊列進行されることを特徴とする請求項3又は4に記載の計算機システム。 - 前記複数のメモリユニットがチップ上で2次元で配置されて前記アレイを構成していることを特徴とする請求項1〜5のいずれか1項に記載の計算機システム。
- 複数の前記チップが、3次元の前記メモリユニット・アレイを形成するように、放熱板をそれぞれの間に挟んで、垂直に積層されていることを特徴とする請求項6に記載の計算機システム。
- 前記プロセッサが、前記一組の情報群の流れを前記出力端子列の前記少なくとも一部を介して前記マーチング主記憶装置から前記クロック信号に同期して逐次入力する、複数の演算パイプラインを更に含むことを特徴とする請求項1〜7のいずれか1項に記載の計算機システム。
- クロック信号を生成するクロック発生回路を有する制御装置、及び、前記クロック信号に同期した演算論理動作を実行する演算論理装置を含むプロセッサと、
複数のセルの列方向の配列からなるメモリユニットを複数個、前記列方向に更に配列し、それぞれのメモリユニットに対しそれぞれ一組の情報群を前記列方向の配列に沿って前記複数のセルに格納し、前記メモリユニットの複数個を前記列方向に配列した構成を、複数個、更に行方向に配列したアレイを含むマーチング主記憶装置と、
前記列方向に配列された複数のメモリユニットの少なくとも一部のメモリユニットのそれぞれの配列位置に対応して、前記列方向に一組の情報群をそれぞれ格納するように配置されたキャッシュメモリユニットを複数個、前記列方向に更に配列し、前記キャッシュメモリユニットの複数個が前記列方向に配列された構成を、複数個、更に行方向に配列したマーチングキャッシュアレイを有するマーチング・キャッシュメモリと、
を備える計算機システムであって、
前記マーチング主記憶装置が、前記複数のセルの列方向の配列に対応して設けられた前記アレイの入力端子列及び出力端子列を更に有し、
前記マーチング・キャッシュメモリが、前記マーチング主記憶装置の前記出力端子列に接続されて前記マーチング主記憶装置に格納された前記一組の情報群を入力する前記マーチングキャッシュアレイのキャッシュ入力端子列と、前記マーチングキャッシュアレイのキャッシュ出力端子列を更に有し、前記キャッシュ出力端子列を前記演算論理装置に接続し、
前記入力端子列を介して前記マーチング主記憶装置に前記列方向の配列を一組とする情報群が逐次入力され、前記クロック信号に同期して、前記列方向に配列された前記一組の情報群を前記出力端子列の方向に前記アレイの内部において隊列進行させ、該隊列進行された前記一組の情報群を、前記出力端子列と前キャッシュ入力端子列を介して前記マーチングキャッシュアレイに転送し、
該転送された前記一組の情報群を前記キャッシュメモリユニットのそれぞれに列方向に逐次格納し、前記クロック信号と同期して、前記一組の情報群を隣接するキャッシュメモリユニットにそれぞれ隊列進行させ、該隊列進行された前記一組の情報群を、前記キャッシュ出力端子列を介して前記プロセッサにパラレルに出力し、
前記演算論理装置が、前記キャッシュ出力端子列を介して逐次入力された前記一組の情報群の流れにより演算論理動作を、前記クロック信号に同期して逐次実行可能であることを特徴とする計算機システム。 - 前記演算論理装置が、それぞれベクトル処理装置を有する複数の演算パイプラインを更に含むがことを特徴とする請求項9に記載の計算機システム。
- クロック信号を生成するクロック発生回路を有する制御装置、及び、前記クロック信号に同期した演算論理動作を実行する演算論理装置を含むプロセッサと、
複数のセルの列方向の配列からなるメモリユニットを複数個、前記列方向に更に配列し、それぞれのメモリユニットに対しそれぞれ一組の情報群を前記列方向の配列に沿って前記複数のセルに格納し、前記メモリユニットの複数個を前記列方向に配列した構成を、複数個、更に行方向に配列したアレイを含むマーチング主記憶装置と、
前記列方向に配列された複数のメモリユニットの少なくとも一部のメモリユニットのそれぞれの列上の配列位置に対応して、前記一組の情報群をそれぞれ格納するように配置されたキャッシュメモリユニットを複数個、前記列方向に更に配列し、前記キャッシュメモリユニットの複数個が前記列方向に配列された構成を、複数個、更に行方向に配列したマーチングキャッシュアレイを有するマーチング・キャッシュメモリと、
前記キャッシュメモリユニットの列方向の配列位置に対応して配置されたベクトルレジスタユニットを複数個、行方向に配列して有するマーチング・ベクトルレジスタのアレイと、
を備える計算機システムであって、
前記マーチング主記憶装置が、前記複数のセルの列方向の配列に対応して設けられた前記アレイの入力端子列及び出力端子列を更に有し、
前記マーチング・キャッシュメモリが、前記マーチング主記憶装置の前記出力端子列に接続されて前記マーチング主記憶装置に格納された前記一組の情報群をベクトル情報として入力する前記マーチングキャッシュアレイのキャッシュ入力端子列と、前記ベクトル情報を出力する前記マーチングキャッシュアレイのキャッシュ出力端子列を更に有し、
前記複数のマーチング・ベクトルレジスタが、前記マーチング・ベクトルレジスタのアレイのベクトルレジスタ入力端子列とを有し、
前記キャッシュ出力端子列を前記ベクトルレジスタ入力端子列に接続し、
前記複数の前記マーチング・ベクトルレジスタを前記演算論理装置に接続し、
前記入力端子列を介して前記マーチング主記憶装置に前記列方向の配列を一組とする情報群が逐次入力され、前記クロック信号に同期して、前記列方向に配列された前記一組の情報群を前記出力端子列の方向にベクトル情報として前記アレイの内部において隊列進行させ、該隊列進行された前記ベクトル情報を、前記出力端子列と前キャッシュ入力端子列を介して前記マーチングキャッシュアレイに転送し、
該転送された前記ベクトル情報を構成する前記一組の情報群を、前記キャッシュメモリユニットのそれぞれに列方向に逐次格納し、前記クロック信号と同期して、前記一組の情報群を隣接するキャッシュメモリユニットにベクトル情報としてそれぞれ逐次転送し、該逐次転送された前記ベクトル情報を、前記マーチング・キャッシュメモリが、前記キャッシュ出力端子列を介して前記マーチング・ベクトルレジスタのアレイに出力し、
前記マーチング・ベクトルレジスタのアレイが、前記ベクトル情報を前記ベクトルレジスタユニットのそれぞれに格納し、
前記マーチング・ベクトルレジスタのアレイが、前記ベクトル情報を逐次、前記演算論理装置にパラレルに出力し、前記演算論理装置は前記ベクトル情報を、前記クロック信号に同期して逐次実行可能であることを特徴とする計算機システム。 - 前記一組の情報群のそれぞれの列上の配列位置に対応して配置された、スカラレジスタユニットの複数個を行方向に配列したスカラレジスタユニットのアレイと、
該アレイのスカラレジスタ入力端子列
とを更に有し、前記スカラレジスタユニットのアレイが格納されるべきスカラ情報を前記マーチング・キャッシュメモリから前記スカラレジスタ入力端子列を介して入力するように構成され、前記スカラ情報を前記スカラレジスタユニットに格納し、前記クロック信号に同期して、格納された前記スカラ情報を前記演算論理装置に転送し、前記スカラ情報を前記演算論理装置が実行可能なように構成したことを特徴とする請求項11に記載の計算機システム。 - 前記制御装置が、前記マーチング主記憶装置と前記マーチング・キャッシュメモリと前記マーチング・ベクトルレジスタ又は前記マーチング・スカラレジスタとの動作を切り替え、制御するフィールド・プログラマブル・ゲートアレイを更に有していることを特徴とする請求項12に記載の計算機システム。
- 前記マーチング主記憶装置と前記マーチング・キャッシュメモリが同じ前記チップ上に集積化されていることを特徴とする請求項11〜13のいずれか1項に記載の計算機システム。
- 前記演算論理装置を構成するベクトル処理装置の少なくとも一つとマーチング・ベクトルレジスタの少なくとも一つが、同一チップ上に集積化されていることを特徴とする請求項11〜14のいずれか1項に記載の計算機システム。
- 前記演算論理装置を構成するベクトル処理装置とマーチング・ベクトルレジスタとを集積化した第1のチップと、
前記マーチング・キャッシュメモリを集積化した第2のチップと、
前記マーチング主記憶装置を集積化した第3のチップ
とが、垂直に積層され、それぞれの間に放熱板を挟んでいることを特徴とする請求項11〜15のいずれか1項に記載の計算機システム。 - 前記演算論理装置がプロセッサコアを形成していることを特徴とする請求項11〜16のいずれか1項に記載の計算機システム。
- 前記プロセッサが複数の前記プロセッサコアを含むことを特徴とする請求項17に記載の計算機システム。
- 複数のキャッシュメモリユニットの第2のアレイと、
前記マーチング主記憶装置から、格納された前記ベクトル情報を入力する該第2のアレイのキャッシュ入力端子列と、
該第2のアレイのキャッシュ出力端子列
とを有し、前記ベクトル情報を、該第2のアレイの前記複数のキャッシュメモリユニットのそれぞれに前記一組の情報群毎に格納し、前記第2のアレイの前記複数のキャッシュメモリユニットのそれぞれに格納された前記一組の情報群情報を、前記クロック信号に同期して、前記第2のアレイの前記キャッシュ入力端子列側に隣接する前記キャッシュメモリユニットから、前記第2のアレイの前記キャッシュ出力端子列側に隣接する前記キャッシュメモリユニットに向かう方向に、前記クロック信号と同期して、連続的に転送し、前記第2のアレイに格納された前記ベクトル情報を、前記プロセッサに前記第2のアレイの前記キャッシュ出力端子列を介して能動的に逐次出力し、前記プロセッサコアが前記第2のアレイに格納された前記ベクトル情報により動作できる、第2のマーチング・キャッシュメモリを更に備えることを特徴とする請求項18に記載の計算機システム。 - 複数のレジスタファイル・セルのアレイと、
前記マーチング・キャッシュメモリから、格納された前記ベクトル情報を入力する該アレイのレジスタファイル入力端子列と、
該アレイのレジスタファイル出力端子列
とを有し、前記ベクトル情報を前記複数のレジスタファイル・セルのそれぞれに格納し、前記クロック信号に同期して、前記複数のレジスタファイル・セルのそれぞれに格納された前記ベクトル情報を、前記レジスタファイル・入力端子列側に隣接するレジスタファイル・セルから、前記レジスタファイル出力端子列側に隣接するレジスタファイル・セルに向かう方向に、前記クロック信号に同期して転送し、格納された前記ベクトル情報を前記プロセッサコアに前記レジスタファイル出力端子列を介して能動的に逐次出力する、マーチング・レジスタファイルを更に備えることを特徴とする請求項18に記載の計算機システム。 - 前記制御装置が、前記マーチング主記憶装置と前記マーチング・キャッシュメモリと前記マーチング・レジスタファイルとの動作を切り替え、制御するフィールド・プログラマブル・ゲートアレイを更に有していることを特徴とする請求項20に記載の計算機システム。
- 前記マーチング主記憶装置と前記マーチング・キャッシュメモリが同一のチップ上に集積化されていることを特徴とする請求項11〜21のいずれか1項に記載の計算機システム。
- 前記マーチング・レジスタファイルと前記プロセッサコアの少なくとも一つとが、同一のチップ上に集積化されていることを特徴とする請求項18に記載の計算機システム。
- クロック信号を生成するクロック発生回路を有する制御装置、及び、前記クロック信号に同期した演算論理動作を実行する演算論理装置を含むプロセッサと、主記憶装置とを備える計算機システムに用いる前記主記憶装置であって、
複数のセルの列方向の配列からなるメモリユニットを複数個、前記列方向に更に配列し、前記メモリユニットの複数個の前記列方向の配列を、複数個、更に行方向に配列したアレイと、
前記列方向に配列されたそれぞれのメモリユニットのそれぞれの前記複数のセルの配列に対応して前記アレイに設けられた、入力端子列及び出力端子列とを備え、
前記出力端子列の少なくとも一部を前記演算論理装置に接続し、
前記入力端子列を介して、前記列方向に配列された複数のメモリユニットのそれぞれの前記複数のセルに、一組の情報群が入力され、
前記クロック信号に同期して、前記列方向に配列された複数のメモリユニットのそれぞれに格納された情報群を前記出力端子列の方向に前記アレイの内部において隊列進行させ、該隊列進行された前記複数のメモリユニットのそれぞれに格納された情報群を前記出力端子列の前記少なくとも一部を介して前記プロセッサにパラレルに出力し、
前記演算論理装置が、前記出力端子列の前記少なくとも一部を介して逐次入力された、前記情報群を用いた演算論理動作を、前記クロック信号に同期して逐次実行可能であることを特徴とする主記憶装置。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US22732509P | 2009-07-21 | 2009-07-21 | |
US61/227,325 | 2009-07-21 | ||
PCT/JP2010/004642 WO2011010445A1 (en) | 2009-07-21 | 2010-07-20 | A lower energy comsumption and high speed computer without the memory bottleneck |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012533784A JP2012533784A (ja) | 2012-12-27 |
JP5417674B2 true JP5417674B2 (ja) | 2014-02-19 |
Family
ID=43498927
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012503797A Active JP5417674B2 (ja) | 2009-07-21 | 2010-07-20 | 計算機システム及び主記憶装置 |
Country Status (6)
Country | Link |
---|---|
US (2) | US8949650B2 (ja) |
EP (2) | EP3255555B1 (ja) |
JP (1) | JP5417674B2 (ja) |
KR (1) | KR101424020B1 (ja) |
CN (1) | CN102483697B (ja) |
WO (1) | WO2011010445A1 (ja) |
Families Citing this family (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102483697B (zh) * | 2009-07-21 | 2015-06-10 | 中村维男 | 无存储器瓶颈的低能耗高速计算机 |
TWI607454B (zh) * | 2012-02-13 | 2017-12-01 | 中村維男 | 無記憶體瓶頸的行進記憶體,雙向行進記憶體,複雜行進記憶體,及計算機系統 |
KR20130010915A (ko) * | 2012-10-23 | 2013-01-29 | 김성동 | 챕터 데이터가 저장될 수 있는 캐쉬 메모리 어레이를 구비하는 3차원 반도체 장치 및 그 동작 방법 |
TWI557749B (zh) * | 2013-06-13 | 2016-11-11 | 中村維男 | 直接轉移跨步記憶體及使用該記憶體之電腦系統 |
WO2015125960A1 (ja) * | 2014-02-24 | 2015-08-27 | 株式会社ニコン | 情報処理装置、デジタルカメラおよびプロセッサ |
US9513921B2 (en) * | 2014-06-23 | 2016-12-06 | Mill Computing, Inc. | Computer processor employing temporal addressing for storage of transient operands |
CN104777936B (zh) * | 2015-04-16 | 2016-08-24 | 京东方科技集团股份有限公司 | 触控驱动单元和电路、显示面板及显示装置 |
CN108352837A (zh) * | 2015-11-13 | 2018-07-31 | 株式会社半导体能源研究所 | 半导体装置、电子构件及电子设备 |
CN111651206B (zh) * | 2016-04-26 | 2024-05-07 | 中科寒武纪科技股份有限公司 | 一种用于执行向量外积运算的装置和方法 |
US10909037B2 (en) * | 2017-04-21 | 2021-02-02 | Intel Corpor Ation | Optimizing memory address compression |
CN109426518B (zh) * | 2017-08-29 | 2021-02-19 | 杭州旗捷科技有限公司 | 单核处理器设备的并行写码方法、电子设备、存储介质 |
JP7228590B2 (ja) | 2017-11-24 | 2023-02-24 | フラウンホッファー-ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | データバス |
WO2019146623A1 (en) * | 2018-01-23 | 2019-08-01 | Tadao Nakamura | Marching memory and computer system |
KR102543177B1 (ko) | 2018-03-12 | 2023-06-14 | 삼성전자주식회사 | 고 대역폭 메모리 장치 및 이 장치를 포함하는 시스템 장치 |
US10996885B2 (en) | 2018-03-12 | 2021-05-04 | Samsung Electronics Co., Ltd. | High bandwidth memory device and system device having the same |
CN115794730A (zh) * | 2018-12-10 | 2023-03-14 | 杭州海存信息技术有限公司 | 分离的三维处理器 |
US11853758B2 (en) * | 2019-09-27 | 2023-12-26 | Intel Corporation | Techniques for decoupled access-execute near-memory processing |
US11442890B1 (en) | 2020-11-06 | 2022-09-13 | Amazon Technologies, Inc. | On-circuit data activity monitoring for a systolic array |
US11520731B1 (en) | 2020-11-06 | 2022-12-06 | Amazon Technologies, Inc. | Arbitrating throttling recommendations for a systolic array |
Family Cites Families (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3975712A (en) * | 1975-02-18 | 1976-08-17 | Motorola, Inc. | Asynchronous communication interface adaptor |
JPS61165137A (ja) * | 1985-01-17 | 1986-07-25 | Nec Corp | デ−タフロ−処理装置 |
US4833655A (en) * | 1985-06-28 | 1989-05-23 | Wang Laboratories, Inc. | FIFO memory with decreased fall-through delay |
JPH0761017B2 (ja) * | 1985-09-25 | 1995-06-28 | 株式会社日立製作所 | A/d変換器 |
US4805133A (en) * | 1985-12-20 | 1989-02-14 | Greenfield S Edmund | Processor memory element and a new computer architecture |
US5475631A (en) | 1989-03-09 | 1995-12-12 | Micron Technology, Inc. | Multiport RAM based multiprocessor |
US5418933A (en) * | 1990-02-20 | 1995-05-23 | Sharp Kabushiki Kaisha | Bidirectional tri-state data bus buffer control circuit for delaying direction switching at I/O pins of semiconductor integrated circuit |
EP0463721A3 (en) * | 1990-04-30 | 1993-06-16 | Gennum Corporation | Digital signal processing device |
DE59010847D1 (de) * | 1990-12-11 | 1998-09-24 | Siemens Ag | Schaltungsanordnung zur digitalen Bit-seriellen Signalverarbeitung |
JPH04293151A (ja) * | 1991-03-20 | 1992-10-16 | Fujitsu Ltd | 並列データ処理方式 |
JPH05128898A (ja) * | 1991-11-05 | 1993-05-25 | Oki Electric Ind Co Ltd | 半導体記憶装置 |
JP3243920B2 (ja) * | 1994-03-07 | 2002-01-07 | 株式会社日立製作所 | 半導体装置 |
US5790879A (en) | 1994-06-15 | 1998-08-04 | Wu; Chen-Mie | Pipelined-systolic single-instruction stream multiple-data stream (SIMD) array processing with broadcasting control, and method of operating same |
US6496926B1 (en) * | 1997-05-06 | 2002-12-17 | Microsoft Corporation | Computer-implemented paramaterless language with exception handler |
FR2777370B1 (fr) * | 1998-04-09 | 2000-06-23 | Sgs Thomson Microelectronics | Architecture de dsp optimisee pour les acces memoire |
US20020184381A1 (en) * | 2001-05-30 | 2002-12-05 | Celox Networks, Inc. | Method and apparatus for dynamically controlling data flow on a bi-directional data bus |
US7062636B2 (en) * | 2002-09-19 | 2006-06-13 | Intel Corporation | Ordering scheme with architectural operation decomposed into result producing speculative micro-operation and exception producing architectural micro-operation |
US7617356B2 (en) * | 2002-12-31 | 2009-11-10 | Intel Corporation | Refresh port for a dynamic memory |
US7117290B2 (en) * | 2003-09-03 | 2006-10-03 | Advanced Micro Devices, Inc. | MicroTLB and micro tag for reducing power in a processor |
KR100585227B1 (ko) | 2004-03-12 | 2006-06-01 | 삼성전자주식회사 | 열 방출 특성이 개선된 반도체 적층 패키지 및 이를이용한 메모리 모듈 |
JP4654389B2 (ja) * | 2006-01-16 | 2011-03-16 | 株式会社ムサシノエンジニアリング | ダイヤモンドヒートスプレッダの常温接合方法,及び半導体デバイスの放熱部 |
KR101414774B1 (ko) * | 2007-08-29 | 2014-08-07 | 삼성전자주식회사 | 멀티포트 반도체 메모리 장치 |
JP5035349B2 (ja) * | 2007-09-14 | 2012-09-26 | 富士通株式会社 | 回路、その制御方法 |
JP5194302B2 (ja) * | 2008-02-20 | 2013-05-08 | ルネサスエレクトロニクス株式会社 | 半導体信号処理装置 |
CN102483697B (zh) * | 2009-07-21 | 2015-06-10 | 中村维男 | 无存储器瓶颈的低能耗高速计算机 |
-
2010
- 2010-07-20 CN CN201080033094.2A patent/CN102483697B/zh active Active
- 2010-07-20 EP EP17180711.8A patent/EP3255555B1/en active Active
- 2010-07-20 KR KR1020127002982A patent/KR101424020B1/ko active IP Right Grant
- 2010-07-20 JP JP2012503797A patent/JP5417674B2/ja active Active
- 2010-07-20 US US13/384,774 patent/US8949650B2/en active Active
- 2010-07-20 WO PCT/JP2010/004642 patent/WO2011010445A1/en active Application Filing
- 2010-07-20 EP EP10802066.0A patent/EP2457155B1/en active Active
-
2014
- 2014-11-25 US US14/552,572 patent/US9361957B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US20150149718A1 (en) | 2015-05-28 |
US9361957B2 (en) | 2016-06-07 |
JP2012533784A (ja) | 2012-12-27 |
KR101424020B1 (ko) | 2014-07-28 |
EP3255555B1 (en) | 2020-01-29 |
US8949650B2 (en) | 2015-02-03 |
KR20120048596A (ko) | 2012-05-15 |
WO2011010445A1 (en) | 2011-01-27 |
EP2457155A1 (en) | 2012-05-30 |
EP2457155B1 (en) | 2017-10-11 |
CN102483697B (zh) | 2015-06-10 |
EP3255555A1 (en) | 2017-12-13 |
US20120117412A1 (en) | 2012-05-10 |
EP2457155A4 (en) | 2014-07-23 |
CN102483697A (zh) | 2012-05-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5417674B2 (ja) | 計算機システム及び主記憶装置 | |
TWI714806B (zh) | 動態隨機存取記憶體處理單元架構 | |
TWI640003B (zh) | 用於邏輯/記憶體器件之裝置及方法 | |
JP6218294B2 (ja) | 複合マーチングメモリ、計算機システム及びマーチングメモリ用セル配列 | |
CN109147842B (zh) | 同时进行数据路径中计算操作的设备及方法 | |
Talati et al. | mmpu—a real processing-in-memory architecture to combat the von neumann bottleneck | |
TWI659427B (zh) | 用於資料路徑內計算操作之裝置及方法 | |
TWI718336B (zh) | Dpu操作用的系統 | |
TWI671744B (zh) | 用於在記憶體中資料切換網路的裝置及方法 | |
TW201835906A (zh) | 用於在資料路徑中計算之裝置及方法 | |
Bottleneck | mMPU—A Real Processing-in-Memory Architecture to Combat the von | |
Xie | Microprocessor design using 3D integration technology |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130611 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130906 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20131015 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20131018 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20131101 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5417674 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |