JPH0496867A - Memory bank access system and vector arithmetic unit applied to the same system - Google Patents

Memory bank access system and vector arithmetic unit applied to the same system

Info

Publication number
JPH0496867A
JPH0496867A JP21438690A JP21438690A JPH0496867A JP H0496867 A JPH0496867 A JP H0496867A JP 21438690 A JP21438690 A JP 21438690A JP 21438690 A JP21438690 A JP 21438690A JP H0496867 A JPH0496867 A JP H0496867A
Authority
JP
Japan
Prior art keywords
memory bank
memory
latch circuit
output
memory cell
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP21438690A
Other languages
Japanese (ja)
Inventor
Koichi Kuroiwa
功一 黒岩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP21438690A priority Critical patent/JPH0496867A/en
Publication of JPH0496867A publication Critical patent/JPH0496867A/en
Pending legal-status Critical Current

Links

Landscapes

  • Complex Calculations (AREA)

Abstract

PURPOSE:To reduce an area occupied by a decoder circuit, and to promote a miniaturization and a high integration by sharing the plural memory banks of the decoder circuit. CONSTITUTION:A decoder circuit 13 which decodes an address signal, latch circuit 11 which latches the output signal of this circuit 13, and memory cell array 12 connected with a word line WL1 to which the output from the circuit 11 is supplied, are provided at a first memory bank 1. And also, latch circuits 21 - 41 which latch the output signals of the latch circuits at the memory banks at the previous stage, and memory cell arrays 22 - 42 connected with word lines WL2 - WL4 to which the outputs of these circuits 21 - 41 are supplied, are provided at each of memory banks 2 - 4 after the second. Then, the output of the decoder circuit 13 provided at the first memory bank 1 is delayed in every one cycle by the latch circuit provided at each memory bank, and the memory cell array in each memory bank is simultaneously performed access of by the address which is different in every one cycle.

Description

【発明の詳細な説明】 〔概 要〕 ベクトル処理に適した高速のメモリバンクアクセス方式
および該方式を適用したベクトル演算装置に関し、 デコーダ回路を複数のメモリバンクで共有化することに
よって、デコーダ回路の占有する面積を減少して小型化
および高集積化を推進することを目的とし、 複数のメモリバンクを備え、該複数のメモリノ〈ンクに
格納されているベクトルデータをアクセスしてパイプラ
イン処理を行うベクトル演算装置であって、アドレス信
号をデコードするデコーダ回路と、該デコーダ回路の出
力信号をラッチするラッチ回路と、該ラッチ回路の出力
が供給されるワード線に接続されたメモリセルアレイと
を具備する1番目のメモリバンクと、前段のメモリノ\
ンクにおけるラッチ回路の出力信号をラッチするラッチ
回路と、当該ラッチ回路の出力が供給されるワード線に
接続されたメモリセルアレイとを具備する2番目以鋒の
メモリバンクとを備え、前記1番目のメモリバンクに設
けられたデコーダ回路の出力を各メモリバンクに設けら
れたう・ノチ回路で1サイクルずつ遅延させ、咳各メモ
リバンク内のメモリセルアレイを順次1サイクルずつ異
なるアドレスで同時にアクセスするように構成する。
[Detailed Description of the Invention] [Summary] Regarding a high-speed memory bank access method suitable for vector processing and a vector arithmetic device applying the method, the decoder circuit is shared by a plurality of memory banks. The purpose is to promote miniaturization and high integration by reducing the area occupied, and it is equipped with multiple memory banks and performs pipeline processing by accessing vector data stored in the multiple memory nodes. A vector arithmetic device, comprising a decoder circuit that decodes an address signal, a latch circuit that latches an output signal of the decoder circuit, and a memory cell array connected to a word line to which the output of the latch circuit is supplied. The first memory bank and the previous memory bank\
a second or subsequent memory bank comprising a latch circuit that latches an output signal of the latch circuit in the first bank; and a memory cell array connected to a word line to which the output of the latch circuit is supplied; The output of the decoder circuit provided in the memory bank is delayed one cycle at a time by the circuit provided in each memory bank, and the memory cell array in each memory bank is accessed simultaneously at different addresses one cycle at a time. Configure.

〔産業上の利用分野〕[Industrial application field]

本発明は、ベクトル処理におけるメモリバンクアクセス
技術に関し、特に、ベクトル処理に適した高速のメモリ
バンクアクセス方式および該方式を適用したベクトル演
算装置に関する。
The present invention relates to memory bank access technology in vector processing, and in particular to a high-speed memory bank access method suitable for vector processing and a vector arithmetic device applying the method.

近年、計算機処理の高速化の要求は強く、ベクトル演算
処理も大型汎用コンピュータからワークステーションや
パーソナルコンピュータへと適用分野が広がっている。
In recent years, there has been a strong demand for faster computer processing, and the field of application of vector arithmetic processing has expanded from large general-purpose computers to workstations and personal computers.

そこで、ベクトル演算装置の小型化および高集積化が要
望されている。
Therefore, there is a demand for vector arithmetic devices to be smaller and more highly integrated.

〔従来の技術] 第6図は従来のベクトル演算装置の一例を示すブロック
図である。同図に示されるように、従来のベクトル演算
装置は、複数のメモリバンク101〜104を備え、各
メモリバンク101〜104には、それぞれラッチ回路
111〜141.メモリセルアレイ112〜142およ
びデコーダ回路113〜143が設けられている。
[Prior Art] FIG. 6 is a block diagram showing an example of a conventional vector calculation device. As shown in the figure, the conventional vector arithmetic device includes a plurality of memory banks 101-104, and each memory bank 101-104 has latch circuits 111-141. Memory cell arrays 112-142 and decoder circuits 113-143 are provided.

ところで、ベクトル処理を行う場合、全てのメモリバン
ク101〜104から1サイクル毎にデータをアクセス
する必要があるため、各メモリノ\ンク101〜104
に対してそれぞれ1サイクルずつアドレスを入力する必
要がある。さらに、各メモリノ〈ンク101〜104に
は、それぞれデコーダ回路113〜143が設けられて
いて、1サイクルずつずれた共通のアドレスを各メモリ
バンク101〜104毎にデコードしてメモリセルアレ
4112〜142をアクセスするようになっている。
By the way, when performing vector processing, it is necessary to access data from all memory banks 101 to 104 every cycle.
It is necessary to input an address for each cycle one cycle at a time. Further, each memory node 101-104 is provided with a decoder circuit 113-143, respectively, which decodes a common address shifted by one cycle for each memory cell array 101-104. is designed to be accessed.

(発明が解決しようとする課題〕 上述したように、第6図に示す従来のベクトル演算装置
において、各メモリノ\ンク101〜104に(よ、そ
れぞれ専用のデコーダ回路113〜143が設けられて
いて、これらのデコーダ回路113〜143に対してそ
れぞれ1サイクルずつアドレス信号を供給しなければな
らない。そして、メモリバンク101〜104に設けら
れたデコーダ回路113〜143が占有する面積はベク
トル演算装置の小型化および高集積化の妨げとなってい
る。
(Problems to be Solved by the Invention) As described above, in the conventional vector arithmetic device shown in FIG. , it is necessary to supply one cycle of address signals to each of these decoder circuits 113 to 143.The area occupied by the decoder circuits 113 to 143 provided in the memory banks 101 to 104 is limited to the size of a small vector arithmetic device. This is hindering the development of high-density and high-density integration.

本発明は、上述した従来のベクトル演算装置が有する課
題に鑑み、デコーダ回路を複数のメモリバンクで共有化
することによって、デコーダ回路の占有する面積を減少
して小型化および高集積化を推進することを目的とする
In view of the above-mentioned problems with conventional vector arithmetic devices, the present invention reduces the area occupied by the decoder circuit by sharing the decoder circuit with a plurality of memory banks, thereby promoting miniaturization and high integration. The purpose is to

〔課題を解決するための手段] 本発明によれば、複数のメモリバンク1〜4を備え、該
複数のメモリバンクに格納されているベクトルデータを
アクセスしてパイプライン処理を行うベクトル演算装置
であって、アドレス信号をデコードするデコーダ回路1
3と、該デコーダ回路13の出力信号をラッチするラッ
チ回路11と、該ラッチ回路11の出力が供給されるワ
ード線畦、に接続されたメモリセルアレイ12とを具備
する1番目のメモリバンク1と、前段のメモリバンクに
おけるラッチ回路の出力信号をラッチするラッチ回路2
1〜41と、当該ラッチ回路21〜41の出力が供給さ
れるワード線−L2〜−L4に接続されたメモリセルア
レイ22〜42とを具備する2番目以降のメモリバンク
2〜4とを備え、前記1番目のメモリバンク1に設けら
れたデコーダ回路13の出力を各メモリバンクに設けら
れたラッチ回路で1サイクルずつ遅延させ、該各メモリ
バンク内のメモリセルアレイを順次1サイクルずつ異な
るアドレスで同時にアクセスするようにしたことを特徴
とするベクトル演算装置が捉供される。
[Means for Solving the Problems] According to the present invention, a vector arithmetic device includes a plurality of memory banks 1 to 4 and performs pipeline processing by accessing vector data stored in the plurality of memory banks. There is a decoder circuit 1 that decodes the address signal.
3, a latch circuit 11 that latches the output signal of the decoder circuit 13, and a memory cell array 12 connected to the word line ridge to which the output of the latch circuit 11 is supplied. , a latch circuit 2 that latches the output signal of the latch circuit in the previous stage memory bank.
1 to 41 and memory cell arrays 22 to 42 connected to word lines -L2 to -L4 to which the outputs of the latch circuits 21 to 41 are supplied, The output of the decoder circuit 13 provided in the first memory bank 1 is delayed one cycle at a time by a latch circuit provided in each memory bank, and the memory cell arrays in each memory bank are sequentially moved one cycle at different addresses at the same time. A vector arithmetic device is provided which is characterized in that it is configured to access.

〔作 用〕[For production]

本発明のベクトル演算装置によれば、1番目のメモリバ
ンク1には、アドレス信号をデコードするデコーダ回路
13と、該デコーダ回路13の出力信号をラッチするラ
ッチ回路11と、該ラッチ回路11の出力が供給される
ワード線すし、に接続されたメモリセルアレイ12とが
設けられ、また、2番目以降のメモリバンク2〜4には
、それぞれ前段のメモリバンクにおけるラッチ回路の出
力信号をラッチするラッチ回路21〜41と、当該ラッ
チ回路21〜41の出力が供給されるワード線−L2〜
−L4に接続されたメモリセルアレイ22〜42とが設
けられている。そして、1番目のメモリバンク1に設け
られたデコーダ回路13の出力が各メモリバンクに設け
られたラッチ回路で1サイクルずつ遅延され、該各メモ
リバンク内のメモリセルアレイが順次1サイクルずつ異
なるアドレスで同時にアクセスされるようになっている
。このように、本発明のベクトル演算装置は、デコーダ
回路を複数のメモリバンクで共有化することによって、
デコーダ回路の占有する面積を減少して小型化および高
集積化を推進することができる。
According to the vector arithmetic device of the present invention, the first memory bank 1 includes a decoder circuit 13 that decodes an address signal, a latch circuit 11 that latches an output signal of the decoder circuit 13, and an output signal of the latch circuit 11. A memory cell array 12 connected to the word line Sushi is provided, and each of the second and subsequent memory banks 2 to 4 includes a latch circuit that latches the output signal of the latch circuit in the previous memory bank. 21 to 41, and word lines -L2 to which the outputs of the latch circuits 21 to 41 are supplied.
-Memory cell arrays 22 to 42 connected to L4 are provided. Then, the output of the decoder circuit 13 provided in the first memory bank 1 is delayed by one cycle by the latch circuit provided in each memory bank, and the memory cell array in each memory bank is sequentially read at a different address by one cycle. They are accessed simultaneously. In this way, the vector arithmetic device of the present invention shares the decoder circuit with a plurality of memory banks.
The area occupied by the decoder circuit can be reduced to promote miniaturization and high integration.

〔実施例〕〔Example〕

以下、図面を参照して本発明に係るベクトル演算装置の
実施例を説明する。
Hereinafter, embodiments of a vector calculation device according to the present invention will be described with reference to the drawings.

第1Mは本発明に係るベクトル演算装置の一実施例を示
すブロック図であり、4バンク構成のレイアウトイメー
ジを示すものである。
1M is a block diagram showing an embodiment of the vector calculation device according to the present invention, and shows a layout image of a 4-bank configuration.

第1図に示されるように、本実施例のベクトル演算装置
は、複数のメモリバンク1〜4を備えている。1番目の
メモリバンク1には、ラッチ回路11、メモリセルアレ
イ12およびデコーダ回路13が設けられているが、2
番目以降のメモリバンク2〜3には、ラッチ回路21〜
41およびメモリセルアレイ22〜42だけが設けられ
ていてデコーダ回路は設けられていない。そして、アド
レス信号は、1番目のメモリバンク1におけるデコーダ
回路13にだけ供給され、2番目以降のメモリバンク2
〜3では、1番目のメモリバンクlにおけるテ゛コーダ
回路13の出力信号を使用するようになっている。
As shown in FIG. 1, the vector arithmetic device of this embodiment includes a plurality of memory banks 1-4. The first memory bank 1 is provided with a latch circuit 11, a memory cell array 12, and a decoder circuit 13.
The latch circuits 21 to 3 are provided in memory banks 2 to 3 after the memory bank 2 to 3.
41 and memory cell arrays 22 to 42 are provided, and no decoder circuit is provided. Then, the address signal is supplied only to the decoder circuit 13 in the first memory bank 1, and the address signal is supplied only to the decoder circuit 13 in the first memory bank 1.
3, the output signal of the coder circuit 13 in the first memory bank l is used.

まず、デコーダ回路13の出力信号は、1番目のメモリ
バンク1のラッチ回路11を介して1番目のメモリバン
ク1のメモリセルアレイ12に供給され、さらに、ラッ
チ回路11の出力信号はメモリセルアレイ12のワード
線−り、を経て2番目のメモリバンク2のラッチ回路2
1を介して2番目のメモリバンク2のメモリセルアレイ
22に供給される。同様に、ラッチ回路21の出力信号
はメモリセルアレイ22のワード線−L2を経て3番目
のメモリバンク3のラッチ回路3Iを介して3番目のメ
モリバンク3のメモリセルアレイ32に供給され、また
、ラッチ回路31の出力信号はメモリセルアレイ32の
ワードMWI、。
First, the output signal of the decoder circuit 13 is supplied to the memory cell array 12 of the first memory bank 1 via the latch circuit 11 of the first memory bank 1; Latch circuit 2 of second memory bank 2 via word line
1 to the memory cell array 22 of the second memory bank 2. Similarly, the output signal of the latch circuit 21 is supplied to the memory cell array 32 of the third memory bank 3 via the word line -L2 of the memory cell array 22 and the latch circuit 3I of the third memory bank 3. The output signal of the circuit 31 is the word MWI of the memory cell array 32.

を経て4番目のメモリバンク40ラッチ回路41を介し
て4番目のメモリバンク4のメモリセルアレイ42に供
給される。ここで、各メモリバンク1〜4におけるラッ
チ回路11〜41にはそれぞれクロック信号CLKが供
給されるようになっていて、該ラッチ回路11〜41に
おいてデコーダ回路13の出力および前段のラッチ回路
11〜31の出力がそれぞれ1サイクル分だけ遅延され
て対応するメモリセルアレイ12〜42に供給されるよ
うになっている。
The signal is then supplied to the memory cell array 42 of the fourth memory bank 4 via the latch circuit 41 of the fourth memory bank 40. Here, the latch circuits 11 to 41 in each memory bank 1 to 4 are supplied with a clock signal CLK, respectively, and in the latch circuits 11 to 41, the output of the decoder circuit 13 and the previous stage latch circuits 11 to 41 are supplied with a clock signal CLK. The outputs of 31 are each delayed by one cycle and supplied to the corresponding memory cell arrays 12-42.

すなわち、メモリバンク1のメモリセルアレイ12は、
ラッチ回路11により1サイクル分だけ遅延すしたデコ
ーダ回路13の出力信号によりアクセスされ、また、メ
モリバンク2のメモリセルアレイ22は、ラッチ回路1
1および21により2サイクル分だけ遅延されたデコー
ダ回路13の出力信号によりアクセスされる。同様に、
メモリバンク3のメモリセルアレイ32は、ラッチ回路
II、21および31により3サイクル分だけ遅延され
たデコーダ回路13の出力信号によりアクセスされ、そ
して、メモリバンク4のメモリセルアレイ22は、ラッ
チ回路11゜21.31および41により4サイクル分
だけ遅延されたデコーダ回路13の出力信号によりアク
セスされる。従って、各メモリバンク1〜4内のメモリ
セルアレイ11〜41は、順次1サイクルずつ異なるア
ドレスで、換言すると、前段のメモリバンクをアクセス
しているアドレスが1サイクル遅れて次段のメモリバン
クに供給されて複数のメモリバンクが同時にアクセスさ
れ、複数のメモリバンクで並列的に続出/書込処理が実
行されることになる。
That is, the memory cell array 12 of the memory bank 1 is
The memory cell array 22 of the memory bank 2 is accessed by the output signal of the decoder circuit 13 delayed by one cycle by the latch circuit 11.
1 and 21, the output signal of the decoder circuit 13 is delayed by two cycles. Similarly,
The memory cell array 32 of the memory bank 3 is accessed by the output signal of the decoder circuit 13 delayed by three cycles by the latch circuits II, 21 and 31, and the memory cell array 22 of the memory bank 4 is accessed by the output signal of the decoder circuit 13 delayed by three cycles by the latch circuits II, 21 and 31. It is accessed by the output signal of the decoder circuit 13 delayed by 4 cycles by .31 and 41. Therefore, the memory cell arrays 11 to 41 in each memory bank 1 to 4 have different addresses by one cycle sequentially. In other words, the address accessing the previous memory bank is supplied to the next memory bank with a one cycle delay. As a result, a plurality of memory banks are accessed simultaneously, and successive access/write processing is executed in parallel in a plurality of memory banks.

第2図は第1図のベクトル演算装置の要部を示す回路図
である。同図に示されるように、1番目のメモリバンク
1におけるデコーダ回路13は、0本のアドレス入力(
アドレス信号)を受け、2″本の出力のうち1本をアク
ティブにする回路である。ここで、デコーダ回路13は
、例えば、4つのインバータおよび4つのNORゲート
を有し、また、アドレス入力が2本で4本の出力線の内
の1本を選択するように構成されているが、様々な構成
のものを使用することができる。
FIG. 2 is a circuit diagram showing essential parts of the vector calculation device shown in FIG. 1. As shown in the figure, the decoder circuit 13 in the first memory bank 1 has 0 address inputs (
The decoder circuit 13 is a circuit that receives an address signal (address signal) and activates one of the 2'' outputs.Here, the decoder circuit 13 has, for example, four inverters and four NOR gates, and the address input is Although the two output lines are configured to select one of the four output lines, various configurations can be used.

ラッチ回路11.2H31,41)は、フリップフロッ
プで構成され、それぞれクロック信号CLKが供給され
てクロック信号CLKの変化点(立ち上がりエツジ)で
データを保持して各メモリセルアレイ12.22(32
,42)をアクセスするようになっている。そして、メ
モリセルアレイ12.22 (32,42)は、対応す
るラッチ回路LL21(31,41)から出力された信
号(ワード線WL+、WLz(WLzJLa))により
該メモリセルアレイ12.22(32,42)内の個々
のメモリセルをアクセスし、読み出し或いは書き込み処
理を行う(ビット線BL+ (:BIT、 BIT”)
、BL2(BL3.BL4) )ようになっている。
The latch circuits 11.2H31, 41) are each configured with a flip-flop, are supplied with the clock signal CLK, hold data at the change point (rising edge) of the clock signal CLK, and hold the data at each memory cell array 12.22 (32H).
, 42). Then, the memory cell array 12.22 (32, 42) is activated by the signal (word line WL+, WLz (WLzJLa)) output from the corresponding latch circuit LL21 (31, 41). ) to perform read or write processing (bit line BL+ (:BIT, BIT")
, BL2 (BL3.BL4) ).

第3図は第1図のベクトル演算装置の動作を説明するた
めの図である。第1図および第3図に示されるように、
まず、クロック信号CLKの立ち上がりエツジC1にお
いて、アドレス信号ADOが1番目のメモリバンク1に
おけるデコーダ回路13に取り込まれてデコードされる
FIG. 3 is a diagram for explaining the operation of the vector arithmetic device shown in FIG. 1. As shown in Figures 1 and 3,
First, at the rising edge C1 of the clock signal CLK, the address signal ADO is taken into the decoder circuit 13 in the first memory bank 1 and decoded.

次に、クロック信号CLKの立ち上がりエツジC2にお
いて、アドレス信号MDIがデコーダ回路13に取り込
まれてデコードされる。この時、デコーダ回路13の出
力信号BDO(アドレスADOをデコードした信号)が
メモリバンク1のラッチ回路1工にラッチされる。そし
て、ラッチ回路11から信号BDOが1番目のメモリバ
ンク1におけるメモリセルアレイ12に供給されてアド
レスADOに対応したメモリセルに対してデータの入出
力(書込/読出)処理が行われる。また、ラッチ回路1
1の出力信号(BDO)はメモリセルアレイ12のワー
ド線−Ll を介して2番目のメモリバンク2における
ラッチ回路21にも供給される。この出力信号BDOは
、クロック信号CLKのさらに次の立ち上がり工・ッジ
C3においてラッチ回路21にラッチされる。
Next, at the rising edge C2 of the clock signal CLK, the address signal MDI is taken into the decoder circuit 13 and decoded. At this time, the output signal BDO (signal obtained by decoding address ADO) of the decoder circuit 13 is latched by the latch circuit 1 of the memory bank 1. Then, the signal BDO is supplied from the latch circuit 11 to the memory cell array 12 in the first memory bank 1, and data input/output (write/read) processing is performed on the memory cell corresponding to the address ADO. In addition, latch circuit 1
1 output signal (BDO) is also supplied to the latch circuit 21 in the second memory bank 2 via the word line -Ll of the memory cell array 12. This output signal BDO is latched by the latch circuit 21 at the next rising edge C3 of the clock signal CLK.

さらに、クロック信号CLKの立ち上がりエツジC3に
おいて、アドレス信号AD2がデコーダ回路13に取り
込まれてデコードされる。この時、デコーダ回路13の
出力信号BDIがメモリバンク1のラッチ回路11にラ
ッチされ、メモリセルアレイ12のアドレスADIに対
応したメモリセルに対してデータの入出力処理が行われ
る。また、2番目のメモリバンク2では、ラッチ回路2
1からの出力信号BDOによって、2番目のメモリバン
ク2におけるメモリセルアレイ22のアドレスADOに
対応したメモリセルに対してデータの入出力処理が行わ
れる。ここで、ラッチ回路21の出力信号(BDO)は
メモリセルアレイ22のワード線孔2を介して3番目の
メモリバンク3におけるラッチ回路31にも供給される
Further, at the rising edge C3 of the clock signal CLK, the address signal AD2 is taken into the decoder circuit 13 and decoded. At this time, the output signal BDI of the decoder circuit 13 is latched by the latch circuit 11 of the memory bank 1, and data input/output processing is performed to the memory cell corresponding to the address ADI of the memory cell array 12. In addition, in the second memory bank 2, the latch circuit 2
Data input/output processing is performed on the memory cell corresponding to the address ADO of the memory cell array 22 in the second memory bank 2 by the output signal BDO from the second memory bank 2 . Here, the output signal (BDO) of the latch circuit 21 is also supplied to the latch circuit 31 in the third memory bank 3 via the word line hole 2 of the memory cell array 22.

この出力信号BDOは、クロック信号CLKのさらに次
の立ち上がりエツジC4においてラッチ回路31にラッ
チされることになる。以下このような動作が命令終了ま
で行われる。メモリセルアレイの入出力(ビット線)か
らみるとパイプライン処理されることになる。
This output signal BDO is latched by the latch circuit 31 at the next rising edge C4 of the clock signal CLK. Thereafter, such operations are performed until the instruction ends. From the perspective of the input/output (bit line) of the memory cell array, pipeline processing is performed.

このように、各メモリバンク1〜4内のメモリセルアレ
イ11〜41は、順次1サイクルずつ異なるアドレスに
よって、並列的にアクセスされることになる。第3図で
は、クロック信号CLKの立ち上がりエツジC5より後
において、4ノ\ンク全てが並列的に動作することにな
る。
In this way, the memory cell arrays 11 to 41 in each memory bank 1 to 4 are sequentially accessed in parallel by different addresses one cycle at a time. In FIG. 3, all four nodes operate in parallel after the rising edge C5 of the clock signal CLK.

第4図は本発明のベクトル演算装置の他の実施例を示す
ブロック図である。
FIG. 4 is a block diagram showing another embodiment of the vector calculation device of the present invention.

第4図のベクトル演算装置は、前段のラッチ回路11〜
31の出力信号が専用の次段バンク接続線り。
The vector arithmetic device in FIG.
The output signal of 31 is a dedicated next-stage bank connection line.

〜L3により次段のラッチ回路21〜41に供給される
ようになっている。すなわち、第1図のベクトル演算装
置においては、例えば、ラッチ回路11の出力信号が1
番目のメモリバンク1におけるメモリセルアレイ12の
ワード線−り、を介して2番目のメモリバンク2におけ
るラッチ回路21に供給されているが、本実施例のベク
トル演算装置においては、例えば、ラッチ回路11の出
力信号が1番目のメモリバンク1におけるメモリセルア
レイ12を通ることなく専用の次段バンク接続線L+を
介して2番目のメモリバンク2におけるラッチ回路21
に供給されるようになっている。この第4図のベクトル
演算装置の他の構成および動作は、第1図のベクトル演
算装置と同様であり、説明を省略する。
~L3, the signal is supplied to the latch circuits 21 to 41 at the next stage. That is, in the vector calculation device shown in FIG. 1, for example, the output signal of the latch circuit 11 is 1.
It is supplied to the latch circuit 21 in the second memory bank 2 via the word line of the memory cell array 12 in the second memory bank 1. The output signal is sent to the latch circuit 21 in the second memory bank 2 via the dedicated next-stage bank connection line L+ without passing through the memory cell array 12 in the first memory bank 1.
is being supplied to. The other configuration and operation of the vector arithmetic device shown in FIG. 4 are the same as those of the vector arithmetic device shown in FIG. 1, and their explanation will be omitted.

第5図はベクトル演算装置の全体的構成を概略的に示す
図であり、前述した第1図および第4図に示すベクトル
演算装置によりパイプライン処理が行われる様子を示す
ものである。
FIG. 5 is a diagram schematically showing the overall configuration of the vector arithmetic device, and shows how pipeline processing is performed by the vector arithmetic device shown in FIGS. 1 and 4 described above.

第5図に示されるように、ベクトル演算装置は、メモリ
バンク1〜4から読み出された(R)データはバンクセ
レクタBSを介して、演算パイプラインA−Cに供給さ
れ、該演算パイプラインA−Cの出力がバンクセレクタ
BSを介してメモリバンク1〜4へ書き込まれる(W)
ようになっている。
As shown in FIG. 5, in the vector arithmetic device, (R) data read from memory banks 1 to 4 is supplied to arithmetic pipelines A to C via a bank selector BS, and the arithmetic pipelines The output of A-C is written to memory banks 1 to 4 via bank selector BS (W)
It looks like this.

すなわち、演算パイプラインA−Cは、例えば、加算1
乗算、減算等の演算処理を行うもので、各メモリバンク
1〜4から読み出されたデータがBンクセレクタBSに
より順次切り換えられて演算パイプラインA〜Cへ供給
され、ベクトル処理が行われるようになっている。ここ
で、ベクトル処理とは、処理すべきデータが順序よく格
納されており、そのデータを順番に読み出してパイプラ
イン処理を行うことにより、データの処理速度を見かけ
上高速にみせる処理のことをいう。また、ベクトルデー
タは、1サイクルごとに読みだす必要があるが、その時
、他のバンクのアクセスも同時に行われるようになって
いる。そして、第1回および第4図に示すベクトル演算
装置では、ヘクトルレジスタ(メモリバンク1〜4)の
R/W4こ伴うアクセス方式において、アドレスデコー
ダ(デコーダ回路13)が1つとされ、同一アドレスを
メモリバンク毎にずらして入力することにより、連続す
るベクトルデータのR/Wを可能とし、ノ々イフ。
That is, the operation pipeline A-C is, for example, an addition 1
It performs arithmetic processing such as multiplication and subtraction, and the data read from each memory bank 1 to 4 is sequentially switched by the B link selector BS and supplied to the arithmetic pipelines A to C for vector processing. It has become. Here, vector processing refers to processing in which data to be processed is stored in an orderly manner, and the data is sequentially read out and pipeline processing is performed to make the data processing speed appear higher. Further, vector data needs to be read every cycle, but at that time, other banks are accessed at the same time. In the vector arithmetic device shown in Part 1 and FIG. 4, in the access method involving R/W4 of hector registers (memory banks 1 to 4), there is one address decoder (decoder circuit 13), and the same address is By shifting the input for each memory bank, it is possible to read/write continuous vector data, making it possible to read and write continuous vector data.

ライン処理を行えるようになっている。Line processing is now possible.

(発明の効果〕 以上、詳述したように、本発明のベクトル演算装置は、
デコーダ回路を複数のノ\ンクで共有化することによっ
て、デコーダ回路の占有する面積を減少して小型化およ
び高集積化を推進すること力くできる。
(Effects of the Invention) As detailed above, the vector calculation device of the present invention has the following features:
By sharing the decoder circuit among a plurality of nodes, the area occupied by the decoder circuit can be reduced and miniaturization and high integration can be promoted.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は本発明に係るベクトル演算装置の一実施例を示
すブロック図、 第2図は第1図のベクトル演算装置の要部を示す回路図
、 第3図は第1図のベクトル演算装置の動作を説明するた
めの図、 第4図は本発明のベクトル演算装置の他の実施例を示す
ブロック図、 第5図はベクトル演算装置の全体的構成を概略的に示す
図、 第6図は従来のベクトル演算装置の一例を示すブロック
図である。 (符号の説明) 1〜4・・・バンク、 11〜41・・・ラッチ回路、 12〜42・・・メモリセルアレイ、 13・・・デコーダ回路、 BL、−BL4・・・ワード線、 WL2〜WL4・・・ワード線、 L1〜L3・・・次段バンク接続線。 本発明のベクトル演算装置の他の実施例を示すプロ・ツ
ク図第4図 ・、バンクセレクタBS ベクトル演算装置の全体的構成を概略的に示す図第S図
FIG. 1 is a block diagram showing an embodiment of the vector calculation device according to the present invention, FIG. 2 is a circuit diagram showing the main parts of the vector calculation device shown in FIG. 1, and FIG. 3 is the vector calculation device shown in FIG. 1. FIG. 4 is a block diagram showing another embodiment of the vector calculation device of the present invention; FIG. 5 is a diagram schematically showing the overall configuration of the vector calculation device; FIG. 6 1 is a block diagram showing an example of a conventional vector calculation device. (Explanation of symbols) 1-4...Bank, 11-41...Latch circuit, 12-42...Memory cell array, 13...Decoder circuit, BL, -BL4...Word line, WL2- WL4...word line, L1-L3...next stage bank connection line. FIG. 4 is a program diagram showing another embodiment of the vector arithmetic device of the present invention, and bank selector BS is a diagram S schematically showing the overall configuration of the vector arithmetic device.

Claims (1)

【特許請求の範囲】 1、複数のメモリバンク(1〜4)を備え、該複数のメ
モリバンクに格納されているベクトルデータをアクセス
してパイプライン処理を行うベクトル演算装置であって
、 アドレス信号をデコードするデコーダ回路(13)と、
該デコーダ回路の出力信号をラッチするラッチ回路(1
1)と、該ラッチ回路の出力が供給されるワード線(W
L_1)に接続されたメモリセルアレイ(12)とを具
備する1番目のメモリバンク(1)と、前段のメモリバ
ンクにおけるラッチ回路の出力信号をラッチするラッチ
回路(21〜41)と、当該ラッチ回路の出力が供給さ
れるワード線(WL_2〜WL_4)に接続されたメモ
リセルアレイ(22〜42)とを具備する2番目以降の
メモリバンク(2〜4)とを備え、前記1番目のメモリ
バンクに設けられたデコーダ回路の出力を各メモリバン
クに設けられたラッチ回路で1サイクルずつ遅延させ、
該各メモリバンク内のメモリセルアレイを順次1サイク
ルずつ異なるアドレスで同時にアクセスするようにした
ことを特徴とするベクトル演算装置。 2、前記第1のメモリバンクに設けられたデコーダ回路
の出力は、順次ラッチ回路およびメモリセルアレイのワ
ード線を介して次段のメモリバンクに設けられたラッチ
回路に供給されるようになっている請求項第1項に記載
のベクトル演算装置。 3、前記第1のメモリバンクに設けられたデコーダ回路
の出力は、順次ラッチ回路および専用の接続配線(L_
1〜L_3)を介して次段のメモリバンクに設けられた
ラッチ回路に供給されるようになっている請求項第1項
に記載のベクトル演算装置。 4、複数のメモリバンクに格納されているベクトルデー
タをアクセスしてパイプライン処理を行うメモリバンク
アクセス方式であって、 第1のメモリバンクに設けられたデコーダ回路の出力を
各メモリバンクに設けられたラッチ回路で1サイクルず
つ遅延させ、該各メモリバンク内のメモリセルアレイを
順次1サイクルずつ異なるアドレスで同時にアクセスす
るようにしたことを特徴とするメモリバンクアクセス方
式。 5、前記第1のメモリバンクに設けられたデコーダ回路
の出力は、順次ラッチ回路およびメモリセルアレイのワ
ード線を介して次段のメモリバンクに設けられたラッチ
回路に供給されるようになっている請求項第4項に記載
のメモリバンクアクセス方式。 6、前記第1のメモリバンクに設けられたデコーダ回路
の出力は、順次ラッチ回路および専用の接続配線を介し
て次段のメモリバンクに設けられたラッチ回路に供給さ
れるようになっている請求項第4項に記載のメモリバン
クアクセス方式。
[Claims] 1. A vector arithmetic device comprising a plurality of memory banks (1 to 4) and performing pipeline processing by accessing vector data stored in the plurality of memory banks, the device comprising: an address signal; a decoder circuit (13) for decoding the
A latch circuit (1) that latches the output signal of the decoder circuit.
1) and a word line (W) to which the output of the latch circuit is supplied.
a first memory bank (1) comprising a memory cell array (12) connected to the memory cell array (12), a latch circuit (21 to 41) that latches the output signal of the latch circuit in the previous memory bank, and the latch circuit. and memory cell arrays (22 to 42) connected to word lines (WL_2 to WL_4) to which the outputs of the second and subsequent memory banks (2 to 4) are connected to the first memory bank. The output of the provided decoder circuit is delayed one cycle at a time by a latch circuit provided in each memory bank,
A vector arithmetic device characterized in that memory cell arrays in each memory bank are sequentially accessed one cycle at a time using different addresses. 2. The output of the decoder circuit provided in the first memory bank is sequentially supplied to the latch circuit provided in the next stage memory bank via the latch circuit and the word line of the memory cell array. A vector calculation device according to claim 1. 3. The output of the decoder circuit provided in the first memory bank is sequentially connected to a latch circuit and a dedicated connection wiring (L_
2. The vector arithmetic device according to claim 1, wherein the vector arithmetic device is supplied to a latch circuit provided in a next-stage memory bank via L_3). 4. A memory bank access method that performs pipeline processing by accessing vector data stored in multiple memory banks, in which the output of a decoder circuit provided in the first memory bank is provided in each memory bank. A memory bank access method characterized in that the memory cell array in each memory bank is sequentially accessed one cycle at a time at different addresses by delaying one cycle at a time using a latch circuit. 5. The output of the decoder circuit provided in the first memory bank is sequentially supplied to the latch circuit provided in the next stage memory bank via the latch circuit and the word line of the memory cell array. The memory bank access method according to claim 4. 6. The output of the decoder circuit provided in the first memory bank is sequentially supplied to the latch circuit provided in the next stage memory bank via the latch circuit and dedicated connection wiring. The memory bank access method according to item 4.
JP21438690A 1990-08-15 1990-08-15 Memory bank access system and vector arithmetic unit applied to the same system Pending JPH0496867A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP21438690A JPH0496867A (en) 1990-08-15 1990-08-15 Memory bank access system and vector arithmetic unit applied to the same system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP21438690A JPH0496867A (en) 1990-08-15 1990-08-15 Memory bank access system and vector arithmetic unit applied to the same system

Publications (1)

Publication Number Publication Date
JPH0496867A true JPH0496867A (en) 1992-03-30

Family

ID=16654932

Family Applications (1)

Application Number Title Priority Date Filing Date
JP21438690A Pending JPH0496867A (en) 1990-08-15 1990-08-15 Memory bank access system and vector arithmetic unit applied to the same system

Country Status (1)

Country Link
JP (1) JPH0496867A (en)

Similar Documents

Publication Publication Date Title
US7155581B2 (en) Method and apparatus for an energy efficient operation of multiple processors in a memory
JP4989900B2 (en) Parallel processing unit
US6510510B1 (en) Digital signal processor having distributed register file
JP4738112B2 (en) Semiconductor memory device
US7386689B2 (en) Method and apparatus for connecting a massively parallel processor array to a memory array in a bit serial manner
JPH076080A (en) Field-programmable distributed processing memory
JPH06333394A (en) Dual port computer memory device, method for access, computer memory device and memory structure
JPH0676566A (en) Semiconductor memory device
US5914910A (en) Semiconductor memory and method of using the same column decoder and image processor
KR850004680A (en) Integrated processor
JPH0255878B2 (en)
US6256256B1 (en) Dual port random access memories and systems using the same
EP0646925B1 (en) Fully scalable memory apparatus
CN114115507B (en) Memory and method for writing data
US10580481B1 (en) Methods, circuits, systems, and articles of manufacture for state machine interconnect architecture using embedded DRAM
JP2000132966A (en) Semiconductor storage device
US6052705A (en) Video signal processor with triple port memory
JPH0496867A (en) Memory bank access system and vector arithmetic unit applied to the same system
US11474787B2 (en) Processing-in-memory (PIM) devices
US6359827B1 (en) Method of constructing a very wide, very fast distributed memory
JPH10302475A (en) Memory control device
JPS61256478A (en) Parallel processing computer
JP2515724B2 (en) Image processing device
JP2590704B2 (en) Parallel processor LSI
JPH0863997A (en) Semiconductor memory circuit device