JPH02236692A - 情報処理装置 - Google Patents
情報処理装置Info
- Publication number
- JPH02236692A JPH02236692A JP5626889A JP5626889A JPH02236692A JP H02236692 A JPH02236692 A JP H02236692A JP 5626889 A JP5626889 A JP 5626889A JP 5626889 A JP5626889 A JP 5626889A JP H02236692 A JPH02236692 A JP H02236692A
- Authority
- JP
- Japan
- Prior art keywords
- access
- memory
- processor
- time
- vector data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000010365 information processing Effects 0.000 claims description 11
- 230000006866 deterioration Effects 0.000 abstract 2
- 230000007423 decrease Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 2
- 208000000044 Amnesia Diseases 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 231100000863 loss of memory Toxicity 0.000 description 1
- 238000000034 method Methods 0.000 description 1
Landscapes
- Multi Processors (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔産業上の利用分野〕
本発明は情報処理装置に関し、特にベクトルデータを扱
う、共有メモリを有するマルチプロセッサ方式の情報処
理装置にも関する。
う、共有メモリを有するマルチプロセッサ方式の情報処
理装置にも関する。
[従来の技術]
従来、ベクトルデータを扱うような情報処理装置におい
ては、高速演算のために大量のデータを高速にアクセス
して演算部に供給する必要があり、多バンク化等の高ス
ルーブットを実現するための諸技術が駆使されていた。
ては、高速演算のために大量のデータを高速にアクセス
して演算部に供給する必要があり、多バンク化等の高ス
ルーブットを実現するための諸技術が駆使されていた。
しかしながら、例えば、2次元配列のデータの各要素を
列方向にアクセスする場合、配列の大きさの取り方によ
っては全要素が同一バンクにアクセスすることにより、
スルーブットが著しく低下することがある。
列方向にアクセスする場合、配列の大きさの取り方によ
っては全要素が同一バンクにアクセスすることにより、
スルーブットが著しく低下することがある。
[発明が解決しようとする課題〕
上述した従来の情報処理装置は、メモリアクセスのスル
ーブット低下により、システム全体のスルーブットの低
下を来した場合、メモリアクセスのロスがありで性能低
下を来していることを突止めるためには、プログラムを
詳細に解析して、どこに原因があるのか、あるいはメモ
リアクセスに原因があるのか、それ以外に原因があるの
かを追求しなければならない。メモリアクセスが原因か
、それ以外の原因かではプログラムを調査する観点が異
なり、何が原因かわからないのでは多大の工数を要する
という欠点がある。また、共有メモリを有するマルチプ
ロセッサ環境で上述したようなスルーブット低下が一方
のプロセッサで起こっている場合、他のプロセッサがそ
のスルーブット低下を起こしている共有メモリへのアク
セスによって共有メモリへのアクセスが妨げられる場合
、自分のプログラム以外の要因であるためプログラムを
いくら解析しても原因がつかめないという欠点がある。
ーブット低下により、システム全体のスルーブットの低
下を来した場合、メモリアクセスのロスがありで性能低
下を来していることを突止めるためには、プログラムを
詳細に解析して、どこに原因があるのか、あるいはメモ
リアクセスに原因があるのか、それ以外に原因があるの
かを追求しなければならない。メモリアクセスが原因か
、それ以外の原因かではプログラムを調査する観点が異
なり、何が原因かわからないのでは多大の工数を要する
という欠点がある。また、共有メモリを有するマルチプ
ロセッサ環境で上述したようなスルーブット低下が一方
のプロセッサで起こっている場合、他のプロセッサがそ
のスルーブット低下を起こしている共有メモリへのアク
セスによって共有メモリへのアクセスが妨げられる場合
、自分のプログラム以外の要因であるためプログラムを
いくら解析しても原因がつかめないという欠点がある。
本発明の目的は、上述した欠点を除去し、複数のプロセ
ッサにより共有されるメモリを有する情報処理装置にお
いて、プロセッサ間および自プロセッサの要素間でのメ
モリ競合による遅れ時間、または自プロセッサのベクト
ルデータの要素間でのメモリ競合による遅れ時間を選択
的に計数できる情報処理装置を提供するものである。
ッサにより共有されるメモリを有する情報処理装置にお
いて、プロセッサ間および自プロセッサの要素間でのメ
モリ競合による遅れ時間、または自プロセッサのベクト
ルデータの要素間でのメモリ競合による遅れ時間を選択
的に計数できる情報処理装置を提供するものである。
[課題を解決するための手段]
本発明によれば、
複数のプロセッサにより共有されるメモリを有する情報
処理装置であって、前記各プロセッサ対応に、 前記プロセッサがベクトルデータを前記メモリからアク
セスする際に、ベクトルデータの全要素をアクセスする
のに必要な最小時間を算出する計算手段と、 実際にベクトルデータのアクセスに要した時間を計数す
る第1の計数手段と、 前記計算手段によって計算された値と前記第1の計数手
段の値を比較する比較手段と、前記比較手段による比較
結果に基いて歩進する第2の計数手段を具備し、 前記第1の計数手段は他プロセッサのメモリアクセスに
よる待時間にも歩進するか、否かを規定するシステムモ
ード規定手段を有し、 前記システムモード規定手段により規定されるモードに
応じて前記第1の計数手段の歩進を制御し、前記第2の
計数手段でメモリアクセスの待時間を計数することを特
徴とする情報処理装置が得られる。
処理装置であって、前記各プロセッサ対応に、 前記プロセッサがベクトルデータを前記メモリからアク
セスする際に、ベクトルデータの全要素をアクセスする
のに必要な最小時間を算出する計算手段と、 実際にベクトルデータのアクセスに要した時間を計数す
る第1の計数手段と、 前記計算手段によって計算された値と前記第1の計数手
段の値を比較する比較手段と、前記比較手段による比較
結果に基いて歩進する第2の計数手段を具備し、 前記第1の計数手段は他プロセッサのメモリアクセスに
よる待時間にも歩進するか、否かを規定するシステムモ
ード規定手段を有し、 前記システムモード規定手段により規定されるモードに
応じて前記第1の計数手段の歩進を制御し、前記第2の
計数手段でメモリアクセスの待時間を計数することを特
徴とする情報処理装置が得られる。
[実施列]
次に図面を参照して本発明について詳細に説明する。
第1図は本発明の一実施例の構成を示すブロック図で、
プロセッサ(A) 1、プロセッサ(B)2、メモリア
クセス制御装置3、メモリ4、演算器数レジスタ5、メ
モリポート数レジスタ6、シフト回路(A)15、シフ
ト回路(B)25、アクセス時間カウンタ制御回路8、
レジスタ(A)11およびレジスタ(B)21、アクセ
ス時間カウンタ(A)12およびアクセス時間カウンタ
(B)22、比較回路(A)13および比較回路(B)
23およびメモリアクセス待時間カウンタ(A)14お
よびメモリアクセス待時間カウンタ(B)24から構成
される。
プロセッサ(A) 1、プロセッサ(B)2、メモリア
クセス制御装置3、メモリ4、演算器数レジスタ5、メ
モリポート数レジスタ6、シフト回路(A)15、シフ
ト回路(B)25、アクセス時間カウンタ制御回路8、
レジスタ(A)11およびレジスタ(B)21、アクセ
ス時間カウンタ(A)12およびアクセス時間カウンタ
(B)22、比較回路(A)13および比較回路(B)
23およびメモリアクセス待時間カウンタ(A)14お
よびメモリアクセス待時間カウンタ(B)24から構成
される。
プロセッサ(A) 1 (プロセッサ(B)2も同じ)
は、後述する演算器数レジスタ5により規定される1つ
または複数の演算バイブラインのセットを有しており、
複数の演算バイブラインでは同じ演算が並列に行なわれ
る。本実施例ではプロセッサ(A)1の演算パイプライ
ンのセットとプロセッサ(B)2の演算パイプラインの
セットと同一であると仮定しているが、異なっていても
容昌に構成できることは当業者にとっては明白である。
は、後述する演算器数レジスタ5により規定される1つ
または複数の演算バイブラインのセットを有しており、
複数の演算バイブラインでは同じ演算が並列に行なわれ
る。本実施例ではプロセッサ(A)1の演算パイプライ
ンのセットとプロセッサ(B)2の演算パイプラインの
セットと同一であると仮定しているが、異なっていても
容昌に構成できることは当業者にとっては明白である。
また、プロセッサ(A)1がメモリ参照命令を実行する
場合は、メモリアクセス要求を発行し、結線201(ブ
0{rッサ(B)2からは結線3o1)を介してリクエ
スト信号、リクエストアドレス、ベクトルデータのメモ
リ上の要素間距離、ベクトルデータの要素数などのアク
セス情報がメモリアクセス制御装置3に供給される。メ
モリアクセス制御装置3は、プロセッサ(A)1および
プロセッサ(B)2からそれぞれ結線201および30
1を介して供給されたアクセス情報をもとにして、メモ
リ4へのアクセスを制御する装置で、結線101を介し
てメモリ4と複数ボートを介して接続されている。
場合は、メモリアクセス要求を発行し、結線201(ブ
0{rッサ(B)2からは結線3o1)を介してリクエ
スト信号、リクエストアドレス、ベクトルデータのメモ
リ上の要素間距離、ベクトルデータの要素数などのアク
セス情報がメモリアクセス制御装置3に供給される。メ
モリアクセス制御装置3は、プロセッサ(A)1および
プロセッサ(B)2からそれぞれ結線201および30
1を介して供給されたアクセス情報をもとにして、メモ
リ4へのアクセスを制御する装置で、結線101を介し
てメモリ4と複数ボートを介して接続されている。
また、メモリアクセス制御装置3からは、ベクトルデー
タの要素数信号が結線209(プロセッサ(B)2の場
合は309)を介してシフト回路(A)15(プロセッ
サ(B)2の場合はシフト同路(B)25)に、プロセ
ッサ(A)1のメモリアクセス要求の処理開始信号が結
線202(プロセッサ(B)2の場合は302)を介し
てレジスタ(A)11およびアクセス時間カウンタ(A
)12(プロセッサ(B)2の場合はレジスタ(B)2
1およびアクセス時間カウンタ(B)2゜2)に、プロ
セッサ(A)1のメモリアクセス要求存在信号が結線2
06(プロセッサ(B)2の場合は306)を介して比
較回路(A)13およびアクセス時間カウンタ制御回路
8(プロセッサ(B)2の場合は比較回路(B)23お
よびアクセス時間カウンタ制御回路8)にプロセッサ(
A)1のメモリアクセス要求処理中信号が結線208(
プロセッサ(B)2の場合は308)を介してアクセス
時間制御回路8にそれぞれ供給される。メモリ4は複数
バンクから成る記憶装置で、結線101により複数ボー
トを介してメモリアクセス制御装置3と接続されている
。
タの要素数信号が結線209(プロセッサ(B)2の場
合は309)を介してシフト回路(A)15(プロセッ
サ(B)2の場合はシフト同路(B)25)に、プロセ
ッサ(A)1のメモリアクセス要求の処理開始信号が結
線202(プロセッサ(B)2の場合は302)を介し
てレジスタ(A)11およびアクセス時間カウンタ(A
)12(プロセッサ(B)2の場合はレジスタ(B)2
1およびアクセス時間カウンタ(B)2゜2)に、プロ
セッサ(A)1のメモリアクセス要求存在信号が結線2
06(プロセッサ(B)2の場合は306)を介して比
較回路(A)13およびアクセス時間カウンタ制御回路
8(プロセッサ(B)2の場合は比較回路(B)23お
よびアクセス時間カウンタ制御回路8)にプロセッサ(
A)1のメモリアクセス要求処理中信号が結線208(
プロセッサ(B)2の場合は308)を介してアクセス
時間制御回路8にそれぞれ供給される。メモリ4は複数
バンクから成る記憶装置で、結線101により複数ボー
トを介してメモリアクセス制御装置3と接続されている
。
演算器数レジスタ5はプロセッサ(A)1およびプロセ
ッサ(B)2内にある演算パイプラインのセット数を保
持するレジスタで、図示されない線を介してシステムの
初期化時に値がセットされ、保持されている値は結線1
02を介してシフト凹路(A)15およびCB)25に
供給される。メモリポート数レジスタ6はメモリアクセ
ス制御装[3とメモリ4の間のメモリポート数を保持す
るレジスタで、演算数レジスタ5と同様に図示されない
線を介してシステムの初期化時に値がセットされ、保持
されている値は結線103を介してシフト回路(A)1
5および(B)25に供給される。
ッサ(B)2内にある演算パイプラインのセット数を保
持するレジスタで、図示されない線を介してシステムの
初期化時に値がセットされ、保持されている値は結線1
02を介してシフト凹路(A)15およびCB)25に
供給される。メモリポート数レジスタ6はメモリアクセ
ス制御装[3とメモリ4の間のメモリポート数を保持す
るレジスタで、演算数レジスタ5と同様に図示されない
線を介してシステムの初期化時に値がセットされ、保持
されている値は結線103を介してシフト回路(A)1
5および(B)25に供給される。
シフト回路(A)15および(B)25は、メモリアク
セス制御装置3から結線209および309を介して供
給されるベクトルデータの要素数信号を、結線102を
介して供給される演算パイプラインのセット数信号およ
び結線103を介して供給されるメモリポート数信号に
よって定まる同時アクセス可能な要素数をシフト数とし
て右にシフトし、シフトアウトされたビットに論理′1
゜のビットがあるとシフト結果に′1”を加えて、ベク
トルデータの各要素のアクセス間でバンク競合が起こら
なかった場合に要する時間が得られ、結線201および
310を介してレジスタ(A)11およびレジスタCB
)21に供給される。
セス制御装置3から結線209および309を介して供
給されるベクトルデータの要素数信号を、結線102を
介して供給される演算パイプラインのセット数信号およ
び結線103を介して供給されるメモリポート数信号に
よって定まる同時アクセス可能な要素数をシフト数とし
て右にシフトし、シフトアウトされたビットに論理′1
゜のビットがあるとシフト結果に′1”を加えて、ベク
トルデータの各要素のアクセス間でバンク競合が起こら
なかった場合に要する時間が得られ、結線201および
310を介してレジスタ(A)11およびレジスタCB
)21に供給される。
レジスタ(A)11およびレジスタ(B)21はそれぞ
れプロセッサ(A)1およびプロセッサ(B)2のベク
トルデータアクセス要求でベクトルデータを構成する各
要素間でバンク競合が全く起こらない場合に要する時間
を保持するレジスタで、それぞれ結線202、および3
02により供給されるリクエスト受付信号が“1″にな
るタイミングでセットされ、それぞれ結線203および
303を介して比較回路(A)13、比較回路(B)2
3に供給される。
れプロセッサ(A)1およびプロセッサ(B)2のベク
トルデータアクセス要求でベクトルデータを構成する各
要素間でバンク競合が全く起こらない場合に要する時間
を保持するレジスタで、それぞれ結線202、および3
02により供給されるリクエスト受付信号が“1″にな
るタイミングでセットされ、それぞれ結線203および
303を介して比較回路(A)13、比較回路(B)2
3に供給される。
アクセス時間カウンタ(A)12およびアクセス時間カ
ウンタ(B)22はそれぞれ結線202および302に
より供給されるリクエスト処理開始信号により“0”に
クリアし、その後、アクセス時間カウンタ制御回路8か
らそれぞれ結線204および304を介して供給される
アクセス時間カウンタ有効信号が“1#になっている期
間′1”ずつ歩進していくカウンタで、その出力はそれ
ぞれ結線205および305を介して比較回路(A)1
3および比較回路(B)23に倶給される。
ウンタ(B)22はそれぞれ結線202および302に
より供給されるリクエスト処理開始信号により“0”に
クリアし、その後、アクセス時間カウンタ制御回路8か
らそれぞれ結線204および304を介して供給される
アクセス時間カウンタ有効信号が“1#になっている期
間′1”ずつ歩進していくカウンタで、その出力はそれ
ぞれ結線205および305を介して比較回路(A)1
3および比較回路(B)23に倶給される。
アクセス時間カウンタ制御回路8は結線2o6,208
,306および308により供給されるメモリアクセス
要求存在信号およびメモリアクセス要求処理中信号を基
にしてアクセス時間カウンタ(A)12およびアクセス
時間カウンタ(B)22の歩進を有効にするアクセス時
間カウンタ有効信号204および304を生成し、それ
ぞれアクセス時間カウンタ(A)12およびアクセス時
間カウンタ(B)22に供給する。
,306および308により供給されるメモリアクセス
要求存在信号およびメモリアクセス要求処理中信号を基
にしてアクセス時間カウンタ(A)12およびアクセス
時間カウンタ(B)22の歩進を有効にするアクセス時
間カウンタ有効信号204および304を生成し、それ
ぞれアクセス時間カウンタ(A)12およびアクセス時
間カウンタ(B)22に供給する。
比較回路(A)13および比較回路CB)23はそれぞ
れ結線203および303を介して供給されるバンク競
合が全くない場合に要する時間信号と、結線205およ
び305を介して供給されるアクセス時間カウンタ(A
)12およびアクセス時間カウンタ(B)2’;”lこ
保持されている値を示す信号を比較する回路で、アクセ
ス時間カウンタ(A)12またはアクセス時間カウンタ
(B)22の値の方がレジスタ(A)11またはレジス
タ(B)21より小さくなく、それぞれ結線206およ
び306により供給されるメモリアクセス要求処理中信
号が“1゜である期間にそれぞれ結線207および20
8を“1”として出力し、メモリアクセス待時間カウン
タ(A)14およびメモリアクセス待時間カウンタ(B
)24に供給される。
れ結線203および303を介して供給されるバンク競
合が全くない場合に要する時間信号と、結線205およ
び305を介して供給されるアクセス時間カウンタ(A
)12およびアクセス時間カウンタ(B)2’;”lこ
保持されている値を示す信号を比較する回路で、アクセ
ス時間カウンタ(A)12またはアクセス時間カウンタ
(B)22の値の方がレジスタ(A)11またはレジス
タ(B)21より小さくなく、それぞれ結線206およ
び306により供給されるメモリアクセス要求処理中信
号が“1゜である期間にそれぞれ結線207および20
8を“1”として出力し、メモリアクセス待時間カウン
タ(A)14およびメモリアクセス待時間カウンタ(B
)24に供給される。
メモリアクセス待時間カウンタ(A)14およびメモリ
アクセス待時間カウンタ(B)24はそれぞれ結線20
7および307により供給される信号により歩進される
カウンタで、アクセス時間制御回路8の内容により、メ
モリアクセス要求を受付けて完了するまでに待たされた
時間、またはバンク競合によって待たされた時間を表わ
している。
アクセス待時間カウンタ(B)24はそれぞれ結線20
7および307により供給される信号により歩進される
カウンタで、アクセス時間制御回路8の内容により、メ
モリアクセス要求を受付けて完了するまでに待たされた
時間、またはバンク競合によって待たされた時間を表わ
している。
第2図は第1図のメモリアクセス装置3を詳細に表わし
た図面である。プロセッサ(A)1からのリクエスト信
号、リクエストアドレス、ベクトルデータの要素間距離
、ベクトルデータの要素数はそれぞれ結線201−1,
201−2,201−3および201−4を介して供給
され、レジスタ61.62,63および64にそれぞれ
セットされる。またプロセッサ(B)2からはリクエス
ト信号、リクエストアドレス、ベクトルアドレスの要素
間距離、ベクトルデータの要索数がそれぞれ結線301
−1,301−2,301−3,301−4を介して供
給され、レジスタ71,72.73および74にそれぞ
れセットされる。
た図面である。プロセッサ(A)1からのリクエスト信
号、リクエストアドレス、ベクトルデータの要素間距離
、ベクトルデータの要素数はそれぞれ結線201−1,
201−2,201−3および201−4を介して供給
され、レジスタ61.62,63および64にそれぞれ
セットされる。またプロセッサ(B)2からはリクエス
ト信号、リクエストアドレス、ベクトルアドレスの要素
間距離、ベクトルデータの要索数がそれぞれ結線301
−1,301−2,301−3,301−4を介して供
給され、レジスタ71,72.73および74にそれぞ
れセットされる。
レジスタ61および71は受付けたメモリアクセス要求
の処理待であることを示し、アクセス開始指示信号40
7および507によりそれぞれリセットされる。レジス
タ62とレジスタ72、レジスタ63とレジスタ73お
よびレジスタ64とレジスタ74はそれぞれ選択回路5
1.52および53でそれぞれのプロセッサのメモリア
クセス要求が処理される時にプロセッサ対応の情報が選
択される。
の処理待であることを示し、アクセス開始指示信号40
7および507によりそれぞれリセットされる。レジス
タ62とレジスタ72、レジスタ63とレジスタ73お
よびレジスタ64とレジスタ74はそれぞれ選択回路5
1.52および53でそれぞれのプロセッサのメモリア
クセス要求が処理される時にプロセッサ対応の情報が選
択される。
レジスタ65および75はそれぞれプロセッサ(A)1
、プロセッサ(B)2のメモリアクセス処理要求の処理
中を示すフラグで、結線208および308を介して第
1図のアクセス時間カウンタ制御回路8に供給される。
、プロセッサ(B)2のメモリアクセス処理要求の処理
中を示すフラグで、結線208および308を介して第
1図のアクセス時間カウンタ制御回路8に供給される。
レジスタ65および75は、各プロセッサのアクセス要
求処理待フラグ61および71がm11にセットされて
おり、他プロセッサの処理中フラグ75および65が1
0′になっていて処理が行なわれておらず、他プロセッ
サの優先処理フラグ77および67がa O IIにな
っているか、他プロセッサの処理待フラグ71および6
1が“0′になっている時に、セットされ、またそのセ
ットタイミングで自プロセッサの優先処理フラグ67お
よび77をリセットシ、他プロセッサの優先処理フラグ
77および67をセットする。
求処理待フラグ61および71がm11にセットされて
おり、他プロセッサの処理中フラグ75および65が1
0′になっていて処理が行なわれておらず、他プロセッ
サの優先処理フラグ77および67がa O IIにな
っているか、他プロセッサの処理待フラグ71および6
1が“0′になっている時に、セットされ、またそのセ
ットタイミングで自プロセッサの優先処理フラグ67お
よび77をリセットシ、他プロセッサの優先処理フラグ
77および67をセットする。
さらにアクセス要求待フラグ61および71は、それぞ
れオア回路69および79でアクセス要求処理待フラグ
61および71と論理和がとられ、それぞれ結線206
および306を介して第1図のアクセス時間カウンタ制
御回路8および比較回路(A)13、比較回路CB)2
3に供給される。
れオア回路69および79でアクセス要求処理待フラグ
61および71と論理和がとられ、それぞれ結線206
および306を介して第1図のアクセス時間カウンタ制
御回路8および比較回路(A)13、比較回路CB)2
3に供給される。
60および70は微分回路で、それぞれアクセス要求待
フラグ61および71が“1ゝになっている最初の1サ
イクルだけ“1′にして出力する回路、すなわちプロセ
ッサ(A)1およびプロセッサ(B)2からのメモリア
クセス要求を受取ったタイミングだけ“1゜にして出力
する回路でそれぞれ結線202および302を介して第
1図のレジスタ(A)11およびレジスタ(B)21に
供給される。
フラグ61および71が“1ゝになっている最初の1サ
イクルだけ“1′にして出力する回路、すなわちプロセ
ッサ(A)1およびプロセッサ(B)2からのメモリア
クセス要求を受取ったタイミングだけ“1゜にして出力
する回路でそれぞれ結線202および302を介して第
1図のレジスタ(A)11およびレジスタ(B)21に
供給される。
デコード回路54は、選択回路52で選択された要素間
距離を基にして、メモリ4ヘリクエストを送出するタイ
ミングを決定する回路で、結線101−1を介して第1
図のメモリ4へ複数ボートのリクエスト信号を送出する
。また結線603を介してメモリ4へ何要素分のリクエ
ストが出たかという情報を残要素数カウンタ56および
アドレス加算回路55に供給する。
距離を基にして、メモリ4ヘリクエストを送出するタイ
ミングを決定する回路で、結線101−1を介して第1
図のメモリ4へ複数ボートのリクエスト信号を送出する
。また結線603を介してメモリ4へ何要素分のリクエ
ストが出たかという情報を残要素数カウンタ56および
アドレス加算回路55に供給する。
アドレス加算回路55は選択回路51で選択された先頭
アドレスに順次選択回路52で選択された要素間距離を
、デコード回路で決定された同時アドレス要索数を乗じ
て加えていき、結線101一2を介してメモリ4ヘアド
レスとして送出する。
アドレスに順次選択回路52で選択された要素間距離を
、デコード回路で決定された同時アドレス要索数を乗じ
て加えていき、結線101一2を介してメモリ4ヘアド
レスとして送出する。
残要素数カウンタ56は選択回路53で選択された要素
数からメモリ4へ送出されたリクエストの要索数を順次
減じていくカウンタで、ベクトルデータのアクセスの終
了をカウンタの値が″0”になることにより検出し、結
線604を介してアクセス要求処理中フラグ65および
75をリセットする。バンクビジーカウンタ57はメモ
リ4ヘリクエストが送出されるごとに初期値(メモリ4
のバンクサイクル時間)がセットされ、リクエストが送
出されない時は“12ずつ減じ′0”になることにより
すべてのバンクがビジー状態でないことを検出し、デコ
ード回路54へ結線605を介して通知し、次のベクト
ルデータのアクセス内開始を可能ならしめる。
数からメモリ4へ送出されたリクエストの要索数を順次
減じていくカウンタで、ベクトルデータのアクセスの終
了をカウンタの値が″0”になることにより検出し、結
線604を介してアクセス要求処理中フラグ65および
75をリセットする。バンクビジーカウンタ57はメモ
リ4ヘリクエストが送出されるごとに初期値(メモリ4
のバンクサイクル時間)がセットされ、リクエストが送
出されない時は“12ずつ減じ′0”になることにより
すべてのバンクがビジー状態でないことを検出し、デコ
ード回路54へ結線605を介して通知し、次のベクト
ルデータのアクセス内開始を可能ならしめる。
第3図は第1図におけるアクセス時間カウンタ制御回路
8を詳細に表わした図面である。91および96がモー
ドフラグで、図示されないバスによってシステム初期化
時に“0“または“1”にそれぞれ独立にセットされる
。モードフラグ91および96が′0”の時は他プロセ
ッサのアクセスによりメモリアクセスが待たされている
間も第1図のアクセス時間カウンタ(A)12、アクセ
ス時間カウンタ(B)22は歩進が可能で、′1”の時
は他プロセッサのアクセスによってメモリアクセスが待
たされている間はアクセス時間カウンタ(A)12、ア
クセス時間カウンタ(B)22の歩進が抑止される。プ
ロセッサ(B)2からのメモリアクセス要求が処理中の
時は、第2図の75が″1゜になり、結線308を介し
てNANDゲート92に洪給され、モードフラグ91と
NAND論理がとられる。
8を詳細に表わした図面である。91および96がモー
ドフラグで、図示されないバスによってシステム初期化
時に“0“または“1”にそれぞれ独立にセットされる
。モードフラグ91および96が′0”の時は他プロセ
ッサのアクセスによりメモリアクセスが待たされている
間も第1図のアクセス時間カウンタ(A)12、アクセ
ス時間カウンタ(B)22は歩進が可能で、′1”の時
は他プロセッサのアクセスによってメモリアクセスが待
たされている間はアクセス時間カウンタ(A)12、ア
クセス時間カウンタ(B)22の歩進が抑止される。プ
ロセッサ(B)2からのメモリアクセス要求が処理中の
時は、第2図の75が″1゜になり、結線308を介し
てNANDゲート92に洪給され、モードフラグ91と
NAND論理がとられる。
ここでモードフラグ9lに保持されている値が論理゛0
#の場合は、NANDゲート92から無条件で“1“が
出力され、また91に保持されている値が論理“1”で
あれば、NANDゲート92からは″0”が出力され、
ANDゲート93がディスエーブルされる。ANDゲー
ト93は、プロセッサ(A)1からのメモリアクセス要
求存在信号206とNANDゲート92の出力の論理積
をとる回路で、結線204を介して第1図のアクセス時
間カウンタ(A)12の歩進指示を行なう。
#の場合は、NANDゲート92から無条件で“1“が
出力され、また91に保持されている値が論理“1”で
あれば、NANDゲート92からは″0”が出力され、
ANDゲート93がディスエーブルされる。ANDゲー
ト93は、プロセッサ(A)1からのメモリアクセス要
求存在信号206とNANDゲート92の出力の論理積
をとる回路で、結線204を介して第1図のアクセス時
間カウンタ(A)12の歩進指示を行なう。
NANDゲート97、ANDゲート98もプロセッサ(
A)1とプロセッサ(B)2が異なるだけで同様の動作
を行なう。
A)1とプロセッサ(B)2が異なるだけで同様の動作
を行なう。
以上のような構成でタイムチャートを参照して本発明の
動作を説明する。なお、本実施例ではバンクサイクル時
間が8サイクルであるとする。また、メモリ4に対して
は同時に2要素のアクセスが可能であるとする。
動作を説明する。なお、本実施例ではバンクサイクル時
間が8サイクルであるとする。また、メモリ4に対して
は同時に2要素のアクセスが可能であるとする。
第4図はモードフラグ91がaO″の場合、すなわち、
他プロセッサのアクセスによりメモリアクセスが待たさ
れている間も、アクセス時間カウンタ12,22は歩進
が可能である場合の動作例である。
他プロセッサのアクセスによりメモリアクセスが待たさ
れている間も、アクセス時間カウンタ12,22は歩進
が可能である場合の動作例である。
時刻T0でプロセッサ(A)1からメモリアクセス要求
があり、T,でアクセス処理待フラグ61がセットされ
た時に、プロセッサ(B)2からのアクセス処理中で7
5が″″1゜になっている時、モードフラグ91が′0
#なのでNAND回路92により712が“1#になり
、61または65が“1°になっている期間、アクセス
時間カウンタ有効信号204は゛1”を出力し続ける。
があり、T,でアクセス処理待フラグ61がセットされ
た時に、プロセッサ(B)2からのアクセス処理中で7
5が″″1゜になっている時、モードフラグ91が′0
#なのでNAND回路92により712が“1#になり
、61または65が“1°になっている期間、アクセス
時間カウンタ有効信号204は゛1”を出力し続ける。
要素数が′8″であると、レジスタ64から61が′″
1″になっている最初の1サイクルである時刻T2でレ
ジスタ11に14”がセットされ、アクセス時間カウン
タ(A)12が“0”にクリアされる。丈の後ずっとア
クセス処理存在信号206は“1”になっているので、
アクセス時間カウンタ有効信号204は“11でアクセ
ス時間カウンタ(A)12は“1mずつ歩進され、′4
″以上になるとアクセス待時間カウンタ(A)14の歩
進を開始する。
1″になっている最初の1サイクルである時刻T2でレ
ジスタ11に14”がセットされ、アクセス時間カウン
タ(A)12が“0”にクリアされる。丈の後ずっとア
クセス処理存在信号206は“1”になっているので、
アクセス時間カウンタ有効信号204は“11でアクセ
ス時間カウンタ(A)12は“1mずつ歩進され、′4
″以上になるとアクセス待時間カウンタ(A)14の歩
進を開始する。
第5図はモードフラグ91が′1”の場合、すなわち、
他のプロセッサのアクセスによってメモリアクセスが待
たされている間はアクセス時間カウンタ12,22の歩
進が抑止される場合の動作例である。
他のプロセッサのアクセスによってメモリアクセスが待
たされている間はアクセス時間カウンタ12,22の歩
進が抑止される場合の動作例である。
プロセッサ(A)1からのメモリアクセス要求、および
プロセッサ(B)2のメモリアクセス処理が第4図の例
と同様に行われるとすると、モードフラグ81が“11
であるからアクセス処理中フラグ75がaO″になるま
でNANDゲート92は′0″を出力し、ANDゲート
93がディスエーブルされ、204が“1′″にならな
い。204が“1”になるタイミングはアクセス処理中
フラグ75が′0“になってであるから、時刻T,から
で、従って時刻T6からアクセス時間カウンタ(A)1
2の歩進が開始される。
プロセッサ(B)2のメモリアクセス処理が第4図の例
と同様に行われるとすると、モードフラグ81が“11
であるからアクセス処理中フラグ75がaO″になるま
でNANDゲート92は′0″を出力し、ANDゲート
93がディスエーブルされ、204が“1′″にならな
い。204が“1”になるタイミングはアクセス処理中
フラグ75が′0“になってであるから、時刻T,から
で、従って時刻T6からアクセス時間カウンタ(A)1
2の歩進が開始される。
第4図の例と比較するとアクセス時間カウンタ(A)1
2の歩進開始のタイミングは3サイクル遅く、この分が
、他プロセッサのアクセスによる影響であることがわか
る。
2の歩進開始のタイミングは3サイクル遅く、この分が
、他プロセッサのアクセスによる影響であることがわか
る。
プロセッサ(B)2のメモリアクセスでも全く同様に動
作することは言うまでもない。
作することは言うまでもない。
[発明の効果]
以上説明したように本発明は、ベクトルデータのアクセ
スにおいて要素間で全バンク競合が起こらなかった場合
に要する時間数を算出し、メモリアクセス要求を受取っ
てから完了するまでの経過時間、または他プロセッサか
らのアクセスによる待時間を除いた経過時間をモード信
号によって切替えてバンク競合が全く起こらなかった場
合に要する時間数を比較して、経過時間が同じ、または
大きくなった時に歩進するカウンタを設けることによっ
て、ベクトルデータのアクセスで、プロセッサ間および
自プロセッサの要素間でのメモリ競合による遅れ時間、
または自プロセッサのベクトルデータの要素間でのメモ
リ競合による遅れ時間を選択的に計数でき、性能低下原
因の追求を容品ならしめるという効果がある。
スにおいて要素間で全バンク競合が起こらなかった場合
に要する時間数を算出し、メモリアクセス要求を受取っ
てから完了するまでの経過時間、または他プロセッサか
らのアクセスによる待時間を除いた経過時間をモード信
号によって切替えてバンク競合が全く起こらなかった場
合に要する時間数を比較して、経過時間が同じ、または
大きくなった時に歩進するカウンタを設けることによっ
て、ベクトルデータのアクセスで、プロセッサ間および
自プロセッサの要素間でのメモリ競合による遅れ時間、
または自プロセッサのベクトルデータの要素間でのメモ
リ競合による遅れ時間を選択的に計数でき、性能低下原
因の追求を容品ならしめるという効果がある。
tJl図は本発明の実施例のブロック図、第2図は第1
図のメモリアクセス制御装置3の一例の詳細ブロック図
、13図は第1図のアクセス時間カウンタ制御回路8の
一例の詳細ブロック図、第4図、第5図は動作例を示す
タイムチャートである。 1.2・・・プロセッサ、3・・・メモリアクセス制御
装置、4・・・メモリ、5・・・演算器数レジスタ、6
・・・メモリポート数レジスタ、15.25・・・シフ
ト回路、11.21・・・レジスタ、12.22・・・
アクセス時間カウンタ、13.23・・・比較回路、1
4,24・・・メモリアクセス待時間カウンタ、8・・
・アクセス時間制御回路、61.71・・・メモリアク
セス処理待フラグ、62.72・・・先頭アドレスレジ
スタ、63.73・・・要素間距離レジスタ、64.7
4・・・要素数レジスタ、65.75・・・メモリアク
セス処理中フラグ、66.76・・・組合せ論理回路、
67.77・・・ブライオリティフラグ,68.78・
・・ANDゲート、69.79・・・ORゲート、60
.70・・・微分回路、51〜53・・・選択回路、5
4・・・デコード回路、55・・・アドレス加算回路、
56・・・残要素数カウンタ、57・・・バンクビジー
カウンタ、91.96・・・モードフラグ、92.97
・・・NANDゲート、93.98・・・ANDゲート
。 第 図 第 図 要素数レジスタ 64 残要素数カウンタ 56 レジスタ 11 アクセス時間カウンタ 12 メモリアクセス待時間 14 アクセス時間力ウンタ 204 頁効信号 口m 口酊=======二==二 [可工了]]口口丁■I丁3二 一二==て丁]=
図のメモリアクセス制御装置3の一例の詳細ブロック図
、13図は第1図のアクセス時間カウンタ制御回路8の
一例の詳細ブロック図、第4図、第5図は動作例を示す
タイムチャートである。 1.2・・・プロセッサ、3・・・メモリアクセス制御
装置、4・・・メモリ、5・・・演算器数レジスタ、6
・・・メモリポート数レジスタ、15.25・・・シフ
ト回路、11.21・・・レジスタ、12.22・・・
アクセス時間カウンタ、13.23・・・比較回路、1
4,24・・・メモリアクセス待時間カウンタ、8・・
・アクセス時間制御回路、61.71・・・メモリアク
セス処理待フラグ、62.72・・・先頭アドレスレジ
スタ、63.73・・・要素間距離レジスタ、64.7
4・・・要素数レジスタ、65.75・・・メモリアク
セス処理中フラグ、66.76・・・組合せ論理回路、
67.77・・・ブライオリティフラグ,68.78・
・・ANDゲート、69.79・・・ORゲート、60
.70・・・微分回路、51〜53・・・選択回路、5
4・・・デコード回路、55・・・アドレス加算回路、
56・・・残要素数カウンタ、57・・・バンクビジー
カウンタ、91.96・・・モードフラグ、92.97
・・・NANDゲート、93.98・・・ANDゲート
。 第 図 第 図 要素数レジスタ 64 残要素数カウンタ 56 レジスタ 11 アクセス時間カウンタ 12 メモリアクセス待時間 14 アクセス時間力ウンタ 204 頁効信号 口m 口酊=======二==二 [可工了]]口口丁■I丁3二 一二==て丁]=
Claims (1)
- 【特許請求の範囲】 1、複数のプロセッサにより共有されるメモリを有する
情報処理装置であって、前記各プロセッサ対応に、 前記プロセッサがベクトルデータを前記メモリからアク
セスする際に、ベクトルデータの全要素をアクセスする
のに必要な最小時間を算出する計算手段と、 実際にベクトルデータのアクセスに要した時間を計数す
る第1の計数手段と、 前記計算手段によって計算された値と前記第1の計数手
段の値を比較する比較手段と、 前記比較手段による比較結果に基いて歩進する第2の計
数手段を具備し、 前記第1の計数手段は他プロセッサのメモリアクセスに
よる待時間にも歩進するか、否かを規定するシステムモ
ード規定手段を有し、 前記システムモード規定手段により規定されるモードに
応じて前記第1の計数手段の歩進を制御し、前記第2の
計数手段でメモリアクセスの待時間を計数することを特
徴とする情報処理装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP5626889A JPH0812654B2 (ja) | 1989-03-10 | 1989-03-10 | 情報処理装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP5626889A JPH0812654B2 (ja) | 1989-03-10 | 1989-03-10 | 情報処理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH02236692A true JPH02236692A (ja) | 1990-09-19 |
JPH0812654B2 JPH0812654B2 (ja) | 1996-02-07 |
Family
ID=13022338
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP5626889A Expired - Lifetime JPH0812654B2 (ja) | 1989-03-10 | 1989-03-10 | 情報処理装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH0812654B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0604059A2 (en) * | 1992-12-21 | 1994-06-29 | Matsushita Electric Industrial Co., Ltd. | Video-memory control apparatus |
-
1989
- 1989-03-10 JP JP5626889A patent/JPH0812654B2/ja not_active Expired - Lifetime
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0604059A2 (en) * | 1992-12-21 | 1994-06-29 | Matsushita Electric Industrial Co., Ltd. | Video-memory control apparatus |
EP0604059A3 (en) * | 1992-12-21 | 1994-12-28 | Matsushita Electric Ind Co Ltd | Control circuit for video memory. |
Also Published As
Publication number | Publication date |
---|---|
JPH0812654B2 (ja) | 1996-02-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US4939638A (en) | Time sliced vector processing | |
US5872987A (en) | Massively parallel computer including auxiliary vector processor | |
US5263169A (en) | Bus arbitration and resource management for concurrent vector signal processor architecture | |
US6237089B1 (en) | Method and apparatus for affecting subsequent instruction processing in a data processor | |
JP4267818B2 (ja) | ディジタル信号プロセッサ用双方向通信ポート | |
US6269440B1 (en) | Accelerating vector processing using plural sequencers to process multiple loop iterations simultaneously | |
CA1218754A (en) | Computer vector multi-processing control | |
JPH0463430B2 (ja) | ||
US9400656B2 (en) | Chaining between exposed vector pipelines | |
WO2001086426A2 (en) | System and method for performing a synchronization operation for multiple devices in a computer system | |
JP2000259609A (ja) | データ処理プロセッサおよびシステム | |
JPH02236692A (ja) | 情報処理装置 | |
JP2674809B2 (ja) | 情報処理装置 | |
US6647450B1 (en) | Multiprocessor computer systems with command FIFO buffer at each target device | |
US10956361B2 (en) | Processor core design optimized for machine learning applications | |
JPH03238539A (ja) | メモリアクセス制御装置 | |
JPH06161873A (ja) | 主記憶に対する複数のアクセスポイントのハングアップ処理方式 | |
EP1193607B1 (en) | Apparatus and method for the exchange of signal groups between a plurality of components in a digital signal processor having a direct memory access controller | |
EP1193606B1 (en) | Apparatus and method for a host port interface unit in a digital signal processing unit | |
JPH05108476A (ja) | 主記憶制御装置 | |
JP2826466B2 (ja) | 並列コンピュータシステムの性能測定方式 | |
JP2663417B2 (ja) | 記憶回路 | |
JPH0424843A (ja) | メモリアクセス制御装置 | |
WO1987004829A1 (en) | Improvements relating to control flow in computers | |
JPH0773162A (ja) | 情報処理装置の性能モニタ |