JPH01180052A - アドレス生成回路 - Google Patents

アドレス生成回路

Info

Publication number
JPH01180052A
JPH01180052A JP416988A JP416988A JPH01180052A JP H01180052 A JPH01180052 A JP H01180052A JP 416988 A JP416988 A JP 416988A JP 416988 A JP416988 A JP 416988A JP H01180052 A JPH01180052 A JP H01180052A
Authority
JP
Japan
Prior art keywords
signal
output
address
data
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP416988A
Other languages
English (en)
Other versions
JPH0556542B2 (ja
Inventor
Takeshi Kamimura
健 上村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP416988A priority Critical patent/JPH01180052A/ja
Publication of JPH01180052A publication Critical patent/JPH01180052A/ja
Publication of JPH0556542B2 publication Critical patent/JPH0556542B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Executing Machine-Instructions (AREA)
  • Complex Calculations (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明はアドレス生成回路に関し、特に2次元配列デー
タの処理における、アドレスを発生するアドレス生成回
路に関する。
〔従来の技術〕
数値計算9画像処理全始めとする様々な分野において、
2次元の配列データ全一様に更新する処理は、頻繁に現
われる。この種の処理装瞳はいわゆるラスタ走査順にデ
ータをアクセスする場合が多いが、パイプライン処理を
用いて処理の高速化を図る際に、アクセス順序を変える
ことにより、処理効率が向上することがある。
次にその例として、2次元ラプラス男根式、の数値解を
、反復法により求める場合を考える。
(1)式を5点階差により差分化すると、次の(2)式
が得られる。
・・・・・・(2) 但し、x=i・Δx+y=j・Δyであシ、簡単のため
ΔX=Δy=1とした。更に、反復回数をnとし、n回
目の反復時のφの値をφ3nゝと表わす。このとき例え
ば、 ・・・・・・(3) として、φ(n +1−φLn) 、!:なるまで繰り
返せば、φの定常解が求まる。
ところで、(2)の反復全ラスタ走査順にアドレスを発
生して実行すると、アルゴリズムは・・・・・・(4) となる。(3)式と(4)式を比較すると、(4)式で
はφ1−1j +φi、j−1に関して、1反復分新し
い値(=定常解に近い値)を用いているため、収束が早
い。しかし、(4)式は明らかに(i、j)に関して漸
化式になっていることから、並列処理による高速化が期
待できないという問題がある。
そこで、この問題を解決するためには、次の(5)式の
ように、データのアクセス順序を変えれば良いことが知
られている。
(i+j=偶数)      ・・・・・・(5a)(
i+j=奇数)      ・・・・・・(5b)即ち
、(2)式より、各点の値は上下左右の4近傍の点のみ
から影響を受けるため、2次元アドレス値(i、j)に
対しi+jが偶数のもの同志、奇数のもの同志は影響を
及ぼし合うことはない。第3図(a)に各点の物理的な
位置を示す。′XO“で示したのがi+jが偶数、1Δ
“で示したのが奇数である格子点である。従ってまずゝ
ゝ○”で示した点全全て更新し、次にΔ“で示した点を
全て更新するという順になるように、アドレスe発生f
nは、全格子点の処理をパイプライン処理により実行で
きる。
第3図(b)は、各点の値が上下左右と斜め2方向の計
6近傍から影響金量ける例を表わした図である。これは
有限要素解析などによく現われる例である。このときは
i + j f 3で割った余9が0゜1.2となる点
(各々第3図(b)にゝゝ0“、Δ“。
ゝゝ口″で示す)に分類すれば、先程の例と同様にパイ
プライン処理が可能である。
以上の手続金まとめると、次の(6)のようになる。
2次元配列テータのサイズ1IxJ、データ全分類する
数にとおく。
1)  k=o、1,2.−−−、に−1に対し2) 
、 3)を行う。
2)2次元アドレス(i、j)  (0<i〈I 。
o<」くJ)を生成する。
3) もしi+jiKで割った余りがkに等しけれは点
(i、j)を更新する。   ・・・・・・(6)〔発
明が解決しようとする問題点〕 上述した従来の技術では格子点データをパイプライン処
理する場合、当然パイプラインの流れに見合う速度でデ
ータを供給しなければならない。
しかし、前述の1)〜3)の処理をソフトウェアにょ゛
り実行していたため、アドレス計算に時間がかかシ、デ
ータの供給がネックとなって処理速度が向上しないとい
う問題があった。
本発明の目的は、このアドレス生成を高速に行う回路を
提供することにある。
〔問題点を解決するための手段〕
本発明のアドレス生成回路は2次元配列データの縦方向
サイズ、横方向サイズおよびデータの分類数を表わす信
号を各々入力する第1.第2および第3の入力レジスタ
と、 第1.第2の入力レジスタの縦方向サイズおよび横方向
サイズを表わす信号、および外部より入力されるアドレ
ス要求信号により、前記2次元配列データをラスタ走査
したときの2次元アドレスを表わす2つの信号、1次元
アドレスを表わす信号、およびラスタアドレスの生成終
了を表わす信号を出力するラスタアドレス生成回路と、
定数XX□“と、インクリメンタの出力とのうち1つを
選択するマルチプレクサと、 前記マルチプレクサの出力信号を保持するデータレジス
タと、 前記アークレジスタの出力信号に値ゝゝl// 全加え
てその値全前記マルチプレクサに出力するインクリメン
タと、 前記インクリメンタの出力値と、データの分類数を表わ
す信号とを比較する第1のコンパレータと、 前記データの分類数を表わす信号と、第1のコンパレー
タの出力信号と前記生成終了を表わす信号とを入力とし
、前記マルチプレクサと前記データレジスタと前記ラス
タアドレス生成回路を制御する制御回路と、 前記ラスタアドレス生成回路からの2次元アドレスを表
わす2つの信号の和を求める加算器と、前記加算器の出
力値を、データの分類数を表わす信号の値で割った余り
を求め剰余演算器と、前記データレジスタの出力信号と
、前記剰余演算器の出力信号全比較する第2のコンパレ
ータと、前記ラスタアドレス生成回路の出力のうち、1
次元アドレスを表わす信号を第2のコンパレータの比較
信号により外部へ出力する出力レジスタとを有している
〔実施例〕
次に本発明の実施例について図面を参照して詳細に説明
する。
第1図は本発明の一実施例を示す。第1図において、本
発明の一実施例は2次元配列データに対する処理におけ
るアドレス生成回路で、2次元配列データの縦方向サイ
ズ、横方向サイズおよびデータの分類数を表わす信号Z
oo、101,102を保持する第1.第2および第3
の入力レジスタ10.11および12に有している。こ
の第1゜第2の入力レジスタ10,11はラスタアドレ
ス生成回路13に接続されておシ、第3の入力レジスタ
12は制御回路14、第1のコンパレータ18および剰
余演算器20に接続されている9、ラスタアドレス生成
回路13は第1.第2の入力レジスタ10,11の出力
信号103.104と、制御回路12の出力信号121
、及び外部より入力される7ドレス要求信号122を入
力することにより2次元配列データをラスタ走査したと
きの2次元アドレスを表わす2つの信号113,114
.1次元アドレスを表わす信号115、およびラスタア
ドレスの生成終了を表わす信号11tl出力するように
構成されている。制御回路14は第3の入力レジスタ1
2の出力信号105と、第1のコンパレータ18の出力
信号112と、ラスタアドレス生成回路13の出力のう
ち生成終了を表わす信号116f!:入力することによ
りマルチプレクサ15とデータレジスタ16とラスタア
ドレス生成回路13を制御するように構成されている。
マルチプレクサ15は定数X″0“とインクリメンタ1
7の出力のうち1つを、制御回路14からの信号106
により選択し、データレジスタ16はマルチプレクサ1
5の出力信号109を入力し、これを制御回路14から
の信号107により保持するように構成されている。
インクリメンタ17はデータレジスタ16の出力信号1
10に値ゝ1〃を加えて出力するように構成されている
。第1のコンパレータ18はインクリメンタ17の出力
信号111と、第3の入力レジスタ12の出力信号10
5とを比較し、一致すれば値″X1“、不一致であれば
値″XO”’e出力するように構成されている。加算器
19はラスタアドレス生成回路13の出力のうち、2次
元アドレス要求Jを表わす2つの信号113,114を
入力し、両者の和を求めるように構成され゛、剰余演算
器20は加算器19の出力値117を、第3のレジスタ
12の出力値105で割った余1−求め、出力するよう
に構成されている。第2のコンパレータ21はデータレ
ジスタ16の出力信号110と、剰余演算器2oの出力
信号118を比較し、一致すれば値ゝlll金、不一致
であれば値%% () //を出力するように構成され
ている。更に出力レジスタ22はラスタアドレス生成回
路13の出力のうち、1次元アドレスを表わす信号11
5を入力し、これ金弟2のコンパレータ21の出力信号
119により保持し、外部へ出力するように構成されて
いる。
次に、本発明の一実施例であるアドレス生成回路の動作
について詳細に説明する。
本実施例は、2次元配列データのサイズ■とJ。
データの分類数l(そして、アドレス要求を表わす信号
100.101.102.122金入力とすると、それ
らの信号100.101.102が入力レジスタ10,
11.12に各々保持される。
入力レジスタ12からの信号105は制御回路14に供
給嘔れ、制御回路14の信号106によりマルチプレク
サ15を選択し、出力信号109?!−値ゝ0″とし、
これがデータレジスタ16に保持される。信号110は
インクリメンタ17でその値にゝゝl“が加えられ、信
号111としてマルチプレクサ15に送出する。信号1
11と信号105との値はコンパレータ18と比較され
、一致してい扛ば値ゝゝl″、不一致であれば値′XO
〃を信号112として出力され、制御回路14に送られ
る。
コンパレータ18からの信号1!2の値ゝo〃が制御回
路14へ入力されると、制御回路14は信号106によ
り、マルチプレクサ15の選択を信号111が入力さn
るように切9換える。
以上の動作により、データの分類を表わす信号110の
値は、0,1,2.−−−、に−1となる。
K個の値が出力されると、コンパレータ18は値ゝ1“
を信号112により制御回路14へ入力し、更に制御回
路14はデータレジスタ16からの出力を停止させる。
ここまでが(6)に示した手続きの1)に該当している
一方、ラスタアドレス生成回路13は、2次元配列デー
タのサイズI、J’i表わす信号103゜104と、制
御回路14からの信号121と、アドレス要求信号12
2を入力とし、配列をラスタ走査順にアクセスする場合
の、2次元アドレスを表わす信号113と114.1次
元アドレスを表わす信号115.そして生成終了を表わ
す信号116i出力する。この動作は(6)に示した手
続きの2)に該当している。ラスタアドレス生成回路1
3の詳細については、後に第2図を用いて説明する。
ラスタアドレス生成回路を表わす信号116が制御回路
14に入力されると、制御回路14は信号107により
データレジスタ16にデータを取り込ませる。これは、
信号116とデータの分類を表わす信号110との間で
、同期をとっていることを意味する。
2次元アドレスを表わす信号113と114は加算器1
9では■とJの和が求められ、信号117として出力す
る。信号117と第3の入力レジスタ12からの信号1
05とは剰余演算器2oで(1+J)をKで割った余り
を求められ信号118として出力する。
データの分類を表わす信号110と、剰余演算器20の
出力信号118とはコンパレータ21で比較され、一致
していれば値11″、不一致であれば値ゝゝ0“全出力
する。
ラスタアドレス生成回路13からの1次元アドレス値?
表わす信号115は出力レジスタ22に入力され、コン
パレータ21の出力信号119の値がゝ1“ならばその
入力信号を保持し、信号120として外部へ出力する。
以上、モジー−ル19〜22の動作は(6)の手続のう
ち3)の部分に該当している。
次に、第2図は本実施例におけるラスタアドレス生成回
路13を示す。第2図において、ラスタアドレス生成回
路は、配列のサイズI、J=i表わす信号103.10
4と、制御回路14からの信号121、そしてアドレス
要求を表わす信号122とを入力とする。
マルチプレクサ31は定数10″ データレジスタ32
の出力信号113.インクリメンタ33の出力信号20
6のうち1つを制御回路3oからの信号200により選
択し、信号205として出力する。データレジスタ32
は信号205’に入力とし、これを制御回路30からの
信号201により保持し、信号113として出力する。
インクリメンタ33は信号113に値11“を加え、信
号206として出力する。コンパレータ34は信号20
6と信号103の値を比較し、一致していれば値ゝゝ1
“、不一致であれば値ゝゝ0’/j、−信号207とし
て出力する。
次に、マルチプレクサ35は定数X″0“とインクリメ
ンタ37の出力信号210のうち1つを制御回路30か
らの出力信号202によシ選択し、信号209として出
力する。データレジスタ36は信号209を入力とし、
これを制御回路30からの信号201により保持し、4
g号114として出力する。インクリメンタ37は信号
114に値ゝ1“を加算し、結果を信号210として出
力する。コンパレータ38は(q号210と信号104
の値を比較し、一致していれば値ゝゝl″、そうでなけ
れば値ゝゝ0“を信号211として出力する。
制御回路30は、信号121と122.コンパレータ3
4の出力信号207.そしてコンパレータ38の出力信
号211を入力とし、マルチプレクサ31と35に対し
て各々制御信号200と202を、またデータレジスタ
32と36に対して、制御信号201を出力する。
まず、アドレス要求信号122が有効でない場合、制御
信号201により、データレジスタ32と36は何も保
持せず、ラスタアドレスの生成は停止している状態にあ
るものとする。以下では、信号122が有効である場合
について説明する。
ラスタアドレス生成の起動となる信号121が入力され
ると、制御回路30は、信号200によりマルチプレク
サ31の選択金値”0“とし、信号202によりマルチ
プレクサ35の選択を値ゝゝ0“とする。更に信号20
1よりデータレジスタ32.36は各入力信号を保持す
る。コンパレータ34.38からの信号207.211
を受けとると、制御回路30は信号200.202によ
り、各マルチプレクサの選択を切換える。具体的には、
マルチプレクサ31は信号113k、マルチプレクサ3
5は信号210を選択するようにする。この結果、信号
113,114の値は、各々次のような数列となる。
信号113 : 0 、 O、O、−−−−−信号11
4 : 0 、1 、2 、−−一一−次に、信号11
4からJ個目(値は“J−17/)の信号が出力される
とコンパレータ38の出力信号がゝl“となる。これに
対し制御回路3oは、信号202により、再びマルチプ
レクサ35の選択を値ゝゝ0“に切換え、モジュール3
5〜38に関しては、以上の動作をくυ返すように制御
する。
また一方、信号200により、マルチプレクサ31の選
択を信号113から信号206に切換え、次に信号21
1の値が10“となったら、再びマルチプレクサの選択
を信号113に戻す。以上の動作を、コンパレータ34
の出力信号207の値がゝ゛1“となるまで実行すると
、信号113,114の値は次のような数列となる。
信号113 : O,−−−,0,1,−−−,1,〜
 、 I−1、−−−、l−11−m−」 ニー−」 
   L−m−」5個   J@      5個 信号114 : 0.〜.J−1.0.〜.J−1.−
−−.0.〜.J−11個 ゆえに、2次元配列テータをラスタ走査する際の2次元
アドレス値が得られる。
次に、乗算器39は信号104と信号113の積を求め
、結果を信号212として出力し、加算器40は信号1
14と信号212の和を求め、信号115として出力す
る。この乗算器39と加算器40により2次元アドレス
値から1次元アドレス値が求められる。
ラスタアドレスの生成は、コンパレータ34の出力信号
207の値がX1″となった時点で終了し、制御回路3
0が生成終了を表わす信号116を出力する。
〔発明の効果〕
以上説明したように、本発明のアドレス生成回路はアド
レス生成が高速化され、更に、他の処理装置の処理負荷
も、アドレス計算が不要となる分だけ春減することがで
きる、という効果がある。
【図面の簡単な説明】
第1図は本発明の一実施例であるアドレス生成回路を示
すブロック図、第2図は本発明の一実施例におけるラス
タアドレス生成回路ケ示すブロック図、第3図は2次元
配列テータを位置によって分類した例を示す図である。 10.11.12・・・・・・入力レジスタ、13・・
・・・・ラスタアドレス生成回路、14.30・・・・
・・制御回路、15.31.35・・・・・・マルチプ
レクサ、16゜32.36°°゛°°データレジスタ、
17.33・・・・・・インクリメンタ、18,21,
34.38・・・・・・コンパレータ、19.40・・
・・・・加算器、20・・・・・・剰余演算器、22・
・・・・・出力レジスタ、39・・・・・・乗算器。 代理人 弁理士  内 原   音

Claims (1)

  1. 【特許請求の範囲】 2次元配列データの縦方向サイズ、横方向サイズおよび
    データの分類数を表わす信号を各々入力する第1、第2
    および第3の入力レジスタと、第1、第2の入力レジス
    タの縦方向サイズおよび横方向サイズを表わす信号、お
    よび外部より入力されるアドレス要求信号により、前記
    2次元配列データをラスタ走査したときの2次元アドレ
    スを表わす2つの信号、1次元アドレスを表わす信号お
    よびラスタアドレスの生成終了を表わす信号を出力する
    ラスタアドレス生成回路と、 定数“0”と、インクリメンタの出力とのうち1つを選
    択するマルチプレクサと、 前記マルチプレクサの出力信号を保持するデータレジス
    タと、 前記データレジスタの出力信号に値“1”を加えてその
    値を前記マルチプレクサに出力するインクリメンタと、 前記インクリメンタの出力値と、データの分類数を表わ
    す信号とを比較する第1のコンパレータと、 前記データの分類数を表わす信号と、第1のコンパレー
    タの出力信号と前記生成終了を表わす信号とを入力とし
    、前記マルチプレクサと前記データレジスタと前記ラス
    タアドレス生成回路とを制御する制御回路と、 前記ラスタアドレス生成回路からの2次元アドレスを表
    わす2つの信号の和を求める加算器と、前記加算器の出
    力値を、データの分類数を表わす信号の値で割った余り
    を求める剰余演算器と、前記データレジスタの出力信号
    と、前記剰余演算器の出力信号を比較する第2のコンパ
    レータと、前記ラスタアドレス生成回路の出力のうち、
    1次元アドレスを表わす信号を第2のコンパレータの比
    較信号により外部へ出力する出力レジスタとを含むこと
    を特徴とするアドレス生成回路。
JP416988A 1988-01-11 1988-01-11 アドレス生成回路 Granted JPH01180052A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP416988A JPH01180052A (ja) 1988-01-11 1988-01-11 アドレス生成回路

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP416988A JPH01180052A (ja) 1988-01-11 1988-01-11 アドレス生成回路

Publications (2)

Publication Number Publication Date
JPH01180052A true JPH01180052A (ja) 1989-07-18
JPH0556542B2 JPH0556542B2 (ja) 1993-08-19

Family

ID=11577234

Family Applications (1)

Application Number Title Priority Date Filing Date
JP416988A Granted JPH01180052A (ja) 1988-01-11 1988-01-11 アドレス生成回路

Country Status (1)

Country Link
JP (1) JPH01180052A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05108581A (ja) * 1991-10-17 1993-04-30 Fujitsu Ltd データ転送制御方式
US5765202A (en) * 1995-09-08 1998-06-09 Fujitsu Limited Parallel computer of a distributed storage type

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05108581A (ja) * 1991-10-17 1993-04-30 Fujitsu Ltd データ転送制御方式
US5765202A (en) * 1995-09-08 1998-06-09 Fujitsu Limited Parallel computer of a distributed storage type

Also Published As

Publication number Publication date
JPH0556542B2 (ja) 1993-08-19

Similar Documents

Publication Publication Date Title
Wu et al. A high-performance CNN processor based on FPGA for MobileNets
JP6821002B2 (ja) 処理装置と処理方法
Zhang et al. DNNExplorer: a framework for modeling and exploring a novel paradigm of FPGA-based DNN accelerator
KR102544275B1 (ko) 콘볼루션 신경망 트레이닝 실행용 장치와 방법
Lavin et al. Fast algorithms for convolutional neural networks
JP2020526830A (ja) 演算アクセラレータ
Kästner et al. Hardware/software codesign for convolutional neural networks exploiting dynamic partial reconfiguration on PYNQ
KR100264633B1 (ko) 준난수 생성 장치 및 방법, 및 함수 f의 다중 적분 계산 장치 및 방법
KR20190003610A (ko) 콘볼루션 신경망 정방향 연산 실행용 장치와 방법
JP7317885B2 (ja) チップ用のメモリテスト方法と装置、電子機器、コンピュータ可読記憶媒体及びコンピュータプログラム
JP2022543332A (ja) データ処理
Meng et al. Automatic generation of high-performance convolution kernels on ARM CPUs for deep learning
Wang et al. A scalable FPGA engine for parallel acceleration of singular value decomposition
Meng et al. PPOAccel: A high-throughput acceleration framework for proximal policy optimization
JPH01180052A (ja) アドレス生成回路
JPH02206867A (ja) 分類学習装置
JP2020080048A (ja) 並列処理装置およびプログラム
Zarándy et al. CASTLE: an emulated digital CNN architecture design issues, new results
JPH0764766A (ja) 並列計算機における最大・最小値演算方法
CN111340215A (zh) 一种网络模型推理加速方法、装置、存储介质和智能设备
Huang et al. Accelerating Point Clouds Classification in Dynamic Graph CNN with GPU Tensor Core
US11995148B2 (en) Electronic apparatus for performing deconvolution calculation and controlling method thereof
WO2024185271A1 (ja) 演算処理装置及び演算処理方法
Huang et al. Binary Image Algebra and Digital Optical Cellular Image Processors
Chiu et al. Implanting Machine Learning Accelerator with Multi-Streaming Single Instruction Multiple Data Mechanism to RISC-V Processor