JPS61150067A - 演算装置 - Google Patents

演算装置

Info

Publication number
JPS61150067A
JPS61150067A JP27720784A JP27720784A JPS61150067A JP S61150067 A JPS61150067 A JP S61150067A JP 27720784 A JP27720784 A JP 27720784A JP 27720784 A JP27720784 A JP 27720784A JP S61150067 A JPS61150067 A JP S61150067A
Authority
JP
Japan
Prior art keywords
instruction
register
input
output
multiplication
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP27720784A
Other languages
English (en)
Inventor
Shigeo Asahara
重夫 浅原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP27720784A priority Critical patent/JPS61150067A/ja
Publication of JPS61150067A publication Critical patent/JPS61150067A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/76Architectures of general purpose stored program computers
    • G06F15/80Architectures of general purpose stored program computers comprising an array of processing units with common control, e.g. single instruction multiple data processors
    • G06F15/8053Vector processors

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Theoretical Computer Science (AREA)
  • Computing Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Complex Calculations (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、科学技術計算において重要な大規模行列の乗
算を行う演算装置に関するものである。
従来の技術 近年、科学技術計算分野の有限要素法2回路解析を行う
際には1行列演算、特に大規模行列の乗算を高速に行う
ことが必要になる。
以下に従来の演算装置(たとえば、モトローラ社製MO
68000等のマイクロプロセッサ)についてその構成
を図を参照にしながら説明する。
第3図は、従来の演算装置の構成を示すブロック図であ
る。
入力部12は、制御部13の入力指示により。
演算命令と演算データを入力する。14は、入力された
演算データや、演算結果を格納するレジスタ群である。
15は、2個の演算データを入力するとその加算結果を
出力する加算器である。16は、2個の演算データを入
力すると乗算結果を出力す乗算器である。13ば、入力
された演算命令を解沢し、その実行に必要な入力指示、
加算指示。
乗算指示、レジスタ群と入力部、出力部1乗算器。
加算器等の転送指示などの制御指示を各部に発生する制
御部である。また17は、前記制御部の出力指示により
、レジスタの内容を外部に出力する出力部である。
以上のように構成された従来の演算装置について次の動
作を説明する。
今、2個のnXn行列A=(、aig)とB=Cbiq
)の乗算を行う場合について考察する。
第4図は、その処理の流れ図を示してものである。
乗算結果を表わすnXn行列をC=(cig)とすれば
l C111C211C311”−”1Cn11CI 
2 IC22IC・・・・・ CC・・・・・・ C・
・・・・ C32+     +   n2+   1
3+     +   n1+     +   nn
の順に演算結果が外部に出力される。一般にC1kは、
Σ aij  Jk  で与えられるが、その計算過】
=1 程を以下に記述する。
まず、途中の計算結果を格納するBレジスター9をクリ
アした後、ailとbljを入力部を通じて乗算器に入
力しaiIXbliの乗算を行い、その出力をAレジス
ター8の内容を加゛算器に入力し。
その加算結果をAレジスター8に格納する。同様にして
ai2Xb2jの乗算を行った後1乗算結果    ゛
をAレジスタに格納し、Bレジスター9の内容にを求め
、その時点でCレジスタ2oを出力すればcij  が
求められる。
発明が解決しようとする問題点 しかしながら上記のような構成では、データの入力、加
算1乗算の処理は、遂次性われ、データの入力時間をt
19乗算時間をt2.加算時間をt3とすれば、n2×
2nxt +n5×(t2+t3)の演算時間が必要で
ある。大規模な行列の乗算については、非常な演算時間
を有するという問題点を有していた。
本発明は上記問題点に鑑み、大規模行列の乗算を高速に
演算する演算装置を提供するものであ″る。
問題点を解決するだめの手段 上記問題点を解決するために本発明の演算装置は、制御
部の入力指示により、入力部を通じて入力された被乗算
行列と乗算ベクトルとを各々格納する2個のデータメモ
リと、各々の前期データメモリから読み出された2個の
データを制御部の乗算指示により乗算し1乗算結果を出
力する乗算器と、前記乗算結果と制御部の加算指示によ
り内積レジスタの内容との加算を行い、加算結果を前記
内積レジスタに出力する加算器と、前記入力指示と前記
読出し指示、前記乗算指示と前記加算指示と、出力部に
内積レジスタの内容を外部に出力する出力指示とを行う
制御部という構成を備えたものである。
作  用 本発明は上記した構成によって、データの入力回数を減
らし2乗算と加算を同時並行して行うことにより行列乗
算の演算時間を大幅に短縮することとなる。
実施例 以下2本発明の一実施例の演算装置について。
図面を参照しながら説明する。
第1図は本発明の実施例のブロック構成図を示すもので
ある。第1図において、1は、入力部であり、制御部の
入力指示により乗算すべき行列の要素を入力し、データ
メモリ2に転送する。ここでデータメモリ部は第1の被
演算行列全体を保持するデータメモIJ Aと第2の乗
算行列のどれかの1列を格納するデータメモIJ Bと
から構成される。
データメモリ2は2行列の要素を制御部の指示により遂
次乗算器に出力する。乗算器2は2個の入力データの乗
算を行い、その結果を加算器3に出力する。加算器3は
、前記乗算結果と内積レジスタ5の内容との加算結果を
内積レジスタに加算し、その加算結果を1713積レジ
スタ6に出力する。
制御部4は、前記入力部に入力指示を、前記データメモ
リに読み出し指示を、前記乗算器に乗算指示を、前記加
算器に加算指示を、前記出力部に出力指示を琵して、演
算装置各部の動作を指示する。
読出シアドレスレジスタ7と8は、データメモリ八とデ
ータメモリBの次に読出すべきデータのアドレスを保持
し、ベクトル長レジスタ6は、第1の被演算行列の行数
を保持している。また列数レジスタは第1の被演算行列
の列数を保持している。
以上のように構成された演算装置について以下にその動
作を説明する。
nxm行列A = Ca i g ]とmxr行列B=
CbiDの積を計算する場合について考察する。
ただし1乗算結果をnxr行列C= (c i j )
で表すものとする。
第2図は1本演算装置の処理の流れ図を示すものである
まず1行列Aのすべての要素をデータメモIJ Aに2
行列Bの第に列を、データメモIJ Bに制御の入力指
示により入力する。また、Aの行数mはベクトル長レジ
スタに保持されており、Aの列数nは列数レジスタに保
持されている。
aijとJkがデータメモリから制御部の指示によって
読み出されるが、そのアドレスは、邪制御部の読み出し
アドレスレジスタに保持されている。
読み出されたaijどbjkは乗算器に送られ1乗算が
なされる。これと並行して乗算器の出力と内積レジスタ
の内容が加算され、その加算結果が内積レジスタに保持
される。
次にaij−4−1とJ+1kについて同様の操作がな
され、この操作はj=1.2・・・・・2mについて繰
返される。この結果、Aiの第1行とBの第1列の内積
すなわちcij  が求められる。これは出力部を通じ
て出力される。
次にAの第1−1−1行とBの第1列について同様の演
算がなされ、ci+1iが出力される。従って。
Aの第1列から第n列まで11@番にBの第1列との内
積が取られ、Cの第1列の要素が、 cl i 、c2
j。
・・・・・、cnjの順に処理される。このようにして
Cに第1列の要素が求められた後、入力部から行列Bの
第j−)−1列bj−1−1の入力が行われ、データメ
モリBにはbj+1が読み込まれ、Cの第i+1列の演
算が行れる。
従って、上記の操作をすべてのBの列bj(i=1.2
.・・・・・、n)について行うことにより1行部を通
じて入力された被演算行列と乗算ベクトルとを各々格納
する2個のデータメモリ部と、各々の前記データメモリ
から読み出された2個のデータを制御部の乗算指示によ
り乗算し2乗算結果を出力する乗算器と、制御部の加算
指示により前記乗算結果と内積レジスタの内容との加算
を行い。
加算結果を前記内積レジスタに出力する加算器と。
前記内積レジスタの内容を制御部の出力指示により外部
に出力する出力部と、前記読出し指示と前記乗算指示と
前記加算指示と前記出力指示とを発生する制御部を備え
たように構成すれば、入力時間をt11乗算−間をt2
.加算時間をt3とすれば。
n = m = rのとき演算時間は、 (n −1−
n) t1+max(n2t2. n2(n  1 )
 ts )となり、従来のものに比べて、大幅に節約さ
れる。
この演算装置を複数個接続し、各演算装置に行列Bのn
個の列を分担して処理させ、同時並列に。
演算を行えば、計算時間は更に、削減することができる
【図面の簡単な説明】
第1図は本発明の一実施例における演算装置のブロック
図、第2図はその処理の流れ図、第3図は従来の演算装
置のブロック図、第4図はその処理の流れ図である。 1・・・・・・入力部、2・・・・・・データメモリ、
3・・・・・・乗算器、2・・・・・・加算器、5・・
・・・・内積レジスタ、7・・・・・読出しアドレスレ
ジスタ1.8・・・・・・読出しアドレスレジスタ2.
9・・・・・・列数レジスタ、10・・・・・・ベクト
ル長レジスタ、11・・・・・・中央制御部。 代理人の氏名 弁理士 中 尾 敏 男 ほか1名第2
図 第3図

Claims (2)

    【特許請求の範囲】
  1. (1)制御部の入力指示により、入力部を通じて入力さ
    れた被乗算行列と乗算ベクトルとを各々格納する2個の
    データメモリ部と、各々の前記データメモリから読み出
    された2個のデータを制御部の乗算指示により乗算し、
    乗算結果を出力する乗算器と、制御部の加算指示により
    前記乗算結果と内積レジスタの内容との加算を行い、加
    算結果を前記内積レジスタに出力する加算器と、前記内
    積レジスタの内容を制御部の出力指示により外部に出力
    する出力部と、前期読出し指示と前期乗算指示と前記加
    算指示と前記出力指示とを発生する制御部を備えたこと
    を特徴とする演算装置。
  2. (2)制御部において、データメモリ部の読出しアドレ
    スが、読み出しアドレスレジスタに保持され、読出し指
    示と乗算指示と加算指示を、ベクトル長レジスタに保持
    された回数だけ連続的に行った後、出力指示を行うとい
    う操作を列数レジスタに保持された回数だけ繰返すこと
    を特徴とする特許請求の範囲第1項記載の演算装置。
JP27720784A 1984-12-25 1984-12-25 演算装置 Pending JPS61150067A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP27720784A JPS61150067A (ja) 1984-12-25 1984-12-25 演算装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP27720784A JPS61150067A (ja) 1984-12-25 1984-12-25 演算装置

Publications (1)

Publication Number Publication Date
JPS61150067A true JPS61150067A (ja) 1986-07-08

Family

ID=17580299

Family Applications (1)

Application Number Title Priority Date Filing Date
JP27720784A Pending JPS61150067A (ja) 1984-12-25 1984-12-25 演算装置

Country Status (1)

Country Link
JP (1) JPS61150067A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018206128A (ja) * 2017-06-06 2018-12-27 富士通株式会社 演算処理装置、情報処理装置及び演算処理装置の制御方法
JP2020526830A (ja) * 2017-07-07 2020-08-31 華為技術有限公司Huawei Technologies Co.,Ltd. 演算アクセラレータ

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018206128A (ja) * 2017-06-06 2018-12-27 富士通株式会社 演算処理装置、情報処理装置及び演算処理装置の制御方法
JP2020526830A (ja) * 2017-07-07 2020-08-31 華為技術有限公司Huawei Technologies Co.,Ltd. 演算アクセラレータ
US11321423B2 (en) 2017-07-07 2022-05-03 Huawei Technologies Co., Ltd. Operation accelerator
US11720646B2 (en) 2017-07-07 2023-08-08 Huawei Technologies Co., Ltd. Operation accelerator

Similar Documents

Publication Publication Date Title
JP5408913B2 (ja) 高速かつ効率的な行列乗算ハードウェアモジュール
JPH07141175A (ja) アクティブメモリおよび処理方式
US20180113840A1 (en) Matrix Processor with Localized Memory
JPS61160176A (ja) ベクトル処理装置
JPS61150067A (ja) 演算装置
US11281745B2 (en) Half-precision floating-point arrays at low overhead
US20200371785A1 (en) Computing device and neural network processor incorporating the same
JP3333779B2 (ja) 行列演算装置
JPH0345420B2 (ja)
US20180349061A1 (en) Operation processing apparatus, information processing apparatus, and method of controlling operation processing apparatus
JPS5969845A (ja) デ−タ駆動制御方式
JPS6310263A (ja) ベクトル処理装置
JPH1063647A (ja) 行列演算装置
JPH01119861A (ja) ディジタル信号処理用lsi
CN110300956B (zh) 数据处理装置中的乘-累加
JPS58163061A (ja) 並列画像処理プロセッサ及び装置
Hasan et al. FPGA-based vector processing for solving sparse sets of equations
JPS6252899B2 (ja)
JPS6058502B2 (ja) 情報処理システム
JP2000339296A (ja) 連立一次方程式の求解方法及びその計算装置
SU623204A1 (ru) Устройство дл умножени двух празр дных чисел
JPS60201472A (ja) マトリクス積計算装置
JPH0241563A (ja) ベクトル処理方式
JPS6172363A (ja) 相関関数の演算回路
JPS6367625A (ja) デ−タ処理装置