JPH08212168A - アレイプロセッサ - Google Patents

アレイプロセッサ

Info

Publication number
JPH08212168A
JPH08212168A JP7039102A JP3910295A JPH08212168A JP H08212168 A JPH08212168 A JP H08212168A JP 7039102 A JP7039102 A JP 7039102A JP 3910295 A JP3910295 A JP 3910295A JP H08212168 A JPH08212168 A JP H08212168A
Authority
JP
Japan
Prior art keywords
processor
bit
processor element
data
array
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP7039102A
Other languages
English (en)
Inventor
Nobuo Takayanagi
信夫 高柳
Yoshihiro Yamada
義浩 山田
Shuichi Nakagami
修一 中上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Steel Corp
Original Assignee
Nippon Steel Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Steel Corp filed Critical Nippon Steel Corp
Priority to JP7039102A priority Critical patent/JPH08212168A/ja
Publication of JPH08212168A publication Critical patent/JPH08212168A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Executing Machine-Instructions (AREA)
  • Multi Processors (AREA)

Abstract

(57)【要約】 【目的】 アレイプロセッサ全体の処理速度を高速化で
きるようにする。 【構成】 アレイプロセッサ中にある4個のプロセッサ
要素1〜4のそれぞれに、自己のプロセッサ要素中のレ
ジスタ15n (n=1〜4)から出力されるキャリと隣
接するプロセッサ要素中のレジスタ15n-1 から出力さ
れるキャリとの何れかを選択するマルチプレクサ17n
を設け、例えば、1つのプロセッサ要素で演算されるデ
ータが4ビットになったときに上記マルチプレクサ17
n により隣接するプロセッサ要素中からのキャリ出力を
選択するように切り替えることにより、各プロセッサ要
素1〜4を結合して4ビットデータの各桁の演算をビッ
トパラレルに行うことができるようにし、各プロセッサ
要素1〜4の動作効率を常に高く維持することができる
ようにして、アレイプロセッサ全体の演算をより高速に
行うことができるようにする。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明はアレイプロセッサに関
し、特に、1つのLSI上に多数のプロセッサ要素を結
合して構成した単一命令多重データ型(SIMD型)の
アレイプロセッサに用いて好適なものである。
【0002】
【従来の技術】従来、多数のプロセッサ要素(プロセッ
サエレメント:PE)をアレイ状に設け、これら多数の
プロセッサ要素で並列演算を行うことにより、処理速度
を速くすることができるようにしたアレイプロセッサが
提案されている。そして、このような並列演算を実現す
るために、処理の制御にSIMD型(単一命令多重デー
タ型)の制御を用いたものがある。このSIMD型の制
御は、全てのプロセッサ要素で同一の命令を処理するよ
うにしたものである。
【0003】図3に、従来のアレイプロセッサの構成例
を示す。図3において、31、32、33、34はそれ
ぞれ第1〜第4のプロセッサ要素である。このように、
図3には4個のプロセッサ要素のみを示したが、実際に
は同様の構成を持つプロセッサ要素が多数マトリクス状
に配置されている。
【0004】上記各プロセッサ要素31、32、33、
34の構成において、5はレジスタ群であり、1ビット
のデータを格納するレジスタが8個備えられており、全
部で8ビットのデータを格納することができるようにな
っている。6はデータ読み出し用のゲート群であり、上
記8個のレジスタに対応して8個のゲートが設けられて
いる。そして、読み出し制御線(Read制御線)21を介
して送られてくる制御信号によって何れかのゲートが開
かれると、対応するレジスタから1ビットのデータがリ
ードバス8に読み出されるようになっている。
【0005】7はデータ書き込み用のゲート群であり、
これも上記8個のレジスタに対応して8個のゲートが設
けられている。そして、書き込み制御線( Write制御
線)20を介して送られてくる制御信号によって何れか
のゲートが開かれることにより、ライトバス9を介して
送られてくる1ビットのデータが対応するレジスタに書
き込まれるようになっている。
【0006】10、11は第1のラッチおよび第2のラ
ッチであり、それぞれ上記レジスタ群5からリードバス
8に読み出される1ビットのデータを一時保持する。1
2はAND回路、13はOR回路、14は全加算器、1
5は上記全加算器14から出力されるキャリ(次の桁へ
の繰り上がり)を保持するレジスタである。16はマル
チプレクサ(セレクタ)であり、上記AND回路12、
OR回路13および全加算器14から出力されるデータ
の中から何れかのデータを選択する。なお、上述のAN
D回路12、OR回路13、全加算器14、レジスタ1
5およびマルチプレクサ16によりALU(算術論理演
算器)が構成されている。
【0007】上記のように構成された各プロセッサ要素
31、32、33、34では、それぞれレジスタ群5か
ら1ビットごとに読み出されるデータを用いてビットシ
リアルで演算(AND回路12による論理積演算や、O
R回路13による論理和演算や、全加算器14による全
加算など)が行われるようになっている。
【0008】
【発明が解決しようとする課題】上記のような従来のア
レイプロセッサでは、各プロセッサ要素において並列化
効率が高い計算をしている間は、ビットシリアル演算で
も高速に処理を行うことが可能である。
【0009】しかし、大域的情報を計算する場合などに
おいて計算の終盤になると、一部のプロセッサ要素に処
理が集中してしまう。このため、計算の終盤において
は、計算に寄与しないプロセッサ要素の比率が高くな
り、並列化効率が低下するという問題があった。
【0010】しかも、各プロセッサ要素で計算したデー
タの総和や重心などの量を計算する場合には、計算の終
盤になるとデータの値が大きくなるため、1つのプロセ
ッサ要素でビット幅の大きいデータを扱う必要が生じ
る。このため、上記一部のプロセッサ要素のみでビット
幅の大きいデータにビットシリアル演算を施していたの
では、処理に非常に多くの時間がかかってしまうという
問題があった。
【0011】例えば、第1〜第4のプロセッサ要素31
〜34のデータを全て合計して、その演算結果を第4の
プロセッサ要素34に保持し、その後の演算をこの第4
のプロセッサ要素34に保持されたデータを用いて行う
こととすれば、第1〜第3のプロセッサ要素31、3
2、33は、途中から演算に寄与しなくなる。
【0012】一方、上述のようにして第4のプロセッサ
要素34に保持されたデータは、大きな値を有している
ことが多いため、そのデータはビット幅が大きくなって
いることが多い。このため、第4のプロセッサ要素34
におけるその後の演算においてビットシリアル演算を行
っていたのでは、非常に多くの時間がかかってしまうと
いう問題があった。
【0013】本発明は、このような問題を解決するため
に成されたものであり、アレイプロセッサを構成する各
プロセッサ要素を有効に活用して、全体の処理速度を高
速化できるようにすることを目的とする。
【0014】
【課題を解決するための手段】本発明のアレイプロセッ
サは、所定の演算を行う演算器を有するプロセッサ要素
が複数個アレイ状に配置されて成るアレイプロセッサに
おいて、上記アレイ状に配置された複数個のプロセッサ
要素のそれぞれに、自己のプロセッサ要素で得られる桁
上げ信号と隣接するプロセッサ要素で得られる桁上げ信
号のうちの何れかを選択して、それを自己のプロセッサ
要素中の上記演算器に供給する桁上げ信号選択手段を設
けたものである。
【0015】本発明の他の特徴とするところは、上記複
数個のプロセッサ要素で演算されているデータの大きさ
に応じて上記桁上げ信号選択手段の選択動作を制御する
制御手段を更に設けたものである。
【0016】本発明のその他の特徴とするところは、上
記複数個のプロセッサ要素における演算の並列度に応じ
て上記桁上げ信号選択手段の選択動作を制御する制御手
段を更に設けたものである。
【0017】本発明のその他の特徴とするところは、上
記アレイ状に配置された複数個のプロセッサ要素のう
ち、行方向に並べられた4個のプロセッサ要素が1つの
処理単位として構成され、上記桁上げ信号選択手段によ
り上記隣接するプロセッサ要素で得られる桁上げ信号が
選択されているときに、上記4個のプロセッサ要素が1
組として4ビットパラレル演算を行うように構成されて
いることを特徴とするものである。
【0018】本発明のその他の特徴とするところは、上
記アレイ状に配置された複数個のプロセッサ要素のう
ち、列方向に並べられた4個のプロセッサ要素が1つの
処理単位として構成され、上記桁上げ信号選択手段によ
り上記隣接するプロセッサ要素で得られる桁上げ信号が
選択されているときに、上記4個のプロセッサ要素が1
組として4ビットパラレル演算を行うように構成されて
いることを特徴とするものである。
【0019】本発明のその他の特徴とするところは、上
記制御手段が、上記隣接するプロセッサ要素で得られる
桁上げ信号を選択するように切り替えるときに、上記4
個のプロセッサ要素のうちの1つのプロセッサ要素に保
持されている4ビットデータを上記4個のプロセッサ要
素に1ビットずつ分配することを特徴とするものであ
る。
【0020】
【作用】本発明は上記技術手段より成るので、各プロセ
ッサ要素中の桁上げ信号選択手段により自己のプロセッ
サ要素で得られる桁上げ信号が選択されているときは、
各プロセッサ要素はそれぞれ独立してビットシリアル演
算を行うように動作するとともに、各桁上げ信号選択手
段により隣接するプロセッサ要素で得られる桁上げ信号
が選択されているときは、各プロセッサ要素が結合し
て、隣接するプロセッサ要素から伝搬されてくる桁上げ
信号を用いてビットパラレル演算を行うように動作する
ようになり、各プロセッサ要素を演算の終盤になるまで
有効に活用することができるようになる。
【0021】また、請求項2に記載の制御手段を設けた
場合には、各プロセッサ要素で演算されているデータの
大きさに応じてビットシリアル演算とビットパラレル演
算とが動的に切り替えられるようになる。
【0022】また、請求項3に記載の制御手段を設けた
場合には、各プロセッサ要素における演算の並列度に応
じてビットシリアル演算とビットパラレル演算とが動的
に切り替えられるようになる。
【0023】また、請求項4または5に記載のアレイプ
ロセッサによれば、各桁上げ信号選択手段により隣接す
るプロセッサ要素で得られる桁上げ信号が選択されてい
るときに、行方向または列方向に並べられた4個のプロ
セッサ要素により4ビットパラレル演算が行われるよう
になる。
【0024】また、上記制御手段を請求項6の記載のよ
うに構成した場合には、隣接するプロセッサ要素で得ら
れる桁上げ信号を選択するように切り替えられたとき
に、4ビットデータにおける各桁の演算が、4個のプロ
セッサ要素によりビットパラレルに行われるようにな
る。
【0025】
【実施例】本発明の一実施例を図面に基づいて説明す
る。図1は、本実施例によるアレイプロセッサの要部構
成を示す図である。なお、図1では4個のプロセッサ要
素を並列に接続したものを示しているが、これは、マト
リクス状の各セルに配置された多数のプロセッサ要素の
うちの4個を抜粋して示したものであるとする。
【0026】後述するように、図1に示すアレイプロセ
ッサは、ビットシリアル演算を行う4個のプロセッサ要
素1〜4を、演算の途中で、4ビットデータに対してビ
ットパラレル演算を行う1個のプロセッサ要素(以下、
4ビットPEと称す)に切り替えることができるように
構成したものである。
【0027】なお、4個のプロセッサ要素1〜4が1個
の4ビットPEに切り替えられる際には、1つのプロセ
ッサ要素に保持されている4ビットデータが各プロセッ
サ要素1〜4に1ビットずつ振り分けられる。このと
き、第1のプロセッサ要素1は最下位ビットの演算を担
当し、第4のプロセッサ要素4は最上位ビットの演算を
担当することになる。
【0028】以下、図1に示したアレイプロセッサの構
成について詳しく説明するが、図5に示した符号と同一
の符号を付したものは、同一の機能を有するものである
ので、重複する説明は省略する。なお、図1から明らか
なように、何れのプロセッサ要素1〜4も同様に構成さ
れているが、以下の説明を分かりやすくするために、各
符号の後に各プロセッサ要素1〜4の番号を付して区別
している。
【0029】本実施例では、各プロセッサ要素1〜4
は、それぞれ桁上げ信号選択手段としての第2のマルチ
プレクサ17n (n=1〜4)を具備している。この第
2のマルチプレクサ17n は、その一方の入力端子が自
己のプロセッサ要素で得られるキャリ(桁上げ信号)を
保持するレジスタ15n の出力端子に接続されるととも
に、他方の入力端子が下位のプロセッサ要素で得られる
キャリを保持するレジスタ15n-1 の出力端子に接続さ
れている。
【0030】ただし、第1のプロセッサ要素1における
マルチプレクサ171 については、それより下位のプロ
セッサ要素が存在しないので、上記他の入力端子はアー
スに接続されている。また、各マルチプレクサ17n
出力端子は、自己のプロセッサ要素中の全加算器14n
の入力端子に接続されている。
【0031】すなわち、各プロセッサ要素1〜4におけ
るマルチプレクサ17n は、自己のプロセッサ要素中の
レジスタ15n から出力されるキャリと、その下位のプ
ロセッサ要素中のレジスタ15n-1 から出力されるキャ
リとを入力し、それら2つの入力のうちの何れかを選択
して、それを自己のプロセッサ要素中の全加算器14n
に供給する。
【0032】各マルチプレクサ17n におけるキャリの
選択動作は、制御部19によって制御される。すなわ
ち、制御部19は、各プロセッサ要素1〜4を常に監視
している。そして、各プロセッサ要素1〜4に保持され
ているデータの大きさや、各プロセッサ要素1〜4にお
ける演算の並列度(演算に寄与しているプロセッサ要素
がどのくらいあるか)に応じて、制御線18を介して制
御信号を送ることにより各マルチプレクサ17n におけ
るキャリの選択動作を制御する。
【0033】例えば、制御部19は、1つのプロセッサ
要素で演算されるデータの大きさが4ビットに満たない
場合には、自己のプロセッサ要素からのキャリ出力(自
己のレジスタ15n からのキャリ出力)を選択するよう
に各マルチプレクサ17n を制御する。一方、1つのプ
ロセッサ要素で演算されるデータの大きさが4ビットで
ある場合は、下位のプロセッサ要素からのキャリ出力
(下位のレジスタ15n-1 からのキャリ出力)を選択す
るように各マルチプレクサ17n を制御する。
【0034】また、各プロセッサ要素1〜4のうち、演
算に寄与するプロセッサ要素が複数個ある場合には、自
己のプロセッサ要素からのキャリ出力を選択するように
各マルチプレクサ17n を制御する。一方、演算に寄与
するプロセッサ要素が1個のみである場合には、下位の
プロセッサ要素からのキャリ出力を選択するように各マ
ルチプレクサ17n を制御する。
【0035】制御部19は、上述のように各マルチプレ
クサ17n において下位のプロセッサ要素からのキャリ
出力を選択しているときは、図示しない通信機構を用い
て、1つのプロセッサ要素に格納されている4ビットの
データを各プロセッサ要素1〜4に1ビットずつ分散さ
せる。そして、各プロセッサ要素1〜4では、このよう
にして分散されたデータと下位のプロセッサ要素から伝
搬されてくるキャリとを用いて演算を行う。
【0036】これにより、各マルチプレクサ17n にお
いて自己のプロセッサ要素からのキャリ出力を選択して
いるときは、各プロセッサ要素1〜4は、それぞれ独立
してビットシリアル演算を行うように動作する。一方、
各マルチプレクサ17n において下位のプロセッサ要素
からのキャリ出力を選択しているときは、各プロセッサ
要素1〜4が4ビットデータの各桁の演算を下位の桁か
ら伝搬されてくるキャリを用いて並列に行うこととな
る。よって、各プロセッサ要素1〜4が結合して1個の
4ビットPEとして動作することになる。
【0037】ここで、各プロセッサ要素1〜4が1個ず
つ独立して動作する場合と、各プロセッサ要素1〜4が
結合して1個の4ビットPEとして動作する場合とにつ
いて、それぞれの動作を図1に基づいて説明する。
【0038】まず、各プロセッサ要素1〜4が1個ずつ
独立して動作する場合について説明する。最初に、レジ
スタ群5n の8個のレジスタのうち、データを読み出す
レジスタのアドレスが指定され、読み出し制御線21を
介して制御信号が送られることにより、データ読み出し
用ゲート群6n の中の何れかのゲートが開かれる。これ
により、指定されたアドレスのレジスタからデータがリ
ードバス8n に読み出される。
【0039】こうしてリードバス8n に読み出されたデ
ータは、第1のラッチ10n に保持される。同様にし
て、レジスタ群5n の中の何れかのレジスタからデータ
が再び読み出され、それが第2のラッチ11n に保持さ
れる。そして、これらの各ラッチ10n 、11n に保持
されたデータを用いた演算が、AND回路12n 、OR
回路13n および全加算器14n により行われる。ここ
で、全加算器14n により加算が行われるときは、自己
のプロセッサ要素中におけるレジスタ15n からのキャ
リ出力が第2のマルチプレクサ17n により選択され
る。
【0040】そして、ALUの出力段にある第1のマル
チプレクサ16n により、上述したAND回路12n
OR回路13n 、全加算器14n のうちの何れかの演算
器とライトバス9n とが接続される。すると、その接続
された演算器の演算結果がライトバス9n に出力され
る。
【0041】それと同時に、その演算結果のデータを書
き込むレジスタのアドレスが指定され、書き込み制御線
20を介して制御信号が送られることにより、データ書
き込み用ゲート群7n の中の何れかのゲートが開かれ
る。これにより、上記ライトバス9n に出力された演算
結果のデータが、上記指定されたアドレスのレジスタに
書き込まれる。
【0042】次に、各プロセッサ要素1〜4が結合して
1個の4ビットPEとして動作する場合について説明す
る。なお、ここでは、全加算器14n において加算を行
う場合について説明する。最初に、上述したのと同様に
して各プロセッサ要素1〜4のレジスタ群5n から1ビ
ットのデータが順次読み出され、この読み出されたデー
タが各プロセッサ要素1〜4の第1のラッチ10n およ
び第2のラッチ11n に保持される。
【0043】また、各プロセッサ要素1〜4のレジスタ
15n がスルー状態(レジスタ15n への入力が即座に
レジスタ15n の出力に現れる状態)にされるととも
に、各プロセッサ要素1〜4のマルチプレクサ17n
より下位のプロセッサ要素におけるレジスタ15n-1
らのキャリ出力が選択される。これにより、下位のプロ
セッサ要素からその上位のプロセッサ要素にキャリが伝
搬される。
【0044】これにより、各プロセッサ要素1〜4の全
加算器14n では、上記第1のラッチ10n および第2
のラッチ11n に保持されたデータと下位のプロセッサ
要素のレジスタ15n-1 から伝搬されてくるキャリとを
用いて加算が行われる。
【0045】そして、各プロセッサ要素1〜4中の第1
のマルチプレクサ16n により、全加算器14n とライ
トバス9n とが接続される。すると、その接続された全
加算器14n の演算結果がライトバス9n に出力され
る。それと同時に、その演算結果のデータを書き込むレ
ジスタのアドレスが指定され、書き込み制御線20を介
して制御信号が送られることにより、データ書き込み用
ゲート群7n の中の何れかのゲートが開かれる。これに
より、指定されたアドレスのレジスタに演算結果のデー
タが書き込まれる。
【0046】このように、本実施例では、第2のマルチ
プレクサ17n で下位のプロセッサ要素からのキャリ出
力を選択することによって、4個のプロセッサ要素1〜
4が1個の4ビットPEとして動作するように切り替え
ることができる。したがって、計算が進んでデータが大
きくなり、データ幅が4ビットになった段階で各プロセ
ッサ要素1〜4が1個の4ビットPEとして動作するよ
うに切り替えるのが効果的である。
【0047】そのようなビット幅の切り替えを動的に行
う例を、図2に基づいて説明する。図2は、縦8個、横
8個のマトリクス状に配置された各プロセッサ要素が持
つデータの総和を計算する場合におけるデータの流れを
示す図である。
【0048】まず、図2(0)において、64個のプロ
セッサ要素は、それぞれ1ビットのデータを保持してい
る。次に、図2(1)において、奇数列のプロセッサ要
素のデータをその右隣のプロセッサ要素に送り、加算を
行う。その加算結果は、網かけをした偶数列のプロセッ
サ要素に保持される。
【0049】次に、図2(2)において、第2列および
第6列のプロセッサ要素が保持しているデータをそれぞ
れ第4列および第8列のプロセッサ要素に送り、加算を
行う。その加算結果は、第4列および第8列のプロセッ
サ要素に保持される。ここで、これらのプロセッサ要素
に保持されたデータが4ビットになると、図2(3)に
示すように、その4ビットのデータが横方向の4個のプ
ロセッサ要素に1ビットずつ分散される。これにより、
横方向に並んだ4個のプロセッサ要素は、4ビットデー
タの各桁のデータを1ビットずつ保持することになる。
【0050】次いで、図2(4)において、データが分
散された4個のプロセッサ要素を1組にして4ビットP
Eとしての動作に切り替える。そして、偶数行のプロセ
ッサ要素が保持しているデータをその上のプロセッサ要
素に送り、下位のプロセッサ要素から伝搬されてくるキ
ャリを利用しながらビットパラレルに加算を実行する。
その加算結果は、網かけをした奇数行のプロセッサ要素
に保持される。
【0051】次に、図2(5)において、第3行および
第7行のプロセッサ要素が保持しているデータをそれぞ
れ第1行および第5行のプロセッサ要素に送り、ビット
パラレルに加算を行う。その加算結果は、第1行および
第5行のプロセッサ要素に保持される。さらに、図2
(6)において、第5行のプロセッサ要素が保持してい
るデータを第1行のプロセッサ要素に送り、ビットパラ
レルに加算を行う。これにより、第1行のプロセッサ要
素に加算結果のデータが集められる。
【0052】そして、図2(7)において、左半分の4
個のプロセッサ要素に分散しているデータをその右端
(第4列)のプロセッサ要素に集めるとともに、右半分
の4個のプロセッサ要素に分散しているデータをその右
端(第8列)のプロセッサ要素に集める。これにより、
加算結果のデータは2個のプロセッサ要素に保持され
る。最後に、図2(8)において、第4列のプロセッサ
要素に保持されているデータを第8列のプロセッサ要素
に送る。これにより、64個のプロセッサ要素が持つデ
ータの総和データを1個のプロセッサ要素に保持させる
ことができる。
【0053】以上述べたように、本実施例では、1つの
プロセッサ要素に格納されるデータのビット幅が4ビッ
トと大きくなって、演算の並列度が低下すると、それま
で各プロセッサ要素が独立して動作していたのを、4個
のプロセッサ要素を結合させて1個の4ビットPEとし
て動作させるように切り替えるようにした。すなわち、
データのビット幅等に合わせてビットシリアル演算から
4ビットパラレル演算に動的に切り替えるようにした。
【0054】したがって、演算が進むにつれて演算に寄
与しないプロセッサ要素が多くなるという不都合をなく
すことができ、各プロセッサ要素を常に有効に活用する
ことができる。しかも、演算の結果ビット幅が大きくな
ったデータに対してビットパラレルで演算を行うことが
できるので、アレイプロセッサにおける全体の演算をよ
り高速にすることができる。
【0055】なお、以上の実施例では、4個のプロセッ
サ要素を結合して1個の4ビットPEに切り替える場合
について述べたが、本発明はこれに限定されるものでは
ない。例えば、2ビットPE、8ビットPEその他の多
ビットPEに切り替えるようにしてもよい。
【0056】
【発明の効果】本発明は上述したように、アレイプロセ
ッサ中にある複数個のプロセッサ要素のそれぞれに、自
己のプロセッサ要素で得られる桁上げ信号と隣接するプ
ロセッサ要素で得られる桁上げ信号との何れかを選択す
る桁上げ信号選択手段を設けたので、上記桁上げ信号選
択手段によって自己のプロセッサ要素で得られる桁上げ
信号または隣接するプロセッサ要素で得られる桁上げ信
号の何れを選択するかによって、各プロセッサ要素が独
立してビットシリアル演算を行うようにしたり、複数の
プロセッサ要素が結合して多数ビットのデータにビット
パラレル演算を行うようにしたりするように切り替える
ことができる。これにより、各プロセッサ要素を常に有
効に活用することができるようになり、アレイプロセッ
サ全体の演算をより高速化することができる。
【0057】また、本発明の他の特徴によれば、各プロ
セッサ要素で演算されているデータの大きさや、各プロ
セッサ要素における演算の並列度に応じて桁上げ信号選
択手段の選択動作を制御するように構成したので、ビッ
トシリアル演算とビットパラレル演算とを動的に切り替
えることにより適切な演算を行うことができ、各プロセ
ッサ要素の動作効率を常に高く維持することができる。
このため、新たに特別なビット並列プロセッサ要素を付
加しなくても、アレイプロセッサ全体の演算を高速化す
ることができる。
【図面の簡単な説明】
【図1】本発明の一実施例であるアレイプロセッサにお
けるプロセッサ要素の構成を示す図である。
【図2】マトリクス状に配置された各プロセッサ要素が
持つデータの総和を計算する場合のデータの流れを示す
説明図である。
【図3】従来のアレイプロセッサにおけるプロセッサ要
素の構成を示す図である。
【符号の説明】
1〜4 プロセッサ要素 5 レジスタ群 6 データ読み出し用ゲート群 7 データ書き込み用ゲート群 8 リードバス 9 ライトバス 10、11 ラッチ 12 AND回路 13 OR回路 14 全加算器 15 キャリを保持するレジスタ 16、17 マルチプレクサ 18 制御線 19 制御部 20 書き込み制御線 21 読み出し制御線

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 所定の演算を行う演算器を有するプロセ
    ッサ要素が複数個アレイ状に配置されて成るアレイプロ
    セッサにおいて、 上記アレイ状に配置された複数個のプロセッサ要素のそ
    れぞれに、自己のプロセッサ要素で得られる桁上げ信号
    と隣接するプロセッサ要素で得られる桁上げ信号のうち
    の何れかを選択して、それを自己のプロセッサ要素中の
    上記演算器に供給する桁上げ信号選択手段を設けたこと
    を特徴とするアレイプロセッサ。
  2. 【請求項2】 上記複数個のプロセッサ要素で演算され
    ているデータの大きさに応じて上記桁上げ信号選択手段
    の選択動作を制御する制御手段を更に設けたことを特徴
    とする請求項1に記載のアレイプロセッサ。
  3. 【請求項3】 上記複数個のプロセッサ要素における演
    算の並列度に応じて上記桁上げ信号選択手段の選択動作
    を制御する制御手段を更に設けたことを特徴とする請求
    項1に記載のアレイプロセッサ。
  4. 【請求項4】 上記アレイ状に配置された複数個のプロ
    セッサ要素のうち、行方向に並べられた4個のプロセッ
    サ要素が1つの処理単位として構成され、上記桁上げ信
    号選択手段により上記隣接するプロセッサ要素で得られ
    る桁上げ信号が選択されているときに、上記4個のプロ
    セッサ要素が1組として4ビットパラレル演算を行うよ
    うに構成されていることを特徴とする請求項1〜3の何
    れか1項に記載のアレイプロセッサ。
  5. 【請求項5】 上記アレイ状に配置された複数個のプロ
    セッサ要素のうち、列方向に並べられた4個のプロセッ
    サ要素が1つの処理単位として構成され、上記桁上げ信
    号選択手段により上記隣接するプロセッサ要素で得られ
    る桁上げ信号が選択されているときに、上記4個のプロ
    セッサ要素が1組として4ビットパラレル演算を行うよ
    うに構成されていることを特徴とする請求項1〜3の何
    れか1項に記載のアレイプロセッサ。
  6. 【請求項6】 上記制御手段は、上記隣接するプロセッ
    サ要素で得られる桁上げ信号を選択するように切り替え
    るときに、上記4個のプロセッサ要素のうちの1つのプ
    ロセッサ要素に保持されている4ビットデータを上記4
    個のプロセッサ要素に1ビットずつ分配することを特徴
    とする請求項4または5に記載のアレイプロセッサ。
JP7039102A 1995-02-03 1995-02-03 アレイプロセッサ Withdrawn JPH08212168A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7039102A JPH08212168A (ja) 1995-02-03 1995-02-03 アレイプロセッサ

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7039102A JPH08212168A (ja) 1995-02-03 1995-02-03 アレイプロセッサ

Publications (1)

Publication Number Publication Date
JPH08212168A true JPH08212168A (ja) 1996-08-20

Family

ID=12543716

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7039102A Withdrawn JPH08212168A (ja) 1995-02-03 1995-02-03 アレイプロセッサ

Country Status (1)

Country Link
JP (1) JPH08212168A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008530642A (ja) * 2005-02-07 2008-08-07 ペーアーツェーテー イクスペーペー テクノロジーズ アクチエンゲゼルシャフト 低レイテンシーの大量並列データ処理装置
JP2011048735A (ja) * 2009-08-28 2011-03-10 Ricoh Co Ltd Simd型マイクロプロセッサ

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008530642A (ja) * 2005-02-07 2008-08-07 ペーアーツェーテー イクスペーペー テクノロジーズ アクチエンゲゼルシャフト 低レイテンシーの大量並列データ処理装置
JP2011048735A (ja) * 2009-08-28 2011-03-10 Ricoh Co Ltd Simd型マイクロプロセッサ

Similar Documents

Publication Publication Date Title
US5287532A (en) Processor elements having multi-byte structure shift register for shifting data either byte wise or bit wise with single-bit output formed at bit positions thereof spaced by one byte
US5175862A (en) Method and apparatus for a special purpose arithmetic boolean unit
US6496918B1 (en) Intermediate-grain reconfigurable processing device
EP0539595A1 (en) Data processor and data processing method
JPH06290585A (ja) デュアルポートメモリ
GB2178572A (en) A processor array
US20060101231A1 (en) Semiconductor signal processing device
WO1990004235A1 (en) Parallel data processor
US20050024983A1 (en) Providing a register file memory with local addressing in a SIMD parallel processor
EP1733300B1 (en) Improvements relating to orthogonal data memory
US7769980B2 (en) Parallel operation device allowing efficient parallel operational processing
JP3955741B2 (ja) ソート機能を有するsimd型マイクロプロセッサ
US6715066B1 (en) System and method for arranging bits of a data word in accordance with a mask
JP2008512762A (ja) Simdプロセッサアーキテクチャにおける相互接続
CN213042269U (zh) 计算芯片、算力板和数字货币挖矿机
JPH06274528A (ja) ベクトル演算処理装置
GB1445714A (en) Array processors
JPH04295953A (ja) 要素プロセッサの2次元アレイを内蔵する並列データ処理装置および要素プロセッサのサブアレイユニット
JPH08212168A (ja) アレイプロセッサ
JPS6042516B2 (ja) デ−タ処理装置
JP3333779B2 (ja) 行列演算装置
GB2370139A (en) Parallel loaded shift register in parallel processor element
JP4237046B2 (ja) 画像処理装置
JPH023163A (ja) 多ポートメモリ
JPH1074141A (ja) 信号処理装置

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20020507