JPS61296462A - 高速デ−タ処理装置 - Google Patents
高速デ−タ処理装置Info
- Publication number
- JPS61296462A JPS61296462A JP60138123A JP13812385A JPS61296462A JP S61296462 A JPS61296462 A JP S61296462A JP 60138123 A JP60138123 A JP 60138123A JP 13812385 A JP13812385 A JP 13812385A JP S61296462 A JPS61296462 A JP S61296462A
- Authority
- JP
- Japan
- Prior art keywords
- data
- devices
- data processing
- arithmetic processing
- processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Multi Processors (AREA)
- Complex Calculations (AREA)
- Image Processing (AREA)
- Image Analysis (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
(産業上の利用分野)
本発明は断層撮影装置(CT)の画像再構成等で利用さ
れる大量データの高速処理を行うことのできる高速デー
タ処理装置に関する。
れる大量データの高速処理を行うことのできる高速デー
タ処理装置に関する。
(従来の技術)
データの高速処理を行う場合、一般に高速処理化の手法
としては、処理装置の構成要素に高速素子を使用する方
法と、通常の低速素子、装置を複数個並列に動作させて
高速化を図る手法がある。
としては、処理装置の構成要素に高速素子を使用する方
法と、通常の低速素子、装置を複数個並列に動作させて
高速化を図る手法がある。
(発明が解決しようとする問題点)
処理装置の構成要素に例えばE CL (E 5itt
er(:、 ouplcd l、 ogic)のよう
な高速素子を使用する前者の方式では、シンプルなコン
セプトでソフトウェア、′ファームウェアが設計でき、
並列度が低いので設計がしやすいという長所がある。し
かしながら、その反面、高価な構成要素を使用するため
、装置が高価なものとなってしまう。又、素子の高速化
に伴い、実装上、製造技術上の問題が生じてくる。更に
、高速素子はノイズマージン等が一般に低く、動作の安
定性にも問題があり、電源条件、アース等の環境条件に
も動作が微妙に影響される。
er(:、 ouplcd l、 ogic)のよう
な高速素子を使用する前者の方式では、シンプルなコン
セプトでソフトウェア、′ファームウェアが設計でき、
並列度が低いので設計がしやすいという長所がある。し
かしながら、その反面、高価な構成要素を使用するため
、装置が高価なものとなってしまう。又、素子の高速化
に伴い、実装上、製造技術上の問題が生じてくる。更に
、高速素子はノイズマージン等が一般に低く、動作の安
定性にも問題があり、電源条件、アース等の環境条件に
も動作が微妙に影響される。
これに対し、低速素子、演算鼎等を複数個並列に動作さ
せて高速化を図る後者の方式には、逆投影装置、フィル
タ装置等、機能的に独立したものを並列に動かす例があ
る。このような方式の場合、局部並列化を行っているた
め、ソフ1へウェア/ファームウェアを装置毎に別々に
作る必要があるため、演算を主体にした一貫した設計思
想をもつことができない。ヌ、装置の効率化の点からみ
ると、それぞれの装置の最適化設計ができないので1コ
スl−パフォーマンスが悪い。このような方式では、処
理変更を行う場合や機能アップを図る場合に装置として
の融通性がない。更に、フィルタ装置を複数台並列動作
させるような場合には、装置の効率の悪さ、ラフ1〜ウ
エア/フアームウ、Iアの設M1の困難さが助長されて
しまう。
せて高速化を図る後者の方式には、逆投影装置、フィル
タ装置等、機能的に独立したものを並列に動かす例があ
る。このような方式の場合、局部並列化を行っているた
め、ソフ1へウェア/ファームウェアを装置毎に別々に
作る必要があるため、演算を主体にした一貫した設計思
想をもつことができない。ヌ、装置の効率化の点からみ
ると、それぞれの装置の最適化設計ができないので1コ
スl−パフォーマンスが悪い。このような方式では、処
理変更を行う場合や機能アップを図る場合に装置として
の融通性がない。更に、フィルタ装置を複数台並列動作
させるような場合には、装置の効率の悪さ、ラフ1〜ウ
エア/フアームウ、Iアの設M1の困難さが助長されて
しまう。
加算器1乗算器等の演算機能の単位で多重並列化を図る
後者の方式もあるが、このような方式の場合、−貫した
コンセプトでソフトウェア/ファームウェアが設計、製
作でき、効率の良いシステムが生成できる可能性もあり
、融通性/柔軟性もある。しかしながら、ソフトウェア
/ファームウェアの作成が非常に難しいものとなる。又
、並列度によってソフトウェア/ファームウェアがそれ
ぞれ皆異なったものとなってしまう。並列度が増すと、
ソフトウェア/ファームウェアの作成は累積的に難しく
なり、最適化設計が困難になる。即ち、ソフトウェア/
ファームウェアへの負担が増大する(ソフトウェア危機
の可能性あり)、、又、このような大凶データの高速処
理において、0台の装置の並列動作により、処理スピー
ドを約0倍に増大すること(処理時間を約110に低減
すること)は至難の技であることはよく知られていると
ころである。更に、処理装置が高速化し、高性能化ずれ
ばする程、全体として高性能を引出すには、目的に対応
した巧妙なファームウェア/ソフトウェア/アルゴリズ
ムの存在がクローズアップされることもよく知られてい
る。
後者の方式もあるが、このような方式の場合、−貫した
コンセプトでソフトウェア/ファームウェアが設計、製
作でき、効率の良いシステムが生成できる可能性もあり
、融通性/柔軟性もある。しかしながら、ソフトウェア
/ファームウェアの作成が非常に難しいものとなる。又
、並列度によってソフトウェア/ファームウェアがそれ
ぞれ皆異なったものとなってしまう。並列度が増すと、
ソフトウェア/ファームウェアの作成は累積的に難しく
なり、最適化設計が困難になる。即ち、ソフトウェア/
ファームウェアへの負担が増大する(ソフトウェア危機
の可能性あり)、、又、このような大凶データの高速処
理において、0台の装置の並列動作により、処理スピー
ドを約0倍に増大すること(処理時間を約110に低減
すること)は至難の技であることはよく知られていると
ころである。更に、処理装置が高速化し、高性能化ずれ
ばする程、全体として高性能を引出すには、目的に対応
した巧妙なファームウェア/ソフトウェア/アルゴリズ
ムの存在がクローズアップされることもよく知られてい
る。
本発明はこのような点に濫みてなされたものであって、
その目的は、通常の低速動作素子、装置を複数個並列に
動作させるという後者の方式を採りつつもコストに対応
したシステムを構成できるコストパフォーマンスの優れ
た高速データ処理装置を実現することにある。
その目的は、通常の低速動作素子、装置を複数個並列に
動作させるという後者の方式を採りつつもコストに対応
したシステムを構成できるコストパフォーマンスの優れ
た高速データ処理装置を実現することにある。
(問題点を解決するだめの手段)
前記した問題点を解決プ゛る本発明は、断層撮影装置の
画像再構成装置等に使用するマルチプロセッサ方式の高
速データ処理装置において、複数台の演算処理装置で上
記4!!8置を共用すると共に、各演算処理装置では少
なくとも専用の記憶装置。
画像再構成装置等に使用するマルチプロセッサ方式の高
速データ処理装置において、複数台の演算処理装置で上
記4!!8置を共用すると共に、各演算処理装置では少
なくとも専用の記憶装置。
加減算器及び乗算器を具備して、同一のデータ処理又は
同一処理を多く含んだデータ処理装置を別々なデータに
対して並列に行い、少数回のシンブ′ルな同期制御によ
り、データ処理時間を演算処理装置の数に反比例に低減
させたことを特徴とするものである。
同一処理を多く含んだデータ処理装置を別々なデータに
対して並列に行い、少数回のシンブ′ルな同期制御によ
り、データ処理時間を演算処理装置の数に反比例に低減
させたことを特徴とするものである。
(実施例)
以下、図面を参照して本発明の実施例を詳細に説明する
。
。
第1図は本発明の一実施例を示す構成ブロック図である
々図に示寸装置は4個の演m処理装置FP LJ t−
・FPU4を使用した場合の例で、データの流れを中心
に示1ノでいる。図において、CMは各4個の演算処理
プロセッサFPI〜FP4から共通にアクセスされる主
記憶装置(以下共通メモリという)、IF+ はバス1
OBtを介して外部記m装置(図示せず)と共通メモリ
CM面のデータ転送〈特にDMA転送)を制御するイン
ターフ1イス、IF2はバスI OR3を介してスキャ
ンデータ収集装置(図示せず)と共通メモ90M間のデ
ータ転送を制御するインターフェイスである。
々図に示寸装置は4個の演m処理装置FP LJ t−
・FPU4を使用した場合の例で、データの流れを中心
に示1ノでいる。図において、CMは各4個の演算処理
プロセッサFPI〜FP4から共通にアクセスされる主
記憶装置(以下共通メモリという)、IF+ はバス1
OBtを介して外部記m装置(図示せず)と共通メモリ
CM面のデータ転送〈特にDMA転送)を制御するイン
ターフ1イス、IF2はバスI OR3を介してスキャ
ンデータ収集装置(図示せず)と共通メモ90M間のデ
ータ転送を制御するインターフェイスである。
これらインターフェイスIFt、rFzと共通メモ90
M間はバスIOBで接続されている。
M間はバスIOBで接続されている。
PMI−PM4はそれぞれ各演算処理装置FPU1〜F
PU4に固有の専用メモリ、S N t〜SN4はそれ
ぞれ各演11’3!1理プロセッサFPt”FP4の出
力を受けてバスSNBと共通接続された読出し可能なレ
ジスタである。これらレジスタSN、〜SNaはそれぞ
れ演算処理プロセッサ「P、〜FP4によって内容を変
更り゛ることが1了きるようになっている。これ゛らレ
ジスタS N l−3N4は各演算処即装置FPtJ+
〜FPU4相互間で演障処理の同期を得るために用いる
ものである。
PU4に固有の専用メモリ、S N t〜SN4はそれ
ぞれ各演11’3!1理プロセッサFPt”FP4の出
力を受けてバスSNBと共通接続された読出し可能なレ
ジスタである。これらレジスタSN、〜SNaはそれぞ
れ演算処理プロセッサ「P、〜FP4によって内容を変
更り゛ることが1了きるようになっている。これ゛らレ
ジスタS N l−3N4は各演算処即装置FPtJ+
〜FPU4相互間で演障処理の同期を得るために用いる
ものである。
M2R,Δ2B、CMBは共通メモリCMど各演算処理
装置FPUxへ= F P U 4とのデータ転送に使
用する双り向性のバス、P M B + −P M B
4は、それぞれ専用メモリPMI−PM4と対応する
演算処理プロセッサr P + ” F P 4とを接
続するバス、Tll〜T14はそわぞれバスCMBとP
MBi〜PMB4間を接続する双方向性のトランシーバ
である。以上の説明で明らかなように、演算処理装置F
PUIは演算処理プロセッサ[Pl、専用メモリPM1
.レジスタS N h及び1−ランシーバTRI とで
構成されている。この間の事情は他の演算処理装置FP
U2〜FPU4についても同様である。
装置FPUxへ= F P U 4とのデータ転送に使
用する双り向性のバス、P M B + −P M B
4は、それぞれ専用メモリPMI−PM4と対応する
演算処理プロセッサr P + ” F P 4とを接
続するバス、Tll〜T14はそわぞれバスCMBとP
MBi〜PMB4間を接続する双方向性のトランシーバ
である。以上の説明で明らかなように、演算処理装置F
PUIは演算処理プロセッサ[Pl、専用メモリPM1
.レジスタS N h及び1−ランシーバTRI とで
構成されている。この間の事情は他の演算処理装置FP
U2〜FPU4についても同様である。
第2図は第1図に示した演算処理装置FPUi(1−1
〜4)と演算処理プロセッサFPiの内部構成例を示1
図である。図において、PMiは前記し7た専用メモリ
、WMl i 、WM2iは何れもデータの一時記憶メ
七りと1ノで使用される書込み/読出し可能な高速の1
ノジスタファイル、ト1Miは主として制御データ。定
数或いは逆投影データ等を格納づ゛るメモリ、vu+r
は2人力M1とM2の各1つ同志の乗算を行うfj算器
、ADiは2人力AiとA2の各1つ同志の加減輝を行
う加算器である。これら乗稈器Muc;及び加算器ΔD
i としては、通常、バイブライン方式の演算器が用い
られる。
〜4)と演算処理プロセッサFPiの内部構成例を示1
図である。図において、PMiは前記し7た専用メモリ
、WMl i 、WM2iは何れもデータの一時記憶メ
七りと1ノで使用される書込み/読出し可能な高速の1
ノジスタファイル、ト1Miは主として制御データ。定
数或いは逆投影データ等を格納づ゛るメモリ、vu+r
は2人力M1とM2の各1つ同志の乗算を行うfj算器
、ADiは2人力AiとA2の各1つ同志の加減輝を行
う加算器である。これら乗稈器Muc;及び加算器ΔD
i としては、通常、バイブライン方式の演算器が用い
られる。
BPiは逆投影装置、CT[iは全体の統轄制御を行う
制御装置で、該制御装置CTLiはマイクロブ1コグラ
ムを内蔵しており、各種メモリのアトIノスS1算や処
理ループ数の計算等に使用する演算器を具備し、マイク
ロプログラムを解読して対応する演算処理を実行するた
めに、装置全体の制御を行う。MI BiはWMl i
、WM2i 、HMiからMULiのM1人力用デー
タ転送バス、A1B1 は〜へ7M11.wM2t 、
HMi からADiの△1人力用データ転送バス、M2
BiはCM。
制御装置で、該制御装置CTLiはマイクロブ1コグラ
ムを内蔵しており、各種メモリのアトIノスS1算や処
理ループ数の計算等に使用する演算器を具備し、マイク
ロプログラムを解読して対応する演算処理を実行するた
めに、装置全体の制御を行う。MI BiはWMl i
、WM2i 、HMiからMULiのM1人力用デー
タ転送バス、A1B1 は〜へ7M11.wM2t 、
HMi からADiの△1人力用データ転送バス、M2
BiはCM。
PMi 、WMl i 、WM2iとM U l−r間
の双方向性のデータバス、△2BiはCM、PMi 、
WMli、WM2iとADi間の双方向性のデータバス
、PMBiはCMからPMi 、 WMl i 、 W
M2i 、l−IMi 、BPi 、CTI iへのデ
ータ転送又はCM、PMi 、WM 1i 、WM2i
、HMi、crLr何れか2つの間でのデータ転送を
行うデータバスである。
の双方向性のデータバス、△2BiはCM、PMi 、
WMli、WM2iとADi間の双方向性のデータバス
、PMBiはCMからPMi 、 WMl i 、 W
M2i 、l−IMi 、BPi 、CTI iへのデ
ータ転送又はCM、PMi 、WM 1i 、WM2i
、HMi、crLr何れか2つの間でのデータ転送を
行うデータバスである。
共通メモリCMは、3種のバスCMB、M2B。
A2Bを有しており、演算処理装置FPUiの各々対応
する3種のバスPMBi 、M2Bi 、△2Biを紅
白して該FPUi とデータの授受を行う。
する3種のバスPMBi 、M2Bi 、△2Biを紅
白して該FPUi とデータの授受を行う。
Tli 、T2i 、T3iは双方向性1−ランシーバ
(双方向性バスドライバ)であり、CMBとPMBi
、M2RとM2Bi 、A2BとA2B1とを必汗時に
接続する。M2Bi。△2Biは、1サイクル内でMU
I i 、ADiへの入力データ取出しとMLILi
、ADiの出力データ(各々Mor 。
(双方向性バスドライバ)であり、CMBとPMBi
、M2RとM2Bi 、A2BとA2B1とを必汗時に
接続する。M2Bi。△2Biは、1サイクル内でMU
I i 、ADiへの入力データ取出しとMLILi
、ADiの出力データ(各々Mor 。
AOi )の他の装置への書込みとを時分割で行い、バ
スを多重に使用している。乗算器M U L iの入・
力M+にはMl B+ と自身の出力MOiが接続され
、乗算においては何れか1つが選択される。該乗算WM
ULiの他方の入力M2にはバスM2B;とADiの出
力AOiが接続され、演算時に何れか1つが選ばれるよ
うになっている。加算器ADiの一方の入力A1には、
バスA1B1と乗算器M U L、、、 iの出力MO
iが接続され、演算では何れか1つが選ばれる。加算器
ADiの他方の入力A2には、バスA2B1 と自身の
出力AOiが接続され、演算時に何れか1つが選ばれる
ようになっている。演算処理装置r=pu; (r−
1〜4)の8装@PMi 、WMl i 、WM2i
、HMi 。
スを多重に使用している。乗算器M U L iの入・
力M+にはMl B+ と自身の出力MOiが接続され
、乗算においては何れか1つが選択される。該乗算WM
ULiの他方の入力M2にはバスM2B;とADiの出
力AOiが接続され、演算時に何れか1つが選ばれるよ
うになっている。加算器ADiの一方の入力A1には、
バスA1B1と乗算器M U L、、、 iの出力MO
iが接続され、演算では何れか1つが選ばれる。加算器
ADiの他方の入力A2には、バスA2B1 と自身の
出力AOiが接続され、演算時に何れか1つが選ばれる
ようになっている。演算処理装置r=pu; (r−
1〜4)の8装@PMi 、WMl i 、WM2i
、HMi 。
BPi 、 M(JLi 、 ADi 、 CTLi
、 SNiは互いに並列動作が可能である。演算処理装
置FPIJ iとFPUj<i≠J : ’ + J
”” 1〜4)とはSNiの読出し等を除いて並列動作
できる。演算処理1i tal F P U iから共
通メモリCMへのアクセスは逐次的に行われる。
、 SNiは互いに並列動作が可能である。演算処理装
置FPIJ iとFPUj<i≠J : ’ + J
”” 1〜4)とはSNiの読出し等を除いて並列動作
できる。演算処理1i tal F P U iから共
通メモリCMへのアクセスは逐次的に行われる。
メモリの構成から眺めると、共通メモリCMと専用メモ
リPMiは大容最のメモリで、共通メモリCMは仝F
P U iに共用されるが、PMiはFPUiの専用メ
モリである。+−1yiは高速の中容量のメモリ、WM
l i 、WM2iは小容量の作業(一時記憶)メモリ
と見ることができる。このように構成された装置の動作
を説明すれば、以下の通りである。
リPMiは大容最のメモリで、共通メモリCMは仝F
P U iに共用されるが、PMiはFPUiの専用メ
モリである。+−1yiは高速の中容量のメモリ、WM
l i 、WM2iは小容量の作業(一時記憶)メモリ
と見ることができる。このように構成された装置の動作
を説明すれば、以下の通りである。
第3図は、第1図、第2図に示した本発明装置の動作を
スキャンと画像再構成の処理の流れと1゜で表わしたフ
ローチャー1・を示し、第4図は、第3図に示す処理を
時間との関係で示したタイミングチャートである。第3
図、第4図に示す処理はオンラインでスキャンと画像再
構成を行っており、各演算処理装@FPUiは例えば連
続する8ビ]−く以下Vと略す)ずつのデータを一括し
て処理するようになっている。即ち、8vずつ生データ
読込み、前処理、フィルタリング及び逆投影を行うよう
になっている。
スキャンと画像再構成の処理の流れと1゜で表わしたフ
ローチャー1・を示し、第4図は、第3図に示す処理を
時間との関係で示したタイミングチャートである。第3
図、第4図に示す処理はオンラインでスキャンと画像再
構成を行っており、各演算処理装@FPUiは例えば連
続する8ビ]−く以下Vと略す)ずつのデータを一括し
て処理するようになっている。即ち、8vずつ生データ
読込み、前処理、フィルタリング及び逆投影を行うよう
になっている。
全ての演算処理装置FPUiは、スキャンによるデータ
収集時間が短いものとすると、第4図に示すように、オ
ーバヘッドとなる短い時間を除いて完全に並列動作が可
能となっている。第1番目の演算処理装置FPUIを除
き、他の演算処理装置FPU2〜FPU4の処理(従っ
てマイクロプログラム)は、第3図に示すように全く同
じであり、又、FPtJ+は後処理等一部が他の演算処
理装置と異なるだけでほとんど同じである(マイクロプ
ログラムについても同様である)、、又、データの同時
性を要求する同期制御は、以下に説明するように、非常
にシンプルで、デリケートなタイミングで高速な応答性
を要求されることは少ない。
収集時間が短いものとすると、第4図に示すように、オ
ーバヘッドとなる短い時間を除いて完全に並列動作が可
能となっている。第1番目の演算処理装置FPUIを除
き、他の演算処理装置FPU2〜FPU4の処理(従っ
てマイクロプログラム)は、第3図に示すように全く同
じであり、又、FPtJ+は後処理等一部が他の演算処
理装置と異なるだけでほとんど同じである(マイクロプ
ログラムについても同様である)、、又、データの同時
性を要求する同期制御は、以下に説明するように、非常
にシンプルで、デリケートなタイミングで高速な応答性
を要求されることは少ない。
第4図において、(イ)は撮影制御装置(図示せず)の
動作を、(ロ)はスキャンデータ収集装置DAS (図
示せず)から出力されて共通メモリCMに転送されるデ
ータを、(ハ)は第1の演算処理装置FPUIの動作を
、(ニ)は第2の演算処理装置FPU2の動作を、(ホ
)は第4番目の演算処理装置FPU4の動作をそれぞれ
示している。以下、本発明実施例の動作を説明する。
動作を、(ロ)はスキャンデータ収集装置DAS (図
示せず)から出力されて共通メモリCMに転送されるデ
ータを、(ハ)は第1の演算処理装置FPUIの動作を
、(ニ)は第2の演算処理装置FPU2の動作を、(ホ
)は第4番目の演算処理装置FPU4の動作をそれぞれ
示している。以下、本発明実施例の動作を説明する。
まず、第1の演算処理装置FPIJtの動作について説
明する。第4図(イ)の斜線領1iJAに示すように撮
影υJI31]装置は、マイクロプログラム、制郊デー
タ、定数データ或いは外部メモリからのデータを、共通
メモリCMに転送する。共通メモリCM−にこれらデー
タが転送された後、第4図〈ハ)〜(ホ)のAに示すよ
うに共通メモリCMから、各演算処理装置F[]Uiに
マイクロプログラム。
明する。第4図(イ)の斜線領1iJAに示すように撮
影υJI31]装置は、マイクロプログラム、制郊デー
タ、定数データ或いは外部メモリからのデータを、共通
メモリCMに転送する。共通メモリCM−にこれらデー
タが転送された後、第4図〈ハ)〜(ホ)のAに示すよ
うに共通メモリCMから、各演算処理装置F[]Uiに
マイクロプログラム。
制御データ等が転送される。具体的にはバスCMB→ト
ランシーバT1i→バスPMBiを介して専用メモリp
Mi 、メモリHM+ 、逆投影装置BP1及び制御l
l装WlIG T l−iに伝えられる。そして、制御
装@cTLiはレジスタSNiの内容をOにして、同期
フラグをリセットする。
ランシーバT1i→バスPMBiを介して専用メモリp
Mi 、メモリHM+ 、逆投影装置BP1及び制御l
l装WlIG T l−iに伝えられる。そして、制御
装@cTLiはレジスタSNiの内容をOにして、同期
フラグをリセットする。
次に、演算処理装置FPUi側からスキャンデータ収集
装置DASにスキャンデータ0求が出される。この結果
、DASからのスキャンデータが第4図(ロ)に示すよ
うに1vずつの単位でバス10Bz→インターフエイス
IF2→バスJOBを介して共通メモリCMに転送され
る。共通メモリCMに最初の8vの生データがそろった
ら、それを検知したFPU+は、この8Vデータをバス
CMB→1−ランシーバTLI→バスP M B Iを
介1ノで専用メモリP M 1に格納する。演算処理装
置FPtJ+は、専用メモリP M lに格納された8
Vデータに対して前処理、コンポリコーション、フィル
タリング、逆投影等のデータ処理を行う。これら演算は
演算処理装置F l) kづ1内の各装置部(乗算器M
tJLx、Ill算器ADX、メモリHM を等)で行
わねる。処理後データは、再び専用メモリP M 1に
格納される。
装置DASにスキャンデータ0求が出される。この結果
、DASからのスキャンデータが第4図(ロ)に示すよ
うに1vずつの単位でバス10Bz→インターフエイス
IF2→バスJOBを介して共通メモリCMに転送され
る。共通メモリCMに最初の8vの生データがそろった
ら、それを検知したFPU+は、この8Vデータをバス
CMB→1−ランシーバTLI→バスP M B Iを
介1ノで専用メモリP M 1に格納する。演算処理装
置FPtJ+は、専用メモリP M lに格納された8
Vデータに対して前処理、コンポリコーション、フィル
タリング、逆投影等のデータ処理を行う。これら演算は
演算処理装置F l) kづ1内の各装置部(乗算器M
tJLx、Ill算器ADX、メモリHM を等)で行
わねる。処理後データは、再び専用メモリP M 1に
格納される。
演算処理装置FPUIがこのようなデータ処理をしてい
る間にも、共通メモリCMには生データが続々と転送さ
れてきており、次の8vの生データ即ち9〜16のデー
タがそろったとき、それを検知した第2の演算処理装置
F P U 2が、この生データを専用メモリP M
2に読込んで、同様に前処理、フコンボリコージョン、
フィルタリング。
る間にも、共通メモリCMには生データが続々と転送さ
れてきており、次の8vの生データ即ち9〜16のデー
タがそろったとき、それを検知した第2の演算処理装置
F P U 2が、この生データを専用メモリP M
2に読込んで、同様に前処理、フコンボリコージョン、
フィルタリング。
逆投影等のf−夕処理を行って、処理後のデ・−タを専
用メ1すP M2に格納する。
用メ1すP M2に格納する。
同様に、生データ々〜24Vについては、第3の演算書
装置F P L、J 3が処理し、生データ25〜32
Vについては、第4の演算処理装置F P tJ4が処
理をする。
装置F P L、J 3が処理し、生データ25〜32
Vについては、第4の演算処理装置F P tJ4が処
理をする。
その次の生データ33〜40Vが共通メモリCMにそろ
う頃には、第1の演算処理装置FPU+が、最初の8v
の生データの処理を絡えているので、この演算処理装置
FPtJtが生データ33〜40Vを処理をする。以下
同様に、各演算処理装置FPIJiは、前の演算処理装
置が読込Δ7だY−タの次のデータを読込んで処理をす
る。スキャンデータ収集装ff1DAsから共通メモリ
CMへの生データの転送速度と各演算処理装置F Pt
J iのデータ処理速度は予めわかっているので、−括
処理する生データの伍を適切に選べば、各演算処理装置
FPUi間で特に同期をとらなくても、上述の動作は混
乱なく行える。又、各演算処理装置FPUiにおけるデ
ータ処理は、第3図に示すように、主要部は全く同一で
あり、その前後の処理が、第1の演算処理装置FPUI
とその他の演算処理装置とでわずかに異なるだけである
。
う頃には、第1の演算処理装置FPU+が、最初の8v
の生データの処理を絡えているので、この演算処理装置
FPtJtが生データ33〜40Vを処理をする。以下
同様に、各演算処理装置FPIJiは、前の演算処理装
置が読込Δ7だY−タの次のデータを読込んで処理をす
る。スキャンデータ収集装ff1DAsから共通メモリ
CMへの生データの転送速度と各演算処理装置F Pt
J iのデータ処理速度は予めわかっているので、−括
処理する生データの伍を適切に選べば、各演算処理装置
FPUi間で特に同期をとらなくても、上述の動作は混
乱なく行える。又、各演算処理装置FPUiにおけるデ
ータ処理は、第3図に示すように、主要部は全く同一で
あり、その前後の処理が、第1の演算処理装置FPUI
とその他の演算処理装置とでわずかに異なるだけである
。
第1の演算処理装置FPLJ+が、自分の受持ちの全て
の8Vデータに対して上述の処理を終了したら、専用モ
リメモリPM1からバスPMB、→トランシーバTit
→バスCMBを介して共通メモリCMにイメージデータ
を転送し、レジスタSN1の内容を1にして、同期フラ
グをセットする。
の8Vデータに対して上述の処理を終了したら、専用モ
リメモリPM1からバスPMB、→トランシーバTit
→バスCMBを介して共通メモリCMにイメージデータ
を転送し、レジスタSN1の内容を1にして、同期フラ
グをセットする。
この間の動作を第4図(ハ)のBに示す。
第2の演算処理装置FPU2は、自分の受持ちの全ての
8データの全処理が終了した後、第1の演算処理装@
F P LJ Iの同期フラグSN+を見に行き、同期
フラグが1のときに、共通メモリC1Mに自分が求めた
イメージデータの加算を行う。
8データの全処理が終了した後、第1の演算処理装@
F P LJ Iの同期フラグSN+を見に行き、同期
フラグが1のときに、共通メモリC1Mに自分が求めた
イメージデータの加算を行う。
即ち、第1の′6j4算処理装置FPU+の処理が完了
しイメージデータの転送が終了しない間は自己のイメー
ジデータの加算を先行しないようにしている。第2の演
算処理装置F P LJ ?は処理結果のイメージデー
タ(専用メモリPM2に格納されている)を共通メモリ
のイメージデータに加算すると同期フラグを1にセット
する< S N zをセットする)。このような演算処
理装置FPU2の動作は、残りの演算処理装置FPU3
゜FPU4についても全く同様である。但し、第3番目
の演算処理装置は第2番目の演算処理装置の同期フラグ
が1にセットされてから自己の5イメージデータの加算
とフラグセットを行い、第4番目の演算処理装置は第3
番目の演算処理装置の同期フラグが1にセットされてか
ら自己のイメージデータの加算とフラグセットを行うよ
うに1ノで、演算処理装置相互間の整合即ち同期をとっ
ている。演算処理装置FP1、J +はバスSNBを介
して、全ての演算処理装置FPUi (ここでは4台
)の同期フラグをチェックする。全ての同期フラグが1
にセットされていたら、4台の演算処理a置FPUIへ
−FPU4の処理が全て終了していることになるので、
第4図の〈ハ)のCに示す後処理を行った後、(イ)の
斜線部Bに示すように共通メモリCMからバスIOB→
インターフェイスIF1→パスI OB hを介して外
部記憶装置等へイメージデータの転送を行う。
しイメージデータの転送が終了しない間は自己のイメー
ジデータの加算を先行しないようにしている。第2の演
算処理装置F P LJ ?は処理結果のイメージデー
タ(専用メモリPM2に格納されている)を共通メモリ
のイメージデータに加算すると同期フラグを1にセット
する< S N zをセットする)。このような演算処
理装置FPU2の動作は、残りの演算処理装置FPU3
゜FPU4についても全く同様である。但し、第3番目
の演算処理装置は第2番目の演算処理装置の同期フラグ
が1にセットされてから自己の5イメージデータの加算
とフラグセットを行い、第4番目の演算処理装置は第3
番目の演算処理装置の同期フラグが1にセットされてか
ら自己のイメージデータの加算とフラグセットを行うよ
うに1ノで、演算処理装置相互間の整合即ち同期をとっ
ている。演算処理装置FP1、J +はバスSNBを介
して、全ての演算処理装置FPUi (ここでは4台
)の同期フラグをチェックする。全ての同期フラグが1
にセットされていたら、4台の演算処理a置FPUIへ
−FPU4の処理が全て終了していることになるので、
第4図の〈ハ)のCに示す後処理を行った後、(イ)の
斜線部Bに示すように共通メモリCMからバスIOB→
インターフェイスIF1→パスI OB hを介して外
部記憶装置等へイメージデータの転送を行う。
このように、本発明によれば、第3図のフローチャート
より明らかなように、複数台の演算処理装置が同一の或
いは同一処理を多く含んだデータgl!l理を最小限の
同期制御によって並列に行うことができるので、各演算
処理プロセッサFPI〜「P4の動作速度はそれ程高速
でなくても装置全体と【ッでの処理速度は高速となる。
より明らかなように、複数台の演算処理装置が同一の或
いは同一処理を多く含んだデータgl!l理を最小限の
同期制御によって並列に行うことができるので、各演算
処理プロセッサFPI〜「P4の動作速度はそれ程高速
でなくても装置全体と【ッでの処理速度は高速となる。
第5図は、予めスキャンが終了し、データの収集が既に
終了しでいる場合の画像再構成の動作を示ず夕・イミン
グチャ−1・、第6図は第5図に示す処理を時間との関
係で示づタイミングチJp−トである。第3図、第4図
に示す動作と異なりデータ収集動作がないので、全ての
演算処理装置は生データの読込み持ちのない完全並列動
作が可能となる。、動作の詳細については、第3図、第
4図について説明したと同種であるので、省略する。
終了しでいる場合の画像再構成の動作を示ず夕・イミン
グチャ−1・、第6図は第5図に示す処理を時間との関
係で示づタイミングチJp−トである。第3図、第4図
に示す動作と異なりデータ収集動作がないので、全ての
演算処理装置は生データの読込み持ちのない完全並列動
作が可能となる。、動作の詳細については、第3図、第
4図について説明したと同種であるので、省略する。
上述の説明においては、画像再構成の場合を例にとって
説明したが、本発咀はこれに限るものではなく、その他
の種々のデータ処理の場合に適用することができる。又
、上述の説明では、演算処理装置4台の並列動作の場合
を例にとったが、4台に限るものではなく任意の台数で
あってもよい。
説明したが、本発咀はこれに限るものではなく、その他
の種々のデータ処理の場合に適用することができる。又
、上述の説明では、演算処理装置4台の並列動作の場合
を例にとったが、4台に限るものではなく任意の台数で
あってもよい。
又、レジスタSNiは他の記憶装置く例えば共通メモリ
CM)で代用してもよい。外部記憶装置からPMi 、
t〜(Mi 、BPi 、CTLi等へのデータ転送
を共通メモリCMを経由せずに直接転送するようにして
もよい。制御装置CTI +を(マイクロ)プログラム
メモリ、デコーダ、ル−プカウンタ、演算器、クロック
発生器等で構成してもよい。演算処理装置F P U
iの装置として、専用のフーリエ変換装置、前処理装置
。フィルタ装置等(1台又は複数台)を加えでもよい。
CM)で代用してもよい。外部記憶装置からPMi 、
t〜(Mi 、BPi 、CTLi等へのデータ転送
を共通メモリCMを経由せずに直接転送するようにして
もよい。制御装置CTI +を(マイクロ)プログラム
メモリ、デコーダ、ル−プカウンタ、演算器、クロック
発生器等で構成してもよい。演算処理装置F P U
iの装置として、専用のフーリエ変換装置、前処理装置
。フィルタ装置等(1台又は複数台)を加えでもよい。
又、演算処理装置FPUiが共通メモリCMを専用メモ
リPMiの拡張アドレスとして参照できる構造のもの(
FPUi内蔵のメモリアドレスの一部が共通メモリCM
のアドレスとなるように構成(〕たもの)であってもよ
い。
リPMiの拡張アドレスとして参照できる構造のもの(
FPUi内蔵のメモリアドレスの一部が共通メモリCM
のアドレスとなるように構成(〕たもの)であってもよ
い。
更に、処理アルゴリズムについては、画像再構成方式は
フィルタ補正逆投影方式に限定されない。
フィルタ補正逆投影方式に限定されない。
又、スキャン、画像再構成処理は、第3図〜第6図に示
したものに限定されない。処理ずべきデータの単位も一
括処理の単位は8■とは限らない。
したものに限定されない。処理ずべきデータの単位も一
括処理の単位は8■とは限らない。
マイクロプログラム、制御データ、定数データ等の転送
は、同種のスキャン、画像再構成処理の開始時点で1回
行うだけにしてもよい。後処理等を全F P Uで並列
処理するようにしてもよい。
は、同種のスキャン、画像再構成処理の開始時点で1回
行うだけにしてもよい。後処理等を全F P Uで並列
処理するようにしてもよい。
(発明の効果)
以上詳細に説明したように、本発明によれば以下に示す
ような効果が得られる。
ような効果が得られる。
(1)演算処理装置をn台並列接続することにより、略
1/nの処理時間で画像再構成を行うことができる。
1/nの処理時間で画像再構成を行うことができる。
(2)その場合、シンプルな同期制御方式の故に同期制
御装置が非常にシンプルにできる。即ち、各演算処理装
置間の結合は粗でJ:<、従って粗な同期制御(L o
se S ynchronization>のみが必要
で、厳密なタイミングでの多数回の同期(この同期が処
理性能に著しく影響する)は全く不要である。
御装置が非常にシンプルにできる。即ち、各演算処理装
置間の結合は粗でJ:<、従って粗な同期制御(L o
se S ynchronization>のみが必要
で、厳密なタイミングでの多数回の同期(この同期が処
理性能に著しく影響する)は全く不要である。
(3)価格に応じた柔軟なシステム構成(規模の異なる
構成)を採ることができる。旦つ、規模の増大に従い、
略リニアに処理性能を増大できる。
構成)を採ることができる。旦つ、規模の増大に従い、
略リニアに処理性能を増大できる。
(4)名演算(l!X理装置でのファームウェア(マイ
クロプログラム)、ソフトウェアをほとんど全く同じも
のにできる。従って、それらの開発が容易であ−る。一
般に高能率のファームウェアの生成の生産性を高くする
ことは極めて困難であり、システム構成によりその都度
高効率のファームウェアを生成するのは大変であるが、
本発明によれば、ファームウェアを共用化できる。
クロプログラム)、ソフトウェアをほとんど全く同じも
のにできる。従って、それらの開発が容易であ−る。一
般に高能率のファームウェアの生成の生産性を高くする
ことは極めて困難であり、システム構成によりその都度
高効率のファームウェアを生成するのは大変であるが、
本発明によれば、ファームウェアを共用化できる。
(5)各演算器3!1!装置E沫、高速プロtごツザの
中では機能面で比較的シンプルな構造であるので高効率
なファームウェアの生成が可能で、高能率なシステムが
組める。
中では機能面で比較的シンプルな構造であるので高効率
なファームウェアの生成が可能で、高能率なシステムが
組める。
〈6)処理アルゴリズムの変更等、画像再構成処理法の
変化に柔軟に対応できる〈構成単位の演算処理装置の機
能が、加減算1乗算のようなシンプルなものよりなるが
故である)。
変化に柔軟に対応できる〈構成単位の演算処理装置の機
能が、加減算1乗算のようなシンプルなものよりなるが
故である)。
(7)メモリ装置等システム全体での資源の共用により
、全システムで経済的な装置を構成できる。
、全システムで経済的な装置を構成できる。
第1図、第2図は本発明の一実施例を示す構成ブロック
図、第3図は本発明の動作を示すフローチV−ト、第4
図はそのタイミングチャート、第5図は本発明の装置の
他の動作を示Jフローチャート、第6図はそのタイミン
グチャーi−である。 IFl、IF2・・・インターフェイスFPUI〜FP
U4・・・演算処理装置CM・・・共通メモリ FPI〜FP4・・・演算処理プロセッサS N rへ
□SN+・・・レジスタ PMI〜P M 4・・・専用メモリ Tl1−TI4・・・トランシーバ 10B+ 、I OB2 、T OB、M2S。
図、第3図は本発明の動作を示すフローチV−ト、第4
図はそのタイミングチャート、第5図は本発明の装置の
他の動作を示Jフローチャート、第6図はそのタイミン
グチャーi−である。 IFl、IF2・・・インターフェイスFPUI〜FP
U4・・・演算処理装置CM・・・共通メモリ FPI〜FP4・・・演算処理プロセッサS N rへ
□SN+・・・レジスタ PMI〜P M 4・・・専用メモリ Tl1−TI4・・・トランシーバ 10B+ 、I OB2 、T OB、M2S。
Claims (5)
- (1)断層撮影装置の画像再構成装置等に使用するマル
チプロセッサ方式の高速データ処理装置において、複数
台の演算処理装置で主記憶装置を共用すると共に、各演
算処理装置では少なくとも専用の記憶装置、加減算器及
び乗算器を具備して、同一のデータ処理又は同一処理を
多く含んだデータ処理装置を別々なデータに対して並列
に行い、少数回のシンプルな同期制御により、データ処
理時間を演算処理装置の数に反比例的に低減させたこと
を特徴とする高速データ処理装置。 - (2)前記演算処理装置の内部に、専用の各種階層記憶
装置、マイクロプログラムメモリ、除算器、前処理装置
、フィルタ装置、フーリエ変換装置、逆投影装置及びプ
ログラムデコードと対応する処理を制御する制御装置等
の全部乃至は一部を含むようにしたことを特徴とする特
許請求の範囲第1項記載の高速データ処理装置。 - (3)共用する装置として、主記憶装置の他に各種階層
記憶装置、マイクロプログラムメモリ、加減算器、乗算
器、除算器、プログラムデコードと対応する処理を制御
する制御装置、前処理装置、フィルタ装置、フーリエ変
換装置及び逆投影装置等の全部乃至は一部を含むように
したことを特徴とする特許請求の範囲第1項記載の高速
データ処理装置。 - (4)スキャンして収集されるデータを、各演算処理装
置内の専用記憶装置に分割して格納するように構成した
ことを特徴とする特許請求の範囲第1項記載の高速デー
タ処理装置。 - (5)演算処理装置を構成する各装置の一部又は全部が
並列に動作することを特徴とする特許請求の範囲第1項
乃至第4項記載の高速データ処理装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP60138123A JPS61296462A (ja) | 1985-06-25 | 1985-06-25 | 高速デ−タ処理装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP60138123A JPS61296462A (ja) | 1985-06-25 | 1985-06-25 | 高速デ−タ処理装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS61296462A true JPS61296462A (ja) | 1986-12-27 |
Family
ID=15214505
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP60138123A Pending JPS61296462A (ja) | 1985-06-25 | 1985-06-25 | 高速デ−タ処理装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS61296462A (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1988006321A1 (en) * | 1987-02-19 | 1988-08-25 | Yokogawa Medical Systems, Ltd. | Data processor for image reconstruction |
JPS63317886A (ja) * | 1987-06-12 | 1988-12-26 | スミスズ・インダストリーズ・パブリック・リミテッド・コンパニー | イメージ処理方法 |
JPH01237765A (ja) * | 1988-03-18 | 1989-09-22 | Hitachi Ltd | ディジタル信号処理プロセッサおよびディシタル信号処理プロセッサシステム |
JPH0231283A (ja) * | 1988-07-21 | 1990-02-01 | Toshiba Corp | 画像再構成装置 |
US5732164A (en) * | 1991-05-23 | 1998-03-24 | Fujitsu Limited | Parallel video processor apparatus |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5260540A (en) * | 1975-11-14 | 1977-05-19 | Hitachi Ltd | Synchronization control of double-type system |
JPS5713565A (en) * | 1980-06-27 | 1982-01-23 | Toshiba Corp | Synchronizing method of multiprocessor computer system |
-
1985
- 1985-06-25 JP JP60138123A patent/JPS61296462A/ja active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5260540A (en) * | 1975-11-14 | 1977-05-19 | Hitachi Ltd | Synchronization control of double-type system |
JPS5713565A (en) * | 1980-06-27 | 1982-01-23 | Toshiba Corp | Synchronizing method of multiprocessor computer system |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1988006321A1 (en) * | 1987-02-19 | 1988-08-25 | Yokogawa Medical Systems, Ltd. | Data processor for image reconstruction |
EP0303709A1 (en) * | 1987-02-19 | 1989-02-22 | Yokogawa Medical Systems, Ltd | Data processor for image reconstruction |
US4941094A (en) * | 1987-02-19 | 1990-07-10 | Yokogawa Medical Systems, Ltd. | Image reconstruction data processing unit |
JPS63317886A (ja) * | 1987-06-12 | 1988-12-26 | スミスズ・インダストリーズ・パブリック・リミテッド・コンパニー | イメージ処理方法 |
JPH01237765A (ja) * | 1988-03-18 | 1989-09-22 | Hitachi Ltd | ディジタル信号処理プロセッサおよびディシタル信号処理プロセッサシステム |
JPH0231283A (ja) * | 1988-07-21 | 1990-02-01 | Toshiba Corp | 画像再構成装置 |
US5732164A (en) * | 1991-05-23 | 1998-03-24 | Fujitsu Limited | Parallel video processor apparatus |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2620423B2 (ja) | 2次元高速フーリエ変換コンバータ | |
US5175863A (en) | Signal data processing system having independently, simultaneously operable alu and macu | |
CA2255634C (en) | Parallel processor with redundancy of processor pairs | |
US7725518B1 (en) | Work-efficient parallel prefix sum algorithm for graphics processing units | |
JPS633359A (ja) | デイジタル情報処理システム | |
JPS61296462A (ja) | 高速デ−タ処理装置 | |
Goddard et al. | High-speed cone-beam reconstruction: An embedded systems approach | |
Scherl et al. | Implementation of the FDK algorithm for cone-beam CT on the cell broadband engine architecture | |
Igual et al. | Robust motion estimation on a low-power multi-core DSP | |
Gijbels et al. | A VLSI-architecture for parallel non-linear diffusion with applications in vision | |
Block et al. | Bringing compressed sensing to clinical reality: prototypic setup for evaluation in routine applications | |
JPH0312741B2 (ja) | ||
CN111209230B (zh) | 数据处理装置、方法及相关产品 | |
Hartz et al. | A real-time TOFPET slice-backproject engine employing dual AM29116 microprocessors | |
Schimmler et al. | Instruction systolic array in image processing applications | |
Hussain et al. | ViPS: Visual processing system for medical imaging | |
CN112001836A (zh) | 一种图像处理装置 | |
Brown et al. | Distributed vector processing of the S-transform for medical applications | |
Pinti | Real Time Acquisition and Signal Processing on Transputers Application to Electroencephalography | |
CN113807489B (zh) | 用于执行反卷积操作的方法、板卡及其计算装置 | |
Scherl et al. | On-the-fly-reconstruction in exact cone-beam CT using the Cell Broadband Engine architecture | |
Dowling et al. | HARP: An open architecture for parallel matrix and signal processing | |
Goddard et al. | Multicomputer algorithms for reconstruction and postprocessing | |
JP2508835B2 (ja) | 画像生成装置 | |
Ososanya et al. | Performance evaluation of parallel fast Walsh transform algorithms on a shared-memory multiprocessor computer |