JPH08501403A - インテリジェント通信システム - Google Patents

インテリジェント通信システム

Info

Publication number
JPH08501403A
JPH08501403A JP7503195A JP50319595A JPH08501403A JP H08501403 A JPH08501403 A JP H08501403A JP 7503195 A JP7503195 A JP 7503195A JP 50319595 A JP50319595 A JP 50319595A JP H08501403 A JPH08501403 A JP H08501403A
Authority
JP
Japan
Prior art keywords
data
communication
processors
communication system
individual
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
JP7503195A
Other languages
English (en)
Inventor
グンツィンガー,アントン
Original Assignee
グンツィンガー,アントン
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by グンツィンガー,アントン filed Critical グンツィンガー,アントン
Publication of JPH08501403A publication Critical patent/JPH08501403A/ja
Ceased legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L9/00Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
    • H04L9/40Network security protocols
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/16Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
    • G06F15/163Interprocessor communication
    • G06F15/17Interprocessor communication using an input/output type connection, e.g. channel, I/O port
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/16Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
    • G06F15/163Interprocessor communication
    • G06F15/173Interprocessor communication using an interconnection network, e.g. matrix, shuffle, pyramid, star, snowflake
    • G06F15/17337Direct connection machines, e.g. completely connected computers, point to point communication networks

Abstract

(57)【要約】 本発明は、データ処理のために、マルチプロセッサの組合せたものを並列動作させる装置および方式に関するもので、これらプロセッサは個々のデータストア(8.1,8.1′,8.1″,8.n)と、コントロールストア(7.1,7.1′,7.1″,7.n)とを有すると共に、共有通信システム(2)とインターフェイスしている。この通信システムにおいて、共有通信システムを全体として、処理条件の組合せに対して、プログラム可能であると共に、これら条件に従って、独立して動作可能となる。これら個々のプロセッサによって個々のアルゴリズム、データセット、およびプロトコルインストラクションを、通信に先立ってそれのストア中に受信する。これら個々のプロセッサによって、アルゴリズムで独立してデータセットを処理し、個々の結果を演算する。これら個々の結果を、プロトコルインストラクションに従って、すべてのプロセッサに対してデータとして、独立的且つ、通信可能な状態で供給する。

Description

【発明の詳細な説明】インテリジェント通信システム 本発明は、インテリジェント通信方式および例えば、データ処理で利用するマ ルチプロセッサシステムにおいて、この通信方式を実行する手段に関する。 今日、マルチプロセッサシステムは、増大している大型および小型コンピュー タに利用されると共に、多岐に亘り応用されている。従って、例えば、パーソナ ルコンピュータには、数個の特殊なプロセッサが設けられており、これらプロセ ッサによって、ディスプレイスクリーン、キーボード、マスメモリ等の動作を実 行する。即ち、各パーソナルコンピュータは、すでにマルチプロセッサシステム を構築している。 本来、マルチプロセッサシステムは、パーソナルコンピュータで使用されるだ けでなく、例えば、気象学や流体力学等の科学計算または、ディジタルイメージ (画像)処理等の演算集約的応用に利用されるものである。これらの応用例は、 並列動作のプロセッサによって良好に実行されている。即ち、複数個(7台また はそれ以上)のプロセッサ手段を並列動作させ、これらプロセッサ手段を、通信 システムによって相互接続している。従って、将来、これらマルチプロセッサシ ステムは、極めて重要な役割を果すものと考えられる。 標準的なスーパーコンピュータ、例えばCRAY社のY−MPまたはNEC社 のSX−3では、数GFLOPS(ギガFLOPS)の演算能力を有している。 一方、Intel社のi860プロセッサ、パワ−PC、Motorola社のDSP960 02、DEC社のAlpha等の最新型シングルプロセッサでは、100MFLOP S(ミリオンFLOPS)まで、またはそれより上の演算能力しか有していない 。GFLOPの閾値は、多数個の個々のプロセッサを、並列(sinergy-giving) 結合させ、通信システムによる並列コンピュータを構成することによってのみ到 達する。このような並列式のデータ処理は、通信およびプログラミングにおいて 困難となってしまう。従って、情報のスイッチング(通信)の特性によって、並 列式コンピュータの構成および効率に大きな影響が生じてしまう。 通信における困難とは、マルチプロセッサシステムにおける一般的な問題であ ると共に固有の問題でもある。一般に、大きな演算力を得るためには、最大数の プロセッサを協動させる必要がある。原理上、以下の4つの異なるアーキテクチ ュアが弁別されている。 a)共有メモリ、ここでは、すべてのプロセッサが単一の共通メモリにアクセ スする。これらプロセッサの同期化が、ロックインストラクションおよびロック 解除インストラクションによって実行される。このようなシステムにおけるボト ルネックは、共通メモリである。従って、このアーキテクチュアは、比較的少な い数のプロセッサを有するマルチプロセッサシステムにのみ好適なものである。 b)分散型メモリ、ここでは、各プロセッサが個々のメモリを有し、このメモ リに対して、他のプロセッサがアクセスできる。各アクセスは、リクエスト(ア ドレス)および実際のデータ値から構成されている。数台のプロセッサからの多 くのアクセスで、集中的な通信が行われると、対応する通信システムは急速にオ ーバーロードとなる。 c)クライアント/サーバー、ここでは、マスタ(クライアント)によってタ スクおよびデータが数個のスレーブ(サーバー)に分配される。このようなアー キテクチュアは、個々のタスクおよびデータが全く対話が無いか、または互いに 僅かの対話しかない場合にのみ利用でき、これは、僅かな応用例しか存在しない 。 d)メッセージパッシング、ここでは、プロセッサで発生させたデータを、メ ッセージ手段によってこの特定データに関連したすべてのプロセッサに対して送 給する。この通信システムに送給されたメッセージの数量は、2乗に比例して増 大する。従って、このようなアーキテクチュアは、集中的な通信および多くのプ ロセッサとのタスクには、不適当なものである。 これらの通信システムは、管理費用が嵩むと共に、データのスループットが低 下するのが特徴である。 上述した備考から総合して、中心的な重要事項は、伝送プロトコルに与えられ る。ボトルネックとなることができる通信速度は、例えば、Intel社のPentium( コンピュータ)で構築されたシンメトリックマルチプロセッサシステムによって 表示され、ここでは、4台までのプロセッサが相互に通信できるようになって いる。この利用したマルチプロセッサ相互接続通信システム(MPI)には、9 個の異なったサイクルが用いられており、これら手段によって、個々のプロセッ サは、伝送プロトコルに従って、共用のロールメモリにより対話することが可能 となる。最大の伝送帯域幅は、33.3MHzのクロック周波数で64ビットデー タの下で2.1Gbits/sec.となる。個々のPentiumは、64ビットデータに対し て60MHzのタイミング動作し、従って、3.8Gbits/secの最大伝送帯域幅を 有するようになる。この帯域幅は、1.8の係数だけ高いものである。マルチプ ロセッサシステム中に4台のPentiumを利用した場合に、この通信システムは不 可能なものとなってしまう。その理由は、リニアスピードが増大すると仮定する と、MPIシステムの最大伝送帯域は、個々のPentiumによる最大伝送帯域の僅 か14%となるからである。 本発明の課題は、伝送速度、伝送帯域の利用性、通信およびこれに関連した手 段の制御性に関して、マルチプロセッサシステム用の最適な通信方法を提供する ことである。このような課題は、請求項に規定された発明によって達成される。 本発明の基礎となる技術思想は、個々の情報の伝送に対する通信を最小化する ことより成る。絶対的に必要ではないが、通信を高速で切換えるためには余分な 情報を、“分離”すると共に、この結果として、これら情報は伝送プロトコルの 一部分でなくなるものである。この通信の高速切換えとしては、例えば、加入者 または参加者を送/受信するシーケンス(順序)の決定、どの加入者又は参加者 が誰に送信すると共に、誰れから受信するかを決定すること、または、通信時間 およびパケットサイズの固定化のようなものが存在している。これら分離された 情報を、“ミーティング”に先立ってタイムテーブル(スケジュール)の形式で プロトコルインストラクションとして、参加者(即ち、参加しているプロセッサ )に提供する。これら情報はストアされると共に、何時、どのようにして、誰れ に送信するか、および何時、どのようにして、誰れから受信するのかを前以って 知っている。即ち、これら機能の分担が存在している。従って、この伝送プロト コルは、最早、宛名書きされた封書を持って走り回ったり、郵便受けを探したり する郵便配達員ではなくなり、この代り、この配達員は、参加者達に対して、開 放したバッグを持って来るようになり、これによって、参加者達にとって興味 のある情報が提供されるようになる。また、最近の電子的処理によって、このよ うな方法で情報を、1回またはそれ以上の機会で通信することが可能となってい る。この結果、本発明の通信システム(郵便配達員、タイムテーブルおよび参加 者)では、自律的な手法でインテリジェンスな動作として参考にしている。その 理由としては、個々の参加者(プロセッサ)は、それ自身のタスクおよび機能を 事前に知っているからである。ジョイント通信システムは、インストラクション の実行における最重要主体に対して、全体としてプログラム可能である。例えば 、簡単で、安価に製造可能で、且つ、故障の少ないコンポーネントを利用して、 純粋にハードウェア的な解決法(例えばASIC)で、効率的な伝送が実行可能 となる。 メッセージパッシングとインテリジェント通信との差異およびインテリジェン ト通信の利点について、以下詳述する。すべてのプロセッサは、同等の権利を有 するように動作する。即ち、すべてのプロセッサは、一緒になって、数個のテー ブル(表)を有する本を作成することを望むが、これらプロセッサの各々は、こ れらテーブルのあるものしか演算することができない。演算が実行された後で、 これらテーブルのすべてが、プロセッサ間で交換され、その結果として、各プロ セッサは、その仲間によって得られた情報を利用できるようになる。簡単なメッ セージパッシングまたは情報伝送の場合には、これら各プロセッサによって、作 業完了したデータのコピーを形成すると共に、このコピーをデータパケットとし てその仲間に提供する。これらコピーは、各プロセッサの受信アドレスを有して いる。ネットワークは、郵便配達サービスとして作動すると共に、アドレス付き データパケットを切換えている。次に、各プロセッサは、多数のデータパケット を受信し、これらデータパケットを処理可能な順序でアレンジする。第1の近似 におけるこのようなシーケンス動作は、参加プロセッサの数と共に、リニア状態 で起るようになる。即ち、データの迅速な転送の場合ですら、管理コストは、こ れらテーブルを生成するための実際の演算コストより高価なものとなってしまう 。この場合には、全体システムの演算容量は、更に、プロセッサを追加すること によって増大することなく、実際には、減少することが可能となる。ここで本発 明が必要となってくる。通信の管理を、このネットワーク、即ち、インテリジェ ン ト通信システムと称するものに転送する。別の利点としては、このような管理に よって、各プロセッサからそのデータパケットを移動することが可能となると共 に、これらすべてのプロセッサに対するデータパケットは、適切に順序付けられ 、コピーされると共に、送信された各正しい部分において、これら部分はデータ パケットの一部分であることが補償される。従って、これらプロセッサに対する 情報交換の管理コストを最小化できる。 しかし乍ら、このインテリジェント通信システムは、個々のプロセッサ間で交 換すべき情報を順序付けすると共に、発送する場合にのみ使用できるが、これら 情報を処理するのに好適なものでもある。この目的のため、この通信ネットワー クでは、グループまたはすべてのプロセッサによって利用される1つまたは多く の算術ユニットを有しているので、この結果として、この通信ネットワークから のデータを、この目的のために、発呼することなく、または外部インストラクシ ョンを必要としないで、算術ユニットへ送給することができる。このような方法 によって、例えば、最小値、最大値、合計値、Z・バッファの決定のような演算 を、調整自在なカウンタモジュールで実行できる。この算術ユニットを、1個、 数個または全部のプロセッサの下で、同一または、異なった特性で制御できるが 、この演算の通信および制御を、自律的に実行する。 最後に、このインテリジェント通信システムを、高速動作システムとして利用 できる。上記の算術ユニットに類似して、この通信システムには、その目的から して1つまたはそれ以上の動作メカニズムを有しており、これをグループまたは すべてのプロセッサで利用できるので、1台またはそれ以上のプロセッサからの データを、動作メカニズム中に送給できる。これには、発呼や外部インストラク ションを必要としないと共に、これらデータを同一方法で、即ち、自律的に1台 またはそれ以上のプロセッサに対して分配する。 以下、本発明によるインテリジェント通信システムに関する実施例を、添付の 図面と共に詳述する。 第1図……本発明による通信システムにおける開始位置のブロック線図。 第2図……第1図の通信システムの通信プロセスのタイミングチャート。 第3図……本発明による通信システムにおける並列動作するプロセッサの概念モ デル。 第4図……本発明の通信システムで実行されるマルチレイヤー(多層)パーセプ トロンの概念モデル。 第5図……データソースおよびデータシンクを有する、本発明による通信システ ムのアーキテクチュアの第2実施例のブロック線図。 第1図は、本発明のインテリジェント通信システムのアーキテクチュアの第1 実施例を示すブロックダイヤグラムである。この通信システムはインテリジェン トであり、自律的に動作するものである。即ち、ミーティングの開始時において 、この通信システムには、通信に必要なドキュメントが供給される。従って、個 々の参加者によって提供された情報によって、これら参加者を一緒にグループ化 することができると共に、これら参加者を他の参加者に渡すことができる。マル チプロセッサシステム用のこのような並列通信式通信システムは、結果としてプ ログラム可能である。第1図によれば、数台のプロセッサ1,1′,1″〜1n を永久的に接続すると共に、並列に通信システム2へ接続する。nは正の整数で ある。この通信システム2は、リニアな(線形の)分岐された、またはリング形 状の構造を有すことができる。これらプロセッサの各々は、個々のアルゴリズム を収集して、この通信システム2によって実行に先立って、個々のメモリに書込 まれる共通のプログラムを開発するようになる。更に、各プロセッサは、オリジ ナルの個々のデータセット(組)を受信すると共に、個々のメモリ中に再記録さ れる個々のプロトコルインストラクションを受信する。ミーティング中、データ のみが読込み、読出しされるようになる。このミーティングは、前以ってプロト コルインストラクションに従って、および通信システム手段によって固定された シーケンスで、特別な時間に、開始および終了するものである。共通の通信シス テムは、全体として、インストラクションの実行の最重要課題に対して、全体と してプログラム可能である。また、この通信システムは、インストラクションの 実行に従って自律的に動作可能となる。通信を開始するに先立って、個々のプロ セッサによって個々のアルゴリズム、データセットおよびそれらのメモリに送給 されるプロトコルインストラクションを受信し、これらデータセットを、独立な 手法によるアルゴリズムで処理すると共に、個々の結果を演算し、これら個々の 結 果を、データ形態でおよびすべてのプロセッサに対して、自律的な手法によって プロトコルインストラクションに従って通信するようになる。 個々のプロセッサへのインストラクション、オーダー、アルゴリズムシーケン ス等の送給および個々のプロセッサ間のデータのような個々の結果の通信を、時 間分割方法で送信できる。この通信システムは自律的なものである。この通信の 制御は、自由に決定できるものであり、1つまたはそれ以上のプロセッサから中 心的に行われ、且つ、階層的な方法で実行できる。このミーティングの前に供給 されたアルゴリズム、データおよびプロトコルインストラクションを、例えば、 1つまたはそれ以上の制御用プロセッサによって供給するが、このような階層を 、ミーティング中に保留して設定する。プロセッサ1,1′,1″〜1nの各々 は、インストラクション、オーダー、アルゴリズムシーケンス等の個々の組に従 って、自律的、即ち独立的なものである。この結果として、誰れが、誰れとおよ びどのようにして何時通信したかに関するアービタレーション(調停)、アービ タレーションコートまたは決定が不要となる。これらプロセッサのインストラク ションの独立性が存在するが、通信中では、外部形態で最早、存在しないと共に 、この代りに、プロセッサによる通信に先立って、プロトコルインストラクショ ンに従って、内部的に強調されるようになる。このことは、本発明による通信シ ステム2を、既知のシステムに対して識別することができ、この理由は、例えば 、通信時間や通信のパケットのサイズを、外部的に固定するからである。 これらプロセッサ1,1′,1″〜1nの各々は、インテリジェント通信シス テム2を介して、データ3,3′,3″〜3nを受信すると共に、新しいデータ 4,4′,4″〜4nを発生する。新たに生成したデータ4,4′,4″〜4nを 、このインテリジェント通信システム2によって、データ5,5′,5″〜5n の形態で、時間追従型通信プロセスで、これらプロセッサ1,1′,1″〜1n に分配する。このことを図示するために、第1図のインテリジェント通信システ ムは、特定時間に、データ3,3′,3″〜3nを分配する。例えば、空データ をこれらプロセッサ1,1′,1″〜1nで巡回する。処理において、例えば1 2個のプロセッサによって、現在、個々の結果、またはデータパケット4,4′ ,4″〜4nを、例えば、1/12で満されたデータサークルで演算する。 インテリジェント通信システムによって、これら異なる1/12で満されたデー タサイクルを組合せて、完全に満されたデータサイクルを形成すると共に、この サイクルを、後で、データ5,5′,5″〜5nとして、通過させる。例えば、 完全に満されたデータサイクルとして、プロセッサ1,1′,1″〜1nへ通過 させる。この結果、このサークルは閉鎖されると共に、各プロセッサのメモリ中 に存在する個々のアルゴリズムに従って、これらデータ5,5′,5″〜5nを 、各プロセッサ1,1′,1″〜1nによって、更に処理する。これらプロセッ サは、再びインテリジェント通信システムによって組合わされ、次に、特定の時 間に、新規データとして、個々のプロセッサに再度、分配される。 しかし乍ら、この通信システムによって、同時に演算することも可能である。 即ち、このシステムによって、呼出し、または外部インストラクションを必要と しないで、データを1つまたはそれ以上の組合せ算術ユニットに送給できる。こ の算術ユニットを、例えば、すべてのプロセッサによって利用できる。このよう な方法によって、最小値、最大値、合計値、Z・バッファの決定のような演算が 、調整自由なカウンタモジュールによって実行できる。第1図によれば、例えば 、12台のプロセッサ1,1′,1″〜1nによって、処理において、異なった 個個の結果、即ち、データパケット4,4′,4″〜4nを演算すると共に、例 えば、同一データサイクルを一緒に演算する。このインテリジェント通信システ ムによって、これらデータサイクルを重畳し、これから例えば最小値、最大値、 合計値等を演算すると共に、更に、後で、例えば完全に満たされたデータサイク ルとして、得られたデータ5,5′,5″〜5nをプロセッサ1,1′,1″〜 1nに供給する。 しかし乍ら、この通信システムを、オペレーションシステムとしても利用でき る。即ち、1つまたはそれ以上のオペレーションユニットを、1つまたはそれ以 上のプロセッサによってデータで送給するために利用することができる。1つま たはそれ以上のオペレーションユニットによって、データを1つまたはそれ以上 のプロセッサに分配する。このような分配が、データを受信できるプロセッサに 対して行われる。分配は、外部インストラクションを用いずに行われる。第1図 によれば、例えば、12個のプロセッサ1,1′,1″〜1nによって、1回の プロセスで、データパケット4,4′,4″〜4nをオペレーションユニットに 送信し、このユニットによって、データパケットを、データ処理を実行できるプ ロセッサに分配する。また、このようなコントロールが、この通信システム内で 自律的な方法で行われる。また、本来、5,5′,5″〜5nのような非変換デ ータを、例えば、部分的に満されたデータサークルとして、プロセッサ1,1′ ,1″〜1nへ供給することが、この通信システムによって可能である。本発明 の知識を利用して、エキスパートは、多数の実行可能な例を考案する。例えば、 ある特定の実行によれば、データがこのオペレーションユニットによって決定さ れた基準を満す場合には、データが、1つまたはそれ以上のプロセッサからのみ 受信されるようになる。このような基準としては、データウインドウおよびデー タパケットの詳細または一部分とすることができる。 第2図は、第1図による実施例における通信システム用の通信プロセスのタイ ミングチャートである。このインテリジェント通信システムによって、個々のア ルゴリズムシーケンスおよびプロトコルインストラクションは、個々のプロセッ サ用のメモリに書込んである。データの交換が、第2図の左側の時間矢印“t” の開始点より開始する。特定の時刻に、通信システム2によって、データブロッ ク3*から、処理すべきデータ3,3′,3″〜3nが個々のプロセッサ1,1′ ,1″〜1nに供給される。通信システム2は状態23となる。これらプロセッサ は、個々のアルゴリズムを実行すると共に、後で、それぞれの実行結果4,4′ ,4″〜4nを通信システム2へ供給する。通信システムは、状態2nとなると、 データ4,4′,4″〜4nを個々のプロセッサ1,1′,1″〜1nから受信す る。これらデータまたはデータパケット4,4′,4″〜4nを、インテリジェ ント通信システム2によって、互いに組合わせて、仮想データブロック5*を構 成すると共に、次に、これらの一部分を、これらプロセッサヘ分配することがで きる。これらデータ通信プロセスを繰返し実行できる。インテリジェント通信シ ステム2によって、仮想データブロック5*中へ組込んだデータによって、特定 の時刻に、処理すべきデータ5,5′,5″〜5nとして、これらをプロセッサ 1,1′,1″〜1nへ分配することができる。この通信システムが状態25とな ると、データ5,5′,5″〜5nを個々のプロセッサ1,1′,1 ″〜1nに送信する。次に、個々のプロセッサの結果、6,6′,6″〜6n通信 システム2によって、再度、集められ、もう一度、仮想データブロック7*に組 込まれる。次に、このインテリジェント通信システム2は状態27となる。 生成したデータパケットは、一定のサイズ、または異なったサイズを有するこ とが可能となる。従って、例えば、イメージを表わすデータセット(組)を、ラ イン毎、またはブロック毎に分割することができる(また、異なったブロックサ イズでも分割可能)。一好適実施例において、一定またはフレキシブルウインド ウを創作でき、ここでは、個々のプロセッサはデータを送信または受信する。こ のウインドウ長を、各プロセッサに対して、自由に調整することができる。 このインテリジェント通信システムにおいて、演算が行われると、伝送中、デー タフィールドは、時間的にオーバーラップできる。各データポイントに対して、 対応する機能が、算術ユニット中で、実行される。例えば、最低の機能で、対応 する機能の最小値が演算される。本発明の思想を有するエキスパートによれば、 このような転送を実行する方法を沢山考案できる。 通信および処理を、一緒に同期化するためには、多くの可能性が存在している 。即ち、 a)個々のプロセッサによって、個々のデータ4,4′,4″〜4nを発生し 、これらデータをブロックとし、通信システム2に転送し、およびこれらプロセ ッサは、処理すべきデータ5,5′,5″〜5nのすべてが、プロセッサ1,1 ′,1″〜1nに到着するまで、待機する。 b)個々のプロセッサによって、個々のデータ4,4′,4″〜4nを発生し 、これらデータを個々に通信システム2に転送すると共に、これら処理すべきデ ータ5,5′,5″〜5nがプロセッサ1,1′,1″〜1nに到着するまで待機 する。 c)個々のプロセッサによって個々のデータ4,4′,4″〜4nを発生し、 これらデータをブロックとして通信システム2へ転送する。処理すべきデータ5 ,5′,5″〜5nのあるデータがプロセッサ1,1′,1″〜1nに到着すると すぐに、プロセッサは、更に処理を開始する。 d)個々のプロセッサによって、個々のデータ4,4′,4″〜4nを発生し 、 これらデータをそれぞれ通信システム2に転送する。処理すべきデータ5,5′ ,5″〜5nのあるデータがプロセッサ1,1′,1″〜1nに到着するとすぐに 、これらプロセッサは更に処理を開始する。 また、通信システムによって転送されるパケットのサイズを変化することがで きる。従って、個々のプロセッサは、通信に先立って、個々に固定されたパケッ トのサイズで通信することができる。従って、要求の機能として、技術的に、最 大の伝送帯域を、完全に利用できるか、または、数個の伝送チャネルへ分解でき るので、この結果として、例えば、同時に送信および受信(第5図の説明を参照 )が存在する。同一方法で、通信中に、各プロセッサの通信時間を、予じめ決め られたプロトコルインストラクションに従って変更できるので、各プロセッサの 転送のパケットサイズを、通信中に変更することができる。 第3図は、本発明による通信システムにおける並列動作するプロセッサのモデ ルを表わす。一好適実施例によれば、個々のプロセッサ1,1′,1″〜1nは 高速プロセッサである。これらプロセッサの各々には、通信コントローラ6.1 ,6.1′,6.1″〜6.1nおよび、2つのメモリ7.1,7.1′,7. 1″〜7.1nおよび8.1,8.1′,8.l″〜8.1nを有している。これ ら通信コントローラ6.1,6.1′,6.1″〜6.1nによって、これらメ モリ7.1,7.1′,7.1″〜7.1nおよび8.1,8.1′,8.1″ 〜8.1nに対するアクセスが、プロセッサ1,1′,1″〜1nと通信システム 2との間で確立される。通信コントローラは、個々の構成を有することができる か、または、数個の通信コントローラをモジュール、例えばチップ上に組合せる ことができる。メモリ7.1,7.1′,7.l″〜7.1nはデータメモリ、 例えばビディオDRAMであり、また、メモリ8.1,8.1′,8.1″〜8 .1nは、例えば、インストラクションメモリ、例えば、SRAMである。これ らデータメモリ7.1,7.1′,7.1″〜7.1nおよびインストラクショ ンメモリ8.1,8.1′,8.1″〜8.1nは、2つの入力を有することが 好適である。一方の入力はプロセッサ用であり、他方の入力は、通信システムに 対するインターフェイスとしてである。このようにして装備した、例えば、一方 のプロセッサ1によってデータを処理できると共に、それのデータ メモリ7.1にアクセスでき、これは、処理すべき新しいデータの切換えを、通 信システム2からインターフェイスを介して分配しないで実行する。次に、デー タメモリ7.1の2つの入力の開閉を、通信コントローラ6.1を介して制御す る。 演算が、通信システム2内の1個またはそれ以上の算術ユニットで行われると 、これらユニット(コンパレータ、加算器、論理演算装置等)が、通信コントロ ーラ6.1,6.1′,6.1″〜6.1n中に存在する。この通信コントロー ラにおける算術ユニットを利用して、タスク受入れをコントロールすることもで きる。例えば、通信コントローラは、データ値がプロセッサで決まる或る予期し た値以内の場合に、タスクのみを受入れることができる。 高速オペレーションシステムが、通信システム2内で動作する場合に、プロセ ッサ1,1′,1″〜1nは、データの受入れの用意ができたような時間を、通 信コントローラ6.1,6.1′,6.1″〜6.1nに表示する。次に、これ ら通信コントローラ6.1,6.1′,6.1″〜6.1nは、通信システム2 よりタスクを取込む。 第4図は、本発明による通信システムで実行されるマルチレイヤ(多層)パー セプトロン(ニューロネットワーク)のモデルを表わす。このマルチレイヤパー セプトロンは、並列処理可能な応用例である。これは、ユニバーサル学習モデル であり、このモデルによって、アルゴリズムに従って、複数の層Ln-1, Ln, Ln+1 (nは正の整数)における値の生成を表わしている。層Lnにおいて予じ め決定される初期値から開始して、これら層を前進方向(n+1)に向って、最 後の値の演算が行われると共に、後進方向(n−1)に向って、これら層を介し て、元の値の演算が行われる。このように実行するために、各層における個々の プロセッサ1,1′,1″〜1nによって、並列結果のセットを演算すると共に 、次の層の値を演算する前に、これらプロセッサは互いに通信する。このような 通信結果のセットを、隣接層の個々のプロセッサ1,1′,1″〜1nを連結す る線によって表わしている。これら多数のプロセッサおよび演算の複雑度に対応 して、これら結果のセットも大きくすることができる。即ち、これら通信は、急 速にアルゴリズムの実行におけるスピード決定ステップとなり得るものである。 本発明による通信システム2の利点としては、このシステムをプログラムでき ることであると共に、パーセプトロンアルゴリズムの実行の開始に先立って、個 々のプロセッサ1,1′,1″〜1nは、それらのデータメモリ7.1,7.1 ′,7.1″〜7.1nおよびインストラクションメモリ8.1,8.1′,8 .1″〜8.1nにおいて、個々のアルゴリズムまたは演算用ソフトウエア、こ れを実行するために必要な特定のデータセット、ならびに、プロトコルインスト ラクション(例えば、個々の通信時間や、伝送帯域幅)を受信することである。 この結果として、このアルゴリズムの実行中に、個々のソフトウエアに従って、 独立して動作できるようになる。プロトコルインストラクションを基準にして、 何時、これら結果を送信および受信するかを知ると共に、どのようにして、自己 のデータセットをこれら結果で更新するかを知るようになる。 従って、この通信システムにおけるインテリジェンス性は、アルゴリズムの実 行中に、最小限のデータのみを通信に使うことであると共に、この通信システム が実質的に自律的に機能することである。予じめ転送されたプロトコルインスト ラクションによって、階層の無い通信が導入されるようになる。この自律性とは 、個々のプロセッサ間の通信パケットサイズを有するタイムテーブルまたはスケ ジュールが、プロトコルインストラクションに従って、通信に先立って固定され ることである。最小化とは、他の数個のプロセッサに供給すべき個々のデータ値 によって、通信システムを一度だけロードすることである。この特別なデータ値 に関連した、すべてのプロセッサによって、これのコピーを作成する。プロトコ ルインストラクションに従って、結果として、通信コントローラは、何時、通信 に参加するかを、例えば通信したデータ値を計数することによって、知ることが でき、また、従来から、高度の権限によって要求されているように、何時、通信 に参加する必要がないか、および不必要に長い期間、通信ラインを開放にしてお く必要がないか、ならびに待機する必要がないかを知ることができる。第3図に よれば、データメモリ7.1,7.1′,7.1″〜7.1nの入力の開放およ び閉鎖を、個々のプロセッサ1,1′,1″〜1nの通信コントローラ6.1, 6.1′,6.1″〜6.1nを介して制御する。従って、データ長および通信 時間は、最小限となり、この結果、短かくなると共に既知となる。 この通信システムは、プログラム可能であると共に、実際の通信の前に、参加 しているプロセッサに対して、ソフトウエア、データおよびプロトコルインスト ラクションを転送する結果として、この通信システムは、高速化されるだけでな く、フレキシブルとなる。利用したハードウエア、即ち、データメモリを有する プロセッサおよび通信コントローラによって、高速の通信が達成される。この理 由は、データメモリへのアクセスが通信システムにのみ向うからである。これを 、高速時間方法で開放および閉鎖することが可能となる。個々の応用例、即ち、 ソフトウエアとデータとの間で変化したものが、実際の通信に先立って、これら プロセッサへ転送され、これによって、一般的な利用範囲が確保される。 第5図は、データソースおよびデータシンクを有する、本発明の通信システム のアーキテクチュアの第2実施例をブロック線図形態で表わしている。ここでは 、リング構造の通信が行われ、この通信システム2によって、個々のプロセッサ 1,1′,1″〜1nを閉鎖したリングで連結している。リニア(線形)マトリ ックスやツリー構造とは異なって、これらリング構造によって、データに対して 同時にアクセスできるようになる。これらリング構造では、例えば、従来のバス ベース式即ち、リニア通信システムによるデータレートより高いデータレートで 動作できる。その理由は、単一の送信器によって情報を、それぞれ既知の受信者 へ提供し、これは、回路上の基準から実行しやすいからである。従って、これら 構造は、高速となると共に、より長い距離で動作できるようになる。原理上、リ ニア、マトリックスまたはツリー構造も可能である。リニア構造は、限られたス ペースにおける小型システムで容易に実行できるものである。次に、個々の通信 コントローラを、リニアマトリックスとバス内で連続する。また、本発明の思想 に基いて、エキスパートによれば、種々の変更を行なうことができる。 第5図による実施例においては、個々のプロセッサ1,1′,1″〜1nに、 データメモリ7.1,7.1′,7.1″〜7.1nおよびインストラクション メモリ8.1,8.1′,8.1″〜8.1nを設けると共に、通信コントロー ラ6.1,6.1′,6.1″〜6.1nを介して、これらプロセッサは、通信 に参加する(第1〜第3図に基く説明を参照)。実際の通信、即ち、すべてのプ ロセッサ1,1′,1″〜1n間でのデータとして、演算結果の交換動作に先立 って、これら演算結果が、個々の演算用ソフトウエア、演算に必要なデータセッ ト、プロトコルインストラクションならびに通信パケットサイズと一緒に供給さ れる。通信システムのインテリジェンス性としては、個々のプロセッサ間での通 信を最小限にすることができると共に、最適、且つ、超高速な方法で実行できる ことである。個々のアルゴリズムによるデータの実行中に、通信すべきデータと して、結果が得られると共に、これらプロセッサを介してのデータの分配は、デ ータソースおよびデータシンクを参照して行わうことができる。この用語“デー タソース”は、この図において、黒くハッチングを付けられたプロセッサ1,1 ′,1″〜1nの満たされた”メモリに対して用いられるのに対して、用語“デ ータシンク”は、明るい、ハッチングの付けられていないプロセッサ1,1,1 ″〜1nの“空の”メモリに対して用いられる。例えば、第5図に示す時間にお いて、通信が、プロセッサ1,1’と1″との間で通信システム2を介して実行 されており、同時にプロセッサ1と1′との間で異なったサイズのパケット手段 によって、データをプロセッサ1″へ転送する。プロセッサ1n-1によって、デ ータをプロセッサ1n-2と1nに同時に転送する。例えば、通信に参加しているプ ロセッサの転送権限が順番で与えられるようなデマルチプレックス(逆多重化) トークンリングにおける通信システム以外の、本発明による通信システムでは、 数個のプロセッサからのデータに同時にアクセスできるような、マルチプレック ス(多重化)動作が可能となる。このことは、個々のプロトコルインストラクシ ョンの高度なフレキシビィリティによるものである。これらプロトコルインスト ラクションはデータの通信のみに限定されるが、通信用プロセッサを、外部的且 つ階層的に呼出す必要がない事実のために、通信すべきデータのサイズに対応す る伝送帯域幅を、数個の、より狭く、且つ独立した伝送チャネルに分割すること ができる。通信の方向が予じめ決められていないので、その結果として、プロセ ッサ1n-1は、プロセッサ1n-2と1nと逆方向に通信するようになる。通常、シ ーケンス(順序)および方向も、通信中変更可能である。 また、別の実施例では、第1図〜第5図の構造を有する本発明の通信システム を、ハイパープロセッサとして見なすことができる。このハイパープロセッサを 、他の通信システムと通信を行なうインテリジェント通信コントローラに設ける こ ともできる。上述の説明に従って、このようなハイパープロセッサを数台、一緒 に結合することができ、このことによって、ハイパー/ハイパープロセッサが得 られると共に、このような繰返えしを、無限に実行できる。このことによって、 極めて大型で且つ、強力なスーパーコンピュータを構築することができる。この ようなハイパープロセッサは、これまでに説明したような広範囲なアーキテクチ ュアを有している。従って、一好適実施例によれば、数個のリング状通信システ ムを以下の方法で互いに結合することができる。即ち、これら通信システムは、 インテリジェント通信コントローラを経て互いに通信できると共に、1台のハイ パープロセッサは、サーバー/クライアントアーキテクチュアの観念において、 マスタとなるように結合する。また他の実施例によれば、他の異なった構造のア ーキテクチュアを、相互に、ハイパープロセッサのリニア、マトリックスまたは ツリー構造に結合することができる。また、本発明の技術知識に基いて、エキス パートによれば、多数の変形例を創作することができる。

Claims (1)

  1. 【特許請求の範囲】 1.データ処理用マルチプロセッサシステムを並列動作させるに当り、このマ ルチプロセッサシステムのプロセッサは個々のデータメモリ、インストラクショ ンメモリを有すると共に、共通の通信システムとインターフェイスし、この共通 の通信システムを全体として、シーケンスの実行における最重要点に対してプロ グラムし、これに対応して、自律的な手法で動作させ、通信に先立って、これら 個々のプロセッサのメモリに、個々のアルゴリズム、データセットおよびプロト コルインストラクションを供給し、これら個々のプロセッサによってこれらデー タセットをアルゴリズムで独立して処理し、個々の結果を演算し、これら個々の 結果のすべてを、前記プロトコルインストラクションに対応するデータとして、 通信用に、すべてのプロセッサに対して、自律的な形態で提供するようにしたマ ルチプロセッサシステム並列動作方式。 2.前記個々のプロセッサによって、前記プロトコルインストラクションに従 って独立してデータを送信/受信する場合に、自律性が存在するようにした請求 項1記載の方式。 3.前記自律性は、前記通信プロトコルに従って、通信したデータで、それら の個々のデータセットを独立して更新する個々のプロセッサより構成され、これ らプロセッサによって、個々のアルゴリズムを、前記独立の、更新した個々のデ ータセットで更に処理するようにした請求項1または2記載の方式。 4.前記個々のプロセッサによって、通信したデータを計数することにより、 これら個々のデータセットを自律的に更新するようにした請求項3記載の方式。 5.前記自律性は、通信パケットサイズを有するスケジュールから成り、これ らパケットサイズを、通信に先立って、前記プロトコルインストラクションに対 応する個々のプロセッサ間で固定するようにした請求項1〜4のいずれかに記載 の方式。 6.同様に大きな通信パケットサイズを前記個々のプロセッサ間で利用するよ うにした請求項5記載の方式。 7.それぞれ異なった大きさの通信パケットサイズを前記個々のプロセッサ間 で利用するようにした請求項5記載の方式。 8.前記自律性は、前記個々のプロセッサ間の伝送の帯域幅より成り、この帯 域幅を、通信に先立って、前記プロトコルインストラクションに従って固定する ようにした請求項1〜5のいずれかに記載の方式。 9.マルチプレックス動作が、数個のプロセッサから、数個の伝送帯域を介し てのデータにアクセスして実行される請求項8記載の方式。 10.前記伝送帯域を、通信すべきデータのサイズに担当する、数個のより狭く 、且つ独立した伝送チャネルに分割するようにした請求項9記載の方式。 11.前記個々のプロセッサは、前記通信システムに対して、インターフェイス を介して、データを送信/受信することによって、互いに通信のみを行なうよう にした請求項1〜10のいずれかに記載の方式。 12.個々のデータセットからの変更したデータをデータとして通信するように した請求項11記載の方式。 13.前記個々のプロセッサは、通信コントローラを有し、これら通信コントロ ーラによって、インターフェイスを介して、前記通信システムへのデータメモリ の開放および閉鎖をコントロールするようにした請求項1〜12記載の方式を実 行する通信システム。 14.前記通信コントローラは、前記個々のプロセッサとは独立して動作すると 共に、これら個々のプロセッサは、前記データメモリの開放/閉鎖ならびに前記 インターフェイスを介しての通信とは独立して動作するようにした請求項13記 載の通信システム。 15.数個の通信コントローラをモジュール上で一緒に組合わせた請求項13記 載の通信システム。 16.前記通信コントローラを有するプロセッサを閉鎖したリング内に配置した 請求項13記載の通信システム。 17.前記通信コントローラを、バス手段によって相互接続した請求項16記載 の通信システム。 18.前記通信コントローラの1つまたはそれ以上を、1つまたはそれ以上の共 有可能な算術ユニットとして動作させ、1つまたはそれ以上のプロセッサによっ て、データを前記通信コントローラに自律的に送給し、ここで演算を実行するよ うにした請求項13記載の通信システム。 19.前記通信コントローラの1つまたはそれ以上を、動作メカニズムとして動 作させ、1つまたはそれ以上のプロセッサによって、データを前記通信コントロ ーラに自律的に送給すると共に、これら通信コントローラによって、データを1 つまたはそれ以上のプロセッサに転送した請求項13記載の通信システム。 20.請求項13〜19のいずれかに記載の通信システムから構築されたハイパ ープロセッサにおいて、このハイパープロセッサに、更に、通信コントローラを 設け、これによって、他のハイパープロセッサと通信可能としたハイパープロセ ッサ。 21.数個のハイパープロセッサを互いに結合した請求項20記載のハイパープ ロセッサ。 22.数個のハイパープロセッサを、互いに、階層的に結合した請求項21記載 のハイパープロセッサ。
JP7503195A 1993-06-30 1994-06-24 インテリジェント通信システム Ceased JPH08501403A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CH197293 1993-06-30
CH1972/93-6 1993-06-30
PCT/CH1994/000133 WO1995001604A1 (de) 1993-06-30 1994-06-24 Intelligentes kommunikations-system

Publications (1)

Publication Number Publication Date
JPH08501403A true JPH08501403A (ja) 1996-02-13

Family

ID=4222929

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7503195A Ceased JPH08501403A (ja) 1993-06-30 1994-06-24 インテリジェント通信システム

Country Status (6)

Country Link
US (1) US5671430A (ja)
EP (1) EP0657048B1 (ja)
JP (1) JPH08501403A (ja)
AT (1) ATE183836T1 (ja)
DE (1) DE59408657D1 (ja)
WO (1) WO1995001604A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017504870A (ja) * 2013-12-02 2017-02-09 マイクロン テクノロジー, インク. 自律的メモリの方法及びシステム
US10769097B2 (en) 2009-09-11 2020-09-08 Micron Technologies, Inc. Autonomous memory architecture

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3125842B2 (ja) * 1995-03-03 2001-01-22 株式会社日立製作所 並列計算機での通信処理方法及びそのシステム
JPH10232788A (ja) * 1996-12-17 1998-09-02 Fujitsu Ltd 信号処理装置及びソフトウェア
US5784383A (en) * 1997-10-02 1998-07-21 International Business Machines Corporation Apparatus for identifying SMP bus transfer errors
US6477143B1 (en) 1998-01-25 2002-11-05 Dror Ginossar Method and apparatus for packet network congestion avoidance and control
JP2001027951A (ja) * 1999-07-14 2001-01-30 Fujitsu Ltd マルチプロセッサ構成の情報処理システムにおけるファイルロード装置と記録媒体
AU2003285949A1 (en) * 2002-10-22 2004-05-13 Isys Technologies Non-peripherals processing control module having improved heat dissipating properties
CN102043446A (zh) * 2002-10-22 2011-05-04 贾森·A·沙利文 用于提供动态模块处理单元的系统及方法
EP1557074A4 (en) 2002-10-22 2010-01-13 Sullivan Jason ROBUST ADJUSTABLE COMPUTER PROCESSING SYSTEM
US7007128B2 (en) * 2004-01-07 2006-02-28 International Business Machines Corporation Multiprocessor data processing system having a data routing mechanism regulated through control communication
US7308558B2 (en) * 2004-01-07 2007-12-11 International Business Machines Corporation Multiprocessor data processing system having scalable data interconnect and data routing mechanism
US20070233805A1 (en) * 2006-04-02 2007-10-04 Mentor Graphics Corp. Distribution of parallel operations
US7990724B2 (en) 2006-12-19 2011-08-02 Juhasz Paul R Mobile motherboard
US9779138B2 (en) 2013-08-13 2017-10-03 Micron Technology, Inc. Methods and systems for autonomous memory searching

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IT1151683B (it) * 1982-07-06 1986-12-24 Honeywell Inf Systems Sistema multiprocessore a bus asincrono con caricamento di microistruzioni da memoria di lavoro
CA1293819C (en) * 1986-08-29 1991-12-31 Thinking Machines Corporation Very large scale computer
US4873626A (en) * 1986-12-17 1989-10-10 Massachusetts Institute Of Technology Parallel processing system with processor array having memory system included in system memory
US5321825A (en) * 1991-06-18 1994-06-14 Advanced Micro Devices, Inc. Processing system with lock spaces for providing critical section access
US5423008A (en) * 1992-08-03 1995-06-06 Silicon Graphics, Inc. Apparatus and method for detecting the activities of a plurality of processors on a shared bus
US5517656A (en) * 1993-06-11 1996-05-14 Temple University Of The Commonwealth System Of Higher Education Multicomputer system and method

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10769097B2 (en) 2009-09-11 2020-09-08 Micron Technologies, Inc. Autonomous memory architecture
US11586577B2 (en) 2009-09-11 2023-02-21 Micron Technology, Inc. Autonomous memory architecture
JP2017504870A (ja) * 2013-12-02 2017-02-09 マイクロン テクノロジー, インク. 自律的メモリの方法及びシステム
US10003675B2 (en) 2013-12-02 2018-06-19 Micron Technology, Inc. Packet processor receiving packets containing instructions, data, and starting location and generating packets containing instructions and data
JP2018139118A (ja) * 2013-12-02 2018-09-06 マイクロン テクノロジー, インク. 自律的メモリの方法及びシステム
US10778815B2 (en) 2013-12-02 2020-09-15 Micron Technology, Inc. Methods and systems for parsing and executing instructions to retrieve data using autonomous memory

Also Published As

Publication number Publication date
ATE183836T1 (de) 1999-09-15
EP0657048B1 (de) 1999-08-25
WO1995001604A1 (de) 1995-01-12
US5671430A (en) 1997-09-23
DE59408657D1 (de) 1999-09-30
EP0657048A1 (de) 1995-06-14

Similar Documents

Publication Publication Date Title
JPH08501403A (ja) インテリジェント通信システム
Nowatzyk et al. The S3. mp scalable shared memory multiprocessor
US5664214A (en) Parallel processing computer containing a multiple instruction stream processing architecture
JP3411273B2 (ja) プロセッサでのデータ処理方法及びデータ処理システム
US5717854A (en) Multimedia server having a plurality of stream controllers directly connected to the network
JPH065527B2 (ja) 通信ネットワークアダプタ
US11645225B2 (en) Partitionable networked computer
JP3206126B2 (ja) 分散クロスバー・スイッチ・アーキテクチャにおけるスイッチング・アレイ
Li et al. Efficient online scheduling for coflow-aware machine learning clusters
Luo et al. Optimizing multicast flows in high-bandwidth reconfigurable datacenter networks
JP2001216279A (ja) リアルタイム・システム用時分割多重メモリーを用いた、複数のプロセッサーのインターフェース及び、同期化及びアービトレーション方法
Li et al. Co-Scheduler: A coflow-aware data-parallel job scheduler in hybrid electrical/optical datacenter networks
Aziz et al. A near optimal scheduler for switch-memory-switch routers
US11614946B2 (en) Networked computer
CN113608861A (zh) 一种软件化载荷计算资源虚拟化分配方法及装置
Jones et al. Practical experience of run‐time link reconfiguration in a multi‐transputer machine
Dannenberg et al. A system supporting flexible distributed real-time music processing
Frazier Ariel: A scalable multiprocessor for the simulation of neural networks
US11169956B2 (en) Networked computer with embedded rings field
Santana-Santana et al. Load balancing algorithms with partial information management for the dlml library
JPH11120157A (ja) 並列コンピュータシステム内の高速通信のための方法及びこの方法によって操作される並列コンピュータシステム
Li et al. Bi-Transfer: A Data Packet Allocation Module with Chaining Transmission Mode
Macharia CLD:-A novel approach to dynamic load balancing
Murta Support for Transputer Based Program Development via Run-Time Link Reconfiguration
Wu et al. Flow control support for efficient realization of the EDA model

Legal Events

Date Code Title Description
A313 Final decision of rejection without a dissenting response from the applicant

Free format text: JAPANESE INTERMEDIATE CODE: A313

Effective date: 20040426

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20040525