JP5158091B2 - 自律または共通制御されるpeアレイを有するシステムのためのデータ転送ネットワークおよび制御装置 - Google Patents

自律または共通制御されるpeアレイを有するシステムのためのデータ転送ネットワークおよび制御装置 Download PDF

Info

Publication number
JP5158091B2
JP5158091B2 JP2009538540A JP2009538540A JP5158091B2 JP 5158091 B2 JP5158091 B2 JP 5158091B2 JP 2009538540 A JP2009538540 A JP 2009538540A JP 2009538540 A JP2009538540 A JP 2009538540A JP 5158091 B2 JP5158091 B2 JP 5158091B2
Authority
JP
Japan
Prior art keywords
processing element
access
data
element group
access controller
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2009538540A
Other languages
English (en)
Other versions
JP2010520519A (ja
Inventor
リースケ、ハンノ
昭倫 京
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of JP2010520519A publication Critical patent/JP2010520519A/ja
Application granted granted Critical
Publication of JP5158091B2 publication Critical patent/JP5158091B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F13/14Handling requests for interconnection or transfer
    • G06F13/16Handling requests for interconnection or transfer for access to memory bus
    • G06F13/1605Handling requests for interconnection or transfer for access to memory bus based on arbitration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/76Architectures of general purpose stored program computers
    • G06F15/80Architectures of general purpose stored program computers comprising an array of processing units with common control, e.g. single instruction multiple data processors
    • G06F15/8007Architectures of general purpose stored program computers comprising an array of processing units with common control, e.g. single instruction multiple data processors single instruction multiple data [SIMD] multiprocessors

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Computing Systems (AREA)
  • Multi Processors (AREA)
  • Advance Control (AREA)

Description

本発明は、データ転送帯域コスト低減のためのアーキテクチャデザインに関し、特に、配線領域の削減方法、最大限のデュアルモードプロセッサの適用性を提供するとともに、面積要件に関し最適化されたデザインに到達するために自律制御または共通制御されるプロセッシングエレメント(PE)を有するアーキテクチャの制御方法に関する。
現在まで、1回の命令で多重データストリームを操作する(SIMD)方式や複数の命令ストリームで多重データストリームを操作する(MIMD)方式の数多くのプロセッサが提案されてきている。前者の方式のプロセッサのアーキテクチャは特許文献1に開示されている。前者のタイプのプロセッサの多くは、規則的なデータと制御フローを伴う独立したデータの低レベルのタスクの処理や、規則的なデータアクセスであるが不規則なデータと制御フローを伴う中レベルのタスクの処理といった計算上高コストな処理に用いられている。後者のタイプのプロセッサのアーキテクチャは特許文献2に開示されている。後者のタイプのプロセッサは、不規則なデータと制御フローを伴う不規則な入力データの処理に向いている。これは、MIMDプロセッサが規則的な入力データを伴うタスク実行中には、本来なら共通化可能な回路でも複数存在することになってしまう一方で、SIMDプロセッサ(複数)が不規則な入力データを伴うタスクを実行する場合には、稼動されない回路(プロセッシングエレメント)が多数発生してしまうという問題に帰着する。
H.264のように多くの近年提案されているアルゴリズムは、前記部分的にSIMD制御方式とMIMD制御方式に従うサブアルゴリズムによって構成されている。そこで、新しいデュアルモードのSIMD/MIMDアーキテクチャがいくつか提案されている。これらアーキテクチャの多くは、MIMDアプローチを起点とし、SIMD機能を有効化するための追加のクロスバを追加している。特許文献3から6は、その例である。他のいくつかのアプローチとしては、特許文献7のように、SIMDユニットと、MIMDユニットをそれぞれ所定数加えていくことによりSIMDとMIMDの処理能力を固定した割合を持つものがある。また特許文献8のように、メモリ管理機能を持たないプロセッシングエレメントのアレイにメモリ管理機能を持った所謂ユーザコンピュータの数を加算していくことによるアプローチも提案されている。
下記は、特許文献のリストである。
米国特許第3537074号明細書 米国特許第4837676号明細書 米国特許第5212777号明細書 米国特許第5239654号明細書 米国特許第5522083号明細書 米国特許第5903771号明細書 米国特許第5355508号明細書 米国特許第6487651号明細書
なお、上記特許文献1−8の全開示内容はその引用をもって本書に組み入れられ、また、必要に応じ参照される。
本発明に基づく分析によれば、上記した各アプローチは、共通して、外部メモリと内部メモリを持つプロセッシングエレメント間のデータ転送のために複雑なクロスバを必要としている。これは、例えば、デュアルモードSIMD/MIMDアーキテクチャのように、自律制御も共通制御も可能なプロセッシングエレメントを持つアーキテクチャのため、データバス上の大きな配線面積要件となる。このように、本技術には多くの解決課題がある。
従って、本発明の目的は、複数のプロセッシングエレメント(以下、「PE」と称する。)を持つプロセッサおよびプロセッシングシステムであって、各PE間を接続するための配線面積を削減できる新規なプロセッサおよびプロセッシングシステムを提供することにある。
本発明の別の目的は、それぞれ自律または共通制御されるPEのアレイを持つプロセッサおよびプロセッシングシステムのための新規なソリューションを提供することにある。
本発明のさらなる目的は、データバス用の配線面積要件に関して、前記自律または共通制御されるPEのアレイを持つプロセッサおよびプロセッシングシステムを改良することにある。
本発明のその他の目的は本明細書の全開示内容によって明らかにされる。
本発明によれば、総じて、望ましくはリング状にすべてのプロセッシングエレメントとグローバルなデータ転送制御部を順次接続するパイプラインバスシステムを用いることによって、前記削減が達成される。
より具体的には、本発明は種々の視点を提供する。
本発明の第1の視点によれば、共通コントローラの同一プログラムを実行する第1のプロセッシングエレメント群と、他のプロセッシングエレメントのプログラムとは独立してそれぞれ固有のプログラムを実行する第2のプロセッシングエレメント群と、前記第1、第2のプロセッシングエレメント群を順次接続するパイプラインネットワークと、を備えるプロセッサが提供される。
本発明の第2の視点によれば、前記プロセッサは、さらに、前記第1、第2のプロセッシングエレメント群の各プロセッシングエレメントにそれぞれ接続されたアクセス制御線を有し、前記各プロセッシングエレメントと前記ネットワークとの間のデータアクセスタイミングを制御するアクセスコントローラを備えている。
本発明の第3の視点によれば、前記第1のプロセッシングエレメント群からのデータアクセスタイミングと前記第2のプロセッシングエレメント群からのデータアクセスタイミングとの関係が異なっている。
本発明の第4の視点によれば、前記第1のプロセッシングエレメント群へのデータアクセスは、前記各第1のプロセッシングエレメント群が前記ネットワークに同一のタイミングスロットでアクセスする並列アクセスであり、前記第2のプロセッシングエレメント群へのデータアクセスは、前記各第2のプロセッシングエレメント群が前記ネットワークに独立してアクセスするスタンドアロン型アクセスである。
本発明の第5の視点によれば、前記アクセスコントローラは、前記ネットワークの利用効率の増大(向上)を達成できるよう前記ネットワークを制御する。
本発明の第6の視点によれば、前記アクセスコントローラは、一のプロセッシングエレメントに対する所定のバスアクセス待ち時間を保持するよう前記ネットワークを制御する。
本発明の第7の視点によれば、前記アクセスコントローラは、前記並列アクセスまたは各プロセッシングエレメントへのデータアクセスタイミングが割り当てられている場合のスタンドアロン型アクセスよりも、一のスタンドアロン型アクセスに高い優先度を割り当てる。
本発明の第8の視点によれば、前記アクセスコントローラは、各プロセッシングエレメントへのデータアクセスタイミングが割り当てられている場合のスタンドアロン型アクセスよりも、並列アクセスに高い優先度を割り当てる。
本発明の第9の視点によれば、前記アクセスコントローラは、各プロセッシングエレメントに対する所定のバスアクセス待ち時間を保持するよう前記ネットワークを制御する。
本発明の第10の視点によれば、前記アクセスコントローラは、要求されたデータの送信に要する時間を最小化するよう各プロセッシングエレメントへのデータアクセスタイミングを決定する。
本発明の第11の視点によれば、前記各プロセッシングエレメントは、前記第1のプロセッシングエレメントまたは前記第2のプロセッシングエレメントのいずれかに設定可能であり、前記アクセスコントローラは、前記第1のプロセッシングエレメントとして利用されているプロセッシングエレメントと、前記第2のプロセッシングエレメントとして利用されているプロセッシングエレメントと、を判別する。
本発明の第12の視点によれば、前記プロセッサは、前記第1、第2のプロセッシングエレメント群へのデータ転送要求を調停するアービトレーション部を備える。
本発明の第13の視点によれば、前記第1のプロセッシングエレメントは、SIMD(Single Instruction Multiple Data)アーキテクチャのプロセッシングエレメントであり、前記第2のプロセッシングエレメントは、MIMD(Multiple Instruction Multiple Data)アーキテクチャのプロセッシングエレメントである。
本発明の第14の視点によれば、前記パイプラインネットワークは、パイプラインリングネットワークである。
本発明の第15の視点によれば、各プロセッシングエレメントにそれぞれ接続されたアクセス制御線を有するアクセスコントローラであって、前記各プロセッシングエレメントは、前記アクセスコントローラの同一プログラムを実行する第1のプロセッシングエレメント群と、他のプロセッシングエレメントのプログラムとは独立してそれぞれ固有のプログラムを実行する第2のプロセッシングエレメント群と、を備え、前記第1、第2のプロセッシングエレメント群はパイプラインネットワークを介して順次接続されており、前記アクセスコントローラは、前記各プロセッシングエレメントと前記パイプラインネットワークとの間のデータアクセスタイミングを制御するアクセスコントローラが提供される。
本発明の更なる視点において、前記アクセスコントローラは、前記各視点において述べられたプロセッサのいずれか一つと連携する構成を採ることができる。
更なる視点において、第1のプロセッシングエレメント群により、共通コントローラの同一プログラムを実行するステップと、第2のプロセッシングエレメント群により、他のプロセッシングエレメントのプログラムとは独立してそれぞれ固有のプログラムを実行するステップと、前記第1、第2のプロセッシングエレメント群をパイプラインネットワークで順次接続するステップと、を含むプロセッシング方法が提供される。
更なる視点において、アクセス制御線を有するアクセスコントローラの制御方法が提供される。このアクセスコントローラの制御方法は、各プロセッシングエレメントにそれぞれアクセス制御線を用意することを含み、さらに、第1のプロセッシングエレメント群により、前記アクセスコントローラの同一プログラムを実行するステップと、第2のプロセッシングエレメント群により、他のプロセッシングエレメントのプログラムとは独立してそれぞれ固有のプログラムを実行するステップと、前記第1、第2のプロセッシングエレメント群をパイプラインネットワークで順次接続するステップと、前記アクセスコントローラにより、前記各プロセッシングエレメントと前記パイプラインネットワークとの間のデータアクセスタイミングを制御するステップとを含むことにより、前記各プロセッシングエレメントを制御する。
本発明の効果は次のように要約される。
まず、チップエリア要件において2つの効果が達成される。その一つは、グローバルデータ転送制御部とすべてのデータ信号の接続数が、プロセッシングエレメントの数の逆数まで削減され、グローバルデータ転送部の周囲の配線エリアを小さくできることである。さらに、クリティカルパス長の問題を防止するのに必要とされることがある特別な駆動セルも不要となるため、これらデータ信号の配線長を削減することができる。
図1は、各PEが自律制御または共通制御され、GCU(グローバル制御部)に接続されたパイプラインデータ転送ネットワークを持つ、8PEアーキテクチャの模式図である。 図2は、外部メモリアクセスのためのアービタの例を表した模式図である。 図3は、PE内部メモリユニットへの制御されたアクセスのための信号選択ロジックの用法を表した模式図である。 図4は、デュアルモードSIMD/MIMDアーキテクチャの例におけるデータおよび制御信号転送ネットワークを表した模式図である。 図5は、アービタからMIMDモードで動作するプロセッシングエレメント(PE2)へのデータ転送のタイミングチャートである。 図6は、アービタからSIMDモードで動作するすべてのPEへのデータ転送のタイミングチャートである。
図1は、グローバル制御部(GCU)101と、自律制御型102または共通制御型のいずれにもなりうる8つのプロセッシングエレメント(PE)のアレイと、前記GCUとすべてのPEを順次接続するデータ転送ネットワークとしてのパイプラインバス104と、を備えるアーキテクチャ形態の一例を示している。それぞれのPEの動作モードは、モード決定部にて自由に選択可能であるが、本形態では、奇数番のPEが共通制御に設定され、偶数番のPEが自律制御に設定されているものとする。
上記のようなアーキテクチャにおける各PEから外部メモリへのデータ転送のため、外部メモリアービタ201が追加される。このアービタにおいて前記共通制御のためのGCUからのリクエスト(複数)と、自律制御型PEからのリクエスト(複数)は、図2に示すように処理される。この処理は、いくつかの異なる方法により行うことが可能である。まず第1に、共通制御されているPE群が継続して急いで処理すべきいくつかのタスクに取り掛かっているとき、グローバルコントローラリクエストにプライオリティが付与される。または第2に、ある一つの自律制御型PEが継続して急いで処理すべきタスクに取り掛かっているとき、当該自律制御型PEにプライオリティが付与される。その他、データを送信するために必要な期間を最小化し、または、本形態で用いているように、同一のプライオリティのリクエストの送信元には、アクセス待ち時間が最も長いユニットにアクセスを与えるように、プライオリティを付与する方法を採りうる。
本形態の全体において、4つの異なるリクエストのタイプが、主アービトレーション部202にて調停される。そのうちの3つは、GCU205からの共通制御されるPE群のための、命令キャッシュとデータキャッシュとPE IMEM(Internal MEMory)データ転送制御である。残る一つは、自律制御型PE群からのPEのIMEMリクエストである。最後のリクエストは、各自律制御型PEから到着しうるので、まず、本形態の如くプライオリティを持つ自律制御型PE群のために次のことを行う。即ち、リクエスト選択ロジックとパラメータ決定ロジックとからなる事前アービトレーションロジック203にて次に受理されるアクティブな自律制御型PEの選択が行われる。前記リクエスト選択ロジックは、第1段階において、葉ノードの情報と子の親ノードの情報を受け取る「OR」操作からなるPEリクエストを用いて、葉ノードからルートに到るリクエスト・ツリーを生成する。第2段階において、前記リクエスト・ツリーの親ノードの「最後の子ノード(Last Child taken)」の情報を更新しながら、ルートから葉ノードをたどっていき、最も長い間使われておらず、かつ、現在リクエストを行っているPEが探索される。その後、パラメータ決定ロジックへのリクエストによって、アクティブなPEからのパラメータが取得され、アービタ(ユニット)内の主アービトレーション部に渡される。前記本形態の如くパラメータ決定ロジックは、現にアクティブとなっているPEに関する情報がすべてのPEに送信され、現に非アクティブとなっているPEがそれぞれゼロベクトルを送信することによってそれぞれのリクエストパラメータを無効化(disable)にするとの前提の下では、本形態の如く簡単な「OR」ゲートで構成することができる。PEが自律制御モードで動作しているか、共通制御モードで動作しているかの判定は、アービタのアクセスコントローラ204内で行われる。この割り当て(配置)は、ネットワークの高い効率を達成するためにラインタイム中、変更されうる。
セレクタ(ユニット)301を介したモードに応じて、アービタ内のPE IMEM部ユニット302への正しい制御線303を選択することによって、自律制御および共通制御PE群のための異なるアクセス方式が実行される(図3参照)。自律制御型PEへのデータ転送の場合、一度には唯一つのIMEMがアクセスされる。一方、共通制御型PEへのデータ転送に際しては、すべての共通制御型PE IMEMユニットは同時にアクセスされる。
図4に、デュアルモードSIMD/MIMDアーキテクチャの例を示す。同図に示されたように、このアーキテクチャは、IMEMおよびリングバスレジスタRを含み、MIMD型の処理を実行可能となって自律制御またはSIMD型の処理を実行可能となって共通制御のいずれかで動作可能なPE群401と、外部メモリアービタ402を有するGCUとを備えている。ここで、前記コンセプトに捉われることなく、MIMD制御されるPE群に代えて、MISD(Multiple Instruction Single Data)制御されるPE群を選択することもできる。本実施例のアーキテクチャにおける転送ネットワークは、前記PE群と、外部メモリアービタを備えたGCU間のアドレス及び制御信号のための制御線403が非パイプラインとなり、信号と直接接続されるようになっている。一方、データ信号は、一方向性のパイプラインリングバスシステム404上を転送させる。このパイプラインリングバスシステム404により、第1に配線面積の削減が実現され、第2にクリティカルパス長の低減が実現されている。さらに、このようなバスシステムは、双方向ネットワークの問題を生じさせることなく、前記アービタからPE IMEMへのデータ転送のみならず、PE IMEMからアービタへのデータ転送を可能としている。
[実施例]
図4に示したシステムにおいて、異なるPE制御方式についてそれぞれ異なる転送方法が提供される。図5は、アービタから自律制御型のプロセッシングエレメントPE2への3バイトのD0、D1、D2のリード転送の例のタイミングブロック図である。図5に示したように、アービタ内部での現にアクティブなPEの選択後、MIMDモードで動作するPEからのリクエストREQが行われると、アービタによってデータ転送が開始・制御される。PE選択(SEL)、PE番号(NO)、レジスタシフト(SFT)、データロード(LD)、データストア(ST)といった信号をアービタ内部で正確に設定し、適宜設定されたパスを設定するためにこれら信号を各PEに直接転送することによって、前記データは、パイプラインリングバスのレジスタPER上を転送され、指定されたPEにストアされる、
MIMDモードで動作するPEからのリードリクエストデータのためのデータ転送リクエストは、一つのPE IMEMに一度に送信される。これに対し、SIMDモードでは、SIMDモード(アクティブ)で動作するすべてのPEからIMEMは同時に満たされる。それゆえ、D0からD7までの第1のデータは、前記アービタからパイプラインリングバスのすべてのレジスタPERに転送される。そして、図6のタイミングチャートに示すように、現にアクティブなPEのため前記データは前記レジスタからメモリモジュールにロードされる。8つのPEを持つ図1のアーキテクチャにおけるリードリクエストのため、すべての奇数番のPE群がSIMDモードにてアクティブであり、これらアクティブなPEのためのデータロード制御信号(LDPEn)が転送終了のクロックサイクルでセットされる。その他のデータロード制御信号およびすべてのデータストア信号(STPEn)は変更されず、ゼロ値を保持する。
アービタ内における現在IMEMに転送している種類についての情報はリクエスト元によって供給される。MIMDモードにおいては自律制御型のPEであり、SIMDモードでは、GCUである。一方、PEが自律制御モードであるかまたは共通制御モードであるかといった決定は、アービタ内のアクセスコントローラによって行われる。
次の実施例は、本発明のより望ましい変形例を提供するものである。
デュアルモードSIMD(Single Instruction Multiple Data)/MIMD(Multiple Instruction Multiple Data)アーキテクチャのデータは、外部メモリと、内部メモリを持つプロセッシングエレメントとの間を転送させる必要がある。これは、多数のPEを有するアーキテクチャの場合に、データバスのため配線エリア要件が厳しくなるという問題の原因となっている。
この問題は、PE毎に自律制御または共通制御のいずれかに設定できるPE群を備えた今回新しく提案する構成のアーキテクチャによって解決される。このデュアルモードSIMD/MIMDアーキテクチャは、データ転送ネットワークとして、すべてのPEと、外部メモリアービタを備えるグローバル制御部とを順次接続する、パイプラインバスシステム(望ましくはリング型)を用いることによって、前記配線エリア要件を緩和することができる。上記のようなネットワークを介したデータ転送は、MIMDモードにおいて単一のPEに対して一度に行われる。例えば、当該IMEMへのパスを開くとともにその他すべてのPE IMEMユニットへのパスを閉じ、アービタからパイプライン(リング)バスを介して目的のPEにデータを遷移させることによってPE IMEMにデータを転送することで、一度にデータ転送が行われる。反対に、SIMDモードでは、アービタからバスへの正確な数のデータワードを解放し、データワードがパイプラインバス上の目的のレジスタに到達するまで前記パイプライン(リング)バスを介して前記データを遷移させることで、データはすべての共通制御されるPEに同時に送信される。その後、前記共通制御されるPE群のためのIMEMユニットへのオープン・パスを設定することによって、データはすべての共通制御されるPE群からそのIMEMユニットに同時にストアされる。
本発明は、エンベデッドシステム用のハイパフォーマンスプロセッサデザインを達成するために用いることができる。
本発明のその他目的、特徴および側面は、全開示(請求の範囲を含む)に表されていることに留意されたい。また、添付した請求の範囲に記載された範囲に捉われることなく、開示した実施形態の枠内において、変更・調整が可能である。
また、本発明の請求の範囲の枠内において種々の開示要素の多様な組み合わせないし選択が可能である。すなわち、本発明は、請求の範囲を含む全開示、技術的思想にしたがって当業者であればなし得るであろう各種変形、修正を含むことは勿論である。
101:命令キャッシュとデータキャッシュを含み、共通制御されるプロセッシングエレメントのための共通コントローラとして動作するグローバル制御部(GCU)
102:自律制御型PE、PEは自身の制御部を用いる
103:共通制御型PE,PEはGCU内の共通の制御部を用いる
104:データ信号転送用レジスタ(R)を持つパイプラインリングバス
201:アービタ、主アービトレーション部と、事前アービトレーション部と、アクセスコントローラとから構成される
202:アービタ内の主アービトレーション部
203:リクエスト選択ロジックおよびリクエストパラメータ決定ロジックからなる自律制御型PEのリクエストための事前アービトレーション部
204:PE群とネットワーク間のアクセスタイミングを制御するアクセスコントローラ
205:GCU、共通制御型PE群のための命令キャッシュ、データキャッシュよびPEのIMEMデータ転送制御部を含む
301:自律制御型および共通制御型PE群に転送される制御信号の制御のためのセレクタ
302:PE IMEM
303:制御線
401:IMEMとリングバスレジスタ(R)を持つPE
402:データ信号転送制御用の外部メモリアービタを持つGCU
403:PEとネットワーク間のアクセスタイミング制御用のアクセス制御線
404:データ信号転送用の一方向性パイプラインリングバス

Claims (11)

  1. 共通コントローラの同一プログラムを実行する第1のプロセッシングエレメント群と、
    他のプロセッシングエレメントのプログラムとは独立してそれぞれ固有のプログラムを実行する第2のプロセッシングエレメント群と、
    前記第1、第2のプロセッシングエレメント群を順次接続するパイプラインネットワークと、
    前記第1、第2のプロセッシングエレメント群の各プロセッシングエレメントにそれぞれ接続されたアクセス制御線を有し、前記各プロセッシングエレメントと前記パイプラインネットワークとの間のデータアクセスタイミングを制御するアクセスコントローラと、
    を備え
    前記第1のプロセッシングエレメント群からのデータアクセスタイミングと前記第2のプロセッシングエレメント群からのデータアクセスタイミングとの関係が異なっており、
    前記第1のプロセッシングエレメント群へのデータアクセスは、前記各第1のプロセッシングエレメント群が前記ネットワークに同一のタイミングスロットでアクセスする並列アクセスであり、
    前記第2のプロセッシングエレメント群へのデータアクセスは、前記各第2のプロセッシングエレメント群が前記ネットワークに独立してアクセスするスタンドアロン型アクセスである、
    プロセッサ。
  2. 請求項のプロセッサにおいて、
    前記アクセスコントローラは、一のプロセッシングエレメントに対する所定のバスアクセス待ち時間を保持するよう前記ネットワークを制御するプロセッサ。
  3. 請求項のプロセッサにおいて、
    前記アクセスコントローラは、前記並列アクセスまたは各プロセッシングエレメントへのデータアクセスタイミングが割り当てられている場合のスタンドアロン型アクセスよりも、一のスタンドアロン型アクセスに高い優先度を割り当てるプロセッサ。
  4. 請求項からいずれか一のプロセッサにおいて、
    前記アクセスコントローラは、各プロセッシングエレメントへのデータアクセスタイミングが割り当てられている場合のスタンドアロン型アクセスよりも、並列アクセスに高い優先度を割り当てるプロセッサ。
  5. 請求項からいずれか一のプロセッサにおいて、
    前記各プロセッシングエレメントは、前記第1のプロセッシングエレメントまたは前記第2のプロセッシングエレメントのいずれかに設定可能であり、
    前記アクセスコントローラは、前記第1のプロセッシングエレメントとして利用されているプロセッシングエレメントと、前記第2のプロセッシングエレメントとして利用されているプロセッシングエレメントと、を判定するプロセッサ。
  6. 各プロセッシングエレメントにそれぞれ接続されたアクセス制御線を有するアクセスコントローラであって、
    前記各プロセッシングエレメントは、
    前記アクセスコントローラの同一プログラムを実行する第1のプロセッシングエレメント群と、
    他のプロセッシングエレメントのプログラムとは独立してそれぞれ固有のプログラムを実行する第2のプロセッシングエレメント群と、を備え、
    前記第1、第2のプロセッシングエレメント群はパイプラインネットワークを介して順次接続されており、
    前記アクセスコントローラは、前記各プロセッシングエレメントと前記パイプラインネットワークとの間のデータアクセスタイミングを制御し、かつ、
    前記第1のプロセッシングエレメント群からのデータアクセスタイミングと前記第2のプロセッシングエレメント群からのデータアクセスタイミングとの関係が異なっており、
    さらに、
    前記第1のプロセッシングエレメント群へのデータアクセスは、前記各第1のプロセッシングエレメント群が前記ネットワークに同一のタイミングスロットでアクセスする並列アクセスであり、
    前記第2のプロセッシングエレメント群へのデータアクセスは、前記各第2のプロセッシングエレメント群が前記ネットワークに独立してアクセスするスタンドアロン型アクセスである、
    アクセスコントローラ。
  7. 請求項のアクセスコントローラにおいて、
    前記各プロセッシングエレメントは、前記第1のプロセッシングエレメントまたは前記第2のプロセッシングエレメントのいずれかに設定可能であり、
    前記アクセスコントローラは、前記第1のプロセッシングエレメントとして利用されているプロセッシングエレメントと、前記第2のプロセッシングエレメントとして利用されているプロセッシングエレメントと、を判別するアクセスコントローラ
  8. 請求項のアクセスコントローラにおいて、さらに、
    前記第1、第2のプロセッシングエレメント群へのデータ転送要求を調停するアービトレーション部を備えるアクセスコントローラ。
  9. 請求項のアクセスコントローラにおいて、
    前記第1のプロセッシングエレメントは、SIMD(Single Instruction Multiple Data)アーキテクチャのプロセッシングエレメントであり、
    前記第2のプロセッシングエレメントは、MIMD(Multiple Instruction Multiple Data)アーキテクチャのプロセッシングエレメントであるアクセスコントローラ。
  10. 請求項からいずれか一のアクセスコントローラにおいて、
    前記パイプラインネットワークは、パイプラインリングネットワークであるアクセスコントローラ。
  11. アクセス制御線を有するアクセスコントローラの制御方法であって、
    各プロセッシングエレメントにそれぞれアクセス制御線を用意することを含み、さらに、
    第1のプロセッシングエレメント群により、前記アクセスコントローラの同一プログラムを実行するステップと、
    第2のプロセッシングエレメント群により、他のプロセッシングエレメントのプログラムとは独立してそれぞれ固有のプログラムを実行するステップと、
    前記第1、第2のプロセッシングエレメント群をパイプラインネットワークで順次接続するステップと、
    前記アクセスコントローラにより、前記各プロセッシングエレメントと前記パイプラインネットワークとの間のデータアクセスタイミングを制御するステップと、
    を含むことにより、前記各プロセッシングエレメントを制御し、かつ、
    前記第1のプロセッシングエレメント群からのデータアクセスタイミングと前記第2のプロセッシングエレメント群からのデータアクセスタイミングとの関係が異なっており、
    さらに、
    前記第1のプロセッシングエレメント群へのデータアクセスは、前記各第1のプロセッシングエレメント群が前記ネットワークに同一のタイミングスロットでアクセスする並列アクセスであり、
    前記第2のプロセッシングエレメント群へのデータアクセスは、前記各第2のプロセッシングエレメント群が前記ネットワークに独立してアクセスするスタンドアロン型アクセスである、
    制御方法。
JP2009538540A 2007-03-06 2007-03-06 自律または共通制御されるpeアレイを有するシステムのためのデータ転送ネットワークおよび制御装置 Active JP5158091B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2007/054756 WO2008108005A1 (en) 2007-03-06 2007-03-06 A data transfer network and control apparatus for a system with an array of processing elements each either self- or common controlled

Publications (2)

Publication Number Publication Date
JP2010520519A JP2010520519A (ja) 2010-06-10
JP5158091B2 true JP5158091B2 (ja) 2013-03-06

Family

ID=38616413

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009538540A Active JP5158091B2 (ja) 2007-03-06 2007-03-06 自律または共通制御されるpeアレイを有するシステムのためのデータ転送ネットワークおよび制御装置

Country Status (6)

Country Link
US (1) US8190856B2 (ja)
EP (1) EP2132645B1 (ja)
JP (1) JP5158091B2 (ja)
AT (1) ATE508415T1 (ja)
DE (1) DE602007014413D1 (ja)
WO (1) WO2008108005A1 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120030448A1 (en) * 2009-03-30 2012-02-02 Nec Corporation Single instruction multiple date (simd) processor having a plurality of processing elements interconnected by a ring bus
JP5488609B2 (ja) * 2009-03-30 2014-05-14 日本電気株式会社 リングバスによって相互接続された複数の処理要素を有する単一命令多重データ(simd)プロセッサ
JP5532132B2 (ja) 2009-11-26 2014-06-25 日本電気株式会社 Simdモードで動作するプロセッシング・エレメントの内部メモリに分散記憶された正方マトリックス及びその転置マトリックスに、時間と面積の効率良いアクセスを可能とする装置及び方法
WO2013046475A1 (en) * 2011-09-27 2013-04-04 Renesas Electronics Corporation Apparatus and method of a concurrent data transfer of multiple regions of interest (roi) in an simd processor system
ES2391733B2 (es) * 2011-12-30 2013-05-10 Universidade De Santiago De Compostela Arquitectura híbrida simd/mimd dinámicamente reconfigurable de un coprocesador para sistemas de visión
US20140189298A1 (en) * 2012-12-27 2014-07-03 Teresa Morrison Configurable ring network
WO2016051435A1 (en) * 2014-10-01 2016-04-07 Renesas Electronics Corporation Data transfer apparatus and microcomputer

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3537074A (en) * 1967-12-20 1970-10-27 Burroughs Corp Parallel operating array computer
US4837676A (en) * 1984-11-05 1989-06-06 Hughes Aircraft Company MIMD instruction flow computer architecture
FR2622989B1 (fr) * 1987-11-06 1992-11-27 Thomson Csf Machine multiprocesseur reconfigurable pour traitement du signal
US5522083A (en) * 1989-11-17 1996-05-28 Texas Instruments Incorporated Reconfigurable multi-processor operating in SIMD mode with one processor fetching instructions for use by remaining processors
US5239654A (en) 1989-11-17 1993-08-24 Texas Instruments Incorporated Dual mode SIMD/MIMD processor providing reuse of MIMD instruction memories as data memories when operating in SIMD mode
US5212777A (en) 1989-11-17 1993-05-18 Texas Instruments Incorporated Multi-processor reconfigurable in single instruction multiple data (SIMD) and multiple instruction multiple data (MIMD) modes and method of operation
JPH07122866B1 (ja) * 1990-05-07 1995-12-25 Mitsubishi Electric Corp
WO1991017507A1 (en) 1990-05-07 1991-11-14 Mitsubishi Denki Kabushiki Kaisha Parallel data processing system
JPH0668053A (ja) * 1992-08-20 1994-03-11 Toshiba Corp 並列計算機
WO1996014617A1 (en) * 1994-11-07 1996-05-17 Temple University - Of The Commonwealth System Higher Education Multicomputer system and method
US5903771A (en) * 1996-01-16 1999-05-11 Alacron, Inc. Scalable multi-processor architecture for SIMD and MIMD operations
US6356993B1 (en) 1999-10-26 2002-03-12 Pyxsys Corporation Dual aspect ratio PE array with no connection switching
GB2374442B (en) * 2001-02-14 2005-03-23 Clearspeed Technology Ltd Method for controlling the order of datagrams

Also Published As

Publication number Publication date
JP2010520519A (ja) 2010-06-10
DE602007014413D1 (de) 2011-06-16
EP2132645B1 (en) 2011-05-04
ATE508415T1 (de) 2011-05-15
EP2132645A1 (en) 2009-12-16
US20100088489A1 (en) 2010-04-08
US8190856B2 (en) 2012-05-29
WO2008108005A1 (en) 2008-09-12

Similar Documents

Publication Publication Date Title
JP5158091B2 (ja) 自律または共通制御されるpeアレイを有するシステムのためのデータ転送ネットワークおよび制御装置
JP7074831B2 (ja) ネットワークオンチップによるデータ処理方法及び装置
US10241946B2 (en) Multi-channel DMA system with command queue structure supporting three DMA modes
JP4621604B2 (ja) バス装置、バスシステムおよび情報転送方法
JP2002140289A (ja) 調整可能ワード・サイズ転送とアドレス配列/増加を備えたマイクロコントローラdmaオペレーション
CN111656339B (zh) 存储器装置及其控制方法
EP3729261B1 (en) A centralized-distributed mixed organization of shared memory for neural network processing
CN108874730B (zh) 一种数据处理器及数据处理方法
US10078606B2 (en) DMA engine for transferring data in a network-on-a-chip processor
US20070156937A1 (en) Data transfer in multiprocessor system
US7765351B2 (en) High bandwidth low-latency semaphore mapped protocol (SMP) for multi-core systems on chips
US8667199B2 (en) Data processing apparatus and method for performing multi-cycle arbitration
EP1083487A2 (en) Configuration bus reconfigurable/reprogrammable interface for expanded direct memory access processor
US7913013B2 (en) Semiconductor integrated circuit
US11093276B2 (en) System and method for batch accessing
JP2002163228A (ja) 多重コアdsp装置のための外部バス裁定技術
CN109271333B (zh) 一种sram控制方法及控制器、控制系统
WO2004068362A1 (en) Processor array
US11853235B2 (en) Communicating between data processing engines using shared memory
US20230259486A1 (en) Neural processing unit synchronization systems and methods
US8601197B2 (en) Microcontroller including flexible connections between modules
CN115437994A (zh) 一种多级流水多路数据运算与存取控制系统
JP4567373B2 (ja) データ転送装置及び通信データ処理システム
JP3698912B2 (ja) マルチプロセッサシステムの制御装置および方法
JP2012173847A (ja) バス調停装置およびバス調停方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120807

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121009

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121113

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121126

R150 Certificate of patent or registration of utility model

Ref document number: 5158091

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151221

Year of fee payment: 3