JP2009026135A - マルチプロセッサ装置 - Google Patents

マルチプロセッサ装置 Download PDF

Info

Publication number
JP2009026135A
JP2009026135A JP2007189769A JP2007189769A JP2009026135A JP 2009026135 A JP2009026135 A JP 2009026135A JP 2007189769 A JP2007189769 A JP 2007189769A JP 2007189769 A JP2007189769 A JP 2007189769A JP 2009026135 A JP2009026135 A JP 2009026135A
Authority
JP
Japan
Prior art keywords
coprocessor
processor
processors
resource
bus
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007189769A
Other languages
English (en)
Inventor
Shinji Kashiwagi
伸次 柏木
Hiroyuki Nakajima
博行 中島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Electronics Corp
Original Assignee
NEC Electronics Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Electronics Corp filed Critical NEC Electronics Corp
Priority to JP2007189769A priority Critical patent/JP2009026135A/ja
Priority to US12/175,882 priority patent/US8055882B2/en
Publication of JP2009026135A publication Critical patent/JP2009026135A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/52Program synchronisation; Mutual exclusion, e.g. by means of semaphores
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/30Arrangements for executing machine instructions, e.g. instruction decode
    • G06F9/38Concurrent instruction execution, e.g. pipeline or look ahead
    • G06F9/3867Concurrent instruction execution, e.g. pipeline or look ahead using instruction pipelines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/30Arrangements for executing machine instructions, e.g. instruction decode
    • G06F9/38Concurrent instruction execution, e.g. pipeline or look ahead
    • G06F9/3877Concurrent instruction execution, e.g. pipeline or look ahead using a slave processor, e.g. coprocessor

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Advance Control (AREA)
  • Bus Control (AREA)
  • Multi Processors (AREA)

Abstract

【課題】1つのコプロセッサを密結合バスを介して、複数のプロセッサからアクセス可能とするマルチプロセッサ装置の提供。
【解決手段】共通バス(105)に接続された複数のプロセッサ(101A、101B)と、複数のプロセッサに対して共通に設けられたコプロセッサ(106)と、前記プロセッサによる、密結合バス(109、110)を介したコプロセッサ(106)の資源の使用に関して、複数のプロセッサ(101A、101B)間での競合を調停するアービトレーション回路(107)を備えている。
【選択図】図1

Description

本発明は、複数のプロセッサを備えた装置に関し、特に、複数のプロセッサ間でコプロセッサ資源を共有する装置に適用して好適なシステム構成に関する。
この種のマルチプロセッサ(並列プロセッサ)システムの典型的な構成の一例を、図9に示す(非特許文献1参照)。マルチプロセッサ(並列プロセッサ)システムは、対称又は非対称のプロセッサとコプロセッサを複数持ち、メモリや周辺IOなどをプロセッサ間で共有する。
コプロセッサ(co−processor)には、
・特定の処理(オーディオ、ビデオ、ワイヤレス、あるいは、浮動小数点演算やFFT(Fast Fourier Transform)等の数値演算、・・)を担うことでプロセッサを補助するものと、
・特定の処理(オーディオ、ビデオ、ワイヤレス・・・)に必要な処理を丸ごと処理するといったハードウェア・アクセラレータ的なものがある。
複数のプロセッサを備えたマルチプロセッサにおいて、コプロセッサは、メモリと同様に、プロセッサ間で共有する場合と、プロセッサにローカルに専有する場合とがある。
図9に示した例は、コプロセッサをローカルに専有する構成であり、コンフィギュラブルプロセッサMeP(Media embedded Processor)技術を用いたLSI構成の一例が示されている。
図10は、図9の構成を説明するために簡略化して示した図である。図10に示すように、プロセッサ201A、プロセッサ201Bは、それぞれプロセッサのローカルバスを介して特定用途向けコプロセッサ203A、203Bと密結合している。なお、ローカルメモリ202A、202Bは、それぞれ、プロセッサ201A、201Bで実行される命令や作業データを格納する。
マルチプロセッサとそれに接続された周辺ハードウェア(コプロセッサや各種周辺装置)とを効率的に強調させる構成の並列処理装置が特許文献1に開示されている。図11は、特許文献1に開示されたCPUの構成を示す図である。図11を参照すると、タスクあるいはスレッドを実行する複数のプロセッサ部P0〜P3を備え、コプロセッサ130a、130b、周辺装置40a〜40dの周辺ハードウェアと接続されたCPU10を含み、タスクあるいはスレッドを実行しているプロセッサ部それぞれが実行中のタスクあるいはスレッドの実行内容に応じて周辺ハードウェアに処理依頼を行う、というものである。図12は、図11の構成を簡略化して示した図である。図12に示すように、プロセッサP0〜P3、コプロセッサ130a、130bは共通バスに接続されており、プロセッサP0〜P3はコプロセッサ130a、130bに共通バスを介してアクセスする。
特開2006−260377号公報 東芝半導体 製品カタログ MeP(Media embedded Processor)概説 インターネットURL:<http://www.semicon.toshiba.co.jp/docs/catalog/ja/BCJ0043_catalog.pdf>
上記した関連技術の構成は、以下のような課題を有している(以下は、本発明者等の分析結果による)。
図10に示したように、コプロセッサ203A、203Bをプロセッサ201A、201Bのローカルバスにそれぞれ密結合させた場合、共通バス上の別のプロセッサから、コプロセッサにアクセスすることができない。
また、プロセッサ201A、201Bの各々が、コプロセッサ203A、203Bに必要な回路(演算器やレジスタなど)をローカルに持つこととなり、他のプロセッサとのコプロセッサ(演算資源)レベルでの共有、もしくは回路資源(演算器やレジスタなどの回路レベル)での共有が困難となる。
そして、コプロセッサは、各々のプロセッサのコプロセッサIF(インタフェース)にローカルに密結合されているため、ある機能に特化したコプロセッサを他のプロセッサから利用することはできない。
一方、図12に示したように、コプロセッサを、共通バス上に配置した場合、全てのプロセッサからアクセスすることができ、コプロセッサ資源の共有が可能となる。しかしながら、共有メモリや周辺IOへのアクセスと共用する共通バスを介するため、低速メモリや低速IOへのアクセスがあった場合など、バストラフィック、負荷に影響を受けやすく、このため、リアルタイム性に劣る。
本願で開示される発明は、前記課題の認識に基づき創案されたものであって、概略以下のように構成される。
本発明の1つの側面に係るマルチプロセッサ装置においては、複数のプロセッサに対して共通に設けられたコプロセッサと、前記プロセッサによる、密結合バスを介しての前記コプロセッサの資源の使用に関して、前記複数のプロセッサ間での競合を調停するアービトレーション手段と、を備えている。
本発明に係るマルチプロセッサ装置においては、複数のプロセッサにそれぞれ対応して設けられた複数のコプロセッサと、前記複数のコプロセッサのうち少なくとも1つのプロセッサに対応して設けられた少なくとも1つのコプロセッサに関して、前記1つのプロセッサと他のプロセッサからの、密結合バスを介しての、前記コプロセッサの資源の使用の競合を調停するアービトレーション手段と、を備えた構成としてもよい。
本発明に係るマルチプロセッサ装置においては、第1、第2のプロセッサにそれぞれ対応して設けられた第1、第2のコプロセッサを備え、前記第1のプロセッサと前記第2のプロセッサからの、第1の密結合バスを介しての、前記第1のコプロセッサの資源の使用の競合を調停する第1のアービトレーション手段と、前記第1のプロセッサと前記第2のプロセッサからの、第2の密結合バスを介しての、前記第2のコプロセッサの資源の使用の競合を調停する第2のアービトレーション手段と、を備え、前記第1のプロセッサは、前記第1のコプロセッサの資源及び/又は前記第2のコプロセッサの資源に、密結合バスを介して、アクセス自在とされ、前記第2のプロセッサは、前記第1のコプロセッサの資源及び/又は前記第2のコプロセッサの資源に、密結合バスを介して、アクセス自在とされる構成としてもよい。
本発明に係るマルチプロセッサ装置においては、複数のプロセッサの少なくとも1つのプロセッサに、密結合バスを介して接続されるコプロセッサを備え、共通バスに接続される前記複数のプロセッサは、前記共通バスを介して前記コプロセッサと接続される少なくとも1つの他のプロセッサを有し、前記1つのプロセッサからの密結合バスを介しての前記コプロセッサの資源の使用と、前記他のプロセッサの前記共通バスを介しての前記コプロセッサの資源の使用の競合を調停するアービトレーション手段を備えた構成としてもよい。
本発明においては、前記複数のプロセッサから、前記コプロセッサへの信号を入力するマルチプレクサを備え、前記マルチプレクサは、前記アービトレーション手段で許可されたプロセッサからの信号を選択して、前記コプロセッサに供給する、構成としてもよい。
本発明においては、前記アービトレーション手段は、前記プロセッサからの使用要求を入力し、前記プロセッサによる前記コプロセッサの資源の使用に競合が生じる場合には、前記コプロセッサの資源の使用を要求するプロセッサのうち、使用が許諾されたプロセッサ以外のプロセッサによる前記コプロセッサの資源の使用をウェイトさせる、構成としてもよい。
本発明においては、前記アービトレーション手段は、前記複数のプロセッサが接続される共通バスに接続され、前記アービトレーション手段は、前記プロセッサから前記共通バスに出力される信号に基づき、前記プロセッサによる前記コプロセッサの資源の使用に競合が生じると判定される場合、前記コプロセッサの資源の使用を要求するプロセッサのうち使用が許諾されたプロセッサ以外のプロセッサによる前記コプロセッサの資源の使用をウェイトさせる、構成としてもよい。
本発明においては、前記コプロセッサは、前記アービトレーション手段により行われる前記プロセッサ間での資源使用の調停が、前記コプロセッサの資源単位で行われる資源を少なくとも1つ含む、構成としてもよい。
本発明においては、前記コプロセッサが、複数の資源と、前記複数の資源にそれぞれ対応する複数のインタフェースと、を有し、前記複数の資源は、前記アービトレーション手段により行われる前記プロセッサ間での資源使用の調停が、前記資源単位で行われる資源を少なくとも1つ含む、構成としてもよい。
本発明においては、前記コプロセッサの複数の前記資源が、複数の前記資源にそれぞれ対応する複数の前記インタフェースを介して同時に使用自在とされてなる、構成としてもよい。
本発明においては、前記プロセッサでは、前記別のバスを介して、前記コプロセッサに、命令を送信し、前記コプロセッサによる、命令実行結果を受け取る処理が行われ、前記アービトレーション手段は、前記複数のプロセッサによる前記コプロセッサの資源の使用を、命令パイプラインのステージ単位で、調停する、構成としてもよい。
本発明によれば、複数のプロセッサの共用バスとは別の密結合バスを介してのコプロセッサの使用を調停する構成としたことにより、1つのコプロセッサを複数のプロセッサで使用可能とするとともに、共通バスを介してアクセスする場合と比べて高速化を可能とし、リアルタイム処理に好適とされる。
前記した本発明についてさらに詳細に説述すべく添付図面を参照して実施例を説明する。本発明によれば、並列プロセッサ構成のシステムLSIにおいて、メモリやバスの共有だけでなく、コプロセッサの資源の共有を実現する。コプロセッサを用いた演算は、並列実行が可能であり、資源が競合した時にのみ、アービトレーションが行われる。
以下の各実施例では、本発明をマルチ(並列)プロセッサ・システムに適用した例を説明する。各々の対称又は非対称のプロセッサは、共通バスとは別のローカルバスに専有のメモリやコプロセッサを接続している。コプロセッサは、特定の処理(オーディオ、ビデオ、ワイヤレス、FFT等の数値演算、・・)を担うことで、プロセッサを補助する。あるいは、コプロセッサはハードウェアアクセラレータであってもよい。以下の実施例においては、コプロセッサを並列プロセッサ間で共有しており、密結合プロセッサへのアクセスを調停するアービトレーション回路を用意している。
<実施例1>
図1は、本発明の第1の実施例の構成を示す図である。本実施例においては、コプロセッサ106はプロセッサのローカルバスに密結合される。なお、密結合されるコプロセッサ106を「密結合コプロセッサ」ともいう。プロセッサ101A、101Bからコプロセッサ106の資源に対する使用要求が重複した場合(コプロセッサ106の資源の使用に競合が生じた場合)には、アービトレーション回路(コプロセッサ・アクセス・アービトレーション回路)107で競合の調停を行い、一方のプロセッサの使用要求を許諾し、他方のプロセッサに対してウェイト(WAIT)をかける。
より詳細には、プロセッサ101A、101Bからのコプロセッサ106の使用要求111A、111Bは、アービトレーション回路107に入力され、アービトレーション回路107から使用許諾/WAITを指示する信号112A、112Bが、プロセッサ101A、101Bにそれぞれ入力される。アービトレーション回路107において、プロセッサ101A、101Bからのコプロセッサ106の演算資源の使用要求が重なった場合、1方のプロセッサの使用を許可し、他方のプロセッサをWAIT状態とする。
マルチプレクサ108は、プロセッサ101A、101Bから信号線109A、109Bを介して転送されたコマンド(命令)を受け、アービトレーション回路107での調停結果に基づき、コプロセッサ106の使用が許可されたプロセッサからのコマンド(命令)を信号線109からコプロセッサ106に伝える。コプロセッサ106は、当該命令の実行結果(応答)を、信号線110を介して、プロセッサに返す。
なお、アービトレーション回路107において、コプロセッサ106の状態(回路資源の使用状態、パイプライン状態等)を、コプロセッサ106から信号線110’を介して受け取り、プロセッサ101A、101Bからのコプロセッサ106の使用要求111A、111Bと照合し、資源の競合が生じない場合には、同時並行的に実行するようにしてもよい。例えば、現在、プロセッサ101Aでコプロセッサ106のある資源を使用中の場合において、アービトレーション回路107が、プロセッサ101Bからの使用要求を受けた場合、プロセッサ101Bの使用要求で使用されるコプロセッサ106の資源が、プロセッサ101Aの使用要求で使用されるコプロセッサ106の資源と競合しなければ、アービトレーション回路107は、プロセッサ101Bからのコプロセッサ106の使用要求に対して使用許可を与える。
信号線109、109A、109B、110、110’の各々は、複数ビット幅のパラレルラインであってもよいし、1ビットのシリアルラインであってもよい。信号線109、109A、109B、信号線110、110’は、プロセッサのローカルバス(密結合バス)を構成する。
本実施例では、コプロセッサ106は、プロセッサ101A、101Bのローカルバス上に配設されたマルチプレクサ108を介して密結合される。密結合バスにおいては、プロセッサ101A、101Bからのコマンド(コプロセッサ命令)がコプロセッサ106に転送され、コプロセッサ106は当該コマンド(コプロセッサ命令)を実行し、実行結果が、プロセッサに転送されるというバスプロトコルを有する。一方、共通バス等の疎結合バスにおいては、バス使用権を獲得したバスマスタ(プロセッサ)からアドレス信号、制御信号(リード/ライト)、データ信号がバス上に転送される。なお、図1には、簡単のため、プロセッサ101A、101Bの2台の構成が示されているが、本発明において、プロセッサの数は2台に制限されるものでないことは勿論である。
本実施例によれば、プロセッサのローカルバスに密結合されたコプロセッサ106の演算資源は、プロセッサ101A、101B間で共有可能となり、コプロセッサ106の演算資源の共有と、密結合による高速アクセスとを両立させることができる。
なお、プロセッサ101A、101Bからコプロセッサ106ヘ送るコマンドは、命令(一部デコード済みのコード等、命令の一部)であってもよいし、マクロ命令(例えばFFT等、複数の命令の集まりで定義された命令)であってもよい。また、コプロセッサ106がパイプライン構成の場合、プロセッサから転送されたコプロセッサ命令を受け取ったコプロセッサ106において、命令デコード(DE)ステージから開始し、演算実行(EX)ステージで実行した演算結果を、プロセッサ側に返すようにしてもよい。
次に、図6を参照して、本実施例における、密結合バスを介したコプロセッサのアクセス調停について説明する。特に制限されないが、本実施例において、命令パイプラインは、命令フェッチ(IF)、デコード(DE)、演算実行(EX)、メモリアクセス(ME)、結果格納(WB)の5段のステージを含むものとする。例えばロード命令の場合、EXステージでアドレスの計算が行われ、MEステージでデータメモリからデータが読み出され、WBステージで読み出しデータがレジスタに書き込まれる。ストア命令の場合、EXステージでアドレスの計算が行われ、MEステージでデータはデータメモリに書き込まれ、WBステージでは何も行われない。
図6(A)を参照すると、プロセッサAでは、命令をローカルメモリ(あるいは、プロセッサA内蔵の命令メモリ)よりフェッチし(IF)、デコード(DE)ステージにて、フェッチした命令が、コプロセッサ命令であると判定された場合、該命令を、コプロセッサで実行させるため、コプロセッサの使用要求を、アービトレーション回路(図1の107)に出力する。プロセッサAは、アービトレーション回路からコプロセッサの使用許諾を受けると、当該命令をコプロセッサに送信する。コプロセッサでは、プロセッサAから受け取った当該命令のデコード(COP DE)、命令の実行(COP EX)、メモリアクセス(COP ME)の各ステージを実行し、プロセッサAによるライトバックステージ(WB)が実行される。特に制限されないが、コプロセッサのメモリアクセス(COP ME)ステージにおいて、コプロセッサによる命令の実行結果が、プロセッサAのローカルバスを介してプロセッサAに転送され、プロセッサAのライトバック(WB)ステージにおいて、プロセッサA内のレジスタに書き込まれる構成としてもよい。この場合、プロセッサAは、MEステージでデータメモリのかわりに、コプロセッサから演算結果を受け取り、WBステージで結果をレジスタに格納することになる。なお、図6(A)に示す例では、各プロセッサにおける命令パイプライン・ステージ(DE、EX、ME)と、該プロセッサが発行したコプロセッサ命令を実行するコプロセッサの命令パイプライン・ステージ(COP DE、COP EX、COP ME)とが同期しているが、コプロセッサとプロセッサの動作周波数が相違してもよいことは勿論である。あるいは、コプロセッサがプロセッサと非同期で動作し、コプロセッサで演算が終了した場合、READY信号をプロセッサに通知する構成としてもよい。
プロセッサBも、当該命令のデコード(COP DE)、命令の実行(COP EX)、メモリアクセス(COP ME)の各ステージをコプロセッサで行わせることになる。この場合、アービトレーション回路(図1の107)は、コプロセッサの命令デコード(DE)ステージ(プロセッサA発行のコプロセッサ命令のDEステージ分)に相当する期間、プロセッサBをウェイト状態とし、プロセッサB発行のコプロセッサ命令に関してデコード(DE)ステージがストールされる。つづいて、ウェイト(WAIT)が解除される。プロセッサBは、アービトレーション回路から使用許諾(WAIT解除)を受け、当該命令をコプロセッサに送信する。コプロセッサでは、プロセッサBから受け取った当該命令のデコード(COP DE)、命令の実行(COP EX)、メモリアクセス(COP ME)の各ステージを順次実行し、プロセッサBによるライトバックステージ(WB)が実行される。
図6(A)には、コプロセッサの命令デコード(DE)ステージでの回路資源に競合が生じた例(例えばプロセッサA、Bで同時に発行されたコプロセッサ命令が同一の場合)が示されているが、アクセスの競合が調停される対象は、命令デコード(DE)ステージに限定されるものでなく、演算実行(EX)ステージ、メモリアクセス(ME)ステージにおいて、コプロセッサの回路資源に競合が生じた場合、使用が許可されたプロセッサ以外のプロセッサによるコプロセッサの回路資源の使用は、ウェイト状態に設定される。
一方、プロセッサA、Bがそれぞれ発行したコプロセッサ命令に、回路資源のアクセス競合がない場合には、図6(B)に示すように、WAIT信号は非活性(LOW)のままであり、コプロセッサでは、プロセッサAとプロセッサBからのコプロセッサ命令の命令デコード(DE)からメモリアクセス(ME)のパイプライン・ステージが同時に実行される。特に制限されないが、図6(A)、(B)に示す例では、コプロセッサ106は2本のパイプラインを備え、2命令同時発行可能な構成としてもよい。
本実施例では、プロセッサに密結合されたコプロセッサの回路資源の競合の調整を、命令パイプラインのステージ単位で行っている。例えば図1のアービトレーション回路107において、コプロセッサのパイプラインのステージの進捗情報(現在のステージ)が、信号線110’を介して通知され、アービトレーション回路107では、対応する資源の使用を監視し、使用要求対象の資源と競合が生じるか判別する制御を行う。すなわち、密結合バスには、コプロセッサ106からコプロセッサ106のパイプラインの状態等の信号が転送される構成としてもよい。この場合、プロセッサ101A、101Bには、信号線110を介してパイプラインの状態等が通知される。
密結合バスを介しての資源の競合を調停するアービトレーション回路107においては、パイプラインのステージ単位で資源競合の調停を行っているが、パイプラインのステージ単位ではなく、命令サイクル単位で、プロセッサ間でのコプロセッサ106の資源競合の調停を行うようにしてもよいことは勿論である。
図7は、比較例として、プロセッサを共通バス等の疎結合バスを介してコプロセッサに接続した場合の命令パイプラインの推移を示す図である。
プロセッサが共通バス等の疎結合バスを介してコプロセッサに命令を渡す場合、プロセッサの命令パイプラインのメモリアクセス(ME)ステージにおいて、コプロセッサに命令が渡され、コプロセッサでは、プロセッサのメモリアクセス(ME)ステージの後半に当該命令のデコード(COP DE)が行われ、プロセッサのライトバック(WB)ステージに対応するサイクルで、コプロセッサの演算実行(EX)ステージが実行され、つづいてメモリアクセス(COP ME)ステージが実行される。特に制限されないが、コプロセッサにおけるメモリアクセス(COP ME)ステージでは、コプロセッサからプロセッサへデータの転送が行われる。図7に示す例では、共通バス等の疎結合バスのバスサイクルが低速であるため、バスアクセスによりプロセッサ側のパイプラインに停止期間が生じる。例えばコプロセッサにおけるメモリアクセス(COP ME)ステージに対応する期間、プロセッサ側のパイプラインに空きが生じている。
図7(A)に示すように、プロセッサAとプロセッサBのメモリアクセス(ME)ステージに競合がある場合、プロセッサBのメモリアクセス(ME)(したがって、コプロセッサへコプロセッサ命令を転送しコプロセッサでコプロセッサ命令をデコードするDEステージ)は、コプロセッサにおいて、プロセッサA発行のコプロセッサ命令のデコード(COP DE)、命令実行(COP EX)、メモリアクセス(COP ME)のステージが終了するまで、ウェイト状態(待機状態)とされる。すなわち、共通バス等の疎結合バスにおいては、プロセッサA発行の命令を実行するコプロセッサのメモリアクセス(COP ME)は、プロセッサBのメモリアクセス(ME)ステージと、バス資源の競合が生じるため、プロセッサA発行の命令のデコード(COP DE)、命令実行(COP EX)、メモリアクセス(COP ME)のステージが終了するまで、プロセッサBのメモリアクセス(ME)ステージはストールされる。
コプロセッサにおけるプロセッサA発行の命令のメモリアクセス(COP ME)ステージ終了後、プロセッサBのメモリアクセス(ME)ステージのウェイトが解除され、これを受けて、プロセッサB発行のコプロセッサ命令がコプロセッサに転送され、コプロセッサにおいて、プロセッサB発行のコプロセッサ命令のデコード(COP DE)、実行(COP EX)、メモリアクセス(COP ME)の各ステージが順次実行される。
プロセッサA、Bから発行されるコプロセッサ命令に、回路資源のアクセス競合がない場合には、図7(B)に示すように、ウェイト(WAIT)信号は非活性(LOW)のままである。図7(B)に示す例において、プロセッサBでは、プロセッサAのメモリアクセス(ME)のステージでは、プロセッサBにおける命令フェッチ(IF)、デコード(DE)、実行(EX)が行われ、プロセッサAのメモリアクセス(ME)につづいて、プロセッサBのメモリアクセス(ME)のステージが実行される。すなわち、コプロセッサでは、プロセッサA発行の命令のメモリアクセス(COP ME)につづいて、プロセッサB発行の命令のデコード(COP DE)が行われる。
図6(A)に示した密結合バスの場合、アクセス競合時にパイプラインがストールされる期間(遅延)は、例えばパイプライン1段分の期間(図6(A)ではDEステージ)であるのに対して、図7(A)の疎結合バスの場合、アクセス競合が生じた場合のプロセッサのMEステージのストールされる期間は長く、特にバスサイクルが低速である場合、ストールされる期間は長くなり、パイプラインに停止期間が生じる。図6(A)に示した密結合バスの場合、パイプラインの停止(空き)は生じていない。
図8は、本実施例のコプロセッサを用いた構成において、複数サイクルのコプロセッサの命令が競合した場合を説明するための図である。すなわち図8は、コプロセッサで実行されるパイプラインにおいて、複数サイクルのコプロセッサ命令が競合した場合を示している。プロセッサA発行のコプロセッサ命令を実行するコプロセッサにおけるパイプラインの演算実行ステージ(COP EX1〜EX5)において、プロセッサBのコプロセッサ命令で使う資源アクセスが競合している場合、この期間、アービトレーション回路から、プロセッサBへのWAIT信号が出力され、コプロセッサ106におけるプロセッサB発行のコプロセッサ命令のデコード(DE)ステージがストールされる。コプロセッサにおけるプロセッサA発行のコプロセッサ命令の演算実行ステージ(COP EX5)の終了後、プロセッサB発行のコプロセッサ命令の演算実行ステージ(COP EX1〜EX5)とメモリアクセス(COP ME)ステージが実行される。
なお、本実施例では、資源競合のアービトレーション(調停)制御を、命令パイプラインのステージ単位で行う例を説明したが、資源のアクセス競合に基づき、命令サイクル単位でのアービトレーション、複数命令単位でのアクセスアービトレーションを行ってもよい。
<実施例2>
次に、本発明の第2の実施例を説明する。図2は、本発明の第2の実施例の構成を示す図である。本実施例においては、図1に示した前記第1の実施例のアービトレーション回路のようなハードウェアではなく、プロセッサ同士のソフトウェア制御によるアービトレーションを行う。
コプロセッサ(密結合コプロセッサ)106と、プロセッサ101A、プロセッサ101Bの接続を切換えるマルチプレクサ108は、周辺IO空間にマップされたレジスタ(周辺IO・マップドレジスタ)113から制御する。すなわち、プロセッサ101A、101Bは、共通バス105へのアクセスアドレス(IOアドレス)にて、レジスタ113をアクセスし、他のプロセッサが密結合コプロセッサ106を使用中でない場合、使用要求がレジスタ113に設定され、使用要求を行ったプロセッサからの命令がマルチプレクサ108で選択され、コプロセッサ106に伝達される。1つのプロセッサがコプロセッサ106を使用中は、他のプロセッサによるコプロセッサ106のアクセスはロックされる。レジスタ113の値が他のプロセッサがコプロセッサ106を使用中であることを示す場合、他のプロセッサがコプロセッサ106を解放するまでコプロセッサ106の使用は待たされる。レジスタ113は、コプロセッサ106の排他制御を実現するためのセマフォア、フラグを実現する。プロセッサ101A、101B間でコプロセッサ106の同時使用はできない。なお、排他制御の粒度(granularity)は、命令パイプラインのステージ単位で行ってもよい。
本実施例においては、プロセッサのローカルバスに密結合されたコプロセッサ106をプロセッサ101A、101B間で共有可能となり、演算資源(コプロセッサ)の共有と密結合による高速アクセスが両立できる。
特に制限されないが、コプロセッサ106は、例えばAAC(Advanced Audio Coding)デコード処理に特化した専用コプロセッサであってもよい。プロセッサ101Aは、例えば300MIPS(Mega Instrcutions Per Second)級のDSP(Digital Signal Processor)、プロセッサ101Bは、例えば50MIPS級DSP、という構成では、必要処理MIPSに余裕があるときには、プロセッサ101BでAACデコード処理を行う。一方、ビデオ系が追加され、プロセッサ101Bでは性能不足の場合、プロセッサ101Aにおいてビデオ系とオーディオ系の処理を行う。この場合、プロセッサ101Aがオーディオ用コプロセッサ106にアクセスする。このように、DSPを使い分けることで消費電力の最適化を行うようにしてもよい。
<実施例3>
次に、本発明の第3の実施例を説明する。図3は、本発明の第3の実施例の構成を示す図である。図3を参照すると、本実施例においては、コプロセッサ(密結合コプロセッサ)116は、第1、第2のコプロセッサ・インタフェースIF(1)、IF(2)を備え、マルチレイヤーのコプロセッサ・バス114に接続している。マルチレイヤーのコプロセッサ・バス114は、複数のプロセッサからの同時アクセスを可能とするバスである。
コプロセッサ116内の資源Aと資源Bには、コプロセッサ・バス114のそれぞれ別のレイヤからアクセスすることができるため、プロセッサ101Aとプロセッサ101Bでコプロセッサ106の使用要求が重複した場合に、要求が資源Aと資源Bで分かれていれば、競合せず、同時使用が可能である。
コプロセッサ116内の資源A又は資源Bの単位で使用要求が競合した場合、アービトレーション回路(コプロセッサ・アクセス・アービトレーション回路)115は、いずれか一方のプロセッサにWAITをかける。コプロセッサ・バス114には、インタフェースIF(1)、IF(2)等を介して、コプロセッサ116の状態情報(パイプライン状態、資源の使用状況)が転送される。アービトレーション回路115は、現在使用が許諾されているプロセッサに関するコプロセッサ116内の資源Aと資源Bの使用に関する情報を監視・管理し、プロセッサからの使用要求111A、111Bに基づき、資源の競合の有無を判定する。
本実施例においては、プロセッサ101A、101Bは、コプロセッサ116内の資源(例えば演算器等の回路資源)に個々にアクセスすることが可能となり、より細かな回路ブロックのレベルで資源有効活用(同時使用)が可能となる。
特に制限されないが、例えば、コプロセッサ116内の資源Aがハフマンデコード処理、資源BがIMDCT(Inverse Modified Discrete Cosine Transform)処理を行う。コプロセッサ116内の資源A、資源Bは、MP3(MPEG1 Audio Layer−3)とAACの両方の処理が利用可能である。プロセッサ101AがMP3のデコード処理、プロセッサ101BがAACのデコード処理を行う場合、プロセッサ101A、101Bは、コプロセッサ116内の資源A、資源Bにそれぞれアクセスし、MP3、AACの規格のデコード処理を行う。また、MP3とAACの同時復号処理は、MP3とAACが混在したプレイリストに対し曲間のフェードアウト、フェードインのオーバラップ処理(クロスフェード)に用いられる。
<実施例4>
次に、本発明の第4の実施例を説明する。図4は、本発明の第4の実施例の構成を示す図である。図4を参照すると、本実施例においては、モジュールA、Bとが共通バス105に接続され、モジュールAは、プロセッサ101A、ローカルメモリ102A、コプロセッサ106Aと、マルチプレクサ118Aを備えている。モジュールBは、プロセッサ101B、ローカルメモリ102B、コプロセッサ106Bと、マルチプレクサ118Bを備えている。さらに、アービトレーション回路(コプロセッサ・アクセス・アービトレーション回路)117を備えている。
アービトレーション回路117は、プロセッサ101A、プロセッサ101Bからの使用要求を受け、アクセスが競合する場合、一方に使用許諾を与え、他方をWAITさせる。使用を許可するプロセッサを、マルチプレクサ118A又は118Bに通知する。なお、プロセッサ101A、101Bは、コプロセッサの使用要求111A、111B内に、モジュールAとモジュールBのいずれのコプロセッサを使用するのか指定する。アービトレーション回路117には、コプロセッサ106A、コプロセッサ106Bの状態(パイプライン状態)が信号線110A、110Bを介して通知される構成としてもよい。
プロセッサ101Aとコプロセッサ106Aとローカルメモリ102Aで構成するモジュールAは、モジュール内コプロセッサ106Aに、モジュール外からアクセス可能となるインタフェース121Aと、モジュール外部のコプロセッサ106Bにアクセスするためのインタフェース120Aを備えている。モジュール101Bは、モジュール内コプロセッサ106Bに、モジュール外からアクセス可能となるインタフェース121Bと、モジュール外部のコプロセッサ106Aにアクセスするためのインタフェース120Bを備えている。特に制限されないが、モジュールA又はモジュールBは、再利用IPマクロで構成してもよい。
マルチプレクサ118Aは、プロセッサ101A、101Bのうち選択されたプロセッサからの命令をコプロセッサ106Aに渡し、コプロセッサ106Aでの処理結果を、該命令を発行したプロセッサ101A又は101Bに返す。
マルチプレクサ118Bは、プロセッサ101B、101Aのうち選択されたプロセッサからの命令をコプロセッサ106Bに渡し、コプロセッサ106Bでの処理結果を、該命令を発行したプロセッサ101A又は101Bに返す。
これらのインタフェース120、121を介して他方モジュールのコプロセッサにアクセスすることで、並列プロセッサ間でコプロセッサを共有する。
本実施例によれば、再利用IPのようなモジュールのなかのコプロセッサを並列プロセッサ間で共有可能となる。また、ある機能に特化したコプロセッサを他のプロセッサから利用できるようになる。
再利用IPのような回路がフィックスしている場合でも、モジュール内外のコプロセッサに接続するためのインタフェースを用意しておくことで、再利用IP内部の回路資源(コプロセッサ)の再利用性を高めることが可能となる。
モジュールAは、例えばMP3デコードに特化したIPで、コプロセッサ106A内に32x32乗算器を有し、32x32乗算という単位での命令実行が可能であるものとする。モジュールBは、AACデコードに特化したIPで、コプロセッサ106B内に32x16乗算器を有し、32x16乗算という単位での命令実行が可能であるものとする。モジュールAで、MP3デコードし、同時に、モジュールBにおいて、新たにWMA(Windows(登録商標) Media Auido)デコードする場合、32x32乗算を必要とするモジュールBのプロセッサ101Bは、インタフェース120B、120Aを介して、モジュールA内のコプロセッサ106A(32x32乗算器)を利用する。
<実施例5>
次に、本発明の第5の実施例を説明する。図5は、本発明の第5の実施例の構成を示す図である。図5を参照すると、本実施例においては、共通バス105上の共有コプロセッサ(2)104−2は、マルチプレクサ119を介して、共通バス105とプロセッサ101Bの密結合コプロセッサ・インタフェース(IF)122に接続している。プロセッサ101Bは、共通バス105を介さずに、コプロセッサ・インタフェース(IF)122を介して、共有コプロセッサ(2)104−2にアクセスすることができる。
本実施例において、アービトレーション回路(コプロセッサ・アクセス・アービトレーション回路)127は、プロセッサ101Bからの使用要求を許可する場合には、マルチプレクサ119は、密結合コプロセッサ・インタフェース122を選択して、プロセッサ101Bを共有コプロセッサ104−2に接続し、共有コプロセッサ104−2は、プロセッサ101Bの密結合コプロセッサとして機能する。
一方、アービトレーション回路127がプロセッサ101Aからの使用要求を許可する場合には、マルチプレクサ119は、共通バス105を選択し、プロセッサ101Aは、共通バス105を介して共有コプロセッサ104−2にアクセスする。なお、本実施例において、プロセッサ101Bは、共有コプロセッサ104−2の使用要求をアービトレーション回路127に出力せずに、共通バス105のバスプロトコルにしたがって、共有コプロセッサ104−2にアクセスすることができることは勿論である。
本実施例によれば、共通バス105に接続されるコプロセッサ104−2に対して、密結合による高速アクセスが可能となる。また、コプロセッサ104−2は、共通バス105による接続(疎結合)からのアクセスが可能となる。
上記した各実施例の作用効果について説明する。
前記第1、第2の実施例によれば、プロセッサのローカルバスに密結合されたコプロセッサは並列プロセッサ間で共有可能となり、演算資源(コプロセッサ)の共有と密結合による高速アクセスが両立できる。
前記第3の実施例によれば、複数のプロセッサは密結合コプロセッサ内の回路資源(演算器など)に個々にアクセス可能となり、より細かな回路ブロックのレベルで、資源有効活用(同時使用)が可能となる。
前記第4の実施例によれば、再利用IPのようなモジュールのなかのコプロセッサを並列プロセッサ間で共有可能となる。ある機能に特化したコプロセッサを他のプロセッサから利用できるようになる。再利用IPのような回路が固まっている場合でも、モジュール内外のコプロセッサに接続するためのインタフェースを用意しておくことで、再利用IP内部の回路資源(コプロセッサ)の再利用性を高めることが可能となる。
前記第5に実施例によれば、共通バス上にあるコプロセッサに対して密結合アクセスが可能となり、共通バス接続(粗結合)による全プロセッサからアクセス(共有)可能になる利点と密結合による高速アクセスの両方を得る。
なお、上記の特許文献、非特許文献の各開示を、本書に引用をもって繰り込むものとする。本発明の全開示(請求の範囲を含む)の枠内において、さらにその基本的技術思想に基づいて、実施形態ないし実施例の変更・調整が可能である。また、本発明の請求の範囲の枠内において種々の開示要素の多様な組み合わせないし選択が可能である。すなわち、本発明は、請求の範囲を含む全開示、技術的思想にしたがって当業者であればなし得るであろう各種変形、修正を含むことは勿論である。
本発明の第1の実施例の構成を示す図である。 本発明の第2の実施例の構成を示す図である。 本発明の第3の実施例の構成を示す図である。 本発明の第4の実施例の構成を示す図である。 本発明の第5の実施例の構成を示す図である。 密結合バスでのアクセス競合の有無を説明するための図である。 疎結合バスでのアクセス競合の有無を説明するための図である。 密結合バスでのアクセス競合の有無を説明するための図である。 関連技術の構成を示す図である。 図9の構成を説明する図である。 関連技術の構成を示す図である。 図11の構成を説明する図である。
符号の説明
10 CPU
30 メモリ
40a、40b、40c、40d 周辺装置
101A、201A プロセッサ(A)
101B、201B プロセッサ(B)
102A、202A ローカルメモリ
102B、202B ローカルメモリ
103、204 共用メモリ
104 共有コプロセッサ
104−1 共有コプロセッサ(1)
104−2 共有コプロセッサ(2)
105、206 共通バス
106、106A、106B、116、126、203A、203B コプロセッサ(密結合コプロセッサ)
107、115、117、127 アービトレーション回路
108、118A、118B、119 マルチプレクサ回路
109、109A、109B 信号線(命令)
110、110A、110B、110’ 信号線(応答、状態)
111A、111B コプロセッサ使用要求
112A、112B WAIT信号
113 レジスタ(周辺IO・マップドレジスタ)
114 コプロセッサ・バス
120、120A、102B、121、121A、121B インタフェース
122 密結合コプロセッサ・インタフェース
130a、130b コプロセッサ
205 共有、周辺IO・ホストIF

Claims (11)

  1. 複数のプロセッサに対して共通に設けられたコプロセッサと、
    前記プロセッサによる、密結合バスを介しての前記コプロセッサの資源の使用に関して、前記複数のプロセッサ間での競合を調停するアービトレーション手段と、
    を備えているマルチプロセッサ装置。
  2. 複数のプロセッサにそれぞれ対応して設けられた複数のコプロセッサと、
    前記複数のコプロセッサのうち、少なくとも1つのプロセッサに対応して設けられた少なくとも1つのコプロセッサに関して、前記1つのプロセッサと他のプロセッサからの、密結合バスを介しての、前記1つのコプロセッサの資源の使用の競合を調停するアービトレーション手段と、
    を備えている、マルチプロセッサ装置。
  3. 前記複数のプロセッサが、第1、第2のプロセッサを備え、
    前記複数のコプロセッサが、前記第1、第2のプロセッサにそれぞれ対応して設けられた第1、第2のコプロセッサを備え、
    前記アービトレーション手段が、
    前記第1のプロセッサと前記第2のプロセッサからの、第1の密結合バスを介しての、前記第1のコプロセッサの資源の使用の競合を調停する第1のアービトレーション手段と、
    前記第1のプロセッサと前記第2のプロセッサからの、第2の密結合バスを介しての、前記第2のコプロセッサの資源の使用の競合を調停する第2のアービトレーション手段と、
    を備え、
    前記第1のプロセッサは、前記第1のコプロセッサの資源及び/又は前記第2のコプロセッサの資源に、密結合バスを介して、アクセス自在とされ、
    前記第2のプロセッサは、前記第1のコプロセッサの資源及び/又は前記第2のコプロセッサの資源に、密結合バスを介して、アクセス自在とされる、請求項2記載のマルチプロセッサ装置。
  4. 複数のプロセッサの少なくとも1つのプロセッサに、密結合バスを介して接続されるコプロセッサを備え、
    共通バスに接続される前記複数のプロセッサは、前記共通バスを介して前記コプロセッサと接続される少なくとも1つの他のプロセッサを有し、
    前記1つのプロセッサからの密結合バスを介しての前記コプロセッサの資源の使用と、前記他のプロセッサの前記共通バスを介しての前記コプロセッサの資源の使用の競合を調停するアービトレーション手段を備えている、マルチプロセッサ装置。
  5. 前記複数のプロセッサから、前記コプロセッサへの信号を入力するマルチプレクサを備え、
    前記マルチプレクサは、前記アービトレーション手段で許可されたプロセッサからの信号を選択して前記コプロセッサに供給する、請求項1乃至4のいずれか1項記載のマルチプロセッサ装置。
  6. 前記アービトレーション手段は、前記プロセッサからの使用要求を入力し、前記プロセッサによる前記コプロセッサの資源の使用に競合が生じる場合には、前記コプロセッサの資源の使用を要求するプロセッサのうち、使用が許諾されたプロセッサ以外のプロセッサによる前記コプロセッサの資源の使用をウェイトさせる、請求項1乃至5のいずれか1項記載のマルチプロセッサ装置。
  7. 前記アービトレーション手段は、前記複数のプロセッサが接続される共通バスに接続され、
    前記アービトレーション手段は、前記プロセッサから前記共通バスに出力される信号に基づき、前記プロセッサによる前記コプロセッサの資源の使用に競合が生じると判定される場合、前記コプロセッサの資源の使用を要求するプロセッサのうち使用が許諾されたプロセッサ以外のプロセッサによる前記コプロセッサの資源の使用をウェイトさせる、請求項1記載のマルチプロセッサ装置。
  8. 前記コプロセッサは、前記アービトレーション手段により行われる前記プロセッサ間での資源使用の調停が、前記コプロセッサの資源単位で行われる資源を少なくとも1つ含む、請求項1乃至7のいずれか1項記載のマルチプロセッサ装置。
  9. 前記コプロセッサが、
    複数の資源と、
    前記複数の資源にそれぞれ対応する複数のインタフェースと、
    を有し、
    前記複数の資源は、前記アービトレーション手段により行われる前記プロセッサ間での資源使用の調停が、前記資源単位で行われる資源を少なくとも1つ含む、請求項1乃至7のいずれか1項記載のマルチプロセッサ装置。
  10. 前記コプロセッサの複数の前記資源が、複数の前記資源にそれぞれ対応する複数の前記インタフェースを介して、前記複数のプロセッサから、同時に使用自在とされてなる、請求項9記載のマルチプロセッサ装置。
  11. 前記プロセッサでは、前記密結合バスを介して、前記コプロセッサに、命令を送信し、前記コプロセッサによる、命令実行結果を受け取る処理が行われ、
    前記アービトレーション手段は、前記複数のプロセッサによる前記コプロセッサの資源の使用を、命令パイプラインのステージ単位で、調停する、請求項1乃至7のいずれか1項記載のマルチプロセッサ装置。
JP2007189769A 2007-07-20 2007-07-20 マルチプロセッサ装置 Pending JP2009026135A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2007189769A JP2009026135A (ja) 2007-07-20 2007-07-20 マルチプロセッサ装置
US12/175,882 US8055882B2 (en) 2007-07-20 2008-07-18 Multiplexing commands from processors to tightly coupled coprocessor upon state based arbitration for coprocessor resources

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007189769A JP2009026135A (ja) 2007-07-20 2007-07-20 マルチプロセッサ装置

Publications (1)

Publication Number Publication Date
JP2009026135A true JP2009026135A (ja) 2009-02-05

Family

ID=40265809

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007189769A Pending JP2009026135A (ja) 2007-07-20 2007-07-20 マルチプロセッサ装置

Country Status (2)

Country Link
US (1) US8055882B2 (ja)
JP (1) JP2009026135A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017016637A (ja) * 2015-06-26 2017-01-19 インテル・コーポレーション 密結合ヘテロジニアスコンピューティングのためのハードウェアプロセッサ及び方法

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4868012B2 (ja) * 2009-03-09 2012-02-01 日本電気株式会社 コンピュータシステム、コンピュータシステムの制御方法、及びプログラム
US20170147345A1 (en) * 2015-11-19 2017-05-25 Knuedge, Inc. Multiple operation interface to shared coprocessor
US10871992B2 (en) * 2018-05-30 2020-12-22 Texas Instruments Incorporated Level two first-in-first-out transmission
CN111782580B (zh) * 2020-06-30 2024-03-01 北京百度网讯科技有限公司 复杂计算装置、方法、人工智能芯片和电子设备
CN113312303B (zh) * 2021-04-30 2022-10-21 展讯通信(上海)有限公司 处理器微架构系统、SoC芯片及低功耗智能设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59106075A (ja) * 1982-12-10 1984-06-19 Hitachi Ltd デ−タ処理システム
JP2000298652A (ja) * 1999-04-14 2000-10-24 Mitsubishi Electric Corp マルチプロセッサ
JP2002149424A (ja) * 2000-09-06 2002-05-24 Internatl Business Mach Corp <Ibm> 共有コプロセッサ・リソースに対する複数の論理インタフェース
JP2002342295A (ja) * 2001-05-16 2002-11-29 Nec Corp マルチプロセッサシステム
US20050097305A1 (en) * 2003-10-30 2005-05-05 International Business Machines Corporation Method and apparatus for using FPGA technology with a microprocessor for reconfigurable, instruction level hardware acceleration
JP2007087244A (ja) * 2005-09-26 2007-04-05 Sony Corp コプロセッサ及びコンピュータシステム

Family Cites Families (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3805247A (en) 1972-05-16 1974-04-16 Burroughs Corp Description driven microprogrammable multiprocessor system
US5182801A (en) 1989-06-09 1993-01-26 Digital Equipment Corporation Apparatus and method for providing fast data transfer between multiple devices through dynamic reconfiguration of the memory space of the devices
US5265257A (en) 1990-06-22 1993-11-23 Digital Equipment Corporation Fast arbiter having easy scaling for large numbers of requesters, large numbers of resource types with multiple instances of each type, and selectable queuing disciplines
JP2908598B2 (ja) 1991-06-06 1999-06-21 松下電器産業株式会社 情報処理装置
US5371893A (en) 1991-12-27 1994-12-06 International Business Machines Corporation Look-ahead priority arbitration system and method
WO1994027216A1 (en) 1993-05-14 1994-11-24 Massachusetts Institute Of Technology Multiprocessor coupling system with integrated compile and run time scheduling for parallelism
US6594752B1 (en) 1995-04-17 2003-07-15 Ricoh Company, Ltd. Meta-address architecture for parallel, dynamically reconfigurable computing
EP0752666A3 (en) 1995-07-06 2004-04-28 Sun Microsystems, Inc. Method and apparatus for fast-forwarding slave requests in a packet-switched computer system
US5754865A (en) 1995-12-18 1998-05-19 International Business Machines Corporation Logical address bus architecture for multiple processor systems
US6173349B1 (en) 1996-10-18 2001-01-09 Samsung Electronics Co., Ltd. Shared bus system with transaction and destination ID
US5784394A (en) 1996-11-15 1998-07-21 International Business Machines Corporation Method and system for implementing parity error recovery schemes in a data processing system
US6055619A (en) 1997-02-07 2000-04-25 Cirrus Logic, Inc. Circuits, system, and methods for processing multiple data streams
US5941949A (en) 1997-05-14 1999-08-24 Citrix Systems, Inc. System and method for transmitting data from a server application to more than one client node
US5949982A (en) 1997-06-09 1999-09-07 International Business Machines Corporation Data processing system and method for implementing a switch protocol in a communication system
US6026478A (en) 1997-08-01 2000-02-15 Micron Technology, Inc. Split embedded DRAM processor
US6049845A (en) 1997-11-05 2000-04-11 Unisys Corporation System and method for providing speculative arbitration for transferring data
US6230229B1 (en) 1997-12-19 2001-05-08 Storage Technology Corporation Method and system for arbitrating path contention in a crossbar interconnect network
US6041400A (en) 1998-10-26 2000-03-21 Sony Corporation Distributed extensible processing architecture for digital signal processing applications
US6185221B1 (en) 1998-11-09 2001-02-06 Cabletron Systems, Inc. Method and apparatus for fair and efficient scheduling of variable-size data packets in an input-buffered multipoint switch
US7072817B1 (en) 1999-10-01 2006-07-04 Stmicroelectronics Ltd. Method of designing an initiator in an integrated circuit
US6628662B1 (en) 1999-11-29 2003-09-30 International Business Machines Corporation Method and system for multilevel arbitration in a non-blocking crossbar switch
US6687797B1 (en) 2001-05-17 2004-02-03 Emc Corporation Arbitration system and method
US7714870B2 (en) * 2003-06-23 2010-05-11 Intel Corporation Apparatus and method for selectable hardware accelerators in a data driven architecture
US7013357B2 (en) 2003-09-12 2006-03-14 Freescale Semiconductor, Inc. Arbiter having programmable arbitration points for undefined length burst accesses and method
JP2006260377A (ja) 2005-03-18 2006-09-28 Seiko Epson Corp 並列処理装置および情報処理方法
US7587543B2 (en) 2006-01-23 2009-09-08 International Business Machines Corporation Apparatus, method and computer program product for dynamic arbitration control
US7844805B2 (en) * 2006-08-23 2010-11-30 Via Technologies, Inc. Portable processing device having a modem selectively coupled to a RISC core or a CISC core
US9262356B2 (en) * 2006-12-15 2016-02-16 Lantiq Beteiligungs-GmbH & Co.KG Arbiter device and arbitration method
US8156273B2 (en) * 2007-05-10 2012-04-10 Freescale Semiconductor, Inc. Method and system for controlling transmission and execution of commands in an integrated circuit device

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59106075A (ja) * 1982-12-10 1984-06-19 Hitachi Ltd デ−タ処理システム
JP2000298652A (ja) * 1999-04-14 2000-10-24 Mitsubishi Electric Corp マルチプロセッサ
JP2002149424A (ja) * 2000-09-06 2002-05-24 Internatl Business Mach Corp <Ibm> 共有コプロセッサ・リソースに対する複数の論理インタフェース
JP2002342295A (ja) * 2001-05-16 2002-11-29 Nec Corp マルチプロセッサシステム
US20050097305A1 (en) * 2003-10-30 2005-05-05 International Business Machines Corporation Method and apparatus for using FPGA technology with a microprocessor for reconfigurable, instruction level hardware acceleration
JP2007087244A (ja) * 2005-09-26 2007-04-05 Sony Corp コプロセッサ及びコンピュータシステム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017016637A (ja) * 2015-06-26 2017-01-19 インテル・コーポレーション 密結合ヘテロジニアスコンピューティングのためのハードウェアプロセッサ及び方法
US10372668B2 (en) 2015-06-26 2019-08-06 Intel Corporation Hardware processors and methods for tightly-coupled heterogeneous computing

Also Published As

Publication number Publication date
US20090024834A1 (en) 2009-01-22
US8055882B2 (en) 2011-11-08

Similar Documents

Publication Publication Date Title
JP7025617B2 (ja) メモリにアクセスするための並列処理装置、コンピュータにより実施される方法、システム、コンピュータ可読媒体
EP3353673B1 (en) On-chip atomic transaction engine
TWI386814B (zh) 具動態工作管理能力之多處理器界面及其程式載卸方法
US7631308B2 (en) Thread priority method for ensuring processing fairness in simultaneous multi-threading microprocessors
CN100462913C (zh) 用于阻塞线程的方法与装置
TW201734758A (zh) 使用硬體佇列裝置的多核心通訊加速
KR100985318B1 (ko) 운영 체계 서비스의 투명한 지원을 위한 방법 및 제품
JP2018509687A (ja) ユーザレベルの分岐及び結合を行うプロセッサ、方法、システム、及び命令
AU6450899A (en) Shared memory type vector processing system and control method thereof
JP2009026135A (ja) マルチプロセッサ装置
US8949836B2 (en) Transferring architected state between cores
JP2002117002A (ja) 共用型ペリフェラルアーキテクチャ
US20080288691A1 (en) Method and apparatus of lock transactions processing in single or multi-core processor
Kollig et al. Heterogeneous multi-core platform for consumer multimedia applications
WO2010016169A1 (ja) マルチプロセッサシステム及びその制御方法
US20080077721A1 (en) Methods And Apparatus For Dynamic Grouping Of Requestors Of Resources In A Multi-Processor System
CN107729267B (zh) 资源的分散分配以及用于支持由多个引擎执行指令序列的互连结构
US7996592B2 (en) Cross bar multipath resource controller system and method
JP2008146503A (ja) 分散処理方法、オペレーティングシステムおよびマルチプロセッサシステム
Karim et al. A multilevel computing architecture for embedded multimedia applications
JP2009026136A (ja) マルチプロセッサ装置
US20080172507A1 (en) Methods and Apparatus for Synchronizing a Plurality of Processors
Sousa et al. Runtime reconfigurable bus arbitration for concurrent applications on heterogeneous MPSoC architectures
JP2010257134A (ja) 半導体データ処理装置及びデータ処理システム
JP2001167058A (ja) 情報処理装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100419

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111226

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120117

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120515