JP2008503806A - マイクロプロセッサ及び論理装置の為の接続システムの方法及び構造 - Google Patents

マイクロプロセッサ及び論理装置の為の接続システムの方法及び構造 Download PDF

Info

Publication number
JP2008503806A
JP2008503806A JP2007516829A JP2007516829A JP2008503806A JP 2008503806 A JP2008503806 A JP 2008503806A JP 2007516829 A JP2007516829 A JP 2007516829A JP 2007516829 A JP2007516829 A JP 2007516829A JP 2008503806 A JP2008503806 A JP 2008503806A
Authority
JP
Japan
Prior art keywords
data
processor
storage device
shared storage
processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2007516829A
Other languages
English (en)
Other versions
JP2008503806A5 (ja
Inventor
ラモス,ジェレミー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Honeywell International Inc
Original Assignee
Honeywell International Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Honeywell International Inc filed Critical Honeywell International Inc
Publication of JP2008503806A publication Critical patent/JP2008503806A/ja
Publication of JP2008503806A5 publication Critical patent/JP2008503806A5/ja
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/16Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
    • G06F15/163Interprocessor communication
    • G06F15/167Interprocessor communication using a common memory, e.g. mailbox

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Advance Control (AREA)
  • Multi Processors (AREA)

Abstract

複数のプロセッサと論理装置とを接続するためのシステムが提供される。このシステムは、それぞれが共有記憶装置に接続された、中央プロセッサユニット・ノードと、再構成可能接続ノードとを含む。このシステムは更に中央プロセッサユニット・ノードと再構成可能接続ノードの間の信号通信に用いる個別の入出力バスを含む。

【選択図】 図1

Description

本発明は一般的に電子システムに関し、特に電子システム内のプロセッサと論理装置との接続に関する。
電子システムにおいては、種々のサブシステム要素をデータ経路を用いて接続する必要がある。フィールド・プログラム可能ゲートアレイ(FPGA)のような論理装置は、以前から種々の方法でマイクロプロセッサと接続されて来た。典型的にはFPGAは標準バス(例えばPCIバス)を用いてプロセッサと接続された。
最近の技術は中央プロセッサユニット(CPU)ノードを再構成可能接続(RCC)ノードに入出力バスを用いて接続する構造を有する。CPUノードはプロセッサを有し、RCCノードはFPGAからなる。通常ソフトウエア実装プロセスがCPU内で実行され、ハードウエア実装タスクがFPGA内で実現される。この形式の構造は、多くのデータをやりとりする必要があり、そのためプロセッサと論理装置の間を入出力バスを介してデータが行ったり来たりするという本質的な欠点を有する。その結果入出力バスにボトルネックが生じ、これらの装置間の実質的通信速度が低下する。
またこの形式の構造は、通信オーバーヘッドの一般的な問題も欠点として持つ。通信オーバーヘッドの存在は、プロセッサとFPGA間のデータ及び結果の移動のために要する時間をかなり長くする。加えてFPGA内で実行される処理に必要な時間は、FPGAとプロセッサ間でのデータ及び結果の移動を待つ時間よりかなり小さい。これはFPGAをかなりの時間にわたってアイドル状態にし、その結果その待ち時間中の利用を妨げる。従って、処理中のFPGAの能率が損なわれる。この問題を克服する1つの選択肢はより高速のバスを開発することである。しかしながら、プロセッサとFPGA間のデータ及び結果の移動をするためのより高速のバスを開発することは、簡単なことではない。
FPGAとプロセッサ間の通信速度を増加するもう1つの提案は、プロセッサとFPGAを共通の基板内に製造することである。これは実際上、装置提供技術の情勢的提案である。しかしながら、これは放射線に曝される電子装置に可能な製作技術における制限のため、宇宙空間に基づく電子装置実装に対しては現在実現性が無い。再度この結果を成し遂げるための基礎的半導体プロセスの進歩も簡単なことではない。
上述の理由と、本願明細書を読んで理解することによって当業者に分るであろう以降の他の理由によって、論理装置とプロセッサを接続してシステム性能を向上させるための進歩した方法及び構造の技術の必要がある。
論理装置とプロセッサとの接続の上述の問題が本発明の実施例によって扱われ、以下の記述を読んで調べることによって理解できる。本発明の実施例は、プロセッサと論理装置間のデータ及び結果の移動における遅延の問題を扱う。本発明の実施例は、改善したデータ転送をするためにプロセッサと論理装置間の密結合の接続を、規格品の構成要素を用いて達成する。
1つの実施例では、プロセッサと論理装置及び共有記憶装置を有し、プロセッサが共有記憶装置を介して論理装置と接続され、プロセッサと論理装置間をデータ及び結果が共有記憶装置を通して渡されるシステムが提供される。
以下の好適な実施例の説明において、その部分から関連する図面を参照するが、この図面は本発明の特定の実施例を例示するためであることを理解されたい。他の実施例も利用可能であり本発明の範囲から離れずに構造的変更を行うことも可能である。本願明細書の目的に対して、用語「直接接続」は2つの構成要素がバス無しに、例えば複数の装置間の共通の経路やチャネル無しに相互に接続されることを意味する。
図1は一般的に100で表わされた、中央処理ユニット(CPU)ノード110及び再構成可能計算(RCC)ノード120を有するアーキテクチャのシステムの1つの実施例を示す。1つの実施例において、CPUノード110及びRCCノード120は同一のカード上に実装される。1つの実施例において、RCCノード120はデュアルインライン記憶モジュール(DIMM)内に含まれる。1つの実施例において、中央処理ユニットノード110はプロセッサ102、システム制御装置104及び記憶装置105を含む。1つの実施例において、記憶装置105はセグメント化記憶装置であってRAM、ROM又はフラッシュメモリーのような関連する記憶装置103と、デュアルポート記憶装置(DPM)のような共有記憶装置106とを含む。共有記憶装置106を実装するために記憶装置105の部分を用いることによって、システム100はシステム制御装置104及びマイクロプロセッサ102内の既存の記憶装置インターフェース能力を有利に再利用する。1つの実施例において、記憶装置105は放射線耐性である。1つの実施例において、RCC120は論理装置108を含む。1つの実施例において、論理装置108はフィールド・プログラム可能ゲートアレイ(FPGA)からなり、ハードウエアで特定の機能を実行するようにされている。
1つの実施例において、システム制御装置104はマイクロプロセッサ102に対する支持装置である。システム制御装置104は通常多くの機能を実行し、それには記憶装置インターフェース制御装置、割り込み多重化、入出力(I/O)バスインターフェース、等を含む。この状況において、システム制御装置104はプロセッサ102に対する記憶装置制御装置として機能し、それによってマイクロプロセッサ102のデータ及び命令記憶装置へのアクセスを促進する。システム制御装置は一般的に特定のマイクロプロセッサの配置を支持する「チップセット」の一部として利用可能である。
加えてシステム制御装置104は、マイクロプロセッサ102上のソフトウエアに制御ワードを個別のI/O112を介して論理装置108と通信する事を許す、個別の信号レジスタを実装する。特にシステム制御装置104は個別の信号レジスタを用いて、論理装置108に信号して共有記憶装置106内でデータを処理することを要求する。共有記憶装置106はメモリー105内の多数のメモリーバンクの内の1つであり得るので、システム制御装置104の使用は論理装置108への新型のインターフェースの必要をなくす。
プロセッサ102は特定用途或いは汎用のプロセッサ、マイクロプロセッサ、マイクロ制御装置などのいずれでも良い。プロセッサ102はプログラム可能であり、マシン内或いは関連するメモリー103のようなコンピュータ可読な媒体内に記憶された命令で動作する。
1つの実施例において、プロセッサ102と論理装置108は一緒に動作しシステム100のための特定の機能を実行する。これは多くの場合、プロセッサ102と論理装置108がデータを共有するか又は共通のデータを操作することを必要とする。有利なことには、このデータがプロセッサ102と論理装置108間のバス上におかれることを除去することによって、このデータはこれらの装置間を共有記憶装置106を介して行き来する。
システム100には個別のI/O112も含まれ、これがFPGAに、追加の処理が必要なデュアルポート記憶装置内でデータが利用可能であることを信号する。同様に、結果がデュアルポート記憶装置内でアクセス可能である時、FPGAは個別のI/Oを用いてプロセッサ102に信号する。
1つの実施例において、システム100は規格品の放射線耐性構成要素を用いて作られる。規格品の構成要素を用いることは、より高速のバスを設計したりプロセッサ及び論理装置を同じウエハ上に集積することを許すための新しい作成技術を開発する必要なく、データの高速通信を許す。
一般的に、システムの動作中ある機能はプロセッサ102内で実行され他の機能は論理装置108内で実行される。アプリケーションとアルゴリズムは、ソフトウエア実装プロセスはCPU102内で実行され、ハードウエア実装タスクは論理装置108内で実行されるような方法で分離される。CPUノード110及びRCCノード120はデュアルポート記憶装置(DPM)106である共有資源を共有する。データと結果はI/Oバスを用いてでなくデュアルポート記憶装置106を介してやりとりされる。データの単一のコピーがCPUノード110とRCCノード120によって共有される。加えて同一の実行タスクに対して、データがCPUノード110からRCCノード120へ移動するための時間は、この設計の場合通常のI/Oバスアーキテクチャを用いる設計に比較して少なくとも50パーセント削減される。プロセッサ102があるデータを生成した時、論理装置108は同時にそのデータを読むことが出来る。これは個別のI/O112を用いてCPUノード110とRCCノード120との間で、ある形式のハンドシェーキングを用いることによって成し遂げられる。
1つの実施例において、システム制御装置104は、ハードウエア又はソフトウエアで実装される個別のI/O112を用いて論理装置108に接続される。個別I/Oはシステム制御装置104と論理装置108間の必要なハンドシェーキングを提供し、データが共有記憶装置106内にあることを示す。これは共有記憶装置106内のデータと結果のコピー及び読み出しを調整するために必要である。1つの実施例において、FPGAのような論理装置108は、データがシステム記憶装置内にプロセッサ102によって生成されコピーされるのと同時に、共有記憶装置106からそのデータを処理のために取り出すことができる。
図2aは共有記憶装置を用いて論理装置に直接接続されたプロセッサからのデータの処理の実行方法の1つの実施例の流れ図200である。図2aの方法はブロック202で始まり、更にFPGAのような論理装置で処理される必要があるデータがプロセッサで生成される。この機能を実行するために、ブロック204でデータは、例えばシステム制御装置を用いて共有記憶装置内にコピーされる。ブロック206で、論理装置はデータをその上で必要な処理を実行するために読み出す。1つの実施例において、記憶されたデータはそのデータが共有記憶装置内にコピーされると同時に読み出される。ブロック208で、データは論理装置内で処理される。
図2bは共有記憶装置を用いてプロセッサに直接接続された論理装置からの結果の処理の実行方法の1つの実施例の流れ図220である。ブロック208における論理装置でのデータの処理に続いて、ブロック210で結果が論理装置で生成される。これらの結果はプロセッサへ運ばれなければならない。この機能を実行するために、結果はブロック212に示されるように、共有記憶装置内にコピーされる。最後にプロセッサがブロック214に示されるように、結果を共有記憶装置から読み出す。1つの実施例において、プロセッサは記憶された結果を、その結果が共有記憶装置内にコピーされると同時に読み出す。
1つの実施例において、上述のアーキテクチャは、アナログ−デジタル及びデジタル−アナログ変換のような外部インターフェースにFPGAを接続する事による応用で用いることが出来る。1つの実施例において、FPGAはハードウエア内に実装されたオペレーティングシステムをホストする。オペレーティングシステムがFPGA上に在り、プロセッサ102の削減された合計時間を用いるために、これは非常に低いオーバーヘッドのコンテクストスイッチングを許すであろう。
本願発明の実施例を説明した。1つの実施例は共有記憶装置を用いて論理装置とプロセッサとを接続するアーキテクチャを提供する。この実施例はデータ及び結果がプロセッサの記憶装置と論理装置との間を移動するための時間を削減する。
この明細書においては特定の実施例が例示され説明されたが、この特定の実施例の示すのと同様の目的を実現するために当業者が任意の修正で置き換え得ることは明らかであろう。この出願は本願発明の任意の翻案や変形をも包含することを意図するものである。
図1はプロセッサと論理装置がシステム記憶装置で直接接続されている接続構造の実施例を示す図である。 図2Aは共有記憶装置を用いて論理装置と直接接続されているプロセッサからのデータ処理の動作方法の実施例の流れ図である。 図2Bは共有記憶装置を用いてプロセッサと直接接続されている論理装置からの結果処理の動作方法の実施例の流れ図である。 図3はプロセッサ及び論理装置間の命令、データ及び結果の取り扱い方法の実施例の流れ図である。

Claims (12)

  1. プロセッサと論理装置と共有記憶装置とからなり、
    データ及び結果を前記プロセッサと前記論理装置間でパスするために、前記プロセッサが前記論理装置に前記共有記憶装置を介して接続されていることを特徴とする、
    システム。
  2. 請求項1に記載のシステムにおいて、
    前記共有記憶装置が、第1のポートが前記プロセッサに接続され、第2のポートが前記論理装置に接続されたデュアルポート記憶装置であることを特徴とする、
    システム。
  3. 請求項1に記載のシステムにおいて、
    前記論理装置が、フィールドプログラム可能ゲートアレイであることを特徴とする、
    システム。
  4. 請求項1に記載のシステムにおいて、
    前記プロセッサが、中央処理装置ノードからなり、
    前記論理装置が、再構成可能計算機ノードからなることを特徴とする、
    システム。
  5. 電子システムにおいてプロセッサと論理装置間でデータ通信をする方法であって、
    前記プロセッサでデータを生成するステップと、
    前記プロセッサからデータを共有記憶装置の第1のポートに供給するステップと、
    前記共有記憶装置の第2のポートから前記データを前記論理装置内へ読み出すステップと、
    前記データを前記論理装置で処理するステップと、
    からなる方法。
  6. 請求項5に記載の方法において、
    前記データを前記論理装置で処理するステップが、前記データをフィールドプログラム可能ゲートアレイで処理することからなることを特徴とする方法。
  7. 請求項5に記載の方法において、更に、
    結果を前記論理装置で生成するステップと、
    前記論理装置から結果を共有記憶装置の第1のポートに供給するステップと、
    前記共有記憶装置の第2のポートから前記結果を前記プロセッサ内へ読み出すステップと、
    前記結果を前記プロセッサで処理するステップと、
    を含むことを特徴とする方法。
  8. 請求項5に記載の方法において、
    前記プロセッサでデータを生成するステップが、前記データを中央処理装置ノードで生成することからなり、
    前記データを前記論理装置で処理するステップが、前記データを再構成可能計算ノードで処理することからなる、
    ことを特徴とする方法。
  9. 請求項5に記載の方法において、
    前記共有記憶装置から前記データを読み出すステップが、前記中央処理装置によって前記データが前記共有記憶装置に供給されると実質的に同時に前記データを読み出すことからなることを特徴とする方法。
  10. 請求項8に記載の方法において、
    前記データを中央処理装置ノードで生成することが、前記データを放射線耐性中央処理装置ノードで生成することからなることを特徴とする方法。
  11. 請求項8に記載の方法において、
    前記データを再構成可能計算ノードで処理することが、前記データを放射線耐性論理装置を有する再構成可能計算ノードで処理することからなることを特徴とする方法。
  12. 請求項5に記載の方法において、
    前記プロセッサでデータを生成するステップが、第1のデータを記憶された命令に基づいて前記プロセッサで処理することからなり、
    前記データを前記論理装置で処理するステップが、他のデータを前記論理装置のハードウエア構成に基づいて前記論理装置で処理することからなる、
    ことを特徴とする方法。
JP2007516829A 2004-06-18 2005-06-17 マイクロプロセッサ及び論理装置の為の接続システムの方法及び構造 Withdrawn JP2008503806A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/872,216 US20050283550A1 (en) 2004-06-18 2004-06-18 Method and architecture of a coupling system for microprocessors and logic devices
PCT/US2005/021844 WO2006002120A2 (en) 2004-06-18 2005-06-17 Method and architecture of a coupling system for microprocessors and logic devices

Publications (2)

Publication Number Publication Date
JP2008503806A true JP2008503806A (ja) 2008-02-07
JP2008503806A5 JP2008503806A5 (ja) 2008-07-03

Family

ID=35481886

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007516829A Withdrawn JP2008503806A (ja) 2004-06-18 2005-06-17 マイクロプロセッサ及び論理装置の為の接続システムの方法及び構造

Country Status (4)

Country Link
US (1) US20050283550A1 (ja)
EP (1) EP1782242A2 (ja)
JP (1) JP2008503806A (ja)
WO (1) WO2006002120A2 (ja)

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6288970B1 (en) * 1997-10-16 2001-09-11 Altera Corporation Programmable logic device memory array circuit having combinable single-port memory arrays
US6748457B2 (en) * 2000-02-03 2004-06-08 Realtime Data, Llc Data storewidth accelerator
US6535942B1 (en) * 2000-02-09 2003-03-18 Telefonaktiebolaget L M Ericsson (Publ) Method for reducing processor interrupt load
US7096324B1 (en) * 2000-06-12 2006-08-22 Altera Corporation Embedded processor with dual-port SRAM for programmable logic
US20030061409A1 (en) * 2001-02-23 2003-03-27 Rudusky Daryl System, method and article of manufacture for dynamic, automated product fulfillment for configuring a remotely located device
TW577020B (en) * 2001-07-12 2004-02-21 Ip Flex Inc Integrated circuit device
US6907503B2 (en) * 2001-09-27 2005-06-14 Daimlerchrysler Corporation Dual port RAM communication protocol
US6901532B2 (en) * 2002-03-28 2005-05-31 Honeywell International Inc. System and method for recovering from radiation induced memory errors
US7109859B2 (en) * 2002-12-23 2006-09-19 Gentag, Inc. Method and apparatus for wide area surveillance of a terrorist or personal threat

Also Published As

Publication number Publication date
WO2006002120A3 (en) 2006-08-17
EP1782242A2 (en) 2007-05-09
US20050283550A1 (en) 2005-12-22
WO2006002120A2 (en) 2006-01-05

Similar Documents

Publication Publication Date Title
JP4128956B2 (ja) デュアル・インライン・メモリモジュール・フォーマットにおいて一連のマルチアダプティブプロセッサを採用したクラスタ型コンピュータ用スイッチ/ネットワークアダプタポート
EP3896574B1 (en) System and method for computing
CN103793342B (zh) 一种多通道直接内存存取dma控制器
US7788334B2 (en) Multiple node remote messaging
US10394747B1 (en) Implementing hierarchical PCI express switch topology over coherent mesh interconnect
US7802025B2 (en) DMA engine for repeating communication patterns
EP3400688A1 (en) Massively parallel computer, accelerated computing clusters, and two dimensional router and interconnection network for field programmable gate arrays, and applications
EP1779609B1 (en) Integrated circuit and method for packet switching control
JP2010102719A (ja) メモリサブシステムに複数のメモリアルゴリズムプロセッサを組込むマルチプロセッサコンピュータアーキテクチャ
JP2006216060A (ja) データ処理方法およびデータ処理システム
US8341360B2 (en) Method and apparatus for memory write performance optimization in architectures with out-of-order read/request-for-ownership response
JPH05324348A (ja) シングルチップマイクロコンピュータ
JP2009282917A (ja) サーバ間通信機構及びコンピュータシステム
JPH10283304A (ja) 割り込み要求を処理する方法及びシステム
US7254667B2 (en) Data transfer between an external data source and a memory associated with a data processor
JP2831083B2 (ja) マルチプロセッサシステムおよび割り込み制御装置
JP2008503806A (ja) マイクロプロセッサ及び論理装置の為の接続システムの方法及び構造
JPH0997231A (ja) バス間の変換を有する情報処理システム
JP2004199187A (ja) Cpu内蔵lsi
JP3861898B2 (ja) データ処理システム、アレイ型プロセッサ、データ処理装置、コンピュータプログラム、情報記憶媒体
JPS62152061A (ja) マイクロプロセツサ
Miller et al. Lower level architecture of the Sombrero single address space distributed operating system
JPS6240565A (ja) メモリ制御方式
Hung A SHARED MEMORY MULTI-MICROPROCESSOR SYSTEM WITH HARDWARE SUPPORTED MESSAGE PASSING MECHANISMS
AU2002356010A1 (en) Switch/network adapter port for clustered computers employing a chain of multi-adaptive processors in a dual in-line memory module format

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080515

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080515

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20090421