JP6995745B2 - マルチステージブートイメージロードおよびプログラマブルロジックデバイスの構成 - Google Patents

マルチステージブートイメージロードおよびプログラマブルロジックデバイスの構成 Download PDF

Info

Publication number
JP6995745B2
JP6995745B2 JP2018517393A JP2018517393A JP6995745B2 JP 6995745 B2 JP6995745 B2 JP 6995745B2 JP 2018517393 A JP2018517393 A JP 2018517393A JP 2018517393 A JP2018517393 A JP 2018517393A JP 6995745 B2 JP6995745 B2 JP 6995745B2
Authority
JP
Japan
Prior art keywords
boot
image
soc
pcie
memory
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018517393A
Other languages
English (en)
Other versions
JP2018531461A6 (ja
JP2018531461A (ja
Inventor
サーマー,ムリナル・ジェイ
アビラム・サイ・クリシュナ,ボッカ
クマール・エイ・ブイ,アニル
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xilinx Inc
Original Assignee
Xilinx Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US14/876,467 external-priority patent/US9934175B2/en
Priority claimed from US14/931,037 external-priority patent/US9864605B2/en
Application filed by Xilinx Inc filed Critical Xilinx Inc
Publication of JP2018531461A publication Critical patent/JP2018531461A/ja
Publication of JP2018531461A6 publication Critical patent/JP2018531461A6/ja
Application granted granted Critical
Publication of JP6995745B2 publication Critical patent/JP6995745B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/4401Bootstrapping
    • G06F9/4403Processor initialisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/4401Bootstrapping

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Systems (AREA)
  • Stored Programmes (AREA)

Description

技術分野
本開示は一般に、ブートイメージのロードと、プログラマブルロジックデバイスの構成とに関する。
背景
メモリ回路を使用し得るさまざまな異なる用途が存在しており、当該用途は、プログラマブルロジックデバイス(PLD: programmable logic device)を含むがこれに限定されない。PLDは、特定されたロジック機能(logic function)を実行するようにプログラムされ得る周知のタイプのプログラマブル集積回路(IC)である。1つのタイプのPLDであるフィールドプログラマブルゲートアレイ(FPGA)は典型的に、プログラマブルタイルのアレイを含む。これらのプログラマブルタイルは、さまざまなタイプのロジックブロックを含んでおり、当該ロジックブロックはたとえば、入出力ブロック(IOB)と、コンフィギュラブルロジックブロック(CLB)と、専用ランダムアクセスメモリブロック(BRAM)と、マルチプライヤと、デジタル信号処理ブロック(DSP)と、プロセッサと、クロックマネージャと、遅延ロックループ(DLL)と、ペリフェラルコンポーネントインターコネクトエクスプレス(PCIe)およびイーサネット(登録商標)のようなバスまたはネットワークインターフェイスなどとを含み得る。
いくつかのPLDは、単一のICチップ上で全コンピュータシステムとして有効に機能するのに十分なコンポーネントおよび機能を含む。そのような機能を有するPLDは、システムオンチップ(SOC: system on a chip)と称される場合がある。SOCは、異なる機能を実行するためにソフトウェア命令を実行する1つ以上のプロセッサ回路を含み得る。起動(たとえば、ハードのパワーオンまたはハードのリセット)時には、SOCによって実行される命令のうちの最も初めのセットのうちのいくつかが、SOCをどのようにブートするかについて命令を提供する。たとえば、SOCは最初に、第1のステージブートローダ(FSBL: first-stage boot loader)イメージをロードするようにSOCを構成するブートリードオンリメモリ(ROM)を実行し得る。FSBL命令は、SOCの周辺機能ブロックがどのように構成されるかを特定し得、構成ビットストリームを制御および実現し得、オペレーティングシステム(OS)および他のブート関連機能をセットアップおよび実行し得る。SOCについてのブートイメージはしばしば、リードオンリメモリ(ROM)回路のような不揮発性メモリからロードされ得る。
SOCによって使用されるブートイメージのサイズが増加すると、ブートイメージについてのストレージ位置のサイズが増加する。ブートイメージをロードするのに必要な時間も増加し得る。したがって、SOCが完全に構成および動作される前の時間が増加し得る。電源投入時または同様の状況に関わらず、SOCを迅速に利用可能にすることが望ましい場合には、ロード時間の増加は問題であり得る。これらの問題および他の問題は、SOC設計およびそれらの使用について問題であり得る。
概要
ある実現例は、プロセッサ回路を含む集積回路(IC)をブートするための方法に関する。当該方法は、ICのストレージインターフェイス回路を使用して不揮発性メモリチップから第1のブートイメージを受信することを含み得る。バスインターフェイスモジュールは、ICのプロセッサ回路上で第1のブートイメージを実行することにより構成され得る。バスインターフェイスモジュールは、複数のデバイスおよびICをリンクする通信バスを介してホストデバイスとの間でインターフェイス接続するように設計され得る。バスインターフェイスモジュールは、ホストデバイスのメモリからICのメモリへ第2のブートイメージを通信するために使用され得る。ICは第2のブートイメージを実行することによりブートされ得る。
随意に、バスインターフェイスモジュールはさらに、パケットベースのプロトコルを使用して、ホストデバイスとICとの間のポイントツーポイントリンクを介して、ホストデバイスと通信するように設計され得る。
随意に、パケットベースのプロトコルは、データをカプセル化するとともに宛先アドレスを特定するパケットを定義する。
随意に、上記方法は、第2のブートイメージICのプロセッサ回路提供するよう、ホストデバイスとのハンドシェイクプロトコルを実現することをさらに含む。
随意に、上記方法は、ブートリードオンリメモリ(ROM)イメージをロードすることと、第1のブートイメージを受信するようにICに命令するためにブートROMイメージを実行することとをさらに含む。
随意に、通信バスは、ペリフェラルコンポーネントインターコネクトエクスプレス(PCIe)通信バスであり得、ICはプログラマブルロジックタイルを含み得る。
随意に、バスインターフェイスモジュールを構成することは、ホストデバイスのルートコンプレックスモジュールとの通信のためにバスインターフェイスモジュールを列挙することを含み得る。
随意に、上記方法は、バスインターフェイスモジュールの列挙の完了に応答して、スクラッチパッドメモリスペースにおいて値をセットすることをさらに含み得る。
随意に、第1のブートイメージはブートリードオンリメモリ(ROM)イメージであり得、第2のブートイメージは第1のステージブートローダ(FSBL)イメージであり得る。
随意に、第1のブートイメージは第1のステージブートローダ(FSBL)イメージであり得、第2のブートイメージは第2のステージブートローダ(SSBL)イメージであり得る。
さまざまな実現例に従うと、システムはICを含む。ICは、複数のデバイスをICにリンクする通信バスを介してホストデバイスと通信するように構成されるバスインターフェイスモジュールを含む。ストレージインターフェイス回路は、不揮発性メモリチップから第1のブートイメージを受信するように構成される。プロセッサ回路は、ホストデバイスのメモリからICに第2のブートイメージを通信するようバスインターフェイスモジュールを構成するために第1のブートイメージを実行することと、第2のブートイメージを実行することによってICをブートすることとを行うように構成される。
随意に、バスインターフェイスモジュールはさらに、パケットベースのプロトコルを使用して、ホストデバイスとICとの間のポイントツーポイントリンクを介して、ホストデバイスと通信するように設計され得る。
随意に、パケットベースのプロトコルは、データをカプセル化するとともに宛先アドレスを特定するパケットを定義する。
随意に、プロセッサ回路はさらに、第2のブートイメージを提供するホストデバイスとのハンドシェイクプロトコルを実現するように構成され得る。
随意に、ストレージインターフェイス回路はさらに、ブートリードオンリメモリ(ROM)イメージをロードするように構成され得、ブートROMイメージは、不揮発性メモリチップからの第1のブートイメージの受信を行うようICのための命令を含み得る。
随意に、通信バスは、ペリフェラルコンポーネントインターコネクトエクスプレス(PCIe)通信バスであり得、ICはプログラマブルロジックタイルを含み得る。
随意に、プロセッサ回路は、PCIe通信バスについての列挙プロセスの部分として、バスインターフェイスモジュールを構成するように構成され得る。
随意に、プロセッサ回路は、バスインターフェイスモジュールの列挙の完了に応答して、スクラッチパッドメモリスペースにおいて値をセットするように構成され得る。
随意に、バスインターフェイスモジュールは8B/10Bエンコーディングを使用するように構成され得る。
随意に、第1のブートイメージは第1のステージブートローダ(FSBL)イメージであり得、第2のブートイメージは第2のステージブートローダ(SSBL)イメージであり得る。
ある実現例は、プログラマブル集積回路(IC)を構成するための方法に関する。上記方法は、プログラマブルICのストレージインターフェイス回路を使用して、ストレージ回路とプログラマブルICとの間の構成データの第1のセットを通信することを含む。構成データの第1のセットを使用して、プログラマブルICは、複数のデバイスをリンクする通信バスを介してホストデバイスとインターフェイス接続するように設計されるバスインターフェイスモジュールと、バスインターフェイスモジュールとプログラマブルICのプログラマブルロジックとの間でインターフェイス接続するように設計される内部構成アクセスインターフェイスとを含むように、構成される。バスインターフェイスモジュールを通じて、ダイレクトメモリアクセス(DMA)転送を使用して、構成データの第2のセットは、メインメモリ回路とプログラマブルICとの間で通信される。構成データの第2のセットを使用して、プログラマブルICのプログラマブルロジックが構成される。
随意に、バスインターフェイスモジュールはさらに、パケットベースのプロトコルを使用して、ホストデバイスとプログラマブルICとの間のポイントツーポイントリンクを介して、ホストデバイスとインターフェイス接続するように設計され得る。
随意に、パケットベースのプロトコルは、データをカプセル化するとともに宛先アドレスを特定するパケットを定義する。
随意に、構成データの第1のセットを使用してプログラマブルICを構成することは、DMAエンジンを含むようにプログラマブルICを構成することをさらに含み得る。
随意に、上記方法は、ホストデバイスのメモリにおける特定の位置について少なくとも1つの読出コマンドをホストデバイスからDMAエンジンに通信することをさらに含み得、当該特定の位置は、構成データの第2のセットを格納する。
随意に、ダイレクトメモリアクセス(DMA)転送を使用して、構成データの第2のセットをバスインターフェイスモジュールに通信することは、ホストデバイスのメモリにおける特定の位置へのDMAアクセスを実行するよう、ホストデバイスのルートコンプレックスモジュールを構成することをさらに含み得、当該特定の位置は、構成データの第2のセットを格納する。
随意に、上記方法は、DMA転送のためにバスインターフェイスモジュールのベースアドレスレジスタを構成することをさらに含む。
随意に、上記方法はさらに、バスインターフェイスモジュールを通じて、ダイレクトメモリアクセス(DMA)転送を使用して、構成データの第2のセットを通信するようホストデバイス上でソフトウェアドライバを実行することを含む。
随意に、上記方法はさらに、バッファアドレスレジスタおよび構成データの第2のセットのサイズに関する情報を含むバッファ記述子チェーンをセットアップすることを含む。
ある実現例に従うと、システムはプログラマブル集積回路(IC)を含む。プログラマブルICは、ストレージ回路に接続されストレージ回路から構成データを受信するように構成される第1のインターフェイス回路と、複数のデバイスをリンクする通信バスに接続される第2のインターフェイス回路とを含む。ストレージ回路は、構成データの第1のセットを格納しており、構成データの第1のセットは、第1のインターフェイス回路を通じてプログラマブルICへロードする際、通信バスを介してホストデバイスとインターフェイス接続するように設計されるバスインターフェイスモジュールと、バスインターフェイスモジュールとプログラマブルICのプログラマブルロジックとの間でインターフェイス接続するように設計される内部構成アクセスインターフェイスと、バスインターフェイスモジュールを通じて、ダイレクトメモリアクセス(DMA)転送を使用して、メインメモリ回路とプログラマブルICとの間で構成データの第2のセットを通信するように設計されるダイレクトメモリアクセス(DMA)モジュールとを作り出すように構成される。
随意に、バスインターフェイスモジュールはさらに、パケットベースのプロトコルを使用して、ホストデバイスとプログラマブルICとの間のポイントツーポイントリンクを介して、ホストデバイスとインターフェイス接続するように設計され得る。
随意に、パケットベースのプロトコルは、データをカプセル化するとともに宛先アドレスを特定するパケットを定義し得る。
随意に、バスインターフェイスモジュールはDMAエンジンを含み得る。
随意に、DMAエンジンは、構成データの第2のセットについてホストデバイスのメモリにおける特定の位置を特定する少なくとも1つの読出コマンドを受信することに応答して、メインメモリにアクセスするように構成され得る。
ある実現例では、システムは、プログラマブル集積回路(IC)を含む。プログラマブル集積回路(IC)は、ストレージ回路に接続されストレージ回路から構成データを受信するように構成される第1のインターフェイス回路と、複数のデバイスをリンクする通信バスに接続される第2のインターフェイス回路とを含む。システムは、構成データの第1のセットを格納するストレージ回路を含む。構成データの第1のセットは、第1のインターフェイス回路を通じてプログラマブルICへロードする際に、通信バスを介してホストデバイスとインターフェイス接続するように設計されるバスインターフェイスモジュールと、バスインターフェイスモジュールとプログラマブルICのプログラマブルロジックとの間でインターフェイス接続するように設計される内部構成アクセスインターフェイスとを作り出すように構成される。上記システムはさらに、バスインターフェイスモジュールを通じて、ダイレクトメモリアクセス(DMA)転送を使用して、メインメモリ回路とプログラマブルICとの間で構成データの第2のセットを通信するように設計されるダイレクトメモリアクセス(DMA)エンジンを有するホストデバイスを含む。
随意に、バスインターフェイスモジュールはさらに、パケットベースのプロトコルを使用して、ホストデバイスとプログラマブルICとの間のポイントツーポイントリンクを介して、ホストデバイスとインターフェイス接続するように設計され得る。
随意に、パケットベースのプロトコルは、データをカプセル化するとともに宛先アドレスを特定するパケットを定義し得る。
随意に、ホストデバイスは、ホストデバイスのメモリにおいて特定の位置を特定する少なくとも1つの読出コマンドをDMAエンジンに通信するように構成され得、特定の位置は、構成データの第2のセットを格納し得る。
随意に、DMAエンジンはルートコンプレックスデバイスの部分であり得る。
随意に、ホストデバイスおよびダイレクトメモリアクセス(DMA)エンジンは、ホストデバイスのプロセッサ回路上で実行されるソフトウェアドライバを使用して構成データの第2のセットを通信するように構成され得る。
他の特徴は、以下の詳細な説明および添付の請求の範囲を考慮して認識されるであろう。
以下の詳細な説明を検討し、添付の図面を参照すると、方法、デバイスおよびシステムのさまざまな局面および特徴が明白になるであろう。
ある実現例に従った、シリアルバスを使用してブートイメージデータを転送するためのシステムのブロック図を示す図である。 本開示の実現例に従った、PCIeを介してFSBLまたはプライマリブートを実行するように構成されるシステムのブロック図を示す図である。 本開示の実現例に従った、PCIeを介してSSBLまたはセカンダリブートを実行するように構成されるシステムのブロック図を示す図である。 さまざまな実現例に従った、PCIeコンポーネントを有するコンピュータシステムのシステム図を示す図である。 ある実現例に従った、構成シリアルデータバスを使用してFSBLイメージを転送するためのシステムとの使用のためのフロー図を示す図である。 ある実現例に従った、構成シリアルデータバスを使用して、セカンダリブートイメージを転送するためのシステムとの使用のためのフロー図を示す図である。 ある実現例に従った、PCIeリンクを使用してFSBLイメージを転送する文脈において有用であるハンドシェイクプロセスについてのフロー図を示す図である。 ある実現例に従った、DMAを使用して構成データを転送するためのシステムのブロック図を示す図である。 本願明細書において議論される実現例に従った、DMA能力を含むルートコンプレックスとして使用されるシステムオンチップ(SoC)を有するシステムのブロック図を示す図である。 本願明細書において議論される実現例に従った、PCIeエンドポイントにおけるDMA能力を有するように構成されるステージ1ロジックを有するシステムのブロック図を示す図である。 さまざまな実現例に従った、PCIeコンポーネントを有するコンピュータシステムのシステム図を示す図である。 ある実現例に従った、DMAを使用して構成データを転送するためのシステムとの使用についてのフロー図を示す図である。 開示された回路およびプロセスが実現され得るプログラマブル集積回路(IC)を示す図である。
詳細な説明
以下の記載では、本願明細書において提示される特定の例を説明するために多くの特定の詳細が記載されている。しかしながら、以下に与えられるすべての特定の詳細がなくても1つ以上の他の例および/またはこれらの例の変形例が実施され得るということは当業者に明白であるはずである。他の場合において、本願明細書における例の記載を不明瞭にしないために、周知の特徴は詳細に記載されていない。例示の容易さのために、同じ参照番号は、同じ要素または同じ要素の付加的なインスタンスを指すように異なる図において使用され得る。
さまざまな実現例は、ブートイメージ(たとえばFSBL、SSBLまたは両方)をロードするためにシリアルバスインターフェイス(たとえばPCIe)モジュールを使用するように構成されるシステムに関する。ブートプロセスは、シリアルバスインターフェイスモジュールおよびプログラマブルロジックデバイスを構成するように初期ステージが使用され得るように複数のブートステージに分割され得る。その後のステージの間、当該シリアルバスインターフェイスモジュールを介して、ブートイメージが外部ソースからロードされ得る。ある実現例において、シリアルバスインターフェイスは、(たとえばエンコーディングおよび/またはデータスクランブリング技術を用いて)ブートイメージに含まれるデータを読み出すことを望むサードパーティに対してあるレベルのセキュリティを提供するプロトコルを使用し得る。さまざまな実現例は、高速シリアルインターフェイスの使用による高スループットを活用し得る。
シリアルバスインターフェイスがPCIeである実現例の場合、PCIeリンクを介して転送されるデータは、スクランブルされ8B/10Bエンコードされ得、これにより、外部侵入者が容易にシリアルストリームをデコードすることが困難になる。たとえば、外部侵入は、PCIeリンクパートナーがシリアルデータパスに挿入されることを必要とし得る。さらに、PCIeインターフェイスは、相対的に高速度データ転送(たとえば、使用されるPCIe世代に依存して、レーン(lane)当たり2.5Gbps、5Gbpsおよび8Gbps)を提供するように構成され得る。高速データ転送は、ブートイメージの高速ローディングを提供するため、および、ブートプロセス全体をスピードアップするために、特に有用であり得る。
いくつかの実現例では、シリアルバスインターフェイスを構成する初期ステージは、完全にブートROM内から実行され得る一方、第2のステージは、FSBLイメージ全体を転送し得る。したがって、ブートROMは、FSBLプロセスに使用されるFSBLブートイメージ全体を転送するようSOCプロセッサ回路およびシリアルバスインターフェイスモジュールを構成するための命令を含み得る。
ある実現例では、初期ステージは、ブートROMイメージとFSBLイメージとを実行することを含み得、第2のステージは、第2のステージブートローダ(SSBL: second stage bootloader)プロセスに使用されるブートイメージの転送を含み得る。ブートイメージの第1の部分は、その後のステージの間にSSBLブートイメージを転送するようSOCプロセッサ回路およびシリアルバスインターフェイスモジュールを構成するための命令を含み得る。
ある実現例では、第1のステージは、複数のデバイスを一緒にリンクする通信バスを介してホストデバイスとインターフェイス接続するように設計されるバスインターフェイスモジュールをセットアップおよび構成するのに十分な構成データを含み得る。次いで、システムは、バスインターフェイスモジュールを通じてブートイメージ(全体または部分)をロードし得る。これにより、第2のステージは、ブートイメージを格納する回路とSOCとの間でブートイメージを転送する。次いで、SOCは、ブートプロセスを継続するために、ブートイメージ内に含まれる命令を実行し得る。
さまざまな実現例に従うと、バスインターフェイスモジュールは、ポイントツーポイントトポロジーおよびパケットベースのプロトコルに基づく高速シリアルバスプロトコルを使用して通信するように構成され得る。ポイントツーポイントトポロジーは、デバイス同士間で多くの専用接続を使用し得、共用バストポロジーは、3つ以上のデバイスと共有される接続を使用し得る。パケットベースの通信プロトコルは、データが、各パケットにおいて特定される宛先へ別個の(小さな)ブロックで送信されることを可能にする。必要であり得るように、特定の通信ストリームについてのパケットは、宛先での受信の際に再集合され得る。
パケットを使用するポイントツーポイントトポロジーの特定の例は、ペリフェラルコンポーネントインターコネクトエクスプレス(PCIe: Peripheral Component Interconnect Express)である。議論の容易さのために、さまざまな実現例がPCIeの文脈で議論されるが、他のプロトコル、トポロジーおよび構成も可能であることが理解される。
ある実現例において、初期ステージに対応するデータのサイズは、たとえば1つ以上の設計制約条件に合致するよう相対的に小さいままにされ得る。設計制約条件は、ブートROMメモリ回路のサイズと、初期ステージ命令についての所望のロード時間に合致することとを含み得るが必ずしもこれらに限定されない。さまざまな場合において、初期ステージについての命令は、プログラマブルIC(PLD/FPGA)のデフォルト/構成インターフェイスを介してアクセス可能なメモリ回路に格納され得る。メモリ回路へのインターフェイスは、最初に構成されることなく電源投入時に利用可能なプログラマブルICにおける回路を使用して実現され得る。このタイプのインターフェイスは時に、ハードインターフェイスと称され得る。たとえば、構成データ(たとえばブートROMイメージおよび恐らくFSBLイメージ)の第1のセットは、フラッシュメモリ回路のような永続メモリ回路に格納され得る。したがって、第1のステージについての構成データのサイズは、ハードインターフェイスを使用して構成データがロードされることを可能にするとともに、ブートイメージの後の部分がバス上で利用可能になることを可能にするよう十分に小さいままにされ得る。
さまざまな実現例に従うと、プログラマブルICは、エンドポイント(EP: endpoint)デバイスとして動作するように構成され得、第2のステージイメージのソースはホストデバイスであり得る。たとえば、高速バスはPCIeであり得、プログラマブルICはPCIe EPデバイスとして機能するSoCであり得、第2のステージのソースは、中央処理装置(CPU)を有し、PCIeルートコンプレックス(ホスト)として構成されるリモートコンピュータであり得る。EPデバイスは、リモートCPUによって制御されるPCIeスレーブとして作動し得る。SoCがマルチプロセッサ(MP: multiprocessor)デバイスである場合、ホストCPUは、MPSoCのブートおよび共処理(co-processing)機能を制御し得るアプリケーションプロセッシングユニット(APU:application processing unit)を制御し得る。
ここで図面を参照して、図1は、ある実現例に従った、シリアルバスを使用してブートイメージデータを転送するためのシステムのブロック図を示す。当該ブロック図は、多くの回路コンポーネントを有するSoCデバイス102を含む。図1に示される特定のSoCアーキテクチャは、例として提供される。多くの異なるSoCアーキテクチャが本願明細書において議論される局面および機能に関連して使用され得るということが理解される。SoCデバイス102は1つ以上のプロセッサコア110を含むのが示されている。プロセッサコアはさらにキャッシュおよび他のロジック回路を含み得る。本願明細書において議論されるように、SoCデバイス102は1つ以上のAPUを含み得る。ある実現例では、APUのうちの1つはブートプロセッサとしての使用のために構成され得る。
プロセッサインターコネクト108は、プロセッサコア110とさまざまな他のインターフェイス回路との間のインターフェイスを提供し得る。これらの付加的な回路は、フラッシュコントローラロジック回路104のようなストレージインターフェイス回路を含み得る。当該ストレージインターフェイス回路は、SoCの電源投入の際に、不揮発性メモリ回路(たとえばフラッシュメモリ回路)から第1のブートイメージをロードするように構成される。DRAMコントローラロジック回路106は、ダイナミックメモリ回路へのアクセスを提供するように構成され得る。ダイナミックメモリ回路は、異なるバージョンのダブルデータレート(DDR)(たとえばDDR2、DDR3、DDR3L)に従って動作するように構成されるダイナミックランダムアクセスメモリ(DRAM)回路を含み得るがこれらに限定されない。他のタイプのRAM回路も可能である。
プログラマブルロジック回路ブロック112は、アレイにおいて配されるいくつかの異なるタイプのプログラマブルロジックブロックを含み得る。たとえば、プログラマブルロジックは、マルチギガビットトランシーバ(MGT)、コンフィギュラブルロジックブロック(CLB)、ランダムアクセスメモリブロック(BRAM)、入出力ブロック(IOB)、構成およびクロッキングロジック、デジタル信号処理ブロック、たとえばクロックポートのような特殊化入出力ブロック、ならびに、デジタルクロックマネージャ、アナログ―デジタル変換器およびシステム監視ロジックなどのような他のプログラマブルロジックといった多くの異なるプログラマブルタイルを含み得る。なお、さまざまなSoCアーキテクチャはプログラマブルロジックを含まなくてもよい。議論の容易さのために、さまざまな実施形態はプログラマブルロジックを有するSoCの文脈で議論されるが、対応する実施形態は必ずしもそれに限定されない。
ある実現例に従うと、SoCデバイス102は1つ以上の付加的なハード入出力(I/O)インターフェイスモジュール114を含み得る。これらのI/Oインターフェイスモジュールは、電源投入の際に、対応するビットストリームから、最初にプログラマブルロジックにおいて構成されることなく、利用可能であるプログラマブルICにおいて回路を使用して実現されるハードインターフェイスモジュールであり得る。ハードI/Oインターフェイスモジュール114は、1つ以上のシリアルバスインターフェイスモジュール116(たとえばPCIeインターフェイスモジュール)を含み得る。本願明細書においてより詳細に議論されるように、ハードPCIeインターフェイスモジュールの存在は、第1のステージブートローダ(FSBL)イメージがPCIeを介してロードされることを可能にするために特に有用であり得る。さまざまな実現例において、ソフトPCIeインターフェイスモジュールは、プログラマブルロジック回路ブロック112においてロジックの構成によって使用され得る。さらに本願明細書においてより詳細に議論されるように、ソフトウェアPCIeインターフェイスモジュールの使用は、FSBLがプログラマブルロジック内でPCIeインターフェイスモジュールを構成するために最初に使用された後、第2のステージブートローダ(SSBL)イメージのロードに有用であり得る。
シリアルバスインターフェイスモジュール116は(リモート)ホストデバイス118と通信するように構成され得る。ホストデバイス118は、X-86コンピュータシステムを含むがこれに限定されないさまざまな異なるコンピュータシステムを使用して実現され得る。ホストデバイス118は、CPU124、ホストインターフェイスモジュール122およびストレージ回路120を含み得る。さまざまな実現例に従うと、ホストインターフェイスモジュール122は、ホストデバイスと、スレーブデバイスとして機能し得るSoCとの間のデータフローを制御し得る。PCIe実現例では、ホストインターフェイスモジュール122は、PCIe階層のルートコンプレックスとして機能し得る。
さまざまな実現例に従うと、CPU124上で実行されるソフトウェアドライバは、FSBLプロセスのための使用のためにブートイメージの第2の部分の転送を開始および制御し得る。本願明細書において議論されるように、当該転送は、いつ転送がスタートしたかと、いつ転送が完了したかとをSoCに示すハンドシェイクプロトコルの使用を伴い得る。SoCは、ハンドシェイクプロトコルと、転送の完了の際のブートイメージの第2の部分の実行とを使用するように構成されるソフトウェアドライバを実行し得る。
さまざまな実現例に従うと、最初にブートROM(BootROM)、次いで第1のステージブートローダ(FSBL)が実行される。PCIeリンクが構成され、次いで、ユニバーサルブートローダ(uブート)が、PCIeリンクを介して外部ホストマシンからSoCのローカルメモリに転送され得る。
図2は、本開示の実現例に従った、PCIeを介してFSBLまたはプライマリブートを実行するように構成されるシステムのブロック図を示す。ある実現例に従うと、SoC214は、PCIeインターフェイスを介してFSBLイメージ全体を抽出するように構成され得る。APU202は、電源投入の際に不揮発性メモリからブートROMをロードするブートプロセッサとして機能し得、そうでなければメインプロセッサ204を使用して実行するようシステムをセットアップすることを支援する。ブートROMは、PCIeエンドポイント(EP)モジュール210およびアドバンストエクステンシブルインターフェイス(AXI: Advanced eXtensible Interface)-PCIeブリッジ206の構成を含むSoC214の初期構成を可能にする命令を含み得る。当該命令はさらに、スクラッチパッドメモリ領域208としての使用のためにメモリの部分を確保し得る。APU202がひとたびFSBLイメージの転送について準備ができると、APU202は、スクラッチパッドメモリ領域208においてフラグをセットすることによりホストシステム216に信号送信し得る。
ホストシステム216は、プロセッサ回路224およびローカルメモリ220を含み得る。ある実現例では、プロセッサ回路224およびローカルメモリはX-86システムの部分であり得るが、他のタイプのプロセッサシステムも可能である。ホストシステムは、システム全体について(ホストシステム216およびSoC214の両方について)のルートコンプレックスとして動作するように構成されるPCIeルートモジュール218を含み得る。起動の後に、PCIeルートモジュールは、SoC214を含む全体のシステムにおけるすべてのPCIeエンドポイントデバイスを列挙(enumerate)し得る。列挙プロセスは、(SoC214を含む)PCIeエンドポイントデバイスおよびPCIeルートモジュールが通信することを可能にするアドレシングマッピングを定義することを含む。
APU202およびプロセッサ回路224の両方はそれぞれ、ブリッジ206および222とインターフェイス接続するのが示される。アドバンスドエクステンシブルインターフェイス(AXI)は、プロセッサによって使用され得るローカルバスインターフェイスの例であるが、さまざまな実現例は特定のバスインターフェイスの使用に限定されない。
いくつかの実現例に従うと、ホストシステム216上で実行されるソフトウェアドライバは、スクラッチパッドメモリ領域208においてフラグがセットされるときを検出するように構成され得る。この検出はたとえば、スクラッチパッドメモリ領域208をポーリングすることを含み得る。ソフトウェアドライバは、PCIeトランザクションを使用してオンチップメモリ212にFSBLイメージを転送することによりフラグの検出に応答し得る。ホストシステム216のソフトウェアドライバは、転送が完了したことをAPU202のソフトウェアドライバに通知するように構成され得る。APU202への通知は異なるソリューションを使用して実行され得る。たとえば、ホストシステム216上で実行されるソフトウェアドライバがひとたびブートローダイメージの転送を完了すると、AXI-PCIeブリッジ206は、APU202へのローカル共有周辺割込(local shared peripheral interrupt)を生成し得る。代替的には、APUは、スクラッチパッドメモリ領域208における転送完了ビットについて監視し得る。たとえば、APUは、対応するビット(またはビットのセット)の設定を検出するよう、メモリにおける適切な位置を周期的にポーリングし得る。いくつかの実現例では、ホストシステムのソフトウェアドライバは、転送が完了すると、転送が、フラグを開始およびクリア(または異なるフラグをセットする)したことを示すフラグをセットするように構成され得る。APUブートプロセッサのソフトウェアドライバは、転送が完了したときを検出し得る。その後、完了した転送の検出に応答して、FSBLイメージがメインプロセッサによって実行され得る。
図3は、本開示の実現例に従った、PCIeを介してSSBLまたはセカンダリブートを実行するように構成されるシステムのブロック図を示す。SoC302は、PCIeを使用して第2のステージブートローダ(SSBL)を転送するように構成され得る。SoC302は、メインプロセッサ310と、メモリコントローラ回路312を通じてアクセス可能であるメインメモリ回路(たとえばDDRメモリ)314とを含む。AXIモジュール306は、メインプロセッサがさまざまなモジュールおよびデバイスとインターフェイス接続することを可能にするように設計されるロジック回路を含み得る。たとえば、AXIモジュール回路は、PCIeモジュール304と通信するAXI-PCIeブリッジとして機能し得る。
本願明細書において議論されるように、PCIeモジュール304はプログラマブルロジックを使用して実現されるソフトインターフェイスであり得る。たとえば、FSBLは、SoC302の不揮発性メモリ回路からロードされ得る。FSBLは、PCIeモジュール304を含むようにプログラマブルロジックをプログラムするために使用されるビットストリームデータを含み得るか、または、当該ビットストリームデータにアクセスし得る。PCIeモジュール304がひとたび適切にプログラマブルロジックハードウェアにおいてセットアップされると、FSBLは、SSBLの転送および完了について監視するように構成され得る。たとえば、FSBLは、より詳細に本願明細書において議論されるハンドシェイクプロシージャを実現するソフトウェアドライバを実行し得る。
ある実現例に従うと、FSBLおよび対応するビットストリームはさらに、SoC302のプログラマブルロジックにおいてインターフェイスハンドシェイキングブロック308を作成するように構成され得る。
さまざまな実現例に従うと、SoC302は、ホストシステム316と通信するPCIeエンドポイントデバイスとして動作するように構成され得る。ホストシステム316は、ホストデバイスとして動作するように構成され得る。たとえば、PCIeアーキテクチャにおけるホストデバイスは、PCIeルートコンプレックスモジュール318を含む。ローカルプロセッサ回路324は、ルートコンプレックスモジュール318を通じてすべてのPCIeエンドポイントデバイスに接続するAXI-PCIeブリッジ322を通じて異なるPCIeエンドポイントデバイスと通信し得る。
多くの実現例では、図3のシステムは、システム初期化が第1のステージブートローダ(FSBL)によって行われた後に開始されるSoCベースのアプリケーションによってロードされ得るセカンダリブートイメージとの使用のために構成され得る。PCIeまたは同様のバスを介するセカンダリブートイメージのロードは、FSBLと共に対応する(セカンダリブートイメージとしての)アプリケーションをフラッシュ(flash)する必要性を除去するために有用であり得る。たとえば、セカンダリブートイメージ(たとえばuブート)は最初は、ホストシステム316のメモリ320に格納され得る。イメージは、ホストシステム316上で実行されるソフトウェアドライバアプリケーションによってダブルワード(DW: double words)へとパースされ得、PCIeを介して送信され得る。DWは、AXIモジュール306によってメモリ314における予め規定される位置に書き込まれ得る。いくつかの実現例では、AXIモジュールは、PCIeを介してDWとして受信されるデータを格納するためにメモリ314へのマッピングを使用するAXIメモリマッピングプロトコルを実現するカスタムロジックを含み得る。
セカンダリブートイメージの転送の開始時において、メインプロセッサ310上で作動するアプリケーションは、SoC302がセカンダリブートイメージを受信する準備ができていることの指示を提供し得る。たとえば、メインプロセッサ310上で実行されるアプリケーションは、インターフェイスハンドシェイキングブロック308にマッピングされるデータ位置(レジスタ)に書き込むように構成され得る。たとえば、データ位置は、PCIeを介してAXIモジュール306を通じてアクセス可能なデータレジスタに対応し得る。データレジスタのアクセシビリティを促進するために、PCIeモジュール304のPCIeスペースの部分は、インターフェイスハンドシェイキングブロック308にマッピングされ得る。ホストシステム316上で実行されるソフトウェアドライバは、このメモリマッピングされた位置から周期的に読み出すことによって、SoC302のステータスについてポーリングし得る。データレジスタが書き込まれたことを検出すること(それは、SoC302がセカンダリブートイメージを受信する準備ができていることを示す)に応答して、ホストシステム316のソフトウェアドライバは、PCIeモジュール304と318との間のPCIeリンクを使用してSoC302にセカンダリブートイメージを転送し始めるように構成され得る。セカンダリブートイメージの転送が完了すると、ホストシステム316のソフトウェアドライバは、インターフェイスハンドシェイキングブロック308にマッピングされるメモリ位置に書き込むように構成され得る。インターフェイスハンドシェイキングブロック308は、割込をアサートすることによって、または、メインプロセッサ310によってポーリングされ得るレジスタにデータを格納することによって、データ書込に応答し得る。その後、メインプロセッサ310は、セカンダリブートイメージ(たとえばuブートイメージ)の実行を開始し得る。
図4は、さまざまな実現例に従った、PCIeコンポーネントを有するコンピュータシステムのシステム図を示す。CPU402は1つ以上のプロセッサコア404を含む。ホストブリッジ406(ノースブリッジ(North Bridge)とも称される場合がある)は、プロセッサコアと他のシステムコンポーネントとの間の通信を促進し、かつ、プロセッサコアにインターフェイスを提供するフロントサイドバス(FSB: front-side bus)モジュール408を含む。ホストブリッジ406は、PCIeルートコンプレックス(デバイス/モジュール)410として機能するように構成され得る。PCIeルートコンプレックスモジュール410は、PCIeデバイスツリーを、メインメモリ416と、プロセッサコア404と、グラフィックスプロセッシングユニット(GPU: graphics processing unit)(図示せず)のような他のデバイスとに接続する。ルートコンプレックスは、CPUとは別個の物理的なチップの部分として実現され得るが、ルートコンプレックスはCPUチップに統合することも可能である。メインメモリ416は、メモリコントローラ回路414を使用してアクセスされ得る。
いくつかの実現例では、チップセットインターフェイスモジュール412は、異なる通信プロトコル(たとえばプロプラエタリチップセットプロトコル)を使用してチップセット418と通信するために使用され得る。対応するチップセットインターフェイスモジュール420は、チップセットに特有の通信プロトコルと1つ以上のPCIeスイッチ422との間のインターフェイスを提供し得る。多くのPCIeエンドポイント(EP)デバイス424,426は、PCIeスイッチを通じてアクセス可能であり得る。各PCIe EPは、専用の高速シリアル接続を通じてPCIeスイッチに接続され得る。これにより、システムはポイントツーポイントトポロジーを使用して構成される。さらに、データはパケットベースのプロトコルを使用して送信され得る。たとえば、CPUは、PCIe EPに対応する宛先アドレスを特定するパケットのセットにおいてデータをカプセル化するソフトウェアドライバを実行し得る。ルートコンプレックスと、送信パスにおける各その後のモジュールとは、パケットを受信し得、ルーティングテーブルと宛先アドレスとを使用してポイントツーポイント接続(ポート)を識別し得る。パケットは、送信パスにおいて次のモジュールによって受信され得るように、識別されたポート上で送信され得る。
本願明細書において議論されるさまざまな実現例に従うと、PCIe EPデバイス424,426のうちの1つ以上は、本願明細書において議論されるプライマリまたはセカンダリブートイメージ転送ソリューションとともに、プログラマブルICを使用して実現され得る。
図5は、ある実現例に従った、構成シリアルデータバスを使用して、FSBLイメージを転送するためのシステムとの使用のためのフロー図を示す。当該フローは、ブロック502について、パワーオンリセットイベントから開始する。たとえば、パワーオンリセットイベントは、ホストシステムおよびSoCエンドポイントデバイスに動作電力が提供された後に、発生し得る。ホストシステムは、そのブートサイクル内のあるポイントに到達するまで、リセット状態を維持し得る。
SoCエンドポイントデバイスは、ホストシステムによってリセット状態から解放されると、ブロック504について、ブートROMコードを抽出し実行し始め得る。ブートROMコードはたとえば、フラッシュメモリ回路、PROMまたは同様のストレージ回路のようなローカルの不揮発性メモリ回路に格納され得る。さまざまな実現例に従うと、ブートROMは、たとえばブート媒体を選択しFSBLイメージをロードすることによって、初期のブートプロセスを管理するように設計される命令を含み得る。本願明細書において議論されるように、ブートROMコードは、ハードPCIeインターフェイスモジュールのようなローカルシリアルバスモジュールまたはインターフェイスを構成する命令を含み得る。したがって、FSBLイメージは、ブロック506について、PCIeまたは同様のバスプロトコルを使用してロードされ得る。FSBLは、PLL係数をセットするといったような、重要な初期のシステム初期化機能を実行し得る。SSBLを含むその後の情報も、ブロック508について、PCIeを使用して転送され得る。
さまざまなバスプロトコルは、FSBLおよびSSBLイメージを転送するために多くの異なる利点を提供する。たとえば、PCIeは、相対的に高速のデータ転送速度(たとえばx4Gen2構成について20Gbpsのシリアルスループットまで)を有しており、8B/10Bエンコーディングのオーバーヘッドでも、実効スループットは高くあり得る(たとえば16Gbpsまで)。高速通信バスの使用は、大きなブートイメージの場合でも速い転送時間を提供し得る。PCIeはさらに、あるデータトランザクションにプライオリティを提供することにより転送時間に対して保証を提供するサービス品質(QoS: quality of service)オプションの使用を可能にする。したがって、QoSオプションは、ブートイメージ転送タイミングにおいて既知のレイテンシを提供するために有効化され得る。さらに、PCIeは、シリアルに送信される符号(character)をスクランブルし8B/10Bエンコーディングを使用する。データをスクランブルすることによって、たとえば外部プローブによりバストランザクションを詮索することを試み得るサードパーティが送信データを読み出す試みが妨げられ得る。したがって、PCIeの使用はセキュリティの向上を提供し得る。さらに、PCIeの使用は、転送されたブートイメージのリモートアップグレーディングのための機会を与える。たとえば、イーサネットインターフェイスは、ホストデバイスのイメージを更新するために使用され得る。システムのその後のブートの際に、新しく更新されるイメージが展開され得る。ある実現例では、更新されたイメージの真正性は、たとえばデジタル署名、暗号化および他の認証ソリューションならびにそれらの組み合わせを使用して、照合され得る。
図6は、ある実現例に従った、構成シリアルデータバスを使用して、セカンダリブートイメージを転送するためのシステムとの使用のためのフロー図を示す。フロー図は、ブロック652について、パワーオンリセットイベントの発生から開始する。SoCエンドポイントデバイスは、ホストシステムによってリセット状態から解放されると、ブロック654について、ブートROMコードを抽出および実行し始め得る。ROMコードは、ブロック656について、FSBLイメージを抽出するための命令(どこでおよびどのように)を提供し得る。たとえば、FSBLイメージが、ローカルストレージ回路(たとえばフラッシュメモリ回路またはPROMメモリ回路)から抽出され得る。
さまざまな実現例に従うと、FSBLイメージは、SoCのハードPCIeインターフェイスモジュールのようなローカルシリアルバスモジュールまたはインターフェイスを構成するための命令を含み得る。したがって、SSBLイメージは、ブロック658について、PCIeまたは同様のバスプロトコルを使用してロードされ得る。SSBLの特定の例はuブートである。Uブートは「ユニバーサルブートローダ」を表わしており、Linux(登録商標)のようなオペレーティングシステムをブートする目的で埋込デバイスにおいて使用され得るオープンソースブートローダである。
図7は、ある実現例に従った、PCIeリンクを使用してFSBLイメージを転送する文脈において有用であるハンドシェイクプロセスについてのフロー図を示す。ブートROMコードは、ブロック702について、実行を開始し得る。ブートROMコードは、ローカルストレージ回路からロードされ得、ブートROMコードの実行によって、ブロック704について、SoCが低レベルの局面を構成することが可能になり得、かつ、SoCがローカルPCIeモジュールとホストデバイスのPCIeルートコンプレックスとの間でリンクが確立されるのを監視および待機するアプリケーションの実行を開始することが可能になり得る。ホストデバイスがシステムにおけるPCIeエンドポイントデバイスを列挙すると、リンクが発生し得る。列挙プロセスは、PCIeエンドポイントデバイスおよびPCIeルートコンプレックスモジュールが通信することを可能にするアドレシングマッピングを定義することを含む。
リンクがひとたび確立されると、システムのPCIeモジュールは、ブロック706について、初期化および構成され得る。ブロック706に対応するプロセスは、ルートコンプレックスとエンドポイントデバイスのメモリおよびメインプロセッサとの間の任意のPCIeブリッジの初期化および構成を含み得る。たとえば、PCIeブリッジは、スクラッチパッドとして使用されるローカルメモリの第1の部分にマッピングされるアドレス範囲と、FSBLイメージを格納するために使用されるエンドポイントデバイスの第2の部分にマッピングされる別のアドレス範囲とを有し得る。PCIeモジュールがひとたび初期化され適切に構成されると、SoCエンドポイントデバイスのメインプロセッサは、ブロック708について、当該SoCエンドポイントデバイスがFSBLイメージを受信する準備ができていることを示すスクラッチパッドメモリの位置を更新し得る。
ホストデバイス上で実行されるアプリケーション/ドライバは、スクラッチパッドメモリの位置がFSBLイメージが転送され得ることを示すように更新されたことを検出し得る。ブロック710によって示されるように、ドライバは、FSBLイメージの転送がいつ完了したかを決定し得る。FSBLイメージの転送が完了したと決定すると、ドライバは、ブロック712について、転送が完了したことを示すようスクラッチパッドメモリ内の第2の位置を更新し得る。その後、FSBLイメージは、スクラッチパッドメモリにおける指示を検出すると、SoCエンドポイントによって実行され得る。SSBLイメージのような付加的なイメージは、図7に関して記載されるのと同じ(または同様の)プロセスを使用して転送され得る。
さまざまな他の実現例は、プログラマブルIC(PLD ICと称される場合がある)のための構成データ(構成「ビットストリーム」とも称される場合がある)のロードを2つの異なるステージに分割するように構成されるシステムに関する。2つの異なるステージへロードを分割することによって、プログラマブルICが構成の間に、時間対可用性要件(time-to-availability requirements)を満たすことが可能になり得る。さらに、第2のステージ構成データについての転送は、本願明細書においてより詳細に議論されるように、ダイレクトメモリアクセス(DMA: direct memory access)転送を使用して促進され得る。DMA転送は、中央演算処理装置(CPU)によって使用されCPUから独立しているメインメモリへのアクセスを伴う(たとえば、CPUからメインメモリおよびPLD ICへ個々の読出または書込コマンドなしで)。たとえば、CPUは、DMAエンジンへメモリアクセスコマンドを送信するデバイスドライバソフトウェアを実行し得、DMAエンジンは次いで、メインメモリへアクセスすることと、アクセスされたデータをプログラマブルICに転送することとを扱う。
ある実現例では、第1のステージは、複数のデバイスをともにリンクする通信バスを介してホストデバイスとインターフェイス接続するように設計されるバスインターフェイスモジュールを確立するために十分な構成データを含み得る。バスインターフェイスモジュールとプログラマブルICのプログラマブルロジックとの間のインターフェイスを提供するために内部構成アクセスインターフェイスも含まれ得る。システムはその後、バスインターフェイスモジュールを通じてDMA転送を使用して残りの構成データをロードするように構成される。これにより、構成データの第2のセットは、低いCPU利用で、メインメモリ回路とプログラマブルICとの間で直接的に移動され得る。次いで、PLDのプログラマブルロジックはさらに、構成データの第2のセットを使用して構成され得る。
さまざまな実現例に従うと、バスインターフェイスモジュールは、ポイントツーポイントトポロジーおよびパケットベースのプロトコルに基づく高速シリアルバスプロトコルを使用して通信するように構成され得る。ポイントツーポイントトポロジーは、デバイス同士間で多くの専用接続を使用し得、共用バストポロジーは、3つ以上のデバイスと共有される接続を使用し得る。パケットベースの通信プロトコルは、データが、各パケットにおいて特定される宛先へ別個の(小さな)ブロックで送信されることを可能にする。必要であり得るように、特定の通信ストリームについてのパケットは、宛先での受信の際に再集合され得る。
パケットを使用するポイントツーポイントトポロジーの特定の例は、ペリフェラルコンポーネントインターコネクトエクスプレス(PCIe: Peripheral Component Interconnect Express)である。議論の容易さのために、さまざまな実現例がPCIeの文脈で議論されるが、他のプロトコル、トポロジーおよび構成も可能であることが理解される。
ある実現例では、第1のステージについての構成データのサイズは、初期の所望の構成タイミングに合致するよう十分小さいままである。たとえば、PCIeの仕様は、PCIeに準拠するエンドポイントデバイスが100msのブート時間を満たすという要件を含む。さまざまな場合において、構成データの第1のセットは、プログラマブルIC(PLD/FPGA)のデフォルト/構成インターフェイスを介してアクセス可能なメモリ回路に格納され得る。このインターフェイスは、電源投入時に、最初に構成されることなく利用可能なプログラマブルICにおける回路を使用して実現され得る。たとえば、構成データの第1のセットは、フラッシュメモリ回路のような永続メモリ回路に格納され得る。したがって、第1のステージについての構成データのサイズは、構成データがハードインターフェイスを使用してロードされることを可能にするとともにプログラマブルICが所望の時間(たとえば100ms)内でバス上で利用可能に構成されることを可能にするよう十分小さいままであり得る。
ある実現例に従うと、プログラマブルICは、バスインターフェイスモジュールと、プログラマブルICのプログラマブルロジックとの間でインターフェイス接続するように設計される内部構成アクセスインターフェイスを含み得る。この内部構成アクセスインターフェイスは、プログラマブルICの構成ロジックへのアクセスを提供するよう、バスインターフェイスに統合され得る。一方、いくつかの場合において、内部構成アクセスインターフェイスは、プログラマブルICへの(デバイスドライバによって制御される)構成メモリ書込を使用して、第2のステージ構成データを転送するように構成され得る。構成データは、各々がCPUに由来する多くの異なる書込コマンドに書き込まれている。書込コマンドは、貴重なホストプロセッサ時間を使用し得、それでも、全データ転送を完了するのに有意な量の時間をかけ得る。さまざまな実現例の特定の局面は、同様のメカニズムの構成メモリ書込を使用するのではなく、DMA転送を第2のステージ転送に使用するように構成されるシステムに関する。これは、プロセッサ負荷を低減または除去するため、かつ、第2のステージ転送の速度を増加させるために特に有用であり得る。
図8は、ある実現例に従った、DMAを使用して構成データを転送するためのシステムのブロック図を示す。システム806は、ストレージ回路820から構成データの第1のステージをロードするように構成される、プログラマブルIC808を有し得る(PCIe)エンドポイントカード822を含み得る。ストレージ回路820は、PROM(プログラマブルリードオンリメモリ)、フラッシュメモリまたは別のタイプのメモリ回路として実現され得る。初期の(ストレージ)構成インターフェイス818は、プログラマブルICのプログラマブルロジックの第1の部分を構成するために、ストレージ回路820から構成データを抽出するように構成され得る。
本願明細書において議論されるように、初期構成プロセスについてのデータ転送速度は、所望の時間内(たとえばPCIeエンドポイントデバイスの場合100ms)でプログラマブルICについての構成データのすべてを転送するのに不十分であり得る。したがって、構成データは2つ以上のステージへ分割され得、これにより、異なる時間で対応するロジックの構成が可能になる。たとえば、構成データの第1のステージは、プライマリプログラマブルロジック814であると識別されるプログラマブルロジックの部分を構成するためのデータを含み得る。プライマリプログラマブルロジック814は、バスインターフェイスモジュール810と内部構成アクセスインターフェイス812とを含み得るが必ずしもこれらに限定されない。ある実現例では、バスインターフェイスモジュール810は、ルートコンプレックス802、プロセッサ回路824およびメモリ回路804を含むホストデバイスとのポイントツーポイントリンクを使用するように構成され得る。特定の実現例において、ポイントツーポイントリンクは、ルートコンプレックス802を介してホストデバイスと通信するためにPCIeプロトコルを使用する。
メモリ回路804は、セカンダリプログラマブルロジック816を構成するための(セカンダリ)構成データを格納し得る。このセカンダリ構成データは、DMA転送を使用して、バスインターフェイスモジュール810を使用してアクセスされ得る。PCIeプロトコルの場合、DMA転送は、直接的にメモリ回路804にアクセスするDMA対応バスマスタとしてルートコンプレックス802を使用することによって促進され得る。特定の実現例において、本願明細書においてより詳細に説明されるように、ホストデバイスは、PCIeデバイスツリーのルートコンプレックスデバイスとして機能し得る。DMA転送は、メモリ回路804へのDMA転送を実現するバスマスタとしてバスインターフェイスモジュール810が機能することを可能にするDMAエンジンを有するバスインターフェイスモジュール810を設計することによって、促進され得る。デバイスドライバソフトウェアは、DMA転送に使用されるバッファのための物理アドレスを構成および識別することにより、DMA転送を促進し得る。PCIeの文脈では、これは、バスインターフェイスモジュール810のBARマッピングされたレジスタを識別および使用することを含み得る。
図9は、本願明細書において議論される実現例に従った、DMA能力を含むルートコンプレックスとして使用されるシステムオンチップ(SoC)を有するシステムについてのブロック図を示す。(PCIe)エンドポイントカード904はプログラマブルIC(FPGA)932を含み得る。プログラマブルIC932はステージ1(プログラマブル)ロジックインターフェイス928を含み得る。ステージ1ロジックインターフェイス928は、ステージ1ロジック916を構成する目的で、ステージ1構成データにアクセスしロードするように設計され得る。プログラマブルIC932の初期化(たとえばパワーオン)の際、ステージ1ロジックインターフェイスはステージ1構成データ930を抽出し始める。ステージ1構成データは、(たとえば内部の不揮発性メモリとしての)プログラマブルIC932に格納され得るか、または、(たとえば外部の不揮発性メモリ回路としての)別個のIC930に格納され得る。ステージ1構成データのサイズは、相対的に小さくされたままであり得、これにより、ロードおよびその後の構成が所定の時間(たとえばPCIeの場合100ms)内で実行されることが可能になる。
対応するプログラマブルロジックの構成の後、ステージ1ロジック916は、たとえばPCIeを使用するように構成され得るバスインターフェイスモジュール918を含み得る。ステージ1ロジック916はさらに、バスインターフェイスモジュール918とプログラマブルロジックとの間でのステージ2内部構成アクセスインターフェイス922を含むように構成され得る。当該2つのインターフェイスを介して受信されるデータは、ステージ2ロジック926をプログラムするために使用され得る。いくつかの場合では、ブリッジ920は、ブリッジのいずれかの側上で使用される通信プロトコル同士間のインターフェイスを提供するよう、バスインターフェイスモジュール918との間で実現され得る。PCIeインターフェイス910はバスインターフェイスモジュール918と通信するように構成され得る。
いくつかの実現例では、SoC902はシステムのPCIeルートコンプレックスを有するホストデバイスとして機能するように構成され得る。CPU906は、通常動作の間に、メインメモリ912にアクセスするように構成され得る。メインメモリ912はさらに、メインメモリ912へのDMAトランザクションを使用するように構成されるDMAエンジンを含むブリッジ908によってアクセス可能であるように構成され得る。これにより、メインメモリおよび他のデバイスへの読出および書込要求によりCPU906に負担をかけることなく、SoC902がメインメモリからステージ2構成データを直接的に抽出することが可能になり得る。
いくつかの実現例に従うと、ステージ2構成データは、(たとえば、イーサネットを使用して)外部インターフェイス914から提供され得る。特定の実現例において、ステージ1ロジック916は、ステージ2ロジック926の再構成を可能にするように構成され得る。したがって、プログラマブルIC932は、ステージ2ロジック926へのリモートアップグレードを可能にするように構成され得る。たとえば、ステージ1ロジック916は、ステージ2構成ロジックがDMA転送を使用して受信される構成モードに(再び)入ることにより特定の通信に応答するように構成され得る。次いで、ステージ2ロジック916は、新しく受信された構成データ308に従って構成され得る。
図10は、本願明細書において議論される実現例に従った、DMA能力を有するように構成されるステージ1ロジックを有するシステムについてのブロック図を示す。図9における議論と同様に、(PCIe)エンドポイントカード1004はプログラマブルIC1026を含み得る。プログラマブルIC1026はステージ1(プログラマブル)ロジックインターフェイス1022を含み得る。ステージ1プログラマブルロジックインターフェイス1022は、ステージ1(プログラマブル)ロジック1018を構成する目的で、ステージ1構成データ1024にアクセスしロードするように設計され得る。プログラマブルIC1026の初期化(たとえばパワーオン)の際、ステージ1ロジックインターフェイス1022はステージ1構成データ1024を抽出し始める。ステージ1構成データ1024は、(たとえば内部の不揮発性メモリとしての)プログラマブルIC1026上に格納され得るか、または、(たとえば外部の不揮発性メモリICとしての)別個のIC930上に格納され得る。ステージ1構成データ1024のサイズは、相対的に小さくされたままであり得、これにより、ロードおよびその後の構成が所定の時間(たとえばPCIeの場合100ms)内で実行されることが可能になる。
対応するプログラマブルロジックの構成の後、ステージ1ロジック1018は、たとえばPCIeを使用するように構成され得るバスインターフェイスモジュール1012を含み得る。ステージ1ロジック1018はさらに、バスインターフェイスモジュール1012と、その後ステージ2ロジック1020をプログラムするために使用され得る残りのプログラマブルロジックとの間での内部構成アクセスインターフェイス1016を含むように構成され得る。ブリッジ1014は、ブリッジのいずれかの側上で使用される通信プロトコル同士の間のインターフェイスを提供するとともに、メインメモリからDMA転送を開始する目的のためにバスマスタとして機能し得るDMAエンジンとして機能するように設計され得る。ブリッジ1028は、SoC1002上で同様のインターフェイスを提供するように設計され得る。
ある実現例に従うと、DMA構成レジスタは、PCIeエンドポイントの任意のBAR(ベースアドレスレジスタ(Base Address Register))にマッピングされ得、ホストCPUはBARを通じてそれらのレジスタにアクセスし得る。このように、SoC1002は、DMAエンジンの機能を提供するように構成される必要はない。ステージ1ロジック1018は、CPU1006から独立して、直接的にバス(PCIe)インターフェイスモジュール1010を通じてメインメモリ回路1008にアクセスするように構成され得る。
さまざまな実現例に従うと、DMAエンジンはソフトウェアデバイスドライバによって構成および管理され得る。たとえば、デバイスドライバは、DMAエンジンに送信されるとともに、使用されているオペレーティングシステムに対する特定のメモリ領域についてのメモリマッピングに関するコマンドを生成し得る。このコマンドはたとえば、ソースアドレス、宛先アドレスおよび長さを有する読出コマンドであり得る。これは、BARを通じて、必要な情報によりDMAエンジンを構成することによって行なわれ得る。DMAエンジンは、第2のステージ構成データに関連付けられるタスクについてDMA転送を実行するよう、ソフトウェアドライバによってセットアップされ得る。
第2の構成データのサイズと、DMAエンジンが1つのトランザクションで転送し得るバイト数とに依存して、デバイスドライバは、複数のチャンクで構成データを転送するようにDMAをセットアップする。構成データはホストPCメインメモリにおいて点在し得、したがって、DMAは、異なる位置から構成データをフェッチし得るように、ソフトウェアドライバによって適切にセットアップされ得る。
図11は、さまざまな実現例に従った、PCIeコンポーネントを有するコンピュータシステムのシステム図を示す。CPU1102は1つ以上のプロセッサコア1104を含む。ホストブリッジ1106(ノースブリッジ(North Bridge)とも称される場合がある)は、プロセッサコアと他のシステムコンポーネントとの間の通信を促進し、かつ、プロセッサコアにインターフェイスを提供するフロントサイドバス(FSB:front-side bus)モジュール1108を含む。ホストブリッジ1106は、PCIeルートコンプレックス(デバイス/モジュール)1110として機能するように構成され得る。PCIeルートコンプレックス1110は、PCIeデバイスツリーを、メインメモリ1116と、プロセッサコア1104と、グラフィックスプロセッシングユニット(GPU:graphics processing unit)(図示せず)のような他のデバイスとに接続する。ルートコンプレックスは、CPUとは別個の物理的なチップの部分として実現され得るが、ルートコンプレックスはCPUチップに統合することも可能である。メインメモリ1116は、メモリコントローラ回路1114を使用してアクセスされ得る。
いくつかの実現例では、チップセットインターフェイスモジュール1112は、異なる通信プロトコル(たとえばプロプラエタリチップセットプロトコル)を使用してチップセット1118と通信するために使用され得る。対応するチップセットインターフェイスモジュール1120は、チップセットに特有の通信プロトコルと1つ以上のPCIeスイッチ1122との間のインターフェイスを提供し得る。多くのPCIeエンドポイント(EP)デバイス1124,1126は、PCIeスイッチを通じてアクセス可能であり得る。各PCIe EPは、専用の高速シリアル接続を通じてPCIeスイッチに接続され得る。これにより、システムはポイントツーポイントトポロジーを使用して構成される。さらに、データはパケットベースのプロトコルを使用して送信され得る。たとえば、CPUは、PCIe EPに対応する宛先アドレスを特定するパケットのセットにおいてデータをカプセル化するソフトウェアドライバを実行し得る。ルートコンプレックスと、送信パスにおける各その後のモジュールとは、パケットを受信し得、ルーティングテーブルと宛先アドレスとを使用してポイントツーポイント接続(ポート)を識別し得る。パケットは、送信パスにおいて次のモジュールによって受信され得るように、識別されたポート上で送信され得る。
本願明細書において議論されるさまざまな実現例に従うと、PCIe EPデバイス1124,1126のうちの1つ以上は、メインメモリ1116から第2の構成データにアクセスするためにDMA転送を使用する第2の構成ステージを有するプログラマブルICを使用して実現され得る。これにより、データがメモリからルートコンプレックスを通る方向にアクセスされ得るので、CPUは各転送を開始する必要はない。
図12は、ある実現例に従った、DMAを使用して構成データを転送するためのシステムとの使用についてのフロー図を示す。当該フローは、ブロック1202について、スタートイベントの発生から開始する。スタートイベントは、プログラマブルICおよびホストマシンの電源投入であり得る(がこれに限定されない)。たとえば、PCIeを使用するシステムは、同じ電源からホストマシンおよびPCIeエンドポイントに、両者がほとんど同時に起動するように、電力を供給し得る。ホストマシンはリセットからPCIeエンドポイントを解放し得、次いで、PCIeエンドポイントが設定された量の時間(たとえば100ms後)内に利用可能になると予想し得る。
電源投入/スタートイベントに応答して、初期の(第1ステージ)構成データは、ブロック1204について、第1のステージプログラマブルロジックインターフェイスを介してプログラマブルICに通信され得る。本願明細書において議論されるように、これは、フラッシュメモリ回路、PROMまたは同様のストレージ回路のような不揮発性メモリから構成データを読み出すことを含み得る。ある実現例では、ブロック1206においてロードされる第1のステージビットストリームは、相対的に小さくされたままであり得、これにより、リセット後100ms内でPCIeインターフェイスモジュールの構成がPCIeエンドポイントにリリースされることが可能になる。このタイミングを満たすことで、PCIeインターフェイスモジュールがその後のリブートまたはリセットなしで列挙されることが可能になる。
第1のステージ構成データは、ブロック1206について、プログラマブルIC内のプログラマブルロジックの第1の部分をプログラムするために使用される。この第1の部分はバスインターフェイスモジュールを含み得る。特定の実現例において、バスインターフェイスモジュールは、コンピュータシステムにインターフェイス接続するとともにPCIeエンドポイントデバイスとしてコンピュータシステムに現われるように設計されるPCIeインターフェイスモジュールであり得る。
ブロック1207について、ホストマシン(またはSoC基板)は、そのブートプロセスを実行および完了し得る。ブートプロセスはたとえば、エンドポイントデバイスの構成と、オペレーティングシステムのロードとを含み得る。PCIeでは、エンドポイントデバイスの構成は列挙とも称される。列挙の間、各PCIeエンドポイントデバイスが検出され、アドレススペースが割り当てられる。したがって、列挙が開始する際に特定のPCIeエンドポイントデバイスがまだ利用可能でなければ、アドレススペースが割り当てられなくてもよい。ホストマシンは、列挙が再発生することを可能にするためにリセットされ得るが、これは、追加のブート時間によって著しい遅延に帰着し得る。本願明細書において議論されるように、PCIe仕様は、リセット状態が除去された時と、エンドポイントが列挙に利用可能であるべき時との間を100msにすることを可能にする。小さな第1のステージ構成データの使用は、そのような要件を満たすのに特に有用であり得る。
ホストマシンがひとたびブートプロセスを完了すると、ブロック1208について、コンピュータシステムは次に、コンピュータシステムのメインメモリから第2のステージ構成データにアクセスするDMA転送のためにコンピュータシステムをセットアップするように構成されるソフトウェアドライバを実行し得る。本願明細書において議論されるように、DMAエンジンはプログラマブルICのPCIeインターフェイスモジュール内またはPCIeルートコンプレックス内に配置され得る。いずれかの状況において、ホストコンピュータシステム上で実行されるソフトウェアドライバモジュールは、DMAエンジンを構成し、DMA転送を開始し得る。これは、バスマスタとしてPCIe DMAエンジンをセットすることと、DMA転送についてバッファアドレスを識別することとを含み得る。DMAエンジンの構成は、第2のステージ構成データについてDMA転送のバッファアドレスおよびサイズに関する情報を含むバッファ記述子チェーン(Buffer Descriptor chain)をセットアップすることを含み得る。
ひとたび構成されると、ブロック1210によって示されるように、ステージ2構成データは、DMA転送を使用してコンピュータシステムのメインメモリからプログラマブルICに転送され得る。その後、ブロック1212について、プログラマブルロジックの第2の部分が、ステージ2構成データを使用して構成され得る。
いくつかの実施形態に従うと、プログラマブルロジックの第2の部分は、プログラマブルICが動作している間に(たとえば、第2の部分がプログラムされた後で、かつ、プログラマブルロジックの第1の部分のシャットダウンおよび再構成を必要することなく)更新され得る。ブロック1214について、コンピュータシステムは、更新要求が受信されたかどうか決定し得る。更新要求は、たとえばイーサネット接続を介して、外部位置から由来し得る。これにより、たとえば、リモート更新がインターネットを介してプログラマブルICにプッシュされることが可能になり得る。更新要求がある場合、新しい/更新される第2のステージ構成データについて、ブロック1208~1212によって示されるDMA転送フローが繰り返され得る。
図13は、開示された回路およびプロセスが実現され得るプログラマブル集積回路(IC)600を示す。プログラマブルICはさらに、他のプログラマブルリソースと共にフィールドプログラマブルゲートアレイロジック(FPGA)を含むシステムオンチップ(SOC)と称され得る。FPGAロジックは、アレイにおいていくつかの異なるタイプのプログラマブルロジックブロックを含み得る。たとえば、図13はプログラマブルIC600を示しており、当該プログラマブルIC600は、マルチギガビットトランシーバ(MGT)601、コンフィギュラブルロジックブロック(CLB)602、ランダムアクセスメモリブロック(BRAM)603、入出力ブロック(IOB)604、構成およびクロッキングロジック(CONFIG/CLOCKS)605、デジタル信号処理ブロック(DSP)606、たとえばクロックポートのような特殊化入出力ブロック(I/O)607、ならびに、デジタルクロックマネージャ、アナログ―デジタル変換器およびシステム監視ロジックなどのような他のプログラマブルロジック608を含む多くの異なるプログラマブルタイルを含み得る。FPGAロジックを有するいくつかのプログラマブルICはさらに、専用プロセッサブロック(PROC)610ならびに内部および外部の再構成ポート(図示せず)とを含む。
いくつかのFPGAロジックにおいて、各プログラマブルタイルは、各隣接したタイルにおける対応するインターコネクト要素への標準化された接続および当該対応するインターコネクト要素からの標準化された接続を有するプログラマブルインターコネクト要素(INT)611を含む。したがって、一緒にされたプログラマブルインターコネクト要素は、示されるFPGAロジックのためのプログラマブルインターコネクト構造を実現する。プログラマブルインターコネクト要素INT611はさらに、図13の一番上に含まれる例によって示されるように、同じタイル内のプログラマブルロジック要素への接続および当該プログラマブルロジック要素からの接続を含む。
たとえば、CLB602は、ユーザロジックを実現するようにプログラムされ得るコンフィギュラブルロジック要素CLE612と、単一のプログラマブルインターコネクト要素INT611とを含み得る。BRAM603は、1つ以上のプログラマブルインターコネクト要素に加えてBRAMロジック要素(BRL)613を含み得る。典型的に、タイルに含まれるインターコネクト要素の数は、タイルの高さに依存する。示される実現例において、BRAMタイルは5つのCLBと同じ高さを有しているが、他の数(たとえば4つ)も使用され得る。DSPタイル606は、適切な数のプログラマブルインターコネクト要素に加えて、DSPロジック要素(DSPL)614を含み得る。IOB604はたとえば、プログラマブルインターコネクト要素INT611の1つのインスタンスに加えて、入出力ロジック要素(IOL)615の2つのインスタンスを含み得る。当業者に明らかであろうように、たとえばI/Oロジック要素615に接続される実際のI/Oボンドパッドは、さまざまな示されるロジックブロックの上に積層される金属を使用して製造され、典型的には入出力ロジック要素615のエリアに制限されない。
示される実現例において、(図13においてシェードがつけられて示されている)ダイの中心の近くのカラム状のエリアは、構成、クロックおよび他の制御ロジックのために使用される。カラムから延在する水平エリア609は、プログラマブルICの幅にわたって、クロック信号および構成信号を分配するために使用される。なお、「カラム状の」エリアおよび「水平」エリアへの参照は、縦長の向きで図面を見ることに対するものである。
図13に示されるアーキテクチャを利用するいくつかのプログラマブルICは、プログラマブルICの大部分を構成する規則的なカラム状構造を中断させる付加的なロジックブロックを含む。付加的な論理ブロックは、プログラマブルブロックおよび/または専用ロジックであり得る。たとえば、図13に示されるプロセッサブロックPROC610は、CLBおよびBRAMのいくつかのカラムにわたる。
なお、図13は、例示的なプログラマブルICアーキテクチャのみを示すように意図される。カラムにおけるロジックブロックの数、カラムの相対的な幅、カラムの数および順序、カラムに含まれるロジックブロックのタイプ、ロジックブロックの相対的なサイズ、および、図13の一番上に含まれるインターコネクト/ロジック実現例は、単に例である。たとえば、実際のプログラマブルICにおいて、CLBが現われる場合はいつでも、CLBの隣接した1つより多いカラムが典型的に含まれており、これにより、ユーザロジックの効率的な実現例が促進される。
本願明細書において示されるさまざまなフロー図について、ブロックの特定の順序および関連付けられる機能は例として提供されている。順序は必ずしも限定ではなく、さまざまな実現例に従って変動され得る。
1つ以上のプロセッサとプログラムコードを有するように構成されるメモリ構成とを含むさまざまな代替的なコンピューティング構成が、本願明細書において開示される機能を実行し得るプロセスおよびデータ構造をホスティングするのに好適であるということを当業者は認識するであろう。さらに、プロセスは、磁気ディスク、光学ディスクもしくはテープ、電子ストレージデバイス、または、ネットワークを介するアプリケーションサービスといったさまざまなコンピュータ読取可能記憶媒体または送達チャネルを介して提供され得る。
いくつかの場合において、局面および特徴は個々の図に記載されている場合があるが、1つの図からの特徴と別の図の特徴との組み合わせが明示的に示されていないかまたは明示的に組み合わせとして記載されていなくても、1つの図からの特徴が別の図の特徴と組み合わせられ得るということが認識されるであろう。
方法およびシステムは、RAM回路を使用するさまざまなシステムに適用可能であると考えられる。他の局面および特徴は、明細書の考慮から当業者に明白になるであろう。方法およびシステムの部分は、特定用途向け集積回路(ASIC: application specific integrated circuit)として、または、プログラマブルロジックデバイス上のロジックとして、ソフトウェアを実行するように構成される1つ以上のプロセッサとして実現され得る。さらに、本願明細書において識別されるさまざまな回路は、共通のコンピュータ処理ユニットまたはデジタル処理ユニットを使用するといったように、ハードウェア回路を共有し得る。明細書および図面は単に例であると考えられることが意図されており、本発明の実際の範囲は、添付の請求の範囲によって示される。

Claims (14)

  1. 少なくとも1つのプロセッサ回路を含むシステムオンチップ(SoC)をブートするための方法であって、
    電源投入によって利用可能なSoC中の回路を用いて実現されるハード入出力インターフェイスによって通信バスを構成することと、
    前記通信バスを通じてブートリードオンリメモリ(ROM)イメージをロードすることと、
    前記通信バスを通じて第1のブートイメージを受信するように前記SoCに命令するために前記ブートROMイメージを実行することと、
    前記SoCのストレージインターフェイス回路を使用して不揮発性メモリチップから前記第1のブートイメージを受信することと、
    前記SoCのプロセッサ回路上で前記第1のブートイメージを実行することによって、複数のデバイスを前記SoCにリンクする通信バスを介してホストデバイスと通信するように設計されるソフトインターフェイスを構成することとを含み、
    前記ソフトインターフェイスを構成することは、前記ソフトインターフェイスを実現するよう、ビットストリームデータを使用して前記SoCのプログラマブルロジックをプログラムすることを含んでおり、前記方法はさらに、
    前記ソフトインターフェイスを使用して前記ホストデバイスのメモリから前記SoCのメモリに第2のブートイメージを通信することと、
    前記第2のブートイメージを実行することによって前記SoCをブートすることとを含む、方法。
  2. 前記ソフトインターフェイスはさらに、パケットベースのプロトコルを使用して、前記ホストデバイスと前記SoCとの間のポイントツーポイントリンクを介して、前記ホストデバイスと通信するように設計されており、前記パケットベースのプロトコルは、データをカプセル化するとともに宛先アドレスを特定するパケットを定義する、請求項1に記載の方法。
  3. 前記第2のブートイメージを前記SoCの前記プロセッサ回路に提供するよう、前記ホストデバイスとのハンドシェイクプロトコルを実現することをさらに含む、請求項1に記載の方法。
  4. 前記通信バスは、ペリフェラルコンポーネントインターコネクトエクスプレス(PCIe)通信バスであり、前記SoCはプログラマブルロジックタイルを含む、請求項1に記載の方法。
  5. 前記ソフトインターフェイスを構成することは、前記ホストデバイスのルートコンプレックスモジュールとの通信のために前記ソフトインターフェイスを列挙することを含む、請求項4に記載の方法。
  6. 前記ソフトインターフェイスの列挙の完了に応答して、スクラッチパッドメモリスペースにおいて値をセットすることをさらに含む、請求項5に記載の方法。
  7. 前記第1のブートイメージはブートリードオンリメモリ(ROM)イメージであり、前記第2のブートイメージは、第1のステージブートローダ(FSBL)イメージであり、または、前記第1のブートイメージは第1のステージブートローダ(FSBL)イメージであり、前記第2のブートイメージは第2のステージブートローダ(SSBL)イメージである、請求項1に記載の方法。
  8. システムオンチップ(SoC)を含み、
    前記SoCは、
    プログラマブルロジックと、
    不揮発性メモリチップから第1のブートイメージを受信するように構成されるストレージインターフェイス回路と、
    電源投入によって利用可能な前記SoC中の回路を用いて実現されるハード入出力インターフェイスと、
    プロセッサ回路とを含み、
    前記プロセッサ回路は、
    前記ハード入出力インターフェイスとによって通信バスを構成することと、
    前記通信バスを通じて第1のブートイメージを受信するように前記SoCに命令するためブートリードオンリメモリ(ROMイメージを実行することと、
    前記第1のブートイメージを実行して、
    複数のデバイスを前記SoCにリンクする通信バスを介してホストデバイスと通信するように構成されるソフトインターフェイスを実現するよう、ビットストリームデータを使用して前記プログラマブルロジックをプログラムすること、および、
    前記ホストデバイスのメモリから前記SoCに第2のブートイメージを転送するよう前記ソフトインターフェイスを構成することと、
    前記第2のブートイメージを実行することによって前記SoCをブートすることとを行うように構成される、システム。
  9. 前記ソフトインターフェイスはさらに、パケットベースのプロトコルを使用して、前記ホストデバイスと前記SoCとの間のポイントツーポイントリンクを介して、前記ホストデバイスと通信するように設計されており、前記パケットベースのプロトコルは、データをカプセル化するとともに宛先アドレスを特定するパケットを定義する、請求項8に記載のシステム。
  10. 前記プロセッサ回路はさらに、前記第2のブートイメージを提供する前記ホストデバイスとのハンドシェイクプロトコルを実現するように構成される、請求項8に記載のシステム。
  11. 前記ストレージインターフェイス回路はさらに、ブートリードオンリメモリ(ROM)イメージをロードするように構成され、
    前記ブートROMイメージは、前記不揮発性メモリチップからの前記第1のブートイメージの受信を行うよう前記SoCのための命令を含む、請求項10に記載のシステム。
  12. 前記通信バスは、ペリフェラルコンポーネントインターコネクトエクスプレス(PCIe)通信バスであり、前記SoCはプログラマブルロジックタイルを含み、前記プロセッサ回路は、前記PCIe通信バスについての列挙プロセスの部分として前記ソフトインターフェイスを構成するように構成される、請求項8に記載のシステム。
  13. 前記プロセッサ回路は、前記列挙プロセスの完了に応答して、スクラッチパッドメモリスペースにおいて値をセットするように構成される、請求項12に記載のシステム。
  14. 前記第1のブートイメージは第1のステージブートローダ(FSBL)イメージであり、前記第2のブートイメージは第2のステージブートローダ(SSBL)イメージである、請求項8に記載のシステム。
JP2018517393A 2015-10-06 2016-10-05 マルチステージブートイメージロードおよびプログラマブルロジックデバイスの構成 Active JP6995745B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US14/876,467 2015-10-06
US14/876,467 US9934175B2 (en) 2015-10-06 2015-10-06 Direct memory access for programmable logic device configuration
US14/931,037 2015-11-03
US14/931,037 US9864605B2 (en) 2015-11-03 2015-11-03 Multistage boot image loading by configuration of a bus interface
PCT/US2016/055534 WO2017062479A1 (en) 2015-10-06 2016-10-05 Multistage boot image loading and configuration of programmable logic devices

Publications (3)

Publication Number Publication Date
JP2018531461A JP2018531461A (ja) 2018-10-25
JP2018531461A6 JP2018531461A6 (ja) 2018-12-13
JP6995745B2 true JP6995745B2 (ja) 2022-01-17

Family

ID=57206377

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018517393A Active JP6995745B2 (ja) 2015-10-06 2016-10-05 マルチステージブートイメージロードおよびプログラマブルロジックデバイスの構成

Country Status (5)

Country Link
EP (1) EP3360039B1 (ja)
JP (1) JP6995745B2 (ja)
KR (1) KR102654610B1 (ja)
CN (1) CN108139916B (ja)
WO (1) WO2017062479A1 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11237841B2 (en) * 2019-08-21 2022-02-01 Micron Technology, Inc. Configurable media structure
US11681536B2 (en) * 2019-12-06 2023-06-20 Lattice Semiconductor Corporation Fast boot systems and methods for programmable logic devices
CN112631663A (zh) * 2020-12-24 2021-04-09 中国航空工业集团公司西安航空计算技术研究所 一种基于ARMv7 SoC的一体化映像引导启动方法
US20210294772A1 (en) * 2021-06-07 2021-09-23 Intel Corporation Systems, Apparatus And Methods For Rapid Peripheral Component Interconnect Express (PCIE) System Boot
DE102021002937A1 (de) 2021-06-08 2022-12-08 Karlsruher lnstitut für Technologie, Körperschaft des öffentlichen Rechts Verfahren zum Konfigurieren einer integrierten Schaltung, Verfahren zur Bereitstellung von Lade-Software für eine integrierte Schaltung, und integrierte Schaltung
CN114489821B (zh) * 2022-01-25 2024-06-07 中电科申泰信息科技有限公司 一种基于U-Boot的多核处理器一级启动方法
CN115934631B (zh) * 2022-12-30 2023-10-27 武汉麓谷科技有限公司 一种基于MPSoC的智能存储平台

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007241526A (ja) 2006-03-07 2007-09-20 Sony Computer Entertainment Inc 情報処理装置、情報処理システムおよび初期化方法
JP2009520391A (ja) 2005-12-19 2009-05-21 エム2000 エスア. マイクロコントローラを有する構成可能回路
JP2011248662A (ja) 2010-05-27 2011-12-08 Nec Corp マルチホストシステム
JP2012073304A (ja) 2010-09-28 2012-04-12 Tomoegawa Paper Co Ltd 電子写真用トナー
US20130325998A1 (en) 2012-05-18 2013-12-05 Dell Products, Lp System and Method for Providing Input/Output Functionality by an I/O Complex Switch
WO2014159909A1 (en) 2013-03-13 2014-10-02 Xilinx, Inc. An analog block and test blocks for testing thereof
WO2015010597A1 (en) 2013-07-22 2015-01-29 Huawei Technologies Co., Ltd. Resource management for peripheral component interconnect-express domains

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7809836B2 (en) * 2004-04-07 2010-10-05 Intel Corporation System and method for automating bios firmware image recovery using a non-host processor and platform policy to select a donor system
CN100504801C (zh) * 2004-06-25 2009-06-24 联想(北京)有限公司 检测和诊断计算机硬件故障的方法和装置
US7328335B1 (en) * 2004-10-01 2008-02-05 Xilinx, Inc. Bootable programmable logic device for internal decoding of encoded configuration data
US7673131B2 (en) * 2006-05-05 2010-03-02 Microsoft Corporation Booting an operating system in discrete stages
JP2009193301A (ja) * 2008-02-14 2009-08-27 Nec Corp 情報処理装置、情報処理装置におけるデバイス初期化方法、およびデバイス初期化プログラム
US8370534B2 (en) * 2009-12-03 2013-02-05 Dell Products, Lp Host-based messaging framework for PCIe device management
US8397053B2 (en) * 2010-02-03 2013-03-12 Inventec Corporation Multi-motherboard server system
US8452952B2 (en) * 2010-10-20 2013-05-28 Wyse Technology Inc. Methods and apparatus for building system images and split booting
US20130086371A1 (en) * 2011-09-30 2013-04-04 Pradeep Bisht Method for device-less option-rom bios load and execution
US8775784B2 (en) * 2011-11-11 2014-07-08 International Business Machines Corporation Secure boot up of a computer based on a hardware based root of trust
CN103777972B (zh) * 2012-10-24 2018-08-31 上海联影医疗科技有限公司 基于现场可编程门阵列的系统、配置方法以及升级方法
CN103412619A (zh) * 2013-07-30 2013-11-27 中国科学院上海技术物理研究所 一种异构多核的红外图像处理系统及方法
US9172409B2 (en) * 2013-11-22 2015-10-27 Xilinx, Inc. Multi-path digital pre-distortion
CN105917308B (zh) * 2014-01-22 2019-02-12 惠普发展公司,有限责任合伙企业 分区为包括元数据区域的多个区域的字节可寻址非易失性读写主存储器

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009520391A (ja) 2005-12-19 2009-05-21 エム2000 エスア. マイクロコントローラを有する構成可能回路
JP2007241526A (ja) 2006-03-07 2007-09-20 Sony Computer Entertainment Inc 情報処理装置、情報処理システムおよび初期化方法
JP2011248662A (ja) 2010-05-27 2011-12-08 Nec Corp マルチホストシステム
JP2012073304A (ja) 2010-09-28 2012-04-12 Tomoegawa Paper Co Ltd 電子写真用トナー
US20130325998A1 (en) 2012-05-18 2013-12-05 Dell Products, Lp System and Method for Providing Input/Output Functionality by an I/O Complex Switch
WO2014159909A1 (en) 2013-03-13 2014-10-02 Xilinx, Inc. An analog block and test blocks for testing thereof
WO2015010597A1 (en) 2013-07-22 2015-01-29 Huawei Technologies Co., Ltd. Resource management for peripheral component interconnect-express domains

Also Published As

Publication number Publication date
CN108139916A (zh) 2018-06-08
EP3360039A1 (en) 2018-08-15
EP3360039B1 (en) 2021-03-24
CN108139916B (zh) 2021-04-30
KR20180063128A (ko) 2018-06-11
WO2017062479A1 (en) 2017-04-13
JP2018531461A (ja) 2018-10-25
KR102654610B1 (ko) 2024-04-03

Similar Documents

Publication Publication Date Title
JP6995745B2 (ja) マルチステージブートイメージロードおよびプログラマブルロジックデバイスの構成
JP2018531461A6 (ja) マルチステージブートイメージロードおよびプログラマブルロジックデバイスの構成
US9864605B2 (en) Multistage boot image loading by configuration of a bus interface
US8719483B2 (en) Multi-root PCI express switch, boot method thereof, and multi-root PCI manager program
EP3688604B1 (en) Integration of a programmable device and a processing system in an integrated circuit package
CN112534418B (zh) 通过固定pcie物理传输网络的逻辑传输
US10924430B2 (en) Streaming platform flow and architecture for an integrated circuit
US20170097910A1 (en) Direct memory access for programmable logic device configuration
US10725942B2 (en) Streaming platform architecture for inter-kernel circuit communication for an integrated circuit
EP3274858B1 (en) Method, apparatus and system for encapsulating information in a communication
US9983889B1 (en) Booting of integrated circuits
US8918568B2 (en) PCI express SR-IOV/MR-IOV virtual function clusters
JP7492511B2 (ja) ストリーミングプラットフォームフローおよびアーキテクチャ
US20040117743A1 (en) Heterogeneous multi-processor reference design
US11232060B2 (en) Method, apparatus and system for power supply policy exchange on a bus
Kohn Partial reconfiguration of a hardware accelerator with vivado design suite for zynq-7000 ap soc processor
US8943256B1 (en) Serial data intermediary device, and related systems and methods
US10275259B1 (en) Multi-stage booting of integrated circuits
US20090292849A1 (en) Adaptable pci express controller core
US9852040B1 (en) Methods for updating memory maps of a system-on-chip
Bandara et al. Enabling virtio driver support on fpgas
US10783103B1 (en) Split control for direct memory access transfers
Curd PCI Express for the 7 Series FPGAs
Sebastian A hypervisor layer for virtualization of a system-on-chip: a virtualization extension for network-on-chip
CN118295958A (en) Integration of programmable devices and processing systems in integrated circuit packages

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180411

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20191007

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20201020

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20201021

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20201221

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210601

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210728

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20211116

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20211215

R150 Certificate of patent or registration of utility model

Ref document number: 6995745

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150