JP7149987B2

JP7149987B2 - データ伝送装置、データ処理システム、データ処理方法及び媒体

Info

Publication number: JP7149987B2
Application number: JP2020108977A
Authority: JP
Inventors: ラン，シャンルン; シュー，ニンイー; ヤン，イー; チウ，ジャンズー; チィー，ウェイ
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd; Kunlunxin Technology Beijing Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd; Kunlunxin Technology Beijing Co Ltd
Priority date: 2019-06-26
Filing date: 2020-06-24
Publication date: 2022-10-07
Anticipated expiration: 2040-06-24
Also published as: KR20210001907A; US20200409876A1; KR102337697B1; JP2021005380A; US11360915B2; EP3758264A1; CN112148653A

Description

本開示の実施例は、主にデータ伝送の技術分野に関し、より具体的には、データ伝送装置、データ処理システム及び方法に関する。

現在、人工知能（ＡＩ）テクノロジーが広く利用されているにつれて、グラフィックス処理ユニット（ＧＰＵ）またはＡＩ専用チップの計算能力は増加している。これにより、メモリアクセスの帯域幅に対する要求がますます高くなり、５１２ＧＢ／ｓ～１ＴＢ／ｓは非常に一般的であり、一部のチップさえ１ＴＢ／ｓを超えている。しかし、ＳｏＣの周波数とバス幅は、プロセスとタイミングに限られて絶えず増加させることができない。現在、ありふれたＡＸＩインターフェイスは、一般的には、周波数は約１ＧＨｚで、データビット幅が１０２４ビット以下であり、一般的には、５１２ビットで、帯域幅は６４ＧＢ／ｓ（＝１ＧＨｚ＊５１２ビット／８）であり、シングルチャンネルＧＤＤＲ、ＨＢＭなどのストレージが提供する帯域幅に相当である。既存のメモリマルチチャンネルインターリーブ技術では通常、最大１６（＝１ＴＢ／６４ＧＢ）のＡＸＩインターフェイスを使い、十分なメモリ帯域幅を提供することにより、メモリアクセスの帯域幅要件を満たせる。

しかし、メモリのマルチチャンネルインターリーブ、特に８チャンネル以上のインターリーブは大きな課題となる。一方、このような複数のチャンネルはＳｏＣチップの片側に拡散するのが難しく、チップの両側または周囲に配置する必要がある。これにより、平面配置とチップの物理的な実現に大きな困難をもたらす。一方、マルチチャンネルはＳｏＣのオンチップインターコネクト（ＮｏＣ）とシステムパフォーマンスに挑戦し、如何にインターリーブをサポートしないモジュールをシステムに導入するかを含むだけでなく、様々な状況でパフォーマンス帯域幅はシステム要件などを満たすかどうかを慎重に評価する必要もある。

本開示の例示的な実施例により、データ伝送装置の解決策を提供し、上記の問題及び／または他の潜在的な問題を解決、または少なくとも部分的に解決する。

本開示の第１の態様により、データ伝送装置を提供する。データ伝送装置は、処理ユニットに結合される複数の第１のポートと、複数のメモリに結合される複数の第２のポートと、前記処理ユニットと前記複数のメモリとの間でデータを伝送するように、第１のポートと第２のポートとの間に配置されて複数の層を有するインターリーブネットワークを形成するための複数のデータチャンネルであって、前記インターリーブネットワークの各層が少なくとも１つのサブインターリーブネットワークを含む複数のデータチャンネルと、を含む。

複数のチャンネル、階層化メモリインターリーブ技術を採用することにより、ハードウェアに由来するコストを削減させ、拡張性と柔軟性を向上する。少なくとも１層を分散するように設置され、即ち複数のサブインターリーブネットワークに画分されるため、長いパスを必要とするデータチャンネルが大幅に削減される。これにより、消費電力、データ伝送の遅延及び安定性の点では有利である。また、階層化インターリーブネットワークのデータ伝送技術により、対称構造の配置を実現しやすくなり、データ処理システムにおける様々なモジュールを配置しやすくなる。

いくつかの実施例では、複数のデータチャンネルは、インターリーブネットワークの複数の層内の隣接する層を相互に接続するように、インターリーブチャンネルを含む。これにより、データ伝送の効率と拡張性をさらに向上する。

いくつかの実施例では、インターリーブネットワークの複数の層内のサブインターリーブネットワークの数は、第１のポートから第２のポートへ順次に増加するかまたは減少する。各層の間のサブインターリーブネットワークの様々な組み合わせを適用することにより、拡張性と柔軟性をさらに向上する。

いくつかの実施例では、第１のポートにより提供される総帯域幅は、第２のポートにより提供される総帯域幅以上である。

一部の実施例では、第２のポートはメモリコントローラを介して複数のメモリに結合される。

本開示の第２の態様により、データ処理方法を提供する。データ処理方法は、複数のメモリのうちの少なくとも１つのメモリにおけるデータに対する読み取り要求が受信されたことに応答して、本開示の第１の態様のデータ伝送装置を介して、読み取り要求の対象となる少なくとも１つのメモリからデータを取得するステップを含む。

本開示の第３の態様により、データ処理方法を提供する。データ処理方法は、複数のメモリのうちの少なくとも１つのメモリにデータを書き込む書き込み要求が受信されたことに応答して、本開示の第１の態様のデータ伝送装置を介して、少なくとも１つのメモリにデータを書き込むステップを含む。

本開示の第４の態様により、データ処理システムを提供する。データ処理システムは、処理ユニットと、本開示の第１の態様のデータ伝送装置と、１つまたは複数のプログラムが記憶されている記憶装置とを含み、１つまたは複数のプログラムが前記処理ユニットにより実行される場合、前記処理ユニットが本開示の第２の態様または第３の態様の方法を実現する。

いくつかの実施例では、データ伝送装置は処理ユニットに集積される。

いくつかの実施例では、前記データ処理システムの周りに任意の位置に複数のメモリが配置される。

本開示の第５の態様により、コンピュータ読み取り可能な命令が記憶されているコンピュータ読み取り可能な記憶媒体を提供する。コンピュータ読み取り可能な命令が実行される場合、機器に本開示の第２の態様または第３の態様の方法を実現させる。

発明の概要で説明される発明の内容は、本開示の実施例の鍵または重要な特徴を限定することを意図していない。本開示の他の特徴は、以下の説明により容易に理解される。

図面に併せて説明を参照することにより、本開示の各実施例の上記と他の特徴、利点及び態様はより明らかになる。図面において、同じまたは類似の参照番号は、同じまたは類似の要素を示す。
従来技術におけるメモリインターリーブ技術を採用するデータ伝送を示す概略図である。本開示のいくつかの実施例に係るマルチチャンネル、階層化メモリインターリーブ技術を採用するデータ伝送を示す概略図である。本開示のいくつかの実施例に係るマルチチャンネル、階層化メモリインターリーブ技術を採用する物理的な実現を示す概略図である。本開示の他の実施例に係るマルチチャンネル、階層化メモリインターリーブ技術を採用するデータ伝送を示す概略図である。本開示の他の実施例に係るマルチチャンネル、階層化メモリインターリーブ技術を採用するデータ伝送を示す概略図である。本開示の例示的な実施例に係るデータ処理方法のフロー図である。本開示の例示的な実施例に係るデータ処理方法のフロー図である。本開示の各実施例を実施できるコンピューティング機器のブロック図である。

本開示の実施例は、以下に図面を参照してより詳細に説明する。本開示のある実施例が図面に示されているが、本発明は様々な形態で具現化され、本明細書に記載される実施例に限られるものではなく、逆に本開示をより明確かつ完全に理解されるように実施例を提供する。本開示の図面及び実施例は単に例示とし、本開示の範囲を限定するものではない。

本開示の実施例の説明において、用語「含む」などは、「含むが、これに限定されない」と理解されるべきである。「に基づいて」という用語は、「少なくとも部分的に基づいて」と理解されるべきである。「一実施例」または「実施例」という用語は、「少なくとも１つの実施例」を理解されるべきである。「第１」、「第２」などの用語は、異なるまたは同一のオブジェクトを指せる。以下に他の明示的及び暗黙的な定義も含まれる場合がある。

メモリインターリーブ技術は、メモリ性能を改善するための技術であり、より多くの伝送チャンネルとより高いメモリ帯域幅を提供でき、メモリが複数の書き込み／読み取り操作を同時に実行させ、システムのパフォーマンスを効果的に改善する。図１は、従来技術におけるメモリインターリーブ技術を採用するデータ伝送を示す図である。図１に示すように、システムオンチップ（ＳｏＣ）を例として、複数のチャンネル（特に８チャンネル以上）のメモリインターリーブである場合は、制御側とメモリ側は、一般的に、Ｎ×Ｎクロスバー（ｃｒｏｓｓｂａｒ）により相互に接続される。

ＳｏＣシステムの処理ユニット１０１’は、通常、インターリーブデータチャンネル１０３’、メモリコントローラ及び物理層（ＰＨＹ）を介して、メモリ２００’と相互に接続される。ＳｏＣシステムチップ配置のニーズに応じて、メモリコントローラーと物理層をＳｏＣシステムの両側またはより多くの側に分布する必要がある場合、通常の５００ｍｍ^２のＡＩチップにとっては、マルチチャンネルクロスバーの実現は非常に困難である。

特に、このようなサイズのチップは通常対称構造により実現され、複数のブロック（ｂｌｏｃｋ）に画分される場合、モジュール画分及び対称構造の実装は困難である。発明者の検討により、従来技術ではマルチチャンネルインターリーブネットワークの層は１つしかないことに由来することが判明した。

発明者は上記の発見に基づいて、上記及び／または他の潜在的な問題を解決または少なくとも部分的に解決するために、マルチチャンネルの階層化インターリーブネットワークに基づくデータ伝送技術を提案した。データ伝送技術は、データ伝送装置として具現化することができる。本明細書のデータ伝送装置は、ＳｏＣなどの任意の適切な環境に適用されるモジュールであってもよい。

図２は、本開示のいくつかの実施例に係るマルチチャンネル、階層化メモリインターリーブ技術を採用するデータ伝送を示す図である。図２に示すように、データ伝送装置は、処理ユニット（例えば、ＳｏＣシステムの処理ユニット）に結合される複数の第１のポート１０１と、複数のメモリ（２００）に結合される複数の第２のポート１０２と、複数のデータチャンネル１０３と含む。複数のデータチャンネル１０３は、第１のポート１０１と第２のポート１０２との間に配置され、処理ユニットと複数のメモリ１０２との間のデータを伝送する。

第２のポート１０２は、メモリコントローラ及び物理層を介して複数のメモリに結合することができる。第１のポート１０１と第２のポート１０２の数は同一でもよいし、同一でなくてもよく、一般的に、第１のポート１０１により提供される総帯域幅は、第２のポート１０２により提供される総帯域幅以上である。例えば、いくつかの実施例では、ビット幅が同じである場合、第１のポート１０１の数は第２のポート１０２の数と異なってもよい。以下は、同数の第１のポート１０１と第２のポート１０２の数と同じである場合を例として（例えば、Ｎ×Ｎ）、本開示の実施例による改善を説明する。

従来のメモリインターリーブ技術を採用するデータチャンネルとは異なり、本開示の実施例に係る複数のデータチャンネルは、階層化メモリインターリーブ方式を採用する。データチャンネルのインターリーブネットワークの各層には、少なくとも１つのサブインターリーブネットワーク１０３１が含まれる。すなわち、複数のデータチャンネルは階層化インターリーブネットワークを採用する。例えば、図２に示すように、複数のデータチャンネルは２層構造に画分され、第１層に１つのサブインターリーブネットワークがあり、第２層に２つのサブインターリーブネットワークがある。

この場合、第１層のサブインターリーブネットワークはＮ×２インターリーブを採用するだけで、第２層の各サブインターリーブネットワークは（Ｎ／２）×（Ｎ／２）インターリーブを採用するだけでよい。まず、階層化技術を採用するため、ハードウェアに由来するコストは非常に少なくなることは明らかである。具体的には、単層のＮ×Ｎインターリーブネットワークの場合、図２に示す例のＮ×２＋２×（Ｎ／２）×（Ｎ／２）インターリーブネットワークに由来するコストよりもはるかに多い。次に、少なくとも１つの層が分散されるように設置され、すなわち複数のサブインターリーブネットワークに画分されるため、長い経路のデータ経路は大幅に削減される。これにより、消費電力、データ伝送の遅延及び安定性の点では有利である。

階層化メモリインターリーブ技術により、各層は単独または他の既存のモジュールとともに新しいモジュールを形成できるため、各サブインターリーブネットワークはいずれも大きな面積を利用せず、より柔軟に配置できる。図３に示すように、図２に示す階層化インターリーブネットワークを採用するデータ伝送技術は、対称構造の配置をより容易に実現することができる。

いくつかの実施例では、物理的に実現される時に、図２に示す第２層、必要なメモリコントローラ及び物理層は、人工知能（ＡＩ）演算モジュールに組み込むことにより実現され得る。このようにして、モジュール画分と対称構造をより適切に実現できるため、階層化技術の拡張性を向上する。例えば、合理的なモジュール画分と対称構造により、チャンネル数を８チャンネルから１６チャンネル、さらには３２チャンネル以上に簡単に拡張できる。これにより、メモリアクセス帯域幅に対する高い要求を簡単に実現できる。

いくつかの実施例では、インターリーブネットワークの複数の層のうちの少なくとも隣接するサブインターリーブネットワーク間で、インターリーブデータチャンネルを採用して相互に接続する。各隣接する層の間ではＡＸＩインターフェイスなどのデータ伝送プロトコルを採用してデータを伝送する。これにより、データ伝送の効率と拡張性をさらに向上する。

さらに、図２には本開示のいくつかの実施例に係るマルチチャンネルの階層化メモリインターリーブ技術を採用するデータ伝送の概略図だけが示されている。勿論、これは単なる例示であり、本開示の範囲を限定することを意図していない。本開示の実施例に係る階層化内部インターリーブを採用するデータ伝送装置は、様々なモジュール及び／またはサブインターリーブネットワークをより柔軟に調整できる。

例えば、図４に示されるように、いくつかの実施例では、複数のデータチャンネル１０３も２つの層を形成するインターリーブネットワークである。図２に示す実施例とは異なり、第１層インターリーブネットワークには１つのサブインターリーブネットワーク１０３１があり、第２層インターリーブネットワークには４つのサブインターリーブネットワークがある。このように、第１層のサブインターリーブネットワークはＮ×４インターリーブを採用でき、第２層の各サブインターリーブネットワークは（Ｎ／４）×（Ｎ／４）インターリーブを採用できる。これにより、ハードウェアに由来するコストをさらに削減できるとともに、様々なモジュール画分方法もできる。また、この配置により、メモリをＳｏＣチップの周りに対称的に配置することもできる。

図２及び図４は、データチャンネルをインターリーブネットワークの２つの層に画分できる場合を示している。図２及び図４の実施例の説明から、各層のサブインターリーブネットワークの数は、実際の状況に応じて柔軟に調整できる。いくつかの実施例では、複数の層内のサブインターリーブネットワークの数は、第１のポート１０２から第２のポートへ順次に増加するかまたは減少する。各層の間でのサブインターリーブネットワークを様々に組み合わせることにより、データ伝送の拡張性と柔軟性をさらに向上する。

サブインターリーブネットワークの様々な組み合わせ方式は、各層のサブインターリーブネットワークの数を実際のニーズに応じて柔軟に調整できる以外、インターリーブネットワークの層数も調整できる。チャンネルの数が多いほど、考慮できる層の数も多くなる。例えば、いくつかの実施例では、図５に示されるように、３つの層を有する１６チャンネルのインターリーブネットワークが示されている。第１層は１つのサブインターリーブネットワーク１０３１を有し、第２層は２つのサブインターリーブネットワーク１０３１を有し、第３層は４つのサブインターリーブネットワーク１０３１を有する。

この場合、第１層のサブインターリーブネットワーク１０３１はＮ×２インターリーブを採用することができ、第２層の各サブインターリーブネットワークは（Ｎ／２）×（Ｎ／４）インターリーブを採用することができ、第３層のサブインターリーブネットワークは（Ｎ／４）×（Ｎ／４）インターリーブ方式を採用できる。この多層構造により、サブインターリーブネットワークがさらに細分化されるため、モジュールの画分と対称配置がより容易になり、柔軟性と拡張性をさらに向上する。

上記の層の数及び各層のサブインターリーブネットワークの数は柔軟に調整することができる以外、面積をさらに最適化するために、第１のポート１０１または第２のポート１０２のいずれかのビット幅を増加させることにより、インターフェイスの数を減少しても良い。

例えば、いくつかの実施例では、第１のポート１０１のビット幅は、第２のポートのビット幅の２倍であってもよい。これにより、第１のポート１０１の数は、第２のポート１０２の数の半分であっても良い。２層構造のインターリーブネットワークを採用する場合、一方、第１層のサブインターリーブネットワークは（Ｎ／２）×２のインターリーブ方法を採用できる。これにより、第１層の面積とルーティングを大幅に削減できる。一方、ルーティングの削減によって、より友好的な物理的な実現をもたらす。例えば、チャンネルが１６である場合、８つの第１のポート１０１のみが必要になる。

上記は、データチャンネルが２つ以上の層を有することができ、かつ各層が異なる数のサブインターリーブネットワークを有するマルチチャンネルインターリーブ方式を説明している。このマルチチャンネルインターリーブ方式は、データチャンネルの複数の配置モードを実現し、高い拡張性とマルチチャンネル及び階層化のメモリインターリーブ方式が物理的に実現される。

本開示の実施例により、読み取りデータ処理方法６００を提供する。読み取りデータ処理方法６００は、データ処理システム内の処理ユニットにより実行されることができる。図６は、本開示の例示的な実施例に係るデータ処理方法のフロー図である。図面に示されるように、６１０では、複数のメモリ２００のうちの少なくとも１つのメモリ２００におけるデータに対する読み取り要求が受信されたか否やかを判定する。読み取り要求が受信された場合、方法６００は６２０で上記データ伝送装置を介して、読み取り要求の対象となる少なくとも１つのメモリ２００からデータを取得する。

例えば、ユーザがメモリまたは他の記憶装置に保存されているデータを処理しようとする場合、ユーザは適切なインターフェースを介してデータに対する読み取り要求を処理ユニットに伝送することができる。データが他のストレージ機器に保存されている場合、適切な操作を介してデータがメモリにダンプできる。読み取り要求には、メモリ内のデータのアドレスを含んでも良い。これらのデータに対する読み取り要求が受信された場合、処理部はアドレス情報に基づいてメモリ２００からデータを取得できる。データを取得した後、相応的に処理し、インターフェイスを介してユーザに指定されたモジュールに伝送し、さらなる処理を行うことができる。例えば、データは処理ユニットで読み取って処理した後、メモリ２００に書き込み、さらなる処理を行うことができる。

本開示の実施例により、書き込みデータ処理方法７００を提供する。書き込みデータ処理方法７００は、データ処理システム内の処理ユニットにより実行されることができる。図７は、本開示の例示的な実施例に係るデータ処理方法のフロー図である。図面に示されるように、７１０では、複数のメモリ２００のうちの少なくとも１つのメモリ２００にデータを書き込む書き込み要求が受信されたか否やかを判定する。書き込み要求が受信された場合、方法７００は７２０で上記のデータ伝送装置を介して、少なくとも１つのメモリにデータを書き込む。

例えば、処理ユニットはデータの処理を終了し、処理されたデータをメモリ２００に書き込む要求が受信された場合、上記のデータ伝送装置を介して、メモリ２００に書き込み、さらなる処理を行うことができる。

上記の方法はマルチチャンネル、階層化のメモリインターリーブ方法を採用することにより、ロングパスデータチャンネルの数を効果的に削減し、データの伝送効率と安定性を向上する。

本開示の実施例により、図３に示すように、データ処理システム３００を提供する。データ処理システムは、処理ユニットと、記憶装置と、上記データ伝送装置１００とを含む。データ処理システム３００は、いくつかの実施例ではシステムオンチップＳｏＣであってもよい。ストレージ機器は、少なくとも１つのプログラムを記憶している。当該少なくとも１つのプログラムは、処理ユニットにより実行される場合、処理ユニットが上記の方法を実現することができる。上記のデータ伝送装置１００を採用するデータ処理システム３００の配置は、もっと合理的でより大きな拡張性を有し、電力消費はより少ない。

いくつかの実施例では、データ伝送装置１００は処理ユニットに集積することができる。すなわち、いくつかの実施例では、システムオンチップＳｏＣは少なくとも１つの処理ユニットを含み、データ伝送装置１００はシステムオンチップ処理ユニットに集積されるデータチャンネルであってもよい。いくつかの実施例では、複数のメモリ２００はデータ処理システム（例えば、システムオンチップＳｏＣ）の任意の位置に、例えば対称的に両側または周囲に配置されることができる。上記の構成を採用するデータ処理ユニットは、より簡単に物理的に実現されることができる。

図８は、本開示の各実施例を実施できるコンピューティング機器のブロック図である。装置８００は図７及び図８に示される方法の実施に採用することができる。図面に示されるように、機器８００は、読み取り専用メモリ（ＲＯＭ）８０２に記憶されているコンピュータプログラム命令または記憶装置８０８からランダムアクセスメモリ（ＲＡＭ）８０３にロードされたコンピュータプログラム命令に従って、適切な各アクションとプロセスを実行する中央処理装置（ＣＰＵ）８０１を含む。ＲＡＭ８０３には、機器８００の動作に必要な様々なプログラム及びデータも記憶することができる。ＣＰＵ８０１、ＲＯＭ８０２、及びＲＡＭ８０３は、バス８０４を介して相互に接続される。入力／出力（Ｉ／Ｏ）インターフェース８０５もバス８０４に接続される。

キーボード、マウスなどの入力ユニット８０６と、様々なタイプのディスプレイ、スピーカーなどの出力ユニット８０７と、ハードディスク、光ディスクなどの記憶装置８０８と、ネットワークカード、モデム、無線通信トランシーバなどの通信ユニット８０９と、を含む機器８００内の複数の部材は、Ｉ／Ｏインターフェース８０５に接続される。通信ユニット８０９により、機器８００がインターネット及び／または様々な電気通信ネットワークなどのコンピュータネットワークを介して、他の機器と情報／データを交換することができる。

処理ユニット８０１は、プロセス６００及び７００などの上記の様々な方法及びプロセスを実行する。例えば、いくつかの実施例では、プロセス６００及び７００はコンピュータプログラムとして実装し、記憶装置８０８などのコンピュータ読み取り可能な媒体に具現的に含まれる。いくつかの実施例では、コンピュータプログラムの一部またはすべてを、ＲＯＭ６０２及び／または通信ユニット８０９を介して機器８００にロード及び／またはインストールすることができる。コンピュータプログラムがＲＡＭ８０３にロードされ、ＣＰＵ８０１により実行される場合、上記のステップ６００及び７００の１つまたは複数のステップを実行することができる。また他の実施例では、ＣＰＵ８０１は任意の他の適切な手段（例えば、ファームウェアに依存する）により、プロセス６００及び７００を実行するように構成され得る。

本明細書で上記の機能は少なくとも部分的に、１つまたは複数のハードウェア論理ユニットにより実行することができる。例えば、制限なく、使用できるハードウェア論理ユニットの典型的なタイプは、現場でプログラム可能なゲートアレイ（ＦＰＧＡ）、特定用途向け集積回路（ＡＳＩＣ）、特定用途向け標準製品（ＡＳＳＰ）、システムオンチップ（ＳＯＣ）、プログラマブルロジック機器（ＣＰＬＤ）などを含む。

本開示の方法を実施するためのプログラムコードは、１つまたは複数のプログラミング言語の任意の組み合わせでコーディングすることができる。プログラムコードは、汎用コンピューター、専用コンピューター、または他のプログラム可能なデータ処理装置のプロセッサーまたはコントローラーに提供され、プログラムコードがプロセッサーまたはコントローラーにより実行される場合、フロー図及び／またはブロック図に特定される機能／操作が実行される。プログラムコードは、完全にマシン上で、一部はマシン上で、スタンドアロンソフトウェアパッケージの一部としてマシン上で、一部はリモートマシン上で、あるいは完全にリモートマシンまたはサーバー上で実行され得る。

本開示の文脈において、機械読み取り可能な媒体は有形の媒体で、命令実行システム、装置または機器により使用、あるいは命令実行システム、装置または機器に結合するためのプログラムを含むまたは記憶することができる。機械読み取り可能な媒体は、機械読み取り可能な信号媒体または機械読み取り可能な記憶媒体であり得る。機械読み取り可能な媒体は電子、磁気、光学、電磁気、赤外線、または半導体システム、装置、または機器、または上記の任意の適切な組み合わせを含めるが、それらに限定されない。機械読み取り可能な記憶媒体のより具体的な例には、１つまたは１つ上のワイヤによる電気接続、ポータブルコンピューターディスク、ハードディスク、ランダムアクセスメモリ（ＲＡＭ）、読み取り専用メモリ（ＲＯＭ）、消去可能なプログラマブル読み取り専用メモリ（ＥＰＲＯＭまたはフラッシュメモリ）、光ファイバー、コンパクトコンパクトディスク読み取り専用メモリ（ＣＤ－ＲＯＭ）、光学記憶装置、磁気記憶装置、または上記の任意の適切な組み合わせを含む。

さらに、操作は特定の順序で示されているが、これは、そのような操作により特定の順序を示すまたは順序で実行されるため、または示されたすべての操作を実行して望ましい結果を得るためである。特定の状況では、マルチタスクと並列処理は有利になる。同様に、いくつかの特定の実現の詳細が上記の説明に含まれているが、これらは開示の範囲を限定するものとして解釈されるべきではない。単独の実施例の文脈で説明された一部の特徴は、単一の実現に組み合わせて実現することもできる。逆に、単一の実現の文脈で説明された様々な特徴は、単一または任意の適切なサブ組み合わせる方式で複数の実現に実現できる。

本開示の上記の詳細な実施例は、単に本開示の原理を例示または説明することにより、本開示を限定することを意図していない。したがって、本開示の旨及び範囲内で行われた修正、同等の置換及び改善は、本開示の範囲内に含まれるべきである。また、添付の請求項は、請求項の範囲と限定の同等の代替の範囲と限定以内のすべての変更及び修正を含むことを意図している。

Claims

データ伝送装置（１００）であって、
処理ユニットに結合される複数の第１のポート（１０１）と、
複数のメモリ（２００）に結合される複数の第２のポート（１０２）と、
前記処理ユニットと前記複数のメモリ（２００）との間でデータを伝送するように、前記第１のポート（１０１）と前記第２のポート（１０２）との間に配置されて複数の層を有するインターリーブネットワークを形成する複数のデータチャンネル（１０３）であって、前記インターリーブネットワークの各層が少なくとも１つのサブインターリーブネットワーク（１０３１）を含む複数のデータチャンネル（１０３）と、を含み、
前記インターリーブネットワークの前記複数の層内のサブインターリーブネットワーク（１０３１）の数は、前記第１のポート（１０１）から前記第２のポート（１０２）へ順次に増加するかまたは減少し、
前記第２のポート（１０２）がメモリコントローラ（２０１）を介して前記複数のメモリ（２００）に結合される
ことを特徴とするデータ伝送装置（１００）。
前記複数のデータチャンネル（１０３）は、前記インターリーブネットワークの前記複数の層内の隣接する層を相互に接続するように、インターリーブチャンネルを含む、
ことを特徴とする請求項１に記載のデータ伝送装置（１００）。
前記第１のポート（１０１）により提供される総帯域幅は、前記第２のポート（１０２）により提供される総帯域幅以上である、
ことを特徴とする請求項１に記載のデータ伝送装置（１００）。
コンピュータにより実行されるデータ処理方法であって、
複数のメモリ（２００）のうちの少なくとも１つのメモリ（２００）におけるデータに対する読み取り要求が受信されたことに応答して、請求項１～３のいずれかに記載のデータ伝送装置（１００）を介して、前記読み取り要求の対象となる前記少なくとも１つのメモリ（２００）から前記データを取得するステップ、を含む、
ことを特徴とするデータ処理方法。
コンピュータにより実行されるデータ処理方法であって
複数のメモリ（２００）のうちの少なくとも１つのメモリ（２００）にデータを書き込む書き込み要求が受信されたことに応答して、請求項１～３のいずれかに記載のデータ伝送装置（１００）を介して、前記少なくとも１つのメモリ（２００）に前記データを書き込むステップ、を含む、
ことを特徴とするデータ処理方法。
データ処理システム（３００）であって、
処理ユニットと、
請求項１～３のいずれかに記載のデータ伝送装置（１００）と、
１つまたは複数のプログラムが記憶されている記憶装置と、を含み、
前記１つまたは複数のプログラムが前記処理ユニットにより実行される場合、前記処理ユニットが、インターフェースに由来する要求に応じて請求項４または５に記載の方法を実現する、
ことを特徴とするデータ処理システム（３００）。
前記データ伝送装置（１００）が、前記処理ユニットに集積される、
ことを特徴とする請求項６に記載のデータ処理システム（３００）。
前記データ処理システムの周りの任意の位置に複数のメモリ（２００）が配置される、
ことを特徴とする請求項６に記載のデータ処理システム（３００）。
コンピュータ読み取り可能な命令が記憶されているコンピュータ読み取り可能な記憶媒体であって、コンピュータ読み取り可能な命令が実行される場合、インターフェースに由来する要求に応じて、機器に請求項４または５に記載のデータ処理方法を実行させる、
ことを特徴とするコンピュータ読み取り可能な記憶媒体。
コンピュータ上で動作する際、インターフェースに由来する要求に応じて、前記コンピュータに請求項４または５に記載のデータ処理方法を実行させる、
ことを特徴とするコンピュータプログラム。