JP7242968B2 - 計算ノードとストレージサーバ間のPCI Expressファブリックを介した高速ストレージアクセスを提供するネットワークアーキテクチャ - Google Patents

計算ノードとストレージサーバ間のPCI Expressファブリックを介した高速ストレージアクセスを提供するネットワークアーキテクチャ Download PDF

Info

Publication number
JP7242968B2
JP7242968B2 JP2022549013A JP2022549013A JP7242968B2 JP 7242968 B2 JP7242968 B2 JP 7242968B2 JP 2022549013 A JP2022549013 A JP 2022549013A JP 2022549013 A JP2022549013 A JP 2022549013A JP 7242968 B2 JP7242968 B2 JP 7242968B2
Authority
JP
Japan
Prior art keywords
streaming
compute
array
network
pcie
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2022549013A
Other languages
English (en)
Other versions
JP2023506585A (ja
Inventor
ロダリック コーレンブランデル ルーロフ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Interactive Entertainment Inc
Original Assignee
Sony Interactive Entertainment Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Interactive Entertainment Inc filed Critical Sony Interactive Entertainment Inc
Publication of JP2023506585A publication Critical patent/JP2023506585A/ja
Priority to JP2023035545A priority Critical patent/JP2023071941A/ja
Application granted granted Critical
Publication of JP7242968B2 publication Critical patent/JP7242968B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F13/38Information transfer, e.g. on bus
    • G06F13/382Information transfer, e.g. on bus using universal interface adapter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/15Interconnection of switching modules
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/16Constructional details or arrangements
    • G06F1/18Packaging or power distribution
    • G06F1/181Enclosures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/16Constructional details or arrangements
    • G06F1/18Packaging or power distribution
    • G06F1/183Internal mounting support structures, e.g. for printed circuit boards, internal connecting means
    • G06F1/187Mounting of fixed and removable disk drives
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F13/14Handling requests for interconnection or transfer
    • G06F13/16Handling requests for interconnection or transfer for access to memory bus
    • G06F13/1668Details of memory controller
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F13/38Information transfer, e.g. on bus
    • G06F13/40Bus structure
    • G06F13/4004Coupling between buses
    • G06F13/4022Coupling between buses using switching circuits, e.g. switching matrix, connection or expansion network
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F13/38Information transfer, e.g. on bus
    • G06F13/42Bus transfer protocol, e.g. handshake; Synchronisation
    • G06F13/4204Bus transfer protocol, e.g. handshake; Synchronisation on a parallel bus
    • G06F13/4221Bus transfer protocol, e.g. handshake; Synchronisation on a parallel bus being an input/output bus, e.g. ISA bus, EISA bus, PCI bus, SCSI bus
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F13/38Information transfer, e.g. on bus
    • G06F13/42Bus transfer protocol, e.g. handshake; Synchronisation
    • G06F13/4282Bus transfer protocol, e.g. handshake; Synchronisation on a serial bus, e.g. I2C bus, SPI bus
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/061Improving I/O performance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0655Vertical data movement, i.e. input-output transfer; data movement between one or more hosts and one or more storage devices
    • G06F3/0659Command handling arrangements, e.g. command buffers, queues, command scheduling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/067Distributed or networked storage systems, e.g. storage area networks [SAN], network attached storage [NAS]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/35Switches specially adapted for specific applications
    • H04L49/351Switches specially adapted for specific applications for local area network [LAN], e.g. Ethernet switches
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1097Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]
    • AHUMAN NECESSITIES
    • A63SPORTS; GAMES; AMUSEMENTS
    • A63FCARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
    • A63F13/00Video games, i.e. games using an electronically generated display having two or more dimensions
    • A63F13/30Interconnection arrangements between game servers and game devices; Interconnection arrangements between game devices; Interconnection arrangements between game servers
    • A63F13/35Details of game servers
    • A63F13/355Performing operations on behalf of clients with restricted processing capabilities, e.g. servers transform changing game scene into an encoded video stream for transmitting to a mobile phone or a thin client
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/16Constructional details or arrangements
    • G06F1/18Packaging or power distribution
    • G06F1/183Internal mounting support structures, e.g. for printed circuit boards, internal connecting means
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2213/00Indexing scheme relating to interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F2213/0026PCI express
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2213/00Indexing scheme relating to interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F2213/38Universal adapter
    • G06F2213/3808Network interface controller
    • HELECTRICITY
    • H05ELECTRIC TECHNIQUES NOT OTHERWISE PROVIDED FOR
    • H05KPRINTED CIRCUITS; CASINGS OR CONSTRUCTIONAL DETAILS OF ELECTRIC APPARATUS; MANUFACTURE OF ASSEMBLAGES OF ELECTRICAL COMPONENTS
    • H05K7/00Constructional details common to different types of electric apparatus
    • H05K7/14Mounting supporting structure in casing or on frame or rack
    • H05K7/1485Servers; Data center rooms, e.g. 19-inch computer racks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer Hardware Design (AREA)
  • Power Engineering (AREA)
  • Mathematical Physics (AREA)
  • Information Transfer Between Computers (AREA)
  • Pinball Game Machines (AREA)
  • Small-Scale Networks (AREA)
  • Slot Machines And Peripheral Devices (AREA)

Description

本開示は、ネットワークストレージに関し、より具体的には、PCI-Expressを使用するラックアセンブリのストリーミングアレイの計算スレッド上に配置された計算ノードへの高速ネットワークストレージアクセスに関する。
近年、クラウドゲームサーバとネットワークを介して接続されたクライアントとの間でストリーミング形式のオンラインまたはクラウドゲームを可能にするオンラインサービスが継続的に推進されている。ストリーミング形式は、オンデマンドのゲームタイトルの利用可能性、より複雑なゲームが実行できる、マルチプレイヤーゲームのためのプレイヤー間でネットワークが築ける、プレイヤー間のアセットあるいは資産を共有できる、プレイヤー及び/または観客間のインスタントエクスペリエンスが共有できる、友人がフレンドプレイビデオゲームを見ることが可能である、友人がプレイ中のゲームプレイに別の友人を参加させることができるなどの理由により、いっそう人気が高まっている。
残念ながら、需要は、ネットワーク接続の機能の限界にまで押し上げられている。例えば、前世代のストリーミングネットワークアーキテクチャは、ギガビットイーサネット通信接続(例えば、毎秒40ギガビットのイーサネット接続)を使用してネットワークストレージを提供していた。しかしながら、新世代のストリーミングネットワークアーキテクチャでは、より優れた(より高速な)帯域幅パフォーマンス(ギガバイト接続など)が必要である。
本開示の実施形態は、このような背景の下になされたものである。
本開示の実施形態は、ラックアセンブリ内などのネットワークストレージへの、計算ノード当たり毎秒4ギガバイト(GB/s)を超えるネットワークストレージ帯域幅(例えば、アクセス)を提供可能な高速アクセスを提供することに関する。
本開示の実施形態は、ネットワークアーキテクチャを開示する。ネットワークアーキテクチャには、ネットワークストレージが含まれる。ネットワークアーキテクチャは複数のストリーミングアレイを含み、各ストリーミングアレイは複数の計算スレッドを含み、各計算スレッドは1つ以上の計算ノードを含む。ネットワークアーキテクチャは、複数のストリーミングアレイのそれぞれの計算ノードからネットワークストレージへの直接アクセスを提供するように構成されたPCI Express(PCIe)ファブリックを含む。PCIeファブリックは、複数のアレイレベルのPCIeスイッチを含み、各アレイレベルのPCIeスイッチは、対応するストリーミングアレイの計算スレッドの計算ノードに通信可能に結合され、ストレージサーバに通信可能に結合される。ネットワークストレージは、複数のストリーミングアレイによって共有される。
本開示の実施形態は、ネットワークアーキテクチャを開示する。ネットワークアーキテクチャには、ネットワークストレージが含まれる。ネットワークアーキテクチャは複数のストリーミングアレイを含み、各ストリーミングアレイは複数の計算スレッドを含み、各計算スレッドは1つ以上の計算ノードを含む。ネットワークアーキテクチャは、複数のストリーミングアレイのそれぞれの計算ノードからネットワークストレージへの直接アクセスを提供するように構成されたPCI Express(PCIe)ファブリックを含む。PCIeファブリックは、複数のアレイレベルのPCIeスイッチを含み、各アレイレベルのPCIeスイッチは、対応するストリーミングアレイの計算スレッドの計算ノードに通信可能に結合され、ストレージサーバに通信可能に結合される。ネットワークアーキテクチャは、計算スレッド及び計算ノード管理情報をストリーミングするために、複数のストリーミングアレイの計算スレッドの計算ノードをネットワークストレージに通信可能に結合するように構成されたイーサネットファブリックを含む。ネットワークストレージは、複数のストリーミングアレイによって共有される。
本開示の他の態様は、本開示の原理の例として示される添付図面と併せて、下記の発明を実施するための形態から明らかになるであろう。
本開示は、添付図面と併せて、以下の詳細な説明を参照することにより、最も良く理解することができる。
本開示の一実施形態による、1つ以上のデータセンターに配置された1つ以上の計算ノード間でネットワークを介してゲームを提供するためのゲームクラウドシステムの図である。 本開示の一実施形態による、ゲームクラウドシステムの代表的なデータセンターにおける複数の計算ノードを含む複数のラックアセンブリの図である。 本開示の一実施形態による、PCIe通信を使用して計算ノードにネットワークストレージへの高速アクセスを提供するように構成されたラックアセンブリの図である。 本開示の一実施形態による、PCIe通信を使用して計算ノードにネットワークストレージへの高速アクセスを提供するように構成されたラックアセンブリ内に配置された複数の計算ノードを含むストリーミングアレイの図である。 本開示の一実施形態による、PCIe通信を使用して計算ノードにネットワークストレージへの高速アクセスを提供するように構成されたラックアセンブリ内に配置された複数の計算ノードを含む計算スレッドの図である。 本開示の一実施形態による、PCIe通信を使用して計算ノードにネットワークストレージへの高速アクセスを提供するように構成されたラックアセンブリ内に配置されたスレッドレベルのPCIeスイッチの図である。 本開示の様々な実施形態の態様を実行するために使用することができる例示的なデバイスのコンポーネントを示す。
以下の詳細な説明は、例示の目的で多くの特定の詳細を含むが、当業者であれば、以下の詳細に対する多くの変形及び変更が本開示の範囲内にあることを理解するであろう。したがって、以下で説明される本開示の態様は、この説明に続く特許請求の範囲への一般性を失うことなく、また限定を課すことなく示される。
一般的に言えば、本開示の実施形態は、ラックアセンブリ内などのネットワークストレージへの、不揮発性メモリエクスプレス(NVMe:Non-Volatile Memory express)レイテンシでの計算ノード(例えば、ラックアセンブリの)当たり毎秒4ギガバイト(GB/s)を超えるネットワークストレージ帯域幅(例えば、アクセスなど)を提供可能な高速アクセスを提供する。
様々な実施形態の上記の一般的な理解により、様々な図面を参照して実施形態の例の詳細をここに説明する。
本明細書全体を通して、「アプリケーション」または「ゲーム」または「ビデオゲーム」または「ゲームアプリケーション」への言及は、入力コマンドの実行を通して指示される任意のタイプのインタラクティブアプリケーションを表すことを意味する。説明目的のみで、インタラクティブアプリケーションは、ゲーム、文書処理、ビデオ処理、ビデオゲーム処理などのためのアプリケーションを含む。さらに、これらの用語は、置き換え可能である。
図1は、本開示の一実施形態による、1つ以上のデータセンターに配置された1つ以上の計算ノード間でネットワーク150を介してゲームを提供するためのシステム100の図である。本開示の一実施形態によれば、システムは、1つ以上のクラウドゲームサーバ間のネットワークを介してゲームを提供するように構成され、より具体的には、計算ノードから、ラックアセンブリ内などのネットワークストレージに高速アクセスするように構成される。クラウドゲームには、サーバでビデオゲームを実行して、ゲームでレンダリングされたビデオフレームを生成し、次いでそれをクライアントに送信して表示することが含まれる。
クラウドゲームは、物理マシン(例えば、中央処理装置--CPU--及びグラフィック処理装置--GPU)、または仮想マシン、または両方の組み合わせを使用して、様々な実施形態で(例えば、クラウドゲーム環境またはスタンドアロンシステム内で)実行することができることも理解される。例えば、仮想マシン(例えば、インスタンス)は、複数のCPU、メモリモジュール、GPU、ネットワークインタフェース、通信コンポーネントなどのハードウェア層の1つ以上のコンポーネントを利用するホストハードウェア(例えば、データセンターに配置される)のハイパーバイザを使用して作成することができる。これらの物理リソースは、CPUのラック、GPUのラック、メモリのラックなどのラックに配置でき、インスタンスに使用される(インスタンスの仮想化されたコンポーネントを構築する場合など)コンポーネントの組み立てとアクセスのためのファブリックを容易にするラックスイッチのトップを使用して、ラック内の物理リソースにアクセスできる。
通常、ハイパーバイザは、仮想リソースで構成された複数のインスタンスの複数のゲストオペレーティングシステムを提示できる。すなわち、オペレーティングシステムのそれぞれは、1つ以上のハードウェアリソース(例えば、対応するデータセンターに配置される)によってサポートされる仮想化リソースの対応するセットで構成され得る。例えば、各オペレーティングシステムは、仮想CPU、複数の仮想GPU、仮想メモリ、仮想化された通信コンポーネントなどでサポートされ得る。さらに、インスタンスの構成は、あるデータセンターから別のデータセンターに転送されてレイテンシを短縮することができる。ユーザまたはゲームに対して定義された即時使用状況は、ユーザのゲームセッションを保存するときに使用できる。
即時使用状況は、ゲームセッション用のビデオフレームの高速レンダリングを最適化するために、本明細書で説明する任意の数の構成を含むことができる。一実施形態では、ゲームまたはユーザに対して定義された即時使用状況は、構成可能な設定としてデータセンター間で転送することができる。即時使用状況を転送する機能により、ユーザが異なる地理的位置からゲームをプレイするために接続する場合に、データセンターからデータセンターへのゲームプレイの効率的な移行が可能になる。
システム100は、1つ以上のデータセンター(例えば、データセンター1からN)を通じて実装されるゲームクラウドシステム190を含む。図示されるように、ゲームクラウドシステム190のインスタンスは、管理機能を提供するデータセンターNに配置することができ、ゲームクラウドシステム190の管理機能は、各データセンターでゲームクラウドシステム190の複数のインスタンスを通じて分散させることができる。いくつかの実施態様では、ゲームクラウドシステム管理機能は、データセンターのいずれかの外部に配置されてもよい。
そのゲームクラウドシステム190は、クライアントデバイス(例えば、1~N)のそれぞれを対応するデータセンター内の対応するリソースに割り当てるように構成されたアサイナ191を含む。特に、クライアントデバイス110がゲームクラウドシステム190にログインするとき、クライアントデバイス110は、データセンターNでゲームクラウドシステム109のインスタンスと接続されてもよく、データセンターNはクライアントデバイス110に地理的に最も近くてもよい。アサイナ191は、診断テストを実行して、クライアントデバイス110への利用可能な送信及び受信帯域幅を決定することができる。テストに基づいて、アサイナ191は、リソースをクライアントデバイス110に非常に特定的あるいは特異的に割り当てることができる。例えば、アサイナ191は、特定のデータセンターをクライアントデバイス110に割り当てることができる。さらに、アサイナ191は、特定の計算スレッド、特定のストリーミングアレイ、特定のラックアセンブリの、特定の計算ノードをクライアントデバイス110に割り当てることができる。
割り当ては、計算ノードで利用可能なアセット(ゲームなど)の知識に基づいて実行される。以前は、クライアントデバイスは一般的にデータセンターに割り当てられており、ラックアセンブリにはそれ以上割り当てられていなかった。このようにして、アサイナ191は、計算集約型の特定のゲームアプリケーションの実行を要求しているクライアントデバイスを、計算集約型アプリケーションを実行していない可能性のある計算ノードに割り当てることができる。さらに、クライアントからの要求に応じて計算集約型ゲームアプリケーションの割り当ての負荷管理をアサイナ191で実行することができる。例えば、短期間に要求されている同じ計算集約型のゲームアプリケーションは、特定の計算ノード、計算スレッド、及び/またはラックアセンブリの負荷を軽減するために、1つのラックアセンブリまたは異なるラックアセンブリ内の異なる計算スレッドの異なる計算ノードにわたって分散され得る。
いくつかの実施形態では、割り当ては、機械学習に基づいて実行され得る。特に、リソースの需要は、特定のデータセンターとその対応するリソースについて予測され得る。例えば、データセンターが計算集約型のゲームアプリケーションを実行する多くのクライアントをすぐに処理することが予測できる場合、アサイナ191はその知識をクライアントデバイス110に割り当て、そのリソース能力のすべてを現在利用していない可能性のあるリソースを割り当てることができる。別のケースでは、アサイナ191は、データセンターNでの負荷の増加を見越して、クライアントデバイス110をデータセンターNのゲームクラウドシステム190からデータセンター3で利用可能なリソースに切り替えることができる。
さらに、将来のクライアントは、リソースの負荷と需要が、ゲームクラウドシステム全体に、複数のデータセンターにわたり、複数のラックアセンブリにわたり、複数の計算スレッドにわたり、及び/または複数の計算ノードにわたって分散されるように、分散された方法でリソースに割り当てられる。例えば、クライアントデバイス110は、データセンターN(例えばパス1を介して)及びデータセンター3(例えば経路2を介して)の両方のゲームクラウドシステムからリソースを割り当てられ得る。
クライアントデバイス110が、対応するストリーミングアレイの対応する計算スレッドの特定の計算ノードに割り当てられると、クライアントデバイス110は、ネットワークを介して対応するデータセンターに接続する。すなわち、クライアントデバイス110は、データセンター3など、割り当てを実行するデータセンターとは異なるデータセンターと通信している可能性がある。
特に、システム100は、ゲームクラウドシステム190を介してゲームを提供し、本開示の一実施形態によれば、ゲームは、ゲームをプレイしている対応するユーザのクライアントデバイス(例えば、シンクライアント)からリモートで実行されている。システム100は、シングルプレイヤーモードまたはマルチプレイヤーモードのいずれかで、ネットワーク150を介してクラウドゲームネットワークまたはゲームクラウドシステム190を介して1つ以上のゲームをプレイする1人以上のユーザにゲームのコントロールをもたらすことができる。いくつかの実施形態では、クラウドゲームネットワークまたはゲームクラウドシステム190は、ホストマシンのハイパーバイザ上で実行する複数の仮想マシン(VM)を含むことができ、1つ以上の仮想マシンは、ホストのハイパーバイザに利用可能であるハードウェアリソースを利用するゲームプロセッサモジュールを実行するように構成される。ネットワーク150は、1つ以上の通信技術を含み得る。いくつかの実施形態では、ネットワーク150は、高度な無線通信システムを有する第5世代(5G)ネットワーク技術を含み得る。
いくつかの実施形態では、通信は、無線技術を使用して促進され得る。そのような技術には、例えば、5G無線通信技術が含まれ得る。5Gは、セルラーネットワークテクノロジーの第5世代である。5Gネットワークはデジタルセルラーネットワークであり、プロバイダーがカバーするサービスエリアはセルと呼ばれる小さな地理的エリアに分割されている。音と画像を表すアナログ信号は、電話でデジタル化され、アナログ-デジタルコンバータによって変換され、ビットのストリームとして送信される。
セル内のすべての5Gワイヤレスデバイスは、他のセルで再利用される周波数のプールからトランシーバによって割り当てられた周波数チャネルを介して、セル内のローカルアンテナアレイ及び低電力自動トランシーバ(送信機及び受信機)と電波で通信する。ローカルアンテナは、高帯域幅光ファイバまたは無線バックホール接続によって、電話網及びインターネットに接続される。他のセルネットワークと同様に、あるセルから別のセルに移動するモバイルデバイスは、新しいセルに自動的に転送される。5Gネットワークは単なる一例のタイプの通信ネットワークであり、本開示の実施形態は、5Gに続く後の世代の有線または無線技術と同様に、前世代の無線または有線通信を利用することができることを理解されたい。
図示されるように、ゲームクラウドシステム190を含むシステム100は、複数のビデオゲームへのアクセスを提供することができる。特に、クライアントデバイスのそれぞれが、クラウドゲームネットワークから異なるゲームへのアクセスを要求している可能性がある。例えば、ゲームクラウドシステム190は、対応するゲームアプリケーションを実行するために1つ以上のホスト上で実行される1つ以上の仮想マシンとして構成され得る1つ以上のゲームサーバを提供し得る。例えば、ゲームサーバは、ユーザのゲームのインスタンスをインスタンス化するゲームプロセッサをサポートする仮想マシンを管理し得る。よって、複数の仮想マシンに関連付けられた1つ以上のゲームサーバの複数のゲームプロセッサは、複数のユーザのゲームプレイに関連付けられた1つ以上のゲームの複数のインスタンスを実行するように構成される。
そのようにして、バックエンドサーバサポートは、複数のゲームアプリケーションのゲームプレイのメディア(例えば、ビデオ、オーディオなど)のストリーミングを、対応する複数のユーザに提供する。つまり、ゲームクラウドシステム190のゲームサーバは、ネットワーク150を介して、データ(例えば、対応するゲームプレイのレンダリングされた画像及び/またはフレーム)を対応するクライアントデバイスにストリーミング返信するように構成される。そのようにして、クライアントデバイスによって受信されて転送されたコントローラの入力に応答して、計算の複雑なゲームアプリケーションが、バックエンドサーバで実行し続けることができる。各サーバは、画像及び/またはフレームをレンダリングし、次いでそれらをエンコード(例えば、圧縮)して、対応するクライアントデバイスにストリーミングして表示することが可能である。
一実施形態では、クラウドゲームネットワークまたはゲームクラウドシステム190は、分散型ゲームサーバシステム及び/またはアーキテクチャである。具体的には、ゲームロジックを実行する分散型ゲームエンジンが、対応するゲームの対応するインスタンスとして構成されている。一般に、分散型ゲームエンジンは、ゲームエンジンの各機能を取り込み、それらの機能を分散させて多数の処理エンティティによって実行する。個々の機能は、さらに1つ以上の処理エンティティにわたって分散させることができる。
処理エンティティは、物理ハードウェアを含んで、及び/または仮想コンポーネントまたは仮想マシンとして、及び/または仮想コンテナとしてなど、様々な構成で構成することができ、コンテナは、仮想化されたオペレーティングシステム上で動作するゲームアプリケーションのインスタンスを仮想化するものであるため、仮想マシンとは異なる。処理エンティティは、クラウドゲームネットワークまたはゲームクラウドシステム190の1つ以上のサーバ(計算ノード)上のサーバ及びその基礎となるハードウェアを利用し、及び/またはそれらに依拠してもよく、サーバは1つ以上のラック上に配置され得る。
種々の処理エンティティに対するそれらの機能の実行の協調、割り当て、及び管理は、分散同期層によって行われる。そのようにして、それらの機能の実行が分散同期層によって制御されて、プレイヤーによるコントローラ入力に応答して、ゲームアプリケーション用のメディア(例えば、ビデオフレーム、オーディオなど)を生成することが可能になる。分散同期層は、重要なゲームエンジンコンポーネント/機能が、より効率的な処理のために分散されて再構築されるように、分散処理エンティティ全体で(例えば、負荷バランシングを介して)それらの機能を効率的に実行することが可能である。
図2は、本開示の一実施形態による、ゲームクラウドシステムの代表的なデータセンター200における複数の計算ノードを含む複数のラックアセンブリ210の図である。例えば、北米、ヨーロッパ、日本など、世界中に複数のデータセンターが分散している場合がある。
データセンター200は、複数のラックアセンブリ220(例えば、ラックアセンブリ220Aから220N)を含む。ラックアセンブリのそれぞれは、対応するネットワークストレージ及び複数の計算スレッドを含む。例えば、代表的なラックアセンブリ220Nは、ネットワークストレージ210及び複数の計算スレッド230(例えば、スレッド230Aから230N)を含む。他のラックアセンブリは、変更を加えてまたは加えずに同様に構成することができる。
特に、計算スレッドのそれぞれは、ハードウェアリソース(例えば、プロセッサ、CPU、GPUなど)を提供する1つ以上の計算ノードを含む。例えば、ラックアセンブリ220Nの複数の計算スレッド230における計算スレッド230Nは、4つの計算ノードを含むように示されているが、ラックアセンブリは1つ以上の計算ノードを含み得ることが理解される。各ラックアセンブリは、対応するデータセンターの管理用に構成された管理サーバとの通信を提供するように構成されたクラスタスイッチに結合される。例えば、ラックアセンブリ220Nはクラスタスイッチ240Nに結合される。クラスタスイッチは、外部通信ネットワーク(インターネットなど)への通信も提供する。
各ラックアセンブリは、ラックアセンブリ内など、対応するネットワークストレージへの高速アクセスを提供する。この高速アクセスは、計算ノードと対応するネットワークストレージ間の直接アクセスを提供するPCIeファブリック(PCI-express Fabric)を介して提供される。例えば、ラックアセンブリ220Nにおいて、高速アクセスは、対応する計算スレッドの特定の計算ノードと対応するネットワークストレージ(例えば、ストレージ210)との間のデータパス201を提供するように構成される。特に、PCIeファブリックは、不揮発性メモリエクスプレス(NVMe)レイテンシでの計算ノード(ラックアセンブリなど)当たり毎秒4ギガバイト(GB/s)を超えるネットワークストレージ帯域幅(例えば、アクセスなど)を提供可能である。また、制御パス202は、ネットワークストレージ210と各計算ノードとの間の制御及び/または管理情報を通信するために構成される。
図示されるように、データセンター200の管理サーバ210は、アサイナ191(図1に示される)と通信して、リソースをクライアントデバイス110に割り当てる。特に、管理サーバ210は、ゲームクラウドシステム190’のインスタンスと連携し、ゲームクラウドシステム190の最初のインスタンス(例えば、図1の)と連携して、リソースをクライアントデバイス110に割り当てることができる。実施形態では、割り当ては、どのリソースと帯域幅が必要であり、データセンターに存在するかを知るなど、アセット認識に基づいて実行される。したがって、本開示の実施形態は、説明のために、対応するラックアセンブリ220Bの対応する計算スレッド231の特定の計算ノード232にクライアントデバイス110を割り当てるように構成される。
ストリーミングラックアセンブリは計算ノードを中心に配置されており、これがゲームアプリケーション、ビデオゲームを実行し、及び/またはゲームセッションのオーディオ/ビデオを1つ以上のクライアントにストリーミングする。さらに、各ラックアセンブリ内で、ネットワークストレージを提供するストレージサーバにゲームコンテンツを格納することができる。ネットワークストレージには、ネットワークファイルシステム(NFS:Network File System)ベースのネットワークストレージによって多くの計算ノードにサービスを提供するために、大量のストレージと高速ネットワークが装備されている。
図3は、本開示の一実施形態による、PCIe通信を使用して計算ノードにネットワークストレージへの高速アクセスを提供するように構成されたラックアセンブリ300の図である。図示されるように、図3の図は、ラックアセンブリ300の高レベルのラック設計を示している。ラックアセンブリ300は、複数のラックアセンブリ220のうちの1つ以上を表すことができる。例えば、ラックアセンブリは、ラックアセンブリ220Nを表すことができる。
前述のように、従来のラック設計では、ギガビットイーサネットを使用してネットワークストレージへのアクセスが提供されていた。それはネットワークストレージへの40gb/sのアクセスを提供するものであり、これは、将来のゲームには適していない。
本開示の実施形態は、NVMeレベルのレイテンシでの計算ノードあたり毎秒約4ギガバイト(GB/s)帯域幅を超えるネットワークストレージへのアクセスを提供する。これは、一実施形態では、PCI Expressスイッチング技術及びラック全体のPCI Expressファブリックによって達成される。
各ラックアセンブリ300は、ネットワークストレージ310を含む。ゲームコンテンツは、各ラックアセンブリ内のネットワークストレージ310に記憶あるいは保存される。ネットワークストレージ310には、NFSベースのネットワークストレージによって多くの計算ノードにサービスを提供するために、大量のストレージと高速ネットワークが装備されている。
さらに、各ラックアセンブリ300は、1つ以上のストリーミングアレイを含む。ラックアセンブリ300は4つのアレイを有するものとして示されているが、1つ以上のストリーミングアレイがラックアセンブリ300内に含まれ得ることが理解される。より具体的には、各ストリーミングアレイには、ネットワークスイッチ、アレイ管理サーバ(AMS)、及び1つ以上の計算スレッドが含まれる。例えば、代表的なストリーミングアレイ4には、ネットワークスイッチ341、AMS343、及び1つ以上の計算スレッド345が含まれる。他のストリーミングアレイ1~3も同様に構成され得る。図3に示されるストリーミングアレイは、例示の目的で、ストリーミングアレイごとに8つの計算スレッドを含むが、ストリーミングアレイは、各計算スレッドが1つ以上の計算ノードを含むように、任意の数の計算スレッドを含むことができることが理解される。
具体的には、各ストリーミングアレイは、PCIeファブリック(例えば、Gen4)の一部として構成された対応するPCIeスイッチによってサービスされ、PCIeファブリックを介して計算ノードとストレージサーバ間の直接アクセスを提供する。例えば、代表的なストリーミングアレイ4は、PCIeスイッチ347によってサービスされる。PCIeファブリック(すなわち、ストリーミングアレイ1~4のそれぞれにサービスを提供するPCIeスイッチを含む)は、前述のネットワークストレージ310に記憶されたゲームデータへの高速アクセスを可能にするデータパス301(例えば、ラックアセンブリ220N内のデータパス201)を提供する。
さらに、各ストリーミングアレイは、制御及び/または管理情報をストリーミングアレイに通信するためなどの制御パス302(例えば、ラックアセンブリ220N内の制御パス202)を提供するイーサネットファブリックで構成される。
また、ラックアセンブリ300は、ラック管理コントローラ(図示せず)によって管理される共有電力で構成される。さらに、ラックアセンブリは、冷却を共有するように構成することもできる(図示せず)。
ラックアセンブリ300は、各計算ノードに高速ストレージアクセス(例えば、最大で4~5GB/sまたはそれ以上)を提供するという要件に合わせて設計されている。ストレージは、ネットワークストレージ310によって提供され、これがゲームコンテンツをRAM及びNVMeドライブに記憶する(つまり、従来の単なるディスクの束--JBOD--ストレージサーバではない)。一実施形態では、ゲームコンテンツは「読み取り専用」であるため、システム間で共有することができる。個々の計算ノードは、ストリーミングアレイのそれぞれとネットワークストレージ310との間のPCIeファブリック(例えば、データパス301を提供する)を介して、ネットワークストレージ310でゲームコンテンツにアクセスする。
特に、PCIeファブリック(例えば、Gen4)は、すべての計算ノードが同時にピークパフォーマンス(4~5GB/s)を必要としているわけではないと想定することができる。各スレッドは、PCIeの複数のレーン(例えば、8)を有する(例えば、最大16GB/s)。例えば、ストリーミングアレイごとに合計64レーン(8スレッドの場合)が、対応するPCIeスイッチに提供され、マルチレーン(例えば96レーン)PCIeスイッチを有するように構成することができる。しかしながら、各PCIeスイッチは、設計に応じて、対応するアレイ32レーンのみをネットワークストレージ310に提供することができる。
さらに、各ラックアセンブリ300は、アレイ管理サーバ(AMS)と対応する計算スレッドとの間で利用可能な第2のPCIeファブリックを含む。例えば、アレイ4は、AMS343と1つ以上の計算スレッド345との間の通信を提供する第2のPCIeファブリック349を含む。このファブリックはパフォーマンスが低く(例えば、スレッドごとに1レーンのPCIe)、低速のストレージワークロードやスレッド管理のために使用できる。
さらに、各ラックアセンブリ300は従来のイーサネットネットワークを含み、例えば、制御パス302のための通信を提供する。例えば、各計算ノードには1×1Gbpsイーサネット(例えば、計算ノードと対応するネットワークスイッチとの間の32個の計算ノード用に32×1Gbps)があり、「オーディオ/ビデオのストリーミング」と管理に使用される。AMS及びネットワークストレージは、ネットワークストレージ及び管理のために、より高速なネットワーキングを有する(例えば、対応するAMSとネットワークスイッチとの間で40Gbps、ネットワークストレージ310と対応するネットワークスイッチとの間で10Gbps、ネットワークストレージ310とクラスタスイッチ350との間で100Gbps)。
ネットワークストレージ310(例えば、サーバ)はまた、AMSサーバ及び計算ノードへのネットワークストレージアクセスを提供するように構成され得る。AMSサーバへのネットワークストレージアクセスは、従来のイーサネットネットワーキング(例えば、対応するネットワークスイッチとネットワークストレージ310との間で10Gbps)を介して処理される。しかしながら、計算ノードへのネットワークストレージは、カスタムプロトコル及びカスタムストレージソリューションによって(すなわち、データパス301を介して)PCI Express上で行われる。このカスタムストレージソリューションの背景は、PCIeスイッチングを利用する計算ノードのハードウェア及びソフトウェア設計にある。
一実施形態では、各計算ノードは、「コマンドバッファ」ベースのプロトコルを使用して、ある場所からデータを要求することができる。ネットワークストレージ310は、データを配置することが予期される。特に、計算ノードは、直接メモリアクセス(DMA)エンジンを使用して、「読み取り操作」中に独自のメモリに移動する。ネットワークストレージ310に記憶されたデータは、RAM及びNVMeに記憶される。ネットワークストレージ310上のソフトウェアは、NVMeからデータを取得する必要がないようするのが可能な場合は、データがRAMにキャッシュされるのを保証する。多くの計算ノードが同じコンテンツにアクセスすることが予想されるため、キャッシングが可能である。
図4は、本開示の一実施形態による、PCIe通信を使用して計算ノードにネットワークストレージ410への高速アクセスを提供するように構成されたラックアセンブリ内に配置された複数の計算ノードを含むストリーミングアレイ400の図である。1人以上のユーザにコンテンツをストリーミングするように構成されたラックアセンブリは、ネットワークストレージ310にアクセスする図3のストリーミングアレイ1~4などの「ストリーミングアレイ」に分割される。特に、アレイは、前述のように、ネットワークスイッチ、アレイ管理サーバ(AMS)、及び複数の計算スレッド(例えば、アレイごとに1つ以上の計算スレッドで、それぞれ1つ以上の計算ノードを保持する計算スレッド)からなるラックアセンブリ(例えば、図3のラックアセンブリ300)の一部である。複数のアレイ400がラックアセンブリ内に構成され、ネットワークストレージを共有するが、それ以外は独立して動作する。
図示されるように、アレイ管理サーバ(AMS)403は、対応するストリーミングアレイ400内のサーバであり、ストリーミングアレイ内のすべての操作を管理する責任を負う。それは大まかに2つのクラスの操作を処理している。最初に、AMS403は「構成作業」を管理し、これは、各計算スレッド(例えば、スレッド1~8)が正常に機能していることを確認することに関するものである。これには、スレッドへの電力供給、ソフトウェアが最新であることの確認、ネットワークの構成、PCIeスイッチの構成などが含まれる。
2番目のクラスのAMS403の操作は、クラウドゲームセッションの管理である。これには、対応する計算ノードでのクラウドゲームセッションの設定、1つ以上の計算ノードへのネットワーク/インターネットアクセスの提供、ストレージアクセスの提供及びクラウドゲームセッションの監視が含まれる。
したがって、AMS403は、計算ノード及び計算スレッドを管理するように構成され、各計算スレッドは1つ以上の計算ノードを含む。例えば、AMS403は、電力インターポーザへの汎用入出力(GPIO)を使用して計算ノードへの電力供給を可能にする。一実施形態では、AMS403は、シリアルデータ(例えば、電源オン/オフ、診断、及びロギング情報)を送達する汎用非同期受信送信(UART)信号を使用して計算ノードを制御および監視するように構成される。AMS403は、計算ノードでファームウェアの更新を実行するように構成される。AMS403は、計算スレッド及び対応するPCIeスイッチ407の構成を実行するように構成される。
そのストリーミングアレイ400は、前述のように、PCI Expressを介して計算ノードにストレージを提供するように構成される。例えば、PCIeファブリックは、計算スレッド上の計算ノードとPCIeスイッチ407との間のデータパス402を提供する。実施形態において、計算ノードごとの読み取り-書き込みストレージアクセスは、毎秒最大500メガバイト(MB/s)で提供される。さらに、1つの実施態様では、計算ノードごとのストレージあたり1~2ギガバイト(GB)があるが、他のサイズのストレージもサポートされている。
さらに、各ストリーミングアレイ400は、前述のように、計算ノードへのネットワーク/インターネットアクセスを提供する。例えば、(例えば、ネットワークスイッチ411を介し、イーサネットなど、図示していないパスを介した)ネットワークアクセスは、計算ノードあたり毎秒100メガビット(mb/s)で提供される。
図4に示すように、AMS403の主な機能は、計算スレッドのそれぞれへのPCI Expressファブリック接続である。例えば、計算スレッド上の計算ノードとAMS403の間の通信を提供するPCIeファブリック420が示されている。一実施形態では、PCI Expressファブリック接続は、「パッシブPCI Expressアダプタ」を使用して実施される。なぜなら、各計算スレッドは、PCI Express Gen4スイッチで構成することができ、AMSと計算スレッドとの間の距離は短くなければならないからである。
AMS403は、ランダムアクセスメモリ(RAM)を備えた中央処理装置(CPU)で構成することができる。PCIeファブリック用の入出力(I/O)があってもよい。イーサネット用のネットワーク接続がある。
AMS403は、ストレージ(例えば、2×2テラバイトのNVMe)で構成され得る。さらに、パッシブPCIeファブリックアダプタの使用など、各計算スレッドへのPCIeファブリック接続が存在してもよい。また、電力(例えば、12ボルト)を提供するバスバーもある。
図5は、本開示の一実施形態による、PCIe(例えば、Gen4-第4世代)通信を使用して計算ノードにネットワークストレージへの高速アクセスを提供するように構成されたラックアセンブリ内に配置された複数の計算ノード(例えば、ノード1~4)を含む計算スレッド500の図である。図5は、複数の計算ノード(例えば、ノード1~4)及び計算ノードの動作をサポートするための補助ハードウェアを示している。
各計算スレッド500は、1つ以上の計算ノードを含む。図5は、4つの計算ノード(例えば、ノード1~4)を含む計算スレッドを示すが、1つ以上の計算ノードを含む計算スレッドに任意の数の計算ノードを提供できることが理解される。計算スレッド500は、(例えば、計算ノードを介して)計算リソースを提供するハードウェアプラットフォーム(例えば、回路基板)を提供することができる。
計算スレッド500は、前述のように、計算ノード(例えば、ノード1~4)とラックレベルのネットワークスイッチ(図示せず)との間のイーサネットケーブルを接続するように構成されたイーサネットパッチパネル510を含む。
計算スレッド500は、PCIeスイッチボード520を含む。
計算スレッド500は、は管理パネル530を含む。例えば、管理パネル530は、LEDやボタンなどのステータスを与えることができる。
計算スレッド500は、計算スレッドに電力を供給するように構成された電力インターポーザボード540を含む。
各計算スレッドには、1つ以上の計算ノード(ノード1~4など)が含まれる。ラックアセンブリ内に配置された各計算ノードは、本開示の一実施形態に従って、PCIe通信(例えば、Gen4)を使用して計算ノードにネットワークストレージ(図示せず)への高速アクセスを提供するように構成される。計算ノードには複数のI/Oインタフェースが含まれる。例えば、計算ノードには、M.2ポートと、PCIe Gen4(双方向)用の複数のレーンが含まれ得る。
PCIe(例えば、Gen4)インタフェース(例えば、4レーン)を使用して、追加のデバイスでシステムを拡張できる。特に、PCIeインタフェースは、高速ストレージ用のPCI Expressスイッチ520を含むPCIeファブリックに接続するために使用される。さらに、計算ノードには、イーサネット接続(ギガビットイーサネットなど)が含まれる。また、計算ノードには、シリアルデータを送信及び/または受信するように構成された1つ以上の汎用非同期送受信機(UART)接続が含まれる。例えば、1つ以上のUARTポートが存在する場合があるが、これは(例えば、計算ノードをUART/GPIOコントローラ550に接続する)管理目的の意味を持つ。ポートは、「電源オン」、「電源オフ」、及び診断などのリモート制御操作に使用できる。別のUARTポートは、シリアルコンソール機能を提供する。
各計算ノードはまた、電力インターポーザ540に接続された電力入力コネクタ(例えば、設計された電力消費のための12ボルト)を含む。
図6は、本開示の一実施形態による、PCIe通信を使用して計算ノードにネットワークストレージへの高速アクセスを提供するように構成されたラックアセンブリ内に配置されたスレッドレベルのPCIeスイッチ600の図である。
スレッドPCIeスイッチ600は、2つの役割を有する対応する計算スレッド内の回路基板として構成することができる。一実施形態では、第1に、スレッドレベルのPCIeスイッチ600は、「非透過ブリッジング」(NTB)によって、個々の計算ノード(例えば、4つの計算ノード)を、PCIe(例えば、Gen4)バス620を介してAMS及び対応するネットワークストレージに接続する「ファブリックの役割」を有する。第2に、スレッドレベルのPCIeスイッチ600は、UART及びGPIO信号がスレッド管理のために提供される「管理の役割」を有する。
特に、PCIe(例えば、Gen4)接続は、外部ケーブルコネクタ、内部ケーブルコネクタ、及びPCIeエッジコネクタによって提供される。例えば、8レーンのPCIe(例えば、Gen4)外部ケーブル接続620を使用して、計算スレッドをストレージワークロード用のネットワークストレージに接続することができる。第2のPCIeファブリックへの第2の外部PCIe(例えば、Gen4)接続625は、AMSに接続する。例えば、第2のPCIe接続には1つのレーンが含まれ得る。なぜなら、これが主に管理機能に使用され、補助ストレージ機能を備えているためである。
さらに、内部PCIe(例えば、Gen4)ケーブルコネクタ610を使用して、ケーブルを用いてスレッドPCIeスイッチ520を、対応するM.2インタフェースを介して計算ノードのそれぞれに接続することができる。他の接続手段が実装されてもよい。例えば、M.2接続インタフェースを使用する代わりに、他のコネクタ及び/またはOCuLink、Slimline SASなどのコネクタインタフェースを使用できる。
UART及びGPIOコントローラ550の形態の管理インタフェースは、AMS(図示せず)によって使用され、個々の計算ノードと通信し、電力を管理する。AMSは、管理目的(電力オン/オフ、診断、ロギングなど)のために計算ノードごとに複数(例えば2つ)のUARTインタフェースを使用する。GPIO機能は、接続630を介して電力インターポーザボードを介した各計算ノードへの電力供給を管理するために使用される。これは、前述のように、接続630を介して管理パネル(例えば、LED及びボタン用)にも接続する。
スレッドレベルのPCIeスイッチ600は、PCIe(例えば、Gen4)スイッチ520を含み得る。また、複数(例えば、4つ)の非透過(NT)ブリッジングインタフェースを含めることができる。さらに、複数(例えば、4つ)のDMA(直接メモリアクセス)エンジンを含めることができる。
さらに、UART/GPIOコントローラ550が構成され、PCIeスイッチへのPCIeインタフェース、複数(例えば、8個)のUARTチャネル640、及び電力インターポーザ及び管理パネルへの複数(8個)のGPIO接続を含む。
さらに、ネットワークストレージアクセス用のPCIeファブリックへのコネクタがある。例えば、一実施態様では、PCIeファブリックからネットワークストレージへの8レーンの外部PCIeコネクタ620が提供される。
前述のように、AMSへのアクセスを提供する第2のPCIeファブリックへの1レーンの外部PCIeコネクタ625も、スレッドレベルのPCIeスイッチボード600内に提供される。1つ以上のPCIeエッジコネクタも提供され得る。
さらに、計算ノードへの4つのマルチレーン(例えば、4レーン)の内部PCIe接続610が提供され得る。例えば、各計算ノードには4つのレーンがある。
電力インターポーザへのGPIOコネクタ630が含まれていてもよい。例えば、計算ノードごとに1つずつ、合計4つの信号が必要である。
管理パネルへの4つデュアル/ペアUARTコネクタがあってもよい。例えば、一実施態様では、各計算ノードには2つのUARTインタフェースがある。他の実施態様では、各計算ノードが2つ未満のUARTインタフェース、または2つを超えるUARTインタフェースを有する場合がある。
接続630を介してスレッドに電力を供給する電力インターポーザを含めることができる。計算スレッドは、本開示の一実施形態による、PCIe通信を使用して計算ノードにネットワークストレージへの高速アクセスを提供するように構成されたラックアセンブリ内に配置された複数の計算ノードを含み得る。一実施形態では、電力インターポーザは、ラックの12Vバスバーから計算スレッドに電力を供給する。他の実施形態では、48ボルトなどの他の電圧がラックコンポーネントに電力を供給するために使用される。例えば、より高い電圧(例えば48ボルト)を電力効率のために使用してもよい。特定の電圧(例えば、12ボルト)を必要とするコンポーネントの場合、電力インターポーザを使用して電力を変換することができる。例えば、電力インターポーザは、48ボルト(または他の電圧)を12ボルトに下げるように変換するための変換ロジック(例えば、DC-DCコンバータ)を含むことができる。これは、計算ノードならびに補助ハードウェアに電力を供給するために使用される。計算ノードへの電力供給は、スレッドPCIeスイッチによるGPIOによって制御できる。各計算ノードには、電力を有効化/無効化する専用の信号が存在し得る。
また、電力インターポーザボードを監視するために、ラック管理制御インタフェースがラック管理コントローラ(RMC)に提供される。これにより、電圧、電流、温度などの診断情報が提供される。ラック管理制御インタフェースには電圧及び/または電流情報、及び温度が含まれ得る。
電源ステータス情報は、GPIO信号を使用して管理パネルに送達される。これには、各計算ノードの電力ステータスならびに電力インターポーザの12Vステータスが含まれる。さらに、バス(例えば、12ボルト)バーインタフェースが提供される。
例えば、電源バスの電源が入っているときに計算スレッドを追加及び/または取り外しするためのホットプラグサポートがあってもよい。例えば、電力は12ボルトまたはその他のレベルで供給され得る。補助コンポーネントへの電圧はより低い場合があり(例えば、6ボルト未満)、これは電力バス上の12ボルトから生成することができる。
管理パネルには計算スレッドの前面に配置されたボード/パネルが含まれてもよく、LEDによってスレッドのステータスを示す。各計算ノードには、制御ステータス情報を提供する2つのLEDがあってもよい。1つ目は、ソフトウェア制御可能なGPIO信号を使用して、スレッドPCIeスイッチから電力を供給される。2つ目のLEDは電力インターポーザボードからのもので、電力ステータス(例えば、電圧レベル)を示す。電力インターポーザボードからのグローバルな電力ステータスは、スレッドの全体的な電力ステータスを示す。
図7は、本開示の様々な実施形態の態様を実行するために使用することができる例示的なデバイス700のコンポーネントを示す。例えば、図7は、本開示の実施形態による、ラックアセンブリ内などの、対応するストリーミングアレイ内に構成された対応する計算スレッドの計算ノードへのネットワークストレージへの高速アクセスを提供するのに適した例示的なハードウェアシステムを示す。このブロック図は、各々が本発明の実施形態を実施するために適した、パーソナルコンピュータ、サーバコンピュータ、ゲームコンソール、モバイル機器、または他のデジタルデバイスを組み込むことができる、またはそれらであり得るデバイス700を示す。デバイス700は、ソフトウェアアプリケーション及び任意選択でオペレーティングシステムを実行するための中央処理装置(CPU)702を含む。CPU702は、1つ以上の同種または異種の処理コアから構成されてもよい。
様々な実施形態によれば、CPU702は、1つ以上の処理コアを有する1つ以上の汎用マイクロプロセッサである。さらなる実施形態は、ゲーム実行中のグラフィック処理のために構成されたアプリケーションの、媒体及び双方向エンターテインメントアプリケーションなどのきわめて並列かつ計算集約的なアプリケーションに特に適合されたマイクロプロセッサアーキテクチャを有する1つ以上のCPUを使用し、実装することができる。
メモリ704は、CPU702とGPU716とが使用するアプリケーション及びデータを記憶する。ストレージ706は、アプリケーション及びデータに不揮発性ストレージ及び他のコンピュータ可読媒体を提供し、固定ディスクドライブ、取り外し可能ディスクドライブ、フラッシュメモリデバイス、及びCD-ROM、DVD-ROM、Blu-ray(登録商標)、HD-DVD、または他の光学記憶デバイス、ならびに信号伝送及び記憶媒体を含んでもよい。
ユーザ入力デバイス708は、1人以上のユーザからのユーザ入力をデバイス700に伝達するものであり、その例としては、キーボード、マウス、ジョイスティック、タッチパッド、タッチスクリーン、スチルまたはビデオレコーダ/カメラ、及び/またはマイクロフォンがあり得る。ネットワークインタフェース709は、デバイス700が電子通信ネットワークを介して他のコンピュータシステムと通信することを可能にし、ローカルエリアネットワーク、及びインターネットなどのワイドエリアネットワークにわたる有線または無線通信を含んでもよい。
音声プロセッサ712は、CPU702、メモリ704、及び/またはストレージ706によって提供される命令及び/またはデータから、アナログまたはデジタル音声出力を生成するように適合される。CPU702、GPU716を含むグラフィックサブシステム、メモリ704、データストレージ706、ユーザ入力デバイス708、ネットワークインタフェース709、及びオーディオプロセッサ712を含むデバイス700のコンポーネントは、1つ以上のデータバス722を介して接続されている。
グラフィックサブシステム714はさらに、データバス722及びデバイス700のコンポーネントと接続される。グラフィックサブシステム714は、少なくとも1つのグラフィックプロセシングユニット(GPU)716及びグラフィックメモリ718を含む。グラフィックメモリ718は出力画像の各々の画素に対する画素データを記憶するために使用される表示メモリ(例えばフレームバッファ)を含む。グラフィックメモリ718は、GPU716と同一のデバイスに統合されてもよく、GPU716と別個のデバイスとして接続されてもよく、及び/またはメモリ704内で実装されてもよい。
画素データは、CPU702からグラフィックメモリ718に直接提供されてもよい。代わりに、CPU702は、所望の出力画像を定義するデータ及び/または命令をGPU716に提供し、GPU716は、そこから1つ以上の出力画像の画素データを生成する。所望の出力画像を定義するデータ及び/または命令は、メモリ704及び/またはグラフィックメモリ718に記憶されてもよい。1つの実施形態では、GPU716は、シーンに対するジオメトリ、照明、シェーディング、テクスチャリング、動き、及び/またはカメラパラメータを定義する命令及びデータから、出力画像の画素データを生成する3Dレンダリング能力を含む。GPU716は、シェーダプログラムを実行することが可能な1つ以上のプログラム可能実行ユニットをさらに含むことができる。
グラフィックサブシステム714は、グラフィックメモリ718から画像の画素データを定期的に出力して、ディスプレイデバイス710に表示させる、または投影システム(図示せず)により投影させる。ディスプレイデバイス710は、CRT、LCD、プラズマ、及びOLEDディスプレイを含む、デバイス700からの信号に応答して、視覚情報を表示することが可能な任意のデバイスであってもよい。デバイス700は、ディスプレイデバイス710に、例えば、アナログ信号またはデジタル信号を提供することができる。
他の実施形態では、グラフィックサブシステム714は、対応するCPU上で実行されている単一のアプリケーションのためにグラフィック処理を実行するために組み合わされる複数のGPUデバイスを含む。例えば、複数のGPUは、画像フレームのオブジェクトをレンダリングする前に、インターリーブされる可能性のあるスクリーン領域に対してジオメトリを事前テストすることにより、アプリケーションのジオメトリのマルチGPUレンダリングを実行できる。他の例では、複数のGPUが、フレームレンダリングの代替形式を実行でき、この場合、連続したフレーム期間で、GPU1は第1のフレームをレンダリングし、GPU2は第2のフレームをレンダリングするなどして、最後のGPUに到達すると、最初のGPUが次のビデオフレームをレンダリングする(例えば、GPUが2つしかない場合、GPU1は第3のフレームをレンダリングする)。つまり、フレームをレンダリングするときにGPUが循環する。
レンダリング操作は重複する可能性があり、それにおいて、GPU1が最初のフレームのレンダリングを終了する前にGPU2が2番目のフレームのレンダリングを開始できる。別の実施態様では、複数のGPUデバイスに、レンダリング及び/またはグラフィックスパイプラインで異なるシェーダー操作を割り当てることができる。マスターGPUがメインのレンダリングと合成を実行している。
例えば、3つのGPUを含むグループでは、マスターGPU1がメインレンダリング(例えば、第1のシェーダー操作)及び、スレーブGPU2とスレーブGPU3からの出力の合成を実行でき、スレーブGPU2は第2のシェーダー(例えば、川などの流体効果)操作を実行でき、スレーブGPU3は第3のシェーダー(例えば、粒子の煙)操作を実行でき、マスターGPU1は、GPU1、GPU2、及びGPU3のそれぞれからの結果を合成する。このようにして、異なるGPUを割り当てて、異なるシェーダー操作(旗振り、風、煙の発生、炎など)を実行してビデオフレームをレンダリングできる。さらに別の実施形態では、3つのGPUのそれぞれを、ビデオフレームに対応するシーンの異なるオブジェクト及び/または部分に割り当てることができる。上記の実施形態及び実施態様では、これらの操作は、同じフレーム周期で(同時に並行して)、または異なるフレーム周期で(順次並列に)実行することができる。
したがって、本開示は、ラックアセンブリ内などの、対応するストリーミングアレイ内に構成された対応する計算スレッドの計算ノードに、ネットワークストレージへの高速アクセスを提供するように構成された方法及びシステムについて説明する。
本明細書で定義される様々な実施形態は、本明細書で開示される様々な特徴を使用する特定の実施態様に組み合わされ得る、または組み立てられ得ることを、理解されたい。したがって、提供される例は、可能な例の一部にすぎず、様々な要素を組み合わせることでより多くの実施態様を規定することが可能な様々な実施態様に制限を加えるものではない。ある例では、ある実施態様は、開示されたまたは同等の実施態様の趣旨から逸脱することなく、より少ない要素を含んでもよい。
本開示の実施形態は、ハンドヘルドデバイス、マイクロプロセッサシステム、マイクロプロセッサベースもしくはプログラム可能な消費者向け電気製品、ミニコンピュータ、及びメインフレームコンピュータなどを含む様々なコンピュータシステム構成で実施されてよい。本開示の実施形態はまた、有線ベースネットワークまたは無線ネットワークを介してリンクされる遠隔処理デバイスによりタスクが行われる分散コンピューティング環境においても、実施することができる。
上記の実施形態を念頭に置いて、本開示の実施形態がコンピュータシステムに格納されたデータを含む様々なコンピュータ実装の動作を使用し得ることを理解されたい。これらの動作は、物理量の物理的操作を必要とする動作である。本開示の実施形態の一部を形成する、本明細書で説明される動作のうちのいずれも、有用な機械動作である。開示の実施形態はまた、これら動作を実行するためのデバイスまたは装置に関する。装置は、必要な目的のために特別に構築することができる。または、装置は、コンピュータに記憶されたコンピュータプログラムにより選択的に起動または構成される汎用コンピュータであってもよい。具体的には、本明細書の教示に従って書かれたコンピュータプログラムとともに様々な汎用マシンを使用することができる、あるいは、必要な動作を実行するためにさらに特化した装置を構築するほうがより好都合である場合もある。
本開示はまた、コンピュータ可読媒体上のコンピュータ可読コードとしても具現化することができる。コンピュータ可読媒体は、後でコンピュータシステムにより読み出され得るデータを格納できる任意のデータストレージデバイスである。コンピュータ可読媒体の例は、ハードドライブ、ネットクワーク接続ストレージ(NAS)、読み出し専用メモリ、ランダムアクセスメモリ、CD-ROM、CD-R、CD-RW、磁気テープ、並びに他の光学及び非光学データストレージデバイスを含む。コンピュータ可読媒体には、コンピュータ可読コードが分散方式で記憶され実行されるように、ネットワーク接続されたコンピュータシステムにわたり分散されたコンピュータ可読有形媒体が含まれ得る。
方法動作は特定の順序で説明されたが、オーバーレイ動作の処理が所望の方法で実行される限り、動作間に他の維持管理動作が実行されてもよく、または動作がわずかに異なる時間に起こるように調整されてもよく、またはシステム内に動作を分散することで、処理に関連する様々な間隔で処理動作が起こることを可能にしてもよいことを、理解すべきである。
前述の開示は、理解を明確にするためにある程度詳細に説明されたが、添付の特許請求の範囲内で特定の変更及び修正を実施できることは明らかであろう。したがって、本実施形態は、限定ではなく例示としてみなされるべきであり、本開示の実施形態は、本明細書に提供される詳細に限定されるものではなく、添付の特許請求の範囲内及び均等物内で変更されてよい。

Claims (20)

  1. ネットワークアーキテクチャであって、
    ネットワークストレージを有し、
    複数のストリーミングアレイを有し、前記複数のストリーミングアレイの各ストリーミングアレイは複数の計算スレッドを含み、前記複数の計算スレッドの各計算スレッドは1つ以上の計算ノードを含み、
    前記複数のストリーミングアレイのそれぞれの前記各ストリーミングアレイの計算ノードから前記ネットワークストレージへの直接アクセスを提供するように構成された第1のPCI Express(PCIe)ファブリックを有し、前記第1のPCIeファブリックは複数のアレイレベルのPCIeスイッチを含み、前記複数のアレイレベルのPCIeスイッチの各アレイレベルのPCIeスイッチは対応するストリーミングアレイの計算スレッドの計算ノードに通信可能に結合され、前記ネットワークストレージに通信可能に結合され、
    前記ネットワークストレージは、前記複数のストリーミングアレイによって共有され、
    前記複数のストリーミングアレイの前記各ストリーミングアレイの前記各計算ノードは、複数のゲームアプリケーションの1つ以上のインスタンスを実行するように構成され、
    前記複数のストリーミングアレイの前記対応するストリーミングアレイは、
    前記対応するストリーミングアレイ内の対応する計算スレッドを管理するように構成された、対応するアレイ管理サーバを有し、
    対応するネットワークスイッチを有し、前記対応するネットワークスイッチは、計算スレッド及び計算ノード管理情報をストリーミングするために、イーサネットファブリックを介して前記対応するアレイ管理サーバを介して、前記対応するストリーミングアレイ内の前記計算スレッドの対応する計算ノードから前記ネットワークストレージへの通信を提供し、前記イーサネットファブリックを介した前記通信を、前記ネットワークアーキテクチャの外部にあるネットワーク通信を提供するクラスタスイッチに提供するように構成され、
    前記ネットワークストレージは、ゲームアプリケーションの読み取り専用ゲームコンテンツを記憶し、それにより、前記複数の計算スレッドの対応する計算ノード上で前記ゲームアプリケーションを実行する計算インスタンスの間で前記読み取り専用ゲームコンテンツを共有できるようにする、ネットワークアーキテクチャ。
  2. 前記ネットワークストレージは、
    少なくとも1つのランダムアクセスメモリ(RAM)ドライブと、
    少なくとも1つの不揮発性メモリエクスプレス(NVMe)ドライブと、を有する、請求項1に記載のネットワークアーキテクチャ。
  3. 前記イーサネットファブリックは、前記複数のストリーミングアレイの各ネットワークスイッチを前記ネットワークストレージ及び前記クラスタスイッチに通信可能に結合する、請求項に記載のネットワークアーキテクチャ。
  4. 前記複数のストリーミングアレイの前記対応するストリーミングアレイは、
    第2のPCIeファブリックを有し、前記第2のPCIeファブリックは、前記対応するネットワークスイッチ及び前記対応するアレイ管理サーバに対する、前記対応するストリーミングアレイの前記対応する計算スレッドの前記対応する計算ノードの間の直接通信を、低速ストレージワークロードまたはスレッド管理のために提供するように構成される、請求項に記載のネットワークアーキテクチャ。
  5. 前記対応するアレイ管理サーバは、前記対応するストリーミングアレイ内の1つ以上の対応する計算スレッドの1つ以上の計算ノード上で実行されるクラウドゲームセッションを確立するように構成される、請求項に記載のネットワークアーキテクチャ。
  6. 前記ストリーミングアレイ内の前記対応する計算スレッドのそれぞれは、
    対応する計算スレッドの1つ以上の対応する計算ノード及び対応するアレイレベルのPCIeスイッチに通信可能に結合された、対応するスレッドレベルのPCIeスイッチを有し、
    前記対応するスレッドレベルのPCIeスイッチは、前記対応するアレイレベルのPCIeスイッチを介して、前記第1のPCIeファブリックを通して、前記対応するスレッドの前記1つ以上の対応する計算ノードと前記ネットワークストレージとの間の通信を提供するように構成され、
    前記対応するスレッドレベルのPCIeスイッチは、スレッド管理のために、前記対応するストリーミングアレイ内の前記計算スレッドのそれぞれと前記対応するアレイ管理サーバとの間の通信を提供するように構成される、請求項に記載のネットワークアーキテクチャ。
  7. 前記対応するスレッドの前記1つ以上の対応する計算ノードのそれぞれは、前記対応するスレッド上の前記対応するスレッドレベルのPCIeスイッチとの通信を提供するように構成された対応するM.2ポートを有する、請求項に記載のネットワークアーキテクチャ。
  8. 前記第1のPCIeファブリックは、前記ネットワークストレージと前記複数のストリーミングアレイの前記計算ノードのうちの少なくとも1つとの間に最大毎秒5ギガバイトの帯域幅を提供する、請求項1に記載のネットワークアーキテクチャ。
  9. ネットワークアーキテクチャであって、
    ネットワークストレージを有し、
    複数のストリーミングアレイを有し、前記複数のストリーミングアレイの各ストリーミングアレイは複数の計算スレッドを含み、前記複数の計算スレッド内の各計算スレッドは1つ以上の計算ノードを含み、
    前記複数のストリーミングアレイのそれぞれの計算ノードから前記ネットワークストレージへの直接アクセスを提供するように構成された第1のPCI Express(PCIe)ファブリックを有し、前記第1のPCIeファブリックは複数のアレイレベルのPCIeスイッチを含み、前記複数のアレイレベルのPCIeスイッチ内の各アレイレベルのPCIeスイッチは対応するストリーミングアレイの計算スレッドの計算ノードに通信可能に結合され、前記ネットワークストレージに通信可能に結合され、
    計算スレッド及び計算ノード管理情報をストリーミングするために、前記複数のストリーミングアレイの計算スレッドの計算ノードを前記ネットワークストレージに通信可能に結合するように構成されたイーサネットファブリックを有し、
    前記ネットワークストレージは、前記複数のストリーミングアレイによって共有され、
    前記複数のストリーミングアレイの各計算ノードは、複数のゲームアプリケーションの1つ以上のインスタンスを実行するように構成され、
    前記複数のストリーミングアレイの前記対応するストリーミングアレイは、
    前記対応するストリーミングアレイの前記計算スレッドを管理するように構成された、対応するアレイ管理サーバを有し、
    対応するネットワークスイッチを有し、前記対応するネットワークスイッチは、前記計算スレッド及び計算ノード管理情報をストリーミングするために、前記イーサネットファブリックを介して前記対応するアレイ管理サーバを介して、前記対応するストリーミングアレイの前記計算スレッドの前記計算ノードから前記ネットワークストレージへの通信を提供し、前記イーサネットファブリックを介した通信を、前記ネットワークアーキテクチャの外部にあるネットワーク通信を提供するクラスタスイッチに提供するように構成され、
    前記ネットワークストレージは、ゲームアプリケーションの読み取り専用ゲームコンテンツを記憶し、それにより、前記複数の計算スレッドの1つ以上の計算ノード上で前記ゲームアプリケーションを実行する計算インスタンスの間で前記読み取り専用ゲームコンテンツを共有できるようにする、ネットワークアーキテクチャ。
  10. 前記イーサネットファブリックは、前記複数のストリーミングアレイの前記計算スレッドの前記計算ノードを、前記ネットワークアーキテクチャの外部にある前記ネットワーク通信を提供するように構成された前記クラスタスイッチに通信可能に結合するように構成される、請求項に記載のネットワークアーキテクチャ。
  11. 前記イーサネットファブリックは、前記複数のストリーミングアレイの各ネットワークスイッチを前記ネットワークストレージ及び前記クラスタスイッチに通信可能に結合する、請求項に記載のネットワークアーキテクチャ。
  12. 前記複数のストリーミングアレイの前記対応するストリーミングアレイは、
    第2のPCIeファブリックを有し、前記第2のPCIeファブリックは、前記対応するネットワークスイッチ及び前記対応するアレイ管理サーバに対する、前記対応するストリーミングアレイの前記計算スレッドの前記計算ノードの間の直接通信を、低速ストレージワークロードまたはスレッド管理のために提供するように構成される、請求項に記載のネットワークアーキテクチャ。
  13. 前記対応するアレイ管理サーバは、前記対応するストリーミングアレイの前記計算スレッドの1つ以上の前記計算ノード上で実行されるクラウドゲームセッションを確立するように構成される、請求項に記載のネットワークアーキテクチャ。
  14. 前記対応するストリーミングアレイの前記計算スレッドのそれぞれは、
    対応するスレッドの1つ以上の対応する計算ノード及び対応するアレイレベルのPCIeスイッチに通信可能に結合された、対応するスレッドレベルのPCIeスイッチを有し、
    前記対応するスレッドレベルのPCIeスイッチは、前記対応するアレイレベルのPCIeスイッチを介して、前記第1のPCIeファブリックを通して、前記1つ以上の対応する計算ノードと前記ネットワークストレージとの間の通信を提供するように構成され、
    前記対応するスレッドレベルのPCIeスイッチは、スレッド管理のために、前記対応するストリーミングアレイの前記計算スレッドのそれぞれと前記対応するアレイ管理サーバとの間の通信を提供するように構成される、請求項に記載のネットワークアーキテクチャ。
  15. 前記対応するストリーミングアレイの前記計算スレッドの前記計算ノードのそれぞれは、前記対応するスレッド上の前記対応するスレッドレベルのPCIeスイッチとの通信を提供するように構成された対応するM.2ポートを有する、請求項14に記載のネットワークアーキテクチャ。
  16. 前記第1のPCIeファブリックは、前記ネットワークストレージと前記複数のストリーミングアレイの前記計算スレッドの前記計算ノードのうちの少なくとも1つとの間に最大毎秒5ギガバイトの帯域幅を提供する、請求項に記載のネットワークアーキテクチャ。
  17. 前記ネットワークストレージは、
    少なくとも1つのランダムアクセスメモリ(RAM)ドライブと、
    少なくとも1つの不揮発性メモリエクスプレス(NVMe)ドライブと、を有する、請求項に記載のネットワークアーキテクチャ。
  18. ネットワークアーキテクチャであって、
    ネットワークストレージを有し、
    複数のストリーミングアレイを有し、前記複数のストリーミングアレイ内の各ストリーミングアレイは複数の計算スレッドを含み、前記複数の計算スレッド内の各計算スレッドは1つ以上の計算ノードを含み、
    前記複数のストリーミングアレイのそれぞれの計算ノードから前記ネットワークストレージへの直接アクセスを提供するように構成された第1のPCI Express(PCIe)ファブリックを有し、前記第1のPCIeファブリックは複数のアレイレベルのPCIeスイッチを含み、前記複数のアレイレベルのPCIeスイッチ内の各アレイレベルのPCIeスイッチは対応するストリーミングアレイの計算スレッドの計算ノードに通信可能に結合され、前記ネットワークストレージに通信可能に結合され、
    計算スレッド及び計算ノード管理情報をストリーミングするために、前記複数のストリーミングアレイの計算スレッドの計算ノードを前記ネットワークストレージに通信可能に結合するように構成されたイーサネットファブリックを有し、
    前記ネットワークストレージは、前記複数のストリーミングアレイによって共有され、
    前記複数のストリーミングアレイの各計算ノードは、複数のゲームアプリケーションの1つ以上のインスタンスを実行するように構成され、
    前記複数のストリーミングアレイの前記対応するストリーミングアレイは、
    前記対応するストリーミングアレイ内の前記計算スレッドを管理するように構成された、対応するアレイ管理サーバを有し、
    対応するネットワークスイッチを有し、前記対応するネットワークスイッチは、前記計算スレッド及び計算ノード管理情報をストリーミングするために、前記イーサネットファブリックを介して前記対応するアレイ管理サーバを介して、前記対応するストリーミングアレイの前記計算スレッドの前記計算ノードから前記ネットワークストレージへの通信を提供し、前記イーサネットファブリックを介した通信を、前記ネットワークアーキテクチャの外部にあるネットワーク通信を提供するクラスタスイッチに提供するように構成され、
    前記対応するアレイ管理サーバは、前記対応するストリーミングアレイの前記計算スレッドの1つ以上の前記計算ノードで実行されるクラウドゲーミングセッションを確立するように構成される、ネットワークアーキテクチャ。
  19. ネットワークストレージを有し、
    複数のストリーミングアレイを有し、前記複数のストリーミングアレイの各ストリーミングアレイは複数の計算スレッドを含み、前記複数の計算スレッド内の各計算スレッドは1つ以上の計算ノードを含み、
    前記複数のストリーミングアレイのそれぞれの計算ノードから前記ネットワークストレージへの直接アクセスを提供するように構成された第1のPCI Express(PCIe)ファブリックを有し、前記第1のPCIeファブリックは複数のアレイレベルのPCIeスイッチを含み、前記複数のアレイレベルのPCIeスイッチの各アレイレベルのPCIeスイッチは対応するストリーミングアレイの計算スレッドの計算ノードに通信可能に結合され、前記ネットワークストレージに通信可能に結合され、
    計算スレッド及び計算ノード管理情報をストリーミングするために、前記複数のストリーミングアレイの計算スレッドの計算ノードを前記ネットワークストレージに通信可能に結合するように構成されたイーサネットファブリックを有し、
    前記ネットワークストレージは、前記複数のストリーミングアレイによって共有され、
    前記複数のストリーミングアレイの各計算ノードは、複数のゲームアプリケーションの1つ以上のインスタンスを実行するように構成され、
    前記第1のPCIeファブリックは、前記ネットワークストレージと前記複数のストリーミングアレイの前記計算スレッドの前記計算ノードのうちの少なくとも1つとの間に最大毎秒5ギガバイトの帯域幅を提供する、ネットワークアーキテクチャ。
  20. ネットワークストレージを有し、
    複数のストリーミングアレイを有し、前記複数のストリーミングアレイの各ストリーミングアレイは複数の計算スレッドを含み、前記複数の計算スレッド内の各計算スレッドは1つ以上の計算ノードを含み、
    前記複数のストリーミングアレイのそれぞれの計算ノードから前記ネットワークストレージへの直接アクセスを提供するように構成された第1のPCI Express(PCIe)ファブリックを有し、前記第1のPCIeファブリックは複数のアレイレベルのPCIeスイッチを含み、前記複数のアレイレベルのPCIeスイッチの各アレイレベルのPCIeスイッチは対応するストリーミングアレイの計算スレッドの計算ノードに通信可能に結合され、前記ネットワークストレージに通信可能に結合され、
    前記ネットワークストレージは、前記複数のストリーミングアレイによって共有され、
    前記複数のストリーミングアレイのそれぞれの前記計算ノードは、複数のゲームアプリケーションの1つ以上のインスタンスを実行するように構成され、
    前記第1のPCIeファブリックは、前記ネットワークストレージと前記複数のストリーミングアレイのぞれぞれの前記計算ノードのうちの少なくとも1つとの間に最大毎秒5ギガバイトの帯域幅を提供する、ネットワークアーキテクチャ。
JP2022549013A 2020-02-14 2021-02-12 計算ノードとストレージサーバ間のPCI Expressファブリックを介した高速ストレージアクセスを提供するネットワークアーキテクチャ Active JP7242968B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2023035545A JP2023071941A (ja) 2020-02-14 2023-03-08 ラックアセンブリ及びネットワークアーキテクチャ

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US202062977138P 2020-02-14 2020-02-14
US62/977,138 2020-02-14
US16/945,635 US11321259B2 (en) 2020-02-14 2020-07-31 Network architecture providing high speed storage access through a PCI express fabric between a compute node and a storage server
US16/945,635 2020-07-31
PCT/US2021/017894 WO2021163517A1 (en) 2020-02-14 2021-02-12 Network architecture providing high speed storage access through a pci express fabric between a compute node and a storage server

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2023035545A Division JP2023071941A (ja) 2020-02-14 2023-03-08 ラックアセンブリ及びネットワークアーキテクチャ

Publications (2)

Publication Number Publication Date
JP2023506585A JP2023506585A (ja) 2023-02-16
JP7242968B2 true JP7242968B2 (ja) 2023-03-20

Family

ID=74867633

Family Applications (3)

Application Number Title Priority Date Filing Date
JP2022549013A Active JP7242968B2 (ja) 2020-02-14 2021-02-12 計算ノードとストレージサーバ間のPCI Expressファブリックを介した高速ストレージアクセスを提供するネットワークアーキテクチャ
JP2022549015A Active JP7522204B2 (ja) 2020-02-14 2021-02-13 計算ノードと計算ノードのアレイの中のストレージサーバとの間でのpciエクスプレスファブリックによる高速ストレージアクセスを提供するネットワークアーキテクチャ
JP2023035545A Pending JP2023071941A (ja) 2020-02-14 2023-03-08 ラックアセンブリ及びネットワークアーキテクチャ

Family Applications After (2)

Application Number Title Priority Date Filing Date
JP2022549015A Active JP7522204B2 (ja) 2020-02-14 2021-02-13 計算ノードと計算ノードのアレイの中のストレージサーバとの間でのpciエクスプレスファブリックによる高速ストレージアクセスを提供するネットワークアーキテクチャ
JP2023035545A Pending JP2023071941A (ja) 2020-02-14 2023-03-08 ラックアセンブリ及びネットワークアーキテクチャ

Country Status (5)

Country Link
US (5) US11321259B2 (ja)
EP (2) EP4104394A1 (ja)
JP (3) JP7242968B2 (ja)
CN (2) CN115211094B (ja)
WO (2) WO2021163517A1 (ja)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20230325343A1 (en) * 2016-07-26 2023-10-12 Samsung Electronics Co., Ltd. Self-configuring ssd multi-protocol support in host-less environment
US11321259B2 (en) * 2020-02-14 2022-05-03 Sony Interactive Entertainment Inc. Network architecture providing high speed storage access through a PCI express fabric between a compute node and a storage server
US11782833B2 (en) * 2020-03-12 2023-10-10 Samsung Electronics Co., Ltd. System and method of determining available bandwidth in disaggregated tiered cache for cloud content storage
US11765235B2 (en) 2020-03-12 2023-09-19 Samsung Electronics Co., Ltd. System and method of disk sharing for cloud content storage
US11470327B2 (en) * 2020-03-30 2022-10-11 Alibaba Group Holding Limited Scene aware video content encoding
CN113434090B (zh) * 2021-06-30 2023-03-28 同济大学 一种用于高速视频测量的海量数据异步存储方法
KR20230068477A (ko) * 2021-11-10 2023-05-18 주식회사 이노그리드 보드형 컴퓨팅 노드들을 이용한 고성능 클라우드 분리 운영 방법 및 그 시스템
US20230176988A1 (en) * 2021-12-03 2023-06-08 Pixart Imaging Inc. Detection system sending calculated data and raw data
US20230199062A1 (en) * 2021-12-22 2023-06-22 Sony Interactive Entertainment Inc. Data center wide network storage load balancing
CN114553899A (zh) * 2022-01-30 2022-05-27 阿里巴巴(中国)有限公司 一种存储设备
US12045627B2 (en) 2022-03-14 2024-07-23 Sony Interactive Entertainment Inc. Sled level boot management control of compute nodes for context switching using boot controllers
US11930611B2 (en) * 2022-07-29 2024-03-12 Dell Products, L.P. Configurable chassis supporting replaceable hardware accelerator baseboards

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150281126A1 (en) 2014-03-31 2015-10-01 Plx Technology, Inc. METHODS AND APPARATUS FOR A HIGH PERFORMANCE MESSAGING ENGINE INTEGRATED WITHIN A PCIe SWITCH
JP2015197805A (ja) 2014-04-01 2015-11-09 株式会社ソニー・コンピュータエンタテインメント プロセッシングシステムおよびマルチプロセッシングシステム
JP2017182791A (ja) 2016-03-07 2017-10-05 廣達電腦股▲ふん▼有限公司 スケーラブルプールNVMeストレージボックス(a scalable pooled nvme storage box)
US20180361237A1 (en) 2007-12-05 2018-12-20 Sony Interactive Entertainment America Llc Method for Multicasting Views of Real-Time Streaming Interactive Video
US20190140838A1 (en) 2018-12-28 2019-05-09 Intel Corporation Technologies for providing certified telemetry data indicative of resources utilizations
WO2019112710A1 (en) 2017-12-05 2019-06-13 Sony Interactive Entertainment America Llc Ultra high-speed low-latency network storage
US10409524B1 (en) 2018-04-25 2019-09-10 Advanced Micro Devices, Inc. Dynamic memory traffic optimization in multi-client systems

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7237036B2 (en) * 1997-10-14 2007-06-26 Alacritech, Inc. Fast-path apparatus for receiving data corresponding a TCP connection
US6771264B1 (en) * 1998-08-20 2004-08-03 Apple Computer, Inc. Method and apparatus for performing tangent space lighting and bump mapping in a deferred shading graphics processor
US7031838B1 (en) * 2003-03-25 2006-04-18 Integrated Environmental Services. Inc. System and method for a cradle-to-grave solution for investigation and cleanup of hazardous waste impacted property and environmental media
JP4725719B2 (ja) 2005-03-28 2011-07-13 日本電気株式会社 ブレードサーバシステムおよびその管理方法
US7984454B2 (en) 2006-12-19 2011-07-19 International Business Machines Corporation Migration of single root stateless virtual functions
US8392661B1 (en) * 2009-09-21 2013-03-05 Tilera Corporation Managing cache coherence
JP4911230B2 (ja) * 2010-02-01 2012-04-04 カシオ計算機株式会社 撮影装置、並びに制御プログラム及び制御方法
US8830228B2 (en) * 2010-12-20 2014-09-09 Microsoft Corporation Techniques for enabling remote management of servers configured with graphics processors
US9432298B1 (en) * 2011-12-09 2016-08-30 P4tents1, LLC System, method, and computer program product for improving memory systems
US9141568B2 (en) * 2011-08-25 2015-09-22 Apple Inc. Proportional memory operation throttling
US9609782B2 (en) * 2013-01-15 2017-03-28 Intel Corporation Rack assembly structure
US9075557B2 (en) * 2013-05-15 2015-07-07 SanDisk Technologies, Inc. Virtual channel for data transfers between devices
CN103281260A (zh) * 2013-05-20 2013-09-04 华为技术有限公司 支持PCIe的系统、设备及其资源分配方法
US9224187B2 (en) * 2013-09-27 2015-12-29 Apple Inc. Wavefront order to scan order synchronization
US20170105313A1 (en) * 2015-10-10 2017-04-13 Ebullient, Llc Multi-chamber heat sink module
US10489328B2 (en) 2015-09-25 2019-11-26 Quanta Computer Inc. Universal sleds server architecture
US10929232B2 (en) 2017-05-31 2021-02-23 Intel Corporation Delayed error processing
US20190068466A1 (en) * 2017-08-30 2019-02-28 Intel Corporation Technologies for auto-discovery of fault domains
CN107645457A (zh) * 2017-10-19 2018-01-30 济南浪潮高新科技投资发展有限公司 一种PCIe交换机系统和方法
GB2569604B (en) * 2017-12-21 2020-06-03 Advanced Risc Mach Ltd Controlling reading and writing of data streams in data processing systems
US10877792B2 (en) * 2017-12-29 2020-12-29 Virtual Instruments Corporation Systems and methods of application-aware improvement of storage network traffic
KR102637166B1 (ko) * 2018-04-17 2024-02-16 삼성전자주식회사 대용량 데이터를 저장하는 네트워크 스토리지 장치
US20200364303A1 (en) * 2019-05-15 2020-11-19 Nvidia Corporation Grammar transfer using one or more neural networks
US11311800B2 (en) * 2019-08-09 2022-04-26 Sony Interactive Entertainment LLC Systems implementing high-speed data communication fabric for cloud gaming data storage and retrieval
US20200021492A1 (en) 2019-09-23 2020-01-16 Intel Corporation Technologies for storage cluster rebuild service traffic management
US11321259B2 (en) * 2020-02-14 2022-05-03 Sony Interactive Entertainment Inc. Network architecture providing high speed storage access through a PCI express fabric between a compute node and a storage server

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180361237A1 (en) 2007-12-05 2018-12-20 Sony Interactive Entertainment America Llc Method for Multicasting Views of Real-Time Streaming Interactive Video
US20150281126A1 (en) 2014-03-31 2015-10-01 Plx Technology, Inc. METHODS AND APPARATUS FOR A HIGH PERFORMANCE MESSAGING ENGINE INTEGRATED WITHIN A PCIe SWITCH
JP2015197805A (ja) 2014-04-01 2015-11-09 株式会社ソニー・コンピュータエンタテインメント プロセッシングシステムおよびマルチプロセッシングシステム
JP2017182791A (ja) 2016-03-07 2017-10-05 廣達電腦股▲ふん▼有限公司 スケーラブルプールNVMeストレージボックス(a scalable pooled nvme storage box)
WO2019112710A1 (en) 2017-12-05 2019-06-13 Sony Interactive Entertainment America Llc Ultra high-speed low-latency network storage
US10409524B1 (en) 2018-04-25 2019-09-10 Advanced Micro Devices, Inc. Dynamic memory traffic optimization in multi-client systems
US20190140838A1 (en) 2018-12-28 2019-05-09 Intel Corporation Technologies for providing certified telemetry data indicative of resources utilizations

Also Published As

Publication number Publication date
WO2021163646A1 (en) 2021-08-19
EP4104395A1 (en) 2022-12-21
US11321259B2 (en) 2022-05-03
CN115211095A (zh) 2022-10-18
US12007924B2 (en) 2024-06-11
US20220253394A1 (en) 2022-08-11
WO2021163517A1 (en) 2021-08-19
US11645218B2 (en) 2023-05-09
CN115211094A (zh) 2022-10-18
JP2023071941A (ja) 2023-05-23
CN115211094B (zh) 2024-06-14
US20230273889A1 (en) 2023-08-31
US20240330219A1 (en) 2024-10-03
JP2023506585A (ja) 2023-02-16
EP4104394A1 (en) 2022-12-21
US20210255979A1 (en) 2021-08-19
JP2023524342A (ja) 2023-06-12
US20210255970A1 (en) 2021-08-19
JP7522204B2 (ja) 2024-07-24

Similar Documents

Publication Publication Date Title
JP7242968B2 (ja) 計算ノードとストレージサーバ間のPCI Expressファブリックを介した高速ストレージアクセスを提供するネットワークアーキテクチャ
US9779463B2 (en) Local management for intermediary graphics rendition
CN107231815B (zh) 用于图形渲染的系统和方法
CN111420397A (zh) 用于云游戏的游戏状态保存、传输和恢复
CN104735123B (zh) 用于云计算的大容量存储虚拟化
EP4143688B1 (en) System and method for efficient multi-gpu execution of kernels by region based dependencies
US20150273329A1 (en) Game Providing System
US20180095799A1 (en) Method for managing graphic cards in a computing system
WO2023107283A1 (en) Network storage game allocation based on artificial intelligence
Li et al. The implementation of a GPU-accelerated virtual desktop infrastructure platform
US12045627B2 (en) Sled level boot management control of compute nodes for context switching using boot controllers
CN115913953A (zh) 一种云资源加速方法、装置及其介质
US20230199062A1 (en) Data center wide network storage load balancing
US20240226730A9 (en) Scalable data center platform for cloud gaming and metaverse
KR20110039115A (ko) 멀티유저 컴퓨팅 시스템
KR20110086792A (ko) 멀티유저 컴퓨터 시스템

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221005

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20221005

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20221005

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230207

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230308

R150 Certificate of patent or registration of utility model

Ref document number: 7242968

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150