JP2015197805A - Processing system and multi-processing system - Google Patents
Processing system and multi-processing system Download PDFInfo
- Publication number
- JP2015197805A JP2015197805A JP2014075605A JP2014075605A JP2015197805A JP 2015197805 A JP2015197805 A JP 2015197805A JP 2014075605 A JP2014075605 A JP 2014075605A JP 2014075605 A JP2014075605 A JP 2014075605A JP 2015197805 A JP2015197805 A JP 2015197805A
- Authority
- JP
- Japan
- Prior art keywords
- data
- processing system
- input
- gpu
- memory
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012545 processing Methods 0.000 title claims abstract description 256
- 230000015654 memory Effects 0.000 claims abstract description 89
- 238000012546 transfer Methods 0.000 claims abstract description 35
- 238000004891 communication Methods 0.000 claims description 12
- 230000006835 compression Effects 0.000 claims description 6
- 238000007906 compression Methods 0.000 claims description 6
- 239000000758 substrate Substances 0.000 claims description 5
- 230000004044 response Effects 0.000 claims description 4
- 230000026676 system process Effects 0.000 claims description 2
- 238000005516 engineering process Methods 0.000 abstract description 3
- 238000000034 method Methods 0.000 description 17
- 230000008569 process Effects 0.000 description 13
- 238000010586 diagram Methods 0.000 description 11
- 238000004364 calculation method Methods 0.000 description 8
- 230000008859 change Effects 0.000 description 5
- 230000007423 decrease Effects 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 238000009877 rendering Methods 0.000 description 3
- 238000004590 computer program Methods 0.000 description 2
- 230000006837 decompression Effects 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 235000008694 Humulus lupulus Nutrition 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F13/00—Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
- G06F13/38—Information transfer, e.g. on bus
- G06F13/40—Bus structure
- G06F13/4004—Coupling between buses
- G06F13/4027—Coupling between buses using bus bridges
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F13/00—Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
- G06F13/14—Handling requests for interconnection or transfer
- G06F13/20—Handling requests for interconnection or transfer for access to input/output bus
- G06F13/28—Handling requests for interconnection or transfer for access to input/output bus using burst mode transfer, e.g. direct memory access DMA, cycle steal
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F13/00—Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
- G06F13/38—Information transfer, e.g. on bus
- G06F13/42—Bus transfer protocol, e.g. handshake; Synchronisation
- G06F13/4204—Bus transfer protocol, e.g. handshake; Synchronisation on a parallel bus
- G06F13/4221—Bus transfer protocol, e.g. handshake; Synchronisation on a parallel bus being an input/output bus, e.g. ISA bus, EISA bus, PCI bus, SCSI bus
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Hardware Design (AREA)
- Multi Processors (AREA)
- Bus Control (AREA)
- Information Transfer Systems (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Abstract
Description
本発明は、プロセッシングシステムおよびマルチプロセッシングシステムに関する。 The present invention relates to a processing system and a multiprocessing system.
近年、インターネットをはじめとするネットワークの通信技術が急速に発達し、ユーザがネットワークを経由して様々なアプリケーションの提供を受ける、いわゆるクラウドサービスが提供されるようになってきた。このようなクラウドサービスの中には、ゲームアプリケーションをクラウドサーバ上で実行し、実行結果をネットワークを介してクライアント装置にストリーミング配信するクラウドゲーミングサービスも実現されている。 In recent years, communication technologies for networks such as the Internet have rapidly developed, and so-called cloud services in which users are provided with various applications via networks have come to be provided. Among such cloud services, a cloud gaming service is also realized in which a game application is executed on a cloud server and an execution result is streamed and distributed to a client device via a network.
一方、近年のプロセッサ技術の進歩は著しく、汎用の演算処理を担うCPU(Central Processing Unit)のみならず、画像処理を主に担当するGPU(Graphics Processing Unit)の性能も向上してきている。これらプロセッサの性能向上に応じて、ゲームアプリケーションが提供する映像を生成するために要する演算量も増加している。 On the other hand, recent advances in processor technology are remarkable, and not only the CPU (Central Processing Unit) responsible for general-purpose arithmetic processing, but also the performance of GPU (Graphics Processing Unit) mainly responsible for image processing. As the performance of these processors improves, the amount of computation required to generate video provided by the game application is also increasing.
クラウドゲーミングサービスを実現するためには、複数のユーザそれぞれに対して異なるアプリケーションを提供するために、複数のゲーム提供サーバが必要となる。当然ながら、ゲームアプリケーションを実行するためのプロセッシングシステムも複数存在することになる。 In order to realize a cloud gaming service, a plurality of game providing servers are required to provide different applications to a plurality of users. Of course, there are a plurality of processing systems for executing the game application.
本願の発明者は、複数のプロセッシングシステムを備えるサーバにおいて、ひとつのアプリケーションを複数のプロセッシングシステムで協働で実行させることにより、アプリケーションを1つのプロセッシングシステムで実行させる場合と比較して、高画質のサービスを提供することができる可能性について認識した。このとき、複数のプロセッシングシステムでの協働作業を効率化するために、プロセッシングシステム間でのデータ転送のレイテンシを低減する必要性について認識するに至った。 The inventor of the present application, in a server having a plurality of processing systems, allows a single application to be executed in cooperation with a plurality of processing systems, thereby achieving high image quality compared to a case in which an application is executed by a single processing system. Recognized the possibility of being able to provide services. At this time, in order to make collaborative work in a plurality of processing systems efficient, the necessity of reducing the latency of data transfer between the processing systems has been recognized.
本発明はこうした課題に鑑みてなされたものであり、その目的は、複数のプロセッシングシステムでアプリケーションを協働で実行させるときに、プロセッシングシステム間のデータ転送のレイテンシを低減する技術を提供することにある。 The present invention has been made in view of these problems, and an object of the present invention is to provide a technique for reducing latency of data transfer between processing systems when an application is executed in cooperation with a plurality of processing systems. is there.
上記課題を解決するために、本発明のある態様のプロセッシングシステムは、映像を生成するGPUと、データを格納するメモリと、GPUとメモリとを接続するデータバスと、データバスと接続するDMA(Direct Memory Access)コントローラと、データバスと接続するとともに、プロセッシングシステムと協働する外部のプロセッシングシステムとの間でデータの送受信をするための外部バスとも接続する入出力ブリッジと、GPUとの間でメモリが格納するデータを共有するCPUとを備える。GPUは、CPUを介さずに、DMAコントローラに対してメモリが格納するデータのデータ転送命令を発行し、DMAコントローラは、データ転送命令を受信すると、入出力ブリッジに、外部のプロセッシングシステムへメモリが格納するデータを転送させる。 In order to solve the above-described problems, a processing system according to an aspect of the present invention includes a GPU that generates video, a memory that stores data, a data bus that connects the GPU and the memory, and a DMA ( Direct Memory Access) between the GPU and the input / output bridge that connects to the controller and the data bus and also connects to the external bus for sending and receiving data to and from the external processing system that cooperates with the processing system And a CPU that shares data stored in the memory. The GPU issues a data transfer instruction for data stored in the memory to the DMA controller without going through the CPU. When the DMA controller receives the data transfer instruction, the memory is sent to the input / output bridge to the external processing system. Transfer the data to be stored.
なお、以上の構成要素の任意の組合せ、本発明の少なくとも一部の表現を方法、装置、システム、コンピュータプログラム、データ構造、記録媒体などの間で変換したものもまた、本発明の態様として有効である。コンピュータプログラムは、画像プロセッサを実現するハードウェア資源の基本的な制御を行なうために機器に組み込まれるファームウェアの一部として提供されてもよい。このファームウェアは、たとえば、機器内のROM(Read Only Memory)やフラッシュメモリなどの半導体メモリに格納される。このファームウェアを提供するため、あるいはファームウェアの一部をアップデートするために、このプログラムを記録したコンピュータ読み取り可能な記録媒体が提供されてもよく、また、このプログラムが通信回線で伝送されてもよい。 Note that any combination of the above components and at least a part of the expression of the present invention converted between a method, an apparatus, a system, a computer program, a data structure, a recording medium, etc. are also effective as an aspect of the present invention. It is. The computer program may be provided as part of firmware incorporated in the device to perform basic control of hardware resources that implement the image processor. This firmware is stored in a semiconductor memory such as a ROM (Read Only Memory) or a flash memory in the device, for example. In order to provide the firmware or to update a part of the firmware, a computer-readable recording medium storing the program may be provided, and the program may be transmitted through a communication line.
本発明によれば、複数のプロセッシングシステムでアプリケーションを協働で実行させるときに、プロセッシングシステム間のデータ転送のレイテンシを低減する技術を提供する技術を提供することができる。 According to the present invention, it is possible to provide a technique that provides a technique for reducing the latency of data transfer between processing systems when an application is executed in cooperation by a plurality of processing systems.
図1は、実施の形態に係るアプリケーション提供システム10の全体構成を模式的に示す図である。図1においては、クライアント装置500と総称する複数のクライアント装置500のうち、クライアント装置500aと500bとが図示されている。クライアント装置500は、インターネット等のネットワーク400を介してログインサーバ300と接続している。
FIG. 1 is a diagram schematically showing an overall configuration of an
ログインサーバ300は、ネットワーク400を介して接続するクライアント装置500を利用するユーザのアカウントを管理する。ログインサーバ300は、アプリケーション提供システム10に登録しているユーザのユーザ名やパスワード等を格納する図示しないデータベースを参照し、ユーザのログイン処理およびログオフ処理を担当する。
The
図1においては、ブレードサーバ200と総称する複数のブレードサーバ200のうち、ブレードサーバ200aと200bとが図示されている。ブレードサーバ200は、クライアント装置500に提供するためのアプリケーションを実行するサーバである。割当サーバ100は、複数のブレードサーバ200の中から、クライアント装置500に提供するためのアプリケーションを実行するブレードサーバ200を割当て、アプリケーションプログラムを実行させる。なお、割当サーバ100における割当処理の詳細は後述する。
FIG. 1 illustrates
クライアント装置500は、ほとんどの場合CPU等の計算リソースを持っており、アプリケーションプログラムの少なくとも一部をクライアント装置500のローカルな環境で実行することも可能である。しかしながら、クライアント装置500を利用するユーザにとっては、アプリケーションがローカルな計算リソースで実行されるか、あるいはネットワーク上のアプリケーション提供システム10の計算リソースで実行されるかは重要な問題ではなく、サービスを利用できるという点では同じである。クライアント装置500は、例えば、PC(Personal Computer)、据え置き型のゲームコンソール、携帯ゲーム機、スマートフォン、タブレットPC、ファブレット、電子書籍端末、電子辞書、携帯音楽プレイヤ、携帯型ワンセグテレビ等を用いて実現できる。
In most cases, the client device 500 has a calculation resource such as a CPU, and at least a part of the application program can be executed in a local environment of the client device 500. However, for the user who uses the client device 500, whether the application is executed with the local calculation resource or the calculation resource of the
図1は、ネットワーク400を介してクライアント装置500とログインサーバ300とが接続している様子を図示しており、現実のシステム構成を模式的に図示するものである。しかしながら、クライアント装置500を利用するユーザは、ネットワーク400を含め、ログインサーバ300、割当サーバ100等のシステム構成を認識することはあまりない。アプリケーション提供システム10を利用するユーザの立場から見ると、サービスの提供を受ける上でアプリケーション提供システム10の物理構成やソフトウェア構成等を理解する必要はなく、あたかもネットワークの雲(Cloud;クラウド)の中から出てきたサービスを利用するかのような印象を受ける。図1に示すアプリケーション提供システム10は、クラウドゲーミングシステムを構成する。
FIG. 1 illustrates a state in which a client device 500 and a
以下、実施の形態に係るアプリケーション提供システム10において、ブレードサーバ200は、専用のハードウェアであるゲームコンソール上で実行されることを前提として開発されたゲームコンテンツを実行する場合について説明する。この意味で、ブレードサーバ200はゲーム提供サーバとして機能する。しかしながら、ブレードサーバ200が実行するコンテンツはゲームに限られず、例えばSNS(Social Networking Service)、動画閲覧サービス等、ゲーム以外のジャンルのコンテンツを実行する場合も本実施の形態に含まれる。
Hereinafter, in the
図2は、実施の形態に係るブレードサーバ200の内部構成を模式的に示す図である。図2に示すように、ひとつのブレードサーバ200は、筐体内に16個のブレード(Blade)600を搭載することができる。実施の形態に係るブレードサーバ200は16個のブレード600を備える。図2においては、16個のブレード600は、ブレード600a〜600pとして図示されている。以下、特に区別をする場合を除き、複数のブレード600を単に「ブレード600」と総称する。ブレード600は、単体でアプリケーション提供サーバを構成し、アプリケーションプログラムの実行に16個のブレード600を必ずしも必要としない。また、実施の形態に係るブレードサーバ200が備えるブレード600の数は16個に限られず、複数のブレード600を備えていればよい。
FIG. 2 is a diagram schematically illustrating an internal configuration of the
図2に示すように、1つのブレード600は、4つのプロセッシングシステム700a〜700d(以下、特に区別する場合を除き、単に「プロセッシングシステム700」と総称する。)の他、電源ポート610、入出力ポート620、および通信ポート630を同一基板上に備える。
As shown in FIG. 2, one
上述したように、実施の形態に係るブレードサーバ200は、専用のハードウェアであるゲームコンソールで実行されることを前提として開発されたゲームコンテンツを実行する。ブレード600を構成する基板上に配置された4つのプロセッシングシステム700a〜700dは、それぞれ単体でゲームコンソールが備えるプロセッシングシステムと同等の性能をもつプロセッシングシステムである。
As described above, the
一般に、専用のゲームコンソール向けに開発されるゲームタイトルは、プロセッサやメモリ等のハードウェアリソースに対して、高度に最適化されている。このため、ひとつのプロセッサはひとつのゲームタイトルを実行するために占有され、プロセッサが単体で複数のゲームタイトルを同時に実行するのは困難である。実施の形態に係るプロセッシングシステム700も、単体で最大ひとつのゲームアプリケーションを実行可能なゲームプロセッシングシステムである。実施の形態に係るブレード600は、このようなプロセッシングシステム700を複数有し、マルチプロセッシングシステムを構成する。
In general, game titles developed for dedicated game consoles are highly optimized for hardware resources such as processors and memories. For this reason, one processor is occupied to execute one game title, and it is difficult for a single processor to execute a plurality of game titles simultaneously. The
電源ポート610は、ブレード600が有するプロセッシングシステム700に電力を供給する。入出力ポート620は、他のブレード600とデータを送受信するためのポートであり、例えばPCI Express等の既知の入出力インタフェースを用いて実現できる。通信ポート630は、割当サーバ100から、ゲームアプリケーションを実行するプロセッシングシステム700の割当指示を受信するポートである。通信ポート630は、例えばイーサネット(登録商標)等の既知のLAN(Local Area Network)規格に則ったLANポートを用いて実現できる。
The power port 610 supplies power to the
図3は、実施の形態に係るプロセッシングシステム700の回路構成を模式的に示す図である。実施の形態に係るプロセッシングシステム700は、CPU710、GPU724、メモリ726、メモリ制御部714、ブリッジ712、DMAコントローラ716、入出力ブリッジ722、GPUバス718、およびCPUバス720を備える。
FIG. 3 is a diagram schematically illustrating a circuit configuration of the
GPU724は、クライアント装置500に提供するゲームアプリケーションの映像を生成する。GPU724は、GPUバス718を介してメモリ726に接続している。メモリ726は、GPU724が出力したデータを格納する。
The
CPU710は、CPUバス720を介してメモリ726と接続している。CPU710はまた、GPUバス718を介してGPU724とも接続している。CPU710は、これらのバスとはブリッジ12を介して接続する。また、メモリ726はGPUバス718とCPUバス720とに接続する。このため、メモリ726におけるCPU710またはGPU724との間でのデータのやりとりは、メモリ制御部714を介して実行する。CPU710とGPU724とはメモリ726を共有し、メモリ726を介してデータを共有する。GPUバス718とCPUバス720とはともに、データ交換に用いられるデータバスとして機能する。
The
DMAコントローラ716は、GPUバス718と接続する。入出力ブリッジ722はGPUバス718と接続し、外部のプロセッシングシステム700との間でデータの送受信をするためのインタフェースとなる。DMAコントローラ716はGPUバス718と接続しており、CPU710を介さず、GPU724の制御の下、メモリ726に格納されているデータを外部のプロセッシングシステム700に転送することができる。
The
図4は、異なるプロセッシングシステム700間のデータ転送を説明するための図である。図4に示す例では、2つの異なるプロセッシングシステム700aおよび700bが、入出力ブリッジ722aおよび722bを介して接続している。より具体的に、プロセッシングシステム700aが備える入出力ブリッジ722aは、他のプロセッシングシステム700との間でデータを送受信するための複数の入出力ポート730a、731a、732a、および733aを備える。同様にプロセッシングシステム700bが備える730bも、複数の入出力ポート730b、731b、732b、および733bを備える。プロセッシングシステム700aおよび700bは、入出力ポート730aおよび入出力ポート730bを介して接続している。
FIG. 4 is a diagram for explaining data transfer between
図4において、プロセッシングシステム700aはプロセッシングシステム700bの他、入出力ポート732aを介してプロセッシングシステム700cと接続し、入出力ポート733aを介してプロセッシングシステム700dとも接続している。また、プロセッシングシステム700bは、プロセッシングシステム700aの他、入出力ポート731b、732、および733bを介して、それぞれプロセッシングシステム700c、700d、および700eとも接続している。このように、入出力ポートを介して異なるプロセッシングシステム700間を接続するバスが、それらのプロセッシングシステム700間でデータを送受信するための外部バスとして機能する。
In FIG. 4, in addition to the
なお、入出力ブリッジ722は、DMAコントローラ716を経由したアクセスだけでなく、特定範囲の物理メモリに各入出力ポートをマッピングして、GPUバス718に流れるコマンドをリモートノード(他のプロセッシングシステム700)のGPUバス718に流すこともできる。入出力ブリッジ722は、GPUバス718に接続され、物理メモリにマップされる。このため、CPU710やGPU724それぞれが、リモートノードのメモリ726に直接アクセスすることもできる。
The input /
以下、プロセッシングシステム700aとプロセッシングシステム700bとが、ひとつのゲームアプリケーションプログラムを協働して実行する場合を例に説明する。
Hereinafter, a case where the
実施の形態に係るプロセッシングシステム700において、GPU724は、CPU710の制御によらず、DMAコントローラ716に対してメモリ726が格納するデータのデータ転送命令を発行することができる。例えばGPU724aが、DMAコントローラ716aに対してメモリ726aが格納するデータを、プロセッシングシステム700bに転送することを指示するデータ転送命令を発行したとする。データ転送命令を発行する契機としては、GPU724aが自発的にデータ転送命令を発行する場合もある。あるいは、プロセッシングシステム700bがブロードキャストしたデータ読み出し命令に応答して、データ転送命令を発行する場合もある。いずれにしても、DMAコントローラ716aは、データ転送命令を受信すると、入出力ブリッジ722に、プロセッシングシステム700bへメモリ726が格納するデータを転送させる。
In the
プロセッシングシステム700b内のDMAコントローラ716bは、入出力ブリッジ722bを介して、プロセッシングシステム700aから転送されたデータを受信する。続いてDMAコントローラ716bは、受信したデータを、プロセッシングシステム700b内のメモリ726bに書き込む。
The DMA controller 716b in the
なお、プロセッシングシステム700b内のGPU724bが、プロセッシングシステム700a内のメモリ726aが格納するデータを取得する場合、まず、GPU724bが、CPU710bを介さずに、DMAコントローラ716bに対してデータ取得命令を発行する。DMAコントローラ716bは、データ取得命令を受信すると、入出力ブリッジ722bにデータの読み出し命令を発行する。入出力ブリッジ722bは、DMAコントローラ716bが発行したデータの読み出し命令を外部バスにブロードキャストする。プロセッシングシステム700aがこの命令に応答した後の動作は、上述と同様である。
When the
このように、GPU724は、メモリ726に格納されているデータを外部のプロセッシングシステム700に送信したり、外部のプロセッシングシステム700のデータを受信してメモリ726に格納したりすることができる。なお、複数のプロセッシングシステム700間でデータを共有しつつ処理することについて、詳細を後述する。
As described above, the
図5(a)−(c)は、ひとつのブレード600におけるプロセッシングシステム700の接続トポロジを模式的に示す図である。上述したように、ブレード600を構成する基板上に、同一の性能を持つプロセッシングシステム700a〜700dが実装されている。ここで、各プロセッシングシステム700内の入出力ブリッジ722a〜722dは、既知のPCI Expressを用いて実装されていることとする。
FIGS. 5A to 5C are diagrams schematically illustrating a connection topology of the
図示はしないが、ブレード600には、PCI Expressの動作を制御するシステムコントローラが実装されている。このシステムコントローラは、通信ポート630を介して割当サーバ100から接続関係を指示する命令を受信して、入出力ブリッジ722の接続を制御する。より具体的には、システムコントローラは、受信した命令に基づいて、PCI ExpressにおけるRoot ComplexおよびEndpointを設定した後、リセットをかけることで接続が確立する。接続が確立したプロセッシングシステム700同士はそれぞれメモリに格納したデータも共有し、同じゲームアプリケーションを協働して実行することが可能となる。
Although not shown, the
図5(a)は、2つのプロセッシングシステム700aおよび700bが接続している場合を示す図であり、図5(b)は、3つのプロセッシングシステム700a、700b、および700cが接続している場合を示す図である。また図5(c)は、4つのプロセッシングシステム700a、700b、700c、および700dが接続している場合を示す図である。各プロセッシングシステム700において入出力ブリッジ722は複数の入出力ポート(730、731、732、および733)備えるため、いずれの場合にしても、プロセッシングシステム700同士はポイント・ツー・ポイント(point-to-point)で接続する。これにより、プロセッシングシステム700はそれぞれ、1対1で通信可能となる。
FIG. 5A shows a case where two
図6は、複数のブレード600をまたがったプロセッシングシステム700間の接続トポロジを模式的に示す図である。図6は、4つのブレード600a、600b、600c、および600dが接続している場合の例を示している。各ブレード600内の4つのプロセッシングシステム700は、図5(c)に示す場合と同様に、互いにポイント・ツー・ポイントで接続している。
FIG. 6 is a diagram schematically showing a connection topology between the
4つのブレード600a、600b、600c、および600dはそれぞれ、各ブレードにおけるいずれかのプロセッシングシステム700が備える入出力ブリッジ722を介して、1対1で通信可能に接続される。例えば、ブレード600aとブレード600dとは、ブレード600a内のプロセッシングシステム700dの入出力ブリッジ722と、ブレード600d内のプロセッシングシステム700dの入出力ブリッジ722とを介して、互いにポイント・ツー・ポイントで接続する。プロセッシングシステム700dは、ブレード600a内においてプロセッシングシステム700a、700b、および700cとも接続するが、入出力ブリッジ722は4つの入出力ポート730、731、732、および733備えるため、4つの異なるプロセッシングシステム700と同時に接続することができる。
The four
16個のプロセッシングシステム700a〜700pを、図6に示す構成で接続する場合、任意の異なるプロセッシングシステム700同士は、最大でも3ホップ(hop)、すなわち、相手に到達するまでの間に経由するプロセッシングシステム700の数は最大でも3つとなる。これにより、16個のプロセッシングシステム700a〜700pが協働してひとつのゲームアプリケーションを実行する場合において、データの共有時におけるデータ転送の際のレイテンシを抑えることができる。
When 16
一般に、複数のGPUを協働して動作させる場合、GPUの描画処理をフレーム単位や領域単位に分割し、それぞれの描画タスクを複数のGPUに分散する。分散された複数の描画タスクをそれぞれのGPUが処理し、描画結果を1つのGPUに書き戻すのが主流である。これは、GPU間における描画結果の伝送に制約があるからである。 In general, when a plurality of GPUs are operated in cooperation, the GPU drawing processing is divided into frame units or region units, and each drawing task is distributed to a plurality of GPUs. The mainstream is that each GPU processes a plurality of distributed drawing tasks and writes the drawing result back to one GPU. This is because there are restrictions on the transmission of drawing results between GPUs.
例えば描画結果の伝送に専用バスが用いられる場合、専用バスは画像の伝送に最適化されたディスプレイインタフェースのようなものであるため、帯域保証はされる。しかしながら、バンド幅はある解像度以下の画像を伝送するのに必要な帯域に制限されうる。一方、描画結果の伝送にPCI Expressが用いられることもある。この場合、帯域が大きく専用インタフェースも必要ないが、その他のデータの伝送と混在するために帯域保証が困難となる。 For example, when a dedicated bus is used for transmitting drawing results, the dedicated bus is like a display interface optimized for image transmission, and thus the bandwidth is guaranteed. However, the bandwidth can be limited to a bandwidth necessary for transmitting an image having a certain resolution or less. On the other hand, PCI Express may be used for transmission of drawing results. In this case, the bandwidth is large and no dedicated interface is required, but it is difficult to guarantee the bandwidth because it is mixed with other data transmissions.
近年のGPUは、グラフィックス描画だけでなく従来CPUが担っていた物理演算やシミュレーションの一部をCPUに代わって並列処理することができるようになってきている。そのため、ゲームなどのリアルタイムアプリケーションでは、物理演算等をCPUとGPUとのそれぞれに適した処理に分割し、並列実行した後でその結果を描画処理に反映させるといったことが可能になってきている。しかしながら、例えばユーザによる入力を物理演算および描画に反映させる場合、フレーム単位での分散処理はレイテンシを増加させる要因になるため適さない。 In recent years, GPUs have been able to perform not only graphics rendering but also parallel processing on behalf of the CPU for a part of physical computations and simulations that have been performed by the CPU. For this reason, in real-time applications such as games, it has become possible to divide physics and the like into processes suitable for the CPU and GPU, and to reflect the results in the drawing process after executing them in parallel. However, for example, when reflecting user input in physical calculation and drawing, distributed processing in units of frames is a factor that increases latency, which is not suitable.
また1フレームの中で物理演算と描画を完了させる場合、CPUおよびGPUのインタラクションが1フレームの間に複数回発生する。例えば、1フレームを縦2、横2の4分割し、それぞれの領域を4つのGPUが描画する場合を考える。このとき、あるGPUが処理する領域に存在する移動物体の影が、その領域のみならず、別のGPUが処理する領域に映り込むこともありうる。この場合、移動物体の運動をCPUが処理し、その移動物体に起因する影を異なる2つのGPUが描画することになり、CPUおよびGPUのインタラクションが1フレームの間に複数回発生する。 In addition, when physics calculation and drawing are completed within one frame, the CPU and GPU interaction occur multiple times during one frame. For example, consider a case in which one frame is divided into four parts of 2 in the vertical direction and 2 in the horizontal direction, and each GPU draws each area. At this time, the shadow of a moving object existing in a region processed by a certain GPU may be reflected not only in that region but also in a region processed by another GPU. In this case, the movement of the moving object is processed by the CPU, and two different GPUs draw the shadow caused by the moving object, and the interaction between the CPU and the GPU occurs a plurality of times during one frame.
実施の形態に係るプロセッシングシステム700は、CPU710およびGPU724が1チップに統合されたシステムである。さらに、CPU710およびGPU724はメモリ726を共有する。このため、CPU710およびGPU724間が共通のデータを参照する際にメモリコピーが発生せず、レイテンシが短くなる。また、DMAコントローラ716はGPUバス718に接続され、GPU724の制御でデータ転送を実行できるため、入出力ポート732を介して接続される他のプロセッシングシステム700とともに分散処理する場合にも、通信と同期によるレイテンシが抑制できる。これにより、1フレーム内で複数回にわたって異なるGPU724やCPU710間でデータをやりとりする、リアルタイムによる分散処理が実現できる。
A
図7は、4つのプロセッシングシステム700a、700b、700c、および700dの協働時におけるメモリ726のメモリマップと処理の依存関係とを説明するための図である。図7において、記号「a」は、プロセッシングシステム700aのメモリ726のメモリマップであることを示す。記号Aで示すメモリ領域(以下、「領域A」という。)は、プロセッシングシステム700aのCPU710が、図示しないストレージから読み出したデータを格納する領域を示す。
FIG. 7 is a diagram for explaining the memory map of the
記号Bで示すメモリ領域(以下、「領域B」という。)は、領域Aのデータを使って、GPU724が演算処理した結果を格納するメモリ領域を示す。記号Cで示す領域(以下、「領域C」という。)は、領域Aのデータと領域Bのデータとの両方を用いて、GPU724が演算処理した結果を格納するメモリ領域を示す。記号Dで示す領域(以下、「領域D」という。)は、領域Cのデータが完全に揃った後に、そのデータを使ってCPU710が演算処理した結果を格納するメモリ領域である。記号FBで示す領域(以下、「領域FB」という。)は、領域Aのデータ、領域Bのデータ、および領域Dのデータを使って描画した結果を格納するフレームバッファ(Frame Buffer)を示す。
A memory area indicated by a symbol B (hereinafter referred to as “area B”) indicates a memory area in which the result of arithmetic processing by the
図8(a)−(e)は、4つのプロセッシングシステム700a、700b、700c、および700dの協働時におけるメモリマップの更新の流れの一例を示す図である。図8(a)から図8(e)の順に、メモリマップが更新される。
FIGS. 8A to 8E are diagrams illustrating an example of the flow of updating the memory map when the four
図8(a)−(e)において、記号「a」、「b」、「c」、および「d」は、それぞれプロセッシングシステム700a、700b、700c、および700dのメモリ726のメモリマップであることを示す。記号「A」、「B」、「C」、「D」、および「FB」で示すメモリ領域は、上述と同様である。
In FIG. 8 (a)-(e), the symbols “a”, “b”, “c”, and “d” are memory maps of the
図8は、4つのプロセッシングシステム700a、700b、700c、および700dで分散処理された結果が、プロセッシングシステム700dにまとめられる場合の例を示している。分散処理を実行するゲームプログラムおよびデータは、全てのプロセッシングシステム700からアクセス可能な共有ストレージ(図示せず)に格納されている。プログラムの実行は、それぞれのプロセッシングシステム700が共有ストレージから読み出して実行されるが、巨大なデータはプロセッシングシステム700d読み出した後は、入出力ブリッジ722dを介して他のすべてのプロセッシングシステム700にブロードキャストされる。共有されるデータは、全てのプロセッシングシステム700が同じアドレスにデータを共有するために、あらかじめ確保された領域Aが使われる。
FIG. 8 illustrates an example in which the results of distributed processing performed by the four
プロセッシングシステム700dは、テクスチャやプリミティブなどプログラムの実行に必要な全てのデータを共有ストレージから読み出す。プロセッシングシステム700dは、読み出したデータを領域Aに格納する。プロセッシングシステム700dは、共有ストレージからのデータの読み出しを継続するとともに、領域Aの内容を低プライオリティーの非圧縮データとして他のプロセッシングシステム700a、700b、および700cにブロードキャストする。これにより、図8(a)に示すように、4つのプロセッシングシステム700a、700b、700c、および700dは、それぞれの領域Aに共通のデータを格納する。
The
4つのプロセッシングシステム700a、700b、700c、および700dが、それぞれの領域Aに共通のデータを格納すると、プロセッシングシステム700dのCPU710は、プログラム実行開始を伝えるためのメッセージを他のプロセッシングシステム700a、700b、および700cに高プライオリティーで書き込む。プロセッシングシステム700a、700b、および700cではすでにGPU724が実行すべきタスクが実行されており、各GPU724はメッセージ領域(図示せず)をポーリング(Polling)している。
When the four
各GPU724がメッセージを検出すると、それぞれのメモリ726中の領域Aに格納されたデータを使い、各メモリ726中の領域Bに結果を出力する。図8(a)は、4つのプロセッシングシステム700a、700b、700c、および700dのそれぞれが、演算結果をそれぞれの領域Bに格納したことを示す。
When each
各GPU724が領域Bに結果を出力する時点で、各GPU724にはすでに次のコマンドが投入されている。GPU724に投入された次のコマンドは、領域Bの内容を他のプロセッシングシステム700におけるメモリ726中の領域Bにブロードキャストするための命令である。各DMAコントローラ716は、GPU724によって発行されたDMA命令にしたがって、領域Bの内容は、他のプロセッシングシステム700にブロードキャストする。これにより、各プロセッシングシステム700は、他のプロセッシングシステム700との間で、自身が処理した領域Bのデータを共有することができる。図8(b)は、各プロセッシングシステム700が領域Bのデータを共有した後、その時点で未処理であったデータをさらに処理した結果を示している。
When each
ここで実施の形態に係るDMAコントローラ716は、メモリ726が格納するデータの圧縮、入出力ブリッジ722が外部のプロセッシングシステム700から転送されたデータから受信したデータの伸張、およびGPU724またはCPU710が発行した命令の優先順位の制御を実行する。より具体的には、DMAコントローラ716は、受信した書き込み命令に圧縮オプションが設定された場合、メモリ726から読み出したデータを図示しない圧縮エンジンに転送する。圧縮エンジンで発生するレイテンシを隠ぺいするため、DMAコントローラ716は、他のコマンドインタフェースに入力されたリクエストを並列で処理する。
Here, the
DMAコントローラ716は、入出力ブリッジ722から圧縮データを受信すると、受信したデータを図示しない伸張エンジンに転送する。伸張エンジンは、伸張後のデータをメモリ726に書き込む。DMAコントローラ716は、入出力ブリッジ722から受け取った読み込み/書き込み命令の宛先がローカルノードの場合、コマンドをGPUバス718に流す。宛先がローカルノードではない場合、DMAコントローラ716は、その命令をエラーとして処理するか、宛先ノードに接続される入出力ポートにルーティング(Routing)する。
When receiving the compressed data from the input /
このように、異なるプロセッシングシステム700間でのデータ転送時にデータを圧縮することで、転送効率を高めることができる。
As described above, by compressing data when transferring data between
図8の説明に戻る。上述したとおり、領域Cは、領域Aのデータと領域Bのデータとの両方を用いて、GPU724が演算処理した結果を格納するメモリ領域である。領域Cに格納するデータを生成するGPUタスクは、領域Bに格納されたデータをポーリングしており、演算に必要なデータがそろうまで待機する。図8(b)は、領域Cに格納するデータを生成するためのデータがそろったため、各プロセッシングシステム700において領域Cのデータが生成され、格納されていることを示す。図8(c)は、各プロセッシングシステム700において生成された領域Cのデータが互いにブロードキャストされ、全てのプロセッシングシステム700が領域Cのデータを共有した場合を示している。
Returning to the description of FIG. As described above, the area C is a memory area that stores the result of calculation processing performed by the
ここで、他のプロセッシングシステム700から領域Bに書き込まれるデータは、DMAコントローラ716からGPUバス718を経由して書き込まれる。一方、領域Cに書き込むデータは、CPUバス720を経由して書き込まれる。また、他のプロセッシングシステム700にデータを書き込む場合もCPUバス720を経由してメモリに書き込むように、DMAコントローラ716に命令を発行してもよい。
Here, data to be written to the area B from another
プロセッシングシステム700dのCPU710は領域Cの書き込み完了割り込みを受け取ると、図8(c)に示すように、領域Cのデータを使って領域Dに格納するデータを生成する。なお、領域Cの書き込みはCPUバス720を経由して行われるため、CPU710は領域Cの内容をキャッシュしている場合でも、外部からの書き込みによってキャッシュの内容が更新される。プロセッシングシステム700dのCPU710は、領域Dにデータを格納すると、そのデータを他のプロセッシングシステム700にブロードキャストする。図8(d)は、全てのプロセッシングシステム700で領域Dのデータを共有した場合を示している。
When the
各プロセッシングシステム700におけるGPU724が処理する描画タスクは、領域Cおよび領域Dの書き込み完了をポーリングしており、データがそろった時点で、フレーム生成処理を開始する。各GPU724の描画結果は、それぞれの領域FBに書き込まれる。図8(d)は、各GPU724の描画結果は、それぞれの領域FBに書き込まれた場合を示している。各GPU724の描画結果は、プロセッシングシステム700dの領域FBにブロードキャストされ、図8(e)で示すように、プロセッシングシステム700dの領域FB中にコピーされる。領域FBのデータがそろうと、プロセッシングシステム700dはディスプレイ出力を実行する。
The drawing task processed by the
このように、実施の形態に係るブレードサーバ200は、単体で最大ひとつのゲームアプリケーションを実行可能なプロセッシングシステム700を複数有し、複数のプロセッシングシステム700を協働してひとつのゲームアプリケーションを実行することができる。この際、各プロセッシングシステム700中のGPU724は、最終処理結果のみならず、中間データも互いに密にやりとりすることができる。これにより、ゲームアプリケーションをひとつのプロセッシングシステム700で実行する場合よりも、より演算量の多い処理を実行でき、より緻密で高精細な画像を提供することができる。
As described above, the
入出力ブリッジ722としてPCE Express 4.0(Gen4)を採用する場合において、16レーンを4ポートに分割して4[lane/port]としたとする。このとき、1ポートあたりのバンド幅は8GB/秒となり、実効バンド幅は、約5GB/秒となる。4ポートからから同時にデータをやり取りする場合のピーク実効バンド幅は、TX/RXそれぞれ20GB/秒となる。非可逆圧縮を組み合わせた場合、内部バンド幅はその数倍となる。
When PCE Express 4.0 (Gen4) is adopted as the input /
ここで、5GB/秒のバンド幅で1ミリ秒の間に送ることができるデータ量は、5MBである。32ビットの頂点データに換算すると、1ミリ秒あたり125万頂点となる。ゆえに、32bit/pixelのテクスチャデータが約1/10に圧縮される場合、1ミリ秒あたり50MB、すなわち縦1024ピクセル、横1024ピクセルの画像のテクスチャ12.5枚分のデータが転送できる。 Here, the amount of data that can be sent in 1 millisecond with a bandwidth of 5 GB / second is 5 MB. When converted into 32-bit vertex data, it becomes 1.25 million vertices per millisecond. Therefore, when texture data of 32 bits / pixel is compressed to about 1/10, 50 MB per millisecond, that is, data of 12.5 textures of an image of 1024 pixels vertically and 1024 pixels horizontally can be transferred.
以上説明したように、実施の形態に係るブレードサーバ200によれば、各プロセッシングシステム700がポイント・ツー・ポイントで接続され、DMAコントローラ716内で処理命令のプライオリティー制御と、内部バスであるGPUバス718による帯域保証によって、システム全体として帯域保証することが可能とある。例えばファイルシステムから読み出した巨大なデータがバックグラウンドでコピーされている間に、各GPU724が決められたサイズのリアルタイムデータを処理することによって、1フレーム内で完了させなければならない処理が遅延することを抑制できる。
As described above, according to the
各プロセッシングシステム700において、CPU710およびGPU724は、それぞれDMAコントローラ716を介したメモリコピーが実施できる等により、プロセッシングシステム700間でのデータ転送のレイテンシを低減できる。これにより、従来では困難であった1フレーム内で複数回にわたってデータをやりとりしながら、CPU710およびGPU724による処理が混在した分散処理が可能となる。
In each
以上、複数のプロセッシングシステム700が協働してひとつのゲームアプリケーションを実行する場合について説明した。次に、ひとつのゲームアプリケーションの実行を担当するプロセッシングシステムの割当処理について説明する。
The case where a plurality of
クラウドゲーミングシステムにおいて、高クオリティーかつ高負荷のゲームを提供する場合、ひとつのプロセッシングシステムで複数のゲームを動かすことは難しい。このため、図1に示すアプリケーション提供システム10のように、複数のプロセッシングシステム700を備えるブレードサーバ200をさらに複数用意する。しかしながら、システムにかかる負荷が最も多いピーク時に対応できるようにプロセッシングシステム700を用意すると、時間帯によっては負荷が減少し、稼働しないプロセッシングシステム700が増える。アプリケーション提供システム10をゲーム提供システムとして運用する場合、レイテンシを低く抑える必要があり、時間帯の異なる複数の地域での負荷分散を実現することは難しい
In a cloud gaming system, when providing a high quality and high load game, it is difficult to move a plurality of games with a single processing system. Therefore, a plurality of
そこで実施の形態に係る割当サーバ100は、ゲーム提供サーバであるブレードサーバ200の負荷をもとに、ひとつのゲームアプリケーションを実行するために割り当てるプロセッシングシステム700の数を設定する。より具体的に、割当サーバ100は、ブレードサーバ200の負荷が大きい場合は、小さい場合と比較して、ひとつのゲームアプリケーションを実行するために割り当てるプロセッシングシステム700の数を小さく設定する。
Therefore, the
割当サーバ100はまた、ブレードサーバ200の負荷が小さい場合は、大きい場合と比較して、ゲームアプリケーションを実行するために割り当てたプロセッシングシステム700におけるGPU724およびCPU710の動作クロックを大きくしてもよい。割当サーバ100は、ブレードサーバ200の負荷に応じて、例えば以下のようにプロセッシングシステム700の稼働状態を切り換える。
The
状態0:スタンバイ
状態1:1つのプロセッシングシステム700を通常クロックで使用
状態2:1つのプロセッシングシステム700をクロックアップして使用
状態3:4つのプロセッシングシステム700をクロックアップして使用
状態4:16のプロセッシングシステム700をクロックアップして使用
State 0: Standby State 1: One
割当サーバ100は、ブレードサーバ200の負荷が小さい場合はプロセッシングシステム700の稼働状態を状態4とし、負荷が増大するにつれて、状態3、状態2、状態1へと稼働状態を変化させる。これにより、ブレードサーバ200の負荷が小さいときは、緻密で高精細な画像で、クライアント装置500にゲームを提供することができる。ブレードサーバ200の負荷が増えても、専用のハードウェアであるゲームコンソール上で実行された場合と同等の画質を維持して、クライアント装置500にゲームを提供することができる。なお、上記の状態は一例であり、この他にも、プロセッシングシステム700数とクロックとの異なる組み合わせの状態を定義することもできる。
The
ここで、「ブレードサーバ200の負荷」とは、割当サーバ100がひとつのゲームアプリケーションを実行させるプロセッシングシステム700の数を決定するために利用する、プロセッシングシステム700の割り当て指標である。具体的には、ブレードサーバ200の消費電力、ブレードサーバ200の排熱量、およびブレードサーバ200がゲームアプリケーションを提供中のクライアント装置500またはユーザの数の、少なくともいずれかひとつである。ブレードサーバ200の消費電力や排熱量は、図示しない電力計や温度センサを用いて取得することができる。割当サーバ100は、ブレードサーバ200の消費電力が大きい場合、排熱量が多い場合、あるいはゲームアプリケーションを提供中のクライアント装置500またはユーザの数が多い場合は、そうでない場合と比較して、ブレードサーバ200の負荷が大きいと判断する。
Here, the “load of the
割当サーバ100がプロセッシングシステム700の稼働状態をある状態としている際に、例えばユーザがゲームを終了したり、負荷の軽いアプリケーションに切り換えたりすることにより、ブレードサーバ200の負荷が変動することも起こりうる。そこで割当サーバ100は、複数のクライアント装置500にゲームアプリケーションを提供中に、ブレードサーバ200の負荷が増加または減少した場合、提供を継続中のゲームアプリケーションにおいてシーンが切り替わることを契機として、そのゲームアプリケーションを実行するために割り当てるプロセッシングシステム700の数を変更してもよい。
When the
ここで「ゲームアプリケーションにおけるシーンの切り替わり」とは、例えばゲームの進行によってステージが切り替わったり、ゲームの映像を構成するための仮想の視点の位置を変更したりすることで、フレーム全体を再描画するタイミングを意味する。割当サーバ100がプロセッシングシステム700の稼働状態を変更すると、提供するゲームアプリケーションの画質も変更される。しかしながら、シーンの切り替わり時に稼働状態を変更することで、画質の変更に伴ってユーザが感じる違和感を抑制しつつ、アプリケーション提供システム10のリソースを有効活用することが可能となる。
Here, “switching of scenes in a game application” refers to, for example, redrawing the entire frame by switching the stage according to the progress of the game or changing the position of a virtual viewpoint for composing the video of the game. Means timing. When the
上述したとおり、1つのプロセッシングシステム700を通常クロックで使用する状態1でゲームアプリケーションを提供する場合であっても、専用のハードウェアであるゲームコンソール上で実行する場合と同等の画質をクライアント装置500に提供することができる。したがって、その他の稼働状態でゲームアプリケーションを提供する場合は、専用のハードウェアであるゲームコンソール上で実行する場合と比較して、高い画質でゲームアプリケーションを提供することができる。
As described above, even when a game application is provided in a state 1 in which one
そこで割当サーバ100は、クライアント装置500に提供中のゲームアプリケーションを実行するために複数のプロセッシングシステム700を割り当てている場合、そのクライアント装置500に対し、ゲームアプリケーションを高品質で提供していることを通知してもよい。これは例えばクライアント装置500に提供する映像の一部に「高画質モード」を示すメッセージを表示したり、あるいはゲームの提供開始時に音声で伝えたりすることで実現できる。これにより、ユーザは自宅のゲームコンソールで実行する場合よりも高い画質でゲームをプレイしていることが認識できるため、アプリケーション提供システム10を利用するためのインセンティブとなり得る。
Accordingly, when the
図9は、実施の形態に係る割当サーバ100が実行するプロセッシングシステム700の割当数の変更処理の流れを示すフローチャートである。
FIG. 9 is a flowchart showing a flow of processing for changing the number of allocations of the
割当サーバ100は、アプリケーション提供システム10におけるブレードサーバ200の負荷を確認する(S2)。ブレードサーバ200の負荷が増加している場合(S4のY)、割当サーバ100は、ひとつのゲームアプリケーションの実行に割り当てるプロセッシングシステム700の割当数の設定を減少する(S6)。
The
ブレードサーバ200の負荷が増加しておらず(S4のN)、ブレードサーバ200の負荷が減少している場合)(S8のY)、割当サーバ100は、ひとつのゲームアプリケーションの実行に割り当てるプロセッシングシステム700の割当数の設定を増加する(S10)。割当サーバ100がプロセッシングシステム700の割当数の設定を変更した後、実行中のゲームアプリケーションにおいてシーンチェンジがあった場合(S12のY)、割当サーバ100は割当数の設定を反映させる(S14)。実行中のゲームアプリケーションにおいてシーンチェンジがない間は(S12のN)、割当サーバ100はシーンチェンジがあるまで割当数の設定反映を待機する。
When the load on the
割当サーバ100が当数の設定反映をするか、ブレードサーバ200の負荷が増加も減少もしない場合(S8のN)、本フローチャートにおける処理は終了する。
If the
以上説明したように、実施の形態に係る割当サーバ100によれば、ゲーム提供サーバであるブレードサーバ200の負荷に応じて、アプリケーション提供システム10のリソースを適応的に割り当てることができる。
As described above, according to the
以上、本発明を実施の形態をもとに説明した。実施の形態は例示であり、それらの各構成要素や各処理プロセスの組合せにいろいろな変形例が可能なこと、またそうした変形例も本発明の範囲にあることは当業者に理解されるところである。 The present invention has been described based on the embodiments. The embodiments are exemplifications, and it will be understood by those skilled in the art that various modifications can be made to combinations of the respective constituent elements and processing processes, and such modifications are within the scope of the present invention. .
[変形例]
上記の説明では、割当サーバ100は、ブレードサーバ200の負荷に応じてひとつのゲームアプリケーションの実行のために割り当てるプロセッシングシステム700の割当数を変更したり、プロセッシングシステム700の動作クロックを変更したりする場合について説明した。割当サーバ100は、ブレードサーバ200の負荷に替えて、あるいはこれに加えて、ゲームアプリケーションを提供するクライアント装置500に応じて割当数やクロック数を変更してもよい。
[Modification]
In the above description, the
例えば、実施の形態に係るアプリケーション提供システム10を利用するために、ユーザはアプリケーション提供システム10にユーザ登録をする場合において、ユーザはアプリケーション提供システム10の利用態様に応じた料金を支払う場合を考える。例えば、ユーザは、より高い料金を支払うことにより、通常のユーザよりも優先的にプロセッシングシステム700が割り当てられる「プレミアムユーザ」としてユーザ登録できる。割当サーバ100は、あるクライアント装置500を利用するユーザがプレミアムユーザである場合、ブレードサーバ200の負荷が大きいときであっても、そのクライアント装置500にゲームアプリケーションを提供するときは、状態2またはそれよりもよい稼働状態を割り当てる。これにより、特定のユーザには、常に専用のハードウェアであるゲームコンソール上で実行する場合よりもよい画質でゲームアプリケーションを提供することができる。
For example, when a user registers in the
なお、本実施の形態に係る発明は、以下に記載する項目によって特定されてもよい。 The invention according to the present embodiment may be specified by the items described below.
[項目1−1]
プロセッシングシステムであって、
映像を生成するGPU(Graphics Processing Unit)と、
データを格納するメモリと、
前記GPUと前記メモリとを接続するデータバスと、
前記データバスと接続するDMA(Direct Memory Access)コントローラと、
前記データバスと接続するとともに、前記プロセッシングシステムと協働する外部のプロセッシングシステムとの間でデータの送受信をするための外部バスとも接続する入出力ブリッジと、
前記GPUとの間で前記メモリが格納するデータを共有するCPU(Central Processing Unit)とを備え、
前記GPUは、前記CPUを介さずに、前記DMAコントローラに対して前記メモリが格納するデータのデータ転送命令を発行し、
前記DMAコントローラは、前記データ転送命令を受信すると、前記入出力ブリッジに、前記外部のプロセッシングシステムへ前記メモリが格納するデータを転送させることを特徴とするプロセッシングシステム。
[項目1−2]
前記GPUは、前記CPUを介さずに、前記DMAコントローラに対してデータ取得命令を発行し、
前記DMAコントローラは、前記データ取得命令を受信すると、前記入出力ブリッジにデータの読み出し命令を発行し、
前記入出力ブリッジは、前記DMAコントローラが発行したデータの読み出し命令を前記外部バスにブロードキャストするとともに、前記読み出し命令に応答した前記外部のプロセッシングシステムから転送されたデータを受信し、
前記DMAコントローラは、前記入出力ブリッジが受信したデータを前記メモリに書き込むことを特徴とする項目1−1に記載のプロセッシングシステム。
[項目1−3]
前記DMAコントローラは、前記メモリが格納するデータの圧縮、前記入出力ブリッジが前記外部のプロセッシングシステムから転送されたデータから受信したデータの伸張の制御を実行することを特徴とする項目1−2に記載のプロセッシングシステム。
[項目1−4]
項目1−1から項目1−3のいずれかに記載のプロセッシングシステムを2以上備えるマルチプロセッシングシステムであって、
各プロセッシングシステムにおける入出力ブリッジはそれぞれ、他のプロセッシングシステムとの間でデータを送受信するための2以上の入出力ポートを有し、
前記プロセッシングシステムはそれぞれ、各ゲームプロセッシングシステム中の入出力ブリッジが有する入出力ポートを介して、1対1で通信可能に接続されていることを特徴とするマルチプロセッシングシステム。
[項目1−5]
各プロセッシングシステムにおけるGPUまたはCPUが処理してそれぞれのメモリにデータを格納すると、当該データを処理したGPUまたはCPUは、DMAコントローラに対してデータ転送命令を発行し、
前記データ転送命令を取得したDMAコントローラは、前記メモリに格納されたデータを、入出力ブリッジを介して各プロセッシングシステムにブロードキャストすることを特徴とする項目1−4に記載のマルチプロセッシングシステム。
[項目1−6]
項目1−1から項目1−3のいずれかに記載のプロセッシングシステムを同一基板上に複数個配置したブレードをさらに複数備え、
各ブレードにおける複数のゲームプロセッシングシステムはそれぞれ、入出力ブリッジが有する入出力ポートを介して1対1で通信可能に接続されており、
前記複数のブレードはそれぞれ、各ブレードにおけるいずれかのゲームプロセッシングシステムが備える入出力ブリッジの入出力ポートを介して、1対1で通信可能に接続されていることを特徴とする項目1−4または項目1−5に記載のマルチプロセッシングシステム。
[Item 1-1]
A processing system,
GPU (Graphics Processing Unit) that generates video,
Memory to store data,
A data bus connecting the GPU and the memory;
A DMA (Direct Memory Access) controller connected to the data bus;
An input / output bridge connected to the data bus and also connected to an external bus for transmitting and receiving data to and from an external processing system cooperating with the processing system;
A CPU (Central Processing Unit) that shares data stored in the memory with the GPU;
The GPU issues a data transfer instruction of data stored in the memory to the DMA controller without going through the CPU,
The DMA controller, when receiving the data transfer command, causes the input / output bridge to transfer data stored in the memory to the external processing system.
[Item 1-2]
The GPU issues a data acquisition command to the DMA controller without going through the CPU,
When the DMA controller receives the data acquisition command, it issues a data read command to the input / output bridge,
The input / output bridge broadcasts a data read command issued by the DMA controller to the external bus and receives data transferred from the external processing system in response to the read command,
The processing system according to item 1-1, wherein the DMA controller writes data received by the input / output bridge to the memory.
[Item 1-3]
Item 1-2 is characterized in that the DMA controller controls compression of data stored in the memory and expansion of data received from the data transferred by the input / output bridge from the external processing system. The processing system described.
[Item 1-4]
A multiprocessing system comprising two or more processing systems according to any one of items 1-1 to 1-3,
Each input / output bridge in each processing system has two or more input / output ports for transmitting and receiving data to and from other processing systems.
Each of the processing systems is connected to be capable of one-to-one communication through an input / output port of an input / output bridge in each game processing system.
[Item 1-5]
When the GPU or CPU in each processing system processes and stores data in each memory, the GPU or CPU that processed the data issues a data transfer instruction to the DMA controller,
Item 5. The multiprocessing system according to item 1-4, wherein the DMA controller that has acquired the data transfer command broadcasts the data stored in the memory to each processing system via an input / output bridge.
[Item 1-6]
A plurality of blades in which a plurality of the processing systems according to any one of Items 1-1 to 1-3 are arranged on the same substrate;
A plurality of game processing systems in each blade are connected to communicate one-on-one via input / output ports of the input / output bridge,
Each of the plurality of blades is connected so as to be capable of one-to-one communication via an input / output port of an input / output bridge included in any of the game processing systems in each blade. Item 6. A multiprocessing system according to item 1-5.
[項目2−1]
ネットワークを介して複数のクライアント装置と接続する割当サーバと、
前記割当サーバによって割り当てられたクライアント装置に提供するゲームアプリケーションを実行するゲーム提供サーバとを備え、
前記ゲーム提供サーバは、単体で最大ひとつのゲームアプリケーションを実行可能なゲームプロセッシングシステムを複数有するマルチプロセッシングシステムであり、
前記割当サーバは、前記ゲーム提供サーバの負荷をもとに、前記ゲーム提供サーバにおいてひとつのゲームアプリケーションを実行するために割り当てるゲームプロセッシングシステムの数を設定することを特徴とするゲーム提供システム。
[項目2−2]
前記割当サーバは、前記ゲーム提供サーバの負荷が大きい場合は、小さい場合と比較して、前記ゲーム提供サーバにおいてひとつのゲームアプリケーションを実行するために割り当てるゲームプロセッシングシステムの数を小さく設定することを特徴とする項目2−1に記載のゲーム提供システム。
[項目2−3]
前記ゲーム提供サーバにおけるゲームプロセッシングシステムはそれぞれ、
前記ゲームアプリケーションの映像を生成するGPUと、
前記GPUが生成したデータを格納するメモリと、
前記GPUとの間で前記メモリが格納するデータを共有するCPUと、
他のゲームプロセッシングシステムとの間で前記メモリが格納するデータを送受信するDMAコントローラ(Direct Memory Access System)とを備え、
前記割当サーバは、前記ゲーム提供サーバの負荷が小さい場合は、大きい場合と比較して、前記GPUおよび前記CPUの動作クロックを大きくすることを特徴とする項目2−1または項目2−2に記載のゲーム提供システム。
[項目2−4]
前記ゲーム提供サーバの負荷は、前記ゲーム提供サーバの消費電力、前記ゲーム提供サーバの排熱量、および前記ゲーム提供サーバがゲームアプリケーションを提供中のクライアント装置の数の、少なくともいずれかひとつであることを特徴とする項目2−1から項目2−3のいずれかに記載のゲーム提供システム。
[項目2−5]
前記割当サーバは、複数のクライアント装置にゲームアプリケーションを提供中に前記ゲーム提供サーバの負荷が増加または減少した場合、提供を継続中のゲームアプリケーションにおいてシーンが切り替わることを契機として、当該ゲームアプリケーションを実行するために割り当てるゲームプロセッシングシステムの数を増加または減少させることを特徴とする項目2−1から項目2−4のいずれかに記載のゲーム提供システム。
[項目2−6]
前記割当サーバは、クライアント装置に提供中のゲームアプリケーションを実行するために複数のゲームプロセッシングシステムを割り当てている場合、当該クライアント装置に対し、ゲームアプリケーションを高品質で提供していることを通知することを特徴とする項目2−1から項目2−5のいずれかに記載のゲーム提供システム。
[Item 2-1]
An allocation server connected to a plurality of client devices via a network;
A game providing server that executes a game application provided to the client device assigned by the assignment server,
The game providing server is a multi-processing system having a plurality of game processing systems capable of executing a maximum of one game application alone,
The allocation server sets a number of game processing systems to be allocated to execute one game application in the game providing server based on a load of the game providing server.
[Item 2-2]
The allocation server sets a smaller number of game processing systems to be allocated to execute one game application in the game providing server when the load of the game providing server is large than when the game providing server is small. The game providing system according to item 2-1.
[Item 2-3]
Each of the game processing systems in the game providing server is
A GPU for generating video of the game application;
A memory for storing data generated by the GPU;
A CPU that shares data stored in the memory with the GPU;
A DMA controller (Direct Memory Access System) that transmits and receives data stored in the memory to and from other game processing systems;
Item 2-1 or Item 2-2 is characterized in that the allocation server increases the operation clock of the GPU and the CPU when the load of the game providing server is small compared to when the load is large. Game provision system.
[Item 2-4]
The load of the game providing server is at least one of the power consumption of the game providing server, the amount of heat exhausted from the game providing server, and the number of client devices that the game providing server is providing game applications. The game providing system according to any one of items 2-1 to 2-3, which is characterized.
[Item 2-5]
When the load of the game providing server increases or decreases while providing a game application to a plurality of client devices, the allocation server executes the game application in response to a scene switching in the game application being provided 5. The game providing system according to any one of items 2-1 to 2-4, wherein the number of game processing systems to be allocated is increased or decreased.
[Item 2-6]
When the allocation server allocates a plurality of game processing systems to execute a game application being provided to the client device, the allocation server notifies the client device that the game application is provided with high quality. The game providing system according to any one of items 2-1 to 2-5, characterized by:
10 アプリケーション提供システム、 12 ブリッジ、 50 テクスチャ、 100 割当サーバ、 200 ブレードサーバ、 300 ログインサーバ、 400 ネットワーク、 500 クライアント装置、 600 ブレード、 610 電源ポート、 620 入出力ポート、 630 通信ポート、 700 プロセッシングシステム、 710 CPU、 712 ブリッジ、 714 メモリ制御部、 716 DMAコントローラ、 718 GPUバス、 720 CPUバス、 722 入出力ブリッジ、 724 GPU、 726 メモリ、 730,732 入出力ポート。 10 application providing system, 12 bridge, 50 texture, 100 allocation server, 200 blade server, 300 login server, 400 network, 500 client device, 600 blade, 610 power supply port, 620 input / output port, 630 communication port, 700 processing system, 710 CPU, 712 bridge, 714 memory controller, 716 DMA controller, 718 GPU bus, 720 CPU bus, 722 I / O bridge, 724 GPU, 726 memory, 730, 732 I / O port.
Claims (6)
映像を生成するGPU(Graphics Processing Unit)と、
データを格納するメモリと、
前記GPUと前記メモリとを接続するデータバスと、
前記データバスと接続するDMA(Direct Memory Access)コントローラと、
前記データバスと接続するとともに、前記プロセッシングシステムと協働する外部のプロセッシングシステムとの間でデータの送受信をするための外部バスとも接続する入出力ブリッジと、
前記GPUとの間で前記メモリが格納するデータを共有するCPU(Central Processing Unit)とを備え、
前記GPUは、前記CPUを介さずに、前記DMAコントローラに対して前記メモリが格納するデータのデータ転送命令を発行し、
前記DMAコントローラは、前記データ転送命令を受信すると、前記入出力ブリッジに、前記外部のプロセッシングシステムへ前記メモリが格納するデータを転送させることを特徴とするプロセッシングシステム。 A processing system,
GPU (Graphics Processing Unit) that generates video,
Memory to store data,
A data bus connecting the GPU and the memory;
A DMA (Direct Memory Access) controller connected to the data bus;
An input / output bridge connected to the data bus and also connected to an external bus for transmitting and receiving data to and from an external processing system cooperating with the processing system;
A CPU (Central Processing Unit) that shares data stored in the memory with the GPU;
The GPU issues a data transfer instruction of data stored in the memory to the DMA controller without going through the CPU,
The DMA controller, when receiving the data transfer command, causes the input / output bridge to transfer data stored in the memory to the external processing system.
前記DMAコントローラは、前記データ取得命令を受信すると、前記入出力ブリッジにデータの読み出し命令を発行し、
前記入出力ブリッジは、前記DMAコントローラが発行したデータの読み出し命令を前記外部バスにブロードキャストするとともに、前記読み出し命令に応答した前記外部のプロセッシングシステムから転送されたデータを受信し、
前記DMAコントローラは、前記入出力ブリッジが受信したデータを前記メモリに書き込むことを特徴とする請求項1に記載のプロセッシングシステム。 The GPU issues a data acquisition command to the DMA controller without going through the CPU,
When the DMA controller receives the data acquisition command, it issues a data read command to the input / output bridge,
The input / output bridge broadcasts a data read command issued by the DMA controller to the external bus and receives data transferred from the external processing system in response to the read command,
The processing system according to claim 1, wherein the DMA controller writes data received by the input / output bridge to the memory.
各プロセッシングシステムにおける入出力ブリッジはそれぞれ、他のプロセッシングシステムとの間でデータを送受信するための2以上の入出力ポートを有し、
前記プロセッシングシステムはそれぞれ、各ゲームプロセッシングシステム中の入出力ブリッジが有する入出力ポートを介して、1対1で通信可能に接続されていることを特徴とするマルチプロセッシングシステム。 A multi-processing system comprising two or more processing systems according to any one of claims 1 to 3,
Each input / output bridge in each processing system has two or more input / output ports for transmitting and receiving data to and from other processing systems.
Each of the processing systems is connected to be capable of one-to-one communication through an input / output port of an input / output bridge in each game processing system.
前記データ転送命令を取得したDMAコントローラは、前記メモリに格納されたデータを、入出力ブリッジを介して各プロセッシングシステムにブロードキャストすることを特徴とする請求項4に記載のマルチプロセッシングシステム。 When the GPU or CPU in each processing system processes and stores data in each memory, the GPU or CPU that processed the data issues a data transfer instruction to the DMA controller,
5. The multiprocessing system according to claim 4, wherein the DMA controller that has acquired the data transfer instruction broadcasts the data stored in the memory to each processing system via an input / output bridge.
各ブレードにおける複数のゲームプロセッシングシステムはそれぞれ、入出力ブリッジが有する入出力ポートを介して1対1で通信可能に接続されており、
前記複数のブレードはそれぞれ、各ブレードにおけるいずれかのゲームプロセッシングシステムが備える入出力ブリッジの入出力ポートを介して、1対1で通信可能に接続されていることを特徴とする請求項4または5に記載のマルチプロセッシングシステム。 A plurality of blades in which a plurality of the processing systems according to any one of claims 1 to 3 are arranged on the same substrate,
A plurality of game processing systems in each blade are connected to communicate one-on-one via input / output ports of the input / output bridge,
6. The plurality of blades are connected so as to be capable of one-to-one communication via an input / output port of an input / output bridge provided in any one of the game processing systems in each blade. The multiprocessing system described in
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014075605A JP6412708B2 (en) | 2014-04-01 | 2014-04-01 | Processing system and multi-processing system |
US14/663,656 US10579571B2 (en) | 2014-04-01 | 2015-03-20 | Processing system and multiprocessing system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014075605A JP6412708B2 (en) | 2014-04-01 | 2014-04-01 | Processing system and multi-processing system |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2015197805A true JP2015197805A (en) | 2015-11-09 |
JP2015197805A5 JP2015197805A5 (en) | 2017-03-16 |
JP6412708B2 JP6412708B2 (en) | 2018-10-24 |
Family
ID=54190595
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014075605A Active JP6412708B2 (en) | 2014-04-01 | 2014-04-01 | Processing system and multi-processing system |
Country Status (2)
Country | Link |
---|---|
US (1) | US10579571B2 (en) |
JP (1) | JP6412708B2 (en) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019149086A (en) * | 2018-02-28 | 2019-09-05 | 日本電信電話株式会社 | Data processing apparatus and data transfer method |
WO2021200492A1 (en) * | 2020-03-31 | 2021-10-07 | 株式会社ソニー・インタラクティブエンタテインメント | Transmission device, transmission method, and program |
KR20220021444A (en) * | 2019-01-30 | 2022-02-22 | 소니 인터랙티브 엔터테인먼트 엘엘씨 | Scalable game console CPU/GPU design for home console and cloud gaming |
JP2023506585A (en) * | 2020-02-14 | 2023-02-16 | 株式会社ソニー・インタラクティブエンタテインメント | A network architecture that provides high-speed storage access through PCI Express fabric between compute nodes and storage servers |
US11890538B2 (en) | 2019-01-30 | 2024-02-06 | Sony Interactive Entertainment LLC | Scalable game console CPU / GPU design for home console and cloud gaming |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10449448B2 (en) * | 2015-10-15 | 2019-10-22 | Sony Interactive Entertainment America Llc | Method for improving game streaming performance in the cloud |
US10462008B2 (en) * | 2016-04-29 | 2019-10-29 | Microsoft Technology Licensing, Llc | Cart mode provisioning of shared computing devices |
KR101897704B1 (en) * | 2017-09-25 | 2018-10-29 | 넷마블 주식회사 | Apparatus and method for providing game service |
CN108287806B (en) * | 2018-01-25 | 2021-04-06 | 曙光云计算集团有限公司 | Cloud server system |
Family Cites Families (40)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5892932A (en) * | 1995-11-21 | 1999-04-06 | Fore Systems, Inc. | Reprogrammable switching apparatus and method |
JP3396035B2 (en) | 1995-12-01 | 2003-04-14 | 株式会社セガ | Image processing device |
US6015348A (en) | 1996-10-18 | 2000-01-18 | Starwave Corporation | Scalable game server architecture |
JP2000042247A (en) | 1998-07-30 | 2000-02-15 | Namco Ltd | Game system, game data distribution device, game device, real time image display system and information recording medium |
US8165155B2 (en) * | 2004-07-01 | 2012-04-24 | Broadcom Corporation | Method and system for a thin client and blade architecture |
US20020026321A1 (en) | 1999-02-26 | 2002-02-28 | Sadeg M. Faris | Internet-based system and method for fairly and securely enabling timed-constrained competition using globally time-sychronized client subsystems and information servers having microsecond client-event resolution |
EP1483741A2 (en) | 2002-03-01 | 2004-12-08 | t5 Labs Ltd | Centralised interactive graphical application server |
GB0302926D0 (en) | 2003-02-08 | 2003-03-12 | Grex Games Ltd | System architecture and engine for massively multi-user operation |
US7813562B2 (en) | 2004-09-27 | 2010-10-12 | Intel Corporation | Low-latency remote display rendering using tile-based rendering systems |
US20070004501A1 (en) | 2005-06-29 | 2007-01-04 | Christopher Brewer | Multi-core processing in a wagering game machine |
US8172684B2 (en) | 2005-12-23 | 2012-05-08 | Wms Gaming Inc. | Networks for use in gaming |
US8968077B2 (en) | 2006-04-13 | 2015-03-03 | Idt | Methods and systems for interfacing with a third-party application |
KR100829561B1 (en) | 2006-08-24 | 2008-05-15 | 삼성전자주식회사 | Method for rendering 3D graphic data and apparatus therefore |
US8838674B2 (en) * | 2006-10-26 | 2014-09-16 | International Business Machines Corporation | Plug-in accelerator |
JP5072774B2 (en) | 2008-08-25 | 2012-11-14 | キヤノン株式会社 | Image processing apparatus, method, and program |
JP2010061283A (en) | 2008-09-02 | 2010-03-18 | Fujitsu Ltd | Load balancer setting program, load balancer setting method and load balancer setting apparatus |
US8073990B1 (en) * | 2008-09-23 | 2011-12-06 | Teradici Corporation | System and method for transferring updates from virtual frame buffers |
KR101127598B1 (en) * | 2008-12-10 | 2012-03-23 | 한국전자통신연구원 | Sink node for multiple radio interface and DMA-based data transfer method in wireless sensor node |
US8151199B2 (en) | 2009-02-09 | 2012-04-03 | AltEgo, LLC | Computational delivery system for avatar and background game content |
CN102439974B (en) | 2009-05-22 | 2015-01-28 | 株式会社巨晶片 | Video playback system and video playback method |
US8208937B2 (en) | 2009-06-12 | 2012-06-26 | Futurewei Technologies, Inc. | System and method for uplink inter cell interference coordination in a wireless access system |
WO2011041516A1 (en) | 2009-09-30 | 2011-04-07 | Zynga Game Network Inc. | Apparatuses, methods and systems for an online game manager |
JP5137932B2 (en) * | 2009-11-17 | 2013-02-06 | 株式会社ソニー・コンピュータエンタテインメント | Communication system, terminal device, communication processing method, communication processing program, storage medium storing communication processing program, and expansion device |
US20120028712A1 (en) * | 2010-07-30 | 2012-02-02 | Britesmart Llc | Distributed cloud gaming method and system where interactivity and resources are securely shared among multiple users and networks |
US8435121B1 (en) | 2010-11-05 | 2013-05-07 | Amazon Technologies, Inc. | Providing remote access to games designed for a single-machine experience |
US8830245B2 (en) | 2010-12-14 | 2014-09-09 | Amazon Technologies, Inc. | Load balancing between general purpose processors and graphics processors |
JP5117611B2 (en) | 2011-03-18 | 2013-01-16 | 株式会社コナミデジタルエンタテインメント | GAME DEVICE, GAME CONTROL METHOD, PROGRAM, AND GAME MANAGEMENT DEVICE |
US9959008B2 (en) * | 2011-04-13 | 2018-05-01 | Razer (Asia-Pacific) Pte Ltd. | Computer peripheral display and communication device providing an adjunct 3D user interface |
EP2568392A4 (en) * | 2011-06-24 | 2013-05-22 | Huawei Tech Co Ltd | Computer subsystem and computer system |
US10086292B2 (en) | 2011-08-02 | 2018-10-02 | Zynga Inc. | Low-friction response in a social game |
JP5331192B2 (en) | 2011-11-07 | 2013-10-30 | 株式会社スクウェア・エニックス・ホールディングス | Drawing server, center server, encoding device, control method, encoding method, program, and recording medium |
JP5624074B2 (en) | 2012-03-30 | 2014-11-12 | 株式会社コナミデジタルエンタテインメント | Game system and program |
US9729614B2 (en) | 2012-10-01 | 2017-08-08 | Datacastle Corporation | Resilient data node for improving distributed data management and bandwidth utilization |
US9071609B2 (en) | 2012-10-08 | 2015-06-30 | Google Technology Holdings LLC | Methods and apparatus for performing dynamic load balancing of processing resources |
US9245496B2 (en) * | 2012-12-21 | 2016-01-26 | Qualcomm Incorporated | Multi-mode memory access techniques for performing graphics processing unit-based memory transfer operations |
US9734598B2 (en) * | 2013-01-15 | 2017-08-15 | Microsoft Technology Licensing, Llc | Engine for streaming virtual textures |
US9478000B2 (en) * | 2013-09-27 | 2016-10-25 | Intel Corporation | Sharing non-page aligned memory |
US9336134B2 (en) * | 2013-11-12 | 2016-05-10 | Skyera, Llc | Apparatus and method for accessing a non-volatile memory blade using multiple controllers in a non-volatile memory based storage device |
US9348742B1 (en) | 2013-12-18 | 2016-05-24 | Amazon Technologies, Inc. | Detecting code alteration based on memory allocation |
KR20150085376A (en) | 2014-01-15 | 2015-07-23 | 한국전자통신연구원 | Load balancing system for rendering service over cloud gaming environment and load balancing method thereof |
-
2014
- 2014-04-01 JP JP2014075605A patent/JP6412708B2/en active Active
-
2015
- 2015-03-20 US US14/663,656 patent/US10579571B2/en active Active
Non-Patent Citations (1)
Title |
---|
藤井 久史: "GPU向けQCDライブラリQUDAのTCAアーキテクチャによる実装", 情報処理学会 研究報告 ハイパフォーマンスコンピューティング, vol. 2014-HPC-143巻,第35号, JPN6018008676, 24 February 2014 (2014-02-24), JP, pages 1 - 7, ISSN: 0003755547 * |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019149086A (en) * | 2018-02-28 | 2019-09-05 | 日本電信電話株式会社 | Data processing apparatus and data transfer method |
KR20220021444A (en) * | 2019-01-30 | 2022-02-22 | 소니 인터랙티브 엔터테인먼트 엘엘씨 | Scalable game console CPU/GPU design for home console and cloud gaming |
JP2022521455A (en) * | 2019-01-30 | 2022-04-08 | ソニー・インタラクティブエンタテインメント エルエルシー | Scalable game console CPU / GPU design for home game consoles and cloud games |
JP7277592B2 (en) | 2019-01-30 | 2023-05-19 | ソニー・インタラクティブエンタテインメント エルエルシー | Scalable Game Console CPU/GPU Design for Home Game Console and Cloud Gaming |
KR102610097B1 (en) * | 2019-01-30 | 2023-12-04 | 소니 인터랙티브 엔터테인먼트 엘엘씨 | Scalable game console CPU/GPU design for home console and cloud gaming |
US11890538B2 (en) | 2019-01-30 | 2024-02-06 | Sony Interactive Entertainment LLC | Scalable game console CPU / GPU design for home console and cloud gaming |
JP2023506585A (en) * | 2020-02-14 | 2023-02-16 | 株式会社ソニー・インタラクティブエンタテインメント | A network architecture that provides high-speed storage access through PCI Express fabric between compute nodes and storage servers |
JP7242968B2 (en) | 2020-02-14 | 2023-03-20 | 株式会社ソニー・インタラクティブエンタテインメント | A network architecture that provides high-speed storage access through PCI Express fabric between compute nodes and storage servers |
WO2021200492A1 (en) * | 2020-03-31 | 2021-10-07 | 株式会社ソニー・インタラクティブエンタテインメント | Transmission device, transmission method, and program |
JPWO2021200492A1 (en) * | 2020-03-31 | 2021-10-07 | ||
JP7444971B2 (en) | 2020-03-31 | 2024-03-06 | 株式会社ソニー・インタラクティブエンタテインメント | Transmission device, transmission method and program |
US12113968B2 (en) | 2020-03-31 | 2024-10-08 | Sony Interactive Entertainment Inc. | Transmission device, transmission method, and program |
Also Published As
Publication number | Publication date |
---|---|
JP6412708B2 (en) | 2018-10-24 |
US10579571B2 (en) | 2020-03-03 |
US20150278145A1 (en) | 2015-10-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6412708B2 (en) | Processing system and multi-processing system | |
JP6373620B2 (en) | Game provision system | |
CN107690622B9 (en) | Method, equipment and system for realizing hardware acceleration processing | |
CN109978751B (en) | Multi-GPU frame rendering | |
JP7242968B2 (en) | A network architecture that provides high-speed storage access through PCI Express fabric between compute nodes and storage servers | |
JP5088366B2 (en) | Virtual computer control program, virtual computer control system, and virtual computer migration method | |
US8996755B2 (en) | Facilitating, at least in part, by circuitry, accessing of at least one controller command interface | |
US20120149464A1 (en) | Load balancing between general purpose processors and graphics processors | |
JP2002189629A (en) | Graphic processing system provided with function extension type memory controller | |
TW201145172A (en) | Sharing resources between a CPU and GPU | |
CN109729106A (en) | Handle the method, system and computer program product of calculating task | |
JP2015195977A (en) | game providing server | |
CN110442389A (en) | A kind of shared method using GPU of more desktop environments | |
CN115335851B (en) | Dynamic transparent reconfiguration of multi-tenant graphics processing units | |
JP2017507395A (en) | Multi-mode gaming server | |
CN104750614B (en) | Method and apparatus for managing memory | |
JP3688618B2 (en) | Data processing system, data processing method, computer program, and recording medium | |
CN116383127B (en) | Inter-node communication method, inter-node communication device, electronic equipment and storage medium | |
JP4011082B2 (en) | Information processing apparatus, graphic processor, control processor, and information processing method | |
CN105988871A (en) | Remote memory allocation method, device and system | |
US20240362165A1 (en) | Computing Device, Data Processing Method and System, and Related Device | |
CN115494946A (en) | Screen projection method, device, equipment and readable storage medium | |
CN115362476A (en) | Fully utilized hardware in multi-tenant graphics processing unit |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170210 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170210 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20180214 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180313 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180507 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180703 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180828 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180911 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20181001 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6412708 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |