JP2014529831A - グラフィックス処理のためのメモリコピーエンジン - Google Patents
グラフィックス処理のためのメモリコピーエンジン Download PDFInfo
- Publication number
- JP2014529831A JP2014529831A JP2014529730A JP2014529730A JP2014529831A JP 2014529831 A JP2014529831 A JP 2014529831A JP 2014529730 A JP2014529730 A JP 2014529730A JP 2014529730 A JP2014529730 A JP 2014529730A JP 2014529831 A JP2014529831 A JP 2014529831A
- Authority
- JP
- Japan
- Prior art keywords
- data
- memory
- gpu
- copy engine
- shader processor
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012545 processing Methods 0.000 title claims abstract description 95
- 238000000034 method Methods 0.000 claims abstract description 64
- 230000008569 process Effects 0.000 claims description 19
- 230000004048 modification Effects 0.000 abstract description 13
- 238000012986 modification Methods 0.000 abstract description 13
- 230000003993 interaction Effects 0.000 abstract description 7
- 230000006870 function Effects 0.000 description 34
- 238000012546 transfer Methods 0.000 description 7
- 238000001914 filtration Methods 0.000 description 5
- 239000012634 fragment Substances 0.000 description 5
- 230000009286 beneficial effect Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000007796 conventional method Methods 0.000 description 3
- 238000013144 data compression Methods 0.000 description 3
- 238000013500 data storage Methods 0.000 description 3
- 238000007726 management method Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 239000003086 colorant Substances 0.000 description 2
- 241000023320 Luma <angiosperm> Species 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- GWEVSGVZZGPLCZ-UHFFFAOYSA-N Titan oxide Chemical group O=[Ti]=O GWEVSGVZZGPLCZ-UHFFFAOYSA-N 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000006837 decompression Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000010387 memory retrieval Effects 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- OSWPMRLSEDHDFF-UHFFFAOYSA-N methyl salicylate Chemical compound COC(=O)C1=CC=CC=C1O OSWPMRLSEDHDFF-UHFFFAOYSA-N 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000012856 packing Methods 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F12/00—Accessing, addressing or allocating within memory systems or architectures
- G06F12/02—Addressing or allocation; Relocation
- G06F12/08—Addressing or allocation; Relocation in hierarchically structured memory systems, e.g. virtual memory systems
- G06F12/0802—Addressing of a memory level in which the access to the desired data or data block requires associative addressing means, e.g. caches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F12/00—Accessing, addressing or allocating within memory systems or architectures
- G06F12/02—Addressing or allocation; Relocation
- G06F12/08—Addressing or allocation; Relocation in hierarchically structured memory systems, e.g. virtual memory systems
- G06F12/0802—Addressing of a memory level in which the access to the desired data or data block requires associative addressing means, e.g. caches
- G06F12/0875—Addressing of a memory level in which the access to the desired data or data block requires associative addressing means, e.g. caches with dedicated cache, e.g. instruction or stack
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F15/00—Digital computers in general; Data processing equipment in general
- G06F15/16—Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
- G06F15/163—Interprocessor communication
- G06F15/167—Interprocessor communication using a common memory, e.g. mailbox
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T1/00—General purpose image data processing
- G06T1/60—Memory management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2212/00—Indexing scheme relating to accessing, addressing or allocation within memory systems or architectures
- G06F2212/10—Providing a specific technical effect
- G06F2212/1016—Performance improvement
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computer Hardware Design (AREA)
- Software Systems (AREA)
- Image Generation (AREA)
- Image Processing (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
以下に、本件出願当初の特許請求の範囲に記載された発明を付記する。
[C1]システムバスを介してアクセス可能なシステムメモリと、
グラフィックス処理ユニット(GPU)と、
を備える装置であって、
前記グラフィックス処理ユニット(GPU)は、下記を具備する、
ローカルメモリと、
前記システムバスを介して前記システムメモリから第1データを検索し、かつ前記ローカルメモリに前記第1データを格納し、並びに前記ローカルメモリから第2データを検索し、かつ前記システムバスを介して前記システムメモリに前記第2データを格納するために動作可能なメモリコピーエンジンと、
前記ローカルメモリから前記第1データを検索し、前記第2データを生成するために前記第1データを処理し、そして前記ローカルメモリに前記第2データを格納するために動作可能なシェーダプロセッサ。
[C2]前記メモリコピーエンジン、前記シェーダプロセッサ、及び前記ローカルメモリは相互に分離され、かつ前記GPUのチップ上にある、C1の装置。
[C3]前記第1データはソースデータを備え、並びに前記第2データは前記ソースデータの前記処理の結果生じる複数の結果データを備える、C1の装置。
[C4]前記メモリコピーエンジンはハードウェア上で実行するハードウェア又はソフトウェアとして実装され、そしてここにおいて、前記ハードウェアは前記シェーダプロセッサから分離され、かつ前記GPUのチップ上にある、C1の装置。
[C5]前記シェーダプロセッサは、前記システムメモリから前記第1データを検索するために動作できず、並びに前記システムメモリに前記第2データを格納するために動作できないうちの少なくとも一方である、C1の装置。
[C6]前記シェーダプロセッサは、前記第2データを生成するために前記第1データを処理するための複数の算術演算に関する複数の命令を実行するために動作可能である、C1の装置。
[C7]前記メモリコピーエンジンは、前記シェーダプロセッサ上で実行するシェーダプログラムによって使用可能なデータに、前記ローカルメモリに格納された前記第1データを修正するために、さらに動作可能である、C1の装置。
[C8]前記メモリコピーエンジンは、前記シェーダプロセッサ上で実行するシェーダプログラムによって使用可能なデータに、前記ローカルメモリに格納された前記第2データを修正するために、さらに動作可能である、C1の装置。
[C9]前記装置は、メディアプレーヤー、セット―トップボックス、無線ハンドセット、パーソナルデジタルアシスタント(PDA)、デスクトップコンピュータ、ラップトップコンピュータ、ゲーム用コンソール、ビデオ会議ユニット、及びタブレットコンピュータデバイスのうちの少なくとも1つを備える、C1の装置。
[C10]前記メモリコピーエンジンは、前記ローカルメモリから第4データを検索しているか、前記第4データを処理しているか、または前記ローカルメモリに前記第4データを格納している前記シェーダプロセッサと同時に、前記システムメモリから第3データを検索するか、又は前記システムメモリに前記第3データを格納するために動作可能である、C1の装置。
[C11]前記メモリコピーエンジンは、前記メモリコピーエンジンが、前記ローカルメモリに前記第1データを格納することと、及び前記システムメモリに前記第2データを格納することのうちの少なくとも一方を完了したことを前記シェーダプロセッサに指示ためにさらに動作可能である、C1の装置。
[C12]前記メモリコピーエンジンは、前記第1データを修正するためにさらに動作可能であり、そしてここにおいて、前記第1データを格納するために動作可能な前記メモリコピーエンジンは前記ローカルメモリに、前記修正された第1データを格納するために動作可能な前記メモリコピーエンジンを備える、C1の装置。
[C13]前記メモリコピーエンジンは、前記第2データを修正するためにさらに動作可能であり、そしてここにおいて、第2データを格納するために動作可能な前記メモリコピーエンジンは前記システムメモリに前記修正された第2データを格納するために動作可能な前記メモリコピーエンジンを備える、C1の装置。
[C14]グラフィックス処理ユニット(GPU)のメモリコピーエンジンを用いて、システムバスを介して前記GPUの外部のシステムメモリから第1データを検索することと、
前記GPUの前記メモリコピーエンジンを用いて、前記GPUのローカルメモリに前記第1データを格納することと、
前記GPUのシェーダプロセッサを用いて、前記ローカルメモリから前記第1データを検索することと、
前記GPUの前記シェーダプロセッサを用いて、第2データを生成するために前記第1データを処理することと、
前記GPUの前記シェーダプロセッサを用いて、前記ローカルメモリに前記第2データを格納することと、
前記GPUの前記メモリコピーエンジンを用いて、前記ローカルメモリから前記第2データを検索することと、
前記GPUの前記メモリコピーエンジンを用いて、前記システムバスを介して前記システムメモリに前記第2データを格納することと、
を備える方法。
[C15]前記メモリコピーエンジン、前記シェーダプロセッサ、及び前記ローカルメモリは相互に分離され、かつ前記GPUのチップ上にある、C14の方法。
[C16]前記第1データはソースデータを備え、並びに前記第2データは前記ソースデータの前記処理の結果生じる複数の結果データを備える、C14の方法。
[C17]前記シェーダプロセッサは、前記システムメモリから前記第1データを検索するために動作できず、並びに前記システムメモリに前記第2データを格納するために動作できないうちの少なくとも一方である、C14の方法。
[C18]前記第2データを生成するために前記第1データを処理することは、前記第2データを生成するために前記第1データを処理するための複数の算術演算に関する複数の命令を実行することを備える、C14の方法。
[C19]前記GPUの前記メモリコピーエンジンを用いて、前記シェーダプロセッサ上で実行するシェーダプログラムによって使用可能なデータに、前記ローカルメモリに格納された前記第1データを修正することを、さらに備える、C14の方法。
[C20]前記GPUの前記メモリコピーエンジンを用いて、前記シェーダプロセッサ上で実行するシェーダプログラムによって使用可能なデータに、前記ローカルメモリに格納された前記第2データを修正することを、さらに備える、C14の方法。
[C21]前記メモリコピーエンジンを用いて、前記システムメモリから第3データを検索することか、又は前記システムメモリに前記第3データを格納することと、
同時に、前記シェーダプロセッサを用いて、前記ローカルメモリから第4データを検索することか、前記第4データを処理することか、または前記ローカルメモリに前記第4データを格納することを、さらに備えるC14の方法。
[C22]前記メモリコピーエンジンを用いて、前記メモリコピーエンジンが、前記ローカルメモリに前記第1データを格納することと、及び前記システムメモリに前記第2データを格納することのうちの少なくとも一方を完了したことを前記シェーダプロセッサに指示することを、さらに備える、C14の装置。
[C23]前記メモリコピーエンジンを用いて、前記第1データを修正することをさらに備え、
ここにおいて、前記GPUの前記メモリコピーエンジンを用いて、前記GPUのローカルメモリに前記第1データを格納することは、前記メモリコピーエンジンを用いて、前記GPUのローカルメモリに前記修正された第1データを格納することを備える、C14の方法。
[C24]前記メモリコピーエンジンを用いて、前記第2データを修正することをさらに備え、
ここにおいて、前記GPUの前記メモリコピーエンジンを用いて、前記システムバスを介して前記システムメモリに前記第2データを格納することは、前記GPUの前記メモリコピーエンジンを用いて、前記システムバスを介して前記システムメモリに前記修正された第2データを格納することを備える、C14の方法。
[C25]システムバスを介してアクセス可能なシステムメモリと、
前記システムメモリの外部のグラフィックス処理ユニット(GPU)と、を備える装置であって、
前記GPUは下記を具備する、
ローカルメモリと、
前記GPUのメモリコピーエンジンを用いて、前記システムバスを介して前記システムメモリから第1データを検索するための手段と、
前記GPUの前記メモリコピーエンジンを用いて、前記ローカルメモリに前記第1データを格納するための手段と、
前記GPUのシェーダプロセッサを用いて、前記ローカルメモリから前記第1データを検索するための手段と、
前記GPUの前記シェーダプロセッサを用いて、第2データを生成するために前記第1データを処理するための手段と、
前記GPUの前記シェーダプロセッサを用いて、前記ローカルメモリに前記第2データを格納するための手段と、
前記GPUの前記メモリコピーエンジンを用いて、前記ローカルメモリから前記第2データを検索するための手段と、
前記GPUの前記メモリコピーエンジンを用いて、前記システムバスを介して前記システムメモリに前記第2データを格納するための手段。
[C26]前記メモリコピーエンジン、前記シェーダプロセッサ、及び前記ローカルメモリは相互に分離され、かつ前記GPUのチップ上にある、C25の装置。
[C27]前記第1データはソースデータを備え、並びに前記第2データは前記ソースデータの前記処理の結果生じる複数の結果データを備える、C25の装置。
[C28]前記シェーダプロセッサは、前記システムメモリから前記第1データを検索するために動作できず、並びに前記システムメモリに前記第2データを格納するために動作できないうちの少なくとも一方である、C25の装置。
[C29]前記第2データを生成するため前記第1データを処理するための前記手段は、前記第2データを生成するために前記第1データを処理するための算術演算に関する命令を実行するための手段を備える、C25の装置。
[C30]前記GPUの前記メモリコピーエンジンを用いて、前記シェーダプロセッサ上で実行するシェーダプログラムによって使用可能なデータに、前記ローカルメモリに格納された前記第1データを修正するための手段を、さらに備える、C25の装置。
[C31]前記GPUの前記メモリコピーエンジンを用いて、前記シェーダプロセッサ上で実行するシェーダプログラムによって使用可能なデータに、前記ローカルメモリに格納された前記第2データを修正するための手段を、さらに備える、C25の装置。
[C32]前記装置は、メディアプレーヤー、セット―トップボックス、無線ハンドセット、パーソナルデジタルアシスタント(PDA)、デスクトップコンピュータ、ラップトップコンピュータ、ゲーム用コンソール、ビデオ会議ユニット、及びタブレットコンピュータデバイスのうちの少なくとも1つを備える、C25の装置。
[C33]前記メモリコピーエンジンを用いて、前記システムメモリから第3データを検索するか、又は前記システムメモリに前記第3データを格納するための手段と、
同時に、前記シェーダプロセッサを用いて、前記ローカルメモリから第4データを検索するか、前記第4データを処理するか、または前記ローカルメモリに前記第4データを格納するための手段を、さらに備える、C25の方法。
[C34]グラフィックス処理ユニット(GPU)に下記をさせる複数の命令を備える非一時的コンピュータ可読記憶媒体であって、
前記GPUのメモリコピーエンジンを用いて、システムバスを介して前記GPUの外部のシステムメモリから第1データを検索すること、
前記GPUの前記メモリコピーエンジンを用いて、前記GPUのローカルメモリに前記第1データを格納すること、
前記GPUのシェーダプロセッサを用いて、前記ローカルメモリから前記第1データを検索すること、
前記GPUの前記シェーダプロセッサを用いて、第2データを生成するために前記第1データを処理すること、
前記GPUの前記シェーダプロセッサを用いて、前記ローカルメモリに前記第2データを格納すること、
前記GPUの前記メモリコピーエンジンを用いて、前記ローカルメモリから前記第2データを検索すること、
前記GPUの前記メモリコピーエンジンを用いて、前記システムバスを介して前記システムメモリに前記第2データを格納すること。
[C35]前記メモリコピーエンジン、前記シェーダプロセッサ、及び前記ローカルメモリは相互に分離され、かつ前記GPUのチップ上にある、C34の非一時的コンピュータ可読記憶媒体。
[C36]前記第1データはソースデータを備え、並びに前記第2データは前記ソースデータの前記処理の結果生じる複数の結果データを備える、C34の非一時的コンピュータ可読記憶媒体。
[C37]前記シェーダプロセッサは、前記システムメモリから前記第1データを検索するために動作できず、並びに前記システムメモリに前記第2データを格納するために動作できないうちの少なくとも一方である、C34の非一時的コンピュータ可読記憶媒体。
[C38]前記GPUに前記第2データを生成するために前記第1データを処理させる前記複数の命令は、前記GPUに前記第2データを生成するために前記第1データを処理するための算術演算に関する複数の命令を実行させる命令を備える、C34の非一時的コンピュータ可読記憶媒体。
[C39]前記GPUの前記メモリコピーエンジンを用いて、前記シェーダプロセッサ上で実行するシェーダプログラムによって使用可能なデータに、前記ローカルメモリに格納された前記第1データを修正するための複数の命令をさらに備える、C34の非一時的コンピュータ可読記憶媒体。
[C40]前記GPUの前記メモリコピーエンジンを用いて、前記シェーダプロセッサ上で実行するシェーダプログラムによって使用可能なデータに、前記ローカルメモリに格納された前記第2データを修正するための複数の命令をさらに備える、C34の非一時的コンピュータ可読記憶媒体。
[C41]
下記を行うための命令を、さらに備える、C34の非一時的コンピュータ可読記憶媒体、
前記メモリコピーエンジンを用いて、前記システムメモリから第3データを検索するためか、又は前記システムメモリに前記第3データを格納するため、
同時に、前記シェーダプロセッサを用いて、前記ローカルメモリから第4データを検索するためか、前記第4データを処理するためか、または前記ローカルメモリに第4データを格納するため。
Claims (41)
- システムバスを介してアクセス可能なシステムメモリと、
グラフィックス処理ユニット(GPU)と、
を備える装置であって、
前記グラフィックス処理ユニット(GPU)は、下記を具備する、
ローカルメモリと、
前記システムバスを介して前記システムメモリから第1データを検索し、かつ前記ローカルメモリに前記第1データを格納し、並びに前記ローカルメモリから第2データを検索し、かつ前記システムバスを介して前記システムメモリに前記第2データを格納するために動作可能なメモリコピーエンジンと、
前記ローカルメモリから前記第1データを検索し、前記第2データを生成するために前記第1データを処理し、そして前記ローカルメモリに前記第2データを格納するために動作可能なシェーダプロセッサ。 - 前記メモリコピーエンジン、前記シェーダプロセッサ、及び前記ローカルメモリは相互に分離され、かつ前記GPUのチップ上にある、請求項1の装置。
- 前記第1データはソースデータを備え、並びに前記第2データは前記ソースデータの前記処理の結果生じる複数の結果データを備える、請求項1の装置。
- 前記メモリコピーエンジンはハードウェア上で実行するハードウェア又はソフトウェアとして実装され、そしてここにおいて、前記ハードウェアは前記シェーダプロセッサから分離され、かつ前記GPUのチップ上にある、請求項1の装置。
- 前記シェーダプロセッサは、前記システムメモリから前記第1データを検索するために動作できず、並びに前記システムメモリに前記第2データを格納するために動作できないうちの少なくとも一方である、請求項1の装置。
- 前記シェーダプロセッサは、前記第2データを生成するために前記第1データを処理するための複数の算術演算に関する複数の命令を実行するために動作可能である、請求項1の装置。
- 前記メモリコピーエンジンは、前記シェーダプロセッサ上で実行するシェーダプログラムによって使用可能なデータに、前記ローカルメモリに格納された前記第1データを修正するために、さらに動作可能である、請求項1の装置。
- 前記メモリコピーエンジンは、前記シェーダプロセッサ上で実行するシェーダプログラムによって使用可能なデータに、前記ローカルメモリに格納された前記第2データを修正するために、さらに動作可能である、請求項1の装置。
- 前記装置は、メディアプレーヤー、セット―トップボックス、無線ハンドセット、パーソナルデジタルアシスタント(PDA)、デスクトップコンピュータ、ラップトップコンピュータ、ゲーム用コンソール、ビデオ会議ユニット、及びタブレットコンピュータデバイスのうちの少なくとも1つを備える、請求項1の装置。
- 前記メモリコピーエンジンは、前記ローカルメモリから第4データを検索しているか、前記第4データを処理しているか、または前記ローカルメモリに前記第4データを格納している前記シェーダプロセッサと同時に、前記システムメモリから第3データを検索するか、又は前記システムメモリに前記第3データを格納するために動作可能である、請求項1の装置。
- 前記メモリコピーエンジンは、前記メモリコピーエンジンが、前記ローカルメモリに前記第1データを格納することと、及び前記システムメモリに前記第2データを格納することのうちの少なくとも一方を完了したことを前記シェーダプロセッサに指示ためにさらに動作可能である、請求項1の装置。
- 前記メモリコピーエンジンは、前記第1データを修正するためにさらに動作可能であり、そしてここにおいて、前記第1データを格納するために動作可能な前記メモリコピーエンジンは前記ローカルメモリに、前記修正された第1データを格納するために動作可能な前記メモリコピーエンジンを備える、請求項1の装置。
- 前記メモリコピーエンジンは、前記第2データを修正するためにさらに動作可能であり、そしてここにおいて、第2データを格納するために動作可能な前記メモリコピーエンジンは前記システムメモリに前記修正された第2データを格納するために動作可能な前記メモリコピーエンジンを備える、請求項1の装置。
- グラフィックス処理ユニット(GPU)のメモリコピーエンジンを用いて、システムバスを介して前記GPUの外部のシステムメモリから第1データを検索することと、
前記GPUの前記メモリコピーエンジンを用いて、前記GPUのローカルメモリに前記第1データを格納することと、
前記GPUのシェーダプロセッサを用いて、前記ローカルメモリから前記第1データを検索することと、
前記GPUの前記シェーダプロセッサを用いて、第2データを生成するために前記第1データを処理することと、
前記GPUの前記シェーダプロセッサを用いて、前記ローカルメモリに前記第2データを格納することと、
前記GPUの前記メモリコピーエンジンを用いて、前記ローカルメモリから前記第2データを検索することと、
前記GPUの前記メモリコピーエンジンを用いて、前記システムバスを介して前記システムメモリに前記第2データを格納することと、
を備える方法。 - 前記メモリコピーエンジン、前記シェーダプロセッサ、及び前記ローカルメモリは相互に分離され、かつ前記GPUのチップ上にある、請求項14の方法。
- 前記第1データはソースデータを備え、並びに前記第2データは前記ソースデータの前記処理の結果生じる複数の結果データを備える、請求項14の方法。
- 前記シェーダプロセッサは、前記システムメモリから前記第1データを検索するために動作できず、並びに前記システムメモリに前記第2データを格納するために動作できないうちの少なくとも一方である、請求項14の方法。
- 前記第2データを生成するために前記第1データを処理することは、前記第2データを生成するために前記第1データを処理するための複数の算術演算に関する複数の命令を実行することを備える、請求項14の方法。
- 前記GPUの前記メモリコピーエンジンを用いて、前記シェーダプロセッサ上で実行するシェーダプログラムによって使用可能なデータに、前記ローカルメモリに格納された前記第1データを修正することを、さらに備える、請求項14の方法。
- 前記GPUの前記メモリコピーエンジンを用いて、前記シェーダプロセッサ上で実行するシェーダプログラムによって使用可能なデータに、前記ローカルメモリに格納された前記第2データを修正することを、さらに備える、請求項14の方法。
- 前記メモリコピーエンジンを用いて、前記システムメモリから第3データを検索することか、又は前記システムメモリに前記第3データを格納することと、
同時に、前記シェーダプロセッサを用いて、前記ローカルメモリから第4データを検索することか、前記第4データを処理することか、または前記ローカルメモリに前記第4データを格納することを、さらに備える請求項14の方法。 - 前記メモリコピーエンジンを用いて、前記メモリコピーエンジンが、前記ローカルメモリに前記第1データを格納することと、及び前記システムメモリに前記第2データを格納することのうちの少なくとも一方を完了したことを前記シェーダプロセッサに指示することを、さらに備える、請求項14の装置。
- 前記メモリコピーエンジンを用いて、前記第1データを修正することをさらに備え、
ここにおいて、前記GPUの前記メモリコピーエンジンを用いて、前記GPUのローカルメモリに前記第1データを格納することは、前記メモリコピーエンジンを用いて、前記GPUのローカルメモリに前記修正された第1データを格納することを備える、請求項14の方法。 - 前記メモリコピーエンジンを用いて、前記第2データを修正することをさらに備え、
ここにおいて、前記GPUの前記メモリコピーエンジンを用いて、前記システムバスを介して前記システムメモリに前記第2データを格納することは、前記GPUの前記メモリコピーエンジンを用いて、前記システムバスを介して前記システムメモリに前記修正された第2データを格納することを備える、請求項14の方法。 - システムバスを介してアクセス可能なシステムメモリと、
前記システムメモリの外部のグラフィックス処理ユニット(GPU)と、を備える装置であって、
前記GPUは下記を具備する、
ローカルメモリと、
前記GPUのメモリコピーエンジンを用いて、前記システムバスを介して前記システムメモリから第1データを検索するための手段と、
前記GPUの前記メモリコピーエンジンを用いて、前記ローカルメモリに前記第1データを格納するための手段と、
前記GPUのシェーダプロセッサを用いて、前記ローカルメモリから前記第1データを検索するための手段と、
前記GPUの前記シェーダプロセッサを用いて、第2データを生成するために前記第1データを処理するための手段と、
前記GPUの前記シェーダプロセッサを用いて、前記ローカルメモリに前記第2データを格納するための手段と、
前記GPUの前記メモリコピーエンジンを用いて、前記ローカルメモリから前記第2データを検索するための手段と、
前記GPUの前記メモリコピーエンジンを用いて、前記システムバスを介して前記システムメモリに前記第2データを格納するための手段。 - 前記メモリコピーエンジン、前記シェーダプロセッサ、及び前記ローカルメモリは相互に分離され、かつ前記GPUのチップ上にある、請求項25の装置。
- 前記第1データはソースデータを備え、並びに前記第2データは前記ソースデータの前記処理の結果生じる複数の結果データを備える、請求項25の装置。
- 前記シェーダプロセッサは、前記システムメモリから前記第1データを検索するために動作できず、並びに前記システムメモリに前記第2データを格納するために動作できないうちの少なくとも一方である、請求項25の装置。
- 前記第2データを生成するため前記第1データを処理するための前記手段は、前記第2データを生成するために前記第1データを処理するための算術演算に関する命令を実行するための手段を備える、請求項25の装置。
- 前記GPUの前記メモリコピーエンジンを用いて、前記シェーダプロセッサ上で実行するシェーダプログラムによって使用可能なデータに、前記ローカルメモリに格納された前記第1データを修正するための手段を、さらに備える、請求項25の装置。
- 前記GPUの前記メモリコピーエンジンを用いて、前記シェーダプロセッサ上で実行するシェーダプログラムによって使用可能なデータに、前記ローカルメモリに格納された前記第2データを修正するための手段を、さらに備える、請求項25の装置。
- 前記装置は、メディアプレーヤー、セット―トップボックス、無線ハンドセット、パーソナルデジタルアシスタント(PDA)、デスクトップコンピュータ、ラップトップコンピュータ、ゲーム用コンソール、ビデオ会議ユニット、及びタブレットコンピュータデバイスのうちの少なくとも1つを備える、請求項25の装置。
- 前記メモリコピーエンジンを用いて、前記システムメモリから第3データを検索するか、又は前記システムメモリに前記第3データを格納するための手段と、
同時に、前記シェーダプロセッサを用いて、前記ローカルメモリから第4データを検索するか、前記第4データを処理するか、または前記ローカルメモリに前記第4データを格納するための手段を、さらに備える、請求項25の方法。 - グラフィックス処理ユニット(GPU)に下記をさせる複数の命令を備える非一時的コンピュータ可読記憶媒体であって、
前記GPUのメモリコピーエンジンを用いて、システムバスを介して前記GPUの外部のシステムメモリから第1データを検索すること、
前記GPUの前記メモリコピーエンジンを用いて、前記GPUのローカルメモリに前記第1データを格納すること、
前記GPUのシェーダプロセッサを用いて、前記ローカルメモリから前記第1データを検索すること、
前記GPUの前記シェーダプロセッサを用いて、第2データを生成するために前記第1データを処理すること、
前記GPUの前記シェーダプロセッサを用いて、前記ローカルメモリに前記第2データを格納すること、
前記GPUの前記メモリコピーエンジンを用いて、前記ローカルメモリから前記第2データを検索すること、
前記GPUの前記メモリコピーエンジンを用いて、前記システムバスを介して前記システムメモリに前記第2データを格納すること。 - 前記メモリコピーエンジン、前記シェーダプロセッサ、及び前記ローカルメモリは相互に分離され、かつ前記GPUのチップ上にある、請求項34の非一時的コンピュータ可読記憶媒体。
- 前記第1データはソースデータを備え、並びに前記第2データは前記ソースデータの前記処理の結果生じる複数の結果データを備える、請求項34の非一時的コンピュータ可読記憶媒体。
- 前記シェーダプロセッサは、前記システムメモリから前記第1データを検索するために動作できず、並びに前記システムメモリに前記第2データを格納するために動作できないうちの少なくとも一方である、請求項34の非一時的コンピュータ可読記憶媒体。
- 前記GPUに前記第2データを生成するために前記第1データを処理させる前記複数の命令は、前記GPUに前記第2データを生成するために前記第1データを処理するための算術演算に関する複数の命令を実行させる命令を備える、請求項34の非一時的コンピュータ可読記憶媒体。
- 前記GPUの前記メモリコピーエンジンを用いて、前記シェーダプロセッサ上で実行するシェーダプログラムによって使用可能なデータに、前記ローカルメモリに格納された前記第1データを修正するための複数の命令をさらに備える、請求項34の非一時的コンピュータ可読記憶媒体。
- 前記GPUの前記メモリコピーエンジンを用いて、前記シェーダプロセッサ上で実行するシェーダプログラムによって使用可能なデータに、前記ローカルメモリに格納された前記第2データを修正するための複数の命令をさらに備える、請求項34の非一時的コンピュータ可読記憶媒体。
- 下記を行うための命令を、さらに備える、請求項34の非一時的コンピュータ可読記憶媒体、
前記メモリコピーエンジンを用いて、前記システムメモリから第3データを検索するためか、又は前記システムメモリに前記第3データを格納するため、
同時に、前記シェーダプロセッサを用いて、前記ローカルメモリから第4データを検索するためか、前記第4データを処理するためか、または前記ローカルメモリに第4データを格納するため。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US13/227,363 | 2011-09-07 | ||
US13/227,363 US8941655B2 (en) | 2011-09-07 | 2011-09-07 | Memory copy engine for graphics processing |
PCT/US2012/050613 WO2013036358A1 (en) | 2011-09-07 | 2012-08-13 | Memory copy engine for graphics processing |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014529831A true JP2014529831A (ja) | 2014-11-13 |
JP5792391B2 JP5792391B2 (ja) | 2015-10-14 |
Family
ID=46705060
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014529730A Active JP5792391B2 (ja) | 2011-09-07 | 2012-08-13 | グラフィックス処理のためのメモリコピーエンジン |
Country Status (8)
Country | Link |
---|---|
US (1) | US8941655B2 (ja) |
EP (1) | EP2754055B1 (ja) |
JP (1) | JP5792391B2 (ja) |
KR (1) | KR101564859B1 (ja) |
CN (1) | CN103782280B (ja) |
ES (1) | ES2688353T3 (ja) |
HU (1) | HUE040473T2 (ja) |
WO (1) | WO2013036358A1 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019179411A (ja) * | 2018-03-30 | 2019-10-17 | 株式会社デンソー | 情報処理装置 |
JP2022541669A (ja) * | 2019-12-13 | 2022-09-26 | ソニーグループ株式会社 | 2-d画像のリアルタイム体積視覚化 |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8924752B1 (en) | 2011-04-20 | 2014-12-30 | Apple Inc. | Power management for a graphics processing unit or other circuit |
US9378560B2 (en) | 2011-06-17 | 2016-06-28 | Advanced Micro Devices, Inc. | Real time on-chip texture decompression using shader processors |
US9390461B1 (en) | 2012-05-08 | 2016-07-12 | Apple Inc. | Graphics hardware mode controls |
US10176621B2 (en) | 2013-06-10 | 2019-01-08 | Sony Interactive Entertainment Inc. | Using compute shaders as front end for vertex shaders |
US10096079B2 (en) | 2013-06-10 | 2018-10-09 | Sony Interactive Entertainment Inc. | Fragment shaders perform vertex shader computations |
US10102603B2 (en) | 2013-06-10 | 2018-10-16 | Sony Interactive Entertainment Inc. | Scheme for compressing vertex shader output parameters |
US10062135B2 (en) * | 2013-07-31 | 2018-08-28 | National Technology & Engineering Solutions Of Sandia, Llc | Graphics processing unit management system for computed tomography |
US20150109315A1 (en) * | 2013-10-23 | 2015-04-23 | Nvidia Corporation | System, method, and computer program product for mapping tiles to physical memory locations |
US9612884B2 (en) * | 2014-12-04 | 2017-04-04 | Advanced Micro Devices, Inc. | Memory management in graphics and compute application programming interfaces |
US9779469B2 (en) * | 2015-08-17 | 2017-10-03 | Qualcomm Incorporated | Register spill management for general purpose registers (GPRs) |
US20170371797A1 (en) * | 2016-06-24 | 2017-12-28 | Qualcomm Incorporated | Pre-fetch mechanism for compressed memory lines in a processor-based system |
US10223822B2 (en) * | 2016-12-22 | 2019-03-05 | Apple Inc. | Mid-render compute for graphics processing |
US10331532B2 (en) * | 2017-01-19 | 2019-06-25 | Qualcomm Incorporated | Periodic non-intrusive diagnosis of lockstep systems |
US10467796B2 (en) | 2017-04-17 | 2019-11-05 | Intel Corporation | Graphics system with additional context |
KR20230138777A (ko) * | 2022-03-24 | 2023-10-05 | 삼성전자주식회사 | 데이터 재구성가능한 스토리지 장치, 전자 시스템 및 그 동작방법 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7068272B1 (en) * | 2000-05-31 | 2006-06-27 | Nvidia Corporation | System, method and article of manufacture for Z-value and stencil culling prior to rendering in a computer graphics processing pipeline |
US7053901B2 (en) | 2003-12-11 | 2006-05-30 | Nvidia Corporation | System and method for accelerating a special purpose processor |
US7821520B1 (en) | 2004-12-10 | 2010-10-26 | Nvidia Corporation | Fragment processor having dual mode register file |
US8427496B1 (en) * | 2005-05-13 | 2013-04-23 | Nvidia Corporation | Method and system for implementing compression across a graphics bus interconnect |
CN101156176A (zh) * | 2005-10-25 | 2008-04-02 | 三菱电机株式会社 | 图像处理装置 |
JP4439491B2 (ja) | 2006-05-24 | 2010-03-24 | 株式会社ソニー・コンピュータエンタテインメント | マルチグラフィックスプロセッサシステム、グラフィックスプロセッサおよびデータ転送方法 |
US8736626B2 (en) | 2008-08-26 | 2014-05-27 | Matrox Graphics Inc. | Method and system for cryptographically securing a graphics system |
US20100315421A1 (en) * | 2009-06-16 | 2010-12-16 | Disney Enterprises, Inc. | Generating fog effects in a simulated environment |
US20100332792A1 (en) * | 2009-06-30 | 2010-12-30 | Advanced Micro Devices, Inc. | Integrated Vector-Scalar Processor |
US8484647B2 (en) | 2009-07-24 | 2013-07-09 | Apple Inc. | Selectively adjusting CPU wait mode based on estimation of remaining work before task completion on GPU |
US8675003B2 (en) | 2009-09-09 | 2014-03-18 | Advanced Micro Devices, Inc. | Efficient data access for unified pixel interpolation |
US8780122B2 (en) | 2009-09-16 | 2014-07-15 | Nvidia Corporation | Techniques for transferring graphics data from system memory to a discrete GPU |
-
2011
- 2011-09-07 US US13/227,363 patent/US8941655B2/en active Active
-
2012
- 2012-08-13 EP EP12748636.3A patent/EP2754055B1/en active Active
- 2012-08-13 ES ES12748636.3T patent/ES2688353T3/es active Active
- 2012-08-13 WO PCT/US2012/050613 patent/WO2013036358A1/en active Application Filing
- 2012-08-13 CN CN201280043520.XA patent/CN103782280B/zh active Active
- 2012-08-13 KR KR1020147007769A patent/KR101564859B1/ko active IP Right Grant
- 2012-08-13 HU HUE12748636A patent/HUE040473T2/hu unknown
- 2012-08-13 JP JP2014529730A patent/JP5792391B2/ja active Active
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019179411A (ja) * | 2018-03-30 | 2019-10-17 | 株式会社デンソー | 情報処理装置 |
JP7080698B2 (ja) | 2018-03-30 | 2022-06-06 | 株式会社デンソー | 情報処理装置 |
JP2022541669A (ja) * | 2019-12-13 | 2022-09-26 | ソニーグループ株式会社 | 2-d画像のリアルタイム体積視覚化 |
US11734873B2 (en) | 2019-12-13 | 2023-08-22 | Sony Group Corporation | Real-time volumetric visualization of 2-D images |
Also Published As
Publication number | Publication date |
---|---|
ES2688353T3 (es) | 2018-11-02 |
KR101564859B1 (ko) | 2015-10-30 |
EP2754055A1 (en) | 2014-07-16 |
WO2013036358A1 (en) | 2013-03-14 |
US8941655B2 (en) | 2015-01-27 |
CN103782280A (zh) | 2014-05-07 |
EP2754055B1 (en) | 2018-06-27 |
US20130057562A1 (en) | 2013-03-07 |
CN103782280B (zh) | 2016-04-06 |
KR20140053370A (ko) | 2014-05-07 |
HUE040473T2 (hu) | 2019-03-28 |
JP5792391B2 (ja) | 2015-10-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5792391B2 (ja) | グラフィックス処理のためのメモリコピーエンジン | |
KR102695571B1 (ko) | 머신 러닝 워크로드들에서 텐서 오브젝트 지원을 위한 방법들 및 장치 | |
US11232534B2 (en) | Scheme for compressing vertex shader output parameters | |
US9384522B2 (en) | Reordering of command streams for graphical processing units (GPUs) | |
JP5960368B2 (ja) | ビジビリティ情報を用いたグラフィックスデータのレンダリング | |
JP6073533B1 (ja) | タイルベースのアーキテクチャ上での最適化されたマルチパスレンダリング | |
JP6352546B2 (ja) | 非整列ブロック転送動作の処理 | |
KR102003655B1 (ko) | 그래픽 프로세싱에서 셰도우 레이들에 대한 트리 횡단을 위한 시작 노드 결정 | |
KR101630996B1 (ko) | 셰이더 동작의 동기화 | |
JP5792402B2 (ja) | グラフィックス処理ユニット上でのグラフィックスアプリケーションおよび非グラフィックスアプリケーションの実行 | |
KR20140109431A (ko) | 커맨드 프로세서를 갖는 그래픽 프로세싱 유닛 | |
KR20120125395A (ko) | 그래픽 시스템에서 2차 프로세서를 이용하기 위한 시스템 및 방법 | |
JP2016538646A (ja) | グラフィックス処理のための任意の制御ポイントでのフォールトトレラントプリエンプションメカニズム | |
JP2018514855A (ja) | ハイブリッド2d/3dグラフィックスレンダリング | |
JP2018529168A (ja) | 帯域幅圧縮グラフィックスデータの記憶 | |
CN111986279A (zh) | 有效访问存储器和避免不必要的计算的技术 | |
TW202219887A (zh) | 快速增量共享常數 | |
JP6271812B2 (ja) | 透過的画素フォーマット変換器 | |
JP2018503919A (ja) | ベイヤーマッピングを備えたグラフィックス処理ユニット | |
Bratt | The arm® mali-t880 mobile gpu | |
CN112581575B (zh) | 一种外视频做纹理系统 | |
KR20230149319A (ko) | 프리미티브들의 배치들의 지오메트리 프로세싱을 위한 스케일러블 프리미티브 레이트 아키텍처 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150302 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150317 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150616 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150707 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150805 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5792391 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |