JP7025617B2 - メモリにアクセスするための並列処理装置、コンピュータにより実施される方法、システム、コンピュータ可読媒体 - Google Patents
メモリにアクセスするための並列処理装置、コンピュータにより実施される方法、システム、コンピュータ可読媒体 Download PDFInfo
- Publication number
- JP7025617B2 JP7025617B2 JP2019145645A JP2019145645A JP7025617B2 JP 7025617 B2 JP7025617 B2 JP 7025617B2 JP 2019145645 A JP2019145645 A JP 2019145645A JP 2019145645 A JP2019145645 A JP 2019145645A JP 7025617 B2 JP7025617 B2 JP 7025617B2
- Authority
- JP
- Japan
- Prior art keywords
- memory
- request
- access
- processing element
- slice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000015654 memory Effects 0.000 title claims description 463
- 238000012545 processing Methods 0.000 title claims description 393
- 238000000034 method Methods 0.000 title claims description 78
- 239000013598 vector Substances 0.000 claims description 75
- 238000001514 detection method Methods 0.000 claims description 17
- 230000004044 response Effects 0.000 claims description 12
- 239000000872 buffer Substances 0.000 description 52
- 235000003239 Guizotia abyssinica Nutrition 0.000 description 30
- 240000002795 Guizotia abyssinica Species 0.000 description 30
- 230000008569 process Effects 0.000 description 19
- 238000004891 communication Methods 0.000 description 17
- 230000007246 mechanism Effects 0.000 description 14
- 230000004888 barrier function Effects 0.000 description 13
- 238000012546 transfer Methods 0.000 description 11
- 230000008901 benefit Effects 0.000 description 10
- 230000006870 function Effects 0.000 description 9
- 241001522296 Erithacus rubecula Species 0.000 description 8
- 230000009471 action Effects 0.000 description 8
- 230000006399 behavior Effects 0.000 description 7
- 238000013461 design Methods 0.000 description 6
- 238000001914 filtration Methods 0.000 description 6
- 230000002093 peripheral effect Effects 0.000 description 6
- 230000002829 reductive effect Effects 0.000 description 6
- 238000013475 authorization Methods 0.000 description 5
- 230000000630 rising effect Effects 0.000 description 5
- 230000003068 static effect Effects 0.000 description 5
- 238000003491 array Methods 0.000 description 4
- 238000003384 imaging method Methods 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000013468 resource allocation Methods 0.000 description 4
- 238000013459 approach Methods 0.000 description 3
- 230000007717 exclusion Effects 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 239000002245 particle Substances 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000002459 sustained effect Effects 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 238000011282 treatment Methods 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 101100236200 Arabidopsis thaliana LSU1 gene Proteins 0.000 description 1
- 241001165575 Hylotelephium telephium subsp. maximum Species 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 125000002015 acyclic group Chemical group 0.000 description 1
- 230000002730 additional effect Effects 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000003139 buffering effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000001627 detrimental effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005265 energy consumption Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000001815 facial effect Effects 0.000 description 1
- 238000007667 floating Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 229910044991 metal oxide Inorganic materials 0.000 description 1
- 150000004706 metal oxides Chemical class 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 238000005096 rolling process Methods 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 230000002195 synergetic effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F12/00—Accessing, addressing or allocating within memory systems or architectures
- G06F12/02—Addressing or allocation; Relocation
- G06F12/0223—User address space allocation, e.g. contiguous or non contiguous base addressing
- G06F12/023—Free address space management
- G06F12/0238—Memory management in non-volatile memory, e.g. resistive RAM or ferroelectric memory
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F12/00—Accessing, addressing or allocating within memory systems or architectures
- G06F12/02—Addressing or allocation; Relocation
- G06F12/08—Addressing or allocation; Relocation in hierarchically structured memory systems, e.g. virtual memory systems
- G06F12/0802—Addressing of a memory level in which the access to the desired data or data block requires associative addressing means, e.g. caches
- G06F12/0806—Multiuser, multiprocessor or multiprocessing cache systems
- G06F12/0842—Multiuser, multiprocessor or multiprocessing cache systems for multiprocessing or multitasking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F13/00—Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
- G06F13/14—Handling requests for interconnection or transfer
- G06F13/16—Handling requests for interconnection or transfer for access to memory bus
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/38—Concurrent instruction execution, e.g. pipeline or look ahead
- G06F9/3867—Concurrent instruction execution, e.g. pipeline or look ahead using instruction pipelines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/38—Concurrent instruction execution, e.g. pipeline or look ahead
- G06F9/3885—Concurrent instruction execution, e.g. pipeline or look ahead using a plurality of independent parallel functional units
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5005—Allocation of resources, e.g. of the central processing unit [CPU] to service a request
- G06F9/5027—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
- G06F9/5044—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering hardware capabilities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5005—Allocation of resources, e.g. of the central processing unit [CPU] to service a request
- G06F9/5027—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
- G06F9/505—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering the load
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5061—Partitioning or combining of resources
- G06F9/5066—Algorithms for mapping a plurality of inter-dependent sub-tasks onto a plurality of physical CPUs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T1/00—General purpose image data processing
- G06T1/20—Processor architectures; Processor configuration, e.g. pipelining
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T1/00—General purpose image data processing
- G06T1/60—Memory management
-
- G—PHYSICS
- G09—EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
- G09G—ARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
- G09G5/00—Control arrangements or circuits for visual indicators common to cathode-ray tube indicators and other visual indicators
- G09G5/36—Control arrangements or circuits for visual indicators common to cathode-ray tube indicators and other visual indicators characterised by the display of a graphic pattern, e.g. using an all-points-addressable [APA] memory
- G09G5/363—Graphics controllers
-
- G—PHYSICS
- G09—EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
- G09G—ARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
- G09G5/00—Control arrangements or circuits for visual indicators common to cathode-ray tube indicators and other visual indicators
- G09G5/36—Control arrangements or circuits for visual indicators common to cathode-ray tube indicators and other visual indicators characterised by the display of a graphic pattern, e.g. using an all-points-addressable [APA] memory
- G09G5/39—Control of the bit-mapped memory
- G09G5/395—Arrangements specially adapted for transferring the contents of the bit-mapped memory to the screen
- G09G5/397—Arrangements specially adapted for transferring the contents of two or more bit-mapped memories to the screen simultaneously, e.g. for mixing or overlay
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F12/00—Accessing, addressing or allocating within memory systems or architectures
- G06F12/02—Addressing or allocation; Relocation
- G06F12/08—Addressing or allocation; Relocation in hierarchically structured memory systems, e.g. virtual memory systems
- G06F12/0802—Addressing of a memory level in which the access to the desired data or data block requires associative addressing means, e.g. caches
- G06F12/0844—Multiple simultaneous or quasi-simultaneous cache accessing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2209/00—Indexing scheme relating to G06F9/00
- G06F2209/50—Indexing scheme relating to G06F9/50
- G06F2209/501—Performance criteria
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2209/00—Indexing scheme relating to G06F9/00
- G06F2209/50—Indexing scheme relating to G06F9/50
- G06F2209/503—Resource availability
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0602—Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
- G06F3/061—Improving I/O performance
- G06F3/0611—Improving I/O performance in relation to response time
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0628—Interfaces specially adapted for storage systems making use of a particular technique
- G06F3/0629—Configuration or reconfiguration of storage systems
- G06F3/0631—Configuration or reconfiguration of storage systems by allocating resources to storage systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0668—Interfaces specially adapted for storage systems adopting a particular infrastructure
- G06F3/0671—In-line storage system
-
- G—PHYSICS
- G09—EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
- G09G—ARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
- G09G2360/00—Aspects of the architecture of display systems
- G09G2360/08—Power processing, i.e. workload management for processors involved in display operations, such as CPUs or GPUs
-
- G—PHYSICS
- G09—EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
- G09G—ARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
- G09G2360/00—Aspects of the architecture of display systems
- G09G2360/12—Frame memory handling
- G09G2360/122—Tiling
-
- G—PHYSICS
- G09—EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
- G09G—ARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
- G09G2360/00—Aspects of the architecture of display systems
- G09G2360/12—Frame memory handling
- G09G2360/126—The frame memory having additional data ports, not inclusive of standard details of the output serial port of a VRAM
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Computer Hardware Design (AREA)
- Computer Graphics (AREA)
- Advance Control (AREA)
- Multi Processors (AREA)
- Image Processing (AREA)
- Bus Control (AREA)
- Memory System (AREA)
- Image Analysis (AREA)
Description
[0001]本出願は、2013年11月18日に出願された、名称が「APPARATUS, SYSTEMS, AND METHODS FOR PROVIDING COMPUTATIONAL IMAGING PIPELINE」であるU.S. Patent Application No. 14/082,396のより早い優先日の利益を主張し、この出願は、2013年11月6に出願された、名称が「APPARATUS, SYSTEMS, AND METHODS FOR PROVIDING CONFIGURABLE AND COMPOSABLE COMPUTATIONAL IMAGING PIPELINE」であるRomanian Patent Application OSIM Registratura A/00812、及び、2013年8月8日に出願された、名称が「CONFIGURABLE AND COMPOSABLE COMPUTATIONAL IMAGING PIPELINE」であるU.K. Patent Application No. GB1314263.3に対する優先権を主張している。本出願はまた、2013年11月18日に出願された、名称が「APPARATUS, SYSTEMS, AND METHODS FOR PROVIDING CONFIGURABLE COMPUTATIONAL IMAGING PIPELINE」であるU.S. Patent Application No. 14/082,645のより早い優先日の利益も主張し、この出願は、2013年11月6に出願された、名称が「APPARATUS, SYSTEMS, AND METHODS FOR PROVIDING CONFIGURABLE AND COMPOSABLE COMPUTATIONAL IMAGING PIPELINE」であるRomanian Patent Application OSIM Registratura A/00812、及び、2013年8月8日に出願された、名称が「CONFIGURABLE AND COMPOSABLE COMPUTATIONAL IMAGING PIPELINE」であるU.K. Patent Application No. GB1314263.3に対する優先権を主張している。上記出願のそれぞれは、ここで参照することにより本明細書に完全に組み込まれる。
複数のノードのうちの第1のノードを並列処理装置の第1の処理要素に割り当てること
と、複数のノードのうちの第2のノードを並列処理装置の第2の処理要素に割り当てることとを含み、それによって、第1のノード及び第2のノードと関連する動作を並列化する。並列処理装置はまた、第1の処理要素と関連する第1のメモリ・スライスを含む複数のメモリ・スライスを備えるメモリ・サブシステムを含み、ここで、第1のメモリ・スライスは、それぞれ個々の読み出し及び書き込みポートを有する複数のランダム・アクセス・メモリ(RAM)タイルと、第1の処理要素、第2の処理要素、及びメモリ・サブシステムを結合するように構成される相互接続システムとを備える。相互接続システムは、第1のメモリ・スライス及び第1の処理要素を結合するように構成されるローカル相互接続と、第1のメモリ・スライス及び第2の処理要素を結合するように構成されるグローバル相互接続とを含む。
[発明の項目]
[項目1]
命令を実行するようにそれぞれ構成される複数の処理要素と、
前記複数の処理要素のうちの1つと関連する第1のメモリ・スライスを含む複数のメモリ・スライスを備えるメモリ・サブシステムであって、前記第1のメモリ・スライスがそれぞれ個々の読み出し及び書き込みポートを有する複数のランダム・アクセス・メモリ(RAM)タイルを備える、前記メモリ・サブシステムと、
前記複数の処理要素と前記メモリ・サブシステムとを結合するように構成される相互接続システムであって、前記相互接続システムが、前記第1のメモリ・スライスと前記複数の処理要素のうちの前記1つとを結合するように構成されるローカル相互接続と、前記第1のメモリ・スライスと前記複数の処理要素のうちの残りとを結合するように構成されるグローバル相互接続とを含む、前記相互接続システムとを備える、
並列処理装置。
[項目2]
前記複数のRAMタイルのうちの前記1つが調停ブロックと関連し、
前記調停ブロックが、前記複数の処理要素うちの1つからのメモリ・アクセス要求を受けるように、かつ、前記複数の処理要素のうちの前記1つに、前記複数のRAMタイルうちの前記1つへのアクセスを許可するように構成される、
項目1に記載の処理装置。
[項目3]
前記調停ブロックが、ラウンドロビン方式で前記複数のRAMタイルのうちの前記1つへのアクセスを許可するように構成される、
項目2に記載の処理装置。
[項目4]
前記調停ブロックが、前記複数のRAMタイルのうちの前記1つへのメモリ・アクセス要求を監視し、前記複数の処理要素のうちの2つ以上が同時に前記複数のRAMタイルのうちの前記1つにアクセスしようとしているかどうかを判定するように構成される衝突検出器を備える、
項目2に記載の処理装置。
[項目5]
前記衝突検出器が、複数のアドレス・デコーダに結合され、
前記複数のアドレス・デコーダのそれぞれが、前記複数の処理要素のうちの1つに結合されて、前記複数の処理要素のうちの前記1つが前記調停ブロックと関連する前記複数のRAMタイルのうちの前記1つにアクセスしようとしているかどうかを判定するように構成される、
項目4に記載の処理装置。
[項目6]
前記複数の処理要素が、少なくとも1つのベクトル・プロセッサと、少なくとも1つのハードウェア・アクセラレータとを備える、
項目1に記載の処理装置。
[項目7]
前記複数のメモリ・スライスのうちの1つへのアクセスを提供するようにそれぞれ構成される複数のメモリ・スライス・コントローラをさらに備える、
項目6に記載の処理装置。
[項目8]
前記相互接続システムが、前記少なくとも1つのベクトル・プロセッサと前記メモリ・サブシステムとの間の通信を提供するように構成される第1のバスを備える、
項目7に記載の処理装置。
[項目9]
前記相互接続システムが、前記少なくとも1つのハードウェア・アクセラレータと前記メモリ・サブシステムとの間の通信を提供するように構成される第2のバス・システムを備える、
項目8に記載の処理装置。
[項目10]
前記第2のバス・システムが、前記少なくとも1つのハードウェア・アクセラレータからのメモリ・アクセス要求を受けることによって、かつ、前記メモリ・サブシステムへのアクセスを、前記少なくとも1つのハードウェア・アクセラレータに許可することによって、前記少なくとも1つのハードウェア・アクセラレータと前記メモリ・サブシステムとの間の通信を仲介するように構成されるスライス・アドレス要求フィルタを備える、
項目9に記載の処理装置。
[項目11]
前記複数の処理装置のうちの1つが、前記メモリ・サブシステムのスループットを増加させるためのバッファを備え、
前記バッファの要素の数が、前記メモリ・サブシステムからデータを検索するためのサイクルの数より大きい、
項目1に記載の処理装置。
[項目12]
第1の処理要素と第2の処理要素とを含み、それぞれが命令を実行するように構成された複数の処理要素を提供することと、
前記第1の処理要素と関連し、それぞれ個々の読み出し及び書き込みポートを有する複数のランダム・アクセス・メモリ(RAM)タイルを備えた第1のメモリ・スライスを含む複数のメモリ・スライスを備えるメモリ・サブシステムを提供することと、
相互接続システムのローカル相互接続を介した前記複数のRAMタイルのうちの1つと関連する調停ブロックによって、前記第1の処理要素から第1のメモリ・アクセス要求を受けることと、
グローバル相互接続を介した前記調停ブロックによって、前記第1の処理要素に前記複数のRAMタイルのうちの前記1つにアクセスする権限を付与するために、前記第1の処理要素に第1の権限付与メッセージを送ることとを含む、
並列処理システムの作動方法。
[項目13]
前記相互接続システムのグローバル相互接続を介した前記調停ブロックによって、第2の処理要素から第2のメモリ・アクセス要求を受けることと、
前記グローバル相互接続を介した前記調停ブロックによって、前記第2の処理要素に前記複数のRAMタイルのうちの前記1つにアクセスする権限を付与するために、前記第2の処理要素に第2の権限付与メッセージを送ることとをさらに含む、
項目12に記載の方法。
[項目14]
前記調停ブロックによって、ラウンドロビン方式で前記複数のRAMタイルのうちの前記1つへアクセスする権限を付与するために、前記複数の処理要素に複数の権限付与メッセージを送ることをさらに含む、
項目12に記載の方法。
[項目15]
前記調停ブロックの衝突検出器によって、前記複数のRAMタイルのうちの前記1つへのメモリ・アクセス要求を監視することと、
前記複数の処理要素の2つ以上が同時に前記複数のRAMタイルのうちの前記1つにアクセスしようとしているかどうかを判定することとをさらに含む、
項目12に記載の方法。
[項目16]
前記複数の処理要素が、少なくとも1つのベクトル・プロセッサと、少なくとも1つのハードウェア・アクセラレータとを備える、
項目12に記載の方法。
[項目17]
前記複数のメモリ・スライスのうちの1つへのアクセスを提供するようにそれぞれ構成される複数のメモリ・スライス・コントローラを提供することをさらに含む、
項目16に記載の方法。
[項目18]
前記相互接続システムの第1のバス・システムを介した、前記少なくとも1つのベクトル・プロセッサと前記メモリ・サブシステムとの間の通信を提供することをさらに含む、
項目17に記載の方法。
[項目19]
前記相互接続システムの第2のバス・システムを介した、前記少なくとも1つのハードウェア・アクセラレータと前記メモリ・サブシステムとの間の通信を提供することをさらに含む、
項目18に記載の方法。
[項目20]
前記第2のバス・システムが、前記少なくとも1つのハードウェア・アクセラレータからのメモリ・アクセス要求を受けることによって、かつ、前記メモリ・サブシステムへのアクセスを、前記少なくとも1つのハードウェア・アクセラレータに許可することによって、前記少なくとも1つのハードウェア・アクセラレータと前記メモリ・サブシステムとの間の通信を仲介するように構成されるスライス・アドレス要求フィルタを備える、
項目19に記載の方法。
[項目21]
命令を実行するようにそれぞれ構成される複数の処理要素と、
前記複数の処理要素のうちの1つと関連する第1のメモリ・スライスを含む複数のメモリ・スライスを備えるメモリ・サブシステムであって、前記第1のメモリ・スライスがそれぞれ個々の読み出し及び書き込みポートを有する複数のランダム・アクセス・メモリ(RAM)タイルを備える、前記メモリ・サブシステムと、
前記複数の処理要素と前記メモリ・サブシステムとを結合するように構成される相互接続システムであって、前記相互接続システムが、前記第1のメモリ・スライスと前記複数の処理要素のうちの前記1つとを結合するように構成されるローカル相互接続と、前記第1のメモリ・スライスと前記複数の処理要素のうちの残りとを結合するように構成されるグローバル相互接続とを含む、前記相互接続システムとを備える、
並列処理装置と、
前記並列処理装置と通信し、メモリに格納されるモジュールを実行するように構成されるプロセッサであって、
前記モジュールが、データ処理プロセスと関連するフロー・グラフを受けるように構成され、前記フロー・グラフが、複数のノードと、前記複数のノードのうちの2つ以上を連結する複数のエッジとを備え、各ノードが動作を識別し、各エッジは前記連結されたノード間の関係を識別し、
さらに、前記モジュールが、前記複数のノードのうちの第1のノードを前記並列処理装置の第1の処理要素に割り当て、前記複数のノードのうちの第2のノードを前記並列処理装置の第2の処理要素に割り当てるように構成され、それによって、前記第1のノード及び前記第2のノードと関連する動作を並列化する、
前記プロセッサと
を備える、電子装置。
[項目22]
前記フロー・グラフが、拡張可能なマーク付け言語(XML)フォーマットで提供される、
項目21に記載の電子装置。
[項目23]
前記モジュールが、前記複数のノードのうちの前記第1のノードを、前記並列処理装置のメモリ・サブシステムの過去のパフォーマンスに基づいて、前記第1の処理要素に割り当てるように構成される、
項目21に記載の電子装置。
[項目24]
前記並列処理装置の前記メモリ・サブシステムが、所定の期間にわたるメモリ衝突回数をカウントするように構成されるカウンタを備え、
前記メモリ・サブシステムの前記過去のパフォーマンスが、前記カウンタによって計測される前記メモリ衝突回数を備える、
項目23に記載の電子装置。
[項目25]
前記モジュールが、前記複数のノードのうちの前記第1のノードを前記第1の処理要素に割り当てるように構成され、
一方、前記並列処理装置が、前記フロー・グラフの少なくとも一部を作動させている、
項目21に記載の電子装置。
[項目26]
前記モジュールが、複数のフロー・グラフを受けて、前記複数のフロー・グラフと関連するすべての動作を前記並列処理装置の単一の処理要素に割り当てるように構成される、
項目21に記載の電子装置。
[項目27]
前記モジュールが、前記処理要素によるメモリ・アクセスをずらして、メモリ衝突を減少させるように構成される、
項目21に記載の電子装置。
[項目28]
前記電子装置が携帯機器を含む、
項目21に記載の電子装置。
[項目29]
前記フロー・グラフが、前記並列処理装置と関連するアプリケーション・プログラミング・インタフェース(API)を使用して指定される、
項目21に記載の電子装置。
[項目30]
前記モジュールが、入力画像データを複数のストリップに分割し、前記入力画像データの前記複数のストリップのうちの1つを前記複数の処理要素のうちの1つに提供することによって、前記入力画像データを前記複数の処理要素に提供するように構成される、
項目21に記載の電子装置。
[項目31]
前記入力画像データの前記複数のストリップの数が、前記複数の処理要素の数と同じである、
項目30に記載の電子装置。
[項目32]
並列処理装置と通信するプロセッサで、データ処理プロセスと関連し、複数のノードと、前記複数のノードのうちの2つ以上を連結する複数のエッジとを備えたフロー・グラフであって、各ノードが動作を識別し、各エッジが前記連結されたノード間の関係を識別する前記フロー・グラフを受けることと、
前記複数のノードのうちの第1のノードを前記並列処理装置の第1の処理要素に割り当て、前記複数のノードのうちの第2のノードを前記並列処理装置の第2の処理要素に割り当て、それによって、前記第1のノード及び前記第2のノードと関連する動作を並列化することとを含み、
前記並列処理装置がまた、
前記第1の処理要素と関連する第1のメモリ・スライスを含む複数のメモリ・スライスを備えるメモリ・サブシステムであって、前記第1のメモリ・スライスがそれぞれ個々の読み出し及び書き込みポートを有する複数のランダム・アクセス・メモリ(RAM)タイルを備える、前記メモリ・サブシステムと、
前記第1の処理要素、前記第2の処理要素、及び前記メモリ・サブシステムを結合するように構成される相互接続システムであって、前記相互接続システムが、前記第1のメモリ・スライスと前記第1の処理要素とを結合するように構成されるローカル相互接続と、前記第1のメモリ・スライスと前記第2の処理要素とを結合するように構成されるグローバル相互接続とを含む、前記相互接続システムとを含む、
方法。
[項目33]
前記フロー・グラフが、拡張可能なマーク付け言語(XML)フォーマットで提供される、
項目32に記載の方法。
[項目34]
前記複数のノードのうちの前記第1のノードを前記並列処理装置の前記第1の処理要素に割り当てることが、前記複数のノードのうちの前記第1のノードを前記並列処理装置の第1のメモリ・スライスの過去のパフォーマンスに基づいて前記第1の処理要素に割り当てることを含む、
項目32に記載の方法。
[項目35]
前記メモリ・サブシステムのカウンタで、所定の期間にわたる前記第1のメモリ・スライスにおけるメモリ衝突回数をカウントすることをさらに含み、
前記第1のメモリ・スライスの過去のパフォーマンスが、前記第1のメモリ・スライスにおける前記メモリ衝突回数を備える、
項目34に記載の方法。
[項目36]
前記複数のノードのうちの前記第1のノードを前記第1の処理要素に割り当てることが行われ、
一方、前記並列処理装置が、前記フロー・グラフの少なくとも一部を作動させている、
項目32に記載の方法。
[項目37]
メモリ衝突を減少させるために、前記処理要素による前記第1のメモリ・スライスへのメモリ・アクセスをずらすことをさらに含む、
項目32に記載の方法。
[項目38]
前記フロー・グラフが、前記並列処理装置と関連するアプリケーション・プログラミング・インタフェース(API)を使用して指定される、
項目32に記載の方法。
[項目39]
入力画像データを複数のストリップに分割することによって、前記入力画像データを前記複数の処理要素に提供することと、
前記入力画像データの前記複数のストリップのうちの1つを前記複数の処理要素のうちの1つに提供することとをさらに含む、
項目32に記載の方法。
[項目40]
前記入力画像データの前記複数のストリップの数が、前記複数の処理要素の数と同じである、
項目39に記載の方法。
Claims (33)
- 集積回路であって、
第1のレイテンシを有する第1の処理要素と、
第2のレイテンシを有する第2の処理要素と、
第1のアドレス・エンコーダと、
第2のアドレス・エンコーダと、
(A)前記第1の処理要素から前記第1のアドレス・エンコーダへのメモリにアクセスするための第1の要求と、(B)前記第2の処理要素から前記第2のアドレス・エンコーダへの前記メモリにアクセスするための第2の要求とを送る相互接続システムと、
第1の衝突検出器と、
第2の衝突検出器と、
分散型調停回路であり、
前記第1の衝突検出器に前記第1のアドレス・エンコーダの第1の出力部を結合するとともに、前記第2の衝突検出器に前記第2のアドレス・エンコーダの第2の出力部を結合し、
(A)前記第1の衝突検出器によって決定された前記第1の出力部における第1の値と(B)前記第2の衝突検出器によって決定された前記第2の出力部における第2の値とに基づき、前記メモリにアクセスを要求した前記第1の処理要素及び前記第2の処理要素の数を同時に決定し、
前記数に基づいて前記メモリにアクセスするための前記第1の要求及び前記メモリにアクセスするための前記第2の要求の衝突を検出する、
分散型調停回路と、
を備える集積回路。 - 前記第1のアドレス・エンコーダは、前記メモリにアクセスするための前記第1の要求の第1のターゲット・アドレスを判定し、前記第2のアドレス・エンコーダは、前記メモリにアクセスするための前記第2の要求の第2のターゲット・アドレスを判定する、請求項1に記載の集積回路。
- ターゲット・アドレスが所定の範囲に含まれる場合、前記第1のアドレス・エンコーダは、前記第1の値を生成し、前記第2のアドレス・エンコーダは、前記第2の値を生成するものである、請求項1に記載の集積回路。
- 前記第1の値は、前記第1の処理要素が前記メモリにアクセスを要求したかどうかを示し、前記第2の値は、前記第2の処理要素が前記メモリにアクセスを要求したかどうかを示す、請求項1に記載の集積回路。
- 前記分散型調停回路は、前記第1の値及び前記第2の値の合計が1より多い場合に前記衝突を報告する、請求項1に記載の集積回路。
- 前記分散型調停回路は、前記衝突を検出することに応じて、リクエスタに停止信号を送る、請求項1に記載の集積回路。
- 前記メモリのRAMタイルに関連する第1の範囲比較ブロックと、
前記メモリの前記RAMタイルに関連する第2の範囲比較ブロックと、
前記第1の範囲比較ブロック及び前記第2の範囲比較ブロックの出力部に通信可能に接続されるORゲートと、
を更に含み、
前記ORゲートの出力は、衝突に応答して停止信号を送るよう前記第1の処理要素及び前記第2の処理要素のうちの1つに通信可能に接続されている、請求項1に記載の集積回路。 - 前記分散型調停回路は、前記第1の処理要素及び前記第2の処理要素に関連するクライアント要求ベクトルを検索して、前記クライアント要求ベクトルのビット位置に基づいて前記メモリにアクセスするための前記第1の要求及び前記メモリにアクセスするための前記第2の要求を判定する、請求項1に記載の集積回路。
- 前記クライアント要求ベクトルは、前記メモリにアクセスするための前記第1の要求及び前記メモリにアクセスするための前記第2の要求に関連付けられており、前記メモリが第1のメモリ・スライス又は第2のメモリ・スライスのうちの1つを含む、請求項8に記載の集積回路。
- 前記メモリにアクセスするための前記第1の要求及び前記メモリにアクセスするための前記第2の要求のうちどれが優先ベクトルに基づいて前記第1のメモリ・スライス又は前記第2のメモリ・スライスのうちの前記1つに割り当てられるかを判定するためのポート勝者選択部を更に含む、請求項9に記載の集積回路。
- 前記第1のメモリ・スライス及び前記第2のメモリ・スライスにアクセスするための要求に応答して、比較した場合に最も高い入力ベクトルのランクに関連する前記第1のメモリ・スライス及び前記第2のメモリ・スライスのうちの勝ったものを選択してリソースの過度の割り当てを避けるための勝者検出部を更に含む、請求項9に記載の集積回路。
- 命令を備えるコンピュータ可読媒体であって、
前記命令は、実行された場合に、集積回路を含む1つ以上のプロセッサにより、少なくとも、
(A)第1のレイテンシを有する第1の処理要素から第1のアドレス・エンコーダへのメモリにアクセスするための第1の要求と、(B)第2のレイテンシを有する第2の処理要素から第2のアドレス・エンコーダへの前記メモリにアクセスするための第2の要求と、を送ることと、
(A)第1の衝突検出器に前記第1のアドレス・エンコーダの第1の出力部を、(B)第2の衝突検出器に前記第2のアドレス・エンコーダの第2の出力部を、結合することと、
(A)前記第1の衝突検出器によって決定された前記第1の出力部における第1の値と(B)前記第2の衝突検出器によって決定された前記第2の出力部における第2の値とに基づき、前記メモリにアクセスを要求した前記第1の処理要素及び前記第2の処理要素の数を同時に決定することと、
前記数に基づいて前記メモリにアクセスするための前記第1の要求及び前記メモリにアクセスするための前記第2の要求の衝突を検出することと、
を実行させる、コンピュータ可読媒体。 - 前記命令は、実行された場合に、前記集積回路を含む前記1つ以上のプロセッサに、
前記メモリにアクセスするための前記第1の要求の第1のターゲット・アドレス、及び前記メモリにアクセスするための前記第2の要求の第2のターゲット・アドレスを識別することを実行させる、請求項12に記載のコンピュータ可読媒体。 - 前記命令は、実行された場合に、前記集積回路を含む前記1つ以上のプロセッサに、
ターゲット・アドレスが所定の範囲に含まれるときに、前記第1の値及び前記第2の値を生成することを実行させる、請求項12に記載のコンピュータ可読媒体。 - 前記第1の値は、前記第1の処理要素が前記メモリにアクセスを要求したかどうかを示し、前記第2の値は、前記第2の処理要素が前記メモリにアクセスを要求したかどうかを示す、請求項12に記載のコンピュータ可読媒体。
- 前記命令は、実行された場合に、前記集積回路を含む前記1つ以上のプロセッサに、
前記第1の値及び前記第2の値の合計が1より多いときに前記衝突を報告すること、を実行させる、請求項12に記載のコンピュータ可読媒体。 - 前記命令は、実行された場合に、前記集積回路を含む前記1つ以上のプロセッサに、
前記衝突の検出に応答して、リクエスタに停止信号を送ることを実行させる、請求項12に記載のコンピュータ可読媒体。 - 前記命令は、実行された場合に、前記集積回路を含む前記1つ以上のプロセッサに、さらに、
前記メモリのRAMタイルに第1の範囲比較ブロックを関連付けること、
前記メモリの前記RAMタイルに第2の範囲比較ブロックを関連付けること、
前記衝突に応答して停止信号を送ることであり、前記停止信号は、前記第1の範囲比較ブロックの第1の出力部および第2の範囲比較ブロックの第2の出力部に結合されたORゲートによって実行されるOR演算の結果として生じる、送ること、
を実行させる、請求項12に記載のコンピュータ可読媒体。 - 前記命令は、実行された場合に、前記集積回路を含む前記1つ以上のプロセッサに、さらに、
前記第1の処理要素および前記第2の処理要素に関連するクライアント要求ベクトルを検索して、前記クライアント要求ベクトルのビット位置に基づき前記メモリにアクセスするための前記第1の要求及び前記メモリにアクセスするための前記第2の要求を判定することを実行させる、請求項12に記載のコンピュータ可読媒体。 - 前記命令は、実行された場合に、前記集積回路を含む前記1つ以上のプロセッサに、さらに、前記クライアント要求ベクトルを前記メモリにアクセスするための前記第1の要求及び前記メモリにアクセスするための前記第2の要求に関連付けることであり、前記メモリが、第1のメモリ・スライス又は第2のメモリ・スライスのうちの1つを含む、関連付けること、を実行させる、請求項19に記載のコンピュータ可読媒体。
- 前記命令は、実行された場合に、前記集積回路を含む前記1つ以上のプロセッサに、さらに、前記メモリにアクセスするための前記第1の要求及び前記メモリにアクセスするための前記第2の要求のうちどれが優先ベクトルに基づいて前記第1のメモリ・スライス又は前記第2のメモリ・スライスのうちの前記1つに割り当てられるかを判定すること、を実行させる請求項20に記載のコンピュータ可読媒体。
- 前記命令は、実行された場合に、前記集積回路を含む前記1つ以上のプロセッサに、さらに、
前記第1のメモリ・スライス及び前記第2のメモリ・スライスにアクセスするための要求に応答して、比較した場合に最も高い入力ベクトルランクに関連する前記第1のメモリ・スライス及び前記第2のメモリ・スライスのうちの勝ったものを選択してリソースの過度の割り当てを避けること、を実行させる請求項20に記載のコンピュータ可読媒体。 - 方法であって、
(A)第1のレイテンシを有する第1の処理要素から第1のアドレス・エンコーダへのメモリにアクセスするための第1の要求と、(B)第2のレイテンシを有する第2の処理要素から第2のアドレス・エンコーダへの前記メモリにアクセスするための第2の要求と、を送るステップと、
(A)第1の衝突検出器に前記第1のアドレス・エンコーダの第1の出力部を、(B)第2の衝突検出器に前記第2のアドレス・エンコーダの第2の出力部を、結合するステップと、
(A)前記第1の衝突検出器によって決定された前記第1の出力部における第1の値と(B)前記第2の衝突検出器によって決定された前記第2の出力部における第2の値とに基づき、前記メモリにアクセスを要求した前記第1の処理要素及び前記第2の処理要素の数を同時に決定するステップと、
前記数に基づいて前記メモリにアクセスするための前記第1の要求及び前記メモリにアクセスするための前記第2の要求の衝突を検出するステップと、
を含む方法。 - 前記メモリにアクセスするための前記第1の要求の第1のターゲット・アドレス、及び前記メモリにアクセスするための前記第2の要求の第2のターゲット・アドレスを識別するステップをさらに含む、請求項23に記載の方法。
- ターゲット・アドレスが所定の範囲に含まれるときに前記第1の値及び前記第2の値を生成するステップをさらに含む、請求項23に記載の方法。
- 前記第1の値は、前記第1の処理要素が前記メモリにアクセスを要求したかどうかを示し、前記第2の値は、前記第2の処理要素が前記メモリにアクセスを要求したかどうかを示す、請求項23に記載の方法。
- 前記第1の値及び前記第2の値の合計が1より多いときに前記衝突を報告するステップをさらに含む、請求項23に記載の方法。
- 前記衝突の検出に応答して、リクエスタに停止信号を送るステップをさらに含む、請求項23に記載の方法。
- 前記メモリのRAMタイルに第1の範囲比較ブロックを関連付けるステップと、
前記メモリの前記RAMタイルに第2の範囲比較ブロックを関連付けるステップと、
前記衝突に応答して停止信号を送るステップであり、前記停止信号は、前記第1の範囲比較ブロックの第1の出力部および第2の範囲比較ブロックの第2の出力部に結合されたORゲートによって実行されるOR演算の結果として生じる、送るステップと、
をさらに含む、請求項23に記載の方法。 - 前記第1の処理要素および前記第2の処理要素に関連するクライアント要求ベクトルを検索して、前記クライアント要求ベクトルのビット位置に基づき前記メモリにアクセスするための前記第1の要求及び前記メモリにアクセスするための前記第2の要求を判定するステップをさらに含む、請求項23に記載の方法。
- 前記クライアント要求ベクトルを前記メモリにアクセスするための前記第1の要求及び前記メモリにアクセスするための前記第2の要求に関連付けるステップであり、前記メモリが、第1のメモリ・スライス又は第2のメモリ・スライスのうちの1つを含む、ステップをさらに含む、請求項30に記載の方法。
- 前記メモリにアクセスするための前記第1の要求及び前記メモリにアクセスするための前記第2の要求のうちどれが優先ベクトルに基づいて前記第1のメモリ・スライス又は前記第2のメモリ・スライスのうちの前記1つに割り当てられるかを判定するステップをさらに含む、請求項31に記載の方法。
- 前記第1のメモリ・スライス及び前記第2のメモリ・スライスにアクセスするための要求に応答して、比較した場合に最も高い入力ベクトルランクに関連する前記第1のメモリ・スライス及び前記第2のメモリ・スライスのうちの勝ったものを選択してリソースの過度の割り当てを避けるステップをさらに含む、請求項31に記載の方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022004451A JP7384534B2 (ja) | 2013-08-08 | 2022-01-14 | 並列処理装置、コンピュータ可読記憶装置および方法 |
Applications Claiming Priority (8)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
GB1314263.3 | 2013-08-08 | ||
GBGB1314263.3A GB201314263D0 (en) | 2013-08-08 | 2013-08-08 | Configurable and composable computational imaging pipeline |
ROA/00812 | 2013-11-06 | ||
ROA201300812A RO129804A0 (ro) | 2013-11-06 | 2013-11-06 | Aparat, sistem şi metodă pentru a realiza o bandă configurabilă şi extensibilă de procesare de imagini |
US14/082,645 | 2013-11-18 | ||
US14/082,645 US9146747B2 (en) | 2013-08-08 | 2013-11-18 | Apparatus, systems, and methods for providing configurable computational imaging pipeline |
US14/082,396 | 2013-11-18 | ||
US14/082,396 US9934043B2 (en) | 2013-08-08 | 2013-11-18 | Apparatus, systems, and methods for providing computational imaging pipeline |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016532759A Division JP6571078B2 (ja) | 2013-08-08 | 2014-08-06 | メモリにアクセスするための並列処理装置、コンピュータにより実施される方法、システム、コンピュータ可読媒体 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022004451A Division JP7384534B2 (ja) | 2013-08-08 | 2022-01-14 | 並列処理装置、コンピュータ可読記憶装置および方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019220201A JP2019220201A (ja) | 2019-12-26 |
JP7025617B2 true JP7025617B2 (ja) | 2022-02-25 |
Family
ID=52449645
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016532759A Active JP6571078B2 (ja) | 2013-08-08 | 2014-08-06 | メモリにアクセスするための並列処理装置、コンピュータにより実施される方法、システム、コンピュータ可読媒体 |
JP2019145645A Active JP7025617B2 (ja) | 2013-08-08 | 2019-08-07 | メモリにアクセスするための並列処理装置、コンピュータにより実施される方法、システム、コンピュータ可読媒体 |
JP2022004451A Active JP7384534B2 (ja) | 2013-08-08 | 2022-01-14 | 並列処理装置、コンピュータ可読記憶装置および方法 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016532759A Active JP6571078B2 (ja) | 2013-08-08 | 2014-08-06 | メモリにアクセスするための並列処理装置、コンピュータにより実施される方法、システム、コンピュータ可読媒体 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022004451A Active JP7384534B2 (ja) | 2013-08-08 | 2022-01-14 | 並列処理装置、コンピュータ可読記憶装置および方法 |
Country Status (6)
Country | Link |
---|---|
US (6) | US9934043B2 (ja) |
EP (1) | EP3031047A2 (ja) |
JP (3) | JP6571078B2 (ja) |
KR (4) | KR102340003B1 (ja) |
CN (2) | CN105765623B (ja) |
WO (1) | WO2015019197A2 (ja) |
Families Citing this family (72)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9378560B2 (en) * | 2011-06-17 | 2016-06-28 | Advanced Micro Devices, Inc. | Real time on-chip texture decompression using shader processors |
US9934043B2 (en) | 2013-08-08 | 2018-04-03 | Linear Algebra Technologies Limited | Apparatus, systems, and methods for providing computational imaging pipeline |
US11768689B2 (en) | 2013-08-08 | 2023-09-26 | Movidius Limited | Apparatus, systems, and methods for low power computational imaging |
WO2015060845A1 (en) * | 2013-10-23 | 2015-04-30 | Intel Corporation | Emi mitigation on high-speed lanes using false stall |
KR102103543B1 (ko) * | 2013-11-28 | 2020-05-29 | 삼성전자 주식회사 | 내부 하드웨어 필터를 포함하는 일체형 데이터 저장 장치, 이의 동작 방법, 및 상기 데이터 저장 장치를 포함하는 시스템 |
US10635544B1 (en) * | 2014-03-13 | 2020-04-28 | EMC IP Holding Company LLC | Assigning VMware local proxy host-datastore groups for consistently optimized access |
US9542321B2 (en) * | 2014-04-24 | 2017-01-10 | Avago Technologies General Ip (Singapore) Pte. Ltd. | Slice-based random access buffer for data interleaving |
KR102273023B1 (ko) * | 2014-10-16 | 2021-07-05 | 삼성전자주식회사 | 화질 개선 알고리즘 처리 방법 및 장치 |
US12026095B2 (en) | 2014-12-30 | 2024-07-02 | Arteris, Inc. | Cache coherent system implementing victim buffers |
US10255183B2 (en) * | 2015-07-23 | 2019-04-09 | Arteris, Inc. | Victim buffer for cache coherent systems |
US9818166B2 (en) | 2015-01-16 | 2017-11-14 | Intel Corporation | Graph-based application programming interface architectures with producer/consumer nodes for enhanced image processing parallelism |
US9710876B2 (en) | 2015-01-16 | 2017-07-18 | Intel Corporation | Graph-based application programming interface architectures with equivalency classes for enhanced image processing parallelism |
KR102106541B1 (ko) | 2015-03-18 | 2020-05-04 | 삼성전자주식회사 | 공유 리소스 액세스 중재 방법 및 이를 수행하기 위한 공유 리소스 액세스 중재 장치 및 공유 리소스 액세스 중재 시스템 |
US10691463B2 (en) * | 2015-07-30 | 2020-06-23 | Futurewei Technologies, Inc. | System and method for variable lane architecture |
US11120884B2 (en) | 2015-09-30 | 2021-09-14 | Sunrise Memory Corporation | Implementing logic function and generating analog signals using NOR memory strings |
US10169073B2 (en) | 2015-12-20 | 2019-01-01 | Intel Corporation | Hardware accelerators and methods for stateful compression and decompression operations |
US10055807B2 (en) | 2016-03-02 | 2018-08-21 | Samsung Electronics Co., Ltd. | Hardware architecture for acceleration of computer vision and imaging processing |
WO2017163591A1 (ja) * | 2016-03-24 | 2017-09-28 | 富士フイルム株式会社 | 画像処理装置、画像処理方法、及び画像処理プログラム |
CN108475213B (zh) * | 2016-03-24 | 2021-11-30 | 富士胶片商业创新有限公司 | 图像处理装置、图像处理方法和图像处理程序 |
JP6592184B2 (ja) * | 2016-03-24 | 2019-10-16 | 富士フイルム株式会社 | 画像処理装置、画像処理方法、及び画像処理プログラム |
US10460704B2 (en) | 2016-04-01 | 2019-10-29 | Movidius Limited | Systems and methods for head-mounted display adapted to human visual mechanism |
WO2017201475A1 (en) * | 2016-05-19 | 2017-11-23 | Integnology Corporation | Systems and methods for non-disruptive continuous software delivery |
US10310897B2 (en) * | 2016-09-30 | 2019-06-04 | Intel Corporation | Hardware accelerators and methods for offload operations |
US20180122038A1 (en) * | 2016-10-28 | 2018-05-03 | Qualcomm Incorporated | Multi-layer fetch during composition |
US10567248B2 (en) * | 2016-11-29 | 2020-02-18 | Intel Corporation | Distributed assignment of video analytics tasks in cloud computing environments to reduce bandwidth utilization |
US10387160B2 (en) * | 2017-04-01 | 2019-08-20 | Intel Corporation | Shared local memory tiling mechanism |
CN108733311B (zh) * | 2017-04-17 | 2021-09-10 | 伊姆西Ip控股有限责任公司 | 用于管理存储系统的方法和设备 |
US10505860B1 (en) * | 2017-05-30 | 2019-12-10 | Xilinx, Inc. | System and method for round robin scheduling |
US10600147B2 (en) * | 2017-08-22 | 2020-03-24 | Intel Corporation | Efficient memory layout for enabling smart data compression in machine learning environments |
US10474600B2 (en) | 2017-09-14 | 2019-11-12 | Samsung Electronics Co., Ltd. | Heterogeneous accelerator for highly efficient learning systems |
US11360934B1 (en) | 2017-09-15 | 2022-06-14 | Groq, Inc. | Tensor streaming processor architecture |
US11243880B1 (en) | 2017-09-15 | 2022-02-08 | Groq, Inc. | Processor architecture |
US11114138B2 (en) | 2017-09-15 | 2021-09-07 | Groq, Inc. | Data structures with multiple read ports |
US11868804B1 (en) | 2019-11-18 | 2024-01-09 | Groq, Inc. | Processor instruction dispatch configuration |
US11170307B1 (en) | 2017-09-21 | 2021-11-09 | Groq, Inc. | Predictive model compiler for generating a statically scheduled binary with known resource constraints |
WO2019086764A1 (en) * | 2017-11-06 | 2019-05-09 | Basemark Oy | Graphics engine resource management and allocation system |
US10475151B2 (en) * | 2017-11-06 | 2019-11-12 | Basemark Oy | Graphics engine resource management and allocation system |
WO2019086765A1 (en) * | 2017-11-06 | 2019-05-09 | Basemark Oy | Combined rendering and compute resource allocation management system |
JP7074777B2 (ja) * | 2017-11-20 | 2022-05-24 | シャンハイ カンブリコン インフォメーション テクノロジー カンパニー リミテッド | タスク並列処理方法、装置、システム、記憶媒体およびコンピュータ機器 |
CN108076287B (zh) * | 2017-12-14 | 2020-01-03 | 维沃移动通信有限公司 | 一种图像处理方法、移动终端及计算机可读存储介质 |
US10949947B2 (en) | 2017-12-29 | 2021-03-16 | Intel Corporation | Foveated image rendering for head-mounted display devices |
US10416899B2 (en) * | 2018-02-13 | 2019-09-17 | Tesla, Inc. | Systems and methods for low latency hardware memory management |
US10679070B1 (en) * | 2018-02-23 | 2020-06-09 | Facebook, Inc. | Systems and methods for a video understanding platform |
CN110555793B (zh) * | 2018-06-04 | 2023-03-14 | 北京亮亮视野科技有限公司 | 高效的深度卷积实现方法及包括该方法的视觉处理方法 |
US11579921B2 (en) * | 2018-08-29 | 2023-02-14 | Alibaba Group Holding Limited | Method and system for performing parallel computations to generate multiple output feature maps |
US10922203B1 (en) * | 2018-09-21 | 2021-02-16 | Nvidia Corporation | Fault injection architecture for resilient GPU computing |
US11537687B2 (en) | 2018-11-19 | 2022-12-27 | Groq, Inc. | Spatial locality transform of matrices |
CN112005275B (zh) * | 2018-11-26 | 2023-04-21 | 北京嘀嘀无限科技发展有限公司 | 使用视频内存池进行点云渲染的系统和方法 |
US10963384B2 (en) * | 2018-12-19 | 2021-03-30 | SimpleMachines Inc. | Method, computer program product, and apparatus for acceleration of simultaneous access to shared data |
CN113383415A (zh) | 2019-01-30 | 2021-09-10 | 日升存储公司 | 使用晶片键合的具有嵌入式高带宽、高容量存储器的设备 |
CN110032452B (zh) | 2019-04-19 | 2021-08-24 | 上海兆芯集成电路有限公司 | 处理系统与异构处理器加速方法 |
CN110032453B (zh) | 2019-04-19 | 2022-05-03 | 上海兆芯集成电路有限公司 | 用以任务调度与分配的处理系统及其加速方法 |
CN110058931B (zh) | 2019-04-19 | 2022-03-22 | 上海兆芯集成电路有限公司 | 用以任务调度的处理系统及其加速方法 |
CN110083387B (zh) * | 2019-04-19 | 2021-11-12 | 上海兆芯集成电路有限公司 | 使用轮询机制的处理系统及其访存方法 |
CN110046053B (zh) | 2019-04-19 | 2021-11-12 | 上海兆芯集成电路有限公司 | 用以分配任务的处理系统及其访存方法 |
US11074213B2 (en) * | 2019-06-29 | 2021-07-27 | Intel Corporation | Apparatuses, methods, and systems for vector processor architecture having an array of identical circuit blocks |
US11269777B2 (en) | 2019-09-25 | 2022-03-08 | Facebook Technologies, Llc. | Systems and methods for efficient data buffering |
CN114930351A (zh) | 2019-11-26 | 2022-08-19 | 格罗克公司 | 使用仅单个侧从多维阵列加载操作数并输出结果 |
WO2021127218A1 (en) | 2019-12-19 | 2021-06-24 | Sunrise Memory Corporation | Process for preparing a channel region of a thin-film transistor |
CN113254070B (zh) | 2020-02-07 | 2024-01-02 | 阿里巴巴集团控股有限公司 | 加速单元、片上系统、服务器、数据中心和相关方法 |
CN115413367A (zh) | 2020-02-07 | 2022-11-29 | 日升存储公司 | 具有低有效延迟的高容量存储器电路 |
WO2021158994A1 (en) | 2020-02-07 | 2021-08-12 | Sunrise Memory Corporation | Quasi-volatile system-level memory |
US11507301B2 (en) | 2020-02-24 | 2022-11-22 | Sunrise Memory Corporation | Memory module implementing memory centric architecture |
US11561911B2 (en) | 2020-02-24 | 2023-01-24 | Sunrise Memory Corporation | Channel controller for shared memory access |
US12001929B2 (en) * | 2020-04-01 | 2024-06-04 | Samsung Electronics Co., Ltd. | Mixed-precision neural processing unit (NPU) using spatial fusion with load balancing |
US11287869B2 (en) * | 2020-04-30 | 2022-03-29 | Marvell Asia Pte Ltd | System and methods for on-chip memory (OCM) port throttling for machine learning operations |
CN113744114A (zh) * | 2020-05-27 | 2021-12-03 | 京东方科技集团股份有限公司 | 基于8k视频系统的矢量图绘制方法及装置、存储介质 |
CN112328522B (zh) * | 2020-11-26 | 2023-05-26 | 北京润科通用技术有限公司 | 数据处理方法和装置 |
US11810640B2 (en) | 2021-02-10 | 2023-11-07 | Sunrise Memory Corporation | Memory interface with configurable high-speed serial data lanes for high bandwidth memory |
US11921559B2 (en) * | 2021-05-03 | 2024-03-05 | Groq, Inc. | Power grid distribution for tensor streaming processors |
US20230333746A1 (en) * | 2022-04-13 | 2023-10-19 | Nvidia Corporation | Speculative remote memory operation tracking for efficient memory barrier |
US12079510B2 (en) | 2022-09-08 | 2024-09-03 | Samsung Electronics Co., Ltd. | Systems and methods for executing data processing functions |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001344195A (ja) | 2000-05-30 | 2001-12-14 | Nec Kofu Ltd | マルチプロセッサシステムとその排他制御の調停方法 |
WO2010086919A1 (ja) | 2009-01-27 | 2010-08-05 | パナソニック株式会社 | メモリアクセス装置およびその関連技術 |
Family Cites Families (110)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB710876A (en) | 1951-04-27 | 1954-06-23 | Chamberlain & Hookham Ltd | Protective apparatus for electricity distributing systems |
US4281312A (en) | 1975-11-04 | 1981-07-28 | Massachusetts Institute Of Technology | System to effect digital encoding of an image |
GB1488538A (en) | 1975-11-28 | 1977-10-12 | Ibm | Compressed refresh buffer |
US4562435A (en) * | 1982-09-29 | 1985-12-31 | Texas Instruments Incorporated | Video display system using serial/parallel access memories |
JPS6015771A (ja) | 1983-07-08 | 1985-01-26 | Hitachi Ltd | ベクトルプロセッサ |
US5226171A (en) | 1984-12-03 | 1993-07-06 | Cray Research, Inc. | Parallel vector processing system for individual and broadcast distribution of operands and control information |
US5081573A (en) | 1984-12-03 | 1992-01-14 | Floating Point Systems, Inc. | Parallel processing system |
CA1236584A (en) | 1984-12-03 | 1988-05-10 | William E. Hall | Parallel processing system |
JPH0731669B2 (ja) | 1986-04-04 | 1995-04-10 | 株式会社日立製作所 | ベクトル・プロセツサ |
GB2190560B (en) | 1986-05-08 | 1990-06-20 | Gen Electric Plc | Data compression |
JPH02290626A (ja) | 1989-04-27 | 1990-11-30 | Nhk Spring Co Ltd | 金属ベローズの製造方法および製造装置 |
JPH04246745A (ja) * | 1991-02-01 | 1992-09-02 | Canon Inc | 情報処理装置及びその方法 |
US5434623A (en) | 1991-12-20 | 1995-07-18 | Ampex Corporation | Method and apparatus for image data compression using combined luminance/chrominance coding |
US6104836A (en) | 1992-02-19 | 2000-08-15 | 8×8, Inc. | Computer architecture for video data processing and method thereof |
US5262973A (en) | 1992-03-13 | 1993-11-16 | Sun Microsystems, Inc. | Method and apparatus for optimizing complex arithmetic units for trivial operands |
US5861873A (en) | 1992-06-29 | 1999-01-19 | Elonex I.P. Holdings, Ltd. | Modular portable computer with removable pointer device |
JP3042969B2 (ja) | 1993-07-28 | 2000-05-22 | 凸版印刷株式会社 | ゴルフボール用転写箔及びそれを用いたゴルフボールの製造方法並びにゴルフボール |
JP3670041B2 (ja) | 1993-12-10 | 2005-07-13 | アドバンスト・マイクロ・ディバイシズ・インコーポレイテッド | 不揮発性メモリチップイネーブル符号化方法、コンピュータシステム、およびメモリコントローラ |
FI97096C (fi) | 1994-09-13 | 1996-10-10 | Nokia Mobile Phones Ltd | Videonkompressiomenetelmä |
GB2311882B (en) | 1996-04-04 | 2000-08-09 | Videologic Ltd | A data processing management system |
US6184709B1 (en) * | 1996-04-09 | 2001-02-06 | Xilinx, Inc. | Programmable logic device having a composable memory array overlaying a CLB array |
US5796269A (en) * | 1996-04-09 | 1998-08-18 | Xilinx, Inc. | Composable memory array for a programmable logic device and method for implementing same |
JP3042969U (ja) | 1997-04-28 | 1997-11-04 | 朝日印刷紙器株式会社 | トレー兼用弁当容器 |
JPH1185512A (ja) | 1997-09-03 | 1999-03-30 | Fujitsu Ltd | 命令圧縮格納および命令復元機能を有するデータ処理装置 |
US6173389B1 (en) | 1997-12-04 | 2001-01-09 | Billions Of Operations Per Second, Inc. | Methods and apparatus for dynamic very long instruction word sub-instruction selection for execution time parallelism in an indirect very long instruction word processor |
US6366999B1 (en) | 1998-01-28 | 2002-04-02 | Bops, Inc. | Methods and apparatus to support conditional execution in a VLIW-based array processor with subword execution |
AU4326699A (en) | 1998-05-30 | 1999-12-20 | Board Of Trustees Of The Leland Stanford Junior University | Low-power parallel processor and imager integrated circuit |
WO2000004484A2 (en) | 1998-07-17 | 2000-01-27 | Intergraph Corporation | Wide instruction word graphics processor |
US6839728B2 (en) | 1998-10-09 | 2005-01-04 | Pts Corporation | Efficient complex multiplication and fast fourier transform (FFT) implementation on the manarray architecture |
US6757019B1 (en) | 1999-03-13 | 2004-06-29 | The Board Of Trustees Of The Leland Stanford Junior University | Low-power parallel processor and imager having peripheral control circuitry |
GB2348971B (en) | 1999-04-09 | 2004-03-03 | Pixelfusion Ltd | Parallel data processing systems |
US7526630B2 (en) * | 1999-04-09 | 2009-04-28 | Clearspeed Technology, Plc | Parallel data processing apparatus |
EP1181648A1 (en) | 1999-04-09 | 2002-02-27 | Clearspeed Technology Limited | Parallel data processing apparatus |
US20080007562A1 (en) | 1999-04-09 | 2008-01-10 | Dave Stuttard | Parallel data processing apparatus |
US6329162B1 (en) | 1999-04-16 | 2001-12-11 | Anticancer, Inc. | Biological fluid assay methods |
JP3412554B2 (ja) | 1999-04-16 | 2003-06-03 | 日本電気株式会社 | バス調停回路 |
US6523110B1 (en) | 1999-07-23 | 2003-02-18 | International Business Machines Corporation | Decoupled fetch-execute engine with static branch prediction support |
US6665708B1 (en) * | 1999-11-12 | 2003-12-16 | Telefonaktiebolaget Lm Ericsson (Publ) | Coarse grained determination of data dependence between parallel executed jobs in an information processing system |
US6591019B1 (en) | 1999-12-07 | 2003-07-08 | Nintendo Co., Ltd. | 3D transformation matrix compression and decompression |
US6859870B1 (en) | 2000-03-07 | 2005-02-22 | University Of Washington | Method and apparatus for compressing VLIW instruction and sharing subinstructions |
US6779066B2 (en) | 2000-05-01 | 2004-08-17 | Matsushita Electric Industrial Co., Ltd. | Module having application-specific program stored therein |
GB2362055A (en) | 2000-05-03 | 2001-11-07 | Clearstream Tech Ltd | Image compression using a codebook |
WO2001084849A1 (en) | 2000-05-03 | 2001-11-08 | Clearstream Technologies Limited | Video data transmission |
GB2366643B (en) | 2000-05-25 | 2002-05-01 | Siroyan Ltd | Methods of compressing instructions for processors |
US7538772B1 (en) * | 2000-08-23 | 2009-05-26 | Nintendo Co., Ltd. | Graphics processing system with enhanced memory controller |
KR100466689B1 (ko) * | 2000-08-28 | 2005-01-24 | 인터내셔널 비지네스 머신즈 코포레이션 | 콤팩트형 이중 포트 동적 랜덤 액세스 메모리 아키텍쳐 시스템 및 그 제조 방법 |
CA2357236C (en) | 2000-10-17 | 2011-09-06 | Spx Development Corporation | Plug-in module for portable computing device |
US7305092B2 (en) | 2000-12-19 | 2007-12-04 | Qualcomm Incorporated | Method and system to accelerate cryptographic functions for secure e-commerce applications |
EP1241892A1 (de) | 2001-03-06 | 2002-09-18 | Siemens Aktiengesellschaft | Hardware-Accelerator eines Systems zur Videoverarbeitung |
US6813390B2 (en) | 2001-07-25 | 2004-11-02 | Koninklijke Philips Electronics N.V. | Scalable expandable system and method for optimizing a random system of algorithms for image quality |
JP2004527172A (ja) | 2001-03-29 | 2004-09-02 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 画像品質についてのアルゴリズムのランダムシステムを最適化するための拡張可能なシステム及び方法 |
JP3956652B2 (ja) * | 2001-06-06 | 2007-08-08 | 株式会社日立製作所 | プロセッサシステム |
US20030005261A1 (en) | 2001-06-29 | 2003-01-02 | Gad Sheaffer | Method and apparatus for attaching accelerator hardware containing internal state to a processing core |
US20030149822A1 (en) | 2002-02-01 | 2003-08-07 | Bryan Scott | Method for integrating an intelligent docking station with a handheld personal computer |
KR100464406B1 (ko) | 2002-02-08 | 2005-01-03 | 삼성전자주식회사 | 가변길이 vliw 명령어를 위한 디스패치 장치 및 방법 |
US6963342B2 (en) * | 2002-02-28 | 2005-11-08 | Sun Microsystems, Inc. | Arbitration scheme for efficient parallel processing |
WO2003088033A1 (en) | 2002-04-09 | 2003-10-23 | University Of Rochester | Multiplier-based processor-in-memory architectures for image and graphics processing |
JP4566738B2 (ja) * | 2002-05-24 | 2010-10-20 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | コンピュータメモリ装置 |
US7386704B2 (en) | 2002-10-31 | 2008-06-10 | Lockheed Martin Corporation | Pipeline accelerator including pipeline circuits in communication via a bus, and related system and method |
US7088777B2 (en) | 2002-11-22 | 2006-08-08 | Microsoft Corp. | System and method for low bit rate watercolor video |
JP4266619B2 (ja) | 2002-11-25 | 2009-05-20 | 株式会社ルネサステクノロジ | 調停回路 |
US7038687B2 (en) | 2003-06-30 | 2006-05-02 | Intel Corporation | System and method for high-speed communications between an application processor and coprocessor |
US20080074431A1 (en) | 2003-11-19 | 2008-03-27 | Reuven Bakalash | Computing system capable of parallelizing the operation of multiple graphics processing units (GPUS) supported on external graphics cards |
JPWO2005051099A1 (ja) | 2003-11-28 | 2007-12-06 | 株式会社医食同源社 | 豆類食材及びその製造方法、並びに当該豆類食材を用いた加工食品 |
US8028164B2 (en) | 2004-03-19 | 2011-09-27 | Nokia Corporation | Practical and secure storage encryption |
US7196708B2 (en) | 2004-03-31 | 2007-03-27 | Sony Corporation | Parallel vector processing |
EP1815317A2 (en) * | 2004-08-31 | 2007-08-08 | Silicon Optix | Method and apparatus for reading and writing pixel-aligned subframes in a frame buffer |
KR100618860B1 (ko) * | 2004-09-09 | 2006-08-31 | 삼성전자주식회사 | 메모리 장치의 리프레쉬시 센싱 노이즈를 감소시킬 수있는 어드레스 코딩 방법 및 이를 구현한 어드레스 디코더 |
EP1913771A2 (en) * | 2005-08-02 | 2008-04-23 | Koninklijke Philips Electronics N.V. | Display device |
KR100707203B1 (ko) | 2005-08-04 | 2007-04-13 | 삼성전자주식회사 | 3차원 그래픽스 가속 장치에 공급되는 전압을 제어하는장치 및 방법, 그를 이용한 3차원 그래픽스 가속 장치 |
US8074031B2 (en) * | 2005-12-20 | 2011-12-06 | Nxp B.V. | Multi-processor circuit with shared memory banks |
JP2007207024A (ja) | 2006-02-02 | 2007-08-16 | Matsushita Electric Ind Co Ltd | リソース管理装置 |
JP2007272357A (ja) | 2006-03-30 | 2007-10-18 | Toshiba Corp | ストレージクラスタシステム、データ処理方法、及びプログラム |
US7805577B1 (en) * | 2006-04-14 | 2010-09-28 | Tilera Corporation | Managing memory access in a parallel processing environment |
US20070291571A1 (en) | 2006-06-08 | 2007-12-20 | Intel Corporation | Increasing the battery life of a mobile computing system in a reduced power state through memory compression |
KR100828128B1 (ko) | 2006-07-20 | 2008-05-09 | 에이디반도체(주) | 시분할 복수 주파수를 이용하는 정전용량 검출방법 및검출장치 |
JP2008108126A (ja) | 2006-10-26 | 2008-05-08 | Canon Inc | データ転送制御装置及びそのバスアクセス調停方法 |
US8108625B1 (en) * | 2006-10-30 | 2012-01-31 | Nvidia Corporation | Shared memory with parallel access and access conflict resolution mechanism |
GB0700877D0 (en) | 2007-01-17 | 2007-02-21 | Linear Algebra Technologies Lt | A device |
GB2447494A (en) | 2007-03-15 | 2008-09-17 | Linear Algebra Technologies Lt | A method and circuit for compressing data using a bitmap to identify the location of data values |
US8291174B2 (en) * | 2007-08-15 | 2012-10-16 | Micron Technology, Inc. | Memory device and method having on-board address protection system for facilitating interface with multiple processors, and computer system using same |
US7856536B2 (en) * | 2007-10-05 | 2010-12-21 | International Business Machines Corporation | Providing a process exclusive access to a page including a memory address to which a lock is granted to the process |
US20090204837A1 (en) | 2008-02-11 | 2009-08-13 | Udaykumar Raval | Power control system and method |
US8930644B2 (en) | 2008-05-02 | 2015-01-06 | Xilinx, Inc. | Configurable transactional memory for synchronizing transactions |
US20090276559A1 (en) | 2008-05-02 | 2009-11-05 | International Business Machines Corporation | Arrangements for Operating In-Line Memory Module Configurations |
JP2010003067A (ja) * | 2008-06-19 | 2010-01-07 | Sony Corp | メモリシステムおよびそのアクセス制御方法、並びにプログラム |
US8948270B2 (en) | 2008-08-19 | 2015-02-03 | Qualcomm Incorporated | Power and computational load management techniques in video processing |
US8200594B1 (en) * | 2008-09-10 | 2012-06-12 | Nvidia Corporation | System, method, and computer program product for accelerating a game artificial intelligence process |
ES2630045T3 (es) | 2009-01-30 | 2017-08-17 | Mauna Kea Technologies | Método y sistema para el procesamiento de imágenes adquiridas en tiempo real mediante un dispositivo médico |
US8615039B2 (en) | 2009-05-21 | 2013-12-24 | Microsoft Corporation | Optimized allocation of multi-core computation for video encoding |
KR101039782B1 (ko) * | 2009-11-26 | 2011-06-09 | 한양대학교 산학협력단 | 능동 메모리 프로세서를 포함하는 네트워크-온-칩 시스템 |
US8095824B2 (en) * | 2009-12-15 | 2012-01-10 | Intel Corporation | Performing mode switching in an unbounded transactional memory (UTM) system |
US8539129B2 (en) * | 2010-04-14 | 2013-09-17 | Qualcomm Incorporated | Bus arbitration techniques to reduce access latency |
US20120096445A1 (en) | 2010-10-18 | 2012-04-19 | Nokia Corporation | Method and apparatus for providing portability of partially accelerated signal processing applications |
WO2012052773A1 (en) | 2010-10-21 | 2012-04-26 | Bluwireless Technology Limited | Data processing systems |
US8516205B2 (en) * | 2010-10-29 | 2013-08-20 | Nokia Corporation | Method and apparatus for providing efficient context classification |
JP2012168871A (ja) * | 2011-02-16 | 2012-09-06 | Nec Corp | 計算機、消費電力低減方法およびプログラム |
US8464190B2 (en) * | 2011-02-17 | 2013-06-11 | Maxeler Technologies Ltd. | Method of, and apparatus for, stream scheduling in parallel pipelined hardware |
US8892924B2 (en) * | 2011-05-31 | 2014-11-18 | Intel Corporation | Reducing power consumption of uncore circuitry of a processor |
US20130009980A1 (en) | 2011-07-07 | 2013-01-10 | Ati Technologies Ulc | Viewing-focus oriented image processing |
US9021146B2 (en) * | 2011-08-30 | 2015-04-28 | Apple Inc. | High priority command queue for peripheral component |
US8914262B2 (en) | 2011-11-08 | 2014-12-16 | The Mathworks, Inc. | Visualization of data dependency in graphical models |
US20140169669A1 (en) | 2012-12-19 | 2014-06-19 | National Chung Cheng University | Tone mapping method of high dynamic range image/video |
US9123128B2 (en) | 2012-12-21 | 2015-09-01 | Nvidia Corporation | Graphics processing unit employing a standard processing unit and a method of constructing a graphics processing unit |
US9405357B2 (en) | 2013-04-01 | 2016-08-02 | Advanced Micro Devices, Inc. | Distribution of power gating controls for hierarchical power domains |
US9727113B2 (en) | 2013-08-08 | 2017-08-08 | Linear Algebra Technologies Limited | Low power computational imaging |
US9934043B2 (en) | 2013-08-08 | 2018-04-03 | Linear Algebra Technologies Limited | Apparatus, systems, and methods for providing computational imaging pipeline |
KR101864000B1 (ko) | 2013-09-17 | 2018-07-05 | 아셀산 엘렉트로닉 사나이 베 티카렛 아노님 시르케티 | 다목적 이미지 프로세싱 코어 |
WO2015084966A2 (en) | 2013-12-04 | 2015-06-11 | Razzor Technologies Inc. | Adaptive sharpening in image processing and display |
US9402018B2 (en) | 2013-12-17 | 2016-07-26 | Amazon Technologies, Inc. | Distributing processing for imaging processing |
-
2013
- 2013-11-18 US US14/082,396 patent/US9934043B2/en active Active
- 2013-11-18 US US14/082,645 patent/US9146747B2/en active Active
-
2014
- 2014-08-06 JP JP2016532759A patent/JP6571078B2/ja active Active
- 2014-08-06 KR KR1020217006168A patent/KR102340003B1/ko active IP Right Grant
- 2014-08-06 CN CN201480045179.0A patent/CN105765623B/zh active Active
- 2014-08-06 KR KR1020167005928A patent/KR102223840B1/ko active IP Right Grant
- 2014-08-06 KR KR1020217040695A patent/KR102553932B1/ko active IP Right Grant
- 2014-08-06 KR KR1020237022874A patent/KR20230107412A/ko not_active Application Discontinuation
- 2014-08-06 CN CN202010159172.9A patent/CN112037115A/zh active Pending
- 2014-08-06 WO PCT/IB2014/002541 patent/WO2015019197A2/en active Application Filing
- 2014-08-06 EP EP14815431.3A patent/EP3031047A2/en active Pending
-
2018
- 2018-02-20 US US15/900,327 patent/US10360040B2/en active Active
-
2019
- 2019-06-18 US US16/444,559 patent/US11042382B2/en active Active
- 2019-08-07 JP JP2019145645A patent/JP7025617B2/ja active Active
-
2021
- 2021-06-21 US US17/353,697 patent/US11567780B2/en active Active
-
2022
- 2022-01-14 JP JP2022004451A patent/JP7384534B2/ja active Active
-
2023
- 2023-01-30 US US18/103,224 patent/US20230359464A1/en active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001344195A (ja) | 2000-05-30 | 2001-12-14 | Nec Kofu Ltd | マルチプロセッサシステムとその排他制御の調停方法 |
WO2010086919A1 (ja) | 2009-01-27 | 2010-08-05 | パナソニック株式会社 | メモリアクセス装置およびその関連技術 |
Also Published As
Publication number | Publication date |
---|---|
US20180349147A1 (en) | 2018-12-06 |
CN105765623A (zh) | 2016-07-13 |
US11042382B2 (en) | 2021-06-22 |
US10360040B2 (en) | 2019-07-23 |
US9146747B2 (en) | 2015-09-29 |
US11567780B2 (en) | 2023-01-31 |
JP2016536692A (ja) | 2016-11-24 |
JP2019220201A (ja) | 2019-12-26 |
WO2015019197A2 (en) | 2015-02-12 |
KR102553932B1 (ko) | 2023-07-07 |
US20220147363A1 (en) | 2022-05-12 |
US9934043B2 (en) | 2018-04-03 |
KR20230107412A (ko) | 2023-07-14 |
JP2022058622A (ja) | 2022-04-12 |
CN105765623B (zh) | 2020-04-07 |
JP6571078B2 (ja) | 2019-09-04 |
KR20160056881A (ko) | 2016-05-20 |
KR102223840B1 (ko) | 2021-03-09 |
KR20210156845A (ko) | 2021-12-27 |
KR102340003B1 (ko) | 2021-12-17 |
US20150046678A1 (en) | 2015-02-12 |
JP7384534B2 (ja) | 2023-11-21 |
US20150046677A1 (en) | 2015-02-12 |
US20190370005A1 (en) | 2019-12-05 |
EP3031047A2 (en) | 2016-06-15 |
CN112037115A (zh) | 2020-12-04 |
KR20210027517A (ko) | 2021-03-10 |
WO2015019197A3 (en) | 2015-11-19 |
US20230359464A1 (en) | 2023-11-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7025617B2 (ja) | メモリにアクセスするための並列処理装置、コンピュータにより実施される方法、システム、コンピュータ可読媒体 | |
Hassan et al. | Bounding dram interference in cots heterogeneous mpsocs for mixed criticality systems | |
US7546405B2 (en) | Methods and apparatus for dynamic grouping of requestors of resources in a multi-processor system | |
US20080112313A1 (en) | Methods And Apparatus For Dynamic Redistribution Of Tokens In A Multi-Processor System | |
CN104011676A (zh) | 用于跨过多个硬件线程的虚拟线程的细粒度并行的低延迟变量转移网络 | |
US8180998B1 (en) | System of lanes of processing units receiving instructions via shared memory units for data-parallel or task-parallel operations | |
US8694705B2 (en) | Information processing device | |
JP6201591B2 (ja) | 情報処理装置および情報処理装置の制御方法 | |
Sousa et al. | Runtime reconfigurable bus arbitration for concurrent applications on heterogeneous MPSoC architectures | |
Elliott et al. | Gpusync: Architecture-aware management of gpus for predictable multi-gpu real-time systems | |
Zhou et al. | An operating system framework for reconfigurable systems | |
US20240272961A1 (en) | Logical Slot to Distributed Hardware Slot Scheduling for Graphics Work | |
US20240273667A1 (en) | Geometry Kick Distribution in Graphics Processor | |
RO129804A0 (ro) | Aparat, sistem şi metodă pentru a realiza o bandă configurabilă şi extensibilă de procesare de imagini | |
GB2599041A (en) | Methods for managing virtual partitionings of a storage unit | |
Vrijnsen | A NUMA Architecture Simulator |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190826 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190826 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200930 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20201104 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210204 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210413 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20210713 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20210913 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20211008 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20211207 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20220104 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220114 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7025617 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |