JP2008181558A5 - - Google Patents

Download PDF

Info

Publication number
JP2008181558A5
JP2008181558A5 JP2008090853A JP2008090853A JP2008181558A5 JP 2008181558 A5 JP2008181558 A5 JP 2008181558A5 JP 2008090853 A JP2008090853 A JP 2008090853A JP 2008090853 A JP2008090853 A JP 2008090853A JP 2008181558 A5 JP2008181558 A5 JP 2008181558A5
Authority
JP
Japan
Prior art keywords
multiprocessor
memory
shared memory
data
data transfer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008090853A
Other languages
Japanese (ja)
Other versions
JP2008181558A (en
JP4784842B2 (en
Filing date
Publication date
Application filed filed Critical
Priority to JP2008090853A priority Critical patent/JP4784842B2/en
Priority claimed from JP2008090853A external-priority patent/JP4784842B2/en
Publication of JP2008181558A publication Critical patent/JP2008181558A/en
Publication of JP2008181558A5 publication Critical patent/JP2008181558A5/ja
Application granted granted Critical
Publication of JP4784842B2 publication Critical patent/JP4784842B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Claims (7)

CPUと、前記CPUに接続されているネットワークインタフェースと、データを格納する分散共有メモリと、当該プロセッシングエレメントだけからアクセス可能なローカルデータメモリと、前記分散共有メモリの一つのポートに接続されるデータ転送コントローラと、を備える複数のプロセッシングエレメントと、
前記各プロセッシングエレメントに接続され、前記各プロセッシングエレメントによって共有される集中共有メモリと、を備えるマルチプロセッサであって、
前記マルチプロセッサ用のコンパイラがタスクのスケジューリングをし、
前記スケジューリングの結果に基づいて、前記分散共有メモリとの間でデータを転送することによって、前記マルチプロセッサで共通に必要とされるデータを前記各CPUへ必要とされるとき以前に提供することを特徴とするマルチプロセッサ。
CPU, network interface connected to the CPU, distributed shared memory for storing data, local data memory accessible only from the processing element, and data transfer connected to one port of the distributed shared memory A plurality of processing elements comprising a controller;
A multi-processor comprising: a centralized shared memory connected to each processing element and shared by each processing element;
The multiprocessor compiler schedules tasks,
Based on the result of the scheduling, by transferring data to and from the distributed shared memory, the data that is commonly required by the multiprocessor is provided to each CPU before it is needed. A featured multiprocessor.
前記分散共有メモリは、デュアルポートメモリで構成され、
前記分散共有メモリの一つのポートには、前記データ転送コントローラが接続され、
前記分散共有メモリの他のポートには、前記CPUが接続されることを特徴とする請求項1に記載のマルチプロセッサ。
The distributed shared memory is composed of a dual port memory,
The data transfer controller is connected to one port of the distributed shared memory,
The multiprocessor according to claim 1, wherein the CPU is connected to another port of the distributed shared memory.
前記ローカルデータメモリは、デュアルポートメモリで構成され、
前記ローカルデータメモリの一つのポートには、前記データ転送コントローラが接続され、
前記ローカルデータメモリの他のポートには、前記CPUが接続されることを特徴とす
る請求項1又は2に記載のマルチプロセッサ。
The local data memory is a dual port memory,
The data transfer controller is connected to one port of the local data memory,
The multiprocessor according to claim 1, wherein the CPU is connected to another port of the local data memory.
前記データ転送コントローラは、実行するデータ転送命令の指示を受け、前記受けた指示に従ってローカルメモリからデータ転送命令を読み出し、前記読み出したデータ転送命令に従って連続してデータ転送を実行することを特徴とする請求項1から3のいずれか一つに記載のマルチプロセッサ。  The data transfer controller receives an instruction of a data transfer instruction to be executed, reads a data transfer instruction from a local memory according to the received instruction, and continuously executes data transfer according to the read data transfer instruction The multiprocessor according to any one of claims 1 to 3. 前記CPU及び前記ネットワークインタフェースに直接接続され、将来実行すべき命令を前記集中共有メモリから先読みするアジャスタブルプリフェッチ命令キャッシュをさらに備え、  An adjustable prefetch instruction cache directly connected to the CPU and the network interface and prefetching instructions to be executed in the future from the centralized shared memory;
前記アジャスタブルプリフェッチ命令キャッシュは、将来実行される命令列を事前読み出しできるエリアとして複数のウェイを使用し、  The adjustable prefetch instruction cache uses a plurality of ways as an area where an instruction sequence to be executed in the future can be read in advance,
通常のキャッシュエリアとして複数のウェイを使用することを特徴とする請求項1から4のいずれか一つに記載のマルチプロセッサ。  5. The multiprocessor according to claim 1, wherein a plurality of ways are used as a normal cache area.
前記ローカルデータメモリは、L1キャッシュとして使用でき、前記L1キャッシュのデータは同期するように制御されることを特徴とする請求項1に記載のマルチプロセッサ。  2. The multiprocessor according to claim 1, wherein the local data memory can be used as an L1 cache, and data in the L1 cache is controlled to be synchronized. 請求項1から6のいずれか一つに記載のマルチプロセッサが複数接続されて構成されるマルチプロセッサシステムであって、  A multiprocessor system configured by connecting a plurality of multiprocessors according to any one of claims 1 to 6,
前記集中共有メモリは、第1集中共有メモリと第2集中共有メモリとを含み、  The centralized shared memory includes a first centralized shared memory and a second centralized shared memory;
前記第1集中共有メモリは、前記マルチプロセッサ内に設けられ、当該マルチプロセッサ内の各プロセッシングエレメントに接続され、前記各プロセッシングエレメントによって共有されるものであって、  The first centralized shared memory is provided in the multiprocessor, is connected to each processing element in the multiprocessor, and is shared by the processing elements,
前記第2集中共有メモリは、前記マルチプロセッサ外に設けられ、各マルチプロセッサに接続され、前記各マルチプロセッサ内のプロセッシングエレメントによって共有されるものであって、  The second central shared memory is provided outside the multiprocessor, connected to each multiprocessor, and shared by processing elements in each multiprocessor,
前記各ローカルデータメモリ、前記各分散共有メモリ、前記各第1集中共有メモリ及び前記第2集中共有メモリが、各プロセッシングエレメントから直接読み書きできるように配置されていることを特徴とするマルチプロセッサシステム。  Each of the local data memory, each of the distributed shared memory, each of the first centralized shared memory, and the second centralized shared memory is arranged so as to be directly readable and writable from each processing element.
JP2008090853A 2008-03-31 2008-03-31 Multiprocessor and multiprocessor system Expired - Lifetime JP4784842B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008090853A JP4784842B2 (en) 2008-03-31 2008-03-31 Multiprocessor and multiprocessor system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008090853A JP4784842B2 (en) 2008-03-31 2008-03-31 Multiprocessor and multiprocessor system

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP36370299A Division JP4784792B2 (en) 1999-12-22 1999-12-22 Multiprocessor

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2008118007A Division JP4304347B2 (en) 2008-04-30 2008-04-30 Multiprocessor

Publications (3)

Publication Number Publication Date
JP2008181558A JP2008181558A (en) 2008-08-07
JP2008181558A5 true JP2008181558A5 (en) 2008-10-09
JP4784842B2 JP4784842B2 (en) 2011-10-05

Family

ID=39725341

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008090853A Expired - Lifetime JP4784842B2 (en) 2008-03-31 2008-03-31 Multiprocessor and multiprocessor system

Country Status (1)

Country Link
JP (1) JP4784842B2 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015038646A (en) * 2010-11-30 2015-02-26 株式会社東芝 Information processing apparatus and information processing method
KR102082859B1 (en) 2013-01-07 2020-02-28 삼성전자주식회사 System on chip including a plurality of heterogeneous cores and operating method therof
JP6018022B2 (en) 2013-06-14 2016-11-02 株式会社デンソー Parallel compilation method, parallel compiler, parallel compilation device, and in-vehicle device

Similar Documents

Publication Publication Date Title
TWI628594B (en) User-level fork and join processors, methods, systems, and instructions
US10725919B2 (en) Processors having virtually clustered cores and cache slices
TWI603207B (en) Application scheduling in heterogeneous multiprocessor computing platforms for maximal predicted performance gains
JP2010102719A5 (en)
US10031888B2 (en) Parallel memory systems
WO2007092528A9 (en) Thread optimized multiprocessor architecture
JP2008176699A5 (en)
McCalpin Memory bandwidth and system balance in hpc systems
JP2007156824A5 (en)
Talpes et al. Dojo: The microarchitecture of tesla’s exa-scale computer
TW200612342A (en) Methods and apparatus for task management in a multi-processor system
JP2011175624A (en) Sharing resources between cpu and gpu
WO2009067219A8 (en) Contention management for a hardware transactional memory
WO2016209519A1 (en) Coherent fabric interconnect for use in multiple topologies
EP3186704B1 (en) Multiple clustered very long instruction word processing core
TW200641624A (en) Technical fieldmethods and apparatus for list transfers using dma transfers in a multi-processor system
JP2008181558A5 (en)
CN103902502B (en) A kind of extendible separate type isomery thousand core system
Islam et al. Improving node-level mapreduce performance using processing-in-memory technologies
Woolley GPU optimization fundamentals
Munir et al. High-performance optimizations on tiled many-core embedded systems: a matrix multiplication case study
Melot et al. Investigation of main memory bandwidth on Intel Single-Chip Cloud Computer.
Carle et al. Reconciling performance and predictability on a many-core through off-line mapping
He et al. A 98 GMACs/W 32-core vector processor in 65 nm CMOS
Natvig et al. Multi‐and Many‐Cores, Architectural Overview for Programmers