JP2009543170A5 - - Google Patents

Download PDF

Info

Publication number
JP2009543170A5
JP2009543170A5 JP2009517429A JP2009517429A JP2009543170A5 JP 2009543170 A5 JP2009543170 A5 JP 2009543170A5 JP 2009517429 A JP2009517429 A JP 2009517429A JP 2009517429 A JP2009517429 A JP 2009517429A JP 2009543170 A5 JP2009543170 A5 JP 2009543170A5
Authority
JP
Japan
Prior art keywords
thread
point
synchronization
branch
threads
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009517429A
Other languages
English (en)
Other versions
JP5710878B2 (ja
JP2009543170A (ja
Filing date
Publication date
Priority claimed from GBGB0613289.8A external-priority patent/GB0613289D0/en
Application filed filed Critical
Publication of JP2009543170A publication Critical patent/JP2009543170A/ja
Publication of JP2009543170A5 publication Critical patent/JP2009543170A5/ja
Application granted granted Critical
Publication of JP5710878B2 publication Critical patent/JP5710878B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Description

本発明の好ましい実施形態は、各々が多数の同期点を備えた、マルチスレッドプロセッサ上の複数のスレッドの実行を同期させるための方法及び装置を提供する。いずれかのスレッドが同期点に到達したときに、同じ同期点に到達するように同期されることが意図される他のスレッドを待機し、次いで実行が再開できるようになる。同期点を含むコードの1セクションをスレッドが分岐して飛び越すときは、停止され、分岐しているとフラグが立てられる。次いで、同期点に到達するいずれかのスレッドは、分岐されているとフラグが立てられていないスレッドだけを待機する。このことは、分岐されなかったあらゆるスレッドが互いに同期することを保証する。
同期点の動作は、図2を参照してより詳細に説明される。20において、媒体制御コアは、特定のスレッドに対して、ここで次の命令を処理できることを識別する。その第1のタスクは、22において、その命令が同期点を含むかどうか判断することである。同期点がある場合には、実行スレッドは、24の同期開始待機状態に移動する。この状態は、26において、媒体制御コアがすべての他のスレッドを反復的に調査して、同期開始/終了待機状態にあるかどうかを判断するようにする。これらのすべてが、これらの状態の1つにない場合には、システムは、反復的に周りをループして、同期されるすべてのスレッドがストールされるまでチェックする。すべての他のスレッドがこれらの状態の1つに入ると、媒体制御コアは、再び20において、次の命令を処理し、再び22において、同期点を探すことができる。同期点はないと判断された場合には、28において、スレッドが、同期点を分岐して飛び越したかについて判断がなされる。こうした分岐が生じていなかった場合には、システムは20に戻り、次の命令を処理する。
システムが同期点を分岐して飛び越した場合には、ビットは、同期点を飛び越す分岐が生じたことをMCCに示すように設定され、30において、すべての他のスレッドが同期終了待機状態にあるかどうかについて判断がなされる。分岐スレッドが、他のスレッドの実行を再開しないようにする唯一のスレッドであると示す場合には、次の命令が20において処理される。すべての他のスレッドが同期終了待機状態にない場合には、32において、実行スレッドが同期終了待機状態になり、34において、他のスレッドが同期終了状態に到達したかどうか判断するループに入る。別のスレッドがこの点に到達すると、システムは、20において、次の命令を処理するようにループを戻る。
同期点及び分岐点の検出は、そのコンパイラによりスレッドに含まれるデータに応答して、媒体制御コア2において生じることができる。或いは、情報は、命令を処理するときに、データ処理コア8により媒体制御コアにフィードバックされることができる。
同期開始待機状態と同期終了待機状態との間の違いは、同期開始待機状態は、同期点がスレッドの通常のフローにおいて処理されるときに生じることである。
同期点を飛び越して分岐されると知られる分岐命令が処理された場合に、いずれかの他のスレッドがプログラムにおける同じ点に到達していてもいなくても、同期終了待機状態になる。したがって、スレッドが同期点を飛び越して分岐されると、別のスレッドがその実行において追いつくまで、すなわち、プログラムの同じ点に到達するまで、効率的にストールされる。
MCC2は、命令デコードユニット34からのフィードバック経路40により、データを受信して、各々のスレッドに対して含むレジスタを更新する。このことは、スレッドがコードの1セクションを分岐して飛び越したときを認識し、したがって、このスレッドは、他のスレッドが分岐の終わり又は分岐内の同期点に到達するのを待機する間、同期終了待機状態に入る必要がある。さらに、スレッドが分岐して飛び越すことができるコードを実行したときを認識し、スレッドを、コードのセクションの終わりにおいて、又は、コードのセクション内の同期点において、同期終了待機状態に入れる。この状態は、さらに、MCC2にフィードバックされ、そのスレッドに対するレジスタ内に格納される。
本発明の実施形態に用いられるスレッドがコンパイルされるときには、コンパイラは、スレッドのどこで同期点が生じるかを検出し、コンパイルされたスレッドにおいて、MCCに対して同期点の存在を示す命令を含む。分岐がある場合には、コンパイラは、分岐が同期点を含むかどうか判断しなければならない。含む場合には代替的な分岐、含まない場合には対応する同期点が、同期点を分岐して飛び越したことをMCCに示し、分岐の終わりにおいて実行を停止する命令を含む。
JP2009517429A 2006-07-04 2007-07-04 マルチスレッドプロセッサ上の実行スレッドの同期 Active JP5710878B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
GB0613289.8 2006-07-04
GBGB0613289.8A GB0613289D0 (en) 2006-07-04 2006-07-04 Synchronisation of execution threads on a multi-threaded processor
PCT/GB2007/002504 WO2008003968A1 (en) 2006-07-04 2007-07-04 Synchronisation of execution threads on a multi-threaded processor

Publications (3)

Publication Number Publication Date
JP2009543170A JP2009543170A (ja) 2009-12-03
JP2009543170A5 true JP2009543170A5 (ja) 2013-02-28
JP5710878B2 JP5710878B2 (ja) 2015-04-30

Family

ID=36926447

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009517429A Active JP5710878B2 (ja) 2006-07-04 2007-07-04 マルチスレッドプロセッサ上の実行スレッドの同期

Country Status (5)

Country Link
US (6) US20080010640A1 (ja)
EP (1) EP2035929B1 (ja)
JP (1) JP5710878B2 (ja)
GB (2) GB0613289D0 (ja)
WO (1) WO2008003968A1 (ja)

Families Citing this family (69)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB0613289D0 (en) * 2006-07-04 2006-08-16 Imagination Tech Ltd Synchronisation of execution threads on a multi-threaded processor
US8533530B2 (en) * 2006-11-15 2013-09-10 Qualcomm Incorporated Method and system for trusted/untrusted digital signal processor debugging operations
US8341604B2 (en) * 2006-11-15 2012-12-25 Qualcomm Incorporated Embedded trace macrocell for enhanced digital signal processor debugging operations
US8380966B2 (en) * 2006-11-15 2013-02-19 Qualcomm Incorporated Method and system for instruction stuffing operations during non-intrusive digital signal processor debugging
US8370806B2 (en) * 2006-11-15 2013-02-05 Qualcomm Incorporated Non-intrusive, thread-selective, debugging method and system for a multi-thread digital signal processor
US8484516B2 (en) * 2007-04-11 2013-07-09 Qualcomm Incorporated Inter-thread trace alignment method and system for a multi-threaded processor
US8866827B2 (en) * 2008-06-26 2014-10-21 Microsoft Corporation Bulk-synchronous graphics processing unit programming
US8412889B2 (en) * 2008-10-16 2013-04-02 Microsoft Corporation Low-level conditional synchronization support
US8756562B2 (en) * 2008-12-11 2014-06-17 The Mathworks, Inc. Subgraph execution control in a graphical modeling environment
US8549470B2 (en) * 2008-12-11 2013-10-01 The Mathworks, Inc. Multi-threaded subgraph execution control in a graphical modeling environment
US8850436B2 (en) * 2009-09-28 2014-09-30 Nvidia Corporation Opcode-specified predicatable warp post-synchronization
US8421162B2 (en) 2009-09-30 2013-04-16 Suvolta, Inc. Advanced transistors with punch through suppression
US8273617B2 (en) 2009-09-30 2012-09-25 Suvolta, Inc. Electronic devices and systems, and methods for making and using the same
JP5504879B2 (ja) * 2009-12-25 2014-05-28 富士通株式会社 マルチスレッド処理方法及びマルチスレッド処理装置
US8530286B2 (en) 2010-04-12 2013-09-10 Suvolta, Inc. Low power semiconductor transistor structure and method of fabrication thereof
US8569128B2 (en) 2010-06-21 2013-10-29 Suvolta, Inc. Semiconductor structure and method of fabrication thereof with mixed metal types
US8759872B2 (en) 2010-06-22 2014-06-24 Suvolta, Inc. Transistor with threshold voltage set notch and method of fabrication thereof
US8404551B2 (en) 2010-12-03 2013-03-26 Suvolta, Inc. Source/drain extension control for advanced transistors
US8461875B1 (en) 2011-02-18 2013-06-11 Suvolta, Inc. Digital circuits having improved transistors, and methods therefor
US8525271B2 (en) 2011-03-03 2013-09-03 Suvolta, Inc. Semiconductor structure with improved channel stack and method for fabrication thereof
US8748270B1 (en) 2011-03-30 2014-06-10 Suvolta, Inc. Process for manufacturing an improved analog transistor
US8796048B1 (en) 2011-05-11 2014-08-05 Suvolta, Inc. Monitoring and measurement of thin film layers
US8999861B1 (en) 2011-05-11 2015-04-07 Suvolta, Inc. Semiconductor structure with substitutional boron and method for fabrication thereof
US8811068B1 (en) 2011-05-13 2014-08-19 Suvolta, Inc. Integrated circuit devices and methods
US8569156B1 (en) 2011-05-16 2013-10-29 Suvolta, Inc. Reducing or eliminating pre-amorphization in transistor manufacture
US8735987B1 (en) 2011-06-06 2014-05-27 Suvolta, Inc. CMOS gate stack structures and processes
US8995204B2 (en) 2011-06-23 2015-03-31 Suvolta, Inc. Circuit devices and methods having adjustable transistor body bias
US8629016B1 (en) 2011-07-26 2014-01-14 Suvolta, Inc. Multiple transistor types formed in a common epitaxial layer by differential out-diffusion from a doped underlayer
WO2013022753A2 (en) 2011-08-05 2013-02-14 Suvolta, Inc. Semiconductor devices having fin structures and fabrication methods thereof
US8748986B1 (en) 2011-08-05 2014-06-10 Suvolta, Inc. Electronic device with controlled threshold voltage
US8645878B1 (en) 2011-08-23 2014-02-04 Suvolta, Inc. Porting a circuit design from a first semiconductor process to a second semiconductor process
US8614128B1 (en) 2011-08-23 2013-12-24 Suvolta, Inc. CMOS structures and processes based on selective thinning
US20130055273A1 (en) * 2011-08-30 2013-02-28 Samsung Electronics Co., Ltd. Terminal and application management method thereof
US8713511B1 (en) 2011-09-16 2014-04-29 Suvolta, Inc. Tools and methods for yield-aware semiconductor manufacturing process target generation
US9236466B1 (en) 2011-10-07 2016-01-12 Mie Fujitsu Semiconductor Limited Analog circuits having improved insulated gate transistors, and methods therefor
US8895327B1 (en) 2011-12-09 2014-11-25 Suvolta, Inc. Tipless transistors, short-tip transistors, and methods and circuits therefor
US8819603B1 (en) 2011-12-15 2014-08-26 Suvolta, Inc. Memory circuits and methods of making and designing the same
US8883600B1 (en) 2011-12-22 2014-11-11 Suvolta, Inc. Transistor having reduced junction leakage and methods of forming thereof
US8599623B1 (en) 2011-12-23 2013-12-03 Suvolta, Inc. Circuits and methods for measuring circuit elements in an integrated circuit device
US8970289B1 (en) 2012-01-23 2015-03-03 Suvolta, Inc. Circuits and devices for generating bi-directional body bias voltages, and methods therefor
US8877619B1 (en) 2012-01-23 2014-11-04 Suvolta, Inc. Process for manufacture of integrated circuits with different channel doping transistor architectures and devices therefrom
US9093550B1 (en) 2012-01-31 2015-07-28 Mie Fujitsu Semiconductor Limited Integrated circuits having a plurality of high-K metal gate FETs with various combinations of channel foundation structure and gate stack structure and methods of making same
US9406567B1 (en) 2012-02-28 2016-08-02 Mie Fujitsu Semiconductor Limited Method for fabricating multiple transistor devices on a substrate with varying threshold voltages
US8863064B1 (en) 2012-03-23 2014-10-14 Suvolta, Inc. SRAM cell layout structure and devices therefrom
US9299698B2 (en) 2012-06-27 2016-03-29 Mie Fujitsu Semiconductor Limited Semiconductor structure with multiple transistors having various threshold voltages
US8637955B1 (en) 2012-08-31 2014-01-28 Suvolta, Inc. Semiconductor structure with reduced junction leakage and method of fabrication thereof
US9112057B1 (en) 2012-09-18 2015-08-18 Mie Fujitsu Semiconductor Limited Semiconductor devices with dopant migration suppression and method of fabrication thereof
US9041126B2 (en) 2012-09-21 2015-05-26 Mie Fujitsu Semiconductor Limited Deeply depleted MOS transistors having a screening layer and methods thereof
US9431068B2 (en) 2012-10-31 2016-08-30 Mie Fujitsu Semiconductor Limited Dynamic random access memory (DRAM) with low variation transistor peripheral circuits
US8816754B1 (en) 2012-11-02 2014-08-26 Suvolta, Inc. Body bias circuits and methods
US9093997B1 (en) 2012-11-15 2015-07-28 Mie Fujitsu Semiconductor Limited Slew based process and bias monitors and related methods
JP5994601B2 (ja) * 2012-11-27 2016-09-21 富士通株式会社 並列計算機、並列計算機の制御プログラム及び並列計算機の制御方法
US9070477B1 (en) 2012-12-12 2015-06-30 Mie Fujitsu Semiconductor Limited Bit interleaved low voltage static random access memory (SRAM) and related methods
US9112484B1 (en) 2012-12-20 2015-08-18 Mie Fujitsu Semiconductor Limited Integrated circuit process and bias monitors and related methods
US9268885B1 (en) 2013-02-28 2016-02-23 Mie Fujitsu Semiconductor Limited Integrated circuit device methods and models with predicted device metric variations
US9299801B1 (en) 2013-03-14 2016-03-29 Mie Fujitsu Semiconductor Limited Method for fabricating a transistor device with a tuned dopant profile
US9117021B2 (en) * 2013-03-14 2015-08-25 Intel Corporation Methods and apparatus to manage concurrent predicate expressions
US9478571B1 (en) 2013-05-24 2016-10-25 Mie Fujitsu Semiconductor Limited Buried channel deeply depleted channel transistor
FR3021429B1 (fr) * 2014-05-23 2018-05-18 Kalray Barriere de synchronisation materielle entre elements de traitement
US9710006B2 (en) 2014-07-25 2017-07-18 Mie Fujitsu Semiconductor Limited Power up body bias circuits and methods
US9319013B2 (en) 2014-08-19 2016-04-19 Mie Fujitsu Semiconductor Limited Operational amplifier input offset correction with transistor threshold voltage adjustment
US10402234B2 (en) * 2016-04-15 2019-09-03 Nec Corporation Fine-grain synchronization in data-parallel jobs
US10402235B2 (en) * 2016-04-15 2019-09-03 Nec Corporation Fine-grain synchronization in data-parallel jobs for distributed machine learning
US11356334B2 (en) * 2016-04-15 2022-06-07 Nec Corporation Communication efficient sparse-reduce in distributed machine learning
US9940226B2 (en) 2016-05-26 2018-04-10 International Business Machines Corporation Synchronization of hardware agents in a computer system
US11353868B2 (en) * 2017-04-24 2022-06-07 Intel Corporation Barriers and synchronization for machine learning at autonomous machines
US11086672B2 (en) * 2019-05-07 2021-08-10 International Business Machines Corporation Low latency management of processor core wait state
US20220012598A1 (en) * 2020-07-09 2022-01-13 Femtosense, Inc. Methods and apparatus for matrix and vector storage and operations
CN113284038B (zh) * 2021-03-05 2022-10-18 上海壁仞智能科技有限公司 用于执行计算的方法、计算设备、计算系统和存储介质

Family Cites Families (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE68927946T2 (de) * 1988-08-02 1997-10-16 Philips Electronics Nv Verfahren und Vorrichtung für die Synchronisierung von parallelen Prozessoren unter Verwendung einer unscharf definierten Sperre
JPH0630094B2 (ja) * 1989-03-13 1994-04-20 インターナショナル・ビジネス・マシーンズ・コーポレイション マルチプロセツサ・システム
US5261063A (en) * 1990-12-07 1993-11-09 Ibm Corp. Pipeline apparatus having pipeline mode eecuting instructions from plural programs and parallel mode executing instructions from one of the plural programs
US5515490A (en) * 1993-11-05 1996-05-07 Xerox Corporation Method and system for temporally formatting data presentation in time-dependent documents
US5504898A (en) * 1994-06-20 1996-04-02 Candle Distributed Solutions, Inc. Threaded environment for AS/400
US5721921A (en) * 1995-05-25 1998-02-24 Cray Research, Inc. Barrier and eureka synchronization architecture for multiprocessors
US5797004A (en) * 1995-12-08 1998-08-18 Sun Microsystems, Inc. System and method for caching and allocating thread synchronization constructs
GB2311882B (en) * 1996-04-04 2000-08-09 Videologic Ltd A data processing management system
US6216174B1 (en) * 1998-09-29 2001-04-10 Silicon Graphics, Inc. System and method for fast barrier synchronization
US6378124B1 (en) * 1999-02-22 2002-04-23 International Business Machines Corporation Debugger thread synchronization control points
US6574725B1 (en) 1999-11-01 2003-06-03 Advanced Micro Devices, Inc. Method and mechanism for speculatively executing threads of instructions
JP3571976B2 (ja) * 1999-11-08 2004-09-29 富士通株式会社 デバッグ装置及び方法並びにプログラム記録媒体
US6766437B1 (en) * 2000-02-28 2004-07-20 International Business Machines Corporation Composite uniprocessor
US6971084B2 (en) * 2001-03-02 2005-11-29 National Instruments Corporation System and method for synchronizing execution of a batch of threads
US6754850B2 (en) * 2001-03-02 2004-06-22 National Instruments Corporation System and method for performing batch synchronization for a test sequence
US7493615B2 (en) * 2003-05-01 2009-02-17 Sun Microsystems, Inc. Apparatus and method for synchronizing multiple threads in an out-of-order microprocessor
US7512950B1 (en) * 2003-08-14 2009-03-31 Sun Microsystems, Inc. Barrier synchronization object for multi-threaded applications
JP4276028B2 (ja) * 2003-08-25 2009-06-10 株式会社日立製作所 マルチプロセッサシステムの同期方法
US7418576B1 (en) * 2004-11-17 2008-08-26 Nvidia Corporation Prioritized issuing of operation dedicated execution unit tagged instructions from multiple different type threads performing different set of operations
US7937709B2 (en) * 2004-12-29 2011-05-03 Intel Corporation Synchronizing multiple threads efficiently
JP4448784B2 (ja) * 2005-03-15 2010-04-14 株式会社日立製作所 並列計算機の同期方法及びプログラム
US7770170B2 (en) * 2005-07-12 2010-08-03 Microsoft Corporation Blocking local sense synchronization barrier
US7543136B1 (en) * 2005-07-13 2009-06-02 Nvidia Corporation System and method for managing divergent threads using synchronization tokens and program instructions that include set-synchronization bits
US7353369B1 (en) * 2005-07-13 2008-04-01 Nvidia Corporation System and method for managing divergent threads in a SIMD architecture
US7555607B2 (en) * 2005-11-10 2009-06-30 Hewlett-Packard Development Company, L.P. Program thread syncronization for instruction cachelines
US7861060B1 (en) * 2005-12-15 2010-12-28 Nvidia Corporation Parallel data processing systems and methods using cooperative thread arrays and thread identifier values to determine processing behavior
US7788468B1 (en) * 2005-12-15 2010-08-31 Nvidia Corporation Synchronization of threads in a cooperative thread array
US7584342B1 (en) * 2005-12-15 2009-09-01 Nvidia Corporation Parallel data processing systems and methods using cooperative thread arrays and SIMD instruction issue
US20070143755A1 (en) * 2005-12-16 2007-06-21 Intel Corporation Speculative execution past a barrier
GB0613289D0 (en) * 2006-07-04 2006-08-16 Imagination Tech Ltd Synchronisation of execution threads on a multi-threaded processor

Similar Documents

Publication Publication Date Title
JP2009543170A5 (ja)
JP5710878B2 (ja) マルチスレッドプロセッサ上の実行スレッドの同期
CN103348318B (zh) 控制依赖于相同数据条件的相邻指令的执行
US8612978B2 (en) Code execution utilizing single or multiple threads
US10025592B2 (en) Selectively blocking branch prediction for a predetermined number of instructions
US8423970B2 (en) Method, computer program product, and hardware product for handling breakpoints in an asynchronous debug model
EP3103302A1 (en) Method and apparatus for enabling a processor to generate pipeline control signals
US20150178132A1 (en) Functional unit for supporting multithreading, processor comprising the same, and operating method thereof
US9582324B2 (en) Controlling execution of threads in a multi-threaded processor
US20140195790A1 (en) Processor with second jump execution unit for branch misprediction
US11061680B2 (en) Instructions controlling access to shared registers of a multi-threaded processor
JP2009037271A (ja) 仮想計算機システムの停止方法および計算機装置
US20140331025A1 (en) Reconfigurable processor and operation method thereof
JP2008269114A (ja) マルチスレッドプロセッサ及びそれに用いるスレッド間同期操作方法
CN105868094A (zh) 一种用于mips架构cpu的热补丁的方法和设备
WO2019200618A1 (zh) 一种指令执行方法及装置
US9323536B2 (en) Identification of missing call and return instructions for management of a return address stack
JP2004164369A (ja) ファイル監視方法、ファイル監視プログラム及びコンピュータシステム
JP2011128709A (ja) 情報処理装置およびプロセッサの処理方法