JP2019525294A5 - - Google Patents

Download PDF

Info

Publication number
JP2019525294A5
JP2019525294A5 JP2018566347A JP2018566347A JP2019525294A5 JP 2019525294 A5 JP2019525294 A5 JP 2019525294A5 JP 2018566347 A JP2018566347 A JP 2018566347A JP 2018566347 A JP2018566347 A JP 2018566347A JP 2019525294 A5 JP2019525294 A5 JP 2019525294A5
Authority
JP
Japan
Prior art keywords
memory
addresses
processor
destination addresses
source addresses
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018566347A
Other languages
English (en)
Other versions
JP7134100B2 (ja
JP2019525294A (ja
Filing date
Publication date
Priority claimed from US15/192,992 external-priority patent/US20170371657A1/en
Application filed filed Critical
Publication of JP2019525294A publication Critical patent/JP2019525294A/ja
Publication of JP2019525294A5 publication Critical patent/JP2019525294A5/ja
Application granted granted Critical
Publication of JP7134100B2 publication Critical patent/JP7134100B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Claims (5)

  1. メモリ動作を行う方法であって、
    プロセッサによって、メモリの2つ以上のソースアドレスおよび対応する2つ以上の宛先アドレスをトランザクション入力バッファに与えるステップであって、
    前記2つ以上のソースアドレスが、前記メモリにおいて不連続であり、
    前記2つ以上の宛先アドレスが、前記メモリにおいて不連続である、ステップと、
    前記トランザクション入力バッファによって、前記2つ以上のソースアドレスおよび前記対応する2つ以上の宛先アドレスをトランザクションシーケンサに供給するステップと、
    前記プロセッサ内のレジスタへの中間コピーなしで、前記メモリ内で前記2つ以上のソースアドレスから前記対応する2つ以上の宛先アドレスに2つ以上のデータ要素をコピーするための、前記トランザクションシーケンサによって供給された2つ以上の命令を実行するステップと
    を含む、方法。
  2. 前記メモリ内で前記2つ以上のソースアドレスから前記対応する2つ以上の宛先アドレスにデータ要素を前記コピーすることが、単一命令複数データ(SIMD)コピー命令を実行することを含む、請求項1に記載の方法。
  3. 前記プロセッサによる指示なしで前記SIMDコピー命令を実行するステップを含む、請求項2に記載の方法。
  4. 装置であって、
    メモリの2つ以上のソースアドレスおよび対応する2つ以上の宛先アドレスをトランザクション入力バッファに与えるように構成されたプロセッサであって、
    前記2つ以上のソースアドレスが、前記メモリにおいて不連続であり、
    前記2つ以上の宛先アドレスが、前記メモリにおいて不連続であり、
    前記トランザクション入力バッファが、前記2つ以上のソースアドレスおよび前記対応する2つ以上の宛先アドレスをトランザクションシーケンサに供給するように構成される、プロセッサと、
    前記プロセッサ内のレジスタへの中間コピーなしで、前記メモリ内で前記2つ以上のソースアドレスから前記対応する2つ以上の宛先アドレスに2つ以上のデータ要素をコピーするように構成された論理手段と
    を含む、装置。
  5. 前記プロセッサによる指示なしで、前記2つ以上のソースアドレスから前記対応する2つ以上の宛先アドレスに前記2つ以上のデータ要素をコピーするように構成された論理手段を含む、請求項4に記載の装置。
JP2018566347A 2016-06-24 2017-06-06 Simdの集中およびコピー動作を実行するための方法および装置 Active JP7134100B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US15/192,992 2016-06-24
US15/192,992 US20170371657A1 (en) 2016-06-24 2016-06-24 Scatter to gather operation
PCT/US2017/036041 WO2017222798A1 (en) 2016-06-24 2017-06-06 Method and apparatus for performing simd gather and copy operations

Publications (3)

Publication Number Publication Date
JP2019525294A JP2019525294A (ja) 2019-09-05
JP2019525294A5 true JP2019525294A5 (ja) 2020-07-02
JP7134100B2 JP7134100B2 (ja) 2022-09-09

Family

ID=59054330

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018566347A Active JP7134100B2 (ja) 2016-06-24 2017-06-06 Simdの集中およびコピー動作を実行するための方法および装置

Country Status (9)

Country Link
US (1) US20170371657A1 (ja)
EP (1) EP3475808B1 (ja)
JP (1) JP7134100B2 (ja)
KR (1) KR102507275B1 (ja)
CN (1) CN109313548B (ja)
BR (1) BR112018076270A8 (ja)
ES (1) ES2869865T3 (ja)
SG (1) SG11201810051VA (ja)
WO (1) WO2017222798A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10795678B2 (en) * 2018-04-21 2020-10-06 Microsoft Technology Licensing, Llc Matrix vector multiplier with a vector register file comprising a multi-port memory
US10782918B2 (en) * 2018-09-06 2020-09-22 Advanced Micro Devices, Inc. Near-memory data-dependent gather and packing
KR20210112949A (ko) 2020-03-06 2021-09-15 삼성전자주식회사 데이터 버스, 그것의 데이터 처리 방법 및 데이터 처리 장치

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5887183A (en) * 1995-01-04 1999-03-23 International Business Machines Corporation Method and system in a data processing system for loading and storing vectors in a plurality of modes
US6513107B1 (en) * 1999-08-17 2003-01-28 Nec Electronics, Inc. Vector transfer system generating address error exception when vector to be transferred does not start and end on same memory page
US7454585B2 (en) * 2005-12-22 2008-11-18 International Business Machines Corporation Efficient and flexible memory copy operation
US7484062B2 (en) * 2005-12-22 2009-01-27 International Business Machines Corporation Cache injection semi-synchronous memory copy operation
US8432409B1 (en) * 2005-12-23 2013-04-30 Globalfoundries Inc. Strided block transfer instruction
US8060724B2 (en) * 2008-08-15 2011-11-15 Freescale Semiconductor, Inc. Provision of extended addressing modes in a single instruction multiple data (SIMD) data processor
US9218183B2 (en) * 2009-01-30 2015-12-22 Arm Finance Overseas Limited System and method for improving memory transfer
US20120060016A1 (en) * 2010-09-07 2012-03-08 International Business Machines Corporation Vector Loads from Scattered Memory Locations
US8635431B2 (en) * 2010-12-08 2014-01-21 International Business Machines Corporation Vector gather buffer for multiple address vector loads
US9626333B2 (en) * 2012-06-02 2017-04-18 Intel Corporation Scatter using index array and finite state machine
US8972697B2 (en) * 2012-06-02 2015-03-03 Intel Corporation Gather using index array and finite state machine
US10049061B2 (en) * 2012-11-12 2018-08-14 International Business Machines Corporation Active memory device gather, scatter, and filter
US9563425B2 (en) * 2012-11-28 2017-02-07 Intel Corporation Instruction and logic to provide pushing buffer copy and store functionality

Similar Documents

Publication Publication Date Title
JP6793228B2 (ja) 画像プロセッサのためのシート生成部
US11442734B2 (en) Packed data element predication processors, methods, systems, and instructions
JP2016027701A5 (ja) 半導体装置
JP6373425B2 (ja) 複数のビットを左にシフトし、複数の1を複数の下位ビットにプルインするための命令
JP6025986B2 (ja) 装置、方法、およびシステム
US20180122433A1 (en) Multiple register memory access instructions, processors, methods, and systems
JP2016526220A5 (ja)
KR101732046B1 (ko) 해시 동작을 효율적으로 실행하는 방법 및 장치
CN108351839A (zh) 用来挂起/恢复安全飞地页面高速缓存中飞地的迁移的指令和逻辑
US20170185888A1 (en) Interconnection Scheme for Reconfigurable Neuromorphic Hardware
WO2018093439A3 (en) Processors, methods, systems, and instructions to load multiple data elements to destination storage locations other than packed data registers
KR102556033B1 (ko) 패킹된 데이터 정렬 플러스 계산 명령어, 프로세서, 방법, 및 시스템
JP6419205B2 (ja) プロセッサ、方法、システム、コンピュータシステム、およびコンピュータ可読記憶媒体
WO2016100142A3 (en) Advanced processor architecture
JP2019525294A5 (ja)
GB2517877A (en) Controlling an order for processing data elements during vector processing
TW200731739A (en) Cryptography system and elliptic curve operation method involved thereof
JP2014182803A (ja) バイパスマルチプルインスタンス化テーブルを用いた移動除去のためのシステム及び方法
JP2017142799A5 (ja)
JP2016194929A5 (ja)
JP2018525731A5 (ja)
JP2021504788A (ja) ストアフュージョンのためのシステム及び方法
US11003447B2 (en) Vector arithmetic and logical instructions performing operations on different first and second data element widths from corresponding first and second vector registers
WO2015017129A4 (en) Multi-threaded gpu pipeline
JP2017503232A (ja) Rsaアルゴリズム加速プロセッサ、方法、システム、及び命令