JP2021022370A - コンピューティングデバイスによって実行される方法、装置、機器及びコンピュータ読み取り可能な記憶媒体 - Google Patents
コンピューティングデバイスによって実行される方法、装置、機器及びコンピュータ読み取り可能な記憶媒体 Download PDFInfo
- Publication number
- JP2021022370A JP2021022370A JP2020108978A JP2020108978A JP2021022370A JP 2021022370 A JP2021022370 A JP 2021022370A JP 2020108978 A JP2020108978 A JP 2020108978A JP 2020108978 A JP2020108978 A JP 2020108978A JP 2021022370 A JP2021022370 A JP 2021022370A
- Authority
- JP
- Japan
- Prior art keywords
- vector
- vector operation
- configurable
- computing device
- parameter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 77
- 239000013598 vector Substances 0.000 claims abstract description 611
- 238000004364 calculation method Methods 0.000 claims description 44
- 238000004590 computer program Methods 0.000 claims description 12
- 238000010586 diagram Methods 0.000 description 10
- 150000001875 compounds Chemical class 0.000 description 8
- 239000002131 composite material Substances 0.000 description 7
- 238000013135 deep learning Methods 0.000 description 7
- 238000012545 processing Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 6
- 238000013473 artificial intelligence Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 5
- 230000001960 triggered effect Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000006399 behavior Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 241001502050 Acis Species 0.000 description 1
- 101000822695 Clostridium perfringens (strain 13 / Type A) Small, acid-soluble spore protein C1 Proteins 0.000 description 1
- 101000655262 Clostridium perfringens (strain 13 / Type A) Small, acid-soluble spore protein C2 Proteins 0.000 description 1
- 101000655256 Paraclostridium bifermentans Small, acid-soluble spore protein alpha Proteins 0.000 description 1
- 101000655264 Paraclostridium bifermentans Small, acid-soluble spore protein beta Proteins 0.000 description 1
- 238000000627 alternating current impedance spectroscopy Methods 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/30003—Arrangements for executing specific machine instructions
- G06F9/30007—Arrangements for executing specific machine instructions to perform operations on data operands
- G06F9/3001—Arithmetic instructions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F15/00—Digital computers in general; Data processing equipment in general
- G06F15/16—Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F15/00—Digital computers in general; Data processing equipment in general
- G06F15/76—Architectures of general purpose stored program computers
- G06F15/80—Architectures of general purpose stored program computers comprising an array of processing units with common control, e.g. single instruction multiple data processors
- G06F15/8007—Architectures of general purpose stored program computers comprising an array of processing units with common control, e.g. single instruction multiple data processors single instruction multiple data [SIMD] multiprocessors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/30003—Arrangements for executing specific machine instructions
- G06F9/30007—Arrangements for executing specific machine instructions to perform operations on data operands
- G06F9/30036—Instructions to perform operations on packed data, e.g. vector, tile or matrix operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/30181—Instruction operation extension or modification
- G06F9/30189—Instruction operation extension or modification according to execution mode, e.g. mode flag
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/38—Concurrent instruction execution, e.g. pipeline or look ahead
- G06F9/3885—Concurrent instruction execution, e.g. pipeline or look ahead using a plurality of independent parallel functional units
- G06F9/3887—Concurrent instruction execution, e.g. pipeline or look ahead using a plurality of independent parallel functional units controlled by a single instruction for multiple data lanes [SIMD]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/445—Program loading or initiating
- G06F9/44505—Configuring for program initiating, e.g. using registry, configuration files
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/54—Interprogram communication
- G06F9/546—Message passing systems or structures, e.g. queues
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Computer Hardware Design (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- Algebra (AREA)
- Advance Control (AREA)
- Complex Calculations (AREA)
Abstract
Description
基本ベクトル演算のみをサポートでき、複数の基本ベクトル演算を含む複雑なベクトル演算に対しては、複数の基本のベクトル演算命令をさらに分割する必要があるため、ベクトル演算命令が長くなる。
本開示のいくつかの例示的な実施例では、スカラタイプの構成可能なベクトル演算パラメータに対して、少なくとも一つの構成可能なベクトル演算パラメータを示す情報110は、構成可能なベクトル演算パラメータの数値を含む。例えば、構成可能なベクトル演算パラメータA及びBに対して、構成可能なベクトル演算パラメータの情報110は、A=1、B=2を示すことができる。
ベクトルタイプの構成可能なベクトル演算パラメータの取得を具体的に説明する前に、まず、ベクトルタイプパラメータの基本概念を簡単に説明する。ディープラーニングにおけるベクトル演算に対して、バイアスの追加は、一つの常に必要な操作であり、この時、コンピューティングデバイス130が、複数の並列に実行されるベクトル演算ユニット150をサポートする必要があり、例えば、図1のベクトル演算ユニット150−1、150−2〜150−L、図3のベクトル演算ユニット150−1及び150−2である。本開示のいくつかの例示的な実施例では、ベクトルタイプの構成可能なベクトル演算パラメータの次元は、ベクトル演算ユニット150の数に対応する(等しい)。例えば、コンピューティングデバイスが二つのベクトル演算ユニット150−1及び150−1を含む場合、構成可能なベクトル演算パラメータCは[C1、C2]であってもよく、その中、C1はベクトル演算ユニット150−1に適用され、C2はベクトル演算ユニット150−2に適用される。バイアスの追加は、例示的な応用シーンに過ぎず、ベクトルタイプの構成可能なベクトル演算パラメータの応用シーンはこれに限定されないことを理解されたい。
Claims (28)
- コンピューティングデバイスによって実行されるベクトル演算を構成する方法であって、
少なくとも一つの構成可能なベクトル演算パラメータを示す情報を取得するステップであって、前記少なくとも一つの構成可能なベクトル演算パラメータの情報は、前記構成可能なベクトル演算パラメータのタイプ及び値を示すステップと、
前記構成可能なベクトル演算パラメータのタイプ及び値に基づいて、複数のベクトル演算ユニットを構成して、前記複数のベクトル演算ユニット内の各ベクトル演算ユニットが、前記構成可能なベクトル演算パラメータのタイプ及び値によって定義される、二つ以上の基本ベクトル演算で構成されるターゲットベクトル演算を実行可能にするステップと、を含む、
ことを特徴とするコンピューティングデバイスによって実行されるベクトル演算を構成する方法。 - 前記構成可能なベクトル演算パラメータのタイプは、スカラタイプ及びベクトルタイプを含む、
ことを特徴とする請求項1に記載のコンピューティングデバイスによって実行されるベクトル演算を構成する方法。 - 前記少なくとも一つの構成可能なベクトル演算パラメータを示す前記情報は、
前記構成可能なベクトル演算パラメータのタイプがスカラタイプであることを明示的に又は暗黙的に示す第1の指示と、
前記構成可能なベクトル演算パラメータの数値と、を含む、
ことを特徴とする請求項2に記載のコンピューティングデバイスによって実行されるベクトル演算を構成する方法。 - 少なくとも一つの構成可能なベクトル演算パラメータを示す情報を取得するステップは、
前記構成可能なベクトル演算パラメータの前記数値を取得するステップと、
取得された前記構成可能なベクトル演算パラメータの数値をスカラストレージデバイスに記憶するステップと、を含む、
ことを特徴とする請求項3に記載のコンピューティングデバイスによって実行されるベクトル演算を構成する方法。 - 前記構成可能なベクトル演算パラメータのタイプ及び値に基づいて、複数のベクトル演算ユニットを構成するステップは、
セレクタを介して前記構成可能なベクトル演算パラメータの前記数値を取得し、前記構成可能なベクトル演算パラメータの前記数値を前記複数のベクトル演算ユニット内の各ベクトル演算ユニットに適用するステップを含む、
ことを特徴とする請求項3又は4に記載のコンピューティングデバイスによって実行されるベクトル演算を構成する方法。 - 前記方法は、
前記構成可能なベクトル演算パラメータのベクトル値を取得するステップと、
前記構成可能なベクトル演算パラメータのベクトル値をベクトルストレージデバイスに記憶するステップと、
前記構成可能なベクトル演算パラメータのベクトル値のストレージ情報を生成するステップであって、前記少なくとも一つの構成可能なベクトル演算パラメータを示す前記情報は、前記ストレージ情報を含むステップと、をさらに含む、
ことを特徴とする請求項2に記載のコンピューティングデバイスによって実行されるベクトル演算を構成する方法。 - 前記構成可能なベクトル演算パラメータのベクトル値の次元は、前記複数のベクトル演算ユニットの数に対応する、
ことを特徴とする請求項6に記載のコンピューティングデバイスによって実行されるベクトル演算を構成する方法。 - 前記構成可能なベクトル演算パラメータを示す前記情報は、
前記構成可能なベクトル演算パラメータのタイプがベクトルタイプであることを明示的に又は暗黙的に示す第2の指示をさらに含む、
ことを特徴とする請求項6に記載のコンピューティングデバイスによって実行されるベクトル演算を構成する方法。 - 前記構成可能なベクトル演算パラメータのタイプ及び値に基づいて、複数のベクトル演算ユニットを構成するステップは、
前記構成可能なベクトル演算パラメータの前記ストレージ情報を取得するステップと、
前記構成可能なベクトル演算パラメータの前記ストレージ情報に基づいて、セレクタを介して前記構成可能なベクトル演算パラメータの前記ベクトル値を取得し、前記構成可能なベクトル演算パラメータの前記ベクトル値の異なる次元の値を、前記複数のベクトル演算ユニット内の各ベクトル演算ユニットにそれぞれ適用するステップと、を含む、
ことを特徴とする請求項6に記載のコンピューティングデバイスによって実行されるベクトル演算を構成する方法。 - 複数のベクトル演算ユニットを含むコンピューティングデバイスによって実行されるベクトル演算の方法であって、
前記方法は、
演算対象のベクトルデータを取得するステップと、
取得されたベクトルデータに対して、ベクトル演算結果を出力するために、前記複数のベクトル演算ユニットによってベクトル演算を実行するステップと、を含み、
前記ベクトル演算は、請求項1〜9のいずれかに記載の方法によって構成される、
ことを特徴とするコンピューティングデバイスによって実行されるベクトル演算の方法。 - 前記方法は、
ベクトルストレージデバイスにベクトルデータをキャッシュするステップをさらに含む、
ことを特徴とする請求項10に記載のコンピューティングデバイスによって実行されるベクトル演算の方法。 - コンピューティングデバイスであって、
少なくとも一つの構成可能なベクトル演算パラメータを示す情報を取得するように構成されるコントローラであって、前記少なくとも一つの構成可能なベクトル演算パラメータの情報は、前記構成可能なベクトル演算パラメータのタイプ及び値を示すコントローラと、
前記構成可能なベクトル演算パラメータのタイプ及び値に基づいて、前記複数のベクトル演算ユニットを構成して、前記複数のベクトル演算ユニット内の各ベクトル演算ユニットが、前記構成可能なベクトル演算パラメータのタイプ及び値によって定義される、二つ以上の基本ベクトル演算で構成されるターゲットベクトル演算を実行可能にするように構成される複数のベクトル演算ユニットを含む計算ユニットと、を含む、
ことを特徴とするコンピューティングデバイス。 - 前記構成可能なベクトル演算パラメータのタイプは、スカラタイプ及びベクトルタイプを含む、
ことを特徴とする請求項12に記載のコンピューティングデバイス。 - 前記少なくとも一つの構成可能なベクトル演算パラメータを示す前記情報は、
前記構成可能なベクトル演算パラメータのタイプがスカラタイプであることを明示的に又は暗黙的に示す第1の指示と、
前記構成可能なベクトル演算パラメータの数値と、を含む、
ことを特徴とする請求項13に記載のコンピューティングデバイス。 - 前記コンピューティングデバイスは、
前記構成可能なベクトル演算パラメータの前記数値を記憶するように構成されるスカラストレージデバイスをさらに含み、
コントローラは、
前記構成可能なベクトル演算パラメータの前記数値を取得し、
取得された前記構成可能なベクトル演算パラメータの前記数値を前記スカラストレージデバイスに記憶するように構成される、
ことを特徴とする請求項14に記載のコンピューティングデバイス。 - 前記計算ユニットは、
前記構成可能なベクトル演算パラメータの数値を取得するように構成されるセレクタと、
前記セレクタによって取得された前記構成可能なベクトル演算パラメータの数値を前記複数のベクトル演算ユニット内の各ベクトル演算ユニットに適用するように構成されるスカラパラメータ構成モジュールと、をさらに含む、
ことを特徴とする請求項14又は15に記載のコンピューティングデバイス。 - 前記コンピューティングデバイスは、
前記構成可能なベクトル演算パラメータのベクトル値を記憶するように構成されるベクトルストレージデバイスと、
前記構成可能なベクトル演算パラメータの前記ベクトル値を取得し、前記構成可能なベクトル演算パラメータの前記ベクトル値を前記ベクトルストレージデバイスに記憶し、前記構成可能なベクトル演算パラメータのベクトル値のストレージ情報を生成するように構成されるベクトルパラメータ取得モジュールと、をさらに含み、
前記少なくとも一つの構成可能なベクトル演算パラメータを示す前記情報には、前記ストレージ情報を含む、
ことを特徴とする請求項13に記載のコンピューティングデバイス。 - 前記構成可能なベクトル演算パラメータのベクトル値の次元は、前記複数のベクトル演算ユニットの数に対応する、
ことを特徴とする請求項17に記載のコンピューティングデバイス。 - 前記構成可能なベクトル演算パラメータを示す前記情報は、
前記構成可能なベクトル演算パラメータのタイプがベクトルタイプであることを明示的に又は暗黙的に示す第2の指示をさらに含む、
ことを特徴とする請求項17に記載のコンピューティングデバイス。 - 前記コントローラは、さらに、前記構成可能なベクトル演算パラメータのストレージ情報を取得するように構成され、
前記演算ユニットは、
前記構成可能なベクトル演算パラメータのストレージ情報に基づいて前記構成可能なベクトル演算パラメータのベクトル値を取得するように構成されるセレクタと、
前記セレクタによって取得された前記構成可能なベクトル演算パラメータの前記ベクトル値の異なる次元の値を、前記複数のベクトル演算ユニット内の各ベクトル演算ユニットにそれぞれ適用するように構成されるベクトルパラメータ構成モジュールと、を含む、
ことを特徴とする請求項17に記載のコンピューティングデバイス。 - コンピューティングデバイスであって、
演算対象のベクトルデータを取得し、取得されたベクトルデータに対して、ベクトル演算結果を出力するために、前記複数のベクトル演算ユニットを操作してベクトル演算を実行するように構成される複数のベクトル演算ユニットを含む計算ユニットを含み、
前記ベクトル演算は、請求項1〜9のいずれかに記載の方法によって構成される、
ことを特徴とするコンピューティングデバイス。 - 前記コンピューティングデバイスは、
前記演算対象のベクトルデータを記憶するように構成されるベクトルストレージデバイスと、
ベクトルストレージデバイスにベクトルデータをキャッシュするように構成されるベクトルデータ取得モジュールと、をさらに含む、
ことを特徴とする請求項21に記載のコンピューティングデバイス。 - 電子機器であって、
一つ又は複数のプロセッサと、
一つ又は複数のプログラムを記憶するための記憶装置と、を含み、
前記一つ又は複数のプログラムが前記一つ又は複数のプロセッサにより実行される場合に、前記一つ又は複数のプロセッサが、請求項1〜9のいずれかに記載の方法を実現する、
ことを特徴とする電子機器。 - コンピュータプログラムが記憶されているコンピュータ読み取り可能な記憶媒体であって、
前記プログラムがプロセッサにより実行される場合に、請求項1〜9のいずれかに記載の方法が実現される、
ことを特徴とするコンピュータ読み取り可能な記憶媒体。 - コンピュータ読み取り可能な記憶媒体に記憶されているコンピュータプログラムであって、
前記コンピュータプログラムにおける命令が実行される場合に、請求項1〜9のいずれかに記載の方法が実現される、
ことを特徴とするコンピュータプログラム。 - 電子機器であって、
一つ又は複数のプロセッサと、
一つ又は複数のプログラムを記憶するための記憶装置と、を含み、
前記一つ又は複数のプログラムが前記一つ又は複数のプロセッサにより実行される場合に、前記一つ又は複数のプロセッサが、請求項10または11に記載の方法を実現する、
ことを特徴とする電子機器。 - コンピュータプログラムが記憶されているコンピュータ読み取り可能な記憶媒体であって、
前記プログラムがプロセッサにより実行される場合に、請求項10または11に記載の方法が実現される、
ことを特徴とするコンピュータ読み取り可能な記憶媒体。 - コンピュータ読み取り可能な記憶媒体に記憶されているコンピュータプログラムであって、
前記コンピュータプログラムにおける命令が実行される場合に、請求項10または11に記載の方法が実現される、
ことを特徴とするコンピュータプログラム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910677739.9A CN112286578A (zh) | 2019-07-25 | 2019-07-25 | 由计算设备执行的方法、装置、设备和计算机可读存储介质 |
CN201910677739.9 | 2019-07-25 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021022370A true JP2021022370A (ja) | 2021-02-18 |
JP7042870B2 JP7042870B2 (ja) | 2022-03-28 |
Family
ID=70008361
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020108978A Active JP7042870B2 (ja) | 2019-07-25 | 2020-06-24 | コンピューティングデバイスによって実行される方法、装置、機器及びコンピュータ読み取り可能な記憶媒体 |
Country Status (5)
Country | Link |
---|---|
US (1) | US11221851B2 (ja) |
EP (1) | EP3770756B1 (ja) |
JP (1) | JP7042870B2 (ja) |
KR (1) | KR102471553B1 (ja) |
CN (1) | CN112286578A (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114489506B (zh) * | 2022-01-21 | 2024-02-27 | 杭州海康存储科技有限公司 | 存储访问控制装置、方法及存储设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS59114677A (ja) * | 1982-12-22 | 1984-07-02 | Hitachi Ltd | ベクトル処理装置 |
JPH02176971A (ja) * | 1988-12-28 | 1990-07-10 | Koufu Nippon Denki Kk | ベクトル演算装置 |
JPH04181373A (ja) * | 1990-11-15 | 1992-06-29 | Koufu Nippon Denki Kk | ベクトル処理装置 |
JPH09185602A (ja) * | 1995-12-28 | 1997-07-15 | Nec Corp | ベクトルプロセッサ |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020133688A1 (en) * | 2001-01-29 | 2002-09-19 | Ming-Hau Lee | SIMD/MIMD processing on a reconfigurable array |
US20040193837A1 (en) * | 2003-03-31 | 2004-09-30 | Patrick Devaney | CPU datapaths and local memory that executes either vector or superscalar instructions |
EP1758030B1 (en) * | 2005-08-22 | 2009-05-27 | Panasonic Corporation | Dynamically reconfigurable shared baseband engine |
KR101259133B1 (ko) * | 2009-11-11 | 2013-04-30 | 삼성중공업 주식회사 | 동작 중 재구성이 가능한 제어 시스템 및 그 방법 |
KR101699910B1 (ko) * | 2010-03-04 | 2017-01-26 | 삼성전자주식회사 | 재구성 가능 프로세서 및 그 제어 방법 |
GB2489914B (en) * | 2011-04-04 | 2019-12-18 | Advanced Risc Mach Ltd | A data processing apparatus and method for performing vector operations |
US10762164B2 (en) * | 2016-01-20 | 2020-09-01 | Cambricon Technologies Corporation Limited | Vector and matrix computing device |
GB2553783B (en) * | 2016-09-13 | 2020-11-04 | Advanced Risc Mach Ltd | Vector multiply-add instruction |
US10402527B2 (en) * | 2017-01-04 | 2019-09-03 | Stmicroelectronics S.R.L. | Reconfigurable interconnect |
US11586907B2 (en) * | 2018-02-27 | 2023-02-21 | Stmicroelectronics S.R.L. | Arithmetic unit for deep learning acceleration |
US10628162B2 (en) * | 2018-06-19 | 2020-04-21 | Qualcomm Incorporated | Enabling parallel memory accesses by providing explicit affine instructions in vector-processor-based devices |
-
2019
- 2019-07-25 CN CN201910677739.9A patent/CN112286578A/zh active Pending
-
2020
- 2020-03-25 EP EP20165644.4A patent/EP3770756B1/en active Active
- 2020-04-14 KR KR1020200045444A patent/KR102471553B1/ko active IP Right Grant
- 2020-06-24 JP JP2020108978A patent/JP7042870B2/ja active Active
- 2020-07-23 US US16/936,676 patent/US11221851B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS59114677A (ja) * | 1982-12-22 | 1984-07-02 | Hitachi Ltd | ベクトル処理装置 |
JPH02176971A (ja) * | 1988-12-28 | 1990-07-10 | Koufu Nippon Denki Kk | ベクトル演算装置 |
JPH04181373A (ja) * | 1990-11-15 | 1992-06-29 | Koufu Nippon Denki Kk | ベクトル処理装置 |
JPH09185602A (ja) * | 1995-12-28 | 1997-07-15 | Nec Corp | ベクトルプロセッサ |
Also Published As
Publication number | Publication date |
---|---|
EP3770756A1 (en) | 2021-01-27 |
EP3770756B1 (en) | 2024-05-01 |
KR102471553B1 (ko) | 2022-11-28 |
US11221851B2 (en) | 2022-01-11 |
JP7042870B2 (ja) | 2022-03-28 |
CN112286578A (zh) | 2021-01-29 |
KR20210012886A (ko) | 2021-02-03 |
US20210026630A1 (en) | 2021-01-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7379779B2 (ja) | 行列処理装置 | |
KR102470264B1 (ko) | 완전연결층 신경망 역방향 트레이닝 실행용 장치와 방법 | |
Li et al. | GPU-accelerated preconditioned iterative linear solvers | |
KR102486030B1 (ko) | 완전연결층 신경망 정방향 연산 실행용 장치와 방법 | |
EP3407202A1 (en) | Matrix calculation apparatus | |
US9910714B2 (en) | Scriptable dynamic load balancing in computer systems | |
JP7088897B2 (ja) | データアクセス方法、データアクセス装置、機器及び記憶媒体 | |
US20070192762A1 (en) | Method to analyze and reduce number of data reordering operations in SIMD code | |
US20110302394A1 (en) | System and method for processing regular expressions using simd and parallel streams | |
CN107315716B (zh) | 一种用于执行向量外积运算的装置和方法 | |
KR102333845B1 (ko) | 칩 기반의 컴퓨팅 기능 생성 방법, 장치, 기기 및 저장 매체 | |
US20200364056A1 (en) | Facilitating data processing using simd reduction operations across simd lanes | |
CN112463159A (zh) | 编译方法、装置、电子设备和存储介质 | |
CN112463160A (zh) | 编译方法、装置、电子设备和存储介质 | |
US10476492B2 (en) | Structures and operations of integrated circuits having network of configurable switches | |
JP7042870B2 (ja) | コンピューティングデバイスによって実行される方法、装置、機器及びコンピュータ読み取り可能な記憶媒体 | |
CN116069393A (zh) | 一种数据处理方法以及相关装置 | |
CN110704193B (zh) | 一种适合向量处理的多核软件架构的实现方法及装置 | |
CN112465116B (zh) | 编译方法、运算方法、电子设备和存储介质 | |
JP6489985B2 (ja) | プログラム開発支援装置およびプログラム開発支援ソフトウェア | |
CN116185378A (zh) | 计算图的优化方法、数据处理方法及相关产品 | |
CN116185377A (zh) | 计算图的优化方法、计算装置及相关产品 | |
CN111966399B (zh) | 指令处理方法、装置及相关产品 | |
CN117540783B (zh) | 仿真脑活动数据的生成方法、装置、电子装置和存储介质 | |
CN117768356B (zh) | 预测方法及装置、电子设备与存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200624 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210615 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210706 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20211005 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20211018 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20211018 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20220204 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220308 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220315 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7042870 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |