JP7408723B2 - ニューラルネットワークプロセッシングユニット、ニューラルネットワークの処理方法及びその装置 - Google Patents
ニューラルネットワークプロセッシングユニット、ニューラルネットワークの処理方法及びその装置 Download PDFInfo
- Publication number
- JP7408723B2 JP7408723B2 JP2022089599A JP2022089599A JP7408723B2 JP 7408723 B2 JP7408723 B2 JP 7408723B2 JP 2022089599 A JP2022089599 A JP 2022089599A JP 2022089599 A JP2022089599 A JP 2022089599A JP 7408723 B2 JP7408723 B2 JP 7408723B2
- Authority
- JP
- Japan
- Prior art keywords
- input data
- result
- floating point
- dsp
- npu
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000013528 artificial neural network Methods 0.000 title claims description 57
- 238000012545 processing Methods 0.000 title claims description 51
- 238000003672 processing method Methods 0.000 title claims description 26
- 238000013139 quantization Methods 0.000 claims description 77
- 238000007667 floating Methods 0.000 claims description 76
- 238000004364 calculation method Methods 0.000 claims description 75
- 238000000034 method Methods 0.000 claims description 55
- 239000013598 vector Substances 0.000 claims description 54
- 239000011159 matrix material Substances 0.000 claims description 24
- 230000004913 activation Effects 0.000 claims description 21
- 230000006870 function Effects 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 10
- 238000006243 chemical reaction Methods 0.000 claims description 7
- 238000012546 transfer Methods 0.000 claims description 5
- 230000008569 process Effects 0.000 description 36
- 238000005516 engineering process Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 11
- 238000013473 artificial intelligence Methods 0.000 description 9
- 238000004891 communication Methods 0.000 description 8
- 238000013461 design Methods 0.000 description 6
- 238000007792 addition Methods 0.000 description 5
- 238000013519 translation Methods 0.000 description 5
- 230000001133 acceleration Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 230000009977 dual effect Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 102100039164 Acetyl-CoA carboxylase 1 Human genes 0.000 description 1
- 101710190443 Acetyl-CoA carboxylase 1 Proteins 0.000 description 1
- 102100021641 Acetyl-CoA carboxylase 2 Human genes 0.000 description 1
- 101000677540 Homo sapiens Acetyl-CoA carboxylase 2 Proteins 0.000 description 1
- 101000894929 Homo sapiens Bcl-2-related protein A1 Proteins 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000003139 buffering effect Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/06—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
- G06N3/063—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using electronic means
- G06N3/065—Analogue means
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/06—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
- G06N3/063—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using electronic means
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
- G06F18/2148—Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the process organisation or structure, e.g. boosting cascade
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F5/00—Methods or arrangements for data conversion without changing the order or content of the data handled
- G06F5/01—Methods or arrangements for data conversion without changing the order or content of the data handled for shifting, e.g. justifying, scaling, normalising
- G06F5/012—Methods or arrangements for data conversion without changing the order or content of the data handled for shifting, e.g. justifying, scaling, normalising in floating-point computations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F7/00—Methods or arrangements for processing data by operating upon the order or content of the data handled
- G06F7/38—Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation
- G06F7/48—Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices
- G06F7/544—Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices for evaluating functions by calculation
- G06F7/5443—Sum of products
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/30003—Arrangements for executing specific machine instructions
- G06F9/30007—Arrangements for executing specific machine instructions to perform operations on data operands
- G06F9/30036—Instructions to perform operations on packed data, e.g. vector, tile or matrix operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/38—Concurrent instruction execution, e.g. pipeline or look ahead
- G06F9/3877—Concurrent instruction execution, e.g. pipeline or look ahead using a slave processor, e.g. coprocessor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5005—Allocation of resources, e.g. of the central processing unit [CPU] to service a request
- G06F9/5011—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resources being hardware resources other than CPUs, Servers and Terminals
- G06F9/5016—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resources being hardware resources other than CPUs, Servers and Terminals the resource being the memory
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/16—Speech classification or search using artificial neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Computing Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Computational Mathematics (AREA)
- Neurology (AREA)
- Databases & Information Systems (AREA)
- Algebra (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Complex Calculations (AREA)
- Facsimile Image Signal Circuits (AREA)
Description
前記PSRAMが、ニューラルネットワークのネットワークパラメータを記憶するように構成される。
Claims (16)
- 浮動小数点型の入力データを取得し、前記浮動小数点型の入力データを量子化して量子化された後の入力データを得て、前記量子化された後の入力データを演算ユニットに提供し、及び、前記演算ユニットによって出力された演算結果に対して逆量子化を行って逆量子化結果を得るための量子化ユニットを備え、
前記演算ユニットが、前記量子化された後の入力データに対して行列ベクトル操作及び/又は畳み込み演算を行って、前記入力データの演算結果を得るように構成され、
前記演算ユニットが、行列ベクトル操作を実行し、前記量子化ユニットが、
デジタル信号プロセッサDSP内部のメモリに記憶される浮動小数点型の入力データに基づいて、量子化のために使用される第1のパラメータと逆量子化のために使用される第2のパラメータを求め、
数値型の入力データを得るように、前記浮動小数点型の入力データ内における量子化対象の浮動小数点の値に第1のパラメータをかけ、且つ小数点以下を切り捨てて数値型に変換し、
前記数値型の入力データを前記演算ユニットに送信し、
前記演算ユニットが得た演算結果を浮動小数点型に変換し、
浮動小数点型の演算結果に前記第2のパラメータをかけてDSPのメモリに送信して記憶するように構成されるニューラルネットワークプロセッシングユニットNPU。 - バスのメインインターフェースを備え、
該メインインターフェースが、前記バスを介して前記DSPにメモリコピー関数を送信することにより、前記DSP内部のメモリにアクセスして、前記DSP内部のメモリに記憶される前記浮動小数点型の入力データを得るように構成される請求項1に記載のNPU。 - 前記演算ユニットが畳み込み演算を実行し、
前記量子化ユニットが、前記浮動小数点型の入力データに対して、浮動小数点を短整数型に変換する変換操作を行うことで、変換後の短整数型の入力データに対して畳み込み演算を実行するように構成される請求項1に記載のNPU。 - 前記NPUが、高速アクセスインターフェースを介してランダムメモリRAMに接続され、
前記RAMが、前記短整数型の入力データを前記RAM内に転送して記憶するように構成される請求項3に記載のNPU。 - 前記演算ユニットが、第1のレジスタ、第2のレジスタ及びアキュムレータを備え、
前記第1のレジスタが、第1の周期で前記RAMから前記短整数型の入力データを読み取るように構成され、
前記第2のレジスタが、第1の周期の後の複数の後続サイクルで、PSRAMに記憶されているネットワークパラメータの少なくとも一部を読み取り、各周期で読み取った前記ネットワークパラメータの少なくとも一部と前記第1のレジスタ内の対応する入力データとのドット積演算を行うように構成され、
前記アキュムレータが、ドット積演算の結果を取得し、前記ドット積演算の結果に基づいて累積して、畳み込み演算の演算結果を得るように構成される請求項4に記載のNPU。 - DSPに記憶されている畳み込み演算の演算結果に基づいて、活性化関数を用いて活性化を行い、且つ記憶するように活性化結果を前記DSPに提供するための活性化ユニットを備える請求項1から5のいずれか一項に記載のNPU。
- バスで接続される請求項1から5のいずれか一項に記載のニューラルネットワークプロセッシングユニットNPUと、擬似静的ランダムメモリPSRAMと、デジタル信号プロセッサDSPと、を備え、
前記DSPが、内部のメモリに処理対象の入力データを記憶し、及び前記NPUによる前記入力データの演算結果を記憶するように構成され、
前記PSRAMが、ニューラルネットワークのネットワークパラメータを記憶するように構成される処理装置。 - ニューラルネットワークプロセッシングユニットNPUに適用されるニューラルネットワークの処理方法であって、前記NPUが量子化ユニット及び演算ユニットを備え、
前記量子化ユニットが浮動小数点型の入力データを取得し、前記浮動小数点型の入力データを量子化して量子化された後の入力データを得て、前記量子化された後の入力データを演算ユニットに提供するステップと、
前記演算ユニットが前記量子化された後の入力データに対して行列ベクトル操作及び/又は畳み込み演算を行って、前記入力データの演算結果を得るステップと、
前記量子化ユニットが前記演算ユニットによって出力された演算結果に対して逆量子化を行って逆量子化結果を得るステップと、
を含み、
前記量子化ユニットが、デジタル信号プロセッサDSP内部のメモリに記憶される浮動小数点型の入力データに基づいて、量子化のために使用される第1のパラメータと逆量子化のために使用される第2のパラメータを求め、数値型の入力データを得るように、前記浮動小数点型の入力データ内における量子化対象の浮動小数点の値に第1のパラメータをかけ、且つ小数点以下を切り捨てて数値型に変換し、及び前記数値型の入力データを前記演算ユニットに送信し、
前記演算ユニットが、前記数値型の入力データに対して行列ベクトル操作を実行し、前記演算結果を得て、
前記量子化ユニットが、前記演算結果を浮動小数点型に変換し、浮動小数点型の演算結果に前記第2のパラメータをかけてDSPのメモリに送信して記憶する、ニューラルネットワークの処理方法。 - 前記NPUが、バスのメインインターフェースを備え、
前記メインインターフェースが、前記バスを介して前記DSPにメモリコピー関数を送信することにより、前記DSP内部のメモリにアクセスして、前記DSP内部のメモリに記憶される前記浮動小数点型の入力データを得るように構成される請求項8に記載の方法。 - 前記量子化ユニットが、前記浮動小数点型の入力データに対して、浮動小数点を短整数型に変換する変換操作を行い、
前記演算ユニットが、変換後の短整数型の入力データに対して畳み込み演算を実行し、前記演算結果を得る請求項8に記載の方法。 - 前記NPUが、高速アクセスインターフェースを介してランダムメモリRAMに接続され、
前記RAMが、前記短整数型の入力データを前記RAM内に転送して記憶するように構成される請求項10に記載の方法。 - 前記演算ユニットが、第1のレジスタ、第2のレジスタ及びアキュムレータを備え、
前記第1のレジスタが、第1の周期で前記RAMから前記短整数型の入力データを読み取り、
前記第2のレジスタが、第1の周期の後の複数の後続サイクルで、PSRAMに記憶されているネットワークパラメータの少なくとも一部を読み取り、各周期で読み取った前記ネットワークパラメータの少なくとも一部と前記第1のレジスタ内の対応する入力データとのドット積演算を行い、
前記アキュムレータドット積演算の結果を取得し、前記ドット積演算の結果に基づいて累積して、畳み込み演算の演算結果を得る請求項11に記載の方法。 - 前記NPUが、活性化ユニットを備え、
前記方法が、活性化ユニットDSPに記憶されている畳み込み演算の演算結果に基づいて、活性化関数を用いて活性化を行い、且つ記憶するように活性化結果を前記DSPに提供するステップを含む請求項8から12のいずれか一項に記載の方法。 - 少なくとも1つのプロセッサと、
該なくとも1つのプロセッサと通信可能に接続されるメモリと、
を備え、
前記メモリには、前記少なくとも1つのプロセッサによって実行可能な命令が記憶されており、前記命令が、前記少なくとも1つのプロセッサが請求項8から12のいずれか一項に記載のニューラルネットワークの処理方法を実行できるように、前記少なくとも1つのプロセッサによって実行される電子機器。 - コンピュータ命令が記憶されている非一時的コンピュータ読み取り可能な記憶媒体であって、前記コンピュータ命令は、コンピュータに請求項8から12のいずれか一項に記載のニューラルネットワークの処理方法を実行させる非一時的コンピュータ読み取り可能な記憶媒体。
- プロセッサによって実行される際に、請求項8から12のいずれか一項に記載のニューラルネットワークの処理方法を実現するコンピュータプログラム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110679295.XA CN113570033B (zh) | 2021-06-18 | 2021-06-18 | 神经网络处理单元、神经网络的处理方法及其装置 |
CN202110679295.X | 2021-06-18 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022116266A JP2022116266A (ja) | 2022-08-09 |
JP7408723B2 true JP7408723B2 (ja) | 2024-01-05 |
Family
ID=78162273
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022089599A Active JP7408723B2 (ja) | 2021-06-18 | 2022-06-01 | ニューラルネットワークプロセッシングユニット、ニューラルネットワークの処理方法及びその装置 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20220292337A1 (ja) |
EP (1) | EP4044070A3 (ja) |
JP (1) | JP7408723B2 (ja) |
KR (1) | KR20220078536A (ja) |
CN (1) | CN113570033B (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020075433A1 (ja) * | 2018-10-10 | 2020-04-16 | LeapMind株式会社 | ニューラルネットワーク処理装置、ニューラルネットワーク処理方法、およびニューラルネットワーク処理プログラム |
CN116090520A (zh) * | 2023-01-18 | 2023-05-09 | 广东高云半导体科技股份有限公司 | 一种数据处理系统及方法 |
CN115883564B (zh) * | 2023-02-21 | 2023-05-23 | 青岛创新奇智科技集团股份有限公司 | 一种媒体流处理方法、装置、电子设备及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN208141826U (zh) | 2018-05-22 | 2018-11-23 | 出门问问信息科技有限公司 | 一种语音离线识别装置 |
US20190294413A1 (en) | 2018-03-23 | 2019-09-26 | Amazon Technologies, Inc. | Accelerated quantized multiply-and-add operations |
CN111931917A (zh) | 2020-08-20 | 2020-11-13 | 浙江大华技术股份有限公司 | 前向计算的实现方法及装置、存储介质、电子装置 |
WO2020249085A1 (zh) | 2019-06-14 | 2020-12-17 | 华为技术有限公司 | 基于神经网络计算的数据处理方法和装置 |
US20210132769A1 (en) | 2020-08-18 | 2021-05-06 | Kunjal S. Parikh | Lid controller hub architecture for improved touch experiences |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190102671A1 (en) * | 2017-09-29 | 2019-04-04 | Intel Corporation | Inner product convolutional neural network accelerator |
KR20200075185A (ko) * | 2018-12-17 | 2020-06-26 | 삼성전자주식회사 | 뉴럴 프로세싱 시스템 및 그것의 동작 방법 |
US11531893B2 (en) * | 2019-06-03 | 2022-12-20 | Samsung Electronics Co., Ltd. | Method and apparatus with neural network parameter quantization |
CN112686365B (zh) * | 2019-10-18 | 2024-03-29 | 华为技术有限公司 | 运行神经网络模型的方法、装置和计算机设备 |
CN111368972B (zh) * | 2020-02-21 | 2023-11-10 | 华为技术有限公司 | 一种卷积层量化方法及其装置 |
CN111931918B (zh) * | 2020-09-24 | 2021-02-12 | 深圳佑驾创新科技有限公司 | 神经网络加速器 |
CN112580787B (zh) * | 2020-12-25 | 2023-11-17 | 北京百度网讯科技有限公司 | 神经网络加速器的数据处理方法、装置、设备及存储介质 |
-
2021
- 2021-06-18 CN CN202110679295.XA patent/CN113570033B/zh active Active
-
2022
- 2022-05-24 KR KR1020220063239A patent/KR20220078536A/ko not_active Application Discontinuation
- 2022-06-01 JP JP2022089599A patent/JP7408723B2/ja active Active
- 2022-06-03 US US17/832,303 patent/US20220292337A1/en active Pending
- 2022-06-03 EP EP22177114.0A patent/EP4044070A3/en not_active Withdrawn
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190294413A1 (en) | 2018-03-23 | 2019-09-26 | Amazon Technologies, Inc. | Accelerated quantized multiply-and-add operations |
CN208141826U (zh) | 2018-05-22 | 2018-11-23 | 出门问问信息科技有限公司 | 一种语音离线识别装置 |
WO2020249085A1 (zh) | 2019-06-14 | 2020-12-17 | 华为技术有限公司 | 基于神经网络计算的数据处理方法和装置 |
US20210132769A1 (en) | 2020-08-18 | 2021-05-06 | Kunjal S. Parikh | Lid controller hub architecture for improved touch experiences |
CN111931917A (zh) | 2020-08-20 | 2020-11-13 | 浙江大华技术股份有限公司 | 前向计算的实现方法及装置、存储介质、电子装置 |
Also Published As
Publication number | Publication date |
---|---|
CN113570033A (zh) | 2021-10-29 |
EP4044070A3 (en) | 2022-12-21 |
JP2022116266A (ja) | 2022-08-09 |
EP4044070A2 (en) | 2022-08-17 |
US20220292337A1 (en) | 2022-09-15 |
KR20220078536A (ko) | 2022-06-10 |
CN113570033B (zh) | 2023-04-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7408723B2 (ja) | ニューラルネットワークプロセッシングユニット、ニューラルネットワークの処理方法及びその装置 | |
CN110520870B (zh) | 用于具有动态向量长度和码本大小的高吞吐量向量去量化的灵活硬件 | |
JP7406606B2 (ja) | テキスト認識モデルの訓練方法、テキスト認識方法及び装置 | |
Rhu et al. | Compressing DMA engine: Leveraging activation sparsity for training deep neural networks | |
WO2020073211A1 (zh) | 运算加速器、处理方法及相关设备 | |
JP2022058328A (ja) | 分散型モデルトレーニング装置および方法、電子機器、記憶媒体、ならびに、コンピュータプログラム | |
US11809953B1 (en) | Dynamic code loading for multiple executions on a sequential processor | |
WO2022111002A1 (zh) | 用于训练神经网络的方法、设备和计算机可读存储介质 | |
KR20210151730A (ko) | 메모리 할당 방법, 장치 및 전자 기기 | |
CN114781618A (zh) | 一种神经网络量化处理方法、装置、设备及可读存储介质 | |
Liu et al. | Parallel program design for JPEG compression encoding | |
CN112183744A (zh) | 一种神经网络剪枝方法及装置 | |
CN115688917A (zh) | 神经网络模型的训练方法、装置、电子设备及存储介质 | |
CN113554149B (zh) | 神经网络处理单元npu、神经网络的处理方法及其装置 | |
CN113570034B (zh) | 处理装置、神经网络的处理方法及其装置 | |
KR20200139909A (ko) | 전자 장치 및 그의 연산 수행 방법 | |
US20220318604A1 (en) | Sparse machine learning acceleration | |
US20220113943A1 (en) | Method for multiply-add operations for neural network | |
US20210209471A1 (en) | Processor memory optimization method and apparatus for deep learning training tasks | |
CN115222028A (zh) | 基于fpga的一维cnn-lstm加速平台及实现方法 | |
EP3186731B1 (en) | Array-based computations on a storage device | |
CN114025161B (zh) | 图像处理中的频率特定压缩与补偿技术 | |
KR102435447B1 (ko) | 뉴럴 네트워크 시스템 및 이의 동작 방법 | |
CN110347506B (zh) | 基于lstm的数据处理方法、装置、存储介质与电子设备 | |
WO2022257920A1 (zh) | 优化深度神经网络的参数的处理系统、集成电路及板卡 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220601 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230808 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231108 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231205 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20231220 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7408723 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |