JP2022501674A - データを処理するための方法、装置、及び関連製品 - Google Patents
データを処理するための方法、装置、及び関連製品 Download PDFInfo
- Publication number
- JP2022501674A JP2022501674A JP2020566955A JP2020566955A JP2022501674A JP 2022501674 A JP2022501674 A JP 2022501674A JP 2020566955 A JP2020566955 A JP 2020566955A JP 2020566955 A JP2020566955 A JP 2020566955A JP 2022501674 A JP2022501674 A JP 2022501674A
- Authority
- JP
- Japan
- Prior art keywords
- data
- truncation
- value
- quantization
- quantized
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 96
- 238000012545 processing Methods 0.000 title claims abstract description 59
- 238000013473 artificial intelligence Methods 0.000 claims abstract description 46
- 230000005540 biological transmission Effects 0.000 claims abstract description 15
- 238000013139 quantization Methods 0.000 claims description 162
- 230000008569 process Effects 0.000 claims description 31
- 238000003062 neural network model Methods 0.000 claims description 15
- 238000007667 floating Methods 0.000 claims description 12
- 238000010801 machine learning Methods 0.000 claims description 12
- 230000004044 response Effects 0.000 claims description 10
- 238000004590 computer program Methods 0.000 claims description 4
- 238000012544 monitoring process Methods 0.000 claims description 3
- 238000013500 data storage Methods 0.000 claims description 2
- 238000010586 diagram Methods 0.000 abstract description 16
- 238000013528 artificial neural network Methods 0.000 description 74
- 210000002569 neuron Anatomy 0.000 description 23
- 230000006870 function Effects 0.000 description 19
- 238000012549 training Methods 0.000 description 18
- 230000015654 memory Effects 0.000 description 17
- 230000004913 activation Effects 0.000 description 8
- 238000004364 calculation method Methods 0.000 description 5
- 238000009826 distribution Methods 0.000 description 5
- 230000003068 static effect Effects 0.000 description 4
- 101100498818 Arabidopsis thaliana DDR4 gene Proteins 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 241000282472 Canis lupus familiaris Species 0.000 description 2
- 241000282326 Felis catus Species 0.000 description 2
- 230000000712 assembly Effects 0.000 description 2
- 238000000429 assembly Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000012886 linear function Methods 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 238000005481 NMR spectroscopy Methods 0.000 description 1
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013529 biological neural network Methods 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 235000013339 cereals Nutrition 0.000 description 1
- 239000011362 coarse particle Substances 0.000 description 1
- 238000005094 computer simulation Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000010419 fine particle Substances 0.000 description 1
- 210000002364 input neuron Anatomy 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 210000004205 output neuron Anatomy 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/06—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
- G06N3/063—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using electronic means
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
- G06F18/2148—Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the process organisation or structure, e.g. boosting cascade
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
- G06F18/24133—Distances to prototypes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F7/00—Methods or arrangements for processing data by operating upon the order or content of the data handled
- G06F7/38—Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation
- G06F7/48—Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices
- G06F7/483—Computations with numbers represented by a non-linear combination of denominational numbers, e.g. rational numbers, logarithmic number system or floating-point numbers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Pure & Applied Mathematics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Computational Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Nonlinear Science (AREA)
- Neurology (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
本発明の第4態様において、人工知能チップを提供し、当該人工知能チップは、本発明の各実施例に係るデータを処理するための装置を備える。
本発明の第5態様において、電子デバイスを提供し、当該電子デバイスは、本発明の各実施例に係る人工知能チップを含む。
一つの実施例において、人工知能チップをさらに開示し、当該人工知能チップは、上述したデータデータを処理するための装置を含む。
以下の条項によって前述した内容をよりよく理解できる。
A1.データを処理するための方法であって、
機械学習モデルに用いられる1組の量子化待ちデータを取得するステップと、
ことを特徴とする前記方法。
A2.複数組の量子化後のデータを確定するステップは、
前記1組の量子化待ちデータの中のすべてのデータの絶対値最大値を確定するステップと、
前記絶対値最大値に基づいて、前記複数ペアの切捨て閾値を確定するステップと、を含む
ことを特徴とする条項A1に記載の前記方法。
A3.複数組の量子化後のデータを確定するステップは、
前記絶対値最大値、所定の合計検索回数、および、現在検索順序に基づいて、第1切捨て正の値を確定するステップと、
前記1番目の組の量子化後のデータの絶対値の平均値と前記1組の量子化待ちデータの絶対値の平均値との間の第1差異を確定するステップと、をさらに含む
ことを特徴とする条項A2に記載の前記方法。
A4.複数組の量子化後のデータを確定するステップは、
前記現在検索順序をインクリメントするステップと、
前記絶対値最大値、前記所定の合計検索回数、および、前記現在検索順序に基づいて、第2切捨て正の値を確定するステップと、
前記2番目の組の量子化後のデータの絶対値の平均値と前記1組の量子化待ちデータの絶対値の平均値との間の第2差異を確定するステップと、をさらに含む
ことを特徴とする条項A3に記載の前記方法。
A5.前記複数ペアの切捨て閾値の中から1ペアの切捨て閾値を選択するステップは、
前記複数組の量子化後のデータ中で前記1組の量子化待ちデータとの絶対値の平均値の差異が最小である1組の量子化後のデータを確定するステップと、
前記複数ペアの切捨て閾値の中から前記1組の量子化後のデータと対応する1ペアの切捨て閾値を選択するステップと、を含む
ことを特徴とする条項A1−A4のいずれか1項に記載の前記方法。
A6.選択した前記1ペアの切捨て閾値に関連付けられた切捨て検索範囲を確定するステップと、
前記切捨て検索範囲内に位置する新たな複数ペアの切捨て閾値を確定するステップと、
ことを特徴とする条項A5に記載の前記方法。
A7.複数組の量子化後のデータを確定するステップは、
前記1組の量子化待ちデータの中のすべてのデータの絶対値最大値を確定するステップと、
3ペアの切捨て閾値を使用してそれぞれ前記1組の量子化待ちデータを量子化することによって、3組の量子化後のデータを確定するステップと、を含む
ことを特徴とする条項A1に記載の前記方法。
停止条件を満たすまで、以下の動作を反復実行するステップを含み、当該動作は、
前記3ペアの切捨て閾値の中から1ペアの切捨て閾値を選択する動作と、
選択した1ペアの切捨て閾値と対応する差異が所定閾値未満であるか否かを確定する動作と、
前記差異が所定閾値未満であることに応答して、動作の反復実行を停止する動作と、
前記差異が所定閾値よりも大きいことに応答して、選択した1ペアの切捨て閾値に基づいて、再度3ペアの切捨て閾値を確定する動作と、を含む
ことを特徴とする条項A7に記載の前記方法。
前記方法は、
ことを特徴とする条項A1−A8のいずれか1項に記載の前記方法。
A10.データを処理するための装置であって、
機械学習モデルに用いられる1組の量子化待ちデータを取得するための量子化待ちデータ取得ユニットと、
ことを特徴とする前記装置。
前記1組の量子化待ちデータの中のすべてのデータの絶対値最大値を確定するための絶対値最大値確定ユニットと、
前記絶対値最大値に基づいて前記複数ペアの切捨て閾値を確定するための複数ペア切捨て閾値確定ユニットと、を備える
ことを特徴とする条項A10に記載の前記装置。
前記絶対値最大値、所定の合計検索回数、および、現在検索順序に基づいて、第1切捨て正の値を確定するための第1切捨て正の値確定ユニットと、
ことを特徴とする条項A11に記載の前記装置。
前記現在検索順序をインクリメントするためのインクリメントユニットと、
前記絶対値最大値、前記所定の合計検索回数、および、前記現在検索順序に基づいて、第2切捨て正の値を確定するための第2切捨て正の値確定ユニットと、
ことを特徴とする条項A12に記載の前記装置。
A14.前記切捨て閾値選択ユニットは、
前記複数ペアの切捨て閾値の中から前記1組の量子化後のデータと対応する1ペアの切捨て閾値を選択するための第2切捨て閾値選択ユニットと、を備える
ことを特徴とする条項A10乃至A13のいずれか1項に記載の前記装置。
前記切捨て検索範囲内に位置する新たな複数ペアの切捨て閾値を確定するための新たな複数ペア切捨て閾値確定ユニットと、
ことを特徴とする条項A14に記載の前記装置。
A16.前記量子化後データ確定ユニットは、
前記1組の量子化待ちデータの中のすべてのデータの絶対値最大値を確定するための絶対値最大値確定ユニットと、
ことを特徴とする条項A10に記載の前記装置。
停止条件を満たすまで、以下の動作を反復実行するための反復ユニットを備え、
当該動作は、
前記3ペアの切捨て閾値の中から1ペアの切捨て閾値を選択する動作と、
選択した1ペアの切捨て閾値と対応する差異が所定閾値未満であるか否かを確定する動作と、
前記差異が所定閾値未満であることに応答して、動作の反復実行を停止する動作と、
前記差異が所定閾値よりも大きいことに応答して、選択した1ペアの切捨て閾値に基づいて、再度3ペアの切捨て閾値を確定する動作と、を含む
ことを特徴とする条項A16に記載の前記装置。
前記装置は、
得られた量子化後のデータを前記ニューラルネットワークモデルに入力して、処理に用いるためのデータ入力ユニットと、をさらに備える
ことを特徴とする条項A10乃至A17のいずれか1項に記載の前記装置。
ことを特徴とするコンピュータ可読記憶媒体。
前記チップは、条項A10乃至A18のいずれか1項に記載のデータを処理するための装置を備える
ことを特徴とする人工知能チップ。
前記電子デバイスは、条項A20に記載の人工知能チップを含む
ことを特徴とする電子デバイス。
前記ボードカードは、記憶部品と、インターフェース装置と、制御部品と、条項A20に記載の人工知能チップと、を備え、
ここで、前記人工知能チップは、前記記憶部品、前記制御部品、および、前記インターフェース装置と、接続され、
前記インターフェース装置は、前記人工知能チップと外部デバイスとの間のデータ伝送を実現し、
前記制御部品は、前記人工知能チップの状態を監視制御する
ことを特徴とするボードカード。
前記チップは、DDRコントローラを備え、各々の前記記憶ユニットのデータ伝送およびデータ記憶に対する制御に用いられ、
前記インターフェース装置は、標準PCIEインターフェースである
ことを特徴とする条項A22記載のボードカード。
Claims (23)
- データを処理するための方法であって、
機械学習モデルに用いられる1組の量子化待ちデータを取得するステップと、
複数ペアの切捨て閾値を使用してそれぞれ前記1組の量子化待ちデータを量子化することによって、複数組の量子化後のデータを確定するステップであって、前記複数ペアの切捨て閾値の中の各ペアの切捨て閾値は、対称的な切捨て正の値と切捨て負の値とを含むステップと、
前記複数組の量子化後のデータの中の各組の量子化後のデータの絶対値の平均値と前記1組の量子化待ちデータの絶対値の平均値との間の差異に基づいて、前記複数ペアの切捨て閾値の中から1ペアの切捨て閾値を選択して、前記1組の量子化待ちデータの量子化に用いるステップと、を含む
ことを特徴とする前記方法。 - 複数組の量子化後のデータを確定するステップは、
前記1組の量子化待ちデータの中のすべてのデータの絶対値最大値を確定するステップと、
前記絶対値最大値に基づいて、前記複数ペアの切捨て閾値を確定するステップと、を含む
ことを特徴とする請求項1に記載の前記方法。 - 複数組の量子化後のデータを確定するステップは、
前記絶対値最大値、所定の合計検索回数、および、現在検索順序に基づいて、第1切捨て正の値を確定するステップと、
1番目のペアの切捨て閾値を使用して前記1組の量子化待ちデータを量子化することによって、1番目の組の量子化後のデータを確定するステップであって、前記1番目のペアの切捨て閾値は、前記第1切捨て正の値と、前記第1切捨て正の値と反対の第1切捨て負の値と、を含むステップと、
前記1番目の組の量子化後のデータの絶対値の平均値と前記1組の量子化待ちデータの絶対値の平均値との間の第1差異を確定するステップと、をさらに含む
ことを特徴とする請求項2に記載の前記方法。 - 複数組の量子化後のデータを確定するステップは、
前記現在検索順序をインクリメントするステップと、
前記絶対値最大値、前記所定の合計検索回数、および、前記現在検索順序に基づいて、第2切捨て正の値を確定するステップと、
2番目のペアの切捨て閾値を使用して前記1組の量子化待ちデータを量子化することによって、2番目の組の量子化後のデータを確定するステップであって、前記2番目のペアの切捨て閾値は、前記第2切捨て正の値と、前記第2切捨て正の値と反対の第2切捨て負の値と、を含むステップと、
前記2番目の組の量子化後のデータの絶対値の平均値と前記1組の量子化待ちデータの絶対値の平均値との間の第2差異を確定するステップと、をさらに含む
ことを特徴とする請求項3に記載の前記方法。 - 前記複数ペアの切捨て閾値の中から1ペアの切捨て閾値を選択するステップは、
前記複数組の量子化後のデータ中で前記1組の量子化待ちデータとの絶対値の平均値の差異が最小である1組の量子化後のデータを確定するステップと、
前記複数ペアの切捨て閾値の中から前記1組の量子化後のデータと対応する1ペアの切捨て閾値を選択するステップと、を含む
ことを特徴とする請求項1乃至4のいずれか1項に記載の前記方法。 - 選択した前記1ペアの切捨て閾値に関連付けられた切捨て検索範囲を確定するステップと、
前記切捨て検索範囲内に位置する新たな複数ペアの切捨て閾値を確定するステップと、
前記新たな複数ペアの切捨て閾値を使用してそれぞれ前記1組の量子化待ちデータを量子化することによって、新たな複数組の量子化後のデータを確定するステップと、
前記新たな複数組の量子化後のデータの中の各組の量子化後のデータの絶対値の平均値と前記1組の量子化待ちデータの絶対値の平均値との間の差異に基づいて、前記新たな複数ペアの切捨て閾値の中から新たな1ペアの切捨て閾値を選択するステップと、をさらに含む
ことを特徴とする請求項5に記載の前記方法。 - 複数ペアの切捨て閾値を使用してそれぞれ前記1組の量子化待ちデータを量子化することによって、複数組の量子化後のデータを確定するステップは、
前記1組の量子化待ちデータの中のすべてのデータの絶対値最大値を確定するステップと、
前記絶対値最大値に基づいて、3ペアの切捨て閾値を確定するステップであって、前記3ペアの切捨て閾値中の1番目のペアの切捨て閾値は、前記絶対値最大値の半分と、その反対の値と、を含み、前記3ペアの切捨て閾値中の2番目のペアの切捨て閾値は、前記絶対値最大値の4分の3と、その反対の値と、を含み、前記3ペアの切捨て閾値中の3番目のペアの切捨て閾値は、前記絶対値最大値と、その反対の値と、を含むステップと、
3ペアの切捨て閾値を使用してそれぞれ前記1組の量子化待ちデータを量子化することによって、3組の量子化後のデータを確定するステップと、を含む
ことを特徴とする請求項1に記載の前記方法。 - 前記複数ペアの切捨て閾値の中から1ペアの切捨て閾値を選択するステップは、
停止条件を満たすまで、以下の動作を反復実行するステップを含み、
当該動作は、
前記3ペアの切捨て閾値の中から1ペアの切捨て閾値を選択する動作と、
選択した1ペアの切捨て閾値と対応する差異が所定閾値未満であるか否かを確定する動作と、
前記差異が所定閾値未満であることに応答して、動作の反復実行を停止する動作と、
前記差異が所定閾値よりも大きいことに応答して、選択した1ペアの切捨て閾値に基づいて、再度3ペアの切捨て閾値を確定する動作と、を含む
ことを特徴とする請求項7に記載の前記方法。 - 前記1組の量子化待ちデータは、ニューラルネットワークモデル中の1組の浮動小数点数であり、
前記方法は、
選択した1ペアの切捨て閾値を使用して前記1組の量子化待ちデータを量子化することによって量子化後のデータを得るステップであって、前記1組の量子化待ちデータを量子化することは、前記1組の量子化待ちデータ中の、切捨て正の値よりも大きい数値を、前記切捨て正の値に設定し、前記1組の量子化待ちデータ中の、切捨て負の値よりも小さい数値を、前記切捨て負の値に設定するステップと、
得られた量子化後のデータを前記ニューラルネットワークモデルに入力して、処理に用いるステップと、をさらに含む
ことを特徴とする請求項1乃至8のいずれか1項に記載の前記方法。 - データを処理するための装置であって、
機械学習モデルに用いられる1組の量子化待ちデータを取得するための量子化待ちデータ取得ユニットと、
複数ペアの切捨て閾値を使用してそれぞれ前記1組の量子化待ちデータを量子化することによって、複数組の量子化後のデータを確定するための量子化後データ確定ユニットであって、前記複数ペアの切捨て閾値の中の各ペアの切捨て閾値は、対称的な切捨て正の値と切捨て負の値とを含む量子化後データ確定ユニットと、
前記複数組の量子化後のデータの中の各組の量子化後のデータの絶対値の平均値と前記1組の量子化待ちデータの絶対値の平均値との間の差異に基づいて、前記複数ペアの切捨て閾値の中から1ペアの切捨て閾値を選択して、前記1組の量子化待ちデータの量子化に用いるための切捨て閾値選択ユニットと、を備える
ことを特徴とする前記装置。 - 前記量子化後データ確定ユニットは、
前記1組の量子化待ちデータの中のすべてのデータの絶対値最大値を確定するための絶対値最大値確定ユニットと、
前記絶対値最大値に基づいて前記複数ペアの切捨て閾値を確定するための複数ペア切捨て閾値確定ユニットと、を備える
ことを特徴とする請求項10に記載の前記装置。 - 前記量子化後データ確定ユニットは、
前記絶対値最大値、所定の合計検索回数、および、現在検索順序に基づいて、第1切捨て正の値を確定するための第1切捨て正の値確定ユニットと、
1番目のペアの切捨て閾値を使用して前記1組の量子化待ちデータを量子化することによって、1番目の組の量子化後のデータを確定するための1番目組量子化後データ確定ユニットであって、前記1番目のペアの切捨て閾値は、前記第1切捨て正の値と、前記第1切捨て正の値と反対の第1切捨て負の値と、を含む1番目組量子化後データ確定ユニットと、
前記1番目の組の量子化後のデータの絶対値の平均値と前記1組の量子化待ちデータの絶対値の平均値との間の第1差異を確定するための第1差異確定ユニットと、をさらに備える
ことを特徴とする請求項11に記載の前記装置。 - 前記量子化後データ確定ユニットは、
前記現在検索順序をインクリメントするためのインクリメントユニットと、
前記絶対値最大値、前記所定の合計検索回数、および、前記現在検索順序に基づいて、第2切捨て正の値を確定するための第2切捨て正の値確定ユニットと、
2番目のペアの切捨て閾値を使用して前記1組の量子化待ちデータを量子化することによって、2番目の組の量子化後のデータを確定するための2番目組量子化後データ確定ユニットであって、前記2番目のペアの切捨て閾値は、前記第2切捨て正の値と、前記第2切捨て正の値と反対の第2切捨て負の値と、を含む2番目組量子化後データ確定ユニットと、
前記2番目の組の量子化後のデータの絶対値の平均値と前記1組の量子化待ちデータの絶対値の平均値との間の第2差異を確定するための第2差異確定ユニットと、をさらに備える
ことを特徴とする請求項12に記載の前記装置。 - 前記切捨て閾値選択ユニットは、
前記複数組の量子化後のデータ中で前記1組の量子化待ちデータとの絶対値の平均値の差異が最小である1組の量子化後のデータを確定するための最小差異確定ユニットと、
前記複数ペアの切捨て閾値の中から前記1組の量子化後のデータと対応する1ペアの切捨て閾値を選択するための第2切捨て閾値選択ユニットと、を備える
ことを特徴とする請求項10乃至13のいずれか1項に記載の前記装置。 - 選択した前記1ペアの切捨て閾値に関連付けられた切捨て検索範囲を確定するための切捨て検索範囲確定ユニットと、
前記切捨て検索範囲内に位置する新たな複数ペアの切捨て閾値を確定するための新たな複数ペア切捨て閾値確定ユニットと、
前記新たな複数ペアの切捨て閾値を使用してそれぞれ前記1組の量子化待ちデータを量子化することによって、新たな複数組の量子化後のデータを確定するための第2量子化後データ確定ユニットと、
前記新たな複数組の量子化後のデータの中の各組の量子化後のデータの絶対値の平均値と前記1組の量子化待ちデータの絶対値の平均値との間の差異に基づいて、前記新たな複数ペアの切捨て閾値の中から新たな1ペアの切捨て閾値を選択するための第3切捨て閾値選択ユニットと、をさらに備える
ことを特徴とする請求項14に記載の前記装置。 - 前記量子化後データ確定ユニットは、
前記1組の量子化待ちデータの中のすべてのデータの絶対値最大値を確定するための絶対値最大値確定ユニットと、
前記絶対値最大値に基づいて、3ペアの切捨て閾値を確定するための3ペア切捨て閾値確定ユニットであって、前記3ペアの切捨て閾値中の1番目のペアの切捨て閾値は、前記絶対値最大値の半分と、その反対の値と、を含み、前記3ペアの切捨て閾値中の2番目のペアの切捨て閾値は、前記絶対値最大値の4分の3と、その反対の値と、を含み、前記3ペアの切捨て閾値中の3番目のペアの切捨て閾値は、前記絶対値最大値と、その反対の値と、を含む3ペア切捨て閾値確定ユニットと、
3ペアの切捨て閾値を使用してそれぞれ前記1組の量子化待ちデータを量子化することによって、3組の量子化後のデータを確定するための3組量子化後データ確定ユニットと、を備える
ことを特徴とする請求項10に記載の前記装置。 - 前記切捨て閾値選択ユニットは、
停止条件を満たすまで、以下の動作を反復実行するための反復ユニットを備え、
当該動作は、
前記3ペアの切捨て閾値の中から1ペアの切捨て閾値を選択する動作と、
選択した1ペアの切捨て閾値と対応する差異が所定閾値未満であるか否かを確定する動作と、
前記差異が所定閾値未満であることに応答して、動作の反復実行を停止する動作と、
前記差異が所定閾値よりも大きいことに応答して、選択した1ペアの切捨て閾値に基づいて、再度3ペアの切捨て閾値を確定する動作と、を含む
ことを特徴とする請求項16に記載の前記装置。 - 前記1組の量子化待ちデータは、ニューラルネットワークモデル中の1組の浮動小数点数であり、
前記装置は、
選択した1ペアの切捨て閾値を使用して前記1組の量子化待ちデータを量子化することによって量子化後のデータを得るためのデータ量子化ユニットであって、前記1組の量子化待ちデータを量子化することは、前記1組の量子化待ちデータ中の、切捨て正の値よりも大きい数値を、前記切捨て正の値に設定し、前記1組の量子化待ちデータ中の、切捨て負の値よりも小さい数値を、前記切捨て負の値に設定するデータ量子化ユニットと、
得られた量子化後のデータを前記ニューラルネットワークモデルに入力して、処理に用いるためのデータ入力ユニットと、をさらに備える
ことを特徴とする請求項10乃至17のいずれか1項に記載の前記装置。 - コンピュータ可読記憶媒体であって、
前記コンピュータ可読記憶媒体には、コンピュータプログラムが記憶されており、前記プログラムが実行されると、請求項1乃至9のいずれか1項に記載の前記方法が実現される
ことを特徴とするコンピュータ可読記憶媒体。 - 人工知能チップであって、
前記チップは、請求項10乃至18のいずれか1項に記載のデータを処理するための装置を備える
ことを特徴とする人工知能チップ。 - 電子デバイスであって、
前記電子デバイスは、請求項20に記載の人工知能チップを含む
ことを特徴とする電子デバイス。 - ボードカードであって、
前記ボードカードは、記憶部品と、インターフェース装置と、制御部品と、請求項20に記載の人工知能チップと、を備え、
ここで、前記人工知能チップは、前記記憶部品、前記制御部品、および、前記インターフェース装置と、接続され、
前記記憶部品は、データを記憶し、
前記インターフェース装置は、前記人工知能チップと外部デバイスとの間のデータ伝送を実現し、
前記制御部品は、前記人工知能チップの状態を監視制御する
ことを特徴とするボードカード。 - 前記記憶部品は、複数組の記憶ユニットを備え、各組の記憶ユニットは、前記人工知能チップとバスを介して接続され、前記記憶ユニットは、DDR SDRAMであり、
前記チップは、DDRコントローラを備え、各々の前記記憶ユニットのデータ伝送およびデータ記憶に対する制御に用いられ、
前記インターフェース装置は、標準PCIEインターフェースである
ことを特徴とする請求項22記載のボードカード。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910804625.6 | 2019-08-28 | ||
CN201910804625.6A CN112446472A (zh) | 2019-08-28 | 2019-08-28 | 用于处理数据的方法、装置以及相关产品 |
PCT/CN2020/111489 WO2021037082A1 (zh) | 2019-08-28 | 2020-08-26 | 用于处理数据的方法、装置以及相关产品 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022501674A true JP2022501674A (ja) | 2022-01-06 |
JP7060719B2 JP7060719B2 (ja) | 2022-04-26 |
Family
ID=74684563
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020566955A Active JP7060719B2 (ja) | 2019-08-28 | 2020-08-26 | データを処理するための方法、装置、及び関連製品 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20220121908A1 (ja) |
EP (1) | EP4024287A4 (ja) |
JP (1) | JP7060719B2 (ja) |
CN (1) | CN112446472A (ja) |
WO (1) | WO2021037082A1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113238987B (zh) * | 2021-06-08 | 2022-11-22 | 中科寒武纪科技股份有限公司 | 量化数据的统计量化器、存储装置、处理装置及板卡 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180349758A1 (en) * | 2017-06-06 | 2018-12-06 | Via Alliance Semiconductor Co., Ltd. | Computation method and device used in a convolutional neural network |
JP2019032833A (ja) * | 2017-08-04 | 2019-02-28 | 三星電子株式会社Samsung Electronics Co.,Ltd. | 固定小数点量子化ニューラルネットワークのための方法及び装置 |
JP2022501670A (ja) * | 2019-08-26 | 2022-01-06 | 上海寒武紀信息科技有限公司Shanghai Cambricon Information Technology Co., Ltd | データを処理するための方法、装置、及び関連製品 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101596954B1 (ko) * | 2009-01-29 | 2016-02-24 | 엘지디스플레이 주식회사 | 데이터 압축과 복원 방법 및 장치와 이를 이용한 액정표시장치 |
US11222263B2 (en) * | 2016-07-28 | 2022-01-11 | Samsung Electronics Co., Ltd. | Neural network method and apparatus |
CN107197297B (zh) * | 2017-06-14 | 2019-12-10 | 中国科学院信息工程研究所 | 一种检测基于dct系数隐写的视频隐写分析方法 |
KR20190034985A (ko) * | 2017-09-25 | 2019-04-03 | 삼성전자주식회사 | 인공 신경망의 양자화 방법 및 장치 |
CN109934761B (zh) * | 2019-01-31 | 2022-11-29 | 中山大学 | 基于卷积神经网络的jpeg图像隐写分析方法 |
CN109993296B (zh) * | 2019-04-01 | 2020-12-29 | 安徽寒武纪信息科技有限公司 | 量化实现方法及相关产品 |
-
2019
- 2019-08-28 CN CN201910804625.6A patent/CN112446472A/zh active Pending
-
2020
- 2020-08-26 EP EP20858492.0A patent/EP4024287A4/en active Pending
- 2020-08-26 JP JP2020566955A patent/JP7060719B2/ja active Active
- 2020-08-26 WO PCT/CN2020/111489 patent/WO2021037082A1/zh unknown
-
2021
- 2021-12-29 US US17/565,008 patent/US20220121908A1/en active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180349758A1 (en) * | 2017-06-06 | 2018-12-06 | Via Alliance Semiconductor Co., Ltd. | Computation method and device used in a convolutional neural network |
JP2019032833A (ja) * | 2017-08-04 | 2019-02-28 | 三星電子株式会社Samsung Electronics Co.,Ltd. | 固定小数点量子化ニューラルネットワークのための方法及び装置 |
JP2022501670A (ja) * | 2019-08-26 | 2022-01-06 | 上海寒武紀信息科技有限公司Shanghai Cambricon Information Technology Co., Ltd | データを処理するための方法、装置、及び関連製品 |
Also Published As
Publication number | Publication date |
---|---|
US20220121908A1 (en) | 2022-04-21 |
WO2021037082A1 (zh) | 2021-03-04 |
CN112446472A (zh) | 2021-03-05 |
EP4024287A1 (en) | 2022-07-06 |
EP4024287A4 (en) | 2023-09-13 |
JP7060719B2 (ja) | 2022-04-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111652367B (zh) | 一种数据处理方法及相关产品 | |
US20200394523A1 (en) | Neural Network Quantization Parameter Determination Method and Related Products | |
JP2022501678A (ja) | データ処理方法、装置、コンピュータデバイス、及び記憶媒体 | |
JP2022501675A (ja) | データ処理方法、装置、コンピュータデバイス、及び記憶媒体 | |
JP2022501677A (ja) | データ処理方法、装置、コンピュータデバイス、及び記憶媒体 | |
US20220108150A1 (en) | Method and apparatus for processing data, and related products | |
JP7060718B2 (ja) | データを処理するための方法、装置、及び関連製品 | |
US20220076095A1 (en) | Multi-level sparse neural networks with dynamic rerouting | |
CN115860100A (zh) | 一种神经网络模型训练方法、装置及计算设备 | |
JP7060719B2 (ja) | データを処理するための方法、装置、及び関連製品 | |
WO2021082725A1 (zh) | Winograd卷积运算方法及相关产品 | |
CN112308201A (zh) | 神经网络量化方法、装置、芯片、电子设备及板卡 | |
JP7233636B2 (ja) | データ量子化処理方法、装置、電子機器および記憶媒体 | |
CN113112009B (zh) | 用于神经网络数据量化的方法、装置和计算机可读存储介质 | |
CN115329925A (zh) | 神经网络结构确定方法及装置以及相关产品 | |
US20220222041A1 (en) | Method and apparatus for processing data, and related product | |
WO2021082724A1 (zh) | 运算方法及相关产品 | |
JP7072680B2 (ja) | データを処理するための方法、装置、及び関連製品 | |
CN113111997A (zh) | 用于神经网络数据量化的方法、装置和计算机可读存储介质 | |
CN113112008A (zh) | 用于神经网络数据量化的方法、装置和计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20201130 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20201130 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20211214 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220314 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220405 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220414 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7060719 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |