JP2022532439A - データ量子化処理方法、装置、電子機器および記憶媒体 本願は、2020年02月24日に中国国家知識産権局に提出された、出願番号が202010111884.3であり、発明の名称が「データ量子化処理方法、装置、電子機器および記憶媒体」である中国特許出願の優先権を主張し、その全ての内容は、参照により本願に組み込まれるものとする。 - Google Patents
データ量子化処理方法、装置、電子機器および記憶媒体 本願は、2020年02月24日に中国国家知識産権局に提出された、出願番号が202010111884.3であり、発明の名称が「データ量子化処理方法、装置、電子機器および記憶媒体」である中国特許出願の優先権を主張し、その全ての内容は、参照により本願に組み込まれるものとする。 Download PDFInfo
- Publication number
- JP2022532439A JP2022532439A JP2021578095A JP2021578095A JP2022532439A JP 2022532439 A JP2022532439 A JP 2022532439A JP 2021578095 A JP2021578095 A JP 2021578095A JP 2021578095 A JP2021578095 A JP 2021578095A JP 2022532439 A JP2022532439 A JP 2022532439A
- Authority
- JP
- Japan
- Prior art keywords
- channel
- data
- quantized
- quantization
- bit width
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000013139 quantization Methods 0.000 title claims abstract description 159
- 238000000034 method Methods 0.000 title claims abstract description 58
- 238000003672 processing method Methods 0.000 title claims abstract description 16
- 238000012545 processing Methods 0.000 claims abstract description 51
- 238000013473 artificial intelligence Methods 0.000 claims description 31
- 230000015654 memory Effects 0.000 claims description 27
- 238000004590 computer program Methods 0.000 claims description 6
- 238000013528 artificial neural network Methods 0.000 abstract description 11
- 238000003062 neural network model Methods 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 10
- 238000004364 calculation method Methods 0.000 description 7
- 230000005540 biological transmission Effects 0.000 description 5
- 101100498818 Arabidopsis thaliana DDR4 gene Proteins 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 238000005481 NMR spectroscopy Methods 0.000 description 1
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/187—Segmentation; Edge detection involving region growing; involving region merging; involving connected component labelling
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/186—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
Description
本明細書に含まれ、本明細書の一部を構成する図面は、本明細書と共に、本開示の例示的な実施例、特徴、および態様を示し、本開示の原理を説明するために用いられる。
深層畳み込み層における入力画像のチャンネル数に基づいて、入力画像の各チャンネルに対応する量子化すべきデータを確定するための第1の確定モジュール501と、
各チャンネルに対応する量子化すべきデータに基づいて、それぞれ各チャンネルに対応する量子化すべきデータの統計結果を確定するための第2の確定モジュール502と、
いずれか一つのチャンネルに対して、該チャンネルに対応する量子化すべきデータの統計結果に基づいて、該チャンネルに対応する量子化パラメータを確定するための第3の確定モジュール503と、
各チャンネルに対応する量子化パラメータを利用して、それぞれ各チャンネルに対応する量子化すべきデータを量子化し、入力画像の各チャンネルに対応する量子化後のデータを得るための量子化モジュール504と、を含む。
第3の確定モジュール503は、具体的に、
いずれか一つのチャンネルに対して、該チャンネルに対応する量子化すべきデータの統計結果と該チャンネルに対応するデータビット幅に基づいて、該チャンネルに対応する点位置パラメータを確定するために用いられる。
第3の確定モジュール503は、具体的に、
いずれか一つのチャンネルに対して、該チャンネルに対応する量子化すべきデータの統計結果、該チャンネルに対応する点位置パラメータ、および該チャンネルに対応するデータビット幅に基づいて、該チャンネルに対応するスケジューリング係数を確定するために用いられる。
第3の確定モジュール503は、具体的に、
いずれか一つのチャンネルに対して、該チャンネルに対応する量子化すべきデータの統計結果に基づいて、該チャンネルに対応するオフセット量を確定するために用いられる。
いずれか一つのチャンネルに対して、該チャンネルに対応する量子化すべきデータにおける絶対値の最大値を確定するための第1の確定サブモジュールと、
該チャンネルに対応する量子化すべきデータにおける絶対値の最大値を該チャンネルに対応する量子化すべきデータの統計結果として確定するためのる第2の確定サブモジュールを含む。
いずれか一つのチャンネルに対して、該チャンネルに対応する量子化すべきデータの最大値と最小値を確定するために用いられ、
該チャンネルに対応する量子化すべきデータの最大値と最小値に基づいて、該チャンネルに対応する量子化すべきデータの絶対値の最大値を確定するために用いられる。
いずれか一つのチャンネルに対して、該チャンネルに対応するデータビット幅の量子化誤差に基づいて、該チャンネルに対応するデータビット幅を調整して、調整後のデータビット幅を使用して、該チャンネルに対応する量子化パラメータを確定するためのデータビット幅調整モジュールを含み、ここで、量子化誤差は、該チャンネルに対応する量子化後のデータと該チャンネルに対応する量子化すべきデータに基づいて確定されるものである。
量子化誤差と閾値を比較し、比較結果に基づいて、該チャンネルに対応するデータビット幅を調整するために用いられる。
データビット幅調整モジュールは、具体的に、
量子化誤差が第1の閾値以上である場合、該チャンネルに対応するデータビット幅を増加し、
量子化誤差が第2の閾値以下である場合、該チャンネルに対応するデータビット幅を減少し、
量子化誤差が第1の閾値と第2の閾値との間にある場合、該チャンネルに対応するデータビット幅を不変に保つために用いられる。
前記記憶デバイス390は、バスを介して前記人工知能チップに接続され、データの記憶に利用される。前記記憶デバイスは、複数組の記憶ユニット393を含んでもよい。各組の前記記憶ユニットは、バスを介して前記人工知能チップに接続される。なお、各組の前記メモリユニットは、DDR SDRAM(英語、Double Data Rate SDRAM、ダブルデータレート同期ダイナミックランダムアクセスメモリ)であってもよいことが理解されるであろう。
深層畳み込み層における入力画像のチャンネル数に基づいて、前記入力画像の各チャンネルに対応する量子化すべきデータを確定することと、
各チャンネルに対応する量子化すべきデータに基づいて、それぞれ各チャンネルに対応する量子化すべきデータの統計結果を確定することと、
いずれか一つのチャンネルに対して、該チャンネルに対応する量子化すべきデータの統計結果に基づいて、該チャンネルに対応する量子化パラメータを確定することと、
各チャンネルに対応する量子化パラメータを利用して、それぞれ各チャンネルに対応する量子化すべきデータを量子化し、前記入力画像の各チャンネルに対応する量子化後のデータを得ることと、を含み、
ここで、前記深層畳み込み層における前記入力画像のチャンネル数と出力画像のチャンネル数が同じである。
いずれか一つのチャンネルに対して、該チャンネルに対応する量子化すべきデータの統計結果に基づいて、該チャンネルに対応する量子化パラメータを確定することは、
いずれか一つのチャンネルに対して、該チャンネルに対応する量子化すべきデータの統計結果と該チャンネルに対応するデータビット幅に基づいて、該チャンネルに対応する点位置パラメータを確定することを含む。
いずれか一つのチャンネルに対して、該チャンネルに対応する量子化すべきデータの統計結果に基づいて、該チャンネルに対応する量子化パラメータを確定することは、
いずれか一つのチャンネルに対して、該チャンネルに対応する量子化すべきデータの統計結果、該チャンネルに対応する点位置パラメータ、および該チャンネルに対応するデータビット幅に基づいて、該チャンネルに対応するスケジューリング係数を確定することを含む。
いずれか一つのチャンネルに対して、該チャンネルに対応する量子化すべきデータの統計結果に基づいて、該チャンネルに対応する量子化パラメータを確定することは、
いずれか一つのチャンネルに対して、該チャンネルに対応する量子化すべきデータの統計結果に基づいて、該チャンネルに対応するオフセット量を確定することを含む。
いずれか一つのチャンネルに対して、該チャンネルに対応する量子化すべきデータにおける絶対値の最大値を確定することと、
該チャンネルに対応する量子化すべきデータにおける絶対値の最大値を該チャンネルに対応する量子化すべきデータの統計結果として確定することとを含む。
いずれか一つのチャンネルに対して、該チャンネルに対応する量子化すべきデータの最大値と最小値を確定することと、
該チャンネルに対応する量子化すべきデータの最大値と最小値に基づいて、該チャンネルに対応する量子化すべきデータの絶対値の最大値を確定することとを含む。
いずれか一つのチャンネルに対して、該チャンネルに対応するデータビット幅の量子化誤差に基づいて、該チャンネルに対応するデータビット幅を調整し、調整後のデータビット幅を使用して、該チャンネルに対応する量子化パラメータを確定することをさらに含み、ここでは、前記量子化誤差は、該チャンネルに対応する量子化後のデータと該チャンネルに対応する量子化すべきデータに基づいて確定されるものである。
前記量子化誤差と閾値を比較し、比較結果に基づいて、該チャンネルに対応するデータビット幅を調整することを含む。
前記量子化誤差と閾値を比較し、比較結果に基づいて、該チャンネルに対応するデータビット幅を調整することは、
前記量子化誤差が前記第1の閾値以上である場合、該チャンネルに対応するデータビット幅を増加することと、
前記量子化誤差が前記第2の閾値以下である場合、該チャンネルに対応するデータビット幅を減少することと、
前記量子化誤差が前記第1の閾値と前記第2の閾値との間にある場合、該チャンネルに対応するデータビット幅は不変に保つこととを含む。
深層畳み込み層における入力画像のチャンネル数に基づいて、前記入力画像の各チャンネルに対応する量子化すべきデータを確定するための第1の確定モジュールと、
各チャンネルに対応する量子化すべきデータに基づいて、それぞれ各チャンネルに対応する量子化すべきデータの統計結果を確定するための第2の確定モジュールと、
いずれか一つのチャンネルに対して、該チャンネルに対応する量子化すべきデータの統計結果に基づいて、該チャンネルに対応する量子化パラメータを確定するための第3の確定モジュールと、
各チャンネルに対応する量子化パラメータを利用して、それぞれ各チャンネルに対応する量子化すべきデータを量子化し、前記入力画像の各チャンネルに対応する量子化後のデータを得るための量子化モジュールと、を含み、
ここで、前記深層畳み込み層における前記入力画像のチャンネル数と出力画像のチャンネル数が同じである。
プロセッサと、プロセッサの実行可能な命令を記憶するためのメモリとを含み、
ここでは、前記プロセッサは、項目A1~A10のいずれか一項に記載の方法を実行するように、前記メモリに記憶された命令を呼び出すように構成される。
Claims (15)
- データ量子化処理方法であって、
深層畳み込み層における入力画像のチャンネル数に基づいて、前記入力画像の各チャンネルに対応する量子化すべきデータを確定することと、
各チャンネルに対応する量子化すべきデータに基づいて、各チャンネルに対応する量子化すべきデータの統計結果をそれぞれ確定することと、
いずれか一つのチャンネルに対して、該チャンネルに対応する量子化すべきデータの統計結果に基づいて、該チャンネルに対応する量子化パラメータを確定することと、
各チャンネルに対応する量子化パラメータを利用して、各チャンネルに対応する量子化すべきデータをそれぞれ量子化し、前記入力画像の各チャンネルに対応する量子化後のデータを得ることと、を含み、
前記深層畳み込み層における前記入力画像のチャンネル数と出力画像のチャンネル数が同じであることを特徴とするデータ量子化処理方法。 - 前記量子化パラメータは点位置パラメータを含み、
いずれか一つのチャンネルに対して、該チャンネルに対応する量子化すべきデータの統計結果に基づいて、該チャンネルに対応する量子化パラメータを確定することは、
いずれか一つのチャンネルに対して、該チャンネルに対応する量子化すべきデータの統計結果と該チャンネルに対応するデータビット幅に基づいて、該チャンネルに対応する点位置パラメータを確定することを含むことを特徴とする請求項1に記載の方法。 - 前記量子化パラメータはスケジューリング係数をさらに含み、
いずれか一つのチャンネルに対して、該チャンネルに対応する量子化すべきデータの統計結果に基づいて、該チャンネルに対応する量子化パラメータを確定することは、
いずれか一つのチャンネルに対して、該チャンネルに対応する量子化すべきデータの統計結果、該チャンネルに対応する点位置パラメータ、および該チャンネルに対応するデータビット幅に基づいて、該チャンネルに対応するスケジューリング係数を確定することを含むことを特徴とする請求項2に記載の方法。 - 前記量子化パラメータはオフセット量を含み、
いずれか一つのチャンネルに対して、該チャンネルに対応する量子化すべきデータの統計結果に基づいて、該チャンネルに対応する量子化パラメータを確定することは、
いずれか一つのチャンネルに対して、該チャンネルに対応する量子化すべきデータの統計結果に基づいて、該チャンネルに対応するオフセット量を確定することを含むことを特徴とする請求項1に記載の方法。 - 各チャンネルに対応する量子化すべきデータに基づいて、それぞれ各チャンネルに対応する量子化すべきデータの統計結果を確定することは、
いずれか一つのチャンネルに対して、該チャンネルに対応する量子化すべきデータにおける絶対値の最大値を確定することと、
該チャンネルに対応する量子化すべきデータにおける絶対値の最大値を該チャンネルに対応する量子化すべきデータの統計結果として確定することとを含むことを特徴とする請求項1~4に記載の方法。 - いずれか一つのチャンネルに対して、該チャンネルに対応する量子化すべきデータにおける絶対値の最大値を確定することは、
いずれか一つのチャンネルに対して、該チャンネルに対応する量子化すべきデータの最大値と最小値を確定することと、
該チャンネルに対応する量子化すべきデータの最大値と最小値に基づいて、該チャンネルに対応する量子化すべきデータの絶対値の最大値を確定することとを含むことを特徴とする請求項5に記載の方法。 - いずれか一つのチャンネルに対して、該チャンネルに対応するデータビット幅は予め設定された値であることを特徴とする請求項2または3に記載の方法。
- いずれか一つのチャンネルに対して、
該チャンネルに対応するデータビット幅の量子化誤差に基づいて、該チャンネルに対応するデータビット幅を調整して、調整後のデータビット幅を利用して、該チャンネルに対応する量子化パラメータを確定することをさらに含み、
前記量子化誤差は、該チャンネルに対応する量子化後のデータと該チャンネルに対応する量子化すべきデータに基づいて確定されることを特徴とする請求項2または3に記載の方法。 - 該チャンネルに対応するデータビット幅の量子化誤差に基づいて、該チャンネルに対応するデータビット幅を調整することは、
前記量子化誤差と閾値を比較し、比較結果に基づいて、該チャンネルに対応するデータビット幅を調整することを含むことを特徴とする請求項8に記載の方法。 - 前記閾値は第1の閾値と第2の閾値を含み、
前記量子化誤差と閾値を比較し、比較結果に基づいて、該チャンネルに対応するデータビット幅を調整することは、
前記量子化誤差が前記第1の閾値以上である場合、該チャンネルに対応するデータビット幅を増加することと、
前記量子化誤差が前記第2の閾値以下である場合、該チャンネルに対応するデータビット幅を減少することと、
前記量子化誤差が前記第1の閾値と前記第2の閾値との間にある場合、該チャンネルに対応するデータビット幅は不変に保つこととを含むことを特徴とする請求項9に記載の方法。 - データ量子化処理装置であって、
深層畳み込み層における入力画像のチャンネル数に基づいて、前記入力画像の各チャンネルに対応する量子化すべきデータを確定するための第1の確定モジュールと、
各チャンネルに対応する量子化すべきデータに基づいて、各チャンネルに対応する量子化すべきデータの統計結果をそれぞれ確定するための第2の確定モジュールと、
いずれか一つのチャンネルに対して、該チャンネルに対応する量子化すべきデータの統計結果に基づいて、該チャンネルに対応する量子化パラメータを確定するための第3の確定モジュールと、
各チャンネルに対応する量子化パラメータを利用して、各チャンネルに対応する量子化すべきデータをそれぞれ量子化し、前記入力画像の各チャンネルに対応する量子化後のデータを得るための量子化モジュールと、を含み、
前記深層畳み込み層における前記入力画像のチャンネル数と出力画像のチャンネル数が同じであることを特徴とするデータ量子化処理方法。 - 人工知能チップであって、請求項11に記載のデータ量子化処理装置を含むことを特徴とする人工知能チップ。
- 電子機器であって、請求項12に記載の人工知能チップを含むことを特徴とする電子機器。
- 電子機器であって、
プロセッサと、プロセッサの実行可能な命令を記憶するためのメモリとを含み、前記プロセッサは、請求項1~10のいずれか一項に記載の方法を実行するように、前記メモリに記憶された命令を呼び出すように構成されることを特徴とする電子機器。 - コンピュータプログラム命令が記憶されたコンピュータ可読記憶媒体であって、前記コンピュータプログラム命令がプロセッサによって実行されると、請求項1~10のいずれか一項に記載の方法を実現することを特徴とするコンピュータ可読記憶媒体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010111884.3 | 2020-02-24 | ||
CN202010111884.3A CN113298843B (zh) | 2020-02-24 | 2020-02-24 | 数据量化处理方法、装置、电子设备和存储介质 |
PCT/CN2021/077235 WO2021169914A1 (zh) | 2020-02-24 | 2021-02-22 | 数据量化处理方法、装置、电子设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022532439A true JP2022532439A (ja) | 2022-07-14 |
JP7233636B2 JP7233636B2 (ja) | 2023-03-07 |
Family
ID=77317797
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021578095A Active JP7233636B2 (ja) | 2020-02-24 | 2021-02-22 | データ量子化処理方法、装置、電子機器および記憶媒体 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20230091541A1 (ja) |
JP (1) | JP7233636B2 (ja) |
CN (1) | CN113298843B (ja) |
WO (1) | WO2021169914A1 (ja) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019032833A (ja) * | 2017-08-04 | 2019-02-28 | 三星電子株式会社Samsung Electronics Co.,Ltd. | 固定小数点量子化ニューラルネットワークのための方法及び装置 |
CN109993296A (zh) * | 2019-04-01 | 2019-07-09 | 北京中科寒武纪科技有限公司 | 量化实现方法及相关产品 |
CN110020616A (zh) * | 2019-03-26 | 2019-07-16 | 深兰科技(上海)有限公司 | 一种目标识别方法及设备 |
US20190220709A1 (en) * | 2018-01-18 | 2019-07-18 | Aptiv Technologies Limited | Device and a method for image classification using a convolutional neural network |
US20190297327A1 (en) * | 2017-09-26 | 2019-09-26 | Tencent Technology (Shenzhen) Company Limited | Video encoding processing method, computer device and storage medium |
CN110717585A (zh) * | 2019-09-30 | 2020-01-21 | 上海寒武纪信息科技有限公司 | 神经网络模型的训练方法、数据处理方法和相关产品 |
US20200026986A1 (en) * | 2018-04-27 | 2020-01-23 | Samsung Electronics Co., Ltd. | Neural network method and appartus with parameter quantization |
CN110826685A (zh) * | 2018-08-08 | 2020-02-21 | 华为技术有限公司 | 神经网络卷积计算的方法和装置 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7768516B1 (en) * | 2006-10-16 | 2010-08-03 | Adobe Systems Incorporated | Image splitting to use multiple execution channels of a graphics processor to perform an operation on single-channel input |
EP4199513A1 (en) * | 2011-06-23 | 2023-06-21 | Huawei Technologies Co., Ltd. | Offset decoding device, offset coding device, image filtering device, and data structure |
CN115841137A (zh) * | 2017-06-06 | 2023-03-24 | 格兰菲智能科技有限公司 | 一种用于对待量化数据进行定点化处理的方法及计算装置 |
US11755901B2 (en) * | 2017-12-28 | 2023-09-12 | Intel Corporation | Dynamic quantization of neural networks |
WO2019143025A1 (ko) * | 2018-01-16 | 2019-07-25 | 한국과학기술원 | 라인 입력 및 출력을 이용한 이미지 처리 방법 및 장치 |
CN109472353B (zh) * | 2018-11-22 | 2020-11-03 | 浪潮集团有限公司 | 一种卷积神经网络量化电路及量化方法 |
CN110348562B (zh) * | 2019-06-19 | 2021-10-15 | 北京迈格威科技有限公司 | 神经网络的量化策略确定方法、图像识别方法和装置 |
CN110781912A (zh) * | 2019-09-10 | 2020-02-11 | 东南大学 | 一种基于通道扩张倒置卷积神经网络的图像分类方法 |
CN110728352A (zh) * | 2019-09-10 | 2020-01-24 | 东南大学 | 一种基于深度卷积神经网络的大规模图像分类方法 |
-
2020
- 2020-02-24 CN CN202010111884.3A patent/CN113298843B/zh active Active
-
2021
- 2021-02-22 WO PCT/CN2021/077235 patent/WO2021169914A1/zh active Application Filing
- 2021-02-22 US US17/801,999 patent/US20230091541A1/en active Pending
- 2021-02-22 JP JP2021578095A patent/JP7233636B2/ja active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019032833A (ja) * | 2017-08-04 | 2019-02-28 | 三星電子株式会社Samsung Electronics Co.,Ltd. | 固定小数点量子化ニューラルネットワークのための方法及び装置 |
US20190297327A1 (en) * | 2017-09-26 | 2019-09-26 | Tencent Technology (Shenzhen) Company Limited | Video encoding processing method, computer device and storage medium |
US20190220709A1 (en) * | 2018-01-18 | 2019-07-18 | Aptiv Technologies Limited | Device and a method for image classification using a convolutional neural network |
US20200026986A1 (en) * | 2018-04-27 | 2020-01-23 | Samsung Electronics Co., Ltd. | Neural network method and appartus with parameter quantization |
CN110826685A (zh) * | 2018-08-08 | 2020-02-21 | 华为技术有限公司 | 神经网络卷积计算的方法和装置 |
CN110020616A (zh) * | 2019-03-26 | 2019-07-16 | 深兰科技(上海)有限公司 | 一种目标识别方法及设备 |
CN109993296A (zh) * | 2019-04-01 | 2019-07-09 | 北京中科寒武纪科技有限公司 | 量化实现方法及相关产品 |
CN110717585A (zh) * | 2019-09-30 | 2020-01-21 | 上海寒武纪信息科技有限公司 | 神经网络模型的训练方法、数据处理方法和相关产品 |
Non-Patent Citations (1)
Title |
---|
JUN HAENG LEE, SANGWON HA, SAEROM CHOI, WON-JO LEE, SEUNGWON LEE: "Quantization for Rapid Deployment of Deep Neural Networks", ARXIV [ONLINE], JPN6022034234, 12 October 2018 (2018-10-12), ISSN: 0004850051 * |
Also Published As
Publication number | Publication date |
---|---|
US20230091541A1 (en) | 2023-03-23 |
JP7233636B2 (ja) | 2023-03-07 |
WO2021169914A1 (zh) | 2021-09-02 |
CN113298843A (zh) | 2021-08-24 |
CN113298843B (zh) | 2024-05-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7146955B2 (ja) | データ処理方法、装置、コンピュータデバイス、及び記憶媒体 | |
JP7146952B2 (ja) | データ処理方法、装置、コンピュータデバイス、及び記憶媒体 | |
JP7146953B2 (ja) | データ処理方法、装置、コンピュータデバイス、及び記憶媒体 | |
CN112085189B (zh) | 一种神经网络的量化参数确定方法及相关产品 | |
JP7146954B2 (ja) | データ処理方法、装置、コンピュータデバイス、及び記憶媒体 | |
CN110889503B (zh) | 数据处理方法、装置、计算机设备和存储介质 | |
US11249721B2 (en) | Multiplication circuit, system on chip, and electronic device | |
US20220108150A1 (en) | Method and apparatus for processing data, and related products | |
US11354097B2 (en) | Compressor circuit, Wallace tree circuit, multiplier circuit, chip, and device | |
CN112085182A (zh) | 数据处理方法、装置、计算机设备和存储介质 | |
US20220114454A1 (en) | Electronic apparatus for decompressing a compressed artificial intelligence model and control method therefor | |
JP2022532439A (ja) | データ量子化処理方法、装置、電子機器および記憶媒体 本願は、2020年02月24日に中国国家知識産権局に提出された、出願番号が202010111884.3であり、発明の名称が「データ量子化処理方法、装置、電子機器および記憶媒体」である中国特許出願の優先権を主張し、その全ての内容は、参照により本願に組み込まれるものとする。 | |
US20220121908A1 (en) | Method and apparatus for processing data, and related product | |
CN112308201A (zh) | 神经网络量化方法、装置、芯片、电子设备及板卡 | |
US20220222041A1 (en) | Method and apparatus for processing data, and related product | |
CN112766472B (zh) | 数据处理方法、装置、计算机设备和存储介质 | |
WO2021082654A1 (zh) | 数据处理方法、装置、计算机设备和存储介质 | |
CN112784207A (zh) | 运算方法及相关产品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20211228 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20211228 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220816 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221116 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230124 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230202 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7233636 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |