JP2021535689A - ディープ・ニューラル・ネットワークのための圧縮方法、チップ、電子デバイス、および媒体 - Google Patents
ディープ・ニューラル・ネットワークのための圧縮方法、チップ、電子デバイス、および媒体 Download PDFInfo
- Publication number
- JP2021535689A JP2021535689A JP2021517260A JP2021517260A JP2021535689A JP 2021535689 A JP2021535689 A JP 2021535689A JP 2021517260 A JP2021517260 A JP 2021517260A JP 2021517260 A JP2021517260 A JP 2021517260A JP 2021535689 A JP2021535689 A JP 2021535689A
- Authority
- JP
- Japan
- Prior art keywords
- feature map
- neural network
- layer
- region
- deep neural
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 242
- 238000000034 method Methods 0.000 title claims abstract description 230
- 238000007906 compression Methods 0.000 title claims abstract description 143
- 230000006835 compression Effects 0.000 title claims abstract description 141
- 230000015654 memory Effects 0.000 claims description 122
- 238000013139 quantization Methods 0.000 claims description 109
- 230000008569 process Effects 0.000 claims description 79
- 238000013527 convolutional neural network Methods 0.000 claims description 50
- 238000012549 training Methods 0.000 claims description 41
- 238000012545 processing Methods 0.000 claims description 25
- 238000013473 artificial intelligence Methods 0.000 claims description 11
- 230000004044 response Effects 0.000 claims description 10
- 238000003384 imaging method Methods 0.000 claims description 7
- 238000010586 diagram Methods 0.000 abstract description 33
- 230000006870 function Effects 0.000 description 20
- 238000004364 calculation method Methods 0.000 description 18
- 230000002441 reversible effect Effects 0.000 description 14
- 230000004913 activation Effects 0.000 description 10
- 238000006243 chemical reaction Methods 0.000 description 10
- 230000006837 decompression Effects 0.000 description 10
- 239000007787 solid Substances 0.000 description 10
- 241000238876 Acari Species 0.000 description 8
- 239000011159 matrix material Substances 0.000 description 8
- 238000011176 pooling Methods 0.000 description 8
- 238000013461 design Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 6
- 238000012544 monitoring process Methods 0.000 description 6
- 230000009466 transformation Effects 0.000 description 6
- 230000008878 coupling Effects 0.000 description 4
- 238000010168 coupling process Methods 0.000 description 4
- 238000005859 coupling reaction Methods 0.000 description 4
- 238000001514 detection method Methods 0.000 description 4
- 230000002123 temporal effect Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 2
- 239000003086 colorant Substances 0.000 description 2
- 238000000354 decomposition reaction Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 210000000887 face Anatomy 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000007667 floating Methods 0.000 description 2
- 238000012886 linear function Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000008447 perception Effects 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 238000011897 real-time detection Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000000638 solvent extraction Methods 0.000 description 2
- 230000002087 whitening effect Effects 0.000 description 2
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/06—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
- G06N3/063—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using electronic means
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/157—Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
- H04N19/159—Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/082—Learning methods modifying the architecture, e.g. adding, deleting or silencing nodes or connections
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/167—Position within a video image, e.g. region of interest [ROI]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/42—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/593—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Biophysics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Neurology (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression Of Band Width Or Redundancy In Fax (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
1つの発想は、高帯域幅メモリ(HBM)のような、帯域幅がもっと大きいメモリを使用することである。しかし、このやり方はコストが高く、ハードウェアの設計も非常に難しい。
図5は、本開示の例示的実施形態によるディープ・ニューラル・ネットワークの推論プロセスの模式図である。ニューラル・ネットワークの推論プロセスは、処理されるデータを、訓練済みのニューラル・ネットワークに入力して、推論結果を得るプロセスである。図5に示すように、ディープ・ニューラル・ネットワークは、入力層532、出力層538、および複数の隠れ層を含む。簡単にするために、図5は2つの隣接する層、即ち、i番目の層および(i+1)番目の層のみを示す。これらを、それぞれ、参照番号534および536によって示す。また、図5は、パラメータ記憶空間510、および特徴マップ記憶空間520も示す。推論プロセスにおいて、ニューラル・ネットワークにおける各層は、出力層538が最終的な推論結果を出力するまで、順次入来するデータを処理する。層534および536における処理については、以下で一例をあげて説明する。
1.複数の層を含むディープ・ニューラル・ネットワークのための圧縮方法であって、入力層を除く複数の層における少なくとも1つの層に対して、この方法は、パラメータ記憶空間から層のパラメータを読み出すステップと、特徴マップ記憶空間から、直前の層によって格納された第1特徴マップを読み出すステップと、読み出したパラメータおよび第1特徴マップに基づいて、第2特徴マップを生成するステップと、第2特徴マップを圧縮して、第3特徴マップを得るステップと、第3特徴マップを特徴マップ記憶空間に格納するステップとを含む。
3.項目1による方法において、この方法が、ディープ・ニューラル・ネットワークの訓練プロセスおよびディープ・ニューラル・ネットワークの推論プロセスにおける順方向伝搬フェーズにおいて、使用される。
13.項目11による方法において、領域における特異的特徴の存在または不在にしたがって領域の各々の量子化刻みを決定するステップが、領域における特異的特徴の存在に応答して、第1量子化刻みを領域に割り当てるステップと、領域における特異的特徴の不在に応答して、第2量子化刻みを領域に割り当てるステップとを含み、第1量子化刻みが第2量子化刻みよりも小さい。
16.チップであって、パラメータ記憶空間および特徴マップ記憶空間を含むメモリであって、パラメータ記憶空間が、ディープ・ニューラル・ネットワークのパラメータを格納するように構成され、特徴マップ記憶空間が、ディープ・ニューラル・ネットワークの特徴マップを格納するように構成される、メモリと、メモリと協働して、項目1から15までのいずれか1つによる方法を実行するように構成されたディープ・ニューラル・ネットワーク・エンジンとを含む。
18.項目16によるチップにおいて、チップが、人工知能ビジョン・チップを含む。
19.項目18によるチップにおいて、チップが、更に、画像信号を処理するように構成された画像信号処理(ISP)ユニットと、オーディオおよびビデオ信号をエンコードならびにデコードするように構成されたマルチメディア信号コデックとを含む。
1つの発想は、高帯域幅メモリ(HBM)のような、帯域幅がもっと大きいメモリを使用することである。しかし、このやり方はコストが高く、ハードウェアの設計も非常に難しい。
図5は、本開示の例示的実施形態によるディープ・ニューラル・ネットワークの推論プロセスの模式図である。ニューラル・ネットワークの推論プロセスは、処理されるデータを、訓練済みのニューラル・ネットワークに入力して、推論結果を得るプロセスである。図5に示すように、ディープ・ニューラル・ネットワークは、入力層532、出力層538、および複数の隠れ層を含む。簡単にするために、図5は2つの隣接する層、即ち、i番目の層および(i+1)番目の層のみを示す。これらを、それぞれ、参照番号534および536によって示す。また、図5は、パラメータ記憶空間510、および特徴マップ記憶空間520も示す。推論プロセスにおいて、ニューラル・ネットワークにおける各層は、出力層538が最終的な推論結果を出力するまで、順次入来するデータを処理する。層534および536における処理については、以下で一例をあげて説明する。
1.複数の層を含むディープ・ニューラル・ネットワークのための圧縮方法であって、入力層を除く複数の層における少なくとも1つの層の各々に対して、この方法は、パラメータ記憶空間から層のパラメータを読み出すステップと、特徴マップ記憶空間から、直前の層によって格納された第1特徴マップを読み出すステップと、読み出したパラメータおよび第1特徴マップに基づいて、第2特徴マップを生成するステップと、第2特徴マップを圧縮して、第3特徴マップを得るステップと、第3特徴マップを特徴マップ記憶空間に格納するステップとを含む。
3.項目1による方法において、この方法が、ディープ・ニューラル・ネットワークの訓練プロセスおよびディープ・ニューラル・ネットワークの推論プロセスにおける順方向伝搬フェーズにおいて、使用される。
13.項目11による方法において、領域における特異的特徴の存在または不在にしたがって領域の各々の量子化刻みを決定するステップが、領域における特異的特徴の存在に応答して、第1量子化刻みを領域に割り当てるステップと、領域における特異的特徴の不在に応答して、第2量子化刻みを領域に割り当てるステップとを含み、第1量子化刻みが第2量子化刻みよりも小さい。
16.チップであって、パラメータ記憶空間および特徴マップ記憶空間を含むメモリであって、パラメータ記憶空間が、ディープ・ニューラル・ネットワークのパラメータを格納するように構成され、特徴マップ記憶空間が、ディープ・ニューラル・ネットワークの特徴マップを格納するように構成される、メモリと、メモリと協働して、項目1から15までのいずれか1つによる方法を実行するように構成されたディープ・ニューラル・ネットワーク・エンジンとを含む。
18.項目16によるチップにおいて、チップが、人工知能ビジョン・チップを含む。
19.項目18によるチップにおいて、チップが、更に、画像信号を処理するように構成された画像信号処理(ISP)ユニットと、オーディオおよびビデオ信号をエンコードならびにデコードするように構成されたマルチメディア信号コデックとを含む。
Claims (22)
- ディープ・ニューラル・ネットワークのための圧縮方法であって、前記ディープ・ニューラル・ネットワークが複数の層を含み、入力層を除く前記複数の層における少なくとも1つの層に対して、前記方法が、
パラメータ記憶空間から前記層のパラメータを読み出すステップと、
特徴マップ記憶空間から、直前の層によって格納された第1特徴マップを読み出すステップと、
前記読み出したパラメータおよび第1特徴マップに基づいて、第2特徴マップを生成するステップと、
前記第2特徴マップを圧縮して、第3特徴マップを得るステップと、
前記第3特徴マップを前記特徴マップ記憶空間に格納するステップと、
を含む、方法。 - 請求項1に記載の方法において、前記第2特徴マップに対して実行される圧縮が、損失のある圧縮を含む、方法。
- 請求項1に記載の方法において、この方法が、前記ディープ・ニューラル・ネットワークの訓練プロセスおよび前記ディープ・ニューラル・ネットワークの推論プロセスにおける順方向伝搬フェーズにおいて、使用される、方法。
- 請求項1に記載の方法において、前記ディープ・ニューラル・ネットワークが、畳み込みニューラル・ネットワークを含み、前記畳み込みニューラル・ネットワークが、複数の畳み込み層を含み、前記方法が、前記畳み込み層の少なくとも1つに対して実行される、方法。
- 請求項1に記載の方法において、
前記第1特徴マップが圧縮特徴マップであり、
前記読み出したパラメータおよび第1特徴マップに基づいて第2特徴マップを生成するステップが、
前記第1特徴マップを解凍するステップと、
前記読み出したパラメータおよび解凍した第1特徴マップに基づいて、前記第2特徴マップを生成するステップと、
を含む、方法。 - 請求項1に記載の方法において、
前記パラメータ記憶空間から読み出した前記パラメータが圧縮パラメータであり、前記読み出したパラメータおよび第1特徴マップに基づいて第2特徴マップを生成するステップが、
前記読み出したパラメータを解凍するステップと、
前記解凍したパラメータおよび前記第1特徴マップに基づいて、前記第2特徴マップを生成するステップと、
を含む、方法。 - 請求項2に記載の方法において、前記第2特徴マップを圧縮するステップが、
前記第2特徴マップを空間ドメインから周波数ドメインに変換するステップと、
変換係数を量子化するステップと、
を含む、方法。 - 請求項2に記載の方法において、前記第2特徴マップを圧縮するステップが、更に、
前記第2特徴マップに対して予測コーディングを実行するステップを含み、前記予測コーディングが、内部予測および/または相互予測を含む、方法。 - 請求項2に記載の方法において、前記第2特徴マップを圧縮するステップが、前記第2特徴マップの異なる領域を異なる圧縮率で圧縮するステップを含み、前記領域の各々の圧縮率が、当該領域における関心度に依存し、第1関心度の領域の圧縮率が、第2関心度の領域の圧縮率よりも低く、前記第1関心度が、前記第2関心度よりも高い、方法。
- 請求項2に記載の方法において、前記第2特徴マップを圧縮するステップが、前記第2特徴マップに対して非均一量子化を実行するステップを含み、前記第2特徴マップの異なる領域が、異なる量子化刻みを有する、方法。
- 請求項10に記載の方法において、前記第2特徴マップの領域の各々の量子化刻みが、領域の画像の複雑さ、前記第2特徴マップにおける領域の位置、領域の重要度、領域における特異的特徴の存在または不在、および領域における特異的特徴の数の内少なくとも1つに基づいて決定される、方法。
- 請求項11に記載の方法において、特異的特徴が、前記ディープ・ニューラル・ネットワークのアプリケーション・シナリオにおいて関心のある特徴を含む、方法。
- 請求項11に記載の方法において、領域における特異的特徴の存在または不在にしたがって領域の各々の量子化刻みを決定するステップが、
前記領域における前記特異的特徴の存在に応答して、第1量子化刻みを前記領域に割り当てるステップと、
前記領域における前記特異的特徴の不在に応答して、第2量子化刻みを前記領域に割り当てるステップと、
を含み、前記第1量子化刻みが、前記第2量子化刻みよりも小さい、方法。 - 請求項11に記載の方法において、前記領域における前記特異的特徴の数にしたがって前記領域の各々の量子化刻みを決定するステップが、
前記領域における前記特異的特徴の数が、予め設定された閾値よりも多いことに応答して、第3量子化刻みを前記領域に割り当てるステップと、
前記領域における前記特異的特徴の数が前記所定の閾値以下であることに応答して、第4量子化刻みを前記領域に割り当てるステップと、
を含み、前記第3量子化刻みが、前記第4量子化刻みよりも小さい、方法。 - 請求項1に記載の方法において、前記ディープ・ニューラル・ネットワークが、物体認識のために、ビデオ・データを処理するように構成される、方法。
- チップであって、
パラメータ記憶空間および特徴マップ記憶空間を含むメモリであって、前記パラメータ記憶空間が、ディープ・ニューラル・ネットワークのパラメータを格納するように構成され、前記特徴マップ記憶空間が、前記ディープ・ニューラル・ネットワークの特徴マップを格納するように構成される、メモリと、
前記メモリと協働して、請求項1〜15までのいずれか一項に記載の方法を実行するように構成されたディープ・ニューラル・ネットワーク・エンジンと、
を備える、チップ。 - 請求項16に記載のチップにおいて、前記メモリがランダム・アクセス・メモリを含む、チップ。
- 請求項16に記載のチップにおいて、前記チップが、人工知能ビジョン・チップを含む、チップ。
- 請求項18に記載のチップにおいて、前記チップが、更に、
画像信号を処理するように構成された画像信号処理(ISP)ユニットと、
オーディオおよびビデオ信号をエンコードならびにデコードするように構成されたマルチメディア信号コデックと、
を含む、チップ。 - 電子デバイスであって、
画像および/またはビデオ・データをキャプチャするように構成された撮像センサと、
請求項16〜19のいずれか一項に記載のチップであって、ディープ・ニューラル・ネットワークを使用して、前記キャプチャされた画像および/またはビデオ・データを、物体の認識のために処理するように構成される、チップと、
を含む、電子デバイス。 - 電子デバイスであって、
プロセッサと、
プログラムを格納するメモリと、
を含み、前記プログラムが命令を含み、前記プロセッサによって前記命令が実行されると、請求項1〜15のいずれか一項に記載の方法を前記電子デバイスに実行させる、電子デバイス。 - プログラムを格納するコンピュータ読み取り可能記憶媒体であって、前記プログラムが命令を含み、プロセッサによって前記命令が実行されると、請求項1〜15のいずれか一項に記載の方法を前記プロセッサに実行させる、コンピュータ読み取り可能記憶媒体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910441306.3 | 2019-05-24 | ||
CN201910441306.3A CN110163370B (zh) | 2019-05-24 | 2019-05-24 | 深度神经网络的压缩方法、芯片、电子设备及介质 |
PCT/CN2020/089696 WO2020238603A1 (zh) | 2019-05-24 | 2020-05-12 | 深度神经网络的压缩方法、芯片、电子设备及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021535689A true JP2021535689A (ja) | 2021-12-16 |
JP7164904B2 JP7164904B2 (ja) | 2022-11-02 |
Family
ID=67632716
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021517260A Active JP7164904B2 (ja) | 2019-05-24 | 2020-05-12 | ディープ・ニューラル・ネットワークのための圧縮方法、チップ、電子デバイス、および媒体 |
Country Status (6)
Country | Link |
---|---|
US (1) | US11272188B2 (ja) |
EP (1) | EP3836035A4 (ja) |
JP (1) | JP7164904B2 (ja) |
KR (1) | KR102332490B1 (ja) |
CN (1) | CN110163370B (ja) |
WO (1) | WO2020238603A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2023512570A (ja) * | 2020-02-07 | 2023-03-27 | 華為技術有限公司 | 画像処理方法および関連装置 |
Families Citing this family (32)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11580382B2 (en) * | 2019-04-26 | 2023-02-14 | Rohde & Schwarz Gmbh & Co. Kg | Method and apparatus providing a trained signal classification neural network |
US11494616B2 (en) * | 2019-05-09 | 2022-11-08 | Shenzhen Malong Technologies Co., Ltd. | Decoupling category-wise independence and relevance with self-attention for multi-label image classification |
CN110163370B (zh) * | 2019-05-24 | 2021-09-17 | 上海肇观电子科技有限公司 | 深度神经网络的压缩方法、芯片、电子设备及介质 |
CN110497925B (zh) * | 2019-09-06 | 2020-08-25 | 合肥德泰科通测控技术有限公司 | 一种用于轨道无人驾驶的障碍物识别方法 |
EP4075343A4 (en) * | 2019-12-31 | 2023-01-25 | Huawei Technologies Co., Ltd. | DEVICE AND METHOD FOR SYNCHRONIZING DATA IN A LEAD OF A NEURAL NETWORK |
CN111294512A (zh) * | 2020-02-10 | 2020-06-16 | 深圳市铂岩科技有限公司 | 图像处理方法、装置、存储介质及摄像装置 |
WO2021177652A1 (ko) * | 2020-03-02 | 2021-09-10 | 엘지전자 주식회사 | 피쳐 양자화/역양자화를 수행하는 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장하는 기록 매체 |
CN111326167B (zh) * | 2020-03-09 | 2022-05-13 | 广州深声科技有限公司 | 一种基于神经网络的声学特征转换方法 |
US20210303975A1 (en) * | 2020-03-25 | 2021-09-30 | Arm Limited | Compression and decompression of weight values |
US11551089B2 (en) * | 2020-03-31 | 2023-01-10 | Ati Technologies Ulc | Feature reordering based on sparsity for improved memory compression transfers during machine learning jobs |
WO2021237513A1 (zh) * | 2020-05-27 | 2021-12-02 | 深圳市大疆创新科技有限公司 | 数据压缩存储的系统、方法、处理器及计算机存储介质 |
KR20210156538A (ko) * | 2020-06-18 | 2021-12-27 | 삼성전자주식회사 | 뉴럴 네트워크를 이용한 데이터 처리 방법 및 데이터 처리 장치 |
CN111832692A (zh) * | 2020-07-14 | 2020-10-27 | Oppo广东移动通信有限公司 | 数据处理方法、装置、终端及存储介质 |
WO2022021083A1 (zh) * | 2020-07-28 | 2022-02-03 | 深圳市大疆创新科技有限公司 | 图像处理方法、图像处理装置及计算机可读存储介质 |
CN112115948A (zh) * | 2020-09-15 | 2020-12-22 | 电子科技大学 | 一种基于深度学习的芯片表面字符识别方法 |
CN112712174B (zh) * | 2020-12-31 | 2022-04-08 | 湖南师范大学 | 全频域卷积神经网络的硬件加速器、加速方法和图像分类方法 |
CN112749799B (zh) * | 2020-12-31 | 2022-04-12 | 湖南师范大学 | 基于自适应ReLU的全频域卷积神经网络的硬件加速器、加速方法和图像分类方法 |
EP4303762A1 (en) * | 2021-03-01 | 2024-01-10 | Zhejiang University | Encoding method, decoding method, encoder, decoder, and storage medium |
CN113033779B (zh) * | 2021-03-18 | 2024-08-27 | 联想(北京)有限公司 | 一种基于设备参数的模型处理方法及电子设备 |
US20220300800A1 (en) * | 2021-03-19 | 2022-09-22 | Vianai Systems, Inc. | Techniques for adaptive generation and visualization of quantized neural networks |
AU2021202141A1 (en) * | 2021-04-07 | 2022-10-27 | Canon Kabushiki Kaisha | 4:2:0 packing of feature maps |
US20220335655A1 (en) * | 2021-04-19 | 2022-10-20 | Tencent America LLC | Substitutional input optimization for adaptive neural image compression with smooth quality control |
US20220383121A1 (en) * | 2021-05-25 | 2022-12-01 | Applied Materials, Inc. | Dynamic activation sparsity in neural networks |
CN117529922A (zh) * | 2021-06-29 | 2024-02-06 | 夏普株式会社 | 用于在多维数据的编码中压缩特征数据的系统和方法 |
CN113507605B (zh) * | 2021-09-10 | 2021-12-07 | 南通海腾铜业有限公司 | 基于人工智能的危险区域监控视频压缩存储方法和系统 |
CN113947185B (zh) * | 2021-09-30 | 2022-11-18 | 北京达佳互联信息技术有限公司 | 任务处理网络生成、任务处理方法、装置、电子设备及存储介质 |
CN113837310B (zh) * | 2021-09-30 | 2023-05-23 | 四川新网银行股份有限公司 | 多尺度融合的证件翻拍识别方法、装置、电子设备和介质 |
KR102650992B1 (ko) | 2022-05-12 | 2024-03-22 | 중앙대학교 산학협력단 | 블록 변환을 이용한 신경망 압축 장치 및 방법 |
WO2024057721A1 (ja) * | 2022-09-16 | 2024-03-21 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 復号装置、符号化装置、復号方法、及び符号化方法 |
CN116011551B (zh) * | 2022-12-01 | 2023-08-29 | 中国科学技术大学 | 优化数据加载的图采样训练方法、系统、设备及存储介质 |
CN118250463A (zh) * | 2022-12-23 | 2024-06-25 | 维沃移动通信有限公司 | 图像处理方法、装置及设备 |
WO2024196160A1 (ko) * | 2023-03-22 | 2024-09-26 | 엘지전자 주식회사 | 피쳐 부호화/복호화 방법, 장치, 비트스트림을 저장한 기록 매체 및 비트스트림 전송 방법 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180082181A1 (en) * | 2016-05-13 | 2018-03-22 | Samsung Electronics, Co. Ltd. | Neural Network Reordering, Weight Compression, and Processing |
US20180189981A1 (en) * | 2016-12-30 | 2018-07-05 | Intel Corporation | System and method of encoding and decoding feature maps and weights for a convolutional neural network |
US20180350110A1 (en) * | 2017-05-31 | 2018-12-06 | Samsung Electronics Co., Ltd. | Method and device for processing multi-channel feature map images |
WO2019050771A1 (en) * | 2017-09-05 | 2019-03-14 | Panasonic Intellectual Property Corporation Of America | EXECUTION METHOD, EXECUTION DEVICE, LEARNING METHOD, LEARNING DEVICE, AND PROGRAM FOR DEEP NEURAL NETWORK |
Family Cites Families (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100461867C (zh) * | 2004-12-02 | 2009-02-11 | 中国科学院计算技术研究所 | 一种帧内图像预测编码方法 |
US10229356B1 (en) | 2014-12-23 | 2019-03-12 | Amazon Technologies, Inc. | Error tolerant neural network model compression |
GB201603144D0 (en) * | 2016-02-23 | 2016-04-06 | Magic Pony Technology Ltd | Training end-to-end video processes |
WO2017031630A1 (zh) * | 2015-08-21 | 2017-03-02 | 中国科学院自动化研究所 | 基于参数量化的深度卷积神经网络的加速与压缩方法 |
KR102124714B1 (ko) * | 2015-09-03 | 2020-06-19 | 미디어텍 인크. | 비디오 코딩에서의 신경망 기반 프로세싱의 방법 및 장치 |
KR20170128080A (ko) * | 2016-05-13 | 2017-11-22 | 삼성전자주식회사 | 신경 네트워크를 구현하는 방법 및 장치 |
KR102061615B1 (ko) * | 2016-12-26 | 2020-01-02 | 한국과학기술원 | 인공 신경망 모델에서 메모리 효율성 및 학습 속도 향상을 위한 드롭아웃 방법과 이를 이용한 학습 방법 |
US10735023B2 (en) * | 2017-02-24 | 2020-08-04 | Texas Instruments Incorporated | Matrix compression accelerator system and method |
KR102499396B1 (ko) * | 2017-03-03 | 2023-02-13 | 삼성전자 주식회사 | 뉴럴 네트워크 장치 및 뉴럴 네트워크 장치의 동작 방법 |
CN107092961B (zh) * | 2017-03-23 | 2018-08-28 | 中国科学院计算技术研究所 | 一种基于模式频率统计编码的神经网络处理器及设计方法 |
US20180307987A1 (en) * | 2017-04-24 | 2018-10-25 | Intel Corporation | Hardware ip optimized convolutional neural network |
WO2018214913A1 (zh) * | 2017-05-23 | 2018-11-29 | 上海寒武纪信息科技有限公司 | 处理方法及加速装置 |
CN109389210B (zh) * | 2017-08-09 | 2021-06-18 | 上海寒武纪信息科技有限公司 | 处理方法和处理装置 |
CN107392868A (zh) * | 2017-07-21 | 2017-11-24 | 深圳大学 | 基于全卷积神经网络的压缩双目图像质量增强方法及装置 |
CN109376856B (zh) * | 2017-08-09 | 2022-07-08 | 上海寒武纪信息科技有限公司 | 数据处理方法及处理装置 |
KR102343648B1 (ko) * | 2017-08-29 | 2021-12-24 | 삼성전자주식회사 | 영상 부호화 장치 및 영상 부호화 시스템 |
KR102535361B1 (ko) * | 2017-10-19 | 2023-05-24 | 삼성전자주식회사 | 머신 러닝을 사용하는 영상 부호화기 및 그것의 데이터 처리 방법 |
US10721471B2 (en) * | 2017-10-26 | 2020-07-21 | Intel Corporation | Deep learning based quantization parameter estimation for video encoding |
US11989861B2 (en) * | 2017-11-28 | 2024-05-21 | Intel Corporation | Deep learning-based real-time detection and correction of compromised sensors in autonomous machines |
CN109523017B (zh) | 2018-11-27 | 2023-10-17 | 广州市百果园信息技术有限公司 | 姿态检测方法、装置、设备及存储介质 |
US10937169B2 (en) * | 2018-12-18 | 2021-03-02 | Qualcomm Incorporated | Motion-assisted image segmentation and object detection |
CN109726799A (zh) | 2018-12-27 | 2019-05-07 | 四川大学 | 一种深度神经网络的压缩方法 |
CN109766995A (zh) | 2018-12-28 | 2019-05-17 | 钟祥博谦信息科技有限公司 | 深度神经网络的压缩方法与装置 |
CN110163370B (zh) * | 2019-05-24 | 2021-09-17 | 上海肇观电子科技有限公司 | 深度神经网络的压缩方法、芯片、电子设备及介质 |
-
2019
- 2019-05-24 CN CN201910441306.3A patent/CN110163370B/zh active Active
-
2020
- 2020-05-12 KR KR1020217007212A patent/KR102332490B1/ko active IP Right Grant
- 2020-05-12 WO PCT/CN2020/089696 patent/WO2020238603A1/zh unknown
- 2020-05-12 JP JP2021517260A patent/JP7164904B2/ja active Active
- 2020-05-12 EP EP20812625.0A patent/EP3836035A4/en not_active Withdrawn
-
2021
- 2021-03-03 US US17/191,606 patent/US11272188B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180082181A1 (en) * | 2016-05-13 | 2018-03-22 | Samsung Electronics, Co. Ltd. | Neural Network Reordering, Weight Compression, and Processing |
US20180189981A1 (en) * | 2016-12-30 | 2018-07-05 | Intel Corporation | System and method of encoding and decoding feature maps and weights for a convolutional neural network |
US20180350110A1 (en) * | 2017-05-31 | 2018-12-06 | Samsung Electronics Co., Ltd. | Method and device for processing multi-channel feature map images |
WO2019050771A1 (en) * | 2017-09-05 | 2019-03-14 | Panasonic Intellectual Property Corporation Of America | EXECUTION METHOD, EXECUTION DEVICE, LEARNING METHOD, LEARNING DEVICE, AND PROGRAM FOR DEEP NEURAL NETWORK |
Non-Patent Citations (1)
Title |
---|
野水 泰之: "「JPEG2000最新動向」", 画像電子学会誌, vol. 第30巻, 第2号, JPN6021042216, 25 March 2001 (2001-03-25), pages 167 - 175, ISSN: 0004735945 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2023512570A (ja) * | 2020-02-07 | 2023-03-27 | 華為技術有限公司 | 画像処理方法および関連装置 |
JP7551759B2 (ja) | 2020-02-07 | 2024-09-17 | 華為技術有限公司 | 画像処理方法および関連装置 |
Also Published As
Publication number | Publication date |
---|---|
EP3836035A1 (en) | 2021-06-16 |
WO2020238603A1 (zh) | 2020-12-03 |
KR20210043626A (ko) | 2021-04-21 |
EP3836035A4 (en) | 2022-02-09 |
CN110163370B (zh) | 2021-09-17 |
CN110163370A (zh) | 2019-08-23 |
JP7164904B2 (ja) | 2022-11-02 |
US11272188B2 (en) | 2022-03-08 |
US20210266565A1 (en) | 2021-08-26 |
KR102332490B1 (ko) | 2021-12-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7164904B2 (ja) | ディープ・ニューラル・ネットワークのための圧縮方法、チップ、電子デバイス、および媒体 | |
KR102301232B1 (ko) | 다채널 특징맵 영상을 처리하는 방법 및 장치 | |
KR102174777B1 (ko) | 이미지의 품질 향상을 위하여 이미지를 처리하는 방법 및 장치 | |
WO2021155832A1 (zh) | 一种图像处理方法以及相关设备 | |
US11570477B2 (en) | Data preprocessing and data augmentation in frequency domain | |
KR20220070326A (ko) | 비디오 코딩을 위한 변형 가능한 콘볼루션에 의한 예측 프레임 생성 | |
CN114067007A (zh) | 图像处理方法与装置、神经网络训练的方法与装置 | |
TWI826160B (zh) | 圖像編解碼方法和裝置 | |
CN114096987A (zh) | 视频处理方法及装置 | |
Löhdefink et al. | On low-bitrate image compression for distributed automotive perception: Higher peak snr does not mean better semantic segmentation | |
CN114066914A (zh) | 一种图像处理方法以及相关设备 | |
Jeong et al. | An overhead-free region-based JPEG framework for task-driven image compression | |
CN115022637A (zh) | 一种图像编码方法、图像解压方法以及装置 | |
WO2022100140A1 (zh) | 一种压缩编码、解压缩方法以及装置 | |
US11403782B2 (en) | Static channel filtering in frequency domain | |
KR102642059B1 (ko) | 다양한 영상 신호 특성의 다중 모델을 이용한 영상 화질 향상 방법 및 장치 | |
CN118318441A (zh) | 特征图编解码方法和装置 | |
WO2021179117A1 (zh) | 神经网络通道数搜索方法和装置 | |
Deshmukh | Image compression using neural networks | |
WO2024199477A1 (zh) | 图像解码和编码方法、装置、设备及存储介质 | |
WO2023178662A1 (en) | Image and video coding using multi-sensor collaboration and frequency adaptive processing | |
Kunwar | Strategies in JPEG compression using Convolutional Neural Network (CNN) | |
CHABBIA | Image compression based on machine learning technics | |
Al-Kafagi | Hierarchical Autoregressive for Image Compression | |
CN114693811A (zh) | 一种图像处理方法以及相关设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210325 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210325 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20210325 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20211026 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220119 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20220328 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220714 |
|
C60 | Trial request (containing other claim documents, opposition documents) |
Free format text: JAPANESE INTERMEDIATE CODE: C60 Effective date: 20220714 |
|
C11 | Written invitation by the commissioner to file amendments |
Free format text: JAPANESE INTERMEDIATE CODE: C11 Effective date: 20220727 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20220816 |
|
C21 | Notice of transfer of a case for reconsideration by examiners before appeal proceedings |
Free format text: JAPANESE INTERMEDIATE CODE: C21 Effective date: 20220817 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20221007 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20221014 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7164904 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |