JP7034336B2 - データを処理するための方法、装置、および関連製品 - Google Patents
データを処理するための方法、装置、および関連製品 Download PDFInfo
- Publication number
- JP7034336B2 JP7034336B2 JP2020564843A JP2020564843A JP7034336B2 JP 7034336 B2 JP7034336 B2 JP 7034336B2 JP 2020564843 A JP2020564843 A JP 2020564843A JP 2020564843 A JP2020564843 A JP 2020564843A JP 7034336 B2 JP7034336 B2 JP 7034336B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- group
- quantized
- dot
- dot position
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/06—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
- G06N3/063—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using electronic means
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F7/00—Methods or arrangements for processing data by operating upon the order or content of the data handled
- G06F7/38—Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation
- G06F7/48—Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices
- G06F7/483—Computations with numbers represented by a non-linear combination of denominational numbers, e.g. rational numbers, logarithmic number system or floating-point numbers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Biophysics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Neurology (AREA)
- Nonlinear Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Image Processing (AREA)
Description
本開示の第1の態様においては、データを処理するための方法が提供される。この方法は、機械学習モデルに用いられる1グループの量子化待ちデータを取得するステップと、1グループの量子化待ちデータを、複数のドット・ポジションを用いてそれぞれ量子化することにより、複数グループの量子化後のデータを決定するステップであって、複数のドット・ポジションの各々は、複数グループの量子化後のデータ中の小数点の位置を指定するステップと、1グループの量子化待ちデータの量子化に用いるように、複数グループの量子化後のデータの中の各グループの量子化後のデータと1グループの量子化待ちデータとの間の差に基づいて、複数のドット・ポジションから1ドット・ポジションを選択するステップと、を含む。
本開示の第4の態様においては、本開示の各々の実施形態によるデータを処理するための装置を備える人工知能チップが提供される。
本開示の第5の態様においては、本開示の各々の実施形態による人工知能チップを備える電子デバイスが提供される。
1つの実施形態においては、データを処理するための装置を備える人工知能チップは更に開示される。
以下の条項によって前述した内容をより良く理解され得る。
A1.データを処理するための方法であって、
機械学習モデルに用いられる1グループの量子化待ちデータを取得するステップと、
A2.条項A1に記載の方法であって、複数のドット・ポジションの各々は整数で表され、方法は、
1グループの量子化待ちデータに関連した範囲に基づいて、複数のドット・ポジションの中の1ドット・ポジションを取得するステップと、
A3.条項A2に記載の方法であって、複数のドット・ポジションの中の他のドット・ポジションを決定するステップは、
ドット・ポジションを表す整数をインクリメントすることによって、他のドット・ポジションの中の1ドット・ポジションを決定するステップと、
A4.条項A1乃至A3の何れか1項に記載の方法であって、複数のドット・ポジションから1ドット・ポジションを選択するステップは、
複数グループの量子化後のデータと1グループの量子化待ちデータとの間の複数の差をそれぞれ決定するステップと、
複数の差から最小の差を選択するステップと、
複数のドット・ポジションから最小の差に対応する1ドット・ポジションを選択するステップと、を含むことを特徴とする前記方法。
A5.条項A4に記載の方法であって、複数グループの量子化後のデータと1グループの量子化待ちデータとの間の複数の差をそれぞれ決定するステップは、
1グループの相対の差に基づいて、複数の差の中の1つの差を決定するステップと、を含むことを特徴とする前記方法。
A6.条項A4に記載の方法であって、複数グループの量子化後のデータと1グループの量子化待ちデータとの間の複数の差をそれぞれ決定するステップは、
量子化平均値と元の平均値とに基づいて、複数の差の中の1つの差を決定するステップと、を含むことを特徴とする前記方法。
A8.条項A1乃至A6の何れか1項に記載の方法であって、前記方法は、
ニューラル・ネットワーク・モデル中の1グループの浮動小数点数を含む、別のグループの量子化待ちデータを取得するステップと、
A9.データを処理するための装置であって、
機械学習モデルに用いられる1グループの量子化待ちデータを取得するための取得ユニットと、
A10.条項A9に記載の装置であって、複数のドット・ポジションの各々は整数で表され、前記装置は、
A11.条項A10に記載の装置であって、ドット・ポジション決定ユニットは、
A12.条項A9乃至A11の何れか1項に記載の装置であって、選択モジュールは、
複数グループの量子化後のデータと1グループの量子化待ちデータとの間の複数の差をそれぞれ決定するための差決定ユニットと、
複数の差から最小の差を選択するための差選択ユニットと、
A13.条項A12に記載の装置であって、差決定ユニットは、
複数グループの量子化後のデータの中の所定の1グループの量子化後のデータに対して、所定の1グループの量子化後のデータと1グループの量子化待ちデータとの間の1グループの相対差をそれぞれ決定ための相対差決定ユニットと、
1グループの相対差に基づいて、複数の差の中の1つの差を決定するための総体差決定ユニットと、を備えることを特徴とする前記装置。
A14.条項A12に記載の装置であって、差決定ユニットは、
量子化平均値と元の平均値とに基づいて、複数の差の中の1つの差を決定する平均値差決定ユニットと、を備えることを特徴とする前記装置。
A16.条項A9乃至A14の何れか1項に記載の装置であって、前記装置は、
ニューラル・ネットワーク・モデル中の1グループの浮動小数点数を含む、別のグループの量子化待ちデータを取得するデータ取得ユニットと、
A19.電子デバイスであって、電子デバイスは条項A18に記載の人工知能チップを備えることを特徴とする前記電子デバイス。
A20.ボートカードであって、記憶装置と、インターフェース装置と、制御装置と、条項18に記載の人工知能チップと、を備え、
ここで、人工知能チップは、記憶装置、制御装置、および、インターフェース装置に接続され、
記憶装置はデータを記憶し、
インターフェース装置は人工知能チップと外部装置との間のデータ伝送を実現し、
制御装置は人工知能チップの状態を監視制御することを特徴とする前記ボートカード。
A21.条項A20に記載のボートカードであって、
チップは、各々のメモリユニットのデータ伝送とデータ記憶とを制御するためのDDRコントローラーを備え、
インターフェース装置は、基準PCIEインターフェースであることを特徴とする前記ボートカード。
Claims (20)
- データを処理するための方法であって、
機械学習モデルに用いられる1グループの量子化待ちデータを取得するステップと、
前記1グループの量子化待ちデータを、複数のドット・ポジションを用いてそれぞれ量子化することにより、複数グループの量子化後のデータを決定するステップであって、前記複数のドット・ポジションの各々は、前記複数グループの量子化後のデータ中の小数点の位置を指定するステップと、
前記1グループの量子化待ちデータの量子化に用いるように、前記複数グループの量子化後のデータの中の各グループの量子化後のデータと前記1グループの量子化待ちデータとの間の差に基づいて、前記複数のドット・ポジションから1ドット・ポジションを選択するステップと、を含む
ことを特徴とする前記方法。 - 前記複数のドット・ポジションの各々は整数で表され、
前記方法は、
前記1グループの量子化待ちデータに関連した範囲に基づいて、前記複数のドット・ポジションの中の1ドット・ポジションを取得するステップと、
得られた前記ドット・ポジションに隣接する整数に基づいて、前記複数のドット・ポジションの中の他のドット・ポジションを決定するステップと、をさらに含む
ことを特徴とする請求項1に記載の方法。 - 前記複数のドット・ポジションの中の他のドット・ポジションを決定するステップは、
前記ドット・ポジションを表す前記整数をインクリメントすることによって、前記他のドット・ポジションの中の1ドット・ポジションを決定するステップと、
前記ドット・ポジションを表す前記整数をデクリメントすることによって、前記他のドット・ポジションの中の1ドット・ポジションを決定するステップと、の中の少なくとも1つを含む
ことを特徴とする請求項2に記載の方法。 - 前記複数のドット・ポジションから1ドット・ポジションを選択するステップは、
前記複数グループの量子化後のデータと前記1グループの量子化待ちデータとの間の複数の差をそれぞれ決定するステップと、
前記複数の差から最小の差を選択するステップと、
前記複数のドット・ポジションから前記最小の差に対応する1ドット・ポジションを選択するステップと、を含む
ことを特徴とする請求項1乃至3の何れか1項に記載の方法。 - 前記複数グループの量子化後のデータと前記1グループの量子化待ちデータとの間の複数の差をそれぞれ決定するステップは、
前記複数グループの量子化後のデータの所定の1グループの量子化後のデータに対して、前記所定の1グループの量子化後のデータと前記1グループの量子化待ちデータとの間の1グループの相対差をそれぞれ決定するステップと、
前記1グループの相対差に基づいて、前記複数の差の中の1つの差を決定するステップと、を含む
ことを特徴とする請求項4に記載の方法。 - 前記複数グループの量子化後のデータと前記1グループの量子化待ちデータとの間の複数の差をそれぞれ決定するステップは、
前記複数グループの量子化後のデータの中の所定の1グループの量子化後のデータに対して、前記1グループの量子化後のデータの量子化平均値と前記1グループの量子化待ちデータの元の平均値とをそれぞれ決定するステップと、
前記量子化平均値と前記元の平均値とに基づいて、前記複数の差の中の1つの差を決定するステップと、を含む
ことを特徴とする請求項4に記載の方法。 - 前記1グループの量子化待ちデータは、ニューラル・ネットワーク・モデル中の1グループの浮動小数点数を含み、
前記方法は、
前記1グループの量子化待ちデータを、選択された前記ドット・ポジションを用いて量子化することによって、1グループの量子化後のデータを得るステップであって、前記1グループの量子化待ちデータを量子化することは、選択された前記ドット・ポジションに基づいて、前記1グループの量子化待ちデータを前記1グループの量子化後のデータにマッピングすることを含み、前記1グループの量子化後のデータ中の小数点の位置は、選択された前記ドット・ポジションによって決定されるものであるステップと、
得られた前記1グループの量子化後のデータをニューラル・ネットワーク・モデルに入力することによって、処理に用いるステップと、をさらに含む
ことを特徴とする請求項1乃至6の何れか1項に記載の方法。 - ニューラル・ネットワーク・モデル中の1グループの浮動小数点数を含む、別のグループの量子化待ちデータを取得するステップと、
前記別のグループの量子化待ちデータを、選択された前記ドット・ポジションを用いて量子化することによって、別のグループの量子化後のデータを得るステップであって、前記別のグループの量子化待ちデータを量子化することは、選択された前記ドット・ポジションに基づいて、前記別のグループの量子化待ちデータを前記別のグループの量子化後のデータにマッピングすることを含み、前記別のグループの量子化後のデータ中の小数点の位置は、選択された前記ドット・ポジションによって決定されるものであるステップと、
得られた前記別のグループの量子化後のデータを前記ニューラル・ネットワーク・モデルに入力することによって、処理に用いるステップと、をさらに含む
ことを特徴とする請求項1乃至6の何れか1項に記載の方法。 - データを処理するための装置であって、
機械学習モデルに用いられる1グループの量子化待ちデータを取得するための取得ユニットと、
前記1グループの量子化待ちデータを、複数のドット・ポジションを用いてそれぞれ量子化することにより、複数グループの量子化後のデータを決定するための決定ユニットであって、前記複数のドット・ポジションの各々は、前記複数グループの量子化後のデータ中の小数点の位置を指定する決定ユニットと、
前記1グループの量子化待ちデータの量子化に用いるように、前記複数グループの量子化後のデータの中の各グループの量子化後のデータと前記1グループの量子化待ちデータとの間の差に基づいて、前記複数のドット・ポジションから1ドット・ポジションを選択するための選択ユニットと、を備え、
ことを特徴とする前記装置。 - 前記複数のドット・ポジションの各々は整数で表され、
前記装置は、
前記1グループの量子化待ちデータに関連した範囲に基づいて、前記複数のドット・ポジションの中の1ドット・ポジションを取得するためのドット・ポジション取得ユニットと、
得られた前記ドット・ポジションに隣接する整数に基づいて、前記複数のドット・ポジションの中の他のドット・ポジションを決定するためのドット・ポジション決定ユニットと、をさらに備える
ことを特徴とする請求項9に記載の装置。 - 前記ドット・ポジション決定ユニットは、
前記ドット・ポジションを表す前記整数をインクリメントすることによって、前記他のドット・ポジションの中の1ドット・ポジションを決定するためのインクリメントユニットと、
前記ドット・ポジションを表す前記整数をデクリメントすることによって、前記他のドット・ポジションの中の1ドット・ポジションを決定するためのデクリメントユニットと、を備える
ことを特徴とする請求項10に記載の装置。 - 選択モジュールは、
前記複数グループの量子化後のデータと前記1グループの量子化待ちデータとの間の複数の差をそれぞれ決定するための差決定ユニットと、
前記複数の差から最小の差を選択するための差選択ユニットと、
前記複数のドット・ポジションから前記最小の差に対応する1ドット・ポジションを選択するためのドット・ポジション選択ユニットと、を備える
ことを特徴とする請求項9乃至11の何れか1項に記載の装置。 - 前記差決定ユニットは、
前記複数グループの量子化後のデータの中の所定の1グループの量子化後のデータに対して、前記所定の1グループの量子化後のデータと前記1グループの量子化待ちデータとの間の1グループの相対差をそれぞれ決定するための相対差決定ユニットと、
前記1グループの相対差に基づいて、前記複数の差の中の1つの差を決定するための総体差決定ユニットと、を備える
ことを特徴とする請求項12に記載の装置。 - 前記差決定ユニットは、
前記複数グループの量子化後のデータの中の所定の1グループの量子化後のデータに対して、前記所定の1グループの量子化後のデータの量子化平均値と前記1グループの量子化待ちデータの元の平均値とをそれぞれ決定するための平均値決定ユニットと、
前記量子化平均値と前記元の平均値とに基づいて、前記複数の差の中の1つの差を決定するための平均値差決定ユニットと、を備える
ことを特徴とする請求項12に記載の装置。 - 前記1グループの量子化待ちデータは、ニューラル・ネットワーク・モデル中の1グループの浮動小数点数を含み、
前記装置は、
前記1グループの量子化待ちデータを、選択された前記ドット・ポジションを用いて量子化することによって、1グループの量子化後のデータが得るための量子化ユニットであって、前記1グループの量子化待ちデータを量子化することは、選択された前記ドット・ポジションに基づいて、前記1グループの量子化待ちデータを前記1グループの量子化後のデータにマッピングすることを含み、前記1グループの量子化後のデータ中の小数点の位置は、選択された前記ドット・ポジションによって決定されるものである量子化ユニットと、
得られた前記1グループの量子化後のデータを前記ニューラル・ネットワーク・モデルに入力することによって、処理に用いるための入力ユニットと、をさらに備える
ことを特徴とする9乃至14の何れか1項に記載の装置。 - 前記装置は、
ニューラル・ネットワーク・モデル中の1グループの浮動小数点数を含む、別のグループの量子化待ちデータを取得するためのデータ取得ユニットと、
前記別のグループの量子化待ちデータを、選択された前記ドット・ポジションを用いて量子化することによって、別のグループの量子化後のデータが得るための量子化ユニットであって、前記別のグループの量子化待ちデータを量子化することは、選択された前記ドット・ポジションに基づいて、前記別のグループの量子化待ちデータを前記別のグループの量子化後のデータにマッピングすることを含み、前記別のグループの量子化後のデータ中の小数点の位置は、選択された前記ドット・ポジションによって決定されるものである量子化ユニットと、
得られた前記別のグループの量子化後のデータを前記ニューラル・ネットワーク・モデルに入力することによって、処理に用いるための入力ユニットと、をさらに備える
ことを特徴とする請求項9乃至14の何れか1項に記載の装置。 - コンピュータ可読記憶媒体であって、
前記コンピュータ可読記憶媒体には、コンピュータプログラムが記憶されており、前記コンピュータプログラムが実行されると、請求項1乃至8の何れか1項に記載の方法を実現する
ことを特徴するコンピュータ可読記憶媒体。 - 人工知能チップであって、
前記チップに請求項9乃至16の何れか1項に記載のデータを処理するためのユニットを備える
ことを特徴とする前記人工知能チップ。 - 電子デバイスであって、
前記電子デバイスは請求項18に記載の人工知能チップを備える
ことを特徴とする前記電子デバイス。 - ボートカードであって、
記憶装置と、
インターフェース装置と、
制御装置と、
請求項18に記載の人工知能チップと、を備え、
前記人工知能チップは、前記記憶装置、前記制御装置、および、前記インターフェース装置に接続され、
前記記憶装置は、データを記憶し、
前記インターフェース装置は、人工知能チップと外部装置との間のデータ伝送を実現し、
前記制御装置は、人工知能チップの状態を監視制御する
ことを特徴とする前記ボートカード。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910804627.5 | 2019-08-28 | ||
CN201910804627.5A CN112446460A (zh) | 2019-08-28 | 2019-08-28 | 用于处理数据的方法、装置以及相关产品 |
PCT/CN2020/091578 WO2021036362A1 (zh) | 2019-08-28 | 2020-05-21 | 用于处理数据的方法、装置以及相关产品 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022502724A JP2022502724A (ja) | 2022-01-11 |
JP7034336B2 true JP7034336B2 (ja) | 2022-03-11 |
Family
ID=74683565
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020564843A Active JP7034336B2 (ja) | 2019-08-28 | 2020-05-21 | データを処理するための方法、装置、および関連製品 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20220108150A1 (ja) |
EP (1) | EP4024283A4 (ja) |
JP (1) | JP7034336B2 (ja) |
CN (1) | CN112446460A (ja) |
WO (1) | WO2021036362A1 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2580171B (en) * | 2018-12-21 | 2021-02-17 | Imagination Tech Ltd | Methods and systems for selecting quantisation parameters for deep neural networks using back-propagation |
JP7146954B2 (ja) * | 2019-08-23 | 2022-10-04 | 安徽寒武紀信息科技有限公司 | データ処理方法、装置、コンピュータデバイス、及び記憶媒体 |
CN112686364B (zh) * | 2019-10-18 | 2023-12-08 | 华为技术有限公司 | 一种神经网络计算芯片及计算方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012203566A (ja) | 2011-03-24 | 2012-10-22 | Seiko Epson Corp | 状態推定装置、電子機器及びプログラム |
CN107688855A (zh) | 2016-08-12 | 2018-02-13 | 北京深鉴科技有限公司 | 针对于复杂神经网络的分层量化方法与装置 |
US20180121789A1 (en) | 2016-11-03 | 2018-05-03 | Beijing Baidu Netcom Science And Technology Co., Ltd. | Data processing method and apparatus |
CN109993296A (zh) | 2019-04-01 | 2019-07-09 | 北京中科寒武纪科技有限公司 | 量化实现方法及相关产品 |
US20200234133A1 (en) | 2017-10-16 | 2020-07-23 | SZ DJI Technology Co., Ltd. | Data fixed-point method and device |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0784975A (ja) * | 1993-09-10 | 1995-03-31 | Hitachi Ltd | 情報処理装置および学習演算処理方法 |
DE10316381A1 (de) * | 2003-04-10 | 2004-10-28 | Bayer Technology Services Gmbh | Verfahren zum Training von neuronalen Netzen |
JP4861087B2 (ja) * | 2006-07-31 | 2012-01-25 | 富士通株式会社 | 演算プログラム変換装置、演算プログラム変換プログラム、演算プログラム変換方法 |
CN109934331B (zh) * | 2016-04-29 | 2020-06-19 | 中科寒武纪科技股份有限公司 | 用于执行人工神经网络正向运算的装置和方法 |
CN106485316B (zh) * | 2016-10-31 | 2019-04-02 | 北京百度网讯科技有限公司 | 神经网络模型压缩方法以及装置 |
KR20190034985A (ko) * | 2017-09-25 | 2019-04-03 | 삼성전자주식회사 | 인공 신경망의 양자화 방법 및 장치 |
KR20190044878A (ko) * | 2017-10-23 | 2019-05-02 | 삼성전자주식회사 | 뉴럴 네트워크에서 파라미터를 처리하는 방법 및 장치 |
CN110059733A (zh) * | 2019-04-01 | 2019-07-26 | 苏州科达科技股份有限公司 | 卷积神经网络的优化及快速目标检测方法、装置 |
-
2019
- 2019-08-28 CN CN201910804627.5A patent/CN112446460A/zh active Pending
-
2020
- 2020-05-21 JP JP2020564843A patent/JP7034336B2/ja active Active
- 2020-05-21 EP EP20858900.2A patent/EP4024283A4/en active Pending
- 2020-05-21 WO PCT/CN2020/091578 patent/WO2021036362A1/zh unknown
-
2021
- 2021-12-17 US US17/554,521 patent/US20220108150A1/en active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012203566A (ja) | 2011-03-24 | 2012-10-22 | Seiko Epson Corp | 状態推定装置、電子機器及びプログラム |
CN107688855A (zh) | 2016-08-12 | 2018-02-13 | 北京深鉴科技有限公司 | 针对于复杂神经网络的分层量化方法与装置 |
US20180121789A1 (en) | 2016-11-03 | 2018-05-03 | Beijing Baidu Netcom Science And Technology Co., Ltd. | Data processing method and apparatus |
US20200234133A1 (en) | 2017-10-16 | 2020-07-23 | SZ DJI Technology Co., Ltd. | Data fixed-point method and device |
CN109993296A (zh) | 2019-04-01 | 2019-07-09 | 北京中科寒武纪科技有限公司 | 量化实现方法及相关产品 |
Also Published As
Publication number | Publication date |
---|---|
WO2021036362A1 (zh) | 2021-03-04 |
CN112446460A (zh) | 2021-03-05 |
EP4024283A1 (en) | 2022-07-06 |
JP2022502724A (ja) | 2022-01-11 |
US20220108150A1 (en) | 2022-04-07 |
EP4024283A4 (en) | 2023-09-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7034336B2 (ja) | データを処理するための方法、装置、および関連製品 | |
US20210157992A1 (en) | Information processing method and terminal device | |
CN111652368B (zh) | 一种数据处理方法及相关产品 | |
JP7146955B2 (ja) | データ処理方法、装置、コンピュータデバイス、及び記憶媒体 | |
JP7146954B2 (ja) | データ処理方法、装置、コンピュータデバイス、及び記憶媒体 | |
JP2022501676A (ja) | データ処理方法、装置、コンピュータデバイス、及び記憶媒体 | |
US11586601B2 (en) | Apparatus and method for representation of a sparse matrix in a neural network | |
US11763153B2 (en) | Method and apparatus with neural network operation | |
CN115860100A (zh) | 一种神经网络模型训练方法、装置及计算设备 | |
JP7060718B2 (ja) | データを処理するための方法、装置、及び関連製品 | |
WO2021082725A1 (zh) | Winograd卷积运算方法及相关产品 | |
JP7060719B2 (ja) | データを処理するための方法、装置、及び関連製品 | |
US20200074286A1 (en) | Neuromorphic method and apparatus with multi-bit neuromorphic operation | |
JP7146952B2 (ja) | データ処理方法、装置、コンピュータデバイス、及び記憶媒体 | |
CN113112009B (zh) | 用于神经网络数据量化的方法、装置和计算机可读存储介质 | |
CN114692865A (zh) | 一种神经网络量化训练方法、装置及相关产品 | |
WO2020054402A1 (ja) | ニューラルネットワーク処理装置、コンピュータプログラム、ニューラルネットワーク製造方法、ニューラルネットワークデータの製造方法、ニューラルネットワーク利用装置、及びニューラルネットワーク小規模化方法 | |
KR20200135117A (ko) | 압축 해제 장치 및 그 제어 방법 | |
WO2021082724A1 (zh) | 运算方法及相关产品 | |
CN114254746A (zh) | 执行神经网络的方法和设备 | |
CN113112008A (zh) | 用于神经网络数据量化的方法、装置和计算机可读存储介质 | |
CN113111997A (zh) | 用于神经网络数据量化的方法、装置和计算机可读存储介质 | |
CN116663640A (zh) | 用于剪枝的方法和设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20201119 Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20201116 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20201116 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220208 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220301 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7034336 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |