JP7322620B2 - 情報処理装置、情報処理方法および情報処理プログラム - Google Patents
情報処理装置、情報処理方法および情報処理プログラム Download PDFInfo
- Publication number
- JP7322620B2 JP7322620B2 JP2019167657A JP2019167657A JP7322620B2 JP 7322620 B2 JP7322620 B2 JP 7322620B2 JP 2019167657 A JP2019167657 A JP 2019167657A JP 2019167657 A JP2019167657 A JP 2019167657A JP 7322620 B2 JP7322620 B2 JP 7322620B2
- Authority
- JP
- Japan
- Prior art keywords
- bit
- neural network
- information processing
- variables
- recognition rate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/06—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
- G06N3/063—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using electronic means
Description
量子化誤差=(a1・b1+a2・b2)-(a3・b1+a3・b2)+(a10・b10+a11・b11)-(a9・b10+a9・b11) ‥(1)
式(1)において、"・"は、積を示し、第1項および第2項は、飽和誤差を示し、第3項および第4項は丸め誤差を示す。そして、例えば、算出された変数毎の量子化誤差の平均値が算出され、閾値と比較する量子化誤差に決定される。
(付記1)
プロセッサを有する情報処理装置であって、
前記プロセッサは、
ニューラルネットワークで使用する複数種の変数の少なくともいずれかについて、量子化後の複数のビット範囲を決定し、
前記複数種の変数を含み、前記複数種の変数の少なくともいずれかのビット範囲が異なる複数の変数グループの各々を使用して前記ニューラルネットワークの認識率を算出し、
算出された複数の前記認識率のうち最大の認識率の前記変数グループを前記ニューラルネットワークの計算に使用することを決定する、情報処理装置。
(付記2)
前記プロセッサは、グループ決定期間と計算実行期間とを含む複数の計算サイクルに分けて、前記ニューラルネットワークの計算を実行し、
前記認識率を算出するステップおよび前記最大の認識率の前記変数グループを決定するステップは、前記グループ決定期間に動作し、
前記複数の計算サイクルの各々において、前記グループ決定期間に決定した前記変数グループを使用して前記計算実行期間の計算を実行する、付記1に記載の情報処理装置。
(付記3)
前記ビット範囲を決定するステップは、前記複数のビット範囲の決定対象の変数を固定小数点数で表した場合の最上位ビットの分布に基づいて、前記分布の最上位ビット側から前記複数のビット範囲を決定する、付記1または付記2に記載の情報処理装置。
(付記4)
前記ビット範囲を決定するステップは、前記最上位ビットの分布の有効範囲内において、前記分布の最上位ビット側から前記複数のビット範囲を決定する、付記3に記載の情報処理装置。
(付記5)
前記プロセッサは、前記複数のビット範囲の決定対象の前記変数について、複数通りのビット範囲で量子化する場合の量子化誤差をそれぞれ算出し、
前記ビット範囲を決定するステップは、算出された前記量子化誤差が小さい順に、前記分布の最上位ビット側から前記複数のビット範囲を決定する、付記3または付記4に記載の情報処理装置。
(付記6)
前記プロセッサは、前記ニューラルネットワークの計算により算出された前記複数種の変数のうち、前記複数のビット範囲の決定対象の前記変数の前記最上位ビットの分布を取得する、付記3ないし付記5のいずれか1項に記載の情報処理装置。
(付記7)
前記プロセッサは、決定された前記最大の認識率の前記変数グループを使用して、前記ニューラルネットワークの学習を実行する、付記1ないし付記6のいずれか1項に記載の情報処理装置。
(付記8)
前記複数種の変数は、重み、活性および勾配を含む、付記7に記載の情報処理装置。
(付記9)
前記プロセッサは、決定された前記最大の認識率の前記変数グループを使用して、前記ニューラルネットワークの推論を実行する、付記1ないし付記6のいずれか1項に記載の情報処理装置。
(付記10)
ニューラルネットワークで使用する複数種の変数の少なくともいずれかについて、量子化後の複数のビット範囲を決定し、
前記複数種の変数を含み、前記複数種の変数の少なくともいずれかのビット範囲が異なる複数の変数グループの各々を使用して前記ニューラルネットワークの認識率を算出し、
算出された複数の前記認識率のうち最大の認識率の前記変数グループを前記ニューラルネットワークの計算に使用することを決定する、処理を情報処理装置が有するプロセッサに実行させる情報処理方法。
(付記11)
ニューラルネットワークで使用する複数種の変数の少なくともいずれかについて、量子化後の複数のビット範囲を決定し、
前記複数種の変数を含み、前記複数種の変数の少なくともいずれかのビット範囲が異なる複数の変数グループの各々を使用して前記ニューラルネットワークの認識率を算出し、
算出した複数の前記認識率のうち最大の認識率の前記変数グループを前記ニューラルネットワークの計算に使用することを決定する、処理を情報処理装置が有するプロセッサに実行させる情報処理プログラム。
11 統計情報取得部
12 ビット範囲決定部
13 量子化誤差算出部
14 認識率算出部
16 変数決定部
20 メモリ
30 アクセラレータ
40 通信バス
50 補助記憶装置
60 通信インタフェース
70 入出力インタフェース
80 記録媒体
100、100A 情報処理装置
Claims (7)
- プロセッサを有する情報処理装置であって、
前記プロセッサは、
ニューラルネットワークで使用する複数種の変数の少なくともいずれかの変数を固定小数点数で表した場合の最上位ビットの分布に基づいて、前記分布の最上位ビット側から量子化後の複数のビット範囲を決定し、
前記複数種の変数を含み、前記複数種の変数の少なくともいずれかのビット範囲が異なる複数の変数グループの各々を使用して前記ニューラルネットワークの認識率を算出し、
算出された複数の前記認識率のうち最大の認識率の前記変数グループを前記ニューラルネットワークの計算に使用することを決定する、情報処理装置。 - 前記プロセッサは、グループ決定期間と計算実行期間とを含む複数の計算サイクルに分けて、前記ニューラルネットワークの計算を実行し、
前記認識率を算出するステップおよび前記最大の認識率の前記変数グループを決定するステップは、前記グループ決定期間に動作し、
前記複数の計算サイクルの各々において、前記グループ決定期間に決定した前記変数グループを使用して前記計算実行期間の計算を実行する、請求項1に記載の情報処理装置。 - 前記プロセッサは、前記複数のビット範囲の決定対象の前記変数について、複数通りのビット範囲で量子化する場合の量子化誤差をそれぞれ算出し、
前記ビット範囲を決定するステップは、算出された前記量子化誤差が小さい順に、前記分布の最上位ビット側から前記複数のビット範囲を決定する、請求項1または請求項2に記載の情報処理装置。 - 前記プロセッサは、決定された前記最大の認識率の前記変数グループを使用して、前記ニューラルネットワークの学習を実行する、請求項1ないし請求項3のいずれか1項に記載の情報処理装置。
- 前記プロセッサは、決定された前記最大の認識率の前記変数グループを使用して、前記ニューラルネットワークの推論を実行する、請求項1ないし請求項3のいずれか1項に記載の情報処理装置。
- ニューラルネットワークで使用する複数種の変数の少なくともいずれかの変数を固定小数点数で表した場合の最上位ビットの分布に基づいて、前記分布の最上位ビット側から量子化後の複数のビット範囲を決定し、
前記複数種の変数を含み、前記複数種の変数の少なくともいずれかのビット範囲が異なる複数の変数グループの各々を使用して前記ニューラルネットワークの認識率を算出し、
算出した複数の前記認識率のうち最大の認識率の前記変数グループを前記ニューラルネットワークの計算に使用することを決定する、処理を情報処理装置が有するプロセッサに実行させる情報処理方法。 - ニューラルネットワークで使用する複数種の変数の少なくともいずれかの変数を固定小数点数で表した場合の最上位ビットの分布に基づいて、前記分布の最上位ビット側から量量子化後の複数のビット範囲を決定し、
前記複数種の変数を含み、前記複数種の変数の少なくともいずれかのビット範囲が異なる複数の変数グループの各々を使用して前記ニューラルネットワークの認識率を算出し、
算出した複数の前記認識率のうち最大の認識率の前記変数グループを前記ニューラルネットワークの計算に使用することを決定する、処理を情報処理装置が有するプロセッサに実行させる情報処理プログラム。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019167657A JP7322620B2 (ja) | 2019-09-13 | 2019-09-13 | 情報処理装置、情報処理方法および情報処理プログラム |
EP20192763.9A EP3796233A1 (en) | 2019-09-13 | 2020-08-25 | Information processing device and method, and program |
US17/002,814 US20210081785A1 (en) | 2019-09-13 | 2020-08-26 | Information processing device and method, and recording medium storing information processing program |
CN202010908955.2A CN112508166A (zh) | 2019-09-13 | 2020-09-02 | 信息处理装置和方法以及存储信息处理程序的记录介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019167657A JP7322620B2 (ja) | 2019-09-13 | 2019-09-13 | 情報処理装置、情報処理方法および情報処理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021043906A JP2021043906A (ja) | 2021-03-18 |
JP7322620B2 true JP7322620B2 (ja) | 2023-08-08 |
Family
ID=72242957
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019167657A Active JP7322620B2 (ja) | 2019-09-13 | 2019-09-13 | 情報処理装置、情報処理方法および情報処理プログラム |
Country Status (4)
Country | Link |
---|---|
US (1) | US20210081785A1 (ja) |
EP (1) | EP3796233A1 (ja) |
JP (1) | JP7322620B2 (ja) |
CN (1) | CN112508166A (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20210156538A (ko) * | 2020-06-18 | 2021-12-27 | 삼성전자주식회사 | 뉴럴 네트워크를 이용한 데이터 처리 방법 및 데이터 처리 장치 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6528893B1 (ja) | 2018-11-07 | 2019-06-12 | 富士通株式会社 | 学習プログラム、学習方法、情報処理装置 |
JP2019148896A (ja) | 2018-02-26 | 2019-09-05 | 富士通株式会社 | 演算処理装置、情報処理装置、情報処理方法、およびプログラム |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FI107483B (fi) * | 1999-10-22 | 2001-08-15 | Nokia Mobile Phones Ltd | Järjestely ja menetelmä sanan pituuden rajoittamiseksi |
DE10318830B4 (de) * | 2003-04-25 | 2005-05-12 | Infineon Technologies Ag | Verfahren und Auswertung einer Bitfehlerratenmessung zur Angabe einer Kanalqualität |
US7711062B2 (en) * | 2006-12-29 | 2010-05-04 | Intel Corporation | Decoding methods and apparatus for MIMO communication systems |
WO2012137617A1 (ja) * | 2011-04-05 | 2012-10-11 | 日本電信電話株式会社 | 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体 |
JP2012221187A (ja) * | 2011-04-08 | 2012-11-12 | Fujitsu Ltd | 演算回路、演算処理装置、及び演算回路の制御方法 |
US9088323B2 (en) * | 2013-01-09 | 2015-07-21 | Lg Electronics Inc. | Method and apparatus for reporting downlink channel state |
JP6561877B2 (ja) | 2016-03-01 | 2019-08-21 | 株式会社デンソー | 演算処理装置 |
US11222263B2 (en) * | 2016-07-28 | 2022-01-11 | Samsung Electronics Co., Ltd. | Neural network method and apparatus |
CN108268947A (zh) * | 2016-12-30 | 2018-07-10 | 富士通株式会社 | 用于提高神经网络的处理速度的装置和方法及其应用 |
KR102601604B1 (ko) * | 2017-08-04 | 2023-11-13 | 삼성전자주식회사 | 뉴럴 네트워크의 파라미터들을 양자화하는 방법 및 장치 |
KR20190044878A (ko) * | 2017-10-23 | 2019-05-02 | 삼성전자주식회사 | 뉴럴 네트워크에서 파라미터를 처리하는 방법 및 장치 |
US10474430B2 (en) * | 2017-12-29 | 2019-11-12 | Facebook, Inc. | Mixed-precision processing elements, systems, and methods for computational models |
US11348009B2 (en) * | 2018-09-24 | 2022-05-31 | Samsung Electronics Co., Ltd. | Non-uniform quantization of pre-trained deep neural network |
US20200302283A1 (en) * | 2019-03-18 | 2020-09-24 | Microsoft Technology Licensing, Llc | Mixed precision training of an artificial neural network |
CN110210619A (zh) * | 2019-05-22 | 2019-09-06 | 上海商汤智能科技有限公司 | 神经网络的训练方法及装置、电子设备和存储介质 |
JP2021111081A (ja) * | 2020-01-09 | 2021-08-02 | 富士通株式会社 | 情報処理装置、ニューラルネットワークの演算プログラム及びニューラルネットワークの演算方法 |
-
2019
- 2019-09-13 JP JP2019167657A patent/JP7322620B2/ja active Active
-
2020
- 2020-08-25 EP EP20192763.9A patent/EP3796233A1/en not_active Withdrawn
- 2020-08-26 US US17/002,814 patent/US20210081785A1/en not_active Abandoned
- 2020-09-02 CN CN202010908955.2A patent/CN112508166A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019148896A (ja) | 2018-02-26 | 2019-09-05 | 富士通株式会社 | 演算処理装置、情報処理装置、情報処理方法、およびプログラム |
JP6528893B1 (ja) | 2018-11-07 | 2019-06-12 | 富士通株式会社 | 学習プログラム、学習方法、情報処理装置 |
Non-Patent Citations (1)
Title |
---|
ZHOU, Shuchang et al.,DoReFa-Net: Training Low Bitwidth Convolutional Neural Networks with Low Bitwidth Gradients,arXiv.org [online],米国,arXiv.org,2018年02月02日,第1頁-第13頁,[検索日 2023.3.6], インターネット:<URL: https://arxiv.org/pdf/1606.06160v3.pdf> |
Also Published As
Publication number | Publication date |
---|---|
US20210081785A1 (en) | 2021-03-18 |
JP2021043906A (ja) | 2021-03-18 |
CN112508166A (zh) | 2021-03-16 |
EP3796233A1 (en) | 2021-03-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7349835B2 (ja) | ニューラルネットワークにおいてパラメータを処理する方法及び装置 | |
TWI791610B (zh) | 對人工神經網路及浮點神經網路進行量化的方法及裝置 | |
JP2019164793A5 (ja) | ||
KR20190043849A (ko) | 뉴럴 네트워크의 파라미터를 양자화하는 장치 및 방법 | |
JP2019079535A (ja) | パラメータ処理方法及び装置 | |
CN109697048B (zh) | 在神经网络中生成随机性 | |
JP2019139338A (ja) | 情報処理装置、情報処理方法、およびプログラム | |
JP7292297B2 (ja) | 確率的丸めロジック | |
JP7294017B2 (ja) | 情報処理装置、情報処理方法および情報処理プログラム | |
JP7322620B2 (ja) | 情報処理装置、情報処理方法および情報処理プログラム | |
US20210097397A1 (en) | Information processing apparatus and information processing method | |
CN104412512B (zh) | 编码装置、解码装置、编码方法以及解码方法 | |
JP2020201646A (ja) | 演算処理装置、制御方法、及び制御プログラム | |
US20210216867A1 (en) | Information processing apparatus, neural network computation program, and neural network computation method | |
US20220318611A1 (en) | Data processing | |
JP2019075003A (ja) | 近似計算装置、近似計算方法及びプログラム | |
KR102243119B1 (ko) | 가변 정밀도 양자화 장치 및 방법 | |
CN111814955A (zh) | 神经网络模型的量化方法、设备及计算机存储介质 | |
CN111985604A (zh) | 运算处理设备、用于控制运算处理设备的方法和存储介质 | |
CN112561050A (zh) | 一种神经网络模型训练方法及装置 | |
JP7298266B2 (ja) | 情報処理装置、情報処理方法および情報処理プログラム | |
EP3792836A1 (en) | Information processing apparatus, method of processing information, and information processing program | |
JP2023069780A (ja) | 演算プログラム、演算方法及び計算機 | |
JP2023174473A (ja) | 深層学習ネットワーク用の最適化方法及びコンピュータ装置、及びコンピュータ可読記憶媒体 | |
JP2022141513A (ja) | 演算装置、共通演算設定装置、演算方法、共通演算設定方法およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220609 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230308 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230314 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230511 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230627 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230710 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7322620 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |