JP2021111082A - 演算装置、認識装置および制御装置 - Google Patents
演算装置、認識装置および制御装置 Download PDFInfo
- Publication number
- JP2021111082A JP2021111082A JP2020002022A JP2020002022A JP2021111082A JP 2021111082 A JP2021111082 A JP 2021111082A JP 2020002022 A JP2020002022 A JP 2020002022A JP 2020002022 A JP2020002022 A JP 2020002022A JP 2021111082 A JP2021111082 A JP 2021111082A
- Authority
- JP
- Japan
- Prior art keywords
- unit
- arithmetic unit
- calculation
- arithmetic
- output
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003860 storage Methods 0.000 claims abstract description 72
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 claims abstract description 52
- 238000013528 artificial neural network Methods 0.000 claims abstract description 7
- 238000004364 calculation method Methods 0.000 claims description 227
- 230000001186 cumulative effect Effects 0.000 abstract description 52
- 238000007792 addition Methods 0.000 description 54
- 238000000034 method Methods 0.000 description 35
- 230000006870 function Effects 0.000 description 29
- 238000013500 data storage Methods 0.000 description 28
- 230000008569 process Effects 0.000 description 27
- 230000004913 activation Effects 0.000 description 16
- 238000013527 convolutional neural network Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 5
- 238000013473 artificial intelligence Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 206010039203 Road traffic accident Diseases 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000002250 progressing effect Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F7/00—Methods or arrangements for processing data by operating upon the order or content of the data handled
- G06F7/38—Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation
- G06F7/48—Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices
- G06F7/499—Denomination or exception handling, e.g. rounding or overflow
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/15—Correlation function computation including computation of convolution operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/06—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
- G06N3/063—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using electronic means
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S17/00—Systems using the reflection or reradiation of electromagnetic waves other than radio waves, e.g. lidar systems
- G01S17/88—Lidar systems specially adapted for specific applications
- G01S17/93—Lidar systems specially adapted for specific applications for anti-collision purposes
- G01S17/931—Lidar systems specially adapted for specific applications for anti-collision purposes of land vehicles
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Pure & Applied Mathematics (AREA)
- Computational Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Algebra (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Neurology (AREA)
- Complex Calculations (AREA)
- Image Processing (AREA)
Abstract
Description
入力データに基づき所定の演算を行う第一の演算器と、前記第一の演算器の演算結果を用いて、所定の演算を行う第二の演算器とを有する数値演算部と、前記数値演算部の出力に対する丸め演算を行う丸め演算部と、前記丸め演算部での丸め演算で切り捨てられるビット数を格納したパラメータ格納部と、前記入力データ及び前記ビット数とに基づいて、前記第一の演算器および前記第二の演算器に対する演算停止の要否を判断し、当該判断の結果に応じて、停止信号を出力する演算停止信号生成部とを有する。また、本発明には、上記演算装置を利用した認識装置や制御装置も含まれる。さらに、演算装置、認識装置、制御装置それぞれを用いた方法も、本発明の一態様である。
入力データ格納レジスタ151
重みパラメータ格納レジスタ152
累積加算回数格納レジスタ153
切り捨てビット数格納レジスタ154
入力データMSB(Most Significant Bit)取得部155
重みパラメータMSB取得部156
しきい値計算部157
第一停止信号生成部251
第二停止信号生成部252
そして、演算停止信号生成部116は、入力データ104、重みパラメータ113、累積加算回数114および切り捨てビット数115とを入力し、第一停止信号117および第二停止信号118を出力する。なお、上記MSBは、入力データにおける有効データの最上位ビットを示す。
入力データ格納レジスタ151の入力データ格納レジスタ出力158
重みパラメータ格納レジスタ152の重みパラメータ格納レジスタ出力159
入力データMSB取得部155の入力データMSB取得部出力162
重みパラメータMSB取得部156の重みパラメータMSB取得部出力163
しきい値計算部157の出力であるしきい値ビット数164
そして、第一停止信号生成部251は、第一停止信号117を出力する。第二停止信号生成部252には第一停止信号117が入力され、第二停止信号118を出力する。
(数1)において、cは上記図3で説明した切り捨てビット数である161の値、xは上記累積加算回数である160の値、nは本実施例では2である。
入力データ格納レジスタ151からの入力データ格納レジスタ出力158
重みパラメータ格納レジスタ152の重みパラメータ格納レジスタ出力159
入力データMSB取得部155の入力データMSB取得部出力162
重みパラメータMSB取得部156の重みパラメータMSB取得部出力163
しきい値計算部157からのしきい値ビット数164
引き続き、図7を用いて、第一停止信号生成部251の接続関係を説明する。
I + W < D ・・・(数2)
次に、論理和演算部255では、数値比較部253からの4種類の数値比較部出力256と、しきい値判定部254からの4種類のしきい値判定部出力257の論理和を演算する。この結果、論理和演算部255は、停止対象の4種類の演算器(1)301のどれを停止するかを決定し、当該結果に応じて第一停止信号117を有効にする(出力する)。
102 メモリ
103 選択器
104 入力データ
105 畳み込み演算出力
106 認識結果
107 畳み込み演算部
108 学習データ保管部
109 パラメータ格納部
110 複数層の重みパラメータ
111 複数層の累積加算回数
112 複数層の切り捨てビット数
113 1層分の重みパラメータ
114 1層分の累積加算回数
115 1層分の切り捨てビット数
116 演算停止信号生成部
117 第一停止信号
118 第二停止信号
201 数値演算部
301 演算器(1)
305 個別入力データ
306 個別重みパラメータ
307 演算器(1)の出力
401 演算器(2)
403 演算器(2)の出力
501 丸め演算部
503 丸め演算部の出力
601 活性化関数演算部
701 内部演算器(1)
702 内部演算器(2)
703 内部演算器(1)の出力
704 累積加算結果格納レジスタの出力
705 累積加算結果格納レジスタ
706 内部演算器(2)の出力
707 出力レジスタ
801 第一の演算部
802 第二の演算部
803 演算器(1)の停止信号
901 演算器(2)の停止信号
151 入力データ格納レジスタ
152 重みパラメータ格納レジスタ
153 累積加算回数格納レジスタ
154 切り捨てビット数格納レジスタ
155 入力データMSB取得部
156 重みパラメータMSB取得部
157 しきい値計算部
158 入力データ格納レジスタ出力
159 重みパラメータ格納レジスタ出力
160 累積加算回数格納レジスタ出力
161 切り捨てビット数格納レジスタ出力
162 入力データMSB取得部出力
163 重みパラメータMSB取得部出力
164 しきい値ビット数
165 累積加算回数更新フラグ
166 入力データ更新フラグ
251 第一停止信号生成部
252 第二停止信号生成部
253 数値比較部
254 しきい値判定部
255 論理和演算部
256 数値比較部出力
257 しきい値判定部出力
351 クロック信号生成部
352 クロック信号
353 クロックバッファ
354 クロックバッファ
450 丸めデータ入力レジスタ
451 丸めデータ入力レジスタの出力
452 ビットセレクタ
453 ビットセレクタ出力
454 丸めデータ出力レジスタ
551 畳み込み演算部
751 クロック供給を受ける演算器(1)
851 クロック供給を受ける演算器(2)
951 クロック供給を受ける内部演算器(1)
952 クロック供給を受ける内部演算器(2)
953 クロック供給を受ける累積加算結果格納レジスタ
954 クロック供給を受ける出力レジスタ
Claims (13)
- 所定の演算を行う演算装置において、
入力データに基づき所定の演算を行う第一の演算器と、前記第一の演算器の演算結果を用いて、所定の演算を行う第二の演算器とを有する数値演算部と、
前記数値演算部の出力に対する丸め演算を行う丸め演算部と、
前記丸め演算部での丸め演算で切り捨てられるビット数を格納したパラメータ格納部と、
前記入力データ及び前記ビット数とに基づいて、前記第一の演算器および前記第二の演算器に対する演算停止の要否を判断し、当該判断の結果に応じて、停止信号を出力する演算停止信号生成部とを有することを特徴とする演算装置。 - 請求項1に記載の演算装置において、
前記演算停止信号生成部は、
前記入力データ及び前記ビット数を用いて、前記第一の演算器に対する演算停止の要否を判断し、当該判断の結果に応じて前記第二の演算器に対する演算停止の要否を判断することを特徴とする演算装置。 - 請求項2に記載の演算装置において、
前記演算停止信号生成部は、
前記第一の演算器に対する演算停止が必要と判断した場合に、前記第二の演算器に対する前記第二の演算器に対する演算停止の要否を判断することを特徴とする演算装置。 - 請求項3に記載の演算装置において、
前記演算停止信号生成部は、
前記入力データが、前記第一の演算器の演算結果が前記丸め演算部で丸めを行った場合のビット数が所定以下の場合に、前記第一の演算器に対する演算停止が必要と判断することを特徴する演算装置。 - 請求項4に記載の演算装置において、
前記演算停止信号生成部は、
前記第一の演算器に対する演算停止が必要と判断し、前記第一の演算器の演算結果が0の場合に、前記第二の演算器の演算を停止が必要と判断することを特徴とする演算装置。 - 請求項5に記載の演算装置において、
前記数値演算部は、前記入力データに基づき所定の演算を行う第三の演算器であって、前記第一の演算器と並列接続される第三の演算器をさらに有し、
前記演算停止信号生成部は、前記第一の演算器および前記第三の演算器に対する演算停止の要否の判断を独立に実行することを特徴とする演算装置。 - 請求項6に記載の演算装置において、
前記演算停止信号生成部は、
前記第一の演算器および前記第三の演算器のそれぞれに対する演算停止が必要と判断された場合、前記前記第二の演算器の演算を停止が必要と判断することを特徴とする演算装置。 - 請求項7に記載の演算装置において、
前記入力データは、入力画素およびニューラルネットワークの重みパラメータを含み、
前記第一の演算器は、前記入力データに対して乗算を行う乗算器であって、
前記第二の演算器は、前記乗算器の乗算結果を加算する加算器であることを特徴とする演算装置。 - 請求項8に記載の演算装置において、
前記演算停止信号生成部は、
前記第一の演算器および前記第三の演算器それぞれの出力データの最上位ビットであるMSBが、切り捨てビット数以下となる場合に前記第一の演算器および前記第三の演算器それぞれに対する演算停止が必要と判断することを特徴とする演算装置。 - 請求項8に記載の演算装置において、
前記演算停止信号生成部は、
前記入力画素のMSBと重みパラメータのMSBを用いて前記演算停止の要否を判断し、前記入力画素のMSBのビット位置の値および前記重みパラメータのMSBのビット位置の値足し算が切り捨てビット数より小さくなる場合に前記第一の演算器および前記第三の演算器それぞれに対する演算停止が必要と判断することを特徴とする演算装置。 - 請求項10に記載の演算装置において、
前記第一の演算器、前記第二の演算器および前記第三の演算器にクロック信号を供給するクロック信号生成部で生成されるクロック信号を供給するクロック信号停止部をさらに有し、
前記クロック信号停止部は、前記演算停止信号生成部から出力される前記停止信号に基づいて、前記第一の演算器、前記第二の演算器および前記第三の演算器に対するクロック信号の供給を停止することを特徴とする演算装置。 - 請求項1乃至11のいずれかに記載の演算装置により、
前記入力データとして、外界取得装置から取得される外界情報を用い、
前記外界情報を用いて、外界の状況を認識することを特徴とする認識装置。 - 請求項12に記載の認識装置を有し、
前記認識された外界の状況に応じて、前記所定の演算の結果を、対象に対する制御信号として出力することを特徴とする制御装置。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020002022A JP7304295B2 (ja) | 2020-01-09 | 2020-01-09 | 演算装置、認識装置および制御装置 |
PCT/JP2020/040917 WO2021140730A1 (ja) | 2020-01-09 | 2020-10-30 | 演算装置、認識装置および制御装置 |
US17/789,730 US20230067212A1 (en) | 2020-01-09 | 2020-10-30 | Computing device, recognition device, and control device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020002022A JP7304295B2 (ja) | 2020-01-09 | 2020-01-09 | 演算装置、認識装置および制御装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021111082A true JP2021111082A (ja) | 2021-08-02 |
JP7304295B2 JP7304295B2 (ja) | 2023-07-06 |
Family
ID=76787835
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020002022A Active JP7304295B2 (ja) | 2020-01-09 | 2020-01-09 | 演算装置、認識装置および制御装置 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20230067212A1 (ja) |
JP (1) | JP7304295B2 (ja) |
WO (1) | WO2021140730A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023119522A1 (ja) * | 2021-12-22 | 2023-06-29 | 日本電気株式会社 | スパース化対象層決定装置、スパース化対象層決定方法及び、プログラム |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11161472A (ja) * | 1997-11-28 | 1999-06-18 | Matsushita Electric Ind Co Ltd | ディジタル乗算装置 |
WO2018154648A1 (ja) * | 2017-02-22 | 2018-08-30 | 三菱電機株式会社 | デジタル演算処理回路 |
-
2020
- 2020-01-09 JP JP2020002022A patent/JP7304295B2/ja active Active
- 2020-10-30 US US17/789,730 patent/US20230067212A1/en active Pending
- 2020-10-30 WO PCT/JP2020/040917 patent/WO2021140730A1/ja active Application Filing
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11161472A (ja) * | 1997-11-28 | 1999-06-18 | Matsushita Electric Ind Co Ltd | ディジタル乗算装置 |
WO2018154648A1 (ja) * | 2017-02-22 | 2018-08-30 | 三菱電機株式会社 | デジタル演算処理回路 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023119522A1 (ja) * | 2021-12-22 | 2023-06-29 | 日本電気株式会社 | スパース化対象層決定装置、スパース化対象層決定方法及び、プログラム |
Also Published As
Publication number | Publication date |
---|---|
US20230067212A1 (en) | 2023-03-02 |
WO2021140730A1 (ja) | 2021-07-15 |
JP7304295B2 (ja) | 2023-07-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109478144B (zh) | 一种数据处理装置和方法 | |
US10460230B2 (en) | Reducing computations in a neural network | |
CN110799957B (zh) | 具有元数据致动的条件图执行的处理核心 | |
CN111353578A (zh) | 信息处理装置、神经网络程序和用于神经网络的处理方法 | |
JP2019139338A (ja) | 情報処理装置、情報処理方法、およびプログラム | |
US11537879B2 (en) | Neural network weight discretizing method, system, device, and readable storage medium | |
Kung et al. | A power-aware digital feedforward neural network platform with backpropagation driven approximate synapses | |
KR102655950B1 (ko) | 뉴럴 네트워크의 고속 처리 방법 및 그 방법을 이용한 장치 | |
US11561795B2 (en) | Accumulating data values and storing in first and second storage devices | |
CN110543936B (zh) | 一种cnn全连接层运算的多并行加速方法 | |
EP3444757A1 (en) | Discrete data representation supported device and method for forward operation of artificial neural network | |
US20180293486A1 (en) | Conditional graph execution based on prior simplified graph execution | |
CN109389208B (zh) | 数据的量化装置及量化方法 | |
CN112633477A (zh) | 一种基于现场可编程阵列的量化神经网络加速方法 | |
CN114626516A (zh) | 一种基于对数块浮点量化的神经网络加速系统 | |
JP7536574B2 (ja) | 演算デバイス、計算機システム、及び演算方法 | |
WO2021140730A1 (ja) | 演算装置、認識装置および制御装置 | |
EP3444758B1 (en) | Discrete data representation-supporting apparatus and method for back-training of artificial neural network | |
CN110955405A (zh) | 一种输入数据的处理及指数值获取方法、装置及电子设备 | |
Fuketa et al. | Image-classifier deep convolutional neural network training by 9-bit dedicated hardware to realize validation accuracy and energy efficiency superior to the half precision floating point format | |
US11551087B2 (en) | Information processor, information processing method, and storage medium | |
KR20220018199A (ko) | 희소성 데이터를 이용하는 연산 장치 및 그것의 동작 방법 | |
CN113516171B (zh) | 基于贝叶斯神经网络随机加法分解结构的图像分类方法 | |
CN112215349B (zh) | 基于数据流架构的稀疏卷积神经网络加速方法及装置 | |
US11847567B1 (en) | Loss-aware replication of neural network layers |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220526 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230328 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230403 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230530 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230626 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7304295 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |