JP6957365B2 - 演算装置 - Google Patents
演算装置 Download PDFInfo
- Publication number
- JP6957365B2 JP6957365B2 JP2018003972A JP2018003972A JP6957365B2 JP 6957365 B2 JP6957365 B2 JP 6957365B2 JP 2018003972 A JP2018003972 A JP 2018003972A JP 2018003972 A JP2018003972 A JP 2018003972A JP 6957365 B2 JP6957365 B2 JP 6957365B2
- Authority
- JP
- Japan
- Prior art keywords
- calculation
- unit
- memory
- feature map
- weight
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/26—Power supply means, e.g. regulation thereof
- G06F1/32—Means for saving power
- G06F1/3203—Power management, i.e. event-based initiation of a power-saving mode
- G06F1/3234—Power saving characterised by the action undertaken
- G06F1/325—Power saving in peripheral device
- G06F1/3275—Power saving in memory, e.g. RAM, cache
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F15/00—Digital computers in general; Data processing equipment in general
- G06F15/76—Architectures of general purpose stored program computers
- G06F15/78—Architectures of general purpose stored program computers comprising a single central processing unit
- G06F15/7807—System on chip, i.e. computer system on a single chip; System in package, i.e. computer system on one or more chips in a single package
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F15/00—Digital computers in general; Data processing equipment in general
- G06F15/76—Architectures of general purpose stored program computers
- G06F15/78—Architectures of general purpose stored program computers comprising a single central processing unit
- G06F15/7807—System on chip, i.e. computer system on a single chip; System in package, i.e. computer system on one or more chips in a single package
- G06F15/781—On-chip cache; Off-chip memory
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/06—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
- G06N3/063—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using electronic means
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Hardware Design (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Microelectronics & Electronic Packaging (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Neurology (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- Complex Calculations (AREA)
- Image Analysis (AREA)
Description
(構成)
以下、図面を参照して実施形態を説明する。
図3〜図7を用い、演算システム1の畳み込み演算Cvについて説明をする。図3〜図6は、第1の実施形態に係わる、演算システム1の畳み込み演算Cvの一例を説明するための説明図である。
Ic(B1)=w11×x11+w12×x12+・・・+w33×x33
=行列W1[w11,w12,・・・,w33]・行列X1a[x11,x12,・・・,x33] ・・・(1)
続いて、対応領域Cをx方向に1つスライドし(図6のハッチングされた領域)、数式(2)に示すように、領域B2に格納される中間演算結果Icが算出される。
Ic(B2)=w11×x12+w12×x13+・・・w33×x34
=行列W1[w11,w12,・・・,w33]・行列X1a[x12,x13,・・・,x34] ・・・(2)
すなわち、特徴マップX1内をxy方向に走査して対応領域Cを読み込み、演算素子M1〜M9による重み量W1との演算を行い、領域B1〜B9に中間演算結果Icが格納される。特徴マップX1の演算が終了すると、特徴マップX2内をxy方向に走査して対応領域Cを読み込み、重み量W1と演算を行う。同様に、特徴マップX3〜Xmについても、重み量W1との演算を行い、中間演算結果Icは、領域B1〜B9に累積加算される。図7の例に示すように、演算結果Y1は、重み量W1を用いた演算によって生成される。また、図8の例に示すように、演算結果Ynは、重み量Wnを用いた演算によって生成される。
演算システム1の全結合演算Fcについて説明をする。図10及び図11は、第1の実施形態に係わる、演算システム1の全結合演算Fcの一例を説明するための説明図である。
第1の実施形態では、演算装置3は、メモリ2から読み込まれた重み量W及び特徴マップXの全てについて演算を行うが、重み量Wに0値が含まれるときに0値の演算を省略してもよい。本変形例の説明では、他の実施形態又は変形例と同じ構成については、説明を省略する。
第1の実施形態及び変形例では、演算指示部11は、畳み込み演算Cvにおいて、特徴マップX内におけるxy方向の走査を行った後、z方向にスライドし、次のxy方向の走査を行うように構成されるが、z方向に走査を行った後、x方向又はy方向のいずれか一方向にスライドし、次のz方向の走査を行うように構成しても構わない。本実施形態の説明では、他の実施形態又は変形例と同じ構成については、説明を省略する。
第1、第2の実施形態及び第1の実施形態の変形例では、演算種類は、畳み込み演算Cv及び全結合演算Fcによって構成されるが、走査方向の異なる演算によって構成されても構わない。本変形例の説明では、他の実施形態又は変形例と同じ構成については、説明を省略する。
続いて、第3の実施形態について、説明をする。本実施形態の説明では、他の実施形態又は変形例と同じ構成については、説明を省略する。
図16〜図18は、第3の実施形態に係わる、演算システム1の畳み込み演算Cvの一例を説明するための説明図である。
Ic(1,1,1,1)=W(1,1,1,1)×X(1,1,1)+W(1,1,1,2)×X(1,1,2)+W(1,1,1,3)×X(1,1,3)+W(1,1,2,1)×X(1,2,1)+・・・+W(1,1,3,3)×X(1,3,3) ・・・(3)
数式(4)は、特徴マップXの対応領域Cをx方向に1つスライドさせた例を示す。数式(4)の例では、重み行列W(1,1,1〜3,1〜3)と特徴マップX(1,2〜4,2〜4)の畳み込み演算Cvが行われ、第1セット、第1チャネル、第1行、及び、第2列の中間演算結果Ic(1,1,1,2)が算出される。算出された中間演算結果Ic(1,1,1,2)は、領域B2に格納される。
Ic(1,1,1,2)=W(1,1,1,1)×X(1,1,2)+W(1,1,1,2)×X(1,1,3)+W(1,1,1,3)×X(1,1,4)
+W(1,1,2,1)×X(1,2,2)+・・・+W(1,1,3,3)×X(1,3,4) ・・・(4)
図17に示すように、演算部21は、特徴マップX内をxy方向に走査し、中間演算結果Ic(u=1,z=1,y=1〜h,x=1〜w)を算出し、xy座標に応じた領域B1〜Bkのいずれかに中間演算結果Icを格納する。
Y(1,1,1)={Ic(1,1,1,1)+Ic(1,2,1,1)+・・・+(1,m,1,1)} ・・・(5)
Y(1,1,2)={Ic(1,1,1,2)+Ic(1,2,1,2)+・・・+(1,m,1,2)} ・・・(6)
Y(1,h,w)={Ic(1,1,h,w)+Ic(1,2,h,w)+・・・+(1,m,h,w)} ・・・(7)
図17の例では、領域B1に演算結果Y(1,1,1)が生成され、領域B2に演算結果Y(1,1,2)が生成され、領域Bkに演算結果Y(1,h,w)が生成される。
演算システム1の全結合演算Fcについて説明をする。図20及び図21は、第3の実施形態に係わる、演算システム1の全結合演算Fcの一例を説明するための説明図である。
第3の実施形態では、演算装置3は、メモリ2から読み込まれた重み行列W及び特徴マップXの全てについて演算を行うが、重み行列Wに0値が含まれるときに0値の演算を省略してもよい。本変形例の説明では、実施形態と同じ構成については、説明を省略する。
実施形態及び変形例では、演算指示部11は、畳み込み演算Cvにおいて、特徴マップX内におけるxy方向の走査を行った後、z方向にスライドし、次のxy方向の走査を行うように構成されるが、z方向に走査を行った後、x方向又はy方向のいずれか一方向にスライドし、次のz方向の走査を行うように構成しても構わない。本実施形態の説明では、他の実施形態又は変形例と同じ構成については、説明を省略する。
実施形態及び変形例では、演算種類は、畳み込み演算Cv及び全結合演算Fcによって構成されるが、走査方向の異なる演算によって構成されても構わない。本変形例の説明では、他の実施形態又は変形例と同じ構成については、説明を省略する。
Claims (5)
- 第1演算又は第2演算のいずれか一方の演算種類に応じた重み量と特徴量をメモリから読み込み、読み込まれた前記重み量と前記特徴量に対応する前記演算種類の演算指示を行う演算指示部と、
前記演算指示に応じ、前記メモリから読み込まれた前記重み量と前記特徴量を用いた演算を行い、中間演算結果を出力する演算部と、
前記中間演算結果を格納するバッファと、
前記演算種類に応じ、前記中間演算結果を格納する前記バッファ内の領域の指示を行う格納領域指示部と、
を有し、
前記演算指示部は、前記演算部からの前記中間演算結果と前記バッファに格納させた前記中間演算結果との積算結果により前記バッファに格納された前記中間演算結果を更新させると共に、前記演算指示に基づく所定の演算が終了すると前記バッファに格納されている前記中間演算結果を演算結果として前記メモリに記憶させる演算装置。 - 前記第1演算は、畳み込み演算であり、
前記第2演算は、全結合演算である、
請求項1に記載の演算装置。 - 前記演算指示部は、前記畳み込み演算において、前記重み量に対応した特徴マップXの対応領域の前記特徴量をメモリから読み込む、請求項2に記載の演算装置。
- 前記演算指示部は、重み量圧縮部及び特徴量圧縮部を有し、
前記重み量圧縮部は、前記重み量に含まれる0値を削除することによって前記重み量を圧縮し、圧縮位置の情報である圧縮位置情報を出力し、
前記特徴量圧縮部は、前記圧縮位置情報に応じて前記特徴量に含まれる値を削除することによって前記特徴量を圧縮する、
請求項1に記載の演算装置。 - 前記演算部は、前記重み量を要素とする行列と前記特徴量を要素とする行列との演算によって前記中間演算結果を得る、請求項1に記載の演算装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US15/923,521 US10558386B2 (en) | 2017-09-22 | 2018-03-16 | Operation device and operation system |
EP18162305.9A EP3460724A1 (en) | 2017-09-22 | 2018-03-16 | Operation device and operation system |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017182766 | 2017-09-22 | ||
JP2017182766 | 2017-09-22 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019061641A JP2019061641A (ja) | 2019-04-18 |
JP6957365B2 true JP6957365B2 (ja) | 2021-11-02 |
Family
ID=65864491
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018003972A Active JP6957365B2 (ja) | 2017-09-22 | 2018-01-15 | 演算装置 |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP6957365B2 (ja) |
CN (1) | CN109557996B (ja) |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7028271B2 (en) * | 2002-11-06 | 2006-04-11 | Canon Kabushiki Kaisha | Hierarchical processing apparatus |
US20160358069A1 (en) * | 2015-06-03 | 2016-12-08 | Samsung Electronics Co., Ltd. | Neural network suppression |
CN105260776B (zh) * | 2015-09-10 | 2018-03-27 | 华为技术有限公司 | 神经网络处理器和卷积神经网络处理器 |
US11475269B2 (en) * | 2015-12-15 | 2022-10-18 | Analog Devices, Inc. | Convolutional neural network |
CN106203621B (zh) * | 2016-07-11 | 2019-04-30 | 北京深鉴智能科技有限公司 | 用于卷积神经网络计算的处理器 |
CN106529670B (zh) * | 2016-10-27 | 2019-01-25 | 中国科学院计算技术研究所 | 一种基于权重压缩的神经网络处理器、设计方法、芯片 |
CN106447034B (zh) * | 2016-10-27 | 2019-07-30 | 中国科学院计算技术研究所 | 一种基于数据压缩的神经网络处理器、设计方法、芯片 |
-
2018
- 2018-01-15 JP JP2018003972A patent/JP6957365B2/ja active Active
- 2018-02-27 CN CN201810161068.6A patent/CN109557996B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN109557996B (zh) | 2022-12-02 |
CN109557996A (zh) | 2019-04-02 |
JP2019061641A (ja) | 2019-04-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3460724A1 (en) | Operation device and operation system | |
CN107610146B (zh) | 图像场景分割方法、装置、电子设备及计算机存储介质 | |
CN109064428B (zh) | 一种图像去噪处理方法、终端设备及计算机可读存储介质 | |
US9411726B2 (en) | Low power computation architecture | |
US20200327079A1 (en) | Data processing method and device, dma controller, and computer readable storage medium | |
CN108717571B (zh) | 一种用于人工智能的加速方法和装置 | |
US8368713B2 (en) | Figure drawing device and method | |
EP1406213A1 (en) | Information processor | |
CN107590811B (zh) | 基于场景分割的风景图像处理方法、装置及计算设备 | |
JP2021530770A (ja) | ビデオ処理方法、装置及びコンピュータ記憶媒体 | |
CN106780336B (zh) | 一种图像缩小方法及装置 | |
US20200218777A1 (en) | Signal Processing Method and Apparatus | |
US20200394516A1 (en) | Filter processing device and method of performing convolution operation at filter processing device | |
US20210117762A1 (en) | Arithmetic processing device | |
JP2021528726A (ja) | ポイントクラウドデータの処理方法、装置、電子機器及び記憶媒体 | |
JP6957365B2 (ja) | 演算装置 | |
JP2017027314A (ja) | 並列演算装置、画像処理装置及び並列演算方法 | |
US8938133B2 (en) | Image resizing apparatus and method that interpolates image blocks with abuttal regions | |
CN107622498B (zh) | 基于场景分割的图像穿越处理方法、装置及计算设备 | |
JPWO2019077933A1 (ja) | 演算回路および演算方法 | |
EP3680827B1 (en) | Information processing apparatus and memory control method | |
CN110930290B (zh) | 一种数据处理方法及装置 | |
CN113469880A (zh) | 图像拼接方法及装置、存储介质及电子设备 | |
CN113420604A (zh) | 多人姿态估计方法、装置和电子设备 | |
JP6910622B2 (ja) | 画像処理システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20191008 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200127 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20201216 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210126 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20210329 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210419 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210907 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20211006 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6957365 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |