JP6747305B2 - データ処理装置及びニューラルネットワークシステム - Google Patents
データ処理装置及びニューラルネットワークシステム Download PDFInfo
- Publication number
- JP6747305B2 JP6747305B2 JP2017006059A JP2017006059A JP6747305B2 JP 6747305 B2 JP6747305 B2 JP 6747305B2 JP 2017006059 A JP2017006059 A JP 2017006059A JP 2017006059 A JP2017006059 A JP 2017006059A JP 6747305 B2 JP6747305 B2 JP 6747305B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- unit
- signal
- input
- processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000013528 artificial neural network Methods 0.000 title claims description 10
- 230000015654 memory Effects 0.000 claims description 43
- 238000007781 pre-processing Methods 0.000 claims description 19
- 238000000034 method Methods 0.000 claims description 11
- 230000008569 process Effects 0.000 claims description 10
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 claims description 2
- 230000006870 function Effects 0.000 description 28
- 238000000605 extraction Methods 0.000 description 22
- 238000010586 diagram Methods 0.000 description 19
- 239000000872 buffer Substances 0.000 description 18
- 238000004364 calculation method Methods 0.000 description 16
- 238000006243 chemical reaction Methods 0.000 description 14
- 238000011176 pooling Methods 0.000 description 13
- 238000009825 accumulation Methods 0.000 description 10
- 238000001994 activation Methods 0.000 description 9
- 238000013527 convolutional neural network Methods 0.000 description 8
- 230000004913 activation Effects 0.000 description 7
- 230000000630 rising effect Effects 0.000 description 4
- 238000001514 detection method Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 239000002131 composite material Substances 0.000 description 2
- 230000001186 cumulative effect Effects 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000011144 upstream manufacturing Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000012447 hatching Effects 0.000 description 1
- XEBWQGVWTUSTLN-UHFFFAOYSA-M phenylmercury acetate Chemical compound CC(=O)O[Hg]C1=CC=CC=C1 XEBWQGVWTUSTLN-UHFFFAOYSA-M 0.000 description 1
Images
Landscapes
- Image Processing (AREA)
- Complex Calculations (AREA)
Description
図1には、詳しくは後述するデータ処理装置10に適用されるニューラルネットワーク、この場合、畳み込みニューラルネットワークの構成を概念的に示している。畳み込みニューラルネットワークNは、入力データである画像データD1から所定の形状やパターンを認識する画像認識技術に応用されるものであり、中間層Naと全結合層Nbとを有する。中間層Naは、複数の特徴量抽出処理層Na1,Na2…が階層的に接続された構成である。各特徴量抽出処理層Na1,Na2…は、それぞれ畳み込み層Cおよびプーリング層Pを備える。
図5に例示するデータ処理装置10は、複数の演算ブロック11、複数の中継部12及び13、複数のデータ保持部14、複数のインタフェース部15などを備える。データ処理装置10は、1つの演算ブロック11、RD中継部12及びWR中継部13、1つのデータ保持部14により1つの演算処理ユニット16を構成している。そして、データ処理装置10は、複数の演算処理ユニット16を列状に配列した構成となっている。なお、説明の便宜上、図の下側を上位側、図の上側を下位側と定義する。また、演算処理ユニット16は、それぞれインタフェース部15を介してインターコネクト部17に接続されている。インターコネクト部17は、データ処理装置10の外部に設けられた外部メモリ18に接続されている。
尚、上記先行出願では、図7〜図10において「累積」,「非累積:パラレル」,「分散」,「非分散:パラレル」の4つの動作例が示されているが、本実施形態のデータ処理装置10においてもこれらの動作は同様に可能である。
PE0:データ0x0,4,8,c
PE1:データ0x1,5,9,d
PE2:データ0x2,6,a,e
PE3:データ0x3,7,b,f
のみが、それぞれに対応するRD中継部12によりピックアップされて読み込まれるようになる。
以下、第1実施形態と同一部分には同一符号を付して説明を省略し、異なる部分について説明する。第2実施形態はデータ処理装置を、畳込み処理後の画像サイズが変わらないように、画像データにパディングを行う場合に対応させたものである。例えば図24に示すように、先頭の4ビットのピクセルをそれぞれ2回読出し、それに合わせてEN信号は2ビット幅で生成出力する。これにより、図示しないRD中継部12Pが、図25に示すように、5ビットの通常画素Dの両端に、1ビットのパディング画素Pをそれぞれ追加する。
図27に示す基準EN生成部41cは、図24に示すタイミングチャートに対応する基準EN信号を生成するもので、第1実施形態の構成に、加算器42〜44,乗算器45,カウンタ46,比較ロジック部47〜50,NORゲート51及びORゲート52を加えている。
in_image_width=8
pixel_skip=3
pad_size=1
となる。
第3実施形態は、外部メモリ18における画像データの配置が、図28に示すように、
アドレス0:データA〜Dの繰り返し
アドレス1:データE〜Hの繰り返し
アドレス2:データI〜Lの繰り返し
アドレス3:データM〜Pの繰り返し
アドレス4:データA〜Dの繰り返し
…
アドレス7:データM〜Pの繰り返し
となるように配置されているものとする。このような画像データの処理効率を高めるようにデータ処理装置51を構成する。
図30に示す第4実施形態のRD中継部12Aは、第1実施形態のRD中継部12におけるEN生成部12eをフリップフロップに置き換えたものである。第1実施形態のようにパディングを行わず、EN信号のハイレベル期間が全て等しくなる場合には、フリップフロップ12eによりクロック同期をとって中継するのみで必要十分である。したがって、RD中継部12Aがより簡単に構成できる。
畳込み演算の処理対象は、画像データに限ることはない。
データ処理装置によって、必ずしもニューラルネットワークを構成する必要は無い。
本開示は、実施例に準拠して記述されたが、本開示は当該実施例や構造に限定されるものではないと理解される。本開示は、様々な変形例や均等範囲内の変形をも包含する。加えて、様々な組み合わせや形態、さらには、それらに一要素のみ、それ以上、あるいはそれ以下、を含む他の組み合わせや形態をも、本開示の範疇や思想範囲に入るものである。
Claims (4)
- 階層的に接続された複数の処理層に対応して、それぞれ畳込み演算を実行する複数の演算ブロック(11)と、
前記複数の演算ブロックとそれぞれ対をなして配置され、前記複数の演算ブロックに入力されるデータ,及び前記複数の演算ブロックが出力するデータを保持する複数のデータ保持部(14)と、
外部メモリ(18)と前記複数のデータ保持部との間に配置され、入力されるデータを中継して、前記複数のデータ保持部に出力する複数の読出し中継部(12,12P,12A)と、
前記複数の演算ブロックと前記複数のデータ保持部との間に配置され、前記複数の演算ブロックが出力するデータを中継して、前記複数のデータ保持部に出力する複数の書込み中継部(13)と、
前記外部メモリより読出されたシリアルデータにおいて、対応する演算ブロックが処理対象とするデータを示す有効信号を周期的に出力する信号出力部(12e,15c,41c)とを備え、
前記読出し中継部は、前記外部メモリより読出されたデータ,又は自身よりも上位側に位置する読出し中継部より出力されたデータがシリアルに入力されると、前記有効信号に基づいて取込んだデータを一定の処理単位毎に纏める前処理を行い、対応するデータ保持部又は自身よりも下位側に位置する読出し中継部に出力するデータ処理装置。 - 前記読出し中継部(12P)は、対応する演算ブロックが処理単位とするデータ列の両端に位置するデータを複数ビット連続して出力するパディング処理を行い、
前記信号出力部(41c)は、前記有効信号がアクティブとなる期間を、処理対象とするデータが出力される期間に応じて可変設定する請求項1記載のデータ処理装置。 - 前記複数の演算ブロックとそれぞれ対をなして配置され、前記複数の演算ブロックが外部メモリから読込むデータをパラレル/シリアル変換すると、当該シリアルデータにおいて対応する演算ブロックが処理対象とするデータを示す基準有効信号を周期的に出力する複数のインタフェース部(15,41)を備え、
前記信号出力部は、前記インタフェース部に配置され、基準有効信号を発生する基準信号発生部(15c,41c)と、
前記読出し中継部に配置され、前記基準有効信号又は自身よりも上位側に位置する読出し中継部より入力された有効信号を、自身よりも下位側に位置する読出し中継部に対し、クロック同期により出力する信号中継部(12e)とを備える請求項1又は2記載のデータ処理装置。 - 請求項1から3の何れか一項に記載のデータ処理装置を備えて構成されるニューラルネットワークシステム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017006059A JP6747305B2 (ja) | 2017-01-17 | 2017-01-17 | データ処理装置及びニューラルネットワークシステム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017006059A JP6747305B2 (ja) | 2017-01-17 | 2017-01-17 | データ処理装置及びニューラルネットワークシステム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018116419A JP2018116419A (ja) | 2018-07-26 |
JP6747305B2 true JP6747305B2 (ja) | 2020-08-26 |
Family
ID=62984148
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017006059A Active JP6747305B2 (ja) | 2017-01-17 | 2017-01-17 | データ処理装置及びニューラルネットワークシステム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6747305B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7162956B2 (ja) * | 2019-09-02 | 2022-10-31 | 株式会社デンソー | データ処理装置及びプログラム |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0567060A (ja) * | 1991-08-02 | 1993-03-19 | Iizeru Robotsuto Vision:Kk | ニユーロデバイス |
JPH0652132A (ja) * | 1992-07-28 | 1994-02-25 | Mitsubishi Electric Corp | 並列演算半導体集積回路装置およびそれを用いたシステム |
JPH0756605A (ja) * | 1993-08-17 | 1995-03-03 | Komatsu Ltd | 制御装置の制御パラメータ調整装置 |
JP5376920B2 (ja) * | 2008-12-04 | 2013-12-25 | キヤノン株式会社 | コンボリューション演算回路、階層的コンボリューション演算回路及び物体認識装置 |
-
2017
- 2017-01-17 JP JP2017006059A patent/JP6747305B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2018116419A (ja) | 2018-07-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6645252B2 (ja) | 演算処理装置 | |
JP5376920B2 (ja) | コンボリューション演算回路、階層的コンボリューション演算回路及び物体認識装置 | |
JP6945986B2 (ja) | 演算回路、その制御方法及びプログラム | |
CN109784489B (zh) | 基于fpga的卷积神经网络ip核 | |
US20210117810A1 (en) | On-chip code breakpoint debugging method, on-chip processor, and chip breakpoint debugging system | |
CN108665063B (zh) | 用于bnn硬件加速器的双向并行处理卷积加速系统 | |
JP6365258B2 (ja) | 演算処理装置 | |
CN107844832A (zh) | 一种信息处理方法及相关产品 | |
CN107633297B (zh) | 一种基于并行快速fir滤波器算法的卷积神经网络硬件加速器 | |
US20210019594A1 (en) | Convolutional neural network accelerating device and method | |
WO2019136764A1 (zh) | 卷积器及其所应用的人工智能处理装置 | |
JP6945987B2 (ja) | 演算回路、その制御方法及びプログラム | |
JP6684951B2 (ja) | 人工知能推論演算装置 | |
WO2019216376A1 (ja) | 演算処理装置 | |
CN112905530B (zh) | 片上架构、池化计算加速器阵列、单元以及控制方法 | |
CN111582465B (zh) | 基于fpga的卷积神经网络加速处理系统、方法以及终端 | |
JP2020068027A (ja) | アンサンブル学習ベースの画像分類システム | |
CN117217274B (zh) | 向量处理器、神经网络加速器、芯片及电子设备 | |
CN115221102A (zh) | 用于优化片上系统的卷积运算操作的方法和相关产品 | |
CN114462587B (zh) | 一种用于光电混合计算神经网络的fpga实现方法 | |
JP6747305B2 (ja) | データ処理装置及びニューラルネットワークシステム | |
US20220113944A1 (en) | Arithmetic processing device | |
CN111028136A (zh) | 一种人工智能处理器处理二维复数矩阵的方法和设备 | |
JP6631262B2 (ja) | 演算処理装置 | |
KR102667134B1 (ko) | 싱글포트 메모리를 포함하는 신경망 하드웨어 가속기 및 그 동작 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190626 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200529 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200707 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200720 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6747305 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |