JP7379821B2 - 推論処理装置および推論処理方法 - Google Patents
推論処理装置および推論処理方法 Download PDFInfo
- Publication number
- JP7379821B2 JP7379821B2 JP2019001590A JP2019001590A JP7379821B2 JP 7379821 B2 JP7379821 B2 JP 7379821B2 JP 2019001590 A JP2019001590 A JP 2019001590A JP 2019001590 A JP2019001590 A JP 2019001590A JP 7379821 B2 JP7379821 B2 JP 7379821B2
- Authority
- JP
- Japan
- Prior art keywords
- inference
- input data
- processing device
- data
- batch
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012545 processing Methods 0.000 title claims description 189
- 238000003672 processing method Methods 0.000 title claims description 6
- 238000004364 calculation method Methods 0.000 claims description 186
- 239000011159 matrix material Substances 0.000 claims description 94
- 238000013528 artificial neural network Methods 0.000 claims description 43
- 230000006870 function Effects 0.000 claims description 34
- 230000015654 memory Effects 0.000 claims description 29
- 230000004913 activation Effects 0.000 claims description 22
- 238000000034 method Methods 0.000 claims description 21
- 238000006243 chemical reaction Methods 0.000 claims description 12
- 238000010923 batch production Methods 0.000 claims description 10
- 238000010586 diagram Methods 0.000 description 20
- 238000004891 communication Methods 0.000 description 18
- 238000012546 transfer Methods 0.000 description 16
- 238000003062 neural network model Methods 0.000 description 14
- 230000000694 effects Effects 0.000 description 4
- 238000007667 floating Methods 0.000 description 4
- 238000013527 convolutional neural network Methods 0.000 description 3
- 238000013500 data storage Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 102000005717 Myeloma Proteins Human genes 0.000 description 2
- 108010045503 Myeloma Proteins Proteins 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013499 data model Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 235000019800 disodium phosphate Nutrition 0.000 description 1
- 230000020169 heat generation Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 229940050561 matrix product Drugs 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/06—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
- G06N3/063—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using electronic means
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Neurology (AREA)
- Feedback Control In General (AREA)
- Image Analysis (AREA)
- Complex Calculations (AREA)
Description
図1は、本発明の第1の実施の形態に係る推論処理装置1の構成を示すブロック図である。本実施の形態に係る推論処理装置1は、図1に示すように、外部のセンサ2などから取得された音声データや言語データなどの時系列データ、または画像データを推論対象の入力データXとして用いる。推論処理装置1は、学習済みのニューラルネットワークモデルを用いてニューラルネットワークの演算をバッチ処理し、入力データXの特徴を推論する。
推論処理装置1は、図1に示すように、バッチ処理制御部10、メモリ制御部11、記憶部12、および推論演算部13を備える。
入力データ格納部120には、外部のセンサ2から取得された時系列データなどの入力データXが格納される。
次に、上述した構成を有する推論処理装置1のハードウェア構成の一例について図5を参照して説明する。
次に、本実施の形態に係る推論処理装置1による入力データXの推論処理の概要について、図7Aおよび図7Bに示す具体例を用いて説明する。
次に、本実施の形態に係る推論処理装置1の動作について、図8および図9のフローチャートを参照してより詳細に説明する。以下の説明では、記憶部12には、予め学習が行われて構築されたニューラルネットワークの重みデータWが格納されているものとする。また、外部のセンサ2によって測定された時系列データや画像データなどの入力データXは、記憶部12に保持されるものとする。
次に、本発明の第2の実施の形態について説明する。なお、以下の説明では、上述した第1の実施の形態と同じ構成については同一の符号を付し、その説明を省略する。
図13は、本実施の形態に係る推論処理装置1Aの構成を示すブロック図である。
推論処理装置1Aは、バッチ処理制御部10、メモリ制御部11、記憶部12、推論演算部13、およびデータタイプ変換部(データ変換部)14を備える。
次に、上述した構成を有する推論処理装置1Aの動作について、図14のフローチャートを参照して説明する。以下の説明では、記憶部12には、予め学習が行われて構築されたニューラルネットワークの重みデータWが格納されているものとする。また、重みデータWと、センサ2から取得されて記憶部12に記憶されている入力データXとは、ともに32ビットの浮動小数点型のデータであるものとする。
次に、本発明の第3の実施の形態について説明する。なお、以下の説明では、上述した第1および第2の実施の形態と同じ構成については同一の符号を付し、その説明を省略する。
次に、本発明の第4の実施の形態について説明する。なお、以下の説明では、上述した第1から第3の実施の形態と同じ構成については同一の符号を付し、その説明を省略する。
次に、本発明の第5の実施の形態について説明する。なお、以下の説明では、上述した第1から第4の実施の形態と同じ構成については同一の符号を付し、その説明を省略する。
次に、本発明の第6の実施の形態について説明する。なお、以下の説明では、上述した第1から第5の実施の形態と同じ構成については同一の符号を付し、その説明を省略する。
Claims (8)
- 1個1個がニューラルネットワークの推論対象となる複数個の入力データと、前記ニューラルネットワークの重みと、を記憶する主記憶装置と、
プログラムを実行することで、前記入力データに関する情報に基づいて1回のバッチ処理で扱う前記入力データの個数であるバッチサイズを設定する処理と、前記主記憶装置から、設定した前記バッチサイズに応じた前記個数の入力データ、及び、当該個数の入力データのそれぞれに共通して使用される前記重みを、推論演算部にまとめて転送する処理と、を行うプロセッサと、
前記推論演算部として機能し、転送された前記個数の入力データおよび前記重みに基づいて、前記個数の入力データ1個1個と前記重みとの前記ニューラルネットワークの各演算をバッチ処理して、前記個数の入力データ1個1個の特徴を推論するFPGA又はASICと
を備える推論処理装置。 - 請求項1に記載の推論処理装置において、
前記プロセッサは、前記FPGA又はASICのハードウェアリソースに関する情報に基づいて、前記バッチサイズを設定することを特徴とする推論処理装置。 - 請求項1または請求項2に記載の推論処理装置において、
前記推論演算部は、
前記入力データと前記重みとの行列演算を行う行列演算部と、
前記行列演算部による行列演算結果に対して活性化関数を適用する活性化関数演算部とを備え、
前記行列演算部は、
前記入力データと前記重みとを乗算する乗算器と、
前記乗算器による乗算結果を加算する加算器とを有する
ことを特徴とする推論処理装置。 - 請求項3に記載の推論処理装置において、
前記行列演算部は、複数具備され、行列演算を並列に行うことを特徴とする推論処理装置。 - 請求項3または請求項4に記載の推論処理装置において、
前記行列演算部は、前記乗算器および前記加算器をそれぞれ複数具備し、乗算および加算を並列に行うことを特徴とする推論処理装置。 - 請求項1から5のいずれか1項に記載の推論処理装置において、
前記推論演算部に入力される前記入力データおよび前記重みのデータタイプを変換するデータ変換部をさらに備えることを特徴とする推論処理装置。 - 請求項1から6のいずれか1項に記載の推論処理装置において、
前記推論演算部は、複数具備され、推論演算を並列に行うことを特徴とする推論処理装置。 - プロセッサが、プログラムを実行することで、主記憶装置に記憶された1個1個がニューラルネットワークの推論対象となる複数個の入力データに関する情報に基づいて1回のバッチ処理で扱う前記入力データの個数であるバッチサイズを設定する処理と、前記主記憶装置から、設定した前記バッチサイズに応じた前記個数の入力データ、及び、当該個数の入力データのそれぞれに共通して使用される前記ニューラルネットワークの重みを、推論演算部にまとめて転送する処理と、を行う第1ステップと、
FPGA又はASICが、前記推論演算部として機能することで、転送された前記個数の入力データおよび前記重みに基づいて、前記個数の入力データ1個1個と前記重みとの前記ニューラルネットワークの各演算をバッチ処理して、前記個数の入力データ1個1個の特徴を推論する第2ステップと
を備える推論処理方法。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019001590A JP7379821B2 (ja) | 2019-01-09 | 2019-01-09 | 推論処理装置および推論処理方法 |
PCT/JP2019/050832 WO2020145146A1 (ja) | 2019-01-09 | 2019-12-25 | 推論処理装置および推論処理方法 |
US17/293,736 US20210406655A1 (en) | 2019-01-09 | 2019-12-25 | Inference processing device and inference processing method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019001590A JP7379821B2 (ja) | 2019-01-09 | 2019-01-09 | 推論処理装置および推論処理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020112901A JP2020112901A (ja) | 2020-07-27 |
JP7379821B2 true JP7379821B2 (ja) | 2023-11-15 |
Family
ID=71520421
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019001590A Active JP7379821B2 (ja) | 2019-01-09 | 2019-01-09 | 推論処理装置および推論処理方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20210406655A1 (ja) |
JP (1) | JP7379821B2 (ja) |
WO (1) | WO2020145146A1 (ja) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11809908B2 (en) | 2020-07-07 | 2023-11-07 | SambaNova Systems, Inc. | Runtime virtualization of reconfigurable data flow resources |
US11782729B2 (en) | 2020-08-18 | 2023-10-10 | SambaNova Systems, Inc. | Runtime patching of configuration files |
US11182221B1 (en) | 2020-12-18 | 2021-11-23 | SambaNova Systems, Inc. | Inter-node buffer-based streaming for reconfigurable processor-as-a-service (RPaaS) |
US11392740B2 (en) | 2020-12-18 | 2022-07-19 | SambaNova Systems, Inc. | Dataflow function offload to reconfigurable processors |
US11237880B1 (en) | 2020-12-18 | 2022-02-01 | SambaNova Systems, Inc. | Dataflow all-reduce for reconfigurable processor systems |
US11782760B2 (en) | 2021-02-25 | 2023-10-10 | SambaNova Systems, Inc. | Time-multiplexed use of reconfigurable hardware |
US11200096B1 (en) | 2021-03-26 | 2021-12-14 | SambaNova Systems, Inc. | Resource allocation for reconfigurable processors |
US11544548B2 (en) * | 2021-05-24 | 2023-01-03 | Rebellions Inc. | Processing element and neural processing device including same |
KR102590993B1 (ko) * | 2021-09-03 | 2023-10-19 | 한국전자기술연구원 | 적응형 배치 프로세싱 방법 및 시스템 |
CN114118389B (zh) * | 2022-01-28 | 2022-05-10 | 深圳鲲云信息科技有限公司 | 神经网络数据处理方法、设备及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017073000A1 (ja) | 2015-10-29 | 2017-05-04 | 株式会社Preferred Networks | 情報処理装置及び情報処理方法 |
CN107330515A (zh) | 2016-04-29 | 2017-11-07 | 北京中科寒武纪科技有限公司 | 一种用于执行人工神经网络正向运算的装置和方法 |
US20180373976A1 (en) | 2017-05-19 | 2018-12-27 | Google Llc | Scheduling neural network processing |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018173814A (ja) * | 2017-03-31 | 2018-11-08 | 富士通株式会社 | 画像処理装置、画像処理方法、画像処理プログラム、及び教師データ生成方法 |
-
2019
- 2019-01-09 JP JP2019001590A patent/JP7379821B2/ja active Active
- 2019-12-25 US US17/293,736 patent/US20210406655A1/en active Pending
- 2019-12-25 WO PCT/JP2019/050832 patent/WO2020145146A1/ja active Application Filing
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017073000A1 (ja) | 2015-10-29 | 2017-05-04 | 株式会社Preferred Networks | 情報処理装置及び情報処理方法 |
CN107330515A (zh) | 2016-04-29 | 2017-11-07 | 北京中科寒武纪科技有限公司 | 一种用于执行人工神经网络正向运算的装置和方法 |
US20180373976A1 (en) | 2017-05-19 | 2018-12-27 | Google Llc | Scheduling neural network processing |
Non-Patent Citations (2)
Title |
---|
竹中 慎治,スーパーコンピュータを活用したディープラーニング分散学習の高効率開発基盤,パナソニック技報 [5月号] MAY 2018 Vol.64 No.1 [online] ,2018年05月15日,第64巻,pp.39-44 |
西川 由理,一般物体検出YOLOの分散深層学習による性能評価,情報処理学会 研究報告 ハイパフォーマンスコンピューティング(HPC) 2018-HPC-166 [online] ,日本,情報処理学会,2018年09月20日 |
Also Published As
Publication number | Publication date |
---|---|
US20210406655A1 (en) | 2021-12-30 |
JP2020112901A (ja) | 2020-07-27 |
WO2020145146A1 (ja) | 2020-07-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7379821B2 (ja) | 推論処理装置および推論処理方法 | |
KR102516092B1 (ko) | 신경망 프로세서의 벡터 컴퓨테이션 유닛 | |
CN112162723B (zh) | 一种量子减法运算方法、装置、电子装置及存储介质 | |
US8995756B2 (en) | 3D vision processing | |
CN112114776A (zh) | 一种量子乘法运算方法、装置、电子装置及存储介质 | |
WO2020074989A1 (en) | Data representation for dynamic precision in neural network cores | |
CN108363559B (zh) | 神经网络的乘法处理方法、设备和计算机可读介质 | |
CN113177209B (zh) | 基于深度学习的加密流量分类方法及相关设备 | |
CN113222150B (zh) | 一种量子态的变换方法及装置 | |
CN111767986A (zh) | 一种基于神经网络的运算方法及装置 | |
JP2023084094A (ja) | 面積高効率畳み込みブロック | |
JP7215572B2 (ja) | 推論処理装置および推論処理方法 | |
CN112214200A (zh) | 一种量子减法运算方法、装置、电子装置及存储介质 | |
CN114819168A (zh) | 一种矩阵特征值的量子比较方法及装置 | |
Strempfer et al. | Designing a streaming data coalescing architecture for scientific detector ASICs with variable data velocity | |
CN112561050A (zh) | 一种神经网络模型训练方法及装置 | |
CN115879530A (zh) | 一种面向rram存内计算系统阵列结构优化的方法 | |
TW202311984A (zh) | 用於具有不同的精度之按位元乘法之混合信號電路 | |
JP7226541B2 (ja) | 推論処理装置および推論処理方法 | |
Luo et al. | DeepBurning-MixQ: An open source mixed-precision neural network accelerator design framework for FPGAs | |
CN113495717A (zh) | 神经网络装置、操作神经网络装置的方法和应用处理器 | |
Pan et al. | Hierarchical resampling algorithm and architecture for distributed particle filters | |
Wei et al. | Fpga design of real-time mdfd system using high level synthesis | |
CN115358391B (zh) | 神经网络的规模拓展方法、装置、电子设备及存储介质 | |
CN111324860B (zh) | 一种基于随机矩阵逼近的轻量级cnn计算方法与装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210511 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220802 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20220928 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221129 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230404 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20230529 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230615 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231003 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20231016 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7379821 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |