JP2020506454A - ハードウェアにおける平均プーリングの実行 - Google Patents
ハードウェアにおける平均プーリングの実行 Download PDFInfo
- Publication number
- JP2020506454A JP2020506454A JP2019531384A JP2019531384A JP2020506454A JP 2020506454 A JP2020506454 A JP 2020506454A JP 2019531384 A JP2019531384 A JP 2019531384A JP 2019531384 A JP2019531384 A JP 2019531384A JP 2020506454 A JP2020506454 A JP 2020506454A
- Authority
- JP
- Japan
- Prior art keywords
- tensor
- input
- neural network
- elements
- hardware circuit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/06—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
- G06N3/063—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using electronic means
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Neurology (AREA)
- Image Analysis (AREA)
- Complex Calculations (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
- Advance Control (AREA)
Abstract
Description
本明細書は、ハードウェアにおけるニューラルネットワーク推論の計算に関する。
概して、本明細書はニューラルネットワーク推論を計算する専用ハードウェア回路について説明する。
複数の層を有するニューラルネットワークを用いて推論を計算することができる。たとえば、入力が与えられると、ニューラルネットワークはその入力に対する推論を計算することができる。ニューラルネットワークは、ニューラルネットワークの各層を通って入力を処理することによって、この推論を計算する。各層は入力を受け取り、その層に対する重みのセットに従って入力を処理して出力を生成する。
Claims (20)
- 平均プーリングニューラルネットワーク層を含むニューラルネットワークをハードウェア回路上で処理することを求める要求を受けることと、
それに応じて命令を生成することとを含み、前記命令は、前記ハードウェア回路によって実行されると、前記ハードウェア回路に、前記ニューラルネットワークによるネットワーク入力の処理中に、演算を実行することによって前記平均プーリングニューラルネットワーク層の出力に相当する層出力テンソルを生成させ、
前記演算は、
前記平均プーリングニューラルネットワーク層に対する入力テンソルと、カーネルとの畳み込みを実行することにより、第1のテンソルを生成することを含み、前記カーネルは、前記平均プーリングニューラルネットワーク層のウィンドウに等しいサイズを有し、各々が恒等行列である要素で構成されており、
前記演算は、さらに、
前記第1のテンソルの各要素を、前記平均プーリングニューラルネットワーク層のウィンドウ内の要素の数で除算することによって初期出力テンソルを生成させる演算を実行することを含む、方法。 - 前記演算は、前記初期出力テンソルのエッジ要素を第1のスケーリングファクタによってリスケーリングし、前記初期出力テンソルのコーナー要素を第2のスケーリングファクタによってリスケーリングすることにより、出力テンソルを生成することをさらに含む、請求項1に記載の方法。
- 前記第1のスケーリングファクタは、前記第1のテンソルのエッジ要素を生成するために前記畳み込みを実行する際に前記カーネルの要素で乗算される前記入力テンソルの要素の数に基づいており、前記第2のスケーリングファクタは、前記第1のテンソルのコーナー要素を生成するために前記畳み込みを実行する際に前記カーネルの要素で乗算される前記入力テンソルの要素の数に基づいている、請求項2に記載の方法。
- 前記演算は、前記第1のテンソルのエッジに隣接する要素を第3のスケーリングファクタによってリスケーリングし、前記第1のテンソルのコーナーに隣接する要素を第4のスケーリングファクタによってリスケーリングすることにより、前記出力テンソルを生成することをさらに含む、請求項1に記載の方法。
- 前記入力テンソルとカーネルとの畳み込みを実行することによって第1のテンソルを生成することは、
前記入力テンソルにゼロを埋め込むことによってゼロ埋込み入力テンソルを生成することと、
前記ゼロ埋込み入力テンソルと前記カーネルとの畳み込みを実行することによって前記第1のテンソルを生成することとを含む、請求項1に記載の方法。 - 前記第1のテンソルの各要素を前記平均プーリングニューラルネットワーク層のウィンドウ内の要素の数で除算することによって初期出力テンソルを生成させる演算を実行することは、
第1のファクタによる、前記第1のテンソルの各要素の第1の乗算を実行することを含み、前記第1のファクタは、
(i)出力テンソルのコーナー要素を生成するために畳み込みを実行する際に、前記平均プーリングニューラルネットワーク層のウィンドウに等しいサイズを有するカーネルの要素で乗算される、入力テンソルの要素の数と、
(ii)出力テンソルのエッジ要素を生成するために畳み込みを実行する際に、前記平均プーリングニューラルネットワーク層のウィンドウに等しいサイズを有するカーネルの要素で乗算される、入力テンソルの要素の数と、
(iii)前記平均プーリングニューラルネットワーク層のウィンドウの要素の数との最小公倍数であり、
1つ以上の第2のファクタによる、前記第1のテンソルの各要素の第2の乗算を実行することを含み、各第2のファクタは、前記第1のテンソルの対応する要素を生成するために前記畳み込みを実行する際に前記カーネルの要素で乗算される前記入力テンソルの要素の数に基づいている、請求項1に記載の方法。 - 前記第1の乗算の実行結果の要素のビット分解能は、前記第1のテンソルの要素のビット分解能よりも高い、請求項6に記載の方法。
- 前記第1のテンソルの各要素を前記平均プーリングニューラルネットワーク層のウィンドウ内の要素の数で除算することによって初期出力テンソルを生成させる演算を実行することは、
マスキングテンソルを生成することを含み、前記マスキングテンソルのサイズは、前記入力テンソルのサイズによって決まり、前記マスキングテンソルの要素は、前記平均プーリングニューラルネットワーク層のウィンドウのサイズによって決まり、
前記第1のテンソルの各要素と、前記マスキングテンソルの対応する各要素との、要素ごとの乗算を実行することを含む、請求項1に記載の方法。 - 前記マスキングテンソルを生成することは、メモリに格納されている1つ以上のマスキングテンソルフラグメントをタイリングすることを含む、請求項8に記載の方法。
- 前記入力テンソルは、前記ハードウェア回路のユニファイドバッファに格納され、前記マスキングテンソルは、前記ハードウェア回路のダイナミックメモリに格納され、
前記第1のテンソルの各要素を前記平均プーリングニューラルネットワーク層のウィンドウ内の要素の数で除算することによって初期出力テンソルを生成させる演算を実行することは、
前記入力テンソルを、前記ユニファイドバッファから、ハードウェアで実現される前記ハードウェア回路の行列計算ユニットに送ることと、
前記マスキングテンソルを、前記ダイナミックメモリから、前記ハードウェア回路の前記行列計算ユニットに送ることと、
前記ハードウェア回路の前記行列計算ユニットにより、前記入力テンソルと前記マスキングテンソルとの、要素ごとの乗算を実行することによって前記第1のテンソルを生成することとを含む、請求項8に記載の方法。 - 前記入力テンソルは、前記ハードウェア回路のユニファイドバッファに格納され、前記カーネルは、前記ハードウェア回路のダイナミックメモリに格納され、
前記入力テンソルと前記カーネルとの畳み込みを実行することにより、前記第1のテンソルを生成することは、
前記入力テンソルを、前記ユニファイドバッファから、ハードウェアで実現される前記ハードウェア回路の行列計算ユニットに送ることと、
前記カーネルを、前記ダイナミックメモリから、前記ハードウェア回路の前記行列計算ユニットに送ることと、
前記ハードウェア回路の前記行列計算ユニットにより、前記入力テンソルと前記カーネルとの畳み込みを実行することによって前記第1のテンソルを生成することとを含む、請求項1に記載の方法。 - 前記畳み込みを実行すること、および、前記第1のテンソルの各要素を除算するための演算を実行することとは、整数レジスタに格納された値に対する固定小数点演算として実行される、請求項1に記載の方法。
- システムであって、
ハードウェア回路と、
1つ以上の記憶装置とを備え、前記記憶装置は、ハードウェア回路によって実行されると前記ハードウェア回路に演算を実行させるように機能することが可能な命令を格納しており、前記演算は、
平均プーリングニューラルネットワーク層に対する入力テンソルと、カーネルとの畳み込みを実行することにより、第1のテンソルを生成することを含み、前記カーネルは、前記平均プーリングニューラルネットワーク層のウィンドウに等しいサイズを有し、各々が恒等行列である要素で構成されており、
前記演算は、さらに、
前記第1のテンソルの各要素を、前記平均プーリングニューラルネットワーク層のウィンドウ内の要素の数で除算することによって初期出力テンソルを生成させる演算を実行することを含む、システム。 - 前記演算は、前記初期出力テンソルのエッジ要素を第1のスケーリングファクタによってリスケーリングし、前記初期出力テンソルのコーナー要素を第2のスケーリングファクタによってリスケーリングすることにより、出力テンソルを生成することをさらに含む、請求項13に記載のシステム。
- 前記第1のスケーリングファクタは、前記第1のテンソルのエッジ要素を生成するために前記畳み込みを実行する際に前記カーネルの要素で乗算される前記入力テンソルの要素の数に基づいており、前記第2のスケーリングファクタは、前記第1のテンソルのコーナー要素を生成するために前記畳み込みを実行する際に前記カーネルの要素で乗算される前記入力テンソルの要素の数に基づいている、請求項14に記載のシステム。
- 前記演算は、前記第1のテンソルのエッジに隣接する要素を第3のスケーリングファクタによってリスケーリングし、前記第1のテンソルのコーナーに隣接する要素を第4のスケーリングファクタによってリスケーリングすることにより、前記出力テンソルを生成することをさらに含む、請求項13に記載のシステム。
- 前記入力テンソルとカーネルとの畳み込みを実行することによって第1のテンソルを生成することは、
前記入力テンソルにゼロを埋め込むことによってゼロ埋込み入力テンソルを生成することと、
前記ゼロ埋込み入力テンソルと前記カーネルとの畳み込みを実行することによって前記第1のテンソルを生成することとを含む、請求項13に記載のシステム。 - 前記第1のテンソルの各要素を前記平均プーリングニューラルネットワーク層のウィンドウ内の要素の数で除算することによって初期出力テンソルを生成させる演算を実行することは、
マスキングテンソルを生成することを含み、前記マスキングテンソルのサイズは、前記入力テンソルのサイズによって決まり、前記マスキングテンソルの要素は、前記平均プーリングニューラルネットワーク層のウィンドウのサイズによって決まり、
前記第1のテンソルの各要素と、前記マスキングテンソルの対応する各要素との、要素ごとの乗算を実行することを含む、請求項13に記載のシステム。 - 前記入力テンソルは、前記ハードウェア回路のユニファイドバッファに格納され、前記マスキングテンソルは、前記ハードウェア回路のダイナミックメモリに格納され、
前記第1のテンソルの各要素を前記平均プーリングニューラルネットワーク層のウィンドウ内の要素の数で除算することによって初期出力テンソルを生成させる演算を実行することは、
前記入力テンソルを、前記ユニファイドバッファから、ハードウェアで実現される前記ハードウェア回路の行列計算ユニットに送ることと、
前記マスキングテンソルを、前記ダイナミックメモリから、前記ハードウェア回路の前記行列計算ユニットに送ることと、
前記ハードウェア回路の前記行列計算ユニットにより、前記入力テンソルと前記マスキングテンソルとの、要素ごとの乗算を実行することによって前記第1のテンソルを生成することとを含む、請求項18に記載のシステム。 - 前記入力テンソルは、前記ハードウェア回路のユニファイドバッファに格納され、前記カーネルは、前記ハードウェア回路のダイナミックメモリに格納され、
前記入力テンソルと前記カーネルとの畳み込みを実行することにより、前記第1のテンソルを生成することは、
前記入力テンソルを、前記ユニファイドバッファから、ハードウェアで実現される前記ハードウェア回路の行列計算ユニットに送ることと、
前記カーネルを、前記ダイナミックメモリから、前記ハードウェア回路の前記行列計算ユニットに送ることと、
前記ハードウェア回路の前記行列計算ユニットにより、前記入力テンソルと前記カーネルとの畳み込みを実行することによって前記第1のテンソルを生成することとを含む、請求項13に記載のシステム。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US15/377,196 | 2016-12-13 | ||
US15/377,196 US10032110B2 (en) | 2016-12-13 | 2016-12-13 | Performing average pooling in hardware |
US15/467,294 US10037490B2 (en) | 2016-12-13 | 2017-03-23 | Performing average pooling in hardware |
US15/467,294 | 2017-03-23 | ||
PCT/US2017/048017 WO2018111357A1 (en) | 2016-12-13 | 2017-08-22 | Performing average pooling in hardware |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020506454A true JP2020506454A (ja) | 2020-02-27 |
JP6900487B2 JP6900487B2 (ja) | 2021-07-07 |
Family
ID=59746363
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019531384A Active JP6900487B2 (ja) | 2016-12-13 | 2017-08-22 | ハードウェアにおける平均プーリングの実行 |
Country Status (12)
Country | Link |
---|---|
US (3) | US10037490B2 (ja) |
EP (2) | EP4369255A1 (ja) |
JP (1) | JP6900487B2 (ja) |
KR (2) | KR102315346B1 (ja) |
CN (2) | CN108615072B (ja) |
DE (2) | DE202017105528U1 (ja) |
DK (1) | DK3555814T3 (ja) |
FI (1) | FI3555814T3 (ja) |
GB (1) | GB2557703B (ja) |
IE (3) | IE20170187A1 (ja) |
SG (2) | SG10201805259XA (ja) |
WO (1) | WO2018111357A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022014141A1 (ja) * | 2020-07-17 | 2022-01-20 | ソニーセミコンダクタソリューションズ株式会社 | 固体撮像素子、撮像装置、および、情報処理システム |
Families Citing this family (45)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10175980B2 (en) | 2016-10-27 | 2019-01-08 | Google Llc | Neural network compute tile |
US9959498B1 (en) | 2016-10-27 | 2018-05-01 | Google Llc | Neural network instruction set architecture |
US10360163B2 (en) | 2016-10-27 | 2019-07-23 | Google Llc | Exploiting input data sparsity in neural network compute units |
US10037490B2 (en) | 2016-12-13 | 2018-07-31 | Google Llc | Performing average pooling in hardware |
EP3596660A1 (en) * | 2017-03-24 | 2020-01-22 | Huawei Technologies Co., Ltd. | Neural network data processing apparatus and method |
US11010338B2 (en) * | 2017-04-06 | 2021-05-18 | Shanghai Cambricon Information Technology Co., Ltd | Data screening device and method |
US10795836B2 (en) * | 2017-04-17 | 2020-10-06 | Microsoft Technology Licensing, Llc | Data processing performance enhancement for neural networks using a virtualized data iterator |
CN107146616B (zh) * | 2017-06-13 | 2020-05-08 | Oppo广东移动通信有限公司 | 设备控制方法及相关产品 |
US11328037B2 (en) * | 2017-07-07 | 2022-05-10 | Intel Corporation | Memory-size- and bandwidth-efficient method for feeding systolic array matrix multipliers |
US10740607B2 (en) * | 2017-08-18 | 2020-08-11 | Autel Robotics Co., Ltd. | Method for determining target through intelligent following of unmanned aerial vehicle, unmanned aerial vehicle and remote control |
CN107633295B (zh) * | 2017-09-25 | 2020-04-28 | 南京地平线机器人技术有限公司 | 用于适配神经网络的参数的方法和装置 |
US11010666B1 (en) * | 2017-10-24 | 2021-05-18 | Tunnel Technologies Inc. | Systems and methods for generation and use of tensor networks |
US20190205738A1 (en) * | 2018-01-04 | 2019-07-04 | Tesla, Inc. | Systems and methods for hardware-based pooling |
US11164073B2 (en) | 2018-02-08 | 2021-11-02 | Western Digital Technologies, Inc. | Systolic neural network processor with feedback control |
US11494582B2 (en) | 2018-02-08 | 2022-11-08 | Western Digital Technologies, Inc. | Configurable neural network engine of tensor arrays and memory cells |
CN110096309B (zh) * | 2018-11-14 | 2020-04-14 | 上海寒武纪信息科技有限公司 | 运算方法、装置、计算机设备和存储介质 |
US11636325B2 (en) * | 2018-10-24 | 2023-04-25 | Macronix International Co., Ltd. | In-memory data pooling for machine learning |
CN111126558B (zh) * | 2018-10-31 | 2024-04-02 | 嘉楠明芯(北京)科技有限公司 | 一种卷积神经网络计算加速方法及装置、设备、介质 |
CN111160516B (zh) * | 2018-11-07 | 2023-09-05 | 杭州海康威视数字技术股份有限公司 | 一种深度神经网络的卷积层稀疏化方法及装置 |
JP7315317B2 (ja) | 2018-11-09 | 2023-07-26 | 株式会社Preferred Networks | プロセッサおよびプロセッサのデータ転送方法 |
US10963746B1 (en) * | 2019-01-14 | 2021-03-30 | Xilinx, Inc. | Average pooling in a neural network |
US11556764B2 (en) * | 2019-03-01 | 2023-01-17 | Microsoft Technology Licensing, Llc | Deriving a concordant software neural network layer from a quantized firmware neural network layer |
US10929058B2 (en) | 2019-03-25 | 2021-02-23 | Western Digital Technologies, Inc. | Enhanced memory device architecture for machine learning |
US11783176B2 (en) | 2019-03-25 | 2023-10-10 | Western Digital Technologies, Inc. | Enhanced storage device memory architecture for machine learning |
KR20200116268A (ko) * | 2019-04-01 | 2020-10-12 | 에스케이하이닉스 주식회사 | 버퍼 메모리, 이를 이용하는 연산 장치 및 시스템 |
CN110046705B (zh) * | 2019-04-15 | 2022-03-22 | 广州异构智能科技有限公司 | 用于卷积神经网络的装置 |
CN110059805B (zh) * | 2019-04-15 | 2021-08-31 | 广州异构智能科技有限公司 | 用于二值阵列张量处理器的方法 |
CN110033085B (zh) * | 2019-04-15 | 2021-08-31 | 广州异构智能科技有限公司 | 张量处理器 |
CN110188795B (zh) * | 2019-04-24 | 2023-05-09 | 华为技术有限公司 | 图像分类方法、数据处理方法和装置 |
US11593637B2 (en) | 2019-04-30 | 2023-02-28 | Samsung Electronics Co., Ltd. | Convolution streaming engine for deep neural networks |
KR20210014902A (ko) | 2019-07-31 | 2021-02-10 | 삼성전자주식회사 | 프로세서 및 그 제어 방법 |
US11449739B2 (en) | 2019-08-22 | 2022-09-20 | Google Llc | General padding support for convolution on systolic arrays |
US20210103803A1 (en) * | 2019-10-08 | 2021-04-08 | Apple Inc. | Multi-Mode Planar Engine For Neural Processor |
CN112766471B (zh) * | 2019-11-01 | 2024-03-29 | 中科寒武纪科技股份有限公司 | 运算装置及相关产品 |
US11513799B2 (en) * | 2019-11-04 | 2022-11-29 | Apple Inc. | Chained buffers in neural network processor |
CN111191780B (zh) * | 2020-01-03 | 2024-03-19 | 珠海亿智电子科技有限公司 | 均值池化累加电路、装置以及方法 |
US11630991B2 (en) | 2020-02-04 | 2023-04-18 | Apple Inc. | Broadcasting mode of planar engine for neural processor |
KR20210126398A (ko) * | 2020-04-10 | 2021-10-20 | 에스케이하이닉스 주식회사 | 시스톨릭 어레이를 갖는 신경망 연산 장치 |
US11507817B2 (en) | 2020-04-17 | 2022-11-22 | Samsung Electronics Co., Ltd. | System and method for performing computations for deep neural networks |
KR20210156554A (ko) * | 2020-06-18 | 2021-12-27 | 삼성전자주식회사 | 텐서 처리 방법, 가속기 및 이를 포함한 전자 장치 |
KR20220001821A (ko) * | 2020-06-30 | 2022-01-06 | 삼성전자주식회사 | 텐서 처리 방법, 가속기 및 이를 포함한 가속기 시스템 |
GB2604142B (en) * | 2021-02-25 | 2023-02-22 | Imagination Tech Ltd | Implementation of softmax and exponential in hardware |
US11797270B2 (en) | 2021-06-17 | 2023-10-24 | International Business Machines Corporation | Single function to perform multiple operations with distinct operation parameter validation |
KR102361249B1 (ko) * | 2021-08-02 | 2022-02-14 | 오픈엣지테크놀로지 주식회사 | 브로드캐스팅 멀티플라이 최적화 방법 및 이를 이용한 하드웨어 가속기, 이를 이용한 컴퓨팅 장치 |
US11657864B1 (en) * | 2021-12-17 | 2023-05-23 | Winbond Electronics Corp. | In-memory computing apparatus and computing method having a memory array includes a shifted weight storage, shift information storage and shift restoration circuit to restore a weigh shifted amount of shifted sum-of-products to generate multiple restored sum-of-products |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06164905A (ja) * | 1992-11-24 | 1994-06-10 | Ricoh Co Ltd | 画像処理装置 |
JP2009230494A (ja) * | 2008-03-24 | 2009-10-08 | Nec Corp | Fpgaを用いた並列周辺画素加算モジュール、その方法及びそのプログラム |
US20120030932A1 (en) * | 2010-08-04 | 2012-02-09 | Tesla Motors, Inc. | Method of Controlled Cell-Level Fusing Within a Battery Pack |
JP2013200778A (ja) * | 2012-03-26 | 2013-10-03 | Fujitsu Ltd | 画像処理装置、画像処理方法 |
US20150170021A1 (en) * | 2013-12-18 | 2015-06-18 | Marc Lupon | Reconfigurable processing unit |
Family Cites Families (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US1003749A (en) | 1910-04-05 | 1911-09-19 | Gustav Jaennert | Razor. |
US1003211A (en) | 1910-04-11 | 1911-09-12 | William S Levings | Valve-locking device. |
US6389441B1 (en) | 1999-05-28 | 2002-05-14 | Eastman Kodak Company | Two dimensional moving average filter |
JP4573769B2 (ja) | 2005-12-20 | 2010-11-04 | 富士通セミコンダクター株式会社 | 画像処理回路および画像処理方法 |
GB2436377B (en) | 2006-03-23 | 2011-02-23 | Cambridge Display Tech Ltd | Data processing hardware |
KR100793285B1 (ko) | 2007-05-11 | 2008-01-10 | 주식회사 코아로직 | 필터 매트릭스에 의한 영상 노이즈 제거 시스템, 방법 및그 기록매체 |
US10078620B2 (en) | 2011-05-27 | 2018-09-18 | New York University | Runtime reconfigurable dataflow processor with multi-port memory access module |
US8886533B2 (en) | 2011-10-25 | 2014-11-11 | At&T Intellectual Property I, L.P. | System and method for combining frame and segment level processing, via temporal pooling, for phonetic classification |
WO2014055874A1 (en) | 2012-10-05 | 2014-04-10 | Raytheon BBN Technologies, Corp. | Fast computation of kernel descriptors |
US20150104102A1 (en) | 2013-10-11 | 2015-04-16 | Universidade De Coimbra | Semantic segmentation method with second-order pooling |
US9424492B2 (en) | 2013-12-27 | 2016-08-23 | Xerox Corporation | Weighting scheme for pooling image descriptors |
WO2016033710A1 (en) | 2014-09-05 | 2016-03-10 | Xiaoou Tang | Scene text detection system and method |
US10083395B2 (en) | 2015-05-21 | 2018-09-25 | Google Llc | Batch processing in a neural network processor |
US9805303B2 (en) * | 2015-05-21 | 2017-10-31 | Google Inc. | Rotating data for neural network computations |
US9747546B2 (en) | 2015-05-21 | 2017-08-29 | Google Inc. | Neural network processor |
US10438117B1 (en) | 2015-05-21 | 2019-10-08 | Google Llc | Computing convolutions using a neural network processor |
US10192162B2 (en) | 2015-05-21 | 2019-01-29 | Google Llc | Vector computation unit in a neural network processor |
US20160358069A1 (en) * | 2015-06-03 | 2016-12-08 | Samsung Electronics Co., Ltd. | Neural network suppression |
US9792492B2 (en) * | 2015-07-07 | 2017-10-17 | Xerox Corporation | Extracting gradient features from neural networks |
JP2017068608A (ja) * | 2015-09-30 | 2017-04-06 | 株式会社東芝 | 演算装置、方法及びプログラム |
US10275394B2 (en) | 2015-10-08 | 2019-04-30 | Via Alliance Semiconductor Co., Ltd. | Processor with architectural neural network execution unit |
US10228911B2 (en) * | 2015-10-08 | 2019-03-12 | Via Alliance Semiconductor Co., Ltd. | Apparatus employing user-specified binary point fixed point arithmetic |
JP6750203B2 (ja) * | 2015-10-20 | 2020-09-02 | 富士通株式会社 | 畳み込みニューラルネットワークの演算方法及び演算プログラム、情報処理装置 |
US9904874B2 (en) * | 2015-11-05 | 2018-02-27 | Microsoft Technology Licensing, Llc | Hardware-efficient deep convolutional neural networks |
CN105488656A (zh) | 2015-11-20 | 2016-04-13 | 贵州电网有限责任公司遵义供电局 | 一种电网分县局继电保护管理系统功能模块动态配置技术 |
US10552119B2 (en) * | 2016-04-29 | 2020-02-04 | Intel Corporation | Dynamic management of numerical representation in a distributed matrix processor architecture |
US10037490B2 (en) | 2016-12-13 | 2018-07-31 | Google Llc | Performing average pooling in hardware |
-
2017
- 2017-03-23 US US15/467,294 patent/US10037490B2/en active Active
- 2017-08-22 JP JP2019531384A patent/JP6900487B2/ja active Active
- 2017-08-22 KR KR1020197019046A patent/KR102315346B1/ko active IP Right Grant
- 2017-08-22 KR KR1020217033033A patent/KR102370563B1/ko active IP Right Grant
- 2017-08-22 EP EP23211011.4A patent/EP4369255A1/en active Pending
- 2017-08-22 WO PCT/US2017/048017 patent/WO2018111357A1/en unknown
- 2017-08-22 DK DK17761165.4T patent/DK3555814T3/da active
- 2017-08-22 FI FIEP17761165.4T patent/FI3555814T3/fi active
- 2017-08-22 EP EP17761165.4A patent/EP3555814B1/en active Active
- 2017-09-12 DE DE202017105528.0U patent/DE202017105528U1/de active Active
- 2017-09-13 DE DE102017121257.4A patent/DE102017121257A1/de active Pending
- 2017-09-18 SG SG10201805259XA patent/SG10201805259XA/en unknown
- 2017-09-18 SG SG10201707701PA patent/SG10201707701PA/en unknown
- 2017-09-19 IE IE20170187A patent/IE20170187A1/en unknown
- 2017-09-19 IE IE20180231A patent/IE20180231A1/en unknown
- 2017-09-19 IE IE20190119A patent/IE20190119A1/en not_active IP Right Cessation
- 2017-09-20 GB GB1715180.4A patent/GB2557703B/en active Active
- 2017-09-29 CN CN201710903739.7A patent/CN108615072B/zh active Active
- 2017-09-29 CN CN202111383490.4A patent/CN114239797A/zh active Pending
-
2018
- 2018-06-18 US US16/011,454 patent/US11232351B2/en active Active
-
2019
- 2019-08-05 US US16/531,703 patent/US10679127B2/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06164905A (ja) * | 1992-11-24 | 1994-06-10 | Ricoh Co Ltd | 画像処理装置 |
JP2009230494A (ja) * | 2008-03-24 | 2009-10-08 | Nec Corp | Fpgaを用いた並列周辺画素加算モジュール、その方法及びそのプログラム |
US20120030932A1 (en) * | 2010-08-04 | 2012-02-09 | Tesla Motors, Inc. | Method of Controlled Cell-Level Fusing Within a Battery Pack |
JP2013200778A (ja) * | 2012-03-26 | 2013-10-03 | Fujitsu Ltd | 画像処理装置、画像処理方法 |
US20150170021A1 (en) * | 2013-12-18 | 2015-06-18 | Marc Lupon | Reconfigurable processing unit |
Non-Patent Citations (1)
Title |
---|
DU, ZIDONG ほか: "ShiDianNao: Shifting vision processing closer to the sensor", PROCEEDINGS OF THE 42ND ANNUAL INTERNATIONAL SYMPOSIUM ON COMPUTER ARCHITECTURE, JPN7020004297, June 2015 (2015-06-01), ISSN: 0004421964 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022014141A1 (ja) * | 2020-07-17 | 2022-01-20 | ソニーセミコンダクタソリューションズ株式会社 | 固体撮像素子、撮像装置、および、情報処理システム |
Also Published As
Publication number | Publication date |
---|---|
US20180165577A1 (en) | 2018-06-14 |
DE202017105528U1 (de) | 2017-12-18 |
KR102315346B1 (ko) | 2021-10-19 |
US20180300628A1 (en) | 2018-10-18 |
CN108615072A (zh) | 2018-10-02 |
EP4369255A1 (en) | 2024-05-15 |
US20190354863A1 (en) | 2019-11-21 |
JP6900487B2 (ja) | 2021-07-07 |
CN114239797A (zh) | 2022-03-25 |
FI3555814T3 (fi) | 2024-03-18 |
DK3555814T3 (da) | 2024-03-18 |
IE20190119A1 (en) | 2020-09-30 |
KR102370563B1 (ko) | 2022-03-03 |
IE20180231A1 (en) | 2018-10-17 |
GB2557703B (en) | 2021-03-31 |
DE102017121257A1 (de) | 2018-06-14 |
US10679127B2 (en) | 2020-06-09 |
GB2557703A (en) | 2018-06-27 |
US11232351B2 (en) | 2022-01-25 |
KR20190089204A (ko) | 2019-07-30 |
SG10201707701PA (en) | 2018-07-30 |
SG10201805259XA (en) | 2018-07-30 |
KR20210127813A (ko) | 2021-10-22 |
EP3555814A1 (en) | 2019-10-23 |
GB201715180D0 (en) | 2017-11-01 |
CN108615072B (zh) | 2021-12-07 |
WO2018111357A1 (en) | 2018-06-21 |
EP3555814B1 (en) | 2023-12-27 |
US10037490B2 (en) | 2018-07-31 |
IE20170187A1 (en) | 2018-06-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2020506454A (ja) | ハードウェアにおける平均プーリングの実行 | |
US10032110B2 (en) | Performing average pooling in hardware | |
JP7346510B2 (ja) | ニューラルネットワークプロセッサにおけるベクトル計算ユニット | |
US11704547B2 (en) | Transposing neural network matrices in hardware | |
CN108073983B (zh) | 在硬件中执行核心跨越 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20191113 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20191113 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20201221 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210112 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210302 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210518 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210616 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6900487 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |