JP2019079505A - 畳み込みニューラルネットワーク計算スループットの加速化 - Google Patents
畳み込みニューラルネットワーク計算スループットの加速化 Download PDFInfo
- Publication number
- JP2019079505A JP2019079505A JP2018178236A JP2018178236A JP2019079505A JP 2019079505 A JP2019079505 A JP 2019079505A JP 2018178236 A JP2018178236 A JP 2018178236A JP 2018178236 A JP2018178236 A JP 2018178236A JP 2019079505 A JP2019079505 A JP 2019079505A
- Authority
- JP
- Japan
- Prior art keywords
- output
- data
- pooling
- component
- convolution
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/06—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
- G06N3/063—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using electronic means
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
- G06F18/24133—Distances to prototypes
- G06F18/24137—Distances to cluster centroïds
- G06F18/2414—Smoothing the distance, e.g. radial basis function networks [RBFN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0602—Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
- G06F3/0625—Power saving in storage systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0628—Interfaces specially adapted for storage systems making use of a particular technique
- G06F3/0655—Vertical data movement, i.e. input-output transfer; data movement between one or more hosts and one or more storage devices
- G06F3/0656—Data buffering arrangements
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0628—Interfaces specially adapted for storage systems making use of a particular technique
- G06F3/0655—Vertical data movement, i.e. input-output transfer; data movement between one or more hosts and one or more storage devices
- G06F3/0659—Command handling arrangements, e.g. command buffers, queues, command scheduling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0668—Interfaces specially adapted for storage systems adopting a particular infrastructure
- G06F3/0671—In-line storage system
- G06F3/0683—Plurality of storage devices
- G06F3/0685—Hybrid storage combining heterogeneous device types, e.g. hierarchical storage, hybrid arrays
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/94—Hardware or software architectures specially adapted for image or video understanding
- G06V10/95—Hardware or software architectures specially adapted for image or video understanding structured as a network, e.g. client-server architectures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/56—Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
- G06V20/58—Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/56—Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
- G06V20/58—Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads
- G06V20/582—Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads of traffic signs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/191—Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
- G06V30/19173—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/192—Recognition using electronic means using simultaneous comparisons or correlations of the image signals with a plurality of references
- G06V30/194—References adjustable by an adaptive method, e.g. learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Biophysics (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Mathematical Physics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Human Computer Interaction (AREA)
- Databases & Information Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Neurology (AREA)
- Medical Informatics (AREA)
- Image Analysis (AREA)
Abstract
Description
102 センサ
104 CNN
106 歩行者検出器
106−102 ADAS検出器
106−112 検出器
108 車検出器
110 自転車又は自動二輪車検出器
112 交通標識検出器
114、116 アプリケーション
116 衝突警告
202、230 畳み込み層
204 RELU層
206 プーリング層
208 全結合層
210 出力層
212 畳み込みコンポーネント
214 RELUコンポーネント
216、604、608 プーリングコンポーネント
218 全結合コンポーネント
220 分類器関数
222、226 ネット関数
224、228 出力関数
230、602、606 畳み込み結合層
232、302 画像
300 畳み込みデータ結果
304 メモリ1
308 畳み込みスライドウィンドウ
310 畳み込み出力
402 プーリング出力
502 出力アドレス
600 CNN演算
700 動作フロー例
800 アーキテクチャCNNシステム
802 制御フロー処理部分
804 データフロー処理部分
806 相互接続
808 CPU
810 観測ユニット
812 コプロセッサ
814 メモリ
900 畳み込み層ウォッチテーブル
904a〜904n テーブル
906 トランザクションマッチユニットコンポーネント
908、1508 出力
1002 ストライドレジスタ
1004 統計演算レジスタ
1005 統計演算エンジン
1006、1608 ロード/ストアユニット
1010 マスタポート
1012 スレーブポート
1100 状態フロー
1200、1300 FC層
1400 データ従属性グラフ
1402、1404 実行のクロノグラフ
1500 観測ユニットコンポーネントの態様
1502 ニューロンネット関数の宛先アドレス
1504 ニューロン出力関数の宛先アドレス
1506 活性化関数
1510 テーブル
1602 関数1
1604 関数2
1606 関数m
1700、1800 プロセスフロー
Claims (20)
- 畳み込みニューラルネットワーク(CNN)のためのシステムであって、
1つ又は複数の画像からデータを抽出し、且つ非線形畳み込み出力データを出力するように構成される1つ又は複数の正規化線形関数(RELU)に前記データを提供する畳み込み演算を実行するように構成される畳み込みコンポーネントと、
前記非線形畳み込み出力データのサブセットのプーリングウィンドウに基づいて、前記畳み込み演算と並行してパイプラインプロセスを介してプーリング出力を生成するように構成されるプーリングコンポーネントと、
前記プーリング出力に基づいてANN出力を提供する人工ニューラルネットワーク(ANN)を形成し、且つ前記ANN出力に基づいて前記1つ又は複数の画像におけるパターンの認識を可能にするように構成される全結合(FC)コンポーネントと
を含むシステム。 - 前記プーリングコンポーネントは、前記プーリングウィンドウの可用性を特定し、且つ前記非線形畳み込み出力データの異なるサブセットに対応する複数のプーリングウィンドウを処理するように更に構成される、請求項1に記載のシステム。
- 前記FCコンポーネントは、ニューロンの後続層に結合されるニューロンの第1の層を含み、前記第1の層及び前記後続層のニューロンは、ネット関数出力を提供するように構成されるネット関数ノードと、前記ネット関数出力から出力関数出力を生成するように構成される出力関数ノードとをそれぞれ含む、請求項1に記載のシステム。
- 前記ニューロンの第1の層は、少なくとも1つの先行層から、プーリング出力、前記畳み込みコンポーネントからの前記データ、又は前記非線形畳み込み出力データの少なくとも1つを含む出力を受け取る同じネット関数入力の第1の集合を有する第1のニューロンをそれぞれ含み、及び前記ニューロンの後続層は、前記ニューロンの第1の層から同じ出力を受け取る同じネット関数入力の第2の集合を有する第2のニューロンをそれぞれ含む、請求項3に記載のシステム。
- 前記ネット関数ノードは、それぞれ入力及び前記入力に関連する重みのドット積乗算及び対応する結果の合算を実行するように構成され、及び前記出力関数ノードは、前記ネット関数出力に活性化関数を実行して、FCコンポーネントの出力を提供するように構成され、第1のニューロンの前記出力関数ノードは、別のパイプラインプロセスを介して第2のニューロンの前記ネット関数ノードと並行して動作する、請求項3に記載のシステム。
- 前記プーリングコンポーネントは、前記非線形畳み込み出力データのボリュームの低減を生成し、且つ前記非線形畳み込み出力データを処理して、前記FCコンポーネントに提供される前記プーリング出力としてスケーリング不変データにするように更に構成される、請求項1に記載のシステム。
- 前記畳み込みコンポーネントとの前記プーリングコンポーネントの前記パイプラインプロセスに対応する1つ又は複数の第1のテーブルを含む観測ユニットコンポーネントと、前記畳み込みコンポーネントによる、前記1つ又は複数の第1のテーブル内にあるメモリロケーションへの書き込み動作を検出し、且つ前記畳み込みコンポーネントが前記1つ又は複数の第1のテーブル内の前記メモリロケーションへの前記書き込み動作を実行することに応答して、前記プーリングコンポーネントの統計学的演算をトリガーし、且つ前記1つ又は複数の第1のテーブルから前記プーリングコンポーネントへの複数の出力を生成するように構成されるトランザクションウォッチコンポーネントとを更に含む、請求項1に記載のシステム。
- 前記複数の出力は、前記プーリングウィンドウに関連するマーカを識別する前記1つ若しくは複数の第1のテーブルの畳み込みウォッチアドレスに関連するプーリング入力アドレス、前記プーリングコンポーネントの前記演算への前記トリガー、前記統計学的演算の結果を有する前記1つ若しくは複数の第1のテーブル内のアドレスを指すプーリング出力アドレス、又は前記1つ若しくは複数の第1のテーブルを前記プーリングコンポーネントに関連付ける畳み込み層識別子(ID)の少なくとも1つを含む、請求項7に記載のシステム。
- 前記FC層に関連する第2のテーブルは、前記FCコンポーネントのネット関数ノードのネット関数出力に対応するニューロンネット関数出力アドレス、出力関数ノードのANN出力に対応するニューロン活性化出力アドレス、及び前記出力関数ノードによって実行される活性化関数の少なくとも1つを含む、請求項7に記載のシステム。
- 畳み込みニューラルネットワーク(CNN)のための装置であって、
メモリに結合される1つ又は複数のプロセッサ
を含み、前記メモリは、前記1つ又は複数のプロセッサの動作を実行する命令を含み、前記1つ又は複数のプロセッサは、
1つ又は複数の画像から、1つ又は複数のフィルタカーネルを介して、畳み込みデータセットを含むデータ特徴を抽出することと、
前記畳み込みデータセットを非線形出力データの集合に変換することと、
前記非線形出力データの集合のうちの非線形データの第1の集合又は前記畳み込みデータセットの畳み込みデータの第1の集合が利用可能であると判断することに応答して、前記データ特徴の抽出又は前記畳み込みデータセットの変換の少なくとも一方と並行して動作するパイプラインプロセスを介して、前記非線形出力データの集合に対するプーリング演算からプーリング出力を生成することと
を行うように構成される、装置。 - 前記1つ又は複数のプロセッサは、前記1つ又は複数の画像の部分にわたってスライドする1つ又は複数の畳み込みウィンドウを用いてスライド畳み込みを実行することにより、前記データ特徴を抽出して、前記1つ又は複数の画像の特徴マップを生成し、且つ前記1つ又は複数の畳み込みウィンドウに対応するデータ特徴が存在する確率を特定するように更に構成される、請求項10に記載の装置。
- 前記1つ又は複数のプロセッサは、前記畳み込みデータセットの畳み込みデータの前記第1の集合を処理して、プーリングウィンドウに基づいて畳み込みデータのスケーリング不変集合にするプーリング演算と並行した畳み込み演算を介して、前記1つ又は複数の画像から前記畳み込みデータセットの畳み込みデータの第2の集合を抽出するように更に構成される、請求項10に記載の装置。
- 前記1つ又は複数のプロセッサは、前記非線形データの集合に対応する前記プーリング出力をカテゴリに分類することにより、全結合(FC)コンポーネントを介して前記プーリング出力を処理するように更に構成される、請求項10に記載の装置。
- 前記1つ又は複数のプロセッサは、
ニューロンネット関数出力を生成する第1のFCコンポーネントにおける、入力と重みとのドット積及び前記プーリング出力からの加重入力の和を含むネット関数を実行することと、
前記第1のFCコンポーネントにおける前記ニューロンネット関数出力に対して出力関数を実行して、後続するFCコンポーネントにおける別のドット積及び前記プーリング出力からの前記入力の別の和を含む別のネット関数の実行と並行してニューロン活性化関数出力を生成して、第2のニューロンネット関数出力を生成することと
を行うように更に構成される、請求項13に記載の装置。 - 前記第1のFCコンポーネント及び前記後続するFCコンポーネントは、前記メモリから命令をフェッチすることなく、且つ前記プーリング出力からの入力データ又は先行するFCコンポーネントがニューロン入力において利用可能であることに応答して動作するデータフロープロセスを含む、請求項14に記載の装置。
- 前記1つ又は複数のプロセッサは、ネット関数出力に対応するニューロンネット関数出力アドレス、ニューロンの出力に対応するニューロン活性化関数出力アドレス、及び前記ニューロンの出力関数によって実行される活性化関数のエントリを含むテーブルを埋めて、前記ネット関数出力に基づいて前記ニューロンの前記出力を生成するように更に構成される、請求項10に記載の装置。
- 畳み込みニューラルネットワーク(CNN)のための方法であって、
1つ又は複数のプロセッサを介して、1つ又は複数の画像からデータを抽出する畳み込み演算を実行することと、
前記1つ又は複数のプロセッサを介して、非線形畳み込み出力データを生成するように構成される1つ又は複数の正規化線形関数(RELU)に前記データを提供することと、
前記1つ又は複数のプロセッサを介して、前記非線形畳み込み出力データのサブセットのプーリングウィンドウに基づいて、畳み込み演算と並行してプーリング出力を生成することと、
前記1つ又は複数のプロセッサを介して、前記プーリング出力に基づいて人工ニューラルネットワーク(ANN)のANN出力を提供することと
を含む方法。 - 前記プーリングウィンドウの可用性の判断を生成し、且つ前記非線形畳み込み出力データの異なるサブセットに対応する複数のプーリングウィンドウを処理することを更に含む、請求項17に記載の方法。
- 前記ANNの第1の全結合(FC)層において、第1のネット関数ノードの第1のネット関数出力を第1の出力関数ノードに提供することと、
前記ANN出力を生成するように構成される後続するFC層の第2のネット関数ノードに前記第1の出力関数ノードの第1の出力関数出力を提供することと
を更に含む、請求項17に記載の方法。 - 前記第1のネット関数ノードのうちの第1のネット関数ノードの完成を判断することと、
前記完成に応答して、前記第1のFC層の出力関数を生成する第1の出力ネットワークノードと並行して前記第2のネット関数ノードの第2のネット関数を開始することと
を更に含む、請求項19に記載の方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US15/719,829 | 2017-09-29 | ||
US15/719,829 US10482337B2 (en) | 2017-09-29 | 2017-09-29 | Accelerating convolutional neural network computation throughput |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2019079505A true JP2019079505A (ja) | 2019-05-23 |
JP2019079505A5 JP2019079505A5 (ja) | 2021-11-04 |
JP7280026B2 JP7280026B2 (ja) | 2023-05-23 |
Family
ID=65727803
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018178236A Active JP7280026B2 (ja) | 2017-09-29 | 2018-09-25 | 畳み込みニューラルネットワーク計算スループットの加速化 |
Country Status (4)
Country | Link |
---|---|
US (1) | US10482337B2 (ja) |
JP (1) | JP7280026B2 (ja) |
KR (1) | KR20190038318A (ja) |
DE (1) | DE102018123143A1 (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020201883A (ja) * | 2019-06-13 | 2020-12-17 | キヤノン株式会社 | データ処理装置及びその制御方法 |
JP6854969B1 (ja) * | 2019-12-04 | 2021-04-07 | 三菱電機株式会社 | 送信装置、送信方法および記憶媒体 |
JP2021114279A (ja) * | 2020-01-20 | 2021-08-05 | ベイジン バイドゥ ネットコム サイエンス アンド テクノロジー カンパニー リミテッド | 画像の生成方法、生成装置、電子機器、コンピュータ可読媒体およびコンピュータプログラム |
JP2021144265A (ja) * | 2020-03-10 | 2021-09-24 | 株式会社東芝 | プロセッサ性能測定装置 |
JP2022544739A (ja) * | 2019-08-22 | 2022-10-21 | グーグル エルエルシー | 伝搬レイテンシの短縮 |
KR102670905B1 (ko) | 2019-08-22 | 2024-05-31 | 구글 엘엘씨 | 전파 지연 감소 |
Families Citing this family (41)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10366328B2 (en) * | 2017-09-19 | 2019-07-30 | Gyrfalcon Technology Inc. | Approximating fully-connected layers with multiple arrays of 3x3 convolutional filter kernels in a CNN based integrated circuit |
US10387740B2 (en) * | 2016-10-10 | 2019-08-20 | Gyrfalcon Technology Inc. | Object detection and recognition apparatus based on CNN based integrated circuits |
US10417527B2 (en) * | 2017-09-06 | 2019-09-17 | Irdeto B.V. | Identifying an object within content |
CN108062780B (zh) * | 2017-12-29 | 2019-08-09 | 百度在线网络技术(北京)有限公司 | 图像压缩方法和装置 |
GB2574372B (en) * | 2018-05-21 | 2021-08-11 | Imagination Tech Ltd | Implementing Traditional Computer Vision Algorithms As Neural Networks |
US11277455B2 (en) | 2018-06-07 | 2022-03-15 | Mellanox Technologies, Ltd. | Streaming system |
US20200106828A1 (en) * | 2018-10-02 | 2020-04-02 | Mellanox Technologies, Ltd. | Parallel Computation Network Device |
US10726516B2 (en) * | 2018-10-11 | 2020-07-28 | Futurewei Technologies, Inc. | Arithmetic logic unit (ALU)-centric operations in graphics processing units (GPUs) |
US11720997B2 (en) | 2018-10-19 | 2023-08-08 | Samsung Electronics Co.. Ltd. | Artificial intelligence (AI) encoding device and operating method thereof and AI decoding device and operating method thereof |
WO2020080827A1 (en) | 2018-10-19 | 2020-04-23 | Samsung Electronics Co., Ltd. | Ai encoding apparatus and operation method of the same, and ai decoding apparatus and operation method of the same |
WO2020080665A1 (en) | 2018-10-19 | 2020-04-23 | Samsung Electronics Co., Ltd. | Methods and apparatuses for performing artificial intelligence encoding and artificial intelligence decoding on image |
US11640522B2 (en) | 2018-12-13 | 2023-05-02 | Tybalt, Llc | Computational efficiency improvements for artificial neural networks |
US11144282B2 (en) * | 2019-01-16 | 2021-10-12 | Mediatek Inc. | Mathematical accelerator for artificial intelligence applications |
US11625393B2 (en) | 2019-02-19 | 2023-04-11 | Mellanox Technologies, Ltd. | High performance computing system |
EP3699770A1 (en) | 2019-02-25 | 2020-08-26 | Mellanox Technologies TLV Ltd. | Collective communication system and methods |
US11113838B2 (en) * | 2019-03-26 | 2021-09-07 | Nec Corporation | Deep learning based tattoo detection system with optimized data labeling for offline and real-time processing |
CN110084363B (zh) * | 2019-05-15 | 2023-04-25 | 电科瑞达(成都)科技有限公司 | 一种基于fpga平台的深度学习模型加速方法 |
US11586943B2 (en) * | 2019-08-12 | 2023-02-21 | Micron Technology, Inc. | Storage and access of neural network inputs in automotive predictive maintenance |
KR20210036715A (ko) | 2019-09-26 | 2021-04-05 | 삼성전자주식회사 | 뉴럴 프로세싱 장치 및 뉴럴 프로세싱 장치에서 뉴럴 네트워크의 풀링을 처리하는 방법 |
KR20210039197A (ko) | 2019-10-01 | 2021-04-09 | 삼성전자주식회사 | 데이터를 처리하는 방법 및 장치 |
EP4040342A4 (en) * | 2019-10-02 | 2023-08-02 | Electronics and Telecommunications Research Institute | METHOD OF LEARNING AND SIMPLIFYING DEEP NEURONAL NETWORK STRUCTURE |
KR20210056179A (ko) | 2019-11-08 | 2021-05-18 | 삼성전자주식회사 | Ai 부호화 장치 및 그 동작방법, 및 ai 복호화 장치 및 그 동작방법 |
CN111047035B (zh) * | 2019-12-09 | 2024-04-19 | Oppo广东移动通信有限公司 | 神经网络处理器、芯片和电子设备 |
CN111002980B (zh) * | 2019-12-10 | 2021-04-30 | 苏州智加科技有限公司 | 基于深度学习的道路障碍物轨迹预测方法和系统 |
US11687778B2 (en) | 2020-01-06 | 2023-06-27 | The Research Foundation For The State University Of New York | Fakecatcher: detection of synthetic portrait videos using biological signals |
US20210216868A1 (en) * | 2020-01-08 | 2021-07-15 | Maxim Integrated Products, Inc. | Systems and methods for reducing memory requirements in neural networks |
US11750699B2 (en) | 2020-01-15 | 2023-09-05 | Mellanox Technologies, Ltd. | Small message aggregation |
CN111275784B (zh) * | 2020-01-20 | 2023-06-13 | 北京百度网讯科技有限公司 | 生成图像的方法和装置 |
US11252027B2 (en) | 2020-01-23 | 2022-02-15 | Mellanox Technologies, Ltd. | Network element supporting flexible data reduction operations |
US11507817B2 (en) | 2020-04-17 | 2022-11-22 | Samsung Electronics Co., Ltd. | System and method for performing computations for deep neural networks |
US11876885B2 (en) | 2020-07-02 | 2024-01-16 | Mellanox Technologies, Ltd. | Clock queue with arming and/or self-arming features |
KR102243125B1 (ko) * | 2020-07-31 | 2021-04-22 | 주식회사 웨이센 | 신경망 모델을 이용한 영상의 복합 특성 분류 방법 및 장치 |
CN112070210A (zh) * | 2020-08-20 | 2020-12-11 | 成都恒创新星科技有限公司 | 一种基于fpga的多并行策略卷积网络加速器 |
CN112488126A (zh) * | 2020-11-30 | 2021-03-12 | 北京百度网讯科技有限公司 | 特征图处理方法、装置、设备以及存储介质 |
US11556378B2 (en) | 2020-12-14 | 2023-01-17 | Mellanox Technologies, Ltd. | Offloading execution of a multi-task parameter-dependent operation to a network device |
KR102368075B1 (ko) * | 2021-06-04 | 2022-02-25 | 오픈엣지테크놀로지 주식회사 | 고효율 풀링 방법 및 이를 위한 장치 |
KR102620823B1 (ko) * | 2021-07-06 | 2024-01-04 | 한국과학기술원 | 인공지능 기반의 변형가능한 기준 마커 생성 및 인식 방법 및 그 시스템 |
CN114943635B (zh) * | 2021-09-30 | 2023-08-22 | 太初(无锡)电子科技有限公司 | 一种基于异构协同计算核心的融合算子设计与实现方法 |
KR20230066697A (ko) * | 2021-11-08 | 2023-05-16 | 한국전자기술연구원 | 딥러닝 가속기를 위한 풀링 장치 |
KR20230073757A (ko) * | 2021-11-19 | 2023-05-26 | 서울과학기술대학교 산학협력단 | 심층신경망을 위한 희소성 학습 기반 필터 프루닝 기법 |
US11922237B1 (en) | 2022-09-12 | 2024-03-05 | Mellanox Technologies, Ltd. | Single-step collective operations |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015210709A (ja) * | 2014-04-28 | 2015-11-24 | 株式会社デンソー | 演算処理装置 |
US9373059B1 (en) * | 2014-05-05 | 2016-06-21 | Atomwise Inc. | Systems and methods for applying a convolutional network to spatial data |
US20170046616A1 (en) * | 2015-08-15 | 2017-02-16 | Salesforce.Com, Inc. | Three-dimensional (3d) convolution with 3d batch normalization |
US20170124711A1 (en) * | 2015-11-04 | 2017-05-04 | Nec Laboratories America, Inc. | Universal correspondence network |
JP2017138867A (ja) * | 2016-02-05 | 2017-08-10 | 富士通株式会社 | 演算処理回路、および情報処理装置 |
US20170236053A1 (en) * | 2015-12-29 | 2017-08-17 | Synopsys, Inc. | Configurable and Programmable Multi-Core Architecture with a Specialized Instruction Set for Embedded Application Based on Neural Networks |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3035204B1 (en) * | 2014-12-19 | 2018-08-15 | Intel Corporation | Storage device and method for performing convolution operations |
US9514391B2 (en) * | 2015-04-20 | 2016-12-06 | Xerox Corporation | Fisher vectors meet neural networks: a hybrid visual classification architecture |
US9792531B2 (en) * | 2015-09-16 | 2017-10-17 | Siemens Healthcare Gmbh | Intelligent multi-scale medical image landmark detection |
-
2017
- 2017-09-29 US US15/719,829 patent/US10482337B2/en active Active
-
2018
- 2018-09-05 KR KR1020180105882A patent/KR20190038318A/ko unknown
- 2018-09-20 DE DE102018123143.1A patent/DE102018123143A1/de active Pending
- 2018-09-25 JP JP2018178236A patent/JP7280026B2/ja active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015210709A (ja) * | 2014-04-28 | 2015-11-24 | 株式会社デンソー | 演算処理装置 |
US9373059B1 (en) * | 2014-05-05 | 2016-06-21 | Atomwise Inc. | Systems and methods for applying a convolutional network to spatial data |
US20170046616A1 (en) * | 2015-08-15 | 2017-02-16 | Salesforce.Com, Inc. | Three-dimensional (3d) convolution with 3d batch normalization |
US20170124711A1 (en) * | 2015-11-04 | 2017-05-04 | Nec Laboratories America, Inc. | Universal correspondence network |
US20170236053A1 (en) * | 2015-12-29 | 2017-08-17 | Synopsys, Inc. | Configurable and Programmable Multi-Core Architecture with a Specialized Instruction Set for Embedded Application Based on Neural Networks |
JP2017138867A (ja) * | 2016-02-05 | 2017-08-10 | 富士通株式会社 | 演算処理回路、および情報処理装置 |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020201883A (ja) * | 2019-06-13 | 2020-12-17 | キヤノン株式会社 | データ処理装置及びその制御方法 |
JP2022544739A (ja) * | 2019-08-22 | 2022-10-21 | グーグル エルエルシー | 伝搬レイテンシの短縮 |
JP7326501B2 (ja) | 2019-08-22 | 2023-08-15 | グーグル エルエルシー | 伝搬レイテンシの短縮 |
KR102670905B1 (ko) | 2019-08-22 | 2024-05-31 | 구글 엘엘씨 | 전파 지연 감소 |
JP6854969B1 (ja) * | 2019-12-04 | 2021-04-07 | 三菱電機株式会社 | 送信装置、送信方法および記憶媒体 |
JP2021114279A (ja) * | 2020-01-20 | 2021-08-05 | ベイジン バイドゥ ネットコム サイエンス アンド テクノロジー カンパニー リミテッド | 画像の生成方法、生成装置、電子機器、コンピュータ可読媒体およびコンピュータプログラム |
US11463631B2 (en) | 2020-01-20 | 2022-10-04 | Beijing Baidu Netcom Science And Technology Co., Ltd. | Method and apparatus for generating face image |
JP2021144265A (ja) * | 2020-03-10 | 2021-09-24 | 株式会社東芝 | プロセッサ性能測定装置 |
JP7404111B2 (ja) | 2020-03-10 | 2023-12-25 | 株式会社東芝 | プロセッサ性能測定装置 |
Also Published As
Publication number | Publication date |
---|---|
KR20190038318A (ko) | 2019-04-08 |
JP7280026B2 (ja) | 2023-05-23 |
US20190102640A1 (en) | 2019-04-04 |
DE102018123143A1 (de) | 2019-04-04 |
US10482337B2 (en) | 2019-11-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7280026B2 (ja) | 畳み込みニューラルネットワーク計算スループットの加速化 | |
US11436014B2 (en) | Deep vision processor | |
Hu et al. | Randla-net: Efficient semantic segmentation of large-scale point clouds | |
CN109740534B (zh) | 图像处理方法、装置及处理设备 | |
CN111401516B (zh) | 一种神经网络通道参数的搜索方法及相关设备 | |
EP3256992A1 (en) | Convolution matrix multiply with callback for deep tiling for deep convolutional neural networks | |
CN110222718B (zh) | 图像处理的方法及装置 | |
Heinrich et al. | BRIEFnet: Deep pancreas segmentation using binary sparse convolutions | |
US20230401838A1 (en) | Image processing method and related apparatus | |
CN111950702A (zh) | 一种神经网络结构确定方法及其装置 | |
Fan et al. | Improved SSD-based multi-scale pedestrian detection algorithm | |
CN114821096A (zh) | 一种图像处理方法、神经网络的训练方法以及相关设备 | |
Vaidya et al. | Hardware efficient modified cnn architecture for traffic sign detection and recognition | |
US20220066776A1 (en) | Accelerating processor based artificial neural network computation | |
Liu et al. | Lightweight target detection algorithm based on YOLOv4 | |
WO2022179599A1 (zh) | 一种感知网络及数据处理方法 | |
Agarwal et al. | Real-time traffic light signal recognition system for a self-driving car | |
Zhai et al. | Geometry understanding from autonomous driving scenarios based on feature refinement | |
Hashemifard et al. | Weakly supervised human skin segmentation using guidance attention mechanisms | |
Li et al. | Deep Visible and thermal image fusion with cross-modality feature selection for pedestrian detection | |
Pereira et al. | MPF6D: masked pyramid fusion 6D pose estimation | |
Saidani et al. | Embedded Plant Disease Recognition using Deep PlantNet on FPGA-SoC | |
Wang et al. | MS-HRNet: multi-scale high-resolution network for human pose estimation | |
He et al. | Improving small object detection via context-aware and feature-enhanced plug-and-play modules | |
Al Amin et al. | FPGA-based Real-Time Object Detection and Classification System using YOLO for Edge Computing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210924 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210924 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220914 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220920 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221220 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230411 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230511 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7280026 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |