JP7386542B2 - 機械知覚および高密度アルゴリズム集積回路 - Google Patents
機械知覚および高密度アルゴリズム集積回路 Download PDFInfo
- Publication number
- JP7386542B2 JP7386542B2 JP2020546936A JP2020546936A JP7386542B2 JP 7386542 B2 JP7386542 B2 JP 7386542B2 JP 2020546936 A JP2020546936 A JP 2020546936A JP 2020546936 A JP2020546936 A JP 2020546936A JP 7386542 B2 JP7386542 B2 JP 7386542B2
- Authority
- JP
- Japan
- Prior art keywords
- array
- integrated circuit
- cores
- data
- boundary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000008447 perception Effects 0.000 title description 6
- 230000015654 memory Effects 0.000 claims description 128
- 230000009977 dual effect Effects 0.000 claims description 78
- 238000012545 processing Methods 0.000 claims description 67
- 230000002093 peripheral effect Effects 0.000 claims description 35
- 230000006854 communication Effects 0.000 claims description 17
- 238000004891 communication Methods 0.000 claims description 17
- 238000012546 transfer Methods 0.000 claims description 15
- 238000004364 calculation method Methods 0.000 claims description 13
- 230000007175 bidirectional communication Effects 0.000 claims description 2
- 230000006870 function Effects 0.000 description 39
- 238000000034 method Methods 0.000 description 8
- 238000013528 artificial neural network Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000004927 fusion Effects 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 230000003068 static effect Effects 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 230000001953 sensory effect Effects 0.000 description 2
- 230000031893 sensory processing Effects 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 238000011144 upstream manufacturing Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000037406 food intake Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000035807 sensation Effects 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0668—Interfaces specially adapted for storage systems adopting a particular infrastructure
- G06F3/0671—In-line storage system
- G06F3/0683—Plurality of storage devices
- G06F3/0688—Non-volatile semiconductor memory arrays
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F15/00—Digital computers in general; Data processing equipment in general
- G06F15/76—Architectures of general purpose stored program computers
- G06F15/80—Architectures of general purpose stored program computers comprising an array of processing units with common control, e.g. single instruction multiple data processors
- G06F15/8007—Architectures of general purpose stored program computers comprising an array of processing units with common control, e.g. single instruction multiple data processors single instruction multiple data [SIMD] multiprocessors
- G06F15/8023—Two dimensional arrays, e.g. mesh, torus
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F15/00—Digital computers in general; Data processing equipment in general
- G06F15/76—Architectures of general purpose stored program computers
- G06F15/80—Architectures of general purpose stored program computers comprising an array of processing units with common control, e.g. single instruction multiple data processors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0628—Interfaces specially adapted for storage systems making use of a particular technique
- G06F3/0655—Vertical data movement, i.e. input-output transfer; data movement between one or more hosts and one or more storage devices
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0668—Interfaces specially adapted for storage systems adopting a particular infrastructure
- G06F3/0671—In-line storage system
- G06F3/0683—Plurality of storage devices
- G06F3/0685—Hybrid storage combining heterogeneous device types, e.g. hierarchical storage, hybrid arrays
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/30—Circuit design
- G06F30/32—Circuit design at the digital level
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/30—Circuit design
- G06F30/36—Circuit design at the analogue level
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/30—Circuit design
Description
本出願は、2018年3月8日に出願された、米国仮出願第62/640,478号の利益を主張し、これは、参照によってその全体が援用される。
本出願の好ましい態様の以下の記述は、これらの好ましい態様に発明を限定することを意図せず、しかしむしろ任意の当業者がこれらの発明を作製し、および使用できることを意図する。
背景部門において上記のように、集積回路アーキテクチャにおける技術水準は、ロボット工学および自立型機械の知覚処理タスクの多数を扱うための適切な解決法を欠いている。GPUがさらなるおよび/または異なる回路で修正されてロボット工学および自立型機械のこれらの知覚処理要求のいくつかを行うかもしれないが、GPUの処理能力に有意なギャップが存在し、その結果生じる性能は低く、およびリアルタイムでない。その他の知覚処理回路が存在し得るし、ニューラルネットワーク特定のプロセッサ、計算機視覚特定のプロセッサなどを含む場合もある。しかし、これらのいずれも、センサ獲得、センサーフュージョン、知覚処理、経路計画などのために必要とされる多くの異なる知覚アルゴリズムおよび計算を処理することができる単一の包括的集積回路を提供しない。
図1~1Aに示したように、知覚処理および/または任意の適切なタイプのデータ処理を行うための集積回路100(たとえば、高密度アルゴリズム処理回路および/または知覚処理装置)は、複数のアレイコア110、複数の境界コア120、ディスパッチャ(メインコントローラ)130、第1の複数の周囲コントローラ140、第2の複数の周囲コントローラ150およびメインメモリ160を含む。加えて、集積回路100は、第1の周囲ロードストア145、第2の周囲ロードストア155、第1の周囲メモリ147、第2の周囲メモリ157、第1の複数のデュアルFIFO 149および第2の複数のデュアルFIFO 159を含んでもよい。
Claims (17)
- 集積回路であって、
複数のアレイコアであって、複数のアレイコアのそれぞれのアレイコアが、
複数の異なるデータ処理回路、および
データキューレジスタファイル、
を含む、複数のアレイコアと、
複数の境界コアであって、複数の境界コアのそれぞれの境界コアが、少なくとも一つのレジスタファイルを含む、複数の境界コアと、
データ移動命令を提供するディスパッチコントローラであって、データ移動命令がデータフロースケジュールを含み、データフロースケジュールが、
集積回路の中でデータの自動移動を定義し、
データが予め定められたデータフロースケジュールに従った1つまたは複数の境界コアに提供されない場合、複数の境界コアの1つまたは複数の境界コアを一定の値にセットすることを特徴とする、ディスパッチコントローラと、
を含み、
[i]複数の境界コアの少なくとも一つのサブセットが、複数のアレイコアの第1のサブセットの周囲を包囲し、および、
[ii]複数のアレイコアと複数の境界コアの組み合わせが、集積回路アレイを定義することを特徴とする、集積回路。 - 請求項1に記載の集積回路であって、
複数のアレイコアの第1のサブセットは、複数のアレイコアの第2のサブセットの周囲を包囲する、集積回路。 - 請求項1に記載の集積回路であって、
複数のアレイコアのそれぞれの複数の異なるデータ処理回路は、
複数の乗算アキュムレータであって、複数の乗算アキュムレータのそれぞれが、複数のアレイコアのそれぞれのアレイコアのデータ入力/出力ポートに隣接して配列されている、乗算アキュムレータ、を含む、
集積回路。 - 集積回路であって、
複数のアレイコアであって、複数のアレイコアのそれぞれのアレイコアが、
複数の異なるデータ処理回路、および
データキューレジスタファイル、
を含む、複数のアレイコアと、
複数の境界コアであって、複数の境界コアのそれぞれの境界コアが、
少なくとも一つのレジスタファイル、
第1の複数のデュアルFIFO、および
第2の複数のデュアルFIFO、
を含み、
複数の境界コアの少なくとも一つのサブセットが、複数のアレイコアの第1のサブセットの周囲を包囲し、および、
複数のアレイコアと複数の境界コアの組み合わせが、集積回路アレイを定義し、
前記第1の複数のデュアルFIFOは、前記第1の複数のデュアルFIFOのそれぞれのデュアルFIFOに入っている最も古いデータセットが、前記第1の複数のデュアルFIFOのそれぞれのデュアルFIFOによって最初に処理されるように、データを先入れ先出し方式において集積回路アレイの中にロードする第1の複数のデュアルFIFOであって、
前記第1の複数のデュアルFIFOは、集積回路アレイの第1の周囲側に沿って配列され、
前記第2の複数のデュアルFIFOは、前記第2の複数のデュアルFIFOのそれぞれのデュアルFIFOに入っている最も古いデータセットが、前記第2の複数のデュアルFIFOのそれぞれのデュアルFIFOによって最初に処理されるように、データを先入れ先出し方式において集積回路アレイにロードする第2の複数のデュアルFIFOであって、
前記第2の複数のデュアルFIFOは、集積回路アレイの第1の周囲側とは異なる集積回路アレイの第2の周囲側に沿って配列される、
ことを特徴とする、集積回路。 - 請求項4に記載の集積回路であって、
第1および第2の複数のデュアルFIFOのそれぞれは少なくとも2つのメモリエレメントを含み、
前記少なくとも2つのメモリエレメントの第1が、集積回路アレイの複数の境界コアの境界コアの1つおよび複数のアレイコアの1つのアレイコアの中へデータをプッシュし、
前記少なくとも2つのメモリエレメントの第2が、集積回路アレイの複数の境界コアの境界コアの1つおよび複数のアレイコアの1つのアレイコアからデータを収集する、
集積回路。 - 請求項3に記載の集積回路であって、
複数のアレイコアのそれぞれは、長方形を有し、且つ、
複数の乗算アキュムレータの1つは、複数のアレイコアのそれぞれの長方形の中に配列される、
集積回路。 - 請求項1に記載の集積回路であって、さらに、
統合メモリとインタフェースする第1の周囲メモリおよび第2の周囲メモリを含み、
第1の周囲メモリは、集積回路アレイの第1の周囲側に沿って配列され、および第1の周囲ロードストアとインタフェースし、
第2の周囲メモリは、集積回路アレイの第2の周囲側に沿って配列され、および第2の周囲ロードストアとインタフェースする
集積回路。 - 請求項1に記載の集積回路であって、さらに、
メインメモリと集積回路アレイとの間に直接メモリアクセスを可能にする階層的メモリ構造を含み、階層的メモリ構造は、
集積回路アレイとインタフェースし、および先入れ先出し方式においてデータを伝達し、および受信する複数のデュアルFIFOと、
それぞれが複数のデュアルFIFOのそれぞれのデュアルFIFOとインタフェースし、およびそれぞれのデュアルFIFOから受信された、および/またはそれぞれのデュアルFIFOへのロードを保留するいずれかのデータの1つまたは複数のロードを格納する複数の周囲ロードストアと、
それぞれが複数の周囲ロードストアのそれぞれの周囲ロードストアとインタフェースし、およびメインメモリとインタフェースする複数の周囲メモリと、
を含む、集積回路。 - 請求項8に記載の集積回路であって、さらに、
データ移動命令を実行するときに、階層的メモリ構造と集積回路アレイとの間のデータの移動を制御する複数の周囲コントローラ、
を含む、集積回路。 - 請求項8に記載の集積回路であって、
階層的メモリ構造は、データ転送の間にデータアクセスおよびデータ再構築を可能にする二次元の直接メモリアクセスとして実行することのできる、
集積回路。 - 請求項4に記載の集積回路であって、さらにディスパッチコントローラを含み、
当該ディスパッチコントローラは、
(i)データの自動移動を生じさせるデータ移動命令、すなわち(a)集積回路の階層的メモリ構造と集積回路アレイとの間の、(b)それぞれの複数のアレイコアのそれぞれのアレイコアの中の、(c)それぞれのアレイコアの間および集積回路アレイのアレイコアと境界コアとの間の、いずれかのデータ移動命令、および
(ii)集積回路アレイの複数のアレイコアによって実行される複数の計算を定義する計算命令、
を提供する、集積回路。 - 請求項4に記載の集積回路であって、さらに、
データ移動命令を提供するディスパッチコントローラであって、データ移動命令が、
(i)集積回路の中でデータの自動移動を定義し、
(ii)データが予め定められたデータフロースケジュールに従った1つまたは複数の境界コアに提供されない場合、複数の境界コアの1つまたは複数の境界コアを予め定められた一定の値にセットする、
データフロースケジュールを含むことを特徴とする、
ディスパッチコントローラを含む、集積回路。 - 集積回路であって、
複数のアレイコアであって、複数のアレイコアのそれぞれのアレイコアが、
複数の異なるデータ処理回路、および
データキューレジスタファイル、
を含む、複数のアレイコアと、
複数の境界コアであって、複数の境界コアのそれぞれの境界コアが、
少なくとも一つのレジスタファイル、および
ディスパッチコントローラ、を含み、
複数の境界コアの少なくとも一つのサブセットが、複数のアレイコアの第1のサブセットの周囲を包囲し、および、
複数のアレイコアと複数の境界コアの組み合わせが、集積回路アレイを定義し、
前記ディスパッチコントローラは、
(i) データフロースケジュールを含むデータ移動命令であって、データの自動移動を生じさせるデータ移動命令、すなわち(a)集積回路の階層的メモリ構造と集積回路アレイとの間の、(b)それぞれの複数のアレイコアのそれぞれのアレイコアの中の、(c)それぞれのアレイコアの間および集積回路アレイのアレイコアと境界コアとの間の、いずれかのデータ移動命令、および
(ii) 集積回路アレイの複数のアレイコアによって実行される複数の計算を定義する計算命令、
を提供し、
前記データフロースケジュールは、複数の周囲ロードストアの1つまたは複数によって実行可能なメモリアドレスのスケジュールを含むことを特徴とする、集積回路。 - 請求項4に記載の集積回路であって、さらに、
ディスパッチコントローラであって、
複数のアレイコアのそれぞれに計算命令を提供する計算命令ジェネレータ回路、および、
集積回路の中でデータの予め定められた移動を定義するデータフロースケジュールを提供するデータ移動ジェネレータ回路、
を含むことを特徴とするディスパッチコントローラを含む、
集積回路。 - 請求項1に記載の集積回路であって、さらに、
同報通信バスの第1の入力端子にて1つまたは複数の周囲コントローラと電気的通信して、および同報通信バスの複数の出力端子にて複数のアレイコアのサブセットと電気的通信して配列される同報通信バス、
を含む、集積回路。 - 請求項1に記載の集積回路であって、
複数のアレイコアのそれぞれは、複数アレイコアおよび複数の境界コアの1つまたは複数を含む隣接したコアと双方向通信して配列される、
集積回路。 - 請求項1に記載の集積回路であって、
複数のアレイコアのそれぞれは、少なくとも1つの論理演算装置をさらに含む、
集積回路。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201862640478P | 2018-03-08 | 2018-03-08 | |
US62/640,478 | 2018-03-08 | ||
PCT/US2019/020266 WO2019173135A1 (en) | 2018-03-08 | 2019-03-01 | A machine perception and dense algorithm integrated circuit |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021515339A JP2021515339A (ja) | 2021-06-17 |
JP7386542B2 true JP7386542B2 (ja) | 2023-11-27 |
Family
ID=67394305
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020546936A Active JP7386542B2 (ja) | 2018-03-08 | 2019-03-01 | 機械知覚および高密度アルゴリズム集積回路 |
Country Status (4)
Country | Link |
---|---|
US (5) | US10365860B1 (ja) |
EP (1) | EP3762831A4 (ja) |
JP (1) | JP7386542B2 (ja) |
WO (1) | WO2019173135A1 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11087067B2 (en) * | 2020-01-06 | 2021-08-10 | quadric.io, Inc. | Systems and methods for implementing tile-level predication within a machine perception and dense algorithm integrated circuit |
US11392667B2 (en) * | 2020-12-18 | 2022-07-19 | quadric.io, Inc. | Systems and methods for an intelligent mapping of neural network weights and input data to an array of processing cores of an integrated circuit |
US11531633B2 (en) * | 2021-04-01 | 2022-12-20 | quadric.io, Inc. | Systems and methods for intelligently implementing concurrent transfers of data within a machine perception and dense algorithm integrated circuit |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100180100A1 (en) | 2009-01-13 | 2010-07-15 | Mavrix Technology, Inc. | Matrix microprocessor and method of operation |
US20140173228A1 (en) | 2012-12-18 | 2014-06-19 | Samsung Electronics Co., Ltd. | Memory system and system on chip including the same |
US20180032335A1 (en) | 2016-07-31 | 2018-02-01 | Microsoft Technology Licensing, Llc | Transactional register file for a processor |
Family Cites Families (42)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1990001192A1 (en) * | 1988-07-22 | 1990-02-08 | United States Department Of Energy | Data flow machine for data driven computing |
EP0660245A3 (en) * | 1993-12-20 | 1998-09-30 | Motorola, Inc. | Arithmetic engine |
US5708835A (en) * | 1995-03-27 | 1998-01-13 | Hughes Electronics | Dual-directional parallel processor |
US6130551A (en) | 1998-01-19 | 2000-10-10 | Vantis Corporation | Synthesis-friendly FPGA architecture with variable length and variable timing interconnect |
US6167502A (en) * | 1997-10-10 | 2000-12-26 | Billions Of Operations Per Second, Inc. | Method and apparatus for manifold array processing |
US7111155B1 (en) * | 1999-05-12 | 2006-09-19 | Analog Devices, Inc. | Digital signal processor computation core with input operand selection from operand bus for dual operations |
US6476636B1 (en) * | 2000-09-02 | 2002-11-05 | Actel Corporation | Tileable field-programmable gate array architecture |
WO2004021176A2 (de) | 2002-08-07 | 2004-03-11 | Pact Xpp Technologies Ag | Verfahren und vorrichtung zur datenverarbeitung |
US8276135B2 (en) | 2002-11-07 | 2012-09-25 | Qst Holdings Llc | Profiling of software and circuit designs utilizing data operation analyses |
US7099983B2 (en) * | 2002-11-25 | 2006-08-29 | Lsi Logic Corporation | Multi-core communications module, data communications system incorporating a multi-core communications module, and data communications process |
US6800884B1 (en) * | 2002-12-30 | 2004-10-05 | Actel Corporation | Inter-tile buffer system for a field programmable gate array |
US6867615B1 (en) * | 2003-05-30 | 2005-03-15 | Actel Corporation | Dedicated input/output first in/first out module for a field programmable gate array |
US7251803B2 (en) * | 2003-11-05 | 2007-07-31 | Peter Ramyalal Suaris | Memory re-implementation for field programmable gate arrays |
US20070247189A1 (en) * | 2005-01-25 | 2007-10-25 | Mathstar | Field programmable semiconductor object array integrated circuit |
US8074224B1 (en) * | 2005-12-19 | 2011-12-06 | Nvidia Corporation | Managing state information for a multi-threaded processor |
US7353363B2 (en) * | 2006-03-03 | 2008-04-01 | Microsystems, Inc. | Patchable and/or programmable decode using predecode selection |
US7577820B1 (en) * | 2006-04-14 | 2009-08-18 | Tilera Corporation | Managing data in a parallel processing environment |
US9292825B2 (en) | 2006-07-05 | 2016-03-22 | International Business Machines Corporation | Multi-tier inventory visibility |
US7805575B1 (en) * | 2006-09-29 | 2010-09-28 | Tilera Corporation | Caching in multicore and multiprocessor architectures |
US7743232B2 (en) * | 2007-07-18 | 2010-06-22 | Advanced Micro Devices, Inc. | Multiple-core processor with hierarchical microcode store |
US8045546B1 (en) * | 2008-07-08 | 2011-10-25 | Tilera Corporation | Configuring routing in mesh networks |
US9152427B2 (en) * | 2008-10-15 | 2015-10-06 | Hyperion Core, Inc. | Instruction issue to array of arithmetic cells coupled to load/store cells with associated registers as extended register file |
GB2471067B (en) * | 2009-06-12 | 2011-11-30 | Graeme Roy Smith | Shared resource multi-thread array processor |
US9189448B2 (en) * | 2009-08-20 | 2015-11-17 | Empire Technology Development Llc | Routing image data across on-chip networks |
US9135215B1 (en) | 2009-09-21 | 2015-09-15 | Tilera Corporation | Route prediction in packet switched networks |
US20110153982A1 (en) * | 2009-12-21 | 2011-06-23 | Bbn Technologies Corp. | Systems and methods for collecting data from multiple core processors |
WO2011079942A1 (en) * | 2009-12-28 | 2011-07-07 | Hyperion Core, Inc. | Optimisation of loops and data flow sections |
US8738860B1 (en) * | 2010-10-25 | 2014-05-27 | Tilera Corporation | Computing in parallel processing environments |
US20120110303A1 (en) * | 2010-10-28 | 2012-05-03 | International Business Machines Corporation | Method for Process Synchronization of Embedded Applications in Multi-Core Systems |
US9432298B1 (en) * | 2011-12-09 | 2016-08-30 | P4tents1, LLC | System, method, and computer program product for improving memory systems |
EP2761466B1 (en) * | 2011-09-30 | 2020-08-05 | Intel Corporation | Apparatus and method for implementing a multi-level memory hierarchy |
US8971338B2 (en) * | 2012-01-09 | 2015-03-03 | Telefonaktiebolaget L M Ericsson (Publ) | Expanding network functionalities for openflow based split-architecture networks |
US9355058B2 (en) * | 2012-10-22 | 2016-05-31 | Intel Corporation | High performance interconnect physical layer |
US20140208072A1 (en) * | 2013-01-18 | 2014-07-24 | Nec Laboratories America, Inc. | User-level manager to handle multi-processing on many-core coprocessor-based systems |
US10318444B2 (en) * | 2013-04-11 | 2019-06-11 | The Regents Of The University Of California | Collective memory transfer devices and methods for multiple-core processors |
US9256278B2 (en) * | 2013-08-20 | 2016-02-09 | Winbond Electronics Corp. | Devices and methods for multi-core memory |
US9378174B2 (en) * | 2013-11-04 | 2016-06-28 | Xilinx, Inc. | SERDES receiver oversampling rate |
US9245125B2 (en) | 2014-02-27 | 2016-01-26 | Nec Laboratories America, Inc. | Duleak: a scalable app engine for high-impact privacy leaks |
US11449452B2 (en) * | 2015-05-21 | 2022-09-20 | Goldman Sachs & Co. LLC | General-purpose parallel computing architecture |
US10133504B2 (en) * | 2016-04-06 | 2018-11-20 | Futurewei Technologies, Inc. | Dynamic partitioning of processing hardware |
US10282808B2 (en) * | 2016-05-27 | 2019-05-07 | Intel Corporation | Hierarchical lossless compression and null data support |
US10776684B1 (en) * | 2016-11-02 | 2020-09-15 | National Technology & Engineering Solutions Of Sandia, Llc | Mixed core processor unit |
-
2019
- 2019-03-01 JP JP2020546936A patent/JP7386542B2/ja active Active
- 2019-03-01 EP EP19764218.4A patent/EP3762831A4/en not_active Withdrawn
- 2019-03-01 US US16/290,064 patent/US10365860B1/en active Active
- 2019-03-01 WO PCT/US2019/020266 patent/WO2019173135A1/en active Application Filing
- 2019-06-13 US US16/439,988 patent/US10474398B2/en active Active
- 2019-10-02 US US16/590,999 patent/US10642541B2/en active Active
-
2020
- 2020-03-26 US US16/831,423 patent/US11086574B2/en active Active
-
2021
- 2021-07-01 US US17/365,675 patent/US20210326078A1/en not_active Abandoned
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100180100A1 (en) | 2009-01-13 | 2010-07-15 | Mavrix Technology, Inc. | Matrix microprocessor and method of operation |
US20140173228A1 (en) | 2012-12-18 | 2014-06-19 | Samsung Electronics Co., Ltd. | Memory system and system on chip including the same |
US20180032335A1 (en) | 2016-07-31 | 2018-02-01 | Microsoft Technology Licensing, Llc | Transactional register file for a processor |
Also Published As
Publication number | Publication date |
---|---|
US20190310801A1 (en) | 2019-10-10 |
US10365860B1 (en) | 2019-07-30 |
US10474398B2 (en) | 2019-11-12 |
US20200225884A1 (en) | 2020-07-16 |
US20210326078A1 (en) | 2021-10-21 |
US20200034082A1 (en) | 2020-01-30 |
EP3762831A1 (en) | 2021-01-13 |
US10642541B2 (en) | 2020-05-05 |
WO2019173135A1 (en) | 2019-09-12 |
US11086574B2 (en) | 2021-08-10 |
JP2021515339A (ja) | 2021-06-17 |
EP3762831A4 (en) | 2022-04-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11907726B2 (en) | Systems and methods for virtually partitioning a machine perception and dense algorithm integrated circuit | |
JP7386543B2 (ja) | 機械知覚および高密度アルゴリズム集積回路を実装するためのシステムおよび方法 | |
CN109102065B (zh) | 一种基于PSoC的卷积神经网络加速器 | |
JP7386542B2 (ja) | 機械知覚および高密度アルゴリズム集積回路 | |
EP3480748A1 (en) | Neural network hardware | |
US11531633B2 (en) | Systems and methods for intelligently implementing concurrent transfers of data within a machine perception and dense algorithm integrated circuit | |
US20200356370A1 (en) | Systems and methods for implementing core-level predication within a machine perception and dense algorithm integrated circuit | |
US20210334450A1 (en) | Systems and methods for implementing tile-level predication within a machine perception and dense algorithm integrated circuit | |
WO2020163171A1 (en) | Systems and methods for implementing a random access augmented machine perception and dense algorithm integrated circuit | |
US11714556B2 (en) | Systems and methods for accelerating memory transfers and computation efficiency using a computation-informed partitioning of an on-chip data buffer and implementing computation-aware data transfer operations to the on-chip data buffer | |
US11392667B2 (en) | Systems and methods for an intelligent mapping of neural network weights and input data to an array of processing cores of an integrated circuit | |
US20230055528A1 (en) | Systems and methods for executing a programmable finite state machine that accelerates fetchless computations and operations of an array of processing cores of an integrated circuit | |
KR102441520B1 (ko) | 필터 분해 기법을 이용한 에너지 효율적 재구성형 cnn 가속기 장치 및 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220207 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230411 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230626 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231010 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20231107 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7386542 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |