JP2022544512A - 特定用途向け集積回路のデュアルモード動作 - Google Patents
特定用途向け集積回路のデュアルモード動作 Download PDFInfo
- Publication number
- JP2022544512A JP2022544512A JP2022508894A JP2022508894A JP2022544512A JP 2022544512 A JP2022544512 A JP 2022544512A JP 2022508894 A JP2022508894 A JP 2022508894A JP 2022508894 A JP2022508894 A JP 2022508894A JP 2022544512 A JP2022544512 A JP 2022544512A
- Authority
- JP
- Japan
- Prior art keywords
- tiles
- integrated circuit
- input data
- tile
- criterion
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000009977 dual effect Effects 0.000 title 1
- 238000000034 method Methods 0.000 claims abstract description 37
- 239000013598 vector Substances 0.000 claims description 70
- 238000004891 communication Methods 0.000 claims description 32
- 230000008569 process Effects 0.000 claims description 18
- 238000004364 calculation method Methods 0.000 claims description 11
- 238000012545 processing Methods 0.000 description 42
- 230000004913 activation Effects 0.000 description 20
- 238000001994 activation Methods 0.000 description 20
- 238000012546 transfer Methods 0.000 description 12
- 230000008859 change Effects 0.000 description 11
- 238000013461 design Methods 0.000 description 9
- 238000003491 array Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 238000013528 artificial neural network Methods 0.000 description 5
- 230000001934 delay Effects 0.000 description 5
- 238000004590 computer program Methods 0.000 description 4
- 238000009825 accumulation Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000013527 convolutional neural network Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 230000003213 activating effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03K—PULSE TECHNIQUE
- H03K19/00—Logic circuits, i.e. having at least two inputs acting on one output; Inverting circuits
- H03K19/02—Logic circuits, i.e. having at least two inputs acting on one output; Inverting circuits using specified components
- H03K19/173—Logic circuits, i.e. having at least two inputs acting on one output; Inverting circuits using specified components using elementary logic circuits as components
- H03K19/177—Logic circuits, i.e. having at least two inputs acting on one output; Inverting circuits using specified components using elementary logic circuits as components arranged in matrix form
- H03K19/17736—Structural details of routing resources
- H03K19/1774—Structural details of routing resources for global signals, e.g. clock, reset
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/06—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
- G06N3/063—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using electronic means
- G06N3/065—Analogue means
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F15/00—Digital computers in general; Data processing equipment in general
- G06F15/76—Architectures of general purpose stored program computers
- G06F15/78—Architectures of general purpose stored program computers comprising a single central processing unit
- G06F15/7867—Architectures of general purpose stored program computers comprising a single central processing unit with reconfigurable architecture
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03K—PULSE TECHNIQUE
- H03K19/00—Logic circuits, i.e. having at least two inputs acting on one output; Inverting circuits
- H03K19/02—Logic circuits, i.e. having at least two inputs acting on one output; Inverting circuits using specified components
- H03K19/173—Logic circuits, i.e. having at least two inputs acting on one output; Inverting circuits using specified components using elementary logic circuits as components
- H03K19/177—Logic circuits, i.e. having at least two inputs acting on one output; Inverting circuits using specified components using elementary logic circuits as components arranged in matrix form
- H03K19/17748—Structural details of configuration resources
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/06—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
- G06N3/063—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using electronic means
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Computer Hardware Design (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- General Physics & Mathematics (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Neurology (AREA)
- Computer Networks & Wireless Communication (AREA)
- Design And Manufacture Of Integrated Circuits (AREA)
- Semiconductor Integrated Circuits (AREA)
- Advance Control (AREA)
Abstract
Description
本出願は、2019年8月14日に出願された米国特許出願第62/886,481号の優先権を主張し、その内容全体が参照により本明細書に組み込まれる。
101 第1の次元
102 タイル
103 第2の次元
104 ベクトル処理ユニット
108 通信インターフェース
108a インターフェース
108b インターフェース
110 セクション
110a セクション
110b セクション
110c セクション
110d セクション
200 アレイ
202 タイル
202a タイル
202b タイル
202c タイル
202d タイル
204 SRAM
206 セルの計算アレイ
208 ベクトル
208a ベクトル
208b ベクトル
210 バスライン
210a バスライン
210b バスライン
210c バスライン
210d バスライン
212 遅延レジスタ
212a 遅延レジスタ
212b 遅延レジスタ
214 入力ベクトル
214a 入力ベクトル
214b 入力ベクトル
300 2次元アレイ
302 タイル
304 遅延レジスタ
306 遅延レジスタ
308 入力ベクトル
Claims (20)
- 複数のタイルを含む集積回路のチップを動作させるための方法であって、
計算を実行するための前記集積回路の前記タイルの構成を決定するステップと、
前記タイルの前記構成が第1の基準を満たすとき、前記集積回路を、
前記集積回路の前記タイルの各々において前記計算のためのそれぞれの入力データを同時に受信すること
を含む、第1のモードで動作させるステップと、
前記タイルの前記構成が第2の基準を満たすとき、前記集積回路を、
第1の時間において、前記集積回路の第1のグループのタイルの各タイルにおいて前記計算のためのそれぞれの第1の入力データを同時に受信することと、
前記第1の時間において、複数の遅延レジスタの各々に前記計算のためのそれぞれの第2の入力データを記憶することであり、各遅延レジスタが、前記集積回路の第2のグループのタイルのうちの1つのタイルに対応する、記憶することと、
第2の時間において、前記第2の入力データを前記遅延レジスタから解放し、前記解放されたそれぞれの第2の入力データを、前記第2のグループのタイルの各タイルにおいて受信することと
を含む、第2のモードで動作させるステップと
を含む方法。 - 前記計算を実行するための前記タイルの構成を決定するステップが、前記計算を実行するために動作可能なタイルの数およびパーセンテージのうちの1つまたは複数を決定するステップを含む、請求項1に記載の方法。
- 前記第1の基準が、前記計算を実行するように動作可能なタイルの前記数またはパーセンテージがしきい値数またはしきい値パーセンテージ未満であることを含み、
前記第2の基準が、前記計算を実行するように動作可能なタイルの前記数またはパーセンテージがしきい値数またはしきい値パーセンテージよりも大きいことを含む、
請求項2に記載の方法。 - 前記計算を実行するための前記タイルの構成を決定するステップが、前記計算を実行するために動作可能なタイルの列の数を決定するステップを含む、請求項1に記載の方法。
- 前記第1の基準が、前記計算を実行するように動作可能なタイルの列の前記数またはパーセンテージがしきい値数またはしきい値パーセンテージ未満であることを含み、
前記第2の基準が、前記計算を実行するように動作可能なタイルの列の前記数またはパーセンテージがしきい値数またはしきい値パーセンテージよりも大きいことを含む、
請求項4に記載の方法。 - 前記タイルの前記構成が前記第1の基準または前記第2の基準を満たすかどうかを決定するステップを含む、請求項1に記載の方法。
- 前記集積回路を第2のモードで動作させるステップが、前記遅延レジスタを有効にするようにマルチプレクサを動作させるステップを含む、請求項1に記載の方法。
- 前記集積回路を第1のモードで動作させるステップが、前記遅延レジスタを無効にするように前記マルチプレクサを動作させるステップを含む、請求項7に記載の方法。
- 前記第1の時間が、第1のクロックサイクルであり、
前記第2の時間が、次のクロックサイクルである、請求項1に記載の方法。 - 前記第1のモードでそれぞれの入力データを同時に受信するステップが、各タイルにおいて入力データのベクトルを受信するステップを含む、請求項1に記載の方法。
- 前記集積回路を第1のモードで動作させるステップが、前記それぞれの入力データを処理するために、前記集積回路の前記タイルの各々を動作させるステップを含む、請求項1に記載の方法。
- 前記集積回路を第2のモードで動作させるステップが、
前記それぞれの第1の入力データを処理するために、前記第1のグループの前記タイルの各々を動作させるステップと、
前記遅延レジスタから解放された前記それぞれの第2の入力データを処理するために、前記第2のグループの前記タイルの各々を動作させるステップと
を含む、請求項1に記載の方法。 - 前記第1の基準および前記第2の基準の指示をコンパイラから受信するステップを含む、請求項1に記載の方法。
- 集積回路であって、
各々が対応する第1のバスラインに接続された複数の遅延レジスタと、
複数のタイルであって、第1のグループの前記タイルの各タイルが、対応する第2のバスラインに接続され、第2のグループの前記タイルの各タイルが、前記第1のバスラインの対応する1つに接続されている、複数のタイルと、
コントローラであって、
計算を実行するための前記第1のグループの前記タイルおよび前記第2のグループの前記タイルの構成を決定することと、
前記タイルの前記構成が第1の基準を満たすとき、前記第1のバスラインおよび前記第2のバスラインを介して前記複数のタイルの各々において、前記計算のためのそれぞれの入力データが同時に受信される第1のモードで動作するように前記集積回路を制御することと、
前記タイルの前記構成が第2の基準を満たすとき、
第1の時間において、前記計算のためのそれぞれの第1の入力データが、前記第1のグループのタイルの各タイルにおいて同時に受信され、
前記第1の時間において、前記計算のためのそれぞれの第2の入力データが、前記遅延レジスタの各々に記憶され、
第2の時間において、前記第2の入力データが前記遅延レジスタから解放され、前記解放されたそれぞれの第2の入力データが、前記第2のグループのタイルの各タイルにおいて受信される、
第2のモードで動作するように前記集積回路を制御することと
を行うように構成されているコントローラと
を含む集積回路。 - 各第2のバスラインに接続されたマルチプレクサを含む、請求項14に記載の集積回路。
- 前記タイルが2次元アレイに配列されている、請求項14に記載の集積回路。
- 前記集積回路が、特定用途向け集積回路(ASIC)を含む、請求項14に記載の集積回路。
- 各タイルが、
複数の計算セル、
前記計算セルに結合されたメモリ、および
前記タイルとの間でデータを伝達するように構成された制御可能バスライン
を含む、請求項14に記載の集積回路。 - 前記タイルのうちの少なくとも1つが、前記コントローラとして動作するように構成されている、請求項14に記載の集積回路。
- 通信インターフェースを含む、請求項14に記載の集積回路。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962886481P | 2019-08-14 | 2019-08-14 | |
US62/886,481 | 2019-08-14 | ||
PCT/US2020/046287 WO2021030653A1 (en) | 2019-08-14 | 2020-08-14 | Dual-mode operation of application specific integrated circuits |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022544512A true JP2022544512A (ja) | 2022-10-19 |
JP7423755B2 JP7423755B2 (ja) | 2024-01-29 |
Family
ID=72243244
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022508894A Active JP7423755B2 (ja) | 2019-08-14 | 2020-08-14 | 特定用途向け集積回路のデュアルモード動作 |
Country Status (8)
Country | Link |
---|---|
US (1) | US11811401B2 (ja) |
EP (1) | EP3824554B1 (ja) |
JP (1) | JP7423755B2 (ja) |
KR (1) | KR102664456B1 (ja) |
CN (1) | CN114223000B (ja) |
DK (1) | DK3824554T3 (ja) |
TW (1) | TWI794636B (ja) |
WO (1) | WO2021030653A1 (ja) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006163815A (ja) * | 2004-12-07 | 2006-06-22 | Matsushita Electric Ind Co Ltd | 再構成可能な信号処理プロセッサ |
JP2007293556A (ja) * | 2006-04-25 | 2007-11-08 | Ip Flex Kk | 集積回路装置 |
JP2012194774A (ja) * | 2011-03-16 | 2012-10-11 | Ricoh Co Ltd | Simd型マイクロプロセッサ |
JP2019109892A (ja) * | 2017-12-19 | 2019-07-04 | 三星電子株式会社Samsung Electronics Co.,Ltd. | 計算のためのシステムと方法 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7840914B1 (en) * | 2005-05-13 | 2010-11-23 | Massachusetts Institute Of Technology | Distributing computations in a parallel processing environment |
EP1933463A1 (en) | 2005-10-05 | 2008-06-18 | Matsushita Electric Industrial Co., Ltd. | Reconfigurable semiconductor integrated circuit and its processing allocation method |
US8990651B2 (en) | 2007-09-19 | 2015-03-24 | Tabula, Inc. | Integrated circuit (IC) with primary and secondary networks and device containing such an IC |
CN101566972B (zh) * | 2009-05-12 | 2010-12-08 | 苏州国芯科技有限公司 | 嵌入式系统用户多分区存储空间访问权限的安全控制方法 |
US20140095847A1 (en) * | 2012-09-28 | 2014-04-03 | Doron Orenstein | Instruction and highly efficient micro-architecture to enable instant context switch for user-level threading |
US9660650B1 (en) * | 2014-03-13 | 2017-05-23 | Altera Corporation | Integrated circuits with improved register circuitry |
US9529947B1 (en) * | 2014-10-28 | 2016-12-27 | Altera Corporation | Register retiming and verification of an integrated circuit design |
US10152565B2 (en) * | 2015-06-03 | 2018-12-11 | Altera Corporation | Methods for performing register retiming operations into synchronization regions interposed between circuits associated with different clock domains |
US10324730B2 (en) * | 2016-03-24 | 2019-06-18 | Mediatek, Inc. | Memory shuffle engine for efficient work execution in a parallel computing system |
US10169518B1 (en) * | 2016-11-03 | 2019-01-01 | Intel Corporation | Methods for delaying register reset for retimed circuits |
US11675588B2 (en) * | 2021-08-20 | 2023-06-13 | Micron Technology, Inc. | Tile-based result buffering in memory-compute systems |
-
2020
- 2020-08-14 EP EP20761984.2A patent/EP3824554B1/en active Active
- 2020-08-14 WO PCT/US2020/046287 patent/WO2021030653A1/en unknown
- 2020-08-14 CN CN202080057338.4A patent/CN114223000B/zh active Active
- 2020-08-14 JP JP2022508894A patent/JP7423755B2/ja active Active
- 2020-08-14 US US17/634,744 patent/US11811401B2/en active Active
- 2020-08-14 DK DK20761984.2T patent/DK3824554T3/da active
- 2020-08-14 TW TW109127786A patent/TWI794636B/zh active
- 2020-08-14 KR KR1020227004412A patent/KR102664456B1/ko active IP Right Grant
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006163815A (ja) * | 2004-12-07 | 2006-06-22 | Matsushita Electric Ind Co Ltd | 再構成可能な信号処理プロセッサ |
US20080034235A1 (en) * | 2004-12-07 | 2008-02-07 | Masahiro Houshaku | Reconfigurable Signal Processor |
JP2007293556A (ja) * | 2006-04-25 | 2007-11-08 | Ip Flex Kk | 集積回路装置 |
JP2012194774A (ja) * | 2011-03-16 | 2012-10-11 | Ricoh Co Ltd | Simd型マイクロプロセッサ |
JP2019109892A (ja) * | 2017-12-19 | 2019-07-04 | 三星電子株式会社Samsung Electronics Co.,Ltd. | 計算のためのシステムと方法 |
Also Published As
Publication number | Publication date |
---|---|
JP7423755B2 (ja) | 2024-01-29 |
CN114223000B (zh) | 2023-06-06 |
US11811401B2 (en) | 2023-11-07 |
EP3824554A1 (en) | 2021-05-26 |
TWI794636B (zh) | 2023-03-01 |
KR20220032089A (ko) | 2022-03-15 |
WO2021030653A1 (en) | 2021-02-18 |
KR102664456B1 (ko) | 2024-05-10 |
DK3824554T3 (da) | 2022-10-24 |
EP3824554B1 (en) | 2022-10-05 |
US20220286135A1 (en) | 2022-09-08 |
TW202107326A (zh) | 2021-02-16 |
CN114223000A (zh) | 2022-03-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102614616B1 (ko) | 동형 암호화에 의한 보안 계산 가속화를 위한 동형 처리 유닛(hpu) | |
US20230010315A1 (en) | Application specific integrated circuit accelerators | |
KR102459854B1 (ko) | 심층 신경망용 가속기 | |
EP0086052B1 (en) | Segregator functional plane for use in a modular array processor | |
TWI771675B (zh) | 控制流程屏障和可重組態的資料處理器 | |
US11762602B2 (en) | Enhanced input of machine-learning accelerator activations | |
CN110210615B (zh) | 一种用于执行神经网络计算的脉动阵列系统 | |
KR20220015813A (ko) | 딥러닝 연산 수행 방법 및 장치 | |
CN209766043U (zh) | 存算一体芯片、存储单元阵列结构 | |
WO1984000226A1 (en) | Interconnecting plane for modular array processor | |
US11868243B2 (en) | Topological scheduling | |
US4543642A (en) | Data Exchange Subsystem for use in a modular array processor | |
JP2023107786A (ja) | オンチップ動作の初期化 | |
JP7423755B2 (ja) | 特定用途向け集積回路のデュアルモード動作 | |
EP4128234A1 (en) | Stacked-die neural network with integrated high-bandwidth memory | |
US9519807B1 (en) | Hash generation circuitry and methods for multi-channel, multi-lane encryption and authentication | |
US20220318638A1 (en) | Propagation latency reduction | |
CN103914429A (zh) | 用于粗粒度动态可重构阵列的多模式数据传输互连器 | |
Rezaei et al. | Smart Memory: Deep Learning Acceleration In 3D-Stacked Memories | |
JP2007249744A (ja) | 演算処理ユニット |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220408 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230329 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230410 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20230710 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230911 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231218 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240117 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7423755 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |