JP2005531843A - アレイプロセッサにおける除算 - Google Patents
アレイプロセッサにおける除算 Download PDFInfo
- Publication number
- JP2005531843A JP2005531843A JP2004517068A JP2004517068A JP2005531843A JP 2005531843 A JP2005531843 A JP 2005531843A JP 2004517068 A JP2004517068 A JP 2004517068A JP 2004517068 A JP2004517068 A JP 2004517068A JP 2005531843 A JP2005531843 A JP 2005531843A
- Authority
- JP
- Japan
- Prior art keywords
- array
- cell
- processing
- cells
- processor
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012545 processing Methods 0.000 claims abstract description 37
- 238000004891 communication Methods 0.000 claims abstract description 36
- 238000000034 method Methods 0.000 claims abstract description 26
- 230000003068 static effect Effects 0.000 claims abstract description 8
- 210000004027 cell Anatomy 0.000 claims description 81
- 230000006870 function Effects 0.000 claims description 12
- 238000003491 array Methods 0.000 claims description 11
- 238000013507 mapping Methods 0.000 claims description 8
- 238000002940 Newton-Raphson method Methods 0.000 claims description 6
- 210000003888 boundary cell Anatomy 0.000 claims description 5
- 230000015572 biosynthetic process Effects 0.000 claims description 2
- 238000003786 synthesis reaction Methods 0.000 claims description 2
- 102000006822 Agouti Signaling Protein Human genes 0.000 claims 2
- 108010072151 Agouti Signaling Protein Proteins 0.000 claims 2
- 239000011159 matrix material Substances 0.000 claims 2
- 230000008568 cell cell communication Effects 0.000 claims 1
- 230000003044 adaptive effect Effects 0.000 abstract description 10
- 230000000737 periodic effect Effects 0.000 abstract description 6
- 230000004044 response Effects 0.000 abstract description 6
- 230000008569 process Effects 0.000 abstract description 5
- 239000013589 supplement Substances 0.000 abstract description 2
- 239000000047 product Substances 0.000 description 10
- 238000004364 calculation method Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 9
- 238000010606 normalization Methods 0.000 description 9
- 238000007792 addition Methods 0.000 description 8
- 230000008901 benefit Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000007667 floating Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000008275 binding mechanism Effects 0.000 description 1
- 230000001364 causal effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000002040 relaxant effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F15/00—Digital computers in general; Data processing equipment in general
- G06F15/76—Architectures of general purpose stored program computers
- G06F15/80—Architectures of general purpose stored program computers comprising an array of processing units with common control, e.g. single instruction multiple data processors
- G06F15/8007—Architectures of general purpose stored program computers comprising an array of processing units with common control, e.g. single instruction multiple data processors single instruction multiple data [SIMD] multiprocessors
- G06F15/8023—Two dimensional arrays, e.g. mesh, torus
Landscapes
- Engineering & Computer Science (AREA)
- Computer Hardware Design (AREA)
- Theoretical Computer Science (AREA)
- Computing Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Complex Calculations (AREA)
Abstract
Description
(1)係数および状態記憶を用いてタップ計算の全てをローカライズするための計算ハードウェアおよびメモリを有する専用のセル;(2)セルの機能を部分的にプログラムでき且つ様々なセルにわたって複製することができるという事実、を含む。
A.一貫したセルおよびアレイ構造を保持して、簡単な最適化を促進すること;
B.より広いアレイサイズへの拡張可能性をもたらすこと;
C.可能な範囲で部分的な通信を保持して、出力を最小限に抑えるとともに、通信上の障害を回避すること;
D.プログラミングが容易であること;
E.必要に応じてマッピング方法およびマッピングツールを簡単に開発することができること。
e ss1.0bbbbbbbbbbbbbbbbbbbb
正規パス1:0b000.010000000000000000000
正規パス2:0b000.100000000000000000000
正規パス3:0b001.000000000000000000000
正規化された仮数
0b001.000000000000000000000
指数 (−3)
0b111101予想値−>0b111101
yn+1=2yn−yn 2Xnorm
120 制御部
130 レジスタファイル
140 通信制御機能部
201,210,220,230,240 プロセッサ
310 物理出力ポート
320 論理入力ポート
330 ランダムアクセス構成
340 Bind inxレジスタ
350 構成マルチプレクサ
410 プログラマブルデータパス要素
420 内部記憶レジスタ
430 入力データポート
440 データパス結果
450 ローカルレジスタ
460 出力ポート
Claims (25)
- デジタル信号処理演算を実行する装置であって、
複数の処理セルから成る二次元アレイを備え、
各前記処理セルは、その最も近くに隣接した処理セルと通信を行ない、反復アルゴリズムの少なくとも1回の反復を実行し、前記反復アルゴリズムが自己制御式であることを特徴とする装置。 - セル間の通信が前記最も近くに隣接した処理セルに制限されることを特徴とする請求項1に記載の装置。
- 前記最も近くに隣接した処理セルとの通信はプログラム可能な静的方式に従うことを特徴とする請求項2に記載の装置。
- 前記反復アルゴリズムは除算を実行することを特徴とする請求項2に記載の装置。
- 各前記処理セルは4つの出力ポートを有することを特徴とする請求項4に記載の装置。
- 各前記処理セルは、前記最も近くに隣接した処理セルからの出力ポート、内部に記憶されたデータ、あるいは、これらの任意の組み合わせのうちの1つを入力として受け取ることを特徴とする請求項5に記載の装置。
- 各前記処理セルが、最も近くに隣接した出力ポートの様々な組み合わせをその論理入力ポートへとマッピングしたものを記憶するためのメモリを有することを特徴とする請求項6に記載の装置。
- 前記メモリがレジスタを備えることを特徴とする請求項7に記載の装置。
- 各前記処理セルは、ニュートン・ラフソン法の一回の反復を実行することを特徴とする請求項8に記載の装置。
- 前記算術制御アーキテクチャは、
ローカルコントローラと、
内部記憶レジスタと、
データパス要素と、を備えることを特徴とする請求項9に記載の装置。 - 前記データパス要素は、少なくとも加算、乗算、シフト演算を実行可能であることを特徴とする請求項10に記載の装置。
- 前記データパス要素には、前記ローカルコントローラにより、RISC型オペコードが与えられていることを特徴とする請求項11に記載の装置。
- 前記算術制御アーキテキチャは、
ローカルVLIWコントローラと、
内部記憶レジスタと、
複数のデータパス要素と、を備えることを特徴とする請求項9に記載の装置。 - 前記データパス要素はそれぞれ、少なくとも加算、乗算、シフト演算を実行可能であることを特徴とする請求項13に記載の装置。
- 前記処理セルはASIPとして実現されることを特徴とする請求項13に記載の装置。
- 前記ASIPはアーキテクチャ合成ツールによって生成されることを特徴とする請求項15に記載の装置。
- 1つ以上の重畳された小さい二次元アレイを更に備え、
前記重畳された各アレイは、一層下側のアレイにおける特定の収束点で、前記一層下側のアレイと通信を行なうことを特徴とする請求項9に記載の装置。 - 1つ以上の重畳された小さい二次元アレイを更に備え、
前記重畳された各アレイは、一層下側のアレイにおける特定の収束点で、前記一層下側のアレイと通信を行なうことを特徴とする請求項13に記載の装置。 - プログラム可能な境界セルを更に備え、
このプログラマブル境界セルは、全てのアレイ階層内の利用可能なポートに接続するとともに、外部プロセッサとの通信を容易にすることを特徴とする請求項17に記載の装置。 - プログラム可能な境界セルを更に備え、
このプログラム可能な境界セルは、全てのアレイ階層内の利用可能なポートに接続するとともに、外部プロセッサとの通信を容易にすることを特徴とする請求項19に記載の装置。 - 除算アルゴリズムを効率的に実行する方法であって、
前記除算アルゴリズムを、自己制御アルゴリズムの複数の反復に分割するステップであって、前記複数の反復のそれぞれが、複数のセルから成るマトリクスのうちの単一セル上で実行可能なステップと、
除算されるべき数とは無関係に、同数の反復を実行するステップとを含む方法。 - 各前記反復は、セルマトリクスの別個のセル上で実行されることを特徴とする請求項21に記載の方法。
- 各前記反復は、数値が所定の範囲外にある場合にはその数値を右または左にシフトし、数値が前記所定の範囲内にある場合にはその数値をシフトしないステップをさらに含むことを特徴とする請求項22に記載の方法。
- 前記反復アルゴリズムは、平方根関数を実行するために利用されることを特徴とする請求項3に記載の装置。
- 前記処理セルのサブセットがそれぞれ異なるアルゴリズムを実行し、複数の前記サブセットを互いに結び付けることにより、完全なシグナルチェーンが実施されることを特徴とする請求項3に記載の装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10/184,514 US20040003201A1 (en) | 2002-06-28 | 2002-06-28 | Division on an array processor |
PCT/IB2003/002548 WO2004003780A2 (en) | 2002-06-28 | 2003-06-05 | Division on an array processor |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005531843A true JP2005531843A (ja) | 2005-10-20 |
Family
ID=29779381
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004517068A Pending JP2005531843A (ja) | 2002-06-28 | 2003-06-05 | アレイプロセッサにおける除算 |
Country Status (6)
Country | Link |
---|---|
US (1) | US20040003201A1 (ja) |
EP (1) | EP1520232A2 (ja) |
JP (1) | JP2005531843A (ja) |
CN (1) | CN100492342C (ja) |
AU (1) | AU2003239304A1 (ja) |
WO (1) | WO2004003780A2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013206293A (ja) * | 2012-03-29 | 2013-10-07 | Fujitsu Semiconductor Ltd | リコンフィグ可能な集積回路装置 |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2395298B (en) * | 2002-09-17 | 2007-02-14 | Micron Technology Inc | Flexible results pipeline for processing element |
US7299339B2 (en) | 2004-08-30 | 2007-11-20 | The Boeing Company | Super-reconfigurable fabric architecture (SURFA): a multi-FPGA parallel processing architecture for COTS hybrid computing framework |
US8755515B1 (en) | 2008-09-29 | 2014-06-17 | Wai Wu | Parallel signal processing system and method |
CN102200961B (zh) * | 2011-05-27 | 2013-05-22 | 清华大学 | 一种动态可重构处理器内子单元的扩展方法 |
CN103543984B (zh) * | 2012-07-11 | 2016-08-10 | 世意法(北京)半导体研发有限责任公司 | 用于特殊相关应用的修改型平衡吞吐量数据路径架构 |
CN103543983B (zh) * | 2012-07-11 | 2016-08-24 | 世意法(北京)半导体研发有限责任公司 | 用于提高平衡吞吐量数据路径架构上的fir操作性能的新颖数据访问方法 |
US10885985B2 (en) | 2016-12-30 | 2021-01-05 | Western Digital Technologies, Inc. | Processor in non-volatile storage memory |
US10114795B2 (en) | 2016-12-30 | 2018-10-30 | Western Digital Technologies, Inc. | Processor in non-volatile storage memory |
US10581407B2 (en) * | 2018-05-08 | 2020-03-03 | The Boeing Company | Scalable fir filter |
CN109471062A (zh) * | 2018-11-14 | 2019-03-15 | 深圳美图创新科技有限公司 | 定位方法、定位装置及定位系统 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4380051A (en) * | 1980-11-28 | 1983-04-12 | Motorola, Inc. | High speed digital divider having normalizing circuitry |
GB8605366D0 (en) * | 1986-03-05 | 1986-04-09 | Secr Defence | Digital processor |
US5038386A (en) * | 1986-08-29 | 1991-08-06 | International Business Machines Corporation | Polymorphic mesh network image processing system |
US4985832A (en) * | 1986-09-18 | 1991-01-15 | Digital Equipment Corporation | SIMD array processing system with routing networks having plurality of switching stages to transfer messages among processors |
US4964032A (en) * | 1987-03-27 | 1990-10-16 | Smith Harry F | Minimal connectivity parallel data processing system |
US5671170A (en) * | 1993-05-05 | 1997-09-23 | Hewlett-Packard Company | Method and apparatus for correctly rounding results of division and square root computations |
US20030065904A1 (en) * | 2001-10-01 | 2003-04-03 | Koninklijke Philips Electronics N.V. | Programmable array for efficient computation of convolutions in digital signal processing |
-
2002
- 2002-06-28 US US10/184,514 patent/US20040003201A1/en not_active Abandoned
-
2003
- 2003-06-05 JP JP2004517068A patent/JP2005531843A/ja active Pending
- 2003-06-05 EP EP03732875A patent/EP1520232A2/en not_active Withdrawn
- 2003-06-05 AU AU2003239304A patent/AU2003239304A1/en not_active Abandoned
- 2003-06-05 WO PCT/IB2003/002548 patent/WO2004003780A2/en active Application Filing
- 2003-06-05 CN CNB038152258A patent/CN100492342C/zh not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013206293A (ja) * | 2012-03-29 | 2013-10-07 | Fujitsu Semiconductor Ltd | リコンフィグ可能な集積回路装置 |
Also Published As
Publication number | Publication date |
---|---|
CN100492342C (zh) | 2009-05-27 |
WO2004003780A3 (en) | 2004-12-29 |
WO2004003780A2 (en) | 2004-01-08 |
US20040003201A1 (en) | 2004-01-01 |
EP1520232A2 (en) | 2005-04-06 |
AU2003239304A1 (en) | 2004-01-19 |
AU2003239304A8 (en) | 2004-01-19 |
CN1729464A (zh) | 2006-02-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Kwon et al. | Maeri: Enabling flexible dataflow mapping over dnn accelerators via reconfigurable interconnects | |
US11995027B2 (en) | Neural processing accelerator | |
US10223334B1 (en) | Native tensor processor | |
JP7315317B2 (ja) | プロセッサおよびプロセッサのデータ転送方法 | |
Nath et al. | Efficient VLSI networks for parallel processing based on orthogonal trees | |
US5081575A (en) | Highly parallel computer architecture employing crossbar switch with selectable pipeline delay | |
CN110352435A (zh) | 利用链接指令的神经网络处理 | |
WO2017127086A1 (en) | Analog sub-matrix computing from input matrixes | |
Kung | Computational models for parallel computers | |
Bartoloni et al. | A hardware implementation of the APE100 architecture | |
US10853034B2 (en) | Common factor mass multiplication circuitry | |
JP2005531843A (ja) | アレイプロセッサにおける除算 | |
NL2015114B1 (en) | Scalable computation architecture in a memristor-based array. | |
JP2005504394A (ja) | デジタル信号処理でコンボリューション演算を効率的に行うプログラマブルアレイ | |
Das et al. | Multi-Mesh-an efficient topology for parallel processing | |
US7260709B2 (en) | Processing method and apparatus for implementing systolic arrays | |
KR20050016642A (ko) | 디지털 신호 처리 동작 구현 장치 및 분할 알고리즘 실행방법 | |
Kung | Warp experience: we can map computations onto a parallel computer efficiently | |
Pechanek et al. | An introduction to an array memory processor for application specific acceleration | |
JP7243006B1 (ja) | ネットワークオンチップリコンフィギュアビリティ | |
Laghari et al. | Scheduling Techniques of Processor Scheduling in Cellular Automaton | |
US20240329930A1 (en) | Heterogeneous multi-functional reconfigurable processing-in-memory architecture | |
Kim et al. | Mapping of neural networks onto the memory-processor integrated architecture | |
CN114443146A (zh) | 基于存算一体存储器的矢量处理器及其运行方法 | |
Kumawat et al. | CNN agnostic accelerator design for low latency inference on FPGAs |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060605 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20071226 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080104 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20080404 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20080411 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080626 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20080703 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090717 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20091218 |