JP2011034566A - マルチmacアーキテクチャにおける低電力firフィルタ - Google Patents
マルチmacアーキテクチャにおける低電力firフィルタ Download PDFInfo
- Publication number
- JP2011034566A JP2011034566A JP2010173110A JP2010173110A JP2011034566A JP 2011034566 A JP2011034566 A JP 2011034566A JP 2010173110 A JP2010173110 A JP 2010173110A JP 2010173110 A JP2010173110 A JP 2010173110A JP 2011034566 A JP2011034566 A JP 2011034566A
- Authority
- JP
- Japan
- Prior art keywords
- adder
- multiplier
- mac
- output
- mac unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 claims abstract description 27
- 230000015654 memory Effects 0.000 claims description 52
- 238000012545 processing Methods 0.000 claims description 16
- 230000004044 response Effects 0.000 claims description 5
- 238000010586 diagram Methods 0.000 description 8
- 230000035508 accumulation Effects 0.000 description 4
- 238000009825 accumulation Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000001914 filtration Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F7/00—Methods or arrangements for processing data by operating upon the order or content of the data handled
- G06F7/38—Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation
- G06F7/48—Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices
- G06F7/544—Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices for evaluating functions by calculation
- G06F7/5443—Sum of products
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computational Mathematics (AREA)
- Computing Systems (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Complex Calculations (AREA)
Abstract
【解決手段】本発明の実施形態は、チェーンの第1の乗加算器の出力結果をチェーンの第2の後続乗加算器への入力として供給することによって、2つ以上の乗加算器ユニット(210、220、230、240)の乗加算器チェーンの演算をスケジュールして、比較的低いワット損を可能にするシステムおよび方法を対象とする。
【選択図】図2
Description
ここで、x[n]は入力信号のデータ値を表し、c[i]は係数値を表し、y[n]は出力信号を表し、和はフィルタ次数Nに従ってゼロに等しいiからNに等しいiまでのすべてのi係数にわたって取られ、ここで、N次フィルタは式の右辺に(n+1)項を有する。
y[n+1]=Σc[i]・x[n+1−i]
y[n+2]=Σc[i]・x[n+2−i]
y[n+3]=Σc[i]・x[n+3−i]
本発明の実施形態に従って、ワット損を低減しうる効率的な方法でユニット210〜240などの4つの有効なMACユニットで4並列演算がスケジュールされてもよい。各MACユニットに対して、出力の計算に必要なすべてのサイクルに対して乗算器への入力オペランドとして単一の係数値を使用することによって、比較的低いワット損が実現され得る。
4つのMACユニットを有する図3に示されるマルチMACアーキテクチャにおいて、加算器の各出力y[n]は、4回演算され、第1の加算器212にシフトバックされる前に4つの乗算器の4つの乗算の結果が累算される。このアーキテクチャはP個のMACユニットを有するアーキテクチャに一般化されてもよく、この場合、各出力はシフトバックされる前にP回演算されてもよいことを当業者は理解されたい。
101 プロセッサ
102 データ・メモリ・ユニット
103 プログラム・メモリ・ユニット
104 データ・メモリ・バス
105 プログラム・メモリ・バス
107 ロード/記憶ユニット
108 プログラム制御ユニット
109 メモリコントローラ
110 マルチMACユニット
111 算術論理ユニット(ALU)
112 機能ユニット
200、300、400 マルチMACユニット
201 クロック信号
210、220、230、240、310、320、330、340、410、420、410、420、430、440 MACユニット
211、221、231、241 乗算器
212、222、232、242 加算器
213、223、233、243 メモリユニットまたは素子
214、215、224、225、234、235、244、255 入力信号
216、226、236、246 出力線
226、236、246 信号線
419、429、439、449 マルチプレクサ
500、510、520、530 ボックス
Claims (15)
- 信号処理用装置であって、
2つ以上の乗加算器のチェーンを備え、各乗加算器が乗算器および加算器を含み、前記チェーンの第1の乗加算器の出力結果が前記チェーンの第2の後続乗加算器の加算器への入力として供給されるように前記2つ以上の乗加算器が配置されている、信号処理用装置。 - 前記第2の乗加算器の前記乗算器は、2つのオペランドを受け取って乗じ、前記第2の乗加算器の前記加算器は、前記第2の乗加算器の前記乗算器からの出力結果と前記第1の乗加算器の出力とを受け取って加算する、請求項1に記載の装置。
- 前記チェーンの最後の乗加算器の出力結果が、前記チェーンの前記第1の乗加算器の加算器への入力として供給される、請求項1に記載の装置。
- 前記第1の乗加算器の前記加算器は、前記第1の乗加算器の前記乗算器の積と前記最後の乗加算器の前記出力結果とを加算すること、及び前記チェーンの前記最後の乗加算器の乗算器の積と事前に記憶された値とを加算することのうちの少なくとも一方を行う、請求項3に記載の装置。
- 前記チェーンの前記第1の乗加算器は、前記第1の乗加算器の前記加算器の前記出力または前記第1の乗加算器の前記加算器への入力としての前記最後の乗加算器の前記加算器の出力のいずれかを選択するマルチプレクサを備える、請求項3に記載の装置。
- 前記チェーンの乗加算器の乗算器は、有限インパルス応答フィルタの係数およびデータを受け取り、前記係数は所定の時間一定である、請求項1に記載の装置。
- 前記乗加算器の各々は、それぞれの加算器の出力を所定の時間保持するためのメモリ素子を備える、請求項1に記載の装置。
- 前記チェーンの前記乗加算器の少なくとも1つは、前記乗加算器の前記加算器の前記出力または先行する乗加算器の前記加算器の出力のいずれかを前記乗加算器の前記加算器への入力として選択するマルチプレクサを備える、請求項1に記載の装置。
- 信号を処理するための方法であって、
2つ以上の乗加算器のチェーンの第1の乗加算器の出力結果を、前記チェーンの第2の後続乗加算器への入力として供給することを備え、前記乗加算器の各々は乗算器および加算器を含む、方法。 - 前記第2の乗加算器の前記乗算器によって2つのオペランドを乗じること、
前記第2の乗加算器の加算器によって、前記第2の乗加算器の前記乗算器からの出力結果と前記チェーンの前記第1の乗加算器の加算器の出力とを加算すること
をさらに備える、請求項9に記載の方法。 - 前記チェーンの最後の乗加算器の出力結果を、前記第1の乗加算器の加算器への入力として供給することをさらに備える、請求項9に記載の方法。
- 前記第1の乗加算器の前記加算器によって、前記第1の乗加算器の前記乗算器の積を前記最後の乗加算器の前記出力結果に加算することをさらに備える、請求項11に記載の方法。
- 前記チェーンの前記乗加算器の少なくとも1つのマルチプレクサによって、前記乗加算器の前記加算器の前記出力または先行する乗加算器の加算器の出力のいずれかを前記乗加算器の前記加算器への入力として選択することをさらに備える、請求項11に記載の方法。
- 前記第1の乗加算器の前記加算器によって、前記最後の乗加算器の乗算器の積を事前に記憶された値に加算することをさらに備える、請求項11に記載の方法。
- 前記チェーンの乗加算器の乗算器によって、有限インパルス応答フィルタの係数およびデータを受け取って前記係数を所定の時間一定に保つことをさらに備える、請求項9に記載の方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US12/512,032 US8706791B2 (en) | 2009-07-30 | 2009-07-30 | Low power fir filter in multi-MAC architecture |
US12/512,032 | 2009-07-30 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2011034566A true JP2011034566A (ja) | 2011-02-17 |
JP2011034566A5 JP2011034566A5 (ja) | 2013-09-12 |
JP5544240B2 JP5544240B2 (ja) | 2014-07-09 |
Family
ID=43216926
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010173110A Active JP5544240B2 (ja) | 2009-07-30 | 2010-07-30 | マルチmacアーキテクチャにおける低電力firフィルタ |
Country Status (4)
Country | Link |
---|---|
US (1) | US8706791B2 (ja) |
EP (1) | EP2280341B1 (ja) |
JP (1) | JP5544240B2 (ja) |
CA (1) | CA2711027C (ja) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020046642A1 (en) * | 2018-08-31 | 2020-03-05 | Flex Logix Technologies, Inc. | Multiplier-accumulator circuit, logic tile architecture for multiply-accumulate and ic including logic tile array |
JP7165018B2 (ja) * | 2018-10-03 | 2022-11-02 | キヤノン株式会社 | 情報処理装置、情報処理方法 |
US11194585B2 (en) | 2019-03-25 | 2021-12-07 | Flex Logix Technologies, Inc. | Multiplier-accumulator circuitry having processing pipelines and methods of operating same |
US11314504B2 (en) | 2019-04-09 | 2022-04-26 | Flex Logix Technologies, Inc. | Multiplier-accumulator processing pipelines and processing component, and methods of operating same |
US11288076B2 (en) | 2019-09-13 | 2022-03-29 | Flex Logix Technologies, Inc. | IC including logic tile, having reconfigurable MAC pipeline, and reconfigurable memory |
US11455368B2 (en) | 2019-10-02 | 2022-09-27 | Flex Logix Technologies, Inc. | MAC processing pipeline having conversion circuitry, and methods of operating same |
US11693625B2 (en) | 2019-12-04 | 2023-07-04 | Flex Logix Technologies, Inc. | Logarithmic addition-accumulator circuitry, processing pipeline including same, and methods of operation |
US11960856B1 (en) | 2020-01-15 | 2024-04-16 | Flex Logix Technologies, Inc. | Multiplier-accumulator processing pipeline using filter weights having gaussian floating point data format |
US11442881B2 (en) | 2020-04-18 | 2022-09-13 | Flex Logix Technologies, Inc. | MAC processing pipelines, circuitry to control and configure same, and methods of operating same |
US11604645B2 (en) | 2020-07-22 | 2023-03-14 | Flex Logix Technologies, Inc. | MAC processing pipelines having programmable granularity, and methods of operating same |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0844703A (ja) * | 1994-07-28 | 1996-02-16 | Fujitsu Ltd | 積和演算器 |
JPH1196136A (ja) * | 1997-09-24 | 1999-04-09 | Fujitsu Ltd | 積和演算モジュール |
JP2002073586A (ja) * | 2000-08-28 | 2002-03-12 | Matsushita Electric Ind Co Ltd | 演算処理装置 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5931892A (en) * | 1996-12-20 | 1999-08-03 | Compaq Computer Corporation | Enhanced adaptive filtering technique |
US5862063A (en) * | 1996-12-20 | 1999-01-19 | Compaq Computer Corporation | Enhanced wavetable processing technique on a vector processor having operand routing and slot selectable operations |
US6978287B1 (en) * | 2001-04-04 | 2005-12-20 | Altera Corporation | DSP processor architecture with write datapath word conditioning and analysis |
US7570704B2 (en) * | 2005-11-30 | 2009-08-04 | Intel Corporation | Transmitter architecture for high-speed communications |
-
2009
- 2009-07-30 US US12/512,032 patent/US8706791B2/en active Active
-
2010
- 2010-07-23 EP EP10170647.1A patent/EP2280341B1/en active Active
- 2010-07-29 CA CA2711027A patent/CA2711027C/en active Active
- 2010-07-30 JP JP2010173110A patent/JP5544240B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0844703A (ja) * | 1994-07-28 | 1996-02-16 | Fujitsu Ltd | 積和演算器 |
JPH1196136A (ja) * | 1997-09-24 | 1999-04-09 | Fujitsu Ltd | 積和演算モジュール |
JP2002073586A (ja) * | 2000-08-28 | 2002-03-12 | Matsushita Electric Ind Co Ltd | 演算処理装置 |
Also Published As
Publication number | Publication date |
---|---|
US8706791B2 (en) | 2014-04-22 |
JP5544240B2 (ja) | 2014-07-09 |
CA2711027C (en) | 2016-05-10 |
EP2280341B1 (en) | 2013-06-05 |
EP2280341A1 (en) | 2011-02-02 |
CA2711027A1 (en) | 2011-01-30 |
US20110029589A1 (en) | 2011-02-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5544240B2 (ja) | マルチmacアーキテクチャにおける低電力firフィルタ | |
US8271571B2 (en) | Microprocessor | |
KR100715770B1 (ko) | 연산을 수행하는 방법 및 시스템 및 장치 | |
US8443170B2 (en) | Apparatus and method for performing SIMD multiply-accumulate operations | |
Meher | Hardware-efficient systolization of DA-based calculation of finite digital convolution | |
Shieh et al. | Word-based Montgomery modular multiplication algorithm for low-latency scalable architectures | |
US8239442B2 (en) | Computing module for efficient FFT and FIR hardware accelerator | |
KR20050065673A (ko) | 연산을 수행하기 위한 방법, 시스템 및 장치 | |
JPH10187438A (ja) | 乗算器の入力に対する遷移を減少させる方法 | |
JPS6125188B2 (ja) | ||
Meher | Systolic designs for DCT using a low-complexity concurrent convolutional formulation | |
CN113853601A (zh) | 用于矩阵运算的装置和方法 | |
Lin et al. | Scalable montgomery modular multiplication architecture with low-latency and low-memory bandwidth requirement | |
Meher | New approach to LUT implementation and accumulation for memory-based multiplication | |
US9632752B2 (en) | System and method for implementing a multiplication | |
EP2851786A1 (en) | Instruction class for digital signal processors | |
US20100146024A1 (en) | Digital filter, its synthesizing device, synthesizing program and synthesizing program recording medium | |
CN112074810B (zh) | 并行处理设备 | |
Sakellariou et al. | Application-specific low-power multipliers | |
Kumar et al. | Analysis of low power, area and high speed multipliers for DSP applications | |
EP1936492A1 (en) | SIMD processor with reduction unit | |
JP2009245296A (ja) | 積和演算回路 | |
Shahid et al. | A generic approach to the development of coprocessors for elliptic curve cryptosystems | |
KR100386979B1 (ko) | 갈로아체상에서 비트 직렬 승산기의 병렬화 방법 및 이를이용한 직병렬 승산기 | |
CN108140017B (zh) | 用于线性相位有限脉冲响应抽取滤波器的方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20120224 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130726 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130726 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20130726 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20130814 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130820 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20131113 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20131118 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140212 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140415 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140512 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5544240 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |