JP2013025468A - 高速フーリエ変換装置 - Google Patents
高速フーリエ変換装置 Download PDFInfo
- Publication number
- JP2013025468A JP2013025468A JP2011158011A JP2011158011A JP2013025468A JP 2013025468 A JP2013025468 A JP 2013025468A JP 2011158011 A JP2011158011 A JP 2011158011A JP 2011158011 A JP2011158011 A JP 2011158011A JP 2013025468 A JP2013025468 A JP 2013025468A
- Authority
- JP
- Japan
- Prior art keywords
- ram
- butterfly
- stage
- calculation
- fft
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Landscapes
- Complex Calculations (AREA)
Abstract
【課題】1ステージ分のバタフライ演算回路を用意して行う従来の方法では、処理する信号数が大きくなると回路規模が大きくなってしまう問題点があった。また、FFT演算を少ないハードウェア量で出来るだけ処理時間を短くすることに課題がある。
【解決手段】従来手法で1ステージ分のバタフライ演算回路で行っていた演算を、1個のバタフライ演算部を繰り返し使って演算することでゲート数を削減する。また、FFT演算の順番を並び替える最適化をすることで、RAMのリード回数削減と処理時間の短縮を実現する。さらに、RAMから中間データを読み出すアドレスを各ステージで共通化することでアドレス生成部を小型化し、ゲート規模の削減を図る。
【選択図】図1
【解決手段】従来手法で1ステージ分のバタフライ演算回路で行っていた演算を、1個のバタフライ演算部を繰り返し使って演算することでゲート数を削減する。また、FFT演算の順番を並び替える最適化をすることで、RAMのリード回数削減と処理時間の短縮を実現する。さらに、RAMから中間データを読み出すアドレスを各ステージで共通化することでアドレス生成部を小型化し、ゲート規模の削減を図る。
【選択図】図1
Description
本発明は、高速フーリエ変換装置、高速フーリエ変換処理方法に関する。
本技術分野の背景技術として、例えば、特許文献1がある。該公報の要約には、課題として、「FFTを少ないゲート数で実現するアーキテクチャ。」とあり、解決手段として、「バタフライ演算ステージをシーケンス制御回路,入力切り替え回路および順序整列回路を用いることにより1ステージ分のバタフライ演算回路のみで実現する。メモリを配置したことにより、1つの乗算器と3つの加算器を用いて8クロックでバタフライ演算を行う。」と記載されている。
また、本技術分野の背景技術として、例えば、特許文献2がある。該公報の要約には、目的として、「高速フーリエ変換処理におけるバタフライ演算に関し、ハードウェア量が少なくかつ処理時間が短いバタフライ演算方式を提供することを目的とする。」とあり、構成として、「バタフライ演算における乗算後の正規化を省略するように構成される。」と記載されている。
また、本技術分野の背景技術として、例えば、特許文献2がある。該公報の要約には、目的として、「高速フーリエ変換処理におけるバタフライ演算に関し、ハードウェア量が少なくかつ処理時間が短いバタフライ演算方式を提供することを目的とする。」とあり、構成として、「バタフライ演算における乗算後の正規化を省略するように構成される。」と記載されている。
特許文献1の方法では、「1ステージ分のバタフライ演算回路のみで実現する」とあるが、このように、FFTにおけるLog2(N)(NはFFTの処理信号数)回のバタフライ演算ステージを、1ステージ分のバタフライ演算回路を用意して行う方法では、処理する信号数が大きくなると1ステージ分のバタフライ演算回路の規模が大きくなってしまう問題があった。
また、特許文献2は、「ハードウェア量が少なくかつ処理時間が短いバタフライ演算方式を提供することを目的」としているが、特許文献1と同様に、処理する信号数が増加するとハードウェア量が大幅に増加するという問題があった。
また、特許文献2は、「ハードウェア量が少なくかつ処理時間が短いバタフライ演算方式を提供することを目的」としているが、特許文献1と同様に、処理する信号数が増加するとハードウェア量が大幅に増加するという問題があった。
上記課題を解決するため、本発明ではバタフライ演算回路を1ステージ分用意せず、一つのバタフライ演算回路を繰り返し使用して演算を行い、中間演算データをRAMに保持する方法を用いる。この時、一般的なFFTのシグナルフローグラフに沿って繰り返し演算をすると、演算結果数に対してRAMリード回数が2倍の回数となり処理時間が長くなる。そこで、本発明ではRAMからリードした中間演算データを2つの演算にわたって利用できるように演算順序を並び替えることで、RAMリード回数を削減、処理時間を短縮する。
また、繰り返し演算時には、中間演算データをRAMにライト・リードする必要が生じるが、FFTのシグナルフローグラフに沿って演算を行う場合、リードするRAMアドレスの順番はFFT演算のステージごとに異なり、アドレス生成回路はステージごとに異なった順番のアドレスを生成する必要が生じ、回路構成が複雑、大規模化する。本発明では、FFT演算の各ステージにおいて、中間演算データをRAMからリードする際のアドレスの順番が同じとなるよう、演算順序の並び替えを行う。これにより、FFT演算のステージに関係なく同じ順番のアドレスを生成する構成で済むようになる。また、このような構成をとることで、FFTの処理信号点数が増加した場合の回路規模増加を抑えることができ、単純でゲート規模の小さなアドレス生成回路とすることができる。
繰り返し演算順序の並び替えによりRAMのリード回数をおよそ半分に削減でき、処理時間が短縮できる。また、RAMから中間演算データをリードするアドレスの順番を共通化することにより、ステージ数と同数必要だったリードアドレスのパターンが一つで済み、アドレス生成回路の構成を単純化でき、ゲート規模が削減できる。
以下、本発明の実施の形態例について図面により説明する。
図1は、第1の実施例における高速フーリエ変換装置のブロック構成図である。
図1において、1はFFT装置の制御部である。制御部1の構成要素として、外部装置(図示せず)から入力端子101に供給される処理開始トリガ信号を入力として、回転因子生成制御部3をはじめとした各部を制御する全体制御部2、全体制御部2から全体制御信号を受け、回転因子生成制御信号を生成する回転因子生成制御部3、RAM制御部4がある。さらにRAM制御部4の構成要素として、全体制御信号を入力とし、RAM-A 7、RAM-B 8のリード・ライトアドレスを生成するRAMアドレス生成部5、全体制御信号により、外部装置から入力端子102に供給される入力信号、出力端子103から外部装置へ供給する出力信号、各RAMのリード・ライトデータ、バタフライ入力データ、バタフライ演算データを切り替える信号切り替え部6がある。
図1において、1はFFT装置の制御部である。制御部1の構成要素として、外部装置(図示せず)から入力端子101に供給される処理開始トリガ信号を入力として、回転因子生成制御部3をはじめとした各部を制御する全体制御部2、全体制御部2から全体制御信号を受け、回転因子生成制御信号を生成する回転因子生成制御部3、RAM制御部4がある。さらにRAM制御部4の構成要素として、全体制御信号を入力とし、RAM-A 7、RAM-B 8のリード・ライトアドレスを生成するRAMアドレス生成部5、全体制御信号により、外部装置から入力端子102に供給される入力信号、出力端子103から外部装置へ供給する出力信号、各RAMのリード・ライトデータ、バタフライ入力データ、バタフライ演算データを切り替える信号切り替え部6がある。
また図1において、7、8は演算中間データと入力データを格納する2つのRAM、9は回転因子生成制御信号を受け、バタフライ演算で用いる回転因子を生成する回転因子生成部、10はバタフライ入力データと回転因子に対してバタフライ演算を行うバタフライ演算部である。
制御部1、RAM-A 7、RAM-B 8、回転因子生成部9、バタフライ演算部10によってFFT装置が構成されている。
以上のように構成された高速フーリエ変換装置について、以下、その動作を説明する。説明では例としてFFT演算対象信号8点の場合について記述する。
図4は、信号数8の場合のFFTシグナルフロー図である。図中のS0〜S7は入力信号を表し、G0〜G7は出力信号となるFFT演算結果を表している。W2 0、W2 1、W4 0〜W4 3、W8 0〜W8 7はFFT演算の回転因子を表し、実際の値は以下の式で表される。
制御部1、RAM-A 7、RAM-B 8、回転因子生成部9、バタフライ演算部10によってFFT装置が構成されている。
以上のように構成された高速フーリエ変換装置について、以下、その動作を説明する。説明では例としてFFT演算対象信号8点の場合について記述する。
図4は、信号数8の場合のFFTシグナルフロー図である。図中のS0〜S7は入力信号を表し、G0〜G7は出力信号となるFFT演算結果を表している。W2 0、W2 1、W4 0〜W4 3、W8 0〜W8 7はFFT演算の回転因子を表し、実際の値は以下の式で表される。
eはネイピア数、jは虚数単位、πは円周率を表す。
図4のP0〜T1、E0〜H3は演算の中間結果を表す。また、図中左側部分のS0〜S7からP0〜T1を算出する過程をステージ1、中央部分のP0〜T1からE0〜H3を算出する過程をステージ2、右側部分のE0〜H3からG0〜G7を算出する過程をステージ3と呼ぶこととする。
図4の見方について説明する。図の左側が入力、右側が出力となっており、入力信号が矢印の向きに沿って途中で演算されながら出力される様子を表している。矢印の先が重なっている点は2つの信号を加算することを表している。また、破線の矢印は矢印の先にある回転因子を信号に乗算することを表している。例えば、図4のP0はS0+W2 0S4の演算により求まる値である。
図4の見方について説明する。図の左側が入力、右側が出力となっており、入力信号が矢印の向きに沿って途中で演算されながら出力される様子を表している。矢印の先が重なっている点は2つの信号を加算することを表している。また、破線の矢印は矢印の先にある回転因子を信号に乗算することを表している。例えば、図4のP0はS0+W2 0S4の演算により求まる値である。
FFTは図4のシグナルフロー図を演算することで実現される。図からわかるようにステージ3の演算はステージ2の結果を利用し、ステージ2の演算はステージ1の結果を利用する。したがって、ステージ1〜3は順を追って演算する必要がある。しかし、各ステージ内の演算は次のステージの演算を始める前に行うことが出来れば順番は問わない。本発明ではこのことを利用し、演算順序を並び替えることで処理時間の削減と回路規模の縮小を図る。
図1において、処理開始トリガ信号を全体制御部2に入力することにより本装置の動作を開始する。全体制御部2は、状態を持ち条件に沿って状態遷移する状態マシンと制御カウンタを内部に持ち、これらにより全体を制御する。
図2は、全体制御部の状態マシンの状態定義を示した図である。以下、この定義に沿って説明する。状態番号0は待機状態であり、処理を行っていない場合はこの状態である。全体制御部2に処理開始トリガ信号が入力されることで、待機状態から状態番号1のデータ入力状態に遷移する。この状態では入力信号を信号切り替え部6経由でRAM-A 7にライトする。入力データ数は8と決まっているため、全体制御部2が持つ制御カウンタの値が一定の値となった時点で入力終了と判断し、状態マシンは状態番号2のFFT演算ステージ1の状態に遷移する。
図2は、全体制御部の状態マシンの状態定義を示した図である。以下、この定義に沿って説明する。状態番号0は待機状態であり、処理を行っていない場合はこの状態である。全体制御部2に処理開始トリガ信号が入力されることで、待機状態から状態番号1のデータ入力状態に遷移する。この状態では入力信号を信号切り替え部6経由でRAM-A 7にライトする。入力データ数は8と決まっているため、全体制御部2が持つ制御カウンタの値が一定の値となった時点で入力終了と判断し、状態マシンは状態番号2のFFT演算ステージ1の状態に遷移する。
状態番号2 FFT演算ステージ1では、図4のステージ1の演算を行う。ステージ1の演算をP0、P1、・・・、T1と上から順に行うことを考える。この時、図1のRAM-A 7からデータS0、S4、S2、・・・、S7を順にリードする。
図5は、入力データをRAM-A 7に格納した様子を示した図である。RAM-A 7に図5のようにデータが書き込まれているとすれば、0、4、2、6、1、5、3、7という順番でリードアドレスを生成し、RAM-A 7に送ることでデータをリードできる。このリードアドレスはRAMアドレス生成部5で生成する。RAM-A 7からリードしたデータは、信号切り替え部6経由でバタフライ入力データとしてバタフライ演算部10に送る。また、バタフライ入力データとタイミングを合わせて回転因子をバタフライ演算部10へ送る。この回転因子は回転因子生成制御部3で回転因子部生成制御信号を生成し、回転因子生成部9に送ることで生成する。バタフライ演算部10ではこのバタフライ入力データと回転因子に対してバタフライ演算を順次行い、バタフライ演算データを信号切り替え部6へ送る。
図5は、入力データをRAM-A 7に格納した様子を示した図である。RAM-A 7に図5のようにデータが書き込まれているとすれば、0、4、2、6、1、5、3、7という順番でリードアドレスを生成し、RAM-A 7に送ることでデータをリードできる。このリードアドレスはRAMアドレス生成部5で生成する。RAM-A 7からリードしたデータは、信号切り替え部6経由でバタフライ入力データとしてバタフライ演算部10に送る。また、バタフライ入力データとタイミングを合わせて回転因子をバタフライ演算部10へ送る。この回転因子は回転因子生成制御部3で回転因子部生成制御信号を生成し、回転因子生成部9に送ることで生成する。バタフライ演算部10ではこのバタフライ入力データと回転因子に対してバタフライ演算を順次行い、バタフライ演算データを信号切り替え部6へ送る。
図4における演算結果P0、P1、・・・、T1は図1におけるバタフライ演算データとして、信号切り替え部6経由でRAM-B 8にライトする。格納順は演算順とし、RAMアドレス生成部5はライトアドレス0、1、2、3、4、5、6、7を生成し、RAM-B 8に送る。これによりRAM-B 8に図6のようにステージ1の演算結果が格納される。
図6は、FFT演算ステージ1を終えた後のRAM-B 8の様子を示した図である。このライトアドレスは単純なインクリメントであり、例えばカウンタ等を用いて容易に生成できる。このようにして8個のデータを演算することで、FFT演算ステージ1が完了する。演算データ数は決まっているため、全体制御部1の制御カウンタが一定値になった時点で完了と判断し、図2に示した状態番号3のFFT演算ステージ2へ遷移する。
図6は、FFT演算ステージ1を終えた後のRAM-B 8の様子を示した図である。このライトアドレスは単純なインクリメントであり、例えばカウンタ等を用いて容易に生成できる。このようにして8個のデータを演算することで、FFT演算ステージ1が完了する。演算データ数は決まっているため、全体制御部1の制御カウンタが一定値になった時点で完了と判断し、図2に示した状態番号3のFFT演算ステージ2へ遷移する。
状態番号3の状態では、図4のステージ2の演算を行う。ステージ2の演算についてもステージ1と同様に図の上方から順に行うことを考える。RAM-B 8からデータをリードし、ステージ1同様バタフライ演算を行い、RAM-A 7へライトする。このときRAM-B 8リードデータと対応するアドレスをタイミングチャート状に表したものを図7に示す。
図7は、FFT演算ステージ2をシグナルフローグラフの順で行った場合のRAMのリードと結果の関係を示した図である。図7の見方について説明する。図の左から右に向かって時間の経過を表している。最上列はRAM-B 8のリードアドレスを表し、その下はリードデータを表し、最下列はバタフライ演算データを表している。矢印はバタフライ演算の入出力関係を表しており、例えば、一番左側はP0とQ0からE0を演算することを表している。図7を見てわかるように8個の結果を得るために16回のリードが必要となり、1つのアドレスに対するRAMリードにかかる時間と演算にかかる時間が同じであれば出力は2回に1回となる。バタフライ演算結果個数に対してリード回数が倍となるため処理時間が余計にかかっている。これを改善するため、演算順の並び替えを行う。リードアドレスに着目すると、同じアドレスを2回ずつリードしている。そこで同じアドレスのデータを使う演算を連続して演算するような順番に並べ替える。
図7は、FFT演算ステージ2をシグナルフローグラフの順で行った場合のRAMのリードと結果の関係を示した図である。図7の見方について説明する。図の左から右に向かって時間の経過を表している。最上列はRAM-B 8のリードアドレスを表し、その下はリードデータを表し、最下列はバタフライ演算データを表している。矢印はバタフライ演算の入出力関係を表しており、例えば、一番左側はP0とQ0からE0を演算することを表している。図7を見てわかるように8個の結果を得るために16回のリードが必要となり、1つのアドレスに対するRAMリードにかかる時間と演算にかかる時間が同じであれば出力は2回に1回となる。バタフライ演算結果個数に対してリード回数が倍となるため処理時間が余計にかかっている。これを改善するため、演算順の並び替えを行う。リードアドレスに着目すると、同じアドレスを2回ずつリードしている。そこで同じアドレスのデータを使う演算を連続して演算するような順番に並べ替える。
図7に対して並べ替えを行った結果を図8に示す。
図8は、FFT演算ステージ2の演算順序入れ替えによるリード回数削減を示した図である。図から明らかなように8個の結果に対して8回のリードで済み、処理時間が半分となる。一方、図8を見るとリードアドレスは0、2、1、3、4、6、5、7の順であり、その並びはステージ1と異なる。RAMアドレス生成部5には、ステージ1用とステージ2用のアドレス生成回路がそれぞれ必要となり回路規模が増大する。そこで、このリードアドレスの並びを同じにするため、図4に示すステージ1のQ0とR0、Q1とR1の演算順序を入れ替え、P0、P1、R0、R1、Q0、Q1、T0、T1の順に計算する。これによりステージ1のリードアドレスは0、4、1、5、2、6、3、7となり、RAM-B 8へのデータ格納順は図9のように変わる。
図8は、FFT演算ステージ2の演算順序入れ替えによるリード回数削減を示した図である。図から明らかなように8個の結果に対して8回のリードで済み、処理時間が半分となる。一方、図8を見るとリードアドレスは0、2、1、3、4、6、5、7の順であり、その並びはステージ1と異なる。RAMアドレス生成部5には、ステージ1用とステージ2用のアドレス生成回路がそれぞれ必要となり回路規模が増大する。そこで、このリードアドレスの並びを同じにするため、図4に示すステージ1のQ0とR0、Q1とR1の演算順序を入れ替え、P0、P1、R0、R1、Q0、Q1、T0、T1の順に計算する。これによりステージ1のリードアドレスは0、4、1、5、2、6、3、7となり、RAM-B 8へのデータ格納順は図9のように変わる。
図9は、FFT演算ステージ1を演算順序入れ替えて行った後のRAM-B 8の様子を示した図である。ステージ1でのRAM-B 8へのデータ格納順が変わるため、ステージ2のリードアドレスも変わり、0、4、1、5、2、6、3、7となる。これはステージ1と同じであり、RAMアドレス生成部5はステージ1と2で同じアドレスを生成すればよく、アドレス生成回路の共通化が図られる。このようにして、ステージ2の演算を行うと、演算結果は図10のようにRAM-A 7へ格納される。
図10は、FFT演算ステージ2を演算順序入れ替えて行った後のRAM-A 7の様子を示した図である。
図10は、FFT演算ステージ2を演算順序入れ替えて行った後のRAM-A 7の様子を示した図である。
このようにFFT演算ステージ2の処理を行い、状態番号2の場合と同様に制御カウンタによって状態番号4のFFT演算ステージ3へ遷移する。
状態番号4の状態では、図4に示すステージ3の演算を行う。状態番号2の場合と同様にRAM-A 7からデータをリードし、バタフライ演算を行い、RAM-B 8へライトする処理を行う。
図11は、FFT演算ステージ3をシグナルフローグラフの順で行った場合のRAMのリードと結果の関係を示した図である。ステージ3の演算についてもステージ1、2と同様に図4の上側から演算することを考えると、図11に示すようにステージ2同様16回のリードが発生する。そのため、ステージ2同様に並び替えを行う。
図12は、FFT演算ステージ3の演算順序入れ替えによるリード回数削減を示した図である。前記並び替えにより図12に示すように、リード回数8回とし処理時間の削減を図る。さらに、図12ではリードアドレスが0、4、2、6、1、5、3、7となっており、ステージ1、2の0、4、1、5、2、6、3、7と異なっている。そこでステージ3についてもリードアドレスを共通化するため、G1とG2、G5とG6の計算順序を入れ替え、G0、G4、G2、G6、G1、G5、G3、G7の順で計算するようにする。この計算順序の入れ替えにより、ステージ3のリードアドレスが0、4、1、5、2、6、3、7となりステージ1、2と同一になる。
図13は、FFT演算ステージ3を演算順序入れ替えて行った後のRAM-B 8の様子を示した図である。前記したようにしてステージ3の演算を行うと、演算結果は図13のようにRAM-B 8へ格納される。状態番号2の場合と同様に制御カウンタによって、図2に示す状態番号5のデータ出力へ遷移する。
状態番号4の状態では、図4に示すステージ3の演算を行う。状態番号2の場合と同様にRAM-A 7からデータをリードし、バタフライ演算を行い、RAM-B 8へライトする処理を行う。
図11は、FFT演算ステージ3をシグナルフローグラフの順で行った場合のRAMのリードと結果の関係を示した図である。ステージ3の演算についてもステージ1、2と同様に図4の上側から演算することを考えると、図11に示すようにステージ2同様16回のリードが発生する。そのため、ステージ2同様に並び替えを行う。
図12は、FFT演算ステージ3の演算順序入れ替えによるリード回数削減を示した図である。前記並び替えにより図12に示すように、リード回数8回とし処理時間の削減を図る。さらに、図12ではリードアドレスが0、4、2、6、1、5、3、7となっており、ステージ1、2の0、4、1、5、2、6、3、7と異なっている。そこでステージ3についてもリードアドレスを共通化するため、G1とG2、G5とG6の計算順序を入れ替え、G0、G4、G2、G6、G1、G5、G3、G7の順で計算するようにする。この計算順序の入れ替えにより、ステージ3のリードアドレスが0、4、1、5、2、6、3、7となりステージ1、2と同一になる。
図13は、FFT演算ステージ3を演算順序入れ替えて行った後のRAM-B 8の様子を示した図である。前記したようにしてステージ3の演算を行うと、演算結果は図13のようにRAM-B 8へ格納される。状態番号2の場合と同様に制御カウンタによって、図2に示す状態番号5のデータ出力へ遷移する。
状態番号5の状態では、FFT演算結果を出力する。RAM-B 8からデータをリードし、信号切り替え部6経由で出力信号とする。出力データ数は決まっているため、全体制御部2が持つ制御カウンタの値によってデータ出力終了を判断し、状態番号0の待機状態に遷移する。これにより本装置の一連の動作が完了する。
回転因子生成制御部3は全体制御部2から全体制御信号を受け、回転因子生成部制御信号を生成する。回転因子生成部制御信号生成部3は、例えば、全体制御部2から前述の状態番号と制御カウンタの値を受け、回転因子生成部制御信号を生成するデコーダにより構成する。
回転因子生成制御部3は全体制御部2から全体制御信号を受け、回転因子生成部制御信号を生成する。回転因子生成部制御信号生成部3は、例えば、全体制御部2から前述の状態番号と制御カウンタの値を受け、回転因子生成部制御信号を生成するデコーダにより構成する。
回転因子生成部9は回転因子生成制御部3から回転因子生成部制御信号を受け、バタフライ演算に使用する回転因子を生成し、バタフライ演算部10へ送る。回転因子生成部9は例えばROM(Read Only Memory)とし、アドレスとして回転因子生成部制御信号をうけ、ROMデータとした回転因子の値を出力する構成とする。
バタフライ演算部10は回転因子生成部9からの回転因子と、信号切り替え部6からのバタフライ入力データを用いてFFT演算におけるバタフライ演算を行い、バタフライ演算データとして信号切り替え部6へ送られる。
この演算は複素数の乗算と加算により構成する。回転因子をW=X+Yi、バタフライ入力データとして、P1=A+Bi、P2=C+Di、バタフライ演算データをQ=E+Fiとする。ここでiは虚数単位である。このとき、バタフライ演算部10では以下に示す演算を行う。
バタフライ演算部10は回転因子生成部9からの回転因子と、信号切り替え部6からのバタフライ入力データを用いてFFT演算におけるバタフライ演算を行い、バタフライ演算データとして信号切り替え部6へ送られる。
この演算は複素数の乗算と加算により構成する。回転因子をW=X+Yi、バタフライ入力データとして、P1=A+Bi、P2=C+Di、バタフライ演算データをQ=E+Fiとする。ここでiは虚数単位である。このとき、バタフライ演算部10では以下に示す演算を行う。
Q=P1×W+P2
複素数演算であるため実際の演算は以下に示す内容となる。
E=A×X-B×Y+C(実部)
F=A×Y+B×X+D(虚部)
信号切り替え部6は全体制御部2からの全体制御信号により、入力信号、出力信号、RAM-A 7、RAM-B 8のリード、ライトデータ、バタフライ入力データ、バタフライ演算データを切り替える。
複素数演算であるため実際の演算は以下に示す内容となる。
E=A×X-B×Y+C(実部)
F=A×Y+B×X+D(虚部)
信号切り替え部6は全体制御部2からの全体制御信号により、入力信号、出力信号、RAM-A 7、RAM-B 8のリード、ライトデータ、バタフライ入力データ、バタフライ演算データを切り替える。
例えば、全体制御部2から全体制御信号として前述の状態番号を受け、図3に示す入出力関係になるように切り替えを行う構成とする。
図3は、信号切り替え部6の動作を示した図である。
RAMアドレス生成部5は全体制御部2から全体制御信号を受け、RAMアドレスAとRAMアドレスBを生成し、RAM-A 7とRAM-B 8へ送る。
RAMアドレス生成部5は、例えば全体制御部2から全体制御信号を受け、アドレスを生成するデコーダにより構成する。この時、前述の並び替えによりFFT演算のステージ1〜3で生成するアドレスが共通化できるため、デコーダの論理が単純化でき回路規模縮小が図られる。
このような構成により、小規模な回路で処理時間を抑えつつFFT演算を実現する。
図3は、信号切り替え部6の動作を示した図である。
RAMアドレス生成部5は全体制御部2から全体制御信号を受け、RAMアドレスAとRAMアドレスBを生成し、RAM-A 7とRAM-B 8へ送る。
RAMアドレス生成部5は、例えば全体制御部2から全体制御信号を受け、アドレスを生成するデコーダにより構成する。この時、前述の並び替えによりFFT演算のステージ1〜3で生成するアドレスが共通化できるため、デコーダの論理が単純化でき回路規模縮小が図られる。
このような構成により、小規模な回路で処理時間を抑えつつFFT演算を実現する。
図14は、第2の実施例における高速フーリエ変換装置のブロック構成図である。実施例1に示す構成に対し、乗算係数生成制御部11、乗算係数生成部12、乗算処理部13を追加した点が特徴となり、そのほかの特徴は同様である。
乗算処理部13は乗算係数生成部12からの乗算係数と入力信号を乗算し乗算後信号として信号切り替え部6に送る。乗算係数生成部12は乗算係数生成制御部11からの乗算係数生成部制御信号を入力とし、乗算係数を生成し、乗算処理部13に送る。乗算係数生成部12の構成として、例えばROMによる構成とし、入力としてアドレス、ROM値としてハニング窓関数(0.5−0.5cos2πx、ただしxは0〜1の値)の値を出力するものとする。乗算係数生成制御部11は全体制御部2からの全体制御信号を受け、入力信号に合わせたタイミングで乗算係数を生成できるように乗算係数生成部制御信号を生成し、乗算係数生成部12に送る。
乗算処理部13は乗算係数生成部12からの乗算係数と入力信号を乗算し乗算後信号として信号切り替え部6に送る。乗算係数生成部12は乗算係数生成制御部11からの乗算係数生成部制御信号を入力とし、乗算係数を生成し、乗算処理部13に送る。乗算係数生成部12の構成として、例えばROMによる構成とし、入力としてアドレス、ROM値としてハニング窓関数(0.5−0.5cos2πx、ただしxは0〜1の値)の値を出力するものとする。乗算係数生成制御部11は全体制御部2からの全体制御信号を受け、入力信号に合わせたタイミングで乗算係数を生成できるように乗算係数生成部制御信号を生成し、乗算係数生成部12に送る。
乗算係数生成制御部11の構成として、例えば、実施例1で述べた状態番号と制御カウンタの値を受け、図2に示す状態番号1データ入力の状態のとき、前述の乗算係数生成部12のROMアドレスを生成するようなデコーダとする。乗算係数生成部12で乗算係数としてハニング窓関数値を生成し、乗算処理部13で入力信号と乗算する構成とすれば、入力信号に対してハニング窓関数処理を施すことが出来、本装置を用いてハニング窓関数処理を行ったFFT演算結果を得ることが出来る。このことより、高速フーリエ変換で区間両端が不連続となることにより生じる高調波成分に対し、FFT演算結果がばらつくことを軽減する。また、乗算係数はハニング窓関数に限らず、他の窓関数にすることも出来る。
1:制御部、2:全体制御部、3:回転因子生成制御部、4:RAM制御部、5:RAMアドレス生成部、6:信号切り替え部、7:RAM-A、8:RAM-B、9:回転因子生成部、10:バタフライ演算部、11:乗算係数生成制御部、12:乗算係数生成部、13:乗算処理部。
Claims (2)
- 高速フーリエ変換(FFT)装置において、
バタフライ演算を行うバタフライ演算部と、
前記バタフライ演算の際のデータを保持するRAM(Random Access Memory)と、
前記バタフライ演算部が前記RAMに前記データを書込み/読取りする際の前記RAMにおけるアドレス情報を生成するアドレス生成部とを備え、
前記バタフライ演算部は、前記RAMに中間データを書込み/読取りながら複数のステージにわたりバタフライ演算をしてFFT演算を行い、
前記アドレス生成部は、前記バタフライ演算部が前記RAMから前記データを読取る際に、前記バタフライ演算を行う複数のステージにおいて、時間軸上の順番が一致した読取りアドレスを生成する
ことを特徴とする高速フーリエ変換装置。 - 請求項1に記載の高速フーリエ変換装置おいて、
前記演算を行うために入力された入力信号に対して、高速フーリエ変換により変換された区間の両端が不連続となることで生じる高調波成分によるFFT変換結果のばらつきを軽減するハニング窓関数を乗算する乗算部
を備えたことを特徴とする高速フーリエ変換装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011158011A JP2013025468A (ja) | 2011-07-19 | 2011-07-19 | 高速フーリエ変換装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011158011A JP2013025468A (ja) | 2011-07-19 | 2011-07-19 | 高速フーリエ変換装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2013025468A true JP2013025468A (ja) | 2013-02-04 |
Family
ID=47783769
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011158011A Withdrawn JP2013025468A (ja) | 2011-07-19 | 2011-07-19 | 高速フーリエ変換装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2013025468A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016514330A (ja) * | 2013-03-13 | 2016-05-19 | クゥアルコム・インコーポレイテッドQualcomm Incorporated | マルチモード基数2のx乗のバタフライベクトル処理回路を提供するためのプログラマブルなデータパス構成を有するベクトル処理エンジン、ならびに関連ベクトルプロセッサ、システム、および方法 |
CN108874743A (zh) * | 2018-04-16 | 2018-11-23 | 北京理工大学 | 一种控制频谱主副瓣特性的加窗方法 |
JP2021152452A (ja) * | 2020-03-24 | 2021-09-30 | 株式会社小野測器 | 信号解析装置および信号解析方法 |
-
2011
- 2011-07-19 JP JP2011158011A patent/JP2013025468A/ja not_active Withdrawn
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016514330A (ja) * | 2013-03-13 | 2016-05-19 | クゥアルコム・インコーポレイテッドQualcomm Incorporated | マルチモード基数2のx乗のバタフライベクトル処理回路を提供するためのプログラマブルなデータパス構成を有するベクトル処理エンジン、ならびに関連ベクトルプロセッサ、システム、および方法 |
CN108874743A (zh) * | 2018-04-16 | 2018-11-23 | 北京理工大学 | 一种控制频谱主副瓣特性的加窗方法 |
JP2021152452A (ja) * | 2020-03-24 | 2021-09-30 | 株式会社小野測器 | 信号解析装置および信号解析方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20230289230A1 (en) | Method and apparatus for accelerating convolutional neural network | |
TW200923831A (en) | System, method and computer program product for performing a scan operation | |
CN108073549B (zh) | 卷积运算装置及方法 | |
JPH05189518A (ja) | 論理ネットワークを最適化する方法および装置 | |
WO2016006071A1 (ja) | 半導体装置及び情報処理システム | |
JP2009087252A (ja) | 画像処理装置、画像処理方法及びプログラム | |
JP2013025468A (ja) | 高速フーリエ変換装置 | |
Wang et al. | Solving large systems of linear equations over GF (2) on FPGAs | |
JP6003744B2 (ja) | 演算処理装置及び演算処理方法 | |
KR102654862B1 (ko) | 영상 처리 방법 및 장치 | |
JP5549442B2 (ja) | Fft演算装置 | |
JP2008217359A (ja) | 高速フーリエ変換装置及び高速フーリエ変換処理方法 | |
US20200349433A1 (en) | Streaming-based artificial intelligence convolution processing method and apparatus, readable storage medium and terminal | |
JP5917907B2 (ja) | 画像処理装置 | |
US11604852B2 (en) | Signal processing apparatus, method, program, and recording medium | |
CN108491546A (zh) | 一种页面切换方法及电子设备 | |
JP5865696B2 (ja) | 画像処理装置 | |
CN109753629B (zh) | 多粒度并行fft计算装置 | |
JP2008052504A (ja) | 離散フーリエ変換装置および離散フーリエ逆変換装置 | |
JP2018120536A (ja) | データ補間装置及びその方法、画像処理装置 | |
Honda et al. | A warp-synchronous implementation for multiple-length multiplication on the GPU | |
CN118034785B (zh) | 指令压缩方法、装置、加速器及存储介质 | |
JP2015135452A (ja) | ペアリング演算装置、マルチペアリング演算装置、プログラム | |
US12019700B2 (en) | Signal processing apparatus, method, program, and recording medium | |
JP2010504007A (ja) | マルチサイトfmスクリーンドットを同時に生成する方法及び装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Withdrawal of application because of no request for examination |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20141007 |