WO1999066423A1

WO1999066423A1 - Dispositif pour calcul de donnees

Info

Publication number: WO1999066423A1
Application number: PCT/JP1999/003157
Authority: WO
Inventors: Shiro Kobayashi; Gerhard Fettweis
Original assignee: Asahi Kasei Kogyo Kabushiki Kaisha; Technische Universitaet Dresden
Priority date: 1998-06-15
Filing date: 1999-06-14
Publication date: 1999-12-23
Also published as: KR20010052899A; US6728739B1; EP1094401B1; JP3736741B2; DE69925123D1; DE19826252A1; EP1094401A1; DE19826252C2; EP1094401A4; DE69925123T2; KR100398859B1; AU4165799A; TW457441B

Description

明細書データ演算処理装置技術分野

本発明は、 1または複数のデータを含んでデータグループが構成され、さらに複数のデ一夕グループを含んで構成されたデ一タプロック単位で、デ一夕を処理する装置に係り、特に、ブロックフローティング方式で固定小数点演算を行うブロックフローテイング型のデジタル ' シグナル ·プロセッサ（以下、単に D S Pという。 ) に関する。背景技術

デジタル信号処理における数値表現方法として、固定小数点表現または浮動小数点表現がある。

浮動小数点表現では、各データが指数部と仮数部をもち、これにより、高い精度と広いダイナミックレンジが確保可能という利点がある反面、複雑で大規模なハードゥヱァが必要となるという問題がある。

一方、固定小数点表現では、ハードウェアが簡単で回路規模も小さくてすむが、演算精度の低下が問題となる。従来の代表的な固定小数点型の D S Pとしては、例えば、図 1 0に示すものがある。図 1 0は、従来の固定小数点型の D S Pの構成および各構成要素の入出力段におけるデ —夕のビット数を示す図である。

従来の固定小数点型の D S Pは、図 1 0に示すように、データを nビット単位で格納するメモリ 1 0 0と、 nビッ卜のデータをデータメモリ 1 0 0から入力して 2 nビッ卜の演算データを出力する積和演算器 1 2 と、 2 nビッ卜の演算データのうち上位の nビッ卜のデータを選択する選択回路 1 3と、データバス 1 1 0と、で構成されており、演算対象となるデータをデ一タメモリ 1 0 0から読み出し、読み出したデータを積和演算器 1 2で演算し、積和演算器 1 2からの演算データのうち上位の nビッ卜のデータを選択回路 1 3で選択し、選択回路 1 3からの演算デ —タをデータメモリ 1 0 0に再度格納するようになっている。

積和演算器 1 2は、データメモリ 1 0 0からのデータを保持する第 1 のレジスタファイル 1 2 aと、第 1のレジス夕ファイル 1 2 aのデ一夕を乗算する乗算器 1 2 bと、乗算器 1 2 bからの乗算データをこれまでの加算データと加算する加算器 1 2 cと、加算器 1 2 cからの加算データを演算データとして保持する第 2のレジスタファイル 1 2 dと、で構成されている。

演算精度の低下は、選択回路 1 3で 2 nビットから nビッ卜を選択する際に、下位 nビットが切り捨てられるために生じる。

固定小数点表現における演算精度の低下を、下式（ 1 ) ，（2) の数式例を用いて示す。すなわち、積和演算器 1 2は、下式（ 1 ) ，（2) により演算を行うようになつている。

ここでは簡単のため、データメモリ 1 0 0からのデータを 8ビッ卜、積和演算器 1 2の出力を 1 6 ビットとし、データ X ( 0 ) -X (7) および係数データ A (0) 〜A (3) 、 B (0) , B ( 1 ) を演算対象として積和演算器 1 2に与える。データ X (0) 〜X (7) および係数デ一夕 A (0 ) ~A (3) 、 B (0 ) , B ( 1) は、それぞれ図 1 1に示すような値をもち、 X (- 3) =X (- 2) -X (— 1 ) = Y (— 1) 二 0とする。また、図 1 2に示すように、各データと係数データの最上位ビッ卜（MS B) は符号ビッ卜とし、符号ビッ卜と右隣のビッ卜との間に小数点位置が定められ、符号ビットの右隣は 0. 5を表すものとして、各デ一夕と係数データの値の十進数表現を合わせて図 1 1に示す。上記従来の固定小数点型の DS Pを用いて、下式（ 1) , (2) により演算を行ったときの演算結果を図 1 3に示す。データメモリ 1 0 0に格納される最終的な演算結果（二進数表現および十進数表現）とともに、途中結果として積和演算器 1 2の出力（ 1 6ビッ卜の二進数表現）を、そしてまた比較のため、浮動小数点で演算を行ったときの演算結果も合わせて示す。 1 6ビットから 8ビットを選択する際に、下位 8ビッ卜のデ一夕が失われるため、精度が落ちていることがわかる。ここで、精度の劣化量を表す尺度として信号対雑音比（SNR) を導入し、これを下式（3) のように定義する。

下式（ 3 ) は、浮動小数点演算結果の二乗和を、誤差（固定小数点演算結果と浮動小数点演算結果の差）の二乗和で割ったもので、精度が劣化するほど小さい値をとる。図 1 3の結果を用いて SNRを計算すると、下式（4) ， (5) に示すようになる。なお、下式（4) は、下式（ 1 ) の演算結果に基づく SNRを示す式であり、下式（5) は、下式（ 2) の演算結果に基づく SNRを示す式である。

このように、固定小数点表現では、連続して演算を繰り返すごとに精度が大きく劣化していくのである。

この問題への対策法として提案されたのがブロックフローティングという方式である。この方式では、所定数（例えば、 m個）のデータを一つのデータプロックとし、データプロックに対し 1個のプロックスケールファクタをもたせ、デ一タブ口ックの m個のデータに対し共通のスケ一リング（以下、プロック正規化という。）を行うことにより、限られたダイナミックレンジを有効に用いて精度の劣化を抑える。

このブロックフローティングを効率良く実現するために、例えば、図 1 4のような DS Pが提案されている（特開平 10-40073号公報）。このブロックフローティング型の D S Pは、図 1 4に示すように、上記従来の固定小数点型の D S Pに加え、与えられたスケールファクタに基づいて積和演算器 1 2への入力データをブロック正規化する第 2 シフ夕 1 0 と、デ一タブ口ックに含まれる各データに基づいてブロックスケ —ルファクタを検出するブロックスケールファクタ検出器 5 4と、プロックスケールファク夕を格納するブロックスケールファクタレジスタ 5 6 と、で構成されている。

ブロックスケールファクタ検出器 5 4は、選択回路 1 3からの演算デ —タを入力し、そのデータプロックの各データのうち絶対値が最大となるデータを検出し、検出したデータの冗長なビット数をブロックスケールファクタとして検出するようになっている。

第 2シフタ 1 0は、図示しない制御装置によりブロックスケールファクタレジスタ 5 6のブロックスケールファクタが与えられたときは、そのブロックスケールファクタに相当するシフ卜量で、データブロックの各データに対して上位ビッ卜の方向へビットシフ卜（以下、単に左シフトという。）を行うようになっている。

次に、上記従来のプロックフローティング型の D S Pで、下式（ 1 ) , ( 2 ) をブロックフローティング処理した場合の動作について説明する。

まず、データブロックに含まれるデータの個数を「ブロックサイズ」と、デ一タメモリ 1 0 0からデ一タブ口ックの各データを読み出して積和演算を行ったのち、演算結果である演算データを再度データメモリ 1 0 0へ格納する一連の処理を「ブロック処理」と定義する。

下式（ 1 ) ，（2 ) では、ブロックサイズを 8とし、初回のブロック処理でデータブロック X ( 0 ) 〜X ( 7 ) を入力として下式（ 1 ) により演算を行い、 Y ( 0 ) 〜Y ( 7 ) を求め、 2回目のブロック処理でデ一タブロック Y (0) 〜Υ ( 7) を入力として下式（2 ) により演算を行い、 Ζ ( 0) 〜Ζ ( 7 ) を求めることとする。なお、初回のブロック処理では、ブロックスケールファクタレジスタ 5 6には、ブロックスケ —ルファクタとして "0" が設定されているので、第 2 シフタ 1 0においてブロック正規化は行われないこととする。また、以下の説明では、係数データ A ( 0) 〜A (3 ) 、 B ( 0) ， B ( 1 ) の設定方法については特に触れないが、必要に応じてデータメモリ 1 0 0から読み出すなどして与えることができる。

まず、第 1のステップとして、 n = 0〜 7について次の処理を行う。データ X ( n ) 、 X ( n— 1 ) 、 X ( n— 2 ) を順次デ一タメモリ 1 0 0から読み出して第 2シフタ 1 0に入力する。初回プロック処理では、ブロックスケールファクタレジスタ 5 6のブロックスケールファクタ力く "0" であるため、第 2シフタ 1 0においてブロック正規化は行わず、 X (n) 、 X (n- 1) 、 X (n— 2 ) をそのまま積和演算器 1 2に入力する。積和演算器 1 2では、下式（ 1) により演算を行い、演算デ— 夕を選択回路 1 3に入力する。選択回路 1 3では、演算データのうち上位 nビッ卜を選択して取り出す。選択回路 1 3からの nビッ卜の演算デ —タは、データバス 1 1 0経由で Y (n) としてデータメモリ 1 0 0に格納される。一方、この格納処理と並行して、 2回目のブロック処理に用いるブロックスケールファクタを決定するために演算データ Y (n) を、ブロックスケールファクタ検出器 5 4に入力する。

次いで、第 2のステップとして、第 1のステップが終了した時点で、ブロックスケールファクタ検出器 5 4では、 2回目のブロック処理に用いるプロックスケールファクタを決定し、決定したプロックスケールファク夕をブロックスケールファクタレジスタ 5 6に格納する。

次いで、第 3のステップとして、 n = 0〜 7について以下の処理を行う。データ Y (η) 、 Υ (η - 1 ) を順次データメモリ 1 0 0から読み出して第 2シフ夕 1 0に入力する。第 2シフタ 1 0では、ブロックスケールファクタレジスタ 5 6のブロックスケールファクタに基づ、てプロック正規化を行い、ブロック正規化を行ったデータを積和演算器 1 2に入力する。積和演算器 1 2では、下式（2) により演算を行い、演算デ一夕を選択回路 1 3に入力する。選択回路 1 3では、演算データのうち上位 ηビッ卜を選択して取り出す。選択回路 1 3からの ηビッ卜の演算データは、データバス 1 1 0経由で Ζ (η) としてデータメモリ 1 0 0 に格納される。一方、この格納処理と並行して、 3回目のブロック処理に用いるブロックスケールファクタを決定するために演算データ Ζ (η ) を、ブロックスケールファクタ検出器 5 4に入力する。

次いで、第 4のステップとして、第 3のステップ 3が終了した時点で、ブロックスケールファクタ検出器 5 4では、 3回目のブロック処理に用いるプロックスケールファクタを決定し、決定したプロックスケールファクタをブロックスケールファクタレジスタ 5 6に格納する。

上記第 1ないし第 4のステップを経て、下式（ 1 ) ，（2 ) により実際にブロックフローティング処理した演算結果を図 1 5に示す。そして、この演算結果を用いて下式（3) により SNRを計算すると、下式（ 6) , (7) に示すようになる。なお、下式（6) は、下式（1) の演算結果に基づく SNRを示す式であり、下式（7) は、下式（2) の演算結果に基づく SNRを示す式である。

下式（6 ) ， (7) によれば、固定小数点演算を単に行うよりも精度が改善されていることがわかる。

先の例からもわかる通り、上記従来のブロックフローティング型の D S Pにあっては、確かに、上記従来の固定小数点型の D S Ρに比して演算精度を改善することができるが、なお演算精度上の課題が存在する。すなわち、上記従来のプロックフローティング型の D S Pにあっては、プロック処理が終了するまでプロックスケールファクタを決定することができないため、選択回路 1 3で上位 nビッ卜を選択してデータメモリ 1 0 0に格納し、ブロック処理終了後に、その演算データに対してブロックスケールファクタに相当するシフ卜量で左シフトを行っている。このため、第 2シフ夕 1 0からのデータのうち、ブロックスケールファクタに相当するビット数の下位ビットは、 " 0 " となって意味のない情報となる。

積和演算器 1 2からの演算デ一タを 1 6 ビット、デ一タメモリ 1 0 0 からのデ一夕を 8 ビッ卜、演算データを " 0 0 0 0 1 1 0 1 1 1 0 1 0 1 0 1 " 、ブロック処理終了後に確定したブロックスケールファクタを " 2 " とした場合のブロック正規化後のデータを、理想的な場合と従来法の場合とのについて図 1 6に例示する。この例では、ブロック正規化後のデータの下位 2 ビットに着目してみると、理想的には " 1 1 " となるべきところが従来の D S Pでは " 0 0 " となっていることがわかる。これが演算精度の向上を妨げる要因となっているのである。

そこで、本発明は、このような従来の技術の有する未解決の課題に着目してなされたものであって、ブロックフローティング方式で固定小数点演算を行うときの演算精度を向上するのに好適なデータ演算処理装置を提供することを目的としている。発明の開示

本発明では、従来のデータ区分であるデ一タブ口ックをさらに钿分化し、データグループという区分を新たに導入する。すなわち、デ一タブロックは、複数のデ一夕グループを含んで構成され、データグループは、 1または複数のデータを含んで構成される。ここで、デ一タグループに含まれるデータの個数を「グループサイズ」と定義する。

上記目的を達成するために、本発明に係る請求の範囲第 1項記載のデ一夕演算処理装置は、 1または複数のデータを含んでデ一夕グループが構成され、さらに複数のデータグループを含んで構成されたデ一タブ口ック単位で、データを処理するデータ演算処理装置であって、前記デ一タグループの各デ一夕に対して演算を行い、それら演算デ一夕のうち絶対値が最大となるもののスケールファクタをグループスケールファクタとして検出し、検出したグループスケールファクタに基づいて前記各演算データに対してスケーリングを行うこれら一連の処理を、前記データブロックの各データグループごとに行い、さらに、検出したグループスケールファクタのうち絶対値が最大となる演算データに対応するものをブロックスケールファクタとして検出し、スケ一リングした演算データに対して再度演算を行うときは、演算の前に、前記データグループの各演算データに対して当該データグループのグループスケールファクタおよび前記プロックスケールファクタに基づいてスケ一リングを行うようになっている。

このような構成であれば、デ一タグループの各データに対して演算が行われ、それら演算データのうち絶対値が最大となるもののスケールファクタがグループスケールファクタとして検出され、検出されたグループスケールファクタに基づいて、各演算データに対してスケーリングが行われる。こうした一連の処理が、データブロックの各データグループごとに行われる。そして、一つのデータブロックについて処理が終了すると、各データグループごとに検出されたグループスケールファクタのうち絶対値が最大となる演算データに対応するものがプロックスケールファクタとして検出される。次に、スケ一リングされた演算データに対して再度演算を行うときは、データグループの各演算データに対して、そのデータグループのグループスケールファクタおよびブロックスケールファクタに基づいて、スケーリングが行われる。

なお、その後は、スケーリングされた各演算データに対して演算が行われ、その演算結果である演算データのうち絶対値が最大となるもののスケールファク夕がグループスケールファクタとして検出され、検出されたグループスケールファクタに基づいて、各演算データに対してスケ -リングが行われる。こうした一連の処理が、デ一タブ口ックの各データグループごとに行われる。そして、一つのデ一夕ブロックについて処理が終了すると、各デ一夕グループごとに検出されたグループスケールファクタのうち絶対値が最大となるものがプロックスケールファクタとして検出される。

ここで、スケールファク夕としては、例えば、データをビッ卜シフ卜するときのシフト量を挙げることができる。この場合、スケールファク夕に相当するシフ卜量で、データに対してビッ卜シフトを行うことによりスケ一リングを行う。

また、グループスケールファクタを検出する構成は、データグループの各データに対して演算を行つたのち、それら演算データのスケールファクタを算出し、算出したスケールファクタのうち最小のものをグループスケールファクタとして検出するようになっていてもよいし、それら演算データのスケールファクタを算出せず、それら演算データから直接グループスケールファクタを検出するようになっていてもよい。

さらに、本発明に係る請求の範囲第 2項記載のデータ演算処理装置は、請求の範囲第 1項記載のデータ演算処理装置において、スケーリングした演算データに対して再度演算を行うときは、演算の前に、前記デー T

タグループの各演算データに対して当該データグループのグループスケールファクタと前記プロックスケールファクタとの差分に基づいてスケ一リングを行うようになっている。

このような構成であれば、スケーリングされた演算データに対して再度演算を行うときは、データグループの各演算データに対して、そのデ一タグループのグループスケールファクタとブロックスケールファクタとの差分に基づいて、スケーリングが行われる。

さらに、本発明に係る請求の範囲第 3項記載のデータ演算処理装置は、複数の計算ュニッ卜を備え、 1または複数のデータを含んでデ一タグループが構成され、さらに複数のデータグループを含んで構成されたデ —タブ口ック単位で、データを処理するデータ演算処理装置であって、前記各計算ュニッ卜は、与えられたスケールファクタに基づいてデ一夕に対してスケ一リングを行う第 1のスケ一リング手段と、前記第 1のスケーリング手段からのデータに対して演算を行う演算手段と、前記演算手段からの演算デ一夕のスケールファクタを算出するスケールファクタ算出手段と、与えられた他のスケールファクタに基づいて前記演算手段からの演算データに対してスケ一リングを行う第 2のスケ一リング手段と、を有しており、さらに、データを記憶するための記憶手段と、前記各計算ュニッ卜のスケールファタ夕算出手段で算出したスケールファク夕のうち絶対値が最大となる演算データに対応するものをグループスケールファクタとして検出するグループスケールファク夕検出手段と、前記グループスケールファク夕検出手段で検出したグループスケールファクタのうち絶対値が最大となる演算デ一夕に対応するものをブロックスケールファク夕として検出するプロックスケールファク夕検出手段と、データ処理のための制御を行う制御手段と、を備え、前記制御手段は、前記データプロック単位でデータを前記記憶手段から読み出し、前記デ一タブロックの各データグループごとに、前記データグループのデータをそれぞれ前記各計算ュニッ卜の第 1のスケーリング手段に振り分け、前記グループスケールファクタ検出手段で検出したグループスケールファクタを前記各計算ュニッ卜の第 2のスケ一リング手段に与え、前記各計算ュニ'ッ卜の第 2のスケーリング手段からの演算データを前記記憶手段に格納し、前記記憶手段の演算データに対して再度演算を行うときは、前記データブロックの各データグループごとに、前記データグループの演算データをそれぞれ前記各計算ュニッ卜の第 1のスケ一リング手段に振り分けるとともに、前記データグループのグループスケールファク夕と前記プロックスケールファクタとの差分からなるスケールファクタを前記各計算ュニッ卜の第 1のスケ一リング手段に与えるようになっている。

このような構成であれば、制御手段により、データブロック単位でデ —夕が記憶手段から読み出され、デ一タブ口ックの各データグループごとに、データグループのデ一夕がそれぞれ各計算ュニッ卜の第 1のスケ —リング手段に振り分けられる。

各計算ュニットでは、初期状態では第 1のスケーリング手段にスケ一ルファクタが与えられていないので、第 1のスケーリング手段によるスケ一リングが行われず、そのまま演算手段に入力される。そして、演算手段により、第 1のスケーリング手段からのデータに対して演算が行われ、スケールファクタ算出手段により、演算手段からの演算データのスケールファクタが算出される。

各計算ュニッ卜でスケールファクタが算出されると、グループスケ一ルファクタ検出手段により、各計算ュニッ卜のスケールファクタ算出手段で算出されたスケールファクタのうち絶対値が最大となる演算デ一夕に対応するものがグループスケールファクタとして検出され、制御手段により、算出されたグループスケールファクタが各計算ュニッ卜の第 2 のスケ一リング手段に与えられる。

これにより、各計算ュニッ卜では、第 2のスケ一リング手段により、与えられたグループスケールファクタに基づいて、演算手段からの演算データに対してスケーリングが行われる。

このように各計算ュニッ卜で演算データに対してスケーリングが行われると、制御手段により、各計算ユニットの第 2のスケーリング手段からの演算データが記憶手段に格納されるとともに、ブロックスケールファクタ検出手段により、グループスケールファクタ検出手段で検出されたグループスケールファクタのうち絶対値が最大となる演算データに対応するものがブロックスケールファクタとして検出される。

次に、記憶手段の演算データに対して再度演算を行うときは、制御手段により、デ一タブロック単位で演算データが記憶手段から読み出され、データブロックの各デ一夕グループごとに、データグループの演算デ一夕がそれぞれ各計算ュニッ卜の第 1のスケーリング手段に振り分けられるとともに、そのデータグループのグループスケールファクタとブ口ックスケールファク夕との差分からなるスケールファク夕が各計算ュニッ卜の第 1のスケーリング手段に与えられる。

各計算ュニッ卜では、第 1のスケーリング手段により、前回の処理において検出されたグループスケールファクタとブロックスケールファク夕との差分からなるスケールファクタに基づいて、与えられた演算デ一タに対してスケーリングが行われ、演算手段により、第 1のスケ一リング手段からの演算デー夕に対して演算が行われ、スケールファクタ算出手段により、演算手段からの演算データのスケールファクタが算出される。

各計算ュニッ卜でスケールファクタが算出されると、グループスケ一ルファクタ検出手段により、各計算ュニッ卜のスケールファクタ算出手段で算出されたスケールファクタのうち絶対値が最大となる演算データに対応するものがグループスケールファクタとして検出され、制御手段により、算出されたグループスケールファクタが各計算ュニッ卜の第 2 のスケーリング手段に与えられる。

これにより、各計算ュニットでは、第 2のスケーリング手段により、与えられたグループスケールファクタに基づいて、演算手段からの演算データに対してスケ一リングが行われる。

このように各計算ュニッ卜で演算データに対してスケーリングが行われると、制御手段により、各計算ュニッ卜の第 2のスケーリング手段からの演算データが記憶手段に格納されるとともに、プロックスケールファクタ検出手段により、グループスケールファクタ検出手段で検出されたグループスケールファクタのうち絶対値が最大となる演算データに対応するものがプロックスケールファクタとして検出される。

ここで、記憶手段は、データを記憶するためのものであればよく、デ —夕をあらかじめ記憶しておくものであってもよいし、本装置の動作時にデータを記憶するものであってもよい。

また、スケールファクタとしては、例えば、データをビットシフトするときのシフト量を挙げることができる。この場合、スケールファクタに相当するシフト量で、データに対してビットシフトを行うことによりスケ一リングを行う。

さらに、本発明に係る請求の範囲第 4項記載のデータ演算処理装置は、請求の範囲第 3項記載のデータ演算処理装置において、前記グループスケールファクタおよび前記プロックスケールファクタを記憶するための第 2の記憶手段を備え、前記制御手段は、前記グループスケールファクタおよび前記ブロックスケールファクタを演算データと対応させて前記第 2の記憶手段に記憶し、前記記憶手段の演算データに対して再度演算を行うときは、対応するグループスケールファクタおよびプロックスケ一ルファクタを前記第 2の記憶手段から読み出し、前記デ一タブ口ックの各デ一タグループごとに、前記デ一夕グループの演算データをそれぞれ前記各計算ュニッ卜の第 1のスケ一リング手段に振り分け、前記デ —タグループのグループスケールファクタと前記ブロックスケールファクタとの差分からなるスケールファクタを前記各計算ュニッ卜の第 1のスケーリング手段に与えるようになつている。

このような構成であれば、記憶手段の演算データに対して再度演算を行うときは、制御手段により、グループスケールファクタ検出手段で検出されたグループスケールファクタおよびプロックスケールファクタ検出手段で検出されたブロックスケールファクタ力各計算ュニッ卜の第 2のスケ一リング手段からの演算データと対応づけられて第 2の記憶手段に格納される。

そして、記憶手段の演算データに対して再度演算を行うときは、制御手段により、対応するグループスケールファクタおよびプロックスケールファクタが第 2の記憶手段から読み出され、データブロックの各デ一夕グループごとに、データグループの演算データがそれぞれ各計算ュニッ卜の第 1のスケ一リング手段に振り分けられるとともに、そのデータグループのグループスケールファクタとブロックスケールファクタとの差分からなるスケールファク夕が各計算ュニッ卜の第 1のスケ一リング手段に与えられる。

これにより、各計算ュニッ卜では、第 1のスケーリング手段により、前回の処理において検出されたグループスケールファク夕とブロックスケ一ルファクタとの差分からなるスケールファクタに基づいて、与えられた演算データに対してスケーリングが行われる。ここで、第 2の記憶手段は、グループスケールファクタおよびブロックスケールファクタを記憶するためのものであって、グループスケールファクタおよびプロックスケールファクタをあらかじめ記憶しているこ . とを要しない。

さらに、本発明に係る請求の範囲第 5項記載のデータ演算処理装置は、請求の範囲第 3項および第 4項のいずれかに記載のデータ演算処理装置において、前記スケールファクタ算出手段は、前記演算手段からの演算データの冗長なビット数を算出し、これをスケールファクタとして算出するようになつている。

このような構成であれば、スケールファクタ算出手段により、演算手段からの演算データの冗長なビット数が算出され、これがスケールファクタとして算出される。

さらに、本発明に係る請求の範囲第 6項記載のデータ演算処理装置は、請求の範囲第 5項記載のデータ演算処理装置において、前記演算手段は、固定小数点演算器であり、前記第 1のスケーリング手段は、与えられたスケールファクタに相当するシフト量で、データに対してビッ卜シフ卜を行うようになっており、前記第 2のスケ一リング手段は、与えられた他のスケールファクタに相当するシフ卜量で、前記演算手段からの演算データに対してビッ卜シフトを行うようになっている。

このような構成であれば、各計算ュニッ卜では、第 1のスケ一リング手段により、与えられたスケールファクタに相当するシフト量で、与えられたデータに対してビットシフトが行われ、演算手段により、第 1のスケ一リング手段からのデータに対して固定小数点演算が行われる。そして、第 2のスケ一リング手段により、与えられたスケールファクタに相当するシフト量で、演算手段からの演算データに対してビットシフトが行われる。ここで、第 1のスケーリング手段は、例えば、データに対して下位ビッ卜の方向へビットシフ卜（以下、単に右シフ卜という。）を行うようになっている。また、第 2のスケーリング手段は、例えば、データに対して左シフトまたは右シフトを行うようになっている。

さらに、本発明に係る請求の範囲第 7項記載のデータ演算処理装置は、請求の範囲第 3項ないし第 6項のいずれかに記載のデータ演算処理装置において、前記演算手段は、前記第 1のスケ一リング手段からのデー夕と所定の係数との積和を演算する積和演算器である。

このような構成であれば、演算手段により、第 1のスケーリング手段からのデータと所定の係数との積和が演算され、積和されたデータが演算データとして出力される。

本発明の概要は、例えば、図 1に示す通りである。本発明では、デ一タグループごとに一つのスケールファクタを計算してこれをグループスケ一ルファクタとし、各積和演算器 1 2から出力されたデータをグループスケールファクタで正規化（以下、グループ正規化という。）し、グループスケールファクタを、グループ正規化されたデータグループと関連づけてレジスタファイル 5 2に格納する。こうした一連の処理は、デ一タブ口ックに含まれる他のデータグループに対しても、繰り返し適用される。ひとつのデータブロックの処理を行ったのち、複数のグループスケールファクタうち最小のスケールファクタを検出してこれをプロックスケールファクタとし、データブロックと関連つけてレジスタフアイル 5 6に格納する。その後、このデータブロックをブロック処理する場合、ブロックスケールファクタとグループスケールファクタとが異なり、データグループ間で桁の位置が合っていない可能性があるため、グループスケールファク夕とプロックスケールファク夕との差分に基づいて、各データグループをシフト（ブロック正規化）して桁合わせしたのち、積和演算器 1 2に入力する。

これにより、積和演算終了後のデータは、データグループ単位で一旦グループ正規化を行ってデータメモリ 1 0 0に格納され、次のブロック処理で使用する際に、ブロック正規化されるため、ブロック正規化後のデータの下位ビッ卜に意味のなし、情報が含まれることがなく、ブロックフローテイング方式で固定小数点演算を行うときの演算誤差が小さくなる。

以上では、上記目的を達成するためのデータ演算^；理装置を提案したが、これに限らず、上記目的を達成するために、次の第 1ないし第 7のデータ演算処理装置を提案することもできる。

第 1のデータ演算処理装置は、スケ一リングを用いることで仮数部とスケール部とに分解可能な複数のデ一夕を含むデ一タグループに対して単一で共通のスケールファクタを決定し、複数の仮数部をひとまとめにし、前記共通のスケールファクタを参照してデータを処理するデジタル信号処理のためのデ一夕演算処理装置であって、一番目のデータグループから、複数のスケールファクタのうち単一の最小値をグループスケ一ルファクタとして決定し、前記グループスケールファクタを参照して当該デ一夕グループの各デ一夕をスケーリングし、スケーリングした各デ —タを格納し、前記グループスケールファクタを当該データグループと唯一に対応する関係をもって格納し、これらの処理を二番目以降のデー夕グループに対して引き続き繰り返し、複数のグループスケールファク夕のうち単一の最小値を複数のデータグループのブロックスケールファクタとして決定し、前記プロックスケールファクタを一番目と二番目以降の複数のデータグループから構成される単一のデ一タブ口ックと唯一に対応する関係をもって格納し、前記各デ一夕グループの各データを、前記各グループスケールファクタと前記プロックスケールファクタとの差分として得られる整列スケールファクタを用いてスケーリングするようになっている。

さらに、第 2のデータ演算処理装置は、上記第 1のデータ演算処理装置において、前記整列スケールファクタを用いてスケーリングした複数のデータを単一の新しいデータブロックとして格納し、前記整列スケールファクタを前記プロックスケールファクタとして唯一つに決定するようになつている。

さらに、第 3のデータ演算処理装置は、上記第 1および第 2のいずれかのデータ演算処理装置において、前記整列ファクタを用いてスケーリングしたデータを引き続き固定小数点デ一タ表現を用、て処理するようになっている。

さらに、第 4のデータ演算処理装置は、上記第 1ないし第 3のいずれかのデータ演算処理装置において、前記グループスケールファクタを、関連するデータグループとともに格納するようになっている。

さらに、第 5のデータ演算処理装置は、データを処理するため少なくとも一つの計算ュニッ卜とレジス夕とメモリを備えたデジタルデータ処理プロセッサによるデジタルデータ処理のためのデータ演算処理装置であって、複数のデータから複数のスケールファクタを計算する手段と、前記スケールファクタを参照して複数のデ一夕からスケ一リングされた値を生成する手段と、複数の前記スケーリングされた値をデータグループ（スケーリングされた値の組）として格納する手段と、前記データグループうち最小のスケールファクタ（グループスケールファクタ）を検出する手段と、前記グループスケールファクタを格納する手段と、複数の前言己データグループうち最、のスケールファクタ（ブロックスケールファクタ）を検出する手段と、前記ブロックスケールファクタを格納する手段と、を備えている。さらに、第 6のデータ演算処理装置は、上記第 5のデータ演算処理装置において、前記グループスケールファクタを一時的に格納するためのレジスタファイルによる手段と、一時的に格納したグループスケールファク夕とそれに対応するデータグループを関連づけるための手段と、前記レジスタファイルに一時的に格納したグループスケールファクタを格納する手段と、を備えている。

さらに、第 7のデータ演算処理装置は、上記第 5および第 6のいずれかのデータ演算処理装置において、最小のスケールファクタを検出する手段と、冗長な符号ビッ卜を計数する手段と、冗長な符号ビッ卜の情報を一つにまとめる手段と、を備えている。

以上では、上記目的を達成するためのデータ演算処理装置を提案した力これに限らず、上記目的を達成するために、次の第 1の記憶媒体を提案することもできる。

第 1の記憶媒体は、 1または複数のデータを含んでデータグループが構成され、さらに複数のデータグループを含んで構成されたデ一タブ口ック単位で、データを処理するためのプログラムを記憶した記憶媒体であって、請求の範囲第 3項ないし第 7項のいずれかに記載の、前記各計算ュニッ卜、前記第 1のスケーリング手段、前記演算手段、前記スケールファクタ算出手段、前記第 2のスケーリング手段、前記グループスケ —ルファクタ検出手段、前記ブロックスケールファクタ検出手段および前記制御手段としてコンピュータを機能させるためのプログラムを記憶したコンピュータ読み取り可能なものである。

このような構成であれば、記憶媒体に記憶された情報がコンピュー夕によって読み取られ、コンピュータが各手段として機能させられたときは、上記請求の範囲第 3項ないし第 7項のいずれかに記載のデータ演算処理装置と同様の作用が得られる。図面の簡単な説明

図 1は、本発明に係るデータ演算処理装置の構成を示すブロック図である。図 2は、データメモリ 1 0 0におけるデータ構造を示す図である。図 3は、各積和演算器 1 2で行われる積和演算を示す図である。図 4 は、本発明を数値例に適用した場合の演算過程を説明するための図である。図 5は、データグループとグループスケールファクタを関連付けて格納する方法の一例である。図 6は、本発明を数値例に適用した場合の演算結果を示す図である。図 7は、本発明による方式と従来方式との演算精度の比較を示す図である。図 8は、各計算ュニッ卜 P _Q 〜P _k— , の第 2シフタ 1 0と積和演算器 1 2と相互間でデータを転送するための詳細な構成を示すブロック図である。図 9は、局所スケールファクタ検出器 1 4およびグループスケールファクタ検出器 5 0の他の構成を示すブ口ック図である。

図 1 0は、従来の固定小数点型の D S Pの構成および各構成要素の入出力段におけるデ一夕のビット数を示す図である。図 1 1は、数値例で使用されるデータの値を示す図である。図 1 2は、数値例で使用されるデータの固定小数点表記を説明するための図である。図 1 3は、従来の固定小数点型の D S Pによる数値例の演算結果を示す図である。図 1 4 は、従来のブロックフローティング型の D S Pの構成を示すブロック図である。図 1 5は、従来のプロックフローティング型の D S Pによる数値例の演算結果を示す図である。図 1 6は、従来方法の問題点を説明するための図である。発明を実施するための最良の形態

以下、本発明の実施の形態を図面を参照しながら説明する。図 1ないし図 9は、本発明に係るデータ演算処理装置の実施の形態を示す図であ o

まず、本発明に係るデータ演算処理装置の構成を図 1を参照しながら説明する。図 1は、本発明に係るデータ演算処理装置の構成を示すプロック図である。

本発明に係るデータ演算処理装置は、図 1に示すように、デ一タブ口ック単位でデータを記憶するためのデータメモリ 1 0 0と、データメモリ 1 0 0のデータに対して積和演算を行う演算部 2 0 0と、ブロックフローティングに必要な正規化を行うための制御部 3 0 0と、これらの制御を行う制御ロジック 4 0 0と、ァドレス生成器 5 0 0と、で構成されている。データメモリ 1 0 0、演算部 2 0 0、制御部 3 0 0および制御ロジック 4 0 0は、データバス 1 1 0で相互にかつデータ授受可能に接続されており、データメモリ 1 0 0、制御部 3 0 0およびァドレス生成器 5 0 0は、データアドレスバス 1 2 0で相互にかつデータ授受可能に接続されている。

データメモリ 1 0 0は、図示しない外部からデータを入力し、演算部 2 0 0の演算対象となるデータとして格納するようになっている。デ一タメモリ 1 0 0では、データは、図 2に示すように、デ一タブロック単位で格納される。図 2は、データメモリ 1 0 0におけるデータ構造を示す図である。データメモリ 1 0 0では、図 2に示すように、データが計算ュニッ卜の数に相当する個数（この場合、 k個）組合わさってデータグループとして格納され、さらに、データグループが複数組合わさってデータブロックとして格納される。すなわち、データブロックは、複数のデータグループを含んで構成され、データグループは、計算ュニッ卜の数に相当する個数のデータを含んで構成されている。

演算部 2 0 0は、同一機能を有する k個の計算ュニッ卜 P。 P k ^ で構成されている。各計算ュニッ卜 P。〜P _k - i には、一つのデ一タグループのデータがそれぞれ振り分けられ、各計算ュニッ P。 P k ^ は、データグループ単位でデータを並列処理する。

各計算ュニッ P。 P k は、与えられたスケールファクタに基づいてデータに対してスケーリングを行う第 2シフタ 1 0と、第 2 シフタからのデータに対して積和演算を行う積和演算器 1 2と、積和演算器 1 2からの演算データのスケールファク夕を算出するュニッ卜スケールファクタ検出器 1 4と、与えられたスケールファクタに基づいて積和演算器 1 2からの演算データに対してスケ一リングを行う第 1シフタ 1 6と、で構成されている。

ュニッ卜スケールファクタ検出器 1 4は、積和演算器 1 2からの演算データの冗長なビッ卜数を算出し、これをスケールファクタとして算出するようになつている。本実施の形態では、スケールファクタとしては、データをビットシフトするときのシフト量であり、シフトするビット数を示す。以下、グループスケールファクタおよびブロックスケールファクタについても同様である。

第 2 シフタ 1 0は、与えられるスケールファクタに相当するシフト量で、与えられたデータに対して右シフ卜を行うようになっており、第 1 シフタ 1 6は、与えられたスケールファクタに相当するシフ卜量で、積和演算器 1 2からの演算データに対して左シフトを行うようになっている。

制御部 3 0 0は、ュニットスケールファクタ検出器 1 4で算出したスケールファクタからグループスケールファクタを検出するグループスケ —ルファクタ検出器 5 0と、グループスケールファクタを格納するグル —プスケールファクタレジスタファイル 5 2と、グループスケールファクタからプロックスケールファク夕を検出するブロックスケールファクタ検出器 5 4と、ブロックスケールファクタを格納するブロックスケ一ルファクタレジスタ 5 6と、グループスケールファクタとブロックスケールファクタの差分を計算する桁合わせ用加算器 6 0と、で構成されている。

グループスケールファクタ検出器 5 0は、各計算ュニッ P„ 〜P_k— i のュニッ卜スケールファクタ検出器 1 4で算出したスケールファクタうち最小のものをグループスケールファクタとして検出し、制御ロジック 4 0 0の制御により、検出したグループスケールファクタをグループスケールファクタレジスタファイル 5 2および各計算ュニッ卜 P。〜P _k-, の第 1 シフタ 1 6に出力するようになっている。例えば、各計算ュニット P。〜P_k , (例えば、 k二 3 ) のュニッ卜スケールファク夕検出器 1 4からスケールファクタとして " 1 " 、 "2 " 、 "3" を入力した場合、そのうちの最小値である " 1 " をそのグループスケールファク夕として検出する。

グループスケールファクタレジスタファイル 5 2は、グループスケールファクタ検出器 5 0で検出したグループスケールファクタをそれぞれ一時的に格納し、制御ロジック 4 0 0の制御により、データメモリ 1 0 0または桁合わせ用加算器 6 0にグループスケールファクタを出力するようになっている。

ブロックスケールファクタ検出器 5 4は、グループスケールファクタ検出器 5 0で検出したグループスケールファクタのうち最小のものをグプロックスケールファクタとして検出するようになっている。例えば、あるデ一夕ブロックのグループスケールファクタ力 " 3 " 、 "4" 、 " 5" として検出された場合、そのうちの最小値である "3" をそのプロックスケールファクタとして検出する。

ブロックスケールファクタレジスタ 5 6は、ブロックスケールファクタ検出器 5 4で検出したプロックスケールファクタを一時的に格納し、制御口ジック 4 0 0の制御により、データメモリ 1 0 0または桁合わせ用加算器 6 0にグループスケールファクタを出力するようになっている桁合わせ用加算器 6 0は、グループスケールファクタレジスタフアイル 5 2から出力されたグループスケールファクタと、プロックスケールファクタレジスタ 5 6から出力されたプロックスケールファク夕とを入力し、グループスケールファクタからブロックスケールファクタを減算してその差分を計算し、制御ロジック 4 0 0の制御により、その差分からなるスケールファクタを各計算ュニット P。〜P _k ！の第 2 シフタ 1 0に出力するようになっている。

制御ロジック 4 0 0は、データメモリ 1 0 0のデータに対して初めて演算を行うときは、次の制御処理を実行するようになっている。

まず、デ一夕ブロック単位でデータをデータメモリ 1 0 0から読み出し、データブロックの各データグループごとに、データグループのデー夕をそれぞれデ一夕バス 1 1 0経由で各計算ュニット。〜P _k— , の第 2 シフタ 1 0に振り分ける。

そして、グループスケールファクタ検出器 5 0で検出したグループスケ一ルファクタを各計算ュニッ卜 P。 P k - i の第 1 シフタ 1 6に与え、各計算ュニッ卜 P。 ~ P _k— , の第 1 シフタ 1 6からの演算データをデ —夕バス 1 1 0経由でデータメモリ 1 0 0に格納する。

また、制御ロジック 4 0 0は、データメモリ 1 0 0のデータに対して再度演算を行うときは、次の制御処理を実行するようになっている。まず、デ一タブ口ック単位で演算データをデータメモリ 1 0 0から読み出し、データブロックの各データグループごとに、データグループの演算データをそれぞれデータバス 1 1 0経由で各計算ュニッ b P。〜P K - . の第 2シフタ 1 0に与える。これとともに、各計算ュニッ卜 P„ 〜 P _k - i の第 2シフタ 1 0に与えたデータのグループスケールファクタおよびブロックスケールファク夕がグループスケールファクタレジスタフアイル 5 2およびブロックスケールファクタレジスタ 5 6に格納されているときは、ブロックスケールファクタレジスタ 5 6からブロックスケールファクタを読み出して桁合わせ用加算器 6 0に与え、グループスケールファクタレジスタファイル 5 2からグループスケールファクタを順次読み出して桁合わせ用加算器 6 0に与え、桁合わせ用加算器 6 0により各グループスケールファクタとプロックスケールファク夕との差分を計算し、その差分からなるスケールファクタを各計算ュニット P 。 ~ P _k - , の第 2シフタ 1 0に与える。

そして、グループスケールファクタ検出器 5 0で検出したグループスケ一ルファクタを各計算ュニッ卜 P 。 ~ P ，の第 1 シフタ 1 6に与え、各計算ュニット P 。 P k の第 1シフタ 1 6からの演算データをデ —タバス 1 1 0経由でデータメモリ 1 0 0に格納する。

なお、各計算ユニット P 。〜 P _k i の第 2シフタ 1 0に与えたデータのグループスケールファクタおよびプロックスケールファク夕がグループスケールファクタレジスタファイル 5 2およびブロックスケールファクタレジスタ 5 6に格納されていないときは、各計算ュニッ卜 P 。〜 P κ - , の第 2シフ夕 1 0に与えたデータに対応するグループスケールファクタおよびブロックスケールファクタをデータメモリ 1 0 0から読み出し、これらをデ一夕バス 1 1 0経由でグループスケールファクタレジス夕ファイル 5 2およびプロックスケールファクタレジスタ 5 6に格納してから、上記処理を実行する。

次に、上記実施の形態の動作を図 3ないし図 7を参照しながら説明する。以下、下式（1 ) ，（2 ) の数式例を用いて説明する。なお、ここでも、データメモリ 1 0 0からのデータを 8ビッ卜、積和演算器 1 2の出力を 1 6ビットとする。

本例では、演算部 2 0 0が 4つの計算ュニッ卜から構成されているものとし、データブロックは、 2つのデータグループを含んで構成され、データグループは、 4つのデータを含んで構成されているものとする。また、あらかじめ定められた係数データ A (0) 〜A (3) 、 B (0) ， B ( 1) は、必要な時にはいつでも利用可能であると仮定する。これらの係数データをどのように供給するかは、本発明とは関わりないので説明しないが、例えば、必要に応じてデータメモリ 1 0 0から読み出すなどして各積和演算器 1 2に与えることができるものとする。

まず、本発明に係るデータ演算処理装置において、下式（ 1) によりデータを並列処理する手順を図 3を参照しながら簡単に説明する。図 3 は、各積和演算器 1 2で行われる積和演算を示す図である。

下式（1 ) によりデータメモリ 1 0 0のデータに対して演算を行うときは、まず、サイクル 1で、データ X (0) 〜X (3) を含む 1番目のデータグループがデータメモリ 1 0 0から読み出され、データ X (0) 〜X (3) がそれぞれデータバス 1 1 0経由で各計算ュニット P。〜P 3 の第 2シフタ 1 0に振り分けられる。このとき、データ X (0 ) 〜X (3) は、最初でスケールに関する情報はないので、制御ロジック 4 0 0は、データ X (0) 〜X (3) がシフ卜されないように第 2シフタ 1 0を制御する。これらのデータを各積和演算器 1 2に保持するための手段（例えば、図 1 4の積和演算器 1 2の第 1レジスタファイル）は利用可能であるとする。このような保持手段は本発明とは関係ないため、図 1には示されていない。

各積和演算器 1 2では、図 3の手順に従って、係数データ A (0) 〜 A (3) とデータ X (0) 〜X (3) との積和演算が行われ、サイクル 2からサイクル 5までを経て、最初の積和演算結果である演算データ Y ( 0) 〜Y (3) が得られる。これらの演算過程では、データ X (0) 〜Χ (3) は、各計算ュニッ P。 Pk i 間をハ一ドウヱァ手段を通じて転送されるものとする。

演算デ一夕 Y (0) 〜Y (3) は、その後、各ュニッ卜スケールファクタ検出器 1 4に入力される。各ュニッ卜スケールファクタ検出器 1 4 では、積和演算器 1 2からの演算データの冗長なビッ卜数が算出され、これがスケールファクタとして算出される。この算出では、例えば、演算データ Υ (0 ) 〜Υ (3) のうちあるデータ " 0 0 0 0 1 1 0 0 " は、 " 0 1 1 0 0 0 0 0 " にスケ一リングされ、その場合、冗長なビット数が "3" であるため、スケールファクタは "3" となる。

各ュニットスケールファクタ検出器 1 4で算出された複数のスケールファクタは、次に、グループスケールファクタ検出器 5 0に入力され、ここで複数のスケールファクタのうち最小のものがグループスケールファクタとして検出される。

このグループスケールファクタは、さらに各計算ユニット Ρ。〜Ρ₃ の第 1シフタ 1 6に入力される。これとともに、各積和演算器 1 2からの演算データ Υ ( 0 ) 〜Υ ( 3 ) も第 1シフタ 1 6に入力される。グル —プスケールファクタに従って、第 1シフタ 1 6により、 1 6ビッ卜の演算データ Υ (0) ~Υ (3) に対してグループ正規化が行われる。図 4に、実際の数値を用いた演算結果の一例を示す。

これらのグループ正規化された演算データは、さらに、次のブロック処理に備えるため、データメモリ 1 0 0に格納される。データメモリ 1 0 0のデータのビッ卜数は演算データよりも少ないため、各演算データは、下位の 8ビッ卜が切り捨てられ、 8ビットの演算デ一夕に丸められる。これらの丸められた演算データ Υ (0) 〜Υ (3) は、図 4の中でデータメモリ 1 0 0の入力欄に示されている。演算データ Y ( 0 ) 〜Y ( 3 ) をデ一タメモリ 1 0 0に格納する間に、グループスケールファクタもグループスケールファクタレジスタファイル 5 2に入力される。このグループスケールファクタは、グループスケールファクタレジスタフアイル 5 2内に、対応するデータグループと関連付けられて格納される。例えば、データグループは、データメモリ 1 0 0に格納する場合、ある一つのメモリアドレスを取り、そのデータグループのすべてのデータは、一つのメモリァドレスで同時にアクセスされるとして、演算データをデータメモリ 1 0 0に格納するのに用いられるのと同じァドレスで特定されるレジスタに格納する。あるいは、図 5に示すように、デ一タグループが格納されているデータメモリ 1 0 0のアドレスと、グループスケ一ルファク夕が格納されているグループスケールファクタレジスタフアイル 5 2のァドレスとの対応表を、データメモリ 1 0 0の一部に作成してこれらのァドレスを管理してもよい。

グループスケールファクタは、また、ブロックスケールファクタ検出器 5 4にも入力され、そこで、複数のグループスケールファクタのうち最小のものがブロックスケールファクタとして検出される。あるデータブロックの最初のデータグル一プの計算が終わつた時点では、今計算されたばかりのグループスケールファクタ、すなわち、この図 4の例では " 2 " が初期値として、ブロックスケールファクタ検出器 5 4内のレジスタ（図 1には示されていない）に格納される。

次に、サイクル 6で、データ X ( 4 ) 〜Χ ( 7 ) を含む 2番目のデ一タグループがデータメモリ 1 0 0から読み出され、データ X ( 4 ) 〜Χ ( 7 ) がそれぞれデータバス 1 1 0経由で各計算ュニッ卜 Ρ。 ~ Ρ ₃ の第 2シフタ 1 0に振り分けられる。デ一夕 X ( 0 ) 〜Χ ( 3 ) を含む 1 番目のデ一夕グループに対するのと同様の演算処理が、このデ一タグループに対しても行われる。唯一異なるのは、演算データ Y ( 4) 〜Y ( 7) に対して計算されるグループスケールファクタは、今回はブロックスケールファクタ検出器 5 4内のレジスタに保持されている内容と比較され、小さい方の値がブロックスケールファクタとして選択されるという点である。図 4の例では、演算データ Υ (4 ) 〜Υ ( 7) からグループスケールファクタ "1 " が検出される。この場合、ブロックスケールファクタ検出器 5 4内のレジスタに保持されている "2" よりも " 1" の方が小さいので、ブロックスケールファクタ検出器 5 4内のレジスタの内容は更新される。

この例においては、この時点で、一つのデータブロックのすべてのデ —夕に関する演算が完了したため、ブロックスケールファクタは、プロックスケールファクタ検出器 5 4内のレジスタの現在の値、すなわち " 1 " に確定される。本例から、容易に類推されるように、例えこの後に演算を行うべき複数のデ一タグループがあつたとしても、 2番目のデ一夕グループに適用された上述の処理を繰り返すことが可能である。

次に、下式（2) の信号処理を開始する。演算を始める前に、ブロックスケールファクタ検出器 5 4内のレジス夕の内容をプロックスケールファクタレジスタ 5 6に転送しておく。

下式（ 2 ) によりデータメモリ 1 0 0の演算データに対して再度演算を行うときは、演算データ Υ ( 0 ) 〜Υ (3) を含む 1番目のデ一タグループがデータメモリ 1 0 0から読み出され、演算データ Υ ( 0 ) 〜Υ (3) がそれぞれデータバス 1 1 0経由で各計算ュニッ卜 Ρ» 〜Ρ₃ の第 2シフタ 1 0に振り分けられる _c これとともに、対応するグループスケールファクタ、すなわち、本例においては "2" が、アドレスバス 1 2 0経由で与えられるアドレス情報により選択され、グループスケールファクタレジスタファイル 5 2から読み出される。第 2 シフタ 1 0における右シフ卜量は、現在のグループスケールファクタとブロックスケ一ルファクタの差分、すなわち、本例においては、 2— 1 = 1、として与えられる。このため、第 2シフタ 1 0は、現在の入力を 1ビッ卜右シフ卜するように制御される。演算データ Y (0) 〜Y (3) に対して、この後適用される演算処理は、下式（ 1) について説明した演算処理とまつたく同様である。

次に、演算データ Υ (4) 〜Υ (7) を含む 2番目のデータグループがデータメモリ 1 0 0から読み出され、演算データ Υ (4) 〜Υ (7) がそれぞれデータバス 1 1 0経由で各計算ュニッ P。〜P₃ の第 2シフタ 1 0に振り分けられる。このデ一タグループに対するグループスケ

—ルファクタは、図 4に示すように、 "1 " である。結果として、このデ一夕グループのすべての演算データは、 1— 1 = 0、すなわち第 2シフタ 1 0でシフ卜されずに出力される。

この段階で、すべての演算データ Y ( 0 ) 〜Y ( 7 ) が、デ一タブ口ックの最大値の小数点位置に桁合わせされ、その結果、のちに続く積和演算において、固定小数点演算を行うことが可能となる。

図 6に、本発明のプロックフローティング方式によって得られる演算デ一夕 Υ ( 0) 〜Υ ( 7 ) 、 Ζ ( 0) 〜Ζ ( 7 ) を示す。そして、この演算結果を用いて下式（3) により SNRを計算すると、下式（8) ， (9) に示すようになる。なお、下式（8) は、下式（ 1) の演算結果に基づく SNRを示す式であり、下式（9 ) は、下式（2) の演算結果に基づく SNRを示す式である。

また、図 7に、下式（ 1) ，（2) により、従来の固定小数点処理、従来のプロックフ口一ティング処理および本発明によるプロックフ口一ティング処理をそれぞれ行った場合の SNRをまとめて示す。図 7によれば、本発明によるブロックフローティング処理では、演算精度が大幅に改善されていることがわかる。

このようにして、本実施の形態では、データグループの各データに対して演算を行い、それら演算データを代表する最小のスケールファクタをグループスケールファクタとして検出し、検出したグループスケールファクタに基づいて各演算データに対してスケーリングを行うこれら一連の処理を、データブロックの各データグループごとに行い、さらに、検出したグループスケールファクタのうち最小のものをブロックスケ一ルファクタとして検出し、スケ一リングした演算データに対して再度演算を行うときは、演算の前に、データグループの各演算デ一夕に対して当該デ一夕グループのグループスケールファク夕およびプロックスケ一ルファクタに基づいてスケ一リングを行うようにした。

これにより、積和演算器 1 2からの演算データは、そのデータグループの演算データのうち絶対値が最大となるものの冗長なビット分だけ左シフ卜されてから丸められ、演算データに対して再度演算を行うときは、データメモリ 1 0 0の演算データは、そのデータブロックの演算データ（前回の演算における積和演算器 1 2からの演算データ）のうち正の最大値の小数点位置に桁合わせが行われてから演算が行われるので、演算過程におけるデータの桁落ちが少なくなる。また、従来の構成に対して回路をわずかに追加または変更するだけでよいので、回路を簡易に構成することができる。したがって、従来に比して、比較的簡易な構成により、ブロックフローティング方式で固定小数点演算を行うときの演算精度を向上することができる。

また、本実施の形態では、複数の計算ュニッ卜 P„ ~ P _k - , を備え、データグループ単位でデ一タを並列処理するようにした, ₃ これにより、ブロックフローティング方式で固定小数点演算を行うときの演算精度を向上しつつ、さらにデータの演算処理を高速に行うこともできる。なお、上記実施の形態においては、各計算ュニッ P。〜P _k— i の第 2シフタ 1 0と積和演算器 1 2と相互間で、ハ一ドウヱァ手段を通じてデータを転送することについて説明したが、具体的には、図 8に示す構成を採用することができる。図 8は、各計算ュニッ卜 P。〜？，の第 2シフタ 1 0と積和演算器 1 2と相互間でデータを転送するための詳細な構成を示すプロック図である。

図 8において、計算ュニット P。は、第 2シフタ 1 0からのデータを保持するレジスタ 1 1 aを備えている。計算ュニッ卜， P ₂ は、前段の計算ュニッ卜 p。，のレジスタ 1 1 aからのデータを保持するレジスタ 1 1 aと、前段の計算ュニッ卜 P。， P t のレジスタ 1 1 a力、らのデ一夕および第 2シフタ 1 0からのデータのいずれかを選択して積和演算器 1 2に出力するセレクタ 1 1 bと、を備えている。計算ュニッ卜 P ₃ は、前段の計算ュニット P ₂ のレジスタ 1 1 aからのデータおよび第 2シフタ 1 2からのデータのいずれかを選択して積和演算器 1 2に出力するセレクタ 1 1 bを備えている。

また、上記実施の形態においては、ュニットスケールファクタ検出器 1 4と、グループスケールファクタ検出器 5 0 と、を備えて構成したが、これに限らず、例えば、図 9に示す構成を採用することができる。図 9は、ュニットスケールファクタ検出器 1 4およびグループスケールファクタ検出器 5 0の他の構成を示すブロック図である。

図 9において、各計算ュニッ P。〜P ₄ は、ュニッ卜スケールファクタ検出器 1 4に代えて、 X O Rアレイ 1 5 aからなる局所ブロックフ口一ティングュニッ卜 1 5で構成されている。そして、プライオリティエンコーダ 2 1からなるグループスケールファクタ検出器 5 1と、各計算ュニット P。〜 P ₄ の局所プロックフ口一ティングュニット 1 5とグループスケールファクタ検出器 5 1とを接続するワイヤ一ド O Rバスと、を備えて構成されている。

局所ブロックフローティングュニット 1 5は、積和演算器 1 2からの演算データを入力し、その演算データの隣り合うビッ卜に対して排他的論理和演算を行って出力するようになっている。例えば、 4ビッ卜の演算データを入力した場合、最上位の 4番目のビッ卜および 3番目のビットに対して排他的論理和演算を行ったものを出力デ一夕の 3番目のビッ卜とし、同じ要領で、 3番目および 2番目の演算結果を出力データの 2 番目のビットとし、 2番目および 1番目の演算結果を出力データの 1番目のビッ卜とし、そして、最上位のビッ卜を出力データの最上位のビットとして出力する。

これにより、各計算ュニッ卜 P。〜P ₄ の積和演算器 1 2からの演算データのスケールファタ夕を算出し、それらスケールファク夕からダル —プスケールファクタを算出しなくても、各計算ュニット P。 ~ P ₄ の積和演算器 1 2からの演算データから直接グループスケールファクタを検出することもできる。

また、上記実施の形態においては、数値演算を行うのに本発明を適用した場合について説明したが、これに限らず、本発明の主旨を逸脱しない範囲で他のものにも適用可能である。

また、上記実施の形態においては、制御ロジック 4 0 0を、内部の口ジックに従って各部の制御を行うように構成したが、これに限らず、制御ロジック 4 0 0に代えて、 C P U、 R A Mおよび R O Mをバス接続してデータ演算処理部を構成し、データ演算処理部は、 C P Uにより、上記の制御手順を示したプログラムを R 0 Mから読み出して実行するように構成してもよい。この場合、上記の制御手順を示したプログラムは、 R O Mに格納されているが、これに限らず、上記の制御手順を示したプログラムが記憶された記憶媒体から、そのプログラムを R A Mに読み込んで実行するようにしてもよい。

また、上記実施の形態においては、本発明に係るデータ演算処理装置を、データメモリ 1 0 0と、演算部 2 0 0と、制御部 3 0 0と、制御口ジック 4 0 0と、ァドレス生成器 5 0 0と、を備えたハ一ドウエアで構成したが、これに限らず、例えば、 C PU、 RAMおよび ROMをバス接続して構成し、 C PUにより、各部の機能を実現するための制御プログラムを ROMから読み出して実行するように、一部または全部をソフ卜ウェアで構成してもよい。この場合も、制御プログラムは、 ROMに格納されているが、これに限らず、制御プログラムが記憶された記憶媒体から、その制御プログラムを RAMに読み込んで実行するようにしてもよい。

ここで、記憶媒体とは、 RAM、 ROM等の半導体記憶媒体、 FD、 HD等の磁気記憶型記憶媒体、 C D、 C DV、 L D、 DVD等の光学的読取方式記憶媒体、 MO等の磁気記憶型/光学的読取方式記憶媒体であつて、電子的、磁気的、光学的等の読み取り方法のいかんにかかわらず、コンピュータで読み取り可能な記憶媒体であれば、あらゆる記憶媒体を含むものである。

上記実施の形態において、データメモリ 1 0 0は、請求の範囲第 3項または第 4項記載の記憶手段に対応し、グループスケールファクタレジスタファイル 5 2およびブロックスケールファクタレジスタ 5 6は、請求の範囲第 4項記載の第 2の記憶手段に対応している。

また、第 2シフタ 1 0は、請求の範囲第 3項、第 4項、第 6項または第 7項記載の第 1のスケ一リング手段に対応し、積和演算器 1 2は、請求の範囲第 3項、第 5項、第 6項または第 7項記載の演算手段に対応し、ュニッ卜スケールファクタ検出器 1 4は、請求の範囲第 3項または第 5項記載のスケールファクタ算出手段に対応し、第 1シフタ 1 6は、請求の範囲第 3項または第 6項記載の第 2のスケーリング手段に対応している。

また、グループスケールファクタ検出器 5 0は、請求の範囲第 3項記載の検出グループスケールファクタ検出手段に対応し、プロックスケ一ルファクタ検出器 5 4は、請求の範囲第 3項記載のブロックスケールファクタ検出手段に対応し、制御ロジック 4 0 0は、請求の範囲第 3項または第 4項記載の制御手段に対応している。

3

Y(n)= ∑A(k) X X(n - k) (1)

k=0

Z(m)= ∑B(1) X Y(m - 1) (2)

1=0

-夕の個数

∑ (n番目の浮動小数点演算結果） ²

n = 1

S NR = 10xlog (3)

-夕の個数

∑ (n番目の固定小数点演算結果一 _n番目の浮動小数点演算結果） ² n= 1

0.521617412567

S NR = 10 X log = 35.2 dB

1.559257507324e-4 (4)

0.073227959219

S NR = io x log 24.5 dB

2.610855735586e-4 (5)

0.521617412567

S NR = 10 x log 35.2 dB

1.559257507324e-4 (6)

0.073227959219

SNR = 10 x log 28.5 dB (7)

0.000103669706719

0.521617412567

SNR = 10 x log = 46.1 dB … (8)

1.287460327148e-5

0.073227959219

SNR = 10 x log 39.9 dB

7.408205414267e-6 …（9) 産業上の利用可能性

以上説明したように、本発明に係る請求の範囲第 1項ないし第 7項記載のデータ演算処理装置によれば、従来に比して、比較的簡易な構成により、ブロックフローティング方式で固定小数点演算を行うときの演算精度を向上することができるという効果が得られる。

さらに、本発明に係る請求の範囲第 3項記載のデータ演算処理装置によれば、ブロックフローティング方式で固定小数点演算を行うときの演算精度を向上しつつ、さらにデータの演算処理を高速に行うことができるという効果も得られる。

Claims

請求の範囲

1 . 1又は複数のデータを含んでデータグループが構成され、さらに複数のデータグループを含んで構成されたデ一タブロック単位で、デー夕を処理するデータ演算処理装置であつて、

前記データグループの各データに対して演算を行い、それら演算デー夕のうち絶対値が最大となるもののスケールファクタをグループスケ一ルファクタとして検出し、検出したグループスケールファクタに基づいて前記各演算デ一夕に対してスケーリングを行うこれら一連の処理を、前記データブロックの各デ一夕グループごとに行い、さらに、検出したグループスケールファクタのうち絶対値が最大となる演算デ一タに対応するものをブロックスケールファクタとして検出し、

スケ一リングした演算データに対して再度演算を行うときは、演算の前に、前記デ一タグループの各演算デ一タに対して当該デ一タグループのグループスケールファクタ及び前言己ブロックスケールファクタに基づいてスケ一リングを行うようになっていることを特徴とするデータ演算処理装置。

2 . 請求の範囲第 1項において、

スケ一リングした演算データに対して再度演算を行うときは、演算の前に、前記デ一タグループの各演算デー夕に対して当該デ一夕グループのグループスケールファクタと前記プロックスケールファク夕との差分に基づいてスケーリングを行うようになっていることを特徴とするデ一夕演算処理装置。

3 . 複数の計算ユニットを備え、 1又は複数のデータを含んでデータグループが構成され、さらに複数のデ一タグループを含んで構成されたデ一タブロック単位で、データを処理するデータ演算処理装置であって前記各計算ュニットは、与えられたスケールファクタに基づいてデータに対してスケーリングを行う第 1のスケ一リング手段と、前記第 1のスケ一リング手段からのデータに対して演算を行う演算手段と、前記演算手段からの演算データのスケールファクタを算出するスケールファタタ算出手段と、与えられた他のスケールファクタに基づいて前記演算手段からの演算データに対してスケ一リングを行う第 2のスケ一リング手段と、を有しており、

さらに、データを記憶するための記憶手段と、前記各計算ュニッ卜のスケールファタタ算出手段で算出したスケールファクタのうち絶対値が最大となる演算データに対応するものをグループスケールファクタとして検出するグループスケールファクタ検出手段と、前記グループスケ一ルファクタ検出手段で検出したグループスケールファクタのうち絶対値が最大となる演算デ一タに対応するものをブロックスケールファクタとして検出するブロックスケールファクタ検出手段と、データ処理のための制御を行う制御手段と、を備え、

前記制御手段は、前記データプロック単位でデータを前記記憶手段から読み出し、前記デ一夕ブロックの各データグループごとに、前記デー夕グループのデータをそれぞれ前記各計算ュニッ卜の第 1のスケ一リング手段に振り分け、前記グループスケールファクタ検出手段で検出したグループスケールファクタを前記各計算ュニッ卜の第 2のスケーリング手段に与え、前記各計算ュニッ卜の第 2のスケ一リング手段からの演算データを前記記憶手段に格納し、

前記記憶手段の演算データに対して再度演算を行うときは、前記データブ口ックの各データグループごとに、前記データグループの演算デ一タをそれぞれ前記各計算ュニッ卜の第 1のスケーリング手段に振り分けるとともに、前記データグループのグループスケールファクタと前記ブロックスケールファクタとの差分からなるスケールファクタを前記各計算ュニッ卜の第 1のスケ一リング手段に与えるようになつていることを特徴とするデータ演算処理装置。

4 . 請求の範囲第 3項において、

前記グループスケールファク夕及び前記ブロックスケールファク夕を記憶するための第 2の記憶手段を備え、

前記制御手段は、前記グループスケールファクタ及び前記プロックスケールファクタを演算データと対応させて前記第 2の記憶手段に記憶し前記記憶手段の演算データに対して再度演算を行うときは、対応するグループスケールファクタ及びプロックスケールファク夕を前記第 2の記憶手段から読み出し、前記データブロックの各データグループごとに、前記データグループの演算データをそれぞれ前記各計算ュニッ卜の第 1のスケーリング手段に振り分け、前記データグループのグループスケ —ルファクタと前記プロックスケールファク夕との差分からなるスケ一ルファクタを前記各計算ュニッ卜の第 1のスケ一リング手段に与えるようになつていることを特徴とするデータ演算処理装置。

5 . 請求の範囲第 3項及び第 4項のいずれかにおいて、

前記スケールファクタ算出手段は、前記演算手段からの演算データの冗長なビット数を算出し、これをスケールファクタとして算出するようになっていることを特徴とするデータ演算処理装置。

6 . 請求の範囲第 5項において、

前記演算手段は、固定小数点演算器であり、

前記第 1のスケ一リング手段は、与えられたスケールファクタに相当するシフト量で、データに対してビットシフトを行うようになっており前記第 2のスケ一リング手段は、与えられた他のスケールファクタに相当するシフ卜量で、前記演算手段からの演算データに対してビットシフ卜を行うようになっていることを特徴とするデータ演算処理装置。

7 . 請求の範囲第 3項乃至第 6項のいずれかにおいて、

前記演算手段は、前記第 1のスケ一リング手段からのデータと所定の係数との積和を演算する積和演算器であることを特徴とするデータ演算