WO2006022048A1

WO2006022048A1 - 演算方法および装置

Info

Publication number: WO2006022048A1
Application number: PCT/JP2005/007250
Authority: WO
Inventors: Kohei Kodama
Original assignee: Sony Computer Entertainment Inc.
Priority date: 2004-08-27
Filing date: 2005-04-14
Publication date: 2006-03-02
Also published as: US20080104160A1; US8694567B2; EP1783601A1; JP2006065633A

Abstract

　浮動小数点数の演算の処理量を抑えつつ、精度を向上させる。　第２変換部３２は、関数に応じて定められた指数部の変換規則によって、指数部１２に含まれた指数部を変換する。記憶部３８は、関数に応じて定められた仮数部の変換規則によって、仮数部１４を変換した値をテーブルとして予め記憶する。取得部３４は、仮数部１４を構成する２３ビットから上位８ビットを抽出することによって、テーブルのインデックスを導出する。さらに、取得部３４は、上位８ビットによって近似した仮数部１４に対して１を加え。ふたつ目のインデックスを導出する。導出部３６は、仮の戻り値Ａと仮の戻り値Ｂをそれぞれ導出する。さらに、導出部３６は、仮の戻り値Ａと仮の戻り値Ｂに補間演算を施して関数の戻り値２０８を導出する。

Description

明細書

演算方法および装置

技術分野

[0001] 本発明は、演算技術に関し、特に浮動小数点の形式によって表現された値に対して演算を実行する演算方法および装置に関する。

背景技術

[0002] コンピュータや DSP (Digital Signal Processer)が数値を扱う際の表現手法として、一般的に固定小数点数と浮動小数点数が使用されている。浮動小数点数は小数点に関する処理を必要とするので、浮動小数点数の計算速度は、特定の位置に小数点を固定している固定小数点数の計算速度に比べて、遅くなる傾向にある。し力しながら、浮動小数点数は、小数点の位置を変更できるので、絶対値が小さな数の場合に高い精度で数を表現でき、一方、絶対値が大きな数の場合であっても数を表現できる。

発明の開示

発明が解決しょうとする課題

[0003] グラフィックスハードウェアのピクセルパイプラインでは、ライティング計算や画像処理演算が実行される。このような計算は、ベクトルの正規化、逆行列の計算などを含み、それらは多くの逆数計算や平方根逆数計算等を実行する。従来、ピクセルパイプラインは、演算対象を整数としていたので、整数テーブルと整数の線形補間演算にもとづく逆数や平方根逆数の計算によって実行されていた。しかしながら、近年、ピクセルパイプラインは、演算対象として浮動小数点演算をサポートする傾向にあるので、浮動小数点数に対する逆数や平方根逆数の計算の高速性が要求される。特に、リアルタイムグラフィックスのための演算において、その要求が強くなる。またパイプラインの並列度も多くなる傾向にあるので、コストの点から、使用するハードウェアリソースを最小限に抑えるほうが望ましい。

[0004] 本発明はこうした状況に鑑みてなされたものであり、その目的は、浮動小数点の形式で表現した数値に対して演算を実行する際に、演算の処理量を軽減する演算方法および装置を提供することにある。

課題を解決するための手段

[0005] 本発明のある態様は、演算装置である。この装置は、指数部と仮数部を含んだ浮動小数点形式で表現された関数の引数を入力する入力部と、関数に応じて定められた指数部の変換規則によって、入力した引数に含まれた指数部を変換する変換部と、関数に応じて定めされた仮数部の変換規則によって、引数に含まれる仮数部を変換した値をテーブルとして予め記憶する記憶部と、入力した引数のうちの少なくとも仮数部を近似することによって、記憶部に記憶したテーブルの複数のインデックスをそれぞれ導出し、導出した複数のインデックスにもとづいて、記憶部に記憶したテーブルから複数の値をそれぞれ取得する取得部と、変換した指数部と取得した複数の値にもとづいて、引数と同様の浮動小数点形式で表現された関数の戻り値を導出して出力する導出部とを備える。この装置によれば、記憶部には、引数のうちの少なくとも仮数部の近似値がとりうる値の総数に 1をカ卩えた数力テーブルのインデックスの数として規定されてもよい。

[0006] 「関数に応じて定められた指数部の変換規則」と「関数に応じて定めされた仮数部の変換規則」は、計算すべき関数に応じて定められた規則であって、指数部あるいは仮数部を変換するための規則である。

[0007] この態様によると、テーブルを使用することによって、演算の処理量を少なくする場合であっても、インデックスがとりうる数に 1をカ卩えた数によってインデックスの数が規定されるので、引数の一部によって近似された値より大きい値と小さい値をインデックスとして用意でき、戻り値の精度を向上できる。

[0008] 入力部で入力した引数に対応した関数は、引数の逆数の演算であり、記憶部には、引数のうちの仮数部を当該仮数部の上位ビットにより近似した値力テーブルのィンデッタスとして規定され、取得部は、入力した引数のうちの仮数部を当該仮数部の上位ビットにより近似した値と、当該近似した値に 1をカ卩えた値をテーブルの複数のィンデッタスとして導出してもよ、。

[0009] 「引数のうちの仮数部を当該仮数部の上位ビットにより近似した値」とは、仮数部を構成する複数のビットのうち、上位力も所定のビットを抽出した値に対応する。もとの仮数部のビット数と近似した値のビット数が異なる場合もある力ビットの配列におヽて、ビットの同一のパターンが含まれているので、これを近似に含める。

[0010] 入力部で入力した引数に対応した関数は、引数の平方根の演算であり、記憶部には、引数のうちの指数部の最下位のビット値と、引数のうちの仮数部を当該仮数部の上位ビットにより近似した値によって形成される値力テーブルのインデックスとして規定され、取得部は、入力した引数のうちの指数部の最下位のビット値と、入力した引数のうちの仮数部を当該仮数部の上位ビットにより近似した値によって形成される値と、当該形成された値に 1を加えた値をテーブルの複数のインデックスとして導出してもよい。

[0011] 「引数のうちの指数部の最下位のビット値と、引数のうちの仮数部を当該仮数部の上位ビットにより近似した値によって形成される値」とは、仮数部を構成する複数のビットのうち、上位カゝら所定のビットを抽出した値と、指数部の最下位のビット値を組み合わせた値である。ここで、近似に関しては、上記のとおりであってもよい。

[0012] 本発明の別の態様は、演算方法である。この方法は、指数部と仮数部を含んだ浮動小数点形式で表現された関数の引数を入力するステップと、関数に応じて定められた指数部の変換規則によって、入力した引数に含まれた指数部を変換するステツプと、関数に応じて定められた仮数部の変換規則によって、引数に含まれる仮数部を変換した値を予め記憶したテーブルを参照するために、入力した引数のうちの少なくとも仮数部を近似することによって、テーブルの複数のインデックスをそれぞれ導出し、導出した複数のインデックスにもとづいて、テーブル力複数の値をそれぞれ取得するステップと、変換した指数部と取得した複数の値にもとづいて、引数と同様の浮動小数点形式で表現された関数の戻り値を導出して出力するステップとを備える。この方法によれば、取得するステップで参照すべきテーブルには、引数のうちの少なくとも仮数部の近似値がとりうる値の総数に 1をカ卩えた数力インデックスの数として規定されてもよい。

[0013] 本発明のさらに別の態様は、プログラムである。このプログラムは、所定のインターフェースを介して、指数部と仮数部を含んだ浮動小数点形式で表現された関数の引数を入力するステップと、関数に応じて定められた指数部の変換規則によって、入力した引数に含まれた指数部を変換するステップと、関数に応じて定められた仮数部の変換規則によって、引数に含まれる仮数部を変換した値を予めメモリに記憶したテーブルを参照するために、入力した引数のうちの少なくとも仮数部を近似することによつて、テーブルの複数のインデックスをそれぞれ導出し、導出した複数のインデックスにもとづ、てメモリにアクセスすることによって、テーブル力複数の値をそれぞれ取得するステップと、変換した指数部と取得した複数の値にもとづいて、引数と同様の浮動小数点形式で表現された関数の戻り値を導出して出力するステップとを備える。このプログラムによれば、取得するステップで参照すべきテーブルには、引数のうちの少なくとも仮数部の近似値がとりうる値の総数に 1をカ卩えた数力インデックスの数として規定されてヽることをコンピュータに実行させてもょ、。

[0014] なお、以上の構成要素の任意の組合せ、本発明の表現を方法、装置、システム、記録媒体、コンピュータプログラムなどの間で変換したものもまた、本発明の態様として有効である。

発明の効果

[0015] 本発明によれば、浮動小数点の形式で表現した数値に対して演算を実行する際に、演算の処理量を軽減できる。

図面の簡単な説明

[0016] [図 1]本発明の実施例 1に係る浮動小数点数のフォーマットを示す図である。

[図 2]本発明の実施例 1に係る画像表示装置の構成を示す図である。

[図 3]図 2の記憶部に記憶されたテーブルのデータ構造を示す図である。

[図 4]図 2の導出部の構成を示す図である。

[図 5]図 2の演算装置による演算処理の手順を模式的に示す図である。

[図 6]図 6 (a) - (b)は、図 2の演算装置による近似解と真の解との関係を示す図である。

[図 7]本発明の実施例 2に係る導出部の構成を示す図である。

[図 8]図 7の導出部を含んだ演算装置による演算処理の手順を模式的に示す図である。

[図 9]本発明の実施例 3に係る記憶部に記憶されたテーブルのデータ構造を示す図である。

[図 10]図 9の記憶部を含んだ演算装置による演算処理の手順を模式的に示す図である。

符号の説明

[0017] 10 符号部、 12 指数部、 14 仮数部、 20 画像処理部、 22 画像出力部、 24 演算装置、 26 入力部、 28 分離部、 30 第 1変換部、 32 第 2変換部、 34 取得部、 36 導出部、 38 記憶部、 40 合成部、 42 補間部、 10 0 画像表示装置、 200 変換符号部、 202 変換指数部、 204 変換仮数部、 208 戻り値。

発明を実施するための最良の形態

[0018] (実施例 1)

本発明を具体的に説明する前に、概要を述べる。本発明の実施例 1は、ディスプレィ等の表示装置に表示すべき画像を生成するために、ライティング計算や画像処理計算を実行する画像表示装置、特にその中で、浮動小数点数の逆数を計算する演算装置に関する。本実施例に係る演算装置は、引数として、符号部、指数部、仮数部で構成される浮動小数点数を入力し、符号部、指数部、仮数部に分離する。演算装置は、予め記憶した値と指数部との間で減算を実行する。なお、当該減算は、逆数に対応している。

[0019] また、逆数に対応するように仮数部を変換したした値がテーブルのエントリとして予め記憶されている。当該テーブルのインデックスは、指数部の上位ビットで形成されているが、インデックスの総数は、指数部の上位ビットで表現できる数に 1をカ卩えた数で規定されている。演算装置は、インデックスを生成するために、仮数部の上位ビットを抽出し、さらにふたつ目のインデックスを生成するために、抽出した上位ビットに 1を加算する。その後、テーブルを参照しながら、生成したふたつのインデックスによって、ふたつのエントリに対応した値を取得する。演算装置は、ふたつのエントリに対応した値のそれぞれに対して、符号部と、減算した指数部をそれぞれ合成して、ふたつの仮の戻り値を生成する。最終的に、ふたつの仮の戻り値に内挿補間処理を実行して、戻り値を生成する。 [0020] 演算装置は、指数部に対して減算を実行し、仮数部に対してテーブルにもとづく変換を実行しており、一般的に処理量の多い乗算および除算処理が内挿補間処理だけに使用されているので、全体の処理量を小さくできる。また、テーブルのインデックスを仮数部の上位の数ビットとしているので、テーブルの規模を小さくできる。また、テ一ブルの規模を小さくしながらも、内挿補間処理を実行するので、精度の低下を抑制できる。また、インデックスの総数は、指数部の上位の数ビットで表現できる数に 1を加えた数で規定されて、るので、入力した引数に含まれた指数部の上位の数ビットが最大値であっても、演算装置は、内挿補間処理を実行できる。

[0021] 本実施例における演算装置の構成を説明する前に、本実施例における逆数演算のアルゴリズムを説明する。図 1は、本発明の実施例 1に係る浮動小数点数のフォーマットを示す。符号部 10は、数値の符号を反映しており、 1ビット符号なし整数で構成されている。指数部 12は、 2のべき乗の整数値を表しており、 8ビット符号なし整数で構成されている。仮数部 14は、 1. 0から 2. 0の値を表しており、 23ビット符号なし整数で構成されている。図示のごとぐ符号部 10を s、指数部 12を e、仮数部 14を mとすれば、これらは、次のような浮動小数点数を表現する。また、ここでは、次の Xを関数の引数とする。

(式 1)

X = (-l)^s * 2^e"¹²⁷ * (l+m/2²³)

[0022] このように表現された Xによって、関数の戻り値の lZxを表現すれば次のようになる

(式 2)

l/x = l/{(-l)^s * 2^e_127 * (l+m/2²³)}

このように表現された lZxを変形すれば、次のようになる。

(式 3)

l/x = (-l)^s * 2^127_e * l/(l+m/2²³)

= (-l)^s * 2¹²⁷"^e_1 * 2/(l+m/2²³)

= (-l)^s * 2⁽²⁵³"^eH27 * 2/(l+m/2²³)

= (- l)^s * 2^(253_e)"¹²⁷ * (l+(l-m/2²³)/(l+m/2²³)) = (- l)^s * 2^(253_e)"¹²⁷ * (l+(2²³-m)/(2²³+m)*2²³/2²³)

[0023] ここで、指数部 12を変換した値 (以下、「変換指数部」という）を e'で示し、仮数部 14 を変換した値 (以下、「変換仮数部」という）を m'で示せば、これらの値は、次のように示される。

(式 4)

e' =253-e (ただし e≥254のときは e' =0)

m' =(2²³-m)/(2²³+m)*2²³

このような変換指数部と変換仮数部を使用すれば、 lZxは、次のように示される。 (式 5)

1/x = (-1)⁸ * 2°'"¹²⁷ * (l+m72²³)

[0024] つまり、これは、引数 Xの指数部 12と仮数部 14に対して、変換指数部と変換仮数部を導出すれば、 Xの逆数 lZxが計算できることを意味する。ここで、変換指数部は、 8 ビットの減算処理で導出できるが、変換仮数部は、単純な演算器で導出できないので、テーブルを使用する。その際、仮数部 14の 23ビットをテーブルのインデックスとすれば、テーブルの規模が大きくなるので、仮数部 14の上位 8ビットをテーブルとする。これは、次のようにち示される。

(式 6)

m' =table0[m[0:7]]

[0025] ここで table0[m[0:7]]は、仮数部 14の上位 8ビットをインデックスとして、テーブルから取得した値、すなわちエントリの値である。当該エントリの値が変換仮数部に対応する。なお、テーブルにおいて、 1エントリのサイズは 23ビットとする。 i番目のエントリである table0[i]には、（2²³- i)/(2²³+i)*2²³の値が整数ィ匕して記憶されている。ただし、テーブルサイズが 23ビットであるので、エントリにいれる値が 2²³-1を超える場合はエントリの値は 2²³-1としている。

[0026] し力しながら、エントリの値をひとつだけ抽出し、そのような値を変換仮数部として計算した場合、仮数部の精度が 8ビット程度となる。そこで本実施例では、インデックスで表現できる数に 1をカ卩えた 257個のエントリを持つテーブルを予め用意し、仮数部 14の上位 8ビットと当該値に 1を加えた値から、隣接したふたつのインデックスを生成する。さらに、ふたつのインデックスから、ふたつのエントリの値を取り出し、このふたつのエントリの値を内挿補間処理し、さらに高精度な近似解を導出する。

[0027] 以上のようなふたつのインデックスのうち、小さい方のインデックスから取得されたェントリの値を変換仮数部 Aとし、大き、方のインデックスから取得されたエントリの値を変換仮数部 Bとする。さら〖こ、変換仮数部 Aを m'とし、変換仮数部 Bを m"とすれば、変換仮数部 Aに対応した仮の戻り値 (以下、「仮の戻り値 A」という） aと変換仮数部 B に対応した仮の戻り値 (以下、「仮の戻り値 B」という） bは、次のように示される。

[0028] ここで、引数 Xに対して、指数部 12に 8ビットの整数演算を施し、仮数部 14の上位 8 ビットをインデックスとしてエントリを 1つ取得する。このようにして仮の戻り値 Aが計算される。このとき、 e'が負になる場合は e'の値は 0とする。また、仮の戻り値 Bは、仮数部 14の上位 8ビットに 1が加えられた値をインデックスとする以外、仮の戻り値 Aと同様に導出される。

[0029] (式 7)

e' =253-e

m' =table0[m[0:7]]

(式 8)

a = (-l)"^s * 2^e'"¹²⁷ * (l+m72²³)

[0030] (式 9)

e' =253-e

m"=table0[m[0:7]+l]

(式 10)

b = (-1Γ * 2^e'— ¹²⁷ * (l+m"/2²³)

[0031] 仮数部 14の下位 15ビットを 32ビットの浮動小数点数に変換した値を cで示せば、 1 Zxは次のように示される。

(式 11)

c= m[8:22]/2¹⁵

(式 12)

1/x = (1/x -1/x )*(m[8:22]/2¹⁵)+l/x = (b- a)*c+a 以上のごとぐ lZxは、 cにもとづいて、 aと bを内挿補間することによって、導出される。このようなアルゴリズムによれば、指数部 12の上位 8ビットが最大値であっても、ィンデッタス「256」と「257」によって内挿補間を実行できる。本実施例に係る演算装置は、式 10から式 12の処理を実行するように構成される。

[0032] なお、変換値である e'と m'が適正な範囲であることを確認する。まず、 0≤e≤255である力も、 0≤e，≤253である。また、 0≤m〈2²³であるから、 0< m' =(2²³-m)/(2²³+m)*2²³ ≤2²³となる。ただし、上記のとおり m'はテーブルから求めるため、 m' =2²³にならない。よって、 0< m，=(2²³- m)/(2²³+m)*2²³く 2²³である。すなわち、 e，は 8bit, m，は 23bitの符号なし整数で表現できる。

[0033] 図 2は、本発明の実施例 1に係る画像表示装置 100の構成を示す。画像表示装置 100は、画像処理部 20、画像出力部 22、演算装置 24、記憶部 38を含む。また、演算装置 24は、入力部 26、分離部 28、第 1変換部 30、第 2変換部 32、取得部 34、導出部 36を含む。また、信号として、変換符号部 200、変換指数部 202、変換仮数部 2 04、戻り値 208を含む。

[0034] 画像処理部 20は、画像を生成するために、ライティング計算や画像処理計算を実行する。例えば、画像処理部 20は、コンピュータグラフィックにおけるサーフェスモデル等によって、球体を生成するためにライティング計算を実行する。そのようなライテイング計算は、正規化されたベクトルの導出に逆数の計算を必要とする。逆数の計算が必要になった場合に、画像処理部 20は、演算装置 24に引数を出力する。また、演算装置 24から戻り値、すなわち計算された逆数を入力すれば、画像処理部 20は当該逆数を使用しながら画像を生成する。画像出力部 22は、画像処理部 20で生成した画像を表示する。画像出力部 22は、ディスプレイ等によって構成される。

[0035] 入力部 26は、図 1のごとぐ符号部 10、指数部 12、仮数部 14を含んだ浮動小数点形式によって表現された関数の引数を入力する。なお、引数は画像処理部 20から入力される。

[0036] 分離部 28は、入力した引数を符号部 10、指数部 12、仮数部 14に分離する。分離部 28は、符号部 10を第 1変換部 30に出力し、指数部 12を第 2変換部 32に出力し、仮数部 14を取得部 34および導出部 36に出力する。 [0037] 第 1変換部 30は、符号部 10に対して所定の変換を行う。計算すべき関数が逆数の場合、式 5のように、引数における符号部 10と戻り値における符号部 10は同一の値である。すなわち、第 1変換部 30は、入力した符号部 10をそのまま導出部 36に出力する。ここで、第 1変換部 30から導出部 36に出力される符号部 10は、変換符号部 2 00と呼ばれる。

[0038] 第 2変換部 32は、関数に応じて定められた指数部の変換規則によって、指数部 12 に含まれた指数部を変換する。ここで関数は逆数なので、変換規則は、式 4、式 7、式 9のごとく、「253」から指数部 12を減じる減算処理に対応する。ただし、符号部 10 が「254」以上の場合は「0」とする。減算した結果は、変換指数部 202として導出部 3 6に出力される。変換指数部 202は、式 4、式 7、式 9の e'に対応する。

[0039] 記憶部 38は、関数に応じて定められた仮数部の変換規則によって、仮数部 14を変換した値をテーブルとして予め記憶する。ここで関数は逆数なので、変換規則は、式 4の m'の計算式に対応する。記憶部 38に記憶されたテーブルは、仮数部 14の上位 8ビットをインデックスとする。すなわち、引数を近似した値をインデックスとする。ここで、仮数部 14の上位 8ビットがとりうる値の総数は 256である力前述のごとぐテーブルのインデックスの数は、 256に 1を加えた 257に規定されている。また、記憶部 3 8は、式 4の mをエントリとする。図 3は、記憶部 38に記憶されたテーブルのデータ構造を示す。「インデックス」が「0」から「256」まで、すなわち 257個規定されている。また、「インデックス」にそれぞれ対応した「エントリ」が「C0」から「C256」まで記憶されている。ここで、「C0」は、式 4の m，に対して、 mに「0」を代入した値であり、「C1」は、 mに「 1」を代入した値である。

[0040] 図 2に戻る。取得部 34は、仮数部 14を構成する 23ビットから上位 8ビットを抽出することによって、すなわち仮数部 14を上位 8ビットで近似することによって、記憶部 38 に記憶したテーブルのインデックスを導出する。さらに、取得部 34は、インデックスをふたつ導出するために、上位 8ビットによって近似した仮数部 14に対して、 1を加えた数を導出する。以上の結果、取得部 34は、ふたつのインデックスを導出する。その後、取得部 34は、ふたつのインデックスにもとづいて、記憶部 38に記憶したテーブルからふたつのエントリの値をそれぞれ取得する。すなわち、図 3のテーブルにおいて、ふたつのインデックスに対応したふたつのエントリの値、すなわち変換仮数部 204A と変換仮数部 204Bを取得する。取得したふたつのエントリの値が、式 7の m'と式 9の m"に対応する。なお、ふたつのエントリの値は、変換仮数部 204として、導出部 36に出力される。記憶部 38がメモリ等の記憶媒体で構成される場合、インデックスはアドレスに対応してもよい。

[0041] 導出部 36は、取得部 34で取得したふたつの変換仮数部 204のそれぞれに対応するように、変換符号部 200と変換指数部 202を加えて、引数と同様の浮動小数点形式で表現された仮の戻り値 Aと仮の戻り値 Bをそれぞれ導出する。仮の戻り値 Aは式 8の aに対応し、仮の戻り値 Bは式 10の bに対応する。引数と同様の浮動小数点形式とは、図 1に示したフォーマットであり、ここでは、左から変換符号部 200、変換指数部 202、変換仮数部 204の順に並べられる。さらに、導出部 36は、仮数部 14の下位 15 ビットを使用しつつ、仮の戻り値 Aと仮の戻り値 Bに補間演算を施して関数の戻り値 2 08を導出する。なお補間演算の前に、仮数部 14の下位 15ビットは、式 11のごとぐ浮動小数点数の cに変換される。 a、 b、 cによる補間演算は、式 12のような線形補間によって、実行される。

[0042] この構成は、ハードウェア的には、任意のコンピュータの CPU、メモリ、その他の LS Iで実現でき、ソフトウェア的にはメモリのロードされたプログラムなどによって実現される力ここではそれらの連携によって実現される機能ブロックを描いている。したがつて、これらの機能ブロックがハードウェアのみ、ソフトウェアのみ、またはそれらの組合せによっていろいろな形で実現できることは、当業者には理解されるところである。

[0043] 図 4は、導出部 36の構成を示す。導出部 36は、合成部 40、補間部 42を含む。合成部 40は、変換符号部 200、変換指数部 202、変換仮数部 204を合成することによつて、仮の戻り値を生成する。変換仮数部 204には、ふたつの値が含まれているので、それぞれに対応するように仮の戻り値 Aと仮の戻り値 Bが生成される。これらの生成は、図 1のごとぐ変換符号部 200、変換指数部 202、変換仮数部 204を並べるだけの処理である。合成部 40は、仮の戻り値 Aと仮の戻り値 Bを補間部 42に出力する。

[0044] 補間部 42は、仮の戻り値 Aと仮の戻り値 Bに対して、線形補間を実行して戻り値 20 8を生成する。線形補間を実行するために、仮数部 14の下位 15ビットを浮動小数点数に変換した値を使用する。前述のごとぐ仮の戻り値 A、仮の戻り値 B、変換した値は、式 12の a、 b、 cによって示され、戻り値 208は式 12の lZxによって示される。 cは、仮数部 14力インデックスに使用した仮数部 14の上位 8ビットの値にどれだけ近、かを示す指標となる。また、仮数部 14の上位 8ビットの値力も離れていれば、それは、もうひとつのインデックスの値に近いことに相当する。

[0045] 図 5は、演算装置 24による演算処理の手順を模式的に示す。入力部 26は、 32ビットの引数を入力する（S10)。分離部 28は、入力した引数を分離する。すなわち 1ビットの符号部 10を抽出し (S12)、 8ビットの指数部 12を抽出し (S14)、仮数部 14の上位 8ビットを抽出する（S16)。第 1変換部 30は、符号部 10を変換符号部 200として出力する。第 2変換部 32は、固定値「253」を入力し (S20)、固定値と指数部 12によつて減算を実行して (S22)、変換指数部 202を出力する。取得部 34は、仮数部 14の上位 8ビットからふたつのインデックスを生成し（S24)、当該インデックスにもとづいて、記憶部 38から変換仮数部 204Aを取得しつつ（S26)、変換仮数部 204Bも取得する（S28)。

[0046] 合成部 40は、変換符号部 200、変換指数部 202、変換仮数部 204Aカゝら仮の戻り値 Aを生成する（S30)と共に、変換符号部 200、変換指数部 202、変換仮数部 204 B力も仮の戻り値 Bを生成する（S32)。補間部 42は、仮数部 14の下位 15ビットを抽出し (S18)、当該仮数部 14の下位 15ビットを浮動小数点数に変換する（S34)。さらに、補間部 42は、変換した浮動小数点数にもとづいて、仮の戻り値 Aと仮の戻り値 B を内挿補間して（S36)、戻り値を生成する。最終的に、 32ビットの戻り値を出力する（ S38)。

[0047] 図 6 (a) - (b)は、演算装置 24による近似解、すなわち式 12の lZxと真の解との関係を示す。これらの図にもとづいて、本実施例では、補間が行われた場合に精度が向上する理由を説明する。図 6 (a)は、本実施例での補間処理による近似解を示す。横軸の Sample point (A)と Sample point (B)力テーブルのインデックスに相当する離散的な値を示す。縦軸が、インデックスに対応したエントリおよび近似解を示す。

[0048] 前述のごとぐ Sample point (A)と Sample point (B)における 2点力隣接するエントリを参照する 2点で、 Aと Bの間の近似解は線形補間によって計算される。本実施例では、線形補間係数が 0.0である Sample pointにおける近似解、すなわちエントリの値そのものは、真の解を 32ビットの浮動小数点で表現した値に対して、仮数部 14の下位ビットをマスクしたものである。従って、入力が x≥0の場合は、 Sample pointにおける近似解は真の解よりも小さくなる。ここで、入力が負の場合は原点対象になるのみで、本質は変わらないので、説明を省略する。また、真の解の二次微分係数は、次のように示される。

(式 13)

(d²/dx²){l/x}=(d/dx){-l/x²}=2/x³

[0049] よって、 x≥0のときは、常に曲線の二次微分係数は正となる。そのため、図示のごとぐ下に膨らんだ曲線になる。すなわち、真の解と近似解の関係図は、図 6 (a)あるいは図 6 (b)のいずれかで示される。図 6 (a)では、隣接する Sample point (A)と Sample point (B)の区間における誤差は、中央部分において最小になる。一方、図 6 (b)では、 Sample point (A)と Sample point (B)の区間における誤差は、中央において最大になる。

[0050] し力しながら、本実施例では、浮動小数点数の仮数部 14を 8ビットのインデックスとしており、この場合の真の解とエントリの位置関係は、図 6 (b)のようなケースにはならず、図 6 (a)のようになる。このとき、 Sample point (A)と Sample point (B)の区間における誤差は、中央部分において最小になる。すなわち、 Sample point (A)と Sample point (B)の区間における近似解の精度は、 Sampling pointにおける精度を下回らない。なお、以上の説明は、 lZxに関するものである力それ以外の関数にも対応する。

[0051] 本発明の実施例によれば、仮数部を近似した値でテーブルのインデックスを生成するので、テーブルのサイズを削減できる。また、近似した値がとりうる総数に 1をカロえた値が、インデックスの数として規定されているため、すべての近似した値に対して、複数のインデックスを生成でき、戻り値の精度を向上できる。また、指数部は、減算処理を実行するだけなので、処理量を削減できる。また、テーブルから取得した複数の値に対して補間処理を実行して戻り値を導出するので、戻り値の精度を向上できる。また、逆数の計算が、処理量を抑えつつも、高い精度によって実行される。また、補間処理のみに乗算が実行されるので、処理量を小さくできる。 [0052] また、浮動小数点数の演算が、 1回の線形補間計算によって実行できるので、処理量を削減できる。また、少なくとも 17ビットの精度を持つ逆数の計算が可能となる。また、テーブルは、 257のインデックスを有した 23ビットのエントリで逆数計算を実行できる。また、ひとつのエントリにおけるビットサイズを小さくして、精度と SRAM (Static Random Access Memory)容量のトレードオフを調整することもできる。

[0053] (実施例 2)

本発明の実施例 2は、実施例 1と同様に、浮動小数点数の引数に対して逆数を計算する演算装置に関する。実施例 2に係る演算装置は、実施例 1と同様に、テーブルを参照しながら、ふたつのインデックスによって、ふたつのエントリに対応した値、すなわちふたつの変換仮数部を取得する。しかしながら、実施例 1と異なって、演算装置は、ふたつの変換仮数部を内挿補間処理してから、内挿補間された値、変換符号部、変換指数部を合成して、戻り値を生成する。すなわち、内挿補間と合成の順番が実施例 1と異なる。

[0054] 実施例 2に係る画像表示装置 100は、図 2に示した画像表示装置 100と同じタイプであるので、説明を省略する。

[0055] 図 7は、本発明の実施例 2に係る導出部 36の構成を示す。導出部 36は、補間部 4 2、合成部 40を含む。図 7の導出部 36は、図 4の導出部 36と比較して、合成部 40と補間部 42の順番が異なる。

[0056] 補間部 42は、図示しない取得部 34から入力したふたつの変換仮数部 204に対して、補間演算を施す。すなわち、変換仮数部 204Aと変換仮数部 204Bを線形補間する。補間部 42は、線形補間を実行するために、仮数部 14の下位 15ビットを浮動小数点数に変換した値を使用する。具体的には、式 12における aを m'に置き換え、 bを m"に置き換えることによって線形補間を実行し、式 12における 1/xの代わりの値（以下、「補間仮数部」という）が得られる。なお、 c等の性質は、実施例 1と同様であるので、説明を省略する。また、補間部 42は、合成部 40に補間仮数部を出力する。

[0057] 合成部 40は、変換符号部 200、変換指数部 202、補間仮数部を合成することによつて、戻り値 208を生成する。これらの生成は、図 1のごとぐ変換符号部 200、変換指数部 202、補間仮数部を左カゝら並べるだけの処理である。合成部 40は、戻り値 20 8を出力する。

[0058] 図 8は、演算装置 24による演算処理の手順を模式的に示す。ステップ 50からステツプ 68は、図 5のステップ 10からステップ 28にそれぞれ対応するので、説明を省略する。補間部 42は、仮数部 14の下位 15ビットを使用しつつ、変換仮数部 Aと変換仮数部 Bを内挿補間して (S70)、補間仮数部を生成し、合成部 40に出力する。合成部 4 0は、変換符号部 200、変換指数部 202、補間仮数部を合成して、関数の戻り値を生成する（S72)。さらに、 32ビットの戻り値を出力する（S74)。

[0059] 本発明の実施例によれば、実施例 1と同様の効果がえられる。また、仮の戻り値よりもビット数の少ない変換仮数部に対して、補間計算を実行するので、処理量を削減できる。また、処理量が少ないので、処理速度が速くなる。また、消費電力を小さくできる。

[0060] (実施例 3)

本発明の実施例 3は、これまでの実施例と異なって、浮動小数点数の引数に対して平方根の逆数を計算する演算装置に関する。実施例 3に係る演算装置は、これまでと同様に、引数を符号部、指数部、仮数部に分離して、指数部力も減算によって変換指数部を導出しつつ、変換仮数部をテーブルのエントリとして記憶しておき、ふたつのインデックスからふたつの変換仮数部を取得する。さらに、ふたつの変換仮数部に対してそれぞれ符号部と指数部を合成することによって、ふたつの仮の戻り値を導出する。最終的に、ふたつの仮の戻り値に対して内挿補間を実行して、戻り値を導出する。

[0061] し力しながら、これまでの実施例とは別のインデックスの導出方法を使用する。インデッタスのビット数は、 8ビットである力その内容は指数部の最下位の 1ビットと仮数部の上位 7ビットを組み合わせた値である。詳細は後述するが、平方根の逆数の場合、指数部が偶数か奇数かによつて、変換仮数部の値が異なってくる。そこで、インデッタスの最上位ビットに、指数部が偶数か奇数かを示すビットを挿入し、それぞれのインデックスに対応した値をエントリとすることによって、指数部の偶奇性を考慮したテーブルを実現できる。

[0062] また、以上のようにテーブルを構成したために、インデックスが連続した値であるにもかかわらず、エントリが連続した値にならない場合がある。すなわち、インデックスの最小ビットが 0であり、かつ下位ビットがすべて 1になる値と、その次のインデックスの最小ビットが 1であり、かつ下位ビットがすべて 0になる値である。これらは、前述のごとぐそれぞれ偶数の指数部と奇数の指数部とに対応した変換仮数部の値であるので、不連続になる。本実施例に係る演算装置は、このような不連続の場合に処理を工夫して、同一のテーブルを使用しつつ、正常な値を出力する。なお、これまでの実施例と同様に、インデックスの数は、 8ビットによって表現できる数に 1をカ卩えた数とする。

[0063] 本実施例における演算装置の構成を説明する前に、本実施例における平方根の逆数演算のアルゴリズムを説明する。実施例 1の式 1と同様に、関数の引数の Xを表現すれば、 l/ |x|は、次のように示される。

(式 14)

1/ = 1/ |(- l)^s * 2^e— ^m * (l+m/2²³)|

= 1/ {(- l)。* 2^e— ^m * (l+m/2²³)}

これを変形すれば、以下のように示される。

(式 15)

1 = {(- 1)。 } * {2¹²⁷- * {l/(l+m/2²¾

= (-1)。 * {2¹²⁷— ^e— * {2/(l+m/2²³)}

[0064] ここで、指数部 12が偶数の場合と奇数の場合を分類して、式を展開する。指数部 1 2が偶数の場合は、以下のようになる。

(式 16)

l/^|x| = (-1)。 * {2¹²⁶— ^e}* {2/(l+m/2²³)}

= (-1)。 * ^{2^{2(63_0 2)} }* {l+α- m/2²³)/(l+m/2²³)}

= (—1)。 * 2^{(63_e 2)} * {l+α— m/2²³)/(l+m/2²³)}

= (-1)。 * 2^(63+127"^{e 2}"¹²⁷⁾ * ^{l+(l-m/2²³)/(l+m/2²³)}

= (-1)。 * 2⁽¹⁹⁰"^{e 2}"¹²⁷⁾ * ^{l+(l-m/2²³)/(l+m/2²³)}

[0065] ここで、変換指数部 202である e'と、変換仮数部 204である mを以下のように定義する。 e'=190-e/2

m'=(^{l+(l-m/2²³)/(l+m/2²³)}-l)*2²³

これらを使用すれば、 1/ |x|は次のように示される。

(式 18)

l/^|x| = (-1)° * 2°'"¹²⁷ * (l+m72²³)

[0066] 一方、指数部 12が奇数の場合に、式 15は以下のように展開される。

(式 19)

l/^|x| = (-1)。 * ^{2¹²⁶"°}* ^{2/(l+m/2²³)}

= (-1)。 * ^{2^{2(6 e+1) 2)+1}}* ^{l+(l-m/2²³)/(l+m/2²³)}

= (—1)。 * 2^{(63_(e+1) 2)}* {2} * {l+α— m/2²³)/(l+m/2²³)}

= (-1)。 * ₂ ^{(63+12 e+1) 2}"¹²⁷⁾* {2} * {l+α- m/2²³)/(l+m/2²³)} = (-1)。 * ₂ ⁽¹⁹⁰"^{(e+1) 2}"¹²⁷⁾* ^{2+2(l-m/2²³)/(l+m/2²³)}

[0067] ここで、変換指数部 202である e'と、変換仮数部 204である mを以下のように定義する。

(式 20)

e'=190-(e+l)/2

m' =(^{2+2(l-m/2²³)/(l+m/2²³))}-l)*2²³

これらを使用すれば、 1/ |x|は次のように示される。

(式 21)

l/^|x| = (-1)° * 2°'"¹²⁷ * (l+m72²³)

[0068] すなわち、指数部 12が偶数であるか奇数であるかに応じて、式 17と式 20のように変換指数部 202と変換仮数部 204とを変えれば、式 18と式 21のように、 1/ |χ|は同一の式で表現される。以上の処理は、指数部 12が偶数であるか奇数であるかによつて処理内容が変わるので、分岐処理を必要とする。このような分岐処理を避けるために、本実施例では、指数部 12の下位 1ビットと仮数部 14の上位 7ビットを組み合わせた 8ビットの値をインデックスとして規定する。

[0069] このようにして、指数部 12の下位 1ビットは、偶数奇数を判別するために使用される。すなわち、インデックスを形成する 8ビットのうちの上位 1ビットが偶数であるか奇数であるかを表して、るので、偶数のときは「0」から「 127」のインデックスおよびそれに対応したエントリを使用し、奇数のときは「128」から「255」のインデックスおよびそれに対応したエントリを使用する。このように、予め偶数用と奇数用とに分けたエントリの値力テーブルに記憶される。つまり、式 17と式 20のように偶数と奇数とに分けて表されている変換仮数部 204の値力テーブルの半分ずつのエントリに収納される。

[0070] さらに、実施例 1と同様に、 257個のインデックスおよびエントリを有するテーブルを用意しておき、 8ビットのインデックスから、隣接するふたつのエントリを取得し、このふたつのエントリの値を使用して近似解を求める。

[0071] 仮の戻り値 Aは、次のように示される。

(式 22)

a = (-l)"^s * 2^e'"¹²⁷ * (l+m72²³)

変換指数部 202と変換仮数部 204は、次のように示される。

(式 23)

e' =(380-e)/2

m' =table0[e[7]m[0:6]]

[0072] ここで table0[e[7]m[0:6]]は、指数部 12の下位 1ビットと仮数部 14の上位 7ビットをインデックスとして、テーブルから取得した値、すなわちエントリの値である。また、当該エントリの値が変換仮数部 204に対応する。なお、テーブルにおいて、 1エントリのサイズは 23ビットとする。 i番目のエントリである tableO[i]には、式 17あるいは式 20での m'の値が整数化されて記憶されて!、る。

[0073] 一方、仮の戻り値 Bは、次のように示される。

(式 24)

b = ΗΓ * 2°'"¹²⁷ * (l+m72²³)

変換指数部 202は、次のように示される。

(式 25)

e' =(379-e)/2 (e[7]m[0:6]が 127の場合）

(式 26) e' =(380-e)/2 (e[7]m[0:6]が 127以外の場合）

変換仮数部 204は、次のように示される。

(式 27)

m' =table0[e[7]m[0:6]+l]

[0074] 式 25と式 26において、 e[7]m[0:6]が 127のときとそれ以外のときによって、処理が異なる。この理由を述べる。 e[7]m[0:6]が 127のとき、線形補間に使用される 2つ目の値 b 、すなわち変換仮数部 204Bを求める際のインデックス e[7]m[0:6]+lは、「1」の最上位ビットを有する。そのため、 aと bの連続性が保たれない。さらに詳細に説明すると、インデックス「127」と「128」に対応したエントリは、前述のごとぐ偶数に対応したェントリと奇数に対応したエントリを使い分けていた境界である。そのため、 aを生成するためのインデックス（e[7]m[0:6])が 127のときに、 bを生成するためのインデックス（e[7] m[0:6]+l)が 128になり、本来奇数用に作られたエントリが使用される。その結果、 aと b が連続しなくなる。この差を埋めるために、 8ビットの値 (e[7]m[0:6])が 127のときには、 e'の値が 1だけ小さくなるように補正を実行する。それが式 25に対応する。

[0075] 仮数部 14の下位 16ビットを 32ビットの浮動小数点数に変換した値を cで示せば、

1/ |χ|は次のように示される。

(式 28)

c= m[7:22]/2¹⁶

(式 29)

= ( 1/ |x I - 1/ |x I )*(m[7:22]/2¹⁶)+ 1/ |x | = (b-a)*c+a

1 0 0

以上のごとぐ 1/ |x|は、 cにもとづいて、 aと bを内挿補間することによって、導出される。本実施例に係る演算装置は、式 22から式 29の処理を実行するように構成される。

[0076] なお、変換した値である e， ,m，が適正な範囲であることを確認する。まず、 0≤e≤ 255であるので、 e'は- 190の値をとりうる。 m'に対して、次のように示される。

(式 30)

m' =(^{l+(l-m/2²³)/(l+m/2²³))}-l)*2²³ (_e=偶数のとき）

そのため、次のように示される。 (式 31)

0< m'≤(^{2} - 1)*2²³< 2²³

[0077] (式 32)

m' =(^{2+2(l-m/2²³)/(l+m/2²³))}-l)*2²³ (e=奇数のとき）

そのため、次のように示される。

(式 33)

( {2}— l)*2²³< m，≤2²³

ただし、前述のとおり mはテーブルから求めているため、 m 'く 2²³である。そのため、次のように示される。

(式 34)

(^{2} - l)*2²³< m' < 2²³

式 31と式 34をあわせると次のようになる。

(式 35)

0<m' <2²³

すなわち、変換指数部 202である e'は 8ビットの符号なし整数によって表現でき、変換仮数部 204である m'は 23ビットの符号なし整数で表現できる。

[0078] 実施例 2に係る画像表示装置 100は、図 2に示した画像表示装置 100と同じタイプである。しかしながら、一部の構成および構成要素の機能が異なる。ここでは、異なつている部分を中心に説明する。

[0079] 分離部 28は、実施例 1と同様に、入力した引数を符号部 10、指数部 12、仮数部 1 4に分離する。分離部 28は、取得部 34に対して、指数部 12の下位 1ビットと仮数部 1 4を出力する。ここで、分離部 28から取得部 34へ指数部 12の下位 1ビットを出力するための信号線は、図 2に図示されていない。第 1変換部 30は、符号部 10を正の値に変換し、変換符号部 200として導出部 36に出力する。第 2変換部 32は、式 25あるいは式 26の計算を実行する。当該計算は、実施例 1と異なって、 2による除算を含んでいる。し力しながら、 2による除算は、ビットシフトで実現可能であるので、実質的な処理量の増加は小さい。

[0080] 記憶部 38は、関数に応じて定められた仮数部の変換規則によって、仮数部 14を変換した値をテーブルとして予め記憶する。ここで関数は平方根の逆数なので、変換規則は、式 17の mあるいは式 20の mの計算式に対応する。すなわち、指数部 1 2の下位 1ビットが「0」ならば、式 17の m，をエントリとし、指数部 12の下位 1ビットが「1 」ならば、式 20の mをエントリとする。前者は指数部 12が偶数である場合に相当し、後者は指数部 12の下位 1ビットが奇数である場合に相当する。

[0081] 記憶部 38に記憶されたテーブルは、少なくとも仮数部 14を含むように、指数部 12 の下位 1ビットと仮数部 14の上位 7ビットをインデックスとする。このように、引数をこれらの値によって近似した値をインデックスとする。また、これまでと同様に、テーブルのインデックスの数は、 256に 1を加えた 257に規定されている。

[0082] 図 9は、本発明の実施例 3に係る記憶部 38に記憶されたテーブルのデータ構造を示す。図 9の「インデックス」と「エントリ」は、図 3の「インデックス」と「エントリ」にそれぞれ対応する。インデックスの数は、図 3と同様に「0」から「256」までの 257だけ規定されている。「0」から「127」のインデックスは、指数部 12の下位 1ビットが 0である場合に相当し、それに対応したエントリは式 17の m，に相当する。また、「128」力「256」のインデックスは、指数部 12の下位 1ビットが 1である場合に相当し、それに対応したエントリは式 20の m，に相当する。

[0083] 実施例 3に係る画像表示装置 100の説明に戻る。以上の結果、取得部 34は、ふたつのインデックスを導出する。その後、取得部 34は、ふたつのインデックスにもとづいて、記憶部 38に記憶したテーブル力もふたつのエントリの値をそれぞれ取得する。すなわち、図 3のテーブルにおいて、ふたつのインデックスに対応したふたつのエントリを取得する。取得したふたつのエントリが、式 7の m'と式 9の m"に対応する。なお、ふたつのエントリは、変換仮数部 204として、導出部 36に出力される。

[0084] 取得部 34は、仮数部 14の上位 7ビットと、指数部 12の下位 1ビットとを合成することによって、すなわち少なくとも仮数部 14を近似することによって、記憶部 38に記憶したテーブルのインデックスを導出する。さらに、取得部 34は、インデックスをふたつ導出するために、前述のインデックスに 1をカ卩えた数を導出する。その後、導出したふたつのインデックスにもとづいて、記憶部 38からふたつの変換仮数部 204を取得する過程は、実施例 1と同様であるので、説明を省略する。 [0085] 導出部 36は、変換符号部 200、変換指数部 202、ふたつの変換仮数部 204から仮の戻り値 Aと仮の戻り値 Bを生成する。さらに、仮の戻り値 Aと仮の戻り値 Bに対して、補間処理を施して戻り値 208を生成する。ここで、仮の戻り値を生成する処理は、式 22と式 24に対応し、補間処理は、式 28と式 29に従う。また、これらの処理は実施例 1に準じるので、説明を省略する。

[0086] また、取得部 34において、ふたつのインデックスの値が「127」と「128」である場合、すなわち、ふたつのインデックスに対応して記憶部 38に記憶されたエントリの値が不連続である場合に、以下の処理を実行する。所定の指示にもとづいて、第 2変換部 32は、変換指数部 202から所定の値を減じた値も導出する。これは、式 25に相当する。導出部 36は、仮の戻り値 Aを通常通りに生成する。一方、仮の戻り値 Bは、変換指数部 202として、変換指数部 202から 1を減算した値を使用しつつ生成する。さらに、仮の戻り値 Aと仮の戻り値 Bにもとづいて戻り値 208を導出する。この処理の原理を説明する。図 9のエントリ「127」の値は「0x4030」であり、エントリ「128」の値は「 0x7匿」である。仮に、エントリ「128」が「0x000000」であれば、式 26によって、仮の戻り値 Bを導出できる力実際は、奇数用の別の値「0x7匿」が記憶されているので、指数部を 1だけ下げることによって、近似している。つまり、以下の関係を利用する。

[0087] (式 36)

2^e-127) * ( 0x000000 / 0x800000 )

= 2^e-127-l) * ( 0x7匿/ 0x800000 )

[0088] 図 10は、演算装置 24による演算処理の手順を模式的に示す。入力部 26は、 32ビットの引数を入力する（S100)。分離部 28は、入力した引数を分離する。すなわち 1 ビットの符号部 10を抽出し (S102)、 8ビットの指数部 12を抽出し (S104)、指数部 1 2の下位 1ビットと仮数部 14の上位 7ビットを抽出する（S106)。第 1変換部 30は、符号部 10を正の値に変換し (S110)、変換符号部 200として出力する。第 2変換部 32 は、固定値「380」を入力し (S112)、固定値と指数部 12によって、式 26のような整数演算を実行して (S 114)、変換指数部 202を出力する。なお、式 25のような整数演算に関しては、説明を省略する。取得部 34は、指数部 12の下位 1ビットと仮数部 14 の上位 7ビットからふたつのインデックスを生成し（S116)、当該インデックスにもとづいて、記憶部 38から変換仮数部 204Aを取得しつつ（SI 18)、変換仮数部 204Bも取得する（S 120)。

[0089] 導出部 36は、変換符号部 200、変換指数部 202、変換仮数部 204 A力も仮の戻り値 Aを生成する（S122)と共に、変換符号部 200、変換指数部 202、変換仮数部 20 4B力も仮の戻り値 Bを生成する（S 124)。さらに、導出部 36は、仮数部 14の下位 16 ビットを抽出し (S108)、当該仮数部 14の下位 16ビットを浮動小数点数に変換する（ S126)。導出部 36は、変換した浮動小数点数にもとづいて、仮の戻り値 Aと仮の戻り値 Bを内挿補間して（S128)、戻り値を生成する。最終的に、 32ビットの戻り値を出力する（S 130)。

[0090] 本発明の実施例によれば、指数部と仮数部との値を近似した値でテーブルのインデッタスを生成するので、テーブルのサイズを削減できる。また、近似した値がとりうる総数に 1をカ卩えた値力インデックスの数として規定されているため、すべてのインデックスに対して、複数のインデックスを生成でき、平方根の逆数の戻り値の精度を向上できる。また、指数部は、減算処理とビットシフトを実行するだけなので、処理量を削減できる。また、テーブルから取得した複数の値に対して補間処理を実行して戻り値を導出するので、平方根の逆数の戻り値の精度を向上できる。また、補間処理のみに乗算が実行されるので、処理量を小さくできる。

[0091] また、平方根の逆数の計算が、処理量を抑えつつも、高い精度によって実行できる。また、インデックスに指数部の下位 1ビットを含めるので、指数部が偶数であるか奇数であるかにかかわらず、ひとつのテーブルに変換仮数部を記憶できる。また、テーブル力取得したふたつの値が連続した値でなくても、変換指数部の値を小さくするような処理を施すので、ふたつの値の連続性を維持できる。また、少なくとも 16ビットの精度を持つ平方根の逆数の計算が可能となる。また、 257のインデックスを有した 23ビットのエントリを有したテーブルにもとづ、て、平方根の逆数の計算を実行できる

[0092] (実施例 4)

本発明の実施例 3は、浮動小数点数の引数に対して平方根を計算する演算装置に関する。実施例 4に係る演算装置は、実施例 3に係る演算装置と同様の構成によつて、平方根を計算できる。

[0093] 本実施例における演算装置の構成を説明する前に、本実施例における平方根の演算のアルゴリズムを説明する。本アルゴリズムは、平方根の逆数演算のァルゴリズムとほぼ同じであるので、式だけを記述する。

|x|は、次のように示される。

(式 37)

|x| =^|(-l)^s*2°"¹²⁷*(l+m/2²³)|

= ^{(-l)°*2^e"¹²⁷*(l+m/2²³)}

[0094] 1/ |x|と同様に展開すると、仮の戻り値 Aは、次のように示される。

(式 38)

a = (-l)"^s*2^e'"¹²⁷*(l+m72²³)

ここで、変換指数部 202と変換仮数部 204は、次のように示される。

(式 39)

e'=(e+127)/2

m'=table0[e[7]m[0:6]]

[0095] 一方、仮の戻り値 Bは、次のように示される。

(式 40)

b = ΗΓ * 2°'"¹²⁷ * (l+m72²³)

変換指数部 202は、次のように示される。

(式 41)

e'=(e+129)/2 (e[7]m[0:6]が 127の場合）

(式 42)

e'=(e+127)/2 (e[7]m[0:6]が 127以外の場合）

変換仮数部 204は、次のように示される。

(式 43)

m'=table0[e[7]m[0:6]+l]

[0096] 仮数部 14の下位 16ビットを 32ビットの浮動小数点数に変換した値を cで示せば、

|χ|は次のように示される。 (式 44)

c= m[7:22]/2¹⁶

(式 45)

|x| = ( |xト |x |)*(m[7:22]/2¹⁶)+ |x | = (b-a)*c+a

1 0 0

[0097] 実施例 4に係る画像表示装置 100は、実施例 3に係る画像表示装置 100と同じタイプである。両者の違いは、第 2変換部 32が式 41と式 42に対応していることと、記憶部 38に記憶されたエントリの値力式 37に対応していることである。そのため、画像表示装置 100の説明を省略する。

[0098] 本発明の実施例によれば、実施例 3に記載した効果が得られつつ、平方根の演算を実行できる。

[0099] 以上、本発明を実施の形態をもとに説明した。この実施の形態は例示であり、それらの各構成要素や各処理プロセスの組合せに、ろ、ろな変形例が可能なこと、またそうした変形例も本発明の範囲にあることは当業者に理解されるところである。

[0100] 本発明の実施例 1と 2において、第 2変換部 32は、固定値と指数部 12との間で減算処理を実行している。し力しながらこれに限らず例えば、第 2変換部 32は、加算処理を実行してもよい。この場合、指数部 12の符号を反転させて、固定値に加算する。本変形例によれば、第 2変換部 32の構成が多様になる。つまり、乗算処理のような処理量の多、処理でなければよ!、。

[0101] 本発明の実施例 1から 4において、取得部 34は、ふたつのインデックスを生成し、当該ふたつのインデックスにもとづ、て、記憶部 38からふたつの変換仮数部 204を取得している。し力しながらこれに限らず例えば、取得部 34は、複数のインデックスを生成し、当該複数のインデックスにもとづいて、記憶部 38から複数の変換仮数部 20 4を取得してもよい。この場合、内挿補間の処理力複数の変換仮数部 204あるいは複数の仮の戻り値に対応できるように、変形される。本変形例によれば、近似値の精度を高められる。つまり、ふたつ以上の変換仮数部 204が使用されればよい。

[0102] 本発明の実施例 1から 4において、演算装置 24によってなされる逆数、平方根の逆数、平方根の演算を説明した。しかしながらこれに限らず例えば、演算装置 24はこれら以外の関数を計算してもよい。本変形例によれば、さまざまな関数に本発明を提供できる。つまり、浮動小数点数で表現された引数に対する演算であればよい。

[0103] 本発明の実施例 1から 4において、演算装置 24は、逆数、平方根の逆数、平方根のいずれかひとつの演算を実行していた。しかしながらこれに限らず例えば、演算装置 24は、複数の関数を演算できてもよい。その場合、記憶部 38には、複数の関数に対応したエントリが予め記憶されており、また演算装置 24には、演算を実行すべき関数の種類を示した指示が入力される。演算装置 24は、指示に従って、第 1変換部 30 等の処理方法を特定して、演算を実行する。本変形例によれば、演算装置 24の回路規模の増加量を抑えながら、さまざまな関数に対応させられる。つまり、浮動小数点数で表現された引数に対する演算であればよい。

[0104] 本発明の実施例 1から 2の任意の組み合わせも有効である。本変形例によれば、組み合わせに対応した効果が得られる。

産業上の利用可能性

[0105] 本発明によれば、浮動小数点の形式で表現した数値に対して演算を実行する際に、演算の処理量を軽減できる。

Claims

請求の範囲

[1] 指数部と仮数部を含んだ浮動小数点形式で表現された関数の引数を入力する入力部と、

関数に応じて定められた指数部の変換規則によって、入力した引数に含まれた指数部を変換する変換部と、

関数に応じて定められた仮数部の変換規則によって、引数に含まれる仮数部を変換した値をテーブルとして予め記憶する記憶部と、

入力した引数のうちの少なくとも仮数部を近似することによって、前記記憶部に記憶したテーブルの複数のインデックスをそれぞれ導出し、導出した複数のインデックスにもとづ、て、前記記憶部に記憶したテーブル力複数の値をそれぞれ取得する取得部と、

変換した指数部と取得した複数の値にもとづいて、引数と同様の浮動小数点形式で表現された関数の戻り値を導出して出力する導出部とを備え、

前記記憶部には、引数のうちの少なくとも仮数部の近似値がとりうる値の総数に 1をカロえた数が、前記テーブルのインデックスの数として規定されて、ることを特徴とする演算装置。

[2] 前記変換部は、前記指数部の変換規則として、前記入力した引数に含まれた指数部に加減演算を実行し、

前記取得部は、入力した引数のうちの少なくとも仮数部を近似した値と、当該近似した値に 1をカ卩えた値を前記テーブルの複数のインデックスとして導出し、

前記導出部は、前記変換した指数部を使用しつつ、前記取得した複数の値をもとにした補間演算によって、前記関数の戻り値を導出することを特徴とする請求項 1に記載の演算装置。

[3] 前記入力部で入力した引数に対応した関数は、引数の逆数の演算であり、

前記記憶部には、引数のうちの仮数部を当該仮数部の上位ビットにより近似した値

1S 前記テーブルのインデックスとして規定され、

前記取得部は、入力した引数のうちの仮数部を当該仮数部の上位ビットにより近似した値と、当該近似した値に 1を加えた値を前記テーブルの複数のインデックスとして導出することを特徴とする請求項 2に記載の演算装置。

[4] 前記導出部は、前記取得部で取得した複数の値のそれぞれに対応するように、前記引数と同様の浮動小数点形式で表現されたふたつの仮の戻り値をそれぞれ導出し、前記ふたつの仮の戻り値に補間演算を施して前記関数の戻り値を導出することを特徴とする請求項 3に記載の演算装置。

[5] 前記導出部は、前記取得部で取得した複数の値に補間演算を施し、補間演算の結果と前記変換した指数部から、前記関数の戻り値を導出することを特徴とする請求項 3に記載の演算装置。

[6] 前記入力部で入力した引数に対応した関数は、引数の平方根の演算であり、前記記憶部には、引数のうちの指数部の最下位のビット値と、引数のうちの仮数部を当該仮数部の上位ビットにより近似した値によって形成される値が、前記テーブルのインデックスとして規定され、

前記取得部は、入力した引数のうちの指数部の最下位のビット値と、入力した引数のうちの仮数部を当該仮数部の上位ビットにより近似した値によって形成される値と、当該形成された値に 1を加えた値を前記テーブルの複数のインデックスとして導出することを特徴とする請求項 2に記載の演算装置。

[7] 前記入力部で入力した引数に対応した関数は、引数の平方根の逆数の演算であり前記記憶部には、引数のうちの指数部の最下位のビット値と、引数のうちの仮数部を当該仮数部の上位ビットにより近似した値によって形成される値が、前記テーブルのインデックスとして規定され、

[8] 前記変換部は、前記取得部で形成された値をインデックスとして、前記記憶部に記憶したテーブルから取得した第 1の値と、前記形成された値に 1を加えた値をインデッタスとして、前記記憶部に記憶したテーブルから取得した第 2の値とが不連続である場合に、入力した引数に含まれた指数部を変換する際に、変換した指数部から所定の値を減じた値も導出し、

前記導出部は、前記第 1の値および前記変換部で変換した指数部、ならびに前記第 2の値および前記変換した指数部から所定の値を減じた値よりふたつの仮の戻り値をそれぞれ導出し、前記ふたつの仮の戻り値に補間演算を施して前記関数の戻り値を導出することを特徴とする請求項 6または 7に記載の演算装置。

[9] 指数部と仮数部を含んだ浮動小数点形式で表現された関数の引数を入力するステツプと、

関数に応じて定められた指数部の変換規則によって、入力した引数に含まれた指数部を変換するステップと、

関数に応じて定められた仮数部の変換規則によって、引数に含まれる仮数部を変換した値を予め記憶したテーブルを参照するために、入力した引数のうちの少なくとも仮数部を近似することによって、前記テーブルの複数のインデックスをそれぞれ導出し、導出した複数のインデックスにもとづいて、前記テーブル力複数の値をそれぞれ取得するステップと、

変換した指数部と取得した複数の値にもとづいて、引数と同様の浮動小数点形式で表現された関数の戻り値を導出して出力するステップとを備え、

前記取得するステップで参照すべきテーブルには、引数のうちの少なくとも仮数部の近似値がとりうる値の総数に 1をカ卩えた数力インデックスの数として規定されていることを特徴とする演算方法。

[10] 所定のインターフェースを介して、指数部と仮数部を含んだ浮動小数点形式で表現された関数の引数を入力するステップと、

関数に応じて定められた仮数部の変換規則によって、引数に含まれる仮数部を変換した値を予めメモリに記憶したテーブルを参照するために、入力した引数のうちの少なくとも仮数部を近似することによって、前記テーブルの複数のインデックスをそれぞれ導出し、導出した複数のインデックスにもとづいて前記メモリにアクセスすることによって、前記テーブル力複数の値をそれぞれ取得するステップと、

前記取得するステップで参照すべきテーブルには、引数のうちの少なくとも仮数部の近似値がとりうる値の総数に 1をカ卩えた数力インデックスの数として規定されていることをコンピュータに実行させるためのプログラム。