JPH056393A

JPH056393A - 関数演算処理装置およびその演算方法

Info

Publication number: JPH056393A
Application number: JP15716891A
Authority: JP
Inventors: Masatsugu Kametani; 雅嗣亀谷
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 1991-06-27
Filing date: 1991-06-27
Publication date: 1993-01-14

Abstract

(57)【要約】【目的】より高速で低コストなコストパフォーマンス
の高い関数演算処理装置を提供すること。【構成】ファンクションユニットＡの内部に、レジス
タ１，２、乗算器Ａ４、整数化部５、テーブルＲＯＭ
（ＴＲＯＭ）ユニット６、乗算器Ｂ７及び加算器８が設
けられている。そして、レジスタ１からの引数ｘとレジ
スタ１からの定数値βnとを乗算器Ａ４で乗算し、その
乗算結果を整数化部５で整数データにまるめてインデッ
クスデータとして出力する。テーブルＲＯＭ（ＴＲＯ
Ｍ）ユニット６では、そのインデックスデータをアドレ
スデータとして取り込み、アドレスに対応した２つのデ
ータＴＲＯＭ０（ＩＸ）とＴＲＯＭ１（ＩＸ）を出力す
る。さらに、乗算器Ｂ７で引数ｘとＴＲＯＭ１（ＩＸ）
を乗算し、その乗算結果とＴＲＯＭ０（ＩＸ）とを加算
器８で加算して関数の近似解としてを出力する。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、コンピュータシステム
において関数演算処理を行う装置およびその演算方法に
関する。

【０００２】

【従来の技術】従来のコンピュータシステムにおける関
数処理機能は、マイクロプログラム制御等により、複数
の関数機能を１つの演算処理装置内で実現する場合が多
い。

【０００３】また、関数ｆ(ｘ）を求めるために用いる
アルゴリズムも、数学的に得られたｆ(ｘ）への収束型
の級数展開（例えばチョビシエフ級数、テーラー展開）
であり、誤差については、十分な精度の近似級数解を計
算した後、必要以上の精度部分をまるめて、最終的に必
要な精度を得る方法が一般的である。

【０００４】

【発明が解決しようとする課題】しかしながら、上記従
来技術では以下に示すような問題点がある。

【０００５】(１）ｆ(ｘ）を求める処理過程で、アル
ゴリズムには依存しないレベルの無駄時間（オーバーヘ
ッド）が処理シーケンス内に発生するため、高速化の妨
げとなっている。

【０００６】(２）機能は汎用的であるが、逆に特定
のいくつかの関数を高速処理したい場合にも同レベルの
ハードウエア規模を必要とし、コスト的に不利である。
また、関数処理の多くは並列に実行できる場合が多い
が、基本的に１度に１つの関数しか得られない。他の関
数を並列実行する場合には別に同等の機能を有する演算
ハードウエアが必要となり、規模が大きくなってコスト
的にも物理的にも不利である。

【０００７】(３）十分な精度を得るために、関数演
算アルゴリズムが最終的なまるめ処理のための余分な演
算を必要とする。このことは、関数演算処理に要する時
間を増加させたり、演算処理装置のコストを上昇させた
りすることにつながる。

【０００８】本発明の目的は、上記問題点を解決し、よ
り高速で低コストなコストパーフォーマンスの高い関数
演算処理装置を提供することである。

【０００９】

【課題を解決するための手段】上記目的を達成するため
に、本発明の関数演算処理装置は、外部から引数データ
を与える入力手段と、定数データを外部から与えるか又
は予め保持しておく記憶手段と、前記引数データと定数
データをオペランドデータとして取り込んで前記両デー
タを乗算し、その乗算結果を出力する第１の乗算手段
と、該第１の乗算手段からの乗算結果を整数データにま
るめてインデックスデータとして出力する整数化手段
と、前記インデックスデータをアドレスデータとして取
り込み、アドレスに対応してテーブルより選択した２つ
のデータを出力するテーブルメモリ手段と、該テーブル
メモリ手段から出力された２つのデータのうちの一方の
データと前記入力手段からの引数データとをオペランド
データとして取り込んで、それらの両データを乗算し、
その乗算結果を出力する第２の乗算手段と、前記テーブ
ルメモリ手段から出力された２つのデータのうちの他方
のデータと前記第２の乗算手段からの乗算結果とをオペ
ランドデータとして加算し、その加算結果を、引数の値
に応じて変化する関数の近似解として出力する加算手段
と、を具備したものである。

【００１０】また、本発明の関数演算処理装置は、外部
から引数データを与える入力手段と、定数データを外部
から与えるか又は予め保持しておく記憶手段と、前記引
数データと定数データをオペランドデータとして取り込
んで前記両データを乗算するとともに、その乗算結果を
整数データにまるめてインデックスデータとして出力す
る乗算・整数化手段と、前記インデックスデータをアド
レスデータとして取り込み、アドレスに対応してテーブ
ルより選択した２つのデータを出力するテーブルメモリ
手段と、該テーブルメモリ手段から出力された２つのデ
ータのうちの一方のデータと前記入力手段からの引数デ
ータとをオペランドデータとして取り込んで、それらの
両データを乗算し、その乗算結果を出力する乗算手段
と、前記テーブルメモリ手段から出力された２つのデー
タのうちの他方のデータと前記乗算手段からの乗算結果
とをオペランドデータとして加算し、その加算結果を、
引数の値に応じて変化する関数の近似解として出力する
加算手段と、を具備したものである。

【００１１】さらに、本発明の関数演算処理装置は、外
部から引数データを与える入力手段と、データＹＤと前
記引数データをオペランドデータとして取り込んで前記
両データを乗算し、その乗算結果を出力する乗算手段
と、該乗算手段からの乗算結果を整数データにまるめて
インデックスデータとして出力する整数化手段と、前記
インデックスデータをアドレスデータとして取り込み、
アドレスに対応してテーブルより選択した２つのデータ
を出力するテーブルメモリ手段と、定数データを外部か
ら与えるか又は予め保持しておく記憶手段と、前記テー
ブルメモリ手段から出力された２つのデータのうちの一
方のデータと前記定数データのいずれかを選択して、前
記データＹＤとして出力するスイッチ手段と、前記テー
ブルメモリ手段から出力された２つのデータのうちの他
方のデータと前記乗算手段からの乗算結果とをオペラン
ドデータとして加算し、その加算結果を、引数の値に応
じて変化する関数の近似解として出力する加算手段と、
を具備したものである。

【００１２】また、本発明の関数演算方法は、引数デー
タと定数データをオペランドデータとして取り込んで、
引数データと定数データを乗算する第１のステップと、
その乗算結果を整数データにまるめてインデックスデー
タとして出力する第２のステップと、前記インデックス
データをアドレスデータとして取り込み、アドレスに対
応してテーブルより選択した２つのデータを出力する第
３のステップと、該第３のステップで出力された２つの
データのうちの一方のデータと前記引数データとをオペ
ランドデータとして取り込んで、それらの両データを乗
算する第４のステップと、前記第３のステップで出力さ
れた２つのデータのうちの他方のデータと前記第４のス
テップでの乗算結果とをオペランドデータとして加算
し、その加算結果を、引数の値に応じて変化する関数の
近似解として出力する第５のステップと、を含んでい
る。

【００１３】またさらに、本発明の関数演算方法は、引
数データとデータＹＤとをオペランドデータとして取り
込んで、引数データとデータＹＤを乗算する第１のステ
ップと、その乗算結果を整数データにまるめてインデッ
クスデータとして出力する第２のステップと、前記イン
デックスデータをアドレスデータとして取り込み、アド
レスに対応してテーブルより選択した２つのデータを出
力する第３のステップと、該第３のステップで出力され
た２つのデータのうちの一方のデータと定数データのい
ずれかを選択して、前記データＹＤとして出力する第４
のステップと、前記第３のステップで出力された２つの
データのうちの他方のデータと前記第１のステップでの
乗算結果とをオペランドデータとして加算し、その加算
結果を、引数の値に応じて変化する関数の近似解として
出力する第５のステップと、を含んでいる。

【００１４】

【作用】上記構成によれば、引数ｘの近傍値ｘ′のみの
計数関数で表現されるｘの一次関数ａ₀(ｘ′)＋ａ
₁(ｘ′)ｘのみを演算するための最もシンプルな構造の
ファンクションユニットを得ることができ、前記一次関
数の求解を高速に処理することが可能となる。また、１
つの関数を１つのファンクションユニットで実行するこ
とができるため、マイクロコードを用いなくても容易に
所望の関数を得ることができる。

【００１５】また、基本的な専用演算で関数を表現でき
るため、将来ＬＳＩ化仕易いシンプルな構造を採ること
が可能となる。そして、ユーザは、所望の関数分だけフ
ァンクションユニットを用意すれば良い。この場合、フ
ァンクションユニット間で関数の並列処理も可能とな
る。また、ファンクションユニット内のテーブルＲＯＭ
（ａ₀(ｘ′)，ａ₁(ｘ′)を内蔵）と、テーブルＲＯＭを
参照するためのインデックス（ＩＸ）を求めるための係
数βnとを変更できる様にしておくことにより、係数関
数及び精度を自由に設定できるため、同一構造を有する
ファンクションユニットで様々な関数を表現することが
できる。

【００１６】さらに、テーラー展開による一次近似関数
の最大誤差と誤差の生じる方向に着目し、一方方向に誤
差が集積しない様にしつつ最大誤差をより小さくする方
向に補正を加えることにより、全体の精度をより高める
ａ₀(ｘ′)＋ａ₁(ｘ′)ｘ形式の補正された一次関数を求
めることができる。そして、それを用いることによって
所望の関数を近似することができる。これによって、従
来のように誤差を補正するための冗長な精度分を余分に
演算する必要が無く、高速でかつ高精度な関数処理が可
能となる。

【００１７】

【実施例】以下に本発明の一実施例を図面に従って説明
する。（第１実施例）図１は本発明の演算処理装置の第１実施
例を示しており、引数ｘに対応する基本関数ｆn(ｘ）又
はｆn(ｘ）の近傍解を求めるファンクションユニットＡ
のハードウエアブロック図である。このハードウエアブ
ロック図の処理シーケンスを以下に示す。

【００１８】(1) 外部から与えられた引数ｘを保持す
るレジスタ１と、外部から与えられるか又はファンクシ
ョンユニットＡに予め保持されている基本関数ｆn固有
の定数値βnを保持するレジスタ２とが存在している。

【００１９】(2) レジスタ１に引数ｘが、レジスタ２
に定数値βnがそれぞれ確定すると、ＩＮＤＥＸ計算部
３にそれらの値が送られる。ＩＮＤＥＸ計算部３の中に
は乗算器Ａ４が設けられていて、入力された引数ｘと定
数値βnとを乗算し、その乗算結果βn・ｘがもし小数点
以下を含むなら整数化部５で適当な整数にまるめてから
ＩＮＤＥＸ値として出力する。

【００２０】(3) 上記ＩＮＤＥＸ値は、テーブルＲＯ
Ｍ（ＴＲＯＭ）６のアドレス（ＡＤＤＲＥＳＳ）入力に
テーブルを参照するためのインデックスとして入力され
る。ＴＲＯＭ６は、ＩＮＤＥＸ値で示されるアドレスに
対応してテーブルより選択された２つのデータＴＲＯＭ
０（ＩＸ）とＴＲＯＭ１（ＩＸ）とを出力する。

【００２１】(4) 乗算器Ｂ７は、ＴＲＯＭ６からのデ
ータＴＲＯＭ１（ＩＸ）と、レジスタ１からの引数ｘと
を乗算し、その乗算結果ＴＲＯＭ１（ＩＸ）・ｘを出力
する。

【００２２】(5) 加算器８は、ＴＲＯＭ６からのデー
タＴＲＯＭ０（ＩＸ）と、乗算器Ｂ７の出力ＴＲＯＭ１
（ＩＸ）・ｘを加算し、その加算結果ＴＲＯＭ０（Ｉ
Ｘ）＋ＴＲＯＭ１（ＩＸ）・ｘをｆn(ｘ）の近似解とし
て出力する。

【００２３】なお、レジスタ１はファンクションユニッ
トＡの外部に存在しても良いし、引数ｘを与える外部の
装置がｆn(ｘ）を求めるための必要な演算をファンクシ
ョンユニットＡが終了するまでｘの値を保持し続けても
良い。その場合、レジスタ１をファンクションユニット
Ａの内部に設ける必要はなくなる。

【００２４】さて、このファンクションユニットＡで求
まる近似解ｆn(ｘ）の値は、次のような式になる。

【００２５】ｆn(ｘ）≒ＴＲＯＭ０（ＩＸ）＋ＴＲＯＭ１（ＩＸ）・ｘ …（１−１）式ただし、ＩＸ＝ＩＮＤＥＸ＝ＩＮＴＥＧＥＲ（βn・ｘ） …（１−２）式この演算に適合した近似解の求解方程式としては、例え
ばテーラー展開がある。すなわち、

【００２６】

【数１】

【００２７】ここで、ｘ′はｘの近傍値の方が少ない項
数でｆ(ｘ)の真値に近づく。ｘ′の関数として表現され
る係数関数ａn(ｘ′)でｘの多項式として（２）式をま
とめると、

【００２８】

【数２】

【００２９】と表現することが可能である。なお、ａn
(ｘ′）のアンダーラインは添字を示している。以下、
アンダーラインは同じ意味である。

【００３０】ここで、簡単のため、（２）式を一次の近
似式として表現すると、ｆ(ｘ）≒ｆ(ｘ′)＋ｆ′(ｘ′)(ｘ−ｘ′) ＝（ｆ(ｘ′)−ｆ′(ｘ′)ｘ′)＋ｆ′(ｘ′)ｘ＝ａ₀(ｘ′)＋ａ₁(ｘ′)ｘ ……（４）式 ∴ａ₀(ｘ′)＝ｆ(ｘ′)−ｆ′(ｘ′)ｘ′，ａ₁(ｘ′)＝ｆ′(ｘ′) ｘ′はｘの近傍値（４）式から分かるように、ａ₀及びａ₁はｘ′のみの関
数として表現されている。したがってａn(ｘ′）をｘの
ｎ乗の係数関数と呼ぶ。

【００３１】（４)式と(１−１)式の係数を比較する
と、ＴＲＯＭ０（ＩＸ）＝ａ₀（ｘ′），ＴＲＯＭ１
（ＩＸ）＝ａ₁（ｘ′）となれば良い。すなわち、テー
ブルＲＯＭ６からｘの近傍値ｘ′に対応するａ
₀（ｘ′）及びａ₁（ｘ）の値としてＴＲＯＭ０（Ｉ
Ｘ），ＴＲＯＭ１（ＩＸ）を読み出すことになる。この
時、ＴＲＯＭ６に与えるＩＮＤＥＸ値ＩＸがｘ′の関数
として表現されている必要がある。（１−２）式より、
ＩＸ＝ＩＮＴＥＧＥＲ（βn・ｘ）であるから、βn・ｘ
が整数値にまるめられた値ＩＸはβn・ｘの近傍値と考
えられ、ｘ′の関数ｇ(ｘ´)＝βn・ｘ′で置換するこ
とができる。

【００３２】ＩＸ＝ｇ(ｘ′)＝βn・ｘ′＝ＩＮＴＥＧＥＲ（βn・ｘ） …（５−１）式ｘ′＝ＩＸ／βn＝ＩＮＴＥＧＥＥＲ（βn・ｘ）／βn …（５−２）式とｘ′を表現でき、βnを適当に決めれば対応するＩＸ
を決定することができて、そのＩＸで示される番地にｘ
の近傍値ｘ′の係数関数ａ₀(ｘ′)及びａ₁(ｘ′)を格納
しておけば良いことがわかる。

【００３３】次に、ｆ(ｘ）＝ＳＩＮ（ｘ）の場合を検
討してみる。テーラー展開の一次式は、ｆ(ｘ）＝ＳＩＮ(ｘ)≒ＳＩＮ(ｘ′)＋ＣＯＳ(ｘ′)(ｘ−ｘ′) ＝ＳＩＮ(ｘ′)−ＣＯＳ(ｘ′)ｘ′＋ＣＯＳ(ｘ′)ｘ ……（６）式 ∴ａ₀(ｘ′)＝ＳＩＮ(ｘ′)−ＣＯＳ(ｘ′)ｘ′ ａ₁(ｘ′)＝ＣＯＳ(ｘ′) となる。ここで例えばβn＝４０９６／２πとすると、ＩＸ＝ＩＮＴＥＧＥＲ（βn・ｘ）＝ＩＮＴＥＧＥＲ((４０９６／２π)・ｘ)＝(４０９６／２π)・ｘ′ ∴ｘ′＝(２π／４０９６)・ＩＸ＝ＩＮＴＥＧＥＲ((４０９６／２π)・ｘ)・(２π／４０９６) ……（７）式上記の（７）式から分かるように、１／βnはｘの区間
を２πとした時、その区間を４０９６等分した値であ
り、ＴＲＯＭ６にはＩＸを１ずつ増加するとｘ′を１／
βnずつ増加させた場合のａ₀(ｘ′）とａ₁(ｘ′）の値
が格納される。

【００３４】ｘ′の起点を−πとすると、ｘ′＝−π＋（１／βn）・ＩＸ＝−π＋(４０９６／２π)・ＩＸ ……（８）式となり、予めａ₀(ｘ′)とａ₁(ｘ′)の値を決定し、ＴＲ
ＯＭ６に格納しておくことができる。

【００３５】なお、乗算器Ａ４と整数化部５を１つの乗
算・整数化計算部としてまとめて、この計算部内で、引
数ｘと定数値βnとを乗算し、その乗算結果を整数デー
タにまるめてインデックスデータとして出力するように
しても良い。

【００３６】（第２実施例）図２は本発明の関数演算処
理装置の第２実施例を示している。図において、ファン
クションユニットＢは乗算器の数を１つ節約したもので
あり、ファンクションユニットＡに対してコストメリッ
トを高くすることができる。ファンクションユニットＢ
の動作シーケンスを以下に示す。

【００３７】(1) 引数ｘを保持するレジスタ１と、定
数値βnを保持するレジスタ２とが設けられているの
は、ファンクションユニットＡの場合と同じである。

【００３８】(2) レジスタ１から与えられた引数ｘ
と、レジスタ２からＭＵＸ９を介して与えられた定数値
βnを乗算器４で乗算し、その乗算結果βn・ｘを信号Ｌ
２として出力する。ＭＵＸ９はマルチプレクサであり、
レジスタ２からの信号Ｌ３とＴＲＯＭ６からの信号Ｌ４
とから１つを選択して出力する。その信号を選択する際
のの切り換えは信号Ｌ５によって行なう。なお、ＭＵＸ
９の初期値は、信号Ｌ３が選択されているとする。

【００３９】(3) 乗算器４より信号Ｌ２として出力さ
れたβn・ｘの値は整数化部５に送られるが、乗算器４
と整数化部５との間にラッチ回路１０を設けても良い。
もし、ラッチ回路１０を設けた場合、βn・ｘの値をそ
こにラッチし、その後のタイミングでＭＵＸ９の出力を
信号Ｌ４側に切り換えるための信号を、信号Ｌ５として
出力する。整数化部５の出力ＩＮＤＥＸ＝ＩＮＴＥＧＥ
Ｒ（βn・ｘ）は、ＴＲＯＭ６に送られるが、ラッチ回
路１０の代わりに整数化部５の出力段にラッチ回路１１
を設け、そこでＩＮＤＥＸ値をラッチしても良い。その
場合ラッチ回路１１は、ＭＵＸ９の出力を信号Ｌ４側に
切り換えるための信号を、ラッチ回路１１にＩＮＤＥＸ
値をラッチした後のタイミングで出力する。ラッチ回路
１０及びラッチ回路１１は、そのいずれか一方が設けら
れていれば十分である。

【００４０】(4) ＴＲＯＭ６は、ファンクションユニ
ットＡの場合と同様に、整数化部５から送られて来た出
力結果ＩＮＤＥＸ（ＩＸ）＝ＩＮＴＥＧＥＲ（βn・
ｘ）をアドレスとして、その値に対応する２つの結果Ｔ
ＲＯＭ０（ＩＸ）及びＴＲＯＭ１（ＩＸ）を出力する。

【００４１】(5) 次に、ＴＲＯＭ６より出力されたＴ
ＲＯＭ１（ＩＸ）は、信号Ｌ４としてＭＵＸ９に送ら
れ、そのまま乗算器４に与えられる（ＭＵＸ９は、Ｌ４
側が選択されているから）。

【００４２】(6) 再び乗算器４は、レジスタ１からの
引数ｘとＭＵＸ９からのＴＲＯＭ１（ＩＸ）の各値を乗
算し、その乗算結果であるＴＲＯＭ１（ＩＸ）・ｘを信
号Ｌ６として出力する。

【００４３】(7) 信号Ｌ６の中のデータ（ＴＲＯＭ１
（ＩＸ）・ｘ）はラッチ回路１３で取り込んで、信号Ｌ
６の中のデータが確定した後のタイミングで一度ラッチ
回路１３にラッチしても良い。その場合、ＭＵＸ９の切
り換え信号Ｌ５は、ラッチ回路１３に信号Ｌ６の中のデ
ータをラッチした後のタイミングで、初期状態（信号Ｌ
３が選択されている状態）に戻すことができる。

【００４４】(8) ラッチ回路１３が存在する場合に
は、そこからのデータ（ＴＲＯＭ１（ＩＸ）・ｘ）とＴ
ＲＯＭ６からのデータＴＲＯＭ０（ＩＸ）を加算器８で
加算し、ｆn(ｘ）の近似解ＴＲＯＭ０（ＩＸ）＋ＴＲＯ
Ｍ１（ＩＸ）・ｘの出力が得られる。もし、ラッチ回路
１３が存在しない場合は、乗算器４の直接の出力結果Ｔ
ＲＯＭ１（ＩＸ）・ｘとＴＲＯＭ６の出力ＴＲＯＭ０
（ＩＸ）を加算し、ｆn(ｘ）の近似解ＴＲＯＭ０（Ｉ
Ｘ）＋ＴＲＯＭ１（ＩＸ）・ｘが得られる。この場合、
乗算器４の出力値を加算器８が演算を終了するまで保っ
ておく必要があるため、ＭＵＸ９の初期化（信号Ｌ３側
が選択されている状態）処理は、加算器８の演算結果
（近似解ｆn(ｘ））を外部で取りだしてから行う必要が
ある。

【００４５】本実施例によれば、ファンクションユニッ
トＢ中の乗算器が１つで済み、しかもファンクションユ
ニットＡの場合と同レベルの演算処理の高速性を得るこ
とができる。したがって、個別の演算器を組み合わせる
場合でも、１つのＬＳＩにまとめる場合でも、性能を低
下させずに安価に関数演算処理装置を実現することがで
きる。しかも集積度が小さくて済むのでＬＳＩ化の可能
性自体も高まる。

【００４６】図３及び図４は、ＴＲＯＭ６の内部のＲＯ
Ｍの構成を示したものである。

【００４７】図３は、１つのＲＯＭユニット６ａ（アド
レス入力とデータ出力が１つずつある）を用いたＲＯＭ
システムＡを示している。Ｄａｔａ出力が１つしか無い
ので、まずＴＲＯＭ１（ＩＸ）のデータをＲＯＭユニッ
ト６ａから取り出して一度ラッチ回路６ｄにラッチす
る。その後のタイミングで速やかに選択信号Ｌ６１を用
いてＲＯＭユニット６ａのアドレスをシフトし、別のア
ドレスエリアに保持されたＴＲＯＭ０（ＩＸ）のデータ
を読み出すようにする。選択信号Ｌ６１は、外部から与
えても良いし、ラッチ回路６ｄへのラッチ信号を用いて
自動的に内部で生成しても良い。ただし、再びＴＲＯＭ
１（ＩＸ）のデータを読み出す場合には、選択信号Ｌ６
１の状態を初期状態に戻す回路が必要である。

【００４８】図４は、２つの独立したＲＯＭユニット６
ｂ，６ｃを設けたＲＯＭシステムＢの構成を示してい
る。このＲＯＭシステムでは、ＴＲＯＭ０（ＩＸ）のデ
ータをＲＯＭユニット６ｂに、ＴＲＯＭ１（ＩＸ）のデ
ータをＲＯＭユニット６ｃにそれぞれ保持しており、独
立して２つの必要なデータＴＲＯＭ１（ＩＸ）及びＴＲ
ＯＭ０（ＩＸ）を読み出すことができるため、ＲＯＭシ
ステムＡの様なラッチ回路６ｄや選択信号Ｌ６１を必要
としない。また、特性的に異なるＲＯＭユニットを用い
ることができるため、アルゴリズム上アクセスタイム的
に余裕の生じるＲＯＭユニット６ｂ（ＴＲＯＭ０（Ｉ
Ｘ）のデータを保持している）側を、低速なアクセスタ
イムのＲＯＭで構成すれば、より安価なＲＯＭシステム
を構築することができる。なお、ＲＯＭシステムＡを用
いてもＲＯＭシステムＢを用いても必要となるＲＯＭの
メモリ容量は同じである。

【００４９】図５は、ｆn(ｘ）の近似解を求める演算シ
ーケンスを示したものである。ファンクションユニット
Ａを用い、ＴＲＯＭ６の内容がＲＯＭユニット６ｂの場
合を想定している。上位から下位にかけて時刻が経過
し、その各時刻に実行されている動作を横方向に並列に
記載したものである。

【００５０】図５に示したＳで、外部（例えば外部プロ
セッサやＣＰＵ）から引数ｘが与えられ、ファンクショ
ンユニットＡは有効な動作を開始し、Ｅで結果が得られ
演算を終了する。シーケンスについては前述したとおり
であるが、本図によりアルゴリズム自体の並列性などの
特徴が明確になるので、その点に注意して以下に詳細に
説明する。

【００５１】１）並列に動作して有効なのは、ＴＲＯＭ
０（ＩＸ）とＴＲＯＭ１（ＩＸ）を並行してテーブルＲ
ＯＭ（ＴＲＯＭ６）から読み出す操作及びＴＲＯＭ０
（ＩＸ）をＴＲＯＭ６から読み出す操作と乗算器Ｂ７で
の演算処理の並列実行の２点である。いずれも、ＴＲＯ
Ｍ０（ＩＸ）をＴＲＯＭ６から読み出すための時間（ア
クセス時間）を長くとれるようにする効果があり、ＲＯ
Ｍユニット６ｂにアクセス時間の長い安価なＲＯＭを使
用できる。この並列処理を用いた場合のＲＯＭユニット
６ｂのアクセス時間は、ＲＯＭユニット６ｃのアクセス
時間＋乗算器Ｂ７での演算時間分、すなわち図５でｔ₅
−ｔ₃に相当する時間より短ければ、全体の処理の流れ
の中でクリティカルパスにはならない。

【００５２】２）ＴＲＯＭ１（ＩＸ）をＴＲＯＭ６から
読み出す操作は、全体の処理の流れの中でクリティカル
パスになっている。すなわち、ＲＯＭユニット６ｃのア
クセス時間（図５ではｔ₄−ｔ₃に相当する）は短ければ
短いほど良い。そのためには、ＲＯＭユニット６ｃ側に
高速なアクセス時間を有するＲＯＭを用いる必要がある。３）乗算器Ａ４の演算（ｔ₁からｔ₂）と、乗算器Ｂ７
の演算（ｔ₄からｔ₅）は決して並列には実行できない。
したがって、ファンクションユニットＢのように、乗算
器Ａ及びＢでの処理を１つの乗算器で実行してもクリテ
ィカルパスにそれほど影響しない（ＭＵＸ９をデータが
通過する時間が余分に必要となるが、このオーバーヘッ
ドは乗算器での演算時間に比べて非常に小さい）。この
ことから、ファンクションユニットＢはコストパフォー
マンス的に有利であることがわかる。

【００５３】次に、ｘのｎ次多項式で、係数関数がｘの
近傍値ｘ′の関数ａn(ｘ′）で表現できるｆ(ｘ）の近
似解

【００５４】

【数３】

【００５５】について、係数関数ａn(ｘ′）をＴＲＯＭ
にテーブル化する場合の実用的な解を検討してみる。

【００５６】まず、ｆ（ｘ）≒ａ₀(ｘ′）＋ａ₁(ｘ′）ｘ＋ａ₂(ｘ′）・ｘ²＋‥‥ ＝ａ₀(ｘ′）＋ａ₁(ｘ′）ｘ＋（ａ₂(ｘ′）＋ａ₃(ｘ′）ｘ）ｘ² ＋（ａ₄(ｘ′）＋ａ₅(ｘ′）ｘ）ｘ⁴＋‥‥ ……（１０）式と変形するか、又は、

【００５７】

【数４】

【００５８】と変形することによって、ファンクション
ユニットＡ又はＢが使用できる。

【００５９】（１１）式を用いる場合は、その最内側の
ファンクションａk-1(ｘ′）＋ａk(ｘ′）ｘをまずファ
ンクションユニットによって求めた後、その結果をｂk-
1（ｘ′）とおき、ａk-2(ｘ′）＋ｂk-1(ｘ′）ｘを最
内側のファンクションとして置換する。これにより、ｂ
k-1(ｘ′）をＴＲＯＭ１（ＩＸ）の代わりに用い、ａk-
1（ｘ′）を実際のＴＲＯＭ０（ＩＸ）を用いて求める
ことによって、ファンクションａk-2(ｘ′）＋ｂk-1
(ｘ′）ｘを別のファンクションユニットによって求め
る。この繰り返しによって（１１）式によりｆ(ｘ）の
近似解を得ることができる。

【００６０】一方（１０）式を用いる場合は、（１１）
式を構成する各括弧内のファンクションａn(ｘ′）＋ａ
n+1(ｘ′）ｘをファンクションユニットＡ又はＢでそれ
ぞれ求め、加算していけば良い。（１０）式を用いる場
合は、括弧内の各ファンクションを複数のファンクショ
ンユニットを用いることにより並列に計算することがで
きる。別にｘのｎ乗の計算を実行しておけば、（ａn
(ｘ′）＋ａn+1(ｘ′）ｘ）×（ｘのｎ乗）の計算が実
現できる。ｘのｎ乗の計算も、（１０）式の各括弧内の
計算とある程度並列に実行できる。

【００６１】以上のことから、ファンクションユニット
は（９）式に示すｘのｎ次多項式によるｆ(ｘ）の近似
解

【００６２】

【数５】

【００６３】を計算する基本ファンクションｆn(ｘ）を
求める基本演算ユニットであることが分かる。すなわ
ち、

【００６４】

【数６】

【００６５】を実現するエレメントと定義すれば良い。

【００６６】次に、具体的なｆ(ｘ）の近似解としての

【００６７】

【数７】

【００６８】における各係数関数ａn(ｘ′）について考
察してみる。

【００６９】最も代表的な級数展開として、テーラー展
開を用いると、

【００７０】

【数８】

【００７１】これは正にｘ′がｘの近傍値のときｆ
(ｘ）の近似解を表現するものであり、（１３）式をｘ
のｎ乗（ｎ＝０，１，…ｍ）の多項式に展開して、
（９）式とｘのｎ乗（ｎ＝０，１，…ｍ）をそれぞれ比
較すれば、各係数関数ａn(ｘ′）（ｎ＝０，１，…ｍ）
がｘの近傍値ｘ′の関数として得られる。ｘ′が十分ｘ
に近く、ｍの値が十分大きい時にはそのまま用いても十
分な精度が得られるが、ｍの値が小さい場合には、各係
数関数を補正した方が良いことが多い。以下にｍ＝１の
場合、すなわち、ｆ(ｘ)≒ｆ′(ｘ′)＋ｆ′(ｘ′)(ｘ−ｘ′) ……（１４）式（ｆ′はｆの一階微分）を基本式として用いる場合、より実用的に補正された１
次多項式ａ₀(ｘ′)＋ａ₁（ｘ′）ｘの各係数ａ₀(ｘ′）
及びａ₁(ｘ′）を求める方法について以下に考察してみ
る。

【００７２】図６は、実際の正確な関数ｙ＝ｆ(ｘ）お
よび近傍値をｘ′＝ｘaとした場合のｆ(ｘ）の近似一次
関数ｙa＝ｆ(ｘa）＋ｆ′(ｘa）・（ｘ−ｘa）を示して
いる。１／βは、前述したように、テーブルＲＯＭに係
数関数をテーブル化する場合のＩＮＤＥＸ（ＩＸ）の増
加分に対応する実際のｘの増加分に相当する。すなわ
ち、ＩＮＤＥＸ＝ＩＸが１増加すれば、ｘは１／β増加
する。ファンクションユニットＡ及びＢにおいて、βは
βnと等価なものである。また、ｘmは、（５−１）式で
整数化し、ＩＸを求めた時に、まるめ処理によってｘa
側（ＩＸ側）にまるめられるか、ｘa-1＝ｘa−１／β側
（ＩＸ−１側）にまるめられるかの境界値を示す。例え
ば、小数点以下を四捨五入して整数値にまるめた場合、
ｘmの値はｘa−１／（２β）となる。したがって、（１
４）式によって近似された関数は、

【００７３】

【数９】

【００７４】

【数１０】

【００７５】

【数１１】

【００７６】となる。ａの値は、定義域ｘの領域を全て
カバーする全ての近傍値ｘaに対応して与えられるもの
である。

【００７７】さて、（１４）式をそのまま表現した近似
解は、図６からも分かるように、ｙ＝ｆ(ｘ）のｘaにお
ける接線関数を各ａに対応して求めて、それらをｘm
（ｍはａに対応して決まる）の点で切り換えることによ
り得られる。したがって、真値ｆ(ｘ）に対して常に一
方方向に誤差が大きく出る。図６においては、誤差は常
にマイナス方向に出る。すなわち、（１４）式によって
得られたｆ(ｘ）の近似解は、常に真値より小さな値と
して得られる。ゆえに、ａ）繰り返して演算すると、誤差が一方方向に蓄積しや
すい。

【００７８】ｂ）最大誤差が大きくなる。

【００７９】という欠点がある。一方、ｘの近傍値ｘa
にｘの値が非常に近い領域では、非常に高い精度が得ら
れる。しかし、誤差を均質化する方が一般に有効であ
り、演算速度は最大誤差をより小さくする方が高いと言
える。したがって、前記ａ），ｂ）の欠点を少しでも改
善するために、より有効なｆ(ｘ）の近似解を与える一
次関数ｙm(ｘ）を以下のようにして求める。

【００８０】１）誤差が、ｘmにおける（１５−２）式
によって得られたｙa（ｘm）とｘmにおける真値ｆ(ｘ）
の値ｆ(ｘm）との誤差αm＝ｆ(ｘm）−ｙa(ｘm）のｄm
(ｘa）倍になる点（ｘm，ｙm(ｘm））を決める。

【００８１】２）誤差が、ｘm+1における（１５−３）
式によって得られたｙa+1(ｘm+1）と、ｘm+1における真
値ｆ(ｘ）の値ｆ(ｘm+1）との誤差αm+1＝ｆ(ｘm+1）−
ｙa+1 (ｘm+1）のｄm+1(ｘa+1）倍になる点（ｘm+1，ｙ
m(ｘm+1））を決める。

【００８２】３）ｙm(ｘ）を一次関数（直線関数）とし
て１）及び２）で求めた２つの点を通過するように決定
する。

【００８３】図６に示した例では、ｘ＝ｘmで｜αm｜／
２に、ｘ＝ｘm+1で｜αm+1｜／２に誤差がなる様にｙm
（ｘm）及びｙm（ｘm+1）を決めている。すなわち、

【００８４】

【数１２】

【００８５】となる。本例では、ｘ＝ｘaでγaで示した
プラス側の誤差を生ずるが、ｘ＝ｘm及びｘ＝ｘm+1近傍
ではマイナス側の誤差（最大αm／２及びαm+1／２）を
生じ、全体の誤差分布としては均質化されていると言え
る。最大誤差は、補正前では、｜αm+1｜であったが、
本実施例では｜αm+1／２｜となっている。これによっ
て、前述した欠点ａ）及びｂ）を共に改善する解の一例
を示すことができた。

【００８６】なお、図６では、ｘmを一次関数ｙa-1
（ｘ）とｙa（ｘ）との交点Ｐmのｘ座標、ｘm+1を一次
関数ｙa（ｘ）とｙa+1（ｘ）との交点Ｐm+1のｘ座標に
それぞれ一致するように、整数ＩＸへのまるめ処理を行
った場合を記載している。ある意味で図６に示した実施
例は理想的と言える。しかし、実際には、整数ＩＸへの
まるめ処理はもっと単純（例えば四捨五入）であり、ｘ
mの値はｘa又はｘa-1のみに依存した定数となる。した
がって（１６）式は、

【００８７】

【数１３】

【００８８】となる。

【００８９】これを関数全体を表すべく一般化すると、ｆ(ｘ）≒ｙ＝ａ₀(ｘ′）＋ａ₁(ｘ′）ｘ ……（１８）式となり、ｘの近傍値ｘ′のみの係数関数としてａ
₀(ｘ′）及びａ₁(ｘ′）を表現することができ、目的と
する一次近似関数を求めることが可能となる。そして、
ａ₀(ｘ′）をＴＲＯＭ０（ＩＸ）として、ａ₁(ｘ′）を
ＴＲＯＭ１（ＩＸ）としてテーブルＲＯＭにＲＯＭ化す
れば良い。

【００９０】図６の例から、補正された一次近似関数ｙ
m(ｘ）として利用可能な実用的な直線の存在する領域
は、

【００９１】

【数１４】

【００９２】で囲まれる領域である。この領域を通過す
る直線は、なんらかの補正効果を有しており、かつ前述
した手法でｘの近傍値ｘ′のみの関数としてその係数関
数を決めることができる。

【００９３】また以上から、関数処理のための近似解が
テーラー展開によって求まり、その一次関数近似解は全
て上述した補正が可能なことから、ファンクションユニ
ットＡ及びＢの構造は最も基本的であることが分かる。
すなわち、求めるべき関数が異なっても、ｆ(ｘ）≒ａ₀
(ｘ′）＋ａ₁(ｘ′）ｘと表現できることにはかわりが
なく、βnの値とＴＲＯＭ６の内容を変更できるように
さえしておけば、大半の関数は本実施例のファンクショ
ンユニットによって表現できることになる。

【００９４】

【発明の効果】以上説明したように、本発明によれば次
のような効果が得られる。

【００９５】(１) １つの関数機能をシンプルなアルゴ
リズムで実現するファンクションユニット（演算処理装
置）を提供でき、より高速な関数処理速度を実現でき
る。また、１つの関数処理を１つのユニットで実現する
ため、マイクロコードを用いなくても容易にかつ高速な
関数処理を実現できる。さらに、関数処理アルゴリズム
が基本的・普遍的であるため、定数値βnの値とＴＲＯ
Ｍの内容を変更するだけで様々な関数を実現できる（量
産性が高い）。

【００９６】(２) ファンクションユニット（関数処理
装置）のハードウエア規模がコンパクトであり、ＬＳＩ
化しやすい構造である。したがって、これらのファンク
ションユニットを複数用意すれば、関数処理の並列化を
容易に実現できる。また、特定の関数しか用いない用途
（例えば特殊目的向けの工業用組込み用途）でも、安価
に必要な関数機能を提供できる。

【００９７】(３) テーラー展開を基本とした補正形の
一次関数近似解を用いることで、最大誤差や繰返し演算
によるまるめ誤差の増大をより小さく抑え、トータル的
により高い精度を実現している。これにより、最小量の
演算により必要な精度が得られ、さらに高速化を可能に
する。

【図面の簡単な説明】

【図１】本発明の関数演算処理装置の第１実施例を示す
ブロック図である。

【図２】本発明の関数演算処理装置の第２実施例を示す
ブロック図である。

【図３】テーブルＲＯＭユニット（ＴＲＯＭ）の一実施
例を示すブロック図である。

【図４】テーブルＲＯＭユニット（ＴＲＯＭ）の他の実
施例を示すブロック図である。

【図５】関数処理のシーケンスを示す図である。

【図６】近似関数の補正を説明するための説明図であ
る。

【符号の説明】

１，２レジスタ３ＩＮＤＥＸ計算部４，７乗算器５整数化部６テーブルＲＯＭ（ＴＲＯＭ）ユニット８加算器９マルチプレクサ１０，１１，１３ラッチ回路

Claims

【特許請求の範囲】

【請求項１】外部から引数データを与える入力手段
と、定数データを外部から与えるか又は予め保持してお
く記憶手段と、前記引数データと定数データをオペラン
ドデータとして取り込んで前記両データを乗算し、その
乗算結果を出力する第１の乗算手段と、該第１の乗算手
段からの乗算結果を整数データにまるめてインデックス
データとして出力する整数化手段と、前記インデックス
データをアドレスデータとして取り込み、アドレスに対
応してテーブルより選択した２つのデータを出力するテ
ーブルメモリ手段と、該テーブルメモリ手段から出力さ
れた２つのデータのうちの一方のデータと前記入力手段
からの引数データとをオペランドデータとして取り込ん
で、それらの両データを乗算し、その乗算結果を出力す
る第２の乗算手段と、前記テーブルメモリ手段から出力
された２つのデータのうちの他方のデータと前記第２の
乗算手段からの乗算結果とをオペランドデータとして加
算し、その加算結果を、引数の値に応じて変化する関数
の近似解として出力する加算手段と、を具備した関数演
算処理装置。
【請求項２】外部から引数データを与える入力手段
と、定数データを外部から与えるか又は予め保持してお
く記憶手段と、前記引数データと定数データをオペラン
ドデータとして取り込んで前記両データを乗算するとと
もに、その乗算結果を整数データにまるめてインデック
スデータとして出力する乗算・整数化手段と、前記イン
デックスデータをアドレスデータとして取り込み、アド
レスに対応してテーブルより選択した２つのデータを出
力するテーブルメモリ手段と、該テーブルメモリ手段か
ら出力された２つのデータのうちの一方のデータと前記
入力手段からの引数データとをオペランドデータとして
取り込んで、それらの両データを乗算し、その乗算結果
を出力する乗算手段と、前記テーブルメモリ手段から出
力された２つのデータのうちの他方のデータと前記乗算
手段からの乗算結果とをオペランドデータとして加算
し、その加算結果を、引数の値に応じて変化する関数の
近似解として出力する加算手段と、を具備した関数演算
処理装置。
【請求項３】外部から引数データを与える入力手段
と、データＹＤと前記引数データをオペランドデータと
して取り込んで前記両データを乗算し、その乗算結果を
出力する乗算手段と、該乗算手段からの乗算結果を整数
データにまるめてインデックスデータとして出力する整
数化手段と、前記インデックスデータをアドレスデータ
として取り込み、アドレスに対応してテーブルより選択
した２つのデータを出力するテーブルメモリ手段と、定
数データを外部から与えるか又は予め保持しておく記憶
手段と、前記テーブルメモリ手段から出力された２つの
データのうちの一方のデータと前記定数データのいずれ
かを選択して、前記データＹＤとして出力するスイッチ
手段と、前記テーブルメモリ手段から出力された２つの
データのうちの他方のデータと前記乗算手段からの乗算
結果とをオペランドデータとして加算し、その加算結果
を、引数の値に応じて変化する関数の近似解として出力
する加算手段と、を具備した関数演算処理装置。
【請求項４】請求項３記載の関数演算処理装置におい
て、前記乗算手段から加算手段へ送出される乗算結果
は、ラッチ手段を介して送られることを特徴とする関数
演算処理装置。
【請求項５】請求項１，２又は３記載の関数演算処理
装置において、前記テーブルメモリ手段から出力される
２つのデータのうちの一方のデータをＴＲＯＭ１（Ｉ
Ｘ）、他方のデータをＴＲＯＭ０（ＩＸ）とし、かつ関
数処理を行うための基本式として、引数ｘの近傍値ｘ′
で表現した一次近似関数ｆ(ｘ）＝ａ₀(ｘ′)＋ａ
₁（ｘ′)ｘを用いたとき、前記ＴＲＯＭ０(ＩＸ)に対応
してａ₀(ｘ′)を、前記ＴＲＯＭ１（ＩＸ）に対応して
ａ₁(ｘ′)をそれぞれ格納することを特徴とする関数演
算処理装置。
【請求項６】請求項５記載の関数演算処理装置におい
て、前記一次近似関数ｆ(ｘ）≒ａ₀(ｘ′)＋ａ₁（ｘ′)
ｘを求める場合に、テーラー展開における一次近似式ｆ
(ｘ）≒ｆ(ｘ′)＋ｆ′(ｘ′)(ｘ−ｘ′)によって表現
されるインデックス値ＩＸに対応するｆ(ｘ)の近似式
と、前記整数化手段によるまるめ処理のインデックス値
ＩＸ−１とＩＸに対応した境界値ｘm、並びにインデッ
クス値ＩＸとＩＸ＋１に対応した境界値ｘm+1で、それ
ぞれ得られたポイントＰm＝（ｘm，ｆ(ｘm)）及びポイ
ントＰm+1＝（ｘm+1，ｆ(ｘm+1))を結ぶ一次関数と、前
記ｘm及びｘm+1とで囲まれた領域を通過する一次関数を
ｆ(ｘ)≒ａ₀(ｘ′)＋ａ₁(ｘ′)ｘと置いて、係数関数ａ
₀(ｘ′)とａ₁(ｘ′)を求めることを特徴とする関数演算
処理装置。
【請求項７】引数データと定数データをオペランドデ
ータとして取り込んで、引数データと定数データを乗算
する第１のステップと、その乗算結果を整数データにま
るめてインデックスデータとして出力する第２のステッ
プと、前記インデックスデータをアドレスデータとして
取り込み、アドレスに対応してテーブルより選択した２
つのデータを出力する第３のステップと、該第３のステ
ップで出力された２つのデータのうちの一方のデータと
前記引数データとをオペランドデータとして取り込ん
で、それらの両データを乗算する第４のステップと、前
記第３のステップで出力された２つのデータのうちの他
方のデータと前記第４のステップでの乗算結果とをオペ
ランドデータとして加算し、その加算結果を、引数の値
に応じて変化する関数の近似解として出力する第５のス
テップと、を含む関数演算方法。
【請求項８】引数データとデータＹＤとをオペランド
データとして取り込んで、引数データとデータＹＤを乗
算する第１のステップと、その乗算結果を整数データに
まるめてインデックスデータとして出力する第２のステ
ップと、前記インデックスデータをアドレスデータとし
て取り込み、アドレスに対応してテーブルより選択した
２つのデータを出力する第３のステップと、該第３のス
テップで出力された２つのデータのうちの一方のデータ
と定数データのいずれかを選択して、前記データＹＤと
して出力する第４のステップと、前記第３のステップで
出力された２つのデータのうちの他方のデータと前記第
１のステップでの乗算結果とをオペランドデータとして
加算し、その加算結果を、引数の値に応じて変化する関
数の近似解として出力する第５のステップと、を含む関
数演算方法。