JPH04505978A - Method and apparatus for fast convergence coefficient determination - Google Patents
Method and apparatus for fast convergence coefficient determinationInfo
- Publication number
- JPH04505978A JPH04505978A JP3501946A JP50194690A JPH04505978A JP H04505978 A JPH04505978 A JP H04505978A JP 3501946 A JP3501946 A JP 3501946A JP 50194690 A JP50194690 A JP 50194690A JP H04505978 A JPH04505978 A JP H04505978A
- Authority
- JP
- Japan
- Prior art keywords
- value
- binary
- determination
- convergence
- judgment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F7/00—Methods or arrangements for processing data by operating upon the order or content of the data handled
- G06F7/38—Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F7/00—Methods or arrangements for processing data by operating upon the order or content of the data handled
- G06F7/38—Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation
- G06F7/48—Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices
- G06F7/52—Multiplying; Dividing
- G06F7/535—Dividing only
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F7/00—Methods or arrangements for processing data by operating upon the order or content of the data handled
- G06F7/38—Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation
- G06F7/48—Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices
- G06F7/544—Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices for evaluating functions by calculation
- G06F7/552—Powers or roots, e.g. Pythagorean sums
- G06F7/5525—Roots or inverse roots of single operands
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2207/00—Indexing scheme relating to methods or arrangements for processing data by operating upon the order or content of the data handled
- G06F2207/535—Indexing scheme relating to groups G06F7/535 - G06F7/5375
- G06F2207/5355—Using iterative approximation not using digit recurrence, e.g. Newton Raphson or Goldschmidt
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F7/00—Methods or arrangements for processing data by operating upon the order or content of the data handled
- G06F7/38—Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation
- G06F7/48—Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices
- G06F7/483—Computations with numbers represented by a non-linear combination of denominational numbers, e.g. rational numbers, logarithmic number system or floating-point numbers
- G06F7/487—Multiplying; Dividing
- G06F7/4873—Dividing
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Optimization (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Complex Calculations (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるため要約のデータは記録されません。 (57) [Summary] This bulletin contains application data before electronic filing, so abstract data is not recorded.
Description
【発明の詳細な説明】 高速収束係数判定のための方法および装置発明の背景 従来、浮動小数点収束除算アルゴリズムおよび平方根アルゴリスム判定を実行す ることは、両方のアルゴリズム内で収束係数を効率的に計算する方法がないこと によって妨げられている。収束アルゴリズムは反復乗算を利用して、所定の精度 の結果を得る。修正入力値Xの可能な範囲は、0<X<2であることが証明され ている。このような範囲をさらに限定することにより、アルゴリズム判定の効率 化を図ることができる。[Detailed description of the invention] Background of the invention of method and device for fast convergence coefficient determination Traditionally, floating-point convergence division algorithms and square root algorithm tests are performed. The problem is that there is no way to efficiently calculate the convergence coefficient within both algorithms. is hindered by. The convergence algorithm uses iterative multiplication to achieve a given accuracy get the result. It is proven that the possible range of the corrected input value X is 0<X<2. ing. By further limiting such a range, the efficiency of algorithm judgment can be improved. It is possible to aim for
さらに、収束除算の収束係数の判定には、一般に正規化ステップと、桁上げ/伝 搬(carry−propagation)ステ7プを要する減算演算と、別の 正規化ステップとを必要とする。Furthermore, determining the convergence coefficient for convergence division generally requires a normalization step and a carry/transfer step. A subtraction operation that requires a carry-propagation step and another A normalization step is required.
平方根演算の収束係数の判定は、さらにスケ−ソング演算を必要とする。従って 、収束除算および平方根判定の両方の収束係数を判定するには、浮動不数点乗算 よりも多くの演算サイクルを必要とする。収束係数は、両方の演算において逐次 発生するので、収束係数演算が非効率的であると、収束除算および平方根判定ア ルゴリズムの両方における演算効率性を直接低減することになる。Determining the convergence coefficient of the square root operation requires an additional scale song operation. Therefore , to determine the convergence factor for both convergence division and square root determination, use floating point multiplication requires more computational cycles than The convergence factor is sequential in both operations. occurs, so if the convergence factor operation is inefficient, the convergence division and square root determination This will directly reduce the computational efficiency of both algorithms.
収束除算および平方根判定の収束係数をめ、デジタル方式でこれら2つの処理全 体の効率化を図るためのより効率適な方法が必要となる。Including the convergence coefficients of convergence division and square root determination, these two processes are all performed digitally. More efficient methods are needed to make the body more efficient.
発明の概要 本発明は、組合せ論理により収束係数判定の高速化を図り、かつ収束係数判定に ついて修正入力値の限定された範囲を仮定することにより、デジタル信号プロセ ッサなどの数値演算プロセッサにおける浮動小数点収束除算および平方根判定の 収束係数を判定する効率を向上させる。この方法は、減算および桁上げ/伝搬演 算を避け、そのため両方の収束アルゴリズム演算を乗数待ち時間係数(mult iplierlatency time factor)によって主に限定する ことができる。Summary of the invention The present invention uses combinatorial logic to speed up the determination of convergence coefficients. digital signal processing by assuming a limited range of corrected input values for floating-point convergence division and square root determination in numerical processors such as Improve the efficiency of determining convergence coefficients. This method uses subtraction and carry/propagation operations. Therefore, both convergence algorithm operations are reduced by a multiplier latency factor (mult Mainly limited by iplier latency time factor) be able to.
図面の簡単な説明 第1図は、本発明の1つの実施例を示すブロック図である。Brief description of the drawing FIG. 1 is a block diagram illustrating one embodiment of the invention.
第2図は、収束除算演算において収束係数判定を向上させるための新たな正規化 有効桁(significand)の判定の1つの実施例を示すブロック図であ る。Figure 2 shows a new normalization method for improving convergence coefficient judgment in convergence division operations. 2 is a block diagram illustrating one embodiment of determining significant digits; FIG. Ru.
第3図は、平方根判定において収束係数判定を向上させるための新たな正規化有 効桁の判定の1つの実施例を示すブロック図である。Figure 3 shows a new normalization method for improving convergence coefficient judgment in square root judgment. FIG. 2 is a block diagram illustrating one example of determining an effective figure.
第4図は、本発明のコンピュータ・ハードウェア構築を示すブロック図である。FIG. 4 is a block diagram showing the computer hardware architecture of the present invention.
発明を実施するための最良の形態 参照番号100によって表される第1図は、本発明の1つの実施例を示すフロー チャートである。この実施例は、複数の演算ではなく高速組合せ論理を介して新 たな正規化有効桁(significand) (f ’ )の判定を利用して 、Xの新たな値であるX′をめ(116) 、かつ収束除算または平方根判定で ある演算判定において用いられる収束係数をめ、これを所定の精度の解が得られ るまで反復する(118.120)。BEST MODE FOR CARRYING OUT THE INVENTION FIG. 1, designated by the reference numeral 100, is a flow diagram illustrating one embodiment of the invention. It is a chart. This example uses fast combinatorial logic rather than multiple operations to Using the determination of normalized significant digits (f’) , find the new value of X, X′ (116), and use convergent division or square root test Determine the convergence coefficient used in a certain calculation decision, and use this to obtain a solution with a given accuracy. (118.120).
本発明の1つの実施例に従って浮動小数点演算を用l/1て収束除算および平方 根判定を開始するためには、数値演算プロセッサ(例えば、デジタル信号プロセ ッサ)は処理プラットフォームを利用して、入力Xをチェックし、Xが±ω、± 0または「数値以外J (Not−a−Number: N a N)に等しい かどうか判断する(102)。Xが±ω、±OまたはNaNに等しい場合、エラ ー・チェック機構は、Xが0.5≦Xくβの範囲に制限されるという根拠に基づ き、収束係数判定を迂回する(122)(ただし、βにつし)ては以下で詳しく 説明する)。Xが±ω、±0またはNaN以外の場合、Xは、5.1/Xを有効 値として、適切なシード値(seed value) Sによる乗算によって修 正され、0゜5≦xくβの範囲のXを得る。ただし、βは収束除算の場合1.5 が割り当てられ、平方根判定の場合は2.0が割り当てられる(103,104 )。1≦f<2を条件として、XをX=2eXfに設定する(105)、次に、 処理プラットフォームは、0.5≦X<1.0であるかチェックする(106) 。O,S≦X<1.0である場合、プラットフォームはe=−1に設定する。0 .5≦X<1.0でない場合、1.0≦Xくβとなり(108)、eはOに設定 される(112)、eが設定されると(110,112)、foがめられ(11 4)(ただし、foの判定に関する詳細については以下で説明する)、X′もめ られる(116)。ただし、X’ =2”Xf’である。プラットフォームはX ′を利用して、収束除算または平方根判定である、呼び出された演算判定の収束 係数を計算する(118)。Convergent division and squaring using l/1 using floating point arithmetic in accordance with one embodiment of the present invention To start root determination, a numerical processor (e.g., a digital signal processor) is required. A processor) uses a processing platform to check the input X and determine whether X is ±ω, ± Equal to 0 or "Not-a-Number: N a N It is determined whether or not (102). If X equals ±ω, ±O or NaN, error - The checking mechanism is based on the basis that X is restricted to the range 0.5≦X and β and bypassing the convergence coefficient judgment (122) (however, regarding β), details are given below. explain). If X is other than ±ω, ±0 or NaN, 5.1/X is valid for X. value, modified by multiplication by an appropriate seed value S. Corrected, we obtain X in the range of 0°5≦x and β. However, β is 1.5 in the case of convergent division is assigned, and in the case of square root determination, 2.0 is assigned (103, 104 ). Under the condition that 1≦f<2, set X to X=2eXf (105), then, The processing platform checks whether 0.5≦X<1.0 (106) . If O,S≦X<1.0, the platform sets e=-1. 0 .. If 5≦X<1.0, 1.0≦X becomes β (108), and e is set to O. is set (112), e is set (110, 112), fo is set (11 4) (However, details regarding the determination of fo will be explained below), (116) However, X' = 2"Xf'.The platform is ′ is used to determine the convergence of the called operation test, which is a convergence division or square root test. Calculate the coefficients (118).
次に、収束除算または平方根判定である呼び出された演算判定について収束アル ゴリズムが計算され、所定の精度の解が得られるまで反復される(120)。Next, the convergence algorithm for the called arithmetic test, which is a convergent division or square root test. The algorithm is calculated and iterated (120) until a solution of a predetermined accuracy is obtained.
第2図において示され、参照番号200によって概して表される収束除算判定の ための収束係数判定の1つの実施例において、eが設定された後(110,11 2)、処理プラットフォームは奇数バイアスを用いてI EEE 754−19 85浮動小数点規格に準拠して指数eをバイアスし、その結果、最下位ビット( LSB)を有するバイアスされた指数を得る(206)。バイアスされた指数の 最下位ビットが1の場合(214)、rl、wxyzOJのバイナリf値が選択 される(212,213)。バイアスされた指数の最下位ビットがOの場合、[ 1,lvwxyJのバイナリf値が選択される(212,215)。バイナリ小 数点(binary decimal)の右側にある選択されたfの値は反転さ れ(216) 、関連する最下位ビットがOの場合、f。The convergence division test shown in FIG. 2 and represented generally by the reference numeral 200 In one example of determining the convergence coefficient for 2), the processing platform uses IEEE 754-19 using odd bias 85 floating point standard, biasing the exponent e so that the least significant bit ( Obtain (206) a biased index with LSB). biased index If the least significant bit is 1 (214), the binary f value of rl, wxyzOJ is selected (212, 213). If the least significant bit of the biased exponent is O, then [ The binary f-value of 1, lvwxyJ is selected (212, 215). binary small The selected f value to the right of the binary decimal point is inverted. (216), if the associated least significant bit is O, then f.
はバイナリ値r1.Ov’ w’ x’ y’ J となり、また関連する最下 位ビットが1の場合、foは[1、W+ x+ y)z゛ 1」となる(218 )。さらに、バイアスされた指数eの最下位ビットは反転され(208)、f’ の最後の被バイアス指数となる(210)。is a binary value r1. Ov’ w’ x’ y’ J, and the related bottom If the digit bit is 1, fo becomes [1, W + x + y)z゛ 1'' (218 ). Furthermore, the least significant bit of the biased index e is inverted (208) and f' becomes the last biased index of (210).
第3図に示され、参照番号300によって概して表される平方根判定にための収 束係数判定の1つの実施例では、eが設定された後(112,114)、処理プ ラットフォームは奇数バイアスを用いてIEEE754−1985浮動小数点規 格に準拠して指数eをバイアスし、最下位ビットを有するバイアスされた指数を 得る(306)。ノ(イアスされた指数の最下位ビットが1の場合(314)、 [1゜vwx y zJのバイナリf値が選択される(312,313)。バイ アスされた指数の最下位ビットがOの場合(314)、rl、11 vwxjの バイナリf値が選択される(312,315)。次に、バイナリ小数点の右側に ある選択されたfの値は反転され(316)、関連する最下位ビットがOの場合 、バイナリ値r1.00v’ w’ x’ Jとなり、また関連する最下位ビッ トが1の場合、「1.v’w’ x’ y″ zIJとなる(318)。さらに 、バイアスされた指数eの最下位ビットは反転され(308)、f’の最後の被 バイアス指数となる(310)。The collection for square root determination shown in FIG. In one embodiment of bundle coefficient determination, after e is set (112, 114), the processing The platform follows the IEEE754-1985 floating point standard using odd bias. Bias the exponent e according to the Obtain (306). (If the least significant bit of the ignored exponent is 1 (314), A binary f value of [1°vwx yzJ is selected (312, 313). by If the least significant bit of the assigned exponent is O (314), rl, 11 vwxj A binary f value is selected (312, 315). Then to the right of the binary decimal point The value of some selected f is inverted (316) and if the associated least significant bit is O , the binary value r1.00v' w' x' J, and the associated least significant bit If the value is 1, it becomes "1.v'w' x' y" zIJ (318). moreover , the least significant bit of the biased index e is inverted (308) and It becomes a bias index (310).
収束除算および平方根判定の両方において、収束係数判定は1最下位ビット・エ ラーを伴うことに注目されたい。In both convergence division and square root tests, the convergence coefficient test is Please note that it is accompanied by ra.
この1最下位ビット・エラーは、2の補数ではなく1の補数演算を利用すること に起因する。2の補数では1最下位ビット・エラーは生じないが、2の補数は桁 上げ伝搬を必要とし、そのため収束係数判定速度を低下させる。1の補数はこの 桁上げ伝搬を避け、そのスピードゆえに好ましい。This one least significant bit error requires the use of one's complement arithmetic instead of two's complement. caused by. Two's complement numbers do not have a one least significant bit error, but two's complement numbers This requires upward propagation, which slows down the convergence coefficient determination speed. The one's complement is this It avoids carry propagation and is preferred because of its speed.
収束アルゴリズムでは1最下位ビット・エラーは無視できる。これは、拡張精度 ハードウェアを用いて演算が実行され、その後より低い精度に丸められるためで ある。One least significant bit error is negligible in the convergence algorithm. This is extended precision This is because the calculation is performed using hardware and then rounded to a lower precision. be.
X=1の場合、1最下位ビット・エラーにより結果は1よりわずかに小さい、す なわち、1から1最下位ビットを差し引いた値となり、それに応じて指数の最下 位ビットも変化する。For X=1, 1 least significant bit error causes the result to be slightly less than 1, all That is, the value is 1 minus 1 least significant bit, and the lowest bit of the exponent is accordingly The digit bit also changes.
第4図は、参照番号400によって概して表される本発明のハードウェア構築を 示す。本発明を構成するコンピュータ・プログラムは、プログラム・メモリ(4 04)、その他のメモリ (412)に保存でき、あるν)は数値演算プロセッ サのデータ保存手段およびデータ処理手段を割り付けることにより論理演算装置 (ALU)(406)内のハードウェアで具現することもできる。1つの実施例 では、プログラム制御ユニット(402)はバス(41,0)を利用して、コン ピュータ・プログラムを選択して、本発明を実行し、また状態レジスタはX=士 ω、±0またはN a Nかどうか判断する(408)。X=±ω、±0または NaNである場合、処理プラットフォームがエラー・チェック機構を処理して、 処理は停止する。Xが士■、±OまたはNaN以外である場合、ALUはXを0 .5≦Xくβであるような値Xに変換する。ただし、−1/Xによる乗算は有効 変換であり、βは収束除算の場合1.5として選択され、平方根判定の場合は2 .0として選択される(406)。FIG. 4 shows a hardware architecture of the present invention, generally represented by the reference numeral 400. show. The computer program constituting the present invention is stored in a program memory (4 04), can be stored in other memory (412), and some ν) can be stored in the numerical calculation processor. By allocating the data storage means and data processing means of the It can also be implemented by hardware within the (ALU) (406). One example Then, the program control unit (402) uses the bus (41,0) to Select the computer program to run the invention and set the status register to It is determined whether ω, ±0 or N a N (408). X=±ω, ±0 or If it is NaN, the processing platform handles the error checking mechanism to Processing will stop. If X is other than +, ±O, or NaN, the ALU sets X to 0. .. Convert to a value X such that 5≦X×β. However, multiplication by -1/X is valid. transformation, β is chosen as 1.5 for convergent division and 2 for square root determination. .. 0 (406).
収束除算の場合、ALUの1次選択手段は、0.5≦Xく1.0のときeについ て負の「l」を選択し、ALUの2次選択手段は、1.0≦X<1.5のときe について「0」を選択する(406)。平方根判定の場合、ALUの3次選択手 段は0.5≦X<1.0のときeについて負の「1」を選択し、ALUの4次選 択手段は1.0≦X〈2.0のときeについて「0」を選択する(406)。こ の指数eは、IEEE754−1985浮動小数点規格に基づき奇数バイアスに よってバイアスされる。ALUは、f=X/2eで、1≦f<2を条件として、 fの値を計算し、バイナリ点の左側にある最上位ビット「1」と、バイナリ点の 右側にある残りのバイナリ・ビットとから成る一連のバイナリ・ビットとしてf を出力する。これは、ここでは概してrl、vwxyzJ として記述されてい る(406)。In the case of convergent division, the primary selection means of the ALU is and the secondary selection means of the ALU selects e when 1.0≦X<1.5. "0" is selected for (406). In the case of square root determination, the ALU's tertiary selection method When 0.5≦X<1.0, negative “1” is selected for e, and the fourth selection of ALU is performed. The selection means selects "0" for e when 1.0≦X<2.0 (406). child The exponent e of is odd biased based on the IEEE754-1985 floating point standard. Therefore, it is biased. ALU is f=X/2e, with the condition that 1≦f<2, Calculate the value of f and set the most significant bit "1" on the left side of the binary point and f as a sequence of binary bits consisting of the remaining binary bits on the right Output. This is generally written here as rl,vwxyzJ. (406).
収束除算の場合で、0.5≦X<1.0であってバイアスされた指数の最下位ビ ットが「0」に等しい場合、ALUはバイナリ点の左側にある最上位ビット「1 」およびバイナリ点の右側にある新たなバイナリ・ビットとして、バイナリ点の 右側にあるrlJとそれに続くバイナリ・ビットから成る出力を選択する(40 6)。収束除算の場合で、1.0≦X<1.5であってバイアスされた指数の最 下位ビットが1に等しい場合、ALUはバイナリ点の左側にある最上位ビットr lJおよびバイナリ点の右側にある新たなバイナリ・ビットとして、バイナリ小 数点の右側にある最初の第2バイナリ・ビットとそれに続くすべてのバイナリ・ ビットならびに「0」から成る出力を選択する(406)。In the case of convergent division, 0.5≦X<1.0 and the least significant bit of the biased exponent If the bit is equal to '0', the ALU selects the most significant bit '1' to the left of the binary point. ” and the new binary bit to the right of the binary point. Select the output consisting of rlJ on the right followed by the binary bits (40 6). In the case of convergent division, 1.0≦X<1.5 and the maximum of the biased exponent If the lower bit is equal to 1, the ALU selects the most significant bit r to the left of the binary point. lJ and the new binary bit to the right of the binary point. The first second binary bit to the right of the number point and all subsequent binary bits An output consisting of bits and '0' is selected (406).
平方根判定の場合で、0.5≦X<1.0であってバイアスされた指数の最下位 ビットがrOJに等しい場合、ALUはバイナリ点の左側にある最上位ビット「 1」およびバイナリ点の右側にある新たなバイナリ・ビットとして2つの「1」 とそれに続くすべてのビットから成る出力を選択する(406)。平方根判定の 場合で、1.0≦xく2゜Oであってバイアスされた指数の最下位ビットが1に 等しい場合、ALUはバイナリ点の左側にある最上位ビット「1」およびバイナ リ点の右側にある新たなバイナリ・ビットとして最初にバイナリ点の右側にある すべてのビットから成る出力を選択する(406)。ついで、ALUは、上記の すべての演算判定についてバイナリ小数点の右側にあるすべてのビットを反転さ せて、f′を出力とする(406)。また、ALUはバイアスされた指数の最下 位ビットの補数をとり、新たな被バイアス指数をめる(406)。In the case of square root judgment, 0.5≦X<1.0 and the lowest biased index If the bit is equal to rOJ, the ALU selects the most significant bit to the left of the binary point. 1” and two 1’s as new binary bits to the right of the binary point. and all subsequent bits (406). Square root determination If 1.0≦x2゜O and the least significant bit of the biased exponent is 1. If equal, the ALU selects the most significant bit '1' to the left of the binary point and the binary first the new binary bits to the right of the binary point. Select the output consisting of all bits (406). Then, the ALU performs the above Inverts all bits to the right of the binary decimal point for all arithmetic decisions. Then, f' is output (406). Also, ALU is at the bottom of the biased index. The complement of the digit bit is taken and a new biased exponent is calculated (406).
このようなすべての判定について、ALUはX゛をめる。ただし、X’ =2″ Xf” とする(406)。収束除算の場合、ALUは収束係数r2.0−X’ Jをめ、平方根判定の場合、ALUは収束係数r1.5−0.5X’ Jをめ る(406)。ALUは、1つ以上のデータ処理およびデータ保存デバイスを利 用して、所定の精度の解が得られるまで、関連する収束係数を用いる収束除算ア ルゴリズムまたは平方根判定の計算を行なう (406)。For all such decisions, the ALU calculates X. However, X’=2″ Xf" (406). In the case of convergent division, the ALU uses the convergence coefficient r2.0-X' In the case of square root determination, ALU uses a convergence coefficient r1.5-0.5X' (406). An ALU utilizes one or more data processing and data storage devices. the convergent division algorithm with the associated convergence factor until a solution of a given accuracy is obtained. Calculation of algorithm or square root determination is performed (406).
要約書 高速プロセッサは、修正入力値について組合せ論理と範囲制限を利用して、収束 除算および平方根判定に対する収束係数判定における効率を向上させる。入力値 (101)は、限定された範囲内の値に修正され、ついで2つの部分に分割され る(106,108)。この2つの部分を利用して、処理プラットフォームは、 選択されたバイナリ・ビットを反転させて被修正係数を生成することにより収束 係数判定における時間消費を最小限に押さえ、かつこの被修正係数を用いて、収 束係数計算の高速化を図る(118゜120)。abstract Fast processors utilize combinatorial logic and range constraints on modified input values to achieve convergence. Improve efficiency in determining convergence coefficients for division and square root determinations. Input value (101) is modified to a value within a limited range and then split into two parts. (106, 108). Using these two parts, the processing platform Converges by inverting selected binary bits to generate modified coefficients Minimize the time consumption in coefficient determination and use the modified coefficients to To speed up the calculation of bundle coefficients (118°120).
国際調査報告international search report
Claims (10)
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US45891589A | 1989-12-29 | 1989-12-29 | |
US458,915 | 1989-12-29 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH04505978A true JPH04505978A (en) | 1992-10-15 |
Family
ID=23822608
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP3501946A Pending JPH04505978A (en) | 1989-12-29 | 1990-12-03 | Method and apparatus for fast convergence coefficient determination |
Country Status (5)
Country | Link |
---|---|
EP (1) | EP0461230A4 (en) |
JP (1) | JPH04505978A (en) |
KR (1) | KR940008610B1 (en) |
CA (1) | CA2050353C (en) |
WO (1) | WO1991010188A1 (en) |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4878190A (en) * | 1988-01-29 | 1989-10-31 | Texas Instruments Incorporated | Floating point/integer processor with divide and square root functions |
US4949296A (en) * | 1988-05-18 | 1990-08-14 | Harris Corporation | Method and apparatus for computing square roots of binary numbers |
US5157624A (en) * | 1990-12-13 | 1992-10-20 | Micron Technology, Inc. | Machine method to perform newton iterations for reciprocal square roots |
-
1990
- 1990-12-03 KR KR1019910701002A patent/KR940008610B1/en not_active IP Right Cessation
- 1990-12-03 JP JP3501946A patent/JPH04505978A/en active Pending
- 1990-12-03 CA CA002050353A patent/CA2050353C/en not_active Expired - Fee Related
- 1990-12-03 EP EP19910901464 patent/EP0461230A4/en not_active Withdrawn
- 1990-12-03 WO PCT/US1990/007034 patent/WO1991010188A1/en not_active Application Discontinuation
Also Published As
Publication number | Publication date |
---|---|
WO1991010188A1 (en) | 1991-07-11 |
CA2050353A1 (en) | 1991-06-30 |
EP0461230A4 (en) | 1993-08-18 |
KR920701901A (en) | 1992-08-12 |
CA2050353C (en) | 1994-08-30 |
EP0461230A1 (en) | 1991-12-18 |
KR940008610B1 (en) | 1994-09-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107844322B (en) | Apparatus and method for performing artificial neural network forward operations | |
US4969118A (en) | Floating point unit for calculating A=XY+Z having simultaneous multiply and add | |
JP2018124681A (en) | Arithmetic processing device, information processing device, method, and program | |
US5671170A (en) | Method and apparatus for correctly rounding results of division and square root computations | |
JPH02294819A (en) | Floating point arithmetic processor | |
Arnold et al. | Redundant logarithmic arithmetic | |
JP2019148972A (en) | Arithmetic processing device, information processing device, information processing method, and program | |
US10579338B2 (en) | Apparatus and method for processing input operand values | |
US5132925A (en) | Radix-16 divider using overlapped quotient bit selection and concurrent quotient rounding and correction | |
JP7292297B2 (en) | probabilistic rounding logic | |
JPH0145649B2 (en) | ||
JPH09212337A (en) | Floating-point arithmetic processor | |
WO1999066423A1 (en) | Data calculating device | |
US6912559B1 (en) | System and method for improving the accuracy of reciprocal square root operations performed by a floating-point unit | |
JP2822399B2 (en) | Logarithmic function arithmetic unit | |
JPH0687218B2 (en) | Floating-point arithmetic processing device and divisor multiple generation device | |
US20040083255A1 (en) | Apparatus and method for performing operations implemented by iterative execution of a recurrence equation | |
US5648924A (en) | Method and apparatus for finding arctangents | |
TW202333041A (en) | System and method performing floating-point operations | |
JP2020190894A (en) | Arithmetic processing device, program and arithmetic processing device control method | |
JP2020067897A (en) | Arithmetic processing unit, learning program, and learning method | |
JPH04505978A (en) | Method and apparatus for fast convergence coefficient determination | |
CN114385112A (en) | Apparatus and method for processing modular multiplication | |
JPH09128213A (en) | Block floating processing system/method | |
Deller et al. | Implementing the optimal bounding ellipsoid algorithm on a fast processor |