WO2014023871A1

WO2014023871A1 - Aparato y método para calcular operaciones de potenciación y extracción de raíces

Info

Publication number: WO2014023871A1
Application number: PCT/ES2013/070586
Authority: WO
Inventors: Javier DÍAZ BRUGUERA; Álvaro VÁZQUEZ ÁLVAREZ
Original assignee: Universidade De Santiago De Compostela
Priority date: 2012-08-09
Filing date: 2013-08-08
Publication date: 2014-02-13
Also published as: ES2396673A1; ES2396673B2; EP2884403A1

Abstract

La invención muestra un método y un aparato para el cálculo general de operaciones de potenciación. El método está basado en la optimización del cálculo X ^z = 2^ΖxlogX. El aparato comprende una pluralidad de elementos de memoria; y un procesador hardware configurado para calcular la operación de potenciación X^z de un número en punto flotante X, donde Z es un exponente sin restricciones. El exponente sin restricciones puede ser un número en punto fijo o punto flotante. Además, el exponente puede ser el inverso de un número lo que permite calcular raíces dentro del mismo procesador aparato. El aparato incluye todos los elementos necesarios para calcular X^z.

Description

Aparato y método para calcular operaciones de potenciación y extracción de raíces

SECTOR TÉCNICO DE LA INVENCIÓN

Las realizaciones mostradas se refieren a aparatos y métodos de computación. Más concretamente, las realizaciones mostradas se refieren a aparatos y métodos para el cálculo de operaciones de potenciación y extracción de raíces.

ESTADO DE LA TÉCNICA

El diseño de unidades funcionales para el cálculo de potencias y raíces q-ésimas (X^z, Z = p o Z = 1/q, donde p y q son enteros) es un reto importante desde hace varios años. Las operaciones de potenciación y de cálculo de raíz q-ésima se emplean con mucha frecuencia en los campos de computación gráfica, procesado digital de señales y cálculos científicos. Estas operaciones incluyen la raíz cuadrada

raíz cuadrada inversa

raíz cúbica

raíz cúbica inversa

cuadrado

cuadrado inverso

recíproco exponencial y otras operaciones menos frecuentes pero también

importantes.

Existen varias arquitecturas para el cálculo de exponenciales y logaritmos; sin embargo el cálculo preciso de operaciones de potenciación y de extracción de raíces en punto flotante es una tarea complicada. Los prohibitivos requerimientos hardware de una implementación basada en tablas y la complejidad intrínseca de los algoritmos basados en la recurrencia de dígitos han provocado que se hayan propuesto soluciones parciales al cómputo de este tipo de operaciones en las que la computación se lleva a cabo para un exponente fijo o para una precisión muy baja. La aproximación tradicional para las operaciones de potenciación o cálculo de raíz q-ésima ha sido el desarrollo de unidades funcionales para la computación de un exponente o raíz particular. Así, hay un gran número de algoritmos e implementaciones para los exponentes más frecuentes tales como recíprocos, raíz cuadrada o inverso de raíz cuadrada, que incluyen algoritmos de recurrencia de dígitos de convergencia lineal y métodos de convergencia cuadrática basados en multiplicación, tales como los algoritmos de Newton-Raphson y Goldschmidt. También existen varias aproximaciones para el cálculo de otros exponentes derivados de la aplicación de métodos generales para la evaluación de potencias.

En general, el cálculo de una potencia o raíz q-ésima con una precisión muy baja se puede llevar a cabo utilizando una tabla, pero los elevados requerimientos de memoria hacen que esta aproximación sea muy ineficiente para un número en punto flotante con precisión simple o doble. Las aproximaciones racionales y polinómicas representan otra aproximación para el cálculo de potencias y raíces q-ésimas. Sin embargo, uno de los métodos más eficientes para el cálculo de estas operaciones con números en punto flotante son los algoritmos dirigidos por tabla, que están a medio camino entre los las aproximaciones basadas en tablas y las basadas en aproximaciones racionales y polinómicas.

Existen aproximaciones polinómicas de primer y segundo orden basadas en expansiones de Taylor para el cálculo de un número limitado de potencias y raíces, entre ellas raíz cuadrada, recíproco de raíz cuadrada, potencia cuarta, etc., tal y como se describe en Powering by a Table Look-Up and a Multiplication with Operand Modificaction, N. Tagaki, IEEE Transactions on Computers, vol. 47, no. 11 , pp. 1216-1222, Nov. 1998; Faithful Powering Computation using Table Lookup and Fused Accumulation Tree, J.A. Piñero, J.D. Bruguera and J.M. Muller, Proceedings 15th IEEE Symposium on Computer Arithmetic, pp. 40-47, Jun- 2001; y High Performance architectures for elementar/ function generation, J. Cao, B.W.Y. Wei y J. Cheng, Proceedings 15th IEEE Symposium on Computer Arithmetic, pp. 136-144, Jun. 2001 , pero estas implementaciones requieren replicar la tabla de almacenamiento de los coeficientes y no se pueden considerar como unidades de cálculo de raíces q-ésimas. Un método de recurrencia de dígitos para el cálculo de la raíz q-ésima se presentó en An Digit-by-Digit Algorithm for m-th Root Extraction, P. Montuchi, J.D. Bruguera, L. Ciminiera y J.A. Piñeiro, IEEE Transactions on Computers, vol.56, no. 12, pp. 1696-1706, Dec. 2007, y particularizado para el cálculo en radix 2 de raíces cúbicas en A Radix-2 Digit-byDigit Architecture for Cube Root, J.A. Piñeiro, J.D. Bruguera, F. Lamberti, P. Montuschi, IEEE Transactions on Computers, vol. 57, no.4, pp. 562-566., Apr. 2008. La complejidad de las arquitecturas depende de q, con lo que para valores mayores de q hay una mayor complejidad. En consecuencia, una arquitectura para la computación de valores elevados de q en operaciones de raíz q-ésimas es muy compleja. También existen otras implementaciones de métodos de recurrencia de dígitos para el cálculo de raíces cuadradas y cúbicas presentado en Digit-byDigit Methods for Computing Certain Functions, M.D. Ergovac, 41 st Asilomar Conference on Signáis, Systems and Computers, pp. 338-342, Nov. 2007; y A Digit-Recurrence Algorithm for Cube Rooting, N. Tagaki, IEICE Transactions on Fundamental of Electronics, Communications and Computer Sciences, vol. E84-A, no 5, pp. 1309-1314, May 2001. Se debe resaltar el hecho de que todos los métodos indicados hasta ahora para el cálculo de una potencia o de una raíz q-ésima están orientados a realizar el cálculo para un exponente fijo. Esto implica que la arquitectura resultante no se puede emplear para calcular potencias o raíces distintas de aquella para la que ha sido diseñada. Para adaptar la arquitectura a una potencia o raíz diferente hay que realizar cambios en las, del inglés Look-up Table (LUT), en el caso de aproximaciones polinómicas basadas en tabla, o diseñar una nueva arquitectura, en el caso de métodos de recurrencia de dígitos. Las aproximaciones polinómicas basadas en tabla se pueden adaptar para calcular más de una potencia o raíz, pero esto requiere replicar las tablas. De todos modos, los métodos indicados no se puede considerar que sean métodos generales para el calculo de potencias o raíces q-ésimas.

La única arquitectura encontrada en el estado de la técnica para el cálculo de raíces q- ésimas para cualquier q se describe en Algorithm and architecture for Logarithm, Exponential and Powering Computation, J.A. Piñeiro, M.D. Ergovac and J.D. Bruguera, IEEE Transactions on Computers, vol. 53, no. 9, pp. 1085-1096, Sep. 2004, y fue diseñada para el cálculo de potencias X^p, con p entero, basado en una cadena logaritmo- multiplicación-exponencial acelerada por el uso de redundancia y aritmética on-line, y extendidas para el cálculo de

Sin embargo, la implementación de la arquitectura extendida para la raíz q-ésima es muy compleja, porque además de las operaciones en cadena, se incluye una división entera ya que se requiere el cálculo del resto de la división.

DESCRIPCIÓN DE LA INVENCIÓN

Las realizaciones mostradas incluyen un aparato para el cálculo general de operaciones de potenciación y extracción de raíces que comprende (a) una pluralidad de elementos de memoria; y (b) un procesador hardware configurado para calcular la operación de potenciación X^z de un número en punto flotante X, donde Z es un exponente sin restricciones. El exponente sin restricciones puede ser un número en punto fijo o punto flotante. Además, el exponente puede ser el inverso de un número para calcular raíces q- ésimas dentro del mismo procesador hardware. De acuerdo a una realización, el procesador hardware comprende una unidad multiplexora, una unidad recíproca, una unidad logarítmica, una unidad exponencial, una unidad de multiplicación, una unidad de desplazamiento, o una combinación de todas ellas. La unidad recíproca, unidad logarítmica y la unidad de multiplicación están configuradas para llevar a cabo los cálculos concurrentemente, y la unidad exponencial está configurada para llevar a cabo los cálculos de forma on-line. En una realización particular, y sin limitación, las unidades recíproca, logarítmica y de multiplicación están configuradas para realizar los cálculos comenzando por el dígito más significativo. Las realizaciones mostradas también incluyen métodos para calcular funciones de potenciación y extracción de raíces generales.

BREVE DESCRIPCIÓN DE LAS FIGURAS

Las modalidades detalladas en las figuras se ilustran a modo de ejemplo y no a modo de limitación:

La Figura 1 es una secuencia de operaciones para calcular la función de potenciación X^z, con un exponente Z en punto fijo de acuerdo a una realización. La Figura 2 es un diagrama de bloques de un procesador para calcular la función de potenciación X^z, con un exponente Z en punto fijo de acuerdo a una realización.

La Figura 3 es una secuencia de operaciones para calcular

siendo X e Y número en puntos flotante de precisión simple de acuerdo a una realización.

La Figura 4 muestra un método para desplazar el logaritmo de acuerdo a una realización. La Figura 5 es un diagrama de bloques de un procesador para calcular la función de potenciación X^z, con un exponente Z en punto fijo o punto flotante de acuerdo a una realización.

La Figura 6 es un ejemplo de parámetros para el cálculo de potencias y de raíces con un exponente en punto fijo, número de bits de los resultados intermedios y latencias, usando un radix r = 128 y resultados en simple y doble precisión.

La Figura 7 es un ejemplo de parámetros para el cálculo de potencias y de raíces con un exponente en punto flotante, número de bits de los resultados intermedios y latencias, usando un radix r = 128 y resultados en simple y doble precisión.

DESCRIPCIÓN DETALLADA DE LA INVENCIÓN

Los microprocesadores tienen una estructura general para llevar a cabo operaciones comunes, tales como acceso a memoria, ejecución de instrucciones software, control de periféricos y cálculos aritméticos. La complejidad de algunas operaciones, tales como la raíz cuadrada, raíz cúbica o cálculo del recíproco no permiten la incorporación de hardware específico para llevar a cabo estas operaciones dentro del microprocesador. Por lo tanto, los microprocesadores actuales incorporan unidades de punto flotante, del inglés Floating Point Unit (FPU), para llevar a cabo operaciones complejas tales como raíz cuadrada o división de número en punto flotante. Sin embargo, la funcionalidad de las FPUs es limitada, ya que no pueden implementar un gran número de operaciones y las operaciones complejas se deben llevar a cabo empleando una solución software. La solución software degrada el rendimiento global del sistema y ralentiza los cálculos. Las realizaciones mostradas incluyen un aparato y un método que calcula operaciones generales de potenciación y raíces q-ésimas.

Las realizaciones mostradas, y sin limitación, incluyen métodos y aparatos para el cálculo de potencias y raíces X^Y, siendo X e Y números en punto flotante e

siendo los significandos de n-bits (es decir, los n bits de los

significandos que incluyen el bit oculto, y el bit menos significativo, del inglés Less Significant Bit (LSB), tiene un peso de

y los exponentes con signo de

bits, o Y un exponente en punto fijo de

bits de la forma:

siendo y un número entero con signo de bits, con para el cálculo de raíces.

A. Aparato para exponente en punto fijo

De acuerdo a una realización particular, y sin limitación, el aparato que calcula la potencia Z o la raíz Z-ésima de un número X comprende: (a) una pluralidad de elementos de memoria, tales como registros, que almacenan un número X cuya potencia Z o raíz Z- ésima calcula el aparato, un número en punto fijo Z que indica el exponente de la potencia o raíz, el número de bits significativos del número X y del resultado del cálculo, la operación llevada a cabo, cálculo de potencia Z o de raíz Z-ésima y el exponente Z; (b) un unidad de cálculo de recíproco que calcula el recíproco de Z obteniendo un número A; (c) una unidad logarítmica que calcula el logaritmo en base 2 del número X resultando en un número B; (d) una unidad de multiplicación que calcula el producto de los número A y B resultando en un número C; y (e) un unidad exponencial que calcula la exponencial del número C, obteniendo así el resultado de la operación. En realizaciones particulares, la unidad de cálculo del recíproco opera en paralelo con la unidad logarítmica, las operaciones de la unidad logarítmica y la unidad de multiplicación se superponen durante los cálculos, la unidad exponencial calcula la exponencial siguiendo una base on-line y la unidad logarítmica y la unidad de multiplicación calculan el logaritmo y el producto comenzando por el bit más significativo. De acuerdo a una realización particular, tal y como se muestra en la Figura 2, la arquitectura de los aparatos comprende una unidad de cálculo del recíproco con tabla de verdad, un unidad logarítmica de radix elevado

un multiplicador izquierda-derecha sin acarreo, del inglés left-to-right carry-free (LRCF), una unidad de conversión, y una unidad exponencial de radix elevado. En una realización alternativa la arquitectura del aparato comprende una unidad de desplazamiento de longitud de palabra, una unidad recíproca de radix elevado, una unidad logarítmica de radix elevado, una unidad de multiplicación de radix elevado, una unidad de conversión y una unidad exponencial de radix elevado. La Figura 2 muestra el diagrama de bloques del aparato que calcula X^z de acuerdo a una realización. Las líneas más gruesas representan operandos de longitud de palabra elevada (alrededor de n bits), las líneas más finas representan operandos de longitud de palabra pequeña (alrededor de b, donde es el radix empleado, o bits) y las líneas dobles representan dígitos

redundantes con signo de radix elevado en un formato borrow-save. El resultado es una conversión de los dígitos con signo con radix r. Además, un sumador borrow-save se puede implementar como un sumador de acarreo almacenado, del inglés Carry Save Adder (CSA). La Figura 1 muestra la secuencia de operaciones que involucran el cálculo de la función de potenciación X^z con un exponente en punto fijo de acuerdo a una realización. A modo ilustrativo, el aparato se muestra para las operaciones de potenciación y cálculo de raíz, con un exponente en punto fijo y un radix genérico

En una realización particular el número X se representa en precisión flotante doble o simple de acuerdo al estándar IEEE-754.

B. Método para un exponente en punto fijo

De acuerdo a una realización particular, el cálculo de la potencia Z-ésima o de la raíz Z- ésima en un procesador hardware comprende: (a) almacenar un número X en un primer elemento de memoria del procesador, donde X es un número cuya potencia Z-ésima o raíz Z-ésima se va a calcular; (b) almacenar el número Z en un segundo elemento de memoria del procesador, donde Z es un número de punto fijo que indica el exponente de la potenciación o de la operación de extracción de raíz; (c) almacenar el número de bits significativos del número X y del resultado del cálculo en un tercer elemento de memoria del procesador; (d) almacenar la operación que se va a llevar a cabo, potenciación o raíz, en un cuarto elemento de memoria del procesador; (e) almacenar el exponente del número Z en un quinto elemento de memoria; (f) calcular el recíproco del número Z cuyo resultado es un número A; (g) calcular el logaritmo en base 2 del número X cuyo resultado es un número B; (h) calcular el producto de los número A y B cuyo resultado es un número C; (i) separar la parte entera y fraccionaria del número C; y G) calcular la exponencial del número C. En una realización particular, el cálculo del la exponencial y del producto se solapan; el cálculo del producto y el logaritmo se solapan; el número X es un número flotante con precisión doble o simple de acuerdo al estándar IEEE-754; y el procesador se escoge de entre el grupo consistente en circuitos integrados, dispositivo FPGA, microprocesador, microcontrolador, procesador digital de señal (DSP), unidad de procesamiento gráfico (GPU) y procesador de propósito general.

De acuerdo a una realización particular, y sin limitación, el método se deriva como sigue:

considerando que X es un número en punto flotante esta ecuación se puede reescribir como:

donde es la concatenación de los dígitos de E_x (valor entero) y

[0,1). De acuerdo a (2),

de puede calcular como la secuencia de operaciones: (1) logaritmo del significando (2) suma de (concatenación de cadenas

binarias); (3) multiplicación del resultado de (2) por Z; y (4) cálculo de la exponencial del resultado de la multiplicación. Para una implementación eficiente, las operaciones se solapan. Esto requiere un modo de operación izquierda-derecha dígito más significativo primero, del inglés left-to-right most-significand digit first (MSDF), y el uso de representación redundante. Se utiliza una representación con signo radix-r con un conjunto máximo de dígitos redundantes {-(r-1), 0, ...(r-1)}.

Una potencial limitación de este método para ciertas aplicaciones es el rango de la función exponencial

Los algoritmos exponenciales de recurrencia de dígitos requieren que el argumento esté dentro del intervalo (-1 , 1), mientras que Z x S puede estar fuera de este rango. Para extender el rango de convergencia y garantizar la convergencia del método, las partes entera y fraccional de Z x S se extraen de forma serie y la ecuación (2) se puede escribir como:

siendo

y las partes entera y fraccional de ZxS, respectivamente. Por lo

tanto, de acuerdo a la ecuación (3), y considerando el significando

M _f y el exponente E_f de X^z son:

El argumento de la exponencial está ahora en el rango (-1 , 1). El número de bits

enteros de Z x S es mayor para

que para

En el caso de extracción de raíces, el número de bits enteros depende sólo de

pero en las operaciones de potenciación depende además de y. De acuerdo a una realización, la secuencia de operaciones del método es:

1. Evaluación de (sólo si se extrae la raíz, REC en Figura 1), siendo

el signo de y. Para consideración práctica, una baja precisión para |y| es suficiente y se prefiere una tabla (LUT) para el cálculo de

Por lo tanto, se usa una LUT con

entradas y salidas bits fracciónales, representación binaria no redundante).

2. Evaluación del logaritmo L = log₂ M _x e [0,1) con una precisión de bts usando un

algoritmo de recurrencia de dígitos de radix elevado. El logaritmo se representa empleando una representación radix-r con signo. Hay que indicar que como el logaritmo en la función de potenciación necesita un paso más que en la extracción de raíces, la primera etapa se evita en el caso de extracción de raíces. 3. Multiplicación T = Z x S. El operando se obtiene

concatenando los dígitos de E_x (dígitos enteros), recodificados a una representación radix-r con signo, y L (bits fracciónales). La multiplicación se evalúa usando un multiplicador LRCF.

4. Extracción serie de la parte entera int(T) y de la parte fraccional frac(T) de 7, y la conversión on-line de int(T) a una representación no redundante. Hay que indicar que el número de dígitos enteros depende de la operación y que se requiere un ciclo para obtener cada uno. Así, el número de dígitos enteros es para extracción de

raices. 5. Cálculo de la exponencial de radix elevado on-line con

con una precisión de bits, y un retardo on-line δ = 2.

El número de etapas del logaritmo de la multiplicación son diferentes para la potenciación y para la extracción de raíces, de hecho, a partir del análisis de errores, en este caso, el cálculo de la operación de potenciación requiere una etapa adicional de cálculo de logaritmo y de multiplicación con respecto a la operación de extracción de raíz. Para acomodar estos dos flujos de datos con diferentes número de etapas para el logaritmo y la multiplicación, y diferente número de dígitos enteros, se introducen varios multiplicadores en la primera etapa en el procesador tal y como se indica en la Figura 1. El número de dígitos en la parte entera es para potenciación y

para extracción de raíces. Como la extracción de raíces requiere obtener Z

el número de ciclos requeridos para obtener la parte entera de ambas operaciones es la misma, Por lo tanto la latencia total viene dada por :

donde es la latencia del cálculo de la exponencial

Para obtener un resultado correctamente redondeado para la potenciación y extracción de raíz los resultados se redondean con un error de 1 ulp con respecto al resultado obtenido. Asumiendo un redondeo al número par más próximo, la precisión requerida y la mínima latencia para cada operación intermedia y la latencia para la operación completa se muestran en la Figura 6. Estos valores están indicados para precisión simple (SP) y precisión doble (DP) con radix r = 128.

C. Aparato para exponente en punto fijo y punto flotante

De acuerdo a una realización particular, y sin limitación, el aparato para calcular la potencia Z-ésima o la raíz Z-ésima de un número X comprende: (a) una pluralidad de elementos de memoria, como por ejemplo registros, para almacenar el número X cuya potencia Z-ésima o raíz Z-ésima se va a calcular, un número Z en punto fijo o punto flotante que indica el exponente de la potencia o la raíz, el número de bits significativos del número X y del resultado del cálculo, la operación que se va a llevar a cabo, potenciación o cálculo de raíz y el exponente de Z; (b) una unidad de cálculo del recíproco que calcula el recíproco de Z cuyo resultado es un número A; (c) una unidad logarítmica que calcula el logaritmo en base 2 del número X cuyo resultado es un número B; (d) una unidad de desplazamiento que desplaza el número B en caso de que Z sea un número en punto flotante, cuyo resultado es un número B'; (e) una unidad de multiplicación que calcula el producto de los números A y B o B', cuyo resultado es un número C; y (f) una unidad exponencial que calcula la exponencial del número C, resultado de la operación. En una realización particular, la unidad recíproca opera en paralelo con la unidad logarítmica, se superponen las operaciones de la unidad logarítmica y la unidad de multiplicación, la unidad exponencial calcula la exponencial siguiendo una base on-line, la unidad logarítmica calcula el logaritmo comenzando por el dígito más significativo, el desplazamiento se calcula en comenzando por el dígito más significativo, y/o la unidad de multiplicación calcula el producto comenzando por el dígitos más significativo. De acuerdo a una realización particular, la arquitectura del aparato comprende una unidad de selección de exponente, una unidad de selección de operación, una unidad de tabla de verdad recíproca, un unidad logarítmica de radix elevado, un multiplicador LRCF, una unidad de conversión y una unidad exponencial de radix elevado. En una realización alternativa, la arquitectura del aparato comprende una unidad de desplazamiento de longitud de palabra, una unidad de cálculo de recíproco de radix elevado, una unidad logarítmica de radix elevado, una unidad de multiplicación de radix elevado, una unidad de conversión y una unidad exponencial de radix elevado. La Figura 5 muestra el diagrama de bloques que calcula X^z para exponentes generales. En una realización particular el número X se representa en precisión flotante doble o simple de acuerdo al estándar IEEE-754. D. Método para exponente en punto flotante

De acuerdo a una realización, el cálculo de la potencia Z-ésima o de la raíz Z-ésima en un procesador hardware comprende: (a) almacenar un número X en un primer elementos de memoria del procesador, donde X es un número cuya potencia Z-ésima o raíz Z-ésima se va a calcular; (b) almacenar el número Z en un segundo elemento de memoria del procesador, donde Z es un número de punto fijo o punto flotante que indica el exponente de la potenciación o de la operación de extracción de raíz; (c) almacenar el número de bits significativos del número X y del resultado del cálculo en un tercer elemento de memoria del procesador; (d) almacenar la operación que se va a llevar a cabo, potenciación o raíz, en un cuarto elemento de memoria del procesador; (e) almacenar el exponente del número Z en un quinto elemento de memoria; (f) calcular el recíproco del número Z cuyo resultado es un número A; (g) calcular el logaritmo en base 2 del número X cuyo resultado es un número B; (h) desplazar el número B, en caso de que Z sea un número en punto flotante, cuyo resultado es un número B'; (i) calcular el producto de los número A y B o B' cuyo resultado es un número C; (j) separar la parte entera y fraccionaria del número C; y (k) calcular la exponencial del número C, obteniendo así el resultado de la operación. En una realización particular, el cálculo de la exponencial y del producto se solapan; el cálculo del producto y el logaritmo se solapan; el número X se representa en precisión flotante doble o simple de acuerdo al estándar IEEE-754; y el procesador se escoge de entre el grupo consistente en circuitos integrados, dispositivo FPGA, microprocesador, microcontrolador, procesador digital de señal (DSP), unidad de procesamiento gráfico (GPU) y procesador de propósito general.

De acuerdo a una realización se va a calcular la función

siendo X e Y números en punto flotante, . Sustituyendo el exponente

en la ecuación 1 por un exponente Y en punto flotante:

De forma similar:

Para usar el mismo multiplicador para ambas operaciones, se normaliza

al intervalo [1 ,2); entonces:

En el caso de que el exponente sea un número en punto fijo, para garantizar la convergencia del algoritmo, la parte entera y la parte fraccional se extraen de forma serie,

siendo Z = Y o Z = 1/Y y

para potenciación y extracción de raíz, respectivamente. La secuencia de operaciones es: (1) cálculo de recíproco para el caso de

extracción de una raíz; (2) evaluación de

(3) desplazamiento del resultado del logaritmo, (4) multiplicación por y (5) cálculo exponencial siguiendo

una base on-line. De acuerdo a una realización, la secuencia de operaciones del método es:

1. Evaluación de sólo en el caso de extracción de raíz, mediante un

método de recurrencia de dígitos. La latencia es p

ara n_r bits de precisión.

2. Cálculo de El logaritmo se calcula como dígito a dígito.

Para asegurar la convergencia del logaritmo, los argumentos E_x y M_x se modifican ligeramente. Para reducir el número de iteraciones, se estima el número de ceros/unos a la izquierda,

en y se evitan las primeras iteraciones. Por contra,

una iteración inicial (reducción de rango) se necesita para calcular varias variables. En el primer ciclo, los ceros/unos a la izquierda de la parte fraccional y las partes enteras de L, respectivamente, se obtienen usando detectores de ceros a la izquierda, del inglés

Leading-Zero Detectors (LZD) o detectores de unos a la izquierda, del inglés Leading- One detector (LOD), que permiten calcular el número de iteraciones que se evitan, K, y el número de ceros de la parte entera de K_Ex. Después de esto, se calcula el logaritmo con

bits de precisión, lo que requiere Λ/, =/^~ 'n+n_Ex+6)/b iteraciones.

3. Desplazar L por El desplazamiento se describe en la sección D.1.

4. Multiplicación en base on-line sin acarreo izquierda-derecha

dependiendo de la operación que se esté llevando a cabo, comenzando

en el ciclo 5 con un retardo on-line

Se debe seleccionar el operando adecuado para llevar a cabo la operación, y en el caso de una implementación independiente de la operación de potenciación el retardo on-line

es cero. Se calcula un dígito significativo adicional T₀ para detectar el desbordamiento para desbordamiento).

5. Cálculo on-line de la exponencial

comenzando en el ciclo 7, ya que el retardo on-line de la exponencial es δ = 2. La latericia del método es donde (para el cálculo de la raíz

q-ésima), es la latencia de la operación de cálculo de la

exponencial.

Los desplazamientos

imponen una limitación en el rango de valores soportado de Y (i.e. el desplazamiento no puede producir un valor mayor que el máximo o menos que el mínimo número representable de punto flotante). De acuerdo a una realización particular, el rango práctico de para la potenciación está limitado a:

En el caso de extracción de raíz cuadrada, el rango práctico de está limitado a :

Así, para potenciación

(extracción de raíz) en precisión doble y simple para representación en punto flotante, respectivamente.

Para obtener un valor de la potenciación o de la raíz correctamente redondeado el resultado tiene una precisión 1 ulp con respecto al resultado exacto. Asumiendo un redondeo al par más cercano, los valores de precisión requerida y latencia mínima para cada operación intermedia y la latencia para la operación completa se muestran en la Figura 7. Estos valores son para precisión simple (SP) y precisión doble (DP) con r = 128.

D.1 Método de desplazamiento El cálculo de una potencia y una raíz genéricas, en el método que opera con exponentes en punto fijo y punto flotante, requiere realizar el desplazamiento por

, en el cálculo de cálculo de potencia o por en el caso de extracción de raíz. En

ambos casos el desplazamiento puede ser negativo o positivo.

Para simplificar la representación del desplazamiento se ilustra considerando un desplazamiento por para potenciación, para extracción

de raíz. La Figura 4(A) muestra el formato de Debido a la adición de

hay una parte entera de dígitos en radix-r, de los cuales son ceros a

la izquierda. Si Κ_Εχ = χ la parte entera de L es cero, que corresponde a los

casos (1) con (i.e., se filtra el caso

ya que su evaluación es directa). La parte fraccional tiene

ceros a la izquierda radix-r seguidos por dígitos, donde es el número

de 0 o 1 consecutivos más significativos de la parte fraccional de M_x. Los dígitos radix-r que no son ceros de la parte entera y fraccional se denotan como

, respectivamente (i.e., los ceros a la izquierda se evitan durante el cálculo, estos dígitos no se emplean en el cálculo pero están representados para una mejor comprensión del desplazamiento).

Los dígitos del logaritmo se calculan de forma serie, comenzando por el dígito más significativo, y los dígitos de la parte entera y fraccional se obtienen en paralelo, como se muestra en la Figura 4(B). El desplazamiento a la izquierda o derecha se implementa

como un desplazamiento a derecha: como los ceros/unos a la izquierda no se utilizan, el primer dígito que no es un cero de la parte entera y fraccional de L se obtienen simultáneamente en el ciclo 2; esto es equivalente a prealinear L colocando sus

si la parte entera no es cero) o (s\ la parte entera es cero) dígitos a la izquierda,

el máximo desplazamiento posible la izquierda.

El desplazamiento se divide en dos partes: (1) un desplazamiento a la derecha de dígitos radix-r y (2) un desplazamiento binario a

la derecha de bits. El desplazamiento dígito a dígito se lleva a cabo con un registro

de desplazamiento con N_s radix-b dígitos (Figura 4(C)), donde N_s es aproximadamente

(en los casos de interés Todos los dígitos enteros entran en la misma posición

del registro pero en ciclos consecutivos. Ocurre lo mismo para los dígitos fracciónales

Por otro lado, el dígito entra posiciones a la derecha del dígito Los

dígitos se desplazan a la izquierda, un dígito cada ciclo.

La posición de los dígitos de entrada al registro está determinada en función de y

Se identifican dos casos:

1. La parte entera es distinta de cero, que corresponde a El máximo

desplazamiento a la izquierda permitido en L es Entonces, los dígitos entran en el registro en la posición y la salida del registro tiene

ceros/unos a la izquierda.

2. La parte entera es cero, que corresponde a El

desplazamiento máximo permitido a la izquierda en L es

Entonces, los L_¡ dígitos se introducen en la posición Una vez que los dígitos han sido

desplazado, hay dígitos ceros/unos a la izquierda en S.

Por lo tanto, el logaritmo desplazado S tiene dígitos. El bit más significativo

permite detectar el desbordamiento (si entonces hay

desbordamiento), los siguientes

dígitos en radix-r corresponden a la parte entera del logaritmo desplazado y los restantes

dígitos radix-r corresponden a la parte fraccional. El desplazamiento binario de se lleva a cabo introduciendo los dígitos

juntos en un registro de desplazamiento a la derecha de b bits y descartando los

b bits más significativos, como se muestra en la Figura 4(D).

Claims

REIVINDICACIONES

1. Un procesador hardware para el cálculo general de

donde X es un número en punto flotante e Y es un exponente en punto flotante, comprende:

a. una unidad de cálculo de recíproco que calcula el valor

b. una unidad logarítmica que calcula el valor el algoritmo se calcula

como

c. una unidad de desplazamiento que desplaza L por

en el caso de cálculo de potencia o por

en el caso de cálculo de raíz, obteniendo un valor S; d. una unidad de multiplicación que calcula el producto en el caso

de cálculo de raíz y en el caso de cálculo de potencia; y

e. una unidad de cálculo exponencial que calcula el valor de frac(T), donde frac indica parte fraccional, que es el resultado de la operación de cálculo de raíz o de cálculo de potencia.

2. El procesador según la reivindicación 1 , en el que la unidad de desplazamiento opera en modo izquierda-derecha dígito más significativo primero, del inglés left-to-right most-significand digit first (MSDF).

3. El procesador según la reivindicación 2 en el que la unidad de desplazamiento izquierda o derecha del logaritmo, que tiene una parte entera de

dígitos en radix-r, donde

es el radix empleado y es el número de bits del

exponente, de los cuales K_Ex son ceros a la izquierda, y una parte fraccional que tiene ceros a la izquierda seguidos por N| dígitos, donde es el número de

0 o 1 consecutivos más significativos de la parte fraccional de

que comprende: a. desplazador a la derecha de dígitos en radix-r cuando la

parte entera del logaritmo es distinta de cero, o de

dígitos radix-r cuando la parte entera del logaritmo es cero,

b. desplazador binario a la derecha de

4. El procesador según la reivindicación 1 en el que los números X e Y se representan de acuerdo al estándar IEEE-754.

5. Un método del cálculo de la potencia Y-ésima o de la raíz Y-ésima de un número X,

en un procesador hardware, siendo X e Y números en punto flotante,

, que comprende:

a. calcular el término

b. calcular

c. desplazar L por

siendo en el caso de cálculo de potencia y

el caso de cálculo de raíz, obteniendo un valor S;

d. multiplicar en base on-line sin acarreo izquierda-derecha los términos

en el caso de cálculo de potencia, en el caso de cálculo

de raíz; e. separar la parte entera y fraccionaria de T; y f. calcular de forma on-line la exponencial

donde frac indica parte fraccional, que es el resultado de la operación de cálculo de potencia o cálculo de raíz.

6. El método según la reivindicación 5 en el que el desplazamiento se lleva a cabo en modo de operación izquierda-derecha dígito más significativo primero, del inglés left- to-right most-significand digit first (MSDF).

7. El método según la reivindicación 6 en el que el desplazamiento a izquierda o derecha del logaritmo, que tiene una parte entera de dígitos en radix-

r, donde

es el radix empleado, de los cuales

son ceros a la izquierda, y una parte fraccional que tiene ceros a la izquierda seguidos por N| dígitos,

donde es el número de 0 o 1 consecutivos más significativos de la parte fraccional de que comprende: a. realizar un desplazamiento a la derecha de dígitos en radix-

r cuando la parte entera del logaritmo es distinta de cero, o un

desplazamiento a la derecha de dígitos radix-r cuando la

parte entera del logaritmo es cero, ; y

b. realizar un desplazamiento binario a la derecha de

8. El método según la reivindicación 5 en el que los números X e Y se representan de acuerdo al estándar IEEE-754.