ES2987686T3

ES2987686T3 - Dispositivo de conversión de coeficiente de predicción lineal y procedimiento de conversión de coeficiente de predicción lineal

Info

Publication number: ES2987686T3
Application number: ES18205457T
Authority: ES
Inventors: Nobuhiko Naka; Vesa Ruoppila
Original assignee: NTT Docomo Inc
Current assignee: NTT Docomo Inc
Priority date: 2014-04-25
Filing date: 2015-04-16
Publication date: 2024-11-15
Anticipated expiration: 2035-04-16
Also published as: JP6018724B2; MX352479B; KR101920297B1; FI4343763T3; AU2019280040A1; KR20180123742A; KR20180081181A; DK3471095T3; US10714108B2; JP2018077524A; US20170053655A1; FI3471095T3; CN107945812B; ES2709329T3; PL4343763T3; BR112016024372B1; EP3136384B1; CA2946824A1; TR201901328T4; US20190080705A1

Abstract

La presente invención tiene por objeto estimar, con una pequeña cantidad de cálculo, un filtro de síntesis de predicción lineal después de la conversión de una frecuencia de muestreo interna. Un dispositivo de conversión de coeficientes de predicción lineal es un dispositivo que convierte primeros coeficientes de predicción lineal calculados en una primera frecuencia de muestreo en segundos coeficientes de predicción lineal en una segunda frecuencia de muestreo diferente de la primera frecuencia de muestreo, que incluye un medio para calcular, en el eje real del círculo unitario, un espectro de potencia correspondiente a los segundos coeficientes de predicción lineal en la segunda frecuencia de muestreo en base a los primeros coeficientes de predicción lineal o un parámetro equivalente, un medio para calcular, en el eje real del círculo unitario, coeficientes de autocorrelación a partir del espectro de potencia, y un medio para convertir los coeficientes de autocorrelación en los segundos coeficientes de predicción lineal en la segunda frecuencia de muestreo. (Traducción automática con Google Translate, sin valor legal)

Description

DESCRIPCIÓN

Dispositivo de conversión de coeficiente de predicción lineal y procedimiento de conversión de coeficiente de predicción lineal

Campo técnico

La presente invención se refiere a un dispositivo de conversión de coeficiente de predicción lineal y a un procedimiento de conversión de coeficiente de predicción lineal.

Técnica anterior

Un modelo de todos los polos autorregresivo es un procedimiento que se usa a menudo para el modelado de una envolvente espectral a corto plazo en codificación de voz y audio, en el que se adquiere una señal de entrada para una determinada unidad colectiva o una trama con una longitud especificada, se codifica un parámetro del modelo y se transmite a un descodificador junto con otro parámetro como información de transmisión. El modelo de todos los polos autorregresivo se estima generalmente mediante predicción lineal y se representa como un filtro de síntesis de predicción lineal.

Una de las técnicas de codificación de voz y audio habituales más recientes es la recomendación G.718 de ITU-T. La recomendación describe en detalle una estructura de trama habitual para codificación que usa un filtro de síntesis de predicción lineal, y un procedimiento de estimación, un procedimiento de codificación, un procedimiento de interpolación y un procedimiento de uso de un filtro de síntesis de predicción lineal. Además, la codificación de voz y audio basada en predicción lineal también se describe en detalle en el documento de patente 2.

En la codificación de voz y audio que puede gestionar diversas frecuencias de muestreo de entrada/salida y funcionar a un amplio intervalo de tasas de transmisión de bits, que varían de trama a trama, generalmente se requiere cambiar la frecuencia de muestreo interna de un codificador. Puesto que también se requiere la misma operación en un descodificador, la descodificación se realiza a la misma frecuencia de muestreo interna que en el codificador. La figura 1 muestra un ejemplo en el que cambia la frecuencia de muestreo interna. En este ejemplo, la frecuencia de muestreo interna es de 16.000 Hz en una trama i, y es de 12.800 Hz en la trama i-1 anterior. Es necesario que el filtro de síntesis de predicción lineal que representa las características de una señal de entrada en la trama i-1 anterior se estime de nuevo después de volver a muestrear la señal de entrada a la frecuencia de muestreo interna cambiada de 16.000 Hz, o se convierta en uno correspondiente a la frecuencia de muestreo interna cambiada de 16.000 Hz. El motivo de que sea necesario que el filtro de síntesis de predicción lineal se calcule a una frecuencia de muestreo interna cambiada es obtener el estado interno correcto del filtro de síntesis de predicción lineal para la señal de entrada actual y realizar una interpolación con el fin de obtener un modelo que es temporalmente más uniforme.

Un procedimiento para obtener otro filtro de síntesis de predicción lineal en función de las características de un determinado filtro de síntesis de predicción lineal es calcular un filtro de síntesis de predicción lineal después de la conversión a partir de una respuesta de frecuencia deseada después de la conversión en un dominio de frecuencia tal como se muestra en la figura 2. En este ejemplo, se introducen coeficientes LSF como parámetro que representa el filtro de síntesis de predicción lineal. Pueden ser coeficientes LSP, coeficientes ISF, coeficientes ISP o coeficientes de reflexión, que generalmente se conocen como parámetros equivalentes a coeficientes de predicción lineal. En primer lugar, se calculan coeficientes de predicción lineal con el fin de obtener un espectro de potencia Y(w) del filtro de síntesis de predicción lineal a la primera frecuencia de muestreo interna (001). Esta etapa puede omitirse cuando se conocen los coeficientes de predicción lineal. A continuación se calcula el espectro de potencia Y(w) del filtro de síntesis de predicción lineal, que se determina mediante los coeficientes de predicción lineal obtenidos (002). Luego, se modifica el espectro de potencia obtenido para dar un espectro de potencia deseado Y’(w) (003). Se calculan coeficientes de autocorrelación a partir del espectro de potencia modificado (004). Se calculan coeficientes de predicción lineal a partir de los coeficientes de autocorrelación (005). La relación entre los coeficientes de autocorrelación y los coeficientes de predicción lineal se conoce como la ecuación de Yule-Walker, y el algoritmo de Levinson-Durbin se conoce bien como una solución de esa ecuación.

Este algoritmo es eficaz en la conversión de una frecuencia de muestreo del filtro de síntesis de predicción lineal descrito anteriormente. Esto se debe a que, aunque en un análisis de predicción lineal generalmente se usa una señal que está temporalmente adelantada a una señal en una trama que va a codificarse, que se denomina señal anticipada, la señal anticipada no puede usarse cuando se realiza un análisis de predicción lineal de nuevo en un descodificador.

Tal como se describió anteriormente, en la codificación de voz y audio con dos frecuencias de muestreo internas diferentes, se prefiere usar un espectro de potencia con el fin de convertir la frecuencia de muestreo interna de un filtro de síntesis de predicción lineal conocido. Sin embargo, puesto que el cálculo de un espectro de potencia es un cálculo complejo, existe el problema de que la cantidad de cálculo es grande.

Lista de referencias

Bibliografía no de patente

Documento no de patente 1: Recomendación G.718 de ITU-T

Documento no de patente 2: Speech coding and synthesis, W.B. Kleijn, K.K. Pariwal,et al.ELSEVIER.

Bibliografía de patente

Documento de patente 1: KR 20050113744 A

Documento de patente 2: WO 2013/068634 A1

Documento de patente 3: EP 1785985 A1

El documento de patente 1 divulga un sistema y procedimiento que transforma una señal de voz de banda estrecha en una señal de voz de banda ancha mediante el procesamiento de la señal a través de una secuencia de unidades de análisis que extrae características relevantes de la señal de voz recibida.

El documento de patente 2 divulga un procedimiento y aparato para codificación de voz o audio donde se determinan coeficientes de predicción lineal para una trama de audio a una tasa de muestreo y, además, los coeficientes de predicción se convierten en coeficientes de frecuencia espectral de línea.

El documento de patente 3 divulga un dispositivo de codificación escalable. El dispositivo obtiene un parámetro de frecuencia espectral de línea, LSP, de banda ancha a partir de un LSP de banda estrecha.

Sumario de la invención

Problema técnico

Tal como se describió anteriormente, existe el problema de que, en un esquema de codificación que tiene un filtro de síntesis de predicción lineal con dos frecuencias de muestreo internas diferentes, se requiere una gran cantidad de cálculo para convertir el filtro de síntesis de predicción lineal a una determinada frecuencia de muestreo interna en uno a una frecuencia de muestreo interna deseada.

Solución al problema

Para resolver el problema anterior, un dispositivo de conversión de coeficiente de predicción lineal según un aspecto de la presente invención es un dispositivo que incluye las características según la reivindicación 1. En esta configuración, es posible reducir de manera eficaz la cantidad de cálculo.

Un aspecto de la presente invención puede describirse como una invención de un dispositivo tal como se mencionó anteriormente y, además, también puede describirse como una invención de un procedimiento tal como sigue. Se encuentran bajo diferentes categorías, pero son sustancialmente la misma invención y logran una operación y efectos similares.

Específicamente, un procedimiento de conversión de coeficiente de predicción lineal según un aspecto de la presente invención es un procedimiento de conversión de coeficiente de predicción lineal según la reivindicación 2.

Efectos ventajosos de la invención

Es posible estimar un filtro de síntesis de predicción lineal después de la conversión de una frecuencia de muestreo interna con una cantidad menor de cálculo que con los medios existentes.

Breve descripción de los dibujos

La figura 1 es una vista que muestra la relación entre la conmutación de una frecuencia de muestreo interna y un filtro de síntesis de predicción lineal.

La figura 2 es una vista que muestra una conversión de coeficientes de predicción lineal.

La figura 3 es un diagrama de flujo de conversión 1.

La figura 4 es un diagrama de flujo de conversión 2.

La figura 5 es un diagrama de bloques de una realización de la presente invención.

La figura 6 es una vista que muestra la relación entre un círculo unitario y una función coseno.

Descripción de realizaciones

A continuación en el presente documento se describen realizaciones de un dispositivo, un procedimiento y un programa con referencia a los dibujos. Obsérvese que, en la descripción de los dibujos, los mismos elementos se indican mediante los mismos símbolos de referencia y se omite una descripción redundante de los mismos.

En primer lugar, a continuación en el presente documento se describen las definiciones requeridas para describir las realizaciones.

Una respuesta de un filtro de predicción lineal autorregresivo de orden N (que a continuación en el presente documento se denomina filtro de síntesis de predicción lineal)

1 1

( 1)A(z)1+ a¡z1H----- hanz"

puede adaptarse al espectro de potencia Y(w) calculando la autocorrelación

(2)Rk = —O2'T TTIT ru c o skadco,fr = 0JU,«

para un espectro de potencia conocido Y(w) a una frecuencia angular ue[-n, n] y, usando los coeficientes de autocorrelación de orden N, resolviendo los coeficientes de predicción lineal a1, a2,... , an mediante el procedimiento de Levinson-Durbin como procedimiento habitual, por ejemplo.

Tal generación de un modelo autorregresivo usando un espectro de potencia conocido puede usarse también para la modificación de un filtro de síntesis de predicción lineal 1/A(z) en el dominio de frecuencia. Esto se logra calculando el espectro de potencia de un filtro conocido

(3) Y(<y) = l/|4fy)|:

y modificando el espectro de potencia obtenido Y(w) mediante un procedimiento apropiado que sea adecuado con el propósito de obtener el espectro de potencia modificado Y’(w), después calculando los coeficientes de autocorrelación de Y’(w) mediante la ecuación anterior (2), y obteniendo los coeficientes de predicción lineal del filtro modificado 1/A’(z) mediante el algoritmo de Levinson-Durbin o un procedimiento similar.

Aunque la ecuación (2) no puede calcularse analíticamente excepto en casos sencillos, la aproximación rectangular puede usarse de la siguiente manera, por ejemplo.

(4)Rk *j-*pr(<p)cx>skq>

donde ü indica el número M de frecuencias colocadas a intervalos regulares a la frecuencia angular [-n, n]. Cuando se usa la propiedad simétrica de Y(-w)=-Y(w), la adición mencionada anteriormente solamente necesita evaluar la frecuencia angular w>e[0, n], que corresponde a la mitad superior del círculo unitario. Por tanto, en cuanto a la cantidad de cálculo se prefiere que la aproximación rectangular representada mediante la ecuación anterior (4) se altere de la siguiente manera

donde ü indica el número (N-2) de frecuencias colocadas a intervalos regulares a (0, n), excluyendo 0 y n.

A continuación en el presente documento se describen frecuencias espectrales de línea (que a continuación en el presente documento se denominan LSF) como medios equivalentes de expresión de coeficientes de predicción lineal.

La representación mediante LSF se usa en diversas técnicas de codificación de voz y audio para la cantidad característica de un filtro de síntesis de predicción lineal, y el funcionamiento y la codificación de un filtro de síntesis de predicción lineal. La LSF caracteriza de manera única el polinomio A(z) de orden N mediante el número n de parámetros que son diferentes respecto a coeficientes de predicción lineal. La LSF tiene características tales como que garantiza fácilmente la estabilidad de un filtro de síntesis de predicción lineal, se interpreta de manera intuitiva en el dominio de frecuencia, es menos probable que se vea afectada por errores de cuantificación que otros parámetros tales como coeficientes de predicción lineal y coeficientes de reflexión, es adecuada para interpolación y similares.

Con el propósito de una realización de la presente invención, las LSF se definen de la siguiente manera.

Una descomposición de LSF del polinomio A(z) de orden N puede representarse de la siguiente manera usando un desplazamiento de un número entero donde<k>> 0

(6) A(z)={P(z)+Q(z)}/2

dondeP(z)=A(z)+z"',cA(z'1) y

Q(z)=A(z)-z'“‘KA(z"1)

La ecuación (6) indica que P(z) es simétrico y Q(z) es antisimétrico de la siguiente manera

P(z)~z n KP(z"')

Q i^ r - z ^ Q iz ' )

Tal propiedad simétrica es una característica importante en la descomposición de LSF.

Resulta evidente que P(z) y Q(z) tienen cada uno una raíz en z=±1. Esas raíces evidentes son tal como se muestra en la tabla 1 como n y<k>.Por tanto, polinomios que representan las raíces evidentes de P(z) y Q(z) se definen comoP<t>(z)yQ<t>(z),respectivamente. Cuando P(z) no tiene una raíz evidente,P<t>(z)es 1. Lo mismo se aplica a Q(z).

Una LSF de A(z) es una raíz no trivial del ángulo de fase positivo de P(z) y Q(z). Cuando el polinomio A(z) es la fase mínima, es decir, cuando todas las raíces de A(z) están en el interior del círculo unitario, las raíces no triviales de P(z) y Q(z) se disponen de manera alterna en el círculo unitario. El número de raíces complejas de P(z) y Q(z) es mP y mo, respectivamente. La tabla 1 muestra la relación de mP y mo con el orden n y desplazamiento<k>.

Cuando las raíces complejas de P(z), que es el ángulo de fase positivo, se representan como

y las raíces de Q(z) se representan como

las posiciones de las raíces del polinomio A(z), que es la fase mínima, pueden representarse de la siguiente manera.

(7)O«D0<ü>1<...<e>mf+mg_l < x

En la codificación de voz y audio, se usa un desplazamiento<k>=0 o<k>=1. Cuando<k>=0, se denomina generalmente frecuencia espectral de inmitancia (ISF), y cuando<k>=1, se denomina generalmente LSF en un sentido más restringido que el de la descripción de una realización de la presente invención. Sin embargo, obsérvese que la representación que usa desplazamiento puede gestionar tanto ISF como LSF de manera unificada. En muchos casos, un resultado obtenido mediante LSF puede aplicarse tal cual a un<k>>0 dado o puede generalizarse.

Cuando<k>=0, la representación de LSF solamente tiene el número (mP+mo=n-1) de parámetros de frecuencia tal como se muestra en la tabla 1. Por tanto, se requiere un parámetro más para representar de manera única A(z), y se usa normalmente el n-ésimo coeficiente de reflexión (que a continuación en el presente documento se denomina Yn) de A(z). Este parámetro se introduce en la descomposición de LSF como el siguiente factor.

donde Yn es el n-ésimo coeficiente de reflexión de A(z) que comienza con Q(z), y es normalmente Yn=an.

Cuando<k>=1, el número (mp+mo=n) de parámetros se obtiene mediante descomposición de LSF, y es posible representar de manera única A(z). En este caso, u=1.

Tabla 1

Teniendo en cuenta el hecho de que raíces no evidentes, excluyendo raíces evidentes, son un par de números complejos en el círculo unitario y obtienen polinomios simétricos, se obtiene la siguiente ecuación.

Asimismo,

En esos polinomios,

representan completamente P(z) y Q(z) usando un desplazamiento dadokyvque se determina mediante el orden n de A(z). Esos coeficientes pueden obtenerse directamente a partir de las expresiones (6) y (8).

Cuando z=ejw y usando la siguiente relación

las expresiones (9) y (10) pueden representarse de la siguiente manera

donde

y

Específicamente, las LSF del polinomio A(z) son las raíces de R(w) y S(w) a la frecuencia angular we(0, n).

A continuación en el presente documento se describen los polinomios de Chebyshev del primer tipo, que se usan en la presente invención.

Los polinomios de Chebyshev del primer tipo se definen de la siguiente manera usando una relación de recurrencia

Obsérvese que los valores iniciales son Tü(x)=1 y T1(x)=x, respectivamente. Para x donde [-1, 1], los polinomios de Chebyshev pueden representarse de la siguiente manera

(16) Tk(x)=cos{k cos_1x} k=0,l,...

Una realización de la presente invención explica que la ecuación (15) proporciona un procedimiento sencillo para calcular coskw (donde k=2,3,...) que empieza con cosw y cos0=1. Específicamente, con el uso de la ecuación (16), la ecuación (15) se reescribe de la siguiente forma

( 17) cosk©=2cosocos(k-l)a )-cos(k-2)G) k= 2,3, ...

Cuando se usa la conversión w=arccosx, los primeros polinomios obtenidos a partir de la ecuación (15) son de la siguiente manera

Cuando las ecuaciones (13) y (14) para xe[-1,1] se reemplazan por esos polinomios de Chebyshev, se obtienen las siguientes ecuaciones

(18)R(x) = T,r(x)+PíT,Jx)+-+p„,rn

(19) S(*) =T,e(x) q{TmJ x )+ ■ ■-+qme 12

Cuando se conoce LSFw¡ para i=0,1,...,mP+mQ-1, se obtienen las siguientes ecuaciones usando el coseno de LSF x¡=cosw¡ (LSP)

(20)R(x)= r0(x - x0)(x -X2) ■ ■ ■ (x- x2mf J

Los coeficientes ro y so pueden obtenerse mediante una comparación de las ecuaciones (18) y (19) con (20) y (21) basándose en mp y mQ.

Las ecuaciones (20) y (21) se escriben como

(22)R(x) = rax'"'+rlx"'A+-+rm mP

(23) S (x )= s ,x " Q +s1/ ' ‘r‘ - í„8

Esos polinomios pueden calcularse de manera eficiente para una x dada mediante un procedimiento conocido como el procedimiento de Horner. El procedimiento de Horner obtiene R(x)=bo(x) mediante el uso de la siguiente relación recursiva

bk(x)=xbk+i(x)+rk

donde el valor inicial es

Lo mismo se aplica a S(x).

A continuación en el presente documento se describe un procedimiento de cálculo de los coeficientes de los polinomios de las ecuaciones (22) y (23) usando un ejemplo. En este ejemplo se supone que el orden de A(z) es 16 (n=16). Por consiguiente, mp=mQ=8 en este caso. Un desarrollo en serie de la ecuación (18) puede representarse en forma de la ecuación (22) mediante sustitución y simplificación mediante los polinomios de Chebyshev. Como resultado, los coeficientes del polinomio de la ecuación (22) se representan de la siguiente manera usando el coeficiente p del polinomio P(z).

f r0=128

r,=64pi

r2=-2564-32p2

r3=-118pi+16p3

J<r4=160-48p2+8p4>

r5=56pi-20p3+4p5

r6=-32+18p2-8p4+2p6

r7=-7pi+5p3-3p5+p7

vr8= l-p 2+p4-p6+p8/2

Los coeficientes de P(z) pueden obtenerse a partir de la ecuación (6). Este ejemplo puede aplicarse también al polinomio de la ecuación (23) usando la misma ecuación y usando los coeficientes de Q(z). Además, la misma ecuación para calcular los coeficientes de R(x) y S(x) también puede derivar fácilmente otro orden n y desplazamientok .

Además, cuando se conocen las raíces de las ecuaciones (20) y (21), pueden obtenerse coeficientes a partir de las ecuaciones (20) y (21).

A continuación en el presente documento se ofrece una descripción general del procesamiento según una realización de la presente invención.

Una realización de la presente invención proporciona un dispositivo y procedimiento de cálculo eficaces para, cuando se convierte un filtro de síntesis de predicción lineal calculado de antemano mediante un codificador o un descodificador a una primera frecuencia de muestreo en uno a una segunda frecuencia de muestreo, calcular el espectro de potencia del filtro de síntesis de predicción lineal y modificarlo a la segunda frecuencia de muestreo, y entonces obtener coeficientes de autocorrelación a partir del espectro de potencia modificado.

A continuación en el presente documento se describe un procedimiento de cálculo para el espectro de potencia de un filtro de síntesis de predicción lineal según una realización de la presente invención. El cálculo del espectro de potencia usa la descomposición de LSF de la ecuación (6) y las propiedades de los polinomios P(z) y Q(z). Usando la descomposición de LSF y los polinomios de Chebyshev descritos anteriormente, el espectro de potencia puede convertirse en el eje real del círculo unitario.

Con la conversión en el eje real, es posible lograr un procedimiento eficaz para calcular un espectro de potencia a una frecuencia arbitraria en we[0, n]. Esto se debe a que es posible eliminar funciones transcendentales dado que el espectro de potencia está representado por polinomios. Particularmente, es posible simplificar el cálculo del espectro de potencia a w=0, w=n/2 y w=n. La misma simplificación también es aplicable a LSF cuando uno cualquiera de P(z) o Q(z) es cero. Tales propiedades son ventajosas en comparación con FFT, que generalmente se usa para el cálculo del espectro de potencia.

Se conoce que el espectro de potencia de A(z) puede representarse de la siguiente manera usando descomposición de LSF.

La presente invención usa los polinomios de Chebyshev como una manera de calcular de manera más eficaz el espectro de potencia |A(w)|2 de A(z) en comparación con el caso de aplicar directamente la ecuación (26). Específicamente, el espectro de potencia |A(w)|2 se calcula en el eje real del círculo unitario tal como se representa mediante la siguiente ecuación, convirtiendo una variable en x=cosw y usando una descomposición de LSF mediante los polinomios de Chebyshev.

o(2)(3)

(1) a (4) corresponden a (1) a (4) en la tabla 1, respectivamente.

La ecuación (27) se demuestra de la siguiente manera.

Las siguientes ecuaciones se obtienen a partir de las ecuaciones (11) y (12).

|P(ffl)|2 =4jü(ffl)j2|Pr (ffl)|2

Los factores que representan las raíces evidentes de P(w) y Q(w) son respectivamente de la siguiente manera.

La aplicación de la sustitución cosw=x y cos2w=2x2-1 en |P<t>(w)| y |Q<t>(w)|, respectivamente, da la ecuación (27). Los polinomios R(x) y S(x) pueden calcularse mediante el procedimiento de Horner descrito anteriormente. Además, cuando se conoce x para calcular R(x) y S(x), puede omitirse el cálculo de una función trigonométrica almacenando x en una memoria.

El cálculo del espectro de potencia de A(z) puede simplificarse adicionalmente. En primer lugar, en el caso de calcular con LSF, uno de R(x) y S(x) en la correspondiente ecuación (27) es cero. Cuando el desplazamiento esk=1 y el orden n es un número par, la ecuación (27) se simplifica de la siguiente manera.

f

M <x)f = 2 ( l - x i.)jSf2(jc¡),ipar

2(l x:)R2(x() iimpar

Además, en el caso de w={0,n/2,n}, se simplifica cuando x={1,0,-1}. Las ecuaciones son de la siguiente manera cuando el desplazamiento esk=1 y el orden n es un número par, que son los mismos que en el ejemplo anterior. |A(to=0)|2=4R2( l)

| A(oo=7t/2) 12=2(R2 (0)+S2(0))

| A(<cü>=7<t>)|2=4S2(- 1)

También pueden obtenerse fácilmente resultados similares cuando el desplazamiento esk=0 y el orden n es un número impar.

A continuación se describe el cálculo de coeficientes de autocorrelación según una realización de la presente invención.

En la ecuación (5), cuando se define una frecuencia fi+=A,2A,...,(N-1)A donde N es un número impar y el intervalo de frecuencias es A=n/(N-1), el cálculo de autocorrelación contiene el espectro de potencia simplificado descrito anteriormente a w=0,tc/2,tc. Puesto que la normalización de coeficientes de autocorrelación mediante 1/N no afecta a coeficientes de predicción lineal que van a obtenerse como resultado, puede usarse cualquier valor positivo.

Sin embargo, el cálculo de la ecuación (5) todavía requiere coskw donde k=1,2,...,n para cada uno del número (N-2) de frecuencias. Por tanto, se usa la propiedad simétrica de coskw.

También se usan las siguientes características.

(29) cos(Jbr/2) = (1/2)(1+(-l)w ) ( - # /2j

donde indica el mayor número entero que no supera x. Obsérvese que la ecuación (29) se simplifica a 2, 0, -2, 0, 2, 0,... para k=0,1,2,...

Además, mediante conversión en x=cosw, los coeficientes de autocorrelación se mueven sobre el eje real del círculo unitario. Con este propósito, se introduce la variable X(x)=Y(arccos x). Esto posibilita el cálculo de coskw mediante el uso de la ecuación (15).

Dado lo anterior, la aproximación de autocorrelación de la ecuación (5) puede reemplazarse por la siguiente ecuación.

(30)

donde Tk(x)=2xTk.1(x)-Tk.2(x)

k=2,3,...,n, y Tü(x)=1, T1(x)=cosx tal como se describió anteriormente. Cuando se tiene en cuenta la propiedad simétrica de la ecuación (28), solamente es necesario calcular el último término de la ecuación (30) cuando xeA={cosA,cos2A,...,(N-3)A/2}, y el número (N-3)/2 de valores de coseno puede almacenarse en una memoria. La figura 6 muestra la relación entre la frecuencia A y la función coseno cuando N=31.

A continuación en el presente documento se describen un ejemplo informativo (que a continuación en el presente documento se denomina conversión 1) útil para comprender la presente invención y un ejemplo de la presente invención (que a continuación en el presente documento se denomina conversión 2). En el ejemplo informativo, se usa un caso de conversión de un filtro de síntesis de predicción lineal calculado a una primera frecuencia de muestreo de 16.000 Hz en uno a una segunda frecuencia de muestreo de 12.800 Hz (que a continuación en el presente documento se denomina conversión 1). Y en el ejemplo según la presente invención, se usa un caso de conversión de un filtro de síntesis de predicción lineal calculado a una primera frecuencia de muestreo de 12.800 Hz en uno a una segunda frecuencia de muestreo de 16.000 Hz (a continuación en el presente documento, conversión 2). Esas dos frecuencias de muestreo tienen una razón de 4:5 y se usan generalmente en codificación de voz y audio. Cada una de la conversión 1 y la conversión 2 de estos ejemplos se realiza en el filtro de síntesis de predicción lineal en la trama anterior cuando ha cambiado la frecuencia de muestreo interna, y puede realizarse en cualquiera de un codificador y un descodificador. Tal conversión se requiere para ajustar el estado interno correcto al filtro de síntesis de predicción lineal en la trama actual y para realizar una interpolación del filtro de síntesis de predicción lineal en función del tiempo.

A continuación en el presente documento se describe el procesamiento en estos ejemplos con referencia a los diagramas de flujo de las figuras 3 y 4.

Para calcular un espectro de potencia y coeficientes de autocorrelación usando un punto de frecuencia común en ambos casos de las conversiones 1 y 2, el número de frecuencias cuando una frecuencia de muestreo es de 12.800 Hz se determina como N<l>=1+(12.800 Hz/16.000 Hz)(N-1). Obsérvese que N es el número de frecuencias a una frecuencia de muestreo de 16.000 Hz. Tal como se describió anteriormente, se prefiere que N y N<l>sean ambos números impares con el fin de contener frecuencias a las que se simplifica el cálculo de un espectro de potencia y coeficientes de autocorrelación. Por ejemplo, cuando N es 31,41, 51, 61, el N<l>correspondiente es 25, 33, 41,49. A continuación se describe como ejemplo el caso en el que N=31 y N<l>=25 (etapa S000).

Cuando el número de frecuencias que van a usarse para el cálculo de un espectro de potencia y coeficientes de autocorrelación en el dominio en el que la frecuencia de muestreo es de 16.000 Hz es N=31, el intervalo de frecuencias es A=n/30, y el número de elementos requeridos para el cálculo de autocorrelación contenidos en A es (N-3)/2=14.

La conversión 1 (es decir, el ejemplo informativo útil para comprender la presente invención) que se realiza en un codificador y un descodificador en las condiciones anteriores se lleva a cabo en el siguiente procedimiento.

Determinar los coeficientes de los polinomios R(x) y S(x) usando las ecuaciones (20) y (21) a partir de las raíces obtenidas mediante un desplazamiento<k>=0 o<k>=1 y LSF que corresponden a un filtro de síntesis de predicción lineal obtenido a una frecuencia de muestreo de 16.000 Hz, que es la primera frecuencia de muestreo (etapa S001). Calcular el espectro de potencia del filtro de síntesis de predicción lineal a la segunda frecuencia de muestreo hasta 6.400 Hz, que es la frecuencia de Nyquist de la segunda frecuencia de muestreo. Puesto que esta frecuencia de corte corresponde a w=(4/5)u a la primera frecuencia de muestreo, se calcula un espectro de potencia usando la ecuación (27) a un número N<l>=25 de frecuencias en el lado inferior. Para el cálculo de R(x) y S(x), puede usarse el procedimiento de Horner para reducir el cálculo. No hay necesidad de calcular un espectro de potencia para las 6 (=N-N<l>) frecuencias restantes en el lado superior (etapa S002).

Calcular coeficientes de autocorrelación correspondientes al espectro de potencia obtenido en la etapa S002 usando la ecuación (30). En esta etapa, N en la ecuación (30) se ajusta a N<l>=25, que es el número de frecuencias a la segunda frecuencia de muestreo (etapa S003).

Derivar coeficientes de predicción lineal mediante el procedimiento de Levinson-Durbin o un procedimiento similar con el uso del coeficiente de autocorrelación obtenido en la etapa S003, y obtener un filtro de síntesis de predicción lineal a la segunda frecuencia de muestreo (etapa S004).

Convertir el coeficiente de predicción lineal obtenido en la etapa S004 en LSF (etapa S005).

La conversión 2 (es decir, el ejemplo según la presente invención) que se realiza en un codificador o un descodificador puede lograrse en el siguiente procedimiento, de la misma manera que la conversión 1.

Determinar los coeficientes de los polinomios R(x) y S(x) usando las ecuaciones (20) y (21) a partir de las raíces obtenidas mediante un desplazamiento k=0 o k=1 y LSF que corresponden a un filtro de síntesis de predicción lineal obtenido a una frecuencia de muestreo de 12.800 Hz, que es la primera frecuencia de muestreo (etapa S011). Calcular en primer lugar el espectro de potencia del filtro de síntesis de predicción lineal a la segunda frecuencia de muestreo hasta 6.400 Hz, que es la frecuencia de Nyquist de la primera frecuencia de muestreo. Esta frecuencia de corte corresponde a w=n, y se calcula un espectro de potencia usando la ecuación (27) a un número N<l>=25 de frecuencias. Para el cálculo de R(x) y S(x), puede usarse el procedimiento de Horner para reducir el cálculo. Para 6 frecuencias que superan 6.400 Hz a la segunda frecuencia de muestreo, se extrapola un espectro de potencia. Como ejemplo de extrapolación, puede usarse el espectro de potencia obtenido a la NL-ésima frecuencia (etapa S012).

Calcular coeficientes de autocorrelación correspondientes al espectro de potencia obtenido en la etapa S012 usando la ecuación (30). En esta etapa, N en la ecuación (30) se ajusta a N=31, que es el número de frecuencias a la segunda frecuencia de muestreo (etapa S013).

Derivar coeficientes de predicción lineal mediante el procedimiento de Levinson-Durbin o un procedimiento similar con el uso del coeficiente de autocorrelación obtenido en la etapa S013, y obtener un filtro de síntesis de predicción lineal a la segunda frecuencia de muestreo (etapa S014).

Convertir el coeficiente de predicción lineal obtenido en la etapa S014 en LSF (etapa S015).

La figura 5 es un diagrama de bloques en el ejemplo de la presente invención. Una unidad de conversión de espectro de potencia real 100 está compuesta por una unidad de cálculo de polinomios 101, una unidad de cálculo de espectro de potencia real 102 y una unidad de extrapolación de espectro de potencia real 103, y además se proporcionan una unidad de cálculo de autocorrelación real 104 y una unidad de cálculo de coeficiente de predicción lineal 105. Esto es para lograr las conversiones 1 y 2 descritas anteriormente. Al igual que en la descripción de los diagramas de flujo descritos anteriormente, la unidad de conversión de espectro de potencia real 100 recibe, como entrada, LSF que representan un filtro de síntesis de predicción lineal a la primera frecuencia de muestreo, y emite el espectro de potencia de un filtro de síntesis de predicción lineal deseado a la segunda frecuencia de muestreo. En primer lugar, la unidad de cálculo de polinomios 101 realiza el procesamiento en las etapas S001, S011 descritas anteriormente para calcular los polinomios R(x) y S(x) a partir de LSF. A continuación, la unidad de cálculo de espectro de potencia real 102 realiza el procesamiento en las etapas S002 o S012 para calcular el espectro de potencia. Además, la unidad de extrapolación de espectro de potencia real 103 realiza una extrapolación del espectro, que se realiza en la etapa S012 en el caso de la conversión 2. Mediante el procedimiento anterior, se obtiene el espectro de potencia de un filtro de síntesis de predicción lineal deseado a la segunda frecuencia de muestreo. Después de eso, la unidad de cálculo de autocorrelación real 104 realiza el procesamiento en las etapas S003 y S013 para convertir el espectro de potencia en coeficientes de autocorrelación. Finalmente, la unidad de cálculo de coeficiente de predicción lineal 105 realiza el procesamiento en las etapas S004 y S014 para obtener coeficientes de predicción lineal a partir de los coeficientes de autocorrelación. Obsérvese que, aunque este diagrama de bloques no muestra el bloque correspondiente a S005 y S015, la conversión a partir de los coeficientes de predicción lineal en LSF u otros coeficientes equivalentes puede lograrse fácilmente mediante una técnica conocida.

[Ejemplo alternativo]

Aunque los coeficientes de los polinomios R(x) y S(x) se calculan usando las ecuaciones (20) y (21) en las etapas S001 y S011 del ejemplo descrito anteriormente, el cálculo puede realizarse usando los coeficientes de los polinomios de las ecuaciones (9) y (10), que pueden obtenerse a partir de los coeficientes de predicción lineal. Además, los coeficientes de predicción lineal pueden convertirse a partir de coeficientes LSP o coeficientes ISP. Además, en el caso en el que algún procedimiento conoce un espectro de potencia a la primera frecuencia de muestreo o la segunda frecuencia de muestreo mediante, el espectro de potencia puede convertirse en uno a la segunda frecuencia de muestreo, y pueden omitirse las etapas S001, S002, S011 y S012.

Además, con el fin de asignar pesos en el dominio de frecuencia, puede deformarse un espectro de potencia, y pueden obtenerse coeficientes de predicción lineal a la segunda frecuencia de muestreo.

Lista de signos de referencia

100...unidad de conversión de espectro de potencia real, 101...unidad de cálculo de polinomios, 102...unidad de cálculo de espectro de potencia real, 103...unidad de extrapolación de espectro de potencia real, 104...unidad de cálculo de autocorrelación real, 105...unidad de cálculo de coeficiente de predicción lineal

Claims

REIVINDICACIONES

Dispositivo de conversión de coeficiente de predicción lineal en codificación de voz y audio, configurado para convertir primeros coeficientes de predicción lineal calculados a una primera frecuencia de muestreo F1 en segundos coeficientes de predicción lineal a una segunda frecuencia de muestreo F2, donde F1 < F2, que comprende:

unos medios (102) configurados para calcular un espectro de potencia usando descomposición de frecuencias espectrales de línea, LSF, y polinomios de Chebyshev, el espectro de potencia correspondiente a los segundos coeficientes de predicción lineal a la segunda frecuencia de muestreo F2 usando los primeros coeficientes de predicción lineal en puntos en el eje real del círculo unitario, correspondientes al número N1 de frecuencias diferentes, donde las frecuencias son entre 0 y F1, y se obtiene un número (N1-1)(F2-F1)/F1 de componentes de espectro de potencia correspondientes a frecuencias superiores a F1 e inferiores o iguales a F2 extrapolando el espectro de potencia calculado usando los primeros coeficientes de predicción lineal;

unos medios (104) configurados para calcular, en puntos en el eje real del círculo unitario, coeficientes de autocorrelación a partir del espectro de potencia; y

unos medios (105) configurados para convertir los coeficientes de autocorrelación en los segundos coeficientes de predicción lineal a la segunda frecuencia de muestreo F2.

Procedimiento de conversión de coeficiente de predicción lineal en codificación de voz y audio realizado por un dispositivo que convierte primeros coeficientes de predicción lineal calculados a una primera frecuencia de muestreo F1 en segundos coeficientes de predicción lineal a una segunda frecuencia de muestreo F2, donde F1 < F2, que comprende:

una etapa (S102) de calcular un espectro de potencia usando descomposición de LSF y polinomios de Chebyshev, el espectro de potencia correspondiente a los segundos coeficientes de predicción lineal a la segunda frecuencia de muestreo F2 usando los primeros coeficientes de predicción lineal en puntos en el eje real del círculo unitario, correspondientes al número N1 de frecuencias diferentes, donde las frecuencias son entre 0 y F1, y se obtiene un número (N1-1)(F2-F1)/F1 de componentes de espectro de potencia correspondientes a frecuencias superiores a F1 e inferiores o iguales a F2 extrapolando el espectro de potencia calculado usando los primeros coeficientes de predicción lineal;

una etapa (S103) de calcular, en puntos en el eje real del círculo unitario, coeficientes de autocorrelación a partir del espectro de potencia; y

una etapa (S104) de convertir los coeficientes de autocorrelación en los segundos coeficientes de predicción lineal a la segunda frecuencia de muestreo F2.