ES2987686T3 - Dispositivo de conversión de coeficiente de predicción lineal y procedimiento de conversión de coeficiente de predicción lineal - Google Patents

Dispositivo de conversión de coeficiente de predicción lineal y procedimiento de conversión de coeficiente de predicción lineal Download PDF

Info

Publication number
ES2987686T3
ES2987686T3 ES18205457T ES18205457T ES2987686T3 ES 2987686 T3 ES2987686 T3 ES 2987686T3 ES 18205457 T ES18205457 T ES 18205457T ES 18205457 T ES18205457 T ES 18205457T ES 2987686 T3 ES2987686 T3 ES 2987686T3
Authority
ES
Spain
Prior art keywords
linear prediction
power spectrum
coefficients
sampling frequency
prediction coefficients
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES18205457T
Other languages
English (en)
Inventor
Nobuhiko Naka
Vesa Ruoppila
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Docomo Inc
Original Assignee
NTT Docomo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Docomo Inc filed Critical NTT Docomo Inc
Application granted granted Critical
Publication of ES2987686T3 publication Critical patent/ES2987686T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • G10L19/13Residual excited linear prediction [RELP]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/12Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being prediction coefficients

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Complex Calculations (AREA)
  • Picture Signal Circuits (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

La presente invención tiene por objeto estimar, con una pequeña cantidad de cálculo, un filtro de síntesis de predicción lineal después de la conversión de una frecuencia de muestreo interna. Un dispositivo de conversión de coeficientes de predicción lineal es un dispositivo que convierte primeros coeficientes de predicción lineal calculados en una primera frecuencia de muestreo en segundos coeficientes de predicción lineal en una segunda frecuencia de muestreo diferente de la primera frecuencia de muestreo, que incluye un medio para calcular, en el eje real del círculo unitario, un espectro de potencia correspondiente a los segundos coeficientes de predicción lineal en la segunda frecuencia de muestreo en base a los primeros coeficientes de predicción lineal o un parámetro equivalente, un medio para calcular, en el eje real del círculo unitario, coeficientes de autocorrelación a partir del espectro de potencia, y un medio para convertir los coeficientes de autocorrelación en los segundos coeficientes de predicción lineal en la segunda frecuencia de muestreo. (Traducción automática con Google Translate, sin valor legal)

Description

DESCRIPCIÓN
Dispositivo de conversión de coeficiente de predicción lineal y procedimiento de conversión de coeficiente de predicción lineal
Campo técnico
La presente invención se refiere a un dispositivo de conversión de coeficiente de predicción lineal y a un procedimiento de conversión de coeficiente de predicción lineal.
Técnica anterior
Un modelo de todos los polos autorregresivo es un procedimiento que se usa a menudo para el modelado de una envolvente espectral a corto plazo en codificación de voz y audio, en el que se adquiere una señal de entrada para una determinada unidad colectiva o una trama con una longitud especificada, se codifica un parámetro del modelo y se transmite a un descodificador junto con otro parámetro como información de transmisión. El modelo de todos los polos autorregresivo se estima generalmente mediante predicción lineal y se representa como un filtro de síntesis de predicción lineal.
Una de las técnicas de codificación de voz y audio habituales más recientes es la recomendación G.718 de ITU-T. La recomendación describe en detalle una estructura de trama habitual para codificación que usa un filtro de síntesis de predicción lineal, y un procedimiento de estimación, un procedimiento de codificación, un procedimiento de interpolación y un procedimiento de uso de un filtro de síntesis de predicción lineal. Además, la codificación de voz y audio basada en predicción lineal también se describe en detalle en el documento de patente 2.
En la codificación de voz y audio que puede gestionar diversas frecuencias de muestreo de entrada/salida y funcionar a un amplio intervalo de tasas de transmisión de bits, que varían de trama a trama, generalmente se requiere cambiar la frecuencia de muestreo interna de un codificador. Puesto que también se requiere la misma operación en un descodificador, la descodificación se realiza a la misma frecuencia de muestreo interna que en el codificador. La figura 1 muestra un ejemplo en el que cambia la frecuencia de muestreo interna. En este ejemplo, la frecuencia de muestreo interna es de 16.000 Hz en una trama i, y es de 12.800 Hz en la trama i-1 anterior. Es necesario que el filtro de síntesis de predicción lineal que representa las características de una señal de entrada en la trama i-1 anterior se estime de nuevo después de volver a muestrear la señal de entrada a la frecuencia de muestreo interna cambiada de 16.000 Hz, o se convierta en uno correspondiente a la frecuencia de muestreo interna cambiada de 16.000 Hz. El motivo de que sea necesario que el filtro de síntesis de predicción lineal se calcule a una frecuencia de muestreo interna cambiada es obtener el estado interno correcto del filtro de síntesis de predicción lineal para la señal de entrada actual y realizar una interpolación con el fin de obtener un modelo que es temporalmente más uniforme.
Un procedimiento para obtener otro filtro de síntesis de predicción lineal en función de las características de un determinado filtro de síntesis de predicción lineal es calcular un filtro de síntesis de predicción lineal después de la conversión a partir de una respuesta de frecuencia deseada después de la conversión en un dominio de frecuencia tal como se muestra en la figura 2. En este ejemplo, se introducen coeficientes LSF como parámetro que representa el filtro de síntesis de predicción lineal. Pueden ser coeficientes LSP, coeficientes ISF, coeficientes ISP o coeficientes de reflexión, que generalmente se conocen como parámetros equivalentes a coeficientes de predicción lineal. En primer lugar, se calculan coeficientes de predicción lineal con el fin de obtener un espectro de potencia Y(w) del filtro de síntesis de predicción lineal a la primera frecuencia de muestreo interna (001). Esta etapa puede omitirse cuando se conocen los coeficientes de predicción lineal. A continuación se calcula el espectro de potencia Y(w) del filtro de síntesis de predicción lineal, que se determina mediante los coeficientes de predicción lineal obtenidos (002). Luego, se modifica el espectro de potencia obtenido para dar un espectro de potencia deseado Y’(w) (003). Se calculan coeficientes de autocorrelación a partir del espectro de potencia modificado (004). Se calculan coeficientes de predicción lineal a partir de los coeficientes de autocorrelación (005). La relación entre los coeficientes de autocorrelación y los coeficientes de predicción lineal se conoce como la ecuación de Yule-Walker, y el algoritmo de Levinson-Durbin se conoce bien como una solución de esa ecuación.
Este algoritmo es eficaz en la conversión de una frecuencia de muestreo del filtro de síntesis de predicción lineal descrito anteriormente. Esto se debe a que, aunque en un análisis de predicción lineal generalmente se usa una señal que está temporalmente adelantada a una señal en una trama que va a codificarse, que se denomina señal anticipada, la señal anticipada no puede usarse cuando se realiza un análisis de predicción lineal de nuevo en un descodificador.
Tal como se describió anteriormente, en la codificación de voz y audio con dos frecuencias de muestreo internas diferentes, se prefiere usar un espectro de potencia con el fin de convertir la frecuencia de muestreo interna de un filtro de síntesis de predicción lineal conocido. Sin embargo, puesto que el cálculo de un espectro de potencia es un cálculo complejo, existe el problema de que la cantidad de cálculo es grande.
Lista de referencias
Bibliografía no de patente
Documento no de patente 1: Recomendación G.718 de ITU-T
Documento no de patente 2: Speech coding and synthesis, W.B. Kleijn, K.K. Pariwal,et al.ELSEVIER.
Bibliografía de patente
Documento de patente 1: KR 20050113744 A
Documento de patente 2: WO 2013/068634 A1
Documento de patente 3: EP 1785985 A1
El documento de patente 1 divulga un sistema y procedimiento que transforma una señal de voz de banda estrecha en una señal de voz de banda ancha mediante el procesamiento de la señal a través de una secuencia de unidades de análisis que extrae características relevantes de la señal de voz recibida.
El documento de patente 2 divulga un procedimiento y aparato para codificación de voz o audio donde se determinan coeficientes de predicción lineal para una trama de audio a una tasa de muestreo y, además, los coeficientes de predicción se convierten en coeficientes de frecuencia espectral de línea.
El documento de patente 3 divulga un dispositivo de codificación escalable. El dispositivo obtiene un parámetro de frecuencia espectral de línea, LSP, de banda ancha a partir de un LSP de banda estrecha.
Sumario de la invención
Problema técnico
Tal como se describió anteriormente, existe el problema de que, en un esquema de codificación que tiene un filtro de síntesis de predicción lineal con dos frecuencias de muestreo internas diferentes, se requiere una gran cantidad de cálculo para convertir el filtro de síntesis de predicción lineal a una determinada frecuencia de muestreo interna en uno a una frecuencia de muestreo interna deseada.
Solución al problema
Para resolver el problema anterior, un dispositivo de conversión de coeficiente de predicción lineal según un aspecto de la presente invención es un dispositivo que incluye las características según la reivindicación 1. En esta configuración, es posible reducir de manera eficaz la cantidad de cálculo.
Un aspecto de la presente invención puede describirse como una invención de un dispositivo tal como se mencionó anteriormente y, además, también puede describirse como una invención de un procedimiento tal como sigue. Se encuentran bajo diferentes categorías, pero son sustancialmente la misma invención y logran una operación y efectos similares.
Específicamente, un procedimiento de conversión de coeficiente de predicción lineal según un aspecto de la presente invención es un procedimiento de conversión de coeficiente de predicción lineal según la reivindicación 2.
Efectos ventajosos de la invención
Es posible estimar un filtro de síntesis de predicción lineal después de la conversión de una frecuencia de muestreo interna con una cantidad menor de cálculo que con los medios existentes.
Breve descripción de los dibujos
La figura 1 es una vista que muestra la relación entre la conmutación de una frecuencia de muestreo interna y un filtro de síntesis de predicción lineal.
La figura 2 es una vista que muestra una conversión de coeficientes de predicción lineal.
La figura 3 es un diagrama de flujo de conversión 1.
La figura 4 es un diagrama de flujo de conversión 2.
La figura 5 es un diagrama de bloques de una realización de la presente invención.
La figura 6 es una vista que muestra la relación entre un círculo unitario y una función coseno.
Descripción de realizaciones
A continuación en el presente documento se describen realizaciones de un dispositivo, un procedimiento y un programa con referencia a los dibujos. Obsérvese que, en la descripción de los dibujos, los mismos elementos se indican mediante los mismos símbolos de referencia y se omite una descripción redundante de los mismos.
En primer lugar, a continuación en el presente documento se describen las definiciones requeridas para describir las realizaciones.
Una respuesta de un filtro de predicción lineal autorregresivo de orden N (que a continuación en el presente documento se denomina filtro de síntesis de predicción lineal)
1 1
( 1)A(z)1+ a¡z1H----- hanz"
puede adaptarse al espectro de potencia Y(w) calculando la autocorrelación
(2)Rk = —O2'T TTIT ru c o skadco,fr = 0JU,«
para un espectro de potencia conocido Y(w) a una frecuencia angular ue[-n, n] y, usando los coeficientes de autocorrelación de orden N, resolviendo los coeficientes de predicción lineal a1, a2,... , an mediante el procedimiento de Levinson-Durbin como procedimiento habitual, por ejemplo.
Tal generación de un modelo autorregresivo usando un espectro de potencia conocido puede usarse también para la modificación de un filtro de síntesis de predicción lineal 1/A(z) en el dominio de frecuencia. Esto se logra calculando el espectro de potencia de un filtro conocido
(3) Y(<y) = l/|4fy)|:
y modificando el espectro de potencia obtenido Y(w) mediante un procedimiento apropiado que sea adecuado con el propósito de obtener el espectro de potencia modificado Y’(w), después calculando los coeficientes de autocorrelación de Y’(w) mediante la ecuación anterior (2), y obteniendo los coeficientes de predicción lineal del filtro modificado 1/A’(z) mediante el algoritmo de Levinson-Durbin o un procedimiento similar.
Aunque la ecuación (2) no puede calcularse analíticamente excepto en casos sencillos, la aproximación rectangular puede usarse de la siguiente manera, por ejemplo.
(4)Rk *j-*pr(<p)cx>skq>
donde ü indica el número M de frecuencias colocadas a intervalos regulares a la frecuencia angular [-n, n]. Cuando se usa la propiedad simétrica de Y(-w)=-Y(w), la adición mencionada anteriormente solamente necesita evaluar la frecuencia angular w>e[0, n], que corresponde a la mitad superior del círculo unitario. Por tanto, en cuanto a la cantidad de cálculo se prefiere que la aproximación rectangular representada mediante la ecuación anterior (4) se altere de la siguiente manera
donde ü indica el número (N-2) de frecuencias colocadas a intervalos regulares a (0, n), excluyendo 0 y n.
A continuación en el presente documento se describen frecuencias espectrales de línea (que a continuación en el presente documento se denominan LSF) como medios equivalentes de expresión de coeficientes de predicción lineal.
La representación mediante LSF se usa en diversas técnicas de codificación de voz y audio para la cantidad característica de un filtro de síntesis de predicción lineal, y el funcionamiento y la codificación de un filtro de síntesis de predicción lineal. La LSF caracteriza de manera única el polinomio A(z) de orden N mediante el número n de parámetros que son diferentes respecto a coeficientes de predicción lineal. La LSF tiene características tales como que garantiza fácilmente la estabilidad de un filtro de síntesis de predicción lineal, se interpreta de manera intuitiva en el dominio de frecuencia, es menos probable que se vea afectada por errores de cuantificación que otros parámetros tales como coeficientes de predicción lineal y coeficientes de reflexión, es adecuada para interpolación y similares.
Con el propósito de una realización de la presente invención, las LSF se definen de la siguiente manera.
Una descomposición de LSF del polinomio A(z) de orden N puede representarse de la siguiente manera usando un desplazamiento de un número entero donde<k>> 0
(6) A(z)={P(z)+Q(z)}/2
dondeP(z)=A(z)+z"',cA(z'1) y
Q(z)=A(z)-z'“‘KA(z"1)
La ecuación (6) indica que P(z) es simétrico y Q(z) es antisimétrico de la siguiente manera
P(z)~z n KP(z"')
Q i^ r - z ^ Q iz ' )
Tal propiedad simétrica es una característica importante en la descomposición de LSF.
Resulta evidente que P(z) y Q(z) tienen cada uno una raíz en z=±1. Esas raíces evidentes son tal como se muestra en la tabla 1 como n y<k>.Por tanto, polinomios que representan las raíces evidentes de P(z) y Q(z) se definen comoP<t>(z)yQ<t>(z),respectivamente. Cuando P(z) no tiene una raíz evidente,P<t>(z)es 1. Lo mismo se aplica a Q(z).
Una LSF de A(z) es una raíz no trivial del ángulo de fase positivo de P(z) y Q(z). Cuando el polinomio A(z) es la fase mínima, es decir, cuando todas las raíces de A(z) están en el interior del círculo unitario, las raíces no triviales de P(z) y Q(z) se disponen de manera alterna en el círculo unitario. El número de raíces complejas de P(z) y Q(z) es mP y mo, respectivamente. La tabla 1 muestra la relación de mP y mo con el orden n y desplazamiento<k>.
Cuando las raíces complejas de P(z), que es el ángulo de fase positivo, se representan como
y las raíces de Q(z) se representan como
las posiciones de las raíces del polinomio A(z), que es la fase mínima, pueden representarse de la siguiente manera.
(7)O«D0<ü>1<...<e>mf+mg_l < x
En la codificación de voz y audio, se usa un desplazamiento<k>=0 o<k>=1. Cuando<k>=0, se denomina generalmente frecuencia espectral de inmitancia (ISF), y cuando<k>=1, se denomina generalmente LSF en un sentido más restringido que el de la descripción de una realización de la presente invención. Sin embargo, obsérvese que la representación que usa desplazamiento puede gestionar tanto ISF como LSF de manera unificada. En muchos casos, un resultado obtenido mediante LSF puede aplicarse tal cual a un<k>>0 dado o puede generalizarse.
Cuando<k>=0, la representación de LSF solamente tiene el número (mP+mo=n-1) de parámetros de frecuencia tal como se muestra en la tabla 1. Por tanto, se requiere un parámetro más para representar de manera única A(z), y se usa normalmente el n-ésimo coeficiente de reflexión (que a continuación en el presente documento se denomina Yn) de A(z). Este parámetro se introduce en la descomposición de LSF como el siguiente factor.
donde Yn es el n-ésimo coeficiente de reflexión de A(z) que comienza con Q(z), y es normalmente Yn=an.
Cuando<k>=1, el número (mp+mo=n) de parámetros se obtiene mediante descomposición de LSF, y es posible representar de manera única A(z). En este caso, u=1.
Tabla 1
Teniendo en cuenta el hecho de que raíces no evidentes, excluyendo raíces evidentes, son un par de números complejos en el círculo unitario y obtienen polinomios simétricos, se obtiene la siguiente ecuación.
Asimismo,
En esos polinomios,
representan completamente P(z) y Q(z) usando un desplazamiento dadokyvque se determina mediante el orden n de A(z). Esos coeficientes pueden obtenerse directamente a partir de las expresiones (6) y (8).
Cuando z=ejw y usando la siguiente relación
las expresiones (9) y (10) pueden representarse de la siguiente manera
donde
y
Específicamente, las LSF del polinomio A(z) son las raíces de R(w) y S(w) a la frecuencia angular we(0, n).
A continuación en el presente documento se describen los polinomios de Chebyshev del primer tipo, que se usan en la presente invención.
Los polinomios de Chebyshev del primer tipo se definen de la siguiente manera usando una relación de recurrencia
Obsérvese que los valores iniciales son Tü(x)=1 y T1(x)=x, respectivamente. Para x donde [-1, 1], los polinomios de Chebyshev pueden representarse de la siguiente manera
(16) Tk(x)=cos{k cos_1x} k=0,l,...
Una realización de la presente invención explica que la ecuación (15) proporciona un procedimiento sencillo para calcular coskw (donde k=2,3,...) que empieza con cosw y cos0=1. Específicamente, con el uso de la ecuación (16), la ecuación (15) se reescribe de la siguiente forma
( 17) cosk©=2cosocos(k-l)a )-cos(k-2)G) k= 2,3, ...
Cuando se usa la conversión w=arccosx, los primeros polinomios obtenidos a partir de la ecuación (15) son de la siguiente manera
Cuando las ecuaciones (13) y (14) para xe[-1,1] se reemplazan por esos polinomios de Chebyshev, se obtienen las siguientes ecuaciones
(18)R(x) = T,r(x)+PíT,Jx)+-+p„,rn
(19) S(*) =T,e(x) q{TmJ x )+ ■ ■-+qme 12
Cuando se conoce LSFw¡ para i=0,1,...,mP+mQ-1, se obtienen las siguientes ecuaciones usando el coseno de LSF x¡=cosw¡ (LSP)
(20)R(x)= r0(x - x0)(x -X2) ■ ■ ■ (x- x2mf J
Los coeficientes ro y so pueden obtenerse mediante una comparación de las ecuaciones (18) y (19) con (20) y (21) basándose en mp y mQ.
Las ecuaciones (20) y (21) se escriben como
(22)R(x) = rax'"'+rlx"'A+-+rm mP
(23) S (x )= s ,x " Q +s1/ ' ‘r‘ - í„8
Esos polinomios pueden calcularse de manera eficiente para una x dada mediante un procedimiento conocido como el procedimiento de Horner. El procedimiento de Horner obtiene R(x)=bo(x) mediante el uso de la siguiente relación recursiva
bk(x)=xbk+i(x)+rk
donde el valor inicial es
Lo mismo se aplica a S(x).
A continuación en el presente documento se describe un procedimiento de cálculo de los coeficientes de los polinomios de las ecuaciones (22) y (23) usando un ejemplo. En este ejemplo se supone que el orden de A(z) es 16 (n=16). Por consiguiente, mp=mQ=8 en este caso. Un desarrollo en serie de la ecuación (18) puede representarse en forma de la ecuación (22) mediante sustitución y simplificación mediante los polinomios de Chebyshev. Como resultado, los coeficientes del polinomio de la ecuación (22) se representan de la siguiente manera usando el coeficiente p del polinomio P(z).
f r0=128
r,=64pi
r2=-2564-32p2
r3=-118pi+16p3
J<r4=160-48p2+8p4>
r5=56pi-20p3+4p5
r6=-32+18p2-8p4+2p6
r7=-7pi+5p3-3p5+p7
vr8= l-p 2+p4-p6+p8/2
Los coeficientes de P(z) pueden obtenerse a partir de la ecuación (6). Este ejemplo puede aplicarse también al polinomio de la ecuación (23) usando la misma ecuación y usando los coeficientes de Q(z). Además, la misma ecuación para calcular los coeficientes de R(x) y S(x) también puede derivar fácilmente otro orden n y desplazamientok .
Además, cuando se conocen las raíces de las ecuaciones (20) y (21), pueden obtenerse coeficientes a partir de las ecuaciones (20) y (21).
A continuación en el presente documento se ofrece una descripción general del procesamiento según una realización de la presente invención.
Una realización de la presente invención proporciona un dispositivo y procedimiento de cálculo eficaces para, cuando se convierte un filtro de síntesis de predicción lineal calculado de antemano mediante un codificador o un descodificador a una primera frecuencia de muestreo en uno a una segunda frecuencia de muestreo, calcular el espectro de potencia del filtro de síntesis de predicción lineal y modificarlo a la segunda frecuencia de muestreo, y entonces obtener coeficientes de autocorrelación a partir del espectro de potencia modificado.
A continuación en el presente documento se describe un procedimiento de cálculo para el espectro de potencia de un filtro de síntesis de predicción lineal según una realización de la presente invención. El cálculo del espectro de potencia usa la descomposición de LSF de la ecuación (6) y las propiedades de los polinomios P(z) y Q(z). Usando la descomposición de LSF y los polinomios de Chebyshev descritos anteriormente, el espectro de potencia puede convertirse en el eje real del círculo unitario.
Con la conversión en el eje real, es posible lograr un procedimiento eficaz para calcular un espectro de potencia a una frecuencia arbitraria en we[0, n]. Esto se debe a que es posible eliminar funciones transcendentales dado que el espectro de potencia está representado por polinomios. Particularmente, es posible simplificar el cálculo del espectro de potencia a w=0, w=n/2 y w=n. La misma simplificación también es aplicable a LSF cuando uno cualquiera de P(z) o Q(z) es cero. Tales propiedades son ventajosas en comparación con FFT, que generalmente se usa para el cálculo del espectro de potencia.
Se conoce que el espectro de potencia de A(z) puede representarse de la siguiente manera usando descomposición de LSF.
La presente invención usa los polinomios de Chebyshev como una manera de calcular de manera más eficaz el espectro de potencia |A(w)|2 de A(z) en comparación con el caso de aplicar directamente la ecuación (26). Específicamente, el espectro de potencia |A(w)|2 se calcula en el eje real del círculo unitario tal como se representa mediante la siguiente ecuación, convirtiendo una variable en x=cosw y usando una descomposición de LSF mediante los polinomios de Chebyshev.
o(2)(3)
(1) a (4) corresponden a (1) a (4) en la tabla 1, respectivamente.
La ecuación (27) se demuestra de la siguiente manera.
Las siguientes ecuaciones se obtienen a partir de las ecuaciones (11) y (12).
|P(ffl)|2 =4jü(ffl)j2|Pr (ffl)|2
|Q(®)f=4u2|5(©)|2|2r (a))f
Los factores que representan las raíces evidentes de P(w) y Q(w) son respectivamente de la siguiente manera.
La aplicación de la sustitución cosw=x y cos2w=2x2-1 en |P<t>(w)| y |Q<t>(w)|, respectivamente, da la ecuación (27). Los polinomios R(x) y S(x) pueden calcularse mediante el procedimiento de Horner descrito anteriormente. Además, cuando se conoce x para calcular R(x) y S(x), puede omitirse el cálculo de una función trigonométrica almacenando x en una memoria.
El cálculo del espectro de potencia de A(z) puede simplificarse adicionalmente. En primer lugar, en el caso de calcular con LSF, uno de R(x) y S(x) en la correspondiente ecuación (27) es cero. Cuando el desplazamiento esk=1 y el orden n es un número par, la ecuación (27) se simplifica de la siguiente manera.
f
M <x)f = 2 ( l - x i.)jSf2(jc¡),ipar
2(l x:)R2(x() iimpar
Además, en el caso de w={0,n/2,n}, se simplifica cuando x={1,0,-1}. Las ecuaciones son de la siguiente manera cuando el desplazamiento esk=1 y el orden n es un número par, que son los mismos que en el ejemplo anterior. |A(to=0)|2=4R2( l)
| A(oo=7t/2) 12=2(R2 (0)+S2(0))
| A(<cü>=7<t>)|2=4S2(- 1)
También pueden obtenerse fácilmente resultados similares cuando el desplazamiento esk=0 y el orden n es un número impar.
A continuación se describe el cálculo de coeficientes de autocorrelación según una realización de la presente invención.
En la ecuación (5), cuando se define una frecuencia fi+=A,2A,...,(N-1)A donde N es un número impar y el intervalo de frecuencias es A=n/(N-1), el cálculo de autocorrelación contiene el espectro de potencia simplificado descrito anteriormente a w=0,tc/2,tc. Puesto que la normalización de coeficientes de autocorrelación mediante 1/N no afecta a coeficientes de predicción lineal que van a obtenerse como resultado, puede usarse cualquier valor positivo.
Sin embargo, el cálculo de la ecuación (5) todavía requiere coskw donde k=1,2,...,n para cada uno del número (N-2) de frecuencias. Por tanto, se usa la propiedad simétrica de coskw.
También se usan las siguientes características.
(29) cos(Jbr/2) = (1/2)(1+(-l)w ) ( - # /2j
donde indica el mayor número entero que no supera x. Obsérvese que la ecuación (29) se simplifica a 2, 0, -2, 0, 2, 0,... para k=0,1,2,...
Además, mediante conversión en x=cosw, los coeficientes de autocorrelación se mueven sobre el eje real del círculo unitario. Con este propósito, se introduce la variable X(x)=Y(arccos x). Esto posibilita el cálculo de coskw mediante el uso de la ecuación (15).
Dado lo anterior, la aproximación de autocorrelación de la ecuación (5) puede reemplazarse por la siguiente ecuación.
(30)
donde Tk(x)=2xTk.1(x)-Tk.2(x)
k=2,3,...,n, y Tü(x)=1, T1(x)=cosx tal como se describió anteriormente. Cuando se tiene en cuenta la propiedad simétrica de la ecuación (28), solamente es necesario calcular el último término de la ecuación (30) cuando xeA={cosA,cos2A,...,(N-3)A/2}, y el número (N-3)/2 de valores de coseno puede almacenarse en una memoria. La figura 6 muestra la relación entre la frecuencia A y la función coseno cuando N=31.
A continuación en el presente documento se describen un ejemplo informativo (que a continuación en el presente documento se denomina conversión 1) útil para comprender la presente invención y un ejemplo de la presente invención (que a continuación en el presente documento se denomina conversión 2). En el ejemplo informativo, se usa un caso de conversión de un filtro de síntesis de predicción lineal calculado a una primera frecuencia de muestreo de 16.000 Hz en uno a una segunda frecuencia de muestreo de 12.800 Hz (que a continuación en el presente documento se denomina conversión 1). Y en el ejemplo según la presente invención, se usa un caso de conversión de un filtro de síntesis de predicción lineal calculado a una primera frecuencia de muestreo de 12.800 Hz en uno a una segunda frecuencia de muestreo de 16.000 Hz (a continuación en el presente documento, conversión 2). Esas dos frecuencias de muestreo tienen una razón de 4:5 y se usan generalmente en codificación de voz y audio. Cada una de la conversión 1 y la conversión 2 de estos ejemplos se realiza en el filtro de síntesis de predicción lineal en la trama anterior cuando ha cambiado la frecuencia de muestreo interna, y puede realizarse en cualquiera de un codificador y un descodificador. Tal conversión se requiere para ajustar el estado interno correcto al filtro de síntesis de predicción lineal en la trama actual y para realizar una interpolación del filtro de síntesis de predicción lineal en función del tiempo.
A continuación en el presente documento se describe el procesamiento en estos ejemplos con referencia a los diagramas de flujo de las figuras 3 y 4.
Para calcular un espectro de potencia y coeficientes de autocorrelación usando un punto de frecuencia común en ambos casos de las conversiones 1 y 2, el número de frecuencias cuando una frecuencia de muestreo es de 12.800 Hz se determina como N<l>=1+(12.800 Hz/16.000 Hz)(N-1). Obsérvese que N es el número de frecuencias a una frecuencia de muestreo de 16.000 Hz. Tal como se describió anteriormente, se prefiere que N y N<l>sean ambos números impares con el fin de contener frecuencias a las que se simplifica el cálculo de un espectro de potencia y coeficientes de autocorrelación. Por ejemplo, cuando N es 31,41, 51, 61, el N<l>correspondiente es 25, 33, 41,49. A continuación se describe como ejemplo el caso en el que N=31 y N<l>=25 (etapa S000).
Cuando el número de frecuencias que van a usarse para el cálculo de un espectro de potencia y coeficientes de autocorrelación en el dominio en el que la frecuencia de muestreo es de 16.000 Hz es N=31, el intervalo de frecuencias es A=n/30, y el número de elementos requeridos para el cálculo de autocorrelación contenidos en A es (N-3)/2=14.
La conversión 1 (es decir, el ejemplo informativo útil para comprender la presente invención) que se realiza en un codificador y un descodificador en las condiciones anteriores se lleva a cabo en el siguiente procedimiento.
Determinar los coeficientes de los polinomios R(x) y S(x) usando las ecuaciones (20) y (21) a partir de las raíces obtenidas mediante un desplazamiento<k>=0 o<k>=1 y LSF que corresponden a un filtro de síntesis de predicción lineal obtenido a una frecuencia de muestreo de 16.000 Hz, que es la primera frecuencia de muestreo (etapa S001). Calcular el espectro de potencia del filtro de síntesis de predicción lineal a la segunda frecuencia de muestreo hasta 6.400 Hz, que es la frecuencia de Nyquist de la segunda frecuencia de muestreo. Puesto que esta frecuencia de corte corresponde a w=(4/5)u a la primera frecuencia de muestreo, se calcula un espectro de potencia usando la ecuación (27) a un número N<l>=25 de frecuencias en el lado inferior. Para el cálculo de R(x) y S(x), puede usarse el procedimiento de Horner para reducir el cálculo. No hay necesidad de calcular un espectro de potencia para las 6 (=N-N<l>) frecuencias restantes en el lado superior (etapa S002).
Calcular coeficientes de autocorrelación correspondientes al espectro de potencia obtenido en la etapa S002 usando la ecuación (30). En esta etapa, N en la ecuación (30) se ajusta a N<l>=25, que es el número de frecuencias a la segunda frecuencia de muestreo (etapa S003).
Derivar coeficientes de predicción lineal mediante el procedimiento de Levinson-Durbin o un procedimiento similar con el uso del coeficiente de autocorrelación obtenido en la etapa S003, y obtener un filtro de síntesis de predicción lineal a la segunda frecuencia de muestreo (etapa S004).
Convertir el coeficiente de predicción lineal obtenido en la etapa S004 en LSF (etapa S005).
La conversión 2 (es decir, el ejemplo según la presente invención) que se realiza en un codificador o un descodificador puede lograrse en el siguiente procedimiento, de la misma manera que la conversión 1.
Determinar los coeficientes de los polinomios R(x) y S(x) usando las ecuaciones (20) y (21) a partir de las raíces obtenidas mediante un desplazamiento k=0 o k=1 y LSF que corresponden a un filtro de síntesis de predicción lineal obtenido a una frecuencia de muestreo de 12.800 Hz, que es la primera frecuencia de muestreo (etapa S011). Calcular en primer lugar el espectro de potencia del filtro de síntesis de predicción lineal a la segunda frecuencia de muestreo hasta 6.400 Hz, que es la frecuencia de Nyquist de la primera frecuencia de muestreo. Esta frecuencia de corte corresponde a w=n, y se calcula un espectro de potencia usando la ecuación (27) a un número N<l>=25 de frecuencias. Para el cálculo de R(x) y S(x), puede usarse el procedimiento de Horner para reducir el cálculo. Para 6 frecuencias que superan 6.400 Hz a la segunda frecuencia de muestreo, se extrapola un espectro de potencia. Como ejemplo de extrapolación, puede usarse el espectro de potencia obtenido a la NL-ésima frecuencia (etapa S012).
Calcular coeficientes de autocorrelación correspondientes al espectro de potencia obtenido en la etapa S012 usando la ecuación (30). En esta etapa, N en la ecuación (30) se ajusta a N=31, que es el número de frecuencias a la segunda frecuencia de muestreo (etapa S013).
Derivar coeficientes de predicción lineal mediante el procedimiento de Levinson-Durbin o un procedimiento similar con el uso del coeficiente de autocorrelación obtenido en la etapa S013, y obtener un filtro de síntesis de predicción lineal a la segunda frecuencia de muestreo (etapa S014).
Convertir el coeficiente de predicción lineal obtenido en la etapa S014 en LSF (etapa S015).
La figura 5 es un diagrama de bloques en el ejemplo de la presente invención. Una unidad de conversión de espectro de potencia real 100 está compuesta por una unidad de cálculo de polinomios 101, una unidad de cálculo de espectro de potencia real 102 y una unidad de extrapolación de espectro de potencia real 103, y además se proporcionan una unidad de cálculo de autocorrelación real 104 y una unidad de cálculo de coeficiente de predicción lineal 105. Esto es para lograr las conversiones 1 y 2 descritas anteriormente. Al igual que en la descripción de los diagramas de flujo descritos anteriormente, la unidad de conversión de espectro de potencia real 100 recibe, como entrada, LSF que representan un filtro de síntesis de predicción lineal a la primera frecuencia de muestreo, y emite el espectro de potencia de un filtro de síntesis de predicción lineal deseado a la segunda frecuencia de muestreo. En primer lugar, la unidad de cálculo de polinomios 101 realiza el procesamiento en las etapas S001, S011 descritas anteriormente para calcular los polinomios R(x) y S(x) a partir de LSF. A continuación, la unidad de cálculo de espectro de potencia real 102 realiza el procesamiento en las etapas S002 o S012 para calcular el espectro de potencia. Además, la unidad de extrapolación de espectro de potencia real 103 realiza una extrapolación del espectro, que se realiza en la etapa S012 en el caso de la conversión 2. Mediante el procedimiento anterior, se obtiene el espectro de potencia de un filtro de síntesis de predicción lineal deseado a la segunda frecuencia de muestreo. Después de eso, la unidad de cálculo de autocorrelación real 104 realiza el procesamiento en las etapas S003 y S013 para convertir el espectro de potencia en coeficientes de autocorrelación. Finalmente, la unidad de cálculo de coeficiente de predicción lineal 105 realiza el procesamiento en las etapas S004 y S014 para obtener coeficientes de predicción lineal a partir de los coeficientes de autocorrelación. Obsérvese que, aunque este diagrama de bloques no muestra el bloque correspondiente a S005 y S015, la conversión a partir de los coeficientes de predicción lineal en LSF u otros coeficientes equivalentes puede lograrse fácilmente mediante una técnica conocida.
[Ejemplo alternativo]
Aunque los coeficientes de los polinomios R(x) y S(x) se calculan usando las ecuaciones (20) y (21) en las etapas S001 y S011 del ejemplo descrito anteriormente, el cálculo puede realizarse usando los coeficientes de los polinomios de las ecuaciones (9) y (10), que pueden obtenerse a partir de los coeficientes de predicción lineal. Además, los coeficientes de predicción lineal pueden convertirse a partir de coeficientes LSP o coeficientes ISP. Además, en el caso en el que algún procedimiento conoce un espectro de potencia a la primera frecuencia de muestreo o la segunda frecuencia de muestreo mediante, el espectro de potencia puede convertirse en uno a la segunda frecuencia de muestreo, y pueden omitirse las etapas S001, S002, S011 y S012.
Además, con el fin de asignar pesos en el dominio de frecuencia, puede deformarse un espectro de potencia, y pueden obtenerse coeficientes de predicción lineal a la segunda frecuencia de muestreo.
Lista de signos de referencia
100...unidad de conversión de espectro de potencia real, 101...unidad de cálculo de polinomios, 102...unidad de cálculo de espectro de potencia real, 103...unidad de extrapolación de espectro de potencia real, 104...unidad de cálculo de autocorrelación real, 105...unidad de cálculo de coeficiente de predicción lineal

Claims (1)

  1. REIVINDICACIONES
    Dispositivo de conversión de coeficiente de predicción lineal en codificación de voz y audio, configurado para convertir primeros coeficientes de predicción lineal calculados a una primera frecuencia de muestreo F1 en segundos coeficientes de predicción lineal a una segunda frecuencia de muestreo F2, donde F1 < F2, que comprende:
    unos medios (102) configurados para calcular un espectro de potencia usando descomposición de frecuencias espectrales de línea, LSF, y polinomios de Chebyshev, el espectro de potencia correspondiente a los segundos coeficientes de predicción lineal a la segunda frecuencia de muestreo F2 usando los primeros coeficientes de predicción lineal en puntos en el eje real del círculo unitario, correspondientes al número N1 de frecuencias diferentes, donde las frecuencias son entre 0 y F1, y se obtiene un número (N1-1)(F2-F1)/F1 de componentes de espectro de potencia correspondientes a frecuencias superiores a F1 e inferiores o iguales a F2 extrapolando el espectro de potencia calculado usando los primeros coeficientes de predicción lineal;
    unos medios (104) configurados para calcular, en puntos en el eje real del círculo unitario, coeficientes de autocorrelación a partir del espectro de potencia; y
    unos medios (105) configurados para convertir los coeficientes de autocorrelación en los segundos coeficientes de predicción lineal a la segunda frecuencia de muestreo F2.
    Procedimiento de conversión de coeficiente de predicción lineal en codificación de voz y audio realizado por un dispositivo que convierte primeros coeficientes de predicción lineal calculados a una primera frecuencia de muestreo F1 en segundos coeficientes de predicción lineal a una segunda frecuencia de muestreo F2, donde F1 < F2, que comprende:
    una etapa (S102) de calcular un espectro de potencia usando descomposición de LSF y polinomios de Chebyshev, el espectro de potencia correspondiente a los segundos coeficientes de predicción lineal a la segunda frecuencia de muestreo F2 usando los primeros coeficientes de predicción lineal en puntos en el eje real del círculo unitario, correspondientes al número N1 de frecuencias diferentes, donde las frecuencias son entre 0 y F1, y se obtiene un número (N1-1)(F2-F1)/F1 de componentes de espectro de potencia correspondientes a frecuencias superiores a F1 e inferiores o iguales a F2 extrapolando el espectro de potencia calculado usando los primeros coeficientes de predicción lineal;
    una etapa (S103) de calcular, en puntos en el eje real del círculo unitario, coeficientes de autocorrelación a partir del espectro de potencia; y
    una etapa (S104) de convertir los coeficientes de autocorrelación en los segundos coeficientes de predicción lineal a la segunda frecuencia de muestreo F2.
ES18205457T 2014-04-25 2015-04-16 Dispositivo de conversión de coeficiente de predicción lineal y procedimiento de conversión de coeficiente de predicción lineal Active ES2987686T3 (es)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014090781 2014-04-25

Publications (1)

Publication Number Publication Date
ES2987686T3 true ES2987686T3 (es) 2024-11-15

Family

ID=54332406

Family Applications (3)

Application Number Title Priority Date Filing Date
ES18205457T Active ES2987686T3 (es) 2014-04-25 2015-04-16 Dispositivo de conversión de coeficiente de predicción lineal y procedimiento de conversión de coeficiente de predicción lineal
ES24155958T Active ES3041986T3 (en) 2014-04-25 2015-04-16 Linear prediction coefficient conversion device and linear prediction coefficient conversion method for speech and audio coding
ES15783059T Active ES2709329T3 (es) 2014-04-25 2015-04-16 Dispositivo de conversión de coeficiente de predicción lineal y procedimiento de conversión de coeficiente de predicción lineal

Family Applications After (2)

Application Number Title Priority Date Filing Date
ES24155958T Active ES3041986T3 (en) 2014-04-25 2015-04-16 Linear prediction coefficient conversion device and linear prediction coefficient conversion method for speech and audio coding
ES15783059T Active ES2709329T3 (es) 2014-04-25 2015-04-16 Dispositivo de conversión de coeficiente de predicción lineal y procedimiento de conversión de coeficiente de predicción lineal

Country Status (22)

Country Link
US (4) US10163448B2 (es)
EP (4) EP3471095B1 (es)
JP (4) JP6018724B2 (es)
KR (4) KR101957276B1 (es)
CN (2) CN107945812B (es)
AU (4) AU2015251609B2 (es)
BR (1) BR112016024372B1 (es)
CA (4) CA2946824C (es)
DK (3) DK3471095T3 (es)
ES (3) ES2987686T3 (es)
FI (2) FI3471095T3 (es)
HK (1) HK1226547B (es)
HU (2) HUE066731T2 (es)
MX (2) MX352479B (es)
MY (1) MY167352A (es)
PH (1) PH12016502076B1 (es)
PL (3) PL3471095T3 (es)
PT (3) PT4343763T (es)
RU (4) RU2639656C1 (es)
TR (1) TR201901328T4 (es)
TW (1) TWI576831B (es)
WO (1) WO2015163240A1 (es)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4336500B8 (en) 2014-04-17 2025-11-26 VoiceAge EVS LLC Methods, encoder and decoder for linear predictive encoding and decoding of sound signals upon transition between frames having different sampling rates
US10897262B2 (en) * 2017-03-20 2021-01-19 Texas Instruments Incorporated Methods and apparatus to determine non linearity in analog-to-digital converters
CN111210837B (zh) * 2018-11-02 2022-12-06 北京微播视界科技有限公司 音频处理方法和装置

Family Cites Families (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5853352B2 (ja) * 1979-10-03 1983-11-29 日本電信電話株式会社 音声合成器
GB2059726B (en) * 1979-10-03 1984-06-27 Nippon Telegraph & Telephone Sound synthesizer
JP3707116B2 (ja) * 1995-10-26 2005-10-19 ソニー株式会社 音声復号化方法及び装置
JPH09230896A (ja) * 1996-02-28 1997-09-05 Sony Corp 音声合成装置
KR970063031U (ko) * 1996-05-07 1997-12-11 차량의 브레이크 패드
US6253172B1 (en) * 1997-10-16 2001-06-26 Texas Instruments Incorporated Spectral transformation of acoustic signals
FI119576B (fi) * 2000-03-07 2008-12-31 Nokia Corp Puheenkäsittelylaite ja menetelmä puheen käsittelemiseksi, sekä digitaalinen radiopuhelin
WO2002003377A1 (en) * 2000-07-05 2002-01-10 Koninklijke Philips Electronics N.V. Method of calculating line spectral frequencies
US7739052B2 (en) 2001-05-18 2010-06-15 International Business Machines Corporation Pattern discovery techniques for determining maximal irredundant and redundant motifs
US6895375B2 (en) * 2001-10-04 2005-05-17 At&T Corp. System for bandwidth extension of Narrow-band speech
US6829579B2 (en) * 2002-01-08 2004-12-07 Dilithium Networks, Inc. Transcoding method and system between CELP-based speech codes
US20040002856A1 (en) * 2002-03-08 2004-01-01 Udaya Bhaskar Multi-rate frequency domain interpolative speech CODEC system
US7027980B2 (en) * 2002-03-28 2006-04-11 Motorola, Inc. Method for modeling speech harmonic magnitudes
EP1383109A1 (fr) * 2002-07-17 2004-01-21 STMicroelectronics N.V. Procédé et dispositif d'encodage de la parole à bande élargie
KR100579797B1 (ko) * 2004-05-31 2006-05-12 에스케이 텔레콤주식회사 음성 코드북 구축 시스템 및 방법
BRPI0514940A (pt) * 2004-09-06 2008-07-01 Matsushita Electric Industrial Co Ltd dispositivo de codificação escalável e método de codificação escalável
KR100721537B1 (ko) * 2004-12-08 2007-05-23 한국전자통신연구원 광대역 음성 부호화기의 고대역 음성 부호화 장치 및 그방법
US7676362B2 (en) * 2004-12-31 2010-03-09 Motorola, Inc. Method and apparatus for enhancing loudness of a speech signal
US8135588B2 (en) * 2005-10-14 2012-03-13 Panasonic Corporation Transform coder and transform coding method
CN101322182B (zh) * 2005-12-05 2011-11-23 高通股份有限公司 用于检测音调分量的系统、方法和设备
CN101149927B (zh) * 2006-09-18 2011-05-04 展讯通信(上海)有限公司 在线性预测分析中确定isf参数的方法
CN101484935B (zh) * 2006-09-29 2013-07-17 Lg电子株式会社 用于编码和解码基于对象的音频信号的方法和装置
CN101266797B (zh) * 2007-03-16 2011-06-01 展讯通信(上海)有限公司 语音信号后处理滤波方法
CN101030375B (zh) * 2007-04-13 2011-01-26 清华大学 一种基于动态规划的基音周期提取方法
JP4691082B2 (ja) * 2007-09-11 2011-06-01 日本電信電話株式会社 線形予測モデル次数決定装置、線形予測モデル次数決定方法、そのプログラムおよび記録媒体
CN101388214B (zh) * 2007-09-14 2012-07-04 向为 一种变速率的声码器及其编码方法
ES2678415T3 (es) * 2008-08-05 2018-08-10 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato y procedimiento para procesamiento y señal de audio para mejora de habla mediante el uso de una extracción de característica
JP4918074B2 (ja) * 2008-08-18 2012-04-18 日本電信電話株式会社 符号化装置、符号化方法、符号化プログラム、及び記録媒体
CN101770777B (zh) * 2008-12-31 2012-04-25 华为技术有限公司 一种线性预测编码频带扩展方法、装置和编解码系统
JP4932917B2 (ja) * 2009-04-03 2012-05-16 株式会社エヌ・ティ・ティ・ドコモ 音声復号装置、音声復号方法、及び音声復号プログラム
KR101747917B1 (ko) * 2010-10-18 2017-06-15 삼성전자주식회사 선형 예측 계수를 양자화하기 위한 저복잡도를 가지는 가중치 함수 결정 장치 및 방법
CN102065291B (zh) * 2010-11-09 2012-11-21 北京工业大学 基于稀疏表示模型的图像解码方法
SE536046C2 (sv) * 2011-01-19 2013-04-16 Limes Audio Ab Metod och anordning för mikrofonval
WO2012103686A1 (en) * 2011-02-01 2012-08-09 Huawei Technologies Co., Ltd. Method and apparatus for providing signal processing coefficients
CN102325090B (zh) * 2011-09-21 2014-04-09 电子科技大学 一种网络流量估计方法
US9542149B2 (en) * 2011-11-10 2017-01-10 Nokia Technologies Oy Method and apparatus for detecting audio sampling rate
CN103366749B (zh) * 2012-03-28 2016-01-27 北京天籁传音数字技术有限公司 一种声音编解码装置及其方法
CN102867516B (zh) * 2012-09-10 2014-08-27 大连理工大学 一种采用高阶线性预测系数分组矢量量化的语音编解方法
CN103021405A (zh) * 2012-12-05 2013-04-03 渤海大学 基于music和调制谱滤波的语音信号动态特征提取方法
CN103050121A (zh) 2012-12-31 2013-04-17 北京迅光达通信技术有限公司 线性预测语音编码方法及语音合成方法
ES2770407T3 (es) * 2014-01-24 2020-07-01 Nippon Telegraph & Telephone Aparato, método, programa y soporte de registro de análisis predictivo lineal
EP2916319A1 (en) * 2014-03-07 2015-09-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Concept for encoding of information
KR102745244B1 (ko) * 2014-03-28 2024-12-20 삼성전자주식회사 선형예측계수 양자화방법 및 장치와 역양자화 방법 및 장치
EP4336500B8 (en) * 2014-04-17 2025-11-26 VoiceAge EVS LLC Methods, encoder and decoder for linear predictive encoding and decoding of sound signals upon transition between frames having different sampling rates
CN111757189B (zh) * 2014-12-01 2022-07-15 构造数据有限责任公司 用于连续介质片段识别的系统和方法

Also Published As

Publication number Publication date
JP6018724B2 (ja) 2016-11-02
MX352479B (es) 2017-11-27
KR101920297B1 (ko) 2018-11-20
FI4343763T3 (fi) 2025-10-07
AU2019280040A1 (en) 2020-01-16
KR20180123742A (ko) 2018-11-19
KR20180081181A (ko) 2018-07-13
DK3471095T3 (da) 2024-05-21
US10714108B2 (en) 2020-07-14
JP2018077524A (ja) 2018-05-17
US20170053655A1 (en) 2017-02-23
FI3471095T3 (fi) 2024-05-28
CN107945812B (zh) 2022-01-25
ES2709329T3 (es) 2019-04-16
PL4343763T3 (pl) 2025-10-27
BR112016024372B1 (pt) 2020-11-03
EP3136384B1 (en) 2019-01-02
CA2946824A1 (en) 2015-10-29
TR201901328T4 (tr) 2019-02-21
US20190080705A1 (en) 2019-03-14
CA3042070C (en) 2021-03-02
KR20170098989A (ko) 2017-08-30
CN106233381A (zh) 2016-12-14
JP2017058683A (ja) 2017-03-23
PH12016502076B1 (en) 2018-07-20
JPWO2015163240A1 (ja) 2017-04-13
PT3136384T (pt) 2019-04-22
RU2673691C1 (ru) 2018-11-29
WO2015163240A1 (ja) 2015-10-29
US20190080706A1 (en) 2019-03-14
ES3041986T3 (en) 2025-11-17
US10714107B2 (en) 2020-07-14
CA3042066A1 (en) 2015-10-29
CA2946824C (en) 2019-06-18
CN106233381B (zh) 2018-01-02
US11222644B2 (en) 2022-01-11
JP6715269B2 (ja) 2020-07-01
MX2016013797A (es) 2016-11-11
KR101878292B1 (ko) 2018-07-13
KR20160129904A (ko) 2016-11-09
RU2694150C1 (ru) 2019-07-09
MX377364B (es) 2025-03-10
RU2639656C1 (ru) 2017-12-21
RU2714390C1 (ru) 2020-02-14
CA3042069C (en) 2021-03-02
PL3136384T3 (pl) 2019-04-30
CA3042066C (en) 2021-03-02
CA3042069A1 (en) 2015-10-29
PT4343763T (pt) 2025-09-18
AU2019280041A1 (en) 2020-01-16
AU2019280041B2 (en) 2021-02-25
US10163448B2 (en) 2018-12-25
HUE072785T2 (hu) 2025-12-28
HK1226547B (zh) 2017-09-29
PL3471095T3 (pl) 2024-07-15
EP4583105A2 (en) 2025-07-09
JP6936363B2 (ja) 2021-09-15
US20200302942A1 (en) 2020-09-24
TW201606756A (zh) 2016-02-16
EP3136384A1 (en) 2017-03-01
DK3136384T3 (en) 2019-04-15
KR101957276B1 (ko) 2019-03-12
JP2020144397A (ja) 2020-09-10
JP6277245B2 (ja) 2018-02-07
EP4583105A3 (en) 2025-08-13
AU2015251609A1 (en) 2016-11-17
DK4343763T3 (da) 2025-09-29
EP3136384A4 (en) 2017-03-29
BR112016024372A2 (pt) 2017-08-15
EP4343763B1 (en) 2025-08-27
KR101772501B1 (ko) 2017-08-29
AU2018204572B2 (en) 2019-09-12
PT3471095T (pt) 2024-05-20
PH12016502076A1 (en) 2017-01-09
MY167352A (en) 2018-08-16
HUE066731T2 (hu) 2024-09-28
CA3042070A1 (en) 2015-10-29
AU2018204572A1 (en) 2018-07-19
EP3471095A1 (en) 2019-04-17
TWI576831B (zh) 2017-04-01
EP3471095B1 (en) 2024-05-01
EP4343763A3 (en) 2024-06-05
AU2019280040B2 (en) 2021-01-28
CN107945812A (zh) 2018-04-20
AU2015251609B2 (en) 2018-05-17
EP4343763A2 (en) 2024-03-27

Similar Documents

Publication Publication Date Title
ES2987686T3 (es) Dispositivo de conversión de coeficiente de predicción lineal y procedimiento de conversión de coeficiente de predicción lineal
HK1226547A1 (en) Linear prediction coefficient conversion device and linear prediction coefficient conversion method
ES2635026T3 (es) Aparato y procedimiento de codificación, procesamiento y decodificación de envolvente de señal de audio por división de la envolvente de la señal de audio utilizando cuantización y codificación de distribución