ES2938725T3 - Transposición armónica basada en bloque de subbanda mejorado de producto cruzado - Google Patents

Transposición armónica basada en bloque de subbanda mejorado de producto cruzado Download PDF

Info

Publication number
ES2938725T3
ES2938725T3 ES21204205T ES21204205T ES2938725T3 ES 2938725 T3 ES2938725 T3 ES 2938725T3 ES 21204205 T ES21204205 T ES 21204205T ES 21204205 T ES21204205 T ES 21204205T ES 2938725 T3 ES2938725 T3 ES 2938725T3
Authority
ES
Spain
Prior art keywords
subband
samples
analysis
input
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES21204205T
Other languages
English (en)
Inventor
Lars Villemoes
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dolby International AB
Original Assignee
Dolby International AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby International AB filed Critical Dolby International AB
Application granted granted Critical
Publication of ES2938725T3 publication Critical patent/ES2938725T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • G10L19/025Detection of transients or attacks for time/frequency resolution switching
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • G10L19/265Pre-filtering, e.g. high frequency emphasis prior to encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/04Time compression or expansion
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G3/00Gain control in amplifiers or frequency changers
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G3/00Gain control in amplifiers or frequency changers
    • H03G3/20Automatic control
    • H03G3/30Automatic control in amplifiers having semiconductor devices
    • H03G3/3089Control of digital or coded signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Golf Clubs (AREA)
  • Vibration Dampers (AREA)
  • Superconductors And Manufacturing Methods Therefor (AREA)
  • Complex Calculations (AREA)
  • Selective Calling Equipment (AREA)

Abstract

La invención proporciona una implementación eficiente de la reconstrucción de alta frecuencia (HFR) mejorada de productos cruzados, en la que se genera un nuevo componente en la frecuencia QΩ + rΩ0 sobre la base de los componentes existentes en Ω y Ω + Ω0. La invención proporciona una transposición armónica basada en bloques, en la que un bloque de tiempo de muestras de subbandas complejas se procesa con una modificación de fase común. La superposición de varias muestras modificadas tiene el efecto neto de limitar los productos de intermodulación no deseados, lo que permite utilizar una resolución de frecuencia más gruesa y/o un grado menor de sobremuestreo. En una realización, la invención incluye además una función de ventana adecuada para su uso con HFR mejorado de productos cruzados basado en bloques. Una realización de hardware de la invención puede incluir un banco de filtros de análisis (101), (Traducción automática con Google Translate, sin valor legal)

Description

DESCRIPCIÓN
Transposición armónica basada en bloque de subbanda mejorado de producto cruzado
Referencia cruzada a la solicitud relacionada
Esta solicitud es una solicitud divisional europea de la solicitud de patente europea 18198247.1 (referencia: D10079EP02), cuyo formulario EPO 1001 se presentó el 02 de octubre de 2018.
Campo técnico
La presente invención se refiere a sistemas de codificación de origen de audio que hacen uso de un método de transposición armónica para reconstrucción de alta frecuencia (HFR), a procesadores de efectos digitales, tales como excitadores que generan distorsión armónica para agregar brillo a una señal procesada y a extensores de tiempo que prolongan una duración de señal con contenido espectral mantenido.
Antecedentes de la invención
En el documento WO98/57436 A2, el concepto de transposición se estableció como un método para recrear una banda de alta frecuencia a partir de una banda de frecuencia más baja de una señal de audio. Se puede obtener un ahorro sustancial en la tasa de bits al utilizar este concepto en la codificación de audio. En un sistema de codificación de audio basado en HFR, se presenta una señal de bajo ancho de banda a un codificador de forma de onda central y las frecuencias más altas se regeneran utilizando transposición e información lateral adicional de tasa de bits muy baja que describe la forma espectral objetivo en el lado del decodificador. Para tasas de bits bajas, donde el ancho de banda de la señal codificada principal es estrecho, es cada vez más importante recrear una banda alta con características perceptualmente agradables. La transposición armónica definida en el documento WO98/57436 funciona muy bien para material musical complejo en una situación con baja frecuencia de cruce. El principio de una transposición armónica es que una sinusoide con frecuencia w se asigna a una sinusoide con frecuencia Q w donde Q$ > 1 es un entero que define el orden de la transposición. En contraste con esto, una modulación de banda lateral única (SSB) basada en HFR asigna una sinusoide con frecuencia w a una sinusoide con frecuencia w Aw donde Aw es un desplazamiento de frecuencia fijo. Dada una señal principal con un ancho de banda bajo, un artefacto de timbre disonante resultará de la transposición de SSB. Para alcanzar la mejor calidad de audio posible, los métodos de HFR armónicos de alta calidad del estado de la técnica emplean complejos bancos de filtros modulados con una resolución de frecuencia muy fina y un alto grado de sobremuestreo para alcanzar la calidad de audio requerida. La resolución fina es necesaria para evitar la distorsión de intermodulación no deseada que surge del tratamiento no lineal de sumas de sinusoides. Con subbandas suficientemente estrechas, los métodos de alta calidad apuntan a tener como máximo una sinusoide en cada una de las subbandas. Es necesario un alto grado de sobremuestreo en el tiempo para evitar la distorsión del tipo de alias y es necesario un cierto grado de sobremuestreo en la frecuencia para evitar ecos previos para señales transitorias. El inconveniente obvio es que la complejidad computacional llega a ser muy alta.
Otro inconveniente común asociado con los transpositores armónicos se hace evidente para las señales con una estructura periódica prominente. Tales señales son superposiciones de sinusoides relacionadas armónicamente con frecuencias Q,2Q,3Q,..., donde Q es la frecuencia fundamental. Tras la transposición armónica de orden Q$, las sinusoides de salida tienen frecuencias Q#Q,2Q#Q,3QQ, ..., que, en caso de Q$ > 1, es solo un subconjunto estricto de las series completamente armónicas deseadas. En términos de calidad de audio resultante, se percibirá habitualmente un tono “fantasma” correspondiente a la frecuencia fundamental transpuesta QQ. A menudo, la transposición armónica resulta en un carácter sonoro “metálico” de la señal de audio codificada y decodificada.
En el documento WO2010/0881892 A2, el método de productos cruzados se desarrolló para abordar el problema del tono fantasma anterior en el caso de una transposición de alta calidad. Dada la información parcial o total transmitida sobre el valor de frecuencia fundamental de la parte armónica dominante de la señal a transponer con mayor fidelidad, las modificaciones de subbanda no lineales se complementan con combinaciones no lineales de al menos dos subbandas de análisis diferentes, donde las distancias entre los índices de subbanda de análisis están relacionados con la frecuencia fundamental. El resultado es regenerar los parciales faltantes en la salida transpuesta, lo que, sin embargo, ocurre a un costo computacional considerable. Técnica anterior no de patentes: Huan Zhou et al: Finalization of CE on QMF based harmonic transposer, 93. MPEG Meeting, 26.07.2010-30.07.2010.
Resumen de la invención
En vista de los inconvenientes anteriores de los métodos de HFR disponibles, un objeto de la presente invención es proporcionar una implementación más eficiente de HFR mejorado de productos cruzados. En particular, es un objeto proporcionar un método tal que permita una reproducción de audio de alta fidelidad con un esfuerzo computacional reducido en comparación con las técnicas disponibles.
La presente invención logra al menos uno de estos objetos proporcionando dispositivos y métodos como se establece en las reivindicaciones independientes.
En un primer aspecto, la invención proporciona un sistema configurado para generar una señal extendida en tiempo y/o transpuesta en frecuencia a partir de una señal de audio de entrada. El sistema comprende:
• un banco de filtros de análisis configurado para derivar un número Y=2 de señales de subbanda de análisis a partir de la señal de entrada, en donde cada una de las señales de subbanda de análisis comprende una pluralidad de muestras de análisis de valor complejo, cada una con una fase y una magnitud;
• una unidad de procesamiento de subbanda configurada para determinar una señal de subbanda de síntesis a partir de las Y señales de subbanda de análisis utilizando un factor Q de transposición de subbanda y un factor S de extensión de subbanda, siendo al menos uno de Q y S mayor que uno, en donde la unidad de procesamiento de subbanda comprende:
° un extractor de bloque configurado para:
■ i) a partir de Y tramas de L muestras de entrada, cada una de las tramas se extrae de dicha pluralidad de muestras de análisis de valor complejo en una señal de subbanda de análisis y la longitud de la trama es L > 1; y
■ ii) aplicar un tamaño de salto de bloque de h muestras a dicha pluralidad de muestras de análisis, antes de formar una trama subsiguiente de L muestras de entrada, generando así una secuencia de tramas de las muestras de entrada;
° una unidad de procesamiento de trama no lineal configurada para generar; sobre la base de Y tramas correspondientes de muestras de entrada formadas por el extractor de bloque, una trama de muestras procesadas mediante la determinación de una fase y una magnitud para cada una de las muestras procesadas de la trama, en donde, para al menos una muestra procesada:
■ i) la fase de la muestra procesada se basa en una combinación lineal, con coeficientes (Ti, T2) enteros no negativos, de las respectivas fases de la correspondiente muestra de entrada en una primera y segunda trama de las muestras de entrada; y
■ ii) la magnitud de la muestra procesada como valor medio de la magnitud de la correspondiente muestra de entrada en una primera trama de las muestras de entrada y la magnitud de la correspondiente muestra de entrada en una segunda trama de las muestras de entrada; y
° una unidad de superposición y adición configurada para determinar la señal de subbanda de síntesis mediante la superposición y adición de las muestras de una secuencia de tramas de muestras procesadas; y • un banco de filtros de síntesis configurado para generar la señal extendida en tiempo y/o transpuesta en frecuencia a partir de la señal de subbanda de síntesis.
El sistema puede ser operable para cualquier valor entero positivo de Y. Sin embargo, es operable al menos para Y = 2.
Además, el extractor de bloque está configurado para derivar al menos una trama de muestras de entrada al submuestrear las muestras de análisis de valor complejo en una señal de subbanda de análisis.
En un segundo aspecto, la invención proporciona un método para generar una señal extendida en tiempo y/o transpuesta en frecuencia a partir de una señal de audio de entrada. El método comprende:
• derivar un número Y = 2 de señales de subbanda de análisis a partir de la señal de entrada, en donde cada una de las señales de subbanda de análisis comprende una pluralidad de muestras de análisis de valor complejo, cada una con una fase y una magnitud;
• formar Y tramas de L muestras de entrada, extrayéndose cada una de las tramas de dicha pluralidad de muestras de análisis de valor complejo en una señal de subbanda de análisis y siendo la longitud de trama L > 1;
• aplicar un tamaño de salto de bloque de h muestras a dicha pluralidad de muestras de análisis, antes de derivar una trama subsiguiente de L muestras de entrada, generando así una secuencia de tramas de las muestras de entrada;
• generar, en base a Y tramas correspondientes de las muestras de entrada, una trama de muestras procesadas determinando una fase y una magnitud para cada una de las muestras procesadas de la trama, en donde, para al menos una muestra procesada:
° la fase de la muestra procesada se basa en una combinación lineal, con coeficientes (71, T2) enteros no negativos, de las respectivas fases de la correspondiente muestra de entrada en una primera y segunda trama de las muestras de entrada; y
° la magnitud de la muestra procesada como valor medio de la magnitud de la correspondiente muestra de entrada en una primera trama de las muestras de entrada y la magnitud de la correspondiente muestra de entrada en una segunda trama de las muestras de entrada;
• determinar la señal de subbanda de síntesis mediante la superposición y la adición de las muestras de una secuencia de tramas de muestras procesadas; y
• generar la señal extendida en tiempo y/o transpuesta en frecuencia a partir de la señal de subbanda de síntesis.
Aquí, Y es un entero arbitrario mayor que uno. El sistema de acuerdo con el primer aspecto es operable para llevar a cabo el método al menos para Y = 2.
Además, las tramas de formación de las muestras de entrada incluyen muestras de análisis de valor complejo de submuestreo en una señal de subbanda de análisis.
Un tercer aspecto de la invención proporciona un producto de programa informático que incluye un medio legible por computadora (o soporte de datos) que almacena instrucciones de software para hacer que una computadora programable ejecute el método de acuerdo con el segundo aspecto.
La invención se basa en la constatación de que el concepto general de HFR mejorado de productos cruzados proporcionará mejores resultados cuando los datos se procesen organizados en bloques de muestras de subbandas complejas. Entre otras cosas, esto hace posible aplicar un desplazamiento de fase por trama a las muestras, que se ha encontrado que reduce los productos de intermodulación en algunas situaciones. También es posible aplicar un ajuste de magnitud, que puede llevar a efectos ventajosos similares. La implementación inventiva de HFR mejorado de productos cruzados incluye transposición armónica basada en bloque de subbanda, que puede reducir significativamente los productos de intermodulación. Por lo tanto, se puede utilizar un banco de filtros con una resolución de frecuencia más gruesa y/o un menor grado de sobremuestreo (como un banco de filtros de QMF) al tiempo que se conserva una alta calidad de salida. En el procesamiento basado en bloques de subbandas, un bloque de tiempo de muestras de subbandas complejas se procesa con una modificación de fase común y la superposición de varias muestras modificadas para crear una muestra de subbanda de salida tiene el efecto neto de suprimir los productos de intermodulación que, de otra manera, ocurriría cuando la señal de subbanda de entrada consta de varias sinusoides. La transposición basada en el procesamiento de subbanda basado en bloques tiene una complejidad computacional mucho menor que los transpositores de alta resolución y alcanza casi la misma calidad para muchas señales.
Para los fines de esta divulgación, se observa que en las realizaciones donde Y > 2, la unidad de procesamiento no lineal utiliza como entrada Y tramas “correspondientes” de muestras de entrada en el sentido de que las tramas son síncronas o casi síncronas. P. ej., las muestras en las respectivas tramas pueden relacionarse con intervalos de tiempo que tienen una superposición sustancial de tiempo entre las tramas. El término “correspondiente” también se utiliza con respecto a las muestras para indicar que éstas son síncronas o aproximadamente así. Además, el término “trama” se utilizará indistintamente con “bloque”. En consecuencia, el “tamaño de salto de bloque” puede ser igual a la longitud de trama (posiblemente ajustado con respecto al submuestreo, si se aplica) o puede ser más pequeño que la longitud de trama (posiblemente ajustado con respecto al submuestreo, si se aplica), en cuyo caso las tramas consecutivas se superponen en el sentido de que una muestra de entrada puede pertenecer a más de una trama. El sistema no genera necesariamente cada una de las muestras procesadas en una trama al determinar su fase y magnitud, en función de la fase y la magnitud de todas las Y tramas correspondientes de las muestras de entrada; sin apartarse de la invención, el sistema puede generar la fase y/o la magnitud de algunas muestras procesadas en base a un número menor de correspondientes muestras de entrada, o en base a solo en una muestra de entrada.
El banco de filtros de análisis puede ser un banco de filtros de espejo en cuadratura (QMF) o un banco de pseudo-QMF con cualquier número de tomas y puntos. Puede ser, por ejemplo, un banco de QMF de 64 puntos. El banco de filtros de análisis puede elegirse, además, de la clase de transformadas de Fourier discretas en ventana o transformadas ondículas. Ventajosamente, el banco de filtros de síntesis coincide con el banco de filtros de análisis al ser, respectivamente, un banco de QMF inverso, un banco de pseudo-QMF inverso, etc. Se sabe que dichos bancos de filtros pueden tener una resolución de frecuencia relativamente gruesa y/o un grado relativamente bajo de sobremuestreo. A diferencia de la técnica anterior, la invención puede realizarse utilizando tales componentes relativamente más simples sin que necesariamente adolezcan de una calidad de producción disminuida; por lo tanto, tales realizaciones representan una ventaja económica sobre la técnica anterior.
En una realización, uno o más de lo siguiente es cierto del banco de filtros de análisis:
• un paso de tiempo de análisis es AtA,
• una separación de frecuencias de análisis es A/A;
• el banco de filtros de análisis incluye N > 1 subbandas de análisis indexadas por un índice n = 0,...,N -1 de subbandas de análisis;
• una subbanda de análisis está asociada con una banda de frecuencia de la señal de entrada.
En una realización, uno o más de lo siguiente es cierto del banco de filtros de síntesis:
• un paso de tiempo de síntesis es Ats;
• una separación de frecuencias de síntesis es Afs;
• el banco de filtros de síntesis incluye M > 1 subbandas de análisis indexadas por un índice m = 0,...,M -1 de subbandas de análisis;
• una subbanda de síntesis está asociada con una banda de frecuencia de la señal extendida en tiempo y/o transpuesta en frecuencia.
En una realización, la unidad de procesamiento de subbanda, incluye una unidad de control de procesamiento cruzado para generar datos de control de procesamiento cruzado. Al especificar de este modo las características cuantitativas y/o cualitativas del procesamiento de subbanda, la invención logra flexibilidad y adaptabilidad. Los datos de control pueden especificar subbandas (p. ej., identificadas por índices) que difieren en frecuencia en una frecuencia fundamental de la señal de entrada. En otras palabras, los índices que identifican las subbandas pueden diferir en un entero que se aproxima a la relación de dicha frecuencia fundamental dividida por la separación de la frecuencia de análisis. Esto conducirá a una salida psicoacústicamente agradable, ya que los nuevos componentes espectrales generados por la transposición armónica serán compatibles con la serie de armónicas naturales.
En un desarrollo adicional de la realización anterior, los índices de subbanda de análisis (entrada) y de síntesis (salida) se eligen para satisfacer la ecuación (16) a continuación. Un parámetro a que aparece en esta ecuación lo hace aplicable a bancos de filtros apilados de forma extraña y uniforme. Cuando los índices de subbanda obtenidos como una solución aproximada (p. ej., mínimos cuadrados) a la ecuación (16), el nuevo componente espectral obtenido por transposición armónica, probablemente, sea compatible con la serie de armónicos naturales. Por lo tanto, es probable que el HFR proporcione una reconstrucción fiel de una señal original a la que se haya eliminado su contenido de alta frecuencia.
Un desarrollo adicional de la realización anterior proporciona una manera de seleccionar el parámetro r que aparece en la ecuación (16) y que representa el orden de la transposición del producto cruzado. Dado un índice m de subbanda de salida, cada uno de los valores del orden r de transposición determinará dos índices ni, n2 de subbanda de análisis. Este desarrollo adicional evalúa las magnitudes de las dos subbandas para un número r de opciones y selecciona ese valor que da maximizado el mínimo de las dos magnitudes de subbanda de análisis. Esta forma de seleccionar índices puede evitar la necesidad de restaurar suficiente magnitud al amplificar los componentes débiles de la señal de entrada, lo que puede llevar a una calidad de salida deficiente. A este respecto, las magnitudes de subbanda pueden calcularse de manera en sí conocida, tal como por la raíz cuadrada de las muestras de entrada al cuadrado que forman una trama (bloque) o parte de una trama. Una magnitud de subbanda también puede calcularse como una magnitud de una muestra central o casi central en una trama. Un cálculo tal puede proporcionar una medida de magnitud simple pero adecuada.
Una subbanda de síntesis puede recibir contribuciones de instancias de transposición armónica de acuerdo con el procesamiento directo y el procesamiento basado en productos cruzados. A este respecto, se pueden aplicar criterios de decisión para determinar si se utilizará o no una posibilidad particular de regeneración de un parcial faltante mediante procesamiento basado en productos cruzados. Por ejemplo, este desarrollo adicional puede adaptarse para abstenerse de utilizar una unidad de procesamiento de subbanda cruzado si se cumple una de las siguientes condiciones:
a) la relación de la magnitud Ms de la subbanda de análisis del término de origen directo que produce la subbanda de síntesis y la menor magnitud Me en un par óptimo de términos de origen cruzados que producen la subbanda de síntesis, es mayor que una constante predeterminada;
b) la subbanda de síntesis ya recibe una contribución significativa de una unidad de procesamiento directo; c) una frecuencia Qo fundamental es menor que la separación úfA del banco de filtro de análisis.
En una realización, la invención incluye el submuestreo (decimación) de la señal de entrada. De hecho, una o más de las tramas de las muestras de entrada pueden determinarse submuestreando las muestras de análisis de valor complejo en una subbanda, como puede hacerlo el extractor de bloque.
Los factores de submuestreo a aplicar pueden satisfacer la ecuación (15) a continuación. No se permite que ambos factores de submuestreo sean cero, ya que esto corresponde a un caso trivial. La ecuación (15) define una relación entre los factores Di, D2 de submuestreo con el factor S de extensión de subbanda y el factor Q de transposición de subbanda y, además, con los coeficientes Ti, T2 de fase que aparecen en una expresión (13) para determinar la fase de una muestra procesada. Esto asegura una coincidencia de la fase de las muestras procesadas con los otros componentes de la señal de entrada, a la que se agregarán las muestras procesadas. Las tramas de las muestras procesadas pueden establecerse en ventanas antes de que se superpongan y se agreguen. Una unidad de establecimiento de ventana puede adaptarse para aplicar una función de ventana de longitud finita a tramas de muestras procesadas. Las funciones de ventana adecuadas se enumeran en las reivindicaciones adjuntas.
El inventor se ha dado cuenta de que los métodos de productos cruzados del tipo dado a conocer en el documento WO2010/081892 no son totalmente compatibles desde el principio con las técnicas de procesamiento basadas en bloque de subbanda. Aunque tal método puede aplicarse satisfactoriamente a una de las muestras de subbandas en un bloque, podría llevar a artefactos de solapamiento si se extendieran de manera directa a las otras muestras del bloque. Para este fin, una realización aplica funciones de ventana que comprenden muestras de ventana que se suman, cuando se ponderan con pesos complejos y se desplazan en un tamaño de salto, a una secuencia sustancialmente constante. El tamaño del salto puede ser el producto del tamaño h del salto del bloque y el factor S de extensión de subbanda. El uso de tales funciones de ventana reduce el impacto de los artefactos de superposición. Alternativa o adicionalmente, tales funciones de ventana también pueden permitir otras medidas para reducir artefactos, tales como rotaciones de fase de muestras procesadas.
Preferiblemente, los pesos complejos consecutivos, que se aplican para evaluar la condición en las muestras de ventana, difieren solo en una rotación de fase fija. Además, preferiblemente, dicha rotación de fase fija es proporcional a una frecuencia fundamental de la señal de entrada. La rotación de fase también puede ser proporcional al orden de la transposición de productos cruzados a aplicar y/o al parámetro de transposición física y/o a la diferencia de los factores de submuestreo y/o al progreso del tiempo de análisis. La rotación de fase puede darse por la ecuación (21), al menos en un sentido aproximado.
En un ejemplo, la presente invención permite la transposición armónica mejorada de productos cruzados modificando el establecimiento de ventanas de síntesis en respuesta a un parámetro de frecuencia fundamental. En un ejemplo, las tramas sucesivas de muestras procesadas se agregan con una cierta superposición. Para lograr la superposición adecuada, las tramas de las tramas procesadas se desplazan adecuadamente por un tamaño de salto, que es el tamaño h de salto de bloque incrementado por el factor S de extensión de subbanda. Por lo tanto, si la superposición de las tramas consecutivas de las muestras de entrada es L - h, entonces la superposición de tramas consecutivas de muestras procesadas puede ser S(L - h).
En un ejemplo ilustrativo que no es parte de la invención, es operable no solo para generar una muestra procesada en base a Y = 2 muestras de entrada, sino también en base solo a Y = 1 muestra. Por lo tanto, el sistema puede regenerar parciales faltantes no solo mediante un enfoque basado en productos cruzados (tal como la ecuación (13)), sino también mediante un enfoque de subbanda directa (tal como la ecuación (5) u (11)). Preferiblemente, una unidad de control está configurada para controlar el funcionamiento del sistema, incluyendo el enfoque que se utilizará para regenerar un parcial faltante particular.
El sistema puede estar, además, adaptado para generar una muestra procesada sobre la base de más de tres muestras, es decir, para Y > 3. Por ejemplo, una muestra procesada puede obtenerse mediante múltiples casos de transposición armónica basada en productos cruzados, puede contribuir a una muestra procesada por múltiples instancias de procesamiento directo de subbanda, o por una combinación de transposición de productos cruzados y transposición directa. Esta opción de adaptar el método de transposición proporciona un HFR potente y versátil. En consecuencia, el ejemplo ilustrativo es operable para llevar a cabo el método para Y = 3, 4, 5, etc.
El sistema está configurado para determinar una muestra procesada como un número complejo que tiene una magnitud que es un valor medio de las respectivas magnitudes de las correspondientes muestras de entrada. El valor medio puede ser una media aritmética (ponderada), geométrica (ponderada) o armónica (ponderada) de dos o más muestras de entrada. En el caso Y = 2, la media se basa en dos muestras de entrada complejas. Preferiblemente, la magnitud de la muestra procesada es un valor geométrico ponderado. Más preferiblemente, el valor geométrico es ponderado por los parámetros p y 1 - p, como en la ecuación (13). En este caso, el parámetro p de ponderación de la magnitud geométrica es un número real inversamente proporcional al factor Q de transposición de subbanda. El parámetro p puede, además, ser inversamente proporcional al factor S de extensión.
El sistema está adaptado para determinar una muestra procesada como un número complejo que tiene una fase que es una combinación lineal de respectivas fases de correspondientes muestras de entrada en las tramas de las muestras de entrada. En particular, la combinación lineal puede comprender fases relacionadas con dos muestras (Y = 2) de entrada. La combinación lineal de dos fases puede aplicar coeficientes enteros no cero, la suma de los cuales es igual al factor S de extensión multiplicado por el factor Q de transposición de subbanda. Opcionalmente, la fase obtenida mediante dicha combinación lineal se ajusta adicionalmente mediante un parámetro de corrección de fase fija. La fase de la muestra procesada puede darse por la ecuación (13).
En un ejemplo, el extractor de bloque (o un paso análogo en un método de acuerdo con la invención), está adaptado para interpolar dos o más muestras de análisis de una señal de subbanda de análisis para obtener una muestra de entrada que se incluirá en una trama (bloque). Dicha interpolación puede permitir la mezcla descendente de la señal de entrada por un factor no entero. Las muestras de análisis a interpolar pueden o no ser consecutivas.
En un ejemplo, la configuración del procesamiento de subbanda puede controlarse mediante datos de control proporcionados desde fuera de la unidad que efectúa el procesamiento. Los datos de control pueden referirse a propiedades acústicas momentáneas de la señal de entrada. Por ejemplo, el propio sistema puede incluir una sección adaptada para determinar las propiedades acústicas momentáneas de la señal, tal como la frecuencia fundamental (dominante) de la señal. El conocimiento de la frecuencia fundamental proporciona una guía para seleccionar las subbandas de análisis a partir de las cuales se derivarán las muestras procesadas. Adecuadamente, la separación de las subbandas de análisis es proporcional a dicha frecuencia fundamental de la señal de entrada. Como alternativa, los datos de control también pueden proporcionarse desde fuera del sistema, preferiblemente al incluirlos en un formato de codificación adecuado para la transmisión como un flujo de bits a través de una red de comunicación digital. Además de los datos de control, dicho formato de codificación puede incluir información relacionada con los componentes de baja frecuencia de una señal (p. ej., componentes en la pos. 701 en la Fig. 7). Sin embargo, en aras de la economía de ancho de banda, el formato preferiblemente no incluye información completa relacionada con componentes de alta frecuencia (pos. 702), que puede regenerarse por la invención. La invención puede proporcionar en particular un sistema de decodificación con una unidad de recepción de datos de control configurada para recibir dichos datos de control, ya sea incluidos en un flujo de bits recibido que también codifica la señal de entrada o recibidos como una señal separada o flujo de bits.
Una realización proporciona una técnica para realizar de manera eficiente los cálculos ocasionados por el método inventivo. Para este fin, una implementación de hardware puede incluir un prenormalizador para reescalar las magnitudes de las correspondientes muestras de entrada en algunas de las Y tramas en las que se basará una trama de muestras procesadas. Después de tal reescalado, se puede calcular una muestra procesada como un producto complejo (ponderado) de muestras reescaladas y, posiblemente, de entrada no reescaladas. Una muestra de entrada que aparece como un factor reescalado en el producto, normalmente no necesita volver a aparecer como un factor no reescalado. Con la posible excepción del parámetro G de corrección de fase, es posible evaluar la ecuación (13) como un producto de muestras de entrada complejas (posiblemente reescaladas). Esto representa una ventaja computacional en comparación con tratamientos separados de la magnitud y de la fase de una muestra procesada.
En un ejemplo, un sistema configurado para el caso Y = 2 comprende dos extractores de bloque adaptados para formar una trama de muestras de entrada cada una, en operación paralela.
En un ejemplo ilustrativo adicional que no es parte de la invención que representa Y > 3, un sistema puede comprender una pluralidad de unidades de procesamiento de subbanda, cada una de las cuales está configurada para determinar una señal de subbanda de síntesis intermedia utilizando un factor de transposición de subbanda diferente y/o un factor de extensión de subbanda diferente y/o un método de transposición que difiere por basarse en productos cruzados o directo. Las unidades de procesamiento de subbanda pueden estar dispuestas en paralelo, para operación en paralelo. En esta realización, el sistema puede comprender además una unidad de fusión dispuesta aguas abajo de las unidades de procesamiento de subbanda y aguas arriba del banco de filtros de síntesis. La unidad de fusión puede adaptarse para fusionar (p. ej., mezclando juntas) las correspondientes señales de subbanda de síntesis intermedias para obtener la señal de subbanda de síntesis. Como ya se señaló, la subbanda de síntesis intermedia que se fusiona puede haberse obtenido por transposición armónica directa y basada en productos cruzados. Un sistema de acuerdo con el ejemplo puede comprender, además, un decodificador central para decodificar un flujo de bits en una señal de entrada. También puede comprender una unidad de procesamiento de HFR adaptada para aplicar información de banda espectral, en particular mediante la realización de conformación espectral. El funcionamiento de la unidad de procesamiento de HFR puede controlarse mediante información codificada en el flujo de bits.
Un ejemplo proporciona HFR de señales multidimensionales, p. ej., en un sistema para reproducir audio en un formato estéreo que comprende Z canales, como izquierda, derecha, centro, envolvente, etc. En una posible implementación para procesar una señal de entrada con una pluralidad de canales, las muestras procesadas de cada uno de los canales se basan en el mismo número de muestras de entrada, aunque el factor S de extensión y el factor Q de transposición para cada una de las bandas pueden variar entre canales. Para este fin, la implementación puede comprender un banco de filtros de análisis para producir Y señales de subbanda de análisis desde cada uno de los canales, una unidad de procesamiento de subbanda para generar Z señales de subbanda y un banco de filtros de síntesis para generar Z señales extendidas en tiempo y/o transpuestas en frecuencia que forman la señal de salida.
En variaciones del ejemplo anterior, la señal de salida puede comprender canales de salida que se basan en diferentes números de señales de subbanda de análisis. Por ejemplo, puede ser aconsejable dedicar una mayor cantidad de recursos computacionales a HFR de canales acústicamente prominentes; p. ej., los canales que se reproducirán mediante fuentes de audio ubicadas frente a un oyente pueden favorecerse sobre canales envolventes o traseros.
Se enfatiza que la invención se refiere a todas las combinaciones como se especifica en las reivindicaciones adjuntas.
Breve descripción de los dibujos
La presente invención se describirá ahora por medio de ejemplos ilustrativos, sin limitar el alcance de la invención, con referencia a los dibujos adjuntos.
La Fig. 1 ilustra el principio de la transposición armónica basada en bloques de subbandas.
La Fig. 2 ilustra la operación del procesamiento de bloque de subbanda no lineal con una entrada de subbanda. La Fig. 3 ilustra la operación del procesamiento de bloque de subbanda no lineal con dos entradas de subbanda. La Fig. 4 ilustra la operación de la transposición armónica basada en subbanda mejorada de productos cruzados. La Fig. 5 ilustra un escenario de ejemplo para la aplicación de la transposición basada en bloques de subbanda utilizando varios órdenes de transposición en un códec de audio mejorado de HFR.
La Fig. 6 ilustra un escenario de ejemplo para la operación de una transposición basada en bloques de subbandas de orden múltiple que aplica un banco de filtros de análisis de QMF de 64 bandas.
Las Figs. 7 y 8 ilustran los resultados experimentales del método de transposición basado en bloques de subbandas descrito.
La Fig. 9 muestra un detalle de la unidad de procesamiento no lineal de la Fig. 2, que incluye un prenormalizador y un multiplicador.
Descripción de las realizaciones
Las realizaciones descritas a continuación son meramente ilustrativas de los principios de la presente invención.
Transposición armónica basada en bloque de subbanda mejorado de productos cruzados. Se entiende que las modificaciones y variaciones de las disposiciones y los detalles descritos en el presente documento serán evidentes para otros expertos en la técnica. Es la intención, por lo tanto, que la invención esté limitada solo por el alcance de las reivindicaciones de patente adjuntas y no por los detalles específicos presentados a modo de descripción y explicación de las realizaciones en el presente documento.
La Fig. 1 ilustra el principio de la transposición basada en bloque de subbanda, extensión de tiempo o una combinación de transposición y extensión de tiempo. La señal del dominio del tiempo de entrada se alimenta a un banco 101 de filtros de análisis que proporciona una multitud de señales de subbanda de valor complejo. Éstas se envían a la unidad 102 de procesamiento de subbanda, cuya operación puede verse influida por los datos 104 de control. Cada una de las subbandas de salida se puede obtener del procesamiento de una o de dos subbandas de entrada, o incluso como una superposición del resultado de varias de dichas subbandas procesadas. La multitud de subbandas de salida de valor complejo se alimenta a un banco 103 de filtros de síntesis, que a su vez genera la señal del dominio del tiempo modificada. Los datos 104 de control opcionales describen la configuración y los parámetros del procesamiento de subbanda, que pueden adaptarse a la señal a transponer. Para el caso de la transposición mejorada de productos cruzados, estos datos pueden transportar información relacionada con una frecuencia fundamental dominante.
La Fig. 2 ilustra la operación del procesamiento de bloque de subbanda no lineal con una entrada de subbanda. Dados los valores objetivo de la extensión de tiempo y de la transposición física, y los parámetros físicos de los bancos 101 y 103 de filtros de análisis y de síntesis, se deducen los parámetros de la extensión de tiempo y de la transposición de subbanda, así como un índice de subbanda de origen para cada uno de los índices de subbanda objetivo. El objetivo del procesamiento de bloque de subbanda es realizar la correspondiente transposición, la extensión de tiempo o una combinación de transposición y de extensión de tiempo de la señal de subbanda de origen de valor complejo para producir la señal de subbanda objetivo.
Un extractor 201 de bloque muestrea una trama finita de muestras de la señal de entrada de valor complejo. La trama se define mediante una posición de puntero de entrada y el factor de transposición de subbanda. Esta trama se somete a un procesamiento no lineal en la sección 202 de procesamiento y luego se establecen ventanas con ventanas de longitud finita y posiblemente variable en la sección 203 de establecimiento de ventana. Las muestras resultantes se agregan a las muestras de salida anteriores en una unidad 204 de superposición y adición donde la posición de la trama de salida se define por una posición del puntero de salida. El puntero de entrada se incrementa en una cantidad fija y el puntero de salida se incrementa por el factor de extensión de subbanda multiplicado por la misma cantidad. Una iteración de esta cadena de operaciones producirá una señal de salida cuya duración será el factor de extensión de subbanda multiplicado por la duración de la señal de la subbanda de entrada, hasta la longitud de la ventana de síntesis, y con frecuencias complejas transpuestas por el factor de transposición de subbanda. La señal 104 de control puede influir en cada una de las tres secciones 201, 202, 203.
La Fig. 3 ilustra la operación del procesamiento de bloque de subbanda no lineal con dos entradas de subbanda. Dados los valores objetivo de la extensión de tiempo y de la transposición física y los parámetros físicos de los bancos 101 y 103 de filtros de análisis y de síntesis, se deducen los parámetros de la extensión de tiempo y de la transposición de subbanda, así como dos índices de subbanda de origen para cada uno de los índices de subbanda objetivo. En caso de que el procesamiento de bloque de subbanda no lineal se utilice para la creación de parciales faltantes mediante la adición de productos cruzados, la configuración de las secciones 301-1, 301-2, 302, 303, así como los valores de los dos índices de subbanda de origen pueden depender de la salida 403 de una unidad 404 de control de procesamiento cruzado. El objetivo del procesamiento de bloque de subbanda es realizar la correspondiente transposición, la extensión de tiempo o una combinación de transposición y de extensión de tiempo de la combinación de las dos señales de subbanda de origen de valor complejo para producir la señal de subbanda objetivo. Un primer extractor 301-1 de bloques muestrea una trama de tiempo finito de muestras de la primera subbanda de origen de valor complejo y el segundo extractor 301-2 de bloques muestrea una trama finita de muestras de la segunda subbanda de origen de valor complejo. Las tramas están definidas por una posición de puntero de entrada común y el factor de transposición de subbanda. Las dos tramas se someten a un procesamiento no lineal en 302 y, luego, se establecen ventanas por una ventana de longitud finita en la sección 303 de establecimiento de ventana. La unidad 204 de superposición y adición puede tener una estructura similar o idéntica a la que se muestra en la Fig. 2. Una iteración de esta cadena de operaciones producirá una señal de salida cuya duración es el factor de extensión de subbanda multiplicado por la más larga de las dos señales de subbanda de entrada (hasta la longitud de la ventana de síntesis). En caso de que las dos señales de subbanda de entrada transporten las mismas frecuencias, la señal de salida tendrá frecuencias complejas transpuestas por el factor de transposición de subbanda. En el caso de que las dos subbandas las señales transporten diferentes frecuencias, la presente invención enseña que el establecimiento de ventana 303 puede adaptarse para generar una señal de salida que tiene una frecuencia objetivo adecuada para la generación de parciales faltantes en la señal transpuesta.
La Fig. 4 ilustra el principio de la transposición basada en bloque de subbanda mejorada de productos cruzados, extensión de tiempo, o una combinación de transposición y de extensión de tiempo. La unidad 401 de procesamiento de subbanda directa puede ser del tipo ya descrito con referencia a la Fig. 2 (sección 202) o la Fig. 3. Una unidad 402 de procesamiento de subbanda cruzada también se alimenta con la multitud de señales de subbanda de valor complejo y su funcionamiento se ve influido por los datos 403 de control de procesamiento cruzado. La unidad 402 de procesamiento de subbanda cruzado realiza el procesamiento de bloque de subbanda no lineal del tipo con dos entradas de subbanda descritas en la Fig. 3, y las subbandas objetivo de salida se agregan a las del procesamiento 401 directo de subbandas en el sumador 405. Los datos 403 de control de procesamiento cruzado pueden variar para cada una de las posiciones del puntero de entrada y consisten en al menos
• una lista seleccionada de índices de subbanda objetivo;
• un par de índices de subbanda de origen para cada índice de subbanda objetivo seleccionado; y
• una ventana de síntesis de longitud finita.
Una unidad 404 de control de procesamiento de cruzado proporciona estos datos 403 de control procesamiento cruzado dada una parte de los datos 104 de control que describen una frecuencia fundamental y la multitud de señales de subbanda de valor complejo emitidas desde el banco 101 de filtros de análisis. Los datos 104 de control, también pueden transportar otros parámetros de configuración dependientes de la señal que influyen en el procesamiento de productos cruzados.
En el siguiente texto, se esbozará una descripción de los principios del bloque de subbanda de productos cruzados mejorados basado en la extensión de tiempo y la transposición, con referencia a las Figs. 1-4, y agregando la terminología matemática apropiada.
Los dos principales parámetros de configuración del transpositor de armónicos en general y/o el extensor de tiempo son
S#: el factor de extensión de tiempo físico deseado; y
Q f el factor de transposición física deseado.
Los bancos 101 y 103 de filtros pueden ser de cualquier tipo exponencial complejo modulado tal como QMF o una DFT de ventana o una transformada ondícula. El banco 101 de filtros de análisis y el banco 103 de filtros de síntesis se pueden apilar de manera uniforme o extraña en la modulación y se pueden definir a partir de una amplia gama de prototipos de filtros y/o ventanas. Si bien todas estas opciones de segundo orden afectan a los detalles en el diseño posterior, tal como las correcciones de fase y gestión de la asignación de subbandas, los principales parámetros de diseño del sistema para el procesamiento de subbandas se pueden derivar típicamente a partir de los dos cocientes úts/ñtA y Afs/Afñ de los siguientes cuatro parámetros de banco de filtros, todos medidos en unidades físicas. En los cocientes anteriores,
AtA es el paso de tiempo de muestra de subbanda o paso de tiempo del banco 101 de filtros de análisis (p. ej., medido en segundos [s]);
AfA es la separación de subbanda de frecuencia del banco 101 de filtros de análisis (p. ej., medida en hercios [1/s]);
Ats es el paso de tiempo de muestra de subbanda o extensión de tiempo del banco 103 de filtros de síntesis (p. ej., medido en segundos [s]); y
Afs es la separación de frecuencia de subbanda del banco 103 de filtros de síntesis (p. ej., medido en hercios [1/s]).
Para la configuración de la unidad 102 de procesamiento de subbanda, deben calcularse los siguientes parámetros:
• S: el factor de extensión de subbanda, es decir, el factor de extensión que se aplica dentro de la unidad 102 de procesamiento de subbanda como una relación de las muestras de entrada y de salida para lograr un extensión de tiempo física general de la señal del dominio del tiempo por S#;
• Q: el factor de transposición de subbanda, es decir, el factor de transposición que se aplica dentro de la unidad 102 de procesamiento de subbanda para lograr una transposición de frecuencia física general de la señal de dominio del tiempo por el factor Q#; y
la correspondencia entre los índices de subbanda de origen y objetivo, en donde n denota un índice de una subbanda de análisis que ingresa en la unidad 102 de procesamiento de subbanda y m denota un índice de una subbanda de síntesis correspondiente en la salida de la unidad 102 de procesamiento de subbanda.
Con el fin de determinar el factor S de extensión de subbanda, se observa que una señal de entrada al banco 101 de filtros de análisis de la duración D física, corresponde a un número D/AtA de muestras de subbanda de análisis en la entrada a la unidad 102 de procesamiento de subbanda. Estas D/AtA muestras se extenderán a S • D/AtA muestras por la unidad 102 de procesamiento de subbanda que aplica el factor S de extensión de subbandas. En la salida del banco 103 de filtros de síntesis estas S • D/AtA muestras resultan en una señal de salida que tiene una duración física de AtS • S • D/AtA. Dado que esta última duración debe cumplir con el valor especificado Sq • D, es decir, ya que la duración de la señal de salida de dominio del tiempo debería estar extendida en tiempo en comparación con la señal de entrada de dominio del tiempo por el factor S de extensión de tiempo físico Sq, se obtiene la siguiente regla de diseño:
Figure imgf000010_0001
Con el fin de determinar el factor Q de trasposición de subbanda que se aplica dentro de la unidad 102 de procesamiento de subbanda a fin de lograr una transposición Qq física, se observa que una sinusoide de entrada al banco 101 de filtros de análisis de frecuencia Q física resultará en una señal de subbanda de análisis compleja con una frecuencia angular de tiempo discreto w = 2nQ • Ma y la contribución principal se produce dentro de la subbanda de análisis con índice n ~ Q/úfA. Una sinusoide de salida en la salida del banco 103 de filtros de síntesis de la frecuencia Q$ • Q física transpuesta deseada, resultará de la alimentación de la subbanda de síntesis con el índice m ~ Q$ • Q/úfs con una señal de subbanda compleja de frecuencia 2nQq • Q • úts angular discreta. En este contexto, se debe tener cuidado para evitar la síntesis de frecuencias de salida superpuestas diferentes de Q$ • Q. Típicamente esto puede evitarse haciendo elecciones apropiadas de segundo orden como se discutió, p. ej., seleccionando bancos de filtros de análisis y/o de síntesis apropiados. La frecuencia 2nQ$ • Q • úts discreta en la salida de la unidad 102 de procesamiento de subbanda debe corresponder a la frecuencia w = 2nQ • útA de tiempo discreta en la entrada de la unidad 102 de procesamiento de subbanda multiplicada por el factor Q de transposición de subbanda. Es decir, al igualar 2nQQútA y 2nQ$ • Q • úts, se puede determinar la siguiente relación entre el factor Q$ de transposición física y el factor Q de transposición de subbanda:
Figure imgf000011_0001
Del mismo modo, el índice n de subbanda de origen o de análisis apropiado de la unidad 102 de procesamiento de subbanda para un índice m de subbanda objetivo o de síntesis dado debe cumplir
Figure imgf000011_0002
En una realización, se cumple que úfs/úfA = Qq, es decir, la separación de frecuencias del banco 103 de filtros de síntesis corresponde a la separación de frecuencias del banco 101 de filtros de análisis multiplicado por el factor de transposición física, y se puede aplicar la asignación uno a uno de índice n = m de subbanda de análisis a de síntesis. En otras realizaciones, la asignación de índice de subbanda puede depender de los detalles de los parámetros del banco de filtros. En particular, si la fracción de la separación de frecuencia del banco 103 de filtros de síntesis y del banco 101 de filtros de análisis es diferente del factor Q$ de transposición física, se pueden asignar una o dos subbandas de origen a una subbanda objetivo dada. En el caso de dos subbandas de origen, puede ser preferible utilizar dos subbandas de origen adyacentes con el índice n, n 1, respectivamente. Es decir, la primera y la segunda subbanda de origen vienen dadas por (n(m), n(m) 1) o (n(m) 1, n(m)).
La subbanda de procesamiento de la Fig. 2 con una única subbanda de origen, se describe a continuación como una función de las parámetros S y Q de procesamiento de subbanda. Sea x(k) la señal de entrada al extractor 201 de bloque, y sea h la extensión del bloque de entrada. Es decir, x(k) es una señal de subbanda de análisis de valor complejo de una subbanda de análisis con índice n. El bloque extraído por el extractor 201 de bloque puede, sin pérdida de generalidad, considerarse como definido por las L = Ri R2 muestras
(k) - x(Qk hl), k = -R1,...R 1- 1 , (4)
en donde el entero l es un índice de conteo de bloques, L es la longitud del bloque y Ri, R2 son enteros no negativos. Señalar que para Q = 1, el bloque se extrae de muestras consecutivas, pero para Q > 1, se lleva a cabo un submuestreo de tal manera que las direcciones de entrada se extienden por el factor Q. Si Q es un número entero, esta operación suele ser sencilla de realizar, mientras que puede requerirse un método de interpolación para valores no enteros de Q. Esta declaración es relevante también para los valores no enteros del incremento h, es decir, de la extensión del bloque de entrada. En una realización, pueden aplicarse filtros de interpolación cortos, p. ej., filtros que tienen dos tomas de filtro, a la señal de subbanda de valor complejo. Por ejemplo, si se requiere una muestra en el índice k + 0,5 de tiempo fraccionario, una interpolación de dos tomas de la forma x(k 0,5) ~ ax(k) bx(k 1), donde los coeficientes a, b pueden ser constantes o pueden depender de un índice de subbanda (véase, p. ej., el documento WO2004/097794 y el documento WO2007/085275), puede garantizar una calidad suficiente.
Un caso especial interesante de la fórmula (4) es R1 = 0, R2 = 1 donde el bloque extraído consiste en una sola muestra, es decir la longitud de bloque es L = 1.
Con la representación polar de un número z = \z\ exp(i zz) complejo, en donde \z\ es la magnitud del número complejo y zz es la fase del número complejo, la unidad 202 de procesamiento no lineal que produce la trama yi de salida a partir de la trama xi de entrada se define ventajosamente por el factor T = SQ de modificación de fase a través de
Figure imgf000012_0001
donde p e [0,1] es un parámetro de ponderación de magnitud geométrica. El caso p = 0 corresponde a una modificación de fase pura del bloque extraído. Un valor particularmente atractivo de la ponderación de la magnitud es p = 1 - 1/7 para el que se obtiene un cierto alivio de complejidad computacional independientemente de la longitud del bloque L, y la respuesta transitoria resultante se mejora algo con respecto al caso p = 0. El parámetro G de corrección de fase depende de los detalles del banco de filtros y de los índices de subbanda de origen y objetivo. En una realización, el parámetro G de corrección de fase puede determinarse experimentalmente barriendo un conjunto de sinusoides de entrada. Además, el parámetro G de corrección de fase se puede derivar estudiando la diferencia de fase de sinusoides complejas de subbanda objetivo adyacentes u optimizando el rendimiento para un tipo de impulso de Dirac de la señal de entrada. Finalmente, con un diseño adecuado de los bancos 101 y 103 de filtros de análisis y de síntesis, el parámetro G de corrección de fase puede ajustarse a cero, u omitirse. El factor 7 de modificación de fase debe ser un número entero tal que los coeficientes 7 - 1 y 1 sean números enteros en la combinación lineal de fases en la primera línea de la fórmula (5). Con esta suposición, es decir, con la suposición de que el factor 7 de modificación de fase es un número entero, el resultado de la modificación no lineal está bien definido aunque las fases son ambiguas por el módulo de identificación 2n.
En palabras, la fórmula (5) especifica que la fase de una muestra de trama de salida se determina mediante el desplazamiento de la fase de una correspondiente muestra de trama de entrada por un valor de desplazamiento constante. Este valor de desplazamiento constante puede depender del factor 7 de modificación, que a su vez depende del factor de extensión de subbanda y/o del factor de transposición de subbanda. Además, el valor de desplazamiento constante puede depender de la fase de una muestra de trama de entrada particular desde la trama de entrada. Esta muestra de trama de entrada particular se mantiene fija para la determinación de la fase de todas las muestras de trama de salida de un bloque dado. En el caso de la fórmula (5), la fase de la muestra central de la trama de entrada se utiliza como la fase de la muestra de trama de entrada particular.
La segunda línea de la fórmula (5), especifica que la magnitud de una muestra de la trama de salida puede depender de la magnitud de la correspondiente muestra de la trama de entrada. Además, la magnitud de una muestra de la trama de salida puede depender de la magnitud de una muestra de trama de entrada particular. Esta muestra de trama de entrada particular puede utilizarse para la determinación de la magnitud de todas las muestras de trama de salida. En el caso de la fórmula (5), la muestra central de la trama de entrada se utiliza como muestra de trama de entrada particular. En una realización, la magnitud de una muestra de la trama de salida puede corresponder a la media geométrica de la magnitud de la correspondiente muestra de la trama de entrada y la muestra de la trama de entrada particular.
En la unidad 203 de establecimiento de ventana, una ventana w de longitud L se aplica sobre la trama de salida, resultando en la trama de salida de ventana
zl (k) = w(k)yl(k \ k = -R 1,...R 2 - 1 . (6)
Por último, se asume que todas las tramas están extendidas por ceros y la operación 204 de superposición y adición se define por
z(k) = Y JZi(k-Shl), (7)
/
en donde cabe señalar que la unidad 204 de superposición y adición aplica un paso de bloque de Sh, es decir, un paso de tiempo que es S veces más alto que la extensión h de bloque de entrada. Debido a esta diferencia en los pasos de tiempo de las fórmulas (4) y (7), la duración de la señal z(k) de salida es S multiplicado por la duración de la señal x(k) de entrada, es decir, la señal de subbanda de síntesis se ha extendido por el factor S de extensión de subbanda en comparación con la señal de subbanda de análisis. Cabe señalar que esta observación se aplica normalmente si la longitud L de la ventana es despreciable en comparación con la duración de la señal.
Para el caso en el que una sinusoide compleja se utiliza como entrada al procesamiento 102 de subbanda, es decir, un análisis de señal de subbanda correspondiente a una sinusoide compleja
x(k ) = C Qxp(iú)k ) , (8) puede determinarse al aplicar las fórmulas (4) -(7) que la salida del procesamiento 102 de subbanda, es decir, la correspondiente señal de subbanda de síntesis, viene dada por
z(k) = \C\exp[i(TZC+6 Qcok)]'Yj w(k-Shl) . (9)
¡
independientemente de p. Por lo tanto, una sinusoide compleja de frecuencia de tiempo discreta w se transformará en una sinusoide compleja con frecuencia Qw de tiempo discreta siempre que la ventana de síntesis se desplace con un paso de Sh sumada hasta el mismo valor K constante para todo k,
Y JM k - S h l ) = K . (10) l
Es ilustrativo considerar el caso especial de la transposición pura donde S = 1 y T = Q. Si el paso del bloque de entrada es h = 1 y Ri = 0, R2 = 1, todo lo anterior, es decir, notablemente la fórmula (5), se reduce a la regla de modificación de fase por punto o basada en muestra
Figure imgf000013_0001
La unidad 102 de procesamiento de subbanda puede utilizar los datos 104 de control para establecer ciertos parámetros de procesamiento, p. ej. la longitud de bloque de los extractores de bloque.
En la siguiente, la descripción del procesamiento de subbanda se extenderá para cubrir el caso de la Fig. 3 con dos entradas de subbanda. Sea x(1)(k) la señal de subbanda de entrada al primer extractor 301-1 de bloque y sea x(2)(k) la señal de subbanda de entrada al segundo extractor 301-2 de bloque. Cada uno de los extractores puede utilizar un factor de submuestreo diferente, lo que conduce a los bloques extraídos
Figure imgf000013_0002
El procesamiento 302 no lineal produce la trama yi de salida y puede estar definido por
Figure imgf000013_0003
el procesamiento en 303, se describe de nuevo por (6) y (7) y 204 es idéntico al procesamiento de superposición y adición descrito en el contexto del caso de entrada única.
La definición de los parámetros Di, D2 , p reales no negativos y los parámetros Ti, T2 enteros no negativos y la ventana w de síntesis, ahora depende del modo de operación deseado. Señalar que si la misma subbanda se alimenta a ambas entradas, x(1)(k) = x(2)(k) y Di = Q, D2 = 0, Ti = 1, T2 = T - 1, las operaciones en (12) y (13) reducen las de (4) y (5) en el caso de entrada única.
En una realización, en donde la relación de la separación úfs de frecuencia del banco 103 de filtros de síntesis y la separación úfA de frecuencia del banco 101 de filtros de análisis es diferente del factor Qq de transposición física deseado, puede ser beneficioso determinar las muestras de una subbanda de síntesis con el índice m a partir de dos subbandas de análisis con el índice n, n i, respectivamente. Para un índice m dado, el correspondiente índice n puede estar dado por el valor entero obtenido truncando el valor n de índice de análisis dado por la fórmula (3). Una de las señales de subbanda de análisis, p. ej., la señal de subbanda de análisis correspondiente al índice n, se alimenta al primer extractor 301-1 de bloque y la otra señal de subbanda de análisis, p. ej. la correspondiente al índice n i, se alimenta al segundo extractor 301-2 de bloque. En base a estas dos señales de subbanda de análisis, una señal de subbanda de síntesis correspondiente al índice m se determina de acuerdo con el procesamiento descrito anteriormente. La asignación de las señales de subbanda de análisis adyacentes a los dos extractores 301-1 y 302-1 de bloque, puede ser en base al resto que se obtiene al truncar el valor de índice de la fórmula (3), es decir, la diferencia del valor de índice exacto dado por la fórmula (3) y el valor n entero truncado obtenido de la fórmula (3). Si el resto es mayor que 0,5, entonces la señal de subbanda de análisis correspondiente al índice n puede asignarse al segundo extractor 301-2 de bloque, de lo contrario, esta señal de subbanda de análisis se puede asignar al primer extractor 301-1 de bloque. En este modo de funcionamiento, los parámetros pueden estar diseñados de tal manera que las señales de subbanda de entrada que comparten la misma frecuencia w compleja,
J X (1) ( k ) = C j Q Xp(ÍÜ )k)
(14)
[X (2) (k ) = C2 Q X p (íü )k)
conducen a una salida de subbanda, siendo la señal una sinusoide compleja con una frecuencia Qw de tiempo discreta. Resulta que esto sucede si se cumplen las siguientes relaciones:
Figure imgf000014_0001
Para el modo de operación de generación de parciales faltantes por medio de productos cruzados, los criterios de diseño son diferentes. Volviendo al parámetro Q$ de transposición física, el objetivo de una adición de productos cruzados es producir una salida en las frecuencias QQ + rQo para r = 1,...,Q$ - 1 entradas dadas en las frecuencias Q y Q Do, donde Do es una frecuencia fundamental que pertenece a una componente de tono dominante de la señal de entrada. Como se describe en el documento WO2010/081892, la adición selectiva de esos términos dará como resultado la finalización de la serie de armónicos y una reducción significativa del artefacto de tono fantasma.
Ahora se esbozará un algoritmo constructivo para el funcionamiento del procesamiento 404 de control cruzado. Dado un índice m de subbanda de salida objetivo, el parámetro r = 1,...Q - 1 y la frecuencia fundamental Do, se pueden deducir los índices ni y n2 de subbanda de origen apropiados, resolviendo el siguiente sistema de ecuaciones en una sentido aproximado,
Figure imgf000014_0002
donde a = 1/2 para la modulación de bancos de filtros apilados de manera extraña (como se utiliza generalmente para los bancos de filtros de QMF y de MDCT) y a = 0 para la modulación de bancos de filtros apilados uniformemente (como se utiliza generalmente para los bancos de filtros de FFT).
Con las definiciones
p = Qo/ñfA. la frecuencia fundamental medida en unidades de separación de frecuencia del banco de filtros de análisis; •
F = úfs/ñfA. el cociente de la separación frecuencias de subbanda de síntesis y de análisis; y
nJ f - ---- (---m--------- +------- a------ )---- F--------- ------ r----- p- —-cr
a el valor real objetivo para un índice de origen inferior de valor entero, se da un ejemplo de solución aproximada ventajosa para (16) al seleccionar ni como el entero más cercano a nf, y n2 como el entero más cercano a nf p.
Si la frecuencia fundamental es menor que la separación del banco de filtros de análisis, es decir, si p < 1, puede ser ventajoso cancelar la adición de un producto cruzado.
Como se enseña en el documento WO2010/081892 un producto cruzado no debe añadirse a una subbanda de salida que ya tiene una contribución principal significativa de la transposición sin productos cruzados. Además, en la mayoría de los casos, r = 1,...,Q$ - 1 debería contribuir a salida del producto cruzado. Aquí, estas reglas se pueden llevar a cabo realizando los siguientes tres pasos para cada uno de los índices m de subbanda de salida objetivo:
1. Calcular la Me máxima en todas las opciones de r = 1,...,Q$ - 1 del mínimo de las magnitudes \x(i)\ y \x(2)\ de subbanda de origen candidata evaluada en (o desde una adyacente) el intervalo k = hl de tiempo central, en donde las subbandas de origen x(1) y x(2) pueden estar dadas por los índices ni y n2 como en la ecuación (16); 2. Calcular la magnitud correspondiente de Ms para el término |x| de origen directo obtenido de una subbanda de F
origen con índice
Figure imgf000015_0001
(véase la ec. 3);
3. Activar el término cruzado de una opción ganadora para Me en el punto 1 anterior solo si Me > qMs, donde q es un valor de umbral predeterminado.
Las variaciones en este procedimiento pueden ser deseables dependiendo de los parámetros de configuración del sistema en particular. Una variación tal es reemplazar la umbralización dura del punto 3 con normas más suaves en función del cociente Me/ Ms. Otra variación es expandir la maximización en el punto 1 a más de Q$- 1 elecciones, por ejemplo, definidas por una lista finita de valores candidatos para la frecuencia fundamental medida en unidades p de separación de frecuencia de análisis. Otra variación más es aplicar diferentes medidas de las magnitudes de subbanda, tal como la magnitud de una muestra fija, una magnitud máxima, una magnitud media, una magnitud en sentido lp-norma, etc.
La lista de bandas m de origen objetivo seleccionadas para la adición de un producto cruzado junto con los valores de ni y n2 constituye una parte principal de los datos 403 de control de procesamiento cruzado. Lo que queda por describir son los parámetros Di, D2, p de configuración, los parámetros Ti, T2 enteros no negativos que aparecen en la rotación (13) de fase y la ventana w de síntesis a ser utilizada en el procesamiento 402 de subbanda cruzado. Insertar el modelo sinusoidal para la situación de producto cruzado conduce a las siguientes señales de subbanda de origen:
Figure imgf000015_0002
donde w = 2nQútA y wo = 2n QoAtA. Asimismo, la subbanda de salida deseada es de la forma
Figure imgf000015_0003
Los cálculos revelan que esta salida objetivo se puede lograr si (15) se cumple conjuntamente con
T2 _ r (19)
t x+ t 2 q v
Las condiciones (15) y (19) son equivalentes a
Figure imgf000015_0004
que define los factores Ti, T2 enteros para la modificación de fase en (13) y proporciona algo de libertad de diseño en la fijación de los valores de los factores Di, D2 de submuestreo. El parámetro de ponderación de magnitud se puede elegir ventajosamente para p = r/Q$. Como puede verse, estos parámetros de configuración solo dependen de la frecuencia Qo fundamental a través de la selección de r. Sin embargo, para que (18) se mantenga, emerge una nueva condición en la ventana w de síntesis, a saber
Figure imgf000016_0001
Una ventana w de síntesis que satisface (21) debe proporcionarse bien exacta o aproximadamente como la última pieza de datos 403 de control de procesamiento cruzado.
Se observa que el algoritmo anterior para el cálculo de datos 403 de control de procesamiento cruzado sobre la base de parámetros de entrada, tales como un índice m de subbanda de salida objetivo y una frecuencia Qo fundamental, es de una naturaleza puramente a modo de ejemplo y como tal no limita el alcance de la invención. Las variaciones de esta divulgación dentro del conocimiento de la persona experta y la experimentación rutinaria, p. ej., un método adicional de procesamiento basado en bloques de subbanda que proporciona una señal (18) como salida en respuesta a las señales (17) de entrada, caen completamente dentro del alcance de la invención.
La Fig. 5 ilustra un escenario de ejemplo para la aplicación de la transposición basada en bloques de subbanda utilizando varios órdenes de transposición en un códec de audio mejorado de HFR. Se recibe un flujo de bits transmitido en un decodificador 501 principal, que proporciona una señal principal decodificada de bajo ancho de banda a una frecuencia fs de muestreo. La señal principal decodificada de bajo ancho de banda se remuestrea a la frecuencia 2fs de muestreo de salida por medio de un banco 502 de análisis de QMF de 32 bandas modulado complejo seguido de un banco 505 de síntesis de QMF de 64 bandas (QMF inverso). Los dos bancos 502 y 505 de filtros comparten los mismos parámetros úts = M a y úfS = úfA físicos, y la unidad 504 de procesamiento de HFR simplemente deja pasar las subbandas inferiores no modificadas correspondientes a la señal principal de bajo ancho de banda. El contenido de alta frecuencia de la señal de salida se obtiene alimentando las subbandas más altas del banco 505 de síntesis de QMF de 64 bandas con las bandas de salida de una unidad 503 de transposición múltiple, sujeto a la conformación y modificación espectral realizada por una unidad 504 de procesamiento de HFR. El transpositor 503 toma como entrada la señal principal decodificada y genera una multitud de señales de subbanda que representan el análisis de la banda de QMF 64 de una superposición o combinación de varias componentes de señales transpuestas El objetivo es que si se omite el procesamiento de HFR, cada uno de los componentes corresponde a una transposición física entera sin una extensión de tiempo de la señal principal Q = 2,3, ..., y S$ = 1). En el escenario de la invención, la señal de control del transpositor 104 contiene datos que describen una frecuencia fundamental. Estos datos pueden transmitirse a través del flujo de bits desde el codificador de audio correspondiente, deducidos por la detección de tono en el decodificador, u obtenidos a partir de una combinación de información transmitida y detectada.
La Fig. 6 ilustra un escenario de ejemplo para la operación de una transposición basada en bloques de subbandas de orden múltiple que aplica un solo banco de filtros de análisis de QMF de 64 bandas. En este caso, deben producirse tres órdenes de transposición Q$ = 2,3,4 y entregarse en el dominio de un QMF de 64 bandas que opera a una tasa 2fs de muestreo de salida. La unidad 603 de fusión simplemente selecciona y combina las subbandas relevantes de cada una de las ramas del factor de transposición en una sola multitud de subbandas de QMF para alimentar a la unidad de procesamiento de HFR. El objetivo es específicamente que la cadena de procesamiento de un análisis 601 de QMF de 64 bandas, una unidad 602-Q# de procesamiento de subbandas y una síntesis 505 de QMF de 64 bandas dé como resultado una transposición física de Q$ con S$ = 1 (es decir, sin extensión). Al identificar estos tres bloques con 101, 102 y 103 de la Fig. 1, se encuentra que ÁtA = 64 fs y úfA = fs/128, así, úts/útA = 1/2 y F = úfs/úfA = 2. Un diseño de parámetros de configuración específicos para 602 Q se describirá por separado para cada uno de los casos Q$ = 2,3,4. Para todos los casos, el paso de análisis se elige para que sea h = 1 y se supone que se conoce el parámetro p = Qo/úfA = 128Qo/fs de frecuencia fundamental normalizada.
Considerando primero el caso Qq = 2. Entonces 602-2 tiene que realizar una extensión de subbanda de S = 2, una transposición de subbanda de Q = 1 (es decir, ninguna) y la correspondencia entre subbandas de origen n y objetivo m viene dada por n = m para el procesamiento de subbanda directo. En el escenario inventivo de la adición de productos cruzados, solo hay un tipo de producto cruzado a considerar, a saber, r = 1 (véase más arriba, después de la ecuación (15)), y las ecuaciones (20) se reducen a T1 = T2 = 1 y D1 + D2 = 1. Una solución a modo de ejemplo consiste en elegir D1 = 0 y D2 = 1. Para la ventana de síntesis de procesamiento directo, puede utilizarse una ventana rectangular de longitud uniforme L = 10 con R1 = R2 = 5 ya que satisface la condición (10). Para la ventana de síntesis de procesamiento cruzado, se puede utilizar una ventana de toma L = 2 corta, con R1 = R2 = 1, para mantener la complejidad adicional de la adición de productos cruzados al mínimo. Después de todo, el efecto beneficioso de utilizar un bloque largo para el procesamiento de subbanda es más notable en el caso de señales de audio complejas, donde se suprimen los términos de intermodulación no deseados; para el caso de un tono dominante, es menos probable que ocurran tales artefactos. La ventana de toma L = 2 es la más corta que puede satisfacer (10) ya que h = 1 y S = 2. Sin embargo, según la presente invención, la ventana satisface ventajosamente (21). Para los parámetros disponibles, asciende a
Figure imgf000017_0001
que se cumple al elegir w(0) = 1 y w(-1) = exp(ia) = exp(inp/2).
Para el caso Qq = 3 las especificaciones para 602-3 dadas por (1) -(3), son que tiene que realizar una extensión de subbanda de S = 2, una transposición de subbanda de Q = 3/2 y que la correspondencia entre subbandas de origen n y objetivo m para el procesamiento del término directo viene dada por n ~ 2 m/3. Hay dos tipos de términos de productos cruzados r = 1,2, y las ecuaciones (20) se reducen a
Figure imgf000017_0002
Una solución a modo de ejemplo consiste en elegir los parámetros de submuestreo como
Di = 0 y D2 = 3/2 para r = 1;
Di = 3/2 y D2 = 0 para r = 2.
Para la ventana w de síntesis de procesamiento directo, puede utilizarse una ventana rectangular de longitud par L = 8 con Ri = R2 = 4. Para la ventana de síntesis de procesamiento cruzado, se puede utilizar una ventana de toma L = 2 pequeña, con Ri = R2 = 1, y que satisfaga
Figure imgf000017_0003
lo que se cumple al elegir w(0) = 1 y w(-1) = exp(ia).
Para el caso Qq = 4, las especificaciones para 602-4 dadas por (1) -(3), son que tiene que realizar una extensión de subbanda de S = 2, una transposición de subbanda de Q = 2 y que la correspondencia entre las subbandas de origen n y objetivo m para el procesamiento del término directo viene dada por n - 2m. Hay tres tipos de términos de productos cruzados r = 1, 2, 3, y las ecuaciones (20) se reducen a
Figure imgf000017_0004
Una solución a modo de ejemplo consiste en elegir
Di = 0 y D2 = 2 para r = 1;
Di = 0 y D2 = 1 para r = 2;
Di = 2 y D2 = 0 para r = 3;
Para la ventana w de síntesis de procesamiento directo, puede utilizarse una ventana rectangular de longitud par L = 6 con Ri = R2 = 3. Para la ventana de síntesis de procesamiento cruzado, se puede utilizar una ventana de toma L = 2 pequeña, con Ri = R2 = 1, y que satisfaga
Figure imgf000018_0001
lo que se cumple al elegir w(0) = 1 y w(-1) = exp(ia).
En cada uno de los casos anteriores, donde más de un valor r es aplicable, se llevará a cabo una selección, p. ej., de manera similar al procedimiento de tres pasos descrito antes de la ecuación (17).
La Fig. 7 representa el espectro de amplitud de una señal armónica con frecuencia Qo = 564,7 Hz fundamental. La parte 701 de baja frecuencia de la señal se utilizará como entrada para una transposición múltiple. El propósito del transpositor es generar una señal lo más cerca posible de la parte 702 de alta frecuencia de la señal de entrada, de modo que la transmisión de la parte 702 de alta frecuencia no sea imperativa y la tasa de bits disponible se pueda utilizar económicamente.
La Fig. 8 representa el espectro de amplitud de las salidas de un transpositor que tiene la parte 701 de baja frecuencia de la señal de la Fig. 7 como entrada. El transpositor múltiple está construido utilizando bancos de filtros de QMF de 64 bandas, frecuencia fs = 14400 Hz de muestreo de entrada y de acuerdo con la descripción de la Fig. 5. Sin embargo, para mayor claridad, solo se consideran los dos órdenes Q$ = 2,3 de transposición. Los tres paneles 801-803 diferentes representan la salida final obtenida al utilizar diferentes configuraciones de los datos de control de procesamiento cruzado.
El panel 801 superior representa el espectro de salida obtenido si todo el procesamiento de productos cruzados se cancela y sólo está activo el procesamiento 401 de subbanda directo. Este será el caso si el control 404 de procesamiento cruzado no recibe tono o p = 0. La transposición por Q$ = 2 genera la salida en el rango de 4 a 8 kHz y la transposición por Q$ = 3 genera la salida en el rango de 8 a 12 kHz. Como puede verse, los parciales creados están cada vez más alejados y la salida se desvía significativamente de la señal 702 de alta frecuencia objetivo. En la salida de audio resultante estarán presentes artefactos de tono “fantasma” doble y triple audibles. El panel 802 central representa el espectro de salida obtenido si el procesamiento de productos cruzados está activo, se utiliza el parámetro p = 5 de tono (que es una aproximación a 128Qo/fs = 5,0196), pero se utiliza una ventana de síntesis simple de dos tomas con w(0) = w(-1) = 1, que satisface la condición (10), para el procesamiento de subbanda cruzado. Esto equivale a una combinación sencilla de procesamiento basado en bloques de subbandas y transposición armónica mejorada de productos cruzados. Como puede verse, los componentes de señal de salida adicionales en comparación con 801, no se alinean bien con la serie de armónicos deseada. Esto muestra que conduce a una calidad de audio insuficiente para utilizar el procedimiento heredado del diseño del procesamiento de subbanda directo para el procesamiento de productos cruzados. El panel 803 inferior representa el espectro de salida obtenido a partir del mismo escenario como para el panel 802 central, pero ahora con las ventanas de síntesis de procesamiento de subbanda cruzado dadas por las fórmulas descritas en el casos Qq = 2,3 de la Fig. 5. Es decir, una ventana de dos tomas de la forma w(0) = 1 y w(-1) = exp(ia) que satisface (21) y con la característica enseñada por la presente invención de que depende del valor de p. Como puede verse, la señal de salida combinada se alinea muy bien con la serie de armónicos deseada de 702.
La Fig. 9 muestra una parte de la unidad 202 de procesamiento de trama de procesamiento no lineal que incluye secciones configuradas para recibir dos muestras ui, U2 de entrada y generar en base a éstas una muestra w procesada, cuya magnitud viene dada por una media geométrica de las magnitudes de las muestras de entrada y cuya fase es una combinación lineal de las fases de las muestras de entrada, es decir,
f Ii \W\ - i Mj ip i 11
|U2 \—p
(22)
[arg w - T] arg u , T2 argw2
Es posible obtener la muestra w procesada de acuerdo con esta especificación, prenormalizando cada una de las muestras ui, U2 de entrada en un prenormalizador 901, 902 respectivo y multiplicando las muestras de entrada prenormalizadas vi = uil\ui\a, V2 = U2l\u2 \b en un multiplicador 910 ponderado, que genera una salida C p
w ~ V| v2. Claramente, el funcionamiento de los prenormalizadores 901, 902 y el multiplicador 910 ponderado está determinado por los parámetros de entrada a, b, a y p. Es fácil verificar que las ecuaciones (22) se cumplirán si a = Ti, $ = T2 , a = 1-p/Ti, b = 1- (1-p)/T2. El experto en la materia podrá generalizar fácilmente este diseño a un número No arbitrario de muestras de entrada, en donde un multiplicador se suministra con No muestras de entrada, de las cuales algunas o todas se han sometido a la prenormalización. Se observa, entonces, que es posible una prenormalización común (a = b, lo que implica que los prenormalizadores 901, 902 producen resultados idénticos) si el parámetro p se establece en p = Ti/(Ti T2). Esto resulta en una ventaja computacional cuando se consideran muchas subbandas, ya que un paso de prenormalización común puede efectuarse en todas las subbandas candidatas antes de la multiplicación. En una implementación de hardware ventajosa, una pluralidad de prenormalizadores que funcionan de manera idéntica se reemplaza por una sola unidad que alterna muestras de diferentes subbandas en una forma de división de tiempo.
Otras realizaciones de la presente invención resultarán evidentes para un experto en la técnica después de leer la descripción anterior. Aunque la presente descripción y los dibujos describen realizaciones y ejemplos, la invención no está restringida a estos ejemplos específicos. Se pueden realizar numerosas modificaciones y variaciones sin apartarse del alcance de la presente invención, que se define en las reivindicaciones adjuntas.
Los sistemas y métodos dados a conocer en el presente documento anteriormente pueden implementarse como software, firmware, hardware o una combinación de los mismos. Ciertos componentes o todos los componentes pueden implementarse como software ejecutado por un procesador de señal digital o microprocesador, o implementarse como hardware o como un circuito integrado de aplicación específica. Dicho software puede distribuirse en medios legibles por ordenador, que pueden comprender medios de almacenamiento informáticos (o medios no transitorios) y medios de comunicación (o medios transitorios). Como conocen bien los expertos en la técnica, los medios de almacenamiento informáticos incluyen medios volátiles y no volátiles, extraíbles y no extraíbles implementados en cualquier método o tecnología para el almacenamiento de información, como instrucciones legibles por ordenador, estructuras de datos, módulos de programas u otros datos. Los medios de almacenamiento informáticos incluyen, pero no se limitan a, RAM, ROM, EEPROM, memoria flash u otra tecnología de memoria, CD-ROM, discos versátiles digitales (DVD) u otro almacenamiento en disco óptico, casetes magnéticos, cinta magnética, almacenamiento en disco magnético u otros dispositivos de almacenamiento magnético, o cualquier otro medio que pueda usarse para almacenar la información deseada y al que pueda acceder un ordenador. Además, los expertos conocen bien que los medios de comunicación normalmente incorporan instrucciones legibles por ordenador, estructuras de datos, módulos de programas u otros datos en una señal de datos modulada como una onda portadora u otro mecanismo de transporte e incluye cualquier medio de suministro de información.

Claims (1)

  1. REIVINDICACIONES
    Un sistema configurado para generar una señal extendida en tiempo y/o transpuesta en frecuencia a partir de una señal de audio de entrada, comprendiendo el sistema:
    un banco (101) de filtros de análisis configurado para derivar un número Y = 2 de señales de subbanda de análisis a partir de la señal de audio de entrada, en donde cada una de las señales de subbanda de análisis comprende una pluralidad de muestras de análisis de valor complejo, cada una con una fase y una magnitud;
    una unidad (102) de procesamiento de subbanda configurada para generar una señal de subbanda de síntesis a partir de las Y señales de subbanda de análisis utilizando un factor Q de transposición de subbanda y un factor S de extensión de subbanda, siendo al menos uno de Q y S mayor que uno, en donde la unidad (102) de procesamiento de subbanda comprende:
    un extractor (201) de bloque configurado para:
    i) formar Y tramas de L muestras de entrada, extrayéndose cada una de las tramas de dicha pluralidad de muestras de análisis de valor complejo en una señal de subbanda de análisis y siendo la longitud de trama L > 1; y
    ii) aplicar un tamaño de salto de bloque de h muestras a dicha pluralidad de muestras de análisis, antes de formar una trama subsiguiente de L muestras de entrada, generando así una secuencia de tramas de las muestras de entrada;
    una unidad (202) de procesamiento de trama no lineal configurada para generar, en base a las correspondientes Y tramas de las muestras de entrada formadas por el extractor de bloque, una trama de muestras procesadas determinando una fase y una magnitud para cada una de las muestras procesadas de la trama, en donde, para al menos una muestra procesada:
    i) la fase de la muestra procesada se basa en una combinación lineal, con coeficientes (71, T2) enteros no negativos, de las respectivas fases de la correspondiente muestra de entrada en una primera y segunda trama de las muestras de entrada; y
    ii) la magnitud de la muestra procesada como valor medio de la magnitud de la correspondiente muestra de entrada en una primera trama de las muestras de entrada y la magnitud de la correspondiente muestra de entrada en una segunda trama de las muestras de entrada; y
    una unidad (204) de superposición y adición configurada para determinar la señal de subbanda de síntesis superponiendo y añadiendo las muestras de una secuencia de tramas de muestras procesadas; y
    un banco (103) de filtros de síntesis configurado para generar la señal extendida en tiempo y/o transpuesta en frecuencia a partir de la señal de subbanda de síntesis,
    en donde extractor (201) de bloque está configurado para derivar al menos una trama de muestras de entrada submuestreando las muestras de análisis de valor complejo en una señal de subbanda de análisis.
    El sistema de la reivindicación 1, en donde:
    el banco (101) de filtros de análisis aplica un paso ÁtA de tiempo de análisis a la señal de audio de entrada;
    el banco de filtros de análisis tiene una separación ÁfA de frecuencia de análisis;
    el banco de filtros de análisis tiene un número N de subbandas de análisis, con N > 1, donde n es un índice de subbanda de análisis con n = 0,..., N - 1;
    una subbanda de análisis de las N subbandas de análisis está asociada con una banda de frecuencia de la señal de audio de entrada;
    el banco (103) de filtros de síntesis aplica un paso úts de tiempo de síntesis a la señal de subbanda de síntesis;
    el banco de filtros de síntesis tiene una separación úfs de frecuencia de síntesis;
    el banco de filtros de síntesis tiene un número M de subbandas de síntesis, con M > 1, donde m es un índice de subbanda de síntesis con m = 0,..., M - 1; y
    una subbanda de síntesis de las M subbandas de síntesis está asociada con una banda de frecuencia de la señal extendida en tiempo y/o transpuesta en frecuencia.
    El sistema de la reivindicación 2, en donde la unidad (102) de procesamiento de subbanda comprende, además, una unidad (404) de control de procesamiento cruzado configurada para generar datos (403) de control de procesamiento cruzado que definen índices ni, n2 de subbanda asociados con las señales de subbanda de análisis y el índice m de subbanda de síntesis, índices de subbanda que están relacionados por ser soluciones enteras aproximadas de
    Figure imgf000021_0001
    donde Qo es una frecuencia fundamental de la señal de audio de entrada,
    a = 0 o 1/2,
    Figure imgf000021_0002
    r es un número entero que satisface 1 < r < Q$ - 1.
    El sistema de una cualquiera de las reivindicaciones anteriores, en donde la unidad (102) de procesamiento no lineal comprende:
    un prenormalizador (901, 902) configurado para reescalar las magnitudes de las correspondientes muestras de entrada en al menos una de las Y tramas de las muestras de entrada (vm = um/|um| pm); y un multiplicador (910) complejo configurado para determinar la muestra procesada calculando un í \
    producto V«sAr « m ) complejo ponderado de factores igual a la correspondiente muestra de entrada en las Y tramas de las muestras de entrada, derivándose al menos uno de los factores (vm, m e M t 0) de una muestra con una magnitud reescalada por el prenormalizador.
    Un método para generar una señal extendida en tiempo y/o transpuesta en frecuencia a partir de una señal de audio de entrada, comprendiendo el método:
    derivar un número Y = 2 de señales de subbanda de análisis a partir de la señal de audio de entrada, en donde cada una de las señales de subbanda de análisis comprende una pluralidad de muestras de análisis de valor complejo, cada una con una fase y una magnitud;
    formar Y tramas de L muestras de entrada, extrayéndose cada una de las tramas de dicha pluralidad de muestras de análisis de valor complejo en una señal de subbanda de análisis y siendo la longitud de trama L > 1;
    aplicar un tamaño de salto de bloque de h muestras a dicha pluralidad de muestras de análisis, antes de derivar una trama subsiguiente de L muestras de entrada, generando así una secuencia de tramas de las muestras de entrada;
    generar, en base a las correspondientes Y tramas de muestras de entrada, una trama de muestras procesadas determinando una fase y una magnitud para cada una de las muestras procesadas de la trama, en donde, para al menos una muestra procesada:
    i) la fase de la muestra procesada se basa en una combinación lineal, con coeficientes (Ti, T2) enteros no negativos, de las respectivas fases de la correspondiente muestra de entrada en una primera y segunda trama de las muestras de entrada; y
    ii) la magnitud de la muestra procesada como valor medio de la magnitud de la correspondiente muestra de entrada en una primera trama de las muestras de entrada y la magnitud de la correspondiente muestra de entrada en una segunda trama de las muestras de entrada; y
    determinar la señal de subbanda de síntesis superponiendo y añadiendo las muestras de una secuencia de tramas de las muestras procesadas; y
    generar la señal extendida en tiempo y/o transpuesta en frecuencia a partir de la señal de subbanda de síntesis, en donde dichas tramas que se forman de muestras de entrada incluyen muestras de análisis de valor complejo de submuestreo en una señal de subbanda de análisis.
    El método de la reivindicación 5, en donde dicha generación de una trama de muestras procesadas comprende:
    reescalar una magnitud de al menos una muestra de entrada; y
    calcular una muestra procesada como un producto
    Figure imgf000022_0001
    ponderado complejo de factores igual a la correspondiente muestra de entrada en las Y tramas de las muestras de entrada, en donde al menos uno de los factores (vm = um/\umf, m e M t 0) es una muestra de entrada con una magnitud reescalada.
    Un producto de programa informático que incluye instrucciones legibles por ordenador para realizar el método establecido en la reivindicación 5 o la reivindicación 6, cuando se ejecuta en un ordenador.
ES21204205T 2010-09-16 2011-09-05 Transposición armónica basada en bloque de subbanda mejorado de producto cruzado Active ES2938725T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US38344110P 2010-09-16 2010-09-16
US41916410P 2010-12-02 2010-12-02

Publications (1)

Publication Number Publication Date
ES2938725T3 true ES2938725T3 (es) 2023-04-14

Family

ID=44720852

Family Applications (3)

Application Number Title Priority Date Filing Date
ES21204205T Active ES2938725T3 (es) 2010-09-16 2011-09-05 Transposición armónica basada en bloque de subbanda mejorado de producto cruzado
ES11763872T Active ES2699750T3 (es) 2010-09-16 2011-09-05 Transposición armónica basada en bloque de subbanda mejorado de producto cruzado
ES21204206T Active ES2933477T3 (es) 2010-09-16 2011-09-05 Transposición armónica basada en bloque de subbanda mejorado de producto cruzado

Family Applications After (2)

Application Number Title Priority Date Filing Date
ES11763872T Active ES2699750T3 (es) 2010-09-16 2011-09-05 Transposición armónica basada en bloque de subbanda mejorado de producto cruzado
ES21204206T Active ES2933477T3 (es) 2010-09-16 2011-09-05 Transposición armónica basada en bloque de subbanda mejorado de producto cruzado

Country Status (18)

Country Link
US (9) US9172342B2 (es)
EP (6) EP3503100A1 (es)
JP (9) JP5951614B2 (es)
KR (11) KR101980070B1 (es)
CN (2) CN103262164B (es)
AU (1) AU2011304113C1 (es)
BR (4) BR122019025121B1 (es)
CA (9) CA3067155C (es)
CL (1) CL2013000717A1 (es)
DK (3) DK3975178T3 (es)
ES (3) ES2938725T3 (es)
IL (11) IL296448A (es)
MX (1) MX2013002876A (es)
MY (2) MY176574A (es)
PL (3) PL3975177T3 (es)
RU (6) RU2671619C2 (es)
SG (3) SG10202103492XA (es)
WO (1) WO2012034890A1 (es)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8958510B1 (en) * 2010-06-10 2015-02-17 Fredric J. Harris Selectable bandwidth filter
EP2682941A1 (de) * 2012-07-02 2014-01-08 Technische Universität Ilmenau Vorrichtung, Verfahren und Computerprogramm für frei wählbare Frequenzverschiebungen in der Subband-Domäne
TWI557727B (zh) 2013-04-05 2016-11-11 杜比國際公司 音訊處理系統、多媒體處理系統、處理音訊位元流的方法以及電腦程式產品
CA3194257A1 (en) 2013-09-17 2015-03-26 Wilus Institute Of Standards And Technology Inc. Method and apparatus for processing multimedia signals
US10580417B2 (en) 2013-10-22 2020-03-03 Industry-Academic Cooperation Foundation, Yonsei University Method and apparatus for binaural rendering audio signal using variable order filtering in frequency domain
US10163447B2 (en) * 2013-12-16 2018-12-25 Qualcomm Incorporated High-band signal modeling
JP6151866B2 (ja) 2013-12-23 2017-06-21 ウィルス インスティテュート オブ スタンダーズ アンド テクノロジー インコーポレイティド オーディオ信号のフィルタ生成方法およびそのためのパラメータ化装置
WO2015142073A1 (ko) 2014-03-19 2015-09-24 주식회사 윌러스표준기술연구소 오디오 신호 처리 방법 및 장치
EP3128766A4 (en) 2014-04-02 2018-01-03 Wilus Institute of Standards and Technology Inc. Audio signal processing method and device
US9306606B2 (en) * 2014-06-10 2016-04-05 The Boeing Company Nonlinear filtering using polyphase filter banks
WO2016142002A1 (en) * 2015-03-09 2016-09-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal
TWI758146B (zh) 2015-03-13 2022-03-11 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
EP3171362B1 (en) * 2015-11-19 2019-08-28 Harman Becker Automotive Systems GmbH Bass enhancement and separation of an audio signal into a harmonic and transient signal component
CN110266287B (zh) * 2019-05-05 2023-06-23 深圳信息职业技术学院 电子耳蜗分数延迟滤波器构造方法、存储介质及电子耳蜗
US10938444B2 (en) * 2019-07-12 2021-03-02 Avago Technologies International Sales Pte. Limited Apparatus and method for noise reduction in a full duplex repeater
US11344298B2 (en) 2019-12-06 2022-05-31 Covidien Lp Surgical stapling device

Family Cites Families (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5774837A (en) 1995-09-13 1998-06-30 Voxware, Inc. Speech coding system and method using voicing probability determination
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
SE512719C2 (sv) 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
US6266003B1 (en) * 1998-08-28 2001-07-24 Sigma Audio Research Limited Method and apparatus for signal processing for time-scale and/or pitch modification of audio signals
US7272556B1 (en) 1998-09-23 2007-09-18 Lucent Technologies Inc. Scalable and embedded codec for speech and audio signals
US6782360B1 (en) * 1999-09-22 2004-08-24 Mindspeed Technologies, Inc. Gain quantization for a CELP speech coder
JP3518737B2 (ja) * 1999-10-25 2004-04-12 日本ビクター株式会社 オーディオ符号化装置、オーディオ符号化方法、及びオーディオ符号化信号記録媒体
SE0004163D0 (sv) 2000-11-14 2000-11-14 Coding Technologies Sweden Ab Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering
CA2365203A1 (en) * 2001-12-14 2003-06-14 Voiceage Corporation A signal modification method for efficient coding of speech signals
JP3537807B2 (ja) * 2002-02-28 2004-06-14 株式会社神戸製鋼所 デジタルデータ処理装置,およびその方法
ES2259158T3 (es) * 2002-09-19 2006-09-16 Matsushita Electric Industrial Co., Ltd. Metodo y aparato decodificador audio.
SE0301273D0 (sv) 2003-04-30 2003-04-30 Coding Technologies Sweden Ab Advanced processing based on a complex-exponential-modulated filterbank and adaptive time signalling methods
EP1683133B1 (en) 2003-10-30 2007-02-14 Koninklijke Philips Electronics N.V. Audio signal encoding or decoding
US7460990B2 (en) 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
US20090299756A1 (en) * 2004-03-01 2009-12-03 Dolby Laboratories Licensing Corporation Ratio of speech to non-speech audio such as for elderly or hearing-impaired listeners
KR100608062B1 (ko) * 2004-08-04 2006-08-02 삼성전자주식회사 오디오 데이터의 고주파수 복원 방법 및 그 장치
JP5129115B2 (ja) 2005-04-01 2013-01-23 クゥアルコム・インコーポレイテッド 高帯域バーストの抑制のためのシステム、方法、および装置
US20070078645A1 (en) * 2005-09-30 2007-04-05 Nokia Corporation Filterbank-based processing of speech signals
CN101882441B (zh) 2006-01-27 2013-02-27 杜比国际公司 利用复调制滤波器组的高效滤波
JP2007316254A (ja) * 2006-05-24 2007-12-06 Sony Corp オーディオ信号補間方法及びオーディオ信号補間装置
KR101041895B1 (ko) 2006-08-15 2011-06-16 브로드콤 코포레이션 패킷 손실 후 디코딩된 오디오 신호의 시간 워핑
JP4918841B2 (ja) * 2006-10-23 2012-04-18 富士通株式会社 符号化システム
ES2898865T3 (es) * 2008-03-20 2022-03-09 Fraunhofer Ges Forschung Aparato y método para sintetizar una representación parametrizada de una señal de audio
US9142221B2 (en) * 2008-04-07 2015-09-22 Cambridge Silicon Radio Limited Noise reduction
BR122017003818B1 (pt) * 2008-07-11 2024-03-05 Fraunhofer-Gesellschaft zur Föerderung der Angewandten Forschung E.V. Instrumento e método para geração de sinal estendido de largura de banda
ES2901735T3 (es) * 2009-01-16 2022-03-23 Dolby Int Ab Transposición armónica mejorada de productos de cruce
RU2493618C2 (ru) * 2009-01-28 2013-09-20 Долби Интернешнл Аб Усовершенствованное гармоническое преобразование
EP2214165A3 (en) 2009-01-30 2010-09-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and computer program for manipulating an audio signal comprising a transient event
UA102347C2 (ru) * 2010-01-19 2013-06-25 Долби Интернешнл Аб Усовершенствованное гармоническое преобразование на основе блока поддиапазонов
PL3570278T3 (pl) * 2010-03-09 2023-03-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Rekonstrukcja wysokiej częstotliwości wejściowego sygnału audio przy użyciu kaskadowych banków filtrów

Also Published As

Publication number Publication date
SG10202103492XA (en) 2021-05-28
MY155990A (en) 2015-12-31
US11355133B2 (en) 2022-06-07
CA3191597A1 (en) 2012-03-22
DK2617035T3 (da) 2019-01-02
KR20190053306A (ko) 2019-05-17
MY176574A (en) 2020-08-17
EP3975177B1 (en) 2022-12-14
JP2018022178A (ja) 2018-02-08
KR20180058847A (ko) 2018-06-01
JP5951614B2 (ja) 2016-07-13
IL224785A (en) 2015-08-31
JP2020190757A (ja) 2020-11-26
KR101924326B1 (ko) 2018-12-03
US20170213563A1 (en) 2017-07-27
EP2617035A1 (en) 2013-07-24
IL296448A (en) 2022-11-01
IL265722B (en) 2020-11-30
JP7273218B2 (ja) 2023-05-12
AU2011304113A1 (en) 2013-03-07
US10706863B2 (en) 2020-07-07
CN104851429B (zh) 2018-10-19
JP7053912B2 (ja) 2022-04-12
RU2720495C1 (ru) 2020-04-30
KR20200013092A (ko) 2020-02-05
JP6736634B2 (ja) 2020-08-05
BR112013005676B1 (pt) 2021-02-09
IL303921A (en) 2023-08-01
RU2015105671A (ru) 2015-08-20
US9172342B2 (en) 2015-10-27
EP3975178B1 (en) 2022-11-16
IL285298A (en) 2021-09-30
US20180182404A1 (en) 2018-06-28
PL2617035T3 (pl) 2019-02-28
EP3975178A1 (en) 2022-03-30
EP4148732A1 (en) 2023-03-15
KR20140132370A (ko) 2014-11-17
JP2021081754A (ja) 2021-05-27
US11817110B2 (en) 2023-11-14
US20240046940A1 (en) 2024-02-08
US10446161B2 (en) 2019-10-15
KR20190099092A (ko) 2019-08-23
SG10201506914PA (en) 2015-10-29
KR102014696B1 (ko) 2019-08-27
KR20220123752A (ko) 2022-09-08
IL278478B (en) 2021-08-31
JP2020106867A (ja) 2020-07-09
PL3975178T3 (pl) 2023-03-13
CN104851429A (zh) 2015-08-19
CA2808353C (en) 2017-05-02
CA3102325A1 (en) 2012-03-22
KR102439053B1 (ko) 2022-09-02
JP2016173603A (ja) 2016-09-29
ES2933477T3 (es) 2023-02-09
WO2012034890A1 (en) 2012-03-22
CA3067155A1 (en) 2012-03-22
JP6755426B2 (ja) 2020-09-16
KR20230119038A (ko) 2023-08-14
IL259070A (en) 2018-06-28
BR122019025121B1 (pt) 2021-04-27
RU2682340C1 (ru) 2019-03-19
KR20130081290A (ko) 2013-07-16
KR101980070B1 (ko) 2019-05-20
IL291501A (en) 2022-05-01
CA3043428C (en) 2020-02-18
CN103262164A (zh) 2013-08-21
US20130182870A1 (en) 2013-07-18
US20190378525A1 (en) 2019-12-12
CA3168514A1 (en) 2012-03-22
IL253387A0 (en) 2017-09-28
US20220293113A1 (en) 2022-09-15
EP2617035B1 (en) 2018-10-03
JP2019012295A (ja) 2019-01-24
AU2011304113C1 (en) 2015-08-06
CA3168514C (en) 2023-04-11
PL3975177T3 (pl) 2023-04-11
KR102312475B1 (ko) 2021-10-14
ES2699750T3 (es) 2019-02-12
CA3191597C (en) 2024-01-02
KR20170060191A (ko) 2017-05-31
CA2961088C (en) 2019-07-02
US20160006406A1 (en) 2016-01-07
JP6849847B2 (ja) 2021-03-31
DK3975177T3 (da) 2023-01-30
JP2023086885A (ja) 2023-06-22
CA2808353A1 (en) 2012-03-22
EP4145445A1 (en) 2023-03-08
CA2961088A1 (en) 2012-03-22
RU2013117038A (ru) 2014-10-27
BR112013005676A2 (pt) 2016-05-03
IL291501B (en) 2022-12-01
CA3102325C (en) 2021-12-21
BR122019025142B1 (pt) 2021-04-27
RU2685993C1 (ru) 2019-04-23
JP7053912B6 (ja) 2022-05-16
US20200395025A1 (en) 2020-12-17
KR101610626B1 (ko) 2016-04-20
IL298230A (en) 2023-01-01
EP3975177A1 (en) 2022-03-30
IL298230B2 (en) 2023-11-01
JP6429966B2 (ja) 2018-11-28
JP6218889B2 (ja) 2017-10-25
IL298230B1 (en) 2023-07-01
RU2015105671A3 (es) 2018-08-27
MX2013002876A (es) 2013-04-08
IL291501B2 (en) 2023-04-01
RU2671619C2 (ru) 2018-11-02
EP3503100A1 (en) 2019-06-26
KR101744621B1 (ko) 2017-06-09
US10192562B2 (en) 2019-01-29
IL240068A (en) 2017-08-31
CA3067155C (en) 2021-01-19
KR20180128983A (ko) 2018-12-04
KR101863035B1 (ko) 2018-06-01
CA3137515C (en) 2022-09-20
CL2013000717A1 (es) 2013-07-05
KR102564590B1 (ko) 2023-08-09
IL253387B (en) 2018-06-28
IL240068A0 (en) 2015-08-31
CA3043428A1 (en) 2012-03-22
US9940941B2 (en) 2018-04-10
RU2020111638A (ru) 2021-09-20
IL285298B (en) 2022-04-01
SG188229A1 (en) 2013-04-30
CN103262164B (zh) 2015-06-17
US20190108850A1 (en) 2019-04-11
AU2011304113B2 (en) 2015-02-26
IL265722A (en) 2019-05-30
DK3975178T3 (da) 2022-12-05
JP2013537322A (ja) 2013-09-30
RU2551817C2 (ru) 2015-05-27
KR102073544B1 (ko) 2020-02-05
US9735750B2 (en) 2017-08-15
CA3220202A1 (en) 2012-03-22
JP2022088591A (ja) 2022-06-14
KR20210124538A (ko) 2021-10-14
RU2694587C1 (ru) 2019-07-16
CA3137515A1 (en) 2012-03-22
BR122019025115B1 (pt) 2021-04-13

Similar Documents

Publication Publication Date Title
ES2938725T3 (es) Transposición armónica basada en bloque de subbanda mejorado de producto cruzado
AU2023201183B2 (en) Cross Product Enhanced Subband Block Based Harmonic Transposition
RU2810281C1 (ru) Гармоническое преобразование на основе блока поддиапазонов, усиленное перекрестными произведениями
CA3239279A1 (en) Cross product enhanced subband block based harmonic transposition
BR122019025118B1 (pt) Sistema e método para gerar um sinal de tempo alongado e/ou um sinal de frequência transposta a partir de um sinal de entrada e meio de armazenamento legível por computador