ES2666150T3 - Descodificación de audio con pos-filtro selectivo - Google Patents

Descodificación de audio con pos-filtro selectivo Download PDF

Info

Publication number
ES2666150T3
ES2666150T3 ES14164773.5T ES14164773T ES2666150T3 ES 2666150 T3 ES2666150 T3 ES 2666150T3 ES 14164773 T ES14164773 T ES 14164773T ES 2666150 T3 ES2666150 T3 ES 2666150T3
Authority
ES
Spain
Prior art keywords
post
filter
signal
module
decoder
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES14164773.5T
Other languages
English (en)
Inventor
Barbara Resch
Kristofer Kjoerling
Lars Villemoes
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dolby International AB
Original Assignee
Dolby International AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=44504387&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=ES2666150(T3) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Dolby International AB filed Critical Dolby International AB
Application granted granted Critical
Publication of ES2666150T3 publication Critical patent/ES2666150T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01LMEASURING FORCE, STRESS, TORQUE, WORK, MECHANICAL POWER, MECHANICAL EFFICIENCY, OR FLUID PRESSURE
    • G01L19/00Details of, or accessories for, apparatus for measuring steady or quasi-steady pressure of a fluent medium insofar as such details or accessories are not special to particular types of pressure gauges
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/028Noise substitution, i.e. substituting non-tonal spectral components by noisy source
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/03Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/083Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being an excitation gain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/09Long term prediction, i.e. removing periodical redundancies, e.g. by using adaptive codebook or pitch predictor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • G10L19/125Pitch excitation, e.g. pitch synchronous innovation CELP [PSI-CELP]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • G10L19/265Pre-filtering, e.g. high frequency emphasis prior to encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/003Changing voice quality, e.g. pitch or formants
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/003Changing voice quality, e.g. pitch or formants
    • G10L21/007Changing voice quality, e.g. pitch or formants characterised by the process used
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/003Changing voice quality, e.g. pitch or formants
    • G10L21/007Changing voice quality, e.g. pitch or formants characterised by the process used
    • G10L21/013Adapting to target pitch
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
    • G10L19/107Sparse pulse excitation, e.g. by using algebraic codebook

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • General Physics & Mathematics (AREA)
  • Algebra (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Physics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Lubrication Details And Ventilation Of Internal Combustion Engines (AREA)
  • Fats And Perfumes (AREA)
  • Stereo-Broadcasting Methods (AREA)
  • Filters For Electric Vacuum Cleaners (AREA)

Abstract

Un sistema descodificador (400; 500; 700; 1000) para descodificar una señal de flujo de bits como una señal de tiempo de audio, que incluye: una sección (410; 511, 512, 513; 711, 712, 713; 1011, 1013) de descodificación para descodificar una señal de flujo de bits como una señal preliminar de tiempo de audio; y un pos-filtro de atenuación de ruido inter-armónico (440; 540; 740; 1040) para filtrar la señal preliminar de tiempo de audio con el fin de obtener una señal de tiempo de audio, en el cual la atenuación de ruido inter-armónico está controlada por una ganancia del pos-filtro, que comprende una sección de control adaptada para inhabilitar de manera selectiva el pos-filtro, fijando la ganancia del pos-filtro a cero, en respuesta únicamente a la información de pos-filtrado codificada en la señal de flujo de bits, siendo la información de pos-filtrado indicativa de una decisión por parte del codificador en cuanto a inhabilitar o no el pos-filtrado, en el cual la señal preliminar de tiempo de audio es emitida como la señal de tiempo de audio.

Description

5
10
15
20
25
30
35
40
45
50
55
60
DESCRIPCIÓN
Descodificación de audio con pos-filtro selectivo Campo técnico
La presente invención se refiere, en general, a la codificación de audio digital y, más precisamente, a técnicas de codificación para señales de audio que contienen componentes de distintos caracteres.
Antecedentes
Una extendida clase de métodos de codificación para señales de audio que contienen habla o canto incluye la predicción lineal excitada por código (CELP) aplicada en la alternación en el tiempo con distintos métodos de codificación, que incluyen métodos de codificación del dominio de la frecuencia, especialmente adaptados para la música, o métodos de naturaleza general, para admitir variaciones en el carácter entre sucesivos periodos de tiempo de la señal de audio. Por ejemplo, un descodificador simplificado de Codificación Unificada de Habla y Audio (USAC; véase la norma ISO / IEC 23003-3) del Grupo de Expertos en Imágenes en Movimiento (MPEG) es operable en al menos tres modalidades de descodificación, la Codificación Avanzada de Audio (AAC; véase la norma ISO / IEC 13818-7), la CELP algebraica (ACELP) y la excitación codificada por transformación (TCX), según se muestra en la parte superior de la figura 2 adjunta.
Las diversas realizaciones de la CELP están adaptadas a las propiedades de los órganos humanos del habla y, posiblemente, al sentido humano del oído. Según se usa en esta solicitud, la CELP se referirá a todas las posibles realizaciones y variantes, incluyendo, pero sin limitarse a, la ACELP, la CELP de banda ancha y estrecha, la SB- CELP (CELP de sub-banda), la CELP de baja y alta velocidad, la RCELP (CELP relajada), la LD-CELP (CELP de bajo retardo), la CS-CELP (CeLP de estructura conjugada), la CS-ACELP (ACELP de estructura conjugada), la PSI- CELP (CELP de innovación sincrónica en tono) y la VSELP (predicción lineal excitada por suma vectorial). Los principios de la CELP son expuestos por R. Schroeder y S. Atal en los Anales de la Conferencia Internacional del IEEE sobre Acústica, Habla y Procesamiento de Señales (ICASSP), vol. 10, págs. 937 a 940, 1985, y algunas de sus aplicaciones están descritas en las referencias 25 a 29 citadas en la publicación de Chen y Gersho en las Transacciones del IEEE sobre Habla y Procesamiento de Audio, vol. 3, n° 1, de 1995. Según lo adicionalmente detallado en el artículo anterior, un descodificador de CELP (o, análogamente, un sintetizador de habla de CELP) puede incluir un predictor de tono, que restaura el componente periódico de una señal de habla codificada, y un libro de códigos de pulsos, desde el cual se añade una secuencia de innovación. El predictor de tono puede incluir, a su vez, un predictor de retardo largo para restaurar el tono y un predictor de retardo corto para restaurar las regiones formantes por medio de la modelación del envolvente espectral. En este contexto, el tono se concibe, en general, como la frecuencia fundamental del componente sonoro tonal producido por las cuerdas vocales, y adicionalmente realzado por las partes resonantes del conducto vocal. Esta frecuencia, junto con sus armónicos, dominará el habla o el canto. En términos generales, los métodos de CELP son los más adecuados para el procesamiento del canto solo o unipersonal, para el cual la frecuencia del tono está bien definida y es relativamente fácil de determinar.
Para mejorar la calidad percibida del habla codificada por CELP, es práctica común combinarla con el pos-filtrado (o realce tonal, en otras palabras). La Patente Estadounidense N° 4.969.192 y la sección II del artículo de Chen y Gersho revelan propiedades deseables de tales pos-filtros, esto es, su capacidad de suprimir los componentes de ruido situados entre los armónicos del tono vocal detectado (parte a largo plazo, véase la sección IV). Se cree que una parte importante de este ruido emana del modelado del envolvente espectral. La parte a largo plazo de un posfiltro sencillo puede ser diseñada para que tenga la siguiente función de transferencia:
imagen1
donde T es un periodo tonal estimado en términos del número de muestras y a es una ganancia del pos-filtro, según se muestra en las figuras 1 y 2. De manera similar a un filtro peine, un filtro de ese tipo atenúa las frecuencias 1/(2T), 3/(2T), 5/(2T), ..., que están situadas a mitad de camino entre los armónicos de la frecuencia tonal y las frecuencias adyacentes. La atenuación depende del valor de la ganancia a. Los pos-filtros levemente más sofisticados aplican esta atenuación solamente a las frecuencias bajas - de aquí, el término habitualmente usado de pos-filtro bajo - donde el ruido es más perceptible. Esto puede ser expresado aplicando en cascada la función de transferencia HE descrita anteriormente y un filtro HLp de paso bajo. Así, el valor descodificado pos-procesado de SE proporcionado por el pos-filtro estará dado, en el dominio de transformación, por
imagen2
5
10
15
20
25
30
35
40
45
50
55
60
donde
y S es la señal descodificada que es suministrada como entrada al pos-filtro. La Figura 3 muestra una realización de un pos-filtro con estas características, que es adicionalmente expuesto en la sección 6.1.3 de la Especificación Técnica ETSI TS 126 290, versión 6.3.0, edición 6. Como sugiere esta figura, la información tonal está codificada como un parámetro en la señal del flujo de bits y es extraída por un módulo de rastreo tonal, conectado comunicativamente con el filtro de predicción a largo plazo que lleva a cabo las operaciones expresadas por Plt.
La parte a largo plazo descrita en el párrafo anterior puede ser usada sola. Alternativamente, se dispone en serie con un filtro modelador del ruido que preserva los componentes en los intervalos de frecuencia correspondientes a las regiones formantes y que atenúa el ruido en otras regiones espectrales (parte a corto plazo; véase la sección III), es decir, en los ‘valles espectrales’ de la envolvente de región formante. Como otra posible variación, este grupo de filtros está adicionalmente suplementado por un filtro de tipo de paso alto, para reducir un deterioro percibido, debido al declive espectral de la parte a corto plazo.
El documento M. Neuendorf (ed.): WD7 de USAC, 92ésima Reunión del MPEG, Dresde, N11299, y la Solicitud Internacional publicada como WO 99/38144 A1 revelan sistemas de procesamiento de audio con la aplicación selectiva del pos-filtrado.
Las señales de audio que contienen una mezcla de componentes de distintos orígenes - por ejemplo, tonal, no tonal, vocal, instrumental, no musical - no siempre son reproducidas por las tecnologías disponibles de codificación digital de manera satisfactoria. Más precisamente, ha sido observado que las tecnologías disponibles son deficientes en la manipulación de tal material de audio no homogéneo, favoreciendo generalmente a uno de los componentes en perjuicio del otro. En particular, la música que contiene canto acompañado por uno o más instrumentos o partes corales, que ha sido codificada por métodos de la naturaleza descrita anteriormente, será a menudo descodificada con distorsiones perceptibles que arruinan parte de la experiencia auditiva.
Resumen de la invención
A fin de mitigar al menos algunos de los inconvenientes esbozados en la sección anterior, es un objeto proporcionar métodos y dispositivos adaptados para la codificación y descodificación de audio de las señales que contienen una mezcla de componentes de distintos orígenes. Como objetos específicos, la invención busca proporcionar aquellos métodos y dispositivos que sean adecuados desde el punto de vista de la eficacia de codificación o la fidelidad (percibida) de reproducción, o ambas.
La invención logra al menos uno de estos objetos proporcionando un sistema descodificador, un método de descodificación y un producto de programa de ordenador para llevar a cabo el método, según lo definido en las reivindicaciones independientes. Las reivindicaciones dependientes definen realizaciones de la invención.
Los inventores han percibido que algunas distorsiones percibidas en las señales de audio descodificadas de origen no homogéneo provienen de una conmutación inadecuada entre varias modalidades de codificación, de las cuales al menos una incluye el pos-filtrado en el descodificador y al menos una no lo hace. Más precisamente, los pos-filtros disponibles eliminan no solamente el ruido inter-armónico (y, donde corresponda, el ruido en los valles espectrales), sino también los componentes de señales que representan acompañamiento instrumental o vocal, y otro material de naturaleza ‘deseable’. El hecho de que la diferencia apenas perceptible en los valles espectrales puede ser tan grande como de 10 dB (según lo observado por Ghitza y Goldstein, Trans. del IEEE sobre Acústica, Habla y Procesamiento de Señales, vol. ASSP-4, págs. 697 a 708, de 1986) puede haber sido tomado como justificación por muchos diseñadores para filtrar con severidad estas bandas de frecuencia. La degradación de la calidad por la misma atenuación inter-armónica (y de valle espectral) puede, sin embargo, ser menos importante que la de las ocasiones de conmutación. Cuando el pos-filtro está activado, el fondo de una voz cantante suena repentinamente atenuado y, cuando el filtro es desactivado, el fondo se hace instantáneamente más sonoro. Si la conmutación tiene lugar frecuentemente, debido a la naturaleza de la señal de audio o a la configuración del dispositivo de codificación, habrá una distorsión de conmutación. Como ejemplo, un descodificador de USAC puede ser operable tanto en una modalidad de ACELP combinada con el pos-filtrado como en una modalidad de tCx sin pos-filtrado. La modalidad de ACELP se usa en episodios donde está presente un componente vocal dominante. De tal modo, la conmutación a la modalidad de ACELP puede ser activada por el inicio del canto, tal como al principio de una nueva frase musical, al comienzo de un nuevo verso, o simplemente después de un episodio donde se considera que el acompañamiento sofoca la voz cantante, en el sentido de que el componente vocal ya no es prominente. Los experimentos han confirmado que una solución alternativa, o más bien una elusión del problema, por la cual se usa la codificación TCX en toda su extensión (y la modalidad ACELP es inhabilitada), no remedia el problema, ya que aparecen distorsiones como de reverberación.
imagen3
5
10
15
20
25
30
35
40
45
50
55
60
65
Se hace notar que los métodos y aparatos revelados en esta sección pueden ser aplicados, después de modificaciones adecuadas dentro de las capacidades del experto, que incluyen la experimentación rutinaria, a la codificación de señales con varios componentes, posiblemente correspondientes a distintos canales, tales como canales estéreo. A lo largo de la presente solicitud, el realce tonal y el pos-filtrado son usados como sinónimos. Se hace notar además que la AAC está expuesta como un ejemplo representativo de métodos de codificación del dominio de la frecuencia. En efecto, la aplicación de la invención a un descodificador o codificador operable en una modalidad de codificación del dominio de frecuencia, distinta a la AAC, solamente requerirá pequeñas modificaciones, si acaso, dentro de las capacidades del experto. De manera similar, TCX se menciona como un ejemplo de codificación por transformación de predicción lineal ponderada y de codificación por transformación en general.
Las características de dos o más realizaciones descritas anteriormente en la presente memoria pueden ser combinadas, a menos que sean claramente complementarias, en realizaciones adicionales. El hecho de que dos características sean mencionadas en distintas reivindicaciones no excluye que puedan ser combinadas con ventaja. Análogamente, también pueden ser proporcionadas realizaciones adicionales por la omisión de ciertas características que no sean necesarias o no sean esenciales para el propósito deseado.
Breve descripción de los dibujos
Se describirán ahora realizaciones de la presente invención con referencia a los dibujos adjuntos, en los cuales:
la figura 1 es un diagrama de bloques que muestra un descodificador convencional con pos-filtro;
la figura 2 es un diagrama de bloques esquemático de un descodificador convencional operable en modalidad de AAC, ACELP y TCX, y que incluye un pos-filtro permanentemente conectado aguas abajo del módulo de ACELP;
la figura 3 es un diagrama de bloques que ilustra la estructura de un pos-filtro;
las figuras 4 y 5 son diagramas de bloques de dos descodificadores de acuerdo a la invención;
las figuras 6 y 7 son diagramas de bloques que ilustran diferencias entre un descodificador convencional (figura 6) y un descodificador (figura 7) de acuerdo a la invención;
la figura 8 es un diagrama de bloques de un codificador;
las figuras 9 y 10 son diagramas de bloques que ilustran diferencias entre un descodificador convencional (figura 9) y un descodificador (figura 10) de acuerdo a la invención; y
la figura 11 es un diagrama de bloques de un pos-filtro autónomo que puede ser activado y desactivado selectivamente.
Descripción detallada de realizaciones
La figura 4 es un dibujo esquemático de un sistema descodificador 400 de acuerdo a una realización de la invención, que tiene como su entrada una señal de flujo de bits y como su salida una señal de audio. Como en los descodificadores convencionales mostrados en la figura 1, un pos-filtro 440 está dispuesto aguas abajo de un módulo descodificador 410, pero puede ser incorporado a, o apartado de, el trayecto de descodificación, operando un conmutador 442. El pos-filtro está habilitado en la posición de conmutación mostrada en la figura. Sería inhabilitado si el conmutador se fijara en la posición opuesta, por lo cual la señal del módulo descodificador 410, en cambio, sería conducida por la línea 444 de omisión. Como una contribución inventiva, el conmutador 442 es controlable por la información de pos-filtrado contenida en la señal del flujo de bits, de modo que el pos-filtrado pueda ser aplicado y eliminado, independientemente del estado actual del módulo descodificador 410. Debido a que un pos-filtro 440 funciona con algún retardo - por ejemplo, el pos-filtro mostrado en la figura 3 introducirá un retardo equivalente al menos al periodo tonal T - un módulo 443 de retardo de compensación está dispuesto en la línea 444 de omisión para mantener los módulos en una condición sincronizada en la conmutación. El módulo 443 de retardo retarda la señal en el mismo periodo que lo haría el pos-filtro 440, pero no procesa de otro modo la señal. Para minimizar el tiempo de traspaso, el módulo 443 de retardo de compensación recibe la misma señal que el pos-filtro 440 en todo momento. En una realización alternativa, donde el pos-filtro 440 es reemplazado por un pos-filtro de retardo cero (por ejemplo, un filtro causal, tal como un filtro con dos tomas, independiente de futuros valores de señal), el módulo 443 de retardo de compensación puede ser omitido.
La figura 5 ilustra un desarrollo adicional de acuerdo a las revelaciones de la invención del sistema descodificador 500 de triple modalidad de la figura 2. Un módulo descodificador 511 de ACELP está dispuesto en paralelo con un módulo descodificador 512 de TCX y un módulo descodificador 513 de AAC. En serie con el módulo descodificador
5
10
15
20
25
30
35
40
45
50
55
60
65
511 de ACELP está dispuesto un pos-filtro 540 para atenuar el ruido, en particular, el ruido situado entre armónicos de una frecuencia tonal, directamente o indirectamente obtenible de la señal del flujo de bits para el cual está adaptado el sistema descodificador 500. La señal del flujo de bits también codifica información de pos-filtrado que gobierna las posiciones del conmutador superior 541 operable para conmutar el pos-filtro 540 fuera del trayecto de procesamiento y reemplazarlo por un retardo 543 de compensación como en la figura 4. Un conmutador inferior 542 se usa para conmutar entre distintas modalidades de descodificación. Con esta estructura, la posición del conmutador superior 541 es irrelevante cuando se usa uno de los módulos 512, 513 de TCX o AAC; por tanto, la información de pos-filtrado no necesariamente indica esta posición, excepto en la modalidad de ACELP. Cualquiera que sea la modalidad de descodificación que se está usando actualmente, la señal es suministrada desde el punto de conexión aguas abajo del conmutador inferior 542 hasta un módulo 550 de copia de banda espectral (SBR), que emite una señal de audio. El experto se dará cuenta de que el dibujo es de naturaleza conceptual, como queda notablemente claro a partir de los conmutadores, que se muestran esquemáticamente como entidades físicas distintas con medios móviles de contacto. En una posible implementación realista del sistema descodificador, los conmutadores, así como los otros módulos, estarán realizados por instrucciones legibles por ordenador.
Las figuras 6 y 7 también son diagramas de bloques de dos sistemas descodificadores de triple modalidad, operables en una modalidad de descodificación ACELP, TCX o del dominio de frecuencia. Con referencia a la última figura, que muestra una realización de la invención, una señal del flujo de bits es suministrada a un punto 701 de entrada, que está a su vez permanentemente conectado, mediante los ramales respectivos, con los tres módulos descodificadores 711, 712, 713. El punto 701 de entrada también tiene un ramal conector 702 (no presente en el sistema descodificador convencional de la figura 6) con un módulo 740 de realce tonal, que actúa como un pos-filtro del tipo general descrito anteriormente. Como es práctica común en la técnica, un primer módulo 703 de ventanas de transición está dispuesto aguas abajo de los módulos 711, 712 de ACELP y TCX, para llevar a cabo las transiciones entre los módulos descodificadores. Un segundo módulo 704 de transición está dispuesto aguas abajo del módulo descodificador 713 del dominio de frecuencia y del primer módulo 703 de ventanas de transición, para llevar a cabo la transición entre las dos super-modalidades. Además, un módulo 750 de SBR está proporcionado inmediatamente aguas arriba del punto 705 de salida. Es claro que la señal de flujo de bits es suministrada directamente (o después del demultiplexado, según corresponda) a los tres módulos descodificadores 711,712, 713 y al módulo 740 de realce tonal. La información contenida en el flujo de bits controla qué módulo de descodificación ha de estar activo. Por parte de la invención, sin embargo, el módulo 740 de realce tonal realiza una análoga auto- activación que, en respuesta a información de pos-filtrado en el flujo de bits, puede actuar como un pos-filtro o, simplemente, como un dispositivo de traspasamiento. Esto, por ejemplo, puede ser realizado mediante la provisión de una sección de control (no mostrada) en el módulo 740 de realce tonal, por medio del cual la acción de posfiltrado puede ser activada o desactivada. El módulo 740 de realce tonal está siempre en su modalidad de traspasamiento cuando el sistema descodificador funciona en el dominio de frecuencia o la modalidad de descodificación TCX, en donde, en rigor, no es necesaria ninguna información de pos-filtrado. Se entiende que los módulos que no forman parte de la contribución inventiva, y cuya presencia es obvia para el experto, por ejemplo, un demultiplexador, han sido omitidos de la figura 7 y de otros dibujos similares, para aumentar la claridad.
Como variación, el sistema descodificador de la figura 7 puede estar equipado con un módulo de control (no mostrado) para decidir si ha de aplicarse o no el pos-filtrado, usando un enfoque de análisis por síntesis. Tal módulo de control está comunicativamente conectado con el módulo 740 de realce tonal y con el módulo 711 de ACELP, desde el cual extrae una señal descodificada intermedia si_DEC(n) que representa una etapa intermedia en el proceso de descodificación, preferiblemente, una correspondiente a la excitación de la señal. El módulo de detección tiene la información necesaria para simular la acción del módulo 740 de realce tonal, según lo definido por las funciones de transferencia Plt(z) y HLP(z) (véase la sección Antecedentes y la figura 3) o, equivalentemente, sus respuestas de impulso de filtro pLT(z) y hLP(n). Como se desprende de la exposición en la sección Antecedentes, el componente a restar en el pos-filtrado puede ser estimado por una señal de diferencia aproximada sAD(n) que es proporcional a [(si_DEC * PLT) * hLp](n), donde * indica la convolución discreta. Esto es una aproximación de la verdadera diferencia entre la señal de audio original y la señal descodificada pos-filtrada, a saber,
SoRiG(n) - SE(n) = SoRiG(n) - (soEc(n) - o[sdec * Plt * hLp](n)),
donde a es la ganancia del pos-filtro. Estudiando la energía total, la energía de banda baja, la tonalidad, el espectro efectivo de magnitudes o los espectros de magnitudes pasadas de la señal, según lo revelado en la sección Resumen y las reivindicaciones, la sección de control puede hallar una base para la decisión de activar o desactivar el módulo 740 de realce tonal.
La figura 8 muestra un sistema codificador 800. El sistema codificador 800 está adaptado para procesar señales de audio digital, que son generalmente obtenidas capturando una onda sonora por parte de un micrófono, y transduciendo la onda hacia una señal eléctrica analógica. La señal eléctrica es luego muestreada en una señal digital susceptible de ser suministrada, en un formato adecuado, al sistema codificador 800. El sistema consiste, en general, en un módulo codificador 810, un módulo 820 de decisión y un multiplexador 830. En virtud de los conmutadores 814, 815 (simbólicamente representados), el módulo codificador 810 es operable en una modalidad CELP, TCX o bien AAC, activando selectivamente los módulos 811, 812, 813. El módulo 820 de decisión aplica uno
5
10
15
20
25
30
35
40
45
50
55
60
o más criterios predefinidos para decidir si se inhabilita o no el pos-filtrado durante la descodificación de una señal de flujo de bits producida por el sistema codificador 800 para codificar una señal de audio. Con este fin, el módulo 820 de decisión puede examinar la señal de audio directamente o puede recibir datos desde el módulo codificador 810 mediante una línea 816 de conexión. Una señal indicativa de la decisión adoptada por el módulo 820 de decisión es suministrada, junto con la señal de audio codificada proveniente del módulo codificador 810, a un multiplexador 830, que concatena las señales en un flujo de bits que constituye la salida del sistema codificador 800.
Preferiblemente, el módulo 820 de decisión basa su decisión sobre una señal de diferencia aproximada calculada a partir de una señal descodificada intermedia sí_dec, que puede ser restada del módulo codificador 810. La señal descodificada intermedia representa una etapa intermedia en el proceso de descodificación, según lo expuesto en los párrafos precedentes, pero puede ser extraída desde una etapa correspondiente del proceso de codificación. Sin embargo, en el sistema codificador 800 está disponible la señal de audio original sorig, de modo que, ventajosamente, la señal de diferencia aproximada se forme como:
SoRiG(n) - (s¡_dec(h) - a [(s¡_dec * Plt) * ht,p](n)).
La aproximación reside en el hecho de que la señal descodificada intermedia se usa en lugar de la señal descodificada final. Esto permite una valoración de la naturaleza del componente que un pos-filtro eliminaría en la descodificación y, aplicando uno de los criterios expuestos en la sección Resumen, el módulo 820 de decisión podrá adoptar una decisión en cuanto a inhabilitar o no el pos-filtrado.
Como una variación de esto, el módulo 820 de decisión puede usar la señal original en lugar de una señal descodificada intermedia, de modo que la señal de diferencia aproximada sea [(smdec * plt) * hLP](n). Es probable que esto sea una aproximación menos fiel pero, por otra parte, hace optativa la presencia de una línea 816 de conexión entre el módulo 820 de decisión y el módulo codificador 810.
En otras variaciones de ese tipo de esta realización, donde el módulo 820 de decisión estudia directamente la señal de audio, pueden aplicarse uno o más de los siguientes criterios:
• ¿Contiene la señal de audio tanto un componente con frecuencia fundamental dominante como un componente situado por debajo de la frecuencia fundamental? (La frecuencia fundamental puede ser suministrada como un subproducto del módulo codificador 810).
• ¿Contiene la señal de audio tanto un componente con frecuencia fundamental dominante como un componente situado entre los armónicos de la frecuencia fundamental?
• ¿Contiene la señal de audio energía significativa de señal por debajo de la frecuencia fundamental?
• ¿Es (probable que sea) preferible la descodificación pos-filtrada a la descodificación no filtrada con respecto a la optimalidad de velocidad-distorsión?
En todas las variaciones descritas de la estructura codificadora mostrada en la figura 8 - es decir, independientemente de la base del criterio de detección - la sección 820 de decisión puede ser habilitada para decidir sobre un avance gradual o una eliminación gradual del pos-filtrado, a fin de lograr transiciones suaves. El avance y la eliminación graduales pueden ser controlados ajustando la ganancia de pos-filtro.
La figura 9 muestra un descodificador convencional operable en una modalidad de descodificación de frecuencia y en una modalidad de descodificación de CELP, según la señal de flujo de bits suministrada al descodificador. El posfiltrado se aplica toda vez que se selecciona la modalidad de descodificación de CELP. Una mejora de este descodificador se ilustra en la figura 10, que muestra un descodificador 1000 de acuerdo a una realización de la invención. Este descodificador es operable no solamente en una modalidad de descodificación basada en el dominio de frecuencia, en la cual está activo el módulo descodificador 1013 del dominio de frecuencia, y en una modalidad de descodificación de CELP filtrada, en la cual están activos el módulo descodificador 1011 de CELP y el pos-filtro 1040, sino también en una modalidad de CELP no filtrada, en la cual el módulo 1011 de CELP suministra su señal a un módulo 1043 de retardo de compensación, mediante una línea 1044 de omisión. Un conmutador 1042 controla qué modalidad de descodificación se usa actualmente, en respuesta a la información de pos-filtrado contenida en la señal del flujo de bits proporcionada al descodificador 1000. En este descodificador y en el de la figura 9, la última etapa de procesamiento es efectuada por un módulo 1050 de SBR, desde el cual es emitida la señal de audio final.
La figura 11 muestra un pos-filtro 1100 adecuado para ser dispuesto aguas abajo de un descodificador 1199. El filtro 1100 incluye un módulo 1140 de pos-filtrado, que es habilitado o inhabilitado por un módulo de control (no mostrado), notablemente, un controlador de ganancia binario o no binario, en respuesta a una señal de pos-filtrado recibida desde un módulo 1120 de decisión dentro del pos-filtro 1100. El módulo de decisión realiza una o más pruebas sobre la señal obtenida desde el descodificador, para llegar a una decisión en cuanto a si el módulo 1140
5
10
15
20
25
30
35
de pos-filtrado ha de estar activo o inactivo. La decisión puede ser tomada según la funcionalidad del módulo 820 de decisión en la figura 8, que usa la señal original y/o una señal descodificada intermedia para predecir la acción del pos-filtro. La decisión del módulo 1120 de decisión también puede basarse en información similar a la que los módulos de decisión usan en esas realizaciones donde se forma una señal descodificada intermedia. Como ejemplo, el módulo 1120 de decisión puede estimar una frecuencia de tono (a menos que esto sea inmediatamente extraíble desde la señal del flujo de bits) y calcular el contenido de energía en la señal por debajo de la frecuencia de tono y entre sus armónicos. Si este contenido de energía es significativo, probablemente representa un componente de señal relevante, en lugar de ruido, lo que motiva una decisión para inhabilitar el módulo 1140 de pos-filtrado.
Una prueba de escucha de 6 personas ha sido llevada a cabo, durante la cual muestras musicales codificadas y descodificadas de acuerdo a la invención fueron comparadas con muestras de referencia que contenían la misma música codificada, aplicando el pos-filtrado de la manera convencional, pero manteniendo sin cambios todos los otros parámetros. Los resultados confirman una mejora percibida de la calidad.
Realizaciones adicionales de la presente invención devendrán evidentes para una persona experta en la técnica, después de leer la descripción anterior. Incluso aunque la presente descripción y los dibujos revelan realizaciones y ejemplos, la invención no está restringida a estos ejemplos específicos. Pueden hacerse numerosas modificaciones y variaciones sin apartarse del alcance de la presente invención, que está definido por las reivindicaciones adjuntas.
Los sistemas y métodos revelados anteriormente en la presente memoria pueden ser implementados como software, firmware, hardware o una combinación de los mismos. Ciertos componentes, o todos los componentes, pueden ser implementados como software ejecutado por un procesador de señales digitales o un micro-procesador, o ser implementados como hardware, o como un circuito integrado específico de la aplicación. Tal software puede ser distribuido en medios legibles por ordenador, que pueden comprender medios de almacenamiento de ordenadores (o medios no transitorios) y medios de comunicación (o medios transitorios). Como es bien sabido para una persona experta en la técnica, los medios de almacenamiento de ordenadores incluyen medios tanto volátiles como no volátiles, extraíbles como no extraíbles, implementados en cualquier método o tecnología para el almacenamiento de información, tal como instrucciones legibles por ordenador, estructuras de datos, módulos de programa u otros datos. Los medios de almacenamiento de ordenadores incluyen, pero no se limitan a, las memorias RAM, ROM, EE-PROM, la memoria flash u otra tecnología de memoria, CD-ROM, discos versátiles digitales (DVD) u otro almacenamiento de disco óptico, casetes magnéticos, cinta magnética, almacenamiento de disco magnético u otros dispositivos de almacenamiento magnético, o cualquier otro medio que pueda ser usado para almacenar la información deseada y que pueda ser objeto de acceso por parte de un ordenador. Además, es bien sabido para el experto que los medios de comunicación realizan habitualmente instrucciones legibles por ordenador, estructuras de datos, módulos de programa u otros datos en una señal de datos modulados, tal como una onda portadora u otro mecanismo de transporte, e incluyen cualquier medio de suministro de información.

Claims (10)

  1. 5
    10
    15
    20
    25
    30
    35
    40
    45
    50
    55
    60
    REIVINDICACIONES
    1. Un sistema descodificador (400; 500; 700; 1000) para descodificar una señal de flujo de bits como una señal de tiempo de audio, que incluye:
    una sección (410; 511, 512, 513; 711, 712, 713; 1011, 1013) de descodificación para descodificar una señal de flujo de bits como una señal preliminar de tiempo de audio; y
    un pos-filtro de atenuación de ruido inter-armónico (440; 540; 740; 1040) para filtrar la señal preliminar de tiempo de audio con el fin de obtener una señal de tiempo de audio, en el cual la atenuación de ruido inter-armónico está controlada por una ganancia del pos-filtro, que comprende una sección de control adaptada para inhabilitar de manera selectiva el pos-filtro, fijando la ganancia del pos-filtro a cero, en respuesta únicamente a la información de pos-filtrado codificada en la señal de flujo de bits, siendo la información de pos-filtrado indicativa de una decisión por parte del codificador en cuanto a inhabilitar o no el pos-filtrado, en el cual la señal preliminar de tiempo de audio es emitida como la señal de tiempo de audio.
  2. 2. El sistema descodificador de la reivindicación 1, en el cual el pos-filtrado está adaptado para atenuar solamente aquellos componentes espectrales que estén situados por debajo de una frecuencia predeterminada de corte.
  3. 3. El sistema descodificador de la reivindicación 1, en el cual la sección de descodificación comprende adicionalmente:
    un módulo (511; 711; 1011) descodificador de predicción lineal excitada por código, CELP; y
    un módulo (512; 712) descodificador de excitación codificada por transformación, TCX, para descodificar una señal de flujo de bits como una señal de tiempo de audio,
    estando la sección de control adaptada para operar el sistema descodificador al menos en las siguientes modalidades:
    a) el módulo de TCX está habilitado y el pos-filtro está inhabilitado;
    b) el módulo de CELP y el pos-filtro están habilitados; y
    c) el módulo de CELP está habilitado y el pos-filtro está inhabilitado, en donde la señal preliminar de tiempo de audio y la señal de tiempo de audio coinciden.
  4. 4. El sistema descodificador de la reivindicación 1, incluyendo dicha sección de descodificación un módulo de descodificación del habla, en el cual una frecuencia de tono estimada por una sección de predicción a largo plazo en el codificador se codifica en la señal de flujo de bits, y en el cual el pos-filtro está adaptado para atenuar los componentes espectrales situados entre los armónicos de la frecuencia de tono.
  5. 5. El sistema descodificador de la reivindicación 1, en el cual la señal de flujo de bits contiene una representación de una frecuencia de tono y el pos-filtro está adaptado para atenuar los componentes espectrales situados entre los armónicos de la frecuencia de tono.
  6. 6. El sistema descodificador de la reivindicación 4 o la reivindicación 5,
    en el cual el pos-filtro está adaptado para atenuar únicamente dichos componentes espectrales que están situados por debajo de una frecuencia predeterminada de corte, y
    en el cual la sección descodificadora comprende adicionalmente un módulo (513; 713) descodificador de Codificación Avanzada de Audio, AAC, para descodificar una señal de flujo de bits como una señal de tiempo de audio,
    estando la sección de control adaptada para operar el sistema descodificador también en la siguiente modalidad:
    d) el módulo de AAC está habilitado y el pos-filtro está inhabilitado.
  7. 7. El sistema descodificador de la reivindicación 1, en el cual la señal del flujo de bits está segmentada en tramas de tiempo, y la sección de control está adaptada para inhabilitar una trama de tiempo entera o una secuencia de tramas de tiempo enteras.
  8. 8. El sistema descodificador de la reivindicación 7, en el cual y la sección de control está adicionalmente adaptada para recibir, para cada trama de tiempo en un flujo de bits del Grupo de Expertos de Imágenes en Movimiento, MPEG, un campo de datos asociado a esta trama de tiempo, y es operable, en respuesta al valor del campo de datos, para inhabilitar el pos-filtro.
  9. 9. El sistema descodificador de la reivindicación 1, en el cual la sección de control está adaptada para disminuir y/o aumentar gradualmente la ganancia del pos-filtro.
    5 10. Un método de descodificación de una señal de flujo de bits como una señal de tiempo de audio, que incluye las
    etapas de:
    descodificar una señal de flujo de bits como una señal preliminar de tiempo de audio; y
    10 pos-filtrar la señal preliminar de tiempo de audio atenuando el ruido inter-armónico, obteniendo por ello una señal de tiempo de audio, en el cual la atenuación del ruido inter-armónico está controlada por una ganancia del pos-filtro,
    en el cual el paso de pos-filtrado se omite de manera selectiva, fijando la ganancia del pos-filtro a cero, en respuesta únicamente a la información de pos-filtrado codificada en la señal de flujo de bits, siendo la información de posfiltrado indicativa de una decisión por parte del codificador en cuanto a inhabilitar o no el pos-filtrado.
    15
  10. 11. Un producto de programa de ordenador que incluye un portador de datos que almacena instrucciones adaptado para realizar el método de la reivindicación 10.
ES14164773.5T 2010-07-02 2011-06-23 Descodificación de audio con pos-filtro selectivo Active ES2666150T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US36123710P 2010-07-02 2010-07-02
US361237P 2010-07-02

Publications (1)

Publication Number Publication Date
ES2666150T3 true ES2666150T3 (es) 2018-05-03

Family

ID=44504387

Family Applications (6)

Application Number Title Priority Date Filing Date
ES16166358.8T Active ES2683648T3 (es) 2010-07-02 2011-06-23 Descodificación de audio con pos-filtración selectiva
ES16166356.2T Active ES2683647T3 (es) 2010-07-02 2011-06-23 Descodificación de audio con pos-filtración selectiva
ES19196423T Active ES2902392T3 (es) 2010-07-02 2011-06-23 Descodificación de audio con pos-filtración selectiva
ES14164773.5T Active ES2666150T3 (es) 2010-07-02 2011-06-23 Descodificación de audio con pos-filtro selectivo
ES16166357.0T Active ES2691934T3 (es) 2010-07-02 2011-06-23 Descodificación de audio con pos-filtro selectivo
ES11743032.2T Active ES2484794T3 (es) 2010-07-02 2011-06-23 Pos-filtro selectivo

Family Applications Before (3)

Application Number Title Priority Date Filing Date
ES16166358.8T Active ES2683648T3 (es) 2010-07-02 2011-06-23 Descodificación de audio con pos-filtración selectiva
ES16166356.2T Active ES2683647T3 (es) 2010-07-02 2011-06-23 Descodificación de audio con pos-filtración selectiva
ES19196423T Active ES2902392T3 (es) 2010-07-02 2011-06-23 Descodificación de audio con pos-filtración selectiva

Family Applications After (2)

Application Number Title Priority Date Filing Date
ES16166357.0T Active ES2691934T3 (es) 2010-07-02 2011-06-23 Descodificación de audio con pos-filtro selectivo
ES11743032.2T Active ES2484794T3 (es) 2010-07-02 2011-06-23 Pos-filtro selectivo

Country Status (18)

Country Link
US (14) US9224403B2 (es)
EP (8) EP2757560B1 (es)
JP (13) JP6178236B2 (es)
KR (12) KR101972762B1 (es)
CN (7) CN105261372B (es)
AU (1) AU2011273680B2 (es)
CA (14) CA3160488C (es)
DK (2) DK3079153T3 (es)
ES (6) ES2683648T3 (es)
HK (8) HK1183965A1 (es)
HU (2) HUE038985T2 (es)
IL (10) IL311020A (es)
MX (1) MX2012014525A (es)
MY (4) MY176188A (es)
PL (2) PL3079152T3 (es)
RU (6) RU2562422C2 (es)
SG (7) SG10201605650WA (es)
WO (1) WO2012000882A1 (es)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105261372B (zh) 2010-07-02 2021-07-16 杜比国际公司 自适应后置滤波器
PL2936484T3 (pl) * 2013-01-29 2018-06-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Urządzenie i sposób do przetwarzania zakodowanego sygnału i koder i sposób do generowania zakodowanego sygnału
KR102170665B1 (ko) * 2013-04-05 2020-10-29 돌비 인터네셔널 에이비 인터리브된 파형 코딩을 위한 오디오 인코더 및 디코더
CN105340300B (zh) 2013-06-18 2018-04-13 杜比实验室特许公司 用于音频呈现的低音管理
US9418671B2 (en) * 2013-08-15 2016-08-16 Huawei Technologies Co., Ltd. Adaptive high-pass post-filter
JP6001814B1 (ja) 2013-08-28 2016-10-05 ドルビー ラボラトリーズ ライセンシング コーポレイション ハイブリッドの波形符号化およびパラメトリック符号化発話向上
US9666202B2 (en) 2013-09-10 2017-05-30 Huawei Technologies Co., Ltd. Adaptive bandwidth extension and apparatus for the same
US9685166B2 (en) 2014-07-26 2017-06-20 Huawei Technologies Co., Ltd. Classification between time-domain coding and frequency domain coding
EP2980799A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for processing an audio signal using a harmonic post-filter
EP2980798A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Harmonicity-dependent controlling of a harmonic filter tool
CN105957534B (zh) * 2016-06-28 2019-05-03 百度在线网络技术(北京)有限公司 自适应滤波方法和自适应滤波器
TW202341126A (zh) 2017-03-23 2023-10-16 瑞典商都比國際公司 用於音訊信號之高頻重建的諧波轉置器的回溯相容整合
EP3483884A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Signal filtering
WO2019091573A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters
EP3483878A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder supporting a set of different loss concealment tools
EP3483879A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Analysis/synthesis windowing function for modulated lapped transformation
EP3483883A1 (en) * 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio coding and decoding with selective postfiltering
EP3483886A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Selecting pitch lag
EP3483880A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Temporal noise shaping
WO2019091576A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits
EP3483882A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Controlling bandwidth in encoders and/or decoders
US10475456B1 (en) * 2018-06-04 2019-11-12 Qualcomm Incorporated Smart coding mode switching in audio rate adaptation
US20230154479A1 (en) 2020-04-24 2023-05-18 Telefonaktiebolaget Lm Ericsson (Publ) Low cost adaptation of bass post-filter

Family Cites Families (154)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4052568A (en) * 1976-04-23 1977-10-04 Communications Satellite Corporation Digital voice switch
US4696040A (en) * 1983-10-13 1987-09-22 Texas Instruments Incorporated Speech analysis/synthesis system with energy normalization and silence suppression
US4617676A (en) * 1984-09-04 1986-10-14 At&T Bell Laboratories Predictive communication system filtering arrangement
US4969192A (en) 1987-04-06 1990-11-06 Voicecraft, Inc. Vector adaptive predictive coder for speech and audio
US4896361A (en) * 1988-01-07 1990-01-23 Motorola, Inc. Digital speech coder having improved vector excitation source
FI95085C (fi) * 1992-05-11 1995-12-11 Nokia Mobile Phones Ltd Menetelmä puhesignaalin digitaaliseksi koodaamiseksi sekä puhekooderi menetelmän suorittamiseksi
US5434947A (en) * 1993-02-23 1995-07-18 Motorola Method for generating a spectral noise weighting filter for use in a speech coder
JPH06250697A (ja) * 1993-02-26 1994-09-09 Fujitsu Ltd 音声符号化方法及び音声符号化装置並びに音声復号化方法及び音声復号化装置
CA2094780A1 (en) 1993-04-23 1994-10-24 Claude Laflamme Transform coded excitation for speech and audio coding
FI96248C (fi) * 1993-05-06 1996-05-27 Nokia Mobile Phones Ltd Menetelmä pitkän aikavälin synteesisuodattimen toteuttamiseksi sekä synteesisuodatin puhekoodereihin
CA2121667A1 (en) 1994-04-19 1995-10-20 Jean-Pierre Adoul Differential-transform-coded excitation for speech and audio coding
US6263307B1 (en) * 1995-04-19 2001-07-17 Texas Instruments Incorporated Adaptive weiner filtering using line spectral frequencies
US5664055A (en) 1995-06-07 1997-09-02 Lucent Technologies Inc. CS-ACELP speech compression system with adaptive pitch prediction filter gain based on a measure of periodicity
JPH0946268A (ja) 1995-07-26 1997-02-14 Toshiba Corp ディジタル音声通信装置
JPH0950298A (ja) * 1995-08-07 1997-02-18 Mitsubishi Electric Corp 音声符号化装置及び音声復号化装置
JP3483998B2 (ja) * 1995-09-14 2004-01-06 株式会社東芝 ピッチ強調方法および装置
US5864798A (en) 1995-09-18 1999-01-26 Kabushiki Kaisha Toshiba Method and apparatus for adjusting a spectrum shape of a speech signal
JP3707116B2 (ja) * 1995-10-26 2005-10-19 ソニー株式会社 音声復号化方法及び装置
TW321810B (es) 1995-10-26 1997-12-01 Sony Co Ltd
WO1997031367A1 (en) 1996-02-26 1997-08-28 At & T Corp. Multi-stage speech coder with transform coding of prediction residual signals with quantization by auditory models
JP2940464B2 (ja) * 1996-03-27 1999-08-25 日本電気株式会社 音声復号化装置
US5802109A (en) 1996-03-28 1998-09-01 Nec Corporation Speech encoding communication system
JPH09319397A (ja) * 1996-05-28 1997-12-12 Sony Corp ディジタル信号処理装置
JP3183826B2 (ja) 1996-06-06 2001-07-09 三菱電機株式会社 音声符号化装置及び音声復号化装置
DE69730779T2 (de) * 1996-06-19 2005-02-10 Texas Instruments Inc., Dallas Verbesserungen bei oder in Bezug auf Sprachkodierung
JP2974059B2 (ja) * 1996-07-18 1999-11-08 日本電気株式会社 ピッチポストフィルタ装置
JPH10143195A (ja) * 1996-11-14 1998-05-29 Olympus Optical Co Ltd ポストフィルタ
SE9700772D0 (sv) * 1997-03-03 1997-03-03 Ericsson Telefon Ab L M A high resolution post processing method for a speech decoder
JPH113099A (ja) * 1997-04-16 1999-01-06 Mitsubishi Electric Corp 音声符号化復号化システム、音声符号化装置及び音声復号化装置
US6073092A (en) * 1997-06-26 2000-06-06 Telogy Networks, Inc. Method for speech coding based on a code excited linear prediction (CELP) model
US6114859A (en) * 1997-07-14 2000-09-05 Nissin Electric Co., Ltd. Harmonic characteristic measuring method and harmonic characteristic measuring apparatus
US6385195B2 (en) 1997-07-21 2002-05-07 Telefonaktiebolaget L M Ericsson (Publ) Enhanced interworking function for interfacing digital cellular voice and fax protocols and internet protocols
FI980132A (fi) * 1998-01-21 1999-07-22 Nokia Mobile Phones Ltd Adaptoituva jälkisuodatin
JP3986150B2 (ja) 1998-01-27 2007-10-03 興和株式会社 一次元データへの電子透かし
TW376611B (en) * 1998-05-26 1999-12-11 Koninkl Philips Electronics Nv Transmission system with improved speech encoder
CN1134762C (zh) 1998-05-27 2004-01-14 Ntt移动通信网株式会社 语音译码器和语音译码方法
US6098036A (en) * 1998-07-13 2000-08-01 Lockheed Martin Corp. Speech coding system and method including spectral formant enhancer
JP4308345B2 (ja) * 1998-08-21 2009-08-05 パナソニック株式会社 マルチモード音声符号化装置及び復号化装置
US6240386B1 (en) * 1998-08-24 2001-05-29 Conexant Systems, Inc. Speech codec employing noise classification for noise compensation
KR100281181B1 (ko) * 1998-10-16 2001-02-01 윤종용 약전계에서 코드 분할 다중 접속 시스템의 코덱 잡음 제거 방법
JP2000206999A (ja) * 1999-01-19 2000-07-28 Nec Corp 音声符号伝送装置
EP1052622B1 (en) * 1999-05-11 2007-07-11 Nippon Telegraph and Telephone Corporation Selection of a synthesis filter for CELP type wideband audio coding
US6604070B1 (en) * 1999-09-22 2003-08-05 Conexant Systems, Inc. System of encoding and decoding speech signals
US7222070B1 (en) 1999-09-22 2007-05-22 Texas Instruments Incorporated Hybrid speech coding and system
US6959274B1 (en) * 1999-09-22 2005-10-25 Mindspeed Technologies, Inc. Fixed rate speech compression system and method
US6782360B1 (en) 1999-09-22 2004-08-24 Mindspeed Technologies, Inc. Gain quantization for a CELP speech coder
JP3559485B2 (ja) 1999-11-22 2004-09-02 日本電信電話株式会社 音声信号の後処理方法および装置並びにプログラムを記録した記録媒体
US20020016161A1 (en) * 2000-02-10 2002-02-07 Telefonaktiebolaget Lm Ericsson (Publ) Method and apparatus for compression of speech encoded parameters
JP2001249700A (ja) * 2000-03-06 2001-09-14 Oki Electric Ind Co Ltd 音声符号化装置及び音声復号装置
KR100804461B1 (ko) * 2000-04-24 2008-02-20 퀄컴 인코포레이티드 보이스화된 음성을 예측적으로 양자화하는 방법 및 장치
US6862567B1 (en) * 2000-08-30 2005-03-01 Mindspeed Technologies, Inc. Noise suppression in the frequency domain by adjusting gain according to voicing parameters
JP2002149200A (ja) 2000-08-31 2002-05-24 Matsushita Electric Ind Co Ltd 音声処理装置及び音声処理方法
US7020605B2 (en) * 2000-09-15 2006-03-28 Mindspeed Technologies, Inc. Speech coding system with time-domain noise attenuation
US6615169B1 (en) * 2000-10-18 2003-09-02 Nokia Corporation High frequency enhancement layer coding in wideband speech codec
US6658383B2 (en) 2001-06-26 2003-12-02 Microsoft Corporation Method for coding speech and music signals
US7110942B2 (en) 2001-08-14 2006-09-19 Broadcom Corporation Efficient excitation quantization in a noise feedback coding system using correlation techniques
US7512535B2 (en) * 2001-10-03 2009-03-31 Broadcom Corporation Adaptive postfiltering methods and systems for decoding speech
US6785645B2 (en) 2001-11-29 2004-08-31 Microsoft Corporation Real-time speech and music classifier
WO2003046889A1 (en) 2001-11-30 2003-06-05 Koninklijke Philips Electronics N.V. Signal coding
JP3733588B2 (ja) * 2001-12-13 2006-01-11 日本電気株式会社 音声復号化装置、及び、音声復号化方法
US20040002856A1 (en) * 2002-03-08 2004-01-01 Udaya Bhaskar Multi-rate frequency domain interpolative speech CODEC system
CA2388352A1 (en) * 2002-05-31 2003-11-30 Voiceage Corporation A method and device for frequency-selective pitch enhancement of synthesized speed
US7330812B2 (en) 2002-10-04 2008-02-12 National Research Council Of Canada Method and apparatus for transmitting an audio stream having additional payload in a hidden sub-channel
CN1288557C (zh) * 2003-06-25 2006-12-06 英业达股份有限公司 多执行线程同时停止的方法
DE10328777A1 (de) 2003-06-25 2005-01-27 Coding Technologies Ab Vorrichtung und Verfahren zum Codieren eines Audiosignals und Vorrichtung und Verfahren zum Decodieren eines codierten Audiosignals
US20050004793A1 (en) 2003-07-03 2005-01-06 Pasi Ojala Signal adaptation for higher band coding in a codec utilizing band split coding
CN1212608C (zh) * 2003-09-12 2005-07-27 中国科学院声学研究所 一种采用后置滤波器的多通道语音增强方法
US7478040B2 (en) 2003-10-24 2009-01-13 Broadcom Corporation Method for adaptive filtering
AU2003274864A1 (en) * 2003-10-24 2005-05-11 Nokia Corpration Noise-dependent postfiltering
CA2457988A1 (en) * 2004-02-18 2005-08-18 Voiceage Corporation Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization
FI118834B (fi) 2004-02-23 2008-03-31 Nokia Corp Audiosignaalien luokittelu
FI118835B (fi) * 2004-02-23 2008-03-31 Nokia Corp Koodausmallin valinta
FI119533B (fi) * 2004-04-15 2008-12-15 Nokia Corp Audiosignaalien koodaus
GB0408856D0 (en) 2004-04-21 2004-05-26 Nokia Corp Signal encoding
ES2291877T3 (es) 2004-05-17 2008-03-01 Nokia Corporation Codificacion de audio con diferentes modelos de codificacion.
CA2566368A1 (en) 2004-05-17 2005-11-24 Nokia Corporation Audio encoding with different coding frame lengths
US7739120B2 (en) 2004-05-17 2010-06-15 Nokia Corporation Selection of coding models for encoding an audio signal
US7596486B2 (en) 2004-05-19 2009-09-29 Nokia Corporation Encoding an audio signal using different audio coder modes
US20060047522A1 (en) 2004-08-26 2006-03-02 Nokia Corporation Method, apparatus and computer program to provide predictor adaptation for advanced audio coding (AAC) system
US7720230B2 (en) 2004-10-20 2010-05-18 Agere Systems, Inc. Individual channel shaping for BCC schemes and the like
KR100640468B1 (ko) * 2005-01-25 2006-10-31 삼성전자주식회사 디지털 통신 시스템에서 음성 패킷의 전송과 처리 장치 및방법
US20070147518A1 (en) * 2005-02-18 2007-06-28 Bruno Bessette Methods and devices for low-frequency emphasis during audio compression based on ACELP/TCX
US7573912B2 (en) 2005-02-22 2009-08-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. Near-transparent or transparent multi-channel encoder/decoder scheme
EP1851866B1 (en) * 2005-02-23 2011-08-17 Telefonaktiebolaget LM Ericsson (publ) Adaptive bit allocation for multi-channel audio encoding
DE602006012637D1 (de) 2005-04-01 2010-04-15 Qualcomm Inc Vorrichtung und Verfahren für die Teilband-Sprachkodierung
JP4958780B2 (ja) * 2005-05-11 2012-06-20 パナソニック株式会社 符号化装置、復号化装置及びこれらの方法
US7930176B2 (en) * 2005-05-20 2011-04-19 Broadcom Corporation Packet loss concealment for block-independent speech codecs
WO2006126856A2 (en) 2005-05-26 2006-11-30 Lg Electronics Inc. Method of encoding and decoding an audio signal
US7707034B2 (en) * 2005-05-31 2010-04-27 Microsoft Corporation Audio codec post-filter
KR100718132B1 (ko) 2005-06-24 2007-05-14 삼성전자주식회사 오디오 신호의 비트스트림 생성 방법 및 장치, 그를 이용한부호화/복호화 방법 및 장치
RU2473062C2 (ru) 2005-08-30 2013-01-20 ЭлДжи ЭЛЕКТРОНИКС ИНК. Способ кодирования и декодирования аудиосигнала и устройство для его осуществления
KR100647336B1 (ko) 2005-11-08 2006-11-23 삼성전자주식회사 적응적 시간/주파수 기반 오디오 부호화/복호화 장치 및방법
KR20080101872A (ko) * 2006-01-18 2008-11-21 연세대학교 산학협력단 부호화/복호화 장치 및 방법
US8208641B2 (en) 2006-01-19 2012-06-26 Lg Electronics Inc. Method and apparatus for processing a media signal
KR20070077652A (ko) 2006-01-24 2007-07-27 삼성전자주식회사 적응적 시간/주파수 기반 부호화 모드 결정 장치 및 이를위한 부호화 모드 결정 방법
FR2897733A1 (fr) 2006-02-20 2007-08-24 France Telecom Procede de discrimination et d'attenuation fiabilisees des echos d'un signal numerique dans un decodeur et dispositif correspondant
JP5390197B2 (ja) 2006-02-23 2014-01-15 エルジー エレクトロニクス インコーポレイティド オーディオ信号の処理方法及び装置
US7454335B2 (en) 2006-03-20 2008-11-18 Mindspeed Technologies, Inc. Method and system for reducing effects of noise producing artifacts in a voice codec
EP2012305B1 (en) 2006-04-27 2011-03-09 Panasonic Corporation Audio encoding device, audio decoding device, and their method
KR20070115637A (ko) 2006-06-03 2007-12-06 삼성전자주식회사 대역폭 확장 부호화 및 복호화 방법 및 장치
US7873511B2 (en) 2006-06-30 2011-01-18 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic
US8682652B2 (en) * 2006-06-30 2014-03-25 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic
EP1873754B1 (en) 2006-06-30 2008-09-10 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic
JP5190363B2 (ja) 2006-07-12 2013-04-24 パナソニック株式会社 音声復号装置、音声符号化装置、および消失フレーム補償方法
CN101145343B (zh) 2006-09-15 2011-07-20 展讯通信(上海)有限公司 一种用于音频处理框架中的编码和解码方法
CN100483509C (zh) 2006-12-05 2009-04-29 华为技术有限公司 声音信号分类方法和装置
CN101197577A (zh) * 2006-12-07 2008-06-11 展讯通信(上海)有限公司 一种用于音频处理框架中的编码和解码方法
RU2444071C2 (ru) 2006-12-12 2012-02-27 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Кодер, декодер и методы кодирования и декодирования сегментов данных, представляющих собой поток данных временной области
US20100010810A1 (en) 2006-12-13 2010-01-14 Panasonic Corporation Post filter and filtering method
KR100964402B1 (ko) 2006-12-14 2010-06-17 삼성전자주식회사 오디오 신호의 부호화 모드 결정 방법 및 장치와 이를 이용한 오디오 신호의 부호화/복호화 방법 및 장치
KR100883656B1 (ko) 2006-12-28 2009-02-18 삼성전자주식회사 오디오 신호의 분류 방법 및 장치와 이를 이용한 오디오신호의 부호화/복호화 방법 및 장치
EP1944761A1 (en) 2007-01-15 2008-07-16 Siemens Networks GmbH & Co. KG Disturbance reduction in digital signal processing
CN101231850B (zh) 2007-01-23 2012-02-29 华为技术有限公司 编解码方法及装置
FR2912249A1 (fr) 2007-02-02 2008-08-08 France Telecom Codage/decodage perfectionnes de signaux audionumeriques.
PL2535894T3 (pl) * 2007-03-02 2015-06-30 Ericsson Telefon Ab L M Sposoby i układy w sieci telekomunikacyjnej
JP5377287B2 (ja) * 2007-03-02 2013-12-25 パナソニック株式会社 ポストフィルタ、復号装置およびポストフィルタ処理方法
WO2008108082A1 (ja) * 2007-03-02 2008-09-12 Panasonic Corporation 音声復号装置および音声復号方法
JP4708446B2 (ja) * 2007-03-02 2011-06-22 パナソニック株式会社 符号化装置、復号装置およびそれらの方法
ES2383365T3 (es) * 2007-03-02 2012-06-20 Telefonaktiebolaget Lm Ericsson (Publ) Post-filtro no causal
CN101256771A (zh) 2007-03-02 2008-09-03 北京工业大学 嵌入式编码、解码方法、编码器、解码器及系统
JP5190445B2 (ja) 2007-03-02 2013-04-24 パナソニック株式会社 符号化装置および符号化方法
DE102007025401B4 (de) 2007-05-31 2015-10-01 Siemens Aktiengesellschaft Verfahren zur Auswertung eines Tomographie-Datensatzes und Tomographie-Arbeitsstation
CN101321033B (zh) 2007-06-10 2011-08-10 华为技术有限公司 帧补偿方法及系统
CA2691993C (en) 2007-06-11 2015-01-27 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder for encoding an audio signal having an impulse-like portion and stationary portion, encoding methods, decoder, decoding method, and encoded audio signal
EP2015293A1 (en) 2007-06-14 2009-01-14 Deutsche Thomson OHG Method and apparatus for encoding and decoding an audio signal using adaptively switched temporal resolution in the spectral domain
KR101513028B1 (ko) * 2007-07-02 2015-04-17 엘지전자 주식회사 방송 수신기 및 방송신호 처리방법
KR101531910B1 (ko) 2007-07-02 2015-06-29 엘지전자 주식회사 방송 수신기 및 방송신호 처리방법
KR101470940B1 (ko) * 2007-07-06 2014-12-09 오렌지 디지털 신호 디코딩에서 후처리 단계에서 생기는 왜곡 제한
ATE448649T1 (de) 2007-08-13 2009-11-15 Harman Becker Automotive Sys Rauschverringerung mittels kombination aus strahlformung und nachfilterung
WO2009022193A2 (en) 2007-08-15 2009-02-19 Nokia Corporation Devices, methods and computer program products for audio signal coding and decoding
CN101383151B (zh) * 2007-09-06 2011-07-13 中兴通讯股份有限公司 一种数字音频质量增强系统和方法
KR101505831B1 (ko) 2007-10-30 2015-03-26 삼성전자주식회사 멀티 채널 신호의 부호화/복호화 방법 및 장치
PL3367381T3 (pl) 2008-02-15 2020-12-14 Nokia Technologies Oy Kwantyfikacja dźwięku poprzez redukcję złożoności indeksowania wektorów
KR101452722B1 (ko) 2008-02-19 2014-10-23 삼성전자주식회사 신호 부호화 및 복호화 방법 및 장치
EP2269188B1 (en) 2008-03-14 2014-06-11 Dolby Laboratories Licensing Corporation Multimode coding of speech-like and non-speech-like signals
US8296135B2 (en) 2008-04-22 2012-10-23 Electronics And Telecommunications Research Institute Noise cancellation system and method
KR20090122143A (ko) 2008-05-23 2009-11-26 엘지전자 주식회사 오디오 신호 처리 방법 및 장치
CN101609684B (zh) * 2008-06-19 2012-06-06 展讯通信(上海)有限公司 解码语音信号的后处理滤波器
CN102089810B (zh) * 2008-07-10 2013-05-08 沃伊斯亚吉公司 多基准线性预测系数滤波器量化和逆量化设备及方法
AU2009267518B2 (en) 2008-07-11 2012-08-16 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for encoding/decoding an audio signal using an aliasing switch scheme
MX2011000375A (es) * 2008-07-11 2011-05-19 Fraunhofer Ges Forschung Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada.
TWI520128B (zh) 2008-10-08 2016-02-01 弗勞恩霍夫爾協會 多解析度切換音訊編碼/解碼方案(一)
RU2400832C2 (ru) 2008-11-24 2010-09-27 Государственное образовательное учреждение высшего профессионального образования Академия Федеральной службы охраны Российской Федерации (Академия ФCО России) Способ формирования сигнала возбуждения в низкоскоростных вокодерах с линейным предсказанием
KR101622950B1 (ko) 2009-01-28 2016-05-23 삼성전자주식회사 오디오 신호의 부호화 및 복호화 방법 및 그 장치
US8457975B2 (en) * 2009-01-28 2013-06-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio decoder, audio encoder, methods for decoding and encoding an audio signal and computer program
KR20100115215A (ko) * 2009-04-17 2010-10-27 삼성전자주식회사 가변 비트율 오디오 부호화 및 복호화 장치 및 방법
WO2011026247A1 (en) 2009-09-04 2011-03-10 Svox Ag Speech enhancement techniques on the power spectrum
US8260220B2 (en) * 2009-09-28 2012-09-04 Broadcom Corporation Communication device with reduced noise speech coding
RU2591011C2 (ru) * 2009-10-20 2016-07-10 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Кодер аудиосигнала, декодер аудиосигнала, способ кодирования или декодирования аудиосигнала с удалением алиасинга (наложения спектров)
BR112012027438B1 (pt) * 2010-04-26 2022-02-22 Sun Patent Trust Método para decodificar, meio legível por computador e aparelho para decodificar
EP2569767B1 (en) 2010-05-11 2014-06-11 Telefonaktiebolaget LM Ericsson (publ) Method and arrangement for processing of audio signals
CN105261372B (zh) 2010-07-02 2021-07-16 杜比国际公司 自适应后置滤波器
US8738385B2 (en) 2010-10-20 2014-05-27 Broadcom Corporation Pitch-based pre-filtering and post-filtering for compression of audio signals
US11429505B2 (en) * 2018-08-03 2022-08-30 Dell Products L.P. System and method to provide optimal polling of devices for real time data

Also Published As

Publication number Publication date
HUE039862T2 (hu) 2019-02-28
US20180047405A1 (en) 2018-02-15
CA2929090A1 (en) 2012-01-05
HK1221326A1 (zh) 2017-05-26
US9595270B2 (en) 2017-03-14
RU2015117332A3 (es) 2018-12-10
US9830923B2 (en) 2017-11-28
CN105261372B (zh) 2021-07-16
KR101449979B1 (ko) 2014-10-14
KR20210107923A (ko) 2021-09-01
CA2976485A1 (en) 2012-01-05
KR20210040184A (ko) 2021-04-12
CA2958360C (en) 2017-11-14
JP2021060601A (ja) 2021-04-15
IL223319A (en) 2016-04-21
KR20140056394A (ko) 2014-05-09
IL286405B (en) 2022-10-01
JP7147090B2 (ja) 2022-10-04
HK1218803A1 (zh) 2017-03-10
KR20160081986A (ko) 2016-07-08
US9343077B2 (en) 2016-05-17
HK1220036A1 (zh) 2017-04-21
US20160225381A1 (en) 2016-08-04
ES2683648T3 (es) 2018-09-27
JP6812585B2 (ja) 2021-01-13
CA3160488A1 (en) 2012-01-05
ES2691934T3 (es) 2018-11-29
CA2937672C (en) 2017-05-02
KR20160075869A (ko) 2016-06-29
CA3207181A1 (en) 2012-01-05
SG10201901308TA (en) 2019-03-28
MY176187A (en) 2020-07-24
JP6556815B2 (ja) 2019-08-07
CA3124114A1 (en) 2012-01-05
US11996111B2 (en) 2024-05-28
HK1183965A1 (en) 2014-01-10
JP2022177215A (ja) 2022-11-30
US10811024B2 (en) 2020-10-20
CA2958360A1 (en) 2012-01-05
DK3079153T3 (en) 2018-11-05
US20190214035A1 (en) 2019-07-11
EP3079152A1 (en) 2016-10-12
US11610595B2 (en) 2023-03-21
CN105390140B (zh) 2019-05-17
CN105261370A (zh) 2016-01-20
CA3239015A1 (en) 2012-01-05
KR20130019004A (ko) 2013-02-25
IL311020A (en) 2024-04-01
JP2019204102A (ja) 2019-11-28
CA2976490C (en) 2019-01-08
IL245591A (en) 2016-12-29
SG186209A1 (en) 2013-01-30
MX2012014525A (es) 2013-08-27
CA2976490A1 (en) 2012-01-05
HK1218462A1 (zh) 2017-02-17
KR101696632B1 (ko) 2017-01-16
EP2757560B1 (en) 2018-02-21
KR102296955B1 (ko) 2021-09-01
CA3025108A1 (en) 2012-01-05
CA2801805A1 (en) 2012-01-05
AU2011273680B2 (en) 2014-10-16
RU2562422C2 (ru) 2015-09-10
RU2692416C2 (ru) 2019-06-24
EP3605534B1 (en) 2021-10-20
JP2017037328A (ja) 2017-02-16
CA2928180C (en) 2017-03-28
EP3079154A1 (en) 2016-10-12
IL223319A0 (en) 2013-02-03
JP2021192121A (ja) 2021-12-16
CN105244035B (zh) 2019-03-12
CA3160488C (en) 2023-09-05
KR20230018539A (ko) 2023-02-07
KR20220053032A (ko) 2022-04-28
CA2929090C (en) 2017-03-14
IL278805B (en) 2021-10-31
CN105355209A (zh) 2016-02-24
KR102388001B1 (ko) 2022-04-19
RU2013102794A (ru) 2014-08-10
CN103098129A (zh) 2013-05-08
US20230282222A1 (en) 2023-09-07
US20160163326A1 (en) 2016-06-09
CN105261371A (zh) 2016-01-20
JP7073565B2 (ja) 2022-05-23
US20160225384A1 (en) 2016-08-04
RU2016117277A (ru) 2017-11-13
US20160093312A1 (en) 2016-03-31
MY176188A (en) 2020-07-24
EP3605534A1 (en) 2020-02-05
CA3124114C (en) 2022-07-05
HUE038985T2 (hu) 2018-12-28
US20160086616A1 (en) 2016-03-24
IL245591A0 (en) 2016-06-30
CN105390140A (zh) 2016-03-09
CA2937672A1 (en) 2012-01-05
KR101730356B1 (ko) 2017-04-27
IL243958A0 (en) 2016-04-21
RU2616774C1 (ru) 2017-04-18
EP3971893A1 (en) 2022-03-23
ES2683647T3 (es) 2018-09-27
SG10201604880YA (en) 2016-08-30
JP2023134779A (ja) 2023-09-27
EP3079152B1 (en) 2018-06-06
JP6682683B2 (ja) 2020-04-15
CA3093517A1 (en) 2012-01-05
US9558754B2 (en) 2017-01-31
EP3971893B1 (en) 2024-06-19
US20160240209A1 (en) 2016-08-18
US9858940B2 (en) 2018-01-02
ES2902392T3 (es) 2022-03-28
CA3025108C (en) 2020-10-27
CA2801805C (en) 2018-01-02
US20220157327A1 (en) 2022-05-19
ES2484794T3 (es) 2014-08-12
JP2013533983A (ja) 2013-08-29
EP3422346B1 (en) 2020-04-22
RU2019135620A (ru) 2021-05-06
PL3079153T3 (pl) 2018-12-31
MY183707A (en) 2021-03-09
EP3079153A1 (en) 2016-10-12
IL295473B2 (en) 2023-10-01
KR102079000B1 (ko) 2020-02-19
KR102030335B1 (ko) 2019-10-10
JP2020109529A (ja) 2020-07-16
KR102492622B1 (ko) 2023-01-30
JP6679433B2 (ja) 2020-04-15
CN105261370B (zh) 2018-12-04
CN103098129B (zh) 2015-11-25
JP6279686B2 (ja) 2018-02-14
IL302557B1 (en) 2024-04-01
HK1218987A1 (zh) 2017-03-17
CN105355209B (zh) 2020-02-14
CN105244035A (zh) 2016-01-13
US20160210980A1 (en) 2016-07-21
CA3093517C (en) 2021-08-24
CA2958350C (en) 2017-11-14
KR20200018720A (ko) 2020-02-19
US9396736B2 (en) 2016-07-19
IL286405A (en) 2021-10-31
PL3079152T3 (pl) 2018-10-31
JP7319441B2 (ja) 2023-08-01
IL295473B1 (en) 2023-06-01
JP6944038B2 (ja) 2021-10-06
IL302557A (en) 2023-07-01
IL243958A (en) 2016-11-30
US9558753B2 (en) 2017-01-31
JP6178236B2 (ja) 2017-08-09
SG10202005270YA (en) 2020-07-29
SG10201604866VA (en) 2016-08-30
US20160118057A1 (en) 2016-04-28
EP3422346A1 (en) 2019-01-02
SG10201605650WA (en) 2016-08-30
EP2757560A1 (en) 2014-07-23
CA2958350A1 (en) 2012-01-05
JP2022106963A (ja) 2022-07-20
US11183200B2 (en) 2021-11-23
KR101972762B1 (ko) 2019-04-29
MY176192A (en) 2020-07-24
US9224403B2 (en) 2015-12-29
JP2016186652A (ja) 2016-10-27
CA2976485C (en) 2018-07-24
CN105261371B (zh) 2019-12-03
WO2012000882A1 (en) 2012-01-05
JP2018045252A (ja) 2018-03-22
JP2015158689A (ja) 2015-09-03
HK1219168A1 (zh) 2017-03-24
US10236010B2 (en) 2019-03-19
IL265661A (en) 2019-05-30
EP2589046A1 (en) 2013-05-08
KR102238082B1 (ko) 2021-04-09
CN105261372A (zh) 2016-01-20
HK1199135A1 (en) 2015-06-19
KR20160086426A (ko) 2016-07-19
US20130096912A1 (en) 2013-04-18
RU2642553C2 (ru) 2018-01-25
JP6258257B2 (ja) 2018-01-10
RU2599338C1 (ru) 2016-10-10
EP2589046B1 (en) 2014-05-28
KR20190116541A (ko) 2019-10-14
RU2015117332A (ru) 2016-11-27
AU2011273680A1 (en) 2012-12-20
IL246684A0 (en) 2016-08-31
JP2016194711A (ja) 2016-11-17
KR20190044692A (ko) 2019-04-30
CA2928180A1 (en) 2012-01-05
DK3079152T3 (en) 2018-08-13
US20210035592A1 (en) 2021-02-04
EP3079154B1 (en) 2018-06-06
KR101696634B1 (ko) 2017-01-16
SG10201503004WA (en) 2015-06-29
IL286405B2 (en) 2023-02-01
IL278805A (en) 2021-01-31
IL295473A (en) 2022-10-01
RU2707716C1 (ru) 2019-11-28
EP3079153B1 (en) 2018-08-01
US9552824B2 (en) 2017-01-24

Similar Documents

Publication Publication Date Title
ES2666150T3 (es) Descodificación de audio con pos-filtro selectivo
ES2908183T3 (es) Decisión no sonora para el procesamiento de la voz