MX2022002322A - Mosaicos de tiempo-frecuencia variables en el tiempo que usan bancos de filtros ortogonales no uniformes basados en el analisis/sintesis de mdct y tdar. - Google Patents

Mosaicos de tiempo-frecuencia variables en el tiempo que usan bancos de filtros ortogonales no uniformes basados en el analisis/sintesis de mdct y tdar.

Info

Publication number
MX2022002322A
MX2022002322A MX2022002322A MX2022002322A MX2022002322A MX 2022002322 A MX2022002322 A MX 2022002322A MX 2022002322 A MX2022002322 A MX 2022002322A MX 2022002322 A MX2022002322 A MX 2022002322A MX 2022002322 A MX2022002322 A MX 2022002322A
Authority
MX
Mexico
Prior art keywords
samples
sets
subband
time
block
Prior art date
Application number
MX2022002322A
Other languages
English (en)
Inventor
Bernd Edler
Nils Werner
Original Assignee
Fraunhofer Ges Forschung
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Ges Forschung filed Critical Fraunhofer Ges Forschung
Publication of MX2022002322A publication Critical patent/MX2022002322A/es

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

Las modalidades proporcionan un método para procesar una señal de audio para obtener una representación de subbanda de la señal de audio. El método comprende un paso de efectuar una transformación muestreada críticamente superpuesta en cascada sobre al menos dos bloques de muestras superpuestos parcialmente de la señal de audio, para obtener conjuntos de muestras de subbanda sobre la base de un primer bloque de muestras de la señal de audio y para obtener conjuntos de muestras de subbanda sobre la base de un segundo bloque de muestras de la señal de audio. Además, el método comprende un paso de identificación, en el caso de que los conjuntos de muestras de subbanda que se basan en el primer bloque de muestras representen regiones diferentes en un plano de tiempofrecuencia en comparación con los conjuntos de muestras de subbanda que se basan en el segundo bloque de muestras, uno o más conjuntos de muestras de subbanda de los conjuntos de muestras de subbanda que se basan en el primer bloque de muestras y uno o más conjuntos de muestras de subbanda de los conjuntos de muestras de subbanda que se basan en el segundo bloque de muestras que en combinación representan la misma región del plano de tiempo-frecuencia. Además, el método comprende un paso de efectuar transformaciones de tiempo-frecuencia sobre la identificación de uno o más conjuntos de muestras de subbanda de los conjuntos de muestras de subbanda que se basan en el primer bloque de muestras y/o la identificación de uno o más conjuntos de muestras de subbanda de los conjuntos de muestras de subbanda que se basan en el segundo bloque de muestras, para obtener una o más muestras de subbanda transformadas en tiempo-frecuencia, cada una de las cuales representa la misma región en el plano de tiempo-frecuencia que una de una o más muestras de subbanda identificadas correspondientes a una o más versiones transformadas en tiempo-frecuencia de las mismas. Además, el método comprende un paso de efectuar una combinación ponderada de dos conjuntos correspondientes de muestras de subbanda o versiones transformadas en tiempo-frecuencia de las mismas, uno obtenido sobre la base del primer bloque de muestras de la señal de audio y uno obtenido sobre la base del segundo bloque de muestras de la señal de audio, para obtener representación de subbanda de solapamiento reducidos de la señal de audio.
MX2022002322A 2019-08-28 2020-08-25 Mosaicos de tiempo-frecuencia variables en el tiempo que usan bancos de filtros ortogonales no uniformes basados en el analisis/sintesis de mdct y tdar. MX2022002322A (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP19194145.9A EP3786948A1 (en) 2019-08-28 2019-08-28 Time-varying time-frequency tilings using non-uniform orthogonal filterbanks based on mdct analysis/synthesis and tdar
PCT/EP2020/073742 WO2021037847A1 (en) 2019-08-28 2020-08-25 Time-varying time-frequency tilings using non-uniform orthogonal filterbanks based on mdct analysis/synthesis and tdar

Publications (1)

Publication Number Publication Date
MX2022002322A true MX2022002322A (es) 2022-04-06

Family

ID=67777236

Family Applications (1)

Application Number Title Priority Date Filing Date
MX2022002322A MX2022002322A (es) 2019-08-28 2020-08-25 Mosaicos de tiempo-frecuencia variables en el tiempo que usan bancos de filtros ortogonales no uniformes basados en el analisis/sintesis de mdct y tdar.

Country Status (10)

Country Link
US (1) US20220165283A1 (es)
EP (2) EP3786948A1 (es)
JP (1) JP7438334B2 (es)
KR (1) KR20220051227A (es)
CN (1) CN114503196A (es)
BR (1) BR112022003044A2 (es)
CA (1) CA3151204C (es)
ES (1) ES2966335T3 (es)
MX (1) MX2022002322A (es)
WO (1) WO2021037847A1 (es)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3644313A1 (en) * 2018-10-26 2020-04-29 Fraunhofer Gesellschaft zur Förderung der Angewand Perceptual audio coding with adaptive non-uniform time/frequency tiling using subband merging and time domain aliasing reduction

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3276620A1 (en) * 2016-07-29 2018-01-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Time domain aliasing reduction for non-uniform filterbanks which use spectral analysis followed by partial synthesis
KR102632136B1 (ko) * 2017-04-28 2024-01-31 디티에스, 인코포레이티드 오디오 코더 윈도우 사이즈 및 시간-주파수 변환
EP3644313A1 (en) * 2018-10-26 2020-04-29 Fraunhofer Gesellschaft zur Förderung der Angewand Perceptual audio coding with adaptive non-uniform time/frequency tiling using subband merging and time domain aliasing reduction

Also Published As

Publication number Publication date
KR20220051227A (ko) 2022-04-26
ES2966335T3 (es) 2024-04-22
CN114503196A (zh) 2022-05-13
EP4022607C0 (en) 2023-09-13
JP7438334B2 (ja) 2024-02-26
EP4022607B1 (en) 2023-09-13
CA3151204C (en) 2024-06-11
US20220165283A1 (en) 2022-05-26
JP2022546448A (ja) 2022-11-04
EP3786948A1 (en) 2021-03-03
EP4022607A1 (en) 2022-07-06
CA3151204A1 (en) 2021-03-04
WO2021037847A1 (en) 2021-03-04
BR112022003044A2 (pt) 2022-05-17

Similar Documents

Publication Publication Date Title
CA2554381A1 (en) Adaptive hybrid transform for signal analysis and synthesis
MX2007012189A (es) Metodo y aparato para codificacion de banda dividida de senales de dialogo.
US9252803B2 (en) Signal processor, window provider, encoded media signal, method for processing a signal and method for providing a window
UA92742C2 (ru) Способ и устройство для кодирования речевых сигналов с расщеплением полосы
EP2980792A1 (en) Apparatus and method for generating an enhanced signal using independent noise-filling
US10978082B2 (en) Time domain aliasing reduction for non-uniform filterbanks which use spectral analysis followed by partial synthesis
ATE377244T1 (de) Einrichtung und verfahren zur verarbeitung eines audiosignals
MX2022002322A (es) Mosaicos de tiempo-frecuencia variables en el tiempo que usan bancos de filtros ortogonales no uniformes basados en el analisis/sintesis de mdct y tdar.
US9269359B2 (en) Coding of multi-channel signals
Unoki et al. Robust, blindly-detectable, and semi-reversible technique of audio watermarking based on cochlear delay characteristics
RU2018145032A (ru) Устройство для определения информации о подобии, способ для определения информации о подобии, устройство для определения информации автокорреляции, устройство для определения информации о взаимной корреляции и компьютерная программа
MX2018009145A (es) Aparato y método para mejorar una transición desde una porción de señal de audio oculta hasta una porción de señal de audio subsiguiente de una señal de audio.
Jeon et al. Mechanical noise suppression based on non-negative matrix factorization and multi-band spectral subtraction for digital cameras
MX2021004636A (es) Codificacion de audio perceptual con division en mosaicos de tiempo/frecuencia, no uniforme, adaptativa que utiliza fusion de subbandas y reduccion de solapamiento de dominio de tiempo.
TH1901000560A (th) การทำให้การเคลือบแฝงโดเมนเวลาลดลงสำหรับฟิลเตอร์แบงค์แบบไม่ใช่เอกรูปซึ่งจะใช้การวิเคราะห์เชิงสเปคตรัมที่ตามหลังโดยการสังเคราะห์บางส่วน
Moritz et al. Amplitude modulation filters as feature sets for robust ASR: constant absolute or relative bandwidth?
Chapagain et al. „Sound Editing using Fourier Transform‟
EP4307721A3 (en) Downmixer, audio encoder, method and computer program applying a phase value to a magnitude value
EP4329331A3 (en) Audio signal processing method and device
Zantalis et al. Semi-Blind Audio Source Separation of Linearly Mixed Two-Channel Recordings via Guided Matching Pursuit.
Zhang et al. Frequency-domain parameter estimations for binary masked signals
Kent An Investigation of Digital Mixing and Panning Algorithms