MX2022002322A - Mosaicos de tiempo-frecuencia variables en el tiempo que usan bancos de filtros ortogonales no uniformes basados en el analisis/sintesis de mdct y tdar. - Google Patents
Mosaicos de tiempo-frecuencia variables en el tiempo que usan bancos de filtros ortogonales no uniformes basados en el analisis/sintesis de mdct y tdar.Info
- Publication number
- MX2022002322A MX2022002322A MX2022002322A MX2022002322A MX2022002322A MX 2022002322 A MX2022002322 A MX 2022002322A MX 2022002322 A MX2022002322 A MX 2022002322A MX 2022002322 A MX2022002322 A MX 2022002322A MX 2022002322 A MX2022002322 A MX 2022002322A
- Authority
- MX
- Mexico
- Prior art keywords
- samples
- sets
- subband
- time
- block
- Prior art date
Links
- 230000015572 biosynthetic process Effects 0.000 title 1
- 238000003786 synthesis reaction Methods 0.000 title 1
- 230000005236 sound signal Effects 0.000 abstract 8
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Las modalidades proporcionan un método para procesar una señal de audio para obtener una representación de subbanda de la señal de audio. El método comprende un paso de efectuar una transformación muestreada críticamente superpuesta en cascada sobre al menos dos bloques de muestras superpuestos parcialmente de la señal de audio, para obtener conjuntos de muestras de subbanda sobre la base de un primer bloque de muestras de la señal de audio y para obtener conjuntos de muestras de subbanda sobre la base de un segundo bloque de muestras de la señal de audio. Además, el método comprende un paso de identificación, en el caso de que los conjuntos de muestras de subbanda que se basan en el primer bloque de muestras representen regiones diferentes en un plano de tiempofrecuencia en comparación con los conjuntos de muestras de subbanda que se basan en el segundo bloque de muestras, uno o más conjuntos de muestras de subbanda de los conjuntos de muestras de subbanda que se basan en el primer bloque de muestras y uno o más conjuntos de muestras de subbanda de los conjuntos de muestras de subbanda que se basan en el segundo bloque de muestras que en combinación representan la misma región del plano de tiempo-frecuencia. Además, el método comprende un paso de efectuar transformaciones de tiempo-frecuencia sobre la identificación de uno o más conjuntos de muestras de subbanda de los conjuntos de muestras de subbanda que se basan en el primer bloque de muestras y/o la identificación de uno o más conjuntos de muestras de subbanda de los conjuntos de muestras de subbanda que se basan en el segundo bloque de muestras, para obtener una o más muestras de subbanda transformadas en tiempo-frecuencia, cada una de las cuales representa la misma región en el plano de tiempo-frecuencia que una de una o más muestras de subbanda identificadas correspondientes a una o más versiones transformadas en tiempo-frecuencia de las mismas. Además, el método comprende un paso de efectuar una combinación ponderada de dos conjuntos correspondientes de muestras de subbanda o versiones transformadas en tiempo-frecuencia de las mismas, uno obtenido sobre la base del primer bloque de muestras de la señal de audio y uno obtenido sobre la base del segundo bloque de muestras de la señal de audio, para obtener representación de subbanda de solapamiento reducidos de la señal de audio.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP19194145.9A EP3786948A1 (en) | 2019-08-28 | 2019-08-28 | Time-varying time-frequency tilings using non-uniform orthogonal filterbanks based on mdct analysis/synthesis and tdar |
PCT/EP2020/073742 WO2021037847A1 (en) | 2019-08-28 | 2020-08-25 | Time-varying time-frequency tilings using non-uniform orthogonal filterbanks based on mdct analysis/synthesis and tdar |
Publications (1)
Publication Number | Publication Date |
---|---|
MX2022002322A true MX2022002322A (es) | 2022-04-06 |
Family
ID=67777236
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
MX2022002322A MX2022002322A (es) | 2019-08-28 | 2020-08-25 | Mosaicos de tiempo-frecuencia variables en el tiempo que usan bancos de filtros ortogonales no uniformes basados en el analisis/sintesis de mdct y tdar. |
Country Status (10)
Country | Link |
---|---|
US (1) | US20220165283A1 (es) |
EP (2) | EP3786948A1 (es) |
JP (1) | JP7438334B2 (es) |
KR (1) | KR20220051227A (es) |
CN (1) | CN114503196A (es) |
BR (1) | BR112022003044A2 (es) |
CA (1) | CA3151204C (es) |
ES (1) | ES2966335T3 (es) |
MX (1) | MX2022002322A (es) |
WO (1) | WO2021037847A1 (es) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3644313A1 (en) * | 2018-10-26 | 2020-04-29 | Fraunhofer Gesellschaft zur Förderung der Angewand | Perceptual audio coding with adaptive non-uniform time/frequency tiling using subband merging and time domain aliasing reduction |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3276620A1 (en) * | 2016-07-29 | 2018-01-31 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Time domain aliasing reduction for non-uniform filterbanks which use spectral analysis followed by partial synthesis |
KR102632136B1 (ko) * | 2017-04-28 | 2024-01-31 | 디티에스, 인코포레이티드 | 오디오 코더 윈도우 사이즈 및 시간-주파수 변환 |
EP3644313A1 (en) * | 2018-10-26 | 2020-04-29 | Fraunhofer Gesellschaft zur Förderung der Angewand | Perceptual audio coding with adaptive non-uniform time/frequency tiling using subband merging and time domain aliasing reduction |
-
2019
- 2019-08-28 EP EP19194145.9A patent/EP3786948A1/en not_active Withdrawn
-
2020
- 2020-08-25 KR KR1020227009467A patent/KR20220051227A/ko unknown
- 2020-08-25 MX MX2022002322A patent/MX2022002322A/es unknown
- 2020-08-25 CN CN202080060582.6A patent/CN114503196A/zh active Pending
- 2020-08-25 JP JP2022513319A patent/JP7438334B2/ja active Active
- 2020-08-25 ES ES20757930T patent/ES2966335T3/es active Active
- 2020-08-25 EP EP20757930.1A patent/EP4022607B1/en active Active
- 2020-08-25 CA CA3151204A patent/CA3151204C/en active Active
- 2020-08-25 BR BR112022003044A patent/BR112022003044A2/pt unknown
- 2020-08-25 WO PCT/EP2020/073742 patent/WO2021037847A1/en unknown
-
2022
- 2022-02-14 US US17/671,123 patent/US20220165283A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
KR20220051227A (ko) | 2022-04-26 |
ES2966335T3 (es) | 2024-04-22 |
CN114503196A (zh) | 2022-05-13 |
EP4022607C0 (en) | 2023-09-13 |
JP7438334B2 (ja) | 2024-02-26 |
EP4022607B1 (en) | 2023-09-13 |
CA3151204C (en) | 2024-06-11 |
US20220165283A1 (en) | 2022-05-26 |
JP2022546448A (ja) | 2022-11-04 |
EP3786948A1 (en) | 2021-03-03 |
EP4022607A1 (en) | 2022-07-06 |
CA3151204A1 (en) | 2021-03-04 |
WO2021037847A1 (en) | 2021-03-04 |
BR112022003044A2 (pt) | 2022-05-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CA2554381A1 (en) | Adaptive hybrid transform for signal analysis and synthesis | |
MX2007012189A (es) | Metodo y aparato para codificacion de banda dividida de senales de dialogo. | |
US9252803B2 (en) | Signal processor, window provider, encoded media signal, method for processing a signal and method for providing a window | |
UA92742C2 (ru) | Способ и устройство для кодирования речевых сигналов с расщеплением полосы | |
EP2980792A1 (en) | Apparatus and method for generating an enhanced signal using independent noise-filling | |
US10978082B2 (en) | Time domain aliasing reduction for non-uniform filterbanks which use spectral analysis followed by partial synthesis | |
ATE377244T1 (de) | Einrichtung und verfahren zur verarbeitung eines audiosignals | |
MX2022002322A (es) | Mosaicos de tiempo-frecuencia variables en el tiempo que usan bancos de filtros ortogonales no uniformes basados en el analisis/sintesis de mdct y tdar. | |
US9269359B2 (en) | Coding of multi-channel signals | |
Unoki et al. | Robust, blindly-detectable, and semi-reversible technique of audio watermarking based on cochlear delay characteristics | |
RU2018145032A (ru) | Устройство для определения информации о подобии, способ для определения информации о подобии, устройство для определения информации автокорреляции, устройство для определения информации о взаимной корреляции и компьютерная программа | |
MX2018009145A (es) | Aparato y método para mejorar una transición desde una porción de señal de audio oculta hasta una porción de señal de audio subsiguiente de una señal de audio. | |
Jeon et al. | Mechanical noise suppression based on non-negative matrix factorization and multi-band spectral subtraction for digital cameras | |
MX2021004636A (es) | Codificacion de audio perceptual con division en mosaicos de tiempo/frecuencia, no uniforme, adaptativa que utiliza fusion de subbandas y reduccion de solapamiento de dominio de tiempo. | |
TH1901000560A (th) | การทำให้การเคลือบแฝงโดเมนเวลาลดลงสำหรับฟิลเตอร์แบงค์แบบไม่ใช่เอกรูปซึ่งจะใช้การวิเคราะห์เชิงสเปคตรัมที่ตามหลังโดยการสังเคราะห์บางส่วน | |
Moritz et al. | Amplitude modulation filters as feature sets for robust ASR: constant absolute or relative bandwidth? | |
Chapagain et al. | „Sound Editing using Fourier Transform‟ | |
EP4307721A3 (en) | Downmixer, audio encoder, method and computer program applying a phase value to a magnitude value | |
EP4329331A3 (en) | Audio signal processing method and device | |
Zantalis et al. | Semi-Blind Audio Source Separation of Linearly Mixed Two-Channel Recordings via Guided Matching Pursuit. | |
Zhang et al. | Frequency-domain parameter estimations for binary masked signals | |
Kent | An Investigation of Digital Mixing and Panning Algorithms |