RU2016121163A - EXTENDING THE AUDIO BANDBAND BY INSERTING A NOISE WITH A PRELIMINARY TIME FORM IN THE FREQUENCY AREA - Google Patents

EXTENDING THE AUDIO BANDBAND BY INSERTING A NOISE WITH A PRELIMINARY TIME FORM IN THE FREQUENCY AREA Download PDF

Info

Publication number
RU2016121163A
RU2016121163A RU2016121163A RU2016121163A RU2016121163A RU 2016121163 A RU2016121163 A RU 2016121163A RU 2016121163 A RU2016121163 A RU 2016121163A RU 2016121163 A RU2016121163 A RU 2016121163A RU 2016121163 A RU2016121163 A RU 2016121163A
Authority
RU
Russia
Prior art keywords
signal
module
shaping
time
frequency domain
Prior art date
Application number
RU2016121163A
Other languages
Russian (ru)
Other versions
RU2666468C2 (en
Inventor
Саша ДИШ
Маркус МУЛЬТРУС
Беньямин ШУБЕРТ
Маркус ШНЕЛЛЬ
Original Assignee
Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. filed Critical Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф.
Publication of RU2016121163A publication Critical patent/RU2016121163A/en
Application granted granted Critical
Publication of RU2666468C2 publication Critical patent/RU2666468C2/en

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/028Noise substitution, i.e. substituting non-tonal spectral components by noisy source
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/03Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Noise Elimination (AREA)

Claims (41)

1. Устройство декодера аудио для декодирования битового потока (BS), при этом устройство (1) декодера аудио, содержащее:1. An audio decoder device for decoding a bitstream (BS), wherein the audio decoder device (1), comprising: приемник (2) битового потока, выполненный с возможностью приема битового потока (BS) и выведения закодированного аудиосигнала (EAS) из битового потока (BS);a bitstream receiver (2) configured to receive a bitstream (BS) and derive the encoded audio signal (EAS) from the bitstream (BS); модуль (3) базового декодера, выполненный с возможностью выведения декодированного аудиосигнала (DAS) во временной области из закодированного аудиосигнала (EAS);a base decoder module (3) configured to derive a decoded audio signal (DAS) in the time domain from an encoded audio signal (EAS); генератор (4) временной огибающей, выполненный с возможностью определения временной огибающей (TED) декодированного аудиосигнала (DAS);a time envelope generator (4) configured to determine a time envelope (TED) of a decoded audio signal (DAS); модуль (5) расширения полосы пропускания, выполненный с возможностью создания сигнала расширения полосы пропускания частотной области (BEF), при этом модуль (5) расширения полосы пропускания содержит генератор (6) шума, выполненный с возможностью создания сигнала шума (NOS) во временной области, при этом модуль (5) расширения полосы пропускания содержит модуль (7) предварительного придания формы, выполненный с возможностью придания формы по времени сигналу шума (NOS) в зависимости от временной огибающей (TED) декодированного аудиосигнала (DAS) для того, чтобы создать сигнал шума с приданной формой (SNS) и при этом модуль (5) расширения полосы пропускания содержит время-частотный преобразователь (8), выполненный с возможностью трансформирования сигнала шума с приданной формой (SNS) в сигнал шума частотной области (FNS); при этом сигнал расширения полосы пропускания частотной области (BEF) зависит от сигнала шума частотной области (FNS);a bandwidth expansion module (5) configured to generate a frequency domain bandwidth extension (BEF) signal, wherein the bandwidth expansion module (5) comprises a noise generator (6) configured to generate a noise signal (NOS) in the time domain wherein the bandwidth extension module (5) comprises a preforming module (7) configured to temporally shape the noise signal (NOS) depending on the time envelope (TED) of the decoded audio signal (DAS) for the tog in order to create a shaped noise signal (SNS), while the bandwidth extension module (5) comprises a time-frequency converter (8) adapted to transform the shaped noise signal (SNS) into a frequency domain noise signal (FNS) ; wherein the frequency domain bandwidth extension (BEF) signal is dependent on the frequency domain noise signal (FNS); время-частотный преобразователь (9), выполненный с возможностью трансформирования декодированного аудиосигнала (DAS) в декодированный аудиосигнал частотной области (FDS);a time-frequency converter (9), configured to transform a decoded audio signal (DAS) into a frequency-domain decoded audio signal (FDS); объединитель (10), выполненный с возможностью объединения декодированного аудиосигнала частотной области (FDS) и сигнала расширения полосы пропускания частотной области (BEF) для того, чтобы создать аудиосигнал частотной области с расширенной полосой пропускания (BFS); иa combiner (10) configured to combine the decoded frequency domain audio signal (FDS) and the frequency domain bandwidth extension (BEF) signal to create an extended frequency bandwidth domain (BFS) audio signal; and частотно-временной преобразователь (11), выполненный с возможностью трансформирования аудиосигнал частотной области с расширенной полосой пропускания (BFS) в аудиосигнал временной области с расширенной-полосой пропускания (BAS).a frequency-time converter (11), configured to transform the audio signal of the frequency domain with extended bandwidth (BFS) into the audio signal of the time domain with extended-bandwidth (BAS). 2. Устройство декодера аудио по предшествующему пункту, в котором сигнал расширения полосы пропускания частотной области (BEF) создается без репликации спектральной полосы.2. The audio decoder apparatus of claim 1, wherein a frequency domain bandwidth extension (BEF) signal is generated without spectral band replication. 3. Устройство декодера аудио по одному из предшествующих пунктов, в котором модуль (5) расширения полосы пропускания выполнен таким образом, что придание формы по времени сигналу шума (NOS) выполняется чрезмерно выраженным образом.3. The audio decoder device according to one of the preceding paragraphs, in which the bandwidth extension module (5) is configured such that the time-shaping of the noise signal (NOS) is performed in an overly pronounced manner. 4. Устройство декодера аудио по одному из предшествующих пунктов, в котором модуль (5) расширения полосы пропускания выполнен таким образом, что придание формы по времени сигналу шума (NOS) выполняется по субполосам посредством разбиения сигнала шума (NOS) на несколько сигналов шума субполосы посредством набора из полосовых фильтров и выполнения особого придания формы по времени над каждым из сигналов шума субполосы.4. The audio decoder device according to one of the preceding paragraphs, in which the bandwidth extension module (5) is configured such that time shaping of the noise signal (NOS) is performed by subbands by splitting the noise signal (NOS) into several noise signals of the subband by a set of band-pass filters and perform special shaping in time over each of the noise signals of the subband. 5. Устройство декодера аудио по одному из предшествующих пунктов, в котором модуль (5) расширения полосы пропускания содержит селектор (12) диапазона частот, выполненный с возможностью установки диапазона частот сигнала расширения полосы пропускания частотной области (BEF).5. The audio decoder device according to one of the preceding claims, in which the bandwidth extension module (5) comprises a frequency band selector (12) configured to set a frequency band of a frequency domain bandwidth extension (BEF) signal. 6. Устройство декодера аудио по одному из предшествующих пунктов, в котором модуль (5) расширения полосы пропускания содержит модуль пост-придания формы, выполненный с возможностью придания формы по времени и/или по спектру в частной области сигналу расширения полосы пропускания частотной области (BEF).6. The audio decoder device according to one of the preceding paragraphs, in which the bandwidth extension module (5) comprises a post-shaping module configured to shape in time and / or spectrum in a private domain in a frequency domain bandwidth extension signal (BEF ) 7. Устройство декодера аудио по одному из предшествующих пунктов, в котором приемник (2) битового потока выполнен с возможностью выведения сигнала побочной информации (SIS) из битового потока (BS), при этом модуль (5) расширения полосы пропускания выполнен с возможностью создания сигнала расширения полосы пропускания частотной области (BEF) в зависимости от сигнала побочной информации (SIS).7. The audio decoder device according to one of the preceding paragraphs, in which the bitstream receiver (2) is configured to derive a side information signal (SIS) from the bitstream (BS), while the bandwidth extension module (5) is configured to generate a signal frequency domain bandwidth (BEF) extensions depending on the side information signal (SIS). 8. Устройство декодера аудио по предшествующему пункту, в котором генератор (6) шума выполнен с возможностью создания сигнала шума (NOS) в зависимости от сигнала побочной информации (SIS).8. The audio decoder device according to the preceding paragraph, in which the noise generator (6) is configured to generate a noise signal (NOS) depending on the side information signal (SIS). 9. Устройство декодера аудио по одному из п.п. 7 или 8, в котором модуль (7) предварительного придания формы выполнен с возможностью придания формы по времени сигналу шума (NOS) в зависимости от сигнала побочной информации (SIS).9. An audio decoder device according to one of claims 7 or 8, wherein the preforming module (7) is configured to temporally shape the noise signal (NOS) depending on the side information signal (SIS). 10. Устройство декодера аудио по одному из п.п. c 7 по 9, в котором модуль (13) пост-придания формы выполнен с возможностью придания формы по времени и/или по спектру сигналу расширения полосы пропускания частотной области (BEF) в зависимости от сигнала побочной информации (SIS).10. An audio decoder device according to one of claims 7 through 9, in which the post-shaping module (13) is configured to shape in time and / or spectrum in a frequency domain bandwidth extension (BEF) signal depending on the side information signal (SIS). 11. Устройство декодера аудио по одному из предшествующих пунктов, в котором модуль (5) расширения полосы пропускания содержит дополнительный генератор (14) шума, выполненный с возможностью создания дополнительного сигнала шума (NOSF) во временной области, дополнительный модуль (15) предварительного придания формы, выполненный с возможностью придания формы по времени дополнительному сигналу шума (NOSF) в зависимости от временной огибающей (TED) декодированного аудиосигнала (DAS) для того, чтобы создавать дополнительный сигнал шума с приданной формой (SNSF), и дополнительный время-частотный преобразователь (16), выполненный с возможностью трансформирования дополнительного сигнала шума с приданной формой (SNSF) в дополнительный сигнал шума частотной области (FNSF), при этом сигнал расширения полосы пропускания частотной области (BEF) зависит от дополнительного сигнала шума частотной области (FNSF).11. The audio decoder device according to one of the preceding claims, in which the bandwidth extension module (5) comprises an additional noise generator (14) configured to create an additional noise signal (NOSF) in the time domain, an additional preforming module (15) configured to temporally shape an additional noise signal (NOSF) depending on the time envelope (TED) of the decoded audio signal (DAS) in order to create an additional noise signal with the given shape th (SNSF), and an additional time-frequency converter (16), configured to transform an additional shaped noise signal (SNSF) into an additional frequency domain noise signal (FNSF), wherein the frequency domain bandwidth extension signal (BEF) depends from an additional frequency domain noise signal (FNSF). 12. Устройство декодера аудио по предшествующему пункту, в котором модуль (5) расширения полосы пропускания выполнен таким образом, что придание формы по времени дополнительному сигналу шума (NOSF) выполняется чрезмерно выраженным образом.12. The audio decoder device according to the preceding paragraph, in which the bandwidth extension module (5) is configured such that time shaping of the additional noise signal (NOSF) is performed in an overly pronounced manner. 13. Устройство декодера аудио по п.п. 11 или 12, в котором модуль (5) расширения полосы пропускания выполнен таким образом, что придание формы по времени дополнительному сигналу шума (NOSF) выполняется по субполосам посредством разбиения дополнительного сигнала шума (NOSF) на несколько дополнительных сигналов шума субполосы посредством набора из полосовых фильтров и выполнения особого придания формы по времени над каждым из дополнительных сигналов шума субполосы.13. The device audio decoder p. 11 or 12, wherein the bandwidth extension module (5) is configured such that time shaping of the additional noise signal (NOSF) is performed by subbands by splitting the additional noise signal (NOSF) into several additional noise signals of the subband by a set of bandpass filters and performing a particular shaping in time over each of the additional subband noise signals. 14. Устройство декодера аудио по одному из предшествующих пунктов, в котором модуль (5) расширения полосы пропускания содержит генератор (17) тона, выполненный с возможностью создания сигнала тона (TOS) во временной области, модуль (18) предварительного придания формы тону, выполненный с возможностью придания формы по времени сигналу тона (TOS) в зависимости от временной огибающей (TED) декодированного аудиосигнала (DAS) для того, чтобы создать сигнал тона с приданной формой (STS) и время-частотный преобразователь (19), выполненный с возможностью трансформирования сигнала тона с приданной формой (STS) в сигнал тона частотной области (FTS), при этом сигнал расширения полосы пропускания частотной области (BEF) зависит от сигнала тона частотной области (FTS).14. The audio decoder device according to one of the preceding claims, in which the bandwidth extension module (5) comprises a tone generator (17) configured to generate a tone signal (TOS) in the time domain, a preliminary tone-shaping module (18) made with the possibility of shaping in time the tone signal (TOS) depending on the time envelope (TED) of the decoded audio signal (DAS) in order to create a tone signal with a given shape (STS) and a time-frequency converter (19) configured to transform shape tone signal (STS) into the frequency domain tone signal (FTS), wherein the frequency domain bandwidth extension signal (BEF) depends on the frequency domain tone signal (FTS). 15. Устройство декодера аудио по одному из предшествующих пунктов, в котором модуль (5) базового декодера содержит базовый декодер (21) временной области и базовый декодер (22) частотной области, при этом либо базовый декодер (21) временной области, либо базовый декодер (22) частотной области используется для выведения декодированного аудиосигнала (DAS) из закодированного аудиосигнала (EAS).15. The audio decoder device according to one of the preceding claims, in which the base decoder module (5) comprises a base time domain decoder (21) and a frequency domain base decoder (22), wherein either the base time domain decoder (21) or the base decoder (22) the frequency domain is used to derive the decoded audio signal (DAS) from the encoded audio signal (EAS). 16. Устройство декодера аудио по предшествующему пункту, в котором экстрактор (23) параметра управления выполнен с возможностью извлечения параметров управления (CP), используемых модулем (3) базового декодера, из декодированного аудиосигнала (DAS) и при этом модуль (5) расширения полосы пропускания выполнен с возможностью создания сигнала расширения полосы пропускания частотной области (BEF) в зависимости от параметров управления (CP).16. The audio decoder device according to the preceding paragraph, in which the control parameter extractor (23) is configured to extract control parameters (CP) used by the base decoder module (3) from the decoded audio signal (DAS) and the band extension module (5) bandwidth is configured to create a frequency domain bandwidth extension (BEF) signal depending on control parameters (CP). 17. Устройство декодера аудио по одному из предшествующих пунктов, в котором модуль (5) расширения полосы пропускания содержит калькулятор (24) коэффициентов усиления придания формы, выполненный с возможностью установления коэффициентов усиления придания формы (SG) для модуля (7) предварительного придания формы в зависимости от временной огибающей (TED) декодированного аудиосигнала (DAS) и при этом модуль (7) предварительного придания формы выполнен с возможностью придания формы по времени сигналу шума (NOS) в зависимости от коэффициентов усиления придания формы (SG) для модуля (7) предварительного придания формы.17. The audio decoder device according to one of the preceding claims, in which the bandwidth extension module (5) comprises a shaping gain calculator (24) configured to set the shaping gain (SG) for the preliminary shaping module (7) in depending on the time envelope (TED) of the decoded audio signal (DAS) and the pre-shaping module (7) is configured to time-shape the noise signal (NOS) depending on the gain shaping (SG) for the module (7) pre-shaping. 18. Устройство декодера аудио по п.п. 16 и 17, в котором калькулятор (24) коэффициентов усиления придания формы для установления коэффициентов усиления придания формы (SG) для модуля (7) предварительного придания формы выполнен с возможностью установления коэффициентов усиления придания формы (SG) для модуля (7) предварительного придания формы в зависимости от параметров управления (CP).18. The device audio decoder in p. 16 and 17, wherein the shaping gain calculator (24) for determining shaping gain (SG) for the pre-shaping module (7) is configured to set shaping gain (SG) for the pre-shaping module (7) depending on control parameters (CP). 19. Устройство декодера аудио по одному из п.п. с 11 по 18, в котором модуль (5) расширения полосы пропускания содержит калькулятор коэффициентов усиления придания формы, выполненный с возможностью установления коэффициентов усиления придания формы для дополнительного модуля (15) предварительного придания формы в зависимости от временной огибающей (TED) декодированного аудиосигнала (DAS) и при этом дополнительный модуль (14) предварительного придания формы выполнен с возможностью придания формы по времени дополнительному сигналу шума (NOSF) в зависимости от коэффициентов усиления придания формы для дополнительного модуля (14) предварительного придания формы.19. An audio decoder device according to one of claims 11 to 18, wherein the bandwidth extension module (5) comprises a shaping gain calculator configured to set the shaping gain for the pre-shaping add-on module (15) depending on the time envelope (TED) of the decoded audio signal (DAS ) and at the same time, the additional module (14) for preliminary shaping is configured to give the form in time an additional noise signal (NOSF) depending on the gain of giving the ph frames for the additional module (14) pre-shaping. 20. Устройство декодера аудио по п.п. 16 и 19, в котором калькулятор коэффициентов усиления придания формы для установления коэффициентов усиления придания формы для дополнительного модуля (15) предварительного придания формы выполнен с возможностью установления коэффициентов усиления придания формы для дополнительного модуля (15) предварительного придания формы в зависимости от параметров управления (CP).20. The device audio decoder p. 16 and 19, wherein the shaping gain factor calculator for establishing the shaping gain for the pre-shaping additional module (15) is configured to set the shaping gain for the pre-shaping additional module (15) depending on the control parameters (CP ) 21. Устройство декодера аудио по одному из п.п. с 14 по 20, в котором модуль (5) расширения полосы пропускания содержит калькулятор коэффициентов усиления придания формы, выполненный с возможностью установления коэффициентов усиления придания формы для модуля (18) предварительного придания формы тону в зависимости от временной огибающей (TED) декодированного аудиосигнала (DAS) и при этом модуль (18) предварительного придания формы тону выполнен с возможностью придания формы по времени сигналу тона (TOS) в зависимости от коэффициентов усиления придания формы для модуля (18) предварительного придания формы тону.21. An audio decoder device according to one of claims 14 to 20, wherein the bandwidth extension module (5) comprises a shaping gain calculator configured to set the shaping gain for the pre-shaping module (18) depending on the time envelope (TED) of the decoded audio signal (DAS ) and at the same time, the pre-shaping module (18) is configured to temporally shape the tone signal (TOS) depending on the shaping gain for the pre-shaping module (18) Nia forms tone. 22. Устройство декодера аудио по п.п. 16 и 21, в котором калькулятор коэффициентов усиления придания формы для установления коэффициентов усиления придания формы для модуля (18) предварительного придания формы тону выполнен с возможностью установления коэффициентов усиления придания формы для дополнительного модуля (18) предварительного придания формы в зависимости от параметров управления (CP).22. The device audio decoder in p. 16 and 21, wherein the shaping gain factor calculator for establishing shaping gain factors for the pre-shaping module (18) is configured to set shaping gain factors for the supplementary shaping module (18) depending on control parameters (CP ) 23. Способ для декодирования битового потока (BS), при этом способ, содержащий этапы, на которых:23. A method for decoding a bitstream (BS), the method comprising the steps of: принимают битовый поток (BS) и выводят закодированный аудиосигнал (EAS) из битового потока (BS), используя приемник (2) битового потока;receiving a bitstream (BS) and outputting the encoded audio signal (EAS) from the bitstream (BS) using the bitstream receiver (2); выводят декодированный аудиосигнал (DAS) во временной области из закодированного аудиосигнала (EAS), используя модуль (3) базового декодера;outputting the decoded audio signal (DAS) in the time domain from the encoded audio signal (EAS) using the base decoder module (3); определяют временную огибающую (TED) декодированного аудиосигнала (DAS), используя генератор (4) временной огибающей;determining a temporal envelope (TED) of the decoded audio signal (DAS) using the temporal envelope generator (4); создают сигнал расширения полосы пропускания частотной области (BEF), используя модуль (5) расширения полосы пропускания, исполняющий этапы, на которых:creating a frequency domain bandwidth extension (BEF) signal using the bandwidth extension module (5), performing the steps of: создают сигнал шума (NOS) во временной области, используя генератор (6) шума модуля (5) расширения полосы пропускания,creating a noise signal (NOS) in the time domain using the noise generator (6) of the bandwidth extension module (5), придают форму по времени сигналу шума (NOS) в зависимости от временной огибающей (TED) декодированного аудиосигнала (DAS) для того, чтобы создать сигнал шума с приданной формой (SNS), используя модуль (7) предварительного придания формы модуля (5) расширения полосы пропускания,shape the noise signal (NOS) in time as a function of the time envelope (TED) of the decoded audio signal (DAS) in order to create a shaped noise signal (SNS) using the pre-shaped module (7) of the band extension module (5) transmittance трансформируют сигнал шума с приданной формой (SNS) в сигнал шума частотной области (FNS); при этом сигнал расширения полосы пропускания частотной области (BEF) зависит от сигнала шума частотной области (FNS), используя время-частотный преобразователь (8) модуля (5) расширения полосы пропускания;transforming the shaped noise signal (SNS) into a frequency domain noise signal (FNS); wherein the frequency domain bandwidth extension (BEF) signal is dependent on the frequency domain noise signal (FNS) using the time-frequency converter (8) of the bandwidth extension module (5); трансформируют декодированный аудиосигнал (DAS) в декодированный аудиосигнал частотной области (FDS), используя дополнительный время-частотный преобразователь (9);transforming the decoded audio signal (DAS) into a frequency domain decoded audio signal (FDS) using an additional time-frequency converter (9); объединяют декодированный аудиосигнал частотной области (FDS) и сигнал расширения полосы пропускания частотной области (BEF) для того, чтобы создать аудиосигнал частотной области с расширенной полосой пропускания (BFS), используя объединитель (10); иcombining the decoded frequency domain audio signal (FDS) and the frequency domain bandwidth extension (BEF) signal to create an extended frequency bandwidth domain (BFS) audio signal using a combiner (10); and трансформируют аудиосигнал частотной области с расширенной полосой пропускания (BFS) в аудиосигнал временной области с расширенной-полосой пропускания (BAS), используя частотно-временной преобразователь (11).transforming the audio signal of the frequency domain with extended bandwidth (BFS) into the audio signal of the time domain with extended bandwidth (BAS) using the time-frequency converter (11). 24. Компьютерная программа, при выполнении на процессоре, исполняющая способ по предшествующему пункту. 24. A computer program, when executed on a processor, executing the method of the preceding paragraph.
RU2016121163A 2013-10-31 2014-10-30 Audio bandwidth extension by insertion of temporal pre-shaped noise in frequency domain RU2666468C2 (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP13191127.3 2013-10-31
EP13191127 2013-10-31
PCT/EP2014/073375 WO2015063227A1 (en) 2013-10-31 2014-10-30 Audio bandwidth extension by insertion of temporal pre-shaped noise in frequency domain

Publications (2)

Publication Number Publication Date
RU2016121163A true RU2016121163A (en) 2017-12-05
RU2666468C2 RU2666468C2 (en) 2018-09-07

Family

ID=51845400

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2016121163A RU2666468C2 (en) 2013-10-31 2014-10-30 Audio bandwidth extension by insertion of temporal pre-shaped noise in frequency domain

Country Status (11)

Country Link
US (1) US9805731B2 (en)
EP (1) EP3063761B1 (en)
JP (1) JP6396459B2 (en)
KR (1) KR101852749B1 (en)
CN (1) CN105706166B (en)
CA (1) CA2927990C (en)
ES (1) ES2657337T3 (en)
MX (1) MX355452B (en)
RU (1) RU2666468C2 (en)
TR (1) TR201802303T4 (en)
WO (1) WO2015063227A1 (en)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3483880A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Temporal noise shaping
EP3483886A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Selecting pitch lag
WO2019091576A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits
EP3483884A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Signal filtering
EP3483878A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder supporting a set of different loss concealment tools
EP3483882A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Controlling bandwidth in encoders and/or decoders
EP3483883A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio coding and decoding with selective postfiltering
WO2019091573A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters
EP3483879A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Analysis/synthesis windowing function for modulated lapped transformation
EP3671741A1 (en) * 2018-12-21 2020-06-24 FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. Audio processor and method for generating a frequency-enhanced audio signal using pulse processing
CN110534128B (en) * 2019-08-09 2021-11-12 普联技术有限公司 Noise processing method, device, equipment and storage medium

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3605706B2 (en) * 1994-10-06 2004-12-22 伸 中川 Sound signal reproducing method and apparatus
US6226616B1 (en) * 1999-06-21 2001-05-01 Digital Theater Systems, Inc. Sound quality of established low bit-rate audio coding systems without loss of decoder compatibility
ATE331280T1 (en) * 2001-11-23 2006-07-15 Koninkl Philips Electronics Nv BANDWIDTH EXTENSION FOR AUDIO SIGNALS
JP4471931B2 (en) 2003-07-29 2010-06-02 パナソニック株式会社 Audio signal band extending apparatus and method
CA2457988A1 (en) * 2004-02-18 2005-08-18 Voiceage Corporation Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization
EP1829424B1 (en) * 2005-04-15 2009-01-21 Dolby Sweden AB Temporal envelope shaping of decorrelated signals
CN101140759B (en) * 2006-09-08 2010-05-12 华为技术有限公司 Band-width spreading method and system for voice or audio signal
JP2008096567A (en) * 2006-10-10 2008-04-24 Matsushita Electric Ind Co Ltd Audio encoding device and audio encoding method, and program
DK3401907T3 (en) * 2007-08-27 2020-03-02 Ericsson Telefon Ab L M Method and apparatus for perceptual spectral decoding of an audio signal comprising filling in spectral holes
EP2571024B1 (en) * 2007-08-27 2014-10-22 Telefonaktiebolaget L M Ericsson AB (Publ) Adaptive transition frequency between noise fill and bandwidth extension
EP2293295A3 (en) * 2008-03-10 2011-09-07 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Device and method for manipulating an audio signal having a transient event
CN101281748B (en) * 2008-05-14 2011-06-15 武汉大学 Method for filling opening son (sub) tape using encoding index as well as method for generating encoding index
US8532998B2 (en) * 2008-09-06 2013-09-10 Huawei Technologies Co., Ltd. Selective bandwidth extension for encoding/decoding audio/speech signal
US8532983B2 (en) * 2008-09-06 2013-09-10 Huawei Technologies Co., Ltd. Adaptive frequency prediction for encoding or decoding an audio signal
EP2239732A1 (en) 2009-04-09 2010-10-13 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Apparatus and method for generating a synthesis audio signal and for encoding an audio signal
JP4932917B2 (en) * 2009-04-03 2012-05-16 株式会社エヌ・ティ・ティ・ドコモ Speech decoding apparatus, speech decoding method, and speech decoding program
EP2273493B1 (en) * 2009-06-29 2012-12-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Bandwidth extension encoding and decoding
US8515768B2 (en) * 2009-08-31 2013-08-20 Apple Inc. Enhanced audio decoder
CA2770287C (en) * 2010-06-09 2017-12-12 Panasonic Corporation Bandwidth extension method, bandwidth extension apparatus, program, integrated circuit, and audio decoding apparatus
RU2630390C2 (en) * 2011-02-14 2017-09-07 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Device and method for masking errors in standardized coding of speech and audio with low delay (usac)
MX2013013261A (en) * 2011-05-13 2014-02-20 Samsung Electronics Co Ltd Bit allocating, audio encoding and decoding.

Also Published As

Publication number Publication date
ES2657337T3 (en) 2018-03-02
MX355452B (en) 2018-04-18
JP6396459B2 (en) 2018-09-26
KR20160075768A (en) 2016-06-29
RU2666468C2 (en) 2018-09-07
CA2927990C (en) 2018-08-14
KR101852749B1 (en) 2018-06-07
CN105706166B (en) 2020-07-14
US9805731B2 (en) 2017-10-31
CN105706166A (en) 2016-06-22
WO2015063227A1 (en) 2015-05-07
EP3063761B1 (en) 2017-11-22
TR201802303T4 (en) 2018-03-21
EP3063761A1 (en) 2016-09-07
JP2016541012A (en) 2016-12-28
CA2927990A1 (en) 2015-05-07
US20160240200A1 (en) 2016-08-18
MX2016005167A (en) 2016-07-05

Similar Documents

Publication Publication Date Title
RU2016121163A (en) EXTENDING THE AUDIO BANDBAND BY INSERTING A NOISE WITH A PRELIMINARY TIME FORM IN THE FREQUENCY AREA
RU2016105618A (en) DEVICE, METHOD AND COMPUTER PROGRAM FOR DECODING AN ENCRYPTED AUDIO SIGNAL
RU2010122326A (en) METHOD AND DEVICE FOR AUDIO DECODING
AU2011239995B2 (en) Apparatus, method and computer program for generating a wideband signal using guided bandwidth extension and blind bandwidth extension
AR080319A1 (en) APPLIANCE AND METHOD TO MODIFY AN AUDIO SIGNAL USING HARMONIC LOCK
RU2015136792A (en) AUDIO CODER, AUDIO DECODER, METHOD FOR PROCESSING ENCODED AUDIO INFORMATION, METHOD FOR PROVIDING DECODED AUDIO INFORMATION, COMPUTER PROGRAM AND ENCODED REPRESENTATION USING SIGNAL-RESISTANCE
RU2012111784A (en) DEVICE AND METHOD FOR SIGNAL PROCESSING AND PROGRAM
RU2015151169A (en) DEVICE AND METHOD FOR EXTENDING THE FREQUENCY RANGE FOR ACOUSTIC SIGNALS
RU2010125251A (en) METHOD AND DEVICE FOR SIGNAL PROCESSING
UA107771C2 (en) Prediction-based fm stereo radio noise reduction
EA028755B9 (en) Companding system and method to reduce quantization noise using advanced spectral extension
MX363675B (en) Improved frequency band extension in an audio signal decoder.
US11915709B2 (en) Inter-channel phase difference parameter extraction method and apparatus
RU2014143463A (en) HARMONIC AUDIO BAND EXTENSION
WO2018226419A8 (en) Systems and methods for automatically generating enhanced audio output
JP2015184470A5 (en)
EA202091313A1 (en) BACKWARD COMPATIBLE HARMONIC TRANSPOSTER LAYOUT FOR RECONSTRUCTION OF HIGH FREQUENCIES OF SOUND SIGNALS
RU2017106091A (en) AUDIO DECODER, METHOD AND COMPUTER PROGRAM USING CHARACTERISTICS IN THE ABSENCE OF INPUT SIGNAL FOR RECEIVING A SMOOTH TRANSITION
JP5232121B2 (en) Signal processing device
WO2007107670A3 (en) Method for post-processing a signal in an audio decoder
NZ727567A (en) Method for processing speech/audio signal and apparatus
RU2016138694A (en) CODER, DECODER, CODING METHOD, DECODING METHOD AND PROGRAM
CN105761726A (en) Method and device for eliminating TDD noise
US20090176449A1 (en) Out-of-Band Signal Generator and Frequency Band Expander
CN106328159B (en) Audio stream processing method and device