RU2665259C1 - Устройство и способ для обработки звукового сигнала с использованием гармонического постфильтра - Google Patents

Устройство и способ для обработки звукового сигнала с использованием гармонического постфильтра Download PDF

Info

Publication number
RU2665259C1
RU2665259C1 RU2017106109A RU2017106109A RU2665259C1 RU 2665259 C1 RU2665259 C1 RU 2665259C1 RU 2017106109 A RU2017106109 A RU 2017106109A RU 2017106109 A RU2017106109 A RU 2017106109A RU 2665259 C1 RU2665259 C1 RU 2665259C1
Authority
RU
Russia
Prior art keywords
filter
tap
audio signal
value
gain
Prior art date
Application number
RU2017106109A
Other languages
English (en)
Inventor
Эммануэль РАВЕЛЛИ
Кристиан ХЕЛЬМРИХ
Горан МАРКОВИЧ
Маттиас НОЙЗИНГЕР
Саша ДИШ
Мануэль ЯНДЕР
Мартин ДИТЦ
Original Assignee
Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. filed Critical Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф.
Application granted granted Critical
Publication of RU2665259C1 publication Critical patent/RU2665259C1/ru

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01LMEASURING FORCE, STRESS, TORQUE, WORK, MECHANICAL POWER, MECHANICAL EFFICIENCY, OR FLUID PRESSURE
    • G01L21/00Vacuum gauges
    • G01L21/02Vacuum gauges having a compression chamber in which gas, whose pressure is to be measured, is compressed
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • G10L19/025Detection of transients or attacks for time/frequency resolution switching
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
  • Control Of Amplification And Gain Control (AREA)
  • Stereophonic System (AREA)

Abstract

Изобретение относится к устройству, системе, способам и машиночитаемым носителям для обработки аудиосигнала. Технический результат заключается в обеспечении фильтрации аудиосигнала. Устройство содержит преобразователь области для преобразования представления аудиосигнала в первой области в представление аудиосигнала во второй области и гармонический постфильтр для фильтрации представления аудиосигнала во второй области, при этом постфильтр основан на передаточной функции, содержащей числитель и знаменатель, при этом числитель содержит значение усиления, указываемое посредством информации усиления, и при этом знаменатель содержит целочисленную часть запаздывания основного тона, указываемую посредством информации запаздывания основного тона, и многоотводный фильтр, зависящий от дробной части запаздывания основного тона. 6 н. и 11 з.п. ф-лы, 11 ил.

Description

Подробное описание изобретения
Настоящее изобретение относится к аудиообработке, и в частности, к аудиообработке с использованием гармонического постфильтра.
Аудиокодеки на основе преобразования, в общем, вводят межгармонический шум при обработке гармонических аудиосигналов, в частности, на низких скоростях передачи битов.
Этот эффект дополнительно ухудшается, когда аудиокодек на основе преобразования работает при низкой задержке вследствие худшего частотного разрешения и/или избирательности, введенной посредством меньшего размера преобразования, и/или худшей частотной характеристики функции окна.
Этот межгармонический шум, в общем, воспринимается в качестве очень раздражающего артефакта, значительно уменьшая производительность аудиокодека на основе преобразования при субъективной оценке на высокотональном аудиоматериале.
Существуют несколько решений для того, чтобы повышать субъективное качество аудиокодеков на основе преобразования для гармонических аудиосигналов. Все они основаны на технологиях на основе прогнозирования, в области преобразования или во временной области.
Примеры подходов области преобразования следующие:
[1] H. Fuchs, "Improving MPEG Audio Coding by Backward Adaptive Linear Stereo Prediction", 99th AES Convention, New York, 1995 год, Preprint 4086.
[2] L. Yin, M. Suonio, M. Väänänen, "A New Backward Predictor for MPEG Audio Coding", 103rd AES Convention, New York, 1997 год, Preprint 4521.
[3] Juha Ojanperä, Mauri Väänänen, Lin Yin, "Long Term Predictor for Transform Domain Perceptual Audio Coding", 107th AES Convention, New York, 1999 год, Preprint 5036.
Примеры подходов на основе временной области следующие:
[4] Philip J. Wilson, Harprit Chhatwal, "Adaptive transform coder having long term predictor", патент (США) 5012517, 30 апреля 1991 года.
[5] Jeongook Song, Chang-Heon Lee, Hyen-O Oh, Hong-Goo Kang, "Harmonic Enhancement in Low Bitrate Audio Coding Using and Efficient Long-Term Predictor", EURASIP Journal on Advances in Signal Processing, 2010 год.
[6] Juin-Hwey Chen, "Pitch-based pre-filtering and post-filtering for compression of audio signals", патент (США) 8738385, 27 мая 2014 года.
Цель настоящего изобретения заключается в том, чтобы предоставить усовершенствованный принцип для обработки аудиосигнала.
Это цель достигается посредством устройства для обработки аудиосигнала по п. 1, способа для обработки аудиосигнала по п. 12, системы по п. 13, способа для работы системы по п. 17 или компьютерной программы по п. 18.
Настоящее изобретение основано на таких выявленных сведениях, что субъективное качество аудиосигнала может существенно повышаться посредством использования гармонического постфильтра, имеющего передаточную функцию, содержащую числитель и знаменатель. Числитель передаточной функции содержит значение усиления, указываемое посредством передаваемой информации усиления, и знаменатель содержит целочисленную часть запаздывания основного тона, указываемую посредством информации запаздывания основного тона, и многоотводный фильтр, зависящий от дробной части запаздывания основного тона.
Следовательно, можно удалять межгармонический шум, введенный посредством обычного аудиодекодера с изменением области в качестве артефакта. Этот гармонический постфильтр, в частности, является полезным тем, что он основывается на передаваемой информации, т.е. усилении основного тона и запаздывании основного тона, которые доступны в любом случае в декодере, поскольку эта информация принимается из соответствующего кодера через входной сигнал декодера. Кроме того, постфильтрация имеет конкретную точность вследствие того, что учитывается не только целочисленная часть запаздывания основного тона, но и, помимо этого, учитывается дробная часть запаздывания основного тона. Дробная часть запаздывания основного тона может быть, в частности, введена в постфильтр через многоотводный фильтр, который имеет коэффициенты фильтрации, фактически зависящие от дробной части запаздывания основного тона. Этот фильтр может реализовываться как FIR-фильтр или также может реализовываться как любой другой фильтр, к примеру, как IIR-фильтр или другая реализация фильтра. Любое изменение области, такое как изменение "время-частота" или изменение "LPC-время", или изменение "время-LPC", или изменение "частота-время", может преимущественно улучшаться посредством принципа постфильтра изобретения. Тем не менее, предпочтительно, изменение области представляет собой изменение из частотной во временную область.
Следовательно, варианты осуществления настоящего изобретения уменьшают межгармонический шум, введенный посредством аудиокодека с преобразованием, на основе долговременного предиктора, работающего во временной области. В отличие от [04]-[6], в которых используются как предварительный фильтр до кодирования с преобразованием, так и постфильтр после декодирования с преобразованием, настоящее изобретение предпочтительно применяет только постфильтр.
Кроме того, следует отметить, что предварительный фильтр, используемый в [04]-[6], имеет тенденцию вводить нестабильности во входном сигнале, предоставленном в кодер с преобразованием. Эти нестабильности обусловлены изменениями усиления и/или запаздывания основного тона между кадрами. Кодер с преобразованием испытывает затруднения в кодировании таких нестабильностей, в частности, на низких скоростях передачи битов, и он иногда вводит еще больше шума в декодированном сигнале по сравнению с ситуацией без предварительного или постфильтра.
Предпочтительно, настоящее изобретение вообще не использует предварительный фильтр и за счет этого полностью исключает проблемы, обусловленные предварительным фильтром.
Кроме того, настоящее изобретение основывается на постфильтре, который применяется к декодированному сигналу после кодирования с преобразованием. Этот постфильтр основан на долговременном прогнозном фильтре с учетом целочисленной части и дробной части запаздывания основного тона, что уменьшает межгармонический шум, введенный посредством аудиокодека с преобразованием.
Для лучшей устойчивости, параметры постфильтрации "запаздывание основного тона" и "усиление основного тона" оцениваются на стороне кодера и передаются в потоке битов. Тем не менее, в других реализациях, запаздывание основного тона и усиление основного тона также могут оцениваться на стороне декодера на основе декодированного аудиосигнала, полученного посредством аудиодекодера, содержащего частотно-временной преобразователь для преобразования частотного представления аудиосигнала в представление аудиосигнала во временной области.
В предпочтительном варианте осуществления, числитель дополнительно содержит многоотводный фильтр для нулевой дробной части запаздывания основного тона, чтобы компенсировать спектральный наклон, введенный посредством многоотводного фильтра в знаменателе, который зависит от дробной части запаздывания основного тона.
Предпочтительно, постфильтр сконфигурирован с возможностью подавлять величину энергии между гармониками в кадре, при этом подавляемая величина энергии меньше 20% полной энергии представления во временной области в кадре.
В дополнительном варианте осуществления, знаменатель содержит произведение между многоотводным фильтром и значением усиления.
В дополнительном варианте осуществления, числитель фильтра дополнительно содержит произведение первого скалярного значения и второго скалярного значения, при этом знаменатель содержит только второе скалярное значение, а не первое скалярное значение. Эти скалярные значения задаются равными предварительно определенным значениям и имеют значения, большие 0 и меньшие 1; и, дополнительно, второе скалярное значение ниже первого скалярного значения. Следовательно, можно очень эффективным способом задавать характеристики удаления энергии, которые типично нежелательны, и дополнительно задавать интенсивность фильтрации, т.е. то, как сильный фильтр ослабляет межгармонические артефакты в выходном сигнале декодера в области преобразования.
Устройство дополнительно содержит, в предпочтительном варианте осуществления, контроллер фильтра для задания, по меньшей мере, второго скалярного значения в зависимости от скорости передачи битов таким образом, что большее значение задается для более низкой скорости передачи битов, и наоборот.
Кроме того, контроллер фильтра сконфигурирован с возможностью выбора, в зависимости от дробной части запаздывания основного тона, соответствующего многоотводного фильтра зависимым от сигнала способом, чтобы задавать гармонический постфильтр сигнально-адаптивно, т.е. в зависимости от фактически предоставленного значения дробной части запаздывания основного тона.
Далее поясняются предпочтительные варианты осуществления настоящего изобретения в контексте прилагаемых чертежей, на которых:
Фиг. 1 иллюстрирует вариант осуществления изобретаемого устройства для обработки аудиосигнала;
Фиг 2 иллюстрирует предпочтительную реализацию гармонического постфильтра, представленного в качестве передаточных функций в z-области;
Фиг. 3 иллюстрирует дополнительный предпочтительный вариант осуществления для гармонического постфильтра, представленного посредством передаточной функции в z-области;
Фиг. 4 иллюстрирует предпочтительную реализацию кодера для формирования кодированного сигнала, который должен декодироваться посредством аудиодекодера в области преобразования, проиллюстрированного на фиг. 1;
Фиг. 5 иллюстрирует предпочтительную реализацию многоотводного фильтра в качестве FIR-фильтра, управляемого посредством контроллера фильтра;
Фиг. 6 иллюстрирует взаимодействие между контроллером фильтра и запоминающим устройством, имеющим предварительно сохраненные весовые коэффициенты отводов, зависящие от дробной части;
Фиг. 7a иллюстрирует частотную характеристику фильтра, имеющего нулевое значение α.
Фиг. 7b иллюстрирует частотную характеристику предпочтительного гармонического постфильтра, имеющего значение α, равное 1;
Фиг. 7c иллюстрирует частотную характеристику предпочтительного гармонического постфильтра, имеющего значение α в 0,8;
Фиг. 8a иллюстрирует предпочтительный вариант осуществления гармонического постфильтра, имеющего значение β, равное 0,4; и
Фиг. 8b иллюстрирует частотную характеристику гармонического постфильтра, имеющего значение β в 0,2.
Фиг. 1 иллюстрирует устройство для обработки аудиосигнала, имеющего ассоциированную информацию запаздывания основного тона и информацию усиления. Эта информация усиления может передаваться в декодер 100 через ввод 102 декодера, принимающий кодированный сигнал, или, альтернативно, эта информация может вычисляться в самом декодере, когда эта информация не доступна. Тем не менее, для более надежной работы, предпочтительно вычислять информацию запаздывания основного тона и информацию усиления основного тона на стороне кодера.
Декодер 100 содержит, например, частотно-временной преобразователь для преобразования частотно-временного представления аудиосигнала в представление аудиосигнала во временной области. Таким образом, декодер не представляет собой речевой кодек только временной области, но содержит декодер только в области преобразования или декодер в смешанной области преобразования либо любой другой кодер, работающий в области, отличающейся от временной области. Кроме того, предпочтительно, если вторая область представляет собой временную область.
Кроме того, устройство содержит гармонический постфильтр 104 для фильтрации представления аудиосигнала во временной области, и этот гармонический постфильтр основан на передаточной функции, содержащей числитель и знаменатель. В частности, числитель содержит значение усиления, указываемое посредством информации усиления, и знаменатель содержит целочисленную часть запаздывания основного тона, указываемую посредством информации запаздывания основного тона, и, что важно, дополнительно содержит многоотводный фильтр, зависящий от дробной части запаздывания основного тона.
Предпочтительная реализация этого гармонического постфильтра с передаточной функцией H(z) проиллюстрирована на фиг. 2. Этот фильтр принимает выходной сигнал 106 декодера и подвергает этот декодированный выходной сигнал операции постфильтрации, чтобы получать постфильтрованный выходной сигнал 108. Этот постфильтрованный выходной сигнал может выводиться в качестве обработанного сигнала или дополнительно может обрабатываться посредством любой процедуры для удаления любых неоднородностей, введенных посредством операции постфильтрации, которая, конечно, является зависимой от сигнала, т.е. может варьироваться между кадрами. Эта операция удаления неоднородности может быть любой известной операцией удаления неоднородности, такой как плавный переход, что означает то, что более ранний кадр постепенно затухает, и, одновременно, новый кадр постепенно нарастает, и предпочтительно, характеристика постепенного изменения является такой, что коэффициенты постепенного изменения составляют в целом единицу в течение операции плавного перехода. Тем не менее, также может применяться другое удаление неоднородности, такое как фильтрация нижних частот или LPC-фильтрация.
Кроме того, устройство для обработки аудиосигнала, проиллюстрированное на фиг. 1, содержит устройство 112 хранения информации многоотводного фильтра и контроллер 114 фильтра. В частности, контроллер 114 фильтра принимает вспомогательную информацию 116 из декодера 100, и эта вспомогательная информация, например, может быть информацией g усиления основного тона и информацией запаздывания основного тона, т.е. информацией относительно целочисленной части Tint запаздывания основного тона и дробной части Tfr запаздывания основного тона. Эта информация является полезной для задания гармонического постфильтра между кадрами и, дополнительно, для выбора информации B(z, Tfr) многоотводного фильтра. Кроме того, дополнительная информация, такая как скорость передачи битов, применяемая посредством декодера, либо частота дискретизации, лежащая в основе декодированного сигнала, также может использоваться посредством контроллера 114 фильтра, чтобы, в частности, устанавливать скалярные значения α, β для определенной настройки кодера и/или декодера относительно скорости передачи битов и частоты дискретизации.
Фиг. 2 иллюстрирует представление нулей и полюсов передаточной функции H(z) фильтра в z-области, как известно в данной области техники. Естественно, предусмотрено множество других представлений гармонического постфильтра, которые все являются представлениями фильтра, которые могут преобразовываться в вид представления нулей и полюсов в z-области. Следовательно, настоящее изобретение является применимым для каждого фильтра, который может описываться тем или иным способом посредством такой передаточной функции, как проиллюстрировано в описании изобретения.
Фиг. 3 иллюстрирует предпочтительный вариант осуществления гармонического постфильтра, также описанный в качестве передаточной функции в обозначении нулей и полюсов в z-области.
Фильтр может описываться следующим образом:
Figure 00000001
,
где
Figure 00000002
является декодированным усилением,
Figure 00000003
и
Figure 00000004
является целочисленной и дробной частью декодированного запаздывания основного тона, α и β являются двумя скалярными величинами, которые взвешивают усиление, и
Figure 00000005
является FIR-фильтром нижних частот, коэффициенты которого зависят от дробной части декодированного запаздывания основного тона.
Следует отметить, что
Figure 00000006
в числителе
Figure 00000007
используется для того, чтобы компенсировать наклон, введенный посредством
Figure 00000005
.
β используется для того, чтобы управлять интенсивностью постфильтра. Β, равное 1, формирует полные эффекты, подавляя максимальную возможную величину энергии между гармониками. β, равное 0, отключает постфильтр. Обычно, довольно низкое значение используется для того, чтобы не подавлять слишком большую величину энергии между гармониками. Значение также может зависеть от скорости передачи битов с большим значением при более низкой скорости передачи битов, например, 0,4 при низкой скорости передачи битов и 0,2 при высокой скорости передачи битов.
α используется для того, чтобы добавлять небольшой наклон в частотную характеристику H(z), чтобы компенсировать небольшие потери в энергии на низких частотах. Значение α, в общем, выбирается близким к 1, например, 0,8.
Пример
Figure 00000008
приведен на фиг. 6. Порядок и коэффициенты
Figure 00000008
также могут зависеть от скорости передачи битов и выходной частоты дискретизации. Различная частотная характеристика может быть рассчитана и настроена для каждой комбинации скорости передачи битов и выходной частоты дискретизации.
В частности, выяснено, что даже значения для α между 0,6 и меньше 1,0 являются полезными, и что, дополнительно, значения для β между 0,1, и 0,5, как оказалось, также являются полезными.
Кроме того, многоотводный фильтр может иметь переменное число отводов. Обнаружено, что для определенных реализаций, четырех отводов достаточно, где один отвод является z+1. Тем не менее, меньшие фильтры только с двумя отводами или даже большие фильтры более чем с четырьмя отводами являются полезными для определенных реализаций.
Фиг. 6 иллюстрирует предпочтительную реализацию фильтров B(z) для различных дробных значений запаздывания основного тона и, в частности, для разрешения запаздывания основного тона в 1/4. Для этой реализации, проиллюстрированы четыре различных описания фильтра для многоотводного фильтра в знаменателе передаточной функции гармонического постфильтра. Тем не менее, обнаружено, что коэффициенты фильтрации не обязательно должны указывать точно проиллюстрированные значения на фиг. 6, но определенные варьирования+/-0,05 также могут быть полезными в других реализациях.
В частности, как проиллюстрировано на фиг. 1, весовые коэффициенты отводов, проиллюстрированные на фиг. 6, сохраняются в запоминающем устройстве 112 для получения информации многоотводного фильтра. Контроллер 114 фильтра принимает дробную часть Tfr из линии 116 по фиг. 1 и, в ответ на это значение, обращается к запоминающему устройству 112 для того, чтобы извлекать через линию 200 извлечения конкретную информацию фильтра для конкретной дробной части запаздывания основного тона. Эта информация затем перенаправляется через линию 202 вывода в гармонический постфильтр 104, так что гармонический постфильтр корректно задается. Определенная реализация многоотводного FIR-фильтра проиллюстрирована на фиг. 5. Указание w1-w4 весовых коэффициентов соответствует обозначению на фиг. 6, и контроллер 114 фильтра применяет, в ответ на фактическую дробную часть запаздывания основного тона, соответствующие весовые коэффициенты для определенного аудиокадра. Другие части, к примеру, части 501, 502, 503 задержки и модуль 505 комбинирования, могут реализовываться так, как проиллюстрировано. В этом контексте, следует подчеркнуть, что значение 501 задержки в обозначении z является отрицательным значением задержки, поскольку выяснено, что представление FIR-фильтра, имеющее отрицательное значение задержки в дополнение к положительному значению задержки, к примеру, 503 и 504, в частности, является полезным.
Затем, предпочтительная реализация кодера, имеющая определенные функциональные блоки и работающая без предварительного фильтра, проиллюстрирована на фиг. 4. Часть фильтра, проиллюстрированная на фиг. 4, содержит модуль 402 оценки основного тона, модуль 404 уточнения основного тона, модуль 406 оценки дробной части, детектор 408 переходных частей, модуль 410 оценки усиления и квантователь 412 усиления. Информация, предоставляемая посредством квантователя 412 усиления, модуля 406 оценки дробной части, модуля 404 уточнения основного тона, и решающий бит, сформированный посредством детектора 408 переходных частей, вводятся в формирователь 414 кодированных сигналов. Формирователь кодированных сигналов предоставляет кодированный сигнал 102, который затем вводится в декодер 100, проиллюстрированный на фиг. 1. Кодированный сигнал 102 должен содержать дополнительную сигнальную информацию, не проиллюстрированную на фиг. 4.
Далее описывается функциональность модуля 402 оценки основного тона.
Одно запаздывание основного тона (целочисленная часть + дробная часть) в расчете на кадр оценивается (размер кадра, например, 20 мс). Это выполняется на 3 этапах, чтобы уменьшать сложность и повышать точность оценки.
Алгоритм анализа основного тона, который формирует гладкий контур изменения основного тона, используется (например, анализ основного тона с разомкнутым контуром, описанный в Rec. ITU-T G.718, раздел 6.6). Этот анализ, в общем, выполняется на основе субкадров (размер субкадра, например, 10 мс) и формирует одну оценку запаздывания основного тона в расчете на субкадр. Следует отметить, что эти оценки запаздывания основного тона не имеют дробной части и, в общем, оцениваются для сигнала после понижающей дискретизации (с частотой дискретизации, например, 6400 Гц). Используемый сигнал может представлять собой любой аудиосигнал, например, взвешенный LPC-аудиосигнал, как описано в Rec. ITU-T G.718, раздел 6.5.
Модуль уточнения основного тона работает следующим образом:
Конечная целочисленная часть запаздывания основного тона оценивается для аудиосигнала x[n], работающего на частоте дискретизации базового кодера, которая, в общем, выше частоты дискретизации сигнала после понижающей дискретизации, используемого в a. (например, 12,8 кГц, 16 кГц, 32 кГц,...,). Сигнал x[n] может представлять собой любой аудиосигнал, например, взвешенный LPC-аудиосигнал.
Целочисленная часть Tint запаздывания основного тона в таком случае является запаздыванием
Figure 00000009
, которое максимизирует автокорреляционную функцию:
Figure 00000010
,
при этом d около запаздывания
Figure 00000011
основного тона оценивается на этапе 1.a.
Figure 00000012
Модуль 406 оценки дробной части работает следующим образом:
Дробная часть находится посредством интерполяции автокорреляционной функции
Figure 00000013
, вычисленной на этапе 2.b, и выбора дробного запаздывания основного тона, которое максимизирует интерполированную автокорреляционную функцию. Интерполяция может выполняться с использованием FIR-фильтра нижних частот, как описано в, например, Rec. ITU-T G.718, раздел 6.6.7.
Детектор 408 переходных частей, проиллюстрированный на фиг. 4, сконфигурирован с возможностью формирования решающего бита.
Если входной аудиосигнал не имеет содержания гармоник, то параметры не кодируются в потоке битов. Только 1 бит отправляется таким образом, что декодер знает то, должен он декодировать параметры постфильтрации или нет. Решение принимается на основе нескольких параметров:
a. Нормализованная корреляция при целочисленном запаздывании основного тона, оцененном на этапе 1.b:
Figure 00000014
Нормализованная корреляция равна 1, если входной сигнал является идеально прогнозируемым посредством целочисленного запаздывания основного тона, и равна 0, если он вообще не является прогнозируемым. Высокое значение (близко к 1) в таком случае указывает гармонический сигнал. Для более надежного решения, нормализованная корреляция предыдущего кадра также может использоваться в решении, например:
Если (norm.corr(curr.)*norm.corr.(prev.))>0,25, то текущий кадр имеет некоторое содержание гармоник (бит=1)
b. Признаки, вычисленные посредством детектора переходных частей (например, показатель временной равномерности, максимальное изменение энергии), чтобы исключать активацию постфильтра для сигнала, содержащего переходную часть, например:
Если (tempFlatness>3,5 или maxEnergychange>3,5), то задание бита=0 и отказ от отправки параметров
Кроме того, модуль 410 оценки усиления вычисляет усиление, которое должно вводиться в квантователь 412 усиления.
Усиление, в общем, оценивается для входного аудиосигнала на частоте дискретизации базового кодера, но он также может представлять собой любой аудиосигнал, к примеру, взвешенный LPC-аудиосигнал. Этот сигнал помечен y[n] и может быть идентичным или отличающимся от x[n].
Прогнозирование yP[n] y[n] сначала находится посредством фильтрации y[n] со следующим фильтром:
Figure 00000015
,
где
Figure 00000003
является целочисленной частью запаздывания основного тона (оцененной на 1.b)), и
Figure 00000008
является FIR-фильтром нижних частот, коэффициенты которого зависят от дробной части запаздывания
Figure 00000004
основного тона (оцененной на 1.c)).
Один пример B(z), когда разрешение запаздывания основного тона составляет 1/4:
Figure 00000016
Figure 00000017
Figure 00000018
Figure 00000019
Усиление g затем вычисляется следующим образом:
Figure 00000020
,
и ограничено между 0 и 1.
В завершение, усиление квантуется, например, для 2 битов, с использованием, например, равномерного квантования.
Если усиление квантуется до 0, то параметры не кодируются в потоке битов, а только один решающий бит (бит=0).
Как указано выше, постфильтр применяется к выходному аудиосигналу после декодера с преобразованием. Он обрабатывает сигнал на покадровой основе с размером кадра, идентичным размеру кадра, используемого на стороне кодера, к примеру, 20 мс. Как проиллюстрировано, он основан на долговременном прогнозном фильтре H(z), параметры которого определяются из параметров, оцененных на стороне кодера и декодированных из потока битов. Эта информация содержит решающий бит, запаздывание и усиление основного тона. Если решающий бит равен 0, то запаздывание и усиление основного тона не декодируются и предположительно равны 0, вообще не записываются в поток битов.
Как пояснено, если параметры фильтрации отличаются между кадрами, неоднородность может вводиться на границе между двумя кадрами. Чтобы исключать неоднородность, применяется модуль удаления неоднородности, к примеру, регулятор плавного перехода или любая другая реализация для этой цели.
Кроме того, несколько различных способов задавать гармонический постфильтр проиллюстрированы на фиг. 7a-8b. Графики иллюстрируют передаточную функцию в частотной области. Горизонтальная ось связана с нормализованной частотой 1, и вертикальная ось является абсолютной величиной характеристики фильтра в дБ. Следует подчеркнуть, что на всех иллюстрациях, кроме фиг. 7b, фильтр вводит усиление для низких частот, т.е. определенное положительное значение абсолютной величины в дБ.
В частности, фиг. 7a иллюстрирует передаточную функцию, реализующую фильтр на фиг. 3, с определенными значениями параметров, как указано выше. Кроме того, значение α, т.е. первое скалярное значение задается равным 0. Фиг. 7b иллюстрирует аналогичную ситуацию, но теперь со значением α, равным 1. Другие параметры являются идентичными фиг. 7a.
Фиг. 7c иллюстрирует дополнительную реализацию, где α равен 0,8, который имеет небольшой наклон и повышение нижних частот. С другой стороны, фиг. 7 имеет идентичные другие параметры, как указано на фиг. 7a. Становится очевидным, что α, равный 1, удаляет наклон, и все частоты гармоник имеют усиление 1. Недостаток этой настройки заключается в потерях энергии на частотах между гармониками. Следовательно, предпочитается значение α, равное 0,8, как показано на фиг. 7c. Это значение добавляет небольшой наклон по сравнению с ситуацией α, равного 1, на фиг. 7b. Чтобы компенсировать потери энергий на частотах между гармониками, этот небольшой наклон предпочтительно используется.
Кроме того, фиг. 8a и 8b иллюстрируют настройки фильтра для значения α, равного 0,8, и различных значений β, т.е. значения β в 0,4 на фиг. 8a и значения β в 0,2 на фиг. 8b. Становится очевидным, что значение β 0,4 имеет более сильный эффект постфильтрации по сравнению со значением β 0,2, и в силу этого значение β 0,4 используется на более низких скоростях передачи битов, чтобы удалять межгармонический шум, введенный посредством такой низкой скорости передачи битов.
С другой стороны, β, равное 0,2, имеет менее сильный эффект для подавления энергии между гармониками, и в силу этого данное значение β предпочитается для высоких скоростей передачи битов вследствие того факта, что на таких более высоких скоростях передачи битов, существует не такой большой межгармонический шум.
Хотя некоторые аспекты описаны в контексте устройства, очевидно, что эти аспекты также представляют описание соответствующего способа, при этом блок или устройство соответствует этапу способа либо признаку этапа способа. Аналогично, аспекты, описанные в контексте этапа способа, также представляют описание соответствующего блока или элемента, или признака соответствующего устройства. Некоторые или все этапы способа могут быть выполнены посредством (или с использованием) устройства, такого как, например, микропроцессор, программируемый компьютер либо электронная схема. В некоторых вариантах осуществления, некоторые из одного или более самых важных этапов способа могут выполняться посредством этого устройства.
Изобретаемый передаваемый кодированный сигнал может быть сохранен на цифровом носителе хранения данных или может быть передан по среде передачи, такой как беспроводная среда передачи или проводная среда передачи, к примеру, Интернет.
В зависимости от определенных требований к реализации, варианты осуществления изобретения могут быть реализованы в аппаратных средствах или в программном обеспечении. Реализация может выполняться с использованием цифрового носителя хранения данных, например, гибкого диска, DVD, Blu-Ray, CD, ROM, PROM и EPROM, EEPROM или флэш-памяти, имеющего сохраненные электронночитаемые управляющие сигналы, которые взаимодействуют (или допускают взаимодействие) с программируемой компьютерной системой, так что осуществляется соответствующий способ. Следовательно, цифровой носитель хранения данных может быть машиночитаемым.
Некоторые варианты осуществления согласно изобретению содержат носитель данных, имеющий электронночитаемые управляющие сигналы, которые допускают взаимодействие с программируемой компьютерной системой таким образом, что осуществляется один из способов, описанных в данном документе.
В общем, варианты осуществления настоящего изобретения могут быть реализованы как компьютерный программный продукт с программным кодом, при этом программный код сконфигурирован с возможностью осуществления одного из способов, когда компьютерный программный продукт работает на компьютере. Программный код, например, может быть сохранен на машиночитаемом носителе.
Другие варианты осуществления содержат компьютерную программу для осуществления одного из способов, описанных в данном документе, сохраненную на машиночитаемом носителе.
Другими словами, следовательно, вариант осуществления изобретаемого способа представляет собой компьютерную программу, имеющую программный код для осуществления одного из способов, описанных в данном документе, когда компьютерная программа работает на компьютере.
Следовательно, дополнительный вариант осуществления изобретаемого способа представляет собой носитель хранения данных (или энергонезависимый носитель хранения данных, такой как цифровой носитель хранения данных или машиночитаемый носитель), содержащий записанную компьютерную программу для осуществления одного из способов, описанных в данном документе. Носитель данных, цифровой носитель хранения данных или носитель с записанными данными типично является материальным и/или энергонезависимым.
Следовательно, дополнительный вариант осуществления изобретаемого способа представляет собой поток данных или последовательность сигналов, представляющих компьютерную программу для осуществления одного из способов, описанных в данном документе. Поток данных или последовательность сигналов, например, может быть сконфигурирована с возможностью передачи через соединение для передачи данных, например, через Интернет.
Дополнительный вариант осуществления содержит средство обработки, например, компьютер или программируемое логическое устройство, сконфигурированное с возможностью осуществлять один из способов, описанных в данном документе.
Дополнительный вариант осуществления содержит компьютер, имеющий установленную компьютерную программу для осуществления одного из способов, описанных в данном документе.
Дополнительный вариант осуществления согласно изобретению содержит устройство или систему, сконфигурированную с возможностью передавать (например, электронно или оптически) компьютерную программу для осуществления одного из способов, описанных в данном документе, в приемное устройство. Приемное устройство, например, может представлять собой компьютер, мобильное устройство, запоминающее устройство и т.п. Устройство или система, например, может содержать файловый сервер для передачи компьютерной программы в приемное устройство.
В некоторых вариантах осуществления, программируемое логическое устройство (например, программируемая пользователем вентильная матрица) может быть использовано для того, чтобы выполнять часть или все из функциональностей способов, описанных в данном документе. В некоторых вариантах осуществления, программируемая пользователем вентильная матрица может взаимодействовать с микропроцессором, чтобы осуществлять один из способов, описанных в данном документе. В общем, способы предпочтительно осуществляются посредством любого устройства.
Вышеописанные варианты осуществления являются просто иллюстративными в отношении принципов настоящего изобретения. Следует понимать, что модификации и изменения компоновок и подробностей, описанных в данном документе, должны быть очевидными для специалистов в данной области техники. Следовательно, они подразумеваются как ограниченные только посредством объема нижеприведенной формулы изобретения, а не посредством конкретных подробностей, представленных посредством описания и пояснения вариантов осуществления в данном документе.

Claims (39)

1. Устройство для обработки аудиосигнала, имеющего ассоциированную информацию запаздывания основного тона и информацию усиления, содержащее:
- преобразователь (100) области для преобразования представления аудиосигнала в первой области в представление аудиосигнала во второй области; и
- гармонический постфильтр (104) для фильтрации представления аудиосигнала во второй области, при этом постфильтр основан на передаточной функции, содержащей числитель и знаменатель, при этом числитель содержит значение усиления, указываемое посредством информации усиления, и при этом знаменатель содержит целочисленную часть запаздывания основного тона, указываемую посредством информации запаздывания основного тона, и многоотводный фильтр, зависящий от дробной части запаздывания основного тона.
2. Устройство по п. 1, в котором передаточная функция постфильтра содержит, в числителе, дополнительный многоотводный FIR-фильтр для нулевой дробной части запаздывания основного тона.
3. Устройство по п. 1, в котором знаменатель содержит произведение между многоотводным фильтром и значением усиления.
4. Устройство по п. 1, в котором числитель, кроме того, содержит произведение первого скалярного значения и второго скалярного значения, при этом знаменатель содержит второе скалярное значение, а не первое скалярное значение, при этом первое и второе скалярные значения предварительно определены и имеют значения, большие 0 и меньшие, и при этом второе скалярное значение ниже первого скалярного значения.
5. Устройство по п. 4, дополнительно содержащее:
- контроллер (114) фильтра, сконфигурированный с возможностью задания второго скалярного значения в зависимости от скорости передачи битов, на которой работает частотно-временной преобразователь (100), при этом второе скалярное значение задается равным первому значению, когда скорость передачи битов имеет первое значение, при этом второе скалярное значение задается равным второму значению, когда скорость передачи битов имеет второе значение, при этом второе значение скорости передачи битов ниже первого значения скорости передачи битов, и при этом второе значение второго скалярного значения превышает первое значение второго скалярного значения.
6. Устройство по п. 4, в котором первое скалярное значение задается между 0,6 и 1,0, и при этом второе скалярное значение задается между 0,1 и 0,5.
7. Устройство по п. 1,
- в котором постфильтр имеет передаточную функцию H(z) в представлении нулей и полюсов на основе следующего уравнения:
Figure 00000021
- при этом α является первым скалярным значением, при этом β является вторым скалярным значением, при этом B(z, 0) является многоотводным фильтром для нулевой дробной части запаздывания основного тона, при этом B(z, Tfr) является многоотводным фильтром, зависящим от дробной части запаздывания основного тона, при этом Tint является целочисленной частью запаздывания основного тона, при этом Tfr является дробной частью запаздывания основного тона, и при этом g является значением усиления, указываемым посредством информации усиления, z является переменной в плоскости Z.
8. Устройство по п. 1, в котором многоотводный фильтр представляет собой фильтр с конечной импульсной характеристикой (FIR) и имеет, по меньшей мере, три отвода.
9. Устройство по п. 1,
- в котором многоотводный фильтр в знаменателе содержит четыре отвода, при этом, для нулевой дробной части, первый отвод задается между 0,0 и 0,1, второй отвод задается между 0,2 и 0,3, третий отвод задается между 0,5 и 0,6, и четвертый отвод задается между 0,2 и 0,3,
- при этом многоотводный фильтр содержит, для первой дробной части, четыре отвода фильтра, при этом первый отвод задается между 0,0 и 0,1, второй отвод задается между 0,3 и 0,4, третий отвод задается между 0,45 и 0,55, и четвертый отвод задается между 0,1 и 0,2,
- при этом многоотводный фильтр содержит, для второй дробной части, четыре отвода фильтра, при этом первый отвод задается между 0,0 и 0,1, второй отвод задается между 0,35 и 0,45, третий отвод задается между 0,35 и 0,45, и четвертый отвод задается между 0,0 и 0,1,
- при этом многоотводный фильтр содержит, для третьей дробной части, четыре отвода фильтра, при этом первый отвод задается между 0,1 и 0,2, второй отвод задается между 0,45 и 0,55, третий отвод задается между 0,3 и 0,4, и четвертый отвод задается между 0,0 и 0,1,
- при этом третья дробная часть превышает вторую дробную часть, и при этом вторая дробная часть превышает первую дробную часть.
10. Устройство по п. 1,
- в котором постфильтр сконфигурирован с возможностью иметь отрицательный спектральный наклон для компенсации потерь в энергии посредством гармонического постфильтра, или
- при этом постфильтр сконфигурирован с возможностью подавлять величину энергии между гармониками в кадре, при этом подавляемая величина энергии меньше 20% полной энергии представления во временной области в кадре.
11. Устройство по п. 1,
- в котором преобразователь области представляет собой частотно-временной преобразователь, при этом первая область представляет собой частотную область, и вторая область представляет собой временную область, или
- при этом преобразователь области представляет собой преобразователь "LPC-остатки/время", при этом первая область представляет собой область LPC-остатков, и вторая область представляет собой временную область.
12. Способ обработки аудиосигнала, имеющего ассоциированную информацию запаздывания основного тона и информацию усиления, содержащий этапы, на которых:
- преобразуют (100) частотное представление аудиосигнала в представление аудиосигнала во временной области; и
- фильтруют представление аудиосигнала во временной области посредством гармонического постфильтра (104), при этом постфильтр основан на передаточной функции, содержащей числитель и знаменатель, при этом числитель содержит значение усиления, указываемое посредством информации усиления, и при этом знаменатель содержит целочисленную часть запаздывания основного тона, указываемую посредством информации запаздывания основного тона, и многоотводный фильтр, зависящий от дробной части запаздывания основного тона.
13. Система для обработки аудиосигнала, содержащая кодер для кодирования аудиосигнала и декодер, содержащий процессор, причем процессор содержит:
- преобразователь (100) области для преобразования частотного представления аудиосигнала в представление аудиосигнала во временной области; и
- гармонический постфильтр (104) для фильтрации представления аудиосигнала во временной области,
- при этом постфильтр основан на передаточной функции, содержащей числитель и знаменатель, при этом числитель содержит значение усиления, указываемое посредством информации усиления, и при этом знаменатель содержит целочисленную часть запаздывания основного тона, указываемую посредством информации запаздывания основного тона, и многоотводный фильтр, зависящий от дробной части запаздывания основного тона.
14. Система по п. 13, в которой кодер содержит модуль (402, 404, 406) вычисления запаздывания основного тона для вычисления целочисленной части и дробной части запаздывания основного тона и модуль (410, 412) вычисления усиления основного тона для вычисления значения усиления, и формирователь (414) кодированных сигналов для формирования кодированного сигнала (102), содержащего информацию запаздывания основного тона и информацию усиления.
15. Способ обработки аудиосигнала, содержащий способ кодирования аудиосигнала и способ декодирования, содержащий этапы, на которых:
- преобразуют (100) частотное представление аудиосигнала в представление аудиосигнала во временной области; и
- фильтруют представление аудиосигнала во временной области с использованием гармонического постфильтра (104), при этом постфильтр основан на передаточной функции, содержащей числитель и знаменатель, при этом числитель содержит значение усиления, указываемое посредством информации усиления, и при этом знаменатель содержит целочисленную часть запаздывания основного тона, указываемую посредством информации запаздывания основного тона, и многоотводный фильтр, зависящий от дробной части запаздывания основного тона.
16. Машиночитаемый носитель, имеющий сохраненную на нем компьютерную программу для осуществления способа по п. 12, когда компьютерная программа выполняется на компьютере или процессоре.
17. Машиночитаемый носитель, имеющий сохраненную на нем компьютерную программу для осуществления способа по п. 15, когда компьютерная программа выполняется на компьютере или процессоре.
RU2017106109A 2014-07-28 2015-07-24 Устройство и способ для обработки звукового сигнала с использованием гармонического постфильтра RU2665259C1 (ru)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP14178820.8A EP2980799A1 (en) 2014-07-28 2014-07-28 Apparatus and method for processing an audio signal using a harmonic post-filter
EP14178820.8 2014-07-28
PCT/EP2015/066998 WO2016016121A1 (en) 2014-07-28 2015-07-24 Apparatus and method for processing an audio signal using a harmonic post-filter

Publications (1)

Publication Number Publication Date
RU2665259C1 true RU2665259C1 (ru) 2018-08-28

Family

ID=51224878

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2017106109A RU2665259C1 (ru) 2014-07-28 2015-07-24 Устройство и способ для обработки звукового сигнала с использованием гармонического постфильтра

Country Status (17)

Country Link
US (4) US10242688B2 (ru)
EP (2) EP2980799A1 (ru)
JP (4) JP6546264B2 (ru)
KR (1) KR101959211B1 (ru)
CN (2) CN106663444B (ru)
AR (1) AR101340A1 (ru)
AU (1) AU2015295603B2 (ru)
CA (1) CA2955255C (ru)
ES (1) ES2676584T3 (ru)
MX (1) MX360555B (ru)
MY (1) MY179023A (ru)
PL (1) PL3175454T3 (ru)
PT (1) PT3175454T (ru)
RU (1) RU2665259C1 (ru)
SG (1) SG11201700696UA (ru)
TW (1) TWI590238B (ru)
WO (1) WO2016016121A1 (ru)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2980799A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for processing an audio signal using a harmonic post-filter
EP3000110B1 (en) * 2014-07-28 2016-12-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Selection of one of a first encoding algorithm and a second encoding algorithm using harmonics reduction
EP3483882A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Controlling bandwidth in encoders and/or decoders
WO2019091576A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits
EP3483884A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Signal filtering
EP3483878A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder supporting a set of different loss concealment tools
EP3483880A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Temporal noise shaping
EP3483883A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio coding and decoding with selective postfiltering
WO2019091573A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters
EP3483886A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Selecting pitch lag
EP3483879A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Analysis/synthesis windowing function for modulated lapped transformation
WO2019216037A1 (ja) * 2018-05-10 2019-11-14 日本電信電話株式会社 ピッチ強調装置、その方法、プログラム、および記録媒体
BR112021013720A2 (pt) 2019-01-13 2021-09-21 Huawei Technologies Co., Ltd. Método implementado por computador para codificação de áudio, dispositivo eletrônico e meio legível por computador não transitório
CN112467744B (zh) * 2020-12-11 2022-06-17 东北电力大学 面向配网频率偏移的apf抗频扰谐波指令电流预测方法
EP4120256A1 (en) * 2021-07-14 2023-01-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Processor for generating a prediction spectrum based on long-term prediction and/or harmonic post-filtering

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0698877A2 (en) * 1994-08-22 1996-02-28 Nec Corporation Postfilter and method of postfiltering
RU2121173C1 (ru) * 1994-04-29 1998-10-27 Аудиокоудс, Лтд. Способ постфильтрации основного тона синтезированной речи и постфильтр основного тона
US6058360A (en) * 1996-10-30 2000-05-02 Telefonaktiebolaget Lm Ericsson Postfiltering audio signals especially speech signals
US7707034B2 (en) * 2005-05-31 2010-04-27 Microsoft Corporation Audio codec post-filter
US20120101824A1 (en) * 2010-10-20 2012-04-26 Broadcom Corporation Pitch-based pre-filtering and post-filtering for compression of audio signals
EP2757560A1 (en) * 2010-07-02 2014-07-23 Dolby International AB Selective post filter

Family Cites Families (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5359696A (en) * 1988-06-28 1994-10-25 Motorola Inc. Digital speech coder having improved sub-sample resolution long-term predictor
US5012517A (en) 1989-04-18 1991-04-30 Pacific Communication Science, Inc. Adaptive transform coder having long term predictor
WO1990013112A1 (en) * 1989-04-25 1990-11-01 Kabushiki Kaisha Toshiba Voice encoder
US5293449A (en) * 1990-11-23 1994-03-08 Comsat Corporation Analysis-by-synthesis 2,4 kbps linear predictive speech codec
TW224191B (ru) * 1992-01-28 1994-05-21 Qualcomm Inc
US5568688A (en) 1995-06-07 1996-10-29 Andrews; Edward A. Hair shaving device with curved razor blade strip
JP3328080B2 (ja) * 1994-11-22 2002-09-24 沖電気工業株式会社 コード励振線形予測復号器
JP2993396B2 (ja) * 1995-05-12 1999-12-20 三菱電機株式会社 音声加工フィルタ及び音声合成装置
JP3653826B2 (ja) * 1995-10-26 2005-06-02 ソニー株式会社 音声復号化方法及び装置
EP0807803B1 (en) * 1996-05-16 2005-02-23 Matsushita Electric Industrial Co., Ltd. Road map information readout apparatus, recording medium and transmitting method
JP4121578B2 (ja) * 1996-10-18 2008-07-23 ソニー株式会社 音声分析方法、音声符号化方法および装置
JPH10214100A (ja) 1997-01-31 1998-08-11 Sony Corp 音声合成方法
WO1999038156A1 (fr) * 1998-01-26 1999-07-29 Matsushita Electric Industrial Co., Ltd. Methode et dispositif d'accentuation de registre
JP4343302B2 (ja) * 1998-01-26 2009-10-14 パナソニック株式会社 ピッチ強調方法及びその装置
US7072832B1 (en) * 1998-08-24 2006-07-04 Mindspeed Technologies, Inc. System for speech encoding having an adaptive encoding arrangement
AU2003214182A1 (en) * 2002-03-12 2003-09-29 Dilithium Networks Pty Limited Method for adaptive codebook pitch-lag computation in audio transcoders
CA2388352A1 (en) 2002-05-31 2003-11-30 Voiceage Corporation A method and device for frequency-selective pitch enhancement of synthesized speed
JP2004302257A (ja) * 2003-03-31 2004-10-28 Matsushita Electric Ind Co Ltd 長期ポストフィルタ
JP4786183B2 (ja) 2003-05-01 2011-10-05 富士通株式会社 音声復号化装置、音声復号化方法、プログラム、記録媒体
US8620645B2 (en) * 2007-03-02 2013-12-31 Telefonaktiebolaget L M Ericsson (Publ) Non-causal postfilter
EP2320683B1 (en) * 2007-04-25 2017-09-06 Harman Becker Automotive Systems GmbH Sound tuning method and apparatus
ATE500588T1 (de) * 2008-01-04 2011-03-15 Dolby Sweden Ab Audiokodierer und -dekodierer
US20090319263A1 (en) * 2008-06-20 2009-12-24 Qualcomm Incorporated Coding of transitional speech frames for low-bit-rate applications
ES2396173T3 (es) * 2008-07-18 2013-02-19 Dolby Laboratories Licensing Corporation Método y sistema para post-filtrado en el dominio frecuencia de datos de audio codificados en un decodificador
US9082416B2 (en) * 2010-09-16 2015-07-14 Qualcomm Incorporated Estimating a pitch lag
PL2676268T3 (pl) 2011-02-14 2015-05-29 Fraunhofer Ges Forschung Urządzenie i sposób przetwarzania zdekodowanego sygnału audio w domenie widmowej
JP5663461B2 (ja) 2011-12-06 2015-02-04 日本電信電話株式会社 符号化方法、符号化装置、プログラム、記録媒体
US9418671B2 (en) * 2013-08-15 2016-08-16 Huawei Technologies Co., Ltd. Adaptive high-pass post-filter
EP2980799A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for processing an audio signal using a harmonic post-filter
EP2980798A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Harmonicity-dependent controlling of a harmonic filter tool

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2121173C1 (ru) * 1994-04-29 1998-10-27 Аудиокоудс, Лтд. Способ постфильтрации основного тона синтезированной речи и постфильтр основного тона
EP0698877A2 (en) * 1994-08-22 1996-02-28 Nec Corporation Postfilter and method of postfiltering
US6058360A (en) * 1996-10-30 2000-05-02 Telefonaktiebolaget Lm Ericsson Postfiltering audio signals especially speech signals
US7707034B2 (en) * 2005-05-31 2010-04-27 Microsoft Corporation Audio codec post-filter
EP2757560A1 (en) * 2010-07-02 2014-07-23 Dolby International AB Selective post filter
US20120101824A1 (en) * 2010-10-20 2012-04-26 Broadcom Corporation Pitch-based pre-filtering and post-filtering for compression of audio signals

Also Published As

Publication number Publication date
JP2023072014A (ja) 2023-05-23
ES2676584T3 (es) 2018-07-23
CN106663444A (zh) 2017-05-10
MX2017001242A (es) 2017-07-07
JP6877488B2 (ja) 2021-05-26
JP2019194716A (ja) 2019-11-07
CN112420061A (zh) 2021-02-26
MY179023A (en) 2020-10-26
EP2980799A1 (en) 2016-02-03
PT3175454T (pt) 2018-10-08
KR20170035987A (ko) 2017-03-31
EP3175454B1 (en) 2018-06-20
TW201618086A (zh) 2016-05-16
US10242688B2 (en) 2019-03-26
JP2021064009A (ja) 2021-04-22
JP6546264B2 (ja) 2019-07-17
MX360555B (es) 2018-11-07
EP3175454A1 (en) 2017-06-07
US20190198034A1 (en) 2019-06-27
BR112017001631A2 (pt) 2017-11-21
WO2016016121A1 (en) 2016-02-04
AR101340A1 (es) 2016-12-14
US20230282223A1 (en) 2023-09-07
US11694704B2 (en) 2023-07-04
CA2955255C (en) 2019-04-30
TWI590238B (zh) 2017-07-01
US11037580B2 (en) 2021-06-15
SG11201700696UA (en) 2017-02-27
US20170140769A1 (en) 2017-05-18
KR101959211B1 (ko) 2019-03-18
JP7340553B2 (ja) 2023-09-07
AU2015295603B2 (en) 2018-02-08
PL3175454T3 (pl) 2018-11-30
US20210125624A1 (en) 2021-04-29
AU2015295603A1 (en) 2017-03-16
CA2955255A1 (en) 2016-02-04
CN106663444B (zh) 2020-12-01
JP2017522604A (ja) 2017-08-10

Similar Documents

Publication Publication Date Title
RU2665259C1 (ru) Устройство и способ для обработки звукового сигнала с использованием гармонического постфильтра
JP6629834B2 (ja) ハーモニックフィルタツールのハーモニック依存制御
US20160379646A1 (en) Audio decoder and method for providing a decoded audio information using an error concealment modifying a time domain excitation signal
KR101997006B1 (ko) 오디오 인코더, 오디오 디코더 및 오디오 신호를 처리하기 위한 방법 및 장치
US20160247506A1 (en) Audio decoder and method for providing a decoded audio information using an error concealment based on a time domain excitation signal
CN107533847B (zh) 音频编码器和音频解码器及对应的方法
JP2015522847A (ja) デジタル音声信号における効果的なプレエコー減衰
JP7179060B2 (ja) 信号フィルタリング
KR102426050B1 (ko) 피치 지연 선택
JP2016513270A (ja) 符号化信号を処理する装置および方法、並びに符号化信号を生成するエンコーダおよび方法
BR112017001631B1 (pt) Aparelho e método para processamento de um sinal de áudio utilizando um pós-filtro harmônico
WO2004097795A2 (en) Adaptive voice enhancement for low bit rate audio coding