RU2665259C1 - Устройство и способ для обработки звукового сигнала с использованием гармонического постфильтра - Google Patents
Устройство и способ для обработки звукового сигнала с использованием гармонического постфильтра Download PDFInfo
- Publication number
- RU2665259C1 RU2665259C1 RU2017106109A RU2017106109A RU2665259C1 RU 2665259 C1 RU2665259 C1 RU 2665259C1 RU 2017106109 A RU2017106109 A RU 2017106109A RU 2017106109 A RU2017106109 A RU 2017106109A RU 2665259 C1 RU2665259 C1 RU 2665259C1
- Authority
- RU
- Russia
- Prior art keywords
- filter
- tap
- audio signal
- value
- gain
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 33
- 238000012545 processing Methods 0.000 title claims abstract description 16
- 230000005236 sound signal Effects 0.000 claims abstract description 48
- 238000012546 transfer Methods 0.000 claims abstract description 20
- 238000001914 filtration Methods 0.000 claims abstract description 19
- 238000004590 computer program Methods 0.000 claims description 15
- 230000004044 response Effects 0.000 claims description 10
- 230000003595 spectral effect Effects 0.000 claims description 2
- 238000004364 calculation method Methods 0.000 claims 1
- 238000003672 processing method Methods 0.000 claims 1
- 230000000694 effects Effects 0.000 abstract description 5
- 239000000126 substance Substances 0.000 abstract 1
- 230000006870 function Effects 0.000 description 14
- 230000008859 change Effects 0.000 description 12
- 238000006243 chemical reaction Methods 0.000 description 11
- 238000011045 prefiltration Methods 0.000 description 5
- 238000005070 sampling Methods 0.000 description 5
- 230000007704 transition Effects 0.000 description 5
- 230000007774 longterm Effects 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 238000005311 autocorrelation function Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 2
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01L—MEASURING FORCE, STRESS, TORQUE, WORK, MECHANICAL POWER, MECHANICAL EFFICIENCY, OR FLUID PRESSURE
- G01L21/00—Vacuum gauges
- G01L21/02—Vacuum gauges having a compression chamber in which gas, whose pressure is to be measured, is compressed
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
- G10L19/025—Detection of transients or attacks for time/frequency resolution switching
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- General Physics & Mathematics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
- Control Of Amplification And Gain Control (AREA)
- Stereophonic System (AREA)
Abstract
Изобретение относится к устройству, системе, способам и машиночитаемым носителям для обработки аудиосигнала. Технический результат заключается в обеспечении фильтрации аудиосигнала. Устройство содержит преобразователь области для преобразования представления аудиосигнала в первой области в представление аудиосигнала во второй области и гармонический постфильтр для фильтрации представления аудиосигнала во второй области, при этом постфильтр основан на передаточной функции, содержащей числитель и знаменатель, при этом числитель содержит значение усиления, указываемое посредством информации усиления, и при этом знаменатель содержит целочисленную часть запаздывания основного тона, указываемую посредством информации запаздывания основного тона, и многоотводный фильтр, зависящий от дробной части запаздывания основного тона. 6 н. и 11 з.п. ф-лы, 11 ил.
Description
Подробное описание изобретения
Настоящее изобретение относится к аудиообработке, и в частности, к аудиообработке с использованием гармонического постфильтра.
Аудиокодеки на основе преобразования, в общем, вводят межгармонический шум при обработке гармонических аудиосигналов, в частности, на низких скоростях передачи битов.
Этот эффект дополнительно ухудшается, когда аудиокодек на основе преобразования работает при низкой задержке вследствие худшего частотного разрешения и/или избирательности, введенной посредством меньшего размера преобразования, и/или худшей частотной характеристики функции окна.
Этот межгармонический шум, в общем, воспринимается в качестве очень раздражающего артефакта, значительно уменьшая производительность аудиокодека на основе преобразования при субъективной оценке на высокотональном аудиоматериале.
Существуют несколько решений для того, чтобы повышать субъективное качество аудиокодеков на основе преобразования для гармонических аудиосигналов. Все они основаны на технологиях на основе прогнозирования, в области преобразования или во временной области.
Примеры подходов области преобразования следующие:
[1] H. Fuchs, "Improving MPEG Audio Coding by Backward Adaptive Linear Stereo Prediction", 99th AES Convention, New York, 1995 год, Preprint 4086.
[2] L. Yin, M. Suonio, M. Väänänen, "A New Backward Predictor for MPEG Audio Coding", 103rd AES Convention, New York, 1997 год, Preprint 4521.
[3] Juha Ojanperä, Mauri Väänänen, Lin Yin, "Long Term Predictor for Transform Domain Perceptual Audio Coding", 107th AES Convention, New York, 1999 год, Preprint 5036.
Примеры подходов на основе временной области следующие:
[4] Philip J. Wilson, Harprit Chhatwal, "Adaptive transform coder having long term predictor", патент (США) 5012517, 30 апреля 1991 года.
[5] Jeongook Song, Chang-Heon Lee, Hyen-O Oh, Hong-Goo Kang, "Harmonic Enhancement in Low Bitrate Audio Coding Using and Efficient Long-Term Predictor", EURASIP Journal on Advances in Signal Processing, 2010 год.
[6] Juin-Hwey Chen, "Pitch-based pre-filtering and post-filtering for compression of audio signals", патент (США) 8738385, 27 мая 2014 года.
Цель настоящего изобретения заключается в том, чтобы предоставить усовершенствованный принцип для обработки аудиосигнала.
Это цель достигается посредством устройства для обработки аудиосигнала по п. 1, способа для обработки аудиосигнала по п. 12, системы по п. 13, способа для работы системы по п. 17 или компьютерной программы по п. 18.
Настоящее изобретение основано на таких выявленных сведениях, что субъективное качество аудиосигнала может существенно повышаться посредством использования гармонического постфильтра, имеющего передаточную функцию, содержащую числитель и знаменатель. Числитель передаточной функции содержит значение усиления, указываемое посредством передаваемой информации усиления, и знаменатель содержит целочисленную часть запаздывания основного тона, указываемую посредством информации запаздывания основного тона, и многоотводный фильтр, зависящий от дробной части запаздывания основного тона.
Следовательно, можно удалять межгармонический шум, введенный посредством обычного аудиодекодера с изменением области в качестве артефакта. Этот гармонический постфильтр, в частности, является полезным тем, что он основывается на передаваемой информации, т.е. усилении основного тона и запаздывании основного тона, которые доступны в любом случае в декодере, поскольку эта информация принимается из соответствующего кодера через входной сигнал декодера. Кроме того, постфильтрация имеет конкретную точность вследствие того, что учитывается не только целочисленная часть запаздывания основного тона, но и, помимо этого, учитывается дробная часть запаздывания основного тона. Дробная часть запаздывания основного тона может быть, в частности, введена в постфильтр через многоотводный фильтр, который имеет коэффициенты фильтрации, фактически зависящие от дробной части запаздывания основного тона. Этот фильтр может реализовываться как FIR-фильтр или также может реализовываться как любой другой фильтр, к примеру, как IIR-фильтр или другая реализация фильтра. Любое изменение области, такое как изменение "время-частота" или изменение "LPC-время", или изменение "время-LPC", или изменение "частота-время", может преимущественно улучшаться посредством принципа постфильтра изобретения. Тем не менее, предпочтительно, изменение области представляет собой изменение из частотной во временную область.
Следовательно, варианты осуществления настоящего изобретения уменьшают межгармонический шум, введенный посредством аудиокодека с преобразованием, на основе долговременного предиктора, работающего во временной области. В отличие от [04]-[6], в которых используются как предварительный фильтр до кодирования с преобразованием, так и постфильтр после декодирования с преобразованием, настоящее изобретение предпочтительно применяет только постфильтр.
Кроме того, следует отметить, что предварительный фильтр, используемый в [04]-[6], имеет тенденцию вводить нестабильности во входном сигнале, предоставленном в кодер с преобразованием. Эти нестабильности обусловлены изменениями усиления и/или запаздывания основного тона между кадрами. Кодер с преобразованием испытывает затруднения в кодировании таких нестабильностей, в частности, на низких скоростях передачи битов, и он иногда вводит еще больше шума в декодированном сигнале по сравнению с ситуацией без предварительного или постфильтра.
Предпочтительно, настоящее изобретение вообще не использует предварительный фильтр и за счет этого полностью исключает проблемы, обусловленные предварительным фильтром.
Кроме того, настоящее изобретение основывается на постфильтре, который применяется к декодированному сигналу после кодирования с преобразованием. Этот постфильтр основан на долговременном прогнозном фильтре с учетом целочисленной части и дробной части запаздывания основного тона, что уменьшает межгармонический шум, введенный посредством аудиокодека с преобразованием.
Для лучшей устойчивости, параметры постфильтрации "запаздывание основного тона" и "усиление основного тона" оцениваются на стороне кодера и передаются в потоке битов. Тем не менее, в других реализациях, запаздывание основного тона и усиление основного тона также могут оцениваться на стороне декодера на основе декодированного аудиосигнала, полученного посредством аудиодекодера, содержащего частотно-временной преобразователь для преобразования частотного представления аудиосигнала в представление аудиосигнала во временной области.
В предпочтительном варианте осуществления, числитель дополнительно содержит многоотводный фильтр для нулевой дробной части запаздывания основного тона, чтобы компенсировать спектральный наклон, введенный посредством многоотводного фильтра в знаменателе, который зависит от дробной части запаздывания основного тона.
Предпочтительно, постфильтр сконфигурирован с возможностью подавлять величину энергии между гармониками в кадре, при этом подавляемая величина энергии меньше 20% полной энергии представления во временной области в кадре.
В дополнительном варианте осуществления, знаменатель содержит произведение между многоотводным фильтром и значением усиления.
В дополнительном варианте осуществления, числитель фильтра дополнительно содержит произведение первого скалярного значения и второго скалярного значения, при этом знаменатель содержит только второе скалярное значение, а не первое скалярное значение. Эти скалярные значения задаются равными предварительно определенным значениям и имеют значения, большие 0 и меньшие 1; и, дополнительно, второе скалярное значение ниже первого скалярного значения. Следовательно, можно очень эффективным способом задавать характеристики удаления энергии, которые типично нежелательны, и дополнительно задавать интенсивность фильтрации, т.е. то, как сильный фильтр ослабляет межгармонические артефакты в выходном сигнале декодера в области преобразования.
Устройство дополнительно содержит, в предпочтительном варианте осуществления, контроллер фильтра для задания, по меньшей мере, второго скалярного значения в зависимости от скорости передачи битов таким образом, что большее значение задается для более низкой скорости передачи битов, и наоборот.
Кроме того, контроллер фильтра сконфигурирован с возможностью выбора, в зависимости от дробной части запаздывания основного тона, соответствующего многоотводного фильтра зависимым от сигнала способом, чтобы задавать гармонический постфильтр сигнально-адаптивно, т.е. в зависимости от фактически предоставленного значения дробной части запаздывания основного тона.
Далее поясняются предпочтительные варианты осуществления настоящего изобретения в контексте прилагаемых чертежей, на которых:
Фиг. 1 иллюстрирует вариант осуществления изобретаемого устройства для обработки аудиосигнала;
Фиг 2 иллюстрирует предпочтительную реализацию гармонического постфильтра, представленного в качестве передаточных функций в z-области;
Фиг. 3 иллюстрирует дополнительный предпочтительный вариант осуществления для гармонического постфильтра, представленного посредством передаточной функции в z-области;
Фиг. 4 иллюстрирует предпочтительную реализацию кодера для формирования кодированного сигнала, который должен декодироваться посредством аудиодекодера в области преобразования, проиллюстрированного на фиг. 1;
Фиг. 5 иллюстрирует предпочтительную реализацию многоотводного фильтра в качестве FIR-фильтра, управляемого посредством контроллера фильтра;
Фиг. 6 иллюстрирует взаимодействие между контроллером фильтра и запоминающим устройством, имеющим предварительно сохраненные весовые коэффициенты отводов, зависящие от дробной части;
Фиг. 7a иллюстрирует частотную характеристику фильтра, имеющего нулевое значение α.
Фиг. 7b иллюстрирует частотную характеристику предпочтительного гармонического постфильтра, имеющего значение α, равное 1;
Фиг. 7c иллюстрирует частотную характеристику предпочтительного гармонического постфильтра, имеющего значение α в 0,8;
Фиг. 8a иллюстрирует предпочтительный вариант осуществления гармонического постфильтра, имеющего значение β, равное 0,4; и
Фиг. 8b иллюстрирует частотную характеристику гармонического постфильтра, имеющего значение β в 0,2.
Фиг. 1 иллюстрирует устройство для обработки аудиосигнала, имеющего ассоциированную информацию запаздывания основного тона и информацию усиления. Эта информация усиления может передаваться в декодер 100 через ввод 102 декодера, принимающий кодированный сигнал, или, альтернативно, эта информация может вычисляться в самом декодере, когда эта информация не доступна. Тем не менее, для более надежной работы, предпочтительно вычислять информацию запаздывания основного тона и информацию усиления основного тона на стороне кодера.
Декодер 100 содержит, например, частотно-временной преобразователь для преобразования частотно-временного представления аудиосигнала в представление аудиосигнала во временной области. Таким образом, декодер не представляет собой речевой кодек только временной области, но содержит декодер только в области преобразования или декодер в смешанной области преобразования либо любой другой кодер, работающий в области, отличающейся от временной области. Кроме того, предпочтительно, если вторая область представляет собой временную область.
Кроме того, устройство содержит гармонический постфильтр 104 для фильтрации представления аудиосигнала во временной области, и этот гармонический постфильтр основан на передаточной функции, содержащей числитель и знаменатель. В частности, числитель содержит значение усиления, указываемое посредством информации усиления, и знаменатель содержит целочисленную часть запаздывания основного тона, указываемую посредством информации запаздывания основного тона, и, что важно, дополнительно содержит многоотводный фильтр, зависящий от дробной части запаздывания основного тона.
Предпочтительная реализация этого гармонического постфильтра с передаточной функцией H(z) проиллюстрирована на фиг. 2. Этот фильтр принимает выходной сигнал 106 декодера и подвергает этот декодированный выходной сигнал операции постфильтрации, чтобы получать постфильтрованный выходной сигнал 108. Этот постфильтрованный выходной сигнал может выводиться в качестве обработанного сигнала или дополнительно может обрабатываться посредством любой процедуры для удаления любых неоднородностей, введенных посредством операции постфильтрации, которая, конечно, является зависимой от сигнала, т.е. может варьироваться между кадрами. Эта операция удаления неоднородности может быть любой известной операцией удаления неоднородности, такой как плавный переход, что означает то, что более ранний кадр постепенно затухает, и, одновременно, новый кадр постепенно нарастает, и предпочтительно, характеристика постепенного изменения является такой, что коэффициенты постепенного изменения составляют в целом единицу в течение операции плавного перехода. Тем не менее, также может применяться другое удаление неоднородности, такое как фильтрация нижних частот или LPC-фильтрация.
Кроме того, устройство для обработки аудиосигнала, проиллюстрированное на фиг. 1, содержит устройство 112 хранения информации многоотводного фильтра и контроллер 114 фильтра. В частности, контроллер 114 фильтра принимает вспомогательную информацию 116 из декодера 100, и эта вспомогательная информация, например, может быть информацией g усиления основного тона и информацией запаздывания основного тона, т.е. информацией относительно целочисленной части Tint запаздывания основного тона и дробной части Tfr запаздывания основного тона. Эта информация является полезной для задания гармонического постфильтра между кадрами и, дополнительно, для выбора информации B(z, Tfr) многоотводного фильтра. Кроме того, дополнительная информация, такая как скорость передачи битов, применяемая посредством декодера, либо частота дискретизации, лежащая в основе декодированного сигнала, также может использоваться посредством контроллера 114 фильтра, чтобы, в частности, устанавливать скалярные значения α, β для определенной настройки кодера и/или декодера относительно скорости передачи битов и частоты дискретизации.
Фиг. 2 иллюстрирует представление нулей и полюсов передаточной функции H(z) фильтра в z-области, как известно в данной области техники. Естественно, предусмотрено множество других представлений гармонического постфильтра, которые все являются представлениями фильтра, которые могут преобразовываться в вид представления нулей и полюсов в z-области. Следовательно, настоящее изобретение является применимым для каждого фильтра, который может описываться тем или иным способом посредством такой передаточной функции, как проиллюстрировано в описании изобретения.
Фиг. 3 иллюстрирует предпочтительный вариант осуществления гармонического постфильтра, также описанный в качестве передаточной функции в обозначении нулей и полюсов в z-области.
Фильтр может описываться следующим образом:
где является декодированным усилением, и является целочисленной и дробной частью декодированного запаздывания основного тона, α и β являются двумя скалярными величинами, которые взвешивают усиление, и является FIR-фильтром нижних частот, коэффициенты которого зависят от дробной части декодированного запаздывания основного тона.
Следует отметить, что в числителе используется для того, чтобы компенсировать наклон, введенный посредством .
β используется для того, чтобы управлять интенсивностью постфильтра. Β, равное 1, формирует полные эффекты, подавляя максимальную возможную величину энергии между гармониками. β, равное 0, отключает постфильтр. Обычно, довольно низкое значение используется для того, чтобы не подавлять слишком большую величину энергии между гармониками. Значение также может зависеть от скорости передачи битов с большим значением при более низкой скорости передачи битов, например, 0,4 при низкой скорости передачи битов и 0,2 при высокой скорости передачи битов.
α используется для того, чтобы добавлять небольшой наклон в частотную характеристику H(z), чтобы компенсировать небольшие потери в энергии на низких частотах. Значение α, в общем, выбирается близким к 1, например, 0,8.
Пример приведен на фиг. 6. Порядок и коэффициенты также могут зависеть от скорости передачи битов и выходной частоты дискретизации. Различная частотная характеристика может быть рассчитана и настроена для каждой комбинации скорости передачи битов и выходной частоты дискретизации.
В частности, выяснено, что даже значения для α между 0,6 и меньше 1,0 являются полезными, и что, дополнительно, значения для β между 0,1, и 0,5, как оказалось, также являются полезными.
Кроме того, многоотводный фильтр может иметь переменное число отводов. Обнаружено, что для определенных реализаций, четырех отводов достаточно, где один отвод является z+1. Тем не менее, меньшие фильтры только с двумя отводами или даже большие фильтры более чем с четырьмя отводами являются полезными для определенных реализаций.
Фиг. 6 иллюстрирует предпочтительную реализацию фильтров B(z) для различных дробных значений запаздывания основного тона и, в частности, для разрешения запаздывания основного тона в 1/4. Для этой реализации, проиллюстрированы четыре различных описания фильтра для многоотводного фильтра в знаменателе передаточной функции гармонического постфильтра. Тем не менее, обнаружено, что коэффициенты фильтрации не обязательно должны указывать точно проиллюстрированные значения на фиг. 6, но определенные варьирования+/-0,05 также могут быть полезными в других реализациях.
В частности, как проиллюстрировано на фиг. 1, весовые коэффициенты отводов, проиллюстрированные на фиг. 6, сохраняются в запоминающем устройстве 112 для получения информации многоотводного фильтра. Контроллер 114 фильтра принимает дробную часть Tfr из линии 116 по фиг. 1 и, в ответ на это значение, обращается к запоминающему устройству 112 для того, чтобы извлекать через линию 200 извлечения конкретную информацию фильтра для конкретной дробной части запаздывания основного тона. Эта информация затем перенаправляется через линию 202 вывода в гармонический постфильтр 104, так что гармонический постфильтр корректно задается. Определенная реализация многоотводного FIR-фильтра проиллюстрирована на фиг. 5. Указание w1-w4 весовых коэффициентов соответствует обозначению на фиг. 6, и контроллер 114 фильтра применяет, в ответ на фактическую дробную часть запаздывания основного тона, соответствующие весовые коэффициенты для определенного аудиокадра. Другие части, к примеру, части 501, 502, 503 задержки и модуль 505 комбинирования, могут реализовываться так, как проиллюстрировано. В этом контексте, следует подчеркнуть, что значение 501 задержки в обозначении z является отрицательным значением задержки, поскольку выяснено, что представление FIR-фильтра, имеющее отрицательное значение задержки в дополнение к положительному значению задержки, к примеру, 503 и 504, в частности, является полезным.
Затем, предпочтительная реализация кодера, имеющая определенные функциональные блоки и работающая без предварительного фильтра, проиллюстрирована на фиг. 4. Часть фильтра, проиллюстрированная на фиг. 4, содержит модуль 402 оценки основного тона, модуль 404 уточнения основного тона, модуль 406 оценки дробной части, детектор 408 переходных частей, модуль 410 оценки усиления и квантователь 412 усиления. Информация, предоставляемая посредством квантователя 412 усиления, модуля 406 оценки дробной части, модуля 404 уточнения основного тона, и решающий бит, сформированный посредством детектора 408 переходных частей, вводятся в формирователь 414 кодированных сигналов. Формирователь кодированных сигналов предоставляет кодированный сигнал 102, который затем вводится в декодер 100, проиллюстрированный на фиг. 1. Кодированный сигнал 102 должен содержать дополнительную сигнальную информацию, не проиллюстрированную на фиг. 4.
Далее описывается функциональность модуля 402 оценки основного тона.
Одно запаздывание основного тона (целочисленная часть + дробная часть) в расчете на кадр оценивается (размер кадра, например, 20 мс). Это выполняется на 3 этапах, чтобы уменьшать сложность и повышать точность оценки.
Алгоритм анализа основного тона, который формирует гладкий контур изменения основного тона, используется (например, анализ основного тона с разомкнутым контуром, описанный в Rec. ITU-T G.718, раздел 6.6). Этот анализ, в общем, выполняется на основе субкадров (размер субкадра, например, 10 мс) и формирует одну оценку запаздывания основного тона в расчете на субкадр. Следует отметить, что эти оценки запаздывания основного тона не имеют дробной части и, в общем, оцениваются для сигнала после понижающей дискретизации (с частотой дискретизации, например, 6400 Гц). Используемый сигнал может представлять собой любой аудиосигнал, например, взвешенный LPC-аудиосигнал, как описано в Rec. ITU-T G.718, раздел 6.5.
Модуль уточнения основного тона работает следующим образом:
Конечная целочисленная часть запаздывания основного тона оценивается для аудиосигнала x[n], работающего на частоте дискретизации базового кодера, которая, в общем, выше частоты дискретизации сигнала после понижающей дискретизации, используемого в a. (например, 12,8 кГц, 16 кГц, 32 кГц,...,). Сигнал x[n] может представлять собой любой аудиосигнал, например, взвешенный LPC-аудиосигнал.
Целочисленная часть Tint запаздывания основного тона в таком случае является запаздыванием , которое максимизирует автокорреляционную функцию:
Модуль 406 оценки дробной части работает следующим образом:
Дробная часть находится посредством интерполяции автокорреляционной функции , вычисленной на этапе 2.b, и выбора дробного запаздывания основного тона, которое максимизирует интерполированную автокорреляционную функцию. Интерполяция может выполняться с использованием FIR-фильтра нижних частот, как описано в, например, Rec. ITU-T G.718, раздел 6.6.7.
Детектор 408 переходных частей, проиллюстрированный на фиг. 4, сконфигурирован с возможностью формирования решающего бита.
Если входной аудиосигнал не имеет содержания гармоник, то параметры не кодируются в потоке битов. Только 1 бит отправляется таким образом, что декодер знает то, должен он декодировать параметры постфильтрации или нет. Решение принимается на основе нескольких параметров:
a. Нормализованная корреляция при целочисленном запаздывании основного тона, оцененном на этапе 1.b:
Нормализованная корреляция равна 1, если входной сигнал является идеально прогнозируемым посредством целочисленного запаздывания основного тона, и равна 0, если он вообще не является прогнозируемым. Высокое значение (близко к 1) в таком случае указывает гармонический сигнал. Для более надежного решения, нормализованная корреляция предыдущего кадра также может использоваться в решении, например:
Если (norm.corr(curr.)*norm.corr.(prev.))>0,25, то текущий кадр имеет некоторое содержание гармоник (бит=1)
b. Признаки, вычисленные посредством детектора переходных частей (например, показатель временной равномерности, максимальное изменение энергии), чтобы исключать активацию постфильтра для сигнала, содержащего переходную часть, например:
Если (tempFlatness>3,5 или maxEnergychange>3,5), то задание бита=0 и отказ от отправки параметров
Кроме того, модуль 410 оценки усиления вычисляет усиление, которое должно вводиться в квантователь 412 усиления.
Усиление, в общем, оценивается для входного аудиосигнала на частоте дискретизации базового кодера, но он также может представлять собой любой аудиосигнал, к примеру, взвешенный LPC-аудиосигнал. Этот сигнал помечен y[n] и может быть идентичным или отличающимся от x[n].
Прогнозирование yP[n] y[n] сначала находится посредством фильтрации y[n] со следующим фильтром:
где является целочисленной частью запаздывания основного тона (оцененной на 1.b)), и является FIR-фильтром нижних частот, коэффициенты которого зависят от дробной части запаздывания основного тона (оцененной на 1.c)).
Один пример B(z), когда разрешение запаздывания основного тона составляет 1/4:
Усиление g затем вычисляется следующим образом:
и ограничено между 0 и 1.
В завершение, усиление квантуется, например, для 2 битов, с использованием, например, равномерного квантования.
Если усиление квантуется до 0, то параметры не кодируются в потоке битов, а только один решающий бит (бит=0).
Как указано выше, постфильтр применяется к выходному аудиосигналу после декодера с преобразованием. Он обрабатывает сигнал на покадровой основе с размером кадра, идентичным размеру кадра, используемого на стороне кодера, к примеру, 20 мс. Как проиллюстрировано, он основан на долговременном прогнозном фильтре H(z), параметры которого определяются из параметров, оцененных на стороне кодера и декодированных из потока битов. Эта информация содержит решающий бит, запаздывание и усиление основного тона. Если решающий бит равен 0, то запаздывание и усиление основного тона не декодируются и предположительно равны 0, вообще не записываются в поток битов.
Как пояснено, если параметры фильтрации отличаются между кадрами, неоднородность может вводиться на границе между двумя кадрами. Чтобы исключать неоднородность, применяется модуль удаления неоднородности, к примеру, регулятор плавного перехода или любая другая реализация для этой цели.
Кроме того, несколько различных способов задавать гармонический постфильтр проиллюстрированы на фиг. 7a-8b. Графики иллюстрируют передаточную функцию в частотной области. Горизонтальная ось связана с нормализованной частотой 1, и вертикальная ось является абсолютной величиной характеристики фильтра в дБ. Следует подчеркнуть, что на всех иллюстрациях, кроме фиг. 7b, фильтр вводит усиление для низких частот, т.е. определенное положительное значение абсолютной величины в дБ.
В частности, фиг. 7a иллюстрирует передаточную функцию, реализующую фильтр на фиг. 3, с определенными значениями параметров, как указано выше. Кроме того, значение α, т.е. первое скалярное значение задается равным 0. Фиг. 7b иллюстрирует аналогичную ситуацию, но теперь со значением α, равным 1. Другие параметры являются идентичными фиг. 7a.
Фиг. 7c иллюстрирует дополнительную реализацию, где α равен 0,8, который имеет небольшой наклон и повышение нижних частот. С другой стороны, фиг. 7 имеет идентичные другие параметры, как указано на фиг. 7a. Становится очевидным, что α, равный 1, удаляет наклон, и все частоты гармоник имеют усиление 1. Недостаток этой настройки заключается в потерях энергии на частотах между гармониками. Следовательно, предпочитается значение α, равное 0,8, как показано на фиг. 7c. Это значение добавляет небольшой наклон по сравнению с ситуацией α, равного 1, на фиг. 7b. Чтобы компенсировать потери энергий на частотах между гармониками, этот небольшой наклон предпочтительно используется.
Кроме того, фиг. 8a и 8b иллюстрируют настройки фильтра для значения α, равного 0,8, и различных значений β, т.е. значения β в 0,4 на фиг. 8a и значения β в 0,2 на фиг. 8b. Становится очевидным, что значение β 0,4 имеет более сильный эффект постфильтрации по сравнению со значением β 0,2, и в силу этого значение β 0,4 используется на более низких скоростях передачи битов, чтобы удалять межгармонический шум, введенный посредством такой низкой скорости передачи битов.
С другой стороны, β, равное 0,2, имеет менее сильный эффект для подавления энергии между гармониками, и в силу этого данное значение β предпочитается для высоких скоростей передачи битов вследствие того факта, что на таких более высоких скоростях передачи битов, существует не такой большой межгармонический шум.
Хотя некоторые аспекты описаны в контексте устройства, очевидно, что эти аспекты также представляют описание соответствующего способа, при этом блок или устройство соответствует этапу способа либо признаку этапа способа. Аналогично, аспекты, описанные в контексте этапа способа, также представляют описание соответствующего блока или элемента, или признака соответствующего устройства. Некоторые или все этапы способа могут быть выполнены посредством (или с использованием) устройства, такого как, например, микропроцессор, программируемый компьютер либо электронная схема. В некоторых вариантах осуществления, некоторые из одного или более самых важных этапов способа могут выполняться посредством этого устройства.
Изобретаемый передаваемый кодированный сигнал может быть сохранен на цифровом носителе хранения данных или может быть передан по среде передачи, такой как беспроводная среда передачи или проводная среда передачи, к примеру, Интернет.
В зависимости от определенных требований к реализации, варианты осуществления изобретения могут быть реализованы в аппаратных средствах или в программном обеспечении. Реализация может выполняться с использованием цифрового носителя хранения данных, например, гибкого диска, DVD, Blu-Ray, CD, ROM, PROM и EPROM, EEPROM или флэш-памяти, имеющего сохраненные электронночитаемые управляющие сигналы, которые взаимодействуют (или допускают взаимодействие) с программируемой компьютерной системой, так что осуществляется соответствующий способ. Следовательно, цифровой носитель хранения данных может быть машиночитаемым.
Некоторые варианты осуществления согласно изобретению содержат носитель данных, имеющий электронночитаемые управляющие сигналы, которые допускают взаимодействие с программируемой компьютерной системой таким образом, что осуществляется один из способов, описанных в данном документе.
В общем, варианты осуществления настоящего изобретения могут быть реализованы как компьютерный программный продукт с программным кодом, при этом программный код сконфигурирован с возможностью осуществления одного из способов, когда компьютерный программный продукт работает на компьютере. Программный код, например, может быть сохранен на машиночитаемом носителе.
Другие варианты осуществления содержат компьютерную программу для осуществления одного из способов, описанных в данном документе, сохраненную на машиночитаемом носителе.
Другими словами, следовательно, вариант осуществления изобретаемого способа представляет собой компьютерную программу, имеющую программный код для осуществления одного из способов, описанных в данном документе, когда компьютерная программа работает на компьютере.
Следовательно, дополнительный вариант осуществления изобретаемого способа представляет собой носитель хранения данных (или энергонезависимый носитель хранения данных, такой как цифровой носитель хранения данных или машиночитаемый носитель), содержащий записанную компьютерную программу для осуществления одного из способов, описанных в данном документе. Носитель данных, цифровой носитель хранения данных или носитель с записанными данными типично является материальным и/или энергонезависимым.
Следовательно, дополнительный вариант осуществления изобретаемого способа представляет собой поток данных или последовательность сигналов, представляющих компьютерную программу для осуществления одного из способов, описанных в данном документе. Поток данных или последовательность сигналов, например, может быть сконфигурирована с возможностью передачи через соединение для передачи данных, например, через Интернет.
Дополнительный вариант осуществления содержит средство обработки, например, компьютер или программируемое логическое устройство, сконфигурированное с возможностью осуществлять один из способов, описанных в данном документе.
Дополнительный вариант осуществления содержит компьютер, имеющий установленную компьютерную программу для осуществления одного из способов, описанных в данном документе.
Дополнительный вариант осуществления согласно изобретению содержит устройство или систему, сконфигурированную с возможностью передавать (например, электронно или оптически) компьютерную программу для осуществления одного из способов, описанных в данном документе, в приемное устройство. Приемное устройство, например, может представлять собой компьютер, мобильное устройство, запоминающее устройство и т.п. Устройство или система, например, может содержать файловый сервер для передачи компьютерной программы в приемное устройство.
В некоторых вариантах осуществления, программируемое логическое устройство (например, программируемая пользователем вентильная матрица) может быть использовано для того, чтобы выполнять часть или все из функциональностей способов, описанных в данном документе. В некоторых вариантах осуществления, программируемая пользователем вентильная матрица может взаимодействовать с микропроцессором, чтобы осуществлять один из способов, описанных в данном документе. В общем, способы предпочтительно осуществляются посредством любого устройства.
Вышеописанные варианты осуществления являются просто иллюстративными в отношении принципов настоящего изобретения. Следует понимать, что модификации и изменения компоновок и подробностей, описанных в данном документе, должны быть очевидными для специалистов в данной области техники. Следовательно, они подразумеваются как ограниченные только посредством объема нижеприведенной формулы изобретения, а не посредством конкретных подробностей, представленных посредством описания и пояснения вариантов осуществления в данном документе.
Claims (39)
1. Устройство для обработки аудиосигнала, имеющего ассоциированную информацию запаздывания основного тона и информацию усиления, содержащее:
- преобразователь (100) области для преобразования представления аудиосигнала в первой области в представление аудиосигнала во второй области; и
- гармонический постфильтр (104) для фильтрации представления аудиосигнала во второй области, при этом постфильтр основан на передаточной функции, содержащей числитель и знаменатель, при этом числитель содержит значение усиления, указываемое посредством информации усиления, и при этом знаменатель содержит целочисленную часть запаздывания основного тона, указываемую посредством информации запаздывания основного тона, и многоотводный фильтр, зависящий от дробной части запаздывания основного тона.
2. Устройство по п. 1, в котором передаточная функция постфильтра содержит, в числителе, дополнительный многоотводный FIR-фильтр для нулевой дробной части запаздывания основного тона.
3. Устройство по п. 1, в котором знаменатель содержит произведение между многоотводным фильтром и значением усиления.
4. Устройство по п. 1, в котором числитель, кроме того, содержит произведение первого скалярного значения и второго скалярного значения, при этом знаменатель содержит второе скалярное значение, а не первое скалярное значение, при этом первое и второе скалярные значения предварительно определены и имеют значения, большие 0 и меньшие, и при этом второе скалярное значение ниже первого скалярного значения.
5. Устройство по п. 4, дополнительно содержащее:
- контроллер (114) фильтра, сконфигурированный с возможностью задания второго скалярного значения в зависимости от скорости передачи битов, на которой работает частотно-временной преобразователь (100), при этом второе скалярное значение задается равным первому значению, когда скорость передачи битов имеет первое значение, при этом второе скалярное значение задается равным второму значению, когда скорость передачи битов имеет второе значение, при этом второе значение скорости передачи битов ниже первого значения скорости передачи битов, и при этом второе значение второго скалярного значения превышает первое значение второго скалярного значения.
6. Устройство по п. 4, в котором первое скалярное значение задается между 0,6 и 1,0, и при этом второе скалярное значение задается между 0,1 и 0,5.
7. Устройство по п. 1,
- в котором постфильтр имеет передаточную функцию H(z) в представлении нулей и полюсов на основе следующего уравнения:
- при этом α является первым скалярным значением, при этом β является вторым скалярным значением, при этом B(z, 0) является многоотводным фильтром для нулевой дробной части запаздывания основного тона, при этом B(z, Tfr) является многоотводным фильтром, зависящим от дробной части запаздывания основного тона, при этом Tint является целочисленной частью запаздывания основного тона, при этом Tfr является дробной частью запаздывания основного тона, и при этом g является значением усиления, указываемым посредством информации усиления, z является переменной в плоскости Z.
8. Устройство по п. 1, в котором многоотводный фильтр представляет собой фильтр с конечной импульсной характеристикой (FIR) и имеет, по меньшей мере, три отвода.
9. Устройство по п. 1,
- в котором многоотводный фильтр в знаменателе содержит четыре отвода, при этом, для нулевой дробной части, первый отвод задается между 0,0 и 0,1, второй отвод задается между 0,2 и 0,3, третий отвод задается между 0,5 и 0,6, и четвертый отвод задается между 0,2 и 0,3,
- при этом многоотводный фильтр содержит, для первой дробной части, четыре отвода фильтра, при этом первый отвод задается между 0,0 и 0,1, второй отвод задается между 0,3 и 0,4, третий отвод задается между 0,45 и 0,55, и четвертый отвод задается между 0,1 и 0,2,
- при этом многоотводный фильтр содержит, для второй дробной части, четыре отвода фильтра, при этом первый отвод задается между 0,0 и 0,1, второй отвод задается между 0,35 и 0,45, третий отвод задается между 0,35 и 0,45, и четвертый отвод задается между 0,0 и 0,1,
- при этом многоотводный фильтр содержит, для третьей дробной части, четыре отвода фильтра, при этом первый отвод задается между 0,1 и 0,2, второй отвод задается между 0,45 и 0,55, третий отвод задается между 0,3 и 0,4, и четвертый отвод задается между 0,0 и 0,1,
- при этом третья дробная часть превышает вторую дробную часть, и при этом вторая дробная часть превышает первую дробную часть.
10. Устройство по п. 1,
- в котором постфильтр сконфигурирован с возможностью иметь отрицательный спектральный наклон для компенсации потерь в энергии посредством гармонического постфильтра, или
- при этом постфильтр сконфигурирован с возможностью подавлять величину энергии между гармониками в кадре, при этом подавляемая величина энергии меньше 20% полной энергии представления во временной области в кадре.
11. Устройство по п. 1,
- в котором преобразователь области представляет собой частотно-временной преобразователь, при этом первая область представляет собой частотную область, и вторая область представляет собой временную область, или
- при этом преобразователь области представляет собой преобразователь "LPC-остатки/время", при этом первая область представляет собой область LPC-остатков, и вторая область представляет собой временную область.
12. Способ обработки аудиосигнала, имеющего ассоциированную информацию запаздывания основного тона и информацию усиления, содержащий этапы, на которых:
- преобразуют (100) частотное представление аудиосигнала в представление аудиосигнала во временной области; и
- фильтруют представление аудиосигнала во временной области посредством гармонического постфильтра (104), при этом постфильтр основан на передаточной функции, содержащей числитель и знаменатель, при этом числитель содержит значение усиления, указываемое посредством информации усиления, и при этом знаменатель содержит целочисленную часть запаздывания основного тона, указываемую посредством информации запаздывания основного тона, и многоотводный фильтр, зависящий от дробной части запаздывания основного тона.
13. Система для обработки аудиосигнала, содержащая кодер для кодирования аудиосигнала и декодер, содержащий процессор, причем процессор содержит:
- преобразователь (100) области для преобразования частотного представления аудиосигнала в представление аудиосигнала во временной области; и
- гармонический постфильтр (104) для фильтрации представления аудиосигнала во временной области,
- при этом постфильтр основан на передаточной функции, содержащей числитель и знаменатель, при этом числитель содержит значение усиления, указываемое посредством информации усиления, и при этом знаменатель содержит целочисленную часть запаздывания основного тона, указываемую посредством информации запаздывания основного тона, и многоотводный фильтр, зависящий от дробной части запаздывания основного тона.
14. Система по п. 13, в которой кодер содержит модуль (402, 404, 406) вычисления запаздывания основного тона для вычисления целочисленной части и дробной части запаздывания основного тона и модуль (410, 412) вычисления усиления основного тона для вычисления значения усиления, и формирователь (414) кодированных сигналов для формирования кодированного сигнала (102), содержащего информацию запаздывания основного тона и информацию усиления.
15. Способ обработки аудиосигнала, содержащий способ кодирования аудиосигнала и способ декодирования, содержащий этапы, на которых:
- преобразуют (100) частотное представление аудиосигнала в представление аудиосигнала во временной области; и
- фильтруют представление аудиосигнала во временной области с использованием гармонического постфильтра (104), при этом постфильтр основан на передаточной функции, содержащей числитель и знаменатель, при этом числитель содержит значение усиления, указываемое посредством информации усиления, и при этом знаменатель содержит целочисленную часть запаздывания основного тона, указываемую посредством информации запаздывания основного тона, и многоотводный фильтр, зависящий от дробной части запаздывания основного тона.
16. Машиночитаемый носитель, имеющий сохраненную на нем компьютерную программу для осуществления способа по п. 12, когда компьютерная программа выполняется на компьютере или процессоре.
17. Машиночитаемый носитель, имеющий сохраненную на нем компьютерную программу для осуществления способа по п. 15, когда компьютерная программа выполняется на компьютере или процессоре.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP14178820.8A EP2980799A1 (en) | 2014-07-28 | 2014-07-28 | Apparatus and method for processing an audio signal using a harmonic post-filter |
EP14178820.8 | 2014-07-28 | ||
PCT/EP2015/066998 WO2016016121A1 (en) | 2014-07-28 | 2015-07-24 | Apparatus and method for processing an audio signal using a harmonic post-filter |
Publications (1)
Publication Number | Publication Date |
---|---|
RU2665259C1 true RU2665259C1 (ru) | 2018-08-28 |
Family
ID=51224878
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2017106109A RU2665259C1 (ru) | 2014-07-28 | 2015-07-24 | Устройство и способ для обработки звукового сигнала с использованием гармонического постфильтра |
Country Status (17)
Country | Link |
---|---|
US (4) | US10242688B2 (ru) |
EP (2) | EP2980799A1 (ru) |
JP (4) | JP6546264B2 (ru) |
KR (1) | KR101959211B1 (ru) |
CN (2) | CN106663444B (ru) |
AR (1) | AR101340A1 (ru) |
AU (1) | AU2015295603B2 (ru) |
CA (1) | CA2955255C (ru) |
ES (1) | ES2676584T3 (ru) |
MX (1) | MX360555B (ru) |
MY (1) | MY179023A (ru) |
PL (1) | PL3175454T3 (ru) |
PT (1) | PT3175454T (ru) |
RU (1) | RU2665259C1 (ru) |
SG (1) | SG11201700696UA (ru) |
TW (1) | TWI590238B (ru) |
WO (1) | WO2016016121A1 (ru) |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2980799A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for processing an audio signal using a harmonic post-filter |
EP3000110B1 (en) * | 2014-07-28 | 2016-12-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Selection of one of a first encoding algorithm and a second encoding algorithm using harmonics reduction |
EP3483882A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Controlling bandwidth in encoders and/or decoders |
WO2019091576A1 (en) | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits |
EP3483884A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Signal filtering |
EP3483878A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder supporting a set of different loss concealment tools |
EP3483880A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Temporal noise shaping |
EP3483883A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio coding and decoding with selective postfiltering |
WO2019091573A1 (en) | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters |
EP3483886A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Selecting pitch lag |
EP3483879A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Analysis/synthesis windowing function for modulated lapped transformation |
WO2019216037A1 (ja) * | 2018-05-10 | 2019-11-14 | 日本電信電話株式会社 | ピッチ強調装置、その方法、プログラム、および記録媒体 |
BR112021013720A2 (pt) | 2019-01-13 | 2021-09-21 | Huawei Technologies Co., Ltd. | Método implementado por computador para codificação de áudio, dispositivo eletrônico e meio legível por computador não transitório |
CN112467744B (zh) * | 2020-12-11 | 2022-06-17 | 东北电力大学 | 面向配网频率偏移的apf抗频扰谐波指令电流预测方法 |
EP4120256A1 (en) * | 2021-07-14 | 2023-01-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Processor for generating a prediction spectrum based on long-term prediction and/or harmonic post-filtering |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0698877A2 (en) * | 1994-08-22 | 1996-02-28 | Nec Corporation | Postfilter and method of postfiltering |
RU2121173C1 (ru) * | 1994-04-29 | 1998-10-27 | Аудиокоудс, Лтд. | Способ постфильтрации основного тона синтезированной речи и постфильтр основного тона |
US6058360A (en) * | 1996-10-30 | 2000-05-02 | Telefonaktiebolaget Lm Ericsson | Postfiltering audio signals especially speech signals |
US7707034B2 (en) * | 2005-05-31 | 2010-04-27 | Microsoft Corporation | Audio codec post-filter |
US20120101824A1 (en) * | 2010-10-20 | 2012-04-26 | Broadcom Corporation | Pitch-based pre-filtering and post-filtering for compression of audio signals |
EP2757560A1 (en) * | 2010-07-02 | 2014-07-23 | Dolby International AB | Selective post filter |
Family Cites Families (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5359696A (en) * | 1988-06-28 | 1994-10-25 | Motorola Inc. | Digital speech coder having improved sub-sample resolution long-term predictor |
US5012517A (en) | 1989-04-18 | 1991-04-30 | Pacific Communication Science, Inc. | Adaptive transform coder having long term predictor |
WO1990013112A1 (en) * | 1989-04-25 | 1990-11-01 | Kabushiki Kaisha Toshiba | Voice encoder |
US5293449A (en) * | 1990-11-23 | 1994-03-08 | Comsat Corporation | Analysis-by-synthesis 2,4 kbps linear predictive speech codec |
TW224191B (ru) * | 1992-01-28 | 1994-05-21 | Qualcomm Inc | |
US5568688A (en) | 1995-06-07 | 1996-10-29 | Andrews; Edward A. | Hair shaving device with curved razor blade strip |
JP3328080B2 (ja) * | 1994-11-22 | 2002-09-24 | 沖電気工業株式会社 | コード励振線形予測復号器 |
JP2993396B2 (ja) * | 1995-05-12 | 1999-12-20 | 三菱電機株式会社 | 音声加工フィルタ及び音声合成装置 |
JP3653826B2 (ja) * | 1995-10-26 | 2005-06-02 | ソニー株式会社 | 音声復号化方法及び装置 |
EP0807803B1 (en) * | 1996-05-16 | 2005-02-23 | Matsushita Electric Industrial Co., Ltd. | Road map information readout apparatus, recording medium and transmitting method |
JP4121578B2 (ja) * | 1996-10-18 | 2008-07-23 | ソニー株式会社 | 音声分析方法、音声符号化方法および装置 |
JPH10214100A (ja) | 1997-01-31 | 1998-08-11 | Sony Corp | 音声合成方法 |
WO1999038156A1 (fr) * | 1998-01-26 | 1999-07-29 | Matsushita Electric Industrial Co., Ltd. | Methode et dispositif d'accentuation de registre |
JP4343302B2 (ja) * | 1998-01-26 | 2009-10-14 | パナソニック株式会社 | ピッチ強調方法及びその装置 |
US7072832B1 (en) * | 1998-08-24 | 2006-07-04 | Mindspeed Technologies, Inc. | System for speech encoding having an adaptive encoding arrangement |
AU2003214182A1 (en) * | 2002-03-12 | 2003-09-29 | Dilithium Networks Pty Limited | Method for adaptive codebook pitch-lag computation in audio transcoders |
CA2388352A1 (en) | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for frequency-selective pitch enhancement of synthesized speed |
JP2004302257A (ja) * | 2003-03-31 | 2004-10-28 | Matsushita Electric Ind Co Ltd | 長期ポストフィルタ |
JP4786183B2 (ja) | 2003-05-01 | 2011-10-05 | 富士通株式会社 | 音声復号化装置、音声復号化方法、プログラム、記録媒体 |
US8620645B2 (en) * | 2007-03-02 | 2013-12-31 | Telefonaktiebolaget L M Ericsson (Publ) | Non-causal postfilter |
EP2320683B1 (en) * | 2007-04-25 | 2017-09-06 | Harman Becker Automotive Systems GmbH | Sound tuning method and apparatus |
ATE500588T1 (de) * | 2008-01-04 | 2011-03-15 | Dolby Sweden Ab | Audiokodierer und -dekodierer |
US20090319263A1 (en) * | 2008-06-20 | 2009-12-24 | Qualcomm Incorporated | Coding of transitional speech frames for low-bit-rate applications |
ES2396173T3 (es) * | 2008-07-18 | 2013-02-19 | Dolby Laboratories Licensing Corporation | Método y sistema para post-filtrado en el dominio frecuencia de datos de audio codificados en un decodificador |
US9082416B2 (en) * | 2010-09-16 | 2015-07-14 | Qualcomm Incorporated | Estimating a pitch lag |
PL2676268T3 (pl) | 2011-02-14 | 2015-05-29 | Fraunhofer Ges Forschung | Urządzenie i sposób przetwarzania zdekodowanego sygnału audio w domenie widmowej |
JP5663461B2 (ja) | 2011-12-06 | 2015-02-04 | 日本電信電話株式会社 | 符号化方法、符号化装置、プログラム、記録媒体 |
US9418671B2 (en) * | 2013-08-15 | 2016-08-16 | Huawei Technologies Co., Ltd. | Adaptive high-pass post-filter |
EP2980799A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for processing an audio signal using a harmonic post-filter |
EP2980798A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Harmonicity-dependent controlling of a harmonic filter tool |
-
2014
- 2014-07-28 EP EP14178820.8A patent/EP2980799A1/en not_active Withdrawn
-
2015
- 2015-07-21 TW TW104123536A patent/TWI590238B/zh active
- 2015-07-24 KR KR1020177004542A patent/KR101959211B1/ko active IP Right Grant
- 2015-07-24 RU RU2017106109A patent/RU2665259C1/ru active
- 2015-07-24 ES ES15742238.7T patent/ES2676584T3/es active Active
- 2015-07-24 WO PCT/EP2015/066998 patent/WO2016016121A1/en active Application Filing
- 2015-07-24 CN CN201580040785.8A patent/CN106663444B/zh active Active
- 2015-07-24 MX MX2017001242A patent/MX360555B/es active IP Right Grant
- 2015-07-24 PL PL15742238T patent/PL3175454T3/pl unknown
- 2015-07-24 JP JP2017504060A patent/JP6546264B2/ja active Active
- 2015-07-24 SG SG11201700696UA patent/SG11201700696UA/en unknown
- 2015-07-24 CN CN202011296831.XA patent/CN112420061A/zh active Pending
- 2015-07-24 EP EP15742238.7A patent/EP3175454B1/en active Active
- 2015-07-24 PT PT15742238T patent/PT3175454T/pt unknown
- 2015-07-24 MY MYPI2017000140A patent/MY179023A/en unknown
- 2015-07-24 AU AU2015295603A patent/AU2015295603B2/en active Active
- 2015-07-24 CA CA2955255A patent/CA2955255C/en active Active
- 2015-07-28 AR ARP150102394A patent/AR101340A1/es active IP Right Grant
-
2017
- 2017-01-27 US US15/417,231 patent/US10242688B2/en active Active
-
2019
- 2019-02-27 US US16/288,018 patent/US11037580B2/en active Active
- 2019-06-20 JP JP2019114240A patent/JP6877488B2/ja active Active
-
2021
- 2021-01-08 US US17/144,979 patent/US11694704B2/en active Active
- 2021-01-16 JP JP2021005407A patent/JP7340553B2/ja active Active
-
2023
- 2023-03-11 JP JP2023038178A patent/JP2023072014A/ja active Pending
- 2023-05-16 US US18/197,724 patent/US20230282223A1/en active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2121173C1 (ru) * | 1994-04-29 | 1998-10-27 | Аудиокоудс, Лтд. | Способ постфильтрации основного тона синтезированной речи и постфильтр основного тона |
EP0698877A2 (en) * | 1994-08-22 | 1996-02-28 | Nec Corporation | Postfilter and method of postfiltering |
US6058360A (en) * | 1996-10-30 | 2000-05-02 | Telefonaktiebolaget Lm Ericsson | Postfiltering audio signals especially speech signals |
US7707034B2 (en) * | 2005-05-31 | 2010-04-27 | Microsoft Corporation | Audio codec post-filter |
EP2757560A1 (en) * | 2010-07-02 | 2014-07-23 | Dolby International AB | Selective post filter |
US20120101824A1 (en) * | 2010-10-20 | 2012-04-26 | Broadcom Corporation | Pitch-based pre-filtering and post-filtering for compression of audio signals |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2665259C1 (ru) | Устройство и способ для обработки звукового сигнала с использованием гармонического постфильтра | |
JP6629834B2 (ja) | ハーモニックフィルタツールのハーモニック依存制御 | |
US20160379646A1 (en) | Audio decoder and method for providing a decoded audio information using an error concealment modifying a time domain excitation signal | |
KR101997006B1 (ko) | 오디오 인코더, 오디오 디코더 및 오디오 신호를 처리하기 위한 방법 및 장치 | |
US20160247506A1 (en) | Audio decoder and method for providing a decoded audio information using an error concealment based on a time domain excitation signal | |
CN107533847B (zh) | 音频编码器和音频解码器及对应的方法 | |
JP2015522847A (ja) | デジタル音声信号における効果的なプレエコー減衰 | |
JP7179060B2 (ja) | 信号フィルタリング | |
KR102426050B1 (ko) | 피치 지연 선택 | |
JP2016513270A (ja) | 符号化信号を処理する装置および方法、並びに符号化信号を生成するエンコーダおよび方法 | |
BR112017001631B1 (pt) | Aparelho e método para processamento de um sinal de áudio utilizando um pós-filtro harmônico | |
WO2004097795A2 (en) | Adaptive voice enhancement for low bit rate audio coding |