RU2017105448A - Кодер и декодер аудиосигнала, использующие процессор частотной области с заполнением промежутка в полной полосе и процессор временной области - Google Patents
Кодер и декодер аудиосигнала, использующие процессор частотной области с заполнением промежутка в полной полосе и процессор временной области Download PDFInfo
- Publication number
- RU2017105448A RU2017105448A RU2017105448A RU2017105448A RU2017105448A RU 2017105448 A RU2017105448 A RU 2017105448A RU 2017105448 A RU2017105448 A RU 2017105448A RU 2017105448 A RU2017105448 A RU 2017105448A RU 2017105448 A RU2017105448 A RU 2017105448A
- Authority
- RU
- Russia
- Prior art keywords
- spectral
- audio signal
- signal
- processor
- decoded
- Prior art date
Links
- 230000003595 spectral effect Effects 0.000 claims 92
- 230000005236 sound signal Effects 0.000 claims 63
- 238000005070 sampling Methods 0.000 claims 34
- 230000015572 biosynthetic process Effects 0.000 claims 11
- 238000001914 filtration Methods 0.000 claims 9
- 238000003786 synthesis reaction Methods 0.000 claims 8
- 238000006243 chemical reaction Methods 0.000 claims 6
- 230000002194 synthesizing effect Effects 0.000 claims 6
- 230000003044 adaptive effect Effects 0.000 claims 4
- 230000007774 longterm Effects 0.000 claims 4
- 238000000034 method Methods 0.000 claims 4
- 230000003111 delayed effect Effects 0.000 claims 3
- 238000001228 spectrum Methods 0.000 claims 3
- 238000012952 Resampling Methods 0.000 claims 2
- 238000004590 computer program Methods 0.000 claims 1
- 238000011156 evaluation Methods 0.000 claims 1
- 238000013139 quantization Methods 0.000 claims 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/028—Noise substitution, i.e. substituting non-tonal spectral components by noisy source
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
- G10L19/265—Pre-filtering, e.g. high frequency emphasis prior to encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/20—Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Claims (119)
1. Аудиокодер для кодирования аудиосигнала, содержащий:
первый процессор (600) кодирования для кодирования первого участка аудиосигнала в частотной области, причем первый процессор (600) кодирования содержит:
временно-частотный преобразователь (602) для преобразования первого участка аудиосигнала в представление частотной области, имеющее спектральные линии вплоть до максимальной частоты первого участка аудиосигнала;
анализатор (604) для анализа представления частотной области вплоть до максимальной частоты для определения первых спектральных участков, подлежащих кодированию с первым спектральным разрешением, и вторых спектральных участков, подлежащих кодированию со вторым спектральным разрешением, причем второе спектральное разрешение ниже, чем первое спектральное разрешение, причем анализатор (604) выполнен с возможностью определения первого спектрального участка (306) из первых спектральных участков, причем первый спектральный участок располагается, относительно частоты, между двумя вторыми спектральными участками (307a, 307b) из вторых спектральных участков;
спектральный кодер (606) для кодирования первых спектральных участков с первым спектральным разрешением и для кодирования вторых спектральных участков со вторым спектральным разрешением, причем спектральный кодер содержит параметрический кодер для вычисления информации спектральной огибающей, имеющей второе спектральное разрешение, из вторых спектральных участков;
второй процессор (610) кодирования для кодирования второго, другого, участка аудиосигнала во временной области, причем второй процессор (610) кодирования содержит:
преобразователь (900) частоты дискретизации для преобразования второго участка аудиосигнала в представление с более низкой частотой дискретизации, причем более низкая частота дискретизации ниже, чем частота дискретизации аудиосигнала, причем представление с более низкой частотой дискретизации не включает в себя верхнюю полосу входного сигнала;
кодер (910) нижней полосы временной области для кодирования во временной области представления с более низкой частотой дискретизации; и
кодер (920) с расширением полосы временной области для параметрического кодирования верхней полосы;
контроллер (620), выполненный с возможностью анализа аудиосигнала и определения, какой участок аудиосигнала является первым участком аудиосигнала, кодированным в частотной области, и какой участок аудиосигнала является вторым участком аудиосигнала, кодированным во временной области; и
формирователь (630) кодированного сигнала для формирования кодированного аудиосигнала, содержащего первый кодированный участок сигнала для первого участка аудиосигнала и второй кодированный участок сигнала для второго участка аудиосигнала.
2. Аудиокодер по п. 1, дополнительный содержащий:
препроцессор (1000), выполненный с возможностью предобработки первого участка аудиосигнала и второго участка аудиосигнала,
причем препроцессор содержит:
анализатор (1002) предсказания для определения коэффициентов предсказания; и
при этом второй процессор кодирования содержит:
квантователь (1010) коэффициентов предсказания для генерирования квантованной версии коэффициентов предсказания; и
энтропийный кодер для генерирования кодированной версии квантованных коэффициентов предсказания,
причем формирователь (630) кодированного сигнала выполнен с возможностью внесения кодированной версии в кодированный аудиосигнал.
3. Аудиокодер по п. 1,
в котором препроцессор (1000) содержит блок (1004) повторной дискретизации для повторной дискретизации аудиосигнала до частоты дискретизации второго процессора кодирования; и
причем анализатор предсказания выполнен с возможностью определения коэффициентов предсказания с использованием повторной дискретизированного аудиосигнала, или
препроцессор (1000) дополнительно содержит ступень (1006) анализа долгосрочного предсказания для определения одного или более параметров долгосрочного предсказания для первого участка аудиосигнала.
4. Аудиокодер по п. 1, дополнительно содержащий кросспроцессор (700) для вычисления, из кодированного спектрального представления первого участка аудиосигнала, данных инициализации второго процессора (610) кодирования, таким образом, что вторая обработка (610) кодирования инициализируется для кодирования второго участка аудиосигнала, следующего по времени непосредственно за первым участком аудиосигнала в аудиосигнале.
5. Аудиокодер по п. 4, в котором кросспроцессор (700) содержит:
спектральный декодер (701) для вычисления декодированной версии первого кодированного участка сигнала;
ступень (707) задержки для подачи задержанной версии декодированной версии на ступень (617) устранения предыскажений второго процессора кодирования для инициализации;
блок (708) анализирующей фильтрации взвешенных коэффициентов предсказания для подачи выходного сигнала фильтра на определитель (613) кодовой книги второго процессора (610) кодирования для инициализации;
ступень (706) анализирующей фильтрации для фильтрации декодированной версии или версии с введенными предыскажениями (709) и для подачи остатка фильтра на определитель (612) адаптивной кодовой книги второго процессора кодирования для инициализации; или
фильтр (709) введения предыскажений для фильтрации декодированной версии и для подачи версии с задержкой или с введенными предыскажениями на ступень (616) синтезирующей фильтрации второго процессора (610) кодирования для инициализации.
6. Аудиокодер по п. 1,
в котором анализатор (604) выполнен с возможностью осуществления анализа временного формирования мозаичного элемента или временного формирования шума или операции обнуления спектральных значений во вторых спектральных участках,
причем первый процессор (600) кодирования выполнен с возможностью осуществления формирования (606a) спектральных значений первых спектральных участков с использованием коэффициентов (1002, 1010) предсказания, выведенных из первого участка аудиосигнала, и при этом первый процессор (600) кодирования дополнительно выполнен с возможностью осуществления операции (606b) квантования и энтропийного кодирования спектральных значений с заданной формой первых спектральных участков, и
при этом спектральные значения вторых спектральных участков обнуляются.
7. Аудиокодер по п. 6, дополнительно содержащий кросспроцессор (700), причем кросспроцессор (700) содержит:
формирователь (703) шума для формирования квантованных спектральных значений первых спектральных участков с использованием коэффициентов (1010) LPC, выведенных из первого участка аудиосигнала;
спектральный декодер (704, 705) для декодирования спектральных участков со сформированным спектром первого спектрального участка с высоким спектральным разрешением и для синтеза вторых спектральных участков с использованием параметрического представления вторых спектральных участков и, по меньшей мере, декодированного первого спектрального участка для получения декодированного спектрального представления;
частотно-временной преобразователь (702) для преобразования спектрального представления во временную область для получения декодированного первого участка аудиосигнала, причем частота дискретизации, связанная с декодированным первым участком аудиосигнала, отличается от частоты дискретизации аудиосигнала, и частота дискретизации, связанная с выходным сигналом частотно-временного преобразователя (702), отличается от частоты дискретизации аудиосигнала, поступающего на частотно-временной преобразователь (602).
8. Аудиокодер по п. 1,
в котором второй процессор кодирования содержит, по меньшей мере, один блок из следующей группы блоков:
анализирующего фильтра (611) предсказания;
ступени (612) адаптивной кодовой книги;
ступени (614) инновационной кодовой книги;
блока (613) оценки для оценки записи инновационной кодовой книги;
ступени (615) усиления/кодирования ACELP;
ступени (616) синтезирующей фильтрации предсказания;
ступени (617) устранения предыскажений; и
ступени (618) анализирующего постфильтра басов.
9. Аудиокодер по п. 1,
в котором с процессором кодирования временной области связана вторая частота дискретизации,
причем с процессором кодирования частотной области связана первая частота дискретизации, более высокая, чем вторая частота дискретизации, причем аудиокодер дополнительно содержит кросспроцессор (700) для вычисления, из кодированного спектрального представления первого участка аудиосигнала, данных инициализации второго процессора кодирования,
причем кросспроцессор содержит частотно-временной преобразователь (702) для генерации сигнала временной области на второй частоте дискретизации,
причем частотно-временной преобразователь (702) содержит:
блок (726) выбора для выбора нижнего участка спектра, поступающего на частотно-временной преобразователь, в соответствии с отношением первой частоты дискретизации и второй частоты дискретизации, причем отношение меньше 1,
процессор (720) преобразования, имеющий длину преобразования, меньшую длины преобразования временно-частотного преобразователя (602); и
блок (712) формирования окна для синтеза для формирования окна с использованием функции окна, имеющей меньшее количество коэффициентов функции окна по сравнению с функцией окна, используемой временно-частотным преобразователем (602).
10. Аудиодекодер для декодирования кодированного аудиосигнала, содержащий:
первый процессор (1120) декодирования для декодирования первого кодированного участка аудиосигнала в частотной области, причем первый процессор (1120) декодирования содержит:
спектральный декодер (1122) для декодирования первых спектральных участков с высоким спектральным разрешением и для синтеза вторых спектральных участков с использованием параметрического представления вторых спектральных участков и, по меньшей мере, декодированного первого спектрального участка для получения декодированного спектрального представления, причем спектральный декодер (1122) выполнен с возможностью генерации первого декодированного представления таким образом, что первый спектральный участок (306) располагается относительно частоты между двумя вторыми спектральными участками (307a, 307b); и
частотно-временной преобразователь (1120) для преобразования декодированного спектрального представления во временную область для получения декодированного первого участка аудиосигнала;
второй процессор (1140) декодирования для декодирования второго кодированного участка аудиосигнала во временной области для получения декодированного второго участка аудиосигнала; и
объединитель (1160) для объединения декодированного первого спектрального участка и декодированного второго спектрального участка для получения декодированного аудиосигнала,
причем второй процессор декодирования содержит:
декодер (1200) нижней полосы временной области для декодирования сигнала нижней полосы временной области;
повышающий дискретизатор (1210) для повышения частоты дискретизации сигнала нижней полосы временной области;
декодер (1220) с расширением полосы временной области для синтеза верхней полосы выходного сигнала временной области;
микшер (1230) для микширования синтезированной верхней полосы сигнала временной области и повышенно дискретизированного сигнала нижней полосы временной области; и
объединитель (1160) для объединения декодированного первого спектрального участка и декодированного второго спектрального участка для получения декодированного аудиосигнала.
11. Аудиодекодер по п. 10,
в котором повышающий дискретизатор (1210) содержит банк (1471) анализирующих фильтров, действующий на первой частоте дискретизации временной области декодера нижней полосы , и банк (1473) синтезирующих фильтров, действующий на второй выходной частоте дискретизации, которая выше первой частоты дискретизации нижней полосы временной области.
12. Аудиодекодер по п. 10,
в котором декодер (1200) нижней полосы временной области содержит остаточный сигнал, декодер (1149, 1141, 1142) и синтезирующий фильтр (1143) для фильтрации остаточного сигнала с использованием коэффициентов (1145) синтезирующего фильтра,
причем декодер (1220) с расширением полосы временной области выполнен с возможностью повышения частоты дискретизации остаточного сигнала (1221) и обработки (1222) повышенно дискретизированного остаточного сигнала с использованием нелинейной операции для получения остаточного сигнала верхней полосы и для спектрального формирования (1223) остаточного сигнала верхней полосы для получения синтезированной верхней полосы.
13. Аудиодекодер по п. 10,
в котором первый процессор (1120) декодирования содержит адаптивный постфильтр (1420) долгосрочного предсказания для постфильтрации первого декодированного первого участка сигнала, причем фильтр (1420) управляется одним или более параметрами долгосрочного предсказания, включенными в кодированный аудиосигнал.
14. Аудиодекодер по п. 10, дополнительно содержащий:
кросспроцессор (1170) для вычисления, из декодированного спектрального представления первого кодированного участка аудиосигнала, данных инициализации второго процессора (1140) декодирования, таким образом, что второй процессор (1140) декодирования инициализируется для декодирования кодированного второго участка аудиосигнала, следующий по времени за первым участком аудиосигнала в кодированном аудиосигнале.
15. Аудиодекодер по п. 14, в котором кросспроцессор дополнительно содержит:
частотно-временной преобразователь (1170), действующий на более низкой частоте дискретизации, чем частотно-временной преобразователь (1124) первого процессора (1120) декодирования, для получения дополнительно декодированного первого участка сигнала во временной области,
причем сигнал на выходе частотно-временного преобразователя (1171) имеет вторую частоту дискретизации, более низкую, чем первая частота дискретизации, связанная с выходом частотно-временного преобразователя (1124) второго процессора декодирования,
причем дополнительный частотно-временной преобразователь (1171) содержит блок (726) выбора для выбора нижнего участка спектра, поступающего на дополнительный частотно-временной преобразователь (1171), в соответствии с отношением первой частоты дискретизации и второй частоты дискретизации, причем отношение меньше 1;
процессор (720) преобразования, имеющий длину преобразования, меньшую, чем длина (710) преобразования временно-частотного преобразователя (1124); и
блок (722) формирования окна для синтеза, использующий функцию окна, имеющую меньшее количество коэффициентов по сравнению с функцией окна, используемой частотно-временным преобразователем (1124).
16. Аудиодекодер по п. 14,
в котором кросспроцессор (1170) содержит:
ступень (1172) задержки для задержки дополнительного декодированного первого участка сигнала и для подачи задержанной версии декодированного первого участка сигнала на ступень (1144) устранения предыскажений второго процессора декодирования для инициализации;
фильтр (1173) введения предыскажений и ступень (1175) задержки для фильтрации и задержки дополнительного декодированного первого участка сигнала и для подачи выходного сигнала ступени задержки на синтезирующий фильтр (1143) предсказания второго процессора декодирования для инициализации;
анализирующий фильтр (1174) предсказания для генерации остаточного сигнала предсказания из дополнительного декодированного первого спектрального участка или дополнительного декодированного первого участка сигнала с введенными предыскажениями (1173) и для подачи остаточного сигнала предсказания на синтезатор (1141) кодовой книги второго процессора (1200) декодирования; или
переключатель (1480) для подачи дополнительного декодированного первого участка сигнала на ступень (1471) анализа блока (1210) повторной дискретизации второго процессора декодирования для инициализации.
17. Аудиодекодер по п. 10,
в котором второй процессор (1200) декодирования содержит, по меньшей мере, один блок из группы блоков, содержащей:
ACELP для декодирования коэффициентов усиления и инновационной кодовой книги;
ступень (1141) синтеза адаптивной кодовой книги;
постпроцессор (1142) ACELP;
синтезирующий фильтр (1143) предсказания; и
ступень (1144) устранения предыскажений.
18. Способ кодирования аудиосигнала, содержащий этапы, на которых:
осуществляют первое кодирование (600) первого участка аудиосигнала в частотной области, причем первое кодирование (600) содержит этапы, на которых:
преобразуют (602) первый участок аудиосигнала в представление частотной области, имеющее спектральные линии вплоть до максимальной частоты первого участка аудиосигнала;
анализируют (604) представление частотной области вплоть до максимальной частоты для определения первых спектральных участков, подлежащих кодированию с первым спектральным разрешением, и вторых спектральных участков, подлежащих кодированию со вторым спектральным разрешением, причем второе спектральное разрешение ниже, чем первое спектральное разрешение, причем на этапе анализа (604) определяют первый спектральный участок (306) из первых спектральных участков, причем первый спектральный участок располагается, относительно частоты, между двумя вторыми спектральными участками (307a, 307b) из вторых спектральных участков;
кодируют (606) первые спектральные участки с первым спектральным разрешением и для кодирования вторых спектральных участков со вторым спектральным разрешением, причем кодирование второй спектральный участок содержит вычисление, из вторых спектральных участков, информации спектральной огибающей, имеющей второе спектральное разрешение;
кодируют (606) представление частотной области;
осуществляют второе кодирование (610) второго, другого, участка аудиосигнала во временной области, причем второе кодирование (610) содержит этапы, на которых:
преобразуют (900) второй участок аудиосигнала в представление с более низкой частотой дискретизации, причем более низкая частота дискретизации ниже, чем частота дискретизации аудиосигнала, причем представление с более низкой частотой дискретизации не включает в себя верхнюю полосу входного сигнала;
кодируют (910) во временной области представление с более низкой частотой дискретизации; и
параметрически кодируют (920) верхнюю полосу;
анализируют (620) аудиосигнал и определяют, какой участок аудиосигнала является первым участком аудиосигнала, кодированным в частотной области, и какой участок аудиосигнала является вторым участком аудиосигнала, кодированным во временной области; и
формируют (630) кодированный аудиосигнал, содержащий первый кодированный участок сигнала для первого участка аудиосигнала и второй кодированный участок сигнала для второго участка аудиосигнала.
19. Способ декодирования кодированного аудиосигнала, содержащий этапы, на которых:
осуществляют первое декодирование (1120) первого кодированного участка аудиосигнала в частотной области, причем первое декодирование (1120) содержит этап, на котором:
декодируют (1122) первые спектральные участки с высоким спектральным разрешением и синтезируют вторые спектральные участки с использованием параметрического представления вторых спектральных участков и, по меньшей мере, декодированного первого спектрального участка для получения декодированного спектрального представления, причем декодирование (1122) содержит генерирование первого декодированного представления таким образом, что первый спектральный участок (306) располагается относительно частоты между двумя вторыми спектральными участками (307a, 307b); и
преобразуют (1120) декодированное спектральное представление во временную область для получения декодированного первого участка аудиосигнала;
осуществляют второе декодирование (1140) второго кодированного участка аудиосигнала во временной области для получения декодированного второго участка аудиосигнала, причем второе декодирование содержит этапы, на которых:
декодируют (1200) сигнал нижней полосы временной области;
повышают (1210) частоту дискретизации сигнала нижней полосы временной области;
синтезируют (1220) верхнюю полосу выходного сигнала временной области; и
микшируют (1230) синтезированную верхнюю полосу сигнала временной области и повышенно дискретизированный сигнал нижней полосы временной области; и
объединяют (1160) декодированный первый спектральный участок и декодированный второй спектральный участок для получения декодированного аудиосигнала.
20. Компьютерная программа для осуществления, при выполнении на компьютере или процессоре, способа по п. 18 или 19.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP14178817.4 | 2014-07-28 | ||
EP14178817.4A EP2980794A1 (en) | 2014-07-28 | 2014-07-28 | Audio encoder and decoder using a frequency domain processor and a time domain processor |
PCT/EP2015/067003 WO2016016123A1 (en) | 2014-07-28 | 2015-07-24 | Audio encoder and decoder using a frequency domain processor with full-band gap filling and a time domain processor |
Publications (3)
Publication Number | Publication Date |
---|---|
RU2017105448A3 RU2017105448A3 (ru) | 2018-08-30 |
RU2017105448A true RU2017105448A (ru) | 2018-08-30 |
RU2671997C2 RU2671997C2 (ru) | 2018-11-08 |
Family
ID=51224876
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2017105448A RU2671997C2 (ru) | 2014-07-28 | 2015-07-24 | Кодер и декодер аудиосигнала, использующие процессор частотной области с заполнением промежутка в полной полосе и процессор временной области |
Country Status (19)
Country | Link |
---|---|
US (5) | US10332535B2 (ru) |
EP (4) | EP2980794A1 (ru) |
JP (4) | JP6549217B2 (ru) |
KR (1) | KR102009210B1 (ru) |
CN (6) | CN113948100A (ru) |
AR (1) | AR101344A1 (ru) |
AU (1) | AU2015295605B2 (ru) |
BR (5) | BR122022012519B1 (ru) |
CA (1) | CA2955095C (ru) |
ES (2) | ES2972128T3 (ru) |
MX (1) | MX362424B (ru) |
MY (1) | MY187280A (ru) |
PL (2) | PL3186809T3 (ru) |
PT (1) | PT3186809T (ru) |
RU (1) | RU2671997C2 (ru) |
SG (1) | SG11201700685XA (ru) |
TR (1) | TR201908602T4 (ru) |
TW (1) | TWI570710B (ru) |
WO (1) | WO2016016123A1 (ru) |
Families Citing this family (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2980795A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor |
EP2980794A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and decoder using a frequency domain processor and a time domain processor |
SG11201808684TA (en) | 2016-04-12 | 2018-11-29 | Fraunhofer Ges Forschung | Audio encoder for encoding an audio signal, method for encoding an audio signal and computer program under consideration of a detected peak spectral region in an upper frequency band |
EP3475944B1 (en) | 2016-06-22 | 2020-07-15 | Dolby International AB | Audio decoder and method for transforming a digital audio signal from a first to a second frequency domain |
US10249307B2 (en) | 2016-06-27 | 2019-04-02 | Qualcomm Incorporated | Audio decoding using intermediate sampling rate |
EP3288031A1 (en) | 2016-08-23 | 2018-02-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding an audio signal using a compensation value |
TWI807562B (zh) * | 2017-03-23 | 2023-07-01 | 瑞典商都比國際公司 | 用於音訊信號之高頻重建的諧波轉置器的回溯相容整合 |
EP3382704A1 (en) * | 2017-03-31 | 2018-10-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for determining a predetermined characteristic related to a spectral enhancement processing of an audio signal |
KR102392804B1 (ko) | 2017-07-28 | 2022-04-29 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 인코딩된 다채널 신호를 광대역 필터에 의해 생성된 충전 신호를 사용하여 인코딩 또는 디코딩하는 장치 |
CN111386568B (zh) * | 2017-10-27 | 2023-10-13 | 弗劳恩霍夫应用研究促进协会 | 使用神经网络处理器生成带宽增强的音频信号的装置、方法或计算机可读存储介质 |
EP4336497A3 (en) * | 2018-07-04 | 2024-03-20 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Multisignal encoder, multisignal decoder, and related methods using signal whitening or signal post processing |
US10911013B2 (en) | 2018-07-05 | 2021-02-02 | Comcast Cable Communications, Llc | Dynamic audio normalization process |
CN109215670B (zh) * | 2018-09-21 | 2021-01-29 | 西安蜂语信息科技有限公司 | 音频数据的传输方法、装置、计算机设备和存储介质 |
EP3671741A1 (en) * | 2018-12-21 | 2020-06-24 | FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. | Audio processor and method for generating a frequency-enhanced audio signal using pulse processing |
TWI703559B (zh) * | 2019-07-08 | 2020-09-01 | 瑞昱半導體股份有限公司 | 音效編碼解碼電路及音頻資料的處理方法 |
CN110794273A (zh) * | 2019-11-19 | 2020-02-14 | 哈尔滨理工大学 | 含有高压驱动保护电极的电位时域谱测试系统 |
CN113192521B (zh) * | 2020-01-13 | 2024-07-05 | 华为技术有限公司 | 一种音频编解码方法和音频编解码设备 |
KR20220046324A (ko) | 2020-10-07 | 2022-04-14 | 삼성전자주식회사 | 인공 신경망을 이용한 추론을 위한 트레이닝 방법, 인공 신경망을 이용한 추론 방법, 및 추론 장치 |
TWI752682B (zh) * | 2020-10-21 | 2022-01-11 | 國立陽明交通大學 | 雲端更新語音辨識系統的方法 |
CN113035205B (zh) * | 2020-12-28 | 2022-06-07 | 阿里巴巴(中国)有限公司 | 音频丢包补偿处理方法、装置及电子设备 |
EP4120253A1 (en) * | 2021-07-14 | 2023-01-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Integral band-wise parametric coder |
Family Cites Families (131)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ATE211326T1 (de) * | 1993-05-31 | 2002-01-15 | Sony Corp | Verfahren und vorrichtung zum kodieren oder dekodieren von signalen und aufzeichnungsmedium |
JP3465697B2 (ja) | 1993-05-31 | 2003-11-10 | ソニー株式会社 | 信号記録媒体 |
EP0764939B1 (en) | 1995-09-19 | 2002-05-02 | AT&T Corp. | Synthesis of speech signals in the absence of coded parameters |
US5956674A (en) | 1995-12-01 | 1999-09-21 | Digital Theater Systems, Inc. | Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels |
JP3364825B2 (ja) | 1996-05-29 | 2003-01-08 | 三菱電機株式会社 | 音声符号化装置および音声符号化復号化装置 |
US6134518A (en) | 1997-03-04 | 2000-10-17 | International Business Machines Corporation | Digital audio signal coding using a CELP coder and a transform coder |
WO1999010719A1 (en) * | 1997-08-29 | 1999-03-04 | The Regents Of The University Of California | Method and apparatus for hybrid coding of speech at 4kbps |
US6968564B1 (en) | 2000-04-06 | 2005-11-22 | Nielsen Media Research, Inc. | Multi-band spectral audio encoding |
US6996198B2 (en) * | 2000-10-27 | 2006-02-07 | At&T Corp. | Nonuniform oversampled filter banks for audio signal processing |
DE10102155C2 (de) * | 2001-01-18 | 2003-01-09 | Fraunhofer Ges Forschung | Verfahren und Vorrichtung zum Erzeugen eines skalierbaren Datenstroms und Verfahren und Vorrichtung zum Decodieren eines skalierbaren Datenstroms |
FI110729B (fi) | 2001-04-11 | 2003-03-14 | Nokia Corp | Menetelmä pakatun audiosignaalin purkamiseksi |
US6988066B2 (en) * | 2001-10-04 | 2006-01-17 | At&T Corp. | Method of bandwidth extension for narrow-band speech |
US7447631B2 (en) * | 2002-06-17 | 2008-11-04 | Dolby Laboratories Licensing Corporation | Audio coding system using spectral hole filling |
JP3876781B2 (ja) * | 2002-07-16 | 2007-02-07 | ソニー株式会社 | 受信装置および受信方法、記録媒体、並びにプログラム |
KR100547113B1 (ko) * | 2003-02-15 | 2006-01-26 | 삼성전자주식회사 | 오디오 데이터 인코딩 장치 및 방법 |
US20050004793A1 (en) * | 2003-07-03 | 2005-01-06 | Pasi Ojala | Signal adaptation for higher band coding in a codec utilizing band split coding |
KR100940531B1 (ko) * | 2003-07-16 | 2010-02-10 | 삼성전자주식회사 | 광대역 음성 신호 압축 및 복원 장치와 그 방법 |
CN1701517B (zh) * | 2003-08-28 | 2010-11-24 | 索尼株式会社 | 译码装置和方法 |
JP4679049B2 (ja) | 2003-09-30 | 2011-04-27 | パナソニック株式会社 | スケーラブル復号化装置 |
CA2457988A1 (en) * | 2004-02-18 | 2005-08-18 | Voiceage Corporation | Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization |
KR100561869B1 (ko) * | 2004-03-10 | 2006-03-17 | 삼성전자주식회사 | 무손실 오디오 부호화/복호화 방법 및 장치 |
CN1677490A (zh) * | 2004-04-01 | 2005-10-05 | 北京宫羽数字技术有限责任公司 | 一种增强音频编解码装置及方法 |
US7739120B2 (en) | 2004-05-17 | 2010-06-15 | Nokia Corporation | Selection of coding models for encoding an audio signal |
MXPA06012617A (es) | 2004-05-17 | 2006-12-15 | Nokia Corp | Codificacion de audio con diferentes longitudes de cuadro de codificacion. |
US7596486B2 (en) | 2004-05-19 | 2009-09-29 | Nokia Corporation | Encoding an audio signal using different audio coder modes |
KR100634506B1 (ko) * | 2004-06-25 | 2006-10-16 | 삼성전자주식회사 | 저비트율 부호화/복호화 방법 및 장치 |
US7720230B2 (en) | 2004-10-20 | 2010-05-18 | Agere Systems, Inc. | Individual channel shaping for BCC schemes and the like |
US8204261B2 (en) | 2004-10-20 | 2012-06-19 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Diffuse sound shaping for BCC schemes and the like |
JP5020826B2 (ja) | 2004-12-14 | 2012-09-05 | シリコン ハイブ ビー・ヴィー | プログラム可能信号処理回路及び復調方法 |
US8170221B2 (en) * | 2005-03-21 | 2012-05-01 | Harman Becker Automotive Systems Gmbh | Audio enhancement system and method |
KR100707186B1 (ko) * | 2005-03-24 | 2007-04-13 | 삼성전자주식회사 | 오디오 부호화 및 복호화 장치와 그 방법 및 기록 매체 |
EP1864281A1 (en) | 2005-04-01 | 2007-12-12 | QUALCOMM Incorporated | Systems, methods, and apparatus for highband burst suppression |
ATE421845T1 (de) | 2005-04-15 | 2009-02-15 | Dolby Sweden Ab | Zeitliche hüllkurvenformgebung von entkorrelierten signalen |
US7707034B2 (en) * | 2005-05-31 | 2010-04-27 | Microsoft Corporation | Audio codec post-filter |
US7548853B2 (en) * | 2005-06-17 | 2009-06-16 | Shmunk Dmitry V | Scalable compressed audio bit stream and codec using a hierarchical filterbank and multichannel joint coding |
CN101061638B (zh) * | 2005-07-07 | 2010-05-19 | 日本电信电话株式会社 | 信号编码器、信号解码器、信号编码方法、信号解码方法和信号编解码方法 |
US7974713B2 (en) | 2005-10-12 | 2011-07-05 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Temporal and spatial shaping of multi-channel audio signals |
JP4876574B2 (ja) | 2005-12-26 | 2012-02-15 | ソニー株式会社 | 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体 |
US8271274B2 (en) | 2006-02-22 | 2012-09-18 | France Telecom | Coding/decoding of a digital audio signal, in CELP technique |
CN101406073B (zh) | 2006-03-28 | 2013-01-09 | 弗劳恩霍夫应用研究促进协会 | 用于多声道音频重构中的信号成形的增强的方法 |
JP2008033269A (ja) * | 2006-06-26 | 2008-02-14 | Sony Corp | デジタル信号処理装置、デジタル信号処理方法およびデジタル信号の再生装置 |
EP1873754B1 (en) | 2006-06-30 | 2008-09-10 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic |
US7873511B2 (en) | 2006-06-30 | 2011-01-18 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic |
MX2008016163A (es) * | 2006-06-30 | 2009-02-04 | Fraunhofer Ges Forschung | Codificador de audio, decodificador de audio y procesador de audio con caracteristicas de warping variable de manera dinamica. |
ATE509347T1 (de) * | 2006-10-20 | 2011-05-15 | Dolby Sweden Ab | Vorrichtung und verfahren zum codieren eines informationssignals |
EP2116997A4 (en) | 2007-03-02 | 2011-11-23 | Panasonic Corp | AUDIO DECODING DEVICE AND AUDIO DECODING METHOD |
KR101261524B1 (ko) | 2007-03-14 | 2013-05-06 | 삼성전자주식회사 | 노이즈를 포함하는 오디오 신호를 저비트율로부호화/복호화하는 방법 및 이를 위한 장치 |
KR101411900B1 (ko) | 2007-05-08 | 2014-06-26 | 삼성전자주식회사 | 오디오 신호의 부호화 및 복호화 방법 및 장치 |
CA2691993C (en) | 2007-06-11 | 2015-01-27 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder for encoding an audio signal having an impulse-like portion and stationary portion, encoding methods, decoder, decoding method, and encoded audio signal |
EP2015293A1 (en) * | 2007-06-14 | 2009-01-14 | Deutsche Thomson OHG | Method and apparatus for encoding and decoding an audio signal using adaptively switched temporal resolution in the spectral domain |
MX2010001394A (es) * | 2007-08-27 | 2010-03-10 | Ericsson Telefon Ab L M | Frecuencia de transicion adaptiva entre llenado de ruido y extension de anchura de banda. |
US8515767B2 (en) * | 2007-11-04 | 2013-08-20 | Qualcomm Incorporated | Technique for encoding/decoding of codebook indices for quantized MDCT spectrum in scalable speech and audio codecs |
CN101221766B (zh) * | 2008-01-23 | 2011-01-05 | 清华大学 | 音频编码器切换的方法 |
EP2269188B1 (en) * | 2008-03-14 | 2014-06-11 | Dolby Laboratories Licensing Corporation | Multimode coding of speech-like and non-speech-like signals |
EP2144231A1 (en) * | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme with common preprocessing |
EP2144230A1 (en) | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme having cascaded switches |
PL2346030T3 (pl) | 2008-07-11 | 2015-03-31 | Fraunhofer Ges Forschung | Koder audio, sposób kodowania sygnału audio oraz program komputerowy |
CA2871498C (en) | 2008-07-11 | 2017-10-17 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder and decoder for encoding and decoding audio samples |
AU2013200679B2 (en) | 2008-07-11 | 2015-03-05 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder and decoder for encoding and decoding audio samples |
WO2010003663A1 (en) | 2008-07-11 | 2010-01-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and decoder for encoding frames of sampled audio signals |
ES2396927T3 (es) * | 2008-07-11 | 2013-03-01 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Aparato y procedimiento para decodificar una señal de audio codificada |
ES2683077T3 (es) | 2008-07-11 | 2018-09-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada |
ES2379761T3 (es) * | 2008-07-11 | 2012-05-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Proporcinar una señal de activación de distorsión de tiempo y codificar una señal de audio con la misma |
KR20100007738A (ko) | 2008-07-14 | 2010-01-22 | 한국전자통신연구원 | 음성/오디오 통합 신호의 부호화/복호화 장치 |
PT2146344T (pt) * | 2008-07-17 | 2016-10-13 | Fraunhofer Ges Forschung | Esquema de codificação/descodificação de áudio com uma derivação comutável |
JP5236006B2 (ja) | 2008-10-17 | 2013-07-17 | シャープ株式会社 | 音声信号調整装置及び音声信号調整方法 |
US8364471B2 (en) * | 2008-11-04 | 2013-01-29 | Lg Electronics Inc. | Apparatus and method for processing a time domain audio signal with a noise filling flag |
GB2466666B (en) * | 2009-01-06 | 2013-01-23 | Skype | Speech coding |
BR122019023704B1 (pt) * | 2009-01-16 | 2020-05-05 | Dolby Int Ab | sistema para gerar um componente de frequência alta de um sinal de áudio e método para realizar reconstrução de frequência alta de um componente de frequência alta |
KR101622950B1 (ko) * | 2009-01-28 | 2016-05-23 | 삼성전자주식회사 | 오디오 신호의 부호화 및 복호화 방법 및 그 장치 |
US8457975B2 (en) * | 2009-01-28 | 2013-06-04 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio decoder, audio encoder, methods for decoding and encoding an audio signal and computer program |
TWI618350B (zh) * | 2009-02-18 | 2018-03-11 | 杜比國際公司 | 用於高頻重建或參數立體聲之複指數調變濾波器組 |
JP4977157B2 (ja) * | 2009-03-06 | 2012-07-18 | 株式会社エヌ・ティ・ティ・ドコモ | 音信号符号化方法、音信号復号方法、符号化装置、復号装置、音信号処理システム、音信号符号化プログラム、及び、音信号復号プログラム |
EP2234103B1 (en) | 2009-03-26 | 2011-09-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Device and method for manipulating an audio signal |
RU2452044C1 (ru) | 2009-04-02 | 2012-05-27 | Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. | Устройство, способ и носитель с программным кодом для генерирования представления сигнала с расширенным диапазоном частот на основе представления входного сигнала с использованием сочетания гармонического расширения диапазона частот и негармонического расширения диапазона частот |
US8391212B2 (en) * | 2009-05-05 | 2013-03-05 | Huawei Technologies Co., Ltd. | System and method for frequency domain audio post-processing based on perceptual masking |
KR20100136890A (ko) * | 2009-06-19 | 2010-12-29 | 삼성전자주식회사 | 컨텍스트 기반의 산술 부호화 장치 및 방법과 산술 복호화 장치 및 방법 |
ES2400661T3 (es) * | 2009-06-29 | 2013-04-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Codificación y decodificación de extensión de ancho de banda |
EP2460158A4 (en) * | 2009-07-27 | 2013-09-04 | METHOD AND APPARATUS FOR PROCESSING AUDIO SIGNAL | |
GB2473266A (en) * | 2009-09-07 | 2011-03-09 | Nokia Corp | An improved filter bank |
GB2473267A (en) * | 2009-09-07 | 2011-03-09 | Nokia Corp | Processing audio signals to reduce noise |
CA2777073C (en) * | 2009-10-08 | 2015-11-24 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Multi-mode audio signal decoder, multi-mode audio signal encoder, methods and computer program using a linear-prediction-coding based noise shaping |
KR101137652B1 (ko) * | 2009-10-14 | 2012-04-23 | 광운대학교 산학협력단 | 천이 구간에 기초하여 윈도우의 오버랩 영역을 조절하는 통합 음성/오디오 부호화/복호화 장치 및 방법 |
CA2862715C (en) * | 2009-10-20 | 2017-10-17 | Ralf Geiger | Multi-mode audio codec and celp coding adapted therefore |
TWI430263B (zh) * | 2009-10-20 | 2014-03-11 | Fraunhofer Ges Forschung | 音訊信號編碼器、音訊信號解碼器、使用混疊抵消來將音訊信號編碼或解碼之方法 |
US8484020B2 (en) * | 2009-10-23 | 2013-07-09 | Qualcomm Incorporated | Determining an upperband signal from a narrowband signal |
US9117458B2 (en) * | 2009-11-12 | 2015-08-25 | Lg Electronics Inc. | Apparatus for processing an audio signal and method thereof |
US8423355B2 (en) * | 2010-03-05 | 2013-04-16 | Motorola Mobility Llc | Encoder for audio signal including generic audio and speech frames |
ES2935637T3 (es) * | 2010-03-09 | 2023-03-08 | Fraunhofer Ges Forschung | Reconstrucción de alta frecuencia de una señal de audio de entrada usando bancos de filtros en cascada |
EP2375409A1 (en) | 2010-04-09 | 2011-10-12 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder and related methods for processing multi-channel audio signals using complex prediction |
BR112012026324B1 (pt) * | 2010-04-13 | 2021-08-17 | Fraunhofer - Gesellschaft Zur Förderung Der Angewandten Forschung E. V | Codificador de aúdio ou vídeo, decodificador de aúdio ou vídeo e métodos relacionados para o processamento do sinal de aúdio ou vídeo de múltiplos canais usando uma direção de previsão variável |
US8886523B2 (en) * | 2010-04-14 | 2014-11-11 | Huawei Technologies Co., Ltd. | Audio decoding based on audio class with control code for post-processing modes |
CN101964189B (zh) | 2010-04-28 | 2012-08-08 | 华为技术有限公司 | 语音频信号切换方法及装置 |
WO2011156905A2 (en) * | 2010-06-17 | 2011-12-22 | Voiceage Corporation | Multi-rate algebraic vector quantization with supplemental coding of missing spectrum sub-bands |
EP4398246A2 (en) * | 2010-07-08 | 2024-07-10 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Decoder using forward aliasing cancellation |
BR112012024360B1 (pt) * | 2010-07-19 | 2020-11-03 | Dolby International Ab | sistema configurado para gerar uma pluralidade de sinais de áudio de sub-banda de alta frequência, decodificador de áudio, codificador, método para gerar uma pluralidade de sinais de sub-banda de alta frequência, método para decodificar um fluxo de bits, método para gerar dados de controle a partir de um sinal de áudio e meio de armazenamento |
US8560330B2 (en) * | 2010-07-19 | 2013-10-15 | Futurewei Technologies, Inc. | Energy envelope perceptual correction for high band coding |
US9047875B2 (en) * | 2010-07-19 | 2015-06-02 | Futurewei Technologies, Inc. | Spectrum flatness control for bandwidth extension |
JP5749462B2 (ja) * | 2010-08-13 | 2015-07-15 | 株式会社Nttドコモ | オーディオ復号装置、オーディオ復号方法、オーディオ復号プログラム、オーディオ符号化装置、オーディオ符号化方法、及び、オーディオ符号化プログラム |
KR101826331B1 (ko) * | 2010-09-15 | 2018-03-22 | 삼성전자주식회사 | 고주파수 대역폭 확장을 위한 부호화/복호화 장치 및 방법 |
RU2562384C2 (ru) * | 2010-10-06 | 2015-09-10 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Способ и устройство для обработки аудио сигнала и для обеспечения большей детализации во времени для комбинированного унифицированного кодека речи и аудио (usac) |
WO2012048472A1 (en) * | 2010-10-15 | 2012-04-19 | Huawei Technologies Co., Ltd. | Signal analyzer, signal analyzing method, signal synthesizer, signal synthesizing method, windower, transformer and inverse transformer |
WO2012076689A1 (en) | 2010-12-09 | 2012-06-14 | Dolby International Ab | Psychoacoustic filter design for rational resamplers |
FR2969805A1 (fr) * | 2010-12-23 | 2012-06-29 | France Telecom | Codage bas retard alternant codage predictif et codage par transformee |
CA2929800C (en) * | 2010-12-29 | 2017-12-19 | Samsung Electronics Co., Ltd. | Apparatus and method for encoding/decoding for high-frequency bandwidth extension |
JP2012242785A (ja) | 2011-05-24 | 2012-12-10 | Sony Corp | 信号処理装置、信号処理方法、およびプログラム |
DE102011106033A1 (de) * | 2011-06-30 | 2013-01-03 | Zte Corporation | Verfahren und System zur Audiocodierung und -decodierung und Verfahren zur Schätzung des Rauschpegels |
US9037456B2 (en) * | 2011-07-26 | 2015-05-19 | Google Technology Holdings LLC | Method and apparatus for audio coding and decoding |
CN102543090B (zh) * | 2011-12-31 | 2013-12-04 | 深圳市茂碧信息科技有限公司 | 一种应用于变速率语音和音频编码的码率自动控制系统 |
US9043201B2 (en) * | 2012-01-03 | 2015-05-26 | Google Technology Holdings LLC | Method and apparatus for processing audio frames to transition between different codecs |
CN103428819A (zh) | 2012-05-24 | 2013-12-04 | 富士通株式会社 | 一种载波频点搜索方法和装置 |
US9552818B2 (en) * | 2012-06-14 | 2017-01-24 | Dolby International Ab | Smooth configuration switching for multichannel audio rendering based on a variable number of received channels |
US9589570B2 (en) | 2012-09-18 | 2017-03-07 | Huawei Technologies Co., Ltd. | Audio classification based on perceptual quality for low or medium bit rates |
RU2660605C2 (ru) * | 2013-01-29 | 2018-07-06 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Концепция заполнения шумом |
US9741350B2 (en) | 2013-02-08 | 2017-08-22 | Qualcomm Incorporated | Systems and methods of performing gain control |
BR112015019543B1 (pt) | 2013-02-20 | 2022-01-11 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Aparelho para codificar um sinal de áudio, descodificador para descodificar um sinal de áudio, método para codificar e método para descodificar um sinal de áudio |
BR112015029574B1 (pt) * | 2013-06-11 | 2021-12-21 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Aparelho e método de decodificação de sinal de áudio. |
EP2830064A1 (en) * | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for decoding and encoding an audio signal using adaptive spectral tile selection |
CN104517610B (zh) * | 2013-09-26 | 2018-03-06 | 华为技术有限公司 | 频带扩展的方法及装置 |
FR3011408A1 (fr) * | 2013-09-30 | 2015-04-03 | Orange | Re-echantillonnage d'un signal audio pour un codage/decodage a bas retard |
PL3336840T3 (pl) * | 2013-10-31 | 2020-04-30 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Dekoder audio i sposób dostarczania zdekodowanej informacji audio z wykorzystaniem maskowania błędów modyfikującego sygnał pobudzenia w dziedzinie czasu |
FR3013496A1 (fr) * | 2013-11-15 | 2015-05-22 | Orange | Transition d'un codage/decodage par transformee vers un codage/decodage predictif |
US20150149157A1 (en) | 2013-11-22 | 2015-05-28 | Qualcomm Incorporated | Frequency domain gain shape estimation |
FR3017484A1 (fr) * | 2014-02-07 | 2015-08-14 | Orange | Extension amelioree de bande de frequence dans un decodeur de signaux audiofrequences |
CN103905834B (zh) | 2014-03-13 | 2017-08-15 | 深圳创维-Rgb电子有限公司 | 音频数据编码格式转换的方法及装置 |
MX353200B (es) * | 2014-03-14 | 2018-01-05 | Ericsson Telefon Ab L M | Método y aparato de codificación de audio. |
US9583115B2 (en) * | 2014-06-26 | 2017-02-28 | Qualcomm Incorporated | Temporal gain adjustment based on high-band signal characteristic |
FR3023036A1 (fr) * | 2014-06-27 | 2016-01-01 | Orange | Re-echantillonnage par interpolation d'un signal audio pour un codage / decodage a bas retard |
EP2980795A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor |
EP2980794A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and decoder using a frequency domain processor and a time domain processor |
FR3024582A1 (fr) * | 2014-07-29 | 2016-02-05 | Orange | Gestion de la perte de trame dans un contexte de transition fd/lpd |
-
2014
- 2014-07-28 EP EP14178817.4A patent/EP2980794A1/en not_active Withdrawn
-
2015
- 2015-07-22 TW TW104123735A patent/TWI570710B/zh active
- 2015-07-24 EP EP19160134.3A patent/EP3511936B1/en active Active
- 2015-07-24 CN CN202111184555.2A patent/CN113948100A/zh active Pending
- 2015-07-24 BR BR122022012519-0A patent/BR122022012519B1/pt active IP Right Grant
- 2015-07-24 BR BR112017001297A patent/BR112017001297A2/pt not_active Application Discontinuation
- 2015-07-24 CN CN202111184561.8A patent/CN113963705A/zh active Pending
- 2015-07-24 TR TR2019/08602T patent/TR201908602T4/tr unknown
- 2015-07-24 SG SG11201700685XA patent/SG11201700685XA/en unknown
- 2015-07-24 RU RU2017105448A patent/RU2671997C2/ru active
- 2015-07-24 CN CN201580049740.7A patent/CN107077858B/zh active Active
- 2015-07-24 PT PT15739300T patent/PT3186809T/pt unknown
- 2015-07-24 CN CN202111184409.XA patent/CN113963704A/zh active Pending
- 2015-07-24 ES ES19160134T patent/ES2972128T3/es active Active
- 2015-07-24 WO PCT/EP2015/067003 patent/WO2016016123A1/en active Application Filing
- 2015-07-24 PL PL15739300T patent/PL3186809T3/pl unknown
- 2015-07-24 CN CN202111184553.3A patent/CN113936675A/zh active Pending
- 2015-07-24 AU AU2015295605A patent/AU2015295605B2/en active Active
- 2015-07-24 ES ES15739300T patent/ES2733207T3/es active Active
- 2015-07-24 PL PL19160134.3T patent/PL3511936T3/pl unknown
- 2015-07-24 BR BR122022012616-2A patent/BR122022012616B1/pt active IP Right Grant
- 2015-07-24 KR KR1020177005491A patent/KR102009210B1/ko active IP Right Grant
- 2015-07-24 EP EP15739300.0A patent/EP3186809B1/en active Active
- 2015-07-24 BR BR122022012517-4A patent/BR122022012517B1/pt active IP Right Grant
- 2015-07-24 MY MYPI2017000132A patent/MY187280A/en unknown
- 2015-07-24 BR BR122022012700-2A patent/BR122022012700B1/pt active IP Right Grant
- 2015-07-24 EP EP23184408.5A patent/EP4239634A1/en active Pending
- 2015-07-24 JP JP2017504785A patent/JP6549217B2/ja active Active
- 2015-07-24 MX MX2017001235A patent/MX362424B/es active IP Right Grant
- 2015-07-24 CN CN202111184563.7A patent/CN113963706A/zh active Pending
- 2015-07-24 CA CA2955095A patent/CA2955095C/en active Active
- 2015-07-28 AR ARP150102398A patent/AR101344A1/es active IP Right Grant
-
2017
- 2017-01-24 US US15/414,427 patent/US10332535B2/en active Active
-
2019
- 2019-02-26 US US16/286,397 patent/US11049508B2/en active Active
- 2019-06-26 JP JP2019117964A patent/JP6941643B2/ja active Active
-
2021
- 2021-02-22 JP JP2021026052A patent/JP7228607B2/ja active Active
- 2021-06-01 US US17/336,132 patent/US20210287689A1/en active Pending
-
2023
- 2023-01-23 US US18/158,035 patent/US11929084B2/en active Active
- 2023-02-13 JP JP2023019921A patent/JP2023053255A/ja active Pending
- 2023-08-25 US US18/455,738 patent/US20230402046A1/en active Pending
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2017105448A (ru) | Кодер и декодер аудиосигнала, использующие процессор частотной области с заполнением промежутка в полной полосе и процессор временной области | |
RU2017106099A (ru) | Кодер и декодер аудиосигнала , использующие процессор частотной области, процессор временной области и кросспроцессор для непрерывной инициализации | |
JP6173288B2 (ja) | マルチモードオーディオコーデックおよびそれに適応されるcelp符号化 | |
TWI488177B (zh) | 使用頻譜域雜訊整形之基於線性預測的編碼方案 | |
KR100859881B1 (ko) | 음성 신호 코딩 | |
US9583110B2 (en) | Apparatus and method for processing a decoded audio signal in a spectral domain | |
TWI423252B (zh) | 多模式音訊信號解碼器、多模式音訊信號編碼器、使用基於線性預測編碼之雜訊塑形的方法與電腦程式 | |
EP2209114B1 (en) | Speech coding/decoding apparatus/method | |
JP6396459B2 (ja) | 周波数領域における時間的予備整形雑音の挿入によるオーディオ帯域幅拡張 | |
KR101407120B1 (ko) | 오디오 신호를 처리하고 결합된 통합형 음성 및 오디오 코덱(usac)을 위한 보다 높은 시간적 입도를 제공하기 위한 장치 및 방법 | |
JP2022110116A (ja) | オーディオエンコーダ、オーディオデコーダ、オーディオ信号を符号化する方法、および符号化されたオーディオ信号を復号化する方法 | |
JP6113278B2 (ja) | 改良された確率分布推定を使用する線形予測に基づくオーディオ符号化 | |
KR20070051910A (ko) | 스케일러블 부호화 장치, 스케일러블 복호화 장치,스케일러블 부호화 방법, 스케일러블 복호화 방법, 통신단말 장치 및 기지국 장치 | |
JPH08123495A (ja) | 広帯域音声復元装置 | |
TW201246192A (en) | Sound signal coding method, sound signal decoding method, coding device, decoding device, sound signal processing system, sound signal coding program, and sound signal decoding program | |
RU2463674C2 (ru) | Кодирующее устройство и способ кодирования | |
US9984699B2 (en) | High-band signal coding using mismatched frequency ranges | |
JP2008502022A (ja) | オーディオ符号化 | |
CN102714040A (zh) | 编码装置、解码装置、频谱变动量计算方法和频谱振幅调整方法 | |
EP2133872A1 (en) | Encoding device and encoding method | |
DK3040988T3 (en) | AUDIO DECODING BASED ON AN EFFECTIVE REPRESENTATION OF AUTOREGRESSIVE COEFFICIENTS | |
JP3144009B2 (ja) | 音声符号復号化装置 | |
Fuchs et al. | MDCT-based coder for highly adaptive speech and audio coding | |
Żernicki et al. | Enhanced coding of high-frequency tonal components in MPEG-D USAC through joint application of ESBR and sinusoidal modeling | |
US9524727B2 (en) | Method and arrangement for scalable low-complexity coding/decoding |