RU2022106060A - Обработка аудиоданных на основе карты направленной громкости - Google Patents
Обработка аудиоданных на основе карты направленной громкости Download PDFInfo
- Publication number
- RU2022106060A RU2022106060A RU2022106060A RU2022106060A RU2022106060A RU 2022106060 A RU2022106060 A RU 2022106060A RU 2022106060 A RU2022106060 A RU 2022106060A RU 2022106060 A RU2022106060 A RU 2022106060A RU 2022106060 A RU2022106060 A RU 2022106060A
- Authority
- RU
- Russia
- Prior art keywords
- signals
- audio
- encoded
- audio encoder
- directional loudness
- Prior art date
Links
- 230000005236 sound signal Effects 0.000 claims 49
- 238000000034 method Methods 0.000 claims 15
- 230000003595 spectral effect Effects 0.000 claims 8
- 238000013139 quantization Methods 0.000 claims 5
- 238000007405 data analysis Methods 0.000 claims 4
- 230000000694 effects Effects 0.000 claims 2
- 230000000873 masking effect Effects 0.000 claims 2
- 238000004458 analytical method Methods 0.000 claims 1
- 238000004590 computer program Methods 0.000 claims 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/173—Transcoding, i.e. converting between two coded representations avoiding cascaded coding-decoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/69—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for evaluating synthetic or decoded voice signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/20—Arrangements for obtaining desired frequency or directional characteristics
- H04R1/22—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired frequency characteristic only
- H04R1/26—Spatial arrangements of separate transducers responsive to two or more frequency ranges
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/04—Circuits for transducers, loudspeakers or microphones for correcting frequency response
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Otolaryngology (AREA)
- Mathematical Physics (AREA)
- Stereophonic System (AREA)
Claims (97)
1. Аудиокодер (300) для кодирования (310) входного аудиосодержимого (112), содержащего один или более входных аудиосигналов (112, 1121, 1122, 1123, 112a, 112b),
причем аудиокодер (300) выполнен с возможностью обеспечения одного или более кодированных аудиосигналов (320) на основе одного или более входных аудиосигналов (112, 1121, 1122, 1123, 112a, 112b) или одного или более полученных из них сигналов (110, 1101, 1102, 110a, 110b);
причем аудиокодер (300) выполнен с возможностью адаптации (340) параметров кодирования в зависимости от одной или более карт направленной громкости, которые представляют информацию (142, 1421, 1422, 142a, 142b) о громкости, ассоциированную с множеством различных направлений (121), из одного или более подлежащих кодированию сигналов.
2. Аудиокодер (300) по п. 1, причем аудиокодер (300) выполнен с возможностью адаптации (340) распределения битов между одним или более сигналами и/или параметрами, подлежащими кодированию, в зависимости от вкладов отдельных карт направленной громкости одного или более сигналов и/или параметров, подлежащих кодированию, в общую карту (142, 1421, 1422, 142a, 142b) направленной громкости.
3. Аудиокодер (300) по п. 1, причем аудиокодер (300) выполнен с возможностью запрещения кодирования (310) определённого одного из подлежащих кодированию сигналов, когда вклады отдельной карты направленной громкости определённого одного из подлежащих кодированию сигналов в общую карту направленной громкости ниже порогового значения.
4. Аудиокодер (300) по п. 1, причем аудиокодер (300) выполнен с возможностью адаптации (342) точности квантования одного или более подлежащих кодированию сигналов в зависимости от вкладов отдельных карт направленной громкости одного или более подлежащих кодированию сигналов в общую карту направленной громкости.
5. Аудиокодер (300) по п. 1, причем аудиокодер (300) выполнен с возможностью квантования (312) представлений (110, 1101, 1102, 110a, 110b) в спектральной области одного или более входных аудиосигналов (112, 1121, 1122, 1123, 112a, 112b) или одного или более полученных из них сигналов (110, 1101, 1102, 110a, 110b) с использованием одного или более параметров квантования для получения одного или более квантованных представлений (313) в спектральной области;
причем аудиокодер (300) выполнен с возможностью регулирования (342) одного или более параметров квантования в зависимости от одной или более карт направленной громкости, которые представляют информацию (142, 1421, 1422, 142a, 142b) о громкости, ассоциированную с множеством различных направлений (121) одного или более подлежащих квантованию сигналов для адаптации формирования одного или более кодированных аудиосигналов (320); и
причем аудиокодер (300) выполнен с возможностью кодирования одного или более квантованных представлений (313) в спектральной области для получения одного или более кодированных аудиосигналов (320).
6. Аудиокодер (300) по п. 5, причем аудиокодер (300) выполнен с возможностью регулирования (342) одного или более параметров квантования в зависимости от вкладов отдельных карт направленной громкости одного или более подлежащих квантованию сигналов в общую карту направленной громкости.
7. Аудиокодер (300) по п. 5, причем аудиокодер (300) выполнен с возможностью определения общей карты направленной громкости на основе входных аудиосигналов (112, 1121, 1122, 1123, 112a, 112b) таким образом, что общая карта направленной громкости представляет информацию (142, 1421, 1422, 142a, 142b) о громкости, ассоциированную с различными направлениями (121) аудиосцены, представленной входными аудиосигналами (112, 1121, 1122, 1123, 112a, 112b).
8. Аудиокодер (300) по п. 5, в котором один или более подлежащих квантованию сигналов ассоциированы с различными направлениями (121), или ассоциированы с различными громкоговорителям, или ассоциированы с различными звуковыми объектами.
9. Аудиокодер (300) по п. 5, в котором подлежащие квантованию сигналы содержат компоненты совместного многосигнального кодирования двух или более входных аудиосигналов (112, 1121, 1122, 1123, 112a, 112b).
10. Аудиокодер (300) по п. 5, причем аудиокодер (300) выполнен с возможностью оценки вклада разностного сигнала совместного многосигнального кодирования в общую карту направленной громкости и регулирования (342) в зависимости от него одного или более параметров квантования.
11. Аудиокодер (300) по п. 1, причем аудиокодер (300) выполнен с возможностью адаптации (340) распределения битов между одним или более сигналами и/или параметрами, подлежащими кодированию отдельно для различных спектральных интервалов или отдельно для различных частотных полос; и/или
причем аудиокодер (300) выполнен с возможностью адаптации (342) точности квантования одного или более подлежащих кодированию сигналов отдельно для различных спектральных интервалов или отдельно для различных частотных полос.
12. Аудиокодер (300) по п. 1,
причем аудиокодер (300) выполнен с возможностью адаптации (340) распределения битов между одним или более сигналами и/или параметрами, подлежащими кодированию в зависимости от оценки пространственного маскирования между двумя или более подлежащими кодированию сигналами,
причем аудиокодер (300) выполнен с возможностью оценки пространственного маскирования на основе карт направленной громкости, ассоциированных с двумя или более подлежащими кодированию сигналами.
13. Аудиокодер (300) по п. 12, причем аудиокодер (300) выполнен с возможностью оценки эффекта маскирования вклада (132, 1321, 1322, 1351, 1352) громкости, ассоциированного с первым направлением первого подлежащего кодированию сигнала, на вклад (132, 1321, 1322, 1351, 1352) громкости, ассоциированный со вторым направлением второго подлежащего кодированию сигнала.
14. Аудиокодер (300) по п. 1, причем аудиокодер (300) содержит модуль (100) анализа аудиоданных,
причем модуль (100) анализа аудиоданных выполнен с возможностью получения представлений (110, 1101, 1102, 110a, 110b) в спектральной области двух или более входных аудиосигналов (112, 1121, 1122, 1123, 112a, 112b);
причем модуль (100) анализа аудиоданных выполнен с возможностью получения информации (122, 1221, 1222, 125, 127) о направлении, ассоциированной со спектральными полосами представлений (110, 1101, 1102, 110a, 110b) в спектральной области;
причем модуль (100) анализа аудиоданных выполнен с возможностью получения информации (142, 1421, 1422, 142a, 142b) о громкости, ассоциированной с различными направлениями (121), в качестве результата анализа,
причем вклады (132, 1321, 1322, 1351, 1352) в информацию (142, 1421, 1422, 142a, 142b) о громкости определяются в зависимости от информации (122, 1221, 1222, 125, 127) о направлении;
причём информация (142, 1421, 1422, 142a, 142b) о громкости, ассоциированная с различными направлениями (121), формирует карту направленной громкости.
15. Аудиокодер (300) по п. 1,
причем аудиокодер (300) выполнен с возможностью адаптации (340) шума, вносимого кодером, в зависимости от одной или более карт направленной громкости.
16. Аудиокодер (300) по п. 15,
причем аудиокодер (300) выполнен с возможностью использования отклонения между картой направленной громкости, которая ассоциирована с определённым не кодированным входным аудиосигналом, и картой направленной громкости, достижимой кодированной версией определённого входного аудиосигнала, в качестве критерия адаптации формирования определённого кодированного аудиосигнала.
17. Аудиокодер (300) по п. 1,
причем аудиокодер (300) выполнен с возможностью активации и деактивации инструмента совместного кодирования в зависимости от одной или более карт направленной громкости, которые представляют информацию (142, 1421, 1422, 142a, 142b) о громкости, ассоциированную с множеством различных направлений (121) одного или более подлежащих кодированию сигналов.
18. Аудиокодер (300) по п. 1,
причем аудиокодер (300) выполнен с возможностью определения одного или более параметров инструмента совместного кодирования в зависимости от одной или более карт направленной громкости, которые представляют информацию (142, 1421, 1422, 142a, 142b) о громкости, ассоциированную с множеством различных направлений (121) одного или более подлежащих кодированию сигналов.
19. Аудиокодер (300) по п. 1, причем аудиокодер (300) выполнен с возможностью определения или оценки влияния вариации одного или более управляющих параметров, управляющих обеспечением одного или более кодированных аудиосигналов (320), на карту направленной громкости одного или более кодированных сигналов и регулирования одного или более управляющих параметров в зависимости от определения или оценки влияния.
20. Аудиокодер (300) по п. 1,
причем аудиокодер (300) выполнен с возможностью получения компонента направления, используемого для получения одной или более карт направленной громкости, с использованием метаданных, представляющих информацию о положении громкоговорителей, ассоциированных с входными аудиосигналами (112, 1121, 1122, 1123, 112a, 112b).
21. Аудиокодер (300) для кодирования (310) входного аудиосодержимого (112), содержащего один или более входных аудиосигналов (112, 1121, 1122, 1123, 112a, 112b),
причем аудиокодер (300) выполнен с возможностью обеспечения одного или более кодированных аудиосигналов (320) на основе двух или более входных аудиосигналов (112, 1121, 1122, 1123, 112a, 112b) или на основе двух или более полученных из них сигналов (110, 1101, 1102, 110a, 110b) с использованием совместного кодирования (310) двух или более подлежащих совместному кодированию сигналов;
причем аудиокодер (300) выполнен с возможностью выбора (350) подлежащих совместному кодированию сигналов из множества возможных сигналов (110, 1101, 1102) или из множества пар возможных сигналов (110, 1101, 1102) в зависимости от карт направленной громкости, которые представляют информацию (142, 1421, 1422, 142a, 142b), ассоциированную с множеством различных направлений (121) возможных сигналов (110, 1101, 1102) или пар возможных сигналов (110, 1101, 1102).
22. Аудиокодер (300) по п. 21,
причем аудиокодер (300) выполнен с возможностью выбора (350) подлежащих совместному кодированию сигналов из множества возможных сигналов (110, 1101, 1102) или из множества пар возможных сигналов (110, 1101, 1102) в зависимости от вкладов отдельных карт направленной громкости возможных сигналов (110, 1101, 1102) в общую карту направленной громкости или в зависимости от вкладов карт направленной громкости пар возможных сигналов (110, 1101, 1102) в общую карту направленной громкости.
23. Аудиокодер (300) по п. 21,
причем аудиокодер (300) выполнен с возможностью определения вклада пар возможных сигналов (110, 1101, 1102) в общую карту направленной громкости; и
причем аудиокодер (300) выполнен с возможностью выбора одной или более пар возможных сигналов (110, 1101, 1102), имеющих наиболее высокий вклад в общую карту направленной громкости, для совместного кодирования (310), или
причем аудиокодер (300) выполнен с возможностью выбора одной или более пар возможных сигналов (110, 1101, 1102), вклад которых в общую карту направленной громкости больше заданного порогового значения, для совместного кодирования (310).
24. Аудиокодер (300) по п. 21,
причем аудиокодер (300) выполнен с возможностью определения отдельных карт направленной громкости двух или более возможных сигналов (110, 1101, 1102), и
причем аудиокодер (300) выполнен с возможностью сравнения отдельных карт направленной громкости двух или более возможных сигналов (110, 1101, 1102), и
причем аудиокодер (300) выполнен с возможностью выбора (350) двух или более из возможных сигналов (110, 1101, 1102) для совместного кодирования (310) в зависимости от результата сравнения.
25. Аудиокодер (300) по п. 21,
причем аудиокодер (300) выполнен с возможностью определения общей карты направленной громкости с использованием понижающего микширования входных аудиосигналов (112, 1121, 1122, 1123, 112a, 112b) или с использованием бинаурализации входных аудиосигналов (112, 1121, 1122, 1123, 112a, 112b).
26. Аудиокодер (300) для кодирования (310) входного аудиосодержимого (112), содержащего один или более входных аудиосигналов (112, 1121, 1122, 1123, 112a, 112b),
причем аудиокодер (300) выполнен с возможностью обеспечения одного или более кодированных аудиосигналов (320) на основе двух или более входных аудиосигналов (112, 1121, 1122, 1123, 112a, 112b) или на основе двух или более полученных из них сигналов (110, 1101, 1102, 110a, 110b);
причем аудиокодер (300) выполнен с возможностью определения общей карты направленной громкости на основе входных аудиосигналов (112, 1121, 1122, 1123, 112a, 112b) и/или определять одну или более отдельных карт направленной громкости, ассоциированных с отдельными входными аудиосигналами (112, 1121, 1122, 1123, 112a, 112b); и
причем аудиокодер (300) выполнен с возможностью кодирования общей карты направленной громкости и/или одной или более отдельных карт направленной громкости в качестве вспомогательной информации.
27. Аудиокодер (300) по п. 26,
причем аудиокодер (300) выполнен с возможностью определения общей карты направленной громкости на основе входных аудиосигналов (112, 1121, 1122, 1123, 112a, 112b) таким образом, что общая карта направленной громкости представляет информацию (142, 1421, 1422, 142a, 142b) о громкости, ассоциированную с различными направлениями (121) аудиосцены, представленной входными аудиосигналами (112, 1121, 1122, 1123, 112a, 112b).
28. Аудиокодер (300) по п. 26,
причем аудиокодер (300) выполнен с возможностью кодирования общей карты направленной громкости в виде множества значений, ассоциированных с различными направлениями (121); или
причем аудиокодер (300) выполнен с возможностью кодирования общей карты направленной громкости с использованием значения центрального положения и информации о градиенте; или
причем аудиокодер (300) выполнен с возможностью кодирования общей карты направленной громкости в виде полиномиального представления; или
причем аудиокодер (300) выполнен с возможностью кодирования общей карты направленной громкости в виде сплайнового представления.
29. Аудиокодер (300) по п. 26,
причем аудиокодер (300) выполнен с возможностью кодирования одного микшированного с понижением сигнала, полученного на основе множества входных аудиосигналов (112, 1121, 1122, 1123, 112a, 112b) и общей карты направленной громкости; или
причем аудиокодер (300) выполнен с возможностью кодирования множества сигналов и кодирования отдельных карты направленной громкости множества кодируемых сигналов; или
причем аудиокодер (300) выполнен с возможностью кодирования общей карты направленной громкости, множества сигналов и параметров, описывающих вклады кодируемых сообщений в общую карту направленной громкости.
30. Аудиодекодер (400) для декодирования (410) кодированного аудиосодержимого (420),
причем аудиодекодер (400) выполнен с возможностью приёма кодированного представления (420) одного или более аудиосигналов и обеспечения декодированного представления (432) одного или более аудиосигналов;
причем аудиодекодер (400) выполнен с возможностью приёма кодированной информации (424) о картах направленной громкости и декодирования кодированной информации (424) о картах направленной громкости для получения одной или более карт (414) направленной громкости; и
причем аудиодекодер (400) выполнен с возможностью воссоздания (430) аудиосцены с использованием декодированного представления (432) одного или более аудиосигналов и с использованием одной или более карт направленной громкости.
31. Аудиодекодер (400) по п. 30, причем аудиодекодер (400) выполнен с возможностью получения выходных сигналов таким образом, что одна или более карт направленной громкости, ассоциированных с выходными сигналами, приблизительно равны или равны одной или более целевым картам направленной громкости,
причем одна или более целевых карт направленной громкости основаны на одной или более декодированных картах (414) направленной громкости или равны одной или более декодированным картам (414) направленной громкости.
32. Аудиодекодер (400) по п. 30,
причем аудиодекодер (400) выполнен с возможностью приёма
- одного кодированного микшированного с понижением сигнала и общей карты направленной громкости; или
- множества кодированных аудиосигналов (422) и отдельных карт направленной громкости множества кодированных сигналов; или
- общей карты направленной громкости, множества кодированных аудиосигналов (422) и параметров, описывающих вклады кодированных аудиосигналов (422) в общую карту направленной громкости; и
причем аудиодекодер (400) выполнен с возможностью обеспечения на их основе выходных сигналов.
33. Способ (3000) кодирования входного аудиосодержимого, содержащего один или более входных аудиосигналов,
причем способ содержит этап, на котором обеспечивают (3100) один или более кодированных аудиосигналов на основе одного или более входных аудиосигналов или одного или более полученных из них сигналов; и
причем способ содержит этап, на котором адаптируют (3200) формирование одного или более кодированных аудиосигналов в зависимости от одной или более карт направленной громкости, которые представляют информацию о громкости, ассоциированную с множеством различных направлений одного или более подлежащих кодированию сигналов.
34. Способ (4000) кодирования входного аудиосодержимого, содержащего один или более входных аудиосигналов,
причем способ содержит этап, на котором обеспечивают (4100) один или более кодированных аудиосигналов на основе двух или более входных аудиосигналов или на основе двух или более полученных из них сигналов с использованием совместного кодирования двух или более подлежащих совместному кодированию сигналов; и
причем способ содержит выбор (4200) сигналов, подлежащих совместному кодированию, из множества возможных сигналов или из множества пар возможных сигналов в зависимости от карт направленной громкости, которые представляют информацию о громкости, ассоциированную с множеством различных направлений возможных сигналов или пар возможных сигналов.
35. Способ (5000) кодирования входного аудиосодержимого, содержащего один или более входных аудиосигналов,
причем способ содержит этап, на котором обеспечивают (5100) один или более кодированных аудиосигналов на основе двух или более входных аудиосигналов или на основе двух или более полученных из них сигналов;
причем способ содержит этап, на котором определяют (5200) общую карту направленной громкости на основе входных аудиосигналов и/или определяют одну или более отдельных карт направленной громкости, ассоциированных с отдельными входными аудиосигналами; и
причем способ содержит этап, на котором кодируют (5300) общую карту направленной громкости и/или одну или более отдельных карт направленной громкости в качестве вспомогательной информации.
36. Способ (6000) декодирования кодированного аудиосодержимого,
причем способ содержит этапы, на которых принимают (6100) кодированное представление одного или более аудиосигналов и обеспечивают (6200) декодированное представление одного или более аудиосигналов;
причем способ содержит этапы, на которых принимают (6300) кодированную информацию о картах направленной громкости и декодируют (6400) кодированную информацию о картах направленной громкости для получения (6500) одной или более карт направленной громкости; и
причем способ содержит этап, на котором воссоздают (6600) аудиосцену с использованием декодированного представления одного или более аудиосигналов и используют одну или более карт направленной громкости.
37. Компьютерная программа, имеющая программный код для выполнения способа по п. 33 или 34? или 35 при его выполнении на компьютере.
38. Кодированное звуковое представление, содержащее
кодированное представление одного или более аудиосигналов; и
кодированную информацию о картах направленной громкости.
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP18202945.4 | 2018-10-26 | ||
EP18202945 | 2018-10-26 | ||
EP19169684.8 | 2019-04-16 | ||
EP19169684 | 2019-04-16 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2021114678A Division RU2771833C1 (ru) | 2018-10-26 | 2019-10-28 | Обработка аудиоданных на основе карты направленной громкости |
Publications (2)
Publication Number | Publication Date |
---|---|
RU2022106060A true RU2022106060A (ru) | 2022-04-04 |
RU2798019C2 RU2798019C2 (ru) | 2023-06-14 |
Family
ID=
Also Published As
Publication number | Publication date |
---|---|
RU2022106058A (ru) | 2022-04-05 |
EP4220639A1 (en) | 2023-08-02 |
JP2022505964A (ja) | 2022-01-14 |
US20210383820A1 (en) | 2021-12-09 |
JP2022177253A (ja) | 2022-11-30 |
CN113302692A (zh) | 2021-08-24 |
EP3871216A1 (en) | 2021-09-01 |
EP4213147A1 (en) | 2023-07-19 |
WO2020084170A1 (en) | 2020-04-30 |
BR112021007807A2 (pt) | 2021-07-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6600004B2 (ja) | マルチチャンネル信号を符号化又は復号化するための装置と方法 | |
JP6585128B2 (ja) | 無相関化信号の寄与の残差信号ベースの調整を用いたマルチチャンネルオーディオデコーダ、マルチチャンネルオーディオエンコーダ、方法およびコンピュータプログラム | |
US7573912B2 (en) | Near-transparent or transparent multi-channel encoder/decoder scheme | |
JP6573640B2 (ja) | オーディオ・エンコーダおよびデコーダ | |
KR101449434B1 (ko) | 복수의 가변장 부호 테이블을 이용한 멀티 채널 오디오를부호화/복호화하는 방법 및 장치 | |
RU2379832C2 (ru) | Энтропийное кодирование с помощью компактных кодовых книг | |
US20100014679A1 (en) | Multi-channel encoding and decoding method and apparatus | |
US9293146B2 (en) | Intensity stereo coding in advanced audio coding | |
JP2009516861A (ja) | マルチチャンネルオーディオ信号のエンコーディング/デコーディングシステム、記録媒体及び方法 | |
KR20100105496A (ko) | 멀티 채널 신호의 부호화/복호화 장치 및 방법 | |
RU2007142177A (ru) | Адаптивное остаточное аудиокодирование | |
RU2016137197A (ru) | Устройство кодирования и способ кодирования, устройство декодирования и способ декодирования, и программа | |
US8665945B2 (en) | Encoding method, decoding method, encoding device, decoding device, program, and recording medium | |
CA2604521A1 (en) | Lossless encoding of information with guaranteed maximum bitrate | |
FI3405950T3 (fi) | Stereoaudiokoodaus ILD-pohjaisella normalisoinnilla ennen keski/sivupäätöstä | |
JP6804666B2 (ja) | マルチチャネル信号符号化方法、マルチチャネル信号復号化方法、符号器、及び復号器 | |
WO2015186535A1 (ja) | オーディオ信号処理装置および方法、符号化装置および方法、並びにプログラム | |
JP2006113294A (ja) | 音響信号符号化装置及び音響信号復号装置 | |
ES2838006T3 (es) | Codificación de señal de sonido | |
US20080059203A1 (en) | Audio Encoding Device, Decoding Device, Method, and Program | |
RU2022106060A (ru) | Обработка аудиоданных на основе карты направленной громкости | |
JP6906570B2 (ja) | 符号化されたオーディオ信号を処理するための装置および方法 | |
Lindblom et al. | Flexible sum-difference stereo coding based on time-aligned signal components | |
CN109427338B (zh) | 立体声信号的编码方法和编码装置 | |
JP2002132295A (ja) | ステレオオーディオ信号高能率符号化装置 |