RU2022106060A - Обработка аудиоданных на основе карты направленной громкости - Google Patents

Обработка аудиоданных на основе карты направленной громкости Download PDF

Info

Publication number
RU2022106060A
RU2022106060A RU2022106060A RU2022106060A RU2022106060A RU 2022106060 A RU2022106060 A RU 2022106060A RU 2022106060 A RU2022106060 A RU 2022106060A RU 2022106060 A RU2022106060 A RU 2022106060A RU 2022106060 A RU2022106060 A RU 2022106060A
Authority
RU
Russia
Prior art keywords
signals
audio
encoded
audio encoder
directional loudness
Prior art date
Application number
RU2022106060A
Other languages
English (en)
Other versions
RU2798019C2 (ru
Inventor
Юрген ХЕРРЕ
Пабло Мануэль ДЕЛЬГАДО
Саша ДИК
Original Assignee
Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. filed Critical Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф.
Publication of RU2022106060A publication Critical patent/RU2022106060A/ru
Application granted granted Critical
Publication of RU2798019C2 publication Critical patent/RU2798019C2/ru

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/173Transcoding, i.e. converting between two coded representations avoiding cascaded coding-decoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/69Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for evaluating synthetic or decoded voice signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/22Arrangements for obtaining desired frequency or directional characteristics for obtaining desired frequency characteristic only 
    • H04R1/26Spatial arrangements of separate transducers responsive to two or more frequency ranges
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/04Circuits for transducers, loudspeakers or microphones for correcting frequency response

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Otolaryngology (AREA)
  • Mathematical Physics (AREA)
  • Stereophonic System (AREA)

Claims (97)

1. Аудиокодер (300) для кодирования (310) входного аудиосодержимого (112), содержащего один или более входных аудиосигналов (112, 1121, 1122, 1123, 112a, 112b),
причем аудиокодер (300) выполнен с возможностью обеспечения одного или более кодированных аудиосигналов (320) на основе одного или более входных аудиосигналов (112, 1121, 1122, 1123, 112a, 112b) или одного или более полученных из них сигналов (110, 1101, 1102, 110a, 110b);
причем аудиокодер (300) выполнен с возможностью адаптации (340) параметров кодирования в зависимости от одной или более карт направленной громкости, которые представляют информацию (142, 1421, 1422, 142a, 142b) о громкости, ассоциированную с множеством различных направлений (121), из одного или более подлежащих кодированию сигналов.
2. Аудиокодер (300) по п. 1, причем аудиокодер (300) выполнен с возможностью адаптации (340) распределения битов между одним или более сигналами и/или параметрами, подлежащими кодированию, в зависимости от вкладов отдельных карт направленной громкости одного или более сигналов и/или параметров, подлежащих кодированию, в общую карту (142, 1421, 1422, 142a, 142b) направленной громкости.
3. Аудиокодер (300) по п. 1, причем аудиокодер (300) выполнен с возможностью запрещения кодирования (310) определённого одного из подлежащих кодированию сигналов, когда вклады отдельной карты направленной громкости определённого одного из подлежащих кодированию сигналов в общую карту направленной громкости ниже порогового значения.
4. Аудиокодер (300) по п. 1, причем аудиокодер (300) выполнен с возможностью адаптации (342) точности квантования одного или более подлежащих кодированию сигналов в зависимости от вкладов отдельных карт направленной громкости одного или более подлежащих кодированию сигналов в общую карту направленной громкости.
5. Аудиокодер (300) по п. 1, причем аудиокодер (300) выполнен с возможностью квантования (312) представлений (110, 1101, 1102, 110a, 110b) в спектральной области одного или более входных аудиосигналов (112, 1121, 1122, 1123, 112a, 112b) или одного или более полученных из них сигналов (110, 1101, 1102, 110a, 110b) с использованием одного или более параметров квантования для получения одного или более квантованных представлений (313) в спектральной области;
причем аудиокодер (300) выполнен с возможностью регулирования (342) одного или более параметров квантования в зависимости от одной или более карт направленной громкости, которые представляют информацию (142, 1421, 1422, 142a, 142b) о громкости, ассоциированную с множеством различных направлений (121) одного или более подлежащих квантованию сигналов для адаптации формирования одного или более кодированных аудиосигналов (320); и
причем аудиокодер (300) выполнен с возможностью кодирования одного или более квантованных представлений (313) в спектральной области для получения одного или более кодированных аудиосигналов (320).
6. Аудиокодер (300) по п. 5, причем аудиокодер (300) выполнен с возможностью регулирования (342) одного или более параметров квантования в зависимости от вкладов отдельных карт направленной громкости одного или более подлежащих квантованию сигналов в общую карту направленной громкости.
7. Аудиокодер (300) по п. 5, причем аудиокодер (300) выполнен с возможностью определения общей карты направленной громкости на основе входных аудиосигналов (112, 1121, 1122, 1123, 112a, 112b) таким образом, что общая карта направленной громкости представляет информацию (142, 1421, 1422, 142a, 142b) о громкости, ассоциированную с различными направлениями (121) аудиосцены, представленной входными аудиосигналами (112, 1121, 1122, 1123, 112a, 112b).
8. Аудиокодер (300) по п. 5, в котором один или более подлежащих квантованию сигналов ассоциированы с различными направлениями (121), или ассоциированы с различными громкоговорителям, или ассоциированы с различными звуковыми объектами.
9. Аудиокодер (300) по п. 5, в котором подлежащие квантованию сигналы содержат компоненты совместного многосигнального кодирования двух или более входных аудиосигналов (112, 1121, 1122, 1123, 112a, 112b).
10. Аудиокодер (300) по п. 5, причем аудиокодер (300) выполнен с возможностью оценки вклада разностного сигнала совместного многосигнального кодирования в общую карту направленной громкости и регулирования (342) в зависимости от него одного или более параметров квантования.
11. Аудиокодер (300) по п. 1, причем аудиокодер (300) выполнен с возможностью адаптации (340) распределения битов между одним или более сигналами и/или параметрами, подлежащими кодированию отдельно для различных спектральных интервалов или отдельно для различных частотных полос; и/или
причем аудиокодер (300) выполнен с возможностью адаптации (342) точности квантования одного или более подлежащих кодированию сигналов отдельно для различных спектральных интервалов или отдельно для различных частотных полос.
12. Аудиокодер (300) по п. 1,
причем аудиокодер (300) выполнен с возможностью адаптации (340) распределения битов между одним или более сигналами и/или параметрами, подлежащими кодированию в зависимости от оценки пространственного маскирования между двумя или более подлежащими кодированию сигналами,
причем аудиокодер (300) выполнен с возможностью оценки пространственного маскирования на основе карт направленной громкости, ассоциированных с двумя или более подлежащими кодированию сигналами.
13. Аудиокодер (300) по п. 12, причем аудиокодер (300) выполнен с возможностью оценки эффекта маскирования вклада (132, 1321, 1322, 1351, 1352) громкости, ассоциированного с первым направлением первого подлежащего кодированию сигнала, на вклад (132, 1321, 1322, 1351, 1352) громкости, ассоциированный со вторым направлением второго подлежащего кодированию сигнала.
14. Аудиокодер (300) по п. 1, причем аудиокодер (300) содержит модуль (100) анализа аудиоданных,
причем модуль (100) анализа аудиоданных выполнен с возможностью получения представлений (110, 1101, 1102, 110a, 110b) в спектральной области двух или более входных аудиосигналов (112, 1121, 1122, 1123, 112a, 112b);
причем модуль (100) анализа аудиоданных выполнен с возможностью получения информации (122, 1221, 1222, 125, 127) о направлении, ассоциированной со спектральными полосами представлений (110, 1101, 1102, 110a, 110b) в спектральной области;
причем модуль (100) анализа аудиоданных выполнен с возможностью получения информации (142, 1421, 1422, 142a, 142b) о громкости, ассоциированной с различными направлениями (121), в качестве результата анализа,
причем вклады (132, 1321, 1322, 1351, 1352) в информацию (142, 1421, 1422, 142a, 142b) о громкости определяются в зависимости от информации (122, 1221, 1222, 125, 127) о направлении;
причём информация (142, 1421, 1422, 142a, 142b) о громкости, ассоциированная с различными направлениями (121), формирует карту направленной громкости.
15. Аудиокодер (300) по п. 1,
причем аудиокодер (300) выполнен с возможностью адаптации (340) шума, вносимого кодером, в зависимости от одной или более карт направленной громкости.
16. Аудиокодер (300) по п. 15,
причем аудиокодер (300) выполнен с возможностью использования отклонения между картой направленной громкости, которая ассоциирована с определённым не кодированным входным аудиосигналом, и картой направленной громкости, достижимой кодированной версией определённого входного аудиосигнала, в качестве критерия адаптации формирования определённого кодированного аудиосигнала.
17. Аудиокодер (300) по п. 1,
причем аудиокодер (300) выполнен с возможностью активации и деактивации инструмента совместного кодирования в зависимости от одной или более карт направленной громкости, которые представляют информацию (142, 1421, 1422, 142a, 142b) о громкости, ассоциированную с множеством различных направлений (121) одного или более подлежащих кодированию сигналов.
18. Аудиокодер (300) по п. 1,
причем аудиокодер (300) выполнен с возможностью определения одного или более параметров инструмента совместного кодирования в зависимости от одной или более карт направленной громкости, которые представляют информацию (142, 1421, 1422, 142a, 142b) о громкости, ассоциированную с множеством различных направлений (121) одного или более подлежащих кодированию сигналов.
19. Аудиокодер (300) по п. 1, причем аудиокодер (300) выполнен с возможностью определения или оценки влияния вариации одного или более управляющих параметров, управляющих обеспечением одного или более кодированных аудиосигналов (320), на карту направленной громкости одного или более кодированных сигналов и регулирования одного или более управляющих параметров в зависимости от определения или оценки влияния.
20. Аудиокодер (300) по п. 1,
причем аудиокодер (300) выполнен с возможностью получения компонента направления, используемого для получения одной или более карт направленной громкости, с использованием метаданных, представляющих информацию о положении громкоговорителей, ассоциированных с входными аудиосигналами (112, 1121, 1122, 1123, 112a, 112b).
21. Аудиокодер (300) для кодирования (310) входного аудиосодержимого (112), содержащего один или более входных аудиосигналов (112, 1121, 1122, 1123, 112a, 112b),
причем аудиокодер (300) выполнен с возможностью обеспечения одного или более кодированных аудиосигналов (320) на основе двух или более входных аудиосигналов (112, 1121, 1122, 1123, 112a, 112b) или на основе двух или более полученных из них сигналов (110, 1101, 1102, 110a, 110b) с использованием совместного кодирования (310) двух или более подлежащих совместному кодированию сигналов;
причем аудиокодер (300) выполнен с возможностью выбора (350) подлежащих совместному кодированию сигналов из множества возможных сигналов (110, 1101, 1102) или из множества пар возможных сигналов (110, 1101, 1102) в зависимости от карт направленной громкости, которые представляют информацию (142, 1421, 1422, 142a, 142b), ассоциированную с множеством различных направлений (121) возможных сигналов (110, 1101, 1102) или пар возможных сигналов (110, 1101, 1102).
22. Аудиокодер (300) по п. 21,
причем аудиокодер (300) выполнен с возможностью выбора (350) подлежащих совместному кодированию сигналов из множества возможных сигналов (110, 1101, 1102) или из множества пар возможных сигналов (110, 1101, 1102) в зависимости от вкладов отдельных карт направленной громкости возможных сигналов (110, 1101, 1102) в общую карту направленной громкости или в зависимости от вкладов карт направленной громкости пар возможных сигналов (110, 1101, 1102) в общую карту направленной громкости.
23. Аудиокодер (300) по п. 21,
причем аудиокодер (300) выполнен с возможностью определения вклада пар возможных сигналов (110, 1101, 1102) в общую карту направленной громкости; и
причем аудиокодер (300) выполнен с возможностью выбора одной или более пар возможных сигналов (110, 1101, 1102), имеющих наиболее высокий вклад в общую карту направленной громкости, для совместного кодирования (310), или
причем аудиокодер (300) выполнен с возможностью выбора одной или более пар возможных сигналов (110, 1101, 1102), вклад которых в общую карту направленной громкости больше заданного порогового значения, для совместного кодирования (310).
24. Аудиокодер (300) по п. 21,
причем аудиокодер (300) выполнен с возможностью определения отдельных карт направленной громкости двух или более возможных сигналов (110, 1101, 1102), и
причем аудиокодер (300) выполнен с возможностью сравнения отдельных карт направленной громкости двух или более возможных сигналов (110, 1101, 1102), и
причем аудиокодер (300) выполнен с возможностью выбора (350) двух или более из возможных сигналов (110, 1101, 1102) для совместного кодирования (310) в зависимости от результата сравнения.
25. Аудиокодер (300) по п. 21,
причем аудиокодер (300) выполнен с возможностью определения общей карты направленной громкости с использованием понижающего микширования входных аудиосигналов (112, 1121, 1122, 1123, 112a, 112b) или с использованием бинаурализации входных аудиосигналов (112, 1121, 1122, 1123, 112a, 112b).
26. Аудиокодер (300) для кодирования (310) входного аудиосодержимого (112), содержащего один или более входных аудиосигналов (112, 1121, 1122, 1123, 112a, 112b),
причем аудиокодер (300) выполнен с возможностью обеспечения одного или более кодированных аудиосигналов (320) на основе двух или более входных аудиосигналов (112, 1121, 1122, 1123, 112a, 112b) или на основе двух или более полученных из них сигналов (110, 1101, 1102, 110a, 110b);
причем аудиокодер (300) выполнен с возможностью определения общей карты направленной громкости на основе входных аудиосигналов (112, 1121, 1122, 1123, 112a, 112b) и/или определять одну или более отдельных карт направленной громкости, ассоциированных с отдельными входными аудиосигналами (112, 1121, 1122, 1123, 112a, 112b); и
причем аудиокодер (300) выполнен с возможностью кодирования общей карты направленной громкости и/или одной или более отдельных карт направленной громкости в качестве вспомогательной информации.
27. Аудиокодер (300) по п. 26,
причем аудиокодер (300) выполнен с возможностью определения общей карты направленной громкости на основе входных аудиосигналов (112, 1121, 1122, 1123, 112a, 112b) таким образом, что общая карта направленной громкости представляет информацию (142, 1421, 1422, 142a, 142b) о громкости, ассоциированную с различными направлениями (121) аудиосцены, представленной входными аудиосигналами (112, 1121, 1122, 1123, 112a, 112b).
28. Аудиокодер (300) по п. 26,
причем аудиокодер (300) выполнен с возможностью кодирования общей карты направленной громкости в виде множества значений, ассоциированных с различными направлениями (121); или
причем аудиокодер (300) выполнен с возможностью кодирования общей карты направленной громкости с использованием значения центрального положения и информации о градиенте; или
причем аудиокодер (300) выполнен с возможностью кодирования общей карты направленной громкости в виде полиномиального представления; или
причем аудиокодер (300) выполнен с возможностью кодирования общей карты направленной громкости в виде сплайнового представления.
29. Аудиокодер (300) по п. 26,
причем аудиокодер (300) выполнен с возможностью кодирования одного микшированного с понижением сигнала, полученного на основе множества входных аудиосигналов (112, 1121, 1122, 1123, 112a, 112b) и общей карты направленной громкости; или
причем аудиокодер (300) выполнен с возможностью кодирования множества сигналов и кодирования отдельных карты направленной громкости множества кодируемых сигналов; или
причем аудиокодер (300) выполнен с возможностью кодирования общей карты направленной громкости, множества сигналов и параметров, описывающих вклады кодируемых сообщений в общую карту направленной громкости.
30. Аудиодекодер (400) для декодирования (410) кодированного аудиосодержимого (420),
причем аудиодекодер (400) выполнен с возможностью приёма кодированного представления (420) одного или более аудиосигналов и обеспечения декодированного представления (432) одного или более аудиосигналов;
причем аудиодекодер (400) выполнен с возможностью приёма кодированной информации (424) о картах направленной громкости и декодирования кодированной информации (424) о картах направленной громкости для получения одной или более карт (414) направленной громкости; и
причем аудиодекодер (400) выполнен с возможностью воссоздания (430) аудиосцены с использованием декодированного представления (432) одного или более аудиосигналов и с использованием одной или более карт направленной громкости.
31. Аудиодекодер (400) по п. 30, причем аудиодекодер (400) выполнен с возможностью получения выходных сигналов таким образом, что одна или более карт направленной громкости, ассоциированных с выходными сигналами, приблизительно равны или равны одной или более целевым картам направленной громкости,
причем одна или более целевых карт направленной громкости основаны на одной или более декодированных картах (414) направленной громкости или равны одной или более декодированным картам (414) направленной громкости.
32. Аудиодекодер (400) по п. 30,
причем аудиодекодер (400) выполнен с возможностью приёма
- одного кодированного микшированного с понижением сигнала и общей карты направленной громкости; или
- множества кодированных аудиосигналов (422) и отдельных карт направленной громкости множества кодированных сигналов; или
- общей карты направленной громкости, множества кодированных аудиосигналов (422) и параметров, описывающих вклады кодированных аудиосигналов (422) в общую карту направленной громкости; и
причем аудиодекодер (400) выполнен с возможностью обеспечения на их основе выходных сигналов.
33. Способ (3000) кодирования входного аудиосодержимого, содержащего один или более входных аудиосигналов,
причем способ содержит этап, на котором обеспечивают (3100) один или более кодированных аудиосигналов на основе одного или более входных аудиосигналов или одного или более полученных из них сигналов; и
причем способ содержит этап, на котором адаптируют (3200) формирование одного или более кодированных аудиосигналов в зависимости от одной или более карт направленной громкости, которые представляют информацию о громкости, ассоциированную с множеством различных направлений одного или более подлежащих кодированию сигналов.
34. Способ (4000) кодирования входного аудиосодержимого, содержащего один или более входных аудиосигналов,
причем способ содержит этап, на котором обеспечивают (4100) один или более кодированных аудиосигналов на основе двух или более входных аудиосигналов или на основе двух или более полученных из них сигналов с использованием совместного кодирования двух или более подлежащих совместному кодированию сигналов; и
причем способ содержит выбор (4200) сигналов, подлежащих совместному кодированию, из множества возможных сигналов или из множества пар возможных сигналов в зависимости от карт направленной громкости, которые представляют информацию о громкости, ассоциированную с множеством различных направлений возможных сигналов или пар возможных сигналов.
35. Способ (5000) кодирования входного аудиосодержимого, содержащего один или более входных аудиосигналов,
причем способ содержит этап, на котором обеспечивают (5100) один или более кодированных аудиосигналов на основе двух или более входных аудиосигналов или на основе двух или более полученных из них сигналов;
причем способ содержит этап, на котором определяют (5200) общую карту направленной громкости на основе входных аудиосигналов и/или определяют одну или более отдельных карт направленной громкости, ассоциированных с отдельными входными аудиосигналами; и
причем способ содержит этап, на котором кодируют (5300) общую карту направленной громкости и/или одну или более отдельных карт направленной громкости в качестве вспомогательной информации.
36. Способ (6000) декодирования кодированного аудиосодержимого,
причем способ содержит этапы, на которых принимают (6100) кодированное представление одного или более аудиосигналов и обеспечивают (6200) декодированное представление одного или более аудиосигналов;
причем способ содержит этапы, на которых принимают (6300) кодированную информацию о картах направленной громкости и декодируют (6400) кодированную информацию о картах направленной громкости для получения (6500) одной или более карт направленной громкости; и
причем способ содержит этап, на котором воссоздают (6600) аудиосцену с использованием декодированного представления одного или более аудиосигналов и используют одну или более карт направленной громкости.
37. Компьютерная программа, имеющая программный код для выполнения способа по п. 33 или 34? или 35 при его выполнении на компьютере.
38. Кодированное звуковое представление, содержащее
кодированное представление одного или более аудиосигналов; и
кодированную информацию о картах направленной громкости.
RU2022106060A 2018-10-26 2019-10-28 Обработка аудиоданных на основе карты направленной громкости RU2798019C2 (ru)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
EP18202945.4 2018-10-26
EP18202945 2018-10-26
EP19169684 2019-04-16
EP19169684.8 2019-04-16

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
RU2021114678A Division RU2771833C1 (ru) 2018-10-26 2019-10-28 Обработка аудиоданных на основе карты направленной громкости

Publications (2)

Publication Number Publication Date
RU2022106060A true RU2022106060A (ru) 2022-04-04
RU2798019C2 RU2798019C2 (ru) 2023-06-14

Family

ID=

Also Published As

Publication number Publication date
RU2022106058A (ru) 2022-04-05
EP4213147A1 (en) 2023-07-19
BR112021007807A2 (pt) 2021-07-27
EP3871216A1 (en) 2021-09-01
JP2022177253A (ja) 2022-11-30
US20210383820A1 (en) 2021-12-09
JP2022505964A (ja) 2022-01-14
WO2020084170A1 (en) 2020-04-30
EP4220639A1 (en) 2023-08-02
CN113302692A (zh) 2021-08-24

Similar Documents

Publication Publication Date Title
JP6600004B2 (ja) マルチチャンネル信号を符号化又は復号化するための装置と方法
JP6585128B2 (ja) 無相関化信号の寄与の残差信号ベースの調整を用いたマルチチャンネルオーディオデコーダ、マルチチャンネルオーディオエンコーダ、方法およびコンピュータプログラム
US7573912B2 (en) Near-transparent or transparent multi-channel encoder/decoder scheme
US8666752B2 (en) Apparatus and method for encoding and decoding multi-channel signal
JP6573640B2 (ja) オーディオ・エンコーダおよびデコーダ
KR101449434B1 (ko) 복수의 가변장 부호 테이블을 이용한 멀티 채널 오디오를부호화/복호화하는 방법 및 장치
RU2379832C2 (ru) Энтропийное кодирование с помощью компактных кодовых книг
US20100014679A1 (en) Multi-channel encoding and decoding method and apparatus
US9293146B2 (en) Intensity stereo coding in advanced audio coding
JP2009516861A (ja) マルチチャンネルオーディオ信号のエンコーディング/デコーディングシステム、記録媒体及び方法
RU2007142177A (ru) Адаптивное остаточное аудиокодирование
RU2016137197A (ru) Устройство кодирования и способ кодирования, устройство декодирования и способ декодирования, и программа
JP2017517020A (ja) ダイナミックレンジ制御における効率的なゲイン符号化を有するオーディオ符号化装置及びオーディオ復号化装置
US8665945B2 (en) Encoding method, decoding method, encoding device, decoding device, program, and recording medium
CA2604521A1 (en) Lossless encoding of information with guaranteed maximum bitrate
FI3405950T3 (fi) Stereoaudiokoodaus ILD-pohjaisella normalisoinnilla ennen keski/sivupäätöstä
JP6804666B2 (ja) マルチチャネル信号符号化方法、マルチチャネル信号復号化方法、符号器、及び復号器
WO2015186535A1 (ja) オーディオ信号処理装置および方法、符号化装置および方法、並びにプログラム
JP2006113294A (ja) 音響信号符号化装置及び音響信号復号装置
ES2838006T3 (es) Codificación de señal de sonido
US20080059203A1 (en) Audio Encoding Device, Decoding Device, Method, and Program
RU2022106060A (ru) Обработка аудиоданных на основе карты направленной громкости
Lindblom et al. Flexible sum-difference stereo coding based on time-aligned signal components
CN109427338B (zh) 立体声信号的编码方法和编码装置
JP2002132295A (ja) ステレオオーディオ信号高能率符号化装置