RU2023121109A - Способы и устройства для формирования или декодирования битового потока, содержащего иммерсивные аудиосигналы - Google Patents

Способы и устройства для формирования или декодирования битового потока, содержащего иммерсивные аудиосигналы Download PDF

Info

Publication number
RU2023121109A
RU2023121109A RU2023121109A RU2023121109A RU2023121109A RU 2023121109 A RU2023121109 A RU 2023121109A RU 2023121109 A RU2023121109 A RU 2023121109A RU 2023121109 A RU2023121109 A RU 2023121109A RU 2023121109 A RU2023121109 A RU 2023121109A
Authority
RU
Russia
Prior art keywords
signal
superframe
metadata
field
frames
Prior art date
Application number
RU2023121109A
Other languages
English (en)
Inventor
Стефан БРУН
Хуан Феликс ТОРРЕС
Original Assignee
Долби Лэборетериз Лайсенсинг Корпорейшн
Долби Интернэшнл Аб
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Долби Лэборетериз Лайсенсинг Корпорейшн, Долби Интернэшнл Аб filed Critical Долби Лэборетериз Лайсенсинг Корпорейшн
Publication of RU2023121109A publication Critical patent/RU2023121109A/ru

Links

Claims (48)

1. Способ (500) формирования битового потока (101), в котором битовый поток (101) содержит последовательность суперкадров (400) для последовательности кадров иммерсивного аудиосигнала (111), причем способ (500) содержит этапы, на которых, повторяющимся образом для последовательности суперкадров (400):
- вставляют (501) закодированные аудиоданные (206) для двух или более кадров одного или более сигналов (203) каналов понижающего микширования, полученных из иммерсивного аудиосигнала (111), в поля (411, 421, 412, 422) данных суперкадра (400), причем закодированные аудиоданные (206) кадра канала (203) понижающего микширования сформированы с использованием многорежимного и/или многоскоростного речевого кодека или аудиокодека; и
- вставляют (502) метаданные (202, 205) для воссоздания двух или более кадров иммерсивного аудиосигнала (111) из закодированных аудиоданных (206) в поле (403) метаданных суперкадра (400).
2. Способ (500) по п. 1, причем
- способ (500) содержит этап, на котором вставляют поле (401) заголовка в суперкадр (400); и
- поле (401) заголовка указывает размер поля (403) метаданных суперкадра (400),
причем опционально:
- поле (403) метаданных представляет максимальный возможный размер;
- поле (401) заголовка указывает значение корректировки; и
- размер поля (403) метаданных суперкадра (400) соответствует максимальному возможному размеру минус значение корректировки.
3. Способ (500) по п. 2, в котором
- поле (401) заголовка содержит индикатор размера для размера поля (403) метаданных; и
- индикатор размера представляет разное разрешение для разных диапазонов размера для размера поля (403) метаданных,
причем опционально:
- метаданные (202, 205) для восстановления одного или более кадров иммерсивного аудиосигнала (111) представляют статистическое распределение размера для размера метаданных (202, 205); и
- разрешение индикатора размера зависит от распределения размера метаданных (202, 205).
4. Способ (500) по любому из предыдущих пунктов, причем
- способ (500) содержит этап, на котором вставляют поле (401) заголовка в суперкадр (400); и
- поле (401) заголовка указывает на то, содержит ли суперкадр (400) поле (402) информации конфигурации, и/или
- поле (401) заголовка указывает наличие поля (402) информации конфигурации, и/или
- поле (401) заголовка указывает на то, содержит ли суперкадр (400) дополнительное поле (404) для дополнительной информации относительно иммерсивного аудиосигнала (111).
5. Способ (500) по любому из предыдущих пунктов, причем
- способ (500) содержит этап, на котором вставляют поле (402) информации конфигурации в суперкадр (400); и
- поле (402) информации конфигурации указывает количество сигналов (203) каналов понижающего микширования, представленных полями (411, 421, 412, 422) данных суперкадра (400), и/или
- поле (402) информации конфигурации указывает максимальный возможный размера поля (403) метаданных, и/или
- поле (402) информации конфигурации указывает порядок сигнала представления звукового поля, содержащегося в иммерсивном аудиосигнале (111), и/или
- поле (402) информации конфигурации указывает тип кадра и/или режим кодирования, используемые для кодирования каждого из упомянутого одного или более сигналов (203) каналов понижающего микширования.
6. Способ (500) по любому из предыдущих пунктов, в котором закодированные аудиоданные (206) кадра сигнала (203) канала понижающего микширования закодированы с использованием кодера улучшенных речевых услуг.
7. Способ (500) по любому из предыдущих пунктов, в котором суперкадр (400) составляет по меньшей мере часть элемента данных, переданного с использованием протокола передачи, в частности стандартов DASH, RTSP или RTP, или сохранен в файле в соответствии с форматом хранения, в частности ISOBMFF.
8. Способ (500) по любому из предыдущих пунктов, причем
- поле (401) заголовка указывает отсутствие поля (402) информации конфигурации; и
- способ (500) содержит этап, на котором передают информацию конфигурации в предыдущем суперкадре (400) из последовательности суперкадров (400) или используют внеполосную схему сигнализации.
9. Способ (500) по любому из предыдущих пунктов, причем способ (500) содержит этапы, на которых
- вставляют закодированные аудиоданные (206) для одного или более кадров первого сигнала (203) канала понижающего микширования и второго сигнала (203) канала понижающего микширования, полученных из иммерсивного аудиосигнала (111), в одно или более первых полей (411, 421) данных и одно или более вторых полей (412, 422) данных суперкадра (400), соответственно; причем первый сигнал (203) канала понижающего микширования закодирован с использованием первого кодера, и причем второй сигнал (203) канала понижающего микширования закодирован с использованием второго кодера; и
- обеспечивают информацию конфигурации относительно первого кодера и второго кодера в данном суперкадре (400), в предыдущем суперкадре (400) из последовательности суперкадров (400) или с использованием внеполосной схемы сигнализации.
10. Способ (500) по любому из предыдущих пунктов, причем способ (500) содержит этапы, на которых
- извлекают один или более аудиообъектов из иммерсивного аудиосигнала (111) IA; причем аудиообъект содержит сигнал объекта и метаданные (202) объекта, указывающие позицию аудиообъекта;
- определяют разностный сигнал (201) на основе сигнала (111) IA и на основе упомянутого одного или более аудиообъектов;
- обеспечивают микшированный с понижением сигнал на основе сигнала (111) IA, в частности, таким образом, что количество сигналов (230) каналов понижающего микширования микшированного с понижением сигнала меньше, чем количество сигналов каналов сигнала (111) IA;
- определяют метаданные (205) совместного кодирования для обеспечения возможности повышающего микширования микшированного с понижением сигнала в один или более воссозданных сигналов аудиообъекта, соответствующих упомянутому одному или более аудиообъектам и/или в воссозданный разностный сигнал (311), соответствующий разностному сигналу (201);
- выполняют кодирование формы сигнала микшированного с понижением сигнала, чтобы обеспечить закодированные аудиоданные (206) для последовательности кадров упомянутого одного или более сигналов (203) каналов понижающего микширования; и
- выполняют статистическое кодирование метаданных (205) совместного кодирования и метаданных (202) объектов упомянутого одного или более аудиообъектов, чтобы обеспечить метаданные (202, 205) для вставки в поля (403) метаданных последовательности суперкадров (400).
11. Суперкадр (400) битового потока (101), причем битовый поток (101) содержит последовательность суперкадров (400) для последовательности кадров иммерсивного аудиосигнала (111), причем суперкадр (400) содержит:
- поля (411, 421, 412, 422) данных для закодированных аудиоданных (206) для двух или более кадров одного или более сигналов (203) каналов понижающего микширования, полученных из иммерсивного аудиосигнала (111), причем закодированные аудиоданные (206) кадра канала (203) понижающего микширования сформированы с использованием многорежимного и/или многоскоростного речевого кодека или аудиокодека; и
- одно поле (403) метаданных для метаданных (202, 205), выполненное с возможностью воссоздавать два или более кадров иммерсивного аудиосигнала (111) из закодированных аудиоданных (206).
12. Устройство (110) кодирования, выполненное с возможностью формировать битовый поток (101), причем битовый поток (101) содержит последовательность суперкадров (400) для последовательности кадров иммерсивного аудиосигнала (111), причем устройство (110) кодирования выполнено с возможностью, повторяющимся образом для последовательности суперкадров (400):
- вставлять закодированные аудиоданные (206) для двух или более кадров одного или более сигналов (203) каналов понижающего микширования, полученных из иммерсивного аудиосигнала (111), в поля (411, 421, 412, 422) данных суперкадра (400), причем закодированные аудиоданные (206) кадра канала (203) понижающего микширования сформированы с использованием многорежимного и/или многоскоростного речевого кодека или аудиокодека; и
- вставлять метаданные (202, 205) для восстановления двух или более кадров иммерсивного аудиосигнала (111) из закодированных аудиоданных (206) в поле (403) метаданных суперкадра (400).
RU2023121109A 2018-07-02 2019-07-02 Способы и устройства для формирования или декодирования битового потока, содержащего иммерсивные аудиосигналы RU2023121109A (ru)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US62/693,246 2018-07-02

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
RU2020130051A Division RU2802677C2 (ru) 2018-07-02 2019-07-02 Способы и устройства для формирования или декодирования битового потока, содержащего иммерсивные аудиосигналы

Publications (1)

Publication Number Publication Date
RU2023121109A true RU2023121109A (ru) 2023-08-21

Family

ID=

Similar Documents

Publication Publication Date Title
RU2368074C2 (ru) Адаптивная группировка параметров для улучшенной эффективности кодирования
RU2665887C1 (ru) Декодирование битовых аудиопотоков с метаданными расширенного копирования спектральной полосы по меньшей мере в одном заполняющем элементе
JP6214765B2 (ja) 音声デコーダ、符号化音声出力データを生成するための装置、及びデコーダの初期化を可能にする方法
BR112020016948A2 (pt) Métodos e dispositivos para gerar ou decodificar um fluxo de bits compreendendo sinais de áudio imersivos
BR112016001140B1 (pt) Aparelho e método para codificação eficiente de informações adicionais de áudio
US20230162747A1 (en) System and method for processing audio data
BRPI0514650B1 (pt) Métodos para codificação e decodificação de sinais de áudio, codificador e decodificador de sinais de áudio
BR112016008787B1 (pt) Método para decodificação e codificação de uma matriz de downmix, método para apresentação de conteúdo de áudio, codificador e decodificador para uma matriz de downmix, codificador de áudio e decodificador de áudio
NZ586566A (en) A method and apparatus for encoding and decoding multi-channel audio with random access points into a lossless variable bit rate audio bitstream
US20170103761A1 (en) Adaptive Forward Error Correction Redundant Payload Generation
JP5713296B2 (ja) 信号ソースに関連付けられた少なくとも1つのパラメータを符号化するための装置および方法
MX2021011338A (es) Procesamiento de residuos en codificacion de video.
JP6790251B2 (ja) マルチチャネルオーディオ信号処理方法、装置、およびシステム
JP2009514008A (ja) マルチチャンネルオーディオ信号の符号化及び復号化方法とその装置
TWI631554B (zh) Encoding device and method, decoding device and method, and program
KR20240038819A (ko) 오디오 인코더 및 디코더
CA2604521A1 (en) Lossless encoding of information with guaranteed maximum bitrate
EP1932239A4 (en) METHOD AND APPARATUS FOR ENCODING / DECODING
EP2276192A2 (en) Method and apparatus for transmitting/receiving multi - channel audio signals using super frame
JPWO2020010064A5 (ru)
RU2023121109A (ru) Способы и устройства для формирования или декодирования битового потока, содержащего иммерсивные аудиосигналы
KR20140047509A (ko) 객체 오디오 신호의 잔향 신호를 이용한 오디오 부/복호화 장치
RU2802677C2 (ru) Способы и устройства для формирования или декодирования битового потока, содержащего иммерсивные аудиосигналы
KR101434834B1 (ko) 다채널 오디오 신호의 부호화/복호화 방법 및 장치
KR20070031212A (ko) 오디오 신호의 인코딩/디코딩 방법 및 장치