RU2023121109A - Способы и устройства для формирования или декодирования битового потока, содержащего иммерсивные аудиосигналы - Google Patents
Способы и устройства для формирования или декодирования битового потока, содержащего иммерсивные аудиосигналы Download PDFInfo
- Publication number
- RU2023121109A RU2023121109A RU2023121109A RU2023121109A RU2023121109A RU 2023121109 A RU2023121109 A RU 2023121109A RU 2023121109 A RU2023121109 A RU 2023121109A RU 2023121109 A RU2023121109 A RU 2023121109A RU 2023121109 A RU2023121109 A RU 2023121109A
- Authority
- RU
- Russia
- Prior art keywords
- signal
- superframe
- metadata
- field
- frames
- Prior art date
Links
Claims (48)
1. Способ (500) формирования битового потока (101), в котором битовый поток (101) содержит последовательность суперкадров (400) для последовательности кадров иммерсивного аудиосигнала (111), причем способ (500) содержит этапы, на которых, повторяющимся образом для последовательности суперкадров (400):
- вставляют (501) закодированные аудиоданные (206) для двух или более кадров одного или более сигналов (203) каналов понижающего микширования, полученных из иммерсивного аудиосигнала (111), в поля (411, 421, 412, 422) данных суперкадра (400), причем закодированные аудиоданные (206) кадра канала (203) понижающего микширования сформированы с использованием многорежимного и/или многоскоростного речевого кодека или аудиокодека; и
- вставляют (502) метаданные (202, 205) для воссоздания двух или более кадров иммерсивного аудиосигнала (111) из закодированных аудиоданных (206) в поле (403) метаданных суперкадра (400).
2. Способ (500) по п. 1, причем
- способ (500) содержит этап, на котором вставляют поле (401) заголовка в суперкадр (400); и
- поле (401) заголовка указывает размер поля (403) метаданных суперкадра (400),
причем опционально:
- поле (403) метаданных представляет максимальный возможный размер;
- поле (401) заголовка указывает значение корректировки; и
- размер поля (403) метаданных суперкадра (400) соответствует максимальному возможному размеру минус значение корректировки.
3. Способ (500) по п. 2, в котором
- поле (401) заголовка содержит индикатор размера для размера поля (403) метаданных; и
- индикатор размера представляет разное разрешение для разных диапазонов размера для размера поля (403) метаданных,
причем опционально:
- метаданные (202, 205) для восстановления одного или более кадров иммерсивного аудиосигнала (111) представляют статистическое распределение размера для размера метаданных (202, 205); и
- разрешение индикатора размера зависит от распределения размера метаданных (202, 205).
4. Способ (500) по любому из предыдущих пунктов, причем
- способ (500) содержит этап, на котором вставляют поле (401) заголовка в суперкадр (400); и
- поле (401) заголовка указывает на то, содержит ли суперкадр (400) поле (402) информации конфигурации, и/или
- поле (401) заголовка указывает наличие поля (402) информации конфигурации, и/или
- поле (401) заголовка указывает на то, содержит ли суперкадр (400) дополнительное поле (404) для дополнительной информации относительно иммерсивного аудиосигнала (111).
5. Способ (500) по любому из предыдущих пунктов, причем
- способ (500) содержит этап, на котором вставляют поле (402) информации конфигурации в суперкадр (400); и
- поле (402) информации конфигурации указывает количество сигналов (203) каналов понижающего микширования, представленных полями (411, 421, 412, 422) данных суперкадра (400), и/или
- поле (402) информации конфигурации указывает максимальный возможный размера поля (403) метаданных, и/или
- поле (402) информации конфигурации указывает порядок сигнала представления звукового поля, содержащегося в иммерсивном аудиосигнале (111), и/или
- поле (402) информации конфигурации указывает тип кадра и/или режим кодирования, используемые для кодирования каждого из упомянутого одного или более сигналов (203) каналов понижающего микширования.
6. Способ (500) по любому из предыдущих пунктов, в котором закодированные аудиоданные (206) кадра сигнала (203) канала понижающего микширования закодированы с использованием кодера улучшенных речевых услуг.
7. Способ (500) по любому из предыдущих пунктов, в котором суперкадр (400) составляет по меньшей мере часть элемента данных, переданного с использованием протокола передачи, в частности стандартов DASH, RTSP или RTP, или сохранен в файле в соответствии с форматом хранения, в частности ISOBMFF.
8. Способ (500) по любому из предыдущих пунктов, причем
- поле (401) заголовка указывает отсутствие поля (402) информации конфигурации; и
- способ (500) содержит этап, на котором передают информацию конфигурации в предыдущем суперкадре (400) из последовательности суперкадров (400) или используют внеполосную схему сигнализации.
9. Способ (500) по любому из предыдущих пунктов, причем способ (500) содержит этапы, на которых
- вставляют закодированные аудиоданные (206) для одного или более кадров первого сигнала (203) канала понижающего микширования и второго сигнала (203) канала понижающего микширования, полученных из иммерсивного аудиосигнала (111), в одно или более первых полей (411, 421) данных и одно или более вторых полей (412, 422) данных суперкадра (400), соответственно; причем первый сигнал (203) канала понижающего микширования закодирован с использованием первого кодера, и причем второй сигнал (203) канала понижающего микширования закодирован с использованием второго кодера; и
- обеспечивают информацию конфигурации относительно первого кодера и второго кодера в данном суперкадре (400), в предыдущем суперкадре (400) из последовательности суперкадров (400) или с использованием внеполосной схемы сигнализации.
10. Способ (500) по любому из предыдущих пунктов, причем способ (500) содержит этапы, на которых
- извлекают один или более аудиообъектов из иммерсивного аудиосигнала (111) IA; причем аудиообъект содержит сигнал объекта и метаданные (202) объекта, указывающие позицию аудиообъекта;
- определяют разностный сигнал (201) на основе сигнала (111) IA и на основе упомянутого одного или более аудиообъектов;
- обеспечивают микшированный с понижением сигнал на основе сигнала (111) IA, в частности, таким образом, что количество сигналов (230) каналов понижающего микширования микшированного с понижением сигнала меньше, чем количество сигналов каналов сигнала (111) IA;
- определяют метаданные (205) совместного кодирования для обеспечения возможности повышающего микширования микшированного с понижением сигнала в один или более воссозданных сигналов аудиообъекта, соответствующих упомянутому одному или более аудиообъектам и/или в воссозданный разностный сигнал (311), соответствующий разностному сигналу (201);
- выполняют кодирование формы сигнала микшированного с понижением сигнала, чтобы обеспечить закодированные аудиоданные (206) для последовательности кадров упомянутого одного или более сигналов (203) каналов понижающего микширования; и
- выполняют статистическое кодирование метаданных (205) совместного кодирования и метаданных (202) объектов упомянутого одного или более аудиообъектов, чтобы обеспечить метаданные (202, 205) для вставки в поля (403) метаданных последовательности суперкадров (400).
11. Суперкадр (400) битового потока (101), причем битовый поток (101) содержит последовательность суперкадров (400) для последовательности кадров иммерсивного аудиосигнала (111), причем суперкадр (400) содержит:
- поля (411, 421, 412, 422) данных для закодированных аудиоданных (206) для двух или более кадров одного или более сигналов (203) каналов понижающего микширования, полученных из иммерсивного аудиосигнала (111), причем закодированные аудиоданные (206) кадра канала (203) понижающего микширования сформированы с использованием многорежимного и/или многоскоростного речевого кодека или аудиокодека; и
- одно поле (403) метаданных для метаданных (202, 205), выполненное с возможностью воссоздавать два или более кадров иммерсивного аудиосигнала (111) из закодированных аудиоданных (206).
12. Устройство (110) кодирования, выполненное с возможностью формировать битовый поток (101), причем битовый поток (101) содержит последовательность суперкадров (400) для последовательности кадров иммерсивного аудиосигнала (111), причем устройство (110) кодирования выполнено с возможностью, повторяющимся образом для последовательности суперкадров (400):
- вставлять закодированные аудиоданные (206) для двух или более кадров одного или более сигналов (203) каналов понижающего микширования, полученных из иммерсивного аудиосигнала (111), в поля (411, 421, 412, 422) данных суперкадра (400), причем закодированные аудиоданные (206) кадра канала (203) понижающего микширования сформированы с использованием многорежимного и/или многоскоростного речевого кодека или аудиокодека; и
- вставлять метаданные (202, 205) для восстановления двух или более кадров иммерсивного аудиосигнала (111) из закодированных аудиоданных (206) в поле (403) метаданных суперкадра (400).
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US62/693,246 | 2018-07-02 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2020130051A Division RU2802677C2 (ru) | 2018-07-02 | 2019-07-02 | Способы и устройства для формирования или декодирования битового потока, содержащего иммерсивные аудиосигналы |
Publications (1)
Publication Number | Publication Date |
---|---|
RU2023121109A true RU2023121109A (ru) | 2023-08-21 |
Family
ID=
Similar Documents
Publication | Publication Date | Title |
---|---|---|
IL312390A (en) | Methods and devices for producing or decoding a bit sequence comprising embedded audio signals | |
US20230162747A1 (en) | System and method for processing audio data | |
RU2665887C1 (ru) | Декодирование битовых аудиопотоков с метаданными расширенного копирования спектральной полосы по меньшей мере в одном заполняющем элементе | |
US10504525B2 (en) | Adaptive forward error correction redundant payload generation | |
JP6214765B2 (ja) | 音声デコーダ、符号化音声出力データを生成するための装置、及びデコーダの初期化を可能にする方法 | |
BR112016001140B1 (pt) | Aparelho e método para codificação eficiente de informações adicionais de áudio | |
BRPI0514650B1 (pt) | Métodos para codificação e decodificação de sinais de áudio, codificador e decodificador de sinais de áudio | |
BR112016008787B1 (pt) | Método para decodificação e codificação de uma matriz de downmix, método para apresentação de conteúdo de áudio, codificador e decodificador para uma matriz de downmix, codificador de áudio e decodificador de áudio | |
NZ586566A (en) | A method and apparatus for encoding and decoding multi-channel audio with random access points into a lossless variable bit rate audio bitstream | |
MX2021011338A (es) | Procesamiento de residuos en codificacion de video. | |
JP5713296B2 (ja) | 信号ソースに関連付けられた少なくとも1つのパラメータを符号化するための装置および方法 | |
JP6790251B2 (ja) | マルチチャネルオーディオ信号処理方法、装置、およびシステム | |
TWI631554B (zh) | Encoding device and method, decoding device and method, and program | |
KR20240038819A (ko) | 오디오 인코더 및 디코더 | |
CA2604521A1 (en) | Lossless encoding of information with guaranteed maximum bitrate | |
EP1932239A4 (en) | METHOD AND APPARATUS FOR ENCODING / DECODING | |
EP2276192A2 (en) | Method and apparatus for transmitting/receiving multi - channel audio signals using super frame | |
JPWO2020010064A5 (ru) | ||
RU2009131769A (ru) | Способ кодирования и декодирования аудиосигнала и устройство для его осуществления | |
RU2023121109A (ru) | Способы и устройства для формирования или декодирования битового потока, содержащего иммерсивные аудиосигналы | |
KR20140047509A (ko) | 객체 오디오 신호의 잔향 신호를 이용한 오디오 부/복호화 장치 | |
TH2001005154A (th) | วิธีการและอุปกรณ์สำหรับให้กำเนิดหรือถอดรหัสกระแสบิตซึ่งประกอบรวมด้วยสัญญาณเสียงผ่านโสตแบบซึมซาบ | |
KR101434834B1 (ko) | 다채널 오디오 신호의 부호화/복호화 방법 및 장치 | |
KR20070031212A (ko) | 오디오 신호의 인코딩/디코딩 방법 및 장치 | |
GB2574873A (en) | Determination of spatial audio parameter encoding and associated decoding |