RU2019125257A - Декодер звукового сигнала, кодер звукового сигнала, способ выдачи декодированного звукового сигнала, способ выдачи кодированного звукового сигнала, звуковой поток, поставщик звукового потока и компьютерная программа, использующие идентификатор потока - Google Patents

Декодер звукового сигнала, кодер звукового сигнала, способ выдачи декодированного звукового сигнала, способ выдачи кодированного звукового сигнала, звуковой поток, поставщик звукового потока и компьютерная программа, использующие идентификатор потока Download PDF

Info

Publication number
RU2019125257A
RU2019125257A RU2019125257A RU2019125257A RU2019125257A RU 2019125257 A RU2019125257 A RU 2019125257A RU 2019125257 A RU2019125257 A RU 2019125257A RU 2019125257 A RU2019125257 A RU 2019125257A RU 2019125257 A RU2019125257 A RU 2019125257A
Authority
RU
Russia
Prior art keywords
audio
configuration
information
frames
stream
Prior art date
Application number
RU2019125257A
Other languages
English (en)
Other versions
RU2019125257A3 (ru
RU2783228C2 (ru
Inventor
Макс НОЙЕНДОРФ
Маттиас ФЕЛИХ
Маттиас ХИЛЬДЕНБРАНД
Лукас ШУСТЕР
Инго ХОФМАНН
Бернд ХЕРРМАНН
Николаус РЕТТЕЛЬБАХ
Original Assignee
Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. filed Critical Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф.
Publication of RU2019125257A publication Critical patent/RU2019125257A/ru
Publication of RU2019125257A3 publication Critical patent/RU2019125257A3/ru
Application granted granted Critical
Publication of RU2783228C2 publication Critical patent/RU2783228C2/ru

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0017Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/173Transcoding, i.e. converting between two coded representations avoiding cascaded coding-decoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)
  • Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)

Claims (90)

1. Декодер (100; 200) звукового сигнала для выдачи декодированного представления (112; 212) звукового сигнала на основе кодированного представления (110; 210; 312; 412; 550; 600; 700; 800) звукового сигнала,
при этом декодер звукового сигнала выполнен с возможностью настраивать параметры декодирования в зависимости от конфигурационной информации (110a; 222c; 332; 424; 1010, 1030),
при этом декодер звукового сигнала выполнен с возможностью декодировать один или более звуковых кадров с использованием текущей конфигурационной информации (140; 240), и
при этом декодер звукового сигнала выполнен с возможностью сравнивать конфигурационную информацию (110a; 222c; 332; 424; 1010, 1030) в конфигурационной структуре, связанной с одним или более кадров (222), подлежащих декодированию, с текущей конфигурационной информацией (140; 240), и осуществлять переход для выполнения декодирования с использованием конфигурационной информации в конфигурационной структуре, связанной с одним или более кадров, подлежащих декодированию, в качестве новой конфигурационной информации, если конфигурационная информация в конфигурационной структуре, связанной с одним или более кадров, подлежащих декодированию, или релевантная часть (1020a, 1020b, 1022a, 1024a, 1024b, 1026a, 1050a) конфигурационной информации в конфигурационной структуре, связанной с одним или более кадров, подлежащих декодированию, отлична от текущей конфигурационной информации;
при этом декодер звукового сигнала выполнен с возможностью учитывать информацию (230; streamID, 1050a, streamIdentifier) об идентификаторе потока, включенную в конфигурационную структуру, при сравнении конфигурационной информации, так чтобы различие между идентификатором потока, полученным ранее декодером звукового сигнала, и идентификатором потока, представленным информацией об идентификаторе потока в конфигурационной структуре, связанной с одним или более кадров, подлежащих декодированию, побуждало осуществить переход.
2. Декодер звукового сигнала по п. 1, при этом декодер звукового сигнала выполнен с возможностью проверять, содержит ли конфигурационная структура информацию (230; streamID, 1050a, streamIdentifier) об идентификаторе потока, и избирательно учитывать информацию об идентификаторе потока при сравнении, если информация об идентификаторе потока включена в конфигурационную структуру (222c; 1010, 1030).
3. Декодер звукового сигнала по п. 1, при этом декодер звукового сигнала выполнен с возможность проверять, содержит ли конфигурационная структура (222c; 1010, 1030) структуру (226; 1030) расширения конфигурации, и проверять, содержит ли структура расширения конфигурации информацию (230; streamID, 1050a, streamIdentifier) об идентификаторе потока, и
при этом декодер звукового сигнала выполнен с возможностью избирательно учитывать информацию об идентификаторе потока при сравнении, если информация об идентификаторе потока включена в структуру расширения конфигурации.
4. Декодер звукового сигнала по п. 3, при этом декодер звукового сигнала выполнен с возможностью допускать переменное упорядочение элементов (1046a, 1048a, 1050a) конфигурационной информации в структуре (226; 1030; UsacConfigExtension()) расширения конфигурации, и
при этом декодер звукового сигнала выполнен с возможностью учитывать элементы конфигурационной информации, размещенные в структуре расширения конфигурации до информации (230; streamID, 1050a, streamIdentifier) об идентификаторе потока, при сравнении конфигурационной информации в конфигурационной структуре, связанной с одним или более кадров, подлежащих декодированию, с текущей конфигурационной информацией (140; 240), и
при этом декодер звукового сигнала выполнен с возможностью оставлять элементы конфигурационной информации, размещенные в структуре расширения конфигурации после информации об идентификаторе потока, неучтенными при сравнении конфигурационной информации в конфигурационной структуре, связанной с одним или более кадров, подлежащих декодированию, с текущей конфигурационной информацией.
5. Декодер звукового сигнала по п. 4,
при этом декодер звукового сигнала выполнен с возможностью идентифицировать один или более элементов (1046a, 1048a, 1050a) конфигурационной информации в структуре расширения конфигурации на основе одного или более идентификаторов (1042) типа расширения конфигурации, предшествующих соответственным элементам конфигурационной информации.
6. Декодер звукового сигнала по п. 3, при этом структура (226; 1030) расширения конфигурации является подструктурой данных конфигурационной структуры (222c; 1010, 1030), при этом наличие структуры расширения конфигурации указывается битом (UsacConfigExtensionPresent) конфигурационной структуры (222c; 1010, 1030), который оценивается декодером звукового сигнала, и
при этом информация (230; streamID, 1050a, streamIdentifier) об идентификаторе потока является подэлементом данных структуры расширения конфигурации,
при этом наличие информации об идентификаторе потока указывается идентификатором (1042) типа расширения конфигурации, связанным с информацией об идентификаторе потока, который оценивается декодером звукового сигнала.
7. Декодер звукового сигнала по п. 1,
при этом декодер звукового сигнала выполнен с возможностью получать и обрабатывать представление звукового кадра, которое содержит информацию (222b) с произвольным доступом,
при этом информация с произвольным доступом содержит конфигурационную структуру (222c; 1010, 1030)) и информацию (222d; AccessUnit()) для приведения состояния тракта обработки декодера звукового сигнала в требуемое состояние,
при этом декодер звукового сигнала выполнен с возможностью осуществлять плавный переход между звуковой информацией (272), представленной звуковым кадром (220), обработанным раньше прибытия представления звукового кадра, которое содержит информацию с произвольным доступом, и звуковой информацией (276), выведенной на основе представления (222) звукового кадра, которое содержит информацию с произвольным доступом, после инициализации декодера звукового сигнала с использованием конфигурационной структуры (222c) информации с произвольным доступом и после настройки состояния декодера звукового сигнала с использованием информации (222d) для приведения состояния тракта обработки в требуемое состояние, если декодер звукового сигнала находит, что конфигурационная информация в конфигурационной структуре (222c) информации с произвольным доступом или релевантная часть конфигурационной информации в конфигурационной структуре информации с произвольным доступом отличается от текущей конфигурационной информации (240).
8. Декодер звукового сигнала по п. 7, при этом декодер звукового сигнала выполнен с возможностью продолжать декодирование без выполнения инициализации декодера звукового сигнала и без использования информации (222d) для приведения состояния тракта обработки декодера звукового сигнала в требуемое состояние, если декодер звукового сигнала декодировал звуковой кадр, непосредственно предшествующий звуковому кадру, представленному представлением звукового кадра, которое содержит информацию с произвольным доступом, и если декодер звукового сигнала находит, что релевантная часть конфигурационной информации (222c) в конфигурационной структуре информации с произвольным доступом идентична текущей конфигурационной информации (240).
9. Декодер звукового сигнала по п. 7, при этом декодер звукового сигнала выполнен с возможностью выполнять инициализацию декодера звукового сигнала с использованием конфигурационной структуры (222c) информации с произвольным доступом и настраивать состояние декодера звукового сигнала с использованием информации (222d) для приведения состояния тракта обработки в требуемое состояние, если декодер звукового сигнала не декодировал звуковой кадр, непосредственно предшествующий звуковому кадру, представленному представлением звукового кадра, которое содержит информацию с произвольным доступом.
10. Кодер (300) звукового сигнала для выдачи кодированного представления (110; 210; 312; 412; 550; 600; 700; 800) звукового сигнала,
при этом кодер звукового сигнала выполнен с возможностью кодировать перекрывающиеся или неперекрывающиеся кадры звукового сигнала (310) с использованием параметров кодирования, для получения кодированного представления звукового сигнала,
при этом кодер звукового сигнала выполнен с возможностью выдавать конфигурационную структуру (110a; 222c; 332; 424; 1010, 1030), описывающую параметры кодирования или параметры декодирования, подлежащие использованию декодером звукового сигнала,
при этом конфигурационная структура содержит идентификатор (230; streamID, 1050a, streamIdentifier) потока.
11. Кодер звукового сигнала по п. 10, при этом кодер звукового сигнала выполнен с возможностью включать идентификатор потока (230; streamID, 1050a, streamIdentifier) в структуру (226; 1030; UsacConfigExtension()) расширения конфигурации конфигурационной структуры (222c; 1010), при этом структура расширения конфигурации, содержащая идентификатор потока, может активироваться и деактивироваться кодером звукового сигнала.
12. Кодер звукового сигнала по п. 11, при этомпри этом кодер звукового сигнала выполнен с возможностью включать в структуру (226; 1030; UsacConfigExtension()) расширения конфигурации идентификатор (1042) типа расширения конфигурации, назначающий идентификатор потока, чтобы сигнализировать о наличии идентификатора (230; streamID, 1050a, streamIdentifier) потока в структуре расширения конфигурации.
13. Кодер звукового сигнала по п. 10, при этом кодер звукового сигнала выполнен с возможностью выдавать по меньшей мере одну конфигурационную структуру (222c; 1010, 1030), содержащую идентификатор потока, и по меньшей мере одну конфигурационную структуру, не содержащую идентификатор потока.
14. Кодер звукового сигнала по п. 10, при этом кодер звукового сигнала выполнен с возможностью переключаться между выдачей первой кодированной звуковой информации (552; 710, 720; 810), которая представлена первой последовательностью звуковых кадров, и второй кодированной звуковой информации (554; 730, 740, 750; 820), которая представлена второй последовательностью звуковых кадров,
при этом надлежащее воспроизведение первого звукового кадра (730; 820a) второй последовательности звуковых кадров после воспроизведения последнего кадра (720; 810e) первой последовательности звуковых кадров требует повторной инициализации декодера звукового сигнала;
при этом кодер звукового сигнала выполнен с возможностью включать в представление звукового кадра, представляющее первый кадр второй последовательности звуковых кадров, конфигурационную структуру (222c; 1010, 1030), содержащую идентификатор (230; streamID, 1050a, streamIdentifier) потока, связанный со второй последовательностью звуковых кадров,
при этом идентификатор потока, связанный со второй последовательностью звуковых кадров, отличен от идентификатора потока, связанного с первой последовательностью звуковых кадров.
15. Кодер звукового сигнала по п. 10, при этом кодер звукового сигнала не выдает никакой другой сигнальной информации, указывающей переключение с первой последовательности информации (552; 710, 720; 810) звуковых кадров на вторую последовательность звуковых кадров (554; 730, 740, 750; 820), кроме идентификатора потока.
16. Кодер звукового сигнала по п. 14, при этом кодер звукового сигнала выполнен с возможностью выдавать первую последовательность звуковых кадров (552; 710, 720; 810) и вторую последовательность звуковых кадров (554; 730, 740, 750; 820) с использованием разных скоростей передачи битов, и
при этом кодер звукового сигнала выполнен с возможностью сигнализировать на декодер звукового сигнала идентичную конфигурационную информацию (222c; 1010, 1030) декодера для декодирования первой последовательности звуковых кадров и для декодирования второй последовательности звуковых кадров, за исключением разных идентификаторов (230; streamID, 1050a, streamIdentifier) битового потока.
17. Способ выдачи декодированного представления звукового сигнала на основе кодированного представления звукового сигнала,
при этом способ содержит этап, на котором настраивают параметры декодирования в зависимости от конфигурационной информации (110a; 222c; 332; 424; 1010, 1030),
при этом способ содержит этап, на котором декодируют один или более звуковых кадров с использованием текущей конфигурационной информации (140; 240), и
при этом способ содержит этап, на котором сравнивают конфигурационную информацию (110a; 222c; 332; 424; 1010, 1030) в конфигурационной структуре, связанной с одним или более кадров (222), подлежащих декодированию, с текущей конфигурационной информацией (140; 240), и при этом способ содержит этап, на котором осуществляют переход для выполнения декодирования с использованием конфигурационной информации в конфигурационной структуре, связанной с одним или более кадров, подлежащих декодированию, в качестве новой конфигурационной информации, если конфигурационная информация в конфигурационной структуре, связанной с одним или более кадров, подлежащих декодированию, или релевантная часть (1020a, 1020b, 1022a, 1024a, 1024b, 1026a, 1050a) конфигурационной информации в конфигурационной структуре, связанной с одним или более кадров, подлежащих декодированию, отлична от текущей конфигурационной информации;
при этом способ содержит этап, на котором учитывают информацию (230; streamID, 1050a, streamIdentifier) об идентификаторе потока, включенную в конфигурационную структуру, при сравнении конфигурационной информации, так чтобы различие между идентификатором потока, полученным ранее при декодировании звукового сигнала, и идентификатором потока, представленным информацией об идентификаторе потока в конфигурационной структуре, связанной с одним или более кадров, подлежащих декодированию, побуждало осуществить переход.
18. Способ выдачи кодированного представления (110; 210; 312; 412; 550; 600; 700; 800) звукового сигнала,
при этом способ содержит этап, на котором кодируют перекрывающиеся или неперекрывающиеся кадры звукового сигнала (310) с использованием параметров кодирования, для получения кодированного представления звукового сигнала,
при этом способ содержит этап, на котором выдают конфигурационную структуру (110a; 222c; 332; 424; 1010, 1030), описывающую параметры кодирования или параметры декодирования, подлежащие использованию декодером звукового сигнала,
при этом конфигурационная структура содержит идентификатор (230; streamID, 1050a, streamIdentifier) потока.
19. Звуковой поток (110; 210; 312; 412; 550; 600; 700; 800), содержащий:
кодированное представление (222a) перекрывающихся или неперекрывающихся кадров звукового сигнала; и
конфигурационную структуру (222c), описывающую параметры кодирования или параметры декодирования, подлежащие использованию декодером звукового сигнала,
при этом конфигурационная структура содержит информацию (230; streamID, 1050a, streamIdentifier) об идентификаторе, представляющую собой идентификатор потока.
20. Звуковой поток по п. 19,
в котором информация (230; streamID, 1050a, streamIdentifier) об идентификаторе потока включена в структуру (226; 1030; UsacConfigExtension()) расширения конфигурации, и
при этом структура расширения конфигурации является подструктурой данных конфигурационной структуры (222c; 1010), при этом наличие структуры расширения конфигурации указывается битом (UsacConfigExtensionPresent) конфигурационной структуры, и
при этом информация (230; streamID, 1050a, streamIdentifier) об идентификаторе потока является подэлементом данных структуры расширения конфигурации,
при этом наличие информации об идентификаторе потока указывается идентификатором (1042) типа расширения конфигурации, связанным с информацией об идентификаторе потока.
21. Звуковой поток по п. 19, в котором идентификатор потока встроен в подструктуру (222c, 226; 1010, 1030) данных представления (222) звукового кадра.
22. Звуковой поток по п. 19, в котором идентификатор потока встроен только в подструктуру данных представления звукового кадра, содержащего конфигурационную структуру.
23. Поставщик (400) звукового потока для выдачи кодированного представления (110; 210; 312; 412; 550; 600; 700; 800) звукового сигнала,
при этом поставщик звукового потока выполнен с возможностью выдавать кодированные варианты (220, 222; 710, 720, 730, 740, 750; 810a-810e, 820a-820d, 830a-830d) перекрывающихся или неперекрывающихся кадров звукового сигала, кодированные с использованием параметров кодирования, в виде части кодированного представления звукового сигнала,
при этом поставщик звукового потока выполнен с возможностью выдавать конфигурационную структуру (220; 1010, 1030), описывающую параметры кодирования или параметры декодирования, подлежащие использованию декодером звукового сигнала, в виде части кодированного представления звукового сигнала,
при этом конфигурационная структура содержит идентификатор (230; streamID, 1050a, streamIdentifier) потока.
24. Поставщик звукового потока по п. 23, при этом поставщик звукового потока выполнен с возможностью выдавать кодированное представление звукового сигнала, так чтобы идентификатор (230; streamID, 1050a, streamIdentifier) потока был включен в структуру (222c; 1030) расширения конфигурации конфигурационной структуры, при этом структура расширения конфигурации, содержащая идентификатор потока, может активироваться и деактивироваться одним или более битов (UsacConfigExtensionPresent) в конфигурационной структуре.
25. Поставщик звукового потока по п. 24, при этом поставщик звукового потока выполнен с возможностью выдавать кодированное представление звукового сигнала, так чтобы структура расширения конфигурации содержала идентификатор (1042) типа расширения конфигурации, назначающий идентификатор (230; streamID, 1050a, streamIdentifier) потока, чтобы сигнализировать о наличии идентификатора потока в структуре расширения конфигурации.
26. Поставщик звукового потока по п. 23, при этом поставщик звукового потока выполнен с возможностью выдавать кодированное представление звукового сигнала, так чтобы кодированное представление звукового сигнала содержало по меньшей мере одну конфигурационную структуру (222c; 1010, 1030), содержащую идентификатор потока, и по меньшей мере одну конфигурационную структуру, не содержащую идентификатор потока.
27. Поставщик звукового потока по п. 23, при этом поставщик звукового потока выполнен с возможностью переключаться между выдачей первой частичной информации (552; 710, 720; 810) кодированной звуковой информации, которая представлена первой последовательностью звуковых кадров, и второй частью (554; 730, 740, 750; 820) кодированной звуковой информации, которая представлена второй последовательностью звуковых кадров,
при этом надлежащее воспроизведение первого звукового кадра (730; 820a) второй последовательности звуковых кадров после воспроизведения последнего кадра (720; 810e) первой последовательности звуковых кадров требует повторной инициализации декодера звукового сигнала;
при этом поставщик звукового потока выполнен с возможностью выдавать кодированное представление звукового сигнала, так чтобы представление звукового кадра, представляющее первый кадр второй последовательности звуковых кадров, включало в себя конфигурационную структуру (222c; 1010), содержащую идентификатор (230; streamID, 1050a, streamIdentifier) потока, связанный со второй последовательностью звуковых кадров,
при этом идентификатор потока, связанный со второй последовательностью звуковых кадров, отличен от идентификатора потока, связанного с первой последовательностью звуковых кадров.
28. Поставщик звукового потока по п. 23, при этом поставщик звукового потока выполнен с возможностью выдавать кодированное представление звукового сигнала, так чтобы кодированное представление звукового сигнала не давало никакой другой сигнальной информации, указывающей переключение с первой последовательности звуковых кадров на вторую последовательность звуковых кадров, кроме идентификатора потока.
29. Поставщик звукового потока по п. 27, при этом поставщик звукового потока выполнен с возможностью выдавать кодированное представление звукового сигнала, так чтобы первая последовательность звуковых кадров (552; 710, 720; 810) и вторая последовательность звуковых кадров (554; 730, 740, 750; 820) кодировались с использованием разных скоростей передачи битов, и
при этом поставщик звукового потока выполнен с возможностью выдавать кодированное представление звукового сигнала, так чтобы кодированное представление звукового сигнала сигнализировало декодеру звукового сигнала идентичную конфигурационную информацию декодера для декодирования первой последовательности звуковых кадров и для декодирования второй последовательности звуковых кадров, за исключением разных идентификаторов битового потока.
30. Поставщик звукового потока по п. 23, при этом поставщик звукового потока выполнен с возможностью переключаться между выдачей первой последовательности звуковых кадров (552; 710, 720; 810) и второй последовательности звуковых кадров (554; 730, 740, 750; 820) в декодер звукового сигнала,
при этом первая последовательность звуковых кадров и вторая последовательность звуковых кадров кодируются с использованием разных скоростей передачи битов,
при этом поставщик звукового потока выполнен с возможностью избирательно переключаться между выдачей первой последовательностью звуковых кадров и выдачей второй последовательности звуковых кадров на звуковом кадре, для которого представление звукового кадра содержит информацию (222b; AudioPreRoll()) с произвольным доступом, тем временем, избегая переключения между последовательностями на звуковых кадрах, которые не содержат информацию с произвольным доступом,
при этом поставщик звукового потока выполнен с возможностью выдавать кодированное представление звукового сигнала, так чтобы идентификатор потока был включен в конфигурационную структуру (222c; 1010, 1030) звукового кадра, который выдается при переключении с первой последовательности звуковых кадров на вторую последовательность звуковых кадров.
31. Поставщик звукового потока по п. 30, при этом поставщик звукового потока выполнен с возможностью получать множество параллельных последовательностей (520, 530) звуковых кадров, кодированных с использованием разных скоростей передачи битов, и при этом поставщик звукового потока выполнен с возможностью переключаться между выдачей кадров из разных последовательностей в декодер звукового сигнала, при этом поставщик звукового потока выполнен с возможностью сигнализировать на декодер звукового сигнала, с какой из последовательностей связаны один или более кадров, с использованием идентификатора потока, который включен в конфигурационную структуру первого представления звукового кадра, предусмотренного после переключения.
32. Способ выдачи кодированного представления звукового сигнала,
при этом способ содержит этап, на котором выдают кодированные варианты перекрывающихся или неперекрывающихся кадров звукового сигнала, кодированные с использованием параметров кодирования, в виде части кодированного представления звукового сигнала,
при этом способ содержит этап, на котором выдают конфигурационную структуру, описывающую параметры кодирования или параметры декодирования, подлежащие использованию декодером звукового сигнала, в виде части кодированного представления звукового сигнала,
при этом конфигурационная структура содержит идентификатор потока.
33. Компьютерная программа для выполнения способа по п. 17 или по п. 18 или 32, когда компьютерная программа работает на компьютере.
34. Декодер (100; 200) звукового сигнала для выдачи декодированного представления (112; 212) звукового сигнала на основе кодированного представления (110; 210; 312; 412; 550; 600; 700; 800) звукового сигнала,
при этом декодер звукового сигнала выполнен с возможностью настраивать параметры декодирования в зависимости от конфигурационной информации (110a; 222c; 332; 424; 1010, 1030),
при этом декодер звукового сигнала выполнен с возможностью декодировать один или более звуковых кадров с использованием текущей конфигурационной информации (140; 240), и
при этом декодер звукового сигнала выполнен с возможностью сравнивать конфигурационную информацию (110a; 222c; 332; 424; 1010, 1030) в конфигурационной структуре, связанной с одним или более кадров (222), подлежащих декодированию, с текущей конфигурационной информацией (140; 240), и осуществлять переход для выполнения декодирования с использованием конфигурационной информации в конфигурационной структуре, связанной с одним или более кадров, подлежащих декодированию, в качестве новой конфигурационной информации, если конфигурационная информация в конфигурационной структуре, связанной с одним или более кадров, подлежащих декодированию, или релевантная часть (1020a, 1020b, 1022a, 1024a, 1024b, 1026a, 1050a) конфигурационной информации в конфигурационной структуре, связанной с одним или более кадров, подлежащих декодированию, отлична от текущей конфигурационной информации;
при этом декодер звукового сигнала выполнен с возможностью учитывать информацию (230; streamID, 1050a, streamIdentifier) об идентификаторе потока, включенную в конфигурационную структуру, при сравнении конфигурационной информации, так чтобы различие между идентификатором потока, полученным ранее декодером звукового сигнала, и идентификатором потока, представленным информацией об идентификаторе потока в конфигурационной структуре, связанной с одним или более кадров, подлежащих декодированию, побуждало осуществить переход;
при этом декодер звукового сигнала выполнен с возможность проверять, содержит ли конфигурационная структура (222c; 1010, 1030) структуру (226; 1030) расширения конфигурации, и проверять, содержит ли структура расширения конфигурации информацию (230; streamID, 1050a, streamIdentifier) об идентификаторе потока, и
при этом декодер звукового сигнала выполнен с возможностью избирательно учитывать информацию об идентификаторе потока при сравнении, если информация об идентификаторе потока включена в структуру расширения конфигурации;
при этом декодер звукового сигнала выполнен с возможностью допускать переменное упорядочение элементов (1046a, 1048a, 1050a) конфигурационной информации в структуре (226; 1030; UsacConfigExtension()) расширения конфигурации, и
при этом декодер звукового сигнала выполнен с возможностью учитывать элементы конфигурационной информации, размещенные в структуре расширения конфигурации до информации (230; streamID, 1050a, streamIdentifier) об идентификаторе потока, при сравнении конфигурационной информации в конфигурационной структуре, связанной с одним или более кадров, подлежащих декодированию, с текущей конфигурационной информацией (140; 240), и
при этом декодер звукового сигнала выполнен с возможностью оставлять элементы конфигурационной информации, размещенные в структуре расширения конфигурации после информации об идентификаторе потока, неучтенными при сравнении конфигурационной информации в конфигурационной структуре, связанной с одним или более кадров, подлежащих декодированию, с текущей конфигурационной информацией.
RU2019125257A 2017-01-10 2018-01-10 Декодер звукового сигнала, кодер звукового сигнала, способ выдачи декодированного звукового сигнала, способ выдачи кодированного звукового сигнала, звуковой поток, поставщик звукового потока и компьютерная программа, использующие идентификатор потока RU2783228C2 (ru)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
EP17150915 2017-01-10
EP17150915.1 2017-01-10
EP17151083 2017-01-11
EP17151083.7 2017-01-11
PCT/EP2018/050575 WO2018130577A1 (en) 2017-01-10 2018-01-10 Audio decoder, audio encoder, method for providing a decoded audio signal, method for providing an encoded audio signal, audio stream, audio stream provider and computer program using a stream identifier

Related Child Applications (5)

Application Number Title Priority Date Filing Date
RU2022119879A Division RU2022119879A (ru) 2017-01-10 2018-01-10 Декодер звукового сигнала, кодер звукового сигнала, способ выдачи декодированного звукового сигнала, способ выдачи кодированного звукового сигнала, звуковой поток, поставщик звукового потока и компьютерная программа, использующие идентификатор потока
RU2022119880A Division RU2022119880A (ru) 2017-01-10 2018-01-10 Декодер звукового сигнала, кодер звукового сигнала, способ выдачи декодированного звукового сигнала, способ выдачи кодированного звукового сигнала, звуковой поток, поставщик звукового потока и компьютерная программа, использующие идентификатор потока
RU2022119877A Division RU2022119877A (ru) 2017-01-10 2018-01-10 Декодер звукового сигнала, кодер звукового сигнала, способ выдачи декодированного звукового сигнала, способ выдачи кодированного звукового сигнала, звуковой поток, поставщик звукового потока и компьютерная программа, использующие идентификатор потока
RU2022119882A Division RU2022119882A (ru) 2017-01-10 2018-01-10 Декодер звукового сигнала, кодер звукового сигнала, способ выдачи декодированного звукового сигнала, способ выдачи кодированного звукового сигнала, звуковой поток, поставщик звукового потока и компьютерная программа, использующие идентификатор потока
RU2022119878A Division RU2022119878A (ru) 2017-01-10 2018-01-10 Декодер звукового сигнала, кодер звукового сигнала, способ выдачи декодированного звукового сигнала, способ выдачи кодированного звукового сигнала, звуковой поток, поставщик звукового потока и компьютерная программа, использующие идентификатор потока

Publications (3)

Publication Number Publication Date
RU2019125257A true RU2019125257A (ru) 2021-02-12
RU2019125257A3 RU2019125257A3 (ru) 2021-06-11
RU2783228C2 RU2783228C2 (ru) 2022-11-10

Family

ID=

Also Published As

Publication number Publication date
US11217260B2 (en) 2022-01-04
CN117037804A (zh) 2023-11-10
AU2024201516A1 (en) 2024-03-28
JP7295190B2 (ja) 2023-06-20
EP3822969A1 (en) 2021-05-19
JP6955029B2 (ja) 2021-10-27
US11837247B2 (en) 2023-12-05
CA3049729C (en) 2023-09-05
CN116631413A (zh) 2023-08-22
CN117037806A (zh) 2023-11-10
CA3206050A1 (en) 2018-07-19
KR20230129569A (ko) 2023-09-08
US20190371351A1 (en) 2019-12-05
MX2022015787A (es) 2023-02-27
MX2022015782A (es) 2023-02-27
ZA201905161B (en) 2020-03-25
PL3568853T3 (pl) 2021-06-14
KR20210129255A (ko) 2021-10-27
CN116631414A (zh) 2023-08-22
CN116631415A (zh) 2023-08-22
AU2022201458B2 (en) 2023-12-07
KR102572557B1 (ko) 2023-08-30
CN110476207A (zh) 2019-11-19
MX2022015783A (es) 2023-02-27
TW201832225A (zh) 2018-09-01
ES2953832T3 (es) 2023-11-16
RU2019125257A3 (ru) 2021-06-11
TWI673708B (zh) 2019-10-01
AU2018208522B2 (en) 2020-07-02
MX2019008250A (es) 2019-09-13
AU2022201458A1 (en) 2022-03-24
AU2024201507A1 (en) 2024-03-28
JP2022008681A (ja) 2022-01-13
MX2022015786A (es) 2023-02-27
US20220262379A1 (en) 2022-08-18
MX2022015785A (es) 2023-02-27
CN116631417A (zh) 2023-08-22
AU2018208522A1 (en) 2019-07-25
AU2020244609A1 (en) 2020-10-29
EP3568853B1 (en) 2020-12-16
EP3822969C0 (en) 2023-07-26
WO2018130577A1 (en) 2018-07-19
PL3822969T3 (pl) 2024-01-08
US20240062768A1 (en) 2024-02-22
JP2023126775A (ja) 2023-09-12
AU2020244609B2 (en) 2022-04-07
EP4235662A2 (en) 2023-08-30
EP3568853A1 (en) 2019-11-20
SG11201906367PA (en) 2019-08-27
KR20190103364A (ko) 2019-09-04
EP3822969B1 (en) 2023-07-26
EP4235662A3 (en) 2023-10-11
KR102315774B1 (ko) 2021-10-22
CN110476207B (zh) 2023-09-01
CN117037807A (zh) 2023-11-10
JP2020507131A (ja) 2020-03-05
BR112019014283A2 (pt) 2020-02-11
SG10202100336WA (en) 2021-02-25
CA3049729A1 (en) 2018-07-19
CN117037805A (zh) 2023-11-10
CN116631416A (zh) 2023-08-22
ES2853936T3 (es) 2021-09-20
AU2024201519A1 (en) 2024-03-28

Similar Documents

Publication Publication Date Title
KR101871643B1 (ko) 적어도 하나의 필 요소 내의 향상된 스펙트럼 대역 복제 메타데이터를 사용한 오디오 비트스트림들의 디코딩
JP2016029823A5 (ru)
TW200746051A (en) Apparatus and method for encoding and decoding signal
RU2014146734A (ru) Устройство и способ обработки изображений
RU2707151C2 (ru) Аудиокодер, аудиодекодер, способ кодирования аудиосигнала и способ декодирования кодированного аудиосигнала
EP1938662A4 (en) DEVICE FOR ENCODING AND DECODING AUDIO SIGNAL AND CORRESPONDING METHOD
BR112021022471A2 (pt) Vários conjuntos de filtros em laço adaptativos para codificação de vídeo
RU2016118985A (ru) Аудиодекодер, устройство формирования выходных кодированных аудиоданных и способы, позволяющие инициализацию декодера
JP2010210680A5 (ru)
JP2005510102A (ja) データフレームが符号化された付加データを含んでいるか否かを判定する方法及び装置
RU2011140533A (ru) Способ кодирования аудиосигнала, способ декодирования аудиосигнала, устройство кодирования, устройство декодирования, система обработки аудиосигнала, программа кодирования аудиосигнала и программа декодирования аудиосигнала
RU2017143404A (ru) Устройство кодирования, способ кодирования, устройство декодирования, способ декодирования и программа
RU2007141938A (ru) Энтропийное кодирование с помощью компактных кодовых книг
RU2010142198A (ru) Носитель записи, устройство записи, способ записи и устройство воспроизведения
JP2020522170A5 (ru)
MX2022015783A (es) Decodificador de audio, codificador de audio, metodo para proveer una se?al de audio decodificada, metodo para proveer una se?al de audio codificada, flujo de audio, proveedor de flujos de audio y programa de computacion que utiliza un identificador de flujo.
BR112022007735A2 (pt) Distribuição de taxa de bits em serviços de voz e áudio imersivos
JP2010522348A (ja) オーディオ信号のエンコーディング方法及び装置、そしてオーディオ信号のデコーディング方法及び装置
KR20150009474A (ko) 다채널 신호를 위한 인코더 및 인코딩 방법, 다채널 신호를 위한 디코더 및 디코딩 방법
WO2017186040A1 (zh) 一种音频信号编码、解码方法及音频信号编码器、解码器
RU2022119877A (ru) Декодер звукового сигнала, кодер звукового сигнала, способ выдачи декодированного звукового сигнала, способ выдачи кодированного звукового сигнала, звуковой поток, поставщик звукового потока и компьютерная программа, использующие идентификатор потока
RU2022119879A (ru) Декодер звукового сигнала, кодер звукового сигнала, способ выдачи декодированного звукового сигнала, способ выдачи кодированного звукового сигнала, звуковой поток, поставщик звукового потока и компьютерная программа, использующие идентификатор потока
RU2022119878A (ru) Декодер звукового сигнала, кодер звукового сигнала, способ выдачи декодированного звукового сигнала, способ выдачи кодированного звукового сигнала, звуковой поток, поставщик звукового потока и компьютерная программа, использующие идентификатор потока
RU2022119882A (ru) Декодер звукового сигнала, кодер звукового сигнала, способ выдачи декодированного звукового сигнала, способ выдачи кодированного звукового сигнала, звуковой поток, поставщик звукового потока и компьютерная программа, использующие идентификатор потока
RU2022119880A (ru) Декодер звукового сигнала, кодер звукового сигнала, способ выдачи декодированного звукового сигнала, способ выдачи кодированного звукового сигнала, звуковой поток, поставщик звукового потока и компьютерная программа, использующие идентификатор потока