RU2017134913A - EFFECTIVE ENCODING OF AUDIO SCENES CONTAINING AUDIO OBJECTS - Google Patents

EFFECTIVE ENCODING OF AUDIO SCENES CONTAINING AUDIO OBJECTS Download PDF

Info

Publication number
RU2017134913A
RU2017134913A RU2017134913A RU2017134913A RU2017134913A RU 2017134913 A RU2017134913 A RU 2017134913A RU 2017134913 A RU2017134913 A RU 2017134913A RU 2017134913 A RU2017134913 A RU 2017134913A RU 2017134913 A RU2017134913 A RU 2017134913A
Authority
RU
Russia
Prior art keywords
sound objects
metadata
instance
additional information
time
Prior art date
Application number
RU2017134913A
Other languages
Russian (ru)
Other versions
RU2017134913A3 (en
RU2745832C2 (en
Inventor
Хейко ПУРНХАГЕН
Кристофер ЧОЭРЛИНГ
Тони ХИРВОНЕН
Ларс ВИЛЛЕМОЕС
Дирк Йерун БРЕБАРТ
Original Assignee
Долби Интернешнл Аб
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Долби Интернешнл Аб filed Critical Долби Интернешнл Аб
Publication of RU2017134913A publication Critical patent/RU2017134913A/en
Publication of RU2017134913A3 publication Critical patent/RU2017134913A3/ru
Application granted granted Critical
Publication of RU2745832C2 publication Critical patent/RU2745832C2/en

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/01Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/03Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/13Aspects of volume control, not necessarily automatic, in stereophonic sound systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/15Aspects of sound capture and related signal processing for recording or reproduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/07Synergistic effects of band splitting and sub-band processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Stereophonic System (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Claims (53)

1. Способ восстановления и представления звуковых объектов на основе потока данных, включающий:1. A method of restoring and representing sound objects based on a data stream, including: прием потока данных, содержащего:receiving a data stream containing: результат обратно совместимого понижающего микширования, содержащий M сигналов понижающего микширования, которые являются комбинациями N звуковых объектов, при этом N>1 и M≤N, the result of backward compatible down-mix containing M down-mix signals, which are combinations of N sound objects, with N> 1 and M≤N, изменяющуюся во времени дополнительную информацию, содержащую параметры, которые обеспечивают восстановление N звуковых объектов, исходя из M сигналов понижающего микширования, и time-varying additional information containing parameters that provide restoration of N sound objects based on M down-mix signals, and множество экземпляров метаданных, связанных с N звуковыми объектами, при этом множество экземпляров метаданных определяют соответствующие требуемые установки представления для представления N звуковых объектов, и для каждого экземпляра метаданных данные перехода, содержащие начальное время и продолжительность интерполяции от текущей установки представления до требуемой установки представления, определяемой экземпляром метаданных,a plurality of metadata instances associated with N sound objects, wherein a plurality of metadata instances determine the corresponding required presentation settings for representing N sound objects, and for each metadata instance, transition data containing the initial time and duration of the interpolation from the current presentation setting to the desired presentation setting defined metadata instance восстановление N звуковых объектов на основе результата обратно совместимого понижающего микширования и дополнительной информации, иrestoring N sound objects based on the result of backward compatible downmix and additional information, and представление N звуковых объектов в выходные каналы с предварительно определенной конфигурацией канала посредством:representation of N sound objects in output channels with a predetermined channel configuration by: выполнения представления в соответствии с текущей установкой представления;execution of the presentation in accordance with the current installation of the presentation; запуска в начальное время, определяемое данными перехода для экземпляра метаданных, интерполяции от текущей установки представления до требуемой установки представления, определяемой экземпляром метаданных; иstarting at the initial time determined by the transition data for the metadata instance, interpolating from the current view setting to the desired view setting determined by the metadata instance; and завершения интерполяции до требуемой установки представления после отрезка времени, определяемого данными перехода для экземпляра метаданных.completing the interpolation to the desired setting of the view after the length of time determined by the transition data for the metadata instance. 2. Способ по п. 1, отличающийся тем, что экземпляры метаданных, связанные с N звуковыми объектами, содержат информацию о пространственном положении звуковых объектов.2. The method according to p. 1, characterized in that the metadata instances associated with N sound objects contain information about the spatial position of the sound objects. 3. Способ по п. 2, отличающийся тем, что экземпляры метаданных, связанные с N звуковыми объектами, дополнительно содержат одно или более из размера объекта, громкости объекта, значимости объекта, типа содержимого объекта и масок зон.3. The method according to p. 2, characterized in that the metadata instances associated with N sound objects further comprise one or more of the size of the object, the volume of the object, the significance of the object, the type of object content and zone masks. 4. Способ по любому из предыдущих пунктов, отличающийся тем, что начальные моменты времени, связанные с множеством экземпляров метаданных, соответствуют событиям времени, относящимся к звуковому содержимому, таким как границы кадра.4. The method according to any one of the preceding paragraphs, characterized in that the initial points in time associated with multiple instances of metadata correspond to time events related to audio content, such as frame boundaries. 5. Способ по любому из предыдущих пунктов, отличающийся тем, что интерполяция от текущей установки представления до требуемой установки представления является линейной интерполяцией.5. A method according to any one of the preceding paragraphs, characterized in that the interpolation from the current view setting to the desired view setting is linear interpolation. 6. Способ по любому из предыдущих пунктов, отличающийся тем, что поток данных содержит множество экземпляров дополнительной информации, определяющих соответствующие требуемые установки восстановления для восстановления N звуковых объектов, и для каждого экземпляра дополнительной информации данные перехода, содержащие две независимо присваиваемые части, которые в комбинации определяют момент времени для запуска интерполяции от текущей установки восстановления к требуемой установке восстановления, определяемой экземпляром дополнительной информации, и момент времени для завершения интерполяции, и при этом восстановление N звуковых объектов включает:6. A method according to any one of the preceding paragraphs, characterized in that the data stream contains a plurality of additional information instances defining the corresponding required restoration settings for restoring N sound objects, and for each additional information instance, transition data containing two independently assigned parts that are in combination determine the point in time to start the interpolation from the current recovery installation to the desired recovery installation defined by the instance Flax information and time to complete interpolation, and wherein the restoration N audio objects includes: выполнение восстановления в соответствии с текущей установкой восстановления;performing recovery in accordance with the current recovery installation; запуск в момент времени, определяемый данными перехода для экземпляра дополнительной информации, интерполяции от текущей установки восстановления до требуемой установки восстановления, определяемой экземпляром дополнительной информации; иstarting at a time determined by the transition data for the additional information instance, interpolation from the current recovery installation to the desired recovery installation, determined by the additional information instance; and завершение интерполяции в момент времени, определяемый данными перехода для экземпляра дополнительной информации.completion of the interpolation at a time determined by the transition data for an instance of additional information. 7. Система для восстановления и представления звуковых объектов на основе потока данных, содержащая:7. A system for restoring and presenting sound objects based on a data stream, comprising: компонент приема, выполненный для потока данных, содержащего:a receive component configured for a data stream comprising: результат обратно совместимого понижающего микширования, содержащий M сигналов понижающего микширования, которые являются комбинациями N звуковых объектов, при этом N>1 и M≤N, the result of backward compatible down-mix containing M down-mix signals, which are combinations of N sound objects, with N> 1 and M≤N, изменяющуюся во времени дополнительную информацию, содержащую параметры, которые обеспечивают восстановление N звуковых объектов, исходя из M сигналов понижающего микширования, и time-varying additional information containing parameters that provide restoration of N sound objects based on M down-mix signals, and множество экземпляров метаданных, связанных с N звуковыми объектами, при этом множество экземпляров метаданных определяют соответствующие требуемые установки представления для представления N звуковых объектов, и для каждого экземпляра метаданных данные перехода, содержащие начальное время и продолжительность интерполяции от текущей установки представления до требуемой установки представления, определяемой экземпляром метаданных,a plurality of metadata instances associated with N sound objects, wherein a plurality of metadata instances determine the corresponding required presentation settings for representing N sound objects, and for each metadata instance, transition data containing the initial time and duration of the interpolation from the current presentation setting to the desired presentation setting defined metadata instance компонент восстановления, выполненный для восстановления N звуковых объектов на основе результата обратно совместимого понижающего микширования и дополнительной информации,a recovery component designed to restore N sound objects based on the result of backward compatible downmix and additional information, средство представления, выполненное для представления N звуковых объектов в выходные каналы с предварительно определенной конфигурацией канала посредством:presentation means made for presenting N sound objects to output channels with a predetermined channel configuration by: выполнения представления в соответствии с текущей установкой представления.execution of the view in accordance with the current view setup. 8. Структура данных для отображения метаданных, связанных с N звуковыми объектами, содержащая: 8. A data structure for displaying metadata associated with N sound objects, comprising: множество экземпляров метаданных, определяющих соответствующие требуемые установки представления для представления N звуковых объектов, и a plurality of metadata instances defining the corresponding required presentation settings for representing N sound objects, and данные перехода, связанные с каждым экземпляром метаданных, при этом данные перехода содержат начальное время и продолжительность интерполяции от текущей установки представления до требуемой установки представления, определяемой экземпляром метаданных.transition data associated with each instance of metadata, wherein the transition data contains the initial time and duration of the interpolation from the current view setting to the desired view setting determined by the metadata instance. 9. Способ кодирования звуковых объектов как поток данных, включающий: 9. A method of encoding audio objects as a data stream, including: прием N звуковых объектов, при этом N>1, и изменяющихся во времени метаданных, связанных с N звуковыми объектами, описывающих то, каким образом следует представлять N звуковых объектов с целью воспроизведения на стороне декодера;receiving N sound objects, with N> 1, and time-varying metadata associated with N sound objects describing how to represent N sound objects for playback on the decoder side; вычисление результата обратного совместимого понижающегося микширования, содержащего M сигналов понижающего микширования, при этом M≤N, посредством образования комбинаций N звуковых объектов; calculating the result of the backward compatible downmix containing M downmix signals, wherein M N N, by forming combinations of N sound objects; вычисление изменяющейся во времени дополнительной информации, содержащей параметры, которые обеспечивают восстановление N звуковых объектов, исходя из M сигналов понижающего микширования;calculating time-varying additional information containing parameters that provide restoration of N sound objects based on M down-mix signals; включение результата обратно совместимого понижающего микширования и дополнительной информации в поток данных для передачи в декодер; и inclusion of the result of backward compatible down-mix and additional information in the data stream for transmission to the decoder; and дополнительное включение в поток данных:additional inclusion in the data stream: множества экземпляров метаданных, определяющих соответствующие требуемые установки представления для представления N звуковых объектов, и a plurality of metadata instances defining the corresponding required presentation settings for representing N sound objects, and для каждого экземпляра метаданных данных перехода, содержащих начальное время и продолжительность интерполяции от текущей установки представления до требуемой установки представления, определяемой экземпляром метаданных.for each instance of the transition data metadata containing the initial time and duration of the interpolation from the current view setting to the desired view setting determined by the metadata instance. 10. Способ по п. 9, отличающийся тем, что метаданные, связанные с N звуковыми объектами, содержат информацию о пространственном положении звуковых объектов.10. The method according to p. 9, characterized in that the metadata associated with N sound objects contain information about the spatial position of the sound objects. 11. Способ по п. 10, отличающийся тем, что метаданные, связанные с N звуковыми объектами, дополнительно содержат одно или более из размера объекта, громкости объекта, значимости объекта, типа содержимого объекта и масок зон.11. The method according to p. 10, characterized in that the metadata associated with N sound objects, further comprise one or more of the size of the object, the volume of the object, the significance of the object, the type of object content and zone masks. 12. Способ по любому из пп. 9—11, отличающийся тем, что интерполяция от текущей установки представления до требуемой установки представления является линейной интерполяцией.12. The method according to any one of paragraphs. 9-11, characterized in that the interpolation from the current view setting to the desired view setting is linear interpolation. 13. Способ по любому из пп. 9—12, отличающийся тем, что дополнительно включает:13. The method according to any one of paragraphs. 9-12, characterized in that it further includes: включение в поток данных:inclusion in the data stream: множества экземпляров дополнительной информации, определяющих соответствующие требуемые установки восстановления для восстановления звуковых объектов, и a plurality of copies of additional information defining the respective required recovery settings for restoring sound objects, and данных перехода для каждого экземпляра дополнительной информации, содержащих две независимо присваиваемые части, которые в комбинации определяют момент времени для запуска перехода от текущей установки восстановления к требуемой установке восстановления, определяемой экземпляром дополнительной информации, и момент времени для завершения перехода.transition data for each instance of additional information containing two independently assigned parts, which in combination determine the point in time for starting the transition from the current recovery installation to the desired recovery setting, which is determined by the additional information instance, and the moment in time for completing the transition. 14. Кодер для кодирования звуковых объектов как поток данных, содержащий:14. An encoder for encoding audio objects as a data stream containing: приемник, выполненный с возможностью приема N звуковых объектов, при этом N>1, и изменяющихся во времени метаданных, связанных с N звуковыми объектами, описывающих то, каким образом следует представлять N звуковые объекты с целью воспроизведения на стороне декодера;a receiver configured to receive N sound objects, N> 1, and time-varying metadata associated with N sound objects describing how to represent N sound objects for playback on the decoder side; компонент понижающего микширования, выполненный с возможностью вычисления М сигналов понижающего микширования, при этом M≤N, путем формирования комбинаций N звуковых объектов; a downmix component configured to calculate M downmix signals, wherein M N N, by forming combinations of N sound objects; компонент для анализа, выполненный с возможностью вычисления изменяющейся во времени дополнительной информации, содержащей параметры, которые обеспечивают восстановление N звуковых объектов, исходя из M сигналов понижающего микширования;a component for analysis, configured to calculate time-varying additional information containing parameters that provide recovery of N audio objects based on M down-mix signals; компонент уплотнения, выполненный с возможностью включения результата обратно совместимого понижающего микширования и дополнительной информации в поток данных для передачи в декодер; и a compaction component configured to include the result of a backward compatible downmix and additional information in the data stream for transmission to the decoder; and при этом компонент уплотнения дополнительно выполнен с возможностью включения в поток данных:wherein the compaction component is further configured to be included in the data stream: множества экземпляров метаданных, определяющих соответствующие требуемые установки представления для представления N звуковых объектов, и a plurality of metadata instances defining the corresponding required presentation settings for representing N sound objects, and для каждого экземпляра метаданных данных перехода, содержащих начальное время и продолжительность интерполяции от текущей установки представления до требуемой установки представления, определяемой экземпляром метаданных.for each instance of the transition data metadata containing the initial time and duration of the interpolation from the current view setting to the desired view setting determined by the metadata instance. 15. Машиночитаемый носитель, хранящий компьютерный программный продукт, содержащий команды для выполнения способа по любому из пп. 1-6 или команды для выполнения способа по любому из пп. 9-13.15. A machine-readable medium storing a computer program product containing instructions for executing the method according to any one of claims. 1-6 or command to perform the method according to any one of paragraphs. 9-13.
RU2017134913A 2013-05-24 2014-05-23 Efficient encoding of audio scenes containing audio objects RU2745832C2 (en)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
US201361827246P 2013-05-24 2013-05-24
US61/827,246 2013-05-24
US201361893770P 2013-10-21 2013-10-21
US61/893,770 2013-10-21
US201461973625P 2014-04-01 2014-04-01
US61/973,625 2014-04-01

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
RU2015150078A Division RU2634422C2 (en) 2013-05-24 2014-05-23 Effective encoding of sound scenes containing sound objects

Related Child Applications (1)

Application Number Title Priority Date Filing Date
RU2021106814A Division RU2021106814A (en) 2013-05-24 2021-03-16 EFFICIENT ENCODING OF SOUND SCENES CONTAINING SOUND OBJECTS

Publications (3)

Publication Number Publication Date
RU2017134913A true RU2017134913A (en) 2019-02-08
RU2017134913A3 RU2017134913A3 (en) 2020-11-23
RU2745832C2 RU2745832C2 (en) 2021-04-01

Family

ID=50819736

Family Applications (2)

Application Number Title Priority Date Filing Date
RU2015150078A RU2634422C2 (en) 2013-05-24 2014-05-23 Effective encoding of sound scenes containing sound objects
RU2017134913A RU2745832C2 (en) 2013-05-24 2014-05-23 Efficient encoding of audio scenes containing audio objects

Family Applications Before (1)

Application Number Title Priority Date Filing Date
RU2015150078A RU2634422C2 (en) 2013-05-24 2014-05-23 Effective encoding of sound scenes containing sound objects

Country Status (10)

Country Link
US (3) US9852735B2 (en)
EP (3) EP3005353B1 (en)
JP (2) JP6192813B2 (en)
KR (2) KR101751228B1 (en)
CN (4) CN109712630B (en)
BR (1) BR112015029113B1 (en)
ES (1) ES2643789T3 (en)
HK (2) HK1214027A1 (en)
RU (2) RU2634422C2 (en)
WO (1) WO2014187991A1 (en)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101751228B1 (en) * 2013-05-24 2017-06-27 돌비 인터네셔널 에이비 Efficient coding of audio scenes comprising audio objects
WO2015006112A1 (en) * 2013-07-08 2015-01-15 Dolby Laboratories Licensing Corporation Processing of time-varying metadata for lossless resampling
EP2879131A1 (en) 2013-11-27 2015-06-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Decoder, encoder and method for informed loudness estimation in object-based audio coding systems
CN112802496A (en) * 2014-12-11 2021-05-14 杜比实验室特许公司 Metadata-preserving audio object clustering
TWI607655B (en) * 2015-06-19 2017-12-01 Sony Corp Coding apparatus and method, decoding apparatus and method, and program
JP6355207B2 (en) * 2015-07-22 2018-07-11 日本電信電話株式会社 Transmission system, encoding device, decoding device, method and program thereof
US10278000B2 (en) 2015-12-14 2019-04-30 Dolby Laboratories Licensing Corporation Audio object clustering with single channel quality preservation
EP3409029A1 (en) 2016-01-29 2018-12-05 Dolby Laboratories Licensing Corporation Binaural dialogue enhancement
CN106411795B (en) * 2016-10-31 2019-07-16 哈尔滨工业大学 A kind of non-signal estimation method reconstructed under frame
WO2018162472A1 (en) 2017-03-06 2018-09-13 Dolby International Ab Integrated reconstruction and rendering of audio signals
US10891962B2 (en) 2017-03-06 2021-01-12 Dolby International Ab Integrated reconstruction and rendering of audio signals
GB2567172A (en) 2017-10-04 2019-04-10 Nokia Technologies Oy Grouping and transport of audio objects
CN111164679B (en) * 2017-10-05 2024-04-09 索尼公司 Encoding device and method, decoding device and method, and program
GB2578715A (en) * 2018-07-20 2020-05-27 Nokia Technologies Oy Controlling audio focus for spatial audio processing
KR20210092728A (en) * 2018-11-20 2021-07-26 소니그룹주식회사 Information processing apparatus and method, and program
CN114424586A (en) * 2019-09-17 2022-04-29 诺基亚技术有限公司 Spatial audio parameter coding and associated decoding
GB2590650A (en) * 2019-12-23 2021-07-07 Nokia Technologies Oy The merging of spatial audio parameters
KR20230001135A (en) * 2021-06-28 2023-01-04 네이버 주식회사 Computer system for processing audio content to realize customized being-there and method thereof

Family Cites Families (65)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2859333A1 (en) * 1999-04-07 2000-10-12 Dolby Laboratories Licensing Corporation Matrix improvements to lossless encoding and decoding
US6351733B1 (en) * 2000-03-02 2002-02-26 Hearing Enhancement Company, Llc Method and apparatus for accommodating primary content audio and secondary content remaining audio capability in the digital audio production process
US7567675B2 (en) 2002-06-21 2009-07-28 Audyssey Laboratories, Inc. System and method for automatic multiple listener room acoustic correction with low filter orders
DE10344638A1 (en) * 2003-08-04 2005-03-10 Fraunhofer Ges Forschung Generation, storage or processing device and method for representation of audio scene involves use of audio signal processing circuit and display device and may use film soundtrack
FR2862799B1 (en) * 2003-11-26 2006-02-24 Inst Nat Rech Inf Automat IMPROVED DEVICE AND METHOD FOR SPATIALIZING SOUND
US7394903B2 (en) 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
CA2808226C (en) * 2004-03-01 2016-07-19 Dolby Laboratories Licensing Corporation Multichannel audio coding
WO2005098824A1 (en) * 2004-04-05 2005-10-20 Koninklijke Philips Electronics N.V. Multi-channel encoder
GB2415639B (en) 2004-06-29 2008-09-17 Sony Comp Entertainment Europe Control of data processing
SE0402651D0 (en) * 2004-11-02 2004-11-02 Coding Tech Ab Advanced methods for interpolation and parameter signaling
ATE521143T1 (en) * 2005-02-23 2011-09-15 Ericsson Telefon Ab L M ADAPTIVE BIT ALLOCATION FOR MULTI-CHANNEL AUDIO ENCODING
KR101271069B1 (en) 2005-03-30 2013-06-04 돌비 인터네셔널 에이비 Multi-channel audio encoder and decoder, and method of encoding and decoding
CN101253550B (en) * 2005-05-26 2013-03-27 Lg电子株式会社 Method of encoding and decoding an audio signal
WO2007046659A1 (en) * 2005-10-20 2007-04-26 Lg Electronics Inc. Method for encoding and decoding multi-channel audio signal and apparatus thereof
CN101292285B (en) * 2005-10-20 2012-10-10 Lg电子株式会社 Method for encoding and decoding multi-channel audio signal and apparatus thereof
US7965848B2 (en) * 2006-03-29 2011-06-21 Dolby International Ab Reduced number of channels decoding
KR101015037B1 (en) 2006-03-29 2011-02-16 돌비 스웨덴 에이비 Audio decoding
US8379868B2 (en) 2006-05-17 2013-02-19 Creative Technology Ltd Spatial audio coding based on universal spatial cues
MY151722A (en) * 2006-07-07 2014-06-30 Fraunhofer Ges Forschung Concept for combining multiple parametrically coded audio sources
KR101396140B1 (en) * 2006-09-18 2014-05-20 코닌클리케 필립스 엔.브이. Encoding and decoding of audio objects
RU2551797C2 (en) * 2006-09-29 2015-05-27 ЭлДжи ЭЛЕКТРОНИКС ИНК. Method and device for encoding and decoding object-oriented audio signals
RU2407072C1 (en) 2006-09-29 2010-12-20 ЭлДжи ЭЛЕКТРОНИКС ИНК. Method and device for encoding and decoding object-oriented audio signals
JP5325108B2 (en) 2006-10-13 2013-10-23 ギャラクシー ステューディオス エヌヴェー Method and encoder for combining digital data sets, decoding method and decoder for combined digital data sets, and recording medium for storing combined digital data sets
EP2054875B1 (en) * 2006-10-16 2011-03-23 Dolby Sweden AB Enhanced coding and parameter representation of multichannel downmixed object coding
WO2008046530A2 (en) 2006-10-16 2008-04-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for multi -channel parameter transformation
WO2008063035A1 (en) 2006-11-24 2008-05-29 Lg Electronics Inc. Method for encoding and decoding object-based audio signal and apparatus thereof
US8290167B2 (en) 2007-03-21 2012-10-16 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Method and apparatus for conversion between multi-channel audio formats
KR101312470B1 (en) * 2007-04-26 2013-09-27 돌비 인터네셔널 에이비 Apparatus and method for synthesizing an output signal
MX2010004138A (en) 2007-10-17 2010-04-30 Ten Forschung Ev Fraunhofer Audio coding using upmix.
WO2009084916A1 (en) 2008-01-01 2009-07-09 Lg Electronics Inc. A method and an apparatus for processing an audio signal
KR101461685B1 (en) * 2008-03-31 2014-11-19 한국전자통신연구원 Method and apparatus for generating side information bitstream of multi object audio signal
US8060042B2 (en) * 2008-05-23 2011-11-15 Lg Electronics Inc. Method and an apparatus for processing an audio signal
US8315396B2 (en) * 2008-07-17 2012-11-20 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating audio output signals using object based metadata
CN101809656B (en) 2008-07-29 2013-03-13 松下电器产业株式会社 Sound coding device, sound decoding device, sound coding/decoding device, and conference system
EP2175670A1 (en) * 2008-10-07 2010-04-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Binaural rendering of a multi-channel audio signal
WO2010041877A2 (en) * 2008-10-08 2010-04-15 Lg Electronics Inc. A method and an apparatus for processing a signal
MX2011011399A (en) * 2008-10-17 2012-06-27 Univ Friedrich Alexander Er Audio coding using downmix.
EP2214161A1 (en) * 2009-01-28 2010-08-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and computer program for upmixing a downmix audio signal
JP5163545B2 (en) * 2009-03-05 2013-03-13 富士通株式会社 Audio decoding apparatus and audio decoding method
US20100324915A1 (en) * 2009-06-23 2010-12-23 Electronic And Telecommunications Research Institute Encoding and decoding apparatuses for high quality multi-channel audio codec
KR101283783B1 (en) * 2009-06-23 2013-07-08 한국전자통신연구원 Apparatus for high quality multichannel audio coding and decoding
ES2524428T3 (en) * 2009-06-24 2014-12-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio signal decoder, procedure for decoding an audio signal and computer program using cascading stages of audio object processing
JP5793675B2 (en) 2009-07-31 2015-10-14 パナソニックIpマネジメント株式会社 Encoding device and decoding device
KR101805212B1 (en) 2009-08-14 2017-12-05 디티에스 엘엘씨 Object-oriented audio streaming system
ES2644520T3 (en) * 2009-09-29 2017-11-29 Dolby International Ab MPEG-SAOC audio signal decoder, method for providing an up mix signal representation using MPEG-SAOC decoding and computer program using a common inter-object correlation parameter value time / frequency dependent
US9432790B2 (en) 2009-10-05 2016-08-30 Microsoft Technology Licensing, Llc Real-time sound propagation for dynamic sources
JP5771618B2 (en) * 2009-10-19 2015-09-02 ドルビー・インターナショナル・アーベー Metadata time indicator information indicating the classification of audio objects
EP2491551B1 (en) 2009-10-20 2015-01-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus for providing an upmix signal representation on the basis of a downmix signal representation, apparatus for providing a bitstream representing a multichannel audio signal, methods, computer program and bitstream using a distortion control signaling
EP2489038B1 (en) * 2009-11-20 2016-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus for providing an upmix signal representation on the basis of the downmix signal representation, apparatus for providing a bitstream representing a multi-channel audio signal, methods, computer programs and bitstream representing a multi-channel audio signal using a linear combination parameter
TWI444989B (en) 2010-01-22 2014-07-11 Dolby Lab Licensing Corp Using multichannel decorrelation for improved multichannel upmixing
RU2683175C2 (en) 2010-04-09 2019-03-26 Долби Интернешнл Аб Stereophonic coding based on mdct with complex prediction
GB2485979A (en) 2010-11-26 2012-06-06 Univ Surrey Spatial audio coding
JP2012151663A (en) 2011-01-19 2012-08-09 Toshiba Corp Stereophonic sound generation device and stereophonic sound generation method
US9165558B2 (en) * 2011-03-09 2015-10-20 Dts Llc System for dynamically creating and rendering audio objects
US10051400B2 (en) 2012-03-23 2018-08-14 Dolby Laboratories Licensing Corporation System and method of speaker cluster design and rendering
US9516446B2 (en) * 2012-07-20 2016-12-06 Qualcomm Incorporated Scalable downmix design for object-based surround codec with cluster analysis by synthesis
US9761229B2 (en) * 2012-07-20 2017-09-12 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for audio object clustering
EP2883366B8 (en) 2012-08-07 2016-12-14 Dolby Laboratories Licensing Corporation Encoding and rendering of object based audio indicative of game audio content
EP2717265A1 (en) * 2012-10-05 2014-04-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoder, decoder and methods for backward compatible dynamic adaption of time/frequency resolution in spatial-audio-object-coding
US9805725B2 (en) 2012-12-21 2017-10-31 Dolby Laboratories Licensing Corporation Object clustering for rendering object-based audio content based on perceptual criteria
KR20230020553A (en) 2013-04-05 2023-02-10 돌비 인터네셔널 에이비 Stereo audio encoder and decoder
SG10201710019SA (en) 2013-05-24 2018-01-30 Dolby Int Ab Audio Encoder And Decoder
KR101751228B1 (en) * 2013-05-24 2017-06-27 돌비 인터네셔널 에이비 Efficient coding of audio scenes comprising audio objects
CN109887516B (en) 2013-05-24 2023-10-20 杜比国际公司 Method for decoding audio scene, audio decoder and medium
WO2014187989A2 (en) 2013-05-24 2014-11-27 Dolby International Ab Reconstruction of audio scenes from a downmix

Also Published As

Publication number Publication date
KR20160003039A (en) 2016-01-08
BR112015029113B1 (en) 2022-03-22
CN109410964A (en) 2019-03-01
KR102033304B1 (en) 2019-10-17
EP3312835B1 (en) 2020-05-13
JP2016525699A (en) 2016-08-25
US20220189493A1 (en) 2022-06-16
EP3005353A1 (en) 2016-04-13
CN105229733B (en) 2019-03-08
RU2017134913A3 (en) 2020-11-23
CN109712630B (en) 2023-05-30
CN105229733A (en) 2016-01-06
US9852735B2 (en) 2017-12-26
US11705139B2 (en) 2023-07-18
CN110085240A (en) 2019-08-02
WO2014187991A1 (en) 2014-11-27
ES2643789T3 (en) 2017-11-24
RU2745832C2 (en) 2021-04-01
JP2017199034A (en) 2017-11-02
HK1214027A1 (en) 2016-07-15
BR112015029113A2 (en) 2017-07-25
RU2634422C2 (en) 2017-10-27
EP3005353B1 (en) 2017-08-16
RU2015150078A (en) 2017-05-26
JP6192813B2 (en) 2017-09-06
HK1246959A1 (en) 2018-09-14
US20180096692A1 (en) 2018-04-05
JP6538128B2 (en) 2019-07-03
EP3312835A1 (en) 2018-04-25
CN109410964B (en) 2023-04-14
KR20170075805A (en) 2017-07-03
US20160104496A1 (en) 2016-04-14
US11270709B2 (en) 2022-03-08
CN109712630A (en) 2019-05-03
KR101751228B1 (en) 2017-06-27
CN110085240B (en) 2023-05-23
EP3712889A1 (en) 2020-09-23

Similar Documents

Publication Publication Date Title
RU2017134913A (en) EFFECTIVE ENCODING OF AUDIO SCENES CONTAINING AUDIO OBJECTS
WO2016099141A3 (en) Method for fabricating and reproducing multimedia contents, electronic device for performing same, and recording medium in which program for executing same is recorded
MY172752A (en) Decoder for generating a frequency enhanced audio signal, method of decoding encoder for generating an encoded signal and method of encoding using compact selection side information
JP2010148140A5 (en) Information processing apparatus, information processing method, recording medium, program, reproduction control apparatus, and control apparatus
MY190204A (en) Rendering of multichannel audio using interpolated matrices
RU2016114565A (en) INFORMATION PROCESSING DEVICE, METHOD AND PROGRAM
MX2014001871A (en) Encoding device and method, decoding device and method, and program.
WO2012093320A3 (en) Video coding and decoding devices and methods preserving ppg relevant information
JP2009503615A5 (en)
MY195412A (en) Multi-Channel Audio Decoder, Multi-Channel Audio Encoder, Methods, Computer Program and Encoded Audio Representation Using a Decorrelation of Rendered Audio Signals
PH12018500648A1 (en) Audio encoding and decoding using presentation transform parameters
WO2014202672A3 (en) Time scaler, audio decoder, method and a computer program using a quality control
JP2015527609A5 (en)
JP2015133696A5 (en)
JP2014520473A5 (en)
RU2017143404A (en) CODING DEVICE, CODING METHOD, DECODING DEVICE, DECODING METHOD AND PROGRAM
WO2015095166A3 (en) Producing an output need parameter for an encoder
JP2015149705A5 (en)
JP2014222290A5 (en)
WO2009128663A3 (en) A method and an apparatus for processing an audio signal
JP2017519417A5 (en)
MY197797A (en) Method and apparatus for playing an audio/video from a re-positioned playing point
RU2017113711A (en) AUDIO DECODER AND DECODER
EP4300970A3 (en) Systems and methods for video play control
EP4297026A3 (en) Method for decoding and decoder.