RU2011102416A - Усовершенствованный метод кодирования и параметрического представления кодирования многоканального объекта после понижающего микширования - Google Patents

Усовершенствованный метод кодирования и параметрического представления кодирования многоканального объекта после понижающего микширования Download PDF

Info

Publication number
RU2011102416A
RU2011102416A RU2011102416/08A RU2011102416A RU2011102416A RU 2011102416 A RU2011102416 A RU 2011102416A RU 2011102416/08 A RU2011102416/08 A RU 2011102416/08A RU 2011102416 A RU2011102416 A RU 2011102416A RU 2011102416 A RU2011102416 A RU 2011102416A
Authority
RU
Russia
Prior art keywords
audio
output
parameters
channels
audio objects
Prior art date
Application number
RU2011102416/08A
Other languages
English (en)
Other versions
RU2485605C2 (ru
Inventor
Йонас ЭНГДЕГАРД (SE)
Йонас ЭНГДЕГАРД
Ларс ВИЛЛЕМОЕС (SE)
Ларс ВИЛЛЕМОЕС
Хайко ПУРНАГЕН (SE)
Хайко ПУРНАГЕН
Барбара РЕШ (SE)
Барбара Реш
Original Assignee
Долби Свиден АБ, (SE)
Долби Свиден АБ,
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Долби Свиден АБ, (SE), Долби Свиден АБ, filed Critical Долби Свиден АБ, (SE)
Publication of RU2011102416A publication Critical patent/RU2011102416A/ru
Application granted granted Critical
Publication of RU2485605C2 publication Critical patent/RU2485605C2/ru

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/173Transcoding, i.e. converting between two coded representations avoiding cascaded coding-decoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/02Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/03Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/11Positioning of individual sound objects, e.g. moving airplane, within a sound field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 

Abstract

1. Аудиосинтезатор (104), предназначенный для генерирования выходных данных с использованием закодированного сигнала аудиообъекта (95, 97), характеризующийся тем, что включает в себя синтезатор выходных данных (100), генерирующий на выходе параметры, применимые для представления множества выходных каналов с предварительно заданной конфигурацией выходного аудиосигнала, отображающего множество аудиообъектов, при этом синтезатор выходных данных предусматривает возможность использования информации понижающего микширования, содержащую указания на распределение множества аудиообъектов, по крайней мере, по двум каналам понижающего микширования, и параметр объекта для аудиообъектов, причем синтезатор выходных данных (100) перекодирует (502)параметры аудиообъекта в пространственные параметры для предварительно заданной конфигурации выходного аудиосигнала, дополнительно используя заданное расположение (А) аудиообъектов (90) в конфигурации выходного аудиосигнала. ! 2. Аудиосинтезатор по п.1, характеризующийся тем, что синтезатор выходных данных (100) предназначен для преобразования множества каналов понижающего микширования в понижающее стереомикширование для предварительно заданной конфигурации выходного аудиосигнала, с использованием матрицы преобразования (G), сформированной исходя из заданного пространственного расположения аудиообъектов (А). ! 3. Аудиосинтезатор по п.1, характеризующийся тем, что пространственные параметры включают в себя первую группу параметров для повышающего микширования "два-к-трем" и вторую группу энергетических параметров для повышающего микширования "три-к-шести", а синтезатор выход

Claims (13)

1. Аудиосинтезатор (104), предназначенный для генерирования выходных данных с использованием закодированного сигнала аудиообъекта (95, 97), характеризующийся тем, что включает в себя синтезатор выходных данных (100), генерирующий на выходе параметры, применимые для представления множества выходных каналов с предварительно заданной конфигурацией выходного аудиосигнала, отображающего множество аудиообъектов, при этом синтезатор выходных данных предусматривает возможность использования информации понижающего микширования, содержащую указания на распределение множества аудиообъектов, по крайней мере, по двум каналам понижающего микширования, и параметр объекта для аудиообъектов, причем синтезатор выходных данных (100) перекодирует (502)параметры аудиообъекта в пространственные параметры для предварительно заданной конфигурации выходного аудиосигнала, дополнительно используя заданное расположение (А) аудиообъектов (90) в конфигурации выходного аудиосигнала.
2. Аудиосинтезатор по п.1, характеризующийся тем, что синтезатор выходных данных (100) предназначен для преобразования множества каналов понижающего микширования в понижающее стереомикширование для предварительно заданной конфигурации выходного аудиосигнала, с использованием матрицы преобразования (G), сформированной исходя из заданного пространственного расположения аудиообъектов (А).
3. Аудиосинтезатор по п.1, характеризующийся тем, что пространственные параметры включают в себя первую группу параметров для повышающего микширования "два-к-трем" и вторую группу энергетических параметров для повышающего микширования "три-к-шести", а синтезатор выходных данных (100), предусматривает возможность вычисления параметров предсказания для матрицы предсказания "два-к-трем" с использованием матрицы представления (А) согласно заданному расположению аудиообъектов (90), матрицы частичного понижающего микширования (D36), описывающую понижающее микширование выходных каналов до трех каналов, генерируемых в ходе гипотетической операции повышающего микширования "два-к-трем", и матрицы понижающего микширования (D).
4. Аудиосинтезатор по п.3, характеризующийся тем, что в нем параметры объекта представляют собой параметры предсказания объекта, и в составе которого синтезатор выходных данных (100) предварительного расчитывает матрицу энергии (Е) с использованием параметров предсказания объекта (С), информации понижающего микширования (D) и энергетических показателей (Z), соответствующих каналам понижающего микширования.
5. Аудиосинтезатор по п.1, характеризующийся тем, что синтезатор выходных данных (100) формирует (165) два стереоканала для формирования конфигурации выходного стереосигнала путем расчета параметризованной матрицы стереопредставления (А2) и матрицы преобразования (G) в зависимости от параметризованной матрицы стереопредставления (А2).
6. Способ синтезирования звука, предусматривающий генерирование выходных данных с использованием закодированного сигнала аудиообъекта (95, 97), характеризующийся тем, что включает генерирование выходных данных для формирования множества выходных каналов с заданной конфигурацией выходного аудиосигнала, отображающей множество аудиообъектов (90), при этом используется информация понижающего микширования, указывающая порядок распределения множества аудиообъектов, по крайней мере, по двум каналам понижающего микширования и параметры аудиообъекта для аудиообъектов, причем параметры аудиообъекта перекодируют (502) в пространственные параметры расчетной конфигурации с дополнительным учетом данных заданного расположения (А) аудиообъектов (90) в конфигурации выходного аудиосигнала.
7. Кодер аудиообъектов (101), предназначенный для генерирования закодированных сигналов аудиообъектов множества аудиообъектов (90), характеризующийся тем, что он включает в себя генератор информации понижающего микширования (96) для вырабатывания информации понижающего микширования (97), отражающей порядок распределения множества аудиообъектов, по меньшей мере, между двумя каналами понижающего микширования; причем генератор информации понижающего микширования (96) сконфигурирован с возможностью генерирования (150) энергетических характеристик (XX*) и данных корреляции (SX*), отражающих мощностные характеристики и корреляционные характеристики этих, по меньшей мере, двух каналов понижающего микширования (93); генератор параметров аудиообъекта (94); и выходной интерфейс (98), предназначенный для вывода сгенерированного закодированного сигнала аудиообъекта (99), при этом закодированный сигнал аудиообъекта содержит информацию понижающего микширования, информацию о мощности, информацию о корреляции и параметры объекта.
8. Кодер аудиообъектов по п.7, характеризующийся тем, что он дополнительно включает понижающий микшер (92) для понижающего микширования множества аудиообъектов по множеству каналов понижающего микширования, где количество аудиообъектов превосходит число каналов понижающего микширования и где понижающий микшер (92) соединен с генератором информации понижающего микширования таким образом, что распределение множества аудиообъектов по множеству каналов понижающего микширования выполняется в соответствии с информацией понижающего микширования.
9. Кодер аудиообъектов по п.7, характеризующийся тем, что генератор информации понижающего микширования (96) рассчитывает параметры понижающего микширования таким образом, что он содержат информацию: о аудиообъекте, который полностью или частично распределен по одному или более из множества каналов понижающего микширования, и при распределении аудиообъекта по более чем одному каналу понижающего микширования, о части аудиообъектов, распределенных по одному каналу понижающего микширования из нескольких каналов понижающего микширования.
10. Способ кодирования аудиообъектов (101) с формированием закодированного сигнала множества аудиообъектов, характеризующийся тем, что включает генерирование информации понижающего микширования (97), содержащей указания по распределению множества аудиообъектов (90), по меньшей мере, по двум каналам понижающего микширования, выработку (150) энергетических показателей (XX*) и данных корреляции (SX*), отражающих мощностные характеристики и корреляционные характеристики этих, по меньшей мере, двух каналов понижающего микширования; выработке параметров аудиообъектов (94); и выдаче закодированного сигнала аудиообъекта (99), при этом закодированный сигнал аудиообъекта содержит информацию о мощности, информацию о корреляции, информацию понижающего микширования и параметры объекта.
11. Считываемый компьютером носитель данных с сохраненным на нем закодированным сигналом аудиообъекта, характеризующийся тем, что содержит информацию понижающего микширования, определяющую порядок распределения множества аудиообъектов, по меньшей мере, по двум каналам понижающего микширования, энергетические показатели (XX*) и данные корреляции (SX*), отражающие мощностные характеристики и корреляционные характеристики этих, по меньшей мере, двух каналов понижающего микширования и параметры объектов, позволяющие в сочетании с, по крайней мере, этими двумя каналами низведения воссоздать аудиообъекты.
12. Машиночитаемый носитель с сохраненной на нем компьютерной программой для осуществления способа по п.6.
13. Машиночитаемый носитель с сохраненной на нем компьютерной программой для осуществления способа по п.10.
RU2011102416A 2006-10-16 2007-10-05 Усовершенствованный метод кодирования и параметрического представления кодирования многоканального объекта после понижающего микширования RU2485605C2 (ru)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US82964906P 2006-10-16 2006-10-16
US60/829.649 2006-10-16

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
RU2009113055/09A Division RU2430430C2 (ru) 2006-10-16 2007-10-05 Усовершенствованный метод кодирования и параметрического представления кодирования многоканального объекта после понижающего микширования

Publications (2)

Publication Number Publication Date
RU2011102416A true RU2011102416A (ru) 2012-07-27
RU2485605C2 RU2485605C2 (ru) 2013-06-20

Family

ID=

Also Published As

Publication number Publication date
NO340450B1 (no) 2017-04-24
EP2054875B1 (en) 2011-03-23
JP5270557B2 (ja) 2013-08-21
ATE503245T1 (de) 2011-04-15
CN102892070A (zh) 2013-01-23
RU2430430C2 (ru) 2011-09-27
BRPI0715559B1 (pt) 2021-12-07
MY145497A (en) 2012-02-29
TWI347590B (en) 2011-08-21
CN103400583B (zh) 2016-01-20
JP2010507115A (ja) 2010-03-04
JP5592974B2 (ja) 2014-09-17
TW200828269A (en) 2008-07-01
JP5297544B2 (ja) 2013-09-25
PL2068307T3 (pl) 2012-07-31
KR20090057131A (ko) 2009-06-03
CA2666640A1 (en) 2008-04-24
US20110022402A1 (en) 2011-01-27
KR20110002504A (ko) 2011-01-07
ATE536612T1 (de) 2011-12-15
MX2009003570A (es) 2009-05-28
KR101103987B1 (ko) 2012-01-06
RU2009113055A (ru) 2010-11-27
US20170084285A1 (en) 2017-03-23
EP2068307A1 (en) 2009-06-10
AU2007312598A1 (en) 2008-04-24
AU2011201106B2 (en) 2012-07-26
ES2378734T3 (es) 2012-04-17
AU2011201106A1 (en) 2011-04-07
NO20091901L (no) 2009-05-14
CN103400583A (zh) 2013-11-20
PT2372701E (pt) 2014-03-20
CA2666640C (en) 2015-03-10
HK1162736A1 (en) 2012-08-31
US9565509B2 (en) 2017-02-07
CA2874454C (en) 2017-05-02
AU2007312598B2 (en) 2011-01-20
JP2012141633A (ja) 2012-07-26
HK1126888A1 (en) 2009-09-11
DE602007013415D1 (de) 2011-05-05
SG175632A1 (en) 2011-11-28
CA2874454A1 (en) 2008-04-24
EP2054875A1 (en) 2009-05-06
CN101529501A (zh) 2009-09-09
EP2068307B1 (en) 2011-12-07
KR101012259B1 (ko) 2011-02-08
EP2372701A1 (en) 2011-10-05
JP2013190810A (ja) 2013-09-26
CN102892070B (zh) 2016-02-24
HK1133116A1 (en) 2010-03-12
UA94117C2 (ru) 2011-04-11
CA2874451A1 (en) 2008-04-24
WO2008046531A1 (en) 2008-04-24
EP2372701B1 (en) 2013-12-11
CA2874451C (en) 2016-09-06
CN101529501B (zh) 2013-08-07
BRPI0715559A2 (pt) 2013-07-02

Similar Documents

Publication Publication Date Title
RU2009113055A (ru) Усовершенствованный метод кодирования и параметрического представления кодирования многоканального объекта после понижающего микширования
KR100803212B1 (ko) 스케일러블 채널 복호화 방법 및 장치
JP2020074013A (ja) マルチチャンネル信号を符号化するためのオーディオエンコーダおよび符号化されたオーディオ信号を復号化するためのオーディオデコーダ
FI3404656T3 (fi) Periaate parametrisen monikanava-audiokoodauksen ja matriisiympäröidyn monikanavakoodauksen välisen välin ohittamiseksi
RU2452043C2 (ru) Аудиокодирование с использованием понижающего микширования
RU2008118333A (ru) Временное и пространственное генерирование многоканальных аудиосигналов
RU2015104074A (ru) Кодирование и декодирование аудиосигналов
RU2006146948A (ru) Способы улучшения характеристик многоканальной реконструкции на основе прогнозирования
EP2849180B1 (en) Hybrid audio signal encoder, hybrid audio signal decoder, method for encoding audio signal, and method for decoding audio signal
CA2813859C (en) Apparatus and method for processing an audio signal and for providing a higher temporal granularity for a combined unified speech and audio codec (usac)
RU2669079C2 (ru) Кодер, декодер и способы для обратно совместимого пространственного кодирования аудиообъектов с переменным разрешением
CN102844808B (zh) 用于编码多通道音频信号的参数编码器
CN110942778A (zh) 针对音频声道及音频对象的音频编码及解码的概念
JP2013033299A (ja) マルチチャンネル信号の復号化及び符号化方法、記録媒体及びシステム
KR101903664B1 (ko) 파라미터 오디오 오브젝트 코딩을 위한 잔류 개념을 이용하는 인코더, 디코더, 시스템 및 방법
EP2815399A1 (en) A method and apparatus for performing an adaptive down- and up-mixing of a multi-channel audio signal
CN108780651B (zh) 多声道译码
RU2485605C2 (ru) Усовершенствованный метод кодирования и параметрического представления кодирования многоканального объекта после понижающего микширования