RU2011102416A - Усовершенствованный метод кодирования и параметрического представления кодирования многоканального объекта после понижающего микширования - Google Patents
Усовершенствованный метод кодирования и параметрического представления кодирования многоканального объекта после понижающего микширования Download PDFInfo
- Publication number
- RU2011102416A RU2011102416A RU2011102416/08A RU2011102416A RU2011102416A RU 2011102416 A RU2011102416 A RU 2011102416A RU 2011102416/08 A RU2011102416/08 A RU 2011102416/08A RU 2011102416 A RU2011102416 A RU 2011102416A RU 2011102416 A RU2011102416 A RU 2011102416A
- Authority
- RU
- Russia
- Prior art keywords
- audio
- output
- parameters
- channels
- audio objects
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims 5
- 239000011159 matrix material Substances 0.000 claims abstract 10
- 230000005236 sound signal Effects 0.000 claims abstract 10
- 238000004590 computer program Methods 0.000 claims 2
- 241000382509 Vania Species 0.000 claims 1
- 230000002194 synthesizing effect Effects 0.000 claims 1
- 230000009466 transformation Effects 0.000 claims 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/20—Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/173—Transcoding, i.e. converting between two coded representations avoiding cascaded coding-decoding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/008—Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/02—Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/03—Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/11—Positioning of individual sound objects, e.g. moving airplane, within a sound field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/03—Application of parametric coding in stereophonic audio systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S5/00—Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation
Abstract
1. Аудиосинтезатор (104), предназначенный для генерирования выходных данных с использованием закодированного сигнала аудиообъекта (95, 97), характеризующийся тем, что включает в себя синтезатор выходных данных (100), генерирующий на выходе параметры, применимые для представления множества выходных каналов с предварительно заданной конфигурацией выходного аудиосигнала, отображающего множество аудиообъектов, при этом синтезатор выходных данных предусматривает возможность использования информации понижающего микширования, содержащую указания на распределение множества аудиообъектов, по крайней мере, по двум каналам понижающего микширования, и параметр объекта для аудиообъектов, причем синтезатор выходных данных (100) перекодирует (502)параметры аудиообъекта в пространственные параметры для предварительно заданной конфигурации выходного аудиосигнала, дополнительно используя заданное расположение (А) аудиообъектов (90) в конфигурации выходного аудиосигнала. ! 2. Аудиосинтезатор по п.1, характеризующийся тем, что синтезатор выходных данных (100) предназначен для преобразования множества каналов понижающего микширования в понижающее стереомикширование для предварительно заданной конфигурации выходного аудиосигнала, с использованием матрицы преобразования (G), сформированной исходя из заданного пространственного расположения аудиообъектов (А). ! 3. Аудиосинтезатор по п.1, характеризующийся тем, что пространственные параметры включают в себя первую группу параметров для повышающего микширования "два-к-трем" и вторую группу энергетических параметров для повышающего микширования "три-к-шести", а синтезатор выход
Claims (13)
1. Аудиосинтезатор (104), предназначенный для генерирования выходных данных с использованием закодированного сигнала аудиообъекта (95, 97), характеризующийся тем, что включает в себя синтезатор выходных данных (100), генерирующий на выходе параметры, применимые для представления множества выходных каналов с предварительно заданной конфигурацией выходного аудиосигнала, отображающего множество аудиообъектов, при этом синтезатор выходных данных предусматривает возможность использования информации понижающего микширования, содержащую указания на распределение множества аудиообъектов, по крайней мере, по двум каналам понижающего микширования, и параметр объекта для аудиообъектов, причем синтезатор выходных данных (100) перекодирует (502)параметры аудиообъекта в пространственные параметры для предварительно заданной конфигурации выходного аудиосигнала, дополнительно используя заданное расположение (А) аудиообъектов (90) в конфигурации выходного аудиосигнала.
2. Аудиосинтезатор по п.1, характеризующийся тем, что синтезатор выходных данных (100) предназначен для преобразования множества каналов понижающего микширования в понижающее стереомикширование для предварительно заданной конфигурации выходного аудиосигнала, с использованием матрицы преобразования (G), сформированной исходя из заданного пространственного расположения аудиообъектов (А).
3. Аудиосинтезатор по п.1, характеризующийся тем, что пространственные параметры включают в себя первую группу параметров для повышающего микширования "два-к-трем" и вторую группу энергетических параметров для повышающего микширования "три-к-шести", а синтезатор выходных данных (100), предусматривает возможность вычисления параметров предсказания для матрицы предсказания "два-к-трем" с использованием матрицы представления (А) согласно заданному расположению аудиообъектов (90), матрицы частичного понижающего микширования (D36), описывающую понижающее микширование выходных каналов до трех каналов, генерируемых в ходе гипотетической операции повышающего микширования "два-к-трем", и матрицы понижающего микширования (D).
4. Аудиосинтезатор по п.3, характеризующийся тем, что в нем параметры объекта представляют собой параметры предсказания объекта, и в составе которого синтезатор выходных данных (100) предварительного расчитывает матрицу энергии (Е) с использованием параметров предсказания объекта (С), информации понижающего микширования (D) и энергетических показателей (Z), соответствующих каналам понижающего микширования.
5. Аудиосинтезатор по п.1, характеризующийся тем, что синтезатор выходных данных (100) формирует (165) два стереоканала для формирования конфигурации выходного стереосигнала путем расчета параметризованной матрицы стереопредставления (А2) и матрицы преобразования (G) в зависимости от параметризованной матрицы стереопредставления (А2).
6. Способ синтезирования звука, предусматривающий генерирование выходных данных с использованием закодированного сигнала аудиообъекта (95, 97), характеризующийся тем, что включает генерирование выходных данных для формирования множества выходных каналов с заданной конфигурацией выходного аудиосигнала, отображающей множество аудиообъектов (90), при этом используется информация понижающего микширования, указывающая порядок распределения множества аудиообъектов, по крайней мере, по двум каналам понижающего микширования и параметры аудиообъекта для аудиообъектов, причем параметры аудиообъекта перекодируют (502) в пространственные параметры расчетной конфигурации с дополнительным учетом данных заданного расположения (А) аудиообъектов (90) в конфигурации выходного аудиосигнала.
7. Кодер аудиообъектов (101), предназначенный для генерирования закодированных сигналов аудиообъектов множества аудиообъектов (90), характеризующийся тем, что он включает в себя генератор информации понижающего микширования (96) для вырабатывания информации понижающего микширования (97), отражающей порядок распределения множества аудиообъектов, по меньшей мере, между двумя каналами понижающего микширования; причем генератор информации понижающего микширования (96) сконфигурирован с возможностью генерирования (150) энергетических характеристик (XX*) и данных корреляции (SX*), отражающих мощностные характеристики и корреляционные характеристики этих, по меньшей мере, двух каналов понижающего микширования (93); генератор параметров аудиообъекта (94); и выходной интерфейс (98), предназначенный для вывода сгенерированного закодированного сигнала аудиообъекта (99), при этом закодированный сигнал аудиообъекта содержит информацию понижающего микширования, информацию о мощности, информацию о корреляции и параметры объекта.
8. Кодер аудиообъектов по п.7, характеризующийся тем, что он дополнительно включает понижающий микшер (92) для понижающего микширования множества аудиообъектов по множеству каналов понижающего микширования, где количество аудиообъектов превосходит число каналов понижающего микширования и где понижающий микшер (92) соединен с генератором информации понижающего микширования таким образом, что распределение множества аудиообъектов по множеству каналов понижающего микширования выполняется в соответствии с информацией понижающего микширования.
9. Кодер аудиообъектов по п.7, характеризующийся тем, что генератор информации понижающего микширования (96) рассчитывает параметры понижающего микширования таким образом, что он содержат информацию: о аудиообъекте, который полностью или частично распределен по одному или более из множества каналов понижающего микширования, и при распределении аудиообъекта по более чем одному каналу понижающего микширования, о части аудиообъектов, распределенных по одному каналу понижающего микширования из нескольких каналов понижающего микширования.
10. Способ кодирования аудиообъектов (101) с формированием закодированного сигнала множества аудиообъектов, характеризующийся тем, что включает генерирование информации понижающего микширования (97), содержащей указания по распределению множества аудиообъектов (90), по меньшей мере, по двум каналам понижающего микширования, выработку (150) энергетических показателей (XX*) и данных корреляции (SX*), отражающих мощностные характеристики и корреляционные характеристики этих, по меньшей мере, двух каналов понижающего микширования; выработке параметров аудиообъектов (94); и выдаче закодированного сигнала аудиообъекта (99), при этом закодированный сигнал аудиообъекта содержит информацию о мощности, информацию о корреляции, информацию понижающего микширования и параметры объекта.
11. Считываемый компьютером носитель данных с сохраненным на нем закодированным сигналом аудиообъекта, характеризующийся тем, что содержит информацию понижающего микширования, определяющую порядок распределения множества аудиообъектов, по меньшей мере, по двум каналам понижающего микширования, энергетические показатели (XX*) и данные корреляции (SX*), отражающие мощностные характеристики и корреляционные характеристики этих, по меньшей мере, двух каналов понижающего микширования и параметры объектов, позволяющие в сочетании с, по крайней мере, этими двумя каналами низведения воссоздать аудиообъекты.
12. Машиночитаемый носитель с сохраненной на нем компьютерной программой для осуществления способа по п.6.
13. Машиночитаемый носитель с сохраненной на нем компьютерной программой для осуществления способа по п.10.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US82964906P | 2006-10-16 | 2006-10-16 | |
US60/829.649 | 2006-10-16 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2009113055/09A Division RU2430430C2 (ru) | 2006-10-16 | 2007-10-05 | Усовершенствованный метод кодирования и параметрического представления кодирования многоканального объекта после понижающего микширования |
Publications (2)
Publication Number | Publication Date |
---|---|
RU2011102416A true RU2011102416A (ru) | 2012-07-27 |
RU2485605C2 RU2485605C2 (ru) | 2013-06-20 |
Family
ID=
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2009113055A (ru) | Усовершенствованный метод кодирования и параметрического представления кодирования многоканального объекта после понижающего микширования | |
KR100803212B1 (ko) | 스케일러블 채널 복호화 방법 및 장치 | |
JP2020074013A (ja) | マルチチャンネル信号を符号化するためのオーディオエンコーダおよび符号化されたオーディオ信号を復号化するためのオーディオデコーダ | |
FI3404656T3 (fi) | Periaate parametrisen monikanava-audiokoodauksen ja matriisiympäröidyn monikanavakoodauksen välisen välin ohittamiseksi | |
RU2452043C2 (ru) | Аудиокодирование с использованием понижающего микширования | |
RU2008118333A (ru) | Временное и пространственное генерирование многоканальных аудиосигналов | |
RU2015104074A (ru) | Кодирование и декодирование аудиосигналов | |
RU2006146948A (ru) | Способы улучшения характеристик многоканальной реконструкции на основе прогнозирования | |
EP2849180B1 (en) | Hybrid audio signal encoder, hybrid audio signal decoder, method for encoding audio signal, and method for decoding audio signal | |
CA2813859C (en) | Apparatus and method for processing an audio signal and for providing a higher temporal granularity for a combined unified speech and audio codec (usac) | |
RU2669079C2 (ru) | Кодер, декодер и способы для обратно совместимого пространственного кодирования аудиообъектов с переменным разрешением | |
CN102844808B (zh) | 用于编码多通道音频信号的参数编码器 | |
CN110942778A (zh) | 针对音频声道及音频对象的音频编码及解码的概念 | |
JP2013033299A (ja) | マルチチャンネル信号の復号化及び符号化方法、記録媒体及びシステム | |
KR101903664B1 (ko) | 파라미터 오디오 오브젝트 코딩을 위한 잔류 개념을 이용하는 인코더, 디코더, 시스템 및 방법 | |
EP2815399A1 (en) | A method and apparatus for performing an adaptive down- and up-mixing of a multi-channel audio signal | |
CN108780651B (zh) | 多声道译码 | |
RU2485605C2 (ru) | Усовершенствованный метод кодирования и параметрического представления кодирования многоканального объекта после понижающего микширования |