RU2015116287A - Кодер, декодер и способы для обратно совместимой динамической адаптации разрешения по времени/частоте при пространственном кодировании аудиообъектов - Google Patents
Кодер, декодер и способы для обратно совместимой динамической адаптации разрешения по времени/частоте при пространственном кодировании аудиообъектов Download PDFInfo
- Publication number
- RU2015116287A RU2015116287A RU2015116287A RU2015116287A RU2015116287A RU 2015116287 A RU2015116287 A RU 2015116287A RU 2015116287 A RU2015116287 A RU 2015116287A RU 2015116287 A RU2015116287 A RU 2015116287A RU 2015116287 A RU2015116287 A RU 2015116287A
- Authority
- RU
- Russia
- Prior art keywords
- analysis
- window
- samples
- signal
- analysis windows
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims 10
- 230000006978 adaptation Effects 0.000 title 1
- 230000005236 sound signal Effects 0.000 claims abstract 6
- 230000007704 transition Effects 0.000 claims 18
- 238000001514 detection method Methods 0.000 claims 3
- 238000006243 chemical reaction Methods 0.000 claims 1
- 238000004590 computer program Methods 0.000 claims 1
- 230000002123 temporal effect Effects 0.000 claims 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
- G10L19/0208—Subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
- G10L19/025—Detection of transients or attacks for time/frequency resolution switching
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/20—Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Mathematical Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereophonic System (AREA)
Abstract
1. Декодер для формирования выходного аудиосигнала, содержащего один или более каналов вывода аудио, из сигнала понижающего микширования, содержащего множество выборок понижающего микширования временной области, при этом сигнал понижающего микширования кодирует два или более сигналов аудиообъектов, при этом декодер содержит:генератор (134) последовательности окон для определения множества окон анализа, при этом каждое из окон анализа содержит множество выборок понижающего микширования временной области сигнала понижающего микширования, при этом каждое окно анализа из упомянутого множества окон анализа имеет длину окна, указывающую количество выборок понижающего микширования временной области упомянутого окна анализа, при этом генератор (134) последовательности окон сконфигурирован для определения упомянутого множества окон анализа, чтобы длина окна каждого из окон анализа зависела от свойства сигнала по меньшей мере одного из упомянутых двух или более сигналов аудиообъектов,модуль (135) t/f-анализа для преобразования упомянутого множества выборок понижающего микширования временной области каждого окна анализа упомянутого множества окон анализа из временной области в частотно-временную область в зависимости от длины окна упомянутого окна анализа, чтобы получить преобразованное понижающее микширование, иблок (136) повышающего микширования для повышающего микширования преобразованного понижающего микширования на основе параметрической дополнительной информации об упомянутых двух или более сигналах аудиообъектов, чтобы получить выходной аудиосигнал.2. Декодер по п. 1, в котором генератор (134) последовательности
Claims (17)
1. Декодер для формирования выходного аудиосигнала, содержащего один или более каналов вывода аудио, из сигнала понижающего микширования, содержащего множество выборок понижающего микширования временной области, при этом сигнал понижающего микширования кодирует два или более сигналов аудиообъектов, при этом декодер содержит:
генератор (134) последовательности окон для определения множества окон анализа, при этом каждое из окон анализа содержит множество выборок понижающего микширования временной области сигнала понижающего микширования, при этом каждое окно анализа из упомянутого множества окон анализа имеет длину окна, указывающую количество выборок понижающего микширования временной области упомянутого окна анализа, при этом генератор (134) последовательности окон сконфигурирован для определения упомянутого множества окон анализа, чтобы длина окна каждого из окон анализа зависела от свойства сигнала по меньшей мере одного из упомянутых двух или более сигналов аудиообъектов,
модуль (135) t/f-анализа для преобразования упомянутого множества выборок понижающего микширования временной области каждого окна анализа упомянутого множества окон анализа из временной области в частотно-временную область в зависимости от длины окна упомянутого окна анализа, чтобы получить преобразованное понижающее микширование, и
блок (136) повышающего микширования для повышающего микширования преобразованного понижающего микширования на основе параметрической дополнительной информации об упомянутых двух или более сигналах аудиообъектов, чтобы получить выходной аудиосигнал.
2. Декодер по п. 1, в котором генератор (134) последовательности окон сконфигурирован для определения упомянутого множества окон анализа, чтобы переход, указывающий изменение сигнала по меньшей мере одного из упомянутых двух или более сигналов аудиообъектов, кодируемых посредством сигнала понижающего микширования, был составлен первым окном анализа из упомянутого множества окон анализа и вторым окном анализа из упомянутого множества окон анализа, при этом центр ck упомянутого первого окна анализа задается местоположением t перехода в соответствии с ck=t-lb, а центр ck+1 упомянутого первого окна анализа задается местоположением t перехода в соответствии с ck+1=t+la, при этом la и lb являются числами.
3. Декодер по п. 1, в котором генератор (134) последовательности окон сконфигурирован для определения упомянутого множества окон анализа, чтобы переход, указывающий изменение сигнала по меньшей мере одного из упомянутых двух или более сигналов аудиообъектов, кодируемых посредством сигнала понижающего микширования, был составлен первым окном анализа из упомянутого множества окон анализа, при этом центр ck упомянутого первого окна анализа задается местоположением t перехода в соответствии с ck=t, при этом центр ck-1 второго окна анализа из упомянутого множества окон анализа задается местоположением t перехода в соответствии с ck-1=t-lb, и при этом центр ck+1 третьего окна анализа из упомянутого множества окон анализа задается местоположением t перехода в соответствии с ck+1=t+la, при этом la и lb являются числами.
4. Декодер по п. 1, в котором генератор (134) последовательности окон сконфигурирован для определения упомянутого множества окон анализа, чтобы каждое из упомянутого множества окон анализа содержало либо первое количество выборок сигнала временной области, либо второе количество выборок сигнала временной области, при этом упомянутое второе количество выборок сигнала временной области больше упомянутого первого количества выборок сигнала временной области, и при этом каждое из окон анализа упомянутого множества окон анализа содержит упомянутое первое количество выборок сигнала временной области, когда упомянутое окно анализа содержит переход, указывающий переключение сигнала по меньшей мере одного из упомянутых двух или более сигналов аудиообъектов, кодируемых посредством сигнала понижающего микширования.
5. Декодер для формирования выходного аудиосигнала, содержащего один или более каналов вывода аудио, из сигнала понижающего микширования, содержащего множество выборок понижающего микширования временной области, при этом сигнал понижающего микширования кодирует два или более сигналов аудиообъектов, при этом декодер содержит:
первый подмодуль (161) анализа для преобразования упомянутого множества выборок понижающего микширования временной области, чтобы получить множество поддиапазонов, содержащее множество выборок поддиапазонов,
генератор (162) последовательности окон для определения множества окон анализа, при этом каждое из окон анализа содержит множество выборок поддиапазонов одного из упомянутого множества поддиапазонов, при этом каждое окно анализа упомянутого множества окон анализа имеет длину окна, указывающую количество выборок поддиапазонов упомянутого окна анализа, при этом генератор (162) последовательности окон сконфигурирован для определения упомянутого множества окон анализа, чтобы длина окна каждого из окон анализа зависела от свойства сигнала по меньшей мере одного из упомянутых двух или более сигналов аудиообъектов,
второй модуль (163) анализа для преобразования упомянутого множества выборок поддиапазонов каждого окна анализа упомянутого множества окон анализа в зависимости от длины окна упомянутого окна анализа, чтобы получить преобразованное понижающее микширование, и
блок (164) повышающего микширования для повышающего микширования преобразованного понижающего микширования на основе параметрической дополнительной информации об упомянутых двух или более сигналах аудиообъектов, чтобы получить выходной аудиосигнал.
6. Кодер для кодирования двух или более сигналов входных аудиообъектов, при этом каждый из упомянутых двух или более сигналов входных аудиообъектов содержит множество выборок сигнала временной области, при этом кодер содержит:
блок (102) последовательности окон для определения множества окон анализа, при этом каждое из окон анализа содержит множество выборок сигнала временной области одного из сигналов входных аудиообъектов, при этом каждое из окон анализа имеет длину окна, указывающую количество выборок сигнала временной области упомянутого окна анализа, при этом блок (102) последовательности окон сконфигурирован для определения упомянутого множества окон анализа, чтобы длина окна каждого из окон анализа зависела от свойства сигнала по меньшей мере одного из упомянутых двух или более сигналов входных аудиообъектов,
блок (103) t/f-анализа для преобразования выборок сигнала временной области каждого из окон анализа из временной области в частотно-временную область, чтобы получить преобразованные выборки сигнала, при этом блок (103) t/f-анализа сконфигурирован для преобразования упомянутого множества выборок сигнала временной области каждого из окон анализа в зависимости от длины окна упомянутого окна анализа, и
блок (104) оценки PSI для определения параметрической дополнительной информации в зависимости от преобразованных выборок сигнала.
7. Кодер по п. 6, при этом кодер дополнительно содержит блок (101) обнаружения перехода, сконфигурированный для определения множества разностей уровней объектов упомянутых двух или более сигналов входных аудиообъектов, и сконфигурированный для определения, больше ли порогового значения разница между первой из разностей уровней объектов и второй из разностей уровней объектов, чтобы для каждого из окон анализа определить, содержит ли упомянутое окно анализа переход, указывающий изменение сигнала по меньшей мере одного из упомянутых двух или более сигналов входных аудиообъектов.
8. Кодер по п. 7,
в котором блок (101) обнаружения перехода сконфигурирован для применения функции d(n) обнаружения, чтобы определить, больше ли упомянутого порогового значения разница между упомянутой первой из разностей уровней объектов и упомянутой второй из разностей уровней объектов,
при этом функция d(n) обнаружения задается в виде:
где n указывает индекс,
где i указывает первый объект,
где j указывает второй объект, и
где b указывает параметрический диапазон.
9. Кодер по п. 6, в котором блок (102) последовательности окон сконфигурирован для определения упомянутого множества окон анализа, чтобы переход, указывающий изменение сигнала по меньшей мере одного из упомянутых двух или более сигналов входных аудиообъектов, был составлен первым окном анализа из упомянутого множества окон анализа и вторым окном анализа из упомянутого множества окон анализа, при этом центр ck упомянутого первого окна анализа задается местоположением t перехода в соответствии с ck=t-lb, а центр ck+1 упомянутого первого окна анализа задается местоположением t перехода в соответствии с ck+1=t+la, при этом la и lb являются числами.
10. Кодер по п. 6, в котором блок (102) последовательности окон сконфигурирован для определения упомянутого множества окон анализа, чтобы переход, указывающий изменение сигнала по меньшей мере одного из упомянутых двух или более сигналов входных аудиообъектов, был составлен первым окном анализа из упомянутого множества окон анализа, при этом центр ck упомянутого первого окна анализа задается местоположением t перехода в соответствии с ck=t, при этом центр ck-1 второго окна анализа из упомянутого множества окон анализа задается местоположением t перехода в соответствии с ck-1=t-lb, и при этом центр ck+1 третьего окна анализа из упомянутого множества окон анализа задается местоположением t перехода в соответствии с ck+1=t+la, при этом la и lb являются числами.
11. Кодер по п. 6, в котором блок (102) последовательности окон сконфигурирован для определения упомянутого множества окон анализа, чтобы каждое из упомянутого множества окон анализа содержало либо первое количество выборок сигнала временной области, либо второе количество выборок сигнала временной области, при этом упомянутое второе количество выборок сигнала временной области больше упомянутого первого количества выборок сигнала временной области, и при этом каждое из окон анализа упомянутого множества окон анализа содержит упомянутое первое количество выборок сигнала временной области, когда упомянутое окно анализа содержит переход, указывающий изменение сигнала по меньшей мере одного из упомянутых двух или более сигналов входных аудиообъектов.
12. Кодер для кодирования двух или более сигналов входных аудиообъектов, при этом каждый из упомянутых двух или более сигналов входных аудиообъектов содержит множество выборок сигнала временной области, при этом кодер содержит:
первый подмодуль (171) анализа для преобразования упомянутого множества выборок сигнала временной области, чтобы получить множество поддиапазонов, содержащее множество выборок поддиапазонов,
блок (172) последовательности окон для определения множества окон анализа, при этом каждое из окон анализа содержит множество выборок поддиапазонов одного из упомянутого множества поддиапазонов, при этом каждое из окон анализа имеет длину окна, указывающую количество выборок поддиапазонов упомянутого окна анализа, при этом блок (172) последовательности окон сконфигурирован для определения упомянутого множества окон анализа, чтобы длина окна каждого из окон анализа зависела от свойства сигнала по меньшей мере одного из упомянутых двух или более сигналов входных аудиообъектов,
второй модуль (173) анализа для преобразования упомянутого множества выборок поддиапазонов каждого окна анализа упомянутого множества окон анализа в зависимости от длины окна упомянутого окна анализа, чтобы получить преобразованные выборки сигнала, и
блок (174) оценки PSI для определения параметрической дополнительной информации в зависимости от преобразованных выборок сигнала.
13. Способ декодирования для формирования выходного аудиосигнала, содержащего один или более каналов вывода аудио, из сигнала понижающего микширования, содержащего множество выборок понижающего микширования временной области, при этом сигнал понижающего микширования кодирует два или более сигналов аудиообъектов, при этом способ содержит этапы, на которых:
определяют множество окон анализа, при этом каждое из окон анализа содержит множество выборок понижающего микширования временной области сигнала понижающего микширования, при этом каждое окно анализа из упомянутого множества окон анализа имеет длину окна, указывающую количество выборок понижающего микширования временной области упомянутого окна анализа, при этом определение упомянутого множества окон анализа проводится так, что длина окна каждого из окон анализа зависит от свойства сигнала по меньшей мере одного из упомянутых двух или более сигналов аудиообъектов,
преобразуют упомянутое множество выборок понижающего микширования временной области каждого окна анализа упомянутого множества окон анализа из временной области в частотно-временную область в зависимости от длины окна упомянутого окна анализа, чтобы получить преобразованное понижающее микширование, и
осуществляют повышающее микширование преобразованного понижающего микширования на основе параметрической дополнительной информации об упомянутых двух или более сигналах аудиообъектов, чтобы получить выходной аудиосигнал.
14. Способ кодирования двух или более сигналов входных аудиообъектов, при этом каждый из упомянутых двух или более сигналов входных аудиообъектов содержит множество выборок сигнала временной области, при этом способ содержит этапы, на которых:
определяют множество окон анализа, при этом каждое из окон анализа содержит множество выборок сигнала временной области одного из сигналов входных аудиообъектов, при этом каждое из окон анализа имеет длину окна, указывающую количество выборок сигнала временной области упомянутого окна анализа, при этом определение упомянутого множества окон анализа проводится так, что длина окна каждого из окон анализа зависит от свойства сигнала по меньшей мере одного из упомянутых двух или более сигналов входных аудиообъектов,
преобразуют выборки сигнала временной области каждого из окон анализа из временной области в частотно-временную область, чтобы получить преобразованные выборки сигнала, при этом преобразование упомянутого множества выборок сигнала временной области каждого из окон анализа зависит от длины окна упомянутого окна анализа,
определяют параметрическую дополнительную информацию в зависимости от преобразованных выборок сигнала.
15. Способ декодирования путем формирования выходного аудиосигнала, содержащего один или более каналов вывода аудио, из сигнала понижающего микширования, содержащего множество выборок понижающего микширования временной области, при этом сигнал понижающего микширования кодирует два или более сигналов аудиообъектов, при этом способ содержит этапы, на которых:
преобразуют упомянутое множество выборок понижающего микширования временной области для получения множества поддиапазонов, содержащего множество выборок поддиапазонов,
определяют множество окон анализа, при этом каждое из окон анализа содержит множество выборок поддиапазонов одного из упомянутого множества поддиапазонов, при этом каждое окно анализа из упомянутого множества окон анализа имеет длину окна, указывающую количество выборок поддиапазонов упомянутого окна анализа, при этом определение упомянутого множества окон анализа проводится так, что длина окна каждого из окон анализа зависит от свойства сигнала по меньшей мере одного из упомянутых двух или более сигналов аудиообъектов,
преобразуют упомянутое множество выборок поддиапазонов каждого окна анализа упомянутого множества окон анализа в зависимости от длины окна упомянутого окна анализа, чтобы получить преобразованное понижающее микширование, и
осуществляют повышающее микширование преобразованного понижающего микширования на основе параметрической дополнительной информации об упомянутых двух или более сигналах аудиообъектов, чтобы получить выходной аудиосигнал.
16. Способ кодирования двух или более сигналов входных аудиообъектов, при этом каждый из упомянутых двух или более сигналов входных аудиообъектов содержит множество выборок сигнала временной области, при этом способ содержит этапы, на которых:
преобразуют упомянутое множество выборок сигнала временной области для получения множества поддиапазонов, содержащего множество выборок поддиапазонов,
определяют множество окон анализа, при этом каждое из окон анализа содержит множество выборок поддиапазонов одного из упомянутого множества поддиапазонов, при этом каждое из окон анализа имеет длину окна, указывающую количество выборок поддиапазонов упомянутого окна анализа, при этом определение упомянутого множества окон анализа проводится так, что длина окна каждого из окон анализа зависит от свойства сигнала по меньшей мере одного из упомянутых двух или более сигналов входных аудиообъектов,
преобразуют упомянутое множество выборок поддиапазонов каждого окна анализа упомянутого множества окон анализа в зависимости от длины окна упомянутого окна анализа, чтобы получить преобразованные выборки сигнала, и
определяют параметрическую дополнительную информацию в зависимости от преобразованных выборок сигнала.
17. Компьютерная программа для реализации одного из способов по пп. 13-16 при исполнении на компьютере или процессоре сигналов.
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201261710133P | 2012-10-05 | 2012-10-05 | |
US61/710,133 | 2012-10-05 | ||
EP13167481.4A EP2717265A1 (en) | 2012-10-05 | 2013-05-13 | Encoder, decoder and methods for backward compatible dynamic adaption of time/frequency resolution in spatial-audio-object-coding |
EP13167481.4 | 2013-05-13 | ||
PCT/EP2013/070551 WO2014053548A1 (en) | 2012-10-05 | 2013-10-02 | Encoder, decoder and methods for backward compatible dynamic adaption of time/frequency resolution in spatial-audio-object-coding |
Publications (2)
Publication Number | Publication Date |
---|---|
RU2015116287A true RU2015116287A (ru) | 2016-11-27 |
RU2639658C2 RU2639658C2 (ru) | 2017-12-21 |
Family
ID=48325509
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2015116645A RU2625939C2 (ru) | 2012-10-05 | 2013-10-02 | Кодер, декодер и способы для зависимого от сигнала преобразования масштаба при пространственном кодировании аудиообъектов |
RU2015116287A RU2639658C2 (ru) | 2012-10-05 | 2013-10-02 | Кодер, декодер и способы для обратно совместимой динамической адаптации разрешения по времени/частоте при пространственном кодировании аудиообъектов |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2015116645A RU2625939C2 (ru) | 2012-10-05 | 2013-10-02 | Кодер, декодер и способы для зависимого от сигнала преобразования масштаба при пространственном кодировании аудиообъектов |
Country Status (17)
Country | Link |
---|---|
US (2) | US10152978B2 (ru) |
EP (4) | EP2717262A1 (ru) |
JP (2) | JP6268180B2 (ru) |
KR (2) | KR101685860B1 (ru) |
CN (2) | CN105190747B (ru) |
AR (2) | AR092928A1 (ru) |
AU (1) | AU2013326526B2 (ru) |
BR (2) | BR112015007649B1 (ru) |
CA (2) | CA2886999C (ru) |
ES (2) | ES2880883T3 (ru) |
HK (1) | HK1213361A1 (ru) |
MX (2) | MX350691B (ru) |
MY (1) | MY178697A (ru) |
RU (2) | RU2625939C2 (ru) |
SG (1) | SG11201502611TA (ru) |
TW (2) | TWI539444B (ru) |
WO (2) | WO2014053547A1 (ru) |
Families Citing this family (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2717262A1 (en) | 2012-10-05 | 2014-04-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Encoder, decoder and methods for signal-dependent zoom-transform in spatial audio object coding |
EP2804176A1 (en) * | 2013-05-13 | 2014-11-19 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio object separation from mixture signal using object-specific time/frequency resolutions |
EP3312835B1 (en) | 2013-05-24 | 2020-05-13 | Dolby International AB | Efficient coding of audio scenes comprising audio objects |
KR102243395B1 (ko) * | 2013-09-05 | 2021-04-22 | 한국전자통신연구원 | 오디오 부호화 장치 및 방법, 오디오 복호화 장치 및 방법, 오디오 재생 장치 |
US20150100324A1 (en) * | 2013-10-04 | 2015-04-09 | Nvidia Corporation | Audio encoder performance for miracast |
CN105096957B (zh) | 2014-04-29 | 2016-09-14 | 华为技术有限公司 | 处理信号的方法及设备 |
CN105336335B (zh) | 2014-07-25 | 2020-12-08 | 杜比实验室特许公司 | 利用子带对象概率估计的音频对象提取 |
AU2016214553B2 (en) * | 2015-02-02 | 2019-01-31 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for processing an encoded audio signal |
EP3067885A1 (en) | 2015-03-09 | 2016-09-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding or decoding a multi-channel signal |
WO2017064264A1 (en) | 2015-10-15 | 2017-04-20 | Huawei Technologies Co., Ltd. | Method and appratus for sinusoidal encoding and decoding |
GB2544083B (en) * | 2015-11-05 | 2020-05-20 | Advanced Risc Mach Ltd | Data stream assembly control |
US9711121B1 (en) * | 2015-12-28 | 2017-07-18 | Berggram Development Oy | Latency enhanced note recognition method in gaming |
US9640157B1 (en) * | 2015-12-28 | 2017-05-02 | Berggram Development Oy | Latency enhanced note recognition method |
US10269360B2 (en) * | 2016-02-03 | 2019-04-23 | Dolby International Ab | Efficient format conversion in audio coding |
US10210874B2 (en) * | 2017-02-03 | 2019-02-19 | Qualcomm Incorporated | Multi channel coding |
US10891962B2 (en) | 2017-03-06 | 2021-01-12 | Dolby International Ab | Integrated reconstruction and rendering of audio signals |
CN108694955B (zh) * | 2017-04-12 | 2020-11-17 | 华为技术有限公司 | 多声道信号的编解码方法和编解码器 |
CN110870006B (zh) | 2017-04-28 | 2023-09-22 | Dts公司 | 对音频信号进行编码的方法以及音频编码器 |
CN109427337B (zh) | 2017-08-23 | 2021-03-30 | 华为技术有限公司 | 立体声信号编码时重建信号的方法和装置 |
US10856755B2 (en) * | 2018-03-06 | 2020-12-08 | Ricoh Company, Ltd. | Intelligent parameterization of time-frequency analysis of encephalography signals |
TWI658458B (zh) * | 2018-05-17 | 2019-05-01 | 張智星 | 歌聲分離效能提升之方法、非暫態電腦可讀取媒體及電腦程式產品 |
GB2577885A (en) | 2018-10-08 | 2020-04-15 | Nokia Technologies Oy | Spatial audio augmentation and reproduction |
KR20220024593A (ko) * | 2019-06-14 | 2022-03-03 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 매개변수 인코딩 및 디코딩 |
WO2022079049A2 (en) * | 2020-10-13 | 2022-04-21 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding a plurality of audio objects or apparatus and method for decoding using two or more relevant audio objects |
CN113453114B (zh) * | 2021-06-30 | 2023-04-07 | Oppo广东移动通信有限公司 | 编码控制方法、装置、无线耳机及存储介质 |
CN114127844A (zh) * | 2021-10-21 | 2022-03-01 | 北京小米移动软件有限公司 | 一种信号编解码方法、装置、编码设备、解码设备及存储介质 |
Family Cites Families (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3175446B2 (ja) * | 1993-11-29 | 2001-06-11 | ソニー株式会社 | 情報圧縮方法及び装置、圧縮情報伸張方法及び装置、圧縮情報記録/伝送装置、圧縮情報再生装置、圧縮情報受信装置、並びに記録媒体 |
JP4714416B2 (ja) * | 2002-04-22 | 2011-06-29 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 空間的オーディオのパラメータ表示 |
US7272567B2 (en) * | 2004-03-25 | 2007-09-18 | Zoran Fejzo | Scalable lossless audio codec and authoring tool |
KR100608062B1 (ko) * | 2004-08-04 | 2006-08-02 | 삼성전자주식회사 | 오디오 데이터의 고주파수 복원 방법 및 그 장치 |
CN101046963B (zh) * | 2004-09-17 | 2011-03-23 | 广州广晟数码技术有限公司 | 解码经编码的音频数据流的方法 |
US7630902B2 (en) * | 2004-09-17 | 2009-12-08 | Digital Rise Technology Co., Ltd. | Apparatus and methods for digital audio coding using codebook application ranges |
WO2007010785A1 (ja) * | 2005-07-15 | 2007-01-25 | Matsushita Electric Industrial Co., Ltd. | オーディオデコーダ |
US7917358B2 (en) | 2005-09-30 | 2011-03-29 | Apple Inc. | Transient detection by power weighted average |
EP1974347B1 (en) * | 2006-01-19 | 2014-08-06 | LG Electronics Inc. | Method and apparatus for processing a media signal |
MX2008012217A (es) * | 2006-03-29 | 2008-11-12 | Koninkl Philips Electronics Nv | Decodificacion de audio. |
CA2874454C (en) * | 2006-10-16 | 2017-05-02 | Dolby International Ab | Enhanced coding and parameter representation of multichannel downmixed object coding |
ES2631906T3 (es) | 2006-10-25 | 2017-09-06 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Aparato y procedimiento para la generación de valores de subbanda de audio, aparato y procedimiento para la generación de muestras de audio en el dominio temporal |
EP2137824A4 (en) * | 2007-03-16 | 2012-04-04 | Lg Electronics Inc | METHOD AND DEVICE FOR PROCESSING AN AUDIO SIGNAL |
CN101689368B (zh) * | 2007-03-30 | 2012-08-22 | 韩国电子通信研究院 | 对具有多声道的多对象音频信号进行编码和解码的设备和方法 |
CN103299363B (zh) * | 2007-06-08 | 2015-07-08 | Lg电子株式会社 | 用于处理音频信号的方法和装置 |
EP2144229A1 (en) * | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Efficient use of phase information in audio encoding and decoding |
WO2010105695A1 (en) * | 2009-03-20 | 2010-09-23 | Nokia Corporation | Multi channel audio coding |
KR101387808B1 (ko) * | 2009-04-15 | 2014-04-21 | 한국전자통신연구원 | 가변 비트율을 갖는 잔차 신호 부호화를 이용한 고품질 다객체 오디오 부호화 및 복호화 장치 |
EP2249334A1 (en) * | 2009-05-08 | 2010-11-10 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio format transcoder |
KR101388901B1 (ko) * | 2009-06-24 | 2014-04-24 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 오디오 신호 디코더, 오디오 신호를 디코딩하는 방법 및 캐스케이드된 오디오 객체 처리 단계들을 이용한 컴퓨터 프로그램 |
CN102549655B (zh) * | 2009-08-14 | 2014-09-24 | Dts有限责任公司 | 自适应成流音频对象的系统 |
KR20110018107A (ko) * | 2009-08-17 | 2011-02-23 | 삼성전자주식회사 | 레지듀얼 신호 인코딩 및 디코딩 방법 및 장치 |
KR101418661B1 (ko) * | 2009-10-20 | 2014-07-14 | 돌비 인터네셔널 에이비 | 다운믹스 시그널 표현에 기초한 업믹스 시그널 표현을 제공하기 위한 장치, 멀티채널 오디오 시그널을 표현하는 비트스트림을 제공하기 위한 장치, 왜곡 제어 시그널링을 이용하는 방법들, 컴퓨터 프로그램 및 비트 스트림 |
MY154641A (en) * | 2009-11-20 | 2015-07-15 | Fraunhofer Ges Forschung | Apparatus for providing an upmix signal representation on the basis of the downmix signal representation, apparatus for providing a bitstream representing a multi-channel audio signal, methods, computer programs and bitstream representing a multi-channel audio signal using a linear cimbination parameter |
CN102763432B (zh) * | 2010-02-17 | 2015-06-24 | 诺基亚公司 | 对多装置音频捕获的处理 |
CN102222505B (zh) * | 2010-04-13 | 2012-12-19 | 中兴通讯股份有限公司 | 可分层音频编解码方法系统及瞬态信号可分层编解码方法 |
EP2717262A1 (en) | 2012-10-05 | 2014-04-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Encoder, decoder and methods for signal-dependent zoom-transform in spatial audio object coding |
-
2013
- 2013-05-13 EP EP13167487.1A patent/EP2717262A1/en not_active Withdrawn
- 2013-05-13 EP EP13167481.4A patent/EP2717265A1/en not_active Withdrawn
- 2013-10-02 SG SG11201502611TA patent/SG11201502611TA/en unknown
- 2013-10-02 CA CA2886999A patent/CA2886999C/en active Active
- 2013-10-02 WO PCT/EP2013/070550 patent/WO2014053547A1/en active Application Filing
- 2013-10-02 ES ES13774118T patent/ES2880883T3/es active Active
- 2013-10-02 JP JP2015535006A patent/JP6268180B2/ja active Active
- 2013-10-02 CN CN201380052368.6A patent/CN105190747B/zh active Active
- 2013-10-02 ES ES13776987T patent/ES2873977T3/es active Active
- 2013-10-02 JP JP2015535005A patent/JP6185592B2/ja active Active
- 2013-10-02 CN CN201380052362.9A patent/CN104798131B/zh active Active
- 2013-10-02 BR BR112015007649-1A patent/BR112015007649B1/pt active IP Right Grant
- 2013-10-02 CA CA2887028A patent/CA2887028C/en active Active
- 2013-10-02 WO PCT/EP2013/070551 patent/WO2014053548A1/en active Application Filing
- 2013-10-02 EP EP13774118.7A patent/EP2904611B1/en active Active
- 2013-10-02 KR KR1020157011739A patent/KR101685860B1/ko active IP Right Grant
- 2013-10-02 RU RU2015116645A patent/RU2625939C2/ru active
- 2013-10-02 KR KR1020157011782A patent/KR101689489B1/ko active IP Right Grant
- 2013-10-02 RU RU2015116287A patent/RU2639658C2/ru active
- 2013-10-02 EP EP13776987.3A patent/EP2904610B1/en active Active
- 2013-10-02 MX MX2015004018A patent/MX350691B/es active IP Right Grant
- 2013-10-02 MY MYPI2015000807A patent/MY178697A/en unknown
- 2013-10-02 MX MX2015004019A patent/MX351359B/es active IP Right Grant
- 2013-10-02 AU AU2013326526A patent/AU2013326526B2/en active Active
- 2013-10-02 BR BR112015007650-5A patent/BR112015007650B1/pt active IP Right Grant
- 2013-10-04 TW TW102136012A patent/TWI539444B/zh active
- 2013-10-04 TW TW102136014A patent/TWI541795B/zh active
- 2013-10-07 AR ARP130103630A patent/AR092928A1/es active IP Right Grant
- 2013-10-07 AR ARP130103631A patent/AR092929A1/es active IP Right Grant
-
2015
- 2015-03-27 US US14/671,928 patent/US10152978B2/en active Active
- 2015-04-03 US US14/678,667 patent/US9734833B2/en active Active
-
2016
- 2016-02-05 HK HK16101374.6A patent/HK1213361A1/zh unknown
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2015116287A (ru) | Кодер, декодер и способы для обратно совместимой динамической адаптации разрешения по времени/частоте при пространственном кодировании аудиообъектов | |
RU2676233C2 (ru) | Многоканальный аудиодекодер, многоканальный аудиокодер, способы и компьютерная программа с использованием регулирования доли декоррелированного сигнала на основании остаточных сигналов | |
RU2573774C2 (ru) | Устройство для декодирования сигнала, содержащего переходные процессы, используя блок объединения и микшер | |
RU2015116434A (ru) | Кодер, декодер и способы для обратно совместимого пространственного кодирования аудиообъектов с переменным разрешением | |
RU2646375C2 (ru) | Выделение аудиообъекта из сигнала микширования с использованием характерных для объекта временно-частотных разрешений | |
RU2015135181A (ru) | Декодер, кодер и способ информированной оценки громкости с использованием обходных сигналов аудиообъектов в системах основывающегося на объектах кодирования аудио | |
RU2011141881A (ru) | Усовершенствованное стереофоническое кодирование на основе комбинации адаптивно выбираемого левого/правого или среднего/побочного стереофонического кодирования и параметрического стереофонического кодирования | |
RU2010147691A (ru) | Способ кодирования и устройство для декодирования основывающегося на объектах аудиосигнала | |
ATE371925T1 (de) | Auf mehrfachparametrisierung basierende mehrkanalrekonstruktion | |
RU2016105702A (ru) | Аудио кодер, аудио декодер, способы и компьютерная программа, использующие совместно кодированные разностные сигналы | |
RU2573231C2 (ru) | Устройство и способ для кодирования части аудиосигнала с использованием обнаружения неустановившегося состояния и результата качества | |
JP2022110116A (ja) | オーディオエンコーダ、オーディオデコーダ、オーディオ信号を符号化する方法、および符号化されたオーディオ信号を復号化する方法 | |
JP5977434B2 (ja) | パラメトリック空間オーディオ符号化および復号化のための方法、パラメトリック空間オーディオ符号器およびパラメトリック空間オーディオ復号器 | |
RU2012116743A (ru) | Декодер аудиосигнала, кодер аудиосигнала, способ формирования представления сигнала повышающего микширования, способ формирования представления сигнала понижающего микширования, компьютерная программа и бистрим, использующий значение общего параметра межобъектной корреляции | |
RU2015104074A (ru) | Кодирование и декодирование аудиосигналов | |
JP5681290B2 (ja) | デコードされたマルチチャネルオーディオ信号またはデコードされたステレオ信号を後処理するためのデバイス | |
KR20090043921A (ko) | 멀티 채널 신호의 부호화/복호화 방법 및 장치 | |
RU2013134463A (ru) | Способ кодирования, кодер, способ определения величины периодического признака, устройство определения величины периодического признака, программа и носитель записи | |
RU2016119563A (ru) | Параметрическая реконструкция аудиосигналов | |
KR20230035387A (ko) | 스테레오 오디오 신호 지연 추정 방법 및 장치 | |
RU2017117896A (ru) | Кодирование и декодирование аудиосигналов | |
CN107452390B (zh) | 音频编码方法及相关装置 | |
KR101397512B1 (ko) | 선형 예측 코딩 분석을 위한 방법, 장치 및 시스템 | |
RU2015135593A (ru) | Устройство и способ для пространственного кодирования аудиообъекта с использованием скрытых объектов для воздействия на смесь сигналов | |
RU2008137596A (ru) | Кодирование и декодирование аудио |