RU2631023C2 - Матрицы оптимального микширования и использование декорреляторов при обработке пространственного звука - Google Patents

Матрицы оптимального микширования и использование декорреляторов при обработке пространственного звука Download PDF

Info

Publication number
RU2631023C2
RU2631023C2 RU2014110030A RU2014110030A RU2631023C2 RU 2631023 C2 RU2631023 C2 RU 2631023C2 RU 2014110030 A RU2014110030 A RU 2014110030A RU 2014110030 A RU2014110030 A RU 2014110030A RU 2631023 C2 RU2631023 C2 RU 2631023C2
Authority
RU
Russia
Prior art keywords
matrix
covariance
mixing
signal
signal processor
Prior art date
Application number
RU2014110030A
Other languages
English (en)
Other versions
RU2014110030A (ru
Inventor
Юха ВИЛЬКАМО
Том БЯКСТРЕМ
Фабиан КЮХ
Ахим КУНТЦ
Original Assignee
Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. filed Critical Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф.
Publication of RU2014110030A publication Critical patent/RU2014110030A/ru
Application granted granted Critical
Publication of RU2631023C2 publication Critical patent/RU2631023C2/ru

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H1/00Details of electrophonic musical instruments
    • G10H1/18Selecting circuits
    • G10H1/183Channel-assigning means for polyphonic instruments
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0017Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Mathematical Physics (AREA)
  • Stereophonic System (AREA)
  • Amplifiers (AREA)

Abstract

Изобретение относится к акустике. Устройство для генерации звукового сигнала, имеющее два или более звуковых каналов. Устройство содержит блок предварительной обработки и процессор сигналов. Блок предварительной обработки выполнен с возможностью рассчета первой ковариантности звукового сигнала. Процессор выполнен с возможностью генерации выходного звукового сигнала путем применения правила микширования к двум звуковым каналам. Процессор сконфигурирован с возможностью определения правила микширования на основании первой ковариантности входного звукового сигнала и на основании второй ковариантности выходного звукового сигнала, причем вторая ковариантность является иной, чем первая ковариантность. Микширование выполняется таким образом, чтобы минимизировать погрешности в воспроизведении звука. Правило микширования зависит от входного звукового сигнала и матрицы отображения. При этом диагональное значение первой ковариационной матрицы задает величину энергии входных звуковых каналов. Диагональное значение представляет собой межканальную корреляцию между входными каналами. Технический результат – повышение качества звукоизвлечения. 3 н. и 22 з.п. ф-лы, 15 ил.

Description

Настоящее изобретение относится к обработке звуковых сигналов и, в частности, к устройству и к способу, в которых используют матрицы оптимального микширования и, кроме того, к использованию декорреляторов при обработке пространственного звука.
Обработка звуковых сигналов становится все более и более важной. При перцепционной обработке пространственного звука типичным предположением является то, что пространственный аспект воспроизводимого громкоговорителем звука, определяется, в частности, значениями энергии и согласованными по времени зависимостями между звуковыми каналами в воспринимаемых диапазонах частот. Это основано на представлении о том, что эти характеристики при воспроизведении через громкоговорители передаются в интерауральные разности уровней, в интерауральные разности по времени и в интерауральные когерентности, которые являются бинауральными стимулами пространственного восприятия. Из этой концепции появились различные способы пространственной обработки, включающее в себя микширование с увеличением количества каналов, см. публикацию
[1] C. Faller, "Multiple-Loudspeaker Playback of Stereo Signals”, Journal of the Audio Engineering Society, Vol. 54, No. 11, pp. 1051-1064, June 2006,
пространственный микрофонный эффект, см., например, публикации
[2] V. Pulkki, "Spatial Sound Reproduction with Directional Audio Coding”, Journal of the Audio Engineering Society, Vol. 55, No. 6, pp. 503-516, June 2007; и
[3] C. Tournery, C. Faller, F. Küch, J. Herre, "Converting Stereo Microphone Signals Directly to MPEG Surround”, 128th AES Convention. May 2010;
и эффективную стереофоническую и многоканальную передачу, см., например, публикации
[4] J. Breebaart, S. van de Par, A. Kohlrausch and E. Schuijers, "Parametric Coding of Stereo Audio”, EURASIP Journal on Applied Signal Processing, Vol. 2005, No. 9, pp. 1305-1322, 2005; и
[5] J. Herre. K. Kjörling, J. Breebaart, C. Faller, S. Disch, H. Purnhagen, J. Koppens, J. Hilpert, J. Rödén, W. Oomen, K. Linzmeier and K. S. Chong, "MPEG Surround - The ISO/MPEG Standard for Efficient and Compatible Multichannel Audio Coding", Journal of the Audio Engineering Society, Vol. 56. No. 11, pp. 932-955. November 2008.
Тесты на прослушивание подтвердили пользу этой концепции в каждом применении, см., например, [1, 4, 5] и, например, публикацию
[6] J. Vilkamo, V. Pulkki, “Directional Audio Coding: Virtual Microphone-Based Synthesis and Subjective Evaluation". Journal of the Audio Engineering Society, Vol. 57, No. 9, pp. 709-724, September 2009.
Все эти технологии, несмотря на различия в применении, имеют одну и ту же основную задачу, которая состоит в генерации из набора входных каналов набора выходных каналов с заданными энергиями и зависимостями в виде функции от времени и частоты, которая, как можно предположить, является общей основной задачей при перцепционной обработке пространственного звука. Например, применительно к кодированию направленного звука (DirAC), см., например, [2], исходными каналами обычно являются сигналы с микрофонов первого порядка, которые обрабатывают посредством микширования, амплитудного панорамирования и декорреляции для перцепционной аппроксимации измеренного звукового поля. При микшировании с увеличением количества каналов (см. [1]) входные стереоканалы снова, как функцию времени и частоты, адаптивно распределяют в схему окружающего звука.
Задачей настоящего изобретения является создание усовершенствованных концепций для генерации набора выходных каналов с заданными свойствами из набора входных каналов. Задача настоящего изобретения решается посредством устройства по пункту 1 формулы изобретения, способа по пункту 25 формулы изобретения и компьютерной программы по пункту 26 формулы изобретения.
Предложено устройство для генерации выходного звукового сигнала, имеющего два или более выходных звуковых каналов, из входного звукового сигнала, имеющего два или более входных звуковых каналов. Это устройство содержит блок предоставления и процессор сигналов. Блок предоставления выполнен с возможностью предоставления первой ковариантности входного звукового сигнала. Процессор сигналов выполнен с возможностью генерации выходного звукового сигнала путем применения правила микширования, по меньшей мере, к двум из двух или более входных звуковых каналов. Процессор сигналов сконфигурирован с возможностью определения правила микширования на основании первой ковариантности входного звукового сигнала и на основании второй ковариантности выходного звукового сигнала, причем вторая ковариантность является иной, чем первая ковариантность.
Например, энергии каналов и согласованные по времени зависимости могут быть выражены вещественной частью ковариационной матрицы сигнала, например, в воспринимаемых диапазонах частот. Ниже представлена концепция обработки пространственного звука, обычно применяемая в этой области. Эта концепция содержит техническое решение с адаптивным микшированием для достижения заданной целевой ковариантности (второй ковариантности), например, заданной целевой ковариационной матрицы, за счет наилучшего использования независимых компонентов во входных каналах. В одном из вариантов осуществления изобретения может быть предусмотрено средство ввода необходимого количества декоррелированной звуковой энергии, когда цель не достигнута иным способом. Такая концепция является надежной по своей функции и может применяться в многочисленных вариантах использования. Целевая ковариантность может быть, например, предоставлена пользователем. Например, согласно одному из вариантов осуществления изобретения, устройство может иметь средство, обеспечивающее возможность ввода ковариантности пользователем.
Согласно одному из вариантов осуществления изобретения, блок предоставления может быть выполнен с возможностью предоставления первой ковариантности, причем первая ковариантность имеет первое состояние для первого частотно-временного элемента, и при этом первая ковариантность имеет второе состояние, являющееся иным, чем первое состояние, для второго частотно-временного элемента, являющегося иным, чем первый частотно-временной элемент. Блок предоставления не обязательно должен выполнять анализ для получения ковариантности, но может предоставлять эти данные из запоминающего устройства, за счет ввода данных пользователем или из аналогичных источников.
В другом варианте осуществления изобретения процессор сигналов может быть выполнен с возможностью определения правила микширования на основании второй ковариантности, причем вторая ковариантность имеет третье состояние для третьего частотно-временного элемента, и при этом вторая ковариантность имеет четвертое состояние, являющееся иным, чем третье состояние, для четвертого частотно-временного элемента, являющегося иным, чем третий частотно-временной элемент.
Согласно еще одному варианту осуществления изобретения, процессор сигналов выполнен с возможностью генерации выходного звукового сигнала путем применения правила микширования так, что каждый из двух или более выходных звуковых каналов зависит от каждого из двух или более входных звуковых каналов.
В еще одном варианте осуществления изобретения процессор сигналов может быть выполнен с возможностью определения правила микширования так, что мера погрешности является минимизированной. Мерой погрешности может являться, например, сигнал абсолютной разности между опорным выходным сигналом и реальным выходным сигналом.
В одном из вариантов осуществления изобретения мерой погрешности может являться, например, мера, зависящая от
Figure 00000001
,
где
Figure 00000002
- выходной звуковой сигнал, причем
Figure 00000003
,
где
Figure 00000004
- входной звуковой сигнал, а
Figure 00000005
- матрица отображения, которая может являться специфической для конкретного применения, при этом
Figure 00000006
- опорный целевой выходной звуковой сигнал.
Согласно еще одному варианту осуществления изобретения, процессор сигналов может быть выполнен с возможностью определения правила микширования так, что
Figure 00000007
минимизировано, где
Figure 00000008
- оператор математического ожидания, в
Figure 00000006
- заданная опорная точка, а
Figure 00000009
- выходной звуковой сигнал.
Согласно еще одному варианту осуществления изобретения, процессор сигналов может быть сконфигурирован с возможностью определения правила микширования путем определения второй ковариантности, причем процессор сигналов может быть сконфигурирован с возможностью определения второй ковариантности на основании первой ковариантности.
Согласно еще одному варианту осуществления изобретения, процессор сигналов может быть выполнен с возможностью определения матрицы микширования в качестве правила микширования, причем процессор сигналов может быть выполнен с возможностью определения матрицы микширования на основании первой ковариантности и на основании второй ковариантности.
В еще одном варианте осуществления изобретения блок предоставления может быть выполнен с возможностью анализа первой ковариантности путем определения первой ковариационной матрицы входного звукового сигнала, и при этом процессор сигналов может быть сконфигурирован с возможностью определения правила микширования на основании второй ковариационной матрицы выходного звукового сигнала в качестве второй ковариантности.
Согласно еще одному варианту осуществления изобретения, блок предоставления может быть выполнен с возможностью определения первой ковариационной матрицы так, что каждое диагональное значение первой ковариационной матрицы может указывать энергию одного из входных звуковых каналов, а каждое значение первой ковариационной матрицы, не являющееся диагональным значением, может указывать межканальную корреляцию между первым входным звуковым каналом и отличным от него вторым входным звуковым каналом.
Согласно еще одному варианту осуществления изобретения, процессор сигналов может быть сконфигурирован с возможностью определения правила микширования на основании второй ковариационной матрицы, причем каждое диагональное значение второй ковариационной матрицы может указывать энергию одного из выходных звуковых каналов, а каждое значение второй ковариационной матрицы, не являющееся диагональным значением, может указывать межканальную корреляцию между первым выходным звуковым каналом и вторым выходным звуковым каналом.
Согласно еще одному варианту осуществления изобретения, процессор сигналов может быть выполнен с возможностью определения матрицы микширования так, что:
Figure 00000010
,
при этом
Figure 00000011
Figure 00000012
,
где
Figure 00000013
- матрица микширования,
Figure 00000014
- первая ковариационная матрица,
Figure 00000015
- вторая ковариационная матрица,
Figure 00000016
- первая транспонированная матрица первой разложенной матрицы
Figure 00000017
,
Figure 00000018
- вторая транспонированная матрица второй разложенной матрицы
Figure 00000019
,
Figure 00000020
- матрица, обратная первой разложенной матрице
Figure 00000017
, а
Figure 00000021
- первая унитарная матрица.
В еще одном варианте осуществления изобретения процессор сигналов может быть выполнен с возможностью определения матрицы микширования так, что
Figure 00000010
,
где
Figure 00000022
,
где
Figure 00000023
- третья транспонированная матрица второй унитарной матрицы
Figure 00000024
, а
Figure 00000025
- третья унитарная матрица, при этом
Figure 00000026
,
где
Figure 00000027
- четвертая транспонированная матрица матрицы
Figure 00000005
микширования с сокращением количества каналов,
Figure 00000028
- пятая транспонированная матрица третьей унитарной матрицы
Figure 00000025
, а
Figure 00000029
- диагональная матрица.
Согласно еще одному варианту осуществления изобретения, процессор сигналов выполнен с возможностью определения матрицы микширования в качестве правила микширования, причем процессор сигналов выполнен с возможностью определения матрицы микширования на основании первой ковариантности и на основании второй ковариантности, блок предоставления выполнен с возможностью предоставления или анализа первой ковариантности путем определения первой ковариационной матрицы входного звукового сигнала, а процессор сигналов сконфигурирован с возможностью определения правила микширования на основании второй ковариационной матрицы выходного звукового сигнала в качестве второй ковариантности, причем процессор сигналов сконфигурирован с возможностью модифицирования, по меньшей мере, некоторых диагональных значений диагональной матрицы
Figure 00000030
, когда значения диагональной матрицы
Figure 00000030
равны нулю или являются меньшими, чем заданное пороговое значение, так, чтобы эти значения были большими или равными пороговому значению, а это процессор сигналов выполнен с возможностью определения матрицы микширования на основании диагональной матрицы. Однако пороговое значение не обязательно должно являться заданным, но также может иметь функциональную зависимость.
В еще одном варианте осуществления изобретения процессор сигналов сконфигурирован с возможностью модифицирования, по меньшей мере, некоторые диагональных значений диагональной матрицы
Figure 00000030
, причем
Figure 00000031
и
Figure 00000032
, где
Figure 00000014
- первая ковариационная матрица,
Figure 00000030
- диагональная матрица,
Figure 00000033
- вторая матрица,
Figure 00000034
- третья транспонированная матрица, а
Figure 00000016
- четвертая транспонированная матрица пятой матрицы
Figure 00000017
. Матрицами
Figure 00000035
и
Figure 00000033
могут являться унитарные матрицы.
Согласно еще одному варианту осуществления изобретения, процессор сигналов выполнен с возможностью генерации выходного звукового сигнала путем применения правила микширования, по меньшей мере, к двум из двух или более входных звуковых каналов для получения промежуточного сигнала
Figure 00000036
и путем добавления разностного сигнала
Figure 00000037
к промежуточному сигналу для получения выходного звукового сигнала.
В еще одном варианте осуществления изобретения процессор сигналов выполнен с возможностью определения матрицы микширования на основании диагональной матрицы
Figure 00000038
усиления и вспомогательной матрицы
Figure 00000039
так, что
Figure 00000040
, где диагональная матрица усиления имеет значение
Figure 00000041
,
где
Figure 00000042
,
где
Figure 00000043
- матрица микширования,
Figure 00000038
- диагональная матрица усиления, а
Figure 00000039
- вспомогательная матрица, при этом
Figure 00000015
- вторая ковариационная матрица, а
Figure 00000044
- пятая транспонированная матрица матрицы
Figure 00000039
.
Ниже приведено объяснение предпочтительных вариантов осуществления настоящего изобретения со ссылкой на чертежи, на которых изображено следующее:
на Фиг. 1 проиллюстрировано устройство генерации выходного звукового сигнала, имеющего два или более выходных звуковых каналов, из входного звукового сигнала, имеющего два или более входных звуковых каналов, согласно одному из вариантов осуществления изобретения,
на Фиг. 2 изображен процессор сигналов согласно одному из вариантов осуществления изобретения,
на Фиг. 3 показан пример применения линейной комбинации векторов
Figure 00000045
и
Figure 00000046
для получения нового набора векторов
Figure 00000047
и
Figure 00000048
,
на Фиг. 4 проиллюстрирована блок-схема устройства согласно другому варианту осуществления изобретения,
на Фиг. 5 показана схема, на которой изображен сигнал с микрофонов со стереосовпадением, подаваемый в кодер стандарта MPEG с объемным звучанием (MPEG Surround) согласно одному из вариантов осуществления изобретения,
на Фиг. 6 изображено устройство согласно другому варианту осуществления изобретения, относящемуся к коррекции ICC/уровня при микшировании с сокращением количества каналов для кодера SAM - MPS,
на Фиг. 7 изображено устройство согласно одному из вариантов осуществления изобретения для усовершенствования микрофонных массивов с малым разнесением,
на Фиг. 8 проиллюстрировано устройство согласно другому варианту осуществления изобретения для слепого улучшения качества пространственного звука при стереофоническом или многоканальном воспроизведении,
на Фиг. 9 проиллюстрировано усовершенствование при размещении громкоговорителей близко друг к другу,
на Фиг. 10 изображен вариант осуществления изобретения, обеспечивающий улучшенное воспроизведение кодирования направленного звука на основании микрофонного сигнала B-формата,
на Фиг. 11 проиллюстрирована таблица 1, в которой показаны численные примеры варианта осуществления изобретения, и
на Фиг. 12 изображена распечатка 1, на которой показан вариант реализации способа согласно одному из вариантов осуществления изобретения посредством программы Matlab.
На Фиг. 1 проиллюстрировано устройство генерации выходного звукового сигнала, имеющего два или более выходных звуковых каналов, из входного звукового сигнала, имеющего два или более входных звуковых каналов, согласно одному из вариантов осуществления изобретения. Это устройство содержит блок 110 предоставления и процессор 120 сигналов. Блок 110 предоставления выполнен с возможностью приема входного звукового сигнала, имеющего два или более входных звуковых каналов. Кроме того, блок 110 предоставления выполнен с возможностью анализа первой ковариантности входного звукового сигнала. Кроме того, блок 110 предоставления выполнен с возможностью предоставления первой ковариантности в процессор 120 сигналов. Кроме того, процессор 120 сигналов выполнен с возможностью приема входного звукового сигнала. Кроме того, процессор 120 сигналов выполнен с возможностью генерации выходного звукового сигнала путем применения правила микширования, по меньшей мере, к двум из двух или более входных каналов входного звукового сигнала. Процессор 120 сигналов сконфигурирован с возможностью определения правила микширования на основании первой ковариантности входного звукового сигнала и на основании второй ковариантности выходного звукового сигнала, причем вторая ковариантность является иной, чем первая ковариантность.
На Фиг. 2 проиллюстрирован процессор сигналов согласно одному из вариантов осуществления изобретения. Этот процессор сигналов содержит блок 210 составления матрицы оптимального микширования и блок 220 микширования. Блок 210 составления матрицы оптимального микширования составляет матрицу оптимального микширования. Для этого блок 210 составления матрицы оптимального микширования использует первую ковариантность 230 (например, ковариантность на входе) диапазона частот стереофонического или многоканального входного звукового сигнала, принятого, например, блоком 110 предоставления из варианта осуществления изобретения, показанного на Фиг. 1. Кроме того, блок 210 составления матрицы оптимального микширования определяет матрицу микширования на основании второй ковариантности 240, например, целевой ковариационной матрицы, которая может зависеть от применения. Матрица оптимального микширования, составленная блоком 210 составления матрицы оптимального микширования, может быть использована в качестве матрицы отображения канала. Затем матрица оптимального микширования может быть подана в блок 220 микширования. Блок 220 микширования применяет матрицу оптимального микширования для стереофонического или многоканального диапазона частот на входе для получения на выходе стереофонического или многоканального диапазона частот выходного звукового сигнала. Выходной звуковой сигнал имеет желательную вторую ковариантность (целевую ковариантность).
Для более подробного объяснения вариантов осуществления настоящего изобретения введены следующие определения. Теперь заданы комплексные входной и выходной сигналы
Figure 00000049
и
Figure 00000050
с нулевым средним значением, где
Figure 00000051
- индекс времени,
Figure 00000052
- индекс частоты,
Figure 00000053
- индекс входного канала, а
Figure 00000054
- индекс выходного канала. Кроме того, заданы сигнальные векторы входного звукового сигнала
Figure 00000055
и выходного звукового сигнала
Figure 00000009
:
Figure 00000056
, (1)
где
Figure 00000057
и
Figure 00000058
- общее количество каналов на входе и на выходе. Кроме того,
Figure 00000059
, и заданы сигналы с заполнением нулями равной размерности:
Figure 00000060
(2)
Сигналы с заполнением нулями могут использоваться в формулировке до тех пор, пока полученное решение не будет распространено на векторы различной длины.
Как был объяснено выше, широко используемой мерой для описания пространственного аспекта многоканального звука является комбинация энергий каналов и согласованных по времени зависимостей. Эти свойства содержатся в вещественной части ковариационных матриц, заданных следующим образом:
Figure 00000061
(3)
В уравнении (3) и ниже
Figure 00000062
представляет собой оператор математического ожидания.
Figure 00000063
представляет собой оператор вещественной части, а
Figure 00000064
и
Figure 00000065
- сопряженные транспонированные матрицы
Figure 00000055
и
Figure 00000009
. Оператор
Figure 00000062
математического ожидания представляет собой математический оператор. При практическом применении его заменяют оценочным значением, таким как, например, среднее значение за определенный промежуток времени. В приведенных ниже разделах использование термина "ковариационная матрица" относится к этому вещественнозначному определению.
Figure 00000014
и
Figure 00000015
являются симметричными и положительно полуопределенными, и, следовательно, могут быть заданы такие вещественные матрицы
Figure 00000017
и
Figure 00000019
, что:
Figure 00000066
(4)
Такие разложения могут быть получены, например, с использованием разложения Холецкого (Cholesky) или разложения по собственным значениям, см., например, публикацию:
[7] Golub, G.H. and Van Loan, C.F., "Matrix computations”, Johns Hopkins Univ Press, 1996.
Следует отметить, что существует бесконечное число разложений, удовлетворяющих уравнению (4). Для любых ортогональных матриц
Figure 00000067
и
Figure 00000068
матрицы
Figure 00000069
и
Figure 00000070
также удовлетворяют этому условию, поскольку
Figure 00000071
(5)
В случаях использования стереозвука ковариационная матрица часто задают в виде энергий каналов и межканальной корреляции (ICC), например, в [1, 3, 4]. Диагональные значения
Figure 00000014
являются энергиями каналов, а ICC между двумя каналами равна
Figure 00000072
(6)
и, соответственно, для
Figure 00000015
. Индексы в скобках обозначают строку и столбец матрицы.
Остальным определением является определяемая применением матрица
Figure 00000005
отображения, которая содержит информацию о том, какие входные каналы подлежат использованию в составе каждого выходного канала. Посредством
Figure 00000005
может быть задан опорный сигнал:
Figure 00000073
(7)
Матрица отображения
Figure 00000005
может содержать изменения размерности и масштабирования, сочетания и переупорядочения каналов. Вследствие дополненного нулями определения сигналов, здесь
Figure 00000005
представляет собой квадратную матрицу N × N, которая может содержать нулевые строки или столбцы. Некоторыми примерами
Figure 00000005
являются следующие:
- Улучшение пространственных характеристик:
Figure 00000074
в тех областях применения, где выходной сигнал должен иметь максимальное сходство с входным сигналом.
- Микширование с сокращением количества каналов: матрица
Figure 00000005
представляет собой матрицу микширования с сокращением количества каналов.
- Пространственный синтез по сигналам с микрофонов первого порядка:
Figure 00000005
может представлять собой, например, матрицу микширования амбифонических микрофонов, а это означает, что
Figure 00000006
представляет собой набор сигналов с виртуальных микрофонов.
Ниже сформулировано, как следует генерировать сигнал
Figure 00000009
из сигнала
Figure 00000055
с ограничивающим условием, что
Figure 00000009
имеет определяемую применением ковариационную матрицу
Figure 00000015
. Применение также определяет матрицу
Figure 00000005
отображения, которая дает опорную точку для оптимизации. Входной сигнал
Figure 00000055
имеет измеренную ковариационную матрицу
Figure 00000014
. Как изложено, в предложенных концепциях для выполнения этого преобразования используют, в первую очередь, концепцию только оптимального микширования каналов, поскольку использование декорреляторов обычно включает в себя качество сигнала, и, во вторую очередь, введение декоррелированной энергии, когда цель не достигается иным способом.
Согласно этим концепциям, соотношение между входным и выходным сигналами может быть записано следующим образом:
Figure 00000075
, (8)
где
Figure 00000013
- вещественная матрица микширования согласно первичной концепции, а
Figure 00000076
- разностный сигнал согласно вторичной концепции.
Ниже предложены концепции для модификации ковариационной матрицы.
Сначала решают задачу согласно первичной концепции просто путем перекрестного микширования входных каналов. В этом случае уравнение (8) упрощается до
Figure 00000077
(9)
Из уравнений (3) и (9) получают, что
Figure 00000078
(10)
Из уравнений (5) и (10) следует, что
Figure 00000079
, (11)
из чего следует набор решений для
Figure 00000013
, удовлетворяющих уравнению (10),
Figure 00000080
(12)
Условием для этих решений является существование
Figure 00000020
Остающимся свободным параметром является ортогональная матрица
Figure 00000081
.
Ниже описано то, как находят матрицу
Figure 00000021
, которая обеспечивает оптимальную матрицу
Figure 00000013
. Из всех
Figure 00000013
в уравнении (12) ищут ту, которая дает выходной сигнал, наиболее близкий к заданной опорной точке
Figure 00000006
, то есть которая минимизирует
Figure 00000007
, (13a)
то есть которая минимизирует
Figure 00000082
(13).
Теперь задан такой сигнал
Figure 00000083
, что
Figure 00000084
Figure 00000083
может быть выбран так, что
Figure 00000085
, поскольку
Figure 00000086
(14)
Из этого следует, что
Figure 00000087
(15)
Уравнение (13) может быть записано в следующем виде:
Figure 00000088
(16)
Из
Figure 00000084
может быть легко показано для вещественной симметричной матрицы
Figure 00000089
, что
Figure 00000090
, что является следом матрицы. Из этого следует, что уравнение (16) принимает вид
Figure 00000091
(17)
Для следов матрицы может быть легко подтверждено, что
Figure 00000092
(18)
Используя эти свойства, уравнение (17) принимает вид
Figure 00000093
. (19)
Только лишь последний член зависит от
Figure 00000094
. Таким образом, задача оптимизации состоит в следующем:
Figure 00000095
(20)
Можно легко показать для неотрицательной диагональной матрицы
Figure 00000029
и любой ортогональной матрицы
Figure 00000096
, что
Figure 00000097
(21)
В силу этого путем определения сингулярного разложения
Figure 00000098
, где
Figure 00000029
является неотрицательной и диагональной, а
Figure 00000024
и
Figure 00000025
являются ортогональными, следует, что
Figure 00000099
(22)
для любой ортогональной
Figure 00000021
. Это равенство справедливо для
Figure 00000100
, (23)
в силу чего эта
Figure 00000021
дает максимум
Figure 00000101
и минимум меры погрешности в уравнении (13).
Устройство согласно одному из вариантов осуществления изобретения определяет матрицу
Figure 00000013
оптимального микширования с минимальной погрешностью
Figure 00000102
. Следует отметить, что ковариантность входного звукового сигнала и выходного звукового сигнала может изменяться для различных частотно-временных элементов. Для этого блок предоставления из устройства согласно одному из вариантов осуществления изобретения выполнен с возможностью анализа ковариантности входного звукового канала, которая может быть различной для различных частотно-временных элементов. Кроме того, процессор сигналов из устройства согласно одному из вариантов осуществления изобретения выполнен с возможностью определения правила микширования, например, матрицы
Figure 00000013
микширования, на основании второй ковариантности выходного звукового сигнала, причем вторая ковариантность может иметь различные значения для различных частотно-временных элементов.
Поскольку определенная матрица
Figure 00000013
микширования применяется для каждого из входных звуковых каналов входного звукового сигнала, и поскольку каждый из полученных в результате этого выходных звуковых каналов выходного звукового сигнала может, соответственно, зависеть от каждого из входных звуковых каналов, то, следовательно, процессор сигналов из устройства согласно одному из вариантов осуществления изобретения выполнен с возможностью генерации выходного звукового сигнала путем применения правила микширования так, что каждый из двух или более выходных звуковых каналов зависит от каждого из двух или более входных звуковых каналов входного звукового сигнала.
Согласно другому варианту осуществления изобретения, предложено использование декорреляции, когда
Figure 00000020
не существует или является неустойчивой. В описанных выше вариантах осуществления изобретения было предложено такое техническое решение для определения матрицы оптимального микширования, в котором предполагалось, что
Figure 00000020
существует. Однако
Figure 00000020
может существовать не всегда, или обратная ей матрица может содержать очень большие множители, если некоторые из основных составляющих в
Figure 00000055
очень слабы. Эффективным способом регуляризации обратной матрицы является использование сингулярного разложения
Figure 00000103
. Соответственно, обратная матрица выражается следующим образом:
Figure 00000104
(24)
Проблемы возникают тогда, когда некоторые из диагональных значений неотрицательной диагональной матрицы
Figure 00000030
равны нулю или очень малы. В этом случае концепция, которая обеспечивает надежную регуляризацию обратной матрицы, состоит в замене этих значении более высокими значениями. Результатом этой процедуры является
Figure 00000105
, соответствующая обратная матрица
Figure 00000106
и соответствующая матрица
Figure 00000107
микширования.
Эта регуляризация фактически означает, что в процедуре микширования усиление некоторых из слабых основных составляющих в
Figure 00000055
уменьшено, и следовательно, их сохранность в выходном сигнале
Figure 00000009
также уменьшена, и целевая ковариантность
Figure 00000015
, как правило, не достигается.
Таким образом, согласно одному из вариантов осуществления изобретения, процессор сигналов может быть сконфигурировано так, что модифицирует, по меньшей мере, некоторые диагональные значения диагональной матрицы
Figure 00000030
, когда эти значения диагональной матрицы
Figure 00000030
равны нулю или являются меньшими, чем пороговое значение (пороговое значение может являться заданным или может иметь функциональную зависимость), так, что эти значения являются большими или равными пороговому значению, причем процессор сигналов может быть выполнен с возможностью определения матрицы микширования на основании диагональной матрицы.
Согласно одному из вариантов осуществления изобретения, процессор сигналов может быть сконфигурирован с возможностью модифицирования, по меньшей мере, некоторых диагональных значений диагональной матрицы
Figure 00000030
, причем
Figure 00000103
и
Figure 00000108
, где
Figure 00000014
- первая ковариационная матрица,
Figure 00000030
- диагональная матрица,
Figure 00000033
- вторая матрица,
Figure 00000109
- третья транспонированная матрица, а
Figure 00000110
- четвертая транспонированная матрица пятой матрицы
Figure 00000017
.
Вышеупомянутая потеря составляющей сигнала может быть полностью скомпенсирована разностным сигналом
Figure 00000076
. Исходное соотношение между входным и выходным сигналами будет конкретизировано с регуляризированной инверсией.
Figure 00000111
(25)
Теперь задают аддитивную составляющую
Figure 00000112
, так что вместо
Figure 00000113
имеют
Figure 00000114
. Кроме того, задают независимый сигнал
Figure 00000115
, так что
Figure 00000116
и
Figure 00000117
(26)
Можно легко показать, что сигнал
Figure 00000118
(27)
имеет ковариантность
Figure 00000015
. В этом случае разностный сигнал для компенсации регуляризации равен
Figure 00000119
(28)
Из уравнений (27) и (28) следует, что
Figure 00000120
(29)
Поскольку
Figure 00000112
была задана как стохастический сигнал, то из этого следует, что соответствующим свойством
Figure 00000076
является его ковариационная матрица. Таким образом, любой сигнал, являющийся независимым относительно
Figure 00000055
, который обработан так, что имеет ковариантность
Figure 00000121
, служит в качестве разностного сигнала, который идеально восстанавливает целевую ковариационную матрицу
Figure 00000015
в тех ситуациях, когда использовалась описанная регуляризация. Такой разностный сигнал может быть легко сгенерирован с использованием декорреляторов и предложенного способа микширования каналов.
Аналитическое нахождение оптимального баланса между количеством декоррелированной энергии и усилением слабых составляющих сигнала не является прямолинейным. Это объясняется зависимостью от факторов, специфических для конкретного применения, таких как, например, устойчивость статистических свойств входного сигнала, примененного окна анализа и отношение сигнал/шум (ОСШ) во входном сигнале. Однако довольно прямолинейным способом является регулировка эвристической функции для нахождения этого баланса без очевидных недостатков, как это было сделано в приведенном ниже примере кода.
Согласно этому процессор сигналов устройства согласно одному из вариантов осуществления изобретения может быть выполнен с возможностью генерации выходного звукового сигнала путем применения правила микширования, по меньшей мере, к двум из двух или более входных звуковых сигналов для получения промежуточного сигнала
Figure 00000122
и путем добавления разностного сигнала
Figure 00000076
к промежуточному сигналу для получения выходного звукового сигнала.
Было показано, что когда применяется регуляризация матрицы, обратной
Figure 00000017
, то составляющие сигнала, отсутствующие в общем выходном сигнале, могут быть полностью дополнены разностным сигналом
Figure 00000076
с ковариантностью
Figure 00000121
. Посредством этого может быть гарантировано, что всегда достигается целевая ковариантность
Figure 00000015
. Ниже представлен один способ генерации соответствующего разностного сигнала
Figure 00000076
. Он содержит следующие этапы:
1. Генерация набора сигналов, количество которых равно количеству выходных каналов. Может использоваться сигнал
Figure 00000073
, поскольку он имеет такое же количество каналов, как и выходной сигнал, и каждый выходной сигнал содержит сигнал, подходящий для этого конкретного канала.
2. Декорреляция этого сигнала. Существует множество способов декорреляции, в том числе, фазовые фильтры, свертки с шумовыми пакетами и псевдослучайные задержки в диапазонах частот.
3. Измерение (или предположение) ковариационной матрицы декоррелированного сигнала. Измерение является простейшим и наиболее надежным, но поскольку сигналы исходят из декорреляторов, то можно предположить, что они являются некогерентными. В этом случае достаточным является просто измерение энергии.
4. Применение предложенного способа для генерации матрицы микширования, которая при применении для декоррелированного сигнала обеспечивает генерацию выходного сигнала с ковариационной матрицей
Figure 00000121
. Здесь используют матрицу отображения
Figure 00000074
, поскольку желают оказывать минимальное влияние на содержимое сигнала.
5. Обработка сигнала из декорреляторов при помощи этой матрицы микширования и подача его в выходной сигнал для дополнения отсутствия составляющих сигнала. Посредством этого достигают целевой
Figure 00000015
.
В альтернативном варианте осуществления изобретения декоррелированные каналы добавляют к (по меньшей мере одному) входному сигналу перед составлением матрицы оптимального микширования. В этом случае входной и выходной сигналы имеют одну и ту же размерность, и при условии, что входной сигнал имеет такое же количество независимых составляющих сигнала, что и количество входных каналов, отсутствует необходимость в использовании разностного сигнала
Figure 00000076
. Когда декорреляторы используются таким образом, использование декорреляторов является "невидимым" для предложенной концепции, поскольку входными каналами являются декоррелированные каналы, как и любые другие.
Если использование декорреляторов является нежелательным, то по меньшей мере целевые значения энергии каналов могут быть достигнуты путем перемножения строк матрицы
Figure 00000039
так, что
Figure 00000040
, (30)
где
Figure 00000038
- диагональная матрица усиления со следующими значениями
Figure 00000041
, (31)
где
Figure 00000123
.
Во многих областях применения количество входных и выходных каналов является различным. Как описано в Уравнении (2), применено заполнение нулями сигнала с меньшей размерностью, чтобы он имел одну и ту же самую размерность, что и сигнал с более высокой размерностью. Заполнение нулями подразумевает непроизводительные издержки при вычислениях, поскольку некоторые строки или столбцы в результирующей
Figure 00000013
соответствуют каналам с заданной нулевой энергией. С математической точки зрения непроизводительные издержки могут быть уменьшены путем введения матрицы Λ, представляющей собой единичную матрицу, дополненную нулями до размерности Ny×Nx, что эквивалентно использованию сначала заполнения нулями и, в заключение, обрезки
Figure 00000013
до соответствующей размерности Ny×Nx, например,
Figure 00000124
(32)
Когда
Figure 00000021
переопределена так, что
P=VΛUT, (33)
результирующей
Figure 00000013
является матрица микширования Ny×Nx, которая является той же самой, что и соответствующая часть
Figure 00000013
в случае с заполнением нулями. Следовательно,
Figure 00000014
,
Figure 00000015
,
Figure 00000017
и
Figure 00000019
могут иметь их естественную размерность, а матрица
Figure 00000005
отображения имеет размерность Ny×Nx.
Входная ковариационная матрица всегда является разлагаемой до
Figure 00000108
, поскольку она является положительной полуопределенной мерой из фактического сигнала. Однако возможно задать такие целевые ковариационные матрицы, которые не являются разлагаемыми по той причине, что они отображают неосуществимые зависимости между каналами. Существуют концепции для обеспечения разложимости, например, регулировка отрицательных собственный значений до нулевых и нормировка энергии, см., например, публикацию
[8] R. Rebonato, P. Jäckel, "The most general methodology to create a valid correlation matrix for risk management and option pricing purposes”, Journal of Risk, Vol. 2, No. 2, pp. 17-28. 2000.
Однако наиболее значимым использованием предложенной концепции является запрос только возможных ковариационных матриц.
Для резюмирования вышеизложенного общая задача может быть перефразирована следующим образом. Во-первых, имеется входной сигнал с определенной ковариационной матрицей. Во-вторых, применение определяет два параметра: целевую ковариационную матрицу и правило относительно того, какие входные каналы подлежат использованию в составе каждого выходного канала. Для выполнения этого преобразования предложено использовать следующие концепции: первичную концепцию, проиллюстрированную на Фиг. 2, которая состоит в том, что целевая ковариантность достигнута с использованием решения для оптимального микширования входных каналов. Эту концепцию считают первичной, поскольку в ней избегают использования декоррелятора, который часто ухудшает качество сигнала. Вторичная концепция имеет место тогда, когда имеется недостаточное количество независимых составляющих с надлежащей энергией. Декоррелированную энергию вводят для компенсации отсутствия этих составляющих. Эти две концепции сообща обеспечивают средство для выполнения надежного регулирования ковариационной матрицы в любом заданном сценарии.
Основной ожидаемой областью применения предложенной концепции является пространственный микрофонный эффект [2, 3], которая является той областью техники, где задачи, связанные с ковариантностью сигнала, в частности, являются особо очевидными вследствие физических ограничений, которые имеют направленные микрофоны. Дальнейшими ожидаемыми вариантами использования являются, в тои числе, усовершенствование стереофонического и многоканального воспроизведения, выявление окружения, микширование с увеличением количества каналов и микширование с сокращением количества каналов.
В приведенном выше описании были даны определения, сопровождаемые получением предложенной концепции. Сначала было предложено техническое решение для перекрестного микширования, затем была предложена концепция введения коррелированной звуковой энергии. После этого было дано описание концепции с различным количеством входных и выходных каналов, а также приведены соображения относительно разложимости ковариационной матрицы. Ниже приведены варианты практического применения, представлен набор численных примеров и приведено заключение. Кроме того, приведен пример кода программы Matlab с полными функциональными возможностями согласно этому документу.
Воспринимаемая пространственная характеристика стереофонического или многоканального звука в значительной степени определяется ковариационной матрицей сигнала в диапазонах частот. Была предложена концепция оптимального и адаптивного перекрестного микширования набора входных каналов с заданной ковариантностью в набор выходных каналов с произвольно определимой ковариантностью. Была предложена еще одна концепция, заключающаяся в том, что декоррелированную энергию вводят только лишь там, где это необходимо, при отсутствии независимых составляющих звукового сигнала с надлежащей энергией. Эта концепция имеет широкое разнообразие областей применения в области обработки пространственных звуковых сигналов.
Энергии каналов и зависимости между каналами (или ковариационная матрица) многоканального сигнала могут быть отрегулированы просто путем линейного и изменяемого во времени перекрестного микширования каналов в зависимости от входных характеристик и желательных целевых характеристик. Эта концепция может быть проиллюстрирована при помощи фактор-представления сигнала, где угол между векторами соответствует зависимости от канала, а амплитуда вектора равна уровню сигнала.
На Фиг. 3 проиллюстрирован пример применения линейной комбинации векторов
Figure 00000045
и
Figure 00000046
для получения нового набора векторов
Figure 00000047
и
Figure 00000048
. Аналогичным образом, уровни звукового канала и их зависимость могут быть модифицированы посредством линейной комбинации. Общее решение включает в себя не векторы, а матричное представление, которое является оптимальным для любого количества каналов.
Матрица микширования для стереофонических сигналов также может быть легко составлена тригонометрическим способом, как видно из Фиг. 3. Результаты являются теми же самыми, что и полученные при помощи математики матриц, но составление является иным.
Если входные каналы являются сильно зависимыми, то получение целевой ковариационной матрицы возможно только с использованием декорреляторов. Также была предложена процедура введения декорреляторов только там, где это необходимо, например, оптимально.
На Фиг. 4 проиллюстрирована блок-схема устройства из варианта осуществления изобретения, в котором применяют технологию микширования. Это устройство содержит модуль 410 анализа ковариационной матрицы и процессор сигналов (не показан), причем процессор сигналов содержит модуль 420 составления матрицы микширования и модуль 430 применения матрицы микширования. Входную ковариантность диапазона частот стереофонического или многоканального входного сигнала анализируют модулем 410 анализа ковариационной матрицы. Результат анализа ковариационной матрицы подают в модуль 420 составления матрицы микширования.
Модуль 420 составления матрицы микширования составляет матрицу микширования на основании результата анализа ковариационной матрицы, на основании целевой ковариационной матрицы и, возможно, также на основании критерия погрешности.
Модуль 420 составления матрицы микширования подает матрицу микширования в модуль 430 применения матрицы микширования. Модуль 430 применения матрицы микширования применяет матрицу микширования для диапазона частот стереофонического или многоканального входного сигнала для получения диапазона частот стереофонического или многоканального выходного сигнала, имеющего, например, заданную целевую ковариантность, в зависимости от целевой ковариационной матрицы.
Подводя итог вышеизложенному, общей целью концепции является расширение, фиксация и/или синтез пространственного звука с наивысшей степенью оптимальности с точки зрения качества звука. Целевая ковариантность, например вторая ковариантность, определяется применением.
Также применимая в полном диапазоне, эта концепция является значимой для восприятия, в особенности, при обработке диапазона частот.
Декорреляторы используют для улучшения (уменьшения) корреляции между каналами. Они делают это, но имеют тенденцию ухудшать общее качество звука, в особенности, с переходной составляющей звукового сигнала.
В предложенной концепции избегают использования декорреляторов, или в некоторых вариантах применения сводят к минимуму их использование. Результатом является одна и та же пространственная характеристика, но без таких потерь качества звука.
Среди других вариантов использования, эта технология может использоваться в кодере SAM-MPS.
Предложенная концепция была реализована для улучшения способа для микрофонов, в котором генерируют поток битов в формате MPEG с объемным звучанием (MPEG surround) (MPEG=экспертная группа по вопросам движущихся изображений) из сигнала из синхронных стереофонических микрофонов первого порядка, см., например, [3]. Способ включает в себя оценку по стереофоническому сигналу направления и размытости звукового поля в диапазонах частот и создание такого потока битов в формате MPEG c объемным звучанием (MPEG surround), который при декодировании на стороне приемника, создает звуковое поле, которое аппроксимирует исходное звуковое поле с точки зрения восприятия.
На Фиг. 5. проиллюстрирована схема, на которой изображен сигнал с микрофонов со стереосовпадением, подаваемый в кодер стандарта MPEG с объемным звучанием (MPEG surround), согласно одному из вариантов осуществления изобретения, в котором реализована предложенная концепция создания сигнала формата MPEG c объемным звучанием (MPEG surround), смикшированного с сокращением количества каналов, из заданного сигнала с микрофона. Всю обработку выполняют по диапазонам частот.
Модуль 520 определения пространственных данных выполнен с возможностью формирования данных с информацией о конфигурации, содержащих данные о пространственном окружении и ICC и/или уровни при микшировании с сокращением количества каналов на основании информации о направлении и о размытости в зависимости от модели 510 звукового поля. Сама модель звукового поля основана на анализе значений ICC и уровней для микрофона в сигнале со стереофонического микрофона. Затем модуль 520 определения пространственных данных подает целевые значения ICC и уровней для микширования с сокращением количества каналов в модуль 530 составления матрицы микширования. Кроме того, модуль 520 определения пространственных данных может быть выполнен с возможностью формирования данных о пространственном окружении и значений ICC и уровней для микширования с сокращением количества каналов в качестве вспомогательной пространственной информации формата MPEG с объемным звучанием (MPEG surround). Затем модуль 530 составления матрицы микширования составляет матрицу микширования на основании предоставленных данных с информацией о конфигурации, например, целевых значений ICC и уровней для микширования с сокращением количества каналов, и подает эту матрицу в модуль 540 микширования. Модуль 540 микширования применяет матрицу микширования для сигнала со стереомикрофона. Таким образом, сигнал генерируют при наличии целевых значений ICC и уровней. Затем сигнал с целевыми ICC и уровнями подают в основной кодер 550. В одном из вариантов осуществления изобретения модули 520, 530 и 540 являются подмодулями процессора сигналов.
В способе, выполняемом устройством из Фиг. 5, должен быть сгенерирован стереофонический сигнал формата MPEG с объемным звучанием (MPEG Surround),смикшированный с сокращением количества каналов. Это включает в себя необходимость регулировки уровней и значений ICC заданного стереофонического сигнала с минимальным влиянием на качество звука. Для этого была применена предложенная концепция перекрестного микширования, и была заметна польза для восприятия концепции из предшествующего уровня техники в [3].
На Фиг. 6 проиллюстрировано устройство согласно другому варианту осуществления изобретения, относящемуся к коррекции ICC/уровня при микшировании с сокращением количества каналов для кодера SAM-MPS. Анализ ICC и уровня выполняют в модуле 602, а модель 610 звукового поля зависит от результатов анализа ICC и уровня, выполняемого модулем 602. Модуль 620 соответствует модулю 520, модуль 630 соответствует модулю 530 и модуль 640 соответствует модулю 540 из Фиг. 5 соответственно. То же самое применимо к основному кодеру 650, который соответствует основному кодеру 550 из Фиг. 5. Описанная выше концепция может быть интегрирована в кодер SAM-MPS для создания из сигналов с микрофонов MPS, смикшированных с сокращением количества каналов с в точности правильными ICC и уровнями. Описанная выше концепция также применима и при прямом воспроизведении "SAM - многоканальный сигнал" без MPS для обеспечения идеальный пространственный синтез наряду с минимизацией объема использования декоррелятора.
Ожидаются усовершенствования применительно к расстоянию до источников, локализации источников, устойчивости, комфортности прослушивания и охвату.
На Фиг. 7 изображено устройство согласно одному из вариантов осуществления изобретения для усовершенствования микрофонных массивов с малым разнесением. Модуль 705 выполнен с возможностью выполнения анализа ковариационной матрицы входного сигнала с микрофона для получения ковариационной матрицы микрофона. Ковариационную матрицу микрофона подают в модуль 730 составления матрицы микширования. Кроме того ковариационную матрицу микрофона используют для получения модели 710 звукового поля. Модель 710 звукового поля может быть основана на иных источниках, чем ковариационная матрица.
Информация о направлении и о размытости, на основании модели звукового поля, затем введена в модуль 720 составления целевой ковариационной матрицы для генерации целевой ковариационной матрицы. Затем модуль 720 составления целевой ковариационной матрицы вводит сгенерированную целевую ковариационную матрицу в модуль 730 составления матрицы микширования.
Модуль 730 составления матрицы микширования выполнен с возможностью генерации матрицы микширования и подает сгенерированную матрицу микширования в модуль 740 применения матрицы микширования. Модуль 740 применения матрицы микширования выполнен с возможностью применения матрицы микширования для входного сигнала с микрофона для получения выходного сигнала с микрофона, имеющего целевую ковариантность. В одном из вариантов осуществления изобретения модули 720, 730 и 740 являются подмодулями процессора сигналов.
Такое устройство при DirAC и SAM функционирует в соответствии с концепцией, которая состоит в оценке направления и размытости исходного звукового поля и в создании такого выходного сигнала, который наилучшим образом воспроизводит оцененное направление и оцененную размытость. Эта процедура обработки сигналов требует обширных настроек ковариационной матрицы для обеспечения правильного пространственного образа. Обработанная концепция является решением этой задачи. За счет предложенной концепции обеспечивается расстояние до источников, локализация источников и/или расстояние между источниками, комфортность прослушивания и/или охват.
На Фиг. 8 проиллюстрирован пример, демонстрирующий вариант осуществления изобретения для слепого улучшения качества пространственного звука при стереофоническом или многоканальном воспроизведении. В модуле 805 выполняют анализ ковариационной матрицы, например, анализ ICC или уровня стереофонического или многоканального содержимого. Затем, в модуле 815 улучшения применяют правило улучшения, например, для получения выходных ICC из входных ICC. Модуль 830 составления матрицы микширования генерирует матрицу микширования на основании результатов анализа ковариационной матрицы, выполненного модулем 805, и на основании информации, полученной из применения правила улучшения, осуществленного в модуле 815 улучшения. Затем в модуле 840 матрицу микширования применяют для стереофонического или многоканального содержимого для получения отрегулированного стереофонического или многоканального содержимого, имеющего целевую ковариантность.
Что касается многоканального звука, например, результатов микширования или записей, то весьма распространенным является нахождение субоптимальности восприятия в пространственном звуке, в особенности, с учетом слишком высокой ICC. Типичным следствием является ухудшенное качество применительно к ширине, охвату, расстоянию, расстоянию между источниками, локализации источников и/или устойчивости источников и комфортности прослушивания. Неофициально было проверено, что эта концепция способна улучшать этих свойства при наличии элементов, имеющих излишне высокие ICC. Наблюдаемыми улучшениями являются ширина, расстояние до источника, исходной локализация/разделение источников, охват и комфортность прослушивания.
На Фиг. 9 проиллюстрирован другой вариант осуществления изобретения для усовершенствования при размещении громкоговорителей близко друг к другу (например, в планшетах, телевизорах). Предложенная концепция, вероятно, является полезной в качестве инструментального средства для улучшения качества стереофонического воспроизведения в тех устройствах воспроизведения, где угол громкоговорителя является слишком узким (например, в планшетах). Предложенная концепция обеспечивает:
- перепанорамирование источников в пределах заданной дуги для соответствия более широкой расстановке громкоговорителей
- увеличение ICC для лучшего соответствия ICC при более широкой расстановке громкоговорителей
- обеспечение лучшей исходной точки для выполнения подавления перекрестных помех, например, с использованием подавления перекрестных помех только лишь при отсутствии какого-либо прямого способа создания желательных бинауральных сигналов.
Ожидаются улучшения относительно ширины, и относительно подавления регулярных перекрестных помех, качества звука и устойчивости.
В другом примере применения, проиллюстрированном на Фиг. 10, изображен вариант осуществления изобретения, обеспечивающий оптимальное воспроизведение кодирования направленного звука (DirAC) на основании сигнала с микрофона в B-формате.
Вариант осуществления изобретения из Фиг. 10 основан на том факте, что современные блоки воспроизведения с DirAC, основанные на совпадающих сигналах с микрофонов, применяют декорреляцию в излишней мере, ухудшая, таким образом, качество звучания. Например, если звуковое поле проанализировано как размытое, то для всех каналов применяют полную корреляцию, даже несмотря на то, что B-формат уже обеспечивает три некогерентные составляющие звукового сигнала в случае горизонтального звукового поля (W, X, Y). Этот эффект присутствует в различной степени, за исключением тех случаев, когда размытость рана нулю.
Кроме того, описанные выше системы, в которых используют виртуальные микрофоны, не гарантируют правильную ковариационную матрицу (уровни и корреляции каналов) на выходе, поскольку виртуальные микрофоны влияют на звук по-разному в зависимости от угла источника, расстановки громкоговорителей и размытости звукового поля.
Предложенная концепция решает обе проблемы. Существуют два альтернативных варианта: создание декоррелированных каналов в качестве дополнительных входных каналов (как показано на чертеже); или использование концепции "декоррелятор-микширование".
На Фиг. 10 модуль 1005 выполняет анализ ковариационной матрицы. Модуль 1018 составления целевой ковариационной матрицы при составлении целевой ковариационной матрицы учитывает не только модель звукового поля, но также и конфигурацию громкоговорителей. Кроме того, модуль 1030 составления матрицы микширования генерирует матрицу микширования не только на основании анализа ковариационной матрицы и целевой ковариационной матрицы, но также и на основании критерия оптимизации, например, матрицы микширования "B-формат - виртуальный микрофон", предоставленной модулем 1032. Модель 1010 звукового поля может соответствовать модели 710 звукового поля из Фиг. 7. Модуль 1040 применения матрицы микширования может соответствовать модулю 740 применения матрицы микширования из Фиг. 7.
В еще одном примере применения предложен вариант осуществления изобретения для пространственного регулирования в способах преобразования каналов, например, микширования с сокращением количества каналов. Преобразование каналов, например, выполнение автоматического микширования с сокращением количества каналов до формата 5.1 из фонограммы в формате 22.2, включает в себя сокращение каналов. Оно может включать в себя потерю или изменение пространственного образа, что может решаться посредством предложенной концепции. И вновь, существуют две альтернативных варианта: в первом варианте эту концепцию используют в области более высокого количества каналов, но для более низкого количества отсутствующих каналов задают каналы с нулевой энергией; в другом варианте матричное решение формулируют непосредственно для различных количеств каналов.
На Фиг. 11 проиллюстрирована таблица 1, в которой приведены численные примеры вышеописанных концепций. Когда сигнал с ковариантностью
Figure 00000014
обработан посредством матрицы
Figure 00000013
микширования и дополнен возможным разностным сигналом с
Figure 00000121
, то выходной сигнал имеет ковариантность
Figure 00000015
. Несмотря на то, что эти численные примеры являются статическими, типичный вариант использования предложенного способа является динамическим. Предполагают, что порядок следования каналов является следующим: L, R, C, Ls, Rs, (Lr, Rr).
В таблице 1 показан набор численных примеров для иллюстрации характера поведения предложенной концепции в некоторых ожидаемых вариантах использования. Матрицы были составлены при помощи кода программы Matlab, приведенного в распечатке 1. Распечатка 1 проиллюстрирована на Фиг. 12.
На распечатке 1 из Фиг. 12 проиллюстрирован вариант реализации предложенной концепции посредством программы Matlab. Этот код программы Matlab был использован в численных примерах и обеспечивает общие функциональные возможности предложенной концепции.
Несмотря на то, что матрицы проиллюстрированы статическими, в типичных областях применения они изменяются по времени и частоте. Расчетный критерий удовлетворяется по определению, если сигнал с ковариантностью
Figure 00000014
обработан посредством матрицы
Figure 00000013
микширования и дополнен возможным разностным сигналом с
Figure 00000121
, а выходной сигнал имеет заданную ковариантность
Figure 00000015
.
В первой и второй строках таблицы проиллюстрирован вариант использования улучшения стереофонического воспроизведения посредством декорреляции сигналов. В первой строке имеется малая, но приемлемая некогерентная составляющая между двумя каналами, и, таким образом, полностью некогерентный выходной сигнал достигается просто путем микширования каналов. Во второй строке корреляция на входе является очень высокой, например, более слабая основная составляющая очень мала. Ее усиление в чрезмерной степени является нежелательным, и, следовательно, встроенный ограничитель начинает требовать введения вместо нее коррелированной энергии, например, теперь
Figure 00000121
не равна нулю.
В третьей строке показан случай микширования с увеличением количества каналов от стерео до 5.0. В этом примере целевая ковариационная матрица задана так, чтобы некогерентная составляющая смикшированного стереофонического сигнала была одинаковой и некогерентно распределенной в боковые и задние громкоговорители, и чтобы когерентная составляющая была подана в центральный громкоговоритель. Разностный сигнал вновь не равен нулю, поскольку увеличена размерность сигнала.
В четвертой строке показан случай простого микширования с увеличением количества каналов от 5.0 до 7.0, где два исходных тыловых канала некогерентно смикшированы с увеличением количества каналов в четыре новые тыловые канала. Этот пример иллюстрирует, что обработка сосредоточена на тех каналах, где требуется регулирование.
В пятой строке изображен случай микширования с сокращением количества каналов из сигнала в формате 5.0 в стереосигнал. Пассивное микширование с сокращением количества каналов, например, применение статической матрицы
Figure 00000005
микширования с сокращением количества каналов, привело бы к усилению когерентных составляющих по сравнению с некогерентными составляющими. Здесь целевая ковариационная матрица была задана так, чтобы сохранить энергию, что выполняется посредством результирующей
Figure 00000013
.
В шестой и седьмой строках проиллюстрирован случай использования пространственного микрофонного эффекта с совпадением. Входные ковариационные матрицы
Figure 00000014
являются результатом помещения идеальных совпадающих микрофонов первого порядка в идеальное диффузное поле. В шестой строке углы между микрофонами являются одинаковыми, а в седьмой строке микрофоны обращены к стандартным углам схемы размещения типа 5.0. В обоих случаях большие недиагональные значения
Figure 00000014
иллюстрируют недостаток, присущий технологиям пассивных совпадающих микрофонов первого порядка в идеальном случае, ковариационная матрица, наилучшим образом представляющая диффузное поле, является диагональной, и, следовательно, она была задана в качестве целевой. В обоих случаях отношение результирующей коррелированной энергии ко всей энергии в точности равно 2/5. Это объясняется тем, что в сигналах от совпадающих по горизонтали микрофонов первого порядка имеется три независимых составляющих сигнала, и что необходимо добавить две составляющих для получения диагональной целевой ковариационной матрицы с пятью каналами.
Было установлено, что пространственное восприятие при стереофоническом и многоканальном воспроизведении зависит, главным образом, от ковариационной матрицы сигнала в существенных для восприятия диапазонах частот.
Была представлена концепция регулирования ковариационной матрицы сигнала путем оптимального перекрестного микширования каналов. Были представлены средства введения декоррелированной энергии, когда это необходимо в случаях отсутствия достаточного количества независимых составляющих сигнала с надлежащей энергией.
Было установлено, что эта концепция является надежной по своему назначению, и было определено большое разнообразие вероятных областей применения.
Ниже представлены варианты осуществления генерации
Figure 00000015
на основании
Figure 00000014
. В качестве первого примера, рассмотрено микширование с увеличением количества каналов от стерео до 5.0. Что касается микширования с увеличением количества каналов от стерео до 5.0, то при микшировании с увеличением количества каналов
Figure 00000014
представляет собой матрицу 2×2, а
Figure 00000015
представляет собой матрицу 5×5 (в этом примере канал низкочастотного динамика не рассматривается). Этапами генерации
Figure 00000015
на основании
Figure 00000014
в каждом частотно-временном элементе, применительно к микшированию с увеличением количества каналов, могут являться, например, следующие:
1. Оценка энергии окружающего и прямого звука в левом и в правом канале. Окружающий звук характеризуется некогерентной составляющей между каналами, которая имеет одинаковую энергию в обоих каналах. Энергия прямого звука представляет собой остаток, когда часть энергии окружающего звука, например, когерентная составляющая энергии удалена из полной энергии, возможно с различными значениями энергии в левом и правом каналах.
2. Оценка угла составляющей прямого звука. Это сделано с использованием закона об амплитудном панорамировании в обратном порядке. В составляющей прямого звука имеется соотношение панорамирования по амплитуде, и имеется только один соответствующий ему угол между фронтальными громкоговорителями.
3. Генерация матрицы 5×5 из нулей в качестве
Figure 00000015
.
4. Введение в диагональ
Figure 00000015
такого количества энергии прямого звука, которое соответствует двум ближайшим громкоговорителям проанализированного направления. Распределение энергии между ними может быть полученным согласно правилам амплитудного панорамирования. Амплитудное панорамирование является когерентным, вследствие чего к соответствующим недиагональным элементам добавляют величину, равную квадратному корню произведения значений энергии двух каналов.
5. Добавление к диагонали
Figure 00000015
, соответствующей каналам L, R, Ls и Rs, количества энергии, соответствующего энергии составляющей окружающего звука. Хорошим вариантом выбора является одинаковое распределение. Теперь имеется целевая
Figure 00000015
.
В качестве другого примера, рассмотрен усовершенствованный вариант. Его целью является улучшение качества восприятия, например, ширины или охвата, путем регулирования когерентности между каналами к нулю. Здесь приведены два различных примера реализации улучшения двумя способами. В качестве первого способа выбирают вариант использования улучшения стереофонического воспроизведения, вследствие чего
Figure 00000014
и
Figure 00000015
представляют собой матрицы 2×2. Этапы являются следующими:
1. Представление ICC (нормированного значения ковариантности от -1 до 1), например, в виде приведенной здесь формулы.
2. Регулировка ICC при помощи функции. Например, ICCnew=sign(ICC)**ICC2. Это является довольно умеренное регулировкой. Или ICCnew=sign(ICC)**max(0,abs(ICC)*10-9). Это является более сильной регулировкой.
3. Представление
Figure 00000015
в виде формулы так, что диагональные значения являются теми же самыми, что и в
Figure 00000014
, но недиагональное значение представлено с использованием ICCnew при помощи и той же самой формулы, что и на этапе 1, но обратной.
В вышеупомянутом сценарии отсутствует необходимость в разностном сигнале, поскольку регулирование ICC рассчитано так, что в системе не требуется сильное усиление слабых составляющих сигнала.
Вторым типом реализации способа в этом варианте использования является следующий. Имеется N-канальный входной сигнал, вследствие чего
Figure 00000014
и
Figure 00000015
представляют собой матрицы N×N.
1. Представление
Figure 00000015
в виде формулы через
Figure 00000014
просто путем задания диагональных значений
Figure 00000015
равными диагональным значениям в
Figure 00000014
, а недиагональных значений равными нулю.
2. Активизация способа компенсации усиления в предложенном способе вместо использования разностей. Регуляризация матрицы, обратной
Figure 00000017
, обеспечивает устойчивость системы. Компенсация усиления обеспечивает сохранение значений энергии.
Два описанных способа улучшения дают аналогичные результаты. Последний из них легче реализовать в многоканальном варианте использования.
Наконец, в качестве третьего примера, рассмотрена модель прямого распространения/размытости, например, кодирование направленного звука (DirAC).
DirAC, а также микрофоны пространственной звукозаписи (SAM), обеспечивают интерпретацию звукового поля со следующими параметрами: направление и размытость. Направление представляет собой угол прихода прямой составляющей звукового сигнала. Размытость представляет собой значение от 0 до 1, который дает информацию о том, насколько большое количество общей звуковой энергии рассеяно, например, предполагая, что она приходит некогерентно со всех направлений. Это является приближением звукового поля, но при применении в воспринимаемых диапазонах частот обеспечено хорошее с точки зрения восприятия представление звукового поля. Предполагают, что направление, размытость и общая энергия звукового поля являются известными в частотно-временном элементе. Их представляют в виде формулы с использованием информации в ковариационной матрице
Figure 00000014
микрофона. Имеется N-канальная расстановка громкоговорителей. Этапами генерации
Figure 00000015
, которые являются аналогичными микшированию с увеличением количества каналов, являются следующие:
1. Генерация матрицы N×N из нулей в качестве
Figure 00000015
.
2. Введение в диагональ
Figure 00000015
соответствующей двум ближайшим громкоговорителям проанализированного направления такого количества энергии прямого звука, которое равно (1-размытость)**полная энергия. Распределение энергии между ними может быть получено согласно правилам амплитудного панорамирования. Амплитудное панорамирование является когерентным, вследствие чего к соответствующим недиагональным элементам добавляют величину, равную квадратному корню произведения значений энергии двух каналов.
3. Распределение в диагональ
Figure 00000015
количества рассеянной энергии, равного "размытость*полная энергия". Распределение может быть выполнено, например, так, чтобы больше энергии было распределено в те направления, где громкоговорители расположены редко. Теперь имеется целевая
Figure 00000015
.
Несмотря на то, что некоторые аспекты были описаны применительно к устройству, понятно, что эти аспекты также представляют собой описание соответствующего способа, где блок или устройство соответствуют этапу способа или признаку этапа способа. Аналогичным образом, аспекты, описанные применительно к этапу способа, также представляют собой описание соответствующего блока, элемента или признака соответствующего устройства.
В зависимости от определенных требований, предъявляемых к реализации, варианты осуществления настоящего изобретения могут быть реализованы аппаратными средствами или посредством программного обеспечения. Реализация может быть осуществлена с использованием цифрового носителя информации, такого как, например, гибкий диск, универсальный цифровой диск (DVD), компакт-диск (CD), постоянное запоминающее устройство (ROM), программируемое постоянное запоминающее устройство (PROM), стираемое PROM (EPROM), электрически стираемое PROM (EEPROM) или флэш-память, на котором хранятся электронно-считываемые управляющие сигналы, взаимодействующие (или способные взаимодействовать) с программируемой компьютерной системой для выполнения соответствующего способа.
Согласно настоящему изобретению, некоторые варианты его осуществления содержат носитель данных, содержащий электронно-считываемые управляющие сигналы, которые способны взаимодействовать с программируемой компьютерной системой для выполнения одного из описанных здесь способов.
Как правило, варианты осуществления настоящего изобретения могут быть реализованы как компьютерный программный продукт с программным кодом, причем программный код действует так, что обеспечивает выполнение одного из способов при выполнении этого компьютерного программного продукта на компьютере. Программный код может храниться, например, на машиночитаемом носителе.
Другие варианты осуществления изобретения содержат компьютерную программу для выполнения одного из описанных здесь способов, которая хранится на машиночитаемом носителе или на некратковременном запоминающем носителе.
Другими словами, следовательно, вариантом осуществления способа, предложенного в настоящем изобретении, является компьютерная программа, содержащая программный код для выполнения одного из описанных здесь способов при выполнении этой компьютерной программы на компьютере.
Следовательно, еще одним вариантом осуществления способов, предложенных в настоящем изобретении, является носитель данных (или цифровой запоминающий носитель, или компьютерно-читаемый носитель), содержащий записанную на нем компьютерную программу для выполнения одного из описанных здесь способов.
Следовательно, еще одним вариантом осуществления способа, предложенного в настоящем изобретении, является поток данных или последовательность сигналов, которые представляют собой компьютерную программу для выполнения одного из описанных здесь способов. Например, этот поток данных или эта последовательность сигналов могут быть сконфигурированы с возможностью их передачи через соединение для передачи данных, например, через сеть Интернет.
Еще один вариант осуществления изобретения содержит средство обработки, например, компьютер или программируемое логическое устройство, сконфигурированный или выполненный (сконфигурированное или выполненное) с возможностью выполнения одного из описанных здесь способов.
Еще один вариант осуществления изобретения содержит компьютер, имеющий установленную в нем компьютерную программу для выполнения одного из описанных здесь способов.
В некоторых вариантах осуществления изобретения для выполнения некоторых или всех функций описанных здесь способов может использоваться программируемое логическое устройство (например, программируемая пользователем вентильная матрица). В некоторых вариантах осуществления изобретения программируемая пользователем вентильная матрица может взаимодействовать с микропроцессором для выполнения одного из описанных здесь способов. Как правило, эти способы предпочтительно выполняются каким-либо аппаратным устройством.
Описанные выше варианты осуществления изобретения приведены просто для иллюстрации принципов из настоящего изобретения. Понятно, что для специалистов в данной области техники очевидны возможности модификаций и изменений описанных здесь компоновок и подробностей. Следовательно, подразумевают, что настоящее изобретение ограничено только лишь объемом приведенной ниже формулы изобретения, а не конкретными подробностями, представленными здесь посредством описания и объяснения вариантов осуществления изобретения.
Литература
[1] C. Faller, “Multiple-Loudspeaker Playback of Stereo Signals", Journal of the Audio Engineering Society, Vol. 54, No. 11, pp. 1051-1064. June 2006.
[2] V. Pulkki, “Spatial Sound Reproduction with Directional Audio Coding", Journal of the Audio Engineering Society. Vol. 55. No. 6. pp. 503-516, June 2007.
[3] C. Tournery, C. Faller, F. Küch, J. Herre, “Converting Stereo Microphone Signals Directly to MPEG Surround", 128th AES Convention, May 2010.
[4] J. Breebaart, S. van de Par, A. Kohlrausch and E. Schuijers, “Parametric Coding of Stereo Audio," EURASIP Journal on Applied Signal Processing, Vol. 2005, No. 9. pp. 1305-1322, 2005.
[5] J. Herre, K. Kjörling, J. Breebaart, C. Faller, S. Disch. H. Purnhagen. J. Koppens, J. Hilpert, J. Rödén, W. Oomen. K. Linzmeier and K. S. Chong, "MPEG Surround - The ISO/MPEG Standard for Efficient and Compatible Multichannel Audio Coding", Journal of the Audio Engineering Society, Vol. 56, No. 11, pp. 932-955, November 2008.
[6] J. Vilkamo, V. Pulkki, “Directional Audio Coding: Virtual Microphone-Based Synthesis and Subjective Evaluation", Journal of the Audio Engineering Society, Vol. 57, No. 9, pp. 709-724, September 2009.
[7] Golub, G.H. and Van Loan, C.F., “Matrix computations", Johns Hopkins Univ Press, 1996.
[8] R. Rebonato, P. Jäckel, “The most general methodology to create a valid correlation matrix for risk management and option pricing purposes", Journal of Risk, Vol. 2, No. 2, pp. 17-28, 2000.

Claims (62)

1. Устройство для генерации выходного звукового сигнала, имеющего два или более выходных звуковых каналов, из входного звукового сигнала, имеющего два или более входных звуковых каналов, содержащее:
блок (110) предоставления для предоставления первой ковариантности входного звукового сигнала, и
процессор (120) сигналов для генерации выходного звукового сигнала путем применения правила микширования по меньшей мере к двум из двух или более входных звуковых каналов,
при этом процессор (120) сигналов выполнен с возможностью определения правила микширования на основании первой ковариантности входного звукового сигнала и второй ковариантности выходного звукового сигнала, причем вторая ковариантность отличается от первой ковариантности.
2. Устройство по п. 1, в котором блок (110) предоставления выполнен с возможностью предоставления первой ковариантности, причем первая ковариантность имеет первое состояние для первого частотно-временного элемента и при этом первая ковариантность имеет второе состояние, являющееся иным, чем первое состояние, для второго частотно-временного элемента, являющегося иным, чем первый частотно-временной элемент.
3. Устройство по п. 1, в котором процессор (120) сигналов выполнен с возможностью определения правила микширования на основании второй ковариантности, причем вторая ковариантность имеет третье состояние для третьего частотно-временного элемента и при этом вторая ковариантность имеет четвертое состояние, являющееся иным, чем третье состояние, для четвертого частотно-временного элемента, являющегося отличным от третьего частотно-временного элемента.
4. Устройство по п. 1, в котором процессор (120) сигналов выполнен с возможностью генерации выходного звукового сигнала путем применения правила микширования так, что каждый из двух или более выходных звуковых каналов зависит от каждого из двух или более входных звуковых каналов.
5. Устройство по п. 1, в котором процессор (120) сигналов выполнен с возможностью определения правила микширования так, что мера погрешности является минимизированной.
6. Устройство по п. 5, в котором процессор (120) сигналов выполнен с возможностью определения правила микширования так, что это правило микширования зависит от
Figure 00000125
,
где
Figure 00000126
,
где
Figure 00000127
- входной звуковой сигнал,
Figure 00000128
- матрица отображения, а
Figure 00000129
- выходной звуковой сигнал.
7. Устройство по п. 1, в котором процессор (120) сигналов выполнен с возможностью определения правила микширования путем определения второй ковариантности, причем процессор (120) сигналов выполнен с возможностью определения второй ковариантности на основании первой ковариантности.
8. Устройство по п. 1, в котором процессор (120) сигналов выполнен с возможностью определения матрицы микширования в качестве правила микширования, причем процессор (120) сигналов выполнен с возможностью определения матрицы микширования на основании первой ковариантности и на основании второй ковариантности.
9. Устройство по п. 1, в котором блок (110) предоставления выполнен с возможностью предоставления первой ковариантности путем определения первой ковариационной матрицы входного звукового сигнала, причем процессор (120) сигналов выполнен с возможностью определения правила микширования на основании второй ковариационной матрицы выходного звукового сигнала в качестве второй ковариантности.
10. Устройство по п. 9, в котором блок (110) предоставления выполнен с возможностью определения первой ковариационной матрицы так, что каждое диагональное значение первой ковариационной матрицы указывает энергию одного из входных звуковых каналов, и так, что каждое значение первой ковариационной матрицы, не являющееся диагональным значением, указывает межканальную корреляцию между первым входным звуковым каналом и отличным от него вторым входным звуковым каналом.
11. Устройство по п. 9, в котором процессор (120) сигналов выполнен с возможностью определения правила микширования на основании второй ковариационной матрицы, причем каждое диагональное значение второй ковариационной матрицы указывает энергию одного из выходных звуковых каналов и причем каждое значение второй ковариационной матрицы, не являющееся диагональным значением, указывает межканальную корреляцию между первым выходным звуковым каналом и вторым выходным звуковым каналом.
12. Устройство по п. 1, в котором процессор (120) сигналов выполнен с возможностью определения матрицы микширования в качестве правила микширования, причем процессор (120) сигналов выполнен с возможностью определения матрицы микширования на основании первой ковариантности и на основании второй ковариантности, причем блок (110) предоставления выполнен с возможностью предоставления первой ковариантности путем определения первой ковариационной матрицы входного звукового сигнала и при этом процессор (120) сигналов выполнен с возможностью определения правила микширования на основании второй ковариационной матрицы выходного звукового сигнала в качестве второй ковариантности, причем процессор (120) сигналов выполнен с возможностью определения матрицы микширования так, что:
Figure 00000130
,
при этом
Figure 00000131
Figure 00000132
,
где
Figure 00000133
- матрица микширования,
Figure 00000134
- первая ковариационная матрица,
Figure 00000135
- вторая ковариационная матрица,
Figure 00000136
- первая транспонированная матрица первой разложенной матрицы
Figure 00000137
,
Figure 00000138
- вторая транспонированная матрица второй разложенной матрицы
Figure 00000139
,
Figure 00000140
- матрица, обратная первой разложенной матрице
Figure 00000137
, а
Figure 00000141
- первая унитарная матрица.
13. Устройство по п. 12, в котором процессор (120) сигналов выполнен с возможностью определения матрицы микширования так, что
Figure 00000142
,
где
P = VUT,
где
Figure 00000143
- третья транспонированная матрица второй унитарной матрицы
Figure 00000144
,
Figure 00000145
- третья унитарная матрица, при этом
Figure 00000146
,
где
Figure 00000147
- четвертая транспонированная матрица матрицы
Figure 00000148
отображения,
Figure 00000149
- пятая транспонированная матрица третьей унитарной матрицы
Figure 00000150
, а
Figure 00000151
- диагональная матрица.
14. Устройство по п. 1, в котором процессор (120) сигналов выполнен с возможностью определения матрицы микширования в качестве правила микширования, причем процессор (120) сигналов выполнен с возможностью определения матрицы микширования на основании первой ковариантности и на основании второй ковариантности,
при этом блок (110) предоставления выполнен с возможностью предоставления первой ковариантности путем определения первой ковариационной матрицы входного звукового сигнала, и
при этом процессор (120) сигналов выполнен с возможностью определения правила микширования на основании второй ковариационной матрицы выходного звукового сигнала в качестве второй ковариантности,
при этом процессор (120) сигналов выполнен с возможностью определения правила микширования путем модифицирования по меньшей мере некоторых диагональных значений диагональной матрицы
Figure 00000152
, когда значения диагональной матрицы
Figure 00000152
равны нулю или являются меньшими, чем пороговое значение, так, чтобы эти значения были большими или равными пороговому значению.
15. Устройство по п. 14, в котором процессор (120) сигналов выполнен с возможностью модифицирования по меньшей мере некоторых диагональных значений диагональной матрицы
Figure 00000152
, причем
Figure 00000153
и
Figure 00000154
, где
Figure 00000155
- первая ковариационная матрица,
Figure 00000152
- диагональная матрица,
Figure 00000156
- вторая матрица,
Figure 00000157
- третья транспонированная матрица и
Figure 00000158
- четвертая транспонированная матрица пятой матрицы
Figure 00000159
, а
Figure 00000160
и
Figure 00000161
- унитарные матрицы.
16. Устройство по п. 14, в котором процессор (120) сигналов выполнен с возможностью генерации выходного звукового сигнала путем применения матрицы микширования по меньшей мере к двум из двух или более входных звуковых каналов для получения промежуточного сигнала и путем добавления разностного сигнала
Figure 00000162
к промежуточному сигналу для получения выходного звукового сигнала.
17. Устройство по п. 14, в котором процессор (120) сигналов выполнен с возможностью определения матрицы микширования на основании диагональной матрицы
Figure 00000163
усиления и вспомогательной матрицы
Figure 00000164
так, что
Figure 00000165
, где диагональная матрица усиления имеет значение
Figure 00000166
,
где
Figure 00000167
,
где
Figure 00000168
- матрица микширования,
Figure 00000163
- диагональная матрица усиления,
Figure 00000169
- вторая ковариационная матрица, а
Figure 00000170
- пятая транспонированная матрица вспомогательной матрицы
Figure 00000164
.
18. Устройство по п. 1, в котором процессор (120) сигналов содержит:
модуль (420; 530; 630; 730; 830; 1030) составления матрицы микширования для генерации матрицы микширования в качестве правила микширования на основании первой ковариантности, и
модуль (430; 540; 640; 740; 840; 1040) применения матрицы микширования для применения матрицы микширования к входному звуковому сигналу для генерации выходного звукового сигнала.
19. Устройство по п. 18,
в котором блок (110) предоставления содержит модуль (410; 705; 805; 1005) анализа ковариационной матрицы для предоставления входной ковариантности входного звукового сигнала для получения результата анализа в качестве первой ковариантности, и
в котором модуль (420; 530; 630; 730; 830; 1030) составления матрицы микширования выполнен с возможностью генерации матрицы микширования на основании результата анализа.
20. Устройство по п. 18, в котором модуль (420; 530; 630; 730; 830; 1030) составления матрицы микширования выполнен с возможностью генерации матрицы микширования на основании критерия погрешности.
21. Устройство по п. 18,
в котором процессор (120) сигналов дополнительно содержит модуль (520; 620) определения пространственных данных для определения данных с информацией о конфигурации, содержащих данные об окружающем пространстве, данные о межканальной корреляции или данные об уровне звукового сигнала, и
в котором модуль (420; 530; 630; 730; 830; 1030) составления матрицы микширования выполнен с возможностью генерации матрицы микширования на основании данных с информацией о конфигурации.
22. Устройство по п. 18,
в котором процессор (120) сигналов дополнительно содержит модуль (720; 1018) составления целевой ковариационной матрицы для генерации целевой ковариационной матрицы на основании результата анализа, и
причем модуль (420; 530; 630; 730; 830; 1030) составления матрицы микширования выполнен с возможностью генерации матрицы микширования на основании целевой ковариационной матрицы.
23. Устройство по п. 22, в котором модуль (1018) составления целевой ковариационной матрицы выполнен с возможностью генерации целевой ковариационной матрицы на основании конфигурации громкоговорителей.
24. Устройство по п. 18, в котором процессор (120) сигналов дополнительно содержит модуль (815) улучшения для получения данных о межканальной корреляции на выходе на основании данных о межканальной корреляции на входе, и
в котором модуль (420; 530; 630; 730; 830; 1030) составления матрицы микширования выполнен с возможностью генерации матрицы микширования на основании данных о межканальной корреляции на выходе.
25. Способ генерации выходного звукового сигнала, имеющего два или более выходных звуковых каналов, из входного звукового сигнала, имеющего два или более входных звуковых каналов, содержащий этапы, на которых:
предоставляют первую ковариантность входного звукового сигнала, и
генерируют выходной звуковой сигнал путем применения правила микширования по меньшей мере к двум из двух или более входных звуковых каналов,
причем правило микширования определяют на основании первой ковариантности входного звукового сигнала и на основании второй ковариантности выходного звукового сигнала, которая является иной, чем первая ковариантность.
26. Компьютерно-читаемый носитель, содержащий компьютерную программу для реализации способа по п. 25 при ее исполнении в компьютере или процессоре.
RU2014110030A 2011-08-17 2012-08-14 Матрицы оптимального микширования и использование декорреляторов при обработке пространственного звука RU2631023C2 (ru)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201161524647P 2011-08-17 2011-08-17
US61/524,647 2011-08-17
EP12156351.4 2012-02-21
EP12156351A EP2560161A1 (en) 2011-08-17 2012-02-21 Optimal mixing matrices and usage of decorrelators in spatial audio processing
PCT/EP2012/065861 WO2013024085A1 (en) 2011-08-17 2012-08-14 Optimal mixing matrices and usage of decorrelators in spatial audio processing

Publications (2)

Publication Number Publication Date
RU2014110030A RU2014110030A (ru) 2015-09-27
RU2631023C2 true RU2631023C2 (ru) 2017-09-15

Family

ID=45656296

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2014110030A RU2631023C2 (ru) 2011-08-17 2012-08-14 Матрицы оптимального микширования и использование декорреляторов при обработке пространственного звука

Country Status (16)

Country Link
US (3) US10339908B2 (ru)
EP (2) EP2560161A1 (ru)
JP (1) JP5846460B2 (ru)
KR (1) KR101633441B1 (ru)
CN (1) CN103765507B (ru)
AR (1) AR087564A1 (ru)
AU (1) AU2012296895B2 (ru)
BR (1) BR112014003663B1 (ru)
CA (1) CA2843820C (ru)
ES (1) ES2499640T3 (ru)
HK (1) HK1187731A1 (ru)
MX (1) MX2014001731A (ru)
PL (1) PL2617031T3 (ru)
RU (1) RU2631023C2 (ru)
TW (1) TWI489447B (ru)
WO (1) WO2013024085A1 (ru)

Families Citing this family (48)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015509212A (ja) * 2012-01-19 2015-03-26 コーニンクレッカ フィリップス エヌ ヴェ 空間オーディオ・レンダリング及び符号化
WO2013120510A1 (en) * 2012-02-14 2013-08-22 Huawei Technologies Co., Ltd. A method and apparatus for performing an adaptive down- and up-mixing of a multi-channel audio signal
EP2688066A1 (en) * 2012-07-16 2014-01-22 Thomson Licensing Method and apparatus for encoding multi-channel HOA audio signals for noise reduction, and method and apparatus for decoding multi-channel HOA audio signals for noise reduction
US20140355769A1 (en) * 2013-05-29 2014-12-04 Qualcomm Incorporated Energy preservation for decomposed representations of a sound field
US9466305B2 (en) 2013-05-29 2016-10-11 Qualcomm Incorporated Performing positional analysis to code spherical harmonic coefficients
KR102161169B1 (ko) * 2013-07-05 2020-09-29 한국전자통신연구원 오디오 신호 처리 방법 및 장치
EP2830332A3 (en) 2013-07-22 2015-03-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method, signal processing unit, and computer program for mapping a plurality of input channels of an input channel configuration to output channels of an output channel configuration
EP2830047A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for low delay object metadata coding
EP2830048A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for realizing a SAOC downmix of 3D audio content
EP2830045A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Concept for audio encoding and decoding for audio channels and audio objects
EP2866227A1 (en) * 2013-10-22 2015-04-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method for decoding and encoding a downmix matrix, method for presenting audio content, encoder and decoder for a downmix matrix, audio encoder and audio decoder
US9489955B2 (en) 2014-01-30 2016-11-08 Qualcomm Incorporated Indicating frame parameter reusability for coding vectors
US9922656B2 (en) 2014-01-30 2018-03-20 Qualcomm Incorporated Transitioning of ambient higher-order ambisonic coefficients
US10770087B2 (en) 2014-05-16 2020-09-08 Qualcomm Incorporated Selecting codebooks for coding vectors decomposed from higher-order ambisonic audio signals
US9852737B2 (en) 2014-05-16 2017-12-26 Qualcomm Incorporated Coding vectors decomposed from higher-order ambisonics audio signals
US9620137B2 (en) 2014-05-16 2017-04-11 Qualcomm Incorporated Determining between scalar and vector quantization in higher order ambisonic coefficients
US9883308B2 (en) * 2014-07-01 2018-01-30 Electronics And Telecommunications Research Institute Multichannel audio signal processing method and device
US9747910B2 (en) 2014-09-26 2017-08-29 Qualcomm Incorporated Switching between predictive and non-predictive quantization techniques in a higher order ambisonics (HOA) framework
US9875756B2 (en) * 2014-12-16 2018-01-23 Psyx Research, Inc. System and method for artifact masking
US9712936B2 (en) 2015-02-03 2017-07-18 Qualcomm Incorporated Coding higher-order ambisonic audio data with motion stabilization
JP6576458B2 (ja) 2015-03-03 2019-09-18 ドルビー ラボラトリーズ ライセンシング コーポレイション 変調された脱相関による空間的オーディオ信号の向上
DK3065422T3 (da) * 2015-03-04 2019-05-20 Starkey Labs Inc Teknikker til forbedring af behandlingskapacitet i høreapparater
EP3357259B1 (en) 2015-09-30 2020-09-23 Dolby International AB Method and apparatus for generating 3d audio content from two-channel stereo content
EP3406084B1 (en) 2016-01-18 2020-08-26 Boomcloud 360, Inc. Subband spatial and crosstalk cancellation for audio reproduction
US10225657B2 (en) 2016-01-18 2019-03-05 Boomcloud 360, Inc. Subband spatial and crosstalk cancellation for audio reproduction
JP6546351B2 (ja) 2016-01-19 2019-07-17 ブームクラウド 360 インコーポレイテッド ヘッドマウントスピーカのためのオーディオエンハンスメント
US11234072B2 (en) 2016-02-18 2022-01-25 Dolby Laboratories Licensing Corporation Processing of microphone signals for spatial playback
WO2017143003A1 (en) * 2016-02-18 2017-08-24 Dolby Laboratories Licensing Corporation Processing of microphone signals for spatial playback
US10923132B2 (en) 2016-02-19 2021-02-16 Dolby Laboratories Licensing Corporation Diffusivity based sound processing method and apparatus
US10979844B2 (en) * 2017-03-08 2021-04-13 Dts, Inc. Distributed audio virtualization systems
US9820073B1 (en) 2017-05-10 2017-11-14 Tls Corp. Extracting a common signal from multiple audio signals
US10313820B2 (en) 2017-07-11 2019-06-04 Boomcloud 360, Inc. Sub-band spatial audio enhancement
GB201718341D0 (en) * 2017-11-06 2017-12-20 Nokia Technologies Oy Determination of targeted spatial audio parameters and associated spatial audio playback
US10764704B2 (en) 2018-03-22 2020-09-01 Boomcloud 360, Inc. Multi-channel subband spatial processing for loudspeakers
GB2572420A (en) * 2018-03-29 2019-10-02 Nokia Technologies Oy Spatial sound rendering
GB2572650A (en) 2018-04-06 2019-10-09 Nokia Technologies Oy Spatial audio parameters and associated spatial audio playback
GB2574239A (en) 2018-05-31 2019-12-04 Nokia Technologies Oy Signalling of spatial audio parameters
CN110782911A (zh) * 2018-07-30 2020-02-11 阿里巴巴集团控股有限公司 音频信号处理方法、装置、设备和存储介质
GB2582749A (en) * 2019-03-28 2020-10-07 Nokia Technologies Oy Determination of the significance of spatial audio parameters and associated encoding
BR112021025265A2 (pt) * 2019-06-14 2022-03-15 Fraunhofer Ges Forschung Sintetizador de áudio, codificador de áudio, sistema, método e unidade de armazenamento não transitória
AU2020319893A1 (en) * 2019-08-01 2022-02-10 Dolby Laboratories Licensing Corporation Systems and methods for covariance smoothing
GB2587357A (en) * 2019-09-24 2021-03-31 Nokia Technologies Oy Audio processing
US10841728B1 (en) 2019-10-10 2020-11-17 Boomcloud 360, Inc. Multi-channel crosstalk processing
CN112653985B (zh) 2019-10-10 2022-09-27 高迪奥实验室公司 使用2声道立体声扬声器处理音频信号的方法和设备
GB2589321A (en) 2019-11-25 2021-06-02 Nokia Technologies Oy Converting binaural signals to stereo audio signals
GB2594265A (en) * 2020-04-20 2021-10-27 Nokia Technologies Oy Apparatus, methods and computer programs for enabling rendering of spatial audio signals
US11373662B2 (en) * 2020-11-03 2022-06-28 Bose Corporation Audio system height channel up-mixing
WO2023147864A1 (en) * 2022-02-03 2023-08-10 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method to transform an audio stream

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060165237A1 (en) * 2004-11-02 2006-07-27 Lars Villemoes Methods for improved performance of prediction based multi-channel reconstruction
US20080205657A1 (en) * 2006-12-07 2008-08-28 Lg Electronics, Inc. Method and an Apparatus for Decoding an Audio Signal
US20100254539A1 (en) * 2009-04-07 2010-10-07 Samsung Electronics Co., Ltd. Apparatus and method for extracting target sound from mixed source sound
RU2407073C2 (ru) * 2005-03-30 2010-12-20 Конинклейке Филипс Электроникс Н.В. Кодирование многоканального аудио
US20110137662A1 (en) * 2008-08-14 2011-06-09 Dolby Laboratories Licensing Corporation Audio Signal Transformatting

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4298466B2 (ja) * 2003-10-30 2009-07-22 日本電信電話株式会社 収音方法、装置、プログラム、および記録媒体
US8126152B2 (en) * 2006-03-28 2012-02-28 Telefonaktiebolaget L M Ericsson (Publ) Method and arrangement for a decoder for multi-channel surround sound
AU2008215232B2 (en) 2007-02-14 2010-02-25 Lg Electronics Inc. Methods and apparatuses for encoding and decoding object-based audio signals
CN101542596B (zh) * 2007-02-14 2016-05-18 Lg电子株式会社 用于编码和解码基于对象的音频信号的方法和装置
RU2439719C2 (ru) 2007-04-26 2012-01-10 Долби Свиден АБ Устройство и способ для синтезирования выходного сигнала
EP2082396A1 (en) 2007-10-17 2009-07-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio coding using downmix
EP2146522A1 (en) * 2008-07-17 2010-01-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating audio output signals using object based metadata
EP3093843B1 (en) 2009-09-29 2020-12-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Mpeg-saoc audio signal decoder, mpeg-saoc audio signal encoder, method for providing an upmix signal representation using mpeg-saoc decoding, method for providing a downmix signal representation using mpeg-saoc decoding, and computer program using a time/frequency-dependent common inter-object-correlation parameter value
TWI396186B (zh) * 2009-11-12 2013-05-11 Nat Cheng Kong University 基於盲訊號分離語音增強技術之遠距離雜訊語音辨識
US9344813B2 (en) * 2010-05-04 2016-05-17 Sonova Ag Methods for operating a hearing device as well as hearing devices

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060165237A1 (en) * 2004-11-02 2006-07-27 Lars Villemoes Methods for improved performance of prediction based multi-channel reconstruction
RU2407073C2 (ru) * 2005-03-30 2010-12-20 Конинклейке Филипс Электроникс Н.В. Кодирование многоканального аудио
US20080205657A1 (en) * 2006-12-07 2008-08-28 Lg Electronics, Inc. Method and an Apparatus for Decoding an Audio Signal
US20110137662A1 (en) * 2008-08-14 2011-06-09 Dolby Laboratories Licensing Corporation Audio Signal Transformatting
US20100254539A1 (en) * 2009-04-07 2010-10-07 Samsung Electronics Co., Ltd. Apparatus and method for extracting target sound from mixed source sound

Also Published As

Publication number Publication date
BR112014003663B1 (pt) 2021-12-21
JP5846460B2 (ja) 2016-01-20
US20140233762A1 (en) 2014-08-21
JP2014526065A (ja) 2014-10-02
CN103765507B (zh) 2016-01-20
TWI489447B (zh) 2015-06-21
PL2617031T3 (pl) 2015-01-30
US10339908B2 (en) 2019-07-02
RU2014110030A (ru) 2015-09-27
CA2843820A1 (en) 2013-02-21
WO2013024085A1 (en) 2013-02-21
MX2014001731A (es) 2014-03-27
AR087564A1 (es) 2014-04-03
US10748516B2 (en) 2020-08-18
HK1187731A1 (en) 2014-04-11
KR101633441B1 (ko) 2016-07-08
KR20140047731A (ko) 2014-04-22
ES2499640T3 (es) 2014-09-29
CA2843820C (en) 2016-09-27
AU2012296895A1 (en) 2014-02-27
US11282485B2 (en) 2022-03-22
EP2617031A1 (en) 2013-07-24
EP2617031B1 (en) 2014-07-23
EP2560161A1 (en) 2013-02-20
BR112014003663A2 (pt) 2020-10-27
CN103765507A (zh) 2014-04-30
AU2012296895B2 (en) 2015-07-16
US20190251938A1 (en) 2019-08-15
TW201320059A (zh) 2013-05-16
US20200372884A1 (en) 2020-11-26

Similar Documents

Publication Publication Date Title
RU2631023C2 (ru) Матрицы оптимального микширования и использование декорреляторов при обработке пространственного звука
JP5624967B2 (ja) マルチチャネルシンセサイザ制御信号を発生するための装置および方法並びにマルチチャネル合成のための装置および方法
US8346565B2 (en) Apparatus and method for generating an ambient signal from an audio signal, apparatus and method for deriving a multi-channel audio signal from an audio signal and computer program
US9502040B2 (en) Encoding and decoding of slot positions of events in an audio signal frame
EP3933834A1 (en) Enhanced soundfield coding using parametric component generation
US20080232617A1 (en) Multichannel surround format conversion and generalized upmix
HUE032018T2 (en) Improving audio signal using estimated spatial parameters
US20150334500A1 (en) Producing a multichannel sound from stereo audio signals
CN105284133A (zh) 基于信号下混比进行中心信号缩放和立体声增强的设备和方法

Legal Events

Date Code Title Description
FA92 Acknowledgement of application withdrawn (lack of supplementary materials submitted)

Effective date: 20160901

FZ9A Application not withdrawn (correction of the notice of withdrawal)

Effective date: 20161102