UA120372C2 - Decoding method and decoder for dialog enhancement - Google Patents

Decoding method and decoder for dialog enhancement Download PDF

Info

Publication number
UA120372C2
UA120372C2 UAA201703054A UAA201703054A UA120372C2 UA 120372 C2 UA120372 C2 UA 120372C2 UA A201703054 A UAA201703054 A UA A201703054A UA A201703054 A UAA201703054 A UA A201703054A UA 120372 C2 UA120372 C2 UA 120372C2
Authority
UA
Ukraine
Prior art keywords
parameters
dialogue
subset
mixing
dialog
Prior art date
Application number
UAA201703054A
Other languages
Ukrainian (uk)
Inventor
Йерун КОППЕНС
Пер Екстранд
Пэр Экстранд
Original Assignee
Долбі Інтернешнл Аб
Долби Интернешнл Аб
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Долбі Інтернешнл Аб, Долби Интернешнл Аб filed Critical Долбі Інтернешнл Аб
Publication of UA120372C2 publication Critical patent/UA120372C2/en

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0364Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/01Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/03Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Mathematical Physics (AREA)
  • Stereophonic System (AREA)
  • Telephonic Communication Services (AREA)

Abstract

There is provided a method for enhancing dialog in a decoder of an audio system. The method comprises receiving a plurality of downmix signals being a downmix of a larger plurality of channels; receiving parameters for dialog enhancement being defined with respect to a subset of the plurality of channels that is downmixed into a subset of the plurality of downmix signals; upmixing the subset of downmix signals parametrically in order to reconstruct the subset of the plurality of channels with respect to which the parameters for dialog enhancement are defined; applying dialog enhancement to the subset of the plurality of channels with respect to which the parameters for dialog enhancement are defined using the parameters for dialog enhancement to provide at least one dialog enhanced signal; and subjecting the at least one dialog enhanced signal to mixing to provide dialog enhanced versions of the subset of downmix signals.

Description

Галузь технікиThe field of technology

Винахід, який розкривається в даному документі, в цілому стосується кодування звуку.The invention disclosed herein relates generally to audio coding.

Зокрема він стосується способів і пристроїв для виконання посилювання діалогу в аудіосистемах на основі каналів.In particular, it relates to methods and devices for performing dialogue amplification in channel-based audio systems.

Передумови винаходуPrerequisites of the invention

Посилення діалогу полягає в виконанні посилювання діалогу стосовно іншого звукового вмісту. Воно може бути використане, наприклад, для надання можливості особам з порушенням слуху слідкувати за діалогом в кінострічці. Для звукового вмісту на основі каналів діалог, як правило, присутній в декількох каналах, а також є мікшованим з іншим звуковим вмістом. Тому посилення діалогу являє собою нетривіальну задачу.Dialogue amplification consists in performing dialogue amplification in relation to other audio content. It can be used, for example, to enable hearing-impaired people to follow dialogue in a film. For channel-based audio content, dialogue is typically present in multiple channels and mixed with other audio content. Therefore, strengthening the dialogue is a non-trivial task.

Відомі декілька способів виконання посилення діалогу в декодері. Згідно з деякими з цих способів спочатку декодують повний вміст каналів, тобто повну конфігурацію каналів, а потім використовують отримані параметри посилення діалогу для передбачення діалогу на основі цього повного вмісту каналів. Передбачений діалог потім використовують для посилення діалогу у відповідних каналах. Проте такі способи декодування покладаються на декодер, здатний декодувати повну конфігурацію каналів.There are several ways to perform dialogue enhancement in the decoder. Some of these methods first decode the full channel content, i.e. the full channel configuration, and then use the resulting dialogue gain parameters to predict dialogue based on this full channel content. The predicted dialogue is then used to amplify the dialogue in the appropriate channels. However, such decoding methods rely on a decoder capable of decoding the full channel configuration.

Втім декодери з низькою складністю, як правило, не розраховані на декодування повної конфігурації каналів. Замість цього декодер з низькою складністю може декодувати і виводити меншу кількість каналів, які представляють піддану знижувальному мікшуванню версію повної конфігурації каналів. Відповідно, в декодері з низькою складністю повна конфігурація каналів є недоступною. Оскільки параметри посилення діалогу визначені стосовно каналів повної конфігурації каналів (чи принаймні стосовно деяких з каналів повної конфігурації каналів), відомі способи посилення діалогу не можуть бути прямо застосовані декодером з низькою складністю.However, decoders with low complexity, as a rule, are not designed to decode the full configuration of channels. Instead, a low-complexity decoder can decode and output a smaller number of channels that represent a down-mixed version of the full channel configuration. Accordingly, in a low-complexity decoder, the full channel configuration is not available. Since the dialogue enhancement parameters are defined with respect to the channels of the full channel configuration (or at least with respect to some of the channels of the full channel configuration), the known dialogue enhancement methods cannot be directly applied by a low-complexity decoder.

Зокрема, це пояснюється тим, що канали, стосовно яких застосовні параметри посилення діалогу, можуть все ж бути мікшованими з іншими каналами.In particular, this is due to the fact that the channels to which the dialogue enhancement parameters are applicable can still be mixed with other channels.

Таким чином існує простір для удосконалень, які дозволяють використовувати декодер з низькою складністю для посилення діалогу без необхідності декодування повної конфігурації каналів.Thus, there is room for improvements that allow a low-complexity decoder to be used to enhance dialogue without having to decode the full channel configuration.

Стислий опис графічних матеріалівBrief description of graphic materials

Надалі наведені для прикладу варіанти здійснення будуть описані більш докладно з посиланням на супровідні графічні матеріали, на яких: фіг. Та -- схематична ілюстрація конфігурації каналів 7.144, підданої знижувальному мікшуванню в конфігурацію знижувального мікшування 5.1 згідно з першою схемою знижувального мікшування; фіг. 10 -- схематична ілюстрація конфігурації каналів 7.144, підданої знижувальному мікшуванню в конфігурацію знижувального мікшування 5.1 згідно з другою схемою знижувального мікшування; фіг 2 - схематична ілюстрація декодера на відомому рівні техніки для виконання посилення діалогу на повністю декодованій конфігурації каналів; фіг. 3 -- схематична ілюстрація посилення діалогу згідно з першим способом; фіг. 4 -- схематична ілюстрація посилення діалогу згідно з другим способом; фіг. 5-- схематична ілюстрація декодера згідно з наведеними для прикладу варіантами здійснення; фіг. 6-- схематична ілюстрація декодера згідно з наведеними для прикладу варіантами здійснення; фіг. 7 - схематична ілюстрація декодера згідно з наведеними для прикладу варіантами здійснення; фіг. 8 -- схематична ілюстрація кодера, який відповідає будь-якому з декодерів, представлених на фіг. 2, фіг. 5, фіг. 6 і фіг. 7;In the following, the exemplary embodiments will be described in more detail with reference to the accompanying graphic materials, in which: fig. 1 is a schematic illustration of a channel configuration 7.144 downmixed into a downmix configuration 5.1 according to a first downmix scheme; fig. 10 is a schematic illustration of channel configuration 7.144 downmixed into downmix configuration 5.1 according to the second downmix scheme; Fig. 2 is a schematic illustration of a prior art decoder for performing dialogue amplification on a fully decoded channel configuration; fig. 3 -- a schematic illustration of dialogue enhancement according to the first method; fig. 4 -- a schematic illustration of dialogue enhancement according to the second method; fig. 5-- a schematic illustration of the decoder according to the examples given for implementation; fig. 6-- a schematic illustration of the decoder according to the examples given for implementation; fig. 7 - a schematic illustration of the decoder according to the examples given for implementation; fig. 8 is a schematic illustration of an encoder corresponding to any of the decoders shown in FIG. 2, fig. 5, fig. 6 and fig. 7;

БО фіг. 9 -- схеми способів обчислення операції ВА об'єднаної обробки даних, яка складається з двох підоперацій А та В, на основі параметрів, які управляють кожною з цих підоперацій.BO fig. 9 -- diagrams of methods for calculating operation BA of combined data processing, which consists of two sub-operations A and B, based on the parameters that control each of these sub-operations.

Усі фігури є схематичними і в цілому наводять лише елементи, які є необхідними для ілюстрації даного винаходу, тоді як іншими елементами можна знехтувати чи лише запропонувати.All figures are schematic and generally show only those elements that are necessary to illustrate the present invention, while other elements may be omitted or merely suggested.

Докладний опис винаходуDetailed description of the invention

Зважаючи на наведене вище метою даного винаходу є надання декодера та пов'язаних способів, які дозволяють використовувати посилення діалогу без необхідності декодування повної конфігурації каналів.In view of the above, it is an object of the present invention to provide a decoder and related methods that allow the use of dialogue enhancement without the need to decode a complete channel configuration.

І. ОглядI. Review

Згідно з першою особливістю наведені для прикладу варіанти здійснення передбачають спосіб посилення діалогу в декодері аудіосистеми. Вказаний спосіб включає етапи: приймання ряду сигналів знижувального мікшування, які представляють собою результат знижувального мікшування більшої кількості каналів; приймання параметрів для посилення діалогу, причому ці параметри визначені стосовно підмножини ряду каналів, яка включає канали, які містять діалог, причому цю підмножину ряду каналів піддано знижувальному мікшуванню в підмножину ряду сигналів знижувального мікшування; приймання параметрів відновлення, які надають можливість параметричного відновлення каналів, підданих знижувальному мікшуванню в підмножину ряду сигналів знижувального мікшування; параметричного підвищувального мікшування підмножини ряду сигналів знижувального мікшування на основі параметрів відновлення з метою відновлення підмножини ряду каналів, стосовно якої визначені параметри для посилення діалогу; застосування посилення діалогу до підмножини ряду каналів, стосовно якої визначені параметри для посилення діалогу, з використанням параметрів для посилення діалогу з метою надання щонайменше одного сигналу з посиленим діалогом; і піддавання мікшуванню щонайменше одного сигналу з посиленим діалогом з метою надання версій з посиленим діалогом підмножини ряду сигналів знижувального мікшування.According to the first feature, the examples of implementation provide a way to enhance the dialogue in the decoder of the audio system. This method includes the following steps: receiving a number of down-mixing signals, which are the result of down-mixing a larger number of channels; receiving parameters to enhance dialogue, and these parameters are defined with respect to a subset of the channel array that includes channels that contain dialogue, and this subset of the channel array is downmixed into a subset of the downmix signal array; adoption of recovery parameters, which provide the possibility of parametric recovery of downmixed channels into a subset of downmixed signals; parametric up-mixing of a subset of a number of signals; applying dialog enhancement to a subset of the channel array for which the dialog enhancement parameters are defined, using the dialog enhancement parameters to provide at least one dialog enhanced signal; and downmixing the at least one dialogue-enhanced signal to provide dialogue-enhanced versions of a subset of the plurality of downmixed signals.

При такій схемі декодеру не доводиться відновлювати повну конфігурацію каналів для виконання посилення діалогу, завдяки чому зменшується складність. Замість цього декодер відновлює ті канали, які потрібні для застосування посилення діалогу. Це включає, зокрема, підмножину ряду каналів, стосовно якої визначені прийняті параметри для посилення діалогу.With such a scheme, the decoder does not have to restore the full channel configuration to perform dialogue amplification, which reduces complexity. Instead, the decoder restores those channels that are needed to apply dialogue enhancement. This includes, in particular, a subset of a number of channels, in relation to which the accepted parameters for enhancing the dialogue are defined.

Після виконання посилення діалогу, тобто коли щонайменше один сигнал з посиленим діалогом був визначений на основі параметрів для посилення діалогу і підмножини ряду каналів, стосовно якої визначені ці параметри, версії з посиленим діалогом прийнятих сигналів знижувального мікшування визначають шляхом піддання сигналу (сигналів) з посиленим діалогом процедурі мікшування. В результаті отримують версії з посиленим діалогом сигналів знижувального мікшування для наступного відтворювання аудіосистемою.After dialog enhancement is performed, that is, when at least one dialog-enhanced signal has been determined based on the dialog-enhanced parameters and the subset of the channel array for which those parameters are defined, the dialog-enhanced versions of the received downmix signals are determined by subjecting the dialog-enhanced signal(s) to mixing procedure. As a result, dialogue-enhanced versions of the downmix signals are obtained for subsequent reproduction by the audio system.

Зо В наведених для прикладу варіантах здійснення операція підвищувального мікшування може бути повною (такою, що відновлює всю множину закодованих каналів) або частковою (такою, що відновлює підмножину каналів).In the exemplary embodiments, the upmixing operation may be full (one that restores the entire set of encoded channels) or partial (one that restores a subset of the channels).

В межах цього документа сигнал знижувального мікшування стосується сигналу, який являє собою комбінацію одного чи більше сигналів/каналів.For the purposes of this document, a downmix signal refers to a signal that is a combination of one or more signals/channels.

В межах цього документа параметричне підвищувальне мікшування стосується відновлення одного чи більше сигналів/каналів із сигналу знижувального мікшування з використанням параметричних методик. Варто підкреслити, що наведені для прикладу варіанти здійснення, розкриті в даному документі, не обмежені вмістом на основі каналів (в розумінні звукових сигналів, пов'язаних з незмінними чи наперед визначеними напрямками, кутами і/або положеннями в просторі), а також поширюються на вміст на основі об'єктів.For the purposes of this document, parametric upmixing refers to the recovery of one or more signals/channels from a downmixed signal using parametric techniques. It should be emphasized that the exemplary embodiments disclosed herein are not limited to channel-based content (in the sense of audio signals associated with fixed or predetermined directions, angles, and/or positions in space), but also extend to object-based content.

Згідно з наведеними для прикладу варіантами здійснення на етапі параметричного підвищувального мікшування підмножини ряду сигналів знижувального мікшування декорельовані сигнали не використовують з метою відновлення підмножини ряду каналів, стосовно якої визначені параметри для посилення діалогу.According to the options given for example, at the stage of parametric up-mixing of a subset of down-mixing signals, the decorrelated signals are not used for the purpose of restoring the subset of the channel series, for which the parameters for dialogue amplification are defined.

Перевага цього полягає в тому, що зменшується складність обчислень, і одночасно збільшується якість отримуваних в результаті версій з посиленим діалогом сигналів знижувального мікшування (тобто якість на виході). Більш докладно, переваги, отримувані шляхом використання декорельованих сигналів при підвищувальному мікшуванні, зменшуються при наступному мікшуванні, якому піддають сигнал з посиленим діалогом. Через це використання декорельованих сигналів переважно можна оминати, тим самим зменшуючи складність обчислень. Фактично використання при підвищувальному мікшуванні декорельованих сигналів в сполученні з посиленням діалогу могло б в результаті призводити до гіршої якості, оскільки це могло спричинити реверберацію декорелятора на посиленому діалозі.The advantage of this is that the computational complexity is reduced, while simultaneously increasing the quality of the resulting dialogue-enhanced versions of the downmix signals (ie, output quality). In more detail, the benefits obtained by using decorrelated signals in upmixing are reduced in the next downmix to which the signal is subjected to enhanced dialogue. Because of this, the use of decorrelated signals can be mostly avoided, thereby reducing the complexity of the calculations. In fact, using decorrelated signals in upmixing in conjunction with dialogue amplification could result in poorer quality as it could cause the decorrelator to reverberate on the amplified dialogue.

Згідно з наведеними для прикладу варіантами здійснення мікшування виконують згідно з параметрами мікшування, які описують внесок щонайменше одного сигналу з посиленим діалогом в версії з посиленим діалогом підмножини ряду сигналів знижувального мікшування.According to the exemplary embodiments, the mixing is performed according to the mixing parameters that describe the contribution of at least one dialogue-enhanced signal to the dialogue-enhanced version of a subset of a number of downmix signals.

Відтак можуть існувати певні параметри мікшування, які описують те, яким чином слід мікшувати щонайменше один сигнал з посиленим діалогом з метою надання версій з посиленим діалогом підмножини ряду сигналів знижувального мікшування. Наприклад, параметри бо мікшування можуть мати форму вагових коефіцієнтів, які описують те, наскільки щонайменше один сигнал з посиленим діалогом слід мікшувати в кожен з сигналів знижувального мікшування в підмножині ряду сигналів знижувального мікшування для отримання версій з посиленим діалогом підмножини ряду сигналів знижувального мікшування. Такі вагові коефіцієнти можуть, наприклад, мати форму параметрів представлення, які слугують ознакою просторових положень, пов'язаних з щонайменше одним сигналом з посиленим діалогом відносно просторових положень, пов'язаних з рядом каналів і, таким чином, з відповідною підмножиною сигналів знижувального мікшування. Згідно з іншими прикладами параметри мікшування можуть вказувати, має чи не має щонайменше один сигнал з посиленим діалогом вносити вклад, наприклад, входити до складу, до однієї конкретної версії з посиленим діалогом підмножини сигналів знижувального мікшування. Наприклад, "1" може вказувати, що сигнал з посиленим діалогом слід включати при формуванні однієї конкретної з версій з посиленим діалогом сигналів знижувального мікшування, а "0" може вказувати на те, що його включати не слід.Thus, there may be certain mixing parameters that describe how at least one up-mixed signal should be mixed in order to provide up-dialog versions of a subset of a number of downmixed signals. For example, the downmix parameters may be in the form of weights that describe how much at least one upmixed signal should be downmixed into each of the downmixed signals in a subset of the downmixed signals to produce the downmixed versions of the subset of downmixed signals. Such weights may, for example, take the form of representation parameters that are indicative of the spatial positions associated with at least one cross-talk signal relative to the spatial positions associated with a number of channels and thus with a corresponding subset of the downmix signals. According to other examples, the mixing parameters may specify whether or not at least one up-dialog signal should contribute to, eg, be part of, one particular up-dialog version of a subset of the downmix signals. For example, "1" may indicate that the dialogue-enhanced signal should be included when forming one particular dialogue-enhanced version of the downmix signals, and "0" may indicate that it should not be included.

На етапі піддавання мікшуванню щонайменше одного сигналу з посиленим діалогом з метою надання версій з посиленим діалогом підмножини ряду сигналів знижувального мікшування сигнали з посиленим діалогом можуть бути мікшовані з іншими сигналами/каналами.In the step of downmixing at least one enhanced dialog signal to provide enhanced dialog versions of a subset of the downmix signals, the enhanced dialog signals may be mixed with other signals/channels.

Згідно з наведеними для прикладу варіантами здійснення щонайменше один сигнал з посиленим діалогом мікшують з каналами, які відновлюють на етапі підвищувального мікшування, проте які не було піддані посиленню діалогу. Більш докладно, етап параметричного підвищувального мікшування підмножини ряду сигналів знижувального мікшування може включати відновлення щонайменше одного додаткового каналу окрім ряду каналів, стосовно яких визначені параметри для посилення діалогу, і при цьому мікшування включає мікшування щонайменше одного додаткового каналу разом з щонайменше одним сигналом з посиленим діалогом. Наприклад, можуть бути відновлені і включені до мікшування всі канали, піддані знижувальному мікшуванню в підмножину ряду сигналів знижувального мікшування. В таких варіантах здійснення, як правило, має місце пряма відповідність між кожним сигналом з посиленим діалогом і певним каналом.According to the exemplary embodiments, at least one dialogue-enhanced signal is mixed with channels that are recovered in the up-mixing step, but which have not been dialogue-enhanced. In more detail, the step of parametrically up-mixing a subset of the down-mixing signals may include restoring at least one additional channel in addition to the number of channels for which dialog enhancement parameters are defined, wherein the mixing includes mixing the at least one additional channel together with the at least one enhanced dialog signal. For example, all downmixed channels in a subset of the downmix signal can be restored and mixed. In such embodiments, there is typically a direct correspondence between each enhanced dialogue signal and a specific channel.

Згідно з іншими наведеними для прикладу варіантами здійснення щонайменше один сигнал з посиленим діалогом мікшують з підмножиною ряду сигналів знижувального мікшування. БільшAccording to other exemplary embodiments, at least one signal with enhanced dialogue is mixed with a subset of a number of downmixed signals. More

Зо докладно, етап параметричного підвищувального мікшування підмножини ряду сигналів знижувального мікшування може включати відновлення тільки підмножини ряду каналів, стосовно якої визначені параметри для посилення діалогу, і етап застосування посилення діалогу може включати здійснення передбачення і посилення діалогової складової з підмножини ряду каналів, стосовно якої визначені параметри для посилення діалогу, з використанням параметрів для посилення діалогу, щоб надавати щонайменше один сигнал з посиленим діалогом, і мікшування може включати мікшування щонайменше одного сигналу з посиленим діалогом з підмножиною ряду сигналів знижувального мікшування. Таким чином такі варіанти здійснення слугують для передбачення і посилення діалогового вмісту і його мікшування в підмножину ряду сигналів знижувального мікшування.In more detail, the step of parametrically upmixing a subset of the downmix signals may include recovering only the subset of the channel array for which the dialog enhancement parameters are defined, and the step of applying dialog enhancement may include predicting and amplifying the dialog component from the subset of the channel array for which the parameters are defined for enhancing dialogue, using parameters for enhancing dialogue to provide at least one enhanced dialogue signal, and mixing may include mixing at least one enhanced dialogue signal with a subset of the downmix signals. Thus, such implementations serve to predict and amplify dialogue content and mix it into a subset of downmix signals.

В цілому варто відзначити, що канал може містити діалоговий вміст, мікшований з вмістом, який не стосується діалогу. Окрім того, діалоговий вміст, який відповідає одному діалогу, може бути мікшований в декілька каналів. Під здійсненням передбачення діалогової складової з підмножини ряду каналів, стосовно якої визначені параметри для посилення діалогу, зазвичай розуміють те, що діалоговий вміст здобувають, тобто виділяють, з каналів і комбінують з метою відновлення діалогу.In general, it is worth noting that a channel can contain dialog content mixed with non-dialog content. In addition, dialog content that corresponds to one dialog can be mixed into multiple channels. The prediction of a dialogue component from a subset of a number of channels, in relation to which the parameters for strengthening the dialogue are defined, is usually understood as the fact that the dialogue content is obtained, that is, extracted, from the channels and combined in order to restore the dialogue.

Якість посилення діалогу можна додатково підвищити шляхом приймання і використання звукового сигналу, який представляє діалог. Наприклад, звуковий сигнал, який представляє діалог, може бути закодований з низькою бітовою швидкістю, що призводить до появи добре чутних артефактів при його окремому прослуховуванні. Втім при використанні разом з параметричним посиленням діалогу, тобто при використанні параметрів для посилення діалогу на етапі застосування посилення діалогу до підмножини ряду каналів, стосовно якої визначені параметри для посилення діалогу, отримуване в результаті посилення діалогу можна покращити, наприклад, в плані якості звуку. Більш докладно, спосіб може додатково включати приймання звукового сигналу, який представляє діалог, при цьому етап застосування посилення діалогу включає застосування посилення діалогу до підмножини ряду каналів, стосовно якої визначені параметри для посилення діалогу, з додатковим використанням звукового сигналу, який представляє діалог.The quality of dialogue amplification can be further enhanced by accepting and using the audio signal that represents the dialogue. For example, an audio signal representing dialogue may be encoded at a low bit rate, resulting in audible artifacts when listening to it separately. However, when used together with parametric dialogue enhancement, i.e. when using dialogue enhancement parameters at the stage of applying dialogue enhancement to a subset of a number of channels for which dialogue enhancement parameters are defined, the resulting dialogue enhancement can be improved, for example, in terms of sound quality. In more detail, the method may further include receiving an audio signal representing the dialogue, wherein the step of applying the dialogue enhancement includes applying the dialogue enhancement to a subset of the number of channels for which the dialogue enhancement parameters are defined, with additional use of the audio signal representing the dialogue.

В деяких варіантах здійснення параметри мікшування можуть бути вже доступними в декодері, наприклад, вони можуть бути жорстко запрограмовані. Зокрема, це може мати місце 60 тоді, коли щонайменше один сигнал з посиленим діалогом завжди мікшують однаковим чином,In some embodiments, the mixing parameters may already be available in the decoder, for example, they may be hard-coded. In particular, this may be the case 60 when at least one enhanced dialogue signal is always mixed in the same way,

наприклад, якщо його завжди мікшують з одними й тими самими відновленими каналами. В інших варіантах здійснення спосіб включає приймання параметрів мікшування для етапу піддавання мікшуванню щонайменше одного сигналу з посиленим діалогом. Наприклад, параметри мікшування можуть утворювати частину параметрів посилення діалогу.for example, if it is always mixed with the same restored channels. In other embodiments, the method includes receiving mixing parameters for the step of mixing at least one signal with enhanced dialogue. For example, mixing parameters can form part of dialog gain parameters.

Згідно з наведеними для прикладу варіантами здійснення спосіб включає приймання параметрів мікшування, які описують схему знижувального мікшування, яка описує, в який сигнал знижувального мікшування мікшований кожен з ряду каналів. Наприклад, якщо кожен сигнал з посиленим діалогом відповідає каналу, який, в свою чергу, є мікшованим з іншими відновленими каналами, то мікшування здійснюють у відповідності до схеми знижувального мікшування так, що кожен канал мікшують в правильний сигнал знижувального мікшування.According to the exemplary embodiments, the method includes receiving mixing parameters that describe a down-mixing scheme that describes which down-mix signal each of a number of channels is mixed into. For example, if each signal with enhanced dialogue corresponds to a channel, which, in turn, is mixed with other restored channels, then the mixing is carried out in accordance with the down-mixing scheme so that each channel is mixed into the correct down-mixing signal.

Схема знижувального мікшування може змінюватись з часом, тобто вона може бути динамічною, таким чином збільшуючи гнучкість системи.The downmixing scheme can change over time, i.e. it can be dynamic, thus increasing the flexibility of the system.

Спосіб може також включати приймання даних, які ідентифікують підмножину ряду каналів, стосовно якої визначені параметри для посилення діалогу. Наприклад, дані, які ідентифікують підмножину ряду каналів, стосовно якої визначені параметри для посилення діалогу, можуть бути включені в параметри для посилення діалогу. Таким чином декодеру може бути надано сигнал про те, для яких каналів слід здійснити посилення діалогу. Альтернативно така інформація може бути доступною в декодері, наприклад, вона може бути жорстко запрограмована, що означає, що параметри для посилення діалогу завжди визначені стосовно одних й тих самих каналів. Зокрема, спосіб може також включати приймання інформації, яка вказує, які сигнали з сигналів з посиленим діалогом слід піддати мікшуванню. Наприклад, спосіб згідно з даним варіантом може бути реалізований системою декодування, яка працює в певному режимі, в якому сигнали з посиленим діалогом не мікшують назад в повністю ідентичний набір сигналів знижувального мікшування, який був використаний для надання сигналів з посиленим діалогом. Таким чином, операція мікшування на практиці може бути обмежена неповною вибіркою (одного чи більше сигналів) з підмножини ряду сигналів знижувального мікшування. Інші сигнали з посиленим діалогом додають до дещо відмінних сигналів знижувального мікшування, таких як сигнали знижувального мікшування, які пройшли перетворення формату. Як тільки стають відомими дані, які ідентифікують підмножину ряду каналів, стосовно якої визначені параметри для посилення діалогу, і схема знижувального мікшування, можна знайти підмножину ряду сигналів знижувального мікшування, в яку виконане знижувальне мікшування підмножини ряду каналів, стосовно якої визначені параметри для посилення діалогу. Більш докладно, дані, які ідентифікують підмножину ряду каналів, стосовно якої визначені параметри для посилення діалогу, можна використовувати разом зі схемою знижувального мікшування для знаходження підмножини ряду сигналів знижувального мікшування, в яку виконане знижувальне мікшування підмножини ряду каналів, стосовно якої визначені параметри для посилення діалогу.The method may also include receiving data that identifies a subset of the channel array for which dialog enhancement parameters are defined. For example, data that identifies a subset of the channel array for which the dialog enhancement parameters are defined may be included in the dialog enhancement parameters. In this way, the decoder can be given a signal about which channels should be enhanced with dialogue. Alternatively, such information may be available in the decoder, for example, it may be hard-coded, meaning that the dialogue enhancement parameters are always defined for the same channels. In particular, the method may also include receiving information indicating which signals from the enhanced dialogue signals should be mixed. For example, the method of this embodiment may be implemented by a decoding system operating in a particular mode in which the enhanced dialogue signals are not mixed back into a completely identical set of downmix signals that was used to provide the enhanced dialogue signals. Thus, the mixing operation in practice may be limited to an incomplete sample (one or more signals) from a subset of the downmix signal range. Other dialogue-enhanced signals add to slightly different downmix signals, such as downmix signals that have undergone format conversion. As soon as the data identifying the subset of the channel array for which the parameters for dialog enhancement are defined and the downmixing scheme are known, the subset of the downmix signal array that is downmixed with the subset of the channel array for which the parameters for dialog enhancement are defined is known. In more detail, the data identifying the subset of the channel array for which the dialog enhancement parameters are defined can be used in conjunction with the downmixing scheme to find the subset of the downmix signal array that is downmixed to the subset of the channel array for which the dialog enhancement parameters are defined .

Етапи підвищувального мікшування підмножини ряду сигналів знижувального мікшування, застосування посилення діалогу і мікшування можуть бути виконані як матричні операції, визначені, відповідно, параметрами відновлення, параметрами для посилення діалогу і параметрами мікшування. Перевага цього полягає в тому, що спосіб можна ефективним чином реалізувати шляхом виконання матричного множення.The steps of up-mixing a subset of down-mixing signals, applying dialogue enhancement, and mixing can be performed as matrix operations defined, respectively, by restoration parameters, dialogue enhancement parameters, and mixing parameters. The advantage of this is that the method can be efficiently implemented by performing matrix multiplication.

Більш того, спосіб може включати об'єднання шляхом матричного множення матричних операцій, які відповідають етапам підвищувального мікшування підмножини ряду сигналів знижувального мікшування, застосування посилення діалогу і мікшування, в єдину матричну операцію перед застосуванням до підмножини ряду сигналів знижувального мікшування. Таким чином різні матричні операції можуть бути об'єднані в єдину матричну операцію, таким чином додатково підвищуючи ефективність і знижуючи обчислювальну складність способу.Moreover, the method may include combining, by matrix multiplication, the matrix operations that correspond to the steps of up-mixing a subset of the down-mixing signal series, applying dialog gain and mixing, into a single matrix operation before applying the down-mixing signal to a subset of the series. Thus, various matrix operations can be combined into a single matrix operation, thus further increasing the efficiency and reducing the computational complexity of the method.

Параметри посилення діалогу і/або параметри відновлення можуть залежати від частоти, таким чином надаючи можливість вказаним параметрами бути різними для різних смуг частот.The dialog gain parameters and/or recovery parameters may be frequency dependent, thus allowing the specified parameters to be different for different frequency bands.

Таким чином посилення діалогу і відновлення можна оптимізувати в різних смугах частот, тим самим підвищуючи якість звуку на виході.In this way, dialogue gain and restoration can be optimized in different frequency bands, thereby increasing the quality of the output sound.

Більш докладно, параметри для посилення діалогу можуть бути визначені стосовно першого набору смуг частот, а параметри відновлення можуть бути визначені стосовно другого набору смуг частот, при цьому другий набір смуг частот відрізняється від першого набору смуг частот.In more detail, parameters for dialogue enhancement may be defined with respect to a first set of frequency bands, and restoration parameters may be defined with respect to a second set of frequency bands, wherein the second set of frequency bands is different from the first set of frequency bands.

Це може бути переважним при зменшенні бітової швидкості для передавання параметрів для посилення діалогу і параметрів відновлення в бітовому потоці, коли, наприклад, процес відновлення потребує параметрів з більш високою роздільністю за частотою, ніж процес посилення діалогу, і/або коли, наприклад, процес посилення діалогу виконують на меншій смузі бо пропускання, ніж процес відновлення.This may be preferable when reducing the bitrate for transmitting dialog enhancement parameters and restoration parameters in the bitstream, when, for example, the restoration process requires parameters with a higher frequency resolution than the dialog enhancement process, and/or when, for example, the enhancement process the dialog is performed on a lower bandwidth than the recovery process.

Згідно з наведеними для прикладу варіантами здійснення (переважно дискретні) значення параметрів для посилення діалогу можуть бути прийняті неодноразово і пов'язані з першим набором моментів часу, в які відповідні значенні застосовні точно. В даному описі твердження стосовно того, що значення є застосовним, або відомим, "точно" в визначений момент часу, має означати, що це значення було прийняте декодером, як правило, разом з явною чи неявною вказівкою на момент часу, в який воно є застосовним. Навпаки, значення, яке є інтерпольованим або передбаченим для певного моменту часу, в цьому розумінні не є застосовним "точно" у вказаний момент часу, а являє собою оцінку на боці декодера. "Точно" не передбачає, що дане значення досягає точного відновлення звукового сигналу. Між послідовними моментами часу в наборі може бути встановлена наперед визначена перша схема інтерполяції. Схема інтерполяції, яка визначає те, яким чином слід оцінювати приблизне значення параметра в певний момент часу, який знаходиться між двома граничними моментами часу в наборі, в яких значення параметра є відомими, може представляти собою, наприклад, лінійну чи кусково-постійну інтерполяцію. Якщо момент часу передбачення знаходиться на певній відстані від одного з граничних моментів часу, лінійна схема інтерполяції грунтується на припущені про те, що значення параметра в момент часу передбачення лінійно залежить від вказаної відстані, тоді як кусково-постійна схема інтерполяції гарантує, що значення параметра не змінюється між кожним відомим і наступним значеннями. Також можуть мати місце й інші можливі схеми інтерполяції, в тому числі, наприклад, схеми, в яких для оцінювання значення параметра в даний момент часу передбачення використовують многочлени зі степенем більше одиниці, сплайни, раціональні функції, гаусові процеси, тригонометричні многочлени, вейвлети або їх сполучення. Набір моментів часу може не бути переданий чи заявлений в явному виді, а замість цього він може бути домислений зі схеми інтерполяції, наприклад, початковою точкою або кінцевою точкою інтервалу лінійної інтерполяції, які можуть бути неявно прив'язані до меж кадру алгоритму обробки звуку. Параметри відновлення можна отримати подібним чином: (переважно дискретні) значення параметрів відновлення можуть бути пов'язані з другим набором моментів часу, і між послідовними моментами часу може бути виконана друга схема інтерполяції.According to the exemplary embodiments, the (predominantly discrete) values of the parameters for enhancing the dialog can be taken multiple times and associated with the first set of time points in which the corresponding values are applicable exactly. In this specification, a statement that a value is applicable, or known, "exactly" at a specified point in time shall mean that the value has been received by the decoder, usually together with an explicit or implicit indication of the point in time at which it is applicable In contrast, a value that is interpolated or predicted for a particular point in time is in this sense not applicable "exactly" at that point in time, but represents an estimate on the part of the decoder. "Exactly" does not imply that the given value achieves an exact reproduction of the audio signal. A predetermined first interpolation scheme may be established between successive time instants in the set. An interpolation scheme that determines how to estimate the approximate value of a parameter at a certain point in time that is between two extreme points in time in the set at which the parameter values are known can be, for example, linear or piecewise-constant interpolation. If the time point of prediction is at a certain distance from one of the extreme points of time, the linear interpolation scheme is based on the assumption that the value of the parameter at the time of prediction depends linearly on the specified distance, while the piecewise-constant interpolation scheme ensures that the value of the parameter does not varies between each known and subsequent value. Other possible interpolation schemes may also take place, including, for example, schemes in which polynomials with degree greater than unity, splines, rational functions, Gaussian processes, trigonometric polynomials, wavelets or their combination. The set of time instants may not be explicitly transmitted or declared, but instead may be inferred from an interpolation scheme, such as the start point or end point of a linear interpolation interval, which may be implicitly bound to the frame boundaries of the audio processing algorithm. The recovery parameters can be obtained in a similar way: the (mostly discrete) values of the recovery parameters can be associated with a second set of time points, and a second interpolation scheme can be performed between successive time points.

Спосіб може також включати здійснення вибору типу параметрів, причому параметри даного типу представляють собою або параметри для посилення діалогу, або параметри відновлення, таким чином, що набір моментів часу, пов'язаних з вибраним типом, містить щонайменше один момент передбачення, який представляє собою момент часу, відсутній в наборі, пов'язаному з невибраним типом. Наприклад, якщо набір моментів часу, з яким пов'язані параметри відновлення, містить певний момент часу, відсутній в наборі моментів часу, з яким пов'язані параметри для посилення діалогу, то цей певний момент часу буде моментом часу передбачення, якщо параметрами вибраного типу є параметри відновлення, а параметрами невибраного типу -- параметри для посилення діалогу. Аналогічним чином в іншій ситуації момент передбачення можна замість знайти в наборі моментів часу, з яким пов'язані параметри для посилення діалогу, і тоді вибраний і невибраний типи поміняються місцями. Переважно вибраний тип параметрів представляє собою тип, який має найбільшу щільність моментів часу з пов'язаними значеннями параметрів, в даному випадку використання це може зменшити загальну кількість необхідних операцій передбачення.The method may also include selecting a type of parameters, wherein the parameters of the type are either dialog enhancement parameters or restoration parameters, such that the set of time points associated with the selected type contains at least one prediction point that is a time not in the set associated with the unselected type. For example, if the set of points in time to which the recovery parameters are associated contains a particular point in time that is not present in the set of points in time to which the parameters to enhance dialog are associated, then that particular point in time will be the point in time of the prediction if the parameters of the selected type there are recovery parameters, and the parameters of the unselected type are parameters to strengthen the dialogue. Similarly, in another situation, the prediction instant can instead be found in the set of instants to which the dialogue enhancement options are associated, and then the selected and unselected types are swapped. Preferably, the selected parameter type is the type that has the highest density of time points with associated parameter values, in this use case this may reduce the total number of prediction operations required.

Значення параметрів невибраного типу в момент передбачення можуть бути передбачені.Values of parameters of an unselected type at the time of prediction can be predicted.

Передбачення можна виконати з використанням придатного способу передбачення, такого як інтерполяція або екстраполяція, з урахуванням наперед визначеної схеми інтерполяції для типів параметрів.The prediction can be performed using a suitable prediction method, such as interpolation or extrapolation, given a predefined interpolation scheme for parameter types.

Спосіб може включати етап обчислення на основі щонайменше одного передбаченого значення параметрів невибраного типу і прийнятого значення параметрів вибраного типу об'єднаної операції обробки, яка представляє собою принаймні підвищувальне мікшування підмножини сигналів знижувального мікшування з наступним посиленням діалогу в момент передбачення. Додатково до значень параметрів відновлення і параметрів для посилення діалогу обчислення може грунтуватись і на інших значеннях, таких як значення параметрів для мікшування, і об'єднана операція обробки може представляти також етап мікшування сигналу з посиленим діалогом назад в сигнал знижувального мікшування.The method may include a calculation step based on at least one predicted value of the parameters of the unselected type and the accepted value of the parameters of the selected type of the combined processing operation, which is at least up-mixing of a subset of down-mixing signals followed by amplification of the dialogue at the moment of prediction. In addition to the recovery parameter values and dialogue enhancement parameters, the calculation may be based on other values, such as downmix parameter values, and the combined processing operation may also represent a step of mixing the dialogue-enhanced signal back into the downmix signal.

Спосіб може включати етап обчислення на основі принаймні (прийнятого або передбаченого) значення параметрів вибраного типу і принаймні (прийнятого або передбаченого) значення параметрів невибраного типу, причому щонайменше одне з вказаних значень представляє собою прийняте значення, об'єднаної операції обробки в суміжний момент часу в наборі, пов'язаному з вибраним чи невибраним типом. Суміжний момент часу може бути або більш раннім, або більш віддаленим, ніж момент передбачення, і вимога того, щоб цей суміжний момент часу був найближчим сусідом в плані відстані, не є суттєвою.The method may include the step of calculating based on at least the (accepted or predicted) value of the parameters of the selected type and at least the (accepted or predicted) value of the parameters of the unselected type, and at least one of the specified values represents the accepted value of the combined processing operation at the adjacent time point in to the set associated with the selected or unselected type. The adjacent point in time can be either earlier or more distant than the point in time of prediction, and the requirement that this adjacent point in time be the nearest neighbor in terms of distance is not essential.

В даному способі етапи підвищувального мікшування підмножини ряду сигналів знижувального мікшування і застосування посилення діалогу можуть бути виконані між моментом передбачення і суміжним моментом часу за допомогою інтерпольованого значення обчисленої об'єднаної операції обробки. За допомогою інтерполяції обчисленої об'єднаної операції обробки можна досягти зменшення обчислювальної складності. Завдяки тому, що обидва типи параметрів не інтерполюють окремо, і завдяки тому, що не формують добуток (тобто об'єднану операцію обробки), в кожній точці інтерполяції, для досягненні рівною мірою корисного результату в плані якості прослуховування, яка сприймається, може знадобитись менша кількість математичних операцій додавання і множення.In this method, the steps of up-mixing a subset of the down-mix signals and applying the dialog gain can be performed between the time of prediction and the adjacent time using the interpolated value of the calculated combined processing operation. With the help of interpolation of the calculated combined processing operation, a reduction in computational complexity can be achieved. Because the two types of parameters are not interpolated separately, and because they do not form a product (i.e., a combined processing operation), at each interpolation point, less may be required to achieve an equally useful result in terms of perceived listening quality. the number of mathematical operations of addition and multiplication.

Згідно з додатковими наведеними для прикладу варіантами здійснення об'єднану операцію обробки в суміжний момент часу можна обчислити на основі прийнятого значення параметрів вибраного типу і передбаченого значення параметрів невибраного типу. Також можлива і зворотна ситуація, в якій об'єднану операцію обробки в суміжний момент часу можна обчислити на основі передбаченого значення параметрів вибраного типу і прийнятого значення параметрів невибраного типу. Ситуації, в яких значення параметрів одного й того самого типу є прийнятим значенням в момент передбачення і передбаченим значенням в суміжний момент часу, можуть виникати, якщо, наприклад, моменти часу в наборі, з яким пов'язані параметри вибраного типу, знаходяться суворо поміж моментами часу в наборі, з якими пов'язані параметри невибраного типу.According to additional exemplary embodiments, a combined processing operation at a contiguous point in time can be calculated based on the accepted value of the parameters of the selected type and the predicted value of the parameters of the unselected type. The reverse situation is also possible, in which the combined processing operation at the adjacent moment of time can be calculated on the basis of the predicted value of the parameters of the selected type and the accepted value of the parameters of the unselected type. Situations in which parameter values of the same type are the accepted value at the time of prediction and the predicted value at an adjacent time point may arise if, for example, the time points in the set to which the parameters of the selected type are associated are strictly between points in time time in the set to which parameters of the unselected type are associated.

Згідно з наведеними для прикладу варіантами здійснення об'єднану операцію обробки в суміжний момент часу можна обчислити на основі прийнятого значення параметрів вибраного типу параметрів і прийнятого значення параметрів невибраного типу параметрів. Такі ситуації можуть виникати, наприклад, тоді, коли точні значення параметрів обох типів прийняті для меж кадру, але також -- для вибраного типу -- для моменту часу всередині поміж межами. Тоді суміжний момент часу представляє собою момент часу, пов'язаний з межею кадру, а момент часу передбачення знаходиться посередині між межами кадру.According to the exemplary embodiments, the combined processing operation at a contiguous point in time can be calculated based on the accepted value of the parameters of the selected type of parameters and the accepted value of the parameters of the unselected type of parameters. Such situations may arise, for example, when the exact values of parameters of both types are accepted for the frame boundaries, but also -- for the selected type -- for the instant of time inside the boundaries. Then the contiguous instant of time is the instant of time associated with the frame boundary, and the instant of prediction time is in the middle between the frame boundaries.

Згідно з додатковими наведеними для прикладу варіантами здійснення спосіб може такожAccording to additional exemplary embodiments, the method may also

Зо включати здійснення вибору на основі першої і другої схем інтерполяції об'єднаної схеми інтерполяції згідно з наперед визначеним правилом вибору, при цьому інтерполяція відповідних обчислених об'єднаних операцій обробки відповідає об'єднаній схемі інтерполяції. Наперед визначене правило вибору може бути визначене для випадку, в якому перша і друга схеми інтерполяції є однаковими, а також може бути визначене для випадку, в якому перша і друга схеми інтерполяції є різними. Для прикладу, якщо перша схема інтерполяції є лінійною (Її, переважно, якщо існує лінійний взаємозв'язок між параметрами і кількісними властивостями операції посилення діалогу), а друга схема інтерполяції є кусково-постійною, то об'єднану схему інтерполяції можна вибрати лінійною.To include making a selection based on the first and second interpolation schemes of the combined interpolation scheme according to a predetermined selection rule, wherein the interpolation of the respective calculated combined processing operations corresponds to the combined interpolation scheme. The predetermined selection rule may be determined for the case in which the first and second interpolation schemes are the same, and may also be determined for the case in which the first and second interpolation schemes are different. For example, if the first interpolation scheme is linear (its, preferably, if there is a linear relationship between the parameters and the quantitative properties of the dialogue amplification operation), and the second interpolation scheme is piecewise-continuous, then the combined interpolation scheme can be chosen linear.

Згідно з наведеними для прикладу варіантами здійснення передбачення значення параметрів невибраного типу в момент передбачення виконують згідно зі схемою інтерполяції для параметрів невибраного типу. Це може включати використання точного значення параметра невибраного типу в момент часу в наборі, пов'язаному з невибраним типом, який є суміжним з моментом передбачення.According to the options given for the example, the prediction of the value of the parameters of the unselected type at the time of prediction is performed according to the interpolation scheme for the parameters of the unselected type. This may include using the exact value of the parameter of the unselected type at a point in time in the set associated with the unselected type that is contiguous to the time of prediction.

Згідно з наведеними для прикладу варіантами здійснення об'єднану операцію обробки обчислюють як єдину матричну операцію і потім застосовують до підмножини ряду сигналів знижувального мікшування. Переважно етапи підвищувального мікшування і застосування посилення діалогу виконують як матричні операції, які визначені параметрами відновлення і параметрами для посилення діалогу. В якості об'єднаної схеми інтерполяції може бути вибрана лінійна схема інтерполяції, і інтерпольоване значення відповідних обчислених об'єднаних операцій обробки можна обчислити за допомогою лінійної матричної інтерполяції. Для зменшення обчислювальної складності інтерполяція може бути обмежена такими матричними елементами, які змінюються між моментом передбачення і суміжним моментом часу.According to the exemplary embodiments, the combined processing operation is calculated as a single matrix operation and then applied to a subset of a number of downmixed signals. Predominantly, the stages of upmixing and application of dialog enhancement are performed as matrix operations, which are defined by restoration parameters and dialog enhancement parameters. A linear interpolation scheme can be selected as the combined interpolation scheme, and the interpolated value of the corresponding calculated combined processing operations can be calculated by linear matrix interpolation. To reduce the computational complexity, the interpolation can be limited to such matrix elements that change between the moment of prediction and the adjacent moment of time.

Згідно з наведеними для прикладу варіантами здійснення прийняті сигнали знижувального мікшування можуть бути розбиті на часові кадри, і спосіб в усталеному режимі роботи може включати етап приймання щонайменше одного значення параметрів відповідних типів, точно застосовного в деякий момент часу в кожному часовому кадрі. В межах даного документа "усталений режим" стосується роботи, яка не включає наявності початкової і кінцевої частин, наприклад, пісні, і роботу, яка не включає внутрішні перехідні стани, які роблять необхідним підрозбиття кадру.According to the exemplary embodiments, the received downmix signals can be divided into time frames, and the method in the steady state of operation can include the step of accepting at least one value of the parameters of the corresponding types that is exactly applicable at some point in time in each time frame. For the purposes of this document, "fixed mode" refers to work that does not include the presence of a beginning and end part, such as a song, and work that does not include internal transitions that make frame subdivision necessary.

Згідно з другою особливістю передбачений комп'ютерний програмний продукт, який містить машинопрочитуваний носій з командами для виконання способу згідно з першою особливістю.According to the second feature, a computer software product is provided, which contains a machine-readable medium with commands for performing the method according to the first feature.

Машинопрочитуваний носій може представляти собою постійний машинопрочитуваний носій або пристрій.The machine-readable medium may be a permanent machine-readable medium or device.

Згідно з третьою особливістю передбачений декодер для посилення діалогу в аудіосистемі, який містить: компонент приймання, виконаний з можливістю приймання: ряду сигналів знижувального мікшування, які представляють собою результат знижувального мікшування більшої кількості каналів, параметрів для посилення діалогу, причому ці параметри визначені стосовно підмножини ряду каналів, яка включає канали, які містять діалог, причому цю підмножину ряду каналів піддано знижувальному мікшуванню в підмножину ряду сигналів знижувального мікшування, і параметрів відновлення, які надають можливість параметричного відновлення каналів, підданих знижувальному мікшуванню в підмножину ряду сигналів знижувального мікшування; компонент підвищувального мікшування, виконаний з можливістю параметричного підвищувального мікшування підмножини ряду сигналів знижувального мікшування на основі параметрів відновлення з метою відновлення підмножини ряду каналів, стосовно якої визначені параметри для посилення діалогу; і компонент посилення діалогу, виконаний з можливістю застосування посилення діалогу до підмножини ряду каналів, стосовно якої визначені параметри для посилення діалогу, з використанням параметрів для посилення діалогу з метою надання щонайменше одного сигналу з посиленим діалогом; і компонент мікшування, виконаний з можливістю піддавання мікшуванню щонайменше одного сигналу з посиленим діалогом з метою надання версій з посиленим діалогом підмножини ряду сигналів знижувального мікшування.According to the third feature, a decoder is provided for enhancing dialogue in an audio system, which includes: a receiving component configured to receive: a series of down-mixing signals, which are the result of down-mixing a larger number of channels, parameters for enhancing dialogue, and these parameters are defined with respect to a subset of the series of channels, which includes channels that contain dialogue, and this subset of the number of channels is subjected to downmixing into a subset of the number of downmixing signals, and restoration parameters that provide the possibility of parametric restoration of the channels subjected to downmixing into a subset of the number of downmixing signals; an upmixing component, made with the possibility of parametric upmixing of a subset of a number of downmixing signals based on restoration parameters in order to restore a subset of a number of channels for which the parameters for dialogue amplification are defined; and a dialog enhancement component configured to apply dialog enhancement to a subset of a number of channels for which dialog enhancement parameters are defined, using dialog enhancement parameters to provide at least one dialog enhanced signal; and a mixing component configured to mix at least one dialogue-enhanced signal to provide dialogue-enhanced versions of a subset of a number of downmix signals.

В цілому друга і третя особливості можуть мати ті самі ознаки і переваги, як і перша особливість.In general, the second and third features may have the same characteristics and advantages as the first feature.

ІЇ. Наведені для прикладу варіанти здійсненняII. Examples of implementation options are provided

На фіг. та ї фіг. 16 схематично представлена конфігурація каналів 7.1-4 (відповідно до конфігурації динаміків 7.14-44) з трьома передніми каналами, Г, С, К, двома навколишніми каналами, І 5, К5, двома задніми каналами, ІВ, КВ, чотирма висотними каналами ТЕ, ТЕК,In fig. and fig. 16 schematically presents the configuration of channels 7.1-4 (corresponding to the configuration of speakers 7.14-44) with three front channels, H, C, K, two surround channels, I 5, K5, two rear channels, IV, KV, four height channels TE, TEK,

ТВ, ТВЕ, ї каналом ІЕЕ низькочастотних ефектів. В процесі кодування конфігурації каналів 7.144 канали, як правило, піддають знижувальному мікшуванню, тобто об'єднують в меншу кількість сигналів, які називають сигналами знижувального мікшування. В процесі знижувального мікшування канали можуть бути поєднані різними способами для створення різних конфігурацій знижувального мікшування. На фіг. та представлена перша конфігурація 100а знижувального мікшування 5.1 з сигналами знижувального мікшування Ї, с, г, І5, г5, Ме. Кола на фігурі показують, які канали піддані знижувальному мікшуванню в які сигнали знижувального мікшування. На фіг. 165 представлена друга конфігурація 1006 знижувального мікшування 5.1 з сигналами знижувального мікшування І, с, г, !І, її, Ме. Друга конфігурація 100р. знижувального мікшування 5.1 відрізняється від першої конфігурації 100а знижувального мікшування 5.1 тим, що канали об'єднані в інший спосіб. Наприклад, в першій конфігурації 100а знижувального мікшування канали ЇЇ і ТЕГ піддані знижувальному мікшуванню в сигнал | знижувального мікшування, тоді як в другій конфігурації 100Ю6 знижувального мікшування знижувальному мікшуванню в сигнал | знижувального мікшування піддані канали І, 1/5, ІВ. Конфігурацію знижувального мікшування в даному документі іноді називають схемою знижувального мікшування, яка описує, які канали піддають знижувальному мікшуванню в які сигнали знижувального мікшування. Конфігурація знижувального мікшування, або схема знижувального мікшування, може бути динамічною в тому, що вона може відрізнятись поміж часовими кадрами системи кодування звуку. Наприклад, в деяких часових кадрах може бути використана перша схема 100а знижувального мікшування, тоді як в інших часових кадрах може бути використана друга схема 1006 знижувального мікшування. У випадку динамічної зміни схеми знижувального мікшування кодер може відправляти в декодер дані, які вказують, яка схема знижувального мікшування була використана при здійсненні кодування каналів.TV, TVE, and the IEE channel of low-frequency effects. In the process of encoding the configuration of the 7.144 channels, as a rule, they are downmixed, that is, they are combined into a smaller number of signals, which are called downmix signals. In the downmix process, channels can be combined in different ways to create different downmix configurations. In fig. and the first configuration 100a of downmixing 5.1 with downmixing signals Y, c, r, I5, r5, Me is presented. The circles on the figure show which channels are downmixed into which downmix signals. In fig. 165 presents the second configuration 1006 of downmixing 5.1 with downmixing signals I, c, r, !I, her, Me. The second configuration is 100 rubles. downmixing 5.1 differs from the first configuration 100a of downmixing 5.1 in that the channels are combined in a different way. For example, in the first down-mixing configuration 100a, the HER and TEG channels are down-mixed into a signal | down-mixing, while in the second configuration 100U6 down-mixing down-mixing into the signal | channels I, 1/5, IV are subjected to down-mixing. The down-mix configuration in this document is sometimes referred to as a down-mix scheme, which describes which channels are down-mixed into which down-mix signals. The down-mixing configuration, or down-mixing scheme, can be dynamic in that it can vary between time frames of the audio coding system. For example, in some time frames the first down-mixing scheme 100a may be used, while in other time frames the second down-mixing scheme 1006 may be used. In the case of a dynamic change of the down-mixing scheme, the encoder can send data to the decoder indicating which down-mixing scheme was used when encoding the channels.

На фіг. 2 представлений декодер 200 для посилення діалогу на відомому рівні техніки. Цей декодер містить три основні компоненти: компонент 202 приймання, компонент 204 підвищувального мікшування, або відновлення, і компонент 206 посилення діалогу (ОЕ).In fig. 2 illustrates a prior art dialogue enhancement decoder 200. This decoder contains three main components: a receiving component 202, an upmixing component 204, or recovery, and a dialogue enhancement (OE) component 206.

Декодер 200 належить до типу, який приймає ряд сигналів 212 знижувального мікшування, відновлює повну конфігурацію 218 каналів на основі прийнятих сигналів 212 знижувального мікшування, виконує посилення діалогу стосовно повної конфігурації 218 каналів або, принаймні, її підмножини, і видає повну конфігурацію каналів 220 з посиленим діалогом.Decoder 200 is of the type that receives a series of downmix signals 212 , reconstructs the full channel configuration 218 based on the received downmix signals 212 , performs dialogue amplification on the full channel configuration 218 , or at least a subset thereof, and outputs the full channel configuration 220 with enhanced dialogue

Більш докладно, компонент 202 приймання виконаний з можливістю приймання з кодера потоку 210 даних (який іноді називають бітовим потоком). Потік 210 даних може містити дані різних типів, і компонент 202 приймання може декодувати прийнятий потік 210 даних в дані різних типів. В даному випадку потік даних містить ряд сигналів 212 знижувального мікшування, параметри 214 відновлення і параметри 216 для посилення діалогу.In more detail, the receiving component 202 is configured to receive a stream of data (sometimes referred to as a bit stream) from the encoder 210 . The data stream 210 may contain data of various types, and the receiving component 202 may decode the received data stream 210 into data of various types. In this case, the data stream contains a series of downmix signals 212, restoration parameters 214, and dialog enhancement parameters 216.

Компонент 204 підвищувального мікшування потім відновлює повну конфігурацію каналів на основі ряду сигналів 212 знижувального мікшування і параметрів 214 відновлення. Іншими словами, компонент 204 підвищувального мікшування відновлює всі канали 218, які були піддані знижувальному мікшуванню в сигнали 212 знижувального мікшування. Наприклад, компонент 204 підвищувального мікшування на основі параметрів 214 відновлення може параметрично відновлювати повну конфігурацію каналів.The upmix component 204 then restores the full channel configuration based on a number of downmix signals 212 and recovery parameters 214 . In other words, the upmix component 204 restores all channels 218 that have been downmixed into downmix signals 212 . For example, the parameter-based upmixing component 204 of recovery 214 may parametrically recover the full channel configuration.

В представленому прикладі сигнали 212 знижувального мікшування відповідають сигналам знижувального мікшування однієї з конфігурацій знижувального мікшування 5.1, представлених на фіг. Та і 1р, а канали 218 відповідають каналам конфігурації каналів 7.14, яка представлена на фіг. Та і 15. Проте зрозуміло, що принципи декодера 200 застосовні й до інших конфігурацій каналів/конфігурацій знижувального мікшування.In the presented example, the down-mixing signals 212 correspond to the down-mixing signals of one of the down-mixing configurations 5.1 shown in FIG. Yes and 1p, and channels 218 correspond to the channels of channel configuration 7.14, which is presented in fig. Yes and 15. However, it will be understood that the principles of decoder 200 are applicable to other channel/downmix configurations.

Відновлені канали 218 або принаймні підмножину відновлених каналів 218 потім піддають посиленню діалогу за допомогою компонента 206 посилення діалогу. Наприклад, компонент 206 посилення діалогу може виконувати на відновлених каналах 218 або принаймні на підмножині відновлених каналів 218 певну матричну операцію з метою видачі каналів з посиленим діалогом. Така матрична операція, як правило, визначена параметрами 216 посилення діалогу.The reconstructed channels 218 , or at least a subset of the reconstructed channels 218 , are then subjected to dialog enhancement using the dialog enhancement component 206 . For example, the dialog enhancement component 206 may perform a matrix operation on the reconstructed channels 218 or at least on a subset of the reconstructed channels 218 to produce dialogue enhanced channels. Such a matrix operation, as a rule, is defined by the parameters 216 of dialogue enhancement.

Наприклад, компонент 206 посилення діалогу може піддавати посиленню діалогу канали С,For example, the dialogue enhancement component 206 can subject C channels to dialogue amplification,

І, К з метою створення каналів Спр, І оє, Коє з посиленим діалогом, тоді як інші канали просто пропускають, як показано на фіг. 2 пунктирними лініями. В такій ситуації параметри посилення діалогу визначені тільки стосовно каналів С, І, ЕК, тобто стосовно підмножини ряду каналів 218.I, K in order to create channels Spr, I oye, Koe with enhanced dialogue, while the other channels are simply skipped, as shown in fig. 2 dotted lines. In such a situation, the dialogue amplification parameters are defined only in relation to channels C, I, EK, i.e. in relation to a subset of the number of channels 218.

Наприклад, параметри 216 посилення діалогу можуть визначати матрицю 3х3, яка може бути застосована до каналів С, І, Б. г ВЕ На аа Ота її зе) - тя поз 2 . ЙFor example, the dialogue enhancement parameters 216 can define a 3x3 matrix that can be applied to channels C, I, and B. AND

Аве тля ізз ЛбПза ВAve tlia izz LbPza V

Альтернативно канали, не залучені до посилення діалогу, можуть бути пропущені за допомогою матриці посилення діалогу з "1" у відповідних діагональних позиціях і "0" у всіх інших елементах відповідних строк і стовпців.Alternatively, channels not involved in dialogue gain may be omitted using a dialogue gain matrix with "1" in the corresponding diagonal positions and "0" in all other elements of the corresponding rows and columns.

Свв пі 27» 0 от. 000080 о йSvv pi 27" 0 ot. 000080 o.i

Тов тої йо 0 ота 0 000000 і,Tov toi yo 0 ota 0 000000 i,

ТЕ, п 011 0000080 о ОРІ ТКTE, p 011 0000080 o ORI TC

Кк пз йза бот 00000 о0в6о КкKk pz yza bot 00000 o0v6o Kk

ТїЕВ по 00 о0 10000000 ЕК 51 о п 00 01000000 5 т ві. о 0 00001000 о0 ов їв 0 п ЕВ. а о ваа1о00о0о05 їнTiEV on 00 o0 10000000 EC 51 o p 00 01000000 5 t vi. o 0 00001000 o0 ov ate 0 p EV. and about vaa1o00o0o05 yin

КУ Ії п о о о 0 поп 1о0009 КУKU Ii p o o o 0 pop 1o0009 KU

ТЕ о 00 00000010 ОР ТЕБКTE at 00 00000010 OR TEBK

КЕ 0 0 ЕВ. 0 о виаооо1о КВKE 0 0 EV. 0 o vyaooo1o KV

ЕЕ пап пао0опопаоі1 КБЕEE pap pao0opopaoi1 KBE

Компонент 206 посилення діалогу може виконувати посилення діалогу згідно з різними способами. Перший спосіб, який в даному документі називають незалежним від каналів параметричним посиленням, представлений на фіг. 3. Посилення діалогу виконують стосовно принаймні підмножини відновлених каналів 218, як правило, каналів, які містять діалог, тут -- каналів І, Е, С. Параметри 216 для посилення діалогу включають набір параметрів для кожного з каналів, які належить посилити. В представленому прикладі набори параметрів представлені параметрами рі, р», рз, які стосуються, відповідно, каналів Г, К, С. В принципі, параметри, які передають в даному способі, представляють відносний внесок діалогу в енергію мікшування для частотно-часової мозаїки в каналі. Крім того, в процесі посилення діалогу бере участь коефіцієнт д підсилення. Коефіцієнт уд підсилення можна виразити як: т д -10:0-1 де б -- коефіцієнт підсилення при посиленні діалогу, виражений в дБ. Коефіцієнт о підсилення при посиленні діалогу може, наприклад, бути введений користувачем, і тому він, як правило, не включений в потік 210 даних, представлений на фіг. 2.The dialogue enhancement component 206 may perform dialogue enhancement according to various methods. The first method, which in this document is called channel-independent parametric amplification, is presented in fig. 3. Dialogue amplification is performed with respect to at least a subset of restored channels 218, as a rule, channels that contain dialogue, here - channels I, E, C. Parameters 216 for dialogue amplification include a set of parameters for each of the channels to be amplified. In the presented example, the sets of parameters are represented by the parameters рі, р», рз, which refer, respectively, to channels Г, К, С. In principle, the parameters transmitted in this method represent the relative contribution of the dialog to the mixing energy for the frequency-time mosaic in channels In addition, the amplification factor d takes part in the process of dialogue amplification. The amplification factor can be expressed as: t d -10:0-1 where b is the amplification factor when amplifying the dialogue, expressed in dB. The gain factor for dialogue amplification may, for example, be input by the user, and therefore is typically not included in the data stream 210 shown in FIG. 2.

В способі незалежного від каналів параметричного посилення компонент 206 посилення діалогу помножує кожен канал на відповідний йому параметр р; і на коефіцієнт уд підсилення, а потім складає результат з каналом, створюючи канали 220 з посиленим діалогом, тут -- І ов,In the method of channel-independent parametric amplification, the dialog amplification component 206 multiplies each channel by its corresponding parameter p; and on the ud gain factor, and then adds the result to the channel, creating 220 channels with enhanced dialogue, here -- І ов,

Воє, Сов. З використанням матричного представлення це можна записати наступним чином:Howl, Owl. Using matrix representation, this can be written as follows:

Хе - У ваша) віх де А-- матриця, яка містить в якості строк канали 2181, КЕ, С), ХЕ. матриця, яка містить в якості строк канали 220 з посиленим діалогом, Є -- вектор-строка з елементами, відповідними . з дав . параметрам посилення діалогу Рі, М, 3 для кожного каналу, і аівдірі-. діагональна матриця, яка містить на діагоналі елементи ?.Хе - У ваша) milestone where А is a matrix that contains channels 2181, КЕ, С), ХЕ as terms. the matrix, which contains as lines 220 channels with enhanced dialogue, is a vector-line with elements corresponding to . with gave dialogue amplification parameters Ri, M, 3 for each channel, and aivdiri-. diagonal matrix, which contains elements ? on the diagonal.

Другий спосіб посилення діалогу, який в даному документі називають багатоканальним передбаченням діалогу, представлений на фіг. 4. В цьому способі компонент 206 посилення діалогу об'єднує декілька каналів 218 в лінійну комбінацію для виконання передбачення сигналу 419 діалогу. Окрім когерентного додавання присутності діалогу в декількох каналах цей підхід може отримувати переваги від віднімання фонового шуму в каналі, який містить діалог, з використанням іншого каналу без діалогу. З цією метою параметри 216 посилення діалогу містять для кожного каналу 218 параметр, який визначає коефіцієнт відповідного каналу при створенні лінійної комбінації. В представленому прикладі параметри 216 посилення діалогу містять параметри рі, рг2, рз, які стосуються, відповідно, каналів Ї, К, С. Як правило, для генерування параметрів передбачення на боці кодера використовують алгоритми оптимізації мінімальної середньоквадратичної похибки (ММ5Е).The second method of dialogue enhancement, which in this document is called multi-channel dialogue prediction, is presented in fig. 4. In this method, the dialogue enhancement component 206 combines multiple channels 218 into a linear combination to perform prediction of the dialogue signal 419. In addition to coherently adding the presence of dialogue across multiple channels, this approach can benefit from subtracting background noise in a channel containing dialogue using another channel without dialogue. For this purpose, the dialog gain parameters 216 contain for each channel 218 a parameter that determines the coefficient of the corresponding channel when creating a linear combination. In the presented example, the dialogue amplification parameters 216 contain the parameters рі, рг2, рз, which relate, respectively, to channels І, К, С. As a rule, to generate prediction parameters on the encoder side, optimization algorithms of the minimum root mean square error (MM5E) are used.

Компонент 206 посилення діалогу може потім посилювати, тобто збільшувати, передбачений сигнал 419 діалогу шляхом використання коефіцієнта д підсилення і додавати сигнал з посиленим діалогом до каналів 218 з метою створення каналів 220 з посиленим діалогом. Для додавання сигналу з посиленим діалогом до правильних каналів в правильній просторовій позиції (інакше він не буде посилювати діалог з очікуваним підсиленням) панорамування між трьома каналами передають за допомогою коефіцієнтів представлення, тут - п, г, Із. За умови, що коефіцієнти представлення є такими, що зберігають енергію, тобто тов яті 1 третій коефіцієнт гз представлення можна визначити з перших двох коефіцієнтів так, що:The dialogue enhancement component 206 may then amplify, ie increase, the predicted dialogue signal 419 by using a gain factor d and add the dialogue enhanced signal to channels 218 to create dialogue enhanced channels 220. To add a signal with enhanced dialogue to the correct channels in the correct spatial position (otherwise it will not enhance the dialogue with the expected gain), panning between the three channels is transmitted using representation coefficients, here - n, r, Iz. Provided that the coefficients of the representation are such that they conserve energy, that is, the third coefficient of the representation can be determined from the first two coefficients so that:

ІЙ а . та Б 11-76 - КІ, зі че -ІІ and . and B 11-76 - KI, with che -

З використанням матричного представлення посилення діалогу, виконуване компонентом 206 посилення діалогу в способі багатоканального передбачення діалогу, можна записати наступним чином:Using a matrix representation of the dialogue gain performed by the dialogue gain component 206 in the multi-channel dialogue prediction method can be written as follows:

Ха НУРІЕХ або 1 каст рі потр поті рзHa NURIEH or 1 caste ri potri rz

Хе Втр 1вд'ст р тр "Х тп т пот ве 1 вдстатрі де І -- матриця тотожного перетворення, Х-- матриця, яка містить в якості строк канали 218 (І, А, С), Хе-- матриця, яка містить в якості строк канали 220 з посиленим діалогом, -- вектор-строка з елементами, які відповідають параметрам Рі, Б, 3 посилення діалогу для кожного каналу, 77 -- вектор-стовпець, який містить в якості елементів коефіцієнти 73, 75, 75 представлення, і 4 -- коефіцієнт підсилення, причому 5 п - 1022-11.Xe Vtr 1vd'str r tr "X tp t pot ve 1 vdstatri where I is the matrix of the identical transformation, X-- the matrix that contains as terms the channels 218 (I, A, C), Xe-- the matrix that contains as rows, 220 channels with enhanced dialogue, -- a row vector with elements that correspond to the parameters of Рi, B, 3 dialogue amplification for each channel, 77 -- a column vector that contains as elements the coefficients 73, 75, 75 of the representation , and 4 is the amplification factor, and 5 p is 1022-11.

Згідно з третім способом, який називають в даному документі сигнально-параметричним гібридом, компонент 206 посилення діалогу може поєднувати будь-який з першого і другого способів з передачею додаткового звукового сигналу (хвильового сигналу), який представляє діалог. Останній, як правило, кодують з низькою бітовою швидкістю, що призводить до появи добре чутних артефактів при його окремому прослуховуванні. В залежності від властивостей сигналів каналів 218 і діалогу, і від бітової швидкості передачі даних, призначеної для кодування хвильового сигналу діалогу, кодер також визначає параметр змішування, Ус, який вказує, як слід розділяти внески підсилення між параметричним вкладом (з першого або другого способу) і додатковим звуковим сигналом, який представляє діалог.According to the third method, which is referred to in this document as a signal-parametric hybrid, the dialogue enhancement component 206 may combine any of the first and second methods with the transmission of an additional audio signal (wave signal) that represents the dialogue. The latter, as a rule, is encoded with a low bit rate, which leads to the appearance of clearly audible artifacts when listening to it separately. Depending on the properties of the signals of the channels 218 and dialogue, and on the bit rate of data transmission intended for coding the wave signal of the dialogue, the coder also determines the mixing parameter, Us, which indicates how the gain contributions should be divided between the parametric contribution (from the first or second method) and an additional sound signal that represents the dialogue.

В сполученні з другим способом посилення діалогу в третьому способі можна записати наступним чином:In combination with the second method of strengthening the dialogue in the third method, it can be written as follows:

Ха -Н'щсач ЯН дос РІХ або 1 дастз трі Яготіб ох 82 ті Вр Вз1сті уHa -N'shsach YAN dos RIH or 1 dastz tri Yagotib oh 82 ti Vr Vz1sti u

Хвт | Яз' їз ' рі 1 стар» Я сТз' вз щі т й йHvt | Yaz' iz ' ri 1 star» I sTz' vz shchi t y y

Заст ЯзстасТ В 1 дзстз ва ді стз я де йг-- це додатковий звуковий сигнал, який представляє діалог, причому а й ді - ас (1026 - 1), аз - («й (10 - 1).Zast YazstasT In 1 dzstz va di stz ya de yg-- is an additional sound signal that represents a dialogue, and a and dia - as (1026 - 1), az - («y (10 - 1).

Для комбінації з незалежним від каналів посиленням (першим способом) звуковий сигналFor combination with channel-independent gain (first method) sound signal

Я її г. ї і: тI her g. i i: t

Яся, який представляє діалог, приймають для кожного каналу 218. В запису хбед, посилення діалогу можна записати наступним чином:Yasya, which represents the dialogue, is accepted for each channel 218. In the hbed recording, the amplification of the dialogue can be written as follows:

Хе - ді Во в йіад(рі: дз) Х.He - di Vo in yiad(ri: dz) Kh.

На фіг. 5 представлений декодер 500 згідно з наведеними для прикладу варіантами здійснення. Декодер 500 належить до типу, який декодує ряд сигналів знижувального мікшування, які представляють собою результат знижувального мікшування більшої кількості каналів, з метою наступного відтворення. Іншими словами, декодер 500 відрізняється від декодера, представленого на фіг. 2, тим, що він не виконаний з можливістю відновлення повної конфігурації каналів.In fig. 5 shows a decoder 500 according to the exemplary embodiments. Decoder 500 is of the type that decodes a series of down-mixed signals, which are the result of down-mixing multiple channels, for subsequent playback. In other words, the decoder 500 is different from the decoder shown in FIG. 2, by the fact that it is not made with the possibility of restoring the full configuration of the channels.

Декодер 500 містить компонент 502 приймання і блок 503 посилення діалогу, який містить компонент 504 підвищувального мікшування, компонент 506 посилення діалогу і компонент 508 мікшування.The decoder 500 includes a receiving component 502 and a dialogue amplification unit 503, which includes a component 504 upmixing, a dialogue amplification component 506 and a mixing component 508.

Як пояснено з посиланням на фіг. 2, компонент 502 приймання приймає потік 510 даних і декодує його на його складові, в даному випадку -- в ряд сигналів 512 знижувальногоAs explained with reference to fig. 2, the reception component 502 receives the data stream 510 and decodes it into its components, in this case - into a series of signals 512 of the downlink

Зо мікшування, які представляють собою результат знижувального мікшування більшої кількості каналів (пор. фіг. Та і 15), і параметри для посилення 516 діалогу. В деяких випадках потік 510 даних також містить дані, які відображають параметри 522 мікшування. Наприклад, параметри мікшування можуть утворювати частину параметрів для посилення діалогу. В інших випадках параметри 522 мікшування вже є доступними в декодері 500, наприклад, вони можуть бути жорстко запрограмовані в декодері 500. Вінших випадках параметри 522 мікшування є доступними для декількох наборів параметрів мікшування, і дані в потоці 510 даних надають вказівку на те, який набір з цих декількох наборів параметрів мікшування використовують.From mixing, which is the result of down-mixing of a larger number of channels (cf. Fig. 1 and 15), and parameters for strengthening 516 dialog. In some cases, the data stream 510 also contains data that reflects the mixing parameters 522 . For example, mixing parameters can form part of the dialog enhancement parameters. In other cases, the mixing parameters 522 are already available in the decoder 500, for example, they may be hard-programmed in the decoder 500. In other cases, the mixing parameters 522 are available for multiple sets of mixing parameters, and the data in the data stream 510 provides an indication of which set from these several sets of mixing parameters are used.

Ці параметри для посилення 516 діалогу, як правило, визначені стосовно підмножини ряду каналів. Дані, які ідентифікують підмножину ряду каналів, стосовно якої визначені параметри для посилення діалогу, можна включити в прийнятий потік 510 даних, наприклад, в якості частини параметрів для посилення 516 діалогу. Альтернативно підмножина ряду каналів, стосовно якої визначені параметри для посилення діалогу, може бути жорстко запрограмована в декодері 500. Наприклад, з посиланням на фіг. та, параметри для посилення 516 діалогу можна визначити стосовно каналів Ї, ТЕЇ, підданих знижувальному мікшуванню в сигнал знижувального мікшування, каналу С, який міститься в сигналі знижувального мікшування с, і каналів К, ТЕК, підданих знижувальному мікшуванню в сигнал знижувального мікшування г. З метою ілюстрації припустимо, що діалог є присутнім тільки в каналах І, С і К. Варто відзначити, що параметри для посилення 516 діалогу можна визначити стосовно каналів, які містять діалог, таких як канали Г, С, ЕК, проте можна визначити і стосовно каналів, які не містять діалог, таких як, в даному прикладі, канали ТЕ, ТЕК. Таким чином, фоновий шум в каналі, який містить діалог, можна, наприклад, відняти, використовуючи інший канал без діалогу.These dialog enhancement parameters 516 are typically defined with respect to a subset of a number of channels. Data that identifies a subset of the channel array for which dialog enhancement parameters are defined may be included in the received data stream 510 , for example, as part of the dialog enhancement parameters 516 . Alternatively, a subset of the channel array for which the dialog enhancement parameters are defined may be hard-coded into the decoder 500. For example, with reference to FIG. and, the parameters for dialogue amplification 516 can be determined with respect to channels Y, TEI, subjected to down-mixing into the down-mixing signal, channel C, which is contained in the down-mixing signal c, and channels K, TEK, subjected to down-mixing into the down-mixing signal r. C for the purpose of illustration, let's assume that dialogue is present only in channels I, C and K. It is worth noting that the parameters for strengthening 516 dialogue can be defined in relation to channels that contain dialogue, such as channels G, C, EK, but can also be defined in relation to channels , which do not contain dialogue, such as, in this example, TE, TEK channels. Thus, background noise in a channel that contains dialogue can, for example, be subtracted by using another channel without dialogue.

Підмножину каналів, стосовно якої визначені параметри для посилення 516 діалогу, піддають знижувальному мікшуванню в підмножину 512а ряду сигналів 512 знижувального мікшування. В представленому прикладі підмножина 512а сигналів знижувального мікшування містить сигнали знижувального мікшування с, І ї г. Цю підмножину сигналів 512а знижувального мікшування подають в блок 503 посилення діалогу. Відповідну підмножину 512а сигналів знижувального мікшування можна знайти, наприклад, на основі знання підмножини ряду каналів, стосовно якої визначені параметри для посилення діалогу, і схеми знижувального мікшування.A subset of channels, in relation to which the parameters for enhancing the dialogue 516 are defined, are subjected to down-mixing into a subset 512a of a number of down-mixing signals 512. In the presented example, the subset 512a of the downmixing signals contains the downmixing signals c, I and d. This subset of the downmixing signals 512a is fed to the dialog amplification unit 503. A suitable subset 512a of the downmix signals can be found, for example, based on knowledge of the subset of the channel array for which the dialogue enhancement parameters are defined and the downmix scheme.

Компонент 514 підвищувального мікшування використовує для відновлення каналів, підданих знижувальному мікшуванню в підмножину сигналів 512а знижувального мікшування, параметричні методики, відомі в даній галузі техніки. Відновлення грунтується на параметрах 514 відновлення. Зокрема, компонент 504 підвищувального мікшування відновлює підмножину ряду каналів, стосовно якої визначені параметри для посилення 516 діалогу. В деяких варіантах здійснення компонент 504 підвищувального мікшування відновлює тільки підмножину ряду каналів, стосовно якої визначені параметри для посилення 516 діалогу. Ці наведені для прикладу варіанти здійснення будуть описані з посиланням на фіг. 7. В інших варіантах здійснення компонент 504 підвищувального мікшування на додачу до підмножини ряду каналів, стосовно якої визначені параметри для посилення 516 діалогу, відновлює ще щонайменше один канал. Ці наведені для прикладу варіанти здійснення будуть описані з посиланням на фіг. б.The upmixing component 514 uses parametric techniques known in the art to restore the downmixed channels to a subset of downmix signals 512a. Recovery is based on recovery options 514. In particular, the upmixing component 504 restores a subset of the number of channels for which the parameters for enhancing the dialogue 516 are defined. In some embodiments, the upmixing component 504 restores only a subset of the channel array for which the dialogue enhancement 516 parameters are defined. These exemplary embodiments will be described with reference to FIG. 7. In other embodiments, the upmixing component 504 restores at least one more channel in addition to the subset of the number of channels for which the dialog enhancement 516 parameters are defined. These exemplary embodiments will be described with reference to FIG. b.

Параметри відновлення можуть бути не тільки змінними в часі, а можуть бути і залежними від частоти. Наприклад, параметри відновлення можуть приймати різні значення для різних смуг частот. Це, як правило, підвищує якість відновлених каналів.Recovery parameters can be not only time-varying, but also frequency-dependent. For example, recovery parameters can take different values for different frequency bands. This, as a rule, improves the quality of restored channels.

Як відомо в даній галузі техніки, параметричне підвищувальне мікшування, як правило, може включати формування декорельованих сигналів з вхідних сигналів, підданих підвищувальному мікшуванню, і параметрично відновлює сигнали на основі вхідних сигналів і декорельованих сигналів. (Див., наприклад, книгу "Зраїйа! Ацаїо Ргосеззіпд: МРЕС Зйштоцпа апаAs is known in the art, parametric upmixing can typically involve forming decorrelated signals from upmixed input signals, and parametrically reconstructs the signals based on the input signals and the decorrelated signals. (See, for example, the book "Zrayia! Atsaio Rgosezzipd: MRES Zyshtotspa apa

ОїШйег Арріїсайопе" авторів дУегоєп Вгеераай і СнНтгізюї Раїіег, ІЗВМ:978-9-470-03350-0). Проте компонент 504 підвищувального мікшування переважно виконує параметричне підвищувальнеOiShieg Arriisaiope" by authors DUegoip Vgeeraai and SnNtgizui Raiiieg, ИЗВМ:978-9-470-03350-0). However, the upmixing component 504 mainly performs parametric upmixing

Зо мікшування без використання будь-яких таких декорельованих сигналів. Переваги, отримувані при використанні декорельованих сигналів, в даному випадку зменшуються при наступному знижувальному мікшуванні, виконуваному компонентом 508 мікшування. Тому використання декорельованих сигналів переважно може бути пропущене компонентом 504 підвищувального мікшування, завдяки чому зменшується складність обчислень. Фактично використання при підвищувальному мікшуванні декорельованих сигналів в сполученні з посиленням діалогу призводило б до гіршої якості, оскільки воно могло б спричинити реверберацію декорелятора на діалозі.From mixing without using any such decorrelated signals. The advantages obtained when using decorrelated signals, in this case, are reduced by the subsequent downmixing performed by the mixing component 508. Therefore, the use of decorrelated signals can preferably be omitted by the upmixing component 504, thereby reducing the computational complexity. In fact, using decorrelated signals in upmixing with dialogue amplification would result in poorer quality, as it could cause the decorrelator to reverberate on the dialogue.

Компонент 506 посилення діалогу потім застосовує посилення діалогу до підмножини ряду каналів, стосовно якої визначені параметри для посилення 516 діалогу, з метою отримання щонайменше одного сигналу з посиленим діалогом. В деяких варіантах здійснення сигнал з посиленим діалогом відповідає версіям з посиленим діалогом підмножини ряду каналів, стосовно якої визначені параметри для посилення 516 діалогу. Це буде більш докладно пояснено нижче з посиланням на фіг. 6. В інших варіантах здійснення сигнал з посиленим діалогом відповідає передбаченій і посиленій діалоговій складовій з підмножини ряду каналів, стосовно якої визначені параметри для посилення 516 діалогу. Це буде більш докладно пояснено нижче з посиланням на фіг. 7.The dialog enhancement component 506 then applies the dialog enhancement to a subset of the channel array for which the dialog enhancement parameters 516 are defined, in order to obtain at least one dialog-enhanced signal. In some embodiments, the enhanced dialog signal corresponds to the enhanced dialog versions of a subset of the channel array for which dialog enhancement parameters 516 are defined. This will be explained in more detail below with reference to FIG. 6. In other embodiments, the enhanced dialog signal corresponds to a predicted and enhanced dialog component from a subset of the channel array for which dialog enhancement parameters 516 are defined. This will be explained in more detail below with reference to FIG. 7.

Аналогічно параметрам відновлення параметри для посилення діалогу можуть змінюватись в часі, а також з частотою. Більш докладно, параметри для посилення діалогу можуть приймати різні значення для різних смуг частот. Набір смуг частот, стосовно якого визначені параметри відновлення, може відрізнятись від набору смуг частот, стосовно якого визначені параметри посилення діалогу.Similar to recovery parameters, dialogue enhancement parameters can change over time as well as with frequency. In more detail, parameters for dialogue enhancement can take different values for different frequency bands. The set of frequency bands for which the restoration parameters are defined can be different from the set of frequency bands for which the dialogue enhancement parameters are defined.

Компонент 508 мікшування потім виконує мікшування на основі щонайменше одного сигналу з посиленим діалогом з метою надання версій 520 з посиленим діалогом підмножини 512а сигналів знижувального мікшування. В представленому прикладі версії 520 з посиленим діалогом підмножини 512а сигналів знижувального мікшування мають вид сов, Ірє, Гоє, ЩО відповідає сигналам с, І, г знижувального мікшування, відповідно.The mixing component 508 then mixes the at least one dialogue-enhanced signal to provide dialogue-enhanced versions 520 of the subset 512a of the downmixed signals. In the presented example of the version 520 with enhanced dialogue, the subsets 512a of the downmix signals are of the form owls, Ire, Goye, which correspond to the signals c, I, g of the downmix, respectively.

Мікшування може бути виконане згідно з параметрами 522 мікшування, які описують внесок щонайменше одного сигналу з посиленим діалогом в версії 520 з посиленим діалогом підмножини сигналів 512а знижувального мікшування. В деяких варіантах здійснення, див. фіг. 60 б, вказаний щонайменше один сигнал з посиленим діалогом мікшують разом з каналами, які були відновлені компонентом 504 підвищувального мікшування. В цих випадках параметри 522 мікшування можуть відповідати схемі знижувального мікшування, див. фіг. Та і 1р, яка описує, в які з сигналів 520 знижувального мікшування з посиленим діалогом слід мікшувати кожен канал.Mixing may be performed according to the mixing parameters 522 that describe the contribution of at least one dialogue-enhanced signal to the dialogue-enhanced version 520 of the downmix signal subset 512a. In some embodiments, see fig. 60b, the specified at least one signal with enhanced dialogue is mixed together with the channels that have been restored by the upmixing component 504. In these cases, the 522 mixing parameters may correspond to a down-mixing scheme, see fig. And 1r, which describes which of the 520 downmix signals with enhanced dialogue should be mixed into which each channel should be mixed.

В інших варіантах здійснення, див. фіг. 7, вказаний щонайменше один сигнал з посиленим діалогом мікшують разом з підмножиною 512а сигналів знижувального мікшування. В цьому випадку параметри 522 мікшування можуть відповідати ваговим коефіцієнтам, які описують, як в підмножині 512а сигналів знижувального мікшування слід зважувати щонайменше один сигнал з посиленим діалогом.In other embodiments, see fig. 7, the specified at least one enhanced dialogue signal is mixed together with a subset 512a of the downmix signals. In this case, the downmix parameters 522 may correspond to weights that describe how at least one dialogue-enhanced signal should be weighted in the subset 512a of the downmix signals.

Операція підвищувального мікшування, виконувана компонентом 504 підвищувального мікшування, операція посилення діалогу, виконувана компонентом 506 посилення діалогу, і операція мікшування, виконувана компонентом 508 мікшування, як правило, представляють собою лінійні операції, кожну з яких можна визначити за допомогою матричної операції, тобто за допомогою добутку матриці і вектора. Це є істинним, принаймні, якщо в операції підвищувального мікшування не використовують сигнали декорелятора. Зокрема, матриця, пов'язана з операцією (а підвищувального мікшування, визначається/може бути отримана з параметрів 514 відновлення. Стосовно цього варто відзначити, що використання сигналів декорелятора в операції підвищувального мікшування зрештою є можливим, проте створення декорельованих сигналів тоді не є частиною матричної операції для підвищувального мікшування. Операцію підвищувального мікшування з декореляторами можна розглядати як двоетапний підхід. На першому етапі вхідні сигнали знижувального мікшування подають на матрицю попереднього декорелятора, і кожен з вихідних сигналів після застосовування матриці попереднього декорелятора подають на декорелятор. На другому етапі вхідні сигнали знижувального мікшування і вихідні сигнали з декореляторів подають на матрицю підвищувального мікшування, де коефіцієнти матриці підвищувального мікшування, які відповідають вхідним сигналам знижувального мікшування, утворюють те, що називають "матрицею сухого підвищувального мікшування", а коефіцієнти, які відповідають вихідним сигналам з декореляторів, утворюють те, що називають "матрицею вологого підвищувального мікшування". Кожна підматриця відображається в конфігурацію каналів підвищувального мікшування. Коли сигнали декорелятора не використовують, матриця, пов'язана з операцією підвищувального мікшування, виконана з можливістю дії тільки стосовно вхідних сигналів 512а, а стовпці, які стосуються декорельованих сигналів (матриці вологого підвищувального мікшування), до матриці не включають. Іншими словами, матриця підвищувального мікшування в цьому випадку відповідає матриці сухого підвищувального мікшування. Проте, як відзначено вище, використання сигналів декорелятора в цьому випадку буде, як правило, призводити до гіршої якості.The upmixing operation performed by the upmixing component 504 , the dialog boost operation performed by the dialog enhancement component 506 , and the mixing operation performed by the mixing component 508 are generally linear operations, each of which can be defined by a matrix operation, that is, by product of a matrix and a vector. This is true, at least, if the upmixing operation does not use decorrelator signals. In particular, the matrix associated with the upmixing operation is/can be obtained from the recovery parameters 514. In this regard, it should be noted that the use of decorrelator signals in the upmixing operation is ultimately possible, but the generation of the decorrelated signals is then not part of the matrix operations for upmixing. The upmixing operation with decorrelators can be thought of as a two-stage approach. In the first stage, the downmixing inputs are applied to the predecorrelator matrix, and each of the outputs after applying the predecorrelator matrix is applied to the decorrelator. In the second stage, the downmixing inputs and the output signals from the decorrelators are fed to an upmixing matrix, where the upmixing matrix coefficients corresponding to the downmixing inputs form what is called a "dry upmixing matrix", and coefficients corresponding to the outputs from the decorrelators form what is called a "wet upmix matrix". Each submatrix is mapped to a configuration of upmix channels. When the decorrelator signals are not used, the matrix associated with the upmixing operation is made with the ability to act only on the input signals 512a, and the columns that relate to the decorrelated signals (wet upmixing matrix) are not included in the matrix. In other words, the upmixing matrix in this case corresponds to the dry upmixing matrix. However, as noted above, the use of decorrelator signals in this case will, as a rule, lead to worse quality.

Матриця, пов'язана з операцією (МУ посилення діалогу, визначається/може бути отримана з параметрів для посилення 516 діалогу, а матриця, пов'язана з операцією ща. мікшування, визначається/може бути отримана з параметрів 522 мікшування.The matrix associated with the dialog gain operation (MU) is determined/can be obtained from the dialog gain parameters 516, and the matrix associated with the mixing operation is determined/can be obtained from the mixing parameters 522.

Оскільки операція підвищувального мікшування, операція посилення діалогу і операція мікшування всі є лінійними операціями, відповідні матриці можуть бути об'єднані, за допомогою матричного множення, в єдину матрицю Е (тоді ХрЕ ЕС Х причому Е - СА, Тут Х -- вектор-стовпець сигналів 512а знижувального мікшування, і Хвк -- вектор-стовпець сигналів 520 знижувального мікшування з посиленням діалогу. Таким чином, весь блок 503 посилення діалогу може відповідати єдиній матричній операції, застосовуваній до підмножини 512а сигналів знижувального мікшування з метою отримання версій 520 з посиленим діалогом вказаної підмножини 512а сигналів знижувального мікшування. Відповідно, способи, описані в даному документі, можна реалізувати надзвичайно ефективним чином.Since the upmixing operation, the dialog boosting operation, and the mixing operation are all linear operations, the corresponding matrices can be combined, by means of matrix multiplication, into a single matrix E (then ХрЕ ЕС Х and Э is АА, Here Х is a column vector downmix signals 512a, and Hvk is a column vector of dialogue-enhanced downmix signals 520. Thus, the entire dialogue-enhancement block 503 may correspond to a single matrix operation applied to a subset 512a of the down-mix signals to produce dialogue-enhanced versions 520 of said downmix signal subsets 512a Accordingly, the methods described herein can be implemented in an extremely efficient manner.

На фіг. 6 представлений декодер 600, який відповідає одному з наведених для прикладу варіантів здійснення декодера 500, представленого на фіг. 5. Декодер 600 містить компонент 602 приймання, компонент 604 підвищувального мікшування, компонент 606 посилення діалогу і компонент 608 мікшування.In fig. 6 shows a decoder 600 that corresponds to one of the exemplary embodiments of the decoder 500 shown in FIG. 5. Decoder 600 includes a receiving component 602 , an upmixing component 604 , a dialogue enhancement component 606 , and a mixing component 608 .

Аналогічно декодеру 500, представленому на фіг. 5, компонент 602 приймання приймає потік 610 даних і декодує його в ряд сигналів 612 знижувального мікшування, параметри 614 відновлення і параметри для посилення 616 діалогу.Similarly to the decoder 500 shown in fig. 5, the receiving component 602 receives the data stream 610 and decodes it into a series of downmix signals 612 , recovery parameters 614 , and dialog enhancement parameters 616 .

Компонент 604 підвищувального мікшування приймає підмножину 612а (яка відповідає підмножині 512а) ряду сигналів 612 знижувального мікшування. Для кожного з сигналів знижувального мікшування в підмножині 612а компонент 604 підвищувального мікшування відновлює всі канали, які були піддані знижувальному мікшуванню в цьому сигналі знижувального мікшування (Хе - СХ), Це включає канали 618а, стосовно яких визначені параметри для посилення діалогу, і канали 618Б, які не потрібно долучати до посилення діалогу. З посиланням на фіг. 165, канали 6б18а, стосовно яких визначені параметри для посилення діалогу, можуть, наприклад, відповідати каналам Г, І 5, С, К, К5, а канали 6186, які не потрібно долучати до посилення діалогу, можуть відповідати каналам І В, КВ.The upmix component 604 receives a subset 612a (corresponding to the subset 512a) of the downmix signal series 612. For each of the downmix signals in the subset 612a, the upmix component 604 restores all the channels that were downmixed in that downmix signal (Xe - CX). This includes channels 618a for which parameters are defined for dialogue enhancement, and channels 618B, which do not need to be included to enhance the dialogue. With reference to fig. 165, channels 6b18a, in relation to which the parameters for strengthening the dialogue are defined, can, for example, correspond to channels Г, И 5, С, К, К5, and channels 6186, which do not need to be included in strengthening the dialogue, can correspond to channels И В, КВ.

Канали 618а, стосовно яких визначені параметри для посилення діалогу С, потім піддають посиленню діалогу за допомогою компонента 606 посилення діалогу (Я. - М. Хі тоді як канали 6186, які не потрібно долучати до посилення діалогу СХ, обходять компонент 606 посилення діалогу.Channels 618a, in respect of which the parameters for dialogue enhancement C are defined, are then subject to dialogue enhancement using the dialogue enhancement component 606 (Y. - M. Hi, while channels 6186, which do not need to be included in the dialogue enhancement CX, bypass the dialogue enhancement component 606.

Компонент 606 посилення діалогу може використовувати будь-який з першого, другого і третього способів посилення діалогу, описаних вище. В разі використання третього способу потік 610 даних може, як пояснено вище, містити звуковий сигнал, який представляє діалог (тобто кодований хвильовий сигнал, який представляє діалог), який належить використати при посиленні діалогу разом с підмножиною 618а ряду каналів, стосовно якої визначені параметри для посилення діалогуThe dialog enhancement component 606 may use any of the first, second, and third dialog enhancement methods described above. In the case of using the third method, the data stream 610 may, as explained above, contain an audio signal that represents dialogue (ie, a coded wave signal that represents dialogue) to be used in amplifying the dialogue together with a subset 618a of the channel array for which parameters are defined for strengthening the dialogue

Ще р.а у - дж. (х.-м ТОStill r.a y - j. (kh.-m TO

В результаті компонент 606 посилення діалогу видає сигнали 619 з посиленим діалогом, які в даному випадку відповідають версіям з посиленим діалогом підмножини 618а каналів, стосовно якої визначені параметри для посилення діалогу. Для прикладу, сигнали 619 з посиленим діалогом можуть відповідати версіям з посиленим діалогом каналів І, І 5, С, К, К5, представлених на фіг. 16.As a result, the dialogue enhancement component 606 outputs dialogue-enhanced signals 619, which in this case correspond to the dialogue-enhanced versions of the subset 618a of the channels for which the dialogue enhancement parameters are defined. For example, the enhanced dialog signals 619 may correspond to the enhanced dialog versions of channels I, I5, C, K, K5 shown in FIG. 16.

Компонент 608 мікшування потім мікшує сигнали 619 з посиленим діалогом разом з їв Хе ! | | (Хр С хг) каналами 618р, які не були долучені до посилення діалогу "» зі" з метою отримання версій 620 з посиленим діалогом підмножини 612а сигналів знижувального мікшування. Компонент 608 мікшування виконує мікшування згідно з поточною схемою знижувального мікшування, такою як схема знижувального мікшування, представлена на фіг. 15. В цьому випадку параметри 622 мікшування, таким чином, відповідають схемі знижувального мікшування, яка описує, в який сигнал 620 знижувального мікшування слід мікшувати кожний канал 619, 6186. Схема знижувального мікшування може бути статичною іThe mixing component 608 then mixes the enhanced dialogue signals 619 together with the Yew Heh ! | | (Xr C xg) channels 618r, which were not included in the dialogue enhancement "» with" in order to obtain versions 620 with enhanced dialogue of the subset 612a of downmixing signals. The mixing component 608 performs mixing according to the current down-mixing scheme, such as the down-mixing scheme shown in FIG. 15. In this case, the downmixing parameters 622 thus correspond to the downmixing scheme that describes which downmixing signal 620 each channel 619, 6186 should be mixed into. The downmixing scheme can be static and

Зо через це відомою декодеру 600, що означає, що завжди використовують одну й ту саму схему знижувального мікшування, або ж схема знижувального мікшування може бути динамічною, що означає, що вона може змінюватись від кадру до кадру, або вона може представляти собою одну з декількох схем, відомих в декодері. В останньому випадку в потік 610 даних включають вказівку стосовно схеми знижувального мікшування.This is known to the decoder 600, which means that the same down-mixing scheme is always used, or the down-mixing scheme can be dynamic, meaning that it can change from frame to frame, or it can be one of several schemes known in the decoder. In the latter case, the data stream 610 includes an indication of the down-mixing scheme.

На фіг. 6 декодер обладнаний необов'язковим компонентом 630 перемикання. Компонент 630 перемикання може бути використаний для переходу між різними схемами знижувального мікшування, наприклад, для переходу від схеми 1006 до схеми 100ба. Варто відзначити, що компонент 630 перемикання, як правило, залишає без змін сигнали с і Ме, тобто стосовно цих сигналів він діє як транзитний компонент. Компонент 630 перемикання може виконувати приймання і діяти (не показано) на основі різних параметрів, таких як, наприклад, параметри 614 відновлення і параметри для посилення 616 діалогу.In fig. 6, the decoder is equipped with an optional switching component 630. Switching component 630 can be used to transition between different downmixing schemes, for example, to transition from scheme 1006 to scheme 100ba. It is worth noting that the switching component 630, as a rule, leaves the signals c and Me unchanged, that is, with respect to these signals, it acts as a transit component. The switching component 630 may receive and act (not shown) on the basis of various parameters, such as, for example, recovery parameters 614 and parameters for enhancing dialogue 616 .

На фіг. 7 представлений декодер 700, який відповідає одному з наведених для прикладу варіантів здійснення декодера 500, представленого на фіг. 5. Декодер 700 містить компонент 702 приймання, компонент 704 підвищувального мікшування, компонент 706 посилення діалогу і компонент 708 мікшування.In fig. 7 shows a decoder 700 that corresponds to one of the exemplary embodiments of the decoder 500 shown in FIG. 5. Decoder 700 includes a receiving component 702 , an upmixing component 704 , a dialogue enhancement component 706 , and a mixing component 708 .

Аналогічно декодеру 500, представленому на фіг. 5, компонент 702 приймання приймає потік 710 даних і декодує його в ряд сигналів 712 знижувального мікшування, параметри 714 відновлення і параметри для посилення 716 діалогу.Similarly to the decoder 500 shown in fig. 5, the receiving component 702 receives the data stream 710 and decodes it into a series of down-mix signals 712 , recovery parameters 714 , and dialog amplification parameters 716 .

Компонент 704 підвищувального мікшування приймає підмножину 712а (яка відповідає підмножині 512а) ряду сигналів 712 знижувального мікшування. На відміну від варіанту здійснення, описаного стосовно фіг. б, компонент 704 підвищувального мікшування відновлює лише підмножину 718а ряду каналів, стосовно якої визначені параметри для посилення 716 діалогу ( у ой З посиланням на фіг. 160, канали 718а, стосовно яких визначені параметри для посилення діалогу, можуть, наприклад, відповідати каналам С, І, І 5, К, К5.The upmix component 704 receives a subset 712a (corresponding to the subset 512a) of the downmix signal series 712. Unlike the embodiment described in relation to fig. b, the upmixing component 704 restores only the subset 718a of the range of channels for which the parameters for dialogue enhancement 716 are defined (in o. With reference to Fig. 160, the channels 718a for which the parameters for dialogue enhancement are defined may, for example, correspond to channels C, I, I 5, K, K5.

Компонент 706 посилення діалогу потім виконує посилення діалогу на каналах 718а, стосовно яких визначені параметри для посилення діалогу (Ха - Ме: Хі В цьому випадку компонент 706 посилення діалогу приступає до передбачення діалогової складової на основі каналів 7184 шляхом формування лінійної комбінації каналів 718а згідно з другим способом посилення діалогу. Коефіцієнти, використовувані при формуванні цієї лінійної комбінації, позначені на фіг. 7 як рі---ро5, містяться в параметрах для посилення 716 діалогу. Передбачену діалогову складову потім піддають посиленню шляхом множення на коефіцієнт д підсилення для отримання сигналу 719 з посиленим діалогом. Коефіцієнт д підсилення можна виразити як:The dialogue enhancement component 706 then performs dialogue enhancement on the channels 718a for which the dialogue enhancement parameters are defined (Xa - Me: Xi In this case, the dialogue enhancement component 706 proceeds to predict the dialogue component based on the channels 7184 by forming a linear combination of the channels 718a according to the second by the dialog enhancement method. The coefficients used in forming this linear combination, denoted in Fig. 7 as ri---ro5, are contained in the dialog enhancement parameters 716. The predicted dialog component is then amplified by multiplying by a gain factor d to obtain a signal 719 with the amplification factor d can be expressed as:

Ге д - 1028-11 де сб -- коефіцієнт підсилення при посиленні діалогу, виражений в дБ. Коефіцієнт о підсилення при посиленні діалогу може, наприклад, бути введений користувачем, і тому він, як правило, не включений в потік 710 даних. Варто відзначити, що в випадку, коли існує декілька діалогових складових, описана вище процедура здійснення передбачення і посилення може бути застосована один раз для кожної діалогової складової.Ge d - 1028-11 where sb is the amplification factor when amplifying the dialogue, expressed in dB. The gain factor for dialogue amplification may, for example, be entered by the user, and therefore it is typically not included in the data stream 710. It is worth noting that in the case where there are several dialog components, the above-described prediction and amplification procedure can be applied once for each dialog component.

Передбачений сигнал 719 з посиленим діалогом (тобто передбачені і піддані посиленню діалогові складові) потім мікшують в підмножину 712а сигналів знижувального мікшування з метою отримання версій 720 з посиленим діалогом підмножини 712а сигналів знижувального бокс) мікшування СЕ Х / Мікшування виконують згідно з параметрами 722 мікшування, які описують внесок сигналу 719 з посиленим діалогом в версії 720 з посиленим діалогом підмножини сигналів знижувального мікшування. Параметри мікшування, як правило, містяться в потоці 710 даних. В цьому випадку параметри 722 мікшування відповідають ваговим коефіцієнтам г", г2, їз, які описують, як в підмножину 712а сигналів знижувального мікшування слід зважувати щонайменше один сигнал 719 з посиленим діалогом: т т- 100 іоThe predicted dialogue-enhanced signal 719 (that is, the predicted and amplified dialogue components) is then mixed into a subset 712a of the downmix signals in order to obtain the dialog-enhanced versions 720 of the subset 712a of the downbox signals) mixing CE X / Mixing is performed with the parameters 722 of mixing, which according to describe the contribution of the dialog-enhanced signal 719 to the dialog-enhanced version 720 of the downmix signal subset. Mixing parameters are typically contained in the data stream 710. In this case, the mixing parameters 722 correspond to the weighting factors г", г2, из, which describe how at least one signal 719 with enhanced dialogue should be weighted in the subset 712a of the downmixing signals: т т- 100 ио

Хрв - Х Е "Ха - Е 01 | мHrv - X E "Xa - E 01 | m

ТЗ Кк ) шеТZ Кк ) ше

Ка Ка 0 й 1 ХіKa Ka 0 and 1 Hi

Більш докладно, вагові коефіцієнти можуть відповідати коефіцієнтам представлення, які описують панорамування щонайменше одного сигналу 719 з посиленим діалогом стосовно підмножини 712а сигналів знижувального мікшування, так що сигнал 719 з посиленим діалогом додають до сигналів 712а знижувального мікшування в правильних просторових позиціях.In more detail, the weights may correspond to representation factors that describe the panning of the at least one dialogue-enhanced signal 719 with respect to a subset 712a of the downmix signals, so that the dialogue-enhanced signal 719 is added to the downmix signals 712a in the correct spatial positions.

Коефіцієнти представлення (параметри 722 мікшування) в потоці 710 даних можуть відповідати каналам 718а, підданим підвищувальному мікшуванню. В представленому прикладі є п'ять каналів 718а, підданих підвищувальному мікшуванню, і, таким чином, може бути п'ять відповідних коефіцієнтів представлення гс1, гс2,..., по5. Значення І1, г2, гЗ (що відповідає сигналам 712а знижувального мікшування) можуть потім бути обчислені з гс1, гс2,..., го5 в сполученні зі схемою знижувального мікшування. Якщо одному і тому ж сигналу 712а знижувального мікшування відповідає декілька каналів 718а, то коефіцієнти представлення діалогу можуть бути підсумовані. Наприклад, в представленому прикладі виходить, що г1:2гсС1, г2го2ягоЗ3, і г3-гс4-го5. У випадку, якщо знижувальне мікшування каналів було виконане з використанням коефіцієнтів знижувального мікшування, це також може бути зважене підсумовування.The representation coefficients (mixing parameters 722) in the data stream 710 may correspond to the upmixed channels 718a. In the presented example, there are five channels 718a subjected to upmixing, and thus there may be five corresponding representation coefficients gs1, gs2,..., po5. The values of I1, g2, gZ (corresponding to the downmix signals 712a) can then be calculated from gs1, gs2, . . . , go5 in conjunction with the downmix circuit. If multiple channels 718a correspond to the same downmix signal 712a, then the dialogue representation coefficients can be summed. For example, in the presented example, it turns out that г1:2гсС1, г2го2ягоЗ3, and г3-гс4-го5. In case the channels were downmixed using downmixing coefficients, this can also be a weighted summation.

Варто відзначити, що в даному випадку компонент 706 посилення діалогу може також використовувати додатково прийнятий звуковий сигнал, який представляє діалог. В такому випадку передбачений сигнал 719 з посиленим діалогом може бути зважений разом із звуковим сигналом, який представляє діалог, перед подачею в компонент 708 мікшуванняIt is worth noting that in this case, the dialog enhancement component 706 may also use an additional received audio signal that represents the dialog. In such a case, the predicted dialogue-enhanced signal 719 may be weighted together with the audio signal representing the dialogue before being fed to the mixing component 708

Са - (1 - ай Ма Ха бо Відповідне зважування забезпечується параметром Ус змішування, включеним до параметрів для посилення 716 діалогу. Параметр Ус змішування вказує, як слід розділяти внески підсилення між передбаченою діалоговою складовою 719 (описаною вище) і додатковим звуковим сигналом, який представляє діалог Ос.Sa - (1 - ai Ma Ha bo Appropriate weighting is provided by the Us Mixing parameter included in the parameters for dialogue amplification 716. The Us Mixing parameter indicates how the gain contributions should be divided between the intended dialogue component 719 (described above) and the additional audio signal that represents dialogue Os.

Це аналогічно тому, що було описано стосовно третього способу посилення діалогу при його сполученні з другим способом посилення діалогу.This is similar to what was described about the third method of dialogue amplification when it is combined with the second method of dialogue amplification.

На фіг, 7 декодер обладнаний необов'язковим компонентом 730 перемикання.In Fig. 7, the decoder is equipped with an optional switching component 730.

Компонент 730 перемикання може бути використаний для переходу між різними схемами знижувального мікшування, наприклад, для переходу від схеми 1006 до схеми 100а. Варто відзначити, що компонент 730 перемикання, як правило, залишає без змін сигнали с і Ме, тобто стосовно цих сигналів він діє як транзитний компонент. Компонент 730 перемикання може виконувати приймання і діяти (не показано) на основі різних параметрів, таких як, наприклад, параметри 714 відновлення і параметри для посилення 716 діалогу.Switching component 730 may be used to transition between different downmixing schemes, for example, to transition from scheme 1006 to scheme 100a. It is worth noting that the switching component 730, as a rule, leaves the c and Me signals unchanged, that is, with respect to these signals, it acts as a transit component. The switching component 730 may receive and act (not shown) on the basis of various parameters, such as, for example, recovery parameters 714 and parameters for enhancing dialogue 716 .

Наведене вище було головним чином пояснено стосовно конфігурації каналів 7.14 і конфігурації знижувального мікшування 5.1. Проте слід розуміти, що принципи декодерів і способів декодування, описані в даному документі, рівною мірою застосовні і до інших конфігурацій каналів і знижувального мікшування.The above was mainly explained in relation to channel configuration 7.14 and downmix configuration 5.1. However, it should be understood that the principles of decoders and decoding methods described in this document are equally applicable to other channel configurations and downmixing.

Фіг. 8 представляє собою ілюстрацію кодера 800, який може бути використаний для кодування ряду каналів 818, деякі з яких містять діалог, з метою отримання потоку 810 даних для передачі в декодер. Кодер 800 можна використовувати з будь-яким з декодерів 200, 500, 600, 700. Кодер 800 містить компонент 805 знижувального мікшування, компонент 806 кодування посилення діалогу, компонент 804 параметричного кодування і компонент 802 передачі.Fig. 8 is an illustration of an encoder 800 that can be used to encode a number of channels 818, some of which contain dialogue, to obtain a data stream 810 for transmission to the decoder. Encoder 800 may be used with any of decoders 200, 500, 600, 700. Encoder 800 includes a down-mixing component 805, a dialogue enhancement coding component 806, a parametric coding component 804, and a transmission component 802.

Кодер 800 приймає ряд каналів 818, наприклад, канали з конфігурацій 100а, 1006 каналів, представлених на фіг. Та їі 165.Encoder 800 receives a number of channels 818, for example, channels from configurations 100a, 1006 channels shown in FIG. But she is 165.

Компонент 805 знижувального мікшування виконує знижувальне мікшування ряду каналів 818 в ряд сигналів 812 знижувального мікшування, які потім подають в компонент 802 передачі для включення в потік 810 даних. Ряд каналів 818 можна, наприклад, піддати знижувальному мікшуванню згідно зі схемою знижувального мікшування, такою як схема, представлена на фіг. 1а або на фіг. 1р.Downmixing component 805 performs downmixing of a number of channels 818 into a number of downmixing signals 812, which are then fed to transmission component 802 for inclusion in data stream 810. A number of channels 818 may, for example, be down-mixed according to a down-mixing scheme such as that shown in FIG. 1a or fig. 1 year

Ряд каналів 818 і сигнали 812 знижувального мікшування вводять в компонент 804 параметричного кодування. На основі своїх вхідних сигналів компонент 804 параметричного кодування обчислює параметри 814 відновлення, які дають можливість відновлення каналів 818 з сигналів 812 знижувального мікшування. Параметри 814 відновлення можуть бути обчислені, наприклад, з використанням алгоритмів оптимізації мінімальної середньоквадратичної похибки (ММ5Е), як відомо в даній галузі техніки. Параметри 814 відновлення потім подають в компонент 802 передачі для включення в потік 810 даних.A number of channels 818 and downmix signals 812 are input to the parametric coding component 804. Based on its input signals, the parametric coding component 804 calculates recovery parameters 814 that enable recovery of channels 818 from downmix signals 812 . Recovery parameters 814 can be calculated, for example, using minimum mean square error (MMS) optimization algorithms as known in the art. The recovery parameters 814 are then fed to the transmission component 802 for inclusion in the data stream 810 .

Компонент 806 кодування посилення діалогу обчислює параметри для посилення 816 діалогу на основі одного або більше з ряду каналів 818 і одного або більше сигналів 813 діалогу. Сигнали 813 діалогу представляють діалог в чистому вигляді. Зокрема, діалог є вже мікшованим в один або більше каналів 818. В каналах 818, таким чином, може бути одна або більше діалогових складових, які відповідають сигналам 813 діалогу. Як правило, компонент 806 кодування посилення діалогу обчислює параметри для посилення 816 діалогу з використанням алгоритмів оптимізації мінімальної середньоквадратичної похибки (ММ5Е). Ці алгоритми можуть надати параметри, які дозволяють передбачати сигнали 813 діалогу зважаючи на деякі з ряду каналів 818. Ці параметри для посилення 816 діалогу можуть, таким чином, бути визначені стосовно підмножини ряду каналів 818, а саме стосовно тих, з яких можна передбачити сигнали 813 діалогу. Параметри для передбачення 816 діалогу подають в компонент 802 передачі для включення в потік 810 даних.The dialogue enhancement coding component 806 calculates parameters for dialogue enhancement 816 based on one or more of a number of channels 818 and one or more dialogue signals 813 . Dialog signals 813 represent dialog in its purest form. In particular, the dialog is already mixed into one or more channels 818. In the channels 818, thus, there may be one or more dialog components that correspond to the signals 813 of the dialog. Typically, the dialog enhancement coding component 806 calculates parameters for dialog enhancement 816 using least mean square error (MSE) optimization algorithms. These algorithms may provide parameters that enable the prediction of dialog signals 813 given some of the channel array 818. These dialog enhancement parameters 816 may thus be determined with respect to a subset of the channel array 818, namely those from which the signals 813 can be predicted. dialogue The parameters for prediction 816 of the dialog are submitted to the transmission component 802 for inclusion in the data stream 810.

На завершення, потік 810 даних, таким чином, принаймні містить ряд сигналів 812 знижувального мікшування, параметри 814 відновлення і параметри для посилення 816 діалогу.Finally, the data stream 810 thus at least includes a number of down-mix signals 812 , recovery parameters 814 , and dialogue enhancement parameters 816 .

Під час нормальної роботи декодера значення параметрів різних типів (таких як параметри для посилення діалогу або параметри відновлення) неодноразово приймаються декодером з певними частотами. Якщо частоти, з якими приймають значення різних параметрів, нижче ніж частота, з якою потрібно обчислювати вихід з декодера, то значення параметрів може бути необхідно інтерполювати. Якщо відомо, що значення узагальненого параметра Р в точках піDuring normal decoder operation, parameter values of various types (such as dialog enhancement parameters or recovery parameters) are repeatedly received by the decoder at specific frequencies. If the frequencies at which the values of the various parameters are received are lower than the frequency at which the output from the decoder is to be calculated, then the values of the parameters may need to be interpolated. If it is known that the value of the generalized parameter P at points pi

Ї2 в часі дорівнює, відповідно, КУ213 і Рі: то значення ра) цього параметра в проміжний момент часу її БВ З 2 можна обчислити, використовуючи різні схеми інтерполяції. Один приклад такої схеми, яку в даному документі називають лінійною схемою інтерполяції, може обчислювати проміжне значення з використанням лінійної інтерполяції, наприклад рі) - ра) ЇрРС:) ро 13/К2: - 13), |нша схема, яку в даному документі називають кусково-постійною схемою інтерполяції, може замість цього включати підтримування значення параметра прив'язаним до одного з відомих значень протягом всього інтервалу часу, наприклад, РО) - в) або РК) - (22) або до комбінації відомих значень, такої як, наприклад, середнє значення во) - Гр) раз ЛИ, Інформацію про те, яку зі схем інтерполяції необхідно використовувати для певного типу параметрів протягом певного проміжку часу, можна включити в декодер або надати в декодер різними способами, як,Y2 in time is equal, respectively, to КУ213 and Ри: then the value ра) of this parameter at an intermediate moment of time of its BV Z 2 can be calculated using various interpolation schemes. One example of such a scheme, referred to herein as a linear interpolation scheme, can calculate an intermediate value using linear interpolation, such as piecewise-constant interpolation scheme, may instead involve keeping the parameter value tied to one of the known values throughout the time interval, e.g., РО) - c) or РК) - (22) or to a combination of known values, such as e.g. , the average value of v) - Gr) times LI, Information about which of the interpolation schemes should be used for a certain type of parameters during a certain period of time can be included in the decoder or provided to the decoder in various ways, as,

наприклад, разом з самими параметрами або в якості додаткової інформації, яка міститься в прийнятому сигналі.for example, together with the parameters themselves or as additional information contained in the received signal.

В одному з ілюстративних прикладів декодер приймає значення параметрів для параметрів першого і другого типу. Прийняті значення параметрів кожного типу є точно застосовними, відповідно, в першій (Т1-4И11, 72, М3, ...)3) ії другій (Т2-421, 122, 123, ...)) множинах моментів часу, і декодер також має доступ до інформації про те, як слід інтерполювати значення параметрів кожного типу у випадку, коли значення необхідно оцінити в момент часу, відсутній у відповідній множині. Значення параметрів управляють кількісними властивостями математичних операцій над сигналами, і ці операції можуть, наприклад, бути представлені у вигляді матриць. В наступному прикладі припускають, що операція, керована параметрами першого типу, представлена першою матрицею А, операція, керована параметрами другого типу, представлена другою матрицею В, і в даному прикладі терміни "операція" і "матриця" можуть бути використані взаємозамінним чином. В момент часу, в який необхідно обчислити вихідне значення з декодера, необхідно обчислити об'єднану операцію обробки даних, яка відповідає композиції обох операцій. Також припускають, що матриця А представляє собою операцію підвищувального мікшування (керовану параметрами відновлення), і що матриця В представляє собою операцію застосування посилення діалогу (керовану параметрами для посилення діалогу), і тоді, відповідно, об'єднана операція обробки підвищувального мікшування з наступним посиленням діалогу представлена матричним добутком ВА.In one illustrative example, the decoder accepts parameter values for parameters of the first and second type. The accepted parameter values of each type are exactly applicable, respectively, in the first (T1-4И11, 72, M3, ...)3) and second (T2-421, 122, 123, ...)) sets of time moments, and the decoder also has access to information about how parameter values of each type should be interpolated in the event that the value needs to be evaluated at a point in time not present in the corresponding set. Parameter values control the quantitative properties of mathematical operations on signals, and these operations can, for example, be represented in the form of matrices. In the following example, it is assumed that the operation controlled by the parameters of the first type is represented by the first matrix A, the operation controlled by the parameters of the second type is represented by the second matrix B, and in this example the terms "operation" and "matrix" can be used interchangeably. At the time when it is necessary to calculate the output value from the decoder, it is necessary to calculate the combined operation of data processing, which corresponds to the composition of both operations. It is also assumed that matrix A represents an upmixing operation (controlled by restoration parameters) and that matrix B represents an application of dialog enhancement (controlled by parameters for dialog enhancement), and then, accordingly, the operation of upmixing processing followed by amplification is combined dialogue is represented by the matrix product BA.

Способи обчислення об'єднаних операцій обробки представлені на фіг. За--9е, де час проходить вздовж горизонтальної осі, а поділки осі вказують моменти часу, в які необхідно обчислити об'єднану операцію обробки (моменти часу виводу). На фігурах трикутники відповідають матриці А (яка представляє операцію підвищувального мікшування), кола -- матриці В (яка представляє операцію використання посилення діалогу), а квадрати -- матриціMethods of calculating the combined processing operations are presented in fig. For--9e, where time passes along the horizontal axis, and the divisions of the axis indicate the moments of time at which it is necessary to calculate the combined processing operation (moments of output time). In the figures, triangles correspond to matrix A (representing the upmixing operation), circles to matrix B (representing the use of dialogue enhancement), and squares to matrices

ВА об'єднаної операції (яка представляє об'єднану операцію підвищувального мікшування з наступним посиленням діалогу). Зафарбовані трикутники і кола вказують на те, що відповідна матриця є точно відомою (тобто що точно відомі параметри, які управляють операцією, яку представляє матриця) у відповідний момент часу, тоді як незафарбовані трикутники і кола вказують на те, що значення відповідної матриці є передбаченим, або інтерпольованимBA of the combined operation (which represents the combined operation of upmixing followed by dialogue amplification). Colored triangles and circles indicate that the corresponding matrix is precisely known (that is, that the parameters governing the operation represented by the matrix are precisely known) at the corresponding instant in time, while uncolored triangles and circles indicate that the value of the corresponding matrix is predicted , or interpolated

Зо (наприклад, з використанням будь-якої з описаних вище схем інтерполяції). Зафарбований квадрат вказує на те, що матриця ВА об'єднаної операції була обчислена, у відповідний момент часу, наприклад, матричним добутком матриць А і В, а незафарбований квадрат вказує на те, що значення ВА було інтерпольоване з більш раннього моменту часу. Крім того, пунктирні стрілки вказують, між якими моментами часу виконується інтерполяція. Нарешті, суцільна горизонтальна лінія, яка поєднує моменти часу, вказує, що значення матриці в даному інтервалі припускають кусково-постійним.Zo (for example, using any of the interpolation schemes described above). A colored square indicates that the BA matrix of the combined operation was calculated at the appropriate time, for example, by the matrix product of matrices A and B, and an uncolored square indicates that the BA value was interpolated from an earlier time point. In addition, the dashed arrows indicate between which time points the interpolation is performed. Finally, the solid horizontal line that connects the moments of time indicates that the values of the matrix in this interval are assumed to be piecewise constant.

На фіг. 9а представлений спосіб обчислення об'єднаної операції ВА обробки, яка не передбачає використання даного винаходу. Прийняті значення для операцій А і В точно застосовні в моменти часу, відповідно, 111, 121 їі 42, 122, і для обчислення матриці об'єднаної операції обробки в кожний момент часу виводу цей спосіб інтерполює кожну з матриць окремо.In fig. 9a presents a method of calculating the combined operation of BA processing, which does not involve the use of this invention. The adopted values for operations A and B are exactly applicable at time points 111, 121 and 42, 122, respectively, and to calculate the matrix of the combined processing operation at each output time point, this method interpolates each of the matrices separately.

Для виконання кожного кроку вперед в часі матрицю, яка представляє об'єднану операцію обробки, обчислюють як добуток передбачених значень А і В. Тут припускають, що кожну матрицю належить інтерполювати з використанням лінійної схеми інтерполяції. Якщо матриця А містить М" строк і НІ стовпців, а матриця В містить М строк і А" стовпців, то кожний крок вперед в часі вимагав би ОМ) операцій множення на кожний набір параметрів (для виконання матричного множення, необхідного для обчислення матриці ВА об'єднаної обробки). Тому висока щільність моментів часу виводу і/або більша кількість наборів параметрів створює ризик (через відносно високу обчислювальну складність операції множення в порівнянні з операцією додавання) висування високих вимог до обчислювальних ресурсів. Для зменшення обчислювальної складності можна використати альтернативний спосіб, представлений на фіг. 9р. Шляхом обчислення об'єднаної операції обробки (наприклад, виконання матричного множення) тільки в ті моменти часу, коли значення параметрів змінюються (тобто коли прийняті значення застосовні точно, в И11, 121 і 12, 122), замість інтерполяції матриць А і В окремо можна інтерполювати безпосередньо матрицю ВА об'єднаної операції обробки. Таким чином, якщо операції представлені матрицями, то кожен крок вперед в часі (між моментами часу, в які змінюються точні значення параметрів) вимагатиме лише ОМ) операцій (для складання матриць) на кожен набір параметрів, і зменшена складність обчислення накладатиме менші вимоги на обчислювальні ресурси. Також, якщо матриці А і В є такими, щоFor each step forward in time, the matrix representing the combined processing operation is calculated as the product of the predicted values of A and B. It is assumed here that each matrix is to be interpolated using a linear interpolation scheme. If the matrix A contains M" rows and NO columns, and the matrix B contains M rows and A" columns, then each step forward in time would require OM) multiplication operations on each set of parameters (to perform the matrix multiplication necessary to calculate the matrix BA by combined processing). Therefore, a high density of output time points and/or a larger number of parameter sets creates the risk (due to the relatively high computational complexity of the multiplication operation compared to the addition operation) of placing high demands on computing resources. To reduce the computational complexity, you can use an alternative method, shown in Fig. 9 years By calculating the combined processing operation (for example, performing matrix multiplication) only at those moments of time when the values of the parameters change (that is, when the accepted values are applicable exactly, in I11, 121 and 12, 122), instead of interpolating the matrices A and B separately, it is possible directly interpolate the BA matrix of the combined processing operation. Thus, if the operations are represented by matrices, then each step forward in time (between time instants at which the exact values of the parameters change) will require only OM) operations (to assemble the matrices) on each set of parameters, and the reduced computational complexity will impose lower computational demands resource. Also, if the matrices A and B are such that

М» М х МУСМ М). то матриця, яка представляє об'єднану операцію ВА обробки, буде містити менше елементів, ніж їх знаходиться в окремих матрицях А і В разом. Однак спосіб інтерполяції матриці ВА буде прямо вимагати, щоб як А, так і В були відомими в одні й ті самі моменти часу. Якщо моменти часу, для яких визначено А (принаймні частково), відрізняються від моментів часу, для яких визначено В, то потрібен удосконалений спосіб інтерполяції. Такий удосконалений спосіб згідно з наведеними для прикладу варіантами здійснення даного винаходу представлений на фіг. 9с--9е. В поєднанні з обговоренням фіг. За--9е, для простоти припускають, що матриця ВА об'єднаної операції обробки обчислюється як добуток окремих матриць А ії В, кожна з яких була згенерована на основі (прийнятих або передбачених/інтерпольованих) значень параметрів. В інших ситуаціях може бути рівною мірою або більш переважно обчислювати операцію, яку представляє матриця ВА, безпосередньо із значень параметрів без проходження через представлення у вигляді двох матричних множників. В комбінації з будь-якою з методик, представлених на фіг. 9с--ое, кожний з цих підходів підпадає під обсяг даного винаходу.M» M x MUSM M). then the matrix, which represents the combined operation BA processing, will contain fewer elements than there are in separate matrices A and B together. However, the method of interpolating the BA matrix will explicitly require that both A and B be known at the same instants of time. If the points in time for which A is defined (at least partially) differ from the points in time for which B is defined, then an improved method of interpolation is required. Such an improved method according to the exemplary embodiments of the present invention is shown in Fig. 9c--9e. In conjunction with the discussion of fig. For--9e, for simplicity, it is assumed that the matrix BA of the combined processing operation is calculated as the product of separate matrices A and B, each of which was generated based on (accepted or predicted/interpolated) parameter values. In other situations, it may be equally or more preferable to calculate the operation represented by the BA matrix directly from the parameter values without going through the representation in the form of two matrix multipliers. In combination with any of the techniques presented in fig. 9c--oe, each of these approaches falls within the scope of this invention.

На фіг. 9с представлена ситуація, в якій набір Т1 моментів часу для параметра, який відповідає матриці А, включає значення 112 часу, відсутні в наборі Т2 (моменти часу для параметра, який відповідає матриці В). Обидві матриці необхідно інтерполювати з використанням лінійної схеми інтерполяції і даний спосіб визначає момент (ір-На2 передбачення, для якого необхідно передбачити значення матриці В (наприклад, с використанням інтерполяції). Після того, як це значення було знайдене, шляхом перемноженняIn fig. 9c presents a situation in which the set T1 of moments of time for the parameter that corresponds to the matrix A includes 112 time values that are absent in the set T2 (moments of time for the parameter that corresponds to the matrix B). Both matrices must be interpolated using a linear interpolation scheme and this method determines the moment (ir-Na2 of the prediction for which the value of the matrix B must be predicted (for example, using interpolation). After this value has been found, by multiplying

А ії В можна обчислити значення матриці ВА об'єднаної операції обробки в момент ір. В продовження спосіб обчислює значення ВА в суміжний момент часу 14-11, а потім інтерполюєA and B can calculate the value of the matrix BA of the combined processing operation at the moment ir. In continuation, the method calculates the VA value at the adjacent time point 14-11, and then interpolates

ВА між із і їр. Спосіб також може за необхідності обчислювати значення ВА в інший суміжний момент часу 14-13 і інтерполювати ВА від їр до їз. И хоча вимагається додаткове матричне множення (в момент ір-ї12), спосіб дозволяє інтерполювати матрицю ВА об'єднаної операції обробки прямо, все ж зменшуючи обчислювальну складність в порівнянні, наприклад, зі способом, представленим на фіг. З9а. Як заявлено вище, об'єднану операцію обробки альтернативно можна обчислити безпосередньо З (прийнятих або передбачених/інтерпольованих) значень параметрів, а не як добуток двох матриць в явному вигляді, які, в свою чергу, залежать від значень відповідних параметрів.VA between iz and ir. The method can also, if necessary, calculate the VA value at another adjacent point in time 14-13 and interpolate VA from yir to yiz. And although an additional matrix multiplication is required (at the moment ir-i12), the method allows you to interpolate the BA matrix of the combined processing operation directly, still reducing the computational complexity in comparison, for example, with the method presented in fig. C9a. As stated above, the combined processing operation can alternatively be calculated directly from the (accepted or predicted/interpolated) values of the parameters, rather than as a product of two matrices in explicit form, which in turn depend on the values of the corresponding parameters.

В попередньому випадку тільки тип параметрів, який відповідає А, мав моменти часу, які не знаходились серед моментів часу типу параметрів, який відповідає В. На фіг. 9а представлена відмінна ситуація, в якій момент 112 часу є відсутнім в наборі 12, і в якій момент часу 122 є відсутнім в наборі Т1. Якщо значення ВА потрібно обчислити в проміжний момент часу ї" між 72 і 122, то спосіб може передбачати як значення В в момент їр-й2, так і значення А в момент 143-422. Після обчислення матриці ВА об'єднаної операції обробки в обидва моменти часу ВА можна інтерполювати, щоб знайти її значення в момент !". В цілому, спосіб виконує множення матриць тільки в моменти часу, коли змінюються значення параметрів (тобто в моменти часу в наборах Т1 і Т2, коли прийняті значення є точно застосовними). В проміжках інтерполяція об'єднаної операції обробки вимагає лише матричних складань, які мають меншу обчислювальну складність, ніж множення.In the previous case, only the type of parameters corresponding to A had moments of time that were not among the moments of time of the type of parameters corresponding to B. In fig. 9a presents a special situation in which the time point 112 is absent in the set 12, and in which the time point 122 is absent in the set T1. If the value of BA needs to be calculated at an intermediate moment of time y" between 72 and 122, then the method can provide both the value of B at the moment yr-y2, and the value of A at the moment 143-422. After calculating the matrix BA of the combined processing operation in both moments of time VA can be interpolated to find its value at moment !". In general, the method performs matrix multiplication only at times when the values of the parameters change (that is, at times in the sets T1 and T2 when the accepted values are exactly applicable). In between, the interpolation of the combined processing operation requires only matrix additions, which have less computational complexity than multiplication.

В наведених вище прикладах припускали, що всі схеми інтерполяції є лінійними. На фіг. Уе представлений спосіб інтерполяції в якому параметри спочатку необхідно інтерполювати з використанням інших схем. На цій фігурі значення параметра, який відповідає матриці А, підтримують кусково-постійними до моменту часу М12, в якому значення різко змінюються. Якщо значення параметрів приймають на покадровій основі, то кожний кадр може нести сигнали, які вказують момент часу, в який прийняте значення є застосовним точно. В цьому прикладі параметр, який відповідає В, прийняв тільки значення, застосовні точно в моменти 121 і 122, Її спосіб може спочатку передбачити значення В в момент часу ір, який безпосередньо передує моменту 112. Після обчислення матриці ВА об'єднаної операції обробки в моменти іб і 1-1 матрицю ВА можна інтерполювати між їз і ів. Потім спосіб може передбачити значення В в новий момент ір-Н12 передбачення, обчислити значення ВА в моменти ір і ї-4-122 і інтерполювати ВА безпосередньо між ір і ї3. И знову операція ВА об'єднаної обробки була інтерпольована на всьому інтервалі, і її значення було знайдене у всі моменти часу виводу. В порівнянні з більш ранньою ситуацією, представленою на фіг. да, де А і В були б інтерпольовані окремо, а ВА обчислена шляхом множення А і В в кожний момент часу виводу, вимагається менша кількість матричних множень, і обчислювальна складність зменшується.In the above examples, it was assumed that all interpolation schemes are linear. In fig. A method of interpolation is presented in which the parameters must first be interpolated using other schemes. In this figure, the values of the parameter corresponding to the matrix A are kept piecewise constant until the moment of time M12, in which the values change sharply. If parameter values are accepted on a frame-by-frame basis, then each frame can carry signals that indicate the exact moment in time at which the accepted value is applicable. In this example, the parameter corresponding to B has assumed only the values applicable exactly at times 121 and 122. Her method can first predict the value of B at time ir immediately preceding time 112. After calculating the matrix BA of the combined processing operation at times ib and 1-1 matrix BA can be interpolated between iz and iv. Then the method can predict the value of B at the new moment of ir-H12 prediction, calculate the value of BA at the moments ir and і-4-122 and interpolate BA directly between ir and і3. And again, the operation BA of the combined processing was interpolated over the entire interval, and its value was found at all points in time of the output. In comparison with the earlier situation presented in fig. yes, where A and B would be interpolated separately and BA is calculated by multiplying A and B at each output time, fewer matrix multiplications are required and the computational complexity is reduced.

Еквіваленти, розширення, альтернативи й іншеEquivalents, extensions, alternatives and more

Додаткові варіанти здійснення даного опису будуть очевидні для спеціаліста в даній галузі техніки після вивчення опису, наведеного вище. Незважаючи на те, що даний опис і графічні бо матеріали розкривають варіанти здійснення і приклади, розкриття не обмежене даними конкретними прикладами. Можливі численні модифікації і зміни в межах обсягу даного розкриття, визначеного формулою винаходу, яка додається. Будь-які знаки посилань, які зустрічаються в формулі винаходу, не слід розглядати як такі, що обмежують її обсяг.Additional embodiments of the present disclosure will be apparent to one skilled in the art upon review of the above disclosure. Despite the fact that this description and graphic materials disclose embodiments and examples, the disclosure is not limited to these specific examples. Numerous modifications and changes are possible within the scope of this disclosure, defined by the appended claims. Any reference signs appearing in the claims should not be construed as limiting its scope.

Крім того, після вивчення графічних матеріалів, опису і прикладеної формули винаходу спеціаліст може зрозуміти і здійснити зміни розкритих варіантів здійснення. В формулі винаходу термін "який містить" не виключає інших елементів або етапів, і форма однини не виключає множини. Сам факт, що деякі ознаки згадані у взаємно відмінних пунктах формули винаходу, не свідчить про те, що не можна з перевагою використати комбінацію цих ознак.In addition, after studying the graphic materials, the description and the attached claims of the invention, the specialist can understand and make changes to the disclosed implementation options. In the claims, the term "containing" does not exclude other elements or stages, and the singular form does not exclude the plural. The very fact that some features are mentioned in mutually exclusive claims does not indicate that a combination of these features cannot be used with advantage.

Системи і способи, розкриті вище, можуть бути здійснені в вигляді програмного забезпечення, програмно-апаратного забезпечення, апаратного забезпечення або їх комбінації.The systems and methods disclosed above may be implemented in software, hardware, hardware, or a combination thereof.

При здійсненні в вигляді апаратного забезпечення поділ задач між функціональними вузлами, про які йшла мова в наведеному вище описі, не обов'язково відповідає поділу на фізичні вузли; навпаки, один фізичний компонент може виконувати декілька функцій, а одна задача може бути виконана декількома фізичними компонентами у взаємодії. Деякі компоненти або всі компоненти можуть бути здійснені в вигляді програмного забезпечення, виконуваного процесором цифрових сигналів або мікропроцесором, або бути здійснені в вигляді апаратного забезпечення або у вигляді спеціалізованої інтегральної мікросхеми. Таке програмне забезпечення може бути розповсюджене на машинопрочитуваних носіях, які можуть включати комп'ютерні носії інформації (або постійні носії) і засоби зв'язку (або тимчасові носії). Як добре відомо спеціалісту в даній галузі техніки, термін "комп'ютерні носії інформації" включає енергонезалежні і енергозалежні, знімні і незнімні носії, реалізовані будь-яким способом або технологією для зберігання інформації, такої як машинопрочитувані команди, структури даних, програмні модулі або інші дані. Комп'ютерні носії інформації включають, проте без обмеження,When implemented in the form of hardware, the division of tasks between functional nodes, which was discussed in the above description, does not necessarily correspond to the division into physical nodes; conversely, one physical component can perform several functions, and one task can be performed by several physical components in interaction. Some or all of the components may be implemented as software executed by a digital signal processor or microprocessor, or may be implemented as hardware or as a specialized integrated circuit. Such software may be distributed on machine-readable media, which may include computer media (or permanent media) and communication media (or temporary media). As is well known to one skilled in the art, the term "computer media" includes non-volatile and non-volatile, removable and non-removable media implemented by any method or technology to store information such as machine-readable commands, data structures, program modules or other data. Computer storage media include, but are not limited to,

ОЗП, ПЗП, ЕСППЗП, флеш-пам'ять або іншу технологію пам'яті, компакт-диски, універсальні цифрові диски (ОМ) або інші оптичні диски для зберігання інформації, магнітні касети, магнітну стрічку, магнітний диск для зберігання інформації або інші магнітні пристрої для зберігання інформації, або будь-який інший носій, який може бути використаний для зберігання необхідної інформації і який може бути доступним за допомогою комп'ютера. Крім того, як добре відомо спеціалісту в даній галузі техніки, засоби зв'язку, як правило, втілюоють машинопрочитувані команди, структури даних, програмні модулі або інші дані в модульованому сигналі даних, такому як хвиля-носій або інший механізм передачі даних, і включають будь-які засоби доставки інформації.RAM, SSD, SSD, flash memory or other memory technology, CD-ROMs, Universal Digital Discs (UDDs) or other optical discs for information storage, magnetic cassettes, magnetic tape, magnetic disk for information storage or other magnetic devices for storing information, or any other media that can be used to store the necessary information and that can be accessed using a computer. Additionally, as is well known to those skilled in the art, communication means typically embody machine-readable commands, data structures, program modules, or other data in a modulated data signal, such as a carrier wave or other data transmission mechanism, and include any means of information delivery.

Claims (29)

ФОРМУЛА ВИНАХОДУFORMULA OF THE INVENTION 1. Спосіб посилення діалогу в декодері аудіосистеми, який включає етапи: приймання ряду сигналів знижувального мікшування, які являють собою результат знижувального мікшування більшої кількості каналів; приймання параметрів для посилення діалогу, причому ці параметри визначені стосовно підмножини ряду каналів, яка включає канали, які містять діалог, причому цю підмножину ряду каналів піддано знижувальному мікшуванню в підмножину ряду сигналів знижувального мікшування; приймання параметрів відновлення, які надають можливість параметричного відновлення каналів, підданих знижувальному мікшуванню в підмножину ряду сигналів знижувального мікшування; параметричного підвищувального мікшування тільки підмножини ряду сигналів знижувального мікшування на основі параметрів відновлення з метою відновлення тільки підмножини ряду каналів, яка містить підмножину ряду каналів, стосовно якої визначені параметри для посилення діалогу; застосування посилення діалогу до підмножини ряду каналів, стосовно якої визначені параметри для посилення діалогу, з використанням параметрів для посилення діалогу з метою надання щонайменше одного сигналу з посиленим діалогом; і надання версій з посиленим діалогом підмножини ряду сигналів знижувального мікшування шляхом мікшування щонайменше одного сигналу з посиленим діалогом із щонайменше одним іншим сигналом.1. A method of enhancing dialogue in an audio system decoder, which includes the following steps: receiving a number of down-mixing signals, which are the result of down-mixing a larger number of channels; receiving parameters to enhance dialogue, and these parameters are defined with respect to a subset of the channel array that includes channels that contain dialogue, and this subset of the channel array is downmixed into a subset of the downmix signal array; adoption of recovery parameters, which provide the possibility of parametric recovery of downmixed channels into a subset of downmixed signals; parametric up-mixing of only a subset of a series of signals; down-mixing based on restoration parameters in order to restore only a subset of a series of channels, which contains a subset of the series of channels, in relation to which the parameters for enhancing the dialogue are defined; applying dialog enhancement to a subset of the channel array for which the dialog enhancement parameters are defined, using the dialog enhancement parameters to provide at least one dialog enhanced signal; and providing dialogue-enhanced versions of a subset of the downmix signals by mixing at least one dialogue-enhanced signal with at least one other signal. 2. Спосіб за п. 1, який відрізняється тим, що на етапі параметричного підвищувального мікшування тільки підмножини ряду сигналів знижувального мікшування декорельовані сигнали не використовують з метою відновлення тільки підмножини ряду каналів, яка містить підмножину ряду каналів, стосовно якої визначені параметри для посилення діалогу.2. The method according to claim 1, which is distinguished by the fact that at the stage of parametric upmixing, only a subset of the downmix signal range is not used for the purpose of restoring only a subset of the channel range, which contains a subset of the channel range, for which the parameters for dialogue amplification are defined. З. Спосіб за п. 1, який відрізняється тим, що мікшування виконують згідно з параметрами мікшування, які описують внесок щонайменше одного сигналу з посиленим діалогом в версії з посиленим діалогом підмножини ряду сигналів знижувального мікшування.C. The method of claim 1, wherein the mixing is performed according to mixing parameters that describe the contribution of at least one enhanced dialog signal to the enhanced dialog version of a subset of the downmix signal series. 4. Спосіб за будь-яким з попередніх пунктів, який відрізняється тим, що етап параметричного підвищувального мікшування тільки підмножини ряду сигналів знижувального мікшування включає відновлення щонайменше одного додаткового каналу окрім ряду каналів, стосовно яких визначені параметри для посилення діалогу, і при цьому мікшування включає мікшування щонайменше одного додаткового каналу разом з щонайменше одним сигналом з посиленим діалогом.4. The method according to any of the previous items, characterized in that the step of parametric up-mixing of only a subset of the down-mixing signal range includes restoring at least one additional channel in addition to the channel range for which the dialog enhancement parameters are defined, and the mixing includes mixing at least one additional channel together with at least one signal with enhanced dialogue. 5. Спосіб за будь-яким з пп. 1-3, який відрізняється тим, що етап параметричного підвищувального мікшування тільки підмножини ряду сигналів знижувального мікшування включає відновлення тільки підмножини ряду каналів, стосовно якої визначені параметри для посилення діалогу, причому етап застосування посилення діалогу включає здійснення передбачення і посилення діалогової складової з підмножини ряду каналів, стосовно якої визначені параметри для посилення діалогу, з використанням параметрів для посилення діалогу з метою надання щонайменше одного сигналу з посиленим діалогом, і причому мікшування включає мікшування щонайменше одного сигналу з посиленим діалогом з підмножиною ряду сигналів знижувального мікшування.5. The method according to any one of claims 1-3, which is characterized in that the step of parametric up-mixing of only a subset of the range of down-mixing signals includes restoring only a subset of the range of channels for which the parameters for dialogue enhancement are determined, and the stage of applying dialogue enhancement includes performing predicting and amplifying a dialog component from a subset of the channel array for which the dialog enhancement parameters are defined, using the dialog enhancement parameters to provide at least one dialog enhanced signal, and wherein the mixing includes mixing the at least one dialog enhanced signal with a subset of the downlink signal array mixing 6. Спосіб за будь-яким з попередніх пунктів, який відрізняється тим, що додатково включає: приймання звукового сигналу, який представляє діалог, при цьому етап застосування посилення діалогу включає застосування посилення діалогу до підмножини ряду каналів, стосовно якої визначені параметри для посилення діалогу, з додатковим використанням звукового сигналу, який представляє діалог.6. The method according to any of the previous items, which is characterized by the fact that it additionally includes: receiving an audio signal that represents the dialog, while the step of applying the dialog enhancement includes applying the dialog enhancement to a subset of the number of channels for which the parameters for the dialog enhancement are defined, with the additional use of a beep that represents dialogue. 7. Спосіб за будь-яким з попередніх пунктів, який відрізняється тим, що додатково включає приймання параметрів мікшування для мікшування щонайменше одного сигналу з посиленим діалогом із щонайменше одним іншим сигналом.7. The method of any preceding claim, further comprising receiving mixing parameters for mixing the at least one enhanced dialogue signal with the at least one other signal. 8. Спосіб за будь-яким з попередніх пунктів, який відрізняється тим, що включає приймання параметрів мікшування, які описують схему знижувального мікшування, яка описує, в який Зо сигнал знижувального мікшування мікшований кожен з ряду каналів.8. A method according to any of the preceding claims, characterized in that it includes receiving mixing parameters that describe a down-mixing scheme that describes into which Zo the down-mixed signal is mixed for each of the number of channels. 9. Спосіб за п. 8, який відрізняється тим, що схема знижувального мікшування змінюється з часом.9. The method according to claim 8, which is characterized by the fact that the down-mixing scheme changes over time. 10. Спосіб за будь-яким з попередніх пунктів, який відрізняється тим, що додатково включає приймання даних, які ідентифікують підмножину ряду каналів, стосовно якої визначені параметри для посилення діалогу.10. The method according to any one of the previous items, which is characterized by the fact that it additionally includes receiving data that identifies a subset of the number of channels with respect to which the parameters for enhancing the dialogue are determined. 11. Спосіб за п. 10, причому з залежністю від п. 8 або п. 9, який відрізняється тим, що дані, які ідентифікують підмножину ряду каналів, стосовно якої визначені параметри для посилення діалогу, використовують разом зі схемою знижувального мікшування для знаходження підмножини ряду сигналів знижувального мікшування, в яку виконане знижувальне мікшування підмножини ряду каналів, стосовно якої визначені параметри для посилення діалогу.11. The method according to claim 10, and with dependence on claim 8 or claim 9, which differs in that the data identifying the subset of the channel series, in relation to which the parameters for enhancing the dialog are determined, are used together with the down-mixing scheme to find the subset of the series of signals of the down-mixing mixing, in which the downmixing of a subset of a number of channels is performed, in relation to which the parameters for enhancing the dialogue are defined. 12. Спосіб за будь-яким з попередніх пунктів, який відрізняється тим, що етапи підвищувального мікшування тільки підмножини ряду сигналів знижувального мікшування, застосування посилення діалогу і мікшування виконують як матричні операції, визначені, відповідно, параметрами відновлення, параметрами для посилення діалогу і параметрами мікшування.12. The method according to any of the previous clauses, which is characterized in that the stages of upmixing only a subset of a number of signals of downmixing, applying dialogue amplification and mixing are performed as matrix operations defined, respectively, by restoration parameters, parameters for dialogue amplification and mixing parameters . 13. Спосіб за п. 12, який відрізняється тим, що додатково включає об'єднання шляхом матричного множення матричних операцій, які відповідають етапам підвищувального мікшування тільки підмножини ряду сигналів знижувального мікшування, застосування посилення діалогу і мікшування в єдину матричну операцію перед застосуванням до підмножини ряду сигналів знижувального мікшування.13. The method according to claim 12, which is characterized by the fact that it additionally includes combining by matrix multiplication matrix operations that correspond to the steps of up-mixing only a subset of the down-mix signal series, applying dialogue amplification and mixing into a single matrix operation before applying to a subset of the signal series reduction mixing. 14. Спосіб за будь-яким з попередніх пунктів, який відрізняється тим, що параметри посилення діалогу і параметри відновлення є залежними від частоти.14. The method according to any one of the previous items, characterized in that the dialog gain parameters and the restoration parameters are frequency dependent. 15. Спосіб за п. 14, який відрізняється тим, що параметри для посилення діалогу визначають стосовно першого набору смуг частот, а параметри відновлення визначають стосовно другого набору смуг частот, при цьому другий набір смуг частот відрізняється від першого набору смуг частот.15. The method according to claim 14, which is characterized in that the parameters for enhancing the dialogue are determined with respect to the first set of frequency bands, and the recovery parameters are determined with respect to the second set of frequency bands, while the second set of frequency bands is different from the first set of frequency bands. 16. Спосіб за будь-яким з попередніх пунктів, який відрізняється тим, що: значення параметрів для посилення діалогу приймають неодноразово та пов'язують їх з першим набором моментів часу (Т1-ЩН1, М2, М3,...3), в яких відповідні значення є точно застосовними, і причому між послідовними моментами часу необхідно виконувати наперед визначену першу схему інтерполяції (11); і значення параметрів відновлення приймають неодноразово та пов'язують їх з другим набором моментів часу (Т2-121, 122, 123,...3У), в яких відповідні значення є точно застосовними, причому між послідовними моментами часу необхідно виконувати наперед визначену другу схему інтерполяції (12), при цьому спосіб додатково включає: здійснення вибору типу параметрів, які являють собою або параметри для посилення діалогу, або параметри відновлення, таким чином, що набір моментів часу, пов'язаний з вибраним типом, містить щонайменше один момент передбачення, який являє собою момент часу (р), відсутній в наборі, пов'язаному з невибраним типом; здійснення передбачення значення параметрів невибраного типу в момент (Ір) передбачення; обчислення на основі щонайменше одного передбаченого значення параметрів невибраного типу і прийнятого значення параметрів вибраного типу об'єднаної операції обробки, яка являє собою принаймні підвищувальне мікшування тільки підмножини сигналів знижувального мікшування з наступним посиленням діалогу в момент (Ір) передбачення; і обчислення на основі принаймні значення параметрів вибраного типу і значення параметрів невибраного типу, причому щонайменше одне з вказаних значень являє собою прийняте значення, вказаної об'єднаної операції обробки в суміжний момент часу (їз) в наборі, пов'язаному з вибраним чи невибраним типом, причому вказані етапи підвищувального мікшування тільки підмножини ряду сигналів знижувального мікшування і застосування посилення діалогу виконують між моментом (р) передбачення і суміжним моментом часу (їз) за допомогою інтерпольованого значення обчисленої об'єднаної операції обробки.16. The method according to any of the previous clauses, which differs in that: the values of the parameters for strengthening the dialogue are taken repeatedly and associated with the first set of time points (T1-ШН1, M2, M3,...3), in which corresponding values are exactly applicable, and between successive moments of time it is necessary to perform the predetermined first interpolation scheme (11); and the recovery parameter values are repeatedly taken and associated with a second set of time points (T2-121, 122, 123,...3U) in which the corresponding values are exactly applicable, and between successive time points a predetermined second scheme must be performed interpolation (12), wherein the method further comprises: performing a selection of a type of parameters that are either dialogue enhancement parameters or restoration parameters, such that the set of time points associated with the selected type contains at least one prediction point, which is a point in time (p) that is not in the set associated with the unselected type; making a prediction of the value of the parameters of the unselected type at the time of (Ir) prediction; calculation based on at least one predicted value of the parameters of the unselected type and the accepted value of the parameters of the selected type of the combined processing operation, which is at least an upmixing of only a subset of the downmixing signals, followed by the amplification of the dialog at the time of (Ir) prediction; and computing based on at least the parameter value of the selected type and the parameter value of the unselected type, wherein at least one of said values is an accepted value of the specified combined processing operation at a contiguous point in time (trip) in the set associated with the selected or unselected type , and the indicated stages of upmixing only a subset of a number of downmixing signals and the application of dialog amplification are performed between the moment (p) of prediction and the adjacent moment of time (iz) using the interpolated value of the calculated combined processing operation. 17. Спосіб за п. 16, який відрізняється тим, що параметрами вибраного типу є параметри відновлення.17. The method according to claim 16, characterized in that the parameters of the selected type are recovery parameters. 18. Спосіб за п. 16 або п. 17, який відрізняється тим, що є вірним одне з наступного: вказану об'єднану операцію обробки в суміжний момент часу (їз) обчислюють на основі прийнятого значення параметрів вибраного типу і передбаченого значення параметрів Зо невибраного типу; вказану об'єднану операцію обробки в суміжний момент часу (їз) обчислюють на основі передбаченого значення параметрів вибраного типу і прийнятого значення параметрів невибраного типу.18. The method according to claim 16 or claim 17, which is distinguished by the fact that one of the following is true: the specified combined processing operation at the adjacent moment of time (i) is calculated on the basis of the accepted value of the parameters of the selected type and the predicted value of the parameters of the unselected type; the specified combined processing operation at the adjacent moment of time (trip) is calculated on the basis of the predicted value of the parameters of the selected type and the accepted value of the parameters of the unselected type. 19. Спосіб за п. 16 або п. 17, який відрізняється тим, що вказану об'єднану операцію обробки в суміжний момент часу (їз) обчислюють на основі прийнятого значення параметрів вибраного типу та прийнятого значення параметрів невибраного типу.19. The method according to claim 16 or claim 17, which is characterized by the fact that the specified combined processing operation at an adjacent time point (time) is calculated based on the accepted value of the parameters of the selected type and the accepted value of the parameters of the unselected type. 20. Спосіб за будь-яким з пп. 16-19, який відрізняється тим, що додатково включає здійснення вибору на основі першої і другої схем інтерполяції об'єднаної схеми (ІЗ) інтерполяції згідно з наперед визначеним правилом вибору, причому вказана інтерполяція відповідних обчислених об'єднаних операцій обробки відповідає об'єднаній схемі інтерполяції.20. The method according to any of claims 16-19, which is characterized by the fact that it additionally includes making a selection based on the first and second interpolation schemes of the combined interpolation scheme (IS) according to a predetermined selection rule, and the specified interpolation of the corresponding calculated of combined processing operations corresponds to the combined interpolation scheme. 21. Спосіб за п. 20, який відрізняється тим, що наперед визначене правило вибору визначене для випадку, в якому перша і друга схеми інтерполяції відрізняються.21. The method according to claim 20, characterized in that the predetermined selection rule is defined for the case in which the first and second interpolation schemes differ. 22. Спосіб за п. 21, який відрізняється тим, що, у відповідь на те, що перша схема (11) інтерполяції є лінійною, а друга схема (І2) інтерполяції є кусково-постійною, як об'єднану схему інтерполяції вибирають лінійну інтерполяцію.22. The method according to claim 21, which differs in that, in response to the fact that the first interpolation scheme (11) is linear, and the second interpolation scheme (I2) is piecewise-continuous, linear interpolation is selected as the combined interpolation scheme. 23. Спосіб за будь-яким з пп. 16-22, який відрізняється тим, що передбачення значення параметрів невибраного типу в момент (Ір) передбачення виконують згідно зі схемою інтерполяції для параметрів невибраного типу.23. The method according to any of claims 16-22, which is characterized by the fact that the prediction of the value of the parameters of the unselected type at the moment (Ir) of the prediction is performed according to the interpolation scheme for the parameters of the unselected type. 24. Спосіб за будь-яким з пп. 16-23, який відрізняється тим, що об'єднану операцію обробки обчислюють як єдину матричну операцію перед її застосуванням до підмножини ряду сигналів знижувального мікшування.24. The method according to any one of claims 16-23, characterized in that the combined processing operation is calculated as a single matrix operation before applying it to a subset of the downmix signal series. 25. Спосіб за п. 24, який відрізняється тим, що: як об'єднану схему інтерполяції вибирають лінійну інтерполяцію; і інтерпольоване значення відповідних обчислених об'єднаних операцій обробки обчислюють за допомогою лінійної матричної інтерполяції.25. The method according to claim 24, which differs in that: linear interpolation is chosen as the combined interpolation scheme; and the interpolated value of the corresponding calculated combined processing operations is calculated using linear matrix interpolation. 26. Спосіб за будь-яким з пп. 16-25, який відрізняється тим, що вказані прийняті сигнали знижувального мікшування розбивають на часові кадри, причому в усталеному режимі роботи спосіб включає приймання щонайменше одного значення параметрів відповідних типів, точно застосовного в момент часу в кожному часовому кадрі.26. The method according to any one of claims 16-25, which is characterized in that said received downmix signals are divided into time frames, and in a fixed mode of operation, the method includes accepting at least one value of parameters of the corresponding types, exactly applicable at the time in each time frame 27. Спосіб за будь-яким з попередніх пунктів, який відрізняється тим, що мікшування щонайменше одного сигналу з посиленим діалогом із щонайменше одним іншим сигналом обмежене неповною вибіркою ряду сигналів знижувального мікшування.27. A method according to any of the preceding claims, characterized in that the mixing of the at least one dialogue-enhanced signal with the at least one other signal is limited to an incomplete sampling of the downmix signal range. 28. Машиночитаний носій інформації, що містить команди для виконання способу за будь-яким з пп. 1-27.28. A computer-readable medium containing instructions for performing the method according to any one of claims 1-27. 29. Декодер для посилення діалогу в аудіосистемі, який містить: компонент приймання, виконаний з можливістю приймання: ряду сигналів знижувального мікшування, які являють собою результат знижувального мікшування більшої кількості каналів, параметрів для посилення діалогу, причому ці параметри визначені стосовно підмножини ряду каналів, яка включає канали, які містять діалог, причому цю підмножину ряду каналів піддано знижувальному мікшуванню в підмножину ряду сигналів знижувального мікшування, і параметрів відновлення, які надають можливість параметричного відновлення каналів, підданих знижувальному мікшуванню в підмножину ряду сигналів знижувального мікшування; компонент підвищувального мікшування, виконаний з можливістю параметричного підвищувального мікшування тільки підмножини ряду сигналів знижувального мікшування на основі параметрів відновлення з метою відновлення тільки підмножини ряду каналів, яка містить підмножину ряду каналів, стосовно якої визначені параметри для посилення діалогу; і компонент посилення діалогу, виконаний з можливістю застосування посилення діалогу до підмножини ряду каналів, стосовно якої визначені параметри для посилення діалогу, з використанням параметрів для посилення діалогу з метою надання щонайменше одного сигналу з посиленим діалогом; і компонент мікшування, виконаний з можливістю надання версій з посиленим діалогом підмножини ряду сигналів знижувального мікшування шляхом мікшування щонайменше одного сигналу з посиленим діалогом із щонайменше одним іншим сигналом. р 100а пе з Е ї й Ме: ей С) 2 Г в 1РЕ лк це К те /з ла Е твої / тва ті М/о ів кв шо яв29. A decoder for enhancing dialog in an audio system, which includes: a receiving component configured to receive: a number of down-mixing signals, which are the result of down-mixing a larger number of channels, parameters for enhancing dialogue, and these parameters are defined with respect to a subset of the number of channels, which includes channels that contain dialogue, and this subset of the number of channels is down-mixed into a subset of the down-mix signals, and restoration parameters that enable parametric restoration of the down-mixed channels into a subset of the down-mix signals; an upmixing component, made with the possibility of parametric upmixing of only a subset of the downmix signal series based on restoration parameters in order to restore only a subset of the channel series, which contains a subset of the channel series, in relation to which the parameters for dialogue amplification are defined; and a dialog enhancement component configured to apply dialog enhancement to a subset of a number of channels for which dialog enhancement parameters are defined, using dialog enhancement parameters to provide at least one dialog enhanced signal; and a mixing component configured to provide dialogue-enhanced versions of a subset of a number of downmixed signals by mixing at least one dialogue-enhanced signal with at least one other signal. r 100a pe z E i y Me: ey C) 2 G v 1RE lk ce K te /z la E tvoje / tva ti M/o iv kv sho yav Фіг. ТаFig. And В. 1006 2 в/с ш г: Й тV. 1006 2 v/s w d: Y t І. " ів Ї е ЦО Ст вв ! Скелет вх (ввI. " iv Y e TSO St vv ! Skeleton vh (vv Фіг. льFig. l КЗ ! | -ВіЖ В ' ОО 8ІВ ; ї | і і ! : пн ПИ У Ж Ж З Еш ж Я рої п: Тдж З рено реехея я фен во Е | ж ше ОЯЖЕ ь і ! ! Ж рев риннннновв «я І Н 1 ЖЕ ОК Н гоже нео І Тож І рег Я і ке ВУ ЩЕ роож іОТЕя : ТЕЖ ТОЖ и фен нд ню м хх хм сх пф В, НУ І Я 5 Її зе Я і зе - ж ! їх їі : а : ги : Н їж рими пи фен в : Ех їв зві - ОТ Я :ОТВЕ Н : : ж Н 3 : : ів Н І І хх в ВН А НН : о Е пи що і унччняннполняофвх в У дж жа тяотяи нях нн й Е Щі ї Я я а -Short circuit! | -ViZH V 'OO 8IV ; and | and and! : пн PI U Ж Ж Z Esh zh I roi p: Tj Z reno reeheya I fen vo E | Well, OYAZE! ! Ж rev rynnnnnovv "I AND N 1 SAME OK N gozhe neo I So I reg I i ke VU SCHE rooj iOTEya: TOO TOZ i fen nd nyu m хх хм сх pf V, NU I I 5 Her ze I and ze - zh ! их ии : а : гы : N eat rhymes pi fen v : Eh yiv zvi - OT I :OTVE N : : ж H 3 : : iv N I I xx v VN A NN : o E pi what i unchchnyannpolnyaofvh v U j zha tyaotyay nyah nn y E Shchi y I I a - Фіг. 2 ча й хх Й УК к ку Ей М кРА-к їж Ш їх іх . У В рн Крх І» і-ї дк ях, щ г п --к сокFig. 2 cha y xx Y UK k ku Ei M kRA-k eat Sh ih ih . In V rn Krh I» i-i dk yah, sh g p --k sok Фіг. З пиття ; п Я - | Пон ов Я ВО : ши чн аа т и т в дж ян Н Н х Н чини : Н ' Н х Н : : та ї Н | зн Фін ' С : : В У ІНН бутттнттй Н : : ту НИ Н БО 2 фо- МНК нн т сн: Коля ШЕ ж Н : ї ТТ, Її он нн нон з В нн АНУFig. From drinking; n I - | Pon ov I VO : shi chn aa t i t v djan N N x N chiny : N ' N x N : : ta i N | zn Fin ' S : : V U INN butttntty N : : tu NI N BO 2 fo- MNK nn t sn: Kolya SHE zh N : i TT, Her on nn non z V nn ANU Фіг. 4 че В Ї ту фитттнттнтнтннннн 7 ЗЕ ще Н і й І: --е ож ж юю сю ожюж о зжжо ож жжя ж ЛО ЖЖ Ж З СИЛИ ЖИ АКХ ХАМО МАХ ЯМ сх сю жлюо ож шжж Ж УЮЮ жу жжх зл С ж.Fig. 4 che V I tu fitttnttntntnnnn 7 ZE still N i i I: --e ож ж yuyu syu ожюж o зжжо ож жжя ж LO ЖЖ Ж Z SYLY ЖХ ЖХ ЖХ ХАМО МАХ ЯМ ш шю жлюо ож шжж Х UYUYU жу жжх зл С ж. АХ, ІІ ав : ! Н теж я Я а : ЗІ 53 : 1 Н док дк х, х ї і жу Ку т Я Н Н іє пана и п а а З ві мялиолх лилия. тин, : КЕШ і : : рехх трати дуухкююхххххтххххххкккххя реко єєюккєєкн Зх : вт і ! ! ! ме : о і НУ ї ! Н Н Ох Н ов М це : і : | род ї Н х ! Н ї Н Н Н . : х : : СИМ НУ оо: і і і М і : : но ! 5 ж ї ! : Н хе НУ е дів а Щі ж | ще і : ДЕ че и ож Ге : реж тк Н ' ш НН Н ії; рок Н НИЙ : ! і Це й Н НЕ ії 5 і ід Ж : і Я оон З Ух Р І БМ о ! і шок ни ЗК ШУ : СЕ : х : ОО Жоожк Н | х рони Вк Ще ТВ ж Уетннннн ння фік їж де ох : ! кН: мин НЕ ж в іш я | і в, о кА г МЕНЕ НИ СН пз МИ і В; се» ам сш ни ОТ ОЕ Мі ра ї і ЗИ; к іже В біта: К- і вк : й шов і м Я : ОК обо. ток х ї 1 х ' їх «к З семи й ши и нн Не Ж. р ! | Кк ш м щи її фребєскіссфє 10 ее і Її ж яко а Ач ож Те ревно: Я і жл : і ОВ і і ка Н : М лллялляляеєюнююєюююююкютикй Моди В ддхллжжжхллллллллллалАЛАХАЛАМ ; по Я Дж ло мк мк іо сннх сил те вн тях, АК ОМЖХО ОМ ОХХО ЧАК РКО М МР ж жк жк жк скхо сх мк МА АЖ Ах МА Же тк жжоню Й ! їі м 1 зе МЕ : ин нн а ен ооо пн ти : Я І Н В ! ШЕ : Пон но оо он нн нн мн я : : І : : : ; і ! і Н НУ пе І чи нн п ШЕ ве Н Н і Я ви Фіг. 5 і Ж «ее Е Біб : : м пеннннан тя АКААА КАХ АХА ТАКА КАК тт ндлялнялнх плАААААААААН ї се Е і дж : і ї ВШ: ! «в'я ЕЕ ачех ше З Ко | і вла БОаВ ЩЕ; а Н ; ї : З га. | ке х ; і з ж Н М й ї ще ій В Ся ях ї - Н ті ЕІ Ж донос оно мух и п пи чек ки ре їх и й Й веннннннну В ї ЕІ, її; Н Шен гі і І рі : ши : й і ко і! | гра й ше | ! : к З 1 Н КЕ т ік ' | Й х я ї | КР думу жов но х сеї Ш- о о дай АВнвІувютье т 5 ненні Янижувальне ДЕ К- о і ! Ся МіюУвання 7 а НИ ТВ мікшування Мі Еомнннни -і Мн 7 я 1 ж е : Кік т НІ Вдету с : : 1 ще НІ: : ; » ою ц В ї ; | 7 дати : шої ее : Торт ин икАААААААААМ, ! ще В ро Ко їЕ | са Павніувальне три ов пу рю уваНе І ТОЖ ж Ц Хв Ж фс мішнуния ПА ! ПАК одкрууваняя 11 Й НЕ НН АКА вени І оре " І; Н і Ж : Тож яті ж ж нижній Н і Кості Н : ше ЗЛИЛИ МИТ шини ще Пон ши оф - ї к че Щ- шк ШЕ КО іа ЕЕ яв себорея ш їв як : ВАГ : Ше | : же пт КЕНЕ У я я то теки оф і : Я : : фе оон нн нн нн і що : У р Ї зу - ге кешу СОAH, II av: ! N also I I a : ZI 53 : 1 N dok dk x, x i i zhu Ku t I N N ie pana i p a a Z vi mielyolh liliya. tin, : CASH and : : rekh spend duukhkyyuukhkhkhkhhtkhkhkhkhkkkhhya reko yeyukkeeekn Zh : ut and ! ! ! me: oh and NU! N N Oh N ov M is : and : | kind of N x ! N y N N N . : x : : SIM NU oo: i i i M i : : but ! 5 th! : N he NU e div a Shchi zh | also: DE che i oj Ge: rezh tk N ' sh NN N iyi; rock N HY : ! and This and N NE ii 5 and id Z : and I oon Z Uh R I BM o ! and shock of ZK SHU : SE : x : OO Zhoozk N | х рони Вк Ше TV ж Uetnnnnnn nnya fic eat where oh : ! kN: min NOT in ish I | i v, o kA g MENE NI SN pz MI i V; se» am ssh ni OT OE Mi ra i i ZY; k izhe V bita: K- and vk : y shov and m I : OK obo. tok h i 1 x ' ih "k Z seven y shi i nn Not Zh. r ! | Kk sh m shchi her frebeskissfie 10 ee and Her same as a Ach oz Te jealously: I and zhl : and OV and and ka N : M lllyallyalyaeyyunyuyuyuyuyuyuyuyukyutyky Mody V ddhllzhzhzhhllllllllllalALAHALAM ; po I J lo mk mk io snnh sil te vntyh, AK OMZHHO OM OHHO CHAK RKO M MR zh zhk zhk zhk skho skh mk MA AJH Ah MA Zhe tk zzhjonyu Y ! iii m 1 ze ME: inn nn a en ooo pn ti: I AND N V! SHE: Mon no oo he nn nn mn I : : I : : : ; and ! i N NU pe I chy nn p SHE ve N N i I you Fig. 5 and Z «ee E Bib : : m pennnnan tya AKAAA KAH AHA TAKA KAK tt ndlyalnyalnh plAAAAAAAAAN i se E i j : i i VSH: ! "vya EE acheh she Z Ko | and vla BOaV STILL; and H; and : From ha. | ke x ; and with N M y y still y V Sya yah y - N ti EI Х donos ono muh y p py check ky re y y y Y vennnnnnu V y EI, her; N Shen gi i I ri : shi : y i ko i! | game and what | ! : k Z 1 N KE t ik ' | Y x i y | KR dumu zhov no x sei Sh- o o give AVnvIuvyutie t 5 nenny Yanizhuvalne DE K- o i ! Sya MiyuUvanja 7 a NI TV mixing Mi Eomnnnny -i Mn 7 i 1 same e : Kik t NI Vdetu s : : 1 still NO: : ; » oyu ts V i ; | 7 dates: shooi ee: Cake in ikAAAAAAAAAAAM, ! more V ro Ko iE | sa Pavniuvalne tri ov puru ryu uvaNe AND TOZ same Ts Hv Z fs mishnunia PA ! PAK odkruuvanyaya 11 Y NE NN AKA veins I ore " I; N i Z: So the same lower N and Bones N: sHE BLINDED MYT tires still Pon shi of - y k che Sh- shk SHE KO ia EE yav seborrhea sh yiv as : VAG : She | : same pt KENE U I I to teki of i : I : : fe oon nn nn nn and what : U r Y zu - ge keshu SO З сокккюєююююююкі ї Її «хх стру : ! хх ; я Ю І 7 о нн нн нн ря : ' сек ож ї х і | «7 16 : Ж Я | Кі І : фен ту Ї ї і ї х : | ж З і ї : і Ж ї 1 : Ї ї 3 7 ї че с чужим ї ї З Н вих на ї (у ЗК КУ ІВ ї ї ДН й хх : х Ж х г ї ння ТЯ тва 0006 : Н : ї Н Ї КІ І : Н Н В х Н Н х ї ! | Н 3 с Х і 1 х Н Н и і-ї С ї У Н НК Н т ж 5 фл аю Малою жу я ж юю ки Мк. сюжа ж Н Н ке ті Н й феюкккєкккні Н : т ще Н пн Н Х дю ї Н : ! я НН ПТК Рі а і : ' ОРІ Ба Е іш ! : Н С же МНН ї Н ' : ' ЗИ ї СУ : ї х З Н : ШК Ка: и пиши В М ши рі ! ' | М Пс пннвнннн: НАКЯЩЕ БО. ват Ще КОР аа ПАБНШЩУВВЛЬН З ГО чай ше ТТ : т : 12 : хОЕТЯ : см тоне МИ МНН ; шо Н ЯМ Ро рень МІК НаНВЯ оба а род пк, і Е | В ших па "Вин НИ я, : ; ши нн вх У НЕ і с шин а ше поль Ж ОЖЯЩ Р свертттттт ц ан хз: З ВЕ, нб р з ї жі У нен в ГСК Ї Біжу вк в я Я кі Р од КЛВНЕДУВЕЬКНЕ тк) б37; роз НК НЕ Нес І г її : «5 НУ мин : і ВЕ Со рбенбееуернвнеяявя МіІБНЕВИННЯ Гор. ша : же вм і ЕЕ Ку т. р: | : З шен ГОР можн шо жі : ! Са на п В МО, ЩЕ Сов : : ТОВ Моєеєтстєкин са Н Ї ох як "КК, : : ЕМ і Н нн и а КИ с Зк. киже ! нич | и ши пом ке пн Н 1 ЖК... я І т І я Теж У м : ще длллкнлннннн фі ї ом й : | о з : В Яке клааАААААХ АХА КАНА НААН ТРЮК ої же ї Я Б : У Н : ото і рен т Сй Чи: : щі і : пе Дю ле Н ж ТЕО. : Ж ! : ви вин Н й ох В ! : шо і к ПОЛ і Я Ка Х ї - зи ин фентннннннннннннннтн ння ! ї їжу ВЕ ПАААААХАКТ тт тт тт ТА А КААААААААКААЮЬК кн» ше | ! : Кий а Ве Н п п я : жа НК ; ! : їн пен Мо одднннтнттттттттчттттнтх : ка пдддетененння п Кк тк тт т У оо жилжижжко ВД» : і ж х : : 7 х Н Н ТИ У Її ох з З 1 Фіг. 7 таз ї ес ху й як Я зе с Н щі Я -й и я. -КаО ШЕ: і ту зм ї У В ї го дя а т Е о : і Кт ин Доежкх і Н ' Коцеання ШЕ з : Ї Н ее Н 2 рев З КЕФЕУЕТУ Ї тт ддддддлстня й ї ! і : Кен зеНння Діла! Ша Її дав Н Н кі і : ЕВ і : Еш: і аг і сеощмк ї пиття апа АКАХАХАЮ тт тт тт ВК єв ВІВ, 1 ще ШЕ йе ж : ії Зинжуразь Ох Н МТА КУ в, рі: : : у о Яняжувальне В. н КІ ме лико ї АВ ідаучяьо : 7 Н : ї З аукакицвто : МК фев нин и В фонтану МНареметрнхо | Ще : НІ й Ї : ; х Н Н : : А А і Її вада мито Е г. ! і Кодування ; п ИН реко т ІЗ їх. 2 ї Гек нанні дов в її виш ж Н Н З : ! І; ЕН У. дата алла ща Ї пснкни Бий г ЗИ о НО Я УА Ст х не М нан сн ни пелляж вв тУлтткваєюк во дихати яння зешкжжжже жк з и ро яю засут Я уWith sokkkyueyuyuyuyuyuuki and Her "xx stru : ! xx; i Yu I 7 o nn nn nn rya : ' sec ozh yi kh i | "7 16 : J I | Ki I : fen tu Yi i i i i x : | Ж Зі і : і Ж і 1 : Ж і 3 7 і че s chuezhim і і З N vyh na і (in ZK KU IV і і ДН y xx : х Ж х гі ниня ТЯ тва 0006 : Н : і N Y KI I : Н N В х Н Н х и ! ke ti N y feyukkkkkkkni N : t sche N pn N H duy i N : ! i NN PTK Ri a i : ' ORI Ba E ish ! : N S zhe MNN i N ' : ' ZY i SU : i x Z N : ShK Ka: and write in M shi ri !' | M Ps pnnvnnnn: NAKYASHCHE BO. vat More KOR aa PABNSHSHCHUVVLN Z GO chay she TT : t : 12 : hOETYA : sm tone MI MNN ; sho N YAM Ro ren MIK NaNVYA both a rod pk, and E | V shih pa "Vyn NI i, : ; shin nn vh U NE and s shin a she pol Z OZHYASH R svertttttt ts an khz: Z VE, nb r z yi zhi U nen in GSK Y Biju vk in I Ya ki R od KLVNEDUVEKNE tk) b37; dis NK NE Nes I g her : "5 NU min : i VE So rbenbeeuernvneyayavya MiIBNEVINYNA Hor. sha : same vm and EE Ku t. r: | : Z shen HOR mozhn sho zhi : ! Sa na p V MO, SCHE Sov : : TOV Moeeetstekin sa N Y oh as "KK, : : EM i N nn i a KI s Zk. damn it! nothing | и ши пом ке пн H 1 ЖК... и и т и и и Теж У м : еще dlllknlnnnnn фи и ом и : | o z : V Yake klaaAAAAAH AHA KANA NAAN TRUCK oi same i I B : U N : oto i rent t Sy Chi: : shchi i : pe Du le N zh TEO. : Yes! : it's your fault N y oh V ! : sho i k POL i I Ka H i - zy in fentnnnnnnnnnnnnnnntn nnya ! th food VE PAAAAAAHACT tt tt tt TA A КААААААААКАЙК kn» ше | ! : Kiy a Ve N p p ia : zha NK ; ! : yin pen Mo oddnnntnttttttttttttnth : ka pdddetenennnya p Kk tk tt t U oo zhilzhizhko VD» : i zh x : : 7 x N N TI U Her oh z Z 1 Fig. 7 taz i es hu y as I ze s N schi I -y and i. -KaO SHE: i tu smy U V y go dya a t E o : i Kt in Doezhkh i N ' Kotseannya SHE z : Y N ee N 2 rev Z KEFEUETU Y tt ddddddlstnya y y ! and: Ken zennnia Dila! Sha She gave N N ki i : EV i : Esh: i ag i seoshmk y pittya apa AKAHAHAYU tt tt tt VK ev VIV, 1 more SHE ye same : ii Zinzhuraz Okh N MTA KU v, ri: : : u o Yanyazhuvalne V n KI me lyko i AV idauchyayo : 7 N : i Z aukakytsvto : MK fev nin i In the fountain MNaremetrnho | Also: NO and YES: ; х Н Н : : A A and Her defect toll E g. ! and Coding; p IN reco t FROM them. 2nd Hek nanni dov in her university N N Z : ! AND; EN U. date alla shcha Y psnkny Byy g ZY o NO I UA St h ne M nan ny pellage vv tUlttkvaeyuk vo breathing yannia zeshkzhzhzhzhe zhk z iro yayu zasut I u Фіг. ЧаFig. Cha А . Ва мини ня ан В В ов вона В Но МеA. Va mini nya an V V ov she V No Me Фіг. ор Ва пд пили шіхлсхтуюеууат рних рних ктая ух : г й яккжежвеххя скхатх хори ТК фіг. пе Аз дечхлня С и М ' пт по 2 ПЗ ЗFig. or Va pd saw shihlskhtuyueuuat rnyh rnyh ktaya uh: g y yakkzhezhvekhhya skkhath hori TK fig. fri Az dechhlnya S and M ' pt at 2 PZ Z Фіг. ЗаFig. By А с. техники и жтиннх няння вв ! нема лона анна І в : ! і Гу Е: Ма ско у пихоялянія аа о зхлголтекхеуую кяжуюєкх хв КЗ я из ІAnd with technicians and zhtynnh nanny vv! there is no womb Anna And in : ! and Gu E: Ma sko u pyhoyalyaniya aa o zhlgoltekheuuyu kyazhuuyekh hv KZ i iz I Фіг. ЗеFig. Ze
UAA201703054A 2014-10-02 2015-09-30 Decoding method and decoder for dialog enhancement UA120372C2 (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201462059015P 2014-10-02 2014-10-02
US201562128331P 2015-03-04 2015-03-04
PCT/EP2015/072578 WO2016050854A1 (en) 2014-10-02 2015-09-30 Decoding method and decoder for dialog enhancement

Publications (1)

Publication Number Publication Date
UA120372C2 true UA120372C2 (en) 2019-11-25

Family

ID=54199263

Family Applications (1)

Application Number Title Priority Date Filing Date
UAA201703054A UA120372C2 (en) 2014-10-02 2015-09-30 Decoding method and decoder for dialog enhancement

Country Status (19)

Country Link
US (1) US10170131B2 (en)
EP (1) EP3201918B1 (en)
JP (1) JP6728146B2 (en)
KR (1) KR102426965B1 (en)
CN (1) CN106796804B (en)
AU (1) AU2015326856B2 (en)
BR (1) BR112017006325B1 (en)
CA (1) CA2962806C (en)
DK (1) DK3201918T3 (en)
ES (1) ES2709327T3 (en)
IL (1) IL251263B (en)
MX (1) MX364166B (en)
MY (1) MY179448A (en)
PL (1) PL3201918T3 (en)
RU (1) RU2701055C2 (en)
SG (1) SG11201702301SA (en)
TW (1) TWI575510B (en)
UA (1) UA120372C2 (en)
WO (1) WO2016050854A1 (en)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016050854A1 (en) * 2014-10-02 2016-04-07 Dolby International Ab Decoding method and decoder for dialog enhancement
CN106303897A (en) * 2015-06-01 2017-01-04 杜比实验室特许公司 Process object-based audio signal
JP7023848B2 (en) 2016-01-29 2022-02-22 ドルビー ラボラトリーズ ライセンシング コーポレイション Improved binaural dialog
TWI658458B (en) * 2018-05-17 2019-05-01 張智星 Method for improving the performance of singing voice separation, non-transitory computer readable medium and computer program product thereof
WO2020216459A1 (en) * 2019-04-23 2020-10-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method or computer program for generating an output downmix representation

Family Cites Families (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6463410B1 (en) * 1998-10-13 2002-10-08 Victor Company Of Japan, Ltd. Audio signal processing apparatus
US7158933B2 (en) 2001-05-11 2007-01-02 Siemens Corporate Research, Inc. Multi-channel speech enhancement system and method based on psychoacoustic masking effects
WO2004097799A1 (en) 2003-04-24 2004-11-11 Massachusetts Institute Of Technology System and method for spectral enhancement employing compression and expansion
KR20050049103A (en) 2003-11-21 2005-05-25 삼성전자주식회사 Method and apparatus for enhancing dialog using formant
CA3026267C (en) 2004-03-01 2019-04-16 Dolby Laboratories Licensing Corporation Reconstructing audio signals with multiple decorrelation techniques and differentially coded parameters
SE0402652D0 (en) * 2004-11-02 2004-11-02 Coding Tech Ab Methods for improved performance of prediction based multi-channel reconstruction
WO2006103584A1 (en) 2005-03-30 2006-10-05 Koninklijke Philips Electronics N.V. Multi-channel audio coding
ES2297825T3 (en) * 2005-04-19 2008-05-01 Coding Technologies Ab ENERGY DEPENDENT QUANTIFICATION FOR EFFECTIVE CODING OF SPACE AUDIO PARAMETERS.
US7707034B2 (en) * 2005-05-31 2010-04-27 Microsoft Corporation Audio codec post-filter
WO2007004828A2 (en) 2005-06-30 2007-01-11 Lg Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
JP2009500656A (en) 2005-06-30 2009-01-08 エルジー エレクトロニクス インコーポレイティド Apparatus and method for encoding and decoding audio signals
EP1906706B1 (en) * 2005-07-15 2009-11-25 Panasonic Corporation Audio decoder
CA2646961C (en) * 2006-03-28 2013-09-03 Sascha Disch Enhanced method for signal shaping in multi-channel audio reconstruction
JP4875142B2 (en) 2006-03-28 2012-02-15 テレフオンアクチーボラゲット エル エム エリクソン(パブル) Method and apparatus for a decoder for multi-channel surround sound
ATE527833T1 (en) * 2006-05-04 2011-10-15 Lg Electronics Inc IMPROVE STEREO AUDIO SIGNALS WITH REMIXING
TWI308739B (en) 2006-06-23 2009-04-11 Mstar Semiconductor Inc Audio processing circuit and method
US7606716B2 (en) 2006-07-07 2009-10-20 Srs Labs, Inc. Systems and methods for multi-dialog surround audio
EP2070391B1 (en) 2006-09-14 2010-11-03 LG Electronics Inc. Dialogue enhancement techniques
US7463170B2 (en) 2006-11-30 2008-12-09 Broadcom Corporation Method and system for processing multi-rate audio from a plurality of audio processing sources
US8050434B1 (en) 2006-12-21 2011-11-01 Srs Labs, Inc. Multi-channel audio enhancement system
US8494840B2 (en) 2007-02-12 2013-07-23 Dolby Laboratories Licensing Corporation Ratio of speech to non-speech audio such as for elderly or hearing-impaired listeners
KR101336237B1 (en) * 2007-03-02 2013-12-03 삼성전자주식회사 Method and apparatus for reproducing multi-channel audio signal in multi-channel speaker system
US8515759B2 (en) 2007-04-26 2013-08-20 Dolby International Ab Apparatus and method for synthesizing an output signal
CA2701457C (en) * 2007-10-17 2016-05-17 Oliver Hellmuth Audio coding using upmix
UA101974C2 (en) 2008-04-18 2013-05-27 Долби Леборетериз Лайсенсинг Корпорейшн Method and apparatus for maintaining speech audibility in multi-channel audio with minimal impact on surround experience
US8831936B2 (en) * 2008-05-29 2014-09-09 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for speech signal processing using spectral contrast enhancement
EP2146522A1 (en) * 2008-07-17 2010-01-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating audio output signals using object based metadata
US8639502B1 (en) 2009-02-16 2014-01-28 Arrowhead Center, Inc. Speaker model-based speech enhancement system
ES2415155T3 (en) 2009-03-17 2013-07-24 Dolby International Ab Advanced stereo coding based on a combination of adaptively selectable left / right or center / side stereo coding and parametric stereo coding
RU2011147119A (en) 2009-04-21 2013-05-27 Конинклейке Филипс Электроникс Н.В. AUDIO SYNTHESIS
US8204742B2 (en) 2009-09-14 2012-06-19 Srs Labs, Inc. System for processing an audio signal to enhance speech intelligibility
WO2011044064A1 (en) * 2009-10-05 2011-04-14 Harman International Industries, Incorporated System for spatial extraction of audio signals
BR112012009447B1 (en) * 2009-10-20 2021-10-13 Voiceage Corporation AUDIO SIGNAL ENCODER, STNAI, AUDIO DECODER, METHOD FOR ENCODING OR DECODING AN AUDIO SIGNAL USING AN ALIASING CANCEL
US9324337B2 (en) * 2009-11-17 2016-04-26 Dolby Laboratories Licensing Corporation Method and system for dialog enhancement
TWI459828B (en) * 2010-03-08 2014-11-01 Dolby Lab Licensing Corp Method and system for scaling ducking of speech-relevant channels in multi-channel audio
BR112013033386B1 (en) * 2011-07-01 2021-05-04 Dolby Laboratories Licensing Corporation system and method for adaptive audio signal generation, encoding, and rendering
JP5856295B2 (en) 2011-07-01 2016-02-09 ドルビー ラボラトリーズ ライセンシング コーポレイション Synchronization and switchover methods and systems for adaptive audio systems
US8615394B1 (en) 2012-01-27 2013-12-24 Audience, Inc. Restoration of noise-reduced speech
EP2690621A1 (en) * 2012-07-26 2014-01-29 Thomson Licensing Method and Apparatus for downmixing MPEG SAOC-like encoded audio signals at receiver side in a manner different from the manner of downmixing at encoder side
US9055362B2 (en) 2012-12-19 2015-06-09 Duo Zhang Methods, apparatus and systems for individualizing audio, music and speech adaptively, intelligently and interactively
US10026408B2 (en) 2013-05-24 2018-07-17 Dolby International Ab Coding of audio scenes
EP2830047A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for low delay object metadata coding
WO2016050854A1 (en) * 2014-10-02 2016-04-07 Dolby International Ab Decoding method and decoder for dialog enhancement

Also Published As

Publication number Publication date
WO2016050854A1 (en) 2016-04-07
BR112017006325A2 (en) 2018-01-16
SG11201702301SA (en) 2017-04-27
RU2701055C2 (en) 2019-09-24
CA2962806A1 (en) 2016-04-07
MX2017004194A (en) 2017-05-19
EP3201918A1 (en) 2017-08-09
BR112017006325B1 (en) 2023-12-26
MX364166B (en) 2019-04-15
TW201627983A (en) 2016-08-01
KR102426965B1 (en) 2022-08-01
US10170131B2 (en) 2019-01-01
RU2017110842A3 (en) 2019-05-15
RU2017110842A (en) 2018-10-01
TWI575510B (en) 2017-03-21
CA2962806C (en) 2023-03-14
IL251263B (en) 2019-07-31
JP6728146B2 (en) 2020-07-22
US20170309288A1 (en) 2017-10-26
PL3201918T3 (en) 2019-04-30
AU2015326856B2 (en) 2021-04-08
EP3201918B1 (en) 2018-12-12
CN106796804B (en) 2020-09-18
KR20170063667A (en) 2017-06-08
ES2709327T3 (en) 2019-04-16
CN106796804A (en) 2017-05-31
MY179448A (en) 2020-11-06
JP2017534904A (en) 2017-11-24
AU2015326856A1 (en) 2017-04-06
IL251263A0 (en) 2017-05-29
DK3201918T3 (en) 2019-02-25

Similar Documents

Publication Publication Date Title
AU2021200911B2 (en) Method for and apparatus for decoding an ambisonics audio soundfield representation for audio playback using 2D setups
JP6472863B2 (en) Method for parametric multi-channel encoding
UA120372C2 (en) Decoding method and decoder for dialog enhancement
CA3125246A1 (en) Method and apparatus for compressing and decompressing a higher order ambisonics representation for a sound field
KR102482162B1 (en) Audio encoder and decoder
KR101637407B1 (en) Apparatus and method and computer program for generating a stereo output signal for providing additional output channels
UA119765C2 (en) Method and device for applying dynamic range compression to a higher order ambisonics signal
JP6275831B2 (en) Concept for generating a downmix signal
KR101464977B1 (en) Method of managing a memory and Method and apparatus of decoding multi channel data
RU2791673C1 (en) Downmix device and downmix method
KR101904420B1 (en) Decoding method of audio signal and decoding apparatus thereof
JP2016522445A (en) Audio encoding and decoding method, corresponding computer readable medium and corresponding audio encoder and decoder
ES2965084T3 (en) Determination of corrections to apply to a multichannel audio signal, associated encoding and decoding
US20210375293A1 (en) Downmixer and Method of Downmixing