RU2237296C2 - Method for encoding speech with function for altering comfort noise for increasing reproduction precision - Google Patents

Method for encoding speech with function for altering comfort noise for increasing reproduction precision Download PDF

Info

Publication number
RU2237296C2
RU2237296C2 RU2001117232/09A RU2001117232A RU2237296C2 RU 2237296 C2 RU2237296 C2 RU 2237296C2 RU 2001117232/09 A RU2001117232/09 A RU 2001117232/09A RU 2001117232 A RU2001117232 A RU 2001117232A RU 2237296 C2 RU2237296 C2 RU 2237296C2
Authority
RU
Russia
Prior art keywords
parameters
variability
background noise
values
noise
Prior art date
Application number
RU2001117232/09A
Other languages
Russian (ru)
Other versions
RU2001117232A (en
Inventor
Эрик ЭКУДДЕН (SE)
Эрик ЭКУДДЕН
Роар ХАГЕН (SE)
Роар ХАГЕН
Ингемар ЙОХАНССОН (SE)
Ингемар ЙОХАНССОН
Original Assignee
Телефонактиеболагет Лм Эрикссон (Пабл)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Телефонактиеболагет Лм Эрикссон (Пабл) filed Critical Телефонактиеболагет Лм Эрикссон (Пабл)
Publication of RU2001117232A publication Critical patent/RU2001117232A/en
Application granted granted Critical
Publication of RU2237296C2 publication Critical patent/RU2237296C2/en

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

FIELD: radio communications technology.
SUBSTANCE: method includes altering values of comfort noise parameters, usually used for generating comfort noise, quality of comfort noise is increased, generation of comfort noise is performed by means of device for speech decoding during time spans, in which speech is absent. Values of comfort noise parameter are altered in response to receiving information about changeability, matching parameter of comfort noise. Altered values of comfort noise parameters are then used for generation of comfort noise.
EFFECT: higher system capacity.
2 cl, 10 dwg

Description

Данная заявка на изобретение, согласно статье 35 USC 119(е) (1) свода законов США, имеет приоритет находящей в процессе одновременного рассмотрения предварительной заявки на патент США №60/109,555 с датой подачи 23 ноября 1998 г.This application for invention, in accordance with Section 35 of USC 119 (e) (1) of the U.S. Code, has priority in the process of simultaneous consideration of provisional patent application US No. 60 / 109,555 with a filing date of November 23, 1998.

ОБЛАСТЬ ТЕХНИКИFIELD OF TECHNOLOGY

Изобретение относится, в общем случае, к процессу кодирования речи, в частности к процессу кодирования речи, в котором в течение промежутков времени, в которых отсутствует речевая активность, создают искусственный фоновый шум.The invention relates, in General, to the process of encoding speech, in particular to a process for encoding speech, in which for periods of time in which there is no speech activity, create artificial background noise.

ПРЕДШЕСТВУЮЩИЙ УРОВЕНЬ ТЕХНИКИBACKGROUND OF THE INVENTION

Радиопередающие и радиоприемные устройства обычно снабжены устройствами соответственно кодирования и декодирования речи, которые взаимодействуют таким образом, что позволяют осуществлять передачу речевых сигналов между заданными передатчиком и приемником по линии радиосвязи. Совокупность устройства кодирования речи и устройства декодирования речи часто называют кодер-декодером речи. Типичным примером устройства связи, которое обычно содержит радиопередающее устройство, снабженное устройством кодирования речи, и радиоприемное устройство, снабженное устройством декодирования речи, является радиотелефон мобильной связи (например, телефонный аппарат сотовой связи).Radio transmitting and receiving devices are usually equipped with speech encoding and decoding devices, respectively, which interact in such a way that they allow the transmission of speech signals between a given transmitter and receiver via a radio link. The combination of a speech encoding device and a speech decoding device is often referred to as a speech codec. A typical example of a communication device, which typically comprises a radio transmitter equipped with a speech encoding device, and a radio receiver equipped with a speech decoding device, is a mobile radiotelephone (e.g., a cellular telephone).

В обычных устройствах, основанных на поблочном кодировании речи, входящий речевой сигнал разделяют на блоки, называемые кадрами. Для обычной телефонной связи с шириной полосы частот 4 кГц длина кадров обычно равна 20 миллисекундам (мс) или 160 выборкам. Кадры дополнительно разделяют на под-кадры, длина которых обычно равна 5 мс или 40 выборкам.In conventional devices based on block coding of speech, the incoming speech signal is divided into blocks called frames. For regular telephony with a 4 kHz bandwidth, the frame length is usually 20 milliseconds (ms) or 160 samples. Frames are further divided into sub-frames, the length of which is usually 5 ms or 40 samples.

В обычных устройствах кодирования с линейным предсказанием посредством анализа через синтез (ЛПАС) используют модели, обусловленные речеобразованием. Параметры модели, описывающие речевой тракт человека, основной тон речевого сигнала и т.д. извлекают из входного речевого сигнала. Вычисление медленно изменяющихся параметров обычно осуществляют для каждого кадра. Примерами таких параметров являются, в том числе, параметры КСП (краткосрочного предсказания, которые характеризуют речевой тракт устройства, создающего речевой сигнал. Одним из примеров параметров КСП являются коэффициенты линейного предсказания (КПП), которые отображают форму спектра входного речевого сигнала. Примерами более быстро изменяющихся параметров являются, в том числе, параметры основного тона и поправки на форму/усиление, вычисление которых обычно осуществляют для каждого подкадра.Conventional linear prediction coding devices through synthesis analysis (LPAS) use speech-conditioned models. Model parameters describing the human vocal tract, pitch of the speech signal, etc. extracted from the input speech signal. The calculation of slowly varying parameters is usually carried out for each frame. Examples of such parameters are, among other things, PCB parameters (short-term prediction, which characterize the speech path of the device generating the speech signal. One example of PCB parameters are linear prediction coefficients (PPC), which display the shape of the spectrum of the input speech signal. Examples of more rapidly changing The parameters are, among other things, pitch parameters and shape / gain corrections, which are usually calculated for each subframe.

Квантование извлеченных параметров осуществляют с использованием соответствующих известных способов скалярного и векторного квантования. Параметры КСП, например, линейные коэффициенты предсказания, часто преобразуют в более удобный для квантования вид, например, в виде частот с линейчатым спектром (ЧЛС). После квантования параметры передают по каналу связи в устройство декодирования.Quantization of the extracted parameters is carried out using the appropriate known methods of scalar and vector quantization. PCB parameters, for example, linear prediction coefficients, are often converted into a more convenient form for quantization, for example, in the form of frequencies with a linear spectrum (LS). After quantization, the parameters are transmitted over the communication channel to the decoding device.

В обычном устройстве декодирования ЛПАС обычно выполняют операции, противоположные вышеуказанным, и синтезируют речевой сигнал. Для улучшения качества восприятия обычно используют последующую фильтрацию синтезированного речевого сигнала.In a conventional LPAS decoding device, operations opposite to the above are usually performed and a speech signal is synthesized. Subsequent filtering of the synthesized speech signal is usually used to improve perceptual quality.

Для многих обычных типов фонового шума достаточно хорошую модель сигнала получают при значительно меньшей скорости передачи информации в битах, чем та, которая необходима для речевого сигнала. В существующих системах мобильной связи используют этот факт и осуществляют соответствующую регулировку скорости передачи информации в битах во время наличия фонового шума. В обычных системах, в которых применяют способы непрерывной передачи, в устройстве кодирования речи с переменной скоростью передачи (ПСП) может быть использована наиболее низкая скорость передачи информации в битах. В обычных схемах прерывистой передачи (ПРП), передатчик прекращает передачу закодированных кадров речевого сигнала при отсутствии активности говорящего абонента. Через одинаковые или неодинаковые промежутки времени (обычно через каждые 500 мс) передатчик осуществляет передачу надлежащих параметров речевого сигнала для генерации комфортного шума в устройстве декодирования. Кодирование этих параметров для генерации комфортного шума (ГКШ) обычно осуществляют в виде кадров, которые иногда называют кадрами дескриптора тишины (ДТШ). Устройство декодирования в приемнике использует параметры комфортного шума, принятые в кадрах ДТШ, для синтеза искусственного шума посредством обычного алгоритма введения комфортного шума (ВКШ).For many common types of background noise, a reasonably good signal model is obtained at a significantly lower bit rate than that needed for the speech signal. In existing mobile communication systems use this fact and carry out the appropriate adjustment of the bit rate during the presence of background noise. In conventional systems that employ continuous transmission methods, the variable bit rate (CSP) speech coding apparatus can use the lowest bit rate. In conventional discontinuous transmission (PRP) schemes, the transmitter stops transmitting encoded frames of the speech signal when there is no talking activity. At identical or unequal intervals (usually every 500 ms), the transmitter transmits the appropriate parameters of the speech signal to generate comfortable noise in the decoding device. The coding of these parameters to generate comfortable noise (GKSH) is usually carried out in the form of frames, which are sometimes called frames of the silence descriptor (DTSH). The decoding device in the receiver uses the comfort noise parameters adopted in the DTS frames to synthesize artificial noise using a conventional algorithm for introducing comfort noise (VCS).

После генерации комфортного шума в устройстве декодирования обычной системы ПРП шум обычно воспринимается как в высокой степени статический и сильно отличающийся от фонового шума, создаваемого в активном (не ПРП) режиме. Причина такого восприятия заключается в том, что передачу кадров ДТШ при ПРП выполняют реже, чем обычных кадров речевого сигнала. В кодер-декодерах ЛПАС, имеющих режим ПРП, обычно осуществляют оценку (например, усреднение) спектра и энергии фонового шума по нескольким кадрам, а затем вычисленные параметры квантуют и передают по каналу связи в устройство декодирования. На фиг.1 показан пример известного устройства кодирования комфортного шума, которое создает вышеуказанные оценочные параметры фонового шума (комфортного шума). Передачу квантованных параметров комфортного шума обычно осуществляют через каждые 100-500 мс.After comfortable noise is generated in the decoding device of a conventional PDP system, noise is usually perceived as highly static and very different from background noise generated in the active (non-PDP) mode. The reason for this perception is that the transmission of DTL frames during PDP is performed less frequently than ordinary frames of a speech signal. In LPAS codecs-decoders having a PDP mode, the spectrum and energy of background noise are usually estimated (for example, averaged) over several frames, and then the calculated parameters are quantized and transmitted over the communication channel to the decoding device. Figure 1 shows an example of a known device for encoding comfort noise, which creates the above estimated parameters of the background noise (comfort noise). The transmission of quantized comfort noise parameters is usually carried out every 100-500 ms.

Передача кадров ДТШ с низкой скоростью обновления вместо передачи обычных кадров речевого сигнала имеет двойное преимущество. Вследствие снижения потребляемой мощности продлевают ресурс аккумулятора, например, в приемопередатчике мобильной радиосвязи, и снижают помехи, создаваемые передатчиком, посредством чего обеспечивают более высокую пропускную способность системы.Transmitting DTS frames with a low update rate instead of transmitting conventional speech frames has a double advantage. Due to the reduction in power consumption, the battery life is extended, for example, in a mobile radio transceiver, and the interference caused by the transmitter is reduced, thereby providing a higher system throughput.

В обычном устройстве декодирования прием и декодирование параметров комфортного шума могут быть осуществлены так, как показано на фиг.2. Поскольку устройство декодирования не принимает новые параметры комфортного шума также часто, как принимаются параметры речевого сигнала, то для обеспечения плавного изменения параметров при синтезе комфортного шума в блоке 23 обычно выполняют интерполяцию параметров комфортного шума, принятых в кадрах ДТШ. При операции синтеза, обозначенной ссылочной позицией 25, устройство декодирования вводит в синтезирующий фильтр 27 возбуждение в виде нормированного по усилению случайного шума (например, белого шума) и интерполированные параметры спектра. В результате, созданный комфортный шум Sc(n) будет восприниматься как в высокой степени стационарный ("статический") вне зависимости от изменения свойств фонового шума s(n) в устройстве кодирования (см. фиг.1). Эта проблема более явно выражена для сильно изменяющихся фоновых шумов, таких как уличный шум и невнятный шум от многих источников (например, шум в ресторане), но она также возникает в случае автомобильного шума.In a conventional decoding device, reception and decoding of comfort noise parameters can be implemented as shown in FIG. Since the decoding device does not accept new comfort noise parameters as often as the parameters of the speech signal are received, in order to ensure a smooth change in the parameters during the synthesis of comfort noise, the block 23 usually interpolates the comfort noise parameters received in the DTS frames. In the synthesis operation, denoted by 25, the decoding device introduces into the synthesis filter 27 excitation in the form of a gain-normalized random noise (eg, white noise) and interpolated spectrum parameters. As a result, the created comfort noise S c (n) will be perceived as highly stationary (“static”) regardless of the change in the properties of the background noise s (n) in the encoding device (see FIG. 1). This problem is more pronounced for highly changing background noise, such as street noise and inarticulate noise from many sources (for example, noise in a restaurant), but it also occurs in the case of car noise.

Одним из традиционных подходов к решению этой проблемы "статического" комфортного шума является простое увеличение скорости обновления параметров комфортного шума при ПРП (например, использование более высокой скорости передачи кадров ДТШ). При подобном решении возникают такие проблемы, как увеличение энергопотребления аккумулятора (например, в приемопередатчике мобильной связи), обусловленное необходимостью более частой работы передатчика, и уменьшение пропускной способности системы вследствие увеличения скорости передачи кадров ДТШ. Поэтому в традиционных системах обычно соглашаются с неизбежностью наличия статического фонового шума.One of the traditional approaches to solving this problem of “static” comfort noise is to simply increase the update rate of comfort noise parameters during PDP (for example, using a higher transmission rate of DTS frames). With such a solution, problems arise such as an increase in battery power consumption (for example, in a mobile communications transceiver), due to the need for more frequent operation of the transmitter, and a decrease in system throughput due to an increase in the transmission speed of DTS frames. Therefore, in traditional systems, they usually agree with the inevitability of static background noise.

Следовательно, желательным является устранение вышеуказанных недостатков, связанных с традиционным способом генерации комфортного шума.Therefore, it is desirable to eliminate the above disadvantages associated with the traditional method of generating comfortable noise.

Согласно изобретению параметры комфортного шума, полученные посредством традиционного способа генерации, изменяют исходя из их свойств реального фонового шума, воспринимаемого устройством кодирования. Комфортный шум, генерируемый исходя из измененных параметров, воспринимается как менее статический по сравнению с комфортным шумом, генерация которого осуществлена традиционным способом, и более похожий на реальный фоновый шум, существующий в устройстве кодирования.According to the invention, comfort noise parameters obtained by the traditional generation method are changed based on their properties of real background noise perceived by the encoding device. Comfort noise generated from the changed parameters is perceived as less static compared to comfort noise generated in the traditional way and more similar to real background noise existing in the encoding device.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙBRIEF DESCRIPTION OF THE DRAWINGS

Фиг.1 - схематичное представление процесса получения параметров комфортного шума в обычном устройстве кодирования речи.Figure 1 is a schematic representation of a process for obtaining comfort noise parameters in a conventional speech encoding device.

Фиг.2 - схематичное представление процесса генерации комфортного шума в обычном устройстве декодирования речи.Figure 2 - schematic representation of the process of generating comfortable noise in a conventional speech decoding device.

Фиг.3 - блок-схема устройства изменения параметров комфортного шума, используемого при генерации комфортного шума согласно изобретению.Figure 3 is a block diagram of a device for changing comfort noise parameters used in generating comfort noise according to the invention.

Фиг.4 - пример варианта осуществления устройства изменения по фиг.3.Figure 4 is an example of an embodiment of the change device of Figure 3.

Фиг.5 - пример варианта осуществления устройства оценки изменчивости по фиг.4.5 is an example of an embodiment of the variability estimation apparatus of FIG. 4.

Фиг.5 - пример устройства управления сигналом ВЫБОРА по фиг.5.FIG. 5 is an example of a SELECT signal control device of FIG. 5.

Фиг.6 - пример варианта осуществления устройства изменения по фиг.3-фиг.5, в котором устройство оценки изменчивости по фиг.5 выполнено частично в устройстве кодирования и частично в устройстве декодирования.FIG. 6 is an example embodiment of the change device of FIG. 3 to FIG. 5, wherein the variability estimation device of FIG. 5 is implemented in part in an encoding device and in part in a decoding device.

Фиг.7 - примерный вариант операций, которые могут быть выполнены устройством изменения по фиг.3 - фиг.6.Fig.7 is an exemplary embodiment of operations that can be performed by the change device of Fig.3 - Fig.6.

Фиг.8 - пример осуществления этапа оценочного вычисления по фиг.7.Fig. 8 is an example implementation of the evaluation calculation step of Fig. 7.

Фиг.9 - блок-схема системы речевой связи, в которой могут быть реализованы варианты осуществления устройства изменения по фиг.3 - фиг.8.Fig.9 is a block diagram of a voice communication system in which embodiments of the change device of Fig.3 - Fig.8 can be implemented.

ПОДРОБНОЕ ОПИСАНИЕDETAILED DESCRIPTION

На фиг.3 показано устройство 30 изменения параметров комфортного шума для изменения параметров комфортного шума согласно изобретению. Согласно фиг.3, на вход 33 устройства 30 изменения подают обычные интерполированные параметры комфортного шума, например спектральные и энергетические параметры, полученные с выхода интерполятора 23 по фиг.2. Также на вход 31 устройства 30 изменения подают спектральные и энергетические параметры, соответствующие фоновому шуму, поступающему в устройство кодирования. Устройство 30 изменения изменяет полученные параметры комфортного шума исходя из параметров фонового шума, полученных с входа 31, и создает измененные параметры комфортного шума на выходе 35. Измененные параметры комфортного шума могут быть затем поданы, например, в блок 25 синтеза комфортного шума по фиг.2 для их использования в обычных операциях синтеза комфортного шума. Измененные параметры комфортного шума, сформированные на выходе 35, позволяют осуществлять в блоке 25 синтеза генерацию комфортного шума, который более точно воспроизводит реальный фоновый шум, поступающий в устройство кодирования речи.Figure 3 shows a device 30 for changing comfort noise parameters for changing comfort noise parameters according to the invention. According to figure 3, the input 33 of the device changes 30 serves the usual interpolated parameters of comfort noise, such as spectral and energy parameters obtained from the output of the interpolator 23 of figure 2. Also at the input 31 of the device 30 changes provide spectral and energy parameters corresponding to the background noise entering the encoding device. The change device 30 changes the obtained comfort noise parameters based on the background noise parameters obtained from the input 31, and creates the modified comfort noise parameters at the output 35. The modified comfort noise parameters can then be fed, for example, to the comfort noise synthesis unit 25 of FIG. 2 for use in conventional comfort noise synthesis operations. The modified comfort noise parameters generated at the output 35 allow the comfort noise generation in the synthesis unit 25 to more accurately reproduce the actual background noise entering the speech encoding device.

На фиг.4 показан пример варианта осуществления устройства 30 изменения параметров комфортного шума по фиг.3. Устройство 30 изменения содержит устройство 41 оценки изменчивости, соединенное со входом 31, осуществляющее прием спектральных и энергетических параметров фонового шума. Устройство 41 оценки изменчивости осуществляет оценку характеристик изменчивости параметров фонового шума и подает на выход 43 информацию, характеризующую изменчивость параметров фонового шума. В информации об изменчивости может быть указана степень изменчивости параметра относительно его среднего значения, например дисперсия параметра или максимальное отклонение параметра от его среднего значения.Figure 4 shows an example of an embodiment of a device 30 for changing comfort noise parameters of Figure 3. The change device 30 comprises a variability estimation device 41 connected to an input 31 that receives spectral and energy parameters of background noise. The device 41 estimates variability evaluates the characteristics of the variability of the parameters of the background noise and outputs 43 the information characterizing the variability of the parameters of the background noise. The variability information may indicate the degree of variability of the parameter relative to its average value, for example, the variance of the parameter or the maximum deviation of the parameter from its average value.

В информации об изменчивости, полученной на выходе 43, также могут быть указаны корреляционные характеристики, эволюция параметра во времени или другие критерии оценки изменчивости параметра во времени. В качестве примеров информации об изменчивости во времени могут быть приведены, в том числе, простые критерии оценки, такие как скорость изменения параметра (быстрые или медленные изменения), дисперсия параметра, максимальное отклонение от среднего значения, другие статистические критерии оценки, характеризующие изменчивость параметра, и более сложные критерии оценки, такие как автокорреляционные характеристики и коэффициенты фильтрации прогнозирующего устройства с автоматической регрессией (АР), оценочное вычисление которых выполнено исходя из значения параметра. Одним из примеров простого критерия оценки по скорости изменения является вычисление частоты перехода через ноль, то есть, сколько раз параметр меняет знак при просмотре последовательности значений параметра от первого значения параметра до последнего значения параметра. Информацию, полученную на выходе 43 устройства оценки 41, подают на вход устройства 45 объединения, которое объединяет информацию, полученную на выходе 43, с интерполированными параметрами комфортного шума, принимаемыми на входе 33, для формирования на выходе 35 измененных параметров комфортного шума.The information on the variability obtained at the output 43 may also indicate the correlation characteristics, the evolution of the parameter in time, or other criteria for assessing the variability of the parameter in time. Examples of information on time variability can be given, including simple evaluation criteria, such as the rate of change of a parameter (fast or slow changes), the variance of a parameter, the maximum deviation from the average value, other statistical evaluation criteria characterizing the variability of a parameter, and more complex evaluation criteria, such as autocorrelation characteristics and filter coefficients of a predictor with automatic regression (AR), the estimated calculation of which is performed but starting from the parameter values. One example of a simple criterion for evaluating the rate of change is to calculate the frequency of crossing through zero, that is, how many times the parameter changes sign when viewing a sequence of parameter values from the first parameter value to the last parameter value. The information obtained at the output 43 of the evaluation device 41 is fed to the input of the combining device 45, which combines the information received at the output 43 with the interpolated comfort noise parameters received at the input 33 to form the modified comfort noise parameters at the output 35.

На фиг.5 показан пример варианта осуществления устройства 41 оценки изменчивости по фиг.4. Устройство оценки по фиг.5 содержит устройство 51 определения среднего значения изменчивости, соединенное со входом 31, для приема спектральных и энергетических параметров фонового шума. Как описано выше, устройство 51 определения среднего значения изменчивости может определять средние значения характеристик изменчивости.FIG. 5 shows an example embodiment of the variability estimation apparatus 41 of FIG. 4. The evaluation device of FIG. 5 comprises an average variability determination device 51 connected to input 31 for receiving spectral and energy parameters of background noise. As described above, the apparatus 51 for determining the average value of the variability can determine the average values of the characteristics of the variability.

Например, если буфер 37 фонового шума из фиг.3 содержит 8 кадров и 32 подкадра, то анализ изменчивости буферизованных спектральных и энергетических параметров может быть выполнен следующим образом. Может быть выполнено вычисление среднего (или усредненного) значения буферизованных спектральных параметров (как обычно делают в устройствах кодирования ПРП для создания кадров ДТШ) и его вычитание из буферизованных значений спектрального параметра, посредством чего получают вектор значений отклонения по спектру. Точно так же может быть выполнено вычисление среднего значения буферизованных энергетических параметров по подкадру (как обычно делают в устройствах кодирования ПРП для создания кадров ДТШ), а затем его вычитание из буферизованных значений энергетического параметра в подкадре, посредством чего получают вектор отклонения значений по энергии. Следовательно, векторы отклонения по спектру и энергии содержат спектральные и энергетические параметры с исключенным средним значением. Векторы отклонения по спектру и энергии передают из устройства 51 определения изменчивости в запоминающее устройство 55 для вектора отклонения через тракт 52 связи.For example, if the background noise buffer 37 of FIG. 3 contains 8 frames and 32 subframes, then the variability analysis of buffered spectral and energy parameters can be performed as follows. The calculation of the average (or average) value of the buffered spectral parameters (as is usually done in PRP coding devices to create DTT frames) can be performed and its subtraction from the buffered values of the spectral parameter, whereby a vector of spectrum deviation values is obtained. In the same way, the calculation of the average value of the buffered energy parameters over a subframe can be performed (as is usually done in PRP coding devices to create DTT frames), and then its subtraction from the buffered values of the energy parameter in a subframe, whereby the energy deviation vector is obtained. Consequently, the spectrum and energy deviation vectors contain spectral and energy parameters with the mean value excluded. The spectrum and energy deviation vectors are transmitted from the variability determination device 51 to the storage device 55 for the deviation vector via the communication path 52.

Для того чтобы устройство 53 вычисления коэффициентов могло получать параметры фонового шума, его также соединяют со входом 31. Приведенное в качестве примера устройство 53 вычисления коэффициентов осуществляет обычные оценочные вычисления способом АР с использованием соответствующих спектральных и энергетических параметров. Полученные из оценочных вычислений способом АР коэффициенты фильтрации передают из устройства 53 вычисления коэффициентов в фильтр 57 через тракт 54 связи. Посредством коэффициентов фильтрации, вычисленных в устройстве 53, могут быть заданы, например, соответствующие фильтры полюсов для спектральных и энергетических параметров.In order that the coefficient calculating device 53 can obtain the background noise parameters, it is also connected to the input 31. An exemplary coefficient calculating device 53 performs conventional evaluative calculations by the AP method using the corresponding spectral and energy parameters. The filter coefficients obtained from the estimated calculations by the AP method are transmitted from the coefficient calculation device 53 to the filter 57 through the communication path 54. By means of the filtering coefficients calculated in the device 53, for example, corresponding pole filters for spectral and energy parameters can be set.

В одном из вариантов осуществления устройство 53 вычисления коэффициентов выполняет оценочные вычисления АР первого порядка как для спектральных, так и для энергетических параметров, вычисляя коэффициенты фильтрации a1=Rxx(1)/Rxx(0) для каждого параметра обычным способом. Значения Rxx(0) и Rxx(1) представляют собой обычные значения автокорреляционной функции конкретного параметра:In one embodiment, the coefficient calculator 53 performs first-order AP estimation calculations for both spectral and energy parameters, calculating filter coefficients a1 = Rxx (1) / Rxx (0) for each parameter in the usual way. The values of Rxx (0) and Rxx (1) are the usual values of the autocorrelation function of a particular parameter:

Figure 00000002
Figure 00000002

В этих операциях вычисления Rxx представляет собой параметр фонового шума (например, спектральный или энергетический). Положительное значение а1 в общем случае означает, что параметр изменяется медленно, а отрицательное значение в общем случае означает, что он изменяется быстро.In these calculation operations, Rxx is a background noise parameter (e.g. spectral or energetic). A positive value of a1 in the general case means that the parameter changes slowly, and a negative value in the general case means that it changes quickly.

Согласно одному из вариантов осуществления для каждого кадра спектральных параметров и для каждого подкадра энергетических параметров может быть, например, осуществлен выбор компоненты x(k) соответствующего вектора отклонения случайным образом (посредством входного сигнала ВЫБОР в запоминающем устройстве 55) и ее фильтрация посредством фильтра 57 с использованием соответствующих коэффициентов фильтрации. Затем выходной сигнал из фильтра нормируют, умножая его на постоянный масштабный коэффициент посредством устройства 59 масштабирования, например умножающего устройства. Нормированный выходной сигнал, обозначенный на фиг.5 как xp(k), подают на вход 43 устройства 45 объединения по фиг.4.According to one embodiment, for each frame of spectral parameters and for each subframe of energy parameters, for example, the component x (k) of the corresponding deviation vector can be selected randomly (by means of the SELECT input signal in memory 55) and filtered by a filter 57 s using appropriate filtering coefficients. Then, the output signal from the filter is normalized by multiplying it by a constant scaling factor by means of a scaling device 59, for example, a multiplying device. The normalized output signal, indicated in Fig. 5 as xp (k), is supplied to the input 43 of the combining device 45 in Fig. 4.

В одном из вариантов осуществления, который схематически изображен на фиг.5А, устройство 50 определения частоты перехода через ноль соединено с входом 31 для приема буферизованных параметров из блока 37. Устройство 50 определения определяет соответствующие частоты перехода через ноль спектральных и энергетических параметров. То есть для последовательности энергетических параметров, накопленных в буфере 37, а также для последовательности спектральных параметров, накопленных в буфере 37, устройство 50 определения частоты перехода через ноль определяет для соответствующей последовательности то, сколько раз значение соответствующего параметра меняет знак при просмотре буферизованной последовательности от первого значения параметра до последнего значения параметра. Затем эта информация о частоте перехода через ноль может быть использована в блоке 56 для управления сигналом ВЫБОР из фиг.5.In one embodiment, which is shown schematically in FIG. 5A, the zero crossing frequency determination device 50 is connected to an input 31 for receiving buffered parameters from block 37. The determining device 50 determines the corresponding zero and frequency transition frequencies of the spectral and energy parameters. That is, for the sequence of energy parameters accumulated in the buffer 37, as well as for the sequence of spectral parameters accumulated in the buffer 37, the zero crossing frequency determination device 50 determines for the corresponding sequence how many times the value of the corresponding parameter changes sign when viewing the buffered sequence from the first parameter values to the last parameter value. Then, this information on the zero-crossing frequency can be used in block 56 to control the SELECT signal from FIG. 5.

Например, для данного вектора отклонения управление сигналом ВЫБОР может быть выполнено для осуществления случайного выбора компонент x(k) вектора отклонения относительно более часто (с частотой каждого кадра или субкадра), если соответствующая этому параметру частота перехода через ноль относительно велика (что указывает на весьма большую изменчивость параметра), и для осуществления случайного выбора компонент x(k) вектора отклонения относительно менее часто (например, с меньшей частотой, чем частота каждого кадра или субкадра) в том случае, если соответствующая этому параметру частота перехода через ноль относительно низка (что указывает на весьма малую изменчивость параметра). В других вариантах осуществления частота выбора компонент x(k) данного вектора отклонения может быть установлена равной заранее заданному требуемому значению.For example, for a given deviation vector, the control of the SELECT signal can be performed to randomly select the components x (k) of the deviation vector relatively more often (with the frequency of each frame or subframe), if the zero crossing frequency corresponding to this parameter is relatively high (which indicates greater variability of the parameter), and to randomly select the components x (k) of the deviation vector, it is relatively less frequent (for example, with a lower frequency than the frequency of each frame or subframe) moreover, if the frequency of crossing through zero corresponding to this parameter is relatively low (which indicates a very small variability of the parameter). In other embodiments, the frequency of component selection x (k) of a given deviation vector may be set to a predetermined desired value.

Устройство объединения по фиг.4 выполняет объединение нормированного выходного сигнала xp(k) с обычными параметрами комфортного шума. Объединение спектральных параметров осуществляют по кадру, а энергетических параметров - по субкадру. В одном из примеров устройство 45 объединения может представлять собой сумматор, который просто добавляет сигнал xp(k) к обычным параметрам комфортного шума. Следовательно, нормированный выходной сигнал xp(k) (фиг.5) может рассматриваться в качестве возмущающего сигнала, который используется в устройстве 45 объединения для оказания возмущающего воздействия на обычные параметры комфортного шума, принятые на входе 33, для формирования измененных (или полученных в результате возмущающего воздействия) параметров комфортного шума, подаваемых на вход блока 25 синтеза комфортного шума (см. фиг. 2 - фиг.4).The combining device of FIG. 4 combines the normalized output signal xp (k) with the usual comfort noise parameters. The combination of spectral parameters is carried out on a frame, and energy parameters on a subframe. In one example, the combiner 45 may be an adder that simply adds the signal xp (k) to the normal comfort noise parameters. Therefore, the normalized output signal xp (k) (Fig. 5) can be considered as a disturbing signal, which is used in the combining device 45 to exert a disturbing effect on the usual comfort noise parameters received at input 33 to form altered (or resulting disturbing effect) of the comfort noise parameters supplied to the input of the comfort noise synthesis unit 25 (see Fig. 2 - Fig. 4).

Использование полученных в результате возмущающего воздействия параметров комфортного шума в обычном блоке 25 синтеза может быть выполнено традиционным способом. Вследствие наличия возмущающего воздействия на обычные параметры, созданный комфортный шум будет изменяться квазислучайным образом, что значительно улучшает качество восприятия для сильно меняющегося фона, например, для невнятного шума от многих источников и уличного шума, а также автомобильного шума. В качестве одного из примеров, возмущающий сигнал xp(k) может быть выражен следующим образом:The use of comfort noise parameters obtained as a result of the disturbing effect in a conventional synthesis unit 25 can be performed in a conventional manner. Due to the perturbation effect on the usual parameters, the generated comfortable noise will change in a quasi-random manner, which significantly improves the perception quality for a very changing background, for example, for slurred noise from many sources and street noise, as well as car noise. As one example, the disturbing signal xp (k) can be expressed as follows:

xp(k)=β х· (b0х· x(k)–a1x· γ х· (xp(k-1)),xp (k) = β x · (b0 x · x (k) –a1 x · γ x · (xp (k-1)),

где β х - масштабный коэффициент, b0х и a1x - коэффициенты фильтрации, a γ x - коэффициент расширения полосы частот.where β x is the scale factor, b0 x and a1 x are the filtering coefficients, and γ x is the coefficient of expansion of the frequency band.

Пунктирной линией на фиг.5 показан вариант осуществления, в котором операция фильтрации опущена, а возмущающий сигнал xp(k) содержит в себе нормированные компоненты вектора отклонения.The dotted line in FIG. 5 shows an embodiment in which the filtering operation is omitted, and the disturbing signal xp (k) contains the normalized components of the deviation vector.

В некоторых вариантах осуществления устройство 30 изменения по фиг.3 - фиг.5 полностью выполнено в составе устройства декодирования речи (см. фиг.9), а в других вариантах осуществления устройства изменения по фиг.3-5 распределено между устройством кодирования речи и устройством декодирования речи (см. пунктирные линии на фиг.9). В тех вариантах осуществления, в которых устройство 30 изменения полностью выполнено в устройстве декодирования, устройство декодирования должно опознавать параметры фонового шума, показанные на фиг.3. Это может быть выполнено посредством буферизации в блоке 37 требуемого количества (кадров и субкадров) спектральных и энергетических параметров, полученных из устройства кодирования через канал передачи. В схеме ПРП для принятия решения о том, что буфер 37 содержит только параметры, связанные с фоновым шумом, может быть использована неявная информация, обычно имеющаяся в устройстве декодирования. Например, в том случае, если буфер 37 может осуществить буферизацию N кадров, и если в режиме ПРП после фрагментов речи и до прерывания передачи используют N кадров блокировки при переходе (что является общепринятым), то, как известно, эти последние N кадров перед переключением в режим ПРП содержат только спектральные и энергетические параметры фонового шума. Как описано выше, эти параметры фонового шума могут быть затем использованы в устройстве 30 изменения.In some embodiments, the implementation of the change device 30 of FIG. 3 to FIG. 5 is completely implemented as part of a speech decoding device (see FIG. 9), and in other embodiments, the implementation of the change device of FIG. speech decoding (see dashed lines in FIG. 9). In those embodiments in which the change device 30 is completely implemented in the decoding device, the decoding device should recognize the background noise parameters shown in FIG. This can be done by buffering in block 37 the required number (frames and subframes) of spectral and energy parameters obtained from the encoding device through the transmission channel. In the PDP scheme, in order to decide that the buffer 37 contains only the parameters associated with background noise, the implicit information typically found in the decoding device can be used. For example, if the buffer 37 can buffer N frames, and if in the PDP mode, after N speech fragments and before the transmission is interrupted, N blocking frames are used during the transition (which is common), then, as is known, these last N frames before switching The PDP mode contains only the spectral and energy parameters of background noise. As described above, these background noise parameters can then be used in the change device 30.

В тех вариантах осуществления, в которых устройство 30 изменения распределено между устройством кодирования и устройством декодирования, устройство 51 определения среднего значения изменчивости и устройство 53 вычисления коэффициентов могут быть предусмотрены в устройстве кодирования. Следовательно, в таких вариантах осуществления тракты 52 и 54 связи аналогичны обычному каналу связи, используемому для передачи обычных параметров комфортного шума из устройства кодирования в устройство декодирования (см. фиг.1 и 2). В частности, как показано на фиг.6, тракты 52 и 54 проходят через устройство квантования (см. также фиг.1), канал связи (см. также фиг.1 и 2) и блок выполнения операции, обратной квантованию (см. также фиг.2), к запоминающему устройству 55 и к фильтру 57 (см. также фиг.5). Что касается информации о среднем значении изменчивости и коэффициентов фильтрации АР, могут быть применены известные способы квантования скалярных значений и коэффициенты фильтрации АР.In those embodiments in which the change device 30 is distributed between the encoding device and the decoding device, the average variability value determining device 51 and the coefficient calculating device 53 may be provided in the encoding device. Therefore, in such embodiments, the communication paths 52 and 54 are similar to the conventional communication channel used to transmit conventional comfort noise parameters from the encoding device to the decoding device (see FIGS. 1 and 2). In particular, as shown in FIG. 6, paths 52 and 54 pass through a quantization device (see also FIG. 1), a communication channel (see also FIGS. 1 and 2) and an inverse quantization operation block (see also figure 2), to the storage device 55 and to the filter 57 (see also figure 5). As for the information on the average value of the variability and AR filter coefficients, known methods for quantizing scalar values and AR filter coefficients can be applied.

При использовании обычных средств в устройстве кодирования известно о наличии спектральных и энергетических параметров фонового шума, доступных для обработки посредством устройства 51 определения среднего значения изменчивости и устройства 53 вычисления коэффициентов, поскольку те же самые спектральные и энергетические параметры обычно используют в устройстве кодирования для создания обычных параметров комфортного шума. В традиционных устройствах кодирования среднее значение энергии и среднее значение спектрального распределения обычно вычисляют по нескольким кадрам и осуществляют передачу этих средних значений спектральных и энергетических параметров в устройство декодирования в качестве параметров комфортного шума. Поскольку требуется передавать коэффициенты фильтрации, полученные из устройства 53 вычисления коэффициентов, и векторы отклонения, полученные из устройства 51 определения среднего значения изменчивости, из устройства кодирования в устройство декодирования по каналу передачи, как показано на Фиг.6, то необходимо обеспечить дополнительную ширину полосы частот в том случае, когда устройство изменения является распределенным между устройством кодирования и устройством декодирования. В противном случае, когда устройство изменения выполнено полностью в устройстве декодирования, для его осуществления не требуется никакого дополнительного расширения полосы частот.Using conventional means in the encoding device, it is known that the spectral and energy parameters of background noise are available for processing by means of the average variability determination device 51 and coefficient calculating device 53, since the same spectral and energy parameters are usually used in the encoding device to create ordinary parameters comfortable noise. In traditional encoding devices, the average energy value and the average spectral distribution value are usually calculated over several frames and these average spectral and energy parameters are transmitted to the decoding device as comfort noise parameters. Since it is required to transmit filter coefficients obtained from coefficient calculator 53 and deviation vectors obtained from mean variability determination device 51 from an encoding device to a decoding device over a transmission channel, as shown in FIG. 6, it is necessary to provide additional bandwidth in the case where the change device is distributed between the encoding device and the decoding device. Otherwise, when the change device is completely implemented in the decoding device, no additional bandwidth extension is required to implement it.

На фиг.7 показаны примеры описанных выше операций, которые могут быть выполнены посредством устройства изменения в вариантах осуществления по фиг.3-5. На этапе 71 определяют, соответствуют ли имеющиеся спектральные и энергетические параметры (например, в буфере 37 из фиг.3) речи или же фоновому шуму. Если имеющиеся параметры соответствуют фоновому шуму, то на этапе 73 вычисляют оценочные значения характеристик фонового шума, например среднее значение изменчивости и степень изменчивости во времени. После этого на этапе 75 в интерполированные параметры комфортного шума вносят возмущение в соответствии с оценочными значениями характеристик фонового шума. Процесс возмущения на этапе 75 выполняют до тех пор, пока на этапе 77 не будет обнаружен фоновый шум. Если на этапе 77 обнаружена речевая активность, то переходят к этапу 71, на котором ожидают получения дополнительных параметров фонового шума.7 shows examples of the above operations that can be performed by the change device in the embodiments of FIGS. 3-5. At step 71, it is determined whether the available spectral and energy parameters (for example, in buffer 37 of FIG. 3) correspond to speech or background noise. If the available parameters correspond to background noise, then at step 73, estimated values of the background noise characteristics are calculated, for example, the average value of the variability and the degree of variability over time. After that, at step 75, a disturbance is introduced into the interpolated comfort noise parameters in accordance with the estimated values of the background noise characteristics. The perturbation process in step 75 is performed until, in step 77, background noise is detected. If speech activity is detected in step 77, then go to step 71, where they expect to receive additional background noise parameters.

На фиг.8 показан пример операций, которые могут быть осуществлены при выполнении на этапе 73 оценочного вычисления (фиг.7). В процессе обработки на этапе 81 учитывают N кадров и kN подкадров, которые соответствуют вышеупомянутым N буферизованным кадрам. В одном из вариантов осуществления N=8, a k=4. На этапе 83 получают вектор отклонений по спектру, имеющий N компонент, а на этапе 85 получают вектор отклонений по энергии, имеющий kN компонент. На этапе 87 осуществляют выбор компоненты (например, случайным образом) из каждого вектора отклонения. На этапе 89 вычисляют коэффициенты фильтрации и производят соответствующую фильтрацию выбранных компонент векторов. На этапе 88 отфильтрованные векторные компоненты нормируют, создавая возмущающий сигнал, который используют на этапе 75 (фиг.7). Пунктирная линия на фиг.8 соответствует вариантам осуществления, обозначенным на фиг.5 пунктирной линией, то есть вариантам осуществления, в которых опущена фильтрация, а в качестве параметров возмущения используют нормированные компоненты вектора отклонения.On Fig shows an example of operations that can be performed when performing at step 73 of the evaluation calculation (Fig.7). In the processing in step 81, N frames and kN subframes that correspond to the aforementioned N buffered frames are taken into account. In one embodiment, N = 8, a k = 4. At step 83, a spectrum deviation vector having an N component is obtained, and at step 85, an energy deviation vector having a kN component is obtained. At step 87, a component is selected (e.g., randomly) from each deviation vector. At 89, filter coefficients are calculated and the selected components of the vectors are filtered accordingly. At step 88, the filtered vector components are normalized, creating a disturbing signal, which is used at step 75 (Fig.7). The dashed line in Fig. 8 corresponds to the embodiments indicated in Fig. 5 by a dashed line, that is, embodiments in which filtering is omitted, and normalized components of the deviation vector are used as perturbation parameters.

На фиг.9 показан пример системы речевой связи, в которой могут быть реализованы варианты осуществления устройства изменения параметров комфортного шума по фиг.3 - 8. Передатчик (ПРД) содержит устройство 91 кодирования речи, которое поддерживает связь с устройством 93 декодирования речи в приемнике (ЦРМ) через канал 95 передачи. Передатчик по фиг.9, приемник по фиг.9, либо оба из них могут являться частью, например, радиотелефона или иной составной части системы радиосвязи. Канал 95 может содержать, например, канал радиосвязи. Как показано на фиг.9, варианты осуществления устройства изменения по фиг.3-8 могут быть реализованы в устройстве декодирования, либо, как описано выше со ссылками на фиг.5 и 6, могут быть распределены между устройством кодирования и устройством декодирования (см. пунктирные линии).FIG. 9 shows an example of a voice communication system in which embodiments of the device for changing comfort noise parameters of FIGS. 3 to 8 can be implemented. The transmitter (TX) comprises a speech encoding device 91 that communicates with a voice decoding device 93 in a receiver ( CRM) through transmission channel 95. The transmitter of FIG. 9, the receiver of FIG. 9, or both of them may be part of, for example, a radiotelephone or other component of a radio communication system. Channel 95 may comprise, for example, a radio channel. As shown in FIG. 9, the embodiments of the change device of FIGS. 3-8 can be implemented in a decoding device, or, as described above with reference to FIGS. 5 and 6, can be distributed between the encoding device and the decoding device (see dashed lines).

Для специалистов в данной области техники очевидно, что приведенные на фиг.3-9 варианты осуществления могут быть легко реализованы в обычных устройствах кодирования-декодирования речи, например, посредством надлежащих видоизменений программного обеспечения и/или аппаратных средств.It will be apparent to those skilled in the art that the embodiments shown in FIGS. 3 through 9 can be easily implemented in conventional speech encoding-decoding devices, for example, by appropriate modifications of software and / or hardware.

Описанное выше изобретение улучшает естественность фонового шума (без выделения дополнительной ширины полосы частот или дополнительных затрат мощности в некоторых вариантах осуществления). Это позволяет реализовать в устройствах кодирования-декодирования речи более незаметное и, следовательно, более приемлемое для человеческого уха переключение между режимами наличия речи и отсутствия речи.The invention described above improves the naturalness of background noise (without highlighting additional bandwidth or additional power costs in some embodiments). This allows you to implement in devices encoding-decoding of speech more invisible and, therefore, more acceptable for the human ear, switching between the modes of speech presence and absence of speech.

Несмотря на то, что подробное описание было приведено выше для вариантов осуществления настоящего изобретения, служащих в качестве примеров, это не ограничивает объем изобретения, которое может быть реализовано на практике в различных вариантах осуществления.Although the detailed description has been given above for embodiments of the present invention, serving as examples, this does not limit the scope of the invention, which can be practiced in various embodiments.

Claims (26)

1. Способ генерации комфортного шума в устройстве (93) декодирования речи, которое принимает информацию речевого сигнала и шума из канала (95) связи, включающий формирование множества значений (33) спектральных и энергетических параметров комфортного шума, обычно используемых в устройстве (93) декодирования речи для генерации комфортного шума, отличающийся тем, что включает этапы, при которых получают информацию (31) об изменчивости, которая указывает степень изменчивости спектральных и энергетических параметров (37) фонового шума, испытываемой устройством кодирования, в ответ на информацию об изменчивости осуществляют изменение (30) значений (33) спектральных и энергетических параметров комфортного шума для формирования измененных значений (35) спектральных и энергетических параметров комфортного шума и используют измененные значения (35) спектральных и энергетических параметров комфортного шума для генерации комфортного шума (25), причем информация об изменчивости указывает, как изменяются спектральные и энергетические параметры фонового шума относительно по меньшей мере одной из следующих величин: времени и средних значений параметров фонового шума.1. A method for generating comfort noise in a speech decoding device (93), which receives speech signal and noise information from a communication channel (95), including generating a plurality of values (33) of spectral and energy parameters of comfort noise typically used in a decoding device (93) speech for generating comfortable noise, characterized in that it includes the steps in which information (31) on the variability is obtained, which indicates the degree of variability of the spectral and energy parameters (37) of the background noise experienced the coding device, in response to the variability information, change (30) the values (33) of the spectral and energy parameters of the comfort noise to generate changed values (35) of the spectral and energy parameters of the comfort noise and use the changed values (35) of the spectral and energy parameters of the comfort noise to generate comfortable noise (25), and the variability information indicates how the spectral and energy parameters of the background noise change with respect to at least one th of the following variables: time and the average values of the background noise parameters. 2. Способ по п.1, отличающийся тем, что упомянутый этап получения включает вычисление средних значений (51) спектральных и энергетических параметров фонового шума по множеству значений спектральных и энергетических параметров (37) фонового шума и вычитание среднего значения из каждого соответствующего значения параметра (37) фонового шума для формирования множества значений (55) отклонения.2. The method according to claim 1, characterized in that said step of obtaining includes calculating average values (51) of spectral and energy parameters of background noise from a plurality of values of spectral and energy parameters (37) of background noise and subtracting the average value from each corresponding parameter value ( 37) background noise to form a plurality of deviation values (55). 3. Способ по п.2, отличающийся тем, что упомянутый этап изменения включает случайный выбор одного из упомянутых значений отклонения, масштабирование выбранного случайным образом значения отклонения посредством умножения на масштабный коэффициент для формирования масштабированного значения отклонения, и объединение масштабированного значения отклонения с соответствующим значением (33) параметра комфортного шума для формирования одного из измененных значений (35) параметра комфортного шума.3. The method according to claim 2, characterized in that said step of changing includes randomly selecting one of the mentioned deviation values, scaling the random deviation value by multiplying by a scale factor to form a scaled deviation value, and combining the scaled deviation value with the corresponding value ( 33) comfort noise parameter to form one of the changed values (35) of the comfort noise parameter. 4. Способ по п.1, отличающийся тем, что устройство (93) декодирования речи предусмотрено в устройстве радиосвязи.4. The method according to claim 1, characterized in that the speech decoding device (93) is provided in the radio communication device. 5. Способ по п.4, отличающийся тем, что устройство (93) декодирования речи предусмотрено в сотовом телефоне.5. The method according to claim 4, characterized in that the device (93) for decoding speech is provided in a cell phone. 6. Способ по п.1, отличающийся тем, что упомянутый этап получения включает получение в устройстве (93) декодирования речи информации (31) об изменчивости независимо от канала (95) связи.6. The method according to claim 1, characterized in that the said receiving step includes receiving information (31) on the variability in the speech decoding apparatus (93) independently of the communication channel (95). 7. Способ по п.1, отличающийся тем, что упомянутый этап получения включает прием устройством (93) декодирования речи информации (31) об изменчивости из устройства (91) кодирования речи через канал (95) связи.7. The method according to claim 1, characterized in that the said receiving step includes receiving, by the speech decoding apparatus (93), information on variability from the speech encoding apparatus (91) through the communication channel (95). 8. Способ по п.1, отличающийся тем, что информация (31) об изменчивости включает в себя информацию об изменчивости относительно среднего значения, указывающую, как изменяются спектральные и энергетические параметры фонового шума относительно средних значений спектральных и энергетических параметров (37) фонового шума.8. The method according to claim 1, characterized in that the variability information (31) includes variability information with respect to the average value indicating how the spectral and energy parameters of the background noise change relative to the average values of the spectral and energy parameters (37) of the background noise . 9. Способ по п.8, отличающийся тем, что упомянутый этап получения включает использование множества значений каждого из параметров (37) фонового шума для вычисления средних значений (51) параметров (37) фонового шума в течение интервала времени и сравнение средних значений по меньшей мере с некоторыми из соответствующих значений (37) параметров фонового шума для формирования значений параметров фонового шума с исключенным средним значением.9. The method according to claim 8, characterized in that said obtaining step includes using a plurality of values of each of the background noise parameters (37) to calculate average values (51) of the background noise parameters (37) over a time interval and comparing average values of at least with some of the corresponding values (37) of the background noise parameters for generating background noise parameter values with the average value excluded. 10. Способ по п.9, отличающийся тем, что упомянутый этап получения включает использование множества значений параметров (37) фонового шума для вычисления коэффициентов (89) фильтрации и фильтрацию, по меньшей мере, некоторых из значений параметров (37) фонового шума с исключенным средним значением в соответствии с коэффициентами фильтрации.10. The method according to claim 9, characterized in that said step of obtaining comprises using a plurality of background noise parameter values (37) to calculate filtering coefficients (89) and filtering at least some of the background noise parameter values (37) with excluded average value in accordance with the filtering coefficients. 11. Способ по п.10, отличающийся тем, что упомянутый этап использования включает вычисление коэффициентов фильтрации фильтра прогнозирующего устройства с автоматической регрессией.11. The method according to claim 10, characterized in that the said use phase includes calculating filter coefficients of a filter of a predictive device with automatic regression. 12. Способ по п.8, отличающийся тем, что информация (31) об изменчивости включает в себя информацию об изменчивости во времени, указывающую, как изменяются параметры (37) фонового шума во времени.12. The method according to claim 8, characterized in that the variability information (31) includes time variability information indicating how the background noise parameters (37) change over time. 13. Способ по п.1, отличающийся тем, что информация (31) об изменчивости включает в себя информацию об изменчивости во времени, указывающую, как изменяются параметры фонового шума во времени.13. The method according to claim 1, characterized in that the variability information (31) includes time variability information indicating how the background noise parameters change over time. 14. Устройство для формирования параметров (33) комфортного шума, используемое для генерации комфортного шума в устройстве (93) декодирования речи, которое принимает информацию речевого сигнала и шума из канала (95) связи, содержащее первый вход (33) для подачи множества значений (33) спектральных и энергетических параметров комфортного шума, обычно используемых в устройстве (93) декодирования речи для генерации комфортного шума, и второй вход (31) для подачи спектральных и энергетических параметров (37) фонового шума, отличающееся тем, что дополнительно содержит устройство (30) изменения, соединенное с первым (33) и вторым (31) входами и реагирующее на характеристики изменчивости спектральных и энергетических параметров (51) фонового шума, для изменения значений (33) спектральных и энергетических параметров комфортного шума для формирования измененных значений (30) спектральных и энергетических параметров комфортного шума, и выход (35), соединенный с устройством (30) изменения, для выдачи измененных значений (30) спектральных и энергетических параметров комфортного шума для их использования при генерации комфортного шума, причем характеристики изменчивости спектральных и энергетических параметров фонового шума указывают, как изменяются спектральные и энергетические параметры фонового шума относительно, по меньшей мере, одной из следующих величин: времени и средних значений параметров фонового шума.14. Device for generating comfort noise parameters (33) used to generate comfort noise in a speech decoding device (93) that receives speech signal and noise information from a communication channel (95) containing a first input (33) for supplying a plurality of values ( 33) spectral and energy parameters of comfortable noise, usually used in a speech decoding device (93) for generating comfortable noise, and a second input (31) for supplying spectral and energy parameters (37) of background noise, characterized in that It contains a change device (30) connected to the first (33) and second (31) inputs and responsive to the variability characteristics of the spectral and energy parameters (51) of the background noise, for changing values (33) of the spectral and energy parameters of the comfort noise to form altered the values (30) of the spectral and energy parameters of the comfort noise, and the output (35) connected to the device (30) changes for issuing the changed values (30) of the spectral and energy parameters of the comfort noise for their use and generating comfortable noise, wherein the variability characteristics of the spectral and energy parameters of the background noise indicate how the spectral and energy parameters of the background noise change with respect to at least one of the following values: time and average values of the background noise parameters. 15. Устройство по п.14, отличающееся тем, что устройство (30) изменения содержит устройство (41) оценки изменчивости, соединенное с вторым входом (31) и реагирующее на параметры (37) фонового шума, для формирования указанной информации об изменчивости.15. The device according to 14, characterized in that the change device (30) comprises a variability estimation device (41) connected to a second input (31) and responsive to background noise parameters (37) to generate said variability information. 16. Устройство по п.15, отличающееся тем, что устройство оценки изменчивости содержит устройство (51) определения среднего значения изменчивости для формирования информации (31) об изменчивости относительно среднего значения, указывающей, как изменяются параметры (37) фонового шума относительно средних значений параметров (37) фонового шума.16. The device according to p. 15, characterized in that the device for assessing variability contains a device (51) for determining the average value of variability for generating information (31) about variability relative to the average value indicating how the background noise parameters (37) change with respect to the average values of the parameters (37) background noise. 17. Устройство по п.16, отличающееся тем, что устройство (51) определения среднего значения изменчивости содержится в устройстве (93) декодирования речи.17. The device according to clause 16, wherein the device (51) for determining the average value of the variability is contained in the speech decoding device (93). 18. Устройство по п.16, отличающееся тем, что устройство (51) определения среднего значения изменчивости содержится в устройстве (91) кодирования речи, которое осуществляет связь с устройством (93) декодирования речи через канал (95) связи.18. The device according to p. 16, characterized in that the device (51) for determining the average value of the variability is contained in the speech encoding device (91), which communicates with the speech decoding device (93) through the communication channel (95). 19. Устройство по п.16, отличающееся тем, что устройство (51) определения среднего значения изменчивости в ответ на получение множества значений параметров (37) фонового шума осуществляет вычисление средних значений параметров (37) фонового шума на интервале времени (51) и дополнительно сравнивает средние значения, по меньшей мере, с некоторыми из значений параметров (37) фонового шума для формирования значений параметров (37) фонового шума с исключенным средним значением.19. The device according to clause 16, characterized in that the device (51) for determining the average value of the variability in response to receiving a plurality of background noise parameter values (37) calculates the average values of the background noise parameters (37) over a time interval (51) and additionally compares the average values with at least some of the values of the background noise parameters (37) to generate the values of the background noise parameters (37) with the excluded average value. 20. Устройство по п.19, отличающееся тем, что информация (31) об изменчивости включает в себя информацию об изменчивости во времени, указывающую, как изменяются параметры (37) фонового шума во времени.20. The device according to claim 19, characterized in that the variability information (31) includes time variability information indicating how the background noise parameters (37) change over time. 21. Устройство по п.20, отличающееся тем, что устройство (41) оценки изменчивости содержит устройство (53) вычисления коэффициентов, которое в ответ на получение множества значений параметров (37) фонового шума осуществляет вычисление коэффициентов (89) фильтрации, причем указанная информация об изменчивости во времени включает в себя коэффициенты фильтрации.21. The device according to claim 20, characterized in that the variability estimation device (41) comprises a coefficient calculation device (53), which, in response to receiving a plurality of background noise parameter values (37), calculates filtering coefficients (89), said information Variability over time includes filter coefficients. 22. Устройство по п.21, отличающееся тем, что коэффициенты фильтрации являются коэффициентами фильтрации фильтра прогнозирующего устройства с автоматической регрессией.22. The device according to item 21, wherein the filter coefficients are filter coefficients of a filter of a predictive device with automatic regression. 23. Устройство по п.21, отличающееся тем, что содержит фильтр (57), соединенный с устройством (53) вычисления коэффициентов для приема из него коэффициентов фильтрации и соединенный с устройством (51) определения среднего значения изменчивости для фильтрации, по меньшей мере, некоторых из значений параметров фонового шума с исключенным средним значением в соответствии с коэффициентами фильтрации.23. The device according to item 21, characterized in that it contains a filter (57) connected to a device (53) for calculating coefficients for receiving filter coefficients from it and connected to a device (51) for determining the average value of the variability for filtering, at least some of the values of the background noise parameters with the excluded average value in accordance with the filtering coefficients. 24. Устройство по п.21, отличающееся тем, что устройство вычисления коэффициентов содержится в устройстве декодирования речи.24. The device according to item 21, wherein the coefficient calculation device is contained in a speech decoding device. 25. Устройство по п.21, отличающееся тем, что устройство (53) вычисления коэффициентов содержится в устройстве (91) кодирования речи, которое осуществляет связь с устройством (93) декодирования речи через канал (95) связи.25. The device according to item 21, wherein the coefficient calculation device (53) is contained in a speech encoding device (91) that communicates with a speech decoding device (93) through a communication channel (95). 26. Устройство по п.15, отличающееся тем, что информация (31) об изменчивости включает в себя информацию об изменчивости во времени, указывающую, как изменяются параметры фонового шума во времени.26. The device according to p. 15, characterized in that the information (31) about the variability includes information about the variability in time, indicating how the parameters of the background noise change over time.
RU2001117232/09A 1998-11-23 1999-11-08 Method for encoding speech with function for altering comfort noise for increasing reproduction precision RU2237296C2 (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US10955598P 1998-11-23 1998-11-23
US60/109,555 1998-11-23
US09/391,768 1999-09-08

Publications (2)

Publication Number Publication Date
RU2001117232A RU2001117232A (en) 2003-06-10
RU2237296C2 true RU2237296C2 (en) 2004-09-27

Family

ID=33434391

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2001117232/09A RU2237296C2 (en) 1998-11-23 1999-11-08 Method for encoding speech with function for altering comfort noise for increasing reproduction precision

Country Status (1)

Country Link
RU (1) RU2237296C2 (en)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2454737C2 (en) * 2008-02-19 2012-06-27 Сименс Энтерпрайз Коммьюникейшнз Гмбх Унд Ко.Кг Method and apparatus for decoding background noise information
RU2461080C2 (en) * 2008-02-19 2012-09-10 Сименс Энтерпрайз Коммьюникейшнз Гмбх Унд Ко.Кг Method and means for encoding background noise information
RU2469419C2 (en) * 2007-03-05 2012-12-10 Телефонактиеболагет Лм Эрикссон (Пабл) Method and apparatus for controlling smoothing of stationary background noise
RU2512103C2 (en) * 2008-07-11 2014-04-10 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Noise background, apparatus for processing noise background, method of providing noise background parameters, method of providing spectral representation of audio signal noise background, computer program and encoded audio signal
US8949121B2 (en) 2008-02-19 2015-02-03 Unify Gmbh & Co. Kg Method and means for encoding background noise information
US9583114B2 (en) 2012-12-21 2017-02-28 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Generation of a comfort noise with high spectro-temporal resolution in discontinuous transmission of audio signals
RU2648953C2 (en) * 2013-01-29 2018-03-28 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Noise filling without side information for celp-like coders
US10147432B2 (en) 2012-12-21 2018-12-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Comfort noise addition for modeling background noise at low bit-rates
RU2754497C1 (en) * 2020-11-17 2021-09-02 федеральное государственное автономное образовательное учреждение высшего образования "Казанский (Приволжский) федеральный университет" (ФГАОУ ВО КФУ) Method for transmission of speech files over a noisy channel and apparatus for implementation thereof

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9318117B2 (en) 2007-03-05 2016-04-19 Telefonaktiebolaget Lm Ericsson (Publ) Method and arrangement for controlling smoothing of stationary background noise
RU2469419C2 (en) * 2007-03-05 2012-12-10 Телефонактиеболагет Лм Эрикссон (Пабл) Method and apparatus for controlling smoothing of stationary background noise
RU2461080C2 (en) * 2008-02-19 2012-09-10 Сименс Энтерпрайз Коммьюникейшнз Гмбх Унд Ко.Кг Method and means for encoding background noise information
RU2454737C2 (en) * 2008-02-19 2012-06-27 Сименс Энтерпрайз Коммьюникейшнз Гмбх Унд Ко.Кг Method and apparatus for decoding background noise information
US8949121B2 (en) 2008-02-19 2015-02-03 Unify Gmbh & Co. Kg Method and means for encoding background noise information
US9711157B2 (en) 2008-07-11 2017-07-18 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, methods for encoding and decoding an audio signal, and a computer program
US11024323B2 (en) 2008-07-11 2021-06-01 Fraunhofer-Gesellschaft zur Fcerderung der angewandten Forschung e.V. Audio encoder, audio decoder, methods for encoding and decoding an audio signal, audio stream and a computer program
US8983851B2 (en) 2008-07-11 2015-03-17 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Noise filer, noise filling parameter calculator encoded audio signal representation, methods and computer program
US9449606B2 (en) 2008-07-11 2016-09-20 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, methods for encoding and decoding an audio signal, and a computer program
RU2512103C2 (en) * 2008-07-11 2014-04-10 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Noise background, apparatus for processing noise background, method of providing noise background parameters, method of providing spectral representation of audio signal noise background, computer program and encoded audio signal
US11869521B2 (en) 2008-07-11 2024-01-09 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, methods for encoding and decoding an audio signal, audio stream and a computer program
US9043203B2 (en) 2008-07-11 2015-05-26 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, methods for encoding and decoding an audio signal, and a computer program
US10629215B2 (en) 2008-07-11 2020-04-21 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, methods for encoding and decoding an audio signal, and a computer program
US9583114B2 (en) 2012-12-21 2017-02-28 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Generation of a comfort noise with high spectro-temporal resolution in discontinuous transmission of audio signals
RU2650025C2 (en) * 2012-12-21 2018-04-06 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Generation of a comfort noise with high spectro-temporal resolution in discontinuous transmission of audio signals
US10147432B2 (en) 2012-12-21 2018-12-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Comfort noise addition for modeling background noise at low bit-rates
US10339941B2 (en) 2012-12-21 2019-07-02 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Comfort noise addition for modeling background noise at low bit-rates
US10789963B2 (en) 2012-12-21 2020-09-29 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Comfort noise addition for modeling background noise at low bit-rates
US10269365B2 (en) 2013-01-29 2019-04-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Noise filling without side information for CELP-like coders
US10984810B2 (en) 2013-01-29 2021-04-20 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Noise filling without side information for CELP-like coders
RU2648953C2 (en) * 2013-01-29 2018-03-28 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Noise filling without side information for celp-like coders
RU2754497C1 (en) * 2020-11-17 2021-09-02 федеральное государственное автономное образовательное учреждение высшего образования "Казанский (Приволжский) федеральный университет" (ФГАОУ ВО КФУ) Method for transmission of speech files over a noisy channel and apparatus for implementation thereof

Similar Documents

Publication Publication Date Title
US7124079B1 (en) Speech coding with comfort noise variability feature for increased fidelity
RU2251750C2 (en) Method for detection of complicated signal activity for improved classification of speech/noise in audio-signal
US9646621B2 (en) Voice detector and a method for suppressing sub-bands in a voice detector
US5812965A (en) Process and device for creating comfort noise in a digital speech transmission system
RU2262748C2 (en) Multi-mode encoding device
US8019599B2 (en) Speech codecs
WO2001035395A1 (en) Wide band speech synthesis by means of a mapping matrix
JP2002528775A (en) Method and apparatus for adaptive band pitch search in wideband signal coding
US6424942B1 (en) Methods and arrangements in a telecommunications system
RU2237296C2 (en) Method for encoding speech with function for altering comfort noise for increasing reproduction precision
US5313554A (en) Backward gain adaptation method in code excited linear prediction coders
KR100735246B1 (en) Apparatus and method for transmitting audio signal
US7031913B1 (en) Method and apparatus for decoding speech signal
JP2762938B2 (en) Audio coding device
JPH07210199A (en) Method and device for voice encoding