RU2651184C1

RU2651184C1 - Способ обработки речевого/звукового сигнала и устройство

Info

Publication number: RU2651184C1
Application number: RU2016152224A
Authority: RU
Inventors: Цзэсинь ЛЮ; Лэй МЯО
Original assignee: Хуавэй Текнолоджиз Ко., Лтд.
Priority date: 2014-06-03
Filing date: 2015-01-19
Publication date: 2018-04-18
Also published as: ES2964221T3; BR112016028375A2; US11462225B2; EP3147900A1; US20170084282A1; EP3147900A4; AU2015271580A1; EP3712890B1; KR20170008837A; IL249337A0; JP2021060609A; MX2016015950A; AU2015271580B2; MX2019001193A; KR102201791B1; JP6817283B2; JP2019061282A; EP4283614A2; KR20200043548A; US9978383B2

Abstract

Изобретение относится к технике связи. Технический результат – улучшение акустического качества сигнала, полученного после восстановления шумовой составляющей. Данный способ включает в себя этапы, на которых: принимают битовый поток и декодируют битовый поток, чтобы получить речевой/звуковой сигнал; определяют первый речевой/звуковой сигнал в соответствии с речевым/звуковым сигналом; определяют символ каждого выборочного значения в первом речевом/звуковом сигнале и значение амплитуды каждого выборочного значения в первом речевом/звуковом сигнале; определяют длину адаптивной нормализации; определяют скорректированное значение амплитуды каждого выборочного значения в соответствии с длиной адаптивной нормализации и значением амплитуды каждого выборочного значения и определяют второй речевой/звуковой сигнал в соответствии с символом каждого выборочного значения и скорректированным значением амплитуды каждого выборочного значения. 2 н. и 20 з.п. ф-лы, 7 ил.

Description

[0001] Настоящее изобретение имеет отношение к области связи, и в частности, к способу для обработки речевого/звукового сигнала, и устройству.

УРОВЕНЬ ТЕХНИКИ

[0002] В настоящее время, для достижения лучшего акустического качества, при декодировании закодированной информации речевого/звукового сигнала, электронное устройство восстанавливает шумовую составляющую речевого/звукового сигнала, полученного посредством декодирования.

[0003] В настоящее время, электронное устройство восстанавливает шумовую составляющую речевого/звукового сигнала, как правило, путем добавления случайного шумового сигнала в речевой/звуковой сигнал. Конкретнее, выполняется взвешенное сложение на речевом/звуковом сигнале и случайном шумовом сигнале, чтобы получить сигнал после восстановления шумовой составляющей речевого/звукового сигнала. Речевой/звуковой сигнал может быть сигналом во временной области, сигналом в частотной области или сигналом возбуждения, или может быть низкочастотным сигналом, высокочастотным сигналом, или тому подобным.

[0004] Однако, было установлено, что если речевой/звуковой сигнал является сигналом, имеющим момент возникновения или сдвиг, этот способ для восстановления шумовой составляющей речевого/звукового сигнала в результате приводит к тому, что сигнал, полученный после восстановления шумовой составляющей речевого/звукового сигнала, имеет эхо-сигнал, что влияет на акустическое качество сигнала, полученного после восстановления шумовой составляющей.

РАСКРЫТИЕ ИЗОБРЕТЕНИЯ

[0005] Варианты осуществления настоящего изобретения предоставляют способ для обработки речевого/звукового сигнала, и устройство, такие, что для речевого/звукового сигнала, имеющего момент возникновения или сдвиг, когда восстанавливается шумовая составляющая речевого/звукового сигнала, сигнал, полученный после восстановления шумовой составляющей речевого/звукового сигнала, не имеет эхо-сигнала, тем самым улучшая акустическое качество сигнала, полученного после восстановления шумовой составляющей.

[0006] В соответствии с первым аспектом, один из вариантов осуществления настоящего изобретения предоставляет способ для обработки речевого/звукового сигнала, причем способ включает в себя этапы, на которых:

принимают битовый поток, и декодируют этот битовый поток, чтобы получить речевой/звуковой сигнал;

определяют первый речевой/звуковой сигнал в соответствии с речевым/звуковым сигналом, причем первый речевой/звуковой сигнал является сигналом, шумовая составляющая которого должна быть восстановлена, в речевом/звуковом сигнале;

определяют символ каждого выборочного значения в первом речевом/звуковом сигнале и значение амплитуды каждого выборочного значения в первом речевом/звуковом сигнале;

определяют длину адаптивной нормализации;

определяют скорректированное значение амплитуды каждого выборочного значения в соответствии с длиной адаптивной нормализации и значением амплитуды каждого выборочного значения; и

определяют второй речевой/звуковой сигнал в соответствии с символом каждого выборочного значения и скорректированным значением амплитуды каждого выборочного значения, причем второй речевой/звуковой сигнал является сигналом, полученным после восстановления шумовой составляющей первого речевого/звукового сигнала.

[0007] С учетом первого аспекта, в первой возможной форме реализации первого аспекта этап, на котором определяют скорректированное значение амплитуды каждого выборочного значения в соответствии с длиной адаптивной нормализации и значением амплитуды каждого выборочного значения, включает в себя этапы, на которых:

вычисляют, в соответствии со значением амплитуды каждого выборочного значения и длиной адаптивной нормализации, среднее значение амплитуды, соответствующее каждому выборочному значению, и определяют, в соответствии со средним значением амплитуды, соответствующим каждому выборочному значению, значение возмущения амплитуды, соответствующее каждому выборочному значению; и

вычисляют скорректированное значение амплитуды каждого выборочного значения в соответствии со значением амплитуды каждого выборочного значения и в соответствии со значением возмущения амплитуды, соответствующим каждому выборочному значению.

[0008] С учетом первой возможной формы реализации первого аспекта, во второй возможной форме реализации первого аспекта этап, на котором вычисляют, в соответствии со значением амплитуды каждого выборочного значения и длиной адаптивной нормализации, среднее значение амплитуды, соответствующее каждому выборочному значению, включает в себя этапы, на которых:

определяют, для каждого выборочного значения и в соответствии с длиной адаптивной нормализации, поддиапазон, которому принадлежит выборочное значение; и

вычисляют среднее значение значений амплитуд всех выборочных значений в поддиапазоне, которому принадлежит выборочное значение, и используют среднее значение, полученное посредством вычисления, в качестве среднего значения амплитуды, соответствующего выборочному значению.

[0009] С учетом второй возможной формы реализации первого аспекта, в третьей возможной форме реализации первого аспекта этап, на котором, определяют, для каждого выборочного значения и в соответствии с длиной адаптивной нормализации, поддиапазон, которому принадлежит выборочное значение, включает в себя этапы, на которых:

выполняют группировку поддиапазонов на всех выборочных значениях в предварительно заданном порядке в соответствии с длиной адаптивной нормализации; и, для каждого выборочного значения, определяют поддиапазон, включающий в себя выборочное значение, как поддиапазон, которому принадлежит выборочное значение; или

для каждого выборочного значения, определяют поддиапазон, вмещающий m выборочных значений перед выборочным значением, выборочное значение и n выборочных значений после выборочного значения, как поддиапазон, которому принадлежит выборочное значение, где m и n зависят от длины адаптивной нормализации, m является целым числом не меньше 0, и n является целым числом не меньше 0.

[0010] С учетом первой возможной формы реализации первого аспекта, и/или второй возможной формы реализации первого аспекта, и/или третьей возможной формы реализации первого аспекта, в четвертой возможной форме реализации первого аспекта этап, на котором вычисляют скорректированное значение амплитуды каждого выборочного значения в соответствии со значением амплитуды каждого выборочного значения и в соответствии со значением возмущения амплитуды, соответствующим каждому выборочному значению, включает в себя этапы, на которых:

вычитают значение возмущения амплитуды, соответствующее каждому выборочному значению, из значения амплитуды каждого выборочного значения, чтобы получить разность между значением амплитуды каждого выборочного значения и значением возмущения амплитуды, соответствующим каждому выборочному значению, и используют полученную разность в качестве скорректированного значения амплитуды каждого выборочного значения.

[0011] С учетом первого аспекта, и/или первой возможной формы реализации первого аспекта, и/или второй возможной формы реализации первого аспекта, и/или третьей возможной формы реализации первого аспекта, и/или четвертой возможной формы реализации первого аспекта, в пятой возможной форме реализации первого аспекта этап, на котором определяют длину адаптивной нормализации, включает в себя этапы, на которых:

разделяют сигнал низкочастотного диапазона в речевом/звуковом сигнале на N поддиапазонов, где N является натуральным числом;

вычисляют отношение пиковой и средней мощностей каждого поддиапазона и определяют количество поддиапазонов, отношения пиковой и средней мощностей которых больше предварительно заданной пороговой величины отношения пиковой и средней мощностей; и

вычисляют длину адаптивной нормализации в соответствии с типом сигнала для сигнала высокочастотного диапазона в речевом/звуковом сигнале и количеством поддиапазонов.

[0012] С учетом пятой возможной формы реализации первого аспекта, в шестой возможной форме реализации первого аспекта этап, на котором вычисляют длину адаптивной нормализации в соответствии с типом сигнала для сигнала высокочастотного диапазона в речевом/звуковом сигнале и количеством поддиапазонов, включает в себя этап, на котором:

вычисляют длину адаптивной нормализации по формуле L=K+α×M, где

L является длиной адаптивной нормализации; K является численным значением, соответствующим типу сигнала для сигнала высокочастотного диапазона в речевом/звуковом сигнале, и разные типы сигналов для сигналов высокочастотного диапазона соответствуют разным численным значениям K; M является количеством поддиапазонов, отношения пиковой и средней мощностей которых больше предварительно заданной пороговой величины отношения пиковой и средней мощностей; и α является константой меньше 1.

[0013] С учетом первого аспекта, и/или первой возможной формы реализации первого аспекта, и/или второй возможной формы реализации первого аспекта, и/или третьей возможной формы реализации первого аспекта, и/или четвертой возможной формы реализации первого аспекта, в седьмой возможной форме реализации первого аспекта этап, на котором определяют длину адаптивной нормализации, включает в себя этапы, на которых:

вычисляют отношение пиковой и средней мощностей сигнала низкочастотного диапазона в речевом/звуковом сигнале и отношение пиковой и средней мощностей сигнала высокочастотного диапазона в речевом/звуковом сигнале; и когда абсолютное значение разности между отношением пиковой и средней мощностей сигнала низкочастотного диапазона и отношением пиковой и средней мощностей сигнала высокочастотного диапазона меньше предварительно заданной пороговой величины разности, определяют длину адаптивной нормализации как предварительно заданное первое значение длины, или когда абсолютное значение разности между отношением пиковой и средней мощностей сигнала низкочастотного диапазона и отношением пиковой и средней мощностей сигнала высокочастотного диапазона не меньше предварительно заданной пороговой величины разности, определяют длину адаптивной нормализации как предварительно заданное второе значение длины, при этом первое значение длины больше, чем второе значение длины; или

вычисляют отношение пиковой и средней мощностей сигнала низкочастотного диапазона в речевом/звуковом сигнале и отношение пиковой и средней мощностей сигнала высокочастотного диапазона в речевом/звуковом сигнале; и когда отношение пиковой и средней мощностей сигнала низкочастотного диапазона меньше, чем отношение пиковой и средней мощностей сигнала высокочастотного диапазона, определяют длину адаптивной нормализации как предварительно заданное первое значение длины, или когда отношение пиковой и средней мощностей сигнала низкочастотного диапазона не меньше, чем отношение пиковой и средней мощностей сигнала высокочастотного диапазона, определяют длину адаптивной нормализации как предварительно заданное второе значение длины; или

определяют длину адаптивной нормализации в соответствии с типом сигнала для сигнала высокочастотного диапазона в речевом/звуковом сигнале, при этом разные типы сигналов для сигналов высокочастотного диапазона соответствуют разным длинам адаптивной нормализации.

[0014] С учетом первого аспекта, и/или первой возможной формы реализации первого аспекта, и/или второй возможной формы реализации первого аспекта, и/или третьей возможной формы реализации первого аспекта, и/или четвертой возможной формы реализации первого аспекта, и/или пятой возможной формы реализации первого аспекта, и/или шестой возможной формы реализации первого аспекта, и/или седьмой возможной формы реализации первого аспекта, в восьмой возможной форме реализации первого аспекта этап, на котором определяют второй речевой/звуковой сигнал в соответствии с символом каждого выборочного значения и скорректированным значением амплитуды каждого выборочного значения, включает в себя этапы, на которых:

определяют новое значение каждого выборочного значения в соответствии с символом и скорректированным значением амплитуды каждого выборочного значения, чтобы получить второй речевой/звуковой сигнал; или

вычисляют коэффициент модификации; выполняют модификационную обработку на скорректированном значении амплитуды, которое больше 0, в скорректированных значениях амплитуд выборочных значений в соответствии с коэффициентом модификации; и определяют новое значение каждого выборочного значения в соответствии с символом каждого выборочного значения и скорректированным значением амплитуды, которое получено после модификационной обработки, чтобы получить второй речевой/звуковой сигнал.

[0015] С учетом восьмой возможной формы реализации первого аспекта, в девятой возможной форме реализации первого аспекта этап, на котором вычисляют коэффициент модификации, включает в себя этап, на котором:

вычисляют коэффициент модификации с использованием формулы β=a/L, где β является коэффициентом модификации, L является длиной адаптивной нормализации, и a является константой больше 1.

[0016] С учетом восьмой возможной формы реализации первого аспекта и/или девятой возможной формы реализации первого аспекта, в десятой возможной форме реализации первого аспекта этап, на котором выполняют модификационную обработку на скорректированном значении амплитуды, которое больше 0, в скорректированных значениях амплитуд выборочных значений в соответствии с коэффициентом модификации, включает в себя этап, на котором:

выполняют модификационную обработку на скорректированном значении амплитуды, которое больше 0, в скорректированных значениях амплитуд выборочных значений с использованием следующей формулы:

Y=y×(b-β);

где Y является скорректированным значением амплитуды, полученным после модификационной обработки; y является скорректированным значением амплитуды, которое больше 0, в скорректированных значениях амплитуд выборочных значений; и b является константой, и 0<b<2.

[0017] В соответствии со вторым аспектом, вариант осуществления настоящего изобретения предоставляет устройство для восстановления шумовой составляющей речевого/звукового сигнала, включающее в себя:

блок обработки битового потока, выполненный с возможностью приема битового потока и декодирования битового потока, чтобы получить речевой/звуковой сигнал;

блок определения сигнала, выполненный с возможностью определения первого речевого/звукового сигнала в соответствии с речевым/звуковым сигналом, полученным блоком обработки битового потока, причем первый речевой/звуковой сигнал является сигналом, шумовая составляющая которого должна быть восстановлена, в речевом/звуковом сигнале, полученном посредством декодирования;

первый блок определения, выполненный с возможностью определения символа каждого выборочного значения в первом речевом/звуковом сигнале, определенном блоком определения сигнала, и значения амплитуды каждого выборочного значения в первом речевом/звуковом сигнале, определенном блоком определения сигнала;

второй блок определения, выполненный с возможностью определения длины адаптивной нормализации;

третий блок определения, выполненный с возможностью определения скорректированного значения амплитуды каждого выборочного значения в соответствии с длиной адаптивной нормализации, определенной вторым блоком определения, и значением амплитуды каждого выборочного значения, которое определяется первым блоком определения; и

четвертый блок определения, выполненный с возможностью определения второго речевого/звукового сигнала в соответствии с символом каждого выборочного значения, который определяется первым блоком определения, и скорректированным значением амплитуды каждого выборочного значения, которое определяется третьим блоком определения, причем второй речевой/звуковой сигнал является сигналом, полученным после восстановления шумовой составляющей первого речевого/звукового сигнала.

[0018] С учетом второго аспекта, в первой возможной форме реализации второго аспекта третий блок определения включает в себя:

подблок определения, выполненный с возможностью вычисления, в соответствии со значением амплитуды каждого выборочного значения и длиной адаптивной нормализации, среднего значения амплитуды, соответствующего каждому выборочному значению, и определения, в соответствии со средним значением амплитуды, соответствующим каждому выборочному значению, значения возмущения амплитуды, соответствующего каждому выборочному значению; и

блок вычисления скорректированного значения амплитуды, выполненный с возможностью вычисления скорректированного значения амплитуды каждого выборочного значения в соответствии со значением амплитуды каждого выборочного значения и в соответствии со значением возмущения амплитуды, соответствующим каждому выборочному значению.

[0019] С учетом первой возможной формы реализации второго аспекта, во второй возможной форме реализации второго аспекта подблок определения включает в себя:

модуль определения, выполненный с возможностью определения, для каждого выборочного значения и в соответствии с длиной адаптивной нормализации, поддиапазона, которому принадлежит выборочное значение; и

модуль вычисления, выполненный с возможностью вычисления среднего значения значений амплитуд всех выборочных значений в поддиапазоне, которому принадлежит выборочное значение, и использования среднего значения, полученного посредством вычисления, в качестве среднего значения амплитуды, соответствующего выборочному значению.

[0020] С учетом второй возможной формы реализации второго аспекта, в третьей возможной форме реализации второго аспекта модуль определения выполняется с особой возможностью:

выполнения группировки поддиапазонов на всех выборочных значениях в предварительно заданном порядке в соответствии с длиной адаптивной нормализации; и, для каждого выборочного значения, определения поддиапазона, включающего в себя выборочное значение, как поддиапазона, которому принадлежит выборочное значение; или

для каждого выборочного значения, определения поддиапазона, вмещающего m выборочных значений перед выборочным значением, выборочное значение и n выборочных значений после выборочного значения, как поддиапазона, которому принадлежит выборочное значение, где m и n зависят от длины адаптивной нормализации, m является целым числом не меньше 0, и n является целым числом не меньше 0.

[0021] С учетом первой возможной формы реализации второго аспекта, и/или второй возможной формы реализации второго аспекта, и/или третьей возможной формы реализации второго аспекта, в четвертой возможной форме реализации второго аспекта подблок вычисления скорректированного значения амплитуды выполняется с особой возможностью:

вычитания значения возмущения амплитуды, соответствующего каждому выборочному значению, из значения амплитуды каждого выборочного значения, чтобы получить разность между значением амплитуды каждого выборочного значения и значением возмущения амплитуды, соответствующим каждому выборочному значению, и использования полученной разности в качестве скорректированного значения амплитуды каждого выборочного значения.

[0022] С учетом второго аспекта, и/или первой возможной формы реализации второго аспекта, и/или второй возможной формы реализации второго аспекта, и/или третьей возможной формы реализации второго аспекта и/или четвертой возможной формы реализации второго аспекта, в пятой возможной форме реализации второго аспекта второй блок определения включает в себя:

подблок разделения, выполненный с возможностью разделения сигнала низкочастотного диапазона в речевом/звуковом сигнале на N поддиапазонов, где N является натуральным числом;

подблок количественного определения, выполненный с возможностью вычисления отношения пиковой и средней мощностей каждого поддиапазона, и определения количества поддиапазонов, отношения пиковой и средней мощностей которых больше предварительно заданной пороговой величины отношения пиковой и средней мощностей; и

подблок вычисления длины, выполненный с возможностью вычисления длины адаптивной нормализации в соответствии с типом сигнала для сигнала высокочастотного диапазона в речевом/звуковом сигнале и количеством поддиапазонов.

[0023] С учетом пятой возможной формы реализации второго аспекта, в шестой возможной форме реализации второго аспекта подблок вычисления длины выполняется с особой возможностью:

вычисления длины адаптивной нормализации по формуле L=K+α×M, где

[0024] С учетом второго аспекта, и/или первой возможной формы реализации второго аспекта, и/или второй возможной формы реализации второго аспекта, и/или третьей возможной формы реализации второго аспекта, и/или четвертой возможной формы реализации второго аспекта, в седьмой возможной форме реализации второго аспекта второй блок выполняется с особой возможностью:

вычисления отношения пиковой и средней мощностей сигнала низкочастотного диапазона в речевом/звуковом сигнале и отношения пиковой и средней мощностей сигнала высокочастотного диапазона в речевом/звуковом сигнале; и когда абсолютное значение разности между отношением пиковой и средней мощностей сигнала низкочастотного диапазона и отношением пиковой и средней мощностей сигнала высокочастотного диапазона меньше предварительно заданной пороговой величины разности, определения длины адаптивной нормализации как предварительно заданного первого значения длины, или когда абсолютное значение разности между отношением пиковой и средней мощностей сигнала низкочастотного диапазона и отношением пиковой и средней мощностей сигнала высокочастотного диапазона не меньше предварительно заданной пороговой величины разности, определения длины адаптивной нормализации как предварительно заданного второго значения длины, при этом первое значение длины больше, чем второе значение длины; или

вычисления отношения пиковой и средней мощностей сигнала низкочастотного диапазона в речевом/звуковом сигнале и отношения пиковой и средней мощностей сигнала высокочастотного диапазона в речевом/звуковом сигнале; и когда отношение пиковой и средней мощностей сигнала низкочастотного диапазона меньше, чем отношение пиковой и средней мощностей сигнала высокочастотного диапазона, определения длины адаптивной нормализации как предварительно заданного первого значения длины, или когда отношение пиковой и средней мощностей сигнала низкочастотного диапазона не меньше, чем отношение пиковой и средней мощностей сигнала высокочастотного диапазона, определения длины адаптивной нормализации как предварительно заданного второго значения длины; или

определения длины адаптивной нормализации в соответствии с типом сигнала для сигнала высокочастотного диапазона в речевом/звуковом сигнале, при этом разные типы сигналов для сигналов высокочастотного диапазона соответствуют разным длинам адаптивной нормализации.

[0025] С учетом второго аспекта, и/или первой возможной формы реализации второго аспекта, и/или второй возможной формы реализации второго аспекта, и/или третьей возможной формы реализации второго аспекта, и/или четвертой возможной формы реализации второго аспекта, и/или пятой возможной формы реализации второго аспекта, и/или шестой возможной формы реализации второго аспекта, и/или седьмой возможной формы реализации второго аспекта, в восьмой возможной форме реализации второго аспекта четвертый блок определения выполняется с особой возможностью:

определения нового значения каждого выборочного значения в соответствии с символом и скорректированным значением амплитуды каждого выборочного значения, чтобы получить второй речевой/звуковой сигнал; или

вычисления коэффициента модификации; выполнения модификационной обработки на скорректированном значении амплитуды, которое больше 0, в скорректированных значениях амплитуд выборочных значений в соответствии с коэффициентом модификации; и определения нового значения каждого выборочного значения в соответствии с символом каждого выборочного значения и скорректированным значением амплитуды, которое получено после модификационной обработки, чтобы получить второй речевой/звуковой сигнал.

[0026] С учетом восьмой возможной формы реализации второго аспекта, в девятой возможной форме реализации второго аспекта четвертый блок определения выполняется с особой возможностью вычисления коэффициента модификации с использованием формулы β=a/L, где β является коэффициентом модификации, L является длиной адаптивной нормализации, и a является константой больше 1.

[0027] С учетом восьмой возможной формы реализации второго аспекта и/или девятой возможной формы реализации второго аспекта, в десятой возможной форме реализации второго аспекта четвертый блок определения выполняется с особой возможностью:

выполнения модификационной обработки на скорректированном значении амплитуды, которое больше 0, в скорректированных значениях амплитуд выборочных значений с использованием следующей формулы:

Y=y×(b-β);

[0028] В этих вариантах осуществления принимается битовый поток, и декодируется битовый поток, чтобы получить речевой/звуковой сигнал; определяется первый речевой/звуковой сигнал в соответствии с речевым/звуковым сигналом; определяются символ каждого выборочного значения в первом речевом/звуковом сигнале и значение амплитуды каждого выборочного значения в первом речевом/звуковом сигнале; определяется длина адаптивной нормализации; определяется скорректированное значение амплитуды каждого выборочного значения в соответствии с длиной адаптивной нормализации и значением амплитуды каждого выборочного значения; и определяется второй речевой/звуковой сигнал в соответствии с символом каждого выборочного значения и скорректированным значением амплитуды каждого выборочного значения. В этом технологическом процессе, обрабатывается только исходный сигнал, а именно, первый речевой/звуковой сигнал, и никакой новый сигнал не добавляется к первому речевому/звуковому сигналу, так что никакая новая энергия не добавляется ко второму речевому/звуковому сигналу, полученному после восстановления шумовой составляющей. Следовательно, если первый речевой/звуковой сигнал имеет момент возникновения или сдвиг, никакой эхо-сигнал не добавляется ко второму речевому/звуковому сигналу, тем самым улучшая акустическое качество второго речевого/звукового сигнала.

[0029] Следует понимать, что, приведенное выше общее описание и последующие подробное описание являются лишь иллюстративными, и не предполагают ограничения объема охраны настоящего изобретения.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ

[0030] Для более наглядного описания технических решений в вариантах осуществления настоящего изобретения, нижеследующее кратко представляет прилагаемые чертежи, необходимые для описания вариантов осуществления. Очевидно, что прилагаемые чертежи в последующем описании демонстрируют лишь некоторые варианты осуществления настоящего изобретения, и средний специалист в данной области техники может произвести еще и другие чертежи на основании этих прилагаемых чертежей без творческих усилий.

[0031] Фиг. 1 является упрощенной блок-схемой последовательности операций способа для восстановления шумовой составляющей речевого/звукового сигнала в соответствии с одним из вариантов осуществления настоящего изобретения;

[0032] Фиг. 1A является упрощенной схемой примера группировки выборочных значений в соответствии с одним из вариантов осуществления настоящего изобретения;

[0033] Фиг. 1B является другой упрощенной схемой примера группировки выборочных значений в соответствии с одним из вариантов осуществления настоящего изобретения;

[0034] Фиг. 2 является упрощенной блок-схемой последовательности операций другого способа для восстановления шумовой составляющей речевого/звукового сигнала в соответствии с одним из вариантов осуществления настоящего изобретения;

[0035] Фиг. 3 является упрощенной блок-схемой последовательности операций другого способа для восстановления шумовой составляющей речевого/звукового сигнала в соответствии с одним из вариантов осуществления настоящего изобретения;

[0036] Фиг. 4 является упрощенной структурной схемой устройства для восстановления шумовой составляющей речевого/звукового сигнала в соответствии с одним из вариантов осуществления настоящего изобретения; и

[0037] Фиг. 5 является упрощенной структурной схемой электронного устройства в соответствии с одним из вариантов осуществления настоящего изобретения.

[0038] Вышеуказанные прилагаемые чертежи демонстрируют конкретные варианты осуществления настоящего изобретения, и ниже приводится более подробное описание. Прилагаемые чертежи и текстовое описание не предназначены для ограничения объема замысла настоящего изобретения каким-либо образом, а предназначены для описания идеи настоящего изобретения для специалиста в данной области техники со ссылкой на конкретные варианты осуществления.

ОСУЩЕСТВЛЕНИЕ ИЗОБРЕТЕНИЯ

[0039] Ниже ясно описываются технические решения в вариантах осуществления настоящего изобретения со ссылкой на прилагаемые чертежи в вариантах осуществления настоящего изобретения. Очевидно, что описываемые варианты осуществления являются всего лишь частью, а не всеми вариантами осуществления настоящего изобретения. Все другие варианты осуществления, полученные средним специалистом в данной области техники на основе вариантов осуществления настоящего изобретения без творческих усилий, должны попадать в объем охраны настоящего изобретения.

[0040] В последующем подробном описании упоминаются многочисленные конкретные детали, чтобы обеспечить полное понимание настоящего изобретения. Тем не менее, специалист в данной области техники должен понимать, что настоящее изобретение может быть реализовано без этих конкретных деталей. В других вариантах осуществления способ, технологический процесс, компонент, а также схемы, которые являются общеизвестными, не описываются подробно, чтобы излишне не затруднять понимание этих вариантов осуществления.

[0041] Обратимся к Фиг. 1, Фиг. 1 является блок-схемой последовательности операций способа для восстановления шумовой составляющей речевого/звукового сигнала в соответствии с одним из вариантов осуществления настоящего изобретения. Способ включает в себя:

[0042] Этап 101: Прием битового потока, и декодирование битового потока, чтобы получить речевой/звуковой сигнал.

[0043] Подробности того, как декодировать битовый поток, чтобы получить речевой/звуковой сигнал, не описываются в данном документе.

[0044] Этап 102: Определение первого речевого/звукового сигнала в соответствии с речевым/звуковым сигналом, причем первый речевой/звуковой сигнал является сигналом, шумовая составляющая которого должна быть восстановлена, в речевом/звуковом сигнале, полученном посредством декодирования.

[0045] Первый речевой/звуковой сигнал может быть сигналом низкочастотного диапазона, сигналом высокочастотного диапазона, сигналом полного диапазона, или тому подобным, в речевом/звуковом сигнале, полученном посредством декодирования.

[0046] Речевой/звуковой сигнал, полученный посредством декодирования, может включать в себя сигнал низкочастотного диапазона и сигнал высокочастотного диапазона, или может включать в себя сигнал полного диапазона.

[0047] Этап 103: Определение символа каждого выборочного значения в первом речевом/звуковом сигнале и значения амплитуды каждого выборочного значения в первом речевом/звуковом сигнале.

[0048] Когда первый речевой/звуковой сигнала имеет разные формы реализации, формы реализации выборочного значения тоже могут быть разными. Например, если первый речевой/звуковой сигнал является сигналом в частотной области, выборочное значение может быть спектральным коэффициентом; если речевой/звуковой сигнал является сигналом во временной области, выборочное значение может быть значением момента дискретизации.

[0049] Этап 104: Определение длины адаптивной нормализации.

[0050] Длина адаптивной нормализации может быть определена в соответствии со связанным параметром сигнала низкочастотного диапазона и/или сигнала высокочастотного диапазона в речевом/звуковом сигнале, полученном посредством декодирования. Конкретнее, связанный параметр может включать в себя тип сигнала, отношение пиковой и средней мощностей, и тому подобное. Например, в одной из возможных форм реализации, этап, на котором определяют длину адаптивной нормализации, может включать в себя этапы, на которых:

вычисляют отношение пиковой и средней мощностей каждого поддиапазона, и определяют количество поддиапазонов, отношения пиковой и средней мощностей которых больше предварительно заданной пороговой величины отношения пиковой и средней мощностей; и

[0051] В некоторых случаях этап, на котором вычисляют длину адаптивной нормализации в соответствии с типом сигнала для сигнала высокочастотного диапазона в речевом/звуковом сигнале и количеством поддиапазонов, может включать в себя этап, на котором:

[0052] В другой возможной форме реализации длина адаптивной нормализации может быть вычислена в соответствии с типом сигнала для сигнала низкочастотного диапазона в речевом/звуковом сигнале и количеством поддиапазонов. Что касается конкретной формулы вычисления, обратимся к формуле L=K+α×M. Различие заключается только в том, что в этом случае K является численным значением, соответствующим типу сигнала для сигнала низкочастотного диапазона в речевом/звуковом сигнале. Разные типы сигналов для сигналов низкочастотного диапазона соответствуют разным численным значениям K.

[0053] В третьей возможной форме реализации этап, на котором определяют длину адаптивной нормализации, может включать в себя этапы, на которых:

вычисляют отношение пиковой и средней мощностей сигнала низкочастотного диапазона в речевом/звуковом сигнале и отношение пиковой и средней мощностей сигнала высокочастотного диапазона в речевом/звуковом сигнале; и когда абсолютное значение разности между отношением пиковой и средней мощностей сигнала низкочастотного диапазона и отношением пиковой и средней мощностей сигнала высокочастотного диапазона меньше предварительно заданной пороговой величины разности, определяют длину адаптивной нормализации как предварительно заданное первое значение длины, или когда абсолютное значение разности между отношением пиковой и средней мощностей сигнала низкочастотного диапазона и отношением пиковой и средней мощностей сигнала высокочастотного диапазона не меньше предварительно заданной пороговой величины разности, определяют длину адаптивной нормализации как предварительно заданное второе значение длины. Первое значение длины больше, чем второе значение длины. Первое значение длины и второе значение длины также могут быть получены посредством вычисления с использованием соотношения между отношением пиковой и средней мощностей сигнала низкочастотного диапазона и отношением пиковой и средней мощностей сигнала высокочастотного диапазона или разности между отношением пиковой и средней мощностей сигнала низкочастотного диапазона и отношением пиковой и средней мощностей сигнала высокочастотного диапазона. Конкретный способ вычисления не ограничивается.

[0054] В четвертой возможной форме реализации этап, на котором определяют длину адаптивной нормализации, может включать в себя этапы, на которых:

вычисляют отношение пиковой и средней мощностей сигнала низкочастотного диапазона в речевом/звуковом сигнале и отношение пиковой и средней мощностей сигнала высокочастотного диапазона в речевом/звуковом сигнале; и когда отношение пиковой и средней мощностей сигнала низкочастотного диапазона меньше, чем отношение пиковой и средней мощностей сигнала высокочастотного диапазона, определяют длину адаптивной нормализации как предварительно заданное первое значение длины, или когда отношение пиковой и средней мощностей сигнала низкочастотного диапазона не меньше, чем отношение пиковой и средней мощностей сигнала высокочастотного диапазона, определяют длину адаптивной нормализации как предварительно заданное второе значение длины. Первое значение длины больше, чем второе значение длины. Первое значение длины и второе значение длины также могут быть получены посредством вычисления с использованием соотношения между отношением пиковой и средней мощностей сигнала низкочастотного диапазона и отношением пиковой и средней мощностей сигнала высокочастотного диапазона или разности между отношением пиковой и средней мощностей сигнала низкочастотного диапазона и отношением пиковой и средней мощностей сигнала высокочастотного диапазона. Конкретный способ вычисления не ограничивается.

[0055] В пятой возможной форме реализации этап, на котором определяют длину адаптивной нормализации, может включать в себя этап, на котором: определяют длину адаптивной нормализации в соответствии с типом сигнала для сигнала высокочастотного диапазона в речевом/звуковом сигнале. Разные типы сигналов соответствуют разным длинам адаптивной нормализации. Например, когда типом сигнала является гармонический сигнал, соответствующая длина адаптивной нормализации равна 32; когда типом сигнала является нормальный сигнал, соответствующая длина адаптивной нормализации равна 16; когда типом сигнала является переходный сигнал, соответствующая длина адаптивной нормализации равна 8.

[0056] Этап 105: Определение скорректированного значения амплитуды каждого выборочного значения в соответствии с длиной адаптивной нормализации и значением амплитуды каждого выборочного значения.

[0057] Этап, на котором определяют скорректированное значение амплитуды каждого выборочного значения в соответствии с длиной адаптивной нормализации и значением амплитуды каждого выборочного значения, может включать в себя этапы, на которых:

[0058] Этап, на котором вычисляют, в соответствии со значением амплитуды каждого выборочного значения и длиной адаптивной нормализации, среднее значение амплитуды, соответствующее каждому выборочному значению, может включать в себя этапы, на которых:

[0059] Этап, на котором определяют, для каждого выборочного значения и в соответствии с длиной адаптивной нормализации, поддиапазон, которому принадлежит выборочное значение, может включать в себя этапы, на которых:

выполняют группировку поддиапазонов на всех выборочных значениях в предварительно заданном порядке в соответствии с длиной адаптивной нормализации; и, для каждого выборочного значения, определяют поддиапазон, включающий в себя выборочное значение, как поддиапазон, которому принадлежит выборочное значение.

[0060] Предварительно заданный порядок может быть, например, порядком от низкой частоты к высокой частоте, или порядком от высокой частоты к низкой частоте, что не ограничивается в данном документе.

[0061] Например, обращаясь к Фиг. 1A, предположим, что выборочные значения в порядке возрастания представляют собой, соответственно, x1, x2, x3,..., и xn, а длина адаптивной нормализации равна 5, x1-x5 могут быть сгруппированы в один поддиапазон, и x6-x10 могут быть сгруппированы в один поддиапазон. По аналогии получаются несколько поддиапазонов. Следовательно, для каждого выборочного значения в x1-x5, поддиапазон x1-x5 является поддиапазоном, которому принадлежит каждое выборочное значение, и для каждого выборочного значения в x6-x10, поддиапазон x6-x10 является поддиапазоном, которому принадлежит каждое выборочное значение.

[0062] В качестве альтернативы, этап, на котором определяют, для каждого выборочного значения и в соответствии с длиной адаптивной нормализации, поддиапазон, которому принадлежит выборочное значение, может включать в себя этапы, на которых:

[0063] Например, обращаясь к Фиг. 1B, предположим, что выборочные значения в порядке возрастания представляют собой, соответственно, x1, x2, x3,..., и xn, длина адаптивной нормализации равна 5, m равно 2 и n равно 2. Для выборочного значения x3, поддиапазон, вмещающий x1-x5, является поддиапазоном, которому принадлежит выборочное значение x3. Для выборочного значения x4, поддиапазон, вмещающий x2-x6, является поддиапазоном, которому принадлежит выборочное значение x4. Остальные могут быть выведены по аналогии. Поскольку недостаточно выборочных значений перед выборочными значениями x1 и x2 для формирования поддиапазонов, которым принадлежат выборочные значения x1 и x2, и недостаточно выборочных значений после выборочных значений x(n-1) и xn для формирования поддиапазонов, которым принадлежат выборочные значения x(n-1), и xn, при реальном применении поддиапазоны, которым принадлежат x1, x2, x(n-1) и xn могут задаваться автономно. Например, само выборочное значение может быть добавлено, чтобы компенсировать недостаток выборочного значения в поддиапазоне, которому принадлежит выборочное значение. Например, для выборочного значения x1, нет никакого выборочного значения перед выборочным значением x1, и в качестве поддиапазона, которому принадлежит выборочное значение x1, может использоваться x1, x1, x1, x2 и x3.

[0064] Когда значение возмущения амплитуды, соответствующее каждому выборочному значению, определяется в соответствии со средним значением амплитуды, соответствующим каждому выборочному значению, среднее значение амплитуды, соответствующее каждому выборочному значению, может непосредственно использоваться в качестве значения возмущения амплитуды, соответствующего каждому выборочному значению. В качестве альтернативы, предварительно заданная операция может быть выполнена на среднем значении амплитуды, соответствующем каждому выборочному значению, чтобы получить значение возмущения амплитуды, соответствующее каждому выборочному значению. Предварительно заданная операция может заключаться в том, например, что среднее значение амплитуды умножается на численное значение. Это численное значение, как правило, больше 0.

[0065] Этап, на котором вычисляют скорректированное значение амплитуды каждого выборочного значения в соответствии со значением амплитуды каждого выборочного значения и в соответствии со значением возмущения амплитуды, соответствующим каждому выборочному значению, может включать в себя этапы, на которых:

[0066] Этап 106: Определение второго речевого/звукового сигнала в соответствии с символом каждого выборочного значения и скорректированным значением амплитуды каждого выборочного значения, причем второй речевой/звуковой сигнал является сигналом, полученным после восстановления шумовой составляющей первого речевого/звукового сигнала.

[0067] В одной из возможных форм реализации может быть определено новое значение каждого выборочного значения в соответствии с символом и скорректированным значением амплитуды каждого выборочного значения, чтобы получить второй речевой/звуковой сигнал.

[0068] В другой возможной форме реализации этап, на котором определяют второй речевой/звуковой сигнала в соответствии с символом каждого выборочного значения и скорректированным значением амплитуды каждого выборочного значения, может включать в себя этапы, на которых:

вычисляют коэффициент модификации;

выполняют модификационную обработку на скорректированном значении амплитуды, которое больше 0, в скорректированных значениях амплитуд выборочных значений в соответствии с коэффициентом модификации; и

определяют новое значение каждого выборочного значения в соответствии с символом каждого выборочного значения и скорректированным значением амплитуды, которое получено после модификационной обработки, чтобы получить второй речевой/звуковой сигнал.

[0069] В одной из возможных форм реализации полученный второй речевой/звуковой сигнал может включать в себя новые значения всех выборочных значений.

[0070] Коэффициент модификации может быть вычислен в соответствии с длиной адаптивной нормализации. Конкретнее, коэффициент β модификации может быть равен a/L, где a является константой больше 1.

[0071] Этап, на котором выполняют модификационную обработку на скорректированном значении амплитуды, которое больше 0, в скорректированных значениях амплитуд выборочных значений в соответствии с коэффициентом модификации, может включать в себя этап, на котором:

Y=y×(b-β);

[0072] Этап извлечения символа каждого выборочного значения в первом речевом/звуковом сигнале на этапе 103 может быть выполнен в любое время до этапа 106. Нет обязательного порядка исполнения между этапом извлечения символа каждого выборочного значения в первом речевом/звуковом сигнале и этапом 104 и этапом 105.

[0073] Порядок исполнения между этапом 103 и этапом 104 не ограничивается.

[0074] В предшествующем уровне техники, если речевой/звуковой сигнал является сигналом, имеющим момент возникновения или сдвиг, сигнал во временной области в речевом/звуковом сигнале может быть в пределах одного кадра. В этом случае часть речевого/звукового сигнала имеет очень большое значение момента дискретизации сигнала и очень сильную энергию сигнала, тогда как другая часть речевого/звукового сигнала имеет очень маленькое значение момента дискретизации сигнала и очень слабую энергию сигнала. В этом случае случайный шумовой сигнал добавляется к речевому/звуковому сигналу в частотной области, чтобы получить сигнал, полученный после восстановления шумовой составляющей. Поскольку энергия случайного шумового сигнала находится точно в пределах одного кадра во временной области, когда сигнал в частотной области, полученный после восстановления шумовой составляющей, преобразуется в сигнал во временной области, вновь добавленный случайный шумовой сигнал, в общем случае, вызывает увеличение энергии сигнала в части, исходное значение момента дискретизации которой является очень маленьким, в сигнале во временной области, полученном посредством преобразования. Значение момента дискретизации сигнала этой части также, соответственно, становится относительно большим. Следовательно, сигнал, полученный после восстановления шумовой составляющей, имеет некоторые эхо-сигналы, что влияет на акустическое качество сигнала, полученного после восстановления шумовой составляющей.

[0075] В этом варианте осуществления, определяется первый речевой/звуковой сигнал в соответствии с речевым/звуковым сигналом; определяются символ каждого выборочного значения в первом речевом/звуковом сигнале и значение амплитуды каждого выборочного значения в первом речевом/звуковом сигнале; определяется длина адаптивной нормализации; определяется скорректированное значение амплитуды каждого выборочного значения в соответствии с длиной адаптивной нормализации и значением амплитуды каждого выборочного значения; и определяется второй речевой/звуковой сигнал в соответствии с символом каждого выборочного значения и скорректированным значением амплитуды каждого выборочного значения. В этом технологическом процессе, обрабатывается только исходный сигнал, а именно, первый речевой/звуковой сигнал, и никакой новый сигнал не добавляется к первому речевому/звуковому сигналу, так что никакая новая энергия не добавляется ко второму речевому/звуковому сигналу, полученному после восстановления шумовой составляющей. Следовательно, если первый речевой/звуковой сигнал имеет момент возникновения или сдвиг, никакой эхо-сигнал не добавляется ко второму речевому/звуковому сигналу, тем самым улучшая акустическое качество второго речевого/звукового сигнала.

[0076] Обратимся к Фиг. 2, Фиг. 2 является другой упрощенной блок-схемой последовательности операций способа для восстановления шумовой составляющей речевого/звукового сигнала в соответствии с одним из вариантов осуществления настоящего изобретения. Способ включает в себя:

[0077] Этап 201: Прием битового потока, декодирование битового потока, чтобы получить речевой/звуковой сигнал, причем речевой/звуковой сигнал, полученный посредством декодирования, включает в себя сигнал низкочастотного диапазона и сигнал высокочастотного диапазона; и определение сигнала высокочастотного диапазона как первого речевого/звукового сигнала.

[0078] То, как декодировать битовый поток, не ограничивается в настоящем изобретении.

[0079] Этап 202: Определение символа каждого выборочного значения в сигнале высокочастотного диапазона и значения амплитуды каждого выборочного значения в сигнале высокочастотного диапазона.

[0080] Например, если коэффициентом выборочного значения в сигнале высокочастотного диапазона является -4, то символом выборочного значения является "-", а значение амплитуды равно 4.

[0081] Этап 203: Определение длины адаптивной нормализации.

[0082] Для получения дополнительной информации о том, как определить длину адаптивной нормализации, см. соответствующее описание для этапа 104. Подробности не описываются здесь еще раз.

[0083] Этап 204: Определение, в соответствии со значением амплитуды каждого выборочного значения и длиной адаптивной нормализации, среднего значения амплитуды, соответствующего каждому выборочному значению, и определение, в соответствии со средним значением амплитуды, соответствующим каждому выборочному значению, значения возмущения амплитуды, соответствующего каждому выборочному значению.

[0084] Касательно того, как определить среднее значение амплитуды, соответствующее каждому выборочному значению, см. соответствующее описание для этапа 105. Подробности не описываются здесь еще раз.

[0085] Этап 205: Вычисление скорректированного значения амплитуды каждого выборочного значения в соответствии со значением амплитуды каждого выборочного значения и в соответствии со значением возмущения амплитуды, соответствующим каждому выборочному значению.

[0086] Касательно того, как определить скорректированное значение амплитуды каждого выборочного значения, см. соответствующее описание для этапа 105. Подробности не описываются здесь еще раз.

[0087] Этап 206: Определение второго речевого/звукового сигнала в соответствии с символом и скорректированным значением амплитуды каждого выборочного значения.

[0088] Второй речевой/звуковой сигнал является сигналом, полученным после восстановления шумовой составляющей первого речевого/звукового сигнала.

[0089] Касательно конкретной реализации на этом этапе, см. соответствующее описание для этапа 106. Подробности не описываются здесь еще раз.

[0090] Этап определения символа каждого выборочного значения в первом речевом/звуковом сигнале на этапе 202 может быть выполнен в любое время до этапа 206. Нет обязательного порядка исполнения между этапом определения символа каждого выборочного значения в первом речевом/звуковом сигнале и этапом 203, этапом 204 и этапом 205.

[0091] Порядок исполнения между этапом 202 и этапом 203 не ограничивается.

[0092] Этап 207: Объединение второго речевого/звукового сигнала и сигнала низкочастотного диапазона в речевом/звуковом сигнале, полученном посредством декодирования, чтобы получить выходной сигнал.

[0093] Если первый речевой/звуковой сигнал является сигналом низкочастотного диапазона в речевом/звуковом сигнале, полученном посредством декодирования, второй речевой/звуковой сигнал и сигнал высокочастотного диапазона в речевом/звуковом сигнале, полученном посредством декодирования, могут быть объединены, чтобы получить выходной сигнал.

[0094] Если первый речевой/звуковой сигнал является сигналом высокочастотного диапазона в речевом/звуковом сигнале, полученном посредством декодирования, второй речевой/звуковой сигнал и сигнал низкочастотного диапазона в речевом/звуковом сигнале, полученном посредством декодирования, могут быть объединены, чтобы получить выходной сигнал.

[0095] Если первый речевой/звуковой сигнал является сигналом полного диапазона в речевом/звуковом сигнале, полученном посредством декодирования, второй речевой/звуковой сигнал может быть непосредственно определен как выходной сигнал.

[0096] В этом варианте осуществления, путем восстановления шумовой составляющей сигнала высокочастотного диапазона в речевом/звуковом сигнале, полученном посредством декодирования, в конечном итоге восстанавливается шумовая составляющая сигнала высокочастотного диапазона, чтобы получить второй речевой/звуковой сигнал. Таким образом, если сигнал высокочастотного диапазона имеет момент возникновения или сдвиг, никакой эхо-сигнал не добавляется ко второму речевому/звуковому сигналу, тем самым улучшая акустическое качество второго речевого/звукового сигнала, и дополнительно улучшая акустическое качество выводящегося в конечном итоге выходного сигнала.

[0097] Обратимся к Фиг. 3, Фиг. 3 является другой упрощенной блок-схемой последовательности операций способа для восстановления шумовой составляющей речевого/звукового сигнала в соответствии с одним из вариантов осуществления настоящего изобретения. Способ включает в себя:

[0098] Этапы от 301 до 305 совпадают с этапами от 201 до 205, и подробности не описываются здесь еще раз.

[0099] Этап 306: Вычисление коэффициента модификации; и выполнение модификационной обработки на скорректированном значении амплитуды, которое больше 0, в скорректированных значениях амплитуд выборочных значений в соответствии с коэффициентом модификации.

[0100] Касательно конкретной реализации на этом этапе, см. соответствующее описание для этапа 106. Подробности не описываются здесь еще раз.

[0101] Этап 307: Определение второго речевого/звукового сигнала в соответствии с символом каждого выборочного значения и скорректированным значением амплитуды, полученным после модификационной обработки.

[0102] Касательно конкретной реализации на этом этапе, см. соответствующее описание для этапа 106. Подробности не описываются здесь еще раз.

[0103] Этап определения символа каждого выборочного значения в первом речевом/звуковом сигнале на этапе 302 может быть выполнен в любое время до этапа 307. Нет обязательного порядка исполнения между этапом определения символа каждого выборочного значения в первом речевом/звуковом сигнале и этапом 303, этапом 304, этапом 305 и этапом 306.

[0104] Порядок исполнения между этапом 302 и этапом 303 не ограничивается.

[0105] Этап 308: Объединение второго речевого/звукового сигнала и сигнала низкочастотного диапазона в речевом/звуковом сигнале, полученном посредством декодирования, чтобы получить выходной сигнал.

[0106] По сравнению с вариантом осуществления, показанным на Фиг. 2, в этом варианте осуществления, после того, как получено скорректированное значение амплитуды каждого выборочного значения, еще и дополнительно модифицируется скорректированное значение амплитуды, которое больше 0, в скорректированных значениях амплитуды, тем самым дополнительно улучшая акустическое качество второго речевого/звукового сигнала, и дополнительно улучшая акустическое качество выводящегося в конечном итоге выходного сигнала.

[0107] В иллюстративных способах для восстановления шумовой составляющей речевого/звукового сигнала, показанных на Фиг. 2 и Фиг. 3, в соответствии с вариантами осуществления настоящего изобретения, сигнал высокочастотного диапазона в речевом/звуковом сигнале, полученном посредством декодирования, определяется как первый речевой/звуковой сигнал, и шумовая составляющая первого речевого/звукового сигнала восстанавливается, чтобы в конечном итоге получить второй речевой/звуковой сигнал. При реальном применении, согласно способу для восстановления шумовой составляющей речевого/звукового сигнала в соответствии с вариантами осуществления настоящего изобретения, может быть восстановлена шумовая составляющая сигнала полного диапазона речевого/звукового сигнала, полученного посредством декодирования, или восстанавливается шумовая составляющая сигнала низкочастотного диапазона речевого/звукового сигнала, полученного посредством декодирования, чтобы в конечном итоге получить второй речевой/звуковой сигнал. Что касается технологического процесса реализации этого, см. иллюстративные способы, показанные на Фиг. 2 и Фиг. 3. Различие заключается только в том, что когда должен быть определен первый речевой/звуковой сигнал, сигнал полного диапазона или сигнал низкочастотного диапазона определяется как первый речевой/звуковой сигнал. Описание с поочередным использованием примеров не предоставляется в данном документе.

[0108] Обратимся к Фиг. 4, Фиг. 4 является упрощенной структурной схемой устройства для восстановления шумовой составляющей речевого/звукового сигнала в соответствии с одним из вариантов осуществления настоящего изобретения. Устройство может быть размещено в электронном устройстве. Устройство 400 может включать в себя:

блок 410 обработки битового потока, выполненный с возможностью приема битового потока и декодирования битового потока, чтобы получить речевой/звуковой сигнал; и определения первого речевого/звукового сигнала в соответствии с речевым/звуковым сигналом, причем первый речевой/звуковой сигнал является сигналом, шумовая составляющая которого должна быть восстановлена, в речевом/звуковом сигнале, полученном посредством декодирования;

блок 420 определения сигнала, выполненный с возможностью определения первого речевого/звукового сигнала в соответствии с речевым/звуковым сигналом, полученным блоком 410 обработки битового потока;

первый блок 430 определения, выполненный с возможностью определения символа каждого выборочного значения в первом речевом/звуковом сигнале, определенном блоком 420 определения сигнала, и значения амплитуды каждого выборочного значения в первом речевом/звуковом сигнале, определенном блоком 420 определения сигнала;

второй блок 440 определения, выполненный с возможностью определения длины адаптивной нормализации;

третий блок 450 определения, выполненный с возможностью определения скорректированного значения амплитуды каждого выборочного значения в соответствии с длиной адаптивной нормализации, определенной вторым блоком 440 определения, и значением амплитуды каждого выборочного значения, которое определяется первым блоком 430 определения; и

четвертый блок 460 определения, выполненный с возможностью определения второго речевого/звукового сигнала в соответствии с символом каждого выборочного значения, который определяется первым блоком 430 определения, и скорректированным значением амплитуды каждого выборочного значения, которое определяется третьим блоком 450 определения, причем второй речевой/звуковой сигнал является сигналом, полученным после восстановления шумовой составляющей первого речевого/звукового сигнала.

[0109] В некоторых случаях третий блок 450 определения может включать в себя:

подблок вычисления скорректированного значения амплитуды, выполненный с возможностью вычисления скорректированного значения амплитуды каждого выборочного значения в соответствии со значением амплитуды каждого выборочного значения и в соответствии со значением возмущения амплитуды, соответствующим каждому выборочному значению.

[0110] В некоторых случаях подблок определения может включать в себя:

[0111] В некоторых случаях модуль определения может быть выполнен с особой возможностью:

[0112] В некоторых случаях подблок вычисления скорректированного значения амплитуды выполняется с особой возможностью:

[0113] В некоторых случаях второй блок 440 определения может включать в себя:

[0114] В некоторых случаях подблок вычисления длины может быть выполнен с особой возможностью:

[0115] В некоторых случаях второй блок 440 определения может быть выполнен с особой возможностью:

[0116] В некоторых случаях четвертый блок 460 определения может быть выполнен с особой возможностью:

[0117] В некоторых случаях четвертый блок 460 определения может быть выполнен с особой возможностью вычисления коэффициента модификации с использованием формулы β=a/L, где β является коэффициентом модификации, L является длиной адаптивной нормализации, и a является константой больше 1.

[0118] В некоторых случаях четвертый блок 460 определения может быть выполнен с особой возможностью:

Y=y×(b-β);

[0119] В этом варианте осуществления определяется первый речевой/звуковой сигнал в соответствии с речевым/звуковым сигналом; определяется символ каждого выборочного значения в первом речевом/звуковом сигнале и значение амплитуды каждого выборочного значения в первом речевом/звуковом сигнале; определяется длина адаптивной нормализации; определяется скорректированное значение амплитуды каждого выборочного значения в соответствии с длиной адаптивной нормализации и значением амплитуды каждого выборочного значения; и определяется второй речевой/звуковой сигнал в соответствии с символом каждого выборочного значения и скорректированным значением амплитуды каждого выборочного значения. В этом технологическом процессе, обрабатывается только исходный сигнал, а именно, первый речевой/звуковой сигнал, и никакой новый сигнал не добавляется к первому речевому/звуковому сигналу, так что никакая новая энергия не добавляется ко второму речевому/звуковому сигналу, полученному после восстановления шумовой составляющей. Следовательно, если первый речевой/звуковой сигнал имеет момент возникновения или сдвиг, никакой эхо-сигнал не добавляется ко второму речевому/звуковому сигналу, тем самым улучшая акустическое качество второго речевого/звукового сигнала.

[0120] Обратимся к Фиг. 5, Фиг. 5 является структурной схемой электронного устройства в соответствии с одним из вариантов осуществления настоящего изобретения. Электронное устройство 500 включает в себя обрабатывающее устройство 510, запоминающее устройство 520, приемопередающее устройство 530, а также шину 540.

[0121] Обрабатывающее устройство 510, запоминающее устройство 520 и приемопередающее устройство 530 соединены друг с другом с помощью шины 540, и шина 540 может быть шиной ISA, шиной PCI, шиной EISA, или тому подобным. Шина может подразделяться на адресную шину, шину данных, шину управления, или тому подобное. Для простоты обозначения шина, показанная на Фиг. 5, обозначена при помощи только одной жирной линии, но это не означает, что существует только одна шина или только один тип шины.

[0122] Запоминающее устройство 520 выполняется с возможностью хранения программы. В частности, программа может включать программный код, и программный код включает в себя операционную инструкцию для компьютера. Запоминающее устройство 520 может включать в себя быстродействующее запоминающее устройство ОЗУ, и может дополнительно включать в себя энергонезависимое запоминающее устройство (энергонезависимое запоминающее устройство), такое как, по меньшей мере, одно хранилище на магнитных дисках.

[0123] Приемопередающее устройство 530 выполняется с возможностью соединения с другим устройством, и обмена данными с другим устройством. В частности, приемопередающее устройство 530 может быть выполнено с возможностью приема битового потока.

[0124] Обрабатывающее устройство 510 исполняет программный код, сохраненный в запоминающем устройстве 520, и выполняется с возможностью: декодирования битового потока, чтобы получить речевой/звуковой сигнал; определения первого речевого/звукового сигнала в соответствии с речевым/звуковым сигналом; определения символа каждого выборочного значения в первом речевом/звуковом сигнале и значения амплитуды каждого выборочного значения в первом речевом/звуковом сигнале; определения длины адаптивной нормализации; определения скорректированного значения амплитуды каждого выборочного значения в соответствии с длиной адаптивной нормализации и значением амплитуды каждого выборочного значения; и определения второго речевого/звукового сигнала в соответствии с символом каждого выборочного значения и скорректированным значением амплитуды каждого выборочного значения.

[0125] В некоторых случаях обрабатывающее устройство 510 может быть выполнено с особой возможностью:

вычисления, в соответствии со значением амплитуды каждого выборочного значения и длиной адаптивной нормализации, среднего значения амплитуды, соответствующего каждому выборочному значению, и определения, в соответствии со средним значением амплитуды, соответствующим каждому выборочному значению, значения возмущения амплитуды, соответствующего каждому выборочному значению; и

вычисления скорректированного значения амплитуды каждого выборочного значения в соответствии со значением амплитуды каждого выборочного значения и в соответствии со значением возмущения амплитуды, соответствующим каждому выборочному значению.

[0126] В некоторых случаях обрабатывающее устройство 510 может быть выполнено с особой возможностью:

определения, для каждого выборочного значения и в соответствии с длиной адаптивной нормализации, поддиапазона, которому принадлежит выборочное значение; и

вычисления среднего значения значений амплитуд всех выборочных значений в поддиапазоне, которому принадлежит выборочное значение, и использования среднего значения, полученного посредством вычисления, в качестве среднего значения амплитуды, соответствующего выборочному значению.

[0127] В некоторых случаях обрабатывающее устройство 510 может быть выполнено с особой возможностью:

[0128] В некоторых случаях обрабатывающее устройство 510 может быть выполнено с особой возможностью:

[0129] В некоторых случаях обрабатывающее устройство 510 может быть выполнено с особой возможностью:

разделения сигнала низкочастотного диапазона в речевом/звуковом сигнале на N поддиапазонов, где N является натуральным числом;

вычисления отношения пиковой и средней мощностей каждого поддиапазона, и определения количества поддиапазонов, отношения пиковой и средней мощностей которых больше предварительно заданной пороговой величины отношения пиковой и средней мощностей; и

вычисления длины адаптивной нормализации в соответствии с типом сигнала для сигнала высокочастотного диапазона в речевом/звуковом сигнале и количеством поддиапазонов.

[0130] В некоторых случаях обрабатывающее устройство 510 может быть выполнено с особой возможностью:

[0131] В некоторых случаях обрабатывающее устройство 510 может быть выполнено с особой возможностью:

[0132] В некоторых случаях обрабатывающее устройство 510 может быть выполнено с особой возможностью:

[0133] В некоторых случаях обрабатывающее устройство 510 может быть выполнено с особой возможностью:

вычисления коэффициента модификации с использованием формулы β=a/L, где β является коэффициентом модификации, L является длиной адаптивной нормализации, и a является константой больше 1.

[0134] В некоторых случаях обрабатывающее устройство 510 может быть выполнено с особой возможностью:

Y=y×(b-β);

[0135] В этом варианте осуществления электронное устройство определяет первый речевой/звуковой сигнал в соответствии с речевым/звуковым сигналом; определяет символ каждого выборочного значения в первом речевом/звуковом сигнале и значение амплитуды каждого выборочного значения в первом речевом/звуковом сигнале; определяет длину адаптивной нормализации; определяет скорректированное значение амплитуды каждого выборочного значения в соответствии с длиной адаптивной нормализации и значением амплитуды каждого выборочного значения; и определяет второй речевой/звуковой сигнал в соответствии с символом каждого выборочного значения и скорректированным значением амплитуды каждого выборочного значения. В этом технологическом процессе, обрабатывается только исходный сигнал, а именно, первый речевой/звуковой сигнал, и никакой новый сигнал не добавляется к первому речевому/звуковому сигналу, так что никакая новая энергия не добавляется ко второму речевому/звуковому сигналу, полученному после восстановления шумовой составляющей. Следовательно, если первый речевой/звуковой сигнал имеет момент возникновения или сдвиг, никакой эхо-сигнал не добавляется ко второму речевому/звуковому сигналу, тем самым улучшая акустическое качество второго речевого/звукового сигнала.

[0136] Вариант осуществления системы в основном соответствует варианту осуществления способа, и, следовательно, для связанных с ним частей может быть сделана отсылка на частичные описания в варианте осуществления способа. Описываемый вариант осуществления системы приводится лишь в качестве примера. Блоки, описанные как отдельные части, могут быть, или не быть, физически разделенными, а части, отображенные как блоки, могут быть, или не быть, физическими блоками, могут находиться в одном месте или могут быть распределены по множеству сетевых блоков. Частично или все модули могут быть выбраны в соответствии с фактическими потребностями для достижения целей решений вариантов осуществления. Средний специалист в данной области техники может осмыслить и реализовать варианты осуществления настоящего изобретения без творческих усилий.

[0137] Настоящее изобретение может быть описано в общем контексте исполнимых компьютерных инструкций, исполняемых компьютером, например, программного модуля. Как правило, программный блок включает в себя подпрограмму, программу, объект, компонент, структуру данных, и тому подобное, для исполнения конкретной задачи или реализации конкретного абстрактного типа данных. Настоящее изобретение также может быть осуществлено на практике в распределенных вычислительных средах, в которых задачи выполняются удаленными устройствами обработки, которые соединены при помощи сети связи. В распределенной вычислительной среде программные модули могут быть расположены как на локальных, так и на удаленных компьютерных информационных носителях, в том числе устройствах хранения данных.

[0138] Средний специалист в данной области техники может понять, что все или часть этапов форм реализации в способе могут быть реализованы посредством программы, дающей указания соответствующему аппаратному обеспечению. Программа может храниться на машиночитаемом информационном носителе, таком как ПЗУ, ОЗУ, магнитный диск или оптический диск.

[0139] Следует дополнительно отметить, что в настоящем описании изобретения связанные с описанием отношений термины, такие как первый и второй, используются только чтобы отличить объект или операцию от другого объекта или операции, и не требуют и не подразумевают, что существуют какое-либо действительное взаимоотношение или последовательность между этими объектами или операциями. Помимо этого, термины "включает в себя", "содержит", или любой иной их вариант, предполагает охватывание неисключительного включения, так что технологический процесс, способ, изделие или устройство, которое включает в себя перечень элементов, не только включает в себя эти элементы, но также включает в себя и другие элементы, которые явным образом не перечислены, или дополнительно включает в себя элементы, присущие такому технологическому процессу, способу, изделию или устройству. Элемент, которому предшествуют "включает в себя..." не исключает, без дополнительных ограничений, существование добавочных идентичных элементов в технологическом процессе, способе, изделии или устройстве, которое включает в себя этот элемент.

[0140] Предшествующее описание является лишь иллюстративными вариантами осуществления настоящего изобретения и не предназначено для ограничения объема охраны настоящего изобретения. В настоящем описании изобретения конкретные примеры используются для описания принципа и форм реализации настоящего изобретения, и описание вариантов осуществления используется только для того, чтобы сделать способ и основополагающую идею настоящего изобретения более доступными для восприятия. Более того, средний специалист в данной области техники может, основываясь на идее настоящего изобретения, произвести модификации в отношении этих конкретных форм реализации и области действия. В заключение отметим, что содержание этого описания изобретения не должно быть истолковано как ограничение настоящего изобретения. Любая модификация, эквивалентная замена или улучшение, произведенные без отступления от принципа настоящего изобретения, должны попадать в объем охраны настоящего изобретения.

Claims

1. Способ обработки речевого/звукового сигнала, причем способ содержит этапы, на которых:

принимают битовый поток и декодируют битовый поток, чтобы получить речевой/звуковой сигнал;

определяют длину адаптивной нормализации;

2. Способ по п. 1, в котором этап, на котором определяют скорректированное значение амплитуды каждого выборочного значения в соответствии с длиной адаптивной нормализации и значением амплитуды каждого выборочного значения, содержит этапы, на которых:

3. Способ по п. 2, в котором этап, на котором вычисляют, в соответствии со значением амплитуды каждого выборочного значения и длиной адаптивной нормализации, среднее значение амплитуды, соответствующее каждому выборочному значению, содержит этапы, на которых:

4. Способ по п. 3, в котором этап, на котором определяют, для каждого выборочного значения и в соответствии с длиной адаптивной нормализации, поддиапазон, которому принадлежит выборочное значение, содержит этапы, на которых:

выполняют группировку поддиапазонов для всех выборочных значений в предварительно заданном порядке в соответствии с длиной адаптивной нормализации; и для каждого выборочного значения определяют поддиапазон, содержащий выборочное значение, как поддиапазон, которому принадлежит выборочное значение; или

для каждого выборочного значения определяют поддиапазон, состоящий из m выборочных значений перед выборочным значением, выборочного значения и n выборочных значений после выборочного значения, как поддиапазон, которому принадлежит выборочное значение, при этом m и n зависят от длины адаптивной нормализации, m является целым числом не меньше 0 и n является целым числом не меньше 0.

5. Способ по п. 2, в котором этап, на котором вычисляют скорректированное значение амплитуды каждого выборочного значения в соответствии со значением амплитуды каждого выборочного значения и в соответствии со значением возмущения амплитуды, соответствующим каждому выборочному значению, содержит этапы, на которых:

6. Способ по п. 1, в котором этап, на котором определяют длину адаптивной нормализации, содержит этапы, на которых:

разделяют сигнал низкочастотного диапазона в речевом/звуковом сигнале на N поддиапазонов, при этом N является натуральным числом;

7. Способ по п. 6, в котором этап, на котором вычисляют длину адаптивной нормализации в соответствии с типом сигнала для сигнала высокочастотного диапазона в речевом/звуковом сигнале и количеством поддиапазонов, содержит этап, на котором:

вычисляют длину адаптивной нормализации по формуле L=K+α×M, при этом

L является длиной адаптивной нормализации; K является численным значением, соответствующим типу сигнала для сигнала высокочастотного диапазона в речевом/звуковом сигнале, и разные типы сигналов для сигналов высокочастотного диапазона соответствуют разным численным значениям K; M является количеством поддиапазонов, отношения пиковой и средней мощностей которых больше предварительно заданной пороговой величины отношения пиковой и средней мощностей, и α является константой меньше 1.

8. Способ по п. 1, в котором этап, на котором определяют длину адаптивной нормализации, содержит этапы, на которых:

9. Способ по п. 1, в котором этап, на котором определяют второй речевой/звуковой сигнал в соответствии с символом каждого выборочного значения и скорректированным значением амплитуды каждого выборочного значения, содержит этапы, на которых:

вычисляют коэффициент модификации; выполняют модификационную обработку в отношении скорректированного значения амплитуды, которое больше 0, в скорректированных значениях амплитуд выборочных значений в соответствии с коэффициентом модификации; и определяют новое значение каждого выборочного значения в соответствии с символом каждого выборочного значения и скорректированным значением амплитуды, которое получено после модификационной обработки, чтобы получить второй речевой/звуковой сигнал.

10. Способ по п. 9, в котором этап, на котором вычисляют коэффициент модификации, содержит этап, на котором:

11. Способ по п. 9, в котором этап, на котором выполняют модификационную обработку в отношении скорректированного значения амплитуды, которое больше 0, в скорректированных значениях амплитуд выборочных значений в соответствии с коэффициентом модификации, содержит этап, на котором:

выполняют модификационную обработку в отношении скорректированного значения амплитуды, которое больше 0, в скорректированных значениях амплитуд выборочных значений с использованием следующей формулы:

Y=y×(b-β);

при этом Y является скорректированным значением амплитуды, полученным после модификационной обработки; y является скорректированным значением амплитуды, которое больше 0, в скорректированных значениях амплитуд выборочных значений; и b является константой, и 0<b<2.

12. Устройство для восстановления шумовой составляющей речевого/звукового сигнала, содержащее:

13. Устройство по п. 12, в котором третий блок определения содержит:

14. Устройство по п. 13, в котором подблок определения содержит:

15. Устройство по п. 14, в котором модуль определения выполнен, в частности, с возможностью:

выполнения группировки поддиапазонов для всех выборочных значений в предварительно заданном порядке в соответствии с длиной адаптивной нормализации; и для каждого выборочного значения определения поддиапазона, содержащего выборочное значение, как поддиапазона, которому принадлежит выборочное значение; или

для каждого выборочного значения определения поддиапазона, состоящего из m выборочных значений перед выборочным значением, выборочного значения и n выборочных значений после выборочного значения, как поддиапазона, которому принадлежит выборочное значение, при этом m и n зависят от длины адаптивной нормализации, m является целым числом не меньше 0 и n является целым числом не меньше 0.

16. Устройство по п. 13, в котором подблок вычисления скорректированного значения амплитуды выполнен, в частности, с возможностью:

17. Устройство по п. 12, в котором второй блок определения содержит:

подблок количественного определения, выполненный с возможностью вычисления отношения пиковой и средней мощностей каждого поддиапазона и определения количества поддиапазонов, отношения пиковой и средней мощностей которых больше предварительно заданной пороговой величины отношения пиковой и средней мощностей; и

18. Устройство по п. 17, в котором подблок вычисления длины выполнен, в частности, с возможностью:

вычисления длины адаптивной нормализации по формуле L=K+α×M, при этом

19. Устройство по п. 12, в котором второй блок определения выполнен, в частности, с возможностью:

20. Устройство по п. 12, в котором четвертый блок определения выполнен, в частности, с возможностью:

вычисления коэффициента модификации; выполнения модификационной обработки в отношении скорректированного значения амплитуды, которое больше 0, в скорректированных значениях амплитуд выборочных значений в соответствии с коэффициентом модификации; и определения нового значения каждого выборочного значения в соответствии с символом каждого выборочного значения и скорректированным значением амплитуды, которое получено после модификационной обработки, чтобы получить второй речевой/звуковой сигнал.

21. Устройство по п. 20, в котором четвертый блок определения выполнен, в частности, с возможностью вычисления коэффициента модификации с использованием формулы β=a/L, при этом β является коэффициентом модификации, L является длиной адаптивной нормализации и a является константой больше 1.

22. Устройство по п. 20, в котором четвертый блок определения выполнен, в частности, с возможностью:

выполнения модификационной обработки в отношении скорректированного значения амплитуды, которое больше 0, в скорректированных значениях амплитуд выборочных значений с использованием следующей формулы:

Y=y×(b-β);