RU2651184C1 - Способ обработки речевого/звукового сигнала и устройство - Google Patents

Способ обработки речевого/звукового сигнала и устройство Download PDF

Info

Publication number
RU2651184C1
RU2651184C1 RU2016152224A RU2016152224A RU2651184C1 RU 2651184 C1 RU2651184 C1 RU 2651184C1 RU 2016152224 A RU2016152224 A RU 2016152224A RU 2016152224 A RU2016152224 A RU 2016152224A RU 2651184 C1 RU2651184 C1 RU 2651184C1
Authority
RU
Russia
Prior art keywords
value
speech
sample value
signal
length
Prior art date
Application number
RU2016152224A
Other languages
English (en)
Inventor
Цзэсинь ЛЮ
Лэй МЯО
Original Assignee
Хуавэй Текнолоджиз Ко., Лтд.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Хуавэй Текнолоджиз Ко., Лтд. filed Critical Хуавэй Текнолоджиз Ко., Лтд.
Application granted granted Critical
Publication of RU2651184C1 publication Critical patent/RU2651184C1/ru

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/028Noise substitution, i.e. substituting non-tonal spectral components by noisy source
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Noise Elimination (AREA)
  • Telephone Function (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

Изобретение относится к технике связи. Технический результат – улучшение акустического качества сигнала, полученного после восстановления шумовой составляющей. Данный способ включает в себя этапы, на которых: принимают битовый поток и декодируют битовый поток, чтобы получить речевой/звуковой сигнал; определяют первый речевой/звуковой сигнал в соответствии с речевым/звуковым сигналом; определяют символ каждого выборочного значения в первом речевом/звуковом сигнале и значение амплитуды каждого выборочного значения в первом речевом/звуковом сигнале; определяют длину адаптивной нормализации; определяют скорректированное значение амплитуды каждого выборочного значения в соответствии с длиной адаптивной нормализации и значением амплитуды каждого выборочного значения и определяют второй речевой/звуковой сигнал в соответствии с символом каждого выборочного значения и скорректированным значением амплитуды каждого выборочного значения. 2 н. и 20 з.п. ф-лы, 7 ил.

Description

[0001] Настоящее изобретение имеет отношение к области связи, и в частности, к способу для обработки речевого/звукового сигнала, и устройству.
УРОВЕНЬ ТЕХНИКИ
[0002] В настоящее время, для достижения лучшего акустического качества, при декодировании закодированной информации речевого/звукового сигнала, электронное устройство восстанавливает шумовую составляющую речевого/звукового сигнала, полученного посредством декодирования.
[0003] В настоящее время, электронное устройство восстанавливает шумовую составляющую речевого/звукового сигнала, как правило, путем добавления случайного шумового сигнала в речевой/звуковой сигнал. Конкретнее, выполняется взвешенное сложение на речевом/звуковом сигнале и случайном шумовом сигнале, чтобы получить сигнал после восстановления шумовой составляющей речевого/звукового сигнала. Речевой/звуковой сигнал может быть сигналом во временной области, сигналом в частотной области или сигналом возбуждения, или может быть низкочастотным сигналом, высокочастотным сигналом, или тому подобным.
[0004] Однако, было установлено, что если речевой/звуковой сигнал является сигналом, имеющим момент возникновения или сдвиг, этот способ для восстановления шумовой составляющей речевого/звукового сигнала в результате приводит к тому, что сигнал, полученный после восстановления шумовой составляющей речевого/звукового сигнала, имеет эхо-сигнал, что влияет на акустическое качество сигнала, полученного после восстановления шумовой составляющей.
РАСКРЫТИЕ ИЗОБРЕТЕНИЯ
[0005] Варианты осуществления настоящего изобретения предоставляют способ для обработки речевого/звукового сигнала, и устройство, такие, что для речевого/звукового сигнала, имеющего момент возникновения или сдвиг, когда восстанавливается шумовая составляющая речевого/звукового сигнала, сигнал, полученный после восстановления шумовой составляющей речевого/звукового сигнала, не имеет эхо-сигнала, тем самым улучшая акустическое качество сигнала, полученного после восстановления шумовой составляющей.
[0006] В соответствии с первым аспектом, один из вариантов осуществления настоящего изобретения предоставляет способ для обработки речевого/звукового сигнала, причем способ включает в себя этапы, на которых:
принимают битовый поток, и декодируют этот битовый поток, чтобы получить речевой/звуковой сигнал;
определяют первый речевой/звуковой сигнал в соответствии с речевым/звуковым сигналом, причем первый речевой/звуковой сигнал является сигналом, шумовая составляющая которого должна быть восстановлена, в речевом/звуковом сигнале;
определяют символ каждого выборочного значения в первом речевом/звуковом сигнале и значение амплитуды каждого выборочного значения в первом речевом/звуковом сигнале;
определяют длину адаптивной нормализации;
определяют скорректированное значение амплитуды каждого выборочного значения в соответствии с длиной адаптивной нормализации и значением амплитуды каждого выборочного значения; и
определяют второй речевой/звуковой сигнал в соответствии с символом каждого выборочного значения и скорректированным значением амплитуды каждого выборочного значения, причем второй речевой/звуковой сигнал является сигналом, полученным после восстановления шумовой составляющей первого речевого/звукового сигнала.
[0007] С учетом первого аспекта, в первой возможной форме реализации первого аспекта этап, на котором определяют скорректированное значение амплитуды каждого выборочного значения в соответствии с длиной адаптивной нормализации и значением амплитуды каждого выборочного значения, включает в себя этапы, на которых:
вычисляют, в соответствии со значением амплитуды каждого выборочного значения и длиной адаптивной нормализации, среднее значение амплитуды, соответствующее каждому выборочному значению, и определяют, в соответствии со средним значением амплитуды, соответствующим каждому выборочному значению, значение возмущения амплитуды, соответствующее каждому выборочному значению; и
вычисляют скорректированное значение амплитуды каждого выборочного значения в соответствии со значением амплитуды каждого выборочного значения и в соответствии со значением возмущения амплитуды, соответствующим каждому выборочному значению.
[0008] С учетом первой возможной формы реализации первого аспекта, во второй возможной форме реализации первого аспекта этап, на котором вычисляют, в соответствии со значением амплитуды каждого выборочного значения и длиной адаптивной нормализации, среднее значение амплитуды, соответствующее каждому выборочному значению, включает в себя этапы, на которых:
определяют, для каждого выборочного значения и в соответствии с длиной адаптивной нормализации, поддиапазон, которому принадлежит выборочное значение; и
вычисляют среднее значение значений амплитуд всех выборочных значений в поддиапазоне, которому принадлежит выборочное значение, и используют среднее значение, полученное посредством вычисления, в качестве среднего значения амплитуды, соответствующего выборочному значению.
[0009] С учетом второй возможной формы реализации первого аспекта, в третьей возможной форме реализации первого аспекта этап, на котором, определяют, для каждого выборочного значения и в соответствии с длиной адаптивной нормализации, поддиапазон, которому принадлежит выборочное значение, включает в себя этапы, на которых:
выполняют группировку поддиапазонов на всех выборочных значениях в предварительно заданном порядке в соответствии с длиной адаптивной нормализации; и, для каждого выборочного значения, определяют поддиапазон, включающий в себя выборочное значение, как поддиапазон, которому принадлежит выборочное значение; или
для каждого выборочного значения, определяют поддиапазон, вмещающий m выборочных значений перед выборочным значением, выборочное значение и n выборочных значений после выборочного значения, как поддиапазон, которому принадлежит выборочное значение, где m и n зависят от длины адаптивной нормализации, m является целым числом не меньше 0, и n является целым числом не меньше 0.
[0010] С учетом первой возможной формы реализации первого аспекта, и/или второй возможной формы реализации первого аспекта, и/или третьей возможной формы реализации первого аспекта, в четвертой возможной форме реализации первого аспекта этап, на котором вычисляют скорректированное значение амплитуды каждого выборочного значения в соответствии со значением амплитуды каждого выборочного значения и в соответствии со значением возмущения амплитуды, соответствующим каждому выборочному значению, включает в себя этапы, на которых:
вычитают значение возмущения амплитуды, соответствующее каждому выборочному значению, из значения амплитуды каждого выборочного значения, чтобы получить разность между значением амплитуды каждого выборочного значения и значением возмущения амплитуды, соответствующим каждому выборочному значению, и используют полученную разность в качестве скорректированного значения амплитуды каждого выборочного значения.
[0011] С учетом первого аспекта, и/или первой возможной формы реализации первого аспекта, и/или второй возможной формы реализации первого аспекта, и/или третьей возможной формы реализации первого аспекта, и/или четвертой возможной формы реализации первого аспекта, в пятой возможной форме реализации первого аспекта этап, на котором определяют длину адаптивной нормализации, включает в себя этапы, на которых:
разделяют сигнал низкочастотного диапазона в речевом/звуковом сигнале на N поддиапазонов, где N является натуральным числом;
вычисляют отношение пиковой и средней мощностей каждого поддиапазона и определяют количество поддиапазонов, отношения пиковой и средней мощностей которых больше предварительно заданной пороговой величины отношения пиковой и средней мощностей; и
вычисляют длину адаптивной нормализации в соответствии с типом сигнала для сигнала высокочастотного диапазона в речевом/звуковом сигнале и количеством поддиапазонов.
[0012] С учетом пятой возможной формы реализации первого аспекта, в шестой возможной форме реализации первого аспекта этап, на котором вычисляют длину адаптивной нормализации в соответствии с типом сигнала для сигнала высокочастотного диапазона в речевом/звуковом сигнале и количеством поддиапазонов, включает в себя этап, на котором:
вычисляют длину адаптивной нормализации по формуле L=K+α×M, где
L является длиной адаптивной нормализации; K является численным значением, соответствующим типу сигнала для сигнала высокочастотного диапазона в речевом/звуковом сигнале, и разные типы сигналов для сигналов высокочастотного диапазона соответствуют разным численным значениям K; M является количеством поддиапазонов, отношения пиковой и средней мощностей которых больше предварительно заданной пороговой величины отношения пиковой и средней мощностей; и α является константой меньше 1.
[0013] С учетом первого аспекта, и/или первой возможной формы реализации первого аспекта, и/или второй возможной формы реализации первого аспекта, и/или третьей возможной формы реализации первого аспекта, и/или четвертой возможной формы реализации первого аспекта, в седьмой возможной форме реализации первого аспекта этап, на котором определяют длину адаптивной нормализации, включает в себя этапы, на которых:
вычисляют отношение пиковой и средней мощностей сигнала низкочастотного диапазона в речевом/звуковом сигнале и отношение пиковой и средней мощностей сигнала высокочастотного диапазона в речевом/звуковом сигнале; и когда абсолютное значение разности между отношением пиковой и средней мощностей сигнала низкочастотного диапазона и отношением пиковой и средней мощностей сигнала высокочастотного диапазона меньше предварительно заданной пороговой величины разности, определяют длину адаптивной нормализации как предварительно заданное первое значение длины, или когда абсолютное значение разности между отношением пиковой и средней мощностей сигнала низкочастотного диапазона и отношением пиковой и средней мощностей сигнала высокочастотного диапазона не меньше предварительно заданной пороговой величины разности, определяют длину адаптивной нормализации как предварительно заданное второе значение длины, при этом первое значение длины больше, чем второе значение длины; или
вычисляют отношение пиковой и средней мощностей сигнала низкочастотного диапазона в речевом/звуковом сигнале и отношение пиковой и средней мощностей сигнала высокочастотного диапазона в речевом/звуковом сигнале; и когда отношение пиковой и средней мощностей сигнала низкочастотного диапазона меньше, чем отношение пиковой и средней мощностей сигнала высокочастотного диапазона, определяют длину адаптивной нормализации как предварительно заданное первое значение длины, или когда отношение пиковой и средней мощностей сигнала низкочастотного диапазона не меньше, чем отношение пиковой и средней мощностей сигнала высокочастотного диапазона, определяют длину адаптивной нормализации как предварительно заданное второе значение длины; или
определяют длину адаптивной нормализации в соответствии с типом сигнала для сигнала высокочастотного диапазона в речевом/звуковом сигнале, при этом разные типы сигналов для сигналов высокочастотного диапазона соответствуют разным длинам адаптивной нормализации.
[0014] С учетом первого аспекта, и/или первой возможной формы реализации первого аспекта, и/или второй возможной формы реализации первого аспекта, и/или третьей возможной формы реализации первого аспекта, и/или четвертой возможной формы реализации первого аспекта, и/или пятой возможной формы реализации первого аспекта, и/или шестой возможной формы реализации первого аспекта, и/или седьмой возможной формы реализации первого аспекта, в восьмой возможной форме реализации первого аспекта этап, на котором определяют второй речевой/звуковой сигнал в соответствии с символом каждого выборочного значения и скорректированным значением амплитуды каждого выборочного значения, включает в себя этапы, на которых:
определяют новое значение каждого выборочного значения в соответствии с символом и скорректированным значением амплитуды каждого выборочного значения, чтобы получить второй речевой/звуковой сигнал; или
вычисляют коэффициент модификации; выполняют модификационную обработку на скорректированном значении амплитуды, которое больше 0, в скорректированных значениях амплитуд выборочных значений в соответствии с коэффициентом модификации; и определяют новое значение каждого выборочного значения в соответствии с символом каждого выборочного значения и скорректированным значением амплитуды, которое получено после модификационной обработки, чтобы получить второй речевой/звуковой сигнал.
[0015] С учетом восьмой возможной формы реализации первого аспекта, в девятой возможной форме реализации первого аспекта этап, на котором вычисляют коэффициент модификации, включает в себя этап, на котором:
вычисляют коэффициент модификации с использованием формулы β=a/L, где β является коэффициентом модификации, L является длиной адаптивной нормализации, и a является константой больше 1.
[0016] С учетом восьмой возможной формы реализации первого аспекта и/или девятой возможной формы реализации первого аспекта, в десятой возможной форме реализации первого аспекта этап, на котором выполняют модификационную обработку на скорректированном значении амплитуды, которое больше 0, в скорректированных значениях амплитуд выборочных значений в соответствии с коэффициентом модификации, включает в себя этап, на котором:
выполняют модификационную обработку на скорректированном значении амплитуды, которое больше 0, в скорректированных значениях амплитуд выборочных значений с использованием следующей формулы:
Y=y×(b-β);
где Y является скорректированным значением амплитуды, полученным после модификационной обработки; y является скорректированным значением амплитуды, которое больше 0, в скорректированных значениях амплитуд выборочных значений; и b является константой, и 0<b<2.
[0017] В соответствии со вторым аспектом, вариант осуществления настоящего изобретения предоставляет устройство для восстановления шумовой составляющей речевого/звукового сигнала, включающее в себя:
блок обработки битового потока, выполненный с возможностью приема битового потока и декодирования битового потока, чтобы получить речевой/звуковой сигнал;
блок определения сигнала, выполненный с возможностью определения первого речевого/звукового сигнала в соответствии с речевым/звуковым сигналом, полученным блоком обработки битового потока, причем первый речевой/звуковой сигнал является сигналом, шумовая составляющая которого должна быть восстановлена, в речевом/звуковом сигнале, полученном посредством декодирования;
первый блок определения, выполненный с возможностью определения символа каждого выборочного значения в первом речевом/звуковом сигнале, определенном блоком определения сигнала, и значения амплитуды каждого выборочного значения в первом речевом/звуковом сигнале, определенном блоком определения сигнала;
второй блок определения, выполненный с возможностью определения длины адаптивной нормализации;
третий блок определения, выполненный с возможностью определения скорректированного значения амплитуды каждого выборочного значения в соответствии с длиной адаптивной нормализации, определенной вторым блоком определения, и значением амплитуды каждого выборочного значения, которое определяется первым блоком определения; и
четвертый блок определения, выполненный с возможностью определения второго речевого/звукового сигнала в соответствии с символом каждого выборочного значения, который определяется первым блоком определения, и скорректированным значением амплитуды каждого выборочного значения, которое определяется третьим блоком определения, причем второй речевой/звуковой сигнал является сигналом, полученным после восстановления шумовой составляющей первого речевого/звукового сигнала.
[0018] С учетом второго аспекта, в первой возможной форме реализации второго аспекта третий блок определения включает в себя:
подблок определения, выполненный с возможностью вычисления, в соответствии со значением амплитуды каждого выборочного значения и длиной адаптивной нормализации, среднего значения амплитуды, соответствующего каждому выборочному значению, и определения, в соответствии со средним значением амплитуды, соответствующим каждому выборочному значению, значения возмущения амплитуды, соответствующего каждому выборочному значению; и
блок вычисления скорректированного значения амплитуды, выполненный с возможностью вычисления скорректированного значения амплитуды каждого выборочного значения в соответствии со значением амплитуды каждого выборочного значения и в соответствии со значением возмущения амплитуды, соответствующим каждому выборочному значению.
[0019] С учетом первой возможной формы реализации второго аспекта, во второй возможной форме реализации второго аспекта подблок определения включает в себя:
модуль определения, выполненный с возможностью определения, для каждого выборочного значения и в соответствии с длиной адаптивной нормализации, поддиапазона, которому принадлежит выборочное значение; и
модуль вычисления, выполненный с возможностью вычисления среднего значения значений амплитуд всех выборочных значений в поддиапазоне, которому принадлежит выборочное значение, и использования среднего значения, полученного посредством вычисления, в качестве среднего значения амплитуды, соответствующего выборочному значению.
[0020] С учетом второй возможной формы реализации второго аспекта, в третьей возможной форме реализации второго аспекта модуль определения выполняется с особой возможностью:
выполнения группировки поддиапазонов на всех выборочных значениях в предварительно заданном порядке в соответствии с длиной адаптивной нормализации; и, для каждого выборочного значения, определения поддиапазона, включающего в себя выборочное значение, как поддиапазона, которому принадлежит выборочное значение; или
для каждого выборочного значения, определения поддиапазона, вмещающего m выборочных значений перед выборочным значением, выборочное значение и n выборочных значений после выборочного значения, как поддиапазона, которому принадлежит выборочное значение, где m и n зависят от длины адаптивной нормализации, m является целым числом не меньше 0, и n является целым числом не меньше 0.
[0021] С учетом первой возможной формы реализации второго аспекта, и/или второй возможной формы реализации второго аспекта, и/или третьей возможной формы реализации второго аспекта, в четвертой возможной форме реализации второго аспекта подблок вычисления скорректированного значения амплитуды выполняется с особой возможностью:
вычитания значения возмущения амплитуды, соответствующего каждому выборочному значению, из значения амплитуды каждого выборочного значения, чтобы получить разность между значением амплитуды каждого выборочного значения и значением возмущения амплитуды, соответствующим каждому выборочному значению, и использования полученной разности в качестве скорректированного значения амплитуды каждого выборочного значения.
[0022] С учетом второго аспекта, и/или первой возможной формы реализации второго аспекта, и/или второй возможной формы реализации второго аспекта, и/или третьей возможной формы реализации второго аспекта и/или четвертой возможной формы реализации второго аспекта, в пятой возможной форме реализации второго аспекта второй блок определения включает в себя:
подблок разделения, выполненный с возможностью разделения сигнала низкочастотного диапазона в речевом/звуковом сигнале на N поддиапазонов, где N является натуральным числом;
подблок количественного определения, выполненный с возможностью вычисления отношения пиковой и средней мощностей каждого поддиапазона, и определения количества поддиапазонов, отношения пиковой и средней мощностей которых больше предварительно заданной пороговой величины отношения пиковой и средней мощностей; и
подблок вычисления длины, выполненный с возможностью вычисления длины адаптивной нормализации в соответствии с типом сигнала для сигнала высокочастотного диапазона в речевом/звуковом сигнале и количеством поддиапазонов.
[0023] С учетом пятой возможной формы реализации второго аспекта, в шестой возможной форме реализации второго аспекта подблок вычисления длины выполняется с особой возможностью:
вычисления длины адаптивной нормализации по формуле L=K+α×M, где
L является длиной адаптивной нормализации; K является численным значением, соответствующим типу сигнала для сигнала высокочастотного диапазона в речевом/звуковом сигнале, и разные типы сигналов для сигналов высокочастотного диапазона соответствуют разным численным значениям K; M является количеством поддиапазонов, отношения пиковой и средней мощностей которых больше предварительно заданной пороговой величины отношения пиковой и средней мощностей; и α является константой меньше 1.
[0024] С учетом второго аспекта, и/или первой возможной формы реализации второго аспекта, и/или второй возможной формы реализации второго аспекта, и/или третьей возможной формы реализации второго аспекта, и/или четвертой возможной формы реализации второго аспекта, в седьмой возможной форме реализации второго аспекта второй блок выполняется с особой возможностью:
вычисления отношения пиковой и средней мощностей сигнала низкочастотного диапазона в речевом/звуковом сигнале и отношения пиковой и средней мощностей сигнала высокочастотного диапазона в речевом/звуковом сигнале; и когда абсолютное значение разности между отношением пиковой и средней мощностей сигнала низкочастотного диапазона и отношением пиковой и средней мощностей сигнала высокочастотного диапазона меньше предварительно заданной пороговой величины разности, определения длины адаптивной нормализации как предварительно заданного первого значения длины, или когда абсолютное значение разности между отношением пиковой и средней мощностей сигнала низкочастотного диапазона и отношением пиковой и средней мощностей сигнала высокочастотного диапазона не меньше предварительно заданной пороговой величины разности, определения длины адаптивной нормализации как предварительно заданного второго значения длины, при этом первое значение длины больше, чем второе значение длины; или
вычисления отношения пиковой и средней мощностей сигнала низкочастотного диапазона в речевом/звуковом сигнале и отношения пиковой и средней мощностей сигнала высокочастотного диапазона в речевом/звуковом сигнале; и когда отношение пиковой и средней мощностей сигнала низкочастотного диапазона меньше, чем отношение пиковой и средней мощностей сигнала высокочастотного диапазона, определения длины адаптивной нормализации как предварительно заданного первого значения длины, или когда отношение пиковой и средней мощностей сигнала низкочастотного диапазона не меньше, чем отношение пиковой и средней мощностей сигнала высокочастотного диапазона, определения длины адаптивной нормализации как предварительно заданного второго значения длины; или
определения длины адаптивной нормализации в соответствии с типом сигнала для сигнала высокочастотного диапазона в речевом/звуковом сигнале, при этом разные типы сигналов для сигналов высокочастотного диапазона соответствуют разным длинам адаптивной нормализации.
[0025] С учетом второго аспекта, и/или первой возможной формы реализации второго аспекта, и/или второй возможной формы реализации второго аспекта, и/или третьей возможной формы реализации второго аспекта, и/или четвертой возможной формы реализации второго аспекта, и/или пятой возможной формы реализации второго аспекта, и/или шестой возможной формы реализации второго аспекта, и/или седьмой возможной формы реализации второго аспекта, в восьмой возможной форме реализации второго аспекта четвертый блок определения выполняется с особой возможностью:
определения нового значения каждого выборочного значения в соответствии с символом и скорректированным значением амплитуды каждого выборочного значения, чтобы получить второй речевой/звуковой сигнал; или
вычисления коэффициента модификации; выполнения модификационной обработки на скорректированном значении амплитуды, которое больше 0, в скорректированных значениях амплитуд выборочных значений в соответствии с коэффициентом модификации; и определения нового значения каждого выборочного значения в соответствии с символом каждого выборочного значения и скорректированным значением амплитуды, которое получено после модификационной обработки, чтобы получить второй речевой/звуковой сигнал.
[0026] С учетом восьмой возможной формы реализации второго аспекта, в девятой возможной форме реализации второго аспекта четвертый блок определения выполняется с особой возможностью вычисления коэффициента модификации с использованием формулы β=a/L, где β является коэффициентом модификации, L является длиной адаптивной нормализации, и a является константой больше 1.
[0027] С учетом восьмой возможной формы реализации второго аспекта и/или девятой возможной формы реализации второго аспекта, в десятой возможной форме реализации второго аспекта четвертый блок определения выполняется с особой возможностью:
выполнения модификационной обработки на скорректированном значении амплитуды, которое больше 0, в скорректированных значениях амплитуд выборочных значений с использованием следующей формулы:
Y=y×(b-β);
где Y является скорректированным значением амплитуды, полученным после модификационной обработки; y является скорректированным значением амплитуды, которое больше 0, в скорректированных значениях амплитуд выборочных значений; и b является константой, и 0<b<2.
[0028] В этих вариантах осуществления принимается битовый поток, и декодируется битовый поток, чтобы получить речевой/звуковой сигнал; определяется первый речевой/звуковой сигнал в соответствии с речевым/звуковым сигналом; определяются символ каждого выборочного значения в первом речевом/звуковом сигнале и значение амплитуды каждого выборочного значения в первом речевом/звуковом сигнале; определяется длина адаптивной нормализации; определяется скорректированное значение амплитуды каждого выборочного значения в соответствии с длиной адаптивной нормализации и значением амплитуды каждого выборочного значения; и определяется второй речевой/звуковой сигнал в соответствии с символом каждого выборочного значения и скорректированным значением амплитуды каждого выборочного значения. В этом технологическом процессе, обрабатывается только исходный сигнал, а именно, первый речевой/звуковой сигнал, и никакой новый сигнал не добавляется к первому речевому/звуковому сигналу, так что никакая новая энергия не добавляется ко второму речевому/звуковому сигналу, полученному после восстановления шумовой составляющей. Следовательно, если первый речевой/звуковой сигнал имеет момент возникновения или сдвиг, никакой эхо-сигнал не добавляется ко второму речевому/звуковому сигналу, тем самым улучшая акустическое качество второго речевого/звукового сигнала.
[0029] Следует понимать, что, приведенное выше общее описание и последующие подробное описание являются лишь иллюстративными, и не предполагают ограничения объема охраны настоящего изобретения.
КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ
[0030] Для более наглядного описания технических решений в вариантах осуществления настоящего изобретения, нижеследующее кратко представляет прилагаемые чертежи, необходимые для описания вариантов осуществления. Очевидно, что прилагаемые чертежи в последующем описании демонстрируют лишь некоторые варианты осуществления настоящего изобретения, и средний специалист в данной области техники может произвести еще и другие чертежи на основании этих прилагаемых чертежей без творческих усилий.
[0031] Фиг. 1 является упрощенной блок-схемой последовательности операций способа для восстановления шумовой составляющей речевого/звукового сигнала в соответствии с одним из вариантов осуществления настоящего изобретения;
[0032] Фиг. 1A является упрощенной схемой примера группировки выборочных значений в соответствии с одним из вариантов осуществления настоящего изобретения;
[0033] Фиг. 1B является другой упрощенной схемой примера группировки выборочных значений в соответствии с одним из вариантов осуществления настоящего изобретения;
[0034] Фиг. 2 является упрощенной блок-схемой последовательности операций другого способа для восстановления шумовой составляющей речевого/звукового сигнала в соответствии с одним из вариантов осуществления настоящего изобретения;
[0035] Фиг. 3 является упрощенной блок-схемой последовательности операций другого способа для восстановления шумовой составляющей речевого/звукового сигнала в соответствии с одним из вариантов осуществления настоящего изобретения;
[0036] Фиг. 4 является упрощенной структурной схемой устройства для восстановления шумовой составляющей речевого/звукового сигнала в соответствии с одним из вариантов осуществления настоящего изобретения; и
[0037] Фиг. 5 является упрощенной структурной схемой электронного устройства в соответствии с одним из вариантов осуществления настоящего изобретения.
[0038] Вышеуказанные прилагаемые чертежи демонстрируют конкретные варианты осуществления настоящего изобретения, и ниже приводится более подробное описание. Прилагаемые чертежи и текстовое описание не предназначены для ограничения объема замысла настоящего изобретения каким-либо образом, а предназначены для описания идеи настоящего изобретения для специалиста в данной области техники со ссылкой на конкретные варианты осуществления.
ОСУЩЕСТВЛЕНИЕ ИЗОБРЕТЕНИЯ
[0039] Ниже ясно описываются технические решения в вариантах осуществления настоящего изобретения со ссылкой на прилагаемые чертежи в вариантах осуществления настоящего изобретения. Очевидно, что описываемые варианты осуществления являются всего лишь частью, а не всеми вариантами осуществления настоящего изобретения. Все другие варианты осуществления, полученные средним специалистом в данной области техники на основе вариантов осуществления настоящего изобретения без творческих усилий, должны попадать в объем охраны настоящего изобретения.
[0040] В последующем подробном описании упоминаются многочисленные конкретные детали, чтобы обеспечить полное понимание настоящего изобретения. Тем не менее, специалист в данной области техники должен понимать, что настоящее изобретение может быть реализовано без этих конкретных деталей. В других вариантах осуществления способ, технологический процесс, компонент, а также схемы, которые являются общеизвестными, не описываются подробно, чтобы излишне не затруднять понимание этих вариантов осуществления.
[0041] Обратимся к Фиг. 1, Фиг. 1 является блок-схемой последовательности операций способа для восстановления шумовой составляющей речевого/звукового сигнала в соответствии с одним из вариантов осуществления настоящего изобретения. Способ включает в себя:
[0042] Этап 101: Прием битового потока, и декодирование битового потока, чтобы получить речевой/звуковой сигнал.
[0043] Подробности того, как декодировать битовый поток, чтобы получить речевой/звуковой сигнал, не описываются в данном документе.
[0044] Этап 102: Определение первого речевого/звукового сигнала в соответствии с речевым/звуковым сигналом, причем первый речевой/звуковой сигнал является сигналом, шумовая составляющая которого должна быть восстановлена, в речевом/звуковом сигнале, полученном посредством декодирования.
[0045] Первый речевой/звуковой сигнал может быть сигналом низкочастотного диапазона, сигналом высокочастотного диапазона, сигналом полного диапазона, или тому подобным, в речевом/звуковом сигнале, полученном посредством декодирования.
[0046] Речевой/звуковой сигнал, полученный посредством декодирования, может включать в себя сигнал низкочастотного диапазона и сигнал высокочастотного диапазона, или может включать в себя сигнал полного диапазона.
[0047] Этап 103: Определение символа каждого выборочного значения в первом речевом/звуковом сигнале и значения амплитуды каждого выборочного значения в первом речевом/звуковом сигнале.
[0048] Когда первый речевой/звуковой сигнала имеет разные формы реализации, формы реализации выборочного значения тоже могут быть разными. Например, если первый речевой/звуковой сигнал является сигналом в частотной области, выборочное значение может быть спектральным коэффициентом; если речевой/звуковой сигнал является сигналом во временной области, выборочное значение может быть значением момента дискретизации.
[0049] Этап 104: Определение длины адаптивной нормализации.
[0050] Длина адаптивной нормализации может быть определена в соответствии со связанным параметром сигнала низкочастотного диапазона и/или сигнала высокочастотного диапазона в речевом/звуковом сигнале, полученном посредством декодирования. Конкретнее, связанный параметр может включать в себя тип сигнала, отношение пиковой и средней мощностей, и тому подобное. Например, в одной из возможных форм реализации, этап, на котором определяют длину адаптивной нормализации, может включать в себя этапы, на которых:
разделяют сигнал низкочастотного диапазона в речевом/звуковом сигнале на N поддиапазонов, где N является натуральным числом;
вычисляют отношение пиковой и средней мощностей каждого поддиапазона, и определяют количество поддиапазонов, отношения пиковой и средней мощностей которых больше предварительно заданной пороговой величины отношения пиковой и средней мощностей; и
вычисляют длину адаптивной нормализации в соответствии с типом сигнала для сигнала высокочастотного диапазона в речевом/звуковом сигнале и количеством поддиапазонов.
[0051] В некоторых случаях этап, на котором вычисляют длину адаптивной нормализации в соответствии с типом сигнала для сигнала высокочастотного диапазона в речевом/звуковом сигнале и количеством поддиапазонов, может включать в себя этап, на котором:
вычисляют длину адаптивной нормализации по формуле L=K+α×M, где
L является длиной адаптивной нормализации; K является численным значением, соответствующим типу сигнала для сигнала высокочастотного диапазона в речевом/звуковом сигнале, и разные типы сигналов для сигналов высокочастотного диапазона соответствуют разным численным значениям K; M является количеством поддиапазонов, отношения пиковой и средней мощностей которых больше предварительно заданной пороговой величины отношения пиковой и средней мощностей; и α является константой меньше 1.
[0052] В другой возможной форме реализации длина адаптивной нормализации может быть вычислена в соответствии с типом сигнала для сигнала низкочастотного диапазона в речевом/звуковом сигнале и количеством поддиапазонов. Что касается конкретной формулы вычисления, обратимся к формуле L=K+α×M. Различие заключается только в том, что в этом случае K является численным значением, соответствующим типу сигнала для сигнала низкочастотного диапазона в речевом/звуковом сигнале. Разные типы сигналов для сигналов низкочастотного диапазона соответствуют разным численным значениям K.
[0053] В третьей возможной форме реализации этап, на котором определяют длину адаптивной нормализации, может включать в себя этапы, на которых:
вычисляют отношение пиковой и средней мощностей сигнала низкочастотного диапазона в речевом/звуковом сигнале и отношение пиковой и средней мощностей сигнала высокочастотного диапазона в речевом/звуковом сигнале; и когда абсолютное значение разности между отношением пиковой и средней мощностей сигнала низкочастотного диапазона и отношением пиковой и средней мощностей сигнала высокочастотного диапазона меньше предварительно заданной пороговой величины разности, определяют длину адаптивной нормализации как предварительно заданное первое значение длины, или когда абсолютное значение разности между отношением пиковой и средней мощностей сигнала низкочастотного диапазона и отношением пиковой и средней мощностей сигнала высокочастотного диапазона не меньше предварительно заданной пороговой величины разности, определяют длину адаптивной нормализации как предварительно заданное второе значение длины. Первое значение длины больше, чем второе значение длины. Первое значение длины и второе значение длины также могут быть получены посредством вычисления с использованием соотношения между отношением пиковой и средней мощностей сигнала низкочастотного диапазона и отношением пиковой и средней мощностей сигнала высокочастотного диапазона или разности между отношением пиковой и средней мощностей сигнала низкочастотного диапазона и отношением пиковой и средней мощностей сигнала высокочастотного диапазона. Конкретный способ вычисления не ограничивается.
[0054] В четвертой возможной форме реализации этап, на котором определяют длину адаптивной нормализации, может включать в себя этапы, на которых:
вычисляют отношение пиковой и средней мощностей сигнала низкочастотного диапазона в речевом/звуковом сигнале и отношение пиковой и средней мощностей сигнала высокочастотного диапазона в речевом/звуковом сигнале; и когда отношение пиковой и средней мощностей сигнала низкочастотного диапазона меньше, чем отношение пиковой и средней мощностей сигнала высокочастотного диапазона, определяют длину адаптивной нормализации как предварительно заданное первое значение длины, или когда отношение пиковой и средней мощностей сигнала низкочастотного диапазона не меньше, чем отношение пиковой и средней мощностей сигнала высокочастотного диапазона, определяют длину адаптивной нормализации как предварительно заданное второе значение длины. Первое значение длины больше, чем второе значение длины. Первое значение длины и второе значение длины также могут быть получены посредством вычисления с использованием соотношения между отношением пиковой и средней мощностей сигнала низкочастотного диапазона и отношением пиковой и средней мощностей сигнала высокочастотного диапазона или разности между отношением пиковой и средней мощностей сигнала низкочастотного диапазона и отношением пиковой и средней мощностей сигнала высокочастотного диапазона. Конкретный способ вычисления не ограничивается.
[0055] В пятой возможной форме реализации этап, на котором определяют длину адаптивной нормализации, может включать в себя этап, на котором: определяют длину адаптивной нормализации в соответствии с типом сигнала для сигнала высокочастотного диапазона в речевом/звуковом сигнале. Разные типы сигналов соответствуют разным длинам адаптивной нормализации. Например, когда типом сигнала является гармонический сигнал, соответствующая длина адаптивной нормализации равна 32; когда типом сигнала является нормальный сигнал, соответствующая длина адаптивной нормализации равна 16; когда типом сигнала является переходный сигнал, соответствующая длина адаптивной нормализации равна 8.
[0056] Этап 105: Определение скорректированного значения амплитуды каждого выборочного значения в соответствии с длиной адаптивной нормализации и значением амплитуды каждого выборочного значения.
[0057] Этап, на котором определяют скорректированное значение амплитуды каждого выборочного значения в соответствии с длиной адаптивной нормализации и значением амплитуды каждого выборочного значения, может включать в себя этапы, на которых:
вычисляют, в соответствии со значением амплитуды каждого выборочного значения и длиной адаптивной нормализации, среднее значение амплитуды, соответствующее каждому выборочному значению, и определяют, в соответствии со средним значением амплитуды, соответствующим каждому выборочному значению, значение возмущения амплитуды, соответствующее каждому выборочному значению; и
вычисляют скорректированное значение амплитуды каждого выборочного значения в соответствии со значением амплитуды каждого выборочного значения и в соответствии со значением возмущения амплитуды, соответствующим каждому выборочному значению.
[0058] Этап, на котором вычисляют, в соответствии со значением амплитуды каждого выборочного значения и длиной адаптивной нормализации, среднее значение амплитуды, соответствующее каждому выборочному значению, может включать в себя этапы, на которых:
определяют, для каждого выборочного значения и в соответствии с длиной адаптивной нормализации, поддиапазон, которому принадлежит выборочное значение; и
вычисляют среднее значение значений амплитуд всех выборочных значений в поддиапазоне, которому принадлежит выборочное значение, и используют среднее значение, полученное посредством вычисления, в качестве среднего значения амплитуды, соответствующего выборочному значению.
[0059] Этап, на котором определяют, для каждого выборочного значения и в соответствии с длиной адаптивной нормализации, поддиапазон, которому принадлежит выборочное значение, может включать в себя этапы, на которых:
выполняют группировку поддиапазонов на всех выборочных значениях в предварительно заданном порядке в соответствии с длиной адаптивной нормализации; и, для каждого выборочного значения, определяют поддиапазон, включающий в себя выборочное значение, как поддиапазон, которому принадлежит выборочное значение.
[0060] Предварительно заданный порядок может быть, например, порядком от низкой частоты к высокой частоте, или порядком от высокой частоты к низкой частоте, что не ограничивается в данном документе.
[0061] Например, обращаясь к Фиг. 1A, предположим, что выборочные значения в порядке возрастания представляют собой, соответственно, x1, x2, x3,..., и xn, а длина адаптивной нормализации равна 5, x1-x5 могут быть сгруппированы в один поддиапазон, и x6-x10 могут быть сгруппированы в один поддиапазон. По аналогии получаются несколько поддиапазонов. Следовательно, для каждого выборочного значения в x1-x5, поддиапазон x1-x5 является поддиапазоном, которому принадлежит каждое выборочное значение, и для каждого выборочного значения в x6-x10, поддиапазон x6-x10 является поддиапазоном, которому принадлежит каждое выборочное значение.
[0062] В качестве альтернативы, этап, на котором определяют, для каждого выборочного значения и в соответствии с длиной адаптивной нормализации, поддиапазон, которому принадлежит выборочное значение, может включать в себя этапы, на которых:
для каждого выборочного значения, определяют поддиапазон, вмещающий m выборочных значений перед выборочным значением, выборочное значение и n выборочных значений после выборочного значения, как поддиапазон, которому принадлежит выборочное значение, где m и n зависят от длины адаптивной нормализации, m является целым числом не меньше 0, и n является целым числом не меньше 0.
[0063] Например, обращаясь к Фиг. 1B, предположим, что выборочные значения в порядке возрастания представляют собой, соответственно, x1, x2, x3,..., и xn, длина адаптивной нормализации равна 5, m равно 2 и n равно 2. Для выборочного значения x3, поддиапазон, вмещающий x1-x5, является поддиапазоном, которому принадлежит выборочное значение x3. Для выборочного значения x4, поддиапазон, вмещающий x2-x6, является поддиапазоном, которому принадлежит выборочное значение x4. Остальные могут быть выведены по аналогии. Поскольку недостаточно выборочных значений перед выборочными значениями x1 и x2 для формирования поддиапазонов, которым принадлежат выборочные значения x1 и x2, и недостаточно выборочных значений после выборочных значений x(n-1) и xn для формирования поддиапазонов, которым принадлежат выборочные значения x(n-1), и xn, при реальном применении поддиапазоны, которым принадлежат x1, x2, x(n-1) и xn могут задаваться автономно. Например, само выборочное значение может быть добавлено, чтобы компенсировать недостаток выборочного значения в поддиапазоне, которому принадлежит выборочное значение. Например, для выборочного значения x1, нет никакого выборочного значения перед выборочным значением x1, и в качестве поддиапазона, которому принадлежит выборочное значение x1, может использоваться x1, x1, x1, x2 и x3.
[0064] Когда значение возмущения амплитуды, соответствующее каждому выборочному значению, определяется в соответствии со средним значением амплитуды, соответствующим каждому выборочному значению, среднее значение амплитуды, соответствующее каждому выборочному значению, может непосредственно использоваться в качестве значения возмущения амплитуды, соответствующего каждому выборочному значению. В качестве альтернативы, предварительно заданная операция может быть выполнена на среднем значении амплитуды, соответствующем каждому выборочному значению, чтобы получить значение возмущения амплитуды, соответствующее каждому выборочному значению. Предварительно заданная операция может заключаться в том, например, что среднее значение амплитуды умножается на численное значение. Это численное значение, как правило, больше 0.
[0065] Этап, на котором вычисляют скорректированное значение амплитуды каждого выборочного значения в соответствии со значением амплитуды каждого выборочного значения и в соответствии со значением возмущения амплитуды, соответствующим каждому выборочному значению, может включать в себя этапы, на которых:
вычитают значение возмущения амплитуды, соответствующее каждому выборочному значению, из значения амплитуды каждого выборочного значения, чтобы получить разность между значением амплитуды каждого выборочного значения и значением возмущения амплитуды, соответствующим каждому выборочному значению, и используют полученную разность в качестве скорректированного значения амплитуды каждого выборочного значения.
[0066] Этап 106: Определение второго речевого/звукового сигнала в соответствии с символом каждого выборочного значения и скорректированным значением амплитуды каждого выборочного значения, причем второй речевой/звуковой сигнал является сигналом, полученным после восстановления шумовой составляющей первого речевого/звукового сигнала.
[0067] В одной из возможных форм реализации может быть определено новое значение каждого выборочного значения в соответствии с символом и скорректированным значением амплитуды каждого выборочного значения, чтобы получить второй речевой/звуковой сигнал.
[0068] В другой возможной форме реализации этап, на котором определяют второй речевой/звуковой сигнала в соответствии с символом каждого выборочного значения и скорректированным значением амплитуды каждого выборочного значения, может включать в себя этапы, на которых:
вычисляют коэффициент модификации;
выполняют модификационную обработку на скорректированном значении амплитуды, которое больше 0, в скорректированных значениях амплитуд выборочных значений в соответствии с коэффициентом модификации; и
определяют новое значение каждого выборочного значения в соответствии с символом каждого выборочного значения и скорректированным значением амплитуды, которое получено после модификационной обработки, чтобы получить второй речевой/звуковой сигнал.
[0069] В одной из возможных форм реализации полученный второй речевой/звуковой сигнал может включать в себя новые значения всех выборочных значений.
[0070] Коэффициент модификации может быть вычислен в соответствии с длиной адаптивной нормализации. Конкретнее, коэффициент β модификации может быть равен a/L, где a является константой больше 1.
[0071] Этап, на котором выполняют модификационную обработку на скорректированном значении амплитуды, которое больше 0, в скорректированных значениях амплитуд выборочных значений в соответствии с коэффициентом модификации, может включать в себя этап, на котором:
выполняют модификационную обработку на скорректированном значении амплитуды, которое больше 0, в скорректированных значениях амплитуд выборочных значений с использованием следующей формулы:
Y=y×(b-β);
где Y является скорректированным значением амплитуды, полученным после модификационной обработки; y является скорректированным значением амплитуды, которое больше 0, в скорректированных значениях амплитуд выборочных значений; и b является константой, и 0<b<2.
[0072] Этап извлечения символа каждого выборочного значения в первом речевом/звуковом сигнале на этапе 103 может быть выполнен в любое время до этапа 106. Нет обязательного порядка исполнения между этапом извлечения символа каждого выборочного значения в первом речевом/звуковом сигнале и этапом 104 и этапом 105.
[0073] Порядок исполнения между этапом 103 и этапом 104 не ограничивается.
[0074] В предшествующем уровне техники, если речевой/звуковой сигнал является сигналом, имеющим момент возникновения или сдвиг, сигнал во временной области в речевом/звуковом сигнале может быть в пределах одного кадра. В этом случае часть речевого/звукового сигнала имеет очень большое значение момента дискретизации сигнала и очень сильную энергию сигнала, тогда как другая часть речевого/звукового сигнала имеет очень маленькое значение момента дискретизации сигнала и очень слабую энергию сигнала. В этом случае случайный шумовой сигнал добавляется к речевому/звуковому сигналу в частотной области, чтобы получить сигнал, полученный после восстановления шумовой составляющей. Поскольку энергия случайного шумового сигнала находится точно в пределах одного кадра во временной области, когда сигнал в частотной области, полученный после восстановления шумовой составляющей, преобразуется в сигнал во временной области, вновь добавленный случайный шумовой сигнал, в общем случае, вызывает увеличение энергии сигнала в части, исходное значение момента дискретизации которой является очень маленьким, в сигнале во временной области, полученном посредством преобразования. Значение момента дискретизации сигнала этой части также, соответственно, становится относительно большим. Следовательно, сигнал, полученный после восстановления шумовой составляющей, имеет некоторые эхо-сигналы, что влияет на акустическое качество сигнала, полученного после восстановления шумовой составляющей.
[0075] В этом варианте осуществления, определяется первый речевой/звуковой сигнал в соответствии с речевым/звуковым сигналом; определяются символ каждого выборочного значения в первом речевом/звуковом сигнале и значение амплитуды каждого выборочного значения в первом речевом/звуковом сигнале; определяется длина адаптивной нормализации; определяется скорректированное значение амплитуды каждого выборочного значения в соответствии с длиной адаптивной нормализации и значением амплитуды каждого выборочного значения; и определяется второй речевой/звуковой сигнал в соответствии с символом каждого выборочного значения и скорректированным значением амплитуды каждого выборочного значения. В этом технологическом процессе, обрабатывается только исходный сигнал, а именно, первый речевой/звуковой сигнал, и никакой новый сигнал не добавляется к первому речевому/звуковому сигналу, так что никакая новая энергия не добавляется ко второму речевому/звуковому сигналу, полученному после восстановления шумовой составляющей. Следовательно, если первый речевой/звуковой сигнал имеет момент возникновения или сдвиг, никакой эхо-сигнал не добавляется ко второму речевому/звуковому сигналу, тем самым улучшая акустическое качество второго речевого/звукового сигнала.
[0076] Обратимся к Фиг. 2, Фиг. 2 является другой упрощенной блок-схемой последовательности операций способа для восстановления шумовой составляющей речевого/звукового сигнала в соответствии с одним из вариантов осуществления настоящего изобретения. Способ включает в себя:
[0077] Этап 201: Прием битового потока, декодирование битового потока, чтобы получить речевой/звуковой сигнал, причем речевой/звуковой сигнал, полученный посредством декодирования, включает в себя сигнал низкочастотного диапазона и сигнал высокочастотного диапазона; и определение сигнала высокочастотного диапазона как первого речевого/звукового сигнала.
[0078] То, как декодировать битовый поток, не ограничивается в настоящем изобретении.
[0079] Этап 202: Определение символа каждого выборочного значения в сигнале высокочастотного диапазона и значения амплитуды каждого выборочного значения в сигнале высокочастотного диапазона.
[0080] Например, если коэффициентом выборочного значения в сигнале высокочастотного диапазона является -4, то символом выборочного значения является "-", а значение амплитуды равно 4.
[0081] Этап 203: Определение длины адаптивной нормализации.
[0082] Для получения дополнительной информации о том, как определить длину адаптивной нормализации, см. соответствующее описание для этапа 104. Подробности не описываются здесь еще раз.
[0083] Этап 204: Определение, в соответствии со значением амплитуды каждого выборочного значения и длиной адаптивной нормализации, среднего значения амплитуды, соответствующего каждому выборочному значению, и определение, в соответствии со средним значением амплитуды, соответствующим каждому выборочному значению, значения возмущения амплитуды, соответствующего каждому выборочному значению.
[0084] Касательно того, как определить среднее значение амплитуды, соответствующее каждому выборочному значению, см. соответствующее описание для этапа 105. Подробности не описываются здесь еще раз.
[0085] Этап 205: Вычисление скорректированного значения амплитуды каждого выборочного значения в соответствии со значением амплитуды каждого выборочного значения и в соответствии со значением возмущения амплитуды, соответствующим каждому выборочному значению.
[0086] Касательно того, как определить скорректированное значение амплитуды каждого выборочного значения, см. соответствующее описание для этапа 105. Подробности не описываются здесь еще раз.
[0087] Этап 206: Определение второго речевого/звукового сигнала в соответствии с символом и скорректированным значением амплитуды каждого выборочного значения.
[0088] Второй речевой/звуковой сигнал является сигналом, полученным после восстановления шумовой составляющей первого речевого/звукового сигнала.
[0089] Касательно конкретной реализации на этом этапе, см. соответствующее описание для этапа 106. Подробности не описываются здесь еще раз.
[0090] Этап определения символа каждого выборочного значения в первом речевом/звуковом сигнале на этапе 202 может быть выполнен в любое время до этапа 206. Нет обязательного порядка исполнения между этапом определения символа каждого выборочного значения в первом речевом/звуковом сигнале и этапом 203, этапом 204 и этапом 205.
[0091] Порядок исполнения между этапом 202 и этапом 203 не ограничивается.
[0092] Этап 207: Объединение второго речевого/звукового сигнала и сигнала низкочастотного диапазона в речевом/звуковом сигнале, полученном посредством декодирования, чтобы получить выходной сигнал.
[0093] Если первый речевой/звуковой сигнал является сигналом низкочастотного диапазона в речевом/звуковом сигнале, полученном посредством декодирования, второй речевой/звуковой сигнал и сигнал высокочастотного диапазона в речевом/звуковом сигнале, полученном посредством декодирования, могут быть объединены, чтобы получить выходной сигнал.
[0094] Если первый речевой/звуковой сигнал является сигналом высокочастотного диапазона в речевом/звуковом сигнале, полученном посредством декодирования, второй речевой/звуковой сигнал и сигнал низкочастотного диапазона в речевом/звуковом сигнале, полученном посредством декодирования, могут быть объединены, чтобы получить выходной сигнал.
[0095] Если первый речевой/звуковой сигнал является сигналом полного диапазона в речевом/звуковом сигнале, полученном посредством декодирования, второй речевой/звуковой сигнал может быть непосредственно определен как выходной сигнал.
[0096] В этом варианте осуществления, путем восстановления шумовой составляющей сигнала высокочастотного диапазона в речевом/звуковом сигнале, полученном посредством декодирования, в конечном итоге восстанавливается шумовая составляющая сигнала высокочастотного диапазона, чтобы получить второй речевой/звуковой сигнал. Таким образом, если сигнал высокочастотного диапазона имеет момент возникновения или сдвиг, никакой эхо-сигнал не добавляется ко второму речевому/звуковому сигналу, тем самым улучшая акустическое качество второго речевого/звукового сигнала, и дополнительно улучшая акустическое качество выводящегося в конечном итоге выходного сигнала.
[0097] Обратимся к Фиг. 3, Фиг. 3 является другой упрощенной блок-схемой последовательности операций способа для восстановления шумовой составляющей речевого/звукового сигнала в соответствии с одним из вариантов осуществления настоящего изобретения. Способ включает в себя:
[0098] Этапы от 301 до 305 совпадают с этапами от 201 до 205, и подробности не описываются здесь еще раз.
[0099] Этап 306: Вычисление коэффициента модификации; и выполнение модификационной обработки на скорректированном значении амплитуды, которое больше 0, в скорректированных значениях амплитуд выборочных значений в соответствии с коэффициентом модификации.
[0100] Касательно конкретной реализации на этом этапе, см. соответствующее описание для этапа 106. Подробности не описываются здесь еще раз.
[0101] Этап 307: Определение второго речевого/звукового сигнала в соответствии с символом каждого выборочного значения и скорректированным значением амплитуды, полученным после модификационной обработки.
[0102] Касательно конкретной реализации на этом этапе, см. соответствующее описание для этапа 106. Подробности не описываются здесь еще раз.
[0103] Этап определения символа каждого выборочного значения в первом речевом/звуковом сигнале на этапе 302 может быть выполнен в любое время до этапа 307. Нет обязательного порядка исполнения между этапом определения символа каждого выборочного значения в первом речевом/звуковом сигнале и этапом 303, этапом 304, этапом 305 и этапом 306.
[0104] Порядок исполнения между этапом 302 и этапом 303 не ограничивается.
[0105] Этап 308: Объединение второго речевого/звукового сигнала и сигнала низкочастотного диапазона в речевом/звуковом сигнале, полученном посредством декодирования, чтобы получить выходной сигнал.
[0106] По сравнению с вариантом осуществления, показанным на Фиг. 2, в этом варианте осуществления, после того, как получено скорректированное значение амплитуды каждого выборочного значения, еще и дополнительно модифицируется скорректированное значение амплитуды, которое больше 0, в скорректированных значениях амплитуды, тем самым дополнительно улучшая акустическое качество второго речевого/звукового сигнала, и дополнительно улучшая акустическое качество выводящегося в конечном итоге выходного сигнала.
[0107] В иллюстративных способах для восстановления шумовой составляющей речевого/звукового сигнала, показанных на Фиг. 2 и Фиг. 3, в соответствии с вариантами осуществления настоящего изобретения, сигнал высокочастотного диапазона в речевом/звуковом сигнале, полученном посредством декодирования, определяется как первый речевой/звуковой сигнал, и шумовая составляющая первого речевого/звукового сигнала восстанавливается, чтобы в конечном итоге получить второй речевой/звуковой сигнал. При реальном применении, согласно способу для восстановления шумовой составляющей речевого/звукового сигнала в соответствии с вариантами осуществления настоящего изобретения, может быть восстановлена шумовая составляющая сигнала полного диапазона речевого/звукового сигнала, полученного посредством декодирования, или восстанавливается шумовая составляющая сигнала низкочастотного диапазона речевого/звукового сигнала, полученного посредством декодирования, чтобы в конечном итоге получить второй речевой/звуковой сигнал. Что касается технологического процесса реализации этого, см. иллюстративные способы, показанные на Фиг. 2 и Фиг. 3. Различие заключается только в том, что когда должен быть определен первый речевой/звуковой сигнал, сигнал полного диапазона или сигнал низкочастотного диапазона определяется как первый речевой/звуковой сигнал. Описание с поочередным использованием примеров не предоставляется в данном документе.
[0108] Обратимся к Фиг. 4, Фиг. 4 является упрощенной структурной схемой устройства для восстановления шумовой составляющей речевого/звукового сигнала в соответствии с одним из вариантов осуществления настоящего изобретения. Устройство может быть размещено в электронном устройстве. Устройство 400 может включать в себя:
блок 410 обработки битового потока, выполненный с возможностью приема битового потока и декодирования битового потока, чтобы получить речевой/звуковой сигнал; и определения первого речевого/звукового сигнала в соответствии с речевым/звуковым сигналом, причем первый речевой/звуковой сигнал является сигналом, шумовая составляющая которого должна быть восстановлена, в речевом/звуковом сигнале, полученном посредством декодирования;
блок 420 определения сигнала, выполненный с возможностью определения первого речевого/звукового сигнала в соответствии с речевым/звуковым сигналом, полученным блоком 410 обработки битового потока;
первый блок 430 определения, выполненный с возможностью определения символа каждого выборочного значения в первом речевом/звуковом сигнале, определенном блоком 420 определения сигнала, и значения амплитуды каждого выборочного значения в первом речевом/звуковом сигнале, определенном блоком 420 определения сигнала;
второй блок 440 определения, выполненный с возможностью определения длины адаптивной нормализации;
третий блок 450 определения, выполненный с возможностью определения скорректированного значения амплитуды каждого выборочного значения в соответствии с длиной адаптивной нормализации, определенной вторым блоком 440 определения, и значением амплитуды каждого выборочного значения, которое определяется первым блоком 430 определения; и
четвертый блок 460 определения, выполненный с возможностью определения второго речевого/звукового сигнала в соответствии с символом каждого выборочного значения, который определяется первым блоком 430 определения, и скорректированным значением амплитуды каждого выборочного значения, которое определяется третьим блоком 450 определения, причем второй речевой/звуковой сигнал является сигналом, полученным после восстановления шумовой составляющей первого речевого/звукового сигнала.
[0109] В некоторых случаях третий блок 450 определения может включать в себя:
подблок определения, выполненный с возможностью вычисления, в соответствии со значением амплитуды каждого выборочного значения и длиной адаптивной нормализации, среднего значения амплитуды, соответствующего каждому выборочному значению, и определения, в соответствии со средним значением амплитуды, соответствующим каждому выборочному значению, значения возмущения амплитуды, соответствующего каждому выборочному значению; и
подблок вычисления скорректированного значения амплитуды, выполненный с возможностью вычисления скорректированного значения амплитуды каждого выборочного значения в соответствии со значением амплитуды каждого выборочного значения и в соответствии со значением возмущения амплитуды, соответствующим каждому выборочному значению.
[0110] В некоторых случаях подблок определения может включать в себя:
модуль определения, выполненный с возможностью определения, для каждого выборочного значения и в соответствии с длиной адаптивной нормализации, поддиапазона, которому принадлежит выборочное значение; и
модуль вычисления, выполненный с возможностью вычисления среднего значения значений амплитуд всех выборочных значений в поддиапазоне, которому принадлежит выборочное значение, и использования среднего значения, полученного посредством вычисления, в качестве среднего значения амплитуды, соответствующего выборочному значению.
[0111] В некоторых случаях модуль определения может быть выполнен с особой возможностью:
выполнения группировки поддиапазонов на всех выборочных значениях в предварительно заданном порядке в соответствии с длиной адаптивной нормализации; и, для каждого выборочного значения, определения поддиапазона, включающего в себя выборочное значение, как поддиапазона, которому принадлежит выборочное значение; или
для каждого выборочного значения, определения поддиапазона, вмещающего m выборочных значений перед выборочным значением, выборочное значение и n выборочных значений после выборочного значения, как поддиапазона, которому принадлежит выборочное значение, где m и n зависят от длины адаптивной нормализации, m является целым числом не меньше 0, и n является целым числом не меньше 0.
[0112] В некоторых случаях подблок вычисления скорректированного значения амплитуды выполняется с особой возможностью:
вычитания значения возмущения амплитуды, соответствующего каждому выборочному значению, из значения амплитуды каждого выборочного значения, чтобы получить разность между значением амплитуды каждого выборочного значения и значением возмущения амплитуды, соответствующим каждому выборочному значению, и использования полученной разности в качестве скорректированного значения амплитуды каждого выборочного значения.
[0113] В некоторых случаях второй блок 440 определения может включать в себя:
подблок разделения, выполненный с возможностью разделения сигнала низкочастотного диапазона в речевом/звуковом сигнале на N поддиапазонов, где N является натуральным числом;
подблок количественного определения, выполненный с возможностью вычисления отношения пиковой и средней мощностей каждого поддиапазона, и определения количества поддиапазонов, отношения пиковой и средней мощностей которых больше предварительно заданной пороговой величины отношения пиковой и средней мощностей; и
подблок вычисления длины, выполненный с возможностью вычисления длины адаптивной нормализации в соответствии с типом сигнала для сигнала высокочастотного диапазона в речевом/звуковом сигнале и количеством поддиапазонов.
[0114] В некоторых случаях подблок вычисления длины может быть выполнен с особой возможностью:
вычисления длины адаптивной нормализации по формуле L=K+α×M, где
L является длиной адаптивной нормализации; K является численным значением, соответствующим типу сигнала для сигнала высокочастотного диапазона в речевом/звуковом сигнале, и разные типы сигналов для сигналов высокочастотного диапазона соответствуют разным численным значениям K; M является количеством поддиапазонов, отношения пиковой и средней мощностей которых больше предварительно заданной пороговой величины отношения пиковой и средней мощностей; и α является константой меньше 1.
[0115] В некоторых случаях второй блок 440 определения может быть выполнен с особой возможностью:
вычисления отношения пиковой и средней мощностей сигнала низкочастотного диапазона в речевом/звуковом сигнале и отношения пиковой и средней мощностей сигнала высокочастотного диапазона в речевом/звуковом сигнале; и когда абсолютное значение разности между отношением пиковой и средней мощностей сигнала низкочастотного диапазона и отношением пиковой и средней мощностей сигнала высокочастотного диапазона меньше предварительно заданной пороговой величины разности, определения длины адаптивной нормализации как предварительно заданного первого значения длины, или когда абсолютное значение разности между отношением пиковой и средней мощностей сигнала низкочастотного диапазона и отношением пиковой и средней мощностей сигнала высокочастотного диапазона не меньше предварительно заданной пороговой величины разности, определения длины адаптивной нормализации как предварительно заданного второго значения длины, при этом первое значение длины больше, чем второе значение длины; или
вычисления отношения пиковой и средней мощностей сигнала низкочастотного диапазона в речевом/звуковом сигнале и отношения пиковой и средней мощностей сигнала высокочастотного диапазона в речевом/звуковом сигнале; и когда отношение пиковой и средней мощностей сигнала низкочастотного диапазона меньше, чем отношение пиковой и средней мощностей сигнала высокочастотного диапазона, определения длины адаптивной нормализации как предварительно заданного первого значения длины, или когда отношение пиковой и средней мощностей сигнала низкочастотного диапазона не меньше, чем отношение пиковой и средней мощностей сигнала высокочастотного диапазона, определения длины адаптивной нормализации как предварительно заданного второго значения длины; или
определения длины адаптивной нормализации в соответствии с типом сигнала для сигнала высокочастотного диапазона в речевом/звуковом сигнале, при этом разные типы сигналов для сигналов высокочастотного диапазона соответствуют разным длинам адаптивной нормализации.
[0116] В некоторых случаях четвертый блок 460 определения может быть выполнен с особой возможностью:
определения нового значения каждого выборочного значения в соответствии с символом и скорректированным значением амплитуды каждого выборочного значения, чтобы получить второй речевой/звуковой сигнал; или
вычисления коэффициента модификации; выполнения модификационной обработки на скорректированном значении амплитуды, которое больше 0, в скорректированных значениях амплитуд выборочных значений в соответствии с коэффициентом модификации; и определения нового значения каждого выборочного значения в соответствии с символом каждого выборочного значения и скорректированным значением амплитуды, которое получено после модификационной обработки, чтобы получить второй речевой/звуковой сигнал.
[0117] В некоторых случаях четвертый блок 460 определения может быть выполнен с особой возможностью вычисления коэффициента модификации с использованием формулы β=a/L, где β является коэффициентом модификации, L является длиной адаптивной нормализации, и a является константой больше 1.
[0118] В некоторых случаях четвертый блок 460 определения может быть выполнен с особой возможностью:
выполнения модификационной обработки на скорректированном значении амплитуды, которое больше 0, в скорректированных значениях амплитуд выборочных значений с использованием следующей формулы:
Y=y×(b-β);
где Y является скорректированным значением амплитуды, полученным после модификационной обработки; y является скорректированным значением амплитуды, которое больше 0, в скорректированных значениях амплитуд выборочных значений; и b является константой, и 0<b<2.
[0119] В этом варианте осуществления определяется первый речевой/звуковой сигнал в соответствии с речевым/звуковым сигналом; определяется символ каждого выборочного значения в первом речевом/звуковом сигнале и значение амплитуды каждого выборочного значения в первом речевом/звуковом сигнале; определяется длина адаптивной нормализации; определяется скорректированное значение амплитуды каждого выборочного значения в соответствии с длиной адаптивной нормализации и значением амплитуды каждого выборочного значения; и определяется второй речевой/звуковой сигнал в соответствии с символом каждого выборочного значения и скорректированным значением амплитуды каждого выборочного значения. В этом технологическом процессе, обрабатывается только исходный сигнал, а именно, первый речевой/звуковой сигнал, и никакой новый сигнал не добавляется к первому речевому/звуковому сигналу, так что никакая новая энергия не добавляется ко второму речевому/звуковому сигналу, полученному после восстановления шумовой составляющей. Следовательно, если первый речевой/звуковой сигнал имеет момент возникновения или сдвиг, никакой эхо-сигнал не добавляется ко второму речевому/звуковому сигналу, тем самым улучшая акустическое качество второго речевого/звукового сигнала.
[0120] Обратимся к Фиг. 5, Фиг. 5 является структурной схемой электронного устройства в соответствии с одним из вариантов осуществления настоящего изобретения. Электронное устройство 500 включает в себя обрабатывающее устройство 510, запоминающее устройство 520, приемопередающее устройство 530, а также шину 540.
[0121] Обрабатывающее устройство 510, запоминающее устройство 520 и приемопередающее устройство 530 соединены друг с другом с помощью шины 540, и шина 540 может быть шиной ISA, шиной PCI, шиной EISA, или тому подобным. Шина может подразделяться на адресную шину, шину данных, шину управления, или тому подобное. Для простоты обозначения шина, показанная на Фиг. 5, обозначена при помощи только одной жирной линии, но это не означает, что существует только одна шина или только один тип шины.
[0122] Запоминающее устройство 520 выполняется с возможностью хранения программы. В частности, программа может включать программный код, и программный код включает в себя операционную инструкцию для компьютера. Запоминающее устройство 520 может включать в себя быстродействующее запоминающее устройство ОЗУ, и может дополнительно включать в себя энергонезависимое запоминающее устройство (энергонезависимое запоминающее устройство), такое как, по меньшей мере, одно хранилище на магнитных дисках.
[0123] Приемопередающее устройство 530 выполняется с возможностью соединения с другим устройством, и обмена данными с другим устройством. В частности, приемопередающее устройство 530 может быть выполнено с возможностью приема битового потока.
[0124] Обрабатывающее устройство 510 исполняет программный код, сохраненный в запоминающем устройстве 520, и выполняется с возможностью: декодирования битового потока, чтобы получить речевой/звуковой сигнал; определения первого речевого/звукового сигнала в соответствии с речевым/звуковым сигналом; определения символа каждого выборочного значения в первом речевом/звуковом сигнале и значения амплитуды каждого выборочного значения в первом речевом/звуковом сигнале; определения длины адаптивной нормализации; определения скорректированного значения амплитуды каждого выборочного значения в соответствии с длиной адаптивной нормализации и значением амплитуды каждого выборочного значения; и определения второго речевого/звукового сигнала в соответствии с символом каждого выборочного значения и скорректированным значением амплитуды каждого выборочного значения.
[0125] В некоторых случаях обрабатывающее устройство 510 может быть выполнено с особой возможностью:
вычисления, в соответствии со значением амплитуды каждого выборочного значения и длиной адаптивной нормализации, среднего значения амплитуды, соответствующего каждому выборочному значению, и определения, в соответствии со средним значением амплитуды, соответствующим каждому выборочному значению, значения возмущения амплитуды, соответствующего каждому выборочному значению; и
вычисления скорректированного значения амплитуды каждого выборочного значения в соответствии со значением амплитуды каждого выборочного значения и в соответствии со значением возмущения амплитуды, соответствующим каждому выборочному значению.
[0126] В некоторых случаях обрабатывающее устройство 510 может быть выполнено с особой возможностью:
определения, для каждого выборочного значения и в соответствии с длиной адаптивной нормализации, поддиапазона, которому принадлежит выборочное значение; и
вычисления среднего значения значений амплитуд всех выборочных значений в поддиапазоне, которому принадлежит выборочное значение, и использования среднего значения, полученного посредством вычисления, в качестве среднего значения амплитуды, соответствующего выборочному значению.
[0127] В некоторых случаях обрабатывающее устройство 510 может быть выполнено с особой возможностью:
выполнения группировки поддиапазонов на всех выборочных значениях в предварительно заданном порядке в соответствии с длиной адаптивной нормализации; и, для каждого выборочного значения, определения поддиапазона, включающего в себя выборочное значение, как поддиапазона, которому принадлежит выборочное значение; или
для каждого выборочного значения, определения поддиапазона, вмещающего m выборочных значений перед выборочным значением, выборочное значение и n выборочных значений после выборочного значения, как поддиапазона, которому принадлежит выборочное значение, где m и n зависят от длины адаптивной нормализации, m является целым числом не меньше 0, и n является целым числом не меньше 0.
[0128] В некоторых случаях обрабатывающее устройство 510 может быть выполнено с особой возможностью:
вычитания значения возмущения амплитуды, соответствующего каждому выборочному значению, из значения амплитуды каждого выборочного значения, чтобы получить разность между значением амплитуды каждого выборочного значения и значением возмущения амплитуды, соответствующим каждому выборочному значению, и использования полученной разности в качестве скорректированного значения амплитуды каждого выборочного значения.
[0129] В некоторых случаях обрабатывающее устройство 510 может быть выполнено с особой возможностью:
разделения сигнала низкочастотного диапазона в речевом/звуковом сигнале на N поддиапазонов, где N является натуральным числом;
вычисления отношения пиковой и средней мощностей каждого поддиапазона, и определения количества поддиапазонов, отношения пиковой и средней мощностей которых больше предварительно заданной пороговой величины отношения пиковой и средней мощностей; и
вычисления длины адаптивной нормализации в соответствии с типом сигнала для сигнала высокочастотного диапазона в речевом/звуковом сигнале и количеством поддиапазонов.
[0130] В некоторых случаях обрабатывающее устройство 510 может быть выполнено с особой возможностью:
вычисления длины адаптивной нормализации по формуле L=K+α×M, где
L является длиной адаптивной нормализации; K является численным значением, соответствующим типу сигнала для сигнала высокочастотного диапазона в речевом/звуковом сигнале, и разные типы сигналов для сигналов высокочастотного диапазона соответствуют разным численным значениям K; M является количеством поддиапазонов, отношения пиковой и средней мощностей которых больше предварительно заданной пороговой величины отношения пиковой и средней мощностей; и α является константой меньше 1.
[0131] В некоторых случаях обрабатывающее устройство 510 может быть выполнено с особой возможностью:
вычисления отношения пиковой и средней мощностей сигнала низкочастотного диапазона в речевом/звуковом сигнале и отношения пиковой и средней мощностей сигнала высокочастотного диапазона в речевом/звуковом сигнале; и когда абсолютное значение разности между отношением пиковой и средней мощностей сигнала низкочастотного диапазона и отношением пиковой и средней мощностей сигнала высокочастотного диапазона меньше предварительно заданной пороговой величины разности, определения длины адаптивной нормализации как предварительно заданного первого значения длины, или когда абсолютное значение разности между отношением пиковой и средней мощностей сигнала низкочастотного диапазона и отношением пиковой и средней мощностей сигнала высокочастотного диапазона не меньше предварительно заданной пороговой величины разности, определения длины адаптивной нормализации как предварительно заданного второго значения длины, при этом первое значение длины больше, чем второе значение длины; или
вычисления отношения пиковой и средней мощностей сигнала низкочастотного диапазона в речевом/звуковом сигнале и отношения пиковой и средней мощностей сигнала высокочастотного диапазона в речевом/звуковом сигнале; и когда отношение пиковой и средней мощностей сигнала низкочастотного диапазона меньше, чем отношение пиковой и средней мощностей сигнала высокочастотного диапазона, определения длины адаптивной нормализации как предварительно заданного первого значения длины, или когда отношение пиковой и средней мощностей сигнала низкочастотного диапазона не меньше, чем отношение пиковой и средней мощностей сигнала высокочастотного диапазона, определения длины адаптивной нормализации как предварительно заданного второго значения длины; или
определения длины адаптивной нормализации в соответствии с типом сигнала для сигнала высокочастотного диапазона в речевом/звуковом сигнале, при этом разные типы сигналов для сигналов высокочастотного диапазона соответствуют разным длинам адаптивной нормализации.
[0132] В некоторых случаях обрабатывающее устройство 510 может быть выполнено с особой возможностью:
определения нового значения каждого выборочного значения в соответствии с символом и скорректированным значением амплитуды каждого выборочного значения, чтобы получить второй речевой/звуковой сигнал; или
вычисления коэффициента модификации; выполнения модификационной обработки на скорректированном значении амплитуды, которое больше 0, в скорректированных значениях амплитуд выборочных значений в соответствии с коэффициентом модификации; и определения нового значения каждого выборочного значения в соответствии с символом каждого выборочного значения и скорректированным значением амплитуды, которое получено после модификационной обработки, чтобы получить второй речевой/звуковой сигнал.
[0133] В некоторых случаях обрабатывающее устройство 510 может быть выполнено с особой возможностью:
вычисления коэффициента модификации с использованием формулы β=a/L, где β является коэффициентом модификации, L является длиной адаптивной нормализации, и a является константой больше 1.
[0134] В некоторых случаях обрабатывающее устройство 510 может быть выполнено с особой возможностью:
выполнения модификационной обработки на скорректированном значении амплитуды, которое больше 0, в скорректированных значениях амплитуд выборочных значений с использованием следующей формулы:
Y=y×(b-β);
где Y является скорректированным значением амплитуды, полученным после модификационной обработки; y является скорректированным значением амплитуды, которое больше 0, в скорректированных значениях амплитуд выборочных значений; и b является константой, и 0<b<2.
[0135] В этом варианте осуществления электронное устройство определяет первый речевой/звуковой сигнал в соответствии с речевым/звуковым сигналом; определяет символ каждого выборочного значения в первом речевом/звуковом сигнале и значение амплитуды каждого выборочного значения в первом речевом/звуковом сигнале; определяет длину адаптивной нормализации; определяет скорректированное значение амплитуды каждого выборочного значения в соответствии с длиной адаптивной нормализации и значением амплитуды каждого выборочного значения; и определяет второй речевой/звуковой сигнал в соответствии с символом каждого выборочного значения и скорректированным значением амплитуды каждого выборочного значения. В этом технологическом процессе, обрабатывается только исходный сигнал, а именно, первый речевой/звуковой сигнал, и никакой новый сигнал не добавляется к первому речевому/звуковому сигналу, так что никакая новая энергия не добавляется ко второму речевому/звуковому сигналу, полученному после восстановления шумовой составляющей. Следовательно, если первый речевой/звуковой сигнал имеет момент возникновения или сдвиг, никакой эхо-сигнал не добавляется ко второму речевому/звуковому сигналу, тем самым улучшая акустическое качество второго речевого/звукового сигнала.
[0136] Вариант осуществления системы в основном соответствует варианту осуществления способа, и, следовательно, для связанных с ним частей может быть сделана отсылка на частичные описания в варианте осуществления способа. Описываемый вариант осуществления системы приводится лишь в качестве примера. Блоки, описанные как отдельные части, могут быть, или не быть, физически разделенными, а части, отображенные как блоки, могут быть, или не быть, физическими блоками, могут находиться в одном месте или могут быть распределены по множеству сетевых блоков. Частично или все модули могут быть выбраны в соответствии с фактическими потребностями для достижения целей решений вариантов осуществления. Средний специалист в данной области техники может осмыслить и реализовать варианты осуществления настоящего изобретения без творческих усилий.
[0137] Настоящее изобретение может быть описано в общем контексте исполнимых компьютерных инструкций, исполняемых компьютером, например, программного модуля. Как правило, программный блок включает в себя подпрограмму, программу, объект, компонент, структуру данных, и тому подобное, для исполнения конкретной задачи или реализации конкретного абстрактного типа данных. Настоящее изобретение также может быть осуществлено на практике в распределенных вычислительных средах, в которых задачи выполняются удаленными устройствами обработки, которые соединены при помощи сети связи. В распределенной вычислительной среде программные модули могут быть расположены как на локальных, так и на удаленных компьютерных информационных носителях, в том числе устройствах хранения данных.
[0138] Средний специалист в данной области техники может понять, что все или часть этапов форм реализации в способе могут быть реализованы посредством программы, дающей указания соответствующему аппаратному обеспечению. Программа может храниться на машиночитаемом информационном носителе, таком как ПЗУ, ОЗУ, магнитный диск или оптический диск.
[0139] Следует дополнительно отметить, что в настоящем описании изобретения связанные с описанием отношений термины, такие как первый и второй, используются только чтобы отличить объект или операцию от другого объекта или операции, и не требуют и не подразумевают, что существуют какое-либо действительное взаимоотношение или последовательность между этими объектами или операциями. Помимо этого, термины "включает в себя", "содержит", или любой иной их вариант, предполагает охватывание неисключительного включения, так что технологический процесс, способ, изделие или устройство, которое включает в себя перечень элементов, не только включает в себя эти элементы, но также включает в себя и другие элементы, которые явным образом не перечислены, или дополнительно включает в себя элементы, присущие такому технологическому процессу, способу, изделию или устройству. Элемент, которому предшествуют "включает в себя..." не исключает, без дополнительных ограничений, существование добавочных идентичных элементов в технологическом процессе, способе, изделии или устройстве, которое включает в себя этот элемент.
[0140] Предшествующее описание является лишь иллюстративными вариантами осуществления настоящего изобретения и не предназначено для ограничения объема охраны настоящего изобретения. В настоящем описании изобретения конкретные примеры используются для описания принципа и форм реализации настоящего изобретения, и описание вариантов осуществления используется только для того, чтобы сделать способ и основополагающую идею настоящего изобретения более доступными для восприятия. Более того, средний специалист в данной области техники может, основываясь на идее настоящего изобретения, произвести модификации в отношении этих конкретных форм реализации и области действия. В заключение отметим, что содержание этого описания изобретения не должно быть истолковано как ограничение настоящего изобретения. Любая модификация, эквивалентная замена или улучшение, произведенные без отступления от принципа настоящего изобретения, должны попадать в объем охраны настоящего изобретения.

Claims (75)

1. Способ обработки речевого/звукового сигнала, причем способ содержит этапы, на которых:
принимают битовый поток и декодируют битовый поток, чтобы получить речевой/звуковой сигнал;
определяют первый речевой/звуковой сигнал в соответствии с речевым/звуковым сигналом, причем первый речевой/звуковой сигнал является сигналом, шумовая составляющая которого должна быть восстановлена, в речевом/звуковом сигнале;
определяют символ каждого выборочного значения в первом речевом/звуковом сигнале и значение амплитуды каждого выборочного значения в первом речевом/звуковом сигнале;
определяют длину адаптивной нормализации;
определяют скорректированное значение амплитуды каждого выборочного значения в соответствии с длиной адаптивной нормализации и значением амплитуды каждого выборочного значения; и
определяют второй речевой/звуковой сигнал в соответствии с символом каждого выборочного значения и скорректированным значением амплитуды каждого выборочного значения, причем второй речевой/звуковой сигнал является сигналом, полученным после восстановления шумовой составляющей первого речевого/звукового сигнала.
2. Способ по п. 1, в котором этап, на котором определяют скорректированное значение амплитуды каждого выборочного значения в соответствии с длиной адаптивной нормализации и значением амплитуды каждого выборочного значения, содержит этапы, на которых:
вычисляют, в соответствии со значением амплитуды каждого выборочного значения и длиной адаптивной нормализации, среднее значение амплитуды, соответствующее каждому выборочному значению, и определяют, в соответствии со средним значением амплитуды, соответствующим каждому выборочному значению, значение возмущения амплитуды, соответствующее каждому выборочному значению; и
вычисляют скорректированное значение амплитуды каждого выборочного значения в соответствии со значением амплитуды каждого выборочного значения и в соответствии со значением возмущения амплитуды, соответствующим каждому выборочному значению.
3. Способ по п. 2, в котором этап, на котором вычисляют, в соответствии со значением амплитуды каждого выборочного значения и длиной адаптивной нормализации, среднее значение амплитуды, соответствующее каждому выборочному значению, содержит этапы, на которых:
определяют, для каждого выборочного значения и в соответствии с длиной адаптивной нормализации, поддиапазон, которому принадлежит выборочное значение; и
вычисляют среднее значение значений амплитуд всех выборочных значений в поддиапазоне, которому принадлежит выборочное значение, и используют среднее значение, полученное посредством вычисления, в качестве среднего значения амплитуды, соответствующего выборочному значению.
4. Способ по п. 3, в котором этап, на котором определяют, для каждого выборочного значения и в соответствии с длиной адаптивной нормализации, поддиапазон, которому принадлежит выборочное значение, содержит этапы, на которых:
выполняют группировку поддиапазонов для всех выборочных значений в предварительно заданном порядке в соответствии с длиной адаптивной нормализации; и для каждого выборочного значения определяют поддиапазон, содержащий выборочное значение, как поддиапазон, которому принадлежит выборочное значение; или
для каждого выборочного значения определяют поддиапазон, состоящий из m выборочных значений перед выборочным значением, выборочного значения и n выборочных значений после выборочного значения, как поддиапазон, которому принадлежит выборочное значение, при этом m и n зависят от длины адаптивной нормализации, m является целым числом не меньше 0 и n является целым числом не меньше 0.
5. Способ по п. 2, в котором этап, на котором вычисляют скорректированное значение амплитуды каждого выборочного значения в соответствии со значением амплитуды каждого выборочного значения и в соответствии со значением возмущения амплитуды, соответствующим каждому выборочному значению, содержит этапы, на которых:
вычитают значение возмущения амплитуды, соответствующее каждому выборочному значению, из значения амплитуды каждого выборочного значения, чтобы получить разность между значением амплитуды каждого выборочного значения и значением возмущения амплитуды, соответствующим каждому выборочному значению, и используют полученную разность в качестве скорректированного значения амплитуды каждого выборочного значения.
6. Способ по п. 1, в котором этап, на котором определяют длину адаптивной нормализации, содержит этапы, на которых:
разделяют сигнал низкочастотного диапазона в речевом/звуковом сигнале на N поддиапазонов, при этом N является натуральным числом;
вычисляют отношение пиковой и средней мощностей каждого поддиапазона и определяют количество поддиапазонов, отношения пиковой и средней мощностей которых больше предварительно заданной пороговой величины отношения пиковой и средней мощностей; и
вычисляют длину адаптивной нормализации в соответствии с типом сигнала для сигнала высокочастотного диапазона в речевом/звуковом сигнале и количеством поддиапазонов.
7. Способ по п. 6, в котором этап, на котором вычисляют длину адаптивной нормализации в соответствии с типом сигнала для сигнала высокочастотного диапазона в речевом/звуковом сигнале и количеством поддиапазонов, содержит этап, на котором:
вычисляют длину адаптивной нормализации по формуле L=K+α×M, при этом
L является длиной адаптивной нормализации; K является численным значением, соответствующим типу сигнала для сигнала высокочастотного диапазона в речевом/звуковом сигнале, и разные типы сигналов для сигналов высокочастотного диапазона соответствуют разным численным значениям K; M является количеством поддиапазонов, отношения пиковой и средней мощностей которых больше предварительно заданной пороговой величины отношения пиковой и средней мощностей, и α является константой меньше 1.
8. Способ по п. 1, в котором этап, на котором определяют длину адаптивной нормализации, содержит этапы, на которых:
вычисляют отношение пиковой и средней мощностей сигнала низкочастотного диапазона в речевом/звуковом сигнале и отношение пиковой и средней мощностей сигнала высокочастотного диапазона в речевом/звуковом сигнале; и когда абсолютное значение разности между отношением пиковой и средней мощностей сигнала низкочастотного диапазона и отношением пиковой и средней мощностей сигнала высокочастотного диапазона меньше предварительно заданной пороговой величины разности, определяют длину адаптивной нормализации как предварительно заданное первое значение длины, или когда абсолютное значение разности между отношением пиковой и средней мощностей сигнала низкочастотного диапазона и отношением пиковой и средней мощностей сигнала высокочастотного диапазона не меньше предварительно заданной пороговой величины разности, определяют длину адаптивной нормализации как предварительно заданное второе значение длины, при этом первое значение длины больше, чем второе значение длины; или
вычисляют отношение пиковой и средней мощностей сигнала низкочастотного диапазона в речевом/звуковом сигнале и отношение пиковой и средней мощностей сигнала высокочастотного диапазона в речевом/звуковом сигнале; и когда отношение пиковой и средней мощностей сигнала низкочастотного диапазона меньше, чем отношение пиковой и средней мощностей сигнала высокочастотного диапазона, определяют длину адаптивной нормализации как предварительно заданное первое значение длины, или когда отношение пиковой и средней мощностей сигнала низкочастотного диапазона не меньше, чем отношение пиковой и средней мощностей сигнала высокочастотного диапазона, определяют длину адаптивной нормализации как предварительно заданное второе значение длины; или
определяют длину адаптивной нормализации в соответствии с типом сигнала для сигнала высокочастотного диапазона в речевом/звуковом сигнале, при этом разные типы сигналов для сигналов высокочастотного диапазона соответствуют разным длинам адаптивной нормализации.
9. Способ по п. 1, в котором этап, на котором определяют второй речевой/звуковой сигнал в соответствии с символом каждого выборочного значения и скорректированным значением амплитуды каждого выборочного значения, содержит этапы, на которых:
определяют новое значение каждого выборочного значения в соответствии с символом и скорректированным значением амплитуды каждого выборочного значения, чтобы получить второй речевой/звуковой сигнал; или
вычисляют коэффициент модификации; выполняют модификационную обработку в отношении скорректированного значения амплитуды, которое больше 0, в скорректированных значениях амплитуд выборочных значений в соответствии с коэффициентом модификации; и определяют новое значение каждого выборочного значения в соответствии с символом каждого выборочного значения и скорректированным значением амплитуды, которое получено после модификационной обработки, чтобы получить второй речевой/звуковой сигнал.
10. Способ по п. 9, в котором этап, на котором вычисляют коэффициент модификации, содержит этап, на котором:
вычисляют коэффициент модификации с использованием формулы β=a/L, где β является коэффициентом модификации, L является длиной адаптивной нормализации, и a является константой больше 1.
11. Способ по п. 9, в котором этап, на котором выполняют модификационную обработку в отношении скорректированного значения амплитуды, которое больше 0, в скорректированных значениях амплитуд выборочных значений в соответствии с коэффициентом модификации, содержит этап, на котором:
выполняют модификационную обработку в отношении скорректированного значения амплитуды, которое больше 0, в скорректированных значениях амплитуд выборочных значений с использованием следующей формулы:
Y=y×(b-β);
при этом Y является скорректированным значением амплитуды, полученным после модификационной обработки; y является скорректированным значением амплитуды, которое больше 0, в скорректированных значениях амплитуд выборочных значений; и b является константой, и 0<b<2.
12. Устройство для восстановления шумовой составляющей речевого/звукового сигнала, содержащее:
блок обработки битового потока, выполненный с возможностью приема битового потока и декодирования битового потока, чтобы получить речевой/звуковой сигнал;
блок определения сигнала, выполненный с возможностью определения первого речевого/звукового сигнала в соответствии с речевым/звуковым сигналом, полученным блоком обработки битового потока, причем первый речевой/звуковой сигнал является сигналом, шумовая составляющая которого должна быть восстановлена, в речевом/звуковом сигнале, полученном посредством декодирования;
первый блок определения, выполненный с возможностью определения символа каждого выборочного значения в первом речевом/звуковом сигнале, определенном блоком определения сигнала, и значения амплитуды каждого выборочного значения в первом речевом/звуковом сигнале, определенном блоком определения сигнала;
второй блок определения, выполненный с возможностью определения длины адаптивной нормализации;
третий блок определения, выполненный с возможностью определения скорректированного значения амплитуды каждого выборочного значения в соответствии с длиной адаптивной нормализации, определенной вторым блоком определения, и значением амплитуды каждого выборочного значения, которое определяется первым блоком определения; и
четвертый блок определения, выполненный с возможностью определения второго речевого/звукового сигнала в соответствии с символом каждого выборочного значения, который определяется первым блоком определения, и скорректированным значением амплитуды каждого выборочного значения, которое определяется третьим блоком определения, причем второй речевой/звуковой сигнал является сигналом, полученным после восстановления шумовой составляющей первого речевого/звукового сигнала.
13. Устройство по п. 12, в котором третий блок определения содержит:
подблок определения, выполненный с возможностью вычисления, в соответствии со значением амплитуды каждого выборочного значения и длиной адаптивной нормализации, среднего значения амплитуды, соответствующего каждому выборочному значению, и определения, в соответствии со средним значением амплитуды, соответствующим каждому выборочному значению, значения возмущения амплитуды, соответствующего каждому выборочному значению; и
подблок вычисления скорректированного значения амплитуды, выполненный с возможностью вычисления скорректированного значения амплитуды каждого выборочного значения в соответствии со значением амплитуды каждого выборочного значения и в соответствии со значением возмущения амплитуды, соответствующим каждому выборочному значению.
14. Устройство по п. 13, в котором подблок определения содержит:
модуль определения, выполненный с возможностью определения, для каждого выборочного значения и в соответствии с длиной адаптивной нормализации, поддиапазона, которому принадлежит выборочное значение; и
модуль вычисления, выполненный с возможностью вычисления среднего значения значений амплитуд всех выборочных значений в поддиапазоне, которому принадлежит выборочное значение, и использования среднего значения, полученного посредством вычисления, в качестве среднего значения амплитуды, соответствующего выборочному значению.
15. Устройство по п. 14, в котором модуль определения выполнен, в частности, с возможностью:
выполнения группировки поддиапазонов для всех выборочных значений в предварительно заданном порядке в соответствии с длиной адаптивной нормализации; и для каждого выборочного значения определения поддиапазона, содержащего выборочное значение, как поддиапазона, которому принадлежит выборочное значение; или
для каждого выборочного значения определения поддиапазона, состоящего из m выборочных значений перед выборочным значением, выборочного значения и n выборочных значений после выборочного значения, как поддиапазона, которому принадлежит выборочное значение, при этом m и n зависят от длины адаптивной нормализации, m является целым числом не меньше 0 и n является целым числом не меньше 0.
16. Устройство по п. 13, в котором подблок вычисления скорректированного значения амплитуды выполнен, в частности, с возможностью:
вычитания значения возмущения амплитуды, соответствующего каждому выборочному значению, из значения амплитуды каждого выборочного значения, чтобы получить разность между значением амплитуды каждого выборочного значения и значением возмущения амплитуды, соответствующим каждому выборочному значению, и использования полученной разности в качестве скорректированного значения амплитуды каждого выборочного значения.
17. Устройство по п. 12, в котором второй блок определения содержит:
подблок разделения, выполненный с возможностью разделения сигнала низкочастотного диапазона в речевом/звуковом сигнале на N поддиапазонов, где N является натуральным числом;
подблок количественного определения, выполненный с возможностью вычисления отношения пиковой и средней мощностей каждого поддиапазона и определения количества поддиапазонов, отношения пиковой и средней мощностей которых больше предварительно заданной пороговой величины отношения пиковой и средней мощностей; и
подблок вычисления длины, выполненный с возможностью вычисления длины адаптивной нормализации в соответствии с типом сигнала для сигнала высокочастотного диапазона в речевом/звуковом сигнале и количеством поддиапазонов.
18. Устройство по п. 17, в котором подблок вычисления длины выполнен, в частности, с возможностью:
вычисления длины адаптивной нормализации по формуле L=K+α×M, при этом
L является длиной адаптивной нормализации; K является численным значением, соответствующим типу сигнала для сигнала высокочастотного диапазона в речевом/звуковом сигнале, и разные типы сигналов для сигналов высокочастотного диапазона соответствуют разным численным значениям K; M является количеством поддиапазонов, отношения пиковой и средней мощностей которых больше предварительно заданной пороговой величины отношения пиковой и средней мощностей; и α является константой меньше 1.
19. Устройство по п. 12, в котором второй блок определения выполнен, в частности, с возможностью:
вычисления отношения пиковой и средней мощностей сигнала низкочастотного диапазона в речевом/звуковом сигнале и отношения пиковой и средней мощностей сигнала высокочастотного диапазона в речевом/звуковом сигнале; и когда абсолютное значение разности между отношением пиковой и средней мощностей сигнала низкочастотного диапазона и отношением пиковой и средней мощностей сигнала высокочастотного диапазона меньше предварительно заданной пороговой величины разности, определения длины адаптивной нормализации как предварительно заданного первого значения длины, или когда абсолютное значение разности между отношением пиковой и средней мощностей сигнала низкочастотного диапазона и отношением пиковой и средней мощностей сигнала высокочастотного диапазона не меньше предварительно заданной пороговой величины разности, определения длины адаптивной нормализации как предварительно заданного второго значения длины, при этом первое значение длины больше, чем второе значение длины; или
вычисления отношения пиковой и средней мощностей сигнала низкочастотного диапазона в речевом/звуковом сигнале и отношения пиковой и средней мощностей сигнала высокочастотного диапазона в речевом/звуковом сигнале; и когда отношение пиковой и средней мощностей сигнала низкочастотного диапазона меньше, чем отношение пиковой и средней мощностей сигнала высокочастотного диапазона, определения длины адаптивной нормализации как предварительно заданного первого значения длины, или когда отношение пиковой и средней мощностей сигнала низкочастотного диапазона не меньше, чем отношение пиковой и средней мощностей сигнала высокочастотного диапазона, определения длины адаптивной нормализации как предварительно заданного второго значения длины; или
определения длины адаптивной нормализации в соответствии с типом сигнала для сигнала высокочастотного диапазона в речевом/звуковом сигнале, при этом разные типы сигналов для сигналов высокочастотного диапазона соответствуют разным длинам адаптивной нормализации.
20. Устройство по п. 12, в котором четвертый блок определения выполнен, в частности, с возможностью:
определения нового значения каждого выборочного значения в соответствии с символом и скорректированным значением амплитуды каждого выборочного значения, чтобы получить второй речевой/звуковой сигнал; или
вычисления коэффициента модификации; выполнения модификационной обработки в отношении скорректированного значения амплитуды, которое больше 0, в скорректированных значениях амплитуд выборочных значений в соответствии с коэффициентом модификации; и определения нового значения каждого выборочного значения в соответствии с символом каждого выборочного значения и скорректированным значением амплитуды, которое получено после модификационной обработки, чтобы получить второй речевой/звуковой сигнал.
21. Устройство по п. 20, в котором четвертый блок определения выполнен, в частности, с возможностью вычисления коэффициента модификации с использованием формулы β=a/L, при этом β является коэффициентом модификации, L является длиной адаптивной нормализации и a является константой больше 1.
22. Устройство по п. 20, в котором четвертый блок определения выполнен, в частности, с возможностью:
выполнения модификационной обработки в отношении скорректированного значения амплитуды, которое больше 0, в скорректированных значениях амплитуд выборочных значений с использованием следующей формулы:
Y=y×(b-β);
при этом Y является скорректированным значением амплитуды, полученным после модификационной обработки; y является скорректированным значением амплитуды, которое больше 0, в скорректированных значениях амплитуд выборочных значений; и b является константой, и 0<b<2.
RU2016152224A 2014-06-03 2015-01-19 Способ обработки речевого/звукового сигнала и устройство RU2651184C1 (ru)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201410242233.2 2014-06-03
CN201410242233.2A CN105336339B (zh) 2014-06-03 2014-06-03 一种语音频信号的处理方法和装置
PCT/CN2015/071017 WO2015184813A1 (zh) 2014-06-03 2015-01-19 一种语音频信号的处理方法和装置

Publications (1)

Publication Number Publication Date
RU2651184C1 true RU2651184C1 (ru) 2018-04-18

Family

ID=54766052

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2016152224A RU2651184C1 (ru) 2014-06-03 2015-01-19 Способ обработки речевого/звукового сигнала и устройство

Country Status (19)

Country Link
US (3) US9978383B2 (ru)
EP (3) EP3147900B1 (ru)
JP (3) JP6462727B2 (ru)
KR (3) KR102201791B1 (ru)
CN (2) CN110097892B (ru)
AU (1) AU2015271580B2 (ru)
BR (1) BR112016028375B1 (ru)
CA (1) CA2951169C (ru)
CL (1) CL2016003121A1 (ru)
ES (1) ES2964221T3 (ru)
HK (1) HK1220543A1 (ru)
IL (1) IL249337B (ru)
MX (2) MX362612B (ru)
MY (1) MY179546A (ru)
NZ (1) NZ727567A (ru)
RU (1) RU2651184C1 (ru)
SG (1) SG11201610141RA (ru)
WO (1) WO2015184813A1 (ru)
ZA (1) ZA201608477B (ru)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2754497C1 (ru) * 2020-11-17 2021-09-02 федеральное государственное автономное образовательное учреждение высшего образования "Казанский (Приволжский) федеральный университет" (ФГАОУ ВО КФУ) Способ передачи речевых файлов по зашумленному каналу и устройство для его реализации

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110097892B (zh) * 2014-06-03 2022-05-10 华为技术有限公司 一种语音频信号的处理方法和装置
CN108133712B (zh) * 2016-11-30 2021-02-12 华为技术有限公司 一种处理音频数据的方法和装置
CN106847299B (zh) * 2017-02-24 2020-06-19 喜大(上海)网络科技有限公司 延时的估计方法及装置
US20230300524A1 (en) * 2022-03-21 2023-09-21 Qualcomm Incorporated Adaptively adjusting an input current limit for a boost converter

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000025301A1 (en) * 1998-10-26 2000-05-04 Telefonaktiebolaget Lm Ericsson (Publ) Method and arrangement for providing comfort noise in communications systems
EP1895513A1 (en) * 2001-01-31 2008-03-05 QUALCOMM Incorporated Method ans apparatus for interoperability between voice transmission systems during speech inactivity
CN101335003A (zh) * 2007-09-28 2008-12-31 华为技术有限公司 噪声生成装置、及方法
US7536298B2 (en) * 2004-03-15 2009-05-19 Intel Corporation Method of comfort noise generation for speech communication
CN101483042A (zh) * 2008-03-20 2009-07-15 华为技术有限公司 一种噪声生成方法以及噪声生成装置
US7610197B2 (en) * 2005-08-31 2009-10-27 Motorola, Inc. Method and apparatus for comfort noise generation in speech communication systems
RU2460155C2 (ru) * 2006-09-18 2012-08-27 Конинклейке Филипс Электроникс Н.В. Кодирование и декодирование звуковых объектов
RU2483364C2 (ru) * 2008-07-17 2013-05-27 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Схема аудиокодирования/декодирования с переключением байпас
RU2492530C2 (ru) * 2008-07-11 2013-09-10 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Устройство и способ кодирования/декодирования звукового сигнала посредством использования схемы переключения совмещения имен

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6261312B1 (en) 1998-06-23 2001-07-17 Innercool Therapies, Inc. Inflatable catheter for selective organ heating and cooling and method of using the same
CA2252170A1 (en) * 1998-10-27 2000-04-27 Bruno Bessette A method and device for high quality coding of wideband speech and audio signals
US6687668B2 (en) * 1999-12-31 2004-02-03 C & S Technology Co., Ltd. Method for improvement of G.723.1 processing time and speech quality and for reduction of bit rate in CELP vocoder and CELP vococer using the same
US6708147B2 (en) * 2001-02-28 2004-03-16 Telefonaktiebolaget Lm Ericsson(Publ) Method and apparatus for providing comfort noise in communication system with discontinuous transmission
US20030093270A1 (en) * 2001-11-13 2003-05-15 Domer Steven M. Comfort noise including recorded noise
KR100935961B1 (ko) * 2001-11-14 2010-01-08 파나소닉 주식회사 부호화 장치 및 복호화 장치
US7831421B2 (en) * 2005-05-31 2010-11-09 Microsoft Corporation Robust decoder
WO2008007700A1 (fr) 2006-07-12 2008-01-17 Panasonic Corporation Dispositif de décodage de son, dispositif de codage de son, et procédé de compensation de trame perdue
CN101320563B (zh) * 2007-06-05 2012-06-27 华为技术有限公司 一种背景噪声编码/解码装置、方法和通信设备
US8139777B2 (en) * 2007-10-31 2012-03-20 Qnx Software Systems Co. System for comfort noise injection
CN101483048B (zh) 2009-02-06 2010-08-25 凌阳科技股份有限公司 光学储存装置及其回路增益值的自动校正方法
US9047875B2 (en) 2010-07-19 2015-06-02 Futurewei Technologies, Inc. Spectrum flatness control for bandwidth extension
CN102436820B (zh) 2010-09-29 2013-08-28 华为技术有限公司 高频带信号编码方法及装置、高频带信号解码方法及装置
TWI576829B (zh) * 2011-05-13 2017-04-01 三星電子股份有限公司 位元配置裝置
US20130006644A1 (en) * 2011-06-30 2013-01-03 Zte Corporation Method and device for spectral band replication, and method and system for audio decoding
DE102011106033A1 (de) 2011-06-30 2013-01-03 Zte Corporation Verfahren und System zur Audiocodierung und -decodierung und Verfahren zur Schätzung des Rauschpegels
CN102208188B (zh) * 2011-07-13 2013-04-17 华为技术有限公司 音频信号编解码方法和设备
US20130132100A1 (en) 2011-10-28 2013-05-23 Electronics And Telecommunications Research Institute Apparatus and method for codec signal in a communication system
JP6239521B2 (ja) * 2011-11-03 2017-11-29 ヴォイスエイジ・コーポレーション 低レートcelpデコーダに関する非音声コンテンツの向上
US9305567B2 (en) 2012-04-23 2016-04-05 Qualcomm Incorporated Systems and methods for audio signal processing
CN110097892B (zh) * 2014-06-03 2022-05-10 华为技术有限公司 一种语音频信号的处理方法和装置
US20200333702A1 (en) 2019-04-19 2020-10-22 Canon Kabushiki Kaisha Forming apparatus, forming method, and article manufacturing method

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000025301A1 (en) * 1998-10-26 2000-05-04 Telefonaktiebolaget Lm Ericsson (Publ) Method and arrangement for providing comfort noise in communications systems
EP1895513A1 (en) * 2001-01-31 2008-03-05 QUALCOMM Incorporated Method ans apparatus for interoperability between voice transmission systems during speech inactivity
US7536298B2 (en) * 2004-03-15 2009-05-19 Intel Corporation Method of comfort noise generation for speech communication
US7610197B2 (en) * 2005-08-31 2009-10-27 Motorola, Inc. Method and apparatus for comfort noise generation in speech communication systems
RU2460155C2 (ru) * 2006-09-18 2012-08-27 Конинклейке Филипс Электроникс Н.В. Кодирование и декодирование звуковых объектов
CN101335003A (zh) * 2007-09-28 2008-12-31 华为技术有限公司 噪声生成装置、及方法
CN101483042A (zh) * 2008-03-20 2009-07-15 华为技术有限公司 一种噪声生成方法以及噪声生成装置
RU2492530C2 (ru) * 2008-07-11 2013-09-10 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Устройство и способ кодирования/декодирования звукового сигнала посредством использования схемы переключения совмещения имен
RU2483364C2 (ru) * 2008-07-17 2013-05-27 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Схема аудиокодирования/декодирования с переключением байпас

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2754497C1 (ru) * 2020-11-17 2021-09-02 федеральное государственное автономное образовательное учреждение высшего образования "Казанский (Приволжский) федеральный университет" (ФГАОУ ВО КФУ) Способ передачи речевых файлов по зашумленному каналу и устройство для его реализации

Also Published As

Publication number Publication date
ES2964221T3 (es) 2024-04-04
BR112016028375A2 (pt) 2017-08-22
US11462225B2 (en) 2022-10-04
EP3147900A1 (en) 2017-03-29
US20170084282A1 (en) 2017-03-23
EP3147900A4 (en) 2017-05-03
AU2015271580A1 (en) 2017-01-19
EP3712890B1 (en) 2023-08-30
KR20170008837A (ko) 2017-01-24
IL249337A0 (en) 2017-02-28
JP2021060609A (ja) 2021-04-15
MX2016015950A (es) 2017-04-05
AU2015271580B2 (en) 2018-01-18
MX2019001193A (es) 2019-06-12
KR102201791B1 (ko) 2021-01-11
JP6817283B2 (ja) 2021-01-20
JP2019061282A (ja) 2019-04-18
EP4283614A2 (en) 2023-11-29
KR20200043548A (ko) 2020-04-27
US9978383B2 (en) 2018-05-22
KR101943529B1 (ko) 2019-01-29
CN105336339A (zh) 2016-02-17
JP2017517034A (ja) 2017-06-22
MY179546A (en) 2020-11-10
CA2951169C (en) 2019-12-31
EP4283614A3 (en) 2024-02-21
CN110097892B (zh) 2022-05-10
EP3147900B1 (en) 2019-10-02
CL2016003121A1 (es) 2017-04-28
US20180268830A1 (en) 2018-09-20
KR102104561B1 (ko) 2020-04-24
US10657977B2 (en) 2020-05-19
US20200279572A1 (en) 2020-09-03
JP6462727B2 (ja) 2019-01-30
HK1220543A1 (zh) 2017-05-05
CN110097892A (zh) 2019-08-06
CN105336339B (zh) 2019-05-03
IL249337B (en) 2020-09-30
WO2015184813A1 (zh) 2015-12-10
CA2951169A1 (en) 2015-12-10
KR20190009440A (ko) 2019-01-28
EP3712890A1 (en) 2020-09-23
SG11201610141RA (en) 2017-01-27
BR112016028375B1 (pt) 2022-09-27
JP7142674B2 (ja) 2022-09-27
MX362612B (es) 2019-01-28
ZA201608477B (en) 2018-08-29
NZ727567A (en) 2018-01-26

Similar Documents

Publication Publication Date Title
JP6400790B2 (ja) 信号符号化及び復号化方法及び装置
RU2651184C1 (ru) Способ обработки речевого/звукового сигнала и устройство
Bae et al. On enhancement signal using non-uniform sampling in clipped signals for LTE smart phones
US9779747B2 (en) Coding/decoding method, apparatus, and system for audio signal
AU2015247503B2 (en) Systems, methods and devices for electronic communications having decreased information loss