RU2011105976A - Устройство и способы для обработки аудио сигнала, с целью повышения разборчивости речи, используя функцию выделения нужных характеристик - Google Patents

Устройство и способы для обработки аудио сигнала, с целью повышения разборчивости речи, используя функцию выделения нужных характеристик Download PDF

Info

Publication number
RU2011105976A
RU2011105976A RU2011105976/08A RU2011105976A RU2011105976A RU 2011105976 A RU2011105976 A RU 2011105976A RU 2011105976/08 A RU2011105976/08 A RU 2011105976/08A RU 2011105976 A RU2011105976 A RU 2011105976A RU 2011105976 A RU2011105976 A RU 2011105976A
Authority
RU
Russia
Prior art keywords
spectral
characteristic
control information
audio signal
frequency
Prior art date
Application number
RU2011105976/08A
Other languages
English (en)
Other versions
RU2507608C2 (ru
Inventor
Кристиан УЛЕ (DE)
Кристиан УЛЕ
Оливер ХЕЛЛМУТ (DE)
Оливер ХЕЛЛМУТ
Бернхард ГРИЛЛ (DE)
Бернхард ГРИЛЛ
Фалко РИДДЕРБУШ (DE)
Фалко РИДДЕРБУШ
Original Assignee
Фраунхофер-Гезелльшафт цур Фердерунг дер ангевандтен (DE)
Фраунхофер-Гезелльшафт цур Фердерунг дер ангевандтен
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Фраунхофер-Гезелльшафт цур Фердерунг дер ангевандтен (DE), Фраунхофер-Гезелльшафт цур Фердерунг дер ангевандтен filed Critical Фраунхофер-Гезелльшафт цур Фердерунг дер ангевандтен (DE)
Publication of RU2011105976A publication Critical patent/RU2011105976A/ru
Application granted granted Critical
Publication of RU2507608C2 publication Critical patent/RU2507608C2/ru

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/27Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
    • G10L25/30Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique using neural networks

Abstract

1. Устройство для обработки аудио сигнала для получения контрольной информации для фильтра повышения разборчивости речи, включающий устройство выделения признаков для получения временной последовательности кратковременных спектральных представлений звукового сигнала и для извлечения хотя бы одной характеристики в каждой полосе частот множества полос частот для множества кратковременных спектральных представлений, по крайней мере, одной характеристики. представляющей спектральную форму кратковременного спектрального представления в полосе частот множества частотных диапазонов, а также устройство объединения признаков для объединения, по крайней мере, одной характеристики для каждой полосы с использованием параметров комбинирования для получения контрольной информации для фильтра повышения разборчивости речи для временной части звукового сигнала. ! 2. Устройство по п.1, в котором устройство выделения признаков извлекает, по крайней мере, одну дополнительную характеристику, представляющую характеристику кратковременного спектрального представления, отличную от спектральной формы, и где устройство объединения признаков объединяет, по крайней мере, одну дополнительную характеристику и, по крайней мере, одну характеристику для каждого диапазона частот с использованием параметров комбинирования. !3. Устройство по п.1, где устройство выделения признаков применяется для проведения операции преобразования частоты, в которой для последовательности моментов времени достигается последовательность спектральных представлений, где спектральные представления имеют полосы частот с неравномерной ши�

Claims (17)

1. Устройство для обработки аудио сигнала для получения контрольной информации для фильтра повышения разборчивости речи, включающий устройство выделения признаков для получения временной последовательности кратковременных спектральных представлений звукового сигнала и для извлечения хотя бы одной характеристики в каждой полосе частот множества полос частот для множества кратковременных спектральных представлений, по крайней мере, одной характеристики. представляющей спектральную форму кратковременного спектрального представления в полосе частот множества частотных диапазонов, а также устройство объединения признаков для объединения, по крайней мере, одной характеристики для каждой полосы с использованием параметров комбинирования для получения контрольной информации для фильтра повышения разборчивости речи для временной части звукового сигнала.
2. Устройство по п.1, в котором устройство выделения признаков извлекает, по крайней мере, одну дополнительную характеристику, представляющую характеристику кратковременного спектрального представления, отличную от спектральной формы, и где устройство объединения признаков объединяет, по крайней мере, одну дополнительную характеристику и, по крайней мере, одну характеристику для каждого диапазона частот с использованием параметров комбинирования.
3. Устройство по п.1, где устройство выделения признаков применяется для проведения операции преобразования частоты, в которой для последовательности моментов времени достигается последовательность спектральных представлений, где спектральные представления имеют полосы частот с неравномерной широтой полосы и где пропускная способность становится выше с увеличением средней частоты полосы частот.
4. Устройство по п.1, где устройство выделения признаков оперативно рассчитывает как первую характеристику, меру спектральной плотности в полосе, представляющую распределение активности в полосе, или, как вторую характеристику, меру стандартизованной активности в полосе, где стандартизация основывается на полной активности звуковой рамки, из которой получено спектральное представление и в которой устройство объединения признаков оперативно применяется для использования меры спектральной плотности для полосы или стандартизованной активности в полосе.
5. Устройство по п.1, в котором устройство выделения признаков применяется для дополнительного извлечения для каждой полосы меры спектрального потока, представляющего сходство или различие между временем последовательных спектральных представлений или мерой спектрального показателя, где мера спектрального показателя представляет асимметрию вокруг центра тяжести.
6. Устройство по п.1, в котором устройство выделения признаков применяется для дополнительного извлечения характеристик кодирования с линейным предсказанием LPC, характеристики кодирования с линейным предсказанием LPC., включающие сигнал ошибки кодирования с линейным предсказанием LPC, коэффициенты линейного предсказания до определенного порядка или сочетания сигналов ошибки кодирования с линейным предсказанием LPC и коэффициентов линейного предсказания, или, в котором устройство выделения признаков применяется для дополнительного извлечения КЛП коэффициентов или RASTA-ПЛП коэффициентов или коэффициентов косинусного преобразования Фурье для частот чистых тонов или характеристик соединения треугольником.
7. Устройство по п.6, в котором устройство выделения признаков оперативно применяется для расчета характеристик коэффициента линейного предсказания для блока аудио образцов области времени, в том числе для блока, включающего аудио образцы, используемые для извлечения по крайней мере одной характеристики, представляющей спектральную форму для каждого диапазона частот.
8. Устройство по п.1, в котором устройство выделения признаков оперативно применяется для расчета формы спектра в диапазоне частот, используя спектральную информацию одной или двух соседних полос частот и спектральной информации только полосы частот.
9. Устройство по п.1, в котором устройство выделения признаков оперативно используется для извлечения информации необработанной характеристики для каждой характеристики в блоке аудио образцов и для сочетания последовательности информации необработанных характеристик я в полосе частот для получения хотя бы одой характеристики для полосы частот.
10. Устройство по п.1, в котором устройство выделения признаков оперативно применяется для расчета для каждой полосы частот числа спектральных значений и для объединения числа спектральных значений для получения, по крайней мере, одной характеристики, представляющей спектральную форму так, чтобы хотя бы одна характеристика имела размерность, которая меньше, чем число спектральных значений в полосе частот.
11. Способ обработки аудио сигнала, с целью получения контрольной информации для фильтра повышения разборчивости речи, включающий получение временной последовательности кратковременных спектральных представлений звукового сигнала; выделение по меньшей мере одной характеристики в каждой полосе частот множества полос частот для множества кратковременных спектральных представлений, с по крайней мере одной характеристикой, представляющей спектральную форму кратковременного спектрального представления в полосе частот множества полос частот, а также сочетание, по крайней мере, одной характеристики для каждой полосы с использованием параметров комбинирования для получения контрольной информации для фильтра повышения разборчивости речи для части времени звукового сигнала.
12. Устройство для повышения разборчивости речи в звуковом сигнале, включающее устройство для обработки аудио сигнала по п.1 для получения контрольной информации фильтра для множества полос, представляющих часть времени звукового сигнала, и контролируемый фильтр, фильтр управляемый таким образом, чтобы полоса звукового сигнала переменно ослаблялась в отношении к различным полосам на основе контрольной информации.
13. Устройство по п.12, в котором устройство для обработки включает в себя преобразователь частоты времени, обеспечивающий спектральную информацию, имеющую более высокое разрешение, чем спектральное разрешение, для которого получена контрольная информация, а также в котором устройство для обработки дополнительно содержит контрольную информацию пост последующего процессора для интерполяции контрольной информации к высокому разрешению и для сглаживания интерполированной контрольной информации для получения впоследствии обработанной контрольной информации на основе которой устанавливаются параметры контролируемого фильтра.
14. Способ повышения разборчивости речи в звуковом сигнале, включающий способ обработки аудио сигнала по п.11 для получения контрольной информации фильтра для множества полос, представляющих часть времени звукового сигнала, и контрольный фильтр такой, чтобы полоса звукового сигнала переменно ослаблялась в отношении к различным полосам основе контрольной информации.
15. Устройство для подготовки устройства объединения признаков для определения параметров комбинирования устройства объединения признаков, включающее устройство выделения признаков для получения временной последовательности кратковременных спектральных представлений подготовленного звукового сигнала, для которых известна контрольная информация для фильтра повышения разборчивости речи в полосе частот и для извлечения хотя бы одной характеристики в каждой полосе частот множества полос частот для множества кратковременных спектральных представлений, по крайней мере, одной характеристики, представляющей спектральную форму кратковременного спектрального представления в полосе частот множества частотных диапазонов, а также контроллер критерия оптимальности для подачи устройства объединения признаков с по крайней мере одной характеристикой для каждого диапазона частот, для расчета контрольной информации с использованием промежуточных параметров комбинирования, для переменных промежуточных параметров комбинирования, для сравнения переменной контрольной информации с известной контрольной информацией, и для обновления промежуточных параметров комбинирования, когда переменные промежуточные параметры приводят к контрольной информации, лучше сочетающейся с известной контрольной информацией.
16. Способ подготовки устройства объединения признаков для определения параметров комбинирования устройства объединения признаков, включающий получение временной последовательности кратковременных спектральных представлений подготовки звукового сигнала, для которых известна контрольная информация для фильтра повышения разборчивости речи в полосе частот; получение по меньшей мере одной характеристики в каждой полосе частот множества полос частот для множества кратковременных спектральных представлений, по крайней мере одной характеристики, представляющей спектральную форму кратковременного спектрального представления в полосе частот множества полос частот; подачу устройству объединения признаков крайней мере одной характеристики для каждой полосы; f, расчет контрольной информации с использованием промежуточных параметров комбинирования; различные промежуточные параметры комбинирования; сравнение переменной контрольной информации с известной контрольной информацией; обновление промежуточных параметров комбинирования, когда разнообразные промежуточные параметры комбинирования приводят к лучшему соответствию контрольной информации известной контрольной информации.
17. Компьютерная программа для выполнения при работе на компьютере способа по п.11.
RU2011105976/08A 2008-08-05 2009-08-03 Устройства и способы для обработки аудио сигнала с целью повышения разборчивости речи, используя функцию выделения нужных характеристик RU2507608C2 (ru)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US8636108P 2008-08-05 2008-08-05
US61/086,361 2008-08-05
US10082608P 2008-09-29 2008-09-29
EP08017124.2A EP2151822B8 (en) 2008-08-05 2008-09-29 Apparatus and method for processing an audio signal for speech enhancement using a feature extraction
US61/100,826 2008-09-29
EP08017124.2 2008-09-29
PCT/EP2009/005607 WO2010015371A1 (en) 2008-08-05 2009-08-03 Apparatus and method for processing an audio signal for speech enhancement using a feature extraction

Publications (2)

Publication Number Publication Date
RU2011105976A true RU2011105976A (ru) 2012-08-27
RU2507608C2 RU2507608C2 (ru) 2014-02-20

Family

ID=49170422

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2011105976/08A RU2507608C2 (ru) 2008-08-05 2009-08-03 Устройства и способы для обработки аудио сигнала с целью повышения разборчивости речи, используя функцию выделения нужных характеристик

Country Status (13)

Country Link
US (1) US9064498B2 (ru)
EP (1) EP2151822B8 (ru)
JP (1) JP5666444B2 (ru)
KR (1) KR101266894B1 (ru)
CN (1) CN102124518B (ru)
AU (1) AU2009278263B2 (ru)
CA (1) CA2732723C (ru)
ES (1) ES2678415T3 (ru)
HK (1) HK1159300A1 (ru)
MX (1) MX2011001339A (ru)
RU (1) RU2507608C2 (ru)
TR (1) TR201810466T4 (ru)
WO (1) WO2010015371A1 (ru)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9626986B2 (en) 2013-12-19 2017-04-18 Telefonaktiebolaget Lm Ericsson (Publ) Estimation of background noise in audio signals

Families Citing this family (91)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8140331B2 (en) * 2007-07-06 2012-03-20 Xia Lou Feature extraction for identification and classification of audio signals
US9838784B2 (en) 2009-12-02 2017-12-05 Knowles Electronics, Llc Directional audio capture
DE102010009745A1 (de) * 2010-03-01 2011-09-01 Gunnar Eisenberg Verfahren und Vorrichtung zur Verarbeitung von Audiodaten
JP5738020B2 (ja) * 2010-03-11 2015-06-17 本田技研工業株式会社 音声認識装置及び音声認識方法
US8473287B2 (en) 2010-04-19 2013-06-25 Audience, Inc. Method for jointly optimizing noise reduction and voice quality in a mono or multi-microphone system
US8538035B2 (en) 2010-04-29 2013-09-17 Audience, Inc. Multi-microphone robust noise suppression
US8798290B1 (en) 2010-04-21 2014-08-05 Audience, Inc. Systems and methods for adaptive signal equalization
US8781137B1 (en) 2010-04-27 2014-07-15 Audience, Inc. Wind noise detection and suppression
US9245538B1 (en) * 2010-05-20 2016-01-26 Audience, Inc. Bandwidth enhancement of speech signals assisted by noise reduction
US8447596B2 (en) 2010-07-12 2013-05-21 Audience, Inc. Monaural noise suppression based on computational auditory scene analysis
JP5566846B2 (ja) * 2010-10-15 2014-08-06 本田技研工業株式会社 ノイズパワー推定装置及びノイズパワー推定方法並びに音声認識装置及び音声認識方法
JP2012163919A (ja) * 2011-02-09 2012-08-30 Sony Corp 音声信号処理装置、および音声信号処理方法、並びにプログラム
US9589580B2 (en) * 2011-03-14 2017-03-07 Cochlear Limited Sound processing based on a confidence measure
JP2012235310A (ja) * 2011-04-28 2012-11-29 Sony Corp 信号処理装置および方法、プログラム、並びにデータ記録媒体
US8949118B2 (en) * 2012-03-19 2015-02-03 Vocalzoom Systems Ltd. System and method for robust estimation and tracking the fundamental frequency of pseudo periodic signals in the presence of noise
EP2877992A1 (en) * 2012-07-24 2015-06-03 Nuance Communications, Inc. Feature normalization inputs to front end processing for automatic speech recognition
JP6234060B2 (ja) * 2013-05-09 2017-11-22 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation ターゲットドメインの学習用音声データの生成方法、生成装置、および生成プログラム
US9443533B2 (en) * 2013-07-15 2016-09-13 Rajeev Conrad Nongpiur Measuring and improving speech intelligibility in an enclosure
US9536540B2 (en) 2013-07-19 2017-01-03 Knowles Electronics, Llc Speech signal separation and synthesis based on auditory scene analysis and speech modeling
CN103474072B (zh) * 2013-10-11 2016-06-01 福州大学 利用纹理特征与随机森林的快速抗噪鸟鸣声识别方法
US10360901B2 (en) * 2013-12-06 2019-07-23 Nuance Communications, Inc. Learning front-end speech recognition parameters within neural network training
EP3105756A1 (en) * 2014-02-14 2016-12-21 Derrick, Donald James System for audio analysis and perception enhancement
WO2015132798A2 (en) * 2014-03-04 2015-09-11 Indian Institute Of Technology Bombay Method and system for consonant-vowel ratio modification for improving speech perception
KR101957276B1 (ko) * 2014-04-25 2019-03-12 가부시키가이샤 엔.티.티.도코모 선형 예측 계수 변환 장치 및 선형 예측 계수 변환 방법
DE112015004185T5 (de) * 2014-09-12 2017-06-01 Knowles Electronics, Llc Systeme und Verfahren zur Wiederherstellung von Sprachkomponenten
US9881631B2 (en) * 2014-10-21 2018-01-30 Mitsubishi Electric Research Laboratories, Inc. Method for enhancing audio signal using phase information
US9659578B2 (en) * 2014-11-27 2017-05-23 Tata Consultancy Services Ltd. Computer implemented system and method for identifying significant speech frames within speech signals
CN107004427B (zh) 2014-12-12 2020-04-14 华为技术有限公司 增强多声道音频信号内语音分量的信号处理装置
KR102387567B1 (ko) * 2015-01-19 2022-04-18 삼성전자주식회사 음성 인식 방법 및 음성 인식 장치
WO2016123560A1 (en) 2015-01-30 2016-08-04 Knowles Electronics, Llc Contextual switching of microphones
CN104966517B (zh) * 2015-06-02 2019-02-01 华为技术有限公司 一种音频信号增强方法和装置
EP3118851B1 (en) * 2015-07-01 2021-01-06 Oticon A/s Enhancement of noisy speech based on statistical speech and noise models
KR101677137B1 (ko) * 2015-07-17 2016-11-17 국방과학연구소 변조 스펙트로그램을 이용한 수중 방사체의 데몬 및 lofar 특징을 동시 추출하는 방법 및 장치
KR102494139B1 (ko) * 2015-11-06 2023-01-31 삼성전자주식회사 뉴럴 네트워크 학습 장치 및 방법과, 음성 인식 장치 및 방법
CN105611477B (zh) * 2015-12-27 2018-06-01 北京工业大学 数字助听器中深度和广度神经网络相结合的语音增强算法
CN108604452B (zh) * 2016-02-15 2022-08-02 三菱电机株式会社 声音信号增强装置
EP3220367A1 (en) * 2016-03-14 2017-09-20 Tata Consultancy Services Limited System and method for sound based surveillance
US9820042B1 (en) 2016-05-02 2017-11-14 Knowles Electronics, Llc Stereo separation and directional suppression with omni-directional microphones
US11003987B2 (en) * 2016-05-10 2021-05-11 Google Llc Audio processing with neural networks
RU2620569C1 (ru) * 2016-05-17 2017-05-26 Николай Александрович Иванов Способ измерения разборчивости речи
EP3301675B1 (en) * 2016-09-28 2019-08-21 Panasonic Intellectual Property Corporation of America Parameter prediction device and parameter prediction method for acoustic signal processing
US10614827B1 (en) * 2017-02-21 2020-04-07 Oben, Inc. System and method for speech enhancement using dynamic noise profile estimation
US10504538B2 (en) 2017-06-01 2019-12-10 Sorenson Ip Holdings, Llc Noise reduction by application of two thresholds in each frequency band in audio signals
US10381020B2 (en) 2017-06-16 2019-08-13 Apple Inc. Speech model-based neural network-assisted signal enhancement
DE102017212431A1 (de) * 2017-07-20 2019-01-24 Robert Bosch Gmbh Verfahren und Vorrichtung zur Verarbeitung eines Signals
WO2019014890A1 (zh) * 2017-07-20 2019-01-24 大象声科(深圳)科技有限公司 一种通用的单声道实时降噪方法
US11270198B2 (en) * 2017-07-31 2022-03-08 Syntiant Microcontroller interface for audio signal processing
US20190066657A1 (en) * 2017-08-31 2019-02-28 National Institute Of Information And Communications Technology Audio data learning method, audio data inference method and recording medium
US11594241B2 (en) 2017-09-26 2023-02-28 Sony Europe B.V. Method and electronic device for formant attenuation/amplification
US10325588B2 (en) 2017-09-28 2019-06-18 International Business Machines Corporation Acoustic feature extractor selected according to status flag of frame of acoustic signal
RU2745298C1 (ru) * 2017-10-27 2021-03-23 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство, способ или компьютерная программа для генерации аудиосигнала с расширенной полосой с использованием процессора нейронной сети
US10283140B1 (en) 2018-01-12 2019-05-07 Alibaba Group Holding Limited Enhancing audio signals using sub-band deep neural networks
US10991379B2 (en) * 2018-06-22 2021-04-27 Babblelabs Llc Data driven audio enhancement
US11341983B2 (en) 2018-09-17 2022-05-24 Honeywell International Inc. System and method for audio noise reduction
US11218125B2 (en) 2018-10-24 2022-01-04 Gracenote, Inc Methods and apparatus to adjust audio playback settings based on analysis of audio characteristics
CN110008972B (zh) * 2018-11-15 2023-06-06 创新先进技术有限公司 用于数据增强的方法和装置
US11043214B1 (en) * 2018-11-29 2021-06-22 Amazon Technologies, Inc. Speech recognition using dialog history
KR102093929B1 (ko) * 2018-12-05 2020-03-26 중앙대학교 산학협력단 Cim 기반의 시스템 건전성 진단을 위한 장치 및 방법
JP7095586B2 (ja) * 2018-12-14 2022-07-05 富士通株式会社 音声補正装置および音声補正方法
CN109448749B (zh) * 2018-12-19 2022-02-15 中国科学院自动化研究所 基于有监督学习听觉注意的语音提取方法、系统、装置
CN111369986A (zh) * 2018-12-26 2020-07-03 成都启英泰伦科技有限公司 一种智能安全传输语音系统及方法
KR102096588B1 (ko) * 2018-12-27 2020-04-02 인하대학교 산학협력단 음향 장치에서 맞춤 오디오 잡음을 이용해 사생활 보호를 구현하는 기술
KR20200080913A (ko) 2018-12-27 2020-07-07 서울과학기술대학교 산학협력단 자기상관계수를 이용한 심층신경망 기반 신호처리 방법 및 장치
KR102188264B1 (ko) * 2019-01-04 2020-12-08 순천향대학교 산학협력단 언어재활 기반 발성 음성 평가 장치 및 방법
EP3694229A1 (en) * 2019-02-08 2020-08-12 Oticon A/s A hearing device comprising a noise reduction system
KR102198273B1 (ko) * 2019-02-26 2021-01-04 한미란 머신러닝 기반의 음성데이터 분석 방법, 장치 및 프로그램
CN109767789A (zh) * 2019-03-06 2019-05-17 慧言科技(天津)有限公司 一种用于语音情感识别的新特征提取方法
WO2020209840A1 (en) * 2019-04-09 2020-10-15 Hewlett-Packard Development Company, L.P. Applying directionality to audio by encoding input data
WO2020218597A1 (ja) * 2019-04-26 2020-10-29 株式会社Preferred Networks 区間検出装置、信号処理システム、モデル生成方法、区間検出方法およびプログラム
KR20200137561A (ko) * 2019-05-30 2020-12-09 국방과학연구소 잡음 환경 노이지 데이터를 생성하기 위한 데이터 생성장치, 데이터 생성방법 및 이를 이용한 잡음 제거장치 및 잡음 제거방법
CN110534123B (zh) * 2019-07-22 2022-04-01 中国科学院自动化研究所 语音增强方法、装置、存储介质、电子设备
US20220277761A1 (en) * 2019-07-29 2022-09-01 Nippon Telegraph And Telephone Corporation Impression estimation apparatus, learning apparatus, methods and programs for the same
CN110491407B (zh) * 2019-08-15 2021-09-21 广州方硅信息技术有限公司 语音降噪的方法、装置、电子设备及存储介质
CN110473567B (zh) * 2019-09-06 2021-09-14 上海又为智能科技有限公司 基于深度神经网络的音频处理方法、装置及存储介质
CN110556123B (zh) * 2019-09-18 2024-01-19 腾讯科技(深圳)有限公司 频带扩展方法、装置、电子设备及计算机可读存储介质
CN110556122B (zh) * 2019-09-18 2024-01-19 腾讯科技(深圳)有限公司 频带扩展方法、装置、电子设备及计算机可读存储介质
CN110556121B (zh) * 2019-09-18 2024-01-09 腾讯科技(深圳)有限公司 频带扩展方法、装置、电子设备及计算机可读存储介质
US11587575B2 (en) * 2019-10-11 2023-02-21 Plantronics, Inc. Hybrid noise suppression
JP7348812B2 (ja) 2019-10-31 2023-09-21 東京都公立大学法人 雑音抑制装置、雑音抑制方法及び音声入力機器
CN111223493B (zh) * 2020-01-08 2022-08-02 北京声加科技有限公司 语音信号降噪处理方法、传声器和电子设备
CN111259776B (zh) * 2020-01-13 2023-04-18 浙江大学 一种基于同步平均主成分时频分析的确定性信号提取方法
KR20210101670A (ko) * 2020-02-10 2021-08-19 삼성전자주식회사 음질 개선 방법 및 이를 이용한 전자 장치
KR102329353B1 (ko) * 2020-03-17 2021-11-22 성균관대학교산학협력단 심층 신경망을 이용한 음성 발생 방향 추론 방법 및 그 장치
US11521637B1 (en) * 2020-08-19 2022-12-06 Amazon Technologies, Inc. Ratio mask post-filtering for audio enhancement
CN111986660A (zh) * 2020-08-26 2020-11-24 深圳信息职业技术学院 一种神经网络子带建模的单通道语音增强方法、系统及存储介质
US20220101872A1 (en) * 2020-09-25 2022-03-31 Descript, Inc. Upsampling of audio using generative adversarial networks
CN112349277B (zh) * 2020-09-28 2023-07-04 紫光展锐(重庆)科技有限公司 结合ai模型的特征域语音增强方法及相关产品
US11694692B2 (en) 2020-11-11 2023-07-04 Bank Of America Corporation Systems and methods for audio enhancement and conversion
GB202018375D0 (en) * 2020-11-23 2021-01-06 Rossi Lisa Audio signal processing systems and methods
US11475869B2 (en) 2021-02-12 2022-10-18 Plantronics, Inc. Hybrid noise suppression for communication systems
CN115116469B (zh) * 2022-05-25 2024-03-15 腾讯科技(深圳)有限公司 特征表示的提取方法、装置、设备、介质及程序产品

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5822742A (en) 1989-05-17 1998-10-13 The United States Of America As Represented By The Secretary Of Health & Human Services Dynamically stable associative learning neural network system
JP3084721B2 (ja) * 1990-02-23 2000-09-04 ソニー株式会社 雑音除去回路
DE4227826C2 (de) * 1991-08-23 1999-07-22 Hitachi Ltd Digitales Verarbeitungsgerät für akustische Signale
JP3247011B2 (ja) 1994-04-12 2002-01-15 富士通株式会社 セル配置改善装置及び方法
SE505175C2 (sv) 1994-12-01 1997-07-07 Ericsson Telefon Ab L M Förfarande och telekommunikationssystem för att åstadkomma ett abonnentstyrt uppkopplingsförlopp i ett telekommunikationsnät
US5960391A (en) 1995-12-13 1999-09-28 Denso Corporation Signal extraction system, system and method for speech restoration, learning method for neural network model, constructing method of neural network model, and signal processing system
SE506034C2 (sv) * 1996-02-01 1997-11-03 Ericsson Telefon Ab L M Förfarande och anordning för förbättring av parametrar representerande brusigt tal
EP0878790A1 (en) * 1997-05-15 1998-11-18 Hewlett-Packard Company Voice coding system and method
FR2786908B1 (fr) * 1998-12-04 2001-06-08 Thomson Csf Procede et dispositif pour le traitement des sons pour correction auditive des malentendants
DE19948308C2 (de) * 1999-10-06 2002-05-08 Cortologic Ag Verfahren und Vorrichtung zur Geräuschunterdrückung bei der Sprachübertragung
FI116643B (fi) * 1999-11-15 2006-01-13 Nokia Corp Kohinan vaimennus
EP1253581B1 (en) * 2001-04-27 2004-06-30 CSEM Centre Suisse d'Electronique et de Microtechnique S.A. - Recherche et Développement Method and system for speech enhancement in a noisy environment
JP3933909B2 (ja) * 2001-10-29 2007-06-20 日本放送協会 音声/音楽混合比推定装置およびそれを用いたオーディオ装置
US7949522B2 (en) * 2003-02-21 2011-05-24 Qnx Software Systems Co. System for suppressing rain noise
JP2004341339A (ja) * 2003-05-16 2004-12-02 Mitsubishi Electric Corp 雑音抑圧装置
AU2003904207A0 (en) * 2003-08-11 2003-08-21 Vast Audio Pty Ltd Enhancement of sound externalization and separation for hearing-impaired listeners: a spatial hearing-aid
CN101023469B (zh) * 2004-07-28 2011-08-31 日本福年株式会社 数字滤波方法和装置
RU52536U1 (ru) * 2005-12-08 2006-03-27 Общество с ограниченной ответственностью "Филком" Цифровой модуль преобразования речи
ATE425532T1 (de) * 2006-10-31 2009-03-15 Harman Becker Automotive Sys Modellbasierte verbesserung von sprachsignalen
JP5141180B2 (ja) * 2006-11-09 2013-02-13 ソニー株式会社 周波数帯域拡大装置及び周波数帯域拡大方法、再生装置及び再生方法、並びに、プログラム及び記録媒体
US8352257B2 (en) * 2007-01-04 2013-01-08 Qnx Software Systems Limited Spectro-temporal varying approach for speech enhancement
EP2191467B1 (en) * 2007-09-12 2011-06-22 Dolby Laboratories Licensing Corporation Speech enhancement
US8521530B1 (en) * 2008-06-30 2013-08-27 Audience, Inc. System and method for enhancing a monaural audio signal

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9626986B2 (en) 2013-12-19 2017-04-18 Telefonaktiebolaget Lm Ericsson (Publ) Estimation of background noise in audio signals
RU2618940C1 (ru) * 2013-12-19 2017-05-11 Телефонактиеболагет Л М Эрикссон (Пабл) Оценка фонового шума в звуковых сигналах
US9818434B2 (en) 2013-12-19 2017-11-14 Telefonaktiebolaget Lm Ericsson (Publ) Estimation of background noise in audio signals
US10311890B2 (en) 2013-12-19 2019-06-04 Telefonaktiebolaget Lm Ericsson (Publ) Estimation of background noise in audio signals
US10573332B2 (en) 2013-12-19 2020-02-25 Telefonaktiebolaget Lm Ericsson (Publ) Estimation of background noise in audio signals
RU2720357C2 (ru) * 2013-12-19 2020-04-29 Телефонактиеболагет Л М Эрикссон (Пабл) Способ оценки фонового шума, блок оценки фонового шума и машиночитаемый носитель
US11164590B2 (en) 2013-12-19 2021-11-02 Telefonaktiebolaget Lm Ericsson (Publ) Estimation of background noise in audio signals

Also Published As

Publication number Publication date
RU2507608C2 (ru) 2014-02-20
JP2011530091A (ja) 2011-12-15
CN102124518A (zh) 2011-07-13
TR201810466T4 (tr) 2018-08-27
JP5666444B2 (ja) 2015-02-12
KR101266894B1 (ko) 2013-05-24
WO2010015371A1 (en) 2010-02-11
KR20110044990A (ko) 2011-05-03
CN102124518B (zh) 2013-11-06
US20110191101A1 (en) 2011-08-04
EP2151822A1 (en) 2010-02-10
EP2151822B1 (en) 2018-04-25
US9064498B2 (en) 2015-06-23
CA2732723C (en) 2016-10-11
HK1159300A1 (en) 2012-07-27
MX2011001339A (es) 2011-05-10
EP2151822B8 (en) 2018-10-24
ES2678415T3 (es) 2018-08-10
AU2009278263A1 (en) 2010-02-11
AU2009278263B2 (en) 2012-09-27
CA2732723A1 (en) 2010-02-11

Similar Documents

Publication Publication Date Title
RU2011105976A (ru) Устройство и способы для обработки аудио сигнала, с целью повышения разборчивости речи, используя функцию выделения нужных характеристик
EP1914728B1 (en) Method and apparatus for decoding a signal using spectral band replication and interpolation of scale factors
US8484020B2 (en) Determining an upperband signal from a narrowband signal
JP5507596B2 (ja) スピーチ増強
CN103996401B (zh) 解码设备和解码方法
KR101327895B1 (ko) 오디오 신호 분류를 위한 방법 및 장치
KR100744352B1 (ko) 음성 신호의 하모닉 성분을 이용한 유/무성음 분리 정보를추출하는 방법 및 그 장치
KR100388387B1 (ko) 여기파라미터의결정을위한디지탈화된음성신호의분석방법및시스템
CN1938758B (zh) 确定估计值的方法和装置
US20110046947A1 (en) System and Method for Enhancing a Decoded Tonal Sound Signal
KR101250596B1 (ko) 신호 경계 주파수의 결정을 용이하게 하는 방법 및 장치
KR20180050652A (ko) 음향 신호를 사운드 객체들로 분해하는 방법 및 시스템, 사운드 객체 및 그 사용
RU2010136648A (ru) Способ и устройство для оценки энергии полосы высоких частот в системе расширения полосы частот
KR20070017524A (ko) 부호화 장치, 복호화 장치, 및 이들의 방법
CN107221342B (zh) 话音信号处理电路
US20150106087A1 (en) Efficient Discrimination of Voiced and Unvoiced Sounds
TWI590237B (zh) 用以估計音訊信號中雜訊之方法、雜訊估計器、音訊編碼器、音訊解碼器、及用以傳送音訊信號之系統
US20210287687A1 (en) Audio processor and method for generating a frequency enhanced audio signal using pulse processing
WO2010140940A1 (en) A method and arrangement for estimating the quality degradation of a processed signal
KR101757341B1 (ko) 저-복잡도 음조-적응 오디오 신호 양자화
CN115715413A (zh) 空间可识别子带音频源的检测和提取方法、装置以及系统
CN110379438B (zh) 一种语音信号基频检测与提取方法及系统
CN117037840A (zh) 异响源识别方法、装置、设备及可读存储介质
JP6152690B2 (ja) 音響解析装置
JP2003241777A (ja) 楽音のフォルマント抽出方法、記録媒体及び楽音のフォルマント抽出装置