RU2013128375A - Система и способ для генерации аудиосигнала - Google Patents

Система и способ для генерации аудиосигнала Download PDF

Info

Publication number
RU2013128375A
RU2013128375A RU2013128375/08A RU2013128375A RU2013128375A RU 2013128375 A RU2013128375 A RU 2013128375A RU 2013128375/08 A RU2013128375/08 A RU 2013128375/08A RU 2013128375 A RU2013128375 A RU 2013128375A RU 2013128375 A RU2013128375 A RU 2013128375A
Authority
RU
Russia
Prior art keywords
audio signal
speech
user
noise
periods
Prior art date
Application number
RU2013128375/08A
Other languages
English (en)
Other versions
RU2595636C2 (ru
Inventor
Патрик КЕХИХЯН
ДЕН ДЮНГЕН Вилхелмус Андреас Маринус Арнолдус Мария ВАН
Original Assignee
Конинклейке Филипс Электроникс Н.В.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Конинклейке Филипс Электроникс Н.В. filed Critical Конинклейке Филипс Электроникс Н.В.
Publication of RU2013128375A publication Critical patent/RU2013128375A/ru
Application granted granted Critical
Publication of RU2595636C2 publication Critical patent/RU2595636C2/ru

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)
  • Details Of Audible-Bandwidth Transducers (AREA)

Abstract

1. Способ генерации сигнала, представляющего речь пользователя, причем способ содержит этапы, на которых:получают (101) первый аудиосигнал, представляющий речь пользователя, с использованием датчика, находящегося в контакте с пользователем,получают (101) второй аудиосигнал с использованием воздухопроводного датчика, причем второй аудиосигнал представляет речь пользователя и включает в себя шум из среды, окружающей пользователя,выявляют (103) периоды речи в первом аудиосигнале,применяют (105) алгоритм улучшения речи ко второму аудиосигналу для снижения шума во втором аудиосигнале, причем алгоритм улучшения речи использует выявленные периоды речи в первом аудиосигнале,корректируют (107) первый аудиосигнал с использованием очищенного от шума второго аудиосигнала для генерации выходного аудиосигнала, представляющего речь пользователя.2. Способ по п. 1, в котором этап (103) выявления периодов речи в первом аудиосигнале содержит выявление частей первого аудиосигнала, где амплитуда аудиосигнала превышает пороговое значение.3. Способ по п. 1 или 2, в котором этап (105) применения алгоритма улучшения речи содержит применение спектральной обработки ко второму аудиосигналу.4. Способ по п. 1 или 2, в котором этап (105) применения алгоритма улучшения речи для снижения шума во втором аудиосигнале содержит использование выявленных периодов речи в первом аудиосигнале для оценивания минимальных уровней шума в спектральной области второго аудиосигнала.5. Способ по п. 1 или 2, в котором этап (107) коррекции первого аудиосигнала содержит осуществление анализа с линейным прогнозированием на первом аудиосигнале и очищенном от шума втором ауди�

Claims (15)

1. Способ генерации сигнала, представляющего речь пользователя, причем способ содержит этапы, на которых:
получают (101) первый аудиосигнал, представляющий речь пользователя, с использованием датчика, находящегося в контакте с пользователем,
получают (101) второй аудиосигнал с использованием воздухопроводного датчика, причем второй аудиосигнал представляет речь пользователя и включает в себя шум из среды, окружающей пользователя,
выявляют (103) периоды речи в первом аудиосигнале,
применяют (105) алгоритм улучшения речи ко второму аудиосигналу для снижения шума во втором аудиосигнале, причем алгоритм улучшения речи использует выявленные периоды речи в первом аудиосигнале,
корректируют (107) первый аудиосигнал с использованием очищенного от шума второго аудиосигнала для генерации выходного аудиосигнала, представляющего речь пользователя.
2. Способ по п. 1, в котором этап (103) выявления периодов речи в первом аудиосигнале содержит выявление частей первого аудиосигнала, где амплитуда аудиосигнала превышает пороговое значение.
3. Способ по п. 1 или 2, в котором этап (105) применения алгоритма улучшения речи содержит применение спектральной обработки ко второму аудиосигналу.
4. Способ по п. 1 или 2, в котором этап (105) применения алгоритма улучшения речи для снижения шума во втором аудиосигнале содержит использование выявленных периодов речи в первом аудиосигнале для оценивания минимальных уровней шума в спектральной области второго аудиосигнала.
5. Способ по п. 1 или 2, в котором этап (107) коррекции первого аудиосигнала содержит осуществление анализа с линейным прогнозированием на первом аудиосигнале и очищенном от шума втором аудиосигнале для построения корректирующего фильтра.
6. Способ по п. 5, в котором осуществление анализа с линейным прогнозированием содержит этапы, на которых
(i) оценивают коэффициенты линейного прогнозирования для первого аудиосигнала и очищенного от шума второго аудиосигнала,
(ii) используют коэффициенты линейного прогнозирования для первого аудиосигнала для генерации сигнала возбуждения для первого аудиосигнала,
(iii) используют коэффициенты линейного прогнозирования для очищенного от шума второго аудиосигнала для построения огибающей в частотной области, и
(iv) корректируют сигнал возбуждения для первого аудиосигнала с использованием огибающей в частотной области.
7. Способ по п. 1 или 2, в котором этап (107) коррекции первого аудиосигнала содержит (i) использование долговременных спектральных способов для построения корректирующего фильтра или (ii) использование первого аудиосигнала в качестве входного сигнала адаптивного фильтра, который минимизирует среднеквадратическую ошибку между выходным сигналом фильтра и очищенным от шума вторым аудиосигналом.
8. Способ по п. 1 или 2, в котором до этапа коррекции (107),
способ дополнительно содержит этап применения алгоритма улучшения речи к первому аудиосигналу для снижения шума в первом аудиосигнале, причем алгоритм улучшения речи использует выявленные периоды речи в первом аудиосигнале, и этап коррекции содержит коррекцию очищенного от шума первого аудиосигнала с использованием очищенного от шума второго аудиосигнала для генерации выходного аудиосигнала, представляющего речь пользователя.
9. Способ по п. 1 или 2, дополнительно содержащий этапы, на которых:
получают третий аудиосигнал с использованием второго воздухопроводного датчика, причем третий аудиосигнал представляет речь пользователя и включает в себя шум из среды, окружающей пользователя, и
используют способ формирования диаграммы направленности для объединения второго аудиосигнала и третьего аудиосигнала и генерации объединенного аудиосигнала,
причем этап (105) применения алгоритма улучшения речи содержит применение алгоритма улучшения речи к объединенному аудиосигналу для снижения шума в объединенном аудиосигнале, причем алгоритм улучшения речи использует выявленные периоды речи в первом аудиосигнале.
10. Способ по п. 1 или 2, дополнительно содержащий этапы, на которых:
получают четвертый аудиосигнал, представляющий речь пользователя, с использованием второго датчика, находящегося в контакте с пользователем, и
используют способ формирования диаграммы направленности для объединения первого аудиосигнала и четвертого аудиосигнала и генерации второго объединенного аудиосигнала,
причем этап (103) выявления периодов речи содержит выявление периодов речи во втором объединенном аудиосигнале.
11. Устройство (2) для использования при генерации аудиосигнала, представляющего речь пользователя, причем устройство (2) содержит:
схему (8) обработки, которая сконфигурирована для
приема первого аудиосигнала, представляющего речь пользователя, от датчика (4), находящегося в контакте с пользователем,
приема второго аудиосигнала от воздухопроводного датчика (б), причем второй аудиосигнал представляет речь пользователя и включает в себя шум из среды, окружающей пользователя,
выявления периодов речи в первом аудиосигнале,
применения алгоритма улучшения речи ко второму аудиосигналу для снижения шума во втором аудиосигнале, причем алгоритм улучшения речи использует выявленные периоды речи в первом аудиосигнале, и
коррекции первого аудиосигнала с использованием очищенного от шума второго аудиосигнала для генерации выходного аудиосигнала, представляющего речь пользователя.
12. Устройство (2) по п. 11, в котором схема (8) обработки сконфигурирована для коррекции первого аудиосигнала путем осуществления анализа с линейным прогнозированием на первом аудиосигнале и очищенном от шума втором аудиосигнале для построения корректирующего фильтра.
13. Устройство (2) по п. 11 или 12, в котором схема (8) обработки сконфигурирована для осуществления анализа с линейным прогнозированием посредством
(i) оценивания коэффициентов линейного прогнозирования для первого аудиосигнала и очищенного от шума второго аудиосигнала,
(ii) использования коэффициентов линейного прогнозирования для первого аудиосигнала для генерации сигнала возбуждения для первого аудиосигнала,
(iii) использования коэффициентов линейного прогнозирования для очищенного от шума аудиосигнала для построения огибающей в частотной области, и
(iv) коррекции сигнала возбуждения для первого аудиосигнала с использованием огибающей в частотной области.
14. Устройство (2) по п. 11 или 12, причем устройство (2) дополнительно содержит:
контактный датчик (4), который сконфигурирован контактировать с телом пользователя, когда устройство (2) используется, и для генерации первого аудиосигнала, и
воздухопроводный датчик (б) который сконфигурирован для генерации второго аудиосигнала.
15. Компьютерный программный продукт, содержащий машиночитаемый код, который сконфигурирован таким образом, что при выполнении машиночитаемого кода подходящим компьютером или процессором компьютер или процессор осуществляет способ по п. 1 или 2.
RU2013128375/08A 2010-11-24 2011-11-17 Система и способ для генерации аудиосигнала RU2595636C2 (ru)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP10192409.0 2010-11-24
EP10192409A EP2458586A1 (en) 2010-11-24 2010-11-24 System and method for producing an audio signal
PCT/IB2011/055149 WO2012069966A1 (en) 2010-11-24 2011-11-17 System and method for producing an audio signal

Publications (2)

Publication Number Publication Date
RU2013128375A true RU2013128375A (ru) 2014-12-27
RU2595636C2 RU2595636C2 (ru) 2016-08-27

Family

ID=43661809

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2013128375/08A RU2595636C2 (ru) 2010-11-24 2011-11-17 Система и способ для генерации аудиосигнала

Country Status (7)

Country Link
US (1) US9812147B2 (ru)
EP (2) EP2458586A1 (ru)
JP (1) JP6034793B2 (ru)
CN (1) CN103229238B (ru)
BR (1) BR112013012538A2 (ru)
RU (1) RU2595636C2 (ru)
WO (1) WO2012069966A1 (ru)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2685391C1 (ru) * 2015-06-09 2019-04-17 Джи Ар Джи БЭНКИНГ ЭКВИПМЕНТ КО., ЛТД. Способ, устройство и система для подавления шума

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2643981B1 (en) 2010-11-24 2014-09-17 Koninklijke Philips N.V. A device comprising a plurality of audio sensors and a method of operating the same
US9711127B2 (en) 2011-09-19 2017-07-18 Bitwave Pte Ltd. Multi-sensor signal optimization for speech communication
BR112014009338B1 (pt) 2011-10-19 2021-08-24 Koninklijke Philips N.V. Aparelho de atenuação de ruído e método de atenuação de ruído
WO2014112206A1 (ja) * 2013-01-15 2014-07-24 ソニー株式会社 記憶制御装置、再生制御装置および記録媒体
CN105308681B (zh) * 2013-02-26 2019-02-12 皇家飞利浦有限公司 用于生成语音信号的方法和装置
CN103208291A (zh) * 2013-03-08 2013-07-17 华南理工大学 一种可用于强噪声环境的语音增强方法及装置
TWI520127B (zh) 2013-08-28 2016-02-01 晨星半導體股份有限公司 應用於音訊裝置的控制器與相關的操作方法
US9547175B2 (en) 2014-03-18 2017-01-17 Google Inc. Adaptive piezoelectric array for bone conduction receiver in wearable computers
FR3019422B1 (fr) * 2014-03-25 2017-07-21 Elno Appareil acoustique comprenant au moins un microphone electroacoustique, un microphone osteophonique et des moyens de calcul d'un signal corrige, et equipement de tete associe
US10431240B2 (en) * 2015-01-23 2019-10-01 Samsung Electronics Co., Ltd Speech enhancement method and system
EP3353783B1 (en) * 2015-09-25 2019-12-11 Fraunhofer Gesellschaft zur Förderung der Angewand Encoder and method for encoding an audio signal with reduced background noise using linear predictive coding
US10726859B2 (en) 2015-11-09 2020-07-28 Invisio Communication A/S Method of and system for noise suppression
DE112016005688T5 (de) * 2015-12-10 2018-08-30 Intel Corporation System zur Tonerfassung und -erzeugung über Nasalvibration
CN110070883B (zh) * 2016-01-14 2023-07-28 深圳市韶音科技有限公司 语音增强方法
US11528556B2 (en) 2016-10-14 2022-12-13 Nokia Technologies Oy Method and apparatus for output signal equalization between microphones
US9813833B1 (en) 2016-10-14 2017-11-07 Nokia Technologies Oy Method and apparatus for output signal equalization between microphones
WO2018083511A1 (zh) * 2016-11-03 2018-05-11 北京金锐德路科技有限公司 一种音频播放装置及方法
WO2018127412A1 (en) * 2017-01-03 2018-07-12 Koninklijke Philips N.V. Audio capture using beamforming
CN109979476B (zh) * 2017-12-28 2021-05-14 电信科学技术研究院 一种语音去混响的方法及装置
WO2020131963A1 (en) * 2018-12-21 2020-06-25 Nura Holdings Pty Ltd Modular ear-cup and ear-bud and power management of the modular ear-cup and ear-bud
CN109767783B (zh) 2019-02-15 2021-02-02 深圳市汇顶科技股份有限公司 语音增强方法、装置、设备及存储介质
CN109949822A (zh) * 2019-03-31 2019-06-28 联想(北京)有限公司 信号处理方法和电子设备
US11488583B2 (en) 2019-05-30 2022-11-01 Cirrus Logic, Inc. Detection of speech
JP2022505997A (ja) * 2019-10-09 2022-01-17 大象声科(深セン)科技有限公司 骨振動センサーとマイクの信号を融合するディープラーニング音声抽出及びノイズ低減方法
TWI735986B (zh) * 2019-10-24 2021-08-11 瑞昱半導體股份有限公司 收音裝置及方法
CN113421580B (zh) * 2021-08-23 2021-11-05 深圳市中科蓝讯科技股份有限公司 降噪方法、存储介质、芯片及电子设备
CN114124626B (zh) * 2021-10-15 2023-02-17 西南交通大学 信号的降噪方法、装置、终端设备以及存储介质
WO2023100429A1 (ja) * 2021-11-30 2023-06-08 株式会社Jvcケンウッド 収音装置、収音方法、及び収音プログラム

Family Cites Families (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07101853B2 (ja) * 1991-01-30 1995-11-01 長野日本無線株式会社 雑音低減方法
JPH05333899A (ja) * 1992-05-29 1993-12-17 Fujitsu Ten Ltd 音声入力装置、音声認識装置および警報発生装置
JP3306784B2 (ja) * 1994-09-05 2002-07-24 日本電信電話株式会社 骨導マイクロホン出力信号再生装置
US5602959A (en) * 1994-12-05 1997-02-11 Motorola, Inc. Method and apparatus for characterization and reconstruction of speech excitation waveforms
US6498858B2 (en) * 1997-11-18 2002-12-24 Gn Resound A/S Feedback cancellation improvements
JP3434215B2 (ja) * 1998-02-20 2003-08-04 日本電信電話株式会社 収音装置,音声認識装置,これらの方法、及びプログラム記録媒体
US6876750B2 (en) * 2001-09-28 2005-04-05 Texas Instruments Incorporated Method and apparatus for tuning digital hearing aids
US7617094B2 (en) * 2003-02-28 2009-11-10 Palo Alto Research Center Incorporated Methods, apparatus, and products for identifying a conversation
JP2004279768A (ja) * 2003-03-17 2004-10-07 Mitsubishi Heavy Ind Ltd 気導音推定装置及び気導音推定方法
US7447630B2 (en) * 2003-11-26 2008-11-04 Microsoft Corporation Method and apparatus for multi-sensory speech enhancement
CA2454296A1 (en) * 2003-12-29 2005-06-29 Nokia Corporation Method and device for speech enhancement in the presence of background noise
US7499686B2 (en) * 2004-02-24 2009-03-03 Microsoft Corporation Method and apparatus for multi-sensory speech enhancement on a mobile device
TWI390945B (zh) 2004-03-31 2013-03-21 Swisscom Ag 聲波通信用之方法及系統
WO2006027707A1 (en) * 2004-09-07 2006-03-16 Koninklijke Philips Electronics N.V. Telephony device with improved noise suppression
US7283850B2 (en) * 2004-10-12 2007-10-16 Microsoft Corporation Method and apparatus for multi-sensory speech enhancement on a mobile device
CN100592389C (zh) * 2008-01-18 2010-02-24 华为技术有限公司 合成滤波器状态更新方法及装置
US7346504B2 (en) * 2005-06-20 2008-03-18 Microsoft Corporation Multi-sensory speech enhancement using a clean speech prior
JP2007003702A (ja) * 2005-06-22 2007-01-11 Ntt Docomo Inc 雑音除去装置、通信端末、及び、雑音除去方法
EP1913591B1 (en) * 2005-08-02 2010-10-20 Koninklijke Philips Electronics N.V. Enhancement of speech intelligibility in a mobile communication device by controlling the operation of a vibrator in dependance of the background noise
KR100738332B1 (ko) * 2005-10-28 2007-07-12 한국전자통신연구원 성대신호 인식 장치 및 그 방법
EP1640972A1 (en) * 2005-12-23 2006-03-29 Phonak AG System and method for separation of a users voice from ambient sound
JP2007240654A (ja) * 2006-03-06 2007-09-20 Asahi Kasei Corp 体内伝導通常音声変換学習装置、体内伝導通常音声変換装置、携帯電話機、体内伝導通常音声変換学習方法、体内伝導通常音声変換方法
JP4940956B2 (ja) * 2007-01-10 2012-05-30 ヤマハ株式会社 音声伝送システム
CN101246688B (zh) * 2007-02-14 2011-01-12 华为技术有限公司 一种对背景噪声信号进行编解码的方法、系统和装置
WO2009039897A1 (en) * 2007-09-26 2009-04-02 Fraunhofer - Gesellschaft Zur Förderung Der Angewandten Forschung E.V. Apparatus and method for extracting an ambient signal in an apparatus and method for obtaining weighting coefficients for extracting an ambient signal and computer program
JP5327735B2 (ja) * 2007-10-18 2013-10-30 独立行政法人産業技術総合研究所 信号再生装置
JP5159325B2 (ja) * 2008-01-09 2013-03-06 株式会社東芝 音声処理装置及びそのプログラム
US20090201983A1 (en) * 2008-02-07 2009-08-13 Motorola, Inc. Method and apparatus for estimating high-band energy in a bandwidth extension system
CN101483042B (zh) * 2008-03-20 2011-03-30 华为技术有限公司 一种噪声生成方法以及噪声生成装置
CN101335000B (zh) * 2008-03-26 2010-04-21 华为技术有限公司 编码的方法及装置
US9532897B2 (en) * 2009-08-17 2017-01-03 Purdue Research Foundation Devices that train voice patterns and methods thereof
US20120316881A1 (en) * 2010-03-25 2012-12-13 Nec Corporation Speech synthesizer, speech synthesis method, and speech synthesis program
US8606572B2 (en) * 2010-10-04 2013-12-10 LI Creative Technologies, Inc. Noise cancellation device for communications in high noise environments
EP2643981B1 (en) * 2010-11-24 2014-09-17 Koninklijke Philips N.V. A device comprising a plurality of audio sensors and a method of operating the same
US9711127B2 (en) * 2011-09-19 2017-07-18 Bitwave Pte Ltd. Multi-sensor signal optimization for speech communication

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2685391C1 (ru) * 2015-06-09 2019-04-17 Джи Ар Джи БЭНКИНГ ЭКВИПМЕНТ КО., ЛТД. Способ, устройство и система для подавления шума

Also Published As

Publication number Publication date
CN103229238B (zh) 2015-07-22
RU2595636C2 (ru) 2016-08-27
JP2014502468A (ja) 2014-01-30
US20130246059A1 (en) 2013-09-19
EP2643834A1 (en) 2013-10-02
EP2458586A1 (en) 2012-05-30
JP6034793B2 (ja) 2016-11-30
CN103229238A (zh) 2013-07-31
BR112013012538A2 (pt) 2016-09-06
EP2643834B1 (en) 2014-03-19
US9812147B2 (en) 2017-11-07
WO2012069966A1 (en) 2012-05-31

Similar Documents

Publication Publication Date Title
RU2013128375A (ru) Система и способ для генерации аудиосигнала
KR102410392B1 (ko) 실행 중 범위 정규화를 이용하는 신경망 음성 활동 검출
RU2016101469A (ru) Устройство и способ улучшенного плавного изменения сигнала в различных областях во время маскирования ошибок
US8712074B2 (en) Noise spectrum tracking in noisy acoustical signals
RU2013131775A (ru) Устройство и способ для разложения входного сигнала с использованием заранее вычисленной эталонной кривой
RU2407074C2 (ru) Улучшение речи с помощью нескольких датчиков с использованием предшествующей чистой речи
US8834386B2 (en) Noise reduction of breathing signals
AR078717A1 (es) Aparato y metodo para generar una senal de audio de alta frecuencia usando sobremuestreo adaptativo
WO2010013939A3 (en) An apparatus for processing an audio signal and method thereof
EP1973104A3 (en) Method and apparatus for estimating noise by using harmonics of a voice signal
US10874317B2 (en) Biological information measurement device
CN105489226A (zh) 一种用于拾音器的多窗谱估计的维纳滤波语音增强方法
ATE524028T1 (de) Verfahren zur feinanpassung eines hörhilfegerätes sowie hörhilfegerät
AU2010204475B2 (en) A method of correcting errors in binary masks
EP2738763A3 (en) Speech enhancement apparatus and speech enhancement method
JP2015097355A (ja) 収音装置及びその制御方法、プログラム
Islam et al. Speech enhancement based on a modified spectral subtraction method
CN107437421B (zh) 信号处理器
EP2674961A3 (en) Electron microscope and method of operating the same
JP5228903B2 (ja) 信号処理装置および方法
JP6106618B2 (ja) 音声区間検出装置、音声認識装置、その方法、及びプログラム
Yong et al. Performance comparison of new endpoint detection method in noise environments
Tank et al. Speech enhancement using auditory-based transform
Kum et al. Improved global soft decision incorporating second-order conditional MAP in speech enhancement
Poornapriya et al. Clatter diminishing for mobile telephony

Legal Events

Date Code Title Description
MM4A The patent is invalid due to non-payment of fees

Effective date: 20201118