CN109584894A - 一种基于雷达语音与麦克风语音相融合的语音增强方法 - Google Patents
一种基于雷达语音与麦克风语音相融合的语音增强方法 Download PDFInfo
- Publication number
- CN109584894A CN109584894A CN201811577514.8A CN201811577514A CN109584894A CN 109584894 A CN109584894 A CN 109584894A CN 201811577514 A CN201811577514 A CN 201811577514A CN 109584894 A CN109584894 A CN 109584894A
- Authority
- CN
- China
- Prior art keywords
- voice
- microphone
- radar
- signal
- bioradar
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 18
- 230000001360 synchronised effect Effects 0.000 claims abstract description 11
- 230000002708 enhancing effect Effects 0.000 claims abstract description 9
- 230000000630 rising effect Effects 0.000 claims 1
- 238000001514 detection method Methods 0.000 abstract description 7
- 230000001737 promoting effect Effects 0.000 abstract 1
- 230000002045 lasting effect Effects 0.000 description 2
- 230000008447 perception Effects 0.000 description 2
- 235000007926 Craterellus fallax Nutrition 0.000 description 1
- 240000007175 Datura inoxia Species 0.000 description 1
- 206010044565 Tremor Diseases 0.000 description 1
- 230000005534 acoustic noise Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0224—Processing in the time domain
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
一种基于雷达语音与麦克风语音相融合的语音增强方法,包括将声源通过生物雷达和麦克风同步采集,生物雷达获取雷达语音,麦克风获取麦克风语音;将获取的雷达语音和麦克风语音进行时域叠加,得到迭加信号;将中得到的迭加信号进行去燥增强,得到相融后的语音信号;本发明具有提升所获取语音信号的质量,拓展传统语音信号检测能力,从而在更复杂的声学背景和更远的距离条件下获得更高质量的语音信号的优点。
Description
技术领域
本发明属于语音参数获取与探测领域,特别涉及一种基于雷达语音与麦克风语音相融合的语音增强方法。
背景技术
语音是人类进行交流最重要和最有效的手段,也是人类获取知识和信息的主要途径。语音信号的质量对于语音信息的感知、传输、处理、合成、识别等均具有重要意义。尤其在复杂的声学背景条件和低信噪比环境下,如何获取高质量的语音,尽可能多地获取语音信息,是摆在人们面前的现实问题。
目前广泛使用的语音采集和获取传感器是麦克风,自1925年贝尔实验室中的E.C.Wente等人研究出第一支电容式麦克风,麦克风语音获取技术已经得到了很大的发展,并且已广泛应用于人类生活的各个方面。然而,传统的麦克风语音获取方法仍然存在着较大的缺点,例如极易受其它声学信号的干扰、传播距离近、方向性差等。
采用毫米波生物雷达来探测语音信号,该技术以电磁波为探测媒介,当电磁波打到人体表面时,人体发声时体表的微动信号能够引起电磁波的相位和频率发生改变,对接收到的雷达回波信号进行解调,即可获得语音信号。这种新的语音获取方法经过本实验室历时十多年的持续研究和发展,已日趋成熟。采用生物雷达来获取语音,相比传统的麦克风系统,拓展了语音探测的距离,可以实现远距离的语音感知功能,并具有良强的抗声学噪声的性能,尤其适用于一些高强度噪声环境下的应用。但是,多次的实验结果表明,由于探测机制的不同,毫米波生物雷达对语音信号高频段(500Hz以下)感知能力比较弱,这两种不同探测机制的语音采集方法在频率的感知上恰好具有互补性。
发明内容
为了克服上述现有技术的不足,本发明的目的在于提供一种基于雷达语音与麦克风语音相融合的语音增强方法,能够弥补传统麦克风语音获取方式的缺点,拓展传统语音探测方法的能力,在更复杂的声学背景和更远的距离条件下获取更高质量的语音信号。
为达到上述目的,本发明采用的技术方案是:
一种基于雷达语音与麦克风语音相融合的语音增强方法,其步骤包括:
步骤一:将声源通过生物雷达和麦克风同步采集,生物雷达获取雷达语音,麦克风获取麦克风语音;
步骤二:将步骤一获取的雷达语音和麦克风语音进行时域叠加,得到迭加信号;
步骤三:将步骤二中得到的迭加信号进行去燥增强,得到相融后的语音信号。
进一步的,所述的生物雷达是指工作频率在10~100GHz之间,所发射雷达波功率小于10瓦的点频毫米波雷达。
进一步的,所述的生物雷达和麦克风同步采集指采用生物雷达和麦克风对目标声源进行同频率的同步信号采集,其采样频率一般介于5000Hz-50KHz。
进一步的,所述的雷达语音与麦克风语音的时域迭加指将这两种同步信号的数据按照点对点的方式在时间域上进行迭加。
进一步的,所述的迭加信号的去噪增强是指对融合后的语音信号进行去噪增强处理,以提升语音信号的质量,增加语音信号的可懂度。
本发明的有益效果是:
本发明能够突破传统麦克风采集语音信号所具有的低频分量感知能量不足,且易受环境噪声干扰,方向性弱等缺陷,利用生物雷达所具有的低频分量感知能力强,高灵敏度,高方向性,高抗声学干扰能力等特性,通过将雷达语音与麦克风语音相融合的方法,提升所获取语音信号的质量,拓展传统语音信号检测能力,从而在更复杂的声学背景和更远的距离条件下获得更高质量的语音信号。
附图说明
图1是本发明的流程图;
图2为同步采集的麦克风语音信号语谱图
图3为同步采集的生物雷达语音信号语谱图;
图4是麦克风与生物雷达语音信号相融合后的语音信号语谱图;
图5是增强后的融合语音信号语谱图。
具体实施方式
下面结合附图对本发明作进一步详细说明。
参见图1所示,一种基于雷达语音与麦克风语音相融合的语音增强方法,其步骤包括:
步骤一:将声源通过生物雷达和麦克风同步采集,生物雷达获取雷达语音,麦克风获取麦克风语音,图2和图3分别是采用麦克风与生物雷达同步采集的语音信号语谱图。从图2的语谱图中可以看出,麦克风所采集到的语音信号高频分量较为丰富,但低频分量大多淹没在噪声中。从图3可以看出,生物雷达由于具有相当强的方向性和抗声学干扰能力,因此得到的语谱图较为纯净,且低频信号含量丰富;
步骤二:将步骤一获取的雷达语音和麦克风语音进行时域叠加,得到迭加信号,参照图4所示,将这两种信号在时域上迭加能在一定程度上得到较为丰富的高频信号,并进一步增强低频信号,因此通过迭加这种方式可以有效增加信号中语音分量。
步骤三:将步骤二中得到的迭加信号进行去燥增强,得到相融后的语音信号,参照图5所示,为了进一步增强语音信号的质量,增加语音的可懂度,可以采用声学噪声和雷达语音的去除噪音的方法,来进一步提高语音信号的质量。
Claims (5)
1.一种基于雷达语音与麦克风语音相融合的语音增强方法,其特征在于,其步骤包括:
步骤一:将声源通过生物雷达和麦克风同步采集,生物雷达获取雷达语音,麦克风获取麦克风语音;
步骤二:将步骤一获取的雷达语音和麦克风语音进行时域叠加,得到迭加信号;
步骤三:将步骤二中得到的迭加信号进行去燥增强,得到相融后的语音信号。
2.根据权利要求1所述的一种基于雷达语音与麦克风语音相融合的语音增强方法,其特征在于,所述的生物雷达是指工作频率在10~100GHz之间,所发射雷达波功率小于10瓦的点频毫米波雷达。
3.根据权利要求1所述的一种基于雷达语音与麦克风语音相融合的语音增强方法,其特征在于,所述的生物雷达和麦克风同步采集指采用生物雷达和麦克风对目标声源进行同频率的同步信号采集,其采样频率一般介于5000Hz-50KHz。
4.根据权利要求1所述的一种基于雷达语音与麦克风语音相融合的语音增强方法,其特征在于,所述的雷达语音与麦克风语音的时域迭加指将这两种同步信号的数据按照点对点的方式在时间域上进行迭加。
5.根据权利要求1所述的一种基于雷达语音与麦克风语音相融合的语音增强方法,其特征在于,所述的迭加信号的去噪增强是指对融合后的语音信号进行去噪增强处理,以提升语音信号的质量,增加语音信号的可懂度。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811577514.8A CN109584894A (zh) | 2018-12-20 | 2018-12-20 | 一种基于雷达语音与麦克风语音相融合的语音增强方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811577514.8A CN109584894A (zh) | 2018-12-20 | 2018-12-20 | 一种基于雷达语音与麦克风语音相融合的语音增强方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109584894A true CN109584894A (zh) | 2019-04-05 |
Family
ID=65931460
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811577514.8A Pending CN109584894A (zh) | 2018-12-20 | 2018-12-20 | 一种基于雷达语音与麦克风语音相融合的语音增强方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109584894A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113192518A (zh) * | 2021-04-14 | 2021-07-30 | 上海交通大学 | 毫米波侦听方法及系统 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6006175A (en) * | 1996-02-06 | 1999-12-21 | The Regents Of The University Of California | Methods and apparatus for non-acoustic speech characterization and recognition |
GB201116846D0 (en) * | 2011-09-30 | 2011-11-09 | Skype Ltd | Processing signals |
US20120053931A1 (en) * | 2010-08-24 | 2012-03-01 | Lawrence Livermore National Security, Llc | Speech Masking and Cancelling and Voice Obscuration |
CN105632512A (zh) * | 2016-01-14 | 2016-06-01 | 华南理工大学 | 一种基于统计模型的双传感器语音增强方法与装置 |
US20160267911A1 (en) * | 2015-03-13 | 2016-09-15 | Magna Mirrors Of America, Inc. | Vehicle voice acquisition system with microphone and optical sensor |
CN106782588A (zh) * | 2016-11-15 | 2017-05-31 | 中国人民解放军第四军医大学 | 一种基于听觉小波包的毫米波生物雷达语音增强方法 |
CN107910011A (zh) * | 2017-12-28 | 2018-04-13 | 科大讯飞股份有限公司 | 一种语音降噪方法、装置、服务器及存储介质 |
-
2018
- 2018-12-20 CN CN201811577514.8A patent/CN109584894A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6006175A (en) * | 1996-02-06 | 1999-12-21 | The Regents Of The University Of California | Methods and apparatus for non-acoustic speech characterization and recognition |
US20120053931A1 (en) * | 2010-08-24 | 2012-03-01 | Lawrence Livermore National Security, Llc | Speech Masking and Cancelling and Voice Obscuration |
GB201116846D0 (en) * | 2011-09-30 | 2011-11-09 | Skype Ltd | Processing signals |
US20160267911A1 (en) * | 2015-03-13 | 2016-09-15 | Magna Mirrors Of America, Inc. | Vehicle voice acquisition system with microphone and optical sensor |
CN105632512A (zh) * | 2016-01-14 | 2016-06-01 | 华南理工大学 | 一种基于统计模型的双传感器语音增强方法与装置 |
CN106782588A (zh) * | 2016-11-15 | 2017-05-31 | 中国人民解放军第四军医大学 | 一种基于听觉小波包的毫米波生物雷达语音增强方法 |
CN107910011A (zh) * | 2017-12-28 | 2018-04-13 | 科大讯飞股份有限公司 | 一种语音降噪方法、装置、服务器及存储介质 |
Non-Patent Citations (4)
Title |
---|
RONGQIANG HU ET AL: "Single acoustic-channel speech enhancement based on glottal correlation using non-acoustic sensor", 《INTERSPEECH》 * |
田颖等: "94 GHz生物雷达语音探测系统的设计与实验研究", 《医疗卫生装备》 * |
胡金艳等: "基于多带谱减法的生物雷达语音增强方法研究", 《科学技术与工程》 * |
陈扶明等: "生物雷达语音信号探测技术研究进展", 《雷达学报》 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113192518A (zh) * | 2021-04-14 | 2021-07-30 | 上海交通大学 | 毫米波侦听方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110852201B (zh) | 一种基于多脉冲包络谱匹配的脉冲信号检测方法 | |
US20180262832A1 (en) | Sound Signal Processing Apparatus and Method for Enhancing a Sound Signal | |
US9007871B2 (en) | Passive proximity detection | |
CN104157295A (zh) | 用于检测及抑制瞬态噪声的方法 | |
CN105448303A (zh) | 语音信号的处理方法和装置 | |
Nystuen et al. | A sound budget for the southeastern Bering Sea: Measuring wind, rainfall, shipping, and other sources of underwater sound | |
Nemeth et al. | Rainforests as concert halls for birds: are reverberations improving sound transmission of long song elements? | |
EP2441273A1 (en) | Systems, methods, apparatus, and computer-readable media for phase-based processing of multichannel signal | |
KR102429152B1 (ko) | 골진동 센서 및 마이크로폰 신호를 융합한 딥 러닝 음성 추출 및 노이즈 저감 방법 | |
CN110875056B (zh) | 语音转录设备、系统、方法、及电子设备 | |
Roman et al. | Pitch-based monaural segregation of reverberant speech | |
CN109658951B (zh) | 混合信号检测方法及系统 | |
CN109584894A (zh) | 一种基于雷达语音与麦克风语音相融合的语音增强方法 | |
CN108389587A (zh) | 基于语音唤醒技术的语音增强器 | |
Ganguly et al. | Real-time Smartphone implementation of noise-robust Speech source localization algorithm for hearing aid users | |
CN205232299U (zh) | 一种基于光学传感器和声学麦克风录音的智能终端 | |
CN112435692B (zh) | 一种基于多脉冲相干累加的信标信号高增益检测方法 | |
McLoughlin | Super-audible voice activity detection | |
Sun et al. | Akte-liquid: Acoustic-based liquid identification with smartphones | |
CN109901114B (zh) | 一种适用于声源定位的时延估计方法 | |
Shen et al. | RFMic-phone: robust sound acquisition combining millimeter-wave radar and microphone | |
Ou et al. | A non-spectrogram-correlation method of automatically detecting minke whale boings | |
Götz et al. | Mixing time prediction using spherical microphone arrays | |
Calamia et al. | Blind estimation of the direct-to-reverberant ratio using a beta distribution fit to binaural coherence | |
CN109155883A (zh) | 噪声检测和噪声降低 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190405 |