CN109584894A - 一种基于雷达语音与麦克风语音相融合的语音增强方法 - Google Patents

一种基于雷达语音与麦克风语音相融合的语音增强方法 Download PDF

Info

Publication number
CN109584894A
CN109584894A CN201811577514.8A CN201811577514A CN109584894A CN 109584894 A CN109584894 A CN 109584894A CN 201811577514 A CN201811577514 A CN 201811577514A CN 109584894 A CN109584894 A CN 109584894A
Authority
CN
China
Prior art keywords
voice
microphone
radar
signal
bioradar
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811577514.8A
Other languages
English (en)
Inventor
李盛
吕东旭
徐教礼
宋欣欣
路国华
王健琪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xijing University
Original Assignee
Xijing University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xijing University filed Critical Xijing University
Priority to CN201811577514.8A priority Critical patent/CN109584894A/zh
Publication of CN109584894A publication Critical patent/CN109584894A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0224Processing in the time domain

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

一种基于雷达语音与麦克风语音相融合的语音增强方法,包括将声源通过生物雷达和麦克风同步采集,生物雷达获取雷达语音,麦克风获取麦克风语音;将获取的雷达语音和麦克风语音进行时域叠加,得到迭加信号;将中得到的迭加信号进行去燥增强,得到相融后的语音信号;本发明具有提升所获取语音信号的质量,拓展传统语音信号检测能力,从而在更复杂的声学背景和更远的距离条件下获得更高质量的语音信号的优点。

Description

一种基于雷达语音与麦克风语音相融合的语音增强方法
技术领域
本发明属于语音参数获取与探测领域,特别涉及一种基于雷达语音与麦克风语音相融合的语音增强方法。
背景技术
语音是人类进行交流最重要和最有效的手段,也是人类获取知识和信息的主要途径。语音信号的质量对于语音信息的感知、传输、处理、合成、识别等均具有重要意义。尤其在复杂的声学背景条件和低信噪比环境下,如何获取高质量的语音,尽可能多地获取语音信息,是摆在人们面前的现实问题。
目前广泛使用的语音采集和获取传感器是麦克风,自1925年贝尔实验室中的E.C.Wente等人研究出第一支电容式麦克风,麦克风语音获取技术已经得到了很大的发展,并且已广泛应用于人类生活的各个方面。然而,传统的麦克风语音获取方法仍然存在着较大的缺点,例如极易受其它声学信号的干扰、传播距离近、方向性差等。
采用毫米波生物雷达来探测语音信号,该技术以电磁波为探测媒介,当电磁波打到人体表面时,人体发声时体表的微动信号能够引起电磁波的相位和频率发生改变,对接收到的雷达回波信号进行解调,即可获得语音信号。这种新的语音获取方法经过本实验室历时十多年的持续研究和发展,已日趋成熟。采用生物雷达来获取语音,相比传统的麦克风系统,拓展了语音探测的距离,可以实现远距离的语音感知功能,并具有良强的抗声学噪声的性能,尤其适用于一些高强度噪声环境下的应用。但是,多次的实验结果表明,由于探测机制的不同,毫米波生物雷达对语音信号高频段(500Hz以下)感知能力比较弱,这两种不同探测机制的语音采集方法在频率的感知上恰好具有互补性。
发明内容
为了克服上述现有技术的不足,本发明的目的在于提供一种基于雷达语音与麦克风语音相融合的语音增强方法,能够弥补传统麦克风语音获取方式的缺点,拓展传统语音探测方法的能力,在更复杂的声学背景和更远的距离条件下获取更高质量的语音信号。
为达到上述目的,本发明采用的技术方案是:
一种基于雷达语音与麦克风语音相融合的语音增强方法,其步骤包括:
步骤一:将声源通过生物雷达和麦克风同步采集,生物雷达获取雷达语音,麦克风获取麦克风语音;
步骤二:将步骤一获取的雷达语音和麦克风语音进行时域叠加,得到迭加信号;
步骤三:将步骤二中得到的迭加信号进行去燥增强,得到相融后的语音信号。
进一步的,所述的生物雷达是指工作频率在10~100GHz之间,所发射雷达波功率小于10瓦的点频毫米波雷达。
进一步的,所述的生物雷达和麦克风同步采集指采用生物雷达和麦克风对目标声源进行同频率的同步信号采集,其采样频率一般介于5000Hz-50KHz。
进一步的,所述的雷达语音与麦克风语音的时域迭加指将这两种同步信号的数据按照点对点的方式在时间域上进行迭加。
进一步的,所述的迭加信号的去噪增强是指对融合后的语音信号进行去噪增强处理,以提升语音信号的质量,增加语音信号的可懂度。
本发明的有益效果是:
本发明能够突破传统麦克风采集语音信号所具有的低频分量感知能量不足,且易受环境噪声干扰,方向性弱等缺陷,利用生物雷达所具有的低频分量感知能力强,高灵敏度,高方向性,高抗声学干扰能力等特性,通过将雷达语音与麦克风语音相融合的方法,提升所获取语音信号的质量,拓展传统语音信号检测能力,从而在更复杂的声学背景和更远的距离条件下获得更高质量的语音信号。
附图说明
图1是本发明的流程图;
图2为同步采集的麦克风语音信号语谱图
图3为同步采集的生物雷达语音信号语谱图;
图4是麦克风与生物雷达语音信号相融合后的语音信号语谱图;
图5是增强后的融合语音信号语谱图。
具体实施方式
下面结合附图对本发明作进一步详细说明。
参见图1所示,一种基于雷达语音与麦克风语音相融合的语音增强方法,其步骤包括:
步骤一:将声源通过生物雷达和麦克风同步采集,生物雷达获取雷达语音,麦克风获取麦克风语音,图2和图3分别是采用麦克风与生物雷达同步采集的语音信号语谱图。从图2的语谱图中可以看出,麦克风所采集到的语音信号高频分量较为丰富,但低频分量大多淹没在噪声中。从图3可以看出,生物雷达由于具有相当强的方向性和抗声学干扰能力,因此得到的语谱图较为纯净,且低频信号含量丰富;
步骤二:将步骤一获取的雷达语音和麦克风语音进行时域叠加,得到迭加信号,参照图4所示,将这两种信号在时域上迭加能在一定程度上得到较为丰富的高频信号,并进一步增强低频信号,因此通过迭加这种方式可以有效增加信号中语音分量。
步骤三:将步骤二中得到的迭加信号进行去燥增强,得到相融后的语音信号,参照图5所示,为了进一步增强语音信号的质量,增加语音的可懂度,可以采用声学噪声和雷达语音的去除噪音的方法,来进一步提高语音信号的质量。

Claims (5)

1.一种基于雷达语音与麦克风语音相融合的语音增强方法,其特征在于,其步骤包括:
步骤一:将声源通过生物雷达和麦克风同步采集,生物雷达获取雷达语音,麦克风获取麦克风语音;
步骤二:将步骤一获取的雷达语音和麦克风语音进行时域叠加,得到迭加信号;
步骤三:将步骤二中得到的迭加信号进行去燥增强,得到相融后的语音信号。
2.根据权利要求1所述的一种基于雷达语音与麦克风语音相融合的语音增强方法,其特征在于,所述的生物雷达是指工作频率在10~100GHz之间,所发射雷达波功率小于10瓦的点频毫米波雷达。
3.根据权利要求1所述的一种基于雷达语音与麦克风语音相融合的语音增强方法,其特征在于,所述的生物雷达和麦克风同步采集指采用生物雷达和麦克风对目标声源进行同频率的同步信号采集,其采样频率一般介于5000Hz-50KHz。
4.根据权利要求1所述的一种基于雷达语音与麦克风语音相融合的语音增强方法,其特征在于,所述的雷达语音与麦克风语音的时域迭加指将这两种同步信号的数据按照点对点的方式在时间域上进行迭加。
5.根据权利要求1所述的一种基于雷达语音与麦克风语音相融合的语音增强方法,其特征在于,所述的迭加信号的去噪增强是指对融合后的语音信号进行去噪增强处理,以提升语音信号的质量,增加语音信号的可懂度。
CN201811577514.8A 2018-12-20 2018-12-20 一种基于雷达语音与麦克风语音相融合的语音增强方法 Pending CN109584894A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811577514.8A CN109584894A (zh) 2018-12-20 2018-12-20 一种基于雷达语音与麦克风语音相融合的语音增强方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811577514.8A CN109584894A (zh) 2018-12-20 2018-12-20 一种基于雷达语音与麦克风语音相融合的语音增强方法

Publications (1)

Publication Number Publication Date
CN109584894A true CN109584894A (zh) 2019-04-05

Family

ID=65931460

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811577514.8A Pending CN109584894A (zh) 2018-12-20 2018-12-20 一种基于雷达语音与麦克风语音相融合的语音增强方法

Country Status (1)

Country Link
CN (1) CN109584894A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113192518A (zh) * 2021-04-14 2021-07-30 上海交通大学 毫米波侦听方法及系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6006175A (en) * 1996-02-06 1999-12-21 The Regents Of The University Of California Methods and apparatus for non-acoustic speech characterization and recognition
GB201116846D0 (en) * 2011-09-30 2011-11-09 Skype Ltd Processing signals
US20120053931A1 (en) * 2010-08-24 2012-03-01 Lawrence Livermore National Security, Llc Speech Masking and Cancelling and Voice Obscuration
CN105632512A (zh) * 2016-01-14 2016-06-01 华南理工大学 一种基于统计模型的双传感器语音增强方法与装置
US20160267911A1 (en) * 2015-03-13 2016-09-15 Magna Mirrors Of America, Inc. Vehicle voice acquisition system with microphone and optical sensor
CN106782588A (zh) * 2016-11-15 2017-05-31 中国人民解放军第四军医大学 一种基于听觉小波包的毫米波生物雷达语音增强方法
CN107910011A (zh) * 2017-12-28 2018-04-13 科大讯飞股份有限公司 一种语音降噪方法、装置、服务器及存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6006175A (en) * 1996-02-06 1999-12-21 The Regents Of The University Of California Methods and apparatus for non-acoustic speech characterization and recognition
US20120053931A1 (en) * 2010-08-24 2012-03-01 Lawrence Livermore National Security, Llc Speech Masking and Cancelling and Voice Obscuration
GB201116846D0 (en) * 2011-09-30 2011-11-09 Skype Ltd Processing signals
US20160267911A1 (en) * 2015-03-13 2016-09-15 Magna Mirrors Of America, Inc. Vehicle voice acquisition system with microphone and optical sensor
CN105632512A (zh) * 2016-01-14 2016-06-01 华南理工大学 一种基于统计模型的双传感器语音增强方法与装置
CN106782588A (zh) * 2016-11-15 2017-05-31 中国人民解放军第四军医大学 一种基于听觉小波包的毫米波生物雷达语音增强方法
CN107910011A (zh) * 2017-12-28 2018-04-13 科大讯飞股份有限公司 一种语音降噪方法、装置、服务器及存储介质

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
RONGQIANG HU ET AL: "Single acoustic-channel speech enhancement based on glottal correlation using non-acoustic sensor", 《INTERSPEECH》 *
田颖等: "94 GHz生物雷达语音探测系统的设计与实验研究", 《医疗卫生装备》 *
胡金艳等: "基于多带谱减法的生物雷达语音增强方法研究", 《科学技术与工程》 *
陈扶明等: "生物雷达语音信号探测技术研究进展", 《雷达学报》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113192518A (zh) * 2021-04-14 2021-07-30 上海交通大学 毫米波侦听方法及系统

Similar Documents

Publication Publication Date Title
CN110852201B (zh) 一种基于多脉冲包络谱匹配的脉冲信号检测方法
US20180262832A1 (en) Sound Signal Processing Apparatus and Method for Enhancing a Sound Signal
US9007871B2 (en) Passive proximity detection
CN104157295A (zh) 用于检测及抑制瞬态噪声的方法
CN105448303A (zh) 语音信号的处理方法和装置
Nystuen et al. A sound budget for the southeastern Bering Sea: Measuring wind, rainfall, shipping, and other sources of underwater sound
Nemeth et al. Rainforests as concert halls for birds: are reverberations improving sound transmission of long song elements?
EP2441273A1 (en) Systems, methods, apparatus, and computer-readable media for phase-based processing of multichannel signal
KR102429152B1 (ko) 골진동 센서 및 마이크로폰 신호를 융합한 딥 러닝 음성 추출 및 노이즈 저감 방법
CN110875056B (zh) 语音转录设备、系统、方法、及电子设备
Roman et al. Pitch-based monaural segregation of reverberant speech
CN109658951B (zh) 混合信号检测方法及系统
CN109584894A (zh) 一种基于雷达语音与麦克风语音相融合的语音增强方法
CN108389587A (zh) 基于语音唤醒技术的语音增强器
Ganguly et al. Real-time Smartphone implementation of noise-robust Speech source localization algorithm for hearing aid users
CN205232299U (zh) 一种基于光学传感器和声学麦克风录音的智能终端
CN112435692B (zh) 一种基于多脉冲相干累加的信标信号高增益检测方法
McLoughlin Super-audible voice activity detection
Sun et al. Akte-liquid: Acoustic-based liquid identification with smartphones
CN109901114B (zh) 一种适用于声源定位的时延估计方法
Shen et al. RFMic-phone: robust sound acquisition combining millimeter-wave radar and microphone
Ou et al. A non-spectrogram-correlation method of automatically detecting minke whale boings
Götz et al. Mixing time prediction using spherical microphone arrays
Calamia et al. Blind estimation of the direct-to-reverberant ratio using a beta distribution fit to binaural coherence
CN109155883A (zh) 噪声检测和噪声降低

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190405