CN111489759A - 基于光纤语音时域信号波形对齐的噪声评估方法 - Google Patents

基于光纤语音时域信号波形对齐的噪声评估方法 Download PDF

Info

Publication number
CN111489759A
CN111489759A CN202010210101.7A CN202010210101A CN111489759A CN 111489759 A CN111489759 A CN 111489759A CN 202010210101 A CN202010210101 A CN 202010210101A CN 111489759 A CN111489759 A CN 111489759A
Authority
CN
China
Prior art keywords
voice
signal
voice signal
optical fiber
fiber
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010210101.7A
Other languages
English (en)
Inventor
吕辰刚
马敬敬
霍紫强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin University
Original Assignee
Tianjin University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin University filed Critical Tianjin University
Priority to CN202010210101.7A priority Critical patent/CN111489759A/zh
Publication of CN111489759A publication Critical patent/CN111489759A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0224Processing in the time domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/60Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for measuring the quality of voice signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Optical Communication System (AREA)

Abstract

本发明涉及一种基于光纤语音时域信号波形对齐的噪声评估方法,包括下列步骤:原始语音时域信号处理;搭建光纤环形腔的激光麦克风;布置光纤线圈的位置;将时域处理后的语音信号通过光纤线圈输入激光麦克风,利用示波器观察输出信号的情况,通过调整光纤激光源的输出功率,得到稳定的输出语音信号;根据所插入的方波信号进行激光麦克风的输入语音信号和输出语音信号的时域对齐,利用对经过腔激光麦克风的语音信号即含噪语音信号进行去噪处理,并进行语音质量评估。

Description

基于光纤语音时域信号波形对齐的噪声评估方法
技术领域
本发明涉及光纤传感技术和光纤环形腔激光麦克风,属于语音信号噪声评估领域。
背景技术
语音作为一种主流通信方式,显然会成为今后重要的人机交互手段。然而,无论是在人与人之间进行交流、通信,还是人机交互过程中,噪声都是不可避免的,且种类繁多。例如语音交流中的环境噪声、机械噪声、人在马路上打电话时的汽车等交通噪声等都会影响语音质量。在信息化社会的迅速发展中,对语音的整体质量要求也越来越高,语音去噪技术得到快速发展。随着语音去噪研究的深入和新思想的引入,一系列的语音去噪方法如人耳听觉掩蔽、人工神经网络和基于小波变换等语音去噪算法也相继出现。
对于语音去噪处理后的语音信号,如何判断去噪处理效果,这时就需要引入语音去噪评价指标,人们对语音增强算法性能评价包括两种方法,一是主观评价,这种评价指标涉及到言语的可懂度和感知质量。感知质量一般指语音识别的程度、语音质量、音色音调等。主观评价主要考虑语音可懂度是否清晰,语音信号传递的信息是是否完整。另一种方法是客观评价,是通过检查语音编码和语音通信的质量。客观评价方法是根据具体的数据来进行语音去噪性能比较,它不需要除数据以外的其它因素来衡量去噪优劣。客观评价指标主要有信噪比、分段信噪比以及对数谱失真测度。客观评价指标在一定程度上能明显反映去噪性能,对去噪效果的比较非常重要。
语音客观评估方法这里以信噪比的指标来举例说明:
信噪比的定义公式如下:
Figure BDA0002422517910000011
其中,式中s(n)表示原始语音,原始语音可以是在实验室安静环境下录制的语音文件,也可以是手机、电脑等设备上比较清晰的语音文件或者mp3等格式的录音文件;
Figure BDA0002422517910000012
表示的是经过去噪处理之后的语音,L表示语音信号的采样点数,L的数值是在实验中自己设置的参数。信噪比SNR的物理单位是dB。
从公式也可以知道,语音质量评估的基本思想是将两种语音信号进行对比,所以在语音质量评估的时候需要原始语音、去噪后的语音必须是在同一个时间段,且时间长度一样,即需要语音信号时域对齐处理。通常的语音对齐处理是通过SPPAS工具、音频对齐算法或者手动对齐方法等,但是都有很明显的误差,从主观上可以明显听出差别,针对此问题,本发明提出的语音信号时域对齐方法是在原始语音信号时域波形中添加方波信号,用方波信号来标注对齐的时间节点,再将合成的语音信号输入激光麦克风。语音时域对齐是语音信号处理的基础。
技术方案
本发明的目的是提供一种新的方法实现光纤信号的时域波形对齐,应用于基于光纤环形腔的激光麦克风语音信号去噪处理,在对于去噪效果进行语音质量评估的时候,实现输入的原始、含噪语音时间同步。实现技术方案如下:
一种基于光纤语音时域信号波形对齐的噪声评估方法,包括下列步骤:
第一步,原始语音时域信号处理。将原始语音信号用Matlab软件读取,得到原始语音信号的序列信息,在原始语音序列的合适位置添加方波序列信息,合成的语音序列再转化并保存为音频文件,用于输入激光麦克风。
第二步,搭建光纤环形腔的激光麦克风。包括光纤激光源,掺铒光纤,FFP滤波器,与FFP滤波器相连的光纤环形腔外的2×2耦合器,光纤线圈和数据采集部分,其中,光纤激光源产生连续激光,经过隔离器后形成只能在一个方向上传输的光信号,再由掺铒光纤进行光信号放大,然后传输到光纤线圈,所述的光纤线圈由为长度在1千米以上的光纤缠绕而成,作为语音信号感应器件,再经由耦合器和FFP滤波器传输回光纤激光源,耦合器用以将光信号与电信号进行转换,经过耦合器的信号转换,再通过数据采集部分,获得输出的语音信号;
第三步,布置光纤线圈的位置;
第四步,将时域处理后的语音信号通过光纤线圈输入激光麦克风,利用示波器观察输出信号的情况,通过调整光纤激光源的输出功率,得到稳定的输出语音信号;
第五步,根据所插入的方波信号进行激光麦克风的输入语音信号和输出语音信号的时域对齐,利用对经过腔激光麦克风的语音信号即含噪语音信号进行去噪处理,并进行语音质量评估。
附图说明
图1为光纤环形腔的激光麦克风的结构示意图。
图2为本发明的基于光纤语音时域语音信号波形对齐的噪声质量评估的流程图。
图3中(a)为原始语音和方波信号的时域波形示意图,(b)为本发明中添加方波序列后的语音信号示意图。
具体实施方式
下面结合附图和具体实例对本发明进行进一步的说明阐述。
本发明应用于对光纤环形腔的激光麦克风所采集的语音信号即含噪语音信号进行评估。
首先对此新型的麦克风进行介绍,参见图1,系统可以分为三个部分。
第一部分是系统的硬件部分,包括980nm的激光源,激光源产生连续不断的激光为系统提供光能;掺铒光纤(EDFA),掺铒光纤是一个掺杂了少量稀土元素铒的光纤,其能够在1550nm的范围内放大光;滤波器采用的是可调谐光纤法布里-珀罗(FFP)滤波器,FFP滤波器和光纤系统具有很好的兼容性;光纤环形腔外的2×2耦合器与滤波器直接相连。环形腔经FFP滤波器形成的输出端,剩余的光被反馈回环形腔内。由于隔离器的作用,环形腔内只能在一个方向产生与FFP透射波长相同的激光。
第二部分是光纤线圈,是语音信号的感应部分,也是语音信号的输入位置,相当于喇叭作用,由几千米(可以取1千米到10千米之间)的普通光纤缠绕形成。
第三部分是语音采集部分,由光电二极管(PD)和数据采集卡(DAQ)组成。
光纤环形腔的激光麦克风收集到的语音信号是含有噪声的语音信号。噪声来源于环境中的干扰,可能是在录音过程中,由于人说话、走动、吃东西、开关门、敲打、窗外交通或者自然风吹、雨淋等造成。这些噪声会降低语音质量,为了得到较清晰的语音信号,需要进行语音去噪。在语音去噪质量评估时,需要对语音信号时域对齐处理,这也是本发明的目的。
参见图2,本发明的流程图,以下简述其相应步骤:
(1)原始语音信号的时域处理。原始语音信号可以是在实验室安静环境下录制的语音文件,也可以是手机、电脑等设备下载的较为清晰的mp3语音文件,将原始的语音信号用Matlab读取到电脑上会获得对应的序列信息,在语音序列的合适位置添加方波序列信息,一般选取序列值变化较大的位置添加,再将合成的序列信号转化为语音信号作为语音时域处理的结果。
(2)搭建激光麦克风系统。光纤环形腔的激光麦克风系统包括光纤激光源、FFP滤波器、隔离器、掺铒光纤和光纤线圈等元器件。以及环形腔外由PD和DAQ组成的语音采集部分。
(3)布置光纤线圈位置。光纤线圈用于感应语音信号,也是语音信号的输入位置,由2千米的普通光纤缠绕形成。
(4)设置系统参数。搭建好麦克风系统并安置好光纤线圈之后,连接示波器,在有语音信号的输入情况下,调节光纤激光源,使得在合适的功率下,得到比较灵敏且稳定的信号输出。一般情况下,光纤激光源的输出功率越高,输出信号会更快稳定更灵敏,在实验中,设置的光纤激光源输出功率在350w左右。
本发明的思路是通过在原始语音序列中添加方波语音序列,这时的语音信号有了时间标记点,再将合成的语音信号输入到激光麦克风中,经过激光麦克风的信号是含有噪声的语音信号,由此可以保证,输入和输出的语音信号是时域对齐的。然后,对输出的含噪语音信号进行噪声处理,以及语音信号质量评估。
参见图3,图(a)显示在原始语音信号中,选取了一个峰值位置作为时间节点添加方波信号,添加之后可以得到图(b)的语音信号,图(b)所示的合成语音信号可以作为麦克风系统的输入语音。
本发明的有益效果如下:
(1)本发明实现了光纤声信号的时域波形对齐,具有较高的精确度和实用性。
(2)可移植性好,针对不同形式的光纤声音信号波长,只需要在合适的位置添加上标准的方波、锯齿波或者正弦波等即可,实验程序也能在各种操作系统下通用。

Claims (1)

1.一种基于光纤语音时域信号波形对齐的噪声评估方法,包括下列步骤:
第一步,原始语音时域信号处理:将原始语音信号用Matlab软件读取,得到原始语音信号的序列信息,在原始语音序列的合适位置添加方波序列信息,合成的语音序列再转化并保存为音频文件,用于输入激光麦克风。
第二步,搭建光纤环形腔的激光麦克风:包括光纤激光源,掺铒光纤,FFP滤波器,与FFP滤波器相连的光纤环形腔外的2×2耦合器,光纤线圈和数据采集部分,其中,光纤激光源产生连续激光,经过隔离器后形成只能在一个方向上传输的光信号,再由掺铒光纤进行光信号放大,然后传输到光纤线圈,所述的光纤线圈由为长度在1千米以上的光纤缠绕而成,作为语音信号感应器件,再经由耦合器和FFP滤波器传输回光纤激光源,耦合器用以将光信号与电信号进行转换,经过耦合器的信号转换,再通过数据采集部分,获得输出的语音信号;
第三步,布置光纤线圈的位置;
第四步,将时域处理后的语音信号通过光纤线圈输入激光麦克风,利用示波器观察输出信号的情况,通过调整光纤激光源的输出功率,得到稳定的输出语音信号;
第五步,根据所插入的方波信号进行激光麦克风的输入语音信号和输出语音信号的时域对齐,利用对经过腔激光麦克风的语音信号即含噪语音信号进行去噪处理,并进行语音质量评估。
CN202010210101.7A 2020-03-23 2020-03-23 基于光纤语音时域信号波形对齐的噪声评估方法 Pending CN111489759A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010210101.7A CN111489759A (zh) 2020-03-23 2020-03-23 基于光纤语音时域信号波形对齐的噪声评估方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010210101.7A CN111489759A (zh) 2020-03-23 2020-03-23 基于光纤语音时域信号波形对齐的噪声评估方法

Publications (1)

Publication Number Publication Date
CN111489759A true CN111489759A (zh) 2020-08-04

Family

ID=71810808

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010210101.7A Pending CN111489759A (zh) 2020-03-23 2020-03-23 基于光纤语音时域信号波形对齐的噪声评估方法

Country Status (1)

Country Link
CN (1) CN111489759A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113270080A (zh) * 2021-06-02 2021-08-17 广州酷狗计算机科技有限公司 合唱方法、系统、装置、终端及计算机可读存储介质
CN113409820A (zh) * 2021-06-09 2021-09-17 合肥群音信息服务有限公司 一种基于语音数据的质量评价方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002097791A1 (en) * 2001-05-25 2002-12-05 Dolby Laboratories Licensing Corporation Method for time aligning audio signals using characterizations based on auditory events
CN103474083A (zh) * 2013-09-18 2013-12-25 中国人民解放军电子工程学院 基于正交正弦脉冲序列定位标签的语音时间规整方法
US20140029762A1 (en) * 2012-07-25 2014-01-30 Nokia Corporation Head-Mounted Sound Capture Device
US20150279351A1 (en) * 2012-12-19 2015-10-01 Google Inc. Keyword detection based on acoustic alignment
CN107389097A (zh) * 2017-07-25 2017-11-24 北京航空航天大学 光纤陀螺Sagnac光纤环本征频率跟踪测量方法
CN110289014A (zh) * 2019-05-21 2019-09-27 华为技术有限公司 一种语音质量检测方法及电子设备
US20200162821A1 (en) * 2016-12-09 2020-05-21 The Research Foundation For The State University Of New York Fiber microphone
US20210027769A1 (en) * 2018-05-28 2021-01-28 Huawei Technologies Co., Ltd. Voice alignment method and apparatus

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002097791A1 (en) * 2001-05-25 2002-12-05 Dolby Laboratories Licensing Corporation Method for time aligning audio signals using characterizations based on auditory events
US20140029762A1 (en) * 2012-07-25 2014-01-30 Nokia Corporation Head-Mounted Sound Capture Device
US20150279351A1 (en) * 2012-12-19 2015-10-01 Google Inc. Keyword detection based on acoustic alignment
CN103474083A (zh) * 2013-09-18 2013-12-25 中国人民解放军电子工程学院 基于正交正弦脉冲序列定位标签的语音时间规整方法
US20200162821A1 (en) * 2016-12-09 2020-05-21 The Research Foundation For The State University Of New York Fiber microphone
CN107389097A (zh) * 2017-07-25 2017-11-24 北京航空航天大学 光纤陀螺Sagnac光纤环本征频率跟踪测量方法
US20210027769A1 (en) * 2018-05-28 2021-01-28 Huawei Technologies Co., Ltd. Voice alignment method and apparatus
CN110289014A (zh) * 2019-05-21 2019-09-27 华为技术有限公司 一种语音质量检测方法及电子设备

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
O.KILIC ET AL.: "《Fiber-optical acoustic sensor based on a photonic-crystal diaphragm》", 《TRANSDUCERS 2009 - 2009 INTERNATIONAL SOLID-STATE SENSORS, ACTUATORS AND MICROSYSTEMS CONFERENCE》 *
江毅、唐才杰: "《光纤Fabry-Perot干涉仪原理及应用》", vol. 2, 国防工业出版社, pages: 143 - 102 *
高椿明 等: "《光纤声传感器综述》", 《光电工程》, vol. 45, no. 9, pages 116 - 125 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113270080A (zh) * 2021-06-02 2021-08-17 广州酷狗计算机科技有限公司 合唱方法、系统、装置、终端及计算机可读存储介质
CN113409820A (zh) * 2021-06-09 2021-09-17 合肥群音信息服务有限公司 一种基于语音数据的质量评价方法
CN113409820B (zh) * 2021-06-09 2022-03-15 合肥群音信息服务有限公司 一种基于语音数据的质量评价方法

Similar Documents

Publication Publication Date Title
US10891967B2 (en) Method and apparatus for enhancing speech
JP4308278B2 (ja) 電気通信装置の客観的音声品質測定の方法および装置
CN102016984B (zh) 用于动态声音传送的系统和方法
JP3636460B2 (ja) 音響信号中の過渡状態を検出し生成する方法とシステム
CN111489759A (zh) 基于光纤语音时域信号波形对齐的噪声评估方法
CN103229238A (zh) 用于产生音频信号的系统和方法
Harlander et al. Sound quality assessment using auditory models
CN109243429A (zh) 一种语音建模方法及装置
Gaudron et al. LPG-based optical fibre sensor for acoustic wave detection
JP3205560B2 (ja) オーディオ信号の調性を決定するための方法および装置
US7013266B1 (en) Method for determining speech quality by comparison of signal properties
CN116825117B (zh) 一种具有隐私保护功能的麦克风及其隐私保护方法
Barnwell III Objective measures for speech quality testing
Zhou et al. MFCC based real-time speech reproduction and recognition using distributed acoustic sensing technology
CN111128219A (zh) 一种激光多普勒取声方法及装置
CN111261192A (zh) 一种基于lstm网络的音频检测方法、电子设备及存储介质
Gully et al. The Lombard effect in MRI noise
CN112233693B (zh) 一种音质评估方法、装置和设备
CN115460527A (zh) 基于心理声学的耳机失真测量方法、存储介质、耳机
JP2002507776A (ja) 音声信号の過渡現象を解析するための信号処理方法
Zamarreño et al. Distributed optical fiber microphone
Song et al. An Intelligent Speech Multifeature Recognition Method Based on Deep Machine Learning: A Smart City Application
Voishvillo Measurements and Perception of Nonlinear Distortion—Comparing Numbers and Sound Quality
Sadeghi et al. The effect of different acoustic noise on speech signal formant frequency location
JP2006119647A (ja) ささやき声を通常の有声音声に擬似的に変換する装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information

Inventor after: Lv Chengang

Inventor after: Xiao Yanping

Inventor after: Ma Jingjing

Inventor after: Huo Ziqiang

Inventor before: Lv Chengang

Inventor before: Ma Jingjing

Inventor before: Huo Ziqiang

CB03 Change of inventor or designer information
RJ01 Rejection of invention patent application after publication

Application publication date: 20200804

RJ01 Rejection of invention patent application after publication