CN110265052A - 收音设备的信噪比确定方法、装置、存储介质及电子装置 - Google Patents
收音设备的信噪比确定方法、装置、存储介质及电子装置 Download PDFInfo
- Publication number
- CN110265052A CN110265052A CN201910550756.6A CN201910550756A CN110265052A CN 110265052 A CN110265052 A CN 110265052A CN 201910550756 A CN201910550756 A CN 201910550756A CN 110265052 A CN110265052 A CN 110265052A
- Authority
- CN
- China
- Prior art keywords
- signal
- target
- noise
- radio equipment
- noise ratio
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 36
- 230000009467 reduction Effects 0.000 claims abstract description 34
- 238000010801 machine learning Methods 0.000 claims abstract description 13
- 238000011946 reduction process Methods 0.000 claims abstract description 9
- 238000013528 artificial neural network Methods 0.000 claims abstract description 7
- 230000015654 memory Effects 0.000 claims description 18
- 238000004590 computer program Methods 0.000 claims description 14
- 238000012545 processing Methods 0.000 claims description 6
- 230000000694 effects Effects 0.000 abstract description 6
- 238000005516 engineering process Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000012549 training Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 230000005764 inhibitory process Effects 0.000 description 2
- 244000046109 Sorghum vulgare var. nervosum Species 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0272—Voice signal separating
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/27—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
- G10L25/30—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique using neural networks
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/60—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for measuring the quality of voice signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L2021/02087—Noise filtering the noise being separate speech, e.g. cocktail party
Landscapes
- Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Noise Elimination (AREA)
Abstract
本发明提供了一种收音设备的信噪比确定方法、装置、存储介质及电子装置,其中,该方法包括:收取目标场景中的目标源音频;使用目标循环神经网络RNN降噪模型对由所述收音设备获取的源音频进行降噪处理,得到所述目标源音频中包括的目标噪音信号和除去所述噪音信号后的目标去噪信号,其中,所述目标RNN降噪模型为使用多个数据通过机器学习训练出来的,所述多个数据中的每个数据均包括所述目标场景中的噪音信号;基于所述目标噪音信号和所述目标去噪信号确定所述收音设备的第一信噪比。通过本发明,解决了在判断硬件收音质量好坏的时候,实际收音信噪比难以直接计算的问题,进而达到了准确的反馈出该硬件的收音质量的效果。
Description
技术领域
本发明涉及通信领域,具体而言,涉及一种收音设备的信噪比确定方法、装置、存储介质及电子装置。
背景技术
现有技术中,将想要评估收音质量好坏的硬件在现场收两段录音,一段是纯背景噪音,一段是人声对话,将人声对话作为信号源,现场背景噪音作为噪音源,计算两段录音的能量比。即使是同一时段同一地点两段录音,噪音方向来源的差异在最后的信噪比计算时会造成误差。尤其是考虑到对特定方位或人声做降噪的硬件,两段录音的噪音误差将会更大,计算出的信噪比值会更不准确。而通过人为的切分同一段音频,计算切分出的噪音与人声的信噪比,由于人耳分辨率有限,并且一般收音的硬件在有人声的时候会对噪音做抑制或对人声做增益,要考量的信噪比主要就是噪音的抑制或人生的增益效果。人为切分出的音频段往往是纯人声段或纯噪音段,无法考量在有人声时的实际信噪比。
针对相关技术中存在的在判断硬件收音质量好坏的时候,实际收音信噪比难以直接计算的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种收音设备的信噪比确定方法、装置、存储介质及电子装置,以至少解决相关技术中存在的在判断硬件收音质量好坏的时候,实际收音信噪比难以直接计算的问题。
根据本发明的一个实施例,提供了一种收音设备的信噪比确定方法,包括:收取目标场景中的目标源音频;使用目标循环神经网络RNN降噪模型对由所述收音设备获取的源音频进行降噪处理,得到所述目标源音频中包括的目标噪音信号和除去所述噪音信号后的目标去噪信号,其中,所述目标RNN降噪模型为使用多个数据通过机器学习训练出来的,所述多个数据中的每个数据均包括所述目标场景中的噪音信号;基于所述目标噪音信号和所述目标去噪信号确定所述收音设备的第一信噪比。
可选地,在收取目标场景中的目标源音频之前,所述方法还包括:确定所述目标场景中的各种噪音信号;利用确定的噪音信号通过机器学习对原始RNN降噪模型进行训练,以得到所述目标RNN降噪模型。
可选地,所述方法还包括:确定利用所述收音设备在理想场景中获取的理想去噪信号,其中,所述理想场景为不包括所述目标场景中的噪音信号的场景;确定利用所述收音设备在所述目标场景中录制的噪音信号;基于获取的噪音信号和所述理想去噪信号确定所述收音设备的第二信噪比;基于所述第一信噪比和所述第二信噪比确定所述收音设备的收音性能。
可选地,基于所述目标噪音信号和所述目标去噪信号确定所述收音设备的第一信噪比包括:将所述目标去噪信号与所述目标噪音信号的能量比值确定为所述收音设备的第一信噪比。
根据本发明的另一个实施例,提供了一种收音设备的信噪比的确定装置,包括:收取模块,用于收取目标场景中的目标源音频;处理模块,用于使用目标循环神经网络RNN降噪模型对由所述收音设备获取的源音频进行降噪处理,得到所述目标源音频中包括的目标噪音信号和除去所述噪音信号后的目标去噪信号,其中,所述目标RNN降噪模型为使用多个数据通过机器学习训练出来的,所述多个数据中的每个数据均包括所述目标场景中的噪音信号;确定模块,基于所述目标噪音信号和所述目标去噪信号确定所述收音设备的第一信噪比。
可选地,所述装置还用于:在收取目标场景中的目标源音频之前,确定所述目标场景中的各种噪音信号;利用确定的噪音信号通过机器学习对原始RNN降噪模型进行训练,以得到所述目标RNN降噪模型。
可选地,所述装置还用于:确定利用所述收音设备在理想场景中获取的理想去噪信号,其中,所述理想场景为不包括所述目标场景中的噪音信号的场景;确定利用所述收音设备在所述目标场景中录制的噪音信号;基于获取的噪音信号和所述理想去噪信号确定所述收音设备的第二信噪比;基于所述第一信噪比和所述第二信噪比确定所述收音设备的收音性能。
可选地,所述确定模块包括:确定单元,用于将所述目标去噪信号与所述目标噪音信号的能量比值确定为所述收音设备的第一信噪比。
根据本发明的又一个实施例,还提供了一种存储介质,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
根据本发明的又一个实施例,还提供了一种电子装置,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行上述任一项方法实施例中的步骤。
通过本发明,可以利用训练得到的RNN降噪模型来得到更为准确的目标噪音信号和目标去噪信号,进而可以依据得到的目标噪音信号和所述目标去噪信号确定所述收音设备的第一信噪比。可以解决相关技术中存在的在判断硬件收音质量好坏的时候,实际收音信噪比难以直接计算的问题,达到准确的反馈出该硬件的收音质量的效果。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是本发明实施例的一种收音设备的信噪比确定方法的移动终端的硬件结构框图;
图2是根据本发明实施例的一种收音设备的信噪比确定方法的流程图;
图3是根据本发明实施例的一种收音设备的信噪比确定装置的操作流程图;
图4是根据本发明实施例的一种收音设备的信噪比确定装置的结构框图。
具体实施方式
下文中将参考附图并结合实施例来详细说明本发明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
本申请实施例中所提供的方法可以在移动终端、计算机终端或者类似的运算装置中执行。以运行在移动终端上为例,图1是本发明实施例的一种收音设备的信噪比确定方法的移动终端的硬件结构框图。如图1所示,移动终端10可以包括一个或多个(图1中仅示出一个)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)和用于存储数据的存储器104,可选地,上述移动终端还可以包括用于通信功能的传输设备106以及输入输出设备108。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述移动终端的结构造成限定。例如,移动终端10还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
存储器104可用于存储计算机程序,例如,应用软件的软件程序以及模块,如本发明实施例中的地图的更新方法对应的计算机程序,处理器102通过运行存储在存储器104内的计算机程序,从而执行各种功能应用以及数据处理,即实现上述的方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至移动终端10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括移动终端10的通信供应商提供的无线网络。在一个实例中,传输装置106包括一个网络适配器(Network Interface Controller,简称为NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置106可以为射频(Radio Frequency,简称为RF)模块,其用于通过无线方式与互联网进行通讯。
在本实施例中提供了一种收音设备的信噪比确定方法,图2是根据本发明实施例的收音设备的信噪比确定方法的流程图,如图2所示,该流程包括如下步骤:
步骤S102,收取目标场景中的目标源音频;
步骤S104,使用目标循环神经网络RNN降噪模型对由所述收音设备获取的源音频进行降噪处理,得到所述目标源音频中包括的目标噪音信号和除去所述噪音信号后的目标去噪信号,其中,所述目标RNN降噪模型为使用多个数据通过机器学习训练出来的,所述多个数据中的每个数据均包括所述目标场景中的噪音信号;
步骤S106,基于所述目标噪音信号和所述目标去噪信号确定所述收音设备的第一信噪比。
其中,执行上述处理的可以是前述的终端,或者是其他的能够实现上述功能的处理系统。
通过本发明,可以利用训练得到的RNN降噪模型来得到更为准确的目标噪音信号和目标去噪信号,进而可以依据得到的目标噪音信号和所述目标去噪信号确定所述收音设备的第一信噪比。可以解决相关技术中存在的在判断硬件收音质量好坏的时候,实际收音信噪比难以直接计算的问题,达到准确的反馈出该硬件的收音质量的效果。
在一个可选的实施例中,在收取目标场景中的目标源音频之前,所述方法还包括:确定所述目标场景中的各种噪音信号;利用确定的噪音信号通过机器学习对原始RNN降噪模型进行训练,以得到所述目标RNN降噪模型。在本实施例中,通过训练RNN降噪模型来对源音频进行降噪处理,可以实现同一段音频段中的人声信号与噪音信号的分离,由于信号与噪音来源于同一段音频,从而声音来源及噪音类型在噪音及人声中都能够保持一致。并且RNN模型会基于时间帧来进行操作,在人耳无法分辨的时间帧内,其也能分离噪音与信号,硬件端对人声的增益及噪音的抑制就能够被评估出来。例如,RNN降噪模型可以将一段人声音频段中的噪音分离出来,由于被分离出的噪音来源于人声段,该段噪音的能量与该段音频的人声能量会体现出硬件端的降噪或增益模块的作用,得到的信噪比值可以准确的反馈出该硬件的收音质量。
在一个可选的实施例中,所述方法还包括:确定利用所述收音设备在理想场景中获取的理想去噪信号,其中,所述理想场景为不包括所述目标场景中的噪音信号的场景;确定利用所述收音设备在所述目标场景中录制的噪音信号;基于获取的噪音信号和所述理想去噪信号确定所述收音设备的第二信噪比;基于所述第一信噪比和所述第二信噪比确定所述收音设备的收音性能。在本实施例中,可以使用待评估的硬件设备在专业录音室录制纯净人声作为信号源,在应用场景录制纯噪音背景作为噪音源,计算这两者能量比值后,在应用场景使用待评估设备录制一段有人声音频,使用RNN降噪计算信噪比,再通过对比两种信噪比的变化评估出该硬件的收音性能。
在一个可选的实施例中,基于所述目标噪音信号和所述目标去噪信号确定所述收音设备的第一信噪比包括:将所述目标去噪信号与所述目标噪音信号的能量比值确定为所述收音设备的第一信噪比。
因此,通过本发明实施例中的收音设备的信噪比确定方法,可以解决相关技术中,在判断硬件收音质量好坏的时候,实际收音信噪比难以直接计算的问题,达到准确的反馈出该硬件的收音质量的效果。
下面结合具体实施例对本发明进行说明:
图3是根据本发明实施例的一种收音设备的信噪比的确定装置的操作流程图,如图3所示,包括如下步骤:
步骤1:使用想要评估收音性能的硬件收取该硬件所处应用场景可能出现的噪音,并训练RNN降噪模型。
步骤2:使用训练好的RNN降噪模型对收取的源音频进行人为的降噪处理,并生成一个去掉噪声的音频以及噪声音频。
步骤3:计算去噪音频以及噪声音频的能量比值,即可得到在特定场景下该硬件设备的信噪比值。
通过上述实施例可以减少计算信噪比时的其他变量,从而获得相对准确的信噪比指标。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
在本实施例中还提供了一种收音设备的信噪比确定装置,该装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
图4是根据本发明实施例的收音设备的信噪比确定装置的结构框图,如图4所示,该装置包括:
收取模块42,用于收取目标场景中的目标源音频;处理模块44,用于使用目标循环神经网络RNN降噪模型对由所述收音设备获取的源音频进行降噪处理,得到所述目标源音频中包括的目标噪音信号和除去所述噪音信号后的目标去噪信号,其中,所述目标RNN降噪模型为使用多个数据通过机器学习训练出来的,所述多个数据中的每个数据均包括所述目标场景中的噪音信号;确定模块46,基于所述目标噪音信号和所述目标去噪信号确定所述收音设备的第一信噪比。
在一个可选的实施例中,所述装置还用于:在收取目标场景中的目标源音频之前,确定所述目标场景中的各种噪音信号;利用确定的噪音信号通过机器学习对原始RNN降噪模型进行训练,以得到所述目标RNN降噪模型。
在一个可选的实施例中,所述装置还用于确定利用所述收音设备在理想场景中获取的理想去噪信号,其中,所述理想场景为不包括所述目标场景中的噪音信号的场景;确定利用所述收音设备在所述目标场景中录制的噪音信号;基于获取的噪音信号和所述理想去噪信号确定所述收音设备的第二信噪比;基于所述第一信噪比和所述第二信噪比确定所述收音设备的收音性能。
在一个可选的实施例中,所述确定模块包括:确定单元,用于将所述目标去噪信号与所述目标噪音信号的能量比值确定为所述收音设备的第一信噪比。
需要说明的是,上述各个模块是可以通过软件或硬件来实现的,对于后者,可以通过以下方式实现,但不限于此:上述模块均位于同一处理器中;或者,上述各个模块以任意组合的形式分别位于不同的处理器中。
本发明的实施例还提供了一种存储介质,该存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
可选地,在本实施例中,上述存储介质可以包括但不限于:U盘、只读存储器(Read-Only Memory,简称为ROM)、随机存取存储器(Random Access Memory,简称为RAM)、移动硬盘、磁碟或者光盘等各种可以存储计算机程序的介质。
本发明的实施例还提供了一种电子装置,包括存储器和处理器,该存储器中存储有计算机程序,该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。
可选地,上述电子装置还可以包括传输设备以及输入输出设备,其中,该传输设备和上述处理器连接,该输入输出设备和上述处理器连接。
可选地,本实施例中的具体示例可以参考上述实施例及可选实施方式中所描述的示例,本实施例在此不再赘述。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种收音设备的信噪比的确定方法,其特征在于,包括:
收取目标场景中的目标源音频;
使用目标循环神经网络RNN降噪模型对由所述收音设备获取的源音频进行降噪处理,得到所述目标源音频中包括的目标噪音信号和除去所述噪音信号后的目标去噪信号,其中,所述目标RNN降噪模型为使用多个数据通过机器学习训练出来的,所述多个数据中的每个数据均包括所述目标场景中的噪音信号;
基于所述目标噪音信号和所述目标去噪信号确定所述收音设备的第一信噪比。
2.根据权利要求1所述的方法,其特征在于,在收取目标场景中的目标源音频之前,所述方法还包括:
确定所述目标场景中的各种噪音信号;
利用确定的噪音信号通过机器学习对原始RNN降噪模型进行训练,以得到所述目标RNN降噪模型。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
确定利用所述收音设备在理想场景中获取的理想去噪信号,其中,所述理想场景为不包括所述目标场景中的噪音信号的场景;
确定利用所述收音设备在所述目标场景中录制的噪音信号;
基于获取的噪音信号和所述理想去噪信号确定所述收音设备的第二信噪比;
基于所述第一信噪比和所述第二信噪比确定所述收音设备的收音性能。
4.根据权利要求1至3中任一项所述的方法,其特征在于,基于所述目标噪音信号和所述目标去噪信号确定所述收音设备的第一信噪比包括:
将所述目标去噪信号与所述目标噪音信号的能量比值确定为所述收音设备的第一信噪比。
5.一种收音设备的信噪比的确定装置,其特征在于,包括:
收取模块,用于收取目标场景中的目标源音频;
处理模块,用于使用目标循环神经网络RNN降噪模型对由所述收音设备获取的源音频进行降噪处理,得到所述目标源音频中包括的目标噪音信号和除去所述噪音信号后的目标去噪信号,其中,所述目标RNN降噪模型为使用多个数据通过机器学习训练出来的,所述多个数据中的每个数据均包括所述目标场景中的噪音信号;
确定模块,基于所述目标噪音信号和所述目标去噪信号确定所述收音设备的第一信噪比。
6.根据权利要求5所述的装置,其特征在于,所述装置还用于:
在收取目标场景中的目标源音频之前,确定所述目标场景中的各种噪音信号;
利用确定的噪音信号通过机器学习对原始RNN降噪模型进行训练,以得到所述目标RNN降噪模型。
7.根据权利要求5所述的装置,其特征在于,所述装置还用于:
确定利用所述收音设备在理想场景中获取的理想去噪信号,其中,所述理想场景为不包括所述目标场景中的噪音信号的场景;
确定利用所述收音设备在所述目标场景中录制的噪音信号;
基于获取的噪音信号和所述理想去噪信号确定所述收音设备的第二信噪比;
基于所述第一信噪比和所述第二信噪比确定所述收音设备的收音性能。
8.根据权利要求5至7中任一项所述的装置,其特征在于,所述确定模块包括:
确定单元,用于将所述目标去噪信号与所述目标噪音信号的能量比值确定为所述收音设备的第一信噪比。
9.一种存储介质,其特征在于,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行所述权利要求1至4任一项中所述的方法。
10.一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行所述权利要求1至4任一项中所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910550756.6A CN110265052B (zh) | 2019-06-24 | 2019-06-24 | 收音设备的信噪比确定方法、装置、存储介质及电子装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910550756.6A CN110265052B (zh) | 2019-06-24 | 2019-06-24 | 收音设备的信噪比确定方法、装置、存储介质及电子装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110265052A true CN110265052A (zh) | 2019-09-20 |
CN110265052B CN110265052B (zh) | 2022-06-10 |
Family
ID=67920957
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910550756.6A Active CN110265052B (zh) | 2019-06-24 | 2019-06-24 | 收音设备的信噪比确定方法、装置、存储介质及电子装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110265052B (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111583958A (zh) * | 2020-05-19 | 2020-08-25 | 北京达佳互联信息技术有限公司 | 音频信号处理方法、装置、电子设备及存储介质 |
CN112185410A (zh) * | 2020-10-21 | 2021-01-05 | 北京猿力未来科技有限公司 | 音频处理方法及装置 |
CN112652323A (zh) * | 2020-12-24 | 2021-04-13 | 北京猿力未来科技有限公司 | 音频信号筛选方法、装置、电子设备及存储介质 |
CN112750453A (zh) * | 2020-12-24 | 2021-05-04 | 北京猿力未来科技有限公司 | 一种音频信号筛选方法、装置、设备及存储介质 |
CN112786066A (zh) * | 2020-12-24 | 2021-05-11 | 北京猿力未来科技有限公司 | 音频信号筛选方法、装置及电子设备 |
CN112802463A (zh) * | 2020-12-24 | 2021-05-14 | 北京猿力未来科技有限公司 | 一种音频信号筛选方法、装置及设备 |
CN113345433A (zh) * | 2021-05-30 | 2021-09-03 | 重庆长安汽车股份有限公司 | 一种车外语音交互系统 |
CN113571036A (zh) * | 2021-06-18 | 2021-10-29 | 上海淇玥信息技术有限公司 | 一种低质数据的自动化合成方法、装置及电子设备 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080312918A1 (en) * | 2007-06-18 | 2008-12-18 | Samsung Electronics Co., Ltd. | Voice performance evaluation system and method for long-distance voice recognition |
CN105261359A (zh) * | 2015-12-01 | 2016-01-20 | 南京师范大学 | 手机麦克风的消噪系统和消噪方法 |
CN105513605A (zh) * | 2015-12-01 | 2016-04-20 | 南京师范大学 | 手机麦克风的语音增强系统和语音增强方法 |
US9361899B2 (en) * | 2014-07-02 | 2016-06-07 | Nuance Communications, Inc. | System and method for compressed domain estimation of the signal to noise ratio of a coded speech signal |
CN106297818A (zh) * | 2016-09-12 | 2017-01-04 | 广州酷狗计算机科技有限公司 | 一种获取去噪语音信号的方法和装置 |
US20170004843A1 (en) * | 2013-11-07 | 2017-01-05 | Continental Automotive Systems, Inc. | Externally Estimated SNR Based Modifiers for Internal MMSE Calculations |
CN107205205A (zh) * | 2016-03-17 | 2017-09-26 | 北京卓锐微技术有限公司 | 麦克风评估装置及评估方法 |
US20170345439A1 (en) * | 2014-06-13 | 2017-11-30 | Oticon A/S | Audio processing device and a method for estimating a signal-to-noise-ratio of a sound signal |
CN107886943A (zh) * | 2017-11-21 | 2018-04-06 | 广州势必可赢网络科技有限公司 | 一种声纹识别方法及装置 |
US20190043524A1 (en) * | 2018-02-13 | 2019-02-07 | Intel Corporation | Vibration sensor signal transformation based on smooth average spectrums |
CN109378010A (zh) * | 2018-10-29 | 2019-02-22 | 珠海格力电器股份有限公司 | 神经网络模型的训练方法、语音去噪方法及装置 |
CN109801644A (zh) * | 2018-12-20 | 2019-05-24 | 北京达佳互联信息技术有限公司 | 混合声音信号的分离方法、装置、电子设备和可读介质 |
-
2019
- 2019-06-24 CN CN201910550756.6A patent/CN110265052B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080312918A1 (en) * | 2007-06-18 | 2008-12-18 | Samsung Electronics Co., Ltd. | Voice performance evaluation system and method for long-distance voice recognition |
US20170004843A1 (en) * | 2013-11-07 | 2017-01-05 | Continental Automotive Systems, Inc. | Externally Estimated SNR Based Modifiers for Internal MMSE Calculations |
US20170345439A1 (en) * | 2014-06-13 | 2017-11-30 | Oticon A/S | Audio processing device and a method for estimating a signal-to-noise-ratio of a sound signal |
US9361899B2 (en) * | 2014-07-02 | 2016-06-07 | Nuance Communications, Inc. | System and method for compressed domain estimation of the signal to noise ratio of a coded speech signal |
CN105261359A (zh) * | 2015-12-01 | 2016-01-20 | 南京师范大学 | 手机麦克风的消噪系统和消噪方法 |
CN105513605A (zh) * | 2015-12-01 | 2016-04-20 | 南京师范大学 | 手机麦克风的语音增强系统和语音增强方法 |
CN107205205A (zh) * | 2016-03-17 | 2017-09-26 | 北京卓锐微技术有限公司 | 麦克风评估装置及评估方法 |
CN106297818A (zh) * | 2016-09-12 | 2017-01-04 | 广州酷狗计算机科技有限公司 | 一种获取去噪语音信号的方法和装置 |
CN107886943A (zh) * | 2017-11-21 | 2018-04-06 | 广州势必可赢网络科技有限公司 | 一种声纹识别方法及装置 |
US20190043524A1 (en) * | 2018-02-13 | 2019-02-07 | Intel Corporation | Vibration sensor signal transformation based on smooth average spectrums |
CN109378010A (zh) * | 2018-10-29 | 2019-02-22 | 珠海格力电器股份有限公司 | 神经网络模型的训练方法、语音去噪方法及装置 |
CN109801644A (zh) * | 2018-12-20 | 2019-05-24 | 北京达佳互联信息技术有限公司 | 混合声音信号的分离方法、装置、电子设备和可读介质 |
Non-Patent Citations (3)
Title |
---|
XUHUI CHEN: "Coherence based Dual Microphone Source Separation in Low SNR Noisy Environments", 《2018 IEEE/ACIS 17TH INTERNATIONAL CONFERENCE ON COMPUTER AND INFORMATION SCIENCE (ICIS)》 * |
洪骥宇: "基于降噪自编码器的航空发动机性能退化评估", 《航空动力学报》 * |
赵殿栋: "《油气地球物理勘探技术》", 30 June 2002, 东营:石油大学出版社 * |
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111583958A (zh) * | 2020-05-19 | 2020-08-25 | 北京达佳互联信息技术有限公司 | 音频信号处理方法、装置、电子设备及存储介质 |
CN111583958B (zh) * | 2020-05-19 | 2023-10-10 | 北京达佳互联信息技术有限公司 | 音频信号处理方法、装置、电子设备及存储介质 |
CN112185410A (zh) * | 2020-10-21 | 2021-01-05 | 北京猿力未来科技有限公司 | 音频处理方法及装置 |
CN112185410B (zh) * | 2020-10-21 | 2024-04-30 | 北京猿力未来科技有限公司 | 音频处理方法及装置 |
CN112750453B (zh) * | 2020-12-24 | 2023-03-14 | 北京猿力未来科技有限公司 | 一种音频信号筛选方法、装置、设备及存储介质 |
CN112802463A (zh) * | 2020-12-24 | 2021-05-14 | 北京猿力未来科技有限公司 | 一种音频信号筛选方法、装置及设备 |
CN112652323B (zh) * | 2020-12-24 | 2023-01-20 | 北京猿力未来科技有限公司 | 音频信号筛选方法、装置、电子设备及存储介质 |
CN112786066A (zh) * | 2020-12-24 | 2021-05-11 | 北京猿力未来科技有限公司 | 音频信号筛选方法、装置及电子设备 |
CN112786066B (zh) * | 2020-12-24 | 2023-03-14 | 北京猿力未来科技有限公司 | 音频信号筛选方法、装置及电子设备 |
CN112802463B (zh) * | 2020-12-24 | 2023-03-31 | 北京猿力未来科技有限公司 | 一种音频信号筛选方法、装置及设备 |
CN112750453A (zh) * | 2020-12-24 | 2021-05-04 | 北京猿力未来科技有限公司 | 一种音频信号筛选方法、装置、设备及存储介质 |
CN112652323A (zh) * | 2020-12-24 | 2021-04-13 | 北京猿力未来科技有限公司 | 音频信号筛选方法、装置、电子设备及存储介质 |
CN113345433A (zh) * | 2021-05-30 | 2021-09-03 | 重庆长安汽车股份有限公司 | 一种车外语音交互系统 |
CN113571036A (zh) * | 2021-06-18 | 2021-10-29 | 上海淇玥信息技术有限公司 | 一种低质数据的自动化合成方法、装置及电子设备 |
CN113571036B (zh) * | 2021-06-18 | 2023-08-18 | 上海淇玥信息技术有限公司 | 一种低质数据的自动化合成方法、装置及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN110265052B (zh) | 2022-06-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110265052A (zh) | 收音设备的信噪比确定方法、装置、存储介质及电子装置 | |
CN108899044B (zh) | 语音信号处理方法及装置 | |
CN107591152B (zh) | 基于耳机的语音控制方法、装置及其设备 | |
CN111885275B (zh) | 语音信号的回声消除方法、装置、存储介质以及电子装置 | |
WO2003025858A3 (en) | Method for identifying and quantifying characteristics of seeds and other small objects | |
CN110706693B (zh) | 语音端点的确定方法及装置、存储介质、电子装置 | |
EP2907121B1 (en) | Real-time traffic detection | |
KR101344435B1 (ko) | 음성의 표적화 및 잡음의 무시에 의한 음성 신호의 프로세싱에 있어서 잡음 감소를 위한 시스템 및 방법 | |
CN112037789A (zh) | 设备唤醒方法、装置、存储介质及电子装置 | |
EP4319099A1 (en) | Audio processing method, related device, storage medium and program product | |
US20210326700A1 (en) | Neural network optimization | |
CN108877783A (zh) | 确定音频数据的音频类型的方法和装置 | |
CN112906046B (zh) | 一种利用单比特压缩感知技术的模型训练方法和装置 | |
CN112151051B (zh) | 音频数据的处理方法和装置及存储介质 | |
CN111142066A (zh) | 波达方向估计方法、服务器以及计算机可读存储介质 | |
CN110222246A (zh) | 一种数据筛选方法和装置 | |
CN112348110A (zh) | 模型训练及图像处理方法、装置、电子设备和存储介质 | |
CN109685805A (zh) | 一种图像分割方法及装置 | |
JP6517124B2 (ja) | 雑音抑圧装置、雑音抑圧方法、およびプログラム | |
CN111081222A (zh) | 语音识别方法、装置、存储介质以及电子装置 | |
KR101979652B1 (ko) | 음파 통신 시스템 및 그의 음파 통신 방법 | |
CN113077804B (zh) | 回声消除方法、装置、设备及存储介质 | |
CN111354341A (zh) | 语音唤醒方法及装置、处理器、音箱和电视机 | |
CN114067785B (zh) | 语音深度神经网络训练方法、装置、存储介质及电子装置 | |
CN112201239B (zh) | 目标设备的确定方法及装置、存储介质、电子装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |