CN110782884B - 远场拾音噪声处理方法、装置、设备及存储介质 - Google Patents
远场拾音噪声处理方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN110782884B CN110782884B CN201911033489.1A CN201911033489A CN110782884B CN 110782884 B CN110782884 B CN 110782884B CN 201911033489 A CN201911033489 A CN 201911033489A CN 110782884 B CN110782884 B CN 110782884B
- Authority
- CN
- China
- Prior art keywords
- noise
- noise signal
- signal
- energy spectrum
- sound pressure
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 21
- 238000001228 spectrum Methods 0.000 claims abstract description 60
- 238000012545 processing Methods 0.000 claims abstract description 37
- 238000000034 method Methods 0.000 claims abstract description 29
- 238000011156 evaluation Methods 0.000 claims abstract description 16
- 230000008569 process Effects 0.000 claims abstract description 9
- 238000001914 filtration Methods 0.000 claims description 9
- 238000004590 computer program Methods 0.000 claims description 8
- 230000005540 biological transmission Effects 0.000 claims description 7
- 238000010586 diagram Methods 0.000 description 18
- 230000009467 reduction Effects 0.000 description 8
- 238000004891 communication Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 3
- 239000000835 fiber Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000001902 propagating effect Effects 0.000 description 2
- 230000002829 reductive effect Effects 0.000 description 2
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000003238 somatosensory effect Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/24—Speech recognition using non-acoustical features
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Quality & Reliability (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
本发明公开了一种远场拾音噪声处理方法、装置、设备及存储介质。所述方法通过根据噪声信号的声压级来划分得到不同种类的噪声系数,根据不同类别的噪声系数选择与之相匹配的算法固件,通过算法固件对噪声信号进行处理得到最终的目标语音信号,使得远场拾音设备应用在不同的环境中时有不同的算法固件对不同类别的噪声信号进行处理,还可通过噪声信号的声压级和能量谱计算得到噪声预测评估值,通过噪声预测评估值选择与之相匹配的算法固件对噪声信号进行处理,进而提高了多种场景下的外部家电模组语音识别率与唤醒率。
Description
技术领域
本发明涉及信号处理技术领域,尤其涉及一种远场拾音噪声处理方法、装置、设备及存储介质。
背景技术
信道的噪声相对于有用的信号就属于干扰,如果噪声干扰不去除,就会造成信号的失真,使得通信无法正确和有效的进行。
随着科技的发展,智能设备的应用越来越广泛,在智能设备上使用语音唤醒技术的应用也越来越普遍,相对于近场语音唤醒,远场语音唤醒碰到的困难更多,比如环境噪声、混响、其他人的话语干扰等都会影响智能设备对用户唤醒命令的识别,导致智能设备唤醒率降低。目前为了提高智能设备的唤醒率,多会通过智能设备内部的算法对噪声进行降噪、回声消除。
但是基于远场拾音设备内部的算法,无论外部环境的噪音级处于一个什么样的级别,设备内部的算法都是固定的对不同噪音级的噪音进行相同的降噪和回声处理,所以导致了不同环境下对设备唤醒存在差异。
发明内容
本发明的目的在于提供一种远场拾音噪声处理方法、装置及电子设备,以避免在不同环境下用同一算法处理不同的噪音从而导致远场拾音设备语音识别率和唤醒率低的问题。
根据本发明的第一方面,提供了一种远场拾音噪声处理方法,所述方法包括:
通过拾取外部声音获取噪声信号;
获取所述噪声信号的声压级;
根据所述声压级判断所述噪声信号在第一分类表中的类别,所述第一分类表包括不同种类的噪声系数;
根据所述噪声系数选择相匹配的算法固件对所述噪声信号进行处理并得到目标语音信号。
可选的,还包括:
获取所述噪声信号的能量谱;
根据所述声压级和所述能量谱判断所述噪声信号在第二分类表中的类别,所述第二分类表包括不同种类的噪声系数和不同种类的能量谱系数;
根据所述声压级和所述能量谱通过空间滤波算法计算得到噪声预测评估值;
根据所述噪声预测评估值选择相匹配的算法固件。
可选的,其中,通过拾取外部声音获取噪声信号包括:
获取所述外部声音对应的语音信号;
判断所述语音信号是否为噪声信号;
若是则提取所述噪声信号。
可选的,将所述目标语音信号传输到外部家电模组,以控制外部家电模组的运行状态。
可选的,所述噪声系数位于20分贝~90分贝之间。
可选的,所述不同种类的噪声系数通过以下步骤得到:
当所述噪声信号的初始声压级为S时,以第一间隔T1对所述噪声信号的声压级进行分类得到所述噪声信号的噪声系数N,所述噪声系数N位于S+(N-1)*T1~S+N*T1之间,其中N为整数且N≥1,2分贝≤T1≤8分贝。
可选的,所述T1为5分贝。
可选的,所述不同种类的能量谱系数通过以下步骤得到:
当所述噪声信号的初始能量为E时,以第二间隔T2对所述噪声信号的能量进行分类得到所述噪声信号的能量谱N,所述能量谱N位于E+(N-1)*T2~E+N*T2之间,其中N为整数且N≥1,2焦耳≤T2≤8焦耳。
可选的,所述T2为5焦耳。
可选的,所述能量谱位于35焦耳~100焦耳之间。
根据本发明的第二方面,提供了一种远场拾音噪声处理装置,包括:
第一获取模块,用于获取噪声信号;
第二获取模块,用于获取所述噪声信号的声压级;
第一判断模块,用于根据所述声压级判断所述噪声信号在第一分类表中的类别;
第一选择模块,用于根据所述噪声系数选择相匹配的算法固件;
噪声处理模块,用于根据所述算法固件对所述噪声信号进行处理并得到目标语音信号。
可选的,还包括:
第三获取模块,用于获取所述噪声信号的能量谱;
第二判断模块,用于根据所述声压级和所述能量谱判断所述噪声信号在第二分类表中的类别;
计算模块,用于根据所述声压级和所述能量谱通过空间滤波算法计算得到噪声预测评估值;
第二选择模块,用于根据噪声预测评估值选择相匹配的算法固件。
可选的,传输模块用于将所述目标语音信号传输到外部家电模组,以控制外部家电模组的运行状态。
根据本发明的第三方面,提供了一种电子设备,此电子设备包括:根据本发明第二方面所述的远场拾音噪声处理装置;或者,
处理器和存储器,所述存储器用于存储可执行的指令,所述指令用于控制所述处理器执行根据本发明第一方面所述的远场拾音噪声处理方法。
根据本发明的第四方面,提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序在被处理器执行时实现根据本发明第一方面所述的远场拾音噪声处理方法。
本发明根据噪声信号的声压级来对应出噪声信号在预制第一分类表中的类别,根据不同类别的噪声系数选择与之相匹配的算法固件,通过算法固件对噪声信号进行处理得到最终的目标语音信号,使得远场拾音设备应用在不同的环境中时有不同的算法固件对不同类别的噪声信号进行处理,进而提高了多种场景下的外部家电模组语音识别率与唤醒率。
通过以下参照附图对本发明的示例性实施例的详细描述,本发明的其它特征及其优点将会变得清楚。
附图说明
被结合在说明书中并构成说明书的一部分的附图示出了本发明的实施例,并且连同其说明一起用于解释本发明的原理。
图1为可用于实现本发明实施例的电子设备的硬件配置结构方框图。
图2为本发明第一实施例的远场拾音噪声处理方法流程图。
图3为本发明第二实施例的远场拾音噪声处理方法流程图。
图4为本发明实施例的第一种远场拾音噪声处理装置的结构方框图。
图5为本发明实施例的第二种远场拾音噪声处理装置的结构方框图。
图6为本发明实施例的电子设备的结构方框图。
具体实施方式
现在将参照附图来详细描述本发明的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本发明的范围。
以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本发明及其应用或使用的任何限制。
对于相关领域普通技术人物已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。
在这里示出和讨论的所有例子中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它例子可以具有不同的值。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
图1是示出可以实现本发明的实施例的电子设备1000的硬件配置的结构方框图。
电子设备1000可以是便携式电脑、台式计算机、手机、平板电脑等。
如图1所示,电子设备1000可以包括处理器1100、存储器1200、接口装置1300、通信装置1400、显示装置1500、输入装置1600、扬声器1700、麦克风1800等等。其中,处理器1100可以是中央处理器CPU、微处理器MCU等。存储器1200例如包括ROM(只读存储器)、RAM(随机存取存储器)、诸如硬盘的非易失性存储器等。接口装置1300例如包括USB接口、耳机接口等。通信装置1400例如能够进行有线或无线通信,具体地可以包括WiFi通信、蓝牙通信、2G/3G/4G/5G通信等。显示装置1500例如是液晶显示屏、触摸显示屏等。输入装置1600例如可以包括触摸屏、键盘、体感输入等。用户可以通过扬声器1700和麦克风1800输入/输出语音信息。
图1所示的电子设备仅仅是说明性的并且决不意味着对本发明、其应用或使用的任何限制。应用于本发明的实施例中,电子设备1000的所述存储器1200用于存储指令,所述指令用于控制所述处理器1100进行操作以执行本发明实施例提供的任意一项所述的远场拾音噪声处理方法。本领域技术人员应当理解,尽管在图1中对电子设备1000示出了多个装置,但是,本发明可以仅涉及其中的部分装置,例如电子设备1000可以只涉及处理器1100和存储装置1200。技术人员可以根据本发明所公开方案设计指令。指令如何控制处理器进行操作,这是本领域公知,故在此不再详细描述。
图2是示出可以实现本发明的实施例的第一种远场拾音噪声处理方法流程图。
远场拾音噪声处理方法可以是由电子设备实施,该电子设备例如可以是如图1所示的电子设备1000,还可以是如图6所示的电子设备100。
如图2所示,本发明实施例的远场拾音噪声处理方法包括以下步骤:
S1:通过拾取外部声音获取噪声信号。
外部家电模组中均设置有麦克风,当需要外部家电模组运行的时候,麦克风就会开始拾取外部声音,外部声音中包括外部家电模组需要的目标语音信号,同时目标语音信号中还掺杂有噪声信号,只有对噪声信号进行处理之后才能获取我们需要的目标语音信号,从而外部家电模组就能得到清晰的目标语音信号,这样外部家电模组的唤醒率就会提高。
可选的,其中,通过拾取外部声音获取噪声信号包括:
S101:获取外部声音对应的语音信号。
因为本发明的适用环境是针对智能语音家电模组,智能语音家电模组都是通过声音来控制其运行状态,但是这些语音家电模组所处的环境以及每一次唤醒所接收到的语音信号是不同的,因为每一次语音信号夹杂的噪声信号不同,所以语音家电模组在接收到目标语音信号,也就是可以唤醒语音家电模组的声音时同时会接收伴随着接收目标语音信号的噪声信号。
S102:判断语音信号是否为噪声信号。
在通过S101的步骤后,为了保证外部家电模组可以清晰的接收到有用的语音信号,就需要对夹杂的语音信号进行处理,所以在接收到语音信号后,就需要对语音信号进行判断,只针对噪声信号进行处理,保留目标信号。
S103:若是则提取噪声信号。
在经过了S102的步骤后,噪声信号被系统识别,识别后将噪声信号提取出来,就可以对噪声信号进行处理。
S2:获取噪声信号的声压级。
对噪声信号进行处理,首先需要获取噪声信号的声压级,噪声信号的声压级就是从噪声的大小来对噪声信号进行划分,从而得到不同种类的噪声信号,针对不同种类的噪声信号采用不同的算法对其进行处理,从而实现了基于多种应用场景可以进行不同的噪声处理,提高了多种场景下的外部家电模组的语音识别率和唤醒率。
S3:根据声压级判断噪声信号在第一分类表中的类别,第一分类表包括不同种类的噪声系数。
在S2的步骤中,已经获取了在对外部家电模组进行一次唤醒时的噪声信号,噪声信号获取之后,我们就可以获知噪声信号的声压级,然而再每一次唤醒的时候,由于外部环境的不同,每一次获取的噪声信号必定是不同的,所以本申请中的分类表会根据每一次获取的噪声信号得到不同种类的噪声系数,且在分类表中每一种噪声系数会对应一种算法固件,这样在外部家电模组工作时,就可以根据不同的噪声系数来选择不同的算法固件,从而提高了对噪声信号的处理率,得到的目标语音信号也更加的清晰。
其中,可选的,不同种类的噪声系数通过以下步骤得到:
当噪声信号的初始声压级为S时,以第一间隔T1对噪声信号的声压级进行分类得到噪声信号的噪声系数N,噪声系数N位于S+(N-1)*T1~S+N*T1之间,其中N为整数且N≥1,5分贝≤T1≤15分贝。
实施例1,当噪声信号的初始声压级为20分贝,且噪声信号的声压级位于20分贝到40分贝之间,T1为5分贝时,则本次唤醒外部家电模组时,第一分类表中的噪声系数分为噪声系数1位于20分贝~25分贝之间,噪声系数2位于25分贝~30分贝之间,噪声系数3位于30分贝~35分贝之间,噪声系数4位于35分贝~40分贝之间,噪声系数一共有四类。
实施例2,当噪声信号的初始声压级为20分贝,且噪声信号的声压级位于20分贝到40分贝之间,T1为10分贝时,则本次唤醒外部家电模组时,第一分类表中的噪声系数分为噪声系数1位于20分贝~30分贝之间,噪声系数2位于30分贝~40分贝之间,噪声系数一共有两类。
实施例3,当噪声信号的初始声压级为20分贝,且噪声信号的声压级位于20分贝到40分贝之间,T1为15分贝时,则本次唤醒外部家电模组时,第一分类表中的噪声系数分为噪声系数1位于20分贝~35分贝之间,噪声系数2位于35分贝~40分贝之间,噪声系数一共有两类。
综上所述,当T1设置为10分贝时,噪声系数的划分更为合理,避免了因T1设置小导致需要长时间的来划分噪声系数,使得在进行噪声系数划分时浪费了时间,降低了对噪声处理的速率;又可避免T1设置大导致划分不够精确,造成对噪声处理不彻底的现象发生。
可选的,噪声系数位于20分贝~90分贝之间。
S4:根据所述噪声系数选择相匹配的算法固件对所述噪声信号进行处理并得到目标语音信号。
算法固件1是噪声系数为20分贝~30分贝时的时域降噪算法;算法固件2是噪声系数为30分贝~40分贝时的频域降噪算法;算法固件3是噪声系数为40分贝~50分贝时的回声消除算法;算法固件4是噪声系数为50分贝~60分贝时的去混响算法;算法固件5是噪声系数为60分贝~70分贝时的时域降噪算法与去混响算法的混合算法;算法固件6是噪声系数为70分贝~80分贝时的频域降噪算法与回声消除算法的混合算法;算法固件7是噪声系数为80分贝~90分贝时的时域降噪算法、频域降噪算法和回声消除算法的混合算法。
根据S3中的实施例,按照实施例1进行噪声系数划分时,根据第一分类表的预设匹配信息得到,噪声系数1选择算法固件1来处理,噪声系数2选择算法固件1和算法固件2来处理,噪声系数3,噪声系数4,噪声系数5均选择算法固件2来处理。
按照实施例2进行噪声系数划分时,根据第一分类表的预设匹配信息得到,噪声系数1选择算法固件1来处理,噪声系数2选择算法固件2来处理。
按照实施例3进行噪声系数划分时,根据第一分类表的预设匹配信息得到,噪声系数1选择算法固件1和算法固件2来处理,噪声系数2选择算法固件2来处理。
图3是示出可以实现本发明的实施例的第二种远场拾音噪声处理方法流程图。
可选的,本发明可以只通过噪声系数来对应选择相匹配的算法固件,另外还可以通过噪声预测算法来选择相匹配的算法固件,具体步骤包括:
Q1:获取噪声信号的能量谱。
噪声信号也是一种声音,声音是一种空气介质的机械波,它的能量存在于传播过程中气体的疏密振动,所以装置在获取噪声信号后就可以进一步的读取噪声信号的能量谱。
Q2:根据声压级和能量谱判断噪声信号在第二分类表中的类别,第二分类表包括不同种类的噪声系数和不同种类的能量谱系数。
不同种类的噪声系数已在步骤S3中说明如何划分,再次不做赘述。不同种类的能量谱系数通过以下步骤得到:
当所述噪声信号的初始能量为E时,以第二间隔T2对所述噪声信号的能量进行分类得到所述噪声信号的能量谱N,所述能量谱N位于E+(N-1)*T2~E+N*T2之间,其中N为整数且N≥1,2焦耳≤T2≤8焦耳。
实例性的,当噪声信号的初始能量为40焦耳,且噪声信号的能量谱位于40焦耳到50焦耳之间,T2为2焦耳时,则本次唤醒外部家电模组时,第一分类表中的能量谱系数分为能量谱系数1位于40焦耳~42焦耳之间,能量谱系数2位于42焦耳~44焦耳之间,能量谱系数3位于44焦耳~46焦耳之间,能量谱系数4位于46焦耳~48焦耳之间,能量谱系数5位于48焦耳~50焦耳之间,能量谱系数一共有五类。
实例性的,当噪声信号的初始能量为40焦耳,且噪声信号的能量谱位于40焦耳到50焦耳之间,T2为5焦耳时,则本次唤醒外部家电模组时,第一分类表中的能量谱系数分为能量谱系数1位于40焦耳~45焦耳之间,能量谱系数2位于45焦耳~50焦耳之间,能量谱系数一共有二类。
实例性的,当噪声信号的初始能量为40焦耳,且噪声信号的能量谱位于40焦耳到50焦耳之间,T2为8焦耳时,则本次唤醒外部家电模组时,第一分类表中的能量谱系数分为能量谱系数1位于40焦耳~48焦耳之间,能量谱系数2位于48焦耳~50焦耳之间,能量谱系数一共有二类。
综上所述,当T2设置为5焦耳时,能量谱系数的划分更为合理,避免了因T2设置小导致需要长时间的来划分能量谱系数,使得在进行能量谱系数划分时浪费了时间,降低了对噪声的处理速率;又可避免T2设置大导致划分不够精确,造成对噪声处理不彻底的现象发生。
可选的,所述能量谱位于35焦耳~100焦耳之间。
Q3:根据声压级和能量谱通过空间滤波算法计算得到噪声预测评估值。
根据噪声系数1与能量谱1通过空间滤波算法就可以得到噪声预测评估值1,根据噪声系数2与能量谱系数2通过空间滤波算法就可以得到噪声预测评估值2,根据噪声系数3与能量谱系数3通过空间滤波算法就可以得到噪声预测评估值3,……,以此类推。
Q4:根据噪声预测评估值选择相匹配的算法固件。
根据Q3步骤计算出噪声预测评估值后系统就可以自动的调用与之相匹配的算法固件。通过噪声预测评估值来选择算法固件会使得在处理不同种类的噪声时选择算法固件更加的准确。
可选的,将目标语音信号传输到外部家电模组,以控制外部家电模组的运行状态。对噪声信号用对应的算法固件进行处理后,就会通过USB/I2S等方式将信号传输到外部家电模组,如智能灯、智能风扇及空调等家电模组,家电模组在识别了目标语音信号之后,就会自动的实现开启、关闭以及开启或者关闭的程度。
图4是示出可以实现本发明的实施例的第一种远场拾音噪声处理装置的结构方框图。
根据本发明的另一个实施例,提供了一种远场拾音噪声处理装置2000,包括:
第一获取模块2100,用于获取噪声信号。
第二获取模块2200,用于获取噪声信号的声压级。
第一判断模块2300,用于根据声压级判断噪声信号在第一分类表中的类别。
第一选择模块2400,用于根据噪声系数选择相匹配的算法固件。
噪声处理模块2500,用于根据算法固件对噪声信号进行处理并得到目标语音信号。
如图4所示,在一个示例中,远场拾音噪声处理装置2000还包括有传输模块2600,用于将目标语音信号传输到外部家电模组,以控制外部家电模组的运行状态。
图5是示出可以实现本发明的实施例的第二种远场拾音噪声处理装置的结构方框图。
在一个示例中,远场拾音噪声处理装置3000还包括:
第三获取模块3100,用于获取噪声信号的能量谱。
第二判断模块3200,用于根据声压级和能量谱判断噪声信号在第二分类表中的类别。
计算模块3300,用于根据声压级和能量谱通过空间滤波算法计算得到噪声预测评估值。
第二选择模块3400,用于根据噪声预测评估值选择相匹配的算法固件。
根据本发明的再一个实施例,提供了一种电子设备,该电子设备100可以是图1所示的电子设备1000。图6为本发明实施例的电子设备的结构方框图。
一方面,电子设备100可以包括前述的远场拾音噪声处理装置,用于对应实施本发明任意实施例的远场拾音噪声处理方法。
另一方面,如图6所示,此电子设备100包括处理器104和存储器102(加编号),存储器用于存储可执行的指令,指令用于控制处理器执行前述的远场拾音噪声处理方法。
在本实施例中,电子设备100可以是手机、平板电脑、掌上电脑、台式机、笔记本电脑、工作站、游戏机等任意具有存储器102以及处理器104的电子产品。
根据本发明的又一个实施例,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序在被处理器执行时实现根据本发明任意实施例所述的远场拾音噪声处理方法。
本发明可以是系统、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于使处理器实现本发明的各个方面的计算机可读程序指令。
计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
用于执行本发明操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言—诸如Smalltalk、C++等,以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本发明的各个方面。
这里参照根据本发明实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本发明的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
附图中的流程图和框图显示了根据本发明的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。对于本领域技术人物来说公知的是,通过硬件方式实现、通过软件方式实现以及通过软件和硬件结合的方式实现都是等价的。
以上已经描述了本发明的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人物来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术改进,或者使本技术领域的其它普通技术人物能理解本文披露的各实施例。本发明的范围由所附权利要求来限定。
Claims (13)
1.一种远场拾音噪声处理方法,其特征在于,所述方法包括:
通过拾取外部声音获取噪声信号;
获取所述噪声信号的声压级;
根据所述声压级判断所述噪声信号在第一分类表中的类别,所述第一分类表包括不同种类的噪声系数;
根据所述噪声系数选择相匹配的算法固件对所述噪声信号进行处理并得到目标语音信号,
所述方法还包括:
获取所述噪声信号的能量谱;
根据所述声压级和所述能量谱判断所述噪声信号在第二分类表中的类别,所述第二分类表包括不同种类的噪声系数和不同种类的能量谱系数;
根据所述声压级和所述能量谱通过空间滤波算法计算得到噪声预测评估值;
根据所述噪声预测评估值选择相匹配的算法固件。
2.根据权利要求1所述的方法,其中,通过拾取外部声音获取噪声信号包括:
获取所述外部声音对应的语音信号;
判断所述语音信号是否为噪声信号;
若是则提取所述噪声信号。
3.根据权利要求1所述的方法,其中,还包括:
将所述目标语音信号传输到外部家电模组,以控制外部家电模组的运行状态。
4.根据权利要求1所述的方法,其中,所述噪声系数位于20分贝~90分贝之间。
5.根据权利要求1所述的方法,其中,所述不同种类的噪声系数通过以下步骤得到:
当所述噪声信号的初始声压级为S时,以第一间隔T1对所述噪声信号的声压级进行分类得到所述噪声信号的噪声系数N,所述噪声系数N位于S+(N-1)*T1~S+N*T1之间,其中N为整数且N≥1,2分贝≤T1≤8分贝。
6.根据权利要求5所述的方法,其中,所述T1为5分贝。
7.根据权利要求1所述的方法,其中,所述不同种类的能量谱系数通过以下步骤得到:
当所述噪声信号的初始能量为E时,以第二间隔T2对所述噪声信号的能量进行分类得到所述噪声信号的能量谱N,所述能量谱N位于E+(N-1)*T2~E+N*T2之间,其中N为整数且N≥1,2焦耳≤T2≤8焦耳。
8.根据权利要求7所述的方法,其中,所述T2为5焦耳。
9.根据权利要求1所述的方法,其中,所述能量谱位于35焦耳~100焦耳之间。
10.一种远场拾音噪声处理装置,其特征在于,所述装置包括:
第一获取模块,用于获取噪声信号;
第二获取模块,用于获取所述噪声信号的声压级;
第一判断模块,用于根据所述声压级判断所述噪声信号在第一分类表中的类别;
第一选择模块,用于根据所述噪声系数选择相匹配的算法固件;
噪声处理模块,用于根据所述算法固件对所述噪声信号进行处理并得到目标语音信号,
所述装置还包括:
第三获取模块,用于获取所述噪声信号的能量谱;
第二判断模块,用于根据所述声压级和所述能量谱判断所述噪声信号在第二分类表中的类别;
计算模块,用于根据所述声压级和所述能量谱通过空间滤波算法计算得到噪声预测评估值;
第二选择模块,用于根据噪声预测评估值选择相匹配的算法固件。
11.根据权利要求10所述的装置,其中,还包括:
传输模块,用于将所述目标语音信号传输到外部家电模组,以控制外部家电模组的运行状态。
12.一种电子设备,其特征在于,包括:
根据权利要求10或11所述的远场拾音噪声处理装置;或者,
处理器和存储器,所述存储器用于存储可执行的指令,所述指令用于控制所述处理器执行根据权利要求1至9中任一权利要求所述的远场拾音噪声处理方法。
13.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,所述计算机程序在被处理器执行实现根据权利要求1至9中任一权利要求所述的远场拾音噪声处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911033489.1A CN110782884B (zh) | 2019-10-28 | 2019-10-28 | 远场拾音噪声处理方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911033489.1A CN110782884B (zh) | 2019-10-28 | 2019-10-28 | 远场拾音噪声处理方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110782884A CN110782884A (zh) | 2020-02-11 |
CN110782884B true CN110782884B (zh) | 2022-04-15 |
Family
ID=69387107
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911033489.1A Active CN110782884B (zh) | 2019-10-28 | 2019-10-28 | 远场拾音噪声处理方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110782884B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113534681A (zh) * | 2020-04-15 | 2021-10-22 | 青岛海尔滚筒洗衣机有限公司 | 家用电器的参数配置方法、装置及设备 |
CN111696567B (zh) * | 2020-06-12 | 2022-04-01 | 思必驰科技股份有限公司 | 用于远场通话的噪声估计方法及系统 |
CN112562688A (zh) * | 2020-12-11 | 2021-03-26 | 天津讯飞极智科技有限公司 | 语音转写方法、装置、录音笔和存储介质 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2932332B1 (fr) * | 2008-06-04 | 2011-03-25 | Parrot | Systeme de controle automatique de gain applique a un signal audio en fonction du bruit ambiant |
US9601128B2 (en) * | 2013-02-20 | 2017-03-21 | Htc Corporation | Communication apparatus and voice processing method therefor |
CN103325378A (zh) * | 2013-07-16 | 2013-09-25 | 珠海市魅族科技有限公司 | 一种终端语音降噪方法及终端 |
CN103871421B (zh) * | 2014-03-21 | 2018-02-02 | 厦门莱亚特医疗器械有限公司 | 一种基于子带噪声分析的自适应降噪方法与系统 |
CN105845151B (zh) * | 2016-05-30 | 2019-05-31 | 百度在线网络技术(北京)有限公司 | 应用于语音识别前端的音频增益调整方法和装置 |
CN105979415B (zh) * | 2016-05-30 | 2019-04-12 | 歌尔股份有限公司 | 一种自适应调节降噪增益的降噪方法、装置及降噪耳机 |
CN106448696A (zh) * | 2016-12-20 | 2017-02-22 | 成都启英泰伦科技有限公司 | 一种基于背景噪声估计自适应高通滤波语音降噪方法 |
CN109068213B (zh) * | 2018-08-09 | 2020-06-26 | 歌尔科技有限公司 | 一种耳机响度控制方法和装置 |
-
2019
- 2019-10-28 CN CN201911033489.1A patent/CN110782884B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN110782884A (zh) | 2020-02-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110782884B (zh) | 远场拾音噪声处理方法、装置、设备及存储介质 | |
EP3340243B1 (en) | Method for performing voice control on device with microphone array, and device thereof | |
JP6489563B2 (ja) | 音量調節方法、システム、デバイス及びプログラム | |
US9729984B2 (en) | Dynamic calibration of an audio system | |
WO2016180100A1 (zh) | 一种音频处理的性能提升方法及装置 | |
CN107393548B (zh) | 多个语音助手设备采集的语音信息的处理方法及装置 | |
KR20160001965A (ko) | 음성 명령어 제공 방법 및 이를 지원하는 전자 장치 | |
CN104506702A (zh) | 一种音量调节方法 | |
CN109756818B (zh) | 双麦克风降噪方法、装置、存储介质及电子设备 | |
CN105120063A (zh) | 一种输入语音的音量提示方法及电子设备 | |
CN112687286A (zh) | 音频设备的降噪模型的调整方法和装置 | |
CN105027540A (zh) | 回波抑制 | |
CN109361994A (zh) | 扬声器控制方法、移动终端及计算机可读存储介质 | |
CN110136733B (zh) | 一种音频信号的解混响方法和装置 | |
CN104486483A (zh) | 一种终端 | |
CN107452399B (zh) | 音频特征提取方法及装置 | |
CN115810356A (zh) | 语音控制方法、装置、存储介质以及电子设备 | |
CN108270925B (zh) | 语音信息的处理方法、装置、终端和计算机可读存储介质 | |
US11164591B2 (en) | Speech enhancement method and apparatus | |
CN107948854B (zh) | 一种操作音频生成方法、装置、终端及计算机可读介质 | |
WO2021169585A1 (zh) | 局域网环境下设备间的仲裁方法、电子设备、局域网系统 | |
CN104464746A (zh) | 语音滤波方法、装置以及电子设备 | |
US20170206898A1 (en) | Systems and methods for assisting automatic speech recognition | |
CN117809668A (zh) | 电子设备及电子设备的语音信号处理方法 | |
CN111933170B (zh) | 语音信号的处理方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20200603 Address after: 261061 building 10, Geer phase II Industrial Park, No. 102, Ronghua Road, Ronghua community, Xincheng street, high tech Zone, Weifang City, Shandong Province Applicant after: Weifang goer Microelectronics Co.,Ltd. Address before: 261031 Dongfang Road, Weifang high tech Development Zone, Shandong, China, No. 268 Applicant before: GOERTEK Inc. |
|
TA01 | Transfer of patent application right | ||
GR01 | Patent grant | ||
GR01 | Patent grant |