CN108305614A - 一种语音处理方法及装置 - Google Patents
一种语音处理方法及装置 Download PDFInfo
- Publication number
- CN108305614A CN108305614A CN201710020444.5A CN201710020444A CN108305614A CN 108305614 A CN108305614 A CN 108305614A CN 201710020444 A CN201710020444 A CN 201710020444A CN 108305614 A CN108305614 A CN 108305614A
- Authority
- CN
- China
- Prior art keywords
- voice signal
- pending
- signal
- denoising
- amplitude
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 57
- 230000006870 function Effects 0.000 claims description 33
- 238000001914 filtration Methods 0.000 claims description 17
- 238000006243 chemical reaction Methods 0.000 claims description 7
- 230000005236 sound signal Effects 0.000 claims description 5
- 238000012512 characterization method Methods 0.000 claims description 4
- 230000008569 process Effects 0.000 description 14
- 238000010586 diagram Methods 0.000 description 12
- 238000004590 computer program Methods 0.000 description 7
- 230000003321 amplification Effects 0.000 description 6
- 238000003199 nucleic acid amplification method Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 3
- 230000002452 interceptive effect Effects 0.000 description 3
- 239000002699 waste material Substances 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 235000013399 edible fruits Nutrition 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000003860 storage Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000005303 weighing Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Telephone Function (AREA)
Abstract
本发明实施例公开了一种语音处理方法,所述方法包括:获得待处理语音信号;基于所述待处理语音信号,获取用于表征用户语音信号的特性参数;通过由所述特性参数生成的用于去噪的滤波函数,对所述待处理语音信号进行处理,获得去噪后的语音信号。本发明实施例同时公开了一种语音处理装置。
Description
技术领域
本发明涉及语音识别领域,尤其涉及一种语音处理方法及装置。
背景技术
智能语音交互是基于语音输入的新一代交互模式,通过说话就可以得到反馈结果。衡量语音交互的最重要的一个性能指标,就是语音识别的准确率。
在现有技术中,移动终端会直接将所获得的用户语音信号送入语音识别模块进行识别,但是,由于移动终端所获得的用户语音信号的质量往往比较差,如果直接对该用户语音信号进行语音识别,容易出现识别不准确,甚至识别失败的问题。
所以,现有技术中存在语音信号的质量较差所导致的语音识别准确率较低的技术问题。
发明内容
有鉴于此,本发明实施例期望提供一种语音处理方法及装置,以在语音识别过程中,实现改善语音信号的质量,提高语音识别准确率,提供良好的用户体验。
为达到上述目的,本发明的技术方案是这样实现的:
第一方面,本发明实施例提供一种语音处理方法,包括:获得待处理语音信号;基于所述待处理语音信号,获取用于表征用户语音信号的特性参数;通过由所述特性参数生成的用于去噪的滤波函数,对所述待处理语音信号进行处理,获得去噪后的语音信号。
第二方面,本发明实施例提供一种语音处理装置,包括:获得模块、获取模块以及处理模块,其中,所述获得模块,用于获得待处理语音信号;所述获取模块,用于基于所述待处理语音信号,获取用于表征用户语音信号的特性参数;所述处理模块,用于通过由所述特性参数生成的用于去噪的滤波函数,对所述待处理语音信号进行处理,获得去噪后的语音信号。
本发明实施例提供了一种语音处理方法及装置,在获得待处理语音信号之后,会基于待处理语音信号,获取用于表征用户语音信号的特性参数,然后通过由特性参数生成的用于去噪的滤波函数,对待处理语音信号进行处理,获得去噪后的语音信号。这样,通过本发明实施例提供的语音处理方法,就可以过滤掉语音信号中的噪声信号,改善语音信号的质量。从而,可以实现提高语音识别的准确率,进而提供了良好的用户体验。
附图说明
图1为本发明实施例一中的语音处理方法的流程示意图;
图2为本发明实施例二中的语音处理方法应用于语音识别过程的方法流程示意图;
图3为本发明实施例三中的语音处理装置的一种结构示意图;
图4为本发明实施例三中的语音处理装置的另一种结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。
实施例一
本实施例提供一种语音处理方法,在实际应用中,该方法可以应用于终端语音业务应用中的各种需要语音处理的场合,如移动终端中的语音助手类产品、社交类产品、智能家居类产品等。示例性地,用户可以通过语音助手软件来使用语音控制终端进行各种操作,如播放音乐、拨打电话等,用户也可以在社交软件中将语音转化为文本文字,用户还可以通过智能家居软件使用语音转换家居用品的功能,如打开照明用品、关闭音响设备等,当然,还可以有其他的应用场景,这里,本发明实施例不做具体限定。
那么,图1为本发明实施例一中的语音处理方法的流程示意图,参见图1所示,该语音处理方法包括:
S101:获得待处理语音信号;
具体地,当用户在使用移动终端上的语音业务应用时,移动终端会通过音频设备或录音设备,如麦克风等,来获取用户的语音内容,生成待处理语音信号。这样,就获得了待处理语音信号。这里,待处理语音信号可能是用户语音信号与各种噪声信号叠加形成的混合语音信号,也可能是不含有噪声的用户语音信号。
S102:基于待处理语音信号,获取用于表征用户语音信号的特性参数;
这里,该特性参数为用户语音信号所独有的物理特性,能够使得待处理语音信号中用户语音信号可以区别于干扰噪声信号,可以用来生成用于去噪的滤波函数。那么,为了过滤待处理语音信号中的噪声,移动终端可以在获得了待处理语音信号后,获取能够表征用户语音信号的特性参数,以便进一步地对待处理语音信号进行滤波处理,获得最终所需的去噪后的语音信号。
在具体实施过程中,S102可以包括:按照预设策略对待处理语音信号进行预处理,获得处理后的语音信号;对处理后的语音信号进行时域到频域的转换,获得处理后的语音信号对应的频域信号;计算频域信号的中心频率。
具体地,为了获取表征用户语音信号的特性参数,移动终端在获得了待处理语音信号后,就可以先按照预设策略对该待处理语音信号进行预处理,获得了处理后的语音信号。然后,移动终端可以采用时频域转换方法,来将处理后的语音信号从时域转换到频域,从而,获得该处理后的语音信号对应的频域信号,最后,可以计算该频域信号的中心频率,进而,使用中心频率作为特性参数。这里,中心频率是使得待处理语音信号中的真实的用户语音信号有别于待处理语音信号中的噪声信号的一个特性参数,可以用来生成滤波函数。当然,本领域技术人员在具体实施时,还可以使用其他频域特征作为特性参数,这里,本发明实施例不做具体限定。
需要说明的是,将语音信号从时域转换频域的方法,可以由本领域技术人员在具体实施时,根据语音信号的不同类型来进行选取,这里,本发明实施例不做具体限定。示例性地,当语音信号为非周期性连续信号时,可以采用傅里叶变换(Fourier Transform)的方法;当语音信号为非周期性离散信号时,可以采用离散时域傅里叶变换(Discrete TimeFourier Transform)的方法;当语音信号为周期性离散信号时,可以采用离散傅里叶变换(Discrete Fourier Transform)的方法等。
在实际应用中,由于移动终端在获取待处理语音信号时,用户的发声器(通常为嘴巴)往往与音频设备或者录音设备相距较近,从而,待处理语音信号中包含的真实的用户语音信号的幅度就会大于待处理语音信号中包含的各种噪声形成的干扰信号的幅度。也就是说,待处理语音信号中的高幅语音信号中包含着真实的用户语音信号所特有的特性参数。这样,为了获取用户真实的语音,可以先提取待处理语音信息号中的高幅部分,然后基于高幅部分来获取用户语音信号的特性参数,以便去除待处理语音信号中夹杂的噪声。
这样,上述预设策略可以为设置预设幅度门限值的方式来对待处理语音信号进行预处理,提取待处理语音信号中的高幅部分,当然,上述预设策略还可以通过其他方式,如采用信号处理算法提取高幅部分,这里,本发明实施例不做具体限定。
那么,在具体实施过程中,按照预设策略对待处理语音信号进行预处理,获得处理后的语音信号,就可以包括:获取待处理语音信号的幅度;将待处理语音信号的幅度与预设幅度门限值进行比较,获取待处理语音信号中幅度大于预设幅度门限值的高幅信号。
具体地,预设幅度门限值可以是按照一定的策略计算获得,也可以是根据经验进行选取,当然,还可以是通过其他方式来确定。由本领域技术人员在具体实施时根据实际情况来确定,本发明实施例不做具体限定。
示例性地,移动终端可以先通过检测待处理语音信号的幅度包络的方法,来获得待处理语音信号的幅度;然后可以选取一定时间间隔内的待处理语音信号来计算幅度的均值,并将该均值作为预设幅度门限值;最后,将待处理语音信号的幅度与此预设幅度门限值进行比较,根据比较结果,过滤掉待处理语音信号中幅度不大于该预设幅度门限值的那部分低幅语音信号,获取待处理语音信号中幅度大于预设幅度门限值的那部分高幅语音信号。这样,移动终端就可以获得高幅信号。
在本发明的另一实施例中,为了有效利用系统资源、避免系统资源浪费,S102还可以包括:确定待处理语音信号的信噪比是否小于预设阈值;在确定待处理语音信号的信噪比小于预设阈值后,基于待处理语音信号,获取用于表征用户语音信号的特性参数。
在实际应用中,由于待处理语音信号是真实的用户语音信号与各种噪声信号叠加后而形成的混合信号,因此,当混合信号中的噪声信号较多时,如果对该待处理语音信号进行语音识别,噪声信号对语音识别的准确率影响较大,此时,如果不获取表征用户语音信号的特性参数,来去除待处理语音信号中的噪声信号的话,语音识别的准确率会很低;但是,当混合信号中的噪声信号较少时,如果对该待处理语音信号进行语音识别,噪声信号对语音识别的准确率影响较小,能够获得较好的语音识别准确率。此时,就不需要获取表征用户语音信号的特性参数,来去除待处理语音信号中的噪声信号。因此,为了有效利用系统资源、避免系统资源浪费并对待处理语音信号进行更好的处理,移动终端可以在对待处理语音信号进行去噪处理之前,先判断该待处理语音数据是否需要进行处理。具体地,移动终端可以通过对待处理语音信号的信噪比设定预设阈值的方式来进行判断。
因此,在具体实施过程中,移动终端在获取用于表征用户语音信号的特性参数之前,还需要先确定待处理语音信号的信噪比是否小于预设阈值;如果确定待处理语音信号的信噪比小于预设阈值,再基于待处理语音信号,获取用于表征用户语音信号的特性参数。这里,预设阈值可以由本领域技术人员在具体实施过程中根据实际情况进行调试设定,或者,也可以根据经验来设定。
S103:通过由特性参数生成的用于去噪的滤波函数,对待处理语音信号进行处理,获得去噪后的语音信号。
这里,在获得了可以表征待处理语音信号中用户语音信号的特性参数后,就可以利用由该特性参数生成的用于去噪的滤波函数对待处理语音信号进行去噪处理,从而,获得去噪后的语音信号。
在具体实施过程中,可以先根据特性参数来生成滤波函数,然后通过该滤波函数对待处理语音信号进行滤波,过滤掉待处理语音信号中包含的噪声信号,最后,就可以获得去噪后的语音信号。
示例性地,S103可以包括:根据中心频率生成带通滤波函数;通过带通滤波函数对待处理语音信号进行滤波,获得去噪后的语音信号。
在实际应用中,当移动终端获得的特性参数为中心频率时,可以根据该中心频率生成带通滤波函数,然后通过带通滤波函数对待处理语音信号进行滤波,过滤掉待处理语音信号中包含的噪声信号,获取待处理语音信号中包含的真实的用户语音信号,这样,移动终端就获得了去噪后的语音信号。
具体地,在通过带通滤波函数实现对待处理语音信号的滤波时,可以直接采用软件的方式实现该带通滤波函数,从而形成一数字带通滤波器,也可以采用硬件的方式根据该滤波函数的参数,调试实体的模拟带通滤波器的参数,进而达到滤波的效果。
在实际应用中,带通滤波器能够能通过某一频率范围内的信号,屏蔽或抑制其他频率范围的信号。在本发明实施例中,通过计算所获得的中心频率虽然在一定程度上能够表征真实的用户语音信号的特性,但是还是有一定的差异。因此,在实现带通滤波器时,还需要考虑能够容忍的差异程度。这里,能够容忍的差异程度是由带通滤波器的带宽来决定。也就是说,在实现带通滤波器时,还需要设定带宽。示例性地,当设定带通滤波器的中心频率为2kHz、带宽为200Hz时,该带通滤波器能够容忍的差异度就是-100Hz到+100Hz之间,允许通过1.9kHz至2.1kHz频率范围之间的信号。在具体实施过程中,本领域技术人员可以根据实际情况来设定带宽,如设定为经验值或者实验值等,这里,本发明实施例不做具体限定。
在本发明的另一实施例中,为了达到更好的识别效果,在移动终端获得了去噪的语音信号后,上述语音处理方法还包括:计算去噪后的语音信号的功率;判断去噪后的语音信号的功率是否小于预设信号功率门限值;如果去噪后的语音信号的功率小于预设信号功率门限值,按照预设调整策略,增大去噪后的语音信号的功率。
在实际应用中,由于去噪后的语音信号的功率过小会影响语音识别率,使得语音识别的准确率变低,甚至可能导致可能识别不出准确的信息。因此,为了达到更好的识别效果,移动终端就需要在确定去噪后的语音信号的功率较小时,对去噪后的语音信号进行功率调整,增大去噪后的语音信号的功率,使得对其进行语音识别时,可以获得更高的准确率。这样,就可以在获得去噪后的语音信号后,计算该去噪后的语音信号的功率,再通过与预设信号功率门限值进行比较的方式,来判断是否需要进一步地处理。
具体地,移动终端在获得去噪后的语音信号之后,可以先计算去噪后的语音信号的功率,然后,判断去噪后的语音信号的功率是否小于预设信号功率门限值,最后,当去噪后的语音信号的功率小于预设信号功率门限值时,就可以按照预设调整策略来增大去噪后的语音信号的功率。这样,移动终端就可以获得适合进行语音识别的来自用户的语音信号。
在实际应用中,在确定去噪后的语音信号的功率小于预设信号功率门限值后,可以根据去噪后的语音信号的功率与预设信号功率门限值,来确定功率放大倍数即信号增益,如可以利用预设的功率差值信号增益映射表来获得所需的功率放大倍数,也可以采用线性公式来确定所需的功率放大倍数,如k=1+a/(a-b),其中,k为功率放大倍数,a为去噪后的语音信号的功率,b为预设信号功率门限值,a-b为去噪后的语音信号的功率与预设信号功率门限值之间的差值。当然,还可以通过其他方式来确定出功率放大倍数,由本领域技术人员在具体实施时根据实际情况来决定,这里,本发明实施例不做具体限定。从而,在移动终端获得放大器的功率放大倍数后,就可以通过放大器来增大去噪后的语音信号的功率。
至此,便完成了对语音信号的处理。
由上述内容可知,本发明实施例提供的技术方案,在获得待处理语音数据后,先基于待处理语音信号,获取用于表征用户语音信号的特性参数,然后通过特性参数生成的用于去噪的滤波函数,对待处理语音信号进行处理,获得去噪后的语音信号。这样,通过本发明实施例提供的语音处理方法,可以将所获得的待处理语音信号中包含的噪声信号过滤掉,只保留有用的用户语音信号。从而,改善了语音信号的质量。进而,通过对所获得的去噪后的语音信号进行语音识别时,就可以提高语音识别的准确率,并提供良好的用户体验。
实施例二
下面结合上述实施例,以移动终端上的一种语音助手类产品为例,对应用有本发明实施例提供的语音处理方法的语音识别过程进行详细说明。
这里,其使用的场景为公共场合,如车站、马路等。
那么,图2为本发明实施例二中的语音处理方法应用于语音识别过程的方法流程示意图,参见图2所示,该方法包括:
S201:获得待处理语音信号;
S202:确定待处理语音信号的信噪比是否小于预设阈值;
其中,如果确定待处理语音信号的信噪比小于预设阈值,执行S203,否则,执行S212。具体地,为了有效利用系统资源、避免系统资源浪费并对待处理语音信号进行更好的处理,移动终端可以在对待处理语音信号进行去噪处理之前,先判断该待处理语音信号是否需要进行去噪处理。因此,如果确定待处理语音信号的信噪比小于预设阈值,表明需要改善待处理语音信号的质量,不能直接对获取到的待处理语音信号进行语音识别,此时,就需要执行S203,开始对待处理语音信号进行改善语音信号质量的处理;否则,表明不需要改善待处理语音信号的质量,此时,不需要对待处理语音信号进行改善语音信号质量的处理,可以执行S212,直接对获得的待处理语音信号进行语音识别。
这里,预设阈值可以由本领域技术人员在具体实施过程中根据实际情况进行调试设定,或者,也可以根据经验来设定,本发明实施例不做具体限定。
S203:获取待处理语音信号的幅度;
S204:将待处理语音信号的幅度与预设幅度门限值进行比较,获取待处理语音信号中幅度大于预设幅度门限值的高幅信号;
S205:对高幅信号进行时域到频域的转换,获得高幅信号对应的频域信号;
S206:计算频域信号的中心频率;
这里,中心频率可以表征用户语音信号,是使得待处理语音信号中的真实的用户语音信号有别于待处理语音信号中的噪声信号的一个特性参数,可以用来生成带通滤波函数,并过滤待处理语音信号中的噪声信号。
S207:根据中心频率生成带通滤波函数;
S208:通过带通滤波函数对待处理语音信号进行滤波,过滤待处理语音信号中的噪声信号,获得去噪后的语音信号;
S209:计算去噪后的语音信号的功率;
S210:判断去噪后的语音信号的功率是否小于预设信号功率门限值;
其中,如果确定去噪后的语音信号的功率小于预设信号功率门限值,执行S211,否则,执行S212。
S211:按照预设调整策略,增大去噪后的语音信号的功率;
S212:对去噪后的语音信号进行语音识别,获得对应的信息。
这里,该信息是移动终端可识别的数据,进而移动终端可根据该信息进行相关的操作,比如在显示屏上显示出文字、控制音乐软件播放指定音乐等。
至此,便完成了一次语音识别过程。
由上述内容可知,通过本发明实施例提供的语音处理方法,可以过滤掉噪声,改善语音信号的质量。从而,可以实现提高语音识别的准确率,进而提供了良好的用户体验。
实施例三
基于同一发明构思,本实施例还提供一种语音处理装置。图3为本发明实施例三中的语音处理装置的结构示意图,参见图3所示,该语音处理装置30包括:获得模块301、获取模块302以及处理模块303;其中,获得模块301,用于获得待处理语音信号;获取模块302,用于基于待处理语音信号,获取用于表征用户语音信号的特性参数;处理模块303,用于通过特性参数生成的用于去噪的滤波函数,对待处理语音信号进行处理,获得去噪后的语音信号。
进一步地,获取模块,还用于按照预设策略对待处理语音信号进行预处理,获得处理后的语音信号;对处理后的语音信号进行时域到频域的转换,获得处理后的语音信号对应的频域信号;计算频域信号的中心频率。
进一步地,获取模块,还用于获取待处理语音信号的幅度;将待处理语音信号的幅度与预设幅度门限值进行比较,获取待处理语音信号中幅度大于预设幅度门限值的高幅信号。
进一步地,获取模块,还用于检测待处理语音信号的幅度包络,获得待处理语音信号的幅度;
进一步地,处理模块,还用于根据中心频率生成带通滤波函数;通过带通滤波函数对待处理语音信号进行滤波,获得去噪后的语音信号。
进一步地,获取模块,还用于确定待处理语音信号的信噪比是否小于预设阈值;在确定待处理语音信号的信噪比小于预设阈值后,基于待处理语音信号,提取用户语音信号的特性参数。
进一步地,参见图4所示,该语音处理装置30还包括:功率放大模块401,用于计算去噪后的语音信号的功率;判断去噪后的语音信号的功率是否小于预设信号功率门限值;如果去噪后的语音信号的功率小于预设信号功率门限值,按照预设调整策略,增大去噪后的语音信号的功率。
在实际应用中,上述获得模块可以由声卡等音频设备实现,上述获取模块、处理模块以及功率放大模块可以由语音处理器来实现,当然,还可以由其他方式来实现,这里,本发明实施例不做具体限定。
这里需要指出的是:以上语音处理装置实施例的描述,与上述语音处理方法实施例的描述是类似的,具有同方法实施例相似的有益效果,因此不做赘述。对于本发明装置实施例中未披露的技术细节,请参照本发明方法实施例中的描述而理解,为节约篇幅,因此不再赘述。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。
Claims (11)
1.一种语音处理方法,其特征在于,所述方法包括:
获得待处理语音信号;
基于所述待处理语音信号,获取用于表征用户语音信号的特性参数;
通过由所述特性参数生成的用于去噪的滤波函数,对所述待处理语音信号进行处理,获得去噪后的语音信号。
2.根据权利要求1所述的方法,其特征在于,所述基于所述待处理语音信号,获取用于表征用户语音信号的特性参数,包括:
按照预设策略对所述待处理语音信号进行预处理,获得处理后的语音信号;
对所述处理后的语音信号进行时域到频域的转换,获得所述处理后的语音信号对应的频域信号;
计算所述频域信号的中心频率。
3.根据权利要求2所述的方法,其特征在于,所述按照预设策略对所述待处理语音信号进行预处理,获得处理后的语音信号,包括:
获取所述待处理语音信号的幅度;
将所述待处理语音信号的幅度与预设幅度门限值进行比较,获取所述待处理语音信号中幅度大于所述预设幅度门限值的高幅信号。
4.根据权利要求3所述的方法,其特征在于,所述获取所述待处理语音信号的幅度,包括:
检测所述待处理语音信号的幅度包络,获得所述待处理语音信号的幅度。
5.根据权利要求2所述的方法,其特征在于,所述通过由所述特性参数生成的用于去噪的滤波函数,对所述待处理语音信号进行处理,获得去噪后的语音信号,包括:
根据所述中心频率生成带通滤波函数;
通过所述带通滤波函数对所述待处理语音信号进行滤波,获得去噪后的语音信号。
6.根据权利要求1所述的方法,其特征在于,所述基于所述待处理语音信号,获取用于表征用户语音信号的特性参数,包括:
确定所述待处理语音信号的信噪比是否小于预设阈值;
在确定所述待处理语音信号的信噪比小于预设阈值后,基于所述待处理语音信号,获取用于表征用户语音信号的特性参数。
7.根据权利要求1所述的方法,其特征在于,在所述获得去噪后的语音信号之后,所述方法还包括:
计算所述去噪后的语音信号的功率;
判断所述去噪后的语音信号的功率是否小于预设信号功率门限值;
如果所述去噪后的语音信号的功率小于所述预设信号功率门限值,按照预设调整策略,增大所述去噪后的语音信号的功率。
8.一种语音处理装置,其特征在于,所述装置包括:获得模块、获取模块以及处理模块,其中,
所述获得模块,用于获得待处理语音信号;
所述获取模块,用于基于所述待处理语音信号,获取用于表征用户语音信号的特性参数;
所述处理模块,用于通过由所述特性参数生成的用于去噪的滤波函数,对所述待处理语音信号进行处理,获得去噪后的语音信号。
9.根据权利要求8所述的装置,其特征在于,所述获取模块,还用于按照预设策略对所述待处理语音信号进行预处理,获得处理后的语音信号;对所述处理后的语音信号进行时域到频域的转换,获得所述处理后的语音信号对应的频域信号;计算所述频域信号的中心频率。
10.根据权利要求9所述的装置,其特征在于,所述获取模块,还用于获取所述待处理语音信号的幅度;将所述待处理语音信号的幅度与预设幅度门限值进行比较,获取所述待处理语音信号中幅度大于所述预设幅度门限值的高幅信号。
11.根据权利要求9所述的装置,其特征在于,所述处理模块,还用于根据所述中心频率生成带通滤波函数;通过所述带通滤波函数对所述待处理语音信号进行滤波,获得去噪后的语音信号。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710020444.5A CN108305614A (zh) | 2017-01-11 | 2017-01-11 | 一种语音处理方法及装置 |
PCT/CN2017/087599 WO2018129854A1 (zh) | 2017-01-11 | 2017-06-08 | 一种语音处理方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710020444.5A CN108305614A (zh) | 2017-01-11 | 2017-01-11 | 一种语音处理方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108305614A true CN108305614A (zh) | 2018-07-20 |
Family
ID=62839719
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710020444.5A Pending CN108305614A (zh) | 2017-01-11 | 2017-01-11 | 一种语音处理方法及装置 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN108305614A (zh) |
WO (1) | WO2018129854A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108922558A (zh) * | 2018-08-20 | 2018-11-30 | 广东小天才科技有限公司 | 一种语音处理方法、语音处理装置及移动终端 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150294667A1 (en) * | 2014-04-09 | 2015-10-15 | Electronics And Telecommunications Research Institute | Noise cancellation apparatus and method |
CN105741847A (zh) * | 2012-05-14 | 2016-07-06 | 宏达国际电子股份有限公司 | 噪声消除方法 |
CN105976810A (zh) * | 2016-04-28 | 2016-09-28 | Tcl集团股份有限公司 | 一种检测语音有效话语段端点的方法和装置 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006033131A (ja) * | 2004-07-13 | 2006-02-02 | Matsushita Electric Ind Co Ltd | フィルタ自動調整回路 |
JP2011019049A (ja) * | 2009-07-08 | 2011-01-27 | Kenwood Corp | ノイズスケルチ回路 |
CN103745729B (zh) * | 2013-12-16 | 2017-01-04 | 深圳百科信息技术有限公司 | 一种音频去噪方法和系统 |
CN104064196B (zh) * | 2014-06-20 | 2017-08-01 | 哈尔滨工业大学深圳研究生院 | 一种基于语音前端噪声消除的提高语音识别准确率的方法 |
-
2017
- 2017-01-11 CN CN201710020444.5A patent/CN108305614A/zh active Pending
- 2017-06-08 WO PCT/CN2017/087599 patent/WO2018129854A1/zh active Application Filing
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105741847A (zh) * | 2012-05-14 | 2016-07-06 | 宏达国际电子股份有限公司 | 噪声消除方法 |
US20150294667A1 (en) * | 2014-04-09 | 2015-10-15 | Electronics And Telecommunications Research Institute | Noise cancellation apparatus and method |
CN105976810A (zh) * | 2016-04-28 | 2016-09-28 | Tcl集团股份有限公司 | 一种检测语音有效话语段端点的方法和装置 |
Non-Patent Citations (1)
Title |
---|
肖蓉: "FIR数字带通滤波器语音去噪的DSP实现研究", 《硅谷》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108922558A (zh) * | 2018-08-20 | 2018-11-30 | 广东小天才科技有限公司 | 一种语音处理方法、语音处理装置及移动终端 |
CN108922558B (zh) * | 2018-08-20 | 2020-11-27 | 广东小天才科技有限公司 | 一种语音处理方法、语音处理装置及移动终端 |
Also Published As
Publication number | Publication date |
---|---|
WO2018129854A1 (zh) | 2018-07-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9570072B2 (en) | System and method for noise reduction in processing speech signals by targeting speech and disregarding noise | |
US11062708B2 (en) | Method and apparatus for dialoguing based on a mood of a user | |
JP2010154092A (ja) | 雑音検出装置及び雑音検出方法 | |
US9185506B1 (en) | Comfort noise generation based on noise estimation | |
CN105405441B (zh) | 一种语音信息的反馈方法及装置 | |
CN108269578A (zh) | 用于处理信息的方法和装置 | |
CN111796790B (zh) | 一种音效调节方法、装置、可读存储介质及终端设备 | |
CN109376363A (zh) | 一种基于耳机的实时语音翻译方法及装置 | |
JP2015166764A (ja) | 音声処理装置、雑音抑圧方法、およびプログラム | |
CN105741854A (zh) | 一种语音信号的处理方法及终端 | |
CN112309414B (zh) | 基于音频编解码的主动降噪方法、耳机及电子设备 | |
CN110718238B (zh) | 串音数据检测方法、客户端和电子设备 | |
CN107481727A (zh) | 一种基于电音基调控制的音频信号处理方法及系统 | |
JP2023536104A (ja) | 機械学習を用いたノイズ削減 | |
CN105764008B (zh) | 一种调试扩声系统传输频率特性的方法及装置 | |
CN107969164B (zh) | 适应性信道间判别再缩放滤波器 | |
CN108305614A (zh) | 一种语音处理方法及装置 | |
CN103730117A (zh) | 一种自适应智能语音装置及方法 | |
CN104899000B (zh) | 一种信息处理方法及电子设备 | |
JP2017525292A (ja) | 入力音声信号を操作するための装置および方法 | |
CN106648525A (zh) | 一种音频信号的自动增益控制方法和装置 | |
CN114299982A (zh) | 处理音频信号的方法、装置及电子设备 | |
KR20150107520A (ko) | 음성인식 방법 및 장치 | |
CN110022514B (zh) | 音频信号的降噪方法、装置、系统及计算机存储介质 | |
CN105374363B (zh) | 音频信号编码方法和系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20180720 |
|
WD01 | Invention patent application deemed withdrawn after publication |