CN108922558B - 一种语音处理方法、语音处理装置及移动终端 - Google Patents
一种语音处理方法、语音处理装置及移动终端 Download PDFInfo
- Publication number
- CN108922558B CN108922558B CN201810948350.9A CN201810948350A CN108922558B CN 108922558 B CN108922558 B CN 108922558B CN 201810948350 A CN201810948350 A CN 201810948350A CN 108922558 B CN108922558 B CN 108922558B
- Authority
- CN
- China
- Prior art keywords
- frequency band
- preset
- signal
- frequency
- spectrum
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012545 processing Methods 0.000 title claims abstract description 32
- 238000003672 processing method Methods 0.000 title claims abstract description 22
- 238000001228 spectrum Methods 0.000 claims abstract description 171
- 238000000034 method Methods 0.000 claims abstract description 24
- 238000004590 computer program Methods 0.000 claims description 21
- 230000003247 decreasing effect Effects 0.000 claims description 14
- 230000009466 transformation Effects 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 claims description 2
- 238000012958 reprocessing Methods 0.000 claims description 2
- 230000003595 spectral effect Effects 0.000 claims 2
- 238000004891 communication Methods 0.000 abstract description 4
- 230000006870 function Effects 0.000 description 8
- 230000008569 process Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000007667 floating Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0324—Details of processing therefor
- G10L21/034—Automatic adjustment
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Telephone Function (AREA)
- Mobile Radio Communication Systems (AREA)
Abstract
本申请提供了一种语音处理方法、语音处理装置及移动终端,所述方法包括:接收待处理的语音信号;对所述语音信号进行傅里叶变换,得到所述语音信号的频谱;提高所述频谱中预设频段的信号幅度,并降低所述频谱中除所述预设频段之外的频段的信号幅度,得到处理后的频谱,其中,所述预设频段为覆盖人声频率范围的频段;对所述处理后的频谱进行傅里叶反变换,得到处理后的语音信号。本申请所提供的技术方案,可以解决在用户在接打电话时,若对方处于嘈杂的环境中,使得用户接听到的语音中包含大量的噪声的技术问题,能够提高通话质量。
Description
技术领域
本申请属于语音处理技术领域,尤其涉及一种语音处理方法、语音处理装置、移动终端及计算机可读存储介质。
背景技术
移动终端(比如,手机、电话手表等)已成为当今社会最主流的通讯工具,用户经常使用移动终端接打电话。然而,若用户在接打电话时,对方处于嘈杂的环境中,会使得用户接听到的语音中包含大量的噪声,严重影响通话质量。
发明内容
有鉴于此,本申请提供了一种语音处理方法、语音处理装置、移动终端及计算机可读存储介质,可以解决在用户在接打电话时,若对方处于嘈杂的环境中,使得用户接听到的语音中包含大量的噪声的技术问题。
本申请第一方面提供了一种语音处理方法,包括:
接收待处理的语音信号;
对上述语音信号进行傅里叶变换,得到上述语音信号的频谱;
提高上述频谱中预设频段的信号幅度,并降低上述频谱中除上述预设频段之外的频段的信号幅度,得到处理后的频谱,其中,上述预设频段为覆盖人声频率范围的频段;
对上述处理后的频谱进行傅里叶反变换,得到处理后的语音信号。
本申请第二方面提供了一种语音处理装置,包括:
语音接收模块,用于接收待处理的语音信号;
频谱获取模块,用于对上述语音信号进行傅里叶变换,得到上述语音信号的频谱;
频谱处理模块,用于提高上述频谱中预设频段的信号幅度,并降低上述频谱中除上述预设频段之外的频段的信号幅度,得到处理后的频谱,其中,上述预设频段为覆盖人声频率范围的频段;
频谱反变换模块,用于对上述处理后的频谱进行傅里叶反变换,得到处理后的语音信号。
本申请第三方面提供了一种移动终端,包括存储器、处理器以及存储在上述存储器中并可在上述处理器上运行的计算机程序,上述处理器执行上述计算机程序时实现如上述第一方面方法的步骤。
本申请第四方面提供了一种计算机可读存储介质,上述计算机可读存储介质存储有计算机程序,上述计算机程序被处理器执行时实现如上述第一方面方法的步骤。
本申请第五方面提供了一种计算机程序产品,上述计算机程序产品包括计算机程序,上述计算机程序被一个或多个处理器执行时实现如上述第一方面方法的步骤。
由上可见,本申请提供了一种语音处理方法,首先,接收待处理的语音信号,并对该语音信号进行傅里叶变换,得到该语音信号的频谱;其次,提高该语音信号的频谱中预设频段的信号幅度,并降低该语音信号的频谱中除上述预设频段之外的频段的信号幅度,得到处理后的频谱,其中,上述预设频段为覆盖人声频率范围的频段,通常人说话时发出的声音的频率范围大致在82HZ~1100HZ之间,则上述预设频段为覆盖82HZ~1100HZ的频段,比如,上述预设频段可以为80HZ~1200HZ,或者为60HZ~1300HZ等等;最后,对上述处理后的频谱进行傅里叶反变换,得到处理后的语音信号。由此可见,处理后的语音信号的频谱相比于待处理的语音信号的频谱,在除预设频段之外的频段的信号幅度会降低,由于除预设频段之外的频段中的信号均为噪声,因此,本申请所提供的技术方案能够降低接收到的语音信号中的噪声,此外,本申请所提供的技术方案中,处理后的语音信号的频谱相比于待处理的语音信号的频谱,在预设频段的信号幅度也会有所增大,因此,会进一步增大处理后的语音信号的信噪比。综上所述,本申请所提供的技术方案,可以解决在用户在接打电话时,若对方处于嘈杂的环境中,使得用户接听到的语音中包含大量的噪声的技术问题,能够提高通话质量。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
图1是本申请实施例一提供的一种语音处理方法的实现流程示意图;
图2是本申请实施例一提供的一种频谱处理方法的实现流程示意图;
图3是本申请实施例一提供的另一种频谱处理方法的实现流程示意图;
图4是本申请实施例二提供的另一种语音处理方法的实现流程示意图;
图5是本申请实施例二提供的对各个预设子频段以及预设频段的信号能量计算示意图;
图6是本申请实施例三提供的一种语音处理装置的结构示意图;
图7是本申请实施例四提供的移动终端的结构示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。
本申请实施例提供的语音处理方法可以适用于移动终端,示例性地,上述移动终端包括但不限于:智能手机、平板电脑、学习机或智能穿戴设备等。
为了说明本申请上述的技术方案,下面通过具体实施例来进行说明。
实施例一
下面对本申请实施例一提供的一种语音处理方法进行描述,请参阅附图1,本申请实施例一中的语音处理方法包括:
在步骤S101中,接收待处理的语音信号;
在本申请实施例中,上述待处理的语音信号为用户在接打电话时,用户所使用的移动终端接收到的对方的语音信号。
在步骤S102中,对上述语音信号进行傅里叶变换,得到上述语音信号的频谱;
在移动终端通过步骤S101接收到对方的语音信号之后,对该语音信号进行傅里叶变换,得到该语音信号的频谱。其中,对该语音信号进行傅里叶变换的方法可以为:首先对该语音信号进行数字采样,将该语音信号转换为数字信号,然后对数字采样后的数字信号进行FFT(Fast Fourier Transformation,快速傅里叶变换),从而得到该语音信号的频谱。
在步骤S103中,提高上述频谱中预设频段的信号幅度,并降低上述频谱中除上述预设频段之外的频段的信号幅度,得到处理后的频谱,其中,上述预设频段为覆盖人声频率范围的频段;
通过步骤S102得到该语音信号的频谱之后,提高该频谱中预设频段的信号幅度,并降低该频谱中除上述预设频段之外的频段的信号幅度,通常人说话时发出的声音的频率范围大致在82HZ~1100HZ之间,则在本申请实施例中,若上述预设频段为80HZ~1100HZ,则在该步骤S103中,将上述语音信号在80~1100HZ之间的信号幅度进行相应地提高,并降低其余频段的信号幅度。
其中,在本申请实施例中,上述提高上述频谱中预设频段的信号幅度,并降低上述频谱中除上述预设频段之外的频段的信号幅度,得到处理后的频谱,可以如图2所示,包括步骤S201-S203:
在步骤S201中,根据上述语音信号的频谱,计算上述语音信号中上述预设频段的信号能量以及除上述预设频段之外的频段的信号能量;
在步骤S202中,判断上述预设频段的信号能量与除上述预设频段之外的频段的信号能量的比值是否小于预设能量比;
在步骤S203中,若小于上述预设能量比,则提高上述频谱中预设频段的信号幅度,并降低上述频谱中除上述预设频段之外的频段的信号幅度,得到处理后的频谱。
也即是在本申请实施例中,只有当上述预设频段的信号能量与除上述预设频段之外的频段的信号能量的比值比较小时,才对该语音信号的频谱进行处理,若上述预设频段的信号能量与除上述预设频段之外的频段的信号能量的比值大于上述预设能量比时,可以不对该语音信号进行处理,直接将步骤S101接收的待处理的语音信号作为处理后的语音信号。
此外,在本申请实施例中,上述提高上述频谱中预设频段的信号幅度,并降低上述频谱中除上述预设频段之外的频段的信号幅度,得到处理后的频谱,还可以如图3所示,包括步骤S301-S306:
在步骤S301中,根据上述语音信号的频谱,计算上述语音信号中上述预设频段的信号能量以及除上述预设频段之外的频段的信号能量;
在步骤S302中,判断上述预设频段的信号能量与除上述预设频段之外的频段的信号能量的比值是否小于预设能量比;
在步骤S303中,若小于上述预设能量比,则提高上述频谱中预设频段的信号幅度,并降低上述频谱中除上述预设频段之外的频段的信号幅度,得到处理后的频谱;
上述步骤S301-S303与上述步骤S201-S203执行方式完全相同,具体可参见对上述步骤S201-S203的描述。
在步骤S304中,判断当前处理后的频谱在预设频段的信号能量与除预设频段之外的频段的信号能量的比值是否小于预设能量比,若是,则执行步骤S305,否则,执行步骤S306;
在步骤S305中,提高当前处理后的频谱中预设频段的信号幅度,并降低当前处理后的频谱中除上述预设频段之外的频段的信号幅度,并返回执行步骤S304;
通过步骤S303获取到处理后的频谱之后,再次判断该处理后的频谱在预设频段的信号能量与在其他频段的信号能量的比值是否依然比较小,如果依然较小,则再次提高该处理后的频谱在预设频段的信号幅度,并降低该处理后的频段在其他频段的信号幅度,再次得到处理后的频谱,然后返回执行步骤S304,再次判断当前的处理后的频谱在预设频段的信号能量与在其他频段的信号能量的比值是否满足要求。
在步骤S306中,将当前处理后的频谱作为最终处理后的频谱。
若步骤S304判断出当前的处理后的频谱在预设频段的信号能量与在其他频段的信号能量的比值大于或等于预设能量比,则认为当前处理后的频谱满足要求,将当前处理后的频谱作为最终处理后的频谱。
其中,在本申请实施例中,提高预设频段的信号幅度,可以为:将预设频段的信号幅度提高第一预设倍数。降低除预设频段之外的频段的信号幅度,可以为:将除预设频段之外的频段的信号幅度降低第二预设倍数。
在步骤S104中,对上述处理后的频谱进行傅里叶反变换,得到处理后的语音信号;
将步骤S103获取的最终处理后的频谱做傅里叶反变换,得到处理后的语音信号,并可以将该处理后的语音信号输出至扬声器,从而播放该处理后的语音信号。
本申请实施例一提供了一种语音处理方法,使得处理后的语音信号的频谱相比于待处理的语音信号的频谱,在除预设频段之外的频段的信号幅度会降低,由于除预设频段之外的频段中的信号均为噪声,因此,本申请所提供的技术方案能够降低接收到的语音信号中的噪声,此外,本申请所提供的技术方案中,处理后的语音信号的频谱相比于待处理的语音信号的频谱,在预设频段的信号幅度也会有所增大,因此,会进一步增大处理后的语音信号的信噪比。所以,可以解决在用户在接打电话时,若对方处于嘈杂的环境中,使得用户接听到的语音中包含大量的噪声的技术问题,能够提高通话质量。
实施例二
下面对本申请实施例二提供的另一种语音处理方法进行描述,请参阅附图4,本申请实施例二中的语音处理方法包括:
在步骤S401中,接收待处理的语音信号;
在步骤S402中,对上述语音信号进行傅里叶变换,得到上述语音信号的频谱;
在本申请实施例二中,上述步骤S401-S402与实施例一中的步骤S101-S102执行方式完全相同,具体可参见实施例一的描述。
在步骤S403中,计算上述频谱在各个预设子频段的信号能量分别与上述频谱在预设频段的信号能量的比值;
在本申请实施例中,上述预设频段为覆盖人声频率范围的频段,上述预设子频段为上述预设频段所覆盖的频段,比如,若预设频段为80-1100HZ,则预设子频段可以为100-200HZ。并且在本申请实施例中,预设子频段可以有一个或者也可以有多个。
人声在不同频段的能量大小会影响人声的音色,比如,100-150HZ的信号会影响声音的浑厚感,如果这段频率成分缺少,音色会变得单薄、苍白,如果这段频率成分过强,音色会显得浑浊,清晰感变差;150-500HZ的信号会影响声音的力度,如果这段频率成分缺少,音色会发软、发飘,如果这段频率成分过强,声音会变得生硬不自然;500-1000HZ的信号会影响声音的轮廓感,如果这段频率不足,声音会有一种收缩感,如果这段频率过强,声音会有一种凸出感。因此,在本申请实施例中,为了让用户在接打电话时,增加耳朵的舒适性(不同的音色会影响听起来的舒适性),可以调整接收到的语音信号在各个频段的信号幅度,从而可以进一步提高用户体验。因此,上述预设子频段可以为影响人声音色的子频段,比如100-150HZ、150-500HZ和/或500-1000HZ。
为了详细阐述本申请实施例二所提供的技术方案,下面利用附图5举例说明:
如图5所示,预设频段为80-1100HZ,预设子频段有两个,分别为100-150HZ和500-1000HZ。在该步骤S403中,可以首先计算出接收到的语音信号在100-150HZ的信号能量E1、在500-1000HZ的信号能量E2以及在80-1100HZ的信号能量E;其次,再计算出该语音信号在100-150HZ的信号能量与在80-1100HZ的信号能量的比值E1/E,以及该语音信号在500-1000HZ的信号能量与在80-1100HZ的信号能量的比值E2/E。
在步骤S404中,不断调整各个预设子频段的信号幅度,直至各个预设子频段的信号能量与上述频谱在预设频段的信号能量的比值在对应的预设比值范围内,得到第一频谱;
如图5所示,假设100-150HZ对应的预设比值范围为(A1,A2),500-1000HZ对应的预设比值范围为(B1,B2),若步骤S403计算出的E1/E小于A1,未在对应的预设比值范围(A1,A2)内,E2/E的大小在对应的预设的比值范围(B1,B2)内,则增大该频谱在100-150HZ内的信号幅度,比如,可以将100-150HZ的信号幅度增大第三预设倍数;在增大该频谱在100-150HZ内的信号幅度之后,再次继续计算100-150HZ的信号能量与80-1100HZ的信号能量的比值,以及500-1000HZ的信号能量与80-1100HZ的信号能量的比值,再次判断各个比值是否在对应的预设比值范围内,不断调整各个预设子频段的信号幅度,直至各个预设子频段的信号能量与上述频谱在预设频段的信号能量的比值在对应的预设比值范围内为止。
由于人声音色的不同不仅会影响听起来的舒适性,而且还代表着一定的个人特质,因此,为了不影响个人特质,该步骤对各个预设子频段的信号幅度的调整可以相对较小,比如上述第三预设倍数可以为一较小的数值,比如为0.1、0.5等,并且可以将上述预设比值范围可以相对来说设置的较宽。
在步骤S405中,提高上述第一频谱中预设频段的信号幅度,并降低上述第一频谱中除上述预设频段之外的频段的信号幅度,得到第二频谱;
在步骤S406中,对上述第二频谱进行傅里叶反变换,得到处理后的语音信号;
在本申请实施例二中,上述步骤S405-S406与实施例一中的步骤S103-S104执行方式完全相同,具体可参见实施例一的描述。
本申请实施例二提供了另一种语音处理方法,使得处理后的语音信号中噪声的能量有所降低,人声的能量有所提高,增大处理后的语音信号的信噪比。所以,可以解决在用户在接打电话时,若对方处于嘈杂的环境中,使得用户接听到的语音中包含大量的噪声的技术问题,能够提高通话质量。此外,本申请实施例二所提供的技术方案还可以使得处理后的语音信号听起来更加舒适,能够进一步提高用户体验。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
实施例三
本申请实施例三提供了一种语音处理装置,为便于说明,仅示出与本申请相关的部分,如图6所示语音处理装置600包括:
语音接收模块601,用于接收待处理的语音信号;
频谱获取模块602,用于对上述语音信号进行傅里叶变换,得到上述语音信号的频谱;
频谱处理模块603,用于提高上述频谱中预设频段的信号幅度,并降低上述频谱中除上述预设频段之外的频段的信号幅度,得到处理后的频谱,其中,上述预设频段为覆盖人声频率范围的频段;
频谱反变换模块604,用于对上述处理后的频谱进行傅里叶反变换,得到处理后的语音信号。
可选地,上述频谱处理模块603包括:
能量计算单元,用于根据上述语音信号的频谱,计算上述语音信号中上述预设频段的信号能量以及除上述预设频段之外的频段的信号能量;
能量比判断单元,用于判断上述预设频段的信号能量与除上述预设频段之外的频段的信号能量的比值是否小于预设能量比;
频谱处理单元,用于若小于上述预设能量比,则提高上述频谱中预设频段的信号幅度,并降低上述频谱中除上述预设频段之外的频段的信号幅度,得到处理后的频谱。
可选地,上述频谱处理模块603还包括:
频谱再次处理单元,用于判断当前处理后的频谱在上述预设频段的信号能量与除上述预设频段之外的频段的信号能量的比值是否小于上述预设能量比,若小于上述预设能量比,则提高当前处理后的频谱中在上述预设频段的信号幅度,并降低当前处理后的频谱中除上述预设频段之外的频段的信号幅度。
可选地,上述提高上述频谱中预设频段的信号幅度,并降低上述频谱中除上述预设频段之外的频段的信号幅度包括:
将上述频谱中上述预设频段的信号幅度提高第一预设倍数,并将上述频谱中除上述预设频段之外的频段的信号幅度降低第二预设倍数。
可选地,上述语音处理装置600还包括:
播放模块,用于将上述处理后的语音信号输出至扬声器,播放上述处理后的语音信号。
需要说明的是,上述装置/单元之间的信息交互、执行过程等内容,由于与本申请方法实施例基于同一构思,其具体功能及带来的技术效果,具体可参见方法实施例部分,此处不再赘述。
实施例四
图7是本申请实施例四提供的移动终端的示意图。如图7所示,该实施例的移动终端7包括:处理器70、存储器71以及存储在上述存储器71中并可在上述处理器70上运行的计算机程序72。上述处理器70执行上述计算机程序72时实现上述各个方法实施例中的步骤,例如图1所示的步骤S101至S104。或者,上述处理器70执行上述计算机程序72时实现上述各装置实施例中各模块/单元的功能,例如图6所示模块601至604的功能。
示例性的,上述计算机程序72可以被分割成一个或多个模块/单元,上述一个或者多个模块/单元被存储在上述存储器71中,并由上述处理器70执行,以完成本申请。上述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述上述计算机程序72在上述移动终端7中的执行过程。例如,上述计算机程序72可以被分割成语音接收模块、频谱获取模块、频谱处理模块以及频谱反变换模块,各模块具体功能如下:
接收待处理的语音信号;
对上述语音信号进行傅里叶变换,得到上述语音信号的频谱;
提高上述频谱中预设频段的信号幅度,并降低上述频谱中除上述预设频段之外的频段的信号幅度,得到处理后的频谱,其中,上述预设频段为覆盖人声频率范围的频段;
对上述处理后的频谱进行傅里叶反变换,得到处理后的语音信号。
上述移动终端7可以是智能手机、平板电脑、学习机、智能穿戴设备等计算设备。上述移动终端可包括,但不仅限于,处理器70、存储器71。本领域技术人员可以理解,图7仅仅是移动终端7的示例,并不构成对移动终端7的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如上述移动终端还可以包括输入输出设备、网络接入设备、总线等。
所称处理器70可以是中央处理单元(Central Processing Unit,CPU),还可以是其它通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其它可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
上述存储器71可以是上述移动终端7的内部存储单元,例如移动终端7的硬盘或内存。上述存储器71也可以是上述移动终端7的外部存储设备,例如上述移动终端7上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,上述存储器71还可以既包括上述移动终端7的内部存储单元也包括外部存储设备。上述存储器71用于存储上述计算机程序以及上述移动终端所需的其它程序和数据。上述存储器71还可以用于暂时地存储已经输出或者将要输出的数据。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将上述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
在本申请所提供的实施例中,应该理解到,所揭露的装置/移动终端和方法,可以通过其它的方式实现。例如,以上所描述的装置/移动终端实施例仅仅是示意性的,例如,上述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
上述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
上述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,上述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,上述计算机程序包括计算机程序代码,上述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。上述计算机可读介质可以包括:能够携带上述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,上述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
以上上述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。
Claims (10)
1.一种语音处理方法,其特征在于,包括:
接收待处理的语音信号;
对所述语音信号进行傅里叶变换,得到所述语音信号的频谱;
提高所述频谱中预设频段的信号幅度,并降低所述频谱中除所述预设频段之外的频段的信号幅度,得到处理后的频谱,其中,所述预设频段为覆盖人声频率范围的频段;
所述预设频段还包括多个预设子频段,所述预设子频段为所述预设频段所覆盖的范围,计算所述频谱在各个预设子频段的信号能量分别与所述频谱在所述预设频段的信号能量的比值;不断调整各个预设子频段的信号幅度,直至各个预设子频段的信号能量与所述频谱在预设频段的信号能量的比值在对应的预设比值范围内,得到第一频谱;提高所述第一频谱中预设频段的信号幅度,并降低上述第一频谱中除上述预设频段之外的频段的信号幅度,得到第二频谱;
对所述处理后的第二频谱进行傅里叶反变换,得到处理后的语音信号。
2.如权利要求1所述的语音处理方法,其特征在于,所述提高所述频谱中预设频段的信号幅度,并降低所述频谱中除所述预设频段之外的频段的信号幅度,得到处理后的频谱,包括:
根据所述语音信号的频谱,计算所述语音信号中所述预设频段的信号能量以及除所述预设频段之外的频段的信号能量;
判断所述预设频段的信号能量与除所述预设频段之外的频段的信号能量的比值是否小于预设能量比;
若小于所述预设能量比,则提高所述频谱中预设频段的信号幅度,并降低所述频谱中除所述预设频段之外的频段的信号幅度,得到处理后的频谱。
3.如权利要求2所述的语音处理方法,其特征在于,若小于预设能量比,在提高所述频谱中预设频段的信号幅度,并降低所述频谱中除所述预设频段之外的频段的信号幅度,得到处理后的频谱的步骤之后,还包括:
判断当前处理后的频谱在所述预设频段的信号能量与除所述预设频段之外的频段的信号能量的比值是否小于所述预设能量比,若小于所述预设能量比,则提高当前处理后的频谱中在所述预设频段的信号幅度,并降低当前处理后的频谱中除所述预设频段之外的频段的信号幅度,并返回执行判断当前处理后的频谱在所述预设频段的信号能量与除所述预设频段之外的频段的信号能量的比值是否小于所述预设能量比的步骤以及后续步骤,直至当前处理后的频谱在所述预设频段的信号能量与除所述预设频段之外的频段的信号能量的比值大于或等于所述预设能量比时为止。
4.如权利要求1至3中任一项所述的语音处理方法,其特征在于,所述提高所述频谱中预设频段的信号幅度,并降低所述频谱中除所述预设频段之外的频段的信号幅度包括:
将所述频谱中所述预设频段的信号幅度提高第一预设倍数,并将所述频谱中除所述预设频段之外的频段的信号幅度降低第二预设倍数。
5.如权利要求1至3中任一项所述的语音处理方法,其特征在于,在对所述处理后的频谱进行傅里叶反变换,得到处理后的语音信号的步骤之后,还包括:
将所述处理后的语音信号输出至扬声器,播放所述处理后的语音信号。
6.一种语音处理装置,其特征在于,包括:
语音接收模块,用于接收待处理的语音信号;
频谱获取模块,用于对所述语音信号进行傅里叶变换,得到所述语音信号的频谱;
频谱处理模块,用于提高所述频谱中预设频段的信号幅度,并降低所述频谱中除所述预设频段之外的频段的信号幅度,得到处理后的频谱,其中,所述预设频段为覆盖人声频率范围的频段;
所述预设频段还包括多个预设子频段,所述预设子频段为所述预设频段所覆盖的范围,计算所述频谱在各个预设子频段的信号能量分别与所述频谱在所述预设频段的信号能量的比值;不断调整各个预设子频段的信号幅度,直至各个预设子频段的信号能量与所述频谱在预设频段的信号能量的比值在对应的预设比值范围内,得到第一频谱;提高所述第一频谱中预设频段的信号幅度,并降低上述第一频谱中除上述预设频段之外的频段的信号幅度,得到第二频谱;
频谱反变换模块,用于对所述第二频谱进行傅里叶反变换,得到处理后的语音信号。
7.如权利要求6所述的语音处理装置,其特征在于,所述频谱处理模块包括:
能量计算单元,用于根据所述语音信号的频谱,计算所述语音信号中所述预设频段的信号能量以及除所述预设频段之外的频段的信号能量;
能量比判断单元,用于判断所述预设频段的信号能量与除所述预设频段之外的频段的信号能量的比值是否小于预设能量比;
频谱处理单元,用于若小于所述预设能量比,则提高所述频谱中预设频段的信号幅度,并降低所述频谱中除所述预设频段之外的频段的信号幅度,得到处理后的频谱。
8.如权利要求7所述的语音处理装置,其特征在于,所述频谱处理模块还包括:
频谱再次处理单元,用于判断当前处理后的频谱在所述预设频段的信号能量与除所述预设频段之外的频段的信号能量的比值是否小于所述预设能量比,若小于所述预设能量比,则提高当前处理后的频谱中在所述预设频段的信号幅度,并降低当前处理后的频谱中除所述预设频段之外的频段的信号幅度。
9.一种移动终端,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至5任一项所述方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810948350.9A CN108922558B (zh) | 2018-08-20 | 2018-08-20 | 一种语音处理方法、语音处理装置及移动终端 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810948350.9A CN108922558B (zh) | 2018-08-20 | 2018-08-20 | 一种语音处理方法、语音处理装置及移动终端 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108922558A CN108922558A (zh) | 2018-11-30 |
CN108922558B true CN108922558B (zh) | 2020-11-27 |
Family
ID=64404790
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810948350.9A Active CN108922558B (zh) | 2018-08-20 | 2018-08-20 | 一种语音处理方法、语音处理装置及移动终端 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108922558B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109887526B (zh) * | 2019-01-04 | 2023-10-17 | 平安科技(深圳)有限公司 | 对母羊的生理状态检测方法、装置、设备及存储介质 |
CN109741761B (zh) * | 2019-03-13 | 2020-09-25 | 百度在线网络技术(北京)有限公司 | 声音处理方法和装置 |
CN110365371A (zh) * | 2019-07-05 | 2019-10-22 | 深圳市声临科技有限公司 | 基于蓝牙设备提供触发信号实现翻译系统控制的方法及其系统、电子设备 |
CN110931038B (zh) * | 2019-11-25 | 2022-08-16 | 西安讯飞超脑信息科技有限公司 | 一种语音增强方法、装置、设备及存储介质 |
CN115580682B (zh) * | 2022-12-07 | 2023-04-28 | 北京云迹科技股份有限公司 | 机器人拨打电话的接通挂断时刻的确定的方法及装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102483926A (zh) * | 2009-07-27 | 2012-05-30 | Scti控股公司 | 在处理语音信号中通过把语音作为目标和忽略噪声以降噪的系统及方法 |
CN104575515A (zh) * | 2013-10-23 | 2015-04-29 | 中兴通讯股份有限公司 | 一种提高语音质量的方法及装置 |
CN106340306A (zh) * | 2016-11-04 | 2017-01-18 | 厦门盈趣科技股份有限公司 | 一种提高语音识别度的方法及装置 |
US9553557B2 (en) * | 2011-10-24 | 2017-01-24 | Cochlear Limited | Post-filter common-gain determination |
CN108305614A (zh) * | 2017-01-11 | 2018-07-20 | 中兴通讯股份有限公司 | 一种语音处理方法及装置 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7092881B1 (en) * | 1999-07-26 | 2006-08-15 | Lucent Technologies Inc. | Parametric speech codec for representing synthetic speech in the presence of background noise |
US9047878B2 (en) * | 2010-11-24 | 2015-06-02 | JVC Kenwood Corporation | Speech determination apparatus and speech determination method |
WO2014094242A1 (en) * | 2012-12-18 | 2014-06-26 | Motorola Solutions, Inc. | Method and apparatus for mitigating feedback in a digital radio receiver |
CN104934032B (zh) * | 2014-03-17 | 2019-04-05 | 华为技术有限公司 | 根据频域能量对语音信号进行处理的方法和装置 |
CN105338148B (zh) * | 2014-07-18 | 2018-11-06 | 华为技术有限公司 | 一种根据频域能量对音频信号进行检测的方法和装置 |
CN105989834B (zh) * | 2015-02-05 | 2019-12-24 | 宏碁股份有限公司 | 语音辨识装置及语音辨识方法 |
-
2018
- 2018-08-20 CN CN201810948350.9A patent/CN108922558B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102483926A (zh) * | 2009-07-27 | 2012-05-30 | Scti控股公司 | 在处理语音信号中通过把语音作为目标和忽略噪声以降噪的系统及方法 |
US9553557B2 (en) * | 2011-10-24 | 2017-01-24 | Cochlear Limited | Post-filter common-gain determination |
CN104575515A (zh) * | 2013-10-23 | 2015-04-29 | 中兴通讯股份有限公司 | 一种提高语音质量的方法及装置 |
CN106340306A (zh) * | 2016-11-04 | 2017-01-18 | 厦门盈趣科技股份有限公司 | 一种提高语音识别度的方法及装置 |
CN108305614A (zh) * | 2017-01-11 | 2018-07-20 | 中兴通讯股份有限公司 | 一种语音处理方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN108922558A (zh) | 2018-11-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108922558B (zh) | 一种语音处理方法、语音处理装置及移动终端 | |
CN108076226B (zh) | 一种通话质量调整的方法、移动终端及存储介质 | |
CN104685563B (zh) | 用于嘈杂环境噪里的回放的音频信号整形 | |
CN109493877B (zh) | 一种助听装置的语音增强方法和装置 | |
US20230352038A1 (en) | Voice activation detecting method of earphones, earphones and storage medium | |
CN112017687B (zh) | 一种骨传导设备的语音处理方法、装置及介质 | |
CN101937682B (zh) | 一种处理接听语音的方法和装置 | |
CN110809214A (zh) | 音频播放方法、音频播放装置及终端设备 | |
CN112565981B (zh) | 啸叫抑制方法、装置、助听器及存储介质 | |
WO2022134351A1 (zh) | 单声道语音降噪方法、系统、设备及可读存储介质 | |
CN111970609B (zh) | 音质调节方法、音质调节系统及计算机可读存储介质 | |
CN110956973A (zh) | 一种回声消除方法、装置及智能终端 | |
CN113949968A (zh) | 一种频响校正方法、电子设备及信号处理方法 | |
CN115802224A (zh) | 一种噪音消除方法、装置、电子设备、耳机及存储介质 | |
WO2014161388A1 (zh) | 一种提高语音质量的方法及装置 | |
CN113096677A (zh) | 一种智能降噪的方法及相关设备 | |
WO2021042538A1 (zh) | 一种音频处理方法、装置及计算机存储介质 | |
WO2023245715A1 (zh) | 一种调节通话音量的方法、装置、通话设备及介质 | |
CN107426392A (zh) | 免提通话终端及其语音信号处理方法、装置 | |
CN113393863B (zh) | 一种语音评价方法、装置和设备 | |
CN114067817A (zh) | 低音增强方法、装置、电子设备及存储介质 | |
CN109274826B (zh) | 语音播放模式的切换方法、装置、终端和计算机可读存储介质 | |
CN110809222B (zh) | 一种多段动态范围控制方法、系统及扬声器 | |
JP2002135364A (ja) | 携帯電話無線機の受信音声補正システム及び方法 | |
CN112489669A (zh) | 一种音频信号处理方法、装置、设备和介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |