CN108305637B - 耳机语音处理方法、终端设备及存储介质 - Google Patents

耳机语音处理方法、终端设备及存储介质 Download PDF

Info

Publication number
CN108305637B
CN108305637B CN201810064095.1A CN201810064095A CN108305637B CN 108305637 B CN108305637 B CN 108305637B CN 201810064095 A CN201810064095 A CN 201810064095A CN 108305637 B CN108305637 B CN 108305637B
Authority
CN
China
Prior art keywords
sound signal
earphone
voice
microphone
energy value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810064095.1A
Other languages
English (en)
Other versions
CN108305637A (zh
Inventor
杨宗业
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Oppo Mobile Telecommunications Corp Ltd
Original Assignee
Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Oppo Mobile Telecommunications Corp Ltd filed Critical Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority to CN201810064095.1A priority Critical patent/CN108305637B/zh
Publication of CN108305637A publication Critical patent/CN108305637A/zh
Application granted granted Critical
Publication of CN108305637B publication Critical patent/CN108305637B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02165Two microphones, one receiving mainly the noise signal and the other one mainly the speech signal

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Telephone Function (AREA)

Abstract

本发明提出一种耳机语音处理方法、终端设备及存储介质,其中,方法包括:判断当前耳机麦克风获取的第一声音信号的能量值,与主麦克风获取的第二声音信号的能量值的差值,是否大于阈值;若是,则利用第二声音信号,对第一声音信号进行降噪处理。在利用耳机进行通话时,当耳机麦克风采集的第一声音信号的能量值与主麦克风采集的第二声音信号的能量值的差值,大于阈值时,表明主麦克风采集的声音信号主要包含噪声,因此通过终端上的主麦克风采集的第二声音信号,对耳机麦克风采集的第一声音信号进行降噪处理,可以滤除第一声音信号中大部分噪声,从而可以提高耳机语音的清晰度,进而提高耳机语音质量。

Description

耳机语音处理方法、终端设备及存储介质
技术领域
本发明涉及终端设备技术领域,尤其涉及一种耳机语音处理方法、终端设备及存储介质。
背景技术
在通过耳机进行通话时,由于耳机麦克风与嘴巴的距离不固定,麦克风采集的声音信号中常常会包含噪声,影响通话质量。
目前,主要是利用单麦克(MIC)降噪算法对耳机麦克风采集的信号进行降噪处理,滤除混入的噪声。但是,这种方法仅能滤除少量的噪声,降噪效果不够理想,语音不够清晰,导致通话质量不佳。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本发明提出一种耳机语音处理方法,适用于包括主麦克风及耳机插孔的终端,在利用耳机进行通话时,当耳机麦克风采集的第一声音信号的能量值与主麦克风采集的第二声音信号的能量值的差值,大于阈值时,表明耳机麦克风采集的用户的声音信号强度,相比终端上的主麦克风采集的用户的声音信号的强度较大,也就是说,主麦克风采集的声音信号主要包含噪声,因此通过终端上的主麦克风采集的第二声音信号,对耳机麦克风采集的第一声音信号进行降噪处理,可以滤除第一声音信号中大部分噪声,从而可以提高耳机语音的清晰度,进而提高耳机语音质量。
本发明提出一种耳机语音处理装置。
本发明提出一种终端设备。
本发明提出一种非临时性计算机可读存储介质。
本发明实施例提出了一种耳机语音处理方法,包括:
判断当前耳机麦克风获取的第一声音信号的能量值,与所述主麦克风获取的第二声音信号的能量值的差值,是否大于阈值;
若是,则利用所述第二声音信号,对所述第一声音信号进行降噪处理。
在本发明实施例一种可能实现方式中,判断所述第一声音信号的能量值与所述第二声音信号的能量值的差值是否大于阈值之后,还包括:
若否,则根据预设的声纹特征,从所述第一声音信号中获取有效语音信号。
在本发明实施例一种可能实现方式中,所述根据预设的声纹特征,从所述第一声音信号中获取有效语音信号之前,还包括:
获取所述终端所属用户的声音信号;
对所述用户的声音信号进行识别,确定所述预设的声纹特征。
在本发明实施例一种可能实现方式中,所述获取所述终端所属用户的声音信号,包括:
在声纹采集界面,获取所述终端所属用户的声音信息;
或者,
根据所述终端采集的各种声音信号的频率及时长,确定所述终端所属用户的声音信号。
在本发明实施例一种可能实现方式中,所述利用所述第二声音信号,对所述第一声音信号进行降噪处理,包括:
根据所述差值大小,确定所述耳机麦克风与所述主麦克风的距离;
根据所述距离,确定目标谱减系数;
根据所述目标谱减系数、所述第二声音信号,利用谱减法,对所述第一声音信号进行降噪处理。
在本发明实施例一种可能实现方式中,所述利用谱减法,对所述第一声音信号进行降噪处理之前,还包括:
确定所述第一声音信号预设频段的第一语音频谱,及所述第二声音信号预设频段的第二语音频谱;
所述对所述第一声音信号进行降噪处理,包括:
根据所述目标谱减系数、所述第二语音频谱,利用谱减法,对所述第一语音频谱进行降噪处理。
本发明实施例的耳机语音处理方法,通过判断当前耳机麦克风获取的第一声音信号的能量值,与所述主麦克风获取的第二声音信号的能量值的差值,是否大于阈值;若是,则利用所述第二声音信号,对所述第一声音信号进行降噪处理。在利用耳机进行通话时,当耳机麦克风采集的第一声音信号的能量值与主麦克风采集的第二声音信号的能量值的差值,大于阈值时,表明耳机麦克风采集的用户的声音信号强度,相比终端上的主麦克风采集的用户的声音信号的强度较大,也就是说,主麦克风采集的声音信号主要包含噪声,因此通过终端上的主麦克风采集的第二声音信号,对耳机麦克风采集的第一声音信号进行降噪处理,可以滤除第一声音信号中大部分噪声,从而可以提高耳机语音的清晰度,进而提高耳机语音质量。
本发明实施例提出了一种耳机语音处理装置,包括:
判断模块,用于判断当前耳机麦克风获取的第一声音信号的能量值,与所述主麦克风获取的第二声音信号的能量值的差值,是否大于阈值;
降噪模块,用于在当前耳机麦克风获取的第一声音信号的能量值,与所述主麦克风获取的第二声音信号的能量值的差值大于阈值时,利用所述第二声音信号,对所述第一声音信号进行降噪处理。
本发明实施例的信息处理装置,通过判断当前耳机麦克风获取的第一声音信号的能量值,与所述主麦克风获取的第二声音信号的能量值的差值,是否大于阈值;若是,则利用所述第二声音信号,对所述第一声音信号进行降噪处理。在利用耳机进行通话时,当耳机麦克风采集的第一声音信号的能量值与主麦克风采集的第二声音信号的能量值的差值,大于阈值时,表明耳机麦克风采集的用户的声音信号强度,相比终端上的主麦克风采集的用户的声音信号的强度较大,也就是说,主麦克风采集的声音信号主要包含噪声,因此通过终端上的主麦克风采集的第二声音信号,对耳机麦克风采集的第一声音信号进行降噪处理,可以滤除第一声音信号中大部分噪声,从而可以提高耳机语音的清晰度,进而提高耳机语音质量。
本发明实施例提出了一种终端设备,包括处理器和存储器;其中,所述处理器通过读取所述存储器中存储的可执行程序代码来运行与所述可执行程序代码对应的程序,以用于实现如上述实施例所述的耳机语音处理方法。
本发明实施例提出了一种非临时性计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述实施例所述的耳机语音处理方法。
本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本发明实施例提供的一种耳机语音处理方法的流程示意图;
图2为本发明实施例提供的另一种耳机语音处理方法的流程示意图;
图3为本发明实施例提供的又一种耳机语音处理方法的流程示意图;
图4为本发明实施例提供的一种确定预设的声纹特征的方法的流程示意图;
图5为本发明实施例提供的一种耳机语音处理装置的结构示意图;
图6为本发明实施例提供的一种终端设备的结构示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
下面参考附图描述本发明实施例的耳机语音处理方法、终端设备及存储介质。
需要说明的是,本发明实施例的耳机语音处理方法适用于包括主麦克风及耳机插孔的终端,如包括主麦克风和耳机插孔的手机、电脑、平板电脑等等。
图1为本发明实施例提供的一种耳机语音处理方法的流程示意图。
如图1所示,该耳机语音处理方法包括:
步骤101,判断当前耳机麦克风获取的第一声音信号的能量值,与主麦克风获取的第二声音信号的能量值的差值,是否大于阈值。
用户将耳机插入具有耳机插孔的终端,通过耳机进行语音通话、视频聊天、语音聊天时,终端上的耳机麦克风可采集声音信号,同时终端上的主麦克风也可采集通话环境周围的声音信号。
本实施例中,在通过耳机进行语音通话的过程中,将耳机麦克风采集获取的声音信号称为第一声音信号,将主麦克风采集获取的声音信号称为第二声音信号。
在利用耳机进行通话时,相比终端上的主麦克风而言,耳机麦克风主要负责采集用户的声音信号,因此耳机麦克风采集的用户的声音信号的强度,通常大于主麦克风采集的用户的声音信号的强度。由于日常通话过程中,通话环境往往存在噪声,可以理解的是,耳机麦克风采集的第一声音信号中可包括用户的声音信号和噪声,而主麦克风采集的第二声信号中主要包括通话环境中噪声,也可能包括用户的声音信号。
本实施例中,通过比较第一声音信号的能量值与第二声音信号的能量值的差值,是否超过阈值,来确定是否利用第二声音信号,去除第一声音信号中的噪声。
具体地,针对当前获取的第一声音信号和第二声音信号分别进行傅里叶变换,得到第一声音信号和第二声音信号的频域信号,根据频域信号计算第一声音信号的能量值和第二声音信号的能量值。然后,将第一声音信号的能量值减去第二声音信号的能量值,得到差值,并将差值与预设的阈值进行比较。
步骤102,若是,则利用第二声音信号,对第一声音信号进行降噪处理。
当当前耳机麦克风获取的第一声音信号的能量值,与主麦克风获取的第二声音信号的能量值的差值大于阈值时,可以认为第一声音信号主要包括用户的声音信号,第二声音信号主要包括噪声,则可以利用第二声音信号,来去除第一声音信号中的噪声,以对第一声音信号进行降噪处理。
本实施例中,当第一声音信号能量值大于第二声音信号的能量值,且超过一定阈值时,可以认为第二声音信号主要包括噪声,则利用第二声音信号,对第一声音信号进行降噪处理,可以更好的抑制第一声音信号中的噪声,提高用户语音的清晰度,从而提高了耳机的通话质量。
对于上述实施例中步骤102利用第二声音信号,对第一声音信号进行降噪处理,本发明实施例提供了一种可能的实现方式,利用第二声音信号,根据谱减法,去除第一声音信号中的噪声。如图2所示,包括:
步骤201,根据差值大小,确定耳机麦克风与主麦克风的距离。
由于主麦克风距离耳机麦克风越远,主麦克风采集的第二声音信号中用户的声音信号越少,也就是说第二声音信号中包括的噪声相对用户的声音信号越多,因此可根据耳机麦克风与主麦克风的距离,确定目标谱减系数。
具体地,可预先建立第一声音信号的能量值与第二声音信号的能量值的差值,与耳机麦克风与主麦克风的距离之间的映射关系,在获取两种信号的能量值的差值后,可查询差值与耳机麦克风与主麦克风的距离之间的映射关系,获得当前差值对应的耳机麦克风与主麦克风的距离。
可以理解是,当前获取的两种信号的能量值的差值,在差值与耳机麦克风与主麦克风的距离之间的映射关系中不一定存在,这时可将与当前差值相差最小的差值对应的距离,作为与当前差值对应的耳机麦克风与主麦克风的距离。
步骤202,根据距离,确定目标谱减系数。
本实施例中,在确定距离后,可根据距离与谱减系数之间的对应关系,确定与当前耳机麦克风与主麦克风的距离对应的目标谱减系数。
步骤203,根据目标谱减系数、第二声音信号,利用谱减法,对第一声音信号进行降噪处理。
本实施例中,可将第二声音信号减去目标减谱系数与第一声音信号的乘积,实现利用第二声音信号对第一声音信号进行降噪处理的目的。
由于谱减法是在频域中进行的,因此在对第一声音信号进行降噪之前,将时域内的第一声音信号和第二声音信号变换到频域。
具体而言,利用快速傅里叶变换,将第一声音信号和第二声音信号变换到频域,并将频域内的第一声音信号和第二声音信号,划分为多个连续的预设频段。
针对每个预设频段,确定第一声音信号的预设频段的第一语音频谱,以及第二声音信号的预设频段的第二语音频谱。然后,根据目标谱减系数、第二语音频谱,利用谱减法,对第一语音频谱进行降噪处理,具体而言,可将第一语音频谱,减去第二语音频谱与目标谱减系数的乘积,得到预设频段的降噪后的第一声音信号的频谱。之后,根据每个预设频段的降噪后的第一声音信号的频谱,可得到频谱内降噪后的第一声音信号,对频谱内降噪后的第一声音信号进行快速傅里叶反变换,可得到时域内的降噪后的第一声音信号。
本发明实施例的耳机语音处理方法,当第一声音信号的能量值与第二声音信号的能量值的差值大于预设阈值时,根据目标谱减系数、第二声音信号,利用谱减法,可以去除第一声音信号中稳态噪声,提高耳机语音质量。
上述实施例中,当第一声音信号的能量值与第二声音信号的能量值的差值大于预设阈值时,可根据第二声音信号对第一声音信号进行降噪处理,进一步地,在图1的基础上,如图3所示,本发明实施例的耳机处理方法还可包括:
步骤103,若否,则根据预设的声纹特征,从第一声音信号中获取有效语音信号。
当第一声音信号的能量值与第二声音信号的能量值的差值小于或者等于预设阈值时,说明主麦克风采集的第二声音信号中包括用户的语音信号,且不能忽略,如果采用第二声音信号对第一声音信号进行降噪处理,降噪效果可能会不佳。
由于每个人的声音具有特性,也就说每个人的声纹特征是不同的,在第一声音信号的能量值与第二声音信号的能量值的差值小于或者等于预设阈值的情况下,可根据预设的声纹特征,确定耳机麦克风采集的第一声音信号中的有效语音信号。其中,声纹特征包括基音的轮廓,共振峰的频率带宽及其轨迹、谱包络参数等等。
可以理解的是,这里的有效语音信号为耳机麦克风采集的用户的语音信号。
本实施例中,在步骤103根据预设的声纹特征,从第一声音信号中获取有效语音信号之前,可先确定预设的声纹特征。具体地,如图4所示,包括:
步骤401,获终端所属用户的声音信号。
本实施例中,在利用声纹特征,从第一声音信号中获取有效语音信号之前,可预先采集终端所属用户的声音信号。
作为一个示例,用户可在终端提供的声音采集界面,对准主麦克风输入语音,终端上的主麦克风采集到用户的声音信号,从而获取终端所属用户的声音信息。进一步地,为了提高获取的声音信息的质量,提高声纹特征的准确性,用户可在噪声尽量小的环境中输入语音,以使获取的声纹特征更加准确。
作为另一个示例,还可根据终端采集的各种声音的频率和时长,确定终端所属用户的声音信号。其中,终端采集的各种声音包括用户在聊天软件中向对方发送的语音、录制的视频中的声音。可以理解的是,采集的各种声音中,出现频率最高或者时长最长的语音,可以确定为终端所属用户的声音信号。
步骤402,对用户的声音信号进行识别,确定预设的声纹特征。
根据采集的终端所属用户的声音信息,对用户的声音进行识别,确定预设的声纹特征,如基音的轮廓,共振峰的频率带宽及其轨迹、谱包络参数、美尔倒谱系数等等。
本发明实施例的耳机语音处理方法,当第一声音信号的能量值与第二声音信号的能量值的差值大于预设阈值时,通过第二声音信号对第一声音信号进行降噪处理;当第一声音信号的能量值与第二声音信号的能量值的差值小于或者等于预设阈值时,根据预设的用户的声纹特征,确定第二声音信号中的有效声音信号,从而可以提高耳机语音质量。
为了实现上述实施例,本发明还提出一种耳机语音处理装置。图5为本发明实施例提供的一种耳机语音处理装置的结构示意图。
如图5所示,该装置包括:判断模块510、降噪模块520。
判断模块510用于判断当前耳机麦克风获取的第一声音信号的能量值,与主麦克风获取的第二声音信号的能量值的差值,是否大于阈值。
降噪模块520用于在当前耳机麦克风获取的第一声音信号的能量值,与主麦克风获取的第二声音信号的能量值的差值大于阈值时,利用第二声音信号,对第一声音信号进行降噪处理。
在本实施例一种可能的实现方式中,上述降噪模块520,还用于:
在当前耳机麦克风获取的第一声音信号的能量值,与主麦克风获取的第二声音信号的能量值的差值小于或者等于阈值时,根据预设的声纹特征,从第一声音信号中获取有效语音信号。
在本实施例一种可能的实现方式中,该装置还可包括:
获取模块,用于获取终端所属用户的声音信号;
确定模块,用于对用户的声音信号进行识别,确定预设的声纹特征。
在本实施例一种可能的实现方式中,获取模块可包括:
采集单元,用于在声纹采集界面,获取终端所属用户的声音信息;
或者,
第一确定单元,用于根据终端采集的各种声音信号的频率及时长,确定终端所属用户的声音信号。
在本实施例一种可能的实现方式中,降噪模块520可包括
第二确定单元,用于根据差值大小,确定耳机麦克风与主麦克风的距离;
第三确定单元,用于根据距离,确定目标谱减系数;
降噪单元,用于根据目标谱减系数、第二声音信号,利用谱减法,对第一声音信号进行降噪处理。
在本实施例一种可能的实现方式中,降噪模块520还可包括:
第四确定单元,用于在利用谱减法,对第一声音信号进行降噪处理之前,确定第一声音信号预设频段的第一语音频谱,及第二声音信号预设频段的第二语音频谱;
降噪单元,还用于根据目标谱减系数、第二语音频谱,利用谱减法,对第一语音频谱进行降噪处理。
上述耳机语音处理装置中各个模块的划分仅用于举例说明,在其他实施例中,可将耳机语音处理装置按照需要划分为不同的模块,以完成上述耳机语音处理装置的全部或部分功能。
需要说明的是,前述对耳机语音处理方法实施例的解释说明,也适用于该实施例的耳机语音处理装置,故在此不再赘述。
本发明实施例的信息处理装置,通过判断当前耳机麦克风获取的第一声音信号的能量值,与所述主麦克风获取的第二声音信号的能量值的差值,是否大于阈值;若是,则利用所述第二声音信号,对所述第一声音信号进行降噪处理。在利用耳机进行通话时,当耳机麦克风采集的第一声音信号的能量值与主麦克风采集的第二声音信号的能量值的差值,大于阈值时,表明耳机麦克风采集的用户的声音信号强度,相比终端上的主麦克风采集的用户的声音信号的强度较大,也就是说,主麦克风采集的声音信号主要包含噪声,因此通过终端上的主麦克风采集的第二声音信号,对耳机麦克风采集的第一声音信号进行降噪处理,可以滤除第一声音信号中大部分噪声,从而可以提高耳机语音的清晰度,进而提高耳机语音质量。
为了实现上述实施例,本发明实施例提出了一种终端设备。本实施例中,以终端设备为手机为例进行示意性说明。
如图6所示,该终端设备600包括:存储器610和处理器620;其中,处理器620通过读取存储器610中存储的可执行程序代码来运行与可执行程序代码对应的程序,以用于实现如前述实施例所述的耳机语音处理方法。
为了实现上述实施例,本发明实施例提出了一种非临时性计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如前述实施例所述的耳机语音处理方法。
为了实现上述实施例,本发明还提出一种非临时性计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如前述实施例所述的信息处理方法。
为了实现上述实施例,本发明还提出一种计算机程序产品,当计算机程序产品中的指令由处理器执行时实现如前述实施例所述的信息处理方法。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (9)

1.一种耳机语音处理方法,适用于包括主麦克风及耳机插孔的终端,其特征在于,包括:
判断当前耳机麦克风获取的第一声音信号的能量值,与所述主麦克风获取的第二声音信号的能量值的差值,是否大于阈值;
若是,则根据所述差值大小,确定所述耳机麦克风与所述主麦克风的距离;
根据所述距离,确定目标谱减系数;
根据所述目标谱减系数、所述第二声音信号,利用谱减法,对所述第一声音信号进行降噪处理。
2.如权利要求1所述的方法,其特征在于,判断所述第一声音信号的能量值与所述第二声音信号的能量值的差值是否大于阈值之后,还包括:
若否,则根据预设的声纹特征,从所述第一声音信号中获取有效语音信号。
3.如权利要求2所述的方法,其特征在于,所述根据预设的声纹特征,从所述第一声音信号中获取有效语音信号之前,还包括:
获取所述终端所属用户的声音信号;
对所述用户的声音信号进行识别,确定所述预设的声纹特征。
4.如权利要求3所述的方法,其特征在于,所述获取所述终端所属用户的声音信号,包括:
在声纹采集界面,获取所述终端所属用户的声音信息;
或者,
根据所述终端采集的各种声音信号的频率及时长,确定所述终端所属用户的声音信号。
5.如权利要求1所述的方法,其特征在于,所述利用谱减法,对所述第一声音信号进行降噪处理之前,还包括:
确定所述第一声音信号预设频段的第一语音频谱,及所述第二声音信号预设频段的第二语音频谱;
所述对所述第一声音信号进行降噪处理,包括:
根据所述目标谱减系数、所述第二语音频谱,利用谱减法,对所述第一语音频谱进行降噪处理。
6.一种耳机语音处理装置,其特征在于,包括:
判断模块,用于判断当前耳机麦克风获取的第一声音信号的能量值,与所述主麦克风获取的第二声音信号的能量值的差值,是否大于阈值;
降噪模块,用于在当前耳机麦克风获取的第一声音信号的能量值,与所述主麦克风获取的第二声音信号的能量值的差值大于阈值时,根据所述差值大小,确定所述耳机麦克风与所述主麦克风的距离;根据所述距离,确定目标谱减系数;根据所述目标谱减系数、所述第二声音信号,利用谱减法,对所述第一声音信号进行降噪处理。
7.如权利要求6所述的耳机语音处理装置,其特征在于,所述降噪模块,还用于:在当前耳机麦克风获取的第一声音信号的能量值,与所述主麦克风获取的第二声音信号的能量值的差值小于阈值时,从所述第一声音信号中获取有效语音信号。
8.一种终端设备,其特征在于,包括处理器和存储器;
其中,所述处理器通过读取所述存储器中存储的可执行程序代码来运行与所述可执行程序代码对应的程序,以用于实现如权利要求1-5中任一所述的耳机语音处理方法。
9.一种非临时性计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-5中任一所述的耳机语音处理方法。
CN201810064095.1A 2018-01-23 2018-01-23 耳机语音处理方法、终端设备及存储介质 Active CN108305637B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810064095.1A CN108305637B (zh) 2018-01-23 2018-01-23 耳机语音处理方法、终端设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810064095.1A CN108305637B (zh) 2018-01-23 2018-01-23 耳机语音处理方法、终端设备及存储介质

Publications (2)

Publication Number Publication Date
CN108305637A CN108305637A (zh) 2018-07-20
CN108305637B true CN108305637B (zh) 2021-04-06

Family

ID=62866203

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810064095.1A Active CN108305637B (zh) 2018-01-23 2018-01-23 耳机语音处理方法、终端设备及存储介质

Country Status (1)

Country Link
CN (1) CN108305637B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109933691B (zh) * 2019-02-11 2023-06-09 北京百度网讯科技有限公司 用于内容检索的方法、装置、设备和存储介质
CN111863014B (zh) * 2019-04-26 2024-09-17 北京嘀嘀无限科技发展有限公司 一种音频处理方法、装置、电子设备和可读存储介质
CN111182416B (zh) * 2019-12-31 2022-07-26 联想(北京)有限公司 处理方法、装置及电子设备
CN111432303B (zh) * 2020-03-19 2023-01-10 交互未来(北京)科技有限公司 单耳耳机、智能电子设备、方法和计算机可读介质
CN111816201B (zh) * 2020-08-07 2024-05-28 联想(北京)有限公司 一种电子设备及语音信号处理方法
CN114697812B (zh) * 2020-12-29 2023-06-20 华为技术有限公司 声音采集方法、电子设备及系统
CN114268820B (zh) * 2021-12-20 2024-04-30 歌尔科技有限公司 基于蓝牙耳机的弹幕发送方法、蓝牙耳机、设备和介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1809105A (zh) * 2006-01-13 2006-07-26 北京中星微电子有限公司 适用于小型移动通信设备的双麦克语音增强方法及系统
CN102300140A (zh) * 2011-08-10 2011-12-28 歌尔声学股份有限公司 一种通信耳机的语音增强方法、装置及降噪通信耳机
KR101396873B1 (ko) * 2013-04-03 2014-05-19 주식회사 크린컴 두 개의 마이크로폰을 포함하는 통신장치에서의 잡음제거방법 및 장치
US8949120B1 (en) * 2006-05-25 2015-02-03 Audience, Inc. Adaptive noise cancelation
CN104376848A (zh) * 2013-08-12 2015-02-25 展讯通信(上海)有限公司 语音信号处理方法和装置
CN106210219A (zh) * 2015-05-06 2016-12-07 小米科技有限责任公司 降噪方法及装置
CN106486130A (zh) * 2015-08-25 2017-03-08 百度在线网络技术(北京)有限公司 噪声消除、语音识别方法及装置
CN107369441A (zh) * 2017-09-08 2017-11-21 奇酷互联网络科技(深圳)有限公司 语音信号的消噪方法、装置及终端

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8744844B2 (en) * 2007-07-06 2014-06-03 Audience, Inc. System and method for adaptive intelligent noise suppression
TWI412023B (zh) * 2010-12-14 2013-10-11 Univ Nat Chiao Tung 可消除噪音且增進語音品質之麥克風陣列架構及其方法
US20130332156A1 (en) * 2012-06-11 2013-12-12 Apple Inc. Sensor Fusion to Improve Speech/Audio Processing in a Mobile Device
CN102800323B (zh) * 2012-06-25 2014-04-02 华为终端有限公司 移动终端语音降噪的方法及装置
CN104754430A (zh) * 2013-12-30 2015-07-01 重庆重邮信科通信技术有限公司 终端麦克风降噪装置和方法
CN105976826B (zh) * 2016-04-28 2019-10-25 中国科学技术大学 应用于双麦克风小型手持设备的语音降噪方法
CN106101351A (zh) * 2016-07-26 2016-11-09 哈尔滨理工大学 一种用于移动终端的多mic降噪方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1809105A (zh) * 2006-01-13 2006-07-26 北京中星微电子有限公司 适用于小型移动通信设备的双麦克语音增强方法及系统
US8949120B1 (en) * 2006-05-25 2015-02-03 Audience, Inc. Adaptive noise cancelation
CN102300140A (zh) * 2011-08-10 2011-12-28 歌尔声学股份有限公司 一种通信耳机的语音增强方法、装置及降噪通信耳机
KR101396873B1 (ko) * 2013-04-03 2014-05-19 주식회사 크린컴 두 개의 마이크로폰을 포함하는 통신장치에서의 잡음제거방법 및 장치
CN104376848A (zh) * 2013-08-12 2015-02-25 展讯通信(上海)有限公司 语音信号处理方法和装置
CN106210219A (zh) * 2015-05-06 2016-12-07 小米科技有限责任公司 降噪方法及装置
CN106486130A (zh) * 2015-08-25 2017-03-08 百度在线网络技术(北京)有限公司 噪声消除、语音识别方法及装置
CN107369441A (zh) * 2017-09-08 2017-11-21 奇酷互联网络科技(深圳)有限公司 语音信号的消噪方法、装置及终端

Also Published As

Publication number Publication date
CN108305637A (zh) 2018-07-20

Similar Documents

Publication Publication Date Title
CN108305637B (zh) 耳机语音处理方法、终端设备及存储介质
US10153744B1 (en) Automatically tuning an audio compressor to prevent distortion
CA2527461C (en) Reverberation estimation and suppression system
US9343056B1 (en) Wind noise detection and suppression
CN110853664B (zh) 评估语音增强算法性能的方法及装置、电子设备
CN107910013B (zh) 一种语音信号的输出处理方法及装置
CN109036460B (zh) 基于多模型神经网络的语音处理方法和装置
CN105657110B (zh) 语音通信的回声消除方法及装置
CN110536215A (zh) 音频信号处理的方法、装置、计算设置及存储介质
CN105931647B (zh) 噪声抑制的方法及装置
KR101961998B1 (ko) 즉각적인 바람 잡음을 감소시키는 것
CN104599675A (zh) 语音处理方法、语音处理装置和终端
CN110021305B (zh) 一种音频滤波方法、音频滤波装置及可穿戴设备
CN110706693A (zh) 语音端点的确定方法及装置、存储介质、电子装置
CN113949955B (zh) 降噪处理方法、装置、电子设备、耳机及存储介质
CN110277103A (zh) 基于语音识别的降噪方法及终端
CN113593599A (zh) 一种去除语音信号中噪声信号的方法
JP2014513320A (ja) オーディオ信号におけるドミナント周波数を減衰する方法及び装置
CN115348507A (zh) 脉冲噪声抑制方法、系统、可读存储介质及计算机设备
CN114584908B (zh) 助听器的声学测试方法、装置以及设备
CN112135235B (zh) 质量检测方法、系统及计算机可读存储介质
JP2013205831A (ja) 音声品質客観評価装置及び方法
CN108899041B (zh) 语音信号加噪方法、装置及存储介质
CN110556128A (zh) 一种语音活动性检测方法、设备及计算机可读存储介质
CN115243183A (zh) 一种音频检测方法、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: Changan town in Guangdong province Dongguan 523860 usha Beach Road No. 18

Applicant after: GUANGDONG OPPO MOBILE TELECOMMUNICATIONS Corp.,Ltd.

Address before: Changan town in Guangdong province Dongguan 523860 usha Beach Road No. 18

Applicant before: GUANGDONG OPPO MOBILE TELECOMMUNICATIONS Corp.,Ltd.

GR01 Patent grant
GR01 Patent grant